數據分析
-
數據分析
1、測序堿基錯誤率評估
測序錯誤率決定堿基質量,受測序儀本身、測序試劑、樣品等多因素影響,原始測序序列raw reads含有帶接頭的reads及低質量的reads。為了保證信息分析準確,需對原始序列進行篩選,得到clean reads。
2、GCAT含量分布
GC含量分布檢查用于檢測有無AT、GC分離現象,該現象可能是測序或者建庫所引起。對于DGE測序來說,會導致reads前6-7個堿基有較大的波動,屬于正常情況。
3、IGV可視化
采用IGV軟件對基因組上比對序列文件可視化,可直觀查看染色體、基因上具體序列細節。
4、circRNA長度統計
樣本的circRNA長度分布如圖所示。
5、circRNA來源統計
circRNA可以來源于exon、intron及ingtergenic的剪接。
6、circRNA表達量統計
TPM 密度分布統計。
7、火山圖
火山圖用于直觀展示兩組實驗中,circRNA表達量的上調、下調情況。
8、circRNA聚類熱圖
將表達模式相同或相近的circRNA進行聚類分析,進而識別未知circRNA的功能或已知circRNA的未知功能;這些同類的circRNA可能具有相似的功能,或是共同參與同一代謝過程或細胞通路。
9、趨勢分析
趨勢分析,將不同時間點或狀態點的circRNA表達值進行聚類,通過計算circRNA落入時間表達譜或狀態表達譜的顯著水平,識別顯著性的變化趨勢表達譜和與這些變化趨勢相關的circRNA。
10、差異circRNA來源基因GO富集
對差異circRNA來源基因進行GO富集,直觀的反映出在生物過程(Biological Process)、細胞組分(Cellular Component)和分子功能(Molecular Function)富集的GO term上差異基因的個數分布情況。
11、GO有向無環圖
DAG有向無環圖展現富集到的GO術語之間的關系。
12、差異circRNA來源基因PATHWAY富集
將差異circRNA來源基因進行PATHWAY富集,對得到通路注準差異基因信息,上調基因的KO節點標紅色,下調基因的KO節點標綠色。
13、miRNA結合分析
對鑒定的circRNA進行miRNA結合位點分析,有助于進一步研究circRNA的功能。
以上分析皆為標準分析,生因生物可根據具體項目、具體需求提供個性化分析。