經典案例
-
以擬南芥為例依據染色體間的關系de novo組裝植物基因組
研究背景
基因組組裝的一個典型的兩步策略是:雙端測序組裝contigs,然后contigs組裝成scaffolds。在過去的10年間,二代測序逐漸變得低廉、常用、廣泛。大多數的植物基因組通過二代測序產生了草圖,組裝成contigs或scaffolds。但是進一步得到染色體尺度的scaffolds的高質量基因組卻依然困難。近期報道一種更為高效的方法是根據染色體的關系得到染色體尺度的組裝(Hi-C)。本研究,我們直接根據染色體內部的關系,做了Hi-C分析并評估Hi-C數據。
研究方法
研究結果
1 Ler染色體組裝結果。A:Ler de novo組裝聚類預測;B:Hi-C與遺傳圖譜組裝結果比較;C-G:5個染色體的順序和方向預測;H:Hi-C與遺傳圖譜組裝結果順序比較;I-M:樣本中低相互關系的染色體組裝評估分布。
2 Hi-C組裝結果與已有同源基因組(Col)比較。A:Ler;B:Col;C:兩者相關性。
3 聚類中錯誤scaffolds與正確scaffolds的長度分布。
4 LUSTER_MIN_RE_SITES與ORDER_MIN_N_RES評估。A:聚類覆蓋度;B:聚類錯誤;C:排序覆蓋度;D:排序錯誤;E:方向覆蓋度;F:方向錯誤。
研究結論
根據染色體內關系而開發的de novo染色體尺度組裝是一種新精確構建完成參考序列的方法。該方法能夠以一種低成本的方式進行更為精確和標準的分析,并為植物其他方面的分析打開一扇門。
參考文獻
De Novo Plant Genome Assembly Based on Chromatin Interactions: A Case Study of Arabidopsis thaliana. [Molecular Plant, 2014]