基因組Denovo
不依賴于任何參考序列信息就可對某個物種進行全基因組測序和拼接組裝,并對組裝得到的基因組序列進行組分和功能注釋,構建該物種的全基因組序列圖譜與基因組數據庫,為后續基因挖掘、功能驗證提供更完善的基因組序列信息。
基因組Survey(二代測序)
基于小片段文庫的二代測序數據,通過K-mer分析,有效評估基因組大小、GC含量、雜合度高低及重復序列含量等信息,為后續的組裝策略的制定提供理論依據。
基因組Denovo(三代測序)
對基因組序列未知的物種進行全基因組水平的深度測序,然后用生物信息學方法進行組裝和注釋,從而獲得該物種完整的基因組圖譜,有助于研究該物種起源進化及特定環境適應性。
泛基因組(三代測序)
是指一個生物分支(如一個物種)的全部基因組信息,由所有個體共享的核心基因組和部分個體共享或個體特異性的非必需基因組成。通過構建泛基因組,可以將每個物種中的代表性個體的特異基因組序列包括到泛基因組中,獲得物種更全面的遺傳信息。
T2T基因組(三代測序)
T2T基因組中的T即端粒(Telomere),是真核生物線性染色體的末端部分,完美基因組(T2T)追求基因組組裝從染色體的一端到另外一端,準確、完整識別每一個堿基,無錯誤還原基因的原始序列信息。通過三代測序/Hic等多種技術手段結合實現一條或多條染色體端粒到端粒水平組裝的0 gap基因組,解決高復雜高重復區域的組裝難題,最終得到高準確性、高連續性、高完整性的端粒到端粒的完整基因組。
單倍型基因組(三代測序)
單倍型(Haplotype)是是指共存于單條染色體上的一系列遺傳變異位點的組合。常用的基因組組裝方法往往忽略了同源染色體之間的差異,將雜合區域整合,得到的基因組混雜了來自雙親同源染色體等位基因的嵌合序列。以PacBio HiFi數據為核心進行單倍型基因組研究。分析內容主要涵蓋單倍型基因組組裝、Hi-C輔助單倍型基因組組裝和單倍型基因組注釋,是研究結構、功能、變異與進化的較理想方式。
單倍型T2T基因組(三代測序)
單倍型T2T基因組,結合T2T基因組的最新組裝策略,并通過單倍型基因組組裝區分來自雙親的染色體,獲得分別來自父本、母本的完整遺傳信息,構建更加完整的基因組,進而研究雙親單倍型之間的差異、等位基因變異、追蹤個體親緣關系、探究雜種優勢等。
超大基因組(三代測序)
大型基因組(5 Gb≤ Genome Size<10 Gb)和超大型基因組(Genome Size≥10 Gb) 在進化期間往往伴隨著多倍體化或全基因組復制等事件的發生,造成其基因組存在大量的重復序列,使得大型基因組在組裝時會存在組裝連續性低、重復序列難以跨越、組裝資源消耗大和組裝周期長等難題。隨著長讀長測序技術的發展和組裝算法的優化升級,現階段已可以對大型基因組物種進行全基因組測序和拼接組裝,獲得該物種完整的基因組圖譜,為后續該物種的研究奠定基礎。
應用方向
- 全面基因組信息挖掘:更完善的參考基因組,可以校正之前基因組組裝的錯誤,發現新的基因序列,鑒定新的功能基因和遺傳變異信息,也可以鑒定出更多此前未被成功組裝的重復序列、著絲粒和端粒等;
- 物種進化和起源分析:解開物種的遺傳密碼,探尋物種祖先種及其遺傳多樣性為提高物種進化潛力和適應能力提供了新的可能性;
- 作物育種與改良:幫助種質資源的遺傳多樣性和遺傳價值評估,了解物種間的遺傳差異和關系,作為其他組學的研究基礎為遺傳改良提供最完善的參考信息;
案例解析
32份黍稷種質資源的泛基因集分析
黍稷圖形泛基因組揭示馴化相關的基因組變異
中國農業科學院作物科學研究所刁現民團隊聯合陳金鋒團隊在《Nature Genetics》發表論文“Pangenome analysis reveals genomic variations associated with domestication traits in broomcorn millet”。該研究首次揭示了世界范圍內516種黍稷種質資源的遺傳變異多樣性及起源和傳播的演化史。利用PacBio HiFi測序對黍稷24份栽培材料和8份野生材料的基因組進行從頭組裝,得到了32個黍稷染色體水平的高質量參考基因組,基因組Contigs N50長度平均為12.95Mb,BUSCO完整性平均為95.97%。該研究發現了與馴化和農藝性狀相關的關鍵位點和基因。為開展黍稷基因組輔助育種提供了基礎資源。貝瑞基因為該研究提供了基于PacBio平臺的三代建庫測序服務。
參考文獻:Jinfeng Chen , Yang Liu, et al. Pangenome analysis reveals genomic variations associated with domestication traits in broomcorn millet[J]. Nature Genetics, 2023, 55(12):2243-2254.