Bionano DLS和PacBio技術雙劍合璧,助力歐洲谷倉燕高質量基因組組裝

Bionano光學圖譜派的最新成員DLS大俠因身懷基因組輔助組裝的絕技,此前力戰各大高手,江湖上已連出多篇武林公告,一時間人皆心向往之。近期,DLS大俠也沒閑著,游歷到風光旖旎的意大利米蘭,偶遇歐洲谷倉燕家族的美燕一枚,聽聞她身世不明便拔刀相助,飛鴿傳書召喚好基友PacBio,一路抽絲剝繭破解了身世之謎。欲知后事,且聽……

咳咳,切正題!說人話!最近沉迷武俠小說無法自拔的小編,就收收心為大家解析一篇最新發表的Bionano光學圖譜技術結合PacBio三代測序技術,完成歐洲谷倉燕高質量基因組組裝的文章。

 

SMRT long-read sequencing and Direct Label and Stain optical maps allow the generation of a high-quality genome assembly for the European barn swallow ( Hirundo rustica rustica?)

研究單位:意大利米蘭大學,德國蘇黎世大學,美國Bionano?Genomics公司,

美國加州州立理工大學,意大利帕維亞大學

 

谷倉燕(Hirundo rustica)是一種雀形目鳥類,在歐洲、亞洲和北美洲至少有8個亞種。作為一種候鳥,已成為大量生態、行為和遺傳研究的焦點。獲取高質量的基因組資源,包括參考基因組的可用性,是推動該物種研究和保護的關鍵。

 

樣本選取:取意大利米蘭附近農場某雌性個體的血液,全血離心后分離得到有核紅細胞和白細胞,提取DNA構建SMRTbell文庫。

測序策略:PacBio(45.4X)+ Bionano NLRS(28.2X)+ Bionano DLS(30.6X)

研究思路:

1.利用PacBio測序進行組裝,加上Bionano NLRS和DLS數據分別輔助組裝以及混合輔助組裝,得到各個不同的組裝版本,并對版本之間組裝連續性進行比較。

2.對于PacBio、Bionano NLRS和DLS數據混合組裝版本中極短的Contigs,與連成Scaffold的序列的相似性進行比對,相似性高的推測是獨立組裝出來的單倍體,刪除之后得到的final版本,然后進行注釋、組裝評估。

3.與家雞基因組進行共線性分析,顯示組裝質量很高,且與家雞共線性很高。

 

1. 組裝結果

僅PacBio SMRT測序技術組裝的結果Contig N50為5.2 Mbp, 較之前用Illumina短讀長測序技術組裝的美國亞種 H. r. erythrogaster (Contig N50為3.9 Kbp)提升了134倍。

加入 Bionano?DLS最新光學圖譜技術輔助組裝后,最終組裝出來的基因組final版本大小為1.21 Gbp,Scaffold N50為?25.9 Mbp,相比僅使用PacBio數據組裝得到的Contig N50來說,提升了5倍。

 

表1 本文組裝的基因組與公布的美國亞種H. r. erythrogaster基因組的組裝指標對比

 

2.基因和重讀序列的注釋

重復序列比例為7.11%,與鳥類一致。重復序列主要是由L2/CR1/Rex LINE 元件(3.37%)、retroviral LTRs(1.59%)和簡單重復序列(1.56%)構成。最后預測到了35644個蛋白質編碼基因,其中24331個含有pFAM蛋白結構域。基于BLASTP的簡單相似性搜索表明,17895個蛋白編碼基因,與來自家雞的GRCg6a基因組的基因最佳匹配。

 

3.BUSCO基因評估

用4915個保守的鳥類BUSCO基因進行評估,4598個(93.6%)是完整的,4521個(92%)是完整的而且是單拷貝的,77個(1.6%)是完整且多拷貝的,192個(3.9%)是不完整的,125個(2.5%)是丟失的。連續組裝到的BUSCO基因的百分比與安娜蜂鳥(Calypte anna)和斑馬魚(Taeniopygia guttata)的最新結果一致。

 

4.與家雞和蜂鳥基因組的共線性分析

最終組裝版本與最近發布的家雞基因組(GRCg6a)的比較結果表明:這兩個基因組之間具有高度的共線性,染色體內重排數目有限。這也和之前在鳥類中觀察到的高度共線性和極少的染色體間重組一致。

圖1 最終組裝版本與家雞基因組(GRCg6a)的比較分析

 

將 PacBio SMRT的數據同Bionano 光學圖譜的NLRS和 DLS數據相整合,其組裝的基因組連續性指標遠遠超過脊椎動物基因組計劃(VGP)指定的 “白金基因組”的組裝水平。

 

貝瑞基因作為全球Bionano光學圖譜技術的踐行者,較早推行無需酶切即可進行熒光標記的DLS技術,可實現構建跨越整個染色體臂甚至完整染色體的超長基因組圖譜,提升基因組組裝長度和精度,具有廣泛的物種適應性,為基因組研究帶來新的突破

 

參考文獻:

Formenti, Giulio, et al. “SMRT long-read sequencing and Direct Label and Stain optical maps allow the generation of a high-quality genome assembly for the European barn swallow (Hirundo rustica rustica).” bioRxiv (2018): 374512.

 

咨詢請聯系貝瑞基因當地銷售或致電010-84409702/發送電子郵件至[email protected]