單體型基因組組裝技術(shù)區(qū)別于傳統(tǒng)嵌合基因組,其可以獲得單獨(dú)來自父本或母本、能同時遺傳給下一代的一組序列信息。染色體水平的單體型基因組可以實(shí)現(xiàn)等位基因或同源染色體的組裝。
產(chǎn)品類型 | 樣本類型 | 測序策略 | 備注 |
ADPA(Annoroad Diploid Phasing Assembly) | 有明確雙親本的二倍體/異源四倍體 | 雙親本30X PE150 子代單套25X HiFi 子代單套100X Hi-C | |
AUPPA(Annoroad Unkown Parent-al Phasing Assembly) | 無親本的二倍體 | 子代單套25X HiFi 子代單套100X Hi-C | |
ATPA(Annoroad Tetraploid Phasin-g Assembly) | 高度同源四倍體 | 近緣二倍體參考基因組# 雙親本30X PE150* 子代單套25X HiFi 子代單套100X Hi-C | # 或近緣二倍體的兩套單體型基因組; * 非必需,但是推薦。 |
產(chǎn)品類型 | 送樣要求 |
基因組Survey (二代平臺) | 樣品類型:基因組DNA樣品 樣品需求量:小片段文庫≥0.2 μg 樣品濃度:≥5 ng/μl 樣品純度:OD260/280=1.8-2.2、 OD260/230=0.8-2.5 樣品質(zhì)量:基因組完整,DNA主帶清晰、無降解、無污染 |
基因組de novo (三代平臺) | DNA總量:HiFi≥6 μg 濃度:≥30 ng/μl 質(zhì)量:基因組完整性,DNA主帶:HiFi≥30 Kb 純度:OD260/280≥1.5、 OD260/230≥1.2、 QC/NC=0.5-2.0 |
基因組注釋 | 至少6個不同時期或不同部位的樣品,推薦kinnex Iso-seq 3M/GS 數(shù)據(jù)量 |
Hi-C輔助裝 (二代平臺) | 新鮮組織進(jìn)行甲醛交聯(lián),1個Hi-C文庫至少需要新鮮血液約5 ml或組織1 g,推薦2-3 g組織量 |
鐵觀音單體型組裝,茶樹演化史
茶葉作為一種全球性的經(jīng)濟(jì)作物,有很強(qiáng)的保健作用。茶樹是無性繁殖的,這種方式可以有效地維持因有性重組而分離或丟失的有價值的基因型。然而,這種繁殖方式也會積累大量有害突變,導(dǎo)致“穆勒棘輪”效應(yīng),致使作物遭受損失。茶樹是二倍體,含有15對同源染色體,嵌合式的基因組組裝(篩選同源染色體中的一份拷貝作為代表組裝到染色體水平)可能會錯過重要選擇性狀的等位變異,而分型組裝(不同親本的兩套同源染色體同時組裝到染色體水平)能更完整地呈現(xiàn)二倍體基因組的全部遺傳信息。
材料選擇:山茶植株芽、根、莖、花、幼葉和成熟葉
測序策略:
DNA:
三代平臺基因組測序 114X
二代平臺 150 bp雙端測序,DNA小片段文庫
二代平臺 Hi-C文庫 99.4X
RNA:
三代平臺,Iso-seq文庫
中國烏龍茶品種鐵觀音及幾個主要的茶樹品種和近緣物種進(jìn)行測序及單體型組裝,探索地理上不同的茶樹群體之間的遺傳多樣性,為深入了解茶樹的馴化史和進(jìn)化史提供依據(jù)。
鐵觀音的基因組大小約為3.15 Gb,雜合度為2.31%。利用PacBio長讀長對原始數(shù)據(jù)進(jìn)行組裝得到初始contig,大小為5.41 Gb。將Khaper算法過濾產(chǎn)生的單倍體組裝結(jié)果掛載到15個染色體(圖1),得到單倍體參考基因組(monoploid reference genome),大小為3.03 Gb。同時利用ALLHiC算法得到鐵觀音單體型基因組(haplotype-resolved genome),大小為5.98 Gb。共線性分析顯示它們的基因順序高度一致。
圖1 鐵觀音基因組組裝和質(zhì)量評估
利用鐵觀音不同組織的全基因組測序,分離得到14,691個等位基因(圖2),其中1,528個基因存在一致性的等位特異性表達(dá)(consistent allele-specific expression, ASEGs),即一個等位基因在所有組織和樣本中的表達(dá)都高于另一等位基因?;蚋患治鲲@示這些基因參與核糖體等多個生物學(xué)基本過程,與克服有害突變的潛在機(jī)制相關(guān)。同時還發(fā)現(xiàn)了386個非一致的ASEGs,它們在不同組織的等位基因之間存在特異性表達(dá)。其中幾個基因與揮發(fā)性有機(jī)化合物的生物合成有關(guān),包括黃酮和黃酮醇等的生物合成途徑,這與植物的適應(yīng)性演化相關(guān)。結(jié)果表明,在鐵觀音基因組中,一致性的ASEG明顯多于不一致的ASEG(1,528 vs 386),這一趨勢與雜交水稻的結(jié)果正好相反,即在雜交水稻中,不一致的ASEG遠(yuǎn)遠(yuǎn)大于一致性的ASEG。這種現(xiàn)象或許可以用雜種優(yōu)勢理論中的顯性效應(yīng)解釋,長期無性繁殖的茶樹利用優(yōu)勢等位基因應(yīng)答不斷積累的遺傳負(fù)荷,以保持個體的適應(yīng)度。
圖2 茶樹單倍型基因組等位不平衡
通過對161份茶樹種質(zhì)資源重測序數(shù)據(jù)分析,發(fā)現(xiàn)樣本主要分為三類(圖3),分別為大理茶,大葉茶和小葉茶,與茶樹的形態(tài)學(xué)分類一致。另外大葉茶可以分類古大葉茶和栽培大葉茶;而小葉茶依據(jù)地理分布可分為四個亞組,分別為SSJ(陜西,四川,江西),ZJNFJ(浙江和福建北部),SFJ(福建南部),HHA(湖北,湖南和安徽)。TreeMix分析發(fā)現(xiàn)這些茶樹之間存在顯著的基因流動,表明種內(nèi)基因交流頻繁,其中一些與有記錄的茶樹雜交育種歷史相吻合。
圖3 茶樹群體系統(tǒng)進(jìn)化與群體結(jié)構(gòu)分析
對14種山茶屬植物的21株單株進(jìn)行了全基因組測序,通過群體遺傳分析發(fā)現(xiàn)大葉茶和小葉茶具有不同的進(jìn)化史。在Gelasian epoch時期(259-181萬年前),劇烈的氣候變化很可能導(dǎo)致了整個茶樹物種(包括大葉茶和小葉茶)的群體收縮;兩個變種分化后,僅小葉茶在Last Glacial Maximum時期(2.65-1.9萬年前)可能由于溫度驟降出現(xiàn)了再一次的群體收縮,但隨后適應(yīng)了環(huán)境的小葉茶迅速擴(kuò)張,群體規(guī)模得到恢復(fù)。該分析表明,大葉茶和小葉茶分化后的進(jìn)化史不同(圖4)。通過對大葉茶和小葉茶馴化基因的分析,發(fā)現(xiàn)它們的馴化過程是并行的(即獨(dú)立馴化),這些馴化基因參與了一系列重要的生物學(xué)過程且受人工選育的偏好性影響。基于KEGG分析,在大葉茶馴化早期以參與氧化石墨烯苷轉(zhuǎn)運(yùn)、糖苷轉(zhuǎn)運(yùn)通路為主,后期品種改良主要集中在合成生物堿和芳香化合物等。例如,研究人員鑒定到CsXDH基因在大葉茶品種改良階段受到強(qiáng)烈的人工選擇,該基因編碼黃嘌呤脫氫酶,是咖啡因合成通路的重要基因。而小葉茶品種的早期馴化與植物抵御相關(guān),改良過程主要集中在花發(fā)育的調(diào)控和對一氧化氮的響應(yīng),已有研究表明,NO的積累可以加速γ-氨基丁酸的消耗從而幫助植物抵御冷脅迫,這表明篩選耐寒的品種也是人工選育的重要目標(biāo)。
圖4 大葉茶和小葉茶的平行馴化
本研究成功組裝了兩套鐵觀音基因組(單倍體參考基因組和單體型基因組)。通過對等位基因特異性表達(dá)的分析,預(yù)測顯性效應(yīng)可能是鐵觀音應(yīng)對遺傳負(fù)荷的重要機(jī)制。通過對茶樹種群水平的遺傳分析,揭示了該物種的進(jìn)化和人工馴化歷史。該成果為利用組學(xué)分析和分子生物學(xué)技術(shù)挖掘功能基因、解析其背后的遺傳調(diào)控機(jī)制,開展基于大數(shù)據(jù)驅(qū)動的基因組智能設(shè)計育種奠定了堅實(shí)的理論基礎(chǔ),同時也為縮短育種周期、提高育種效率、降低育種成本提供了科學(xué)依據(jù)。
Zhang X, Chen S, Shi L, et al. Haplotype-resolved genome assembly provides insights into evolutionary history of the tea plant Camellia sinensis[J]. Nature Genetics, 2021,53(8):1250-1259