Hi-C技術(shù)源于染色體構(gòu)象捕獲技術(shù),利用高通量測(cè)序技術(shù),結(jié)合生物信息分析方法,研究全基因組范圍內(nèi)整個(gè)染色質(zhì)DNA在空間位置上的關(guān)系,獲得高分辨率的染色質(zhì)三維結(jié)構(gòu)信息?;贖i-C數(shù)據(jù)中染色質(zhì)片段間的交互強(qiáng)度呈現(xiàn)出隨距離衰減的規(guī)律,Hi-C可以用于基因組組裝,將雜亂的基因序列組裝到染色體水平。
產(chǎn)品類(lèi)型 | 策略 | 推薦數(shù)據(jù)量 | 周期 |
Hi-C輔助組裝 | 二代平臺(tái) | 嵌合基因組:100X 單體型組裝:?jiǎn)翁?00X | 60天 (建庫(kù)測(cè)序+標(biāo)準(zhǔn)分析) |
產(chǎn)品類(lèi)型 | 送樣要求 |
Hi-C 測(cè)序技術(shù) | 新鮮組織進(jìn)行甲醛交聯(lián),1個(gè)Hi-C文庫(kù)需要組織量約2-3 g,對(duì)應(yīng)的基因組DNA量為15 μg。 |
期刊:Horticulture Research 合作方式:共同作者 影響因子:6.793 發(fā)表時(shí)間:2021.11
合作單位:中國(guó)科學(xué)院植物研究所 研究對(duì)象:毛酸漿
毛酸漿染色體水平基因組
茄科是提供營(yíng)養(yǎng)和果蔬多樣性的重要來(lái)源之一。酸漿屬作為茄科最大的屬之一,具有獨(dú)特的果實(shí)形態(tài)和生化多樣性,是生態(tài)、進(jìn)化和發(fā)育研究的新的園藝作物。毛酸漿作為酸漿屬模式生物的代表物種之一,其花萼在受精后隨漿果發(fā)育迅速膨大,形成“中國(guó)燈籠”或膨大花萼綜合征(ICS)這一創(chuàng)新形態(tài),包裹漿果。然而,酸漿屬果實(shí)形態(tài)、生化特性及其起源背后的遺傳基礎(chǔ)還不夠清楚。為了更好地了解茄科此類(lèi)性狀的起源、進(jìn)化和發(fā)育機(jī)制,研究者使用PacBio三代測(cè)序技術(shù)和基于染色體構(gòu)象捕獲的Hi-C技術(shù),實(shí)現(xiàn)了毛酸漿染色體水平的基因組組裝。
材料選擇:二倍體的毛酸漿幼葉
測(cè)序策略:
三代平臺(tái) 基因組測(cè)序,90X
二代平臺(tái) DNA小片段文庫(kù),PE150雙端測(cè)序,100X
二代平臺(tái) Hi-C文庫(kù)
結(jié)合進(jìn)化和功能分析,對(duì)酸漿屬果實(shí)形態(tài)創(chuàng)新“中國(guó)燈籠”和特征性化學(xué)成分的進(jìn)化遺傳基礎(chǔ)有了新的認(rèn)識(shí)。
首先,對(duì)基因組進(jìn)行二代測(cè)序,共得到149 Gb的高質(zhì)量數(shù)據(jù)。研究發(fā)現(xiàn)基因組純合度較高,并且有大量的重復(fù)序列。通過(guò)K-mer分析后,利用三代平臺(tái)進(jìn)行測(cè)序,得到125 Gb的subreads,組裝成922條contigs,contig N50長(zhǎng)度為4.87 Mb。并利用Hi-C數(shù)據(jù)將1.37 Gb的數(shù)據(jù)組裝為12條染色體,使用二代測(cè)序數(shù)據(jù)驗(yàn)證,并與全長(zhǎng)轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行比對(duì),來(lái)評(píng)估組裝的完整性,基因組組裝評(píng)估表明得到了高水平的毛酸漿染色體水平基因組。
圖1 毛酸漿的形態(tài)和基因組組裝結(jié)果
利用蛋白質(zhì)編碼基因、tRNA和rRNA基因、轉(zhuǎn)座因子及GC分布和基因組重排事件等信息,進(jìn)行數(shù)據(jù)評(píng)估。結(jié)合de novo和同源性的方法,將數(shù)據(jù)整合到毛酸漿基因組中,并在轉(zhuǎn)錄組序列輔助下,注釋蛋白質(zhì)編碼序列。在當(dāng)前基因組版本中,共預(yù)測(cè)出32,075個(gè)完整蛋白編碼基因,進(jìn)一步預(yù)測(cè)了3,655個(gè)rRNA,997個(gè)tRNA,375個(gè)miRNA,和3,047個(gè)snRNA 。
圖2 高質(zhì)量的毛酸漿基因組
利用7,553個(gè)單拷貝基因家族進(jìn)行系統(tǒng)基因組分析,揭示了毛酸漿和其他12個(gè)代表性物種的拓?fù)浣Y(jié)構(gòu)??紤]到茄科植物共同的WGD歷史,進(jìn)一步研究了酸漿屬、番茄屬和辣椒屬三種基因組。在全染色體水平上,三個(gè)基因組之間存在明顯的一對(duì)一共線關(guān)系,雖然基因組大小不同,但總體基因組是相對(duì)保守的,僅觀察到幾個(gè)小規(guī)模的染色體重排和物種特定的基因組區(qū)域。
圖3 茄屬植物的基因組進(jìn)化
選取八種茄科植物的基因組,OrthoMCL法構(gòu)建正交群,發(fā)現(xiàn)在茄科基因組中,大部分基因聚集在直系同源基因或旁系同源基因中;且某些基因家族在進(jìn)化過(guò)程中經(jīng)常發(fā)生擴(kuò)張和收縮。在進(jìn)一步揭示基因組獨(dú)特性的研究中,選用毛酸漿和其他12種植物,發(fā)現(xiàn)直系同源基因、旁系同源基因和非聚類(lèi)基因在13種植物中以相似的方式分布。GO富集分析中,毛酸漿特異的基因則發(fā)揮了多種作用。在以上多層次的進(jìn)化分析中,在酸漿屬、辣椒屬和茄屬植物的基因組中觀察到小規(guī)模突變。其中,與甾體相關(guān)化合物生物合成途徑關(guān)鍵步驟相關(guān)的基因和與“中國(guó)燈籠”形成相關(guān)的MADS-box基因的潛在遺傳變異是關(guān)注的重點(diǎn),并做了進(jìn)一步研究。
圖4 被子植物代表性物種的基因家族比較
類(lèi)固醇是所有真核生物必需物質(zhì)之一,檢測(cè)了類(lèi)固醇在生物合成途徑的關(guān)鍵基因。在33個(gè)基因家族中的結(jié)果研究表明,大多數(shù)基因家族的拷貝數(shù)變異(CNV)具有可比性,注釋的HMGR和SQE基因的拷貝數(shù)發(fā)生顯著變化,毛酸漿中發(fā)現(xiàn)20個(gè)SQE-like基因(拷貝數(shù)比非毛酸漿基因組高出約4倍),因此表現(xiàn)出特異性擴(kuò)張。在甾體生物合成途徑中,SQE基因編碼黃酮類(lèi)單加氧酶,在類(lèi)固醇生物合成途徑中起限速酶的作用。這些基因的CNV在與毛酸漿相關(guān)的不同物種間類(lèi)固醇代謝產(chǎn)物的自然變異中所起的作用需要進(jìn)一步深入研究。
圖5 毛酸漿中參與類(lèi)固醇相關(guān)衍生物合成基因的特異性進(jìn)化
毛酸漿基因組包含136個(gè)推定的MADS-box基因。研究者對(duì)MADS-box基因的進(jìn)化關(guān)系進(jìn)行了研究。排除基因組錯(cuò)誤組裝的可能性,數(shù)據(jù)同源性搜索結(jié)果證實(shí)毛酸漿和辣椒中MBP21發(fā)生缺失。這種缺失可能是進(jìn)化過(guò)程中的染色體重排造成的。MBP21類(lèi)基因的敲除或突變,往往產(chǎn)生花萼增大的現(xiàn)象。因此,這一基因丟失很可能與“中國(guó)燈籠”的起源有關(guān)。MPF2和MBP21基因的共同表達(dá)影響了酸漿屬雄性不育和花萼的生長(zhǎng),表明酸漿屬中MPF2和MBP21間的功能性沖突。這種功能沖突意味著這兩個(gè)基因之間的協(xié)調(diào)是它們?cè)贗CS發(fā)育中正常發(fā)揮功能所必需的。
圖6 酸漿屬M(fèi)BP21-like MADS-box基因丟失和“中國(guó)燈籠”的形成
不同物種基因組的Southern印跡分析結(jié)果表明,酸漿族中MBP21同源基因的丟失與ICS出現(xiàn)有密切關(guān)系。綜上所述,MBP21類(lèi)基因的丟失可能代表了一種與“中國(guó)燈籠”起源有關(guān)的新突變。
圖7 酸漿族MBP21丟失與ICS的發(fā)生相關(guān)
研究者構(gòu)建出第一個(gè)毛酸漿的高質(zhì)量染色體水平的參考基因組。除了已知的MPF2的異位表達(dá),基于基因組數(shù)據(jù)還發(fā)現(xiàn)一個(gè)SEP類(lèi)MADS-box基因的丟失這一突變。它們可能共同決定了ICS(膨大花萼綜合征)這一創(chuàng)新形態(tài)的起源。酸漿果實(shí)中某些甾類(lèi)化合物大量積累可能與SQE基因起源和顯著擴(kuò)展有關(guān)。這些甾體的自然變異可能是基因家族的拷貝導(dǎo)致的。本研究強(qiáng)調(diào)了基因獲得和基因缺失在果實(shí)新性狀進(jìn)化和發(fā)育中的重要作用,毛酸漿基因組數(shù)據(jù)為研究植物進(jìn)化遺傳學(xué)以及其他茄科作物的遺傳改良和育種提供了重要參考。
Lu J, Luo M, Wang L, et al. The Physalis floridana genome provides insights into the biochemical and morphological evolution of Physalis fruits[J]. Horticulture Research, 2021, 8(1):244.
分析內(nèi)容 | 軟件 | 備注 |
基因組比對(duì)分析 | Bowtie2 | Clean reads比對(duì)到參考基因組,結(jié)合HiC-Pro一起使用,挑選paired-end Reads 兩端都比對(duì)到基因組唯一位置的reads |
唯一比對(duì)的reads分配到酶切片段 | HiC-Pro | 比對(duì)后的reads Pair分配到酶切片段選取Valid reads |
交互矩陣及標(biāo)準(zhǔn)化 | HiC-Pro | 生成交互矩陣及標(biāo)準(zhǔn)化 |
染色體拼接 | LACHERSIS / ALLHiC | 依據(jù)酶切片段互作信息,將草圖組裝到染色體級(jí)別 |
糾錯(cuò) | 3D-DNA | 根據(jù)互作信號(hào)對(duì)基因組糾錯(cuò) |