尊龙凯时

產(chǎn)品與服務(wù)
PRODUCTS & SERVICE

Hi-C輔助組裝

  • 產(chǎn)品簡(jiǎn)介
  • 技術(shù)流程
  • 樣本要求
  • 案例分析
  • FAQ

Hi-C技術(shù)源于染色體構(gòu)象捕獲技術(shù),利用高通量測(cè)序技術(shù),結(jié)合生物信息分析方法,研究全基因組范圍內(nèi)整個(gè)染色質(zhì)DNA在空間位置上的關(guān)系,獲得高分辨率的染色質(zhì)三維結(jié)構(gòu)信息?;贖i-C數(shù)據(jù)中染色質(zhì)片段間的交互強(qiáng)度呈現(xiàn)出隨距離衰減的規(guī)律,Hi-C可以用于基因組組裝,將雜亂的基因序列組裝到染色體水平。

產(chǎn)品優(yōu)勢(shì)
  • 覆蓋度
    不受標(biāo)記數(shù)量限制,有更高覆蓋度和特異性。
  • 實(shí)驗(yàn)操作
    無(wú)需構(gòu)建作圖群體,周期短實(shí)驗(yàn)規(guī)模小,經(jīng)濟(jì)實(shí)惠。
  • 準(zhǔn)確度
    結(jié)果準(zhǔn)確、直觀,受重復(fù)、雜合區(qū)域影響小。
  • 適用范圍
    不僅能應(yīng)用于簡(jiǎn)單基因組,而且非常適合高雜合類(lèi),超大基因組物種輔助組裝。
應(yīng)用領(lǐng)域
  • 已有基因組組裝水平提升
  • 基因組de novo輔助組裝
   
產(chǎn)品類(lèi)型策略推薦數(shù)據(jù)量周期
Hi-C輔助組裝二代平臺(tái)嵌合基因組:100X
單體型組裝:?jiǎn)翁?00X
60天
(建庫(kù)測(cè)序+標(biāo)準(zhǔn)分析)

產(chǎn)品類(lèi)型送樣要求
Hi-C 測(cè)序技術(shù)新鮮組織進(jìn)行甲醛交聯(lián),1個(gè)Hi-C文庫(kù)需要組織量約2-3 g,對(duì)應(yīng)的基因組DNA量為15 μg。
毛酸漿高質(zhì)量參考基因組組裝及其進(jìn)化研究
The Physalis floridana genome provides insights into the biochemical and morphological evolution of Physalis fruits

期刊:Horticulture Research    合作方式:共同作者  影響因子:6.793   發(fā)表時(shí)間:2021.11   

合作單位:中國(guó)科學(xué)院植物研究所  研究對(duì)象:毛酸漿

關(guān)鍵詞

毛酸漿染色體水平基因組

研究背景

茄科是提供營(yíng)養(yǎng)和果蔬多樣性的重要來(lái)源之一。酸漿屬作為茄科最大的屬之一,具有獨(dú)特的果實(shí)形態(tài)和生化多樣性,是生態(tài)、進(jìn)化和發(fā)育研究的新的園藝作物。毛酸漿作為酸漿屬模式生物的代表物種之一,其花萼在受精后隨漿果發(fā)育迅速膨大,形成“中國(guó)燈籠”或膨大花萼綜合征(ICS)這一創(chuàng)新形態(tài),包裹漿果。然而,酸漿屬果實(shí)形態(tài)、生化特性及其起源背后的遺傳基礎(chǔ)還不夠清楚。為了更好地了解茄科此類(lèi)性狀的起源、進(jìn)化和發(fā)育機(jī)制,研究者使用PacBio三代測(cè)序技術(shù)和基于染色體構(gòu)象捕獲的Hi-C技術(shù),實(shí)現(xiàn)了毛酸漿染色體水平的基因組組裝。

設(shè)計(jì)思路

材料選擇:二倍體的毛酸漿幼葉

測(cè)序策略:
三代平臺(tái) 基因組測(cè)序,90X
二代平臺(tái) DNA小片段文庫(kù),PE150雙端測(cè)序,100X
二代平臺(tái) Hi-C文庫(kù)

文章亮點(diǎn)

結(jié)合進(jìn)化和功能分析,對(duì)酸漿屬果實(shí)形態(tài)創(chuàng)新“中國(guó)燈籠”和特征性化學(xué)成分的進(jìn)化遺傳基礎(chǔ)有了新的認(rèn)識(shí)。

研究結(jié)果

高水平的毛酸漿基因組組裝


首先,對(duì)基因組進(jìn)行二代測(cè)序,共得到149 Gb的高質(zhì)量數(shù)據(jù)。研究發(fā)現(xiàn)基因組純合度較高,并且有大量的重復(fù)序列。通過(guò)K-mer分析后,利用三代平臺(tái)進(jìn)行測(cè)序,得到125 Gb的subreads,組裝成922條contigs,contig N50長(zhǎng)度為4.87 Mb。并利用Hi-C數(shù)據(jù)將1.37 Gb的數(shù)據(jù)組裝為12條染色體,使用二代測(cè)序數(shù)據(jù)驗(yàn)證,并與全長(zhǎng)轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行比對(duì),來(lái)評(píng)估組裝的完整性,基因組組裝評(píng)估表明得到了高水平的毛酸漿染色體水平基因組。

2.png
圖1 毛酸漿的形態(tài)和基因組組裝結(jié)果

基因組注釋和基因預(yù)測(cè)


利用蛋白質(zhì)編碼基因、tRNA和rRNA基因、轉(zhuǎn)座因子及GC分布和基因組重排事件等信息,進(jìn)行數(shù)據(jù)評(píng)估。結(jié)合de novo和同源性的方法,將數(shù)據(jù)整合到毛酸漿基因組中,并在轉(zhuǎn)錄組序列輔助下,注釋蛋白質(zhì)編碼序列。在當(dāng)前基因組版本中,共預(yù)測(cè)出32,075個(gè)完整蛋白編碼基因,進(jìn)一步預(yù)測(cè)了3,655個(gè)rRNA,997個(gè)tRNA,375個(gè)miRNA,和3,047個(gè)snRNA 。

3.png
圖2 高質(zhì)量的毛酸漿基因組

基因組進(jìn)化分析


利用7,553個(gè)單拷貝基因家族進(jìn)行系統(tǒng)基因組分析,揭示了毛酸漿和其他12個(gè)代表性物種的拓?fù)浣Y(jié)構(gòu)??紤]到茄科植物共同的WGD歷史,進(jìn)一步研究了酸漿屬、番茄屬和辣椒屬三種基因組。在全染色體水平上,三個(gè)基因組之間存在明顯的一對(duì)一共線關(guān)系,雖然基因組大小不同,但總體基因組是相對(duì)保守的,僅觀察到幾個(gè)小規(guī)模的染色體重排和物種特定的基因組區(qū)域。

4.png
圖3 茄屬植物的基因組進(jìn)化

基因家族的進(jìn)化分析


選取八種茄科植物的基因組,OrthoMCL法構(gòu)建正交群,發(fā)現(xiàn)在茄科基因組中,大部分基因聚集在直系同源基因或旁系同源基因中;且某些基因家族在進(jìn)化過(guò)程中經(jīng)常發(fā)生擴(kuò)張和收縮。在進(jìn)一步揭示基因組獨(dú)特性的研究中,選用毛酸漿和其他12種植物,發(fā)現(xiàn)直系同源基因、旁系同源基因和非聚類(lèi)基因在13種植物中以相似的方式分布。GO富集分析中,毛酸漿特異的基因則發(fā)揮了多種作用。在以上多層次的進(jìn)化分析中,在酸漿屬、辣椒屬和茄屬植物的基因組中觀察到小規(guī)模突變。其中,與甾體相關(guān)化合物生物合成途徑關(guān)鍵步驟相關(guān)的基因和與“中國(guó)燈籠”形成相關(guān)的MADS-box基因的潛在遺傳變異是關(guān)注的重點(diǎn),并做了進(jìn)一步研究。

5.png
圖4 被子植物代表性物種的基因家族比較

參與類(lèi)固醇化合物生物合成途徑的基因進(jìn)化


類(lèi)固醇是所有真核生物必需物質(zhì)之一,檢測(cè)了類(lèi)固醇在生物合成途徑的關(guān)鍵基因。在33個(gè)基因家族中的結(jié)果研究表明,大多數(shù)基因家族的拷貝數(shù)變異(CNV具有可比性,注釋的HMGR和SQE基因的拷貝數(shù)發(fā)生顯著變化,毛酸漿中發(fā)現(xiàn)20個(gè)SQE-like基因(拷貝數(shù)比非毛酸漿基因組高出約4倍),因此表現(xiàn)出特異性擴(kuò)張。在甾體生物合成途徑中,SQE基因編碼黃酮類(lèi)單加氧酶,在類(lèi)固醇生物合成途徑中起限速酶的作用。這些基因的CNV在與毛酸漿相關(guān)的不同物種間類(lèi)固醇代謝產(chǎn)物的自然變異中所起的作用需要進(jìn)一步深入研究。

6.png
圖5 毛酸漿中參與類(lèi)固醇相關(guān)衍生物合成基因的特異性進(jìn)化

毛酸漿“中國(guó)燈籠”發(fā)育可能與 MBP21的缺失有關(guān)


毛酸漿基因組包含136個(gè)推定的MADS-box基因。研究者對(duì)MADS-box基因的進(jìn)化關(guān)系進(jìn)行了研究。排除基因組錯(cuò)誤組裝的可能性,數(shù)據(jù)同源性搜索結(jié)果證實(shí)毛酸漿和辣椒中MBP21發(fā)生缺失。這種缺失可能是進(jìn)化過(guò)程中的染色體重排造成的。MBP21類(lèi)基因的敲除或突變,往往產(chǎn)生花萼增大的現(xiàn)象。因此,這一基因丟失很可能與“中國(guó)燈籠”的起源有關(guān)。MPF2和MBP21基因的共同表達(dá)影響了酸漿屬雄性不育和花萼的生長(zhǎng),表明酸漿屬中MPF2和MBP21間的功能性沖突。這種功能沖突意味著這兩個(gè)基因之間的協(xié)調(diào)是它們?cè)贗CS發(fā)育中正常發(fā)揮功能所必需的。

7.png
圖6 酸漿屬M(fèi)BP21-like MADS-box基因丟失和“中國(guó)燈籠”的形成

茄科MBP21丟失與ICS出現(xiàn)的關(guān)系


不同物種基因組的Southern印跡分析結(jié)果表明,酸漿族中MBP21同源基因的丟失與ICS出現(xiàn)有密切關(guān)系。綜上所述,MBP21類(lèi)基因的丟失可能代表了一種與“中國(guó)燈籠”起源有關(guān)的新突變。

8.png
圖7 酸漿族MBP21丟失與ICS的發(fā)生相關(guān)

研究結(jié)論

研究者構(gòu)建出第一個(gè)毛酸漿的高質(zhì)量染色體水平的參考基因組。除了已知的MPF2的異位表達(dá),基于基因組數(shù)據(jù)還發(fā)現(xiàn)一個(gè)SEP類(lèi)MADS-box基因的丟失這一突變。它們可能共同決定了ICS(膨大花萼綜合征)這一創(chuàng)新形態(tài)的起源。酸漿果實(shí)中某些甾類(lèi)化合物大量積累可能與SQE基因起源和顯著擴(kuò)展有關(guān)。這些甾體的自然變異可能是基因家族的拷貝導(dǎo)致的。本研究強(qiáng)調(diào)了基因獲得和基因缺失在果實(shí)新性狀進(jìn)化和發(fā)育中的重要作用,毛酸漿基因組數(shù)據(jù)為研究植物進(jìn)化遺傳學(xué)以及其他茄科作物的遺傳改良和育種提供了重要參考。

參考文獻(xiàn)

Lu J, Luo M, Wang L, et al. The Physalis floridana genome provides insights into the biochemical and morphological evolution of Physalis fruits[J]. Horticulture Research, 2021, 8(1):244.

  • Q:Hi-C輔助組裝使用的軟件有哪些?
    A:
    分析內(nèi)容軟件備注
    基因組比對(duì)分析Bowtie2Clean reads比對(duì)到參考基因組,結(jié)合HiC-Pro一起使用,挑選paired-end Reads 兩端都比對(duì)到基因組唯一位置的reads
    唯一比對(duì)的reads分配到酶切片段HiC-Pro比對(duì)后的reads Pair分配到酶切片段選取Valid reads
    交互矩陣及標(biāo)準(zhǔn)化HiC-Pro生成交互矩陣及標(biāo)準(zhǔn)化
    染色體拼接LACHERSIS / ALLHiC依據(jù)酶切片段互作信息,將草圖組裝到染色體級(jí)別
    糾錯(cuò)3D-DNA根據(jù)互作信號(hào)對(duì)基因組糾錯(cuò)
  • Q:基因組草圖有什么要求?
    A:
    A. 普通二倍體基因組(基因組大?。? G):scaffold N50 length≥500 Kb ,同時(shí),scaffold N90 length≥100 Kb。承諾組裝指標(biāo):掛載到染色體的總長(zhǎng)≥90%。
    B. 大基因組(基因組大小≥3 G):scaffold N50 length≥1 Mb ,同時(shí),contig N90 length≥150 Kb。承諾組裝指標(biāo):掛載到染色體的總長(zhǎng)≥90%。
    C.未達(dá)到上述描述組裝指標(biāo)的物種建議跟司內(nèi)溝通,協(xié)商優(yōu)化。
    以上僅限簡(jiǎn)單基因組(重復(fù)序列的比例≤60%,雜合度的比例≤0.5%且為二倍體)物種,多倍體等復(fù)雜基因組建議單個(gè)項(xiàng)目進(jìn)行評(píng)估。
97少妇无码视频在线播放_日韩熟妇啪啪无码视频_永久免费av网址_小小bbwxxxx