全基因組關(guān)聯(lián)分析 (Genome-Wide Association Study,GWAS)在動植物的研究中對于重要性狀特別是復(fù)雜性狀的定位有著快速、準(zhǔn)確的優(yōu)點?;诟咄繙y序?qū)δ撤N農(nóng)作物或禽畜的代表性品種、地方種或野生種進行基因分型,結(jié)合準(zhǔn)確的表型數(shù)據(jù)可對農(nóng)作物或禽畜重要復(fù)雜性性狀進行定位。特別是在包含了野生種、馴化種和改良種的群體中,結(jié)合群體進化分析對收到馴化和改良的重要基因進行定位,是研究作物或禽畜微進化及馴化改良表型的重要思路。
產(chǎn)品類型 | 測序策略 | 指 標(biāo) | 周 期 |
GWAS | 二代測序 PE150 | 樣本數(shù)≥200 個體測序深度≥10X | 分析周期45天 (400個樣本以內(nèi)、 5Tb 數(shù)據(jù)量以下) |
產(chǎn)品類型 | 送樣要求 |
GWAS | 樣品類型:無降解且無蛋白和RNA污染的雙鏈DNA樣品 |
樣品需求量:小片段文庫≥200 ng | |
樣品濃度:≥5 ng/μl | |
樣品質(zhì)量:基因組完整性等級高于7 | |
樣品體積:≥12 μl |
對于鑒定未知基因與QTL的關(guān)聯(lián)存在較大困難的原因在于:1、具有豐富多態(tài)性的作物群體材料常常存在強烈的群體結(jié)構(gòu)效應(yīng),進而導(dǎo)致表型與分子標(biāo)記之間的假陽性關(guān)聯(lián)結(jié)果。2、LD衰減距離過長導(dǎo)致未知基因鑒定困難,特別是當(dāng)單個LD衰減范圍內(nèi)存在多個候選基因表現(xiàn)出顯著信號時,對于與目標(biāo)基因關(guān)聯(lián)的真實基因需要通過額外的實驗進行確認(rèn)。
材料:選取了沒有較高群體結(jié)構(gòu)、彼此之間有一定血緣關(guān)系的176日本粳稻品種,同時群體又表現(xiàn)出很高的群體多態(tài)性
建庫:DNA小片段文庫
測序:二代測序,PE100,5.8X
分析:群體結(jié)構(gòu)分析,LD分析,關(guān)聯(lián)分析
選擇表型呈正太分布且組間存在豐富差異的材料;基于樣本間SNPs多態(tài)性的群體結(jié)構(gòu)分析則表明在這些表型差異豐富的材料之間不存在明顯的群體分層。群體的LD衰減物理距離在445kb(r2=0.2),與已報道的具有更高表型多態(tài)性的群體相比,LD衰減比較一致,說明材料的選擇對控制LD衰減有一定的幫助。
圖1 群體表型數(shù)據(jù)統(tǒng)計與主成分分析
文章通過使用混合線性模型進行GWAS關(guān)聯(lián)分析,鑒定到了26個LOD值大于4.77的位點,其中有3個最高的信號位點分別位于染色體1,6,11,兩個峰點的位置與已報道的抽穗期相關(guān)基因Hd6和Hd2的QTL定位結(jié)果一致,分別定位于染色體3和染色體7。對于GWAS定位結(jié)果的驗證,采用已報道的QTL來驗證是最具說服力的。
圖2 與水稻拔節(jié)相關(guān)的QTL定位結(jié)果
對于未經(jīng)報道的QTL定位信號,其中位于染色體1的候選區(qū)域被錨定在36.30 Mb到36.65 Mb之間(346 Kb),該候選區(qū)域包括了91個與抽穗期顯著關(guān)聯(lián)的位點和7個基因,其中基因LOC_Os01g62780與擬南芥的HESO1基因同源,該基因在擬南芥中表現(xiàn)為延遲開花。同樣,位于第11號染色體上也挖掘到了與水稻抽穗期相關(guān)的候選基因LOC_Os11g08410。研究者也對水稻的分蘗數(shù)、葉寬等性狀進行了全基因組關(guān)聯(lián)分析,獲得了許多控制上述農(nóng)藝性狀的候選基因。
為保證GWAS分析結(jié)果的準(zhǔn)確性,文章在材料選擇方面選擇了群體結(jié)構(gòu)分層不明顯的水稻材料。基于基因的關(guān)聯(lián)分析對農(nóng)藝性狀GWAS分析檢測的假陽性結(jié)果有很好控制效果。
Yano K, Yamamoto E, Aya K, et al. Genome-wide association study using whole-genome sequencing rapidly identifies new genes influencing agronomic traits in rice[J]. Nature Genetics, 2016.