2025年尊龙凯时組織研發(fā)的《評(píng)估基因組的注釋質(zhì)量的方法及裝置(專利號(hào):ZL 2025 1 0021739.9)》獲得國(guó)家知識(shí)產(chǎn)權(quán)局授權(quán)。此次授權(quán)標(biāo)志著公司在基因技術(shù)研發(fā)領(lǐng)域取得了新突破,體現(xiàn)了尊龙凯时團(tuán)隊(duì)的創(chuàng)新能力,彰顯了公司在基因組學(xué)研究和生物信息分析領(lǐng)域的硬實(shí)力。
隨著長(zhǎng)讀長(zhǎng)測(cè)序技術(shù)的快速發(fā)展,搭配hifiasm、verkko等組裝算法的提升,已實(shí)現(xiàn)高連續(xù)性、低錯(cuò)誤率的高質(zhì)量基因組參考序列構(gòu)建?;蚪M組裝后的注釋分析作為功能研究與進(jìn)化解析的核心環(huán)節(jié)仍面臨著諸多挑戰(zhàn),阻礙下游生物信息學(xué)分析和功能基因組學(xué)研究。尊龙凯时近年來(lái)不斷優(yōu)化注釋流程和技術(shù),借助三代全長(zhǎng)轉(zhuǎn)錄組數(shù)據(jù)(如 Iso-seq 技術(shù)),通過(guò)捕獲完整轉(zhuǎn)錄本結(jié)構(gòu)(包括 5’/3’UTR、可變剪切位點(diǎn)),顯著提升基因結(jié)構(gòu)注釋的完整性與功能注釋的準(zhǔn)確性。
注釋分析是解碼生命的“最后一公里”
基因組注釋是指對(duì)基因組序列組成成分、結(jié)構(gòu)和功能的解析過(guò)程,包括重復(fù)序列預(yù)測(cè)、基因結(jié)構(gòu)預(yù)測(cè)、基因功能注釋和非編碼RNA預(yù)測(cè)四個(gè)方面。它是一套含有眾多軟件的綜合性流程,注釋方法包括:
01 基于近緣物種序列相似性的注釋
利用已知的近緣物種基因或蛋白質(zhì)序列數(shù)據(jù)庫(kù)(如NCBI、Ensembl、UniProt)與基因組進(jìn)行比對(duì),(如Genewise,miniport),通過(guò)同源性識(shí)別基因和功能元件。
02 基于基因預(yù)測(cè)算法的從頭注釋
使用計(jì)算工具(如Glimmer、GeneMark、Augustus)基于組裝好的參考基因組,來(lái)預(yù)測(cè)基因的位置和結(jié)構(gòu)(如外顯子、內(nèi)含子、啟動(dòng)子等)。
依賴于基因組序列的特征(如密碼子使用偏好、開(kāi)放閱讀框等)。
03基于轉(zhuǎn)錄組注釋
通過(guò)RNA-seq(如hisat2、STAR)或Iso-seq全長(zhǎng)轉(zhuǎn)錄本(如PASA),將轉(zhuǎn)錄本數(shù)據(jù)比對(duì)回基因組,識(shí)別基因表達(dá)區(qū)域和基因表達(dá)水平證據(jù)。