新人工智能模型可精確預測人體細胞基因表達-紫荊網

新人工智能模型可精確預測人體細胞基因表達

日期:2025-01-14 來源:新華網 瀏覽量: 字號:
分享到
用微信掃描二維碼

美國研究人員開發出一個新的人工智能模型,經過大量數據的訓練後,該模型能精確預測各種人體細胞內部的基因表達情況,將為生物和醫學研究帶來便利。

這個名為“通用表達轉換器”(GET)的模型由美國哥倫比亞大學和卡內基-梅隆大學等機構研究人員聯合開發,其準確性和有效性已得到實驗驗證,論文發表在新一期英國《自然》雜誌上。

在基因表達過程中,以DNA形式儲存的基因“藍圖”轉錄成為RNA形式的“抄本”,後者指導合成出蛋白質,執行具體的生理功能。參與轉錄調控的生物分子種類繁多,相互作用極為複雜,此前相關預測模型侷限於幾種特定的細胞,尤其是癌細胞,缺乏適用於人體多種細胞類型的通用工具。

研究人員根據轉錄調控機制的特點設計出機器學習模型,然後用來自1.3萬個人體細胞的基因測序和表達數據對其進行訓練。這些細胞涵蓋213種人類胚胎細胞和成體細胞,都來自沒有病變的正常人體組織。

就像ChatGPT等人工智能工具能根據大量語料總結出通用語法規則,GET模型也能從訓練數據中總結出關於轉錄調控的“語法”,在此基礎上能對其沒有接觸過的細胞類型進行基因表達預測。

該模型可用於揭示致病基因的作用機制,指導癌症和遺傳疾病研究。例如某種兒童白血病的患者攜帶一個功能不明的變異基因,GET模型預測該基因會擾亂細胞中兩種轉錄因子的相互作用,實驗數據證實了這一結論。

研究人員說,該模型還可用於探尋基因組中“暗物質”的作用。蛋白質編碼基因序列只佔人類基因組的一小部分,佔比達98%的非編碼區域就像宇宙中的暗物質一樣,其屬性和功能目前難以捉摸。

來源:新華網

掃描二維碼分享到手機

編輯:劉雨桐 校對:郭孟琦 監製:連振海
亞冬會|受傷的中國香港冰球隊員將參加今晚賽事
李家超:香港與黑龍江合作共贏,同創繁榮未來
夏寶龍調研河套香港園區和深圳前海深港現代服務業合作區
唯一非好萊塢影片!《哪吒2》進入全球票房榜前30
紫荊雜誌
影響有影響力的人