研究人員利用人工智能技術證明,所謂的“垃圾”DNA突變可導致自閉症。該研究於5月27日在Nature Genetics上發表,是第一個將此類突變與神經發育狀況聯繫起來的研究。

該研究由Olga Troyanskaya與Robert Darnell合作領導。Troyanskaya是紐約市Flatiron研究所計算生物學中心(CCB)的基因組學副主任,也是普林斯頓大學的計算機科學教授。Darnell是洛克菲勒大學的Robert和Harriet Heilbrunn癌症生物學教授,也是Howard Hughes醫學研究所的研究員。

他們的團隊使用機器學習來分析1,790名自閉症患者及其未受影響的父母和兄弟姐妹的全基因組。這些人沒有自閉症的家族史,這意味著他們病情的遺傳原因可能是自發突變而不是遺傳突變。

該分析預測了基因組部分中不編碼蛋白質的遺傳突變的分枝,這些區域經常被誤認為是“垃圾”DNA。與非編碼突變相關的自閉症病例的數量與禁用基因功能的蛋白質編碼突變相關的病例數相當。

Troyanskaya說,這項工作的意義超越了自閉症。這是第一次明確證實非遺傳性非編碼突變導致任何復雜的人類疾病或病症。”

研究報告的共同作者,CCB和普林斯頓的Jian Zhou說,科學家可以應用新研究中使用的相同技術來探索非編碼突變在癌症和心臟病等疾病中的作用。“這使人們對不僅是自閉症,而且還有許多人類疾病的原因有了新的認識。”

只有1%到2%的人類基因組由編碼製造蛋白質藍圖的基因組成。這些蛋白質在我們的身體中執行任務,例如調節血糖水平,對抗感染和在細胞之間發送通信。然而,我們基因組的另外98%不是基因的沉痾。非編碼區有助於調節基因何時何地產生蛋白質。

在沒有自閉症家族史的個體中,蛋白質編碼區域的突變佔自閉症病例的最多30%。證據表明,引起自閉症的突變也必須發生在基因組的其他地方。

揭示哪些非編碼突變可能導致自閉症是棘手的。單個個體可能具有數十個非編碼突變,其中大多數是個體獨有的。這使得識別受影響人群中常見突變的傳統方法無法實現。

Troyanskaya和她的同事採取了新的方法。他們訓練機器學習模型來預測給定序列如何影響基因表達。

普林斯頓Troyanskaya實驗室的研究科學家Chandra Theesfeld說:“這是對我們在分析中引入的基因研究思路的轉變。” “除了研究大數據共有基因突變的科學家之外,我們在這裡應用了一套智能,複雜的工具,告訴我們任何特定的突變將會發生什麼,甚至是那些罕見或以前從未觀察到的突變。”

研究人員通過將機器學習模型應用於稱為Simons Simplex Collection的遺傳數據寶庫來研究自閉症的遺傳基礎。Flatiron Institute的母公司Simons Foundation製作並維護了存儲庫。Simons Simplex Collection包含由自閉症兒童,未受影響的兄弟姐妹及其未受影響的父母組成的近2,000個“四重奏”的全基因組。

這些四人過去沒有自閉症的家族史,這意味著非遺傳性突變可能是影響兒童病情的原因。(這種突變在精子和卵細胞以及胚胎中自發發生。)

研究人員使用他們的模型預測每個自閉症兒童的非遺傳性非編碼突變的影響。然後,他們將這些預測與孩子未受影響的兄弟姐妹中相同的,未突變的鏈的影響進行了比較。

“Simons Simplex Collection的設計使我們能夠進行這項研究,”周說。“未受影響的兄弟姐妹是一個內置的控制。”

分析顯示,許多自閉症兒童的非編碼突變改變了基因調控此外,結果表明突變影響了大腦中的基因表達和已經與自閉症相關的基因,例如那些負責神經元遷移和發育的基因。“這與自閉症最有可能在大腦中的表現形成一致,”該研究的共同作者,CCB研究科學家Christopher Park說。“這不僅僅是突變發生的數量,而是發生了什麼樣的突變。”

研究人員在實驗室實驗中測試了一些非編碼突變的影響。他們將自閉症兒童中發現的預測高影響突變插入到細胞中,並觀察到基因表達的變化。這些變化肯定了模型的預測。

Troyanskaya說她和她的同事將繼續改進和擴展他們的方法。最終,她希望這項工作能夠改善遺傳數據如何用於診斷和治療疾病和異常。“現在,98%的基因組通常被扔掉,”她說。“我們的工作可以讓你思考98%我們能做些什麼。”

參考文獻:

 

  1. Jian Zhou, Christopher Y. Park, Chandra L. Theesfeld, Aaron K. Wong, Yuan Yuan, Claudia Scheckel, John J. Fak, Julien Funk, Kevin Yao, Yoko Tajima, Alan Packer, Robert B. Darnell, Olga G. Troyanskaya. Whole-genome deep-learning analysis identifies contribution of noncoding mutations to autism riskNature Genetics, May 27, 2019; DOI: 10.1038/s41588-019-0420-0

鄭醫師補充:

現在我們的基因檢測,大多是針對1%到2%的人類基因組由編碼製造蛋白質藍圖的基因組成。這些蛋白質在我們的身體中執行任務,例如調節血糖水平,對抗感染和在細胞之間發送通信。剩下的98%其實不應被視為垃圾基因,正確的說法,是人類目前的研究還無法明瞭這98%的基因如何調控那1-2%的蛋白質製造等等的機制。這是一個重要的研究,提醒我們,自閉症不見得是遺傳疾病,直接可以經由精卵結合時產生的基因變異,自發性產生,而且影響的區域是在未知的98%被視為垃圾基因的區域。這對自閉症未來的診斷甚至是治療可能扮演關鍵性的角色。

 

    鄭醫師的部落格 發表在 痞客邦 留言(0) 人氣()