科技.未來|人類基因圖譜完成 勢開啟精準醫療時代

撰文:孔祥威
出版:更新:

雖然人類基因組計劃(Human Genome Project)在2003年已告完成,但是當時的基因圖譜其實一直仍有少部份缺漏。上月底終於有科學家發表研究,首次公布一個完整的人類基因組。為什麼時隔近廿年,這空白終於能夠填補?完整的人類基因圖譜,對我們又有何重要意義?

人類基因組計劃在1990年展開,在大約30億美元支持下,這計劃試圖讀取一個人的每一個基因字母。雖然計劃在2003年宣布「完成」,但是當時實際只完成了92%。一個稱為「端粒到端粒聯盟」(Telomere to Telomere Consortium,T2T)的組織,由來自世界各地數十個研究所的遺傳及計算生物學專家組成,目的就是連那8%的空白之處也要找出來。

上月底他們在《科學》(Science)期刊上共以六篇論文發表成果。美國國立衞生研究院(NIH)轄下國家人類基因組研究所(NHGRI)所長Eric Green說:「這才是第一個沒有缺失的人類基因組序列。」

人類基因組計劃(Human Genome Project)在2003年宣告完成之時,基因組仍有8%空白之處。圖為一名研究人員在比較DNA測序和色譜儀結果。(NHGRI)

簡化基因拼圖

所謂人類基因組,是一個人的全部DNA。據NHGRI解釋,每一條DNA的雙螺旋結構,皆由以A、C、T、G為代號的鹼基以一對對的方式組成。人類基因組約含有30億個基因對,涉及大約30,000個基因。統籌T2T的加州大學聖克魯斯分校(UCSC)生物分子工程助理教授Karen Miga形容,這好比「一個物種的完整說明書。每個物種都有自己的基因組,基本上是一個藍圖,告訴細胞如何以及何時創造出某個物種的個體。」

當年人類基因組計劃展開後,私人公司Celera Genomics加入競賽,結果雙方同於2001年,分別在《科學》和《自然》(Science)期刊發表了基因序列最初成果,兩年後再補上更詳細的版本。但NHGRI的高級研員Adam Phillippy說,這基因組「好像一本有幾個章節缺失了的書」。有份參與是次研究的華盛頓大學遺傳學家Evan Eichler形容,他們這次找出了「基因組的暗物質」(dark matter)。

那8%的基因,有時被為「垃圾DNA」(junk DNA),因為它們包含大量重覆的序列。Miga解釋,若以砌拼圖來比喻他們重組人類基因組圖譜的工作的話,這些DNA就好像拼圖圖畫中藍色天空的部份,幾乎沒有任何提示可以知道它們的正確位置。在當年的測序技術水平所限下,科學家最終未有完成。

T2T之所以能夠克服這難題,原因之一正是因應新的測序技術出現。Phillippy指出,過去十年這研究領域的最大轉變,是所謂「長讀測序」(long-read sequencing)的技術出現。Oxford Nanopore、Pacific Biosciences等公司研製的機器,以激光掃描從細胞中分離出來的DNA,每次可多達20,000個鹼基對。而傳統的測序方式每次只能讀到幾百對。他說新技術變相可令每塊要砌的拼圖變得更大塊,從而更容易砌好。

另一原因是,T2T採取了與過往不同的DNA採樣方法。人類基因組計劃以抽血取得DNA,而T2T是從「全葡萄胎」(complete hydatidiform mole,又名水泡狀胎塊)的細胞系(cell line)取得。人一般有兩套染色體,分別來自父和母。葡萄胎基本上是一種罕見的組織或腫瘤,成因是授精過程中,精子與一個沒有細胞核的卵子結合,所以產生的細胞只含有父系的染色體而缺少母系。Miga再用拼圖比喻,舊有的做法好像一個盒內裝有兩副近乎一樣的拼圖,而她們的方法只有一副拼圖要砌。

科學家估計,新的人類基因組可有助了解基因變異與疾病成因的關係,甚至能為病人帶來個人化的精準醫療。圖為一名市民正接種新冠肺炎疫苗。(蘇煒然攝)

精準醫療不是夢

這稱為T2T-CHM13的新基因組 ,雖然新發現之中有很多基因序列重覆,但Eichler說這不代表它們真的是「垃圾基因」。研究人員從中除了修正舊有人類基因組數以千計錯誤之外,還找出了近2,000個新基因。Miga指出,這些新發現有重要的科學意義,有助科學家深入了解基因組如何運作、基因疾病、人體差異甚至人類演化。

在醫療上,目前,基因變異已經在一定程度上用於部份疾病治療,例如針對某些基因來篩查癌症和使用相應療法。新的基因組或可有助科學家找出更多基因疾病的成因。美國哥倫比亞大學兒科臨床基因部主管Wendy Chung說:「我們有些病人,我們知道他們有遺傳問題,但我們一直無法確實辨識。我希望這新的基因組能夠幫助我們填補知識上的空白。」

研究作者之一、約翰霍普金斯大學生物醫療工程副教授Winston Timp補充,或可從新基因組中找到一些新的基因,能夠區分健康人士和病人,或者會令人增加患上某疾病的風險。例如,這基因組的部份新發現與着絲粒(centromeres)有關。這是位於染色體中間將它分成兩臂的結構,在細胞分裂時有重要功用。Miga指出:「我們在癌症、衰老和不孕症等,都可看到着絲粒若出現問題或錯誤。」Eichler也說,在新的基因組中,研究團隊已辨識了一些與免疫反應相關的基因;也找到了一些重要的區域,可有助預測人體對某藥物或療法的反應。

與此同時,基因組測序的技術已變得更準確和更便宜。相比人類基因組計劃約30億美元經費,Phillippy說新的基因組只花了幾百萬美元。他寄望,若成本能持續下降,將有助邁進精準或個人化的醫療服務:「將來,只有對一個的基因組測序,我們便能識別他們DNA 中的所有變異,並利用這資訊來更好地提供醫療保健……在十年內,取得一個完整、完全準確的人類基因組,將會在醫療保健中變得變成恒常,會便宜到大家不需要考慮太多,可能一次實驗室檢測不足1,000美元。」

着絲粒以外,新基因組的另一重要發現與端粒(Telomeres)相關。那是位於染色體末端、用作保護染色體的「帽」。端粒會隨着生物年齡增長逐漸縮短。過去已有一些研究顯示,端粒與人類老化有關,例如端粒比正常人短的話更容易患上老年疾病甚至更早死;延長端粒來減慢甚至「逆轉」老化也是醫學界一個較新興的研究領域。

新的基因組甚至還為人類演化提供了一些線索。例如在其中一篇論文中,研究人員發現靈長類動物的這些重覆區域的數量與人類不同,而且出現在基因組的不同位置。Eicher指出:「其中一些新發現是可能令我們成為人類的基因。在新測序的區域中,接近一半的基因都相信是負責我們的腦部額葉發展,令我們的大腦比其他靈長類動物更大。」

雖然首個完整的人類基因組終於完成,但有科學家提醒,未來科研和應用上需要更多樣性的人類基因組。圖為科研人員嘗試標識基因的位置。(NHGRI)

多樣性問題待解

當然,新基因組只是開啟了種種可能性,實際上可以帶來什麼應用和轉變,肯定需要更多時間來證實。研究作者之一、約翰霍普金斯大學生物學助理教授Rajiv McCoy坦言:「我們需要未來的研究,才能進一步了解這些前所未見的基因變異與疾病的關係。」T2T的成員Michael Schatz也同意:「我們找出了這些只能夠使用新技術才能發現到的變異。但是這代表它們與疾病有因果關係嗎?我們不能這麼說。」

此外,即使有了似乎比較完整和準確的新基因組,也不表示舊有人類基因組會迅即失去用途。Eichler解釋:「一個基因組的使用價值也取決於科學界附上的註解。臨床和研究實驗室都基於這個舊的、有缺漏的基因組,建立了數十年數據。不太可能要實驗室重做所有研究。」他預期,很多實驗室將會逐漸轉向使用新的基因組,首先以一些較小規模的數據測試,看看可以從新基因組中產生的資訊如何更豐富和全面。

不能忘記的是,T2T發表的只是一個人的人類基因組圖譜。正如前述,這只是來自一個葡萄胎、只有父系染色體的細胞;或用Phillippy的說法,只是「代表一個從未活過的人」。這些細胞早於二十年前採集,捐贈者至今仍然匿名。Eichler提醒,遺傳學界一個長年問題是DNA數據庫中多樣性不足。所以Miga說,完成了首個完整的人類基因組只是計劃的第一個層次:「在此之上,一個來自歐洲血統或者單倍型細胞的基因組,不能完全代表我們這物種在全球內的基因組多樣性。」

事實上,同樣在NHGRI資助下,部份T2T科學家已在2019年另外展開了人類泛基因組對照聯盟(Human Pangenome Reference Consortium),從更多來自不同祖先血源的人測定基因組;而且所用的都會是二倍體(diploid)細胞,亦即父、母系的染色體皆有。目前有70個正在進行,預計在2024年中可完全頒布350個人類基因組。由此看來,就如Eichler所總結:「大家不應該將這個人類基因組圖譜視為一個終結,而應該是基因組研究和臨床醫學轉型的一個開端。」

hotline