探密國家基因庫

這是9月6日拍攝的國家基因庫。深圳國家基因庫將於2016年9月22日正式開業。國家基因庫於2011年由國家發改委等部委批複,依托華大基因組建、運營,採用基因資訊資料庫和生物樣本資源庫相結合的建設模式,主要存儲管理大陸特有遺傳資源、生物資訊和基因資料。

早已滅絕的猛馬象還能複活嗎?利用在凍土層裡發現的猛馬象完整個體,通過基因技術和幹細胞技術獲得猛馬象胚胎細胞,再為該細胞尋找合適的「代孕媽媽」,或許人們有一天可以見到這種在地球上曾經生活過的龐然大物。

根據新華網報導,過去,生物的遺傳資訊好像一本艱深的「生命天書」。現在,人們可以「讀懂」乃至「編寫」它。2011年,國家發改委、財政部、工信部、國家衛計委批准華大基因研究院在深圳大鵬半島組建國家基因庫。如今,生物存儲、基因測序、基因合成與編輯成為這座世界級基因庫的核心業務單元。

據深圳華大基因研究院副院長劉心介紹,國家基因庫擁有「三庫兩平台」。「三庫」即以存儲為主要功能的生物資源樣本庫、生物資訊資料庫、生物活體庫;「兩平台」是數字化平台、合成與編輯平台,分別從事基因的「讀」和「寫」。

「創造要從認識開始,先會「讀」然後才會「寫」,這就需要我們有意識地把海量的生物資訊存儲起來,這是後續進行基因測序和編輯的基礎。」劉心說。

記者在國家基因庫現場看到,「三庫」匯聚了地球上各種生物的資訊。生物資源樣本庫存儲的樣本有血液、組織、採血卡、細胞、體液、DNA、RNA、動植物、菌類微生物等,現已實現2000萬份可溯源、全類型樣本存儲能力。生物資訊資料庫是存儲基因資訊的高性能資料管理系統,已構建40多個資料庫,以此為基礎開發的搜索引擎收集了超過8000個物種/品種、27個人種、1000萬個基因、5億條序列資料、3億條變異資訊。生物活體庫有6萬份種子樣本資源的存儲容量。目前正在建設雲南瑞麗植物園數字化專案、廣東河源活體示範庫、西藏高原庫、青海高原活體示範庫等。

這些海量的資訊有什麼作用?劉心表示,盡可能多地存儲各種類型的樣本,如珍稀動植物、重要的疾病樣本,未來有解讀需要的時候,人們就能夠迅速找到。同時,這些資料也為科學研究及產業發展提供了大數據源頭保障,有利於精準醫學和精準農業的發展。

基因測序是國家基因庫另一項重要的功能。記者在「讀」平台─數字化平台看到,科研人員首先進行制備,將提取到的DNA按照測序的要求上載到晶片,再把晶片放入測序儀,就能夠讀取出基因的原始資料了。

國產設備實現了基因測序的高速度和低成本。數字化平台的科研人員介紹,基因測序使用的儀器是「國貨」,它的測序準確度達到同行業領先水平。同時,操作簡單、24小時快速完成測序、16種以上的使用模式、比同類型測序儀便宜三分之一的價格都是它突出的優勢。

「這是一個集自動化、標準化、高產高效於一體的公共測序平台,目前年產資料5Pb以上,這意味著可以滿足5萬人的個人基因組測序或者1000萬例產前篩查的需求。」劉心說。

如果把基因測序看作是「讀懂」人類生命的密碼,合成與編輯平台的工作就是「編寫」。今年3月,國家基因庫科研人員參與的一個國際合作專案,成功合成了酵母的5條染色體,研究成果發表在知名學術期刊《科學》雜誌上,這是合成生命領域的重大科學進展。
據國家基因庫合成與編輯平台核心研發高級經理顧穎介紹,「寫」平台就是要把「讀」出來基因的資訊重新「編寫」「改寫」,從而產生一些新的功能,在醫學診療、動植物育種等方面應用廣泛。

「未來,我們要進一步擴大規模,聚集更多的資源,把國家基因庫建設成為世界範圍內有影響力的科研共用平台,把生物資源的保護、利用做得更好。」劉心說。