科技大補帖
eLearning

用程式寫未來的精準醫療,
生物醫學資訊科技帶領醫療數位轉型
2022.11.18

張明台/加拿大渥太華大學的資訊工程學位,現為「亞大基因科技」共同創辦人暨執行長,曾參與合作 3 篇同儕審查論文發表。

 

 

你聽過「生物醫學資訊科技」(biomedical IT)嗎?它與傳統的資訊科技有何不同?

生物醫學資訊科技其實是一項跨生物資訊學(bioinformatics),以及現代資訊科技(modern information technology)的專業技術領域。當中涵蓋可用來進行生物資訊分析的統計及演算法軟體工具;儲存及管理大量生物資料庫與基因定序數據的資料湖泊(data lake);排程執行及管理生物資訊分析工作流程的高效能叢集運算;存取認證授權、數據安全性、可用性、完整性保護;垂直整合以上數據流程、軟體工具效能優化,以及符合法規標準稽核的產線管理平台等。

因為人類基因體計畫(Human Genome Project, HGP)的完成,加上次世代定序技術(next generation sequencing, NGS)的進步發展,以及定序成本甚至快於摩爾定律(Moore's law)對半導體晶片成本下跌的經濟法則,在後基因體時代,基因體定序已成為科學研究、臨床診斷治療、藥物開發等可以負擔的一項技術。因此,生物醫學資訊科技逐漸成為精準醫療產業的顯學而受到重視。

 

生物醫學資訊推動精準醫療

在美國前總統歐巴馬(Barack Obama)於 2015 年啟動「精準醫學計畫」(Precision Medicine Initiative, PMI)以前,傳統臨床基因檢測實驗室同時包含了生物資訊分析設計、IT 軟硬體系統建置,以及維運的中央實驗室。生物醫學資訊科技是一項技術含量極高的工程,大量的儲存運算底層技術與前端分析檢測應用相互結合,耗費了傳統中央核心實驗室很多的 IT 軟硬體基礎建設投資與精力。此外,由於雲端運算(cloud computing)與開源軟體(open source software)蓬勃發展,生物醫學資訊科技為精準醫療產業,填補基因醫療研究與 IT 間的鴻溝,不僅賦予了生物資訊生命力,還讓全世界醫療照護有了全新的樣貌。分工生物資訊分析設計和儲存運算流程管理平台,大量減輕了臨床檢測服務提供商企業的負擔,同時帶領產業競爭與創新。

根據全球基因體學和健康聯盟(Global Alliance for Genomics and Health, GA4GH)的研究預測,到了 2025 年,在臨床醫療場域將會有超過 4,750 萬罕見疾病基因體,以及 8,300 萬癌症基因體被定序;2027 年將會有 70% 的癌症診斷檢測,使用基因定序分析。現今精準醫療發展速度快,越來越多病人仰賴基因定序檢測,期望能根據個體基因獨特差異而得到最適合的個人化醫療。

此外,臨床檢測服務企業也必須跟上世界的腳步,基因定序的摩爾定律,正是生物資訊設計分析技術人員的工作難度,隨世界時間線變動而提高的真實寫照;而檢測品質仰賴的則是實驗室品質管理系統,因此如何建置管理系統並徹底落實才是關鍵。

類比於半導體產業的自動化電子設計(electronic design automation, EDA),利用電腦輔助設計軟體,來完成大型積體電路晶片的布局、布線、版圖規畫、後端設計、功能驗證等,基因定序生物資訊分析設計,透過行業最佳實踐流程描述語言標準,來完成高度複雜多模式序列分析軟體應用的數據工作流水線、任務呼叫圖規畫、運算效能後端設計,以及功能驗證與確效(verification and validation),對於獲得流程完整性、結果品質、理想效能、減少運算資源能耗來說至關重要。

 

▲圖片提供/《科學月刊》,圖片來源/123RF

 

高科技加速精準醫療時代降臨

隨著每新一代高通量定序平台問市,讓基因定序成為全世界成長最快的大數據,加上生物資訊分析技術人員需要更有效率地規畫與設計各類複雜疾病的臨床檢測需求,自動化分析流程設計(workflow design automation, WDA)就扮演著關鍵角色。這也是臺灣衛生福利部於 2021 年公布最新修正的《特定醫療技術檢查檢驗醫療儀器施行或使用管理辦法》(以下簡稱特管法),針對實驗室開發檢測(laboratory development tests, LDTs)制定專任技術人員資格,尤其是專任檢測開發、分析、校正、生物資訊處理,以及其他相關人員等。應用領域包含抗癌瘤藥物的伴隨檢測;癌症篩檢、診斷、治療、預後的基因檢測;產前及新生兒染色體與基因變異檢測;藥物不良反應或藥物代謝的基因檢測;遺傳代謝與罕見疾病的基因檢測;病原體鑑定、毒力、抗藥性基因檢測;於藥物仿單中,明載於用藥前應執行的其他藥物伴隨基因檢測等。

為了協助臨床基因醫學能有效地處理生醫大數據,整合不同分析演算法軟體工具及功能註解參考資料庫,更有效地應對各類不同的臨床檢測需求,能彈性規畫出多種分析流程運算要求的雲端運算平台服務,成為了最適合的生物醫學資訊科技基礎設施。

 

▲圖片提供/《科學月刊》,圖片來源/123RF

 

以同源重組缺失癌症基因檢測為例

在人的細胞中,代謝活動、生活習慣、環境影響因素都會使DNA損害,此損害會造成 DNA 分子結構的不穩定性(genome instability),改變基因轉錄(transcription)、轉譯(translation)過程引發基因突變,導致疾病發生。DNA 修復機制是細胞中經常進行的機轉,可以避免基因體受損和突變,對細胞生命存活至關重要。當腫瘤細胞的 DNA 修復機制產生基因缺陷,就能利用藥物加以攻擊腫瘤。

例如乳癌基因 BRCA1、BRCA2 或同源重組修復(homologous recombination repair, HRR)基因突變,就會形成同源重組修復缺失(homologous recombination deficiency, HRD)特徵,此時就是 DNA 修復酶 PARP(poly ADP-ribose polymerase)的抑制劑上場攻擊腫瘤細胞的最佳時機,讓腫瘤細胞無法修復其壞損的 DNA,使細胞走入細胞凋亡(apoptosis)的程序,進而有治癒癌症的可能。讓卵巢癌、乳腺癌、三陰性乳癌等患者,有了更有效持續性治療癌症的機會。

而為了精準計算 HRD 特徵值,除了檢體樣本處理及目標基因定序試劑套組的設計外,生物資訊分析應用在臨床診斷用藥上,也扮演了成敗關鍵的角色。分析流程包含高覆蓋深度序列數據匹配,偵測腫瘤基因體單核苷酸變異(single nucleotide variant, SNV)、小片段插入缺失變異(short INsertion and DELetion, INDEL)、複製數變異(copy number variation, CNV),以及大片段基因重組(large genomic rearrangement, LGR),進一步利用所偵測到的大量複雜變異,計算 DNA 是否失去異型接合性(loss of heterozygosity, LOH),最後再運用權重方法綜合分析,判斷腫瘤基因是否形成 HRD 的特徵狀態。

由於癌症基因定序分析是涉及高度數據密集型的工作流程,需要大量的人工操作分散且異質的生物資訊資料庫及演算法軟體工具才能完成。而生物醫學資訊科技能連結這些複雜的流程,並對此生物資訊分析流程管理自動化,有效地改善基因醫學核心實驗室業務流程的準確性、生產力和效率,這些效益已成了推動精準醫療產業成長的關鍵驅動要素,降低檢測分析成本進而將價值回饋給所有需要的病人(return of value)。

美國國家衛生研究院(National Institutes of Health, NIH)院長柯林斯(Francis S. Collins)與「All of Us」研究計畫執行長丹尼(Joshua C. Denny)在 2021 年 3 月 18 日於著名醫學期刊《細胞》(Cell)上,共同發表一篇評論文章〈2030 年的精準醫療──7 種改變醫療健保的方法〉(Precision medicine in 2030-seven ways to transform healthcare),對未來 10 年精準醫療發展做了 7 大預測與展望。

 

巨量的縱貫、長期性世代研究資料

世界上各國投入群體世代研究計畫,例如英國的「UK Biobank」、美國的「All of US」、芬蘭的「FinnGen」,以及臺灣人體生物資料庫等,持續蒐集、追蹤了百萬人的基因體、生活習慣和健康醫學資訊等多樣資料,累積了寶貴的群體世代數據,並以數據存取民主化的理念提供給良善研究人員,讓全世界醫學研究人員更簡單容易地合併使用來自各群體世代的數據金礦。

 

包含各種群體的生物多樣性

精準醫學的目標就是根據個體化差異,提供最佳的個人化健康醫療,因此各人種群體的研究多樣性就至關重要。現今主要的基因體關聯研究數據超過 80% 以上是來自高加索人種,而來自亞洲、非洲或拉丁美洲的參與者相對少數,缺乏生物多樣性導致研究選樣偏差,並提高確認偏誤帶來的風險,使得精準醫學研究成果無法被廣泛應用到各個種族。因此,世界上最大的公開全基因體群體註解資料庫「The Genome Aggregation Database」(gnomAD),也將持續蒐集涵蓋各式各樣人種的基因體變異資訊。

 

大數據與人工智慧

精準醫學與智慧醫療產生的臨床生物醫學數據,隨著時間、分析,不斷地以倍數成長為大數據,不僅容量大(volume)、資料產生及迭代更新速度快(velocity)、資料來源多元化與數據格式種類繁雜(variety)、資料精確性與品質可信度高(veracity),但資訊價值(value)的密度卻低到如同大海撈針。因此唯有在臨床醫療場域,才能將病人的多體學數據與疾病治療歷程關聯建立起來,包含 DNA 基因突變、RNA 基因表現量、醫療影像、實時監測數據、用過哪些藥,以及預後反應狀況等資訊。當我們擁有這些大數據後,結合人工智慧(artificial intelligence, AI)將可以產生無限種可能的精準醫療臨床應用。

 

▲圖片提供/《科學月刊》,圖片來源/123RF

 

例行性臨床基因定序檢測

目前臨床基因定序檢測只評估少數已知基因突變位點,並且僅用於中後期癌症診斷用藥、非侵入式產前檢測或罕見疾病。在不久的未來,全基因體或全轉錄體定序檢測方法,將成為從預防篩查、早期發現、診斷治療、預後監測的常規例行性臨床檢測作業。以癌症為例,液態生物檢體基因體定序分析,就是一項更便宜、有效的診斷治療方式,透過血液中循環腫瘤細胞或腫瘤 DNA,提供更快非侵入性的方法來獲取個人癌症基因資訊和特徵,能夠更早發現癌症腫瘤,提高治癒率,相較於中後期醫療費用可降低 90% 以上。

 

電子健康紀錄

所有臨床可用的(clinical actionable)縱貫世代研究關鍵成果需要詳細精確的表現型、治療反應、健康診斷紀錄等。這些真實健康數據配合相關基因型資訊,可讓臨床研究人員進一步提供更精準的疾病機轉和治療策略。

 

表現型體學與環境因子

隨著穿戴式裝置及聯網醫療系統設備廣泛使用,未來 10 年內人們將會隨時以各式各樣的方式,測量並記錄醫學健康與生命活動等監測資訊,環境相關數據也變得更容易取得,且更簡單透過雲端共享數據。更多與生命健康的數據資訊將來自臨床醫療場域之外,這些資料將擴增電子病歷、遠端醫療(telemedicine),以及無接觸診斷治療的能力。

 

隱私、信任與價值回饋

精準醫療的成就來自於所有數據資料的參與貢獻者,而推動大量廣泛的參與需要使用責任、提高信任、保護個資安全,以及科學研究成就必須回饋給所有的參與貢獻者。

 

精準醫療現曙光

精準醫療將持續促進健康醫療變革的進程,7 大面向的共同核心技術需依賴生物醫學資訊科技再進化,賦能精準醫療產業鏈,帶領產業競爭與創新,在未來 10 年 ,我們將看到精準醫療給人類的承諾獲得實現。

 

延伸閱讀

1. Ewan Birney, Jessica Vamathevan and Peter Goodhand, Genomics in healthcare: GA4GH looks to 2022, bioRxiv, 2017.

2. OpenWDL, https://openwdl.org/.

3. ACT Genomics, https://www.actgenomics.com/.

 

⇠上一篇:以「次世代定序」完成精準醫療,更能協助生命科學領域的探索

結合生物學、統計學、資訊學的科學,生物資訊學是什麼?:下一篇⇢

 

本文轉載、修改自《科學月刊》2022 年 4 月