用基因、聲音、AI探索生物多樣性新篇章!
蔡怡陞/演化生物學家,專長為遺傳及微生物基因體學。喜歡臺灣的人事物,在實驗室角落研究並追尋迷人的微生物演化史。
駱乙君/中央研究院生物多樣性中心助研究員,研究興趣在於了解胚胎、細胞與基因體如何演化。
林子皓/中央研究院生物多樣性研究中心助研究員,喜歡躺在獨木舟上靜靜聆聽海洋的聲音。
沈聖峰/中央研究院生物多樣性中心研究員。專長為社會生物學、巨觀生態學與人工智慧(AI)在生態演化上的應用。
✤ 隨著科技的進展,各類新研究方法逐一出現,開啟探索生物多樣性的新視角。次世代和單細胞定序技術使我們重新認識遺傳、演化、細胞分化等過程。
✤ 聲音監測技術為研究生態系帶來新機會。動物發聲行為和環境聲音等寶貴資料,讓研究不再侷限於視覺觀察。
✤ AI 中的深度學習能挖掘數據關鍵特徵;生成式 AI 則能探索自然潛在的生物樣態,改變了生物學研究的未來。
在科學與技術迅速發展的現代,跟我們息息相關的生物多樣性研究迎來了各種突破性的進展。生物多樣性是指所有形形色色的生物體,來源包括陸地、海洋、其他水生生態系統,以及其中構成的生態綜合體等,包含物種內部、物種之間的遺傳多樣性,還有人類在內的生態系統多樣性。
透過嶄新的基因定序技術,我們開始能夠理解物種的基因型(genotype)如何定義生物的遺傳基礎和演化,以及基因在分子層次上運作的方式。我們更能夠在環境中識別並系統性收集新的表現型(phenotype)等新型態生態資料,並利用新的方式解析資料,例如人工智慧(artificial intelligence, AI)解析物種在環境間存活於背後的原理。這些技術的整合為我們提供了許多強大的工具,讓我們可以從全新的視角理解和應對生物多樣性面臨的挑戰。
基因定序技術提供的全新視野
談及基因定序技術時,我們討論的是一種分辨生物體中遺傳編碼的能力,例如 DNA、RNA 序列等訊息分子的分析。近年來,隨著定序技術的發展,次世代定序技術(nextgenerationsequencing, NGS)已經能夠以前所未有的速度、高通量、高精確度定序大量的遺傳編碼。例如基因定序公司「Illumina」可一次讀序列兩端各約 250 鹼基對(base pair, bp)的定序技術。近期第三代的奈米孔定序(nanopore sequencing)技術則可以在不進行特殊樣品處理的情況下,直接定序完整的訊息分子,並從訊息分子上取得被修飾的資訊。奈米孔定序技術的進步代表了新資料類型的取得,例如包含整個生物體所有基因的基因體(genome)、包含所有表現基因的轉錄體(transcriptome)、有關 DNA 修飾狀況的表觀遺傳學(epigenetics)數據等。
在此同時,為了理解定序出來的編碼所代表的意義,科學界也發展出相對應的生物資訊方法。定序技術與生物資訊分析的應用範圍非常廣泛,從研究微生物交互作用的環境基因體學,到提供人類疾病治療方向的精準醫學研究,都明顯受益於高通量和長讀取定序技術的進展。它為我們提供了一個前所未有的視角,以便觀察、監測並理解生物多樣性。藉此,科學家可以更精確地識別和分類地球上的生物種類,甚至是那些極小或曾被認為已滅絕的物種,並提高對生物演化歷史的理解。
從 2001 年第一個人類初步的基因體被解序發表,至今科學家已經可以迅速且便宜地定序許多物種的基因體。這些資料不僅豐富我們對物種遺傳基礎的理解,更為分析特定性狀和適應性演化提供更進一步的線索。更重要的是,基因體資料有著共同的遺傳語言⸺都使用 A、T、C、G 當作編碼,因此當我們獲得更多基因體資料,每一個基因體就可作為一個知識轉移的研究平臺,使我們藉由研究不同物種的基因同源性,進而學習到基因的功能與生物演化的奧祕(圖一)。
▲圖一。資料提供/蔡怡陞
揭示生命的演化——單細胞定序技術
在讀者閱讀的這一刻,我們眼睛裡的視網膜有數以億萬計的感光細胞正在接受光子,光學訊號被收集放大並轉換為神經電氣訊號,接著傳遞到大腦解讀文字所要表達的意思。有趣的是,我們身上由不同的細胞組成各種器官,分別執行如感光、消化等特定的生理功能,但構成大多數生物生命週期的起點僅是單一的細胞。這個細胞在發育過程中不斷地複製、分裂、分化,最後產生數以百計、千計的各類型細胞,各自執行特定的生理功能。這個過程如何演化?藉由新定序技術,科學家已經可以知道不同細胞中究竟有哪些基因被表現,並藉由基因轉錄狀態推論出細胞之間的分化與演化關係(圖二)。
在微觀層次,不同的生物個體由許多不一樣功能的細胞所組成,雖然每個細胞中的 DNA 都一樣,但是不同類型的細胞卻會表現特定基因,例如神經細胞不會表現肌肉細胞的基因。因此科學家發展出單細胞 RNA 定序方法,將細胞打散後再利用流式細胞儀、微流體油滴微珠等方式,將獨特的條碼標記在每一個不同的細胞裡面。再透過高通量定序的方式,解讀個別細胞基因表現的資訊。
▲圖二。資料提供/駱乙君
生命的起源來自海洋,單細胞定序的研究方法近來被應用在許多海洋無脊椎動物上,例如無腔蟲、黏絲盤蟲、海綿等動物,用來了解幹細胞、神經細胞、肌肉細胞、消化細胞等不同細胞類型的演化起源。以珊瑚礁生態系為例,珊瑚是只有表皮層(epidermis)與腸皮層(gastrodermis)兩層組織、構造相對簡單的動物,而渦鞭毛藻在與珊瑚共生時,只生活在珊瑚的腸皮層中。科學家至今尚不清楚共生形成的機制,也不明白為何共生藻只生活在特定細胞裡。而單細胞定序的方法目前就被應用在珊瑚與共生藻的共生關係研究中,以理解物種之間的交互作用。
許多實驗室也開始利用單細胞 RNA 定序方法,研究共生過程中各細胞類型的基因轉錄狀態,藉此深入了解共生時哪些基因被啟動或關閉。此方法也被應用在珊瑚白化的過程,找出共生細胞中是否有特定基因的開關,導致不穩定的共生關係。此外,在珊瑚生殖與著苗方面,目前已知月光扮演了很重要的角色,如果可以知道什麼樣的細胞表現了何種的視蛋白(opsin)來接受光學訊號,對於了解珊瑚生理現象與後續保育規畫都具重大意義。可預見在不久後的將來,單細胞定序方法可被更廣泛利用,讓我們能更深入了解重要生態現象背後細胞的多樣性與演化過程。
探索生物多樣性的新視角——聲音監測
說到新的資料類型,近年生態研究中愈來愈多團隊開始在野外調查納入聲音監測。透過聆聽動物個體的發聲行為、不同種類的動物聲音,甚至整個生態系由動物聲音和環境聲音所形成的景觀,都可提供一個橫跨行為、物種、生態系等多種尺度的生態資訊(圖三)。以珊瑚礁生態系為例,雄性雀鯛經常會發出一連串的「兜兜兜」聲音,作為求偶展示行為。然而,這種求偶聲音相當多變,聲音頻率除了可能隨著體型大小而變之外,「兜兜兜」的節奏也會受到發聲器官的影響,在不同種類的珊瑚礁魚類之間產生多種變化。複雜的發聲行為機制讓珊瑚礁生態系展現出豐富的聲音多樣性。
▲圖三。資料提供/林子皓
隨著錄音設備與相關技術的發展,一臺手掌大小的錄音機就能自動進行水下聲音監測,彌補因惡劣海況、夜間能見度低而無法有效觀測生態的調查缺口。為節省處理音訊資料所耗費的時間,研究人員也開始運用 AI 技術,分離環境中各種噪音,針對動物聲音的聲紋模式深入分析。再透過聲音多樣性的量化指標,觀察發聲魚類群聚在不同棲地之間的組成結構變化。在人類難以抵達的深海,聲學調查方法更能展現獨特價值,幫助我們了解即使在深不見光的海底,許多動物的活動習性竟也有日夜和季節的週期性模式。
其實不管在空氣中、水下,甚至土壤裡,聲波都無所不在。一旦被麥克風擷取,並轉換為數位訊號後,聲音就變成一種生物多樣性的快照紀錄。相較於影像,聲音較不易受到物體屏障,更能有效反映當地的生態活動。近年來由於錄音成本與技術門檻不斷降低,已有許多公民科學計畫嘗試記錄發聲動物的時空分布變化,這些錄音資料將是未來面對全球氣候變遷、區域性持續增長的人為干擾等情況時,得以預測生物多樣性損失的關鍵資料。
AI 將改變生物多樣性研究的未來
許多新技術跟新型資料被發明後,如何整合並了解其中的關係,就變成現在科學家不可忽視的課題。而 AI 正成為生物多樣性研究中一股不可忽視的新力量,有望加速我們認識和保育生物多樣性的腳步。 傳統上,生物學家研究多樣性時,往往依賴於人工挑選的特徵,例如測量鳥喙的長度和寬度,蝴蝶翅膀的斑紋面積等。然而,大自然鑄造的生命形態遠比我們想像的複雜。一張照片、一段影片、一段鳴叫聲,都蘊含了難以用肉眼或耳朵完全領會的大量資訊。此時 AI——尤其是深度學習技術的出現,便為我們打開了通往生物世界全新維度的大門。
深度學習最強大之處,在於它能夠從原始數據中,自主學習到與研究問題最相關的特徵,並對特徵客觀量化。這就像讓 AI 戴上一副「智慧眼鏡」,透過鏡片審視每一個物種、每一張照片,從浩如煙海的訊息中提煉出最精髓的内容。更令人興奮的是,近年來發展的生成式 AI,還能夠根據學習到的特徵,創造出全新的圖像。此技術一方面讓 AI 的判斷過程更加透明,讓我們可以藉由分析 AI 生成的圖像理解它如何作出決策;另一方面,生成式 AI 也提供探索生物多樣性的全新途徑——讓 AI 按照特定的規則去「創造」新的物種,並研究它們的特性(圖四)。
▲圖四:利用 AI 在北紅尾鴝(Phoenicurus auroreus,上排左一)和白腹琉璃(Cyanoptila cyanomelana,下排右一)之間插值生成的翅膀形態圖像。兩張照片均來自 iNaturalist。AI 通過分析兩物種的翅膀照片,提取關鍵特徵並在兩者之間進行插值,生成一系列漸變的翅膀圖像。這種技術不僅能夠揭示物種之間的形態差異,還能探索自然界中可能存在的「隱藏」形態,為研究生物多樣性提供新思路。圖片拍攝/Redbird Wu,CC-BY 授權;圖片拍攝/rururubisco,CC-BY 授權;圖片提供/沈聖峰
在中研院生物多樣性研究中心最新的研究中,我們利用生成式 AI 分析了三萬多張蝴蝶和蛾類翅膀照片,探究這個龐大類群翅膀形態多樣性的演化歷程。透過深度學習,我們發現蝴蝶和蛾類的翅膀形態經歷了漫長的演化:在 1 億 4,000 萬年前只有三種主要形態,但在被子植物大爆發 3,000 萬年後的 1 億 1,000 萬年前,形態類型增加到了六種。有趣的是,儘管蝴蝶和蛾類的翅膀形狀逐漸從適合穩定飛行的狹長形狀,演化為適合靈活飛行的寬短形狀並兼顧飛行穩定性。此外,還發現在白堊紀末期大滅絕之後,蝴蝶和蛾類翅膀的形狀與色彩經歷了快速演化,後翅的色彩飽和度和豐富度顯著提高。在此研究中 AI 不僅高效率地處理巨量數據,還根據關鍵特徵生成具代表性的翅膀圖像,直觀呈現各演化階段的形態特點,為理解翅膀形態演化提供寶貴的見解。
當前,AI 在生物多樣性研究中的應用還處於起步階段,主要集中在物種識別、數據處理等相對基礎的領域。但隨著 AI 技術的不斷發展,以及各界持續不斷地積累、數位化的生物多樣性數據,AI 終將在揭開生物多樣性的奧祕中扮演愈來愈重要的角色。 在不久之後的將來,每位生物學家都將手持 AI 這個強大的放大鏡,以全新視角窺見生命的無窮魅力。
科技革新與生物多樣性研究的未來
生物多樣性是地球生命最迷人的特質之一。從基因到物種,從族群到生態系,生命以各種形式展現變化萬千的面貌。而人類試圖描繪這幅多樣性景象的努力從未停歇,對生物多樣性的研究方法也正不斷進化。從高通量定序技術的進步到單細胞定序的應用,再到聲音監測技術的創新應用,每一步技術的突破都為我們提供了更深入的生物多樣性洞察。此外,AI 的融合使研究工具更強大後,不僅提高生物多樣性數據的整合分析能力,更重要的是真正客觀地定義資料並提取生物在環境的意義。
先進技術和方法不僅豐富我們對生物基因型、表型、生態互動的理解,也為生物保護和管理策略的制定提供科學依據。在未來,這些研究將繼續推動生物學的邊界,幫助我們了解和保護周遭生物和賴以生存的環境。
⇠上一篇:水產養殖走向新篇章——漁電共生
人類與自然的最後一線生機,國際與我國生物多樣性策略及行動方案:下一篇⇢
本文轉載、修改自《科學月刊》2024 年 6 月