香港大學(港大)工程學院研究團隊成功研發兩項創新深度學習算法「 ClairS-TO」 及「 Clair3-RNA」,有望大幅提升癌症診斷,以及 RNA 基因組研究的基因突變檢測能力。
團隊由港大工程學院計算與數據科學學院羅銳邦教授帶領,他們最新發布的上述兩項突破性的深度學習算法革新臨床和科研領域的基因組學分析,這些工具利用長讀長測序(Long-read sequencing)技術,顯著提高了在複雜樣本中檢測基因突變的準確性,為精準醫療和基因組學發現開闢了新視野。兩篇相關研究論文已發表於國際著名學術期刊《自然-通訊》(Nature Communications)。
研究團隊運用長讀長測序技術完整讀取DNA與RNA片段,突破傳統基因分析限制。此技術雖能提供詳盡遺傳資訊,但在複雜樣本中精準識別突變始終是一大難題。新開發的演算法顯著提升檢測準確度,使基因分析流程更快速且易於應用。
ClairS-TO 算法解決了癌症診斷中的一個關鍵挑戰:即無需配對的健康組織樣本即可分析腫瘤 DNA。標準方法通常需要腫瘤和正常樣本進行比對,但正常樣本並非總能獲取。ClairS-TO 算法採用精密的雙網絡方法, 一個用於確認真實突變,另一個用於剔除誤差, 從而消除了對配對樣本的需求。這一突破使得即使在樣本有限的情況下,也能進行具成本效益且可靠的腫瘤分析,擴大了精準癌症診斷的適用範圍。
同時,Clair3-RNA 算法標誌著全球首個專為長讀長 RNA 測序量身定制的深度學習小變異檢測工具。RNA 編輯和技術性測序誤差很容易混淆真實遺傳變異的識別,Clair3-RNA 採用先進的深度學習技術,準確區分真實突變與生物噪聲及編輯事件,使研究人員和臨床醫生能夠以極高的準確度同時分析基因表達和突變。
這兩項演算法是羅教授團隊開發的知名「Clair 系列」人工智能(AI )基因組工具套件的最新成員。該系列(包括已成為行業標準的 Clair3)已成為計算生物學領域的基石。這些開源演算法以其速度、準確性和穩健性著稱,下載量已超過 40 萬次,並被全球領先的研究機構和測序公司廣泛採用,為第三代測序技術建立數據處理新基準。
羅銳邦教授表示:「ClairS-TO 和 Clair3-RNA,連同 Clair 系列的其他演算法,為深度學習驅動的基因突變發現奠定了堅實基礎,並加速了精準醫療和臨床基因組學的應用。」
此技術突破有望令基因分析更普及,更準確和全面,不僅提升癌症診斷效能,更有助推動個人化醫療發展,並加速基因組研究——有望為全球患者、科學家與科研界帶來實質性的裨益。
論文連結:
“ClairS-TO: a deep-learning method for long-read tumor-only somatic small variant calling”
https://www.nature.com/articles/s41467-025-64547-z
“Clair3-RNA: a deep learning-based small variant caller for long-read RNA sequencing data”
https://www.nature.com/articles/s41467-025-67237-y
關於羅銳邦教授
羅銳邦教授現任香港大學計算與數據科學學院副教授。他2010-2015在香港大學師從林德華教授完成生物信息學博士學位,隨後2016-2017年在約翰霍普金斯大學(Johns Hopkins University)計算生物學中心師從 Steven Salzberg 教授和 Michael Schatz 教授完成博士後培訓。
羅教授致力於生物信息學算法和臨床信息學研究。他已發表超過 80 篇論文,其中 10 篇引用次數超過一千次。他自 2019 年起被科睿唯安(Clarivate Analytics)評為全球前 1% 學者,獲百度研究院選為全球 AI 華人年輕學者前 150 名,2019 年獲《麻省理工科技評論》選為亞太區「35 歲以下創新者」前 10 名,並於 2017 年獲《福布斯》評選為亞洲醫療與科學領域「30 位 30 歲以下精英」。
傳媒查詢,請聯絡:
香港大學工程學院
鍾敏芝女士(電話:3910 3324;電郵:chungmc@hku.hk)
袁可盈女士(電話:3917 1924;電郵:natyuen@hku.hk)
香港大學計算與數據科學學院公共關係及傳訊部
電郵﹕cdsnews@hku.hk