利用人工智能檢測無徵狀冠狀病毒患者

| | , ,

在今年十月,美國麻省理工學院 (MIT)的研究團隊運用機械學習研發了一個應用程式以非入侵式去檢測用戶是否感染新冠肺炎。這個檢測方法主要是透過分析用戶的咳嗽聲音,團隊計劃將這個程式在App Store 上架,有助用戶每天外出前作檢查,大大減低市區病毒擴散及群體感染。

iPhone本身都有提供各種應用程式讓市民得知瞬時各地的確診數目、死亡數字、預防方法以提高防患意識,如以下這個應用程式十分好用。

20200238003

而將會推出的以聲音檢測將會大大縮短市民檢測時間及獲知結果,同時減輕了政府的行政、醫療、財政負擔,亦避免醫護人員患病風險、集中檢測中心資源,可謂一舉多得。

雖然尚未有應用程式,市民仍可以上網站做測試,貢獻自己的錄音作研究用途:https://opensigma.mit.edu/

20200238004

暫時只有三種語言選擇,你必須了解這個研究的細節,然後按同意便可。之後你便會進入錄音的介面,你需要開啟microphone,然後你要咳出聲音,像你平時會咳的狀態般咳便可(想了解為何請看到尾吧)。

20200238005

之後你便需要選擇你所生處的國家位置、性別、年齡、過去是否有感染徵狀等。敬請真誠填寫,方便團隊統計哪個地區、年齡層、性別需要投放更大資源,更了解患者有哪些共同特徵是更明顯(雖然都明白數據極海量是難以控制的)。

話雖如此,這個應用程式是如何分辨到肺炎特徵?成效有多大?多少人真的可以受惠? MIT研究團隊在IEEE Journal of Engineering in Medicine and BIology投了一份文章(在reference處可找到找到Abstract),聲稱他們建立了一個AI model可以分辨無徵狀感染者及健康人士的咳喇分別。這些微妙的分別不是常人可以耳朵理解及分別的。

AI模型的目標不在於區分已有徵狀的感染者,像有流感或哮喘的表徵,而是能夠區分有病者及無病者咳嗽的分別。

無徵狀感染者,顧名思義,他們或者他人不能單從表面徵狀被偵測為目標病毒的感染者。因此,病者不知自己帶病感染,繼續有群體社交及不到診所求醫,引發大規模病毒在社區蔓延的情況。

這個AI模型的運作首先要收集自願檢測者的咳嗽錄音聲。當然,我們無法得知何時會咳嗽,所以被檢測者是需要強迫性的咳出聲(forced-cough)。智能電話或電腦會作紀錄然後將數據傳送上網絡雲端收集數據。然後,研究人員將上千到萬已收集的咳喇聲及話語數據進行訓練。當數據訓練到一個階段後,新的咳嗽數據會放到己訓練的模型進行分類。研究結果顯示,這個模型可以辨認出已碓診冠狀病毒患者,準確度高達98.5%。而且,模型可辨認出無徵狀者得到冠狀病毒,準確度達100%,與檢測結果吻合。

利用神經網絡檢測

在有疫情之前,MIT研究團隊已經研發演算法去分辨咳嗽的手機錄音以準確診斷肺炎及哮喘等疾病。團隊之後用同樣的方式去分辨阿茲默克症(Alzhiemer’s disease)。病者不只記憶力有倒退的跡象,而且發現有神經肌肉退化,如聲帶變弱的情況。

20200238006

研究團隊分別要訓練三個神經網絡 (neural network), 是屬於Convolutional Neural Network(CNN)。首先,通用的神經網絡,或稱為 ResNet50從發聲錄音去辨認出不同程度的聲帶強度。研究表明,發出humming的聲音,即發出 “mmmm…”可得知聲帶的強弱。這個神經網絡的數據來自於1,000小時的audiobook來進行訓練,要從”the”及”then”挑選出them這個字詞。第二個神經網絡要用來區分言語中的情感狀態,這個模型是基於已有研究證明阿茲默克症患者及神經系統較弱的人會較出現特定情緒,如沮喪或平淡無奇(目無表情),而出現快樂或冷靜(平靜)情緒的頻率會比較少。這個神經網絡的訓練數據是從多個演員的情感語音來開發出情感分類器(中性、平靜、快樂、悲傷)。第三個神經網絡在咳嗽數據庫的訓練以識別心肺及呼吸的功能變化。最後,團隊將這三個模型放在一起,畳加了檢測聲帶肌肉退化的演算法。這演算法是模擬一層audio mask或是噪音層作背景聲音區分較強及較弱的咳嗽聲。較強的咳嗽聲仍可被聽見但較弱的會被蓋過。

因此,集結上述的演算法,這個AI模型可判斷病人的聲帶強度、情感狀態、呼吸系統及肌肉表現,成比以往更有效診斷阿茲默克症的生物標記。

但是,我們不是討論冠狀病毒嗎?然而,研究團隊發現愈來愈的證據證明感染者同樣與阿茲默克症病者有短暫神經肌肉損傷。話語聲與咳嗽聲都是被聲帶同周邊器官所影響。從咳嗽聲中AI模型可以得知錄音者的性別、母語、甚至情感狀態。

在4月期間,團隊開始盡量收集冠狀病毒患者的咳嗽聲。團隊建立了網頁供市民從電話及網絡裝置記錄自己一連串的咳嗽聲。參與者需填寫問題分享自己有相關徵狀的經歴,是否感染冠狀病毒、是否接受測試、是由醫生診斷還是自我判斷等。問卷亦會記下測試者的性別、地理位置、母語。研究團隊在上月已收集了超過70,000錄音檔,每個檔均有咳嗽,總計有200,000個強迫咳嗽樣本。冠戕病毒患者,包括無徵狀者,共提交了2,500個咳嗽錄音。團隊使用這2,500個錄音及另外超過2.500個隨機抽樣的錄音去平衡數據。團隊用其中4,000個錄音樣本來訓練AI模型。之後他們將餘下的1,000個放入已訓練的AI模型來核實演算法能否精確區分患者的狀態。

神奇地巧合,研究團隊發現“a striking similarity between Alzheimer’s and Covid discrimination.”。團隊在沒有對原本的AI模型框架作大量調整下,發現模型能從冠狀病毒者錄音中找到原本的四種模式。

現時團隊正在與一間公司研發更方便使用的AI免費應用程式讓市民進行預檢。他們還與世界各地多家醫院合作,以收取更大量及多樣的咳嗽樣本,無疑是有助訓練及加強模型的準確性。如果FDA認可及實行更廣泛使用,有望可以為全世界提供一個免費、方便、非入侵性的篩選工具。市民可以每天都用應用程式做測試,獲取最新的疫情資訊,得知自己是否有需要檢測進行檢測。這個應用程式真正做到自願性檢測-有需要先求診。

研究團隊在論文中說到“Pandemics could be a thing of the past if pre-screening tools are always on in the background and constantly improved.”研究團隊最終目標是研發的AI模型可以置入於智能發聲及聆聽裝置,市民可以每日初本評估自己感染疾病的風險。但願這個程式盡快推出,將來全球疫情將會大大得到控制。

本來香港的感染數目維持於個位數字,近幾個星期又回升到70,更有預測可到三位數,群組有酒吧、餐廳、卡啦OK、跳舞、不明源頭等等。坊間亦引起討論,應該全民強制檢測,選擇性強制檢測,抽樣檢測,維持自願性檢測。問題在於,即使推行全民強制檢測,出來的報告是需時的,亦有機會檢測成效不高,變成陰性檢測者,亦有醫生指出可再檢驗多次確保成效。當市民得知檢測結果為陽性時,一切已變得太遅,可能已成為超級傳播者。此外,最近又推出應用程式「安心出行」,但實際用途被質疑成迷。這些筆者不在此作深入討論,交由讀者自行查找及判斷。

我們還有什麼可以做?

我們的聲音樣本對研究是很重要的。以下的手機應用程式是由劍橋大學領導,與麻省理工學院的研究方向都是訓練機械學習模型。如上面提及的桌面版本不太方便,可以用這個吧。

20200238007

COVID-19 Sounds – Apps on Google Play

Reference:

有興趣看MIT的文章請看此:

Artificial intelligence model detects asymptomatic Covid-19 infections through cellphone-recorded coughs

有興趣看論文請看此:

https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9208795

COVID-19 Artificial Intelligence Diagnosis using only Cough Recordings – EMBS

相關題目的論文:

https://www.sciencedirect.com/science/article/pii/S2352914820303026#fig1

收集研究數據的網站:

MIT Covid-19 Initiative

Coronavirus-covid19 iOS App

https://apps.apple.com/hk/app/coronavirus-covid19/id1506427472?l=en

Previous

讓氣泡紙共享站遍地開花

走或留,其實都唔係想像咁易

Next
Notice: ob_end_flush(): failed to send buffer of zlib output compression (0) in /var/www/html/wp-includes/functions.php on line 4755