現(xiàn)有新冠病毒診斷AI模型,幾乎毫無(wú)用處
新型冠狀病毒對(duì)全球健康造成了嚴(yán)重的威脅,為了減輕醫(yī)療保健系統(tǒng)的負(fù)擔(dān),也給患者提供最佳的護(hù)理,高效的診斷和疾病預(yù)后信息問(wèn)題亟待解決。
理論上來(lái)說(shuō),在醫(yī)療資源有限的情況下,評(píng)估感染者風(fēng)險(xiǎn)和感染結(jié)果的多變量模型可以幫助醫(yī)務(wù)人員對(duì)患者進(jìn)行分類(lèi)。從基于規(guī)則的評(píng)分系統(tǒng)到深度學(xué)習(xí)模型,大量預(yù)測(cè)模型都是開(kāi)源的,并允許同行評(píng)論分析。
那么,我們應(yīng)該對(duì)這些模型抱有怎樣的期待呢?
頂級(jí)綜合醫(yī)學(xué)期刊《英國(guó)醫(yī)學(xué)雜志》( The BMJ ) 上發(fā)表的一項(xiàng)研究,便對(duì)現(xiàn)有的新冠模型進(jìn)行系統(tǒng)性評(píng)估,主要包括以下三種功用的模型:普通人群風(fēng)險(xiǎn)預(yù)測(cè)模型、實(shí)際感染者的診斷模型、新冠患者的預(yù)后模型,評(píng)估的部分包括模型開(kāi)發(fā)和外部驗(yàn)證研究。
然而,結(jié)果卻不盡人意?梢哉f(shuō),現(xiàn)有的新冠病毒診斷AI模型,幾乎無(wú)用武之地。
收集過(guò)程
這支研究小組通過(guò) Ovid、bioRxiv、medRxiv 、arXiv、PubMed 和 Embase 等學(xué)術(shù)系統(tǒng),收集了 2020 年 1 月 3 日~2020 年 5 月 5 日之間發(fā)布的 covid-19 文獻(xiàn)。如果一篇文獻(xiàn)與基于新冠結(jié)果研究的多變量模型或評(píng)分系統(tǒng)相關(guān),團(tuán)隊(duì)就將它納入研究。
最終,他們收集到總共包括三種類(lèi)型的預(yù)測(cè)模型:普通人群中新冠風(fēng)險(xiǎn)的預(yù)測(cè)模型、疑似患者中實(shí)際感染者的診斷模型、新冠患者的預(yù)后模型。預(yù)測(cè)因素或結(jié)果對(duì)參考人群(例如,住院病人,門(mén)診病人或普通人群)、預(yù)測(cè)范圍(模型預(yù)測(cè)的距離)沒(méi)有限制。而另外的一些模擬疾病傳播或死亡率、診斷測(cè)試準(zhǔn)確性和發(fā)現(xiàn)預(yù)測(cè)指標(biāo)等相關(guān)研究不予考慮。
從第二次系統(tǒng)性評(píng)估開(kāi)始,相關(guān)文獻(xiàn)由 AI 驅(qū)動(dòng)的文本分析工具檢索,以優(yōu)先考慮靈敏度。研究者通過(guò) EPPI-Reviewer 對(duì)標(biāo)題、摘要和全文進(jìn)行重復(fù)篩查,對(duì)于有爭(zhēng)議的文章,則通過(guò)討論選取。
研究使用基于 CHARMS(針對(duì)預(yù)測(cè)模型研究的系統(tǒng)評(píng)價(jià)的嚴(yán)格評(píng)估和數(shù)據(jù)提。┣鍐魏 PROBAST(偏倚風(fēng)險(xiǎn)評(píng)估工具)的標(biāo)準(zhǔn)化數(shù)據(jù)分析表來(lái)評(píng)估預(yù)測(cè)模型。
通過(guò)系統(tǒng)搜索,研究者檢索了 14209 個(gè)標(biāo)題,整個(gè)篩選過(guò)程如下圖所示:
PRISMA(為系統(tǒng)評(píng)價(jià)和變換分析選取報(bào)告)研究是否采納文獻(xiàn)的流程圖
調(diào)查結(jié)果
最終篩選出的 107 項(xiàng)研究,團(tuán)隊(duì)使用 PROBAST 評(píng)估,這是一項(xiàng)專(zhuān)門(mén)為預(yù)測(cè)模型偏倚風(fēng)險(xiǎn)設(shè)計(jì)的評(píng)估工具。
結(jié)果發(fā)現(xiàn),有 53 項(xiàng)在訓(xùn)練集(參考人群)方面存在較高的偏倚風(fēng)險(xiǎn),也就是說(shuō),模型的參考人群可能無(wú)法代表目標(biāo)人群。其中 26 項(xiàng)研究都沒(méi)有對(duì)偏倚評(píng)估風(fēng)險(xiǎn)作出清楚的報(bào)告。
有 15 項(xiàng)對(duì)預(yù)測(cè)集存在很高的偏倚風(fēng)險(xiǎn),這表明預(yù)測(cè)變量并不一定適用于模型,定義不明確或受預(yù)測(cè)結(jié)果影響。
研究者對(duì)一項(xiàng)診斷成像研究使用了簡(jiǎn)單的評(píng)分規(guī)則,它呈現(xiàn)了較低的預(yù)測(cè)偏倚風(fēng)險(xiǎn)。
因?yàn)樵撐墨I(xiàn)缺乏有關(guān)預(yù)處理步驟(例如圖像裁剪)的明確信息,而復(fù)雜機(jī)器學(xué)習(xí)算法是用一種復(fù)雜的方式將圖像轉(zhuǎn)換成預(yù)測(cè)因子,分析人員對(duì)原模型的預(yù)測(cè)因子尚不清楚,這其實(shí)就很難評(píng)估它的偏倚風(fēng)險(xiǎn)。大多數(shù)模型使用易于評(píng)估的結(jié)果(例如,死亡、確診等),而在 19 項(xiàng)研究中仍存在因結(jié)果評(píng)估引起的偏倚的擔(dān)憂,比如使用了主觀或代理結(jié)果(例如,非新冠的嚴(yán)重呼吸道感染)。
除了一項(xiàng)研究之外,所有其他研究在分析的數(shù)據(jù)集上都有較高的偏倚風(fēng)險(xiǎn)。
許多研究的樣本量較小,這導(dǎo)致過(guò)擬合的風(fēng)險(xiǎn)增加,尤其是在使用復(fù)雜的建模策略的情況下。三項(xiàng)研究沒(méi)有報(bào)告模型的預(yù)測(cè)性能,四項(xiàng)研究?jī)H報(bào)告了表面性能(訓(xùn)練集和測(cè)試集相同,未對(duì)潛在的過(guò)度擬合進(jìn)行調(diào)整)。
只有 13 個(gè)研究評(píng)估了校準(zhǔn),但兩項(xiàng)研究中檢查校準(zhǔn)的方法可能欠佳。
其中一個(gè)研究的 25 個(gè)模型使用了外部驗(yàn)證的方式(在一個(gè)獨(dú)立的數(shù)據(jù)集中驗(yàn)證,訓(xùn)練集和測(cè)試集分開(kāi)),但在其中的 11 個(gè)模型中,用于外部驗(yàn)證的數(shù)據(jù)集可能無(wú)法代表目標(biāo)人群。還有一個(gè)研究使用了新冠疫情之前的數(shù)據(jù)。因此,如果將模型應(yīng)用于目標(biāo)人群,則預(yù)測(cè)效果可能會(huì)有所不同。在一項(xiàng)研究中,通常用于預(yù)后(區(qū)分、校準(zhǔn))的性能統(tǒng)計(jì)數(shù)據(jù)沒(méi)有公布。
但也有表現(xiàn)還不錯(cuò)的模型。Gozes、Fu、Chassagnon、Hu、Kurstjens 和 Vaid 等人的研究在外部驗(yàn)證集上具有令人滿意的預(yù)測(cè)性能,但尚不清楚他們是如何收集外部驗(yàn)證數(shù)據(jù)的,以及數(shù)據(jù)是否具有代表性。Wang、Barda、Guo、Tordjman 和 Gong 等人的研究在可能沒(méi)有偏倚的驗(yàn)證數(shù)據(jù)集上獲得了令人滿意的效果,但是數(shù)據(jù)集的數(shù)據(jù)量少于外部驗(yàn)證應(yīng)有的數(shù)據(jù)量(100)。
Diaz-Quijano 的研究也具有不錯(cuò)的外部驗(yàn)證效果,但由于未進(jìn)行聚合酶鏈反應(yīng)(PCR)測(cè)試,因此數(shù)據(jù)集中的許多患者不得不被排除在外。
目前,社會(huì)可能亟需診斷和預(yù)后模型來(lái)幫助醫(yī)務(wù)人員更加快速有效地投入工作,這也許會(huì)促使政府和醫(yī)療機(jī)構(gòu)過(guò)早地實(shí)施預(yù)測(cè)模型。
但介于所有的 145 個(gè)預(yù)測(cè)模型都有很大的偏倚風(fēng)險(xiǎn),并且所有模型都缺乏外部驗(yàn)證的證據(jù),在新冠疫情的大背景下,模型的過(guò)早使用可能弊大于利。
因此,研究人員不建議目前在實(shí)踐中使用任何模型。
他們也推薦,未來(lái)的模型研究應(yīng)側(cè)重于驗(yàn)證、比較、改進(jìn)和更新有前途的可用預(yù)測(cè)模型,而非著力開(kāi)發(fā)新的預(yù)測(cè)模型。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
ChatZOC,藏在口袋里的「眼科醫(yī)生」
-
金百澤科技亮相中國(guó)國(guó)際醫(yī)療器械博覽會(huì) | 盡顯醫(yī)療領(lǐng)域硬實(shí)力
-
進(jìn)階的新冠疫苗 又一個(gè)中國(guó)造
-
“AI醫(yī)療第一股”鷹瞳科技上市首日即破發(fā)
-
圓心科技登陸港股,“賣(mài)藥的生意”還好不好做?
-
十圖解讀2021年中國(guó)康復(fù)醫(yī)療行業(yè)現(xiàn)狀
-
醫(yī)藥流通數(shù)字化運(yùn)營(yíng)實(shí)現(xiàn)精細(xì)化飼養(yǎng)
-
科學(xué)家發(fā)現(xiàn)人體新器官:將有助于癌癥治療
技術(shù)文庫(kù)
最新活動(dòng)更多
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月30-31日報(bào)名參會(huì)>>> 全數(shù)會(huì)2025中國(guó)激光產(chǎn)業(yè)高質(zhì)量發(fā)展峰會(huì)
-
精彩回顧立即查看>> 【線下論壇】新唐科技2025新品發(fā)布會(huì)
-
精彩回顧立即查看>> 【在線會(huì)議】研華嵌入式核心優(yōu)勢(shì),以Edge AI驅(qū)動(dòng)機(jī)器視覺(jué)升級(jí)
-
精彩回顧立即查看>> OFweek 2025(第十四屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【在線會(huì)議】從直流到高頻,材料電特性參數(shù)的全面表征與測(cè)量
-
10 “意外”的藥明康德
- 1 2025高端醫(yī)療器械國(guó)產(chǎn)替代提速,這些賽道值得關(guān)注!
- 2 多數(shù)人錯(cuò)估了關(guān)稅將對(duì)中國(guó)醫(yī)藥產(chǎn)業(yè)的影響
- 3 一季度醫(yī)療儀器及器械進(jìn)出口報(bào)告:前十大出口市場(chǎng)在哪?
- 4 認(rèn)購(gòu)火爆,映恩生物打響18A IPO重啟信號(hào)槍
- 5 中國(guó)創(chuàng)新藥出海:機(jī)遇、挑戰(zhàn)與未來(lái)展望
- 6 核藥賽道解碼:高壁壘、國(guó)產(chǎn)替代與千億市場(chǎng)卡位
- 7 創(chuàng)新藥是避風(fēng)港,更是發(fā)射臺(tái)!
- 8 第一醫(yī)藥扣非凈利潤(rùn)僅687.40萬(wàn)元:上!半[形土豪”要再沉淀沉淀
- 9 隱匿的醫(yī)療大佬,10年干出千億級(jí)公司
- 10 外骨骼機(jī)器人,誰(shuí)是盈利最強(qiáng)企業(yè)?