應(yīng)用深度學(xué)習(xí)法在鼻咽活檢中成功識別鼻咽癌
大家好,今天和大家分享的是一篇6+分的學(xué)習(xí)筆記
題目:應(yīng)用深度學(xué)習(xí)法在鼻咽活檢中成功識別鼻咽癌
一、背景
鼻咽癌(NPC)是一種具有獨特種族傾向、與EB病毒相關(guān)的癌癥。其發(fā)病率在某些種族中較高,在流行區(qū)內(nèi),大多數(shù)NPC病例為非角化型,以未分化或低分化的癌細胞和大量混合炎性細胞為特征,主要為小淋巴細胞和漿細胞。這些形態(tài)學(xué)特征可能給病理診斷帶來困難,特別是對于經(jīng)驗較少的病理學(xué)家或非流行區(qū)。而最近,利用人工智能(AI)分析病理圖像越來越具有可行性,在NPC等形態(tài)上的病理圖像識別中采取AI輔助可以提高病理學(xué)家的診斷效率和準(zhǔn)確性。
二、研究思路
三、結(jié)果解析
1. 貼片級模型
從被事先人為標(biāo)記過的鼻咽活檢標(biāo)本中裁剪并采集貼片樣本,利用ResNeXt(具有殘差和起始架構(gòu)的深度神經(jīng)網(wǎng)絡(luò)),并經(jīng)歷了初始化、更新現(xiàn)有模型的內(nèi)核權(quán)重即SGD(隨機梯度下降),建立了原始的貼片級模型。在此過程中,發(fā)現(xiàn)具有如生發(fā)中心、良性上皮細胞等某些形態(tài)學(xué)特征的良性鼻咽部貼片易被錯判為NPC。為了規(guī)避這種錯誤,對該模型的訓(xùn)練數(shù)據(jù)進行關(guān)于良性上皮細胞區(qū)域與生發(fā)中心區(qū)域貼片水平方面的拓展,重新訓(xùn)練的貼片級模型成功地將生發(fā)中心和良性上皮細胞識別為良性組織。
制作了關(guān)于這個模型算法的學(xué)習(xí)曲線以及原始與最終的受試者工作特征(ROC)曲線,其中可見,ROC曲線下面積(AUC)從原始模型到最終模型有顯著增加,說明該模型的效能得到較顯著的改進。
圖1 訓(xùn)練數(shù)據(jù)的擴展有效防止貼片的錯誤分類
圖2 算法的學(xué)習(xí)曲線和ROC曲線(1)2. 用于貼片水平識別的關(guān)鍵形態(tài)學(xué)特征
利用梯度加權(quán)類激活映射(Grad-CAM)對被貼片級模型辨別為鼻咽癌的貼片進行處理,以此來可視化貼片中模型預(yù)測的重要區(qū)域定位與比較。結(jié)果顯示,將貼片歸類為NPC的最重要區(qū)域(紅色)與可明確識別的癌細胞的位置相關(guān)(箭頭),證實貼片級模型確實可辨別NPC腫瘤的形態(tài)學(xué)特征。
圖3 通過貼片級模型歸類為NPC的貼片(256 × 256像素)的Grad-CAM結(jié)果3.玻片級模型
通過對測試組中的鼻咽癌病理標(biāo)本進行貼片級模型處理,并分別與EB病毒(EBV)編碼的小RNA(EBER)原位雜交、H&E形態(tài)推導(dǎo)處理對比后,發(fā)現(xiàn)貼片級模型可成功確定癌細胞的區(qū)域,與EBV編碼的小RNA(EBER)原位雜交確定的區(qū)域相似。盡管存在許多混合淋巴細胞,模型仍能有效地鑒定腫瘤細胞。
結(jié)合以上推斷的概率圖、低分辨率全玻片圖像、殘差網(wǎng)絡(luò)ResNet后,建立了玻片級模型,并制作了該模型算法的學(xué)習(xí)曲線和受試者工作特征(ROC)曲線,結(jié)果顯示,載玻片級模型的性能與病理學(xué)住院醫(yī)師(紅色十字)相當(dāng),但略低于主治病理學(xué)家(藍色十字)和住院醫(yī)師(綠色十字)。
圖2 算法的學(xué)習(xí)曲線和ROC曲線(2)
圖4 貼片級模型和EB病毒編碼的小RNA原位雜交之間的相關(guān)性
圖5 貼片級模型與H&E形態(tài)之間的相關(guān)性
小結(jié)
這篇學(xué)習(xí)筆記從被事先人為標(biāo)記過的包含鼻咽癌與鼻炎良性組織的鼻咽活檢標(biāo)本中裁剪并采集貼片樣本,利用ResNeXt、SGD以及后續(xù)的拓展完善數(shù)據(jù)建立了貼片級模型,并通過Grad-CAM證實貼片級模型確實可辨別NPC腫瘤的形態(tài)學(xué)特征,后又根據(jù)貼片級模型推斷的概率圖、低分辨率全玻片圖像、殘差網(wǎng)絡(luò)ResNet,又建立了玻片級模型。在建立模型的過程中,簡明地描述了相關(guān)算法的學(xué)習(xí)曲線,并利用ROC曲線檢驗了模型的性能。綜上,這篇學(xué)習(xí)筆記首次開發(fā)了深度學(xué)習(xí)算法來識別鼻咽活檢中的NPC,對該病的臨床病理診斷有較大意義,但由于圖像是手動注釋,因此不能排除由于個人主觀性導(dǎo)致的偏倚。此外,各實驗室H&E染色的顏色和強度往往不同。由于此算法是使用單個實驗室的載玻片開發(fā)的,對于其他機構(gòu)的病例,準(zhǔn)確性可能會降低。因此,使用其他實驗室的病例擴展培訓(xùn)數(shù)據(jù)應(yīng)該有助于在未來實現(xiàn)更穩(wěn)健的發(fā)展。

圖片新聞
技術(shù)文庫
最新活動更多
- 1 2025高端醫(yī)療器械國產(chǎn)替代提速,這些賽道值得關(guān)注!
- 2 多數(shù)人錯估了關(guān)稅將對中國醫(yī)藥產(chǎn)業(yè)的影響
- 3 一季度醫(yī)療儀器及器械進出口報告:前十大出口市場在哪?
- 4 認購火爆,映恩生物打響18A IPO重啟信號槍
- 5 中國創(chuàng)新藥出海:機遇、挑戰(zhàn)與未來展望
- 6 核藥賽道解碼:高壁壘、國產(chǎn)替代與千億市場卡位
- 7 創(chuàng)新藥是避風(fēng)港,更是發(fā)射臺!
- 8 第一醫(yī)藥扣非凈利潤僅687.40萬元:上!半[形土豪”要再沉淀沉淀
- 9 隱匿的醫(yī)療大佬,10年干出千億級公司
- 10 外骨骼機器人,誰是盈利最強企業(yè)?