人工智能能顛覆新藥研發(fā)嗎?
先關(guān)注一下人工智能近年來(lái)的戰(zhàn)績(jī):
2015年估值就已達(dá)到17.81億美元的Benevolent AI公司,通過(guò)分析海量的科技文獻(xiàn)、專(zhuān)利和臨床實(shí)驗(yàn)結(jié)果等挖掘潛在的知識(shí)產(chǎn)生新的假說(shuō),在肌萎縮側(cè)索硬化(ALS) 疾病治療上,發(fā)現(xiàn)的化合物在動(dòng)物模型上顯示效果,準(zhǔn)備進(jìn)入臨床研究;另外它還把強(qiáng)生之前開(kāi)發(fā)用于注意缺陷多動(dòng)障礙(ADHD)失敗的Bavisant重新開(kāi)發(fā)用于帕金森氏癥病人的日間極度嗜睡癥(EDS)的Phase 2b的驗(yàn)證性試驗(yàn)。
近期獲得軟銀領(lǐng)投的twoXAR,用人工智能技術(shù)平臺(tái)進(jìn)行老藥新用,發(fā)現(xiàn)了艾塞那肽(Exenatide)和奧洛他定(Olopatadine)在類(lèi)風(fēng)濕性關(guān)節(jié)炎(RA)的動(dòng)物模型上有較好的效果。
明碼生物的人工智能團(tuán)隊(duì)與耶魯大學(xué)合作,發(fā)現(xiàn)了纖維細(xì)胞生長(zhǎng)因子(FGF)通過(guò)糖酵解參與到血管發(fā)育的過(guò)程。
不過(guò)仔細(xì)想想,拿得出手的進(jìn)展大多是臨床前的數(shù)據(jù),研究結(jié)果未發(fā)表或者發(fā)表在非同行評(píng)議的網(wǎng)站,而根據(jù)老藥新用的預(yù)測(cè)結(jié)果申請(qǐng)做一個(gè)Phase 2b的概念性驗(yàn)證試驗(yàn)并不是什么稀罕的事兒。通過(guò)實(shí)驗(yàn)篩選,甚至臨床偶然觀察發(fā)現(xiàn)的老藥新用的事例數(shù)不勝數(shù)。至于FGF與血管發(fā)育的那篇文章,并沒(méi)有提到多少人工智能的內(nèi)容,更像是傳統(tǒng)的轉(zhuǎn)錄組學(xué)(RNA-seq)分析加GO富集分析(當(dāng)然也可能是限于文章篇幅而沒(méi)有披露人工智能的細(xì)節(jié))。
但生物系統(tǒng)本身就很復(fù)雜,人工智能之前的傳統(tǒng)方法也同樣磕磕碰碰,毫無(wú)疑問(wèn)人工智能可以幫助生物學(xué)家產(chǎn)生新的假說(shuō),但是否會(huì)是更好的假說(shuō)仍面臨極大的挑戰(zhàn)。
首先,近期的Nature Reviews Drug Discovery統(tǒng)計(jì)了FDA批準(zhǔn)的1578個(gè)藥物總共的靶點(diǎn)數(shù)目是667個(gè),而Ensembl標(biāo)注的潛在藥物靶點(diǎn)就有4479個(gè),當(dāng)然還有些其他的關(guān)于靶點(diǎn)數(shù)目的預(yù)估,數(shù)值有差異,但都遠(yuǎn)大于目前已經(jīng)成藥的靶點(diǎn),更何況每期的CNS文章里常有些看起來(lái)很有前景的新靶點(diǎn),這些潛在的新靶點(diǎn)都是有或多或少obvious-data支持,而不僅僅是人工智能費(fèi)力找出來(lái)的hidden-data。
我們究竟能有多大信心去花費(fèi)足夠資源驗(yàn)證這些由Natural Intelligence尋找的有obvious-data支持的新靶點(diǎn)?我們又能有多大信心去花費(fèi)足夠資源驗(yàn)證那些由人工智能尋找的有hidden-data支持的新靶點(diǎn)?
其次,大數(shù)據(jù)訓(xùn)練出來(lái)的人工智能的好處在于有問(wèn)必有答,壞處也在于有問(wèn)必有答。通過(guò)學(xué)習(xí)海量的文獻(xiàn)數(shù)據(jù),人工智能肯定能找出非常多的相關(guān)性, 無(wú)論強(qiáng)弱,但是信噪比如何?生物系統(tǒng)復(fù)雜異常,有著無(wú)數(shù)的獨(dú)立變量,深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)層數(shù)是否足夠處理?更重要的是,海量的文獻(xiàn)必然質(zhì)量參差不齊,存在著相當(dāng)多的錯(cuò)誤信息和結(jié)論、不可重復(fù)的實(shí)驗(yàn)數(shù)據(jù)和結(jié)論、部分公開(kāi)的實(shí)驗(yàn)數(shù)據(jù)和結(jié)論,似是而非的實(shí)驗(yàn)數(shù)據(jù)和結(jié)論,有意無(wú)意誤導(dǎo)性的實(shí)驗(yàn)數(shù)據(jù)和結(jié)論,盲目追熱點(diǎn)導(dǎo)致給相關(guān)性加分的實(shí)驗(yàn)數(shù)據(jù)和結(jié)論,筆者相信上述的這些情況,行業(yè)中人必然是深有體會(huì)。
基于這樣的數(shù)據(jù)集,人工智能該如何學(xué)習(xí)呢?一個(gè)優(yōu)秀的研究人員也需要多年的培訓(xùn)才有可能學(xué)會(huì)區(qū)分文獻(xiàn)中的可靠或不可靠信息,這其中隱含了大量的邏輯推理和常識(shí),甚至偶爾還涉及到對(duì)文章作者學(xué)術(shù)名譽(yù)的估量,這些并不是人工智能所擅長(zhǎng)的領(lǐng)域。
更進(jìn)一步,我們都知道,相關(guān)性,即使是強(qiáng)相關(guān)性,也不是因果性。譬如全基因組關(guān)聯(lián)分析(GWAS)常告訴我們某些基因與某些疾病相關(guān)性很強(qiáng),可這些基因離成為藥物靶點(diǎn)還離著十萬(wàn)八千里,需要科學(xué)家一步步的去探索和驗(yàn)證該基因與疾病的關(guān)系,弄明白具體的機(jī)制機(jī)理才有可能進(jìn)入新藥研發(fā)人員的眼眸,這一晃也許十多年就過(guò)去了。一個(gè)新藥研發(fā)項(xiàng)目的啟動(dòng)意味著大量資金和人力的投入,因此能真正進(jìn)入到新藥研發(fā)管線中的藥物靶標(biāo)都是精挑細(xì)選和嚴(yán)苛驗(yàn)證的。所謂AI弱水三千,NI只取一瓢。
不過(guò)雖然生物體系異常復(fù)雜,但如果還原到更簡(jiǎn)單的水平,譬如細(xì)胞水平,結(jié)合人工智能強(qiáng)大的圖像學(xué)習(xí)能力,有望取得突破。來(lái)自Janssen等公司和學(xué)校的研究人員,利用傳統(tǒng)的高通量篩選針對(duì)糖皮質(zhì)激素受體的細(xì)胞模型,篩選了50萬(wàn)個(gè)化合物,獲得化合物的細(xì)胞表型圖像數(shù)據(jù),生成基于圖像的分子指紋, 同時(shí)結(jié)合這些化合物之前在500多種不同靶點(diǎn)的篩選模型中測(cè)定的生物學(xué)活性作為訓(xùn)練集,采用深度學(xué)習(xí)的方法訓(xùn)練出一個(gè)人工智能模型,然后可以根據(jù)化合物在糖皮質(zhì)激素受體的細(xì)胞表型圖像數(shù)據(jù),來(lái)預(yù)測(cè)化合物對(duì)其他不相關(guān)靶點(diǎn)的生物學(xué)活性數(shù)據(jù)。
這意味著單個(gè)高通量細(xì)胞表型圖像篩選模型可以取代許多耗時(shí)耗力構(gòu)建的特定靶點(diǎn)和通路的篩選模型, 顯著降低人力和時(shí)間成本。于此同時(shí)Cell Image Library提供了上萬(wàn)的化合物處理細(xì)胞后不同的圖像和形態(tài)學(xué)數(shù)據(jù)以供人工智能學(xué)習(xí),以尋找新的藥物作用新機(jī)制。筆者推測(cè)這方面的研究是否會(huì)催生一門(mén)新興學(xué)科-圖像基因組學(xué)(Imagenome),結(jié)合其他組學(xué)研究的數(shù)據(jù),綜合用來(lái)研究細(xì)胞水平的表型變化的分子機(jī)制。
總體而言,基于大數(shù)據(jù)的人工智能,擅長(zhǎng)的是對(duì)已有知識(shí)的挖掘、重新組織和分配,所以人工智能可以學(xué)習(xí)已有的影像診斷規(guī)則,甚至能夠看得更細(xì)更快,也可以在海量的數(shù)據(jù)中尋找已有知識(shí)的關(guān)聯(lián)性。但每一次新藥研發(fā)的成功,都是人類(lèi)突破已有的知識(shí)框架,對(duì)疾病認(rèn)知的新突破。
新知識(shí)的產(chǎn)生,來(lái)源于人類(lèi)的無(wú)數(shù)次試錯(cuò)和實(shí)踐,而不是一條條畫(huà)在已有知識(shí)間的連線。能否更好的理解疾病,相信看到這里的讀者,已經(jīng)有了自己的判斷。那能否成規(guī)模的產(chǎn)生藥物候選物?究竟是“Garbage quick in, Garbage quick out”,還是另有洞天?(李偉)

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專(zhuān)題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?