訂閱
糾錯(cuò)
加入自媒體

人工智能能顛覆新藥研發(fā)嗎?


先關(guān)注一下人工智能近年來(lái)的戰(zhàn)績(jī):

2015年估值就已達(dá)到17.81億美元的Benevolent AI公司,通過(guò)分析海量的科技文獻(xiàn)、專(zhuān)利和臨床實(shí)驗(yàn)結(jié)果等挖掘潛在的知識(shí)產(chǎn)生新的假說(shuō),在肌萎縮側(cè)索硬化(ALS) 疾病治療上,發(fā)現(xiàn)的化合物在動(dòng)物模型上顯示效果,準(zhǔn)備進(jìn)入臨床研究;另外它還把強(qiáng)生之前開(kāi)發(fā)用于注意缺陷多動(dòng)障礙(ADHD)失敗的Bavisant重新開(kāi)發(fā)用于帕金森氏癥病人的日間極度嗜睡癥(EDS)的Phase 2b的驗(yàn)證性試驗(yàn)。

近期獲得軟銀領(lǐng)投的twoXAR,用人工智能技術(shù)平臺(tái)進(jìn)行老藥新用,發(fā)現(xiàn)了艾塞那肽(Exenatide)和奧洛他定(Olopatadine)在類(lèi)風(fēng)濕性關(guān)節(jié)炎(RA)的動(dòng)物模型上有較好的效果。

明碼生物的人工智能團(tuán)隊(duì)與耶魯大學(xué)合作,發(fā)現(xiàn)了纖維細(xì)胞生長(zhǎng)因子(FGF)通過(guò)糖酵解參與到血管發(fā)育的過(guò)程。

不過(guò)仔細(xì)想想,拿得出手的進(jìn)展大多是臨床前的數(shù)據(jù),研究結(jié)果未發(fā)表或者發(fā)表在非同行評(píng)議的網(wǎng)站,而根據(jù)老藥新用的預(yù)測(cè)結(jié)果申請(qǐng)做一個(gè)Phase 2b的概念性驗(yàn)證試驗(yàn)并不是什么稀罕的事兒。通過(guò)實(shí)驗(yàn)篩選,甚至臨床偶然觀察發(fā)現(xiàn)的老藥新用的事例數(shù)不勝數(shù)。至于FGF與血管發(fā)育的那篇文章,并沒(méi)有提到多少人工智能的內(nèi)容,更像是傳統(tǒng)的轉(zhuǎn)錄組學(xué)(RNA-seq)分析加GO富集分析(當(dāng)然也可能是限于文章篇幅而沒(méi)有披露人工智能的細(xì)節(jié))。

但生物系統(tǒng)本身就很復(fù)雜,人工智能之前的傳統(tǒng)方法也同樣磕磕碰碰,毫無(wú)疑問(wèn)人工智能可以幫助生物學(xué)家產(chǎn)生新的假說(shuō),但是否會(huì)是更好的假說(shuō)仍面臨極大的挑戰(zhàn)。

首先,近期的Nature Reviews Drug Discovery統(tǒng)計(jì)了FDA批準(zhǔn)的1578個(gè)藥物總共的靶點(diǎn)數(shù)目是667個(gè),而Ensembl標(biāo)注的潛在藥物靶點(diǎn)就有4479個(gè),當(dāng)然還有些其他的關(guān)于靶點(diǎn)數(shù)目的預(yù)估,數(shù)值有差異,但都遠(yuǎn)大于目前已經(jīng)成藥的靶點(diǎn),更何況每期的CNS文章里常有些看起來(lái)很有前景的新靶點(diǎn),這些潛在的新靶點(diǎn)都是有或多或少obvious-data支持,而不僅僅是人工智能費(fèi)力找出來(lái)的hidden-data。

我們究竟能有多大信心去花費(fèi)足夠資源驗(yàn)證這些由Natural Intelligence尋找的有obvious-data支持的新靶點(diǎn)?我們又能有多大信心去花費(fèi)足夠資源驗(yàn)證那些由人工智能尋找的有hidden-data支持的新靶點(diǎn)?

其次,大數(shù)據(jù)訓(xùn)練出來(lái)的人工智能的好處在于有問(wèn)必有答,壞處也在于有問(wèn)必有答。通過(guò)學(xué)習(xí)海量的文獻(xiàn)數(shù)據(jù),人工智能肯定能找出非常多的相關(guān)性, 無(wú)論強(qiáng)弱,但是信噪比如何?生物系統(tǒng)復(fù)雜異常,有著無(wú)數(shù)的獨(dú)立變量,深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)層數(shù)是否足夠處理?更重要的是,海量的文獻(xiàn)必然質(zhì)量參差不齊,存在著相當(dāng)多的錯(cuò)誤信息和結(jié)論、不可重復(fù)的實(shí)驗(yàn)數(shù)據(jù)和結(jié)論、部分公開(kāi)的實(shí)驗(yàn)數(shù)據(jù)和結(jié)論,似是而非的實(shí)驗(yàn)數(shù)據(jù)和結(jié)論,有意無(wú)意誤導(dǎo)性的實(shí)驗(yàn)數(shù)據(jù)和結(jié)論,盲目追熱點(diǎn)導(dǎo)致給相關(guān)性加分的實(shí)驗(yàn)數(shù)據(jù)和結(jié)論,筆者相信上述的這些情況,行業(yè)中人必然是深有體會(huì)。

基于這樣的數(shù)據(jù)集,人工智能該如何學(xué)習(xí)呢?一個(gè)優(yōu)秀的研究人員也需要多年的培訓(xùn)才有可能學(xué)會(huì)區(qū)分文獻(xiàn)中的可靠或不可靠信息,這其中隱含了大量的邏輯推理和常識(shí),甚至偶爾還涉及到對(duì)文章作者學(xué)術(shù)名譽(yù)的估量,這些并不是人工智能所擅長(zhǎng)的領(lǐng)域。

更進(jìn)一步,我們都知道,相關(guān)性,即使是強(qiáng)相關(guān)性,也不是因果性。譬如全基因組關(guān)聯(lián)分析(GWAS)常告訴我們某些基因與某些疾病相關(guān)性很強(qiáng),可這些基因離成為藥物靶點(diǎn)還離著十萬(wàn)八千里,需要科學(xué)家一步步的去探索和驗(yàn)證該基因與疾病的關(guān)系,弄明白具體的機(jī)制機(jī)理才有可能進(jìn)入新藥研發(fā)人員的眼眸,這一晃也許十多年就過(guò)去了。一個(gè)新藥研發(fā)項(xiàng)目的啟動(dòng)意味著大量資金和人力的投入,因此能真正進(jìn)入到新藥研發(fā)管線中的藥物靶標(biāo)都是精挑細(xì)選和嚴(yán)苛驗(yàn)證的。所謂AI弱水三千,NI只取一瓢。

不過(guò)雖然生物體系異常復(fù)雜,但如果還原到更簡(jiǎn)單的水平,譬如細(xì)胞水平,結(jié)合人工智能強(qiáng)大的圖像學(xué)習(xí)能力,有望取得突破。來(lái)自Janssen等公司和學(xué)校的研究人員,利用傳統(tǒng)的高通量篩選針對(duì)糖皮質(zhì)激素受體的細(xì)胞模型,篩選了50萬(wàn)個(gè)化合物,獲得化合物的細(xì)胞表型圖像數(shù)據(jù),生成基于圖像的分子指紋, 同時(shí)結(jié)合這些化合物之前在500多種不同靶點(diǎn)的篩選模型中測(cè)定的生物學(xué)活性作為訓(xùn)練集,采用深度學(xué)習(xí)的方法訓(xùn)練出一個(gè)人工智能模型,然后可以根據(jù)化合物在糖皮質(zhì)激素受體的細(xì)胞表型圖像數(shù)據(jù),來(lái)預(yù)測(cè)化合物對(duì)其他不相關(guān)靶點(diǎn)的生物學(xué)活性數(shù)據(jù)。

這意味著單個(gè)高通量細(xì)胞表型圖像篩選模型可以取代許多耗時(shí)耗力構(gòu)建的特定靶點(diǎn)和通路的篩選模型, 顯著降低人力和時(shí)間成本。于此同時(shí)Cell Image Library提供了上萬(wàn)的化合物處理細(xì)胞后不同的圖像和形態(tài)學(xué)數(shù)據(jù)以供人工智能學(xué)習(xí),以尋找新的藥物作用新機(jī)制。筆者推測(cè)這方面的研究是否會(huì)催生一門(mén)新興學(xué)科-圖像基因組學(xué)(Imagenome),結(jié)合其他組學(xué)研究的數(shù)據(jù),綜合用來(lái)研究細(xì)胞水平的表型變化的分子機(jī)制。

總體而言,基于大數(shù)據(jù)的人工智能,擅長(zhǎng)的是對(duì)已有知識(shí)的挖掘、重新組織和分配,所以人工智能可以學(xué)習(xí)已有的影像診斷規(guī)則,甚至能夠看得更細(xì)更快,也可以在海量的數(shù)據(jù)中尋找已有知識(shí)的關(guān)聯(lián)性。但每一次新藥研發(fā)的成功,都是人類(lèi)突破已有的知識(shí)框架,對(duì)疾病認(rèn)知的新突破。

新知識(shí)的產(chǎn)生,來(lái)源于人類(lèi)的無(wú)數(shù)次試錯(cuò)和實(shí)踐,而不是一條條畫(huà)在已有知識(shí)間的連線。能否更好的理解疾病,相信看到這里的讀者,已經(jīng)有了自己的判斷。那能否成規(guī)模的產(chǎn)生藥物候選物?究竟是“Garbage quick in, Garbage quick out”,還是另有洞天?(李偉)

<上一頁(yè)  1  2  3  
聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)