“文獻(xiàn)進(jìn),產(chǎn)物出” AI 化學(xué)家引領(lǐng)化學(xué)數(shù)字化發(fā)展
一直以來(lái),化學(xué)家在科研過(guò)程中需要面對(duì)十分復(fù)雜的物質(zhì)體系和實(shí)驗(yàn)過(guò)程,常常為了一個(gè)實(shí)驗(yàn)結(jié)果要進(jìn)行不計(jì)其數(shù)的實(shí)驗(yàn)。
近年來(lái),自動(dòng)化在化學(xué)領(lǐng)域的應(yīng)用在一定程度上幫助化學(xué)家簡(jiǎn)化了繁復(fù)的實(shí)驗(yàn)研究,尤其是隨著人工智能的發(fā)展,基于機(jī)器學(xué)習(xí)的 “AI化學(xué)家” 更是提升了實(shí)驗(yàn)的效率和準(zhǔn)確性,在化學(xué)研究領(lǐng)域釋放出更多紅利。
如今,來(lái)自英國(guó)格拉斯哥大學(xué)(University of Glasgow)Cronin 實(shí)驗(yàn)室的化學(xué)家們?cè)谧詣?dòng)化化學(xué)合成領(lǐng)域取得了開拓性成果——他們開發(fā)了一個(gè)軟件,可以將學(xué)術(shù)論文轉(zhuǎn)化為可執(zhí)行的程序,即實(shí)現(xiàn)了“文獻(xiàn)進(jìn),產(chǎn)物出(Paper in, product out)”的過(guò)程,且研究人員無(wú)需學(xué)習(xí)代碼就可以編輯。
相關(guān)工作以 “A universal system for digitization and automatic execution of the chemical synthesis literature” 為題,在線發(fā)表在頂級(jí)科學(xué)期刊《科學(xué)》(Science)上。
圖 | Science 發(fā)表相關(guān)論文(來(lái)源:Science)
“文獻(xiàn)進(jìn),產(chǎn)物出” AI 化學(xué)家引領(lǐng)化學(xué)數(shù)字化發(fā)展
早在 2018 年底,Cronin 團(tuán)隊(duì)就研發(fā)了一個(gè)名為 “chemputer” 的化學(xué)計(jì)算機(jī),該系統(tǒng)由試管、燒瓶、輸送化學(xué)物質(zhì)的管道、閥門和泵等傳統(tǒng)化學(xué)實(shí)驗(yàn)器皿組成,通過(guò)系統(tǒng)上運(yùn)行的一套由化學(xué)描述語(yǔ)言(XDL,其中 “X” 的發(fā)音是 “kai”,取自希臘語(yǔ)中化學(xué)的第一個(gè)字母)編寫的程序,來(lái)控制化學(xué)分子的合成。去年,Cronin 團(tuán)隊(duì)展示了該計(jì)算機(jī)可以生產(chǎn)多個(gè)分子的能力。如今,他們利用機(jī)器編程的便捷方式,再次向化學(xué)數(shù)字化領(lǐng)域邁出了重要一步。
這項(xiàng)工作的核心在于化學(xué)描述語(yǔ)言。對(duì)于該計(jì)算機(jī)而言,化學(xué)描述語(yǔ)言就像 HTML 對(duì)于瀏覽器一樣,它告訴機(jī)器該做什么。
圖 | 用化學(xué)描述語(yǔ)言 XDL 編寫程序(來(lái)源:The Cronin Group 官網(wǎng))
該系統(tǒng)創(chuàng)建了一個(gè)名為 SynthReader 的軟件,它可以掃描經(jīng)同行評(píng)審的文獻(xiàn)中的化學(xué)配方,比如生產(chǎn)瑞德西韋的 6 個(gè)步驟,并使用自然語(yǔ)言處理來(lái)挑選出“添加”、“攪拌”或“加熱”等動(dòng)詞、“逐滴式”等修飾符,以及持續(xù)時(shí)間和溫度等一些其他細(xì)節(jié),然后系統(tǒng)將這些指令轉(zhuǎn)換為化學(xué)描述語(yǔ)言,通過(guò)執(zhí)行語(yǔ)言命令來(lái)驅(qū)動(dòng)化學(xué)機(jī)器人在實(shí)驗(yàn)室完成化合物的全自動(dòng)合成。
近期剛被美國(guó)食品藥品監(jiān)督管理局(FDA)批準(zhǔn)可用于治療新冠住院患者的藥物瑞德西韋試驗(yàn)就在這臺(tái) chemputer 上高速運(yùn)行著。前幾日,制造瑞德西韋藥物的吉利德公司宣布,他們將在 10 月底前滿足全球?qū)τ谌鸬挛黜f的需求,由此可見其生產(chǎn)效率之高。
論文作者之一 Cronin 介紹,該框架的優(yōu)勢(shì)之一在于化學(xué)家們可以用純英文編輯化學(xué)方案,因此無(wú)需培訓(xùn)即可操作,還有至關(guān)重要的一點(diǎn)是,他們還可以利用化學(xué)專業(yè)知識(shí)來(lái)發(fā)現(xiàn)代碼中的錯(cuò)誤。
研究人員表示,他們從化學(xué)的相關(guān)文獻(xiàn)中提取了 12 種示范配方,其中包括麻醉劑利多卡因、Dess-Martin 高碘烷氧化劑和氟化劑 AlkylFluor。經(jīng)測(cè)試,所有這些配方都是由 chemputer 以類似于人類化學(xué)家的效率進(jìn)行操作的。
Cronin 表示:“如果我們有標(biāo)準(zhǔn)的方法來(lái)發(fā)現(xiàn)分子、制造分子,然后生產(chǎn)化學(xué)物質(zhì),突然間沒(méi)有什么東西會(huì)被淘汰,這就像化學(xué)的電子書閱讀器!
多年來(lái),Cronin 一直夢(mèng)想著未來(lái)研究人員可以像發(fā)送電子郵件和打印 PDF 文件一樣,輕松地分發(fā)和生產(chǎn)分子,從而使無(wú)法訂購(gòu)藥物變得像無(wú)法找到現(xiàn)代文本一樣古老。
如今,越來(lái)越多的科研團(tuán)隊(duì)都在競(jìng)相將化學(xué)技術(shù)帶入數(shù)字時(shí)代,Cronin 團(tuán)隊(duì)僅代表了跨越學(xué)術(shù)界和工業(yè)界的數(shù)十個(gè)小組之一,此次研究成果或?qū)⒁I(lǐng)更安全的藥物生產(chǎn)、更高效的太陽(yáng)能電池板,以及更具顛覆性的新型產(chǎn)業(yè)。
化學(xué)機(jī)器人推動(dòng)制藥公司數(shù)字化轉(zhuǎn)型
如今,Cronin 創(chuàng)立了一家名為 Chemify 的公司,來(lái)銷售化學(xué)機(jī)器人 chemputer 和對(duì)應(yīng)的 XDL 軟件包,他也在網(wǎng)上免費(fèi)發(fā)布了用于機(jī)器的搭建和編程的程序包。chemputer 已經(jīng)在化學(xué)界取得了一定的進(jìn)展,該團(tuán)隊(duì)于去年 5 月在制藥公司葛蘭素史克(GSK )安裝了一臺(tái)原型機(jī)。
葛蘭素史克高級(jí)副總裁兼人工智能和機(jī)器學(xué)習(xí)全球負(fù)責(zé)人 Kim Branson 博士表示:“chemputer 這一概念的產(chǎn)生,以及 Cronin 團(tuán)隊(duì)圍繞化學(xué)機(jī)器人所做的工作的確具有很大的變革性!
眾所周知,葛蘭素史克是一家以研發(fā)為基礎(chǔ)的藥品和保健品公司,其產(chǎn)品遍及全球市場(chǎng)。目前,該公司正在探索各種自動(dòng)化技術(shù),以提高生產(chǎn)效率。Branson 表示,Cronin 團(tuán)隊(duì)正在進(jìn)行的這項(xiàng)研究工作,可能會(huì)讓葛蘭素史克在公司內(nèi)部更加方便地“傳輸專業(yè)知識(shí)”。一旦化學(xué)家設(shè)計(jì)出了一個(gè)有前景的分子配方,他們就不用再去寫報(bào)告或給同事講解,而是直接一鍵 “分享” 配方。
研究人員表示,盡管 Chemify 不是最復(fù)雜的自動(dòng)化化學(xué)平臺(tái),但它可能卻是最易于訪問(wèn)的平臺(tái)。它是基于燒杯和試管這些傳統(tǒng)工具建立起來(lái)的,并在化學(xué)家們使用了幾個(gè)世紀(jì)的 “批量” 模式中逐步發(fā)揮作用。
如今,Cronin 團(tuán)隊(duì)正在研究它的通用性(即與任何批處理化學(xué)機(jī)器人兼容),研究人員只需要告訴軟件他們有哪些零件,并給它一些相應(yīng)的溫度等數(shù)字,就可以讓機(jī)器運(yùn)行。
AutoSyn 自動(dòng)化學(xué)系統(tǒng)
此外,還有很多其他研究團(tuán)體也在做一些打破傳統(tǒng)化學(xué)領(lǐng)域認(rèn)知的研究。
SRI International 公司 SRI Biosciences 部門的首席戰(zhàn)略官 Nathan Collins 說(shuō):“與我們過(guò)去 200 年間所采用的的工作方式相比,大多數(shù)化學(xué)過(guò)程沒(méi)有什么變化,都是一種純手工的、靠工匠驅(qū)動(dòng)的過(guò)程,這一領(lǐng)域還有數(shù)十億美元的機(jī)會(huì)等待挖掘!
今年 6 月,Collins 和他的同事們發(fā)表了一篇題為 “Fully Automated Chemical Synthesis: Toward the Universal Synthesizer” 的研究論文,描述了一種自動(dòng)化多步化學(xué)合成儀 AutoSyn 進(jìn)行藥物合成的研究。
圖 | AutoSyn的俯視圖
圖 | AutoSyn流動(dòng)化學(xué)平臺(tái)中使用的單元操作模塊(UOM)的順序示意圖
圖 | 多步驟化學(xué)合成自動(dòng)化
AutoSyn 平臺(tái)使用一種“流動(dòng)”化學(xué)的方法,來(lái)替代傳統(tǒng)的物質(zhì)混合方法。
以往,物質(zhì)的混合首先需要將它們?cè)谝粋(gè)燒杯中混合,然后再倒入另一個(gè)燒瓶,而 AutoSyn 平臺(tái)的物質(zhì)混合過(guò)程則是當(dāng)化學(xué)物質(zhì)流經(jīng)管子的時(shí)候,在這個(gè)動(dòng)態(tài)過(guò)程中實(shí)現(xiàn)連續(xù)的化學(xué)反應(yīng)。
AutoSyn 平臺(tái)具備 3000 多種合成途徑,可在幾小時(shí)內(nèi)實(shí)現(xiàn)毫克級(jí)甚至是克級(jí)的任何藥物小分子的合成,幾乎可以復(fù)制所有類型的液體之間的反應(yīng)。
Collins 說(shuō):“在流體中進(jìn)行化學(xué)反應(yīng)不僅需要專門的硬件,還需要一些額外的努力,才能從其批次說(shuō)明中翻譯化學(xué)程序,從而實(shí)現(xiàn)傳熱和混合等方面的‘精妙’控制。如果像 AutoSyn 這樣的平臺(tái)可以針對(duì)已公開的反應(yīng)自動(dòng)運(yùn)行數(shù)百種細(xì)微的變化,那么它們生成的詳細(xì)數(shù)據(jù)集可能會(huì)突出顯示制造化學(xué)物質(zhì)的最佳方法。”
這項(xiàng)工作可能是一個(gè)很好的起點(diǎn),但許多已發(fā)表的實(shí)驗(yàn)都存在缺陷。據(jù) Collins 估計(jì),化學(xué)家們會(huì)花費(fèi) 30%-70% 的時(shí)間來(lái)解決已知反應(yīng)中遺漏的細(xì)節(jié)!斑M(jìn)行一個(gè)化學(xué)反應(yīng),是需要研究人員根據(jù)之前的實(shí)驗(yàn)記錄,坐下來(lái)逐步操作的! Collins 說(shuō)。
盡管 AutoSyn 和 chemputer 都能復(fù)制如今大部分已發(fā)布的反應(yīng),但他們下一步需要讓機(jī)器變得更可靠,就像 Cronin 所說(shuō)的那樣 “讓 Apple 變得時(shí)髦”。
Collins 說(shuō),我們過(guò)去需要一名工程師來(lái)維持 AutoSyn 一半以上的運(yùn)行,但現(xiàn)在所需的修復(fù)時(shí)間不到 10%。他希望,最終可能實(shí)現(xiàn)用戶只通過(guò)電話就可以對(duì)系統(tǒng)進(jìn)行故障排除。
Collins 表示:“這仍然是一門非常新的科學(xué)。過(guò)去 18 個(gè)月,它才開始真正爆發(fā)。”
Make-It
美國(guó)國(guó)防高級(jí)研究計(jì)劃局(DARPA)在推動(dòng)這一科學(xué)發(fā)展的過(guò)程中發(fā)揮了重要作用,DARPA 剛結(jié)束了一項(xiàng)為期 4 年的 Make-It 項(xiàng)目,該項(xiàng)目的重點(diǎn)研究領(lǐng)域包括自動(dòng)化分子設(shè)計(jì)、自動(dòng)合成(生產(chǎn))和快速反應(yīng)篩選,在全自動(dòng)快速分子生產(chǎn)領(lǐng)域取得重大進(jìn)展。chemputer 和 AutoSyn 都是它的原型。
在過(guò)去,化學(xué)家們辛辛苦苦地將原子精加工成新穎的分子結(jié)構(gòu),需要一個(gè)漫長(zhǎng)的等待過(guò)程。Make-It 項(xiàng)目的經(jīng)理 Anne Fischer 的一個(gè)長(zhǎng)期目標(biāo)就是加快發(fā)現(xiàn)有用分子的過(guò)程,她說(shuō):“制造和測(cè)試分子始終是一個(gè)緩慢的步驟!
但現(xiàn)在,Make-It 已經(jīng)生產(chǎn)了 chemputer、AutoSyn 等制造分子的機(jī)器人工具,Fischer 正在指導(dǎo)一個(gè)新的 DARPA 項(xiàng)目“加速分子發(fā)現(xiàn)(Accelerated Molecular Discovery)”,該項(xiàng)目著眼于開發(fā)更智能的軟件,來(lái)告訴機(jī)器人要制造什么分子,以及如何制造。
Fischer 說(shuō):“我們現(xiàn)在正在嘗試擴(kuò)展 Make-It 項(xiàng)目所做的工作,這樣我們就可以逐步教計(jì)算機(jī)去發(fā)現(xiàn)新的分子!
許多人認(rèn)為,我們實(shí)現(xiàn)這一過(guò)程的秘密武器是機(jī)器學(xué)習(xí),其實(shí)一些能夠進(jìn)行初級(jí)化學(xué)學(xué)習(xí)的機(jī)器還在研發(fā)中。
自動(dòng)流動(dòng)化學(xué)系統(tǒng)的持續(xù)改進(jìn)
麻省理工學(xué)院的化學(xué)家 Connor Coley 所在的團(tuán)隊(duì)去年將自動(dòng)流動(dòng)化學(xué)系統(tǒng)融合了一種算法,以對(duì)其進(jìn)行指導(dǎo)。該算法在數(shù)十萬(wàn)個(gè)反應(yīng)的數(shù)據(jù)庫(kù)上進(jìn)行了訓(xùn)練,能夠預(yù)測(cè)新產(chǎn)品的配方。Coley 說(shuō):“基于這些模式,該系統(tǒng)試圖了解什么樣的轉(zhuǎn)化方式應(yīng)該適用于從未見過(guò)的新分子合成”。
Coley 還強(qiáng)調(diào),該系統(tǒng)還有很長(zhǎng)的路要走。它是基于相似的分子進(jìn)行預(yù)測(cè),而人類化學(xué)家還需要補(bǔ)充機(jī)器生成的輪廓中所缺失的細(xì)節(jié)。盡管如此,這項(xiàng)工作還是支持了軟件可以提出有用配方的概念。
麻省理工學(xué)院正在與十多家化學(xué)和制藥公司合作,以改進(jìn)其分子預(yù)測(cè)算法,并且一些公司已經(jīng)將該軟件投入使用。默克公司(Merck)計(jì)算和結(jié)構(gòu)化學(xué)助理副總裁 Juan Alvarez 表示,Coley 的機(jī)器學(xué)習(xí)算法是該公司向其內(nèi)部研究人員提供的多種化學(xué)預(yù)測(cè)工具之一。他說(shuō):“它的部署絕對(duì)會(huì)影響我們今天的時(shí)間表!
雖然每個(gè)研究團(tuán)隊(duì)都從不同角度探究自動(dòng)化,但他們都在解決同一個(gè)問(wèn)題。存在著近乎無(wú)限多種的分子,其中某些必定是可以拯救生命的藥物,或者是一些革命性的新材料,但很少有人擁有這方面的專業(yè)技能,來(lái)對(duì)這些化合物進(jìn)行分析、制造和測(cè)試。
而這些化學(xué)自動(dòng)化研究團(tuán)隊(duì)的目標(biāo)就是避免浪費(fèi)那些稀有技能。
在某些方面,化學(xué)家的工作仍然類似于抄寫員的工作,他們?cè)?jīng)費(fèi)盡心思地復(fù)制和修正他人的著作。像 Cronin 這樣的研究人員,就是希望借助相當(dāng)于印刷機(jī)、文字處理器和自動(dòng)更正機(jī)的化學(xué)制劑在手,未來(lái)的化學(xué)家們將花費(fèi)更少的時(shí)間進(jìn)行重復(fù)創(chuàng)作,轉(zhuǎn)而花費(fèi)更多的時(shí)間進(jìn)行新的創(chuàng)作。
Fischer 說(shuō):“這不是要取代化學(xué)家,而是要給化學(xué)家提供工具,讓他們成為有創(chuàng)造力的高級(jí)思考者!

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
ChatZOC,藏在口袋里的「眼科醫(yī)生」
-
金百澤科技亮相中國(guó)國(guó)際醫(yī)療器械博覽會(huì) | 盡顯醫(yī)療領(lǐng)域硬實(shí)力
-
進(jìn)階的新冠疫苗 又一個(gè)中國(guó)造
-
“AI醫(yī)療第一股”鷹瞳科技上市首日即破發(fā)
-
圓心科技登陸港股,“賣藥的生意”還好不好做?
-
十圖解讀2021年中國(guó)康復(fù)醫(yī)療行業(yè)現(xiàn)狀
-
醫(yī)藥流通數(shù)字化運(yùn)營(yíng)實(shí)現(xiàn)精細(xì)化飼養(yǎng)
-
科學(xué)家發(fā)現(xiàn)人體新器官:將有助于癌癥治療
技術(shù)文庫(kù)
最新活動(dòng)更多
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月30-31日報(bào)名參會(huì)>>> 全數(shù)會(huì)2025中國(guó)激光產(chǎn)業(yè)高質(zhì)量發(fā)展峰會(huì)
-
精彩回顧立即查看>> 【線下論壇】新唐科技2025新品發(fā)布會(huì)
-
精彩回顧立即查看>> 【在線會(huì)議】研華嵌入式核心優(yōu)勢(shì),以Edge AI驅(qū)動(dòng)機(jī)器視覺(jué)升級(jí)
-
精彩回顧立即查看>> OFweek 2025(第十四屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【在線會(huì)議】從直流到高頻,材料電特性參數(shù)的全面表征與測(cè)量
- 1 2025高端醫(yī)療器械國(guó)產(chǎn)替代提速,這些賽道值得關(guān)注!
- 2 多數(shù)人錯(cuò)估了關(guān)稅將對(duì)中國(guó)醫(yī)藥產(chǎn)業(yè)的影響
- 3 一季度醫(yī)療儀器及器械進(jìn)出口報(bào)告:前十大出口市場(chǎng)在哪?
- 4 認(rèn)購(gòu)火爆,映恩生物打響18A IPO重啟信號(hào)槍
- 5 中國(guó)創(chuàng)新藥出海:機(jī)遇、挑戰(zhàn)與未來(lái)展望
- 6 核藥賽道解碼:高壁壘、國(guó)產(chǎn)替代與千億市場(chǎng)卡位
- 7 創(chuàng)新藥是避風(fēng)港,更是發(fā)射臺(tái)!
- 8 第一醫(yī)藥扣非凈利潤(rùn)僅687.40萬(wàn)元:上!半[形土豪”要再沉淀沉淀
- 9 隱匿的醫(yī)療大佬,10年干出千億級(jí)公司
- 10 3月生物醫(yī)藥產(chǎn)業(yè)100個(gè)項(xiàng)目獲投,廣東最吸金