界面新聞記者 | 伍洋宇
界面新聞編輯 | 文姝琪
在2024年諾貝爾物理學獎與化學獎接連發布后,比起這兩個領域更興奮的是人工智能領域的從業者與關注者。
10月8日,瑞典皇家科學院宣布,2024年諾貝爾物理學獎被授予美國普林斯頓大學教授約翰·霍普菲爾德(John Hopfield)和加拿大多倫多大學教授杰弗里·辛頓 (Geoffrey Hinton),以表彰他們“基于人工神經網絡實現機器學習的基礎性發現和發明”。
次日,2024年諾貝爾化學獎公布,一半授予大衛·貝克(David Baker),“以表彰在計算蛋白質設計方面的貢獻”;另一半共同授予德米斯·哈薩比斯(Demis Hassabis)和約翰·M·詹珀(John M. Jumper),“以表彰他們在蛋白質結構預測方面的成就”。
兩項名單跟AI關聯度之高,在各自領域激起了巨大浪潮。
前者共同幫助啟動了機器學習的爆炸式發展,即以人工神經網絡為核心的深度學習革命。后者則是利用AI技術促進科學研究的典范,其中大衛·貝克為華盛頓大學蛋白質設計研究所所長,首次使用生成式人工智能從頭設計出了全新的抗體,有望讓AI從頭設計蛋白進入抗體藥物市場。德米斯和約翰則共同來自以AlphaGo聞名在外的谷歌旗下DeepMind,團隊研發的AlphaFold系列對于蛋白質結構預測及相關變革性研究具有里程碑式貢獻。
這一獎項的決定,在很大程度上肯定了由計算機科學撬動其他領域基礎科學研究進程的研究范式,即AI for Science(AI4S),這背后存在一個巨大的可發展的創業體系和商業空間。
AI4S是指利用人工智能技術來推動和加速科學研究的新型研究范式。這種范式通過結合機器學習、數據分析、高性能計算等技術,幫助科學家在各個領域進行更深入的探索和發現。正如DeepMind和大衛·貝克團隊的研究成果,加速了該領域對于蛋白質結構預測與設計的研究工作,這將直接推動生物醫藥領域的研發進程。
在國內,有一家叫做深勢科技的創業公司,其成就能夠對標DeepMind。2021年,深勢科技團隊憑借UniFold成功復現了AlphaFold 2,并在個別指標上優于后者,打破了DeepMind在蛋白折疊領域的壟斷。隨后,其發布的Uni-Mol Docking V2在蛋白-配體對接預測工作上實現重大突破,表現僅略微遜色于AlphaFold 3。
深勢科技同樣錨定在AI4S領域的基礎設施搭建,提出了“多尺度建模+機器學習+高性能計算”的科研范式,目前已推出Bohrium科研云平臺、Hermite藥物計算設計平臺、RiDYMO難成藥靶標研發平臺及Pilotey電池設計自動化平臺等工業設計與仿真基礎設施。
作為國內為數不多定位AI4S領域的企業,深勢科技CEO孫偉杰就諾貝爾獎對AI4S形成的話題效應接受了界面新聞記者的采訪。
對于諾貝爾物理學獎和化學獎顯示出Science與AI的關系,孫偉杰認為物理學獎更像是Science for AI,化學獎則更多體現了AI for Science。從兩個獎項的可預測性來講,物理學獎更讓人意外。團隊推測,這可能與過去幾年來人工神經網絡在物理學領域陸續發揮了重要作用有關,例如相關的數據處理、新儀器設備研發以及新材料發現等等。
雖然今年的諾貝爾獎讓大眾忍不住猜想,評委們的視線是否有意向AI進行了傾斜,但在科研人員視角下,邏輯并非如此。
孫偉杰告訴界面新聞記者,公司內部在日常討論的時候,已經有人推測過AlphaFold獲得諾貝爾獎的可能性。因為在人類現存尚未獲獎的重大成果中,AlphaFold對于蛋白折疊(指蛋白質在合成后,從無規則的多肽鏈自發形成具有特定三維結構的過程,AlphaFold利用AI技術實現了對蛋白質三維結構的精準預測)的貢獻,是內部公認最值得獲獎的成果之一,相比其他成果對科研和產業的影響都至關深刻。
大衛團隊和DeepMind的成果毫無疑問是AI技術在化學生物領域的重要突破。從領域上來看,生命科學和物質科學將是AI4S的重點落地方向,它們包括但不限于生命科學、材料科學、能源科學、環境科學、信息科學等。
孫偉杰認為接下來會有兩個重要趨勢,首先,在AI解決了一個具體科學問題后,未來外界會看到越來越多的類似成果;其次,整個基礎科學研究的范式已經發生改變,在未來,AI與學科領域認知和先進實驗手段相結合,將成為主流的科研范式。
理論上來說,AI4S走上諾獎風口不一定會讓資本和創業者迅速涌入某一個賽道,但它一定有自己潛移默化的影響,孫偉杰認為它最根本的影響將是加強大眾對AI4S的共識。
這種共識會加速科研領域的范式轉變,讓研究機構更快把精力投入轉移到AI4S的路線上,這也就意味著AI4S基礎設施將變得更加重要。在這個“從0到1”的轉變背后,跨學科的研究壁壘和人才培養可能是其中的核心難點。
科研之外,就AI4S的商業格局而言,以深勢科技為代表的基礎設施建設企業處于中游,這里的行業生態其實還相對早期,但AI4S的上下游產業生態已經相對成熟和龐大,其中上游包括以AI芯片、云計算服務為代表的基礎設施,下游則對應生命科學和物質科學兩大門類中的眾多場景,單就AI制藥而言已包含多家上市公司。
其中,以DeepMind和深勢科技為代表的公司,其商業模式有高度重疊的部分,即為有基礎科研需求的產業和企業提供AI4S研究工具和平臺。孫偉杰預估,這里對應一個萬億級全球市場,國內市場也至少是千億級別。
中美在這一落地環節上存在差異。就生物醫藥產業而言,美國相對中國市場更加完善,且市場規模更大。而在材料、電池、能源等制造業領域,中國企業的優勢非常明顯。不過在不同市場,AI4S服務客戶的底層技術是相通的,這意味著企業要針對不同領域采取不同的市場策略。
以深勢科技自身而言,團隊的下一步技術突破方向是其“深勢宇知”科學大模型體系,要完成分子、原子、基因、蛋白這四種模態的統一,使其對于無論小分子、大分子還是高分子都具備完整的表征和性質預測的能力,這將是一個“有機分子宇宙”的通用模型,有機會對上述科研工作產生重大的推動力。
此前,深勢科技首席科學家張林峰在今年上半年接受界面新聞采訪時,曾判斷AI4S領域的科學大模型正處于GPT-2階段,孫偉杰表示,GPT-3時刻可能會出現在2025年。在這個階段,模型的核心任務仍是學到更多科學規律。而在GPT-3之后,它的下一個進化目標是如何對現實世界的數據做出反饋。
在孫偉杰看來,科學研究的范式已經被AI改變了,但這種改變還不均衡,不同學科和不同人群之間的快慢進度會不一樣。而怎么讓AI對科研的改變變得更普世和通用,這是深勢科技這類公司的使命。
作為少數定位AI4S平臺化建設的公司,孫偉杰不諱言在諾獎名單公布后得到了外界的諸多關注,這當中也包括投資人。對于這件事在融資和商務拓展上的直觀影響,他表示接下來可能“敲門”會更加容易,但無論是融資還是商務拓展最終一定是符合市場和商業邏輯。
對于這個領域的信仰者而言,在未來,所有傳統研發手段都值得被AI for Science重新升級一遍。
“本質上是大家擁有了一臺更高水平的挖礦機,之前可能只能挖地表一兩米,但是剩下的這些都是深礦,需要更準的探測技術和更強的挖掘能力。”孫偉杰說,“而這就是AI for Science將會帶給大家的。”