meta AI公司近期在化學研究領域邁出了重要一步,攜手美國能源部勞倫斯伯克利國家實驗室,共同推出了一個前所未有的化學數據集——Open Molecules 2025(簡稱OMol25),以及一款通用原子模型Universal Models for Atoms(簡稱UMA)。
OMol25數據集堪稱化學研究的新里程碑,其規模之龐大,前所未見。該數據集包含了超過1億個基于密度泛函理論(DFT)計算得出的3D分子快照,為科學家提供了豐富的分子模擬資源。DFT作為一種強大的模擬工具,能夠精確捕捉原子間的相互作用,預測原子受力及系統能量,進而揭示分子運動和化學反應的深層規律。
然而,傳統的DFT計算對計算資源的需求極為龐大,隨著分子復雜度的提升,計算需求呈指數級增長,即便是最先進的計算設備也難以應對。為了克服這一難題,meta AI利用OMol25數據集訓練了機器學習原子間勢(MLIPs),這種模型能夠以快至萬倍的速度提供與DFT同等精度的預測結果,使得科學家能夠在普通計算系統上模擬大型原子系統。
除了OMol25數據集外,meta AI還推出了UMA模型,這是一款基于過去五年meta FAIR公開數據集構建的通用原子間勢能模型群。UMA覆蓋了分子、材料、觸媒等多個化學領域,利用超過50億個原子組成的3D結構作為訓練數據,具有極高的通用性和預測精度。
UMA模型分為UMA-small和UMA-medium兩種規模,其中UMA-medium模型擁有14億參數,但單結構計算僅用約5000萬參數,大大提高了推理速度。UMA模型無需微調,僅通過預訓練即可應對多種化學任務,其性能甚至超越了現有的專用模型。
研究表明,UMA在分子特性預測、材料設計、觸媒開發、能量存儲及半導體制造等領域均表現出色。其高精度與快速計算能力為科學研究和工業應用開辟了新的路徑,推動了跨領域的技術革新。這一成果的發布,無疑將為化學研究注入新的活力,促進化學領域的快速發展。