聚焦大灣區：MatChat中國首秀無機材料領域大模型創新發布-紫荊網

紫荊雜誌（記者彭彥）2月20日東莞報道：在2月15日這個寧靜的周六，當大多數人還沉浸在周末的閒暇之中，東莞鬆山湖材料實驗室的一隅，卻正悄然上演着科技與創新的交響曲。

MatChat問世：實現高效而精準的體驗

在這間燈火通明的辦公室裡，鬆山湖材料實驗室與中國科學院物理研究所的傑出研究員、博士生導師劉淼，正全神貫注地探索着無機材料的奧祕。他的指尖輕觸鍵盤，點開MatChat這一革命性的智能平台，輸入一個困擾學界已久的無機材料問題。隨着鼠標的輕輕一點，屏幕上瞬間綻放出一系列精準無誤、邏輯嚴密的化學反應方程式，它們不僅準確無誤，更具備“無幻覺”的特質——即所有推導均可追溯至其原始學術論文，確保信息的權威性與可靠性。

“落地東莞鬆山湖以來，經過7年的研發，2023年下半年開始，我們全力投入這一無機材料AI助手的研發，今年2月9日上線首周，即吸引超5000名用戶注冊，26萬次專業提問。”劉淼在接受記者採訪時表示，這一大模型的成功上線和鬆山湖材料實驗室體制機制創新，以及東莞和鬆山湖大力支持密不可分。它不僅是一個工具，更是一個潛力無限的科研助手，預示着在人工智能與材料科學深度融合的新時代，科研範式即將迎來一場前所未有的顛覆性變革。

MatChat的出現，不僅極大地提高無機材料研究的效率與準確性，更是為科研人員開闢一條通往未知領域的全新路徑。在這個信息爆炸的時代，它如同一座燈塔，照亮科研工作者在浩瀚知識海洋中航行的方向，讓探索未知的過程變得更加高效而精準。

28萬篇論文：打破AI幻覺

“2018年我剛來到鬆山湖材料實驗室從事科研工作時，就喜歡上東莞的氣候環境。”2月15日，在鬆山湖材料實驗室的辦公室裡，劉淼告訴記者。

2018年鬆山湖實驗室成立之初，便前瞻性地意識到數據和人工智能的重要性，成立材料計算與數據庫平台。2023年初，ChatGPT3.5火起來後，劉淼敏銳地發現這一大模型解析文字的強大功能。

2023年6月，國外科學家利用一種叫做“自然語言處理（NLP，natural language processing）”的人工智能技術，從400萬篇論文提取了3萬條材料合成方案數據；與此同時，美國的meta公司發布一款開源大語言模型。劉淼團隊看到機會，將二者結合，研發專注於無機材料合成路徑預測的初代AI工具—MatChat。“當時團隊在這類模型基礎上進行再訓練後發現，模型可以幫科研人員配好化學反應方程式，大大提升工作效率。”

這些初步的嘗試展現出大語言模型在材料領域的創新潛力和應用空間，為材料研究和創新帶來新的啟發和思路。初代MatChat論文，發表在《中國物理B》，是目前最受歡迎的論文之一。

初代MatChat模型並不完美。科研工作對於準確性的要求極高，但是大語言模型普遍存在的“幻覺”問題，給出的答案存在“臆想”。在業界，幻覺是指大型語言模型（LLM）在缺乏事實依據時，自發生成看似合理實則錯誤的內容。這種現象如同人類做夢時的無意識創造，被形象地稱為“幻覺”。

另外一個問題是如何增加信息量，讓模型掌握更多“知識”。“‘投喂’給大模型的數據越多、越準確，模型會變得越‘聰明’，這是人工智能的規模化法則（scaling law）。”劉淼表示。

隨着技術的發展，兩個問題都有解決方案。利用“檢索增強生成（RAG）”技術，可以避免“幻覺”問題。為解決“數據問題”，劉淼團隊把目光投向預印本（Preprint）。

預印本是指科研工作者的研究成果在尚未經過正式出版物發表之前，出於與同行交流的目的，自願先在學術會議上或通過互聯網發布的科研論文、科技報告等文章。相當於為研究成果打上“時間戳”，確立科研發現的優先權。

“預印本論文通常具有高質量、高準確性，以及創新性的特點。”劉淼表示，“同時，它們也都是開源論文，規避文獻數據的版權爭議。”掃清障礙後，MatChat模型開始再次進化。2024年底，MatChat完成所有準備工作，並在2025年2月9日正式上線。

新版MatChat AI基於大語言模型（LLM）與檢索增強生成（RAG），提取超過28萬篇材料科學、物理、化學論文中的知識，形成無機材料領域的龐大知識庫。

“作為一款專注於材料科學領域的智能問答引擎，上線以來，MatChat AI總用戶數已經超過5000人，42%的用戶超過10次對話，獲得廣泛關注和應用。”劉淼表示。

創新科研範式：引領行業變革

2025年春節，DeepSeek大模型問世，瞬間爆火全球。

與DeepSeek等其他通用大模型不同的是，MatChat AI是一款完全側重於無機材料領域的垂類模型。

用戶可以通過對話形式，獲取知識庫中的材料科學內容。例如：“熱電應用中有哪些不錯的材料體系？”“高溫超導體有哪些材料體系？”“Bloch波方法中，是否可以通過電子束衍射強度求解結構因子？”MatChat AI均可給出可靠的答案。

“挺好的，在我查的電子衍射方面的東西，內容不比通用模型差，而且更簡潔，文獻基本都準確。通用模型的文獻有一半左右是假的。”中國科學院研究員姚湲此前評價道，“我問一些專業問題，竟然還給出公式推導，很強。”

中國科學院贛江創新研究院研究員王路告訴記者，作為材料科學領域的智能“智囊團”，它助力研究人員快速獲取高質量學術信息，讓科研更精準、高效，推動自然科學邁入智能新時代，“作為學術研究工作者，我更傾向於用MatChat，答案都是基於科技論文的結果，而不是亂說的。”

MatChat：科研新範式起點

DeepSeek同樣為MatChat的進化帶來幫助。在劉淼看來，DeepSeek-R1上線之後，其強大的語言理解能力和邏輯思維能力同樣被團隊採用，推動MatChat AI進化升級。“同時，MatChat大模型還運用ChatGPT和通義千問等優秀大模型的功能，取其優勢，自成一體。”

成功推出MatChat大模型的背後，是一支勇於打破學科壁壘的“非主流”團隊。

在這個10人的小團隊裡，材料學家與IT極客並肩作戰，物聯網專家為機器人車間注入靈魂，這種“混血基因”催生出獨特的創新生態，同步孵化出機器人車間、Atomly大模型等協同平台，初步形成“迸發靈感-利用平台找材料-實驗驗證-得出數據”的全鏈條研發生態，打破傳統科研工作的範式。

“可以說，這個大模型是跨界碰撞出的火花。”劉淼揭祕團隊建設哲學，這種柔性人才機制，恰是鬆山湖實驗室創新平台與創新主體實力的一個縮影——跨界才能破界，重構才能催生新的物種。

“這一大模型的成功上線和鬆山湖材料實驗室體制機制創新，以及東莞和鬆山湖大力支持密不可分。正是有這一寬鬆的科研環境，才讓MatChat順利問世。”劉淼坦言，MatChat不是終點，是科研新範式發展的起點。

與此同時，中國科學院院士、鬆山湖材料實驗室主任汪衛華向記者表示，“我深信人工智能還將為科學插上翅膀，讓科學飛得更快。我們團隊一直在這個領域探索，MatChat還只是一個前奏，未來還將會有一系列激動人心的進展。”

未來，MatChat將拓展多語言交互與跨材料預測能力，而它的真正價值，則為當前高水平科技自立自強提供了可複製的範式：通過機制破壁釋放人才活力，依託垂直深耕在人工智能時代先行一步。

在AI重構科研範式的浪潮中，這場始於鬆山湖的“材料革命”，正悄然推動行業向人工智能時代躍遷。劉淼希望，這一大模型能夠給無機材料的從業者帶來幫助，助力行業發展，同時能夠在AI時代，給科學界AI賦能發展提供一個有益的借鑑和參考，共同助力我國科技高水平自立自強。

未來，隨着MatChat的不斷完善與推廣，我們有理由相信，它將引領無機材料乃至更廣泛科研領域進入一個全新的智能時代，開啟一個科研創新的新紀元。