理大發布全球首創協作AI新範式首次提出並驗證「模型融合縮放定律」

日期：2025-10-26 來源：紫荊號瀏覽量：字號：大中小

分享到

近年來，#人工智能（AI）的浪潮席捲全球。從傳統機器學習到生成式人工智能，其強大的能力不斷刷新着人們的想象。然而，在這場技術盛宴背後，巨大的門檻卻將無數創新者拒之門外。千萬美元的訓練成本、上萬塊高端顯卡的算力需求，讓普通科研人員、中小企業乃至許多高校實驗室望而卻步。

為了重塑大模型訓練新格局、推動技術民主化的開創性發展，10月23日，香港理工大學舉行新聞發布會，發布由香港理工大學人工智能高等研究院執行院長、計算機及數學科學學院副院長（環球事務）及電子計算學系#楊紅霞教授領導的「協作生成人工智能（Co-GenAI）」項目取得的突破性研究成果。理大高級副校長（研究及創新）趙汝恆教授一同出席新聞發布會。

楊紅霞教授及其科研團隊研發全球首個開源「端到端FP8低比特訓練全套方案」，讓AI開發「輕而易舉」；首次提出併科學驗證了「模型融合縮放定律」，使得AI模塊的「樂高式」組合成為現實。楊教授團隊還推出基於協作AI框架InfiAgent的可以執行全流程科研任務的多智能體系統InfiResearcher，以及可以實現普惠、精準的智能醫療診斷的專用多模態大模型——InfiMed。

楊紅霞教授是全球知名的人工智能專家，在認知智能、基礎模型等領域擁有深厚的研究積累。今年7月，她領導的「協作生成人工智能（Co-GenAI）」項目獲得香港研究資助局「2025/26年度主題研究計劃」高達6,260萬港元的重磅資助。短短兩個多月，項目團隊便迅速將科學藍圖轉化為落地成果，展現出驚人的「理大速度」。

楊紅霞教授領導的「協作生成人工智能項目」今年7月獲香港研資局「2025/26主題研究計劃」資助。

理大協作AI新範式的正式發布，實現了兩大世界級技術的顛覆性突破，開啟了AI「協作共贏」新紀元。這不僅讓AI成為人人蔘與、人人受益的公共智能，還為AI在教育、醫療、科研、產業等關鍵領域的普惠應用帶來社會價值。

以往AI的開發模式，如同「鉅艦獨航」。由一家大公司傾盡資源，打造一個無所不包的龐大模型，再開放給全世界使用。

理大發布的協作生成人工智能開創了「聯合艦隊」的新範式。它允許不同領域的專業機構——無論是醫院、律師事務所還是教育機構，都能根據自身獨特的業務需求和數據，訓練出高度專業化的「專家模型」。

這些各有所長的模型，再通過一套科學的智能融合機制，匯聚成一個能力更全面、更強大的通用智能「超級團隊」，構建前所未有的開放協作新生態。

協作生成人工智能允許不同領域的專業機構根據自身需求，訓練出高度專業化的「專家模型」。

楊紅霞教授率領團隊從人工智能訓練到模型融合，實現了兩大世界級技術突破。全球首個開源「端到端FP8低比特訓練全套方案」，讓AI開發「輕而易舉」；提出並驗證「模型融合縮放定律」，讓AI模塊組合成為現實。

針對AI訓練成本高昂的痛點，理大團隊研發了全球首個開源「端到端FP8低比特訓練全套方案」，讓訓練AI像安裝APP一樣簡單。它通過一種革命性的低比特技術，在幾乎不損失模型精度的前提下，實現驚人的效率提升。其中包括：與業界主流BF16對比，訓練速度提升最高達22%，顯存峰值佔用節省最高達14%，端到端吞吐量增加最高達19%，硬件與時間成本大幅下降四大關鍵性能指標。這一突破提供了一套鏈路完整、工程可落地、精度可保證、指標可復現的全新範式，標誌着過去必須在大型數據中心才能進行的頂尖AI訓練，如今在中小規模的GPU集群上即可高效實現。

以往將多個AI模型高效地融合成更強大的整體，很大程度需要依賴經驗，且效果難以預測。Thinking Machines Lab倡導的Model Merging的理念，由理大團隊首次理論上驗證了可行性。研究團隊通過嚴謹的數學推導，提出了「模型融合縮放定律」(Model Merging Scaling Law)，並給出了可精確預測融合效果的數學公式，讓模型融合從此有章可循。該定律在橫跨9個領域、4種融合方法、總計10,506個融合模型上得到了驗證，擬合優度（R²）超過0.98 ，展現了極高的科學性與普適性。這一定律的發現，使得AI模塊的「樂高式」組合成為現實。開發者可以根據實際需求，敏捷、高效地組合少數幾個核心專家模型，快速獲得高分可用的解決方案，極大提升了AI應用的迭代速度與靈活性。

憑藉驚人的研發效率，理大團隊已將理論突破迅速轉化為前沿應用。他們研發出能發頂級會論文AI科研工作流InfiResearcher及低資源下性能卓越的AI醫療模型InfiMed。

作為一個支持高度協同的協作AI框架，InfiAgent衍生的多智能體AI團隊InfiResearcher能夠自動化執行從文獻綜述、研究點子生成，到實驗執行、論文撰寫全流程的科研任務。此外，InfiAgent強大的能力在多項標準基準測試（如DROP、GSM8K）中表現優異，在支持任務複雜度，泛化能力和生成報告質量上均取得重大突破。

InfiAgent的革命性架構一目瞭然：一個基於有向無環圖（DAG）的金字塔式多智能體系統。其核心在於「智能體即工具」（Agent-as-a-Tool）的機制，能智能地將複雜任務進行自動化分解與分配。

專用多模態AI——InfiMed，通過創新的低資源訓練範式，僅以30億參數的輕量級規模，就在七大國際醫療基準測試中，取得了平均59.2%的準確率，超過目前業界發布同等尺寸最優模型。

Qwen2.5-VL-3B 和 InfiMed 系列模型在醫學視覺問答（VQA）上的案例研究。

這一成果充分證明在有限的資源下，也能夠訓練出頂尖的AI醫療模型，為實現普惠、精準的智能醫療診斷提供切實可行的道路。InfiMed模型未來能讓世界頂級的AI醫療診斷輔助系統，運行在更輕量、更普惠的硬件上，將尖端醫療智慧下沉到社區醫院，惠及更多民眾。

楊紅霞教授指出：「以超低資源實現基礎模型訓練，加上高效模型融合，可助全球學術人員投入GenAI研究，匯聚更多力量創新。」

趙汝恆教授表示：「人工智能是加速培育新質生產力的核心，理大新成立的人工智能高等研究院（PAAI）致力加速人工智能技術在各個重點領域的深度融合，並針對不同行業開發具備專業領域知識的人工智能模型。此舉不但能鞏固理大在相關領域的領先地位，更將助力推動香港成為全球生成式人工智能發展的樞紐。」

協作AI新範式的發布不止於技術本身，更預示一個新時代的到來：人工智能將不再是少數巨頭的壟斷工具，而是如同互聯網一般，成為人人皆可參與、創造和共享的公共基礎設施。如同通向未來的「加速器」，協作生成人工智能讓大模型開發由此擺脫「單打獨鬥」的昂貴競賽，邁向一個開放、融合、協作共贏的全新紀元。

理大發布全球首創協作AI新範式 首次提出並驗證「模型融合縮放定律」

理大發布全球首創協作AI新範式首次提出並驗證「模型融合縮放定律」