理大發布全球首創協作AI新範式 首次提出並驗證「模型融合縮放定律」

理大發布全球首創協作AI新範式 首次提出並驗證「模型融合縮放定律」

日期:2025-10-26 來源:紫荊號 瀏覽量: 字號:
分享到
用微信掃描二維碼

近年來,#人工智能(AI)的浪潮席捲全球。從傳統機器學習到生成式人工智能,其強大的能力不斷刷新着人們的想象。然而,在這場技術盛宴背後,巨大的門檻卻將無數創新者拒之門外。千萬美元的訓練成本、上萬塊高端顯卡的算力需求,讓普通科研人員、中小企業乃至許多高校實驗室望而卻步。

為了重塑大模型訓練新格局、推動技術民主化的開創性發展,10月23日,香港理工大學舉行新聞發布會,發布由香港理工大學人工智能高等研究院執行院長、計算機及數學科學學院副院長(環球事務)及電子計算學系#楊紅霞教授領導的「協作生成人工智能(Co-GenAI)」項目取得的突破性研究成果。理大高級副校長(研究及創新)趙汝恆教授一同出席新聞發布會。

楊紅霞教授及其科研團隊研發全球首個開源「端到端FP8低比特訓練全套方案」,讓AI開發「輕而易舉」;首次提出併科學驗證了「模型融合縮放定律」,使得AI模塊的「樂高式」組合成為現實。楊教授團隊還推出基於協作AI框架InfiAgent的可以執行全流程科研任務的多智能體系統InfiResearcher,以及可以實現普惠、精準的智能醫療診斷的專用多模態大模型——InfiMed。

楊紅霞教授是全球知名的人工智能專家,在認知智能、基礎模型等領域擁有深厚的研究積累。今年7月,她領導的「協作生成人工智能(Co-GenAI)」項目獲得香港研究資助局「2025/26年度主題研究計劃」高達6,260萬港元的重磅資助。短短兩個多月,項目團隊便迅速將科學藍圖轉化為落地成果,展現出驚人的「理大速度」。

楊紅霞教授領導的「協作生成人工智能項目」今年7月獲香港研資局「2025/26主題研究計劃」資助。

理大協作AI新範式的正式發布,實現了兩大世界級技術的顛覆性突破,開啟了AI「協作共贏」新紀元。這不僅讓AI成為人人蔘與、人人受益的公共智能,還為AI在教育、醫療、科研、產業等關鍵領域的普惠應用帶來社會價值。

理大團隊僅用兩個多月便將科學藍圖轉化為落地成果,展現出驚人的「理大速度」。

以往AI的開發模式,如同「鉅艦獨航」。由一家大公司傾盡資源,打造一個無所不包的龐大模型,再開放給全世界使用。

理大發布的協作生成人工智能開創了「聯合艦隊」的新範式。它允許不同領域的專業機構——無論是醫院、律師事務所還是教育機構,都能根據自身獨特的業務需求和數據,訓練出高度專業化的「專家模型」。

這些各有所長的模型,再通過一套科學的智能融合機制,匯聚成一個能力更全面、更強大的通用智能「超級團隊」,構建前所未有的開放協作新生態。

協作生成人工智能允許不同領域的專業機構根據自身需求,訓練出高度專業化的「專家模型」。

楊紅霞教授率領團隊從人工智能訓練到模型融合,實現了兩大世界級技術突破。全球首個開源「端到端FP8低比特訓練全套方案」,讓AI開發「輕而易舉」;提出並驗證「模型融合縮放定律」,讓AI模塊組合成為現實。

楊紅霞教授團隊實現兩大世界級技術突破。

針對AI訓練成本高昂的痛點,理大團隊研發了全球首個開源「端到端FP8低比特訓練全套方案」,讓訓練AI像安裝APP一樣簡單。它通過一種革命性的低比特技術,在幾乎不損失模型精度的前提下,實現驚人的效率提升。其中包括:與業界主流BF16對比,訓練速度提升最高達22%,顯存峰值佔用節省最高達14%,端到端吞吐量增加最高達19%,硬件與時間成本大幅下降四大關鍵性能指標。這一突破提供了一套鏈路完整、工程可落地、精度可保證、指標可復現的全新範式,標誌着過去必須在大型數據中心才能進行的頂尖AI訓練,如今在中小規模的GPU集群上即可高效實現。

FP8 vs BF16 訓練流程。

以往將多個AI模型高效地融合成更強大的整體,很大程度需要依賴經驗,且效果難以預測。Thinking Machines Lab倡導的Model Merging的理念,由理大團隊首次理論上驗證了可行性。研究團隊通過嚴謹的數學推導,提出了「模型融合縮放定律」(Model Merging Scaling Law),並給出了可精確預測融合效果的數學公式,讓模型融合從此有章可循。該定律在橫跨9個領域、4種融合方法、總計10,506個融合模型上得到了驗證,擬合優度(R²)超過0.98 ,展現了極高的科學性與普適性。這一定律的發現,使得AI模塊的「樂高式」組合成為現實。開發者可以根據實際需求,敏捷、高效地組合少數幾個核心專家模型,快速獲得高分可用的解決方案,極大提升了AI應用的迭代速度與靈活性。

模型融合與多任務學習(MultiTask)性能分析。

憑藉驚人的研發效率,理大團隊已將理論突破迅速轉化為前沿應用。他們研發出能發頂級會論文AI科研工作流InfiResearcher及低資源下性能卓越的AI醫療模型InfiMed。

作為一個支持高度協同的協作AI框架,InfiAgent衍生的多智能體AI團隊InfiResearcher能夠自動化執行從文獻綜述、研究點子生成,到實驗執行、論文撰寫全流程的科研任務。此外,InfiAgent強大的能力在多項標準基準測試(如DROP、GSM8K)中表現優異,在支持任務複雜度,泛化能力和生成報告質量上均取得重大突破。

InfiAgent的革命性架構一目瞭然:一個基於有向無環圖(DAG)的金字塔式多智能體系統。其核心在於「智能體即工具」(Agent-as-a-Tool)的機制,能智能地將複雜任務進行自動化分解與分配。

專用多模態AI——InfiMed,通過創新的低資源訓練範式,僅以30億參數的輕量級規模,就在七大國際醫療基準測試中,取得了平均59.2%的準確率,超過目前業界發布同等尺寸最優模型。

Qwen2.5-VL-3B 和 InfiMed 系列模型在醫學視覺問答(VQA)上的案例研究。

這一成果充分證明在有限的資源下,也能夠訓練出頂尖的AI醫療模型,為實現普惠、精準的智能醫療診斷提供切實可行的道路。InfiMed模型未來能讓世界頂級的AI醫療診斷輔助系統,運行在更輕量、更普惠的硬件上,將尖端醫療智慧下沉到社區醫院,惠及更多民眾。

InfiMed模型未來能讓世界頂級的AI醫療診斷輔助系統,運行在更輕量、更普惠的硬件上。

楊紅霞教授指出:「以超低資源實現基礎模型訓練,加上高效模型融合,可助全球學術人員投入GenAI研究,匯聚更多力量創新。」

趙汝恆教授(左)與楊紅霞教授(右)出席新聞發布會。

趙汝恆教授表示:「人工智能是加速培育新質生產力的核心,理大新成立的人工智能高等研究院(PAAI)致力加速人工智能技術在各個重點領域的深度融合,並針對不同行業開發具備專業領域知識的人工智能模型。此舉不但能鞏固理大在相關領域的領先地位,更將助力推動香港成為全球生成式人工智能發展的樞紐。」

趙教授表示理大成立PAAI推動香港成為全球生成式人工智能發展的樞紐。

協作AI新範式的發布不止於技術本身,更預示一個新時代的到來:人工智能將不再是少數巨頭的壟斷工具,而是如同互聯網一般,成為人人皆可參與、創造和共享的公共基礎設施。如同通向未來的「加速器」,協作生成人工智能讓大模型開發由此擺脫「單打獨鬥」的昂貴競賽,邁向一個開放、融合、協作共贏的全新紀元。

協作生成人工智能讓大模型開發邁向開放、融合、協作共贏的全新紀元。

來源:紫荊號

掃描二維碼分享到手機

商務部就中美吉隆坡經貿磋商聯合安排答問
習近平同美國總統特朗普在釜山舉行會晤
國務院總理李強署名文章:“十五五”時期經濟社會發展的指導方針
特朗普:美中會達成更多共識
紫荊雜誌
影響有影響力的人