Google最新開源翻譯模型精準翻譯55種語言-紫荊網

Google最新開源翻譯模型精準翻譯55種語言

日期:2026-01-16 來源:hket 瀏覽量: 字號:
分享到
用微信掃描二維碼

生成式AI崛起,開源翻譯模型的競爭也更為劇烈,緊隨OpenAI推出ChantGPT Translate,Google也推出了全新TranslateGemma。翻譯模型基於Gemma 3構建,涵蓋55種語言,提供4B、12B及27B三種參數,幫助用家跨越語言障礙。

Google表示,已針對55 種語言嚴謹訓練TranslateGemma,涵蓋主要語言以及低資源語言,與Gemma 基礎版模型相比,TranslateGemma 在所有語言中的錯誤率均顯著降低。同時,Google將就著近500種語言訓練TranslateGemma,讓研究人員以TranslateGemma為基礎平台,針對特定語言訓練出尖端模型。

以低參數實現高吞吐

評測上,新模型的表現也頗為出色。在WMT24++基準測試中,以MetricX指標衡量,TranslateGemma 12B版本表現超越Gemma 3 27B模型。換言之,只需使用基礎版Gemma的一半參數,即可實現更高吞吐量,以及更低遲延。

另外,在Vistra 圖像翻譯基準測試中,即使TranslateGemma並未進行多模態微調,其在圖像內翻譯文字的表現依然有所上升。

是次TranslateGemma性能得以提升,乃是得益於Google的兩項微調流程。首先,Google利用監督式微調(SFT),運用豐富的人類翻譯文本,以及Gemini模型生成的高質素翻譯調整基礎Gemma 3模型。其次是,Google透過強化學習(RL),結合多個獎勵模型,使Gemma 3的翻譯更自然流暢。

TranslateGemma已經開放使用,所有用戶均可在Kaggle和於 Hugging Face平台下載體驗,或者進行二次開發。

來源:hket

掃描二維碼分享到手機

編輯:劉雨桐 校對:江心雨 監製:姚潤澤
4月5日起中國內地航線燃油附加費將上調
紫荊時評|唱衰論調可休矣!
Token:完善全球數據治理的突破口
我國科研人員發現99個新物種
紫荊雜誌
影響有影響力的人