Google最新開源翻譯模型精準翻譯55種語言-紫荊網

Google最新開源翻譯模型精準翻譯55種語言

日期：2026-01-16 來源：hket 瀏覽量：字號：大中小

分享到

生成式AI崛起，開源翻譯模型的競爭也更為劇烈，緊隨OpenAI推出ChantGPT Translate，Google也推出了全新TranslateGemma。翻譯模型基於Gemma 3構建，涵蓋55種語言，提供4B、12B及27B三種參數，幫助用家跨越語言障礙。

Google表示，已針對55 種語言嚴謹訓練TranslateGemma，涵蓋主要語言以及低資源語言，與Gemma 基礎版模型相比，TranslateGemma 在所有語言中的錯誤率均顯著降低。同時，Google將就著近500種語言訓練TranslateGemma，讓研究人員以TranslateGemma為基礎平台，針對特定語言訓練出尖端模型。

以低參數實現高吞吐

評測上，新模型的表現也頗為出色。在WMT24++基準測試中，以MetricX指標衡量，TranslateGemma 12B版本表現超越Gemma 3 27B模型。換言之，只需使用基礎版Gemma的一半參數，即可實現更高吞吐量，以及更低遲延。

另外，在Vistra 圖像翻譯基準測試中，即使TranslateGemma並未進行多模態微調，其在圖像內翻譯文字的表現依然有所上升。

是次TranslateGemma性能得以提升，乃是得益於Google的兩項微調流程。首先，Google利用監督式微調（SFT），運用豐富的人類翻譯文本，以及Gemini模型生成的高質素翻譯調整基礎Gemma 3模型。其次是，Google透過強化學習（RL），結合多個獎勵模型，使Gemma 3的翻譯更自然流暢。

TranslateGemma已經開放使用，所有用戶均可在Kaggle和於 Hugging Face平台下載體驗，或者進行二次開發。