
生成式AI崛起,開源翻譯模型的競爭也更為劇烈,緊隨OpenAI推出ChantGPT Translate,Google也推出了全新TranslateGemma。翻譯模型基於Gemma 3構建,涵蓋55種語言,提供4B、12B及27B三種參數,幫助用家跨越語言障礙。
Google表示,已針對55 種語言嚴謹訓練TranslateGemma,涵蓋主要語言以及低資源語言,與Gemma 基礎版模型相比,TranslateGemma 在所有語言中的錯誤率均顯著降低。同時,Google將就著近500種語言訓練TranslateGemma,讓研究人員以TranslateGemma為基礎平台,針對特定語言訓練出尖端模型。
以低參數實現高吞吐
評測上,新模型的表現也頗為出色。在WMT24++基準測試中,以MetricX指標衡量,TranslateGemma 12B版本表現超越Gemma 3 27B模型。換言之,只需使用基礎版Gemma的一半參數,即可實現更高吞吐量,以及更低遲延。
另外,在Vistra 圖像翻譯基準測試中,即使TranslateGemma並未進行多模態微調,其在圖像內翻譯文字的表現依然有所上升。
是次TranslateGemma性能得以提升,乃是得益於Google的兩項微調流程。首先,Google利用監督式微調(SFT),運用豐富的人類翻譯文本,以及Gemini模型生成的高質素翻譯調整基礎Gemma 3模型。其次是,Google透過強化學習(RL),結合多個獎勵模型,使Gemma 3的翻譯更自然流暢。
TranslateGemma已經開放使用,所有用戶均可在Kaggle和於 Hugging Face平台下載體驗,或者進行二次開發。
今日熱搜
查看更多



