人工智能系統建基於「大模型」訓練,背後大數據的質量至關重要。烏克蘭人工智能武器在訓練中採用了大量「合成數據」(Synthetic Data)。「合成數據」是一種模仿真實世界數據,利用「生成式人工智能」(GenAI)技術而生成的。生產商使用「合成數據」進行研究、測試、新開發和機器學習。然而,要注意的是,盡管先進技術讓「合成數據」的生成變得高效且快速,但「垃圾入垃圾出」(Garbage In Garbage Out),因此「合成數據」的質量對生成系統至為關鍵。不過,烏克蘭所生產的人工智能武器所採用的「合成數據」質素成疑,更有些是基於模擬器所產出的資訊;這些數據測試不足,嚴重影響武器的可靠性。
「前車可鑑」,且看下述「巴以衝突」中以軍誤炸,便是人工智能武器失靈的好案例。據獨立綫上新聞媒體「+972雜誌」報道,以色列在加沙攻擊中多次採用一套命名為「薰衣草」(Lavender)的人工智能系統來辨識加沙地區內的襲擊目標。然而,「薰衣草」的準確率只得90%,即是說它在辨別襲擊目標時有10%誤判的機會。這導致近期「世界中央廚房」(World Central Kitchen,WCK)人道主義援助車隊被誤炸,三部車輛上的WCK標誌非常之明顯,而且車與車之間亦保持了一定的距離,在這些條件之下,以軍的人工智能系統仍然會出錯,「誤中副車」,效果實在不可思議,令人不寒而慄!
人工智能系統建基於「大模型」訓練,背後大數據的質量至關重要。烏克蘭人工智能武器在訓練中採用了大量「合成數據」(Synthetic Data)。「合成數據」是一種模仿真實世界數據,利用「生成式人工智能」(GenAI)技術而生成的。生產商使用「合成數據」進行研究、測試、新開發和機器學習。然而,要注意的是,盡管先進技術讓「合成數據」的生成變得高效且快速,但「垃圾入垃圾出」(Garbage In Garbage Out),因此「合成數據」的質量對生成系統至為關鍵。不過,烏克蘭所生產的人工智能武器所採用的「合成數據」質素成疑,更有些是基於模擬器所產出的資訊;這些數據測試不足,嚴重影響武器的可靠性。
「前車可鑑」,且看下述「巴以衝突」中以軍誤炸,便是人工智能武器失靈的好案例。據獨立綫上新聞媒體「+972雜誌」報道,以色列在加沙攻擊中多次採用一套命名為「薰衣草」(Lavender)的人工智能系統來辨識加沙地區內的襲擊目標。然而,「薰衣草」的準確率只得90%,即是說它在辨別襲擊目標時有10%誤判的機會。這導致近期「世界中央廚房」(World Central Kitchen,WCK)人道主義援助車隊被誤炸,三部車輛上的WCK標誌非常之明顯,而且車與車之間亦保持了一定的距離,在這些條件之下,以軍的人工智能系統仍然會出錯,「誤中副車」,效果實在不可思議,令人不寒而慄!