人工智能早於上世紀五十年代於美國面世。1956年一班權威科學家在美國「達特茅斯會議」(Dartmouth Workshop)聚首,會議中首次制定人工智能研究計劃。計劃的目標是鼓勵電腦科學界着力研發能夠擁有人類智能的機器(軟硬件)。可是經過60多年的努力,機器代人的目標離開現實還是有點距離。今天人工智能的通用性仍然偏低,只可以在特定領域及重複性極高的任務上派其用場,實際上應用範圍頗為局限。
《三字經》云:「玉不琢,不成器 ;人不學,不知義」,不論怎樣,機器要模仿人類必須首先懂得學習。因此,「機器學習」是人工智能的核心技術,而且電腦科學界一直精益求精,努力不懈地把這技術強化。上世紀由於軟硬件設施的限制,「機器學習」技術的進展緩慢,影響了人工智能的發展。不過,近10年隨着軟件(例如深度學習,Deep Learning, DL)及硬件(例如圖形處理器,Graphic Processing Unit, GPU)科技的突飛猛進,人工智能的功能得以大大提升,其應用亦日益普及,圖像處理、語音識別、自然語言處理等商業應用像雨後春荀般湧現,全球無處不在。然而在商言商,企業家往往為了盡快把產品及服務推出市場會不惜一切,罔顧「機器學習」中的一些技術盲點。此舉會影響產品及服務的質量,增加用戶在使用時的安全風險。
孔子《論語.為政》道:「學而不思則罔,思而不學則殆。」從軟件工程角度而言,一套高效的人工智能系統設計是不能單憑既定規則(Rule-based)的,不然的話所造出來的系統的覆蓋率便會很低,影響系統的可靠性。因此,先進的人工智能系統都是建於「機器學習」,這結論與上述觀點不謀而合。然而,過程中機器不能只顧「硬學習」,對所學的知識不求甚解,面對錯誤的知識仍「照單全收」。這陋習正是今天大行其道之「深度學習」技術的通病。簡單而言,「深度學習」是以「黑盒」(即不透明)方式作業,為輸入和輸出進行配對,做法只計效果而並沒有探究配對成功的原因。可惜商人一般都急功近利,只顧盡快把產品推出市場而忽略這技術上的漏洞,導致產品的功能大受影響(「罔」),可靠性受損。晉朝哲學家傅玄在《太子少傅箴》中指出:「近朱者赤,近墨者黑」,因此有效學習需要學與思並重,可是現時的「深度學習」卻未能做到。在現實應用中工程師一旦發現人工智能系統失效,他才會重新進行學習,把系統效能更新,但新舊系統交替需時,往往數以月計,效果大受影響,不設實際。
俗語說:「熟讀唐詩三百首,不會作詩也會吟。」不論採用什麼算法,「機器學習」背後的操作模型主要是基於這概念。例如,人工智能可以學習巴赫的音樂,然後用它的風格來編新曲,而一般人都難以分辨出巴赫的真偽。概括而言,要模仿一些重複性較高的應用「機器學習」綽綽有餘,不過如此這般的「機器化」學習(learning mechanically)卻無法表達人類的情感和創意,但這正是人類「智能」的重要特質。
最後,《論語.學而》曰:「學而時習之,不亦悦乎。」仿效人類,人工智能系統一經開發後要盡快付諸應用,並以滿足用戶需求為首要任務。但「學無止境」,所以人工智能系統亦應持續學習,就此上述「機器學習」、「深度學習」所面對的學習問題非常迫切,必須盡早解決,不然的話全球人工智能發展便難免會受阻。
(文章觀點僅代表作者本人)
作者為香港中文大學工程學院副院長(外務)、香港資訊科技聯會榮譽會長
來源:信報