文|黃錦輝
ChatGPT被大眾視為一個智能專家,這位專家博學多才,既能解答用戶的問題,亦能創作,在各行各業大受歡迎。例如,它可以化身成為公司老闆的私人助理,因應不同會議的需求編寫會議紀錄;或是充當前線記者的寫手,因應不同事件撰寫新聞;或是應用於醫療診斷中,因應病人的症狀為醫生提供初診報告;或是在教學中充當教授的教學助理,因應課程所需編寫教材等。
然而,通用版的ChatGPT只能調用它背後的“大型語言模型”(LLM)知識,但LLM並非萬能,往往對解答專業問題力有不足,未能提供準確答案。歸根究柢,現實中ChatGPT僅是一套“智能助理”系統,用戶須對它生成的作品進行仔細的校對,以確保所產出内容的可靠性。針對此問題,人工智能科學家研究如何在“智能助理”操作的三個不同階段,進行效能優化。
人工智能的研發目的是模仿人類的行為和智慧,終極達至“機器代人”。ChatGPT是一套“生成式人工智能”(GenAI)系統,在應用上它充當“智能助理”角色。要了解ChatGPT操作背後的邏輯,便先要了解實體人的處事方法。以顧問工作為例,(1)用戶向助理提出問題(查詢),助理首先要理解查詢的需求(語意,Semantics);(2)之後便根據需求,並利用自己的知識去生成答䅁;(3)但在尋找答案的過程之中,一旦助理發現自己知識不足(出現這情況的其中一個原因是現存的知識並不與時並進),便會去圖書館(或上網)搜索補充資料。ChatGPT正是把這三個步驟自動化(智能化),建造一個智能助理機器人。
在系統建造階段,工程師利用深度機器學習方法,製造垂直領域的大語言模型,這做法尤如學術界特意地編寫一本專業領域(例如醫學)的字典。不過要重新進行機器學習成本不菲,需要大量數據及算力,而且費時及耗能,做法不利中小微企業。
在“提示”(Prompt)處理階段中,“智能助理”接收了用戶輸入的“提示”之後,若發現資料不足,系統便先進行優化,補充相關資料,才進行内容生成。舉例,病人A住在醫院已多日,醫生要為他診症,便利用ChatGPT“智能醫療助理”去先了解A的症狀,例如包括收集A過去幾天的臨床電子記錄,豐富“提示”的表達能力,然後通過醫療領域“大型語言模型”,生成初部診斷報告作參考。
在生成輸出階段,(Retrieval Augmented Generation, RAG)技術對“大型語言模型”的輸出進行優化,使ChatGPT在生成“響應”(Response)輸出之前,引用通過訓練而獲得的“内部知識”(Internal Knowledge),再添加通過“信息檢索”(Information Retrieval, IR)從其他權威資料庫(例如“維基百科”)獲取“大型語言模型”之外的“外部知識”(External Knowledge),讓輸出的生成内容更豐富可靠。與“大型語言模型”前期知識訓練方案比較,“檢索增强生成”可以彌補自身内部知識之不足,以及内部知識過時的現象,保持ChatGPT在不同應用場景上,生成響應的相關性、準確性及實時性;而且做法比重新訓練更便宜,讓中小微型企業負擔得起。
針對上述的操作,“人工智能體”(AI Agent)成為當前人工智能研究領域的熱門,目標是有效落實“提示優化”及“檢索增强生成”技術與“生成式人工智能”的無縫結合。簡單而言,“智能體”根據用戶“提示”的要求,以及外部環境的數據(例如病人電子記錄),作出内部知識(LLM)與外部知識的内容分析和選擇,然後合併生成最符合目標的響應。
(作者係立法會議員、香港中文大學工程學院副院長(外務)、香港專業及資深行政人員協會副會長,文章觀點僅代表作者本人)