黃錦輝：利用外部知識優化ChatGPT效能

文｜黃錦輝

ChatGPT被大眾視為一個智能專家，這位專家博學多才，既能解答用戶的問題，亦能創作，在各行各業大受歡迎。例如，它可以化身成為公司老闆的私人助理，因應不同會議的需求編寫會議紀錄；或是充當前線記者的寫手，因應不同事件撰寫新聞；或是應用於醫療診斷中，因應病人的症狀為醫生提供初診報告；或是在教學中充當教授的教學助理，因應課程所需編寫教材等。

然而，通用版的ChatGPT只能調用它背後的“大型語言模型”（LLM）知識，但LLM並非萬能，往往對解答專業問題力有不足，未能提供準確答案。歸根究柢，現實中ChatGPT僅是一套“智能助理”系統，用戶須對它生成的作品進行仔細的校對，以確保所產出内容的可靠性。針對此問題，人工智能科學家研究如何在“智能助理”操作的三個不同階段，進行效能優化。

人工智能的研發目的是模仿人類的行為和智慧，終極達至“機器代人”。ChatGPT是一套“生成式人工智能”（GenAI）系統，在應用上它充當“智能助理”角色。要了解ChatGPT操作背後的邏輯，便先要了解實體人的處事方法。以顧問工作為例，（1）用戶向助理提出問題（查詢），助理首先要理解查詢的需求（語意，Semantics）；（2）之後便根據需求，並利用自己的知識去生成答䅁；（3）但在尋找答案的過程之中，一旦助理發現自己知識不足（出現這情況的其中一個原因是現存的知識並不與時並進），便會去圖書館（或上網）搜索補充資料。ChatGPT正是把這三個步驟自動化（智能化），建造一個智能助理機器人。

在系統建造階段，工程師利用深度機器學習方法，製造垂直領域的大語言模型，這做法尤如學術界特意地編寫一本專業領域（例如醫學）的字典。不過要重新進行機器學習成本不菲，需要大量數據及算力，而且費時及耗能，做法不利中小微企業。

在“提示”（Prompt）處理階段中，“智能助理”接收了用戶輸入的“提示”之後，若發現資料不足，系統便先進行優化，補充相關資料，才進行内容生成。舉例，病人A住在醫院已多日，醫生要為他診症，便利用ChatGPT“智能醫療助理”去先了解A的症狀，例如包括收集A過去幾天的臨床電子記錄，豐富“提示”的表達能力，然後通過醫療領域“大型語言模型”，生成初部診斷報告作參考。

在生成輸出階段，（Retrieval Augmented Generation, RAG）技術對“大型語言模型”的輸出進行優化，使ChatGPT在生成“響應”（Response）輸出之前，引用通過訓練而獲得的“内部知識”（Internal Knowledge），再添加通過“信息檢索”（Information Retrieval, IR）從其他權威資料庫（例如“維基百科”）獲取“大型語言模型”之外的“外部知識”（External Knowledge），讓輸出的生成内容更豐富可靠。與“大型語言模型”前期知識訓練方案比較，“檢索增强生成”可以彌補自身内部知識之不足，以及内部知識過時的現象，保持ChatGPT在不同應用場景上，生成響應的相關性、準確性及實時性；而且做法比重新訓練更便宜，讓中小微型企業負擔得起。

針對上述的操作，“人工智能體”（AI Agent）成為當前人工智能研究領域的熱門，目標是有效落實“提示優化”及“檢索增强生成”技術與“生成式人工智能”的無縫結合。簡單而言，“智能體”根據用戶“提示”的要求，以及外部環境的數據（例如病人電子記錄），作出内部知識（LLM）與外部知識的内容分析和選擇，然後合併生成最符合目標的響應。

（作者係立法會議員、香港中文大學工程學院副院長（外務）、香港專業及資深行政人員協會副會長，文章觀點僅代表作者本人）

黃錦輝：利用外部知識 優化ChatGPT效能

黃錦輝：利用外部知識優化ChatGPT效能