DeepSeek新突破 讓AI擁“遺忘智慧”-紫荊網

DeepSeek新突破 讓AI擁“遺忘智慧”

日期:2025-11-11 來源:《香港經濟日報》 瀏覽量: 字號:
分享到
用微信掃描二維碼

| 黃岳永

DeepSeek近期發表的DeepSeek-OCR,乍聽是光學文字辨識系統,實際卻別開生面。它並非逐字處理,而是將整頁文字化為影像,令模型以較少“token”記住更多內容。

研發團隊的靈感,來自人類的記憶與遺忘機制--隨時間流逝,畫面被再次壓縮,解析度下降,卻換來更高效率。

遺忘非缺陷 而是內在秩序

技術的核心賣點不難理解,用token更少的“視覺詞元”取代逐字紀錄,並能夠輸出可編輯的文字或結構化的內容。想像一下,一整頁A4文件,每個字轉換為數位文字,可能包含1,000個文字token。但如果將這頁文件“拍一張照”,讓AI儲存這張圖,它可能僅需100個“視覺詞元”就能捕捉所有資訊,即是可以將其壓縮10倍;而後要翻查資料進行解碼,模型能達到97%的驚人解碼(OCR)精度。即便在20倍的極限壓縮下,精度仍保持約60%。

這種“模糊化”做法,就如人心的縮影。人類的記憶功能並不像傳統電腦一樣,會記錄每個細節。我大腦會將印象、關鍵資訊和情感連結,而非毫釐不差的細節,簡而言之就是會將記憶重新編碼,以便更有效地儲存它們。DeepSeek-OCR正好提醒我們:遺忘並非缺陷,而是一種內在秩序。

在數碼時代,雲端備份與無限儲存已成常態,“不遺忘”被視為進步的象徵。

其實,人生的智慧恰在於懂得放下。記得我愛貓離世那段時光,初時回想便如重溫悲劇,內心完全是痛苦悲傷,又會自怨自艾。隨着年月推移,記憶雖然變得模糊,但內心苦痛悲傷也化為溫柔的懷念。心理學稱這個現象為“適應性遺忘”:讓傷口結痂,使生命得以延續。

遠期記憶 隨時間自動淡化

《Inside Out》(玩轉腦朋友)是筆者一套印象甚深的電影,原來“第一集”上映已經是10年前。還記得其中一個角色Bing Bong,出現不多卻意義深遠,它是主Riley童年時的幻想朋友,隨着Riley長大,他逐漸被遺忘,故事最後他犧牲自己,即使化為虛無也希望Riley能夠快樂。Riley遺忘了童年玩伴Bing Bong,而正正是那份失落,成就了她成長的契機。被遺忘的,並非消失,而是融入內心,化為前行的力量。

回到DeepSeek-OCR,其寓意遠超技術層面:以人的角度,重新思考資訊的價值。它試圖將一維語言轉化為二維視覺,為人工智慧開拓另一種記憶形態:讓“近期”資訊保持高解析,而“遠期”記憶隨時間自動淡化。此舉或為“無限上下文”架構提供答案--在資料保留與運算成本之間,取得生物般的動態平衡。

未來AI 料不再需昂貴硬碟

可以想像一下,未來的AI不再需要一座昂貴無比的硬碟,而有層次、有節奏、有呼吸的記憶系統。它懂得保留重要、淡忘冗餘--如同人類在歲月的淘洗中,學懂甚麼該記得,甚麼該放下。

其實對人類而言,我們需要的從來不是巨細無遺的記憶,而是真實的記錄。要記得愛和信念,而非痛苦和遺憾;記得選擇方向時的經驗,而非路上的一個個坑洞陷阱。無論是機器抑或人心,都需要“選擇性遺忘”才能重生。那不是抹去記憶或拒絕回想,而是重整和再造。從記憶的迷霧中,我們選擇留下的不是創傷,而是可以面向未來的智慧。

【知識庫】DeepSeek-OCR有何特點?

•引入光學2D映射機制,將長篇掃描文件的視覺與文字資訊壓縮至原始大小的十分之一,同時完整保留版面格式。

•大幅降低AI處理時的token消耗。

•具備“光學理解”能力,能分析文件布局、支援手寫筆記、多語言混排等。

•模型僅6.6GB,可在本地GPU運行,解決了AI擴展的“成本爆炸”難題。

•具備“隨時間動態壓縮”的機制,能持續節省記憶體與儲存空間。

(作者係香港科技大學副教授兼高級顧問<創業>,文章僅代表作者個人觀點)

來源:《香港經濟日報》

掃描二維碼分享到手機

編輯:藍皓源 校對:楊晨 監製:張晶晶
李家超:將在新一屆立法會首場會議提議支援宏福苑災民
粵港澳大灣區律師聯會成立
香港教育大學為受火災影響學童提供心理支援
孫東到訪過渡性房屋 了解救災物資捐獻平台運作
紫荊雜誌
影響有影響力的人