透過竹管看豹,只見斑紋不見全貌——這就是“管中窺豹”的困境,也是當前AI輔助熒光成像面臨的核心難題。北京大學未來技術學院教授席鵬團隊日前破解了這一難題,他們提出的大視野通用型熒光成像復原網絡LargePNet,讓AI學會“通觀全局”再動手復原。

“當科學家用顯微鏡觀察活細胞時,往往面臨兩難困境:想看清晰就得用強光照射,可這容易損傷細胞,讓長時觀測舉步維艱。”席鵬表示,近年來,深度學習曾帶來轉機,能從模糊低光圖像中“算”出高清畫面,大幅降低成像所需的光照強度,實現更長時間的生命觀測。但有一個問題長期被忽視:現有的AI模型大多沿用自然圖像的處理方法——把一張大於512×512像素的大圖切成64×64或128×128的小塊來訓練。這就像讓AI通過看“碎照片”學習攝影,每一塊小圖都只包含極少信息。
席鵬介紹,自然圖像內容豐富,小塊之間差異明顯,適合切圖訓練。但熒光成像截然不同:熒光染料特異性標記的某種細胞器,在小視野下看到的往往是重複的細線結構。真正區分“結構”與“噪聲”的關鍵信息,恰恰藏在大尺度的全局關聯中。用“碎照片”訓練出的AI,處理完整大圖時常因缺乏全局認知而保真度不足、抗噪性差——它沒學過“整隻豹子”長什麼樣。“熒光圖像中,大視野範圍內生物結構之間存在長程關聯,比如一根微管蛋白纖維可能蜿蜒貫穿整張圖像。當網絡只見過碎片,它就失去了理解這種全局結構的能力。”
團隊的解決思路頗具巧思:提出了一種全新的通用型熒光成像復原網絡LargePNet。核心思路大道至簡:不再切小圖,直接用大於512×512像素的大視野圖像訓練AI,讓模型在訓練階段就完整學習細胞結構的上下文關聯和全局統計信息。然而,直接“喂”大圖給傳統神經網絡,會遇到兩個難題:一是建立足夠大的“感受野”讓AI理解全局結構;二是控制大視野的計算量,不讓GPU“爆內存”。為此,團隊構建了LargePNet這樣一個高效的大視野通用型熒光成像復原網絡,全局“骨架”與局部“細節”融合匯合,實現既看得全又看得清。
效果立竿見影:在涉及不同顯微模態的降噪、去模糊等八項典型任務中,LargePNet相較當前最先進的復原網絡峰值信噪提升0.5至2分貝,大圖推理效率提升4至20倍。依託這一技術,團隊成功實現了長達30小時、分辨率200納米的活細胞亞細胞器動態成像,穩定捕捉了細胞骨架的動態變化;還讓內質網、線粒體和微管三種細胞器的相互作用在同一畫面中纖毫畢現。
更重要的是,團隊還給出了一張“適用範圍說明書”:他們發現,當小圖塊與大視圖的統計信息偏差越大,LargePNet相較於傳統小圖訓練網絡的復原優勢就越顯著。“這意味着研究者可根據自己的數據特點,判斷何時更適合啟用這套‘大局觀’模型。目前,我們已將全部Python源碼、訓練數據與模型開源,供全球同行自由取用。”席鵬說。
今日熱搜
查看更多





