2024年,全國數據生產總量41.06澤字節(ZB),相當於拍攝1300多萬部《哪吒2》這樣的高複雜度3D動畫電影——近日,《全國數據資源調查報告(2024年)》(以下簡稱《報告》)對外發布,亮出全國數據資源“家底”。
此次調查展現了當前中國數據資源怎樣的發展現狀?數據生產主要集中在哪些地區和行業?數據資源開發利用前景如何?
數據生產總量首次突破40ZB
對全國數據資源進行“大摸底”,這是第二次。
據介紹,2024年,國家數據局聯合相關部門首次開展全國數據資源調查,對數據資源進行摸底。2025年2月,本年度全國數據資源統計調查工作啟動,歷時近1個月完成,並於4月29日對外發布《報告》。
相較於第一次,今年的調查有哪些不同?有什麼新發現?
全國數據資源統計調查工作組有關負責人介紹,本年度調查在上年度數據規模、開發利用和應用情況等指標基礎上,新增人工智能、大模型、低空經濟等熱點領域調查指標,並對數據資源地區、行業分布情況做了分析測算。
看數據總量,2024年全國數據生產總量首次突破40ZB,達到41.06ZB,同比增長25%,增速較去年提高2.56個百分點。人均數據生產量約為31.31太字節(TB),相當於1萬多部高清電影,同比增長25.17%,數據生產總量和人均產量實現同步躍升。
看算力布局,2024年,全國算力總規模達到280EFLOPS(每秒百億億次浮點運算),智能算力規模達90EFLOPS,佔比提升至32%,為海量數據計算提供智能底座。其中,中央企業算力規模增長近3倍,智能算力佔比為40.22%;數據技術企業算力規模同比增長近1倍,智能算力佔比為43.63%。
看新增指標,隨着人工智能快速發展,用於開發、訓練和推理的數據量同比增長40.95%。智能家居、智能網聯汽車等智能設備數據增速位居前列,分別為51.43%、29.28%。無人機應用範圍快速拓展,機器人產業化進程不斷加快,帶動低空經濟和機器人數據生產量增速超過30%。
國家工業信息安全發展研究中心主任蔣豔表示,我國數據要素化進入新階段,數據領域新技術、新模式、新業態不斷涌現。從今年的調查看,一方面智能網聯汽車、大模型等智能化應用,推動了全社會數據增長,這類數據量佔比超四成;另一方面低空經濟、機器人等新領域的數據生產量雖然不高,但增速超過30%,成為新的增長點。
區域和行業分布集中度高
全國數據資源規模優勢持續擴大,各地之間存在一定差異。
根據《報告》,經濟大省數據資源集聚效應明顯,廣東、江蘇、山東、浙江、河南和四川6個省份數據生產量佔全國比重達57.45%。東部地區數據資源開發利用活躍,北京、上海企業人工智能投入平均水平位居全國前二,浙江應用大模型的企業比例位居第一。
“山東是經濟大省、工業大省,有着海量的數據資源和豐富的應用場景。”山東省大數據局局長王健說,近年來,山東強化工作統籌、深化數據共享、創新場景應用,全省一體化政務服務能力位列全國第一方陣,“開放數林指數”位居全國第一。
根據山東省發布的數據,山東獲批全國工業品主數據標準建設試點,2024年遴選29個試點縣(市、區)的特色細分行業,全面開展試點工作,試點行業數量居全國第一;形成245個產品主數據標準,約佔全國總量30%;全省重點監測範圍內大數據企業超900家,2024年營收突破2600億元;建成全國首個海洋大數據交易服務平台,交易額超1500萬元。王健說,山東還將着力加強數據源頭供給,開展公共數據匯聚行動,將各級各部門數據匯聚至省一體化大數據平台,挖好數據要素這座“富礦”。
蔣豔表示,從全國看,數據資源向東部地區聚集,江蘇、廣東的企業數字化投入是全國平均水平的1.71倍,也為區域數據開發利用提供有力支撐。
區域發展有差異,行業分布也存在集中度較高的情況。
國際數據公司(IDC)今年5月發布中國金融雲市場跟蹤報告顯示,2024年下半年,中國金融雲市場規模達到52.3億美元,同比增長11.0%。業內人士分析,金融業數據資源和應用場景極為豐富,數據生產量長期以來穩居各行業前列,相關市場規模近年也在不斷增加,數據交易規模佔總體比重超過30%,成為最大的細分行業數據交易市場。
全國數據資源統計調查工作組有關負責人表示,隨着我國數字化、網絡化、智能化進程加速,製造、金融、交通物流行業數據生產總量領先其他行業,金融、採礦、交通物流行業企業平均數據生產量位居前三。交通物流、電力行業數據資源開發利用活躍度遠高於全國平均水平,分別為78.24%、75.83%。
喚醒更多“沉睡數據”
有了豐富的數據資源,如何充分開發利用是關鍵。在第一次全國數據資源調查中,調查組發現我國海量數據和豐富場景優勢潛力亟需釋放。
蔣豔表示,2023年,全國新增數據存儲量為0.95 ZB,生產總量中僅有2.9%的數據被保存,由於海量數據複用價值較低,大部分過程類數據產生後即被丟棄或覆蓋。數據存而未用現象較為突出,企業一年未使用的數據佔比約四成,數據加工能力不足導致大量數據價值被低估、難以挖掘複用。
如今,數據資源開發利用有沒有新變化?
“在本年度調查中,我們看到數據資源開發利用活躍度穩步提升。”全國數據資源統計調查工作組有關負責人說,公共數據資源供給和企業用數需求雙向拉動,企業加快應用大模型,高質量數據集建設進入加速期。
一方面,公共數據資源開發利用步伐加快。根據《報告》,2024年,全國地市級以上公共數據開放平台數量增長7.5%,開放的數據量增長7.1%;超六成省(自治區、直轄市)、計劃單列市啟動公共數據授權運營工作。
另一方面,企業用數活力逐步提升。2024年,存儲數據中活躍數據總量同比提升22.73%,活躍數據總量佔存儲數據總量62.04%;約66%的行業龍頭企業和30%的數據技術企業購買過數據;利用大模型的數據技術企業和數據應用企業數量分別增長57.21%、37.14%;數據技術企業積極推動數據集建設,高質量數據集數量增速達27.4%。
此次《報告》預測,全國數據生產總量將保持增長態勢,2025年有望突破50ZB,無人駕駛、具身智能、低空經濟等戰略性新興產業和未來產業的數據資源規模將保持高速增長。數據資源流通利用將進入加速期,數據治理、數據標注、數據智能等相關企業迎來發展機遇期,信息技術服務商加速向數據運營服務商轉型,數據產品和服務供給能力將大幅提升,催生一批數智應用新產品新服務新業態。企業數據價值挖掘重心從服務自身數字化轉型向數據要素化、市場化拓展,數據跨主體流通、跨行業應用、跨場景賦能的乘數效應加速釋放。
隨着數據資源規模優勢持續擴大,數據要素市場化、價值化進程進一步提速,更多“沉睡數據”有望被喚醒。專家分析,作為全球首個將數據納入生產要素的國家,中國已初步構建起門類齊全的數據產業鏈。截至目前,全國數據領域相關企業超19萬家,數據產業規模超2萬億元。按照20%以上的年均增長率測算,2030年中國數據產業規模將達7.5萬億元。