在全球數字化轉型的浪潮下,數據逐漸成為推動經濟和社會發展的核心資源之一,是重要的生產要素。隨著大數據、人工智能和物聯網等技術的迅猛發展,數據產品和服務的應用范圍不斷擴大,涵蓋了從金融到醫療,從制造業到零售業等多個行業領域,數據產品質量對其在場景中的應用效果影響愈加重要。
2021年發布的《“十四五”大數據產業發展規劃》,強調推動數據產品化、加強數據產品質量評測體系建設的重要性。《關于構建數據基礎制度更好發揮數據要素作用的意見》鼓勵企業積極參與數據要素市場建設,加強數據質量的建設與治理。2024年國家發展改革委、國家數據局等部門聯合印發了《國家數據標準體系建設指南》,要求建立數據質量管理標準,規范數據全生命周期質量的管理、管控與評價,包括數據質量評價指標、評價方法等標準。
以上政策都強調了提高數據質量水平,建立數據產品質量評價標準體系,是促進數據要素市場有效流通的重要內容。
現有數據質量評價標準基礎指引
目前,各地發布了數據質量評價相關標準,用以規范數據質量評價。其中,國家標準《信息技術數據質量評價指標》(GB/T 36344-2018),規定了數據質量評價的相關指標,包括規范性、完整性、準確性、一致性、時效性和可訪問性等指標。金華市發布地方標準《公共數據質量評價規范》(DB3307/T 137-2024),規定了公共數據質量評價的評價指標體系框架、評價指標以及評價程序的要求,適用于公共數據平臺上公共數據的質量評價,主要包括基礎質量、使用成熟度、服務保障、共享成效等維度的質量評價指標體系。浙江省信息產業質量協會發布團體標準《產業數據倉 數據質量評價規范》(T/ZXCH 0013-2022),規范了產業數據質量評價指標框架,包括數據唯一性、數據時效性等指標,同時也提出了指標的計算方式等內容。
通過數據質量評價標準的制定,規范化數據質量評價體系和完善評價要求,有效促進數據質量的提升。一方面,有助于促進數據要素的高效流通,另一方面,能夠為企業戰略決策提供可靠依據。這有助于確保企業在數字化轉型過程中充分利用高質量的數據資源,實現更加精準、高效的運營管理。
數據產品質量評價標準及技術體系建設難題
盡管當前已經發布了相關數據質量評價標準,但在建設全面的數據產品質量評價體系方面仍面臨諸多挑戰。
一是缺乏全面、系統化的數據產品質量評價體系,目前的數據產品質量評價大多集中在傳統的數據質量維度(如準確性、完整性等),而忽視了對數據產品的其他關鍵質量屬性的評估,如數據產品生產質量、數據產品應用效果等,這導致現有的評價過程未能實現一個從“數據資源”到“數據產品”演進的系統化、多維度的數據產品質量評價框架。
二是自動化與智能化水平不足,當前的數據質量評估高度依賴人工操作,尤其是在面對多源異構數據和海量信息時,這種模式不僅效率低成本高,還容易引入主觀偏差。隨著數據量的增長和技術復雜度的提升,傳統的人工評估方式越來越難以滿足高效、準確的要求,亟需引入更先進的自動化工具和智能算法來輔助或替代人工勞動。
三是多場景下的差異化評價需求,不同數據產品質量評價場景對評價維度各有側重,這些差異貫穿于數據產品的整個生命周期。為了確保數據產品在不同環節中的適用性和可靠性,需要實現數據產品治理開發運營中的質量全周期閉環管理,同時也要實現在數據產品進行流通交易前的質量評估。
數據產品質量評價未來發展趨勢與創新方向
促進數據產品質量評價標準體系多元化發展。數據產品的質量評估要實現多維度評估,構建一個多維度、綜合性的評估框架,不僅應涵蓋傳統的數據質量維度,還應擴展至數據產品生產質量和數據產品應用質量等多個方面進行全面考量。此外,評估不僅要滿足基礎的技術和質量要求,還需結合具體的業務需求、數據應用場景定制化設定評價指標,確保評估結果能夠真實反映數據產品在特定領域的有效性。最后,針對不同行業和應用場景的特點,建立靈活且針對性強的評價指標體系,以適應多樣化的需求和挑戰。
數據產品質量評價智能化與自動化。數據質量評價的發展趨勢正朝著智能化與自動化的方向邁進。利用機器學習與AI算法,自動檢測數據質量問題并識別潛在風險,提升數據質量管理效率。建立全面的自動化數據質量評估平臺,涵蓋元數據采集、數據監控、質量評估與數據修復等功能。通過評估結果實施數據去重、糾錯和修復等質量控制措施,提升數據的質量和決策支持能力,推動科學、高效的決策過程。
推動多場景數據產品質量評估應用與閉環管理。實現數據產品質量在多場景下的有效管理,一是數據產品上架和流通交易前,進行數據質量評估,確保數據可靠性和交易透明度。二是定期開展數據質量監測,及時發現并反饋質量問題,針對性地進行數據治理,確保評估、反饋和優化形成閉環管理。同時,基于質量評估結果,為數據產品定價提供依據,并增強買家對數據的信任,降低交易風險,提高供需匹配效率。
國網浙江“三個探索”構建電力數據產品質量評價標準及技術體系
在數字化轉型的浪潮中,浙江省新型重點專業智庫國網浙江省電力有限公司經濟技術研究院支撐國網浙江省電力有限公司不斷提升數據治理能力,深入推進數據主人制,建立涵蓋數據主人認定、數據主人工單管理、數據問題管理等多個數據質量管控內容的機制,積極提高數據治理能力,發揮數據作為生產要素的放大、疊加、倍增作用,助推數字化轉型。同時,為進一步提高數據產品質量,積極應對數據質量管理的新挑戰,探索構建全面的數據產品質量評價標準體系以及自動化的評價技術工具。
一是探索構建多維度的電力數據產品質量評價標準體系。浙江省新型重點專業智庫國網浙江省電力有限公司經濟技術研究院支撐國網浙江省電力有限公司創新構建多維度的質量評價標準體系,不僅包括數據產品數據樣本質量,同時還包括數據產品數據目錄質量、數據產品生產質量、數據產品應用效果質量等多個維度,涵蓋完整性、時效性、目錄規范性、目錄完整性、質量管理、數據安全、市場應用等多個評價指標。
二是探索研究電力數據產品質量評價工具。為實現更高效的數據產品質量評估,研究設計數據產品質量評價工具,實現對數據產品質量的自動化評價管理。包括質量標準管理、評測任務管理、評測結果管理等多個方面,涵蓋元數據采集、質量標準管理、質量評測等功能,滿足對數據產品的自動化管理與評估。此外,將數據產品質量評測得到的問題數據進行派單整改,實現對數據產品質量的閉環管理。
三是探索實現智能化、自動化數據質量評價與監測。初步開展大數據AI智能推薦數據產品質量評價規則研究,以期實現對數據產品評價規則的高效選取。同時,利用人工智能技術包括機器學習、深度學習等技術,對評價規則進行自動化檢測并協助評估指標得分。此外,對問題數據實現全面監測與記錄,并進行智能整改,以提高數據產品質量。(錢江晚報潮新聞客戶端 通訊員 袁翔 俞楚天 張一泓 孔俊 李靜 任紅 董海燕供稿單位:浙江省新型重點專業智庫國網浙江省電力有限公司經濟技術研究院)
評論