數(shù)據(jù)管理知識體系將數(shù)據(jù)質(zhì)量 (DQ) 定義為“將質(zhì)量管理技術(shù)應(yīng)用于數(shù)據(jù)的活動的規(guī)劃、實施和控制,以確保其適合消費并滿足數(shù)據(jù)消費者的需求。”
由于對 DQ 的期望并不總是口頭表達(dá)和為人所知,因此需要進行持續(xù)的討論。DQ 取決于上下文和數(shù)據(jù)消費者的要求。實施有效的 DQ 管理使用 DQ 工具可幫助組織將 DQ 維持和改進到可接受的水平。業(yè)務(wù)領(lǐng)導(dǎo)者使用數(shù)據(jù)質(zhì)量維度來衡量 DQ 并建立對數(shù)據(jù)的更多信任。
數(shù)據(jù)質(zhì)量維度的簡短列表:- 準(zhǔn)確性
- 完整性
- 一致性
- 正直
- 合理性
- 及時性
- 唯一性/重復(fù)數(shù)據(jù)刪除
- 有效性
- 輔助功能
其他定義包括:
- “適合一個目的。滿足其作者、用戶和管理員的要求。” (Peter Aiken 博士,改編自 Martin Eppler)
- “依賴數(shù)據(jù)的準(zhǔn)確性、一致性和完整性才能在整個企業(yè)中發(fā)揮作用。” (米歇爾奈特)
- 用于解析和標(biāo)準(zhǔn)化、廣義“清理”、匹配、分析、監(jiān)控和豐富的工具和過程(高德納)
- Strong-Wang框架:(麻省理工學(xué)院的 Wang 和 Strong和大馬DMBoK)
輔助功能
訪問安全
可解釋性
易于理解
表征一致性
簡明表示
附加值
關(guān)聯(lián)
完整性
適當(dāng)?shù)臄?shù)據(jù)量
準(zhǔn)確性
客觀性
可信度
名聲
內(nèi)在的 DQ:
上下文 DQ:
代表性 DQ:
輔助功能 DQ:
一些用途包括:
- 增加的價值組織數(shù)據(jù) 以及使用它的機會
- 減少風(fēng)險和成本與低質(zhì)量數(shù)據(jù)相關(guān)
- 改善組織效率 和生產(chǎn)力
- 保護和提高組織的聲譽
- 數(shù)據(jù)剖析(建立趨勢并發(fā)現(xiàn)數(shù)據(jù)中的不一致)
- 數(shù)據(jù)標(biāo)準(zhǔn)化(確保數(shù)據(jù)使用相同、一致的格式)
- 數(shù)據(jù)監(jiān)控(當(dāng)未達(dá)到 DQ 閾值時提醒數(shù)據(jù)管理員)
- 數(shù)據(jù)解析(發(fā)現(xiàn)數(shù)據(jù)是否符合可識別的模式)
- 數(shù)據(jù)清理