DMBOK【データ品質】わかりやすいまとめ
とある社畜のDX担当、いねおけです。
今回のテーマは
DMBOKで紹介されている11の知識領域の中から「データ品質」の概要について御紹介します。
データの品質を高い状態に保つことは、より安定したビジネスアウトプットにつながります。指標に基づきデータ品質をチェックすると共に、必要に応じて改善する体制を整えましょう。
データ品質とは
データアーキテクチャをシッカリと描き、それに沿うデータモデリングを行い、データをビジネスに活用する環境を整えたとしても、肝心なデータそのものの品質が低ければ、最終的なビジネスアウトプットが信頼のおけないものになってしまいます。
そこでDMBOKではデータの品質を計る下記の指標が紹介されています。
指標 | 内容 |
完全性 | 必要なデータが全て存在しているかどうか、その程度。 完全な状態である100%に対する保存されたデータの割合。 |
一意性 | 同じ実体を表すデータが同じデータセット内に複数存在していないかの程度。 |
適時性 | データが適切な時点のものであるか、その程度。 要求された時点とデータが現実を反映した時点との差。 |
有効性 | データが定義域に準拠しているか、その程度。 データの定義域とはデータの型、形式、範囲、ルールなどで定義された、 データがとり得る全体を表す。 |
正確性 | データが現実の実体を正しく表している程度。 表現すべき現実世界の対象や事象をデータが正しく表す度合い。 |
一貫性 | データが、特定のデータベースなどデータセット内で一貫して (正しいルールに貫かれて)表現されているか、あるいは、 データセット間で一貫して関連付けられ、一貫して表現されているか、 その程度。 |
データ品質の測定と改善
先に紹介した指標でデータ品質を監視・測定し、可視化できる指標を定義することが重要です。
また、測定だけではなく、プロセスやシステムの改善により、データ品質を向上させる取り組みが行われることも重要です。
データ品質に異常が発生した時点で検知する仕組みや、対策・改善の業務フローを整えることで、生データの取得から最終的なビジネスアウトプットに至るまで全ての工程においてデータ品質が担保される体制を整えるべきです。
データのニーズと適正な品質
一方で、全てのデータについてデータ品質を最高の状態に保つことは、工数や予算がかかり過ぎます。ましてや、企業活動を継続すると、新たな業務やレポート、連携先が際限なく増えていく為、その範囲は拡大するばかりです。
利用ニーズがないデータに対して、過剰品質と言えるほどに高い水準で保守を続ける必要はありません。誰も見ていない無駄なレポートや、参照が適切ではないデータは避けて、ビジネス利用価値の高いデータの品質を高い水準に保ち続ける仕組み作りが重要になります。
まとめ
完全性、一意性、適時性、有効性、正確性、一貫性、これらの指標に基づいてデータ品質を評価できます。
データ品質の管理は、生データ取得から最終的なビジネスアウトプットに至る全行程を対象に、データ品質の測定とその改善がスコープに含まれます。
データ品質の維持にはコストがかかります。過剰品質にならないよう、データのニーズを整理しましょう。
【DMBOK】11の知識領域から「データマネジメント」を理解する
コチラの記事では、DMBOKの全体像を紹介しています。合わせて確認してみてください。
その他のオススメ記事
「DXについてもっと学ぶ・学んでもらう為の記事」はコチラから、
ぜひ参考にしてみてください。
最後まで読んでいただき、ありがとうございました。