データガバナンスは、企業全体のデータ資産に対する説明責任と所有権を確保するための役割、責任、プロセスを定義します。

データガバナンスの定義
データガバナンスとは、組織内の誰がデータ資産に対する権限と制御を持ち、それらのデータ資産をどのように使用することができるかを定義するためのシステムです。データ資産を管理し、保護するために必要な人、プロセス、テクノロジーを包括しています。
Data Governance Instituteでは、データガバナンスを「情報関連プロセスにおける決定権と説明責任のシステムであり、誰が、いつ、どのような状況で、どのような方法で、どのような情報を使って、どのような行動をとることができるかを記述した合意されたモデルに従って実行される」と、定義しています。
国際データマネジメント協会(DAMA)では、データガバナンスを「データの管理およびデータとデータ関連ソースの利用に関する計画、監督、管理」と定義しています。
データガバナンスのフレームワーク
データガバナンスは、組織の包括的なデータ管理戦略をサポートする機能として考えるのが最も適切かもしれません。このようなフレームワークは、データの収集、管理、保護、保存に関する全体的なアプローチを組織に提供します。フレームワークが網羅すべき内容を理解するために、DAMAはデータ管理を車輪に見立て、データガバナンスをハブとして、そこから以下の10のデータ管理知識エリアが放射状に広がるように考えています。
- データアーキテクチャ。企業アーキテクチャの不可欠な部分としてのデータおよびデータ関連リソースの全体的な構造
- データモデリングとデザイン。分析、設計、構築、テスト、保守
- データのストレージと運用。構造化された物理的データ資産のストレージのデプロイと管理
- データの安全性。プライバシー、機密保持、適切なアクセスの確保
- データ統合と相互運用性。取得、抽出、変換、移動、配信、レプリケーション、連携、仮想化、運用のサポート
- ドキュメントとコンテンツ。非構造化ソースにあるデータの保存、保護、インデックス登録、アクセスを可能にし、このデータを構造化データとの統合や相互運用のために利用できるようにする
- リファレンスデータ、マスターデータ。共有データを管理し、データ値の標準的な定義と使用により、冗長性を減らし、より優れたデータ品質を確保する
- データウェアハウジングおよびビジネスインテリジェンス(BI)。分析データ処理を管理し、レポートや分析のための意思決定支援データへのアクセスを可能にする
- メタデータ。メタデータの収集、分類、維持、統合、制御、管理、配信
- データ品質。データ整合性の定義、モニタリング、維持、およびデータ品質の改善
戦略を立てる際には、データの収集、管理、アーカイブ、利用など、上述の各側面を考慮する必要があります。
ビジネスアプリケーション研究センター(BARC)は、データガバナンスは「ビッグバン的な取り組み」ではなく、非常に複雑で継続的なプログラムであり、参加者が時間の経過とともに信頼と関心を失っていく危険性があると警告しています。そのため、BARCでは、管理しやすい、あるいはアプリケーションに特化したプロトタイププロジェクトから始め、学んだ教訓をもとに全社的に展開することを推奨しています。
BARCは実装において以下のステップを推奨しています。
- 目標を明確にし、メリットを理解する
- 現状分析とデルタ分析
- ロードマップを導き出す
- ステークホルダーを納得させ、プロジェクトを予算化する
- データガバナンスプログラムの策定と計画
- データガバナンスプログラムの実装
- モニタリングと管理
データガバナンスとデータマネジメント
データガバナンスは、データマネジメントの全体的な規律の一部に過ぎませんが、重要なものです。データガバナンスがデータ資産の説明責任と所有権を確保するための役割、責任、プロセスに関するものであるのに対し、DAMAはデータマネジメントを「データの計画、特定、有効化、作成、取得、維持、使用、アーカイブ、検索、管理、パージに使用するプロセスを記述する包括的用語」と、定義しています。
データマネジメントは、この分野の一般的な用語になっていますが、データリソースマネジメントやエンタープライズ情報管理(EIM)と呼ばれることもあります。ガートナーはEIMを「組織や技術の境界を越えて情報資産を構造化、記述、管理し、効率を改善し、透明性を促進し、ビジネスの分析情報を実現するための統合的な規律」と説明しています。
データガバナンスの重要性
ほとんどの企業では、個々のアプリケーション、事業部、機能に対して、プロセスや責任が非公式であっても、何らかの形ですでにガバナンスを設けています。慣行として、これらのプロセスや責任に対する体系的で正式な管理を確立しています。特に、企業規模が大きくなり、個人が部門横断的な仕事をすることが効率的でなくなった場合、このような方法をとることで、企業の対応力を維持することができます。データマネジメントの全体的なメリットのいくつかは、企業が体系的なデータガバナンスを確立した後にのみ実現できます。そのメリットの一部は次のとおりです。
- 組織全体で一貫性のある統一されたデータから生まれる、より優れたより包括的な意思決定支援
- ビジネスとITがよりアジャイルでスケーラブルになるための、プロセスとデータの変更に関する明確なルール
- 中央管理機構の提供によるデータ管理の他の分野でのコスト削減
- プロセスやデータの再利用が可能なことによる効率化の向上
- データ品質とデータプロセスの文書化に対する信頼性の向上
- データ規制によるコンプライアンスの向上
データガバナンスの目標
目標は、企業データを標準化、統合、保護、保存するための方法、一連の責任、プロセスを確立することです。BARCによると、組織の重要な目標は次のとおりです。
- リスクの最小化
- データ活用の社内ルールの確立
- コンプライアンス要求の実装
- 社内外のコミュニケーションの向上
- データ価値の向上
- 上記の管理を円滑に行う
- コスト削減
- リスクマネジメントと最適化を通じて、会社の存続に貢献する
BARCは、このようなプログラムは常に企業の戦略、戦術、運用レベルにまたがっており、継続的かつ反復的なプロセスとして扱われなければならないと指摘しています。
データガバナンスの原則
Data Governance Instituteによると、次の8つの原則がデータガバナンスとスチュワードシッププログラムの成功の中心となっています。
- すべての参加者は、互いのやり取りにおいて誠実でなければならない。データに関連する意思決定の推進要因、制約、選択肢、影響を議論する際には、誠実で率直でなければなりません。
- データガバナンスとスチュワードシップのプロセスでは、透明性が求められる。データに関連する意思決定や制御が、いつ、どのようにプロセスに導入されたかは、すべての参加者と監査人に明らかにされなければなりません。
- データガバナンスの対象となるデータ関連の意思決定、プロセス、制御は、監査可能でなければならない。コンプライアンスに基づく監査要件や運用上の監査要件をサポートするための文書が添付されている必要があります。
- 部門横断的なデータ関連の意思決定、プロセス、管理について誰が責任を負うかを定義すること。
- 個々の貢献者やデータスチュワードのグループの責任であるスチュワードシップ活動に対して、誰が責任を負うかを定義すること。
- ビジネスチームとテクノロジーチーム、情報の作成/収集者、管理者、利用者、標準やコンプライアンス要件の導入者の間でチェック&バランスを導入する方法で、プログラムでは説明責任を定義すること。
- 企業データの標準化を導入・支援するプログラムであること。
- プログラムは、参照データの値、マスターデータおよびメタデータの構造や使用に関する事前または事後の変更管理活動をサポートすること。
データガバナンスのベストプラクティス
データガバナンス戦略は、組織のプロセス、ニーズ、目標に最も適したものに変更する必要があります。それでも、守るべき基本的なベストプラクティスが6つ存在します。
- 重要なデータ要素を特定し、データを戦略的なリソースとして扱う。
- データのライフサイクル全体に対する方針と手順を設定する。
- ビジネスユーザーをガバナンスプロセスに参加させる。
- 決してマスターデータマネジメントをおろそかにしない。
- 情報の価値を理解する。
- データ利用を過度に制限しない。
データガバナンスを正しく行うための詳細は、「優れたデータガバナンスのための6つのベストプラクティス」をご覧ください。
データガバナンスの課題
優れたデータガバナンスは単純な作業ではありません。チームワーク、投資、リソースが必要であり、計画やモニタリングも必要です。データガバナンスプログラムの最重要課題としては、以下のようなものがあります。
- データのリーダーシップの欠如。他のビジネス機能と同様に、データガバナンスにも強力なエグゼクティブのリーダーシップが必要です。リーダーは、ガバナンスチームに指示を与え、組織の全員が従うべき方針を策定し、社内の他のリーダーとコミュニケーションを取る必要があります。
- リソースの不足。データガバナンスの取り組みは、予算やスタッフへの投資不足で苦労することがあります。データガバナンスは、誰かが所有し、その費用を負担しなければなりませんが、それだけで収益を上げることはほとんどありません。しかし、データを活用して収益を上げるためには、データガバナンスやデータ管理全般が不可欠です。
- サイロ化されたデータ。特に、事業部門やその他の機能が新しいデータソースを開発したり、新しいテクノロジーを適用したりすると、データは時間の経過とともにサイロ化し、細分化されるものです。データガバナンスプログラムは、常に新しいサイロを破壊し続ける必要があります。
ぜひ、「避けるべきデータガバナンスの7つの失敗」をご覧ください。
データガバナンスのソフトウェアとベンダー
データガバナンスは、テクノロジーソリューションというよりも継続的なプログラムですが、データガバナンスの機能を備えたツールが存在し、プログラムをサポートできます。企業に合ったツールは、そのニーズ、データ量、予算によって異なります。PeerSpotによると、より人気のあるソリューションには以下のようなものがあります。
データガバナンスソリューション | 説明と機能 |
Collibra Governance | Collibraは、多くのガバナンスとスチュワードシップのタスクを自動化する企業規模のソリューションです。ポリシーマネージャー、データヘルプデスク、データディクショナリー、ビジネス用語集が含まれています。 |
SAS Data Management | SASプラットフォーム上に構築されたSAS Data Managementは、プロセスを管理するためのロールベースのGUIを提供し、統合されたビジネス用語集、SASおよびサードパーティのメタデータ管理、系統の視覚化などが含まれます。 |
erwin Data Intelligence (DI) for Data Governance | erwin Diは、データカタログとデータリテラシーの機能を組み合わせて利用可能なデータ資産を認識し、アクセスできるようにします。それらのデータ資産の使用に関するガイダンスを提供し、データポリシーとベストプラクティスが守られていることを確認します。 |
Informatica Axon | Informatica Axonは、プログラムをサポートするためのコレクションハブであり、データマーケットプレイスです。主な機能として、コラボレーションによるビジネス用語集、データの系統を可視化する機能、ビジネス定義に基づくデータ品質測定の生成などがあります。 |
SAP Data Hub | SAP Data Hubは、データオーケストレーションソリューションで、データ環境全体におけるあらゆる種類、品種、量のデータの発見、洗練、充実、管理を支援することを目的としています。組織がユーザー、グループ、役割のセキュリティ設定とID制御ポリシーを確立し、ポリシー管理とセキュリティロギングのベストプラクティスとプロセスを合理化することを支援します。 |
Alation | Alationは、データをソースごとに自動的にインデックス化するエンタープライズデータカタログです。その主要機能の一つであるTrustCheckは、ワークフローにリアルタイムで「ガードレール」を提供します。TrustCheckは、特にセルフサービス分析をサポートすることを目的としており、データ資産にガイドラインやルールを付加することができます。 |
Varonis Data Governance Suite | Varonisのソリューションは、スケーラブルなメタデータフレームワークを活用してデータ保護と管理タスクを自動化し、データアクセスの管理、すべてのファイルや電子メールイベントの監査証跡の表示、異なるビジネスユニット間のデータ所有権の特定、機密データや文書の検索と分類を可能にします。 |
IBM Data Governance | IBM Data Governanceは、機械学習を活用してデータ資産の収集とキュレーションを行います。統合データカタログは、企業がデータを見つけ、キュレーションし、分析し、準備し、共有することを支援します。 |
データガバナンスの認定資格
データガバナンスはシステムですが、以下のように、一部の認定資格により組織は優位に立てるようになります。
- DAMA Certified Data Management Professional (CDMP)
- Data Governance and Stewardship Professional (DGSP)
- edX Enterprise Data Management
- SAP認定アプリケーションコンサルタント – SAPマスターデータガバナンス
関連する認定資格については、「効果を生むマスターデータマネジメント10選」をご覧ください。
データガバナンスの役割
データガバナンスの構成は企業ごとに異なりますが、いくつかの共通点があります。
運営委員
ガバナンスプログラムは企業全体に及びますが、一般的には上級管理職(多くはCレベルまたは事業部門を担当するバイスプレジデント)からなる運営委員会から始まります。Get Governed:Building World Class Data Governance Programs(世界最高水準のデータガバナンスプログラムを構築する)の著者、Morgan Templar氏によると、運営委員のメンバーは、具体的な成果を伴う全体的なガバナンス戦略の設定、データスチュワードの活動の支持、タイムラインと成果に対するガバナンス組織の説明責任などを担っています。
データ所有者
Templar氏は、データ所有者は、特定のデータドメイン内の情報がシステムやビジネスライン全体で管理されることを保証する責任を負う個人であると述べています。一般的に運営委員のメンバーですが、投票権を持たない場合もあります。データ所有者は、以下の責任を負います。
- データ用語集などのデータ定義の承認
- 企業全体の情報の正確性の確保
- データ品質活動の指揮
- マスターデータ管理のアプローチ、成果、活動の審査・承認
- 他のデータオーナーと協力して、データに関する問題を解決する
- データスチュワードが特定した問題に対するセカンドレベルのレビュー
- ソフトウェアソリューション、ポリシー、またはデータドメインの規制要件について、運営委員に意見を提供
データスチュワード
データスチュワードは、データの日常的な管理について説明責任を負います。情報の意味と使い方を理解し、伝える主題専門家(SME)であり、ほとんどのデータ決定の統括機関として、組織全体の他のデータスチュワードと提携すると、Templar氏は説明します。データスチュワードは、以下の責任を負います。
- データ領域におけるSMEであること
- データに関する問題を特定し、他のデータスチュワードと協力して解決する
- データスチュワードカウンシルのメンバーとして活動する
- データポリシーおよび委員会活動に関する提案・審議・投票
- データドメイン内のデータ所有者やその他のステークホルダーへの報告
- 事業部門を横断して、その領域のデータを確実に管理・理解する