データマッチング

その "ゴールデンレコード"、 実は違った・・・? Part 1:エンティティ・データ - MDM(マスターデータマネジメント)を行う理由


テクノロジーに携わる方、あるいはデータを定期的に扱う職務に就いている方(最近ではほとんどの方ですね)であれば、「マスターデータ管理」、別名MDMという言葉を聞いたことがあるはずです。 MDMにはさまざまな種類(さらには複数の定義)がありますが、MDMの普遍的な側面の1つとして、組織全体で統一されたデータビューを作成できる点があげられます。

この "統一されたデータビューの作成 "は、多くの場合 "ゴールデンレコードの生成 "と訳されます。 しかし、その前に基本的なことを確認しておきましょう。そもそもなぜMDMを行うのでしょうか?

MDMシステムでは、データは1つまたは複数のエンティティタイプとして管理されます。 MDMシステムにおけるデータ・エンティティとは、システムが管理するレコードの種類のことで、最も一般的な例は顧客情報ですが、他にもアイテム、商品、場所、システム、スタッフ、イベントなど、ほぼ何でもデータ・エンティティになり得ます。

ほとんどのビジネスにおいて、データとそれを扱うシステムは時間とともに有機的に成長します。 つまり、MDMは必ず既存のシステムに適用されるものであり、既存の運用方法や所有者が競合するものなのです。異なるデータソースをどのように扱うかについては次回に詳しく説明しますが、まずは典型的なセットアップについて考えてみましょう。

「有機的に」というのは、多くの場合、これらシステムは、注文を処理する、売上を記録する、顧客に対応する、といった狭い範囲における目的を果たすために設計されているという点です。これらのシステムは、互いに接続するようには設計されていません・・・そこでMDMの出番となるのです。

例: EmDee Inc.は、B2Bの顧客にウィジェットを販売しています。 当社には、オフショア製造を管理する調達部門があります。 ウィジェットは輸入され、当社の倉庫に保管されます。 売上のほとんどは、ウェブベースのEストアーフロントを通じてもたらされます。

EmDee Inc.では、MDMが必要とすべき膨大な量の業務データを生成、保有しています。 典型的な業務データセットには以下のようなものがあります:

・顧客の連絡先情報

・店頭データ(eコマース/POSなど)

・取引データ(例:受注と出荷)

・製造ログ

・在庫、倉庫データ

・カスタマーサービス情報(返品や苦情など)

また、これらの中には非常に強力な「非業務」データも存在します: 競合分析、販売動向、マーケティングと見込み客データ、さらには人事データなど、例を挙げればきりがありません。

典型的なMDMデータストアをいくつか見てみましょう:

CDLブログ第15号_図1_2

マスターデータ管理は、保有するデータのグラウンドトゥルース*のソースとなることに主眼を置いていますが、もう一つの重要な側面はリンケージです。

MDMのエンティティ連結は、厳密にはRDBMS(リレーショナル・データベース・マネジメント・システム)のデータ関係やグラフデータベースの頂点と辺と同じではないことに注意してください。前者はビジネス機能としてのエンティティ間のリンケージであるのに対し、リレーショナル/グラフ接続はデータ環境自体の正式な構造を反映したものです。 これらのデータベース構造は明らかにMDMシステムに大きな影響を及ぼし、現実にはMDMデータモデルとデータベース構造の間には多くの重複があり得ますが、これは別の記事で取り上げたいと思います。

*グラウンド・トゥルースとは、正確なデータセットを構築するための基礎となる試金石を指し、基準となる真実という意味になります。

 

では、リンケージとは何を意味し、なぜMDMにとって重要なのでしょうか?

簡単な例を紹介します:

ジョン・スミスは、A社の主要顧客のひとつであるExCorp社で働いています。 ジョンはExCorp社のCEOであり、A社の主要顧客でもあります。 最近、ケイティ・アレンがExCorp社のCEOに就任しました。

CDLブログ第15号_図3

 データを使いこなすことで、顧客との接点に関する貴重な洞察を得ることができます。

A社のMDMシステムには、「個人マスター」にジョン・スミスの項目があり、「顧客マスター」にExCorp社の項目があります。 ジョンのレコードは、彼とExCorp社のエントリーをリンクしており、顧客マスターのExCorp社のレコードを取引ログに接続することで、ExCorp社が当社から何を購入したかを確認することができます。

このマスターレコードに 「特別な風味 」を加えると、非常に面白くなります。ジョン・スミスが以前WhyCo社のCEOで、顧客でもあったとしましょう。 すると、次のようなデータになります:

CDLブログ第15号_図4_5

ExCorp社 の CEO であるジョン・スミスが WhyCo社 の前 CEO と同一人物であると判断する際にも、アイデンティティ・レゾルーション マッチング) の技術が大きな役割を果たします。 また、第三者のデータ・プロバイダーのサービスを利用し、ケイティ・アレンの過去の職歴な どを追加することもあります。 レコードをマッチングさせたら、その外部データを社内のMDMフレームワークにリンクさせることができます。

では、データを手に入れ、それを紐づけました。次は何をすればいいのでしょうか?

CDLブログ第15号_図6

MDMは、データを取り込み、リンクし、強化し、そしてどこかに保管することだけを意味するものではありません。 MDMはまた、そのデータを利用する方法と手段を提供することでもあります。では、このデータ・マスタリング・プロセスから、企業はどのように実際の価値を引き出せるのでしょうか?

上記のサンプルのデータを販売データ(取引履歴)にリンクさせると、企業データの中から非常に興味深いシグナルを発見できるかもしれません。

CDLブログ第15号_図7

これらのシグナルは、次のような質問に答えるのに役立つと思われます:

・ジョン・スミスがCEOに就任してからの ExCorp社 の購買行動は?彼がWhyCo社を経営していたころの行動と比較してどうだろう?

・ExCorp社の新CEOケイティ・アレンはどのような人物なのか – 他の場所で見たことがあるか?

ジョン・スミスが指揮を執るようになった今、 ExCorp社 との取引を増やすことができるかもしれないですし、逆にジョン・スミス率いるWhyCorp社が常に難しい顧客であったなら、今後のExCorp社の経営に活かすことができるかもしれません。

しかし、このデータをステークホルダーとどのように共有するのか? どのバージョンを見せるのか? どのデータを捨てるのか? これは、もしあなたのビジネスが単一のデータソース(例えばオンライン購入時の登録情報)しか持っていないのであれば、答えは簡単です。

ExCorp社の新CEOケイティ・アレンの例を拡大してみましょう。顧客としてExCorp社とのやり取りから彼女に関するデータがいくつかありますが、高度なアイデンティティ・レゾリューションシステムを使って、昨年取得した潜在的な販売機会に関する記録と彼女を照合することもできました。

CDLブログ第15号_図8

その外部データは、私たちのデータと重なる部分もあるのですが(だからこそ一致させることができました)、異なる部分もあります。例えば、連絡先の電話番号が違っていたり、誕生日が違っていたり、資格が微妙に違っていたりします。

では、どのケイティ・アレンの情報を営業チームに伝えればいいのでしょうか? どちらの真実が正しいのでしょうか?

利害関係者に実用的な洞察を提供する必要がある。でも、どれを渡す?

CDLブログ第15号_図9

どのように 「最適な情報」を選ぶか、そしてどのような形で選ぶかについては、データブログの次号で取り上げます: ゴールデンレコードとは何かそして、それはどのように機能するのか?について解説する予定です。

 

著者のご紹介

ウオリック・マセウス / ジョン・ニコディモ 共著 

warwick

ウオリック・マセウス(Warwick Matthews)  
最高技術責任者 最高データ責任者

複雑なグローバルデータ、多言語MDM、アイデンティティ解決、「データサプライチェーン」システムの設計、構築、管理において15年以上の専門知識を有し、最高クラスの新システムの構築やサードパーティプラットフォームの統合に従事。 また、最近では大手企業の同意・プライバシー体制の構築にも携わっている。  

米国、カナダ、オーストラリア、日本でデータチームを率いた経験があり、 最近では、ロブロー・カンパニーズ・リミテッド(カナダ最大の小売グループ)および米国ナショナル・フットボール・リーグ(NFL)のアイデンティティ・データチームのリーダーとして従事。  

アジア言語におけるビジネスIDデータ検証、言語間のヒューリスティック翻字解析、非構造化データのキュレーション、ビジネスから地理のIDデータ検証など、いくつかの分野における特許の共同保有者でもある。

 

1574626860886

ジョン ・ ニコディモ ( John Nicodemo )
NFLシニアコンサルタント

アメリカ国内でも、最も優れたデータ・リーダーの一人であり、アメリカ、カナダ、そして世界各地のデータ・コンテンツ・チームのマネジメントに従事。  米国ダン・アンド・ブラッドストリートをはじめロブロー・カンパニーズ・リミテッド(カナダ最大の小売グループ)など、大手企業でデータ管理チームを率い、世界トップクラスの企業からグローバルデータ戦略やソリューションに関する依頼を受ける。  現在は、米国ナショナル・フットボール・リーグ(NFL)のシニアコンサルタントとしてファン・インテリジェンスとデータ共有のエコシステムを全面的に刷新する際のアドバイザーとして従事している。

©️Copyright Compliance Data Lab, Ltd. All rights reserved.        
掲載内容の無断転載を禁じます。

 

Similar posts

ブログ購読申込

コンプライアンス・データラボ代表取締役の山崎博史を含む国内外のコンプライアンス専門家やデータマネジメントのスペシャリストが、お客様のコンプライアンス管理にまつわる国内外の最新情報やトレンド、重要な問題を解説します。当ブログを通じて最新のベストプラクティスやガイドラインの情報も提供します。
 
ブログの購読をご希望の方は下記のリンクより、フォームに必要事項を入力してご登録ください。
配信は毎週金曜日を予定しています。購読料は無料です。