ETLだけじゃない!Informatica IDMCの4本柱をざっくり解説

こんにちは。エンジニアの馬上です。

データが増え続ける今、みなさんの現場では「データをどう整えるか」が課題になっていませんか?

フレクトでは、Informatica領域のエンジニア育成に力を入れています。
近年はAI活用が当たり前になりつつありますが、そのAIは「良いデータ」があってこそ力を発揮します。
だからこそ、データの統合・品質管理・ガバナンスといった土台づくりは、以前にも増して重要になっています。
こうした背景から、Informaticaのプラットフォームを理解し活用できるエンジニアを社内で育てていくことは、お客様へ提供できる価値を広げるうえで欠かせない取り組みだと考えています。

その育成施策の一つとして、フレクトでは社内技術記事「Fラボ」を整備しています。
Informaticaに限らず、Salesforce、MuleSoft、AWS、Auth0など幅広い技術領域について、エンジニアが体系的に学べる記事群を用意しています。
これにより、各製品の全体像から実践的なノウハウまでを、必要な時にいつでもキャッチアップできる環境づくりに励んでいます。

今回は、このFラボのInformaticaシリーズから、主力プラットフォームであるIDMC(Intelligent Data Management Cloud)の全体像についてまとめた記事を外部向けに再編集してお届けします。
読み終えるころには、以下の3つを理解している状態を目指します。

  • Informatica IDMCが何を解決するプラットフォームなのか、コンセプトと主要サービスのイメージがつかめる

  • ある課題に対して、どのサービスから深掘りすべきかの検討がつく

  • IDMCを支えるSecure AgentやCLAIREの役割がわかる


企業データ管理でよくある困りごと

「なぜ今データ管理プラットフォームであるIDMCが必要なのか」を知る前に、まずは現場で起きているデータ管理あるあるを整理してみます。
開発やデータ活用に携わる方なら、次のような状況に心当たりはありませんか?

😢データの連携先が多すぎて、つなげられない

営業はSalesforce、経理はSAP、マーケティングはMAツール、基幹データはオンプレミスのDB...
このように部門ごとに最適化されたシステムを個別導入すると、部門間でデータをつなぐための連携が必要になりますよね。
連携が1本であれば容易ですが、システムが増えるほど「A↔B」「A↔C」「B↔C」...と組み合わせで連携が増え、必要な連携本数はn2オーダー(厳密にはn(n-1)/2)で膨らみます。
その結果、連携ごとに仕様調査・開発・テスト・監視・障害対応が発生し、運用が複雑化してしまいます。

😢どこにどんなデータがあるか、組織で共有できていない

「このカラムの意味は?」「このテーブルのデータ、どこから来てるの?」
システムの増加に伴い、データの「所在」「意味」の把握が属人化しています。
あわせて重要なのが「来歴(リネージ)」です。
データ連携を重ねてあちこちにデータを移してくると、「このテーブルのデータ、そもそもどこのシステムから来たんだっけ?」「途中でどんな変換がされているんだっけ?」がわからなくなってしまいます。
このリネージが追えないと、データに問題が見つかったときに原因の特定も修正もできず、手の打ちようがなくなります。

😢同じ顧客・製品が複数のシステムに別レコードとして存在する

「株式会社ABC」「(株)ABC」「ABC Inc.」
同一企業でも事業部ごとに表記やコード体系が異なり、システムごとに別レコードとして管理されています。
その結果、名寄せ(同一と思われるレコードを突合・統合すること)が追いつかず、正確な顧客数や取引額が把握できなくなってしまいます。
結果として、キャンペーン配信の重複、在庫・注文連携の不整合、問い合わせ履歴の分散など、業務オペレーションと顧客体験に直接影響が出てしまいます。

😢データを開放したいけど、安心安全が担保できない

個人情報保護法、GDPR(EU一般データ保護規則)、業界固有のコンプライアンス要件...
「データをもっと多くの人に使ってもらいたい」と思っても、「どのデータに個人情報が含まれているか」「誰にどこまで見せていいか」を横断的に管理する仕組みがなければ、怖くて開放できませんよね。
攻め(利活用促進)と守り(ガバナンス)のバランスが取れていない状態だと、現場は委縮してデータ活用が滞り、かといって無理に進めれば情報漏洩・監査指摘などの重大リスクを招きます。

😢AIを導入したいのに、データが信用できない

生成AIやAIエージェントを業務に取り入れても、そもそも学習・参照させるデータの品質がバラバラでは、せっかく育てたAIの出力は安定せず、信用できませんよね。
更新されていない資料が残っていたり、重複・欠損のあるデータが混在すれば、回答や提案がブレたり、もっともらしい誤情報(ハルシネーション)を招く恐れもあります。
その結果、「AIを使いたい」と思った瞬間に、「まずはデータを整備しなければ」と行き詰まる企業は少なくありません。

これらの課題に共通する根本原因は、「データの統合・品質・発見・ガバナンスを一元的に管理する仕組みがない」ことです。

Informatica IDMCとは

■一言でいうと?

IDMC(Intelligent Data Management Cloud)は、企業のあらゆるデータをつなぎ、整え、安全に管理し、活用までを支えるAI搭載クラウド型データマネジメントプラットフォームです。

■IDMCが求められる背景

前述の「企業データ管理でよくある困りごと」は、どれか一つだけが単独で起きているわけではなく、各課題同士が連鎖し、互いを悪化させる構造になってしまっていることの方が多いです。
そして多くの企業では、これらの個別のツールで場当たり的に対処してきた結果、ツールの乱立というさらなる複雑さを生んでいます。
つまり、データ管理の課題は「個別に解く」のではなく、「まとめて解く」仕組みが必要というわけです。

さらに近年、このデータ管理課題の緊急度を一段と引き上げているのがAIの進化です。
生成AIやAIエージェントの実用化が加速する中、AIに学習させるデータが汚ければ、アウトプットも信頼できないものになります。
AIの精度を上げたければ、まずデータの品質と信頼性を上げなければならないという事実が、データ管理を「いつかやらなきゃ」から「今すぐやるなきゃ」に変わりました。

しかし現実には、企業内のデータは以下のような状態にあります。

このままではAI活用どころか、日常のレポート作成さえ滞りかねません。
そこで、データの統合・品質・発見・ガバナンスを包括的に管理できるプラットフォームが必要です。
IDMCは、まさにこのデータ管理課題をまとめて解くために設計されたプラットフォームです。

■IDMCの全体像

🔶Informaticaの出発点: ETL

Informaticaは、ETLツールのベンダーとして1993年に創業され、「PowerCenter」と呼ばれるオンプレミスに特化したETL製品の提供を始めました。
一方で、企業におけるデータの役割はこの数十年で大きく変わりました。
かつてデータは業務の記録を残すためのものでしたが、今ではデータをもとに経営判断をしたり、AIの学習材料として扱われるようになり、現場が求める機能も広がっていきました。
そうした流れの中で、ETL製品の延長ではなく、データ管理全体をカバーするプラットフォームであるIDMCが生まれました。

🔶IDMCの主要機能

IDMCが提供する機能は多岐にわたりますが、まず押さえるべきは以下の4つです。
そして各機能を支えるIDMCのサービス群もあわせて紹介します。

① ETL(Extract/Transform/Load)

Informaticaの原点であり、複数システムに散らばったデータを抽出・変換し、データ基盤への集約を担います。
かつてはオンプレミスに特化したPowerCenterが主流でしたが、現在はIDMC上でオンプレミス/クラウドを問わず利用できるサービスとして提供されています。
実際の処理イメージとしては、各データソースからデータを抽出し、「データ統合」サービスの中で、不要なデータの除外、項目の変換やフォーマットの統一などの変換処理といった加工を行ったうえで、指定したターゲットに格納します。
この一連の処理フローを「マッピング」と呼び、GUI上で作成できます。
また、大量データの一括取り込みや、CDC(変更データキャプチャ)によるリアルタイムのデータ複製にも対応できます。

② iPaaS(Integration Platform as a Service)

ETLが「データの移動・変換」を得意とするのに対し、iPaaSはアプリケーション間のリアルタイム連携を担います。
具体的には、あるアプリで起きたイベントを検知して、別のアプリへの処理を自動で走らせる、という使い方です。
例えば、Salesforce(顧客管理)で受注が発生したタイミングで、「アプリケーション統合」サービスが注文情報を取得し、SAP(会計・出荷管理)への出荷指示、および顧客へのメール通知を自動実行する、といった業務プロセスをまたぐ統合を実現します。
MuleSoftもこのiPaaSに分類される代表例です。

③ データカタログ

ETLやiPaaSでデータ/アプリケーション連携を進めていくと、次に出てくるのが「このデータ、そもそもどこから来たんだっけ?」という問題に当たります。
データカタログは、社内に散らばるデータの所在・意味・リネージを可視化し、組織全体で共有できるようにする機能です。
具体的には、「メタデータコマンドセンター」サービスで各種システムからメタデータをスキャンして収集します。
収集されたメタデータは「データガバナンス&カタログ」サービス上で検索・閲覧できます。
さらに、データのリネージも項目レベルで追跡できるので、データの変遷を容易に辿れます。
データに問題が見つかったとき、どこで何が起きたのかを特定するのに欠かせない機能です。

④ MDM(マスターデータ管理)

複数システムに散らばった顧客・製品・仕入先などのマスターデータを名寄せし、組織で統一された「信頼できる唯一のレコード」(ゴールデンレコード)を作る仕組みです。
例えば、同じ取引先企業なのにシステムごとに表記が違うレコードとして管理されていて、取引額の合算すらできない、という状況が起こり得ます。
Informaticaでは、まず「Business 360 Console」サービスでマスター管理画面を作成し、データを統合するためのルールを定義します。
ルールに基づいて「Multidomain MDM」が名寄せし、「ABC株式会社」という一つのゴールデンレコードにまとめます。
これにより、これまでバラバラだったデータやシステムを跨いだ集計が一つのゴールデンレコードから把握できるようになります。

これら4つの機能や後述する派生機能が、共通のメタデータ基盤上で連携しているのがIDMCの特徴です。
例えば、①で作成したETLのリネージ情報が③のデータカタログで反映される、といった具合にサービス間で情報がシームレスにつながります。

🔶4つの柱から広がる派生機能

IDMCでは、上記の4つの機能を軸に、目的や用途に応じた多彩な機能・サービスを展開しています。
例えば、データ品質、アクセス&プライバシー、データマーケットプレイスなどがその一例です。
下図に、派生機能を担うIDMCのサービス群を一覧にまとめたので、気になる方はご確認ください。
さらに、CLAIRE AIエンジンがIDMCプラットフォーム全体に組み込まれており、各サービスのバックグラウンドでインテリジェンスを提供することで、運用の自動化や活用の高度化を支えています。

では、IDMCは実際にどうやってオンプレミス環境や各クラウドに散らばるデータソースと接続しているのでしょうか?
この接続を可能にするのがSecure Agentです。

🔶Secure Agent

Secure Agentは、利用者側のオンプレミス環境またはクラウドネットワーク上にインストールする軽量ソフトウェアです。
主な役割は以下の通りです。

  • データ処理のローカル実行

    ETL処理などのジョブを利用者側の環境内(オンプレミス/クラウド)で実行するエンジンの役割を担います。
    例えば、オンプレミス環境にあるデータ同士を統合したいとき、わざわざクラウドに転送してから処理しようとすると転送時間がかかってパフォーマンスが落ちそうです。
    加えて、機密性の高いデータを扱う場合、クラウドを経由すること自体に不安を感じるかもしれません。
    Secure Agentを使えば、Informaticaのクラウドサーバーにデータを転送せずに利用者側の環境内で処理します。
    その代わり、データの設計図となるメタデータは、Informaticaのクラウドサーバーで管理します。

  • セキュアな接続

    Secure Agentを配置した利用者側の環境内からIDMCに対して、アウトバウンド通信のみで接続します。
    そのため、外部からの接続要求を受け付ける必要がないため、ネットワークの穴を開けずに済みます。

  • あらゆる環境への橋渡し

    オンプレミスのDBから最新のSaaSまで、環境を問わず接続を確立する窓口の役割を果たします。
    Secure Agentが仲介役となることで、オンプレミス/クラウドを問わずあらゆるデータソースを一元的に操作できます。
    将来的にシステムがクラウドへ移行しても、設定変更のみで柔軟に対応できる拡張性を備えています。

このように、Secure AgentはIDMCとデータソースの間に立ち、データを利用者側の管理内に留めたまま安全に接続を実現します。
この仕組みがあるからこそ、IDMCはオンプレミスとクラウドが混在する環境でも柔軟に対応できます。

■IDMCの優位性

✅GUIでのノンコーディング開発による高い生産性

IDMCの各サービスは、すべてローコード/ノーコードのGUI操作で利用できます。

  • データ統合のETL構築やAPI連携のプロセス設計など、コードを書かずに実現可能です。
  • データ品質ルール用の判定文としてSQLが必要な場合でも、自然言語を入力すればCLAIREがSQL文を生成してくれます。
  • SQLやプログラミングの経験が浅いメンバーでも直感的に操作でき、属人化を防ぎながら開発スピードを大幅に向上させることができます。
✅ワンプラットフォームにサービスが統合されている

データ/アプリケーション統合・データカタログ・MDMなどの機能が、共通のメタデータ基盤上でシームレスに連携します。
複数のポイントソリューションを組み合わせる場合と比較して、以下のメリットがあります。

  • サービス間でメタデータを共有できるため、データリネージが一貫管理される
  • 統一された操作画面ですべてのサービスにアクセスできる
  • 個別製品間の連携開発が不要となり、導入・運用コストが下がる
✅ハイブリッドアーキテクチャ

IDMCのコントロールプレーン(ジョブの定義やスケジュール管理を行う管理機能)はクラウド上にありますが、データ処理は主にSecure Agentを通じてオンプレミスや利用者側のクラウド環境で実行できます。
これにより、以下のような柔軟性が得られます。

  • オンプレミス環境やマルチクラウドをシームレスに接続
  • データを社外に出さずに統合処理が可能
    (Secure Agentが利用者側の環境内でデータを処理するため、Informaticaのクラウドサーバーにはデータが渡らない)
✅AI機能(CLAIRE)がプラットフォーム全体に組み込まれている

CLAIREは、メタデータの深い理解に基づき、各サービスに横断的にインテリジェンスを提供します。

  • データ管理の自動化、マッピング候補の推奨、品質ルールの提案など、手作業を大幅に削減
  • 自然言語で「○○のデータを探して」と指示すれば、カタログから適切なデータセットを発見
  • データ品質問題の検知・修正を自律的に実行

IDMC活用例

ここまでの内容を踏まえ、冒頭で挙げた「よくある困りごと」から自然に出てくる要望を起点に、IDMCのどのサービスが解決策となるかを整理します。

要望 活用するサービス 詳細
複数システム間でデータを連携したい ETL処理を実施するためのマッピングを作成し、オンプレミスからクラウドまであらゆるシステム間のデータを連携
数億件規模のデータを別のデータソースに取り込みたい ソースとターゲットを接続するだけのシンプルな構成で、数億件規模のデータ転送をスムーズに実現
リアルタイムなデータ連携を得意とするMuleSoftに対し、Informaticaでは大規模データの転送に特化
アプリケーション同士をリアルタイム連携したい アプリケーション間のAPI連携や、イベント駆動のワークフロー自動化を実現
データの品質を改善・維持したい プロファイリングでデータの現状を把握したうえで、クレンジング・標準化を自動化し、品質を継続的に監視する仕組みを構築
何のデータがどこにあるか把握したい メタデータを収集し、システム横断でデータ資産を検索・可視化できるように
顧客・製品のマスターデータを一元管理したい 複数システムに散らばった同一顧客・製品の表記揺れを名寄せし、組織で統一された「信頼できる唯一のレコード」を生成・管理
データのアクセス制御・規制対応を強化したい ポリシーベースのアクセス管理やマスキングを適用

※表に含まれるInformaticaのサービスアイコンは、IDMCの操作画面から取得したものです。

まとめ

本記事では、Informaticaの主力プラットフォームであるIDMCの全体像を見てきました。

企業のデータ課題は、個別のツールで一つずつ解決しようとするほど、ツールの乱立や運用の複雑化を招き、かえって状況が悪化しがちです。
その点、IDMCはデータの統合・品質・発見・ガバナンスを共通のメタデータ基盤でまとめて扱えるプラットフォームです。
さらに、Secure Agentを組み合わせれば、オンプレミス/クラウド問わず、分断しがちなデータ管理をまとめて解決できます。
そして、AI活用の成否を左右するのは、結局のところ「データが信頼できるかどうか」です。
IDMCでデータの土台を整えることが、AI時代における最も確実な第一歩だと考えます。

本記事がInformatica IDMCに興味を持つきっかけになれば幸いです。
最後までお読みいただき、ありがとうございました。


用語一覧

用語 一言説明
IDMC Intelligent Data Management Cloud。InformaticaのAI搭載クラウド型データマネジメントプラットフォーム
CLAIRE IDMCに組み込まれたAIエンジン。メタデータに基づくインテリジェント自動化を提供
Secure Agent オンプレミス/クラウド上に設置し、IDMCとデータソースをセキュアに接続する軽量ソフトウェア
以下、サービス名
データ統合 ETL処理を実施するためのマッピングを作成し、システム間のデータ連携を実現
アプリケーション統合 アプリケーション間のリアルタイム連携や、ビジネスプロセスの自動化を実現
データ品質 データのクレンジング・標準化・重複排除をルールベースで実行
データプロファイリング データの中身を分析し、傾向・分布・異常値などを把握
データガバナンス&カタログ メタデータを自動収集し、データ資産の検索・リネージ可視化・ビジネス用語集の管理を実現
メタデータコマンドセンター メタデータの取り込み状況やカタログの健全性を一元的にモニタリング
Multidomain MDM 顧客・製品・取引先・従業員など複数ドメインのマスターデータを統合管理
Business 360 Console Multidomain MDM、360アプリケーション群の設定・管理を行う統合コンソール
その他サービス 🔶4つの柱から広がる派生機能」を参照