banner

ブログ

Oct 21, 2023

分析: SAP が独自のデータ ファブリックの構築を開始

11:00 EDT / 2023 年 3 月 8 日更新

トニー・ベアによる分析

テクノロジーを使用するほとんどすべての企業は、大小を問わず、通常、実質的に同等の企業の中で第一位となる戦略的サプライヤーを抱えています。 これは、サードパーティのアプリケーション、ツール、データベースの選択を促進するプラットフォームになります。 中小企業の場合、その戦略的プラットフォームのサプライヤーは Microsoft Corp. または Apple Inc. となる可能性が高く、モバイル側では Google LLC の Android または Apple の iOS が選択されます。 中規模から大企業では、プラットフォームが多極化する可能性が高く、これは、単一のコア サプライヤーを標準化する企業がほとんどないという事実を反映しています。

SAP SE は、優れたエンタープライズアプリケーションプロバイダーとして、戦略的サプライヤーの役割を任されることがよくあります。 これを裏付ける興味深い事実はたくさんありますが、最も一般的な事実の 1 つは、世界のトランザクション収益の 77% が SAP システムによるものであるということです。 SAP の使用は、データベース、分析、サポートするアプリケーションの選択に大きく影響します。

しかし、同じ組織内でも、SAP 環境の外部で作業するグループが存在する可能性があります。 おそらく、組織の一部が Oracle Corp. の e-Business Suite や Microsoft Dynamics を使用しているか、分析を扱うビジネス アナリストのグループ、またはデータ レイクからモデルを構築しているデータ サイエンティストである可能性があります。 多くの場合、データのビューは、エンタープライズ アプリケーションの壁に囲まれた庭園の内側で作業しているか外側で作業しているかによって形成されることがあります。

その考えを保持します。

データ管理に関して、私たちが直面している最も差し迫った問題は、企業が膨大で増え続けるデータをより適切に処理できるようにすることです。 データは単に多様化しているだけではなく、ますます分散化が進んでいます。 クラウド コンピューティング、接続性、5G の到達範囲という完璧な嵐により、データの到達範囲は拡大しました。 そして、ユビキタス接続に伴い、プライバシーとデータ主権に対する懸念が生じます。これらは、文字通り、どのデータを誰が、どのような形式で、どこで使用できるかについての境界を設定します。 SAP の顧客にとって、データの世界は SAP アプリケーションの外側に爆発的に広がりました。

この副産物の 1 つは、データ メッシュへの関心です。データ メッシュでは、所有権とライフサイクル管理が、データについて最も多くの知識と利害関係を持つビジネス ユニット、対象分野の専門家、またはドメインに明確に線引きされています。 その対極にあるのは、適切なデータが確実に検出され配信されるようにするための論理インフラストラクチャの構築であり、そこからデータ ファブリックへの関心が高まっていることがわかります。 私たちの見解では、この 2 つは互いに打ち消し合うのではなく、補完し合うべきです。

課題は、データ ファブリックとは何かを定義することです。 いくつかのアナリスト企業のレポートで見てきたように、データ ファブリックとは、カタログ、データ変換およびオーケストレーション ツール、データ品質、データ リネージなどを含むデータ統合ポートフォリオを指します。 その関数の定義は、私たちにとって少し大雑把すぎます。

私たちにとって、データ ファブリックは共通のメタデータ バックプレーンから開始する必要があります。 少なくとも、データ ソースをクロールし、メタデータを収集します。 より高度なデータ ファブリックでは、機械学習を使用して、どのデータ セットやエンティティが頻繁に一緒にアクセスされるかなど、ソース システムとターゲット システムのパターン アクティビティから検出された推論に基づいてメタデータを強化します。 ファブリックは、データの検出、アクセス、変換、管理、保護の複雑さを内部に隠す必要があります。

データ ファブリックは必ずしもこれらのタスクを実行するわけではありませんが、データの公開、アクセスの制御、データのクレンジング、変換、実行時のマスク、およびデータのアクセス方法を決定するツールチェーンを調整するための論理的な上部構造を提供します。クエリ エンジンへ (レプリケーション経由)、それともその逆 (仮想化経由) ですか? データ ファブリックが必要になるのは、単に単一のトランザクション システムからデータを取得する場合ではなく、さまざまなソースからデータを取得する場合です。

共有