JP2016525734A - Etlマップ設計のためのプロジェクタおよびセレクタコンポーネントタイプの使用 - Google Patents

Etlマップ設計のためのプロジェクタおよびセレクタコンポーネントタイプの使用 Download PDF

Info

Publication number
JP2016525734A
JP2016525734A JP2016513953A JP2016513953A JP2016525734A JP 2016525734 A JP2016525734 A JP 2016525734A JP 2016513953 A JP2016513953 A JP 2016513953A JP 2016513953 A JP2016513953 A JP 2016513953A JP 2016525734 A JP2016525734 A JP 2016525734A
Authority
JP
Japan
Prior art keywords
components
data
logical design
attributes
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016513953A
Other languages
English (en)
Other versions
JP2016525734A5 (ja
JP6412924B2 (ja
Inventor
リー,ジョン
アラン,デイビッド
ラウ,クウォク−ハン・(トーマス)
Original Assignee
オラクル・インターナショナル・コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by オラクル・インターナショナル・コーポレイション filed Critical オラクル・インターナショナル・コーポレイション
Publication of JP2016525734A publication Critical patent/JP2016525734A/ja
Publication of JP2016525734A5 publication Critical patent/JP2016525734A5/ja
Application granted granted Critical
Publication of JP6412924B2 publication Critical patent/JP6412924B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stored Programmes (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

マッピングの設計およびメンテナンスを簡素化するための1つ以上の技術を組み込むデータ統合システムが開示される。データ統合システムは、コンポーネントが既存の設計に追加または除去される際に、すべての入力および出力属性を特定する必要性を除去する。1つの局面において、アサインメントエクスプレッションが上流のコンポーネントのすべてまたは部分を参照することを可能にするコンポーネントタイプが実現される。したがって、あるタイプのコンポーネントの属性は、下流のコンポーネントに伝播し得るか、または、そうでなければマップデザイナーの側の最小の労力で上流のコンポーネントから引き継がれ得る。コード生成の間に、任意のコンポーネントによってプロジェクトされるのに必要な属性は、下流のコンポーネントの必要性に基づいて導き出され得る。

Description

発明の背景
ペースが一層速くなっている今日のビジネス環境において、組織はより特殊化されたソフトウェアアプリケーションを使用する必要がある。さらに、組織は、異種混合のハードウェアプラットフォームおよびシステム上でこれらのアプリケーションの共存を保証する必要があるとともに、アプリケーションとシステムとの間でデータを共有する能力を保証する必要がある。
データ統合は、あるシステムから別のシステムへのデータ移行を行なうために具体的に構成する特別に設計されたソフトウェアを有するプロプライエタリサーバを必要とするリソース集中的なプロシージャである。これらのエリアにおいて、パフォーマンスが典型的に貧弱または非能率的となっている。
したがって、データ統合シナリオの開発に関係する問題を解決することが望まれており、そのいくつかが本願明細書において論じられ得る。さらに、データ統合シナリオの開発に関係する障害を低減することが望まれており、そのいくつかが本願明細書において論じられ得る。
発明の概要
この開示の以下の部分は、少なくとも主題の基本的な理解を提供する目的のために、この開示において発見される1つ以上のイノベーション、実施形態および/または例の簡素化された概要を提供する。この概要は、如何なる特定の実施形態または例の広範囲な概要も提供することを試みてはいない。さらに、この概要は、実施形態または例の主な/決定的な要素を識別するようには意図されておらず、または、この開示の主題の範囲を定めるようには意図されていない。したがって、この概要の1つの目的は、この開示において発見されるいくつかのイノベーション、実施形態および/または例を簡素化された形で、後述されるさらなる詳細な説明の前置きとして提供することであり得る。
さまざまな実施形態において、ユーザはデータ統合システムによって、プラットホームおよび技術に依存しない論理設計を作成し得る。ユーザは、ユーザがデータをソースとターゲットとの間でどのように流したいかをハイレベルで規定する論理設計を作成し得る。ユーザのインフラストラクチャを考慮して、ツールが論理設計を分析し、物理的設計を作成し得る。論理設計は、設計における各ソースおよびターゲットならびにジョインまたはフィルタのようなオペレーションおよびアクセスポイントに対応する複数のコンポーネントを含み得る。物理的設計に転送された際の各コンポーネントは、データに対してオペレーションを行なうようコードを生成する。存在する技術(たとえばSQLサーバ、オラクル、Hadoopなど)およびに使用される言語(SQL、pigなど)に依存して、各コンポーネントによって生成されるコードは異なり得る。
1つの局面において、データ統合システムのユーザは、始めから終わりまで、論理設計における各コンポーネントにて、すべてのデータ属性を特定する必要はない。データ統合システムは、論理設計を通って流れる情報を完全に宣言する必要性を回避する、プロジェクタおよびセレクタタイプのような複数のコンポーネントタイプを提供する。データ統合システムは、所定のコンポーネントタイプによって表わされるオペレーションにて何の属性が必要とされるか決定し得る。これは、設計およびメンテナンスの両方を簡素化する。さまざまな局面において、既存のRDBMSリソースと、パフォーマンスの向上を達成するために別個のプロプラエタリETLサーバの必要性を回避する性能とをレバレッジするデータ変換および移行が提供される。
一実施形態において、データマッピングの生成を促進するための方法は、論理設計の1つ以上のコンポーネントを特定する情報を受け取ることを含み、1つ以上のコンポーネントのうちの少なくとも1つは第1のタイプである。第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つの論理設計における下流のコンポーネントに可視であるデータ属性のセットが、論理設計における上流のコンポーネントに基づいて、判定される。次いで、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つの論理設計における下流のコンポーネントに可視である属性のセットを示す情報が生成される。1つの局面において、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つの論理設計における下流のコンポーネントに可視であるデータ属性のセットを判定することは、上流のコンポーネントから可視である1つ以上の属性を導き出すことと、下流のコンポーネントに1つ以上の属性をエクスポーズする(expose)こととを含み得る。別の局面において、論理設計の1つ以上のコンポーネントを特定する情報を受け取ることは、論理設計を通って流れる情報の形を変更するオペレーションを示す情報を受け取ることを含み得る。
いくつかの実施形態において、論理設計の1つ以上のコンポーネントを特定する情報を受け取ることは、論理設計を通って流れる情報のフローを制御するが論理設計を通って流れる情報の形を変更しないオペレーションを示す情報を受け取ることを含み得る。さらに別の実施形態において、論理設計の1つ以上のコンポーネントを特定する情報を受け取ることは、ソースデータストアに格納されるデータの1つ以上の属性を有するソースコンポーネントを示す情報を受け取ることを含み得る。論理設計の1つ以上のコンポーネントを特定する情報を受け取ることは、ターゲットデータストアに格納されるデータの1つ以上の属性を有するターゲットコンポーネントを示す情報を受け取ることを含み得る。
第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つの論理設計における下流のコンポーネントに可視である属性のセットを示す情報を生成することは、下流のコンポーネントに属性のリストをエクスポートすることを含み得る。一実施形態において、論理設計へのコンポーネントまたは属性の導入または除去による論理設計における変更が受け取られ得る。論理設計における変更が第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つに影響するかどうかの判定がなされる。論理設計における変更が、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つに影響するという判定に基づいて、下流のコンポーネントに可視であるデータ属性の更新されたセットが判定され得る。
さらに別の実施形態において、論理設計へのコンポーネントまたは属性の導入による論理設計における変更が受け取られる。論理設計における変更が第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つに影響するかどうかを判定がなされ得る。論理設計における変更が、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つに影響するという判定に基づいて、下流のコンポーネントに可視であるデータ属性のセットが保存され得る。別の局面において、論理設計における変更が、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つに影響するという判定に基づいて、下流のコンポーネントに可視であるデータ属性のセットが自動的にリネームされ得る。
一実施形態において、一時的でないコンピュータ読取可能媒体は、データマッピングの生成を促進するためのコンピュータ実行可能コードを格納する。一時的でないコンピュータ読取可能媒体は、論理設計の1つ以上のコンポーネントを特定する情報を受け取るためのコードを含み、1つ以上のコンポーネントのうちの少なくとも1つは第1のタイプであり、一時的でないコンピュータ読取可能媒体はさらに、論理設計における上流のコンポーネントに基づいて、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つの論理設計における下流のコンポーネントに可視であるデータ属性のセットを判定するためのコードと、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つの論理設計における下流のコンポーネントに可視である属性のセットを示す情報を生成するためのコードとを含み得る。
別の実施形態において、データマッピングの生成を促進するためのシステムは、プロセッサと、プロセッサと通信するとともに命令のセットを格納するように構成されるメモリとを含み得、命令のセットは、プロセッサによって実行されると、論理設計の1つ以上のコンポーネントを特定する情報を受け取るようにプロセッサを構成し、1つ以上のコンポーネントのうちの少なくとも1つは第1のタイプであり、命令のセットはさらに、論理設計における上流のコンポーネントに基づいて、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つの論理設計における下流のコンポーネントに可視であるデータ属性のセットを判定し、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つの論理設計における下流のコンポーネントに可視である属性のセットを示す情報を生成するようにプロセッサを構成する。
一実施形態において、データマッピングの生成を促進するためのシステムは、論理設計の1つ以上のコンポーネントを特定する情報を受け取るように構成される受取部を含み、1つ以上のコンポーネントのうちの少なくとも1つは第1のタイプであり、システムは、論理設計における上流のコンポーネントに基づいて、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つの論理設計における下流のコンポーネントに可視であるデータ属性のセットを判定するように構成される判定部と、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つの論理設計における下流のコンポーネントに可視である属性のセットを示す情報を生成するように構成される生成部とを含む。第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つの論理設計における下流のコンポーネントに可視であるデータ属性のセットを判定することは、上流のコンポーネントから可視である1つ以上の属性を導き出すとともに、下流のコンポーネントに1つ以上の属性をエクスポーズすることを含み得る。
論理設計の1つ以上のコンポーネントを特定する情報は、論理設計を通って流れる情報の形を変更するオペレーションを示す情報を含み得る。論理設計の1つ以上のコンポーネントを特定する情報は、論理設計を通って流れる情報のフローを制御するが論理設計を通って流れる情報の形を変更しないオペレーションを示す情報を含み得る。論理設計の1つ以上のコンポーネントを特定する情報は、ソースデータストアに格納されるデータの1つ以上の属性を有するソースコンポーネントを示す情報を含み得る。論理設計の1つ以上のコンポーネントを特定する情報は、ターゲットデータストアに格納されるデータの1つ以上の属性を有するターゲットコンポーネントを示す情報を含み得る。第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つの論理設計における下流のコンポーネントに可視である属性のセットを示す情報を生成することは、下流のコンポーネントに属性のリストをエクスポートすることを含み得る。
一実施形態において、受取部はさらに、論理設計へのコンポーネントまたは属性の導入または除去による論理設計における変更を受け取るように構成されており、判定部はさらに、論理設計における変更が、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つに影響するかどうかを判定するように構成されており、判定部はさらに、論理設計における変更が、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つに影響するという判定に基づいて、下流のコンポーネントに可視であるデータ属性の更新されたセットを判定するように構成される。
1つの局面において、システムはさらに保存部を含み得、受取部はさらに、論理設計へのコンポーネントまたは属性の導入による論理設計における変更を受け取るように構成されており、判定部はさらに、論理設計における変更が、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つに影響するかどうかを判定するように構成されており、保存部は、論理設計における変更が、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つに影響するという判定に基づいて、下流のコンポーネントに可視であるデータ属性のセットを保存するように構成される。
別の局面において、システムはさらにリネーム部を含み得、受取部はさらに、コンポーネントまたは属性をリネームする論理設計における変更を受け取るように構成されており、判定部はさらに、論理設計における変更が、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つに影響するかどうかを判定するように構成されており、リネーム部は、論理設計における変更が、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つに影響するという判定に基づいて、下流のコンポーネントに可視であるデータ属性のセットをリネームするように構成される。
この開示の主題の性質および均等物(ならびに提供される如何なる固有または明白な利点および改良)のさらなる理解は、この開示の残りの部分、任意の添付の図面および請求の範囲への参照により、上記のセクションに加えて実現されるべきである。
この開示において発見されるイノベーション、実施形態および/または例を適切に記載および説明するために、1つ以上の添付の図面に対して参照がなされ得る。1つ以上の添付の図面を説明するよう用いられる付加的な詳細または例は、特許請求される発明のいずれか、ここで記載される実施形態および/または例のいずれか、またはこの開示において示されるいずれかのイノベーションの現在理解されている最良の形態の範囲への限定と見なされるべきではない。
本発明の実施形態を組み込み得るシステムの簡略図である。 本発明の実施形態に従ったデータ統合システムのブロック図である。 本発明の実施形態に従った、データ統合システムを実現するために使用され得るハードウェア/ソフトウェアスタックの簡略ブロック図である。 データ統合シナリオが本発明のさまざまな実施形態において作成され得るさまざまな異種混合のデータソースを有する環境のブロック図である。 データ統合システムによって実行され得る従来のデータ統合処理における簡略化されたデータフローを示す図である。 データ統合システムによって実行され得る従来のデータ統合処理における簡略化されたデータフローを示す図である。 本発明の実施形態に従った、データ統合システムによって実行され得る次世代データ統合処理における簡略化されたデータフローを示す図である。 本発明の実施形態に従った、データ統合システムによって実行され得る次世代データ統合処理における簡略化されたデータフローを示す図である。 本発明に従った一実施形態におけるODIスタジオとデータ統合システムのリポジトリとの間の相互作用の簡略ブロック図である。 本発明の実施形態に従った、データ統合シナリオを作成するための方法のフローチャートを示す図である。 本発明の実施形態に従った、データ統合シナリオを作成するためのユーザインターフェイスのスクリーンショットの図である。 本発明の実施形態に従った、マッピングを作成するための方法のフローチャートを示す図である。 本発明の実施形態に従った、データ統合シナリオにおいてマッピング情報を提供するためのユーザインターフェイスのスクリーンショットの図である。 本発明の実施形態に従った、データ統合シナリオにおいてフロー情報を提供するためのユーザインターフェイスのスクリーンショットの図である。 本発明の実施形態に従った、パッケージを作成するための方法のフローチャートを示す図である。 本発明の実施形態に従った、データ統合シナリオにおいてパッケージシーケンス情報を提供するためのユーザインターフェイスのスクリーンショットの図である。 本発明の実施形態に従った、データ統合シナリオを展開するための方法のフローチャートを示す図である。 本発明に従った一実施形態におけるマッピングの簡略ブロック図である。 本発明に従った一実施形態におけるマッピングの簡略ブロック図である。 本発明の実施形態に従った、コンポーネントタイプに基づいてコンポーネント属性を導き出すための方法のフローチャートを示す図である。 本発明に従った一実施形態においてフィルタコンポーネントを有する図16Aおよび図16Bのマッピングの簡略ブロック図である。 本発明に従った一実施形態におけるマッピングの簡略ブロック図である。 本発明の実施形態に従った、コンポーネントを生成するための方法のフローチャートを示す図である。 本発明の実施形態を実施するために使用され得るコンピュータシステムの簡略ブロック図である。 実施形態に従ったデータマッピングの生成を促進するためのシステムの簡略ブロック図である。
発明の詳細な説明
イントロダクション
さまざまな実施形態において、ユーザはデータ統合システムによって、プラットホームおよび技術に依存しない論理設計を作成し得る。ユーザは、ユーザがデータをソースとターゲットとの間でどのように流したいかをハイレベルで規定する論理設計を作成し得る。ユーザのインフラストラクチャを考慮して、ツールが論理設計を分析し、物理的設計を作成し得る。論理設計は、設計における各ソースおよびターゲットならびにジョインまたはフィルタのようなオペレーションおよびアクセスポイントに対応する複数のコンポーネントを含み得る。物理的設計に転送された際の各コンポーネントは、データに対してオペレーションを行なうようコードを生成する。存在する技術(たとえばSQLサーバ、オラクル、Hadoopなど)およびに使用される言語(SQL、pigなど)に依存して、各コンポーネントによって生成されるコードは異なり得る。
1つの局面において、データ統合システムのユーザは、始めから終わりまで、論理設計における各コンポーネントにて、すべてのデータ属性を特定する必要はない。データ統合システムは、論理設計を通って流れる情報を完全に宣言する必要性を回避する、プロジェクタおよびセレクタタイプのような複数のコンポーネントタイプを提供する。データ統合システムは、所定のコンポーネントタイプによって表わされるオペレーションにて何の属性が必要とされるか決定し得る。これは、設計およびメンテナンスの両方を簡素化する。
図1は、この開示において発見されるイノベーション、実施形態および/または例のいずれかの実施形態を組み込み得るか、または、実施形態に組み込まれ得るシステム100の簡略図である。図1は、本発明を組み込む実施形態を単に例示しており、請求の範囲において記載される本発明の範囲を限定しない。当業者は、他の変形例、修正例および代替例を認識するであろう。
一実施形態において、システム100は1つ以上のユーザコンピュータ110(たとえばコンピュータ110A、110Bおよび110C)を含む。ユーザコンピュータ110は、(任意の適切な種類のマイクロソフト社のWindows(登録商標)および/またはアップル社のMacintosh(登録商標)オペレーティングシステムを実行するパーソナルコンピュータおよび/もしくはラップトップコンピュータを単に例示として含む)汎用のパーソナルコンピュータ、ならびに/または、さまざまな商業的に利用可能なUNIX(登録商標)もしくはUNIXライクなオペレーティングシステムのいずれかを実行するワークステーションコンピュータであり得る。これらのユーザコンピュータ110はさらに、本発明の方法を行なうように構成される1つ以上のアプリケーションと、1つ以上のオフィスアプリケーション、データベースクライアントおよび/またはサーバアプリケーションならびにウェブブラウザアプリケーションとを含むさまざまなアプリケーションのうちのいずれかを有し得る。
代替的には、ユーザコンピュータ110は、ネットワーク(たとえば以下に記載される通信ネットワーク120)を介して通信することができ、ならびに/または、ウェブページもしくは他のタイプの電子文書を表示およびナビゲートすることができるシンクライアントコンピュータ、インターネットが有効化された携帯電話、および/または携帯情報端末といった任意の他の電子デバイスであり得る。例示的なシステム100は3つのユーザコンピュータを有するよう示されているが、任意の数のユーザコンピュータまたはデバイスがサポートされ得る。
本発明のある実施形態は、通信ネットワーク120を含み得るネットワーク化された環境において動作する。通信ネットワーク120は、TCP/IP、SNA、IPX、およびAppleTalkなどを含むがこれらに限定されないさまざまな商業的に利用可能なネットワークプロトコルのいずれかを用いるデータ通信をサポートし得る、当業者が精通している任意のタイプのネットワークであり得る。単に例示として、通信ネットワーク120は、イーサネット(登録商標)ネットワークおよび/もしくはトークンリングネットワークなどを含むがこれらに限定されないローカルエリアネットワーク(「LAN」)、ワイドエリアネットワーク、仮想プライベートネットワーク(VPN:virtual private network)を含むがこれに限定されない仮想ネットワーク、インターネット、イントラネット、エクストラネット、公衆交換電話ネットワーク(「PSTN:public switched telephone network」)、赤外線ネットワーク、IEEE802.11スイートのプロトコル、当該技術において公知であるBluetooth(登録商標)プロトコル、および/もしくは任意の他の無線プロトコルのいずれかの下で動作するネットワークを含むがこれに限定されないワイヤレスネットワーク、ならびに/または、これらおよび/もしくは他のネットワークの任意の組合せであり得る。
本発明の実施形態は、1つ以上のサーバコンピュータ130(たとえばコンピュータ130Aおよび130B)を含み得る。サーバコンピュータ130の各々は、上で論じられたオペレーティングシステムのいずれかを含むがこれらに限定されないオペレーティングシステムと、任意の商業的に利用可能なサーバオペレーティングシステムとを有するよう構成され得る。サーバコンピュータ130の各々はさらに、1つ以上のクライアント(たとえばユーザコンピュータ110)および/または他のサーバ(たとえばサーバコンピュータ130)にサービスを提供するように構成され得る1つ以上のアプリケーションを実行し得る。
単に例示として、サーバコンピュータ130の1つは、単に例示としてウェブページまたは他の電子文書についてユーザコンピュータ110からの要求を処理するよう使用され得るウェブサーバであり得る。ウェブサーバはさらに、HTTPサーバ、FTPサーバ、CGIサーバ、データベースサーバ、およびJava(登録商標)サーバなどを含むさまざまなサーバアプリケーションを実行し得る。本発明のいくつかの実施形態において、ウェブサーバは、本発明の方法を実行するよう、ユーザコンピュータ110の1つ以上の上でウェブブラウザ内で動作され得るウェブページを取り扱うように構成され得る。
いくつかの実施形態において、サーバコンピュータ130は、ユーザコンピュータ110および/または他のサーバコンピュータ130の1つ以上の上で実行される、クライアントによってアクセス可能な1つ以上のアプリケーションを含み得る1つ以上のファイルおよび/またはアプリケーションサーバを含み得る。単に例示として、サーバコンピュータ130の1つ以上は、ユーザコンピュータ110および/または他のサーバコンピュータ130に応答して、(いくつかの場合において本発明の方法を行なうように構成され得る)ウェブアプリケーションを含むがこれらに限定されないプログラムまたはスクリプトを実行可能な1つ以上の汎用コンピュータであり得る。
単に例示として、ウェブアプリケーションは、Java、CもしくはC++のような任意のプログラミング言語、および/または、Perl、Python、もしくはTCLのような任意のスクリプト言語、および、任意のプログラミング/スクリプト言語の組合せで記述された1つ以上のスクリプトまたはプログラムとして実現され得る。アプリケーションサーバはさらに、オラクル、マイクロソフト、およびIBMなどから商業的に利用可能なものを含むがこれらに限定されないデータベースサーバを含み得、当該データベースサーバは、ユーザコンピュータ110の1つおよび/またはサーバコンピュータ130の別の1つの上で実行されるデータベースクライアントからの要求を処理し得る。
いくつかの実施形態において、アプリケーションサーバは、本発明の実施形態に従って情報を表示するために動的にウェブページを作成し得る。アプリケーションサーバによって提供されるデータは、(たとえばHTML、XML、Javascript、AJAXなどを含む)ウェブページとしてフォーマットされ得るか、および/または、(たとえば上述したような)ウェブサーバを介してユーザコンピュータ110の1つへ転送され得る。同様に、ウェブサーバは、ユーザコンピュータ110の1つからウェブページ要求および/もしくは入力データを受け取り得、ならびに/または、アプリケーションサーバへウェブページ要求および/もしくは入力データを転送する。
さらに別の実施形態に従うと、サーバコンピュータ130の1つ以上は、ファイルサーバとして機能し得、ならびに/または、ユーザコンピュータ110の1つおよび/もしくはサーバコンピュータ130の別の1つ上で実行されるアプリケーションによって組み込まれる、本発明の方法を実現するのに必要なファイルの1つ以上を含み得る。代替的には、当業者が理解するように、ファイルサーバは、すべての必要なファイルを含み得、ユーザコンピュータ110および/またはサーバコンピュータ130の1つ以上によってそのようなアプリケーションが遠隔から呼び出されることを可能にする。なお、本願明細書におけるさまざまなサーバ(たとえばアプリケーションサーバ、データベースサーバ、ウェブサーバ、ファイルサーバなど)について記載される機能は、インプリメンテーションに特有のニーズおよびパラメータに依存して、単一のサーバおよび/または複数の特殊化されるサーバによって実行され得る。
ある実施形態において、システム100は、1つ以上のデータベース140(たとえばデータベース140Aおよび140B)を含み得る。データベース140の位置は任意である。すなわち、単に例示として、データベース140Aは、サーバコンピュータ130A(および/またはユーザコンピュータ110の1つ以上)に対してローカルな(および/または存在している)記憶媒体上に存在し得る。代替的には、データベース140Bは、(たとえば通信ネットワーク120を介して)ユーザコンピュータ110およびサーバコンピュータ130の1つ以上と通信し得る限り、ユーザコンピュータ110およびサーバコンピュータ130のいずれかまたはすべてからリモートであり得る。実施形態の特定の集合では、データベース140は、当業者が精通しているストレージエリアネットワーク(SAN)に存在し得る。(同様に、ユーザコンピュータ110およびサーバコンピュータ130に起因する機能を実行するための任意の必要なファイルが適切なように、それぞれのコンピュータ上にローカルにおよび/またはリモートに格納され得る。)実施形態の1つの集合において、データベース140の1つ以上は、SQLフォーマットのコマンドに応答してデータを格納、更新および抽出するよう適合されるリレーショナルデータベースであり得る。たとえば、データベース140は、上述したように、データベースサーバによって制御および/または維持され得る。
データ統合の概略
図2は、本発明のある実施形態に従ったデータ統合システム200の簡略ブロック図である。図2は、この開示において示される1つ以上の発明のさまざまな実施形態または実現例を組み込み得るデータ統合システム200の簡略図である。図2は、本願明細書において開示される発明の実施形態または実現例を単に例示しているだけであり、請求の範囲に記載されるような任意の発明の範囲を限定するべきでない。当業者は、この開示および本願明細書において示される教示を通じて、図において示される実施形態または実現例に対する他の変形例、修正例および/または代替例を認識し得る。
この実施形態において、データ統合システム200は、情報ソース202、情報統合部204、および情報宛先部206を含む。一般に、情報ソース202から情報統合部204に情報が流れ、これにより、情報は、情報宛先部206によって、消費され、利用可能になり、または別の態様で使用され得る。データフローは一方向または双方向であり得る。いくつかの実施形態において、1つ以上のデータフローがデータ統合システム200に存在し得る。
情報ソース202は、データを提供するよう構成される1つ以上のハードウェアおよび/またはソフトウェア要素を示す。情報ソース202は、データへの直接または間接のアクセスを提供し得る。この実施形態において、情報ソース202は、1つ以上のアプリケーション208と1つ以上のリポジトリ210とを含む。
アプリケーション208は、デスクトップアプリケーション、ホストされたアプリケーション、ウェブベースアプリケーション、またはクラウドベースアプリケーションのような従来のアプリケーションを示す。アプリケーション208は、1つ以上の所定の目的のために、データを受け取り、処理し、かつ維持するように構成され得る。アプリケーション208のいくつかの例は、カスタマーリレーションシップマネジメント(CRM:customer relationship management)アプリケーション、金融サービスアプリケーション、管理およびリスクコンプライアンスアプリケーション、人的資本マネージメント(HCM:human capital management)調達アプリケーション、サプライチェーンマネジメントアプリケーション、または、プロジェクトもしくはポートフォリオマネージメントアプリケーションなどを含む。アプリケーション208は、当該技術において公知のようなさまざま人間が読むことが可能でありマシンが読み取り可能なフォーマットでアプリケーションデータを操作およびエクスポートするために構成される機能を含み得る。アプリケーション208はさらに、リポジトリ210におけるデータにアクセスするとともに、リポジトリ210にデータを格納し得る。
リポジトリ210は、データへのアクセスを提供するように構成されるハードウェアおよび/またはソフトウェア要素を示す。リポジトリ210は、データの論理的および/または物理的なパーティショニングを提供し得る。リポジトリ210は、リポーティングおよびデータ分析をさらに提供し得る。リポジトリ210のいくつかの例は、データベース、データウェアハウス、またはクラウドストレージなどを含む。リポジトリは、1つ以上のアプリケーション208からのデータを統合することにより作成される中央レポジトリを含み得る。リポジトリ210に格納されたデータは、オペレーショナルシステムからアップロードされ得る。データは、ソースにおいて利用可能になる前に付加的なオペレーションを介して渡され得る。
情報統合部204は、データ統合サービスを提供するように構成される1つ以上のハードウェアおよび/またはソフトウェア要素を示す。直接または間接のデータ統合サービスが情報統合部204において提供され得る。この実施形態において、情報統合部204は、データ移行部212、データウェアハウジング部214、マスターデータマネージメント部216、データ同期部218、連結部220、およびリアルタイムメッセージ部222を含む。情報統合部204は、データ統合機能を提供する1つ以上のモジュール、サービス、または、ここで示された要素以外の付加的な要素を含み得るということが理解されるであろう。
データ移行部212は、データ移行を提供するように構成される1つ以上のハードウェアおよび/またはソフトウェア要素を示す。一般に、データ移行部212は、ストレージタイプ、フォーマット、またはシステム同士の間でデータを転送するための1つ以上のプロセスを提供する。データ移行部212は通常、移行を達成するようマニュアルまたはプログラムオプションを提供する。データ移行プロシージャにおいて、1つのシステム上のデータまたは1つのシステムによって提供されるデータは、データ抽出およびデータロードのための設計を提供する別のシステムにマッピングされる。データ移行は、1つ以上のフェーズを含み得、当該1つ以上のフェーズとしてはたとえば、第1のシステムのデータ形式を第2のシステムのフォーマットおよび要件に関連させる1つ以上の設計が作成される設計フェーズと、データが第1のシステムから読み出されるデータ抽出フェーズと、データクリーニングフェーズと、データが第2のシステムに書き込まれるデータローディングフェーズとがある。いくつかの実施形態において、データ移行は、データが上記のフェーズのうちのいずれかにおいて正確に処理されるかどうか判定するよう、データ検証フェーズを含み得る。
データウェアハウジング部214は、リポーティングおよびデータ分析のために使用されるデータベースを提供するように構成される1つ以上のハードウェアおよび/またはソフトウェア要素を示す。データウェアハウスは典型的に、1つ以上の異種のソースからのデータを統合することにより作成されるデータの中央レポジトリとして閲覧される。データウェアハウジング部214は、現在のデータの格納と履歴データの格納とを含み得る。データウェアハウジング部214は、典型的な抽出、変換、ロード(ETL:extract, transform, load)ベースのデータウェアハウスを含み得、これにより、ステージング層、データ統合層およびアクセス層が主な機能を収容する。一例において、ステージング層またはステージングデータベースは、1つ以上の異なるソースデータシステムの各々から抽出される生データを格納する。統合層は、ステージング層からのデータを変換し、オペレーショナルデータストア(ODS:operational data store)データベースにこの変換されたデータをしばしば格納することによって、異なるデータセットを統合する。その後、統合データは、しばしばデータウェアハウスデータベースと称されるさらに別のデータベースに移される。当該データは、(しばしば次元と称される)階層グループと、ファクト(fact)およびアグリゲートファクト(aggregate fact)とへ配され得る。アクセス層は、ユーザまたは他のシステムがデータを抽出するのを補助するために提供され得る。データウェアハウスはデータマートへ細分され得、これにより、各データマートはウェアハウスからのデータのサブセットを格納する。いくつかの実施形態において、データウェアハウジング部214は、ビジネスインテリジェンスツールと、データを抽出、変換およびリポジトリへロードするツールと、メタデータを管理および抽出するツールとを含み得る。
マスターデータマネージメント部216は、データのマスターコピーを管理するように構成される1つ以上のハードウェアおよび/またはソフトウェア要素を示す。マスターデータマネージメント部216は、一貫してマスターデータを規定および管理するプロセス、ガバナンス、ポリシー、スタンダードおよびツールのセットを含み得る。マスターデータマネージメント部216は、マスターデータの信頼すべきソースを作成するために、重複を除去し、データを標準化し、ルールを組み込んでシステムに誤ったデータが入ることを除去するための機能を含み得る。マスターデータマネージメント部216は、データを収集、集合、マッチング、統合、品質保証、持続、組織の全体にわたって配分するためのプロセスを提供し得、これにより、情報の進行中のメンテナンスおよびアプリケーション使用において一貫性および制御を保証する。
データ同期部218は、データを同期させるように構成される1つ以上のハードウェアおよび/またはソフトウェア要素を示す。データ同期部218は、ソースからターゲットおよびその逆のデータの間の一貫性を確立することを提供し得る。データ同期部218はさらに、時間にわたるデータの連続的なハーモナイゼーションを提供し得る。
連結部220は、構成要素ソースからのデータの閲覧を統合するように構成される1つ以上のハードウェアおよび/またはソフトウェア要素を示す。連結部220は、複数の自律データベースシステムを単一の連結データベースへとトランスピアレントにマッピングし得る。構成要素データベースは、コンピュータネットワークを介して相互に接続されてもよく、地理的に分散されてもよい。連結部220は、いくつかの異なるデータベースをマージすることに対する代替案を提供する。連結データベースまたは仮想データベースはたとえば、すべての構成要素データベースの合成を提供し得る。連結部220は、異なる構成要素データベースにおいて実際のデータ統合を提供しなくてもよく、閲覧においてのみ提供してもよい。
連結部220は、構成要素データベースが異種混合であっても、単一のクエリーによって、ユーザおよびクライアントが複数の非連続のデータベースにおいてデータを格納および抽出することを可能にする均一なユーザインターフェイスを提供する機能を含み得る。連結部220は、関連する構成要素データソースへの提出のためのサブクエリーにクエリーを分解するとともにサブクエリーの結果セットを合成する機能を含み得る。連結部220は、サブクエリーへの1つ以上のラッパー(wrapper)を、それらを適切なクエリー言語に変換するよう含み得る。いくつかの実施形態において、連結部220は、エクスポートスキーマおよびアクセスオペレーションの発行を通じてデータを連結部の他のメンバーに利用可能にする自律コンポーネントの集合である。
リアルタイムメッセージ部222は、リアルタイム制約(たとえばイベントからシステム応答までのオペレーショナルデッドライン)に従ってメッセージサービスを提供するように構成される1つ以上のハードウェアおよび/またはソフトウェア要素を示す。リアルタイムメッセージ部222は、厳密な時間制約内における動作または応答を保証する機能を含み得る。一例において、リアルタイムメッセージ部222には、1つのデータベースからいくつかのオーダおよび消費者データを取得し、ファイル中に保持されるいくつかの従業員データとそれを組合せ、その後、当該統合データをマイクロソフトSQLサーバ2000データベースにロードするタスクが課され得る。オーダは、到達する際に分析される必要があるので、リアルタイムメッセージ部222は、可能な限りリアルタイムに近い状態でターゲットデータベースにオーダを渡し、可能な限りワークロードを小さく維持するよう新しくかつ変更されたデータのみを抽出し得る。
情報宛先部206は、データを格納または消費するように構成される1つ以上のハードウェアおよび/またはソフトウェア要素を示す。この実施形態において、情報宛先部206は、データへの直接または間接のアクセスを提供し得る。この実施形態において、情報宛先部206は、1つ以上のアプリケーション224と1つ以上のリポジトリ226とを含む。
アプリケーション224は、デスクトップアプリケーション、ホストされたアプリケーション、ウェブベースアプリケーション、またはクラウドベースアプリケーションのような従来のアプリケーションを示す。アプリケーション224は、1つ以上の所定の目的のために、データを受け取り、処理し、かつ維持するように構成され得る。アプリケーション224のいくつかの例は、カスタマーリレーションシップマネジメント(CRM:customer relationship management)アプリケーション、金融サービスアプリケーション、管理およびリスクコンプライアンスアプリケーション、人的資本マネージメント(HCM:human capital management)調達アプリケーション、サプライチェーンマネジメントアプリケーション、または、プロジェクトもしくはポートフォリオマネージメントアプリケーションなどを含む。アプリケーション224は、当該技術において公知のようなさまざま人間が読むことが可能でありマシンが読み取り可能なフォーマットでアプリケーションデータを操作およびインポートするために構成される機能を含み得る。アプリケーション224はさらに、リポジトリ226おけるデータにアクセスするとともに、リポジトリ226にデータを格納し得る。
リポジトリ226は、データへのアクセスを提供するように構成されるハードウェアおよび/またはソフトウェア要素を示す。リポジトリ226は、データの論理的および/または物理的なパーティショニングを提供し得る。リポジトリ226は、リポーティングおよびデータ分析をさらに提供し得る。リポジトリ226のいくつかの例は、データベース、データウェアハウス、またはクラウドストレージなどを含む。リポジトリは、1つ以上のアプリケーション226からのデータを統合することにより作成される中央レポジトリを含み得る。リポジトリ226に格納されたデータは、情報統合部204を通じてアップロードまたはインポートされ得る。データは、宛先にて利用可能になる前に付加的なオペレーションを介して渡され得る。
データ統合システム
図3は、本発明の実施形態に従ったデータ統合システム200を実現するために使用され得るハードウェア/ソフトウェアスタックの簡略ブロック図である。図3は、本願明細書において開示される発明の実施形態または実現例を単に例示しているだけであり、請求の範囲に記載されるような任意の発明の範囲を限定するべきでない。当業者は、この開示および本願明細書において示される教示を通じて、図において示される実施形態または実現例に対する他の変形例、修正例および/または代替例を認識し得る。この実施形態に従ったデータ統合システム200において発見されるコンポーネントの一例は、カリフォルニア州レッドウッドショアズのオラクル社によって提供される製品のオラクルフュージョンミドルウェア(ORACLE FUSION Middleware)ファミリーのメンバーであるオラクルデータインテグレータ(ORACLE DATA INTEGRATOR)を含んでもよい。オラクルデータインテグレータは、セットベースのデータ統合タスクを実行するために1つ以上のデータベースを使用するJavaベースのアプリケーションである。さらにオラクルデータインテグレータは、データを抽出し、変換されたデータをウェブサービスおよびメッセージを通じて提供し、サービス指向のアーキテクチャにおいてイベントに応答および作成する統合プロセスを作成し得る。オラクルデータインテグレータは、従来のETL[抽出−変換−ロード(extract-transform-load)]アーキテクチャではなく、ELT[抽出−ロードおよび変換(extract-Load and Transform)]アーキテクチャに基づく。オラクルデータインテグレータのためのユーザマニュアルのコピーが、この開示に添付されており、本願明細書においてすべての目的のために参照により援用される。
さまざまな実施形態において、データ統合システム200は、データ変換および統合プロセスの規定への新しい宣言型設計アプローチ(declarative design approach)を提供し、より速くより簡易な開発およびメンテナンスが得られる。したがって、データ統合システム200は、インプリメンテーションの詳細から宣言型ルールを分離する。データ統合システム200はさらに、データ変換および検証プロセスの実行のためのユニークなE−LTアーキテクチャ(抽出−ロード変換(Extract-Load Transform))を提供する。実施形態におけるこのアーキテクチャは、スタンドアロンのETLサーバおよびプロプラエタリエンジンの必要性を除去する。その代りに、いくつかの実施形態において、データ統合システム200は、RDBMSエンジンの固有のパワーをレバレッジする。
いくつかの実施形態において、データ統合システム200は、オラクルフュージョンミドルウェアプラットフォームのような1つ以上のミドルウェアソフトウェアパッケージに統合し、ミドルウェアスタックのコンポーネントになる。図3に示されるように、データ統合システム200は、JavaEEアプリケーションとしてランタイムコンポーネントを提供し得る。
この例において、データ統合システム200の1つのコンポーネントはリポジトリ302である。リポジトリ302は、ITインフラストラクチャに関する構成情報、すべてのアプリケーションのメタデータ、プロジェクト、シナリオおよび実行ログを格納するように構成されるハードウェアおよび/またはソフトウェア要素を示す。いくつかの局面において、たとえばデベロップメント、QA、ユーザ、アクセプタンスおよびプロダクションといった、リポジトリ302の複数のインスタンスは、ITインフラストラクチャにおいて共存し得る。リポジトリ302は、メタデータおよびシナリオを交換するいくつかの分離された環境を可能にするように構成される(たとえば、デベロップメント環境、テスト環境、メンテナンス環境、およびプロダクション環境)。リポジトリ302はさらに、オブジェクトがアーカイブされバージョン番号を割り当てられるバージョン制御システムとして動作するように構成される。
この例において、リポジトリ302は、少なくとも1つのマスターリポジトリ304および1つ以上のワークリポジトリ306から形成される。データ統合システム200内での使用のために開発または構成されるオブジェクトは、これらのリポジトリタイプの1つに格納され得る。一般に、マスターリポジトリ304は、ユーザ、プロファイルおよび権限を含むセキュリティ情報と、技術、サーバ定義、スキーマ、コンテキスト、および言語などを含むトポロジー情報と、またバージョン付けおよびアーカイブされたオブジェクトといった情報を格納する。1つ以上のワークリポジトリ306は、実際の開発されたオブジェクトを含み得る。
いくつかのワークリポジトリは、(たとえば別個の環境を有するか、または、特定のバージョニングライフサイクルにマッチするよう)データ統合システム200において共存し得る。1つ以上のワークリポジトリ306は、スキーマ定義、データストア構造およびメタデータ、フィールドおよびカラム定義、データ品質制約、相互参照、ならびにデータリネージなどを含む、モデルについての情報を格納する。1つ以上のワークリポジトリ306はさらに、ビジネスルール、パッケージ、プロシージャ、フォルダ、ナレッジモジュール、および変数などを含むプロジェクトと、シナリオ、スケジューリング情報およびログを含むシナリオ実行とを格納し得る。いくつかの局面において、1つ以上のワークリポジトリ306は、(典型的にプロダクション目的のために)実行情報のみを含み得、実行リポジトリとして指定され得る。
さまざまな実施形態において、リポジトリ302は、1つ以上のETLプロジェクトを格納する。ETLプロジェクトは、ソースまたはターゲットにおけるデータのデータ属性をモデリングする1つ以上のデータモデルを規定またはそうでなければ特定する。ETLプロジェクトはさらに、データを移動および変換するために、データ品質制御と、マッピングを規定することとを提供する。データの完全性制御はデータの全体的な一貫性を保証する。アプリケーションデータは、特定のソースまたはターゲットによって課された制約および宣言型ルールに必ずしも有効ではない。たとえば、オーダが顧客を伴わないことが分かった、または、オーダラインが製品を伴わないことが分かったなどである。データ統合システム200は、これらの制約違反を検出し、再利用または報告目的のためにそれらを格納するよう作業環境を提供する。
データ統合システム200のいくつかの実施形態において、スタティック制御およびフロー制御という2つの異なるタイプの制御が存在する。スタティック制御は、アプリケーションデータの完全性を検証するために使用されるルールの存在を示す。これらのルール(制約と称される)のうちのいくつかは、(一次キー、基準制約などを使用して)データサーバにおいて既に実現されている場合がある。データ統合システム200は、付加的な制約の定義およびチェックを、ソースにおいてそれらを直接的に宣言することなく可能にする。フロー制御は、自身の宣言型ルールを実現する変換および統合プロセスのターゲットに関する。フロー制御は、ターゲットにデータをロードする前に、これらの制約に従ってアプリケーションの入力データを検証する。フロー制御プロシージャは一般にマッピングと称される。
ETLプロジェクトは、ランタイム環境における実行のために展開され得るパッケージへと自動化され得る。したがって、パッケージにおける異なるステップ(マッピングおよびプロシージャなど)の実行をシーケンス処理するとともに、これらのステップの各々について既存のコードを含んでいるプロダクションシナリオを作り出すことによって、データ統合フローの自動化が達成される。パッケージは典型的に、実行ダイヤグラムへ組織されるステップのシーケンスから構成される。パッケージは、プロダクションのためのシナリオを生成するよう使用されるメインオブジェクトである。それらは、データ統合ワークフローを表わしており、たとえば、データストアまたはモデルに対するリバースエンジニアリングプロセスを開始し、アドミニストレータに電子メールを送信し、ファイルをダウンロードし、それを解凍し、マッピングが実行されなければならない順序を規定し、変化するパラメータで実行コマンドに対して繰り返すループを規定するジョブを実行し得る。
シナリオは、プロダクションにソースコンポーネント(マッピング、パッケージ、プロシージャ、変数)を配置するよう設計される。シナリオは、このコンポーネントについてコード(SQLおよびシェルなど)の生成により得られる。生成されると、ソースコンポーネントのコードが凍結され、シナリオがワークリポジトリ306の1つ以上のようなリポジトリ302の内部に格納される。シナリオは、エクスポートされ、次に、異なるプロダクション環境にインポートすることができる。
さまざまな実施形態において、データ統合システム200は、Javaグラフィカルモジュールおよびスケジューリングエージェントによってアクセスされるモジュールの態様でリポジトリ302のまわりに組織される。グラフィカルモジュールは、リポジトリ302に格納される1つ以上の統合プロセスを設計および構築するよう使用され得る。アドミニストレータ、デベロッパおよびオペレータは、リポジトリ302にアクセスするためにデベロップメントスタジオを使用し得る。エージェントは、リポジトリ302に格納される統合プロセスに関連付けられる統合タスクのセットをスケジューリングおよび調整するために使用され得る。たとえばランタイムにおいて、デスクトップ、ウェブサービス上に展開されるか、または、ソースと通信するエージェントは、1つ以上の統合プロセスの実行を調整する。エージェントは、マスターリポジトリ304に格納されるコードを抽出し、さまざまなソースおよびターゲットシステムに接続し、全体的なデータ統合プロセスまたはシナリオを取りまとめ得る。
この実施形態において、データ統合システム200は、上で論じたグラフィカルモジュールおよび/またはエージェントの1つ以上を含み得るデスクトップ308を含む。デスクトップ308は、パーソナルコンピュータ、ラップトップ、ネットブック、およびタブレットなどのような1つ以上のデスクトップまたはワークステーションコンピューティングデバイスを示す。デスクトップ308はJava仮想マシン(JVM)310およびオラクルデータインテグレータ(ODI:Oracle Data Integrator)スタジオ312を含む。Java仮想マシン(JVM)310は、Javaバイトコードを実行し得る仮想マシンである。JVM310はほとんどの場合、既存のオペレーティングシステム上で実行するよう実現されるが、ハードウェア上で直接的に実行するよう実現され得る。JVM310は、Javaバイトコードが実行され得るランタイム環境を提供し、ランタイムウェブサービス(WS)314およびエージェント316のような機能を可能にする。JVM310は、Javaクラスライブラリと、Javaアプリケーションプログラミングインターフェイス(API:application programming interface)を実現する(Javaバイトコードでの)スタンダードクラスライブラリのセットと、Javaランタイム環境(JRE:Java Runtime Environment)を形成する他の要素とを含み得る。
エージェント316は、リポジトリ302に格納された1つ以上の統合プロセスに関連付けられる統合タスクのセットをスケジューリングおよび調整するように構成される。たとえば、ランタイムにおいて、エージェントは、統合プロセスの実行を調整する。エージェントは、マスターリポジトリ304に格納されるコードを抽出し、さまざまなソースおよびターゲットシステムに接続し、全体的なデータ統合プロセスまたはシナリオを取りまとめ得る。
図3を再び参照して、ODIスタジオ312はデータ統合プロジェクトを設計するよう構成されるハードウェアおよび/またはソフトウェア要素を含む。この例において、ODIスタジオ312は、データ統合プロジェクトを作成および管理するために使用される4つのグラフィカルモジュールまたはナビゲータ、すなわち、デザイナーモジュール318、オペレータモジュール320、トポロジーモジュール322およびセキュリティモジュール324を含む。デザイナーモジュール318は、データストア(テーブル、ファイルおよびウェブサービスなど)、データマッピング、およびパッケージ(マッピングを含む統合ステップのセット)を規定するように構成されるモジュールである。さまざまな実施形態において、デザイナーモジュール318は、データ変換およびデータ完全性について宣言型ルールを規定する。したがって、プロジェクトデベロップメントがデザイナーモジュール318において発生する。さらに、デザイナーモジュール318において、データベースおよびアプリケーションメタデータがインポートおよび規定される。デザイナーモジュール318は、一実施形態において、メタデータおよびルールを使用して、プロダクションについてデータ統合シナリオまたはロードプランを生成する。一般に、デザイナーモジュール318は、データ完全性チェックを設計するように使用されるとともに、たとえば既存のアプリケーションまたはデータベースの自動リバースエンジニアリング、変換および統合マッピングのグラフィカルデベロップメントおよびメンテナンス、マッピングにおけるデータフローの可視化、自動ドキュメンテーション生成、および生成されたコードのカスタマイゼーションのような変換を構築するように使用される。
オペレータモジュール320は、プロダクション統合ジョブを閲覧および管理するように構成されるモジュールである。したがって、オペレータモジュール320は、プロダクションにおけるデータ統合プロセスを管理および監視し、エラーカウントを有する実行ログ、処理されたロウの数、実行統計、および実行される実際のコードなどを示し得る。設計時において、デベロッパはさらに、デザイナーモジュール318に関連して、デバッグ目的のためにオペレータモジュール320を使用し得る。
トポロジーモジュール322は、データソースおよびエージェントへの接続を作成および管理するように構成されるモジュールである。トポロジーモジュール322は、インフラストラクチャの物理的および論理的アーキテクチャを規定する。インフラストラクチャまたはプロジェクトアドミニストレータは、トポロジーモジュール322を通じて、サーバと、データベーススキーマおよびカタログと、エージェントとをマスターリポジトリに登録し得る。セキュリティモジュール324は、ユーザおよびそれらのリポジトリ権限を管理するように構成されるモジュールである。
一般に、ユーザまたはプロセスは、ソースおよびターゲット326について1つ以上のデータ統合プロセスを有するデータ統合プロジェクトを作成するよう、デザイナーモジュール318と相互作用する。各データ統合プロセスは、少なくとも1つのデータ統合タスクを含む。いくつかの実施形態において、データ統合タスクは、データのどのビットが変換され他のビットと組み合わされるかと、当該データが実際にどのように抽出およびロードされるかの技術的な詳細とを示すビジネスルールのセットによって規定される。好ましい実施形態において、データ統合タスクは、データマッピングを構築するために宣言型のアプローチを使用して特定される。マッピングは、ターゲットと称される、1つのデータストアにポピュレートするオブジェクトであり、1つ以上の他のデータストアからのデータはソースとして既知である。一般に、ソースデータストアにおけるカラムは、マッピングを通じてターゲットデータストアにおけるカラムにリンクされる。マッピングは、パッケージステップとしてパッケージに加えられ得る。上で論じたように、パッケージはデータ統合ジョブを規定する。パッケージは、プロジェクトの下に作成され、各々がマッピングまたはプロシージャであり得るステップの組織されたシーケンスから構成される。パッケージは、1つの入口点および複数の出口点を有し得る。
いくつかの実施形態において、新しいマッピングを作成する場合、デベロッパまたは技術的なビジネスユーザは、どのデータが統合されるかと、どのビジネスルールを使用するべきかとをまず規定するよう、デザイナー318と相互作用する。たとえば、デベロッパは、どのテーブルが連結されるべきか、どのフィルタが適用されるべきか、データを変換するためにどのSQLエクスプレッションが使用されるべきかを特定し得る。使用されるSQLの特定の言語は、コードが実行されるべきデータベースプラットホームによって決定される。その後、別個のステップにおいて、技術スタッフは、デザイナー318と相互に作用して、このデータを抽出、組合せ、次いで統合するのに最も効率的な方法を選ぶ。たとえば、技術スタッフは、インクリメンタルロード(incremental load)、バルクローティングユーティリティ(bulk-loading utility)、スローリー・チェンジング・ディメンション(slowly changing dimension)、および変更データキャプチャ(changed-data capture)といった、データベースに特有のツールおよび設計技術を使用し得る。
この実施形態において、マッピングはソースおよびターゲット326について作成され得る。ソースおよびターゲット326は、1つ以上のレガシーアプリケーション328と、1つ以上のファイル/XML文書330と、1つ以上のアプリケーション332と、1つ以上のデータウェアハウス(DW)と、ビジネスインテリジェンス(BI)ツールおよびアプリケーションと、エンタープライズプロセスマネージメント(EPM:enterprise process management)ツールおよびアプリケーション334と、(ランタイムウェブサービス340およびエージェント342を含む)1つ以上のJVM336とを含み得る。
図4は、本発明のさまざまな実施形態においてデータ統合シナリオが作成され得るさまざまな異種混合のデータソースを有する環境400のブロック図である。この例において、環境400はODIスタジオ312およびリポジトリ302を含む。リポジトリ302は、統合シナリオ400を生成するのに必要とされるメタデータのすべてを含む。ユーザまたはプロセスは、データ完全性制御402および宣言型ルール404を使用して統合シナリオ400を作成するようODIスタジオ312と相互作用する。
オーダアプリケーション406は、顧客のオーダをトラッキングするためのアプリケーションを示す。「オーダアプリケーション」データモデルは、オーダアプリケーション406に格納されたデータと、任意のデータ完全性制御または条件とを表わすよう作成される。たとえば、「オーダアプリケーション」データモデルは、ハイパーストラクチャードクエリラングエッジデータベース(HSQLDB:Hyper Structured Query Language Database)に基づき得、SRC_CITY、SRC_CUSTOMER、SRC_ORDERS、SRC_ORDER_LINES、SRC_PRODUCTおよびSRC_REGIONという5つのデータストアを含む。
パラメータファイル408は、販売員のリストおよび年齢のセグメンテーションから年齢の範囲を含むプロダクションシステムから発行されるフラットファイル(たとえばASCII)を示す。この例において、「パラメータ」データモデルが、フラットファイルにおけるデータを表わすために作成される。たとえば、「パラメータ」データモデルは、ファイルインターフェイスに基づき得、SRC_SALES_PERSONおよびSRC_AGE_GROUPという2つのデータストアを含み得る。
セールスアドミニストレーションアプリケーション410はセールスをトラッキングするためのアプリケーションを示す。セールスアドミニストレーションアプリケーション410は、オーダアプリケーション406およびパラメータファイル408からのデータの変換でポピュレートされたデータウェアハウスであり得る。「セールスアドミニストレーション」データモデルは、セールスアドミニストレーションアプリケーション410に格納されるデータと、任意のデータ完全性制御または条件または変換とを表わすよう作成される。たとえば、「セールスアドミニストレーション」データモデルはハイパーストラクチャードクエリラングエッジデータベース(HSQLDB)マッピングに基づき得、TRG_CITY、TRG_COUNTRY、TRG_CUSTOMER、TRG_PRODUCT、TRG_PROD_FAMILY、TRG_REGION、およびTRG_SALEという6つのデータストアを含み得る。
図5Aおよび図5Bは、データ統合システム200によって実行され得る従来のデータ統合処理における簡素化されたデータフローを示す。この例において、オーダアプリケーション406、パラメータファイル408、1つ以上の他の随意または付加的なソースからのデータは、セールスアドミニストレーションアプリケーション410にターゲットとされる従来のETLプロセスを通じて流れる。データ変換は別個のETLサーバ500において発生する。シナリオは専用のリソースまたはプロプラエタリリソースを必要とし、パフォーマンスがより貧弱になり、高コストを引き起こす。
図6Aおよび図6Bは、本発明の実施形態に従った、データ統合システム200によって実行され得る次世代データ統合処理における簡素化されたデータフローを示す。この例において、オーダアプリケーション406、パラメータファイル408、1つ以上の他の随意または付加的なソースからのデータは、セールスアドミニストレーションアプリケーション410にターゲットとされるE−LTプロセスを通じて流れる。データ変換は既存のリソースをレバレッジし、パフォーマンスおよび効率がより高くなる。上述したように、先のETLシステムは、データ変換を実行するために専用および/またはプロプラエタリインフラストラクチャを必要とした。これは、部分には、未知のユーザインフラストラクチャに対応するためになされた。たとえば、どのタイプのデータベースが使用されているか知ることがなければ、先行のETLシステムは、どの変換オペレーションが所与のシステムにおいて利用可能であるか予想することができなかった。しかしながらこれは、如何なる専用および/またはプロプラエタリインフラストラクチャなしで適切なデータ変換を実行することができるユーザの既存データベースおよびサーバのようなリソースが十分に利用されないことになる。
実施形態に従うと、本発明は、ユーザの特定のニーズに従ってユーザがデータ統合プロセスをカスタマイズすることを可能にすることによってユーザの既存のインフラストラクチャをレバレッジする。たとえば、データ統合プランが設計されると、データ統合プランは、実行単位と称される、単一のシステムによって実行可能である個別の部分に分割され得る。ひとたびデータ統合プランが複数の実行単位に分割されると、ユーザのインフラストラクチャおよびシステムリソースに基づいて、ユーザには物理的なプランが提示され得る。このプランはさらにユーザによって、どのユーザシステムがどの実行単位を実行するかを変更するようカスタマイズされ得る。たとえば、ジョインオペレーションが第1のデータベース上で実行されるプランがユーザには提示され得、ユーザは、第2のデータベースにジョインオペレーションを移動させることによって当該プランをカスタマイズし得る。
図6Bに示されるように、これにより、先行のETLシステムを特徴付けたスタンドアロン変換サーバに依存しない抽出−ロード−変換(E−LT:extract-load-transform)アーキテクチャが得られる。代わりに、上述したように、データ変換はユーザの既存のインフラストラクチャ上で実行され得る。E−LTアーキテクチャは、プロプラエタリ変換サーバを取得および維持することに関連付けられるコストを低減しつつユーザにさらに大きなフレキシビリティを提供する。
図3を再び参照すると、エージェントは統合プロセスに関連付けられる統合タスクのセットをスケジューリングおよび調整するために使用され得る。たとえば、ランタイムにおいて、エージェントは、統合プロセスの実行を調整する。エージェントは、マスターリポジトリ304に格納されるコードを抽出し得、さまざまなソースおよびターゲットシステムに接続し得、全体的なデータ統合プロセスまたはシナリオを取りまとめる。さまざまな実施形態において、2つのタイプのエージェントが存在する。一例において、スタンドアロンのエージェントがエージェント316のようなデスクトップ308上にインストールされる。別の例において、アプリケーションサーバエージェントは(オラクルWebLogicサーバの上で展開されるJavaEEエージェントのように)アプリケーションサーバ326上で展開され得、高いアベイラビリテイ要件についてのクラスタリングのようなアプリケーションサーバレイヤーフィーチャから利益を得ることができる。さらに別の例において、エージェントは、エージェント342のように、ソースおよびターゲット326上で展開され得る。
この実施形態において、データ統合システム200は、上で論じられるエージェントの1つ以上を含み得るアプリケーションサーバ344を含む。アプリケーションサーバ344は、1つ以上のアプリケーションサーバ、ウェブサーバ、またはホストされたアプリケーションを示す。この例において、アプリケーションサーバ344は、FMWコンソール346、サーブレットコンテナ348、ウェブサービスコンテナ350、およびデータソース接続プール352を含む。
FMWコンソール346は、サーブレットコンテナ348、ウェブサービスコンテナ350およびデータソース接続プール334に関係する情報のような、アプリケーションサーバ344の局面を管理するように構成される1つ以上のハードウェアおよび/またはソフトウェア要素を示す。たとえば、FMWコンソール346は、オラクルWebLogicサーバドメインを管理するために使用されるブラウザベースのグラフィカルユーザインターフェイスであり得る。FMWコンソール346は、WebLogicサーバインスタンスを構成、開始、停止し、WebLogicサーバクラスタを構成し、データベース接続性(JDBC)およびメッセージング(JMS)のようなWebLogicサーバサービスを構成し、ユーザ、グループおよび役割を作成および管理することを含むセキュリティパラメータを構成し、JavaEEアプリケーションを構成および展開し、サーバおよびアプリケーションのパフォーマンスを監視し、サーバおよびドメインのログファイルを閲覧し、アプリケーション展開記述子を閲覧し、選択されたランタイムアプリケーション展開記述子要素を編集する機能を含み得る。いくつかの実施形態において、FMWコンソール346は、プロダクションにおけるデータ統合プロセスへのアクセスをFMWコンソール346に提供するODIプラグイン354を含み、エラーカウントを有する実行ログ、処理されたロウの数、実行統計、および実行される実際のコードなどを示し得る。
サーブレットコンテナ348は、アプリケーションサーバ344の性能を拡張するように構成される1つ以上のハードウェアおよび/またはソフトウェア要素を示す。サーブレットは、HTMLフォームから提出されたデータを処理するまたは格納するためにほとんどの場合に使用され、データベースクエリの結果のような動的なコンテンツを提供し、適切な顧客のショッピングカートへ品物を充填するといった、ステートレスHTTPプロトコルに存在しない状態情報を管理する。サーブレットは典型的に、Javaクラスが要求に応答し得るプロトコルである、JavaサーブレットAPIに準拠するJavaEEにおけるJavaクラスである。サーブレットを展開および実行するために、サーブレットコンテナ348は、サーブレットと相互作用するウェブサーバのコンポーネントとして使用される。したがって、サーブレットコンテナ348は、ウェブサービスコンテナ350のパブリックウェブサービス356およびデータサービス358によって提供される機能と、データソース接続プール352によって提供されるデータプールへのアクセスとを拡張し得る。サーブレットコンテナ348はさらに、サーブレットのライフサイクルを管理し、特定のサーブレットにURLをマッピングし、URLリクエスタが正しいアクセス権を有することを保証することを担う。
この例において、サーブレットコンテナ348は、ODI SDK362に関連付けられるJavaEEアプリケーション360と、ODIコンソール364と、JavaEEエージェント368に関連付けられるランタイムウェブサービス366とを含む。ODI SDK362は、データ統合およびETL設計のためのソフトウェア開発キット(SDK)を提供する。ODI SDK362は、一般的でありかつ非常に反復的である作業の自動化を可能にし、ユーザが反復のタスクをスクリプトにすることを可能にする。
ODIコンソール364は、リポジトリ302へのウェブアクセスを提供するJavaエンタープライズエディション(JavaEE:Java Enterprise Edition)アプリケーションである。ODIコンソール364は、プロジェクト、モデルおよび実行ログを含むDesign-Timeオブジェクトをユーザがブラウズすることを可能にするように構成される。ODIコンソール364は、ユーザがフローマップを閲覧し、すべてのデータのソースを追跡し、データを構築するのに使用される変換を理解するためにフィールドレベルにさらにドリルダウンすることを可能にし得る。さらに、エンドユーザは、ODIコンソール364を通じてシナリオ実行を開始および監視し得る。1つの局面において、ODIコンソール364は、データサーバ、物理および論理スキーマのようなトポロジーオブジェクトを閲覧および編集し、かつ、リポジトリ302を管理する能力をアドミニストレータに提供する。
データシナリオ設計および開発
上で論じたように、シナリオは、ソースコンポーネント(マッピング、パッケージ、プロシージャ、変数)をプロダクションに配置するよう設計される。このコンポーネントについて、シナリオがコード(SQL、シェルなど)の発生から得られる。シナリオは、エクスポートされ、その後、異なるプロダクション環境へインポートされ得る。
図7は、本発明に従った一実施形態におけるODIスタジオとデータ統合システムのリポジトリとの間の相互作用の簡略ブロック図である。図7に示される実施形態において、図3のODIスタジオ312は、プロダクションについてデータ統合シナリオ700を生成するようメタデータおよびルールを使用する。一般に、デザイナーモジュール318は、データ完全性チェックを設計するように使用されるとともに、たとえば既存のアプリケーションまたはデータベースの自動リバースエンジニアリング、変換および統合マッピングのグラフィカルデベロップメントおよびメンテナンス、マッピングにおけるデータフローの可視化、自動ドキュメンテーション生成、および生成されたコードのカスタマイゼーションのような変換を構築するように使用される。
図8は、本発明の実施形態に従った、データ統合シナリオを作成するための方法800のフローチャートを示す。図8に示された方法800の実現または処理は、コンピュータシステムまたは情報処理デバイスのようなロジックマシンの中央処理装置(CPUまたはプロセッサ)によって実行される際にソフトウェア(たとえば命令またはコードモジュール)によって実行され得るか、電子デバイスまたは特定用途向け集積回路のハードウェアコンポーネントによって実行され得るか、または、ソフトウェアおよびハードウェア要素の組合せによって実行され得る。図8に示される方法800は、ステップ810において開始する。
さまざまな実施形態において、ユーザはODIスタジオ312のデザイナーモジュール318とのセッションを開始し、リポジトリ302へ接続し得る。ユーザは1つ以上のユーザインターフェイスフィーチャと相互作用して、新しいデータ統合プロジェクトを作成するか、または、たとえばマスターリポジトリ304に格納される既存のデータ統合プロジェクトから選択し得る。一般に、デザイナーモジュール318は、メタデータを管理し、データ完全性チェックを設計し、変換を構築するよう使用される。さまざまな実施形態において、デザイナーモジュール318を通じて取り扱われる主なオブジェクトはモデルおよびプロジェクトである。データモデルは、データソースまたはターゲットにおけるメタデータのすべてを含む(たとえばテーブル、カラム、制約、記述、相互参照など)。プロジェクトは、ソースまたはターゲット(たとえばマッピング、プロシージャ、変数など)についてロードおよび変換ルールのすべてを含む。
ステップ820において、1つ以上のデータモデルが作成される。ステップ830において、1つ以上のプロジェクトが作成される。図9は、本発明の実施形態に従った、データ統合シナリオを作成するためのユーザインターフェイス900のスクリーンショットである。この例において、ナビゲーションパネル910は、情報を表示し、プロジェクトとの相互作用のための機能を含む。ナビゲーションパネル920は情報を表示し、データモデルとの相互作用のための機能を含む。上で論じたように、ユーザはデータモデルを作成するだけでなく、データモデルにおけるデータについて任意のデータ完全性チェックを開発し得る。さらに、ユーザは、ソースからのデータをターゲットにロードするフローにおいてデータについてのデータ完全性および変換を提供する、プロジェクトについてのマッピングおよびプロシージャ、変数を特定し得る。ステップ840では、1つ以上のデータ統合シナリオが生成される。図8はステップ850で終了する。
図10は、本発明の実施形態に従った、マッピングを作成するための方法1000のフローチャートを示す。図10に示された方法1000の実現または処理は、コンピュータシステムまたは情報処理デバイスのようなロジックマシンの中央処理装置(CPUまたはプロセッサ)によって実行される際にソフトウェア(たとえば命令またはコードモジュール)によって実行され得るか、電子デバイスまたは特定用途向け集積回路のハードウェアコンポーネントによって実行され得るか、または、ソフトウェアおよびハードウェア要素の組合せによって実行され得る。図10に示される方法1000は、ステップ1010において開始する。
ステップ1020において、ターゲットデータストア情報が受け取られる。たとえば、ユーザは、ターゲットデータストア情報を提供するよう、デザイナーモジュール318の1つ以上のユーザインターフェイスフィーチャと相互作用し得る。一実施形態において、ユーザは、選択されたデータモデルおよび任意の関連付けられる変換またはデータ完全性チェックの局面を視覚的に表わすマッピングまたはフローパネル上にナビゲーションパネル910から、1つ以上のデータモデルを含むターゲットデータストア情報をドラッグアンドドロップし得る。
ステップ1030では、ソースデータストア情報が受け取られる。たとえば、ユーザは、ソースデータストア情報を提供するよう、デザイナーモジュール318の1つ以上のユーザインターフェイスフィーチャと相互作用し得る。一実施形態において、ユーザは、選択されたデータモデルおよび任意の関連付けられる変換またはデータ完全性チェックの局面を視覚的に表わすターゲットデータストア情報の同じマッピングまたはフローパネル上にナビゲーションパネル910から、1つ以上のデータモデルを含むソースデータストア情報をドラッグアンドドロップし得る。
さまざまな実施形態において、ソースデータストア情報およびターゲットデータストア情報は、1つ以上のデータモデルおよび随意にオペレーションから形成され得る。オペレーションのいくつかの例は1つ以上のデータセットオペレーション(たとえばユニオン、ジョイン、インターセクションなど)、データ変換、データフィルタオペレーション、制約、記述、相互参照、または完全性チェックなどを含み得る。さらに別の実施形態において、これらのオペレーションのうちのいくつかは、あらかじめ構成されるとともに、デザイナーモジュール318において視覚的に表わされ得る。他の実施形態において、カスタムオペレーションが提供され得、オペレーションを実現するロジックおよびマッピングなどをユーザが特定することを可能にする。
ステップ1040において、マッピング情報が受け取られる。たとえば、ユーザは、ターゲットデータストア情報にソースデータストア情報をマッピングするよう、デザイナーモジュール318の1つ以上のユーザインターフェイスフィーチャと相互作用し得る。一実施形態において、ユーザは、ソースデータストア情報におけるデータ要素の属性をターゲットデータストア情報におけるデータ要素の属性に視覚的に接続し得る。これは、ソースデータストア情報およびターゲットデータストア情報におけるテーブルのカラム名をマッチングすることにより行われ得る。さらに別の実施形態において、1つ以上の自動マッピング技術がマッピング情報を提供するために使用され得る。
図11は、本発明の実施形態に従った、データ統合シナリオにおけるマッピング情報を提供するためのユーザインターフェイス1100のスクリーンショットである。この例において、ソースコンポーネントの属性はターゲットコンポーネントの属性にマッピングされる。
図10を再び参照して、ステップ1050において、データロードストラテジーが受け取られる。データロードストラテジーは、ソースデータストア情報からの実際のデータが抽出フェーズの間にどのようにロードされるべきであるかについての情報を含む。データロードストラテジーは、デザイナー318のフロータブにおいて規定され得る。いくつかの実施形態において、データロードストラテジーは、マッピングの構成に依存してフローについて自動的に計算され得る。
たとえば、1つ以上のナレッジモジュールが当該フローのために提案され得る。ナレッジモジュール(KM)は、異なる技術にわたって再使用可能な変換およびELT(抽出、ロード、および変換)ストラテジーを実現するコンポーネントである。1つの局面において、ナレッジモジュール(KM)はコードテンプレートである。各KMは、全体のデータ統合プロセスにおいて個々のタスクに専用であり得る。KMにおけるコードは、ほとんど置換法で実行されるであろう形で現われ、多くの異なる統合ジョブによって一般的に使用されることを可能にする。生成および実行されるコードは、デザイナーモジュール318において規定される宣言型ルールおよびメタデータに由来する。この一例は、オラクルデータベース10gから変更データキャプチャを通じてデータを抽出し、オラクルデータベース11gにおけるパーティショニングされたファクトテーブルに変換データをロードするか、または、マイクロソフトSQLサーバデータベースからのタイムスタンプベースの抽出を作成し、このデータをテラデータエンタープライズデータウェアハウス(Teradata enterprise data warehouse)にロードすることである。
KMの能力はそれらの再使用可能性とフレキシビリティにあり、たとえば、あるロードストラテジーが1つのファクトテーブルのために開発され得、その後、当該ロードストラテジーが他のすべてのファクトテーブルに適用され得る。1つの局面において、所与のKMを使用するすべてのマッピングは、KMに対してなされる任意の変化を引き継ぐ。いくつかの実施形態において、統合ナレッジモジュール(IKM:integration knowledge module)、ロードナレッジモジュール(LKM:loading knowledge module)、およびチェックナレッジモジュールCKM(check knowledge module)といったように、5つの異なるタイプのKMが提供され、それらの各々はソースからターゲットまで変換処理における1つのフェーズをカバーする。
図4を参照して、ユーザは、環境400においてSRC_AGE_GROUP、SRC_SALES_PERSONファイルおよびSRC_CUSTOMERテーブルからデータを抽出する方法を規定し得る。ロードストラテジーを規定するために、ユーザは、SRC_AGE_GROUPファイルのロードに対応するソースセットを選択し、SQLへのLKMファイルを選択し得、ファイルからSQLまでのフローを実現する。1つの局面において、LKMはリモートサーバからステージングエリアにソースデータロードすることを担う。
ステップ1060では、データ統合ストラテジーが受け取られる。ローディングフェーズを規定した後、ユーザは、ロードされたデータのターゲットへの統合に適合するべきストラテジーを規定する。統合ストラテジーを規定するために、ユーザは、ターゲットオブジェクトを選択し、IKM SQLインクリメンタルアップデート(IKM SQL Incremental Update)を選択し得る。IKMは、最終の変換されたデータをターゲットに書き込むことを担う。IKMは、開始されると、リモートサーバのためのすべてのローディングフェーズは、たとえばすべてのリモートソースデータセットがLKMによってステージングエリアにロードされたといったように、既にそれらのタスクを行なったか、または、ソースデータストアがステージングエリアと同じデータサーバ上に存在するとみなす。
ステップ1070では、データ制御ストラテジーが受け取られる。一般に、CKMは、データセットのレコードが規定された制約と一貫していることをチェックすることを担う。CKMは、データ完全性を維持するために使用され得、全体的なデータ品質イニシアチブに参加する。CKMは2つの態様で使用され得る。第1に、既存データの一貫性をチェックするために使用され得る。これは任意のデータストア上またはマッピング内で行われ得る。この場合、チェックされたデータは、現在データストアに存在するデータである。第2の場合において、ターゲットデータストアにおけるデータが、ロードされた後でチェックされる。この場合、CKMは、ターゲットへの書き込みの前に、結果得られたフロー上のターゲットデータストアの制約をシミュレートする。
図12は、本発明の実施形態に従った、データ統合シナリオにおいてフロー情報を提供するためのユーザインターフェイス1200のスクリーンショットである。
ステップ1080において、マッピングが生成される。図10はステップ1090において終了する。
データ統合シナリオパッケージおよび展開
上で論じたように、パッケージにおいて異なるステップ(マッピングおよびプロシージャなど)の実行をシーケンス処理するとともに、これらのステップの各々について既存のコードを含んでいるプロダクションシナリオを作り出すことによって、データ統合システム200においてデータ統合フローの自動化が達成され得る。パッケージは、実行ダイヤグラムへ組織されるステップのシーケンスから構成される。パッケージは、プロダクションのためのシナリオを生成するよう使用されるメインオブジェクトである。シナリオは、ソースコンポーネント(マッピング、パッケージ、プロシージャ、変数)をプロダクションに配置するよう設計される。このコンポーネントについて、シナリオがコード(SQL、シェルなど)の発生から得られる。シナリオは、エクスポートされ、その後、異なるプロダクション環境へインポートされ得る。
図13は、本発明の実施形態に従った、パッケージを作成するための方法のフローチャートを示す。図13に示された方法1300の実現または処理は、コンピュータシステムまたは情報処理デバイスのようなロジックマシンの中央処理装置(CPUまたはプロセッサ)によって実行される際にソフトウェア(たとえば命令またはコードモジュール)によって実行され得るか、電子デバイスまたは特定用途向け集積回路のハードウェアコンポーネントによって実行され得るか、または、ソフトウェアおよびハードウェア要素の組合せによって実行され得る。図13に示される方法1300はステップ1310において開始する。
ステップ1320において、パッケージステップ情報が受け取られる。パッケージステップ情報は、ステップ、要素、プロパティ、およびコンポーネントなどを識別する情報を含む。一例において、ユーザは、パッケージについて1つ以上のステップを作成、識別、またはそうでなければ特定するよう、デザイナーモジュール318の1つ以上のユーザインターフェイスフィーチャと相互作用し得る。一実施形態において、1つ以上のコンポーネントが選択され、図に配置される。これらのコンポーネントはパッケージにおけるステップとして現われる。
ステップ1330において、パッケージステップシーケンス情報が受け取られる。パッケージステップシーケンス情報は、ステップについてのオーダリング、および従属性などを識別する情報を含む。ひとたびステップが作成されると、ステップがデータ処理チェーンへと順に並べられるかまたは並べ替えられる。一例において、ユーザは、パッケージの1つ以上のステップについてシーケンシングまたはオーダリングを提供するよう、デザイナーモジュール318の1つ以上のユーザインターフェイスフィーチャと相互作用し得る。データ処理チェーンは、第1のステップとして規定されたユニークステップを含み得る。一般に、各ステップは、成功または失敗のような1つ以上の終結状態を有する。失敗または成功のようないくつかの状態におけるステップの後には別のステップまたはパッケージの終了が続き得る。1つの局面において、失敗のようないくつかの状態の場合、シーケンス情報は多くの再試行を規定し得る。別の局面において、パッケージはいくつかの可能な終結ステップのみを有し得る。
図14は、本発明の実施形態に従った、データ統合シナリオにおいてパッケージステップシーケンス情報を提供するためのユーザインターフェイスのスクリーンショットである。
ステップ1340において、パッケージが生成される。図13はステップ1350において終了する。
上で論じたように、データ統合フローの自動化は、パッケージにおける異なるステップ(マッピングおよびプロシージャなど)の実行をシーケンス処理することにより達成され得る。次いで、パッケージのステップの各々について既存のコードを含むプロダクションシナリオのために、パッケージが作り出され得る。さまざまな実施形態において、パッケージはプロダクション環境において自動的に実行されるよう展開される。
図15は、本発明の実施形態に従ったデータ統合シナリオを展開するための方法1500のフローチャートを示す。図15に示された方法1500の実現または処理は、コンピュータシステムまたは情報処理デバイスのようなロジックマシンの中央処理装置(CPUまたはプロセッサ)によって実行される際にソフトウェア(たとえば命令またはコードモジュール)によって実行され得るか、電子デバイスまたは特定用途向け集積回路のハードウェアコンポーネントによって実行され得るか、または、ソフトウェアおよびハードウェア要素の組合せによって実行され得る。図15に示される方法1500はステップ1510において開始する。
ステップ1520において、統合シナリオが抽出される。一実施形態において、パッケージがリポジトリ302から抽出される。ステップ1530において、統合シナリオは1つ以上のエージェントに展開される。ステップ1540において、統合シナリオは1つ以上のエージェントによって実行される。1つの局面において、統合シナリオは、たとえばODIスタジオ312から、コマンドラインから、またはウェブサービスからといったようにいくつかの態様で実行され得る。たとえば、シナリオ実行は、上に論じられるようにオペレータモジュール320などを介して閲覧および監視され得る。図15はステップ1550において終了する。
プロジェクタおよびセレクタタイプの使用
ほとんどのデータ統合システムにおいて、マッピングは、マップの部分を形成するすべての入力および出力属性の明示的な定義を必要とする。典型的なフローベースのETLツールにおいて、コネクタが属性レベルに形成される。これにより、非常に簡潔なマッピングモデルが得られる。しかしながら、これによりさらに、巨大な数のオブジェクトが生成されるとともに、属性レベルコネクタの数によりマップを構築および維持することが煩雑になる。
さまざまな実施形態において、データ統合システム200は、マッピングの設計およびメンテナンスを容易にするための1つ以上の技術を組み込む。コンポーネントは、すべての入力および出力属性を特定する必要なく、かつ、コンポーネントレベルコネクタがリルートされることなく、単純に既存の設計に加えられ得る。1つの局面において、アサインメントエクスプレッション(assignment expression)が上流のコンポーネントのすべてまたは部分を参照することを可能にするコンポーネントが実現される。したがって、あるタイプのコンポーネントの属性は、下流のコンポーネントに伝播され得るか、または、そうでなければ、マッピングデザイナー側に対して最小の労力で上流のコンポーネントから引き継がれる。
1つの局面において、データ統合システム200は、属性レベル接続性を管理する必要性を最小化する。たとえば、データ統合システム200は、マッピングのコンポーネントを分類し得る(ジョイナー、セット、テーブル、フィルタなど)。カテゴリーのいくつかの例はプロジェクタおよびセレクタである。一般に、プロジェクタは、マップを通って流れるデータの形に影響するコンポーネントである。セレクタはデータのフローを制御するコンポーネントであるが、フローの形を根本的に変更しない。さまざまな実施形態では、上流のコンポーネントの属性が可視であるという点において、セレクタタイプコンポーネントはトランスピアレントに構成される。プロジェクタタイプコンポーネントは、上流のコンポーネントの属性が可視ではなく、データフローの形で利用可能になったもののみ可視であるという点で、透過ではない(opaque)であるように構成される。
したがって、上流からのデータを閲覧することを可能にするためには、下流のコンポーネントの属性に各属性が接続されることが必要されており、さまざまな実施形態において、データ統合システム200は、ユーザが最も近いプロジェクタの属性までおよび当該属性を含む任意の上流の属性を直接的に参照することを可能にする。したがって、データ統合システム200は、マッピングの設計およびメンテナンスを非常に容易にする。データ統合システム200はさらに、既存の設計へのコンポーネントの追加、典型的には単に必要なレベルコネクタをリルートすることを簡易にする。
図16Aおよび図16Bは、本発明に従った一実施形態におけるマッピングの簡略ブロック図である。この例において、図16Aのマッピング1600は、データソースSRC_EMPを表わすコンポーネント1610と、データソースSRC_DEPTを表わすコンポーネント1620と、データターゲットTGT_EMPDEPTを表わすコンポーネント1630とを含む。データターゲットTGT_EMPDEPTを更新するために、データソースSRC_EMPおよびSRC_DEPTについてジョインが必要とされる。JOINを表わすコンポーネント1640は、入力としてコンポーネント1610および1620に接続するとともに出力としてコンポーネント1630に接続するマッピング1600に加えられる。コンポーネント1640は(SRC_EMP.DEPTNO=SRC_DEPT.DEPTNO)といったジョインエクスプレッションを提供するように構成される。
従来のデータ統合システムにおいて、マッピング1600は、JOINを表わすコンポーネント1640の部分を形成するすべての入力および出力属性の明示的な定義を必要とする。対照的に、さまざまな実施形態において、マッピングデベロッパは、コンポーネント1640を通って流れているためコンポーネント1630に可視である、コンポーネント1610によって表わされるデータソースSRC_EMPの属性およびコンポーネント1620によって表わされるデータソースSRC_DEPTの属性からデータターゲットTGT_EMPDEPTのカラムがどのように直接的にポピュレートされるかを定義し得る。たとえば、ターゲットカラムTGT_EMPDEPT.NAMEのアサインメントは、コンポーネント1640の属性への参照の必要なく、SRC_EMP.ENAMEを参照し得る。
図17は、本発明の実施形態に従った、コンポーネントタイプに基づいてコンポーネント属性を導き出すための方法1700のフローチャートを示す。図17に示される方法1700の実現または処理は、コンピュータシステムまたは情報処理デバイスのようなロジックマシンの中央処理装置(CPUまたはプロセッサ)によって実行される際にソフトウェア(たとえば命令またはコードモジュール)によって実行され得るか、電子デバイスまたは特定用途向け集積回路のハードウェアコンポーネントによって実行され得るか、または、ソフトウェアおよびハードウェア要素の組合せによって実行され得る。図17に示される方法1700はステップ1710において開始する。
ステップ1720において、コンポーネントについてのコンポーネントタイプが決定される。上で論じたように、いくつかのタイプのコンポーネントは、マッピングを通って流れるデータの形に影響する一方、他のタイプのコンポーネントは、データのフローを制御するがフローの形を根本的に変更しない。ステップ1730において、下流のコンポーネントについての属性はコンポーネントタイプに基づいて決定される。たとえば、コンポーネントがデータのフローを制御するがフローの形を根本的に変更しない場合、データ統合システム200は上流のコンポーネントの属性に基づいて属性のセットを導き出し得る。ステップ1740では、導き出されたコンポーネントは、下流のコンポーネントに晒される。図17はステップ1750において終了する。したがって、ターゲットカラムTGT_EMPDEPT.NAMEのアサインメントは、コンポーネント1640の属性への参照の必要なく、SRC_EMP.ENAMEをトランスピアレントに参照し得る。
データ統合システム200はさらに、既存の設計へのコンポーネントの追加、典型的には単に必要なレベルコネクタをリルートすること、を簡易にする。たとえば、フィルタコンポーネントが設計に加えられると、コンポーネントレベルコネクタの変更は、ある下流のコンポーネントの属性のアサインメントに対する変更を必要としない。
図18は、本発明に従った一実施形態における、フィルタコンポーネント1800を有するマッピング1600の簡略ブロック図である。この例において、マッピング1600は、コンポーネント1610とコンポーネント1640との間に配置されるフィルタコンポーネント1800を含む。(たとえばフィルタSRG_EMP.SAL>3000を使用して)マッピング1600へフィルタコンポーネント1800を加えるために、ユーザは、コンポーネント1610とコンポーネント1640との間のグラフへフィルタコンポーネント1800を加える必要があるだけである。コンポーネントレベルコネクタは、フィルタコンポーネント1800が入力としてコンポーネント1610に接続するとともに出力としてのコンポーネント1640に接続するように再リンクされる必要がある。そのような変更は、マッピング1600において、如何なる下流のアサインメントへの変更も必要としない。従来のフローツールでは、カラムレベルのすべては、新しいコンポーネントの導入によって再リンクされる必要がある。
図19は、本発明に従った一実施形態におけるマッピング1900の簡略ブロック図である。この例において、マッピング1900は、データソースを表わすコンポーネントS1と、データソースを表わすコンポーネントS2と、データターゲットを表わすコンポーネントTとを含む。コンポーネントC1、C2およびC3は、マッピングを通って流れるデータの形に影響するように構成されるか、または、データのフローを制御するがフローの形を根本的に変更しないように構成される。この例において、コンポーネントC1はプロジェクタタイプである。したがって、コンポーネントC1は、下流のコンポーネント(たとえばコンポーネントC3以下)から閲覧されると、(いくつかがコンポーネントS1の1つ以上の属性から宣言される)属性の宣言されたセットを有しており、コンポーネントC3はセレクタタイプである。したがって、コンポーネントC3は(いくつかは、下流のコンポーネント(たとえばコンポーネントT)から閲覧されると、コンポーネントC1およびC2の1つ以上の属性から導出される)属性の導出されたセットを有する。
図20は、本発明の実施形態に従った、コンポーネントを生成するための方法2000のフローチャートを示す。図20に示された方法2000の実現または処理は、コンピュータシステムまたは情報処理デバイスのようなロジックマシンの中央処理装置(CPUまたはプロセッサ)によって実行される際にソフトウェア(たとえば命令またはコードモジュール)によって実行され得るか、電子デバイスまたは特定用途向け集積回路のハードウェアコンポーネントによって実行され得るか、または、ソフトウェアおよびハードウェア要素の組合せによって実行され得る。図20に示される方法2000はステップ2010において開始する。
ステップ2020において、コンポーネント定義が受け取られる。たとえば、コンポーネント定義はルール、オペレーション、プロシージャ、変数、およびシーケンスなどを含み得る。ステップ2030において、コンポーネントタイプが受け取られる。たとえば、コンポーネントがフローにおけるデータの形を変更する場合、コンポーネントは1つの態様で分類され得る。コンポーネントがデータのフローを制御するがフローの形を根本的に変更しない場合、コンポーネントは別の態様で分類され得る。ステップ2040では、コンポーネントが生成され、データ統合システム200によって使用され得る。図20はステップ2050において終了する。
したがって、データ統合システム200はユーザがプラットホームおよび技術に依存しない論理設計を作成することを可能にする。ユーザは、どのようにデータがソースとターゲットとの間に流れることをユーザが望むかをハイレベルで規定する論理設計を作成し得る。ユーザのインフラストラクチャを考慮して、ツールは、論理設計を分析し得、物理的設計を作成する。論理設計は、設計における各ソースおよびターゲットに対応する複数のコンポーネントと、ジョインまたはフィルタのようなオペレーションと、アクセスポイントとを含み得る。物理的設計に転送された際の各コンポーネントは、データに対してオペレーションを実行するようコードを生成する。存在する技術(たとえばSQLサーバ、オラクル、Hadoopなど)と使用される言語(SQL、pigなど)とに依存して、各コンポーネントによって生成されるコードは異なり得る。
したがって、データ統合システムのユーザは、論理設計における各コンポーネントにて、始めから終わりまですべてのデータ属性を特定することは必要とされない。データ統合システム200は、論理設計を通って流れる情報を完全に宣言する必要性を回避する、プロジェクタおよびセレクタタイプのような複数のコンポーネントタイプを提供する。データ統合システム200は、所定のコンポーネントタイプによって表わされるオペレーションにてどの属性が必要かを決定することができる。これは設計およびメンテナンスの両方を簡素化する。
結論
図21は、本発明の実施形態を実施するために使用され得るコンピュータシステム2100の簡略ブロック図である。図21に示されるように、コンピュータシステム2100は、バスサブシステム2120を介して多くの周辺機器と通信するプロセッサ2110を含む。これらの周辺機器は、メモリサブシステム2140およびファイルストレージサブシステム2150を含むストレージサブシステム2130と、入力デバイス2160と、出力デバイス2170と、ネットワークインターフェイスサブシステム2180とを含み得る。
バスサブシステム2120は、コンピュータシステム2100のさまざまなコンポーネントおよびサブシステムを意図されるように互いと通信させるためのメカニズムを提供する。バスサブシステム2120は単一のバスとして概略的に示されるが、バスサブシステムの代替的な実施形態は複数のバスを利用してもよい。
ストレージサブシステム2130は、本発明の機能を提供する基本的なプログラミングおよびデータ構造を格納するように構成され得る。本発明の機能を提供するソフトウェア(コードモジュールまたは命令)は、ストレージサブシステム2130に格納され得る。これらのソフトウェアモジュールまたは命令は、プロセッサ2110によって実行され得る。ストレージサブシステム2130は、さらに本発明に従って使用されるデータを格納するためのリポジトリを提供し得る。ストレージサブシステム2130は、メモリサブシステム2140とファイル/ディスクストレージサブシステム2150とを含み得る。
メモリサブシステム2140は、プログラム実行の間に命令およびデータの格納のためのメインランダムアクセスメモリ(RAM)2142と、固定された命令が格納されるリードオンリメモリ(ROM)2144とを含む多くのメモリを含み得る。ファイルストレージサブシステム2150は、プログラムおよびデータファイルのための持続性(不揮発性)ストレージを提供しており、ハードディスクドライブ、関連するリムーバブル媒体を有するフロッピー(登録商標)ディスクドライブ、コンパクトディスクリードオンリメモリ(CD−ROM)ドライブ、DVD、オプティカルドライブ、リムーバブル媒体カートリッジ、および他の同様のストレージ媒体を含み得る。
入力デバイス2160は、キーボードと、マウス、トラックボール、タッチパッドまたはグラフィックスタブレットのようなポインティングデバイスと、スキャナと、バーコードスキャナと、ディスプレイに組み込まれるタッチスクリーンと、音声認識システム、マイクロホンのような音声入力デバイスと、他のタイプの入力デバイスとを含み得る。一般に、「入力デバイス」という用語の使用は、コンピュータシステム2100に情報を入力するためのすべての可能なタイプのデバイスおよびメカニズムを含むように意図される。
出力デバイス2170は、ディスプレイサブシステム、プリンタ、ファックスマシン、または音声出力デバイスなどのノンビジュアルディスプレイを含み得る。ディスプレイサブシステムは、陰極線管(CRT)、液晶ディスプレイ(LCD)のようなフラットパネルデバイス、または投射デバイスであり得る。一般に、「出力デバイス」という用語の使用は、コンピュータシステム2100から情報を出力するためのすべての可能なタイプのデバイスおよびメカニズムを含むように意図される。
ネットワークインターフェイスサブシステム2180は、他のコンピュータシステム、デバイス、および通信ネットワーク2190のようなネットワークにインターフェイスを提供する。ネットワークインターフェイスサブシステム2180は、コンピュータシステム2100からデータを受け取るとともに他のシステムにデータを送信するためのインターフェイスとして機能する。通信ネットワーク2190のいくつかの例は、プライベートネットワーク、パブリックネットワーク、専用回線、インターネット、イーサネットネットワーク、トークンリングネットワーク、および光ファイバーネットワークなどである。
コンピュータシステム2100は、パーソナルコンピュータ、ポータブルコンピュータ、ワークステーション、ネットワークコンピュータ、メインフレーム、キオスクまたは任意の他のデータ処理システムを含むさまざまなタイプのものであり得る。コンピュータおよびネットワークの絶えず変化する性質により、コンピュータシステムの好ましい実施形態を説明する目的のために、図21に示されるコンピュータシステム2100の説明は特定の例としてのみ意図される。図21に示されたシステムよりも多くまたはより少ないコンポーネントを有する多くの構成が可能である。
図22は、実施形態に従ったデータマッピングの生成を促進するためのシステム2200の簡略ブロック図である。図22においてシステム2200に含まれるユニットは、コンピュータシステムまたは情報処理デバイスのようなロジックマシンの中央処理装置(CPUまたはプロセッサ)によって実行される際にソフトウェア(たとえば命令またはコードモジュール)において実行され得るか、電子デバイスまたは特定用途向け集積回路のハードウェアコンポーネントにおいて実行され得るか、または、ソフトウェアおよびハードウェア要素の組合せにおいて実現され得る。
図22に示されるように、特に、データ統合システム2200は、受取部2210、判定部2220および生成部2230を含み得る。受取部2210は、論理設計の1つ以上のコンポーネントを特定する情報を受け取るように構成され得、1つ以上のコンポーネントのうちの少なくとも1つは第1のタイプである。判定部2220は、論理設計における上流のコンポーネントに基づいて、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つの論理設計における下流のコンポーネントに可視であるデータ属性のセットを判定するように構成され得る。生成部2230は、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つの論理設計における下流のコンポーネントに可視である属性のセットを示す情報を生成するように構成され得る。
実施形態に従うと、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つの論理設計における下流のコンポーネントに可視であるデータ属性のセットを判定することは、上流のコンポーネントから可視である1つ以上の属性を導き出すことと、下流のコンポーネントに1つ以上の属性をエクスポーズすることとを含み得る。
実施形態に従うと、論理設計の1つ以上のコンポーネントを特定する情報は、論理設計を通って流れる情報の形を変更するオペレーションを示す情報を含み得る。
実施形態に従うと、論理設計の1つ以上のコンポーネントを特定する情報は、論理設計を通って流れる情報のフローを制御するが論理設計を通って流れる情報の形を変更しないオペレーションを示す情報を含み得る。
実施形態に従うと、論理設計の1つ以上のコンポーネントを特定する情報は、ソースデータストアに格納されるデータの1つ以上の属性を有するソースコンポーネントを示す情報を含み得る。
実施形態に従うと、論理設計の1つ以上のコンポーネントを特定する情報は、ターゲットデータストアに格納されるデータの1つ以上の属性を有するターゲットコンポーネントを示す情報を含み得る。
実施形態に従うと、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つの論理設計における下流のコンポーネントに可視である属性のセットを示す情報を生成することは、下流のコンポーネントに属性のリストをエクスポートすることを含み得る。
実施形態に従うと、受取部2210はさらに、論理設計へのコンポーネントまたは属性の導入または除去による論理設計における変更を受け取るように構成され得る。判定部2220はさらに、論理設計における変更が、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つに影響するかどうかを判定するように構成され得る。論理設計における変更が、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つに影響するという判定に基づいて、判定部2220はさらに、下流のコンポーネントに可視であるデータ属性の更新されたセットを決定するように構成され得る。
実施形態に従うと、データ統合システム2200は保存部2240をさらに含み得る。受取部2210はさらに、論理設計へのコンポーネントまたは属性の導入による論理設計における変更を受け取るように構成され得る。判定部2220はさらに、論理設計における変更が、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つに影響するかどうか判定するように構成され得る。論理設計における変更が第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つに影響するという判定に基づいて、保存部2240は下流のコンポーネントに可視であるデータ属性のセットを保存するように構成され得る。
実施形態に従うと、データ統合システム2200はリネーム部2250をさらに含み得る。受取部2210はさらに、コンポーネントまたは属性をリネームする、論理設計における変更を受け取るように構成され得る。判定部2220はさらに、論理設計における変更が、第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つに影響するかどうかを判定するように構成され得る。論理設計における変更が第1のタイプである1つ以上のコンポーネントのうちの少なくとも1つに影響するという判定に基づいて、リネーム部2250は下流のコンポーネントに可視であるデータ属性のセットをリネームするように構成され得る。
本発明の具体的な実施形態を記載してきたが、さまざまな修正例、変更例、代替的な構成、および均等例も本発明の範囲内に含まれる。記載された発明は、ある特定のデータ処理環境内のオペレーションに制限されず、複数のデータ処理環境において自由に作用する。さらに、特定の一連のトランザクションおよびステップを使用して本発明が記載されたが、本発明の範囲は記載された一連のトランザクションおよびステップに限定されるわけではないということは当業者に明らかであるはずである。
さらに、本発明をハードウェアおよびソフトウェアの特定の組合せを用いて説明したが、ハードウェアおよびソフトウェアの他の組合せも本発明の範囲内であると認識されるべきである。本発明は、ハードウェアのみで、またはソフトウェアのみで、またはその組合せを使用して実現され得る。
したがって、明細書および図面は、限定的な態様ではなく例示的な態様であるとみなされるべきである。しかしながら、添付の特許請求の範囲に記載されるより広い本発明の精神および範囲から逸脱することがなければ、追加、削減、削除、ならびに、他の修正および変更もなされてもよいということが明らかであろう。
その教示がこの開示内に示され得る1つ以上の発明のいずれかのさまざまな実施形態がソフトウェア、ファームウェア、ハードウェアまたはその組合せにおけるロジックの形で実現され得る。ロジックは、この開示において示された発明のさまざまな実施形態において開示され得るステップのセットを実行するために、ロジックマシンの中央処理装置(CPUまたはプロセッサ)を指示するように適合される命令のセットとして、マシンアクセス可能なメモリ、マシン読み取り可能な物品、有形的なコンピュータ読取可能媒体、コンピュータ読取可能記憶媒体、または他のコンピュータ/マシン読取可能媒体に格納され得る。ロジックは、この開示に示される発明のさまざまな実施形態における方法またはプロセスを行うよう実行される際に、コードモジュールがコンピュータシステムまたは情報処理デバイスのプロセッサにより作動状態になると、ソフトウェアプログラムまたはコンピュータプログラムプロダクトの一部を形成し得る。本願明細書において提供されるこの開示および教示に基づいて、示された発明の1つ以上のさまざまな実施形態の開示されたオペレーションまたは機能のいずれかをソフトウェア、ファームウェア、ハードウェアまたはその組合せで実現するための他の態様、変形例、修正例、代替例および/または方法を当業者は理解するであろう。
その教示がこの開示に示され得るそれらの発明のいずれか1つの開示された例、実現例およびさまざまな実施形態は、当業者にこの開示の教示を妥当な明瞭さで伝えるために単に例示的である。これらの実現例および実施形態は例示的な図または特定の図を参照して記載され得る際に、記載される方法および/または特定の構造のさまざまな修正例または適合例は当業者に明らかになり得る。本願明細書において発見されるこの開示およびこれらの教示に依存し、かつ、当該教示によって技術を進歩させたすべてのそのような修正例、適合例または変形例は、その教示がこの開示内に示され得る1つ以上の発明の範囲内に存在すると考えられるべきである。したがって、開示内に示された発明が具体的に示される実施形態にまったく限定されないということが理解されるので、この記載および図は限定的な意味で考えられるべきでない。
したがって、上記の記載および如何なる添付の図面、説明および図は、例示的であるが限定的ではないように意図される。したがって、この開示に示される如何なる発明の範囲も、上記の記載および図に示されるそれらの実施形態を単純に参照してではなく、それらの完全な範囲または均等物とともに係属中の請求項を参照して決定されるべきである。

Claims (21)

  1. データマッピングの生成を促進するための方法であって、
    論理設計の1つ以上のコンポーネントを特定する情報を1つ以上のコンピュータシステムにて受け取ることを含み、前記1つ以上のコンポーネントのうちの少なくとも1つは第1のタイプであり、前記方法はさらに、
    前記1つ以上のコンピュータシステムに関連付けられる1つ以上のプロセッサにより、前記論理設計における上流のコンポーネントに基づいて、前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つの前記論理設計における下流のコンポーネントに可視であるデータ属性のセットを判定することと、
    前記1つ以上のコンピュータシステムに関連付けられる前記1つ以上のプロセッサにより、前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つの前記論理設計における前記下流のコンポーネントに可視である属性の前記セットを示す情報を生成することとを含む、方法。
  2. 前記1つ以上のコンピュータシステムに関連付けられる前記1つ以上のプロセッサにより、前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つの前記論理設計における前記下流のコンポーネントに可視であるデータ属性の前記セットを判定することは、上流のコンポーネントから可視である1つ以上の属性を導き出すことと、下流のコンポーネントに前記1つ以上の属性をエクスポーズすることとを含む、請求項1に記載の方法。
  3. 前記論理設計の前記1つ以上のコンポーネントを特定する前記情報を受け取ることは、前記論理設計を通って流れる情報の形を変更するオペレーションを示す情報を受け取ることを含む、請求項1または2に記載の方法。
  4. 前記論理設計の前記1つ以上のコンポーネントを特定する前記情報を受け取ることは、前記論理設計を通って流れる情報のフローを制御するが前記論理設計を通って流れる前記情報の形を変更しないオペレーションを示す情報を受け取ることを含む、請求項1〜3のいずれか1項に記載の方法。
  5. 前記論理設計の前記1つ以上のコンポーネントを特定する前記情報を受け取ることは、ソースデータストアに格納されるデータの1つ以上の属性を有するソースコンポーネントを示す情報を受け取ることを含む、請求項1〜4のいずれか1項に記載の方法。
  6. 前記論理設計の前記1つ以上のコンポーネントを特定する前記情報を受け取ることは、ターゲットデータストアに格納されるデータの1つ以上の属性を有するターゲットコンポーネントを示す情報を受け取ることを含む、請求項1〜5のいずれか1項に記載の方法。
  7. 前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つの前記論理設計における前記下流のコンポーネントに可視である属性の前記セットを示す前記情報を生成することは、下流のコンポーネントに属性のリストをエクスポートすることを含む、請求項1〜6のいずれか1項に記載の方法。
  8. 前記論理設計へのコンポーネントまたは属性の導入または除去による前記論理設計における変更を前記1つ以上のコンピュータシステムにて受け取ることと、
    前記1つ以上のコンピュータシステムに関連付けられる前記1つ以上のプロセッサにより、前記論理設計における前記変更が前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つに影響するかどうかを判定することと、
    前記論理設計における前記変更が前記第1のタイプである前記1つ以上のコンポーネントの少なくとも1つに影響するという判定に基づいて、前記1つ以上のコンピュータシステムに関連付けられる前記1つ以上のプロセッサにより、下流のコンポーネントに可視であるデータ属性の更新されたセットを判定することとをさらに含む、請求項1〜7のいずれか1項に記載の方法。
  9. 前記論理設計へのコンポーネントまたは属性の導入による前記論理設計における変更を前記1つ以上のコンピュータシステムにて受け取ることと、
    前記1つ以上のコンピュータシステムに関連付けられる前記1つ以上のプロセッサにより、前記論理設計における前記変更が前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つに影響するかどうかを判定することと、
    前記論理設計における前記変更が前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つに影響するという判定に基づいて、下流のコンポーネントに可視であるデータ属性の前記セットを保存することとをさらに含む、請求項1〜8のいずれか1項に記載の方法。
  10. コンポーネントまたは属性をリネームする前記論理設計における変更を、前記1つ以上のコンピュータシステムにて受け取ることと、
    前記1つ以上のコンピュータシステムに関連付けられる前記1つ以上のプロセッサにより、前記論理設計における前記変更が前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つに影響するかどうかを判定することと、
    前記論理設計における前記変更が前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つに影響するという判定に基づいて、下流のコンポーネントに可視であるデータ属性の前記セットをリネームすることとをさらに含む、請求項1〜9のいずれか1項に記載の方法。
  11. データマッピングの生成を促進するためのコンピュータ実行可能コードを格納する一時的でないコンピュータ読取可能媒体であって、
    論理設計の1つ以上のコンポーネントを特定する情報を受け取るためのコードを含み、前記1つ以上のコンポーネントのうちの少なくとも1つは第1のタイプであり、
    前記論理設計における上流のコンポーネントに基づいて、前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つの前記論理設計における下流のコンポーネントに可視であるデータ属性のセットを判定するためのコードと、
    前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つの前記論理設計における前記下流のコンポーネントに可視である属性の前記セットを示す情報を生成するためのコードとを含む、一時的でないコンピュータ読取可能媒体。
  12. 前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つの前記論理設計における前記下流のコンポーネントに可視であるデータ属性の前記セットを判定するための前記コードは、上流のコンポーネントから可視である1つ以上の属性を導き出すとともに、下流のコンポーネントに前記1つ以上の属性をエクスポーズするためのコードを含む、請求項11に記載の一時的でないコンピュータ読取可能媒体。
  13. 前記論理設計の前記1つ以上のコンポーネントを特定する前記情報を受け取るための前記コードは、前記論理設計を通って流れる情報の形を変更するオペレーションを示す情報を受け取るためのコードを含む、請求項11または12のいずれか1項に記載の一時的でないコンピュータ読取可能媒体。
  14. 前記論理設計の前記1つ以上のコンポーネントを特定する前記情報を受け取るための前記コードは、前記論理設計を通って流れる情報のフローを制御するが前記論理設計を通って流れる前記情報の形を変更しないオペレーションを示す情報を受け取るためのコードを含む、請求項11〜13のいずれか1項に記載の一時的でないコンピュータ読取可能媒体。
  15. 前記論理設計の前記1つ以上のコンポーネントを特定する前記情報を受け取るための前記コードは、ソースデータストアに格納されるデータの1つ以上の属性を有するソースコンポーネントを示す情報を受け取るためのコードを含む、請求項11〜14のいずれか1項に記載の一時的でないコンピュータ読取可能媒体。
  16. 前記論理設計の前記1つ以上のコンポーネントを特定する前記情報を受け取るための前記コードは、ターゲットデータストアに格納されるデータの1つ以上の属性を有するターゲットコンポーネントを示す情報を受け取るためのコードを含む、請求項11〜15のいずれか1項に記載の一時的でないコンピュータ読取可能媒体。
  17. 前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つの前記論理設計における前記下流のコンポーネントに可視である属性の前記セットを示す前記情報を生成するための前記コードは、下流のコンポーネントに属性のリストをエクスポートするためのコードを含む、請求項11〜16のいずれか1項に記載の一時的でないコンピュータ読取可能媒体。
  18. 前記論理設計へのコンポーネントまたは属性の導入または除去による前記論理設計における変更を受け取るためのコードと、
    前記論理設計における前記変更が前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つに影響するかどうかを判定するためのコードと、
    前記論理設計における前記変更が、前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つに影響するという判定に基づいて、下流のコンポーネントに可視であるデータ属性の更新されたセットを判定するためのコードとをさらに含む、請求項11〜17のいずれか1項に記載の一時的でないコンピュータ読取可能媒体。
  19. 前記論理設計へのコンポーネントまたは属性の導入または除去による前記論理設計における変更を受け取るためのコードと、
    前記論理設計における前記変更が前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つに影響するかどうかを判定するためのコードと、
    前記論理設計における前記変更が、前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つに影響するという判定に基づいて、下流のコンポーネントに可視であるデータ属性の前記セットを保存するためのコードとをさらに含む、請求項11〜18のいずれか1項に記載の一時的でないコンピュータ読取可能媒体。
  20. コンポーネントまたは属性をリネームする前記論理設計における変更を受け取るためのコードと、
    前記論理設計における前記変更が前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つに影響するかどうかを判定するためのコードと、
    前記論理設計における前記変更が、前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つに影響するという判定に基づいて、下流のコンポーネントに可視であるデータ属性の前記セットをリネームするためのコードとをさらに含む、請求項11〜19のいずれか1項に記載の一時的でないコンピュータ読取可能媒体。
  21. データマッピングの生成を促進するためのシステムであって、
    プロセッサと、
    前記プロセッサと通信し、かつ、命令のセットを格納するように構成されるメモリとを含み、前記命令のセットは、前記プロセッサによって実行されると、
    論理設計の1つ以上のコンポーネントを特定する情報を受け取るように前記プロセッサを構成し、前記1つ以上のコンポーネントのうちの少なくとも1つは第1のタイプであり、前記命令のセットはさらに、
    前記論理設計における上流のコンポーネントに基づいて、前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つの前記論理設計における下流のコンポーネントに可視であるデータ属性のセットを判定し、
    前記第1のタイプである前記1つ以上のコンポーネントのうちの少なくとも1つの前記論理設計における前記下流のコンポーネントに可視である属性の前記セットを示す情報を生成するように前記プロセッサを構成する、システム。
JP2016513953A 2013-05-17 2014-03-26 Etlマップ設計のためのプロジェクタおよびセレクタコンポーネントタイプの使用 Active JP6412924B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361824544P 2013-05-17 2013-05-17
US61/824,544 2013-05-17
US14/044,417 2013-10-02
US14/044,417 US9507838B2 (en) 2013-05-17 2013-10-02 Use of projector and selector component types for ETL map design
PCT/US2014/031921 WO2014186058A1 (en) 2013-05-17 2014-03-26 Use of projector and selector component types for etl map design

Publications (3)

Publication Number Publication Date
JP2016525734A true JP2016525734A (ja) 2016-08-25
JP2016525734A5 JP2016525734A5 (ja) 2017-04-13
JP6412924B2 JP6412924B2 (ja) 2018-10-24

Family

ID=51896600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016513953A Active JP6412924B2 (ja) 2013-05-17 2014-03-26 Etlマップ設計のためのプロジェクタおよびセレクタコンポーネントタイプの使用

Country Status (5)

Country Link
US (1) US9507838B2 (ja)
EP (1) EP2997512A4 (ja)
JP (1) JP6412924B2 (ja)
CN (1) CN105339941B (ja)
WO (1) WO2014186058A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10216814B2 (en) 2013-05-17 2019-02-26 Oracle International Corporation Supporting combination of flow based ETL and entity relationship based ETL
US9922104B1 (en) * 2014-08-13 2018-03-20 Numerify, Inc. Metadata driven code-generated external data feeds
IN2015CH02357A (ja) * 2015-05-08 2015-05-22 Wipro Ltd
US11372880B2 (en) * 2016-02-26 2022-06-28 Crysp Intelligence Pty Ltd Data source system agnostic fact category partitioned information repository and methods for the insertion and retrieval of data using the information repository
EP3475888A1 (en) 2016-08-22 2019-05-01 Oracle International Corporation System and method for ontology induction through statistical profiling and reference schema matching
US11055310B2 (en) * 2017-12-04 2021-07-06 Bank Of America Corporation SQL server integration services (SSIS) package analyzer
AU2020100309B4 (en) * 2019-03-20 2020-09-24 Parametric Systems Pty Ltd Techniques for Controlling Interaction with an Application Database
CN110780946B (zh) * 2019-10-30 2021-05-25 京东数字科技控股有限公司 用于处理信息的方法和装置
US11824837B2 (en) * 2020-07-15 2023-11-21 Sap Se End user creation of trusted integration pathways between different enterprise systems
CN112035468B (zh) * 2020-08-24 2024-06-14 杭州览众数据科技有限公司 基于内存计算、web可视化配置的多数据源ETL工具
US11561803B1 (en) * 2021-07-08 2023-01-24 SambaNova Systems, Inc. Systems and methods for editing topology of a reconfigurable data processor
US11750488B1 (en) * 2022-04-12 2023-09-05 International Business Machines Corporation Minimizing latency of round trip network communication in a computing infrastructure

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005327232A (ja) * 2003-08-29 2005-11-24 Microsoft Corp 任意のデータモデル用のマッピングアーキテクチャ
WO2007083371A1 (ja) * 2006-01-18 2007-07-26 Fujitsu Limited データ統合装置、方法、プログラムを記録した記録媒体
JP2011034246A (ja) * 2009-07-30 2011-02-17 Fujitsu Ltd データ変換装置、データ変換方法、およびデータ変換プログラム
JP2012027690A (ja) * 2010-07-23 2012-02-09 Fujitsu Ltd 情報統合プログラム、装置及び方法
US20130103705A1 (en) * 2006-02-28 2013-04-25 Sap Ag Schema mapping and data transformation on the basis of a conceptual model
US20130111375A1 (en) * 2011-11-01 2013-05-02 Matthew Scott Frohliger Software user interface allowing logical expression to be expressed as a flowchart

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5659723A (en) 1991-12-20 1997-08-19 International Business Machines Corporation Entity/relationship to object oriented logical model conversion method
US7185016B1 (en) 2000-09-01 2007-02-27 Cognos Incorporated Methods and transformations for transforming metadata model
US7343585B1 (en) * 2002-01-30 2008-03-11 Oracle International Corporation Operator approach for generic dataflow designs
US7350191B1 (en) * 2003-04-22 2008-03-25 Noetix, Inc. Computer implemented system and method for the generation of data access applications
US7849438B1 (en) * 2004-05-27 2010-12-07 Sprint Communications Company L.P. Enterprise software development process for outsourced developers
US7430498B2 (en) * 2004-09-07 2008-09-30 The Boeing Company System, method and computer program product for developing a system-of-systems architecture model
TWI311705B (en) * 2005-05-23 2009-07-01 Via Tech Inc Peripheral component interconnect express and changing method of link power states thereof
US7581189B2 (en) * 2005-09-09 2009-08-25 Microsoft Corporation Dynamically generating a database report during a report building process
US7610299B2 (en) * 2006-11-30 2009-10-27 International Business Machines Corporation Method of processing data
US7860905B2 (en) 2007-04-24 2010-12-28 Microsoft Corporation Systems and methods for modularizing data flows
US8245105B2 (en) * 2008-07-01 2012-08-14 International Business Machines Corporation Cascade interconnect memory system with enhanced reliability
US9557889B2 (en) * 2009-01-28 2017-01-31 Headwater Partners I Llc Service plan design, user interfaces, application programming interfaces, and device management
US8719769B2 (en) 2009-08-18 2014-05-06 Hewlett-Packard Development Company, L.P. Quality-driven ETL design optimization
US9218408B2 (en) 2010-05-27 2015-12-22 Oracle International Corporation Method for automatically creating a data mart by aggregated data extracted from a business intelligence server
US20120054147A1 (en) 2010-08-25 2012-03-01 Christophe Goetz System and method for extract, transform, and load workflow generation
WO2012050579A1 (en) 2010-10-14 2012-04-19 Hewlett-Packard Development Company, L.P. Providing operational business intelligence
US8762934B2 (en) 2010-10-15 2014-06-24 Serghei Sarafudinov Method of extensible business object modeling and generation of system artifacts from the models
US8676772B2 (en) * 2011-12-09 2014-03-18 Telduráðgevin Sp/f Systems and methods for improving database performance
US9396037B2 (en) 2012-02-27 2016-07-19 Microsoft Technology Licensing, Llc Model-based data pipeline system optimization
US9020945B1 (en) * 2013-01-25 2015-04-28 Humana Inc. User categorization system and method

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005327232A (ja) * 2003-08-29 2005-11-24 Microsoft Corp 任意のデータモデル用のマッピングアーキテクチャ
WO2007083371A1 (ja) * 2006-01-18 2007-07-26 Fujitsu Limited データ統合装置、方法、プログラムを記録した記録媒体
US20130103705A1 (en) * 2006-02-28 2013-04-25 Sap Ag Schema mapping and data transformation on the basis of a conceptual model
JP2011034246A (ja) * 2009-07-30 2011-02-17 Fujitsu Ltd データ変換装置、データ変換方法、およびデータ変換プログラム
JP2012027690A (ja) * 2010-07-23 2012-02-09 Fujitsu Ltd 情報統合プログラム、装置及び方法
US20130111375A1 (en) * 2011-11-01 2013-05-02 Matthew Scott Frohliger Software user interface allowing logical expression to be expressed as a flowchart

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
データベース技術を最大限に活用できるデータ連係基盤 〜ORACLE DATA INTEGRATORのご紹介〜, JPN6018006501, 31 December 2010 (2010-12-31), pages p.1−54 *

Also Published As

Publication number Publication date
EP2997512A4 (en) 2017-01-18
EP2997512A1 (en) 2016-03-23
US9507838B2 (en) 2016-11-29
US20140344210A1 (en) 2014-11-20
WO2014186058A1 (en) 2014-11-20
CN105339941A (zh) 2016-02-17
JP6412924B2 (ja) 2018-10-24
CN105339941B (zh) 2019-03-05

Similar Documents

Publication Publication Date Title
JP6434960B2 (ja) フローベースのetlおよびエンティティリレーションシップベースのetlの組合せのサポート
US11847131B2 (en) Optimizing incremental loading of warehouse data
US11789964B2 (en) Load plan generation
JP6412924B2 (ja) Etlマップ設計のためのプロジェクタおよびセレクタコンポーネントタイプの使用
US10073867B2 (en) System and method for code generation from a directed acyclic graph using knowledge modules
US9659012B2 (en) Debugging framework for distributed ETL process with multi-language support
US10678632B2 (en) Extract-transform-load diagnostics
US9483506B2 (en) History preserving data pipeline
US8954375B2 (en) Method and system for developing data integration applications with reusable semantic types to represent and process application data
US20240061855A1 (en) Optimizing incremental loading of warehouse data
Tok et al. Microsoft SQL Server 2012 Integration Services
Aytas Designing Big Data Platforms: How to Use, Deploy, and Maintain Big Data Systems
Eisa Parallel Processing for Data Retrieval in Odoo Enterprise Resource Planning Reporting System
Virolainen Migrating Microservices to Graph Database
CN116457771A (zh) 用于提供与数据分析环境一起使用的查询执行调试器的系统和方法
CN117980892A (zh) 与数据分析环境一起使用的用于查询加速的系统和方法
Garcia MDSAA

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170310

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180313

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180612

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180619

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180905

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181001

R150 Certificate of patent or registration of utility model

Ref document number: 6412924

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250