JP2006031687A - 外部メタデータの処理 - Google Patents

外部メタデータの処理 Download PDF

Info

Publication number
JP2006031687A
JP2006031687A JP2005175734A JP2005175734A JP2006031687A JP 2006031687 A JP2006031687 A JP 2006031687A JP 2005175734 A JP2005175734 A JP 2005175734A JP 2005175734 A JP2005175734 A JP 2005175734A JP 2006031687 A JP2006031687 A JP 2006031687A
Authority
JP
Japan
Prior art keywords
data
external data
data file
metadata
column
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005175734A
Other languages
English (en)
Other versions
JP4758150B2 (ja
Inventor
James K Howey
ケー.ホーウェイ ジェームズ
Jeffrey R Bernhardt
アール.バーンハード ジェフリー
Theodore T Lee
ティー.リー セオドア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2006031687A publication Critical patent/JP2006031687A/ja
Application granted granted Critical
Publication of JP4758150B2 publication Critical patent/JP4758150B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 データフローと外部データファイルの整合性を検査する。
【解決手段】 少なくとも1つの外部データファイルの各々に対し、外部データファイルからの少なくとも1つのカラムの使用について記述する使用データを備えるデータフローモデルを記憶するステップと、外部データファイルの各々の少なくとも1つのカラムについて記述するデータを含むメタデータを記憶するステップと、記憶されたメタデータを使用して、データフローモデルと外部データファイルとの整合性があるかどうかを決定するステップとを備えた。
【選択図】 図3

Description

本発明は、一般には、情報技術の分野に関し、より詳細には、データフローに関するメタデータの作成および更新ならびにデータフローの妥当性を検査することを可能にするメタデータの使用に関する。
大きなデータの集まりを、複雑な方法で使用することができる。例えば、ファイル、データベース、および他のデータ記憶手段の中などのデータの集まりを、一連の長い動作の一部として開く、問合せる、または使用することができ、異なる変換の動作をデータに行い、結果のデータを記憶することを伴う。
例えば、図1は、2つのデータ入力と2つのデータ出力を有するデータフローのブロック図である。図1に示すように、ファイルAとデータベーステーブルAの両方が開かれる。図1に示すように、ファイルA1000からデータが読み出され、データベーステーブルA1010からデータが読み出される。それら2つのデータセットに結合1020が行われる。結合の結果を調べて、結合されたデータの各レコードについて、関連付けられた年齢ファイルに記憶された値が50未満であるかどうかを決定する(ボックス1030)。関連付けられた年齢フィールドが50未満のレコードは、性別1040で集約され、データベーステーブルB1050に格納される。関連付けられた年齢フィールドが50未満でないレコードは、ファイルB1060に格納される。
大きく複雑なデータの集まりの使用を可能にするために、ETL(Extract Transform Load)ツールが開発されている。そうしたツールは、データの集まりを使用する操作を行うための自動化された方法を提供する。ETLツールは、データの抽出すなわちデータソースからのデータの取り出し、データの変換すなわち抽出されたデータの利用、そしてデータのロード、すなわち変換の結果を後の使用のための格納というタスクを自動化する。例えば、図1に示された動作がETLツールによって行われる。
そのようなETL機能を容易に使用できるようにし、利用できる機能を拡大するために、ファイルまたは他のデータの集まりを使用するプロセスの視覚的な設計を可能にする設計ツールが開発されている。そのような設計ツールの1つが、マイクロソフト社から入手することができるData Transformation Services(DTS)として知られる。DTSでは、ユーザは、ファイル、データベース、または他のデータの集まりのデータを使用することができるプロセスを視覚的に設計することができる。DTSにより設計されるプロセス中の操作には、限定はしないが、標準的なETLツールを通じて利用できる動作を含めることができる。例えば、DTSで設計されたデータフローでは、ユーザは、所定のファイルを削除し、他のファイルを取得し(例えば指定されたソースからファイル転送プロトコル(FTP)により)、こうして取得された各ファイルに特定のETLプロセスを行うことを指定することができる。
ETLツールまたはDTSなどの設計ツールにより設計されるデータフローは、その使用に先立って設計される。これは、データフローの使用時にあいまい性につながる可能性がある。例えば、データソースを開き、データソースの各レコードについて、特定のカラム(column)AとカラムCにある情報を読み出すデータフローが設計される。しかし、実行時にデータソースを開くと、データソースは、各レコードにつき、カラムA、カラムB、カラムC、およびカラムDに情報を含んでいるとする。
データフローの設計者は、データソースにカラムBが含まれていることを知っていた可能性がある。その場合、カラムBから読み出すための時間と他の計算上のコストを最小限にするために、カラムBから情報を読み出さないようにする設計上の選択が行われている場合がある。したがって、カラムBを含めるべきかどうかを実行時にユーザに尋ねると、不必要な混乱と遅れを生じさせる可能性がある。
一方、データフローの設計者は、カラムDがデータソースに含まれることになることを知らず、データフローのユーザは、カラムDをデータフローに含めると有用であることを発見する可能性がある。したがって、カラムDを含めるべきかどうかを実行時にユーザに尋ねることは有用であることになる。
しかし、データが意図的にデータソースから含められなかった状況と、データソースが変更された状況とを見分ける方法はない。したがって、実行時にユーザに不必要な質問がなされるか、または、有用なデータが失われてしまう可能性がある。
さらに加えて、データの集まりには他の変更が加えられる可能性もある。例えば、カラムAの型が、予想される型から変更されている可能性がある。これは、データフローでカラムAに設計された操作と両立する場合も、しない場合もある。データの型が多少変更されていると、操作は正常に進行する可能性があるが、予期せぬ結果が生じる可能性がある。しかし、その変更が予期されたものか、そうでなかったかを区別する方法はない。上と同じように、変更が予期されたものであった場合でもデータの型の非互換性についてユーザに意見が求められるか、またはユーザに意見が求められず、その場合は問題に発展する可能性がある。
したがって、従来技術のこうした不利点を克服するシステムおよび方法が必要とされる。本発明は、上述の必要性に対処し、本明細書に明らかにされる追加的な利点でそれらの必要性を解決する。
本発明は、データフローに使用される外部のデータファイル(あるいはデータの集まり)の内容に関する外部のメタデータを記憶することを可能にする。そのような情報を記憶することにより、後に、データの集まりに変更が生じているかどうか、生じている場合はどのような動作をとることが可能であるかを判断するために、データの集まりの内容を調べ、外部メタデータを使用することができる。データフローについて記述するデータフロー情報と、データフローで使用されるデータの集まりに関する記憶された外部メタデータとを調べて、その情報に整合性がある(consistent)かどうかを決定する。整合性がない場合は、ユーザに意見を求めるか、または自動的な手段(型の変換など)を行わせることができる。
データの集まりを利用することができない時でも、データフローが、外部メタデータに反映されたデータの集まりとの整合性があるかどうかを決定するために、外部のメタデータを使用することができる。整合性を保証するようにデータフローを変更することができる。
外部メタデータの再同期により、外部のメタデータを更新して、外部メタデータの記憶から引き続き利益が得られるようにすることができる。
本発明の他の特徴は、下記で述べる。
前述の課題を解決するための手段と以下の好ましい実施形態の詳細な説明は、添付図面と併せて読むと、より理解される。本発明を例示する目的ために、図面には本発明の典型的な構成を示すが、本発明は、ここに開示される特定の方法および手段に限定されない。
(例示的コンピューティング環境)
図2に、本発明のいくつかの態様を実装することが可能な例示的コンピューティング環境を示す。コンピューティングシステム環境100は、適切なコンピューティング環境の一例に過ぎず、本発明の使用または機能の範囲について何らの限定を示唆するものではない。また、コンピューティング環境100は、例示的動作環境100に示す構成要素の1つまたは組み合わせに関連する依存性または必要性を有するものとも解釈すべきでない。
本発明は、多数の他の汎用または専用のコンピューティングシステム環境または構成で機能する。本発明に使用するのに適する可能性のあるよく知られるコンピューティングシステム、環境、および/または構成の例には、限定はしないが、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドあるいはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサを利用したシステム、セットトップボックス、プログラム可能な家庭電化製品、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、組み込みシステム、あらゆる上記のシステムまたはデバイスを含む分散コンピューティング環境などがある。
本発明は、コンピュータによって実行されるプログラムモジュールなどのコンピュータ実行可能命令との一般的関連で説明することができる。一般に、プログラムモジュールには、特定のタスクを行うか、特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などが含まれる。本発明は、通信ネットワークあるいは他のデータ通信媒体を通じてつながれた遠隔の処理デバイスによってタスクを実行する分散コンピューティング環境で実施することもできる。分散コンピューティング環境では、プログラムモジュールおよび他のデータは、メモリ記憶装置を含むローカルおよびリモート両方のコンピュータ記憶媒体に置くことができる。
図2を参照すると、本発明を実装する例示的システムは、コンピュータ110の形態の汎用コンピューティングデバイスを含む。コンピュータ110の構成要素には、限定はしないが、処理装置120、システムメモリ130、およびシステムメモリを含む様々なシステム構成要素を処理装置120に結合するシステムバス121を含むことが可能である。処理装置120は、マルチスレッドプロセッサで支援されるような複数の論理処理装置を表すことができる。システムバス121は、あらゆる様々なバスアーキテクチャを使用した、メモリバスあるいはメモリコントローラ、周辺バス、およびローカルバスを含む数種のバス構造のいずれでもよい。限定ではなく例として、そのようなアーキテクチャには、ISA(Industry Standard Architecture)バス、MCA(Micro Channel Architecture)バス、EISA(Enhanced ISA)バス、VESA(Video Electronics Standards Association)ローカルバス、およびPCI(Peripheral Component Interconnect)バス(メザニンバスとも知られる)がある。システムバス121は、通信デバイス間の2地点間接続、スイッチングファブリックなどとして実装することもできる。
コンピュータ110は、通例、いろいろなコンピュータ可読媒体を含む。コンピュータ可読媒体は、コンピュータ110によるアクセスが可能な利用可能媒体でよく、揮発性および不揮発性の媒体、取り外し可能および固定の媒体を含む。限定ではなく例として、コンピュータ可読媒体は、コンピュータ記憶媒体と通信媒体を含むことができる。コンピュータ記憶媒体には、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータなどの情報を記憶するあらゆる方法または技術として実装された、揮発性および不揮発性、取り外し可能および固定の媒体が含まれる。コンピュータ記憶媒体には、限定はしないが、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD−ROM、デジタル多用途ディスク(DVD)または他の光ディスク記憶、磁気カセット、磁気テープ、磁気ディスク記憶または他の磁気記憶装置、もしくは所望の情報を記憶するために使用することができ、コンピュータ110によるアクセスが可能なあらゆる他の媒体が含まれる。通信媒体は、通例、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータを、搬送波や他の転送機構などの変調データ信号として組み立て、およびあらゆる情報伝達媒体を含む。用語の「変調データ信号」とは、信号に情報を符号化するような方法で、情報の特性の1つまたは複数を設定または変化させた信号を意味する。限定ではなく例として、通信媒体には、有線ネットワークまたは直接配線接続などの有線媒体、ならびに、音波、RF、赤外線および他の無線媒体などの無線媒体が含まれる。あらゆる上記の媒体の組み合わせもコンピュータ可読媒体の範囲内に含まれるであろう。
システムメモリ130は、読み取り専用メモリ(ROM)131やランダムアクセスメモリ(RAM)132などの揮発性および/または不揮発性メモリの形態のコンピュータ記憶媒体を含む。起動時などにコンピュータ110内の要素間の情報転送を助ける基本ルーチンを含んだ基本入出力システム133(BIOS)は、通例、ROM131に記憶される。RAM132は、通例、処理装置120により即時アクセスできるおよび/または現在操作されているデータおよび/またはプログラムモジュールを保持する。限定ではなく例として、図2には、オペレーティングシステム134、アプリケーションプログラム135、他のプログラムモジュール136、およびプログラムデータ137を例示する。
コンピュータ110は、他の取り外し可能/固定、揮発性/不揮発性のコンピュータ記憶媒体も含むことができる。単なる例として、図2には、固定、不揮発性の磁気媒体に対する読み取りまたは書き込みを行うハードディスクドライブ140、取り外し可能、不揮発性の磁気ディスク152に対する読み取りまたは書き込みを行う磁気ディスクドライブ151、CD−ROMや他の光学媒体などの取り外し可能、不揮発性の光ディスク156に対する読み取りまたは書き込みを行う光ディスクドライブ155を示す。例示的動作環境で使用することができる他の取り外し可能/固定、揮発性/不揮発性のコンピュータ記憶媒体には、限定はしないが、磁気テープカセット、フラッシュメモリカード、デジタル多用途ディスク、デジタルビデオテープ、固体素子RAM、固体素子ROMなどを含む。ハードディスクドライブ141は、通例、インタフェース140などの固定メモリインタフェースを通じてシステムバス121に接続され、磁気ディスクドライブ151および光ディスクドライブ155は、通例、インタフェース150などの取り外し可能メモリインタフェースによりシステムバス121に接続される。
上述し、図2に例示するドライブおよびドライブに関連付けられたコンピュータ記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、および他のデータの記憶をコンピュータ110に提供する。図2では、例えば、ハードディスクドライブ141によって、オペレーティングシステム144、アプリケーションプログラム145、他のプログラムモジュール146、およびプログラムデータ147を記憶するとして例示する。これらの構成要素は、オペレーティングシステム134、アプリケーションプログラム135、他のプログラムモジュール136、およびプログラムデータ137と同じでも異なってもよいことに留意されたい。オペレーティングシステム144、アプリケーションプログラム145、他のプログラムモジュール146、およびプログラムデータ147には、それらが少なくとも異なるコピーであることを例示するために、本明細書では異なる参照符号を付与している。ユーザは、キーボード162および、一般にはマウス、トラックボールまたはタッチパッドと称されるポインティングデバイス161などの入力装置を通じてコンピュータ20にコマンドおよび情報を入力することができる。他の入力装置(図示せず)には、マイクロフォン、ジョイスティック、ゲームパッド、衛星受信アンテナ、スキャナなどがを含むことができる。上記および他の入力装置は、多くの場合、システムバスに結合されたユーザ入力インタフェース160を通じて処理装置120に接続されるが、パラレルポート、ゲームポートまたはユニバーサルシリアルバス(USB)などの他のインタフェースおよびバス構造により接続してもよい。モニタ191または他の型の表示装置も、ビデオインタフェース190などのインタフェースを介してシステムバス121に接続される。モニタに加えて、コンピュータは、スピーカ197やプリンタ196などの他の周辺出力装置も含むことができ、それらは、出力周辺インタフェース195を通じて接続することができる。
コンピュータ110は、リモートコンピュータ180などの1つまたは複数のリモートコンピュータとの論理接続を使用するネットワーク環境で動作することができる。リモートコンピュータ180は、パーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ピアデバイスまたは他の一般的なネットワークノードであり、図2にはメモリ記憶装置181のみを例示するが、通例、コンピュータ110との関連で上述した要素の多くまたはすべてを含む。図2に示す論理接続は、ローカルエリアネットワーク(LAN)171およびワイドエリアネットワーク(WAN)173を含むが、他のネットワークを含むこともできる。このようなネットワーキング環境は、オフィス、企業内のコンピュータネットワーク、イントラネット、およびインターネットに一般的に見られる。
LANネットワーキング環境で使用される場合、コンピュータ110は、ネットワークインタフェースまたはアダプタ170を通じてLAN171に接続される。WANネットワーキング環境で使用される場合、コンピュータ110は通例、モデム172またはインターネットなどのWAN173の上で通信を確立するための他の手段を含む。モデム172は、内蔵型でも外付け型でもよく、ユーザ入力インタフェース160、または他の適切な機構を介してシステムバス121に接続することができる。ネットワーク環境では、コンピュータ110との関連で図示するプログラムモジュールあるいはその一部は、遠隔のメモリ記憶装置に記憶することができる。限定ではなく例として、図2では、リモートアプリケーションプログラム185がメモリデバイス181に存在するとして例示する。示されたネットワーク接続は典型的なものであり、コンピュータ間に通信リンクを確立する他の手段を使用してよいことは理解されよう。
(外部メタデータ処理システム)
データフローが作成される場合、データフローの結果として入力および出力データの集まりを識別する。データフロー用の入力および出力データの集まりが問合わされ、データの集まりごとに、外部のメタデータ(データフローのために使用される外部のデータソースについてのメタデータ)が取り出され、格納される。データの集まりとしてのメタデータは、データの集まりの中の使用可能な情報について記述する。
一実施形態では、各入力または出力データの集まりは、レコード(record)情報を含む。各レコードにつき、いくつかのカラムが格納される。データの集まりのために取り出される外部のメタデータは、データの集まりの中の使用可能な各カラムについて、いろいろのメタデータの記述するカラムを格納する。
データ型:カラムに格納されたデータの型
長さ:カラムに格納されたデータの長さ
精度:カラムに格納されたデータの精度
コードページ:カラムのデータ型が文字に基づく場合、カラムに格納されたデータのコードページ。コードページは、コードページ中の各文字に数値が割り当てられ、順序付けられた文字のセットである。
スケール:データがまったく数字だけ(numeric in nature)である場合、カラムに格納されたデータのスケール。スケールは、データ中の小数点の右にある桁数である。
他の実施形態では、他のいろいろのメタデータの記述する利用可能なカラムを格納することもできる。
外部メタデータは、初めに、データフローが設定または構成される場合に格納される。最初のバージョンの外部メタデータは、データフローが設計された場合に存在したとおりのデータの集まりを記述する。そして、データフローに変更が生じたかどうかを決定するために、実行時にデータフローのために外部のメタデータを使用することができる。以下で説明するように、外部メタデータを、再同期を通じて更新することができる。
(妥当性検査と再同期)
データフローを使用しようとする場合、外部メタデータを使用して、現時点で存在するとおりのデータの集まりでデータフローの使用の妥当性を検査することができる。こうして、データの集まりに対する関連する変更を検出することができる。さらに加えて、検出された変更をどのように解決できるかを決定するために、妥当性検査情報を使用することができる。
図3は、本発明の一実施形態による、少なくとも1つの外部データファイルを使用するデータフローに関するデータフロー情報を作成する方法のフロー図である。図3に示すように、ステップ300では、データフローモデルを格納する。データフローモデルは、データフローを記述し、データフローにおける、いくつかの外部データファイル(データの集まり)の各々から少なくとも1つのカラムの使用を記述する情報を含む。ステップ310では、メタデータを格納する。格納された外部メタデータは、外部のデータファイル/データの集まりに存在するカラムについて記述する。次いでステップ320では、格納されたメタデータを使用して、データフローモデルと外部のデータファイルに整合性があるかどうかを決定する。これを妥当性検査と称する。
妥当性検査は、接続状態であっても切断状態であってもよい。接続状態の妥当性検査では、データの集まりを(接続状態で)利用することができ、集まりを問合せして、データの集まりの内容に関する情報を決定し、その情報を、格納された外部メタデータと比較することができる場合に行われる。接続状態の妥当性検査では、現在のデータの集まりの各々の関連する状態が外部のメタデータに十分に表されているかどうか、または、データの集まりの何らかの変更または破損が原因で問題が存在するかどうかを決定する。一実施形態では、各々のデータの集まりに対する妥当性状態が決定される。問題が存在することを示す妥当性状態がデータの集まりに割り当てられる場合は、ユーザに問い合わせてどのような動作をとるべきかを決定する。さらに加えて、接続状態の妥当性検査では、各々のデータの集まりの関連する状態と、データフローによって必要とされる情報とを比較する。この場合も、そのような状態情報を使用して、データフローの実行時に問題を発生させる可能性のある、データの集まりの変更を検出する。
切断状態の妥当性検査では、外部のメタデータと、データフローによって必要とされる情報とを比較し、データの集まりのあらゆる変更を参照しない。ユーザは、例えばデータの集まりを利用できない時に、切断状態の妥当性検査を行うことを選択することができる。したがって、例えば、データの集まりへのユーザアクセスを提供するネットワークから切断されている間、データの集まりに現在での接続を持たないユーザでも切断状態の妥当性検査を行うことができる。このような妥当性検査により、ユーザは、データの集まりへの接続を必要とせずに、問題につながる可能性のあるデータフローへの変更を識別することができる。
再同期は、データフローと現在のデータの集まりとの互換性(接続状態の再同期の場合)または現在格納されている外部メタデータとの互換性(切断状態の再同期の場合)を維持するために、データフローを変更する。データフロー中の残りのオブジェクトへの変更を最小に抑え、必要とされるユーザ対話をできるだけ少なくする修正が行われる。
(接続状態の妥当性検査および再同期)
上述のように、接続状態での妥当性検査が行われる場合、データの集まりを再度問合わせて、データの集まりに対する外部メタデータを決定する。データの集まりに対する格納された外部メタデータとの比較が行われる。相違が存在する場合は、そのように検出される。
表1に示すように、妥当性検査時に発生する可能性のあるシナリオがいくつかある。
Figure 2006031687
1番目のシナリオでは、データの集まりにカラムが存在するが、格納された外部メタデータには存在しない。したがって、外部メタデータの作成時に存在したそのカラムが、それ以後データの集まりから削除されたと推測される。2番目のシナリオでは、格納された外部メタデータの収集時に存在しなかったカラムが、現在、データの集まりに存在し、したがって、データの集まりにカラムが追加されたと推測される。3番目および4番目のシナリオでは、過去にデータの集まりにカラムが存在し、現在、格納された外部メタデータにも存在する。3番目のシナリオでは、格納された外部メタデータに収集された型の情報は、データの集まりの中の型の情報と整合性がある。したがって、カラムに対する外部メタデータの変更は検出されない。しかし、4番目のシナリオでは、カラムが、データの集まり中でデータ型を変更している。このようなシナリオでは、一実施形態において、ユーザに不一致を通知する。一実施形態では、ユーザに、格納された外部メタデータ中のデータ型を修正する機会を与えることができる。
加えて、一実施形態では、データの集まりに対するデータフローによって実際に使用されるカラムを参照した妥当性検査も行われる。発生する可能性のあるシナリオを表2に示す。
Figure 2006031687
したがって、表2の1番目のシナリオから分かるように、データフローにカラムが存在するが、データの集まりには存在しない場合は、妥当性検査の問題が発生する。データフローで使用されているカラムが、データの集まりに存在しない。このようなシナリオでは、一実施形態において、妥当性検査の問題を解決するためにユーザ入力を要求する。
2番目および3番目のシナリオでは、妥当性検査の問題が発生しない。データの集まり中のカラムはデータフローで参照されないか、または、データの集まりの中のカラムがデータフローの中で参照され、かつすべての型情報が一致する。これらのシナリオでは、妥当性検査の問題が発生しない。カラムがデータフローで使用されないか、または、カラムが使用され、型情報が予想される通りであるかのいずれかである。
4番目のシナリオでは、カラムがデータの集まりに存在し、データフローで参照されるが、型の情報が変更されている。そのような場合、一実施形態では、この不整合を解決する試みが行われる。型に互換性があり、あらゆる型の不整合を解決できる変換が存在する場合は、変換を使用することができ、不整合が解消される。型に互換性があるが、何らかの他の方法(例えばデータフロー中で実装されるメソッドを介するなど)でデータフローによって状態を修正することができる場合も、不整合を解消することができる。しかし、型に互換性がなく、状態を別の方法で修正することができない場合は、非互換性のために妥当性検査を完了することができない。一実施形態では、非互換性を解決するようにユーザを促す。
妥当性検査の結果、妥当性検査の状態を返すことができる。例えば、一実施形態では、妥当性検査の状態ISVALIDは、妥当性検査に何の問題もないことを表す。妥当性検査の状態ISBROKENは、問題が存在するが、問題が、ユーザにより、またはデータフロー中のメソッドを通じて解決可能であることを意味する。例えば、上述のように、型の不整合を解決することができる型の不整合の変換を利用できる可能性がある。妥当性検査の状態NEEDSNEWMETADATAは、再同期(以下で説明する)を実行すべきことを意味する。妥当性検査の状態ISCORRUPTは、容易には解決することができない問題を意味する。
データの集まりが変更された場合、格納されたメタデータは、以前の時点におけるデータの集まりの状態を反映している。再同期は、格納された外部メタデータを、データの集まりの情報(接続状態の再同期)またはデータフローの情報(切断状態での再同期)と再同期する。
接続状態の再同期の場合は、見つかるデータの集まり情報と一致するように、格納された外部メタデータが変更される。一実施形態では、格納された外部メタデータに見つからないカラムがデータの集まりに存在することが判明した場合、そのカラムに関する情報が、格納された外部メタデータに追加される。格納された外部メタデータとデータの集まりとの両方にカラムが存在するが、型の情報が変更されている場合は、データの集まりからの新しい型の情報で、格納された外部メタデータを更新する。
同様に、接続状態での再同期では、データフローを更新することにより、データの集まりの情報の変更を反映する。データフローで参照されるカラムがもはやデータの集まりで利用することができなくなると、カラムはデータフローから削除される。さらに加えて、妥当性検査を参照して上述したように、格納された外部メタデータおよびデータフローに情報が見つかるカラムの型が変更された場合は、相違を解消する方法があり、可能な場合は再同期で相違が解消される。一実施形態では、データフローの公開されたメソッドを呼び出して、不整合を解消することができ、データフローが変更される。別の実施形態では、ユーザに要求を行うことにより不整合を解消する。
(切断状態での妥当性検査および再同期)
上述のように、切断状態の妥当性検査が行われる際には、データの集まりに問合わせが行われない。格納された外部メタデータをデータフローと比較して、それらに整合性があることを確実にする。可能性のあるシナリオを表3に示す。
Figure 2006031687
したがって、表3の1番目のシナリオから分かるように、データフローにカラムが存在するが、格納された外部メタデータに存在しない場合は、妥当性検査の問題が発生する。データフローで使用されているカラムが、格納された外部メタデータにより、データの集まりに存在すると示されない。そのようなシナリオでは、一実施形態では、妥当性検査の問題を解決するためにユーザ入力が要求される。
2番目および3番目のシナリオでは、妥当性検査の問題は発生しない。格納された外部メタデータに存在すると示されるカラムは、データフローで参照されないか、または、格納された外部メタデータに存在すると示されるカラムが、データフローで参照され、かつすべての型の情報が一致する。これらのシナリオでは、妥当性検査の問題が発生しない。カラムがデータフローで使用されないか、または、カラムが使用され、型の情報が予想通りであるかのいずれかである。
4番目のシナリオでは、格納された外部メタデータにカラムが存在し、データフローで参照されるが、型の情報が変更されている。そのような場合、一実施形態では、不整合を解消する試みがなされる。型に互換性があり、あらゆる型の不整合を解消することができる変換が存在する場合は、変換を使用することができ、したがって不整合が解消される。型に互換性があるが、何らかの他の方法(例えばデータフローコンポーネントのインタフェースを介するなど)でデータフローにより状態を修正することができる場合も、不整合を解消することができる。しかし、型に互換性がなく、別の方法で状態を修正することができない場合は、非互換性のために妥当性検査を完了することができない。一実施形態では、非互換性を解決するようにユーザが促される。
図4は、本発明の一実施形態によるデータフローモデルを評価する方法のフロー図である。ステップ400では、外部データファイルについて記述するメタデータが取り出される。ステップ410で、取り出したメタデータを使用して、データフローモデルとメタデータが整合するかどうかを決定する。
切断状態の妥当性検査ではなく切断状態の再同期が実行される場合は、格納された外部メタデータに反映されたデータの集まりの解釈と一致するようにデータフローが変更される。したがって、一実施形態では、データフローにカラムが存在するが、格納された外部メタデータには存在しない場合は、格納された外部メタデータにカラムがないことにより示されるように、データの集まりでカラムを利用できないという解釈を反映するようにデータフローのカラムが削除される。さらに加えて、データフローおよび格納された外部メタデータが1つのカラムについて異なる型の情報を含む場合は、可能である場合にはその相違が解消される。一実施形態では、データフローの公開されたメソッドを呼び出して不整合を解消することができ、データフローが変更される。別の実施形態では、ユーザに要求を行うことにより不整合を解消する。
(結論)
上述の例は、単に説明の目的ために提供されたものであり、本発明を限定するものとは解釈すべきでないことに留意されたい。本発明について様々な実施形態を参照して説明したが、本明細書で使用された語は、限定の語ではなく、説明と例示の語であることは理解されよう。さらに、本発明について特定の手段、材料、および実施形態を参照して説明したが、本発明は、本明細書に開示される特定の詳細に限定されず、本発明は、頭記の特許請求の範囲に述べられるような、機能的に均等なすべての構造、方法、および使用法に及ぶ。当業者は、本明細書の利益と教示を得て、多数の改変を本発明に加えることができ、その態様における本発明の範囲と主旨から逸脱することなく変更を加えることができる。
データフローの図である。 本発明の態様を実装することが可能な例示的コンピューティング環境のブロック図である。 本発明の一実施形態による、少なくとも1つの外部データファイルを使用してデータフローに関するデータフロー情報を作成する方法のフロー図である。 本発明の一実施形態による、データフローモデルを評価する方法のフロー図である。

Claims (38)

  1. 各々の外部データファイルが情報のカラムを含む少なくとも1つの前記外部データファイルを使用するデータフローに関するデータフロー情報を作成する方法であって、
    前記少なくとも1つのデータファイルの各々に対し、前記外部データファイルからの少なくとも1つのカラムの使用について記述する使用データを備えるデータフローモデルを記憶するステップと、
    前記少なくとも1つの外部データファイルの各々の少なくとも1つのカラムについて記述するデータを含むメタデータを記憶するステップと、
    前記記憶されたメタデータを使用して、前記データフローモデルと前記外部データファイルとの整合性があるかどうかを決定するステップと
    を備えたことを特徴とする方法。
  2. 前記少なくとも1つのカラムについて記述するデータは、前記少なくとも1つのカラムに関連する型データを備えたことを特徴とする請求項1に記載の方法。
  3. 前記記憶されたメタデータを使用して、前記データフローモデルと前記外部データファイルとの整合性があるかどうかを決定するステップは、
    各外部データファイルに対し、前記記憶されたメタデータが、前記外部データファイルの現在の状態と整合性があることを確認するステップ
    を備えたることを特徴とする請求項1に記載の方法。
  4. 前記記憶されたメタデータが、前記外部データファイルの現在の状態と整合性があることを確認するステップは、
    前記記憶されたメタデータに記述された各カラムが、前記外部データファイルにあるかどうかを決定するステップと、
    前記外部データファイル中の各カラムが、前記記憶されたメタデータに記述されているかどうかを決定するステップと
    を備えたことを特徴とする請求項3に記載の方法。
  5. 前記少なくとも1つのカラムについて記述するデータは、前記カラムに記憶されたデータの型について記述する型のデータを備え、前記記憶されたメタデータが前記外部データファイルの現在の状態と整合性があることを確認するステップは、
    前記記憶されたメタデータに記述された各カラムの前記型のデータが、前記外部データファイルの前記カラムの前記型データと整合性があるかどうかを決定するステップをさらに備えたことを特徴とする請求項4に記載の方法。
  6. 前記記憶されたメタデータを使用して、前記データフローモデルと前記外部データファイルとの整合性があるかどうかを決定するステップは、
    前記記憶されたメタデータが前記外部データファイルの前記現在の状態と整合性があることを示す妥当性検査状態を提供するステップをさらに備えたことを特徴とする請求項3に記載の方法。
  7. 前記記憶されたメタデータを使用して、前記データフローモデルと前記外部データファイルとの整合性があるかどうかを決定するステップは、
    前記記憶されたメタデータが前記外部データファイルの前記現在の状態と整合性がない場合は、前記非整合性を解消するステップをさらに備えたことを特徴とする請求項3に記載の方法。
  8. 前記非整合性を解消するステップは、
    前記非整合性を解消するように前記ユーザに問い合わせるステップを備えたことを特徴とする請求項7に記載の方法。
  9. 前記非整合性を解消するステップは、
    前記データフローのインタフェースを使用して前記非整合性を解消するステップを備えたことを特徴とする請求項7に記載の方法。
  10. 前記外部データファイルの各々に記憶された前記現在のデータを反映するデータを含むように、前記記憶されたメタデータを再同期するステップをさらに備えたことを特徴とする請求項1に記載の方法。
  11. 前記使用データに記述された前記外部データファイルからの少なくとも1つのカラムの前記各々の使用が前記外部データファイルの各々に対する現在の状態から提供されたかどうかを決定することにより、前記データフローモデルと前記外部データファイルとに整合性があるかどうかを決定するステップをさらに備えたことを特徴とする請求項1に記載の方法。
  12. 前記使用データに記述された前記外部データファイルからの少なくとも1つのカラムの前記各々の使用が前記外部データファイルの各々に対する現在の状態から提供されたかどうかを決定することにより、前記データフローモデルと前記外部データファイルとに整合性があるかどうかを決定するステップは、
    前記データフローモデルが前記外部データファイルの前記現在の状態と整合性があるかどうかを示す妥当性検査状態を提供するステップを備えたことを特徴とする請求項11に記載の方法。
  13. 前記使用データに記述された前記外部データファイルからの少なくとも1つのカラムの前記各々の使用が前記外部データファイルの各々に対する現在の状態から提供されたかどうかを決定することにより、前記データフローモデルと前記外部データファイルとに整合性があるかどうかを決定するステップは、
    前記記憶されたメタデータが前記外部データファイルの前記現在の状態と整合性がない場合には、前記非整合性を解消するステップを備えたことを特徴とする請求項11に記載の方法。
  14. 前記非整合性を解消するステップは、
    前記非整合性を解消するように前記ユーザに問い合わせるステップを備えたことを特徴とする請求項13に記載の方法。
  15. 前記非整合性を解消するステップは、
    前記データフローのインタフェースを使用して前記非整合性を解消するステップを備えたことを特徴とする請求項13に記載の方法。
  16. 前記外部データファイルの前記現在の状態を反映するよう前記データフローを再同期するステップをさらに備えたことを特徴とする請求項11に記載の方法。
  17. 前記記憶されたメタデータを使用して、前記データフローモデルと前記外部データファイルとの整合性があるかどうかを決定するステップは、
    前記記憶されたメタデータが、前記データフローと整合性があることを確認するステップを備えたことを特徴とする請求項1に記載の方法。
  18. 前記記憶されたメタデータが、前記データフローと整合性があることを確認するステップは、
    前記使用データに記述された前記外部データファイルからの少なくとも1つのカラムの前記使用それぞれが、前記記憶されたメタデータと整合性があるかどうかを決定するステップを備えたことを特徴とする請求項17に記載の方法。
  19. 前記使用データに記述された前記外部データファイルからの少なくとも1つのカラムの前記各々使用が、前記記憶されたメタデータと整合性がない場合は、前記非整合性を解消するステップをさらに備えたことを特徴とする請求項18に記載の方法。
  20. オペレーティングシステム、複数のコンピュータ実行可能命令が格納されたコンピュータ可読媒体、コプロセッシングデバイス、コンピューティングデバイス、および、請求項1に記載の方法を行うコンピュータ実行可能命令を搬送する変調データ信号の少なくとも1つを備えたことを特徴とするシステム。
  21. 前記データフローモデルは、データフローに関する情報を含み、前記情報は、少なくとも1つの外部データファイルの各々に対し、前記外部データファイルからの少なくとも1つのカラムの使用を記述する使用データを含むデータフローモデルを評価する方法であって、
    前記少なくとも1つの外部データファイルの各々の少なくとも1つのカラムについて記述するデータを含むメタデータを取り出すステップと、
    前記メタデータを使用して、前記データフローモデルと前記メタデータとの整合性があるかどうかを決定するステップと
    を備えたことを特徴とする方法。
  22. 前記記憶されたメタデータを使用して、前記データフローモデルと前記メタデータとの整合性があるかどうかを決定するステップは、
    前記記憶されたメタデータが前記メタデータに整合性があるかどうかを示す妥当性検査状態を提供するステップを備えたことを特徴とする請求項21に記載の方法。
  23. 前記記憶されたメタデータを使用して、前記データフローモデルと前記メタデータとの整合性があるかどうかを決定するステップは、
    前記記憶されたメタデータが前記外部データファイルの前記現在の状態と整合性がない場合は、前記非整合性を解消するステップを備えたことを特徴とする請求項21に記載の方法。
  24. 前記非整合性を解消するステップは、前記非整合性を解消するように前記ユーザに問い合わせるステップを備えたことを特徴とする請求項23に記載の方法。
  25. 前記非整合性を解消するステップは、前記データフローのインタフェースを使用して前記非整合性を解消するステップを備えたことを特徴とする請求項23に記載の方法。
  26. 各前記外部データファイルの各々に記憶された前記現在のデータを反映するデータを含むように、前記記憶されたメタデータを再同期するステップをさらに備えたことを特徴とする請求項21に記載の方法。
  27. 各前記外部データファイルの各々は情報のカラムを含み、少なくとも1つの外部データファイルを使用するデータフローに関するデータフロー情報を作成するデータフローモデルのシステムであって、
    前記少なくとも1つの外部データファイルの各々に対し、前記外部データファイルからの少なくとも1つまたは複数のカラムの使用を記述する使用データを含むデータフローモデルを記憶するデータフローモデルの記憶機能と、
    前記少なくとも1つの外部データファイルの各々の少なくとも1つのカラムを記述するデータを含むメタデータを記憶するメタデータの記憶機能と、
    前記記憶されたメタデータを使用して、前記データフローモデルと前記外部データファイルとの整合性があるかどうかを決定する整合性の検査機能と
    を備えたことを特徴とするシステム。
  28. 前記少なくとも1つのカラムについて記述するデータは、前記少なくとも1つのカラムに関連する型のデータを備えたことを特徴とする請求項27に記載のデータフローモデルのシステム。
  29. 前記整合性の検査機能は、各外部データファイルに対し、前記記憶されたメタデータが前記外部データファイルの現在の状態と整合性があることを確認することを特徴とする請求項27に記載のデータフローモデルのシステム。
  30. 前記整合性の検査機能は、
    前記記憶されたメタデータが前記外部データファイルの前記現在の状態と整合性があるかどうかを示す妥当性検査状態を提供する妥当性検査状態の決定機能を備えたことを特徴とする請求項29に記載のデータフローモデルのシステム。
  31. 各前記外部データファイルの各々に記憶された前記現在のデータを反映するデータを含むよう前記記憶されたメタデータを変更するメタデータの再同期機能をさらに備えたことを特徴とする請求項27に記載のデータフローモデルのシステム。
  32. 前記整合性の検査機能は、
    前記記憶されたメタデータが前記データフローと整合性があることを確認する整合性の確認機能を備えたことを特徴とする請求項27に記載のデータフローモデルのシステム。
  33. 前記整合性の確認機能は、前記使用データに記述された前記外部データファイルからの少なくとも1つのカラムの前記各々の使用が、前記記憶されたメタデータと整合性があるかどうかを決定することを特徴とする請求項32に記載のデータフローモデルのシステム。
  34. 前記使用データに記述された前記外部データファイルからの少なくとも1つのカラムの前記各々の使用が、前記記憶されたメタデータと整合性がない場合は、前記非整合性を解消する解消機能をさらに備えたことを特徴とする請求項32に記載のデータフローモデルのシステム。
  35. 前記データフローモデルはがデータフローに関する情報を含み、前記情報が、少なくとも1つの外部データファイルの各々に対し、前記外部データファイルからの少なくとも1つのカラムの使用を記述する使用データを含み、データフローモデルを評価するデータフローモデルのシステムであって、
    前記少なくとも1つの外部データファイルの各々の少なくとも1つのカラムを記述するデータを含むメタデータを記憶するメタデータの記憶機能と、
    前記メタデータを使用して、前記データフローモデルと前記外部データファイルとの整合性があるかどうかを決定する整合性の検査機能と
    を備えたことを特徴とするシステム。
  36. 前記整合性の検査機能は、前記記憶されたメタデータが前記メタデータと整合性があるかどうかを示す妥当性検査状態の指示機能を備えたことを特徴とする請求項35に記載のデータフローモデルのシステム。
  37. 前記記憶されたメタデータが前記外部データファイルの前記現在の状態と整合性がない場合は、前記非整合性を解消する非整合性の解消機能をさらに備えたことを特徴とする請求項34に記載のデータフローモデルのシステム。
  38. 各前記外部データファイルの各々に記憶された前記現在のデータを反映するデータを含むように、前記記憶されたメタデータを再同期する再同期機能をさらに備えたことを特徴とする請求項35に記載のデータフローモデルのシステム。
JP2005175734A 2004-07-15 2005-06-15 外部メタデータの処理 Expired - Fee Related JP4758150B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/891,609 US7386566B2 (en) 2004-07-15 2004-07-15 External metadata processing
US10/891,609 2004-07-15

Publications (2)

Publication Number Publication Date
JP2006031687A true JP2006031687A (ja) 2006-02-02
JP4758150B2 JP4758150B2 (ja) 2011-08-24

Family

ID=35600695

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005175734A Expired - Fee Related JP4758150B2 (ja) 2004-07-15 2005-06-15 外部メタデータの処理

Country Status (5)

Country Link
US (1) US7386566B2 (ja)
EP (1) EP1650675A3 (ja)
JP (1) JP4758150B2 (ja)
KR (1) KR101149994B1 (ja)
CN (1) CN100541489C (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007264768A (ja) * 2006-03-27 2007-10-11 Fujitsu Ltd システム開発支援プログラム、システム開発支援装置およびシステム開発支援方法
US8667022B2 (en) 2011-07-29 2014-03-04 Fujitsu Limited Adjustment apparatus, adjustment method, and recording medium of adjustment program
JP2016529574A (ja) * 2013-05-17 2016-09-23 オラクル・インターナショナル・コーポレイション フローベースのetlおよびエンティティリレーションシップベースのetlの組合せのサポート
JP2017509954A (ja) * 2014-01-21 2017-04-06 ポキットドク インコーポレイテッド 動的文書マッチング及びマージング

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7971204B2 (en) * 2004-03-13 2011-06-28 Adaptive Computing Enterprises, Inc. System and method of co-allocating a reservation spanning different compute resources types
US10510043B2 (en) * 2005-06-13 2019-12-17 Skyword Inc. Computer method and apparatus for targeting advertising
US8346789B2 (en) 2005-10-03 2013-01-01 Intel Corporation System and method for generating homogeneous metadata from pre-existing metadata
US20070294246A1 (en) * 2006-06-16 2007-12-20 Microsoft Corporation Associating metadata on a per-user basis
CN100440144C (zh) * 2007-01-26 2008-12-03 华为技术有限公司 实现系统新旧版本兼容的方法及装置
EP2183669B1 (en) 2007-08-27 2014-05-28 Correlsense Ltd. Apparatus and method for tracking transaction related data
US9659073B2 (en) * 2008-06-18 2017-05-23 Oracle International Corporation Techniques to extract and flatten hierarchies
US8380657B2 (en) * 2008-09-19 2013-02-19 Oracle International Corporation Techniques for performing ETL over a WAN
US20110314070A1 (en) * 2010-06-18 2011-12-22 Microsoft Corporation Optimization of storage and transmission of data
US9824091B2 (en) 2010-12-03 2017-11-21 Microsoft Technology Licensing, Llc File system backup using change journal
US8620894B2 (en) 2010-12-21 2013-12-31 Microsoft Corporation Searching files
US9229818B2 (en) 2011-07-20 2016-01-05 Microsoft Technology Licensing, Llc Adaptive retention for backup data
US10198420B2 (en) 2013-06-15 2019-02-05 Microsoft Technology Licensing, Llc Telling interactive, self-directed stories with spreadsheets
CN104104731B (zh) * 2014-07-28 2018-02-02 浪潮(北京)电子信息产业有限公司 一种维护数据一致性的方法及装置
US11086521B2 (en) * 2015-01-20 2021-08-10 Ultrata, Llc Object memory data flow instruction execution
WO2016118630A1 (en) 2015-01-20 2016-07-28 Ultrata Llc Utilization of a distributed index to provide object memory fabric coherency
US10007682B2 (en) 2015-03-30 2018-06-26 International Business Machines Corporation Dynamically maintaining data structures driven by heterogeneous clients in a distributed data collection system
US9886210B2 (en) 2015-06-09 2018-02-06 Ultrata, Llc Infinite memory fabric hardware implementation with router
US10698628B2 (en) 2015-06-09 2020-06-30 Ultrata, Llc Infinite memory fabric hardware implementation with memory
DE102015218800A1 (de) 2015-09-29 2017-03-30 Continental Automotive Gmbh Kommunikationssystem zur V2X-Kommunikation
US10391275B2 (en) * 2015-11-17 2019-08-27 Potrero Medical, Inc. Systems, devices and methods for draining and analyzing bodily fluids
WO2017100281A1 (en) 2015-12-08 2017-06-15 Ultrata, Llc Memory fabric software implementation
WO2017100292A1 (en) 2015-12-08 2017-06-15 Ultrata, Llc. Object memory interfaces across shared links

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5640550A (en) * 1994-04-15 1997-06-17 Coker; Drake Computer system for generating SQL statements from COBOL code

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5560005A (en) 1994-02-25 1996-09-24 Actamed Corp. Methods and systems for object-based relational distributed databases
US6009428A (en) 1997-09-15 1999-12-28 International Business Machines Corporation System and method for providing a single application program interface for heterogeneous databases
JP2000276387A (ja) 1999-03-23 2000-10-06 Toshiba Corp メタデータ登録方法および装置、データサーバ装置、並びにメタデータ登録用プログラムを記憶した記憶媒体
US6748388B1 (en) 2001-08-24 2004-06-08 Oracle International Corporation Method and mechanism for storing and managing self-descriptive heterogeneous data
US6874001B2 (en) * 2001-10-05 2005-03-29 International Business Machines Corporation Method of maintaining data consistency in a loose transaction model
US7007103B2 (en) * 2002-04-30 2006-02-28 Microsoft Corporation Method to offload a network stack
US7181531B2 (en) * 2002-04-30 2007-02-20 Microsoft Corporation Method to synchronize and upload an offloaded network stack connection with a network stack
US7587667B2 (en) * 2003-09-04 2009-09-08 Oracle International Corporation Techniques for streaming validation-based XML processing directions
EP1676217B1 (en) * 2003-09-15 2011-07-06 Ab Initio Technology LLC Data profiling

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5640550A (en) * 1994-04-15 1997-06-17 Coker; Drake Computer system for generating SQL statements from COBOL code

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007264768A (ja) * 2006-03-27 2007-10-11 Fujitsu Ltd システム開発支援プログラム、システム開発支援装置およびシステム開発支援方法
US8667022B2 (en) 2011-07-29 2014-03-04 Fujitsu Limited Adjustment apparatus, adjustment method, and recording medium of adjustment program
JP2016529574A (ja) * 2013-05-17 2016-09-23 オラクル・インターナショナル・コーポレイション フローベースのetlおよびエンティティリレーションシップベースのetlの組合せのサポート
US10216814B2 (en) 2013-05-17 2019-02-26 Oracle International Corporation Supporting combination of flow based ETL and entity relationship based ETL
JP2017509954A (ja) * 2014-01-21 2017-04-06 ポキットドク インコーポレイテッド 動的文書マッチング及びマージング

Also Published As

Publication number Publication date
KR101149994B1 (ko) 2012-06-01
US20060015521A1 (en) 2006-01-19
EP1650675A2 (en) 2006-04-26
US7386566B2 (en) 2008-06-10
JP4758150B2 (ja) 2011-08-24
CN100541489C (zh) 2009-09-16
CN1722137A (zh) 2006-01-18
KR20060047941A (ko) 2006-05-18
EP1650675A3 (en) 2006-10-25

Similar Documents

Publication Publication Date Title
JP4758150B2 (ja) 外部メタデータの処理
JP4726545B2 (ja) データソースを発見して接続するための方法、システムおよび装置
JP4879580B2 (ja) ユーザ・インタフェースに自動探索メニューを与えるシステムおよび方法
TWI582616B (zh) 藉由實例格式化資料
AU2009238294B2 (en) Data transformation based on a technical design document
US7765505B2 (en) Design rule management method, design rule management program, rule management apparatus and rule verification apparatus
Chard et al. I'll take that to go: Big data bags and minimal identifiers for exchange of large, complex datasets
JP2005301329A (ja) データベースのためのトランザクション整合性のある変更追跡
US10296542B2 (en) Integration database framework
US7720814B2 (en) Repopulating a database with document content
US8001552B1 (en) Model merger using an export map
CN112307124A (zh) 数据库同步验证方法、装置、设备及存储介质
US20100169760A1 (en) Apparatus for displaying instance data, method, and computer program product
JP2017049639A (ja) 評価プログラム、手順書評価方法、および評価装置
JP2021140430A (ja) データベースマイグレーション方法、データベースマイグレーションシステム、及びデータベースマイグレーションプログラム
US7856344B2 (en) Method for transforming overlapping paths in a logical model to their physical equivalent based on transformation rules and limited traceability
WO2016105579A1 (en) Systems and methods for processing sequence data for variant detection and analysis
KR101828466B1 (ko) 파일시스템을 기반으로 하는 저장장치에서 객체기반 스토리지 인터페이스를 제공하는 방법 및 장치
JP7331384B2 (ja) 情報処理装置及びプログラム
JP2009015511A (ja) メタデータ管理装置、プログラムおよびメタデータ管理方法
JP2009151742A (ja) ユースケースシナリオ作成支援システム、ユースケースシナリオ作成支援方法、およびユースケースシナリオ作成支援プログラム
JP6853474B2 (ja) 情報処理装置、制御方法、及びプログラム
Villiers Clinical data warehouse functionality
JP5696280B1 (ja) 用語統一システム及び用語統一プログラム、並びに用語統一方法
JP2003085013A (ja) Pdmシステム、システム接続用プログラム作成方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080606

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110317

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110527

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110602

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140610

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees