JP2006107466A - 電子文書で使用するために複数のデータソースのデータをマージする方法、システム、およびコンピュータ読み取り可能媒体 - Google Patents

電子文書で使用するために複数のデータソースのデータをマージする方法、システム、およびコンピュータ読み取り可能媒体 Download PDF

Info

Publication number
JP2006107466A
JP2006107466A JP2005253870A JP2005253870A JP2006107466A JP 2006107466 A JP2006107466 A JP 2006107466A JP 2005253870 A JP2005253870 A JP 2005253870A JP 2005253870 A JP2005253870 A JP 2005253870A JP 2006107466 A JP2006107466 A JP 2006107466A
Authority
JP
Japan
Prior art keywords
data source
field
data
list
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005253870A
Other languages
English (en)
Other versions
JP4906292B2 (ja
Inventor
Sumi N Singh
エヌ.シン スミ
Juraj Gottweis
ゴットワイス ジュラジ
John E Dimmick Jr
イー.ディミック ジュニア ジョン
Tara M Kraft
エム.クラフト タラ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2006107466A publication Critical patent/JP2006107466A/ja
Application granted granted Critical
Publication of JP4906292B2 publication Critical patent/JP4906292B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Economics (AREA)
  • Computer Hardware Design (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】 電子文書で使用するために複数のデータソースのデータをマージする方法、システム、およびコンピュータ読み取り可能媒体を提供すること。
【解決手段】 この方法は、初期データソースのフィールド名およびフィールドデータを受け取ること、その後で追加されたデータソースから初期データソースにフィールド名をマッピングすること、初期データソースのフィールド名と、その後で追加されたデータソースのマッピング後フィールド名とに基づいて受取リストスキーマを構築すること、受取リストスキーマに従って受取リストを作成すること、および受取リストをファイルに保存することを含む。受取リストスキーマは、受取リスト中のフィールド名と、初期データソースおよびその後で追加されたデータソース中のフィールド名との間の関係を定義する。【選択図】 図2

Description

本発明は、ソフトウェアアプリケーションの分野、より詳細には、電子文書で使用するための複数のデータソースのデータのマージに関する。
最新のデスクトップパブリッシングアプリケーションは、ユーザが容易に電子文書を作成することを可能にする。電子文書を作成するための多くのデスクトップパブリッシングアプリケーションで使用可能な一機能は、メールマージと呼ばれる。メールマージは、ユーザが単一のデータソースに接続し、そこからのデータをマージすることを可能にすることにより、様々なデータ文書を作成するプロセスを自動化する。メールマージ機能を使用する際、データは単一のデータソース(メーリングリストなど)から引き出され、文書の内のマークされた位置に挿入される。
最新のデスクトップパブリッシングアプリケーションによって提供されるメールマージ機能に関連する一つの欠点は、ユーザがしばしば異なるフォーマットで、コンピュータシステム内の複数の場所にデータ(メーリングリストなど)を格納することである。例えば、ユーザは、ある連絡先のリストを、連絡先マネージャプログラムで読取り可能な連絡先ファイルとして格納することがあり、別の連絡先のリストを、スプレッドシートプログラムで読取り可能なスプレッドシートファイルとして格納することがある。したがって、ユーザはしばしば、デスクトップパブリッシングアプリケーションによって提供されるメールマージ機能を利用するために、複数のデータソースからの異なるフォーマットのデータを単一のデータソースとして集める必要がある。
こうした考慮すべき点やその他の点に関して、本発明の様々な実施形態が作成された。
本発明によれば、上記およびその他の問題は、電子文書で使用するために複数のデータソースのデータをマージする方法、システム、およびコンピュータ読み取り可能媒体によって解決される。本発明の一態様によれば、この方法は、初期データソースからフィールド名およびフィールドデータを受け取ること、その後で追加されたデータソースのフィールド名を初期データソースにマッピングすること、ならびに初期データソースのフィールド名、およびその後で追加されたデータソースのマッピング後フィールド名に基づいて受取リストスキーマを構築することを含む。受取リストスキーマは、受取リスト内のフィールド名と、初期データソースおよびその後で追加されたデータソース内のフィールド名との関係を定義する。受取リストの構築は、初期データソースのフィールド名に対して、その後で追加されたデータソースのマッピング後フィールド名を比較することを含み、後で追加されたデータソースのマッピング後フィールド名のいずれも初期データソースのフィールド名に対応しない場合、この方法は、マッピング後フィールド名を追加することを含む。
この方法はさらに、受取リストスキーマに従って受取リストを作成すること、および受取リストを再作成することを可能にするファイルを保存することを含む。受取リストスキーマによる受取リストの作成は、マスタデータソースを作成するためにその後で追加されたデータソースからのフィールドデータの行を一時受取リストに追加すること、およびマスタデータソース中のフィールドデータの各行についてハッシュ値を計算することを含む。保存した更新後受取リストファイルは、初期データソースに対する参照、その後で追加されたデータソースに対する参照、およびマスタデータソース中のフィールドデータの各行について計算したハッシュ値を含む。この方法はさらに、初期データソース中のフィールドデータ、およびその後で追加されたデータソース中のフィールドデータを修正するために受取リストを修正すること、および受取リスト内の初期データソースとその後で追加されたデータソースとの間の重複を解決することを含む。
本発明は、コンピュータプロセス、コンピューティングシステム、またはコンピュータプログラム製品やコンピュータ読み取り可能媒体などの製品として実装することができる。コンピュータプログラム製品は、コンピュータシステムで読み取り可能であり、コンピュータプロセスを実行する命令のコンピュータプログラムを符号化するコンピュータ記憶媒体でよい。コンピュータプログラム製品はまた、コンピューティングシステムで読み取り可能であり、コンピュータプロセスを実行する命令のコンピュータプログラムを符号化する搬送波上で伝播される信号でもよい。
本発明を特徴付ける上記およびその他の様々な機能ならびに利点は、以下の詳細な説明を読み、関連する図面を検討することによって明らかとなるであろう。
次に図面を参照して、本発明の様々な態様を説明する。各図面では、同様の番号が同様の要素を表す。具体的には、図1およびそれに対応する議論は、本発明の実施形態を実施することのできる適切なコンピューティング環境の簡潔で一般的な説明を与えるためのものである。パーソナルコンピュータのオペレーティングシステム上で動作するプログラムモジュールと共に実行されるプログラムモジュールの一般的文脈で本発明を説明するが、他のタイプのコンピュータシステムおよびプログラムモジュールと組み合わせて本発明を実施することもできることを当業者は理解されよう。
一般に、プログラムモジュールは、特定のタスクを実行し、または特定の抽象データ型を実装する、ルーチン、プログラム、コンポーネント、データ構造、およびその他のタイプの構造を含む。さらに本発明は、ハンドヘルド装置、マルチプロセッサシステム、マイクロプロセッサベースの、またはプログラム可能な消費者向け電子機器、ミニコンピュータ、メインフレームコンピュータなどを含むその他のコンピュータシステム構成で実施できることを当業者は理解されよう。本発明は、通信ネットワークを介してリンクされたリモート処理装置によってタスクが実施される分散コンピューティング環境でも実施することができる。分散コンピューティング環境では、プログラムモジュールがローカルメモリ記憶装置とリモートメモリ記憶装置のどちらにも位置することができる。
次に図1を参照して、本発明の様々な実施形態で使用するコンピュータ2用の例示的コンピュータアーキテクチャを説明する。図1に示すコンピュータアーキテクチャは、中央演算処理装置5(「CPU」)と、ランダムアクセスメモリ9(「RAM」)および読取り専用メモリ(「ROM」)11を含むシステムメモリ7と、メモリをCPU5に結合するシステムバス12とを含む従来型デスクトップコンピュータまたはラップトップコンピュータを示す。起動時などにコンピュータ内の要素間で情報を転送する助けになる基本ルーチンを含む基本入出力システムが、ROM11に格納される。コンピュータ2はさらに、以下でより詳細に説明するオペレーティングシステム16、アプリケーションプログラム、およびその他のプログラムモジュールを格納する大容量記憶装置14を含む。
大容量記憶装置14は、バス12に接続された大容量記憶コントローラ(図示せず)を介してCPU5に接続される。大容量記憶装置14およびその関連するコンピュータ読み取り可能媒体は、コンピュータ2における不揮発性記憶領域を提供する。本明細書に含まれるコンピュータ読み取り可能媒体の説明は、ハードディスクやCD−ROMドライブなどの大容量記憶装置を指すが、コンピュータ読み取り可能媒体はコンピュータ2によってアクセスすることのできる入手可能などんな媒体でもよいことを理解されたい。
例えば、それだけに限らないが、コンピュータ読み取り可能媒体は、コンピュータ記憶媒体および通信媒体を含む。コンピュータ記憶媒体は、コンピュータ読み取り可能命令、データ構造、プログラムモジュール、またはその他のデータなどの情報を記憶するために何らかの方法または技術で実装された、揮発性および不揮発性の、取外し可能および取外し不能な媒体を含む。コンピュータ記憶媒体には、それだけに限らないが、RAM、ROM、EPROM、EEPROM、フラッシュメモリ、またはその他の固体メモリ技術、CD−ROM、デジタル多用途ディスク(「DVD」)、またはその他の光記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置、またはその他の磁気記憶装置、あるいは、所望の情報を格納するために使用することができ、コンピュータ2によってアクセスすることができる他のどんな媒体も含まれる。
本発明の様々な実施形態によれば、コンピュータ2は、インターネットなどのネットワーク18を介したリモートコンピュータに対する論理接続を使用するネットワーク環境で動作することができる。コンピュータ2は、バス12に接続されたネットワークインターフェースユニット20を介してネットワーク18に接続する。ネットワークインターフェースユニット20は、他のタイプのネットワークおよびリモートコンピュータシステムに接続するために利用することもできることを理解されたい。コンピュータ2はまた、キーボード、マウス、または電子スタイラス(図1には図示せず)を含むいくつかの他の装置から入力を受け取って処理する入出力コントローラ22も含む。同様に、入出力コントローラ22は、ディスプレイ画面、プリンタ、その他のタイプの出力装置に出力を提供する。
上記で簡潔に述べたように、いくつかのプログラムモジュールおよびデータファイルは、コンピュータ2の大容量記憶装置14およびRAM9に記憶される。それらのプログラムモジュールおよびデータファイルは、ワシントン州レドモンドのMICROSOFT CORPORATIONによるWINDOWS(登録商標) XPオペレーティングシステムなどの、ネットワークパーソナルコンピュータの動作を制御するのに適したオペレーティングシステム16を含む。大容量記憶装置14およびRAM9は、1つまたは複数のプログラムモジュールも格納する。具体的には、大容量記憶装置14およびRAM9は、デスクトップパブリッシングアプリケーション10を格納する。当業者には周知のように、デスクトップパブリッシングアプリケーション10は、電子文書を作成および編集する機能を提供するために動作する。本発明の一実施形態によれば、デスクトップパブリッシングアプリケーション10は、MICROSOFT CORPORATIONによるPUBLISHERというワードプロセッシングアプリケーションプログラムを含む。しかし、本発明の様々な態様を具体化するために、他の製造業者によるデスクトップパブリッシングアプリケーションも使用できることを理解されたい。本発明の様々な態様はデスクトップパブリッシングアプリケーションに限定されず、MICROSOFT CORPORATIONによるWORDプログラムならびにスプレッドシートプログラムおよびデータベースプログラムなどの、テキストを処理することができるその他のプログラムも使用できることをさらに理解されたい。
受取リストの作成に関連して、デスクトップパブリッシングアプリケーション10は、ユーザがデータソース26(データソース1)、28(データソース2)、および30(データソースN)を電子文書の様々な位置にマージすることを可能にする機能を提供する。各データソース26、28、および30は、1つまたは複数のフィールドに分割されたデータのリストまたはテーブルであることが理解されよう。例えば、データソースは、名前、会社、および住所をデータフィールド「Last Name」、「First Name」、「Title」、「Company Name」、および「Address」内に含む連絡先情報を格納することができる。複数のデータソースをマージする際に、デスクトップパブリッシングアプリケーション10は、マージされたデータを格納する受取リストファイル24を作成することを理解されたい。受取リストファイル24を作成するためにデータソース26(Data Source 1)、28(Data Source 2)、および30(Data Source N)をマージするデスクトップパブリッシングアプリケーション10によって使用される例示的方法を、図2に関して以下でより詳細に説明する。
ここで図2を参照して、複数のデータソースのデータをマージするためにデスクトップパブリッシングアプリケーション10によって実施されるプロセスを示す例示的ルーチン200を説明する。本明細書で説明する本発明の実施形態をデスクトップパブリッシングアプリケーション10の状況で提示するが、本発明は、ワードプロセッシング、スプレッドシート、データベースプログラムなどのテキスト処理をサポートする他のタイプのアプリケーションプログラムでも使用できることを理解されたい。
本明細書で提示されるルーチンの説明を読む際に、本発明の様々な実施形態の論理演算が、(1)コンピューティングシステム上で動作する、一連のコンピュータで実施される動作またはプログラムモジュールとして、および/または(2)コンピューティングシステム内の相互接続された機械論理回路または回路モジュールとして実装されることを理解されたい。実装は、本発明を実装するコンピューティングシステムの性能要件に依存して選択される。したがって、図2に示し、本明細書で説明する本発明の実施形態を構成する論理演算は、オペレーション、構造装置、動作、またはモジュールと様々な形で呼ばれる。本明細書に記載の特許請求の範囲内で列挙される本発明の精神および範囲から逸脱することなく、こうしたオペレーション、構造装置、動作、およびモジュールはソフトウェア、ファームウェア、特殊目的デジタル論理、およびそれらの任意の組合せとして実装できることを当業者は理解されよう。
ここで図2を参照すると、ルーチン200はオペレーション210で始まり、デスクトップパブリッシングアプリケーション10がデータソース26(Data Source 1)、28(Data Source 2)、および30(Data Source N)を受け取り、各データソース中のフィールドを「マッピング」する。具体的には、各データソース中のフィールドをマッピングする際に、デスクトップパブリッシングアプリケーション10は、最初のデータソースを初期データソースとして取り出し、取り出した後続の各データソースのフィールドを初期データソースのフィールドと関連付け、初期データソース中に出現しない後続のデータソース中のフィールドを追加する。例えば、データソース26(Data Source 1)は、データフィールド「First Name」および「Last Name」を含み、一方、データソース28(Data Source 2)は、「First Name」、「Last Name」、および「Title」を含む。データフィールドをマッピングする際に、ワードプロセッシングアプリケーションプログラムは、データソース26を初期データソースとして指定し、各データソースによって共有される共通フィールド(すなわち、「First name」および「Last Name」)をマッピングし、データソース28の固有のフィールド「Title」を追加する。本発明の様々な実施形態では、デスクトップパブリッシングアプリケーション10のユーザは、初期データソースにマッピングまたは追加すべき後続のデータソースのフィールドを指定する。さらに、マッピング済みフィールドをマッピング解除することもできることを理解されよう。
ルーチン200は、オペレーション210からオペレーション220に進み、デスクトップパブリッシングアプリケーション10は、データソース26、28、および30のマッピング済みフィールドから、受取リスト(すなわちマスタデータソース)スキーマを構築する。本明細書では、「スキーマ」は、各入力データソースからマッピングされたフィールド名を定義する。例えば、データソース26およびデータソース28についての受取リストスキーマは、(データソース26および28の)フィールド「First Name」および「Last Name」、ならびに(データソース28のみの)フィールド「Title」を含む。
ルーチン200は、オペレーション220からオペレーション230に進み、デスクトップパブリッシングアプリケーション10は、受取リストスキーマから一時受取リストを作成する。具体的には、デスクトップパブリッシングアプリケーション10は、各入力データソースのフィールドに関連するデータを受け取るために、受取リストスキーマからフィールドのテーブルを作成する。ルーチン200は、オペレーション230からオペレーション240に進み、デスクトップパブリッシングアプリケーション10は、受取リストを作成するために各入力データソースからデータの1つまたは複数の行を取り出す。具体的には、デスクトップパブリッシングアプリケーション10は、各データソースからデータを取り出し、受取リストスキーマに従って一時受取リストを埋める。
ルーチン200は、オペレーション240からオペレーション250に進み、デスクトップパブリッシングアプリケーション10は、受取リスト中の各行についてハッシュを作成する。当業者には周知の通り、ハッシュは、テキスト文字列から生成される数値である。それは、データメソッドにアクセスするために使用される。ハッシュ(またはハッシュ値)は、他の何らかのテキストが同一のハッシュ値を生成する可能性が極めて低くなるような式で生成される。ハッシュ値を生成する様々な方法は当業者に周知であり、したがって、本明細書ではさらに詳細には論じない。入力データソース中のデータに対するリンクとして働くハッシュを使用して、受取リスト中のマージデータを区別することができることを理解されよう。
ルーチン200は、オペレーション250からオペレーション260に進み、デスクトップパブリッシングアプリケーション10は、受取リストをファイル(受取リストファイル24など)に保存する。受取リストを保存する際、受取リストを再作成することを可能にするファイルが作成されることを理解されよう。さらに受取リストファイル24は、初期データソースに対する参照、後続のまたは追加された各データソースに対する参照、および受取リスト中のフィールドデータの各行について計算されたハッシュ値を含む。ルーチン200は、オペレーション260からオペレーション270に進み、デスクトップパブリッシングアプリケーション10は、ユーザからの入力に応答して、受取リストを修正する。具体的には、ユーザは、データを変更または削除することによって受取リスト中のデータを更新することができる。受取リスト中の修正により、供給側データソース中のデータも修正されることを理解されよう。例えば、データソース26から取り出された受取リスト中のラストネームデータをユーザが修正する結果として、データソース26中の同一のラストネームデータが修正される。受取リスト中のデータを修正する際に、デスクトップパブリッシングアプリケーション10は、影響を受けるデータソース中の対応するデータの位置を突き止めて更新するために、受取リスト中のデータの修正された各行について計算されたハッシュ値を参照することを理解されよう。
ルーチン200は、オペレーション270からオペレーション280に進み、デスクトップパブリッシングアプリケーション10は、受取リスト中の重複データを解決する。具体的には、データソース26、28、および30は、受取リスト中の重複エントリとして現れる可能性のある同一のデータを含むことがあることを理解されよう。例えば、ユーザは、2つの異なるデータソース中にある同一人物についての名前および住所の情報を有する可能性がある。
一実施形態では、デスクトップパブリッシングアプリケーション10は、受取リストからハッシュ値のハッシュテーブルを作成し、2つのハッシュ値が指すデータエントリを比較することによって、重複データエントリを突き止めるように構成されることを理解されよう。本発明の様々な例示的実施形態では、あらゆる行をあらゆる他の行と比較することによって重複を見つける。各行について計算されたハッシュ値はメモリに記憶される。あらゆる行中のあらゆる列について、1つのハッシュ値が記憶されることを理解されたい。次いでハッシュ値が比較される。2つのデータエントリが合致するとき、そのハッシュ値も合致する。2つの行が所定の重複規則(例えば2つの行中のデータの75%が合致しなければならない)を満足するとき、それらはマスタデータソースからロードされ、実際のデータエントリがユーザによって比較され、それらが実際に互いに重複するかどうかが判定される。その後ルーチン200は終了する。
次に図3を参照して、ユーザがデータソースを受取リストスキーマにマッピングすることを可能にする例示的ユーザインターフェースを説明する。図3に、データソースのフィールドをマッピングするいくつかのユーザインターフェースコンポーネントを含むユーザインターフェースウィンドウ300を示す。具体的には、ウィンドウ40はデータソースのフィールドを表示し、それをウィンドウ40からドラッグして、フィールド42またはフィールド44にドロップすることによって、受取リストスキーマにマッピングする。ウィンドウ44に追加されるフィールドは、受取リストスキーマ中の新しい列として追加される。マッピングは、ウィンドウ42または44のフィールドをウィンドウ40にドラッグすることによってやり直すことができる。データソースのフィールドのデフォルトマッピングを選択するためのデフォルトマップボタン46が提供される。デフォルトマッピングは、デスクトップパブリッシングアプリケーション10によって自動的に決定される。
次に図4を参照して、2つのデータソースから作成された受取リストを表示する例示的ユーザインターフェースを説明する。図4は、受取リスト、ならびにマッピングされたフィールドの行、および関連するデータを表示するユーザインターフェースウィンドウ400を示す。ウィンドウ52は、受取リストを作成するために使用されたデータソースを特定する。ファイル、データベース、または連絡先リストから受取リストにデータソースを追加するためのリンク54および56が提供される。新しいリストをタイプすることによってデータソースを作成するためのリンク58が提供される。
次に図5を参照して、ユーザがデータソースを編集することを可能にする例示的ユーザインターフェースを説明する。図5は、データソーステーブル60およびフィールドデータの行を表示するユーザインターフェースウィンドウ500を示す。新規エントリをデータソーステーブル60に追加する新規エントリ追加ボタン62、および、データソーステーブル60中に表示されるエントリを削除するエントリ削除ボタン64が提供される。ユーザインターフェースウィンドウ500は、別の場所に格納された元のデータソースにリンクする受取リストのマッピングされたデータまたはコピーされたデータを含み、それによって変更が元のデータソースに反映されることが理解されよう。
次に図6を参照して、図2に関連して上記で論じたデスクトップパブリッシングアプリケーション10によって、ユーザが、受取リスト中に見つかった重複を除去することを可能にする例示的ユーザインターフェースを説明する。図6は、重複データエントリを列挙するデータソーステーブル70を表示するユーザインターフェース600を示す。ユーザが受取リストから除去すべきエントリを選択することを可能にするチェックボックス72の列が提供される。
上記に基づいて、本発明の様々な実施形態は、電子文書で使用するために複数のデータソースのデータをマージする方法、システム、およびコンピュータ読み取り可能媒体を含むことを理解されたい。上記の仕様、例、およびデータは、本発明の構成の製造および使用について十分な説明を与える。本発明の精神および範囲から逸脱することなく、本発明の多数の実施形態を作成できるので、本発明は、添付の特許請求の範囲に属する。
本発明の様々な実施形態で使用され、提供されるコンピュータシステムを示すコンピュータシステムアーキテクチャ図である。 本発明の例示的実施形態による、複数のデータソースからのデータをマージするために図1のコンピュータシステム内のデスクトップパブリッシングアプリケーションで実施される例示的ルーチンである。 本発明の様々な実施形態による、ユーザが複数のデータソースからのデータをマージして、マージ後データを管理する機能を提供する本発明の一態様を示す画面図である。 本発明の様々な実施形態による、ユーザが複数のデータソースからのデータをマージして、マージ後データを管理する機能を提供する本発明の一態様を示す画面図である。 本発明の様々な実施形態による、ユーザが複数のデータソースからのデータをマージして、マージ後データを管理する機能を提供する本発明の一態様を示す画面図である。 本発明の様々な実施形態による、ユーザが複数のデータソースからのデータをマージして、マージ後データを管理する機能を提供する本発明の一態様を示す画面図である。

Claims (19)

  1. 電子文書で使用するために複数のデータソースのデータをマージする方法であって、
    初期データソースのフィールド名およびフィールドデータを受け取ること、
    その後で追加された少なくとも1つのデータソースから前記初期データソースにフィールド名をマッピングすること、
    前記初期データソースの前記フィールド名と、前記その後で追加された少なくとも1つのデータソースのマッピング後フィールド名とに基づいて受取リストスキーマを構築すること、
    前記受取リストスキーマに従って受取リストを作成すること、および、
    前記受取リストをファイルに保存することであって、前記受取リストをファイルに保存することは、前記受取リストを再作成することを可能にするファイルを保存することを含むこと
    を備えることを特徴とする方法。
  2. 前記その後で追加されたデータソースのフィールドデータと、前記初期データソースの前記フィールドデータとを受け取るために一時受取リストを生成することをさらに備えることを特徴とする請求項1に記載の方法。
  3. 前記初期データソースの前記フィールド名と、前記その後で追加された少なくとも1つのデータソースのマッピング後フィールド名とに基づいて受取リストスキーマを構築することは、
    前記その後で追加された少なくとも1つのデータソースの前記マッピング後フィールド名を、前記初期データソースの前記フィールド名と比較すること、および、
    前記その後で追加された少なくとも1つのデータソースの前記マッピング後フィールド名のいずれも前記初期データソースの前記フィールド名に対応しない場合、前記マッピング後フィールド名を追加すること
    を備えることを特徴とする請求項1に記載の方法。
  4. 前記受取リストスキーマに従って前記受取リストを作成することは、
    マスタデータソースを作成するために、少なくとも1つの新しいデータソースのフィールドデータの少なくとも1つの行を前記一時受取リストに追加することであって、前記マスタデータソースは複数の行のマスタフィールドデータを含むこと、および、
    前記マスタデータソース中の複数の行のマスタフィールドデータのそれぞれについてハッシュ値を計算すること
    を備えることを特徴とする請求項2に記載の方法。
  5. 前記初期データソース中の前記フィールドデータ、および前記その後に追加された少なくとも1つのデータソース中の前記フィールドデータを修正するために、前記受取リストを修正することをさらに備えることを特徴とする請求項1に記載の方法。
  6. 前記受取リスト中の前記初期データソースと前記その後に追加された少なくとも1つのデータソースとの間の重複を解決することをさらに備えることを特徴とする請求項1に記載の方法。
  7. 電子文書で使用するために複数のデータソースのデータをマージするシステムであって、前記複数のデータソースのデータを使用するアプリケーションプログラムを実行するために動作可能なクライアントコンピュータを備え、
    アプリケーションはさらに、
    初期データソースのフィールド名およびフィールドデータを受け取り、その後で追加された少なくとも1つのデータソースのフィールド名を前記初期データソースにマッピングし、前記初期データソースの前記フィールド名と前記その後で追加された少なくとも1つのデータソースの前記マッピング後フィールド名とに基づいて受取リストスキーマを構築し、前記受取リストスキーマに従って受取リストを作成し、前記受取リストをファイルに保存するために動作可能であることを特徴とするシステム。
  8. 前記アプリケーションプログラムはさらに、前記その後で追加されたデータソースのフィールドデータ、および前記初期データソースの前記フィールドデータを受け取る一時受取リストを生成するために動作可能であることを特徴とする請求項7に記載のシステム。
  9. 前記初期データソースの前記フィールド名、および前記その後で追加された少なくとも1つのデータソースの前記マッピング後フィールド名に基づいて受取リストスキーマを構築することは、
    前記その後で追加された少なくとも1つのデータソースの前記マッピング後フィールド名を、前記初期データソースの前記フィールド名と比較すること、および
    前記その後で追加された少なくとも1つのデータソースの前記マッピング後フィールド名のいずれも前記初期データソースの前記フィールド名に対応しない場合、前記マッピング後フィールド名を追加すること
    を備えることを特徴とする請求項7に記載のシステム。
  10. 前記受取リストスキーマに従って前記受取リストを作成することは、
    マスタデータソースを作成するために、少なくとも1つの新しいデータソースのフィールドデータの少なくとも1つの行を前記一時受取リストに追加することであって、前記マスタデータソースは、複数の行のマスタフィールドデータを含むこと、および
    前記マスタデータソース中の複数の行のマスタフィールドデータのそれぞれについてハッシュ値を計算すること
    を含むことを特徴とする請求項8に記載のシステム。
  11. 前記アプリケーションプログラムはさらに、前記受取リストを修正して、前記初期データソース中の前記フィールドデータ、および前記その後に追加された少なくとも1つのデータソース中の前記フィールドデータを修正するために動作可能であることを特徴とする請求項7に記載のシステム。
  12. 前記アプリケーションプログラムはさらに、前記受取リスト中の前記初期データソースと前記その後に追加された少なくとも1つのデータソースとの間の重複を解決するために動作可能であることを特徴とする請求項7に記載のシステム。
  13. 保存した更新後受取リストファイルは、
    前記初期データソースに対する参照、
    前記その後で追加された少なくとも1つのデータソースに対する参照、および、
    前記マスタデータソース中の前記複数の行のマスタフィールドデータのそれぞれについて計算された前記ハッシュ値
    を含むことを特徴とする請求項10に記載のシステム。
  14. コンピュータ実行可能命令が格納されたコンピュータ読み取り可能媒体であって、前記コンピュータ実行可能命令は、電子文書で使用するために複数のデータソースのデータをマージする方法を、コンピュータ実行時にコンピュータに実行させ、前記方法は、
    初期データソースのフィールド名およびフィールドデータを受け取ること、
    その後で追加された少なくとも1つのデータソースのフィールド名を前記初期データソースにマッピングすること、
    前記初期データソースの前記フィールド名、および前記その後で追加された少なくとも1つのデータソースの前記マッピング後フィールド名に基づいて受取リストスキーマを構築すること、
    前記受取リストスキーマに従って受取リストを作成すること、および、
    前記受取リストをファイルに保存することであって、前記受取リストをファイルに保存することは、前記受取リストを再作成することを可能にするファイルを保存することを含むこと
    を含むことを特徴とするコンピュータ読み取り可能媒体。
  15. 前記方法は、前記その後で追加された少なくとも一つのデータソースのフィールドデータ、および前記初期データソースの前記フィールドデータを受け取るために一時受取リストを生成することをさらに含むことを特徴とする請求項14に記載のコンピュータ読み取り可能媒体。
  16. 前記初期データソースの前記フィールド名、および前記その後で追加された少なくとも1つのデータソースの前記マッピング後フィールド名に基づいて受取リストスキーマを構築することは、
    前記その後で追加された少なくとも1つのデータソースの前記マッピング後フィールド名を、前記初期データソースの前記フィールド名と比較すること、および、
    前記その後で追加された少なくとも1つのデータソースの前記マッピング後フィールド名のいずれも前記初期データソースの前記フィールド名に対応しない場合、前記マッピング後フィールド名を追加すること
    を含むことを特徴とする請求項14に記載のコンピュータ読み取り可能媒体。
  17. 前記受取リストスキーマに従って前期受取リストを更新することは、
    マスタデータソースを作成するために、前記少なくとも1つの新しいデータソースのフィールドデータの少なくとも1つの行を前記一時受取リストに追加することであって、前記マスタデータソースは、複数の行のマスタフィールドデータを含むこと、および、
    前記マスタデータソース中の複数の行のマスタフィールドデータのそれぞれについてハッシュ値を計算すること
    を含むことを特徴とする請求項15に記載のコンピュータ読み取り可能媒体。
  18. 前記方法は、前記受取リストを修正して、前記初期データソース中の前記フィールドデータ、および前記その後に追加された少なくとも1つのデータソース中の前記フィールドデータを修正することをさらに含むことを特徴とする請求項14に記載のコンピュータ読み取り可能媒体。
  19. 前記方法は、前記受取リスト中の前記初期データソースと前記その後に追加された少なくとも1つのデータソースとの間の重複を解決することをさらに含むことを特徴とする請求項14に記載のコンピュータ読み取り可能媒体。
JP2005253870A 2004-09-30 2005-09-01 電子文書で使用するために複数のデータソースのデータをマージする方法、システム、およびコンピュータ読み取り可能媒体 Expired - Fee Related JP4906292B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/955,433 2004-09-30
US10/955,433 US7739309B2 (en) 2004-09-30 2004-09-30 Method, system, and computer-readable medium for merging data from multiple data sources for use in an electronic document

Publications (2)

Publication Number Publication Date
JP2006107466A true JP2006107466A (ja) 2006-04-20
JP4906292B2 JP4906292B2 (ja) 2012-03-28

Family

ID=35563470

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005253870A Expired - Fee Related JP4906292B2 (ja) 2004-09-30 2005-09-01 電子文書で使用するために複数のデータソースのデータをマージする方法、システム、およびコンピュータ読み取り可能媒体

Country Status (5)

Country Link
US (1) US7739309B2 (ja)
EP (1) EP1643377A3 (ja)
JP (1) JP4906292B2 (ja)
KR (1) KR101130443B1 (ja)
CN (1) CN100552677C (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10534766B2 (en) 2013-07-19 2020-01-14 Fujitsu Limited Data management apparatus and data management method

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060156135A1 (en) * 2004-12-16 2006-07-13 Marek Sikora Tabbed form with error indicators
US7788259B2 (en) * 2006-07-21 2010-08-31 Microsoft Corporation Locating, viewing and interacting with information sources
KR100803006B1 (ko) * 2006-09-20 2008-02-14 삼성전자주식회사 휴대단말기의 동적 입력방법 및 장치
EP1912404B1 (en) * 2006-10-11 2011-06-01 Murata Machinery, Ltd. File transfer server
KR100834293B1 (ko) * 2006-11-06 2008-05-30 엔에이치엔(주) 문서 처리 시스템 및 방법
US7675527B2 (en) * 2007-01-26 2010-03-09 Microsoft Corp. Multisource composable projection of text
US20080243823A1 (en) * 2007-03-28 2008-10-02 Elumindata, Inc. System and method for automatically generating information within an eletronic document
US8694518B2 (en) * 2007-06-14 2014-04-08 Colorquick, L.L.C. Method and apparatus for database mapping
US8126928B2 (en) * 2007-06-27 2012-02-28 Sap Ag Systems and methods for merging data into documents
US8056073B2 (en) * 2008-01-08 2011-11-08 International Business Machines Corporation Method, computer program product, and system for merging multiple same class instance states
US9189478B2 (en) * 2008-04-03 2015-11-17 Elumindata, Inc. System and method for collecting data from an electronic document and storing the data in a dynamically organized data structure
US8661342B2 (en) * 2008-06-17 2014-02-25 Microsoft Corporation Mail merge integration techniques
US8037062B2 (en) 2008-07-22 2011-10-11 Elumindata, Inc. System and method for automatically selecting a data source for providing data related to a query
US8041712B2 (en) * 2008-07-22 2011-10-18 Elumindata Inc. System and method for automatically selecting a data source for providing data related to a query
US8176042B2 (en) * 2008-07-22 2012-05-08 Elumindata, Inc. System and method for automatically linking data sources for providing data related to a query
US8341131B2 (en) * 2010-09-16 2012-12-25 Sap Ag Systems and methods for master data management using record and field based rules
US9542428B2 (en) * 2011-10-10 2017-01-10 Salesforce.Com, Inc. Systems and methods for real-time de-duplication
US10546057B2 (en) * 2011-10-28 2020-01-28 Microsoft Technology Licensing, Llc Spreadsheet program-based data classification for source target mapping
US9430114B1 (en) 2011-11-03 2016-08-30 Pervasive Software Data transformation system, graphical mapping tool, and method for creating a schema map
US9201558B1 (en) 2011-11-03 2015-12-01 Pervasive Software Inc. Data transformation system, graphical mapping tool, and method for creating a schema map
US8943059B2 (en) * 2011-12-21 2015-01-27 Sap Se Systems and methods for merging source records in accordance with survivorship rules
US8645332B1 (en) 2012-08-20 2014-02-04 Sap Ag Systems and methods for capturing data refinement actions based on visualized search of information
US10282407B1 (en) * 2013-08-21 2019-05-07 The United States Of America, As Represented By The Secretary Of The Navy Method for filtering data to generate a balance sheet
AU2014363901A1 (en) * 2013-12-10 2016-07-07 De Lage Landen Financial Services Method and system for negotiating, generating, documenting, and fulfilling vendor financing opportunities
US20160321757A1 (en) * 2015-04-29 2016-11-03 Pacific Resources Benefits Advisors, Llc Methods and systems for generating, and responding to, requests for proposals and requests for information for insurance products
CN105069542A (zh) * 2015-06-25 2015-11-18 中铁四局集团有限公司 一种责任成本预算编制方法及系统
CN104978307A (zh) * 2015-06-25 2015-10-14 中铁四局集团有限公司 一种清单处理方法及装置
CN104881762A (zh) * 2015-06-25 2015-09-02 中铁四局集团有限公司 一种工程量清单分解方法及系统
US10467615B1 (en) 2015-09-30 2019-11-05 Square, Inc. Friction-less purchasing technology
CN106919443A (zh) * 2015-12-25 2017-07-04 阿里巴巴集团控股有限公司 执行计算任务的方法、装置及系统
US10515121B1 (en) * 2016-04-12 2019-12-24 Tableau Software, Inc. Systems and methods of using natural language processing for visual analysis of a data set
US10810569B2 (en) 2017-01-30 2020-10-20 Square, Inc. Contacts for misdirected payments and user authentication
US10810574B1 (en) 2017-06-29 2020-10-20 Square, Inc. Electronic audible payment messaging
CN107479910B (zh) * 2017-07-07 2020-11-20 广州视源电子科技股份有限公司 文档修复方法、系统、可读存储介质及计算机设备
CN108989062B (zh) * 2018-07-25 2020-05-01 北京达佳互联信息技术有限公司 更新群成员数据的方法、装置、终端、系统及存储介质
US11079954B2 (en) * 2018-08-21 2021-08-03 Samsung Electronics Co., Ltd. Embedded reference counter and special data pattern auto-detect
CN110457084B (zh) * 2019-07-10 2021-11-30 五八有限公司 一种加载方法及装置
US11314935B2 (en) * 2019-07-25 2022-04-26 Docusign, Inc. System and method for electronic document interaction with external resources
CN112860737B (zh) * 2021-03-11 2022-08-12 中国平安财产保险股份有限公司 数据查询方法、装置、电子设备及可读存储介质
US11604839B2 (en) * 2021-05-17 2023-03-14 Docusign, Inc. Document package merge in document management system

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001109758A (ja) * 1999-10-06 2001-04-20 Hitachi Ltd 仮想表インタフェースと該インタフェースを用いた問合せ処理システム及び方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5111395A (en) 1989-11-03 1992-05-05 Smith Rodney A Automated fund collection system including means to eliminate duplicate entries from a mailing list
US6167405A (en) * 1998-04-27 2000-12-26 Bull Hn Information Systems Inc. Method and apparatus for automatically populating a data warehouse system
JP2000187668A (ja) * 1998-12-22 2000-07-04 Hitachi Ltd グループ化方法と重複排除方法
US6424969B1 (en) * 1999-07-20 2002-07-23 Inmentia, Inc. System and method for organizing data
US6748402B1 (en) 2001-04-02 2004-06-08 Bellsouth Intellectual Property Corporation System and method for converting and loading interactive pager address books
US7363581B2 (en) 2003-08-12 2008-04-22 Accenture Global Services Gmbh Presentation generator
JP2005078612A (ja) * 2003-09-04 2005-03-24 Hitachi Ltd ファイル共有システム及びファイル共有装置間のファイル移行方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001109758A (ja) * 1999-10-06 2001-04-20 Hitachi Ltd 仮想表インタフェースと該インタフェースを用いた問合せ処理システム及び方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10534766B2 (en) 2013-07-19 2020-01-14 Fujitsu Limited Data management apparatus and data management method

Also Published As

Publication number Publication date
EP1643377A3 (en) 2009-01-14
CN100552677C (zh) 2009-10-21
KR20060050395A (ko) 2006-05-19
JP4906292B2 (ja) 2012-03-28
US20060075323A1 (en) 2006-04-06
EP1643377A2 (en) 2006-04-05
CN1755689A (zh) 2006-04-05
KR101130443B1 (ko) 2012-03-28
US7739309B2 (en) 2010-06-15

Similar Documents

Publication Publication Date Title
JP4906292B2 (ja) 電子文書で使用するために複数のデータソースのデータをマージする方法、システム、およびコンピュータ読み取り可能媒体
JP4809897B2 (ja) 電子データスナップショットの生成
US10108914B2 (en) Method and system for morphing object types in enterprise content management systems
US7895179B2 (en) Asynchronous updating of web page data views
KR101122816B1 (ko) 전자 문서에서 특정 유형의 컨텐트를 관리하는 방법, 장치및 컴퓨터 판독가능 매체
US7711754B2 (en) System and method for managing data using static lists
KR101143155B1 (ko) 데이터 소스로서 워크북을 노출시키기 위한 방법, 시스템,및 장치
JP5009310B2 (ja) サーバベースファイルのローカルコピーへのリダイレクト
US8612893B2 (en) Dynamic screentip language translation
US7801863B2 (en) Method and computer-readable medium for formula-based document retention
US9449063B2 (en) Synchronization of form fields in a client-server environment
US8346869B2 (en) Granular data synchronization for editing multiple data objects
WO2017003971A1 (en) Metamorphic documents
US20180074867A1 (en) Provide copy of notebook document
JP2010079710A (ja) メタデータ管理装置、プログラムおよびメタデータ管理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080826

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110318

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110617

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110622

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110713

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111227

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120110

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150120

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350