JP7201299B2

JP7201299B2 - コグニティブな文書イメージのデジタル化のための方法、コンピュータ・プログラム及びシステム

Info

Publication number: JP7201299B2
Application number: JP2020526307A
Authority: JP
Inventors: ノースラップ、ケビン; トリム、クレイグ; ハミース、バダ; セーガル、カラン; パドル、チャンドラシェックハー; アデニラン、アビソーラ
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2017-12-01
Filing date: 2018-11-23
Publication date: 2023-01-10
Anticipated expiration: 2038-11-23
Also published as: JP2021504787A; CN111406262B; GB2582722A; GB2582722B; US20190171873A1; US10592738B2; CN111406262A; WO2019106505A1; GB202009558D0; DE112018005418T5

Description

本開示は、文書処理技術に関し、より特定的には、文書イメージからデータをコグニティブ（cognitive）にデジタル化するための方法、コンピュータ・プログラム製品、及びシステムに関する。

従来の文書処理において、紙に印刷された（ink-on-paper）文書は、ページごとに走査され、それぞれの視覚イメージとして準備される。走査された紙から結果として得られる文書ファイルは、典型的には、一連のページの視覚イメージである。ページの視覚イメージの各々は、アクセス可能なコンテンツを有さず、既存の文書処理アプリケーションは、特定の視覚イメージ・パターンをデジタル化してデジタル化データにすることができ、このデジタル化データには、対応するコンピュータ・プログラム・アプリケーションを用いて、アクセスし動作することができる。視覚イメージのこのようなデータ・デジタル化プロセスは、抽出又はデータ抽出と呼ばれることが多い。従来の紙形態で表される情報及び走査される文書イメージの量を鑑みると、こうした文書イメージの抽出は、産業及び社会の多くの領域における一般的な生産性に大きな影響を与え得る。

文書イメージからデータを抽出するためのコンピュータ実施方法、コンピュータ・プログラム、及びシステムを提供する。

１つの態様において、方法を提供することにより、従来技術の欠点が克服され、付加的な利点が与えられる。文書イメージからデータを抽出するための方法は、例えば、コンピュータの１又は複数のプロセッサにより、複数のオブジェクトを含む前記文書イメージを取得することと、複数のオブジェクトにそれぞれ対応する複数のマイクロブロックを識別することであって、マイクロブロックの各々は、コンテンツ、位置及びスタイルと関連付けられる、識別することと、第１のマイクロブロック及び第２のマイクロブロックのそれぞれの位置特徴、並びに調整可能な共線性パラメータに基づいて、第１のマイクロブロックが第２のブロックと共線性を有することを発見することと、第１のマイクロブロック及び第２のマイクロブロックを有するマクロブロックを識別することであって、マクロブロックは、コンピュータ・プログラムにより計算可能なキー値ペアを構成する、識別することと、発見的手法に基づいて信頼性レベルをキー値ペアと関連付けることと、キー値ペア及び関連付けられた信頼性レベルをユーザに通信することとを含む。

１つの態様において、方法を提供することにより、従来技術の欠点が克服され、付加的な利点が与えられる。文書イメージからデータを抽出するための方法は、例えば、コンピュータの１又は複数のプロセッサにより、テーブル形式のオブジェクト・クラスタを含む文書イメージを取得することと、テーブル形式オブジェクト・クラスタ内の複数のマクロブロックを識別することであって、それぞれのマクロブロックは共線性オブジェクトを含む、識別することと、各マクロブロック内で、それぞれのマイクロブロックから１つ又は複数の候補セルを特定することと、特定した候補セルに基づいて、テーブル形式オブジェクト・クラスタを、テーブル・クラスの所定のセットから１つのテーブル・クラスに分類することと、テーブル・クラスに従って、各マクロブロックについての１つ又は複数の候補セルからデータを抽出することであって、抽出されたデータは、コンピュータ・プログラムにより計算可能である、抽出することと、抽出されたデータから１つ又は複数の二次元（２Ｄ）アレイを作成することであって、１つ又は複数の２Ｄアレイは、第１の次元に、テーブル形式オブジェクト・クラスタ内の多数のマクロブロックを有する、作成することとを含む。

１つの態様において、１つ又は複数のプロセッサにより可読であり、１つ又は複数のプロセッサにより実行される、文書イメージからデータを抽出するための方法を実行するための命令を格納するコンピュータ可読ストレージ媒体を含むコンピュータ・プログラム製品を提供することにより、従来技術の欠点が克服され、付加的な利点が与えられ、この方法は、例えば、コンピュータの１又は複数のプロセッサにより、複数のオブジェクトを含む前記文書イメージを取得することと、複数のオブジェクトにそれぞれ対応する複数のマイクロブロックを識別することであって、マイクロブロックの各々は、コンテンツ、位置及びスタイルと関連付けられる、識別することと、第１のマイクロブロック及び第２のマイクロブロックのそれぞれの位置特徴、並びに調整可能な共線性パラメータに基づいて、第１のマイクロブロックが第２のブロックと共線性を有することを発見することと、第１のマイクロブロック及び第２のマイクロブロックを有するマクロブロックを識別することであって、マクロブロックは、コンピュータ・プログラムにより計算可能なキー値ペアを構成する、識別することと、発見的手法に基づいて、信頼性レベルをキー値ペアと関連付けることと、キー値ペア及び関連付けられた信頼性レベルをユーザに通信することとを含む。

１つの態様において、１つ又は複数のプロセッサにより可読であり、１つ又は複数のプロセッサにより実行される、文書イメージからデータを抽出するための方法を実行するための命令を格納するコンピュータ可読ストレージ媒体を含むコンピュータ・プログラム製品を提供することにより、従来技術の欠点が克服され、付加的な利点が与えられ、この方法は、例えば、コンピュータの１又は複数のプロセッサにより、テーブル形式のオブジェクト・クラスタを含む文書イメージを取得することと、テーブル形式オブジェクト・クラスタ内の複数のマクロブロックを識別することであって、それぞれのマクロブロックは共線性オブジェクトを含む、識別することと、各マクロブロック内で、それぞれのマイクロブロックから１つ又は複数の候補セルを特定することと、特定した候補セルに基づいて、テーブル形式オブジェクト・クラスタを、テーブル・クラスの所定のセットからの１つのテーブル・クラスに分類することと、テーブル・クラスに従って、各マクロブロックについての１つ又は複数の候補セルからデータを抽出することであって、抽出されたデータは、コンピュータ・プログラムにより計算可能である、抽出することと、抽出されたデータから１つ又は複数の二次元（２Ｄ）アレイを作成することであって、１つ又は複数の２Ｄアレイは、第１の次元に、テーブル形式オブジェクト・クラスタ内の多数のマクロブロックを有する、作成することとを含む。

１つの態様において、メモリと、メモリと通信する少なくとも１つのプロセッサと、メモリを介して１つ又は複数のプロセッサにより実行可能な、文書イメージからデータを抽出するための方法を実行するためのプログラム命令とを含むシステムを提供することにより、従来技術の欠点が克服され、付加的な利点が与えられ、この方法は、例えば、コンピュータの１又は複数のプロセッサにより、複数のオブジェクトを含む文書イメージを取得することと、複数のオブジェクトにそれぞれ対応する複数のマイクロブロックを識別することであって、マイクロブロックの各々は、コンテンツ、位置及びスタイルと関連付けられる、識別することと、第１のマイクロブロック及び第２のマイクロブロックのそれぞれの位置特徴、並びに調整可能な共線性パラメータに基づいて、第１のマイクロブロックが第２のブロックと共線性を有することを発見することと、第１のマイクロブロック及び第２のマイクロブロックを有するマクロブロックを識別することであって、マクロブロックは、コンピュータ・プログラムにより計算可能なキー値ペアを構成する、識別することと、発見的手法に基づいて、信頼性レベルをキー値ペアと関連付けることと、キー値ペア及び関連付けられた信頼性レベルをユーザに通信することとを含む。

本発明で記載される技術を通じて、付加的な特徴が実現される。これらに限定されるものではないが、コンピュータ・プログラム製品及びシステムを含む他の実施形態及び態様が、本明細書で詳細に説明され、特許請求される発明の一部と見なされる。

本発明の１つ又は複数の態様が、本明細書の最後にある特許請求の範囲において、例として具体的に示され、明確に特許請求されている。本発明の上記及び他の目的、特徴、並びに利点は、添付図面と関連して用いられる以下の詳細な説明から明らかである。

本明細書に記載される１つ又は複数の実施形態による、文書イメージをコグニティブにデジタル化するためのシステムを示す。本明細書に記載される１つ又は複数の実施形態による、コグニティブな文書デジタル化エンジンにより実行される動作のフローチャートを示す。本明細書に記載される１つ又は複数の実施形態による、コグニティブな文書デジタル化エンジンにより実行される、多層ブロック識別の詳細な動作を示す。本明細書に記載される１つ又は複数の実施形態による、コグニティブな文書デジタル化エンジンにより実行される、テーブル分類及び抽出の詳細な動作を示す。本明細書に記載される１つ又は複数の実施形態による、マクロブロックを識別するために調整可能なブロック識別パラメータが適用される例示的文書イメージを示す。本明細書に記載される１つ又は複数の実施形態による、例示的なテーブル形式のオブジェクト・クラスタを示す。本明細書に記載される１つ又は複数の実施形態による、コグニティブな文書デジタル化エンジンにより作成される、図６のテーブル形式オブジェクト・クラスタに対応するテーブルを示す。本明細書に記載される１つ又は複数の実施形態による、別の例示的なテーブル形式オブジェクト・クラスタを示す。本明細書に記載される１つ又は複数の実施形態による、図８の例示的なテーブル形式オブジェクト・クラスタから識別されるマイクロブロック及びマクロブロックを示す。本明細書に記載される１つ又は複数の実施形態による、コグニティブな文書デジタル化エンジンにより作成される、図８のテーブル形式オブジェクト・クラスタに対応するテーブルを示す。本明細書に記載される１つ又は複数の実施形態による、さらに別の例示的なテーブル形式オブジェクト・クラスタの部分を示す。本明細書に記載される１つ又は複数の実施形態による、コグニティブな文書デジタル化エンジンにより作成される、図１１のテーブル形式オブジェクト・クラスタ内のセルに対応するネストしたテーブルである。本発明の実施形態によるクラウド・コンピューティング・ノードを示す。本発明の実施形態によるクラウド・コンピューティング環境を示す。本発明の実施形態による抽象化モデル層を示す。

図１は、本明細書に記載される１つ又は複数の実施形態による、文書イメージをコグニティブにデジタル化するためのシステム１００を示す。

文書イメージからの計算（computational）データの抽出は、様々なカスタム形式、個々のスタイル、多様なアラインメント、及び非テキスト・コンテンツのためにうまくいかないことが多い。その結果、文書イメージで表される膨大な量の情報には、完全にデジタル化された文書と同じ程度にアクセス可能ではない。デジタル化されていない文書イメージは、視覚的表示及び保存目的などに使用が制限される。その一方で、デジタル化から利益を得る文書の数を考慮すると、そうした文書イメージの手動デジタル化に必要な時間とコストは法外なものである。

デジタル文書は、文書内に表されるデータを計算的に（computationally）用いる際に便宜上好ましいことが多い。紙にペンで書かれた（pen-on-paper）文書を走査して取り込むと、文書は、ページの一連の視覚イメージとなるものの、デジタル・データとして計算的に使用する準備はできていない。従って、文書イメージから計算データを正確に抽出するために、多くの文書デジタル化アプリケーションが開発されてきた。既存の文書処理アプリケーションにおいては、文書の視覚イメージを処理し、文書から計算データを抽出する際、文書のカスタム形式及び構成が非常に多いことにより問題が提示される。本発明の実施形態は、文書内の視覚マークが伝える意味を人間の読み手が理解するとき、文書イメージのコグニティブなデジタル化プロセスを実施し、文書イメージからのデータ抽出の効率及び精度を向上させる。

システム１００は、コグニティブな文書デジタル化エンジン１２０を含む。コグニティブな文書デジタル化エンジン１２０は、ユーザ・デバイス１１０を介して、ユーザ１０１から文書イメージ１８１を受け取る。文書イメージ１８１は、計算データではない特定の情報に対して作成された文書の視覚イメージである。例えば、紙文書の走査イメージは、いずれのデジタル化データも有さないので、走査イメージ内のテキストを検索することも、又はデータ入力として別のアプリケーションに読み込むこともできない。文書イメージ１８１は、計算データとして抽出することができる多数のオブジェクトを有する。本明細書において、「オブジェクト」という用語は、文書イメージにおける識別可能な個々のエンティティを指し、「マイクロブロック」という用語は、マイクロブロック機械論理境界付け規則（delineation rule）に従ってオブジェクト間の関係を見つけるための種々の分析のための、文書内の対応するオブジェクトから識別される候補データの最小単位を指す。コグニティブな文書デジタル化エンジン１２０は、各マイクロブロックのコンテンツ、位置、スタイルを含む多数のマイクロブロック特徴１４５を有して各マイクロブロックを表す。

コグニティブな文書デジタル化エンジン１２０は、多層共線性分析に基づいて文書イメージ１８１からデータを自動的に抽出するので、文書イメージ１８１内のテキスト及び数のイメージから抽出された情報は、他のプログラム及びアプリケーションにより使用可能な計算データであり得る。コグニティブな文書デジタル化エンジン１２０に結合されたリレーショナル・データベース１５０は、文書イメージ１８１から抽出されたデータに対応する複数のＫＶＰのうちの１つのキー値ペア（key-value pair、ＫＶＰ）１５５を格納する。コグニティブな文書デジタル化エンジン１２０は、キー値ペアをそれぞれの信頼性レベルと関連付ける。「キー値ペア」という用語は、キー及び値を用いる一次データ表現単位を指し、そこで、キーは値を説明又は特定する。多くの場合、リレーショナル・データベース・テーブルに見られるように、ＫＶＰを階層的に編成してより大きいデータ構造にすることができる。

コグニティブな文書デジタル化エンジン１２０は、光学式文字認識（ＯＣＲ）アプリケーションなどの１つ又は複数の外部ツール１７０を用いて、それぞれのマイクロブロックとして識別される、文書イメージ１８１内の全てのオブジェクトについての、マイクロブロック特徴１４５を含む文書メタデータ１４０をキャプチャすることができる。本明細書において、「共線性」という用語は、コグニティブな文書デジタル化エンジン１２０が、共線性を有するような２つ又はそれより多いマイクロブロックに基づいてマクロブロックを識別するために、有意であると考えるときの、文書イメージ１８１内の認識可能なオブジェクトの間の幾何的アラインメントを指し、「マイクロブロック」という用語は、文書イメージ１８１から認識される個々のオブジェクトを指し、「マクロブロック」という用語は、テーブル内の、キー値ペア（ＫＶＰ）及び列又行といった有意のデータ単位を形成する、２つ又はそれより多いマイクロブロックのグループを指す。

従来の文書イメージ処理においては、使用可能なデータを抽出するための無数のカスタム形式の文書において共線性を正しく発見するのは、進行中のプロセスである。コグニティブな文書デジタル化エンジン１２０は、共線性及び意味論を用いる多層手法を利用して、従来の文書イメージ処理アプリケーションよりも包括的な文書の認識を達成し、結果として文書イメージ１８１から使用可能データを抽出する。

コグニティブな文書デジタル化エンジン１２０は、複数の調整可能な共線性パラメータに基づいてマイクロブロックの間の共線性を分析し、文書イメージ１８１においてアラインされると判断される複数のマイクロブロックから計算データを抽出する。コヒーシブ・データの例は、文書内のテーブルにおけるような、個々のキー値ペア及びＫＶＰのセットを含むことができる。調整可能な共線性パラメータの例は、これらに限定されるものではないが、フォント・サイズ及びスタイルの変更、アラインメント及び句読点を含むことができる。コグニティブな文書デジタル化エンジン１２０による共線性分析に基づいて２つのマイクロブロックが互いにアラインする場合、キーはマイクロブロックであり、値は別のマイクロブロックであるので、キー値ペアは、２つのマイクロブロックを含むマクロブロックである。

コグニティブな文書デジタル化エンジン１２０は、意味データベース１３０内に格納された種々の意味情報をさらに利用して、文書イメージ１８１からデータを抽出する。意味データベース１３０内の情報の幾つかの例として、これらに限定されるものではないが、１つ又は複数の文書クラス１３１、１つ又は複数のキー・エイリアス１３５、及びキー・オントロジ・データ１３７が挙げられる。コグニティブな文書デジタル化エンジン１２０の詳細な動作は、図２、図３及び図４に説明される。

意味データベース１３０において、１つ又は複数の文書クラス１３１の各々は、各文書クラス内のあらゆる文書が含むことになる１つ又は複数のクラス・キー１３３に対応する。例えば、文書が購入請求書クラスのものであるとき、対応するクラス・キーは、これらに限定されるものではないが、名称、取引日、項目リスト、金額等を含むことができる。

意味データベース１３０において、１つ又は複数のキー・エイリアス１３５は、キーの代わりに文書イメージ１８１内に現れ得る多数のキーについてのエイリアスを含む。クラスに対応する全てのクラス・キーは１つの文書内に現れるので、１つ又は複数のクラス・キー１３３を探して、１つ又は複数のキー・エイリアス１３５が調べられることが多い。例えば、クラス・キーが「ＡｃｃｏｕｎｔＮｕｍｂｅｒ（アカウント番号）」クラス・キーを指定し得るが、文書イメージ１８１は、「ＡｃｃｏｕｎｔＮｕｍｂｅｒ」のテキストではなく、「Ａｃｃｔ．＃」テキストを有するキーを有することがある。１つ又は複数のキー・エイリアス１３５は、様々なカスタマイズ文書の分析及びデータ抽出を適合するように、「ＡｃｃｏｕｎｔＮｕｍｂｅｒ」及び「Ａｃｃｔ．＃」のような交換可能な名称を列挙する。

意味データベース１３０のキー・オントロジ・データ１３７は、制約のセット、及び文書イメージ１８１により表される知識の範囲をモデル化する意味を定める。キー・オントロジ・データ１３７は、文書イメージ１８１内に提示できる複数のキーを含む。複数のキーの中のキー１３８は、キー１３８のプロパティ、キー１３８が属する１つ又は複数のセット、及び１つ又は複数のセットの同じセットのメンバーの間の関係を含む種々の特徴と関連付けられる。また、コグニティブな文書デジタル化エンジン１２０は、２つの意味的に関連付けられたテキスト・ブロックが共線性を有すると結論づけることができる。例えば、キー１３８は、ＣｕｓｔｏｍｅｒＬａｓｔＮａｍｅ（顧客の姓）キーに対するテキスト文字列、ＤａｔｅＯｆＢｉｒｔｈ（生年月日）キーに対する８桁の数のような、キー１３８についての値の適切なデータ・タイプを指定するデータ・タイプ１３９プロパティを有することができる。同じ例において、テキスト文字列が、「Ｊｏｈｎｓｏｎ」のような一般的な名前を有する場合、コグニティブな文書デジタル化エンジン１２０は、テキスト文字列が近接範囲内のキーとアラインされなくても、ＣｕｓｔｏｍｅｒＬａｓｔＮａｍｅキー及びテキスト文字列「Ｊｏｈｎｓｏｎ」をＫＶＰとして判定することができる。同じ例において、コグニティブな文書デジタル化エンジン１２０は、テキスト文字列「Ｊｏｈｎｓｏｎ」を用いて分類器（外部ツール１７０の１つ）を実行し、テキスト文字列「Ｊｏｈｎｓｏｎ」が名前についてのデータ・タイプであると判定する。別の例において、キー１３８は、１つ又は複数のクラス・キー１３３の１つとすることができ、ＣｕｓｔｏｍｅｒＮｕｍｂｅｒ（顧客番号）クラス・キー及びＡｍｏｕｎｔ（金額）クラス・キーの両方を含む請求書文書クラスのような、キー・オントロジ・データ１３７内に定められる他のクラス・キーとの関係を有する。

図２は、本明細書に記載される１つ又は複数の実施形態による、図１のコグニティブな文書デジタル化エンジン１２０により実行される動作のフローチャートを示す。

ブロック２１０において、コグニティブな文書デジタル化エンジン１２０は、文書イメージを受け取り、該文書イメージを処理する。受け取った文書イメージは、１つのページ内に１つより多い特有の（distinctive）視覚パターンを有し得る。コグニティブな文書デジタル化エンジン１２０は、こうしたパターンを文書内のそれぞれのセクションとして識別する。本明細書において、「オブジェクト」という用語は、文書イメージ内のイメージ・オブジェクトを指し、「マイクロブロック」という用語は、共線性分析のためのマイクロブロック機械論理境界付け規則に従って対応するイメージ・オブジェクトから識別された不可分の単位ブロックを指す。次に、コグニティブな文書デジタル化エンジン１２０は、ブロック２２０に進む。

ブロック２２０において、コグニティブな文書デジタル化エンジン１２０は、文書イメージのそれぞれのセクション内にいずれかのテーブル形式オブジェクト・クラスタが発見されたかどうかを判断する。コグニティブな文書デジタル化エンジン１２０が、文書内にいずれのテーブル形式オブジェクト・クラスタも発見しなかった場合、コグニティブな文書デジタル化エンジン１２０はブロック２３０に進む。コグニティブな文書デジタル化エンジン１２０が、文書内に１つ又は複数のテーブル形式オブジェクト・クラスタを発見した場合、コグニティブな文書デジタル化エンジン１２０はブロック２４０に進む。

ブロック２３０において、コグニティブな文書デジタル化エンジン１２０は、文書イメージ１８１内のマイクロブロックを分析し、マイクロブロックの拡張した共線性分析に基づいてマクロブロックを識別する。ブロック２３０の詳細な動作及び対応する説明は、図３に説明される。次に、コグニティブな文書デジタル化エンジン１２０は、ブロック２５０に進む。

ブロック２４０において、コグニティブな文書デジタル化エンジン１２０は、文書イメージ内で発見されたテーブル形式クラスタをそれぞれ分析し、各々のテーブル形式クラスタ内のオブジェクトに対する拡張した共線性分析に基づいてテーブルを識別する。本明細書において、テーブルは、二次元構成のキー値ペアである。テーブルは、多面的な情報を伝える際に最も一般的に使用され、様々なカスタム構成で提示される。コグニティブな文書デジタル化エンジン１２０は、テーブルのタイプに対応するデータ抽出を適切に実行するために、識別されるテーブルのタイプを分類する。ブロック２４０の詳細な動作及び対応する説明は、図４に説明される。次に、コグニティブな文書デジタル化エンジン１２０は、ブロック２５０に進む。

ブロック２５０において、コグニティブな文書デジタル化エンジン１２０は、計算データを有するデジタル化された文書イメージの結果をユーザに返す。コグニティブな文書デジタル化エンジン１２０は、随意的に、ユーザからの結果に対するフィードバックを受け取る。コグニティブな文書デジタル化エンジン１２０は、ブロック２３０から生成されたキー値ペア及び／又はフィードバックに従ってブロック２４０から生成されたテーブルを更新し、次に、ブロック２１０において受け取った文書イメージ１８１の処理を終了する。

コグニティブな文書デジタル化エンジン１２０は、文書イメージ１８１のセクションに応じてブロック２３０及びブロック２４０を実行し、オブジェクト・クラスタ及び種々の組織のテーブルの混合物を有するカスタム文書の種々の形式をサポートすることができる。コグニティブな文書デジタル化エンジン１２０は、文書イメージ１８１内に存在するオブジェクトに従って、必要に応じてブロック２３０及び／又はブロック２４０を繰り返すことができる。

図３は、本明細書に記載される１つ又は複数の実施形態による、図１のコグニティブな文書デジタル化エンジン１２０により実行されるような、図２のブロック２３０の詳細な動作、多層ブロックの識別を示す。

ブロック３１０において、コグニティブな文書デジタル化エンジン１２０は、対応するオブジェクトから、受け取った文書におけるマイクロブロックを識別する。オブジェクトは、テキスト文字列、数値、記号、又は画像のいずれかであり得る。コグニティブな文書デジタル化エンジン１２０は、共線性分析に備えて、オブジェクト間の水平及び垂直空間の絶対距離及び／又は相対近接性を測定する。次に、コグニティブな文書デジタル化エンジン１２０は、ブロック３２０に進む。

ブロック３２０において、コグニティブな文書デジタル化エンジン１２０は、マイクロブロックの調整可能な共線性パラメータに基づいて、２つ又はそれより多いマイクロブロックの相対位置の近接性を分析することにより、ブロック３１０で識別された各マイクロブロックに対応するマクロブロックを識別する。コグニティブな文書デジタル化エンジン１２０は、調整可能な共線性パラメータに従って共線性を有する２つ又はそれより多いマイクロブロックに基づいて、マクロブロックを識別することができる。受け取った文書内の全てのマイクロブロックについてそれぞれのマクロブロックを識別すると、コグニティブな文書デジタル化エンジン１２０は、ブロック３３０に進む。

本発明の１つの実施形態において、コグニティブな文書デジタル化エンジン１２０は、２つ又はそれより多いマイクロブロックが、絶対距離又は相対位置において特定の距離範囲内にあるとき、正確なアラインメントなしに、調整可能な共線性パラメータに基づいて２つ又はそれより多いマイクロブロックが共線性を有すると判断することができる。調整可能な共線性パラメータは、フォント、段落アラインメント、句読点、及びオントロジ・マッチングを含む。調整可能な共線性パラメータは、２つのマイクロブロックが特有のフォント及び異なるサイズ／スタイルを有し、それぞれのマイクロブロックにおいて異なる段落アラインメントを有し、及び／又は句読点により分離されていても、コグニティブな文書デジタル化エンジン１２０は、２つのマイクロブロックを共線関係で関連付けることができる。さらに、コグニティブな文書デジタル化エンジン１２０は、例えば、特定のキー名及びキー名についてのデータ・タイプが指定されるキー・オントロジ・データに基づいて、２つのマイクロブロックをマクロブロックとして判断することができる。調整可能な共線性パラメータの例及び詳細な説明、並びに対応する説明は、図５に説明される。

ブロック３３０において、コグニティブな文書デジタル化エンジン１２０は、受け取った文書のクラス、及び文書のクラスにおいて要求される全てのクラス・キーが識別されたかどうかを判断する。コグニティブな文書デジタル化エンジン１２０が、いずれのクラス・キーも識別されなかったと判断した場合、コグニティブな文書デジタル化エンジン１２０は、ブロック３４０に進む。コグニティブな文書デジタル化エンジン１２０が、全てのクラス・キーが識別されたと判断した場合、コグニティブな文書デジタル化エンジン１２０は、ブロック３５０に進む。

ブロック３４０において、コグニティブな文書デジタル化エンジン１２０は、欠落しているクラス・キーの各々に対応するそれぞれのエイリアスに関して、ブロック３１０において識別された全てのマイクロブロックを検査する。欠落しているクラス・キーの代わりに見つかった各エイリアスについて、コグニティブな文書デジタル化エンジン１２０は、ブロック３２０におけるような、エイリアスを有するマイクロブロックを含むマクロブロックを識別する。次いで、コグニティブな文書デジタル化エンジン１２０は、ブロック３５０に進む。

ブロック３５０において、コグニティブな文書デジタル化エンジン１２０は、ブロック３２０及びブロック３４０において識別されたマクロブロックから全てのキー値ペア（ＫＶＰ）を識別する。各マクロブロックの１つのマイクロブロックは、ＫＶＰにおけるキーに対応し、同じマクロブロックの別のマイクロブロックは、同じＫＶＰ内の値に対応し得る。コグニティブな文書デジタル化エンジン１２０は、信頼性レベルを識別されたＫＶＰの各々に割り当てる。コグニティブな文書デジタル化エンジン１２０は、近接性レベル、それぞれのキー名のオントロジ・マッチング及びデータ・タイプのような種々の要因に基づいて、ＫＶＰの信頼性レベルを発見的に判断する。公式の（formal）取引文書内に頻繁に現れるキー及び値において、ＫＶＰの信頼性レベルは、非公式の（informal）個人的文書におけるカスタム・キー及び値よりも高くなり得る。次いで、コグニティブな文書デジタル化エンジン１２０は、図２のブロック２５０に進む。

図４は、本明細書に記載される１つ又は複数の実施形態による、図１のコグニティブな文書デジタル化エンジン１２０により実行される、図２のブロック２４０の詳細な動作、すなわちテーブル分類及び抽出を示す。

既述のように、文書化の多くの領域では、多数の文書において種々のタイプ及び形式のテーブルが用いられる。コグニティブな文書デジタル化エンジン１２０は、テーブルを分類し、テーブルの特徴に対応する方法でテーブルからデータを抽出する。本発明の特定の実施形態において、コグニティブな文書デジタル化エンジン１２０は、以下のブロック４３０に説明されるように、それぞれのカスタマイズされた抽出戦略から利益を得る、テーブルについての３つのクラスを指定する。

ブロック４１０において、コグニティブな文書デジタル化エンジン１２０は、テーブル形式クラスタからマクロブロックを有する候補列を特定する。コグニティブな文書デジタル化エンジン１２０は、テーブル形式クラスタ又は任意のセクションを、文書イメージの残りから分離し、各々のテーブル形式クラスタを処理する。コグニティブな文書デジタル化エンジン１２０は、種々の列定義属性を分析することにより、テーブル形式構造の、マクロブロックとも呼ばれる候補列を特定する。列定義属性の例は、マクロブロック間の絶対距離、マクロブロック間の相対距離、意味的補間（semantic interpolation）及び相対スタイルを含むことができる。

コグニティブな文書デジタル化エンジン１２０は、列定義属性を発見的に組み合わせて、マクロブロックを有する候補列を特定する。次に、コグニティブな文書デジタル化エンジン１２０は、ブロック４２０に進む。

本発明の特定の実施形態において、コグニティブな文書デジタル化エンジン１２０は、例えば、緊密な間隔（tight spacing）、シングル・スペース（標準の間隔）、１．５行間隔（one-and-a-half spacing）、ダブル・スペース及び広い間隔を含むことができる所定の間隔カテゴリのセットを有することができ、ここで、各々の間隔カテゴリは、それぞれの間隔カテゴリにより分離される２つのマクロブロック間の共線性の特有の尤度を示す。間隔カテゴリのセットは、各マクロブロック内のマイクロブロックに対して特有のものであり得る。

コグニティブな文書デジタル化エンジン１２０はさらに、意味関係を示す、接続詞、論理和、及び関連した記号マークのような意味表示の存在に基づいて、意味的補間を適用することができる。例えば、「及び（ａｎｄ）」及び「又は（ｏｒ）」の両方とも、記号「＆」、「＋」におけるような行の継続を表す。「－」及び「＊」などの記号は、リスト内の行見出し標識として使用されることが多い。コグニティブな文書デジタル化エンジン１２０は、間隔カテゴリからマクロブロックを識別するために、意味的補間を考慮に入れることができる。

さらに、コグニティブな文書デジタル化エンジン１２０は、マクロブロック識別のために、相対スタイルを考慮に入れることもできる。意味的補間及び相対スタイルは一般に、絶対的及び相対的測定に従った間隔を下回るそれぞれの重みを有する。コグニティブな文書デジタル化エンジン１２０は、文書のクラスに基づいて、特定の要素についてのそれぞれの重みを割り当てることができる。例えば、特定の距離範囲内の２つのブロック間のスタイル及びフォントの変更は、プレゼンテーション用スライドなどの非公式文書よりも、取引文書、請求書、及び政府書式などの公式文書においてより重要視され得る。コグニティブな文書デジタル化エンジン１２０による動作を定める列の例及び説明は、図６及び図８に示される。

ブロック４２０において、コグニティブな文書デジタル化エンジン１２０は、それぞれのマクロブロック内のマイクロブロックに基づいて、それぞれの候補列内の候補セルを特定する。テーブルは、各列内に１つより多いセルを有するので、コグニティブな文書デジタル化エンジン１２０は、各候補列内のそれぞれの行として候補セル・データを特定する。本明細書において、「列（column）」及び「行（row）」という用語は、テーブル形式クラスタがどのように編成されるかに基づいて逆にすることができる。コグニティブな文書デジタル化エンジン１２０が最初にマクロブロックを有する候補行を識別した場合、列マイクロブロックが、各行内の候補セルとして識別される。次に、コグニティブな文書デジタル化エンジン１２０は、ブロック４３０に進む。

ブロック４３０において、コグニティブな文書デジタル化エンジン１２０は、ブロック４２０から識別された候補セルにより形成されたテーブルを分類する。コグニティブな文書デジタル化エンジン１２０は、テーブル・クラスに従って候補セルからデータを抽出し、抽出されたセル・データの意味的分析に基づいて、テーブル内の各列についてのそれぞれの見出しを判断する。例えば、セルの残りが数値データである列内にテキスト「量」を有する第１のセルの場合、コグニティブな文書デジタル化エンジン１２０は、「量」セルを、高い信頼性レベルを有する列の見出しとして判断できる。次に、コグニティブな文書デジタル化エンジン１２０は、ブロック４４０に進む。

本発明の１つの実施形態において、コグニティブな文書デジタル化エンジン１２０は、併合したセルを有するテーブル、不明確なセル境界線を有するテーブル、及びネストしたセルを有するテーブルを含む、テーブルについての３つの特別なクラスを利用する。テーブル・クラスは、セルのタイプからのデータの抽出を促進するために、テーブル内の特定のタイプのセルの存在を示すので、１つのテーブルに対して１つ又は複数のテーブル・クラスを同時に適用することができ、１つのテーブルが、各テーブル・クラスに対して処理される。それぞれのテーブル・クラス及び抽出の例、並びにそれぞれの対応する説明は、図６～図７、図８～図１０、及び図１１～図１２に提示される。

ブロック４４０において、コグニティブな文書デジタル化エンジン１２０は、自動的に、及び／又は抽出において随意的なユーザ入力を適用することにより、セル・データを抽出する。コグニティブな文書デジタル化エンジン１２０は、抽出が十分ではないとき、又は単に分類及び抽出を助けるために、抽出されたデータへのフィードバックとして、テーブル分類及びセル・データ抽出のテーブル形式意味論を案内するためのユーザ・インターフェースを提供する。次に、コグニティブな文書デジタル化エンジン１２０は、ブロック４５０に進む。

ブロック４５０において、コグニティブな文書デジタル化エンジン１２０は、候補セルから抽出されたデータを編成して、テーブルを表す１つ又は複数の多次元データ・アレイにする。例えば、１つの列は１つのアレイを形成し、テーブルは、２次元アレイとも呼ばれるマトリックスを形成することができる。データの計算可用性のために、コグニティブな文書デジタル化エンジン１２０は、ＰｙｔｈｏｎＮｕｍＰｙのような多次元アレイ処理及び計算ライブラリに対応する形式で多次元アレイを作成する。次に、コグニティブな文書デジタル化エンジン１２０は、図２のブロック２５０に進む。

図５は、本明細書に記載される１つ又は複数の実施形態による、マクロブロックを特定するために調整可能なブロック特定パラメータが適用される、例示的な文書イメージを示す。

文書５００は、種々の構成での２つのマイクロブロックを含む。第１のマイクロブロックはテキスト文字列「Ｎａｍｅ（名前）」を有し、第２のマイクロブロックはテキスト文字列「Ｋｅｖｉｎ」を有する。第１のマイクロブロックの「Ｎａｍｅ」テキストは、キーとして抽出することができ、第２のマイクロブロックの「Ｋｅｖｉｎ」テキストは、Ｎａｍｅキーの値として抽出することができ、そこから、コグニティブな文書デジタル化エンジン１２０は、マクロブロック、すなわちキー値ペア（ＫＶＰ）、Ｎａｍｅ＝「Ｋｅｖｉｎ」を識別する。

構成５１０は、２つの隣接するマイクロブロックにおける異なるフォント・サイズを示し、そこで、「Ｎａｍｅ」マイクロブロックは、「Ｋｅｖｉｎ」マイクロブロックのフォントより小さいフォントを有する。既存の文書処理アプリケーションにおいては、サイズの変更を含むフォントの差は、さもなくばＫＶＰを形成することになる２つのマイクロブロックがマクロブロック（ＫＶＰ）として識別されるのを阻害するであろう。コグニティブな文書デジタル化エンジン１２０は、フォント・サイズに関する調整可能な共線性パラメータを用いて、異なるフォント・サイズを有する２つのマイクロブロックを１つのマクロブロック（ＫＶＰ）として識別することが可能である。

構成５１５は、２つの垂直方向に隣接するマイクロブロックにおける異なるテキスト・スタイルを示し、ここで、「Ｎａｍｅ」マイクロブロックはボールド体であるが、次の行の「Ｋｅｖｉｎ」マイクロブロックは標準書体を有する。既存の文書処理アプリケーションにおいて、例えば活字書体の変更を含むテキスト・スタイルの差は、標準テキストがボールド体、イタリック体、及び下線付きであるとき、さもなくばＫＶＰを形成することになる２つのマイクロブロックがマクロブロック（ＫＶＰ）として識別されるのを阻害するであろう。コグニティブな文書デジタル化エンジン１２０は、テキスト・スタイルに関する調整可能な共線性パラメータを用いて、異なるテキスト・スタイルを有する２つのマイクロブロックを１つのマクロブロック（ＫＶＰ）として識別することが可能である。

構成５２０は、２つの隣接するマイクロブロックにおける異なる段落アラインメントを示し、ここで、「名前」マイクロブロックは左揃えにされているが、「Ｋｅｖｉｎ」マイクロブロックは右端にアラインされている。既存の文書処理アプリケーションにおいては、上に示されるような段落アラインメントの差は、さもなくばＫＶＰを形成することになる２つのマイクロブロックがマクロブロック（ＫＶＰ）として識別されるのを阻害するであろう。コグニティブな文書デジタル化エンジン１２０は、段落アラインメントに関する調整可能な共線性パラメータを用いて、異なる段落アラインメントを有する２つのマイクロブロックを１つのマクロブロック（ＫＶＰ）として識別することが可能である。

構成５２５は、２つの垂直方向に隣接するマイクロブロックにおける異なる段落アラインメントを示し、ここで、「Ｎａｍｅ」マイクロブロックは左揃えにされているが、「Ｋｅｖｉｎ」マイクロブロックは次の行の右端にアラインされている。既存の文書処理アプリケーションにおいては、上に示されるような段落アラインメントの差は、さもなくばＫＶＰを形成することになるそれぞれの行の２つのマイクロブロックがマクロブロック（ＫＶＰ）として識別されるのを阻害するであろう。コグニティブな文書デジタル化エンジン１２０は、段落アラインメントに関する調整可能な共線性パラメータを用いて、異なる段落アラインメントを有するそれぞれの行の２つのマイクロブロックを１つのマクロブロック（ＫＶＰ）として識別することが可能である。

構成５３０は、句読点で分離される２つの隣接するマイクロブロックを示し、そこで、「：」すなわちコロンが、「Ｎａｍｅ」マイクロブロックと「Ｋｅｖｉｎ」マイクロブロックとの間に配置される。既存の文書処理アプリケーションにおいては、上に示されるような分離する句読点は、さもなくばＫＶＰを形成することになる２つのマイクロブロックがマクロブロック（ＫＶＰ）として識別されるのを阻害することがある。コグニティブな文書デジタル化エンジン１２０は、句読点の分離に関する調整可能な共線性パラメータを用いて、句読点で分離される２つのマイクロブロックを１つのマクロブロック（ＫＶＰ）として識別することが可能である。

構成５３５は、句読点で分離される２つの垂直方向に隣接するブロックを示し、そこで、「：」すなわちコロンが、「Ｎａｍｅ」マイクロブロックと「Ｋｅｖｉｎ」マイクロブロックとの間に配置される。既存の文書処理アプリケーションにおいては、上に示されるような分離する句読点は、さもなくばＫＶＰを形成することになるそれぞれの行の２つのマイクロブロックがマクロブロック（ＫＶＰ）として識別されるのを阻害することがある。コグニティブな文書デジタル化エンジン１２０は、句読点分離に関する調整可能な共線性パラメータを用いて、句読点で分離されるそれぞれの行の２つのマイクロブロックを１つのマクロブロック（ＫＶＰ）として識別することが可能である。

構成５４０は、広いスペースで分離される２つの隣接するマイクロブロックを示し、そこで、「Ｎａｍｅ」マイクロブロックと「Ｋｅｖｉｎ」マイクロブロックとの間の広いスペースは通常、既存の文書処理アプリケーションにおいては、２つのマイクロブロックがマクロブロック（ＫＶＰ）として識別されるのを阻害する。コグニティブな文書デジタル化エンジン１２０は、２つのマイクロブロックのテキストを意味的に分析すること、及び「Ｋｅｖｉｎ」が「Ｎａｍｅ」キーの値についての適切なデータ・タイプのものであるとき、キー・オントロジ・データに基づいてキーと値とをマッチングすることにより、こうした広いスペースで分離される２つのマイクロブロックを１つのマクロブロック（ＫＶＰ）として識別することが可能である。

構成５４５は、広いスペースで分離される２つの垂直方向に隣接するマイクロブロックを示し、ここで、「Ｎａｍｅ」マイクロブロックと次の行の「Ｋｅｖｉｎ」マイクロブロックとの間の広いスペースは通常、既存の文書処理アプリケーションにおいては、２つのマイクロブロックがマクロブロック（ＫＶＰ）として識別されるのを阻害する。コグニティブな文書デジタル化エンジン１２０は、２つのマイクロブロックのテキストを意味的に分析すること、及び「Ｋｅｖｉｎ」が「Ｎａｍｅ」キーの値についての適切なデータ・タイプのものであるとき、キー・オントロジ・データに基づいてキーと値とをマッチングすることにより、こうした広いスペースで分離されるそれぞれの行の２つのマイクロブロックを１つのマクロブロック（ＫＶＰ）として識別することが可能である。

図６は、本明細書に記載される１つ又は複数の実施形態による、例示的なテーブル形式オブジェクト・クラスタ５５０を示す。

図４のブロック４３０の説明に既述されるように、データを抽出するための特別な考慮事項を必要とするテーブル・クラスの１つは、不明確なセル境界線を有するテーブルのクラスである。テーブル形式オブジェクト・クラスタ５５０は、不明確なセル境界線を有するテーブルとして分類される例である。人間の読み手は、テーブル形式オブジェクト・クラスタ５５０をテーブルとして容易に認識するが、既存の文書処理アプリケーションは、特に層状ボックス・セクション５６０内に示される不明確なセル境界線のために、テーブル形式オブジェクト・クラスタ５５０をテーブルとして識別することができない、及び／又はテーブル形式オブジェクト・クラスタ５５０からデータを正確に抽出することができない。

コグニティブな文書デジタル化エンジン１２０は、テーブル形式オブジェクト・クラスタ５５０から３つの列を識別し、ここで、第１の列は、層状ボックス・セクション５６０の左側であり、層状ボックス・セクション５６０は第２の列であり、第３の列は層状ボックス・セクション５６０の右側である。第１の列は７つの行を有し、層状ボックス・セクション５６０の第２の列は８つの行を有し、それぞれが８つの前方ボックスが背景ストリップ上にアラインされている。第３の列は、第１の列のように７つの行を有する。従って、テーブル形式オブジェクト・クラスタ５５０は、３×８のマトリックスのようなテーブルを形成することができる。テーブル形式オブジェクト・クラスタ５５０内の点線は、テーブル内の２つの隣接する行の間のそれぞれの境界線を示す。

図７は、本明細書に記載される１つ又は複数の実施形態による、コグニティブな文書デジタル化エンジン１２０により作成される、図６のテーブル形式オブジェクト・クラスタ５５０に対応するテーブル５７０を示す。

コグニティブな文書デジタル化エンジン１２０は、行５７２、５７３、５７４、５７５、５７６、５７７、５７８及び５７９内に示されるような、８つの行を全ての３つの列内に当てはめる。しかしながら、一番上の行５７１の列見出しがテーブル５７０に付加されているが、図６のテーブル形式オブジェクト・クラスタ５５０に対するテキスト情報はないので、テキストは記入されていない。

図８は、本明細書に記載される１つ又は複数の実施形態による、別の例示的なテーブル形式オブジェクト・クラスタ５８０を示し、図９は、本明細書に記載される１つ又は複数の実施形態による、図８の例示的なテーブル形式オブジェクト・クラスタ５８０から識別されるマイクロブロック及びマクロブロックを示す。

テーブル形式オブジェクト・クラスタ５８０は、通常は種々の文書内に現れるようなテーブルの視覚イメージを表す。

図９において、位置関係を分析し、テーブル形式オブジェクト・クラスタ５８０内のオブジェクトの共線性を判断する際にコグニティブな文書デジタル化エンジン１２０により認識されるように、テーブル形式オブジェクト・クラスタ５８０内の全てのオブジェクトはそれぞれ、テキストのないボックスとして標識付けされる。コグニティブな文書デジタル化エンジン１２０は、マクロブロック間の絶対距離、それぞれのマクロブロック内のオブジェクト間の相対距離、意味的補間、及び相対スタイルを含む、列定義属性を発見的に組み合わせることにより、３つの列５９１、５９３、５９７を識別する。コグニティブな文書デジタル化エンジン１２０は、列の間に何らかの重複が存在し得る場合でも、列内の共線性を判断することができる。テーブル形式オブジェクト・クラスタ５８０の列定義属性の処理において、コグニティブな文書デジタル化エンジン１２０は、オブジェクト間の距離を測定し、平均値、中央値、モード幅並びに変位値及び関連した信頼区間及び観察のための頻度数を計算する。

テーブル形式オブジェクト・クラスタ５８０の第１の列５９１は、列見出しを除いて５つの行を有する。第２の行５９３は、９つのデータ行を有し、第３の行５９７は、１０個のデータ行を有する。従って、テーブル形式オブジェクト・クラスタ５８０のデータ・セルは、テーブルを３×１０のマトリックスとして形成することができる。テーブル形式オブジェクト・クラスタ５８０内の点線は、データ・セルの間のそれぞれの共線性を示す。

第１の列５９１において、コグニティブな文書デジタル化エンジン１２０は、テキストを背景イメージから分離し、テキストの位置を分析する。コグニティブな文書デジタル化エンジン１２０は、主として、両方の列の行の間の位置関係からの拡張した共線性に基づいて、第１の列内の５つの行を第３の列５９７の１０個の行に当てはめる。また、コグニティブな文書デジタル化エンジン１２０は同様に、主として、列にわたるマイクロブロックの水平方向共線性に基づいて、第２の列５９３の９つの行を第３の列５９７の１０個の行に当てはめる。第３の列５９７の列見出し位置に基づいて、イメージ列５９５は、第３の列５９７に対する余分な列として識別され得る。

テーブル形式オブジェクト・クラスタ５８０は、併合したセルを有するテーブル・クラスとして分類された例である。コグニティブな文書デジタル化エンジン１２０は、下流併合アルゴリズムにより、列５９１、５９３、５９５、５９７にわたる行をアラインし、一番上のセルから最後の利用可能なセルに至るまで各列内の行を併合する。

図１０は、本明細書に記載される１つ又は複数の実施形態による、コグニティブな文書デジタル化エンジン１２０により作成される、図８の例示的なテーブル形式オブジェクト・クラスタ５８０に対応するテーブル６００を示す。

「原油（Crude Oils）」見出しの下の第１の列において、適格なマトリックスの計算の便宜のために、テーブル内のデータ・セルが各列内に同じ行数を有するようにするために、コグニティブな文書デジタル化エンジン１２０は、行６０２及び６０３、行６０４、６０５及び６０６、行６０７及び６０８、並びに行６０９及び６１０に示されるように、データを全ての併合したセル内に複製する。「粘度（センチポアズ）」見出しの下の第２の列において、コグニティブな文書デジタル化エンジン１２０は、行６０４及び６０５に示されるように、データを併合したセル内に同様に複製する。

コグニティブな文書デジタル化エンジン１２０は、各マイクロブロックについての図９の列５９５内のイメージのような非テキスト・コンテンツを抽出し、ファイル・システム内に格納し、各イメージを参照するためのリンクをテーブル６００に入れる。コグニティブな文書デジタル化エンジン１２０は、イメージを、テーブル６００内のイメージに対するそれぞれの分類テキストと置き換える。

図１１は、本明細書に記載される１つ又は複数の実施形態による、さらに別の例示的なテーブル形式オブジェクト・クラスタ６２０の部分を示し、図１２は、本明細書に記載される１つ又は複数の実施形態による、コグニティブな文書デジタル化エンジン１２０により作成される、図１１のテーブル形式オブジェクト・クラスタ６２０内のセル６２３に対応するネストしたテーブル６３０を示す。

コグニティブな文書デジタル化エンジン１２０は、テーブル形式オブジェクト・クラスタ６２０を、セルが別のテーブルであることを示す、ネストしたセルを有するテーブル・クラスとして分類する。ネストしたテーブルは、請求書及び他の形態の文書のために一般的に使用され、ネストしたテーブルから計算データを正確に自動的に抽出する有用性が望ましい。コグニティブな文書デジタル化エンジン１２０は、「説明」列のセル内の第２のテーブル形式オブジェクト・クラスタ６２５を抽出する。コグニティブな文書デジタル化エンジン１２０は、第２のテーブル形式オブジェクト・クラスタ６２５に基づいて図１２の内部テーブル６３０を作成し、内部テーブル６３０はデータ・セル６２３からの「Ｊ３３４０９ＨｙｄｒｏｏｆＣＯ２ｃｙｌｉｎｄｅｒ」テキストと関連付けられているので、テーブル形式オブジェクト・クラスタ６２０に基づいて外部テーブルのデータ・セル６２３から内部テーブル６３０をリンクする。従って、コグニティブな文書デジタル化エンジン１２０は、外部テーブルと内部テーブル６３０との間の意味関係を維持する。

コグニティブな文書デジタル化エンジン１２０は、第２のテーブル形式オブジェクト・クラスタ６２５から３つの列を識別する。データ「１」及びテキスト「＃ＴＦＩＲ．ＣＯ２．．．．」は、「ｘ」記号により分離され、データ「１３７．５０」が後に続く。意味分析及び／又はキー・オントロジ・データに基づいて、コグニティブな文書デジタル化エンジン１２０は、「ｘ」は通常は乗算を示すものであり、「１３７．５０」は、金額データ・タイプのものであるので、データ「１」及びテキスト「＃ＴＦＩＲ．ＣＯ２．．．．」を分離可能なデータとして別個の列内に抽出する。

コグニティブな文書デジタル化エンジン１２０は、第２のテーブル形式オブジェクト・クラスタ６２５から３×３のデータ・マトリックスを識別し、各列内のマイクロブロック、一番上の行６３１の列見出し、及び３つの行６３３、６３５、６３７を識別することにより、第２のテーブル６３０を構築する。

図１３～図１５は、本明細書に記載される１つ又は複数の態様による、コンピュータ・システム及びクラウド・コンピューティングを含むコンピューティングの種々の態様を示す。

本開示はクラウド・コンピューティングについての詳細な説明を含むが、本明細書に記載される教示の実装は、クラウド・コンピューティング環境に限定されないことを理解されたい。むしろ、本発明の実施形態は、現在既知の又は後で開発される他のいずれかのタイプのコンピューティング環境と共に実施することができる。

クラウド・コンピューティングは、最小限の管理労力又はサービス・プロバイダとの対話で迅速にプロビジョニング及び解放することができる構成可能なコンピューティング・リソース（例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想マシン、及びサービス）の共有プールへの、便利なオンデマンドのネットワーク・アクセスを可能にするためのサービス配信のモデルである。このクラウド・モデルは、少なくとも５つの特徴、少なくとも３つのサービス・モデル、及び少なくとも４つのデプロイメント・モデルを含むことができる。

特徴は、以下の通りである。

オンデマンド・セルフサービス：クラウド・コンシューマは、必要に応じて、サーバ時間及びネットワーク・ストレージ等のコンピューティング機能を、人間がサービスのプロバイダと対話する必要なく自動的に、一方的にプロビジョニングすることができる。

広範なネットワーク・アクセス：機能は、ネットワーク上で利用可能であり、異種のシン又はシック・クライアント・プラットフォーム（例えば、携帯電話、ラップトップ、及びＰＤＡ）による使用を促進する標準的な機構を通じてアクセスされる。

リソース・プール化：プロバイダのコンピューティング・リソースは、マルチ・テナント・モデルを用いて、異なる物理及び仮想リソースを要求に応じて動的に割り当て及び再割り当てすることにより、複数のコンシューマにサービスを提供するためにプールされる。コンシューマは、一般に、提供されるリソースの正確な位置についての制御又は知識を持たないという点で、位置とは独立しているといえるが、より抽象化レベルの高い位置（例えば、国、州、又はデータセンタ）を特定できる場合がある。

迅速な弾力性：機能は、迅速かつ弾力的に、場合によっては自動的に、プロビジョニングして素早くスケール・アウトし、迅速にリリースして素早くスケール・インさせることができる。コンシューマにとって、プロビジョニングに利用可能なこれらの機能は、多くの場合、無制限であり、いつでもどんな量でも購入できるように見える。

計測されるサービス：クラウド・システムは、サービスのタイプ（例えば、ストレージ、処理、帯域幅、及びアクティブなユーザ・アカウント）に適した何らかの抽象化レベルでの計量機能を用いることによって、リソースの使用を自動的に制御及び最適化する。リソース使用を監視し、制御し、報告し、利用されるサービスのプロバイダとコンシューマの両方に対して透明性をもたらすことができる。

サービス・モデルは以下の通りである。

ＳｏｆｔｗａｒｅａｓａＳｅｒｖｉｃｅ（ＳａａＳ）：クラウド・インフラストラクチャ上で動作しているプロバイダのアプリケーションを使用するために、コンシューマに提供される機能である。これらのアプリケーションは、ウェブ・ブラウザ（例えば、ウェブ・ベースの電子メール）などのシン・クライアント・インターフェースを通じて、種々のクライアント・デバイスからアクセス可能である。コンシューマは、限定されたユーザ固有のアプリケーション構成設定の考え得る例外として、ネットワーク、サーバ、オペレーティング・システム、ストレージ、又は個々のアプリケーション機能をも含めて、基礎をなすクラウド・インフラストラクチャを管理又は制御しない。

ＰｌａｔｆｏｒｍａｓａＳｅｒｖｉｃｅ（ＰａａＳ）：プロバイダによってサポートされるプログラミング言語及びツールを用いて生成された、コンシューマが生成した又は取得したアプリケーションを、クラウド・インフラストラクチャ上にデプロイするために、コンシューマに提供される機能である。コンシューマは、ネットワーク、サーバ、オペレーティング・システム、又はストレージなどの基礎をなすクラウド・インフラストラクチャを管理又は制御しないが、配備されたアプリケーション、及び場合によってはアプリケーション・ホスティング環境構成に対して制御を有する。

ＩｎｆｒａｓｔｒｕｃｔｕｒｅａｓａＳｅｒｖｉｃｅ（ＩａａＳ）：コンシューマが、オペレーティング・システム及びアプリケーションを含み得る任意のソフトウェアを配備及び動作させることができる、処理、ストレージ、ネットワーク、及び他の基本的なコンピューティング・リソースをプロビジョニンングするために、コンシューマに提供される機能である。コンシューマは、基礎をなすクラウド・インフラストラクチャを管理又は制御しないが、オペレーティング・システム、ストレージ、配備されたアプリケーションに対する制御、及び場合によってはネットワーク・コンポーネント（例えば、ホストのファイアウォール）選択の限定された制御を有する。

デプロイメント・モデルは以下の通りである。

プライベート・クラウド：クラウド・インフラストラクチャは、ある組織のためだけに運営される。このクラウド・インフラストラクチャは、その組織又は第三者によって管理することができ、オンプレミス又はオフプレミスに存在することができる。

コミュニティ・クラウド：クラウド・インフラストラクチャは、幾つかの組織によって共有され、共通の関心事項（例えば、任務、セキュリティ要件、ポリシー、及びコンプライアンス上の考慮事項）を有する特定のコミュニティをサポートする。クラウド・インフラストラクチャは、その組織又は第三者によって管理することができ、オンプレミス又はオフプレミスに存在することができる。

パブリック・クラウド：クラウド・インフラストラクチャは、一般公衆又は大規模な業界グループに利用可能であり、クラウド・サービスを販売する組織によって所有される。

ハイブリッド・クラウド：クラウド・インフラストラクチャは、固有のエンティティのままであるが、データ及びアプリケーションの移行性を可能にする標準化された又は専用の技術（例えば、クラウド間の負荷分散のためのクラウド・バースティング）によって結び付けられる２つ以上のクラウド（プライベート、コミュニティ、又はパブリック）の混成物である。

クラウド・コンピューティング環境は、ステートレス性、低結合性、モジュール性、及びセマンティック相互運用性に焦点を置くことを指向するサービスである。クラウド・コンピューティングの中心は、相互接続されたノードのネットワークを含むインフラストラクチャである。

ここで図１３を参照すると、コンピュータ・システム／クラウド・コンピューティング・ノードの例の概略が示される。クラウド・コンピューティング・ノード１０は、適切なクラウド・コンピューティング・ノードの一例にすぎず、本明細書で記載される本発明の実施形態の使用範囲又は機能に関するいずれかの限定を示唆することを意図していない。それにもかかわらず、クラウド・コンピューティング・ノード１０は、本明細書で上述される機能のいずれも実装及び／又は実行することができる。

クラウド・コンピューティング・ノード１０において、多数の他の汎用又は専用コンピューティング・システム環境又は構成で動作可能であるコンピュータ・システム１２がある。コンピュータ・システム１２と共に使用するのに好適であり得る周知のコンピューティング・システム、環境、及び／又は構成の例としては、これらに限定されるものではないが、パーソナル・コンピュータ・システム、サーバ・コンピュータ・システム、シン・クライアント、シック・クライアント、手持ち式又はラップトップ型デバイス、マルチプロセッサ・システム、マイクロプロセッサ・ベースのシステム、セット・トップ・ボックス、プログラム可能民生電子機器、ネットワークＰＣ、ミニコンピュータ・システム、メインフレーム・コンピュータ・システム、及び、上述のシステム若しくはデバイスのいずれかを含む分散型クラウド・コンピューティング環境等が含まれる。

コンピュータ・システム１２は、コンピュータ・システムによって実行される、プログラム・プロセスなどのコンピュータ・システム実行可能命令の一般的な文脈で説明することができる。一般に、プログラム・プロセスは、特定のタスクを実行する又は特定の抽象データ型を実装する、ルーチン、プログラム、オブジェクト、コンポーネント、論理、データ構造などを含むことができる。コンピュータ・システム１２は、通信ネットワークを通じてリンクされた遠隔処理デバイスによってタスクが実行される分散型クラウド・コンピューティング環境で実施することができる。分散型クラウド・コンピューティング環境において、プログラム・プロセスは、メモリ・ストレージ・デバイスを含む、ローカル及び遠隔両方のコンピュータ・システム・ストレージ媒体に配置することができる。

図１３に示されるように、クラウド・コンピューティング・ノード１０におけるコンピュコンピュータ・システム１２が、汎用コンピューティング・デバイスの形で示される。コンピュータ・システム１２のコンポーネントは、これらに限定されるものではないが、１つ又は複数のプロセッサ１６、システム・メモリ２８、及びシステム・メモリ２８を含む種々のシステム・コンポーネントをプロセッサ１６に結合するバス１８を含むことができる。

バス１８は、メモリ・バス又はメモリ・コントローラ、周辺バス、アクセラレーテッド・グラフィックス・ポート、及び種々のバス・アーキテクチャのいずれかを用いるプロセッサ又はローカル・バスを含む、幾つかのタイプのバス構造のうちのいずれかの１つ又は複数を表す。限定ではなく例としては、このようなアーキテクチャは、業界標準アーキテクチャ（Industry Standard Architecture、ＩＳＡ）バス、マイクロ・チャネル・アーキテクチャ（Micro Channel Architecture、ＭＣＡ）バス、ＥｎｈａｎｃｅｄＩＳＡ（ＥＩＳＡ）バス、ＶｉｄｅｏＥｌｅｃｔｒｏｎｉｃｓＳｔａｎｄａｒｄｓＡｓｓｏｃｉａｔｉｏｎ（ＶＥＳＡ）ローカル・バス、及びＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ（ＰＣＩ）バスを含む。

コンピュータ・システム１２は、典型的には、種々のコンピュータ・システム可読媒体を含む。このような媒体は、コンピュータ・システム１２によりアクセス可能ないずれかの利用可能媒体とすることができ、揮発性媒体及び不揮発性媒体の両方と、取り外し可能媒体及び取り外し不能媒体の両方とを含む。

システム・メモリ２８は、ランダム・アクセス・メモリ（ＲＡＭ）３０及び／又はキャッシュ・メモリ３２など、揮発性メモリの形のコンピュータ・システム可読媒体を含むことができる。コンピュータ・システム１２は、他の取り外し可能／取り外し不能、揮発性／不揮発性のコンピュータ・システム・ストレージ媒体をさらに含むことができる。単なる例として、取り外し不能の不揮発性磁気媒体（図示されておらず、典型的には「ハード・ドライブ」と呼ばれる）との間の読み出し及び書き込みのために、ストレージ・システム３４を設けることができる。図示されていないが、取り外し可能な不揮発性磁気ディスク（例えば、「フロッピー・ディスク」）との間の読み出し及び書き込みのための磁気ディスク・ドライブと、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ又は他の光媒体などの取り外し可能な不揮発性光ディスクとの間の読み出し及び書き込みのための光ディスク・ドライブとを設けることができる。このような例においては、それぞれを、１つ又は複数のデータ媒体インターフェースによってバス１８に接続することができる。以下でさらに示され説明されるように、メモリ２８は、本発明の実施形態の機能を実行するように構成されたプログラム・プロセスのセット（例えば、少なくとも１つ）を有する少なくとも１つのプログラム製品を含むことができる。

限定ではなく例として、プログラム・プロセス４２のセット（少なくとも１つ）を有する１つ又は複数のプログラム４０、並びにオペレーティング・システム、１つ又は複数のアプリケーション・プログラム、他のプログラム・プロセス、及びプログラム・データをメモリ２８内に格納することができる。オペレーティング・システムの各々、１つ又は複数のアプリケーション・プログラム、他のプログラム・プロセス、及びプログラム・データ又はその何らかの組み合わせは、図１のコグニティブな文書デジタル化エンジン１２０の実装を含むことができる。コグニティブな文書デジタル化エンジン１２０におけるようなプログラム・プロセス４２は、一般的に、本明細書で説明される本発明の実施形態の機能及び／又は方法を実行する。

コンピュータ・システム１２は、キーボード、ポインティング・デバイス、ディスプレイ２４等のような１つ又は複数の外部デバイス１４、ユーザがコンピュータ・システム１２と対話することを可能にする１つ又は複数のデバイス、及び／又はコンピュータ・システム１２が１つ又は複数の他のコンピューティング・デバイスと通信することを可能にするいずれかのデバイス（例えば、ネットワーク・カード、モデム等）と通信することもできる。このような通信は、入力／出力（Ｉ／Ｏ）インターフェース２２を介して行うことができる。さらに、コンピュータ・システム１２は、ネットワーク・アダプタ２０を介して、ローカル・エリア・ネットワーク（ＬＡＮ）、汎用広域ネットワーク（ＷＡＮ）、及び／又はパブリック・ネットワーク（例えば、インターネット）などの１つ又は複数のネットワークと通信することもできる。示されるように、ネットワーク・アダプタ２０は、バス１８を介して、コンピュータ・システム１２の他のコンポーネントと通信する。図示されないが、コンピュータ・システム１２と共に他のハードウェア及び／又はソフトウェア・コンポーネントを使用できることを理解されたい。例としては、これらに限定されるものではないが、マイクロコード、デバイス・ドライバ、冗長プロセッサ、外部のディスク・ドライブ・アレイ、ＲＡＩＤシステム、テープ・ドライブ、及びデータ・アーカイブ・ストレージ・システム等が含まれる。

ここで図１４を参照すると、例示的クラウド・コンピューティング環境５０が示される。示されるように、クラウド・コンピューティング環境５０は、例えば携帯情報端末（ＰＤＡ）又は携帯電話５４Ａ、デスクトップ・コンピュータ５４Ｂ、ラップトップ・コンピュータ５４Ｃ、及び／又は自動車コンピュータ・システム５４Ｎなどといった、クラウド・コンシューマによって用いられるローカル・コンピューティング・デバイスと通信できる１つ又は複数のクラウド・コンピューティング・ノード１０を含む。ノード１０は、互いに通信することができる。これらのノードは、上述のようなプライベート・クラウド、コミュニティ・クラウド、パブリック・クラウド、若しくはハイブリッド・クラウド、又はこれらの組み合わせなど、１つ又は複数のネットワークにおいて物理的又は仮想的にグループ化することができる（図示せず）。これにより、クラウド・コンピューティング環境５０が、クラウド・コンシューマがローカル・コンピューティング・デバイス上にリソースを保持する必要のないサービスとして、インフラストラクチャ、プラットフォーム、及び／又はソフトウェアを提供することが可能になる。図１４に示されるコンピューティング・デバイス５４Ａ～Ｎのタイプは単に例示であることを意図し、コンピューティング・ノード１０及びクラウド・コンピューティング環境５０は、いずれのタイプのネットワーク及び／又はネットワーク・アドレス指定可能な接続上でも（例えば、ウェブ・ブラウザを用いて）、いずれのタイプのコンピュータ化されたデバイスとも通信できることを理解されたい。

ここで図１５を参照すると、クラウド・コンピューティング環境５０（図１４）によって提供される機能抽象化層のセットが示される。図１５に示されるコンポーネント、層、及び機能は単に例示であることを意図し、本発明の実施形態はそれらに限定されないことを予め理解されたい。図示されるように、以下の層及び対応する機能が提供される。

ハードウェア及びソフトウェア層６０は、ハードウェア及びソフトウェア・コンポーネントを含む。ハードウェア・コンポーネントの例として、メインフレーム６１と、ＲＩＳＣ（Reduced Instruction Set Computer（縮小命令セット・コンピュータ））アーキテクチャ・ベースのサーバ６２と、サーバ６３と、ブレード・サーバ６４と、ストレージ・デバイス６５と、ネットワーク及びネットワーキング・コンポーネント６６とが含まれる。幾つかの実施形態において、ソフトウェア・コンポーネントは、ネットワーク・アプリケーション・サーバ・ソフトウェア６７及びデータベース・ソフトウェア６８を含む。

仮想化層７０は、抽象化層を提供し、この層により、仮想エンティティの以下の例、すなわち、仮想サーバ７１、仮想ストレージ７２、仮想プライベート・ネットワークを含む仮想ネットワーク７３、仮想アプリケーション及びオペレーティング・システム７４、並びに仮想クライアント７５を提供することができる。

一例においては、管理層８０は、以下で説明される機能を提供することができる。リソース・プロビジョニング８１は、クラウド・コンピューティング環境内でタスクを実行するために利用されるコンピューティング・リソース及び他のリソースの動的な調達を提供する。計量及び価格決定８２は、クラウド・コンピューティング環境内でリソースが利用される際のコスト追跡と、これらのリソースの消費に対する課金又は請求とを提供する。一例においては、これらのリソースは、アプリケーション・ソフトウェア・ライセンスを含むことができる。セキュリティは、クラウド・コンシューマ及びタスクに対する識別情報の検証と、データ及び他のリソースに対する保護とを提供する。ユーザ・ポータル８３は、コンシューマ及びシステム管理者のために、クラウド・コンピューティング環境へのアクセスを提供する。サービス・レベル管理８４は、要求されるサービス・レベルが満たされるように、クラウド・コンピューティング・リソースの割り当て及び管理を提供する。サービス・レベル・アグリーメント（Service Level Agreement、ＳＬＡ）の計画及び履行８５は、ＳＬＡに従って将来の要件が予測されるクラウド・コンピューティング・リソースの事前配置及び調達を提供する。

ワークロード層９０は、クラウド・コンピューティング環境を利用することができる機能の例を提供する。この層から提供することができるワークロード及び機能の例として、マッピング及びナビゲーション９１、ソフトウェア開発及びライフサイクル管理９２、仮想教室教育配信９３、データ分析処理９４、トランザクション処理９５、及び本明細書で説明されるような、コグニティブな文書デジタル化エンジンにより提供される文書デジタル化サービスのための処理コンポーネント９６が挙げられる。

本発明は、統合のいずれかの可能な技術的詳細レベルにおける、システム、方法、及び／又はコンピュータ・プログラム製品とすることができる。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令をその上に有するコンピュータ可読ストレージ媒体（単数又は複数）を含むことができる。

コンピュータ可読ストレージ媒体は、命令実行デバイスにより使用される命令を保持及び格納できる有形デバイスとすることができる。コンピュータ可読ストレージ媒体は、例えば、これらに限定されるものではないが、電子記憶装置、磁気記憶装置、光学記憶装置、電磁気記憶装置、半導体記憶装置、又は上記のいずれかの適切な組み合わせとすることができる。コンピュータ可読ストレージ媒体のより具体的な例の非網羅的なリストとして、以下のもの：すなわち、ポータブル・コンピュータ・ディスケット、ハードディスク、ランダム・アクセス・メモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、消去可能プログラム可能読み出し専用メモリ（ＥＰＲＯＭ又はフラッシュ・メモリ）、スタティック・ランダム・アクセス・メモリ（ＳＲＡＭ）、ポータブル・コンパクト・ディスク読み出し専用メモリ（ＣＤ－ＲＯＭ）、デジタル多用途ディスク（ＤＶＤ）、メモリ・スティック、パンチカード若しくは命令がそこに記録された溝内の隆起構造のような機械的にエンコードされたデバイス、及び上記のいずれかの適切な組み合わせが挙げられる。本明細書で使用される場合、コンピュータ可読ストレージ媒体は、電波、又は他の自由に伝搬する電磁波、導波管若しくは他の伝送媒体を通じて伝搬する電磁波（例えば、光ファイバ・ケーブルを通る光パルス）、又はワイヤを通って送られる電気信号などの、一時的信号自体として解釈されない。

本明細書で説明されるコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体からそれぞれのコンピューティング／処理デバイスに、又は、例えばインターネット、ローカル・エリア・ネットワーク、広域ネットワーク、及び／又は無線ネットワークなどのネットワークを介して外部コンピュータ又は外部ストレージ・デバイスにダウンロードすることができる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、及び／又はエッジ・サーバを含むことができる。各コンピューティング／処理デバイスにおけるネットワーク・アダプタ・カード又はネットワーク・インターフェースは、ネットワークからコンピュータ可読プログラム命令を受け取り、コンピュータ可読プログラム命令を転送して、それぞれのコンピューティング／処理デバイス内のコンピュータ可読ストレージ媒体に格納する。

本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ（ＩＳＡ）命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路のための構成データ、又は、Ｓｍａｌｌｔａｌｋ、Ｃ＋＋などのオブジェクト指向プログラミング言語、及び、「Ｃ」プログラミング言語若しくは類似のプログラミング言語などの従来の手続き型プログラミング言語を含む１つ又は複数のプログラミング言語の任意の組み合わせで記述されるソース・コード又はオブジェクト・コードとすることができる。コンピュータ可読プログラム命令は、完全にユーザのコンピュータ上で実行される場合もあり、一部がユーザのコンピュータ上で、独立型ソフトウェア・パッケージとして実行される場合もあり、一部がユーザのコンピュータ上で実行され、一部が遠隔コンピュータ上で実行される場合もあり、又は完全に遠隔コンピュータ若しくはサーバ上で実行される場合もある。最後のシナリオにおいて、遠隔コンピュータは、ローカル・エリア・ネットワーク（ＬＡＮ）若しくは広域ネットワーク（ＷＡＮ）を含むいずれかのタイプのネットワークを通じてユーザのコンピュータに接続される場合もあり、又は外部コンピュータへの接続がなされる場合もある（例えば、インターネットサービスプロバイダを用いたインターネットを通じて）。幾つかの実施形態において、例えば、プログラム可能論理回路、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、又はプログラム可能論理アレイ（ＰＬＡ）を含む電子回路は、本発明の態様を実施するために、コンピュータ可読プログラム命令の状態情報を利用することによって、コンピュータ可読プログラム命令を実行して、電子回路を個別化することができる。

本発明の態様は、本発明の実施形態による方法、装置（システム）及びコンピュータ・プログラム製品のフローチャート図及び／又はブロック図を参照して説明される。フローチャート図及び／又はブロック図の各ブロック、並びにフローチャート図及び／又はブロック図内のブロックの組み合わせは、コンピュータ可読プログラム命令によって実装できることが理解されるであろう。

これらのコンピュータ可読プログラム命令を、汎用コンピュータ、専用コンピュータ、又は他のプログラム可能データ処理装置のプロセッサに与えて機械を製造し、それにより、コンピュータ又は他のプログラム可能データ処理装置のプロセッサによって実行される命令が、フローチャート及び／又はブロック図の１つ又は複数のブロック内で指定された機能／動作を実施するための手段を作り出すようにすることができる。これらのコンピュータ・プログラム命令を、コンピュータ、他のプログラム可能データ処理装置、及び／又は他のデバイスを特定の方式で機能させるように指示することができるコンピュータ可読媒体内に格納し、それにより、そのコンピュータ可読媒体内に格納された命令が、フローチャート及び／又はブロック図の１つ又は複数のブロックにおいて指定された機能／動作の態様を実施する命令を含む製品を含むようにすることもできる。

コンピュータ・プログラム命令を、コンピュータ、他のプログラム可能データ処理装置、又は他のデバイス上にロードして、一連の動作ステップをコンピュータ、他のプログラム可能データ処理装置、又は他のデバイス上で行わせてコンピュータ実施のプロセスを生産し、それにより、コンピュータ又は他のプログラム可能装置上で実行される命令が、フローチャート及び／又はブロック図の１つ又は複数のブロックにおいて指定された機能／動作を実行するためのプロセスを提供するようにすることもできる。

図面内のフローチャート及びブロック図は、本発明の様々な実施形態による、システム、方法、及びコンピュータ・プログラム製品の可能な実装の、アーキテクチャ、機能及び動作を示す。この点に関して、フローチャート内の各ブロックは、指定された論理機能を実装するための１つ又は複数の実行可能命令を含む、モジュール、セグメント、又はコードの一部を表すことができる。幾つかの代替的な実装において、ブロック内に示される機能は、図に示される順序とは異なる順序で生じることがある。例えば、連続して示される２つのブロックは、関与する機能に応じて、実際には実質的に同時に実行されることもあり、又はこれらのブロックはときとして逆順で実行されることもある。ブロック図及び／又はフローチャート図の各ブロック、及びブロック図及び／又はフローチャート図内のブロックの組み合わせは、指定された機能又は動作を実行する、又は専用のハードウェアとコンピュータ命令との組み合わせを実行する、専用ハードウェア・ベースのシステムによって実装できることにも留意されたい。

本明細書で用いられる用語は、特定の実施形態を説明することのみを目的とし、本発明を限定することを意図したものではない。本明細書内で用いられる場合、単数形「１つの（a）」、「１つの（an）」及び「その（the）」は、文脈がそうでないことを明確に示していない限り、複数形も含むことを意図している。さらに、用語「含む（comprise）」（及び、compriseの任意の形態、例えば「comprises」及び「comprising」）、「有する（have）」（及び、haveの任意の形態、例えば「has」及び「having」）、「含む（include）」（及び、includeの任意の形態、例えば「includes」及び「including」）、並びに「含有する（contain）」（及び、containの任意の形態、例えば「contains」及び「containing」）は、変更可能な連結動詞（open-ended linking verbs）であることが理解されるであろう。その結果、１つ又は複数のステップ又は要素を「含む（comprise）」、「有する（have）」、「含む（include）」、又は「含有する（contain）」方法又はデバイスは、１つ又は複数のステップ又は要素を保有するが、それらの１つ又は複数のステップ又は要素のみを保有することに限定されるものではない。同様に、１つ又は複数の特徴を「含む（comprise）」、「有する（have）」、「含む（include）」、又は「含有する（contain）」、方法のステップ又はデバイスの要素は、それらの１つ又は複数の特徴を保有するが、それらの１つ又は複数の特徴のみを保有することに限定されるものではない。本明細書で「～に基づく（based on）」という用語の形態は、要素が部分的に基づく場合の関係、並びに要素が全体的に基づく場合の関係を含む。特定の数の要素を有するものとして記載される方法、製品及びシステムは、特定の数より少ない又はそれより多い要素で実施されることもある。さらに、特定の方法で構成されたデバイス又は構造は、少なくともその方法で構成されるが、列挙されていない方法で構成されることもある。

以下の特許請求の範囲に存在する場合、「手段又はステップと機能との組合せ（ミーンズ又はステップ・プラス・ファンクション）」要素の対応する構造、材料、動作及び均等物は、明確に特許請求された他の特許請求される要素と共に機能を実行するための任意の構造、材料、又は動作を含むことを意図したものである。本明細書に記載される説明は、例証及び説明のためだけに提示されたものであり、網羅的であること又は本発明を開示した形態に限定することを意図したものではない。当業者には、本開示の範囲及び趣旨から逸脱することなく、多くの修正及び変形が明らかであろう。実施形態は、本明細書に記載される１つ又は複数の態様の原理、実際の用途を最も良く説明するため、及び考えられる特定の使用に適するものとして種々の変形を有する種々の実施形態において、当業者が、本明細書に説明される１つ又は複数の態様を理解するのを可能にするために、選択され説明された。

（付記）
以下に、本明細書に記載した技術的事項の範囲に含まれる発明の態様の一部を確認的に例示する。

１．
コンピュータの情報処理により、文書イメージからデータを抽出する方法であって、
テーブル形式のオブジェクト・クラスタを含む前記文書イメージを取得することと、
前記テーブル形式オブジェクト・クラスタ内の複数のマクロブロックを識別することであって、それぞれのマクロブロックは共線性オブジェクトを含む、識別することと、
各マクロブロック内で、それぞれのマイクロブロックから１つ又は複数の候補セルを特定することと、
前記特定した候補セルに基づいて、前記テーブル形式オブジェクト・クラスタを、テーブル・クラスの所定のセットからの１つのテーブル・クラスに分類することと、
前記テーブル・クラスに従って、各マクロブロックについての前記１つ又は複数の候補セルからデータを抽出することであって、前記抽出されたデータは、コンピュータ・プログラムにより計算可能である、抽出することと、
前記抽出されたデータから１つ又は複数の２次元（２Ｄ）アレイを作成することであって、前記１つ又は複数の２Ｄアレイは、第１の次元に、前記テーブル形式オブジェクト・クラスタ内の複数のマクロブロックを有する、作成することと、
を含む、方法。

２．
前記テーブル形式オブジェクト・クラスタのマクロブロックは、テーブルの列に対応し、列は、各列の同じ行内にそれぞれの見出しを有し得る、上記１．に記載の方法。

３．
前記識別することは、
前記テーブル形式オブジェクト・クラスタから垂直方向の共線性オブジェクトの２つ又それより多いグループの列定義属性を分析することにより、前記複数のマクロブロックから各マクロブロックを判断することであって、前記列定義属性は、いずれかの２つの隣接するマクロブロック間の絶対距離、いずれかの２つの隣接うるマクロブロック間の相対距離、意味的補間、及び各マクロブロックについての相対スタイルを含む、判断することを含む、上記１．に記載の方法。

４．
上記いずれかの方法において、前記特定することは、
それぞれのシーケンス番号を各マクロブロック内のそれぞれのマイクロブロックに割り当てることにより、前記テーブル形式オブジェクト・クラスタの各マクロブロック内のそれぞれのマイクロブロックを順序付けることであって、各マイクロブロックは、文字及び／又は記号内に表される１つ又は複数の単語のブロックに対応する、順序付けることと、
全てのマクロブロックにわたって前記同じシーケンス番号を有するマイクロブロックの間の位置関係を分析することと、
を含む、上記１．に記載の方法。

５．
前記分類することは、
前記識別されたマクロブロックと前記特定された候補セルとの間の位置関係に基づいて、前記テーブル・クラスを前記テーブル形式オブジェクト・クラスタに割り当てることであって、前記テーブル・クラスの所定のセットは、併合したセルを有するテーブルの第１のテーブル・クラス、不明確なセル境界線を有するテーブルの第２のテーブル・クラス、及びネストしたセルを有するテーブルの第３のテーブル・クラスを含む、割り当てることを含む、上記１．に記載の方法。

６．
前記抽出することは、
候補セルに対応するキー値ペアを作成することであって、前記キー値ペアのキーは、前記候補セルが特定するマクロブロックの見出しであり、前記マクロブロックの前記見出しは、前記見出しが前記候補セルについての正しいキーである尤度を示す信頼性レベルと関連付けられる、作成することを含む、上記１．に記載の方法。

７．
上記１．から６．までのいずれかに記載の方法をコンピュータに実行させるコンピュータ・プログラム。

８．
上記７．に記載のコンピュータ・プログラムを格納したコンピュータ可読ストレージ媒体。

９．
メモリと、
前記メモリと通信する少なくとも１つのプロセッサと、
前記メモリを介して前記少なくとも１つのプロセッサにより実行可能な、上記１．から６．までのいずれかに記載の方法を実行するためのプログラム命令と、
を含む、システム。

１０：クラウド・コンピューティング・ノード
１２：コンピューティング・システム
１６：プロセッサ
１８：バス
２８：システム・メモリ
４２：プログラム・プロセス
５０：コンピューティング環境
１００：システム
１０１：ユーザ
１１０：ユーザ・デバイス
１２０：コグニティブな文書デジタル化エンジン
１３０：意味データベース
１３１：文書クラス
１３３：キー・クラス
１３５：キー・エイリアス
１３７：キー・オントロジ・データ
１３８：キー
１４０：文書メタデータ
１４５：マイクロブロック特徴
１５０：リレーショナル・データベース
１５５：キー値ペア（ＫＶＰ）
１７０：外部ツール
１８１：文書イメージ
５００：文書
５５０、５８０、６２０、６２５：テーブル形式オブジェクト・クラスタ
５６０：層状ボックス・セクション
５７０、６００、６３０：テーブル

Claims

コンピュータの情報処理により、文書イメージからデータを抽出する方法であって、
複数のオブジェクトを含む前記文書イメージを取得することと、
前記複数のオブジェクトにそれぞれ対応する複数のマイクロブロックを識別することであって、前記マイクロブロックの各々は、コンテンツ、位置及びスタイルと関連付けられる、識別することと、
第１のマイクロブロック及び第２のマイクロブロックのそれぞれの位置特徴、並びに調整可能な共線性パラメータに基づいて、第１のマイクロブロックが第２のマイクロブロックと共線性を有することを発見することと、
前記第１のマイクロブロック及び前記第２のマイクロブロックを有するマクロブロックを識別することであって、前記マクロブロックは、コンピュータ・プログラムにより計算可能なキー値ペアを構成する、識別することと、
発見的手法に基づいて信頼性レベルを前記キー値ペアと関連付けることと、
前記キー値ペア及び前記関連付けられた信頼性レベルをユーザに通信することと、
を含み、
前記発見することは、
前記第１のマイクロブロック及び前記第２のマイクロブロックの前記それぞれの位置特徴の分析に基づいて、前記第１のマイクロブロック及び前記第２のマイクロブロックが互いに直ぐ隣接していることを確認することと、
前記第１のマイクロブロック及び前記第２のマイクロブロックの両方とも、別のマイクロブロックを囲んでいない特定の幾何学領域内に囲まれていることを確認することと、
前記第１のマイクロブロック及び前記第２のマイクロブロックが共線性を有すると判断することと、
を含む、方法。
コンピュータの情報処理により、文書イメージからデータを抽出する方法であって、
複数のオブジェクトを含む前記文書イメージを取得することと、
前記複数のオブジェクトにそれぞれ対応する複数のマイクロブロックを識別することであって、前記マイクロブロックの各々は、コンテンツ、位置及びスタイルと関連付けられる、識別することと、
第１のマイクロブロック及び第２のマイクロブロックのそれぞれの位置特徴、並びに調整可能な共線性パラメータに基づいて、第１のマイクロブロックが第２のマイクロブロックと共線性を有することを発見することと、
前記第１のマイクロブロック及び前記第２のマイクロブロックを有するマクロブロックを識別することであって、前記マクロブロックは、コンピュータ・プログラムにより計算可能なキー値ペアを構成する、識別することと、
発見的手法に基づいて信頼性レベルを前記キー値ペアと関連付けることと、
前記キー値ペア及び前記関連付けられた信頼性レベルをユーザに通信することと、
を含み、
前記発見することは、
前記第１のマイクロブロック及び前記第２のマイクロブロックの前記それぞれの位置特徴の分析に基づいて、前記第１のマイクロブロック及び前記第２のマイクロブロックが互いに直ぐ隣接していることを確認することと、
前記第１のマイクロブロック及び前記第２のマイクロブロックの両方のそれぞれの意味コンテンツを分析することであって、前記意味コンテンツは、前記調整可能な共線性パラメータのメンバーである、分析することと、
前記第１のマイクロブロックの第１の意味コンテンツがキー名と関連付けられることを確認することと、
前記キー名に対応するキー・オントロジ・データから、前記第２のマイクロブロックの第２の意味コンテンツが前記キー名に対応するデータ・タイプのものであることを発見することと、
前記第１のマイクロブロック及び前記第２のマイクロブロックが共線性を有すると判断することと、
を含む、方法。
コンピュータの情報処理により、文書イメージからデータを抽出する方法であって、
複数のオブジェクトを含む前記文書イメージを取得することと、
前記複数のオブジェクトにそれぞれ対応する複数のマイクロブロックを識別することであって、前記マイクロブロックの各々は、コンテンツ、位置及びスタイルと関連付けられる、識別することと、
第１のマイクロブロック及び第２のマイクロブロックのそれぞれの位置特徴、並びに調整可能な共線性パラメータに基づいて、第１のマイクロブロックが第２のマイクロブロックと共線性を有することを発見することと、
前記第１のマイクロブロック及び前記第２のマイクロブロックを有するマクロブロックを識別することであって、前記マクロブロックは、コンピュータ・プログラムにより計算可能なキー値ペアを構成する、識別することと、
発見的手法に基づいて信頼性レベルを前記キー値ペアと関連付けることと、
前記キー値ペア及び前記関連付けられた信頼性レベルをユーザに通信することと、
を含み、
前記スタイルは、フォント・タイプ、フォント・サイズ、段落アラインメント、及びゼロ又はそれより多い句読区切り文字を含み、前記調整可能な共線性パラメータは、前記スタイルを含む、方法。
コンピュータの情報処理により、文書イメージからデータを抽出する方法であって、
複数のオブジェクトを含む前記文書イメージを取得することと、
前記複数のオブジェクトにそれぞれ対応する複数のマイクロブロックを識別することであって、前記マイクロブロックの各々は、コンテンツ、位置及びスタイルと関連付けられる、識別することと、
第１のマイクロブロック及び第２のマイクロブロックのそれぞれの位置特徴、並びに調整可能な共線性パラメータに基づいて、第１のマイクロブロックが第２のマイクロブロックと共線性を有することを発見することと、
前記第１のマイクロブロック及び前記第２のマイクロブロックを有するマクロブロックを識別することであって、前記マクロブロックは、コンピュータ・プログラムにより計算可能なキー値ペアを構成する、識別することと、
発見的手法に基づいて信頼性レベルを前記キー値ペアと関連付けることと、
前記キー値ペア及び前記関連付けられた信頼性レベルをユーザに通信することと、
を含み、
前記文書イメージの文書クラスを確認することと、
前記文書クラスにおいて指定されたクラス・キーが前記文書イメージについてのマクロブロックのセットから欠落していると判断することと、
前記欠落しているクラス・キーに対応するエイリアスを探して前記識別されたマクロブロックから前記マイクロブロックのそれぞれのコンテンツを検索することと、
前記エイリアスをコンテンツとして有する前記マイクロブロックの１つと関連付けられた別のマクロブロックを選択することと、
前記欠落しているクラス・キーについてのキー値ペアの代わりに前記選択された別のマクロブロックにおける別のキー値ペアを識別することと、
をさらに含む、方法。
請求項１から請求項４までのいずれか１項に記載の方法をコンピュータに実行させるコンピュータ・プログラム。
請求項５に記載のコンピュータ・プログラムを格納したコンピュータ可読ストレージ媒体。
メモリと、
前記メモリと通信する少なくとも１つのプロセッサと、
前記メモリを介して前記少なくとも１つのプロセッサにより実行可能な、請求項１から請求項４までのいずれか１項に記載の方法を実行するためのプログラム命令と、
を含む、システム。