JP7201299B2 - コグニティブな文書イメージのデジタル化のための方法、コンピュータ・プログラム及びシステム - Google Patents

コグニティブな文書イメージのデジタル化のための方法、コンピュータ・プログラム及びシステム Download PDF

Info

Publication number
JP7201299B2
JP7201299B2 JP2020526307A JP2020526307A JP7201299B2 JP 7201299 B2 JP7201299 B2 JP 7201299B2 JP 2020526307 A JP2020526307 A JP 2020526307A JP 2020526307 A JP2020526307 A JP 2020526307A JP 7201299 B2 JP7201299 B2 JP 7201299B2
Authority
JP
Japan
Prior art keywords
microblock
key
microblocks
engine
macroblock
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020526307A
Other languages
English (en)
Other versions
JP2021504787A (ja
Inventor
ノースラップ、ケビン
トリム、クレイグ
ハミース、バダ
セーガル、カラン
パドル、チャンドラシェックハー
アデニラン、アビソーラ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2021504787A publication Critical patent/JP2021504787A/ja
Application granted granted Critical
Publication of JP7201299B2 publication Critical patent/JP7201299B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/43Editing text-bitmaps, e.g. alignment, spacing; Semantic analysis of bitmaps of text without OCR

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Description

本開示は、文書処理技術に関し、より特定的には、文書イメージからデータをコグニティブ(cognitive)にデジタル化するための方法、コンピュータ・プログラム製品、及びシステムに関する。
従来の文書処理において、紙に印刷された(ink-on-paper)文書は、ページごとに走査され、それぞれの視覚イメージとして準備される。走査された紙から結果として得られる文書ファイルは、典型的には、一連のページの視覚イメージである。ページの視覚イメージの各々は、アクセス可能なコンテンツを有さず、既存の文書処理アプリケーションは、特定の視覚イメージ・パターンをデジタル化してデジタル化データにすることができ、このデジタル化データには、対応するコンピュータ・プログラム・アプリケーションを用いて、アクセスし動作することができる。視覚イメージのこのようなデータ・デジタル化プロセスは、抽出又はデータ抽出と呼ばれることが多い。従来の紙形態で表される情報及び走査される文書イメージの量を鑑みると、こうした文書イメージの抽出は、産業及び社会の多くの領域における一般的な生産性に大きな影響を与え得る。
文書イメージからデータを抽出するためのコンピュータ実施方法、コンピュータ・プログラム、及びシステムを提供する。
1つの態様において、方法を提供することにより、従来技術の欠点が克服され、付加的な利点が与えられる。文書イメージからデータを抽出するための方法は、例えば、コンピュータの1又は複数のプロセッサにより、複数のオブジェクトを含む前記文書イメージを取得することと、複数のオブジェクトにそれぞれ対応する複数のマイクロブロックを識別することであって、マイクロブロックの各々は、コンテンツ、位置及びスタイルと関連付けられる、識別することと、第1のマイクロブロック及び第2のマイクロブロックのそれぞれの位置特徴、並びに調整可能な共線性パラメータに基づいて、第1のマイクロブロックが第2のブロックと共線性を有することを発見することと、第1のマイクロブロック及び第2のマイクロブロックを有するマクロブロックを識別することであって、マクロブロックは、コンピュータ・プログラムにより計算可能なキー値ペアを構成する、識別することと、発見的手法に基づいて信頼性レベルをキー値ペアと関連付けることと、キー値ペア及び関連付けられた信頼性レベルをユーザに通信することとを含む。
1つの態様において、方法を提供することにより、従来技術の欠点が克服され、付加的な利点が与えられる。文書イメージからデータを抽出するための方法は、例えば、コンピュータの1又は複数のプロセッサにより、テーブル形式のオブジェクト・クラスタを含む文書イメージを取得することと、テーブル形式オブジェクト・クラスタ内の複数のマクロブロックを識別することであって、それぞれのマクロブロックは共線性オブジェクトを含む、識別することと、各マクロブロック内で、それぞれのマイクロブロックから1つ又は複数の候補セルを特定することと、特定した候補セルに基づいて、テーブル形式オブジェクト・クラスタを、テーブル・クラスの所定のセットから1つのテーブル・クラスに分類することと、テーブル・クラスに従って、各マクロブロックについての1つ又は複数の候補セルからデータを抽出することであって、抽出されたデータは、コンピュータ・プログラムにより計算可能である、抽出することと、抽出されたデータから1つ又は複数の二次元(2D)アレイを作成することであって、1つ又は複数の2Dアレイは、第1の次元に、テーブル形式オブジェクト・クラスタ内の多数のマクロブロックを有する、作成することとを含む。
1つの態様において、1つ又は複数のプロセッサにより可読であり、1つ又は複数のプロセッサにより実行される、文書イメージからデータを抽出するための方法を実行するための命令を格納するコンピュータ可読ストレージ媒体を含むコンピュータ・プログラム製品を提供することにより、従来技術の欠点が克服され、付加的な利点が与えられ、この方法は、例えば、コンピュータの1又は複数のプロセッサにより、複数のオブジェクトを含む前記文書イメージを取得することと、複数のオブジェクトにそれぞれ対応する複数のマイクロブロックを識別することであって、マイクロブロックの各々は、コンテンツ、位置及びスタイルと関連付けられる、識別することと、第1のマイクロブロック及び第2のマイクロブロックのそれぞれの位置特徴、並びに調整可能な共線性パラメータに基づいて、第1のマイクロブロックが第2のブロックと共線性を有することを発見することと、第1のマイクロブロック及び第2のマイクロブロックを有するマクロブロックを識別することであって、マクロブロックは、コンピュータ・プログラムにより計算可能なキー値ペアを構成する、識別することと、発見的手法に基づいて、信頼性レベルをキー値ペアと関連付けることと、キー値ペア及び関連付けられた信頼性レベルをユーザに通信することとを含む。
1つの態様において、1つ又は複数のプロセッサにより可読であり、1つ又は複数のプロセッサにより実行される、文書イメージからデータを抽出するための方法を実行するための命令を格納するコンピュータ可読ストレージ媒体を含むコンピュータ・プログラム製品を提供することにより、従来技術の欠点が克服され、付加的な利点が与えられ、この方法は、例えば、コンピュータの1又は複数のプロセッサにより、テーブル形式のオブジェクト・クラスタを含む文書イメージを取得することと、テーブル形式オブジェクト・クラスタ内の複数のマクロブロックを識別することであって、それぞれのマクロブロックは共線性オブジェクトを含む、識別することと、各マクロブロック内で、それぞれのマイクロブロックから1つ又は複数の候補セルを特定することと、特定した候補セルに基づいて、テーブル形式オブジェクト・クラスタを、テーブル・クラスの所定のセットからの1つのテーブル・クラスに分類することと、テーブル・クラスに従って、各マクロブロックについての1つ又は複数の候補セルからデータを抽出することであって、抽出されたデータは、コンピュータ・プログラムにより計算可能である、抽出することと、抽出されたデータから1つ又は複数の二次元(2D)アレイを作成することであって、1つ又は複数の2Dアレイは、第1の次元に、テーブル形式オブジェクト・クラスタ内の多数のマクロブロックを有する、作成することとを含む。
1つの態様において、メモリと、メモリと通信する少なくとも1つのプロセッサと、メモリを介して1つ又は複数のプロセッサにより実行可能な、文書イメージからデータを抽出するための方法を実行するためのプログラム命令とを含むシステムを提供することにより、従来技術の欠点が克服され、付加的な利点が与えられ、この方法は、例えば、コンピュータの1又は複数のプロセッサにより、複数のオブジェクトを含む文書イメージを取得することと、複数のオブジェクトにそれぞれ対応する複数のマイクロブロックを識別することであって、マイクロブロックの各々は、コンテンツ、位置及びスタイルと関連付けられる、識別することと、第1のマイクロブロック及び第2のマイクロブロックのそれぞれの位置特徴、並びに調整可能な共線性パラメータに基づいて、第1のマイクロブロックが第2のブロックと共線性を有することを発見することと、第1のマイクロブロック及び第2のマイクロブロックを有するマクロブロックを識別することであって、マクロブロックは、コンピュータ・プログラムにより計算可能なキー値ペアを構成する、識別することと、発見的手法に基づいて、信頼性レベルをキー値ペアと関連付けることと、キー値ペア及び関連付けられた信頼性レベルをユーザに通信することとを含む。
本発明で記載される技術を通じて、付加的な特徴が実現される。これらに限定されるものではないが、コンピュータ・プログラム製品及びシステムを含む他の実施形態及び態様が、本明細書で詳細に説明され、特許請求される発明の一部と見なされる。
本発明の1つ又は複数の態様が、本明細書の最後にある特許請求の範囲において、例として具体的に示され、明確に特許請求されている。本発明の上記及び他の目的、特徴、並びに利点は、添付図面と関連して用いられる以下の詳細な説明から明らかである。
本明細書に記載される1つ又は複数の実施形態による、文書イメージをコグニティブにデジタル化するためのシステムを示す。 本明細書に記載される1つ又は複数の実施形態による、コグニティブな文書デジタル化エンジンにより実行される動作のフローチャートを示す。 本明細書に記載される1つ又は複数の実施形態による、コグニティブな文書デジタル化エンジンにより実行される、多層ブロック識別の詳細な動作を示す。 本明細書に記載される1つ又は複数の実施形態による、コグニティブな文書デジタル化エンジンにより実行される、テーブル分類及び抽出の詳細な動作を示す。 本明細書に記載される1つ又は複数の実施形態による、マクロブロックを識別するために調整可能なブロック識別パラメータが適用される例示的文書イメージを示す。 本明細書に記載される1つ又は複数の実施形態による、例示的なテーブル形式のオブジェクト・クラスタを示す。 本明細書に記載される1つ又は複数の実施形態による、コグニティブな文書デジタル化エンジンにより作成される、図6のテーブル形式オブジェクト・クラスタに対応するテーブルを示す。 本明細書に記載される1つ又は複数の実施形態による、別の例示的なテーブル形式オブジェクト・クラスタを示す。 本明細書に記載される1つ又は複数の実施形態による、図8の例示的なテーブル形式オブジェクト・クラスタから識別されるマイクロブロック及びマクロブロックを示す。 本明細書に記載される1つ又は複数の実施形態による、コグニティブな文書デジタル化エンジンにより作成される、図8のテーブル形式オブジェクト・クラスタに対応するテーブルを示す。 本明細書に記載される1つ又は複数の実施形態による、さらに別の例示的なテーブル形式オブジェクト・クラスタの部分を示す。 本明細書に記載される1つ又は複数の実施形態による、コグニティブな文書デジタル化エンジンにより作成される、図11のテーブル形式オブジェクト・クラスタ内のセルに対応するネストしたテーブルである。 本発明の実施形態によるクラウド・コンピューティング・ノードを示す。 本発明の実施形態によるクラウド・コンピューティング環境を示す。 本発明の実施形態による抽象化モデル層を示す。
図1は、本明細書に記載される1つ又は複数の実施形態による、文書イメージをコグニティブにデジタル化するためのシステム100を示す。
文書イメージからの計算(computational)データの抽出は、様々なカスタム形式、個々のスタイル、多様なアラインメント、及び非テキスト・コンテンツのためにうまくいかないことが多い。その結果、文書イメージで表される膨大な量の情報には、完全にデジタル化された文書と同じ程度にアクセス可能ではない。デジタル化されていない文書イメージは、視覚的表示及び保存目的などに使用が制限される。その一方で、デジタル化から利益を得る文書の数を考慮すると、そうした文書イメージの手動デジタル化に必要な時間とコストは法外なものである。
デジタル文書は、文書内に表されるデータを計算的に(computationally)用いる際に便宜上好ましいことが多い。紙にペンで書かれた(pen-on-paper)文書を走査して取り込むと、文書は、ページの一連の視覚イメージとなるものの、デジタル・データとして計算的に使用する準備はできていない。従って、文書イメージから計算データを正確に抽出するために、多くの文書デジタル化アプリケーションが開発されてきた。既存の文書処理アプリケーションにおいては、文書の視覚イメージを処理し、文書から計算データを抽出する際、文書のカスタム形式及び構成が非常に多いことにより問題が提示される。本発明の実施形態は、文書内の視覚マークが伝える意味を人間の読み手が理解するとき、文書イメージのコグニティブなデジタル化プロセスを実施し、文書イメージからのデータ抽出の効率及び精度を向上させる。
システム100は、コグニティブな文書デジタル化エンジン120を含む。コグニティブな文書デジタル化エンジン120は、ユーザ・デバイス110を介して、ユーザ101から文書イメージ181を受け取る。文書イメージ181は、計算データではない特定の情報に対して作成された文書の視覚イメージである。例えば、紙文書の走査イメージは、いずれのデジタル化データも有さないので、走査イメージ内のテキストを検索することも、又はデータ入力として別のアプリケーションに読み込むこともできない。文書イメージ181は、計算データとして抽出することができる多数のオブジェクトを有する。本明細書において、「オブジェクト」という用語は、文書イメージにおける識別可能な個々のエンティティを指し、「マイクロブロック」という用語は、マイクロブロック機械論理境界付け規則(delineation rule)に従ってオブジェクト間の関係を見つけるための種々の分析のための、文書内の対応するオブジェクトから識別される候補データの最小単位を指す。コグニティブな文書デジタル化エンジン120は、各マイクロブロックのコンテンツ、位置、スタイルを含む多数のマイクロブロック特徴145を有して各マイクロブロックを表す。
コグニティブな文書デジタル化エンジン120は、多層共線性分析に基づいて文書イメージ181からデータを自動的に抽出するので、文書イメージ181内のテキスト及び数のイメージから抽出された情報は、他のプログラム及びアプリケーションにより使用可能な計算データであり得る。コグニティブな文書デジタル化エンジン120に結合されたリレーショナル・データベース150は、文書イメージ181から抽出されたデータに対応する複数のKVPのうちの1つのキー値ペア(key-value pair、KVP)155を格納する。コグニティブな文書デジタル化エンジン120は、キー値ペアをそれぞれの信頼性レベルと関連付ける。「キー値ペア」という用語は、キー及び値を用いる一次データ表現単位を指し、そこで、キーは値を説明又は特定する。多くの場合、リレーショナル・データベース・テーブルに見られるように、KVPを階層的に編成してより大きいデータ構造にすることができる。
コグニティブな文書デジタル化エンジン120は、光学式文字認識(OCR)アプリケーションなどの1つ又は複数の外部ツール170を用いて、それぞれのマイクロブロックとして識別される、文書イメージ181内の全てのオブジェクトについての、マイクロブロック特徴145を含む文書メタデータ140をキャプチャすることができる。本明細書において、「共線性」という用語は、コグニティブな文書デジタル化エンジン120が、共線性を有するような2つ又はそれより多いマイクロブロックに基づいてマクロブロックを識別するために、有意であると考えるときの、文書イメージ181内の認識可能なオブジェクトの間の幾何的アラインメントを指し、「マイクロブロック」という用語は、文書イメージ181から認識される個々のオブジェクトを指し、「マクロブロック」という用語は、テーブル内の、キー値ペア(KVP)及び列又行といった有意のデータ単位を形成する、2つ又はそれより多いマイクロブロックのグループを指す。
従来の文書イメージ処理においては、使用可能なデータを抽出するための無数のカスタム形式の文書において共線性を正しく発見するのは、進行中のプロセスである。コグニティブな文書デジタル化エンジン120は、共線性及び意味論を用いる多層手法を利用して、従来の文書イメージ処理アプリケーションよりも包括的な文書の認識を達成し、結果として文書イメージ181から使用可能データを抽出する。
コグニティブな文書デジタル化エンジン120は、複数の調整可能な共線性パラメータに基づいてマイクロブロックの間の共線性を分析し、文書イメージ181においてアラインされると判断される複数のマイクロブロックから計算データを抽出する。コヒーシブ・データの例は、文書内のテーブルにおけるような、個々のキー値ペア及びKVPのセットを含むことができる。調整可能な共線性パラメータの例は、これらに限定されるものではないが、フォント・サイズ及びスタイルの変更、アラインメント及び句読点を含むことができる。コグニティブな文書デジタル化エンジン120による共線性分析に基づいて2つのマイクロブロックが互いにアラインする場合、キーはマイクロブロックであり、値は別のマイクロブロックであるので、キー値ペアは、2つのマイクロブロックを含むマクロブロックである。
コグニティブな文書デジタル化エンジン120は、意味データベース130内に格納された種々の意味情報をさらに利用して、文書イメージ181からデータを抽出する。意味データベース130内の情報の幾つかの例として、これらに限定されるものではないが、1つ又は複数の文書クラス131、1つ又は複数のキー・エイリアス135、及びキー・オントロジ・データ137が挙げられる。コグニティブな文書デジタル化エンジン120の詳細な動作は、図2、図3及び図4に説明される。
意味データベース130において、1つ又は複数の文書クラス131の各々は、各文書クラス内のあらゆる文書が含むことになる1つ又は複数のクラス・キー133に対応する。例えば、文書が購入請求書クラスのものであるとき、対応するクラス・キーは、これらに限定されるものではないが、名称、取引日、項目リスト、金額等を含むことができる。
意味データベース130において、1つ又は複数のキー・エイリアス135は、キーの代わりに文書イメージ181内に現れ得る多数のキーについてのエイリアスを含む。クラスに対応する全てのクラス・キーは1つの文書内に現れるので、1つ又は複数のクラス・キー133を探して、1つ又は複数のキー・エイリアス135が調べられることが多い。例えば、クラス・キーが「Account Number(アカウント番号)」クラス・キーを指定し得るが、文書イメージ181は、「Account Number」のテキストではなく、「Acct.#」テキストを有するキーを有することがある。1つ又は複数のキー・エイリアス135は、様々なカスタマイズ文書の分析及びデータ抽出を適合するように、「Account Number」及び「Acct.#」のような交換可能な名称を列挙する。
意味データベース130のキー・オントロジ・データ137は、制約のセット、及び文書イメージ181により表される知識の範囲をモデル化する意味を定める。キー・オントロジ・データ137は、文書イメージ181内に提示できる複数のキーを含む。複数のキーの中のキー138は、キー138のプロパティ、キー138が属する1つ又は複数のセット、及び1つ又は複数のセットの同じセットのメンバーの間の関係を含む種々の特徴と関連付けられる。また、コグニティブな文書デジタル化エンジン120は、2つの意味的に関連付けられたテキスト・ブロックが共線性を有すると結論づけることができる。例えば、キー138は、CustomerLastName(顧客の姓)キーに対するテキスト文字列、DateOfBirth(生年月日)キーに対する8桁の数のような、キー138についての値の適切なデータ・タイプを指定するデータ・タイプ139プロパティを有することができる。同じ例において、テキスト文字列が、「Johnson」のような一般的な名前を有する場合、コグニティブな文書デジタル化エンジン120は、テキスト文字列が近接範囲内のキーとアラインされなくても、CustomerLastNameキー及びテキスト文字列「Johnson」をKVPとして判定することができる。同じ例において、コグニティブな文書デジタル化エンジン120は、テキスト文字列「Johnson」を用いて分類器(外部ツール170の1つ)を実行し、テキスト文字列「Johnson」が名前についてのデータ・タイプであると判定する。別の例において、キー138は、1つ又は複数のクラス・キー133の1つとすることができ、CustomerNumber(顧客番号)クラス・キー及びAmount(金額)クラス・キーの両方を含む請求書文書クラスのような、キー・オントロジ・データ137内に定められる他のクラス・キーとの関係を有する。
図2は、本明細書に記載される1つ又は複数の実施形態による、図1のコグニティブな文書デジタル化エンジン120により実行される動作のフローチャートを示す。
ブロック210において、コグニティブな文書デジタル化エンジン120は、文書イメージを受け取り、該文書イメージを処理する。受け取った文書イメージは、1つのページ内に1つより多い特有の(distinctive)視覚パターンを有し得る。コグニティブな文書デジタル化エンジン120は、こうしたパターンを文書内のそれぞれのセクションとして識別する。本明細書において、「オブジェクト」という用語は、文書イメージ内のイメージ・オブジェクトを指し、「マイクロブロック」という用語は、共線性分析のためのマイクロブロック機械論理境界付け規則に従って対応するイメージ・オブジェクトから識別された不可分の単位ブロックを指す。次に、コグニティブな文書デジタル化エンジン120は、ブロック220に進む。
ブロック220において、コグニティブな文書デジタル化エンジン120は、文書イメージのそれぞれのセクション内にいずれかのテーブル形式オブジェクト・クラスタが発見されたかどうかを判断する。コグニティブな文書デジタル化エンジン120が、文書内にいずれのテーブル形式オブジェクト・クラスタも発見しなかった場合、コグニティブな文書デジタル化エンジン120はブロック230に進む。コグニティブな文書デジタル化エンジン120が、文書内に1つ又は複数のテーブル形式オブジェクト・クラスタを発見した場合、コグニティブな文書デジタル化エンジン120はブロック240に進む。
ブロック230において、コグニティブな文書デジタル化エンジン120は、文書イメージ181内のマイクロブロックを分析し、マイクロブロックの拡張した共線性分析に基づいてマクロブロックを識別する。ブロック230の詳細な動作及び対応する説明は、図3に説明される。次に、コグニティブな文書デジタル化エンジン120は、ブロック250に進む。
ブロック240において、コグニティブな文書デジタル化エンジン120は、文書イメージ内で発見されたテーブル形式クラスタをそれぞれ分析し、各々のテーブル形式クラスタ内のオブジェクトに対する拡張した共線性分析に基づいてテーブルを識別する。本明細書において、テーブルは、二次元構成のキー値ペアである。テーブルは、多面的な情報を伝える際に最も一般的に使用され、様々なカスタム構成で提示される。コグニティブな文書デジタル化エンジン120は、テーブルのタイプに対応するデータ抽出を適切に実行するために、識別されるテーブルのタイプを分類する。ブロック240の詳細な動作及び対応する説明は、図4に説明される。次に、コグニティブな文書デジタル化エンジン120は、ブロック250に進む。
ブロック250において、コグニティブな文書デジタル化エンジン120は、計算データを有するデジタル化された文書イメージの結果をユーザに返す。コグニティブな文書デジタル化エンジン120は、随意的に、ユーザからの結果に対するフィードバックを受け取る。コグニティブな文書デジタル化エンジン120は、ブロック230から生成されたキー値ペア及び/又はフィードバックに従ってブロック240から生成されたテーブルを更新し、次に、ブロック210において受け取った文書イメージ181の処理を終了する。
コグニティブな文書デジタル化エンジン120は、文書イメージ181のセクションに応じてブロック230及びブロック240を実行し、オブジェクト・クラスタ及び種々の組織のテーブルの混合物を有するカスタム文書の種々の形式をサポートすることができる。コグニティブな文書デジタル化エンジン120は、文書イメージ181内に存在するオブジェクトに従って、必要に応じてブロック230及び/又はブロック240を繰り返すことができる。
図3は、本明細書に記載される1つ又は複数の実施形態による、図1のコグニティブな文書デジタル化エンジン120により実行されるような、図2のブロック230の詳細な動作、多層ブロックの識別を示す。
ブロック310において、コグニティブな文書デジタル化エンジン120は、対応するオブジェクトから、受け取った文書におけるマイクロブロックを識別する。オブジェクトは、テキスト文字列、数値、記号、又は画像のいずれかであり得る。コグニティブな文書デジタル化エンジン120は、共線性分析に備えて、オブジェクト間の水平及び垂直空間の絶対距離及び/又は相対近接性を測定する。次に、コグニティブな文書デジタル化エンジン120は、ブロック320に進む。
ブロック320において、コグニティブな文書デジタル化エンジン120は、マイクロブロックの調整可能な共線性パラメータに基づいて、2つ又はそれより多いマイクロブロックの相対位置の近接性を分析することにより、ブロック310で識別された各マイクロブロックに対応するマクロブロックを識別する。コグニティブな文書デジタル化エンジン120は、調整可能な共線性パラメータに従って共線性を有する2つ又はそれより多いマイクロブロックに基づいて、マクロブロックを識別することができる。受け取った文書内の全てのマイクロブロックについてそれぞれのマクロブロックを識別すると、コグニティブな文書デジタル化エンジン120は、ブロック330に進む。
本発明の1つの実施形態において、コグニティブな文書デジタル化エンジン120は、2つ又はそれより多いマイクロブロックが、絶対距離又は相対位置において特定の距離範囲内にあるとき、正確なアラインメントなしに、調整可能な共線性パラメータに基づいて2つ又はそれより多いマイクロブロックが共線性を有すると判断することができる。調整可能な共線性パラメータは、フォント、段落アラインメント、句読点、及びオントロジ・マッチングを含む。調整可能な共線性パラメータは、2つのマイクロブロックが特有のフォント及び異なるサイズ/スタイルを有し、それぞれのマイクロブロックにおいて異なる段落アラインメントを有し、及び/又は句読点により分離されていても、コグニティブな文書デジタル化エンジン120は、2つのマイクロブロックを共線関係で関連付けることができる。さらに、コグニティブな文書デジタル化エンジン120は、例えば、特定のキー名及びキー名についてのデータ・タイプが指定されるキー・オントロジ・データに基づいて、2つのマイクロブロックをマクロブロックとして判断することができる。調整可能な共線性パラメータの例及び詳細な説明、並びに対応する説明は、図5に説明される。
ブロック330において、コグニティブな文書デジタル化エンジン120は、受け取った文書のクラス、及び文書のクラスにおいて要求される全てのクラス・キーが識別されたかどうかを判断する。コグニティブな文書デジタル化エンジン120が、いずれのクラス・キーも識別されなかったと判断した場合、コグニティブな文書デジタル化エンジン120は、ブロック340に進む。コグニティブな文書デジタル化エンジン120が、全てのクラス・キーが識別されたと判断した場合、コグニティブな文書デジタル化エンジン120は、ブロック350に進む。
ブロック340において、コグニティブな文書デジタル化エンジン120は、欠落しているクラス・キーの各々に対応するそれぞれのエイリアスに関して、ブロック310において識別された全てのマイクロブロックを検査する。欠落しているクラス・キーの代わりに見つかった各エイリアスについて、コグニティブな文書デジタル化エンジン120は、ブロック320におけるような、エイリアスを有するマイクロブロックを含むマクロブロックを識別する。次いで、コグニティブな文書デジタル化エンジン120は、ブロック350に進む。
ブロック350において、コグニティブな文書デジタル化エンジン120は、ブロック320及びブロック340において識別されたマクロブロックから全てのキー値ペア(KVP)を識別する。各マクロブロックの1つのマイクロブロックは、KVPにおけるキーに対応し、同じマクロブロックの別のマイクロブロックは、同じKVP内の値に対応し得る。コグニティブな文書デジタル化エンジン120は、信頼性レベルを識別されたKVPの各々に割り当てる。コグニティブな文書デジタル化エンジン120は、近接性レベル、それぞれのキー名のオントロジ・マッチング及びデータ・タイプのような種々の要因に基づいて、KVPの信頼性レベルを発見的に判断する。公式の(formal)取引文書内に頻繁に現れるキー及び値において、KVPの信頼性レベルは、非公式の(informal)個人的文書におけるカスタム・キー及び値よりも高くなり得る。次いで、コグニティブな文書デジタル化エンジン120は、図2のブロック250に進む。
図4は、本明細書に記載される1つ又は複数の実施形態による、図1のコグニティブな文書デジタル化エンジン120により実行される、図2のブロック240の詳細な動作、すなわちテーブル分類及び抽出を示す。
既述のように、文書化の多くの領域では、多数の文書において種々のタイプ及び形式のテーブルが用いられる。コグニティブな文書デジタル化エンジン120は、テーブルを分類し、テーブルの特徴に対応する方法でテーブルからデータを抽出する。本発明の特定の実施形態において、コグニティブな文書デジタル化エンジン120は、以下のブロック430に説明されるように、それぞれのカスタマイズされた抽出戦略から利益を得る、テーブルについての3つのクラスを指定する。
ブロック410において、コグニティブな文書デジタル化エンジン120は、テーブル形式クラスタからマクロブロックを有する候補列を特定する。コグニティブな文書デジタル化エンジン120は、テーブル形式クラスタ又は任意のセクションを、文書イメージの残りから分離し、各々のテーブル形式クラスタを処理する。コグニティブな文書デジタル化エンジン120は、種々の列定義属性を分析することにより、テーブル形式構造の、マクロブロックとも呼ばれる候補列を特定する。列定義属性の例は、マクロブロック間の絶対距離、マクロブロック間の相対距離、意味的補間(semantic interpolation)及び相対スタイルを含むことができる。
コグニティブな文書デジタル化エンジン120は、列定義属性を発見的に組み合わせて、マクロブロックを有する候補列を特定する。次に、コグニティブな文書デジタル化エンジン120は、ブロック420に進む。
本発明の特定の実施形態において、コグニティブな文書デジタル化エンジン120は、例えば、緊密な間隔(tight spacing)、シングル・スペース(標準の間隔)、1.5行間隔(one-and-a-half spacing)、ダブル・スペース及び広い間隔を含むことができる所定の間隔カテゴリのセットを有することができ、ここで、各々の間隔カテゴリは、それぞれの間隔カテゴリにより分離される2つのマクロブロック間の共線性の特有の尤度を示す。間隔カテゴリのセットは、各マクロブロック内のマイクロブロックに対して特有のものであり得る。
コグニティブな文書デジタル化エンジン120はさらに、意味関係を示す、接続詞、論理和、及び関連した記号マークのような意味表示の存在に基づいて、意味的補間を適用することができる。例えば、「及び(and)」及び「又は(or)」の両方とも、記号「&」、「+」におけるような行の継続を表す。「-」及び「*」などの記号は、リスト内の行見出し標識として使用されることが多い。コグニティブな文書デジタル化エンジン120は、間隔カテゴリからマクロブロックを識別するために、意味的補間を考慮に入れることができる。
さらに、コグニティブな文書デジタル化エンジン120は、マクロブロック識別のために、相対スタイルを考慮に入れることもできる。意味的補間及び相対スタイルは一般に、絶対的及び相対的測定に従った間隔を下回るそれぞれの重みを有する。コグニティブな文書デジタル化エンジン120は、文書のクラスに基づいて、特定の要素についてのそれぞれの重みを割り当てることができる。例えば、特定の距離範囲内の2つのブロック間のスタイル及びフォントの変更は、プレゼンテーション用スライドなどの非公式文書よりも、取引文書、請求書、及び政府書式などの公式文書においてより重要視され得る。コグニティブな文書デジタル化エンジン120による動作を定める列の例及び説明は、図6及び図8に示される。
ブロック420において、コグニティブな文書デジタル化エンジン120は、それぞれのマクロブロック内のマイクロブロックに基づいて、それぞれの候補列内の候補セルを特定する。テーブルは、各列内に1つより多いセルを有するので、コグニティブな文書デジタル化エンジン120は、各候補列内のそれぞれの行として候補セル・データを特定する。本明細書において、「列(column)」及び「行(row)」という用語は、テーブル形式クラスタがどのように編成されるかに基づいて逆にすることができる。コグニティブな文書デジタル化エンジン120が最初にマクロブロックを有する候補行を識別した場合、列マイクロブロックが、各行内の候補セルとして識別される。次に、コグニティブな文書デジタル化エンジン120は、ブロック430に進む。
ブロック430において、コグニティブな文書デジタル化エンジン120は、ブロック420から識別された候補セルにより形成されたテーブルを分類する。コグニティブな文書デジタル化エンジン120は、テーブル・クラスに従って候補セルからデータを抽出し、抽出されたセル・データの意味的分析に基づいて、テーブル内の各列についてのそれぞれの見出しを判断する。例えば、セルの残りが数値データである列内にテキスト「量」を有する第1のセルの場合、コグニティブな文書デジタル化エンジン120は、「量」セルを、高い信頼性レベルを有する列の見出しとして判断できる。次に、コグニティブな文書デジタル化エンジン120は、ブロック440に進む。
本発明の1つの実施形態において、コグニティブな文書デジタル化エンジン120は、併合したセルを有するテーブル、不明確なセル境界線を有するテーブル、及びネストしたセルを有するテーブルを含む、テーブルについての3つの特別なクラスを利用する。テーブル・クラスは、セルのタイプからのデータの抽出を促進するために、テーブル内の特定のタイプのセルの存在を示すので、1つのテーブルに対して1つ又は複数のテーブル・クラスを同時に適用することができ、1つのテーブルが、各テーブル・クラスに対して処理される。それぞれのテーブル・クラス及び抽出の例、並びにそれぞれの対応する説明は、図6~図7、図8~図10、及び図11~図12に提示される。
ブロック440において、コグニティブな文書デジタル化エンジン120は、自動的に、及び/又は抽出において随意的なユーザ入力を適用することにより、セル・データを抽出する。コグニティブな文書デジタル化エンジン120は、抽出が十分ではないとき、又は単に分類及び抽出を助けるために、抽出されたデータへのフィードバックとして、テーブル分類及びセル・データ抽出のテーブル形式意味論を案内するためのユーザ・インターフェースを提供する。次に、コグニティブな文書デジタル化エンジン120は、ブロック450に進む。
ブロック450において、コグニティブな文書デジタル化エンジン120は、候補セルから抽出されたデータを編成して、テーブルを表す1つ又は複数の多次元データ・アレイにする。例えば、1つの列は1つのアレイを形成し、テーブルは、2次元アレイとも呼ばれるマトリックスを形成することができる。データの計算可用性のために、コグニティブな文書デジタル化エンジン120は、Python NumPyのような多次元アレイ処理及び計算ライブラリに対応する形式で多次元アレイを作成する。次に、コグニティブな文書デジタル化エンジン120は、図2のブロック250に進む。
図5は、本明細書に記載される1つ又は複数の実施形態による、マクロブロックを特定するために調整可能なブロック特定パラメータが適用される、例示的な文書イメージを示す。
文書500は、種々の構成での2つのマイクロブロックを含む。第1のマイクロブロックはテキスト文字列「Name(名前)」を有し、第2のマイクロブロックはテキスト文字列「Kevin」を有する。第1のマイクロブロックの「Name」テキストは、キーとして抽出することができ、第2のマイクロブロックの「Kevin」テキストは、Nameキーの値として抽出することができ、そこから、コグニティブな文書デジタル化エンジン120は、マクロブロック、すなわちキー値ペア(KVP)、Name=「Kevin」を識別する。
構成510は、2つの隣接するマイクロブロックにおける異なるフォント・サイズを示し、そこで、「Name」マイクロブロックは、「Kevin」マイクロブロックのフォントより小さいフォントを有する。既存の文書処理アプリケーションにおいては、サイズの変更を含むフォントの差は、さもなくばKVPを形成することになる2つのマイクロブロックがマクロブロック(KVP)として識別されるのを阻害するであろう。コグニティブな文書デジタル化エンジン120は、フォント・サイズに関する調整可能な共線性パラメータを用いて、異なるフォント・サイズを有する2つのマイクロブロックを1つのマクロブロック(KVP)として識別することが可能である。
構成515は、2つの垂直方向に隣接するマイクロブロックにおける異なるテキスト・スタイルを示し、ここで、「Name」マイクロブロックはボールド体であるが、次の行の「Kevin」マイクロブロックは標準書体を有する。既存の文書処理アプリケーションにおいて、例えば活字書体の変更を含むテキスト・スタイルの差は、標準テキストがボールド体、イタリック体、及び下線付きであるとき、さもなくばKVPを形成することになる2つのマイクロブロックがマクロブロック(KVP)として識別されるのを阻害するであろう。コグニティブな文書デジタル化エンジン120は、テキスト・スタイルに関する調整可能な共線性パラメータを用いて、異なるテキスト・スタイルを有する2つのマイクロブロックを1つのマクロブロック(KVP)として識別することが可能である。
構成520は、2つの隣接するマイクロブロックにおける異なる段落アラインメントを示し、ここで、「名前」マイクロブロックは左揃えにされているが、「Kevin」マイクロブロックは右端にアラインされている。既存の文書処理アプリケーションにおいては、上に示されるような段落アラインメントの差は、さもなくばKVPを形成することになる2つのマイクロブロックがマクロブロック(KVP)として識別されるのを阻害するであろう。コグニティブな文書デジタル化エンジン120は、段落アラインメントに関する調整可能な共線性パラメータを用いて、異なる段落アラインメントを有する2つのマイクロブロックを1つのマクロブロック(KVP)として識別することが可能である。
構成525は、2つの垂直方向に隣接するマイクロブロックにおける異なる段落アラインメントを示し、ここで、「Name」マイクロブロックは左揃えにされているが、「Kevin」マイクロブロックは次の行の右端にアラインされている。既存の文書処理アプリケーションにおいては、上に示されるような段落アラインメントの差は、さもなくばKVPを形成することになるそれぞれの行の2つのマイクロブロックがマクロブロック(KVP)として識別されるのを阻害するであろう。コグニティブな文書デジタル化エンジン120は、段落アラインメントに関する調整可能な共線性パラメータを用いて、異なる段落アラインメントを有するそれぞれの行の2つのマイクロブロックを1つのマクロブロック(KVP)として識別することが可能である。
構成530は、句読点で分離される2つの隣接するマイクロブロックを示し、そこで、「:」すなわちコロンが、「Name」マイクロブロックと「Kevin」マイクロブロックとの間に配置される。既存の文書処理アプリケーションにおいては、上に示されるような分離する句読点は、さもなくばKVPを形成することになる2つのマイクロブロックがマクロブロック(KVP)として識別されるのを阻害することがある。コグニティブな文書デジタル化エンジン120は、句読点の分離に関する調整可能な共線性パラメータを用いて、句読点で分離される2つのマイクロブロックを1つのマクロブロック(KVP)として識別することが可能である。
構成535は、句読点で分離される2つの垂直方向に隣接するブロックを示し、そこで、「:」すなわちコロンが、「Name」マイクロブロックと「Kevin」マイクロブロックとの間に配置される。既存の文書処理アプリケーションにおいては、上に示されるような分離する句読点は、さもなくばKVPを形成することになるそれぞれの行の2つのマイクロブロックがマクロブロック(KVP)として識別されるのを阻害することがある。コグニティブな文書デジタル化エンジン120は、句読点分離に関する調整可能な共線性パラメータを用いて、句読点で分離されるそれぞれの行の2つのマイクロブロックを1つのマクロブロック(KVP)として識別することが可能である。
構成540は、広いスペースで分離される2つの隣接するマイクロブロックを示し、そこで、「Name」マイクロブロックと「Kevin」マイクロブロックとの間の広いスペースは通常、既存の文書処理アプリケーションにおいては、2つのマイクロブロックがマクロブロック(KVP)として識別されるのを阻害する。コグニティブな文書デジタル化エンジン120は、2つのマイクロブロックのテキストを意味的に分析すること、及び「Kevin」が「Name」キーの値についての適切なデータ・タイプのものであるとき、キー・オントロジ・データに基づいてキーと値とをマッチングすることにより、こうした広いスペースで分離される2つのマイクロブロックを1つのマクロブロック(KVP)として識別することが可能である。
構成545は、広いスペースで分離される2つの垂直方向に隣接するマイクロブロックを示し、ここで、「Name」マイクロブロックと次の行の「Kevin」マイクロブロックとの間の広いスペースは通常、既存の文書処理アプリケーションにおいては、2つのマイクロブロックがマクロブロック(KVP)として識別されるのを阻害する。コグニティブな文書デジタル化エンジン120は、2つのマイクロブロックのテキストを意味的に分析すること、及び「Kevin」が「Name」キーの値についての適切なデータ・タイプのものであるとき、キー・オントロジ・データに基づいてキーと値とをマッチングすることにより、こうした広いスペースで分離されるそれぞれの行の2つのマイクロブロックを1つのマクロブロック(KVP)として識別することが可能である。
図6は、本明細書に記載される1つ又は複数の実施形態による、例示的なテーブル形式オブジェクト・クラスタ550を示す。
図4のブロック430の説明に既述されるように、データを抽出するための特別な考慮事項を必要とするテーブル・クラスの1つは、不明確なセル境界線を有するテーブルのクラスである。テーブル形式オブジェクト・クラスタ550は、不明確なセル境界線を有するテーブルとして分類される例である。人間の読み手は、テーブル形式オブジェクト・クラスタ550をテーブルとして容易に認識するが、既存の文書処理アプリケーションは、特に層状ボックス・セクション560内に示される不明確なセル境界線のために、テーブル形式オブジェクト・クラスタ550をテーブルとして識別することができない、及び/又はテーブル形式オブジェクト・クラスタ550からデータを正確に抽出することができない。
コグニティブな文書デジタル化エンジン120は、テーブル形式オブジェクト・クラスタ550から3つの列を識別し、ここで、第1の列は、層状ボックス・セクション560の左側であり、層状ボックス・セクション560は第2の列であり、第3の列は層状ボックス・セクション560の右側である。第1の列は7つの行を有し、層状ボックス・セクション560の第2の列は8つの行を有し、それぞれが8つの前方ボックスが背景ストリップ上にアラインされている。第3の列は、第1の列のように7つの行を有する。従って、テーブル形式オブジェクト・クラスタ550は、3×8のマトリックスのようなテーブルを形成することができる。テーブル形式オブジェクト・クラスタ550内の点線は、テーブル内の2つの隣接する行の間のそれぞれの境界線を示す。
図7は、本明細書に記載される1つ又は複数の実施形態による、コグニティブな文書デジタル化エンジン120により作成される、図6のテーブル形式オブジェクト・クラスタ550に対応するテーブル570を示す。
コグニティブな文書デジタル化エンジン120は、行572、573、574、575、576、577、578及び579内に示されるような、8つの行を全ての3つの列内に当てはめる。しかしながら、一番上の行571の列見出しがテーブル570に付加されているが、図6のテーブル形式オブジェクト・クラスタ550に対するテキスト情報はないので、テキストは記入されていない。
図8は、本明細書に記載される1つ又は複数の実施形態による、別の例示的なテーブル形式オブジェクト・クラスタ580を示し、図9は、本明細書に記載される1つ又は複数の実施形態による、図8の例示的なテーブル形式オブジェクト・クラスタ580から識別されるマイクロブロック及びマクロブロックを示す。
テーブル形式オブジェクト・クラスタ580は、通常は種々の文書内に現れるようなテーブルの視覚イメージを表す。
図9において、位置関係を分析し、テーブル形式オブジェクト・クラスタ580内のオブジェクトの共線性を判断する際にコグニティブな文書デジタル化エンジン120により認識されるように、テーブル形式オブジェクト・クラスタ580内の全てのオブジェクトはそれぞれ、テキストのないボックスとして標識付けされる。コグニティブな文書デジタル化エンジン120は、マクロブロック間の絶対距離、それぞれのマクロブロック内のオブジェクト間の相対距離、意味的補間、及び相対スタイルを含む、列定義属性を発見的に組み合わせることにより、3つの列591、593、597を識別する。コグニティブな文書デジタル化エンジン120は、列の間に何らかの重複が存在し得る場合でも、列内の共線性を判断することができる。テーブル形式オブジェクト・クラスタ580の列定義属性の処理において、コグニティブな文書デジタル化エンジン120は、オブジェクト間の距離を測定し、平均値、中央値、モード幅並びに変位値及び関連した信頼区間及び観察のための頻度数を計算する。
テーブル形式オブジェクト・クラスタ580の第1の列591は、列見出しを除いて5つの行を有する。第2の行593は、9つのデータ行を有し、第3の行597は、10個のデータ行を有する。従って、テーブル形式オブジェクト・クラスタ580のデータ・セルは、テーブルを3×10のマトリックスとして形成することができる。テーブル形式オブジェクト・クラスタ580内の点線は、データ・セルの間のそれぞれの共線性を示す。
第1の列591において、コグニティブな文書デジタル化エンジン120は、テキストを背景イメージから分離し、テキストの位置を分析する。コグニティブな文書デジタル化エンジン120は、主として、両方の列の行の間の位置関係からの拡張した共線性に基づいて、第1の列内の5つの行を第3の列597の10個の行に当てはめる。また、コグニティブな文書デジタル化エンジン120は同様に、主として、列にわたるマイクロブロックの水平方向共線性に基づいて、第2の列593の9つの行を第3の列597の10個の行に当てはめる。第3の列597の列見出し位置に基づいて、イメージ列595は、第3の列597に対する余分な列として識別され得る。
テーブル形式オブジェクト・クラスタ580は、併合したセルを有するテーブル・クラスとして分類された例である。コグニティブな文書デジタル化エンジン120は、下流併合アルゴリズムにより、列591、593、595、597にわたる行をアラインし、一番上のセルから最後の利用可能なセルに至るまで各列内の行を併合する。
図10は、本明細書に記載される1つ又は複数の実施形態による、コグニティブな文書デジタル化エンジン120により作成される、図8の例示的なテーブル形式オブジェクト・クラスタ580に対応するテーブル600を示す。
「原油(Crude Oils)」見出しの下の第1の列において、適格なマトリックスの計算の便宜のために、テーブル内のデータ・セルが各列内に同じ行数を有するようにするために、コグニティブな文書デジタル化エンジン120は、行602及び603、行604、605及び606、行607及び608、並びに行609及び610に示されるように、データを全ての併合したセル内に複製する。「粘度(センチポアズ)」見出しの下の第2の列において、コグニティブな文書デジタル化エンジン120は、行604及び605に示されるように、データを併合したセル内に同様に複製する。
コグニティブな文書デジタル化エンジン120は、各マイクロブロックについての図9の列595内のイメージのような非テキスト・コンテンツを抽出し、ファイル・システム内に格納し、各イメージを参照するためのリンクをテーブル600に入れる。コグニティブな文書デジタル化エンジン120は、イメージを、テーブル600内のイメージに対するそれぞれの分類テキストと置き換える。
図11は、本明細書に記載される1つ又は複数の実施形態による、さらに別の例示的なテーブル形式オブジェクト・クラスタ620の部分を示し、図12は、本明細書に記載される1つ又は複数の実施形態による、コグニティブな文書デジタル化エンジン120により作成される、図11のテーブル形式オブジェクト・クラスタ620内のセル623に対応するネストしたテーブル630を示す。
コグニティブな文書デジタル化エンジン120は、テーブル形式オブジェクト・クラスタ620を、セルが別のテーブルであることを示す、ネストしたセルを有するテーブル・クラスとして分類する。ネストしたテーブルは、請求書及び他の形態の文書のために一般的に使用され、ネストしたテーブルから計算データを正確に自動的に抽出する有用性が望ましい。コグニティブな文書デジタル化エンジン120は、「説明」列のセル内の第2のテーブル形式オブジェクト・クラスタ625を抽出する。コグニティブな文書デジタル化エンジン120は、第2のテーブル形式オブジェクト・クラスタ625に基づいて図12の内部テーブル630を作成し、内部テーブル630はデータ・セル623からの「J33409 Hydro of CO2 cylinder」テキストと関連付けられているので、テーブル形式オブジェクト・クラスタ620に基づいて外部テーブルのデータ・セル623から内部テーブル630をリンクする。従って、コグニティブな文書デジタル化エンジン120は、外部テーブルと内部テーブル630との間の意味関係を維持する。
コグニティブな文書デジタル化エンジン120は、第2のテーブル形式オブジェクト・クラスタ625から3つの列を識別する。データ「1」及びテキスト「#TFIR.CO2....」は、「x」記号により分離され、データ「137.50」が後に続く。意味分析及び/又はキー・オントロジ・データに基づいて、コグニティブな文書デジタル化エンジン120は、「x」は通常は乗算を示すものであり、「137.50」は、金額データ・タイプのものであるので、データ「1」及びテキスト「#TFIR.CO2....」を分離可能なデータとして別個の列内に抽出する。
コグニティブな文書デジタル化エンジン120は、第2のテーブル形式オブジェクト・クラスタ625から3×3のデータ・マトリックスを識別し、各列内のマイクロブロック、一番上の行631の列見出し、及び3つの行633、635、637を識別することにより、第2のテーブル630を構築する。
図13~図15は、本明細書に記載される1つ又は複数の態様による、コンピュータ・システム及びクラウド・コンピューティングを含むコンピューティングの種々の態様を示す。
本開示はクラウド・コンピューティングについての詳細な説明を含むが、本明細書に記載される教示の実装は、クラウド・コンピューティング環境に限定されないことを理解されたい。むしろ、本発明の実施形態は、現在既知の又は後で開発される他のいずれかのタイプのコンピューティング環境と共に実施することができる。
クラウド・コンピューティングは、最小限の管理労力又はサービス・プロバイダとの対話で迅速にプロビジョニング及び解放することができる構成可能なコンピューティング・リソース(例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想マシン、及びサービス)の共有プールへの、便利なオンデマンドのネットワーク・アクセスを可能にするためのサービス配信のモデルである。このクラウド・モデルは、少なくとも5つの特徴、少なくとも3つのサービス・モデル、及び少なくとも4つのデプロイメント・モデルを含むことができる。
特徴は、以下の通りである。
オンデマンド・セルフサービス:クラウド・コンシューマは、必要に応じて、サーバ時間及びネットワーク・ストレージ等のコンピューティング機能を、人間がサービスのプロバイダと対話する必要なく自動的に、一方的にプロビジョニングすることができる。
広範なネットワーク・アクセス:機能は、ネットワーク上で利用可能であり、異種のシン又はシック・クライアント・プラットフォーム(例えば、携帯電話、ラップトップ、及びPDA)による使用を促進する標準的な機構を通じてアクセスされる。
リソース・プール化:プロバイダのコンピューティング・リソースは、マルチ・テナント・モデルを用いて、異なる物理及び仮想リソースを要求に応じて動的に割り当て及び再割り当てすることにより、複数のコンシューマにサービスを提供するためにプールされる。コンシューマは、一般に、提供されるリソースの正確な位置についての制御又は知識を持たないという点で、位置とは独立しているといえるが、より抽象化レベルの高い位置(例えば、国、州、又はデータセンタ)を特定できる場合がある。
迅速な弾力性:機能は、迅速かつ弾力的に、場合によっては自動的に、プロビジョニングして素早くスケール・アウトし、迅速にリリースして素早くスケール・インさせることができる。コンシューマにとって、プロビジョニングに利用可能なこれらの機能は、多くの場合、無制限であり、いつでもどんな量でも購入できるように見える。
計測されるサービス:クラウド・システムは、サービスのタイプ(例えば、ストレージ、処理、帯域幅、及びアクティブなユーザ・アカウント)に適した何らかの抽象化レベルでの計量機能を用いることによって、リソースの使用を自動的に制御及び最適化する。リソース使用を監視し、制御し、報告し、利用されるサービスのプロバイダとコンシューマの両方に対して透明性をもたらすことができる。
サービス・モデルは以下の通りである。
Software as a Service(SaaS):クラウド・インフラストラクチャ上で動作しているプロバイダのアプリケーションを使用するために、コンシューマに提供される機能である。これらのアプリケーションは、ウェブ・ブラウザ(例えば、ウェブ・ベースの電子メール)などのシン・クライアント・インターフェースを通じて、種々のクライアント・デバイスからアクセス可能である。コンシューマは、限定されたユーザ固有のアプリケーション構成設定の考え得る例外として、ネットワーク、サーバ、オペレーティング・システム、ストレージ、又は個々のアプリケーション機能をも含めて、基礎をなすクラウド・インフラストラクチャを管理又は制御しない。
Platform as a Service(PaaS):プロバイダによってサポートされるプログラミング言語及びツールを用いて生成された、コンシューマが生成した又は取得したアプリケーションを、クラウド・インフラストラクチャ上にデプロイするために、コンシューマに提供される機能である。コンシューマは、ネットワーク、サーバ、オペレーティング・システム、又はストレージなどの基礎をなすクラウド・インフラストラクチャを管理又は制御しないが、配備されたアプリケーション、及び場合によってはアプリケーション・ホスティング環境構成に対して制御を有する。
Infrastructure as a Service(IaaS):コンシューマが、オペレーティング・システム及びアプリケーションを含み得る任意のソフトウェアを配備及び動作させることができる、処理、ストレージ、ネットワーク、及び他の基本的なコンピューティング・リソースをプロビジョニンングするために、コンシューマに提供される機能である。コンシューマは、基礎をなすクラウド・インフラストラクチャを管理又は制御しないが、オペレーティング・システム、ストレージ、配備されたアプリケーションに対する制御、及び場合によってはネットワーク・コンポーネント(例えば、ホストのファイアウォール)選択の限定された制御を有する。
デプロイメント・モデルは以下の通りである。
プライベート・クラウド:クラウド・インフラストラクチャは、ある組織のためだけに運営される。このクラウド・インフラストラクチャは、その組織又は第三者によって管理することができ、オンプレミス又はオフプレミスに存在することができる。
コミュニティ・クラウド:クラウド・インフラストラクチャは、幾つかの組織によって共有され、共通の関心事項(例えば、任務、セキュリティ要件、ポリシー、及びコンプライアンス上の考慮事項)を有する特定のコミュニティをサポートする。クラウド・インフラストラクチャは、その組織又は第三者によって管理することができ、オンプレミス又はオフプレミスに存在することができる。
パブリック・クラウド:クラウド・インフラストラクチャは、一般公衆又は大規模な業界グループに利用可能であり、クラウド・サービスを販売する組織によって所有される。
ハイブリッド・クラウド:クラウド・インフラストラクチャは、固有のエンティティのままであるが、データ及びアプリケーションの移行性を可能にする標準化された又は専用の技術(例えば、クラウド間の負荷分散のためのクラウド・バースティング)によって結び付けられる2つ以上のクラウド(プライベート、コミュニティ、又はパブリック)の混成物である。
クラウド・コンピューティング環境は、ステートレス性、低結合性、モジュール性、及びセマンティック相互運用性に焦点を置くことを指向するサービスである。クラウド・コンピューティングの中心は、相互接続されたノードのネットワークを含むインフラストラクチャである。
ここで図13を参照すると、コンピュータ・システム/クラウド・コンピューティング・ノードの例の概略が示される。クラウド・コンピューティング・ノード10は、適切なクラウド・コンピューティング・ノードの一例にすぎず、本明細書で記載される本発明の実施形態の使用範囲又は機能に関するいずれかの限定を示唆することを意図していない。それにもかかわらず、クラウド・コンピューティング・ノード10は、本明細書で上述される機能のいずれも実装及び/又は実行することができる。
クラウド・コンピューティング・ノード10において、多数の他の汎用又は専用コンピューティング・システム環境又は構成で動作可能であるコンピュータ・システム12がある。コンピュータ・システム12と共に使用するのに好適であり得る周知のコンピューティング・システム、環境、及び/又は構成の例としては、これらに限定されるものではないが、パーソナル・コンピュータ・システム、サーバ・コンピュータ・システム、シン・クライアント、シック・クライアント、手持ち式又はラップトップ型デバイス、マルチプロセッサ・システム、マイクロプロセッサ・ベースのシステム、セット・トップ・ボックス、プログラム可能民生電子機器、ネットワークPC、ミニコンピュータ・システム、メインフレーム・コンピュータ・システム、及び、上述のシステム若しくはデバイスのいずれかを含む分散型クラウド・コンピューティング環境等が含まれる。
コンピュータ・システム12は、コンピュータ・システムによって実行される、プログラム・プロセスなどのコンピュータ・システム実行可能命令の一般的な文脈で説明することができる。一般に、プログラム・プロセスは、特定のタスクを実行する又は特定の抽象データ型を実装する、ルーチン、プログラム、オブジェクト、コンポーネント、論理、データ構造などを含むことができる。コンピュータ・システム12は、通信ネットワークを通じてリンクされた遠隔処理デバイスによってタスクが実行される分散型クラウド・コンピューティング環境で実施することができる。分散型クラウド・コンピューティング環境において、プログラム・プロセスは、メモリ・ストレージ・デバイスを含む、ローカル及び遠隔両方のコンピュータ・システム・ストレージ媒体に配置することができる。
図13に示されるように、クラウド・コンピューティング・ノード10におけるコンピュコンピュータ・システム12が、汎用コンピューティング・デバイスの形で示される。コンピュータ・システム12のコンポーネントは、これらに限定されるものではないが、1つ又は複数のプロセッサ16、システム・メモリ28、及びシステム・メモリ28を含む種々のシステム・コンポーネントをプロセッサ16に結合するバス18を含むことができる。
バス18は、メモリ・バス又はメモリ・コントローラ、周辺バス、アクセラレーテッド・グラフィックス・ポート、及び種々のバス・アーキテクチャのいずれかを用いるプロセッサ又はローカル・バスを含む、幾つかのタイプのバス構造のうちのいずれかの1つ又は複数を表す。限定ではなく例としては、このようなアーキテクチャは、業界標準アーキテクチャ(Industry Standard Architecture、ISA)バス、マイクロ・チャネル・アーキテクチャ(Micro Channel Architecture、MCA)バス、Enhanced ISA(EISA)バス、Video Electronics Standards Association(VESA)ローカル・バス、及びPeripheral Component Interconnect(PCI)バスを含む。
コンピュータ・システム12は、典型的には、種々のコンピュータ・システム可読媒体を含む。このような媒体は、コンピュータ・システム12によりアクセス可能ないずれかの利用可能媒体とすることができ、揮発性媒体及び不揮発性媒体の両方と、取り外し可能媒体及び取り外し不能媒体の両方とを含む。
システム・メモリ28は、ランダム・アクセス・メモリ(RAM)30及び/又はキャッシュ・メモリ32など、揮発性メモリの形のコンピュータ・システム可読媒体を含むことができる。コンピュータ・システム12は、他の取り外し可能/取り外し不能、揮発性/不揮発性のコンピュータ・システム・ストレージ媒体をさらに含むことができる。単なる例として、取り外し不能の不揮発性磁気媒体(図示されておらず、典型的には「ハード・ドライブ」と呼ばれる)との間の読み出し及び書き込みのために、ストレージ・システム34を設けることができる。図示されていないが、取り外し可能な不揮発性磁気ディスク(例えば、「フロッピー・ディスク」)との間の読み出し及び書き込みのための磁気ディスク・ドライブと、CD-ROM、DVD-ROM又は他の光媒体などの取り外し可能な不揮発性光ディスクとの間の読み出し及び書き込みのための光ディスク・ドライブとを設けることができる。このような例においては、それぞれを、1つ又は複数のデータ媒体インターフェースによってバス18に接続することができる。以下でさらに示され説明されるように、メモリ28は、本発明の実施形態の機能を実行するように構成されたプログラム・プロセスのセット(例えば、少なくとも1つ)を有する少なくとも1つのプログラム製品を含むことができる。
限定ではなく例として、プログラム・プロセス42のセット(少なくとも1つ)を有する1つ又は複数のプログラム40、並びにオペレーティング・システム、1つ又は複数のアプリケーション・プログラム、他のプログラム・プロセス、及びプログラム・データをメモリ28内に格納することができる。オペレーティング・システムの各々、1つ又は複数のアプリケーション・プログラム、他のプログラム・プロセス、及びプログラム・データ又はその何らかの組み合わせは、図1のコグニティブな文書デジタル化エンジン120の実装を含むことができる。コグニティブな文書デジタル化エンジン120におけるようなプログラム・プロセス42は、一般的に、本明細書で説明される本発明の実施形態の機能及び/又は方法を実行する。
コンピュータ・システム12は、キーボード、ポインティング・デバイス、ディスプレイ24等のような1つ又は複数の外部デバイス14、ユーザがコンピュータ・システム12と対話することを可能にする1つ又は複数のデバイス、及び/又はコンピュータ・システム12が1つ又は複数の他のコンピューティング・デバイスと通信することを可能にするいずれかのデバイス(例えば、ネットワーク・カード、モデム等)と通信することもできる。このような通信は、入力/出力(I/O)インターフェース22を介して行うことができる。さらに、コンピュータ・システム12は、ネットワーク・アダプタ20を介して、ローカル・エリア・ネットワーク(LAN)、汎用広域ネットワーク(WAN)、及び/又はパブリック・ネットワーク(例えば、インターネット)などの1つ又は複数のネットワークと通信することもできる。示されるように、ネットワーク・アダプタ20は、バス18を介して、コンピュータ・システム12の他のコンポーネントと通信する。図示されないが、コンピュータ・システム12と共に他のハードウェア及び/又はソフトウェア・コンポーネントを使用できることを理解されたい。例としては、これらに限定されるものではないが、マイクロコード、デバイス・ドライバ、冗長プロセッサ、外部のディスク・ドライブ・アレイ、RAIDシステム、テープ・ドライブ、及びデータ・アーカイブ・ストレージ・システム等が含まれる。
ここで図14を参照すると、例示的クラウド・コンピューティング環境50が示される。示されるように、クラウド・コンピューティング環境50は、例えば携帯情報端末(PDA)又は携帯電話54A、デスクトップ・コンピュータ54B、ラップトップ・コンピュータ54C、及び/又は自動車コンピュータ・システム54Nなどといった、クラウド・コンシューマによって用いられるローカル・コンピューティング・デバイスと通信できる1つ又は複数のクラウド・コンピューティング・ノード10を含む。ノード10は、互いに通信することができる。これらのノードは、上述のようなプライベート・クラウド、コミュニティ・クラウド、パブリック・クラウド、若しくはハイブリッド・クラウド、又はこれらの組み合わせなど、1つ又は複数のネットワークにおいて物理的又は仮想的にグループ化することができる(図示せず)。これにより、クラウド・コンピューティング環境50が、クラウド・コンシューマがローカル・コンピューティング・デバイス上にリソースを保持する必要のないサービスとして、インフラストラクチャ、プラットフォーム、及び/又はソフトウェアを提供することが可能になる。図14に示されるコンピューティング・デバイス54A~Nのタイプは単に例示であることを意図し、コンピューティング・ノード10及びクラウド・コンピューティング環境50は、いずれのタイプのネットワーク及び/又はネットワーク・アドレス指定可能な接続上でも(例えば、ウェブ・ブラウザを用いて)、いずれのタイプのコンピュータ化されたデバイスとも通信できることを理解されたい。
ここで図15を参照すると、クラウド・コンピューティング環境50(図14)によって提供される機能抽象化層のセットが示される。図15に示されるコンポーネント、層、及び機能は単に例示であることを意図し、本発明の実施形態はそれらに限定されないことを予め理解されたい。図示されるように、以下の層及び対応する機能が提供される。
ハードウェア及びソフトウェア層60は、ハードウェア及びソフトウェア・コンポーネントを含む。ハードウェア・コンポーネントの例として、メインフレーム61と、RISC(Reduced Instruction Set Computer(縮小命令セット・コンピュータ))アーキテクチャ・ベースのサーバ62と、サーバ63と、ブレード・サーバ64と、ストレージ・デバイス65と、ネットワーク及びネットワーキング・コンポーネント66とが含まれる。幾つかの実施形態において、ソフトウェア・コンポーネントは、ネットワーク・アプリケーション・サーバ・ソフトウェア67及びデータベース・ソフトウェア68を含む。
仮想化層70は、抽象化層を提供し、この層により、仮想エンティティの以下の例、すなわち、仮想サーバ71、仮想ストレージ72、仮想プライベート・ネットワークを含む仮想ネットワーク73、仮想アプリケーション及びオペレーティング・システム74、並びに仮想クライアント75を提供することができる。
一例においては、管理層80は、以下で説明される機能を提供することができる。リソース・プロビジョニング81は、クラウド・コンピューティング環境内でタスクを実行するために利用されるコンピューティング・リソース及び他のリソースの動的な調達を提供する。計量及び価格決定82は、クラウド・コンピューティング環境内でリソースが利用される際のコスト追跡と、これらのリソースの消費に対する課金又は請求とを提供する。一例においては、これらのリソースは、アプリケーション・ソフトウェア・ライセンスを含むことができる。セキュリティは、クラウド・コンシューマ及びタスクに対する識別情報の検証と、データ及び他のリソースに対する保護とを提供する。ユーザ・ポータル83は、コンシューマ及びシステム管理者のために、クラウド・コンピューティング環境へのアクセスを提供する。サービス・レベル管理84は、要求されるサービス・レベルが満たされるように、クラウド・コンピューティング・リソースの割り当て及び管理を提供する。サービス・レベル・アグリーメント(Service Level Agreement、SLA)の計画及び履行85は、SLAに従って将来の要件が予測されるクラウド・コンピューティング・リソースの事前配置及び調達を提供する。
ワークロード層90は、クラウド・コンピューティング環境を利用することができる機能の例を提供する。この層から提供することができるワークロード及び機能の例として、マッピング及びナビゲーション91、ソフトウェア開発及びライフサイクル管理92、仮想教室教育配信93、データ分析処理94、トランザクション処理95、及び本明細書で説明されるような、コグニティブな文書デジタル化エンジンにより提供される文書デジタル化サービスのための処理コンポーネント96が挙げられる。
本発明は、統合のいずれかの可能な技術的詳細レベルにおける、システム、方法、及び/又はコンピュータ・プログラム製品とすることができる。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令をその上に有するコンピュータ可読ストレージ媒体(単数又は複数)を含むことができる。
コンピュータ可読ストレージ媒体は、命令実行デバイスにより使用される命令を保持及び格納できる有形デバイスとすることができる。コンピュータ可読ストレージ媒体は、例えば、これらに限定されるものではないが、電子記憶装置、磁気記憶装置、光学記憶装置、電磁気記憶装置、半導体記憶装置、又は上記のいずれかの適切な組み合わせとすることができる。コンピュータ可読ストレージ媒体のより具体的な例の非網羅的なリストとして、以下のもの:すなわち、ポータブル・コンピュータ・ディスケット、ハードディスク、ランダム・アクセス・メモリ(RAM)、読み出し専用メモリ(ROM)、消去可能プログラム可能読み出し専用メモリ(EPROM又はフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM)、ポータブル・コンパクト・ディスク読み出し専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリ・スティック、パンチカード若しくは命令がそこに記録された溝内の隆起構造のような機械的にエンコードされたデバイス、及び上記のいずれかの適切な組み合わせが挙げられる。本明細書で使用される場合、コンピュータ可読ストレージ媒体は、電波、又は他の自由に伝搬する電磁波、導波管若しくは他の伝送媒体を通じて伝搬する電磁波(例えば、光ファイバ・ケーブルを通る光パルス)、又はワイヤを通って送られる電気信号などの、一時的信号自体として解釈されない。
本明細書で説明されるコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体からそれぞれのコンピューティング/処理デバイスに、又は、例えばインターネット、ローカル・エリア・ネットワーク、広域ネットワーク、及び/又は無線ネットワークなどのネットワークを介して外部コンピュータ又は外部ストレージ・デバイスにダウンロードすることができる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、及び/又はエッジ・サーバを含むことができる。各コンピューティング/処理デバイスにおけるネットワーク・アダプタ・カード又はネットワーク・インターフェースは、ネットワークからコンピュータ可読プログラム命令を受け取り、コンピュータ可読プログラム命令を転送して、それぞれのコンピューティング/処理デバイス内のコンピュータ可読ストレージ媒体に格納する。
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路のための構成データ、又は、Smalltalk、C++などのオブジェクト指向プログラミング言語、及び、「C」プログラミング言語若しくは類似のプログラミング言語などの従来の手続き型プログラミング言語を含む1つ又は複数のプログラミング言語の任意の組み合わせで記述されるソース・コード又はオブジェクト・コードとすることができる。コンピュータ可読プログラム命令は、完全にユーザのコンピュータ上で実行される場合もあり、一部がユーザのコンピュータ上で、独立型ソフトウェア・パッケージとして実行される場合もあり、一部がユーザのコンピュータ上で実行され、一部が遠隔コンピュータ上で実行される場合もあり、又は完全に遠隔コンピュータ若しくはサーバ上で実行される場合もある。最後のシナリオにおいて、遠隔コンピュータは、ローカル・エリア・ネットワーク(LAN)若しくは広域ネットワーク(WAN)を含むいずれかのタイプのネットワークを通じてユーザのコンピュータに接続される場合もあり、又は外部コンピュータへの接続がなされる場合もある(例えば、インターネットサービスプロバイダを用いたインターネットを通じて)。幾つかの実施形態において、例えば、プログラム可能論理回路、フィールド・プログラマブル・ゲート・アレイ(FPGA)、又はプログラム可能論理アレイ(PLA)を含む電子回路は、本発明の態様を実施するために、コンピュータ可読プログラム命令の状態情報を利用することによって、コンピュータ可読プログラム命令を実行して、電子回路を個別化することができる。
本発明の態様は、本発明の実施形態による方法、装置(システム)及びコンピュータ・プログラム製品のフローチャート図及び/又はブロック図を参照して説明される。フローチャート図及び/又はブロック図の各ブロック、並びにフローチャート図及び/又はブロック図内のブロックの組み合わせは、コンピュータ可読プログラム命令によって実装できることが理解されるであろう。
これらのコンピュータ可読プログラム命令を、汎用コンピュータ、専用コンピュータ、又は他のプログラム可能データ処理装置のプロセッサに与えて機械を製造し、それにより、コンピュータ又は他のプログラム可能データ処理装置のプロセッサによって実行される命令が、フローチャート及び/又はブロック図の1つ又は複数のブロック内で指定された機能/動作を実施するための手段を作り出すようにすることができる。これらのコンピュータ・プログラム命令を、コンピュータ、他のプログラム可能データ処理装置、及び/又は他のデバイスを特定の方式で機能させるように指示することができるコンピュータ可読媒体内に格納し、それにより、そのコンピュータ可読媒体内に格納された命令が、フローチャート及び/又はブロック図の1つ又は複数のブロックにおいて指定された機能/動作の態様を実施する命令を含む製品を含むようにすることもできる。
コンピュータ・プログラム命令を、コンピュータ、他のプログラム可能データ処理装置、又は他のデバイス上にロードして、一連の動作ステップをコンピュータ、他のプログラム可能データ処理装置、又は他のデバイス上で行わせてコンピュータ実施のプロセスを生産し、それにより、コンピュータ又は他のプログラム可能装置上で実行される命令が、フローチャート及び/又はブロック図の1つ又は複数のブロックにおいて指定された機能/動作を実行するためのプロセスを提供するようにすることもできる。
図面内のフローチャート及びブロック図は、本発明の様々な実施形態による、システム、方法、及びコンピュータ・プログラム製品の可能な実装の、アーキテクチャ、機能及び動作を示す。この点に関して、フローチャート内の各ブロックは、指定された論理機能を実装するための1つ又は複数の実行可能命令を含む、モジュール、セグメント、又はコードの一部を表すことができる。幾つかの代替的な実装において、ブロック内に示される機能は、図に示される順序とは異なる順序で生じることがある。例えば、連続して示される2つのブロックは、関与する機能に応じて、実際には実質的に同時に実行されることもあり、又はこれらのブロックはときとして逆順で実行されることもある。ブロック図及び/又はフローチャート図の各ブロック、及びブロック図及び/又はフローチャート図内のブロックの組み合わせは、指定された機能又は動作を実行する、又は専用のハードウェアとコンピュータ命令との組み合わせを実行する、専用ハードウェア・ベースのシステムによって実装できることにも留意されたい。
本明細書で用いられる用語は、特定の実施形態を説明することのみを目的とし、本発明を限定することを意図したものではない。本明細書内で用いられる場合、単数形「1つの(a)」、「1つの(an)」及び「その(the)」は、文脈がそうでないことを明確に示していない限り、複数形も含むことを意図している。さらに、用語「含む(comprise)」(及び、compriseの任意の形態、例えば「comprises」及び「comprising」)、「有する(have)」(及び、haveの任意の形態、例えば「has」及び「having」)、「含む(include)」(及び、includeの任意の形態、例えば「includes」及び「including」)、並びに「含有する(contain)」(及び、containの任意の形態、例えば「contains」及び「containing」)は、変更可能な連結動詞(open-ended linking verbs)であることが理解されるであろう。その結果、1つ又は複数のステップ又は要素を「含む(comprise)」、「有する(have)」、「含む(include)」、又は「含有する(contain)」方法又はデバイスは、1つ又は複数のステップ又は要素を保有するが、それらの1つ又は複数のステップ又は要素のみを保有することに限定されるものではない。同様に、1つ又は複数の特徴を「含む(comprise)」、「有する(have)」、「含む(include)」、又は「含有する(contain)」、方法のステップ又はデバイスの要素は、それらの1つ又は複数の特徴を保有するが、それらの1つ又は複数の特徴のみを保有することに限定されるものではない。本明細書で「~に基づく(based on)」という用語の形態は、要素が部分的に基づく場合の関係、並びに要素が全体的に基づく場合の関係を含む。特定の数の要素を有するものとして記載される方法、製品及びシステムは、特定の数より少ない又はそれより多い要素で実施されることもある。さらに、特定の方法で構成されたデバイス又は構造は、少なくともその方法で構成されるが、列挙されていない方法で構成されることもある。
以下の特許請求の範囲に存在する場合、「手段又はステップと機能との組合せ(ミーンズ又はステップ・プラス・ファンクション)」要素の対応する構造、材料、動作及び均等物は、明確に特許請求された他の特許請求される要素と共に機能を実行するための任意の構造、材料、又は動作を含むことを意図したものである。本明細書に記載される説明は、例証及び説明のためだけに提示されたものであり、網羅的であること又は本発明を開示した形態に限定することを意図したものではない。当業者には、本開示の範囲及び趣旨から逸脱することなく、多くの修正及び変形が明らかであろう。実施形態は、本明細書に記載される1つ又は複数の態様の原理、実際の用途を最も良く説明するため、及び考えられる特定の使用に適するものとして種々の変形を有する種々の実施形態において、当業者が、本明細書に説明される1つ又は複数の態様を理解するのを可能にするために、選択され説明された。

(付記)
以下に、本明細書に記載した技術的事項の範囲に含まれる発明の態様の一部を確認的に例示する。

1.
コンピュータの情報処理により、文書イメージからデータを抽出する方法であって、
テーブル形式のオブジェクト・クラスタを含む前記文書イメージを取得することと、
前記テーブル形式オブジェクト・クラスタ内の複数のマクロブロックを識別することであって、それぞれのマクロブロックは共線性オブジェクトを含む、識別することと、
各マクロブロック内で、それぞれのマイクロブロックから1つ又は複数の候補セルを特定することと、
前記特定した候補セルに基づいて、前記テーブル形式オブジェクト・クラスタを、テーブル・クラスの所定のセットからの1つのテーブル・クラスに分類することと、
前記テーブル・クラスに従って、各マクロブロックについての前記1つ又は複数の候補セルからデータを抽出することであって、前記抽出されたデータは、コンピュータ・プログラムにより計算可能である、抽出することと、
前記抽出されたデータから1つ又は複数の2次元(2D)アレイを作成することであって、前記1つ又は複数の2Dアレイは、第1の次元に、前記テーブル形式オブジェクト・クラスタ内の複数のマクロブロックを有する、作成することと、
を含む、方法。

2.
前記テーブル形式オブジェクト・クラスタのマクロブロックは、テーブルの列に対応し、列は、各列の同じ行内にそれぞれの見出しを有し得る、上記1.に記載の方法。

3.
前記識別することは、
前記テーブル形式オブジェクト・クラスタから垂直方向の共線性オブジェクトの2つ又それより多いグループの列定義属性を分析することにより、前記複数のマクロブロックから各マクロブロックを判断することであって、前記列定義属性は、いずれかの2つの隣接するマクロブロック間の絶対距離、いずれかの2つの隣接うるマクロブロック間の相対距離、意味的補間、及び各マクロブロックについての相対スタイルを含む、判断することを含む、上記1.に記載の方法。

4.
上記いずれかの方法において、前記特定することは、
それぞれのシーケンス番号を各マクロブロック内のそれぞれのマイクロブロックに割り当てることにより、前記テーブル形式オブジェクト・クラスタの各マクロブロック内のそれぞれのマイクロブロックを順序付けることであって、各マイクロブロックは、文字及び/又は記号内に表される1つ又は複数の単語のブロックに対応する、順序付けることと、
全てのマクロブロックにわたって前記同じシーケンス番号を有するマイクロブロックの間の位置関係を分析することと、
を含む、上記1.に記載の方法。

5.
前記分類することは、
前記識別されたマクロブロックと前記特定された候補セルとの間の位置関係に基づいて、前記テーブル・クラスを前記テーブル形式オブジェクト・クラスタに割り当てることであって、前記テーブル・クラスの所定のセットは、併合したセルを有するテーブルの第1のテーブル・クラス、不明確なセル境界線を有するテーブルの第2のテーブル・クラス、及びネストしたセルを有するテーブルの第3のテーブル・クラスを含む、割り当てることを含む、上記1.に記載の方法。

6.
前記抽出することは、
候補セルに対応するキー値ペアを作成することであって、前記キー値ペアのキーは、前記候補セルが特定するマクロブロックの見出しであり、前記マクロブロックの前記見出しは、前記見出しが前記候補セルについての正しいキーである尤度を示す信頼性レベルと関連付けられる、作成することを含む、上記1.に記載の方法。

7.
上記1.から6.までのいずれかに記載の方法をコンピュータに実行させるコンピュータ・プログラム。

8.
上記7.に記載のコンピュータ・プログラムを格納したコンピュータ可読ストレージ媒体。

9.
メモリと、
前記メモリと通信する少なくとも1つのプロセッサと、
前記メモリを介して前記少なくとも1つのプロセッサにより実行可能な、上記1.から6.までのいずれかに記載の方法を実行するためのプログラム命令と、
を含む、システム。
10:クラウド・コンピューティング・ノード
12:コンピューティング・システム
16:プロセッサ
18:バス
28:システム・メモリ
42:プログラム・プロセス
50:コンピューティング環境
100:システム
101:ユーザ
110:ユーザ・デバイス
120:コグニティブな文書デジタル化エンジン
130:意味データベース
131:文書クラス
133:キー・クラス
135:キー・エイリアス
137:キー・オントロジ・データ
138:キー
140:文書メタデータ
145:マイクロブロック特徴
150:リレーショナル・データベース
155:キー値ペア(KVP)
170:外部ツール
181:文書イメージ
500:文書
550、580、620、625:テーブル形式オブジェクト・クラスタ
560:層状ボックス・セクション
570、600、630:テーブル

Claims (7)

  1. コンピュータの情報処理により、文書イメージからデータを抽出する方法であって、
    複数のオブジェクトを含む前記文書イメージを取得することと、
    前記複数のオブジェクトにそれぞれ対応する複数のマイクロブロックを識別することであって、前記マイクロブロックの各々は、コンテンツ、位置及びスタイルと関連付けられる、識別することと、
    第1のマイクロブロック及び第2のマイクロブロックのそれぞれの位置特徴、並びに調整可能な共線性パラメータに基づいて、第1のマイクロブロックが第2のマイクロブロックと共線性を有することを発見することと、
    前記第1のマイクロブロック及び前記第2のマイクロブロックを有するマクロブロックを識別することであって、前記マクロブロックは、コンピュータ・プログラムにより計算可能なキー値ペアを構成する、識別することと、
    発見的手法に基づいて信頼性レベルを前記キー値ペアと関連付けることと、
    前記キー値ペア及び前記関連付けられた信頼性レベルをユーザに通信することと、
    を含み、
    前記発見することは、
    前記第1のマイクロブロック及び前記第2のマイクロブロックの前記それぞれの位置特徴の分析に基づいて、前記第1のマイクロブロック及び前記第2のマイクロブロックが互いに直ぐ隣接していることを確認することと、
    前記第1のマイクロブロック及び前記第2のマイクロブロックの両方とも、別のマイクロブロックを囲んでいない特定の幾何学領域内に囲まれていることを確認することと、
    前記第1のマイクロブロック及び前記第2のマイクロブロックが共線性を有すると判断することと、
    を含む、方法。
  2. コンピュータの情報処理により、文書イメージからデータを抽出する方法であって、
    複数のオブジェクトを含む前記文書イメージを取得することと、
    前記複数のオブジェクトにそれぞれ対応する複数のマイクロブロックを識別することであって、前記マイクロブロックの各々は、コンテンツ、位置及びスタイルと関連付けられる、識別することと、
    第1のマイクロブロック及び第2のマイクロブロックのそれぞれの位置特徴、並びに調整可能な共線性パラメータに基づいて、第1のマイクロブロックが第2のマイクロブロックと共線性を有することを発見することと、
    前記第1のマイクロブロック及び前記第2のマイクロブロックを有するマクロブロックを識別することであって、前記マクロブロックは、コンピュータ・プログラムにより計算可能なキー値ペアを構成する、識別することと、
    発見的手法に基づいて信頼性レベルを前記キー値ペアと関連付けることと、
    前記キー値ペア及び前記関連付けられた信頼性レベルをユーザに通信することと、
    を含み、
    前記発見することは、
    前記第1のマイクロブロック及び前記第2のマイクロブロックの前記それぞれの位置特徴の分析に基づいて、前記第1のマイクロブロック及び前記第2のマイクロブロックが互いに直ぐ隣接していることを確認することと、
    前記第1のマイクロブロック及び前記第2のマイクロブロックの両方のそれぞれの意味コンテンツを分析することであって、前記意味コンテンツは、前記調整可能な共線性パラメータのメンバーである、分析することと、
    前記第1のマイクロブロックの第1の意味コンテンツがキー名と関連付けられることを確認することと、
    前記キー名に対応するキー・オントロジ・データから、前記第2のマイクロブロックの第2の意味コンテンツが前記キー名に対応するデータ・タイプのものであることを発見することと、
    前記第1のマイクロブロック及び前記第2のマイクロブロックが共線性を有すると判断することと、
    を含む、方法。
  3. コンピュータの情報処理により、文書イメージからデータを抽出する方法であって、
    複数のオブジェクトを含む前記文書イメージを取得することと、
    前記複数のオブジェクトにそれぞれ対応する複数のマイクロブロックを識別することであって、前記マイクロブロックの各々は、コンテンツ、位置及びスタイルと関連付けられる、識別することと、
    第1のマイクロブロック及び第2のマイクロブロックのそれぞれの位置特徴、並びに調整可能な共線性パラメータに基づいて、第1のマイクロブロックが第2のマイクロブロックと共線性を有することを発見することと、
    前記第1のマイクロブロック及び前記第2のマイクロブロックを有するマクロブロックを識別することであって、前記マクロブロックは、コンピュータ・プログラムにより計算可能なキー値ペアを構成する、識別することと、
    発見的手法に基づいて信頼性レベルを前記キー値ペアと関連付けることと、
    前記キー値ペア及び前記関連付けられた信頼性レベルをユーザに通信することと、
    を含み、
    記スタイルは、フォント・タイプ、フォント・サイズ、段落アラインメント、及びゼロ又はそれより多い句読区切り文字を含み、前記調整可能な共線性パラメータは、前記スタイルを含む、方法。
  4. コンピュータの情報処理により、文書イメージからデータを抽出する方法であって、
    複数のオブジェクトを含む前記文書イメージを取得することと、
    前記複数のオブジェクトにそれぞれ対応する複数のマイクロブロックを識別することであって、前記マイクロブロックの各々は、コンテンツ、位置及びスタイルと関連付けられる、識別することと、
    第1のマイクロブロック及び第2のマイクロブロックのそれぞれの位置特徴、並びに調整可能な共線性パラメータに基づいて、第1のマイクロブロックが第2のマイクロブロックと共線性を有することを発見することと、
    前記第1のマイクロブロック及び前記第2のマイクロブロックを有するマクロブロックを識別することであって、前記マクロブロックは、コンピュータ・プログラムにより計算可能なキー値ペアを構成する、識別することと、
    発見的手法に基づいて信頼性レベルを前記キー値ペアと関連付けることと、
    前記キー値ペア及び前記関連付けられた信頼性レベルをユーザに通信することと、
    を含み、
    前記文書イメージの文書クラスを確認することと、
    前記文書クラスにおいて指定されたクラス・キーが前記文書イメージについてのマクロブロックのセットから欠落していると判断することと、
    前記欠落しているクラス・キーに対応するエイリアスを探して前記識別されたマクロブロックから前記マイクロブロックのそれぞれのコンテンツを検索することと、
    前記エイリアスをコンテンツとして有する前記マイクロブロックの1つと関連付けられた別のマクロブロックを選択することと、
    前記欠落しているクラス・キーについてのキー値ペアの代わりに前記選択された別のマクロブロックにおける別のキー値ペアを識別することと、
    をさらに含む、方法。
  5. 請求項1から請求項4までのいずれか1項に記載の方法をコンピュータに実行させるコンピュータ・プログラム。
  6. 請求項5に記載のコンピュータ・プログラムを格納したコンピュータ可読ストレージ媒体。
  7. メモリと、
    前記メモリと通信する少なくとも1つのプロセッサと、
    前記メモリを介して前記少なくとも1つのプロセッサにより実行可能な、請求項1から請求項4までのいずれか1項に記載の方法を実行するためのプログラム命令と、
    を含む、システム。
JP2020526307A 2017-12-01 2018-11-23 コグニティブな文書イメージのデジタル化のための方法、コンピュータ・プログラム及びシステム Active JP7201299B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/829,304 2017-12-01
US15/829,304 US10592738B2 (en) 2017-12-01 2017-12-01 Cognitive document image digitalization
PCT/IB2018/059248 WO2019106505A1 (en) 2017-12-01 2018-11-23 Cognitive document image digitization

Publications (2)

Publication Number Publication Date
JP2021504787A JP2021504787A (ja) 2021-02-15
JP7201299B2 true JP7201299B2 (ja) 2023-01-10

Family

ID=66659260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020526307A Active JP7201299B2 (ja) 2017-12-01 2018-11-23 コグニティブな文書イメージのデジタル化のための方法、コンピュータ・プログラム及びシステム

Country Status (6)

Country Link
US (1) US10592738B2 (ja)
JP (1) JP7201299B2 (ja)
CN (1) CN111406262B (ja)
DE (1) DE112018005418T5 (ja)
GB (1) GB2582722B (ja)
WO (1) WO2019106505A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10452904B2 (en) * 2017-12-01 2019-10-22 International Business Machines Corporation Blockwise extraction of document metadata
US10824805B2 (en) * 2018-10-22 2020-11-03 Astute Review, LLC Systems and methods for automated review and editing of presentations
US11113095B2 (en) 2019-04-30 2021-09-07 Automation Anywhere, Inc. Robotic process automation system with separate platform, bot and command class loaders
US11481304B1 (en) 2019-12-22 2022-10-25 Automation Anywhere, Inc. User action generated process discovery
US20220108106A1 (en) * 2020-10-05 2022-04-07 Automation Anywhere, Inc. Machined learning supporting document data extraction
CN112906572B (zh) * 2021-02-20 2024-02-27 广联达科技股份有限公司 施工图中纵断面的识别方法及识别装置
KR102655430B1 (ko) * 2021-02-22 2024-04-08 네이버 주식회사 테이블 생성 방법 및 시스템
WO2022182111A1 (ko) * 2021-02-23 2022-09-01 네이버 주식회사 테이블 생성 방법 및 시스템, 그리고 테이블 인식 방법 및 시스템
EP4099215B1 (en) 2021-06-03 2024-01-10 Telefonica Cibersecurity & Cloud Tech S.L.U. Computer vision method for detecting document regions that will be excluded from an embedding process and computer programs thereof
US11881042B2 (en) 2021-11-30 2024-01-23 International Business Machines Corporation Semantic template matching
CN114548219A (zh) * 2022-01-13 2022-05-27 河北汉光重工有限责任公司 基于微块差异特征提取及svm的图像分类方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006092226A (ja) 2004-09-24 2006-04-06 Fuji Xerox Co Ltd 文書属性取得方法および装置並びにプログラムを記録した記録媒体
JP2011150466A (ja) 2010-01-20 2011-08-04 Fujitsu Ltd 文字列認識装置、文字列認識プログラムおよび文字列認識方法
JP2012208589A (ja) 2011-03-29 2012-10-25 Hitachi Omron Terminal Solutions Corp 帳票認識装置、帳票認識方法およびそのためのプログラム
JP2013196479A (ja) 2012-03-21 2013-09-30 Toshiba Corp 情報処理システム、情報処理プログラム、情報処理方法
US20140369602A1 (en) 2013-06-14 2014-12-18 Lexmark International Technology S.A. Methods for Automatic Structured Extraction of Data in OCR Documents Having Tabular Data

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5721938A (en) 1995-06-07 1998-02-24 Stuckey; Barbara K. Method and device for parsing and analyzing natural language sentences and text
JP3814320B2 (ja) * 1995-12-14 2006-08-30 キヤノン株式会社 画像処理方法及び装置
JPH09231291A (ja) * 1996-02-27 1997-09-05 Mitsubishi Electric Corp 帳票読取方法及びその装置
US20010032218A1 (en) * 2000-01-31 2001-10-18 Huang Evan S. Method and apparatus for utilizing document type definition to generate structured documents
US6778995B1 (en) 2001-08-31 2004-08-17 Attenex Corporation System and method for efficiently generating cluster groupings in a multi-dimensional concept space
US8571809B2 (en) 2003-12-19 2013-10-29 Bio informatics Systems Ltd. Apparatus for calculating scores for chains of sequence alignments
US7849048B2 (en) 2005-07-05 2010-12-07 Clarabridge, Inc. System and method of making unstructured data available to structured data analysis tools
CN101305366B (zh) 2005-11-29 2013-02-06 国际商业机器公司 从非结构化文本提取和显现图表结构化关系的方法和系统
US9043197B1 (en) 2006-07-14 2015-05-26 Google Inc. Extracting information from unstructured text using generalized extraction patterns
US8073865B2 (en) 2009-09-14 2011-12-06 Etsy, Inc. System and method for content extraction from unstructured sources
US9110882B2 (en) 2010-05-14 2015-08-18 Amazon Technologies, Inc. Extracting structured knowledge from unstructured text
CN102375978A (zh) * 2010-08-17 2012-03-14 富士通株式会社 处理图像的方法和设备
US20130205202A1 (en) * 2010-10-26 2013-08-08 Jun Xiao Transformation of a Document into Interactive Media Content
US8645819B2 (en) 2011-06-17 2014-02-04 Xerox Corporation Detection and extraction of elements constituting images in unstructured document files
US9916538B2 (en) * 2012-09-15 2018-03-13 Z Advanced Computing, Inc. Method and system for feature detection
US9251180B2 (en) 2012-05-29 2016-02-02 International Business Machines Corporation Supplementing structured information about entities with information from unstructured data sources
US9471550B2 (en) * 2012-10-16 2016-10-18 Linkedin Corporation Method and apparatus for document conversion with font metrics adjustment for format compatibility
US9268823B2 (en) 2013-05-10 2016-02-23 International Business Machines Corporation Partial match derivation using text analysis
US9424524B2 (en) 2013-12-02 2016-08-23 Qbase, LLC Extracting facts from unstructured text
US20150331936A1 (en) 2014-05-14 2015-11-19 Faris ALQADAH Method and system for extracting a product and classifying text-based electronic documents
US9280831B1 (en) * 2014-10-23 2016-03-08 International Business Machines Corporation Image segmentation
CN106663207A (zh) * 2014-10-29 2017-05-10 微软技术许可有限责任公司 白板和文档图像检测方法和系统
US9569733B2 (en) 2015-02-20 2017-02-14 International Business Machines Corporation Extracting complex entities and relationships from unstructured data
US9704104B2 (en) 2015-02-20 2017-07-11 International Business Machines Corporation Confidence weighting of complex relationships in unstructured data
US10360294B2 (en) 2015-04-26 2019-07-23 Sciome, LLC Methods and systems for efficient and accurate text extraction from unstructured documents
CN104978742B (zh) 2015-06-12 2017-12-05 北京邮电大学 基于级联结构的图像配准方法及装置
CN105279484B (zh) 2015-10-10 2019-08-06 北京旷视科技有限公司 对象检测方法和对象检测装置
CN105487774B (zh) 2015-11-27 2019-04-19 小米科技有限责任公司 图像分组方法及装置
CN105379484A (zh) * 2015-11-30 2016-03-09 巴州良佳农机制造有限公司 一种移栽机取苗装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006092226A (ja) 2004-09-24 2006-04-06 Fuji Xerox Co Ltd 文書属性取得方法および装置並びにプログラムを記録した記録媒体
JP2011150466A (ja) 2010-01-20 2011-08-04 Fujitsu Ltd 文字列認識装置、文字列認識プログラムおよび文字列認識方法
JP2012208589A (ja) 2011-03-29 2012-10-25 Hitachi Omron Terminal Solutions Corp 帳票認識装置、帳票認識方法およびそのためのプログラム
JP2013196479A (ja) 2012-03-21 2013-09-30 Toshiba Corp 情報処理システム、情報処理プログラム、情報処理方法
US20140369602A1 (en) 2013-06-14 2014-12-18 Lexmark International Technology S.A. Methods for Automatic Structured Extraction of Data in OCR Documents Having Tabular Data

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Koichi KISE et al.,"Visiting card understanding system",9th International Conference on Pattern Recognition,米国,IEEE,1988年11月17日,pp.425-429
祖父江 恒夫、渡邉 豊英,"検証処理に基づいた帳票の構造認識法とその評価",第55回(平成9年後期)全国大会講演論文集(2),日本,社団法人情報処理学会,1997年09月26日,pp.200-201

Also Published As

Publication number Publication date
JP2021504787A (ja) 2021-02-15
CN111406262B (zh) 2023-09-22
GB2582722A (en) 2020-09-30
GB2582722B (en) 2021-03-03
US20190171873A1 (en) 2019-06-06
US10592738B2 (en) 2020-03-17
CN111406262A (zh) 2020-07-10
WO2019106505A1 (en) 2019-06-06
GB202009558D0 (en) 2020-08-05
DE112018005418T5 (de) 2020-07-16

Similar Documents

Publication Publication Date Title
JP7201299B2 (ja) コグニティブな文書イメージのデジタル化のための方法、コンピュータ・プログラム及びシステム
JP7289047B2 (ja) ブロックに基づく文書メタデータの抽出のための方法、コンピュータ・プログラム及びシステム
US11887010B2 (en) Data classification for data lake catalog
US10643135B2 (en) Linkage prediction through similarity analysis
JP7488006B2 (ja) 機械学習を使用した表形式データの内容特定方法、システム、プログラム
US11042581B2 (en) Unstructured data clustering of information technology service delivery actions
JP6964383B2 (ja) 文書デジタル化における意味正規化のための方法、コンピュータ・プログラム及びシステム
AU2021257649B2 (en) Vision-based cell structure recognition using hierarchical neural networks and cell boundaries to structure clustering
US20200133970A1 (en) Mining locations and other context information from construction documents
US11500840B2 (en) Contrasting document-embedded structured data and generating summaries thereof
US20150046443A1 (en) Document-based search with facet information
WO2023093259A1 (en) Iteratively updating a document structure to resolve disconnected text in element blocks
US20230266966A1 (en) User support content generation
US11881042B2 (en) Semantic template matching
US11841909B2 (en) Text analytics views for web site sources
US20230419710A1 (en) Information extraction from documents containing handwritten text
US20230409806A1 (en) Permutation invariance for representing linearized tabular data
US11163954B2 (en) Propagation of annotation metadata to overlapping annotations of synonymous type
US20230315980A1 (en) Content association in file editing
US20160062974A1 (en) Recording reasons for metadata changes

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200602

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20200512

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210423

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220502

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220607

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220906

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20221107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221213

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20221213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221220

R150 Certificate of patent or registration of utility model

Ref document number: 7201299

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150