JP2009520246A - カスタマゼーションによらない書式データ抽出 - Google Patents

カスタマゼーションによらない書式データ抽出 Download PDF

Info

Publication number
JP2009520246A
JP2009520246A JP2008537309A JP2008537309A JP2009520246A JP 2009520246 A JP2009520246 A JP 2009520246A JP 2008537309 A JP2008537309 A JP 2008537309A JP 2008537309 A JP2008537309 A JP 2008537309A JP 2009520246 A JP2009520246 A JP 2009520246A
Authority
JP
Japan
Prior art keywords
location
format
data
physical
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008537309A
Other languages
English (en)
Inventor
コーメイ,オファー
Original Assignee
キャラクテル リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by キャラクテル リミテッド filed Critical キャラクテル リミテッド
Publication of JP2009520246A publication Critical patent/JP2009520246A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1456Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on user interactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Character Input (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

デジタル化画像の書式で予めデジタル化される書式から抽出データ項目用の形式処理方法であって、特定タイプのデータ項目に関連する各物理フィールド、1ヵ所以上の物理フィールドの位置に関するユーザーによる指示の促進、ユーザーによって物理フィールドの場所の関してもたらされる1回以上の表示の受け取り、ならびに関連データ様式を利用する物理フィールドのデータ項目の内容と位置の識別からなる形式処理方法。
【選択図】図2

Description

本発明は形式処理に関する。さらに特にこれはカスタマゼーションによらないデータ抽出を利用した形式処理に関する。
通常のビジネスの進行過程では、ほぼすべての機関ではその内容が「ターゲット・アプリケーション」に入力されると同時に転送されなくてはならないデータが含まれる(請求書/送り状、購入発注、クレームなどの)書式が受信される。この「ターゲット・アプリケーション」は1種以上の特定タスクを実行するかあるいはデータをデータベースに格納することができる。形式処理用に知られた諸プログラム(FPA−「形式処理アプリケーション」、あるいはFPP−「形式処理プログラム」)では、通常、入力データを保存するためスキャンされた書式画像にOCR(光学文字認識)技術が適用される。しかしながら、多くの場合、これらの製品ではその適用を可能にするためかなり多量のカスタマゼーション業務が必要とされる。
既存のソフトウェア製品に組み込まれるカスタマゼーション業務には2タイプがある。
普通は、多数の恐らく数百あるいは数千もの様々なレイアウトを有する書式を処理しなくてはならないので、形式処理プログラムではこれらの書式の物理レイアウトに関する事前知識が必要とされる。形式処理プログラムを使用した利用に便利なようにサンプル書式を収集したり事前知識を準備したりするのは普通退屈かつ費用のかかる仕事である。
形式処理プログラムとターゲット・アプリケーションとの連結にもまた相当多量の業務が必要とされる。例えば、形式処理システムによって捕捉されるデータはターゲット・アプリケーションに転送されると同時に、ターゲット・アプリケーション内部の既存データと照合して正しいことの確認が取られなくてはならない。
本発明はスキャンされた書式画像からの捕捉データ処理を単純化すると同時にデータをターゲット・アプリケーションに転送した上で、上で触れられた2タイプのカスタマゼーション業務を事実上、排除することを狙ったものである。
いくつかの既存の形式処理プログラムはOCR技術を利用して書式のスキャン画像からデータを抽出するとともにデータをターゲット・アプリケーションデータファイルに送信する。FPPの一部の例には、Captiva Software Corporation社のFormWare(登録商標)、ABBYY Software House社のFormReader(登録商標)、および AnyDoc Software Corporation社のOCR for AnyDoc(登録商標) がある。
これらとその他のこの手のプログラムは2種のメインモードで稼動する。
セットアップモード:この方式ではユーザーが各書式レイアウトについてテンプレートを定義する。これは、既存の形式処理プロダクツの多くでは、書式のスキャン画像上を長方形領域で囲むことによって行われるとともに、各領域毎にOCRインストラクションが定義される。この領域およびインストラクションの集積が各書式レイアウト毎のテンプレートとして保存される。
ランモード:データが含まれる書式はスキャンされると同時に、テンプレートマッチングアルゴリズムを利用して自動的にテンプレートに合致するものが探された後、それぞれ事前定義領域毎に、標準OCRプログラムによりこれからデータが抽出される。ランモードにおける次に続く段階は人がOCR結果の検証と修正を行うことである。ランモードの最終段階はターゲット・アプリケーションが後で処理可能なファイルを作成することによって検証済みデータをターゲット・アプリケーションに送信することである。
送り状や注文書にように書式が分かっている場合でも、セットアップモードは各ユーザーが様々な形態レイアウトを処理する必要があるのでユーザーに特有なものである。このモード中の業務量は出会う形態レイアウトの数に比例する。最終ランモード段階のターゲット・アプリケーションへの統合は各ターゲット・アプリケーションが異なるカスタマゼーションを必要とするのでそのアプリケーションに特有なものである。
本発明の目的は各エンドユーザー向けの当初カスタマゼーションの不要なデータ抽出および転記が可能である形式処理のシステムおよび方法の提供にある。
本発明のその他の目的と利点は本仕様書を読むと同時に付録の図を検討した後に明らかになろう。
したがって、本発明の幾つかの好ましい実施例によりデジタル画像の形態で事前にデジタル化された書式をもとにしたデータ項目抽出のための形式処理方法が提供されこの方法には次のものが含まれる。すなわち、
各物理フィールドが特定タイプのデータ項目に関係する1ヵ所以上の物理フィールドの場所を指示するためのユーザーへの促進
物理フィールドの場所に関してユーザーによって提供される1つ以上の指示の受信
関連データ様式を利用した物理フィールドのデータ項目内容の識別
さらに、本発明の幾つかの好ましい実施例によると、この方法にはさらに次のものが含まれる。すなわち、
前記の1ヵ所以上の物理フィールドの場所の特定
前記1ヵ所以上の物理フィールドの場所を利用した類似レイアウトの様式に関する同一特定タイプのデータ項目の所在についてのインストラクションが含まれるテンプレートの作成
さらに、本発明の幾つかの好ましい実施例によると、この方法にはさらに次のものが含まれる。すなわち、
テンプレートと合致する別の書式の別のデジタル画像の検索、ならびに
合致するものが決り次第のテンプレートインストラクションを利用した自動的なデータ項目抽出
さらに、本発明の好ましい幾つかの実施例によると、物理フィールドの場所についてユーザーによって提供される指示には画像のデータ項目上または近傍でポインティング装置による単一回のクリックが含まれる。
さらに、本発明の幾つかの好ましい実施例によると、物理フィールドの場所に関してユーザーによって提供される指示には画像のデータ項目上または近傍での表示されるタッチスクリーンへの接触が含まれる。
さらに、本発明の幾つかの好ましい実施例によると、この方法にはさらにデータ項目のターゲット・アプリケーションへの転送が含まれる。
さらに、本発明の幾つかの好ましい実施例によると、前記1ヵ所以上の物理フィールドはテーブル書式で準備される。
さらに、本発明の幾つかの好ましい実施例によると、1回以上の指示の受信処置には、テーブルの第1行目に関する項目の場所に関する指示の受信が含まれ、この方法はさらにテーブルの第1行目の指示項目下の諸列に位置するデータ項目の自動抽出からなる。
さらに、本発明の幾つかの好ましい実施例によると、この方法にはさらに次のものが含まれる。すなわち、
類似レイアウトの書式のテーブルの諸列の同一特定タイプのデータ項目の所在に関するインストラクションが含まれるテンプレートが作成されるテーブルの第1行目のデータ項目の場所の利用
さらに、本発明の幾つかの好ましい実施例によると、この方法にはさらに次のものが含まれる。すなわち、
テンプレートと合致する別の書式の別のデジタル画像の検索、および
合致するものが決まり次第のテンプレートインストラクションを利用したテーブルをもとにした自動的データ項目の抽出
さらに、本発明の幾つかの好ましい実施例によると、このように任意の書式からのデータ項目抽出用の形式処理システムが提供され、このシステムには次のものが含まれる。
当該書式のデジタル画像へのスキャン用のスキャナー
デジタル画像表示用の表示装置
ポインティング装置、表示装置上に表示される画像上の物理フィールドの場所上でポインティング装置を利用してユーザーによって提供される1回以上の指示の受信のため、特定タイプの任意のデータ項目に関係する物理フィールド毎に1ヵ所以上の物理フィールドの場所を指示するようユーザーに促進するため、ならびに関連データ様式を利用する物理フィールドのデータ項目の内容および場所の識別のための処理ユニット
さらに、本発明の幾つかの好ましい実施例によると、表示装置およびポインティング装置は1台のタッチスクリーン表示装置に統合される。
本発明は、先行技術の場合の形式処理方法とアプリケーションを用いた当初カスタマゼーションを行う必要なく、書式をもとにしたデータの抽出を簡単にする形式処理の提供方法とシステムを目的としている。
本発明は「ターゲット・アプリケーション」に転送される形式データ抽出用のカスタマゼーションが不要であってかつ「出来合い」の(COTS)市販プロダクツを提供する新たな方法を導入する。
本発明の場合には、既存プロダクツの「セットアップモード」中に通常必要とされるユーザー固有のカスタマゼーション業務は、ユーザーがルーチンワークを実行するにつれて「テンプレート」が自動的に作り出されるので不要である。
既存の形式処理プログラムによって必客先のニーズを満足させるために必要とされるカスタマゼーションは、面倒で、長たらしくかつ費用が高くつくものである。本発明の方法をソフトウェアに応用することによって、開発者は書式の読み取りと「ターゲット・アプリケーション」へのデータ送信が可能である「即使える」形式処理プログラムを開発できる。
本発明はスキャナーあるいはその他のデジタル化手段によって事前にデジタル化された物理形式の電子画像を処理すると同時に、「ターゲット・アプリケーション」へ引き渡されるデータを準備する方法を公開するものである。処理に対して論理形式の可能性のある集合は演繹的に知られる。
本仕様書全般を通じて使用される本発明に関連して用語の定義と説明をしておくと役に立つ。本発明全体を通じて用語「論理形式」(論理形式例:送り状、注文書)とは、抽出を必要とする書式に含まれるデータ項目を定める「論理フィールド」(論理フィールドの例:送り状番号、注文日)の集合を指す。各「論理フィールド」には、スキャン画像である物理形式から抽出されるべきデータ抽出に関するインストラクションが含まれ、様々な機関の「物理」形式は「レイアウト」がばらばらでも良く、物理形式について様々な場所に同一データが含まれていて良い。
本仕様書全般を通じて、用語「テンプレート」とは「テンプレートマッチングアルゴリズム」(下記参照)用であってかつ物理形式内部の物理フィールドの場所に関するインストラクションの集合を指すものである。通常は、書式におけるフィールドの場所は、これらのすべてについて同一の「テンプレート」インストラクションを利用して得られる(例えば、ある販売先が2つの請求書を送信するとき、その多くの場合、請求書の「レイアウト」は同じであるので、同一「テンプレート」インストラクションがこれらの2つの請求書に利用できる)ので1つの「テンプレート」に関連して多数の物理形式がある。各「論理形式」にはこれに関連したいくつかの可能性のある「テンプレート」がある(例えば、多くの場合、販売先が異なればそれぞれ違う送り状を生み出すので、送り状を送信する販売先が複数あれば「論理形式」の「請求書」には複数の「テンプレート」があっても良い。)。多くの場合に、「レイアウト」が異なると「テンプレート」も違うはずである。
本仕様書に関連して、用語「フィールド領域」とは物理形式からの物理フィールドの所在確認方法に関するインストラクションの集合を指す。「フィールド領域」は「テンプレート」の一部である。たまにフィールド領域には領域の座標のみが含まれるが、これには物理形式に関するその他の表示マークの識別によって物理フィールドの所在を見つけるためのその他のインストラクションが含まれる場合もある。例えば、例1:書式が移動されかつ歪みが取られてテンプレートにぴったり合うことを意図して、インストラクションは書式が「登録された」後で正確な座標のデータの中身を見つけるものである。例2:インストラクションにより物理形式上に印刷済みの「合計」の右側にある「合計フィールド」が見つけられ得る。
次いで参考説明が諸図に対して行われる。
図1には本発明の好ましい実施例によるある書式をもとにデータ抽出用の形式処理システム(符号(10)で示される)が示される。スキャナー12はそのデータが「ターゲット・アプリケーション」に転送される書式のスキャンのために準備される。書式のスキャン済み画像は、表示装置9、ユーザーインターフェース(例えば、キーボード13)ならびにポインティング装置(例えば、マウス17)が備えられたコンピューティング装置14に転送される。書式のデジタル画像は表示装置上に表示されるとともにユーザーは表示画像上に特定タイプの様々なデータ項目の場所を指示するよう促進される。コンピューティング装置は本発明のデータ抽出方法(この後の詳細説明を参照)を実行すると同時に、OCRソフトウェアを利用して画像からデータを抽出する。コンピューティング装置を稼動させるユーザーはOCRに結果を正しく確認すると同時に、必要があればこれの修正を行う。この最終データは「ターゲット・アプリケーション」による利用のためあるいは将来の参考のためデータベース16に格納されても良い。
図2では、本発明の好ましい実施例による、「論理形式」、「テンプレート」、「フィールド領域」ならびに「論理フィールド」の階層が示される。
各「論理形式」18について、複数の連結「テンプレート」があってもよい。(図面では簡単のため2つのテンプレート20aおよび20bが示されるが、「テンプレート」の数は処理される、異なる「書式レイアウト」の数に応じて変化する。)「テンプレートリスト」(20)は「論理形式」18に関連する「テンプレート」の集合である。「論理形式」18は関連があると同時に形式処理ユーザーによって求められる(通常は「ターゲット・アプリケーション」に転送される)データ項目30を指す。各データ項目は「論理フィールド」(30a,30b)として言及される。
「テンプレートマッチングアルゴリズム」40(図3を参照)は物理形式19(書式のスキャン画像である)が「テンプレートリスト」(20)からの「テンプレート」(例えば20a)と合致するかどうかを決定した後、物理形式内の物理フィールド21の所在を突きとめる。「テンプレートマッチングアルゴリズム」は別に新しいものではなく、このアルゴリズムを利用するプロダクツは、Top Image Systems LtdのFormOut(登録商標) 、あるいはNCS社のNestor Reader(登録商標)の形式認識オプションのごとく既存のものである。このアルゴリズムに関するもう1つ別の例はUS 6,886,136に公開されている。US 5,793,887 またはUS 6,640,009も合わせて参照されたい。
書式の一部のデータはテーブルに格納される。そのある例は送り状における項目一覧表である。テーブルの各行は1つの項目と関連する。テーブルフィールドは列に格納される。量、価格、ならびに量といった記載項目が別々のテーブル列に格納される。図4の例を参照されたい。
「テーブル抽出」:テーブルの第1行目の各物理フィールドの場所が分かっている場合は、次のような単純なアルゴリズムを利用してテーブル全体からデータの抽出が可能である。すなわち、
1.全頁標準OCRプログラムが全体画像をもとにして「テキスト」とともに「テキスト」の各語のXY座標に関する位置を抽出する。
2.第1行のすべての物理分野について、アルゴリズムは、次行の物理フィールドが前行の物理フィールドと同一のX座標または殆ど同一のX座標を有するよう検索する。X座標は物理フィールドの左側、物理フィールドの右側、あるいは物理フィールドの中央に当てはめられる。
3.アルゴリズムが前行のすべての物理フィールドに関する次行の物理フィールドを見つける場合には、アルゴリズムは次のテーブル行の検索を続行する。1ヵ所以上の物理フィールドに類似したX座標をもつ次行の物理フィールドが見当たらない場合にはアルゴリズムは検索を停止する。
4.追加処置によりフィールドタイプに応じた物理フィールド全体の検索が実行されてよい。これは下記段落A5.3のアルゴリズムのように実行できる。
「テーブル抽出」を行うには、例えば、特許5,737,442のような別の方法がある。
「ターゲット・アプリケーション」は諸書式から抽出されるデータを受け取るアプリケーションである。「ターゲット・アプリケーション」の例にはXGear Technologies社のClaimGearf、Microsoft(登録商標)社のMicrosoft Small Business Accounting(登録商標) あるいはIntuit社のQuickBooksがある。
処理は空の「テンプレート」一覧または事前に定義された「テンプレート」の集合から開始される。事前定義される「テンプレート」が広く利用されている書式の「テンプレート」用に利用可能である。例えば、ある宅配会社(例えば、Federal Express社、UPS社))からの請求書に関する「テンプレート」が事前定義の「テンプレート」の一部であってよい。
処理には物理形式を「ターゲット・アプリケーション」に読み込む次の処置が採用される。
A1.「テンプレートマッチングアルゴリズム」を利用した事前定義「テンプレート」一覧と物理形式画像の比較。上述のように、このアルゴリズムは多くの既存の「形式処理」アプリケーション中に存在している。
A2.比較が処置B1(以降を参照)に進む場合、
次の処置は新たな書式「レイアウト」を利用した物理形式の処理に適用される(上記比較ができない場合に)。
A3.画像の表示ならびにフィールドの場所でのユーザーへの表示画像上のクリック依頼(例えば、「販売者名称」あるいは「送り状番号」)。図5参照。
A4.ユーザーはフィールドの場所を画像上で指示するよう求められる。通常これはスクリーンに表示される画像関連区域上のマウスクリックによって行われる。本発明の一部の好ましい実施例では、タッチスクリーンが利用できる。もう1つの可能性はクリックに代えてデータ周辺領域を囲むと同時に次の段階A5へ跳ぶことである。
A5.あるアルゴリズムがクリック地点の場所近辺のテキスト領域の場所を見つけると同時に「テキスト」データの抽出のために適用される。
この実行のための1つのありうるアルゴリズムは次の通りである。
A5.1)標準OCRプログラムが全頁画像上で稼動し頁から「テキスト」および各語の位置が抽出される。
A5.2)クリック地点の場所に最も近い場所の語が抽出される。
A5.3)プログラムはフィールドタイプに応じてその他のどの語が抽出されるべきかを決定する。下例を参照。
A5.3.1)「日付」フィールド:フィールドが「日付」フィールドである場合には、当該単語あるいは「12/27/04」または「12月27日,2004」のような既知の日付様式で日付を示すために特別に利用されるその他の文字が抽出されるはずである。
A5.3.2)「数量」フィールド:フィールドが「数量」フィールド(価格あるいは全体送り状のような)である場合には、アルゴリズムは「$199.95」や「199.95USD」のような既知の数量書式で与えられる至近の語を取る。
A5.3.3)単語フィールド:フィールドが送り状番号の場合のように含まなくてはならないのは1語のみであることが分かっている場合もある。
A5.3.4)「販売者/顧客」名称フィールド:このフィールドは数語の組合せがありえる。どの語が抽出しなくてはならないかを決定するため、アルゴリズムは単語間隔の上部3分の1および下部3分の1を移動させた後、文書全体の単語間の平均スペースを計算してから、アルゴリズムは単語間の平均間隔の1.5倍未満の間隔のすべての単語を取り出す。同一行の単語だけが抽出されるように考慮される。
A6.追加の処置は、抽出データが表示されてかつユーザーによって確認される明らかなOCRエラーを修正して事後処理されるものである(例:「1213112006」が「12/31/2006」に修正されるとか、「199.95USD」が「199.95」に修正されるものである)。図6を参照。
A7.抽出データはさらなる実行処理が継続されるかあるいは「ターゲット・アプリケーション」に直ちに送られる。フィールドの位置は先のフィールド抽出用のインストラクションである「フィールド領域」として「テンプレート」に格納される。これはこの処置かあるいはさらに後に格納可能であるとともに、物理画像および/または座標の内容に応じて複合インストラクションとして格納可能である。フィールド領域の定義に関しては上記を参照のこと。これは重要な本発明の構成要素である。カスタマゼーション業務はテンプレートがデータ入力の通常業務中に作り出されるので必要ない。
A8.処置A3〜A7が繰り返されると同時に、連続する「論理フィールド」に充てられる。図7にはすべてのフィールドが処理された後のスクリーンが示される。
テーブルに属するフィールドについては次の処置(A9〜A10)が適用される。
A9.処置A3〜A7は当該書式の「テーブル」の第1行目のそれぞれの「論理フィールド」に適用される。(例えば、カタログ番号、品質、価格等)
A10.「テーブル抽出」(上述の通りの)が、場所データを見つけると同時にテーブルのその他のすべてのデータの抽出のために実行される。
A11.フィールドデータの「ターゲット・アプリケーション」へ送信する次処置の継続。下記のC1処置を参照のこと。
B1.「テンプレートマッチングアルゴリズム」が続く場合には、各フィールドに関してフィールドの位置が「テンプレート」インストラクションに応じて計算されるとともに、データはOCRを利用して抽出される。内容は先のさらなる実行のため保存可能であるかあるいは「ターゲット・アプリケーション」に直に送られる。
抽出するターブルがある場合には、下のB2〜B3が適用される。
B2.同一の処置B1が第1テーブル行目のフィールドに適用される。「テーブル抽出」処理が、特許5,737,442のように第1行目の物理フィールドの場所を知る必要がない場合にこの処置を跳ばすことが可能である。
B3.「テーブル抽出」はテーブルの場所ならびにその他残りのすべての行を見つけるために適用される。
B4.フィールドデータをターゲット・アプリケーションに送る次の処置の継続。下の処置C1を参照。
次に、1つ以上のフィールド抽出データの「ターゲット・アプリケーション」への組込みの1方法が説明される。本発明の好ましい実施例によると、これは以下のように機能する。
C1.ユーザーは「ターゲット・アプリケーション」を同時に稼動させる。(別のウィンドーで)
C2.前の処置で収集されたデータは、キー打ち込み、マウス移動、タッチスクリーンあるいはマウス移動を真似る「ウィンドー」メッセージあるいはユーザーが通常のデータ入力のやり方で行うキー打ち込みのデータとして「ターゲット・アプリケーション」に送られる。
こうしてデータの認証チェックおよびデータの格納は「ターゲット・アプリケーション」が作動する通常の方法で実行される。一部のタイプ打ち込みおよびマウス移動が実際のキーボードやマウスによって行われない点が唯一の差である。くたびれるタイプ打ち込みに代ってデータはキーボードのシミュレーションによって転送される。
抽出データの「ターゲット・アプリケーション」への転送は、別の方法でも行うことができる。さらに、特定ユーザーでは「ターゲット・アプリケーション」へのデータ転送に特別なカスタマゼーションを要することが見込まれる。本発明は「ターゲット・アプリケーション」へ転送される書式データ抽出をカスタマゼーションをせずにもたらすことを目的とする。ここで挙げられた「ターゲット・アプリケーション」へのデータ転送に関する説明は単なる1例にすぎない。
本発明の形式処理方法にはビジネス市場からの強い要求がある。ポイントは形式処理方法において最初のカスタマゼーションが不要となるとともに本発明の処理により形式処理が単純なタスクとなることにある。本発明は他の場合にはカスタマゼーションに伴う相当なコストのために自動形式処理を考えない中小ビジネスにとって極めて大きな恩恵が見出されるものとなろう。
本発明の方法は既存の形式処理方法に追加できる。例えば、アプリケーションが書式に関する前述の知識が無くても(ABBYY社のFlexiCapture(登録商標))ある書式に関して提供される少なくとも1部の情報が抽出可能である場合の形式処理アプリケーションでは、本発明の方法はその他の方法を利用して抽出されない残りの情報が抽出されるために利用可能である。
この仕様書に規定される諸実施例付録の諸図の説明はその範囲を限定することなく本発明のより良き理解のためにのみ利用されることが明確にされなくてはならない。
専門技術者は本仕様書を読んだ後、本発明によって取り扱われる付録の図や上述の実施例に調節や修正を行うことができることも明確にされなくてはならない。
本発明のより良き理解ならびにその実用的なアプリケーションの正しい認識のため、次に挙げる図面が提供されると同時にこれ以降において参照される。これらの図面類は例としてのみ挙げられ、決して本発明の範囲を限定するものではない点には留意されなくてはならない。同様構成要素は同じ参照番号によって表示されている。
本発明の好ましい実施例による形式処理システムの図
本発明の好ましい実施例による「論理形式」、「論理フィールド」、「テンプレート」ならびに「フィールド領域」の階層図
テンプレートを検索した後、物理フィールドを検索する「テンプレートマッチングアルゴリズム」の図
通常の印刷書式の数列のテーブルの図
本発明の好ましい実施例によるユーザーに当該画像上の「ベンダー」データ上のクリックを依頼するある書式に関するフィールド表示処置の図
本発明の好ましい実施例によるユーザーによって抽出データの表示と確認を行う、ユーザーが画像上の「ベンダー」データをクリックした直後のスクリーン図
にはすべてのフィールドが処理された後の本発明の好ましい実施例によるスクリーンが示される。

Claims (12)

  1. 特定タイプのデータ項目に関連する1ヵ所以上の各物理フィールドの場所の指示に関するユーザーへの促進、物理フィールドの場所に関するユーザーにより提供される1回以上の指示の受信、関連データ様式を利用した物理フィールドのデータ項目の内容の特定からなる方式のデジタル画像書式の予めデジタル化された書式からのデータ項目抽出のための形式処理方法。
  2. さらに類似レイアウトの書式に関する同一特定タイプのデータ項目の所在に関するインストラクションからなるテンプレートを作成し、前記1ヵ所以上の物理フィールドの場所を利用した前記1ヵ所以上の物理フィールドの場所の特定からなる請求項1に記載の方法。
  3. さらにテンプレートに合致する別書式の別のデジタル画像を検索して合致が決まる時のテンプレートインストラクションを利用したデータ項目の自動抽出からなる請求項2に記載の方法。
  4. 物理フィールドの場所に関してユーザーによって提供される指示にポインティング装置によるかあるいは画像データ項目近傍における単一クリックが含まれる請求項1に記載の方法。
  5. 物理フィールドの場所についてユーザーによって提供される指示に、画像上あるいは画像データ項目の近傍における画像が表示されるタッチスクリーンへのタッチが含まれる請求項1に記載の方法。
  6. さらにデータ項目のターゲット・アプリケーションへの転送が含まれる請求項1に記載の方法。
  7. 前記1か所以上の物理フィールドがテーブル書式で用意される請求項1に記載の方法。
  8. 1回以上の指示の受信処置がテーブルの第1行目にある項目の場所に関する指示の受信からなると同時に、該方法がテーブルの第1列目の表示項目下部列に位置するデータ項目の自動抽出からなる請求項7に記載の方法。
  9. さらに類似レイアウト様式のテーブル列に関する同一特定タイプのデータ項目の所在に関するインストラクションからなるテンプレートを作成するテーブルの第1行目のデータ項目の場所の利用が含まれる請求項8に記載の方法。
  10. テンプレートに合致する別書式の別のデジタル画像を検索して合致が決まる時のテンプレートインストラクションを利用したテーブルからのデータ項目の抽出が含まれる請求項9に記載の方法。
  11. 書式をデジタル画像にするスキャン用のスキャナー、デジタル画像表示用の表示装置、ポインティング装置、表示装置上に表示される画像に関する物理フィールドの場所上でポインティング装置を利用してユーザーによって提供される1回以上の指示の受信のために、特定タイプのデータ項目に関連する各物理フィールド毎の1ヵ所以上の物理フィールドの場所の指示をユーザーに促進する処理ユニット、ならびに関連データ様式を利用した物理フィールドのデータ項目の内容および場所の特定からなるシステムの任意書式からのデータ項目抽出用の形式処理システム。
  12. 表示装置およびポインティング装置が1つのタッチスクリーン表示装置に統合される請求項11に記載のシステム。
JP2008537309A 2005-10-25 2006-09-27 カスタマゼーションによらない書式データ抽出 Pending JP2009520246A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US72953205P 2005-10-25 2005-10-25
PCT/IL2006/001135 WO2007049270A2 (en) 2005-10-25 2006-09-27 Form data extraction without customization

Publications (1)

Publication Number Publication Date
JP2009520246A true JP2009520246A (ja) 2009-05-21

Family

ID=37968210

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008537309A Pending JP2009520246A (ja) 2005-10-25 2006-09-27 カスタマゼーションによらない書式データ抽出

Country Status (7)

Country Link
US (1) US8660294B2 (ja)
EP (1) EP1946233A4 (ja)
JP (1) JP2009520246A (ja)
AU (1) AU2006307452B2 (ja)
CA (1) CA2633535A1 (ja)
RU (1) RU2008120684A (ja)
WO (1) WO2007049270A2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8094976B2 (en) * 2007-10-03 2012-01-10 Esker, Inc. One-screen reconciliation of business document image data, optical character recognition extracted data, and enterprise resource planning data
US20100125617A1 (en) * 2008-11-18 2010-05-20 Andrea Alexander System for Consolidating Business Documents
US9223770B1 (en) * 2009-07-29 2015-12-29 Open Invention Network, Llc Method and apparatus of creating electronic forms to include internet list data
JP5327017B2 (ja) * 2009-11-24 2013-10-30 ソニー株式会社 遠隔操作装置、遠隔操作システム、遠隔操作装置による情報処理方法およびプログラム
JP5556524B2 (ja) * 2010-09-13 2014-07-23 株式会社リコー 帳票処理装置、帳票処理方法、帳票処理プログラム、及びそのプログラムを記録した記録媒体
US8903173B2 (en) * 2011-12-21 2014-12-02 Ncr Corporation Automatic image processing for document de-skewing and cropping
US20140143126A1 (en) * 2012-11-21 2014-05-22 Shaheen Malik Loan Analysis And Management System
US9317484B1 (en) * 2012-12-19 2016-04-19 Emc Corporation Page-independent multi-field validation in document capture
US9430453B1 (en) * 2012-12-19 2016-08-30 Emc Corporation Multi-page document recognition in document capture
US10176159B2 (en) * 2014-05-05 2019-01-08 Adobe Systems Incorporated Identify data types and locations of form fields entered by different previous users on different copies of a scanned document to generate an interactive form field
US9286283B1 (en) * 2014-09-30 2016-03-15 Coupa Software Incorporated Feedback validation of electronically generated forms
US10528808B2 (en) * 2015-04-21 2020-01-07 Orbiion, Inc. Automated document processing system
US10049096B2 (en) 2015-06-19 2018-08-14 Infosys Limited System and method of template creation for a data extraction tool
US9910842B2 (en) * 2015-08-12 2018-03-06 Captricity, Inc. Interactively predicting fields in a form
US10083353B2 (en) 2016-10-28 2018-09-25 Intuit Inc. Identifying document forms using digital fingerprints
US10402163B2 (en) * 2017-02-14 2019-09-03 Accenture Global Solutions Limited Intelligent data extraction
US20200104586A1 (en) * 2018-09-28 2020-04-02 Konica Minolta Laboratory U.S.A., Inc. Method and system for manual editing of character recognition results
FR3098328B1 (fr) 2019-07-01 2022-02-04 Amadeus Sas Procédé pour extraire automatiquement d’un document des informations d’un type prédéfini
CN112306333A (zh) * 2020-11-11 2021-02-02 天津汇商共达科技有限责任公司 一种数据填充的方法及装置

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0381817A (ja) * 1989-08-25 1991-04-08 Hitachi Ltd 手書入力情報処理装置およびこの手書入力情報処理装置を用いた手書入力情報システム
US5404294A (en) * 1990-02-26 1995-04-04 Karnik; Jayant D. Tag method for moving information between computers & forms
US5048099A (en) * 1990-05-21 1991-09-10 Eastman Kodak Company Polygon-based method for automatic extraction of selected text in a digitized document
US6683697B1 (en) * 1991-03-20 2004-01-27 Millenium L.P. Information processing methodology
US5416849A (en) * 1992-10-21 1995-05-16 International Business Machines Corporation Data processing system and method for field extraction of scanned images of document forms
EP0679313A1 (en) 1993-11-16 1995-11-02 International Business Machines Corporation Method and apparatus for alignment of images for template elimination
US5737442A (en) 1995-10-20 1998-04-07 Bcl Computers Processor based method for extracting tables from printed documents
US6327387B1 (en) * 1996-12-27 2001-12-04 Fujitsu Limited Apparatus and method for extracting management information from image
US6507662B1 (en) 1998-09-11 2003-01-14 Quid Technologies Llc Method and system for biometric recognition based on electric and/or magnetic properties
US6789194B1 (en) * 1999-05-25 2004-09-07 Silverbrook Research Pty Ltd Network publishing authorization protocol
US6456740B1 (en) * 1999-07-26 2002-09-24 International Business Machines Corporation System and method for identifying form type in a handwriting recognition based form completion system
US6912308B2 (en) * 2000-12-01 2005-06-28 Targus Communications Corp. Apparatus and method for automatic form recognition and pagination
US20020103827A1 (en) * 2001-01-26 2002-08-01 Robert Sesek System and method for filling out forms
US20020107885A1 (en) * 2001-02-01 2002-08-08 Advanced Digital Systems, Inc. System, computer program product, and method for capturing and processing form data
US6640009B2 (en) 2001-02-06 2003-10-28 International Business Machines Corporation Identification, separation and compression of multiple forms with mutants
US20020194222A1 (en) * 2001-06-18 2002-12-19 International Business Machines Corporation Method and apparatus for disabling histories in a browser
US7212301B2 (en) * 2001-10-31 2007-05-01 Call-Tell Llc System and method for centralized, automatic extraction of data from remotely transmitted forms
US20030214681A1 (en) * 2002-05-16 2003-11-20 Bohan David G. Facsimile system and method
US7343042B2 (en) * 2002-09-30 2008-03-11 Pitney Bowes Inc. Method and system for identifying a paper form using a digital pen
US7426496B2 (en) * 2004-03-03 2008-09-16 Microsoft Corporation Assisted form filling
US7328847B1 (en) * 2003-07-30 2008-02-12 Hewlett-Packard Development Company, L.P. Barcode data communication methods, barcode embedding methods, and barcode systems
DE10342594B4 (de) * 2003-09-15 2005-09-15 Océ Document Technologies GmbH Verfahren und System zum Erfassen von Daten aus mehreren maschinell lesbaren Dokumenten
DE10345526A1 (de) * 2003-09-30 2005-05-25 Océ Document Technologies GmbH Verfahren und System zum Erfassen von Daten aus maschinell lesbaren Dokumenten
WO2006017229A2 (en) * 2004-07-12 2006-02-16 Kyos Systems Inc. Forms based computer interface
US7627592B2 (en) * 2004-12-16 2009-12-01 Microsoft Corporation Systems and methods for converting a formatted document to a web page

Also Published As

Publication number Publication date
AU2006307452B2 (en) 2011-03-03
WO2007049270A2 (en) 2007-05-03
CA2633535A1 (en) 2007-05-03
AU2006307452A1 (en) 2007-05-03
US20080285792A1 (en) 2008-11-20
WO2007049270A3 (en) 2009-04-09
EP1946233A4 (en) 2013-02-27
RU2008120684A (ru) 2009-12-10
EP1946233A2 (en) 2008-07-23
US8660294B2 (en) 2014-02-25

Similar Documents

Publication Publication Date Title
JP2009520246A (ja) カスタマゼーションによらない書式データ抽出
US11868717B2 (en) Multi-page document recognition in document capture
US10120537B2 (en) Page-independent multi-field validation in document capture
US10810351B2 (en) Integrated document editor
US20090049375A1 (en) Selective processing of information from a digital copy of a document for data entry
US7313514B2 (en) Validating content of localization data files
US10019535B1 (en) Template-free extraction of data from documents
US20080195968A1 (en) Method, System and Computer Program Product For Transmitting Data From a Document Application to a Data Application
US10614125B1 (en) Modeling and extracting elements in semi-structured documents
JP2973913B2 (ja) 入力シートシステム
JP2016192223A (ja) 会計情報読取りシステム及びプログラム
JP6993032B2 (ja) 会計処理装置、会計処理システム、会計処理方法及びプログラム
JP3766854B2 (ja) データ処理装置
WO2022029874A1 (ja) データ処理装置、データ処理方法及びデータ処理プログラム
JPH11296578A (ja) 会計処理装置,取引データ入力装置,誤りデータの遡及修正方法
JP2000003403A (ja) 帳票入力支援方法
US12088770B2 (en) Display system, display method, and display program for displaying a content of electronic document
JP6858420B1 (ja) 会計処理装置、会計処理システム、会計処理方法及びプログラム
JP7021819B1 (ja) データ処理装置、データ処理方法及びプログラム
JP6844076B1 (ja) データ処理装置、データ処理方法及びプログラム
WO2022049689A1 (ja) データ処理装置、データ処理方法及びプログラム
US20170221114A1 (en) SYSTEM for GENERATING and IDENTIFYING an OCR FINGERPRINT
CN112347176A (zh) 基于人机交互行为的数据对接方法及装置
JP2023066474A (ja) 画像処理装置、画像処理方法、プログラム
JP2024025219A (ja) Pdf帳票の読取装置、読取方法及び読取プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090928

A072 Dismissal of procedure [no reply to invitation to correct request for examination]

Free format text: JAPANESE INTERMEDIATE CODE: A073

Effective date: 20110215