JP2019109562A - フォーム種別学習システムおよび画像処理装置 - Google Patents

フォーム種別学習システムおよび画像処理装置 Download PDF

Info

Publication number
JP2019109562A
JP2019109562A JP2017240285A JP2017240285A JP2019109562A JP 2019109562 A JP2019109562 A JP 2019109562A JP 2017240285 A JP2017240285 A JP 2017240285A JP 2017240285 A JP2017240285 A JP 2017240285A JP 2019109562 A JP2019109562 A JP 2019109562A
Authority
JP
Japan
Prior art keywords
image
unit
machine learning
original document
form type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017240285A
Other languages
English (en)
Other versions
JP6928876B2 (ja
Inventor
篤志 西田
Atsushi Nishida
篤志 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2017240285A priority Critical patent/JP6928876B2/ja
Priority to CN201810714643.0A priority patent/CN109934244B/zh
Priority to US16/221,477 priority patent/US10762343B2/en
Publication of JP2019109562A publication Critical patent/JP2019109562A/ja
Application granted granted Critical
Publication of JP6928876B2 publication Critical patent/JP6928876B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】 フォームレイアウト情報を使用することなく、フォームの分類を正確に行う。【解決手段】 画像処理装置1は、記入済みフォームの画像が所定サイズに縮小された、分類器27で、縮小後の記入済みフォームを入力として、記入済みフォームのフォーム種別を特定する。その分類器27は、フォーム種別学習システムにより機械学習されたものであり、そのフォーム種別学習システムは、記入済みフォームの画像を原書類画像として縮小し、縮小される前のまたは縮小された後の原書類画像にノイズを付加して複数の機械学習用画像を生成し、複数の機械学習用画像に対して、原書類画像のフォーム種別をラベルとして関連付け、分類器27の機械学習を、複数の機械学習用画像およびラベルを訓練データとして実行する。【選択図】 図1

Description

本発明は、フォーム種別学習システムおよび画像処理装置に関するものである。
ある文書管理システムでは、デジタル複合機でスキャンした文書のフォームが特定され、フォームに対応するフォルダーにその文書が格納される(例えば特許文献1参照)。
特開2006−229305号公報
上述のようなシステムでは、フォーム内の枠・表の位置およびサイズや、フォーム内の文字などを示すフォームレイアウト情報に基づいて、フォームが識別される。
しかしながら、同一種別のフォームであっても、フォーム内の枠・表が違う場合、異なる種別のフォームであっても、フォーム内の枠・表が同じであり、一部の文字のみが異なる場合などがあるため、フォーム識別に使用されるフォーム情報を正確に事前登録するために、ユーザーが、あるフォームに対して登録すべきフォームレイアウト情報が正しいか否かを確認する必要がある。したがって、多数のフォーム種別を識別するためには、ユーザーの手間が多くなり、現実的ではない。
本発明は、上記の問題に鑑みてなされたものであり、フォームレイアウト情報を使用することなく、フォームの分類を正確に行う画像処理装置、およびそのフォームの分類に使用される画像処理装置内の分類器の機械学習を行うフォーム種別学習システムを得ることを目的とする。
本発明に係るフォーム種別学習システムは、記入済みフォームの画像を原書類画像として取得する原書類画像取得部と、前記原書類画像を縮小する画像縮小部と、前記画像縮小部により縮小される前の前記原書類画像または前記画像縮小部により縮小された後の前記原書類画像にノイズを付加して複数の機械学習用画像を生成するノイズ付加部と、前記複数の機械学習用画像に対して、前記原書類画像のフォーム種別をラベルとして関連付けるラベル付加部と、記入済みフォームの画像を入力としフォーム種別を出力とする分類器の機械学習を、前記複数の機械学習用画像および前記ラベルを訓練データとして実行する機械学習処理部とを備える。
本発明に係る画像処理装置は、記入済みフォームの画像を取得するフォーム画像取得部と、取得された前記記入済みフォームの画像を所定サイズに縮小する画像縮小部と、縮小された前記記入済みフォームの画像を入力としフォーム種別を出力とする分類器とを備える。そして、前記分類器は、上述のフォーム種別学習システムにより機械学習されたものである。
本発明によれば、フォームレイアウト情報を使用することなく、フォームの分類を正確に行う画像処理装置、およびそのフォームの分類に使用される画像処理装置内の分類器の機械学習を行うフォーム種別学習システムが得られる。
本発明の上記又は他の目的、特徴および優位性は、添付の図面とともに以下の詳細な説明から更に明らかになる。
図1は、本発明の実施の形態に係るフォーム種別学習システムの構成を示すブロック図である。 図2は、図1における分類器27の機械学習に使用する記入済みフォームの一例を示す図である。 図3は、図2に示す記入済みフォームに対応する機械学習用画像の一例を示す図である。 図4は、図1に示すフォーム種別学習システムにおけるフォーム種別の機械学習を説明する図である。
以下、図に基づいて本発明の実施の形態を説明する。
図1は、本発明の実施の形態に係るフォーム種別学習システムの構成を示すブロック図である。図1に示すシステムでは、画像処理装置1がネットワーク2を介してサーバー装置3との間で通信を行う。
図1における画像処理装置1は、例えば、複合機などといった画像形成装置であり、画像読取装置11、入力装置12、表示装置13、記憶装置14、通信装置15、および演算処理装置16を備える。
画像読取装置11は、書類(ここでは、記入済みのフォーム)の画像を光学的に読み取り、その画像の画像データを生成する。
入力装置12は、ユーザー操作を検出し、ユーザー操作を示す情報を出力する、ハードキー、タッチパネルなどといった装置である。表示装置13は、ユーザーに対して各種情報を表示する、液晶ディスプレイなどといった装置である。例えば、入力装置12および表示装置13は、筐体の表面に設置されている操作パネルに配置される。
記憶装置14は、ハードディスク、フラッシュメモリーなどといった不揮発性の記憶装置である。
通信装置15は、ネットワーク2に接続され、他の装置(サーバー装置3など)との間でデータ通信を行う、ネットワークインターフェイスなどといった装置である。
演算処理装置16は、各種プログラムを実行するコンピューター、ASIC(Application Specific Integrated Circuit)などを備え、コンピューター、ASICなどで、各種処理部として動作する。
ここでは、フォーム種別の機械学習のために、演算処理装置16は、原書類画像取得部21、画像縮小部22、ノイズ付加部23、およびラベル付加部24として動作する。また、フォームの分類のために、演算処理装置16は、フォーム画像取得部25、画像縮小部26、分類器27、フォーム処理部28、およびパラメーター設定部29として動作する。
原書類画像取得部21は、分類器27の機械学習に使用する記入済みフォームの画像を原書類画像として取得する。この実施の形態では、原書類画像取得部21は、画像読取装置11を使用して、記入済みフォームから読み取られたフォーム画像を取得する。
図2は、図1における分類器27の機械学習に使用する記入済みフォームの一例を示す図である。
画像縮小部22は、その原書類画像を縮小する。つまり、画像縮小部22は、原書類画像に対して解像度変換を行う。なお、画像縮小部22は、縮小後の原書類画像のサイズ(縦横の画素数)が所定値(例えば、縦100画素,横100画素)になるように、原書類画像を縮小する。
ノイズ付加部23は、画像縮小部22により縮小される前の原書類画像または画像縮小部により縮小された後の原書類画像(ここでは、縮小後の原書類画像)にノイズを付加して複数の機械学習用画像を生成する。
ノイズ付加部23は、互いに異なる位置パターンでノイズを付加することで、互いに異なる複数の機械学習用画像を生成する。例えば、ノイズ付加部23は、所定個数のノイズの付加位置をランダムに特定し、それらの付加位置にノイズを付加する。
あるいは、ノイズ付加部23は、縮小前の原書類画像に対して互いに異なるパターンでノイズを配置して複数の中間画像を生成し、複数の中間画像をそれぞれ縮小することで、互いに異なる複数の機械学習用画像を生成する。
さらに、この実施の形態では、ノイズ付加部23は、上述のノイズとして擬似文字画像を原書類画像に付加して複数の機械学習用画像を生成する。この擬似文字画像は、文字画像ではなく、所定形状かつ所定サイズの画像である。例えば、一定濃度の矩形形状の画像が、擬似文字画像とされる。
ここで、画像縮小部22により縮小される前の原書類画像にノイズが付加される場合、「所定サイズ」は、縮小前の原書類画像内で使用され得る文字の最小サイズから最大サイズまでのいずれかのサイズである。一方、画像縮小部22により縮小された後の原書類画像にノイズが付加される場合、「所定サイズ」は、原書類画像内で使用され得る縮小後の文字の最小サイズから最大サイズまでのいずれかのサイズである。例えば、「所定サイズ」は、(縮小前または縮小後の)原書類画像のサイズの1〜10パーセントの範囲のいずれかの値に設定される。
また、ノイズ付加部23は、上述のノイズを付加すべき位置(以下、付加位置という)の濃度が背景濃度(例えば白色)と異なる場合には、背景濃度を有する別の位置に付加位置を変更するようにしてもよい。この別の位置は、例えば、再度、ランダムに選択される。
図3は、図2に示す記入済みフォームに対応する機械学習用画像の一例を示す図である。例えば図3に示すように、複数の擬似文字画像がノイズとしてランダムな位置に付加される。
さらに、ノイズ付加部23は、互いに異なるアスペクト比で複数の付加位置に、擬似文字画像を付加するようにしてもよい。
さらに、ノイズ付加部23は、原書類画像内の枠を検出し、検出した枠の内部に擬似文字画像を付加するようにしてもよい。なお、枠は、既存の方法(エッジ抽出、パターンマッチングなど)で検出することができる。
ラベル付加部24は、生成された複数の機械学習用画像に対して、原書類画像のフォーム種別をラベルとして関連付け、複数の機械学習用画像とフォーム種別とを含む機械学習用の訓練データを生成する。
例えば、ラベル付加部24は、入力装置12により検出されたユーザー操作に従って、原書類画像のフォーム種別(納品書、領収書など)をラベルとして特定する。
また、フォーム画像取得部25は、機械学習後の分類器27によりフォーム種別を特定したい記入済みフォームの画像を取得する。この実施の形態では、フォーム画像取得部25は、画像読取装置11を使用して、そのような記入済みフォームから読み取られたフォーム画像を取得する。
画像縮小部26は、取得された記入済みフォームの画像を所定サイズに縮小する。つまり、画像縮小部26は、取得された記入済みフォームの画像を、機械学習に使用された機械学習用画像と同一のサイズに縮小する。つまり、画像縮小部26は、記入済みフォームの画像に対して解像度変換を行う。
分類器27は、縮小された記入済みフォームの画像を入力としフォーム種別を出力とする分類器であり、縮小された記入済みフォームの画像に対応するフォーム種別を特定する。
分類器27は、機械学習されたニューラルネットワーク(例えばディープニューラルネットワーク)を備え、そのニューラルネットワークで、記入済みフォームの画像に対応するフォーム種別を特定する。このニューラルネットワークとしては、例えば、VGG16などといった既存の畳み込みニューラルネットワークを使用することができる。
フォーム処理部28は、分類器27により特定されたフォーム種別に従って、記入済みフォームの画像に対して特定の処理を実行する。例えば、フォーム処理部28は、フォーム種別に対応するフォルダーに、記入済みフォームの画像ファイルを格納する。
パラメーター設定部29は、機械学習処理部32により特定された機械学習後のパラメーターを、機械学習処理部32から取得し、分類器27に設定する。
また、図3におけるサーバー装置3は、クラウドサーバー、ローカルネットワークに接続されたサーバーなどであって、通信装置31および機械学習処理部32を備える。
通信装置31は、ネットワーク2に接続され、他の装置(画像処理装置1など)との間でデータ通信を行う、ネットワークインターフェイスなどといった装置である。
機械学習処理部32は、分類器27の機械学習を、上述の複数の機械学習用画像およびラベルを訓練データとして実行する。
具体的には、機械学習処理部32は、ニューラルネットワークとしての分類器27のパラメーター(ニューロン間の結合係数、ニューロンのバイアスなど)を訓練データに基づいて、既存のディープラーニングの方式で最適化することで、分類器27の機械学習を実行する。
なお、図1では、画像処理装置1は1台のみであるが、当該システムは複数の画像処理装置1を含んでいてもよく、機械学習処理部32は、それらの画像処理装置1の分類器27に対して、一括して機械学習を行ってもよいし、別々に機械学習を行ってもよい。
次に、上記システムの動作について説明する。
上記システムにおいてフォーム種別の機械学習が行われ、また、画像処理装置1では、機械学習された分類器によるフォーム画像の分類が行われる。
(a)フォーム種別の機械学習
図4は、図1に示すフォーム種別学習システムにおけるフォーム種別の機械学習を説明する図である。
まず、機械学習に使用される、複数フォーム種別の記入済みフォーム(帳票など)が用意される。そして、原書類画像取得部21は、画像読取装置11を使用して、その記入済みフォームの画像(フォーム画像)を取得する。
画像縮小部22は、そのフォーム画像を所定サイズに縮小し、ノイズ付加部23は、上述のようにして、縮小後のフォーム画像に、異なるパターンでノイズを付加することで、複数の機械学習用画像を生成する。
ラベル付加部24は、複数の機械学習用画像に対して、その記入済みフォームのフォーム種別をラベルとして付加する。
機械学習処理部32は、その複数の機械学習用画像とそのフォーム種別とを訓練データとして取得し、各機械学習用画像を入力とし対応するフォーム種別を出力として、分類器27のパラメーターの最適化処理を実行し、これにより、分類器27の機械学習を行う。
機械学習の完了後に、パラメーター設定部29は、機械学習後のパラメーターをサーバー装置3の機械学習処理部32から取得し、分類器27にセットする。
(b)フォーム画像の分類
フォーム画像取得部25は、画像読取装置11を使用して、フォーム種別で分類すべき記入済みフォームの画像(フォーム画像)を取得する。
画像縮小部26は、取得されたフォーム画像を所定サイズに縮小する。
分類器27は、縮小されたフォーム画像に対応するフォーム種別を特定する。
フォーム処理部28は、特定されたフォーム種別に対応する特定の処理を、取得されたフォーム画像について実行する。
以上のように、上記実施の形態によれば、画像処理装置1は、記入済みフォームの画像が所定サイズに縮小された、縮小後の記入済みフォームの画像を入力としフォーム種別を出力とする分類器27で、記入済みフォームのフォーム種別を特定する。そして、その分類器27は、フォーム種別学習システムにより機械学習されたものであり、そのフォーム種別学習システムは、記入済みフォームの画像を原書類画像として取得する原書類画像取得部21と、原書類画像を縮小する画像縮小部22と、画像縮小部22により縮小される前の原書類画像または画像縮小部22により縮小された後の原書類画像にノイズを付加して複数の機械学習用画像を生成するノイズ付加部23と、複数の機械学習用画像に対して、原書類画像のフォーム種別をラベルとして関連付けるラベル付加部24と、分類器27の機械学習を、複数の機械学習用画像およびラベルを訓練データとして実行する機械学習処理部32とを備える。
これにより、フォームレイアウト情報を使用することなく、フォームの分類が正確に行われる。また、上述のノイズ付加によってフォームの記入内容が機械学習で反映されにくくなり、記入を除いたフォーム固有のレイアウトが機械学習されやすくなり、その結果、記入内容の影響を受けにくくなり、フォームが正確に分類されやすくなる。
なお、上述の実施の形態に対する様々な変更および修正については、当業者には明らかである。そのような変更および修正は、その主題の趣旨および範囲から離れることなく、かつ、意図された利点を弱めることなく行われてもよい。つまり、そのような変更および修正が請求の範囲に含まれることを意図している。
例えば、上記実施の形態において、原書類画像取得部21、画像縮小部22、ノイズ付加部23、およびラベル付加部24は、フォーム画像取得部25、画像縮小部26、分類器27、フォーム処理部28、およびパラメーター設定部29とは異なる装置に設けられていてもよい。
また、上記実施の形態において、機械学習処理部32は、画像処理装置1とは異なるサーバー装置3に設けられているが、画像処理装置1に設けられていてもよい。
さらに、上記実施の形態において、ノイズ付加部23は、上述の付加位置の濃度が背景濃度(例えば白色)と異なる場合には、擬似文字画像を白色に変換し、変換後の擬似文字画像をその付加位置に付加するようにしてもよい。
さらに、上記実施の形態において、原書類画像取得部21およびフォーム画像取得部25の一方を、他方の代わりに使用してもよい。その場合、原書類画像取得部21およびフォーム画像取得部25の一方を省略してもよい。また、上記実施の形態において、画像縮小部22,26の一方を、他方の代わりに使用してもよい。その場合、画像縮小部22,26の一方を省略してもよい。
本発明は、例えば、複合機に適用可能である。
1 画像処理装置
21 原書類画像取得部
22 画像縮小部
23 ノイズ付加部
24 ラベル付加部
25 フォーム画像取得部
26 画像縮小部
27 分類器
32 機械学習処理部

Claims (7)

  1. 記入済みフォームの画像を原書類画像として取得する原書類画像取得部と、
    前記原書類画像を縮小する画像縮小部と、
    前記画像縮小部により縮小される前の前記原書類画像または前記画像縮小部により縮小された後の前記原書類画像にノイズを付加して複数の機械学習用画像を生成するノイズ付加部と、
    前記複数の機械学習用画像に対して、前記原書類画像のフォーム種別をラベルとして関連付けるラベル付加部と、
    記入済みフォームの画像を入力としフォーム種別を出力とする分類器の機械学習を、前記複数の機械学習用画像および前記ラベルを訓練データとして実行する機械学習処理部と、
    を備えることを特徴とするフォーム種別学習システム。
  2. 前記ノイズ付加部は、前記ノイズとして擬似文字画像を前記原書類画像に付加して複数の機械学習用画像を生成し、
    前記擬似文字画像は、所定形状かつ所定サイズの画像であること、
    を特徴とする請求項1記載のフォーム種別学習システム。
  3. 前記所定サイズは、前記画像縮小部により縮小される前の前記原書類画像または前記画像縮小部により縮小された後の前記原書類画像において存在し得る文字の最小サイズから最大サイズまでのいずれかのサイズであることを特徴とする請求項2記載のフォーム種別学習システム。
  4. 前記ノイズ付加部は、互いに異なるアスペクト比で複数の付加位置に、前記擬似文字画像を付加することを特徴とする請求項2記載のフォーム種別学習システム。
  5. 前記ノイズ付加部は、前記原書類画像内の枠を検出し、検出した前記枠の内部に前記擬似文字画像を付加することを特徴とする請求項2記載のフォーム種別学習システム。
  6. 前記ノイズ付加部は、前記ノイズの付加位置をランダムに特定し、特定した前記付加位置の濃度が背景濃度と異なる場合には、前記背景濃度である別の位置に前記付加位置を変更することを特徴とする請求項1記載のフォーム種別学習システム。
  7. 記入済みフォームの画像を取得するフォーム画像取得部と、
    取得された前記記入済みフォームの画像を所定サイズに縮小する画像縮小部と、
    縮小された前記記入済みフォームの画像を入力としフォーム種別を出力とする分類器とを備え、
    前記分類器は、フォーム種別学習システムにより機械学習されたものであり、
    前記フォーム種別学習システムは、記入済みフォームの画像を原書類画像として取得する原書類画像取得部と、前記原書類画像を縮小する画像縮小部と、前記画像縮小部により縮小される前の前記原書類画像または前記画像縮小部により縮小された後の前記原書類画像にノイズを付加して複数の機械学習用画像を生成するノイズ付加部と、前記複数の機械学習用画像に対して、前記原書類画像のフォーム種別をラベルとして関連付けるラベル付加部と、記入済みフォームの画像を入力としフォーム種別を出力とする分類器の機械学習を、前記複数の機械学習用画像および前記ラベルを訓練データとして実行する機械学習処理部とを備えること、
    を特徴とする画像処理装置。
JP2017240285A 2017-12-15 2017-12-15 フォーム種別学習システムおよび画像処理装置 Active JP6928876B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2017240285A JP6928876B2 (ja) 2017-12-15 2017-12-15 フォーム種別学習システムおよび画像処理装置
CN201810714643.0A CN109934244B (zh) 2017-12-15 2018-07-03 格式类别学习系统以及图像处理装置
US16/221,477 US10762343B2 (en) 2017-12-15 2018-12-15 Form type learning system and image processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017240285A JP6928876B2 (ja) 2017-12-15 2017-12-15 フォーム種別学習システムおよび画像処理装置

Publications (2)

Publication Number Publication Date
JP2019109562A true JP2019109562A (ja) 2019-07-04
JP6928876B2 JP6928876B2 (ja) 2021-09-01

Family

ID=66816080

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017240285A Active JP6928876B2 (ja) 2017-12-15 2017-12-15 フォーム種別学習システムおよび画像処理装置

Country Status (3)

Country Link
US (1) US10762343B2 (ja)
JP (1) JP6928876B2 (ja)
CN (1) CN109934244B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021125040A (ja) * 2020-02-06 2021-08-30 株式会社エヌ・ティ・ティ・データ 帳票仕分システム、帳票仕分方法、及びプログラム
JP2022518889A (ja) * 2019-12-27 2022-03-17 シェンチェン センスタイム テクノロジー カンパニー リミテッド 画像処理方法及び装置、電子機器並びに記憶媒体
JP7464903B2 (ja) 2020-02-19 2024-04-10 京セラドキュメントソリューションズ株式会社 学習用データセット生成システム、学習用データセット生成サーバーおよび学習用データセット生成プログラム

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11775814B1 (en) 2019-07-31 2023-10-03 Automation Anywhere, Inc. Automated detection of controls in computer applications with region based detectors
JP2020095428A (ja) * 2018-12-12 2020-06-18 株式会社東芝 モデル学習システム、モデル学習方法、プログラム、及び記憶媒体
US11301224B1 (en) 2019-04-30 2022-04-12 Automation Anywhere, Inc. Robotic process automation system with a command action logic independent execution environment
US11614731B2 (en) 2019-04-30 2023-03-28 Automation Anywhere, Inc. Zero footprint robotic process automation system
US11113095B2 (en) 2019-04-30 2021-09-07 Automation Anywhere, Inc. Robotic process automation system with separate platform, bot and command class loaders
US11243803B2 (en) 2019-04-30 2022-02-08 Automation Anywhere, Inc. Platform agnostic robotic process automation
US11348353B2 (en) 2020-01-31 2022-05-31 Automation Anywhere, Inc. Document spatial layout feature extraction to simplify template classification
US11182178B1 (en) 2020-02-21 2021-11-23 Automation Anywhere, Inc. Detection of user interface controls via invariance guided sub-control learning
US12111646B2 (en) 2020-08-03 2024-10-08 Automation Anywhere, Inc. Robotic process automation with resilient playback of recordings
US11734061B2 (en) 2020-11-12 2023-08-22 Automation Anywhere, Inc. Automated software robot creation for robotic process automation
US11782734B2 (en) 2020-12-22 2023-10-10 Automation Anywhere, Inc. Method and system for text extraction from an application window for robotic process automation
US11820020B2 (en) 2021-07-29 2023-11-21 Automation Anywhere, Inc. Robotic process automation supporting hierarchical representation of recordings
US12097622B2 (en) 2021-07-29 2024-09-24 Automation Anywhere, Inc. Repeating pattern detection within usage recordings of robotic process automation to facilitate representation thereof
US11968182B2 (en) 2021-07-29 2024-04-23 Automation Anywhere, Inc. Authentication of software robots with gateway proxy for access to cloud-based services

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6778703B1 (en) * 2000-04-19 2004-08-17 International Business Machines Corporation Form recognition using reference areas
JP2008219825A (ja) * 2007-03-08 2008-09-18 Fuji Xerox Co Ltd 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム
US20160148074A1 (en) * 2014-11-26 2016-05-26 Captricity, Inc. Analyzing content of digital images
JP2017068562A (ja) * 2015-09-30 2017-04-06 富士ゼロックス株式会社 情報処理装置及びプログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2134255C (en) * 1993-12-09 1999-07-13 Hans Peter Graf Dropped-form document image compression
US7210100B2 (en) * 2000-09-27 2007-04-24 Eizel Technologies, Inc. Configurable transformation of electronic documents
JP2005275447A (ja) * 2004-03-22 2005-10-06 Casio Comput Co Ltd 画像処理装置、画像処理方法及びプログラム
JP2006229305A (ja) 2005-02-15 2006-08-31 Canon Inc ネットワーク文書管理システム
JP2007251690A (ja) * 2006-03-16 2007-09-27 Sony Corp 画像処理装置および方法、学習装置および方法、並びにプログラム
JP2012156860A (ja) * 2011-01-27 2012-08-16 Murata Mach Ltd 画像処理装置
JP5166569B2 (ja) * 2011-04-15 2013-03-21 株式会社東芝 業務連携支援システムおよび業務連携支援方法
JP6188400B2 (ja) * 2013-04-26 2017-08-30 オリンパス株式会社 画像処理装置、プログラム及び画像処理方法
JP2016071412A (ja) * 2014-09-26 2016-05-09 キヤノン株式会社 画像分類装置、画像分類システム、画像分類方法、及びプログラム
JP6214581B2 (ja) * 2015-01-30 2017-10-18 キヤノン株式会社 文書解析システム、文書解析装置、文書解析方法、及びプログラム
JP2017010069A (ja) * 2015-06-16 2017-01-12 シャープ株式会社 情報処理装置
US9704054B1 (en) * 2015-09-30 2017-07-11 Amazon Technologies, Inc. Cluster-trained machine learning for image processing
US10747994B2 (en) * 2016-12-28 2020-08-18 Captricity, Inc. Identifying versions of a form

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6778703B1 (en) * 2000-04-19 2004-08-17 International Business Machines Corporation Form recognition using reference areas
JP2008219825A (ja) * 2007-03-08 2008-09-18 Fuji Xerox Co Ltd 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム
US20160148074A1 (en) * 2014-11-26 2016-05-26 Captricity, Inc. Analyzing content of digital images
JP2017068562A (ja) * 2015-09-30 2017-04-06 富士ゼロックス株式会社 情報処理装置及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
萩田 紀博: "2値テンプレートパターンによるデザイン文字認識", 情報処理学会研究報告, vol. 第93巻 第110号, JPN6021002760, 17 December 1993 (1993-12-17), JP, pages 113 - 120, ISSN: 0004492134 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022518889A (ja) * 2019-12-27 2022-03-17 シェンチェン センスタイム テクノロジー カンパニー リミテッド 画像処理方法及び装置、電子機器並びに記憶媒体
JP7097513B2 (ja) 2019-12-27 2022-07-07 シェンチェン センスタイム テクノロジー カンパニー リミテッド 画像処理方法及び装置、電子機器並びに記憶媒体
JP2021125040A (ja) * 2020-02-06 2021-08-30 株式会社エヌ・ティ・ティ・データ 帳票仕分システム、帳票仕分方法、及びプログラム
JP7420578B2 (ja) 2020-02-06 2024-01-23 株式会社Nttデータ 帳票仕分システム、帳票仕分方法、及びプログラム
JP7464903B2 (ja) 2020-02-19 2024-04-10 京セラドキュメントソリューションズ株式会社 学習用データセット生成システム、学習用データセット生成サーバーおよび学習用データセット生成プログラム

Also Published As

Publication number Publication date
CN109934244A (zh) 2019-06-25
JP6928876B2 (ja) 2021-09-01
CN109934244B (zh) 2023-04-28
US20190188462A1 (en) 2019-06-20
US10762343B2 (en) 2020-09-01

Similar Documents

Publication Publication Date Title
JP6928876B2 (ja) フォーム種別学習システムおよび画像処理装置
TW434520B (en) Two-dimensional code recognition processing method, device therefor and medium
US8600165B2 (en) Optical mark classification system and method
US9247080B2 (en) Information processing apparatus for acquiring a variation region between image data and read data
JP2010262648A (ja) 文書オブジェクトを自動位置合わせするための方法及び装置
CN107025430A (zh) 着重号列表
US9582483B2 (en) Automatically tagging variable data documents
US11030447B2 (en) On-device partial recognition systems and methods
US11418658B2 (en) Image processing apparatus, image processing system, image processing method, and storage medium
US11670067B2 (en) Information processing apparatus and non-transitory computer readable medium
US9818028B2 (en) Information processing apparatus for obtaining a degree of similarity between elements
CN114529933A (zh) 一种合同数据差异性的比对方法、装置、设备和介质
CN112613367A (zh) 票据信息文本框获取方法、系统、设备及存储介质
US11438477B2 (en) Information processing device, information processing system and computer readable medium
JP7365835B2 (ja) 構造認識システム、構造認識装置、構造認識方法、及びプログラム
CN112101356A (zh) 一种图片中特定文本的定位方法、装置及存储介质
JP2016139869A (ja) 画像処理装置
JP6606885B2 (ja) 画像処理装置及び画像処理プログラム
US9661179B2 (en) Image processing device, information processing method, and non-transitory computer-readable medium
US20220092761A1 (en) Information processing apparatus and non-transitory computer readable medium
CN113474786A (zh) 电子签购单识别方法、装置及终端设备
US11238305B2 (en) Information processing apparatus and non-transitory computer readable medium storing program
US20170180581A1 (en) Information processing apparatus, image reading apparatus, information processing method, and non- transitory computer readable medium
CN113887441B (zh) 一种表格数据处理方法、装置、设备及存储介质
JP2014089575A (ja) 帳票処理装置、帳票処理方法、及び帳票処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210617

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210708

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210721

R150 Certificate of patent or registration of utility model

Ref document number: 6928876

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150