JP5338063B2 - 画像認識プログラム、画像認識装置および画像認識方法 - Google Patents
画像認識プログラム、画像認識装置および画像認識方法 Download PDFInfo
- Publication number
- JP5338063B2 JP5338063B2 JP2007284294A JP2007284294A JP5338063B2 JP 5338063 B2 JP5338063 B2 JP 5338063B2 JP 2007284294 A JP2007284294 A JP 2007284294A JP 2007284294 A JP2007284294 A JP 2007284294A JP 5338063 B2 JP5338063 B2 JP 5338063B2
- Authority
- JP
- Japan
- Prior art keywords
- logical
- recognition
- recognition result
- output
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
- G06V30/127—Detection or correction of errors, e.g. by rescanning the pattern with the intervention of an operator
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/274—Syntactic or semantic context, e.g. balancing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Description
まず最初に、以下の実施例で用いる主要な用語を説明する。以下の実施例で用いる「画像」とは、所定の論理構造を構成する複数の論理要素各々として文字列各々が記載されている画像のことであり、例えば、帳票画像のことである。ここで、帳票画像に、本人情報として、『名前』、『住所』および『電話番号』を記入させる項目があり、職場情報として、『住所』および『電話番号』を記入させる項目があり、複数の項目各々に文字列各々が記載されているとする。このような帳票画像において、「論理構造」とは、『本人情報』の下の階層に、『名前』、『住所』および『電話番号』があり、『職場情報』の下の階層に、『住所』および『電話番号』があり、『本人情報』の階層と『職場情報』の階層とが同じ階層である、といった構造のことをいう。また、『名前』、『住所』、『電話番号』等が、「論理構造」を構成する複数の「論理要素」各々のことである。言い換えると、「論理構造」や「論理要素」とは、例えば、帳票画像のフォーマットを作成する作成者によって当該帳票画像のフォーマットが作成される際に、(意識的か無意識的かに関わらず)複数の項目が形成する構造として「論理構造」が設定され、複数の項目各々が「論理要素」として設定されるものであるといえる。一方、画像認識装置が当該帳票画像について処理を行う際には、当該帳票画像において複数の項目が形成する構造を「論理構造」として扱い、複数の項目各々を「論理要素」として扱うことになる。なお、「画像」は、帳票画像に限られず、例えば、複数の質問各々に回答を記入させるアンケートの画像等、複数の項目各々に文字列各々が記載されている画像であれば、いずれでもよい。
続いて、図1を用いて、実施例1に係る画像認識装置の概要および特徴を説明する。図1は、実施例1に係る画像認識装置の概要および特徴を説明するための図である。
次に、図2〜10を用いて、実施例1に係る画像認識装置を説明する。図2は、実施例1に係る画像認識装置の構成を示すブロック図であり、図3は、帳票画像を説明するための図であり、図4は、認識結果表示画面を説明するための図であり、図5は、論理構造モデル記憶部を説明するための図であり、図6は、認識結果表示用バッファを説明するための図であり、図7は、誤り訂正操作について説明するための図であり、図8は、論理要素自動確定について説明するための図であり、図9は、論理構造モデル記憶部(変換後)を説明するための図であり、図10は、誤り訂正操作について説明するための図である。
次に、図11を用いて、実施例1に係る画像認識装置による処理の手順を説明する。図11は、実施例1に係る画像認識装置による処理の手順を示すフローチャートである。
これまで認識結果表示画面として、図4に示す認識結果表示画面を前提として説明してきたが、これに限られるものではなく、例えば、図12に示す認識結果表示画面など、いずれでもよい。第2の論理要素確定部35が、所定の論理要素よりも前に利用者によって確認済みであると位置づけられる順序で出力された論理要素各々全てについて、正しいものと確定する部であることは、上記した通りであるが、ここで、「所定の論理要素よりも前に利用者によって確認済みであると位置づけられる順序」の意味について改めて説明する。
上記してきたように、実施例1によれば、訂正作業の負荷を軽減することが可能になる。すなわち、実施例1に係る画像認識装置は、利用者が確定されたり訂正されるなどして確定された論理要素を固定した上で論理構造モデルを参照することで、その他の未確定論理要素の認識結果を改善する。また、この時、未確定論理要素の認識結果の候補の数が一つになれば、その論理要素を確定することもできる。したがって、利用者が確定したり訂正した結果を用いて別の論理要素を確定することができるので、利用者における訂正作業の負荷を軽減することが可能になる。
以下、図13を用いて、実施例2に係る画像認識装置の概要および特徴を説明する。図13は、実施例2に係る画像認識装置の概要および特徴を説明するための図である。
次に、図14を用いて、実施例2に係る画像認識装置の構成を説明する。図14は、実施例2に係る画像認識装置の構成を示すブロック図である。
次に、図16を用いて、実施例2に係る画像認識装置による処理の手順を説明する。図16は、実施例2に係る画像認識装置による処理の手順を示すフローチャートである。
これまで認識結果表示画面として、図13に示す認識結果表示画面を前提として説明してきたが、これに限られるものではなく、例えば、図17に示す認識結果表示画面など、いずれでもよい。すなわち、画像認識装置は、図17に示すように、誤り項目を訂正した後でも未確定論理要素の表示を変えずに、未確定論理要素を選択した際に表示される文字列の候補に再認識の結果を反映するように出力している。
上記してきたように、実施例2によれば、未確定論理要素(未だ正しいものであると確定されていない論理要素)の改悪を防止することが可能になる。
図18および19を用いて、実施例3に係る画像認識装置の概要および特徴を説明する。図18は、実施例3に係る画像認識装置の概要および特徴を説明するための図であり、図19は、認識結果表示用バッファおよび再認識結果用バッファを説明するための図である。
次に、図20を用いて、実施例3に係る画像認識装置による処理の手順を説明する。図20は、実施例3に係る画像認識装置による処理の手順を示すフローチャートである。
これまで認識結果表示画面として、図18に示す認識結果表示画面を前提として説明してきたが、これに限られるものではなく、例えば、図21に示す認識結果表示画面など、いずれでもよい。すなわち、画像認識装置は、図21に示すように、誤り項目を訂正した後でも未確定論理要素の表示を変えずに、未確定論理要素を選択した際に表示される文字列の候補に再認識の結果を反映するように出力している。
上記してきたように、実施例3によれば、訂正作業の負荷を軽減することが可能になる。すなわち、実施例3に係る画像認識装置は、利用者が確定されたり訂正されるなどして確定された論理要素を固定した上で論理構造モデルを参照することで、その他の未確定論理要素の認識結果を改善する。また、この時、未確定論理要素の認識結果の候補の数が一つになれば、その論理要素を確定することもできる。したがって、利用者が確定したり訂正した結果を用いて別の論理要素を確定することができるので、利用者における訂正作業の負荷を軽減することが可能になる。
さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。
また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順(図11、16、20等)、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
上記の実施例で説明した各種の処理は、予め用意されたプログラムやパーソナル・コンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。そこで、以下では、図22を用いて、上記の実施例1と同様の機能を有する画像認識プログラムを実行するコンピュータの一例を説明する。図22は、画像認識プログラムを実行するコンピュータを示す図である。
11 画像入力部
12 ユーザ操作入力部
13 表示部
20 記憶部
21 文字認識辞書記憶部
22 論理構造モデル記憶部
25 記憶部
26 認識結果表示用バッファ
27 再認識結果用バッファ
30 制御部
31 文字列認識部
32 論理構造認識部
33 認識結果出力部
34 第1の論理要素確定部
35 第2の論理要素確定部
36 論理構造再認識制御部
37 論理構造モデル変換部
38 再認識結果バッファ格納部
Claims (4)
- 論理構造を構成する複数の論理要素各々として文字列各々が記載されている画像について、当該文字列各々と当該論理要素各々との対応を認識することで、当該論理要素各々を認識する方法をコンピュータに実行させる画像認識プログラムであって、
前記対応が認識または再認識されると、認識結果である複数の論理要素各々を出力部に出力する出力手順と、
前記出力手順によって出力された認識結果を確認する利用者から、当該複数の論理要素各々の内正しいものとされる論理要素を確定する確定要求の入力を受け付けると、当該論理要素について、正しいものと確定する第1の確定手順と、
前記第1の確定手順によって確定された前記論理要素よりも前に前記利用者によって確認済みであると位置づけられる順序で出力された論理要素各々全てについて、前記第1の確定手順で確定した論理要素とは異なる他の論理要素を正しいものと確定する第2の確定手順と、
前記第1の確定手順および前記第2の確定手順によって正しいものであると確定された論理要素各々の確定内容に基づいて、未だ正しいものであると確定されていない論理要素各々について前記対応を再認識する再認識手順と、
をコンピュータに実行させることを特徴とする画像認識プログラム。 - 前記再認識手順による認識結果をバッファに格納する格納手順をさらに備え、
前記出力手順は、前記再認識手順による認識結果を出力するにあたり、前記格納手順によって格納された認識結果が現に出力部に出力している認識結果と一致するか否かを論理要素ごとに比較し、一致しない論理要素については、前記再認識手順による認識結果が現に出力部に出力している認識結果と異なるものであることを示す情報を出力することを特徴とする請求項1に記載の画像認識プログラム。 - 論理構造を構成する複数の論理要素各々として文字列各々が記載されている画像について、当該文字列各々と当該論理要素各々との対応を認識することで、当該論理要素各々を認識する画像認識装置であって、
前記対応が認識または再認識されると、認識結果である複数の論理要素各々を出力部に出力する出力手段と、
前記出力手段によって出力された認識結果を確認する利用者から、当該複数の論理要素各々の内正しいものとされる論理要素を確定する確定要求の入力を受け付けると、当該論理要素について、正しいものと確定する第1の確定手段と、
前記第1の確定手段によって確定された前記論理要素よりも前に前記利用者によって確認済みであると位置づけられる順序で出力された論理要素各々全てについて、前記第1の確定手段で確定した論理要素とは異なる他の論理要素を正しいものと確定する第2の確定手段と、
前記第1の確定手段および前記第2の確定手段によって正しいものであると確定された論理要素各々の確定内容に基づいて、未だ正しいものであると確定されていない論理要素各々について前記対応を再認識する再認識手段と、
を備えたことを特徴とする画像認識装置。 - 論理構造を構成する複数の論理要素各々として文字列各々が記載されている画像について、当該文字列各々と当該論理要素各々との対応を認識することで、当該論理要素各々を認識する画像認識方法であって、
前記対応が認識または再認識されると、認識結果である複数の論理要素各々を出力部に出力する出力工程と、
前記出力工程によって出力された認識結果を確認する利用者から、当該複数の論理要素各々の内正しいものとされる論理要素を確定する確定要求の入力を受け付けると、当該論理要素について、正しいものと確定する第1の確定工程と、
前記第1の確定工程によって確定された前記論理要素よりも前に前記利用者によって確認済みであると位置づけられる順序で出力された論理要素各々全てについて、前記第1の確定工程で確定した論理要素とは異なる他の論理要素を正しいものと確定する第2の確定工程と、
前記第1の確定工程および前記第2の確定工程によって正しいものであると確定された論理要素各々の確定内容に基づいて、未だ正しいものであると確定されていない論理要素各々について前記対応を再認識する再認識工程と、
を含んだことを特徴とする画像認識方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007284294A JP5338063B2 (ja) | 2007-10-31 | 2007-10-31 | 画像認識プログラム、画像認識装置および画像認識方法 |
US12/250,302 US8503784B2 (en) | 2007-10-31 | 2008-10-13 | Image recognition apparatus, image recognition method, and storage medium recording image recognition program |
CN2008101706878A CN101425132B (zh) | 2007-10-31 | 2008-10-30 | 图像识别装置和识别方法及记录图像识别程序的存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007284294A JP5338063B2 (ja) | 2007-10-31 | 2007-10-31 | 画像認識プログラム、画像認識装置および画像認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009110444A JP2009110444A (ja) | 2009-05-21 |
JP5338063B2 true JP5338063B2 (ja) | 2013-11-13 |
Family
ID=40582918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007284294A Expired - Fee Related JP5338063B2 (ja) | 2007-10-31 | 2007-10-31 | 画像認識プログラム、画像認識装置および画像認識方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8503784B2 (ja) |
JP (1) | JP5338063B2 (ja) |
CN (1) | CN101425132B (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4759638B2 (ja) * | 2009-12-25 | 2011-08-31 | 株式会社スクウェア・エニックス | リアルタイムなカメラ辞書 |
JP4923134B2 (ja) * | 2010-06-08 | 2012-04-25 | 株式会社スクウェア・エニックス | リアルタイムなカメラ辞書 |
WO2013079907A1 (en) * | 2011-11-30 | 2013-06-06 | The University Of Surrey | System, process and method for the detection of common content in multiple documents in an electronic system |
US20150006362A1 (en) * | 2013-06-28 | 2015-01-01 | Google Inc. | Extracting card data using card art |
CN103799997A (zh) * | 2014-02-11 | 2014-05-21 | 辛勤 | 基于图像识别的生理监测参数的记录方法及系统 |
CN106909548B (zh) * | 2015-12-22 | 2021-01-08 | 北京奇虎科技有限公司 | 基于服务器的图片加载方法及装置 |
US11256710B2 (en) | 2016-10-20 | 2022-02-22 | Microsoft Technology Licensing, Llc | String transformation sub-program suggestion |
US11620304B2 (en) * | 2016-10-20 | 2023-04-04 | Microsoft Technology Licensing, Llc | Example management for string transformation |
US10846298B2 (en) | 2016-10-28 | 2020-11-24 | Microsoft Technology Licensing, Llc | Record profiling for dataset sampling |
CN106789204A (zh) * | 2016-12-09 | 2017-05-31 | 邯郸美的制冷设备有限公司 | 一种智能配网的方法、装置及智能设备 |
CN107545391A (zh) * | 2017-09-07 | 2018-01-05 | 安徽共生物流科技有限公司 | 一种基于图像识别的物流单据智能分析与自动存储方法 |
CN107622266B (zh) * | 2017-09-21 | 2019-05-07 | 平安科技(深圳)有限公司 | 一种ocr识别的处理方法、存储介质和服务器 |
US11562326B2 (en) * | 2019-02-20 | 2023-01-24 | eCU Technology, LLC | User interface and system for client database management |
JP2021114211A (ja) * | 2020-01-21 | 2021-08-05 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
JP7241822B2 (ja) * | 2021-08-20 | 2023-03-17 | 株式会社マネーフォワード | 証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05158605A (ja) | 1991-12-10 | 1993-06-25 | Casio Comput Co Ltd | データ入力装置 |
JPH07134750A (ja) * | 1993-11-11 | 1995-05-23 | Nec Corp | 文書画像認識装置 |
JPH07192095A (ja) * | 1993-12-27 | 1995-07-28 | Nec Corp | 文字列入力装置 |
JPH08194772A (ja) * | 1995-01-13 | 1996-07-30 | Toshiba Corp | 光学的文字読取り装置 |
WO1997005561A1 (fr) * | 1995-07-31 | 1997-02-13 | Fujitsu Limited | Processeur de supports et procede de traitement de supports |
JP3452774B2 (ja) * | 1997-10-16 | 2003-09-29 | 富士通株式会社 | 文字認識方法 |
JP3639126B2 (ja) * | 1998-01-22 | 2005-04-20 | 富士通株式会社 | 住所認識装置及び住所認識方法 |
US7099507B2 (en) * | 1998-11-05 | 2006-08-29 | Ricoh Company, Ltd | Method and system for extracting title from document image |
JP3425408B2 (ja) * | 2000-05-31 | 2003-07-14 | 株式会社東芝 | 文書読取装置 |
US7149970B1 (en) * | 2000-06-23 | 2006-12-12 | Microsoft Corporation | Method and system for filtering and selecting from a candidate list generated by a stochastic input method |
US6832726B2 (en) * | 2000-12-19 | 2004-12-21 | Zih Corp. | Barcode optical character recognition |
US7142728B2 (en) * | 2002-05-17 | 2006-11-28 | Science Applications International Corporation | Method and system for extracting information from a document |
JP4615272B2 (ja) * | 2003-09-29 | 2011-01-19 | 富士フイルム株式会社 | 認証システム、プログラム、及び建築物 |
CN1848109A (zh) | 2005-04-13 | 2006-10-18 | 摩托罗拉公司 | 用于编辑光学字符识别结果的方法和系统 |
JP2006293810A (ja) * | 2005-04-13 | 2006-10-26 | Oki Electric Ind Co Ltd | 帳票データ化装置、帳票データ化システムおよび帳票データ化方法 |
JP2007222747A (ja) | 2006-02-22 | 2007-09-06 | Toshiba Corp | 郵便物処理装置及び郵便物処理方法 |
-
2007
- 2007-10-31 JP JP2007284294A patent/JP5338063B2/ja not_active Expired - Fee Related
-
2008
- 2008-10-13 US US12/250,302 patent/US8503784B2/en not_active Expired - Fee Related
- 2008-10-30 CN CN2008101706878A patent/CN101425132B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009110444A (ja) | 2009-05-21 |
CN101425132B (zh) | 2012-10-17 |
CN101425132A (zh) | 2009-05-06 |
US8503784B2 (en) | 2013-08-06 |
US20090110282A1 (en) | 2009-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5338063B2 (ja) | 画像認識プログラム、画像認識装置および画像認識方法 | |
JP4998219B2 (ja) | 帳票認識プログラム、帳票認識装置および帳票認識方法 | |
JP5126068B2 (ja) | 文言い換え方法、プログラムおよびシステム | |
JP4077909B2 (ja) | 帳票処理装置 | |
WO2020218512A1 (ja) | 学習モデル生成装置、文字認識装置、学習モデル生成方法、文字認識方法、及びプログラム | |
JP4750802B2 (ja) | 帳票処理プログラムおよび帳票処理装置 | |
US7817825B2 (en) | Apparatus, system and method for person verification | |
US20070009158A1 (en) | Paper and electronic recognizable forms | |
JP2007317022A (ja) | 手書文字処理装置及び手書文字処理方法 | |
JP2008021068A (ja) | 帳票認識装置及び帳票認識プログラム | |
JP2004013813A (ja) | 情報管理システムおよび情報管理方法 | |
JP5253788B2 (ja) | 画像認識装置、画像認識プログラムおよび画像認識方法 | |
JP2020087112A (ja) | 帳票処理装置および帳票処理方法 | |
Shirali-Shahreza et al. | Multilingual captcha | |
Lund | Ensemble Methods for Historical Machine-Printed Document Recognition | |
JP2019074807A (ja) | 情報処理装置及びプログラム | |
JP3484446B2 (ja) | 光学文字認識装置 | |
JP4409408B2 (ja) | 電子申請支援サーバ、電子申請支援方法、および電子申請支援プログラム | |
JP2010237909A (ja) | 知識補正プログラム、知識補正装置および知識補正方法 | |
JP4809024B2 (ja) | 帳票読取装置、プログラム及び帳票読取システム | |
JP2002279352A (ja) | 文字認識装置、文字認識方法および記録媒体 | |
JP2004046388A (ja) | 情報処理システムおよび文字修正方法 | |
JP2004062351A (ja) | レイアウト情報登録システム、レイアウト情報登録プログラム、およびレイアウト情報登録方法 | |
JPH0749924A (ja) | 手書き文字認識装置 | |
JP2829002B2 (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100616 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120717 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130520 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130529 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130709 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130722 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |