JP2011118513A - 文字認識装置および帳票識別方法 - Google Patents

文字認識装置および帳票識別方法 Download PDF

Info

Publication number
JP2011118513A
JP2011118513A JP2009273400A JP2009273400A JP2011118513A JP 2011118513 A JP2011118513 A JP 2011118513A JP 2009273400 A JP2009273400 A JP 2009273400A JP 2009273400 A JP2009273400 A JP 2009273400A JP 2011118513 A JP2011118513 A JP 2011118513A
Authority
JP
Japan
Prior art keywords
image
input
unit
identification information
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009273400A
Other languages
English (en)
Inventor
Akihiro Uda
明弘 宇田
Hironori Ogasawara
裕規 小笠原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2009273400A priority Critical patent/JP2011118513A/ja
Publication of JP2011118513A publication Critical patent/JP2011118513A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】類似する帳票の登録および検索をしやすくする。
【解決手段】この文字認識装置は、新たに入力された第1の画像またはその部分画像から帳票の種類を識別する識別部と帳票の種類が識別されなかった第1の画像と第1の画像と類似する特徴を持つ既存の第2の画像とを画面に表示する表示制御部と、第1画像または第2の画像に対する新たな特徴情報の入力を受け付ける受付部と、入力された特徴情報と第1の画像または第2の画像を対応付けて帳票識別情報記憶部に登録する登録部とを備える。
【選択図】図1

Description

本発明は、例えばスキャナなどによって光学的に読み取られた帳票の画像から帳票の種類を識別する文字認識装置および帳票識別方法に関する。
近年、多種多様な帳票の種類を識別しながら、一部を文字認識し、機械による認識が困難な部分を人手によるキー入力などで補うシステムが増えている。対象となる帳票は多種多様であり初期導入時に予め帳票種別が明確にできるとは限らず、導入の際には対象帳票それぞれの差異を分析して登録しながら識別辞書として正確に登録する必要がある。
帳票の種類を識別するための従来の技術としては、例え2つの画像から抽出した特徴量の差をいくつかに分割した領域毎に「大」、「小」、「無」などとして、2つの画像と特徴量差表示欄を画面に表示することで、利用者が、画面に並べられた2つの画像の「小」と示される該当領域を見比べて特徴の差を探し出せるようにした技術が開示されている(例えば特許文献1参照)。
特開2008−250817号公報
従来の技術の場合、画像を分割した小領域毎に、特徴量の差が「大」、「小」、「無」などとして明示されるものの、具体的に画像のどの文字がどう違うのかを見つけるのは人間であり、画像どうしの違いが微少で判りにくい場合にどこが違うのか特定できないという問題があった。
このため、以前に登録した帳票の画像と類似した帳票の画像を全く別の識別子で登録してしまい、キーワード検索などで、類似した帳票が検索されないといった不具合が生じることもあった。
本発明はこのような課題を解決するためになされたもので、画像どうしが一致する箇所と異なる箇所とを具体的に示すことで、類似する帳票の登録および検索をしやすくすることができる文字認識装置および帳票識別方法を提供することを目的とする。
上記の課題を解決するために、本発明の文字認識装置は、入力された帳票の画像に基づいて識別した帳票の種類に応じて前記帳票に記載されている文字を認識する文字認識装置において、帳票の種類を特徴付ける特徴情報と帳票の画像とを対応させて帳票識別情報として記憶した帳票識別情報記憶部と、新たに入力された第1の画像を帳票識別情報記憶部の帳票識別情報と照合して第1の画像の帳票の種類を識別する識別部と、前記識別部により帳票の種類が識別されなかった第1の画像と第1の画像と類似する特徴を持つ帳票識別情報記憶部から読み出した第2の画像とを画面に表示する表示制御部と、第1画像または第2の画像に対する新たな特徴情報の入力を受け付ける受付部と、受付部により受け付けられた特徴情報を第1の画像または第2の画像に対応付けて前記帳票識別情報記憶部に登録する登録部とを具備することを特徴とする。
本発明によれば、類似する帳票の登録および検索をしやすくすることができる。
本発明の第1実施形態の画像処理システムの構成を示す図である。 帳票の画像の一例を示す図である。 confusion matrixの説明図である。 画像比較用の画面(グラフィックユーザインターフェース:GUI)の一例を示す図である。 第1実施形態の画像処理システム全体の動作を示すフローチャートである。 入力画像と特徴が類似する画像を検出したときの画面の一例を示す図である。 未登録画像を登録する際の画面の一例を示す図である。 第2実施形態の画像処理システムの構成を示す図である。 識別できない入力帳票の画像の一例を示す図である。 図9の画像を補正した画像の一例を示す図である。 第3実施形態の画像処理システムの構成を示す図である。 第3実施形態の画像処理システムの動作を示すフローチャートである。
以下、図面を参照して本発明の実施の形態の画像処理システムを詳細に説明する。図1は第1実施形態の画像処理システムの構成を示す図である。
図1に示すように、この第1実施形態の画像処理システムは、画像入力装置としてのイメージスキャナ1(以下「スキャナ1」と称す)と、制御端末2と、モニタなどの表示装置3とを備えている。
スキャナ1は、例えばCCDなどの撮像素子をライン状に配置したCCDラインセンサとこのCCDラインセンサへ帳票を連続して供給するための給紙機構を備えるものである。この他、スキャナ1は、帳票を一枚ずつ読み取るためのフラットベッドを備えるものであってもよい。スキャナ1は、CCDラインセンサにより読取対象物(申込書などの帳票)をスキャニングし(読み取り)、帳票イメージ(以下これを「入力画像」と称す)として制御端末2に入力する。帳票には、例えばタイトル、注釈、氏名、帳票コードなどの文字を記載した複数の文字記載欄が設けられている。
この実施形態では、画像入力装置としてスキャナ1を例示したが、「帳票を光学的に読み取った画像」を入力するものであれば、例えばネットワーク上のサーバやネットワーク回線、その通信インターフェースなども画像入力装置に含まれる。この他、画像入力装置としては、様々なものを許容する。
表示装置3は、制御端末2から出力された画像比較用の画面(図4の画面40参照)を表示する。すなわち、表示装置3は、帳票を光学的に読み取った画像を表示する表示部として機能する。
制御端末2は、例えばコンピュータなどであり、画像記憶部10、特徴抽出部11、識別部12、特徴比較部13、登録部14、識別定義記憶部15、表示制御部16、confusion matrix記憶部17を備えている。この他、制御端末2は、図示を省略した文字認識機能を備えており、スキャナ1から入力された入力画像から識別した帳票の種類に応じて帳票に記載されている文字を、入力画像から認識する文字認識装置として機能する。
画像記憶部10、識別定義記憶部15はコンピュータに予め搭載されるメモリまたはハードディスク装置などにより実現される。これ以外の要素(特徴抽出部11、識別部12、特徴比較部13、登録部14、表示制御部16など)は、ハードディスク装置にインストールされた文字認識ソフトウェア(プログラム)を、コンピュータに内蔵されたCPUが実行することで実現される。なお上記各要素はプログラム(ソフトウェア)に限らず、ハードウェアで実現してもよい。
この他、制御端末2には、例えば登録対象の帳票に対してファイル名やその他の属性情報を入力する他、検索キーワードを入力するキーボードなどの入力装置4が接続されている。入力装置4には、キーボードの他、例えばマウスやトラックボールなどのように画面上のポインタを操作する機器も含まれる。
画像記憶部10には、スキャナ1から入力された帳票のイメージデータ(以下これを「入力画像」と称す)が記憶される。
特徴抽出部11は、画像記憶部10に記憶された入力画像を読み出して、その入力画像の所定領域から特徴を抽出する。所定領域とは、例えばJISBなどで固定ピッチにて印字された領域(帳票コードが示されている領域)や、入力画像の上部に、所定の大きさ以上のサイズ(大き目のサイズ)で、文字などのキャラクタが印刷された領域(タイトル領域と想定される)であり、予め設定された帳票毎の特徴領域の位置情報から特徴領域を切り出し、特徴(帳票コードやタイトルの文字など)を抽出する。この機能は既存技術のラベリング処理などにより実現される。
なお帳票の文字記載欄のうち、特徴抽出対象とする領域としない領域とが設定されており、本実施形態では、初期値として、タイトルと帳票コードの欄が特徴抽出対象とされているものとする。
confusion matrix記憶部17には、confusion matrixが記憶されている。confusion matrixは、同形文字、類似文字、文字の切り出しを、誤りやすい文字の組み合わせとして定義した定義体、つまり間違いやすい事例のデータベースである。
confusion matrixは、例えば図2に示すように、タイトルが「労働保険」、帳票コードが「4397」の帳票の場合、文字認識により、図3に示すように、タイトルの漢字の「働」がカタカナの「イ」と漢字の「動」として分離されたときにも1つの文字として識別するように識別条件を定義したものである。
confusion matrix記憶部17には、例えば数字のイチ「1」に対して英字の大文字のアイ「I」や英字の小文字のエル「l」などが間違い易いものとして関連付けて登録されている。
識別定義記憶部15には、帳票を識別するための識別定義情報が記憶されている。識別定義情報の1つとして、例えば書類名と帳票コードとを対応付けた帳票種別情報が記憶されている。
帳票コードが例えば「4398」であれば、帳票のサイズがX1mm×Y1mmであり、帳票の種類は例えば「内容確認書」である。また帳票コードが「4399」であれば、帳票のサイズがX1mm×Y1mmであり、帳票の種類は「破棄申請書」…等である。
また、識別定義記憶部15には、それぞれの帳票コード毎に帳票の書式を示すフォーマット情報(これを「帳票フォーマット」という)が記憶されている。帳票フォーマットは、帳票がどういったサイズで、帳票のどの位置にどういった情報が記載されているかといった情報である。
識別定義情報の一つとして、特徴領域の属性データがある。この特徴領域の属性データは、帳票の画像内のどの位置にどの項目の文字イメージ領域が存在するかといった配置データであり、例えば内容確認書というタイトルの文字イメージ領域の切り出し範囲を示す座標情報(始点(左上角)と終点(右下角))である。
座標情報は、例えば入力画像の左上角を基準点(x0,y0など)とする2次元平面の座標である。すなわち、識別定義記憶部15は、帳票における文字記載欄の配置を含む帳票フォーマットが記憶されている。
識別部12は、特徴として抽出された文字の位置と文字列の内容または帳票コードやサイズが、予め登録されている帳票の識別定義情報と一致しているかどうかを確認する。これにより、登録済みの帳票と文字の位置と文字列の内容が一致している入力画像の帳票については種類を特定できる。
すなわち、識別部12は、帳票の所定領域に印字された帳票コードを読み取り、読み取った帳票コードと識別定義記憶部15内の帳票コードとが一致したとき、その帳票の帳票フォーマット(種類)を特定する。
一方、入力画像から得た帳票の特徴情報と既登録の識別定義情報とが不一致の場合には入力画像を未登録帳票として処理する。不一致の場合とは、帳票フォーマットがまったく異なる場合と、類似する帳票(既登録帳票の画像)が複数、候補として読み出されたがその中から1つを特定できない場合がある。
この場合、特徴比較部13は、登録済みの帳票の特徴情報と未登録の入力画像の特徴との差異を検出する。これにより、例えば全体に対する不一致の割合で、どの程度類似しているかを判定できる。
本実施形態では、画像の識別子に使われる大量の文字列を予め分析し、同形文字、類似文字、文字切り出し誤りなどの組み合わせなど、文字認識の際に誤読し易いパターンの一つとして定義されたconfusion matrixを類似判定に使用する。
登録部14は、新規登録する未登録の入力画像(第1の画像)または特徴情報を追加登録する既登録帳票の画像(第2の画像)に対する新たな特徴情報の入力を受け付ける受付部として機能する。
登録部14は、受け付けた特徴情報を、未登録の入力画像(第1の画像)または既登録帳票の画像(第2の画像)に対応付けて識別定義記憶部15に登録する。
より具体的には、登録部14は、未登録帳票の画像を新規登録する場合に、入力装置4からキー入力される新たな識別情報を受け付け、受け付けた識別情報と入力画像の名称(帳票名)や帳票コードなどの識別子と入力画像とを対応させて識別定義情報として識別定義記憶部15に登録する。
登録部14は、既登録帳票の画像(第2の画像)に特徴情報を追加登録する場合、入力装置4からキー入力される新たな識別情報を受け付け、受け付けた識別情報を識別定義記憶部15の、既登録帳票の画像(第2の画像)とその名称(帳票名)や帳票コードなどの識別子とを対応付けた識別定義情報に追加登録する。
表示制御部16は、識別部12により帳票の種類が識別されなかった入力画像(第1の画像)と、この入力画像(第1の画像)と類似する特徴を持つ識別定義記憶部15から読み出した既登録帳票の画像(第2の画像)とを、オペレータに違いを判別させるために、画像比較画面40に同一画面上に同時期に表示する。
より具体的には、表示制御部16は、図4に示すように、識別部12により識別されなかった未識別の帳票の画像(入力画像42)と、これと類似する帳票フォーマット(種類)の帳票の画像(既登録帳票の画像52)とを画像比較用の画面40に同時期に表示すると共に、互いの画像42,52の比較対象箇所42,44と52,54のうち、相違する文字の箇所(または類似する文字の箇所)と一致する文字の箇所それぞれについて色を異ならせて表示するよう制御する。
すなわち、表示制御部16は、特徴を持つ既登録帳票の画像52と、未登録の帳票の画像(入力画像42)とを画面40に並べて表示すると共に、互いの画像の比較対象箇所のうち、相違箇所および類似箇所それぞれについて色を異ならせて表示するよう制御する。
図4では、既登録帳票の特徴についてconfusion matrixを用いて変換した結果がこれから登録しようとする未登録の帳票に近い部分類似領域44,54を、特徴として指定することを禁止する第1の箇所(指定禁止領域)として赤色または黄色の囲い線などのように危険または禁止を示す(促す)色で強調して表示している。
また、登録済みの帳票の画像41とこれから登録しようとする画像51とで内容が異なる領域42,52については、新規に特徴として指定してもよい第2の箇所(指定有効領域)として緑色または青色の囲い線などのように、安全または許可を示す(促す)色で強調して表示している。
ここで、図5のフローチャート、図6および図7を参照してこの画像処理システムの動作を説明する。
この画像処理システムでは、スキャナ1によりスキャンされて新たに入力された入力画像が画像記憶部10に記憶されると(ステップS101)、特徴抽出部11は、入力画像から特徴情報を抽出し(ステップS102)、識別部12へ渡す。
識別部12は、特徴抽出部11から受け取った入力画像の特徴情報と、識別定義記憶部15の帳票識別情報と照合して、入力画像(第1の画像)の帳票の種類を識別する(ステップS103)。
この際、帳票の種類が識別されなかった場合(ステップS104のNo)、識別部12は、特徴比較部13へ処理を渡す。特徴比較部13は、入力画像と類似する特徴を持つ既登録画像を識別定義記憶部15から読み出し、既登録帳票の画像(第2の画像)と入力画像(第1の画像)の予め設定された所定領域について特徴を比較し(ステップS105)、互いの類似度を算出し、類似度が予め設定された値よりも高い箇所と低い箇所とを検出する。そして、特徴比較部13は、既登録帳票の画像(第2の画像)と入力画像(第1の画像)と共に類似度が高い箇所と低い箇所の情報を表示制御部16へ渡す。
表示制御部16は、オペレータに違いを判別させるために、類似度が高い箇所と低い箇所とを、色を変えて示した既登録帳票の画像(第2の画像)と入力画像(第1の画像)を表示装置3の画像比較用の画面40に並べて(同時期)に表示する(図6参照)(ステップS106)。
この場合、図6に示すように、画像比較用の画面40には、特徴が一致する箇所42,52,44,54が赤色または黄色の枠線(点線で囲まれた箇所)などで示されている他、特徴抽出部11により抽出された帳票どうしで相違する新たな特徴を示す箇所45,55が青色または緑色の枠線(破線で囲まれた箇所)を点滅させるなどして示されている。
また、この画面40には、これら相違する箇所45,55の特徴を登録する「はい」、登録しない「いいえ」を指示するためのボタン60,61が設けられており、特徴を登録する場合、「はい」のボタン60をクリックすることで、該当箇所45,55の特徴情報が、それぞれの画像の識別定義情報として登録部14により追加登録される。
また、この画面40に表示された画像の中で、登録可能と示されている青色の枠線部分(特徴を示す箇所45または箇所55のいずれか)を、例えばマウスなどのポインティングデバイスで選択(指定)すると、表示制御部16は、該当する部分画像どうしを画面に並べて拡大表示する。拡大表示された画像どうし(この例では「北海道」と「秋田」)をユーザが確認することで、ユーザは画像どうしの差異を明確に見分けることができる。
なお、特徴が一致する箇所42,52,44,54については、特徴として追加登録するには不向き(危険)なため、赤色または黄色等の危険または拒否を示唆する色で表示するよう設定されている。
また、互いの画像の特徴が一致し帳票の種類が識別できた場合(ステップS104のYes)、その入力画像と一致する特徴を持つ既登録帳票の画像(第2の画像)を識別定義記憶部15から読み出し、その読み出した既登録帳票の画像(第2の画像)と入力画像(第1の画像)とを表示制御部16へ渡す。
表示制御部16は、オペレータに同じ帳票か否かを判別させるために既登録帳票の画像(第2の画像)と入力画像(第1の画像)とを表示装置3の同一画面上に同時期に表示する(ステップS106)。
そして、オペレータが画面の画像を確認し、新規登録する入力画像(第1の画像)または特徴情報を追加登録する既登録帳票の画像(第2の画像)に対する新たな特徴情報を、色が示されている領域をクリックするか、キー入力するなどして入力すると(ステップS107のYes)、登録部14は、その入力された特徴情報を受け付け、受け付けた特徴情報を、入力画像(第1の画像)と既登録帳票の画像(第2の画像)に対応付けて識別定義記憶部15に登録する(ステップS108)。
なお、入力画像(第1の画像)の特徴が既登録帳票の画像(第2の画像)の特徴と全く一致しなかった場合、表示制御部16は、図7に示すように、その入力画像(第1の画像)を未登録画像として新規登録用の画面70を表示する。
この画面70には、特徴抽出部11により抽出された帳票の特徴を示す箇所71,72と、これら箇所71,72の特徴を登録する「はい」、登録しない「いいえ」を指示するためのボタン73,74と、他の領域を追記するためのボタン75と、この未登録画像をモデルとして登録することを確定するためのボタン76が設けられている。
オペレータは、この画面70の「はい」のボタン73をクリックし、「モデル登録」のボタン76をクリック操作することで、入力画像(未登録画像)を新たな特徴を持つ帳票のモデルとして登録することができる。
このようにこの第1実施形態の画像処理システムによれば、入力画像(第1の画像)と既登録帳票の画像(第2の画像)とを比較して帳票の種類を判別した結果、入力画像(第1の画像)の特徴が既登録帳票の画像(第2の画像)と一致しなかった場合、画面に表示する画像どうしの差異を、入力画像(第1の画像)と既登録帳票の画像(第2の画像)との特徴が一致した部分と不一致の部分とをそれぞれ囲み線の線種や該当部分の色を変えて表示するので、ユーザは画像どうしの差異を明確に見分けることができる。
また、画像比較用の画面40に表示された画像の中で、登録可能と示されている青色の囲み線で囲まれた特徴の部分領域を、例えばマウスなどのポインティングデバイスで選択(指定)すると、該当する部分画像どうしを画面に並べて拡大表示するので、ユーザは画像どうしの差異を明確に見分けることができる。
図6に示した画像比較用の画面40のように、類似していない箇所や類似している箇所をそれぞれ別個の色で強調して表示することにより、利用者による確認が特にしやすくなり、二重登録を防止する上でも有効である。
なお、識別部12で帳票を識別できなかった画像について、利用者が識別定義情報の特徴情報の登録数を増やして、類似帳票の識別機能を強化することも考えられる。この際、識別定義情報が既に登録されている帳票の画像について、識別できなかった入力画像との差をより顕著に示す特徴情報を追加登録するようにする。
すなわち、特徴比較部13により抽出された特徴部分の中から新たに追加する識別子に対してマウスによる登録のための選択操作などが行われた場合、登録部14は、選択された識別子を識別定義記憶部15の該当識別定義情報へ追加登録する。
次に、図8乃至図10を参照して第2実施形態について説明する。なお第2実施形態を説明するにあたり、第1実施形態と同じ構成には同一の符号を付しその説明は省略する。
図8に示すように、この第2実施形態は、特徴抽出部11と特徴比較部13との間に入力画像変換部18を設けている。
この入力画像変換部18にて、特徴抽出部11により特徴が抽出されなかった入力画像に対して、ノイズや傾きなどの画像の揺れを矯正するような画像変換を施すことで、ノイズや傾きなどの画像の揺れに対処することができる。
この逆に、図4または図6などの画像比較用の画面40にて、利用者が入力画像の所定領域が既登録の帳票の画像と一致していることを確認した場合には、実際には登録済みであるものの、ノイズなど何らかの影響を受けたために識別ができなかった可能性がある。
例えば図9に示すように、帳票をスキャンした結果、画像の向きが傾斜し、かつ縮小し、かつ濃度が薄くなった画像などが入力された場合、入力画像変換部18は、例えば傾き補正、拡大、濃度を濃くするなどの処理を施し、図10に示すように補正し正規化する。
このようにこの第2実施形態によれば、スキャナ1から入力された画像をそのまま用いるのではなく、入力画像変換部18で補正した画像を用いることで、種類を識別できないが画像を減らし、文字認識率を向上することができる。
次に、図11を参照して第3実施形態を説明する。
図11に示すように、この第3実施形態の画像処理システムは、スキャナ1と、制御端末2と、識別定義作成端末5と、エントリ端末6とを、例えばローカルエリアネットワーク(以下「LAN」と称す)などのネットワークを介して接続している。
つまり、第1実施形態がスキャナを接続したコンピュータに文字認識ソフトウェアを実装した構成であるのに対して、この第3実施形態は、帳票読み取り機能と帳票識別機能と、識別辞書作成機能と、文字認識結果の照合機能をネットワーク上のハードウェア(スキャナ1、制御端末2、識別定義作成端末5、エントリ端末6)に分散配置した構成例である。
ここで、図12のフローチャートを参照してこの第3実施形態の画像処理システムの動作を説明する。
この第3実施形態の画像処理システムでは、制御端末2では、スキャナ1によりスキャンされた帳票の画像を受け付ける(ステップS200)。すると、制御端末2は、新たに登録すべき識別定義情報(新識別定義情報)の有無を確認する(ステップS201)。
この確認の結果、新識別定義情報が存在すると、既に識別定義記憶部15に登録されている識別定義情報を新識別定義情報に差し替える(ステップS202)。
また、確認の結果、新識別定義情報が存在しなければ、受け付けた帳票の画像を識別する(ステップS203)。
帳票を識別できなかった場合(ステップS204のNo)、制御端末2は、識別定義作成端末5に対する辞書作成要求を発行し(ステップS205)、ネットワークを通じて識別定義作成端末5へ送信する。
識別定義作成端末5では、制御端末2からの辞書作成要求が受信されると(ステップS301)、要求に従って新識別定義情報を作成し(ステップS302)、制御端末2へ送り、識別定義記憶部15の識別定義情報を新たに作成した新識別定義情報に差し替える(ステップS202)。
また、帳票を識別できた場合、つまり識別OKであれば(ステップS204のYes)、制御端末2は、識別した帳票に対して文字認識を行い(ステップS206)、文字認識結果のデータ(帳票画像とテキストデータ)をエントリ端末6へ転送(送信)すると共に(ステップS207)、表示装置3の画面へ出力する(ステップS208)。
一方、エントリ端末6では、制御端末2から文字認識結果のデータ(帳票画像とテキストデータ)が受信されると(ステップS401)、新識別定義情報が存在するか否かを確認する(ステップS402)。
この確認の結果、新識別定義情報が存在した場合(ステップS402のYes)、エントリ端末6は、新エントリ画面にて新識別定義情報を登録する(ステップS403)。
また、確認の結果、新識別定義情報が存在しなかった場合(ステップS402のNo)、エントリ端末6は、エントリ作業により識別定義情報を作成し、制御端末2へ転送し、制御端末2に接続された表示装置3の画面に出力する(ステップS208)。
このようにこの第3実施形態の画像処理システムによれば、帳票読み取り機能(スキャナ1)と帳票識別機能(制御端末2)と、識別辞書作成機能(識別定義作成端末5)と文字認識結果の照合機能(エントリ端末6)とをネットワークに分散配置したことで、それぞれの機能に最適な人員を配置できるので、業務効率を向上することができる。
なお、本願発明は、上記実施形態のみに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形してもよい。例えば各構成要素を、コンピュータのハードディスク装置などのストレージにインストールしたプログラムで実現してもよく、また上記プログラムを、コンピュータ読取可能な電子媒体:electronic mediaに記憶しておき、プログラムを電子媒体からコンピュータに読み取らせることで本発明の機能をコンピュータが実現するようにしてもよい。
電子媒体としては、例えばCD−ROM等の記録媒体やフラッシュメモリ、リムーバブルメディア:Removable media等が含まれる。さらに、ネットワークを介して接続した異なるコンピュータに構成要素を分散して記憶し、各構成要素を機能させたコンピュータ間で通信することで実現してもよい。
1…イメージスキャナ(スキャナ)、2…制御端末、3…表示装置、4…入力装置、5…識別定義作成端末、6…エントリ端末、10…画像記憶部、11…特徴抽出部、12…識別部、13…特徴比較部、14…登録部、15…識別定義記憶部、16…表示制御部、17…Confusion Matrix記憶部、18…入力画像変換部。

Claims (6)

  1. 入力された帳票の画像に基づいて識別した帳票の種類に応じて前記帳票に記載されている文字を認識する文字認識装置において、
    前記帳票の種類を特徴付ける特徴情報と前記帳票の画像とを対応させて帳票識別情報として記憶した帳票識別情報記憶部と、
    新たに入力された第1の画像を前記帳票識別情報記憶部の帳票識別情報と照合して前記第1の画像の帳票の種類を識別する識別部と、
    前記識別部により帳票の種類が識別されなかった前記第1の画像と前記第1の画像と類似する特徴を持つ前記帳票識別情報記憶部から読み出した第2の画像とを画面に表示する表示制御部と、
    前記第1画像または前記第2の画像に対する新たな特徴情報の入力を受け付ける受付部と、
    前記受付部により受け付けられた特徴情報を前記第1の画像または前記第2の画像に対応付けて前記帳票識別情報記憶部に登録する登録部と
    を具備することを特徴とする文字認識装置。
  2. 前記表示制御部は、
    前記第1の画像と前記第2の画像との差分の箇所を強調して表示することを特徴とする請求項1記載の文字認識装置。
  3. 前記表示制御部は、
    差分の箇所のうち、差異が少なく特徴として登録しない方がよい第1の箇所と、差異が大きく特徴として登録した方がよい第2の箇所とを異なる表示形態で表示することを特徴とする請求項2記載の文字認識装置。
  4. 前記表示制御部は、
    前記第1の箇所を危険または注意を促す色で表示し、前記第2の箇所を安全または許可を促す色で表示することを特徴とする請求項3記載の文字認識装置。
  5. 前記受付部は、
    前記第2の箇所を特徴情報として登録するよう選択を促すメッセージを画面に表示し、選択された特徴情報を受け付けることを特徴とする請求項3記載の文字認識装置。
  6. 入力された帳票の画像に基づいて識別した帳票の種類に応じて前記帳票に記載されている文字を認識する文字認識装置における帳票識別方法において、
    新たに入力された第1の画像を前記帳票の種類を特徴付ける特徴情報と前記帳票の画像とを対応させて帳票識別情報として記憶した帳票識別情報記憶部の帳票識別情報と照合して前記第1の画像の帳票の種類を識別するステップと、
    前記帳票の種類が識別されなかった前記第1の画像と前記第1の画像と類似する特徴を持つ前記帳票識別情報記憶部から読み出した第2の画像とを画面に表示するステップと、
    前記第1画像または前記第2の画像に対する新たな特徴情報の入力を受け付けるステップと、
    受け付けた特徴情報を前記第1の画像または前記第2の画像に対応付けて前記帳票識別情報記憶部に登録するステップと
    を有することを特徴とする帳票識別方法。
JP2009273400A 2009-12-01 2009-12-01 文字認識装置および帳票識別方法 Pending JP2011118513A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009273400A JP2011118513A (ja) 2009-12-01 2009-12-01 文字認識装置および帳票識別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009273400A JP2011118513A (ja) 2009-12-01 2009-12-01 文字認識装置および帳票識別方法

Publications (1)

Publication Number Publication Date
JP2011118513A true JP2011118513A (ja) 2011-06-16

Family

ID=44283789

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009273400A Pending JP2011118513A (ja) 2009-12-01 2009-12-01 文字認識装置および帳票識別方法

Country Status (1)

Country Link
JP (1) JP2011118513A (ja)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015170045A (ja) * 2014-03-05 2015-09-28 グローリー株式会社 売上管理システム及び売上管理方法
JP2016517587A (ja) * 2013-03-13 2016-06-16 コファックス, インコーポレイテッド モバイル装置を用いて取込まれたデジタル画像におけるオブジェクトの分類
US10108860B2 (en) 2013-11-15 2018-10-23 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
US10127441B2 (en) 2013-03-13 2018-11-13 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US10140511B2 (en) 2013-03-13 2018-11-27 Kofax, Inc. Building classification and extraction models based on electronic forms
US10142499B2 (en) 2015-10-06 2018-11-27 Canon Kabushiki Kaisha Document distribution system, document distribution apparatus, information processing method, and storage medium
JP2018190064A (ja) * 2017-04-28 2018-11-29 株式会社日本デジタル研究所 会計処理システム
US10146803B2 (en) 2013-04-23 2018-12-04 Kofax, Inc Smart mobile application development platform
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
JP6445645B1 (ja) * 2017-09-21 2018-12-26 株式会社東芝 帳票情報認識装置および帳票情報認識方法
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
JP2019114193A (ja) * 2017-12-26 2019-07-11 セイコーエプソン株式会社 画像処理装置および画像処理プログラム
JP2019133430A (ja) * 2018-01-31 2019-08-08 日本電気株式会社 帳票作成支援装置、帳票作成支援方法、及び、帳票作成支援プログラム
JP2019144771A (ja) * 2018-02-19 2019-08-29 株式会社ミラボ 帳票処理システム及び帳票処理プログラム
US10657600B2 (en) 2012-01-12 2020-05-19 Kofax, Inc. Systems and methods for mobile image capture and processing
US10699146B2 (en) 2014-10-30 2020-06-30 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
CN111738026A (zh) * 2019-03-19 2020-10-02 康耐视公司 用于评估符号的系统和方法
US10803350B2 (en) 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
JP2021005226A (ja) * 2019-06-26 2021-01-14 京セラドキュメントソリューションズ株式会社 文書分類システムおよび文書分類プログラム
JP2021012486A (ja) * 2019-07-04 2021-02-04 富士通フロンテック株式会社 帳票処理プログラム、帳票処理方法、及び帳票処理装置
JP2021131659A (ja) * 2020-02-19 2021-09-09 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06301815A (ja) * 1993-04-14 1994-10-28 Matsushita Electric Ind Co Ltd 文字認識装置
JPH11296676A (ja) * 1998-04-08 1999-10-29 Oki Electric Ind Co Ltd 画像データ分類方法および画像データ登録方法
JP2004164674A (ja) * 2004-01-23 2004-06-10 Oki Electric Ind Co Ltd フォーマット認識装置及び文字読み取り装置
JP2009025856A (ja) * 2007-07-17 2009-02-05 Hitachi Computer Peripherals Co Ltd 帳票識別プログラム及び帳票識別装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06301815A (ja) * 1993-04-14 1994-10-28 Matsushita Electric Ind Co Ltd 文字認識装置
JPH11296676A (ja) * 1998-04-08 1999-10-29 Oki Electric Ind Co Ltd 画像データ分類方法および画像データ登録方法
JP2004164674A (ja) * 2004-01-23 2004-06-10 Oki Electric Ind Co Ltd フォーマット認識装置及び文字読み取り装置
JP2009025856A (ja) * 2007-07-17 2009-02-05 Hitachi Computer Peripherals Co Ltd 帳票識別プログラム及び帳票識別装置

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10657600B2 (en) 2012-01-12 2020-05-19 Kofax, Inc. Systems and methods for mobile image capture and processing
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
JP2016517587A (ja) * 2013-03-13 2016-06-16 コファックス, インコーポレイテッド モバイル装置を用いて取込まれたデジタル画像におけるオブジェクトの分類
US10127441B2 (en) 2013-03-13 2018-11-13 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US10140511B2 (en) 2013-03-13 2018-11-27 Kofax, Inc. Building classification and extraction models based on electronic forms
US10146803B2 (en) 2013-04-23 2018-12-04 Kofax, Inc Smart mobile application development platform
US10108860B2 (en) 2013-11-15 2018-10-23 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
JP2015170045A (ja) * 2014-03-05 2015-09-28 グローリー株式会社 売上管理システム及び売上管理方法
US10699146B2 (en) 2014-10-30 2020-06-30 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US10142499B2 (en) 2015-10-06 2018-11-27 Canon Kabushiki Kaisha Document distribution system, document distribution apparatus, information processing method, and storage medium
JP2018190064A (ja) * 2017-04-28 2018-11-29 株式会社日本デジタル研究所 会計処理システム
JP2019057115A (ja) * 2017-09-21 2019-04-11 株式会社東芝 帳票情報認識装置および帳票情報認識方法
JP6445645B1 (ja) * 2017-09-21 2018-12-26 株式会社東芝 帳票情報認識装置および帳票情報認識方法
US11062176B2 (en) 2017-11-30 2021-07-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
US10803350B2 (en) 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
JP2019114193A (ja) * 2017-12-26 2019-07-11 セイコーエプソン株式会社 画像処理装置および画像処理プログラム
JP7040000B2 (ja) 2017-12-26 2022-03-23 セイコーエプソン株式会社 画像処理装置および画像処理プログラム
JP2019133430A (ja) * 2018-01-31 2019-08-08 日本電気株式会社 帳票作成支援装置、帳票作成支援方法、及び、帳票作成支援プログラム
JP7069759B2 (ja) 2018-01-31 2022-05-18 日本電気株式会社 帳票作成支援装置、帳票作成支援方法、及び、帳票作成支援プログラム
JP2019144771A (ja) * 2018-02-19 2019-08-29 株式会社ミラボ 帳票処理システム及び帳票処理プログラム
JP2021106054A (ja) * 2018-02-19 2021-07-26 株式会社ミラボ 帳票処理システム及び帳票処理プログラム
CN111738026A (zh) * 2019-03-19 2020-10-02 康耐视公司 用于评估符号的系统和方法
JP2021005226A (ja) * 2019-06-26 2021-01-14 京セラドキュメントソリューションズ株式会社 文書分類システムおよび文書分類プログラム
JP7364998B2 (ja) 2019-06-26 2023-10-19 京セラドキュメントソリューションズ株式会社 文書分類システムおよび文書分類プログラム
JP2021012486A (ja) * 2019-07-04 2021-02-04 富士通フロンテック株式会社 帳票処理プログラム、帳票処理方法、及び帳票処理装置
JP7201545B2 (ja) 2019-07-04 2023-01-10 富士通フロンテック株式会社 帳票処理プログラム、帳票処理方法、及び帳票処理装置
JP2021131659A (ja) * 2020-02-19 2021-09-09 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、及びプログラム

Similar Documents

Publication Publication Date Title
JP2011118513A (ja) 文字認識装置および帳票識別方法
US7391917B2 (en) Image processing method
US7876471B2 (en) Image processing apparatus, control method and program thereof which searches for corresponding original electronic data based on a paper document
US7236653B2 (en) System and method for locating document areas using markup symbols
US7747108B2 (en) Image processing apparatus and its method
US8009909B2 (en) Image processing apparatus and its method
US7609914B2 (en) Image processing apparatus and its method
JP4785655B2 (ja) 文書処理装置及び文書処理方法
JP2016143165A (ja) 情報処理装置、方法およびプログラム
US20210110152A1 (en) Ledger recognition system
JP2010055142A (ja) 文書処理装置およびプログラム
JP2021043775A (ja) 情報処理装置及びプログラム
JP2018042067A (ja) 画像処理システム、画像処理方法、情報処理装置
JP2018025885A (ja) 画像処理装置
JP2010061471A (ja) 文字認識装置およびプログラム
JP4982587B2 (ja) データエントリシステムおよびデータエントリ方法
JP4651876B2 (ja) パターン識別装置、パターン識別方法及びパターン識別用プログラム
JP2010039783A (ja) 文書処理装置、文書処理システム、文書処理方法、及び、文書処理プログラム
JP2017072941A (ja) 文書振り分けシステム、情報処理方法及びプログラム
JP2021028770A (ja) 情報処理装置及び表認識方法
JP2012190357A (ja) 画像処理装置、画像処理方法、およびプログラム
JP2019074875A (ja) 情報処理装置、制御方法、およびプログラム
JP4280939B2 (ja) 位置面システム画像認識コンピューターソフトウェア
JP2013182459A (ja) 情報処理装置、情報処理方法及びプログラム
JP2010226341A (ja) 画像処理装置、画像処理システムおよび処理プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120327

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120724