JP5908825B2 - 文字認識装置及び文字認識プログラムを記録したコンピュータ読取り可能な記録媒体 - Google Patents

文字認識装置及び文字認識プログラムを記録したコンピュータ読取り可能な記録媒体 Download PDF

Info

Publication number
JP5908825B2
JP5908825B2 JP2012241935A JP2012241935A JP5908825B2 JP 5908825 B2 JP5908825 B2 JP 5908825B2 JP 2012241935 A JP2012241935 A JP 2012241935A JP 2012241935 A JP2012241935 A JP 2012241935A JP 5908825 B2 JP5908825 B2 JP 5908825B2
Authority
JP
Japan
Prior art keywords
character
image
size
reliable
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012241935A
Other languages
English (en)
Other versions
JP2014092871A (ja
Inventor
鈴木 敏
敏 鈴木
永田 昌明
昌明 永田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012241935A priority Critical patent/JP5908825B2/ja
Publication of JP2014092871A publication Critical patent/JP2014092871A/ja
Application granted granted Critical
Publication of JP5908825B2 publication Critical patent/JP5908825B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

本発明は、画像に含まれる文字を認識する文字認識装置及び文字認識プログラムを記録したコンピュータ読取り可能な記録媒体に関する。
従来の文字認識技術では、図11に示すように、まず、入力された画像から文字領域の画像(以下、文字画像という)を特定して切り出して、文字データベース(文字DB)に記憶されている文字情報と照合し、一致度の最も高い文字を正解として出力する技術が一般的に知られている(例えば、非特許文献1参照)。あるいは、この出力結果について自然言語処理技術を用いて修正し、出力する技術が知られている。このように、従来の文字認識技術における文字認識精度は、文字の切り出し位置の正確さに大きく影響される。
Ray Smith, An Overview of the Tesseract OCR Engine, http://tesseract-ocr.googlecode.com/svn/trunk/doc/tesseracticdar2007.pdf
しかしながら、入力された画像中の全ての文字位置を初めから正確に取り出すのは非常に難しい。
本発明は、上記問題を解決するためになされたもので、文字列画像中の文字位置を精度よく推定して高精度に文字を認識することができる文字認識装置及び文字認識プログラムを記録したコンピュータ読取り可能な記録媒体を提供することを目的とする。
上記目的を達成するために、本発明の文字認識装置は、文字列画像から文字を表す文字画像を文字毎に抽出する第1抽出手段と、前記第1抽出手段により抽出された前記文字画像の各々と、予めデータベースに記憶されている文字情報とを照合し、文字画像毎に、該文字画像と最も一致度が高い文字情報が示す文字を出力するとともに前記文字の尤度を示す指標、位置、及び大きさを出力する照合手段と、前記照合手段によって出力された文字の各々について、前記文字の尤度を示す指標及び前記文字の大きさに基づいて、前記文字が信頼できるか否かを判定する信頼判定手段と、前記信頼判定手段によって信頼できると判定された複数の文字の大きさに基づいて、他の文字の大きさを推定するとともに、前記信頼判定手段によって信頼できると判定された複数の文字の位置及び前記推定された前記他の文字の大きさに基づいて、前記信頼できると判定された複数の文字の間に、前記複数の文字の大きさに応じた間隔で、前記他の文字を配置するように、前記他の文字の位置を推定する文字位置推定手段と、前記文字位置推定手段によって推定された前記他の文字の位置及び大きさに基づいて、前記文字列画像から前記文字画像を文字毎に抽出する第2抽出手段と、を含み、前記照合手段は、前記第2抽出手段により抽出された前記文字画像の各々と、前記文字情報とを再度照合し、文字画像毎に該文字画像と最も一致度が高い文字情報が示す文字を再度出力する。
本発明に係る文字認識装置は、第1抽出手段によって、文字列画像から文字を表す文字画像を文字毎に抽出する。そして、照合手段によって、第1抽出手段により抽出された文字画像の各々と、予めデータベースに記憶されている文字情報とを照合し、文字画像毎に、当該文字画像と最も一致度が高い文字情報が示す文字を出力するとともに文字の尤度を示す指標、位置、及び大きさを出力する。
そして、信頼判定手段によって、照合手段によって出力された文字の各々について、文字の尤度を示す指標及び文字の大きさに基づいて、文字が信頼できるか否かを判定する。そして、文字位置推定手段によって、信頼判定手段によって信頼できると判定された複数の文字の大きさに基づいて、他の文字の大きさを推定するとともに、信頼判定手段によって信頼できると判定された複数の文字の位置及び推定された他の文字の大きさに基づいて、信頼できると判定された複数の文字の間に、複数の文字の大きさに応じた間隔で、他の文字を配置するように、他の文字の位置を推定する。
そして、第2抽出手段によって、文字位置推定手段によって推定された他の文字の位置及び大きさに基づいて、文字列画像から文字画像を文字毎に抽出する。そして、照合手段は、第2抽出手段により抽出された文字画像の各々と、文字情報とを再度照合し、文字画像毎に当該文字画像と最も一致度が高い文字情報が示す文字を再度出力する。
このように、抽出された文字画像の各々と、予めデータベースに記憶されている文字情報とを照合して出力された文字の各々について、文字が信頼できるか否かを判定し、信頼できると判定された文字の大きさに基づいて、他の文字の大きさを推定するとともに、信頼できると判定された文字の位置及び推定された他の文字の大きさに基づいて、他の文字の位置を推定することにより、文字列画像中の文字位置を精度よく推定して高精度に文字を認識することができる。
また、上記文字認識装置は、予め定められた繰り返し条件を満足するまで、前記文字位置推定手段による推定、前記第2抽出手段による抽出、前記照合手段による再度の照合、及び前記信頼判定手段による判定を順次繰り返し行うようにすることができる。
また、前記照合手段は、文字画像毎に、該文字画像と最も一致度が高い文字情報が示す文字、前記文字の尤度を示す指標、位置、及び大きさを出力するとともに記憶手段に記憶し、前記信頼判定手段は、前記照合手段によって出力された文字の各々について、信頼できる文字として、前記文字と、前記文字の位置に対応して前記記憶手段に記憶された前記文字とのうち、前記文字の尤度を示す指標及び大きさに基づいて最も信頼できる文字を出力するようにすることができる。
また、本発明の記録媒体は、コンピュータを上記文字認識装置の各手段として機能させるための文字認識プログラムを記録したコンピュータ読取り可能な記録媒体である。
以上説明したように、本発明の文字認識装置、及び文字認識プログラムを記録したコンピュータ読取り可能な記録媒体によれば、抽出された文字画像の各々と、予めデータベースに記憶されている文字情報とを照合して出力された文字の各々について、文字が信頼できるか否かを判定し、信頼できると判定された文字の大きさに基づいて、他の文字の大きさを推定するとともに、信頼できると判定された文字の位置及び推定された他の文字の大きさに基づいて、他の文字の位置を推定することにより、文字列画像中の文字位置を精度よく推定して高精度に文字を認識することができる、という効果が得られる。
第1の実施の形態に係る文字認識装置の構成の一例を示す図である。 第1の実施の形態に係る文字認識処理ルーチンのフローチャートの一例である。 第2の実施の形態に係る文字認識装置の構成の一例を示す図である。 第2の実施の形態に係る文字認識処理ルーチンのフローチャートの一例である。 従来技術の実験における文字位置推定結果を示す図である。 本実施の形態の実験において、信頼度判定部により選出された文字列を示す図である。 図6における実験において用いられた文字識別情報を示す図である。 本実施の形態の実験において、文字位置の推定結果を示す図である。 本実施の形態の実験において、推定された文字位置に基づいて、文字照合結果を示す図である。 図9の結果を再度信頼度判定部にかけた場合の結果を示す図である。 従来の文字認識技術について説明する説明図である。
[第1の実施の形態]
<システム構成>
以下、図面を参照して本発明の実施の形態を詳細に説明する。図1は、本実施の形態に係る文字認識装置の構成の一例を示す図である。
文字認識装置10は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、CPUが後述する各処理ルーチンを実行するためのプログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成されている。また、文字認識装置10を構成するコンピュータは、ハードディスクドライブ等の記憶部や通信インタフェース等を備えていてもよい。また、ハードディスクドライブにCPUが実行するプログラムが記憶されていてもよい。CPUがROMやハードディスク等の記憶部に記憶されているプログラムを読み出して実行することにより、上記ハードウェアとプログラムとを協働させて以下に説明する機能が実現される。
このコンピュータは、機能的には、図1に示すように、第1文字領域抽出部12、文字DB(データベース)14、照合部16、信頼度判定部18、文字位置推定部20、第2文字領域抽出部22、及び文字列決定部24を含んだ構成で表わすことができる。
第1文字領域抽出部12は、文字認識対象としての入力画像を取得し、画像処理により、入力画像から文字列領域の画像を抽出すると共に、抽出された文字列領域から各文字領域の画像(以下、文字画像と称する。)を抽出する。
文字DB14には、様々な書体(フォント)、サイズ、及び太さの文字を示す文字情報が予め文字毎に登録されている。なお、文字情報は、例えば、個々の文字の文字パターン画像情報であってもよいし、個々の文字の特徴を示す特徴値であってもよい。また、文字DB14はデータベースの一例である。
照合部16は、第1文字領域抽出部12又は後述する第2文字領域抽出部22により抽出された文字画像の各々と、予め文字DB14に記憶されている文字情報とを照合し、文字画像毎に当該文字画像と最も一致度が高い文字情報が示す文字と、文字画像が当該文字に該当することの尤もらしさを示すための指標(識別距離)と、文字列領域の画像中の文字の位置(以下、文字の位置と称する。)と、当該文字画像中の文字の幅及び高さ(以下、文字の大きさと称する。)とを出力する。
信頼度判定部18は、照合部16により出力された文字の各々について、文字の識別距離と、文字の大きさとに基づいて、当該文字が信頼できるか否かを判定し、信頼のできる文字を選出する。例えば、「識別距離が一定値以内である」、あるいは、「文字種が記号文字ではない」、あるいは、「文字サイズが平均から大きく外れていない」等のフィルターをかけ、残った文字が信頼できる文字として、選出される。なお、本実施の形態では、文字、文字の識別距離、文字の位置、及び文字の大きさを、文字識別情報として用いる。
文字位置推定部20は、信頼度判定部18により信頼できると判定された文字の位置及び大きさに基づいて、他の文字の位置及び大きさを推定する。具体的には、まず信頼度判定部18によって信頼できると判定された文字の大きさに基づいて、例えば、信頼できると判定された文字の大きさの平均値を、他の文字の大きさとして推定する。そして、信頼できると判定された文字の位置及び当該推定された他の文字の大きさに基づいて、文字列領域のうち、信頼できると判定された文字の文字領域の間に、当該文字の大きさに応じた間隔で、等間隔に他の文字を配置するように、当該他の文字の位置を推定する。
第2文字領域抽出部22は、信頼度判定部18により信頼できると判定された文字の位置及び大きさと、文字位置推定部20により推定された他の文字の位置及び文字の大きさとに基づいて、文字列領域の画像から文字画像を文字毎に抽出する。
文字列決定部24は、第2文字領域抽出部22により抽出された文字画像についての、照合部16による照合結果に基づいて、尤もらしい文字列を決定する。ここで決定された文字列が文字認識結果として出力される。
<文字認識装置10の動作>
次に、文字認識装置10の作用について図2を参照して詳細に説明する。
ステップS100において、第1文字領域抽出部12は、文字認識対象としての入力画像を取得する。
次に、ステップS102において、第1文字領域抽出部12は、取得した入力画像から文字列領域の画像を抽出すると共に、抽出した文字列領域から各文字画像を抽出する。
ステップS104において、照合部16は、上記ステップS102で抽出した文字画像の各々と、予め文字DB14に記憶されている文字情報とを照合し、文字画像毎に当該文字画像と最も一致度が高い文字情報が示す文字と、文字画像が当該文字に該当することの尤もらしさを示すための指標(識別距離)と、文字の位置と、文字の大きさとを出力する。なお、ここで、例えば文字情報が文字パターン画像ではなく、文字の特徴を示すベクトル等の特徴値であった場合には、照合部16は、文字情報を画像に展開して文字画像と照合する。なお、文字画像を文字情報と同様の形式に変換して照合するようにしてもよい。
なお、照合部16は、第1文字領域抽出部12により抽出された文字画像が、横書きの文字画像であれば、左から右に向かう(認識言語によっては右から左であってもよい)配列順に各文字画像と文字情報とを照合し、上記抽出された文字画像が、縦書きの文字画像であれば、上から下に向かう配列順に各文字画像と文字情報とを順に照合していく。
ステップS100からステップS104までの処理は、周知の従来手法(例えば、上記図11に例示した手法)と同様の技術を利用できる。
ステップS106において、信頼度判定部18は、上記ステップS104において出力された文字の各々について算出された文字の識別距離と、文字の大きさとに基づいて、当該文字が信頼できるか否かを判定し、信頼できる文字を選出する。
次に、ステップS108において、文字位置推定部20は、上記ステップS106で信頼できると判定された文字の位置及び大きさに基づいて、他の文字の大きさ及び位置を推定する。
ステップS110において、第2文字領域抽出部22は、上記ステップS108で推定された文字の位置及び大きさに基づいて、上記ステップS102で抽出した文字列領域の画像から文字画像を文字毎に抽出する。
次に、ステップS112において、照合部16は、上記ステップS110で抽出した文字画像の各々と、予め文字DB14に記憶されている文字情報とを照合し、文字画像毎に当該文字画像との一致度が最も高い文字情報が示す文字(テキストデータ)を出力する。
ステップS114において、文字列決定部24は、文字画像毎の一致度に基づいて、尤もらしい文字列を決定し、出力する。
以上説明したように、第1の実施の形態に係る文字認識装置10によれば、抽出された文字画像の各々と、予めデータベースに記憶されている文字情報とを照合して出力された文字の各々について、文字が信頼できるか否かを判定し、信頼できると判定された文字の大きさに基づいて、他の文字の大きさを推定するとともに、信頼できると判定された文字の位置及び推定された他の文字の大きさに基づいて、他の文字の位置を推定することにより、文字列画像中の文字位置を精度よく推定して高精度に文字を認識することができる。
[第2の実施の形態]
<システム構成>
次に、図3を参照して、本発明の第2の実施の形態について説明する。なお、第1の実施の形態と同様の構成となる部分については、同一符号を付して説明を省略する。
第2の実施の形態では、文字位置の推定、文字の照合を繰り返し、文字識別情報を一時的に保存する点、及び一時的に保存した文字識別情報を用いて最も信頼のできる文字列を選出する点が、第1の実施の形態と異なっている。
信頼度判定部18は、予め定められた繰り返し終了条件を満足したか否かを判定し、繰り返し終了条件を満足しない場合には、照合部16により出力された文字の各々について、文字の識別距離と、文字の大きさとに基づいて、当該文字が信頼できるか否かを判定し、信頼のできる文字を選出すると共に、文字位置推定部20による文字位置の推定、第2文字領域抽出部22による文字画像の抽出、及び照合部16による再度の照合を順次繰り返す。
なお、繰り返し終了条件は、繰り返し回数が予め定められた上限に到達することでもよいし、あるいは、照合部16により出力された各文字の識別距離の平均値が、予め定められた閾値以下となることでもよい。
繰り返し終了条件を満足したと判定された場合には、信頼度判定部18は、照合部16により出力された文字の各々について、当該文字の識別距離と、当該文字の大きさと、当該文字の位置と、後述する照合結果記憶部19に記憶されている過去の全ての文字識別情報(文字、文字の位置、文字の識別距離、及び文字の大きさ)とに基づいて、当該文字と、当該文字の位置とが対応して記憶された文字とから、最も信頼のできる文字を選出する。例えば、文字位置推定を複数回繰り返すと、毎回文字位置が微妙に変化するため、各文字の信頼度が高くなったり低くなったりする。そこで、文字画像の照合の各回に取り出される文字識別情報を全て照合結果記憶部19に保存しておいて、最後に、それぞれの文字位置で、直前に選出された文字、照合結果記憶部19に当該文字位置に対応して記憶された文字のうちから、文字識別情報に基づいて最も信頼できる文字を取り出して、全体として信頼度の高い出力を得る。例えば、1番目の文字は3回目の推定結果から、2番目の文字は1回目の推定結果から、最も信頼できる文字を取り出す。
照合結果記憶部19は、照合部16による照合毎に、照合部16により出力された各文字画像との一致度が高い文字情報が示す文字の文字識別情報(文字、文字の識別距離、文字の位置、及び文字の大きさ)を記憶する。
なお、照合結果記憶部19には、文字画像毎に複数の文字候補の情報を保存する必要がある。一般に、照合部16では文字DB14内の全ての文字に関して識別距離(文字の尤度を示す指標)を計算するので文字識別情報として多くの文字を保存することが可能である。ただし、全てを保存すると膨大なデータ量になるため、通常は上位N文字分を文字識別情報として保存する。信頼度判定で対応する文字情報が無ければ、信頼度が低いと判定する。また、照合結果記憶部19は記憶手段の一例である。
文字列決定部24は、最終的に出力される直前に、信頼度判定部18により最も信頼できると判定された文字からなる文字列に対して、自然言語処理技術を用いて意味的に尤もらしい文字列に変換する。
<文字認識装置100の動作>
次に、文字認識装置100の作用について図4を参照して詳細に説明する。
ステップS206において、照合結果記憶部19に、上記ステップS104において出力された照合結果としての文字識別情報(文字、文字の識別距離、文字の位置、及び文字の大きさ)が記憶される。
ステップS106において、信頼度判定部18は、上記ステップS104において出力された文字の各々について算出された文字の識別距離と、文字の大きさとに基づいて、当該文字が信頼できるか否かを判定し、信頼のできる文字を選出する。
ステップS108において、文字位置推定部20は、上記ステップS106で選出された信頼できると判定された文字の位置及び大きさを基準として、他の文字の大きさ及び位置を推定する。
ステップS110において、第2文字領域抽出部22は、上記ステップS106で選出された信頼できると判定された文字の位置及び大きさと、上記ステップS108で推定された文字の位置及び大きさとに基づいて、上記ステップS102で抽出した文字列領域の画像から文字画像を文字毎に抽出する。
ステップS214において、照合部16は、上記ステップS110で抽出した文字画像の各々と、予め文字DB14に記憶されている文字情報とを照合し、文字画像毎に当該文字画像と最も一致度が高い文字情報が示す文字と、文字画像が当該文字に該当することの尤もらしさを表す指標(識別距離)と、文字の位置と、文字の大きさとを出力する。
ステップS216において、照合結果記憶部19に、上記ステップS206と同様に、上記ステップS214において出力された照合結果としての文字識別情報(文字、文字の識別距離、文字の位置、及び文字の大きさ)が記憶される。
次にステップS218において、繰り返し終了条件を満足したか否かを判定する。例えば、照合部16により出力された各文字の識別距離の平均値が、予め定められた閾値以下である場合には、繰り返し終了条件を満足したと判定し、ステップS220へ移行する。一方、各文字の識別距離の平均値が予め定められた閾値以上である場合には、ステップS106へ戻り、ステップS108、S110、S214、S216を繰り返す。
ステップS220において、信頼度判定部18は、上記ステップS214で出力された文字の各々について、当該文字の識別距離と、当該文字の大きさと、当該文字の位置と、照合結果記憶部19に記憶されている過去の全ての文字識別情報(文字、文字の位置、文字の識別距離、及び文字の大きさ)とに基づいて、最も信頼度の高い文字を決定する。
ステップS222において、文字列決定部24は、上記ステップS220で決定された文字からなる文字列に対して自然言語処理技術を適用し、意味的に尤もらしい文字列に変換し、結果として出力する。
なお、第2の実施の形態に係る文字認識装置100の他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。
以上説明したように、第2の実施の形態に係る文字認識装置100によれば、予め定められた繰り返し終了条件を満足するまで、文字位置推定、文字画像の抽出、及び文字照合、信頼度判定を順次繰り返し行うことにより、文字列画像中の文字位置を精度よく推定して、文字認識の精度を向上させることができる。
また、文字画像毎に、当該文字画像との一致度が高い文字情報が示す文字、文字の識別距離、位置、及び大きさを照合結果記憶部19に記憶し、照合結果記憶部19に記憶された文字の識別距離及び大きさに基づいて最も信頼できる文字を出力することにより、文字認識の精度を更に向上させることができる。
<実験結果>
上記の実施の形態の効果を実験結果に基づいて示す。図5〜図10は文字列画像に対し、実際に手法を適用した結果である。図5(a)は従来手法での文字位置判定結果、図5(b)はその結果の出力としての文字列である。図5(a)、(b)における2〜5行目は自然言語処理技術を利用すれば、正しい文字列を推定可能であるが、1行目は推定できない。
図6は、上記の結果を、本実施の形態の文字認識装置10又は100の信頼度判定部18に通した結果である。この時用いられた文字識別情報が図7に示してある。ここで用いられた判定条件は、「識別距離(文字の尤度を示す指標)900以下」かつ「文字種は日本語かつ記号以外」かつ「文字の幅および高さが最頻値±20%以内」である。文字種の分類は信頼度判定部18内で行った。信頼度が高いと判断された文字が図6に位置(a)及び文字(b)として示されている。「詰」等、必ずしも正しくない文字でも正解と判断されることがある。
図8は、本実施の形態の文字認識装置10又は100の文字位置推定部20により、上記結果から再推定された文字位置を表している。
図9は上記再推定された文字位置を基に、再び文字照合を行った結果である。文字位置(a)、文字列(b)ともに、初回の文字照合結果と比較して正しく推定されている文字が増えている。「ご」等、初回の照合で正しかったものが再照合で間違える場合もあるが、初回照合結果を照合結果記憶部19に一時保存しておいて、信頼度判定部18での判断時に合わせて利用することができる。
図10は、図9で示した結果を再度信頼度判定部18に与えた結果である。第2の実施の形態のように、これを更に文字位置推定部20へ送っても良いし、あるいは、この結果であれば、第2の実施の形態における文字列決定部24によって自然言語処理技術を利用して、文字列全体を正しく推定することも可能である。
以上のように、上記第1及び第2の実施の形態によれば、正確な文字位置及び文字サイズが数文字分確定できれば、それらの位置を基準とし、文字列領域中に等間隔に文字が配置されていると仮定することで、それら以外の文字の位置を推定することが出来る。
また、上記第1及び第2の実施の形態によれば、文字位置および文字サイズが統一された状態で各文字を切り出すことができ、切り出し位置が不正確だったために照合できなかった文字を認識することが可能となる。
また、上記第1及び第2の実施の形態によれば、画像上の文字の位置をより正しく推定でき、その結果として、正しい文字認識結果を得ることが可能となる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、第2の実施の形態における自然言語処理技術は、文字列決定部24において適用し、最終的な出力の直前に利用する場合を例に説明したが、これに限定されるものではなく、自然言語処理技術の処理の後に、信頼度判定部18による判定を行ったものを最終出力としてもよい。この場合には、信頼度判定部18が、照合結果記憶部19に記憶された複数の文字候補の文字識別情報に基づいて、自然言語処理技術によって変換された文字が信頼出来るか否かを判定し、当該文字が信頼できる場合には、当該文字を最終的な出力とする。
また、第2の実施の形態における信頼度判定部18は、照合結果記憶部19に記憶されている過去の全ての文字識別情報を用いて、最も信頼できる文字を決定する場合を例に説明したが、これに限定されるものではなく、途中N回目の信頼度判定時に利用することも可能である。
また、照合部16で出力される文字識別情報は、文字、文字の識別距離、文字の位置、及び文字の大きさである場合を例に説明したが、これに限定されるものではなく、他の文字識別情報を含んでいてもよい。
また、上述の文字認識装置が文字DB14を備えている場合について説明したが、例えば文字DB14が文字認識装置の外部装置に設けられ、文字認識装置は、外部装置と通信手段を用いて通信することにより、文字DB14を参照するようにしてもよい。
また、上述の文字認識装置は、内部にコンピュータシステムを有しているが、コンピュータシステムは、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読取り可能な記録媒体に格納して提供することも可能である。
10、100 文字認識装置
12 第1文字領域抽出部
16 照合部
18 信頼度判定部
19 照合結果記憶部
20 文字位置推定部
22 第2文字領域抽出部
24 文字列決定部

Claims (4)

  1. 文字列画像から文字を表す文字画像を文字毎に抽出する第1抽出手段と、
    前記第1抽出手段により抽出された前記文字画像の各々と、予めデータベースに記憶されている文字情報とを照合し、文字画像毎に、該文字画像と最も一致度が高い文字情報が示す文字を出力するとともに前記文字の尤度を示す指標、位置、及び大きさを出力する照合手段と、
    前記照合手段によって出力された文字の各々について、前記文字の尤度を示す指標及び前記文字の大きさに基づいて、前記文字が信頼できるか否かを判定する信頼判定手段と、
    前記信頼判定手段によって信頼できると判定された複数の文字の大きさに基づいて、他の文字の大きさを推定するとともに、前記信頼判定手段によって信頼できると判定された複数の文字の位置及び前記推定された前記他の文字の大きさに基づいて、前記信頼できると判定された複数の文字の間に、前記複数の文字の大きさに応じた間隔で、前記他の文字を配置するように、前記他の文字の位置を推定する文字位置推定手段と、
    前記文字位置推定手段によって推定された前記他の文字の位置及び大きさに基づいて、前記文字列画像から前記文字画像を文字毎に抽出する第2抽出手段と、
    を含み、
    前記照合手段は、前記第2抽出手段により抽出された前記文字画像の各々と、前記文字情報とを再度照合し、文字画像毎に該文字画像と最も一致度が高い文字情報が示す文字を再度出力する
    文字認識装置。
  2. 予め定められた繰り返し条件を満足するまで、前記文字位置推定手段による推定、前記第2抽出手段による抽出、前記照合手段による再度の照合、及び前記信頼判定手段による判定を順次繰り返し行う請求項1記載の文字認識装置。
  3. 前記照合手段は、文字画像毎に、該文字画像と最も一致度が高い文字情報が示す文字、前記文字の尤度を示す指標、位置、及び大きさを出力するとともに記憶手段に記憶し、
    前記信頼判定手段は、前記照合手段によって出力された文字の各々について、信頼できる文字として、前記文字と、前記文字の位置に対応して前記記憶手段に記憶された前記文字とのうち、前記文字の尤度を示す指標及び大きさに基づいて最も信頼できる文字を出力する請求項2記載の文字認識装置。
  4. コンピュータを請求項1〜請求項3の何れか1項記載の文字認識装置の各手段として機能させるための文字認識プログラムを記録したコンピュータ読取り可能な記録媒体。
JP2012241935A 2012-11-01 2012-11-01 文字認識装置及び文字認識プログラムを記録したコンピュータ読取り可能な記録媒体 Active JP5908825B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012241935A JP5908825B2 (ja) 2012-11-01 2012-11-01 文字認識装置及び文字認識プログラムを記録したコンピュータ読取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012241935A JP5908825B2 (ja) 2012-11-01 2012-11-01 文字認識装置及び文字認識プログラムを記録したコンピュータ読取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2014092871A JP2014092871A (ja) 2014-05-19
JP5908825B2 true JP5908825B2 (ja) 2016-04-26

Family

ID=50936917

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012241935A Active JP5908825B2 (ja) 2012-11-01 2012-11-01 文字認識装置及び文字認識プログラムを記録したコンピュータ読取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP5908825B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11574489B2 (en) 2019-08-30 2023-02-07 Canon Kabushiki Kaisha Image processing system, image processing method, and storage medium

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0746371B2 (ja) * 1987-12-26 1995-05-17 三菱電機株式会社 文字読取装置
JPH0830731A (ja) * 1994-07-15 1996-02-02 Daikin Ind Ltd 文字列確認方法およびその装置
JP3148106B2 (ja) * 1995-08-29 2001-03-19 沖電気工業株式会社 文字切り出し方法
JPH09274645A (ja) * 1996-04-05 1997-10-21 Ricoh Co Ltd 文字認識方法および装置
JP3099797B2 (ja) * 1998-03-19 2000-10-16 日本電気株式会社 文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11574489B2 (en) 2019-08-30 2023-02-07 Canon Kabushiki Kaisha Image processing system, image processing method, and storage medium

Also Published As

Publication number Publication date
JP2014092871A (ja) 2014-05-19

Similar Documents

Publication Publication Date Title
CN106874909B (zh) 一种图像字符的识别方法及其装置
CN111444723B (zh) 信息抽取方法、计算机设备和存储介质
JP3919617B2 (ja) 文字認識装置および文字認識方法、プログラムおよび記憶媒体
JP5670787B2 (ja) 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム
US9183636B1 (en) Line segmentation method
US11270683B2 (en) Interactive system, apparatus, and method
JP6795195B2 (ja) 文字種推定システム、文字種推定方法、および文字種推定プログラム
CN107533671B (zh) 模式识别装置、模式识别方法以及记录介质
CN109635810B (zh) 一种确定文本信息的方法、装置、设备及存储介质
KR101686363B1 (ko) 문서에 사용된 언어를 식별하고, 식별된 언어에 기초하여 ocr 인식을 수행하는 방법 및 장치
EP2191396B1 (en) An apparatus for preparing a display document for analysis
US8787702B1 (en) Methods and apparatus for determining and/or modifying image orientation
US8768061B2 (en) Post optical character recognition determination of font size
JP4985724B2 (ja) 単語認識プログラム、単語認識方法、単語認識装置
US10049309B2 (en) Character recognition device, character recognition method and program
JP4570995B2 (ja) マッチング方法およびマッチング装置ならびにプログラム
JP5908825B2 (ja) 文字認識装置及び文字認識プログラムを記録したコンピュータ読取り可能な記録媒体
JP5365065B2 (ja) 辞書作成装置
CN116052195A (zh) 文档解析方法、装置、终端设备和计算机可读存储介质
CN112699634B (zh) 电子书的排版处理方法、电子设备及存储介质
CN113837129A (zh) 手写签名错别字识别方法、装置、设备及存储介质
CN113449763A (zh) 信息处理装置以及记录媒体
JP6092024B2 (ja) 文字認識装置、方法、及びプログラム
JP6170831B2 (ja) 文字認識装置、方法、及びプログラム
CN112990252B (zh) 信息处理装置、信息处理方法以及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151014

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160223

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160324

R150 Certificate of patent or registration of utility model

Ref document number: 5908825

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150