JP2009129392A - 文字認識装置、文字認識方法、および、文字認識プログラム - Google Patents

文字認識装置、文字認識方法、および、文字認識プログラム Download PDF

Info

Publication number
JP2009129392A
JP2009129392A JP2007306804A JP2007306804A JP2009129392A JP 2009129392 A JP2009129392 A JP 2009129392A JP 2007306804 A JP2007306804 A JP 2007306804A JP 2007306804 A JP2007306804 A JP 2007306804A JP 2009129392 A JP2009129392 A JP 2009129392A
Authority
JP
Japan
Prior art keywords
character
candidate
type
predetermined
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007306804A
Other languages
English (en)
Inventor
Junichi Makino
順一 牧野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2007306804A priority Critical patent/JP2009129392A/ja
Publication of JP2009129392A publication Critical patent/JP2009129392A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】読み取った文字をテキストへ変換するときに、類似する候補文字が多く発生したときでも、その候補文字から高精度で文字を確定すること。
【解決手段】文字認識装置2の文字認識部24は、所定文字の候補文字群と、所定文字の前文字と、所定文字の後文字と、の入力を受け付け、類似文字種テーブル27から、前文字および後文字それぞれに対応する文字種を読み取り、所定文字の候補文字群の各候補文字について、各候補文字の文字種と、読み取った前文字および後文字それぞれに対応する文字種と、の異同を判定することにより、所定文字の候補文字群から所定候補文字を選択し、選択した所定候補文字を所定文字として確定することを特徴とする。
【選択図】図1

Description

本発明は、文字認識装置、文字認識方法、および、文字認識プログラムに関するものである。
OCR(Optical Character Reader)などの文字認識装置は、読み取った画像イメージの文字形状から、文字コードで特定されるテキストへと変換する。このとき、口(漢字)とロ(カタカナ)のように、読み取った文字が複数の候補文字に認識されたとき、これらの形状が類似する候補文字の集合から、1つの文字を確定する必要がある。
特許文献1の段落番号0004には、認識結果の文字種(漢字、ひらがななど)が、例えば「○○△○○」であるときに、字種○に挟まれた字種△を、字種○に置き換える手法が開示されている。
特許文献1の段落番号0058には、先行字種による文字決定テーブルを参照することにより、字種が混在しているときに、先行字種から決定された認識結果を得る手法が、開示されている。
特開平06−333084号公報
しかし、特許文献1で示された各手法では、これから候補文字の確定を行う着目文字を中心に、その前後の文字の文字種(1種類ずつ)のみを参照していたため、前後の文字の精度が悪いときに、その影響を受けて、着目文字の確定制度も悪くなってしまっていた。
例えば、先行字種による文字決定テーブルを参照する手法では、これから候補文字の確定を行う着目文字の前文字が間違っていたときには、連鎖的に(連続的に)後続する着目文字や後文字も間違った候補が選択され続けてしまう恐れがある。
そこで、本発明は、前記した問題を解決し、読み取った文字をテキストへ変換するときに、類似する候補文字が多く発生したときでも、その候補文字から高精度で文字を確定することを主な目的とする。
前記課題を解決するため、本発明は、文字列中の所定文字を認識した結果、複数の候補文字が抽出されたとき、その候補文字を確定する文字認識装置であって、
前記文字認識装置が、
前記所定文字の候補文字群と、前記文字列中の前記所定文字の前に位置する前文字と、前記文字列中の前記所定文字の後に位置する後文字と、の入力を受け付け、
文字ごとに、文字コードと、文字の文字種と、その文字に形状が類似する類似文字の文字種と、を対応づけた類似文字種データを格納した記憶手段から、前記前文字および前記後文字それぞれに対応する文字種を読み取り、
前記所定文字の前記候補文字群の各候補文字について、各候補文字の文字種と、読み取った前記前文字および前記後文字それぞれに対応する文字種と、の異同を判定することにより、前記所定文字の前記候補文字群から所定候補文字を選択し、
前記選択した所定候補文字を前記所定文字として確定することを特徴とする。
その他の手段は、後記する。
本発明によれば、読み取った文字をテキストへ変換するときに、類似する候補文字が多く発生したときでも、その候補文字から高精度で文字を確定することができる。
以下に、本発明が適用される文字認識システムの一実施形態について、図面を参照して詳細に説明する。
図1は、文字認識システムの構成図である。文字認識システムは、帳票などの認識対象文字が記載された媒体を画像データ(イメージデータ)として読み取るスキャナ1と、スキャナ1が読み取った媒体上の認識対象文字を認識して、その結果をテキスト出力する文字認識装置2と、を含めて構成される。なお、文字認識システムの他の実施形態として、スキャナ1の代わりに、手書き入力を受け付けるタッチパネルに対してスタイラスなどで認識対象の文字を手書き入力するようにしてもよい。
文字認識装置2は、演算処理を行う際に用いられる記憶手段としての主記憶装置3と、前記演算処理を行う演算処理装置とを少なくとも備えるパソコンなどのコンピュータとして構成される。なお、主記憶装置3は、RAM(Random Access Memory)などのメモリ、ハードディスクなど、任意好適な記憶媒体により構成される。演算処理は、CPU(Central Processing Unit)4によって構成される演算処理装置が、主記憶装置3上のプログラムを実行することで、実現される。
文字認識装置2は、帳票イメージ記憶部21、認識領域決定部22、認識領域記憶部23、文字認識部24、確定前データ記憶部25、文字確定部26、類似文字種テーブル27、および、確定後データ記憶部28を有する。以下、各構成要素の詳細を説明する。
帳票イメージ記憶部21は、スキャナ1が読み取った画像データを記憶する。認識領域決定部22は、帳票イメージ記憶部21に記憶された画像データから、画像データ上に認識対象の文字が記入されている箇所である認識領域を決定し、決定した認識領域を認識領域記憶部23に格納する。
文字認識部24は、帳票イメージ記憶部21から画像データを読み取り、認識領域記憶部23に格納されている認識領域内に記入されている文字を画像データから認識し、その結果を確定前データとして、確定前データ記憶部25に格納する。具体的には、文字認識部24は、認識領域の文字列から文字を切り出し、その文字の特徴を抽出する。そして、抽出した文字の特徴を、予め用意した文字の特徴辞書(図示省略)内の各文字の特徴と照合して、一致または類似する特徴の候補文字を、1文字以上決定する。
文字確定部26は、確定前データ記憶部25に格納された確定前データの各候補文字に対し、類似文字種テーブル27を用い、適宜候補文字の確定を行うことで確定後データを作成し、確定後データ記憶部28に記憶する。確定後データ記憶部28に格納された確定後データは、帳票のテキストとして出力される。
Figure 2009129392
表1に示す類似文字種テーブル27は、1文字ごとに、その文字コードと、その文字およびその文字の類似文字の文字種を対応づけて格納する。例えば、文字コード「口(漢字)」は、自分自身の文字種「漢字」、および、口(漢字)に外見が類似するロ(カタカナ)の文字種「カタカナ」の2つの文字種に対応づけられて(表中の○印は対応を示す)いる。
文字コードとは、例えば、「JIS X 0208」規格の区点コードとして規定され、文字を一意に特定するためのコードである。また、文字コードは、例えば、16区〜47区がJIS第一水準漢字に割り当てられているように、文字種ごとにまとまって(連続して)登録されているので、文字コードからその文字の文字種が特定可能である。文字種とは、漢字、数字など、文字の種別を特定する情報である。
Figure 2009129392
表2に示す確定前データ記憶部25は、横方向に文字列、縦方向に各文字の候補を示す。そして、各文字の1番目の候補が、採用される対象となる。例えば、表2に示す文字列は、1番目の候補を順につなげると、「川ローT目(かわろーてぃーめ)」となり、このまま確定してしまうと誤認識となってしまう。
Figure 2009129392
表3に示す確定後データ記憶部28は、確定前データ記憶部25と同じ形式である。確定後データ記憶部28のデータ内容の初期値は、確定前データ記憶部25と同じデータ内容がコピーされる。そして、文字確定部26は、確定後データ記憶部28のデータ内容について、各1番目の候補を適宜入れ替えることにより、正しい認識結果になるように編集する。表3では、表2の初期状態から、2,3,4文字目の1番目の候補が入れ替えられた結果、「川口一丁目(かわぐちいっちょうめ)」という正しい認識結果になっている。
図2は、図1の文字認識システムの動作概要を示すフローチャートである。
まず、スキャナ1は、帳票イメージを読み取り、帳票イメージ記憶部21は、読み取った帳票イメージを記憶する(S11)。次に、認識領域決定部22は、読み取った帳票イメージ内の認識領域を決定し、その結果を認識領域記憶部23に記憶する(S12)。そして、文字認識部24は、S12で決定された認識領域内の文字を認識し、確定前データとして確定前データ記憶部25に記憶する(S13)。
さらに、文字確定部26は、確定前データから文字を確定し、確定後データとして確定後データ記憶部28に記憶する(S14)。そして、文字認識装置2は、S14の確定後データを読み取った帳票のテキストとして出力する(S15)。
図3は、図2の文字確定部26による文字確定処理(S14)の詳細を示すフローチャートである。このフローチャートは、確定後データ記憶部28のデータ内容を編集するものである。
着目文字とは、その1番目の候補を他の候補と入れ替えるために着目している文字である。この着目文字は、文字列の2番目の文字から開始して、順に右に1つずつずらし、文字列の最後から2番目の文字で終了する。本フローチャートでは、制御変数iを用いて、i番目の文字を着目文字とする。前文字とは、着目文字から見て1つ左(1つ前)の文字であり、(i−1)番目の文字である。後文字とは、着目文字から見て1つ右(1つ後)の文字であり、(i+1)番目の文字である。
まず、認識領域内の文字列の左端文字(開始文字)は、1番目の候補をそのまま確定するとともに、i=2とし、文字列の左側2番目の文字を着目文字とする(S101)。以下、i番目の着目文字についての候補の確定処理を行う。
次に、前文字が類似文字種テーブル27に登録済(S102,Yes)、かつ、前文字の1番目の候補が確定済でない(S103,No)なら、前文字の1番目の候補とその類似文字の文字種(文字ごとに1種類、合計複数種類)を類似文字種テーブル27から取得する(S104)。なお、候補の確定処理は、S124において後記する。一方、登録済でない場合(S102,No)、または、確定済である(S103,Yes)場合は、前文字の文字種(1種類)を取得する(S105)。
そして、後文字が類似文字種テーブル27に登録済(S111,Yes)なら、後文字の1番目の候補とその類似文字の文字種(文字ごとに1種類、合計複数種類)を類似文字種テーブル27から取得する(S112)。一方、登録済でない場合(S111,No)は、後文字の文字種(1種類)を取得する(S113)。
ここで、着目文字における1番目の候補文字(j=1)を選択する(S121)。なお、制御変数jは、着目文字における確定候補となる候補文字の順番を示す。そして、着目文字のj番目の候補文字の文字種を取得する(S122)。
連続する3文字(前文字、着目文字の候補文字、後文字)の取得した文字種について、各文字種が互いに一致する組み合わせが有るか否かを判定する(S123)。判定要件を満たすときには、S124へ進み、満たさないときには、S125へ進む。
例えば、以下の連続する3文字の文字種の場合、3文字で互いに一致する文字種「漢字」が存在するので、S123の判定要件を満たす。
・S104またはS105で取得した、前文字に関する文字種「漢字、カタカナ」
・S122で取得した、着目文字の候補文字の文字種「漢字」
・S112またはS113で取得した、後文字に関する文字種「ひらがな、漢字」
別の例では、以下の連続する3文字の文字種の場合、3文字で互いに一致する文字種が存在しないので、S123の判定要件を満たさない。
・S104またはS105で取得した、前文字に関する文字種「漢字、カタカナ」
・S122で取得した、着目文字の候補文字の文字種「カタカナ」
・S112またはS113で取得した、後文字に関する文字種「ひらがな、漢字」
S123の判定要件を満たすとき、着目文字のj番目の候補文字を、着目文字を示す文字として確定する(1番目の候補と入れ替える)(S124)。そして、S131へ進む。
S123の判定要件を満たさないとき、着目文字における次の候補文字が存在するときには(S125,Yes)、次の候補文字へ移行し(j=j+1)(S126)、S122を再び実行する。次の候補文字が存在しないときには(S125,No)、S131へ進む。なお、「j=j+1」は、制御変数jの値に1を足すことを示す代入式である。
ここで、i番目の着目文字についての候補の確定処理を終えたので、着目文字が文字列の右から2番目になっていなかったら(S131,No)、次の着目文字へ移行し(i=i+1)(S132)、処理をS102に戻す。着目文字が文字列の右から2番目になっていたら、文字列の右端(最後)の文字について、1番目の候補をそのまま確定し、処理を終える。なお、S131の判定は、文字列の長さを変数LENとすると、判定式「LEN==i+1」(演算子==は、両辺の値が等しいときに判定を満たす)と表現できる。
以下、図3のフローチャートを、表2及び表3の具体例に適用した場合を説明する。表2では、5文字からなる文字列を対象として、文字確定処理(S14)を行う。
1文字目の第1候補「川(漢字)」は、先頭文字なので、そのまま確定する(S101)。
2文字目の第1候補「ロ(カタカナ)」は、第2候補「口(漢字)」と入れ替えられる。この入れ替えは、以下の3文字で互いに一致する文字種「漢字」が存在するためである(S123)。
・確定した前文字「川(漢字)」の文字種「漢字」
・着目文字の第2候補文字「口(漢字)」の文字種「漢字」
・後文字「ー(カタカナ)」の類似文字種テーブル27から取得した文字種「カタカナ、漢字」「記号」
3文字目の第1候補「ー(カタカナ)」は、第3候補「一(漢字)」と入れ替えられる。この入れ替えは、以下の3文字で互いに一致する文字種「漢字」が存在するためである(S123)。
・確定した前文字「口(漢字)」の文字種「漢字」
・着目文字の第3候補文字「一(漢字)」の文字種「漢字」
・後文字「T(英字)」の類似文字種テーブル27から取得した文字種「漢字、英字」
4文字目の第1候補「T(英字)」は、第3候補「丁(漢字)」と入れ替えられる。この入れ替えは、以下の3文字で互いに一致する文字種「漢字」が存在するためである(S123)。
・確定した前文字「一(漢字)」の文字種「漢字」
・着目文字の第3候補文字「丁(漢字)」の文字種「漢字」
・後文字「目(漢字)」の文字種「漢字」
5文字目の第1候補「目(漢字)」は、最後文字なので、そのまま確定する(S131)。以上により、表3に示す認識結果は、「川口一丁目(かわぐちいっちょうめ)」となる。
以上説明した本実施形態によれば、着目文字の候補を決定するときに、着目文字の前後文字の第1候補の文字種だけでなく、前後文字に類似する複数の文字種を類似文字種テーブル27から取得することにより、高精度な着目文字の候補決定を実現できる。一方、特許文献1で示された各手法は、着目文字の前文字について、その第1候補の文字種(1種類)のみを参照するため、前文字の第1候補が間違っていたときには、連鎖的に(連続的に)後続する着目文字や後文字も間違った候補が選択され続けてしまう恐れがある。
以上説明した本発明は、以下のようにその趣旨を逸脱しない範囲で広く変形実施することができる。
例えば、図3のフローチャートでは、文字列の両端文字(i=1、i=LEN)については、第1候補をそのまま確定する処理を行っていた。しかし、両端文字の第1候補が誤認識されている可能性もある。そこで、S124の候補確定処理において、着目文字だけでなく、着目文字に隣接する両端文字についても、S123で一致する文字種に対応する両端文字の候補文字を、両端文字の第1候補に確定することとしてもよい。これにより、両端文字の誤認識が発生しても、適切に正しい候補が選択される。
本発明の一実施形態に関する文字認識システムの構成図である。 本発明の一実施形態に関する図1の文字認識システムの動作概要を示すフローチャートである。 本発明の一実施形態に関する図2の文字確定処理の詳細を示すフローチャートである。
符号の説明
1 スキャナ
2 文字認識装置
3 主記憶装置
4 CPU
21 帳票イメージ記憶部
22 認識領域決定部
23 認識領域記憶部
24 文字認識部
25 確定前データ記憶部
26 文字確定部
27 類似文字種テーブル
28 確定後データ記憶部

Claims (5)

  1. 文字列中の所定文字を認識した結果、複数の候補文字が抽出されたとき、その候補文字を確定する文字認識装置であって、
    前記文字認識装置が、
    前記所定文字の候補文字群と、前記文字列中の前記所定文字の前に位置する前文字と、前記文字列中の前記所定文字の後に位置する後文字と、の入力を受け付け、
    文字ごとに、文字コードと、文字の文字種と、その文字に形状が類似する類似文字の文字種と、を対応づけた類似文字種データを格納した記憶手段から、前記前文字および前記後文字それぞれに対応する文字種を読み取り、
    前記所定文字の前記候補文字群の各候補文字について、各候補文字の文字種と、読み取った前記前文字および前記後文字それぞれに対応する文字種と、の異同を判定することにより、前記所定文字の前記候補文字群から所定候補文字を選択し、
    前記選択した所定候補文字を前記所定文字として確定することを特徴とする
    文字認識装置。
  2. 前記所定候補文字は、前記前文字に対応する文字種と、前記候補文字の文字種と、前記後文字に対応する文字種と、が互いに一致する文字種が発見されたときに、発見された候補文字とすることを特徴とする
    請求項1に記載の文字認識装置。
  3. 前記文字認識装置は、さらに、前記前文字または前記後文字が前記文字列の端に位置する文字のときに、その端に位置する文字を、確定した前記所定文字の文字種と同じ文字種の文字に置き換えることを特徴とする
    請求項2に記載の文字認識装置。
  4. 文字列中の所定文字を認識した結果、複数の候補文字が抽出されたとき、その候補文字を確定する文字認識方法であって、
    文字認識装置が、
    前記所定文字の候補文字群と、前記文字列中の前記所定文字の前に位置する前文字と、前記文字列中の前記所定文字の後に位置する後文字と、の入力を受け付け、
    文字ごとに、文字コードと、文字の文字種と、その文字に形状が類似する類似文字の文字種と、を対応づけた類似文字種データを格納した記憶手段から、前記前文字および前記後文字それぞれに対応する文字種を読み取り、
    前記所定文字の前記候補文字群の各候補文字について、各候補文字の文字種と、読み取った前記前文字および前記後文字それぞれに対応する文字種と、の異同を判定することにより、前記所定文字の前記候補文字群から所定候補文字を選択し、
    前記選択した所定候補文字を前記所定文字として確定することを特徴とする
    文字認識方法。
  5. 請求項4に記載の文字認識方法を、前記文字認識装置に実行させるための文字認識プログラム。
JP2007306804A 2007-11-28 2007-11-28 文字認識装置、文字認識方法、および、文字認識プログラム Pending JP2009129392A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007306804A JP2009129392A (ja) 2007-11-28 2007-11-28 文字認識装置、文字認識方法、および、文字認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007306804A JP2009129392A (ja) 2007-11-28 2007-11-28 文字認識装置、文字認識方法、および、文字認識プログラム

Publications (1)

Publication Number Publication Date
JP2009129392A true JP2009129392A (ja) 2009-06-11

Family

ID=40820204

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007306804A Pending JP2009129392A (ja) 2007-11-28 2007-11-28 文字認識装置、文字認識方法、および、文字認識プログラム

Country Status (1)

Country Link
JP (1) JP2009129392A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011165099A (ja) * 2010-02-12 2011-08-25 Oki Electric Industry Co Ltd 帳票処理システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011165099A (ja) * 2010-02-12 2011-08-25 Oki Electric Industry Co Ltd 帳票処理システム

Similar Documents

Publication Publication Date Title
US8340425B2 (en) Optical character recognition with two-pass zoning
US11475688B2 (en) Information processing apparatus and information processing method for extracting information from document image
JP4672692B2 (ja) 単語認識システムおよび単語認識プログラム
JP5942361B2 (ja) 画像処理装置及び画像処理プログラム
JP2009129392A (ja) 文字認識装置、文字認識方法、および、文字認識プログラム
JP2012173959A (ja) 文字認識装置及びプログラム
JP7021496B2 (ja) 情報処理装置及びプログラム
Neves et al. Extraction of biomedical events using case-based reasoning
Lund Ensemble Methods for Historical Machine-Printed Document Recognition
US9009026B2 (en) Information processing apparatus, non-transitory computer readable medium storing information processing program, and information processing method
JP2020087112A (ja) 帳票処理装置および帳票処理方法
JP6131765B2 (ja) 情報処理装置及び情報処理プログラム
US11972208B2 (en) Information processing device and information processing method
JP7315420B2 (ja) テキストの適合および修正の方法
JP2010237909A (ja) 知識補正プログラム、知識補正装置および知識補正方法
JP6260350B2 (ja) 画像処理装置及び画像処理プログラム
JP7463675B2 (ja) 情報処理装置、及び情報処理プログラム
JP5845726B2 (ja) 文字認識装置、文字認識結果処理システム及びプログラム
JP5888222B2 (ja) 情報処理装置及び情報処理プログラム
JP5284342B2 (ja) 文字認識システムおよび文字認識プログラム
JP7110723B2 (ja) データ変換装置、画像処理装置及びプログラム
JP5986051B2 (ja) アラビア語テキストを自動的に認識するための方法
JP2008108153A (ja) 情報処理システムおよび情報処理プログラム
JP6575158B2 (ja) 情報処理装置及び情報処理プログラム
JP2677271B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090617