JP3372005B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3372005B2
JP3372005B2 JP10662595A JP10662595A JP3372005B2 JP 3372005 B2 JP3372005 B2 JP 3372005B2 JP 10662595 A JP10662595 A JP 10662595A JP 10662595 A JP10662595 A JP 10662595A JP 3372005 B2 JP3372005 B2 JP 3372005B2
Authority
JP
Japan
Prior art keywords
character
feature
cluster
recognition result
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP10662595A
Other languages
English (en)
Other versions
JPH08305804A (ja
Inventor
穂 高倉
一郎 中尾
磨理子 竹之内
里志 江村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP10662595A priority Critical patent/JP3372005B2/ja
Priority to US08/608,179 priority patent/US5999647A/en
Publication of JPH08305804A publication Critical patent/JPH08305804A/ja
Priority to US09/187,131 priority patent/US6141443A/en
Priority to US09/186,943 priority patent/US6064769A/en
Application granted granted Critical
Publication of JP3372005B2 publication Critical patent/JP3372005B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、新聞の活字、ワープロ
印字及び手書き文字等を認識する文字認識装置及びその
装置用の辞書の作成装置に関する。
【0002】
【従来の技術】一般に従来より文字認識装置は、認識対
象の文字画像から幾つかの特徴を抽出し、その幾つかの
特徴の組(以後単に特徴と呼ぶ)を、内蔵する辞書中の
基準の特徴と比較し、これが最も類似した文字を認識結
果とする。この際用いられる辞書用の最も単純な辞書作
成装置は、何人かにより手書きされた文字、異なるフォ
ントで印字された文字等からなる同一文字の複数の画像
学習用データから抽出した各特徴の平均値をその文字の
基準特徴として辞書に格納する。
【0003】しかし、学習データから抽出した特徴の分
布は複雑に入り混じったものになることが普通であるた
め、このような単純な装置で作成した辞書を用いると、
同一文字であっても、書く人により、あるいは書くたび
に文字形状が変動する手書き文字や、複数の文字形状か
らなるマルチフォントで印字された文字の認識をする場
合には、不十分である。
【0004】そのため、一般的な手法であるクラスタ分
析〔異質なものの混ざりあっている対象{それは個体
(=もの)の場合もあるし、変数の場合もある}を、そ
れらの間に何らかの意味で定義された類似度(similari
ty)を手がかりにして似たものを集め、いくつかの均質
なものの集落(クラスタ)に分類する方法をいう。「多
変量統計解析法」,田中豊・脇本和昌著,現代数学社,
P.230〜244参照〕の手法を応用した辞書作成装
置が提案されている。この装置では、各文字の学習デー
タ中の類似したデータを集めて複数のクラスタを作り、
各クラスタ毎に求めた特徴の平均値を辞書に格納する。
この場合、文字毎のクラスタ数が多い程、作成された辞
書による認識率は高くなるけれども、それだけ辞書容量
が大きくなる。
【0005】また、作成された辞書を用いて文字認識装
置は、認識対象の文字画像の特徴と辞書に格納された全
辞書データとを距離計算して比較する。このため、辞書
に格納された辞書データの総数が多いと、認識に要する
時間もそれにともなって長くなる。従って、記憶資源の
効率や認識実行時間を考慮すると、1文字のクラスタ数
は少ない程良い。
【0006】これら相反する要件の下、高い認識率を実
現する最少のクラスタ数が、最適クラスタ数となる。し
かし、ある文字の最適クラスタ数は、その文字に属する
学習データの特徴の分布だけではなく、特徴空間上隣接
して分布する他の文字の学習データの分布との関係に左
右されるため、全文字の学習データの特徴の分布を把握
する必要がある。
【0007】ところが、通常、辞書作成には、膨大な数
の学習データを使用するため、それら総てについて、相
互の関係を把握し、各文字の最適クラスタ数を決定する
作業は、膨大な計算量が必要であり、現実的ではない。
そのため、従来の第1の技術では、全文字一律のクラス
タ数でクラスタリング(クラスタ分析)をしている。
【0008】また、第2の技術(特開平1−36388
号公報)では、一旦、全文字一律のクラスタ数でクラス
タリングをして辞書を作成した後、作成した辞書を用い
て認識実験を行い、認識率を見ながらクラスタ数の調整
をしている。また、第3の技術(特公平5−08262
8号公報)では、特徴に関しては、入力された文字画像
の境界画素毎に隣接する境界画素との位置関係に基づい
て方向値を定義し、文字画像外接矩形を水平方向にL分
割、垂直方向にM分割した各部分領域における各方向値
の境界点数を計数した領域別輪郭方向密度と、文字画像
外接矩形中の各画素から各辺に向かって走査したとき、
文字部を横切る回数+1を背景値として定義し、文字画
像外接矩形を水平方向にP分割、垂直方向にQ分割した
各部分領域における各方向各背景値ごとの画素数を計数
した領域別背景密度とを用いている。
【0009】また、第4の技術(特開平5−12830
7号公報)では、文字認識装置で認識対象の文書画像が
文書の印字状態や入力時の画像2値化処理により、文字
同士の接触や掠れによる文字の分離などが出現すること
があるため、接触文字や分離文字が含まれる文書画像か
ら個々の文字を切り出し認識するようしている。その手
段として、切り出された文字あるいは文字部分を単独で
認識すると共に、連結後の文字幅が予め推定しておいた
文字幅を越えない限り分離文字の可能性もあるため、隣
接する文字あるいは文字部分を可能な全ての組合せで連
結・認識し、単独で認識した場合と、連結・認識した場
合とでより評価値の高い方を認識結果として採用する。
【0010】更に、従来の文字認識装置は、文字以外の
絵や図の記入された文書画像から、絵や図を文字行とし
て切り出し、誤認識を行う危険性を考慮して、評価値か
ら認識したものが正しい文字であるか否かを各文字毎に
判断をしている。
【0011】
【発明が解決しようとする課題】ところで、上述した第
1の技術では、1文字あたりのクラスタ数が少ないと極
端に認識率が悪いため、一般に、冗長なクラスタリング
を行うことになり、認識率の割にはクラスタ数が多くな
る。また、第2の技術では、例えば、「0」と「O」な
ど殆ど同形の文字があった場合、いくらクラスタ数を増
やしても認識率が上がらないため、徒にクラスタ数が増
えてしまう。
【0012】また、第3の技術では、図32に示す形状
3201、3202のように形状が異なっても、輪郭の
連続関係3203が類似しているので、非常に類似した
特徴が得られ、同一であると誤認識することが多い。ま
た、第4の技術では、連結後の文字幅が予め推定してお
いた文字幅を越えない限り分離文字の可能性もあるとし
て、隣接する文字あるいは文字部分を可能な全ての組合
せで連結・認識するため、認識に時間を要する。
【0013】更に、従来の文字認識装置では、図や絵の
一部が偶然類似した文字として認識された場合には、意
味のない認識結果が得られることになる。本発明は上記
課題に鑑み、適切な辞書データ数で高認識率が達成でき
る、手書き文字あるいはマルチフォント文字の認識用辞
書の作成装置及び該装置で作成された辞書を用いた文字
認識装置を提供することを目的とする。
【0014】
【0015】
【0016】
【0017】
【課題を解決するための手段】 上記課題を解決するた
め、 請求項に係る発明においては、認識対象の文字画
像の入力を受け付けて2値画像データに変換する入力画
像変換手段と、前記入力画像変換手段で変換された2値
画像データの文字行に対応する座標位置を検出する文字
行座標位置検出手段と、前記文字行座標位置検出手段の
検出対象とされた文字行内の個々の文字に対応する座標
位置を検出する文字座標位置検出手段と、前記文字座標
位置検出手段で検出された座標で特定される2値画像か
らなる文字の認識に使用する特徴を抽出する特徴抽出手
段と、基準となる文字の形状特徴を平均したクラスタ平
均特徴とその文字コードを対応付けて所定の値の大きさ
のクラスタに分類して登録している大分類用辞書と、前
記特徴抽出手段で抽出された特徴と上記クラスタ平均特
徴との距離を計算し、得られた距離から類似度を計算
し、類似度の高い複数のクラスタをクラスタ候補として
選出する大分類手段と、前記大分類用辞書に登録されて
いるクラスタのうち、2つのクラスタ間の距離が所定の
値より小さい近接クラスタの識別子と少なくとも1以上
の両クラスタを識別するクラスタ平均特徴の要素とを対
応付けて登録している詳細識別用辞書と、前記詳細識別
用辞書に登録されている近接クラスタの2つの識別子
が、前記大分類手段で選出された複数の候補クラスタ中
の識別子にともに含まれているときには、前記詳細識別
用辞書に登録されている文字の認識に使用する特徴の要
素のみに関して、前記特徴抽出手段で抽出された特徴と
クラスタ平均特徴との第2の距離を計算し、該第2の距
離の小さい方のクラスタの類似度を引き上げる詳細識別
手段と、前記詳細識別手段で引き上げられた類似度を優
先して、前記大分類手段で選出された候補クラスタに対
応する文字コードを出力する出力手段とを備え、上記文
字認識に用いる特徴のうち予め定めた特定要素の最小値
と最大値とをクラスタの識別子に対応付けて登録してい
る棄却処理用辞書と、前記詳細識別手段で得られた類似
度を優先して、前記大分類手段で選出した最も類似度の
高い候補クラスタの類似度が所定の値よりも大きく、か
つ、前記棄却処理用辞書に登録されている特定要素の最
小値と最大値との間に前記特徴抽出手段で抽出された文
字認識用の特徴の値があるときに認識結果が有意である
と判定する認識結果判定手段 と、前記認識結果判定手段
で認識結果が有意でないと判定された候補クラスタを棄
却文字とし、該棄却文字が連続するとき、その連続する
棄却文字を連結する棄却文字連結手段と、前記認識結果
判定手段で認識結果が有意でないと判定された候補クラ
スタの前後に同様に判定された候補クラスタのない候補
クラスタ又は前記棄却文字連結手段で連結した棄却文字
の上記2値画像データ上の座標位置から文字数を推定す
る文字数推定手段と、上記2値画像データ上の座標で示
される領域を前記文字数推定手段で推定された文字数で
分割して、新たな認識対象の文字の座標を求める連結文
字分割手段と、前記連結文字分割手段で求められた座標
で特定される2値画像データの文字認識に使用する特徴
を抽出する第2の特徴抽出手段と、前記第2の特徴抽出
手段で抽出された特徴と上記クラスタ平均特徴との距離
を計算し、得られた距離から類似度を計算し、類似度の
高い複数のクラスタをクラスタ候補として選出する第2
の大分類手段と、前記第2の大分類手段で選出された2
つのクラスタ候補の識別子が前記詳細識別用辞書に登録
されている識別子と一致するときは、前記詳細識別用辞
書に登録されているクラスタ平均特徴の要素だけに関し
て、前記特徴抽出手段で抽出された特徴とクラスタ平均
特徴との第2の距離を計算し、第2の距離の近いクラス
タの類似度を引き上げる第2の詳細識別手段と、前記第
2の詳細識別手段で引き上げられた類似度を優先して、
前記第2の大分類手段で選出された類似度の最も高い候
補クラスタの類似度が所定の値よりも大きく、かつ、前
記棄却処理用辞書に登録されている特定要素の最小値と
最大値との間に前記特徴抽出手段で抽出された文字認識
用の特徴の値があるときに認識結果が有意であると判定
する第2の認識結果判定手段と、前記第2の認識結果判
定手段が有意であると判定したとき、前記詳細識別手段
で得られた類似度を優先して大分類手段で選出した最も
類似度の高い候補クラスタの認識結果を破棄し、前記第
2の認識結果判定手段で認識結果が有意であると判定さ
れたとき、当該認識結果を選択する認識結果選択手段
と、前記認識結果選択手段で選択された認識結果に従
い、候補クラスタに対応する文字コードを出力する認識
結果出力手段とを備えることとしている。
【0018】請求項に係る発明においては、文字コー
ドごとに入力を受け付けた多数の学習用文字画像を2値
画像データに変換する入力画像変換手段と、前記入力画
像変換手段で変換された各2値画像データから文字認識
に用いる特微を抽出する文字特微抽出手段と、前記文字
特微抽出手段で抽出された文字認識に用いる特微相互間
の距離を文字コードごとに計算する距離計算手段と、前
記距離計算手段が計算した各文字コードごとの距離の最
大値のうち最小のものを基に前記大分類用辞書及び詳細
識別用辞書の所定の値として、決定する決定手段とを備
えることを特徴としている。
【0019】
【0020】請求項に係る発明においては、前記棄却
文字連結手段は、前記詳細識別手段での詳細識別の結
果、類似度の最も高い候補クラスタが括弧記号の文字で
ある場合に、該記号が連続するときは括弧記号を連結す
る括弧連結部と、前記認識結果判定手段で認識結果が有
意でないと判定された棄却文字と上記括弧記号とが連続
するときは、棄却文字と括弧記号とを連結する棄却括弧
連結部とを備えることを特徴としている。
【0021】請求項に係る発明においては、前記特徴
抽出手段は、上記2値画像データの文字部分に対応する
画素を囲む外接矩形を決定する外接矩形決定部と、上記
文字部分に対応する画素の境界画素ごとに隣接画素との
位置関係で定まる方向値を決定し、上記外接矩形を行方
向にL分割し、列方向にM分割した各領域において、そ
の内部の各方向値ごとに画素数を計数し、該計数した画
素数を各領域に含まれる画素数で除した領域別輪郭方向
密度特徴を求める領域別輪郭方向密度計算部と、上記外
接矩形の各辺から対辺に向かって走査したとき、上記文
字部分に対応しない画素から対応する画素に変化するご
とに「1」を加えた背景値を決定し、上記外接矩形を行
方向にP分割し、列方向にQ分割した各領域において、
その内部の背景値ごとの画素数を計数し、該計数した画
素数を各領域の画素数で除した領域別背景密度特徴を求
める領域別背景密度計算部と、上記外接矩形からその縦
横比を計算して縦横比特徴を求める縦横比計算部とを備
えることを特徴としている。
【0022】請求項に係る発明においては、前記認識
結果判定手段の認識結果又は前記認識結果選択手段の選
択結果に基づいて、任意の行中の認識された文字コード
中の予め定めた特殊な記号に対応する文字コードの割合
を計算する割合計算手段と、前記割合計算手段で計算さ
れた割合が所定の割合を超えた場合に、その任意の行を
有意な文字行でないと判断して、前記出力手段にその旨
出力を指示する行認識結果評価手段とを備えることを特
徴としている。
【0023】
【0024】
【0025】
【0026】
【作用】 上記構成により、 請求項の発明においては、
入力画像変換手段は、認識対象の文字画像の入力を受け
付けて2値画像データに変換する。文字行座標位置検出
手段は、前記入力画像変換手段で変換された2値画像デ
ータの文字行に対応する座標位置(例えば対角位置の座
標)を検出する。文字座標位置検出手段は、前記文字行
座標位置検出手段の検出対象とされた文字行内の個々の
文字に対応する座標位置を検出する。特徴抽出手段は、
前記文字座標位置検出手段で検出された座標で特定され
る2値画像からなる文字の認識に使用する特徴を抽出す
る。大分類用辞書は、基準となる文字の形状特徴を平均
したクラスタ平均特徴とその文字コードを対応付けて所
定の値の大きさのクラスタに分類して登録している。大
分類手段は、前記特徴抽出手段で抽出された特徴と上記
クラスタ平均特徴との距離を計算し、得られた距離から
類似度を計算し、類似度の高い複数のクラスタをクラス
タ候補として選出する。詳細識別用辞書は、前記大分類
用辞書に登録されているクラスタのうち、2つのクラス
タ間の距離が所定の値より小さい近接クラスタの識別子
と少なくとも1以上の両クラスタを識別するクラスタ平
均特徴の要素とを対応付けて登録している。詳細識別手
段は、前記詳細識別用辞書に登録されている近接クラス
タの2つの識別子が、前記大分類手段で選出された複数
の候補クラスタ中の識別子にともに含まれているときに
は、前記詳細識別用辞書に登録されている文字の認識に
使用する特徴の要素のみに関して、前記特徴抽出手段で
抽出された特徴とクラスタ平均特徴との第2の距離を計
算し、該第2の距離の小さい方のクラスタの類似度を引
き上げる。これによって、形状の類似した文字の認識率
を高くすることができる。出力手段は、前記詳細識別手
段で引き上げられた類似度を優先して、前記大分類手段
で選出された候補クラスタに対応する文字コードを出力
する。棄却処理用辞書は、認識結果の確認のために、上
記文字認識に用いる特徴のうち予め定めた特定要素の最
小値と最大値とをクラスタの識別子に対応付けて登録し
ている。認識結果判定手段は、前記詳細識別手段で得ら
れた類似度を優先して、前記大分類手段で選出した最も
類似度の高い候補クラスタの類似度が所定の値よりも大
きく、かつ、前記棄却処理用辞書に登録されている特定
要素の最小値と最大値との間に前記特徴抽出手段で抽出
された文字認識用の特徴の値があるときに認識結果が有
意であると判定する。棄却文字連結手段は、認識結果が
有意でないと判定された文字を再認識するために、前記
認識結果判定手段で認識結果が有意でないと判定された
候補クラスタを棄却文字とし、該棄却文字が連続すると
き、その連続する棄却文字を連結する。文字数推定手段
は、前記認識結果判定手段で認識結果が有意でないと判
定された候補クラスタの前後に同様に判定された候補ク
ラスタのない候補クラスタ又は前記棄却文字連結手段で
連結した棄却文字の上記2値画像データ上の座標位置か
ら文字数を推定する。連結文字分割手段は、上記2値画
像データ上の座標で示される領域を前記文字数推定手段
で推定された文字数で分割して、新たな認識対象の文字
の座標を求める。第2の特徴抽出手段は、前記連結文字
分割手段で求められた座標で特定される2値画像データ
の文字認識に使用する特徴を抽出する。第2の大分類手
段は、前記第2の特徴抽出手段で抽出された特徴と上記
クラスタ平均特徴との距離を計算し、得られた距離から
類似度を計算し、類似度の高い複数のクラスタをクラス
タ候補として選出する。第2の詳細識別手段は、前記第
2の大分類手段で選出された2つのクラスタ候補の識別
子が前記詳細識別用辞書に登録されている識別子と一致
するときは、前記詳細識別用辞書に登録されているクラ
スタ平均特徴の要素だけに関して、前記特徴抽出手段で
抽出された特徴とクラスタ平均特徴との第2の距離を計
算し、第2の距離の近いクラスタの類似度を引き上げ
る。第2の認識結果判定手段は、前記第2の詳細識別手
段で引き上げられた類似度を優先して、前記第2の大分
類手段で選出された類似度の最も高い候補クラスタの類
似度が所定の値よりも大きく、かつ、前記棄却処理用辞
書に登録されている特定要素の最小値と最大値との間に
前記特徴抽出手段で抽出された文字認識用の特徴の値が
あるときに認識結果が有意であると判定する。認識結果
選択手段は、前記第2の認識結果判定手段が有意である
と判定したとき、前記詳細識別手段で得られた類似度を
優先して大分類手段で選出した最も類似度の高い候補ク
ラスタの認識結果を破棄し、前記第2の認識結果判定手
段で認識結果が有意であると判定されたとき、当該認識
結果を選択する。認識結果出力手段は、前記認識結果選
択手段で選択された認識結果に従い、候補クラスタに対
応する文字コードを出力する。
【0027】請求項に係る発明においては、入力画像
変換手段は、文字コードごとに入力を受け付けた多数の
学習用文字画像を2値画像データに変換する。文字特微
抽出手段は、前記入力画像変換手段で変換された各2値
画像データから文字認識に用いる特微を抽出する。距離
計算手段は、前記文字特微抽出手段で抽出された文字認
識に用いる特微相互間の距離を文字コードごとに計算す
る。クラスタの数を適正にするために、決定手段は、前
記距離計算手段が計算した各文字コードごとの距離の最
大値のうち最小のものを基に前記大分類用辞書及び詳細
識別用辞書の所定の値として、決定する。
【0028】
【0029】請求項に係る発明においては、前記棄却
文字連結手段の括弧連結部は、掠れ文字を誤認識しない
ために、前記詳細識別手段での詳細識別の結果、類似度
の最も高い候補クラスタが括弧記号の文字である場合
に、該記号が連続するときは括弧記号を連結する。同じ
く、棄却括弧連結部は、前記認識結果判定手段で認識結
果が有意でないと判定された棄却文字と上記括弧記号と
が連続するときは、棄却文字と括弧記号とを連結する。
【0030】請求項に係る発明においては、前記特徴
抽出手段の外接矩形決定部は、上記2値画像データの文
字部分に対応する画素を囲む外接矩形を決定する。同じ
く、領域別輪郭方向密度計算部は、上記文字部分に対応
する画素の境界画素ごとに隣接画素との位置関係で定ま
る方向値を決定し、上記外接矩形を行方向にL分割し、
列方向にM分割した各領域において、その内部の各方向
値ごとに画素数を計数し、該計数した画素数を各領域に
含まれる画素数で除した領域別輪郭方向密度特徴を求め
る。同じく、領域別背景密度計算部は、上記外接矩形の
各辺から対辺に向かって走査したとき、上記文字部分に
対応しない画素から対応する画素に変化するごとに
「1」を加えた背景値を決定し、上記外接矩形を行方向
にP分割し、列方向にQ分割した各領域において、その
内部の背景値ごとの画素数を計数し、該計数した画素数
を各領域の画素数で除した領域別背景密度特徴を求め
る。同じく、縦横比計算部は、上記外接矩形からその縦
横比を計算して縦横比特徴を求める。
【0031】請求項に係る発明においては、文字画像
として入力されたもののうちの絵やゴミなどを誤認識し
ないために、割合計算手段は、前記認識結果判定手段の
認識結果又は前記認識結果選択手段の選択結果に基づい
て、任意の行中の認識された文字コード中の予め定めた
特殊な記号に対応する文字コードの割合を計算する。行
認識結果評価手段は、前記割合計算手段で計算された割
合が所定の割合を超えた場合に、その任意の行を有意な
文字行でないと判断して、前記出力手段にその旨出力を
指示する。
【0032】
【実施例】以下、本発明に係る文字認識用辞書作成装置
を実施例に基づいて説明する。 (第1実施例)図1は、本発明に係る文字認識用辞書作
成装置の一実施例の構成図である。文字認識用辞書作成
装置は、画像入力部101と、学習用文字画像データベ
ース102と、特徴抽出部103と、学習特徴データベ
ース104と、クラスタリング部105と、クラスタデ
ータベース106と、大分類用辞書作成部107と、大
分類用辞書108と、クラスタ間距離計算部109と、
詳細識別用辞書作成部110と、詳細識別用辞書111
と、棄却処理用辞書作成部112と、棄却処理用辞書1
13とを備える。
【0033】画像入力部101は、スキャナ等の光学読
取装置及びキーボード等からなり、オペレータによって
入力される学習用文字画像114の文字コードの入力を
受け付けると、学習用文字画像114を読み取り、2値
画像データに変換し、学習用文字画像データベース10
2にその2値画像データと文字コードとを組にして記憶
させる。全ての認識対象の学習用文字画像114の2値
画像データへの変換を終了すると、特徴抽出部103を
起動する。ここで、学習用文字画像114は、認識対象
の全文字について、異なるフォントで印字した文字、複
数の人物が書いた文字及び同一人物が複数回数書いた文
字を用いる。
【0034】学習用文字画像データベース102は、磁
気ディスク等からなり、画像入力部101で変換された
図2に示すような2値画像データ201と、その文字コ
ードとを組にして多数記憶している。なお、図2に示す
2値画像データ201では、黒画素にデータ値「1」を
表示し、白画素のデータ値「0」は省略されている。特
徴抽出部103は、画像入力部101によって起動され
ると、学習用文字画像データベース102に記憶されて
いる2値画像データを順次読み出し、読み出した個々の
2値画像データについて、文字認識で使用する特徴を抽
出し、抽出した特徴を文字コードとともに学習特徴デー
タベース104に記憶させる。
【0035】特徴抽出部103は、図3に示すように、
方向値付与部301と、領域別輪郭方向密度計算部30
2と、背景値付与部303と、領域別背景密度計算部3
04と、縦横比計算部305と、特徴統合部306とを
備える。方向値付与部301は、画像入力部101によ
って起動されると、学習用文字画像データベース102
に記憶されている図4に示すような2値画像データ40
1を読み出し、隣接する2境界画素間の位置関係に基づ
き図5のように定義した方向値(1≦d≦4)を文字画
像(2値画像データ401のデータ値「1」)の境界画
素毎に図6に示すように決定する。一つの2値画像デー
タ401の方向値の決定が終了すると、その方向値を領
域別輪郭方向密度計算部302に通知する。
【0036】領域別輪郭方向密度計算部302は、方向
値付与部301から方向値の通知を受けると、図7に示
すように、文字画像外接矩形を水平方向にL分割(図7
では4分割)、垂直方向にM分割(図7では4分割)し
た各部分領域(1,1)、(1,2)、・・・、(L,
M)における各方向値ごとの画素の個数を計数し、得ら
れた輪郭画素数をその部分領域の画素数(面積)Slmで
割ったものを領域別輪郭方向密度特徴として求め、この
値を整数化のためα(例えば256)倍して特徴統合部
306に通知する。従って、水平方向にl番目、垂直方
向にm番目の領域の方向値dの画素数をN(l,m,
d)と表すとき、同領域の領域別輪郭方向密度特徴Fd
(l,m,d)は、 Fd(l,m,d)=α*N(l,m,d)/Slm と表される。ここで、1≦d≦4,1≦l≦L,1≦m
≦Mである。
【0037】なお、本実施例では方向値を1≦d≦4の
4方向で定義したが、8方向あるいは16方向の方向値
を定義してもよい。また、分割の幅も均等である必要は
ない。本実施例でも、領域(4,1)、(4,2)、
(4,3)、(4,4)の水平方向の幅は他の領域より
狭い。更に、領域内の黒画素(データ値「1」)数を均
等化する分割や、黒画素のモーメントを均等化する分割
が考えられる。これら方向数やL,Mの値が変われば、
当然、得られる領域別輪郭方向密度特徴の数も変わる。
【0038】また、得られる全ての領域別輪郭方向密度
特徴を認識に用いる必要もないので、上記の部分領域の
一部を求めて領域別輪郭方向密度特徴として使用しても
構わない。背景値付与部303は、後述するように特徴
統合部306によって起動されると、学習用文字画像デ
ータベース102に記憶されている2値画像データ40
1を読み出し、文字画像(2値画像データ401のデー
タ値「1」)外接矩形中の各辺からその対辺に向かって
走査したとき、文字部を横切る回数+1で定義される背
景値を各画素毎に決定する。上辺から下辺に向かって走
査した場合の背景値を図8に示す。右辺から左辺、下辺
から上辺、左辺から右辺に向かう背景値も同様にして決
定し、領域別背景密度計算部304にその背景値を通知
する。
【0039】領域別背景密度計算部304は、背景値付
与部303から背景値の通知を受けると、図7に示すよ
うに、文字画像外接矩形を水平方向にP分割、垂直方向
にQ分割した各部分領域における各方向各背景値ごとの
画素数を計数し、その部分領域の画素数(面積)Spqで
割ったものを領域別背景密度特徴として求め、この値を
整数化のためβ(例えば256)倍して特徴統合部30
6に通知する。従って、水平方向にp番目垂直方向にq
番目の領域のr方向への背景値bの画素数をN(r,
p,q,b)と表すとき、同領域の領域別背景密度特徴
Fb(r,p,q,b)は、 Fb(r,p,q,b)=β*N(r,p,q,b)/
Spq (rは方向(上,右,下,左),1≦p≦P,1≦q≦
Q,1≦b) で表される。
【0040】なお、同一文字において字体の変動にとも
ない大きく変化する特徴要素および文字が異なる場合に
も変動の小さい特徴要素は、文字認識特徴としては不適
当なので、例えば、P,Qが共に4の場合、 Fb(上,1,1,1), Fb(上,2,1,1), Fb(上,3,1,1), Fb(上,4,1,1) Fb(右,4,1,1), Fb(右,4,2,1), Fb(右,4,3,1), Fb(右,4,4,1) Fb(下,1,4,1), Fb(下,2,4,1), Fb(下,3,4,1), Fb(下,4,4,1) Fb(左,1,1,1), Fb(左,1,2,1), Fb(左,1,3,1), Fb(左,1,4,1) Fb(上,1,2,2), Fb(上,2,2,2), Fb(上,3,2,2), Fb(上,4,2,2) Fb(右,3,1,2), Fb(右,3,2,2), Fb(右,3,3,2), Fb(右,3,4,2) Fb(下,1,3,2), Fb(下,2,3,2), Fb(下,3,3,2), Fb(下,4,3,2) Fb(左,2,1,2), Fb(左,2,2,2), Fb(左,2,3,2), Fb(左,2,4,2) の32の値を領域別背景密度特徴として用いることとす
る。
【0041】なお、P,Qは、4以外の数値であっても
構わない。また、分割の幅が均等である必要はないこと
は領域別輪郭方向密度の場合と同様である。縦横比計算
部305は、特徴統合部306によって起動されると、
学習用文字画像データベース102に記憶されている2
値画像データ401を読み出し、図9に示すような文字
画像外接矩形の縦横比特徴Frを計算し、求めた値を整
数化のためγ(例えば16)倍して特徴統合部306に
通知する。
【0042】Fr=γ*h/w 特徴統合部306は、領域別輪郭方向計算部302から
領域別方向密度特徴Fdの通知を受けると、背景値付与
部303を起動し、領域別背景密度計算部304から領
域別背景密度特徴Fbの通知を受けると、縦横比計算部
305を起動する。縦横比計算部305から、縦横比特
徴Frの通知を受けると、領域別輪郭方向密度特徴Fd
と、領域別背景密度特徴Fbと、縦横比特徴Frとを予
め定めた順序に整列し、文字認識用特徴として、学習特
徴データベース104に記憶させる。併せてクラスタリ
ング部105を起動する。本実施例では、文字認識用特
徴Fとして97の数値列が抽出される。
【0043】なお、本実施例では、方向値付与部301
と、背景値付与部303と、縦横比計算部305とは順
次それぞれの処理をするように構成したけれども、学習
用文字画像読出部を設けて、画像入力部101の起動を
受けて、学習用文字画像データベース102の記憶内容
を読み出し、方向値付与部301と、背景値付与部30
3と、縦横比計算部305とにその内容を通知して、並
列に処理するよう構成してもよい。
【0044】学習特徴データベース104は、磁気ディ
スク等からなり、特徴抽出部103で抽出された特徴を
その文字コードとともに記憶している。その一例を図1
0〜図13に示す。図10〜図13に示す97個の数値
の特徴の意味を図14に示している。即ち、図10の第
1列目の数値”4366”は、文字「中」の文字コード
を16進数で表わし、第2列目の数値「18」は縦横比
を表わしている。第3列目の数値「35,3,6,3」
は、(1,1)領域の方向密度の方向値「1,2,3,
4」にそれぞれ対応する値である。第4列目〜第18列
目も、第3列目と同様、方向密度に対応する値である。
第19列目の数値「25,17,15,25」は上辺か
ら下辺に向かって走査したときに背景値「1」の
「(1,1)、(2,1)、(3,1)、(4,1)」
の各領域の値を示している。第20行目〜26行目も第
19行目と同様背景値密度に対応する値である。
【0045】クラスタリング部105は、特徴抽出部1
03によって起動されると、学習特徴データベース10
4から同一文字コードの文字の各文字認識用特徴を順次
読み出し、文字相互間の文字認識用特徴間の距離Dを市
街地距離の式
【0046】
【数1】
【0047】によって計算する。ここで、Fikは文字i
の文字認識用特徴の第k要素を示し、Fjkは文字jの文
字認識用特徴の第k要素を示す。なお、本実施例ではN
は97である。同一文字コードの文字の文字認識用特徴
間の距離Dを計算し、その最大の距離DMAX の値をバッ
ファに記憶する。例えば、同一文字コードの2値画像デ
ータが画像入力部101から100字入力されていたと
きには、4950( 100C2 )個の距離Dを計算して、
その最大値をバッファに記憶する。
【0048】一つの同一文字コードの処理が終了する
と、他の異なる同一文字コードの文字についても同様に
文字認識用特徴間の距離Dを計算し、その最大値をバッ
ファに入力する。全ての文字コードについての計算が終
了すると、バッファに記憶している文字コードごとの文
字認識用特徴間の最大距離の値を読み出し、その最小値
を選択する。この選択した最小値DMIN から式k*DMI
N で求められる値を「クラスタの大きさ」とする。ここ
で、kは1以上の定数である。
【0049】また、クラスタリング部105は、「クラ
スタの大きさ」を決定すると、学習特徴データベース1
04から図10に示すような文字認識用特徴を単一のク
ラスタとして、同一の文字コードのものについて順次読
み出し、そのクラスタ相互間の距離を計算する。このク
ラスタ間距離の計算は、上述の文字認識用特徴間の距離
Dの計算と同様に式(数1)を用いて行われる。各クラ
スタ間の距離を計算すると、最小のクラスタ間距離が
「クラスタの大きさ」以下であるか否かを判定し、以下
であればその最小のクラスタ間距離にある2つのクラス
タを近接クラスタとして1つのクラスタに統合する。こ
の際、統合されたクラスタと他のクラスタとのクラスタ
間距離は、統合前のクラスタ間距離の最大値をクラスタ
間距離とする。
【0050】最小のクラスタ間距離が「クラスタの大き
さ」を超えた時点で、クラスタの統合処理を終了する。
従って、同一文字コードの特徴間距離の最大値が「クラ
スタの大きさ」を超えない文字では、全特徴が単一のク
ラスタに統合される。一方、同一文字コードの特徴間距
離の最大値が「クラスタの大きさ」を超える文字では、
2以上のクラスタに分けられる。一つの文字について、
クラスタの統合処理が終了すると、同一のクラスタに分
類した各文字認識用特徴をクラスタごとにクラスタの所
属特徴としてクラスタデータベース106に記憶させ
る。この際、同一のクラスタに属する各文字認識用特徴
の数も記憶させる。
【0051】更にクラスタリング部105は、学習特徴
データベース104から、他の文字についてもその文字
認識用特徴を順次読み出し、クラスタリング処理をす
る。学習特徴データベース104に記憶されている全て
の文字コードについて処理を終了すると、全クラスタ数
をクラスタデータの先頭に記憶させ、大分類用辞書作成
部107を起動する。
【0052】なお、本実施例では、クラスタリングの手
法のうち最大距離法を用いて文字認識用特徴の文字ごと
の階層構造を分析したけれども、ウォード法等他の手法
を用いてもよい。また、文字認識用特徴間の距離および
クラスタ間の距離の計算に市街地距離を用いたけれど
も、式
【0053】
【数2】
【0054】のユークリッド距離を用いてもよい。クラ
スタデータベース106は、磁気ディスク等からなり、
図15に示すようなデータ構造のクラスタデータ150
1を記憶している。クラスタデータ1501は、クラス
タ数1502と、クラスタに属するデータの特徴数15
03と、特徴数の数だけのクラスタの所属特徴(図15
では、クラスタ1の特徴1)1504等とを有する。ク
ラスタの所属特徴1504のデータ内容は、図10〜図
13に示した文字認識用特徴と同一である。
【0055】大分類用辞書作成部107は、クラスタリ
ング部によって起動されると、クラスタデータベース1
06に記憶されているクラスタデータ1501を読み出
し、各クラスタの所属特徴1504の特徴要素ごとの平
均値を計算し、クラスタの平均特徴とする。このクラス
タの平均特徴は、クラスタデータ1501のクラスタ数
1502と同一の数になる。
【0056】また、クラスタの所属特徴1504中の文
字コードと、その文字コードより判別される字種(数
字、英大文字、英小文字、平仮名、片仮名、漢字等の
別)を示すフラグ、文字の大きさを示す文字サイズフラ
グ等の認識時に使用する属性フラグ、識別子等の付加情
報とを求めたクラスタの平均特徴とを組にして大分類用
辞書108に登録する。登録が終わると、クラスタ間距
離計算部109を起動する。
【0057】また、大分類用辞書作成部107は、属性
フラグおよび付加情報を入力するためのキーボード等
と、文字コード等を表示するCRT等を有する。大分類
用辞書108に登録するに際し、CRTに表示された文
字コードを見たオペレータによって、例えば漢字のうち
の人名漢字であり、文字の大きさが普通であり、文字位
置が下付きである等の属性フラグおよび識別子等の付加
情報の入力を受け付ける。
【0058】大分類用辞書108は、磁気ディスク等か
らなり、図16に示すようなデータ構造を有する。図1
7にその一例を示すように、クラスタ番号1701と識
別子1702と文字コード1703と属性フラグ170
4と平均特徴1705とからなる辞書データ1706を
多数登録している。図17は、その識別子1702に示
すように文字「中」を表すものである。同様に文字
「徳」を表す2つのクラスタが図18と図19とに、文
字「穂」を表す2つのクラスタが図20と図21とに示
されている。したがって、文字「中」は1つのクラスタ
に統合されているけれども文字「徳」や「穂」は2つの
クラスタに分割されている。
【0059】クラスタ間距離計算部109は、大分類用
辞書作成部107によって起動されると、大分類用辞書
108に記憶されている辞書データ1706等を読み出
し、全クラスタの平均特徴1705等相互間の距離を式
(数1)を用いて計算する。文字コードの異なる2クラ
スタ間の距離が、先に決定した「クラスタの大きさ」未
満である場合には、それらのクラスタ番号を組にして詳
細識別用辞書作成部110に通知する。
【0060】詳細識別用辞書作成部110は、クラスタ
間距離計算部109からクラスタ番号の組の通知を受け
ると、それらの平均特徴1705等を大分類辞書108
から読み出し、各要素ごとのクラスタ平均特徴間の差を
式|Fik−Fjk|(||絶対値記号)を用いて計算す
る。ここでFikは、クラスタiの平均特徴の要素kを表
し、Fjkはクラスタjの平均特徴の要素kを表す。平均
特徴要素数をNとしているので、1≦k≦Nであり、本
実施例ではNは97である。求めた各要素ごとのクラス
タ平均特徴間の差を特徴要素の識別子(kの値)を用い
て、差の大きいものから順番に記憶する。
【0061】次に、クラスタ間距離計算部から通知され
ている2つのクラスタ番号のクラスタデータベース10
6に記憶されているクラスタの所属特徴1504につい
て、記憶している特徴要素の識別子の先頭からn番目ま
での特徴要素のみを用いて、大分類辞書108の両クラ
スタの平均特徴1705との距離を計算し、その距離の
小さい方のクラスタに分類されるとしたとき、2つのク
ラスタに属する各クラスタの所属特徴が正しいクラスタ
に分類される割合r(n)をnを1≦n≦Nに変化して
調べる。
【0062】このr(n)が最大になるnを求めて、そ
のnの値と記憶している特徴要素のn番目までのkの値
を両クラスタ番号とともに詳細識別用辞書に登録する。
なお、本実施例では、両クラスタに属する特徴を識別す
る能力の評価尺度として、クラスタ平均特徴間の差を用
いたけれども、両クラスタに属する特徴の要素ごとの標
準偏差等を用いてもよい。
【0063】また、本実施例では、詳細識別に用いる特
徴要素は、クラスタデータベース106に記憶されてい
るクラスタデータ1501を基に、正しいクラスタに分
類される割合r(n)が最大になるnを2つのクラスタ
ごとに求めたけれども、予め特徴要素の数を定めておい
てもよい。クラスタ間距離計算部109から通知された
全てのクラスタ番号の組について、詳細識別用辞書の作
成が終了すると、棄却処理用辞書作成部112を起動す
る。
【0064】詳細識別用辞書111は、磁気ディスク等
からなり、図22に示すようなデータ構造を有する。そ
の具体的内容の一例を図23に示す。図23は、クラス
タ番号2720の文字「徳」とクラスタ番号3177の
文字「穂」とを認識する能力の高い使用特徴番号(k)
が「5、52、2、26」の4つであることを示してい
る。
【0065】棄却処理用辞書作成部112は、詳細識別
用辞書作成部110によって起動されると、クラスタデ
ータベース106から各クラスタに属する特徴の所定の
特徴要素の最大値と最小値とを求め、棄却処理用辞書1
13に、クラスタごとに用いた要素ごとの最大値と最小
値とを登録する。なお、本実施例では、所定の所属特徴
要素を縦横比としているけれども、この特徴要素の数m
は、1≦m≦Nの任意とすることができる。
【0066】棄却処理用辞書113は、磁気ディスク等
からなり、図24にその一部を示すようなデータ内容を
登録している。図24の第1行目2301は、61番目
のクラスタの縦横比の最小値が15であり、最大値が2
4であることを示している。次に本実施例の動作を図2
5、図26に示すフローチャートを用いて説明する。な
お、両図は本来1葉であるべきであるけれども、図面作
成上の都合から2葉に分割されている。
【0067】画像入力部101は、オペレータからの文
字コードの入力を待ち(S2502)、学習用文字画像
の入力を受付(S2504)、2値画像データに変換し
て文字コードとともに学習用文字画像データベース10
2に記憶させる(S2506)。更に学習用文字画像の
入力が有ればS2504に戻り、無ければ(S250
8)、文字コードの入力の有無を判断し(S251
0)、入力が有ればS2504に戻る。
【0068】入力が無ければ、特徴抽出部103は、2
値画像データから領域別方向密度を計算し(S251
2)、領域別背景密度を計算し(S2514)、更に縦
横比を計算し(S2516)、これらを文字認識用特徴
として文字コードとともに学習特徴データベース104
に記憶させる(S2518)。学習用文字画像データベ
ース102に未処理文字があるか否かを判定し(S25
20)、あるときはS2512に戻る。
【0069】ないときは、クラスタリング部105は、
学習特徴データベース104から同一文字コードの文字
特徴を順次読み出し、所定の計算式によって特徴間の距
離を計算する(S2524)。計算した特徴間距離のう
ち最大距離を選択してバッファに記憶する(S252
6)。全ての文字コードについてS2522〜S252
6を繰り返し(S2528)、バッファに記憶された最
大距離のうちの最小値を選択して「クラスタの大きさ」
を決定する(S2602)。
【0070】次にクラスタリング部105は、学習特徴
データベース104に記憶されている同一文字コードの
各文字認識用特徴を1クラスタとして読み出し(S26
04)、クラスタ間距離を計算する(S2606)。こ
のクラスタ間距離がS2602で決定した「クラスタの
大きさ」以下である近接クラスタがあるか否かを判定し
(S2608)、近接クラスタがあるときは、両クラス
タを統合して(S2610)、S2608に戻る。近接
クラスタがないときは、クラスタに分割してクラスタデ
ータとしてクラスタデータベース106に記憶させ(S
2612)、学習特徴データベース104に記憶されて
いる全ての文字コードの処理が終了するまでS2604
からS2612を繰り返す(S2614)。
【0071】大分類用辞書作成部107は、クラスタデ
ータベース106に記憶されているクラスタデータをク
ラスタごとに平均特徴を計算し、大分類用辞書108に
登録して辞書を作成する(S2616)。クラスタ間距
離計算部109は、大分類辞書108に登録されている
クラスタの平均特徴を読み出し、クラスタ間距離を計算
する(S2618)。詳細識別用辞書作成部110は、
異なる文字(文字コードの異なる)でクラスタ間距離計
算部109で計算されたクラスタ間距離がS2602で
決定された「クラスタの大きさ」よりも近いクラスタ
(近接クラスタ)があるか否かを判断する(S262
0)。近接クラスタがあるときには、近接2クラスタを
識別する能力の高い順に平均特徴の特徴要素を順序づけ
る(S2622)。詳細識別に使用する特徴数を決定
し、その平均特徴要素を識別できるように詳細識別用辞
書111にデータを登録し(S2626)、S2620
に戻る。
【0072】S2620で近接クラスタがないときに
は、棄却処理用辞書作成部112は、特徴要素の許容範
囲に基づいて、棄却処理用辞書113を作成する。 (第2実施例)図27は、本発明に係る文字認識装置の
一実施例の構成図である。この文字認識装置は、画像入
力部2701と、文字行検出部2702と、文字検出部
2703と、特徴検出部2704と、大分類部2705
と、詳細認識部2706と、認識結果棄却部2707
と、棄却文字連結部2708と、文字数推定部2709
と、連結文字分割部2710と、認識結果選択部271
1と、行認識結果評価部2712と、認識結果出力部2
713と、大分類用辞書108と、詳細識別用辞書11
1と、棄却処理用辞書113とを備える。
【0073】画像入力部2701は、スキャナ等の光学
読取装置からなり、認識対象文書画像2714の入力を
受け付けると、2値画像データに変換して文字行検出部
2702、文字検出部2703特徴抽出部2704に通
知する。文字行検出部2702は、画像入力部2701
から通知された2値画像データから文字行2801の座
標を検出すると、その座標を文字検出部2703に通知
する。また、認識結果出力部2731によって起動され
ると、通知された1値画像データに残された文字行28
02等が有るか否かを判断し、あるときには文字行28
02等の座標を検出し、それを文字検出部2703に通
知し、ないときには処理を停止する。
【0074】文字検出部2703は、文字行検出部27
02から各文字列2801、2802の座標の通知を受
けると、文字行中の個々の文字2803、2804の座
標を検出し、その座標を特徴抽出部2704に通知す
る。特徴抽出部2704は、上記第1実施例の特徴抽出
部103とほぼ同様の構成を有し、文字検出部2703
又は後述する連結文字分割部2710から座標の通知を
受けると、座標で特定される画像入力部2701から通
知された2値画像データを基に文字認識で使用する特徴
を抽出する。上記第1実施例で説明したと同様に領域別
輪郭方向密度特徴と領域別背景密度特徴と縦横比特徴と
を抽出し、予め定めた順序に整列し、文字認識用特徴と
して座標とともに大分類部2705に通知する。
【0075】大分類部2705は、特徴抽出部2704
から文字認識用特徴の通知を受けると、上記第1実施例
と同様の大分類用辞書108中の各クラスタ平均特徴と
の距離(市街地距離D)を式(数1)を用いて計算し、
得られたDを用いて類似度Rを式R=C/Dを用いて計
算する。類似度Rの高い(距離Dの近い)複数のクラス
タを候補クラスタとして選出し、候補クラスタとその類
似度とを組にして座標とともに詳細識別部2706に通
知する。
【0076】ここで、定数Cは、Rが1〜100になる
ように選ばれる。例えば、文書画像2714が画像入力
部2701から入力された場合は、文字行2801の候
補クラスタとその類似度とを図29に示すように選出す
る。なお、通常距離計算は大分類辞書108中の全クラ
スタ特徴について行うが、字種(下付き文字、漢字等)
が予め限定できる場合には、属性フラグをチェックし、
該当するクラスタのみに対し距離計算をすることもでき
る。
【0077】ここで、入力文字は、「中内里穂」である
けれども、第1候補クラスタだけを見れば「中内里徳」
となっている。詳細識別部2706は、大分類部270
5から候補クラスタ等の通知を受けると、通知された候
補クラスタ番号が上記第1実施例と同様の詳細識別用辞
書111中に登録されている近接するクラスタの組をな
す2クラスタが、大分類部2705から通知された複数
の候補クラスタ中にともに含まれているか否かを判断す
る。含まれていないときは認識結果棄却部2707に座
標とともに候補クラスタを通知する。含まれているとき
は、詳細識別用辞書111中に登録されている近接クラ
スタ識別に用いる特徴要素のみを用いて両候補クラスタ
に対して式(数1)によって距離Dを計算し、低順位の
クラスタの方が距離Dの値が小さいときは、低順位のク
ラスタの類似度を引き上げる。併せて、認識結果棄却部
2707に変更後の候補クラスタと座標とを通知する。
【0078】即ち、図29の大分類部2705の通知結
果では、第1候補クラスタ(文字”徳”,クラスタ番号
2720)と第2候補クラスタ(文字”穂”,クラスタ
番号3177)とが、詳細識別用辞書111中に登録の
ある近接クラスタである。そこで、詳細識別部2706
は、詳細識別用辞書111に登録された両クラスタ識別
に用いる特徴要素に関して文字2805の2値画像デー
タの文字認識用特徴とクラスタ2720、および文字2
805の2値画像データの文字認識用特徴とクラスタ3
177との距離(前者をD(2720)、後者をD(3
177)とする)を求める。得られた2距離を比較し、
D(2720)≦D(3177)のときには何もしない
が、D(2720)≧D(3177)のときには、所定
の操作により低順位のクラスタ3177の類似度を引き
上げる。
【0079】引き上げ操作の最も単純なものは、クラス
タ2720の類似度との値の交換である。引き上げ操作
前の両クラスタに対する類似度をそれぞれR(272
0)、R(3177)、引き上げ操作後の両クラスタに
対する類似度をそれぞれR’(2720)、R’(31
77)と表すと、 R’(2720)=R(3177) R’(3177)=R(2720) となる。この場合、第1位と第2位で類似度が逆転する
ので、候補順位も逆転することになる。
【0080】これによって、候補クラスタは、図30に
示すようになる。なお、他の類似度の引上げ操作として
は、所定の計算式によりD(2720)、D(317
7)から類似度の引上げ幅△Rを計算し、 R’(2720)=R(2720) R’(3177)=R(3177)+△Rとする。
【0081】△Rの計算式は、例えば、次式のような計
算式である。 D(3177)<0.5*D(2720)のとき △R=R(2720)−R(3177)となる。 0.5*D(2720)≦D(3177)<D(272
0)のとき △R=2(R(2720)−R(3177)) *(1−D(3177)/D(2720))となる。
【0082】この場合、第1位と第2位の類似度は逆転
しないので、候補順位も逆転しない。第1位と第2位の
類似度が一致した場合には、認識結果出力後、後処理で
いずれかに判断する。認識結果棄却部2707は、詳細
識別部2706から候補クラスタと座標との通知を受け
ると、詳細識別部46での詳細識別処理の結果得られた
最も類似度の高い候補クラスタ(第1候補クラスタ)3
001に対して、以下のような評価条件で認識結果の有
意性を評価する。
【0083】1.第1候補クラスタ3001に対する類
似度3002が、所定の値以上である。 2.特徴抽出部2704により得られた文字認識用特徴
中の予め定めた一部の特徴要素(棄却特徴)の値が、す
べてあるいは予め定めた個数以上、上記第1実施例と同
様の棄却用辞書113中の第1候補クラスタ3001の
特徴要素の値の範囲に含まれている。
【0084】以上2条件を満たすとき、文字画像271
4の詳細識別結果は有意であると判断し、行認識結果評
価部2712に認識結果を通知する。また、以上の2条
件を満たさないとき、即ち認識結果が有意でないと判断
したときは、棄却文字連結部2708に棄却された文字
の座標を通知する。なお、認識結果の第1候補クラスタ
が括弧記号(”(”または”)”)の場合には、認識結
果が有意であると判断されても、掠れ文字2806を認
識した可能性があるため、棄却された文字と同様に扱
い、棄却文字連結部2708に座標を通知する。
【0085】なお、本実施例では、棄却特徴数は1で縦
横比特徴のみを用いるが、他の特徴を合わせ用いても構
わない。また、認識結果棄却部2707は、通知された
座標が既に通知されている座標と重なるものであるとき
は、後に通知された第1候補クラスタの上述の評価条件
のもとでの認識結果の有意性を判断して認識結果選択部
2711に通知する。
【0086】棄却文字連結部2708は、認識結果棄却
部2707によって座標を通知されると、詳細識別部4
6での詳細識別の処理の結果得られた第1候補クラスタ
が括弧記号および認識結果棄却部2707で認識結果が
有意でないと判定された棄却文字が近接して連続する場
合には連続する括弧記号および棄却文字の座標を連結
し、文字数推定部2709を起動する。
【0087】文字数推定部2709は、棄却文字連結部
2708によって起動されると、認識結果棄却部270
7で棄却された棄却文字の前の括弧記号又は前後の他の
棄却文字が存しない単独棄却文字及び棄却文字連結部粒
2708で複数の棄却文字(括弧記号と棄却文字とを含
む)を連結した連結棄却文字の座標から文字数を推定す
る。推定した文字数と座標とを連結文字分割部2710
に通知する。
【0088】ここで、文字数の推定は、分割対象領域の
幅を標準文字幅で割って求められる。一例として、標準
文字幅は、認識結果棄却部2707で認識結果が棄却さ
れなかった文字の文字幅の平均値とする。認識結果選択
部2711は、認識結果棄却部2707から認識結果が
有意であるとの通知を受けると、認識結果棄却部270
7が先に通知された詳細識別結果を破棄して後に通知さ
れた詳細識別結果を採用して行認識結果評価部2712
に通知する。認識結果棄却部2707から認識結果が有
意でないとの通知を受けると、後に通知された詳細識別
結果を破棄して先に通知された候補クラスタを採用して
行認識結果評価部2712に通知する。
【0089】行認識結果評価部2712には、認識結果
棄却部2707又は認識結果選択部2711から1行中
の全文字の認識結果の通知を受けると、そのクラスタ番
号を検索キーとして大分類辞書108を検索し、認識結
果の第1候補クラスタの”;”、”:”、”
・”、”,”等の破片文字の数を数える。一行内の文字
数に対して破片文字の数が所定の割合を越えていると判
断したときは、認識した行は文字行でないとして行全体
の認識結果を破棄する。所定の割合以下と判断したとき
は、認識結果を認識結果出力部2713に通知する。
【0090】認識結果主力部2713は、行認識結果評
価部2712から通知された認識結果を出力する。この
認識結果には、詳細識別部2706で得られた類似度の
高い一つまたは複数の候補クラスタに対応する文字コー
ドとそれに対応する類似度とを含む。次に、本実施例の
動作を、図31に示すフローチャートを用いて説明す
る。
【0091】先ず、ユーザが認識対象の文字画像271
4を画像入力部2701に入力すると、画像入力部27
01は、文字画像2714を2値画像データに変換し、
文字抽出部2701と文字検出部2703と特徴抽出部
2704とにそのデータを通知する(S3102)。文
字行検出部2702は、一行の2値画像データの座標を
検出する(S2702)。文字検出部2703は、その
行内の文字座標を検出する(S3106)。特徴抽出部
2704は、文字検出部2703から通知された座標で
特定される2値画像データから文字認識用の特徴を1行
分抽出する(S3108)。
【0092】大分類部2705は、特徴抽出部で抽出さ
れた1行分の文字を順次、大分類用辞書108を参照し
てそのクラスタ平均特徴との距離を計算し、得られた距
離から類似度を計算し、類似度の高い候補クラスタを選
出する(S3110)。詳細識別部2706は、詳細識
別用辞書111中に登録されている近接クラスタの組を
なす2クラスタが、大分類部2705で選出された複数
の候補クラスタ中にともに含まれているときには、詳細
識別用辞書111に登録された両クラスタの識別に用い
る特徴要素に関してクラスタ平均特徴との距離を計算
し、順位の低いクラスタ候補のその距離の方が順位の高
いクラスタ候補よりも小さいときには、その類似度を入
れ替える。この処理を1行の全文字に対して行う(S3
112)。
【0093】このように文字の特徴的部分を利用して誤
認識し易い近接クラスタを識別することができる。認識
結果棄却部2707は、所定の特徴要素それぞれの値が
棄却処理用辞書113の第1候補クラスタの値の範囲内
であり、かつ、第1候補クラスタの類似度が所定の値以
上であるときに、詳細識別部2706で認識された候補
クラスタが有意であると判定し、いずれかの条件を満足
しないときに有意でないと判定する(S3114)。
【0094】認識結果棄却部2707において、棄却文
字または棄却文字ではないが第1候補クラスタが括弧記
号で有るか否かを判断される(S3116)。棄却文字
または第1候補クラスタが括弧記号の場合には、棄却文
字連結部2708で棄却文字が連結され(S311
8)、文字数推定部2709は、その連結された棄却文
字の領域の文字数を計算で求める(S3120)。連結
文字分割部2710は、求めた文字数から文字の座標を
求める(S3122)。特徴抽出部2704は、求めら
れた座標で特定される2値画像データから文字認識用特
徴を抽出し(S3124)、大分類部2705は、抽出
した文字認識用特徴と大分類用辞書108のクラスタ平
均特徴との距離Dを計算し、距離Dから類似度を求め、
候補クラスタを選出する(S3126)。
【0095】詳細識別部2706は、詳細識別用辞書1
11中に登録されている近接するクラスタの組をなす2
クラスタが、大分類部2705で選出された複数の候補
クラスタ中にともに含まれているときには、登録されて
いる所定の特徴に関してクラスタ平均特徴との距離を求
め、その距離が候補クラスタの順位の低い方が近いとき
には、その類似度を変更し、その順位を入れ替える(S
3128)。再度認識結果棄却部2707は、棄却処理
用辞書を参照して、第1候補クラスタが有意であるか否
かを判定する(S3130)。認識結果選択部2711
は、棄却文字連結・分割処理後の認識結果が棄却されな
かったときには、棄却文字連結・分割処理後の認識結果
を選択し、棄却文字連結・分割処理後の認識結果が棄却
されたときには、元の認識結果を選択する(S313
2)。1行中の全文字の認識が終了していなければ(S
3134)、S3116に戻る。S3116において、
括弧記号又は棄却文字がないときにはS3134に移
る。
【0096】S3134で、1行中の全文字の認識が終
了しているときは、行認識結果評価部2712は、1行
中の文字に破片文字等が所定の割合以上含まれているか
否かを判断する(S3136)。認識結果出力部271
3は、1行文の認識結果を出力し(S3138)、入力
された文書画像の全行終了していれば処理を終了し(S
3140)、終了していなければ3106に戻る。
【0097】なお、本実施例では、横書き文書を例にし
たけれども、縦と横、幅と高さを置き換えることによっ
て、縦書き文書にも適用可能なのは勿論である。連結文
字分割部2710は、文字数推定部2709から通知さ
れた文字数と座標とに基づいて、単独棄却文字あるい連
結文字中の文字座標を左端の文字から順次求める。求め
た文字座標を順次特徴抽出部2704に通知する。この
文字座標は、分割対象領域の幅を推定文字数割った均等
分割位置で分割して求める。なお、均等分割位置を中心
に、所定の幅の範囲で縦方向の黒画素の射影を求め、射
影の跡切位置で分割して求めることもできる。
【0098】以上、本発明を実施例に基づいて説明した
けれども、本発明は上記実施例に限定されないのは勿論
である。
【0099】
【0100】
【0101】
【発明の効果】 以上説明してきたように、 請求項の発
明によれば、詳細識別手段が、近接クラスタを識別する
能力の高い、文字認識の基準となる部分特微を用いて入
力文字画像を認識するので、高認識率の文字認識装置を
得ることができ、文字でないと判断した掠れ文字や接触
文字を統合の後分離し再認識するので、更に高認識率と
なる文字認識装置となる。
【0102】また、請求項の発明によれば、クラスタ
数を適当な値にしているので、辞書容量の省資源化を図
ることができるとともに、認識対象の入力文字画像の特
微比較による計算時間を短縮することができる。
【0103】また、請求項の発明によれば、掠れ文字
が棄却されない場合にも、それらを連結して、再度、文
字認識をするので、更に認識率を高めることができる。
また、請求項の発明によれば、文字認識用の特微に、
文字画像の外接矩形から得られる縦横比を採用すること
によって、認識率をより高めることができる。また、請
求項の発明によれば、認識された1行分の文字が予め
定めた特殊な記号を所定の割合を超えて含むときに、そ
の行の認識結果が有意でないとして、誤った認識結果の
出力を防止することができる。
【図面の簡単な説明】
【図1】本発明に係る文字認識用辞書作成装置の一実施
例の構成図である。
【図2】上記実施例の学習用文字画像データベースに記
憶されている2値画像データの説明図である。
【図3】上記実施例の特徴抽出部の詳細構成図である。
【図4】上記実施例の特徴抽出部の説明のための2値画
像データの一例を示す図である。
【図5】上記実施例の特徴抽出部で用いる方向値の説明
図である。
【図6】上記実施例の特徴抽出部の方向値付与部で決定
された方向値を説明するための図である。
【図7】上記実施例の特徴抽出部での領域分割を説明す
るための図である。
【図8】上記実施例の特徴抽出部の背景値付与部で決定
された背景値を説明するための図である。
【図9】上記実施例の特徴抽出部の縦横比計算部で決定
された縦横比を説明するための図である。
【図10】上記実施例の学習特徴データベースの記憶内
容の一例を示す図である。
【図11】上記実施例の学習特徴データベースの記憶内
容の一例を示す図である。
【図12】上記実施例の学習特徴データベースの記憶内
容の一例を示す図である。
【図13】上記実施例の学習特徴データベースの記憶内
容の一例を示す図である。
【図14】上記実施例の学習特徴データベースの記憶内
容を説明するための図である。
【図15】上記実施例のクラスデータの構造の一例を示
す図である。
【図16】上記実施例の大分類用辞書の構造の一例を示
す図である。
【図17】上記実施例の大分類用辞書の辞書データの一
例を示す図である。
【図18】上記実施例の大分類用辞書の辞書データの一
例を示す図である。
【図19】上記実施例の大分類用辞書の辞書データの一
例を示す図である。
【図20】上記実施例の大分類用辞書の辞書データの一
例を示す図である。
【図21】上記実施例の大分類用辞書の辞書データの一
例を示す図である。
【図22】上記実施例の詳細識別用辞書のデータ構造を
示す図である。
【図23】上記実施例の詳細識別用辞書の内容の一例を
示す図である。
【図24】上記実施例の棄却処理用辞書の内容の一例を
示す図である。
【図25】上記実施例の動作を説明するフローチャート
である。
【図26】上記実施例の動作を説明するフローチャート
である。
【図27】本発明に係る文字認識装置の一実施例の構成
図である。
【図28】上記実施例の入力画像の一例を示す図であ
る。
【図29】上記実施例の大分類結果の一例を示す図であ
る。
【図30】上記実施例の詳細識別結果の一例を示す図で
ある。
【図31】上記実施例の動作を説明するフローチャート
である。
【図32】従来の特徴では識別の困難であった文字の例
である。
【符号の説明】
101 画像入力部 102 学習用画像データベース 103 特徴抽出部 104 学習特徴データベース 105 クラスタリング部 106 クラスタデータベース 107 大分類用辞書作成部 108 大分類用辞書 109 クラスタ間距離計算部 110 詳細識別用辞書作成部 111 詳細識別用辞書 112 棄却処理用辞書作成部 113 棄却処理用辞書 301 方向値付与部 302 領域別輪郭方向密度計算部 303 背景値付与部 304 領域別背景密度計算部 305 縦横比計算部 306 特徴統合部 2701 画像入力部 2702 文字行検出部 2703 文字検出部 2704 特徴抽出部 2705 大分類部 2706 詳細識別部 2707 認識結果棄却部 2708 棄却文字連結部 2709 文字数推定部 2710 連結文字分割部 2711 認識結果選択部 2712 行認識結果評価部 2713 認識結果出力部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI G06K 9/62 640 G06K 9/62 640A 650 650A 9/66 9/66 (72)発明者 江村 里志 大阪府門真市大字門真1006番地 松下電 器産業株式会社内 (56)参考文献 特開 平7−73276(JP,A) 特開 平8−272904(JP,A) 特開 平8−161431(JP,A) 特開 平6−180770(JP,A) 特開 昭61−188681(JP,A) 特開 平2−224084(JP,A) 特開 平3−185582(JP,A) 特開 平4−31979(JP,A) 特開 昭62−117090(JP,A) D−315 CoPSによる文書認識 (3),1992年電子情報通信学会秋季大 会講演論文集,日本,1992年 9月15 日,p.6−317 (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 認識対象の文字画像の入力を受け付けて
    2値画像データに変換する入力画像変換手段と、 前記入力画像変換手段で変換された2値画像データの文
    字行に対応する座標位置を検出する文字行座標位置検出
    手段と、 前記文字行座標位置検出手段の検出対象とされた文字行
    内の個々の文字に対応する座標位置を検出する文字座標
    位置検出手段と、 前記文字座標位置検出手段で検出された座標で特定され
    る2値画像からなる文字の認識に使用する特徴を抽出す
    る特徴抽出手段と、 基準となる文字の形状特徴を平均したクラスタ平均特徴
    とその文字コードを対応付けて所定の値の大きさのクラ
    スタに分類して登録している大分類用辞書と、 前記特徴抽出手段で抽出された特徴と上記クラスタ平均
    特徴との距離を計算し、得られた距離から類似度を計算
    し、類似度の高い複数のクラスタをクラスタ候補として
    選出する大分類手段と、 前記大分類用辞書に登録されているクラスタのうち、2
    つのクラスタ間の距離が所定の値より小さい近接クラス
    タの識別子と少なくとも1以上の両クラスタを識別する
    クラスタ平均特徴の要素とを対応付けて登録している詳
    細識別用辞書と、 前記詳細識別用辞書に登録されている近接クラスタの2
    つの識別子が、前記大分類手段で選出された複数の候補
    クラスタ中の識別子にともに含まれているときには、前
    記詳細識別用辞書に登録されている文字の認識に使用す
    る特徴の要素のみに関して、前記特徴抽出手段で抽出さ
    れた特徴とクラスタ平均特徴との第2の距離を計算し、
    該第2の距離の小さい方のクラスタの類似度を引き上げ
    る詳細識別手段と、 前記詳細識別手段で引き上げられた類似度を優先して、
    前記大分類手段で選出された候補クラスタに対応する文
    字コードを出力する出力手段とを備え、上記文字認識に用いる特徴のうち予め定めた特定要素の
    最小値と最大値とをクラスタの識別子に対応付けて登録
    している棄却処理用辞書と、 前記詳細識別手段で得られた類似度を優先して、前記大
    分類手段で選出した最 も類似度の高い候補クラスタの類
    似度が所定の値よりも大きく、かつ、前記棄却処理用辞
    書に登録されている特定要素の最小値と最大値との間に
    前記特徴抽出手段で抽出された文字認識用の特徴の値が
    あるときに認識結果が有意であると判定する認識結果判
    定手段と、 前記認識結果判定手段で認識結果が有意でないと判定さ
    れた候補クラスタを棄却文字とし、該棄却文字が連続す
    るとき、その連続する棄却文字を連結する棄却文字連結
    手段と、 前記認識結果判定手段で認識結果が有意でないと判定さ
    れた候補クラスタの前後に同様に判定された候補クラス
    タのない候補クラスタ又は前記棄却文字連結手段で連結
    した棄却文字の上記2値画像データ上の座標位置から文
    字数を推定する文字数推定手段と、 上記2値画像データ上の座標で示される領域を前記文字
    数推定手段で推定された文字数で分割して、新たな認識
    対象の文字の座標を求める連結文字分割手段と、 前記連結文字分割手段で求められた座標で特定される2
    値画像データの文字認識に使用する特徴を抽出する第2
    の特徴抽出手段と、 前記第2の特徴抽出手段で抽出された特徴と上記クラス
    タ平均特徴との距離を計算し、得られた距離から類似度
    を計算し、類似度の高い複数のクラスタをクラスタ候補
    として選出する第2の大分類手段と、 前記第2の大分類手段で選出された2つのクラスタ候補
    の識別子が前記詳細識別用辞書に登録されている識別子
    と一致するときは、前記詳細識別用辞書に登録されてい
    るクラスタ平均特徴の要素だけに関して、前記特徴抽出
    手段で抽出された特徴とクラスタ平均特徴との第2の距
    離を計算し、第2の距離の近いクラスタの類似度を引き
    上げる第2の詳細識別手段と、 前記第2の詳細識別手段で引き上げられた類似度を優先
    して、前記第2の大分類手段で選出された類似度の最も
    高い候補クラスタの類似度が所定の値よりも大きく、か
    つ、前記棄却処理用辞書に登録されている特定要素の最
    小値と最大値との間に前記特徴抽出手段で抽出された文
    字認識用の特徴の値があるときに認識結果が有意である
    と判定する第2の認識結果判定手段と、 前記第2の認識結果判定手段が有意であると判定したと
    き、前記詳細識別手段で得られた類似度を優先して大分
    類手段で選出した最も類似度の高い候補クラスタの認識
    結果を破棄し、前記第2の認識結果判定手段で認識結果
    が有意であると判定されたとき、当該認識結果を選択す
    る認識結果選択手段と、 前記認識結果選択手段で選択された認識結果に従い、候
    補クラスタに対応する文字コードを出力する認識結果出
    力手段とを備え ることを特徴とする文字認識装置。
  2. 【請求項2】 文字コードごとに入力を受け付けた多数
    の学習用文字画像を2値画像データに変換する入力画像
    変換手段と、 前記入力画像変換手段で変換された各2値画像データか
    ら文字認識に用いる特微を抽出する文字特微抽出手段
    と、 前記文字特微抽出手段で抽出された文字認識に用いる特
    微相互間の距離を文字コードごとに計算する距離計算手
    段と、 前記距離計算手段が計算した各文字コードごとの距離の
    最大値のうち最小のものを基に前記大分類用辞書及び詳
    細識別用辞書の所定の値として、決定する決定手段とを
    備えることを特徴とする請求項記載の文字認識装置。
  3. 【請求項3】 前記棄却文字連結手段は、 前記詳細識別手段での詳細識別の結果、類似度の最も高
    い候補クラスタが括弧記号の文字である場合に、該記号
    が連続するときは括弧記号を連結する括弧連結部と、 前記認識結果判定手段で認識結果が有意でないと判定さ
    れた棄却文字と上記括弧記号とが連続するときは、棄却
    文字と括弧記号とを連結する棄却括弧連結部とを備える
    ことを特徴とする請求項記載の文字認識装置。
  4. 【請求項4】 前記特徴抽出手段は、 上記2値画像データの文字部分に対応する画素を囲む外
    接矩形を決定する外接矩形決定部と、 上記文字部分に対応する画素の境界画素ごとに隣接画素
    との位置関係で定まる方向値を決定し、上記外接矩形を
    行方向にL分割し、列方向にM分割した各領域におい
    て、その内部の各方向値ごとに画素数を計数し、該計数
    した画素数を各領域に含まれる画素数で除した領域別輪
    郭方向密度特徴を求める領域別輪郭方向密度計算部と、 上記外接矩形の各辺から対辺に向かって走査したとき、
    上記文字部分に対応しない画素から対応する画素に変化
    するごとに「1」を加えた背景値を決定し、上記外接矩
    形を行方向にP分割し、列方向にQ分割した各領域にお
    いて、その内部の背景値ごとの画素数を計数し、該計数
    した画素数を各領域の画素数で除した領域別背景密度特
    徴を求める領域別背景密度計算部と、 上記外接矩形からその縦横比を計算して縦横比特徴を求
    める縦横比計算部とを備えることを特徴とする請求項
    、請求項又は請求項記載の文字認識装置。
  5. 【請求項5】 前記認識結果判定手段の認識結果又は前
    記認識結果選択手段の選択結果に基づいて、任意の行中
    の認識された文字コード中の予め定めた特殊な記号に対
    応する文字コードの割合を計算する割合計算手段と、 前記割合計算手段で計算された割合が所定の割合を超え
    た場合に、その任意の行を有意な文字行でないと判断し
    て、前記出力手段にその旨出力を指示する行認識結果評
    価手段とを備えることを特徴とする請求項、請求項
    2、請求項3又は請求項記載の文字認識装置。
JP10662595A 1995-04-21 1995-04-28 文字認識装置 Expired - Lifetime JP3372005B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP10662595A JP3372005B2 (ja) 1995-04-28 1995-04-28 文字認識装置
US08/608,179 US5999647A (en) 1995-04-21 1996-02-28 Character extraction apparatus for extracting character data from a text image
US09/187,131 US6141443A (en) 1995-04-21 1998-11-05 Character extraction apparatus, dictionary production apparatus, and character recognition apparatus using both apparatuses
US09/186,943 US6064769A (en) 1995-04-21 1998-11-05 Character extraction apparatus, dictionary production apparatus and character recognition apparatus, using both apparatuses

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10662595A JP3372005B2 (ja) 1995-04-28 1995-04-28 文字認識装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2002300891A Division JP3790736B2 (ja) 2002-10-15 2002-10-15 文字認識用辞書作成装置及び文字認識装置

Publications (2)

Publication Number Publication Date
JPH08305804A JPH08305804A (ja) 1996-11-22
JP3372005B2 true JP3372005B2 (ja) 2003-01-27

Family

ID=14438300

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10662595A Expired - Lifetime JP3372005B2 (ja) 1995-04-21 1995-04-28 文字認識装置

Country Status (1)

Country Link
JP (1) JP3372005B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4661921B2 (ja) * 2008-08-26 2011-03-30 富士ゼロックス株式会社 文書処理装置およびプログラム
KR101214772B1 (ko) 2010-02-26 2012-12-21 삼성전자주식회사 문자의 방향성을 기반으로 한 문자 인식 장치 및 방법
GB2572386B (en) * 2018-03-28 2021-05-19 Canon Europa Nv An image processing system and an image processing method
CN113869314A (zh) * 2021-10-13 2021-12-31 广东金赋科技股份有限公司 一种文本方向聚类矫正的图像信息提取方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
D−315 CoPSによる文書認識(3),1992年電子情報通信学会秋季大会講演論文集,日本,1992年 9月15日,p.6−317

Also Published As

Publication number Publication date
JPH08305804A (ja) 1996-11-22

Similar Documents

Publication Publication Date Title
US6687401B2 (en) Pattern recognizing apparatus and method
US7519226B2 (en) Form search apparatus and method
USRE47889E1 (en) System and method for segmenting text lines in documents
Seni et al. External word segmentation of off-line handwritten text lines
Shi et al. Line separation for complex document images using fuzzy runlength
US6643401B1 (en) Apparatus and method for recognizing character
US8462394B2 (en) Document type classification for scanned bitmaps
US7233697B2 (en) Character recognition device and a method therefor
EP0649113A2 (en) Multifont optical character recognition using a box connectivity approach
JP2001283152A (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US20030012438A1 (en) Multiple size reductions for image segmentation
Lehal et al. Feature extraction and classification for OCR of Gurmukhi script
Pal et al. Automatic separation of machine-printed and hand-written text lines
JP4280355B2 (ja) 文字認識装置
JP3851742B2 (ja) 帳票処理方法及び装置
JP3388867B2 (ja) 宛名領域検出装置および宛名領域検出方法
JPH06501801A (ja) 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置
Srihari et al. A system to locate and recognize ZIP codes in handwritten addresses
US7072514B1 (en) Method of distinguishing handwritten and machine-printed images
US5703963A (en) Character recognition apparatus that subdivides a character into subregions to obtain feature vectors
JP3372005B2 (ja) 文字認識装置
JP3790736B2 (ja) 文字認識用辞書作成装置及び文字認識装置
JPH09319824A (ja) 帳票認識方法
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071122

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081122

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091122

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091122

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101122

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111122

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121122

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121122

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131122

Year of fee payment: 11

EXPY Cancellation because of completion of term