JPH05101220A

JPH05101220A - 文字認識装置

Info

Publication number: JPH05101220A
Application number: JP3260659A
Authority: JP
Inventors: Takeshi Furuto; 健古戸
Original assignee: Sumitomo Electric Industries Ltd
Current assignee: Sumitomo Electric Industries Ltd
Priority date: 1991-10-08
Filing date: 1991-10-08
Publication date: 1993-04-23

Abstract

(57)【要約】【目的】正確かつ高速な文字切出しを実現して文字認識
処理を高速化する。【構成】１行毎の画像の切出しが行われ（ステップｎ
２）、さらに画素の塊である文字要素毎の画像が切り出
される（ステップｎ３）。次に、文字要素の大きさから
推定された文字サイズに基づき、横幅が小さい文字要素
が半角候補文字として抽出される（ステップｎ６）。さ
らに、一定の条件を満たす半角候補文字列が英単語候補
として抽出される（ステップｎ７）。次いで、英単語候
補を構成する各半角候補文字に関して、画素特徴などが
抽出される（ステップｎ８）。この画素特徴などに基づ
き、半角英文字でない半角候補文字を含む英単語候補が
英単語候補から除外されて、英単語候補の修正が行われ
る（ステップｎ９）。そして、切出位置が半角文字と全
角文字とのそれぞれに応じて修正され（ステップｎ１
０）、文字認識処理が行われる（ステップｎ１１）。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、光学的文字読取装置
（ＯＣＲ）などのように、文書画像から１文字ずつの画
像を切り出し、この切り出した画像に基づいて文字や記
号の認識処理を行う文字認識装置に関するものである。

【０００２】

【従来の技術】光学的文字読取装置（ＯＣＲ）などの文
字認識装置では、文書画像に対応した画像データから、
１文字分ずつの画像を順に切り出し、切り出された画像
の特徴量と、認識用辞書に蓄積されている認識可能な各
文字の特徴量との比較演算を行うことで、文字の認識が
行われ、認識された文字に対応した文字コードが出力さ
れる。

【０００３】このような文字認識処理が正確に行われる
ためには、文書画像からの１文字ずつの文字切出しが良
好に行われることが不可欠である。この文字切出処理に
当たっては、まず文字サイズを検出することが必要とな
る。これは、たとえば「い」や「旧」などのように分離
した複数の要素から構成されている分離文字では、黒画
素の塊である文字要素毎に画像を切り出すと、正しい文
字切出処理が行えないからである。すなわち、予め文字
サイズを検出しておき、複数の文字要素からなる分離文
字に対しては、文字サイズに基づいて複数の文字要素を
再構成することにより文字切出処理を正確に行える。

【０００４】しかしながら、日本語の文書中に半角英数
字が存在する場合などには、一定の文字サイズを基に文
字の切出しを行うと、隣接する半角英数字の対が１文字
として再構成されて切り出されるおそれがある。このた
め、日本語と半角英数字とが混在している文書では、単
純にサイズの小さな文字要素同士を結合させてしまう
と、正確な文字切出処理を行うことができない。

【０００５】この不具合を解消するために、文字要素毎
の認識結果をフィードバックして、正しい切出位置を定
める方法が提案されている（たとえば信学論 '84/10 Vo
l.J67-D No.10 参照）。ところが、この方法では、全角
分離文字（横書きの文書では、行方向に関して白画素で
分離された複数の文字要素からなる文字。たとえば
「門」や「卵」などが該当する。）に関しても、各文字
要素毎に認識が行われるため、全体の文字認識回数が文
書の構成文字数に比較して増大してしまい、処理速度が
劣化するという問題が生じていた。

【０００６】すなわち、たとえば、図１６(a) および
(b) に示すような「門」や「卵」のような全角分離文字
に関しては、参照符号１１，１２で切出位置を示すよう
に、それぞれ２つずつの文字要素Ａ１，Ａ２；Ｂ１，Ｂ
２毎に切り出されるので、先ず各文字要素Ａ１，Ａ２；
Ｂ１，Ｂ２に対して認識処理が行われる。そして、この
認識処理が不可能であることに基づいて、文字要素Ａ
１，Ａ２またはＢ１，Ｂ２を結合させて参照符号１３，
１４で示す位置で切出しをやり直し、このようにして切
り出された文字要素の対に関してさらに文字認識処理を
行うことになる。したがって、本来２回の認識処理によ
り認識すべき２つの文字に対して６回の認識処理を要す
ることになる。

【０００７】そこで、特開昭６２−１３０４７９号公報
に開示されている他の先行技術では、推定文字ピッチを
基に判定された基準文字塊（全角文字に対応する。）に
挟まれた小さな文字要素の数に応じて処理を異ならせる
ことにより、処理速度の向上が図られている。すなわ
ち、小さな文字要素が所定数（たとえば４個）以上連続
するときには、各文字要素が１文字（半角文字）を構成
するものとして認識処理が行われる。そして、小さな文
字要素の連続数が所定数未満であるときには、分離文字
（全角分離文字）の可能性があるものとして、各文字要
素毎の認識処理を行うとともに、２個以上の文字要素の
結合に関しても認識処理を行わせるようにしている。こ
のような処理により、半角英数字が連続する場合には、
このような文字列については、文字要素の結合について
の認識処理が省かれるから、認識処理の回数を低減し
て、処理速度を向上することができる。

【０００８】この先行技術の新たな問題は、図１７に示
すように、分離文字が連続する場合に、分離文字の各文
字要素をそれぞれ半角文字であるものとして認識処理が
行われるために、認識処理のやり直しが必要となり、結
果的に却って処理速度が落ちてしまう場合があることで
ある。すなわち、図１７の場合のように、それぞれ文字
要素Ｃ１１，Ｃ１２；Ｃ２１，Ｃ２２；Ｃ３１，Ｃ３２
からなる分離文字Ｃ１，Ｃ２，Ｃ３が連続する場合に
は、小さな文字要素Ｃ１１，Ｃ１２，Ｃ２１，Ｃ２２，
Ｃ３１，Ｃ３２が６個連続しているから、これらの文字
要素に対しては、文字要素相互間の結合は行われず、先
ず、半角文字であるものとして認識処理が行われること
になる。そして、この半角文字としての認識が不可能で
あると判った時点で、初めて、隣接する文字要素間の再
結合が行われる。なお、図１７において、１５は行方向
の切出位置を示す。

【０００９】上記の不具合を解決するためには、半角文
字と分離文字を構成する小さな文字要素とを、認識処理
を行うことなく区別する必要がある。これを実現した先
行技術は、たとえば特開平２−２３９３８６号公報に開
示されている。この先行技術では、認識処理を行う前
に、文字要素の行内における相対的な位置関係や文字要
素の大きさを基にして、当該文字要素が半角文字を構成
しているのか、分離文字の一部であるのかを判断するよ
うにしている。

【００１０】

【発明が解決しようとする課題】ところが、この先行技
術は、文字要素の位置関係やレイアウトに関する規則を
用いて文字要素の判別を行っているため、文字の切出し
の正確さが文書フォーマットの影響を受け易いという新
たな問題を生じさせる。そこで、本発明の目的は、上述
の技術的課題を解決し、文書フォーマットの影響を受け
ることなく、日本語文書中に半角英文字が混在している
文書画像からの文字の切出しを正確に、かつ、高速に行
うことができ、したがって、文字認識処理の高速化に寄
与することができる文字認識装置を提供することであ
る。

【００１１】

【課題を解決するための手段および作用】上記の目的を
達成するための請求項１記載の文字認識装置は、日本語
文字および英文字が混在している文書画像の各文字を認
識し、文字コードに変換して出力する文字認識装置であ
って、入力画像の行方向の周辺分布をとり、１行ずつの
画像を切り出す行切出手段と、この行切出手段により切
り出された１行毎の画像について、行方向に垂直な方向
に関する周辺分布をとり、文字を構成する画素の塊であ
る文字要素毎の画像を切り出す仮切出手段と、切り出さ
れた文字要素の大きさに基づいて日本語文字の大きさで
ある文字サイズを推定する文字サイズ推定手段と、この
文字サイズ推定手段により推定された文字サイズに基づ
いて、横幅が文字サイズの一定割合よりも小さな文字要
素を半角候補文字として抽出する半角候補文字抽出手段
と、所定数以上の半角候補文字が連続し、かつ、この半
角候補文字列の前または後ろに所定長以上の余白部分が
存在するときに、当該半角候補文字列を英単語候補とし
て抽出する英単語候補抽出手段と、英単語候補を構成す
る各半角候補文字の行内での位置特徴、および当該半角
候補文字の構成画素の分布状態に対応した画素特徴を抽
出する画素特徴抽出手段と、半角英文字に関して、上記
位置特徴および画素特徴についての標準条件を記憶した
画素特徴記憶手段と、上記画素特徴抽出手段により抽出
された上記位置特徴および画素特徴と、上記特徴記憶手
段に記憶された標準条件とを照合して、位置特徴および
画素特徴が上記標準条件に合致しないときに、当該半角
候補文字を含む英単語候補を英単語候補から除外する英
単語候補修正手段と、英単語候補を構成する半角候補文
字は半角英文字であるものとして文字画像の切出しを行
い、残余の半角候補文字は日本語文字の一部を成すもの
として近傍の半角候補文字と再結合させて文字画像の切
出しを行う文字切出手段と、この文字切出手段により切
り出された画像に基づいて文字認識を行い、対応する文
字コードを出力する認識手段とを含むものである。

【００１２】上記の構成によれば、行切出手段により切
り出された１行の文書画像から、文字を構成する画素の
塊である文字要素が仮切出手段によって切り出され、こ
の切り出された文字要素の大きさに基づいて当該文書画
像を構成する日本語文字の大きさである文字サイズが、
文字サイズ推定手段によって推定される。そして、推定
された文字サイズに基づいて、半角候補文字抽出手段で
は、横幅が文字サイズの一定割合よりも小さな文字要素
である半角候補文字が抽出される。さらに、この半角候
補文字が所定数以上連続し、かつ、この所定数以上の一
連の半角候補文字からなる半角候補文字列の前または後
ろに所定長以上の余白部分が存在するときに、半角候補
文字列が英単語候補として抽出される。

【００１３】すわなち、日本語文書中に存在する半角英
文字は、一般に、単語を形成しており、しかも、前後に
余白が設けられている場合が多い。英単語候補文字抽出
手段での英単語候補文字の抽出は、日本語文書中の半角
英文字の上記のような特徴を利用したものである。英単
語候補が抽出されると、この英単語候補を構成する半角
候補文字に関して、行内での位置特徴と、当該半角候補
文字の構成画素の分布特徴に対応した画素特徴が抽出さ
れる。一方、位置特徴および画素特徴についての標準条
件は、画素特徴記憶手段に記憶されており、英単語候補
修正手段は、画素特徴抽出手段により抽出された位置特
徴および画素特徴を上記の標準条件と照合し、この標準
条件に合致しない半角候補文字を含む英単語候補を英単
語候補から除外する。

【００１４】すなわち、英単語候補抽出手段での英単語
候補抽出処理は、文書画像のフォーマットの影響を受け
やすいため、必ずしも確実に英単語候補を抽出できると
は限らない。そこで、個々の半角候補文字の位置特徴お
よび画素特徴に基づいて各半角候補文字が英文字である
可能性を調べ、いずれか１つでも英文字ないものと判断
される半角候補文字を含む英単語候補を英単語候補から
除外することとしている。このようにして、英単語候補
を正確に抽出することが可能となる。

【００１５】このように、英単語候補を構成する半角候
補文字の画素特徴を参照して英単語候補の修正を行うこ
ととしている結果、種々のフォーマットの文書に良好に
対応して、英単語候補を確実に抽出できる。これにによ
り、文書フォーマットに依らずに良好に切出処理を行わ
せて、文字認識処理を良好に行わせることができる。文
字切出手段では、英単語候補を構成する半角候補文字は
半角英文字であるものとして文字画像の切出しが行わ
れ、それ以外の半角候補文字は、日本語文字の一部をな
すものであるとして近傍の半角候補文字と再結合されて
切り出される。これにより、半角英文字は確実に半角文
字として切り出すことができ、また左右に分離している
全角分離文字については、再結合を行わせて切り出させ
ることができる。

【００１６】この結果、全角分離文字が半角文字として
切り出されて認識処理が行われたり、半角英文字が全角
文字として切り出されて認識処理が行われたりすること
を有効に防ぐことができるから、文字認識処理の回数を
低減して、処理の高速化に寄与することができる。な
お、上記画素特徴には、半角候補文字を行方向の中心位
置で行方向に垂直な方向に走査したときに、白画素→黒
画素→白画素のように変化する変化点の数、または黒画
素→白画素→黒画素のように変化する変化点の数が含ま
れていてもよい。

【００１７】請求項３記載の文字認識装置は、上記認識
手段は、認識可能な全ての文字の特徴量を記憶した認識
用辞書と、上記切り出された文字画像から特徴量を抽出
する特徴量抽出手段と、この特徴量抽出手段により抽出
された特徴量と上記認識用辞書に記憶されている各文字
の特徴量との類似度を算出する類似度算出手段と、この
類似度算出手段により算出された類似度が最大である文
字の文字コードおよびその類似度を出力する手段とを含
むものであり、上記出力された類似度が所定値未満であ
るときには、当該文字要素について上記文字切出手段に
よる文字画像の切出しとは異なる態様で文字画像の切出
しを再度行う再切出手段をさらに含むことを特徴とす
る。

【００１８】この構成では、文字コードとともに出力さ
れる類似度が所定値未満であるときには、そのような文
字要素については再切出手段によって、文字画像の切出
しが再度行われる。すなわち、半角文字として切り出し
て認識したが類似度が低い場合には、近傍の半角候補文
字と再結合させて再切出しが行われ、また全角文字とし
て切り出して認識したが類似度が低い場合には、半角文
字として切出しが再度行われる。これにより、認識誤り
を低減して、確実な文字認識を行うことができる。

【００１９】

【実施例】以下実施例を示す添付図面によって詳細に説
明する。図２は本発明の文字認識装置の一実施例である
光学的文字読取装置の基本的な構成を示すブロック図で
ある。原稿１の表面に形成された文書画像は、イメージ
スキャナ２により光学的に読み取られる。原稿１には、
日本語の文書が形成されており、この文書中には、半角
英文字で構成された英単語が含まれているものとする。
イメージスキャナ２の出力信号は、二値化部３で二値化
された後に、二値画像として画像メモリ４に記憶され
る。

【００２０】画像メモリ４に記憶された文書画像は、切
出部５で１文字ずつの文字画像毎に切り出される。そし
て、切り出された画像に基づき、認識部６において文字
認識処理が行われ、当該文字に対応する文字コードが出
力される。図１は、切出部５の詳しい構成を示すブロッ
ク図である。画像メモリ４に記憶れた文書画像は、行切
出部５１において１行ずつの画像ごとに切り出される。
この切り出された１行毎の画像は、仮切出部５２に与え
られ、黒画素の塊である文字要素毎の画像に切り出され
る。

【００２１】切り出された文字要素は、文字サイズ推定
部５３に与えられ、公知の文字サイズ推定手法に基づい
て、日本語文字のサイズが推定される。この推定された
文字サイズは、半角候補文字抽出部５４に与えられて、
文字サイズの一定割合以下の横幅の文字要素が、半角候
補文字として抽出される。抽出された半角候補文字は、
英単語候補抽出部５５に与えられる。この英単語候補抽
出部５５は、後述する手法によって、一定の条件を満た
す半角候補文字列を英単語候補として抽出する。

【００２２】英単語候補が抽出されると、次に、英単語
候補を構成する各半角候補文字に関して、行内での位置
特徴や、各半角候補文字の構成画素の分布の特徴である
画素特徴が、画素特徴抽出部５６で抽出される。抽出さ
れた画素特徴などは、照合部５７において、画素特徴記
憶部５８に記憶された画素特徴テーブルの内容と比較照
合される。この画素特徴テーブルには、半角英文字につ
いて、上記の位置特徴および画素特徴に関する標準条件
が記憶されている。

【００２３】照合部５７での照合結果は、英単語候補修
正部５９に与えられる。この英単語候補修正部５９は、
上記の照合結果に基づいて、英単語候補を構成する半角
候補文字の少なくともいずれか１つが英文字でないもの
と判断されるときに、このような半角候補文字を含む英
単語候補を英単語候補から除外する。この英単語候補修
正部５９における詳しい処理については、後述する。

【００２４】このようにして英単語候補の修正が行われ
て最終的に英単語候補が確定すると、文字切出部６０で
は、英単語候補を構成する半角候補文字は、半角英文字
であるものとして文書画像からの画像切出を行う。一
方、英単語候補を構成しない半角候補文字は、隣接する
半角候補文字との再結合が行われて切り出される。すな
わち、このような半角候補文字は、全角分離文字の一部
をなす文字要素であるものとして切り出されることにな
る。

【００２５】図３は、認識部６の詳しい構成を示すブロ
ック図である。切出部５からの１文字ごとの切出画像
は、特徴抽出部６１に入力され、種々の特徴量が抽出さ
れることになる。抽出された特徴量は、類似度算出部６
２に与えられる。この類似度算出部６２には、半角英数
字の特徴量を記憶した認識用辞書である英数字辞書６３
と、半角英数字以外の認識可能な全ての文字の特徴量を
記憶した認識用辞書６４とが接続されている。類似度算
出部６２では、特徴抽出部６２から与えられる特徴量
と、辞書６３，６４に記憶された特徴量との類似度が計
算される。そして、最大の類似度を有する文字が見出さ
れ、その文字の文字コードとその類似度とが出力部６５
から出力されることになる。

【００２６】なお、上記最大の類似度は切出部５にも与
えられ、この類似度が所定値未満のときには、切出ミス
であるものと判断されて、当該文字要素について再度の
切出処理が行われる。図４は文字認識処理を説明するた
めのフローチャートである。ステップｎ１では、画像メ
モリ４に文書画像が入力される。ステップｎ２では、行
切出部５１において、行方向に関して黒画素の周辺分布
が計算され、行切出位置および行幅が求められて、１行
の画像の切出しが行われる。すなわち、図５に示すよう
に、行方向に関して黒画素数が累積され、参照符号ａ１
で示すヒストグラムが作成される。このヒストグラムに
基づいて行幅Ｖが算出される。さらに、行切出位置Ｌ
１，Ｌ２，Ｌ３，・・・・も算出されることになる。この行
切出位置Ｌ１，Ｌ２，Ｌ３，・・・・および行幅Ｖに基づい
て、１行の画像の切出しが行われる。

【００２７】次に、ステップｎ３では、仮切出部５２に
おいて、行切出部５１により切り出された各行の画像毎
に、行方向に垂直な方向に関して黒画素の周辺分布が求
められる。すなわち、図６に示すように、切り出された
各行の画像において行方向に垂直な方向に関して黒画素
数が累積され、参照符号ａ２で示すヒストグラムが作成
される。そして、このヒストグラムに基づいて、黒画素
の塊である各文字要素の切出位置ｈｋ（ただし、ｋ＝
１，２，３，・・・・である。）および横幅Ｈｋが計算され
る。このようにして、文字要素の切出しが達成される。

【００２８】ステップｎ４では、図７に示すように各文
字要素毎に、行幅Ｖの範囲内で、文字の縦方向の黒画素
の周辺分布ｂ１，ｂ２，ｂ３，・・・・が求められ、各文字
要素の縦幅Ｖ１，Ｖ２，Ｖ３，・・・・が算出される。そし
て、ステップｎ５では、算出された縦幅Ｖ１，Ｖ２，Ｖ
３，・・・・などに基づいて、各文字要素を行方向または行
垂直方向に沿う四辺で囲む最小の矩形が求められ、この
矩形が囲み切出矩形とされる。さらに、囲み切出矩形の
大きさから、文字サイズ推定部５３において、日本語文
字の大きさである文字サイズの推定が行われる。この文
字サイズの推定には、たとえば「横書き日本語文書にお
ける個別文字の抽出（信学論'85/11, Vol.J68-D No.11,
第1899頁」などに開示されている公知技術を適用するこ
とができる。

【００２９】ステップｎ６では、半角候補文字抽出部５
４において、囲み切出矩形の大きさと文字サイズとの関
係から、半角候補文字が抽出される。この半角候補文字
とは、切出幅の推定文字サイズに対する割合が一定値よ
りも小さな文字要素のことである。この半角候補文字の
抽出処理は、図８に示されている。すなわち、隣接する
一対の文字要素の結合の横幅Ｗ１，Ｗ２，Ｗ３，・・・・が
算出され、この算出された横幅Ｗ１，Ｗ２，Ｗ３，・・・・
がステップｎ５で推定された文字サイズと比較される。
図８において、実線で示されている横幅Ｗ１，Ｗ３〜Ｗ
９，Ｗ１１は文字サイズ以下であり、破線で示された横
幅Ｗ２，Ｗ１０，Ｗ１２，Ｗ１３は文字サイズを超えて
いる。この横幅Ｗ１，Ｗ２，・・・・に基づき、１つの文字
要素に関連する２つの横幅ＷｊおよびＷ（ｊ＋１）（ｊ
＝１，２，３，・・・・）の少なくともいずれか一方が文字
サイズ以下であれば、当該文字要素は半角候補文字とさ
れる。一方、２つの横幅ＷｊおよびＷ（ｊ＋１）のいず
れもが文字サイズを超えているときには、当該文字要素
は半角候補文字からは除外される。したがって、図８の
場合には、文字要素２１〜３２は、半角候補文字とさ
れ、文字要素３３，３４は半角候補文字からは除外さ
れ、全角文字としての文字切出処理が行われることにな
る。

【００３０】図９は、半角候補文字の具体的な抽出方法
を説明するためのフローチャートである。この処理は、
図４のステップｎ２で抽出した各行の画像毎に行われ
る。ステップｓ１では、処理中の文字要素を計数するた
めのパラメータｍに１が代入される。ステップｓ２で
は、変数Ｗに、ｍ番目の文字要素の横幅ＨＷｍと、（ｍ
＋１）番目の文字要素の横幅ＨＷ（ｍ＋１）と、ｍ番目
の文字および（ｍ＋１）番目の文字の間隔Ｓｍとの和が
代入される。この変数Ｗが上記の横幅Ｗ１，Ｗ２，Ｗ
３，・・・・に対応する。

【００３１】次に、ステップｓ３では、変数Ｗが、図４
のステップｎ５で抽出した文字サイズ以下であるかどう
かが判断される。変数Ｗが文字サイズ以下であるとき
に、ステップｓ４でｍ番目および（ｍ＋１）番目の文字
要素が半角候補文字とされる。ステップｓ５では、パラ
メータｍがインクリメントされ、ステップｓ６での処理
により、パラメータｍが（文字要素の数−１）となるま
で同様の処理が行われる。ステップｓ３で変数Ｗが文字
サイズを超えているものと判断されるときには、ステッ
プｓ４を経ずにステップｓ５に移る。このような処理に
よって、隣接する文字要素と結合し得ない文字要素が半
角候補文字として抽出されることになる。

【００３２】再び図４を参照する。半角候補文字は、切
り出された文字要素のサイズからは、半角文字であるの
か、左右に分離された形態を有する全角分離文字の一部
であるのかが判断できない。このため、図４のステップ
ｎ７では、英単語候補抽出部５５において、一定の条件
を満たす半角候補文字列が英単語候補として抽出され
る。

【００３３】一般に、日本語文書中に混在する英単語を
構成する半角文字列は、図１０(a)に示すように略等し
い間隔Ｓ₁，Ｓ₂，・・・・，Ｓ₆（Ｓ₁≒Ｓ₂≒・・・・≒Ｓ
₆）で印字（以下「等間隔印字」という。）されるか、
または、図１０(b) に示すように略等しいピッチＰ₁，
Ｐ₂，・・・・，Ｐ₆（Ｐ₁≒Ｐ₂≒・・・・≒Ｐ₆）で印字
（以下「等ピッチ印字」という。）される。等ピッチ印
字では、間隔Ｓ₁，Ｓ₂，・・・・，Ｓ₆のばらつきが大き
いのが通常である。したがって、半角候補文字がほぼ一
定間隔またはほぼ一定のピッチで一定数以上連なってい
れば、このような半角候補文字列は英単語を構成してい
る可能性が高い。

【００３４】さらに、日本後文書中に混在する英単語
は、その前後にある程度の余白が設けられるという特徴
がある。そこで、本実施例では、図１１に示すように、
半角候補文字がほぼ一定間隔または一定ピッチで一定数
（たとえば４個）以上連なることを第１の条件とし、そ
のようなひとつながりの半角候補文字列のうちで一番後
ろに位置する半角候補文字とその次に位置する文字要素
との間隔が大きく開いていることを第２の条件として、
この第１および第２の条件を満たす半角候補文字列が英
単語候補として抽出される。

【００３５】たとえば、図１１に示す例では、半角候補
文字Ｃ２１〜Ｃ２８は、ピッチＰ₂₁，Ｐ₂₂，Ｐ₂₃，
Ｐ₂₄，Ｐ₂₅，Ｐ₂₆，Ｐ₂₇で並んでおり、また、各半角候
補文字Ｃ２１〜Ｃ２８間の各間隔は、Ｓ₂₁，Ｓ₂₂，
Ｓ₂₃，Ｓ₂₄，Ｓ₂₅，Ｓ₂₆，Ｓ₂₇となっている。この場
合、Ｐ₂₁≒Ｐ₂₂≒Ｐ₂₃≒Ｐ₂₄≒Ｐ₂₅≒Ｐ₂₆≒Ｐ₂₇≪Ｐ₂₈ ・・・・ (1) またはＳ₂₁≒Ｓ₂₂≒Ｓ₂₃≒Ｓ₂₄≒Ｓ₂₅≒Ｓ₂₆≒Ｓ₂₇≪Ｓ₂₈ ・・・・ (2) が成り立つから、半角候補文字Ｃ２１〜Ｃ２７は、ほぼ
一定ピッチまたはほぼ一定ピッチで一定数以上連なって
いると言える。すなわち、半角候補文字Ｃ２１〜Ｃ２８
からなる文字列は、上記の第１の条件を満たす。

【００３６】このようなほぼ一定間隔またはほぼ一定ピ
ッチで並んでいる半角候補文字列を構成する半角候補文
字Ｃ２１〜Ｃ２７のうち、一番後ろの半角候補文字Ｃ２
７の次の間隔Ｓ₂₈が大きいから、半角候補文字Ｃ２１〜
Ｃ２７からなる半角候補文字列は、結局上記第２の条件
をも満たす。この結果、この間隔Ｓ₂₈より前の半角候補
文字列が英単語候補とされることになる。

【００３７】その一方で、キャラクタ「が」を構成する
半角候補文字列Ｃ３１，Ｃ３２は、その直後の間隔Ｓ₃₂
が小さすぎ、また半角候補文字も２つしか連なっていな
いので、英単語候補とは判定されない。また、キャラク
タ「は」を構成する２つの半角候補文字Ｃ１１，Ｃ１２
は、後ろの間隔Ｓ₁₂は充分大きいが、半角候補文字が２
つしか連なっていないから、英単語候補とは判定されな
い。

【００３８】このようにして、文字列「Ｅｉｎｓｔｅｉ
ｎ」を構成する半角候補文字列Ｃ２１〜Ｃ２７が英単語
候補として抽出されることになる。このようにして、英
単語候補が抽出されると、次に、図４のステップｎ８で
は、画素特徴抽出部５６において、図１２に示されるよ
うに、英単語候補を構成する各半角候補文字の画素特徴
などが抽出される。この画素特徴とは、たとえば、各半
角候補文字を行方向に関する中心位置で縦方向に走査し
たときに、白画素→黒画素→白画素のような変化が生じ
る変化点の数ｎｕｍなどである。各半角候補文字の走査
結果は、図１２において参照符号ｄ１〜ｄ４で示されて
おり、太線部分は走査線３０上の画素が黒画素であるこ
とを示し、細線部分は走査線３０上の画素が白画素であ
ることを示す。

【００３９】たとえば、図１２(a) において、走査線３
０に沿って半角候補文字「Ｅ」を走査すると、上記のよ
うな変化点は参照符号ｃ１，ｃ２，ｃ３で示す３個とな
る（すなわちｎｕｍ＝３である。）。同様に、図１２
(b),(c),(d) から、半角候補文字「ｉ」ではｎｕｍ＝
２、半角候補文字「ｎ」ではｎｕｍ＝１、半角候補文字
「ｓ」ではｎｕｍ＝３となる。

【００４０】なお、図１３は、キャラクタ「は」の分離
された各文字要素に関して上記と同様な走査を行った結
果を参考のために示したものである。図１４は画素特徴
抽出部５６で抽出されるその他の画素特徴を説明するた
めの図である。半角候補文字の上記の走査の際には、走
査線３０上において、連続した白画素からなる白画素群
と連続した黒画素からなる黒画素群との各構成画素数が
計数される。すなわち、走査線３０に従った走査におい
て、最初に現れる白画素群の画素数Ｗ（１）、その次に
現れる最初の黒画素群の画素数Ｂ（１）、その次に現れ
る２番目の白画素群の画素数Ｗ（２）、その次に現れる
２番目の黒画素群の画素数Ｂ（２）、・・・・が計数され
る。

【００４１】さらに画素特徴抽出部５６では、行内での
半角候補文字の相対位置などを表す位置特徴として、行
幅Ｖ内における半角候補文字の囲み切出矩形３５の上部
余白ＳＵおよび下部余白ＳＬも求められ、行内での文字
の相対位置が調べられる。この余白ＳＵおよびＳＬは、
いずれも、画素数で表されるデータである。これらのデ
ータの他に、さらに、上記図７に示された処理により求
められたヒストグラムから、半角候補文字の縦方向の分
離数ＳＰが求められ、この分離数ＳＰも位置特徴とされ
る。すなわち、キャラクタ「ｄ」では、ＳＰ＝１であ
り、キャラクタ「ｉ」では、ＳＰ＝２である。

【００４２】上記のような画素特徴の抽出結果の一例
は、上記の図１２に示されている。また、参考のため
に、図１３には、キャラクタ「は」の分離された各文字
要素に関して画素特徴を抽出した例が示されている。図
１の画素記憶部５８には、半角英文字の位置特徴および
画素特徴に関する標準条件を格納したテーブルが記憶さ
れている。このテーブルを参照することにより、図４の
ステップｎ９では、照合部５７および英単語候補修正部
５０での処理によって、英単語候補を構成する半角候補
文字が半角英文字であるかどうかが再度調べられ、英単
語候補の修正が行われる。すなわち、上記テーブルと抽
出された位置特徴および画素特徴とが照合され、英単語
候補とされた文字要素列を構成する半角候補文字のう
ち、いずれか１つでも英文字に該当しないものがあれ
ば、このような半角候補文字を含む英単語候補は、英単
語候補から除外される。

【００４３】上記のテーブルに記憶された標準条件は、
たとえば、下記表１に示すようなものである。すなわ
ち、変化点の数ｎｕｍ＝１の場合には、当該半角候補文
字の位置条件として、分離度ＳＰが１の場合に、半角英
数字であるものと判定される。また、変化点の数ｎｕｍ
＝２の場合には、位置条件として分離度ＳＰ＝１である
場合と、位置条件として分離度ＳＰ＝２を満たし、か
つ、画素条件としてＢ（２）＞Ｂ（１）×４を満たす場
合とに、当該半角候補文字が英数字であるものと判定さ
れる。さらに、変化点の数ｎｕｍ＝３の場合において、
当該半角候補文字が英数字であると判定されるのは、位
置条件として分離度ＳＰ＝１かつＳＵ＋Ｗ（４）＞Ｖｉ
×０．０９を満たし、さらに画素条件として（Ｖｉ−Ｗ
（１）−Ｗ（４））＞Ｖｉ×０．７を満たす場合であ
る。さらに、変化点の数ｎｕｍ＝４の場合には、分離度
ＳＰ＝１であって、かつＳＵ＞Ｖ×０．２６なる位置条
件が満たされる場合に、半角候補文字が英数字であるも
のと判定される。なお、図１４に示されているように、
Ｖｉは囲み切出矩形３５の縦幅であり、Ｖは行幅であ
る。

【００４４】

【表１】

【００４５】この照合の結果、英単語候補を構成する半
角候補文字の全てが、上記表１の標準条件を満たしてい
れば、このような半角候補文字列は英単語候補として確
定される。その一方で、英単語候補を構成するいずれか
１つの半角候補文字が上記表１の標準条件を満たさない
場合には、このような文字列は英単語候補でないものと
して、英単語候補から除外される。

【００４６】図１５は、英単語候補を抽出するための処
理を説明するためのフローチャートであり、図４のステ
ップｎ７〜ｎ９の具体的な処理が示されている。ステッ
プｒ１では、パラメータｉに１が代入され、別のパラメ
ータＣＯＵＮＴに０が代入される。次にステップｒ２で
は、パラメータｉが当該行内の文字要素の数に達したか
どうかが判断され、文字要素の数に達していれば処理を
終了する。パラメータｉが文字要素の数に達する以前で
あれば、ステップｒ３において、当該行を構成するｉ番
目の文字要素が半角候補文字であるかどうかが判断され
る。半角候補文字でないときには、ステップｒ１３でパ
ラメータｉがインクリメントされた後にステップｒ２に
戻り、半角候補文字であるときにはステップｒ４進む。

【００４７】ステップｒ４では、ｉ番目の文字要素と
（ｉ＋１）番目の文字要素との間隔が変数Ｓに代入さ
れ、また、ｉ番目の文字要素と（ｉ＋１）番目の文字要
素とのピッチが変数Ｐに代入される。さらに、パラメー
タＣＯＵＮＴに１が代入される。そしてステップｒ５で
パラメータｉがインクリメントされた後に、ステップｒ
６では、インクリメントされた後のｉに従って、ｉ番目
の文字要素は半角候補文字であるかどうかが判断され
る。半角候補文字でなければステップｒ１３に進み、半
角候補文字なら、ステップｒ７で上記の画素特徴などが
抽出される。

【００４８】次にステップｒ８では、抽出された画素特
徴などが、上記表１に示されたテーブルと照合される。
ステップｒ９では、変数Ｓと、ｉ番目の文字要素と
（ｉ＋１）番目の文字要素との間の間隔とがほぼ等しい
かどうか、変数Ｐと、ｉ番目の文字要素と（ｉ＋１）
番目の文字要素とのピッチがほぼ等しいかどうか、ｉ
番目の文字要素は行末の文字要素かどうかが、それぞれ
判断される。そして、上記〜のいずれか１つについ
て肯定的な判断がなされると、ステップｒ１０でパラメ
ータＣＯＵＮＴがインクリメントされてステップｒ５に
戻る。また、上記〜のすべてについて否定的な判断
がなされたときには、ステップｒ１１に進む。

【００４９】ステップｒ１１では、パラメータＣＯＵＮ
Ｔが３よりも大きいかどうかが判断れ、３よりも大きけ
れば（すなわちＣＯＵＮＴ＝４となると）、ステップｒ
１２において、（ｉ−ＣＯＵＮＴ）番目からｉ番目の文
字要素が英単語を構成する文字要素であるものとされ
る。この後の処理はステップｒ１３に進む。なお、ステ
ップｒ１１で、パラメータＣＯＵＮＴが３以下である場
合には、ステップｒ１２を経ずにステップｒ１３に進
み、次の文字要素についての処理が行われる。

【００５０】このようにして、一定間隔または一定ピッ
チで一定数以上の半角候補文字が連続しており、かつ各
半角候補文字が半角英文字であると判断されるときに、
このような半角候補文字列が英単語候補として抽出され
ることになる。再び図４を参照して、英単語候補が抽出
された後の処理を説明する。ステップｎ１０では、切出
位置の修正が行われる。すなわち、英単語候補を構成す
る半角候補文字については、ステップｎ３での文字要素
の切出位置をそのまま用いればよいが、英単語候補を構
成しない半角候補文字は、全角分離文字の一部をなす文
字要素である可能性が高いため、切り出すべき画像の再
構成が必要となる。すなわち、隣接する半角候補文字同
士を結合させて切り出すために、切出位置の修正が行わ
れるのである。

【００５１】次に、ステップｎ１１では、文字切出部６
０（図１参照）において１文字ごとの画像である文字画
像が切り出され、この文字画像と英数字辞書６３または
認識用辞書６４（図３参照）を参照することで、文字認
識処理が行われる。すなわち、切り出された文字画像か
ら特徴量が抽出され、この抽出された特徴量と辞書６
３，６４に記憶された各文字の基準となる特徴量との類
似度が計算される。そして、類似度が最大となる文字の
文字コードが、認識候補としてその類似度とともに出力
部６５から出力される。

【００５２】このような認識処理において、類似度算出
部６２では、英単語候補を構成する半角候補文字につい
ては、英数字辞書６３を参照し、その他の文字要素につ
いては認識用辞書６４を参照する。したがって、英単語
候補を構成する文字要素については、類似度計算の対称
となる文字が半角英数字に限定されるので、類似度計算
が格段に簡単に行える。これにより、認識処理が高速化
されることになる。なお、英単語候補を構成する半角候
補文字については、英単語を構成する文字を認識するた
めの既存のあらゆる手法を適用できる。

【００５３】ステップｎ１２では、認識候補の類似度が
所定値を超えているかどうかが判断され、認識候補の類
似度が著しく低いとき、たとえば平均類似度の１割未満
であるときには、切出ミスであると判断され、ステップ
ｎ１２からステップｎ１０に戻って切出位置の修正が行
われる。すなわち、切出ミスとされた文字要素が英単語
候補を構成する半角候補文字であるときには、この文字
要素が全角分離文字の一部を構成する文字要素であるも
のとして切出しがやり直される。また、全角分離文字の
一部を構成するものとされた文字要素に関して切出ミス
と判断されたときには、当該文字要素が半角文字である
ものとして、文字画像の切出が再度行われる。このよう
にして、再度切り出された文字要素に関して、上記の文
字認識処理が行われることになる（ステップｎ１１）。

【００５４】以上のように本実施例の光学的文字読取装
置では、認識処理を行うことなく半角英文字からなる英
単語候補を抽出することができるから、文字の切出を高
速に行うことができる。しかも、英単語候補の抽出に
は、日本語文書中に含まれる英単語のレイアウト上の特
徴のほか、各半角候補文字の位置特徴や画素特徴を参照
して行われているから、文書フォーマットの異なる種々
の文書に良好に対応して、英単語候補を正確に抽出する
ことができる。したがって、文字の切出しを文書フォー
マットによらずに正確に行わせることができ、この結
果、文字認識処理の高速化に寄与することができる。

【００５５】また、文字認識の過程で英単語候補が抽出
されるので、たとえば１文字ずつの文字認識の後に、英
単語のスペリングを調べるスペルチェックなどの処理を
容易に行うことができるという利点がある。なお、本発
明は上記の実施例に限定されるものではない。たとえば
上記の実施例では、英単語候補の抽出の際に、所定数以
上の半角候補文字列の後ろに所定長以上の余白が形成さ
れていることを条件としたが、このような条件の代わり
に、所定数以上の半角候補文字列の前に所定長以上の余
白が形成されていることを条件としたり、所定数以上の
半角候補文字列の前と後ろの両方に所定長以上の余白が
形成されていることを条件としたりしてもよい。

【００５６】また、上記の実施例では、画素特徴の１つ
として、半角候補文字の行方向に関する中心位置での縦
方向への走査において、白画素→黒画素→白画素のよう
に変化する変化点の数ｎｕｍを採用しているが、このよ
うな画素特徴の代わりに黒画素→白画素→黒画素のよう
に変化する変化点の数を採用してもよい。さらに、上記
の実施例では、白地に黒色の文書画像が形成されている
場合を例に採ったが、黒地に白色の文書画像が形成され
ている場合についても、本発明は容易に応用することが
できる。すなわち、この場合には、白画素の塊を文字要
素として抽出することになる。

【００５７】さらに、上記の実施例では、文書画像は、
原稿を光学的に読みとるようにして画像メモリ４に入力
されているが、文書画像を表すデータを通信回線を介し
て取得し、この取得した画像データを画像メモリに記憶
させる構成としてもよい。その他、本発明の要旨を変更
しない範囲で種々の設計変更を施すことが可能である。

【００５８】

【発明の効果】以上のように本発明の文字認識装置によ
れば、日本語文書中に混在する半角英文字は英単語を構
成していることが多いことを利用して、英単語候補を抽
出することによって、文字画像の切出しの最適化が図ら
れている。これにより、半角文字は当初から半角文字と
して切り出し、全角分離文字は当初から半角候補文字同
士を再結合させた状態で切り出すことができるから、文
字切出処理を正確に行うことができる。しかも、英単語
候補の抽出は、文字認識処理を要することなく行われる
から、正確な切出処理を高速に行うことができ、したが
って文字認識処理を高速化することができる。

【００５９】さらに、英単語候補の抽出に当たっては、
文書画像のレイアウトの特徴のほか、英単語候補を構成
する各半角候補文字の位置特徴や画素特徴をも参照して
いるので、文書フォーマットの相違に依らずに英単語候
補の抽出を良好に行うことができる。これにより、切出
処理の一層の最適化が図られるから、文字切出処理を極
めて正確に行うことができ、文字認識処理の回数を低減
して、全体の認識処理に要する時間を短縮することがで
きるようになる。

【図面の簡単な説明】

【図１】本発明の文字認識装置の一実施例である光学的
文字読取装置の要部の構成を示すブロック図である。

【図２】光学的文字読取装置の全体の構成を示すブロッ
ク図である。

【図３】認識部の詳しい構成を示すブロック図である。

【図４】本発明の一実施例の文字認識装置による文字認
識処理を説明するためのフローチャートである。

【図５】１行毎の画像の切出処理を説明するための図で
ある。

【図６】文字要素毎の画像の切出処理を説明するための
図である。

【図７】各文字要素の周辺分布を求めた例を示す図であ
る。

【図８】半角候補文字の抽出処理を説明するための図で
ある。

【図９】半角候補文字の抽出処理を説明するためのフロ
ーチャートである。

【図１０】日本語文書中に混在している半角英文字の印
字特徴を説明するための図である。

【図１１】英単語候補の抽出処理を説明するための図で
ある。

【図１２】画素特徴の抽出処理を説明するための図であ
る。

【図１３】画素特徴の抽出処理を説明するための図であ
る。

【図１４】画素特徴を説明するための図である。

【図１５】英単語候補の抽出処理を説明するためのフロ
ーチャートである。

【図１６】従来技術の問題点を説明するための図であ
る。

【図１７】他の従来技術の問題点を説明するための図で
ある。

【符号の説明】

５切出部６認識部５１行切出部５２仮切出部５３文字サイズ推定部５４半角候補文字抽出部５５英単語候補抽出部５６画素特徴抽出部５７照合部５８画素特徴記憶部５９英単語候補修正部６０文字切出部６１特徴抽出部６２類似度算出部６３英数字辞書６４認識用辞書６５出力部

Claims

【特許請求の範囲】

【請求項１】日本語文字および英文字が混在している文
書画像の各文字を認識し、文字コードに変換して出力す
る文字認識装置であって、入力画像の行方向の周辺分布をとり、１行ずつの画像を
切り出す行切出手段と、この行切出手段により切り出された１行毎の画像につい
て、行方向に垂直な方向に関する周辺分布をとり、文字
を構成する画素の塊である文字要素毎の画像を切り出す
仮切出手段と、切り出された文字要素の大きさに基づいて日本語文字の
大きさである文字サイズを推定する文字サイズ推定手段
と、この文字サイズ推定手段により推定された文字サイズに
基づいて、横幅が文字サイズの一定割合よりも小さな文
字要素を半角候補文字として抽出する半角候補文字抽出
手段と、所定数以上の半角候補文字が連続し、かつ、この半角候
補文字列の前または後ろに所定長以上の余白部分が存在
するときに、当該半角候補文字列を英単語候補として抽
出する英単語候補抽出手段と、英単語候補を構成する各半角候補文字の行内での位置特
徴、および当該半角候補文字の構成画素の分布状態に対
応した画素特徴を抽出する画素特徴抽出手段と、半角英文字に関して、上記位置特徴および画素特徴につ
いての標準条件を記憶した画素特徴記憶手段と、上記画素特徴抽出手段により抽出された上記位置特徴お
よび画素特徴と、上記特徴記憶手段に記憶された標準条
件とを照合して、位置特徴および画素特徴が上記標準条
件に合致しないときに、当該半角候補文字を含む英単語
候補を英単語候補から除外する英単語候補修正手段と、英単語候補を構成する半角候補文字は半角英文字である
ものとして文字画像の切出しを行い、残余の半角候補文
字は日本語文字の一部を成すものとして近傍の半角候補
文字と再結合させて文字画像の切出しを行う文字切出手
段と、この文字切出手段により切り出された画像に基づいて文
字認識を行い、対応する文字コードを出力する認識手段
とを含むことを特徴とする文字認識装置。
【請求項２】上記画素特徴には、半角候補文字を行方向
の中心位置で行方向に垂直な方向に走査したときに、白
画素→黒画素→白画素のように変化する変化点の数、ま
たは黒画素→白画素→黒画素のように変化する変化点の
数が含まれていることを特徴とする請求項１記載の文字
認識装置。
【請求項３】上記認識手段は、認識可能な全ての文字の特徴量を記憶した認識用辞書
と、上記切り出された文字画像から特徴量を抽出する特徴量
抽出手段と、この特徴量抽出手段により抽出された特徴量と上記認識
用辞書に記憶されている各文字の特徴量との類似度を算
出する類似度算出手段と、この類似度算出手段により算出された類似度が最大であ
る文字の文字コードおよびその類似度を出力する手段と
を含むものであり、上記出力された類似度が所定値未満であるときには、当
該文字要素について上記文字切出手段による文字画像の
切出しとは異なる態様で文字画像の切出しを再度行う再
切出手段をさらに含むことを特徴とする請求項１または
２記載の文字認識装置。