JPH05101220A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH05101220A
JPH05101220A JP3260659A JP26065991A JPH05101220A JP H05101220 A JPH05101220 A JP H05101220A JP 3260659 A JP3260659 A JP 3260659A JP 26065991 A JP26065991 A JP 26065991A JP H05101220 A JPH05101220 A JP H05101220A
Authority
JP
Japan
Prior art keywords
character
width
characters
candidate
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3260659A
Other languages
English (en)
Inventor
Takeshi Furuto
健 古戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Electric Industries Ltd
Original Assignee
Sumitomo Electric Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Electric Industries Ltd filed Critical Sumitomo Electric Industries Ltd
Priority to JP3260659A priority Critical patent/JPH05101220A/ja
Publication of JPH05101220A publication Critical patent/JPH05101220A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】正確かつ高速な文字切出しを実現して文字認識
処理を高速化する。 【構成】1行毎の画像の切出しが行われ(ステップn
2)、さらに画素の塊である文字要素毎の画像が切り出
される(ステップn3)。次に、文字要素の大きさから
推定された文字サイズに基づき、横幅が小さい文字要素
が半角候補文字として抽出される(ステップn6)。さ
らに、一定の条件を満たす半角候補文字列が英単語候補
として抽出される(ステップn7)。次いで、英単語候
補を構成する各半角候補文字に関して、画素特徴などが
抽出される(ステップn8)。この画素特徴などに基づ
き、半角英文字でない半角候補文字を含む英単語候補が
英単語候補から除外されて、英単語候補の修正が行われ
る(ステップn9)。そして、切出位置が半角文字と全
角文字とのそれぞれに応じて修正され(ステップn1
0)、文字認識処理が行われる(ステップn11)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、光学的文字読取装置
(OCR)などのように、文書画像から1文字ずつの画
像を切り出し、この切り出した画像に基づいて文字や記
号の認識処理を行う文字認識装置に関するものである。
【0002】
【従来の技術】光学的文字読取装置(OCR)などの文
字認識装置では、文書画像に対応した画像データから、
1文字分ずつの画像を順に切り出し、切り出された画像
の特徴量と、認識用辞書に蓄積されている認識可能な各
文字の特徴量との比較演算を行うことで、文字の認識が
行われ、認識された文字に対応した文字コードが出力さ
れる。
【0003】このような文字認識処理が正確に行われる
ためには、文書画像からの1文字ずつの文字切出しが良
好に行われることが不可欠である。この文字切出処理に
当たっては、まず文字サイズを検出することが必要とな
る。これは、たとえば「い」や「旧」などのように分離
した複数の要素から構成されている分離文字では、黒画
素の塊である文字要素毎に画像を切り出すと、正しい文
字切出処理が行えないからである。すなわち、予め文字
サイズを検出しておき、複数の文字要素からなる分離文
字に対しては、文字サイズに基づいて複数の文字要素を
再構成することにより文字切出処理を正確に行える。
【0004】しかしながら、日本語の文書中に半角英数
字が存在する場合などには、一定の文字サイズを基に文
字の切出しを行うと、隣接する半角英数字の対が1文字
として再構成されて切り出されるおそれがある。このた
め、日本語と半角英数字とが混在している文書では、単
純にサイズの小さな文字要素同士を結合させてしまう
と、正確な文字切出処理を行うことができない。
【0005】この不具合を解消するために、文字要素毎
の認識結果をフィードバックして、正しい切出位置を定
める方法が提案されている(たとえば信学論 '84/10 Vo
l.J67-D No.10 参照)。ところが、この方法では、全角
分離文字(横書きの文書では、行方向に関して白画素で
分離された複数の文字要素からなる文字。たとえば
「門」や「卵」などが該当する。)に関しても、各文字
要素毎に認識が行われるため、全体の文字認識回数が文
書の構成文字数に比較して増大してしまい、処理速度が
劣化するという問題が生じていた。
【0006】すなわち、たとえば、図16(a) および
(b) に示すような「門」や「卵」のような全角分離文字
に関しては、参照符号11,12で切出位置を示すよう
に、それぞれ2つずつの文字要素A1,A2;B1,B
2毎に切り出されるので、先ず各文字要素A1,A2;
B1,B2に対して認識処理が行われる。そして、この
認識処理が不可能であることに基づいて、文字要素A
1,A2またはB1,B2を結合させて参照符号13,
14で示す位置で切出しをやり直し、このようにして切
り出された文字要素の対に関してさらに文字認識処理を
行うことになる。したがって、本来2回の認識処理によ
り認識すべき2つの文字に対して6回の認識処理を要す
ることになる。
【0007】そこで、特開昭62−130479号公報
に開示されている他の先行技術では、推定文字ピッチを
基に判定された基準文字塊(全角文字に対応する。)に
挟まれた小さな文字要素の数に応じて処理を異ならせる
ことにより、処理速度の向上が図られている。すなわ
ち、小さな文字要素が所定数(たとえば4個)以上連続
するときには、各文字要素が1文字(半角文字)を構成
するものとして認識処理が行われる。そして、小さな文
字要素の連続数が所定数未満であるときには、分離文字
(全角分離文字)の可能性があるものとして、各文字要
素毎の認識処理を行うとともに、2個以上の文字要素の
結合に関しても認識処理を行わせるようにしている。こ
のような処理により、半角英数字が連続する場合には、
このような文字列については、文字要素の結合について
の認識処理が省かれるから、認識処理の回数を低減し
て、処理速度を向上することができる。
【0008】この先行技術の新たな問題は、図17に示
すように、分離文字が連続する場合に、分離文字の各文
字要素をそれぞれ半角文字であるものとして認識処理が
行われるために、認識処理のやり直しが必要となり、結
果的に却って処理速度が落ちてしまう場合があることで
ある。すなわち、図17の場合のように、それぞれ文字
要素C11,C12;C21,C22;C31,C32
からなる分離文字C1,C2,C3が連続する場合に
は、小さな文字要素C11,C12,C21,C22,
C31,C32が6個連続しているから、これらの文字
要素に対しては、文字要素相互間の結合は行われず、先
ず、半角文字であるものとして認識処理が行われること
になる。そして、この半角文字としての認識が不可能で
あると判った時点で、初めて、隣接する文字要素間の再
結合が行われる。なお、図17において、15は行方向
の切出位置を示す。
【0009】上記の不具合を解決するためには、半角文
字と分離文字を構成する小さな文字要素とを、認識処理
を行うことなく区別する必要がある。これを実現した先
行技術は、たとえば特開平2−239386号公報に開
示されている。この先行技術では、認識処理を行う前
に、文字要素の行内における相対的な位置関係や文字要
素の大きさを基にして、当該文字要素が半角文字を構成
しているのか、分離文字の一部であるのかを判断するよ
うにしている。
【0010】
【発明が解決しようとする課題】ところが、この先行技
術は、文字要素の位置関係やレイアウトに関する規則を
用いて文字要素の判別を行っているため、文字の切出し
の正確さが文書フォーマットの影響を受け易いという新
たな問題を生じさせる。そこで、本発明の目的は、上述
の技術的課題を解決し、文書フォーマットの影響を受け
ることなく、日本語文書中に半角英文字が混在している
文書画像からの文字の切出しを正確に、かつ、高速に行
うことができ、したがって、文字認識処理の高速化に寄
与することができる文字認識装置を提供することであ
る。
【0011】
【課題を解決するための手段および作用】上記の目的を
達成するための請求項1記載の文字認識装置は、日本語
文字および英文字が混在している文書画像の各文字を認
識し、文字コードに変換して出力する文字認識装置であ
って、入力画像の行方向の周辺分布をとり、1行ずつの
画像を切り出す行切出手段と、この行切出手段により切
り出された1行毎の画像について、行方向に垂直な方向
に関する周辺分布をとり、文字を構成する画素の塊であ
る文字要素毎の画像を切り出す仮切出手段と、切り出さ
れた文字要素の大きさに基づいて日本語文字の大きさで
ある文字サイズを推定する文字サイズ推定手段と、この
文字サイズ推定手段により推定された文字サイズに基づ
いて、横幅が文字サイズの一定割合よりも小さな文字要
素を半角候補文字として抽出する半角候補文字抽出手段
と、所定数以上の半角候補文字が連続し、かつ、この半
角候補文字列の前または後ろに所定長以上の余白部分が
存在するときに、当該半角候補文字列を英単語候補とし
て抽出する英単語候補抽出手段と、英単語候補を構成す
る各半角候補文字の行内での位置特徴、および当該半角
候補文字の構成画素の分布状態に対応した画素特徴を抽
出する画素特徴抽出手段と、半角英文字に関して、上記
位置特徴および画素特徴についての標準条件を記憶した
画素特徴記憶手段と、上記画素特徴抽出手段により抽出
された上記位置特徴および画素特徴と、上記特徴記憶手
段に記憶された標準条件とを照合して、位置特徴および
画素特徴が上記標準条件に合致しないときに、当該半角
候補文字を含む英単語候補を英単語候補から除外する英
単語候補修正手段と、英単語候補を構成する半角候補文
字は半角英文字であるものとして文字画像の切出しを行
い、残余の半角候補文字は日本語文字の一部を成すもの
として近傍の半角候補文字と再結合させて文字画像の切
出しを行う文字切出手段と、この文字切出手段により切
り出された画像に基づいて文字認識を行い、対応する文
字コードを出力する認識手段とを含むものである。
【0012】上記の構成によれば、行切出手段により切
り出された1行の文書画像から、文字を構成する画素の
塊である文字要素が仮切出手段によって切り出され、こ
の切り出された文字要素の大きさに基づいて当該文書画
像を構成する日本語文字の大きさである文字サイズが、
文字サイズ推定手段によって推定される。そして、推定
された文字サイズに基づいて、半角候補文字抽出手段で
は、横幅が文字サイズの一定割合よりも小さな文字要素
である半角候補文字が抽出される。さらに、この半角候
補文字が所定数以上連続し、かつ、この所定数以上の一
連の半角候補文字からなる半角候補文字列の前または後
ろに所定長以上の余白部分が存在するときに、半角候補
文字列が英単語候補として抽出される。
【0013】すわなち、日本語文書中に存在する半角英
文字は、一般に、単語を形成しており、しかも、前後に
余白が設けられている場合が多い。英単語候補文字抽出
手段での英単語候補文字の抽出は、日本語文書中の半角
英文字の上記のような特徴を利用したものである。英単
語候補が抽出されると、この英単語候補を構成する半角
候補文字に関して、行内での位置特徴と、当該半角候補
文字の構成画素の分布特徴に対応した画素特徴が抽出さ
れる。一方、位置特徴および画素特徴についての標準条
件は、画素特徴記憶手段に記憶されており、英単語候補
修正手段は、画素特徴抽出手段により抽出された位置特
徴および画素特徴を上記の標準条件と照合し、この標準
条件に合致しない半角候補文字を含む英単語候補を英単
語候補から除外する。
【0014】すなわち、英単語候補抽出手段での英単語
候補抽出処理は、文書画像のフォーマットの影響を受け
やすいため、必ずしも確実に英単語候補を抽出できると
は限らない。そこで、個々の半角候補文字の位置特徴お
よび画素特徴に基づいて各半角候補文字が英文字である
可能性を調べ、いずれか1つでも英文字ないものと判断
される半角候補文字を含む英単語候補を英単語候補から
除外することとしている。このようにして、英単語候補
を正確に抽出することが可能となる。
【0015】このように、英単語候補を構成する半角候
補文字の画素特徴を参照して英単語候補の修正を行うこ
ととしている結果、種々のフォーマットの文書に良好に
対応して、英単語候補を確実に抽出できる。これにによ
り、文書フォーマットに依らずに良好に切出処理を行わ
せて、文字認識処理を良好に行わせることができる。文
字切出手段では、英単語候補を構成する半角候補文字は
半角英文字であるものとして文字画像の切出しが行わ
れ、それ以外の半角候補文字は、日本語文字の一部をな
すものであるとして近傍の半角候補文字と再結合されて
切り出される。これにより、半角英文字は確実に半角文
字として切り出すことができ、また左右に分離している
全角分離文字については、再結合を行わせて切り出させ
ることができる。
【0016】この結果、全角分離文字が半角文字として
切り出されて認識処理が行われたり、半角英文字が全角
文字として切り出されて認識処理が行われたりすること
を有効に防ぐことができるから、文字認識処理の回数を
低減して、処理の高速化に寄与することができる。な
お、上記画素特徴には、半角候補文字を行方向の中心位
置で行方向に垂直な方向に走査したときに、白画素→黒
画素→白画素のように変化する変化点の数、または黒画
素→白画素→黒画素のように変化する変化点の数が含ま
れていてもよい。
【0017】請求項3記載の文字認識装置は、上記認識
手段は、認識可能な全ての文字の特徴量を記憶した認識
用辞書と、上記切り出された文字画像から特徴量を抽出
する特徴量抽出手段と、この特徴量抽出手段により抽出
された特徴量と上記認識用辞書に記憶されている各文字
の特徴量との類似度を算出する類似度算出手段と、この
類似度算出手段により算出された類似度が最大である文
字の文字コードおよびその類似度を出力する手段とを含
むものであり、上記出力された類似度が所定値未満であ
るときには、当該文字要素について上記文字切出手段に
よる文字画像の切出しとは異なる態様で文字画像の切出
しを再度行う再切出手段をさらに含むことを特徴とす
る。
【0018】この構成では、文字コードとともに出力さ
れる類似度が所定値未満であるときには、そのような文
字要素については再切出手段によって、文字画像の切出
しが再度行われる。すなわち、半角文字として切り出し
て認識したが類似度が低い場合には、近傍の半角候補文
字と再結合させて再切出しが行われ、また全角文字とし
て切り出して認識したが類似度が低い場合には、半角文
字として切出しが再度行われる。これにより、認識誤り
を低減して、確実な文字認識を行うことができる。
【0019】
【実施例】以下実施例を示す添付図面によって詳細に説
明する。図2は本発明の文字認識装置の一実施例である
光学的文字読取装置の基本的な構成を示すブロック図で
ある。原稿1の表面に形成された文書画像は、イメージ
スキャナ2により光学的に読み取られる。原稿1には、
日本語の文書が形成されており、この文書中には、半角
英文字で構成された英単語が含まれているものとする。
イメージスキャナ2の出力信号は、二値化部3で二値化
された後に、二値画像として画像メモリ4に記憶され
る。
【0020】画像メモリ4に記憶された文書画像は、切
出部5で1文字ずつの文字画像毎に切り出される。そし
て、切り出された画像に基づき、認識部6において文字
認識処理が行われ、当該文字に対応する文字コードが出
力される。図1は、切出部5の詳しい構成を示すブロッ
ク図である。画像メモリ4に記憶れた文書画像は、行切
出部51において1行ずつの画像ごとに切り出される。
この切り出された1行毎の画像は、仮切出部52に与え
られ、黒画素の塊である文字要素毎の画像に切り出され
る。
【0021】切り出された文字要素は、文字サイズ推定
部53に与えられ、公知の文字サイズ推定手法に基づい
て、日本語文字のサイズが推定される。この推定された
文字サイズは、半角候補文字抽出部54に与えられて、
文字サイズの一定割合以下の横幅の文字要素が、半角候
補文字として抽出される。抽出された半角候補文字は、
英単語候補抽出部55に与えられる。この英単語候補抽
出部55は、後述する手法によって、一定の条件を満た
す半角候補文字列を英単語候補として抽出する。
【0022】英単語候補が抽出されると、次に、英単語
候補を構成する各半角候補文字に関して、行内での位置
特徴や、各半角候補文字の構成画素の分布の特徴である
画素特徴が、画素特徴抽出部56で抽出される。抽出さ
れた画素特徴などは、照合部57において、画素特徴記
憶部58に記憶された画素特徴テーブルの内容と比較照
合される。この画素特徴テーブルには、半角英文字につ
いて、上記の位置特徴および画素特徴に関する標準条件
が記憶されている。
【0023】照合部57での照合結果は、英単語候補修
正部59に与えられる。この英単語候補修正部59は、
上記の照合結果に基づいて、英単語候補を構成する半角
候補文字の少なくともいずれか1つが英文字でないもの
と判断されるときに、このような半角候補文字を含む英
単語候補を英単語候補から除外する。この英単語候補修
正部59における詳しい処理については、後述する。
【0024】このようにして英単語候補の修正が行われ
て最終的に英単語候補が確定すると、文字切出部60で
は、英単語候補を構成する半角候補文字は、半角英文字
であるものとして文書画像からの画像切出を行う。一
方、英単語候補を構成しない半角候補文字は、隣接する
半角候補文字との再結合が行われて切り出される。すな
わち、このような半角候補文字は、全角分離文字の一部
をなす文字要素であるものとして切り出されることにな
る。
【0025】図3は、認識部6の詳しい構成を示すブロ
ック図である。切出部5からの1文字ごとの切出画像
は、特徴抽出部61に入力され、種々の特徴量が抽出さ
れることになる。抽出された特徴量は、類似度算出部6
2に与えられる。この類似度算出部62には、半角英数
字の特徴量を記憶した認識用辞書である英数字辞書63
と、半角英数字以外の認識可能な全ての文字の特徴量を
記憶した認識用辞書64とが接続されている。類似度算
出部62では、特徴抽出部62から与えられる特徴量
と、辞書63,64に記憶された特徴量との類似度が計
算される。そして、最大の類似度を有する文字が見出さ
れ、その文字の文字コードとその類似度とが出力部65
から出力されることになる。
【0026】なお、上記最大の類似度は切出部5にも与
えられ、この類似度が所定値未満のときには、切出ミス
であるものと判断されて、当該文字要素について再度の
切出処理が行われる。図4は文字認識処理を説明するた
めのフローチャートである。ステップn1では、画像メ
モリ4に文書画像が入力される。ステップn2では、行
切出部51において、行方向に関して黒画素の周辺分布
が計算され、行切出位置および行幅が求められて、1行
の画像の切出しが行われる。すなわち、図5に示すよう
に、行方向に関して黒画素数が累積され、参照符号a1
で示すヒストグラムが作成される。このヒストグラムに
基づいて行幅Vが算出される。さらに、行切出位置L
1,L2,L3,・・・・も算出されることになる。この行
切出位置L1,L2,L3,・・・・および行幅Vに基づい
て、1行の画像の切出しが行われる。
【0027】次に、ステップn3では、仮切出部52に
おいて、行切出部51により切り出された各行の画像毎
に、行方向に垂直な方向に関して黒画素の周辺分布が求
められる。すなわち、図6に示すように、切り出された
各行の画像において行方向に垂直な方向に関して黒画素
数が累積され、参照符号a2で示すヒストグラムが作成
される。そして、このヒストグラムに基づいて、黒画素
の塊である各文字要素の切出位置hk(ただし、k=
1,2,3,・・・・である。)および横幅Hkが計算され
る。このようにして、文字要素の切出しが達成される。
【0028】ステップn4では、図7に示すように各文
字要素毎に、行幅Vの範囲内で、文字の縦方向の黒画素
の周辺分布b1,b2,b3,・・・・が求められ、各文字
要素の縦幅V1,V2,V3,・・・・が算出される。そし
て、ステップn5では、算出された縦幅V1,V2,V
3,・・・・などに基づいて、各文字要素を行方向または行
垂直方向に沿う四辺で囲む最小の矩形が求められ、この
矩形が囲み切出矩形とされる。さらに、囲み切出矩形の
大きさから、文字サイズ推定部53において、日本語文
字の大きさである文字サイズの推定が行われる。この文
字サイズの推定には、たとえば「横書き日本語文書にお
ける個別文字の抽出(信学論'85/11, Vol.J68-D No.11,
第1899頁」などに開示されている公知技術を適用するこ
とができる。
【0029】ステップn6では、半角候補文字抽出部5
4において、囲み切出矩形の大きさと文字サイズとの関
係から、半角候補文字が抽出される。この半角候補文字
とは、切出幅の推定文字サイズに対する割合が一定値よ
りも小さな文字要素のことである。この半角候補文字の
抽出処理は、図8に示されている。すなわち、隣接する
一対の文字要素の結合の横幅W1,W2,W3,・・・・が
算出され、この算出された横幅W1,W2,W3,・・・・
がステップn5で推定された文字サイズと比較される。
図8において、実線で示されている横幅W1,W3〜W
9,W11は文字サイズ以下であり、破線で示された横
幅W2,W10,W12,W13は文字サイズを超えて
いる。この横幅W1,W2,・・・・に基づき、1つの文字
要素に関連する2つの横幅WjおよびW(j+1)(j
=1,2,3,・・・・)の少なくともいずれか一方が文字
サイズ以下であれば、当該文字要素は半角候補文字とさ
れる。一方、2つの横幅WjおよびW(j+1)のいず
れもが文字サイズを超えているときには、当該文字要素
は半角候補文字からは除外される。したがって、図8の
場合には、文字要素21〜32は、半角候補文字とさ
れ、文字要素33,34は半角候補文字からは除外さ
れ、全角文字としての文字切出処理が行われることにな
る。
【0030】図9は、半角候補文字の具体的な抽出方法
を説明するためのフローチャートである。この処理は、
図4のステップn2で抽出した各行の画像毎に行われ
る。ステップs1では、処理中の文字要素を計数するた
めのパラメータmに1が代入される。ステップs2で
は、変数Wに、m番目の文字要素の横幅HWmと、(m
+1)番目の文字要素の横幅HW(m+1)と、m番目
の文字および(m+1)番目の文字の間隔Smとの和が
代入される。この変数Wが上記の横幅W1,W2,W
3,・・・・に対応する。
【0031】次に、ステップs3では、変数Wが、図4
のステップn5で抽出した文字サイズ以下であるかどう
かが判断される。変数Wが文字サイズ以下であるとき
に、ステップs4でm番目および(m+1)番目の文字
要素が半角候補文字とされる。ステップs5では、パラ
メータmがインクリメントされ、ステップs6での処理
により、パラメータmが(文字要素の数−1)となるま
で同様の処理が行われる。ステップs3で変数Wが文字
サイズを超えているものと判断されるときには、ステッ
プs4を経ずにステップs5に移る。このような処理に
よって、隣接する文字要素と結合し得ない文字要素が半
角候補文字として抽出されることになる。
【0032】再び図4を参照する。半角候補文字は、切
り出された文字要素のサイズからは、半角文字であるの
か、左右に分離された形態を有する全角分離文字の一部
であるのかが判断できない。このため、図4のステップ
n7では、英単語候補抽出部55において、一定の条件
を満たす半角候補文字列が英単語候補として抽出され
る。
【0033】一般に、日本語文書中に混在する英単語を
構成する半角文字列は、図10(a)に示すように略等し
い間隔S1 ,S2 ,・・・・,S6 (S1 ≒S2 ≒・・・・≒S
6 )で印字(以下「等間隔印字」という。)されるか、
または、図10(b) に示すように略等しいピッチP1
2 ,・・・・,P6 (P1 ≒P2 ≒・・・・≒P6 )で印字
(以下「等ピッチ印字」という。)される。等ピッチ印
字では、間隔S1 ,S2 ,・・・・,S6 のばらつきが大き
いのが通常である。したがって、半角候補文字がほぼ一
定間隔またはほぼ一定のピッチで一定数以上連なってい
れば、このような半角候補文字列は英単語を構成してい
る可能性が高い。
【0034】さらに、日本後文書中に混在する英単語
は、その前後にある程度の余白が設けられるという特徴
がある。そこで、本実施例では、図11に示すように、
半角候補文字がほぼ一定間隔または一定ピッチで一定数
(たとえば4個)以上連なることを第1の条件とし、そ
のようなひとつながりの半角候補文字列のうちで一番後
ろに位置する半角候補文字とその次に位置する文字要素
との間隔が大きく開いていることを第2の条件として、
この第1および第2の条件を満たす半角候補文字列が英
単語候補として抽出される。
【0035】たとえば、図11に示す例では、半角候補
文字C21〜C28は、ピッチP21,P22,P23
24,P25,P26,P27で並んでおり、また、各半角候
補文字C21〜C28間の各間隔は、S21,S22
23,S24,S25,S26,S27となっている。この場
合、 P21≒P22≒P23≒P24≒P25≒P26≒P27≪P28 ・・・・ (1) または S21≒S22≒S23≒S24≒S25≒S26≒S27≪S28 ・・・・ (2) が成り立つから、半角候補文字C21〜C27は、ほぼ
一定ピッチまたはほぼ一定ピッチで一定数以上連なって
いると言える。すなわち、半角候補文字C21〜C28
からなる文字列は、上記の第1の条件を満たす。
【0036】このようなほぼ一定間隔またはほぼ一定ピ
ッチで並んでいる半角候補文字列を構成する半角候補文
字C21〜C27のうち、一番後ろの半角候補文字C2
7の次の間隔S28が大きいから、半角候補文字C21〜
C27からなる半角候補文字列は、結局上記第2の条件
をも満たす。この結果、この間隔S28より前の半角候補
文字列が英単語候補とされることになる。
【0037】その一方で、キャラクタ「が」を構成する
半角候補文字列C31,C32は、その直後の間隔S32
が小さすぎ、また半角候補文字も2つしか連なっていな
いので、英単語候補とは判定されない。また、キャラク
タ「は」を構成する2つの半角候補文字C11,C12
は、後ろの間隔S12は充分大きいが、半角候補文字が2
つしか連なっていないから、英単語候補とは判定されな
い。
【0038】このようにして、文字列「Einstei
n」を構成する半角候補文字列C21〜C27が英単語
候補として抽出されることになる。このようにして、英
単語候補が抽出されると、次に、図4のステップn8で
は、画素特徴抽出部56において、図12に示されるよ
うに、英単語候補を構成する各半角候補文字の画素特徴
などが抽出される。この画素特徴とは、たとえば、各半
角候補文字を行方向に関する中心位置で縦方向に走査し
たときに、白画素→黒画素→白画素のような変化が生じ
る変化点の数numなどである。各半角候補文字の走査
結果は、図12において参照符号d1〜d4で示されて
おり、太線部分は走査線30上の画素が黒画素であるこ
とを示し、細線部分は走査線30上の画素が白画素であ
ることを示す。
【0039】たとえば、図12(a) において、走査線3
0に沿って半角候補文字「E」を走査すると、上記のよ
うな変化点は参照符号c1,c2,c3で示す3個とな
る(すなわちnum=3である。)。同様に、図12
(b),(c),(d) から、半角候補文字「i」ではnum=
2、半角候補文字「n」ではnum=1、半角候補文字
「s」ではnum=3となる。
【0040】なお、図13は、キャラクタ「は」の分離
された各文字要素に関して上記と同様な走査を行った結
果を参考のために示したものである。図14は画素特徴
抽出部56で抽出されるその他の画素特徴を説明するた
めの図である。半角候補文字の上記の走査の際には、走
査線30上において、連続した白画素からなる白画素群
と連続した黒画素からなる黒画素群との各構成画素数が
計数される。すなわち、走査線30に従った走査におい
て、最初に現れる白画素群の画素数W(1)、その次に
現れる最初の黒画素群の画素数B(1)、その次に現れ
る2番目の白画素群の画素数W(2)、その次に現れる
2番目の黒画素群の画素数B(2)、・・・・が計数され
る。
【0041】さらに画素特徴抽出部56では、行内での
半角候補文字の相対位置などを表す位置特徴として、行
幅V内における半角候補文字の囲み切出矩形35の上部
余白SUおよび下部余白SLも求められ、行内での文字
の相対位置が調べられる。この余白SUおよびSLは、
いずれも、画素数で表されるデータである。これらのデ
ータの他に、さらに、上記図7に示された処理により求
められたヒストグラムから、半角候補文字の縦方向の分
離数SPが求められ、この分離数SPも位置特徴とされ
る。すなわち、キャラクタ「d」では、SP=1であ
り、キャラクタ「i」では、SP=2である。
【0042】上記のような画素特徴の抽出結果の一例
は、上記の図12に示されている。また、参考のため
に、図13には、キャラクタ「は」の分離された各文字
要素に関して画素特徴を抽出した例が示されている。図
1の画素記憶部58には、半角英文字の位置特徴および
画素特徴に関する標準条件を格納したテーブルが記憶さ
れている。このテーブルを参照することにより、図4の
ステップn9では、照合部57および英単語候補修正部
50での処理によって、英単語候補を構成する半角候補
文字が半角英文字であるかどうかが再度調べられ、英単
語候補の修正が行われる。すなわち、上記テーブルと抽
出された位置特徴および画素特徴とが照合され、英単語
候補とされた文字要素列を構成する半角候補文字のう
ち、いずれか1つでも英文字に該当しないものがあれ
ば、このような半角候補文字を含む英単語候補は、英単
語候補から除外される。
【0043】上記のテーブルに記憶された標準条件は、
たとえば、下記表1に示すようなものである。すなわ
ち、変化点の数num=1の場合には、当該半角候補文
字の位置条件として、分離度SPが1の場合に、半角英
数字であるものと判定される。また、変化点の数num
=2の場合には、位置条件として分離度SP=1である
場合と、位置条件として分離度SP=2を満たし、か
つ、画素条件としてB(2)>B(1)×4を満たす場
合とに、当該半角候補文字が英数字であるものと判定さ
れる。さらに、変化点の数num=3の場合において、
当該半角候補文字が英数字であると判定されるのは、位
置条件として分離度SP=1かつSU+W(4)>Vi
×0.09を満たし、さらに画素条件として(Vi−W
(1)−W(4))>Vi×0.7を満たす場合であ
る。さらに、変化点の数num=4の場合には、分離度
SP=1であって、かつSU>V×0.26なる位置条
件が満たされる場合に、半角候補文字が英数字であるも
のと判定される。なお、図14に示されているように、
Viは囲み切出矩形35の縦幅であり、Vは行幅であ
る。
【0044】
【表1】
【0045】この照合の結果、英単語候補を構成する半
角候補文字の全てが、上記表1の標準条件を満たしてい
れば、このような半角候補文字列は英単語候補として確
定される。その一方で、英単語候補を構成するいずれか
1つの半角候補文字が上記表1の標準条件を満たさない
場合には、このような文字列は英単語候補でないものと
して、英単語候補から除外される。
【0046】図15は、英単語候補を抽出するための処
理を説明するためのフローチャートであり、図4のステ
ップn7〜n9の具体的な処理が示されている。ステッ
プr1では、パラメータiに1が代入され、別のパラメ
ータCOUNTに0が代入される。次にステップr2で
は、パラメータiが当該行内の文字要素の数に達したか
どうかが判断され、文字要素の数に達していれば処理を
終了する。パラメータiが文字要素の数に達する以前で
あれば、ステップr3において、当該行を構成するi番
目の文字要素が半角候補文字であるかどうかが判断され
る。半角候補文字でないときには、ステップr13でパ
ラメータiがインクリメントされた後にステップr2に
戻り、半角候補文字であるときにはステップr4進む。
【0047】ステップr4では、i番目の文字要素と
(i+1)番目の文字要素との間隔が変数Sに代入さ
れ、また、i番目の文字要素と(i+1)番目の文字要
素とのピッチが変数Pに代入される。さらに、パラメー
タCOUNTに1が代入される。そしてステップr5で
パラメータiがインクリメントされた後に、ステップr
6では、インクリメントされた後のiに従って、i番目
の文字要素は半角候補文字であるかどうかが判断され
る。半角候補文字でなければステップr13に進み、半
角候補文字なら、ステップr7で上記の画素特徴などが
抽出される。
【0048】次にステップr8では、抽出された画素特
徴などが、上記表1に示されたテーブルと照合される。
ステップr9では、変数Sと、i番目の文字要素と
(i+1)番目の文字要素との間の間隔とがほぼ等しい
かどうか、変数Pと、i番目の文字要素と(i+1)
番目の文字要素とのピッチがほぼ等しいかどうか、i
番目の文字要素は行末の文字要素かどうかが、それぞれ
判断される。そして、上記〜のいずれか1つについ
て肯定的な判断がなされると、ステップr10でパラメ
ータCOUNTがインクリメントされてステップr5に
戻る。また、上記〜のすべてについて否定的な判断
がなされたときには、ステップr11に進む。
【0049】ステップr11では、パラメータCOUN
Tが3よりも大きいかどうかが判断れ、3よりも大きけ
れば(すなわちCOUNT=4となると)、ステップr
12において、(i−COUNT)番目からi番目の文
字要素が英単語を構成する文字要素であるものとされ
る。この後の処理はステップr13に進む。なお、ステ
ップr11で、パラメータCOUNTが3以下である場
合には、ステップr12を経ずにステップr13に進
み、次の文字要素についての処理が行われる。
【0050】このようにして、一定間隔または一定ピッ
チで一定数以上の半角候補文字が連続しており、かつ各
半角候補文字が半角英文字であると判断されるときに、
このような半角候補文字列が英単語候補として抽出され
ることになる。再び図4を参照して、英単語候補が抽出
された後の処理を説明する。ステップn10では、切出
位置の修正が行われる。すなわち、英単語候補を構成す
る半角候補文字については、ステップn3での文字要素
の切出位置をそのまま用いればよいが、英単語候補を構
成しない半角候補文字は、全角分離文字の一部をなす文
字要素である可能性が高いため、切り出すべき画像の再
構成が必要となる。すなわち、隣接する半角候補文字同
士を結合させて切り出すために、切出位置の修正が行わ
れるのである。
【0051】次に、ステップn11では、文字切出部6
0(図1参照)において1文字ごとの画像である文字画
像が切り出され、この文字画像と英数字辞書63または
認識用辞書64(図3参照)を参照することで、文字認
識処理が行われる。すなわち、切り出された文字画像か
ら特徴量が抽出され、この抽出された特徴量と辞書6
3,64に記憶された各文字の基準となる特徴量との類
似度が計算される。そして、類似度が最大となる文字の
文字コードが、認識候補としてその類似度とともに出力
部65から出力される。
【0052】このような認識処理において、類似度算出
部62では、英単語候補を構成する半角候補文字につい
ては、英数字辞書63を参照し、その他の文字要素につ
いては認識用辞書64を参照する。したがって、英単語
候補を構成する文字要素については、類似度計算の対称
となる文字が半角英数字に限定されるので、類似度計算
が格段に簡単に行える。これにより、認識処理が高速化
されることになる。なお、英単語候補を構成する半角候
補文字については、英単語を構成する文字を認識するた
めの既存のあらゆる手法を適用できる。
【0053】ステップn12では、認識候補の類似度が
所定値を超えているかどうかが判断され、認識候補の類
似度が著しく低いとき、たとえば平均類似度の1割未満
であるときには、切出ミスであると判断され、ステップ
n12からステップn10に戻って切出位置の修正が行
われる。すなわち、切出ミスとされた文字要素が英単語
候補を構成する半角候補文字であるときには、この文字
要素が全角分離文字の一部を構成する文字要素であるも
のとして切出しがやり直される。また、全角分離文字の
一部を構成するものとされた文字要素に関して切出ミス
と判断されたときには、当該文字要素が半角文字である
ものとして、文字画像の切出が再度行われる。このよう
にして、再度切り出された文字要素に関して、上記の文
字認識処理が行われることになる(ステップn11)。
【0054】以上のように本実施例の光学的文字読取装
置では、認識処理を行うことなく半角英文字からなる英
単語候補を抽出することができるから、文字の切出を高
速に行うことができる。しかも、英単語候補の抽出に
は、日本語文書中に含まれる英単語のレイアウト上の特
徴のほか、各半角候補文字の位置特徴や画素特徴を参照
して行われているから、文書フォーマットの異なる種々
の文書に良好に対応して、英単語候補を正確に抽出する
ことができる。したがって、文字の切出しを文書フォー
マットによらずに正確に行わせることができ、この結
果、文字認識処理の高速化に寄与することができる。
【0055】また、文字認識の過程で英単語候補が抽出
されるので、たとえば1文字ずつの文字認識の後に、英
単語のスペリングを調べるスペルチェックなどの処理を
容易に行うことができるという利点がある。なお、本発
明は上記の実施例に限定されるものではない。たとえば
上記の実施例では、英単語候補の抽出の際に、所定数以
上の半角候補文字列の後ろに所定長以上の余白が形成さ
れていることを条件としたが、このような条件の代わり
に、所定数以上の半角候補文字列の前に所定長以上の余
白が形成されていることを条件としたり、所定数以上の
半角候補文字列の前と後ろの両方に所定長以上の余白が
形成されていることを条件としたりしてもよい。
【0056】また、上記の実施例では、画素特徴の1つ
として、半角候補文字の行方向に関する中心位置での縦
方向への走査において、白画素→黒画素→白画素のよう
に変化する変化点の数numを採用しているが、このよ
うな画素特徴の代わりに黒画素→白画素→黒画素のよう
に変化する変化点の数を採用してもよい。さらに、上記
の実施例では、白地に黒色の文書画像が形成されている
場合を例に採ったが、黒地に白色の文書画像が形成され
ている場合についても、本発明は容易に応用することが
できる。すなわち、この場合には、白画素の塊を文字要
素として抽出することになる。
【0057】さらに、上記の実施例では、文書画像は、
原稿を光学的に読みとるようにして画像メモリ4に入力
されているが、文書画像を表すデータを通信回線を介し
て取得し、この取得した画像データを画像メモリに記憶
させる構成としてもよい。その他、本発明の要旨を変更
しない範囲で種々の設計変更を施すことが可能である。
【0058】
【発明の効果】以上のように本発明の文字認識装置によ
れば、日本語文書中に混在する半角英文字は英単語を構
成していることが多いことを利用して、英単語候補を抽
出することによって、文字画像の切出しの最適化が図ら
れている。これにより、半角文字は当初から半角文字と
して切り出し、全角分離文字は当初から半角候補文字同
士を再結合させた状態で切り出すことができるから、文
字切出処理を正確に行うことができる。しかも、英単語
候補の抽出は、文字認識処理を要することなく行われる
から、正確な切出処理を高速に行うことができ、したが
って文字認識処理を高速化することができる。
【0059】さらに、英単語候補の抽出に当たっては、
文書画像のレイアウトの特徴のほか、英単語候補を構成
する各半角候補文字の位置特徴や画素特徴をも参照して
いるので、文書フォーマットの相違に依らずに英単語候
補の抽出を良好に行うことができる。これにより、切出
処理の一層の最適化が図られるから、文字切出処理を極
めて正確に行うことができ、文字認識処理の回数を低減
して、全体の認識処理に要する時間を短縮することがで
きるようになる。
【図面の簡単な説明】
【図1】本発明の文字認識装置の一実施例である光学的
文字読取装置の要部の構成を示すブロック図である。
【図2】光学的文字読取装置の全体の構成を示すブロッ
ク図である。
【図3】認識部の詳しい構成を示すブロック図である。
【図4】本発明の一実施例の文字認識装置による文字認
識処理を説明するためのフローチャートである。
【図5】1行毎の画像の切出処理を説明するための図で
ある。
【図6】文字要素毎の画像の切出処理を説明するための
図である。
【図7】各文字要素の周辺分布を求めた例を示す図であ
る。
【図8】半角候補文字の抽出処理を説明するための図で
ある。
【図9】半角候補文字の抽出処理を説明するためのフロ
ーチャートである。
【図10】日本語文書中に混在している半角英文字の印
字特徴を説明するための図である。
【図11】英単語候補の抽出処理を説明するための図で
ある。
【図12】画素特徴の抽出処理を説明するための図であ
る。
【図13】画素特徴の抽出処理を説明するための図であ
る。
【図14】画素特徴を説明するための図である。
【図15】英単語候補の抽出処理を説明するためのフロ
ーチャートである。
【図16】従来技術の問題点を説明するための図であ
る。
【図17】他の従来技術の問題点を説明するための図で
ある。
【符号の説明】
5 切出部 6 認識部 51 行切出部 52 仮切出部 53 文字サイズ推定部 54 半角候補文字抽出部 55 英単語候補抽出部 56 画素特徴抽出部 57 照合部 58 画素特徴記憶部 59 英単語候補修正部 60 文字切出部 61 特徴抽出部 62 類似度算出部 63 英数字辞書 64 認識用辞書 65 出力部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】日本語文字および英文字が混在している文
    書画像の各文字を認識し、文字コードに変換して出力す
    る文字認識装置であって、 入力画像の行方向の周辺分布をとり、1行ずつの画像を
    切り出す行切出手段と、 この行切出手段により切り出された1行毎の画像につい
    て、行方向に垂直な方向に関する周辺分布をとり、文字
    を構成する画素の塊である文字要素毎の画像を切り出す
    仮切出手段と、 切り出された文字要素の大きさに基づいて日本語文字の
    大きさである文字サイズを推定する文字サイズ推定手段
    と、 この文字サイズ推定手段により推定された文字サイズに
    基づいて、横幅が文字サイズの一定割合よりも小さな文
    字要素を半角候補文字として抽出する半角候補文字抽出
    手段と、 所定数以上の半角候補文字が連続し、かつ、この半角候
    補文字列の前または後ろに所定長以上の余白部分が存在
    するときに、当該半角候補文字列を英単語候補として抽
    出する英単語候補抽出手段と、 英単語候補を構成する各半角候補文字の行内での位置特
    徴、および当該半角候補文字の構成画素の分布状態に対
    応した画素特徴を抽出する画素特徴抽出手段と、 半角英文字に関して、上記位置特徴および画素特徴につ
    いての標準条件を記憶した画素特徴記憶手段と、 上記画素特徴抽出手段により抽出された上記位置特徴お
    よび画素特徴と、上記特徴記憶手段に記憶された標準条
    件とを照合して、位置特徴および画素特徴が上記標準条
    件に合致しないときに、当該半角候補文字を含む英単語
    候補を英単語候補から除外する英単語候補修正手段と、 英単語候補を構成する半角候補文字は半角英文字である
    ものとして文字画像の切出しを行い、残余の半角候補文
    字は日本語文字の一部を成すものとして近傍の半角候補
    文字と再結合させて文字画像の切出しを行う文字切出手
    段と、 この文字切出手段により切り出された画像に基づいて文
    字認識を行い、対応する文字コードを出力する認識手段
    とを含むことを特徴とする文字認識装置。
  2. 【請求項2】上記画素特徴には、半角候補文字を行方向
    の中心位置で行方向に垂直な方向に走査したときに、白
    画素→黒画素→白画素のように変化する変化点の数、ま
    たは黒画素→白画素→黒画素のように変化する変化点の
    数が含まれていることを特徴とする請求項1記載の文字
    認識装置。
  3. 【請求項3】上記認識手段は、 認識可能な全ての文字の特徴量を記憶した認識用辞書
    と、 上記切り出された文字画像から特徴量を抽出する特徴量
    抽出手段と、 この特徴量抽出手段により抽出された特徴量と上記認識
    用辞書に記憶されている各文字の特徴量との類似度を算
    出する類似度算出手段と、 この類似度算出手段により算出された類似度が最大であ
    る文字の文字コードおよびその類似度を出力する手段と
    を含むものであり、 上記出力された類似度が所定値未満であるときには、当
    該文字要素について上記文字切出手段による文字画像の
    切出しとは異なる態様で文字画像の切出しを再度行う再
    切出手段をさらに含むことを特徴とする請求項1または
    2記載の文字認識装置。
JP3260659A 1991-10-08 1991-10-08 文字認識装置 Pending JPH05101220A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3260659A JPH05101220A (ja) 1991-10-08 1991-10-08 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3260659A JPH05101220A (ja) 1991-10-08 1991-10-08 文字認識装置

Publications (1)

Publication Number Publication Date
JPH05101220A true JPH05101220A (ja) 1993-04-23

Family

ID=17350994

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3260659A Pending JPH05101220A (ja) 1991-10-08 1991-10-08 文字認識装置

Country Status (1)

Country Link
JP (1) JPH05101220A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7162086B2 (en) 2002-07-09 2007-01-09 Canon Kabushiki Kaisha Character recognition apparatus and method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7162086B2 (en) 2002-07-09 2007-01-09 Canon Kabushiki Kaisha Character recognition apparatus and method

Similar Documents

Publication Publication Date Title
US6047251A (en) Automatic language identification system for multilingual optical character recognition
JP2575539B2 (ja) 書類上の金額フィールドの位置特定方法および識別方法
EP2545495B1 (en) Paragraph recognition in an optical character recognition (ocr) process
JP2734386B2 (ja) 文字列読み取り装置
US20040006467A1 (en) Method of automatic language identification for multi-lingual text recognition
EP0621553A2 (en) Methods and apparatus for inferring orientation of lines of text
EP0195779A1 (en) Cryptographic analysis system
US7680329B2 (en) Character recognition apparatus and character recognition method
JPH04195692A (ja) 文書読取装置
JP2000293626A (ja) 文字認識方法及び装置ならびに記憶媒体
US8787702B1 (en) Methods and apparatus for determining and/or modifying image orientation
JP2000315247A (ja) 文字認識装置
JPH0634256B2 (ja) 接触文字切出し方法
CN113610068A (zh) 基于试卷图像的试题拆解方法、系统、存储介质及设备
Saitoh et al. Document image segmentation and layout analysis
Kumar et al. Line based robust script identification for indianlanguages
JPH05101220A (ja) 文字認識装置
JP2008084105A (ja) 文字切出方法及び文字認識装置
JP2001022883A (ja) 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
JP2004046723A (ja) 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置
JP2851102B2 (ja) 文字切出し方法
JPH02230484A (ja) 文字認識装置
JP3226355B2 (ja) 認識結果評価方法
JP2746345B2 (ja) 文字認識の後処理方法
JP2895115B2 (ja) 文字切出し方法