JPS59180783A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPS59180783A
JPS59180783A JP58055980A JP5598083A JPS59180783A JP S59180783 A JPS59180783 A JP S59180783A JP 58055980 A JP58055980 A JP 58055980A JP 5598083 A JP5598083 A JP 5598083A JP S59180783 A JPS59180783 A JP S59180783A
Authority
JP
Japan
Prior art keywords
character
pattern
detection
detected
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58055980A
Other languages
English (en)
Other versions
JPH0782524B2 (ja
Inventor
Hiromi Nanba
難波 広海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP58055980A priority Critical patent/JPH0782524B2/ja
Publication of JPS59180783A publication Critical patent/JPS59180783A/ja
Publication of JPH0782524B2 publication Critical patent/JPH0782524B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、特に連続した文字列の読取処理を行なう光学
的文字読取装置に関する。
〔発明の技術的背景とその問題点〕
一般に、光学的文字読取装置では、用紙上に記録された
文字列に対して、1文字毎の検出切出処理が行なわれる
。そして、切出された文字が、文字認識部で認識される
こと正こなる。したがって、文字の検出切出処理は、文
字読取性能に大きな影響を与えることになり、極めて重
要である。
ところで、検出切出処理において、第1図(a)に示す
ような隣接した文字列が、セリフ(serif)および
印字ずれ等の理由により接続している場合、確実な検出
切出は極めて困難である。このような場合、従来では以
下のような検出切出方法が行なわれている。即ち、まず
第1図(a)に示すように、連続した文字ブロックの左
端XIから文字ピッチPだけ離れた位置()M+P)の
近傍に幅Wlの境界検出領域を設定する。この境界検出
領域内を、同図(b)に示すように縦方向に走査し、各
走査線l〜6中の黒ビット数を計数する。この黒ビット
の計数値列(ヒストグラム)から文字の境界を求める。
この境界の決定方法は、例えば黒ビット数の最小値の位
置または黒ビット数の変化量最大の位置等から選択して
なされる。例えば、同図(b)に示す各走査線1〜6中
の黒ビット数が、それぞれ15,14゜1B、14,6
.4ビツト数であれば、第5木目の走査線5の位置X2
が境界となる。そして、このように決定された境界位置
X2に基づいて、検出切出処理が行なわれる。さらに、
次の文字については、位置X2を起点として、上記と同
様な操作が行なわれ、境界位置X3が求められる。
しかしながら、上記のような従来の方式では、例えば第
1図(a)に示すように左端の文字幅(文字Iの幅)が
ピッチPよりも狭い場合、本来の正常な境界位置Bより
も右方向の位置が境界位置X2となり、次の文字を分断
して認識する不都合がある。才だ、文字幅がピッチPよ
り広い場合(印字が濃くて太くなった場合など)、第1
図(C)に示すようにその文字自身を分断して認識する
ことになる。即ち、従来方式では、1文字単位に文字境
界の検出判定を行なうため、異種フォントの混在、印字
濃度(こよる文字幅の変動および印字の位置ずれなどが
存在すると、切出位置を誤まって検出することが多い。
一度、切出位置の検出をミスすると、後続する文字の検
出切出も誤まる可能性が高いなど、文字列全体の読取が
不安定になる欠点があった。さらに、ブロポーシャル(
proportional )文字、即ち文字ピッチが
一定でなく文字幅に応じて詰めて印字される文字の読取
は不可能であった。
〔発明の目的〕
本発明は上記の事情に鑑みてなされたもので、その目的
は、連続した文字列およびブロポーシャル文字等の場合
でも、!実な検出切出処理を実現して安定な文字読取を
行なうことができる光学的文字読取装置を提供すること
にある。
〔発明の概要〕
本発明では、文字の検出切出手段において、少なくとも
連続した2文字分以上の文字パターンを格納するパター
ンメモリが設けられる。このパターンメモリ内の文字パ
ターンに対する垂直射影ヒストグラムが求められる。こ
の垂[[射影ヒストグラムに基づいて、文字の検出切出
候補位置が検出される。この検出切出候補位置から、連
続する少なくとも2文字分について検出切出位置が、選
択される。そして、選択された検出切出位置でパターン
メモリ内の文字パターンを切出して、その1文字分の文
字認識が行なわれる。この文字認識結果が利足手段によ
り文字の特徴を有しているか否かを判定され、その判定
結果で検出切出位置の妥当性が判定される。
〔発明の実施例〕
以下図面を参照して本発明の一実施例について説明する
。第2図は本発明に係る光学的文字読取装置の部分的構
成を示すブロック図である。
図中、1は走査器で、用紙上の文字情報を走査し光電変
換した文字パターンを出力する。パターンメモリ2は、
走査器lからの文字パターンを例えば1行分格納する。
XおよびYアドレスカウンタ3,4は、パターンメモリ
2のXおよびY座標を指定する。5は黒ビツトカウンタ
(Bカウンタ)で、パターンメモリ2内を走査して得ら
れる信号の中で文字パターンを構成する黒ビット数を計
数する。6は1文字パターンメモリで、パターンメモリ
2から1文字分切出された文字パターンを格納する。認
識部7は、1文字パターンメモリ6内の文字パターンを
読出して文字認識を行なって、その認識結果をマイクロ
プロセッサ8に出力する。マイクロプロセッサ8は、B
カウンタ5からの計数結果に基づいてパターンメモリ2
内の文字パターンに対する検出切出位置を決定する機能
を有し、さらに認識部7から認識結果に基づいて検出切
出の妥当性を判定する機能を有する。
このような構成において、その動作を第3図および第4
図を参照して説明する。まず、走査器Iにより用紙上の
1行分の文字パターン(才たは2文字分以上からなる1
フイ一ルド分でもよい)が走査されて、パターンメモリ
2に格納される。次に、パターンメモリ2内を走査して
、1文字分が検出切出される。この場合、マイクロプロ
セッサ8は、パターンメモリ2内の文字パターンの垂直
射影ヒストグラムを作成して、この垂直射影ヒストグラ
ムに基づいて検出切出を行なう。この垂直射影ヒストグ
ラムは、文字パターンに対して上から下へ投影した射影
で、Yアドレスカウンタ4をインクリメントしつつBカ
ウンタ5で黒ビット数をカウントした際の計数結果によ
り作成される。マイクロプロセッサ8は、各文字間が十
分分離していると判定した場合、パターンメモリ2内の
文字パターンに対して上下方向位置を検出した後(Xア
ドレスカウンタ3を操作する)、検出切出した文字パタ
ーンを1文字パターンメモリ6へ転送して文字認識を行
なうように制御する。
一方、各文字間が第3図に示すように、分離していない
場合、まず基準点XZから文字ピッチPおよび2P離れ
た両者の位置の近傍に幅W2の境界検出領域を設定する
。この境界検出領域内に対して、Yアドレスカウンタ4
の動作によりパターンメモリ2内を縦方向に走査する。
この走査器こよる各走査線中の黒ビット数が、Bカウン
タ5で計数される。但し、上記のような垂m射影ヒスト
グラムが作成されていれば、そのデータを使用してもよ
い。マイクロプロセッサ8は、黒ビット数の計数値列(
ヒストグラム)に基づいて、文字の検出切出候補点を検
出する。
この場合、候補点は、例えば黒ビット数の極小点、増加
量最大の点および減少量最大の点などであり、この実施
例では第3図に示すようにX2.、X22.X3.、X
3!の4点である。
次に、マイクロプロセッサ8は、検出切出候補点列X2
..X2□vX3I、Xs2の中から、2文字分(2文
字しか接続していない場合は1文字分)の検出切出候補
点を選択する。この場合、まず候補点としてX1+Pお
よびXl+2Pの両者のそれぞれζこ最も近い点を選択
する。そして、選択された検出切出候補点でパターンメ
モリ2から文字パターンを切出して、その文字認識を行
なう。この舘識結果により、2文字とも認識できた場合
には、正しく検出切出しされたものと判定し、その2文
字分の処理を終了し次の文字の処理ζこ移る。また、少
なくとも一方の文字が認識できなかった場合(リジェク
ト)には、検出切出候補点の選択を再度行なう。この場
合、リジェクトされた方の文字の切出位置が、変化する
ような候補点を優先して選択する。
その後、上記のように再度、文字パターンを切出して、
その文字認識を行なう。そして、検出切出候補点の全て
の組合せ(但し、文字幅が許容範囲外になる組合せを除
く)に対して、認識できなかった場合には、各認識結果
のうち最良の結果(例えばパターンマツチング法の場合
、類似度の和が最大のもの等)をその認識結果とする(
第4図の結果判定)。
具体的には、第3図において仮にXJ+PおよびXl+
2Pの両者に最も近い点でX2□。
X 3.を候補点として選択したとする。そして、上記
のような一連の動作の結果、第1文字はrlJと認識さ
れ、第2文字(本来はm)はリジエク)(こなったとす
る。そこで、第2文字の右方向の検出切出候補点をX3
Iにして、再度文字認識を行なう。この認識結果で、第
1文字は「l」と認識され、第2文字は再度リジェクト
になったとする。第2文字の右方向の検出切出候補点は
他にないので、今度は左方向の検出切出候補点をX21
とする。この場合、第2文字の右方向の候補点としてX
3□があるが、(X32−X2I )は文字幅の許容範
囲外となるため選択されない。したがって、第2文字の
右方向の候補点には、X31が選択されることになる。
そして、文字認識の結果として、第1文字が「l」、第
2文字が岡と認識され、この認識結果が最終結果となる
。このような具体例を以下のような表で示す。
表 ここで、上記表において、認識結果の数字は類似度値を
示し、類似度値が80未滴の場合はりジエクトとして処
理する。したがって、検出切出候補点X 2+ r X
3s (’)場合、第1 文字Lt r/(Jと認識さ
れ、第2文字はrmJと認識されることになる。
このようにして、連続した文字列に対する文字認識を行
なうことができる。この場合、本発明においては、上記
のように少なくとも2文字以上の文字境界領域の検出を
行ない、各文字の認識結果に応じて最適の検出切出候補
点を選択する。したがって、異種フォントの混在、文字
幅の変動および印字の位置ずれ等がある場合でも、各文
字の検出切出しを確実に行なうことができる。また、ブ
ロポーシャル文字の場合でも、確実な検出切出処理を行
なうことができる。但しこの場合には、検出切出候補点
の検出領域および文字幅の許容範囲が広がるので、多少
処理時間が増大することになる。
〔発明の効果〕
以上詳述したように本発明によれば、連続した文字列に
おいて異種フォントの混在、印字濃度による文字幅の変
動と印字の位置ずれ等がある場合またはブロポーシャル
文字の場合でも、1文字毎の検出切出処理を確実に行な
うことができる。したがって、結果的に安定で正確な文
字読取を行なうことができるものである。
【図面の簡単な説明】
第1図は従来の光学的文字読取装置(こおいて検出切出
処理方法を説明するための文字パターンの一例を示す図
、第2図は本発明の一実施例に係る光学的文字読取装置
の部分的構成を示すブロック図、第3図は第2図の装置
において検出切出処理方法を説明するための文字パター
ンの一例を示す図、第4図は第2図の動作を説明するた
めのフローチャートである。 I・・・走査器、2・・・パターンメモリ、3・・・X
アドレスカウンタ、4・・・Yアドレスカウンタ、5・
・・黒ビツト数カウンタ、7・・・認識部、8・・・マ
イクロプロセッサ。 出願人代理人 弁理士 鈴 江 武彦

Claims (1)

    【特許請求の範囲】
  1. 用紙上に記録された文字情報を光電変換する光電変換手
    段と、この光電変換手段から出力される文字パターンで
    少なくとも連続した2文字分以上の文字パターンを格納
    するパターンメモリと、このパターンメモリ内の文字パ
    ターンの垂直射影ヒストグラムに基づいて文字の検出切
    出候補位置を検出する候補位置検出手段と、この候補位
    置検出手段で検出された上記検出切出候補位置から連続
    する少なくとも2文字分についての検出切出位置を選択
    する選択手段と、この選択手段で選択された検出切出位
    置で上記パターンメモリ内の文字パターンを切出して文
    字認識を行なう文字認識手段と、この文字認識手段の認
    識結果に基づいて上記検出切出位置の妥当性を判定する
    判定手段とを具備したことを特徴とする光学的文字読取
    装置。
JP58055980A 1983-03-31 1983-03-31 光学的文字読取装置 Expired - Lifetime JPH0782524B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58055980A JPH0782524B2 (ja) 1983-03-31 1983-03-31 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58055980A JPH0782524B2 (ja) 1983-03-31 1983-03-31 光学的文字読取装置

Publications (2)

Publication Number Publication Date
JPS59180783A true JPS59180783A (ja) 1984-10-13
JPH0782524B2 JPH0782524B2 (ja) 1995-09-06

Family

ID=13014219

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58055980A Expired - Lifetime JPH0782524B2 (ja) 1983-03-31 1983-03-31 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPH0782524B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61107877A (ja) * 1984-10-31 1986-05-26 Canon Inc 画像処理装置
JPS61107876A (ja) * 1984-10-31 1986-05-26 Canon Inc 画像処理装置
US7480410B2 (en) 2001-11-30 2009-01-20 Matsushita Electric Works, Ltd. Image recognition method and apparatus for the same method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS52119032A (en) * 1976-03-31 1977-10-06 Fujitsu Ltd Pattern recognition unit
JPS58214969A (ja) * 1982-06-09 1983-12-14 Nec Corp 文字読取装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS52119032A (en) * 1976-03-31 1977-10-06 Fujitsu Ltd Pattern recognition unit
JPS58214969A (ja) * 1982-06-09 1983-12-14 Nec Corp 文字読取装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61107877A (ja) * 1984-10-31 1986-05-26 Canon Inc 画像処理装置
JPS61107876A (ja) * 1984-10-31 1986-05-26 Canon Inc 画像処理装置
US7480410B2 (en) 2001-11-30 2009-01-20 Matsushita Electric Works, Ltd. Image recognition method and apparatus for the same method

Also Published As

Publication number Publication date
JPH0782524B2 (ja) 1995-09-06

Similar Documents

Publication Publication Date Title
EP0125877B1 (en) Information input apparatus
EP0583432B1 (en) Questionnaire scanning system employing expandable answer mark areas for efficient scanning and mark detection
US4516265A (en) Optical character reader
US4204193A (en) Adaptive alignment for pattern recognition system
JPS6077279A (ja) 文字イメ−ジ切出し方法
EP0308673A2 (en) Image inclination detecting method and apparatus
JPS63158678A (ja) 単語間スペ−ス検出方法
US5293469A (en) Apparatus for generating a graphic image having symbols whose centers and aligned with each other and whose sizes are adjusted to accord with each other
JPS6115284A (ja) 光学的文字読取装置
JPS59180783A (ja) 光学的文字読取装置
US4512032A (en) Optical character recognition apparatus
JP3186246B2 (ja) 文書読取装置
EP0076332B1 (en) Optical character reader with pre-scanner
JP2001109887A (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JPH087031A (ja) 文字枠検出装置
JP2578768B2 (ja) 画像処理方法
JP3381803B2 (ja) 傾き角検出装置
JPH07111738B2 (ja) 文書中の領域境界抽出方式
JPH07120392B2 (ja) 文字パターン切り出し装置
JPH0557632B2 (ja)
JPH0467674B2 (ja)
JPS6041396B2 (ja) 宛名検出装置
JPH08212296A (ja) 光学式文字読取装置
JPS6362025B2 (ja)
JPS622356B2 (ja)