JPS62169287A - 記載文字形態判別方式 - Google Patents

記載文字形態判別方式

Info

Publication number
JPS62169287A
JPS62169287A JP61011270A JP1127086A JPS62169287A JP S62169287 A JPS62169287 A JP S62169287A JP 61011270 A JP61011270 A JP 61011270A JP 1127086 A JP1127086 A JP 1127086A JP S62169287 A JPS62169287 A JP S62169287A
Authority
JP
Japan
Prior art keywords
character
pitch
written
characters
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61011270A
Other languages
English (en)
Inventor
Hiroshi Sasaki
宏 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61011270A priority Critical patent/JPS62169287A/ja
Publication of JPS62169287A publication Critical patent/JPS62169287A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は、たとえば郵便物上の宛名情報などを光学的に
読取る文字読取装置において、被読取物上の記載文字が
等ピッチ文字列か可変ピッチ文字列かを判別する記載文
字形態判別方式に関する。
[発明の技術的背景とその問題点] 一般に、この種の文字読取装置においては、文字を01
する際、文字を1文字ごとに切出してから認識するよう
になっている。この場合、被読取物(郵便物)上の記載
文字の形態、すなわち等ピッチ文字列(活字文字の場合
に多い)か可変ピッチ文字列(手書き文字の場合に多い
)かに応じて最良の文字の切出方式が異なる。そこで、
従来は記載文字の形態として、あらかじめ等ピッチ文字
列(たとえば活字文字)か可変ピッチ文字列(たとえば
手書き文字)かを指定した上で、文字の切出処理を行な
う方法をとっている。しかしながら、あらかじめ記載文
字の形態を指定するためには多くの人手を要する場合が
多く、しかも非常に面倒であり、文字読取りの処理効率
が著しく低下するという欠点があった。
[発明の目的] 本発明は上記事情に鑑みてなされたもので、その目的と
するところは、比較的簡単な処理で、被読取物上の記載
文字が等ピッチ文字列か可変ピッチ文字列かを容易かつ
確実に判別でき、文字読取りの処理効率が著しく向上す
る文字判別方式を提供することにある。
[発明の概要] 本発明は上記目的を達成するために、被読取物から得ら
れる文字画像信号から文字行を切出した後、その文字行
に対して各文字の記載ピッチを推定してその記載ピッチ
の分散値を求め、この分散値により被読取物上の記載文
字が等ピッチ文字列か可変ピッチ文字列かを判別するも
のである。
[発明の実施例1 以下、本発明の一実施例について図面を参照して説明す
る。
第1図は本発明に係る記載文字形態判別方式を説明する
ブロック図である。すなわち、光電変換部1は、被読取
物(たとえば郵便物、図示しない)の表面を光学的に走
査することにより文字画像信号を得るもので、たとえば
被読取物の表面に光を照射する光源、およびその反射光
を受けて電気信号に変換する自己走査形のCODイメー
ジセンサなどによって構成される。行検出切出部2は、
光電変換部1から得られる文字画像信号に対して文字記
載方向への射影パターンを作成し、その射影パターンを
用いることにより文字行の切出しを行なう。射影作成部
3は、行検出切出部2で切出された文字行に対してその
行方向と垂直な方向の射影パターンを作成する。文字ブ
ロック分割部4は、射影作成部3で作成された行方向と
垂直な方向の射影パターンにより、たとえば第2図に示
すように、行検出切出部2で切出された文字行に対して
、あらかじめ設定される所定の閾値以上の文字間距離が
発生する位置で順次文字ブロックの分割を行なう。ここ
で、文字ブロックとは、1つの文字行の中で近接した文
字列同士を1つの単位とするものである。文字記載ピッ
チ推定部5は、射影作成部3で作成された行方向と垂直
な方向の射影パターンにより、文字ブロック分割部4で
得られた各文字ブロックごとに1文字ごとの文字記載ピ
ッチを推定する。すなわち、文字記載ピッチの推定は例
えば次のようにして行なわれる。第3図に示すように、
射影作成部3で作成された行方向と垂直な方向の射影パ
ターン8に対して所定の閾fa9を設け、射影パターン
8と閾値9との大小間係で文字部分10と文字量空白部
分とに分離し、その文字部分10の中点間距離を1文字
分の記載ピッチ11とするものである。分散演算部6は
、文字記戟ピッチ推定部5で得られた文字記載ピッチに
より、文字ブロック分割部4で得られた文字ブロック中
に記載されている文字の記載ピッチの分散値を求める。
この分散値は、文字の大きさによる影響を無くすために
、同一文字ブロック内の平均文字記載ピッチで除して正
規化する。このようにして各文字ブロック単位で得られ
た分散値に対して、当該文字ブロックの長さあるいは当
該文字ブロック内の記載文字数で重み付けを行ない、全
文字ブロックで加重平均したものを文字記載ピッチのば
らつきの度合を示す評1iffi IIImとする。判
別部7は、分散演算部6から得られた評価値と経験的に
得られる所定の閾値とを比較し、評価値の方が大きけれ
ば被読取物上の記載文字は可変ピッチ文字列(たとえば
手書き文字)であると判別し、評り値の方が小さければ
等ピッチ文字列(たとえば活字文字)であると判別する
このように、被読取物から19られる文字画像信号に対
して文字記載方向への射影パターンを作成し、この射影
パターンにより文字行の切出しを行なう。その侵、この
切出された文字行に対してその行方向と垂直な方向の射
影パターンを作成する。
その後、この作成された行方向と垂直な方向の射影パタ
ーンにより、上記切出された文字行に対して、あらかじ
め設定される所定値以上の文字間距離が発生する位置で
順次分割することにより文字ブロックの分割を行なう。
その後、上記作成された行方向と垂直な方向の射影パタ
ーンにより、上記分割された文字ブロックごとに1文字
ごとの記載ピッチを推定する。その後、文字ブロックご
とに別々に文字記載ピッチの分散値を求め、この求めた
分散値に対して当該文字ブロックの長さあるいは当該文
字ブロック内の記載文字数で重み付けを行ない、全文字
ブロックで加重平均した値を文字記載ピッチのばらつき
の度合を示す評価値とする。そして、この評1iIiI
Iiとあらかじめ設定される所定値との大小関係で被読
取物上の記載文字が等ピッチ文字列か可変ピッチ文字列
かを判別するものである。
これにより、比較的簡単な処理で、被読取物上の記載文
字が等ピッチ文字列か可変ピッチ文字列かを容易かつ確
実に判別できる。したがって、従来のように記載文字の
形態として、あらかじめ等ピッチ文字列か可変ピッチ文
字列かを指定する必要がなく、自動的に記載文字の形態
を判別して記載文字の形態に応じた最良の切出方式で文
字の切出しが可能となり、文字読取りの処理効率が著し
く向上するものである。
なお、前記実施例では、文字行の切出しおよび文字ブロ
ックの分割を行なうために行方向と垂直な方向の射影パ
ターンを用いているが、既知のランレングスと呼ばれる
手法を用いても同様の作用効果が期待できる。
また、文字記載ピッチ推定部における文字記載ピッチの
推定で、文字部分の中点間距離を用いる代わりに、たと
えば文字量空白部分の中点間距離、文字部分の長さ、あ
るいは文字部分の長さに文字量空白部分の長さを加えた
ものなどを用いてもよい。
また、漢字のへんとつくりに代表される分離文字などを
考慮するために、分散演算部における分散値計算を、文
字記載ピッチの大きさによって2つあるいはそれ以上に
クラスタリングし、各クラスタごとに別々に分散値を求
めた後、クラスタ中のカテゴリ数による加重平均値を評
価値とすれば、より精度の高い判別が可能になる。
さらに、切出した文字行に対して文字ブロックの分割を
行なった後、この分割した文字ブロックごとに各文字の
記載ピッチを推定する場合について説明したが、必ずし
も文字ブロックの分割を行なう必要はなく、文字ブロッ
クの分割を省略してもよい。要は、切出した文字行に対
して各文字の記載ピッチを推定するようにすればよい。
[発明の効果] 以上詳述したように本発明によれば、比較的簡単な処理
で、被読取物上の記載文字が等ピッチ文字列か可変ピッ
チ文字列かを容易かつ確実に判別でき、文字読取りの処
理効率が著しく向上する文字判別方式を提供できる。
【図面の簡単な説明】
第1図は本発明の一実施例を説明するためのブロック図
、第2図は同実施例における文字ブロックの分割を説明
するための図、第3図は同実施例における文字記載ピッ
チの推定を説明するための図である。 1・・・・・・光電変操部、2・・・・・・行検出切出
部、3・・・・・・射影作成部、4・・・・・・文字ブ
ロック分割部、5・・・・・・文字記載ピッチ推定部、
6・・・・・・分散演算部、7・・・・・・判別部。 出願人代理人  弁理士 鈴 江 武 彦第1図

Claims (7)

    【特許請求の範囲】
  1. (1)被読取物から得られる文字画像信号から文字行を
    切出す行検出切出手段と; 前記行検出切出手段で切出した文字行に対して各文字の
    記載ピッチを推定する記載ピッチ推定手段と: 前記記載ピッチ推定手段で得られた記載ピッチの分散値
    を求める分散演算手段と: 前記分散演算手段で求めた分散値により前記被読取物上
    の記載文字が等ピッチ文字列か可変ピッチ文字列かを判
    別する判別手段と を具備したことを特徴とする記載文字形態判別方式。
  2. (2)前記行検出切出手段は、前記文字画像信号に対し
    て文字記載方向への射影パターンを作成し、その射影パ
    ターンにより文字行の切出しを行なうことを特徴とする
    特許請求の範囲第1項記載の記載文字形態判別方式。
  3. (3)前記記載ピッチ推定手段は、前記行検出切出手段
    で切出した文字行に対して行方向と垂直な方向の射影パ
    ターンを作成し、その射影パターンにより1文字ごとの
    記載ピッチを推定することを特徴とする特許請求の範囲
    第1項記載の記載文字形態判別方式。
  4. (4)前記記載ピッチ推定手段は、複数の文字で構成さ
    れる文字ブロック単位で別々に記載ピッチを推定するこ
    とを特徴とする特許請求の範囲第1項または第3項記載
    の記載文字形態判別方式。
  5. (5)前記文字ブロックは、文字間距離が所定値以上の
    とき分離されることを特徴とする特許請求の範囲第4項
    記載の記載文字形態判別方式。
  6. (6)前記分散演算手段は、文字ブロックごとに別々に
    記載ピッチの分散値を求め、この求めた分散値に対して
    当該文字ブロックの長さあるいは当該文字ブロック内の
    記載文字数で重み付けを行ない、全文字ブロックで加重
    平均した値を記載ピッチのばらつきの度合を示す評価値
    とすることを特徴とする特許請求の範囲第4項記載の記
    載文字形態判別方式。
  7. (7)前記判別手段は、前記分散演算手段から得られる
    評価値とあらかじめ設定される所定値との大小関係で前
    記被読取物上の記載文字が等ピッチ文字列か可変ピッチ
    文字列かを判別することを特徴とする特許請求の範囲第
    6項記載の記載文字形態判別方式。
JP61011270A 1986-01-22 1986-01-22 記載文字形態判別方式 Pending JPS62169287A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61011270A JPS62169287A (ja) 1986-01-22 1986-01-22 記載文字形態判別方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61011270A JPS62169287A (ja) 1986-01-22 1986-01-22 記載文字形態判別方式

Publications (1)

Publication Number Publication Date
JPS62169287A true JPS62169287A (ja) 1987-07-25

Family

ID=11773280

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61011270A Pending JPS62169287A (ja) 1986-01-22 1986-01-22 記載文字形態判別方式

Country Status (1)

Country Link
JP (1) JPS62169287A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02100190A (ja) * 1988-10-07 1990-04-12 Fuji Electric Co Ltd 文字サイズ抽出方法
JPH02139686A (ja) * 1988-11-21 1990-05-29 Fuji Electric Co Ltd 文字読取方法
CN113139547A (zh) * 2020-01-20 2021-07-20 阿里巴巴集团控股有限公司 文本识别方法、装置、电子设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02100190A (ja) * 1988-10-07 1990-04-12 Fuji Electric Co Ltd 文字サイズ抽出方法
JPH02139686A (ja) * 1988-11-21 1990-05-29 Fuji Electric Co Ltd 文字読取方法
CN113139547A (zh) * 2020-01-20 2021-07-20 阿里巴巴集团控股有限公司 文本识别方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
JPH06348896A (ja) 文字の切り出し方法及びその装置
JPH0519753B2 (ja)
JPS62169287A (ja) 記載文字形態判別方式
JPH0430070B2 (ja)
JP3090342B2 (ja) 文字列方向判別装置
JPS60116078A (ja) 文字認識装置
JP2000331122A (ja) 文字認識方法および装置
JP3388918B2 (ja) 文字列読み取り装置
JP2728086B2 (ja) 文字切り出し方法
JPS62169286A (ja) 文字切出方式
JPS6254380A (ja) 文字認識装置
JP3193573B2 (ja) かぎかっこ付文字認識装置
JPH0373916B2 (ja)
JPH0564396B2 (ja)
JP2859307B2 (ja) 文字切出し装置
JPH0573718A (ja) 領域属性識別方式
JPH09179982A (ja) 特定パターン検出方法
JPH01265378A (ja) 欧文文字認識方式
JP3190794B2 (ja) 文字切り出し装置
JPS61267184A (ja) 文字列の行位置検出方式
JP2832035B2 (ja) 文字認識装置
JPH0467674B2 (ja)
JP2728085B2 (ja) 文字切り出し方法
JPH07319998A (ja) 文字切り出し方法
CA2186611A1 (en) Automatic determination of landscape scan in binary images