JPS62169286A - 文字切出方式 - Google Patents

文字切出方式

Info

Publication number
JPS62169286A
JPS62169286A JP61011269A JP1126986A JPS62169286A JP S62169286 A JPS62169286 A JP S62169286A JP 61011269 A JP61011269 A JP 61011269A JP 1126986 A JP1126986 A JP 1126986A JP S62169286 A JPS62169286 A JP S62169286A
Authority
JP
Japan
Prior art keywords
character
pitch
line
projection pattern
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61011269A
Other languages
English (en)
Inventor
Hiroshi Sasaki
宏 佐々木
Shunji Ariyoshi
俊二 有吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61011269A priority Critical patent/JPS62169286A/ja
Publication of JPS62169286A publication Critical patent/JPS62169286A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は、たとえば郵便物上の宛名情報などを光学的に
読取る文字読取装置において、文字を認識する際に文字
を1文字ごとに切出す文字切出方式に関する。
[発明の技術的背景とその問題点] 一般に、この種の文字読取装置においては、文字を認識
する際、文字を1文字ごとに切出してから認識するよう
になっている。この場合、文字の切出しが困難であるこ
とから、従来は被読取物(郵便物)上の文字記載位置に
ドロップ・アウト・カラーで記載された枠などの制限を
設けておくことで文字の切出しを容易にし、被読取物上
に記載された文字の読取りを可能にしている。 ゛とこ
ろが、このような枠などの制限は利用者、の負担となる
ため、上記のような制限の軽減が望まれ、枠などを用い
ない方法として射影パターンにより文字の隙間を見つけ
るものなど、種々の方式が提案されている。しかしなが
ら、従来の方式では、隣接文字同士の接触と文字内に分
離位置を持つ分離文字が混在する場合などでは、正しい
文字の切出しが行なえないという欠点があった。
[発明の目的〕 本発明は上記事情に鑑みてなされたもので、その目的と
するところは、被読取物上の文字記載位置に枠などの制
限を設けることなく、文字同士の接触や分離文字などに
対しても正確な文字の切出しを行なうことができる文字
切出方式を提供することにある。
[発明の概要] 本発明は上記目的を達成するために、被読取物から得ら
れる文字画像信号から文字行を切出した後、その文字行
から文字を1文字ごとに切出す文字切出方式において、
上記切出された文字行に対してその行方向と垂直な方向
の射影パターンを作成するとともに、上記切出された文
字行に対して各文字の仮の記載ピッチを推定し、上記射
影パターンに対して、少なくとも1つの谷を有する重み
関数を、その谷と上記推定された記載ピッチとが一致す
るように掛け合わせることにより文字の切出位置を推定
し、この推定した切出位置で文字の切出しを行なうよう
にしたものである。
[発明の実施例] 以下、本発明の一実施例について図面を参照して説明す
る。
第5図は本発明に係る被読取物、たとえば郵便物1の一
例を示すもので、その表面には複数行の宛名情報2が記
載されている。宛名情報2には郵便番号、住所、ビルや
会社の名前、部課保温、個人名などが含まれる。
第1図は本発明に係る文字切出方式を説明するブロック
図である。すなわち、光電変換部3は、郵便物1の表面
を光学的に走査することにより文字画像信号を得るもの
で、たとえば郵便物1の表面に光を照射する光源、およ
びその反射光を受けて電気信号に変換する自己走査形の
CODイメージセンサなどによって構成される。行検出
切出部4は、光電変換部3から得られる文字画像信号に
対して文字記載方向への射影パターンを作成し、その射
影パターンを用いることにより文字行の切出しを行なう
。射影作成部5は、行検出切出部4で切出された文字行
に対してその行方向と垂直な方向の射影パターンを作成
する。文字ブロック分割部6は、射影作成部5で作成さ
れた行方向と垂直な方向の射影パターンにより、たとえ
ば第2図に示すように、行検出切出部4で切出された文
字行に対して、あらかじめ設定される所定の閾値以上の
文字間距離が発生する位置で順次文字ブロックの分割を
行なう。ここで、文字ブロックとは、1つの文字行の中
で近接した文字列同士を1つの単位とするものである。
文字記載ピッチ推定部7は、射影作成部5で作成された
行方向と垂直な方向の射影パターンにより、文字ブロッ
ク分割部6で得られた各文字ブロックごとに別々に仮の
文字記載ピッチを推定する。すなわち、たとえば第3図
に示すような文字ブロック「幸区柳町」が分割された場
合、仮の文字記載ピッチは、この文字ブロックの文字高
9と文字幅10とから求められる平均文字幅と、文字量
空白長11から求められる平均文字量空白長、およびこ
の文字ブロックと同一行内に存在する周辺文字ブロック
の文字記載ピッチにより推定される。なお、この文字幅
10および文字量空白長11は、たとえば射影作成部5
で作成された行方向と垂直な方向の射影パターンに対し
て所定の閾値を設け、その閾値を基準に便宜的に求めら
れるものである。上記板の文字記載ピッチは、たとえば
a、b、cを定数として次式などで与えられる。
仮の文字記載ピッチ−(a%文字高+b’x(平均文字
幅+平均文字量空白長)+c’4周辺文字ブロックの文
字記載ピッチ)/ (a+b十c)なお、文字高および
周辺文字ブロックの文字記載ピッチなどを利用するのは
、便宜的に求められた文字幅10I3よび文字量空白長
11における文字の接触や分離文字の影響を軽減するた
めである。
文字検出切出部8は、第4図に示すように、射影作成部
5で作成された行方向と垂直な方向の射影パターンによ
り、切出開始点および切出終了点をそれ・ぞれ推定する
。すなわち、切出開始点は、文字ブロックの開始点ある
いは1文字前の切出終了点を基準に文字記載方向へ文字
の射影パターンの増加が開始される点を探すことにより
求められる。こうして求めた切出開始点から文字記載ピ
ッチ推定部7で推定された仮の文字記載ピッチだけ移動
した点を切出終了推定点とし、この切出終了推定点と少
なくとも1つの谷を持つ重み関数(第4図参照)の谷の
部分とが一致するように、上記射影パターンと重み関数
とを掛け合わせることにより、第4図に示すような評価
関数が得られる。
この評価関数は、たとえばdを定数として次式などで与
えられる。
評価関数−重み関数X(射影値+d) こうして評価関数が得られると、その評価関数の最小値
を呈する位置を基準に文字記載方向と逆方向へ文字の射
影パターンの減少が終了する点を探すことにより切出終
了点を求める。そして、こうして求めた切出開始点およ
び切出終了点により文字の切出しを行なう。この際、上
記求めた切出開始点および切出終了点により、次の文字
の切出しに対する文字記載ピッチの値を補正することに
より、より正確かつ確実な文字の切出しが可能になる。
このように、被読取物から得られる文字画像信号に対し
て文字記載方向への射影パターンを作成し、この射影パ
ターンにより文字行の切出しを行なう。その後、この切
出された文字行に対してその行方向と垂直な方向の射影
パターンを作成する。
その後、この作成された行方向と垂直な方向の射影パタ
ーンによ゛す、上記切出された文字行に対して、あらか
じめ設定される所定値以上の文字間距離が発生する位置
で順次分割することにより文字ブロックの分割を行なう
。その後、上記作成された行方向と垂直な方向の射影パ
ターンにより、上記分割された文字ブロックごとに別々
に仮の文字記載ピッチを推定する。そして、1文字分の
切出しにおいて、上記作成された行方向と垂直な方向の
射影パターンに対して、少なくとも1つの谷を有する瑣
み関数をその谷と上記推定された文字記載ピッチとが一
致するように掛け合わせて評価関数を得、この評価関数
の最小値を呈する位置を基準に文字の切出位置を推定し
、この推定した切出位置で文字の切出しを行なうもので
ある。
これにより、被読取物上に枠などの記載方法の制限なし
に、文字同士の接触あるいは1文字内の分離など、種々
の状態で記載されている文字を正確に切出すことが可能
になり、正確な文字読取りが行なえるようになる。
なお、前記実施例では、文字行の切出しおよび文字ブロ
ックの分割を行なうために行方向と垂直な方向の射影パ
ターンを用いているが、既知のランレングスと呼ばれる
手法を用いても同様の作用効果が期待できる。
また、文字検出切出部において、射影パターンの増減か
ら実際の詳細な文字の切出開始点および切出終了点を求
める際、射影パターンに対する固定の閾値を用いずに、
文字の大きざ、文字の太さ、文字の密接度、ノイズの加
わり程度、文字のかすれ具合などをパラメータとして、
各文字あるいは各文字ブロックごとに適宜補正すること
により、より正確な文字の切出しが可能になる。
また、文字検出切出部における重み関数として、推定さ
れた文字記載ピッチに対応する位置を第1の谷とし、そ
の1/2に当たる位置を第2の谷として同様の処理を行
なうことにより、いわゆる半角文字を容易に切出すこと
ができる。
さらに、切出した文字行に対して文字ブロックの分割を
行なった後、この分割した文字ブロックごとに各文字の
仮の記載ピッチを推定する場合について説明したが、必
ずしも文字ブロックの分割を行なう必要はなく、文字ブ
ロックの分割を省略してもよい。要は、切出した文字行
に対して各文字の仮の記載ビッヂを推定するようにすれ
ばよい。
[発明の効果] 以上詳述したように本発明によれば、被読取物上の文字
記載位置に枠などの制限を設けること、なく、文字同士
の接触や分離文字などに対しても正確な文字の切出しを
行なうことができる文字切出方式を提供できる。
【図面の簡単な説明】
図は本発明の一実施例を説明するためのもので、第1図
は概略的な構成を示すブロック図、第2図は文字ブロッ
クの分割を説明する図、第3図は文字記載ピッチの推定
を説明する図、第4図は文字の切出動作を説明する図、
第5図は被読取物の一例である郵便物を示す図である。 1・・・・・・郵便物(被読取物)、2・・・・・・宛
名情報、3・・・・・・光電変換部、4・・・・・・行
検出切出部、5・・・・・・射影作成部、6・・・・・
・文字ブロック分割部、7・・・・・・文字記載ピッチ
推定部、8・・・・・・文字検出切出部。 出願人代理人  弁理士 鈴 江 武 豚箱1図 第2図 一一□□へ10 一″′″ −111 第3図 第4図

Claims (4)

    【特許請求の範囲】
  1. (1)被読取物から得られる文字画像信号から文字行を
    切出した後、その文字行から文字を1文字ごとに切出す
    文字切出方式において; 前記切出された文字行に対してその行方向と垂直な方向
    の射影パターンを作成する射影作成手段と: 前記切出された文字行に対して各文字の仮の記載ピッチ
    を推定する記載ピッチ推定手段と:前記射影作成手段で
    作成された射影パターンに対して、少なくとも1つの谷
    を有する重み関数を、その谷と前記記載ピッチ推定手段
    で推定された記載ピッチとが一致するように掛け合わせ
    ることにより文字の切出位置を推定し、この推定した切
    出位置で文字の切出しを行なう文字切出し手段とを具備
    したことを特徴とする文字切出方式。
  2. (2)前記記載ピッチ推定手段は、前記射影作成手段で
    作成された行方向と垂直な方向の射影パターンにより1
    文字ごとの記載ピッチを推定することを特徴とする特許
    請求の範囲第1項記載の文字切出方式。
  3. (3)前記記載ピッチ推定手段は、複数の文字で構成さ
    れる文字ブロック単位で別々に記載ピッチを推定するこ
    とを特徴とする特許請求の範囲第1項または第2項記載
    の文字切出方式。
  4. (4)前記文字ブロックは文字間距離が所定値以上のと
    きに分離されることを特徴とする特許請求の範囲第3項
    記載の文字切出方式。
JP61011269A 1986-01-22 1986-01-22 文字切出方式 Pending JPS62169286A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61011269A JPS62169286A (ja) 1986-01-22 1986-01-22 文字切出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61011269A JPS62169286A (ja) 1986-01-22 1986-01-22 文字切出方式

Publications (1)

Publication Number Publication Date
JPS62169286A true JPS62169286A (ja) 1987-07-25

Family

ID=11773249

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61011269A Pending JPS62169286A (ja) 1986-01-22 1986-01-22 文字切出方式

Country Status (1)

Country Link
JP (1) JPS62169286A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03131995A (ja) * 1989-10-18 1991-06-05 Fuji Facom Corp 日本語文書の接触文字の切出し方法
JP2010039615A (ja) * 2008-08-01 2010-02-18 Hitachi Omron Terminal Solutions Corp 文字認識方法及び文字認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03131995A (ja) * 1989-10-18 1991-06-05 Fuji Facom Corp 日本語文書の接触文字の切出し方法
JP2010039615A (ja) * 2008-08-01 2010-02-18 Hitachi Omron Terminal Solutions Corp 文字認識方法及び文字認識装置

Similar Documents

Publication Publication Date Title
JPH08287184A (ja) 画像切り出し装置及び文字認識装置
JPS62169286A (ja) 文字切出方式
JP3031579B2 (ja) 帳票の文字認識領域指定方法
JP2554187B2 (ja) 基本ライン抽出方法
JP3090342B2 (ja) 文字列方向判別装置
JPS62169287A (ja) 記載文字形態判別方式
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP2610881B2 (ja) 文字列内の文字大きさ測定方式
JP4129898B2 (ja) 文字サイズ推定方法および装置
JP2995818B2 (ja) 文字切り出し方法
JPS6254380A (ja) 文字認識装置
JP2859307B2 (ja) 文字切出し装置
JP2982221B2 (ja) 文字読み取り装置
JP2909132B2 (ja) 光学的文字読取装置
JP2753094B2 (ja) 単語切り出し装置
JP3190794B2 (ja) 文字切り出し装置
JPS59160274A (ja) 文字切出し方式
JP3193573B2 (ja) かぎかっこ付文字認識装置
JPS63101983A (ja) 文字列抽出方式
JP3411795B2 (ja) 文字認識装置
JP2778436B2 (ja) 文字切り出し装置
JPH01269184A (ja) 文書中の領域境界抽出方式
JP2003030585A (ja) 画像処理装置、方法、プログラム及び記憶媒体
JP3039427B2 (ja) 文字切り出し方式及び方法
JP2659182B2 (ja) 文字認識装置