JPS6389990A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPS6389990A
JPS6389990A JP61235940A JP23594086A JPS6389990A JP S6389990 A JPS6389990 A JP S6389990A JP 61235940 A JP61235940 A JP 61235940A JP 23594086 A JP23594086 A JP 23594086A JP S6389990 A JPS6389990 A JP S6389990A
Authority
JP
Japan
Prior art keywords
character
block
character block
sub
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61235940A
Other languages
English (en)
Other versions
JP2570703B2 (ja
Inventor
Yoshitake Tsuji
辻 善丈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61235940A priority Critical patent/JP2570703B2/ja
Publication of JPS6389990A publication Critical patent/JPS6389990A/ja
Application granted granted Critical
Publication of JP2570703B2 publication Critical patent/JP2570703B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、記載書式の制限のない文字行を読み取る光学
的文字読取装置等の文字読取方式に関し、特に郵便物上
に記載されている住所等の特定分野において、記載書式
の制限のない文字行から個々の文字を識別するのに適し
九文字読取方弐に係わる。
(従来技術とその問題点) 従来、印字あるいは手書き文字を光学的に読取る装置(
以下、OCRと呼ぶ)において、英数字及びカタカナを
対象とするものはすでに実用化されておシ:最近では手
書き漢字を読み取ることも実用化されつつある。このよ
うなOCRを用いて文字を読み取る場合、例えば、電子
通信学会論文誌(D)、J68−D、 &8.p 14
97−1504(1985年8月)K示されているよう
に1文字行から個々の文字を切り出した後、例えば、電
子通信学会論文誌(D)、J65−D、A9p1167
〜1174 (1982年9月)に示されているような
手書き漢字認識などの技術を用いて、個々の文字−所定
のカテゴリに識別できる。しかじな示ら、従来技術では
、1つの文字行内に1例えば、縦書きと横書きなどが混
在しないという仮定を設けて行われる。ところが、郵便
物上の宛て名などのように1縦書きの宛て名住所に対し
て丁目や番地などが省略形を用いた横書きで記載される
ことがあシ、このような場合には従来技術では読み取り
が困難となる。この場合、省略形で記載された丁目や番
地は、県名、型名に用いられる漢字などとは異なシ、ア
ラビア数字や特殊記号などが用いられる。そこで、省略
形による記載文字ブロック候補をアラビア数字等を仮定
して再分割し、再度、字種を限定して文字読み取りを行
えば良いが、処理速度及び文字読取精度の観点から再分
割し、文字読み取)を行うべき文字ブロックを選択する
ことが必要となる。
本発明の目的は、上記従来の問題点を解決すべく、例え
ば、省略形記載による丁目や番地のように、行方向と異
なる向きに書かれた文字ブロック候補などをその文字ブ
ロックの形状と文字行内の相対位置によシ選択し、所定
の文字種を有する標準パタンと照合するととKよって、
効率的にしかも精度良く文字読み取りが行えるようKし
た文字読取方式を提供することにある。
(問題点を解決するための手段) 前述の問題点を解決するために本発明が提供する文字読
取方式は二文字行を複数個の文字ブロックに分離する文
字分離手段と:予め複数個の字種毎に分類された標準パ
タンを記憶した認識辞書と;認識辞書から1つないし複
数個の字種に分類される複数個の標準パタンを取り出し
、文字ブロックと照合して所定の文字カテゴリに識別す
る手段と;文字ブロックの形状及び文字行内の相対位置
に従って文字ブロックを再分割し、複数個の文字サブブ
ロックを検出する手段と;認識辞書から所定の字種に分
類された複数個の標準パタンを取り出し。
複数個の文字サブブロックと順次照合して所定の文字カ
テゴリに識別する手段とを具備することを特徴とするも
のである。
(作 用) 本発明において、行方向と異なる向きに書かれた文字ブ
ロックが存在しても、その文字ブロックの形状と文字行
内の相対位置によシ選択し、所定の文字種を有する標準
パタンと照合することによって、効率的で精度の良い文
字読取処理が可能となる。
(実施例) 以下、本発明における具体的実施例について図面を参照
しつつ説明する。図1は縦書きと横書きが混在する郵便
物上の住所の一例を示し、本発明の詳細な説明するため
のものである。
図において、斜線で示した文字は、住所の一部を示して
おシ、図中実線又は点線により文字行から切シ出された
文字ブロックを示している。また、図1 (a)及び図
1 (b)は、縦書きの文字行の例であシ、図1(c)
及び図1 (d)は、横書きの文字行の例である。図1
 (a)に示した文字行は、文字分離装置によシ個々の
文字ブロックに切シ出され、予め用意された認識辞書と
照合して、図1(a)K示すような、所定の文字カテゴ
リ(図中用、崎、谷、?。但し、?は文字読取不能を表
わす)K識別される。尚、文字分離装置は、公知の技術
であシ、投影分布や黒画素の輪郭追跡等によシ実現され
るものでも良い。ここで、文字分離装置において、例え
ば、文字ブロック” Jll ”の要素数が3個あるな
どの情報は、容易に抽出できることは言うまでもない。
次に、前述した文字分離装置によシ抽出された個々の文
字ブロックの形状及び各文字ブロックの相対位置情報に
従ってその文字ブロックを再分割するか否かを決める。
例えば、文字ブロックの形状として、文字ブロク〉内に
含まれる要票数を用い、また、各文学ブロックの相対位
置情報として、例えば、i便住所の場合には、省略表現
は、型名や区名以降に用いることが多いため、1文字行
の下方に存在する1という゛条件を用いることができる
。また、図1 (c)で示す横書き住所の例のように丁
目、番地が正しく付けられることがあるため、1文字行
の中央よシ下方の範囲1として設定しても良い。
尚、本発明では、文字ブロックの形状や相対位置情報と
して、上記特徴や指定法に限定されるものではなく、例
えば、文字ブロックの縦横比や文字ブロックの相対番号
などのようなもの、あるいは、それらの組合せを用いる
こともできる。
そこで、上述した文字ブロックの形状及び相対位置情報
を用いると、対象となる文字ブロックは、図1(a)で
示す一例では、文字ブロック″3−1−11のみが選択
され、図1(b)で示すように5つの文字サブブロック
に再分割される。更に、所定の文字種として、10個の
数字と特殊記号を文字カテゴリとする複数個の標準パタ
ンか、認識辞書から取り出され、照合されると、例えば
、図1(b)の下方に示すような文字カテゴリ列l3−
1−1”が得られる。
また、図1(c)の横書きの住所例の場合には、文字ブ
ロック1121が再分割の対象となシ、同様にして、2
つの文字サブブロックI I Z Jlに対して文字カ
テゴリ列112Iが得られる。
尚、図1(c)及び図1 (d)でしたように1文字ブ
ロック@12”IF一対して、所定の文字カテゴリ10
1が得られ、その2つの文字サブブロックm1m、@2
@J、c対して、所定の文字カテゴリJZJ”が得られ
九場合、どちらの文字プ筒ツク又は文字サブブロック群
を選択するかは、例えば、住所辞書を用いて行う単語認
識によシ決定法や例えば、所定の文字カテゴytc識別
した際に得られる類似度に基づく方法などの公知の技術
を用いて行うことができる。
図2は、本発明の一実施例を示す論理プ四ツク図である
。図において、1は行イメージ記憶部であシ、文字行イ
メージを記憶する。2は、文字分離部であシ、行イメー
ジ記憶部lに格納され九文字行イメージを個々の文字ブ
ロックに9JJ)出し、順次、文字ブロック記憶部3に
格納する。尚、文字分離部2では、図1で示したように
、各文字ブロックの形状及び相対位置情報も同時に抽出
され、文字ブロック記憶部3に格納されているとする。
文字ブロック照合部4において、文字ブロック記憶部3
に格納された文字ブロックが順次域)出されると、認識
辞書記憶部8に格納された複数個の標準パタンか字種選
択部9を介して順次転送され、前述の文字ブロックと照
合して、所定の文字カテゴリを文字ブロック照合結果記
憶部5に格納する。
尚、字種選択部9では、文字シロツク記憶部3に格納さ
れた文字ブロックが文字ブロック照合部4に入力された
場合、すべての字種が選択されるものとする。
次に1文字ブロック記憶部3に格納された各文字ブロッ
クの形状及び相対位置情報が文字ブロック判定部10に
転送されると、文字ブロック判定部では、予め与えられ
た文字ブロックの形状及び相対位置情報に関する閾値と
比較し、各文字ブロックを複数個の文字サブブロックに
再分割するか否かを判定する。入力された文字ブロック
が文字ブロック判定部10において再分割可能であると
判定されると、文字プ目ツク分割部11によシ文字ブロ
ックが再分割され、文字ブロック記憶部12に順次格納
される。
文字サブブロック記憶部12Vc再分割可能な文字ブロ
ックに対応する複数個の文字サブブロックが格納される
と、順次、文字サブブロック照合部6に転送される。文
字サブブロック照合部6に:。
文字サブブロックが転送されると、字種選択部9では、
所定の字種(例えば数字と特殊記号)を有する複数個の
標準パタンを認識辞書記憶部8よシ選択し、文字サブブ
四ツク照合部6に順次転送し、文字サブブロックと照合
することKよって、所定の文字カテゴリが得られ、文字
サブブロック照合結果記憶部7に格納される。
尚、文字サブブロック照合部6として、文字ブロック照
合部4を併用して用いても良い。
以上の動作によシ文字ブロック照合結果記憶部5及び文
字サブブロック照合結果記憶部6が、例えば、従来の単
語認識装置などに転送され、所定の単語(住所など)に
識別される。
(発明の効果) 以上、説明したように、本発明によれば、縦書き、横書
きの混在する等の記載書式制限のない文字行であっても
、処理速度を低下させることなく、しかも精度良く文字
読取〕を可能とする文字読取方式を容易忙提供すること
が可能となる。
【図面の簡単な説明】
図1は、郵便物上の住所の一例を用いて本発明の原理を
示す図である。図2は、本発明の一実施例を示す論理ブ
ロック図である。 図において、1は行イメージ記憶部、2は文字分離部、
3は文字ブロック記憶部、4は文字ブ四ツク照合部、5
は文字ブロック照合結果記憶部、6は文字サブブロック
照合部、7は文字サブブ四ツク照合結果記憶部、8はI
!識辞書記憶部、9は字種選択部、10は文字ブロック
判定部、11は文字ブロック分割部、12は文字サブブ
ロック記憶部である。 代理人 弁理士 本 庄 伸 介 躍”− (a) 図1 1・1  崎    口  丁 (C) (d)

Claims (1)

    【特許請求の範囲】
  1. 文字行を複数個の文字ブロックに分離する文字分離手段
    と;予め複数個の字種毎に分類された標準パタンを記憶
    した認識辞書と;前記認識辞書から1つないし複数個の
    字種に分類される複数個の標準パタンを取り出し、前記
    文字ブロックと照合して所定の文字カテゴリに識別する
    手段と;前記文字ブロックの形状及び前記文字行内の相
    対位置に従つて前記文字ブロックを再分割し、複数個の
    文字サブブロックを検出する手段と;前記認識辞書から
    所定の字種に分類された複数個の標準パタンを取り出し
    、前記複数個の文字サブブロックと順次照合して所定の
    文字カテゴリに識別する手段とを具備することを特徴と
    する文字読取方式。
JP61235940A 1986-10-03 1986-10-03 文字読取装置 Expired - Lifetime JP2570703B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61235940A JP2570703B2 (ja) 1986-10-03 1986-10-03 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61235940A JP2570703B2 (ja) 1986-10-03 1986-10-03 文字読取装置

Publications (2)

Publication Number Publication Date
JPS6389990A true JPS6389990A (ja) 1988-04-20
JP2570703B2 JP2570703B2 (ja) 1997-01-16

Family

ID=16993477

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61235940A Expired - Lifetime JP2570703B2 (ja) 1986-10-03 1986-10-03 文字読取装置

Country Status (1)

Country Link
JP (1) JP2570703B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05169033A (ja) * 1991-12-26 1993-07-09 Toshiba Corp 宛名読取装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60153575A (ja) * 1984-01-23 1985-08-13 Nippon Telegr & Teleph Corp <Ntt> 文字読取方法
JPS60153574A (ja) * 1984-01-23 1985-08-13 Nippon Telegr & Teleph Corp <Ntt> 文字読取方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60153575A (ja) * 1984-01-23 1985-08-13 Nippon Telegr & Teleph Corp <Ntt> 文字読取方法
JPS60153574A (ja) * 1984-01-23 1985-08-13 Nippon Telegr & Teleph Corp <Ntt> 文字読取方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05169033A (ja) * 1991-12-26 1993-07-09 Toshiba Corp 宛名読取装置

Also Published As

Publication number Publication date
JP2570703B2 (ja) 1997-01-16

Similar Documents

Publication Publication Date Title
JP3445394B2 (ja) 少なくとも二つのイメージセクションの比較方法
US6014460A (en) Character strings reading device
US6038351A (en) Apparatus and method for multi-entity, mixed document environment document identification and processing
JPS63182793A (ja) 文字切り出し方式
RU2259592C2 (ru) Способ распознавания графических объектов с использованием принципа целостности
JPH0430070B2 (ja)
Saiga et al. An OCR system for business cards
JPS6389990A (ja) 文字読取装置
JPH06124366A (ja) 住所読取装置
KR100571080B1 (ko) 문서 인식 장치 및 우편 구분기
JP3727422B2 (ja) 文字認識装置及びその方法
JPH09319824A (ja) 帳票認識方法
JP3162552B2 (ja) 郵便物あて名認識装置及びあて名認識方法
JPH0247788B2 (ja)
JP3151866B2 (ja) 英文字認識方法
JPH08287188A (ja) 文字列認識装置
JPS6227887A (ja) 文字種分離方式
KR101025227B1 (ko) 배송분류정보를 생성하는 운송장
JP3292595B2 (ja) 文字認識装置
JP2746345B2 (ja) 文字認識の後処理方法
JP2972443B2 (ja) 文字認識装置
JP2880387B2 (ja) Ocr住所処理装置
KR200353215Y1 (ko) 배송분류정보를 생성하는 운송장
JPH09190507A (ja) 住所読取装置
JPH0646421B2 (ja) 文字読取方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term