JPS61208187A - 単語認識装置 - Google Patents

単語認識装置

Info

Publication number
JPS61208187A
JPS61208187A JP60048506A JP4850685A JPS61208187A JP S61208187 A JPS61208187 A JP S61208187A JP 60048506 A JP60048506 A JP 60048506A JP 4850685 A JP4850685 A JP 4850685A JP S61208187 A JPS61208187 A JP S61208187A
Authority
JP
Japan
Prior art keywords
character
word
address
words
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60048506A
Other languages
English (en)
Inventor
Masaaki Shizuno
静野 正明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP60048506A priority Critical patent/JPS61208187A/ja
Publication of JPS61208187A publication Critical patent/JPS61208187A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Sorting Of Articles (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野] この発明は単語認識装置、たとえば郵便物自動読取区分
機において、搬送される郵便物上に記載されている宛名
、郵便番号等を読取る文字読取装置に関する。
[発明の技術的背景とその問題点] 従来、郵便物自動読取区分機においては、区分情報とし
て郵便物上の郵便番号を読取って、この郵便番号に応じ
て区分を行なうようになっている。
また、この郵便番号の確認手段として、宛名情報の最初
に記載される車名、区名あるいは町名等の宛名を読取っ
て判定し、郵便番号を確認することが望まれており、種
々の考案が成されている。
しかしながら、上記のような宛名を判定する装置では、
宛名として読取った最初の文字(あるいは最後の文字)
から順に認識を行なった結果を宛名として判定している
。このため、最初に認識を行なう文字が認識不能となっ
た場合、その宛名を判定することができないという問題
がめった。そこで、読取った宛名とあらかじめ複数の単
語を記憶している単語の辞書とを比較することにより、
単語つまり宛名の判定を行なうものも考えられている。
この場合、読取った宛名の各文字ごと、つまり単語の最
初から(あるいは最俄から)1文字づつ順番に比較して
いくため、信頼度(類似度)の低い文字が最初に現われ
ると、読取り不能となるか、おるいは読取り可能な場合
でも効率が悪いという問題があった。
[発明の目的] この発明は上記事情に鑑みてなされたもので、その目的
とするところは、単語の判定を高速かつ高信頼性で行な
うことのできる単語認識装置を提供しようとするもので
ある。
[発明の概要] この発明は上記目的を達成するために、文字情報を検出
手段で検出し、この検出手段で検出した文字情報の各文
字を判定すると共にその信頼度を算出し、これらの文字
のうち信頼度の高い文字の順に候補となる単語群を記憶
している記憶手段から候補の単語を読出し、この読出し
た単語により文字情報に対応する単語を判定するように
したものである。
[発明の実施例] 以下、この発明を郵便物自動読取区分機に適用した二実
施例について図面を参照して説明する。
第2図は、この発明に係る被読取物、たとえば郵便物P
の一例を示すもので、その表面には複数行(この場合は
3行)の宛先情報1が横方向に記載されている。このよ
うな郵便物Pにおいて、宛先情報1の最下行2に読取る
べき郵便番号(210)3と、(大きな)地域を示す「
車名」、「区名」等の宛名(カワサキシ)4とが記載さ
れている。そして、この郵便物Pは、図示矢印a方向に
搬送されるようになっている。
第1図は、郵便物自動読取区分機に用いられる、この発
明の文字読取(単語認識)装置の構成を概略的に示すも
のである。すなわち、11は第1走査部で、矢印a方向
に搬送される郵便物Pの搬送路に沿って設けられている
。この第1走査部11は、郵便物P上のあらかじめ定め
られた視野範囲5(第2図参照)を、破線矢印方向に光
学的に走査して光電変換することによりパターン信号を
得るものである。この第1走査部11は、たとえば郵便
物P上に光を照射する光源、およびその反射光を受けて
電気信号に変換する自己走査形のCODイメージセンサ
等によって構成される。
12は文字行検出装置で、第1走査部11からのパター
ン信号により、読取るべき郵便番号3L1”3よび(大
きな地域を示す)宛名4が存在する最下行2の位置等を
検出し、後述する第2走査部13の読取視野位置を設定
する視野位置設定信号を出力するものである。この文字
行検出装置12は、たとえば第1走査部11から供給さ
れるパターン信号によりX方向への投影であるXマスク
を作成するXマスク作成回路、Y方向への投影であるY
マスクを作成するYマスク作成回路、およびそれらマス
ク信号で抽出される各行情報と各条件情報により、Xマ
スク内にある各行が宛先情報ブロックとしてふされしい
か否かを判定し、その判定したブロックの左側のX座標
値および左上端のY座標値を選択出力する判定回路等に
よって構成されている。
13は第2走査部で、郵便物Pの搬送路に沿った第1走
査部11の搬送方向前方に設けられているもので、郵便
物P上の設定視野範囲6(第2図参照)を、破線矢印方
向に光学的に走査して光電変換することによりパターン
信号を得るものである。この第2走査部13は、たとえ
ば郵便物P上に光を照射する光源、文字行検出装置12
の出力によって制御される読取視野設定用の可動ミラー
、および郵便物P上からの反射光を上記可動ミラーを介
して受け、それを電気信号に変換する自己走査形のCO
Dイメージセンサ等によって構成されるものである。
14は文字検出切出部で、第2走査部13からのパター
ン信号により宛先情報1の最下行2の郵便番号3と、郵
便番号に続けて読出される宛名の最初の1ブロツク、つ
まり宛名4(用崎市)のみを検出切出しするものである
。この文字検出切出部14は、たとえば第3図<a>〜
(C)に示すように、マスクが作成され、そのマスクご
とをブロック化し、このブロックパターンから郵便番号
3のブロックと宛名4のブロックとを判断する。
そして、この判断した郵便番号のブロックと宛名のブロ
ックと各文字パターンを1文字づつ検出切出しするよう
になっている。
15は正規化部で、上記文字検出切出部14から供給さ
れる文字パターン、つまり検出切出しされた文字情報を
正規化し、サンプリングするものである。
16は文字認識部で、文字検出切出部14.から正規化
部15を介して供給される文字情報を、たとえば辞書1
7内の数字、漢字、カタカナに対する基準パターンとの
マツチング法等によって、数字、漢字およびカタカナ等
の文字をそれぞれ認識し、その認識結果と共にその信頼
度(類似度)を出力するものである。
18は宛名判定部で、上記文字認識部16から供給され
る宛名4に対して単語辞書19から続出される単語(最
大10文字)により宛名を判定するものでおる。上記単
語辞@19はROM等で構成され、第4図に示すように
アドレスデータからなるエントリ部19aと、同じ文字
数口の位置に同じ文字が現われる複数の単語を関連させ
て記憶しているテーブル部19bとからなっている。上
記エントリ部19aには、単語の各文字(1文字目から
10文字目)に対するテーブル部19bにおける最初の
単語が記憶されているアドレスが50音全部に対して記
憶されている。たとえば、1文字目が「ア」である最初
の単語の記憶アドレスが記憶されるようになっている。
上記テーブル部19bには、複数の単語データが記憶さ
れており、各単語データとしては、たとえば「カワサキ
シ」という単語の場合、1文字目が「力」、2文字目が
「ワ」、3文字目が「す」、4文字目が「キ」、5文字
目が「シ」を記憶していると共に、各文字ごとに同じ文
字数口が同じ文字である次の単語のアドレス(テーブル
部19bにおけるポインタ)を記憶している。
すなわち、上記宛名判定部18は、認識部16から供給
される宛名4のうち信頼度(類似度)の1番高い文字の
認識結果に基づき単語のアドレスをエントリ部19aか
ら読出し、このエントリ部19aから読出したアドレス
にしたがいテーブル部19bから単語と、上記同じ文字
が同じ文字数口の位置に配置されている次の候補の単語
のアドレスを読出す。この読出したアドレスにより次の
単語データを読出す。したがって、上記認識文字に対す
る候補の単語を単語辞書19から読出し、この1文字の
認識結果による候補の単語が1つの場合、その単語を宛
名と判定するようになっている。この1文字の認識結果
による候補の単語が複数の場合、次に信頼度の高い文字
の認識結果に対応するアドレスをエントリ部19aから
読出し、上記同様に対応する候補の単語を読出す。この
結果、1番信頼度の高い文字に対する候補単語と2番目
に信頼度の高い文字に対する候補単語との一致チェック
により、1つの単語を特定できた場合、その単語を宛名
と判定するようになっている。この一致チェックにより
一致する単語が複数の場合、次に信頼度の高い文字の認
識結果に対応するアドレスをエントリ部19aから読出
し、上記同様に対応する候補の単語を読出すと共に、一
致チェックを行ない単語を特定するようになっている。
たとえば、文字認識部16から供給される宛名4の各文
字の認識結果と信頼度とが下記に示す表1のような場合
、信頼度の1番高い文字「す」の認識結果によりエント
リ部19aにおける3文字目が「す」であるアドレスを
読出し、この読出したアドレスにしたがいテーブル部1
9bから単語「アカザ力」と、上記同じ文字が同じ文字
数口の位置に配置されている次の単語のアドレスを読出
す。そして、この読出したアドレスにしたがいテーブル
部19bから候補の単語「オオサカシ」と、上記同じ文
字が同じ文字数口の位置に配置されている次の単語のア
ドレスを続出す。ついで、この読出したアドレスにした
がいテーブル部19bから候補の単語「オオサキ」と、
上記同じ文字が同じ文字数口の位置に配置されている次
の単語のアドレスを読出す。同様にして、他の候補の単
語「カワサキシ」、「タカサキシ」等が読出される。
次に、信頼度の高い4文字目の!!¥!識結果「キ」に
対応するアドレスをエントリ部19aから読出し、上記
同様に候補の単語「イワツキ」、「オオサキ」、「カワ
サキシ」、「クラジキシ」、「タカサキシ」等を読出す
。この結果、1番信頼度の高い文字「す」に基づく候補
単語と、2番目に信頼度の高い文字「キ」に基づく候補
単語との一致チェックにより、複数の単語「オオサキ」
、「カワサキシ」、「タカサキシ」が特定されるように
なっている。ざらに、信頼度の高い文字の順に候補単語
が続出され、各文字に対する候補単語の一致チェックに
より、1つの単語「カワサキシ」が特定され、この単語
が宛名として出力されるようになっている。
表  1 また、上記特定した単語を宛名と判断する場合、その単
語の各文字の信頼度の合計が所定の値に達しているか否
かをチェックするようになっている。
さらに、上記単語の特定を行なっている際に、候補単語
がなくなってしまう場合がある。この場合、最後まで残
っていた単語と、このときまでに使用された文字の信頼
度の和により、1番大きいものを宛名と判定するように
なっている。
20は答編集部であり、上記文字認識部16から供給さ
れる郵便番号と、判定部18から供給される宛名4に対
して郵便番号簿メモリ21から続出された郵便番号とが
一致するか否かにより、郵便番号が正しいか否かを判定
するものである。上記郵便番号簿メモリ21はROM等
で構成され、第5図に示すように、大きな地域を示す種
々の宛名に対応する郵便番号が記憶されているテーブル
であり、宛名の50音順に記憶されている。
次に、このような構成において動作を説明する。
たとえば今、第2図に示す郵便物Pが矢印a方向に搬送
され、第1走査部11に到達する。すると、この第1走
査部11は、その郵便物P上の視野範囲5を光学的に走
査して光電変換し、そのパターン信号が文字行検出装置
12に供給される。
この文字行検出装置12は、上記パターン信号にしたが
って読取るべき郵便番号3と宛名4が存在する最上行2
の位置等を検出し、それを第2走査部13に対する読取
視野位置設定信号に変換して出力する。これにより、第
2走査部13は、その読取視野位置用の可動ミラーが上
記視野位置設定信号により制御されることによって、郵
便物P上に対する視野範囲6が設定される。
そして、郵便物Pが第2走査部13に到達したときに、
この第2走査部13は、その郵便物P上の視野範囲6を
光学的に走査して光電変換し、そのパターン信号を文字
検出切出部14に出力する。
この文字検出切出部14は、第2走査部13からのパタ
ーン信号により、たとえば宛先情報1の最上行2の郵便
番号3と、郵便番号に続けて読出される宛名の最初の1
ブロツク、つまり(大きな地域を示す)宛名4を検出切
出しする。この検出切出部14は、たとえば第3図(a
)〜(C)に示すように、マスクが作成され、そのマス
クごとをブロック化し、このブロックパターンから郵便
番号のブロックと(大きな地域を示す)宛名のブロック
とを判断する。この郵便番号のブロックと(大きな地域
を示す)宛名のブロックは、それぞれ文字パターンを1
文字づつ検出切出しされる。
そして、この郵便番号の文字パターン、および(大きな
地域を示す)宛名のブロックの切出しされた1文字づつ
の文字パターンは、正規化部15に送られる。
この正規化部15は、上記郵便番号3および宛名4の文
字パターンを正規化し、サンプリングして文字認識部1
6に出力する。
すると、文字認識部16は上記正規化部15から供給さ
れる文字パターン、つまり郵便番号3と宛名4とを、た
とえば辞書17内の漢字、数字およびカタカナに対応す
る基準パターンとのマツチング法等によってそれぞれ文
字認識し、その認識結果としての郵便番号3を答編集部
20に出力し、宛名4を宛名判定部18に出力する。
これにより、上記宛名判定部18は、たとえば文字認識
部16から供給される宛名4の各文字の認識結果と信頼
度とが上記表1のような場合、信頼度の1番高い文字「
す」の認識結果に対応するアドレスをエントリ部19a
における3文字目の「す」に対応する位置から読出し、
この読出したアドレスに対応する単語データから単語「
アカザ力」と、上記同じ文字が同じ文字数日の位置に配
置されている単語のアドレスを読出す。そして、この読
出したアドレスに対応する単語データから候補の単語「
オオサカシ」と、上記同じ文字が同じ文字数日の位置に
配置されている単語のアドレスを読出す。ついで、この
読出したアドレスに対応する単語データから、候補の単
語「オオサキ」と上記同じ文字が同じ文字数日の位置に
配置されている単語のアドレスを読出す。このようにし
て、候補の単語として第6図(a)に示すように「アカ
ザ力」、「オオサカシ」、「オオサキ」、「カワサキシ
」、「タカサキシ」等が読出される。
次に、信頼度の高い4文字目の認識結果「キ」によりエ
ントリ部19aから4文字目が「キ」である単語のアド
レスを読出し、上記同様に対応する候補の単語として第
6図(b)に示すように「イワツキ」、「オオサキ」、
「カワサキシ」、「クラジキシ」、「タカサキシ」等を
読出す。この結果、1番信頼度の高い文字「す」に基づ
く候補単語と、2番目に信頼度の高い文字「キ」に基づ
く候補単語との一致チェツ・りにより、単語として第6
図(C)に示すように「オオサキ」、「カワサキシ」、
「タカサキシ」が特定されるようになっている。ざらに
、信頼度の高い文字の順に2文字目の認識結果「ワ」に
よりエントリ部19aにおける2文字目が「ワ」である
単語のアドレスを読出し、このアドレスにしたがいテー
ブル部19bから単語「カワサキシ」等の候補単語が読
出され、各文字に対する候補単語の一致チェックにより
、1つの単語「カワサキシ」が特定され、この単語を宛
名と判定し、答編集部20に出力する。
これにより、答編集部20は、文字認識部16から供給
される郵便番号3と、宛名判定部18から供給される宛
名4に対して郵便番号簿メモリ21から読出された郵便
番号とが一致するか否かにより、郵便番号が正しいか否
かを判定する。たとえば、郵便番号3としてr210J
が得られ、宛名4として「カワサキシ」が得られた場合
、この「カワサキシ」に対応する郵便番号を郵便番号簿
メモリ21から読出す。そして、この郵便番号簿メモリ
21から読出した「カワサキシ」に対応する郵便番号r
210Jと、上記文字認識部16から供給されている郵
便番号r210Jとが一致するか否かを判断する。この
場合、郵便番号が一致するため、この郵便番号が正しい
ものとして後段の区分部(図示せず)に出力される。
上記したように、宛名、たとえば「車名」、「区名」等
の宛名を判定する場合に、信頼度の高い文字の順に、同
じ文字数日の位置に同じ文字が現われる単語を関連させ
て記憶しているテーブルを用いて単語を読出し、この読
出した各単語の一致チェックにより宛名を判定するよう
にしたので、高速かつ高信頼度の宛名判定を行なうこと
ができる。
尚、上記実施例では、この発明を郵便物臼vJ読取区分
機に適用したものについてのみ説明したが、この発明は
これにとられれるものではなく、単語を認識する種々の
装置に応用することができる。
すなわち、音声入力装置における単語認識装置や、手書
文字認識装置における単語認識装置等にも適用できる。
また、上記実施例では、テーブル部において全ての単語
を1つのテーブルで取扱ったが、これに限らず、文字数
等で単語をグループ化した複数のテーブルを用いるよう
にしても良い。また、文字による単語検索を例としてあ
げたが、これに限らず、対象データを複数に分割できる
ものであれば、同じ位置に同じ部分データを含む対象デ
ータを関連させて記憶することにより、同様の検索が可
能となる。
[発明の効果] 以上詳述したように、この発明によれば、単語の判定を
高速かつ高信頼性で行なうことのできる単語認識装置を
提供できる。
【図面の簡単な説明】
第1図はこの発明に係る単3B認識装置の一実施例の構
成を概略的に示すブロック図、第2図は郵便物の一例を
示す平面図、第3図は文字検出切出部の動作を説明する
ための図、第4図は単語辞書の記憶構造の一例を示す図
、第5図は郵便番号簿メモリの記憶例を示す図、第6図
は宛名判定部の動作を説明するための図である。 P・・・郵便物、1・・・宛先情報、3・・・郵便番号
、4・・・宛名、5・・・視野範囲、6・・・設定視野
範囲、11・・・第1走査部、12・・・文字行検出装
置、13・・・第2走査部、14・・・文字検出切出部
、16・・・文字認識部、17・・・辞書、18・・・
宛名判定部、19・・・単語辞書、19a・・・エント
リ部、19b・・・テーブル部、20・・・答編集部、
21・・・郵便番号簿メモリ。 出願人代理人 弁理士 鈴江武彦 (a) (b) (C) 第4図

Claims (3)

    【特許請求の範囲】
  1. (1)文字情報を検出して認識する単語認識装置におい
    て、文字情報を検出する検出手段と、この検出手段によ
    り得られた各文字を判定すると共にその信頼度を算出す
    る文字判定手段と、候補となる単語群を記憶している記
    憶手段と、上記判定手段で判定した文字のうち信頼度の
    高い文字の順に上記記憶手段から候補の単語を読出し、
    この読出した単語により単語を判定する単語判定手段と
    を具備したことを特徴とする単語認識装置。
  2. (2)上記単語判定手段が、上記文字判定手段により判
    定された各文字ごとに上記記憶手段から読出された候補
    単語との一致を取ることにより単語を判定するものであ
    ることを特徴とする特許請求の範囲第1項記載の単語認
    識装置。
  3. (3)上記検出手段とは郵便物上の宛名を検出するもの
    であり、上記単語とは郵便物の住所情報であることを特
    徴とする特許請求の範囲第1項記載の単語認識装置。
JP60048506A 1985-03-12 1985-03-12 単語認識装置 Pending JPS61208187A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60048506A JPS61208187A (ja) 1985-03-12 1985-03-12 単語認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60048506A JPS61208187A (ja) 1985-03-12 1985-03-12 単語認識装置

Publications (1)

Publication Number Publication Date
JPS61208187A true JPS61208187A (ja) 1986-09-16

Family

ID=12805260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60048506A Pending JPS61208187A (ja) 1985-03-12 1985-03-12 単語認識装置

Country Status (1)

Country Link
JP (1) JPS61208187A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03189891A (ja) * 1989-12-20 1991-08-19 Pfu Ltd 辞書参照による知識処理を行う文字列読み取り装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03189891A (ja) * 1989-12-20 1991-08-19 Pfu Ltd 辞書参照による知識処理を行う文字列読み取り装置

Similar Documents

Publication Publication Date Title
US6327373B1 (en) Mail address reading apparatus and mail sorting apparatus
JPS61234481A (ja) 情報認識方法
US20060291692A1 (en) Information processing apparatus having learning function for character dictionary
KR100536509B1 (ko) 우편물에 대한 분배 정보를 인식하기 위한 방법 및 장치
JPH0739820A (ja) 街区認識装置および宛名読取区分機
JPS61208187A (ja) 単語認識装置
JPH07271899A (ja) 文字認識装置
JP3162552B2 (ja) 郵便物あて名認識装置及びあて名認識方法
JP3088036B2 (ja) 宛名読取区分機
JPH03123989A (ja) 文字認識装置
JPH0584548B2 (ja)
JPH01304087A (ja) 住所認識装置
JP2991594B2 (ja) 郵便物の宛名読取装置
JPH0739816A (ja) 宛名読取装置
JPS63136181A (ja) 文字読取装置
JPH02181287A (ja) 住所認識装置
JPH05324899A (ja) 郵便物記載住所認識装置
JPH07271909A (ja) 文字認識装置及び文字認識方法
JPH0696273A (ja) 帳票読み取り装置における認識フィールド検索方法
JPH04139593A (ja) 郵便番号認識装置
JPH0975859A (ja) 郵便番号認識方法、郵便番号認識装置および区分機
JPH0793467A (ja) 住所読取システム
JPS6379194A (ja) 文字認識装置
JPH0739819A (ja) 宛名読取区分機
JPH1057899A (ja) 住所読取装置