JPS63138478A - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JPS63138478A
JPS63138478A JP61285142A JP28514286A JPS63138478A JP S63138478 A JPS63138478 A JP S63138478A JP 61285142 A JP61285142 A JP 61285142A JP 28514286 A JP28514286 A JP 28514286A JP S63138478 A JPS63138478 A JP S63138478A
Authority
JP
Japan
Prior art keywords
address
recognition
string
character
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61285142A
Other languages
English (en)
Inventor
Hidehiro Ishikawa
石川 秀洋
Isao Kaneko
功 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Software Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Software Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Software Engineering Corp filed Critical Toshiba Corp
Priority to JP61285142A priority Critical patent/JPS63138478A/ja
Publication of JPS63138478A publication Critical patent/JPS63138478A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の口約] (産業上の利用分野) 本発明は、住所を示ず文字列と住所の一部に対応した郵
便番号等の数字列とが共に記入されている帳票の前記文
字列を認識する際に適する文字認識方式に関する。
(従来の技術) 近年、郵便番号の一般性が高まり、郵便物に限らず、住
所の近伊に記入される場合が多くなった。
ところで住所と共に郵便番号が記入されている帳票を従
来の文字認識装置により処理する場合、住所の認識は住
所を示す文字列のパターン認識のみにより行われている
そして例えば都道府県名の認識結果が得られると、これ
に続く重置郡名の認識処理を行う際に、その都道府県に
実際に存在する軍区郡名が予め格納されているデータベ
ースを使用して、意味的に正しい認識結果を得るように
している。この処理は軍区郡名に続く町村名の認識を行
なう際にも同様に行なわれる。一般にこの処理は知識処
理と呼ばれている。
しかしながら従来の文字認識装置では、住所の認識結果
が最終的に正しいものであるが否がを判断する基準がな
かったため、前述した知識処理を行なっても誤った認識
結果が得られる場合があるという問題があった。
また、ある段階で誤った認識結果候補が採用されると(
通常は第1位の一議結果候補が採用される)、それ以降
の段階で適当な認識結果候補が得られなくなり、最終的
にエラー扱いとなる場合が多いという問題があった。
(発明が解決しようとする問題点) 本発明は上述したような事情によりなされたもので、住
所の認識における誤読およびエラーの発生を大幅に低減
させ、認識効率を飛躍的に向上させることができる文字
認識方式の提供を目的としている。
[発明の構成] (問題を解決するための手段) 本発明の文字認識方式は、住所を示す文字列と前記住所
の一部に対応した数字列とが共に記入されている帳票の
前記文字列を認識するにあたり、前記数字列の認識結果
に関連させて前記文字列の認識処理を行なうものである
(作 用) 郵便番号等の数字列は文字列と比較して認識が容易であ
り、正しい認識結果が得られる確率が高いので、このコ
ードの認識結果に関連させて住所を示す文字列の認識処
理を行うと、前記文字列の正しい認識結果が得られる確
率が大幅に向上する。
(実施例) 以下、本発明の実施例の詳細を図面に基づいて説明する
第1図は本発明方式の一実施例による住所の認識処理の
流れを示す図である。
本実施例方式では、まず本実施例方式特有の処理を行な
うか否か、すなわち郵便番号を認識処理に加味にするか
否かを指定する(ステップA)。
そしてデータ入力、すなわちスキャナによる帳票の読取
りを実行すると(ステップB)、その帳票に郵便番号が
記入されているか否かを判断する処理が行われ(ステッ
プC)、郵便番号が記入されている場合には、郵便番号
の認識結果に関連させて住所を示す文字列の認識処理を
行うモードが選択される(ステップD)。
2方、郵便番号が記入されていない場合には、従来の文
字認諾方式と同様に直接住所を示す文字列の認識処理を
行うモードが選択され(ステップE)、いずれか一方の
モードの認識処理により住所を示す文字列の認識結果が
出力される(ステップF)。
本実施例方式により、第2図に示したように郵便番号と
してr359Jという数字列が記入され、都道府県名と
して「埼玉系」、軍区郡名として「所沢型」、町村名と
して「金山町」、番地としてr12−19Jという文字
列が記入されている帳票のコ2識処理を行う場合につい
て説明する。
なお本実施例方式の認識処理には少なくとも2通りの方
法がある。
一方は、郵便番号からのデータにより住所内容を確定で
きるフィールドまでは、郵便番号がらのデータを優先し
て採用し、それ以降のフィールドの認識処理において郵
便番号からのデータに基づいて知識処理を行う方法であ
る(方法1)。
また他方は、郵便番号からのデータと郵便番号により住
所内容を確定できるフィールドがらのデータとを比較し
て、両者が一致しなかった場合にはエラー扱いとする方
法である(方法2)。
方法1により認識を行う場合について、第3図にしたが
って説明する。
まず郵便番号r359Jの認識結果がら、都道府県名で
ある「埼玉系」および軍区郡名である「所沢型」を得る
この場合、帳票上の都道府県名および市区郡名に対応す
る各フィールドに、いかなる文字が書かれていても、郵
便番号から得られるデータを採用する。
次に「所沢型」に実際に存在する町村名が予め格納され
ている辞書を選択する。なおこのような辞書は一般に知
識辞書と呼ばれている。
第2図の帳票上の町村名に対応するフィールドには「全
小町」という文字が書かれているため、このフィールド
のパターン認識を行なうと「全小町」、「金本町」、「
全小町」・・・等の認識結果候補が得られるが、これら
認識結果候補に知識処理をかけ、「所沢型」に実際に存
在する「全小町」が認識結果として出力される。
次に帳票上の番地名に対応するフィールドに記入されて
いるr12−19Jをパターン認識し、最終的に[埼玉
県所沢市金山町12−19Jという正しい認識結果を得
る。
すなわち郵便番号は数字のみで表現されるため、一般に
95%以上の認識率を期待することができ、住所を示す
文字列が不鮮明に記入されている場合でも、正しい認識
結果を得ることができる。
続いて方法2により認識を行う場合について、第4図に
したがって説明する。
まず郵便番号’ 3.59 Jの認識結果を得、この郵
便番号から「埼玉県所沢市」という都道府県名および軍
区郡名を得る(ステップA)。
これと並行して帳票上の都道府県名に対応するフィール
ドおよび軍区郡名に対応するフィールドからパターン認
識により、文字列「埼玉系」および「所沢型」に対応す
る「埼玉系」、「埼玉系」、「奇王県」・・・および「
所沢型」、「所沢型」、「戸沢市」・・・等の認識結果
候補を得る(ステップB)。
そしてステップAにより得られた都道府県名および軍区
郡名と、ステップBにより得られた都道府県名および軍
区郡名とを比教して(ステップC)、両者が一致した場
合には「埼玉県所沢市」を正しい住所として、後続する
町村名の知識処理を行なうが、両者が一致していなかっ
た場合にはりジェツトやアラーム等のエラー処理を行な
う。
かくして本実施例方式によれば、郵便番号と住所を示す
文字列との2系統から住所を認識するので、正しい認識
結果が得られる確率が飛躍的に向上する。
そして郵便番号は社会的に知られているコード番号であ
るため、容易に調べることができ、帳票の記入時および
知識辞書の作成時に大きな負担がかかることはない。
なお本実施例では住所に対応する数字列として郵便番号
を採用した場合について説明したが、住所に対応する数
字列は電話番号等のコード番号であってもよい。
また本実施例では本発明方式を文字認識装置に適用した
場合について説明したが、本発明はワードプロセッサの
データエントリ装置等にも応用することができる。
[発明の効果コ 以上説明したように本発明の文字認識方式は、住所を示
す文字列と前記住所の一部に対応した郵便番号等の数字
列とが共に記入されている帳票の前記文字列を認識する
にあたり、前記数字列の認識結果に関連させて前記文字
列の認識処理を行うので、住所の認識における誤読およ
びエラーの発生を大幅に低減させ、認識効率を飛躍的に
向上させることができる。
【図面の簡単な説明】
第1図は本発明方式の一実施例を示す流れ図、第2図は
同実施例により認識することができる帳票の一例を示す
図、第3図は第2図の帳票を第1図の処理における第1
の方法により認識する際の具体例を示す図、第4図は第
2図の帳票を第1図の処理における第2の方法により認
識する際の具体例を示す図である。

Claims (5)

    【特許請求の範囲】
  1. (1)住所を示す文字列と前記住所の一部に対応した数
    字列とが共に記入されている帳票の前記文字列を認識す
    るにあたり、前記数字列の認識結果に関連させて前記文
    字列の認識処理を行なうことを特徴とする文字認識方式
  2. (2)数字列の認識結果とこの数字列に対応する部分の
    文字列の認識結果とが合致しなかったとき、前記数字列
    の認識結果を優先させる特許請求の範囲第1項記載の文
    字認識方式。
  3. (3)数字列の認識結果とこの数字列に対応する部分の
    文字列の認識結果とが合致しなかったとき、エラー扱い
    にする特許請求の範囲第1項記載の文字認識方式。
  4. (4)数字列が、郵便番号である特許請求の範囲第1項
    ないし第3項のいずれか1項記載の文字認識方式。
  5. (5)数字列が、電話番号である特許請求の範囲第1項
    ないし第3項のいずれか1項記載の文字認識方式。
JP61285142A 1986-11-29 1986-11-29 文字認識方式 Pending JPS63138478A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61285142A JPS63138478A (ja) 1986-11-29 1986-11-29 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61285142A JPS63138478A (ja) 1986-11-29 1986-11-29 文字認識方式

Publications (1)

Publication Number Publication Date
JPS63138478A true JPS63138478A (ja) 1988-06-10

Family

ID=17687643

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61285142A Pending JPS63138478A (ja) 1986-11-29 1986-11-29 文字認識方式

Country Status (1)

Country Link
JP (1) JPS63138478A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0256086A (ja) * 1988-08-22 1990-02-26 Ricoh Co Ltd 文字認識の後処理方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61173388A (ja) * 1985-01-26 1986-08-05 Toshiba Corp 光学式文字読取装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61173388A (ja) * 1985-01-26 1986-08-05 Toshiba Corp 光学式文字読取装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0256086A (ja) * 1988-08-22 1990-02-26 Ricoh Co Ltd 文字認識の後処理方法

Similar Documents

Publication Publication Date Title
US4991094A (en) Method for language-independent text tokenization using a character categorization
US7769778B2 (en) Systems and methods for validating an address
KR910007531B1 (ko) 음성인식장치
EP1326234A2 (en) Constraint-based speech recognition system and method
WO2009005492A1 (en) Systems and methods for validating an address
US6912516B1 (en) Place name expressing dictionary generating method and its apparatus
JPS63138478A (ja) 文字認識方式
JPH1011434A (ja) 情報認識装置
JP2008059389A (ja) 語彙候補出力システム、語彙候補出力方法及び語彙候補出力プログラム
JP3002202B2 (ja) 規則音声合成装置における数詞読み付与装置
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JPH0256086A (ja) 文字認識の後処理方法
JP2619499B2 (ja) べた書き住所の文字認識後処理方式
JP2000132635A (ja) 認識データ確認方法
JP2570784B2 (ja) 文書リーダ後処理装置
JP2880387B2 (ja) Ocr住所処理装置
JPH01114976A (ja) 文書処理装置の辞書構造
JP2939945B2 (ja) ローマ字住所認識装置
Marukawa et al. A post-processing method for handwritten Kanji name recognition using Furigana information
JPH0546814A (ja) 文字読み取り装置
JPH08305698A (ja) 自然語解析方法及び装置
JP3725206B2 (ja) 文字認識装置
JPH11120294A (ja) 文字認識装置および媒体
JP2725454B2 (ja) 文字コード知識処理方式
JPH02118785A (ja) 誤認識修正方法及び装置