JP2874199B2 - 単語辞書照合装置 - Google Patents

単語辞書照合装置

Info

Publication number
JP2874199B2
JP2874199B2 JP1179287A JP17928789A JP2874199B2 JP 2874199 B2 JP2874199 B2 JP 2874199B2 JP 1179287 A JP1179287 A JP 1179287A JP 17928789 A JP17928789 A JP 17928789A JP 2874199 B2 JP2874199 B2 JP 2874199B2
Authority
JP
Japan
Prior art keywords
keyword
word
character string
read
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1179287A
Other languages
English (en)
Other versions
JPH0342790A (ja
Inventor
武志 場生松
修 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP1179287A priority Critical patent/JP2874199B2/ja
Publication of JPH0342790A publication Critical patent/JPH0342790A/ja
Application granted granted Critical
Publication of JP2874199B2 publication Critical patent/JP2874199B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は単語辞書照合装置に関し、特に入力された読
取文字列を単語辞書内の登録内容と照合して、読取文字
列を認識する単語辞書照合装置に関する。
〔従来の技術〕
第5図は、従来の単語辞書照合装置の構成を示すブロ
ック図である。
第5図において、レジスタ51は、文字読取機(図示せ
ず)により読取られた文字列を記憶し、辞書読出部52に
出力する。単語辞書53には、照合されるべきすべての文
字列が登録されており、辞書読出部52からの要求によ
り、登録されている文字列が逐次読み出され、読取文字
列とともに、単語照合部54に出力されて2つの文字列の
一致が照合される。両文字列が一致したとき、その文字
列又は文字列を代表するコードが出力される。
〔発明が解決しようとする課題〕
上述した従来の単語辞書照合装置は、出現する可能性
のあるすべての文字列について、登録しておく必要があ
るため、文字列を構成する一部の単語の位置が異なるだ
けで、同一の文字列を示している場合でも、それぞれに
ついて別々の文字列として登録する必要があり、単語辞
書の容量及び照合時間が増大するという欠点がある。
本発明の目的は、複数の記載方法で表現される文字列
に対して、容量の小さい辞書の照合によっても読取文字
列の照合が可能となり、辞書の容量及び処理時間を大幅
に節約することができる単語辞書照合装置を提供するこ
とにある。
〔課題を解決するための手段〕
本発明の単語辞書照合装置は、文字読取機で読取った
読取文字列の中に含まれている単語列を用いて、前記文
字列に対応する文字列を、あらかじめ記憶している単語
辞書を検索して照合することにより、前記読取文字列が
前記単語辞書内に格納されている文字列と一致するかど
うかを確認する単語辞書照合装置において、 (A)特定の単語を登録したキーワードテーブルを用い
て前記読取文字列中からキーワードを検出し、かつ、前
記キーワードと他の単語列との位置関係を示す位置コー
ドを出力するキーワード位置検出手段、 (B)文字列が前記キーワードと、他の単語列と、前記
キーワードと他の単語列が取り得るすべての位置関係を
示す前記位置コードとにより構成される前記単語辞書に
対し、前記読取文字列のキーワード以外の単語列と照合
を行う第1の照合手段、 (C)前記第1の照合手段より出力される前記単語列の
キーワード及び位置コードと前記読取文字列より検出さ
れたキーワード及び位置コードとを照合し、照合結果を
出力する第2の照合手段、 とを有して構成されている。
〔実施例〕
次に、本発明の実施例について図面を参照して説明す
る。
第1図は本発明の一実施例のブロック図、第2図は第
1図の単語辞書照合装置に入力される住所例を示す説明
図、第3図は第1図の単語辞書照合装置の単語辞書の登
録例を示す説明図、第4図は従来の単語辞書照合装置の
単語辞書の登録例を示す説明図である。
本実施例は、郵便物の宛名住所をあらかじめ作成され
た住所辞書と照合して確認するもので、文字読取機4は
入力された文字列のうち、対象とする住所部分を読取っ
て読取文字列としてレジスタ11に出力するものである。
第1図に示す単語辞書照合装置は、キーワード位置検
出手段1、第1の照合手段2、第2の照合手段3から構
成されている。
さらに、キーワード位置検出手段1はレジスタ11、キ
ーワードテーブル12、キーワード検出部13、キーワード
位置検出部14から構成されている。
第1の照合手段2は、辞書読出部21、辞書部22、単語
照合部23から構成されている。
又、第2の照合手段3は、キーワード照合部31、位置
コード照合部32から構成されている。
次に、動作を説明する。
第1図において、レジスタ11に記憶された読取文字列
は、キーワードテーブル12にあらかじめ登録されたキー
ワードにもとづいて、キーワード検出部13において、キ
ーワードの照合が行われ、一致が確認されると、キーワ
ード位置検出部14において、読取文字列におけるキーワ
ードの位置が検出され、位置コードが生成される。この
ようにして、読取文字列は、本キーワード位置検出手段
1により、キーワード,キーワード以外の単語列(以
下、単語列と称す)及びキーワードと単語列の位置関係
を示す位置コードに変換される。
又、第1の照合手段2の辞書部22には、検索対象とな
る住所情報がそれぞれ単語列,キーワード及び位置コー
ドの組合せにより、第3図に示すように登録されてい
る。
読取文字列のうち、単語列が辞書読出部21に出力さ
れ、単語列の文字数等の特徴にもとづいて、辞書部22よ
り登録されている住所情報か読み出される。さらに、単
語照合部23において、読取文字列の単語列と辞書部22よ
り読み出された住所情報の単語列とが照合され、一致が
確認されると、そのときの住所情報が第2の照合手段3
のキーワード照合部31へ出力される。
第2の照合手段3のキーワード照合部31において、読
取文字列のキーワードと、住所情報に登録されたキーワ
ードとが照合される。そして、一致が確認されると、さ
らに、位置コード照合部32において、読取文字列の位置
コードが、住所情報に登録された位置コードに含まれて
いるかが検証され、含まれていることが確認されると、
照合された住所情報又は代表されるコードを区分機5に
出力する。
次に、第2図に示す住所例の場合についての動作を説
明する。
いま、文字読取機4より読取文字列「ABCD STREET WE
ST」が出力されると、キーワード位置検出手段1におい
て、単語列「ABCD STREET」,キーワード「WEST」,及
び位置コード「3」に変換される。本実施例では、位置
コードとして、左端から計算したキーワードまでの単語
数を用いているが、他の方法でコード化できることはい
うまでもない。
次に、第1の照合手段2において、単語列「ABCD STR
EET」と、辞書部22に登録された住所情報の単語列とが
照合され、一致が確認された住所情報として、「ABCD S
TREET,位置コード1,3及びキーワードWEST」が出力され
る。
さらに、第2の照合手段3により、読取文字列のキー
ワード「WEST」と住所情報に登録されているキーワード
「WEST」とが照合され、一致が確認されると、位置コー
ドが比較され、読取文字列の位置コード「3」が住所情
報に登録された位置コード「1,3」に含まれていること
が検出され、読取文字列と辞書部より読み出された住所
情報とが一致していることが確認される。
また、第2図の2番目の例である「WEST ABCD STREE
T」についても、単語列「ABCD STREET」,キーワード
「WEST」及び位置コード「1」と変換され、同様の手順
により、1番目の例と同じ住所情報と一致していること
が確認される。
従来の単語辞書照合装置においては、第4図に示され
るように、各々の読取文字列に対して別々に辞書部に登
録されている必要がある。
このようにして、住所名を単語列,位置コード,キー
ワードに変換して登録しておくことにより、記載方法が
複数存在する住所名に対し、一組の住所情報で構成され
た容量の小さい辞書部22でも検索することができるの
で、辞書の容量及び処理時間を節約することができる。
〔発明の効果〕
以上説明したように、本発明は、入力される読取文字
列についてキーワード位置検出手段によって単語列,位
置コード,キーワードに変換し、かつ、辞書部にあらか
じめ照合される文字列を同様の形式で登録し、第1及び
第2の照合手段によってそれぞれの部分について照合す
ることにより、複数の記載方法で表現される文字列に対
しても、容量の小さい辞書の照合によっても読取文字列
の照合が可能となり、辞書の容量及び処理時間を大幅に
節約することができるという効果を有する。
【図面の簡単な説明】
第1図は本発明の一実施例のブロック図、第2図は第1
図の単語辞書照合装置に入力される住所例を示す説明
図、第3図は第1図の単語辞書照合装置の単語辞書の登
録例を示す説明図、第4図は従来の単語辞書照合装置の
単語辞書の登録例を示す説明図、第5図は従来の単語辞
書照合装置の構成を示すブロック図である。 1……キーワード位置検出手段、2……第1の照合手
段、3……第2の照合手段、4……文字読取機、5……
区分機、11……レジスタ、12……キーワードテーブル、
13……キーワード検出部、14……キーワード位置検出
部、21……辞書読出部、22……辞書部、23……単語辞書
照合部、31……キーワード照合部、32……位置コード照
合部、51……レジスタ、52……辞書読出部、53……単語
辞書、54……単語照合部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】文字読取機で読取った読取文字列の中に含
    まれている単語列を用いて、前記文字列に対応する文字
    列を、あらかじめ記憶している単語辞書を検索して照合
    することにより、前記読取文字列が前記単語辞書内に格
    納されている文字列と一致するかどうかを確認する単語
    辞書照合装置において、 (A)特定の単語を登録したキーワードテーブルを用い
    て前記読取文字列中からキーワードを検出し、かつ、前
    記キーワードと他の単語列との位置関係を示す位置コー
    ドを出力するキーワード位置検出手段、 (B)文字列が前記キーワードと、他の単語列と、前記
    キーワードと他の単語列が取り得るすべての位置関係を
    示す前記位置コードとにより構成される前記単語辞書に
    対し、前記読取文字列のキーワード以外の単語列と照合
    を行う第1の照合手段、 (C)前記第1の照合手段より出力される前記単語列の
    キーワード及び位置コードと前記読取文字列より検出さ
    れたキーワード及び位置コードとを照合し、照合結果を
    出力する第2の照合手段、 とを有することを特徴とする単語辞書照合装置。
JP1179287A 1989-07-11 1989-07-11 単語辞書照合装置 Expired - Lifetime JP2874199B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1179287A JP2874199B2 (ja) 1989-07-11 1989-07-11 単語辞書照合装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1179287A JP2874199B2 (ja) 1989-07-11 1989-07-11 単語辞書照合装置

Publications (2)

Publication Number Publication Date
JPH0342790A JPH0342790A (ja) 1991-02-22
JP2874199B2 true JP2874199B2 (ja) 1999-03-24

Family

ID=16063193

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1179287A Expired - Lifetime JP2874199B2 (ja) 1989-07-11 1989-07-11 単語辞書照合装置

Country Status (1)

Country Link
JP (1) JP2874199B2 (ja)

Also Published As

Publication number Publication date
JPH0342790A (ja) 1991-02-22

Similar Documents

Publication Publication Date Title
JP2874199B2 (ja) 単語辞書照合装置
JPH0441388B2 (ja)
JP2671311B2 (ja) 住所読取装置
JP2588261B2 (ja) Ocrによる住所データベース検索装置
JP2655087B2 (ja) 文字認識後処理方式
JP2000090192A (ja) 住所および郵便番号の文字列修正方法
JPH08272813A (ja) ファイリング装置
JPH0635971A (ja) 文書検索装置
JPH07296005A (ja) 日本語テキスト登録・検索装置
JP2776069B2 (ja) 文章検査装置
JP2839515B2 (ja) 文字読取システム
JPH0758499B2 (ja) 文字認識装置
JP2795003B2 (ja) 文字認識処理装置
JPH0256086A (ja) 文字認識の後処理方法
JPH0646423B2 (ja) 単語辞書照合装置
JPH06301822A (ja) 文字認識後処理方式
JP3292595B2 (ja) 文字認識装置
JP2942375B2 (ja) 文字読取装置
JPH1078953A (ja) 住所表記変換方法および住所表記チェック方法
JP2865443B2 (ja) カナ氏名もしくはカナ法人名表記の漢字変換装置
JPS63268082A (ja) パタ−ン認識装置
JPH0546815A (ja) 光学式文字読取装置における住所単語照合方法
JPH0528132A (ja) 単語辞書照合装置
JPH04250589A (ja) 単語照合装置及び単語照合方法
JPH05242303A (ja) 宛名読取装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080114

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090114

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100114

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100114

Year of fee payment: 11