JPH02148174A - Ocrによる住所データベース検索装置 - Google Patents

Ocrによる住所データベース検索装置

Info

Publication number
JPH02148174A
JPH02148174A JP63300746A JP30074688A JPH02148174A JP H02148174 A JPH02148174 A JP H02148174A JP 63300746 A JP63300746 A JP 63300746A JP 30074688 A JP30074688 A JP 30074688A JP H02148174 A JPH02148174 A JP H02148174A
Authority
JP
Japan
Prior art keywords
keyword
keywords
data
classification information
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63300746A
Other languages
English (en)
Other versions
JP2588261B2 (ja
Inventor
Etsuo Saito
斉藤 悦生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63300746A priority Critical patent/JP2588261B2/ja
Publication of JPH02148174A publication Critical patent/JPH02148174A/ja
Application granted granted Critical
Publication of JP2588261B2 publication Critical patent/JP2588261B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的〕 (産業上の利用分野) 本発明は、各々複数のキーワードを有する複数のデータ
の中から入力された所望のキーワードに対応するデータ
を検索するデータ検索装置に関する。
(従来の技術) この種のデータ検索装置は、各キーワードに対応してデ
ータを記憶したテーブルを有し、入力されたキーワード
と一致するキーワードを前記テーブルに記憶されたすべ
てのキーワードの中から検索し、この検索したキーワー
ドに対応するデータを出力するようになっている。各デ
ータを識別するためのキーワードは、各データに対して
1つのみ存在するのでなく、通常は各データに対して複
数のキーワードが存在する。例えば、英文レターの住所
において、米国の州であるニューヨーク州に対するキー
ワードとしては、例えば正式名の「NY」、フルスペル
の[New  York J、または省略形のrN、Y
、J等のように複数の変形したキーワードが存在するた
め、この複数のキーワード毎にニューヨークとしてデー
タを記憶することが必要である。
このように各データに対してそれぞれ複数のキーワード
が存在するために、入力されたキーワードと一致するキ
ーワードを検索する動作は、各データに対して複数存在
するすべてのキーワードに対して行う必要があるため、
その検索時間は、全データ数に比較して複数存在するキ
ーワードの数倍となる。
(発明が解決しようとする課題) 上述したように、各データに対してそれぞれ複数のキー
ワードが存在する場合、検索動作は従来すべてのキーワ
ードに対して行う必要があるため、検索時間が大幅にか
かるという問題がある。
本発明は、上記に鑑みてなされたもので、その目的とす
るところは、検索を短時間で効率的に行うことができる
データ検索装置を提供することにある。
[発明の構成] (Ii!題を解決するための手段) 上記目的を達成するため、本発明のデータ検索装置は、
各々複数のキーワードを有する複数のデータの中から入
力された所望のキーワードに対応するデータを検索する
データ検索装置であって、前記複数のキーワードをキー
ワードの特性によって定められるキーワード分類情報毎
に分類し、この分類されたキーワードを該キーワードに
対するデータとの関連をもってキーワード分類情報毎に
記憶するキーワード分類記憶手段と、前記入力されたキ
ーワードに対応するキーワード分類情報を決定するキー
ワード分類情報決定手段と、該キーワード分類情報決定
手段で決定されたキーワード分類情報に対応して前記記
憶手段に記憶されているキーワードの中から前記入力さ
れたキーワードに一致するキーワードを検索し、この検
索したキーワードに対するデータを出力する検索手段と
を有することを要旨とする。
(作用) 本発明のデータ検索装置では、複数のキーワードをキー
ワード分類情報毎に分類して記憶するとともに、入力さ
れたキーワードに対応するキーワード分類情報を決定し
、この決定されたキーワード分類情報に対応して記憶さ
れているキーワードの中から一致するキーワードを検索
している。
(実施例) 以下、図面を用いて本発明の詳細な説明する。
第1図は本発明の一実施例に係わるデータ検索装置に使
用されるキーワード情報デープル1、検索テーブル38
〜3nおよびデータテーブル5を示す説明図である。キ
ーワード情報テーブル1は、入力されたキーワードをキ
ーワード分類情報のいずれに該当するかを決定するため
のキーワード分類情報を記憶しているテーブルであり、
このキーワード分類情報は分類したキーワードのすべて
に対して共通な情報である。例えば、このキーワード情
報テーブル1に記憶されるキーワード分類情報は、各キ
ーワードを特徴づける情報であり、キーワードの総文字
数、文字の種類、例えば人文字、小文字、数字、特殊文
字、漢字、仮名文字等またはキーワード中の共通文字例
、例えばキーワードの先頭の文字が「Δ」で始まる共通
文字列等の情報である。これは通常データベースではあ
る程度似た性質のキーワードを用いていることが多く、
検索テーブルを作成する時に容易にこのような情報を抽
出することができる。
キーワード情報テーブル1に記憶されたキーワード分類
情報に各々に対応して検索テーブル38〜3nがそれぞ
れ設けられている。J−なわち、検索テーブル3aは、
キーワード情報テーブル1の最初に記憶されているキー
ワード分類情報によって分類された各キーワードが記憶
され、この各キーワードに対応するデータのアドレスを
示すポインタが各キーワードに対応して右側に示されて
いる。また、検索テーブル3bは、キーワード情報テー
ブル1の二番目に記憶されているキーワード分類情報に
よって分類された各キーワードおよび対応するポインタ
が記憶され、以下同様にして検索テーブル3nは、キー
ワード情報テーブル1の第n番目に記憶されているキー
ワード分類情報によって分類された各キーワードおよび
対応するポインタが記憶されている。
また、各検索テーブル3a〜3nに記憶されているポイ
ンタはそれぞれデータテーブル5に記憶されている各デ
ータのアドレスを示しており、このアドレスのデータを
読み出すことにより検索したキーワードに対するデータ
を得ることができるのである。
第2図は第1図に示す各テーブルを使用した検索動作を
示すフローチャートである。同図において、まず、入力
されたキーワードに対してキーワード情報テーブル1の
最初のキーワード分類情報を抽出しくステップ110)
、この最初のキーワード分類情報に対応して検索テーブ
ルの番号を1としくステップ120) 、キーワード分
類情報が一致するかどうか調べる(ステップ130〉。
致しない場合には、次のキーワード分類情報をキーワー
ド情報デープル1から抽出するとともに、検索テーブル
の番号をインクリメントしくステップ140.150>
、キーワード分類情報が一致するかどうか調べるという
動作を繰り返し行う(ステップ160)。
一致するキーワード分類情報があった場合には、この一
致したキーワード分類情報に対応する検索テーブルを選
択しくステップ180)、該検索テーブルの最初のキー
ワードのポインタで示ずデータの番号を1としくステッ
プ190)、該検索デープルの最初のキーワードが入力
キーワードと致するかどうか調べる(ステップ200)
。キーワードが一致しない場合には、データの番号をイ
ンクリメントしくステップ210,220)、検索テー
ブルの次のキーワードと入力キーワードとが一致するか
どうか調べるという動作を繰り返し行う(ステップ23
0)。キーワードが一致する場合には、そのキーワード
に対応するポインタのデータ、すなわちステップ190
または220で示すデータ番号のデータが該入力キーワ
ードに対するデータとして出力されるのである。
以上説明したように、キーワード分類情報に従って検索
テーブルを分けて複数設け、入力キーワードに対応する
キーワード分類情報の検索テーブルのみを検索すること
によりキーワードによる検索時間を大幅に短縮すること
ができるのである。
具体的には、総キーワード数をNとし、選択された検索
テーブルのキーワード数をMとすると、検索時間はM/
Nに低減されることになる。
第3図は本発明の他の実施例の構成を示すブロック図で
ある。同図は、−例としてOCRを使用したデータベー
ス検索、特に書状上に記載されたデータを読み取り、住
所データベースを検索して書状をソートするシステムを
示しているものである。同図において、書状搬送路11
に沿って搬送される書状21は光学系13によって読み
取られ、A/D変換された後、画像パターン信号として
文字認識部15に供給される。文字認識部15は、例え
ば複合類似度法等により文字を認識して、例えばASC
IIコードとしてその他の住所情報、例えば文字の位置
情報等とともに、データベース検索部17に供給される
。データベース検索部17は、供給された文字]−ドと
文字位置情報を用いて書状21のデータの単語データを
生成し、この単語データをキーワードとして住所データ
ベース23を検索する。そして、住所データベース23
を検索することにより書状21に記載された住所を読み
取り、例えば郵便番号に相当する住所コードを生成する
。この住所コードは搬送制御部19に供給される。搬送
制御部19はこの住所コードに対応するスタッカー制御
信号をスタッカ一部25に供給し、書状21を所定のス
タッカーに格納する。
前記書状21は、第4図に示すように、−例として米国
の書状を示しており、図示のように宛名31、宛先住所
のハウス番号33、ストリート名35、都市名37、州
名39、ZIP41が示されているが、前記データベー
ス検索部17はZ■P41、州名39、都市名37、ス
トリート名35、ハウス番号33の順に住所データベー
ス23を検索して対応する住所コードを生成する。
書状21には、例えば州名39として、正式名でrNY
Jと記載されているが、これは、フルスペルでは「Ne
w  ’y’ork Jと記載されたり、またはrN 
 YJと間隔をあけて記載されたり、いくつかの変形が
ある。従って、州名の検索では、「ニューヨーク州」に
対しては、次に示す複数のキーワードが必要となる。
■NY ■N0V−York ■NY   (注意−はスペースを示す)ここで、■に
示す標準名のキーワードは金側について2文字であり、
■の省略形では1文字の組合せであり、■のフルスペル
では3文字以上の単語の組合せからなっていることがわ
かる。従って、上述したように、キーワードとしてrN
YJが入力された場合には、その文字数から■の標準型
の州名テーブルのみを検索すればよいことになる。
第5F!!iはこのような構造のキーワード情報テーブ
ル50、検索テーブル51.52.53および都市名リ
ストポインタのデータテーブル55を示している。キー
ワード情報テーブル50はキーワード分類情報として2
文字、3文字以上、1文字を設け、これらの各キーワー
ド分類情報に対してそれぞれ標準州名検索テーブル57
、フルスペル州名検索テーブル52、省略形州名検索テ
ーブル53を設けられている。
従って、上述したように、書状21にrNYJの2文字
が記載されている場合には、rNYJの文字を読み取る
と、2文字であることがわかるので、キーワード情報テ
ーブル50をひいて、標準州名検索テーブル51を選択
する。それから、この検索テーブルをキーワードで検索
し、都市テーブルのポインタを得るものである。このよ
うに構成することによりフルスペルや省略形のテーブル
を検索する必要がないので、高速な検索を行うことがで
きる。
なお、上記実施例では、OCRによる住所検索について
説明しているが、本発明はこれに限定されるものでなく
、一般のデータベースの検索にも適用できるものである
[発明の効果〕 以上説明したように、本発明によれば、複数のキーワー
ドをキーワード分類情報毎に分類して記憶するとともに
、入力されたキーワードに対応するキーワード分類情報
を決定し、この決定されたキーワード分類情報に対応し
て記憶されているキーワードの中から一致するキーワー
ドを検索しているので、すべてのキーワードを検索する
必要がなく、決定されたキーワード分類情報に対応して
記憶されているキーワードのみ検索すればよいため、検
索時間を大幅に短縮し、高速化、効率化を達成すること
ができる。
【図面の簡単な説明】
第1図は本発明の一実施例に係わるデータ検索装置に使
用される検索テーブルの構成を示す説明図、第2図は第
1図の検索テーブルによる検索動作を示すフローチャー
ト、第3図は本発明の他の実施例の構成を示すブロック
図、第4図は第3図の実施例に使用される書状を示す図
、第5図は第3図の実施例に使用される検索デープルの
構成を示す説明図である。 1・・・キーワード情報テーブル 38〜3n・・・検索テーブル 5・・・データテーブル 15・・・文字認識部 17・・・データベース検索部 21・・・書状 23・・・住所データベース 唄人弁理士三好保男 今−ワドへ71!1チー7゛ル 第1 図 第2 図 (b) 第2図 (a) キーワードb7報チー7゛ル 寥53

Claims (1)

    【特許請求の範囲】
  1. 各々複数のキーワードを有する複数のデータの中から入
    力された所望のキーワードに対応するデータを検索する
    データ検索装置であつて、前記複数のキーワードをキー
    ワードの特性によつて定められるキーワード分類情報毎
    に分類し、この分類されたキーワードを該キーワードに
    対するデータとの関連をもってキーワード分類情報毎に
    記憶するキーワード分類記憶手段と、前記入力されたキ
    ーワードに対応するキーワード分類情報を決定するキー
    ワード分類情報決定手段と、該キーワード分類情報決定
    手段で決定されたキーワード分類情報に対応して前記記
    憶手段に記憶されているキーワードの中から前記入力さ
    れたキーワードに一致するキーワードを検索し、この検
    索したキーワードに対するデータを出力する検索手段と
    を有することを特徴とするデータ検索装置。
JP63300746A 1988-11-30 1988-11-30 Ocrによる住所データベース検索装置 Expired - Fee Related JP2588261B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63300746A JP2588261B2 (ja) 1988-11-30 1988-11-30 Ocrによる住所データベース検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63300746A JP2588261B2 (ja) 1988-11-30 1988-11-30 Ocrによる住所データベース検索装置

Publications (2)

Publication Number Publication Date
JPH02148174A true JPH02148174A (ja) 1990-06-07
JP2588261B2 JP2588261B2 (ja) 1997-03-05

Family

ID=17888605

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63300746A Expired - Fee Related JP2588261B2 (ja) 1988-11-30 1988-11-30 Ocrによる住所データベース検索装置

Country Status (1)

Country Link
JP (1) JP2588261B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0493899U (ja) * 1991-01-08 1992-08-14
US6515998B1 (en) 1998-12-04 2003-02-04 Nec Corporation Table data retrieving apparatus retrieving table in which reference data is stored by using retrieval key

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2801602B2 (ja) 1988-06-30 1998-09-21 株式会社東芝 単語認識装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61267885A (ja) * 1984-11-21 1986-11-27 Nec Corp 単語辞書照合装置
JPS61267828A (ja) * 1985-05-23 1986-11-27 Matsushita Electric Ind Co Ltd 情報登録検索装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61267885A (ja) * 1984-11-21 1986-11-27 Nec Corp 単語辞書照合装置
JPS61267828A (ja) * 1985-05-23 1986-11-27 Matsushita Electric Ind Co Ltd 情報登録検索装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0493899U (ja) * 1991-01-08 1992-08-14
US6515998B1 (en) 1998-12-04 2003-02-04 Nec Corporation Table data retrieving apparatus retrieving table in which reference data is stored by using retrieval key

Also Published As

Publication number Publication date
JP2588261B2 (ja) 1997-03-05

Similar Documents

Publication Publication Date Title
US5745745A (en) Text search method and apparatus for structured documents
US5832480A (en) Using canonical forms to develop a dictionary of names in a text
US4775956A (en) Method and system for information storing and retrieval using word stems and derivative pattern codes representing familes of affixes
ES2214535T3 (es) Procedimiento y sistema portatil de indexacion de documentos utilizando la descomposicion de palabras en n-grams.
US7062499B2 (en) Enhanced multiway radix tree and related methods
JPH06162098A (ja) 類義語生成処理方法
EP0775963B1 (en) Indexing a database by finite-state transducer
JP2669601B2 (ja) 情報検索方法及びシステム
JP3258063B2 (ja) データベース検索システム及び方法
JPH0782504B2 (ja) 情報検索処理方式および検索ファイル作成装置
JP2693914B2 (ja) 検索システム
JPH02148174A (ja) Ocrによる住所データベース検索装置
JPH06325092A (ja) 顧客情報検索方式
EP1076305A1 (en) A phonetic method of retrieving and presenting electronic information from large information sources, an apparatus for performing the method, a computer-readable medium, and a computer program element
JP3259781B2 (ja) データベース検索システムおよびデータベース検索方法
JPH07296005A (ja) 日本語テキスト登録・検索装置
JP2550022B2 (ja) 文書情報検索方式
JPH09114856A (ja) 検索用索引生成装置
JPH07319890A (ja) 文書登録検索システム
JPH0635971A (ja) 文書検索装置
JPH06309360A (ja) 否定論理条件の処理に適したフルテキストサーチ方法
EP0649106A1 (en) Compactly stored word groups
JPH05258100A (ja) 文字認識装置
JPH05181719A (ja) 可変長データの格納および参照システム
JP2773657B2 (ja) 文字列検索装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees