JP2886308B2 - Data registration apparatus and method and data search apparatus and method - Google Patents

Data registration apparatus and method and data search apparatus and method

Info

Publication number
JP2886308B2
JP2886308B2 JP2249824A JP24982490A JP2886308B2 JP 2886308 B2 JP2886308 B2 JP 2886308B2 JP 2249824 A JP2249824 A JP 2249824A JP 24982490 A JP24982490 A JP 24982490A JP 2886308 B2 JP2886308 B2 JP 2886308B2
Authority
JP
Japan
Prior art keywords
keyword
registered
data
search
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2249824A
Other languages
Japanese (ja)
Other versions
JPH04127371A (en
Inventor
詔 今郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2249824A priority Critical patent/JP2886308B2/en
Publication of JPH04127371A publication Critical patent/JPH04127371A/en
Application granted granted Critical
Publication of JP2886308B2 publication Critical patent/JP2886308B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、フリーキーワード方式のデータ登録検索装
置のデータ登録装置及び方法とデータ検索装置及び方法
に関するものである。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a data registration device and method and a data retrieval device and method of a free keyword type data registration and retrieval device.

従来の技術 現在、多量のデータを高速に検索して出力する装置と
してデータ登録検索装置が存する。このデータ登録検索
装置とは、予めデータ登録装置により各々登録キーワー
ドが付与されてデータベース内に記録された多数の登録
データをデータ検索装置に入力する検索条件内の検索キ
ーワードとのマッチングで検索するようにしたものであ
り、キーワードの利用形態から利用可能なキーワードを
予め限定する統制キーワード方式と限定しないフリーキ
ーワード方式とに分類される。
2. Description of the Related Art At present, there is a data registration and search device as a device for searching and outputting a large amount of data at high speed. The data registration and retrieval device is configured to search a large number of registered data, each of which is provided with a registration keyword by the data registration device in advance and recorded in the database, by matching with a search keyword in a search condition to be input to the data retrieval device. The keyword is classified into a controlled keyword system in which the available keywords are limited in advance based on the usage form of the keyword, and a free keyword system in which the keywords are not limited.

上記二方式は何れも長所と短所とを有するが、フリー
キーワード方式には登録キーワードと検索キーワードと
のマッチングに課題がある。例えば、登録キーワードが
「カラー液晶テレビ」で検索キーワードが「液晶テレ
ビ」であるとすると、これらのキーワードは単純にはマ
ッチングしない。そして、このような課題の解決を目的
とした提案としては、「情報管理vol.32 No4 July 1989
“新聞記事データベースにおけるキーワード自動抽
出”」に開示されたものがある。
Although the above two methods have both advantages and disadvantages, the free keyword method has a problem in matching registered keywords with search keywords. For example, if the registered keyword is “color liquid crystal television” and the search keyword is “liquid crystal television”, these keywords do not simply match. As a proposal for solving such a problem, “Information management vol.32 No4 July 1989
“Automatic keyword extraction in newspaper article database”.

そこで、上記文献に開示された方法を従来例として以
下に説明する。まず、一つの登録キーワードを単語毎に
分割して複数の登録単純キーワードを生成し、これらの
登録単純キーワードを適宜組合わせて複数の登録キーワ
ードを新たに生成する。例えば、ある登録キーワードが
A・B・C・Dの四つの単語で形成さているとすると、
新たに生成する登録キーワードは、 「ABCD」,「ABC」,「BCD」,「AB」,「BC」,「C
D」,「A」,「B」,「C」,「D」 の十語とする。例えば、三つの単語からなる「カラー液
晶テレビ」からは、「カラー液晶テレビ」,「カラー液
晶」,「液晶テレビ」,「カラー」,「液晶」,「テレ
ビ」の六語が生成される。このようにすることで、登録
キーワードが「カラー液晶テレビ」で検索キーワードが
「液晶テレビ」の場合でもキーワードがマッチングする
ことになる。
Therefore, the method disclosed in the above document will be described below as a conventional example. First, one registered keyword is divided for each word to generate a plurality of registered simple keywords, and these registered simple keywords are appropriately combined to newly generate a plurality of registered keywords. For example, if a registered keyword is formed by four words, A, B, C, and D,
The newly generated registered keywords are "ABCD", "ABC", "BCD", "AB", "BC", "C
D ”,“ A ”,“ B ”,“ C ”,“ D ”. For example, from a "color liquid crystal television" composed of three words, six words of "color liquid crystal television", "color liquid crystal", "liquid crystal television", "color", "liquid crystal", and "television" are generated. By doing so, even when the registered keyword is “color liquid crystal television” and the search keyword is “liquid crystal television”, the keywords are matched.

発明が解決しようとする課題 上述のようにすることで、キーワードのマッチングの
範囲を拡大することができるが、それもで検索キーワー
ドとして「カラーテレビ」を入力するとマッチングが実
現されない。
Problems to be Solved by the Invention As described above, the range of keyword matching can be expanded. However, if "color television" is input as a search keyword, matching cannot be realized.

このようなことは、登録キーワードを分割した単語の
全ての組合わせを登録キーワードとすることで防止でき
る。この場合、n個の単語からなる登録キーワードから
新たに生成される登録キーワードの個数は、 2n−1 となり、前述したようなA・B・C・Dの四つの単語か
らなる登録キーワードから新たに生成する登録キーワー
ドの個数は、「ABCD」,「ABC」,「ABD」,「ACD」,
「BCD」,「AB」,「AC」,「AD」,「BC」,「BD」,
「CD」,「A」,「B」,「C」,「D」の十五語とな
る。つまり、この方法では、実際に装置に記録する登録
キーワードの個数が過大になるので、大容量の記録装置
が必要になると共に検索作業に時間を要することになっ
て実際的でない。
This can be prevented by using all combinations of words obtained by dividing the registered keyword as registered keywords. In this case, the number of registered keywords newly generated from the registered keywords composed of n words is 2 n −1, and the number of registered keywords newly generated from the four registered words A, B, C, and D is as described above. , The number of registered keywords generated is "ABCD", "ABC", "ABD", "ACD",
"BCD", "AB", "AC", "AD", "BC", "BD",
It is 15 words of "CD", "A", "B", "C", and "D". In other words, in this method, the number of registered keywords actually recorded in the apparatus becomes excessively large, so that a large-capacity recording apparatus is required and a search operation takes time, which is not practical.

課題を解決するための手段 請求項1記載の発明は、予めデータ登録装置により各
々登録キーワードが付与されてデータベース内に記録さ
れた多数の登録データをデータ検索装置に入力される検
索条件内の検索キーワードとのマッチングで検索するデ
ータ登録検索装置において、登録キーワードを単語に分
割して登録単純キーワードを生成するキーワード分割手
段を設け、このキーワード分割手段で分割された登録単
純キーワードの各々に対応する登録データのインデック
スを付与して記録する単純キーワード転置テーブルを設
け、登録キーワードと登録単純キーワードとの対応関係
を記録するキーワード構成テーブルを設けた。
Means for Solving the Problems According to the invention described in claim 1, a large number of registered data, each of which is given a registration keyword in advance by a data registration device and recorded in a database, is searched in a search condition input to the data search device. In a data registration and retrieval apparatus for searching by matching with a keyword, a keyword dividing unit for dividing a registered keyword into words to generate a registered simple keyword is provided, and a registration corresponding to each of the registered simple keywords divided by the keyword dividing unit is provided. There is provided a simple keyword transposition table for recording data with an index, and a keyword configuration table for recording the correspondence between registered keywords and registered simple keywords.

請求項2記載の発明は、予めデータ登録装置により各
々登録キーワードが付与されてデータベース内に記録さ
れた多数の登録データをデータ検索装置に入力される検
索条件内の検索キーワードとのマッチングで検索するデ
ータ登録検索装置において、前記検索キーワードを単語
に分割して検索単純キーワードを生成するキーワード分
割手段を設け、このキーワード分割手段で分割された前
記検索単純キーワードでデータ登録装置の登録単純キー
ワードの各々に対応する登録データのインデックスを付
与して記録した単純キーワード転置テーブルを検索して
一致する登録単純キーワードの登録データのインデック
スを検出するデータ検出手段を設け、このデータ検出手
段で検出された登録データの登録単純キーワードと登録
キーワードとの対応関係を前記データ登録装置の前記登
録キーワードと前記登録単純キーワードとの対応関係を
記録したキワード構成テーブルから読出して一つの検索
キーワードから生成された前記検索単純キーワードの全
てが一つの前記登録キーワードから生成された前記登録
単純キーワードの一つに一致する登録データを選出する
データ選別手段を設けた。
According to a second aspect of the present invention, a large number of registered data, each of which has been given a registration keyword in advance by a data registration device and recorded in a database, is searched by matching with a search keyword in a search condition input to the data search device. In the data registration and search device, a keyword dividing unit is provided for dividing the search keyword into words to generate a search simple keyword, and the search simple keywords divided by the keyword division unit are used for each of the registered simple keywords of the data registration device. A data detecting means is provided for searching the simple keyword transposition table recorded with the index of the corresponding registered data and detecting the index of the registered data of the registered simple keyword that matches, and for the registered data detected by the data detecting means. Correspondence between registered simple keywords and registered keywords All of the search simple keywords generated from one search keyword are read out from a keyword configuration table that records the correspondence between the registered keywords and the registered simple keywords of the data registration device, and all of the search simple keywords are generated from one registered keyword. Data selection means for selecting registered data that matches one of the registered simple keywords.

請求項3記載の発明は、予めデータ登録装置により各
々登録キーワードが付与されてデータベース内に記録さ
れた多数の登録データをデータ検索装置に入力される検
索条件内の検索キーワードとのマッチングで検索するデ
ータ登録検索装置において、登録キーワードをキーワー
ド分割手段が単語に分割して登録単純キーワードを生成
し、この登録単純キーワードの各々に対応する登録デー
タのインデックスを付与して単純キーワード転置テーブ
ルに記録し、登録キーワードと登録単純キーワードとの
対応関係をキーワード構成テーブルに記録するようにし
た。
According to a third aspect of the present invention, a large number of registered data, each of which has been given a registration keyword in advance by a data registration device and recorded in a database, is searched for by matching with a search keyword in a search condition input to the data search device. In the data registration search device, the keyword dividing unit divides the registered keyword into words to generate a registered simple keyword, assigns an index of registered data corresponding to each of the registered simple keywords, and records the index in the simple keyword transposition table. The correspondence between the registered keywords and the registered simple keywords is recorded in the keyword configuration table.

請求項4記載の発明は、予めデータ登録装置により各
々登録キーワードが付与されてデータべース内に記録さ
れた多数の登録データをデータ検索装置に入力される検
索条件内の検索キーワードとのマッチングで検索するデ
ータ登録検索装置において、前記検索キーワードをキー
ワード分割手段が単語に分割して検索単純キーワードを
生成し、この検索単純キーワードでデータ登録装置の登
録単純キーワードの各々に対応する登録データのインデ
ックスを付与して記録した単純キーワード転置テーブル
をデータ検出手段が検索して一致する登録単純キーワー
ドの登録データのインデックスを検出し、この検出され
た登録データの登録単純キーワードと登録キーワードと
の対応関係を前記データ登録装置の前記登録キーワード
と前記登録単純キーワードとの対応関係を記録したキー
ワード構成テーブルから読出して一つの検索キーワード
から生成さた前記検索単純キーワードの全てが一つの前
記登録キーワードから生成された前記登録単純キーワー
ドの一つに一致する登録データをデータ選別手段が選出
するようにした。
According to a fourth aspect of the present invention, a large number of registered data, each of which is provided with a registration keyword in advance by a data registration device and recorded in a database, is matched with a search keyword in a search condition input to the data search device. In the data registration and search apparatus, the search keyword is divided into words by the keyword dividing means to generate a search simple keyword, and an index of registered data corresponding to each of the registered simple keywords of the data registration apparatus with the search simple keyword. The data detecting means searches the simple keyword transposition table recorded by adding the registered keyword to detect the index of the registered data of the registered simple keyword that matches, and determines the correspondence between the registered simple keyword and the registered keyword of the detected registered data. The registration keyword and the registration simple key of the data registration device The registration in which all of the search simple keywords generated from one search keyword read out from the keyword configuration table recording the correspondence relationship with the keywords match one of the registered simple keywords generated from one registration keyword The data is selected by the data selection means.

請求項5記載の発明は、登録キーワードと登録単純キ
ーワードとの対応関係と共に登録キーワード内での登録
単純キーワードの順位を記録するキーワード構成テーブ
ルを設けた。
The invention according to claim 5 is provided with a keyword configuration table for recording the correspondence between the registered keywords and the registered simple keywords and the order of the registered simple keywords in the registered keywords.

請求項6記載の発明は、キーワード構成テーブルの記
録内容に従ってデータ選別手段で選出された登録データ
の登録キーワード内での複数の登録単純キーワードの前
後関係と検索キーワード内での複数の検索単純キーワー
ドの前後関係との整合を判定して登録データを選出する
第二のデータ選別手段を設けた。
According to a sixth aspect of the present invention, the context of a plurality of registered simple keywords in the registered keywords of the registered data selected by the data selecting means in accordance with the recorded contents of the keyword configuration table and the plurality of searched simple keywords in the search keyword are determined. A second data selection unit is provided for determining registration with the context and selecting registered data.

請求項7記載の発明は、キーワード構成テーブルに登
録キーワードと登録単純キーワードとの対応関係と共に
登録キーワード内での登録単純キーワードの順位を記録
するようにした。
According to the seventh aspect of the invention, the ranking of the registered simple keywords in the registered keywords is recorded in the keyword configuration table together with the correspondence between the registered keywords and the registered simple keywords.

請求項8記載の発明は、キーワード構成テーブルの記
録内容に従ってデータ選別手段で選出された登録データ
の登録キーワード内での複数の登録単純キーワードの前
後関係と検索キーワード内での複数の検索単純キーワー
ドの前後関係との整合を第二のデータ選別手段が判定し
て登録データを選出するようにした。
According to an eighth aspect of the present invention, the context of a plurality of registered simple keywords in the registered keywords of the registered data selected by the data selecting means in accordance with the recorded contents of the keyword configuration table and the plurality of searched simple keywords in the search keyword are determined. The second data selection unit determines the matching with the context and selects the registered data.

作用 請求項1,2,3及び4記載の発明は、検索キーワードと
登録キーワードを各々単純キーワードに分割してマッチ
ングを実行するので登録データの検索範囲を拡大するこ
とができ、しかも、登録単純キーワードの全ての組合わ
せを記録しておくようなことは要しないので、大容量の
記録装置が必要になったり検索作業の動作時間が長くな
るようなことが防止される。
According to the inventions described in claims 1, 2, 3, and 4, the search keyword and the registered keyword are each divided into simple keywords and matching is performed, so that the search range of the registered data can be expanded. Since it is not necessary to record all combinations of the above, it is possible to prevent the need for a large-capacity recording device and the prolonged operation time of the search operation.

請求項5,6,7及び8記載の発明は、単純キーワードの
順番が異なることで検索キーワードとの内容の整合性が
低い登録キーワードは排除されるので、検索キーワード
と極めて整合性が高い登録キーワードが付与された登録
データのみが検出される。
According to the inventions described in claims 5, 6, 7 and 8, since the order of the simple keywords is different, the registered keywords whose contents are not consistent with the search keywords are excluded, so that the registered keywords having extremely high consistency with the search keywords are excluded. Only the registration data to which is added is detected.

実施例 本発明の実施例を図面に基づいて説明する。まず、本
実施例のデータ登録検索装置1は、第2図に例示するよ
うに、データ登録位置2とデータ検出装置3との各々が
キーワード分割手段4と単純キーワード転置テーブル5
及びキーワード構成テーブル6に接続された構造となっ
ている。ここで、データ登録装置2は、画像情報や文書
情報などの登録データが登録キーワードと共に入力され
ると、これをデータベース(図示せず)に記録するよう
になっており、データ検索装置3は、検索キーワードや
論理演算子からなる検索条件が入力されると、この検索
条件の検索キーワードに従ってデータ検出手段やデータ
識別手段及び第二のデータ選別手段(いずれも図示せ
ず)等でデータベースに記録された登録データを検索し
て出力するようになっている。そこで、このような登録
データの登録や検索を実現するデータ登録検索装置1の
各部の機能を以下に説明する。
Embodiment An embodiment of the present invention will be described with reference to the drawings. First, as shown in FIG. 2, in the data registration and retrieval apparatus 1 of the present embodiment, each of the data registration position 2 and the data detection apparatus 3 includes the keyword dividing means 4 and the simple keyword transposition table 5.
And a keyword configuration table 6. Here, when registration data such as image information and document information is input together with a registration keyword, the data registration device 2 records this in a database (not shown). When a search condition including a search keyword and a logical operator is input, the data is recorded in a database by a data detection unit, a data identification unit, and a second data selection unit (none of which are shown) according to the search keyword of the search condition. The registered data is searched and output. Therefore, functions of each unit of the data registration and search device 1 that realizes such registration and search of registration data will be described below.

まず、キーワード分割手段4は、データ登録装置2や
データ検索装置3から入力される登録キーワードや検索
キーワードが複合語を単語辞書7の記録内容に従って単
語に分割することで登録単純キーワードや検索単純キー
ワードを生成する。ここで、第3図に例示するように、
単語辞書7は単語の表記と品詞とで形成されており、そ
の単語の品詞は名詞と接頭辞及び接尾辞からなってい
る。そして、キーワード分割手段4は、 .キーワードの先頭は名詞か接頭辞である。
First, the keyword dividing unit 4 divides a compound word into words according to the recorded contents of the word dictionary 7 so that the registered keyword or the search keyword input from the data registration device 2 or the data search device 3 Generate Here, as exemplified in FIG.
The word dictionary 7 is formed of word expressions and parts of speech, and the parts of speech of the words are composed of nouns, prefixes and suffixes. Then, the keyword dividing means 4 includes: Keywords start with a noun or prefix.

.キーワードの末尾は名詞か接尾辞である。. Keywords end with nouns or suffixes.

.接頭辞の直後に接尾辞は連続しない。. The suffix is not consecutive immediately after the prefix.

と云うような品詞間の関係に従ってキーワードを単語に
分割するようになっている。
The keyword is divided into words according to the relationship between the parts of speech.

なお、本実施例のデータ登録検索装置1のキーワード
分割手段4では、キーワードを数パターンに分割するこ
とができる場合は、分割される単語の全体数や名詞の個
数などが最小となるパターンを選択するようになってい
る。また、本実施例のデータ登録検索装置1では、取扱
う言語として日本語を対象として日本語の単語辞書7に
従ってキーワードを単語に分割するキーワード分割手段
4を例示したが、本発明は上記方式に限定されるもので
はなく、例えば、英語や独語等では複合語でも単語がス
ペースで分割されているので、単語辞書を要することな
くスペースを利用してキーワードを単語に分割するキー
ワード分割手段などが実施可能である。
In the case where the keyword can be divided into several patterns by the keyword dividing means 4 of the data registration and retrieval apparatus 1 of the present embodiment, a pattern which minimizes the total number of words to be divided and the number of nouns is selected. It is supposed to. Also, in the data registration and retrieval apparatus 1 of the present embodiment, the keyword division unit 4 that divides keywords into words according to the Japanese word dictionary 7 for Japanese as a language to be handled is exemplified, but the present invention is limited to the above method. For example, in English, German, etc., words are divided by spaces even in compound words, so it is possible to implement keyword division means that divides keywords into words using spaces without using a word dictionary It is.

つぎに、単純キーワード転置テーブル5は、第4図に
例示するように、上述のようにしてキーワード分割手段
4で登録キーワードから生成された登録単純キーワード
の表記と、これに対応する登録データのインデックスと
がデータ登録装置2により記録されている。ここで、こ
の単純キーワード転置テーブル5では、各登録単純キー
ワードが文字コードに従って配列されているので、これ
と検索単純キーワードとのマッチングをデータ検索装置
3のデータ検出手段が実行することで登録単純キーワー
ドを含む登録キーワードが付与された登録データのイン
デックスが高速に検出される。例えば、データ検索装置
3により検索単純キーワードとして「テレビ」が生成さ
れると、これを含む登録キーワードが付与された登録デ
ータ1,3が単純キーワード転置テーブル5から高速に検
出される。
Next, as illustrated in FIG. 4, the simple keyword transposition table 5 includes the notation of the registered simple keyword generated from the registered keyword by the keyword dividing unit 4 as described above, and the index of the registered data corresponding thereto. Are recorded by the data registration device 2. Here, in the simple keyword transposition table 5, since each registered simple keyword is arranged according to the character code, the matching of the registered simple keyword with the search simple keyword is performed by the data detecting means of the data search device 3 so that the registered simple keyword is registered. The index of the registered data to which the registered keyword including is added is detected at high speed. For example, when “television” is generated as a search simple keyword by the data search device 3, the registration data 1 and 3 to which the registration keyword including this is added are detected from the simple keyword transposition table 5 at high speed.

つぎに、キーワード構成テーブル6は、第5図に例示
するように、登録データのインデックス、これに対応す
る登録単純キーワードと登録キーワードとの表記、この
登録キーワード内での登録単純キーワードの順位がデー
タ登録装置2により記録されている。従って、このキー
ワード構成テーブル6の登録データのインデックスに従
って所定の登録単純キーワードを検出すると、この登録
単純キーワードと登録キーワードとの対応関係や登録キ
ーワード内での順位が判明する。例えば、前述のように
データ検索装置3により「テレビ」と云う登録単純キー
ワードが付与された登録データ1,3が検出された場合、
キーワード構成テーブル6からは登録単純キーワード
「テレビ」が登録データ1では登録キーワード「カラー
液晶テレビ」の三番目の単語で登録データ3では登録キ
ーワード「テレビ電話」の一番目の単語であることが検
出される。
Next, as illustrated in FIG. 5, the keyword configuration table 6 includes an index of registered data, a notation of a registered simple keyword and a registered keyword corresponding thereto, and a ranking of the registered simple keyword in the registered keyword. It is recorded by the registration device 2. Therefore, when a predetermined registered simple keyword is detected in accordance with the index of the registered data in the keyword configuration table 6, the correspondence between the registered simple keyword and the registered keyword and the rank in the registered keyword are determined. For example, as described above, when the data search device 3 detects the registered data 1 and 3 to which the registered simple keyword “TV” is added,
The keyword configuration table 6 detects that the registered simple keyword “TV” is the third word of the registered keyword “color LCD television” in the registered data 1 and the first word of the registered keyword “videophone” in the registered data 3 Is done.

そこで、上述のような機構4〜6に各種情報を記録す
るデータ登録装置2の動作を第1図(a)に例示するフ
ローチャートに基づいて以下に詳述する。まず、画像情
報や文書情報等の登録データと、これに対応した登録キ
ーワードとが入力される。この時、この登録キーワード
は登録データが文書情報や音声情報の場合は公知技術に
より自動抽出することもできるが、基本的には作業者が
作成するものである。なお、ここでは説明を簡明にする
ために入力する登録キーワードの個数を一つとした場合
を例示して説明する。そこで、入力された登録キーワー
ドは前述のようにキーワード分割手段4により単語辞書
7に従って単語に分割され、少なくとも一つの登録単語
キーワードが生成される。そこで、これらの登録単純キ
ーワードが文字コードに従って配列されて登録データの
インデックスと共に単純キーワード転置テーブル5に記
録され、さらに、各登録データのインデックス毎に分類
されて、登録単純キーワードと登録キーワードとの表
記、登録キーワード内での登録単純キーワードの順位が
キーワード構成テーブル6に記録される。
The operation of the data registration device 2 for recording various types of information in the mechanisms 4 to 6 described above will be described in detail below with reference to the flowchart illustrated in FIG. First, registration data such as image information and document information and a registration keyword corresponding thereto are input. At this time, when the registered data is document information or voice information, the registered keyword can be automatically extracted by a known technique, but is basically created by an operator. Here, for simplicity of explanation, a case where the number of registered keywords to be input is one will be described as an example. Thus, the input registered keyword is divided into words according to the word dictionary 7 by the keyword dividing means 4 as described above, and at least one registered word keyword is generated. Therefore, these registered simple keywords are arranged in accordance with the character code, recorded in the simple keyword transposition table 5 together with the index of the registered data, and further classified according to the index of each registered data, so that the notation of the registered simple keyword and the registered keyword is obtained. , The order of the registered simple keywords in the registered keywords is recorded in the keyword configuration table 6.

つぎに、上述のようにしてデータ登録装置2により記
録された登録データを検索するデータ検索装置3の動作
を第1図(b)に例示するフローチャートに基づいて以
下に詳述する。ここでは説明を簡明にするために入力す
る検索条件が一つの検索キーワードで形成されて論理演
算子等を内包しない場合を例示して説明する。例えば、
検索キーワードとして「カラーテレビ」と云う複合語が
入力されると、これがキーワード分割手段4により単語
辞書7に従って単語に分割され、検索単純キーワード
「カラー」と「テレビ」とが生成される。そこで、これ
らの検索単純キーワードが付与された登録データのイン
デックスが単純キーワード転置テーブル5から検出され
るので、第3図に例示するように、検索単純キーワード
「カラー」と「テレビ」とからは登録データ1が検出さ
れる。つぎに、検出された登録データ1のインデックス
に従ってキーワード構成テーブル6から登録単純キーワ
ードと登録キーワードとの対応関係を読出し、第5図に
例示するように、一つの検索キーワードから生成された
検索単純キーワードの全てが一つの登録キーワードから
生成された登録単純キーワードの一つに一致するかがデ
ータ選別手段により判定される。このようにすること
で、例えば、一つの検索キーワード「カラーテレビ」か
ら生成された単純キーワード「カラー」と「テレビ」と
が一つの登録キーワード「カラー液晶テレビ」から生成
されていることが検出され、検索キーワードと登録キー
ワードとの内容の整合性が確認される。そこで、請求項
2及び4記載の発明では、このように検索キーワードと
登録キーワードとの整合性が確認されると登録データ1
を検索結果として出力する。
Next, the operation of the data search device 3 for searching the registered data recorded by the data registration device 2 as described above will be described in detail below based on the flowchart illustrated in FIG. 1 (b). Here, for the sake of simplicity, an example in which a search condition to be input is formed by one search keyword and does not include a logical operator or the like will be described. For example,
When a compound word "color television" is inputted as a search keyword, the compound word is divided into words by the keyword dividing means 4 according to the word dictionary 7, and search simple keywords "color" and "television" are generated. Then, since the index of the registration data to which these search simple keywords are added is detected from the simple keyword transposition table 5, as shown in FIG. 3, the search simple keywords "color" and "television" are registered. Data 1 is detected. Next, the correspondence between the registered simple keywords and the registered keywords is read out from the keyword configuration table 6 in accordance with the detected index of the registered data 1, and as illustrated in FIG. 5, the search simple keywords generated from one search keyword are extracted. Are all matched with one of the registered simple keywords generated from one registered keyword by the data selection means. By doing so, for example, it is detected that the simple keywords “color” and “television” generated from one search keyword “color television” are generated from one registered keyword “color liquid crystal television”. The consistency between the contents of the search keyword and the registered keyword is confirmed. Therefore, according to the second and fourth aspects of the present invention, when the consistency between the search keyword and the registered keyword is confirmed as described above, the registered data 1
Is output as a search result.

ここで、例えば、一つの検索キーワード「宣伝番組」
から生成されえた単純キーワード「宣伝」と「番組」と
が一つの登録キーワード「番組宣伝」から生成されてい
ることが検出されても、これらの検索キーワードと登録
キーワードとは内容の整合性が低いことが自明である。
そこで、請求項6及び8記載の発明では、さらに検索キ
ーワードと登録キーワードとの整合性を第二のデータ選
別手段により確認するようになっている。つまり、上述
のようにしてデータ選別手段で選出された登録データに
対し、第二のデータ選別手段がキーワード構成テーブル
6から登録キーワード内での複数の登録単純キーワード
の前後関係を読出して検索キーワード内での複数の検索
単純キーワードの前後関係との整合を判定する。このよ
うにすることで、上述のように単純キーワードの順番が
異なることで検索キーワードとの内容の整合性が低い登
録キーワードは排除されるので、検索キーワードと極め
て整合性が高い登録キーワードが付与された登録データ
のみが検出されることになる。
Here, for example, one search keyword “promotional program”
Even if it is detected that the simple keywords “promotion” and “program” generated from the same keyword are generated from one registered keyword “program promotion”, the consistency between these search keywords and the registered keywords is low. It is self-evident.
Therefore, in the inventions according to claims 6 and 8, the consistency between the search keyword and the registered keyword is further confirmed by the second data selection means. In other words, for the registered data selected by the data selection means as described above, the second data selection means reads the context of a plurality of registered simple keywords in the registered keywords from the keyword configuration table 6 and retrieves the Of the plurality of search simple keywords is determined. By doing so, since the registered keywords whose contents are inconsistent with the search keyword are excluded because the order of the simple keywords is different as described above, a registered keyword having extremely high consistency with the search keyword is assigned. Only registered data that has been detected will be detected.

なお、本実施例のデータ登録検索装置1では、データ
登録装置2とデータ検索装置3とが一体的に形成された
ものを例示したが、本発明は上記構造に限定されるもの
ではなく、例えば、データ登録装置2とデータ検索装置
3とを別個に形成して通信網(図示せず)などを介して
通信するシステム(図示せず)なども実施可能である。
In the data registration and retrieval device 1 of the present embodiment, an example is shown in which the data registration device 2 and the data retrieval device 3 are integrally formed. However, the present invention is not limited to the above structure. It is also possible to implement a system (not shown) in which the data registration device 2 and the data search device 3 are separately formed and communicate via a communication network (not shown).

発明の効果 請求項1,2,3及び4記載の発明は、予めデータ登録装
置により各々登録キーワードが付与されてデータベース
内に記録された多数の登録データをデータ検索装置に入
力される検索条件内の検索キーワードとのマッチングで
検索するデータ登録検索装置において、登録キーワード
をキーワード分割手段が単語に分割して登録単純キーワ
ードを生成し、この登録単純キーワードの各々に対応す
る登録データのインデックスを付与して単純キーワード
転置テーブルに記録し、登録キーワードと登録単純キー
ワードとの対応関係をキーワード構成テーブルに記録
し、検索キーワードをキーワード分割手段が単語に分割
して検索単純キーワードを生成し、この検索単純キーワ
ードでデータ登録装置の単純キーワード転置テーブルを
データ検出手段が検索して一致する登録単純キーワード
の登録データのインデックスを検出し、この検出された
登録データの登録単純キーワードと登録キーワードとの
対応関係をデータ登録装置のキーワード構成テーブルか
ら読出して一つの検索キーワードから生成された検索単
純キーワードの全てが一つの登録キーワードから生成さ
れた登録単純キーワードの一つに一致する登録データを
データ選別手段が選出するようにしたことにより、検索
キーワードと登録キーワードとを各々単純キーワードに
分割してマッチングを実行するので登録データの検索範
囲を拡大することができ、しかも、登録単純キーワード
の全ての組合わせを記録しておくようなことは要しない
ので、大容量の記録装置が必要になったり検索作業の動
作時間が長くなるようなことが防止され、データ登録検
索装置の高性能化に寄与することができる等の効果を有
するものである。
According to the inventions described in claims 1, 2, 3 and 4, a large number of registered data, each of which is registered in advance in a database with a registration keyword given by a data registration device, is input to a data search device. In a data registration and retrieval apparatus that searches by matching with a search keyword, a registered keyword is divided into words to generate a registered simple keyword, and an index of registered data corresponding to each of the registered simple keywords is assigned. The keyword is recorded in the simple keyword transposition table, the correspondence between the registered keywords and the registered simple keywords is recorded in the keyword configuration table, and the search keyword is divided into words by the keyword dividing means to generate the search simple keywords. The simple keyword transposition table of the data registration device Finds the index of the registered data of the registered simple keyword that matches, reads the correspondence between the registered simple keyword of the detected registered data and the registered keyword from the keyword configuration table of the data registration device, and retrieves one search keyword. The data selection means selects the registration data in which all of the search simple keywords generated from the search keyword match one of the registered simple keywords generated from one registered keyword. Since the matching is performed by dividing into simple keywords, the search range of the registered data can be expanded. Further, since it is not necessary to record all combinations of the registered simple keywords, a large amount of recording is possible. It may be necessary to use a device or the operation time of the search may become longer. Sealed, and has the effect of such can contribute to higher performance of the data registration and retrieval device.

請求項5,6,7及び8記載の発明は、キーワード構成テ
ーブルに登録キーワードと登録単純キーワードとの対応
関係と共に登録キーワード内での登録単純キーワードの
順位を記録し、キーワード構成テーブルの記録内容に従
ってデータ選別手段で選出された登録データの登録キー
ワード内での複数の登録単純キーワードの前後関係と検
索キーワード内での複数の検索単純キーワードの前後関
係との整合を第二のデータ選別手段が判定して登録デー
タを選出するようにしたことにより、単純キーワードの
順番が異なることで検索キーワードとの内容の整合性が
低い登録キーワードは排除されるので、検索キーワード
と極めて整合性が高い登録キーワードが付与された登録
データのみが検出されることになり、データ登録検索装
置の高性能化に寄与することができる等の効果を有する
ものである。
The invention according to claims 5, 6, 7 and 8 records the order of the registered simple keywords in the registered keywords together with the correspondence between the registered keywords and the registered simple keywords in the keyword configuration table, and according to the recorded contents of the keyword configuration table. The second data selection means determines a match between the context of the plurality of registered simple keywords in the registered keywords of the registered data selected by the data selection means and the context of the plurality of search simple keywords in the search keyword. By selecting the registered data, the registered keywords whose contents are inconsistent with the search keywords due to the difference in the order of the simple keywords are excluded. Only registered data that has been registered will be detected, contributing to higher performance of the data registration and retrieval device. It is intended to have an effect, such as it is.

【図面の簡単な説明】[Brief description of the drawings]

図面は本発明の実施例を示すものであり、第1図はフロ
ーチャート、第2図はブロック図、第3図は単語辞書の
内部構造の概念説明図、第4図は単純キーワード転置テ
ーブルの内部構造の概念説明図、第5図はキーワード構
成テーブルの内部構造の概念説明図である。 1…データ登録検索装置、2…データ登録装置、3…デ
ータ検索装置、4…キーワード分割手段、5…単純キー
ワード転置テーブル、6…キーワード構成テーブル
The drawings show an embodiment of the present invention. FIG. 1 is a flowchart, FIG. 2 is a block diagram, FIG. 3 is a conceptual explanatory diagram of the internal structure of a word dictionary, and FIG. FIG. 5 is a conceptual explanatory diagram of the structure, and FIG. 5 is a conceptual explanatory diagram of the internal structure of the keyword configuration table. DESCRIPTION OF SYMBOLS 1 ... Data registration / search apparatus, 2 ... Data registration apparatus, 3 ... Data search apparatus, 4 ... Keyword division means, 5 ... Simple keyword transposition table, 6 ... Keyword structure table

Claims (8)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】予めデータ登録装置により各々登録キーワ
ードが付与されてデータベース内に記録された多数の登
録データをデータ検索装置に入力される検索条件内の検
索キーワードとのマッチングで検索するデータ登録検索
装置において、前記登録キーワードを単語に分割して登
録単純キーワードを生成するキーワード分割手段を設
け、このキーワード分割手段で分割された前記登録単純
キーワードの各々に対応する登録データのインデックス
を付与して記録する単純キーワード転置テーブルを設
け、前記登録キーワードと前記登録単純キーワードとの
対応関係を記録するキーワード構成テーブルを設けたこ
とを特徴とするデータ登録装置。
1. A data registration search for searching a large number of registered data, each of which has been given a registration keyword in advance by a data registration device and recorded in a database, by matching with a search keyword in a search condition input to the data search device. In the apparatus, a keyword dividing means for dividing the registered keyword into words to generate a registered simple keyword is provided, and an index of registered data corresponding to each of the registered simple keywords divided by the keyword dividing means is added and recorded. A data registration apparatus, comprising: a simple keyword transposition table, and a keyword configuration table for recording the correspondence between the registered keywords and the registered simple keywords.
【請求項2】予めデータ登録装置により各々登録キーワ
ードが付与されてデータベース内に記録された多数の登
録データをデータ検索装置に入力される検索条件内の検
索キーワードとのマッチングで検索するデータ登録検索
装置において、前記検索キーワードを単語に分割して検
索単純キーワードを生成するキーワード分割手段を設
け、このキーワード分割手段で分割された前記検索単純
キーワードでデータ登録装置の登録単純キーワードの各
々に対応する登録データのインデックスを付与して記録
した単純キーワード転置テーブルを検索して一致する登
録単純キーワードの登録データのインデックスを検出す
るデータ検出手段を設け、このデータ検出手段で検出さ
れた登録データの登録単純キーワードと登録キーワード
との対応関係を前記データ登録装置の前記登録キーワー
ドと前記登録単純キーワードとの対応関係を記録したキ
ーワード構成テーブルから読出して一つの検索キーワー
ドから生成された前記検索単純キーワードの全てが一つ
の前記登録キーワードから生成された前記登録単純キー
ワードの一つに一致する登録データを選出するデータ選
別手段を設けたことを特徴とするデータ検索装置。
2. A data registration and retrieval system in which a large number of registered data, each of which has been given a registration keyword in advance by a data registration device and recorded in a database, is searched by matching with a search keyword in a search condition input to the data search device. In the apparatus, a keyword dividing means for generating the search simple keyword by dividing the search keyword into words is provided, and the registration corresponding to each of the registered simple keywords of the data registration apparatus is performed by the search simple keyword divided by the keyword division means. Data indexing means is provided for searching a simple keyword transposition table recorded with data index added and detecting an index of registered data of a registered simple keyword that matches, and a registered simple keyword of registered data detected by the data detecting means is provided. And the correspondence between registered keywords All of the search simple keywords generated from one search keyword read out from the keyword configuration table recording the correspondence between the registered keywords and the registered simple keywords of the data registration device are generated from one registered keyword. A data search device comprising a data selection unit for selecting registered data that matches one of the registered simple keywords.
【請求項3】予めデータ登録装置により各々登録キーワ
ードが付与されてデータベース内に記録された多数の登
録データをデータ検索装置に入力される検索条件内の検
索キーワードとのマッチングで検索するデータ登録検索
装置において、前記登録キーワードをキーワード分割手
段が単語に分割して登録単純キーワードを生成し、この
登録単純キーワードの各々に対応する登録データのイン
デックスを付与して単純キーワード転置テーブルに記録
し、前記登録キーワードと前記登録単純キーワードとの
対応関係をキーワード構成テーブルに記録するようにし
たことを特徴とするデータ登録方法。
3. A data registration search in which a large number of registered data, each of which has been given a registration keyword in advance by a data registration device and recorded in a database, is searched by matching with a search keyword in a search condition input to the data search device. In the apparatus, a keyword dividing unit divides the registered keyword into words to generate a registered simple keyword, assigns an index of registration data corresponding to each of the registered simple keywords, records the index in a simple keyword transposition table, and records the registered simple keyword. A data registration method, wherein a correspondence between a keyword and the registered simple keyword is recorded in a keyword configuration table.
【請求項4】予めデータ登録装置により各々登録キーワ
ードが付与されてデータべース内に記録された多数の登
録データをデータ検索装置に入力される検索条件内の検
索キーワードとのマッチングで検索するデータ登録検索
装置において、前記検索キーワードをキーワード分割手
段が単語に分割して検索単純キーワードを生成し、この
検索単純キーワードでデータ登録装置の登録単純キーワ
ードの各々に対応する登録データのインデックスを付与
して記録した単純キーワード転置テーブルをデータ検出
手段が検索して一致する登録単純キーワードの登録デー
タのインデックスを検出し、この検出された登録データ
の登録単純キーワードと登録キーワードとの対応関係を
前記データ登録装置の前記登録キーワードと前記登録単
純キーワードとの対応関係を記録したキーワード構成テ
ーブルから読出して一つの検索キーワードから生成され
た前記検索単純キーワードの全てが一つの前記登録キー
ワードから生成された前記登録単純キーワードの一つに
一致する登録データをデータ選別手段が選出するように
したことを特徴とするデータ検索方法。
4. Searching a large number of registered data, each of which is provided with a registration keyword by a data registration device in advance and recorded in a database, by matching with a search keyword in a search condition input to the data search device. In the data registration and retrieval apparatus, the keyword dividing unit divides the search keyword into words to generate a search simple keyword, and assigns an index of registration data corresponding to each of the registered simple keywords of the data registration apparatus with the search simple keyword. The data detecting means searches the recorded simple keyword transposition table to detect an index of the registered data of the registered simple keyword that matches, and registers the correspondence between the detected registered simple keyword of the registered data and the registered keyword in the data registration. Between the registered keyword of the device and the registered simple keyword Data from the keyword configuration table in which the correspondence is recorded, and data selection is performed on registration data in which all of the search simple keywords generated from one search keyword match one of the registered simple keywords generated from one registration keyword. A data search method characterized in that a means is selected.
【請求項5】登録キーワードと登録単純キーワードとの
対応関係と共に前記登録キーワード内での前記登録単純
キーワードの順位を記録するキーワード構成テーブルを
設けたことを特徴とする請求項1記載のデータ登録装
置。
5. The data registration apparatus according to claim 1, further comprising a keyword configuration table for recording the correspondence between the registered keywords and the registered simple keywords and the order of the registered simple keywords in the registered keywords. .
【請求項6】キーワード構成テーブルの記録内容に従っ
てデータ選別手段で選別された登録データの登録キーワ
ード内での複数の登録単純キーワードの前後関係と前記
検索キーワード内での複数の検索単純キーワードの前後
関係との整合を判定して前記登録データを選出する第二
のデータ選別手段を設けたことを特徴とする請求項2記
載のデータ検索装置。
6. A context of a plurality of registered simple keywords in a registered keyword of registered data selected by data selecting means according to a recorded content of a keyword configuration table and a context of a plurality of searched simple keywords in the search keyword. 3. The data search apparatus according to claim 2, further comprising a second data selection unit that determines a match with the data and selects the registration data.
【請求項7】キーワード構成テーブルに登録キーワード
と登録単純キーワードとの対応関係と共に前記登録キー
ワード内での前記登録単純キーワードの順位を記録する
ようにしたことを特徴とする請求項3記載のデータ登録
方法。
7. The data registration according to claim 3, wherein the correspondence between the registered keywords and the registered simple keywords is recorded in the keyword configuration table together with the order of the registered simple keywords in the registered keywords. Method.
【請求項8】キーワード構成テーブルの記録内容に従っ
てデータ選別手段で選別された登録データの登録キーワ
ード内での複数の登録単純キーワードの前後関係と前記
検索キーワード内での複数の検索単純キーワードの前後
関係との整合を第二のデータ選別手段が判定して前記登
録データを選出するようにしたことを特徴とする請求項
4記載のデータ検索方法。
8. The context of a plurality of registered simple keywords in the registered keywords of the registered data selected by the data selecting means according to the recorded contents of the keyword configuration table, and the context of a plurality of searched simple keywords in the search keyword. 5. The data search method according to claim 4, wherein the second data selection unit determines the matching with the registered data and selects the registered data.
JP2249824A 1990-09-19 1990-09-19 Data registration apparatus and method and data search apparatus and method Expired - Fee Related JP2886308B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2249824A JP2886308B2 (en) 1990-09-19 1990-09-19 Data registration apparatus and method and data search apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2249824A JP2886308B2 (en) 1990-09-19 1990-09-19 Data registration apparatus and method and data search apparatus and method

Publications (2)

Publication Number Publication Date
JPH04127371A JPH04127371A (en) 1992-04-28
JP2886308B2 true JP2886308B2 (en) 1999-04-26

Family

ID=17198731

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2249824A Expired - Fee Related JP2886308B2 (en) 1990-09-19 1990-09-19 Data registration apparatus and method and data search apparatus and method

Country Status (1)

Country Link
JP (1) JP2886308B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3361563B2 (en) * 1993-04-13 2003-01-07 松下電器産業株式会社 Morphological analysis device and keyword extraction device
JP3196698B2 (en) * 1997-09-02 2001-08-06 株式会社デンソー Data search and display system
US6738952B1 (en) 1997-09-02 2004-05-18 Denso Corporation Navigational map data object selection and display system
KR100884889B1 (en) * 2007-03-26 2009-02-23 엔에이치엔(주) Method and system for adding automatic indexing word to search database

Also Published As

Publication number Publication date
JPH04127371A (en) 1992-04-28

Similar Documents

Publication Publication Date Title
JP2886308B2 (en) Data registration apparatus and method and data search apparatus and method
JP2872706B2 (en) Information retrieval device
JPH07234879A (en) Information processor and data base retrieving method
JPH10312395A (en) System and method for full-text retrieval and record medium where full-text retrieving program is recorded
JPS59105141A (en) Managing method of electronic document
JP2535629B2 (en) Input string normalization method of search system
JPH081642B2 (en) Keyword search method
JP2000322416A (en) Document retrieving device
JPH05151264A (en) Information retrieving device
JPH1125117A (en) Word retrieving device
JPH07120357B2 (en) Document retrieval device
JP3005531B1 (en) Dictionary data search method and apparatus, search dictionary and index creation method
JPH08249341A (en) Document storage and retrieval device for document data base
JP3279002B2 (en) Information management device
JPH05158984A (en) Device for extracting character string
JPH09269952A (en) Document retrieval device/method
JP2001134598A (en) Structuring method and retrieving method for t-tree index, structuring device and retrieving device for t- tree index, storage medium stored with t-tree index structuring program, and storage medium stored with t-tree index retrieving program
JPH041853A (en) Document retrieving device
JPS61281368A (en) Picture information retrieving device
JPH08180063A (en) Publication information management system
JPH07319891A (en) Document registration/retrieval system
JP2000315211A (en) Document management system and document managing method
JPH0756943A (en) Whole sentence data base system
JP2002197116A (en) Retrieval device
JPS59103173A (en) Supply system of picture information

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees