JPH04127371A - Device and method for registering data and device and method for retrieving data - Google Patents

Device and method for registering data and device and method for retrieving data

Info

Publication number
JPH04127371A
JPH04127371A JP2249824A JP24982490A JPH04127371A JP H04127371 A JPH04127371 A JP H04127371A JP 2249824 A JP2249824 A JP 2249824A JP 24982490 A JP24982490 A JP 24982490A JP H04127371 A JPH04127371 A JP H04127371A
Authority
JP
Japan
Prior art keywords
registered
keyword
data
keywords
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2249824A
Other languages
Japanese (ja)
Other versions
JP2886308B2 (en
Inventor
Shiyou Imagou
詔 今郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2249824A priority Critical patent/JP2886308B2/en
Publication of JPH04127371A publication Critical patent/JPH04127371A/en
Application granted granted Critical
Publication of JP2886308B2 publication Critical patent/JP2886308B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To eliminate the need of a recorder of a large capacity and to prevent the increase of an operation time of a retrieval work by dividing a retrieval keyword and a registration keyword into simple keywords, respectively and executing the matching. CONSTITUTION:In this structure, each of a data registering device 2 and a data retrieving device 3 is connected to a keyword dividing means 4, a simple keyword transposition table 5 and a keyword configuration table 5. In such a state, the keyword dividing means 4 generates a registration simple keyword and a retrieval simple keyword by a fact that a registration keyword and a retrieval keyword inputted from the data registering device 2 and the data retrieving device 3 divides a composite word into words in accordance with the recording contents of a word dictionary 7. That is, by dividing the retrieval keyword and the registration keyword into simple keywords, respectively and executing the matching, a retrieval range of registration data can be enlarged, and also, it becomes unnecessary to record in advance all the combinations. In such a way, a recorder of a large capacity becomes unnecessary, and it is prevented that the operation time of a retrieval work becomes long.

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、フリーキーワード方式のデータ登録検索装置
のデータ登録装置及び方法とデータ検索装置及び方法に
関するものである。
DETAILED DESCRIPTION OF THE INVENTION Field of the Invention The present invention relates to a data registration device and method of a free keyword type data registration and search device, and a data search device and method.

従来の技術 現在、多量のデータを高速に検索して出力する装置とし
てデータ登録検索装置が存する。このデータ登録検索装
置とは、予めデータ登録装置により各々登録キーワード
が付与されてデータベース内に記録された多数の登録デ
ータをデータ検索装置に入力する検索条件内の検索キー
ワードとのマツチングで検索するようにしたものであり
、キ−ワードの利用形態から利用可能なキーワードを予
め限定する統制キーワード方式と限定しないフリーキー
ワード方式とに分類される。
2. Description of the Related Art Data registration and search devices currently exist as devices that search and output large amounts of data at high speed. This data registration search device searches a large number of registered data, each of which has been given a registered keyword by the data registration device and recorded in the database, by matching it with the search keyword in the search conditions input into the data search device. It is classified into a controlled keyword method in which usable keywords are limited in advance based on the usage pattern of the keywords, and a free keyword method in which the available keywords are not limited.

上記三方式は何れも長所と短所とを有するが、フリーキ
ーワード方式には登録キーワードと検索キーワードとの
マツチングに課題がある。例えば、登録キーワードが「
カラー液晶テレビ」で検索キーワードが「液晶テレビ」
であるとすると、これらのキーワードは単純にはマツチ
ングしない。そして、このような課題の解決を目的とし
た提案としては、「情報管理Vol、32 No4 J
uly 1989“新聞記事データベースにおけるキー
ワード自動抽出”」に開示されたものがある。
All of the above three methods have advantages and disadvantages, but the free keyword method has a problem in matching registered keywords and search keywords. For example, if the registered keyword is “
The search keyword for ``Color LCD TV'' is ``LCD TV.''
If so, these keywords simply do not match. As a proposal aimed at solving such problems, "Information Management Vol. 32 No. 4 J
Uly 1989 "Automatic extraction of keywords in newspaper article database".

そこで、上記文献に開示された方法を従来例として以下
に説明する。まず、一つの登録キーワードを単語毎に分
割して複数の登録単純キーワードを生成し、これらの登
録単純キーワードを適宜組合わせて複数の登録キーワー
ドを新たに生成する。
Therefore, the method disclosed in the above document will be described below as a conventional example. First, one registered keyword is divided into words to generate a plurality of registered simple keywords, and these registered simple keywords are appropriately combined to generate a plurality of new registered keywords.

例えば、ある登録キーワードがA−B−C−Dの四つの
単語で形成されているとすると、新たに生成する登録キ
ーワードは、 rABcD」、rABCJ、rBcD」、rAB」、r
BCl、rCD」、rA」、rB」、rc」、rDJの
十語とする。例えば、三つの単語からなる「カラー液晶
テレビ」からは、「カラー液晶テレビ」。
For example, if a certain registered keyword is made up of four words A-B-C-D, the newly generated registered keywords are rABcD'', rABCJ, rBcD'', rAB'', r
The ten words are BCl, rCD'', rA'', rB'', rc'', and rDJ. For example, from the three words "color LCD television", it becomes "color LCD television".

「カラー液晶」、「液晶テレビ」、「カラー」、「液晶
」。
"Color LCD", "LCD TV", "Color", "LCD".

「テレビ」の古語が生成される。このようにすることで
、登録キーワードが「カラー液晶テレビ」で検索キーワ
ードが「液晶テレビ」の場合でもキーワードがマツチン
グすることになる。
The archaic word for "television" is generated. By doing this, even if the registered keyword is "color liquid crystal television" and the search keyword is "liquid crystal television," the keywords will be matched.

発明が解決しようとする課題 上述のようにすることで、キーワードのマツチングの範
囲を拡大することができるが、それでも検索キーワード
として「カラーテレビ」を入力するとマツチングが実現
されない。
Problems to be Solved by the Invention Although the range of keyword matching can be expanded by doing as described above, matching is still not achieved when "color television" is input as a search keyword.

このようなことは、登録キーワードを分割した単語の全
ての組合わせを登録キーワードとすることで防止できる
。この場合、n個の単語からなる登録キーワードから新
たに生成される登録キーワードの個数は、 2”−1 となり、前述したようなA−B−C−Dの四つの単語か
らなる登録キーワードから新たに生成する登録キーワー
ドの個数は、rABcDJ、rABCJ。
This can be prevented by using all combinations of words obtained by dividing a registered keyword as registered keywords. In this case, the number of newly generated registered keywords from a registered keyword consisting of n words is 2"-1, and the number of newly generated registered keywords from a registered keyword consisting of four words A-B-C-D as described above is 2"-1. The number of registered keywords to be generated is rABcDJ, rABCJ.

rABD」、rACD、+、rBcD」、rAB」、r
Ac」。
rABD", rACD, +, rBcD", rAB", r
Ac”.

rADJ、rBcJ、rBDJ、rCDJ、rAj、T
BJ。
rADJ, rBcJ, rBDJ, rCDJ, rAj, T
B.J.

rcJ、rDJの十五語となる。つまり、この方法では
、実際に装置に記録する登録キーワードの個数が過大に
なるので、大容量の記録装置が必要になると共に検索作
業に時間を要することになって実際的でない。
There are 15 words: rcJ and rDJ. That is, in this method, the number of registered keywords actually recorded in the device becomes excessive, so a large-capacity recording device is required, and the search operation takes time, which is impractical.

課題を解決するための手段 請求項1記載の発明は、予めデータ登fj&装置により
各々登録キーワードが付与されてデータベース内に記録
された多数の登録データをデータ検索装置に入力される
検索条件内の検索キーワードとのマツチングで検索する
データ登録検索装置において、登録キーワードを単語に
分割して登録単純キーワードを生成するキーワード分割
手段を設け、このキーワード分割手段で分割された登録
単純キーワードの各々に対応する登録データのインデッ
クスを付与して記録する単純キーワード転置テーブルを
設け、登録キーワードと登録単純キーワードとの対応関
係を記録するキーワード構成テーブルを設けた。
Means for Solving the Problems The invention according to claim 1 is a method of searching a large number of registered data, each of which has been given a registered keyword in advance by a data registration device and recorded in a database, within search conditions input into a data search device. In a data registration search device that performs a search by matching with a search keyword, a keyword dividing means is provided for dividing a registered keyword into words to generate registered simple keywords, and a keyword dividing means is provided to generate registered simple keywords that correspond to each of the registered simple keywords divided by the keyword dividing means. A simple keyword transposition table is provided to record registered data with an index, and a keyword composition table is provided to record the correspondence between registered keywords and registered simple keywords.

請求項2記載の発明は、予めデータ登録装置により各々
登録キーワードが付与されてデータベース内に記録され
た多数の登録データをデータ検索装置に入力される検索
条件内の検索キーワードとのマツチングで検索するデー
タ登録検索装置において、検索キーワードを単語に分割
して検索単純キーワードを生成するキーワード分割手段
を設け、二のキーワード分割手段で分割された検索単純
キーワードでデータ登録装置の単純キーワード転置テー
ブルを検索して一致する登録単純キーワードの登録デー
タのインデックスを検出するデータ検出手段を設け、こ
のデータ検出手段で検出された登録データの登録単純キ
ーワードと登録キーワードとの対応関係をデータ登録装
置のキーワード構成テーブルから読出して一つの検索キ
ーワードから生成された検索単純キーワードの全てが一
つの登録キーワードから生成された登録単純キーワード
の一つに一致する登録データを選出するデータ選別手段
を設けた。
The invention according to claim 2 searches a large number of registered data, each of which has been given a registered keyword in advance by a data registration device and recorded in a database, by matching it with a search keyword in search conditions input to a data search device. The data registration search device is provided with keyword division means for dividing the search keyword into words to generate search simple keywords, and the simple keyword transposition table of the data registration device is searched using the search simple keywords divided by the second keyword division means. A data detection means is provided for detecting an index of the registered data of the registered simple keyword that matches the data detection means, and the correspondence relationship between the registered simple keyword of the registered data detected by the data detection means and the registered keyword is determined from the keyword configuration table of the data registration device. A data selection means is provided for reading and selecting registered data in which all of the search simple keywords generated from one search keyword match one of the registered simple keywords generated from one registered keyword.

請求項3記載の発明は、予めデータ登録装置により各々
登録キーワードが付与されてデータベース内に記録され
た多数の登録データをデータ検索装置に入力される検索
条件内の検索キーワードとのマツチングで検索するデー
タ登録検索装置において、登録キーワードをキーワード
分割手段が単語に分割して登録単純キーワードを生成し
、この登録単純キーワードの各々に対応する登録データ
のインデックスを付与して単純キーワード転置テーブル
に記録し、登録キーワードと登録単純キーワードとの対
応関係をキーワード構成テーブルに記録するようにした
The invention according to claim 3 searches a large number of registered data, each of which has been assigned a registered keyword in advance by a data registration device and recorded in a database, by matching it with a search keyword in search conditions input to a data search device. In the data registration and search device, the keyword dividing means divides the registered keyword into words to generate registered simple keywords, assigns an index of registered data corresponding to each of the registered simple keywords, and records the index in a simple keyword transposition table; The correspondence between registered keywords and registered simple keywords is now recorded in the keyword composition table.

請求項4記載の発明は、予めデータ登録装置により各々
登録キーワードが付与されてデータベース内に記録され
た多数の登録データをデータ検索装置に入力される検索
条件内の検索キーワードとのマツチングで検索するデー
タ登録検索装置において、検索キーワードをキーワード
分割手段が単語に分割して検索単純キーワードを生成し
、この検索単純キーワードでデータ登録装置の単純キー
ワード転置テーブルをデータ検出手段が検索して一致す
る登録単純キーワードの登録データのインデックスを検
出し、この検出された登録データの登録単純キーワード
と登録キーワードとの対応関係をデータ登録装置のキー
ワード構成テーブルがら読出して一つの検索キーワード
から生成された検索単純キーワードの全てが一つの登録
キーワードから生成された登録単純キーワードの一つに
一致する登録データをデータ選別手段が選出するように
した。
The invention according to claim 4 searches a large number of registered data, each of which has been given a registered keyword in advance by a data registration device and recorded in a database, by matching it with a search keyword in search conditions input to a data search device. In the data registration search device, the keyword division means divides the search keyword into words to generate a search simple keyword, and the data detection means searches the simple keyword transposition table of the data registration device using the search simple keyword to find matching registered simple keywords. The index of the registered keyword data is detected, and the correspondence between the registered simple keywords of the detected registered data and the registered keywords is read out from the keyword configuration table of the data registration device, and the search simple keywords generated from one search keyword are searched. The data selection means selects registered data that all match one of the registered simple keywords generated from one registered keyword.

請求項5記載の発明は、登録キーワードと登録単純キー
ワードとの対応関係と共に登録キーワード内での登録単
純キーワードの順位を記録するキーワード構成テーブル
を設けた。
The invention as set forth in claim 5 provides a keyword composition table that records the correspondence between registered keywords and registered simple keywords as well as the ranking of registered simple keywords within the registered keywords.

請求項6記載の発明は、キーワード構成テーブルの記録
内容に従ってデータ選別手段で選出された登録データの
登録キーワード内での複数の登録単純キーワードの前後
関係と検索キーワード内での複数の検索単純キーワード
の前後関係との整合を判定して登録データを選出する第
二のデータ選別手段を設けた。
The invention as set forth in claim 6 provides a method for determining the context of a plurality of registered simple keywords within the registered keywords of the registered data selected by the data selection means according to the recorded contents of the keyword composition table and the plurality of search simple keywords within the search keyword. A second data selection means is provided to select registered data by determining consistency with the context.

請求項7記載の発明は、キーワード構成テーブルに登録
キーワードと登録単純キーワードとの対応関係と共に登
録キーワード内での登録単純キーワードの順位を記録す
るようにした。
According to the seventh aspect of the present invention, the ranking of the registered simple keywords among the registered keywords is recorded in the keyword composition table along with the correspondence between the registered keywords and the registered simple keywords.

請求項8記載の発明は、キーワード構成テーブルの記録
内容に従ってデータ選別手段で選出された登録データの
登録キーワード内での複数の登録単純キーワードの前後
関係と検索キーワード内での複数の検索単純キーワード
の前後関係との整合を第二のデータ選別手段が判定して
登録データを選出するようにした。
The invention according to claim 8 provides a method for determining the context of a plurality of registered simple keywords within the registered keywords of the registered data selected by the data selection means according to the recorded contents of the keyword composition table and the plurality of search simple keywords within the search keyword. The second data selection means selects registered data by determining consistency with the context.

作用 請求項1,2.3及び4記載の発明は、検索キーワード
と登録キーワードとを各々単純キーワードに分割してマ
ツチングを実行するので登録データの検索範囲を拡大す
ることができ、しかも、登録単純キーワードの全ての組
合わせを記録しておくようなことは要しないので、大容
量の記録装置が必要になったり検索作業の動作時間が長
くなるようなことが防止される。
The invention described in operational claims 1, 2.3, and 4 performs matching by dividing the search keyword and the registered keyword into simple keywords, so it is possible to expand the search range of registered data. Since it is not necessary to record all combinations of keywords, it is possible to prevent a large-capacity recording device from being required or from increasing the operating time of the search operation.

請求項5,6.7及び8記載の発明は、単純キーワード
の順番が異なることで検索キーワードとの内容の整合性
が低い登録キーワードは排除されるので、検索キーワー
ドと極めて整合性が高い登録キーワードが付与された登
録データのみが検出される。
The invention described in claims 5, 6, 7, and 8 eliminates registered keywords that have low content consistency with the search keyword because the order of the simple keywords is different, so that registered keywords that have extremely high consistency with the search keyword are excluded. Only registered data that is given will be detected.

実施例 本発明の実施例を図面に基づいて説明する。まず、本実
施例のデータ登録検索装置1は、第2図に例示するよう
に、データ登録装置2とデータ検索装置3との各々がキ
ーワード分割手段4と単純キーワード転置テーブル5及
びキーワード構成テーブル6に接続された構造となって
いる。ここで、データ登録装置2は、画像情報や文書情
報などの登録データが登録キーワードと共に入力される
と、これをデータベース(図示せず)に記録するように
なっており、データ検索装置3は、検索キーワードや論
理演算子からなる検索条件が入力されると、この検索条
件の検索キーワードに従ってデータ検出手段やデータ選
別手段及び第二のデータ選別手段(いずれも図示せず)
等でデータベースに記録された登録データを検索して出
力するようになっている。そこで、このような登録デー
タの登録や検索を実現するデータ登録検索装置1の各部
の機能を以下に説明する。
Embodiment An embodiment of the present invention will be described based on the drawings. First, in the data registration and retrieval device 1 of this embodiment, as illustrated in FIG. The structure is connected to the Here, when registered data such as image information and document information is input together with a registered keyword, the data registration device 2 records this in a database (not shown), and the data search device 3 When a search condition consisting of a search keyword or a logical operator is input, a data detection means, a data selection means, and a second data selection means (all not shown) are activated according to the search keyword of the search condition.
etc. to search and output registered data recorded in the database. Therefore, the functions of each part of the data registration and search device 1 that realizes such registration and search of registered data will be described below.

まず、キーワード分割手段4は、データ登録装置2やデ
ータ検索装置3から入力される登録キーワードや検索キ
ーワードが複合語を単語辞書7の記録内容に従って単語
に分割することで登録単純キーワードや検索単純キーワ
ードを生成する。ここで、第3図に例示するように、単
語辞書7は単語の表記と品詞とで形成されており、その
単語の品詞は名詞と接頭辞及び接尾辞からなっている。
First, the keyword dividing means 4 divides the registered keywords and search keywords input from the data registration device 2 and the data retrieval device 3 into words according to the recorded contents of the word dictionary 7, so that the registered simple keywords and search simple keywords are divided into words according to the recorded contents of the word dictionary 7. generate. Here, as illustrated in FIG. 3, the word dictionary 7 is formed by the notation of a word and its part of speech, and the part of speech of the word consists of a noun, a prefix, and a suffix.

そして、キーワード分割手段4は、 ■、キーワードの先頭は名詞か接頭辞である。Then, the keyword dividing means 4 ■The beginning of the keyword is a noun or a prefix.

■、キーワードの末尾は名詞か接尾辞である。■The keyword ends with a noun or a suffix.

■、接頭辞の直後に接尾辞は連続しない。■Suffixes are not consecutive immediately after a prefix.

と云うような品詞間の関係に従ってキーワードを単語に
分割するようになっている。
Keywords are divided into words according to the relationship between parts of speech.

なお、本実施例のデータ登録検索装置1のキーワード分
割手段4では、キーワードを数パターンに分割すること
ができる場合は、分割される単語の全体数や名詞の個数
などが最小となるパターンを選択するようになっている
。また、本実施例のデータ登録検索装置1では、取扱う
言語として日本語を対象として日本語の単語辞書7に従
ってキーワードを単語に分割するキーワード分割手段4
を例示したが、本発明は上記方式に限定されるものでは
なく、例えば、英語や独語等では複合語でも単語がスペ
ースで分割されているので、単語辞書を要することなく
スペースを利用してキーワードを単語に分割するキーワ
ード分割手段などが実施可能である。
In addition, in the keyword division means 4 of the data registration search device 1 of this embodiment, when a keyword can be divided into several patterns, the pattern that minimizes the total number of words to be divided, the number of nouns, etc. is selected. It is supposed to be done. Furthermore, in the data registration and search device 1 of this embodiment, the keyword dividing means 4 divides keywords into words according to the Japanese word dictionary 7, with Japanese as the handled language.
However, the present invention is not limited to the above method. For example, in English or German, even compound words are divided by spaces, so keywords can be divided by spaces without the need for a word dictionary. It is possible to implement keyword division means that divides the keyword into words.

っぎに、単純キーワード転置テーブル5は、第4図に例
示するように、上述のようにしてキーワード分割手段4
で登録キーワードから生成された登録単純キーワードの
表記と、これに対応する登録データのインデックスとが
データ登録装置2により記録されている。ここで、この
単純キーワード転置テーブル5では、各登録単純キーワ
ードが文字コードに従って配列されているので、これと
検索単純キーワードとのマツチングをデータ検索装置3
のデータ検出手段が実行することで葺録単純キーワード
を含む登録キーワードが付与された登録データのインデ
ックスが高速に検出される。
Finally, as illustrated in FIG.
The notation of the registered simple keyword generated from the registered keyword in , and the index of the registered data corresponding to this are recorded by the data registration device 2 . Here, in this simple keyword transposition table 5, each registered simple keyword is arranged according to the character code, so the data search device 3 performs matching between this and the search simple keyword.
By executing this data detection means, an index of registered data to which registered keywords including the simple keyword for printing are added can be detected at high speed.

例えば、データ検索装置3により検索単純キーワードと
して「テレビ」が生成されると、これを含む登録キーワ
ードが付与された登録データ1,3が単純キーワード転
置テーブル5から高速に検出される。
For example, when "television" is generated as a simple search keyword by the data search device 3, registered data 1 and 3 to which registered keywords containing this are added are detected from the simple keyword transposition table 5 at high speed.

つぎに、キーワード構成テーブル6は、第5図に例示す
るように、登録データのインデックス、これに対応する
登録単純キーワードと登録キーワードとの表記、この登
録キーワード内での登録単純キーワードの順位がデータ
登録装置2により記録されている。従って、このキーワ
ード構成テーブル6の登録データのインデックスに従っ
て所定の登録単純キーワードを検出すると、この登録単
純キーワードと登録キーワードとの対応関係や登録キー
ワード内での順位が判明する。例えば、前述のようにデ
ータ検索装置3により「テレビ」と云う登録単純キーワ
ードが付与された登録データl。
Next, as illustrated in FIG. 5, the keyword structure table 6 includes data including an index of registered data, the corresponding registered simple keyword and notation of the registered keyword, and the ranking of the registered simple keyword within this registered keyword. It is recorded by the registration device 2. Therefore, when a predetermined registered simple keyword is detected according to the index of the registered data in the keyword configuration table 6, the correspondence relationship between the registered simple keyword and the registered keyword and the ranking within the registered keyword are found. For example, the registered data l to which the registered simple keyword "television" has been added by the data search device 3 as described above.

3が検出された場合、キーワード構成テーブル6からは
登録単純キーワード「テレビ」が登録データlでは登録
キーワード「カラー液晶テレビ」の三番目の単語で登録
データ3では登録キーワード[テレビ電話Jの一番目の
単語であることが検出される。
3 is detected, from the keyword structure table 6, the registered simple keyword "television" is the third word of the registered keyword "color LCD television" in the registered data l, and the registered keyword [video phone J is the first word in the registered data 3]. is detected as a word.

そこで、上述のような機構4〜6に各種情報を記録する
データ登録装置2の動作を第1図(a)に例示するフロ
ーチャートに基づいて以下に詳述する。まず、画像情報
や文書情報等の登録データと、これに対応した登録キー
ワードとが入力される。
Therefore, the operation of the data registration device 2 for recording various information in the mechanisms 4 to 6 as described above will be described in detail below based on the flowchart illustrated in FIG. 1(a). First, registered data such as image information and document information, and registered keywords corresponding to the registered data are input.

この時、この登録キーワードは登録データが文書情報や
音声情報の場合は公知技術により自動抽出することもで
きるが、基本的には作業者が作成するものである。なお
、ここでは説明を簡明にするために入力する登録キーワ
ードの個数を一つとした場合を例示して説明する。そこ
で、入力された登録キーワードは前述のようにキーワー
ド分割手段4により単語辞書7に従って単語に分割され
、少なくとも一つの登録単純キーワードが生成される。
At this time, if the registered data is document information or audio information, the registered keyword can be automatically extracted using known technology, but basically it is created by the operator. Note that here, for the sake of simplicity, an example will be described in which the number of registered keywords to be input is one. Therefore, the input registered keyword is divided into words by the keyword dividing means 4 according to the word dictionary 7 as described above, and at least one registered simple keyword is generated.

そこで、これらの登録単純キーワードが文字コードに従
って配列されて登録データのインデックスと共に単純キ
ーワード転置テーブル5に記録され、さらに、各登録デ
ータのインデックス毎に分類されて、!l録単純キーワ
ードと登録キーワードとの表記、登録キーワード内での
登録単純キーワードの順位がキーワード構成テーブル6
に記録される。
Therefore, these registered simple keywords are arranged according to the character code and recorded in the simple keyword transposition table 5 together with the registered data index, and are further classified for each registered data index. Keyword composition table 6 shows the notation of recorded simple keywords and registered keywords, and the ranking of registered simple keywords within registered keywords.
recorded in

つぎに、上述のようにしてデータ登録装置2により記録
された登録データを検索するデータ検索装置3の動作を
第1図(b)に例示するフローチャートに基づいて以下
に詳述する。ここでは説明を簡明にするために入力する
検索条件が一つの検索キーワードで形成されて論理演算
子等を内包しない場合を例示して説明する。例えば、検
索キーワードとして「カラーテレビjと云う複合語が入
力されると、これがキーワード分割手段4により単語辞
書7に従って単語に分割され、検索単純キーワード「カ
ラー」と「テレビ」とが生成される。そこで、これらの
検索単純キーワードが付与された登録データのインデッ
クスが単純キーワード転置テーブル5から検出されるの
で、第3図に例示するように、検索単純キーワード「カ
ラー」と「テレビ」とからは登録データ1が検出される
。つぎに、検出された登録データ1のインデックスに従
ってキーワード構成テーブル6から登録単純キーワード
と登録キーワードとの対応関係を読出し、第5図に例示
するように、一つの検索キーワードから生成された検索
単純キーワードの全てが一つの登録キーワードから生成
された登録単純キーワードの一つに一致するかがデータ
選別手段により判定される。
Next, the operation of the data retrieval device 3 for retrieving the registered data recorded by the data registration device 2 as described above will be described in detail below based on the flowchart illustrated in FIG. 1(b). Here, to simplify the explanation, an example will be described in which the input search condition is formed by one search keyword and does not include any logical operators or the like. For example, when a compound word ``color television j'' is input as a search keyword, this is divided into words by the keyword dividing means 4 according to the word dictionary 7, and the simple search keywords ``color'' and ``television'' are generated. Therefore, since the index of the registered data to which these search simple keywords have been added is detected from the simple keyword transposition table 5, as illustrated in FIG. Data 1 is detected. Next, the correspondence between the registered simple keywords and the registered keywords is read out from the keyword composition table 6 according to the index of the detected registered data 1, and as illustrated in FIG. 5, the search simple keywords generated from one search keyword are The data selection means determines whether all of the keywords match one of the registered simple keywords generated from one registered keyword.

このようにすることで、例えば、一つの検索キーワード
「カラーテレビ」から生成された単純キーワード「カラ
ー」と「テレビ」とが一つの登録キーワード「カラー液
晶テレビ」から生成されていることが検出され、検索キ
ーワードと登録キーワードとの内容の整合性が確認され
る。そこで、請求項2及び4記載の発明では、このよう
に検索キーワードと登録キーワードとの整合性が確認さ
れると登録データ1を検索結果として出力する。
By doing this, for example, it is detected that the simple keywords "color" and "television" generated from one search keyword "color television" are generated from one registered keyword "color LCD television". , the content consistency between the search keyword and the registered keyword is confirmed. Accordingly, in the invention described in claims 2 and 4, when the consistency between the search keyword and the registered keyword is confirmed in this way, the registered data 1 is output as the search result.

ここで、例えば、一つの検索キーワード[宣伝番組」か
ら生成された単純キーワード「宣伝」と「番組」とが一
つの登録キーワード「番組宣伝」から生成されているこ
とが検出されても、これらの検索キーワードと登録キー
ワードとは内容の整合性が低いことが自明である。そこ
で、請求項6及び8記載の発明では、さらに検索キーワ
ードと登録キーワードとの整合性を第二のデータ選別手
段により確認するようになっている。つまり、上述のよ
うにしてデータ選別手段で選出された登録データに対し
、第二のデータ選別手段がキーワード構成テーブル6か
ら登録キーワード内での複数の登録単純キーワードの前
後関係を読出して検索キーワード内での複数の検索単純
キーワードの前後関係との整合を判定する。このように
することで、上述のように単純キーワードの順番が異な
ることで検索キーワードとの内容の整合性が低い登録キ
ーワードは排除されるので、検索キーワードと極めて整
合性が高い登録キーワードが付与された登録データのみ
が検出されることになる。
Here, for example, even if it is detected that the simple keywords "advertisement" and "program" generated from one search keyword "promotional program" are generated from one registered keyword "promotional program", these It is obvious that the content consistency between the search keyword and the registered keyword is low. Therefore, in the inventions described in claims 6 and 8, the consistency between the search keyword and the registered keyword is further confirmed by the second data selection means. That is, for the registered data selected by the data selection means as described above, the second data selection means reads out the context of a plurality of registered simple keywords within the registered keywords from the keyword composition table 6, and searches the search keywords. Determine whether or not multiple search simple keywords match the context. By doing this, as mentioned above, registered keywords that have low consistency with the search keyword due to the different order of simple keywords are eliminated, and registered keywords that are highly consistent with the search keyword are assigned. Only registered data that has been registered will be detected.

なお、本実施例のデータ登録検索装置1では、データ登
録装置2とデータ検索装置、3とが一体的に形成された
ものを例示したが、本発明は上記構造に限定されるもの
ではなく、例えば、データ登録装置2とデータ検索装置
3とを別個に形成して通信網(図示せず)などを介して
通信するシステム(図示せず)なども実施可能である。
In the data registration and search device 1 of this embodiment, the data registration device 2 and the data search device 3 are integrally formed, but the present invention is not limited to the above structure. For example, it is also possible to implement a system (not shown) in which the data registration device 2 and the data search device 3 are formed separately and communicate via a communication network (not shown).

発明の効果 請求項1,2.3及び4記載の発明は、予めデータ登録
装置により各々登録キーワードが付与されてデータベー
ス内に記録された多数の登録データをデータ検索装置に
入力される検索条件内の検索キーワードとのマツチング
で検索するデータ登録検索装置において、登録キーワー
ドをキーワード分割手段が単語に分割して登録単純キー
ワードを生成し、この登録単純キーワードの各々に対応
する登録データのインデックスを付与して単純キーワー
ド転置テーブルに記録し、登録キーワードと登録単純キ
ーワードとの対応関係をキーワード構成テーブルに記録
し、検索キーワードをキーワード分割手段が単語に分割
して検索単純キーワードを生成し、この検索単純キーワ
ードでデータ登録装置の単純キーワード転置テーブルを
データ検出手段が検索して一致する登録単純キーワード
の登録データのインデックスを検出し、この検出された
登録データの登録単純キーワードと登録キーワードとの
対応関係をデータ登録装置のキーワード構成テーブルか
ら読出して一つの検索キーワードから生成された検索単
純キーワードの全てが一つの登録キーワードから生成さ
れた登録単純キーワードの一つに一致する登録データを
データ選別手段が選出するようにしたことにより、検索
キーワードと登録キーワードとを各々単純キーワードに
分割してマツチングを実行するので登録データの検索範
囲を拡大することができ、しかも、登録単純キーワード
の全ての組合わせを記録しておくようなことは要しない
ので、大容量の記録装置が必要になったり検索作業の動
作時間が長くなるようなことが防止され、データ登録検
索装置の高性能化に寄与することができる等の効果を有
するものである。
Effects of the Invention The invention according to Claims 1, 2.3, and 4 is based on a search condition that is input into a data search device using a large number of registered data that are each assigned a registered keyword and recorded in a database by a data registration device in advance. In a data registration search device that performs a search by matching with a search keyword, a keyword dividing means divides a registered keyword into words to generate registered simple keywords, and assigns an index of registered data corresponding to each of the registered simple keywords. The search keyword is recorded in the simple keyword transposition table, the correspondence between the registered keyword and the registered simple keyword is recorded in the keyword composition table, and the keyword dividing means divides the search keyword into words to generate a search simple keyword. The data detection means searches the simple keyword transposition table of the data registration device, detects the index of the registered data of the matching registered simple keyword, and calculates the correspondence relationship between the registered simple keyword of the detected registered data and the registered keyword. The data selection means reads out the keyword configuration table of the registration device and selects registered data in which all of the search simple keywords generated from one search keyword match one of the registered simple keywords generated from one registered keyword. By doing this, the search keyword and registered keyword are divided into simple keywords and matching is executed, so the search range of registered data can be expanded. Moreover, all combinations of registered simple keywords can be recorded. This eliminates the need for large-capacity storage devices and long search operation times, and contributes to improved performance of data registration and search devices. It is effective.

請求項5,6.7及び8記載の発明は、キーワード構成
テーブルに登録キーワードと登録単純キーワードとの対
応関係と共に登録キーワード内での登録単純キーワード
の順位を記録し、キーワード構成テーブルの記録内容に
従ってデータ選別手段で選出された登録データの登録キ
ーワード内での複数の登録単純キーワードの前後関係と
検索キーワード内での複数の検索単純キーワードの前後
関係との整合を第二のデータ選別手段が判定して登録デ
ータを選出するようにしたことにより、単純キーワード
の順番が異なることで検索キーワードとの内容の整合性
が低い登録キーワードは排除されるので、検索キーワー
ドと極めて整合性が高い登録キーワードが付与された登
録データのみが検出される二とになり、データ登録検索
装置の高性能化に寄与することができる等の効果を有す
るものである。
The invention described in claims 5, 6, 7, and 8 records the correspondence between registered keywords and registered simple keywords in the keyword composition table, as well as the ranking of the registered simple keywords among the registered keywords, and records the ranking of the registered simple keywords among the registered keywords in the keyword composition table. The second data selection means determines whether the context of the plurality of registered simple keywords within the registered keyword of the registered data selected by the data selection means matches the context of the plurality of search simple keywords within the search keyword. By selecting registered data based on the search criteria, registered keywords with low content consistency with the search keyword due to the difference in the order of simple keywords are eliminated, and registered keywords with extremely high consistency with the search keyword are assigned. This allows only the registered data that has been registered to be detected, thereby contributing to improving the performance of the data registration and search device.

【図面の簡単な説明】[Brief explanation of the drawing]

図面は本発明の実施例を示すものであり、第1図はフロ
ーチャート、第2図はブロック図、第3図は単語辞書の
内部構造の概念説明図、第4図は単純キーワード転置テ
ーブルの内部構造の概念説明図、第5図はキーワード構
成テーブルの内部構造の概念説明図である。 ■・・・データ登録検索装置、2・・・データ登録装置
、3・・・データ検索装置、4・・・キーワード分割手
段、5・・・単純キーワード転置テーブル、6・・・キ
ーワード構成テーブル こ第 」 (a)
The drawings show an embodiment of the present invention; FIG. 1 is a flowchart, FIG. 2 is a block diagram, FIG. 3 is a conceptual explanatory diagram of the internal structure of a word dictionary, and FIG. 4 is an internal diagram of a simple keyword transposition table. Conceptual explanatory diagram of structure: FIG. 5 is a conceptual explanatory diagram of the internal structure of the keyword configuration table. ■...Data registration and search device, 2...Data registration device, 3...Data search device, 4...Keyword division means, 5...Simple keyword transposition table, 6...Keyword composition table ``No.'' (a)

Claims (1)

【特許請求の範囲】 1、予めデータ登録装置により各々登録キーワードが付
与されてデータベース内に記録された多数の登録データ
をデータ検索装置に入力される検索条件内の検索キーワ
ードとのマッチングで検索するデータ登録検索装置にお
いて、前記登録キーワードを単語に分割して登録単純キ
ーワードを生成するキーワード分割手段を設け、このキ
ーワード分割手段で分割された前記登録単純キーワード
の各々に対応する登録データのインデックスを付与して
記録する単純キーワード転置テーブルを設け、前記登録
キーワードと前記登録単純キーワードとの対応関係を記
録するキーワード構成テーブルを設けたことを特徴とす
るデータ登録装置。 2、予めデータ登録装置により各々登録キーワードが付
与されてデータベース内に記録された多数の登録データ
をデータ検索装置に入力される検索条件内の検索キーワ
ードとのマッチングで検索するデータ登録検索装置にお
いて、前記検索キーワードを単語に分割して検索単純キ
ーワードを生成するキーワード分割手段を設け、このキ
ーワード分割手段で分割された前記検索単純キーワード
でデータ登録装置の単純キーワード転置テーブルを検索
して一致する登録単純キーワードの登録データのインデ
ックスを検出するデータ検出手段を設け、このデータ検
出手段で検出された登録データの登録単純キーワードと
登録キーワードとの対応関係を前記データ登録装置のキ
ーワード構成テーブルから読出して一つの検索キーワー
ドから生成された前記検索単純キーワードの全てが一つ
の前記登録キーワードから生成された前記登録単純キー
ワードの一つに一致する登録データを選出するデータ選
別手段を設けたことを特徴とするデータ検索装置。 3、予めデータ登録装置により各々登録キーワードが付
与されてデータベース内に記録された多数の登録データ
をデータ検索装置に入力される検索条件内の検索キーワ
ードとのマッチングで検索するデータ登録検索装置にお
いて、前記登録キーワードをキーワード分割手段が単語
に分割して登録単純キーワードを生成し、この登録単純
キーワードの各々に対応する登録データのインデックス
を付与して単純キーワード転置テーブルに記録し、前記
登録キーワードと前記登録単純キーワードとの対応関係
をキーワード構成テーブルに記録するようにしたことを
特徴とするデータ登録方法。 4、予めデータ登録装置により各々登録キーワードが付
与されてデータベース内に記録された多数の登録データ
をデータ検索装置に入力される検索条件内の検索キーワ
ードとのマッチングで検索するデータ登録検索装置にお
いて、前記検索キーワードをキーワード分割手段が単語
に分割して検索単純キーワードを生成し、この検索単純
キーワードでデータ登録装置の単純キーワード転置テー
ブルをデータ検出手段が検索して一致する登録単純キー
ワードの登録データのインデックスを検出し、この検出
された登録データの登録単純キーワードと登録キーワー
ドとの対応関係を前記データ登録装置のキーワード構成
テーブルから読出して一つの検索キーワードから生成さ
れた前記検索単純キーワードの全てが一つの前記登録キ
ーワードから生成された前記登録単純キーワードの一つ
に一致する登録データをデータ選別手段が選出するよう
にしたことを特徴とするデータ検索方法。 5、登録キーワードと登録単純キーワードとの対応関係
と共に前記登録キーワード内での前記登録単純キーワー
ドの順位を記録するキーワード構成テーブルを設けたこ
とを特徴とする請求項1記載のデータ登録装置。 6、キーワード構成テーブルの記録内容に従ってデータ
選別手段で選別された登録データの登録キーワード内で
の複数の登録単純キーワードの前後関係と前記検索キー
ワード内での複数の検索単純キーワードの前後関係との
整合を判定して前記登録データを選出する第二のデータ
選別手段を設けたことを特徴とする請求項2記載のデー
タ検索装置。 7、キーワード構成テーブルに登録キーワードと登録単
純キーワードとの対応関係と共に前記登録キーワード内
での前記登録単純キーワードの順位を記録するようにし
たことを特徴とする請求項3記載のデータ登録方法。 8、キーワード構成テーブルの記録内容に従ってデータ
選別手段で選別された登録データの登録キーワード内で
の複数の登録単純キーワードの前後関係と前記検索キー
ワード内での複数の検索単純キーワードの前後関係との
整合を第二のデータ選別手段が判定して前記登録データ
を選出するようにしたことを特徴とする請求項4記載の
データ検索方法。
[Claims] 1. A large number of registered data, each of which has been assigned a registered keyword in advance by a data registration device and recorded in a database, is searched by matching with a search keyword within search conditions input into a data search device. In the data registration search device, a keyword dividing means is provided for dividing the registered keyword into words to generate registered simple keywords, and an index of registered data corresponding to each of the registered simple keywords divided by the keyword dividing means is provided. A data registration device comprising: a simple keyword transposition table for recording the registered keywords; and a keyword composition table for recording the correspondence between the registered keywords and the registered simple keywords. 2. In a data registration search device that searches a large number of registered data, each of which has been given a registered keyword in advance and recorded in a database, by matching it with a search keyword in search conditions input into a data search device, Keyword dividing means is provided for dividing the search keyword into words to generate search simple keywords, and searching the simple keyword transposition table of the data registration device with the search simple keywords divided by the keyword dividing means to find matching registered simple keywords. A data detection means for detecting an index of the registered data of keywords is provided, and the correspondence relationship between the registered simple keywords and the registered keywords of the registered data detected by the data detection means is read out from the keyword configuration table of the data registration device, and one Data characterized in that data selection means is provided for selecting registered data in which all of the simple search keywords generated from search keywords match one of the registered simple keywords generated from one registered keyword. Search device. 3. In a data registration search device that searches a large number of registered data, each of which has been given a registered keyword in advance by the data registration device and recorded in a database, by matching it with a search keyword in search conditions input to the data search device, A keyword dividing means divides the registered keyword into words to generate registered simple keywords, assigns an index of registered data corresponding to each of the registered simple keywords, records it in a simple keyword transposition table, and combines the registered keyword and the A data registration method characterized in that correspondence with registered simple keywords is recorded in a keyword composition table. 4. In a data registration and search device that searches a large number of registered data, each of which has been given a registered keyword in advance by the data registration device and recorded in a database, by matching with a search keyword in search conditions input to a data search device, The keyword dividing means divides the search keyword into words to generate a simple search keyword, and the data detecting means searches the simple keyword transposition table of the data registration device using the search simple keyword to find the registered data of the matching registered simple keyword. The index is detected, and the correspondence between the registered simple keywords of the detected registered data is read out from the keyword configuration table of the data registration device, and all of the search simple keywords generated from one search keyword are combined. A data search method characterized in that a data selection means selects registered data that matches one of the registered simple keywords generated from the two registered keywords. 5. The data registration device according to claim 1, further comprising a keyword composition table that records the correspondence between registered keywords and registered simple keywords as well as the ranking of the registered simple keywords among the registered keywords. 6. Matching the context of a plurality of registered simple keywords within the registered keywords of the registered data selected by the data selection means according to the recorded contents of the keyword composition table with the context of the plurality of search simple keywords within the search keyword. 3. The data search device according to claim 2, further comprising second data selection means for determining the registered data and selecting the registered data. 7. The data registration method according to claim 3, wherein the correspondence relationship between registered keywords and registered simple keywords and the rank of the registered simple keywords among the registered keywords are recorded in a keyword composition table. 8. Matching the context of a plurality of registered simple keywords within the registered keywords of the registered data selected by the data selection means according to the recorded contents of the keyword composition table with the context of the plurality of search simple keywords within the search keyword. 5. The data search method according to claim 4, wherein the second data selection means determines the registered data to select the registered data.
JP2249824A 1990-09-19 1990-09-19 Data registration apparatus and method and data search apparatus and method Expired - Fee Related JP2886308B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2249824A JP2886308B2 (en) 1990-09-19 1990-09-19 Data registration apparatus and method and data search apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2249824A JP2886308B2 (en) 1990-09-19 1990-09-19 Data registration apparatus and method and data search apparatus and method

Publications (2)

Publication Number Publication Date
JPH04127371A true JPH04127371A (en) 1992-04-28
JP2886308B2 JP2886308B2 (en) 1999-04-26

Family

ID=17198731

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2249824A Expired - Fee Related JP2886308B2 (en) 1990-09-19 1990-09-19 Data registration apparatus and method and data search apparatus and method

Country Status (1)

Country Link
JP (1) JP2886308B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06301722A (en) * 1993-04-13 1994-10-28 Matsushita Electric Ind Co Ltd Morpheme analyzing device and keyword extracting device
JPH1185763A (en) * 1997-09-02 1999-03-30 Denso Corp Data retrieval/display system
US6738952B1 (en) 1997-09-02 2004-05-18 Denso Corporation Navigational map data object selection and display system
JP2008243202A (en) * 2007-03-26 2008-10-09 Nhn Corp Method and system for automatically adding index term of retrieval database

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06301722A (en) * 1993-04-13 1994-10-28 Matsushita Electric Ind Co Ltd Morpheme analyzing device and keyword extracting device
JPH1185763A (en) * 1997-09-02 1999-03-30 Denso Corp Data retrieval/display system
US6738952B1 (en) 1997-09-02 2004-05-18 Denso Corporation Navigational map data object selection and display system
JP2008243202A (en) * 2007-03-26 2008-10-09 Nhn Corp Method and system for automatically adding index term of retrieval database

Also Published As

Publication number Publication date
JP2886308B2 (en) 1999-04-26

Similar Documents

Publication Publication Date Title
US8332391B1 (en) Method and apparatus for automatically identifying compounds
KR970705795A (en) PARALLEL PROCESSING SYSTEM FOR TRAVERSING A DATA BASE FOR DATABASE SEARCH
US11836197B2 (en) Search processing method and apparatus based on clipboard data
JP2872706B2 (en) Information retrieval device
JPH04127371A (en) Device and method for registering data and device and method for retrieving data
KR19990010225A (en) How to operate cache
JP3994188B2 (en) Multimedia data search system, multimedia search method, and program for realizing the search method
JPH06301732A (en) Document retrieval processing method
JPS59105141A (en) Managing method of electronic document
JPH0773187A (en) Retrieving system
KR101142062B1 (en) Apparatus and method for database management and search engine of multimedia metadata
JP3508842B2 (en) Database search system and recording medium storing database search program
JPH0514304B2 (en)
JP2503357B2 (en) Information processing device
JPH05151264A (en) Information retrieving device
JPH03137772A (en) Data base utilizing system
JPH09269952A (en) Document retrieval device/method
JP2601139B2 (en) String search device
JP2001337969A (en) Knowledge acquiring method, document information structuring method and apparatus, and recording medium recording program for implementing the method
JPH041853A (en) Document retrieving device
JPH07120357B2 (en) Document retrieval device
JPH07152623A (en) File system and its access method
JP2000315211A (en) Document management system and document managing method
JPS59103173A (en) Supply system of picture information
JPH0488474A (en) Document processor

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees