JPH05250416A - Registering and retrieving device for data base - Google Patents

Registering and retrieving device for data base

Info

Publication number
JPH05250416A
JPH05250416A JP4082984A JP8298492A JPH05250416A JP H05250416 A JPH05250416 A JP H05250416A JP 4082984 A JP4082984 A JP 4082984A JP 8298492 A JP8298492 A JP 8298492A JP H05250416 A JPH05250416 A JP H05250416A
Authority
JP
Japan
Prior art keywords
representative word
keyword
data
database
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4082984A
Other languages
Japanese (ja)
Inventor
Akio Kimijima
昭生 君島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Engineering Corp
Original Assignee
Toshiba Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Engineering Corp filed Critical Toshiba Engineering Corp
Priority to JP4082984A priority Critical patent/JPH05250416A/en
Publication of JPH05250416A publication Critical patent/JPH05250416A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To provide a device whose retrieval hitting rate is high by converting an inputted keyword and a keyword being immanent in registered data with a prescribed conversion rule, and replacing them with a representative word in a representative word dictionary. CONSTITUTION:The device is constituted of an input/output device 1 for inputting a retrieval keyword and registered data, and outputting the data retrieved actually to a screen, an input control means 2 for receiving an input from the input/output device 1, an output control means 3 for outputting the data to the input/output device 1, a keyword converting means 4 for converting the inputted keyword by five conversion rules, a representative word registering means 51 for defining and registering a representative word to each keyword to a representative word dictionary 6, a representative word determining means 52 for reading in the representative word dictionary 6 from an auxiliary storage device, and determining the representative word concerned, a data registering means 7 for registering the data to a data base 8, and a data retrieving means 9 for retrieving the data registered already.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は書籍の所在などを格納す
るデータベースの登録・検索装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a database registration / retrieval device for storing the whereabouts of books.

【0002】[0002]

【従来の技術】書籍及び論文等の文献を収集貯蔵し、こ
の膨大な貯蔵文献の中から、所望の文献を検索抽出する
ために、文献毎の名称、著者名、発行日、発行所及び文
献の内容を示す各種キーワードとともに文献データを電
子計算機に登録してデータベースを作成し、これらデー
タベース内の求める文献をオペレーターが入力したキー
ワードを検索キーワードとして、求める文献を検索して
いる。
2. Description of the Related Art In order to collect and store documents such as books and papers and retrieve and extract desired documents from the vast amount of stored documents, the name of each document, author's name, date of issue, place of publication and document Document data is registered in an electronic computer together with various keywords indicating the contents of the above, a database is created, and the documents to be sought in these databases are searched for using the keywords input by the operator as the search keywords.

【0003】このような従来のデータベース登録・検索
装置について、図6の従来のデータベース登録・検索装
置を用いて説明する。
Such a conventional database registration / retrieval apparatus will be described with reference to the conventional database registration / retrieval apparatus shown in FIG.

【0004】上記文献毎の複数のキーワード及び文献デ
ータをデータベース8に新規登録する場合、オペレータ
ーにより入出力装置1から入力されたままのデータを、
データ登録手段7が、補助記憶装置のデータベース8に
書き込んでいた。
When a plurality of keywords and document data for each document are newly registered in the database 8, the data that has been input by the operator from the input / output device 1 is
The data registration means 7 has written in the database 8 of the auxiliary storage device.

【0005】また、データベース8にすでに登録済みの
文献データをキーワードで検索する場合は、オペレータ
ーが入出力装置1から入力したキーワードを、そのまま
データ検索手段9に渡し、補助記憶装置のデータベース
8内を検索していた。
Further, when searching the document data already registered in the database 8 by a keyword, the keyword input by the operator from the input / output device 1 is directly passed to the data search means 9 and the database 8 of the auxiliary storage device is searched. I was searching.

【0006】しかしながら上述した従来の技術では、同
じ意味内容のことを表現するのに、個人個人異なる表現
をするように、オペレーターにより(同じオペレーター
であってもその時により)検索用として入力するキーワ
ードは異なる言葉になることがあり、取り出したい文献
データが実際データベース8内に存在するにもかかわら
ず、該当する文献データがないとして扱われてしまい、
検索もれが生じるという問題点があった。例えば、「ア
メリカ合衆国」に関する情報を検索する際、キーワード
として「U.S.A.」、「米国」、「Americ
a」と3とうり入力してそれぞれ検索すると、それぞれ
の検索結果は本来同じであるべきだが、従来の方法では
異なった結果になってしまっていた。
[0006] However, in the above-mentioned conventional technique, in order to express the same meaning content, but to express differently for each individual, the keyword input by the operator (even if it is the same operator, depending on the time) is It may be in a different word, and although the document data you want to retrieve actually exists in the database 8, it is treated as there is no corresponding document data,
There was a problem that search omission occurred. For example, when searching for information about “United States”, keywords such as “U.S.A.”, “US”, and “Americ
When "a" and "3" are entered and the respective searches are performed, the respective search results should be the same, but the conventional method results in different results.

【0007】[0007]

【発明が解決しようとする課題】上述したとうり従来の
技術によると、同じ意味内容のことを表現する場合でも
オペレーターにより(同じオペレーターであってもその
時により)検索用として入力するキーワードが異なるこ
とがあるため、取り出したい情報が実際データベースに
存在するにもかかわらず、検索もれが生じるという問題
点があった。
According to the conventional technique described above, even when expressing the same meaning, the operator inputs different keywords (even if the same operator is used) for searching. Therefore, there is a problem that the search may be missed even though the information to be retrieved actually exists in the database.

【0008】本発明の目的は、データを複数の利用者が
共用できるように計算機処理のできる統合したデータベ
ースとして登録し、各種情報をキーワード化して、この
キーワードにより検索するデータベース管理システムに
おいて、あらかじめ考えられうるキーワードとその同意
語を1つの代表語に対応させた代表語辞書を持ち、登録
・検索処理の際オペレーターから入力されたキーワード
を一定の変換規則により変換して統一後、代表語辞書に
定義されている代表語に置き換えて文献データの登録及
びデータベースの検索をすることにより、検索ヒット率
の高いデータベースの登録・検索装置を提供することに
ある。
An object of the present invention is to preliminarily consider a database management system in which data is registered as an integrated database that can be processed by a computer so that a plurality of users can share it, various information is converted into keywords, and retrieval is performed by using these keywords. It has a representative word dictionary in which possible keywords and their synonyms correspond to one representative word, and the keywords input by the operator during the registration / search process are converted according to a certain conversion rule and unified, and then converted into the representative word dictionary. It is an object of the present invention to provide a database registration / search device having a high search hit rate by registering document data and searching the database by replacing the defined representative word.

【0009】[0009]

【課題を解決するための手段】上記目的を達成するため
に第一の発明では、データを複数の利用者が共用できる
ように計算機処理のできる統合したデータベースとして
登録し、各種情報をキーワード化して、このキーワード
により検索するデータベース管理システムにおいて、オ
ペレーターの入力したキーワード文字列の些細な違いの
統一と、誤入力しがちな文字を一定の変換規則により変
換統一するキーワード変換手段と、オペレーターが入力
するキーワードとして考えうる言葉とその同意語を前記
キーワード変換手段により統一し、キーワードとしてま
とめ、1つの代表語に対応させて代表語辞書に定義登録
する代表語登録手段と、前記代表語登録手段により、定
義登録した代表語辞書内に、前記キーワード変換手段に
より統一されたキーワードが定義されているか否か探
し、このキーワードに対応した代表語を抽出する代表語
決定手段と、前記代表語登録手段により代表語辞書に新
規に代表語を登録した際すでに登録済みの補助記憶装置
のデータベース内データに新規登録の代表語を対応させ
るために、データに内在するキーワードを、すべて前記
代表語決定手段により抽出された代表語に置き換え、補
助記憶装置のデータベースに書き込むデータ登録手段
と、データベースにすでに登録済みのデータを検索する
ために、変換統一後のキーワードを前記代表語決定手段
により抽出された代表語に置き換えて、検索キーワード
として補助記憶装置のデータベース内を検索するデータ
検索手段とで構成される。
To achieve the above object, in the first invention, data is registered as an integrated database that can be processed by a computer so that a plurality of users can share it, and various information is converted into keywords. , In the database management system that searches with this keyword, unification of minor differences in the keyword character string input by the operator and keyword conversion means for unifying characters that are apt to be mis-input by a certain conversion rule, and operator input A word that can be considered as a keyword and its synonym are unified by the keyword conversion means, collected as a keyword, a representative word registration means for defining and registering one representative word in a representative word dictionary, and the representative word registration means, The key word unified by the keyword conversion means is stored in the registered representative word dictionary. Representative word determining means for searching whether a word is defined and extracting a representative word corresponding to this keyword, and auxiliary memory already registered when the representative word is newly registered in the representative word dictionary by the representative word registering means. In order to make the newly registered representative word correspond to the data in the database of the device, all the keywords existing in the data are replaced with the representative word extracted by the representative word determination means, and the data registration means writes the data in the database of the auxiliary storage device. , A data search means for searching the data already registered in the database, replacing the keyword after conversion and unification with the representative word extracted by the representative word determining means, and searching the database of the auxiliary storage device as the search keyword Composed of and.

【0010】また第二の発明は、前記第一の発明におい
て、オペレーターが入力したキーワード内に、ピリオ
ド、スペース、小文字、長音、ハイフンがある場合、所
定の変換規則により変換統一することにより、オペレー
ターの入力文字列の些細な違いの統一と誤入力しがちな
文字の修正をするキーワード変換手段とで構成される。
In a second invention, in the first invention, when a keyword entered by an operator includes a period, a space, a lowercase letter, a long sound, and a hyphen, the operators are unified by a predetermined conversion rule. And a keyword conversion means for correcting characters that are apt to be erroneously input.

【0011】また第三の発明は、前記第一の発明におい
て、新規に補助記憶装置のデータベースにデータを登録
する場合、登録するデータに内在するオペレーター入力
のキーワードを、前記代表語決定手段により抽出された
代表語に置き換え、データベースに書き込むデータ登録
手段とで構成される。
According to a third aspect of the invention, in the first aspect of the invention, when the data is newly registered in the database of the auxiliary storage device, the operator input keyword contained in the data to be registered is extracted by the representative word determining means. It is composed of a data registration unit which replaces the representative word and writes it in the database.

【0012】[0012]

【作用】検索用キーワードとしての複数の同意語を1つ
の代表語に対応定義した代表語辞書を代表語登録手段に
より作成しておき、実際にオペレータがデータベースに
データを登録あるいは検索する際に、オペレーターが最
も入力ミスを生じやすいピリオド、スペース、小文字、
長音(ー)、ハイフン(−)等をキーワード変換手段に
より、5つの変換規則で変換統一する。この変換統一さ
れたキーワードによって代表語が代表語辞書に定義され
ているか否か探し、抽出する。
[Function] A representative word dictionary in which a plurality of synonyms as search keywords are defined corresponding to one representative word is created by the representative word registration means, and when the operator actually registers or searches data in the database, Periods, spaces, lowercase letters,
The long sound (-), hyphen (-), etc. are converted and unified by five conversion rules by the keyword conversion means. Whether or not the representative word is defined in the representative word dictionary by the converted and unified keyword is searched and extracted.

【0013】データベースに新たに文献を登録する場合
は、データ登録手段が文献データに内在するオペレータ
指定のキーワードを探し、すべて代表語決定手段により
抽出された代表語に置き換えて登録する。また、代表語
辞書に新たに情報を追加(キーワード・代表語)した場
合は、すでにデータベースに登録されているすべての文
献データに内在するオペレータ指定の新規に追加された
キーワードを代表語辞書に定義した代表語に置き換えて
登録しなおす。
In the case of newly registering a document in the database, the data registration means searches for a keyword designated by the operator in the document data, and replaces it with the representative word extracted by the representative word determining means and registers it. When new information is added to the representative word dictionary (keyword / representative word), the newly added keyword specified by the operator and existing in all document data already registered in the database is defined in the representative word dictionary. Replace it with the representative word and register again.

【0014】データベースにすでに登録されている文献
データを検索する場合は、前記代表語決定手段により抽
出された代表語を検索キーワードとして、データベース
内を検索する。
When searching the document data already registered in the database, the database is searched using the representative word extracted by the representative word determining means as a search keyword.

【0015】[0015]

【実施例】以下、書籍及び論文等の文献を収集してデー
タベースとして登録し、かつキーワードにより検索する
場合の処理を本発明の一実施例とし、図1を参照しなが
ら全体構成を説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS A process for collecting documents such as books and papers, registering them as a database, and searching by a keyword is an embodiment of the present invention, and the overall configuration will be described with reference to FIG.

【0016】1は検索用のキーワードや登録するデータ
を入力をしたり、実際に検索したデータや検索結果を画
面出力するための入出力装置であり、2はこの入出力装
置1から入力を受け付けるための入力制御手段、3は入
出力装置1にデータを出力するための出力制御手段であ
る。4は入力されたキーワードを5つの変換規則により
変換統一するキーワード変換手段である(変換規則につ
いての詳細は後述)。5は、補助記憶装置に保管されて
いる、キーワード一つ一つに対する代表語を定義登録し
ておく代表語辞書6を管理する代表語管理手段で、この
代表語管理手段5は、新たにキーワード及び代表語を代
表語辞書6に定義登録するための代表語登録手段51
と、前記代表語辞書6内に指定のキーワードに対応する
代表語があるかどうかを検索し、対応する代表語を取り
出す代表語決定手段52で構成される。7は、文献デー
タに内在するキーワードを前記代表語決定手段52によ
り抽出された代表語に置き換えてから各文献データを補
助記憶装置のデータベース8に書き込むデータ登録手段
である。9は、オペレーターが検索用に入力したキーワ
ードを前記キーワード変換手段4により変換統一後、前
記代表語決定手段52により抽出された代表語に置き換
えられた、検索キーワードでデータベース8内の該当デ
ータを探し出すデータ検索手段である。
Reference numeral 1 is an input / output device for inputting a keyword for search and data to be registered, and for actually outputting the searched data and search results on a screen. Reference numeral 2 is an input from the input / output device 1. Is an output control means for outputting data to the input / output device 1. Reference numeral 4 is a keyword conversion means for converting and unifying the inputted keywords by five conversion rules (details of the conversion rules will be described later). Reference numeral 5 is a representative word managing means for managing a representative word dictionary 6 for storing and defining a representative word for each keyword, which is stored in the auxiliary storage device. And a representative word registering means 51 for registering and defining the representative word in the representative word dictionary 6.
And a representative word determining means 52 for searching the representative word dictionary 6 for a representative word corresponding to the designated keyword and extracting the corresponding representative word. Reference numeral 7 is a data registration means for replacing each keyword contained in the document data with the representative word extracted by the representative word determining means 52 and then writing each document data in the database 8 of the auxiliary storage device. Reference numeral 9 finds the corresponding data in the database 8 with the search keyword, which is obtained by replacing the keyword input by the operator for searching by the keyword converting means 4 and replacing it with the representative word extracted by the representative word determining means 52. It is a data search means.

【0017】次に、図2のキーワード変換規則表を用い
て、5つの変換規則について説明する。1はオペレータ
ーが入力したキーワードにピリオドが存在する場合、2
はオペレーターが入力したキーワードにスペースが存在
する場合、3はオペレーターが入力したキーワードに小
文字が存在する場合、4はオペレーターが入力したキー
ワードに長音(ー)が存在する場合、5はオペレーター
が入力したキーワードにハイフン(−)が存在する場合
についての変換規則である。
Next, five conversion rules will be described with reference to the keyword conversion rule table of FIG. 1 if the operator entered a keyword with a period 2
Indicates that there is a space in the keyword entered by the operator, 3 indicates that the keyword entered by the operator has lowercase letters, 4 indicates that the keyword entered by the operator has a long sound (-), and 5 indicates that the operator entered This is a conversion rule when a hyphen (-) is present in the keyword.

【0018】5つの変換規則のうち1〜3は、オペレー
ター個人個人の表記の違いを最小限にして、単なる文字
列の些細な違いによるキーワードの同意語まで代表語辞
書6に登録しなくても検索もれが生じないようにするた
めのものである。
Among the five conversion rules, 1 to 3 minimize the difference in the notation of each operator and do not have to register the synonyms of the keywords in the representative word dictionary 6 due to the slight difference in the character strings. This is to prevent search omissions.

【0019】例えば、キーワードとして“ユウ エス
エー”を表記(入力)するのに、オペレーターAが“U
SA”、オペレーターBが“U.S.A.”、オペレー
ターCが“U S A”オペレーターDが“u.s.
a.”と入力した場合、オペレーターBの入力は変換規
則1、オペレーターCの入力は変換規則2、オペレータ
ーDの入力は変換規則1と変換規則3をもとに変換さ
れ、変換後はすべてオペレーターAの入力と同じ“US
A”に統一される。この3つの変換規則で変換すること
により、無駄な代表語登録と単なる表記の違いによる検
索洩れを防ぐことができる。
For example, as a keyword,
Operator A writes "U"
SA ", operator B" U. S. A. ", Operator C is" U SA ", operator D is" u. s.
a. ", The input of operator B is converted based on conversion rule 1, the input of operator C is based on conversion rule 2, and the input of operator D is based on conversion rule 1 and conversion rule 3. Same as input "US
It is unified to A ". By performing conversion with these three conversion rules, it is possible to prevent unnecessary representative word registration and omission of search due to simple difference in notation.

【0020】変換規則の4、5は、オペレーターの入力
ミスを最小限にするためのものである。一般的にハイフ
ン(−)と長音(ー)は同一のものと間違われやすく、
オペレーターはハイフン(−)と長音(ー)の使い分け
をせずに(無意識に)、入力してしまう場合が多い。人
間の目で確かめる場合はハイフン(−)も長音(ー)も
変わりないため問題ない。しかしコンピュータによる情
報検索処理の場合は、すべて内部コードで行われるた
め、コード番号が違えば、まったく違う言葉を入力した
場合と同じ扱いになってしまう。
The conversion rules 4 and 5 are for minimizing the operator's input error. Generally, hyphen (-) and long sound (-) are easily mistaken for the same thing,
The operator often inputs the hyphen (-) and the long sound (-) without distinguishing them (unconsciously). When checking with the human eye, there is no problem because neither hyphen (-) nor long tone (-) changes. However, in the case of information retrieval processing by a computer, since it is all performed by an internal code, if the code number is different, it will be treated as if a completely different word was input.

【0021】例えば、日本工業規格(JIS)漢字コー
ド表でみると、ハイフン(−)と長音(ー)は、それぞ
れ、コード番号“0161”、コード番号“0128”
であるので、ヨーロッパを表現するのに、“ヨ−(ハイ
フン)ロッパ”はコード番号で表現すると、“051
0,0161,0577,0535,0549”とな
り、“ヨー(長音)ロッパ”は、“0510,012
8,0577,0535,0549”となる。“ヨー
(長音)ロッパ”で記載されたデータが登録されている
データベース8を検索キーワード“ヨ−(ハイフン)ロ
ッパ”で検索処理を実行すると、検索キーワード“ヨ−
(ハイフン)ロッパ”に該当するデータは存在しないと
いう結果になってしまう。このように無意識に入力され
たハイフン(−)と長音(ー)を変換規則4、5をもと
に修正することにより、“ヨ−(ハイフン)ロッパ”と
“ヨー(長音)ロッパ”は、“ヨー(長音)ロッパ”に
統一できるため、紛らわしいハイフン(−)と長音
(ー)の入力ミスによる検索洩れを防ぐことができる。
For example, in the Japanese Industrial Standard (JIS) Kanji code table, hyphen (-) and chorus (-) are code number "0161" and code number "0128", respectively.
Therefore, to express Europe, "yo (hyphen) roppa" is expressed as a code number, "051
0,0161,0577,0535,0549 "and" Yaw (long sound) Loppa "is" 0510,012
8,0577,0535,0549 ". When the search process is executed with the search keyword" Yo (hyphen) Roppa "in the database 8 in which the data described in" Yo (long sound) Roppa "is registered, the search keyword "Yo
The result is that there is no data that corresponds to "(hyphen) Loppa". By correcting the hyphen (-) and the long sound (-) that were unintentionally input in this way based on conversion rules 4 and 5, , "Yo (hyphen) Roppa" and "Yo (long sound) Roppa" can be unified as "Yo (long sound) Roppa", so it is possible to prevent omission of search due to misleading hyphen (-) and long sound (-) input errors. You can

【0022】つぎに、データベース8へのデータ登録処
理、データベース8内のデータ検索処理及び代表語辞書
6への登録処理を前述した図2、図3の登録・検索処理
の流れ、図4の代表語辞書例1、図5の代表語辞書例2
を参照しながら実際の処理の流れを説明する。
Next, the data registration processing in the database 8, the data retrieval processing in the database 8 and the registration processing in the representative word dictionary 6 described above, the flow of the registration / retrieval processing in FIGS. 2 and 3 and the representative in FIG. Word dictionary example 1, representative word dictionary example 2 in FIG.
The actual processing flow will be described with reference to.

【0023】まず第一に、オペレーターが入力したキー
ワードを変換規則により変換統一後、対応する代表語が
代表語辞書6に定義されている場合の検索処理の実施例
を示す。
First of all, an embodiment of a search process in the case where a keyword input by an operator is converted and unified by a conversion rule and then a corresponding representative word is defined in the representative word dictionary 6 will be described.

【0024】オペレーターは検索キーワードとする言葉
「U.S.A.」をキーワードとして、入出力装置1か
ら入力する(S1)。入出力装置1からキーワードを受
け付けた入力制御手段2は、キーワード変換手段4に処
理を渡す。キーワード変換手段4は、変換規則表(図
2)内の5つの変換規則に従って入力されたキーワード
「U.S.A.」を変換していく。入力されたキーワー
ド「U.S.A.」の場合、図2のキーワード変換規則
表の変換規則1の「ピリオドが存在する場合は、ピリオ
ドを取って詰める。」に該当するので(S2)、「US
A」に変換する(S3)。その他の変換規則(2〜5)
には該当しないため、変換後キーワードは「USA」と
して、代表語管理手段5に渡される。
The operator inputs from the input / output device 1 using the word "U.S.A." as a search keyword as a keyword (S1). The input control means 2 that has received the keyword from the input / output device 1 passes the processing to the keyword conversion means 4. The keyword converting means 4 converts the keyword “U.S.A.” input according to the five conversion rules in the conversion rule table (FIG. 2). In the case of the inputted keyword "U.S.A.", it corresponds to "If a period exists, the period is taken and packed." In the conversion rule 1 of the keyword conversion rule table of FIG. 2 (S2), "US
A ”(S3). Other conversion rules (2-5)
Therefore, the converted keyword is passed to the representative word managing means 5 as “USA”.

【0025】代表語管理手段5は、補助記憶装置のあら
かじめ定義登録済みの代表語辞書6を読み込み(S1
2)、代表語決定手段51が変換後キーワード「US
A」が代表語辞書6に定義されているか否か探す(S1
3)。図4の代表語辞書例1の「USA」(K1)の欄
には「アメリカ」(D1)が代表語として定義されてい
るため、「アメリカ」を代表語として取り出す(S1
4)。この様にして決定した代表語は、データ検索手段
9内に検索キーワードとして渡される。データ検索手段
9は、情報が登録されているデータベース8を補助記憶
装置から読み込む(S16)。データベース8の検索処
理指定を指定して(S17)、データベース8に対し、
代表語「アメリカ」を検索キーワードとして検索する
(S18)。該当する文献データが存在する場合は、該
当データを読み込み、出力制御手段3に指令してデータ
を入出力装置1に出力する(S19)。この時、該当す
る文献データが存在しなければ、出力制御手段3に指令
して、該当情報なしの旨、入出力装置1に表示する(S
20)。
The representative word management means 5 reads the representative word dictionary 6 whose definition is registered in the auxiliary storage device (S1).
2), the representative word determining means 51 causes the converted keyword "US"
It is searched whether or not "A" is defined in the representative word dictionary 6 (S1).
3). Since "USA" (D1) is defined as a representative word in the column "USA" (K1) of the representative word dictionary example 1 in FIG. 4, "America" is taken out as a representative word (S1).
4). The representative word determined in this way is passed as a search keyword to the data search means 9. The data search means 9 reads the database 8 in which information is registered from the auxiliary storage device (S16). Specifying the search processing designation of the database 8 (S17),
The representative word "America" is searched as a search keyword (S18). If the relevant document data exists, the relevant data is read and the output control means 3 is instructed to output the data to the input / output device 1 (S19). At this time, if there is no corresponding document data, the output control means 3 is instructed to display on the input / output device 1 that there is no corresponding information (S).
20).

【0026】第二に、オペレーターが入力したキーワー
ドを変換規則により変換統一後対応する代表語が代表語
辞書6に定義されていない場合の検索処理の実施例を示
す。
Secondly, an embodiment of the retrieval process in the case where the corresponding representative word is not defined in the representative word dictionary 6 after conversion and unification of the keyword input by the operator according to the conversion rule is shown.

【0027】オペレーターは検索キーワードとする言葉
「United State ofAmerica」を
キーワードとして入出力装置1から入力する(S1)。
入出力装置1からキーワードを受け付けた入力制御手段
2はキーワード変換手段4に処理を渡す。キーワード変
換手段4は、変換規則表(図2)内の5つの変換規則に
従って、入力されたキーワード「United Sta
te of America」を変換していく。入力さ
れたキーワード「United Stateof Am
erica」の場合、図2のキーワード変換規則表の変
換規則2の「スペースが存在する場合は、スペースを詰
める。」(S4)と、変換規則3の「小文字が存在する
場合は、すべて大文字にする。」(S6)に該当するの
で、「UNITEDSTATEOFAMERICA」に
変換する(S5、S7)。その他の変換規則(1,4,
5)には該当しないため、変換後キーワードは「UNI
TEDSTATEOFAMERICA」として、代表語
管理手段5に渡される。
The operator inputs a word "United State of America" as a search keyword from the input / output device 1 as a keyword (S1).
The input control means 2 that has received the keyword from the input / output device 1 passes the processing to the keyword conversion means 4. The keyword conversion means 4 follows the five conversion rules in the conversion rule table (FIG. 2) to input the keyword “United Sta”.
te of America ”. Entered keyword "United State of Am
In the case of "erica", the conversion rule 2 of the keyword conversion rule table of FIG. 2 is "If there is a space, pad the space." (S4) and the conversion rule 3 is "If there is a lower case character, all are capitalized." Yes. ”(S6), so it is converted to“ UNITED STATE OF AMERICA ”(S5, S7). Other conversion rules (1, 4,
Since it does not correspond to 5), the keyword after conversion is "UNI
"TEDSTATE OF AMERICA" is passed to the representative word managing means 5.

【0028】代表語管理手段5は、補助記憶装置のあら
かじめ定義済みの代表語辞書6を読み込み(S12)、
代表語決定手段52が、渡された変換後キーワード「U
NITEDSTATEOFAMERICA」が代表語辞
書6に定義されているか否か探す(S13)。図4の代
表語辞書例1によると、該当するものが存在しないが、
変換前キーワードは代表語辞書6に登録しないので(S
21)、変換前のキーワード(オペレーターが入力した
ままのキーワードを指すため、「UnitedStat
e of America」)を検索キーワードとして
設定し、データ検索手段9に渡す(S15)。データ検
索手段9は、情報が登録されているデータベース8を補
助記憶装置から読み込む(S16)。データベース8の
検索処理を指定して(S17)、データベース8を検索
し(S18)、代表語変換前キーワードに該当する文献
データが存在する場合は、該当データを読み込み、出力
制御手段3に指令して、データを入出力装置1に出力す
る(S19)。この時、該当する文献データが存在しな
ければ、出力制御手段3に指令して該当情報なしの旨、
入出力装置1に表示する(S20)。
The representative word managing means 5 reads the previously defined representative word dictionary 6 in the auxiliary storage device (S12),
The representative word determination means 52 sends the converted keyword “U
It is searched whether or not "NITED STATE OF AMERICA" is defined in the representative word dictionary 6 (S13). According to the representative word dictionary example 1 in FIG. 4, there is no corresponding word,
The keyword before conversion is not registered in the representative word dictionary 6 (S
21), the keyword before conversion (because it indicates the keyword entered by the operator, "UnitedStat"
e of America ") is set as a search keyword and is passed to the data search means 9 (S15). The data search means 9 reads the database 8 in which information is registered from the auxiliary storage device (S16). The search process of the database 8 is designated (S17), the database 8 is searched (S18), and if there is document data corresponding to the keyword before representative word conversion, the corresponding data is read and the output control means 3 is instructed. Then, the data is output to the input / output device 1 (S19). At this time, if there is no corresponding document data, the output control means 3 is instructed that there is no corresponding information,
It is displayed on the input / output device 1 (S20).

【0029】第三に、代表語辞書6に新規に代表語及び
キーワードを登録する場合の処理の実施例を示す。
Thirdly, an embodiment of processing for newly registering a representative word and a keyword in the representative word dictionary 6 will be shown.

【0030】オペレーターは、代表語辞書6に登録する
キーワードと代表語を入出力装置1から入力する。入出
力装置1からキーワード「ヨ−(ハイフン)ロッパ」及
び代表語「欧州」を受け付けた入力制御手段2は、変換
規則表(図2)内の5つの変換規則に従って、入力され
たキーワード「ヨ−(ハイフン)ロッパ」を変換してい
く。入力されたキーワード「ヨ−(ハイフン)ロッパ」
の場合、図2のキーワード変換規則表の変換規則3の
「小文字が存在する場合は、すべて大文字にする。」
(S6)と、変換規則5の「カナ文字のあとのハイフン
(−)は長音(ー)にする。」(S10)に該当するの
で、それぞれの条件から「ヨー(長音)ロツ(大文字)
パ」に変換する(S7,S11)。その他の変換規則
(1,2,4)には該当しないため、代表語「欧州」に
対応するキーワードとして「ヨー(長音)ロツパ」が代
表語管理手段5に渡される。
The operator inputs keywords and representative words to be registered in the representative word dictionary 6 from the input / output device 1. The input control means 2, which has received the keyword “yo (hyphen) lopper” and the representative word “Europe” from the input / output device 1, follows the five conversion rules in the conversion rule table (FIG. 2). -(Hyphen) Loppa "will be converted. Entered keyword "Yo (hyphen) Roppa"
In the case of, the conversion rule 3 of the keyword conversion rule table of FIG.
(S6) and the conversion rule 5 "Hyphen (-) after kana character is changed to long sound (-)." (S10) correspond to "yaw (long sound) rots (upper case)" from each condition.
It is converted to "P" (S7, S11). Since it does not correspond to the other conversion rules (1, 2, 4), "yaw (long sound) rotpa" is passed to the representative word management means 5 as a keyword corresponding to the representative word "Europe".

【0031】代表語管理手段5は、補助記憶装置のあら
かじめ定義済みの代表語辞書6を読み込み(S12)、
すでに代表語辞書内に登録されているか否か検索する
(S13)。図4の代表語辞書例1には登録されていな
いので(S21)、代表語辞書登録手段51に処理を渡
す。代表語登録手段51は、渡された変換後キーワード
「ヨーロツパ」及び、代表語「欧州」を代表語辞書6に
登録する(S22)。登録されると、代表語辞書6は、
図5の代表語辞書例2に示すように更新される(K3,
D3)。
The representative word managing means 5 reads the previously defined representative word dictionary 6 in the auxiliary storage device (S12),
It is searched whether or not it is already registered in the representative word dictionary (S13). Since it is not registered in the representative word dictionary example 1 in FIG. 4 (S21), the processing is passed to the representative word dictionary registration means 51. The representative word registering means 51 registers the passed converted keyword "Europe" and the representative word "Europe" in the representative word dictionary 6 (S22). Once registered, the representative language dictionary 6,
It is updated as shown in the representative word dictionary example 2 of FIG. 5 (K3.
D3).

【0032】新規に代表語辞書6にキーワード及び代表
語が登録されたので、データベース8にすでに登録され
ている文献データを検索する際にも新たに登録された代
表語で対応できるようにするため、データベース登録手
段7により、データベース8を読み込む(S16)。登
録処理を指定して(S17)かつ代表語辞書の更新あり
なので(S23)、データベース8内に存在する、新規
登録の代表語に対応するキーワードをすべて代表語に置
き換え(S24)、補助記憶装置のデータベース8に書
き込む(S25)。
Since the keyword and the representative word are newly registered in the representative word dictionary 6, the newly registered representative word can be used when searching the document data already registered in the database 8. The database 8 is read by the database registration means 7 (S16). Since the registration process is designated (S17) and the representative word dictionary is updated (S23), all the keywords corresponding to the newly registered representative word existing in the database 8 are replaced with the representative word (S24), and the auxiliary storage device is stored. The data is written in the database 8 (S25).

【0033】第四に、データベース8に新規に文献デー
タを登録する場合の処理の実施例を示す。
Fourthly, an embodiment of processing for newly registering document data in the database 8 will be shown.

【0034】オペレーターはデータベース8に登録する
文献データと、検索キーワードとするべきキーワード
「米国」を入出力装置1から入力する(S1)。入出力
装置1からキーワードを受け付けた入力制御手段2はキ
ーワード変換手段4に処理を渡し、キーワード変換手段
4は、変換規則表(図2)内の5つの変換規則に従っ
て、入力されたキーワード「米国」を変換していく。入
力されたキーワード「米国」の場合、図2のキーワード
変換規則表の変換規則(1〜5)には該当しないため、
変換後キーワードは「米国」のまま、代表語管理手段5
に渡される。
The operator inputs the document data to be registered in the database 8 and the keyword "US" to be used as a search keyword from the input / output device 1 (S1). The input control means 2 that has received the keyword from the input / output device 1 passes the processing to the keyword conversion means 4, and the keyword conversion means 4 follows the five conversion rules in the conversion rule table (FIG. 2) to input the input keyword “US”. Will be converted. In the case of the input keyword “US”, it does not correspond to the conversion rules (1 to 5) in the keyword conversion rule table of FIG.
After conversion, the keyword remains "US" and the representative word management means 5
Passed to.

【0035】代表語管理手段5は、補助記憶装置のあら
かじめ定義済みの代表語辞書6を読み込み(S12)、
渡された変換後キーワード「米国」が代表語辞書6に定
義されているか否か探す(S13)。図4の代表語辞書
例1によると、代表語辞書6の「米国」(K2)の欄に
は「アメリカ」(D2)が代表語として定義されている
ため、「アメリカ」を取り出す(S14)。
The representative word management means 5 reads the previously defined representative word dictionary 6 in the auxiliary storage device (S12),
It is searched whether or not the passed keyword “US” after conversion is defined in the representative word dictionary 6 (S13). According to the representative word dictionary example 1 in FIG. 4, “America” (D2) is defined as a representative word in the “US” (K2) column of the representative word dictionary 6, so “America” is taken out (S14). ..

【0036】次にデータ登録手段7が、データベース8
を読み込む(S16)。新規データ登録処理を指定して
(S17)、代表語辞書6の更新はないので(S2
3)、新規登録文献データ内の「米国」をすべて代表語
の「アメリカ」に置き換えて(S26)、補助記憶装置
のデータベース8にデータを書き込む(S25)。
Next, the data registration means 7 uses the database 8
Is read (S16). Since the new data registration process is designated (S17) and the representative word dictionary 6 is not updated (S2)
3) All "US" in the newly registered document data is replaced with the representative word "US" (S26), and the data is written in the database 8 of the auxiliary storage device (S25).

【0037】以上本実施例は、文献データのデータベー
ス登録及びデータ検索の例で説明したが、その他の例と
して、会社情報検索システムや地図情報検索システム等
で実現可能である。
The present embodiment has been described with reference to the example of database registration and data retrieval of document data, but as other examples, it can be realized by a company information retrieval system or a map information retrieval system.

【0038】[0038]

【発明の効果】以上のように、情報検索用キーワードと
その同意語のキーワードを複数収集しそれら同意語の代
表語を定義した代表語辞書を設けることにより、自己が
通常使用している言葉をキーワードとして入力しても、
代表語辞書にて代表語に変換されるので、キーワード選
択に神経を使わず、検索効率の向上がはかれる。
As described above, by collecting a plurality of information retrieval keywords and their synonymous keywords and providing a representative word dictionary that defines the synonyms of the synonymous words, the words normally used by oneself can be defined. Even if you enter it as a keyword,
Since it is converted into a representative word in the representative word dictionary, the search efficiency can be improved without using nerves for keyword selection.

【0039】また、キーワードを入力する際のキー操作
において、オペレーターにより入力ミスを生じやすいピ
リオド、スペース、小文字、長音(ー)、ハイフン
(−)等は、キーワード変換手段を設けたことにより、
仮に誤って入力してもこの変換手段が統一するためキー
操作に神経を使う必要がなく、入力操作の効率の向上が
はかれ、さらに検索時の入力の違いによる認識違いもな
くなる。
Further, in the key operation when inputting a keyword, the period, the space, the lowercase letter, the long sound (-), the hyphen (-), etc., which are likely to cause an input error by the operator, are provided with the keyword converting means.
Even if an erroneous input is made, since the conversion means are unified, it is not necessary to use the nerve for the key operation, the efficiency of the input operation is improved, and the recognition difference due to the input difference at the time of retrieval is also eliminated.

【0040】よって本発明によれば、検索ヒット率の高
いデータベースの登録・検索装置を実現することができ
る。
Therefore, according to the present invention, it is possible to realize a database registration / search device having a high search hit rate.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明の全体構成図、FIG. 1 is an overall configuration diagram of the present invention,

【図2】 キーワード変換規則表、FIG. 2 is a keyword conversion rule table,

【図3】 登録・検索処理の流れ、[Figure 3] Flow of registration / search processing,

【図4】 代表語辞書例1、FIG. 4 is a representative word dictionary example 1,

【図5】 代表語辞書例2、FIG. 5 is a representative word dictionary example 2,

【図6】 従来のデータベース登録・検索装置。FIG. 6 is a conventional database registration / search device.

【符号の説明】[Explanation of symbols]

1 ・・・入出力装置、 2 ・・・入力制御手段、 3 ・・・出力制御手段、 4 ・・・キーワード変換手段、 5 ・・・代表語管理手段、 51・・・代表語登録手段、 52・・・代表語決定手段、 6 ・・・代表語辞書、 7 ・・・データ登録手段、 8 ・・・データベース、 9 ・・・データ検索手段。 1 ... Input / output device, 2 ... Input control means, 3 ... Output control means, 4 ... Keyword conversion means, 5 ... Representative word management means, 51 ... Representative word registration means, 52 ... Representative word determining means, 6 ... Representative word dictionary, 7 ... Data registering means, 8 ... Database, 9 ... Data searching means.

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】データを複数の利用者が共用できるように
各種情報データを収納した補助記憶装置のデータベース
を計算機処理できるようにデータベースに登録し、各種
情報をキーワード化して、このキーワードにより検索す
るデータベース管理システムにおいて、 オペレーターの入力した文字列の統一と、誤入力しがち
な文字の修正のために、入力キーワードを一定の変換規
則により変換統一するキーワード変換手段と、オペレー
ターが入力するキーワードとその同意語を前記キーワー
ド変換手段により統一し、キーワードとしてまとめ、1
つの代表語に対応させて代表語辞書に定義登録する代表
語登録手段と、 前記代表語登録手段により、定義登録した代表語辞書内
に、前記キーワード変換手段により統一されたキーワー
ドが定義されているか否か探し、このキーワードに対応
した代表語を抽出する代表語決定手段と、 前記代表語登録手段により代表語辞書に新規に代表語を
登録した際すでに登録済みの補助記憶装置のデータベー
ス内データに新規登録の代表語を対応させるために、デ
ータに内在するキーワードを、すべて前記代表語決定手
段により抽出された代表語に置き換え、補助記憶装置の
データベースに書き込むデータ登録手段と、 データベースにすでに登録済みのデータを検索するため
に、変換統一後のキーワードを前記代表語決定手段によ
り抽出された代表語に置き換えて、検索キーワードとし
て補助記憶装置のデータベース内を検索するデータ検索
手段とを備えたことを特徴とするデータベースの登録・
検索装置。
1. A database of an auxiliary storage device storing various kinds of information data so that the data can be shared by a plurality of users is registered in the database so that it can be processed by a computer, various kinds of information are converted into keywords, and retrieval is performed by using these keywords. In the database management system, in order to unify the character strings input by the operator and correct the characters that are apt to be erroneously input, the keyword conversion means for converting and unifying the input keywords according to a certain conversion rule, and the keyword and the operator input Synonyms of the synonyms are unified by the keyword conversion means, and are summarized as keywords. 1
Representative word registering means for defining and registering in the representative word dictionary corresponding to one representative word, and whether the unified keyword defined by the keyword converting means is defined in the representative word dictionary registered and defined by the representative word registering means. A representative word determining means for searching for a representative word corresponding to the keyword, and a representative word registering means for storing the data in the database of the auxiliary storage device already registered when the representative word is newly registered in the representative word dictionary. In order to correspond to the newly registered representative word, all the keywords existing in the data are replaced with the representative word extracted by the representative word determination means, and the data registration means is written in the database of the auxiliary storage device and already registered in the database. In order to search the data of the above, the keyword after conversion and unification is placed in the representative word extracted by the representative word determining means. Instead, the registration and the database, characterized in that a data retrieval means for retrieving a database of auxiliary storage device as a search keyword
Search device.
【請求項2】オペレーターが入力したキーワード内に、
ピリオド、スペース、小文字、長音、ハイフンがある場
合、所定の変換規則により変換統一することにより、オ
ペレーターの入力文字列の統一と、誤入力しがちな文字
の修正をするキーワード変換手段とを備えたことを特徴
とする請求項1のデータベースの登録・検索装置。
2. In the keyword entered by the operator,
When there are periods, spaces, lowercase letters, long tones, and hyphens, it is possible to unify the input string of the operator by unifying the conversion according to the predetermined conversion rules, and the keyword conversion means for correcting the characters that are apt to be input incorrectly The database registration / retrieval device according to claim 1.
【請求項3】新規に補助記憶装置のデータベースにデー
タを登録する場合、登録するデータに内在するオペレー
ター入力のキーワードを、前記代表語決定手段により抽
出された代表語に置き換え、データベースに書き込むデ
ータ登録手段とを備えたことを特徴とする請求項1のデ
ータベースの登録・検索装置。
3. When data is newly registered in the database of the auxiliary storage device, operator-entered keywords existing in the data to be registered are replaced with representative words extracted by the representative word determining means, and data is written in the database. The database registration / retrieval device according to claim 1, further comprising means.
JP4082984A 1992-03-06 1992-03-06 Registering and retrieving device for data base Pending JPH05250416A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4082984A JPH05250416A (en) 1992-03-06 1992-03-06 Registering and retrieving device for data base

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4082984A JPH05250416A (en) 1992-03-06 1992-03-06 Registering and retrieving device for data base

Publications (1)

Publication Number Publication Date
JPH05250416A true JPH05250416A (en) 1993-09-28

Family

ID=13789485

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4082984A Pending JPH05250416A (en) 1992-03-06 1992-03-06 Registering and retrieving device for data base

Country Status (1)

Country Link
JP (1) JPH05250416A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09101964A (en) * 1995-10-06 1997-04-15 Ricoh Co Ltd Device and method for retrieving data
JPH09114839A (en) * 1995-10-19 1997-05-02 Fuji Xerox Co Ltd Keyword controller
JP2006501529A (en) * 2001-12-28 2006-01-12 ジェフリー ジェームズ ジョナス, Real-time data storage
WO2007114481A1 (en) * 2006-03-31 2007-10-11 Hideo Sunaga Communication system
JP2008102845A (en) * 2006-10-20 2008-05-01 Sony Corp Information processing apparatus, method, and program
KR20200046446A (en) * 2018-10-24 2020-05-07 한국전자통신연구원 Similar patent search method and apparatus using alignment of elements

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5464445A (en) * 1977-10-31 1979-05-24 Fujitsu Ltd Information retrieval system
JPS5464446A (en) * 1977-10-31 1979-05-24 Fujitsu Ltd Information processing system for japanese word
JPS63249267A (en) * 1987-04-03 1988-10-17 Canon Inc Electronic filing system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5464445A (en) * 1977-10-31 1979-05-24 Fujitsu Ltd Information retrieval system
JPS5464446A (en) * 1977-10-31 1979-05-24 Fujitsu Ltd Information processing system for japanese word
JPS63249267A (en) * 1987-04-03 1988-10-17 Canon Inc Electronic filing system

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09101964A (en) * 1995-10-06 1997-04-15 Ricoh Co Ltd Device and method for retrieving data
JPH09114839A (en) * 1995-10-19 1997-05-02 Fuji Xerox Co Ltd Keyword controller
JP2006501529A (en) * 2001-12-28 2006-01-12 ジェフリー ジェームズ ジョナス, Real-time data storage
US8615521B2 (en) 2001-12-28 2013-12-24 International Business Machines Corporation Real time data warehousing
WO2007114481A1 (en) * 2006-03-31 2007-10-11 Hideo Sunaga Communication system
JP2008102845A (en) * 2006-10-20 2008-05-01 Sony Corp Information processing apparatus, method, and program
KR20200046446A (en) * 2018-10-24 2020-05-07 한국전자통신연구원 Similar patent search method and apparatus using alignment of elements

Similar Documents

Publication Publication Date Title
US4775956A (en) Method and system for information storing and retrieval using word stems and derivative pattern codes representing familes of affixes
JPH09198395A (en) Document retrieval device
JPH05250416A (en) Registering and retrieving device for data base
KR100452024B1 (en) Searching engine and searching method
JPS60176169A (en) Sentence processor
JPH10312395A (en) System and method for full-text retrieval and record medium where full-text retrieving program is recorded
JP2535629B2 (en) Input string normalization method of search system
EP0539965B1 (en) An electronic dictionary including a pointer file and a word information correction file
JPH04340163A (en) Keyword retrieval system
JPS6175952A (en) Document input processing system
JP3187671B2 (en) Electronic dictionary display
JPH08115330A (en) Method for retrieving similar document and device therefor
JPH03194653A (en) Method for retrieving abbreviated word in information retrieval system
JP2009181524A (en) Document search system and document search method
JPH0612451A (en) Illustrative sentence retrieving system
JPH09245051A (en) Device and method for retrieving natural language instance
JPH09259132A (en) Device and method for information registration and retrieval
JP3431618B2 (en) Data search device and search method
JPH1185765A (en) Retrieval system for document with tag
JPH08249341A (en) Document storage and retrieval device for document data base
JPH05189485A (en) Keyword retrieval system
JPH03177972A (en) Data base system
JPH0785040A (en) Inscription nonuniformity detecting method and kana/ kanji converting method
JP2002251394A (en) Whole sentence retrieval system
JPH09218868A (en) Method for designating kanji and device therefor