JPH05250416A - Registering and retrieving device for data base - Google Patents

Registering and retrieving device for data base

Info

Publication number
JPH05250416A
JPH05250416A JP4082984A JP8298492A JPH05250416A JP H05250416 A JPH05250416 A JP H05250416A JP 4082984 A JP4082984 A JP 4082984A JP 8298492 A JP8298492 A JP 8298492A JP H05250416 A JPH05250416 A JP H05250416A
Authority
JP
Japan
Prior art keywords
keyword
data
representative
representative word
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4082984A
Other languages
Japanese (ja)
Inventor
Akio Kimijima
昭生 君島
Original Assignee
Toshiba Eng Co Ltd
東芝エンジニアリング株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Eng Co Ltd, 東芝エンジニアリング株式会社 filed Critical Toshiba Eng Co Ltd
Priority to JP4082984A priority Critical patent/JPH05250416A/en
Publication of JPH05250416A publication Critical patent/JPH05250416A/en
Application status is Granted legal-status Critical

Links

Abstract

PURPOSE: To provide a device whose retrieval hitting rate is high by converting an inputted keyword and a keyword being immanent in registered data with a prescribed conversion rule, and replacing them with a representative word in a representative word dictionary.
CONSTITUTION: The device is constituted of an input/output device 1 for inputting a retrieval keyword and registered data, and outputting the data retrieved actually to a screen, an input control means 2 for receiving an input from the input/output device 1, an output control means 3 for outputting the data to the input/output device 1, a keyword converting means 4 for converting the inputted keyword by five conversion rules, a representative word registering means 51 for defining and registering a representative word to each keyword to a representative word dictionary 6, a representative word determining means 52 for reading in the representative word dictionary 6 from an auxiliary storage device, and determining the representative word concerned, a data registering means 7 for registering the data to a data base 8, and a data retrieving means 9 for retrieving the data registered already.
COPYRIGHT: (C)1993,JPO&Japio

Description

【発明の詳細な説明】 DETAILED DESCRIPTION OF THE INVENTION

【0001】 [0001]

【産業上の利用分野】本発明は書籍の所在などを格納するデータベースの登録・検索装置に関する。 The present invention relates to a registration and retrieval apparatus of the database that stores such as books of whereabouts.

【0002】 [0002]

【従来の技術】書籍及び論文等の文献を収集貯蔵し、この膨大な貯蔵文献の中から、所望の文献を検索抽出するために、文献毎の名称、著者名、発行日、発行所及び文献の内容を示す各種キーワードとともに文献データを電子計算機に登録してデータベースを作成し、これらデータベース内の求める文献をオペレーターが入力したキーワードを検索キーワードとして、求める文献を検索している。 BACKGROUND OF THE INVENTION books and literature of papers collected storage, from within this vast storage literature, in order to search extract the desired literature, the name of each of the literature, the author's name, date of issue, publishing office and literature to create a database with various indicating the contents keyword to register the document data on the computer, as the search keywords literature operator entered to determine within these databases keyword, and search for documents seek.

【0003】このような従来のデータベース登録・検索装置について、図6の従来のデータベース登録・検索装置を用いて説明する。 [0003] Such conventional database registration and retrieval apparatus will be described with reference to the conventional database registration and retrieval device of FIG.

【0004】上記文献毎の複数のキーワード及び文献データをデータベース8に新規登録する場合、オペレーターにより入出力装置1から入力されたままのデータを、 [0004] When registering a new plurality of keywords and literature data for each said document in the database 8, the data remains inputted from the input device 1 by the operator,
データ登録手段7が、補助記憶装置のデータベース8に書き込んでいた。 Data registration unit 7 has been written to the database 8 of the auxiliary storage device.

【0005】また、データベース8にすでに登録済みの文献データをキーワードで検索する場合は、オペレーターが入出力装置1から入力したキーワードを、そのままデータ検索手段9に渡し、補助記憶装置のデータベース8内を検索していた。 Further, when searching already registered document data with the keyword in the database 8, the keyword operator entered from the input and output device 1, passes it to the data retrieval means 9, a database 8 of the auxiliary storage device Find and had.

【0006】しかしながら上述した従来の技術では、同じ意味内容のことを表現するのに、個人個人異なる表現をするように、オペレーターにより(同じオペレーターであってもその時により)検索用として入力するキーワードは異なる言葉になることがあり、取り出したい文献データが実際データベース8内に存在するにもかかわらず、該当する文献データがないとして扱われてしまい、 [0006] However, in the prior art described above, to represent that of the same meaning, so that the individuals different representations, keyword input as for the search (when by its even in the same operator) by the operator different words there is, despite the presence in the literature data actually in the database 8 to be taken out, will be treated as no such document data,
検索もれが生じるという問題点があった。 There is a problem that the search leakage occurs. 例えば、「アメリカ合衆国」に関する情報を検索する際、キーワードとして「U.S.A.」、「米国」、「Americ For example, when searching for information on the "United States", "U.S.A." as a keyword, "the United States", "Americ
a」と3とうり入力してそれぞれ検索すると、それぞれの検索結果は本来同じであるべきだが、従来の方法では異なった結果になってしまっていた。 Each When you search for 3 Tori input and a ", but they each result of the search should be the same originally, it had ended up with different results in a conventional manner.

【0007】 [0007]

【発明が解決しようとする課題】上述したとうり従来の技術によると、同じ意味内容のことを表現する場合でもオペレーターにより(同じオペレーターであってもその時により)検索用として入力するキーワードが異なることがあるため、取り出したい情報が実際データベースに存在するにもかかわらず、検索もれが生じるという問題点があった。 The object of the invention is to be Solved According to the above-mentioned Toh prior art, (by that time be the same operator) by the operator even if you express that of the same meaning content keywords you enter different as for the search because there is, even though an information to be extracted is in fact the database, there is a problem that the search leakage occurs.

【0008】本発明の目的は、データを複数の利用者が共用できるように計算機処理のできる統合したデータベースとして登録し、各種情報をキーワード化して、このキーワードにより検索するデータベース管理システムにおいて、あらかじめ考えられうるキーワードとその同意語を1つの代表語に対応させた代表語辞書を持ち、登録・検索処理の際オペレーターから入力されたキーワードを一定の変換規則により変換して統一後、代表語辞書に定義されている代表語に置き換えて文献データの登録及びデータベースの検索をすることにより、検索ヒット率の高いデータベースの登録・検索装置を提供することにある。 An object of the present invention, registered as a database of data a plurality of users are integrated can computer process to be shared, the various information and keywords of, in a database management system for searching by keyword, considered in advance keyword and its synonyms have one representative word dictionary so as to correspond to the representative words that may be, after unification by converting the keyword input from the operator during the registration and search process by a predetermined conversion rule, the representative word dictionary by searching for registration and database references data by replacing the representative word defined to provide a registration and retrieval device with high retrieval hit rate database.

【0009】 [0009]

【課題を解決するための手段】上記目的を達成するために第一の発明では、データを複数の利用者が共用できるように計算機処理のできる統合したデータベースとして登録し、各種情報をキーワード化して、このキーワードにより検索するデータベース管理システムにおいて、オペレーターの入力したキーワード文字列の些細な違いの統一と、誤入力しがちな文字を一定の変換規則により変換統一するキーワード変換手段と、オペレーターが入力するキーワードとして考えうる言葉とその同意語を前記キーワード変換手段により統一し、キーワードとしてまとめ、1つの代表語に対応させて代表語辞書に定義登録する代表語登録手段と、前記代表語登録手段により、定義登録した代表語辞書内に、前記キーワード変換手段により統一されたキ To achieve the above object, according to an aspect of the first invention, is registered as a database of data a plurality of users are integrated can computer process to be shared, the various information and keywords of in a database management system for searching by keyword, the unification of minor differences in the keyword string entered by the operator, and a keyword conversion means for the erroneous input prone transliteration unified by a certain conversion rule, the operator inputs words conceivable as a keyword and its synonyms unified by the keyword conversion means, collectively as a keyword, a representative word registering means for defining registration representative dictionary so as to correspond to one representative word, by the representative word registration unit, the defined registered representative word in the dictionary, unified by the keyword conversion unit key ワードが定義されているか否か探し、このキーワードに対応した代表語を抽出する代表語決定手段と、前記代表語登録手段により代表語辞書に新規に代表語を登録した際すでに登録済みの補助記憶装置のデータベース内データに新規登録の代表語を対応させるために、データに内在するキーワードを、すべて前記代表語決定手段により抽出された代表語に置き換え、補助記憶装置のデータベースに書き込むデータ登録手段と、データベースにすでに登録済みのデータを検索するために、変換統一後のキーワードを前記代表語決定手段により抽出された代表語に置き換えて、検索キーワードとして補助記憶装置のデータベース内を検索するデータ検索手段とで構成される。 Looking whether the word has been defined, a representative word determination means for extracting the representative words corresponding to the keyword, the representative word representative word dictionary newly already registered auxiliary storage when the registered representative word by the registration means the database data device to match a newly registered representative words, keywords inherent in the data, all replaced with the representative words extracted by the representative word determination means, a data register means for writing to a database of auxiliary storage device , to find the already registered data in the database, replacing the keyword converted unified representative words extracted by the representative word determination means, the data retrieval means for retrieving a database of auxiliary storage device as a search keyword constituted by the.

【0010】また第二の発明は、前記第一の発明において、オペレーターが入力したキーワード内に、ピリオド、スペース、小文字、長音、ハイフンがある場合、所定の変換規則により変換統一することにより、オペレーターの入力文字列の些細な違いの統一と誤入力しがちな文字の修正をするキーワード変換手段とで構成される。 [0010] The second aspect of the invention, in the first invention, in the operator entered keyword, period, spaces, lowercase, prolonged sound, when there is a hyphen, by converting unified by a predetermined conversion rule, the operator of composed of the keyword conversion means for the trivial and unity erroneous input-prone character of the modification of the difference of the input string.

【0011】また第三の発明は、前記第一の発明において、新規に補助記憶装置のデータベースにデータを登録する場合、登録するデータに内在するオペレーター入力のキーワードを、前記代表語決定手段により抽出された代表語に置き換え、データベースに書き込むデータ登録手段とで構成される。 [0011] The third invention is extracted in the first invention, when registering the data in the database of the new auxiliary storage device, a keyword operator inputs inherent in the data to be registered, by the representative word determination means It has been replaced by representative word, and a data registration means for writing to the database.

【0012】 [0012]

【作用】検索用キーワードとしての複数の同意語を1つの代表語に対応定義した代表語辞書を代表語登録手段により作成しておき、実際にオペレータがデータベースにデータを登録あるいは検索する際に、オペレーターが最も入力ミスを生じやすいピリオド、スペース、小文字、 [Action] Representative dictionary corresponding define multiple synonyms to one representative word of a search keyword previously created by the representative word registration unit, when actually operator registers or retrieve data in a database, operator is likely to occur the most input errors period, space, lower case letters,
長音(ー)、ハイフン(−)等をキーワード変換手段により、5つの変換規則で変換統一する。 Prolonged sound (chromatography), hyphen (-) by the keyword converting means or the like, to convert the unified five conversion rules. この変換統一されたキーワードによって代表語が代表語辞書に定義されているか否か探し、抽出する。 The representative word by conversion unified keyword is looking for whether or not they are defined in the representative word dictionary, is extracted.

【0013】データベースに新たに文献を登録する場合は、データ登録手段が文献データに内在するオペレータ指定のキーワードを探し、すべて代表語決定手段により抽出された代表語に置き換えて登録する。 [0013] If you want to create a new document in the database, the data registration means is looking for an operator-specified keyword inherent in the literature data, to register all be replaced by a representative word that has been extracted by the representative word determination means. また、代表語辞書に新たに情報を追加(キーワード・代表語)した場合は、すでにデータベースに登録されているすべての文献データに内在するオペレータ指定の新規に追加されたキーワードを代表語辞書に定義した代表語に置き換えて登録しなおす。 In addition, if you add new information to the representative word dictionary (keyword representative word) is already defined in the representative Dictionary keywords that have been added to the operator designation of new inherent in all of the literature data that are registered in the database re-registration replaced with the representative word.

【0014】データベースにすでに登録されている文献データを検索する場合は、前記代表語決定手段により抽出された代表語を検索キーワードとして、データベース内を検索する。 [0014] When looking for literature data that is already registered in the database, as a representative word search keyword extracted by the representative word determination means searches the database.

【0015】 [0015]

【実施例】以下、書籍及び論文等の文献を収集してデータベースとして登録し、かつキーワードにより検索する場合の処理を本発明の一実施例とし、図1を参照しながら全体構成を説明する。 EXAMPLES Hereinafter, registered as a database to collect documents, such as books and papers, and as one embodiment of the present invention the processing for searching by keyword, illustrating the overall configuration with reference to FIG.

【0016】1は検索用のキーワードや登録するデータを入力をしたり、実際に検索したデータや検索結果を画面出力するための入出力装置であり、2はこの入出力装置1から入力を受け付けるための入力制御手段、3は入出力装置1にデータを出力するための出力制御手段である。 [0016] 1 or the input data to be keyword or registration for the search, an input and output device for screen output actually retrieved data and search results, 2 accepts the input from the input and output device 1 input control means for, 3 denotes an output control means for outputting the data to the input-output device 1. 4は入力されたキーワードを5つの変換規則により変換統一するキーワード変換手段である(変換規則についての詳細は後述)。 4 is a keyword conversion means for converting unified by five conversion rule the inputted keyword (described later in detail about the conversion rules). 5は、補助記憶装置に保管されている、キーワード一つ一つに対する代表語を定義登録しておく代表語辞書6を管理する代表語管理手段で、この代表語管理手段5は、新たにキーワード及び代表語を代表語辞書6に定義登録するための代表語登録手段51 5 is stored in the auxiliary storage device, a representative word management means for managing a representative word dictionary 6 to be defined registered representative word for keyword one by one, the representative word management unit 5, a new keyword and the representative words to define registered representative dictionary 6 representative word registration unit 51
と、前記代表語辞書6内に指定のキーワードに対応する代表語があるかどうかを検索し、対応する代表語を取り出す代表語決定手段52で構成される。 When searches whether there is a representative words corresponding to the designated keyword in the representative word dictionary 6, and a representative word determination means 52 to retrieve the corresponding canonical word. 7は、文献データに内在するキーワードを前記代表語決定手段52により抽出された代表語に置き換えてから各文献データを補助記憶装置のデータベース8に書き込むデータ登録手段である。 7 is a data registration means for writing the document data after substituting the keyword inherent in literature data representative words extracted by the representative word determination means 52 in the database 8 of the auxiliary storage device. 9は、オペレーターが検索用に入力したキーワードを前記キーワード変換手段4により変換統一後、前記代表語決定手段52により抽出された代表語に置き換えられた、検索キーワードでデータベース8内の該当データを探し出すデータ検索手段である。 9, after conversion unified keywords operator entered for the search by the keyword conversion unit 4 was replaced with the representative words extracted by the representative word determining means 52 locates the corresponding data in the database 8 in Searches a data retrieval means.

【0017】次に、図2のキーワード変換規則表を用いて、5つの変換規則について説明する。 Next, using a keyword conversion rule table of Figure 2 will be described five conversion rules. 1はオペレーターが入力したキーワードにピリオドが存在する場合、2 1 if there is a period in keywords that operator has input, 2
はオペレーターが入力したキーワードにスペースが存在する場合、3はオペレーターが入力したキーワードに小文字が存在する場合、4はオペレーターが入力したキーワードに長音(ー)が存在する場合、5はオペレーターが入力したキーワードにハイフン(−)が存在する場合についての変換規則である。 If there is a space in the keyword operator-entered, 3 if there is a lower case letters in keywords that operator has input, 4 if you want to exist long vowel (over) is the keyword that the operator has input, 5 operator entered hyphen keyword (-) is a conversion rule for the case where there.

【0018】5つの変換規則のうち1〜3は、オペレーター個人個人の表記の違いを最小限にして、単なる文字列の些細な違いによるキーワードの同意語まで代表語辞書6に登録しなくても検索もれが生じないようにするためのものである。 [0018] 1 to 3 out of five of the conversion rules, to minimize the difference in the representation of the operator individual, even if not registered in the representative word dictionary 6 to synonyms of keywords by minor differences of just a string Search leakage is intended to prevent occur.

【0019】例えば、キーワードとして“ユウ エス [0019] For example, "Yu es as a keyword
エー”を表記(入力)するのに、オペレーターAが“U "To be referred to the (input), the operator A is" er U
SA”、オペレーターBが“U. SA ", operator B is" U. S. S. A. A. ”、オペレーターCが“U S A”オペレーターDが“u. "Operator C is" U S A "operator D is" u. s. s.
a. a. ”と入力した場合、オペレーターBの入力は変換規則1、オペレーターCの入力は変換規則2、オペレーターDの入力は変換規則1と変換規則3をもとに変換され、変換後はすべてオペレーターAの入力と同じ“US If you enter "input conversion rule 1 operator B, the input of the operator C conversion rule 2, the input of the operator D is converted based on the conversion rule 1 and the conversion rule 3, after conversion of all operators A same "US and input
A”に統一される。この3つの変換規則で変換することにより、無駄な代表語登録と単なる表記の違いによる検索洩れを防ぐことができる。 Are unified into A ". By converting this three conversion rule, it is possible to prevent a wasteful representative word registration omission search due to a difference in mere notation.

【0020】変換規則の4、5は、オペレーターの入力ミスを最小限にするためのものである。 [0020] The conversion rule 4 and 5, is intended to minimize the input error of the operator. 一般的にハイフン(−)と長音(ー)は同一のものと間違われやすく、 Generally hyphen (-) and prolonged sound (over) is easily mistaken for the same thing,
オペレーターはハイフン(−)と長音(ー)の使い分けをせずに(無意識に)、入力してしまう場合が多い。 The operator hyphen (-) and without the proper use of the long vowel (over) (unconsciously), in many cases resulting in input. 人間の目で確かめる場合はハイフン(−)も長音(ー)も変わりないため問題ない。 If you see the human eye hyphen (-) is also long vowel (over) is also not a problem because it does not change. しかしコンピュータによる情報検索処理の場合は、すべて内部コードで行われるため、コード番号が違えば、まったく違う言葉を入力した場合と同じ扱いになってしまう。 However, if by the computer of the information search process, because all carried out in the internal code, Different code number, it becomes the same treatment as if you enter a completely different word.

【0021】例えば、日本工業規格(JIS)漢字コード表でみると、ハイフン(−)と長音(ー)は、それぞれ、コード番号“0161”、コード番号“0128” [0021] For example, when viewed in the Japanese Industrial Standards (JIS) Kanji code table, a hyphen (-) and long vowel (over), respectively, code number "0161", code number "0128"
であるので、ヨーロッパを表現するのに、“ヨ−(ハイフン)ロッパ”はコード番号で表現すると、“051 Since it is, to represent Europe, "Yo - (hyphen) Europe" will be expressed in the code number, "051
0,0161,0577,0535,0549”となり、“ヨー(長音)ロッパ”は、“0510,012 0,0161,0577,0535,0549 ", and" yaw (long vowel) Europe "is," 0510,012
8,0577,0535,0549”となる。“ヨー(長音)ロッパ”で記載されたデータが登録されているデータベース8を検索キーワード“ヨ−(ハイフン)ロッパ”で検索処理を実行すると、検索キーワード“ヨ− 8,0577,0535,0549 ". A" yaw (long sound) European Yo "Searches the database 8, wherein data is registered in the" - When you perform a search process in (hyphen) European "Searches "Yo -
(ハイフン)ロッパ”に該当するデータは存在しないという結果になってしまう。このように無意識に入力されたハイフン(−)と長音(ー)を変換規則4、5をもとに修正することにより、“ヨ−(ハイフン)ロッパ”と“ヨー(長音)ロッパ”は、“ヨー(長音)ロッパ”に統一できるため、紛らわしいハイフン(−)と長音(ー)の入力ミスによる検索洩れを防ぐことができる。 Data corresponding to (hyphen) European "becomes the result that there thus unintentionally entered hyphen. - by modifying the prolonged sound (over) on the basis of the conversion rule 4, 5 () , "Yo - (hyphen) European" and "yaw (long vowel) Europe", in order to be unified to "yaw (long vowel) Europe", confusing hyphen (-) and to prevent the leakage search by typing errors of long vowels (over) can.

【0022】つぎに、データベース8へのデータ登録処理、データベース8内のデータ検索処理及び代表語辞書6への登録処理を前述した図2、図3の登録・検索処理の流れ、図4の代表語辞書例1、図5の代表語辞書例2 Next, data registration processing, FIG. 2 described above the process of registration in the data search process and the representative dictionary 6 in the database 8, a flow of registration-search process of FIG. 3, the representative of FIG. 4 to the database 8 word dictionary example 1, representative word dictionary example 2 shown in FIG. 5
を参照しながら実際の処理の流れを説明する。 Reference explaining the flow of the actual processing while the.

【0023】まず第一に、オペレーターが入力したキーワードを変換規則により変換統一後、対応する代表語が代表語辞書6に定義されている場合の検索処理の実施例を示す。 [0023] First, after the conversion unified by the conversion rule keywords operator entered, it shows an embodiment of a search process if the corresponding canonical word is defined in the representative word dictionary 6.

【0024】オペレーターは検索キーワードとする言葉「U.S.A.」をキーワードとして、入出力装置1から入力する(S1)。 [0024] operator as a keyword word "U.S.A." to the search keyword, input from the input-output device 1 (S1). 入出力装置1からキーワードを受け付けた入力制御手段2は、キーワード変換手段4に処理を渡す。 Input control means 2 that has received a keyword from the input-output device 1 passes the processing to the keyword conversion unit 4. キーワード変換手段4は、変換規則表(図2)内の5つの変換規則に従って入力されたキーワード「U.S.A.」を変換していく。 Keyword conversion means 4, will convert the keyword "U.S.A." entered in accordance with the five conversion rule in the conversion rule table (Fig. 2). 入力されたキーワード「U.S.A.」の場合、図2のキーワード変換規則表の変換規則1の「ピリオドが存在する場合は、ピリオドを取って詰める。」に該当するので(S2)、「US If the entered keywords "U.S.A.", the "case where a period is present, packed taking period." Conversion rule 1 keyword conversion rule table shown in FIG. 2 because it corresponds to (S2), "US
A」に変換する(S3)。 Converted into A '(S3). その他の変換規則(2〜5) Other conversion rules (2-5)
には該当しないため、変換後キーワードは「USA」として、代表語管理手段5に渡される。 Because it does not apply to, keyword after the conversion as the "USA", is passed to a representative word management means 5.

【0025】代表語管理手段5は、補助記憶装置のあらかじめ定義登録済みの代表語辞書6を読み込み(S1 [0025] The representative word management means 5, pre-defined registered reads a representative word dictionary 6 of the auxiliary storage device (S1
2)、代表語決定手段51が変換後キーワード「US 2), representative word determination means 51 is converted keyword "US
A」が代表語辞書6に定義されているか否か探す(S1 A "look for whether or not they are defined in the representative word dictionary 6 (S1
3)。 3). 図4の代表語辞書例1の「USA」(K1)の欄には「アメリカ」(D1)が代表語として定義されているため、「アメリカ」を代表語として取り出す(S1 Since "America" ​​(D1) is defined as the representative words in the column "USA" (K1) representative dictionary example 1 of FIG 4, taken out "US" as the representative word (S1
4)。 4). この様にして決定した代表語は、データ検索手段9内に検索キーワードとして渡される。 Representative word that was determined in this way, is passed as a search keyword in the data retrieval means 9. データ検索手段9は、情報が登録されているデータベース8を補助記憶装置から読み込む(S16)。 Data retrieval means 9 reads a database 8 which information is registered from the auxiliary storage device (S16). データベース8の検索処理指定を指定して(S17)、データベース8に対し、 Specify the search process specified database 8 (S17), to the database 8,
代表語「アメリカ」を検索キーワードとして検索する(S18)。 Search representative words to "America" ​​as a search keyword (S18). 該当する文献データが存在する場合は、該当データを読み込み、出力制御手段3に指令してデータを入出力装置1に出力する(S19)。 If applicable literature data exists, it reads the corresponding data, and outputs the data to the input-output device 1 instructs the output control unit 3 (S19). この時、該当する文献データが存在しなければ、出力制御手段3に指令して、該当情報なしの旨、入出力装置1に表示する(S At this time, if there is no corresponding document data, and instructs the output control unit 3, indicating that the N information is displayed on the input and output device 1 (S
20)。 20).

【0026】第二に、オペレーターが入力したキーワードを変換規則により変換統一後対応する代表語が代表語辞書6に定義されていない場合の検索処理の実施例を示す。 [0026] Secondly, an embodiment of a search process in a case where the representative words corresponding converted unified by the conversion rule keywords operator entered is not defined in the representative word dictionary 6.

【0027】オペレーターは検索キーワードとする言葉「United State ofAmerica」をキーワードとして入出力装置1から入力する(S1)。 [0027] The operator is input from the input-output device 1 word that the search keyword "United State ofAmerica" ​​as a keyword (S1).
入出力装置1からキーワードを受け付けた入力制御手段2はキーワード変換手段4に処理を渡す。 Output device 1 input control means 2 that has received a keyword from passes the process to the keyword conversion unit 4. キーワード変換手段4は、変換規則表(図2)内の5つの変換規則に従って、入力されたキーワード「United Sta Keywords converter 4, according to the five conversion rule in the conversion rule table (Fig. 2), the input keyword "United Sta
te of America」を変換していく。 We continue to convert the te of America ". 入力されたキーワード「United Stateof Am Input keyword "United Stateof Am
erica」の場合、図2のキーワード変換規則表の変換規則2の「スペースが存在する場合は、スペースを詰める。」(S4)と、変換規則3の「小文字が存在する場合は、すべて大文字にする。」(S6)に該当するので、「UNITEDSTATEOFAMERICA」に変換する(S5、S7)。 In the case of erica ", when the" space exists in the conversion rule 2 of the keyword conversion rule table shown in FIG. 2, filled the space. "And (S4)," if the lower case letters to the presence of the conversion rule 3, in all capital letters to. "because corresponds to (S6), and converts the" UNITEDSTATEOFAMERICA "(S5, S7). その他の変換規則(1,4, Other conversion rules (1, 4,
5)には該当しないため、変換後キーワードは「UNI Since the 5) does not apply, keyword after the conversion is "UNI
TEDSTATEOFAMERICA」として、代表語管理手段5に渡される。 As TEDSTATEOFAMERICA ", is passed to a representative word management means 5.

【0028】代表語管理手段5は、補助記憶装置のあらかじめ定義済みの代表語辞書6を読み込み(S12)、 [0028] The representative word management means 5, pre-reads the predefined representative word dictionary 6 of the auxiliary storage device (S12),
代表語決定手段52が、渡された変換後キーワード「U Representative word determination means 52, after the conversion that was passed keyword "U
NITEDSTATEOFAMERICA」が代表語辞書6に定義されているか否か探す(S13)。 NITEDSTATEOFAMERICA "looks whether or not they are defined in the representative word dictionary 6 (S13). 図4の代表語辞書例1によると、該当するものが存在しないが、 According to typical dictionary example 1 of FIG. 4, but there is nothing applicable,
変換前キーワードは代表語辞書6に登録しないので(S Since before the conversion keyword is not registered with the representative word dictionary 6 (S
21)、変換前のキーワード(オペレーターが入力したままのキーワードを指すため、「UnitedStat 21), since the conversion before the keyword (operator refers to the keyword that remains input, "UnitedStat
e of America」)を検索キーワードとして設定し、データ検索手段9に渡す(S15)。 Set the e of America ") as a search keyword, passed to the data retrieval means 9 (S15). データ検索手段9は、情報が登録されているデータベース8を補助記憶装置から読み込む(S16)。 Data retrieval means 9 reads a database 8 which information is registered from the auxiliary storage device (S16). データベース8の検索処理を指定して(S17)、データベース8を検索し(S18)、代表語変換前キーワードに該当する文献データが存在する場合は、該当データを読み込み、出力制御手段3に指令して、データを入出力装置1に出力する(S19)。 Specifying the search process of the database 8 (S17), searches the database 8 (S18), if the document data corresponding to the representative word conversion before the keyword is present, reads the corresponding data, the command to the output control unit 3 Te, and it outputs the data to the output device 1 (S19). この時、該当する文献データが存在しなければ、出力制御手段3に指令して該当情報なしの旨、 At this time, if there is no corresponding document data, the N information instructs the output control unit 3 fact,
入出力装置1に表示する(S20)。 It is displayed on the output device 1 (S20).

【0029】第三に、代表語辞書6に新規に代表語及びキーワードを登録する場合の処理の実施例を示す。 [0029] Third, shows an embodiment of the process of registering the representative language and keyword new to the representative word dictionary 6.

【0030】オペレーターは、代表語辞書6に登録するキーワードと代表語を入出力装置1から入力する。 [0030] operator, to enter the representative words and keywords to be registered in the representative Dictionary 6 from the input and output device 1. 入出力装置1からキーワード「ヨ−(ハイフン)ロッパ」及び代表語「欧州」を受け付けた入力制御手段2は、変換規則表(図2)内の5つの変換規則に従って、入力されたキーワード「ヨ−(ハイフン)ロッパ」を変換していく。 Keywords from the input and output device 1 "Yo - (hyphen) European" and the representative word "Europe" input control means 2 that has received the according five conversion rule in the conversion rule table (Fig. 2), the input keyword "Yo - continue to convert the (hyphen) Europe ". 入力されたキーワード「ヨ−(ハイフン)ロッパ」 Input keyword "Yo - (hyphen) Europe"
の場合、図2のキーワード変換規則表の変換規則3の「小文字が存在する場合は、すべて大文字にする。」 In the case of, of the conversion rule 3 of the keyword conversion rule table shown in FIG. 2 "If the lower case letters are present, all in capital letters."
(S6)と、変換規則5の「カナ文字のあとのハイフン(−)は長音(ー)にする。」(S10)に該当するので、それぞれの条件から「ヨー(長音)ロツ(大文字) And (S6), the conversion rule 5 "hyphen kana character after (-). The to prolonged sound (over)" because it corresponds to (S10), from each condition "yaw (long sound) Rotsu (uppercase)
パ」に変換する(S7,S11)。 Converting the path "(S7, S11). その他の変換規則(1,2,4)には該当しないため、代表語「欧州」に対応するキーワードとして「ヨー(長音)ロツパ」が代表語管理手段5に渡される。 Not applicable Additional conversion rule (1,2,4), "Yaw (long sound) Rotsupa" is passed to the representative word management unit 5 as a keyword corresponding to the representative word "Europe".

【0031】代表語管理手段5は、補助記憶装置のあらかじめ定義済みの代表語辞書6を読み込み(S12)、 The representative word management means 5, pre-reads the predefined representative word dictionary 6 of the auxiliary storage device (S12),
すでに代表語辞書内に登録されているか否か検索する(S13)。 Already search whether or not it is registered in the representative Dictionary (S13). 図4の代表語辞書例1には登録されていないので(S21)、代表語辞書登録手段51に処理を渡す。 It is not registered Representative Dictionary Example 1 in FIG. 4 (S21), and passes the process to the representative word dictionary registration unit 51. 代表語登録手段51は、渡された変換後キーワード「ヨーロツパ」及び、代表語「欧州」を代表語辞書6に登録する(S22)。 Representative word registration unit 51, passed converted keyword "Yorotsupa" and registers the representative words to "Europe" Representative Dictionary 6 (S22). 登録されると、代表語辞書6は、 Once registered, representative word dictionary 6,
図5の代表語辞書例2に示すように更新される(K3, Is updated as shown in the representative dictionary example 2 of FIG. 5 (K3,
D3)。 D3).

【0032】新規に代表語辞書6にキーワード及び代表語が登録されたので、データベース8にすでに登録されている文献データを検索する際にも新たに登録された代表語で対応できるようにするため、データベース登録手段7により、データベース8を読み込む(S16)。 [0032] Since the keyword and representative word to new representative word dictionary 6 is registered, in order to be able to cope with representative word that has been newly registered in when searching for literature data that has already been registered in the database 8 , by the database registration unit 7 reads the database 8 (S16). 登録処理を指定して(S17)かつ代表語辞書の更新ありなので(S23)、データベース8内に存在する、新規登録の代表語に対応するキーワードをすべて代表語に置き換え(S24)、補助記憶装置のデータベース8に書き込む(S25)。 Specifying a registration process (S17) and since there updating the representative Dictionary (S23), exist in the database 8, all the keywords that correspond to the representative words of the new registration replaced by representative word (S24), an auxiliary storage device writing of the database 8 (S25).

【0033】第四に、データベース8に新規に文献データを登録する場合の処理の実施例を示す。 [0033] Fourth, an embodiment of a process of registering a new document data in the database 8.

【0034】オペレーターはデータベース8に登録する文献データと、検索キーワードとするべきキーワード「米国」を入出力装置1から入力する(S1)。 The operator database 8 and literature data to be registered in, and inputs the keyword "US" to the search keyword from the input-output device 1 (S1). 入出力装置1からキーワードを受け付けた入力制御手段2はキーワード変換手段4に処理を渡し、キーワード変換手段4は、変換規則表(図2)内の5つの変換規則に従って、入力されたキーワード「米国」を変換していく。 Output device input control means 2 that has received a keyword from 1 passes the process to the keyword conversion unit 4, the keyword conversion unit 4, in accordance with the five conversion rule in the conversion rule table (Fig. 2), the input keyword "U.S. We are going to convert. " 入力されたキーワード「米国」の場合、図2のキーワード変換規則表の変換規則(1〜5)には該当しないため、 If the entered keyword "US", not applicable to the conversion rule keyword conversion rule table shown in FIG. 2 (1-5),
変換後キーワードは「米国」のまま、代表語管理手段5 After the conversion keyword remains of "the United States", a representative word management means 5
に渡される。 It is passed to.

【0035】代表語管理手段5は、補助記憶装置のあらかじめ定義済みの代表語辞書6を読み込み(S12)、 The representative word management means 5, pre-reads the predefined representative word dictionary 6 of the auxiliary storage device (S12),
渡された変換後キーワード「米国」が代表語辞書6に定義されているか否か探す(S13)。 After the conversion, which passed in the keyword "the United States" looks whether or not they are defined in the representative word dictionary 6 (S13). 図4の代表語辞書例1によると、代表語辞書6の「米国」(K2)の欄には「アメリカ」(D2)が代表語として定義されているため、「アメリカ」を取り出す(S14)。 According to typical dictionary example 1 of FIG. 4, since the column of "US" (K2) representative dictionary 6 is "America" ​​(D2) is defined as the representative words, taken out "America" ​​(S14) .

【0036】次にデータ登録手段7が、データベース8 [0036] Next, data registration means 7, a database 8
を読み込む(S16)。 The read (S16). 新規データ登録処理を指定して(S17)、代表語辞書6の更新はないので(S2 Specify a new data registration processing (S17), since there is no update of the representative word dictionary 6 (S2
3)、新規登録文献データ内の「米国」をすべて代表語の「アメリカ」に置き換えて(S26)、補助記憶装置のデータベース8にデータを書き込む(S25)。 3), it is replaced by "America", "the United States" all the representative language in the new registration literature data (S26), and writes the data to the database 8 of the auxiliary storage device (S25).

【0037】以上本実施例は、文献データのデータベース登録及びデータ検索の例で説明したが、その他の例として、会社情報検索システムや地図情報検索システム等で実現可能である。 [0037] Although the present embodiment was described using an example of a database registration and data retrieval literature data, as another example, can be implemented by the company information retrieval system and map information retrieval systems.

【0038】 [0038]

【発明の効果】以上のように、情報検索用キーワードとその同意語のキーワードを複数収集しそれら同意語の代表語を定義した代表語辞書を設けることにより、自己が通常使用している言葉をキーワードとして入力しても、 As in the above, according to the present invention, by providing a representative word dictionary that a plurality of collecting information for search keywords and the keyword of the synonyms you define them synonyms of representative words, the words that self is normally used If you enter as a keyword,
代表語辞書にて代表語に変換されるので、キーワード選択に神経を使わず、検索効率の向上がはかれる。 Because they are converted to a representative word at the representative word dictionary, without the nerve to keyword selection, it is possible to improve search efficiency.

【0039】また、キーワードを入力する際のキー操作において、オペレーターにより入力ミスを生じやすいピリオド、スペース、小文字、長音(ー)、ハイフン(−)等は、キーワード変換手段を設けたことにより、 [0039] In addition, in the key operation when you enter the keyword, prone to input errors by the operator period, space, lower case letters, long vowel (over), hyphen (-) and the like, by providing the keyword conversion means,
仮に誤って入力してもこの変換手段が統一するためキー操作に神経を使う必要がなく、入力操作の効率の向上がはかれ、さらに検索時の入力の違いによる認識違いもなくなる。 If accidentally be entered without the need to use nerves key operation for the converter is unified model improves the efficiency of input operation, also eliminated further differences recognition due to differences in input for the search.

【0040】よって本発明によれば、検索ヒット率の高いデータベースの登録・検索装置を実現することができる。 [0040] Therefore, according to the present invention, it is possible to realize the registration and retrieval device with high retrieval hit rate database.

【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS

【図1】 本発明の全体構成図、 [1] an overall configuration diagram of the present invention,

【図2】 キーワード変換規則表、 [Figure 2] keyword conversion rule table,

【図3】 登録・検索処理の流れ、 [Figure 3] of registration and search process flow,

【図4】 代表語辞書例1、 [Figure 4] representative Dictionary Example 1,

【図5】 代表語辞書例2、 FIG. 5 is a representative word dictionary Example 2,

【図6】 従来のデータベース登録・検索装置。 [6] conventional database registration and retrieval apparatus.

【符号の説明】 DESCRIPTION OF SYMBOLS

1 ・・・入出力装置、 2 ・・・入力制御手段、 3 ・・・出力制御手段、 4 ・・・キーワード変換手段、 5 ・・・代表語管理手段、 51・・・代表語登録手段、 52・・・代表語決定手段、 6 ・・・代表語辞書、 7 ・・・データ登録手段、 8 ・・・データベース、 9 ・・・データ検索手段。 1 ... output device, 2 ... input control means, 3 ... output control means, 4 ... keyword conversion unit, 5 ... representative word management unit, 51 ... representative word registering means, 52 ... representative word determination means, 6 ... representative word dictionary, 7 ... data registration means, 8 ... database, 9 ... data retrieval means.

Claims (3)

    【特許請求の範囲】 [The claims]
  1. 【請求項1】データを複数の利用者が共用できるように各種情報データを収納した補助記憶装置のデータベースを計算機処理できるようにデータベースに登録し、各種情報をキーワード化して、このキーワードにより検索するデータベース管理システムにおいて、 オペレーターの入力した文字列の統一と、誤入力しがちな文字の修正のために、入力キーワードを一定の変換規則により変換統一するキーワード変換手段と、オペレーターが入力するキーワードとその同意語を前記キーワード変換手段により統一し、キーワードとしてまとめ、1 1. A registered data in the database to allow the computer process a database of a plurality of users auxiliary storage device that houses a variety of information data can be shared, the various information and keywords of searches this keyword in database management system, and unification of the input string operator, for erroneous input prone character modification, and keyword conversion means for converting unify input keyword by a predetermined conversion rule, the keyword operator enters the synonyms unified by the keyword conversion means, collectively as a keyword, 1
    つの代表語に対応させて代表語辞書に定義登録する代表語登録手段と、 前記代表語登録手段により、定義登録した代表語辞書内に、前記キーワード変換手段により統一されたキーワードが定義されているか否か探し、このキーワードに対応した代表語を抽出する代表語決定手段と、 前記代表語登録手段により代表語辞書に新規に代表語を登録した際すでに登録済みの補助記憶装置のデータベース内データに新規登録の代表語を対応させるために、データに内在するキーワードを、すべて前記代表語決定手段により抽出された代表語に置き換え、補助記憶装置のデータベースに書き込むデータ登録手段と、 データベースにすでに登録済みのデータを検索するために、変換統一後のキーワードを前記代表語決定手段により抽出された代表語に置 One of the representative word registration means canonical word in is corresponding definition registered in the representative word dictionary, by the representative word registering means, to define registered representative word dictionary, or unified keywords are defined by the keyword conversion means looking whether a representative word determination means for extracting the representative words corresponding to the keyword, the database data of the representative word registration unit by newly already registered auxiliary storage device when the registered representative word representative dictionary to match a newly registered representative words, keywords inherent in the data, all replaced with the representative words extracted by the representative word determination means, a data register means for writing to a database of auxiliary storage device, already registered in the database location data to retrieve a keyword converted unified representative words extracted by the representative word determination means 換えて、検索キーワードとして補助記憶装置のデータベース内を検索するデータ検索手段とを備えたことを特徴とするデータベースの登録・ Instead, the registration and the database, characterized in that a data retrieval means for retrieving a database of auxiliary storage device as a search keyword
    検索装置。 Search device.
  2. 【請求項2】オペレーターが入力したキーワード内に、 To [claim 2] within the operator has input keyword,
    ピリオド、スペース、小文字、長音、ハイフンがある場合、所定の変換規則により変換統一することにより、オペレーターの入力文字列の統一と、誤入力しがちな文字の修正をするキーワード変換手段とを備えたことを特徴とする請求項1のデータベースの登録・検索装置。 Period, space, lowercase, prolonged sound, when there is a hyphen, by converting unified by a predetermined conversion rule, and a keyword conversion means for the unification of the input string operator, the correction of erroneous input-prone characters registration and retrieval device of the database according to claim 1, characterized in that.
  3. 【請求項3】新規に補助記憶装置のデータベースにデータを登録する場合、登録するデータに内在するオペレーター入力のキーワードを、前記代表語決定手段により抽出された代表語に置き換え、データベースに書き込むデータ登録手段とを備えたことを特徴とする請求項1のデータベースの登録・検索装置。 3. To register the data in the database of the new auxiliary storage device, a keyword operator inputs inherent in the data to be registered is replaced with the representative words extracted by the representative word determination means, the data register to be written to the database registration and retrieval device of the database according to claim 1, characterized in that a means.
JP4082984A 1992-03-06 1992-03-06 Registering and retrieving device for data base Granted JPH05250416A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4082984A JPH05250416A (en) 1992-03-06 1992-03-06 Registering and retrieving device for data base

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4082984A JPH05250416A (en) 1992-03-06 1992-03-06 Registering and retrieving device for data base

Publications (1)

Publication Number Publication Date
JPH05250416A true JPH05250416A (en) 1993-09-28

Family

ID=13789485

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4082984A Granted JPH05250416A (en) 1992-03-06 1992-03-06 Registering and retrieving device for data base

Country Status (1)

Country Link
JP (1) JPH05250416A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006501529A (en) * 2001-12-28 2006-01-12 ジェフリー ジェームズ ジョナス, Real-time data storage
WO2007114481A1 (en) * 2006-03-31 2007-10-11 Hideo Sunaga Communication system
JP2008102845A (en) * 2006-10-20 2008-05-01 Sony Corp Information processing apparatus, method, and program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5464446A (en) * 1977-10-31 1979-05-24 Fujitsu Ltd Information processing system for japanese word
JPS5464445A (en) * 1977-10-31 1979-05-24 Fujitsu Ltd Information retrieval system
JPS63249267A (en) * 1987-04-03 1988-10-17 Canon Inc Electronic filing system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5464446A (en) * 1977-10-31 1979-05-24 Fujitsu Ltd Information processing system for japanese word
JPS5464445A (en) * 1977-10-31 1979-05-24 Fujitsu Ltd Information retrieval system
JPS63249267A (en) * 1987-04-03 1988-10-17 Canon Inc Electronic filing system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006501529A (en) * 2001-12-28 2006-01-12 ジェフリー ジェームズ ジョナス, Real-time data storage
US8615521B2 (en) 2001-12-28 2013-12-24 International Business Machines Corporation Real time data warehousing
WO2007114481A1 (en) * 2006-03-31 2007-10-11 Hideo Sunaga Communication system
JP2008102845A (en) * 2006-10-20 2008-05-01 Sony Corp Information processing apparatus, method, and program

Similar Documents

Publication Publication Date Title
CA1253622A (en) Information processing system for compaction and replacement of phrases
US5895446A (en) Pattern-based translation method and system
US4760528A (en) Method for entering text using abbreviated word forms
US7260570B2 (en) Retrieving matching documents by queries in any national language
KR101130384B1 (en) Full-form lexicon with tagged data and methods of constructing and using the same
CA1237527A (en) Language processing dictionary for bidirectionally retrieving morphemic and semantic expressions
US5303150A (en) Wild-card word replacement system using a word dictionary
JP3196868B2 (en) Limited state transducer of the related word forms in order to index and search for text
JP3696745B2 (en) Document search method and a document retrieval system and document search program and computer readable recording medium
JP3189186B2 (en) Translation apparatus based on the pattern
JP4544674B2 (en) A system that provides information related to the selected string
JP3160201B2 (en) Information retrieval method, the information retrieval system
JP3300866B2 (en) Method and apparatus for preparing the text used by the text processing system
US4674066A (en) Textual database system using skeletonization and phonetic replacement to retrieve words matching or similar to query words
US6957213B1 (en) Method of utilizing implicit references to answer a query
JP2009266244A (en) System and method of creating and using compact linguistic data
US5579224A (en) Dictionary creation supporting system
US6658404B1 (en) Single graphical approach for representing and merging boolean logic and mathematical relationship operators
JP3695191B2 (en) Translation supporting apparatus and method and computer-readable recording medium
US4876665A (en) Document processing system deciding apparatus provided with selection functions
US4775956A (en) Method and system for information storing and retrieval using word stems and derivative pattern codes representing familes of affixes
JP2006004274A (en) Interactive processing device, interactive processing method, and interactive processing program
US20060195435A1 (en) System and method for providing query assistance
JPH0797373B2 (en) Document Huai ring system
CN1325513A (en) Document semantic analysis/selection with knowledge creativity capability