JPH03246764A - Data base retrieving system - Google Patents
Data base retrieving systemInfo
- Publication number
- JPH03246764A JPH03246764A JP2045246A JP4524690A JPH03246764A JP H03246764 A JPH03246764 A JP H03246764A JP 2045246 A JP2045246 A JP 2045246A JP 4524690 A JP4524690 A JP 4524690A JP H03246764 A JPH03246764 A JP H03246764A
- Authority
- JP
- Japan
- Prior art keywords
- file
- search
- data
- keyword
- retrieval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 abstract description 10
- 238000004364 calculation method Methods 0.000 abstract description 5
- 239000000284 extract Substances 0.000 abstract description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000000386 athletic effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000000034 method Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【発明の詳細な説明】
(産業上の利用分野〕
本発明は、データベース利用者が、検索内容に最も適合
したファイルをデータベースから探し出すデータベース
検索システムに関するものである。DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to a database search system in which a database user searches a database for a file that best matches the search content.
従来、データベースの検索をする場合に、データベース
を構成する多(のファイルの中から、検索者が希望する
内容が多く含まれているファイルを見つけだし、それら
を選択する作業は、検索者の長年の経験によるところが
多かった。また、DIALOGなどのデータベースサー
ビスでは、指定したキーワードに対し、ファイル別にそ
のキーワードがヒツトするデータの数を表示するサービ
スを提供している。Traditionally, when searching a database, the task of finding and selecting files that contain a lot of the content desired by the searcher from among the large number of files that make up the database is a process that the searcher has spent many years working on. A lot of it depended on experience.Also, database services such as DIALOG provide a service that displays the number of data hits for a specified keyword for each file.
しかしこの場合でもヒツトした各データの分野を検索者
が知るには不十分であった。また、このキーワードを設
定する際にも2例えば「コンピュータ」という標記の場
合にはヒツトしても「コンピューター」という標記の場
合ではヒツトしないといった標記上の問題があった。さ
らにこれと同様の、「国民体育大会」を「国体」で表現
するといった略語の場合の問題、特に英語の場合には綴
り誤りや、複合語におけるハイフネーションに関する問
題、「コンピュータ」と「計算機コなどの同義語の問題
、あるいは派生語などの問題があった。However, even in this case, it was insufficient for the searcher to know the field of each hit data. Furthermore, when setting this keyword, there was a problem with the wording, for example, the wording ``computer'' would get a hit, but the wording ``computer'' would not get a hit. Furthermore, there are similar problems with abbreviations, such as expressing ``National Athletic Meet'' with ``Kokutai,'' especially in English, problems with spelling errors and hyphenation in compound words, and ``computer'' with ``calculator.'' There was a problem with synonyms or derivative words.
本発明は、これらの問題を解決し、素人がデータベース
の検索を行う場合などにおいて、検索業務に長年の経験
がなくてもキーワードとすべき単語を即座に見つけだし
、さらにそれに基づいて。The present invention solves these problems, and when an amateur searches a database, he or she can immediately find words that should be used as keywords even if he or she does not have many years of experience in search operations.
検索者が検索を希望する内容に最も適した1つ以上のフ
ァイルをデータベースの中から選択することを目的とし
ている。The purpose is for the searcher to select one or more files from the database that are most suitable for the content desired by the searcher.
本発明では、特にデータベース検索の初心者が遭遇する
所のファイル選択の問題と それに付随して生じるキー
ワード設定の問題とを解決するようにしており、キーワ
ードの設定においては、初心者が人力した検索語を、翻
訳等によってデータベースでの探索が可能なキーワード
に変換する手段をもうけ、ファイル選択においては該キ
ーワード変換手段によって設定した検索キーワードに基
づいて、該検索キーワードが付与されたデータに付与さ
れている全てのキーワードのヒストグラムを、ファイル
ごと、あるいは指定した複数のファイルごとに作成する
手段を設けるようにしている。The present invention is designed to solve the problem of file selection, which is encountered especially by beginners in database searches, and the problem of keyword setting that arises. , has a means for converting keywords into keywords that can be searched in a database by translation etc., and when selecting a file, based on the search keyword set by the keyword conversion means, all the data attached to the search keyword are added. A means is provided to create a histogram of keywords for each file or for each specified multiple files.
以上の手段により、データベース検索者が人力した単語
をデータベース検索用のキーワードに変換することがで
き、さらに、該検索キーワードが付与されているファイ
ル内の1つ以上のデータについて、これらのデータに付
与されている全てのキーワードに関するファイル内での
分布から、該ファイルに格納されているデータの内容・
分野・傾向などを容易に知ることができる。なお、検索
キーワードの変換手段はファイル探索時だけでなく、フ
ァイルを固定した後の通常の検索においても有用である
ことは言うまでもない。また、ファイルを一旦固定した
あとは、固定した該ファイルに検索キーワードを人力し
、検索結果を表示部に表示する通常の使用をすればよい
。By the above means, it is possible to convert the words manually created by the database searcher into keywords for database search, and furthermore, for one or more data in the file to which the search keyword is attached, the words added to these data can be From the distribution of all the keywords in the file, we can determine the content and content of the data stored in the file.
You can easily learn about fields, trends, etc. It goes without saying that the search keyword conversion means is useful not only when searching for files, but also during normal searches after fixing files. Furthermore, once a file has been fixed, it is sufficient to enter a search keyword into the fixed file and display the search results on the display unit.
第1図に本発明の一実施例を示す。図中の符号1はキー
ワード変換部であって、信号線11を経由して検索語と
して入力された単語をもとに、キーワード辞書2内で検
索を行い、必要があれば入力単語Xから検索キーワード
X゛への変換を行う。FIG. 1 shows an embodiment of the present invention. Reference numeral 1 in the figure is a keyword conversion unit, which performs a search in the keyword dictionary 2 based on the word input as a search word via the signal line 11, and if necessary, searches from the input word X. Convert to keyword X゛.
辞書2への検索語の入力、変換後の検索キーワードの出
力は信号線12を用いて行われる。なお。A signal line 12 is used to input a search word to the dictionary 2 and output the converted search keyword. In addition.
入力単語が、そのまま検索キーワードとして使用できる
ものは変換を行わない。キーワード辞書2においては3
例えば、キーワードとして登録されているインタフェー
スという単語と、データベース検索者が入力しうる「イ
ンターフェース」。If the input word can be used as a search keyword as is, it will not be converted. 3 in keyword dictionary 2
For example, the word "interface" is registered as a keyword, and "interface" can be entered by a database searcher.
「インターフェイス」などの単語との変換対を登録して
おく。キーワード辞書2では、同義語、同類語、略語、
翻訳語などの単語対を登録しておくだけでなく、シソー
ラスなどを用いて派生語の問題を解決したり、また特に
英語などでは辞書を用いて誤字や脱字を修正したり、
“First C1ass +“First−clas
s + ”Firstclass″といったハイフネー
ションや複合語の問題を解決する機能、あるいは必要に
応じて辞書の新規登録や削除を行う機能を付与してお(
ようにされる。ユーザが入力した検索語Xをキーワード
変換部lで変換した検索キーワードX°は信号線13を
経由してヒストグラム計算部3.データベース4及びデ
ータベース4°に転送される。なお、キーワード変換部
lに入力される検索語は、単語という形態だけでなく単
語をandやorなどの演算子で結合した式の形態であ
ってもよいことは明らかである。また、データベースが
3つ以上あっても同様の処理が可能であることも明らか
である。Conversion pairs with words such as "interface" are registered. Keyword Dictionary 2 provides synonyms, similar words, abbreviations,
In addition to registering word pairs such as translated words, you can also use a thesaurus etc. to solve problems with derived words, and especially in English, use a dictionary to correct spelling errors and omissions.
“First C1ass +”First-class
It has a function to solve problems with hyphenation and compound words such as s + "Firstclass", and a function to register and delete new dictionaries as necessary (
It will be done like this. The search keyword X°, which is obtained by converting the search word X input by the user by the keyword conversion unit l, is sent to the histogram calculation unit 3 via the signal line 13. Transferred to database 4 and database 4°. Note that it is clear that the search word input to the keyword conversion unit 1 may be in the form of not only a word but also an expression in which words are combined using operators such as and and or. It is also clear that similar processing is possible even if there are three or more databases.
第1図に示すように、データベースは、内容などが異な
る複数個のファイルから構成されており。As shown in FIG. 1, the database is composed of multiple files with different contents.
各ファイルには、それぞれ1つ以上のキーワードを付与
された複数個のデータが格納されている。Each file stores a plurality of pieces of data each assigned one or more keywords.
データベース検索においては、これらのデータのうち、
検索者のキーワードにヒントしたデータが出力される。In database search, among these data,
Data hinted at the searcher's keywords is output.
複数個のファイル、すなわち「ファイル1」「ファイル
2J、・・・、「ファイルn」を含むデータベース4.
さらに「ファイル1° 」、「ファイル2゛」、・・・
、「ファイルn゛」を含むデータベース4°では、まず
、該キーワード変換部1から送られてきた検索キーワー
ドX゛をもとに該データベースを構成する各ファイルを
検索し、検索キーワードX゛が付与されているデータを
抽出する。A database 4 containing a plurality of files, ie, "File 1", "File 2J", . . . , "File n".
Furthermore, “File 1°”, “File 2゛”, etc.
In the database 4° containing "file n", first, each file constituting the database is searched based on the search keyword X' sent from the keyword conversion unit 1, and the search keyword X' is assigned. Extract the data that is
次に、該抽出データに付与されている全てのキーワード
をファイルごと、あるいは指定された複数のファイルご
とに抽出し、信号線14を用いてヒストグラム計算部3
に出力する。当然のことながら、これらのキーワードに
は検索キーワードX゛が含まれる。Next, all keywords assigned to the extracted data are extracted for each file or for each specified plurality of files, and the histogram calculation unit 3 uses the signal line 14 to
Output to. Naturally, these keywords include the search keyword X'.
ヒストグラム計算部3では信号線14を経由して入力さ
れた検索キーワードをファイルごと、あるいは指定され
た複数のファイルごとに整理してヒストグラムを作成す
る。さらに、信号線13を用いて入力された検索キーワ
ードX” と共に信号線15を用いて出力する。The histogram calculation unit 3 organizes the search keywords input via the signal line 14 for each file or for each specified plurality of files to create a histogram. Furthermore, the search keyword X" inputted using the signal line 13 is outputted using the signal line 15.
表示部5では信号線15を用いて入力された検索キーワ
ードX″及びヒストグラムを表示する。The display unit 5 displays the input search keyword X'' and histogram using the signal line 15.
表示結果の一例を第2図に示す。第2図においては、そ
れぞれ「ファイル1」、「ファイル2」において、キー
ワードAを含むデータの数が「3」及び[2」、同様に
、キーワードBを含むデータの数が「10」及び「1」
、キーワードCを含むデータの数が「3」及び「2」、
キーワードDを含むデータの数が「1」及びrlOJ
、さらに、検索キーワードX゛ を含むデータの数が「
ファイルl」、「ファイル2」共に「15」となってい
る。An example of the display results is shown in FIG. In FIG. 2, in "File 1" and "File 2", the number of data containing keyword A is "3" and "2", and similarly, the number of data containing keyword B is "10" and "2", respectively. 1"
, the number of data containing keyword C is "3" and "2",
The number of data containing keyword D is “1” and rlOJ
, Furthermore, the number of data containing the search keyword
"File l" and "File 2" are both "15".
ここで、検索キーワードX゛が付与されたデータの数そ
のものは「15」で同じであっても、これらのデータの
うち、「ファイルl」ではキーワードBを含むデータが
、「ファイル2」ではキーワードDを含むデータが多い
ことから、「ファイル1」と「ファイル2」とにそれぞ
れ格納されたデータの性質が異なることがわかる。従っ
て、データベース検索者はキーワードBとキーワードD
とを比較し、自分が検索したいと思う分野に近いキーワ
ードを多く含むファイルの方を選ぶことが可能になる。Here, even though the number of data to which the search keyword Since there is a large amount of data containing D, it can be seen that the properties of the data stored in "File 1" and "File 2" are different. Therefore, the database searcher needs keyword B and keyword D.
By comparing these files, you can select files that contain many keywords that are close to the field you want to search.
従来のデータベース検索システムでは。In traditional database search systems.
このような場合、検索者に対して、検索キーワードX゛
を含むデータの数が「ファイル1」と「ファイル2」と
では「15」で同じであるという情報しか与えられない
ため、検索者は、どちらのファイルが自分に通している
かを、その場で判断することができなかった。In such a case, the searcher is only given the information that the number of data containing the search keyword , I couldn't decide on the spot which file was going through me.
なお、−旦、検索ファイルを固定したあとは。By the way, after fixing the search file.
キーワード変換部1から出力された検索キーワードを、
該検索ファイルに出力し、信号線16を経由して検索結
果を表示部5に出力すればよい。The search keyword output from the keyword conversion unit 1 is
It is sufficient to output the search results to the search file and output the search results to the display section 5 via the signal line 16.
以上説明したように1本発明によれば、素人がデータベ
ースを検索する場合であっても、容易に検索キーワード
を設定でき、また、検索内容に最も適したファイルをデ
ータベースから容易に選択することができる。As explained above, according to the present invention, even when an amateur searches a database, it is possible to easily set search keywords and to easily select the file most suitable for the search content from the database. can.
第1図は本発明の一実施例、第2図はヒストグラム計算
部で計算されたヒストグラムの表示例を示す。
1・・・キーワード変換部、2・・・キーワード辞書。
3・・・ヒストグラム計算部、4.4’ ・・・データ
ベース、5・・・表示部、11ないし16・・・信号線
。FIG. 1 shows an embodiment of the present invention, and FIG. 2 shows a display example of a histogram calculated by a histogram calculating section. 1...Keyword converter, 2...Keyword dictionary. 3... Histogram calculation section, 4.4'... Database, 5... Display section, 11 to 16... Signal line.
Claims (1)
、検索者が希望する内容のデータを多く含んでいる1つ
以上のファイルを選択するデータベース検索装置におい
て、 検索キーワード又は検索キーワードを論理式によって組
み合わせた検索式に適合するデータを各ファイルの中か
ら検索し、該検索データの各々に付与されたキーワード
の同一ファイル内あるいは特定した複数個のファイル内
での出現頻度を計算してヒストグラムを求め、該ヒスト
グラムを表示するようにした ことを特徴とするデータベース検索システム。[Claims] In a database search device that selects one or more files containing a large amount of data with content desired by a searcher from one or more databases containing a plurality of files, the database search device includes: a search keyword or a search; Search each file for data that matches a search formula that combines keywords using a logical formula, and calculate the frequency of occurrence of the keywords assigned to each of the search data within the same file or within multiple specified files. What is claimed is: 1. A database search system characterized in that the histogram is obtained by calculating the histogram, and the histogram is displayed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2045246A JPH03246764A (en) | 1990-02-26 | 1990-02-26 | Data base retrieving system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2045246A JPH03246764A (en) | 1990-02-26 | 1990-02-26 | Data base retrieving system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03246764A true JPH03246764A (en) | 1991-11-05 |
Family
ID=12713906
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2045246A Pending JPH03246764A (en) | 1990-02-26 | 1990-02-26 | Data base retrieving system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH03246764A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005259088A (en) * | 2004-03-15 | 2005-09-22 | Kousaku Ookubo | System and computer software program for it for visually processing target information in relation with knowledge accumulation |
-
1990
- 1990-02-26 JP JP2045246A patent/JPH03246764A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005259088A (en) * | 2004-03-15 | 2005-09-22 | Kousaku Ookubo | System and computer software program for it for visually processing target information in relation with knowledge accumulation |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7260570B2 (en) | Retrieving matching documents by queries in any national language | |
US6952691B2 (en) | Method and system for searching a multi-lingual database | |
US6442540B2 (en) | Information retrieval apparatus and information retrieval method | |
US5991755A (en) | Document retrieval system for retrieving a necessary document | |
US10552467B2 (en) | System and method for language sensitive contextual searching | |
Plachouras et al. | Interacting with financial data using natural language | |
US20070219986A1 (en) | Method and apparatus for extracting terms based on a displayed text | |
US20100293162A1 (en) | Automated Keyword Generation Method for Searching a Database | |
JP2001043236A (en) | Synonym extracting method, document retrieving method and device to be used for the same | |
JPH03172966A (en) | Similar document retrieving device | |
JP2000200281A (en) | Device and method for information retrieval and recording medium where information retrieval program is recorded | |
JPH1049543A (en) | Document retrieval device | |
JP3331692B2 (en) | Heterogeneous dictionary creation support system | |
JPH03246764A (en) | Data base retrieving system | |
CN112765311A (en) | Method for searching referee document | |
JPH03132872A (en) | Index information generating device | |
JP3328104B2 (en) | Keyword automatic extraction device and document search device | |
JP2732661B2 (en) | Text type database device | |
JP4497337B2 (en) | Concept search device and recording medium recording computer program | |
JPH06124305A (en) | Document retrieving method | |
JPH01243116A (en) | Method for processing japanese sentence | |
JPH03156677A (en) | Composite data base system | |
JPH03194653A (en) | Method for retrieving abbreviated word in information retrieval system | |
JPH0793345A (en) | Document retrieval device | |
JPH1185765A (en) | Retrieval system for document with tag |