JPH0773197A - Supporting system for preparing different notation word dictionary - Google Patents

Supporting system for preparing different notation word dictionary

Info

Publication number
JPH0773197A
JPH0773197A JP5218957A JP21895793A JPH0773197A JP H0773197 A JPH0773197 A JP H0773197A JP 5218957 A JP5218957 A JP 5218957A JP 21895793 A JP21895793 A JP 21895793A JP H0773197 A JPH0773197 A JP H0773197A
Authority
JP
Japan
Prior art keywords
different notation
word
notation word
keyword
different
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5218957A
Other languages
Japanese (ja)
Other versions
JP3331692B2 (en
Inventor
Hide Fuji
秀 富士
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP21895793A priority Critical patent/JP3331692B2/en
Publication of JPH0773197A publication Critical patent/JPH0773197A/en
Application granted granted Critical
Publication of JP3331692B2 publication Critical patent/JP3331692B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PURPOSE:To prepare a different notation word dictionary which is comprehensively provided with different notation words existing in a key word index concerning a different notation word preparation supporting system used in an in an information retrieving system by key word retrieval. CONSTITUTION:The dictionary is formed with an entry word fetching means 1 fetching key words in order from the key word index A of the information retrieving system and making it an entry word B, different notation word extraction means 2 comparing the entry word B and each key word within the key word index A to calculate similarity and extracting the ones of not less similarity than a specified value as a different notation word C, and a dictionary registering means 3 registering the entry word B and the different notation word C by coordinating them.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、キーワード検索による
情報検索システムにおいて使用される異表記語辞書の作
成を支援する装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an apparatus for supporting the creation of a different notation dictionary used in an information search system by keyword search.

【0002】[0002]

【従来の技術】キーワード検索による情報検索システム
は、キーワードと情報(文献・文書)とを対応付けて格
納しておき、キーワードから格納情報を検索できるよう
に構成されている。キーワードとそれに対する情報との
対応関係、すなわちキーワードとそのキーワードを内部
にもつ文献・文書の番号のリストとの対応を網羅したも
のがキーワードインデックスである。このような検索シ
ステムでは、検索者の入力キーワードがシステムのもっ
ているキーワード(キーワードインデックスにあるキー
ワード)と完全に一致した場合にしか格納情報を取り出
すことができない。表記に揺れがあると検索者の意図し
た検索が行なわれない場合が起きる。例えば、ある文献
が情報検索システム内では「シュミレーション」という
キーワードに対応付けられている場合、入力キーワード
が「シミュレーション」であると、この文献は検索する
ことができない。このような異表記語による表記の揺れ
に対応できるシステムとして、同義語辞書を備えた情報
検索システムがある。同義語辞書を備えたシステムで
は、異表記語キーワードを事前に元のキーワードの同義
語として登録しておき、検索のさいには異表記語キーワ
ードも一緒に使って検索を行なう。前記の例でいえば、
「シュミレーション」を「シミュレーション」の同義語
キーワードとして登録しておき、「シミュレーション」
という入力に対して「シミュレーション」の他に「シュ
ミレーション」でも検索を行なう。
2. Description of the Related Art An information retrieval system based on keyword retrieval is constructed so that keywords and information (documents / documents) are stored in association with each other, and stored information can be retrieved from the keywords. A keyword index covers a correspondence relationship between a keyword and information corresponding thereto, that is, a correspondence between a keyword and a list of document / document numbers having the keyword therein. In such a search system, the stored information can be retrieved only when the input keyword of the searcher exactly matches the keyword that the system has (the keyword in the keyword index). If there is a fluctuation in the notation, the search intended by the searcher may not be performed. For example, when a certain document is associated with the keyword “simulation” in the information retrieval system, this document cannot be searched if the input keyword is “simulation”. An information retrieval system equipped with a synonym dictionary is available as a system capable of coping with the fluctuation of the notation using the different notation words. In a system equipped with a synonym dictionary, a different notation keyword is registered in advance as a synonym of the original keyword, and the different notation keyword is also used for the search. In the example above,
"Simulation" is registered as a synonym keyword for "Simulation", and "Simulation" is registered.
In addition to "simulation", search for "simulation" in response to the input.

【0003】同義語辞書は一般的に手作業で見出し語と
同義語(ここでは異表記語)との対応を登録することに
より作成する。
A synonym dictionary is generally created by manually registering the correspondence between a headword and a synonym (here, a different notation).

【0004】[0004]

【発明が解決しようとする課題】同義語辞書(の一種と
しての異表記語辞書)の作成を手作業によって行なう従
来の方法の場合、どの様な語を見出し語とし、対応する
キーワードを何にするかは作成者に任されていた。従っ
て異表記語をすべて登録するのはかなり困難である。ま
た異表記語辞書の見出し語に対応する異表記語キーワー
ドは、その情報検索システムのキーワードインデックス
に存在するキーワードであるべきである。キーワードイ
ンデックスに存在しないキーワードに対応する文献はそ
のシステムには存在しないから、登録しても意味がない
からである。人手による登録方法ではこれを保証するの
は難しい。異表記語を生成する支援システムも存在す
る。このような支援システムは、手作業で入力された見
出し語に対して文字変換規則を用いて異表記語を生成す
るものである。しかし、このような文字変換規則による
異表記語作成支援システムはエディタ的用途に作られた
もので、キーワード検索用ではなく、異表記語は無関係
に合成されるため、キーワードインデックスに含まれて
いる保証はない。
In the conventional method of manually creating a synonym dictionary (a different notation dictionary as a type), what kind of word is used as a headword and what is the corresponding keyword? It was up to the creator to decide. Therefore, it is quite difficult to register all the different notation words. Further, the different notation word keyword corresponding to the entry word of the different notation word dictionary should be a keyword existing in the keyword index of the information search system. Documents corresponding to keywords that do not exist in the keyword index do not exist in the system, and therefore there is no point in registering them. It is difficult to guarantee this by manual registration method. There are also support systems for generating different notation words. Such a support system generates a different notation word by using a character conversion rule with respect to an entry word manually input. However, the different notation word creation support system based on such character conversion rules is made for editorial use, and is not included in the keyword search. Since the different notation words are combined independently, they are included in the keyword index. There is no guarantee.

【0005】本発明は、キーワードインデックス内のキ
ーワード同士の類似性を判断することにより異表記語を
生成するようにした、品質の高い異表記語辞書作成支援
装置を実現することを目的としている。
It is an object of the present invention to realize a high quality different notation dictionary creation support device which generates different notation words by determining the similarity between keywords in a keyword index.

【0006】[0006]

【課題を解決するための手段】図1は本発明の構成図で
ある。キーワードインデックスA は情報検索システムに
おいて、検索のためのキーワードを集めたファイルであ
る。また、本装置の出力である異表記語辞書D は、情報
検索システムにおいて同義語辞書として使用されるべき
ものである。
FIG. 1 is a block diagram of the present invention. The keyword index A is a file that collects keywords for searching in the information search system. Further, the different notation word dictionary D, which is the output of this apparatus, should be used as a synonym dictionary in the information retrieval system.

【0007】第1の発明:情報検索システムのキーワー
ドインデックスA から、順にキーワードを取り出して見
出し語B とする見出し語取り出し手段1と、見出し語B
と、キーワードインデックスA 内の各キーワードとを比
較して類似度を算出し、類似度があらかじめ定めた値以
上のものを異表記語C として抽出する異表記語抽出手段
2と、見出し語B と異表記語C とを対応させて登録する
辞書登録手段3とを設ける。
1st invention: Headword retrieval means 1 for sequentially retrieving keywords from the keyword index A of the information retrieval system to obtain headword B, and headword B
And the respective keywords in the keyword index A to calculate the similarity, and the different notation word extracting means 2 for extracting as the different notation word C the similarity is not less than a predetermined value, and the headword B The dictionary registration means 3 for registering the different notation word C in association with each other is provided.

【0008】第2の発明:第1の発明において、異表記
語抽出手段2は、類似度が高いとして抽出したキーワー
ドの属性が規定の条件を満たす場合に異表記語C とす
る。
Second invention: In the first invention, the different notation word extraction means 2 sets the different notation word C when the attribute of the extracted keyword as having a high degree of similarity satisfies a prescribed condition.

【0009】第3の発明:第1の発明または第2の発明
において、異表記語抽出手段2が抽出した異表記語を候
補語として表示画面に表示する異表記語候補提示手段4
と、表示画面に表示された候補語のうち、操作者によっ
て選択されたものを異表記語C として残す異表記語選択
手段5とを設ける。
Third invention: In the first invention or the second invention, the different notation word presenting means 4 for displaying the different notation word extracted by the different notation word extracting means 2 on the display screen as a candidate word.
And different notation word selecting means 5 for leaving the one selected by the operator as the different notation word C among the candidate words displayed on the display screen.

【0010】第4の発明:第1ないし第3の発明におい
て、異表記語抽出手段2が抽出した異表記語を候補語と
して表示画面に表示する異表記語候補提示手段4と、入
力された新たなキーワードを異表記語C として追加する
異表記語追加手段6とを設ける。
Fourth invention: In the first to third inventions, the different notation word candidate presenting means 4 for displaying the different notation word extracted by the different notation word extracting means 2 on the display screen as a candidate word is inputted. The different notation word adding means 6 for adding a new keyword as the different notation word C is provided.

【0011】第5の発明:第4の発明において、異表記
語追加手段6は、新たに入力されたキーワードがキーワ
ードインデックスA に存在するか否かを調べ、ない場合
には、入力されたキーワードを見出し語とし、初めの見
出し語とその他の候補語を異表記語とする。
Fifth invention: In the fourth invention, the different notation word adding means 6 checks whether or not the newly input keyword is present in the keyword index A, and if not, the input keyword is input. Is a headword, and the first headword and other candidate words are different notation words.

【0012】[0012]

【作用】見出し語取り出し手段1は、キーワードインデ
ックスA にあるキーワードを一つずつ取り出し、見出し
語とする。異表記語抽出手段2は、それに対してキーワ
ードインデックスから類似度の高いキーワードを抽出す
る。辞書登録手段3は、類似度の高いキーワードを異表
記語として見出し語と対応させて登録する。異表記語が
ない場合は見出し語も登録しない。このようにしてキー
ワードインデックスをすべて処理すると自動的に異表記
語辞書D が生成される。
Function: The headword extracting means 1 takes out the keywords in the keyword index A one by one and sets them as headwords. The different notation word extraction means 2 extracts a keyword having a high degree of similarity from the keyword index. The dictionary registration means 3 registers a keyword having a high degree of similarity as a different notation word in association with an entry word. If there is no different notation word, no entry word is registered. In this way, when all the keyword indexes are processed, the different notation word dictionary D is automatically generated.

【0013】第2の発明は、類似度の高いキーワードの
内、属性条件の悪いものは除外することにより、異表記
語辞書D の品質を高くする。第3の発明は、自動的に抽
出した類似語を表示装置の画面に表示し、操作者の判断
を入れることができるようにすることにより、異表記語
辞書D の品質を高くする。
The second aspect of the present invention enhances the quality of the different notation word dictionary D by excluding keywords having bad attribute conditions from keywords having high similarity. A third aspect of the present invention enhances the quality of the different notation dictionary D 1 by displaying the automatically extracted similar words on the screen of the display device so that the operator can make a judgment.

【0014】第4の発明は、操作者が異表記語を追加す
ることができるようにすることにより、異表記語辞書D
の品質を高くする。第5の発明は、操作者が異表記語と
して追加したキーワードがキーワードインデックスA に
存在しない場合には、そのキーワードを見出し語とする
ことにより、異表記語辞書D の品質を高くする。
The fourth aspect of the present invention is to allow the operator to add different notation words, thereby making the different notation word dictionary D
Improve the quality of. In the fifth invention, when the keyword added by the operator as a different notation word does not exist in the keyword index A 1, the keyword is used as a headword, thereby improving the quality of the different notation dictionary D 1.

【0015】このように構成することにより、生成した
異表記語辞書D は情報検索システムにおいて有効な同義
語辞書として使用することができる。もともとキーワー
ドインデックスA に存在するキーワード同士の類似度を
判断して異表記語とするため、むだな語が入ることはな
い。
With this configuration, the generated different notation word dictionary D can be used as an effective synonym dictionary in the information search system. Originally, since the similarities between the keywords existing in the keyword index A are judged to be different notation words, no unnecessary words are included.

【0016】[0016]

【実施例】図1の構成図を参照しながら処理手順を説明
する。 見出し語取り出し手段1はキーワードインデックス
A から取り出したキーワードをバッファにセットする。
これが見出し語B である。 異表記語抽出手段2は、バッファのキーワード(見
出し語)と、キーワードインデックスA のキーワード群
を比較して類似するキーワードを抽出する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS The processing procedure will be described with reference to the block diagram of FIG. Headword extraction means 1 is a keyword index
Set the keyword extracted from A into the buffer.
This is headword B. The different notation word extraction means 2 compares the keyword (headword) in the buffer with the keyword group of the keyword index A 1 and extracts similar keywords.

【0017】キーワード同士の類似を判断するには公知
の手段を用いればよい。図2に類似度の算定の説明図を
示す。2つの文字列の類似を判定するには、文字の対応
付けを行い、類似度評価を行って類似度を数値で表現す
る(類似度の算出)。対応付けには、LCS(Longest
Common Subsequence: 最長共通部分文字列) 法や、ヘッ
ケル(Heckel)法などがある。類似度評価は対応付けの終
わった文字列の対に対して、類似度の要素により類似度
を数値化する。類似度の要素として一致文字列長、不一
致文字列長、一致区分数などがある。一致文字列長が長
いほど、不一致文字列長が短いほど類似度は高い。同じ
一致文字列長でも一致区分数が少ないほど類似度は高
い。例えば、各類似度要素に重み係数を乗じて加算した
値を類似度とする。 類似キーワードとして抽出されたものでも、使用頻
度が少ないものや、文字数の違いが大きいものは有効で
ないので削除する。図3に有効キーワードの判定例を示
す。(A)は見出し語「シュミレーション」に対して抽
出された類似キーワードであるが、「スィミレーショ
ン」は出現頻度が1しかない。また「コンフィギュレー
ション」は文字列の長さが違いすぎる。この様な属性条
件をあらかじめ設定しておき、条件を満たすものだけを
残す。この例で属性条件を出現頻度3以上、文字列長差
2以下とすると、(B)に示す「シミュレーション」と
「エミュレーション」が異表記語候補として残る。 異表記語候補提示手段4によって、異表記語候補を
表示装置に表示する。 異表記語選択手段5は、操作者の指示に従って候補
キーワードの内のいくつかを削除する。 異表記語追加手段6は、操作者の指示に従って候補
キーワードを追加する。 また、追加された候補キーワードが、キーワードイ
ンデックスD に存在するか否か調べる。もし存在しなけ
れば、警告を示し、指示があれば、この語と見出し語と
を入れ替える。 辞書登録手段3は、以上のようにして決定した見出
し語と異表記語とを対応させて異表記語辞書のエントリ
とし、異表記語辞書D に登録する。異表記語辞書のエン
トリの例を図4に示す。 以上の処理をキーワードインデックスD の全キーワ
ードに対して行なうことにより、異表記語辞書が完成す
る。
A known means may be used to judge the similarity between keywords. FIG. 2 shows an explanatory diagram of the calculation of the degree of similarity. To determine the similarity between two character strings, the characters are associated with each other, the similarity is evaluated, and the similarity is expressed by a numerical value (calculation of the similarity). LCS (Longest
Common Subsequence: The longest common substring method and the Heckel method. In the similarity evaluation, the similarity of each pair of character strings that has been associated is digitized by the element of the similarity. Elements of the degree of similarity include a matching character string length, a non-matching character string length, and the number of matching categories. The longer the matching character string length and the shorter the non-matching character string length, the higher the degree of similarity. Even with the same matching character string length, the smaller the number of matching categories, the higher the similarity. For example, a value obtained by multiplying each similarity factor by a weighting factor and adding the result is set as the similarity factor. Even if the keywords are extracted as similar keywords, those that are used less frequently or that have a large difference in the number of characters are not valid and are deleted. FIG. 3 shows an example of determination of valid keywords. (A) is a similar keyword extracted for the headword "Simulation", but "Simulation" has only one appearance frequency. In addition, the length of the strings in the "configuration" is too different. Such attribute conditions are set in advance, and only those satisfying the conditions are left. In this example, if the attribute conditions are the occurrence frequency of 3 or more and the character string length difference of 2 or less, "simulation" and "emulation" shown in (B) remain as different notation word candidates. The different notation word candidate presenting means 4 displays the different notation word candidates on the display device. The different notation word selection means 5 deletes some of the candidate keywords according to the instruction of the operator. The different notation word adding means 6 adds a candidate keyword according to an instruction from the operator. Also, it is checked whether or not the added candidate keyword exists in the keyword index D 1. If it does not exist, a warning is given and this word is replaced with the entry word if instructed. The dictionary registration means 3 associates the entry word determined as described above with the different notation word as an entry in the different notation word dictionary and registers it in the different notation word dictionary D 1. An example of entries in the different notation dictionary is shown in FIG. By performing the above processing for all the keywords of the keyword index D, the different notation word dictionary is completed.

【0018】図5は以上の処理における、〜段階に
おける画面表示例を示したものである。(A)はの異
表記語候補提示手段4によって、異表記語候補を表示装
置に表示した状態である。キーワードバッファから「シ
ュミレーション」というキーワードが取り出され、見出
しとして表示され、見出し語「シュミレーション」に対
して、異表記語候補として「シミュレーション」「シミ
ュレイション」「エミュレーション」が表示されてい
る。画面に表示された異表記語は、全て選択状態になっ
ている(デフォルト設定)。このままでよければ、操作
者はリターンキーを打鍵する等により登録指示を行な
う。もし表示された中に不適当なキーワードがあれば、
非選択の指示を入力してから登録指示を行なう。ここ
で、操作者が「エミュレーション」は「シミュレーショ
ン」の異表記語としては登録したくないとき、非選択を
指示すると、(B)に示すように不適当なキーワードは
削除される。(C)は、操作者が「シミレーション」を
異表記語として思いつき、新たに登録する場合を示す。
入力された新たなキーワードは画面の入力行に示され
る。この入力キーワードはキーワードインデックスに存
在すれば登録対象となる。
FIG. 5 shows an example of the screen display in the steps of the above processing. (A) is a state in which the different notation word candidates are displayed on the display device by the different notation word candidate presenting means 4. The keyword "simulation" is extracted from the keyword buffer and displayed as a heading, and "simulation", "simulation", and "emulation" are displayed as different notation word candidates for the heading "simulation". All the different notation words displayed on the screen are in the selected state (default setting). If this is acceptable, the operator gives a registration instruction by hitting the return key or the like. If there are inappropriate keywords displayed,
Input the non-selection instruction and then give the registration instruction. Here, when the operator does not want to register "emulation" as a different notation of "simulation" and gives an instruction for non-selection, an inappropriate keyword is deleted as shown in (B). (C) shows a case where the operator has come up with "simulation" as a different notation word and newly registers it.
The new keyword entered is shown on the input line of the screen. If this input keyword exists in the keyword index, it will be registered.

【0019】もし、存在しなければ画面上で警告し、操
作者の指示があれば、そのとき表示されている見出し語
と入れ替える。(D)はその指示後の状態を示す。以
上、発明の全てを適用した実施例を説明したが、一部を
適用するのみでもよいことは言うまでもない。また、本
実施例では独立した異表記語辞書作成支援装置として説
明したが、通常は情報検索システムの一部として組み込
まれるべきものである。その場合、異表記語辞書は同義
語辞書の一部を成すものとなる。
If it does not exist, a warning is given on the screen, and if there is an instruction from the operator, the headword displayed at that time is replaced. (D) shows the state after the instruction. Although the embodiments to which all the inventions are applied have been described above, it goes without saying that only a part of them may be applied. Further, in the present embodiment, the description was made as an independent different notation word dictionary creation support device, but it should normally be incorporated as a part of an information search system. In that case, the synonym dictionary becomes part of the synonym dictionary.

【0020】[0020]

【発明の効果】以上説明したように、本発明によれば異
表記語を網羅的にもった異表記語辞書を作成することが
できる。しかもその異表記語は必ずキーワードインデッ
クスに存在するものであるので、むだなキーワードを含
まない。従ってキーワード検索に適した品質の高い異表
記語辞書を作ることができる。
As described above, according to the present invention, it is possible to create a different notation word dictionary having a comprehensive list of different notation words. Moreover, since the different notation always exists in the keyword index, it does not include a wasteful keyword. Therefore, it is possible to create a high quality different notation dictionary suitable for keyword search.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の構成図である。FIG. 1 is a configuration diagram of the present invention.

【図2】類似度の算定の説明図である。FIG. 2 is an explanatory diagram of calculation of similarity.

【図3】有効キーワード判定の説明図である。FIG. 3 is an explanatory diagram of valid keyword determination.

【図4】異表記語辞書エントリの例を示す図である。FIG. 4 is a diagram showing an example of a different notation word dictionary entry.

【図5】実施例の操作を説明する画面表示の例を示す図
である。
FIG. 5 is a diagram showing an example of a screen display for explaining the operation of the embodiment.

【符号の説明】[Explanation of symbols]

1 見出し語取り出し手段 2 異表記語抽出手段 3 辞書登録手段 4 異表記語候補提示手段 5 異表記語選択手段 6 異表記語追加手段 A キーワードインデックス B 見出し
語 C 異表記語 D 異表記
語辞書
1 headword extracting means 2 different notation word extracting means 3 dictionary registering means 4 different notation word candidate presenting means 5 different notation word selecting means 6 different notation word adding means A keyword index B heading C different notation word D different notation dictionary

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G06F 17/21 7315−5L G06F 15/20 550 K 7315−5L 570 N ─────────────────────────────────────────────────── ─── Continuation of the front page (51) Int.Cl. 6 Identification code Internal reference number FI Technical display location G06F 17/21 7315-5L G06F 15/20 550 K 7315-5L 570 N

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 情報検索システムのキーワードインデッ
クス(A) から、順にキーワードを取り出して見出し語
(B) とする見出し語取り出し手段(1)と、 見出し語(B) と、キーワードインデックス(A) 内の各キ
ーワードとを比較して類似度を算出し、類似度があらか
じめ定めた値以上のものを異表記語(C) として抽出する
異表記語抽出手段(2)と、 見出し語(B) と異表記語(C) とを対応させて登録する辞
書登録手段(3)とより成る異表記語辞書作成支援装
置。
1. A keyword is sequentially extracted from a keyword index (A) of an information retrieval system, and a headword is extracted.
The headword extracting means (1) (B) is compared with the headword (B) and each keyword in the keyword index (A) to calculate the similarity, and the similarity is equal to or more than a predetermined value. Different notation word extraction means (2) for extracting things as different notation words (C) and dictionary registration means (3) for registering headwords (B) and different notation words (C) in association with each other Notation word dictionary creation support device.
【請求項2】 異表記語抽出手段(2)は、類似度が高
いとして抽出したキーワードの属性が規定の条件を満た
す場合に異表記語(C) とすることを特徴とする請求項1
に記載の異表記語辞書作成支援装置。
2. The different notation word extracting means (2) sets the different notation word (C) when the attribute of the keyword extracted as having high similarity satisfies a prescribed condition.
Different notation word dictionary creation support device described in.
【請求項3】 異表記語抽出手段(2)が抽出した異表
記語を候補語として表示画面に表示する異表記語候補提
示手段(4)と、 表示画面に表示された候補語のうち、操作者によって選
択されたものを異表記語(C) として残す異表記語選択手
段(5)とを設けたことを特徴とする請求項1または請
求項2に記載の異表記語辞書作成支援装置。
3. A different notation word candidate presenting means (4) for displaying the different notation word extracted by the different notation word extracting means (2) as a candidate word on the display screen, and a candidate word displayed on the display screen, The different notation word dictionary creation support device according to claim 1 or 2, further comprising: different notation word selection means (5) for leaving the one selected by the operator as a different notation word (C). .
【請求項4】 異表記語抽出手段(2)が抽出した異表
記語を候補語として表示画面に表示する異表記語候補提
示手段(4)と、 入力された新たなキーワードを異表記語(C) として追加
する異表記語追加手段(6)とを設けたことを特徴とす
る請求項1ないし請求項3に記載の異表記語辞書作成支
援装置。
4. The different notation word candidate presenting means (4) for displaying the different notation word extracted by the different notation word extracting means (2) as a candidate word on the display screen, and the new notation word inputted as the different notation word ( The different notation word dictionary creation support device according to any one of claims 1 to 3, further comprising: different notation word addition means (6) added as C).
【請求項5】 異表記語追加手段(6)は、新たに入力
されたキーワードがキーワードインデックス(A) に存在
するか否かを調べ、ない場合には、入力されたキーワー
ドを見出し語とし、初めの見出し語とその他の候補語を
異表記語とすることを特徴とする請求項4に記載の異表
記語辞書作成支援装置。
5. The different notation word adding means (6) checks whether or not the newly input keyword is present in the keyword index (A), and if not, the input keyword is used as a headword, The different notation word dictionary creation support device according to claim 4, wherein the first headword and the other candidate words are different notation words.
JP21895793A 1993-09-03 1993-09-03 Heterogeneous dictionary creation support system Expired - Fee Related JP3331692B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21895793A JP3331692B2 (en) 1993-09-03 1993-09-03 Heterogeneous dictionary creation support system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21895793A JP3331692B2 (en) 1993-09-03 1993-09-03 Heterogeneous dictionary creation support system

Publications (2)

Publication Number Publication Date
JPH0773197A true JPH0773197A (en) 1995-03-17
JP3331692B2 JP3331692B2 (en) 2002-10-07

Family

ID=16727998

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21895793A Expired - Fee Related JP3331692B2 (en) 1993-09-03 1993-09-03 Heterogeneous dictionary creation support system

Country Status (1)

Country Link
JP (1) JP3331692B2 (en)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09319767A (en) * 1996-05-29 1997-12-12 Oki Electric Ind Co Ltd Synonym dictionary registering method
JP2002366567A (en) * 2001-06-13 2002-12-20 Hitachi Ltd Retrieval system by free setting of substitute keyword
JP2004110633A (en) * 2002-09-20 2004-04-08 Ricoh Co Ltd Device, method for creating different notation dictionary and program for making computer execute its method
JP2006221532A (en) * 2005-02-14 2006-08-24 Nec Corp Different notation development method, dictionary registeration method, language analysis method and program
JP2009015417A (en) * 2007-07-02 2009-01-22 Hitachi Ltd Similar word determination auxiliary device and similar word determination auxiliary method
JP2010257417A (en) * 2009-04-28 2010-11-11 Pioneer Electronic Corp Apparatus, method and program for controlling display, and recording medium
JP2012022354A (en) * 2010-07-12 2012-02-02 Fujitsu Ltd Abbreviation search device, method and program, and data parse device comprising abbreviation search function
US8509602B2 (en) 2004-08-05 2013-08-13 Sony Corporation Recording control apparatus and method, and program
JP2016139164A (en) * 2015-01-26 2016-08-04 日本電気株式会社 Orthographic variant dictionary creation support device, orthographic variant dictionary creation support method, and orthographic variant dictionary creation support program
JP2020004005A (en) * 2018-06-27 2020-01-09 Nttテクノクロス株式会社 Management device, management method and program

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6211932A (en) * 1985-07-10 1987-01-20 Hitachi Ltd Information retrieving method
JPH0439769A (en) * 1990-06-06 1992-02-10 Nippon Telegr & Teleph Corp <Ntt> Thesaurus generating device
JPH04123264A (en) * 1990-09-14 1992-04-23 Hitachi Ltd Device for preparing relational word table and device for retrieving document
JPH04152468A (en) * 1990-10-17 1992-05-26 Hitachi Ltd Document retrieving device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6211932A (en) * 1985-07-10 1987-01-20 Hitachi Ltd Information retrieving method
JPH0439769A (en) * 1990-06-06 1992-02-10 Nippon Telegr & Teleph Corp <Ntt> Thesaurus generating device
JPH04123264A (en) * 1990-09-14 1992-04-23 Hitachi Ltd Device for preparing relational word table and device for retrieving document
JPH04152468A (en) * 1990-10-17 1992-05-26 Hitachi Ltd Document retrieving device

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09319767A (en) * 1996-05-29 1997-12-12 Oki Electric Ind Co Ltd Synonym dictionary registering method
JP2002366567A (en) * 2001-06-13 2002-12-20 Hitachi Ltd Retrieval system by free setting of substitute keyword
JP4617608B2 (en) * 2001-06-13 2011-01-26 株式会社日立製作所 Search system with free alternative keyword settings
JP2004110633A (en) * 2002-09-20 2004-04-08 Ricoh Co Ltd Device, method for creating different notation dictionary and program for making computer execute its method
US8509602B2 (en) 2004-08-05 2013-08-13 Sony Corporation Recording control apparatus and method, and program
JP2006221532A (en) * 2005-02-14 2006-08-24 Nec Corp Different notation development method, dictionary registeration method, language analysis method and program
JP2009015417A (en) * 2007-07-02 2009-01-22 Hitachi Ltd Similar word determination auxiliary device and similar word determination auxiliary method
JP2010257417A (en) * 2009-04-28 2010-11-11 Pioneer Electronic Corp Apparatus, method and program for controlling display, and recording medium
JP2012022354A (en) * 2010-07-12 2012-02-02 Fujitsu Ltd Abbreviation search device, method and program, and data parse device comprising abbreviation search function
JP2016139164A (en) * 2015-01-26 2016-08-04 日本電気株式会社 Orthographic variant dictionary creation support device, orthographic variant dictionary creation support method, and orthographic variant dictionary creation support program
JP2020004005A (en) * 2018-06-27 2020-01-09 Nttテクノクロス株式会社 Management device, management method and program

Also Published As

Publication number Publication date
JP3331692B2 (en) 2002-10-07

Similar Documents

Publication Publication Date Title
JP3132738B2 (en) Text search method
US6496820B1 (en) Method and search method for structured documents
JP3691844B2 (en) Document processing method
JPH06131398A (en) Method for retrieving plurality of documents
US10140297B2 (en) Supplementing search results with information of interest
JPH03172966A (en) Similar document retrieving device
JP4160548B2 (en) Document summary creation system, method, and program
US6278990B1 (en) Sort system for text retrieval
JP2000200281A (en) Device and method for information retrieval and recording medium where information retrieval program is recorded
JP3331692B2 (en) Heterogeneous dictionary creation support system
JP4935243B2 (en) Search program, information search device, and information search method
JPH06314296A (en) Information retrieving system
JPH0844771A (en) Information retrieval device
JP2005107931A (en) Image search apparatus
JPH07325834A (en) Retrieval device
JP3558267B2 (en) Document search device
JP3249743B2 (en) Document search system
JP4024906B2 (en) Tagged document search system
JP3693734B2 (en) Information retrieval apparatus and information retrieval method thereof
JPH08235204A (en) Method and device for retrieving document
JP2002117043A (en) Device and method for document retrieval, and recording medium with recorded program for implementing the same method
JPH07296005A (en) Japanese text registration/retrieval device
JP2001092831A (en) Device and method for document retrieval
JP2000090110A (en) Full-text retrieval method, device therefor and recording medium recorded with full-text retrieving program
JPH09269952A (en) Document retrieval device/method

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020625

LAPS Cancellation because of no payment of annual fees