JP3331692B2 - Heterogeneous dictionary creation support system - Google Patents

Heterogeneous dictionary creation support system

Info

Publication number
JP3331692B2
JP3331692B2 JP21895793A JP21895793A JP3331692B2 JP 3331692 B2 JP3331692 B2 JP 3331692B2 JP 21895793 A JP21895793 A JP 21895793A JP 21895793 A JP21895793 A JP 21895793A JP 3331692 B2 JP3331692 B2 JP 3331692B2
Authority
JP
Japan
Prior art keywords
word
allotted
keyword
headword
notation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP21895793A
Other languages
Japanese (ja)
Other versions
JPH0773197A (en
Inventor
秀 富士
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP21895793A priority Critical patent/JP3331692B2/en
Publication of JPH0773197A publication Critical patent/JPH0773197A/en
Application granted granted Critical
Publication of JP3331692B2 publication Critical patent/JP3331692B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、キーワード検索による
情報検索システムにおいて使用される異表記語辞書の作
成を支援する装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an apparatus for supporting creation of an allotted word dictionary used in an information search system by keyword search.

【0002】[0002]

【従来の技術】キーワード検索による情報検索システム
は、キーワードと情報(文献・文書)とを対応付けて格
納しておき、キーワードから格納情報を検索できるよう
に構成されている。キーワードとそれに対する情報との
対応関係、すなわちキーワードとそのキーワードを内部
にもつ文献・文書の番号のリストとの対応を網羅したも
のがキーワードインデックスである。このような検索シ
ステムでは、検索者の入力キーワードがシステムのもっ
ているキーワード(キーワードインデックスにあるキー
ワード)と完全に一致した場合にしか格納情報を取り出
すことができない。表記に揺れがあると検索者の意図し
た検索が行なわれない場合が起きる。例えば、ある文献
が情報検索システム内では「シュミレーション」という
キーワードに対応付けられている場合、入力キーワード
が「シミュレーション」であると、この文献は検索する
ことができない。このような異表記語による表記の揺れ
に対応できるシステムとして、同義語辞書を備えた情報
検索システムがある。同義語辞書を備えたシステムで
は、異表記語キーワードを事前に元のキーワードの同義
語として登録しておき、検索のさいには異表記語キーワ
ードも一緒に使って検索を行なう。前記の例でいえば、
「シュミレーション」を「シミュレーション」の同義語
キーワードとして登録しておき、「シミュレーション」
という入力に対して「シミュレーション」の他に「シュ
ミレーション」でも検索を行なう。
2. Description of the Related Art An information retrieval system based on keyword retrieval is configured so that keywords and information (documents / documents) are stored in association with each other and stored information can be retrieved from the keywords. A keyword index covers a correspondence between a keyword and information corresponding thereto, that is, a correspondence between a keyword and a list of numbers of documents and documents having the keyword therein. In such a search system, stored information can be extracted only when the input keyword of the searcher completely matches the keyword (keyword in the keyword index) possessed by the system. If the notation fluctuates, a search intended by the searcher may not be performed. For example, if a document is associated with the keyword “simulation” in the information search system, the document cannot be searched if the input keyword is “simulation”. As a system that can cope with the fluctuation of the notation due to such a different notation word, there is an information retrieval system including a synonym dictionary. In a system provided with a synonym dictionary, a heterologous keyword is registered in advance as a synonym of the original keyword, and a search is performed by using the synonym keyword together with the search. In the above example,
Register "Simulation" as a synonym keyword for "Simulation"
In response to the input “Simulation”, a search is also performed for “Simulation”.

【0003】同義語辞書は一般的に手作業で見出し語と
同義語(ここでは異表記語)との対応を登録することに
より作成する。
A synonym dictionary is generally created by manually registering the correspondence between a headword and a synonym (here, a different notation).

【0004】[0004]

【発明が解決しようとする課題】同義語辞書(の一種と
しての異表記語辞書)の作成を手作業によって行なう従
来の方法の場合、どの様な語を見出し語とし、対応する
キーワードを何にするかは作成者に任されていた。従っ
て異表記語をすべて登録するのはかなり困難である。ま
た異表記語辞書の見出し語に対応する異表記語キーワー
ドは、その情報検索システムのキーワードインデックス
に存在するキーワードであるべきである。キーワードイ
ンデックスに存在しないキーワードに対応する文献はそ
のシステムには存在しないから、登録しても意味がない
からである。人手による登録方法ではこれを保証するの
は難しい。異表記語を生成する支援システムも存在す
る。このような支援システムは、手作業で入力された見
出し語に対して文字変換規則を用いて異表記語を生成す
るものである。しかし、このような文字変換規則による
異表記語作成支援システムはエディタ的用途に作られた
もので、キーワード検索用ではなく、異表記語は無関係
に合成されるため、キーワードインデックスに含まれて
いる保証はない。
According to the conventional method of manually creating a synonym dictionary (heterogram dictionary as a kind of dictionary), what words are used as headwords, and what are the corresponding keywords? It was up to the creator to do it. Therefore, it is very difficult to register all the notations. In addition, the allograph word keyword corresponding to the headword of the allograph word dictionary should be a keyword existing in the keyword index of the information search system. This is because documents corresponding to keywords that do not exist in the keyword index do not exist in the system, and there is no point in registering them. It is difficult to guarantee this with the manual registration method. There is also a support system for generating a notation word. Such a support system generates a variant word using a character conversion rule for a headword entered manually. However, such a notation word creation support system based on the character conversion rules is created for editor-like use, and is not used for keyword search, but is included in the keyword index because the notation words are synthesized independently. There is no guarantee.

【0005】本発明は、キーワードインデックス内のキ
ーワード同士の類似性を判断することにより異表記語を
生成するようにした、品質の高い異表記語辞書作成支援
装置を実現することを目的としている。
[0005] An object of the present invention is to realize a high-quality heterographic word dictionary creation support device that generates heterographic words by determining the similarity between keywords in a keyword index.

【0006】[0006]

【課題を解決するための手段】図1は本発明の構成図で
ある。キーワードインデックスA は情報検索システムに
おいて、検索のためのキーワードを集めたファイルであ
る。また、本装置の出力である異表記語辞書D は、情報
検索システムにおいて同義語辞書として使用されるべき
ものである。
FIG. 1 is a block diagram of the present invention. The keyword index A is a file in which keywords for searching are collected in the information search system. Further, the heterologous word dictionary D output from the present apparatus is to be used as a synonym dictionary in the information retrieval system.

【0007】第1の発明:情報検索システムのキーワー
ドインデックスA から、順にキーワードを取り出して見
出し語B とする見出し語取り出し手段1と、見出し語B
と、キーワードインデックスA 内の各キーワードとを比
較して類似度を算出し、類似度があらかじめ定めた値以
上のものを異表記語C として抽出する異表記語抽出手段
2と、見出し語B と異表記語C とを対応させて登録する
辞書登録手段3とを設ける。
A first invention: a headword extraction means 1 for sequentially extracting keywords from a keyword index A of an information search system to obtain a headword B;
And the respective keywords in the keyword index A to calculate the similarity, and extract the notation word 2 having the similarity not less than a predetermined value as the notation word C; Dictionary registration means 3 for registering the different notation words C in correspondence with each other.

【0008】第2の発明:第1の発明において、異表記
語抽出手段2は、類似度が高いとして抽出したキーワー
ドの属性が規定の条件を満たす場合に異表記語C とす
る。
Second invention: In the first invention, the variant notation extraction means 2 sets the variant notation C when the attribute of the keyword extracted as having high similarity satisfies a prescribed condition.

【0009】第3の発明:第1の発明または第2の発明
において、異表記語抽出手段2が抽出した異表記語を候
補語として表示画面に表示する異表記語候補提示手段4
と、表示画面に表示された候補語のうち、操作者によっ
て選択されたものを異表記語C として残す異表記語選択
手段5とを設ける。
Third invention: In the first invention or the second invention, an allotted word candidate presenting means 4 for displaying the allotted word extracted by the allotted word extracting means 2 as a candidate word on a display screen.
And a notation word selecting means 5 for leaving, as a notation word C, a candidate word selected by the operator among the candidate words displayed on the display screen.

【0010】第4の発明:第1ないし第3の発明におい
て、異表記語抽出手段2が抽出した異表記語を候補語と
して表示画面に表示する異表記語候補提示手段4と、入
力された新たなキーワードを異表記語C として追加する
異表記語追加手段6とを設ける。
Fourth invention: In the first to third inventions, an allotted word candidate presentation unit 4 for displaying the allotted word extracted by the allotted word extraction unit 2 as a candidate word on a display screen; And a notation adding means 6 for adding a new keyword as a notation C.

【0011】第5の発明:第4の発明において、異表記
語追加手段6は、新たに入力されたキーワードがキーワ
ードインデックスA に存在するか否かを調べ、ない場合
には、入力されたキーワードを見出し語とし、初めの見
出し語とその他の候補語を異表記語とする。
Fifth invention: In the fourth invention, the pseudonym adding means 6 checks whether or not the newly input keyword exists in the keyword index A. Is a headword, and the first headword and other candidate words are heterologous words.

【0012】[0012]

【作用】見出し語取り出し手段1は、キーワードインデ
ックスA にあるキーワードを一つずつ取り出し、見出し
語とする。異表記語抽出手段2は、それに対してキーワ
ードインデックスから類似度の高いキーワードを抽出す
る。辞書登録手段3は、類似度の高いキーワードを異表
記語として見出し語と対応させて登録する。異表記語が
ない場合は見出し語も登録しない。このようにしてキー
ワードインデックスをすべて処理すると自動的に異表記
語辞書D が生成される。
The headword extracting means 1 fetches the keywords in the keyword index A one by one and sets them as headwords. The notation extraction unit 2 extracts a keyword having a high degree of similarity from the keyword index. The dictionary registration unit 3 registers a keyword having a high degree of similarity as a notation word in association with the headword. If there is no unusual word, no headword is registered. When all of the keyword indices are processed in this way, an allotted word dictionary D is automatically generated.

【0013】第2の発明は、類似度の高いキーワードの
内、属性条件の悪いものは除外することにより、異表記
語辞書D の品質を高くする。第3の発明は、自動的に抽
出した類似語を表示装置の画面に表示し、操作者の判断
を入れることができるようにすることにより、異表記語
辞書D の品質を高くする。
According to a second aspect of the present invention, the quality of the spelling dictionary D is increased by excluding keywords having a high degree of similarity and having poor attribute conditions. The third aspect of the present invention enhances the quality of the spelling dictionary D by displaying the automatically extracted similar words on the screen of the display device so that the judgment of the operator can be entered.

【0014】第4の発明は、操作者が異表記語を追加す
ることができるようにすることにより、異表記語辞書D
の品質を高くする。第5の発明は、操作者が異表記語と
して追加したキーワードがキーワードインデックスA に
存在しない場合には、そのキーワードを見出し語とする
ことにより、異表記語辞書D の品質を高くする。
According to a fourth aspect of the present invention, an operator can add an alternate notation word, thereby providing an alternate notation dictionary D
To increase the quality. According to the fifth invention, when a keyword added as an allotted word by the operator does not exist in the keyword index A, the quality of the allotted word dictionary D is increased by using the keyword as a headword.

【0015】このように構成することにより、生成した
異表記語辞書D は情報検索システムにおいて有効な同義
語辞書として使用することができる。もともとキーワー
ドインデックスA に存在するキーワード同士の類似度を
判断して異表記語とするため、むだな語が入ることはな
い。
[0015] With this configuration, the generated pseudonym dictionary D can be used as an effective synonym dictionary in the information retrieval system. Since the similarity between keywords that originally exist in the keyword index A is determined to be a different notation, no useless words are included.

【0016】[0016]

【実施例】図1の構成図を参照しながら処理手順を説明
する。 見出し語取り出し手段1はキーワードインデックス
A から取り出したキーワードをバッファにセットする。
これが見出し語B である。 異表記語抽出手段2は、バッファのキーワード(見
出し語)と、キーワードインデックスA のキーワード群
を比較して類似するキーワードを抽出する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS The processing procedure will be described with reference to the block diagram of FIG. Headword retrieval means 1 is a keyword index
Set the keyword extracted from A into the buffer.
This is headword B. The variant notation extracting means 2 compares the keywords (headwords) in the buffer with the keyword group of the keyword index A and extracts similar keywords.

【0017】キーワード同士の類似を判断するには公知
の手段を用いればよい。図2に類似度の算定の説明図を
示す。2つの文字列の類似を判定するには、文字の対応
付けを行い、類似度評価を行って類似度を数値で表現す
る(類似度の算出)。対応付けには、LCS(Longest
Common Subsequence: 最長共通部分文字列) 法や、ヘッ
ケル(Heckel)法などがある。類似度評価は対応付けの終
わった文字列の対に対して、類似度の要素により類似度
を数値化する。類似度の要素として一致文字列長、不一
致文字列長、一致区分数などがある。一致文字列長が長
いほど、不一致文字列長が短いほど類似度は高い。同じ
一致文字列長でも一致区分数が少ないほど類似度は高
い。例えば、各類似度要素に重み係数を乗じて加算した
値を類似度とする。 類似キーワードとして抽出されたものでも、使用頻
度が少ないものや、文字数の違いが大きいものは有効で
ないので削除する。図3に有効キーワードの判定例を示
す。(A)は見出し語「シュミレーション」に対して抽
出された類似キーワードであるが、「スィミレーショ
ン」は出現頻度が1しかない。また「コンフィギュレー
ション」は文字列の長さが違いすぎる。この様な属性条
件をあらかじめ設定しておき、条件を満たすものだけを
残す。この例で属性条件を出現頻度3以上、文字列長差
2以下とすると、(B)に示す「シミュレーション」と
「エミュレーション」が異表記語候補として残る。 異表記語候補提示手段4によって、異表記語候補を
表示装置に表示する。 異表記語選択手段5は、操作者の指示に従って候補
キーワードの内のいくつかを削除する。 異表記語追加手段6は、操作者の指示に従って候補
キーワードを追加する。 また、追加された候補キーワードが、キーワードイ
ンデックスD に存在するか否か調べる。もし存在しなけ
れば、警告を示し、指示があれば、この語と見出し語と
を入れ替える。 辞書登録手段3は、以上のようにして決定した見出
し語と異表記語とを対応させて異表記語辞書のエントリ
とし、異表記語辞書D に登録する。異表記語辞書のエン
トリの例を図4に示す。 以上の処理をキーワードインデックスD の全キーワ
ードに対して行なうことにより、異表記語辞書が完成す
る。
Known means may be used to determine the similarity between keywords. FIG. 2 is an explanatory diagram of the calculation of the similarity. In order to determine the similarity between two character strings, characters are associated with each other, the similarity is evaluated, and the similarity is expressed by a numerical value (similarity calculation). LCS (Longest
Common Subsequence: The longest common substring method and the Heckel method. The similarity evaluation quantifies the similarity of a pair of character strings for which correspondence has been completed, using a similarity factor. Elements of the similarity include a matched character string length, an unmatched character string length, and the number of matching sections. The similarity is higher as the matching character string length is longer and the non-matching character string length is shorter. Even with the same matching character string length, the smaller the number of matching segments, the higher the similarity. For example, a value obtained by multiplying each similarity element by a weight coefficient and adding the result is set as the similarity. Even keywords extracted as similar keywords that are used less frequently or that have a large difference in the number of characters are not valid and are therefore deleted. FIG. 3 shows an example of determining an effective keyword. (A) is a similar keyword extracted for the headword "simulation", but "simulation" has only one appearance frequency. Also, the "configuration" has a string length that is too different. Such attribute conditions are set in advance, and only those that satisfy the conditions are left. In this example, if the attribute condition is set to an appearance frequency of 3 or more and a character string length difference of 2 or less, “simulation” and “emulation” shown in FIG. The alternative word candidate presentation means 4 displays the alternative word candidate on a display device. The alternative word selection means 5 deletes some of the candidate keywords according to the operator's instruction. The variant notation adding means 6 adds a candidate keyword according to an instruction of the operator. Further, it is checked whether or not the added candidate keyword exists in the keyword index D. If it does not exist, a warning is given, and if instructed, this word is replaced with the headword. The dictionary registration means 3 associates the headwords determined as described above with the different notation words to make entries in a different notation word dictionary and registers them in the different notation word dictionary D. FIG. 4 shows an example of an entry of the heterographic word dictionary. By performing the above processing for all the keywords in the keyword index D, an allotted word dictionary is completed.

【0018】図5は以上の処理における、〜段階に
おける画面表示例を示したものである。(A)はの異
表記語候補提示手段4によって、異表記語候補を表示装
置に表示した状態である。キーワードバッファから「シ
ュミレーション」というキーワードが取り出され、見出
しとして表示され、見出し語「シュミレーション」に対
して、異表記語候補として「シミュレーション」「シミ
ュレイション」「エミュレーション」が表示されてい
る。画面に表示された異表記語は、全て選択状態になっ
ている(デフォルト設定)。このままでよければ、操作
者はリターンキーを打鍵する等により登録指示を行な
う。もし表示された中に不適当なキーワードがあれば、
非選択の指示を入力してから登録指示を行なう。ここ
で、操作者が「エミュレーション」は「シミュレーショ
ン」の異表記語としては登録したくないとき、非選択を
指示すると、(B)に示すように不適当なキーワードは
削除される。(C)は、操作者が「シミレーション」を
異表記語として思いつき、新たに登録する場合を示す。
入力された新たなキーワードは画面の入力行に示され
る。この入力キーワードはキーワードインデックスに存
在すれば登録対象となる。
FIG. 5 shows an example of a screen display in the above steps in the above processing. (A) is a state in which the alternative notation word candidate presenting means 4 displays the alternative notation word candidate on a display device. The keyword "simulation" is extracted from the keyword buffer and displayed as a heading. For the headword "simulation", "simulation", "simulation", and "emulation" are displayed as alternative notation word candidates. All the notation words displayed on the screen are in a selected state (default setting). If this is the case, the operator issues a registration instruction by hitting the return key or the like. If any of the displayed keywords are inappropriate,
After inputting a non-selection instruction, a registration instruction is performed. Here, when the operator does not want to register "emulation" as a variant word of "simulation" and instructs non-selection, inappropriate keywords are deleted as shown in (B). (C) shows a case where the operator comes up with “simulation” as a different notation and newly registers it.
The new keyword entered is shown on the input line of the screen. If this input keyword exists in the keyword index, it becomes a registration target.

【0019】もし、存在しなければ画面上で警告し、操
作者の指示があれば、そのとき表示されている見出し語
と入れ替える。(D)はその指示後の状態を示す。以
上、発明の全てを適用した実施例を説明したが、一部を
適用するのみでもよいことは言うまでもない。また、本
実施例では独立した異表記語辞書作成支援装置として説
明したが、通常は情報検索システムの一部として組み込
まれるべきものである。その場合、異表記語辞書は同義
語辞書の一部を成すものとなる。
If it does not exist, a warning is issued on the screen, and if there is an instruction from the operator, it is replaced with the currently displayed headword. (D) shows the state after the instruction. Although the embodiment to which all of the invention is applied has been described, it goes without saying that only a part may be applied. Further, in the present embodiment, the apparatus has been described as an independent heterographic word dictionary creation support apparatus, but it should normally be incorporated as a part of the information search system. In that case, the heterologous word dictionary forms a part of the synonym dictionary.

【0020】[0020]

【発明の効果】以上説明したように、本発明によれば異
表記語を網羅的にもった異表記語辞書を作成することが
できる。しかもその異表記語は必ずキーワードインデッ
クスに存在するものであるので、むだなキーワードを含
まない。従ってキーワード検索に適した品質の高い異表
記語辞書を作ることができる。
As described above, according to the present invention, it is possible to create an allotted word dictionary that comprehensively includes allotted words. Moreover, since the non-words always exist in the keyword index, they do not include useless keywords. Therefore, a high-quality notation dictionary suitable for keyword search can be created.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の構成図である。FIG. 1 is a configuration diagram of the present invention.

【図2】類似度の算定の説明図である。FIG. 2 is an explanatory diagram of similarity calculation.

【図3】有効キーワード判定の説明図である。FIG. 3 is an explanatory diagram of valid keyword determination.

【図4】異表記語辞書エントリの例を示す図である。FIG. 4 is a diagram showing an example of a notation word dictionary entry.

【図5】実施例の操作を説明する画面表示の例を示す図
である。
FIG. 5 is a diagram showing an example of a screen display for explaining the operation of the embodiment.

【符号の説明】[Explanation of symbols]

1 見出し語取り出し手段 2 異表記語抽出手段 3 辞書登録手段 4 異表記語候補提示手段 5 異表記語選択手段 6 異表記語追加手段 A キーワードインデックス B 見出し
語 C 異表記語 D 異表記
語辞書
DESCRIPTION OF REFERENCE NUMERALS 1 headword extracting means 2 allotted word extracting means 3 dictionary registration means 4 allotted word candidate presenting means 5 allotted word selecting means 6 allotted word adding means A keyword index B headword C different notation word D different notation dictionary

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 ──────────────────────────────────────────────────続 き Continued on the front page (58) Field surveyed (Int.Cl. 7 , DB name) G06F 17/30

Claims (5)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 情報検索システムのキーワードインデッ
クス(A) から、順にキーワードを取り出して見出し語
(B) とする見出し語取り出し手段(1)と、 見出し語(B) と、キーワードインデックス(A) 内の各キ
ーワードとを比較して類似度を算出し、類似度があらか
じめ定めた値以上のものを異表記語(C) として抽出する
異表記語抽出手段(2)と、 見出し語(B) と異表記語(C) とを対応させて登録する辞
書登録手段(3)とより成る異表記語辞書作成支援装
置。
1. A keyword is sequentially extracted from a keyword index (A) of an information search system and a headword is extracted.
(B), the headword extraction means (1), the headword (B), and each keyword in the keyword index (A) are compared to calculate similarity, and the similarity is equal to or greater than a predetermined value. A different notation word extracting means (2) for extracting a word as a different notation word (C); and a dictionary registering means (3) for registering a headword (B) and a different notation word (C) in association with each other. Notation dictionary creation support device.
【請求項2】 異表記語抽出手段(2)は、類似度が高
いとして抽出したキーワードの属性が規定の条件を満た
す場合に異表記語(C) とすることを特徴とする請求項1
に記載の異表記語辞書作成支援装置。
2. An allotted word extracting means (2), wherein an attribute of a keyword extracted as having a high similarity satisfies a prescribed condition, is set as an allotted word (C).
2. A device for supporting the creation of a dictionary of different notations described in 1.
【請求項3】 異表記語抽出手段(2)が抽出した異表
記語を候補語として表示画面に表示する異表記語候補提
示手段(4)と、 表示画面に表示された候補語のうち、操作者によって選
択されたものを異表記語(C) として残す異表記語選択手
段(5)とを設けたことを特徴とする請求項1または請
求項2に記載の異表記語辞書作成支援装置。
3. An allotted word candidate presenting means (4) for displaying the allotted word extracted by the allotted word extracting means (2) as a candidate word on a display screen, and among the candidate words displayed on the display screen, 3. An apparatus for supporting the creation of an allotted word dictionary according to claim 1 or 2, further comprising an allotted word selecting means (5) for leaving an item selected by the operator as an allotted word (C). .
【請求項4】 異表記語抽出手段(2)が抽出した異表
記語を候補語として表示画面に表示する異表記語候補提
示手段(4)と、 入力された新たなキーワードを異表記語(C) として追加
する異表記語追加手段(6)とを設けたことを特徴とす
る請求項1ないし請求項3に記載の異表記語辞書作成支
援装置。
4. An allotted word candidate presenting means (4) for displaying the allotted word extracted by the allotted word extracting means (2) as a candidate word on a display screen; 4. The apparatus according to claim 1, further comprising: a means (6) for adding a notation word added as C).
【請求項5】 異表記語追加手段(6)は、新たに入力
されたキーワードがキーワードインデックス(A) に存在
するか否かを調べ、ない場合には、入力されたキーワー
ドを見出し語とし、初めの見出し語とその他の候補語を
異表記語とすることを特徴とする請求項4に記載の異表
記語辞書作成支援装置。
5. An allotted word adding means (6) checks whether or not the newly input keyword exists in the keyword index (A). If not, the input keyword is used as a headword, 5. The apparatus according to claim 4, wherein the first headword and the other candidate words are different notations.
JP21895793A 1993-09-03 1993-09-03 Heterogeneous dictionary creation support system Expired - Fee Related JP3331692B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21895793A JP3331692B2 (en) 1993-09-03 1993-09-03 Heterogeneous dictionary creation support system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21895793A JP3331692B2 (en) 1993-09-03 1993-09-03 Heterogeneous dictionary creation support system

Publications (2)

Publication Number Publication Date
JPH0773197A JPH0773197A (en) 1995-03-17
JP3331692B2 true JP3331692B2 (en) 2002-10-07

Family

ID=16727998

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21895793A Expired - Fee Related JP3331692B2 (en) 1993-09-03 1993-09-03 Heterogeneous dictionary creation support system

Country Status (1)

Country Link
JP (1) JP3331692B2 (en)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09319767A (en) * 1996-05-29 1997-12-12 Oki Electric Ind Co Ltd Synonym dictionary registering method
JP4617608B2 (en) * 2001-06-13 2011-01-26 株式会社日立製作所 Search system with free alternative keyword settings
JP4253483B2 (en) * 2002-09-20 2009-04-15 株式会社リコー Different notation dictionary creation device, different notation dictionary creation method, and program for causing computer to execute the method
JP4333516B2 (en) 2004-08-05 2009-09-16 ソニー株式会社 Recording control apparatus and method, and program
JP4760043B2 (en) * 2005-02-14 2011-08-31 日本電気株式会社 Language analysis method and program
JP4982271B2 (en) * 2007-07-02 2012-07-25 株式会社日立製作所 Similar word determination assisting device and similar word determination assisting method
JP2010257417A (en) * 2009-04-28 2010-11-11 Pioneer Electronic Corp Apparatus, method and program for controlling display, and recording medium
JP5581861B2 (en) * 2010-07-12 2014-09-03 富士通株式会社 Retrieval device, method and program, and data parsing device having retrieval function
JP6613569B2 (en) * 2015-01-26 2019-12-04 日本電気株式会社 Notation shaking dictionary creation support device, notation shaking dictionary creation support method, and notation shaking dictionary creation support program
JP7103868B2 (en) * 2018-06-27 2022-07-20 Nttテクノクロス株式会社 Management equipment, management methods and programs

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2515726B2 (en) * 1985-07-10 1996-07-10 株式会社日立製作所 Information retrieval method and device
JPH0439769A (en) * 1990-06-06 1992-02-10 Nippon Telegr & Teleph Corp <Ntt> Thesaurus generating device
JPH04123264A (en) * 1990-09-14 1992-04-23 Hitachi Ltd Device for preparing relational word table and device for retrieving document
JPH04152468A (en) * 1990-10-17 1992-05-26 Hitachi Ltd Document retrieving device

Also Published As

Publication number Publication date
JPH0773197A (en) 1995-03-17

Similar Documents

Publication Publication Date Title
JP3691844B2 (en) Document processing method
JPH03172966A (en) Similar document retrieving device
US10140297B2 (en) Supplementing search results with information of interest
JPH06309362A (en) Information retrieving method
JP4160548B2 (en) Document summary creation system, method, and program
JP3331692B2 (en) Heterogeneous dictionary creation support system
JP2000200281A (en) Device and method for information retrieval and recording medium where information retrieval program is recorded
JP4935243B2 (en) Search program, information search device, and information search method
JPH06314296A (en) Information retrieving system
JPH08161343A (en) Related word dictionary preparing device
JP3350594B2 (en) Search device
JP2005107931A (en) Image search apparatus
KR100494113B1 (en) An information searching system via Web browser
JP3558267B2 (en) Document search device
JPH10334105A (en) Relative word display device and medium where program for relative word display is recorded
JP4024906B2 (en) Tagged document search system
JP4384736B2 (en) Image search device and computer-readable recording medium storing program for causing computer to function as each means of the device
JP4049543B2 (en) Document search device, document search program, recording medium
JP2002108887A (en) Document retriever, method for adding keyword to the retriever, document retrieval method and computer readable storage medium
JP2001092831A (en) Device and method for document retrieval
JPH09231234A (en) Document retrieval device
JP3436109B2 (en) Related search formula search device and computer-readable recording medium storing related search formula search program
JP2004318328A (en) Information retrieval method
JPH07296005A (en) Japanese text registration/retrieval device
JPH0728845A (en) Document retrieval device and method therefor

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020625

LAPS Cancellation because of no payment of annual fees