JPH07325837A - Communication sentence retrieval device by abstract word and communication sentence retreival method by the abstract word - Google Patents

Communication sentence retrieval device by abstract word and communication sentence retreival method by the abstract word

Info

Publication number
JPH07325837A
JPH07325837A JP6120382A JP12038294A JPH07325837A JP H07325837 A JPH07325837 A JP H07325837A JP 6120382 A JP6120382 A JP 6120382A JP 12038294 A JP12038294 A JP 12038294A JP H07325837 A JPH07325837 A JP H07325837A
Authority
JP
Japan
Prior art keywords
word
abstract
sentence
communication
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6120382A
Other languages
Japanese (ja)
Inventor
Rintarou Sunaba
倫太郎 砂場
Kenji Imamura
賢治 今村
Yoshiji Oyama
芳史 大山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP6120382A priority Critical patent/JPH07325837A/en
Publication of JPH07325837A publication Critical patent/JPH07325837A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To provide a communication sentence retrieval device and a communication sentence retrieval method by abstract words capable of automatically retrieving a communication sentence by the retrieval keyword of fuzzy expression when an abstract keyword is inputted. CONSTITUTION:This device is provided with a similar word acquisition means 100 for extracting the abstract word from a retrieval request sentence and acquiring at least more than one similar words similar to the abstract word, an evaluation means 200 for retrieving the communication sentence example storage means of a retrieval object by the similar words obtained by the similar word acquisition means 100 and evaluating the probability of a retrieved communication sentence candidate and an output means 300 for outputting an evaluated result evaluated by the evaluation means 200 and the communication sentence candidate.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、抽象単語による通信文
検索装置及び抽象単語による通信文検索方法に係り、特
に、日本語通信文処理装置等において、ユーザの抽象的
名詞や形容詞・形容動詞・副詞を含んだリクエストを解
析し、形容詞・形容動詞・副詞・抽象名詞に対応したキ
ーワードに変換することによって、通信文を曖昧である
が、よりユーザに親しみ易い語句で検索する抽象単語に
よる通信文検索装置及び抽象単語による通信文検索方法
に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a communication sentence retrieval device using abstract words and a communication sentence retrieval method using abstract words, and in particular, in a Japanese communication sentence processing device or the like, an abstract noun or adjective / adjective verb of a user.・ Analysis of requests that include adverbs and conversion to keywords that correspond to adjectives, adjective verbs, adverbs, and abstract nouns, so that the communication text is ambiguous, but communication using abstract words that are more familiar to users The present invention relates to a sentence search device and a communication sentence search method using abstract words.

【0002】[0002]

【従来の技術】従来の文書検索装置においては、物理的
・客観的キーワードを用いて検索する。例えば、新聞記
事の検索を目的とした文書検索装置は、検索に使用する
キーワードには、人名、学習用語、製品名等、実在物等
の名詞を用いる。形容詞を用いる場合には、物理的なパ
ラメータを指し示す形容詞を用いている。例えば、「新
しい」製品、これは、一番新しく出た、即ち、物理的時
間において、一番最近に発売された製品を特定する形容
詞である。同じように、「高い価格」といった文は物価
という物理的次元において、値が大きいということを示
す。このような形容詞は、 『形容できる物理次元のインデックス(価格・高さ・温
度)』 『物理的次元上の値』 を用いて定義することができる。これは、物理的次元は
基本的に独立であり、物理量に対してはっきりとしたス
ケールが定まっている。
2. Description of the Related Art In a conventional document retrieval apparatus, a physical / objective keyword is used for retrieval. For example, a document search device for searching newspaper articles uses nouns such as a person's name, learning terms, product name, etc. as a keyword used for the search. When using adjectives, adjectives pointing to physical parameters are used. For example, a "new" product, which is an adjective that identifies the most recently released product, i.e., the most recently released product in physical time. Similarly, the sentence "high price" indicates that the value is large in the physical dimension of prices. Such adjectives can be defined using "index of physical dimension (price, height, temperature) that can be described" and "value on physical dimension". This is because the physical dimensions are basically independent, and there is a clear scale for the physical quantity.

【0003】このような新聞の検索の際に必要になる単
語は具象物、明確な概念名詞、物理的属性で表現される
単語であり、検索のキーワードに用いる単語は形式的に
定義される。
The words necessary for searching such newspapers are those expressed by concrete objects, clear conceptual nouns, and physical attributes, and the words used as search keywords are formally defined.

【0004】また、通信文のようなメッセージを検索す
る際には、抽象的なキーワードを処理できなければなら
ない。従来の通信文検索装置は、送り手、受け手が誰で
あるかを検索のキーとして通信文の内容の丁寧さを表す
丁寧度、そして、親しさを表す親密度によって検索する
方法(特願平3−236191)がある。さらに、例文
集を参考にすると、これ以外にも通信文の索引としてユ
ーモア型・ひやかし型、ほのぼの型、期待型等がある。
Also, when searching for a message such as a message, it is necessary to be able to process abstract keywords. A conventional message retrieval device uses a sender and a receiver as keys to retrieve, and a method of performing a retrieval by a politeness indicating the politeness of the contents of a communication and an intimacy indicating the familiarity (Japanese Patent Application No. 3-236191). Further, referring to the example sentence collection, there are other humor type / hiding type, heartwarming type, expecting type, etc. as indexes of communication sentences.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、上記従
来の文書検索装置は、通信文のようなメッセージを検索
するために、通信例文1つ1つに対して人間の感覚・感
情に関した形容詞・形容動詞・副詞で表現されるインデ
ックスを付与する方法もあるが、これは、新規の例文に
対しても同様の評価を行わなければならない。
However, in order to search for a message such as a message, the above-mentioned conventional document search device uses the adjectives and adjectives relating to human senses and feelings for each communication example sentence. There is also a method of assigning an index expressed by a verb / adverb, but this must perform the same evaluation for a new example sentence.

【0006】本発明は、上記の点に鑑みなされたもの
で、上記従来の問題点を解決し、抽象的なキーワードが
入力された場合に、曖昧な表現の検索キーワードで通信
文を自動的に検索することが可能な抽象単語による通信
文検索装置及び通信文検索方法を提供することである。
The present invention has been made in view of the above points, and solves the above problems of the related art, and when an abstract keyword is input, a communication message is automatically generated using an ambiguous search keyword. An object of the present invention is to provide a communication text search device and a communication text search method using abstract words that can be searched.

【0007】本発明の更なる目的は、通信文のあいまい
な形質を修飾する形容詞や、抽象的な概念を示す名詞を
キーワードにした検索を自動的に行うために、抽象的な
キーワードで指定される属性から、メッセージの表層に
おける具体的な単語文字列に変換し、その表層の単語文
字列を用いて検索することにより、「暖かい」「ほのぼ
のした」「希望」等の意味の曖昧な形容詞・形容動詞・
副詞や、抽象的な名詞をキーワードにして、通信文を検
索することが可能な抽象単語による通信文検索装置及び
抽象単語による通信文検索方法を提供することを目的と
する。
A further object of the present invention is to specify an adjective that modifies an ambiguous trait of a message or a noun indicating an abstract concept as a keyword. By converting from the attribute to a specific word string on the surface of the message and searching using the word string on the surface, ambiguous adjectives with meanings such as "warm", "heartwarming", and "hope" Adjective verb
An object of the present invention is to provide a communication sentence search device using an abstract word and a communication sentence search method using an abstract word that can search a communication sentence using an adverb or an abstract noun as a keyword.

【0008】[0008]

【課題を解決するための手段】図1は、本発明の原理構
成図である。
FIG. 1 is a block diagram showing the principle of the present invention.

【0009】本発明の抽象単語による通信文検索装置
は、通信文を検索するための検索リクエスト文を入力
し、日本語で表記された通信文を蓄積する通信文例蓄積
手段を検索し、検索リクエスト文に対応する通信文を検
索する検索装置において、検索リクエスト文より抽象的
な単語を抽出して、抽象的な単語に類似する少なくとも
1つ以上の類似単語を取得する類似単語取得手段100
と、類似単語取得手段100により得られた類似単語で
検索対象の通信文例蓄積手段を検索し、検索された通信
文候補の確からしさを評価する評価手段200と、評価
手段200により評価された評価結果と、通信文候補を
出力する出力手段300とを有する。
A communication text search device using abstract words according to the present invention inputs a search request text for searching a communication text, searches a communication text example storage means for storing the communication text written in Japanese, and makes a search request. In a search device that searches a communication sentence corresponding to a sentence, a similar word acquisition unit 100 that extracts an abstract word from a search request sentence and acquires at least one similar word similar to the abstract word.
And an evaluation unit 200 that searches the communication sentence example storage unit that is the search target with the similar words obtained by the similar word acquisition unit 100 and evaluates the certainty of the retrieved communication sentence candidates, and the evaluation evaluated by the evaluation unit 200. It has a result and an output means 300 for outputting a message candidate.

【0010】また、上記の類似単語取得手段100は、
入力された検索リクエスト文を形態素毎に分割する形態
素解析手段2と、抽象単語と、抽象単語相互間の意味距
離を格納した抽象単語相互意味距離格納手段9と、検索
リクエスト文から抽象的な検索キーワードを抽象単語相
互意味距離格納手段9を参照して抽出する検索キーワー
ド抽出手段3と、抽出された抽象的な検索キーワードと
意味の近い抽象単語を抽象単語相互意味距離格納手段9
を参照して検索する検索キーワード変換手段4と、抽象
単語と、実際に通信文上に出現する単語との間の意味距
離を格納した通信文検索単語意味距離格納手段10と、
通信文検索単語意味距離格納手段10を参照して、検索
キーワード変換手段4により得られた検索キーワードに
意味的に類似している単語で検索キーワードを拡張する
検索キーワード拡張手段5とを含む。
Further, the above-mentioned similar word acquisition means 100 is
Morphological analysis means 2 for dividing the input search request sentence into morphemes, abstract word mutual meaning distance storage means 9 for storing the semantic distance between the abstract words, and abstract search from the search request sentence. Search keyword extracting means 3 for extracting keywords by referring to the abstract word mutual meaning distance storing means 9, and abstract word mutual meaning distance storing means 9 for abstract words having meanings close to the extracted abstract search keywords.
Search keyword conversion means 4 for searching by referring to, a communication sentence search word meaning distance storage means 10 storing a meaning distance between an abstract word and a word that actually appears in a communication sentence,
It includes a search keyword expanding means 5 for expanding the search keyword with words that are semantically similar to the search keyword obtained by the search keyword converting means 4 by referring to the communication sentence search word meaning distance storing means 10.

【0011】また、上記の抽象単語相互意味距離格納手
段9は、曖昧な意味を有する単語相互の類似度情報を有
する。
The above-mentioned abstract word mutual meaning distance storing means 9 has mutual similarity information of words having ambiguous meanings.

【0012】また、上記の通信文検索単語意味距離格納
手段10は、通信文に使用されているキーワードと検索
キーワード変換手段により得られた抽象単語との類似度
情報を有する。
The communication sentence search word meaning distance storage means 10 has similarity information between the keyword used in the communication sentence and the abstract word obtained by the search keyword conversion means.

【0013】図2は、本発明の原理説明図である。FIG. 2 illustrates the principle of the present invention.

【0014】また、本発明の抽象単語による通信文検索
方法は、通信文を検索するための検索リクエスト文を入
力し(ステップ1)、日本語で表記された通信文を蓄積
する通信文例蓄積手段を検索し、検索リクエスト文に対
応する通信文を検索する場合に、検索リクエスト文より
抽象的な単語を抽出して、抽象的な単語に類似する少な
くとも1つ以上の類似単語を取得し(ステップ2)、類
似単語で検索対象の通信文例蓄積手段を検索し(ステッ
プ3)、検索された通信文候補の確からしさを評価し
(ステップ4)、評価結果と、通信文候補とを出力する
(ステップ5)。
Further, the abstract sentence communication message search method of the present invention inputs a search request sentence for searching a communication sentence (step 1), and accumulates communication sentences written in Japanese. To retrieve a communication sentence corresponding to the search request sentence, an abstract word is extracted from the search request sentence to obtain at least one similar word similar to the abstract word (step 2) Search the communication sentence example storage means to be searched with similar words (step 3), evaluate the certainty of the retrieved communication sentence candidates (step 4), and output the evaluation result and the communication sentence candidates (step 4). Step 5).

【0015】また、上記の抽象単語による通信文検索方
法は、検索のキーワードとして、抽象的な意味を持つ形
容詞・形容動詞・副詞・名詞を用意し、曖昧な意味の形
容詞・形容動詞・副詞と抽象的な意味を示す名詞に対し
て、全ての単語に対して相互の意味距離を設定し、相互
の意味距離を参照して、キーワードが意味的に類似して
いる単語でキーワードを拡張し、拡張されたキーワード
で前記通信文例蓄積手段を検索し、検索された通信文の
キーワードの確からしさを評価し、検索された通信文及
び通信文の評価値を出力する。
Further, in the above-mentioned abstract sentence correspondence search method, adjectives, adjective verbs, adverbs, and nouns having abstract meanings are prepared as search keywords, and adjectives, adjective verbs, and adverbs with ambiguous meanings are prepared. For nouns showing abstract meaning, set the mutual semantic distance for all words, refer to the mutual semantic distance, expand the keywords with words that are semantically similar, The expanded message keyword is used to search the message example storage unit, the likelihood of the keyword of the searched message is evaluated, and the searched message and the evaluation value of the message are output.

【0016】[0016]

【作用】本発明は、通信文例えば、電報文の検索キーワ
ードとして『暖かい』『ほのぼのした』『希望』等の抽
象的な意味を持つ形容詞、形容動詞、副詞、名詞等の全
ての単語対して相互の類似度を示すテーブルを用いて通
信文蓄積手段を検索するためのキーワードを取得し、取
得したキーワードを拡張して、類似する複数のキーワー
ドを得ることにより、類似する複数のキーワードで通信
文例蓄積手段を検索するため、広い範囲での検索が可能
である。
The present invention is applicable to all words such as adjectives, adjective verbs, adverbs and nouns having abstract meanings such as "warm", "heartwarming" and "hope" as search keywords for communication sentences, for example, telegram sentences. A keyword for searching the message storage means is acquired using a table indicating the degree of similarity between each other, and the acquired keyword is expanded to obtain a plurality of similar keywords. Since the storage means is searched, a wide range of search is possible.

【0017】さらに、検索された通信文について確から
しさを求め、出力することにより、曖昧なリクエスト文
を入力しても、種々のキーワードを生成し、類似度の高
い通信文候補を検索できる。また、類似度の最も高い通
信文を自動的に検索出力することも可能となる。
Further, by obtaining and outputting the certainty of the retrieved communication text, even if an ambiguous request text is input, various keywords can be generated and communication text candidates with high similarity can be searched. Also, it is possible to automatically retrieve and output the communication text having the highest degree of similarity.

【0018】[0018]

【実施例】以下、図面と共に本発明の実施例を説明す
る。
Embodiments of the present invention will be described below with reference to the drawings.

【0019】図3は、本発明の一実施例の通信文検索装
置の構成を示す。同図に示す通信文検索装置は、ユーザ
リクエスト入力部1、形態素解析部2、検索キーワード
抽出部3、検索キーワード変換部4、検索キーワード拡
張部5、キーワード検索部6、検索通信文評価部7、通
信文出力部8、抽象単語相互意味距離テーブル9、通信
文検索単語意味距離テーブル10、及び通信文例蓄積装
置11より構成される。
FIG. 3 shows the configuration of a message retrieval device according to an embodiment of the present invention. The communication text search device shown in FIG. 1 includes a user request input unit 1, a morpheme analysis unit 2, a search keyword extraction unit 3, a search keyword conversion unit 4, a search keyword expansion unit 5, a keyword search unit 6, and a search communication message evaluation unit 7. , A communication sentence output unit 8, an abstract word mutual meaning distance table 9, a communication sentence search word meaning distance table 10, and a communication sentence example storage device 11.

【0020】上記の通信文検索装置において、ユーザか
らの検索要求が表現されている文字列がユーザリクエス
ト入力部1に入力されると、形態素解析部2に入力され
た文字列に対して、形態素解析を行い、入力文を形態素
に分割し、形態素が動詞・形容詞・形容動詞の場合は、
終止形もあわせてリストを作成して出力する。
In the above communication text search device, when a character string expressing a search request from a user is input to the user request input unit 1, the morpheme is input to the morpheme analysis unit 2 with respect to the morpheme. Analyze, divide the input sentence into morphemes, and if the morphemes are verbs / adjectives / adjective verbs,
Create and output a list including the final form.

【0021】検索キーワード抽出部3は、形態素解析部
2より入力された形態素解析結果から検索キーワードに
なる単語を抽出する。
The search keyword extraction unit 3 extracts a word serving as a search keyword from the morpheme analysis result input from the morpheme analysis unit 2.

【0022】キーワード相互意味距離テーブル9は、図
4に示すようにキーワードとなり得る形容詞・形容動詞
・副詞・抽象名詞であるn個の抽象単語ci (1≦i≦
n:iは整数)は終止形の形で格納されており、入力さ
れる形態素列の終止形と抽象単語ci との文字列比較を
行い、合致した0個以上の抽象単語ci をリスト形式で
出力する。例えば、抽象単語c2 とc9 が合致すれば以
下のようなリストを出力する。
As shown in FIG. 4, the keyword mutual meaning distance table 9 includes n abstract words c i (1 ≦ i ≦) that are adjectives, adjective verbs, adverbs, and abstract nouns that can be keywords.
(n: i is an integer) is stored in the form of an end form, and the end form of the input morpheme string and the abstract word c i are compared with each other to list 0 or more matching abstract words c i . Output in the format. For example, if the abstract words c 2 and c 9 match, the following list is output.

【0023】出力例: (c2 ,c9 ) 検索キーワード変換部4は、検索キーワード抽出部3よ
り入力された抽象単語だけでなく、抽象単語相互意味距
離テーブル9を参照して、類似した意味の抽象単語を検
索しリストに付加する。
Output example: (c 2 , c 9 ) The search keyword conversion unit 4 refers to not only the abstract word input from the search keyword extraction unit 3 but also the abstract word mutual meaning distance table 9 to obtain similar meanings. Search for the abstract word and add it to the list.

【0024】検索キーワード変換部4に入力された個々
の抽象単語は多くの場合、実際の通信文に存在しない場
合が多い。そこで、入力された抽象単語は、意味的に近
い抽象単語によって増やされる。
In many cases, the individual abstract words input to the search keyword conversion unit 4 do not exist in the actual message. Therefore, the input abstract word is increased by the semantically close abstract word.

【0025】抽象単語相互意味距離テーブル9は、予め
n個の抽象単語間の意味的距離が設定してある。例え
ば、抽象単語ci とcj との意味距離dijは、抽象単語
i とcj の意味が全く同一の場合には、“0”、最も
かけ離れている場合は、“1”というように、0≦dij
≦1の値をとる。ここで、入力されたあるx番目の抽象
単語cx とあるy番目の抽象単語cy 間の相互の意味距
離dxyが、予め設定する閾値Ta に対して、dxy≦Ta
の場合、即ち、意味的に類似している場合は、ある抽象
単語cy も意味距離dxyの値と併せてリスト(c
5 25)にして出力する。出力例では、抽象単語c2
対してd25≦Ta ,d28≦Ta であった場合、新しく、 (c5 25)(c8 28) のリストが付加される。なお、入力である抽象単語cx
自身に対する意味距離の値は“0”とする。
In the abstract word mutual meaning distance table 9, the semantic distance between n abstract words is set in advance. For example, it means the distance d ij between abstract word c i and c j, if the meaning of abstract words c i and c j is identical, the "0", if the most far, so that "1" And 0 ≦ d ij
It takes a value of ≦ 1. Here, the mutual semantic distance d xy between the input x-th abstract word c x and the y-th abstract word c y is d xy ≦ T a with respect to a preset threshold T a .
Cases, i.e., if semantically similar are abstract words c y be in conjunction with the mean distance d xy LOV (c
5 d 25 ) and output. In the output example, if d 25 ≦ T a and d 28 ≦ T a for the abstract word c 2 , a new list of (c 5 d 25 ) (c 8 d 28 ) is added. The abstract word c x that is the input
The value of the semantic distance to itself is “0”.

【0026】出力例:(c2 9) (c9 0) (c5
25) (c8 28) 検索キーワード拡張部5は、(抽象単語ci 意味単語d
i )のリストを入力として、通信文に使用されている名
詞・動詞等の単語が蓄積されている検索単語意味距離テ
ーブル10を参照して実際に通信文例蓄積装置11の通
信文を検索する単語を入力リストに追加する。
Output example: (c 2 9) (c 9 0) (c 5
d 25 ) (c 8 d 28 ). The search keyword expansion unit 5 uses (abstract word c i meaning word d
A word for actually searching for a communication sentence in the communication sentence example storage device 11 by referring to the search word meaning distance table 10 in which words such as nouns and verbs used in the communication sentence are accumulated by inputting the list i ) To the input list.

【0027】図5は、本発明の一実施例の通信文検索単
語意味距離テーブルの構成を示す。同図において、通信
文検索単語意味距離テーブル10は、n個の抽象単語c
i (1≦i≦n:iは整数)とk個の検索単語wj (1
≦j≦k:jは整数)間の意味距離tが格納されてい
る。抽象単語ci と、y番目の検索単語wj 間の意味が
同一の場合は、意味距離tij=0、最もかけ離れている
場合は、tij=1といったように、0≦tij≦1の値を
取る。このときも予め意味距離の閾値Tb を設定してお
く。ある(cx xy)の入力リストに対して、通信文検
索単語意味距離テーブル10のcx の列を参照し、検索
単語w1 〜wk に対する意味距離tx1〜t xkの値が、t
x1〜Tb のとき、即ち、抽象単語cx とある検索単語w
z が意味的に近い値を持つとき、cx とwz の意味距離
であるtxzを抽出する。但し、入力リスト中の(cx
xy)にあるcx の意味距離dxyも考慮するために、補正
後の意味距離DZ は、dxyとtxzを用いて次の式で求め
る。
FIG. 5 shows a single message retrieval unit according to an embodiment of the present invention.
The structure of a word meaning distance table is shown. In the figure, communication
The sentence search word meaning distance table 10 has n abstract words c.
i(1 ≦ i ≦ n: i is an integer) and k search words wj(1
≦ j ≦ k: j is an integer) and the semantic distance t is stored.
It Abstract word ciAnd the y-th search word wjMeaning between
If they are the same, the semantic distance tij= 0, most distant
If tij0 ≦ t, such as = 1ijA value of ≦ 1
take. Also at this time, the threshold T of the semantic distance is set in advance.bSet
Ku. Yes (cxcxy) Input list
Search word meaning distance table 10cxColumn, search
Word w1~ WkSemantic distance t tox1~ T xkIs the value of t
x1~ Tb, That is, the abstract word cxA certain search word w
zC have semantically close values, then cxAnd wzMeaning distance
Is txzTo extract. However, (c in the input listxd
xy) In cxMeaning distance dxyCorrection to also consider
Meaning distance after DZIs dxyAnd txzIs calculated by the following formula
It

【0028】Dz =1−(1−txz)×(1−dxy) を計算する。この意味距離Dz は、dxy=0のとき、即
ち、意味距離が近いとき、DZ =txzとなり、意味距離
xyが増加すると、Dz も増加する。値は、最終的に検
索キーワード拡張部5の入力リストの最後部に、0個以
上の検索単語wzと意味距離Dz の(wz z )が追加
されたリストが出力される。例えば、c2とw2 が意味
距離t22≦Tb で意味的に近く、抽象単語c2 と通信文
検索単語w 6 がt26≦Tb であった場合、(w2 2
(w6 6 )がリストに新規に追加され、出力は以下の
通りとなる。
Dz= 1- (1-txz) × (1-dxy) Is calculated. This meaning distance DzIs dxyWhen = 0, immediately
When the meaning distance is short, DZ= TxzNext, meaning distance
dxyIs increased, DzAlso increases. The value is finally checked.
0 or more at the end of the input list of the keyword expansion unit 5
Search word w abovezAnd meaning distance DzOf (wzDz) Added
The output list is output. For example, c2And w2Means
Distance ttwenty two≤TbIt is close in meaning and is an abstract word c2And correspondence
Search word w 6Is t26≤Tb, Then (w2D2)
(W6D6) Is newly added to the list, and the output is
It becomes a street.

【0029】出力例:((c2 0) (c9 0)
(c5 25) (c8 28)(w2 2 ) (w
6 6 )) ここで、出力されたリストの中には、検索キーワード抽
出部3で抽出された(cn 0)と検索キーワード変換部
4で変換された(cx xy)、検索キーワード拡張部5
で拡張された(wz z )の3種類の出力が繋がったも
のになっているが、基本的に全てが(単語 意味距離)
のリストになって出力されている。依って、合計q個の
リストあるとすると、単語の終止形Wi (1≦i≦q:
iは整数)と意味距離Di とで以下のように表現するこ
とにする。
Output example: ((c 2 0) (c 9 0)
(C 5 d 25 ) (c 8 d 28 ) (w 2 D 2 ) (w
6 D 6 )) Here, in the output list, the search keyword extracted by the search keyword extraction unit 3 (c n 0) and converted by the search keyword conversion unit 4 (c x d xy ), the search keyword Extension 5
The output of (w z D z ) expanded by 3 is connected, but basically all of them are (word meaning distance)
Is output as a list. Therefore, if there are q lists in total, the word end form W i (1 ≦ i ≦ q:
i is an integer) and the semantic distance D i is expressed as follows.

【0030】((W1 1 ) (W2 2 ) (W3
3 )… (Wq q )) キーワード検索部6では、入力の(Wi i )のリスト
を先頭から1つずつ処理していく。通信文例蓄積装置1
1には、p個の通信文Mj (1≦j≦p:jは整数)が
形態素解析され、活用する動詞・形容詞・形容動詞は、
終止形も慌て蓄積されている。キーワード検索部6は、
p個の通信文Mj の中から、q個の(W i i )のリス
ト中の単語Wi が含まれている通信文を検索する。検索
された通信文Mj と、その通信文Mj 中に含まれていた
単語Wi のリスト(Wi i )を新規に作成する。この
ようなp個の通信文Mj 中に存在した単語のリスト(W
imim)で構成されるリスト列が出力される。 ((M 1(W1111)(W1212)(W13
13)) (M2 (W2121)(W2222)(W2323
(W2424) ・ ・ (Mp (wj1j1)) 検索通信文評価部7は、検索されたr個の検索通信文M
j について入力リスト列を1つ1つ評価して、通信文M
j の検索結果の確からしさを示す確信度Sj を算出す
る。確信度Sj は、通信文Mj の中に存在した単語Wjm
の意味距離Djmを用いて(1−Djm)の値を、全てのm
についての和を取ったものである。意味距離Djmの和が
小さい程確信度Sj の値は大きくなる。例えば、 ((M 1(W1111)(W1212)(W13
13)) というリストから、通信文M1 の確信度S1 を求める
と、 S1 =(1−D11)+(1−D12)+(1−D13) となる。
((W1 D1) (W2D2) (W3
D3)… (WqDq)) In the keyword search unit 6, (WiDi) List
Are processed one by one from the beginning. Communication example storage device 1
1 has p messages Mj(1 ≦ j ≦ p: j is an integer)
The verbs, adjectives, and adjectives that are morphologically analyzed and used are
The final form is also hurriedly accumulated. The keyword search unit 6
p message MjOut of q (W iDi) Squirrel
Word W iniSearch for correspondence that contains. Search
Correspondence MjAnd the message MjWas included in
Word WiList of (WiDi) Is newly created. this
Such p messages MjList of words that were present (W
imDim) Is output. ((M1(W11 D11) (W12 D12) (W13 
D13)) (M2(Wtwenty one Dtwenty one) (Wtwenty two Dtwenty two) (Wtwenty three Dtwenty three)
(Wtwenty four Dtwenty four) ・ ・ (Mp(Wj1 Dj1)) The search message evaluation unit 7 searches the r search message M searched for.
jEvaluate the input list sequence one by one for the message M
jConfidence S that indicates the certainty of search resultsjCalculate
It Confidence SjIs the message MjThe word W that existed injm
Meaning distance DjmUsing (1-Djm) Value for all m
Is the sum of. Meaning distance DjmSum of
The smaller the confidence SjThe value of becomes large. For example, ((M1(W11 D11) (W12 D12) (W13 
D13)) From the list1Confidence S1Ask for
And S1= (1-D11) + (1-D12) + (1-D13).

【0031】このような確信度を全ての通信文に対して
計算してリストにして出力する。
Such a certainty factor is calculated for all communication sentences and output as a list.

【0032】 ((M1 1 ) (M2 2 )・・・(Mr r ) 通信文出力部8は、入力されたリスト中の確信度Sj
注目して並べ替え、確信度Sj が高い順番にリストに並
べ出力する。
((M 1 S 1 ) (M 2 S 2 ) ... (M r S r ) The message output unit 8 sorts by paying attention to the certainty factor S j in the input list. The output is arranged in the list in descending order of the degree S j .

【0033】次に、具体的な例で説明する。Next, a specific example will be described.

【0034】まず、ユーザリクエスト入力部1に、ユー
ザから、 『ほのぼのした電報文はありませんか』 という要求文が入力される。このリクエストは、形態素
解析部2において、形態素解析される。例えば、次のよ
うに形態素に分割される。“/”は、形態素の区切り記
号である。
First, the user inputs a request sentence "Is there a warm telegram?" To the user request input unit 1. This request is morphologically analyzed by the morphological analysis unit 2. For example, it is divided into morphemes as follows. "/" Is a morpheme delimiter.

【0035】ほのぼの/した/電報文/は/あり/ませ
/ん/か。 上記の形態素解析において、形態素が動詞・形容詞・形
容動詞の場合には終止形情報も付与する。
Heartwarming / Yes / Telegram / Ha / Yes / No / No / In the above morphological analysis, when the morpheme is a verb / adjective / adjective verb, the final form information is also added.

【0036】検索キーワード抽出部3は、抽象単語相互
意味距離テーブル9を参照し、n個の抽象単語ci (1
≦i≦n:iは整数)の中から形態素解析結果の終止形
と合致するci を抽出する。抽象単語相互意味距離テー
ブル9の一例を図6に示す。この場合は「ほのぼの」と
いう副詞が合致し、以下のようなリスト形式で出力す
る。
The search keyword extraction unit 3 refers to the abstract word mutual meaning distance table 9 and refers to the n abstract words c i (1
≦ i ≦ n: i is an integer), and c i that matches the final form of the morphological analysis result is extracted. An example of the abstract word mutual meaning distance table 9 is shown in FIG. In this case, the adverb "heartwarming" matches, and the output is in the following list format.

【0037】(ほのぼの) 検索キーワード変換部4は、抽象単語相互意味距離テー
ブル9を参照し、類似した他の抽象単語を検出し、意味
距離も併せて出力する。抽出するための閾値T a =0.
3とする。また、入力の抽象単語自身は意味距離=0と
してリストを作成し出力する。以下のリストは、図6に
示す抽象単語相互意味距離テーブル9を参照したもので
ある。
The (heartwarming) search keyword conversion unit 4 uses the abstract word mutual meaning distance table.
Bull 9 to find other similar abstract words
The distance is also output. Threshold value T for extraction a= 0.
Set to 3. The input abstract word itself has a semantic distance of 0
To create and output a list. The following list is shown in Figure 6.
With reference to the abstract word mutual meaning distance table 9
is there.

【0038】((ほのぼの 0)(暖かい 0.2)
(なごやかだ 0.3)(家庭的だ 0.15)) 検索キーワード拡張部5は、通信文検索単語意味距離テ
ーブル10を参照して、入力の抽象単語cx から、実際
に通信文の検索に使用する単語を出力する。図7は、通
信文検索単語意味距離テーブルの構成例を示す。通信文
検索単語意味距離テーブル10は、入力のされる抽象単
語cx に対して、閾値Tb =0.3として参照すると、
以下のような(検索単語 意味距離)のリスト列が得ら
れる。図7において、縦軸は、通信文検索単語を示し、
横軸は抽象単語cn (抽象名詞・形容詞・形容動詞・副
詞)を示す。従って、例えば、 (ほのぼの 0.0)→(灯火 0.15)(夢 0.
3)(風船 0.25)(そよかぜ 0.2) (あたたかい 0.2)→(春 0.05)(新緑
0.1)(ぽかぽか 0.1)(こたつ 0.1) (なごやかだ 0.3)→(さくら 0.2)(小春
0.1)(潮騒 0.25) (家庭的だ 0.15)→(味噌汁 0.1)(箸
0.15)(じゃがいも 0.2) 次に、入力の抽象単語の意味距離dを考慮するために、
通信文検索単語の意味距離をtとすると、最終的な意味
距離Dは次のようになる。
((Heartwarming 0) (warm 0.2)
(Nagoyaka 0.3) (Family 0.15)) The search keyword expansion unit 5 refers to the communication sentence search word meaning distance table 10 to calculate the actual communication message from the input abstract word c x . Output the words used for the search. FIG. 7 shows an example of the configuration of the communication sentence search word meaning distance table. When the communication sentence search word meaning distance table 10 is referred to as the threshold value T b = 0.3 for the input abstract word c x ,
The following list string (search word meaning distance) is obtained. In FIG. 7, the vertical axis represents the message search word,
The horizontal axis represents the abstract word c n (abstract noun / adjective / adjective verb / adverb). Therefore, for example, (heartwarming 0.0) → (lights 0.15) (dream 0.
3) (balloons 0.25) (soyokaze 0.2) (warm 0.2) → (spring 0.05) (fresh green
0.1) (Poka Poka 0.1) (Kotatsu 0.1) (Nagoyaka D 0.3) → (Sakura 0.2) (Koharu
0.1) (Shiosai 0.25) (Homely 0.15) → (Miso soup 0.1) (Chopsticks
0.15) (potato 0.2) Next, in order to consider the semantic distance d of the input abstract word,
When the semantic distance of the message search word is t, the final semantic distance D is as follows.

【0039】D=1−(1−t)(1−d) 具体的には、(灯火 0.15)は(ほのぼのした
0.0)を考慮すると、 D=1−(1−0.15)(1−0)=0.15 と計算でき、リストは、 (灯火 0.15) となる。
D = 1- (1-t) (1-d) Specifically, (light 0.15) is (heartwarming
0.0), D = 1- (1-0.15) (1-0) = 0.15 can be calculated, and the list becomes (lamp 0.15).

【0040】(検索単語 意味距離)が(春 0.0
5)にたいしては(あたたかい 0.2)を考慮して、 D=1−(1−0.05)(1−0.2)=0.24 となり、リストは(春 0.24)と設定される。出力
は、入力リストの後尾に、通信文検索単語リストが繋が
ったものとなる。以下に出力リストを示す。 ((ほのぼの 0)(あたたかい 0.2)(なごやか
だ 0.3)(家庭的だ 0.15)(灯火 0.1
5)(新緑 0.28)(ぽかぽか 0.28)(こた
つ 0.28)(さくら 0.44)(小春 0.3
7)(潮騒 0.48)(味噌汁 0.24)(箸
0.28)(じゃがいも 0.32)) キーワード検索部6は、入力されたq個の(単語Wi
意味距離Di )のリストの単語Wi ・をキーワードに通
信文例蓄積装置に蓄積されている通信文を検索する。例
えば、通信文M1 中に、 (ほのぼのした 0)(風船 0.25)(新緑 0.
28) の3つのキーワードが存在すると、キーワード検索部6
は、 (M1 (ほのぼのした 0)(風船 0.25)(新緑
0.28)) といったリストを出力する。検索は全ての電報文につい
て行い最終的に次のようなリストを出力する。
(Search word meaning distance) is (Spring 0.0
For (5), considering (warm 0.2), D = 1- (1-0.05) (1-0.2) = 0.24, and the list is set as (spring 0.24). It The output is the one in which the communication sentence search word list is connected to the end of the input list. The output list is shown below. ((Heartwarming 0) (warm 0.2) (nagoya 0.3) (homely 0.15) (light 0.1
5) (Fresh green 0.28) (Poka Poka 0.28) (Kotatsu 0.28) (Sakura 0.44) (Koharu 0.3
7) (Shiosai 0.48) (Miso soup 0.24) (Chopsticks
0.28) (potato 0.32)) The keyword search unit 6 receives the q (word W i
Using the word W i · in the list of the semantic distance D i ) as a keyword, the communication text stored in the communication text example storage device is searched. For example, in the message M 1 , (heartwarming 0) (balloon 0.25) (fresh green 0.
28), if there are three keywords, the keyword search unit 6
Outputs a list such as (M 1 (heartwarming 0) (balloon 0.25) (fresh green 0.28)). The search is performed for all telegrams, and the following list is finally output.

【0041】((M1 (ほのぼのした 0)(風船
0.25)(新緑 0.28)) (M2 (新緑 0.28)(なごやかな 0.3)(ほ
のぼのした 0)) (M3 (あたたかい 0.2)(潮騒 0.48)(そ
よかぜ 0.2)(小春 0.37))) 検索通信文評価部7は、通信文Mj 中に存在した検索単
語の意味距離を評価して検索の確からしさを評価する。
評価値Eの計算方法の一例として、検索単語の意味距離
jmの(1−Djm)の値の和とする方法を以下に示す。
((M 1 (heartwarming 0) (balloon
0.25) (fresh green 0.28)) (M 2 (fresh green 0.28) (soft 0.3) (heartwarming 0)) (M 3 (warm warm 0.2) (Shiosai 0.48) (soyokaze 0.2) (Koharu 0.37))) The search message evaluation unit 7 evaluates the accuracy of the search by evaluating the semantic distance of the search word existing in the message M j .
As an example of a method of calculating the evaluation value E, a method of using the sum of the values of (1-D jm ) of the semantic distance D jm of the search word will be shown below.

【0042】(M1 (ほのぽのした 0)(風船 0.
25)(新緑 0.28)) 確信度S1 =(1−0)+(1−0.25)+(1−
0.28)=2.47 こうして通信文M1 の評価結果として次のリストを作成
する。
(M 1 (Honoponoshita 0) (Balloons 0.
25) (fresh green 0.28)) Certainty factor S 1 = (1-0) + (1-0.25) + (1-
0.28) = 2.47 Thus, the following list is created as the evaluation result of the message M 1 .

【0043】(M1 2.47) 同じ様に残りの通信文M2 ,M3 についても評価し、評
価値でソートし、評価値が大きいほど「ほのぼの」した
通信文が検索できる。
(M 1 2.47) Similarly, the remaining communication messages M 2 and M 3 are evaluated and sorted by the evaluation value. The larger the evaluation value is, the more “faint” message can be retrieved.

【0044】((M1 2.75)(M2 2.47)(M
3 2.42)) この例の場合は、通信文M1 が最も「ほのぼの」した通
信文となる。
((M 1 2.75) (M 2 2.47) (M
3 2.42)) In the case of this example, the message M 1 is the most “heartwarming” message.

【0045】通信文出力部8は、上記のソートされた通
信文M1 ,M2 ,M3 を検索の確からしさの情報を付加
して出力する。
The message output unit 8 outputs the sorted messages M 1 , M 2 and M 3 with information on the likelihood of retrieval being added.

【0046】このように、電報文献検索用のキーワード
として『暖かい』「ほのぼのした』『希望』といった抽
象的な意味を持つ形容詞・形容動詞・副詞・名詞を通信
文検索単語を用いて、曖昧な意味の形容詞・形容動詞・
副詞と抽象的な意味を示す名詞に対して、全ての抽象単
語に対して相互の意味距離を設定してある抽象単語相互
意味距離テーブル9を有し、通信文検索単語意味距離テ
ーブル10によって、検索を単なるキーワードの一致と
いった条件だけでなく、意味的に類似している単語でキ
ーワードを拡張し、拡張されたキーワードで通信文例蓄
積装置11を検索して、通信文中に存在した検索単語の
意味距離を評価することにより、検索の確からしさを数
値で比較し、検索された通信文を出力する。これによ
り、通信文の曖昧な形質を修飾する形容詞や抽象的な概
念を示す名詞をキーワードとした検索を自動的に実現す
る。
As described above, the adjectives, adjective verbs, adverbs, and nouns having abstract meanings such as "warm", "heartwarming", and "hope" are used as keywords for telegram literature search, and ambiguous by using the message search words. Meaning adjectives, adjective verbs,
For an adverb and a noun indicating an abstract meaning, an abstract word mutual meaning distance table 9 in which mutual meaning distances are set for all abstract words is provided, and a correspondence sentence search word meaning distance table 10 is used. The meaning of the search word existing in the communication text is searched by expanding the keyword with a word that is semantically similar and searching the communication example storage device 11 with the expanded keyword, in addition to the condition that the search is simply matching the keyword. By evaluating the distance, the certainty of the search is compared numerically, and the retrieved communication message is output. As a result, the search is automatically realized using the adjectives that modify the ambiguous traits of the message and the nouns that represent abstract concepts as keywords.

【0047】なお、上記実施例で用いた図6の抽象単語
意味距離テーブル9及び図7の通信文検索単語意味距離
テーブル10の各意味距離の値は、この例に限定される
ことなく、種々設計が可能である。
The values of the meaning distances of the abstract word meaning distance table 9 of FIG. 6 and the communication sentence search word meaning distance table 10 of FIG. 7 used in the above embodiment are not limited to this example, but may be various values. Design is possible.

【0048】さらに、本発明は、上記実施例に限定され
ることなく、特許請求の範囲内で種々変更、応用が可能
である。
Further, the present invention is not limited to the above-mentioned embodiments, and various modifications and applications are possible within the scope of the claims.

【0049】[0049]

【発明の効果】上述のように本発明によれば、感情・感
覚を示す形容詞・形容動詞・副詞や抽象概念を示す名詞
を用いた、検索要求文を入力することによって、検索要
求文内の単語だけでなく、意味的に近い単語を意味距離
テーブルから検索し、意味距離も考慮して通信文データ
ベースをキーワードで検索し、検索条件に適した通信文
を通信文の蓄積手段より検索の確からしさも含めて出力
することができる。
As described above, according to the present invention, by inputting a search request sentence using an adjective / adjective verb / adverb indicating an emotion / sense, or a noun indicating an abstract concept, Not only words but also words that are close in meaning are searched from the semantic distance table, the correspondence database is searched by keywords in consideration of the semantic distance, and correspondence messages that meet the search conditions are surely searched from the means for storing correspondence messages. It can be output including the likelihood.

【0050】従って、例えば、ユーザに評価度の高い順
に複数の通信文を提示し、所望の通信文を選択させるこ
とも可能であり、さらに、自動的に最も評価度の高い通
信文を用いて、電報文等を構成することも可能である。
Therefore, for example, it is possible to present a user with a plurality of communication sentences in the order of high evaluation, and to select a desired communication message. Furthermore, the communication message with the highest evaluation degree is automatically used. It is also possible to compose a telegram sentence or the like.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の原理構成図である。FIG. 1 is a principle configuration diagram of the present invention.

【図2】本発明の原理説明図である。FIG. 2 is a diagram illustrating the principle of the present invention.

【図3】本発明の一実施例の通信文検索装置の構成図で
ある。
FIG. 3 is a configuration diagram of a message search device according to an embodiment of the present invention.

【図4】本発明の一実施例の抽象単語相互意味距離テー
ブルの構成図である。
FIG. 4 is a configuration diagram of an abstract word mutual meaning distance table according to an embodiment of the present invention.

【図5】本発明の一実施例の通信文検索単語意味距離テ
ーブルの構成図である。
FIG. 5 is a configuration diagram of a communication sentence search word meaning distance table according to an embodiment of the present invention.

【図6】本発明の一実施例の抽象単語意味距離テーブル
の構成例を示す図である。
FIG. 6 is a diagram showing a configuration example of an abstract word meaning distance table according to an embodiment of the present invention.

【図7】本発明の一実施例の通信文検索単語意味距離テ
ーブルの構成例を示す図である。
FIG. 7 is a diagram showing a configuration example of a communication sentence search word meaning distance table according to an embodiment of the present invention.

【符号の説明】 1 ユーザリクエスト入力部 2 形態素解析部 3 検索キーワード抽出部 4 検索キーワード変換部 5 検索キーワード拡張部 6 キーワード検索部 7 検索通信文評価部 8 通信文出力部 9 抽象単語意味距離テーブル 10 通信文検索単語意味距離テーブル 11 通信文例蓄積装置 100 類似単語取得手段 200 評価手段 300 出力手段[Explanation of Codes] 1 user request input unit 2 morphological analysis unit 3 search keyword extraction unit 4 search keyword conversion unit 5 search keyword expansion unit 6 keyword search unit 7 search message evaluation unit 8 message output unit 9 abstract word meaning distance table 10 Communication sentence search word meaning distance table 11 Communication sentence example storage device 100 Similar word acquisition means 200 Evaluation means 300 Output means

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 通信文を検索するための検索リクエスト
文を入力し、日本語で表記された通信文を蓄積する通信
文例蓄積手段を検索し、該検索リクエスト文に対応する
通信文を検索する検索装置において、 該検索リクエスト文より抽象的な単語を抽出して、該抽
象的な単語に類似する少なくとも1つ以上の類似単語を
取得する類似単語取得手段と、 該類似単語取得手段により得られた該類似単語で検索対
象の通信文例蓄積手段を検索し、検索された通信文候補
の確からしさを評価する評価手段と、 該評価手段により評価された評価結果と、通信文候補を
出力する出力手段とを有することを特徴とする抽象単語
による通信文検索装置。
1. A search request sentence for searching a communication sentence is input, a communication sentence example accumulating means for accumulating a communication sentence written in Japanese is searched, and a communication sentence corresponding to the search request sentence is searched. In the search device, an abstract word is extracted from the search request sentence, and a similar word acquiring unit that acquires at least one similar word similar to the abstract word; An evaluation unit that searches the communication-sentence example storage unit to be searched with the similar word and evaluates the certainty of the retrieved communication-sentence candidate, an evaluation result evaluated by the evaluation unit, and an output that outputs the communication-sentence candidate. A communication sentence search device using an abstract word, which comprises:
【請求項2】 前記類似単語取得手段は、 入力された該検索リクエスト文を形態素毎に分割する形
態素解析手段と、 抽象単語と、該抽象単語相互間の意味距離を格納した抽
象単語相互意味距離格納手段と、 該検索リクエスト文から抽象的な検索キーワードを該抽
象単語相互意味距離格納手段を参照して抽出する検索キ
ーワード抽出手段と、 抽出された該抽象的な検索キーワードと意味の近い抽象
単語を該抽象単語相互意味距離格納手段を参照して検索
する検索キーワード変換手段と、 抽象単語と、実際に通信文上に出現する単語との間の意
味距離を格納した通信文検索単語意味距離格納手段と、 該通信文検索単語意味距離格納手段を参照して、該検索
キーワード変換手段により得られた検索キーワードに意
味的に類似している単語で検索キーワードを拡張する検
索キーワード拡張手段とを含む請求項1記載の抽象単語
による通信文検索装置。
2. The similar word acquisition means, a morpheme analysis means for dividing the input search request sentence into morphemes, an abstract word, and an abstract word mutual meaning distance storing a meaning distance between the abstract words. Storage means, search keyword extraction means for extracting an abstract search keyword from the search request sentence by referring to the abstract word mutual meaning distance storage means, and an abstract word having a meaning close to that of the extracted abstract search keyword Search keyword conversion means for searching the abstract word mutual meaning distance storage means, and a communication sentence search word meaning distance storage storing a meaning distance between the abstract word and a word that actually appears in the communication sentence And a search key with a word that is semantically similar to the search keyword obtained by the search keyword conversion means by referring to the communication sentence search word meaning distance storage means. The communication message search device using abstract words according to claim 1, further comprising search keyword expansion means for expanding a keyword.
【請求項3】 前記抽象単語相互意味距離格納手段は、 曖昧な意味を有する単語相互の類似度情報を有する請求
項2記載の抽象単語による通信文検索装置。
3. The communication message search device using abstract words according to claim 2, wherein the abstract word mutual meaning distance storage means has similarity information between words having ambiguous meanings.
【請求項4】 前記通信文検索単語意味距離格納手段
は、 前記通信文に使用されているキーワードと前記検索キー
ワード変換手段により得られた抽象単語との類似度情報
を有する請求項2記載の抽象単語による通信文検索装
置。
4. The abstract according to claim 2, wherein the correspondence sentence search word meaning distance storage unit has similarity information between a keyword used in the correspondence sentence and an abstract word obtained by the search keyword conversion unit. Communication sentence retrieval device by word.
【請求項5】 通信文を検索するための検索リクエスト
文を入力し、日本語で表記された通信文を蓄積する通信
文例蓄積手段を検索し、該検索リクエスト文に対応する
通信文を検索する場合に、 該検索リクエスト文より抽象的な単語を抽出して、該抽
象的な単語に類似する少なくとも1つ以上の類似単語を
取得し、 該類似単語で検索対象の通信文例蓄積手段を検索し、検
索された通信文候補の確からしさを評価し、 評価結果と、通信文候補とを出力することを特徴とする
抽象単語による通信文検索方法。
5. A search request sentence for searching a communication sentence is input, a communication sentence example accumulating unit that accumulates the communication sentence written in Japanese is searched, and a communication sentence corresponding to the search request sentence is searched. In this case, an abstract word is extracted from the search request sentence, at least one or more similar words similar to the abstract word are acquired, and the communication sentence example accumulating means to be searched is searched with the similar word. A method for searching a communication message by an abstract word, characterized in that the certainty of the retrieved communication message candidate is evaluated and the evaluation result and the communication message candidate are output.
【請求項6】 検索のキーワードとして、抽象的な意味
を持つ形容詞・形容動詞・副詞・名詞を用意し、 曖昧な意味の形容詞・形容動詞・副詞と抽象的な意味を
示す名詞に対して、全ての単語に対して相互の意味距離
を設定し、 該相互の意味距離を参照して、キーワードが意味的に類
似している単語で該キーワードを拡張し、 拡張されたキーワードで前記通信文例蓄積手段を検索
し、 検索された通信文のキーワードの確からしさを評価し、 該検索された通信文及び該通信文の評価値を出力する請
求項5記載の抽象単語による通信文検索方法。
6. An adjective, an adjective verb, an adverb, or a noun having an abstract meaning is prepared as a keyword for a search, and an adjective, an adjective verb, or an adverb with an ambiguous meaning and a noun indicating an abstract meaning are provided. Mutual semantic distances are set for all words, the mutual semantic distances are referred to, the keywords are expanded with words that are semantically similar to each other, and the communication sentence example accumulation is performed with the expanded keywords. The method of searching a communication message by an abstract word according to claim 5, wherein the means for searching is searched for, the likelihood of the keyword of the searched communication message is evaluated, and the searched communication message and the evaluation value of the communication message are output.
JP6120382A 1994-06-01 1994-06-01 Communication sentence retrieval device by abstract word and communication sentence retreival method by the abstract word Pending JPH07325837A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6120382A JPH07325837A (en) 1994-06-01 1994-06-01 Communication sentence retrieval device by abstract word and communication sentence retreival method by the abstract word

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6120382A JPH07325837A (en) 1994-06-01 1994-06-01 Communication sentence retrieval device by abstract word and communication sentence retreival method by the abstract word

Publications (1)

Publication Number Publication Date
JPH07325837A true JPH07325837A (en) 1995-12-12

Family

ID=14784829

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6120382A Pending JPH07325837A (en) 1994-06-01 1994-06-01 Communication sentence retrieval device by abstract word and communication sentence retreival method by the abstract word

Country Status (1)

Country Link
JP (1) JPH07325837A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100399502B1 (en) * 2000-06-08 2003-09-26 (주)오롬정보 Mass bibliography searching service system
CN109753658A (en) * 2018-12-29 2019-05-14 百度在线网络技术(北京)有限公司 Exchange method and device
CN111680208A (en) * 2020-04-22 2020-09-18 威比网络科技(上海)有限公司 Cross-platform communication keyword retrieval method and device, electronic equipment and storage medium
US10817551B2 (en) 2017-04-25 2020-10-27 Panasonic Intellectual Property Management Co., Ltd. Method for expanding word, word expanding apparatus, and non-transitory computer-readable recording medium

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100399502B1 (en) * 2000-06-08 2003-09-26 (주)오롬정보 Mass bibliography searching service system
US10817551B2 (en) 2017-04-25 2020-10-27 Panasonic Intellectual Property Management Co., Ltd. Method for expanding word, word expanding apparatus, and non-transitory computer-readable recording medium
CN109753658A (en) * 2018-12-29 2019-05-14 百度在线网络技术(北京)有限公司 Exchange method and device
CN109753658B (en) * 2018-12-29 2023-09-19 百度在线网络技术(北京)有限公司 Interaction method and device
CN111680208A (en) * 2020-04-22 2020-09-18 威比网络科技(上海)有限公司 Cross-platform communication keyword retrieval method and device, electronic equipment and storage medium
CN111680208B (en) * 2020-04-22 2023-05-30 平安直通咨询有限公司 Cross-platform communication keyword retrieval method and device, electronic equipment and storage medium

Similar Documents

Publication Publication Date Title
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
EP0597630B1 (en) Method for resolution of natural-language queries against full-text databases
US7257530B2 (en) Method and system of knowledge based search engine using text mining
JP2742115B2 (en) Similar document search device
US20050203900A1 (en) Associative retrieval system and associative retrieval method
KR101339103B1 (en) Document classifying system and method using semantic feature
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JP2002521767A (en) Information retrieval device using probability
WO2005041063A1 (en) Information retrieval
JP2011118689A (en) Retrieval method and system
JPH08137898A (en) Document retrieval device
JP3198932B2 (en) Document search device
JP2001184358A (en) Device and method for retrieving information with category factor and program recording medium therefor
CN111767733A (en) Document security classification discrimination method based on statistical word segmentation
JPH07325837A (en) Communication sentence retrieval device by abstract word and communication sentence retreival method by the abstract word
JPH1145268A (en) Document retrieval device and computer-readable recording medium where eprogram making computer funtion as same device is recorded
JP4378106B2 (en) Document search apparatus, document search method and program
JPH09319767A (en) Synonym dictionary registering method
KR100659370B1 (en) Method for constructing a document database and method for searching information by matching thesaurus
KR100376931B1 (en) A Method of Database System Implementation for Korean-English Translation Using Information Retrieval Techniques
Moghadam et al. Comparative study of various Persian stemmers in the field of information retrieval
JP2002183194A (en) Device and method for generating retrieval expression
JPH10149370A (en) Document retrieval method and device using context information
Shao et al. An efficient expansion word extraction algorithm for educational video
CN111414459A (en) Character relation obtaining method and device, electronic equipment and storage medium