JP2008204133A - Answer search apparatus and computer program - Google Patents

Answer search apparatus and computer program Download PDF

Info

Publication number
JP2008204133A
JP2008204133A JP2007038932A JP2007038932A JP2008204133A JP 2008204133 A JP2008204133 A JP 2008204133A JP 2007038932 A JP2007038932 A JP 2007038932A JP 2007038932 A JP2007038932 A JP 2007038932A JP 2008204133 A JP2008204133 A JP 2008204133A
Authority
JP
Japan
Prior art keywords
case frame
case
search
question
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007038932A
Other languages
Japanese (ja)
Inventor
Kaoru Sumi
薫 角
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Information and Communications Technology
Original Assignee
National Institute of Information and Communications Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Information and Communications Technology filed Critical National Institute of Information and Communications Technology
Priority to JP2007038932A priority Critical patent/JP2008204133A/en
Publication of JP2008204133A publication Critical patent/JP2008204133A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an answer search apparatus that answers a question by using related concepts. <P>SOLUTION: The answer search apparatus 44 includes a case frame dictionary group 40 including case frame records describing semantic relationships between declinable words and nominal concepts, a question reception part 100, a matching case frame search part 102 for searching the case frame dictionary group 40 for records whose nominative is a word in a question, a case frame selection part 108 for selecting the combination of a declinable word and an objective noun that has the highest occurrence frequency in the records found, a similar case frame search part 110 for searching a case frame dictionary user-selected from the case frame dictionary group 40 for records having the selected combination, a word selection part 116 for selecting the nominative noun included in the records found that has the highest occurrence frequency, and an output creation part 120 for generating an answer to the question with the use of the selected noun. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

この発明は、ユーザによる質問に対する回答を検索する装置に関し、特に、簡単な質問に対し、ユーザにとって分かりやすい適切な回答を検索するための回答検索装置に関する。   The present invention relates to an apparatus for searching for an answer to a question by a user, and more particularly to an answer searching apparatus for searching an appropriate answer that is easy for a user to understand for a simple question.

コンピュータが提供する機能の1つに、多量のデータの中から望みのデータを検索するという検索機能がある。典型的な検索システムは、1個または複数個のキーワードを入力し、そのキーワードのすべて、またはいずれかを含む文書を検索し、表示する、というものである。しかしこのようなシステムでは、質問者の意図とは別に単純にキーワードが含まれているか否かによって文書を検索しているため、ユーザの望むような文書を的確に選択することができないという問題がある。   One of the functions provided by a computer is a search function for searching desired data from a large amount of data. A typical search system is one in which one or a plurality of keywords are input, and a document including all or any of the keywords is searched and displayed. However, in such a system, since a document is searched based on whether or not a keyword is included separately from the inquirer's intention, there is a problem that a document desired by the user cannot be selected accurately. is there.

こうした問題を解決するための1つの手段として、自然言語による質問文を入力し、言語解析を行なって解析結果に基づき文書を検索するという方法がある。しかしこのような方法でも、基本的にはある単語が文書内に含まれているか否かによって文書を検索するため、キーワードを用いるときと同様の問題が生じている。   As one means for solving such a problem, there is a method of inputting a question sentence in a natural language, performing language analysis, and searching for a document based on the analysis result. However, even with such a method, a document is basically searched based on whether or not a certain word is included in the document, so that the same problem as that when using a keyword occurs.

さらに、ある概念に対し複数個の読み方が存在することを考慮し、入力されたキーワードに対しシソーラスを用いた同義語の検索を行ない、その結果を用いて文書を検索するという方法もある。しかしこの場合、検索される文書の数がさらに多くなってしまい、的確な文書を提示することができないという問題がある。   Furthermore, considering that there are a plurality of readings for a certain concept, there is a method of searching for a synonym using a thesaurus for an input keyword and searching for a document using the result. However, in this case, there is a problem that the number of documents to be searched is further increased and an accurate document cannot be presented.

こうした問題を解決するための1つの方法が、後掲の特許文献1に開示されている。特許文献1に開示のシステムでは、入力質問に基づいて検索処理を実行し、その結果に基づいて初期回答候補を抽出する。抽出された回答候補をキーワードとしたクエリを行なうことによって回答候補ごとに関連する文書を検索する。関連する文書に含まれる文の構成語が、入力質問の構成語の語彙意味と同様の語彙意味を有するか否かを判定し、同様の語彙意味を有すると判定された回答候補を、入力質問に対する回答として選択する。
特開2006−293830号公報
One method for solving such a problem is disclosed in Patent Document 1 described later. In the system disclosed in Patent Document 1, a search process is executed based on an input question, and initial answer candidates are extracted based on the result. A query related to each answer candidate is retrieved by performing a query using the extracted answer candidates as keywords. It is determined whether or not the constituent words of the sentence included in the related document have the same vocabulary meaning as the constituent words of the input question, and the answer candidate determined to have the same vocabulary meaning is used as the input question. Select as an answer to.
JP 2006-293830 A

しかし、上記した特許文献1に開示されたシステムでは、単に入力質問に対する解説として適切と思われる文が選択されるに留まり、入力された質問をいかに利用者にとってわかりやすく提示するか、という視点からの解決は行なわれていない。また、質問の中には、入力された質問に対する解説ではなく、その質問に対する周辺の話題を求めようとするものもある。特許文献1に開示のシステムでは、そのような質問に答えることはできない。   However, in the system disclosed in Patent Document 1 described above, a sentence that seems to be appropriate is simply selected as an explanation for the input question, and from the viewpoint of how to present the input question to the user in an easy-to-understand manner. No solution has been made. Some questions are not about commentary on an inputted question, but seek a topic around the question. The system disclosed in Patent Document 1 cannot answer such a question.

すなわち、ある種の質問に関しては、その質問そのものに対する解説よりも、意味的及び概念的にその質問を中心とする周辺の概念を提示したり、そのような概念または事物を説明したりすることのほうが重要である場合がある。従来技術では、そのような視点からの回答検索が行なわれていなかった。   That is, for some questions, rather than explaining the question itself, it presents the surrounding concepts around the question in terms of semantics and concepts, and explains such concepts or things. May be more important. In the prior art, answer retrieval from such a viewpoint has not been performed.

それゆえにこの発明の目的は、単に質問そのものに対する解説を提供するわけではなく、その質問を中心とする周辺の概念を用いて質問に回答することが可能な回答検索装置を提供することである。   Therefore, an object of the present invention is not to simply provide an explanation for the question itself, but to provide an answer search apparatus capable of answering a question using peripheral concepts centered on the question.

本発明の第1の局面に係る回答検索装置は、用言と、当該用言に意味的に接続可能な名詞概念と、それらの間の格関係とを記述した格フレームレコードを多数含む第1及び第2の格フレーム辞書を記憶するための第1の記憶手段と、名詞からなる質問の入力を受けるための質問入力手段と、質問入力手段により入力された単語を主格とする格フレームレコードを第1の記憶手段に記憶された第1の格フレーム辞書内で検索するための第1の検索手段と、第1の検索手段により検索された格フレームレコードの用言と、もしあれば当該用言に対する目的格となる名詞との組合せのうち、第1の検索手段により検索された格フレームレコードのうちで出現頻度が最も高いものを選択するための第1の選択手段と、第1の選択手段により選択された用言と名詞との組合せをもつ格フレームレコードを第1の記憶手段内に記憶された第2の格フレーム辞書内において検索するための第2の検索手段と、第2の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、出現頻度の最も高い所定個数を選択するための第2の選択手段と、第2の選択手段により選択された所定個数の主格の名詞を用いて質問に対する回答を生成し出力するための回答出力手段とを含む。   The answer search device according to the first aspect of the present invention includes a first case frame record in which a predicate, a noun concept that can be semantically connected to the predicate, and a case relationship between them are described. And a first storage means for storing the second case frame dictionary, a question input means for receiving an input of a question consisting of nouns, and a case frame record having a word inputted by the question input means as a main case A first search means for searching in the first case frame dictionary stored in the first storage means; a case frame record searched by the first search means; A first selection means for selecting a case frame record searched by the first search means with the highest appearance frequency from a combination of a noun that is a target case for the word, and a first selection; Selected by means A second search means for searching for a case frame record having a combination of a word and a noun in a second case frame dictionary stored in the first storage means; A second selection means for selecting a predetermined number of the most frequently occurring nouns in the main frame contained in the case frame record, and a question using the predetermined number of main nouns selected by the second selection means Answer output means for generating and outputting an answer to.

この回答検索装置においては、質問入力手段が質問の入力を受けると、第1の検索手段が、その質問に含まれる単語を主格とする格フレームレコードを第1の格フレーム辞書の中で検索する。第1の選択手段が、検索された格フレームレコードに含まれる用言と、(もしあれば)その目的格となる名詞との組合せのうち、検索された中で最も頻度が高いものを選択する。第2の検索手段が、この組合せを用言と目的語との組合せとして持つ格フレームレコードを第2の格フレーム辞書の中で検索する。検索された格フレームレコードの中で主格となっている名詞のうち、出現頻度が最も高い所定個数の名詞が、第2の選択手段により選択される。回答出力手段は、この所定個数の主格の名詞を用いて、質問に対する回答を生成し出力する。   In this answer search device, when the question input means receives an input of a question, the first search means searches the first case frame dictionary for a case frame record whose main case is a word included in the question. . The first selection means selects the most frequently searched combination from the combination of the prescription included in the searched case frame record and the target noun (if any). . The second search means searches the second case frame dictionary for a case frame record having this combination as a combination of a predicate and an object. A predetermined number of nouns having the highest appearance frequency are selected by the second selection means from the nouns that are the main case in the searched case frame records. The answer output means generates and outputs an answer to the question using the predetermined number of main nouns.

入力された質問に対して、その質問に含まれる名詞を含む文書を直接に検索して回答とするのではなく、その名詞と関連してよく出現する用言及び(もしあれば)その目的格となる名詞との組合せを格フレーム辞書で検索し、その中で頻度が最も高い組合せを用いて逆に第2の格フレーム辞書においてその組合せを持つ格フレームレコードを検索する。こうして検索された格フレームレコードのうちの主格となる名詞について、最も頻度が高い所定個数の名詞が最終的に選択され、回答の生成に使用される。用言及びその目的格となる名詞を媒介として、質問中の単語と関連が高い名詞が検索され回答に使用されるので、質問に対する直接の回答ではなく、別の側面からの回答を作成することができる。すなわち、利用者の質問に対して多様な回答が得られる。その結果、質問を中心とする周辺の概念を用いて質問に回答することが可能な回答検索装置を提供することができる。   Rather than searching directly for documents containing nouns contained in the question for the entered question and making it an answer, the commonly used utterances associated with the noun and its purpose (if any) A case frame record having the combination is searched for in the second case frame dictionary using the combination having the highest frequency in the case frame dictionary. A predetermined number of nouns with the highest frequency are finally selected for the main nouns in the case frame records searched in this way, and used for generating an answer. Since nouns that are highly related to the word in the question are searched and used in the answer using the noun and the noun that serves as the objective, create an answer from another aspect, not a direct answer to the question Can do. That is, various answers can be obtained to the user's question. As a result, it is possible to provide an answer search device that can answer a question using a peripheral concept centered on the question.

好ましくは、第1の記憶手段は、それぞれ対象読者領域の異なった文書から得られた複数個の領域別格フレーム辞書を記憶し、回答検索装置はさらに、質問を入力するユーザのプロフィールに基づき、複数個の領域別格フレーム辞書のうちで当該プロフィールが合致する対象読者領域の文書から得られた領域別格フレーム辞書を第2の格フレーム辞書として選択するための手段とを含む。   Preferably, the first storage means stores a plurality of area-specific frame dictionaries respectively obtained from documents having different target reader areas, and the answer search device further includes a plurality of answer search devices based on a profile of a user who inputs a question. Means for selecting, as a second case frame dictionary, a region case frame dictionary obtained from a document in the target reader region that matches the profile among the region case frame dictionaries.

第2の格フレーム辞書として、ユーザプロフィールに合致する対象読者領域の文書から得られた領域別格フレーム辞書を用いる。そのため、回答としてユーザに提示される単語は、ユーザにとってなじみがあるものとなり、より分かりやすい回答を生成できる。   As the second case frame dictionary, an area-specific case frame dictionary obtained from a document in the target reader area that matches the user profile is used. Therefore, the word presented to the user as an answer becomes familiar to the user, and an easier-to-understand answer can be generated.

好ましくは、第2の選択手段は、第2の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、出現頻度の最も高い1つの名詞を選択するための手段を含み、回答出力手段は、質問に含まれる名詞と、第2の選択手段により選択される1つの名詞とを用い、質問に含まれる名詞を、1つの名詞を用いた比喩によって説明する回答を生成し出力するための手段を含む。   Preferably, the second selection means includes means for selecting one noun having the highest appearance frequency from the main nouns included in the case frame record searched by the second search means, and the answer output The means uses the noun included in the question and one noun selected by the second selection means, and generates and outputs an answer explaining the noun contained in the question by a metaphor using one noun. Including means.

質問に含まれる単語に対し、その単語と関連して使用される頻度の高い用言及び目的格の名詞の組合せが第1の格フレーム辞書から求められ、その組合せを媒介として、同様にその組合せとともに主格として用いられる頻度が高い別の名詞が第2の格フレーム辞書から選択される。選択された名詞は、質問中の単語と意味的に特に関連があると考えられ、質問中の単語を、関連の深い別の単語によって言換えることができる。この際、単語の言換えを比喩とし、それを回答とすることで、ユーザにとってより理解しやすい形での回答を生成できる。   For a word included in a question, a combination of frequently used prescriptions and objective case nouns is obtained from the first case frame dictionary, and the combination is similarly used as a medium. In addition, another noun that is frequently used as a main case is selected from the second case frame dictionary. The selected noun is considered to be particularly semantically related to the word in question, and the word in question can be rephrased by another word that is closely related. At this time, by using a word paraphrase as a metaphor and using it as an answer, it is possible to generate an answer in a form that is easier for the user to understand.

第2の選択手段は、第2の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、出現頻度の最も高いものから複数個の名詞を選択するための手段を含み、回答出力手段は、質問に含まれる名詞と、複数個の名詞とを用い、質問に含まれる名詞に対する代替候補として示す回答を生成し出力するための手段を含むようにしてもよい。   The second selection means includes means for selecting a plurality of nouns from the most frequently occurring nouns in the main case nouns included in the case frame record searched by the second search means, and outputs an answer The means may include means for generating and outputting an answer indicated as an alternative candidate for the noun included in the question using a noun included in the question and a plurality of nouns.

入力された質問中の単語と同時に使用される頻度の高い用言・目的格の名詞が求められ、それらとともに主格として使用される頻度の高い複数個の名詞が求められる。これらはいずれも質問中の単語に対し意味的に深い関連があると考えられ、これらを複数個ユーザに提示することにより、ユーザにとっては質問に含まれる名詞に対する選択肢が与えられることになる。これらの中からユーザの望むものを選択することが可能になり、ユーザにとって有益な回答を提供することができる。   A noun with a high frequency of use and purpose that is used at the same time as the word in the input question is obtained, and a plurality of nouns that are frequently used as a main case are obtained. All of these are considered to be deeply related to the words in the question, and by presenting a plurality of these to the user, the user is given an option for the noun included in the question. It becomes possible to select what the user desires from these, and an answer useful for the user can be provided.

好ましくは、回答検索装置は、用言及び名詞に対する類義語を含むシソーラスを記憶するための第2の記憶手段と、第1の選択手段により選択された組合せに含まれる用言に対する類義語、及び当該用言に対する目的格となる名詞の類義語を、シソーラスにより検索するための類義語検索手段と、類義語検索手段により検索された用言に対する類義語と、名詞の類義語との組合せの各々について、当該組合せを持つ格フレームレコードを第1の記憶手段内に記憶された第2の格フレーム辞書内において検索するための第3の検索手段とをさらに含み、第2の選択手段は、第2の検索手段及び第3の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、出現頻度の最も高い所定個数を選択するための頻度順選択手段を含む。   Preferably, the answer search device includes: a second storage unit for storing a thesaurus including synonyms for the nouns and nouns; a synonym for the nouns included in the combination selected by the first selection unit; A synonym search means for searching a synonym of a noun that is a target case for a word by means of a thesaurus, a synonym for a predicate searched by the synonym search means, and a synonym of a noun and a case having the combination. And third search means for searching for a frame record in the second case frame dictionary stored in the first storage means, wherein the second selection means includes the second search means and the third search means. Frequency order selection means for selecting a predetermined number of the most frequently occurring nouns in the main case included in the case frame record searched by the search means. .

質問中の名詞を主格として用いられることが多い用言及び目的格の名詞の組合せだけでなく、それらの類義語の組合せについても、それらとともに主格として用いられる頻度の高い名詞を第2の格フレーム辞書から検索できる。検索される名詞の候補の範囲がより広くなり、より適切な回答が得られる可能性が高くなる。   The second case frame dictionary not only frequently uses the nouns in the question as the main case but also the synonyms of the synonyms and the nouns that are frequently used as the main case. You can search from The range of noun candidates to be searched becomes wider, and the possibility of obtaining a more appropriate answer increases.

さらに好ましくは、頻度順選択手段は、第2の検索手段及び第3の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、第2の検索手段により検索されたものの出現頻度に対し、第3の検索手段により検索されたものの出現頻度を相対的に小さく換算して各主格の名詞の出現頻度の和を算出し、出現頻度の最も高い所定個数の主格の名詞を選択するための手段を含む。   More preferably, the frequency order selection means sets the appearance frequency of the main nouns searched for by the second search means among the main nouns included in the case frame records searched by the second search means and the third search means. On the other hand, in order to select the predetermined number of main nouns having the highest appearance frequency by calculating the sum of the appearance frequencies of the nouns of each major case by relatively reducing the appearance frequency of those searched by the third retrieval means. Including means.

類義語を含む組合せは、質問に対しある関係を有するものの、元の組合せよりは質問に対する関係が薄くなると考えられる。従って、類義語を含む組合せに対して検索される名詞の頻度には、元の組合せよりも小さな重みを付与することが、質問に対する回答を探す際には合理的である。このような重みを用いることにより、検索範囲を広げて候補となる名詞の数を増大させながら、重要な名詞が他のあまり重要でない名詞に埋もれて検索結果から漏れてしまう可能性を小さくすることができる。その結果、質問に対し適切な回答を与えることができる回答検索装置を提供できる。   A combination including a synonym has a certain relationship to the question, but is considered to have a lighter relationship to the question than the original combination. Therefore, it is reasonable to give a smaller weight to the frequency of nouns searched for combinations including synonyms than the original combination when searching for an answer to a question. By using such weights, it is possible to expand the search range and increase the number of candidate nouns, while reducing the possibility that important nouns will be buried in other less important nouns and leaked from the search results. Can do. As a result, it is possible to provide an answer search device that can give an appropriate answer to a question.

本発明の第2の局面に係るコンピュータプログラムは、コンピュータにより実行されると、当該コンピュータを、上記したいずれかの回答検索手段の各手段として機能させるコンピュータプログラムである。   The computer program according to the second aspect of the present invention is a computer program that, when executed by a computer, causes the computer to function as each of the above-described answer search means.

このコンピュータプログラムをコンピュータにより実行させることにより、当該コンピュータは、上記したいずれかの回答検索装置の各手段として機能する。その結果、そのコンピュータにより、上記した回答検索装置と同様の効果を得ることができる。   By causing the computer program to be executed by the computer, the computer functions as each means of any one of the answer search apparatuses described above. As a result, the computer can obtain the same effect as the above-described answer search device.

[第1の実施の形態]
図1は、本発明の第1の実施の形態に係る回答検索装置である、比喩による語句解説システム30の概略構成を示すブロック図である。図1を参照して、このシステム30は、用言と、その用言と関連する名詞との関係を示す格フレームと呼ばれる構造を多数記憶するデータベースである格フレーム辞書を複数個含む格フレーム辞書群40と、日本語単語につき、類義語を階層的にまとめたシソーラス42と、利用者が質問を入力したり、システム30からの回答が表示されたりする入出力装置46と、入出力装置46から与えられる質問に対し、格フレーム辞書群40及びシソーラス42を用い、その質問に対して比喩による語句解説を生成し、入出力装置46を介して質問者に提示するための比喩による語句解説装置44とを含む。
[First Embodiment]
FIG. 1 is a block diagram showing a schematic configuration of a phrase explanation system 30 based on a metaphor, which is an answer search apparatus according to the first embodiment of the present invention. Referring to FIG. 1, this system 30 includes a case frame dictionary including a plurality of case frame dictionaries which are databases that store a number of structures called case frames indicating the relationship between prescriptions and nouns related to the predicates. A group 40, a thesaurus 42 in which synonyms are hierarchically grouped for Japanese words, an input / output device 46 in which a user inputs a question and an answer from the system 30 is displayed, and an input / output device 46 For a given question, the case frame dictionary group 40 and the thesaurus 42 are used to generate a phrase explanation by metaphor for the question, and a phrase explanation apparatus 44 by metaphor for presenting to the questioner via the input / output device 46. Including.

「格フレーム」とは、自然言語処理の分野において、動詞、形容詞、及び形容動詞等の用言の意味的構造を表現する際に使用されるものである(「岩波情報科学辞典」(長尾等編集、岩波書店、1990年発行)の第109頁参照)。「格フレーム」はいくつかの「格スロット」を持ち、「格スロット」は行為者格(主格)、対象格(目的格)、及び場所格等の内容を表す。   “Case frame” is used in the field of natural language processing to express the semantic structure of verbs, adjectives and adjective verbs (“Iwanami Information Science Dictionary” (Nagao et al. Edit, Iwanami Shoten, published in 1990), page 109). The “case frame” has several “case slots”, and the “case slot” represents contents such as an actor case (main case), a target case (target case), and a place case.

本実施の形態では、図1に示すように、質問画面50は、入力単語を入れる入力フィールド60と、比喩による語句解説装置44に対しこの単語を質問として与えるためにユーザが操作する質問ボタン62とを含む。入力フィールド60に質問となる単語を入力し、質問ボタン62を押すことにより、入力フィールド60に入力された単語が質問として比喩による語句解説装置44に与えられる。語句解説装置44は、この単語に対し、格フレーム辞書群40及びシソーラス42を用いて比喩による語句解説を生成し、入出力装置46に与える。   In the present embodiment, as shown in FIG. 1, the question screen 50 includes an input field 60 for entering an input word and a question button 62 operated by the user to give the word as a question to the phrase explanation device 44 using a metaphor. Including. By inputting a word to be a question in the input field 60 and pressing a question button 62, the word input in the input field 60 is given to the phrase explanation device 44 by a metaphor as a question. The phrase explanation device 44 generates a phrase explanation based on a metaphor using the case frame dictionary group 40 and the thesaurus 42 for this word, and gives it to the input / output device 46.

入出力装置46に表示される比喩による語句解説画面52は、解説が表示されるフィールド70と、次の質問を行なうためにユーザが操作する質問ボタン72とを含む。質問ボタン72を押すと、画面は質問画面50に遷移する。   The phrase explanation screen 52 based on metaphor displayed on the input / output device 46 includes a field 70 in which explanation is displayed, and a question button 72 operated by the user to ask the next question. When the question button 72 is pressed, the screen changes to the question screen 50.

格フレーム辞書群40は複数の格フレームレコードを含むテーブルからなるデータベースである。「格フレームレコード」とは、格フレーム辞書を構成するデータベースのテーブル中の一つの単位のことをいう。本実施の形態における格フレームレコードの構成については後述する。格フレームレコードの各々は、一般的に、用言と、その用言に関連する名詞との間の関係構造を示す。図2を参照して、たとえば動詞「代表する」は、1つの例として主格に「大統領」を取り、目的格に「国」を取る。日本語の場合にはさらに、それぞれ主格及び目的格を表わす助詞「は」及び「を」が付される。同様に「治める」という動詞も、主格として「大統領」を、目的格として「国」をそれぞれ取ることができる。格フレーム辞書群40の格フレームレコードには、このように1つの動詞と、用例から得られたその動詞に対する主格の名詞及びもしあれば目的格の名詞が1つの組となって格納される。一般的には、1つの動詞に対し、このような格フレームレコードが格フレーム辞書に多数格納されている。   The case frame dictionary group 40 is a database composed of tables including a plurality of case frame records. “Case frame record” refers to one unit in a database table constituting a case frame dictionary. The configuration of the case frame record in this embodiment will be described later. Each case frame record generally indicates a relationship structure between a predicate and a noun associated with the predicate. Referring to FIG. 2, for example, the verb “represent” takes “president” as the main character and “country” as the target character as one example. In the case of Japanese, the particles “ha” and “wo” representing the main case and the purpose case are added, respectively. Similarly, the verb “to govern” can have “president” as the main character and “country” as the target character. In the case frame record of the case frame dictionary group 40, one verb, the main noun for the verb obtained from the example, and the target noun, if any, are stored as one set. In general, many case frame records are stored in the case frame dictionary for one verb.

動詞だけではなく、形容詞、または形容動詞に対しても格フレーム辞書を作成することができる。たとえば形容詞「渋い」に対し、意味上の主格として「銀閣寺」及び「縁側」を考えることができる。実際に「銀閣寺は渋い」及び「縁側は渋い」という用例が、格フレーム辞書を作成するときの知識源の中に存在していたならば、格フレーム辞書の中にはこうした格フレームの見出しも格納されることになる。形容動詞についても同様である。   Case frame dictionaries can be created not only for verbs but also for adjectives or adjective verbs. For example, for the adjective "Shibui", "Ginkakuji" and "Engenji" can be considered as semantic principals. In fact, if the examples of “Ginkakuji are sober” and “Enkai are sober” existed in the knowledge sources when creating case frame dictionaries, these case frame headings are also included in case frame dictionaries. Will be stored. The same is true for adjective verbs.

また、目的格を持たない格フレーム構造もあり得る。たとえば「ほっこりする」、及び「渋い」という語は、その意味からいって、図2に示すように、「銀閣寺」及び「縁側」の双方ともその主格として取り得る。この場合、図2に示されるようにこの2つの用例に対応する格構造が格フレーム辞書に格納されることになる。   There may also be a case frame structure without an objective case. For example, the words “smiling” and “astringent” can be taken as the main characters of both “Ginkakuji” and “enshi” as shown in FIG. In this case, as shown in FIG. 2, case structures corresponding to these two examples are stored in the case frame dictionary.

図2の下段を参照して、本実施の形態における格フレーム辞書の格フレームレコード80は、見出しとなる用言(「代表する」)と、品詞ラベル(たとえば「動詞」)と、品詞に特有のデータ構造とを含む。品詞に特有のデータ構造とは、動詞、形容詞及び形容動詞のそれぞれによって取り得る格フレーム構造が異なるため、予めそれぞれの品詞に応じて別々に定義されたデータ構造をいう。たとえば動詞のときには、主語と目的語を取るものであれば、第1の関連語(たとえば「大統領」)と、その格ラベル(たとえば「主格」)と、その品詞(たとえば「名詞」)と、その単語に付される助詞(たとえば「は」)と、第2の関連語(たとえば「国」)と、その格ラベル(たとえば「目的格」)と、その品詞(たとえば「名詞」)と、助詞(たとえば「を」)とを含む。   Referring to the lower part of FIG. 2, case frame record 80 of the case frame dictionary in the present embodiment is specific to part of speech (“representative”), part of speech label (for example, “verb”), and part of speech. Data structure. The data structure peculiar to the part of speech is a data structure that is defined separately according to each part of speech because the case frame structure that can be taken is different for each of the verb, the adjective, and the adjective verb. For example, in the case of a verb, if it takes a subject and an object, the first related word (eg “President”), its case label (eg “Main case”), its part of speech (eg “Noun”), A particle attached to the word (eg “ha”), a second related word (eg “country”), a case label (eg “objective case”), a part of speech (eg “noun”), Including particles (for example, “O”).

形容詞及び形容動詞のときも同様にこうしたデータ構造を考えることができる。ただし形容詞及び形容動詞の場合は動詞と比較してさらに簡単な構造となる。   The same data structure can be considered for adjectives and adjective verbs. However, adjectives and adjective verbs have a simpler structure than verbs.

本実施の形態では、格フレーム辞書群40として、複数の格フレーム辞書が準備される。それら格フレーム辞書はそれぞれ、たとえば技術分野、質問者の年齢層、職業などに応じて適切な分野の知識源から作成されたものである。たとえば対象知識層が小学生である場合は、小学校で使用される教科書に出てくる文から用例を収集し、格フレーム辞書を作成すればよい。同様にある技術分野については、その技術分野の論文集などから用例を収集し、格フレーム辞書を作成すればよい。   In the present embodiment, a plurality of case frame dictionaries are prepared as the case frame dictionary group 40. Each of these case frame dictionaries is created from knowledge sources in an appropriate field according to, for example, the technical field, the age group of the questioner, and the occupation. For example, if the target knowledge layer is an elementary school student, it is only necessary to collect examples from sentences appearing in textbooks used in elementary schools and create a case frame dictionary. Similarly, for a technical field, a case frame dictionary may be created by collecting examples from a collection of papers in the technical field.

格フレーム辞書の構造としては種々あり得るが、本実施の形態では、図2に示されるように、用言と、その用言に関連する名詞との間の文構造上の関係がわかるような形式であり、かつ元の用例が復元できるような形でのデータ構造を持てばよい。   There are various case frame dictionary structures, but in this embodiment, as shown in FIG. 2, the relationship in sentence structure between a prescriptive word and a noun related to the prescriptive word can be understood. It is only necessary to have a data structure that is in a format and can restore the original example.

図3に、格フレーム辞書群40に含まれるある格フレーム辞書90の内容につき、その見出しを構成する用言と、その用言に対応する用例との組がどのような形式で蓄積されているかを例示する。図3を参照して、たとえば第1の用言V1に関するレコードは、「X1はN1をV1する」という形の用例から得られたものであり、図2の格フレームレコード80に示されるものと同様の構造を持っている。用言V2も同様である。用言V1と用言V2とは、互いに一致することもあり得る。   FIG. 3 shows in what format a set of a prescription constituting a headline and an example corresponding to the prescription is stored for the contents of a case frame dictionary 90 included in the case frame dictionary group 40. Is illustrated. Referring to FIG. 3, for example, the record relating to the first prescription V1 is obtained from an example of the form “X1 V1 N1”, and is shown in the case frame record 80 of FIG. Has a similar structure. The same applies to the term V2. The word V1 and the word V2 may coincide with each other.

図4に、図1に示す比喩による語句解説装置44の詳細な構成をブロック図形式で示す。図4を参照して、語句解説装置44は、入出力装置46からの質問者の質問(単語)を受付けるための質問受付処理部100と、質問受付処理部100が受付けた質問単語と一致する単語を主格として持つエントリを格フレーム辞書群40の中から検索するための一致格フレーム検索部102と、一致格フレーム検索部102によって検索された格フレームの見出しを蓄積するための一致格フレーム蓄積部104とを含む。本実施の形態では、一致格フレーム検索部102は、予め入力されているユーザのプロフィールに基づき、格フレーム辞書群40の中から、ユーザプロフィールに合致した適切な格フレーム辞書を選択して検索に用いるものとする。   FIG. 4 is a block diagram showing a detailed configuration of the phrase explanation device 44 based on the metaphor shown in FIG. Referring to FIG. 4, phrase explanation device 44 matches question accepting processing unit 100 for accepting a questioner's question (word) from input / output device 46, and the question word accepted by question accepting processing unit 100. A matching case frame search unit 102 for searching for an entry having a word as a main case from the case frame dictionary group 40, and a matching case frame storage for storing headings of case frames searched by the matching case frame search unit 102 Part 104. In the present embodiment, the matching case frame search unit 102 selects an appropriate case frame dictionary that matches the user profile from the case frame dictionary group 40 based on the user profile input in advance, and performs a search. Shall be used.

ここで「ユーザプロフィールに合致する格フレーム辞書」とは、ユーザプロフィール内の項目を基準としてユーザを複数のカテゴリに分類したときに、そのカテゴリに対して適切であるとして予め割当てられた格フレーム辞書のことをいう。例えば、ユーザを年齢又は学年で分類することができる。この場合には、その年齢又は学年の児童、生徒又は学生向けの文書から作成した格フレーム辞書を準備し、ユーザプロフィール内の年齢又は学年の項目の値に従って適切な格フレーム辞書を選択できる。ユーザをその職業で分類するときには、専門分野別の文書から作成した格フレーム辞書を準備しておき、ユーザの職業に応じて適切なものを選択できる。さらに、ユーザプロフィールの複数の項目に従って、ユーザを分類することもできる。その場合には、その複数の項目に従って予め文書を分類したものから格フレーム辞書を作成しておき、それらの中から、ユーザプロフィールの上記複数の項目の値の組合せに応じて適切なものを選択できる。   Here, the “case frame dictionary matching the user profile” refers to a case frame dictionary preliminarily assigned as appropriate to the category when the user is classified into a plurality of categories based on the items in the user profile. I mean. For example, users can be classified by age or school year. In this case, a case frame dictionary created from a document for a child, student or student of that age or grade can be prepared, and an appropriate case frame dictionary can be selected according to the value of the age or grade item in the user profile. When classifying users according to their occupations, case frame dictionaries created from specialized field documents can be prepared and appropriate ones can be selected according to the occupations of the users. Furthermore, users can be classified according to a plurality of items in the user profile. In that case, a case frame dictionary is created from the documents classified in advance according to the plurality of items, and an appropriate one is selected according to the combination of the values of the plurality of items in the user profile. it can.

「比喩」とは、あるものごとを説明するときに、そのものごとと共通する性質を有する別のものごとを借りて表現することをいう。特に、身近でないものごとを説明するときに、身近なものごとを用いた比喩で表現すると、聞く人によって理解しやすいといわれている。   “Metaphor” refers to borrowing and expressing each thing that has the same characteristics as each other when explaining something. In particular, when explaining things that are not familiar, it is said that it is easier for the listener to understand if expressed in a metaphor using familiar things.

語句解説装置44はさらに、一致格フレーム蓄積部104に蓄積された格フレームレコードの中で、主格の部分を除き一致するレコードの出現頻度を算出するための頻度算出処理部106と、一致格フレーム蓄積部104に蓄積されたレコードのうちで、頻度算出処理部106により算出された頻度が最も高いものを選択し、出力するための格フレーム選択処理部108とを含む。   The word explanation device 44 further includes a frequency calculation processing unit 106 for calculating the appearance frequency of records that match the case frame records stored in the matching case frame storage unit 104 except for the main case part, and a matching case frame A case frame selection processing unit 108 for selecting and outputting the record with the highest frequency calculated by the frequency calculation processing unit 106 among the records stored in the storage unit 104 is included.

語句解説装置44はさらに、格フレーム選択処理部108により選択された格フレームレコードに含まれる用言及び目的格と一致する用言及び目的格を持つ格フレームレコードと、それら用言及び目的格の名詞の同義語をそれぞれ用言及び目的格として持つレコードを、格フレーム辞書群40から検索し、出力するための類似格フレーム検索処理部110と、類似格フレーム検索処理部110により検索されたレコードに含まれる主格の単語を蓄積するための主格単語蓄積部112と、主格単語蓄積部112により蓄積された主格の単語の出現頻度を算出するための頻度算出処理部114と、主格単語蓄積部112に蓄積された単語のうち、頻度算出処理部114により算出された頻度が最も高い単語を選択し出力するための単語選択処理部116とを含む。なお類似格フレーム検索処理部110は、用言及び目的格の単語の類義語をシソーラス42から得る。   The phrase explanation device 44 further includes a case frame record having a prescription and an objective case that match the prescription and the objective case included in the case frame record selected by the case frame selection processing unit 108, and the prescription and the objective case. Similar case frame search processing unit 110 for retrieving and outputting records having synonyms of nouns as predicates and objective cases from the case frame dictionary group 40, and records retrieved by the similar case frame search processing unit 110 A main word storage unit 112 for storing the main word included in the main word, a frequency calculation processing unit 114 for calculating the appearance frequency of the main word stored by the main word storage unit 112, and a main word storage unit 112. Selection processing unit for selecting and outputting the word with the highest frequency calculated by the frequency calculation processing unit 114 among the words stored in And a 16. Note that the similar case frame search processing unit 110 obtains synonyms of the word of the predicate and the objective case from the thesaurus 42.

語句解説装置44はさらに、比喩による解説の際に用いられる定型表現を記憶するための定型表現記憶部118と、単語選択処理部116により選択された単語、質問受付処理部100によって質問者から受付けた質問単語、及び格フレーム選択処理部108により選択された格フレームレコードに基づき、質問単語に対する比喩を用いた解説を生成し、入出力部46(図1参照)に出力するための出力作成処理部120とを含む。   The phrase commentary device 44 further receives from the questioner the fixed expression storage unit 118 for storing the fixed expression used in the explanation by the metaphor, the word selected by the word selection processing unit 116, and the question reception processing unit 100. An output creation process for generating a description using a metaphor for the question word based on the question word and the case frame record selected by the case frame selection processing unit 108 and outputting the comment to the input / output unit 46 (see FIG. 1). Part 120.

図5に、「大統領」(って何ですか?)という質問を例として、語句解説装置40によりどのようなレコードが検索され、どのようにして比喩が生成されるかを概略的に示す。図5を参照して、「大統領」という単語が入力されると、一致格フレーム検索部102は格フレーム辞書群40のうち、ユーザプロフィールに従って選択された格フレーム辞書から、入力された質問単語と一致する名詞を主格に有する格フレームレコードを検索する(処理132)。この検索処理132により検索された格フレームレコードの例を図5のブロック134に示す。続いてこれら格フレームレコードのうち、用言及び目的語が一致するものの各々につき、その出現頻度を算出し、最も出現頻度の高いものを選択する処理136が行なわれる。ここでは「(大統領は)国を治める」という用言及び目的格の名詞の組合せが選択されたものとする。   FIG. 5 schematically shows what records are searched by the phrase explanation device 40 and how metaphors are generated, taking the question “President” (what is it?) As an example. Referring to FIG. 5, when the word “President” is input, the matched case frame search unit 102 selects the input question word from the case frame dictionary selected according to the user profile in the case frame dictionary group 40. A case frame record having a matching noun as a main case is searched (process 132). An example of the case frame record searched by the search processing 132 is shown in block 134 of FIG. Subsequently, among these case frame records, a process 136 is performed for calculating the appearance frequency of each of the cases where the predicate coincides with the object, and selecting the one with the highest appearance frequency. Here, it is assumed that the combination of a noun with a noun of “the (president) governs the country” and an objective noun is selected.

続いて図4に示す類似格フレーム検索処理部110により、選択された格フレームレコードの用言及び目的格の名詞の組合せと同じ用言及び目的格の名詞の組合せを有する格フレームレコードを格フレーム辞書から検索する処理139が実行される。この処理により検索された格フレームレコードの例をブロック140に示す。同様にして類似格フレーム検索処理部110は、シソーラス42を用いることにより、格フレーム選択処理部108により選択された格フレームレコード138の用言及び目的格の名詞の各々につき、類義語を求め、それら類義語を用言及びその目的格の名詞として持つ格フレームレコードを格フレーム辞書から検索する処理144を実行する。この結果得られた格フレームレコード群をブロック146に示す。   Subsequently, the case frame record having the same combination of the noun and the noun of the objective case as the combination of the noun of the selected case frame record and the noun of the objective case is obtained by the similar case frame search processing unit 110 shown in FIG. A process 139 for retrieving from the dictionary is executed. An example of a case frame record retrieved by this process is shown in block 140. Similarly, the similar case frame search processing unit 110 uses the thesaurus 42 to obtain synonyms for each of the nouns of the case frame record 138 selected by the case frame selection processing unit 108 and the noun of the target case. A process 144 for searching a case frame record having a synonym as a predicate and a noun of the target case from the case frame dictionary is executed. The resulting case frame record group is shown in block 146.

ブロック140に示される格フレームレコード群と、ブロック146に示される格フレームレコード群とは、図4に示す主格単語蓄積部112にそれぞれ区別されて蓄積されている。   The case frame record group shown in block 140 and the case frame record group shown in block 146 are stored separately in the main word storage unit 112 shown in FIG.

続いて頻度算出処理部114が、ブロック140及びブロック146に示される格フレームレコードにつき、主格の単語の出現頻度を算出する(処理148)。このとき、ブロック140に出現する単語については重み=1とし、ブロック146に出現する主格単語については重み=0.7として頻度計算を行なう。   Subsequently, the frequency calculation processing unit 114 calculates the appearance frequency of the main word for the case frame records shown in the block 140 and the block 146 (processing 148). At this time, the frequency calculation is performed with the weight = 1 for the word appearing in the block 140 and the weight = 0.7 for the main word appearing in the block 146.

単語選択処理部116は、このようにして重み付きで行なわれた頻度計算の結果、最も頻度が高い主格単語150を選択し、出力作成処理部120に出力する。この例の場合、「王様」という単語150がこの処理の結果選択されたものとする。   The word selection processing unit 116 selects the main word 150 having the highest frequency as a result of the frequency calculation performed with weighting in this way, and outputs the selected main word 150 to the output creation processing unit 120. In this example, it is assumed that the word 150 “king” is selected as a result of this processing.

出力作成処理部120は、定型表現記憶部118に記憶されている、定型表現152のうち、主語を表わす部分の空白部154に質問文として入力された単語(例えば「大統領」)を挿入する。さらに、空白部158に単語選択処理部116によって選択された単語150(例えば「王様」)を、空白部156に格フレーム選択処理部108によって選択された格フレームレコードの用言及び目的格の名詞の組合せからなる表現(例えば「国を治める」)をそれぞれ挿入し、図1に示す出力画面50を作成して入出力装置46に与える。   The output creation processing unit 120 inserts a word (for example, “President”) input as a question sentence into the blank portion 154 of the portion representing the subject in the fixed expression 152 stored in the fixed expression storage unit 118. Further, the word 150 selected by the word selection processing unit 116 in the blank part 158 (for example, “king”), the noun of the case frame record used in the case frame record selected by the case frame selection processing unit 108 in the blank part 156 Each of the expressions (for example, “rule the country”) is inserted, and the output screen 50 shown in FIG. 1 is created and given to the input / output device 46.

この結果、たとえば「大統領って何ですか?」という質問を入力した質問者は、「大統領は国を治めるという意味で王様のようなものだよ」という、比喩による解説を得ることができる。この例では、質問者が小学生であることを想定したため、類似格フレーム検索処理部110において検索に用いる格フレーム辞書は、格フレーム辞書群40の中から、ユーザプロフィールに従って選択した小学生向けの辞書を用いる。こうすることにより、ユーザプロフィールに応じた形で、ユーザにとって理解のしやすい単語を用いた比喩で、質問に対する回答を生成することができる。   As a result, for example, a questioner who has entered the question “What is the president?” Can obtain a metaphorical explanation that the president is like a king in the sense of governing the country. In this example, since it is assumed that the questioner is an elementary school student, the case frame dictionary used for the search in the similar case frame search processing unit 110 is a dictionary for elementary school students selected from the case frame dictionary group 40 according to the user profile. Use. By doing so, an answer to the question can be generated with a metaphor using words that are easy to understand for the user in a form corresponding to the user profile.

後述するように、本実施の形態に係る語句解説装置44は、コンピュータハードウェアと、このコンピュータハードウェア上で実行されるコンピュータプログラムとにより実現することができる。コンピュータハードウェアについては後述することとして、図6に、この実施の形態に係る語句解説装置44を実現するためのコンピュータプログラムの制御構造をフローチャート形式で示す。   As will be described later, the phrase explanation device 44 according to the present embodiment can be realized by computer hardware and a computer program executed on the computer hardware. As will be described later, FIG. 6 shows a computer program control structure for realizing the word explanation device 44 according to this embodiment in a flowchart format.

図6を参照してこのプログラムは、図1に示す質問画面50においてユーザが入力フィールド60に単語を入力し、質問ボタン62を押すことにより起動される。この際、入力フィールド60に入力された単語がこのプログラムに引数として渡される。   Referring to FIG. 6, this program is started when the user inputs a word in input field 60 and presses question button 62 on question screen 50 shown in FIG. 1. At this time, the word input in the input field 60 is passed as an argument to this program.

このプログラムは、予め記録されているユーザプロフィールから、格フレーム辞書群40の中のどの格フレーム辞書を使用するかを決定するステップ180と、入力された質問単語を主格に持つ動詞を全格フレーム辞書の中で検索するステップ182と、ステップ182で検索された格フレームレコードのうち、同じ用言と同じ目的格の名詞とを持つ格フレームレコードの出現頻度を算出するステップ184と、ステップ184で算出された頻度のうち、最高の頻度を有する格フレームレコードを選択し、記憶するステップ186とを含む。   This program includes a step 180 for determining which case frame dictionary in the case frame dictionary group 40 is to be used from a user profile recorded in advance, and a verb having the input question word as the main case. In step 182 for searching in the dictionary, in step 184 for calculating the appearance frequency of case frame records having the same prescription and noun of the same objective case among the case frame records searched in step 182; Selecting and storing the case frame record having the highest frequency among the calculated frequencies.

このプログラムはさらに、ステップ186で検索された格フレームレコードの用言及び目的語と同じ用言及び目的語を含む格フレームレコードを、ユーザプロフィールに合致するように選択した格フレーム辞書の中から検索するステップ187と、ステップ186で選択された格フレームレコードの用言の類義語をシソーラス42から検索するステップ188と、ステップ186で選択された格フレームレコードの目的語である名詞の類義語をシソーラス42から検索するステップ190と、ステップ188及びステップ190で検索された用言及び目的語の類義語の組合せを持つ格フレームレコードを、ステップ180でユーザプロフィールに合致するように選択した格フレーム辞書の中から検索し、その主格の単語を含めて蓄積するステップ192とを含む。   The program further retrieves from the case frame dictionary selected to match the user profile a case frame record that contains the same word and object as the case frame record found in step 186. Step 187, searching for the synonym of the prescription of the case frame record selected in step 186 from the thesaurus 42, and synonym of the noun that is the object of the case frame record selected in step 186 from the thesaurus 42 A case frame record having a combination of synonyms of the search and step 188 and the synonyms of the word and the object searched in steps 188 and 190 is searched from the case frame dictionary selected in step 180 so as to match the user profile. And the accumulated steps including the main word And a flop 192.

このプログラムはさらに、ステップ192で蓄積された格フレームレコードに出現する主格である単語ごとに、その出現頻度を算出するステップ194を含む。このステップ194ではステップ187で検索された格フレームレコードについては重みを1とし、ステップ192で検索された格フレームレコードについては重みを0.7として頻度を求め、それらの和を算出する。   The program further includes a step 194 for calculating the appearance frequency for each word that is the main case appearing in the case frame record accumulated in step 192. In step 194, the case frame record searched in step 187 is assigned a weight of 1, the case frame record searched in step 192 is assigned a weight of 0.7, and the frequency is calculated to calculate the sum thereof.

このプログラムはさらに、ステップ194で算出された頻度が最も高い主格の単語である名詞を選択するステップ196と、ステップ196で選択された単語と、このプログラムの起動時に引数として渡された質問単語と、ステップ186で選択された格フレームレコードの用言及び目的格の名詞とを用い、予め格納されている定型表現にこれら単語を挿入することにより比喩による解説を作成するステップ198と、ステップ198で作成された解説文を入出力装置46に出力するステップ200とを含む。ステップ200が終了するとこのプログラムは終了する。   The program further includes a step 196 for selecting a noun which is the main word calculated in step 194, a word selected in step 196, and a question word passed as an argument when the program is started. Step 198 creates a metaphorical commentary by inserting these words into a pre-stored fixed expression using the noun of the case frame record selected in step 186 and the noun of the target case. And a step 200 for outputting the created explanatory text to the input / output device 46. When step 200 ends, the program ends.

図6に示すような制御構造を有するプログラムをコンピュータハードウェアで実行することにより、この第1の実施の形態に係る語句解説装置44を実現することができる。   The phrase explanation device 44 according to the first embodiment can be realized by executing a program having a control structure as shown in FIG. 6 by computer hardware.

[第2の実施の形態]
図7は、本発明の第2の実施の形態に係る回答検索装置である観光施設推薦システム230の概略のブロック図である。図7を参照して、この観光施設推薦システム230は、第1の実施の形態で用いたものと同様の格フレーム辞書群40と、シソーラス42と、第1の実施の形態で用いられた語句解説装置44とよく似た構成を有する観光施設推薦装置244と、観光施設推薦装置244に接続された入出力装置46とを含む。
[Second Embodiment]
FIG. 7 is a schematic block diagram of a tourist facility recommendation system 230 which is an answer search device according to the second embodiment of the present invention. Referring to FIG. 7, this tourist facility recommendation system 230 includes a case frame dictionary group 40, a thesaurus 42, and phrases used in the first embodiment similar to those used in the first embodiment. A tourist facility recommendation device 244 having a configuration similar to that of the explanation device 44 and an input / output device 46 connected to the tourist facility recommendation device 244 are included.

図7を参照して、この観光施設推薦システム230は、利用者が何らかの語句を入力して、その語句と関連した施設、または類似した施設を推薦するためのものである。図7に示すように、このシステム230における入力画面250は、施設名を入力する入力フィールド260と、ユーザが施設を推薦してもらうときにクリックする推薦ボタン262とを含む。入力画面250には、予め「どんなところに行きたいですか。」という文が表示されており、この文に続いて入力フィールド260が設けられている。入力フィールド260の後には「のようなところ」という語句が表示されるため、入力フィールド260には、何らかの場所または施設の名前を入力するものであることがユーザに容易にわかる。   Referring to FIG. 7, this tourist facility recommendation system 230 is for a user to input a certain word and recommend a facility related to the word or a similar facility. As shown in FIG. 7, the input screen 250 in the system 230 includes an input field 260 for inputting a facility name, and a recommendation button 262 that is clicked when the user recommends the facility. On the input screen 250, a sentence “Where do you want to go?” Is displayed in advance, and an input field 260 is provided following this sentence. Since the word “like” is displayed after the input field 260, it is easy for the user to know that the name of some place or facility is input in the input field 260.

図7に示されるように、このシステム230の出力画面252は推薦する行き先を列挙するフィールド270と、別の施設を挙げて類似の施設の推薦を受けるためにユーザが操作するボタン272とを含む。   As shown in FIG. 7, the output screen 252 of the system 230 includes a field 270 that lists recommended destinations, and a button 272 that the user operates to receive a recommendation of a similar facility by listing another facility. .

図8は、図7に示す観光施設推薦装置244の概略のブロック図である。図8において、図4と同じ機能を持つブロックには同じ参照符号を付してある。それらの名称及び機能も同一である。従ってそれらについての詳しい説明は繰返さない。   FIG. 8 is a schematic block diagram of the tourist facility recommendation device 244 shown in FIG. 8, blocks having the same functions as those in FIG. 4 are denoted by the same reference numerals. Their names and functions are also the same. Therefore, detailed description thereof will not be repeated.

図8に示す観光施設推薦装置244が図4に示す語句解説装置44と異なるのは、図4に示す質問受付処理部100に代えて、図7に示す入力画面250を用いて観光施設の例示を受ける質問受付処理部300を含むことと、図4に示す単語選択処理部116に代えて、主格単語蓄積部112に蓄積されている格フレームレコードのうち、頻度算出処理部114によって算出された頻度の上位のものから所定の複数個を選択するための、単語選択処理部302を含むことと、図4に示す出力作成処理部120に代えて、単語選択処理部302によって選択された複数個の単語と、定型表現記憶部118に記憶された施設推薦のための定型文とを持ち、図7に示す出力画面252を作成し出力するための出力作成処理部306とを含む点である。   The tourist facility recommendation device 244 shown in FIG. 8 differs from the phrase commentary device 44 shown in FIG. 4 in that the tourist facility is illustrated using the input screen 250 shown in FIG. 7 instead of the question acceptance processing unit 100 shown in FIG. 4 is included in the case frame records stored in the main word storage unit 112 instead of the word selection processing unit 116 shown in FIG. Including the word selection processing unit 302 for selecting a predetermined plurality from the top ones with the highest frequency, and a plurality selected by the word selection processing unit 302 instead of the output creation processing unit 120 shown in FIG. And an output creation processing unit 306 for creating and outputting the output screen 252 shown in FIG. 7, and the standard sentence for facility recommendation stored in the regular expression storage unit 118.

質問受付処理部300は、図1に示す質問画面50に代えて、図7に示す入力画面250を用いる点を除き、図4に示す質問受付処理部100と同様の機能を有する。   The question reception processing unit 300 has the same function as the question reception processing unit 100 shown in FIG. 4 except that the input screen 250 shown in FIG. 7 is used instead of the question screen 50 shown in FIG.

図8に示す単語選択処理部302は、図4に示す単語選択処理部116に代えて、頻度の上位から複数個の単語を選択する点を除き、図4に示す単語選択処理部116と同様の機能を有する。   The word selection processing unit 302 shown in FIG. 8 is the same as the word selection processing unit 116 shown in FIG. 4 except that a plurality of words are selected from the highest frequency instead of the word selection processing unit 116 shown in FIG. It has the function of.

図8に示す出力作成処理部300は、図4に示す出力作成処理部120と異なり、図7に示す出力画面252を単語選択処理部302から与えられた複数個の単語を使用して作成する。   Unlike the output creation processing unit 120 shown in FIG. 4, the output creation processing unit 300 shown in FIG. 8 creates the output screen 252 shown in FIG. 7 using a plurality of words given from the word selection processing unit 302. .

図9に、この第2の実施の形態に係る観光施設推薦装置244を実現するためのコンピュータプログラムのフローチャートを示す。図9に示されるプログラムは、図7に示す入力画面250において、ユーザが入力フィールド260に何らかの値を入力し、推薦ボタン262をクリックすることにより起動される。このプログラムには、入力フィールド260への入力テキストがパラメータとして与えられる。   FIG. 9 shows a flowchart of a computer program for realizing the tourist facility recommendation device 244 according to the second embodiment. The program shown in FIG. 9 is started when the user inputs some value in the input field 260 and clicks the recommendation button 262 on the input screen 250 shown in FIG. This program is given the input text in the input field 260 as a parameter.

図9において、図6に示す各ステップと同じステップには同じ参照符号を付してある。それらのステップで行なわれる処理は、図6において対応するステップで実行される処理と同様である。従ってここではそれらについての詳しい説明は繰返さない。   In FIG. 9, the same steps as those shown in FIG. 6 are denoted by the same reference numerals. The processing performed in these steps is the same as the processing executed in the corresponding steps in FIG. Therefore, detailed description thereof will not be repeated here.

図9が図6と異なるのは、図6に示すステップ196、198及び200に代えて、ステップ350、352及び354を含む点である。   9 differs from FIG. 6 in that steps 350, 352 and 354 are included instead of steps 196, 198 and 200 shown in FIG.

図9に示すステップ350では、ステップ194において算出された頻度の降順で、主格として現れる単語をソートする。続いてステップ352で、ソート後の主格の語のリストの先頭から予め定められた複数個の語を用い、図7の出力画面252に示すような推薦文(推薦画面)を作成する。そしてステップ354で、このようにして生成された推薦画面を入出力装置46に対して出力する。   In step 350 shown in FIG. 9, words appearing as main characters are sorted in descending order of the frequency calculated in step 194. Subsequently, in step 352, a recommendation sentence (recommendation screen) as shown in the output screen 252 of FIG. 7 is created using a plurality of words determined in advance from the head of the sorted main word list. In step 354, the recommendation screen generated in this way is output to the input / output device 46.

この第2の実施の形態に係る装置では、たとえば利用者が「博物館」のようなところ、と入力して観光施設の推薦を依頼した場合、格フレーム辞書群40の中で、その博物館を主格として持つ用言の格フレームレコードがすべて検索される。そのようにして検索された格フレームレコードのうちで、用言ともしあれば目的格となる単語との組合せのうちで最も頻度が高いものが選択される。さらに、格フレーム辞書群40の中で、ユーザプロフィールに応じて選択された格フレーム辞書につき、選択された組合せ、並びにそれらを構成する用言の類義語と目的格の名詞の類義語との組合せを持つ格フレームレコードが検索される。それら格フレームレコードの中で、主格となっている名詞の出現頻度を算出する。この場合、格フレーム選択処理部108で選択された用言及び目的格の単語の組と、シソーラス42によって検索された類義語を用いて得られた格フレームレコードとでは、それぞれ重みを異ならせる。このようにして主格の語の出現頻度を算出した後、単語選択処理部302がこの単語のリストを頻度順に降順でソートし、頻度の大きいものから所定の複数個を選択して出力作成処理部306に与える。出力作成処理部306は、これら単語を用いて図7に示す出力画面252を作成する。   In the apparatus according to the second embodiment, for example, when a user inputs a place such as “museum” and requests a recommendation of a tourist facility, the museum is designated as the main character in the case frame dictionary group 40. All the case frame records of the predicates that have as are searched. Of the case frame records searched in this way, the most frequently used combination is selected from the combination with the word as the target case if it is a predicate. Further, the case frame dictionary selected according to the user profile in the case frame dictionary group 40 has the selected combination and the combination of the synonym of the prescriptive word and the synonym of the target case noun. Case frame records are searched. Of these case frame records, the appearance frequency of the main noun is calculated. In this case, different weights are used for the combination of the word of the prescription and the objective case selected by the case frame selection processing unit 108 and the case frame record obtained by using the synonym searched by the thesaurus 42. After calculating the appearance frequency of the main word in this way, the word selection processing unit 302 sorts the list of words in descending order according to the frequency, selects a predetermined plurality from the highest frequency, and generates an output generation processing unit To 306. The output creation processing unit 306 creates an output screen 252 shown in FIG. 7 using these words.

なお、出力画面252において、推薦された観光施設の名称には、その施設をより詳しく解説したウェブページ等へのリンクを埋め込むようにすると、ユーザにとって便利である。そのためには、格フレーム辞書内に出現する観光施設について、予めそのURL(Universal Resource Locator)を保持したデータベースを作成しておき、出力作成処理部306において出力画面252を作成する際に、そのURLへのリンクを各観光施設の名称のテキストに付与するようにすればよい。   In the output screen 252, it is convenient for the user to embed a link to a web page or the like describing the facility in more detail in the name of the recommended tourist facility. For this purpose, for a tourist facility that appears in the case frame dictionary, a database that holds the URL (Universal Resource Locator) is created in advance, and when the output screen 252 is created in the output creation processing unit 306, the URL What is necessary is just to give the link to to the text of the name of each tourist facility.

このように、第1の実施の形態とほぼ同様の仕組みを用い、第1の実施の形態のように比喩を用いた語句解説をする装置ではなく、入力された単語に基づいて、観光施設を推薦する装置を実現することができる。この処理では、入力された観光施設名を主格の語として持つ用言(及び目的格となる単語の組合せ)が検索され、さらにその用言(及び目的語の組合せ)を持つ主格の単語が、ユーザプロフィールに応じて選択された格フレーム辞書から検索される。こうして検索された単語群のうち、出現頻度が最も高いものから複数個がユーザに対して推薦される。   In this way, using the mechanism almost the same as that of the first embodiment, the tourist facility is not based on the inputted word, but the device for explaining the phrase using the metaphor as in the first embodiment. A device to recommend can be realized. In this process, a predicate (and a combination of words as a target case) having the input tourist facility name as a main word is searched, and a main word having the prescription (and a combination of target words) is further searched. The search is performed from the case frame dictionary selected according to the user profile. Among the searched word groups, a plurality of words having the highest appearance frequency are recommended to the user.

こうすることにより、ユーザが入力した施設名と概念的に深い関係を持つと思われる用言を中心に、その用言と深い関係を持つ他の観光施設名が検索される。その結果、ユーザが好む観光施設と同様の性質を持った観光施設を選択し、ユーザに提示することができる。   By doing so, the names of other tourist facilities that have a deep relationship with the predicate are searched, centering on the premise that is conceptually deeply related to the facility name input by the user. As a result, it is possible to select a tourist facility having properties similar to the tourist facility preferred by the user and present it to the user.

なお、上記した実施の形態では、いずれも類似格フレーム検索処理部110による検索の際、一致格フレーム検索部102による検索に用いられる格フレーム辞書群40の中から、ユーザプロフィールに合致するものを用いている。しかし本発明はそのような実施の形態には限定されない。例えば類似格フレーム検索処理部110による検索の際には、格フレーム辞書群40とは全く別の格フレーム辞書を用いるようにしてもよい。   In the above-described embodiment, in the case of the search by the similar case frame search processing unit 110, the case frame dictionary group 40 used for the search by the matching case frame search unit 102 is matched with the user profile. Used. However, the present invention is not limited to such an embodiment. For example, a case frame dictionary completely different from the case frame dictionary group 40 may be used in the search by the similar case frame search processing unit 110.

さらに、上記実施の形態では、用言と名詞との意味的関係を記述するデータベースを「格フレーム辞書」と読んでおり、その形態は図2及び図3に示したとおりである。しかし本発明はそのような実施の形態には限定されない。用言と、その用言に対し主格となる名詞及び(もしあれば)目的格となる名詞との関係が分かるようなデータベースであればどのような形式のものを使用してもよい。   Further, in the above embodiment, the database describing the semantic relationship between the prescription and the noun is read as “case frame dictionary”, and its form is as shown in FIGS. However, the present invention is not limited to such an embodiment. Any type of database may be used as long as it is a database that understands the relationship between a predicate, a noun that is a principal for the predicate, and a noun that is a target case (if any).

また、上記実施の形態では、質問として単に単語を受け入れているだけである。これは、このようにすることにより、回答の検索が簡単に行なえるためである。しかし、文構造の解析処理により、文の中心的意味を担う単語を抽出するようにすれば、単語ではなく質問文自体を入力として受けるようにすることも可能である。   Moreover, in the said embodiment, the word is only accepted as a question. This is because it is possible to easily search for answers by doing so. However, if a word bearing the central meaning of a sentence is extracted by analyzing the sentence structure, it is possible to receive the question sentence itself as an input instead of the word.

<コンピュータによる実現>
図10は、上記した第1の実施の形態に係る語句解説システム30及び第2の実施の形態に係る観光施設推薦システム230を、それぞれ図6及び図9に示す制御構造を有するコンピュータプログラムを実行することにより実現するコンピュータシステム530の外観を示し、図11はコンピュータシステム530の内部構成をブロック図形式で示す。
<Realization by computer>
FIG. 10 executes the computer program having the control structure shown in FIGS. 6 and 9 for the phrase commentary system 30 according to the first embodiment and the tourist facility recommendation system 230 according to the second embodiment, respectively. FIG. 11 shows an internal configuration of the computer system 530 in a block diagram form.

図10を参照して、このコンピュータシステム530は、メモリドライブ552及びDVD(Digital Versatile Disc)ドライブ550を有するコンピュータ540と、キーボード546と、マウス548と、モニタ542と、マイクロフォン570と、一対のスピーカ572とを含む。   Referring to FIG. 10, a computer system 530 includes a computer 540 having a memory drive 552 and a DVD (Digital Versatile Disc) drive 550, a keyboard 546, a mouse 548, a monitor 542, a microphone 570, and a pair of speakers. 572.

図11を参照して、コンピュータ540は、メモリドライブ552及びDVDドライブ550に加えて、CPU(中央処理装置)556と、CPU556、メモリドライブ552及びDVDドライブ550に接続されたバス566と、ブートアッププログラム等を記憶する読出専用メモリ(ROM)558と、バス566に接続され、プログラム命令、システムプログラム、及び作業データ等を記憶するランダムアクセスメモリ(RAM)560と、バス566に接続された不揮発性の外部記憶装置であるハードディスク554とを含む。   Referring to FIG. 11, in addition to the memory drive 552 and the DVD drive 550, the computer 540 boots up a CPU (Central Processing Unit) 556, a bus 566 connected to the CPU 556, the memory drive 552, and the DVD drive 550, and A read-only memory (ROM) 558 for storing programs and the like, and a non-volatile memory connected to the bus 566 and a random access memory (RAM) 560 for storing program instructions, system programs, work data, and the like, and a bus 566 And a hard disk 554 which is an external storage device.

コンピュータ540はさらにローカルエリアネットワーク(LAN)574への接続を提供するネットワークアダプタ576を含む。   Computer 540 further includes a network adapter 576 that provides a connection to a local area network (LAN) 574.

コンピュータシステム530に語句解説システム30又は観光施設推薦システム230としての動作を行なわせるためのコンピュータプログラムは、DVDドライブ550又はメモリドライブ552に挿入されるDVD562又は不揮発性メモリ564に記憶され、さらにハードディスク554に転送される。又は、プログラムはネットワーク574を通じてコンピュータ540に送信されハードディスク554に記憶されてもよい。プログラムは実行の際にRAM560にロードされる。DVD562から、不揮発性メモリ564から、又はネットワーク574を介して、直接にRAM560にプログラムをロードしてもよい。   A computer program for causing the computer system 530 to operate as the word commentary system 30 or the tourist facility recommendation system 230 is stored in the DVD 562 or the non-volatile memory 564 inserted into the DVD drive 550 or the memory drive 552, and further the hard disk 554. Forwarded to Alternatively, the program may be transmitted to the computer 540 through the network 574 and stored in the hard disk 554. The program is loaded into the RAM 560 when executed. The program may be loaded directly into the RAM 560 from the DVD 562, from the nonvolatile memory 564, or via the network 574.

図1等に示す格フレーム辞書群40、シソーラス42及びユーザプロフィールは、ハードディスク554上に格納され、プログラムの実行の際にRAM560にロードされる。CPU556は、図示しないプログラムカウンタレジスタにより示される、RAM560上のアドレスから命令を読出し、命令をデコードし、RAM560又はハードディスク554の、デコード結果により特定されるアドレスからデータを読出して命令に従い処理し、デコード結果によって特定されるアドレスに処理結果を格納する。CPU556はこうした処理を繰返す事により、質問に対する回答を生成し提示する処理を行なう。   The case frame dictionary group 40, the thesaurus 42, and the user profile shown in FIG. 1 and the like are stored on the hard disk 554 and loaded into the RAM 560 when the program is executed. The CPU 556 reads an instruction from an address on the RAM 560 indicated by a program counter register (not shown), decodes the instruction, reads data from an address specified by the decoding result of the RAM 560 or the hard disk 554, processes the instruction according to the instruction, and decodes the instruction. The processing result is stored at the address specified by the result. The CPU 556 repeats these processes to generate and present an answer to the question.

図1及び図7に示す入出力装置46は、図10及び図11に示すモニタ542、キーボード546、マウス548等により実現される。当業者であれば容易に分かるように、生成された回答を合成音声で出力するようにしてもよい。この場合には、スピーカ572を出力装置として用いることができる。   The input / output device 46 shown in FIGS. 1 and 7 is realized by the monitor 542, the keyboard 546, the mouse 548, and the like shown in FIGS. As will be readily understood by those skilled in the art, the generated answer may be output as synthesized speech. In this case, the speaker 572 can be used as an output device.

このプログラムは、コンピュータ540に上記実施の形態に係るシステム30又は230としての動作を行なわせる複数の命令を含む。この動作を行なわせるのに必要な基本的機能のいくつかはコンピュータ540上で動作するオペレーティングシステム(OS)若しくはサードパーティのプログラム、又はコンピュータ540にインストールされる各種ツールキットのモジュールにより提供される。従って、このプログラムは上記した実施の形態のシステムを実現するのに必要な機能全てを必ずしも含まなくてよい。このプログラムは、命令のうち、所望の結果が得られる様に制御されたやり方で適切な機能又は「ツール」を呼出す事により、上記したシステム30又は230としての動作を実行する命令のみを含んでいればよい。なお、ここでいう「ツール」とは、ある目的に適した定型的な処理をコンピュータに行なわせる比較的小規模なプログラムのことをいう。「ツールキット」とは、これらツールを多数集め、外部から利用可能にしたプログラムのセットのことをいう。   This program includes a plurality of instructions for causing the computer 540 to operate as the system 30 or 230 according to the above embodiment. Some of the basic functions required to perform this operation are provided by operating system (OS) or third party programs running on the computer 540 or various toolkit modules installed on the computer 540. Therefore, this program does not necessarily include all functions necessary for realizing the system of the above-described embodiment. This program includes only instructions for executing the operation as the system 30 or 230 described above by calling an appropriate function or “tool” in a controlled manner so as to obtain a desired result. It only has to be. Here, the “tool” refers to a relatively small program that causes a computer to perform routine processing suitable for a certain purpose. A “tool kit” refers to a set of programs in which many of these tools are collected and made available from the outside.

コンピュータシステム530の動作は周知であるので、ここでは繰返さない。   The operation of computer system 530 is well known and will not be repeated here.

今回開示された実施の形態は単に例示であって、本発明が上記した実施の形態のみに制限されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、特許請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味及び範囲内でのすべての変更を含む。   The embodiment disclosed herein is merely an example, and the present invention is not limited to the above-described embodiment. The scope of the present invention is indicated by each claim in the claims after taking into account the description of the detailed description of the invention, and all modifications within the meaning and scope equivalent to the wording described therein are intended. Including.

本発明の第1の実施の形態に係る回答検索装置である比喩による語句解説システム30の概略ブロック図である。It is a schematic block diagram of the phrase commentary system 30 by the metaphor which is an answer search apparatus which concerns on the 1st Embodiment of this invention. 格フレームの概念を説明するための概略図である。It is the schematic for demonstrating the concept of a case frame. 格フレーム辞書の構成を説明するための概略図である。It is the schematic for demonstrating the structure of a case frame dictionary. 語句解説装置44の概略構成を示すブロック図である。4 is a block diagram showing a schematic configuration of a word commentary device 44. FIG. 語句解説装置44の動作を説明するための図である。It is a figure for demonstrating operation | movement of the word commentary apparatus 44. FIG. 語句解説装置44をコンピュータハードウェアで実現するためのコンピュータプログラムの制御構造を示すフローチャートである。It is a flowchart which shows the control structure of the computer program for implement | achieving the phrase description apparatus 44 by computer hardware. 本発明の第2の実施の形態に係る回答検索装置である観光施設推薦システム230の概略ブロック図である。It is a schematic block diagram of the sightseeing institution recommendation system 230 which is an answer search apparatus concerning the 2nd Embodiment of this invention. 図7に示す観光施設推薦装置244の概略構成を示すブロック図である。FIG. 8 is a block diagram showing a schematic configuration of a tourist facility recommendation device 244 shown in FIG. 7. 観光施設推薦装置244をコンピュータハードウェアにより実現するためのコンピュータプログラムの制御構造を示すフローチャートである。It is a flowchart which shows the control structure of the computer program for implement | achieving the tourist facility recommendation apparatus 244 by computer hardware. 本発明の第1及び第2の実施の形態に係るシステムを実現するコンピュータシステム530の概観を示す図である。It is a figure which shows the general view of the computer system 530 which implement | achieves the system which concerns on the 1st and 2nd embodiment of this invention. コンピュータシステム530のハードウェア構成を示すブロック図である。FIG. 3 is a block diagram showing a hardware configuration of a computer system 530.

符号の説明Explanation of symbols

30 比喩による語句解説システム
40 格フレーム辞書群
42 シソーラス
44 比喩による語句解説装置
46 入出力装置
100、300 質問受付処理部
102 一致格フレーム検索部
104 一致格フレーム蓄積部
106、114 頻度算出処理部
108 格フレーム選択処理部
110 類似格フレーム検索処理部
112 主格単語蓄積部
116、302 単語選択処理部
118 定型表現記憶部
120、306 出力作成処理部
30 Phrase Explanation System by Metaphor 40 Case Frame Dictionary Group 42 Thesaurus 44 Phrase Explanation Device by Metaphor 46 Input / Output Device 100, 300 Question Accepting Processing Unit 102 Matching Case Frame Searching Unit 104 Matching Case Frame Accumulating Unit 106, 114 Frequency Calculation Processing Unit 108 Case frame selection processing unit 110 Similar case frame search processing unit 112 Primary word storage unit 116, 302 Word selection processing unit 118 Fixed expression storage unit 120, 306 Output creation processing unit

Claims (7)

用言と、当該用言に意味的に接続可能な名詞概念と、それらの間の格関係とを記述した格フレームレコードを多数含む第1及び第2の格フレーム辞書を記憶するための第1の記憶手段と、
名詞からなる質問の入力を受けるための質問入力手段と、
前記質問入力手段により入力された単語を主格とする格フレームレコードを前記第1の記憶手段に記憶された前記第1の格フレーム辞書内で検索するための第1の検索手段と、
前記第1の検索手段により検索された格フレームレコードの用言と、もしあれば当該用言に対する目的格となる名詞との組合せのうち、前記第1の検索手段により検索された格フレームレコードのうちで出現頻度が最も高いものを選択するための第1の選択手段と、
前記第1の選択手段により選択された用言と名詞との組合せをもつ格フレームレコードを前記第1の記憶手段内に記憶された前記第2の格フレーム辞書内において検索するための第2の検索手段と、
前記第2の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、出現頻度の最も高い所定個数を選択するための第2の選択手段と、
前記第2の選択手段により選択された前記所定個数の主格の名詞を用いて前記質問に対する回答を生成し出力するための回答出力手段とを含む、回答検索装置。
A first case for storing first and second case frame dictionaries including a number of case frame records describing a predicate, a noun concept that can be semantically connected to the predicate, and a case relationship between them. Storage means,
Question input means for receiving input of questions consisting of nouns;
First search means for searching in the first case frame dictionary stored in the first storage means for a case frame record having the word input by the question input means as a main case;
Of the combinations of the case frame records searched by the first search means and the nouns that are the target case for the words, if any, the case frame records searched by the first search means A first selection means for selecting the one having the highest appearance frequency,
A second case for searching in the second case frame dictionary stored in the first storage means for a case frame record having a combination of a predicate and a noun selected by the first selection means; Search means;
A second selection means for selecting a predetermined number having the highest appearance frequency among the main case nouns included in the case frame record searched by the second search means;
An answer search device comprising: an answer output means for generating and outputting an answer to the question using the predetermined number of main nouns selected by the second selection means.
前記第1の記憶手段は、それぞれ対象読者領域の異なった文書から得られた複数個の領域別格フレーム辞書を記憶し、
前記回答検索装置はさらに、予め記憶されたユーザのプロフィールに基づき、複数個の領域別格フレーム辞書のうちで当該プロフィールが合致する対象読者領域の文書から得られた領域別格フレーム辞書を前記第2の格フレーム辞書として選択するための手段とを含む、請求項1に記載の回答検索装置。
The first storage means stores a plurality of area-specific frame dictionaries respectively obtained from documents having different target reader areas,
The answer search device further includes, based on a user profile stored in advance, an area-specific frame dictionary obtained from a document in a target reader area that matches the profile among a plurality of area-specific frame dictionaries. The answer search apparatus according to claim 1, further comprising means for selecting as a case frame dictionary.
前記第2の選択手段は、前記第2の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、出現頻度の最も高い1つの名詞を選択するための手段を含み、
前記回答出力手段は、前記質問に含まれる前記名詞と、前記第2の選択手段により選択される前記1つの名詞とを用い、前記質問に含まれる前記名詞を、前記1つの名詞を用いた比喩によって説明する回答を生成し出力するための手段を含む、請求項1又は請求項2に記載の回答検索装置。
The second selection means includes means for selecting one noun having the highest appearance frequency among the main nouns included in the case frame record searched by the second search means,
The answer output means uses the noun included in the question and the one noun selected by the second selection means, and the metaphor using the one noun as the noun included in the question. The answer search apparatus according to claim 1, further comprising means for generating and outputting an answer explained by.
前記第2の選択手段は、前記第2の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、出現頻度の最も高いものから複数個の名詞を選択するための手段を含み、
前記回答出力手段は、前記質問に含まれる前記名詞と、前記複数個の名詞とを用い、前記質問に含まれる前記名詞に対する代替候補として示す回答を生成し出力するための手段を含む、請求項1又は請求項2に記載の回答検索装置。
The second selection means includes means for selecting a plurality of nouns from the most frequently occurring nouns in the main case nouns included in the case frame record searched by the second search means,
The answer output means includes means for generating and outputting an answer indicated as an alternative candidate for the noun included in the question using the noun included in the question and the plurality of nouns. The answer search device according to claim 1 or 2.
用言及び名詞に対する類義語を含むシソーラスを記憶するための第2の記憶手段と、
前記第1の選択手段により選択された前記組合せに含まれる用言に対する類義語、及び当該用言に対する目的格となる名詞の類義語を、前記シソーラスにより検索するための類義語検索手段と、
前記類義語検索手段により検索された前記用言に対する類義語と、前記名詞の類義語との組合せの各々について、当該組合せを持つ格フレームレコードを前記第1の記憶手段内に記憶された前記第2の格フレーム辞書内において検索するための第3の検索手段とをさらに含み、
前記第2の選択手段は、前記第2の検索手段及び前記第3の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、出現頻度の最も高い所定個数を選択するための頻度順選択手段を含む、請求項1又は請求項2に記載の回答検索装置。
A second storage means for storing a thesaurus including synonyms for the nouns and nouns;
Synonyms for the terms included in the combination selected by the first selection unit, and synonyms for a noun that is the target case for the term, using the thesaurus,
For each combination of a synonym for the predicate searched by the synonym search means and a synonym of the noun, a case frame record having the combination is stored in the second case stored in the first storage means. A third search means for searching in the frame dictionary;
The second selection means is a frequency for selecting a predetermined number having the highest appearance frequency from the main nouns included in the case frame records searched by the second search means and the third search means. The answer search apparatus according to claim 1, comprising an order selection unit.
前記頻度順選択手段は、前記第2の検索手段及び前記第3の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、前記第2の検索手段により検索されたものの出現頻度に対し、前記第3の検索手段により検索されたものの出現頻度を相対的に小さく換算して各主格の名詞の出現頻度の和を算出し、出現頻度の最も高い所定個数の主格の名詞を選択するための手段を含む、請求項5に記載の回答検索装置。 The frequency order selection means determines the appearance frequency of the main nouns searched for by the second search means among the main nouns included in the case frame records searched by the second search means and the third search means. On the other hand, the appearance frequency of what is searched for by the third search means is converted to a relatively small value to calculate the sum of the appearance frequencies of the nouns of each main character, and a predetermined number of main nouns having the highest appearance frequency are selected. The answer search apparatus according to claim 5, further comprising means for: コンピュータにより実行されると、当該コンピュータを、請求項1〜請求項6のいずれかに記載の各手段として機能させる、コンピュータプログラム。
A computer program that, when executed by a computer, causes the computer to function as each means according to any one of claims 1 to 6.
JP2007038932A 2007-02-20 2007-02-20 Answer search apparatus and computer program Pending JP2008204133A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007038932A JP2008204133A (en) 2007-02-20 2007-02-20 Answer search apparatus and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007038932A JP2008204133A (en) 2007-02-20 2007-02-20 Answer search apparatus and computer program

Publications (1)

Publication Number Publication Date
JP2008204133A true JP2008204133A (en) 2008-09-04

Family

ID=39781582

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007038932A Pending JP2008204133A (en) 2007-02-20 2007-02-20 Answer search apparatus and computer program

Country Status (1)

Country Link
JP (1) JP2008204133A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010122982A (en) * 2008-11-20 2010-06-03 Nec Corp System, method and program for analyzing language, and system, method and program for translating by machine
JP2012146082A (en) * 2011-01-11 2012-08-02 Toshiba Corp Answer retrieval apparatus, method and program
JP2015079383A (en) * 2013-10-17 2015-04-23 日本電信電話株式会社 Speech generation device, method, and program
WO2015107741A1 (en) * 2014-01-15 2015-07-23 ソニー株式会社 Information processing device, information processing method, and program

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10207910A (en) * 1997-01-16 1998-08-07 Fuji Xerox Co Ltd Related word dictionary preparing device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10207910A (en) * 1997-01-16 1998-08-07 Fuji Xerox Co Ltd Related word dictionary preparing device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010122982A (en) * 2008-11-20 2010-06-03 Nec Corp System, method and program for analyzing language, and system, method and program for translating by machine
JP2012146082A (en) * 2011-01-11 2012-08-02 Toshiba Corp Answer retrieval apparatus, method and program
JP2015079383A (en) * 2013-10-17 2015-04-23 日本電信電話株式会社 Speech generation device, method, and program
WO2015107741A1 (en) * 2014-01-15 2015-07-23 ソニー株式会社 Information processing device, information processing method, and program
US9965463B2 (en) 2014-01-15 2018-05-08 Sony Corporation Information processing apparatus and information processing method

Similar Documents

Publication Publication Date Title
Baker Glossary of corpus linguistics
KR101004515B1 (en) Method and system for retrieving confirming sentences
Malandrakis et al. Distributional semantic models for affective text analysis
RU2487403C1 (en) Method of constructing semantic model of document
Cao et al. A multi-dimensional contrastive study of English abstracts by native and non-native writers
US20040167875A1 (en) Information processing method and system
JP4347226B2 (en) Information extraction program, recording medium thereof, information extraction apparatus, and information extraction rule creation method
JP2007141090A (en) Question answering system, data retrieval method and computer program
JP2007531065A (en) Language processing method and apparatus
JP2001075966A (en) Data analysis system
WO2007105202A2 (en) Automatic reusable definitions identification (rdi) method
Chklovski et al. User interfaces with semi-formal representations: a study of designing argumentation structures
JP2007047974A (en) Information extraction device and information extraction method
JP2008204133A (en) Answer search apparatus and computer program
Filho et al. Crawling by readability level
Neves et al. Automatic content recommendation and aggregation according to scorm
Yafoz et al. Sentiment analysis in Arabic social media using deep learning models
JP4361299B2 (en) Evaluation expression extraction apparatus, program, and storage medium
Jaćimović Textometric methods and the TXM platform for corpus analysis and visual presentation
JP4428703B2 (en) Information retrieval method and system, and computer program
Alarcón et al. Hulat-ALexS CWI Task-CWI for Language and Learning Disabilities Applied to University Educational Texts.
JP2015014980A (en) Search system
Grabar et al. Classification of health webpages as expert and non expert with a reduced set of cross-language features
Papadias et al. Educing knowledge from text: Semantic information extraction of spatial concepts and places
Alassir et al. Paraphrasing Tool Using the NooJ Platform

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120417

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120911