JPH07105213A - Linguistic processor - Google Patents

Linguistic processor

Info

Publication number
JPH07105213A
JPH07105213A JP5246887A JP24688793A JPH07105213A JP H07105213 A JPH07105213 A JP H07105213A JP 5246887 A JP5246887 A JP 5246887A JP 24688793 A JP24688793 A JP 24688793A JP H07105213 A JPH07105213 A JP H07105213A
Authority
JP
Japan
Prior art keywords
sentence
concept
meaning
semantic
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5246887A
Other languages
Japanese (ja)
Other versions
JP3140894B2 (en
Inventor
Akito Nagai
明人 永井
Yasushi Ishikawa
泰 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP05246887A priority Critical patent/JP3140894B2/en
Publication of JPH07105213A publication Critical patent/JPH07105213A/en
Application granted granted Critical
Publication of JP3140894B2 publication Critical patent/JP3140894B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PURPOSE:To take a linguistically semantic analysis of an input sentence of a general user which includes various expressions and to efficiently verify the meaning of the sentence. CONSTITUTION:A morpheme analyzing means 2 takes a morpheme analysis of the input sentence from an input means by referring to a vocabulary knowledge storage means 3 and outputs candidates for words and phrases that possibly appear to a meaning extracting means 9, which extracts plural concept elements appearing in the candidates by referring to a concept element knowledge storage means 6 and outputs a combination of concept elements constituting the meaning of the sentence to a sentence meaning establishment decision means 7; and the sentence meaning establishment decision means 7 interprets the meaning by deciding whether or not the combination of concept elements inputted from the concept element extracting means 4 is proper to express the meaning of the whole sentence.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、自然言語で入力され
た文に形態素解析、および意味解析を行なって入力文の
意味内容を解析する言語処理装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a language processing apparatus for analyzing the meaning content of an input sentence by performing morphological analysis and semantic analysis on a sentence input in natural language.

【0002】[0002]

【従来の技術】一般の利用者にとって自然で使いやすい
インタフェースを目指して、音声などの自然言語によっ
て計算機を操作する対話システムの実現が非常に望まれ
ている。従来から、入力された文の意味解釈を計算機上
で行なうために用いられる代表的な言語処理技術とし
て、形態素解析、構文解析、および意味解析などの技術
がある。これらのうち特に、利用者と計算機が対話的に
作業を進めるシステムにおいては、利用者が計算機に何
をやらせたいかを把握するための意味解析技術が中心的
な役割を果たす。
2. Description of the Related Art With the aim of providing an interface that is natural and easy for general users to use, it is highly desired to realize a dialogue system for operating a computer using natural language such as voice. Conventionally, morphological analysis, syntactic analysis, and semantic analysis have been used as typical language processing techniques used to interpret the meaning of an input sentence on a computer. Among them, especially in a system in which a user and a computer interactively work, a semantic analysis technique for the user to grasp what the computer wants to do plays a central role.

【0003】意味解析技術については、電子情報通信学
会「日本語情報処理」3版 (昭和62年5月30日)p.141-16
6に記載されているもののうち、動詞と名詞句、前置詞
句などとの共起関係を表現した格フレーム形式を用いた
意味解析が、一般に広く用いられている。
Regarding the semantic analysis technology, the Institute of Electronics, Information and Communication Engineers, "Japanese Information Processing" 3rd Edition (May 30, 1987) p.141-16
Among those described in 6, the semantic analysis using the case frame format that expresses the co-occurrence relation between verbs, noun phrases, prepositional phrases, etc. is generally widely used.

【0004】図7は、この格フレームを用いた意味解析
の代表的な処理を示すブロック構成図である。入力手段
1は、利用者が計算機に入力したい情報を文字で表現さ
れた文に変換し、形態素解析手段2へその結果を出力す
る。形態素解析手段2は、語▲い▼知識記憶手段3に記
憶してある単語の見出し語や品詞などの語▲い▼情報
と、単語や文節などの抽出すべき単位を定義する文法規
則などに基づいて、入力文に対し形態素解析を行ない、
抽出された単語や文節などの形態素の列を意味抽出手段
9へ出力する。意味抽出手段9は、形態素と、意味素性
と呼ばれる形態素の意味概念との対応関係が記憶されて
いる意味素性知識記憶手段5を参照して、形態素解析手
段2により入力された形態素に意味素性を対応させ、格
フレーム知識記憶手段10に記憶されている、文全体の
意味表現である格フレームを用いて、意味素性付きの形
態素から文の意味表現を抽出する。
FIG. 7 is a block diagram showing a typical process of semantic analysis using this case frame. The input unit 1 converts the information that the user wants to input into the computer into a sentence expressed in characters, and outputs the result to the morphological analysis unit 2. The morphological analysis means 2 uses word information such as headwords and parts of speech of words stored in the word knowledge storage means 3 and grammatical rules that define units to be extracted such as words and phrases. Based on the morphological analysis of the input sentence,
The sequence of morphemes such as the extracted words and clauses is output to the meaning extraction means 9. The meaning extraction unit 9 refers to the semantic feature knowledge storage unit 5 that stores the correspondence between the morpheme and the semantic concept of the morpheme called the semantic feature, and refers the semantic feature to the morpheme input by the morpheme analysis unit 2. Correspondingly, using the case frame which is the semantic expression of the entire sentence stored in the case frame knowledge storage means 10, the semantic expression of the sentence is extracted from the morpheme with the semantic feature.

【0005】次に、意味解析の中心的な処理である意味
抽出手段における基本的な動作を説明する。この方式で
は、格フレームを文全体の意味を表現するパターンとし
て用いる。格フレームは動詞の用法別に複数記憶され、
格要素を表現する複数のスロットから構成される。スロ
ットとは、文を構成する名詞句などを埋め込む部分であ
り、動作主格、対象格、場所格などの動詞の格要素毎に
準備される。スロットに埋め込まれる名詞句などは、フ
ィラーと呼ばれる。フィラーとしては、通常、単語や文
節程度までの短い単位が用いられ、単語と意味素性との
対応関係を記憶した意味辞書を用いて、それぞれのフィ
ラーに意味素性が与えられる。また、それぞれのスロッ
トには、そこに埋め込まれるフィラーに許される意味概
念、および前置詞などが記憶されており、フィラーの持
つ意味素性、および前置詞との意味的な適合性が検証さ
れる。
Next, the basic operation of the meaning extraction means, which is the main processing of the semantic analysis, will be described. In this method, the case frame is used as a pattern expressing the meaning of the whole sentence. Multiple case frames are stored for each verb usage,
It is composed of multiple slots that represent case elements. A slot is a part in which a noun phrase or the like that constitutes a sentence is embedded, and is prepared for each case element of a verb such as a nominative case, a subject case, and a place case. A noun phrase embedded in a slot is called a filler. As the filler, a short unit such as a word or a phrase is usually used, and a semantic dictionary storing a correspondence relationship between a word and a semantic feature is used to give each filler a semantic feature. Further, in each slot, a semantic concept allowed in the filler embedded therein, a preposition, and the like are stored, and the semantic features of the filler and the semantic compatibility with the preposition are verified.

【0006】上記の意味表現に基づいて、入力された文
から抽出された単語や文節などの形態素(フィラー)は、
格フレームにおけるスロットの意味的制約条件に検証さ
れながら、意味的に許されるスロットに埋め込まれてい
く。このようにして、文を構成し得るフィラーが、全て
意味的に適合した格フレームをもって、文全体の意味の
抽出結果とする。
Based on the above-mentioned semantic expression, morphemes (fillers) such as words and clauses extracted from the input sentence are
While being verified by the semantic constraints of the slots in the case frame, they are embedded in the slots that are allowed semantically. In this way, all the fillers that can form a sentence have a case frame that is semantically matched, and the meaning of the entire sentence is extracted.

【0007】[0007]

【発明が解決しようとする課題】しかしながら、上記の
意味解析方式では、以下のような課題があった。 (1) 一般の利用者が入力する文は様々な言い回しを含
み、文のパターンの種類は膨大に存在すると考えられ
る。従って、文全体の意味を表現する格フレームを文の
パターン毎に多数用意しようとしても、多種多様な文の
パターンを十分にカバーしきれず、解析できない場合が
あった。言い換えれば、言語的な頑健さを得るのが困難
であった。
However, the above-mentioned semantic analysis method has the following problems. (1) Sentences input by general users include various phrases, and it is considered that there are a huge number of types of sentence patterns. Therefore, even if a large number of case frames expressing the meaning of the entire sentence are prepared for each sentence pattern, it may not be possible to sufficiently cover a wide variety of sentence patterns and analysis may not be possible. In other words, it was difficult to obtain verbal robustness.

【0008】(2) 単語や文節を直接、意味理解の単位
であるフィラーとして扱うと、意味的な曖昧さのために
非常に多くの意味解釈の仮説が生成され、意味検証が効
率的でなかった。
(2) When a word or a phrase is directly treated as a filler, which is a unit of meaning understanding, a large number of hypotheses of meaning interpretation are generated due to the semantic ambiguity, and the meaning verification is not efficient. It was

【0009】この発明は、上記の課題を解決するもの
で、様々な言い回しを含む一般の利用者の入力文に対し
て、言語的に頑健に意味解析し、かつ、文の意味の検証
を効率的に行なうことが可能な言語処理装置を提供する
ものである。
The present invention solves the above problems, and linguistically robustly analyzes the meaning of an input sentence of a general user including various phrases and efficiently verifies the meaning of the sentence. The present invention provides a language processing device that can be performed in a specific manner.

【0010】[0010]

【課題を解決するための手段】この発明は、前記課題を
解決するために、自然言語で入力された文に対して形態
素解析を行なって文節候補列を抽出し、それらの文節候
補列に対して、基本的な概念(概念素)を中間的な理解単
位とした概念素フレームを概念素抽出手段によって適用
して、文の部分的な意味的まとまりを概念素として抽出
し、抽出された複数の概念素の組合せが、文全体の意味
を表現するものとして適切であるかどうかを、対象領域
に関する知識や文脈知識などを用いて、文意判定手段に
よって判定し、入力文の意味表現を得る、二段階の意味
抽出方式を行なうようにしたものである。
In order to solve the above problems, the present invention performs morphological analysis on a sentence input in natural language to extract a bunsetsu candidate sequence, and extracts the bunsetsu candidate sequence from the bunsetsu candidate sequence. Then, by applying a conceptual element frame with a basic concept (conceptual element) as an intermediate understanding unit by the conceptual element extraction means, a partial semantic group of sentences is extracted as a conceptual element, and the extracted plural elements are extracted. Whether the combination of conceptual elements of is suitable for expressing the meaning of the whole sentence is judged by the sentence meaning judgment means by using the knowledge about the target area and the context knowledge, and the semantic expression of the input sentence is obtained. , Is a two-stage meaning extraction method.

【0011】[0011]

【作用】この発明によれば、一般の利用者が入力する多
種多様なパターンを有する文全体の意味が、単語や文節
の組合せとしてではなく、文節よりも長い区間の意味的
まとまりである概念素の組合せとして表現されるので、
文パターンの表現効率を高めるように働く。
According to the present invention, a concept element in which the meaning of the entire sentence having a wide variety of patterns input by a general user is not a combination of words or phrases but a semantic unit of a section longer than the phrase Is expressed as a combination of
It works to improve the expression efficiency of sentence patterns.

【0012】また、文意成立判定知識記憶手段によって
記憶された対象領域に関する知識や文脈知識などをトッ
プダウンに直接働かせる対象としては、文パターンより
も概念素の方が、その予測が比較的容易であるために、
頑健な言語処理の設計がしやすくなる。
Further, as a target for directly applying top-down knowledge or context knowledge about the target area stored by the sentence intention determination knowledge storage means, the concept pattern is relatively easy to predict rather than the sentence pattern. To be
It makes it easier to design robust language processing.

【0013】さらに、文の意味の成立を判定する処理は
文節ではなく概念素を直接対象にすることから、単語や
文節を直接フィラーとして扱った場合と異なり、効率の
良い意味検証の処理ができるようになる。
Further, since the process of determining the establishment of the meaning of a sentence directly targets not the bunsetsu, but the conceptual element, an efficient process of semantic verification can be performed unlike the case where a word or a bunsetsu is directly treated as a filler. Like

【0014】[0014]

【実施例】以下、この発明の一実施例を、図面とともに
説明する。図1は、この発明の実施例を示す機能ブロッ
ク図である。図1において、入力手段1は、利用者が計
算機に入力したい情報を文字で表現された文に変換し、
形態素解析手段2へその結果を出力する。利用者がキー
ボードを用いて計算機に文を入力した場合は、入力手段
1はキーボードであり、音声によって文を入力した場合
は、入力手段1は音声認識器である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a functional block diagram showing an embodiment of the present invention. In FIG. 1, the input means 1 converts the information that the user wants to input into the computer into a sentence expressed in characters,
The result is output to the morphological analysis unit 2. When the user inputs a sentence to the computer using the keyboard, the input unit 1 is a keyboard, and when the user inputs a sentence by voice, the input unit 1 is a voice recognizer.

【0015】形態素解析手段2は、語▲い▼知識記憶手
段3に記憶してある単語の見出し語や品詞などの語▲い
▼情報と、単語と単語の接続を規定して文節を定義する
文法規則に基づいて、入力文に対し形態素解析を行な
い、出現可能な文節候補を入力文から全て抽出し、それ
らの文節候補の集合を意味抽出手段9における概念素抽
出手段4へ出力する。ここで、形態素解析手段2で抽出
するものは文節である必要はなく、文の部分的な単位で
あれば良い。
The morpheme analysis means 2 defines word information stored in the word knowledge storage means 3, such as headwords and part-of-speech of words, and word and word connections to define clauses. Morphological analysis is performed on the input sentence based on grammatical rules, all possible phrase clauses are extracted from the input sentence, and a set of these phrase candidates is output to the concept element extracting unit 4 in the meaning extracting unit 9. Here, what is extracted by the morpheme analysis unit 2 does not have to be a phrase, but may be a partial unit of a sentence.

【0016】概念素抽出手段4では、まず、自立語と意
味素性との対応関係が記憶されている意味素性知識記憶
手段5を参照して、形態素解析手段2から入力されたそ
れぞれの文節候補に対し、意味素性を与える。次に、概
念素抽出手段4は、形態素解析手段2から入力された文
節候補のうち、文候補として時間的な順序で接続可能な
組合せを選択し、選択されたそれぞれの文節候補につい
て概念素知識記憶手段6を参照して意味的な適合性を検
証しながら、概念素フレームのスロットに埋め込んでい
く。最後に、概念素抽出手段4は、文節候補が埋め込ま
れたスロットを有する概念素フレームを全て抽出し、文
候補を構成する文節候補の組合せから抽出された概念素
の組合せを、文意成立判定手段7へ出力する。
The concept element extraction unit 4 first refers to the semantic feature knowledge storage unit 5 in which the correspondence relationship between the independent word and the semantic feature is stored and refers to each phrase candidate input from the morpheme analysis unit 2. On the other hand, it gives a semantic feature. Next, the concept element extraction unit 4 selects, from among the phrase candidates input from the morpheme analysis unit 2, a combination that can be connected in a temporal order as a sentence candidate, and the concept element knowledge about each selected phrase candidate. While verifying the semantic compatibility by referring to the storage unit 6, the concept unit frame is embedded in the slot. Finally, the concept element extraction unit 4 extracts all the concept element frames having the slots in which the phrase candidates are embedded, and determines the combination of the concept elements extracted from the combination of the phrase candidates forming the sentence candidates to determine the sentence meaning. Output to the means 7.

【0017】文意成立判定手段7は、文意成立判定知識
記憶手段8を参照して、概念素抽出手段4から入力され
た概念素の組合せが、文全体の意味を表現するのに適当
であるか否かを判定する。文意成立判定知識記憶手段8
に記憶される知識としては、対象領域に関する知識や文
脈知識などであり、その他にも文意の判定に有効である
知識源は、ここに含まれる。
The sentence meaning determination means 7 refers to the sentence meaning determination knowledge storage means 8 and the combination of the concept elements input from the concept element extraction means 4 is suitable for expressing the meaning of the entire sentence. Determine if there is. Sentence determination knowledge storage means 8
The knowledge stored in is knowledge about the target area, contextual knowledge, and the like, and other knowledge sources that are effective in determining the meaning of the sentence are included here.

【0018】以上のような構成において、以下にその動
作を、「湘南海岸の近くできれいなプールのあるホテル
を教えて下さい」という入力文を例にして説明する。形
態素解析手段2は、入力文中に出現可能な文節候補とし
て、「湘南海岸の」、「近くで」、「きれいな」、「プ
ールの」、「ある」、「ホテルを」、「教えて下さい」
などを抽出する。これら以外にも、同音意義語や、音声
入力の場合の認識誤りによる文節候補(例えば、「海
岸」に対する「階段」)なども抽出される。これらの文
節候補には、「湘南海岸(名詞)、の(格助詞)」といった
品詞情報、および入力文中での文節候補の時間的位置の
情報もあわせて抽出される。
In the above-mentioned configuration, the operation will be described below by taking an input sentence "Tell me a clean pool hotel near the Shonan coast" as an example. The morphological analysis means 2 has "Shonan Kaigan", "Near", "Beautiful", "Pool", "Aru", "Hotel", and "Tell me" as bunsetsu candidates that can appear in the input sentence.
And so on. In addition to these, homophonetic meaning words and bunsetsu candidates (for example, “stairs” for “coast”) due to recognition errors in the case of voice input are also extracted. For these bunsetsu candidates, part-of-speech information such as "Shonan Kaigan (noun), no (case particle)" and information on the temporal position of the bunsetsu candidate in the input sentence are also extracted.

【0019】これらの文節候補の集合は概念素抽出手段
4に入力され、各文節候補内の自立語の情報と、意味素
性知識記憶手段5に記憶されている自立語と意味素性と
の対応関係情報によって、図3のようにそれぞれ意味素
性が与えられる。この意味素性は、概念素フレームのそ
れぞれのスロットに記憶してある意味的制約条件を検証
するためのものであり、ある文節候補が概念素フレーム
のあるスロットを意味的に満たすことができるかどうか
を判定するために用いられる。
The set of these bunsetsu candidates is input to the concept element extraction means 4, and the correspondence information between the independent word information in each bunsetsu candidate and the independent words and semantic features stored in the semantic feature knowledge storage means 5. The information gives semantic features as shown in FIG. This semantic feature is for verifying the semantic constraints stored in each slot of the conceptual element frame, and whether a certain clause candidate can semantically satisfy a certain slot of the conceptual element frame. Is used to determine

【0020】続いて、図2に示したような、文候補とし
て時間的な順序で接続可能な文節候補の組合せに対して
概念素フレームを適用して、文節候補を概念素の単位に
まとめる。概念素の具体的な定義は、図3に示すような
概念素フレームとして記憶されている。図3(1)の例
は、文に出現し得る基本的な概念として、「駅に近
い」、「繁華街から離れている」などの、場所の遠近を
表現する概念を記憶した概念素フレームを示し、また図
3(2)の例は「プールがある」、「駐車場が付いてい
る」などの、設備を表現する概念素フレームを示してい
る。それぞれのスロットには、フィラーが満たすべき制
約条件として意味素性と助詞が記憶されている。各概念
素には、その概念素のみを表現するための言い回しを十
分カバーできるだけのスロットを記憶する。
Next, as shown in FIG. 2, the conceptual element frame is applied to the combination of the phrase candidates that can be connected in the temporal order as the sentence candidates, and the phrase candidates are grouped into conceptual element units. A concrete definition of a conceptual element is stored as a conceptual element frame as shown in FIG. The example of FIG. 3 (1) is a conceptual element frame that stores a concept expressing the perspective of a place such as “close to a station” or “away from a downtown area” as a basic concept that can appear in a sentence. In addition, the example of FIG. 3 (2) shows a conceptual element frame expressing equipment such as "there is a pool" and "there is a parking lot". In each slot, a semantic feature and a particle are stored as constraints that the filler must satisfy. Each concept element stores a slot that can sufficiently cover a phrase for expressing only that concept element.

【0021】文の意味理解の単位を、文全体を表現する
格フレームではなく、文の部分的な概念素としたこと
で、文としての全ての言い回しを記憶する必要がなく、
言い回しは各概念素の単位のみで記憶すれば良い。従っ
て、文全体を処理対象にする格フレームよりも、言い回
しの表現効率が高いことは明らかである。これらの概念
素フレームの記述は、概念素知識記憶手段6に記憶され
ている。
Since the unit of understanding the meaning of a sentence is not a case frame expressing the whole sentence but a partial conceptual element of the sentence, it is not necessary to memorize all the expressions of the sentence,
The wording need only be stored in units of each conceptual element. Therefore, it is clear that the expression efficiency of wording is higher than that of the case frame in which the entire sentence is processed. The description of these conceptual element frames is stored in the conceptual element knowledge storage unit 6.

【0022】このようにして、図2の文節候補を概念素
の単位にまとめた例を図4に示す。この例では、概念素
(場所の遠近)を表す表現として、「湘南海岸の」、「近
くで」がまとめられおり、以下同様に、概念素(設備)を
表す表現として「きれいな」、「プールの」、「あ
る」、概念素(宿泊施設)を表す表現として「ホテル
を」、概念素(意図)を表す表現として「教えて下さい」
が、それぞれまとめられている。これらの概念素の組合
せにより、文全体の意味を表現する。
FIG. 4 shows an example in which the phrase candidates shown in FIG. 2 are collected in units of conceptual elements in this way. In this example, the concept element
"Shonan Kaigan" and "near" are summarized as expressions that represent (the perspective of a place), and similarly, "clean", "pool", and "is" as the expressions that represent conceptual elements (equipment). , "Hotel" as an expression that represents a conceptual element (accommodation), and "Tell me" as an expression that represents a conceptual element (intention)
But each is summarized. The meaning of the whole sentence is expressed by the combination of these conceptual elements.

【0023】従って、文の意味的なパターンを考えた場
合、概念素の時間的な出現順序は任意であり、また、別
の概念素が付加することも任意であることから、多種多
様な言い回しを含む一般利用者の入力文を頑健に意味解
析できることは言うまでもない。
Therefore, when considering the semantic pattern of a sentence, the temporal order of appearance of conceptual elements is arbitrary, and addition of another conceptual element is also optional. Needless to say, it is possible to robustly analyze the meaning of input sentences of general users including.

【0024】次に、概念素抽出手段4から入力された概
念素の組合せに対して、文意成立判定手段7は、概念素
の組合せが文全体の意味を成立させるのに適当であるか
どうかを、文意成立判定知識記憶手段8を参照して判定
する。以下に、本実施例で行なった文意判定の方法を三
種類説明する。
Next, with respect to the combination of the concept elements input from the concept element extracting means 4, the sentence meaning determination means 7 determines whether or not the combination of the concept elements is appropriate to establish the meaning of the whole sentence. Is determined by referring to the sentence meaning determination knowledge storage means 8. Hereinafter, three types of methods for determining the meaning of a sentence performed in this embodiment will be described.

【0025】まず第一の文意判定方法は、概念素抽出手
段4から抽出された概念素に対するトップダウンの知識
として、入力文に込められている利用者の意図を利用す
る方法である。意図とは、質問応答システムにおいて利
用者がシステムに何をさせたいのかを表現するものであ
り、具体的には、質問文を分類した種類を指す。質問文
は、ホテルを予約する場合を例にとれば、予約、変更、
取消、WH質問、YN質問、検索などに分類できる。これら
の質問文の種類を、概念素抽出手段4から抽出された概
念素フレーム中の文節候補の情報によって決定し、各意
図における概念素の存在条件を設定することができるよ
うになる。
The first sentence intention determination method is a method of utilizing the user's intention included in the input sentence as top-down knowledge about the concept element extracted from the concept element extraction means 4. The intention expresses what the user wants the system to do in the question answering system, and specifically refers to the type in which the question sentence is classified. Taking the example of booking a hotel, the question text is
Can be categorized as cancellation, WH question, YN question, search, etc. The type of these question sentences can be determined by the information of the phrase candidates in the concept element frame extracted from the concept element extraction unit 4, and the existence condition of the concept element in each intention can be set.

【0026】図5に、ホテルを予約する場合における意
味構造を示す。図中の「ホテル予約」は意図を示し、
「ホテル名」、「日時」、「部屋」、「人数」などは、
ホテル予約必須情報としての概念素を示す。その他の概
念素は、ホテルの属性を示す。このような階層的な意味
構造を参照して、概念素内の文節候補の情報から意図を
推論する。
FIG. 5 shows a semantic structure when reserving a hotel. "Hotel reservation" in the figure indicates the intention,
"Hotel name", "date and time", "room", "number of people", etc.
This section shows the concept element as essential information for hotel reservation. Other conceptual elements indicate the attributes of the hotel. By referring to such a hierarchical semantic structure, the intention is inferred from the information of the clause candidates in the concept element.

【0027】具体的には、図6に示すように、発話意図
抽出のキーワードとして、各意図に関連の深い述語(予
約する、変える、やめる、探す、など)を用い、述語が
省略されている場合には、(1) ホテル予約を達成する
ための予約必須情報(ホテル名、日時、部屋の種類・
数、人数)の有無、(2) 概念素で階層的に表現された
ホテルの属性情報の有無、により意図を推論する。
Specifically, as shown in FIG. 6, predicates (reserved, changed, stopped, searched, etc.) that are deeply related to each intention are used as keywords for utterance intention extraction, and the predicates are omitted. In this case, (1) Reservation essential information for hotel reservation (hotel name, date and time, room type,
The intention is inferred based on the presence / absence of the number and the number of persons, and (2) the presence / absence of attribute information of the hotel hierarchically expressed by the concept element.

【0028】次に第二の文意判定の方法は、概念素抽出
手段4から抽出された概念素に対して、各概念素の中心
的な意味的役割を持つスロットを必須スロットとして定
義し、これ以外のスロットのみから成る概念素フレーム
が単独で成立しないようにする方法である。この方法に
より、単独のスロットで成立した場合に意味的におかし
い概念素を排除する。
Next, in the second method of determining the meaning of a sentence, with respect to the concept elements extracted from the concept element extracting means 4, a slot having a central semantic role of each concept element is defined as an essential slot, This is a method of preventing a conceptual element frame consisting of only other slots from being established independently. This method eliminates semantic elements that are semantically wrong when they are established by a single slot.

【0029】第三の文意判定の方法は、各概念素内では
全ての文節候補が時間的に接続していることを仮定する
方法である。これは、入力文に対して意味的に適合させ
つつ、各概念素を時間的に伸ばしていくことに相当し、
入力文中に同じ概念素が別の位置に分かれて出現するよ
うな概念素の組合せを排除する。
The third method of determining the meaning of a sentence is a method of assuming that all phrase candidates are temporally connected in each conceptual element. This is equivalent to extending each conceptual element temporally while adapting semantically to the input sentence,
A combination of conceptual elements in which the same conceptual element appears in different positions in the input sentence is excluded.

【0030】文意成立判定手段7、および文意成立判定
知識記憶手段8においては、以上述べた三種類の文意判
定の方法に限らず、文脈知識や常識といった他の知識も
広く適用することができる。
In the sentence meaning determination means 7 and the sentence determination knowledge storage means 8, not only the three types of sentence determination methods described above but also other knowledge such as context knowledge and common sense are widely applied. You can

【0031】[0031]

【発明の効果】以上のように、この発明によれば、従来
の、動詞の用法に基づいた格フレームを用いる意味解析
方式に比べ、文の意味理解の単位を文全体を表現する格
フレームではなく、文の部分的な概念素としたことで、
文としての全ての言い回しを記憶する必要がなく、言い
回しは各概念素の単位のみで記憶すれば良い。従って、
文全体を処理対象にする格フレームよりも、言い回しの
表現効率が高くなるという効果がある。この効果は、対
象とする文の言い回しの種類が多いほど特に顕著にな
る。
As described above, according to the present invention, as compared with the conventional semantic analysis method using the case frame based on the usage of verbs, the unit of meaning understanding of a sentence is Instead, by using a partial conceptual element of the sentence,
It is not necessary to store all phrases as sentences, and phrases may be stored only in units of each conceptual element. Therefore,
This has the effect that the expression efficiency of wording is higher than in case frames in which the entire sentence is processed. This effect becomes more remarkable as the number of wording types of the target sentence increases.

【0032】また、言い回しの表現効率が高いという効
果に伴って、文の意味の成立を判定する処理は文節では
なく概念素を直接対象にすることから、単語や文節を直
接フィラーとして扱った場合と異なり、効率の良い意味
検証の処理ができるという効果もある。
Further, with the effect that the expression efficiency of the wording is high, the process of determining the establishment of the meaning of the sentence directly targets not the bunsetsu, but the conceptual element, so that a word or a bunsetsu is directly treated as a filler. Unlike the above, there is also an effect that efficient semantic verification processing can be performed.

【0033】一方、文の意味的なパターンを考えた場
合、概念素の時間的な出現順序は任意であり、また、別
の概念素が付加することも任意であることから、多種多
様な言い回しを含む一般利用者の入力文を、言語的に頑
健に意味解析できる効果がある。
On the other hand, when considering the semantic pattern of a sentence, the temporal order of appearance of conceptual elements is arbitrary, and it is also arbitrary that another conceptual element is added. It has the effect of semantically analyzing the input sentence of a general user including verbally.

【0034】さらに、概念素の定義は文パターンの定義
よりも、対象領域の変更に対してより汎用的であり、処
理の対象領域を変更する場合に、基本的な概念素の再構
成によって容易に新たな対象領域を表現できるという効
果がある。
Further, the definition of the conceptual element is more general than the definition of the sentence pattern with respect to the change of the target area, and when changing the target area of the processing, it is easy to reconstruct the basic concept element. Has the effect of expressing a new target area.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の一実施例を示す言語処理装置の機能
ブロック構成図である。
FIG. 1 is a functional block configuration diagram of a language processing device showing an embodiment of the present invention.

【図2】この発明の一実施例における意味素性情報付与
の例を示す説明図である。
FIG. 2 is an explanatory diagram showing an example of adding semantic feature information according to an embodiment of the present invention.

【図3】この発明の一実施例における概念素フレームの
例を示す説明図である。
FIG. 3 is an explanatory diagram showing an example of a conceptual element frame according to an embodiment of the present invention.

【図4】この発明の一実施例における概念素フレームに
よる概念素抽出の例を示す説明図である。
FIG. 4 is an explanatory diagram showing an example of conceptual element extraction by a conceptual element frame according to an embodiment of the present invention.

【図5】この発明の一実施例における対象領域の意味構
造を示す説明図である。
FIG. 5 is an explanatory diagram showing a semantic structure of a target area in one embodiment of the present invention.

【図6】この発明の一実施例における文意判定知識とし
ての意図抽出知識の例を示す説明図である。
FIG. 6 is an explanatory diagram showing an example of intention extraction knowledge as sentence determination knowledge in one embodiment of the present invention.

【図7】従来の格フレームを用いた意味解析方式の機能
ブロック構成図である。
FIG. 7 is a functional block configuration diagram of a semantic analysis method using a conventional case frame.

【符号の説明】[Explanation of symbols]

1 入力手段 2 形態素解析手段 3 語▲い▼知識記憶手段 4 概念素抽出手段 5 意味素性知識記憶手段 6 概念素知識記憶手段 7 文意成立判定手段 8 文意成立判定知識記憶手段 9 意味抽出手段 10 格フレーム知識記憶手段 1 Input Means 2 Morphological Analysis Means 3 Words Knowledge Storage Means 4 Conceptual Membrane Extraction Means 5 Semantic Feature Knowledge Storage Means 6 Conceptual Element Knowledge Storage Means 7 Sentence Determining Judgment Means 8 Sentence Determining Judgment Knowledge Storage Means 9 Meaning Extraction Means 10 Case frame knowledge storage means

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 自然言語を表現する文を入力する入力手
段と、入力手段が入力する文に対して形態素解析を行な
って、単語や文節等の候補を出力する形態素解析手段
と、単語や文節に対する意味素性情報を記憶する意味素
性知識記憶手段と、単語や文節間の意味関係が記憶さ
れ、それらが文の部分的な意味的まとまりをなすものと
してフレーム構造で表現し、概念素として格納した概念
素知識記憶手段と、前記意味素性知識記憶手段を参照し
て、前記形態素解析手段が出力する各候補に意味素性を
与え、文の部分を構成する候補群に対して、前記概念素
知識記憶手段を参照して概念素を抽出する概念素抽出手
段と、文全体の意味表現を概念素の組合せとし、文全体
の意味表現として認定するための概念素の組合せに対す
る条件を記憶した文意成立判定知識記憶手段と、前記概
念素抽出手段が抽出した概念素の組合せに対して、前記
文意成立判定知識記憶手段に格納された概念素の組合せ
に対する条件に適合する概念素の組合せを出力する文意
成立判定手段とを備えたことを特徴とする言語処理装
置。
1. Input means for inputting a sentence expressing a natural language, morphological analysis means for performing morphological analysis on a sentence input by the input means, and outputting candidates such as words and phrases, and words and phrases. Semantic feature knowledge storage means for storing semantic feature information for, and semantic relations between words and clauses are stored, expressed as a frame structure as a partial semantic unit of a sentence, and stored as a concept element. By referring to the concept element knowledge storage means and the semantic feature knowledge storage means, a semantic feature is given to each candidate output by the morpheme analysis means, and the concept element knowledge storage is performed for a candidate group forming a sentence part. A concept element extraction means for extracting a concept element by referring to a means, and a sentence intention that stores a condition for a combination of concept elements for recognizing a semantic expression of the whole sentence as a concept expression combination With respect to the combination of the vertical determination knowledge storage means and the conceptual element extracted by the conceptual element extraction means, a combination of conceptual elements that meets the condition for the combination of conceptual elements stored in the sentence determination success knowledge storage means is output. A language processing device, comprising:
JP05246887A 1993-10-01 1993-10-01 Language processor Expired - Fee Related JP3140894B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05246887A JP3140894B2 (en) 1993-10-01 1993-10-01 Language processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05246887A JP3140894B2 (en) 1993-10-01 1993-10-01 Language processor

Publications (2)

Publication Number Publication Date
JPH07105213A true JPH07105213A (en) 1995-04-21
JP3140894B2 JP3140894B2 (en) 2001-03-05

Family

ID=17155231

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05246887A Expired - Fee Related JP3140894B2 (en) 1993-10-01 1993-10-01 Language processor

Country Status (1)

Country Link
JP (1) JP3140894B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018151464A1 (en) * 2017-02-14 2018-08-23 윤종식 Coding system and coding method using voice recognition
CN111373391A (en) * 2017-11-29 2020-07-03 三菱电机株式会社 Language processing device, language processing system, and language processing method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018151464A1 (en) * 2017-02-14 2018-08-23 윤종식 Coding system and coding method using voice recognition
CN111373391A (en) * 2017-11-29 2020-07-03 三菱电机株式会社 Language processing device, language processing system, and language processing method
CN111373391B (en) * 2017-11-29 2023-10-20 三菱电机株式会社 Language processing device, language processing system, and language processing method

Also Published As

Publication number Publication date
JP3140894B2 (en) 2001-03-05

Similar Documents

Publication Publication Date Title
US10552533B2 (en) Phrase-based dialogue modeling with particular application to creating recognition grammars for voice-controlled user interfaces
US6374224B1 (en) Method and apparatus for style control in natural language generation
US6282507B1 (en) Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6442524B1 (en) Analyzing inflectional morphology in a spoken language translation system
US6243669B1 (en) Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6223150B1 (en) Method and apparatus for parsing in a spoken language translation system
WO2000045290A1 (en) A method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
WO1999063456A1 (en) Language conversion rule preparing device, language conversion device and program recording medium
WO2003056450A1 (en) Syntax analysis method and apparatus
WO2000045377A9 (en) A method and apparatus for performing spoken language translation
Lee et al. A dialogue analysis model with statistical speech act processing for dialogue machine translation
Heeman et al. Incorporating POS tagging into language modeling
JP3441400B2 (en) Language conversion rule creation device and program recording medium
Huang et al. Language understanding component for Chinese dialogue system.
Zaenen et al. Language analysis and understanding
Popescu-Belis et al. Cooperation between pronoun and reference resolution for unrestricted texts
Hale et al. PCFGs with syntactic and prosodic indicators of speech repairs
JP3140894B2 (en) Language processor
JP3181465B2 (en) Language processor
Boitet Automated translation
Samir et al. Training and evaluation of TreeTagger on Amazigh corpus
Fohr et al. Towards an oral interface for data entry: The maud system
Hoge et al. Syllable-based acoustic-phonetic decoding and wordhypotheses generation in fluently spoken speech
Hegde et al. Tagging Speech For Words In Low Resourced Monolingual Contexts of Sanskrit Shlokas
Mima et al. A situation-based approach to spoken dialog translation between different social roles

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071215

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081215

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091215

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees