JP2003281138A - System and method of processing natural language, and computer program - Google Patents

System and method of processing natural language, and computer program

Info

Publication number
JP2003281138A
JP2003281138A JP2002079626A JP2002079626A JP2003281138A JP 2003281138 A JP2003281138 A JP 2003281138A JP 2002079626 A JP2002079626 A JP 2002079626A JP 2002079626 A JP2002079626 A JP 2002079626A JP 2003281138 A JP2003281138 A JP 2003281138A
Authority
JP
Japan
Prior art keywords
meaning
speech
natural language
particle
language processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002079626A
Other languages
Japanese (ja)
Inventor
Tomoko Okuma
智子 大熊
Hiroshi Masuichi
博 増市
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2002079626A priority Critical patent/JP2003281138A/en
Publication of JP2003281138A publication Critical patent/JP2003281138A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To accurately output the semantic information of a adverbial particle which may have a plurality of semantic functions according to the position of appearance. <P>SOLUTION: The adverbial particle 'bakari' has two meanings: a meaning of 'limitation' and a meaning of 'degree'. The information about the sentence structure of the adverbial particle 'bakari' included in an inputted sentence is extracted, and whether the word 'bakari' relates to a quantifier or not is determined. When the result of determination is positive, the meaning of 'bakari' is decided to mean the 'degree', and to mean the 'limitation' in other cases, and the result of the semantic analysis is outputted. For example, in the sentence 'Kare ha ringo wo 3-ko bakari tabeta' (He ate some three apples), the meaning of 'bakari' is decided to mean the 'degree' because this 'bakari' relates to the quantifier '3-ko'. <P>COPYRIGHT: (C)2004,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、人間が日常的なコ
ミュニケーションに使用する自然言語を数学的に取り扱
うための自然言語処理システム及び自然言語処理方法、
並びにコンピュータ・プログラムに係り、特に、日本語
構文の統語・意味解析を行なう自然言語処理システム及
び自然言語処理方法、並びにコンピュータ・プログラム
に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a natural language processing system and a natural language processing method for mathematically handling a natural language used by humans for daily communication.
The present invention also relates to a computer program, and more particularly to a natural language processing system and a natural language processing method for performing syntactic and semantic analysis of Japanese syntax, and a computer program.

【0002】さらに詳しくは、本発明は、文法ルールに
従って日本語構文の統語・意味解析を行なう自然言語処
理システム及び自然言語処理方法、並びにコンピュータ
・プログラムに係り、特に、使用方法などに応じて複数
の意味を持つ品詞の意味情報を正確に出力する自然言語
処理システム及び自然言語処理方法、並びにコンピュー
タ・プログラムに関する。
More specifically, the present invention relates to a natural language processing system and a natural language processing method for performing syntactic / semantic analysis of Japanese syntax according to grammatical rules, and a computer program. The present invention relates to a natural language processing system, a natural language processing method, and a computer program that accurately output the semantic information of a part of speech having the meaning of.

【0003】[0003]

【従来の技術】日本語や英語など、人間が日常的なコミ
ュニケーションに使用する言葉のことを「自然言語」と
呼ぶ。多くの自然言語は、自然発生的な起源を持ち、人
類、民族、社会の歴史とともに進化してきた。勿論、人
は身振りや手振りなどによっても意思疎通を行なうこと
が可能であるが、自然言語により最も自然で且つ高度な
コミュニケーションを実現することができる。
2. Description of the Related Art Words used by humans for daily communication such as Japanese and English are called "natural language". Many natural languages have a naturally occurring origin and have evolved with the history of humanity, ethnicity, and society. Of course, a person can communicate by gesturing or gesturing, but natural language can realize the most natural and advanced communication.

【0004】他方、情報技術の発展に伴い、コンピュー
タが人間社会に定着し、各種産業や日常生活の中に深く
浸透している。いまやコンピュータ・データだけでな
く、画像や音響などほとんどすべての情報コンテンツが
コンピュータ上で取り扱われ、情報の編集・加工、蓄
積、管理、伝達、共有など高度な処理を行なうことが可
能となっている。
On the other hand, with the development of information technology, computers have become established in human society and have been deeply permeated in various industries and daily lives. Now, not only computer data but almost all information contents such as images and sounds are handled on the computer, and it is possible to perform advanced processing such as editing / processing, storage, management, transmission and sharing of information. .

【0005】自然言語は、本来抽象的であいまい性が高
い性質を持つが、文章を数学的に取り扱うことにより、
コンピュータ処理を行なうことができる。この結果、機
械翻訳や対話システム、検索システムなど、自動化処理
により自然言語に関するさまざまなアプリケーション/
サービスが実現される。
Natural language has an abstract and ambiguous nature by nature, but by treating sentences mathematically,
Computer processing can be performed. As a result, various applications related to natural language such as machine translation, dialogue system, search system, etc.
The service is realized.

【0006】自然言語処理は一般に、形態素解析、構文
解析、意味解析、文脈解析という各処理フェーズに区分
される。
Natural language processing is generally divided into processing phases of morphological analysis, syntactic analysis, semantic analysis, and context analysis.

【0007】形態素解析では、文を意味的最小単位であ
る形態素(morpheme)に分節して品詞の認定処理を行な
う。構文解析では、文法規則などを基に句構造などの文
の構造を解析する。文法規則が木構造であることから、
構文解析結果は一般に個々の形態素が係り受け関係など
を基にして接合された木構造となる。意味解析では、文
中の語の語義(概念)や、語と語の間の意味関係などに
基づいて、文が伝える意味を表現する意味構造を求め
て、意味構造を合成する。文脈解析では、文の系列であ
る文章(談話)を解析の基本単位とみなして、文間の意
味的なまとまりを得て談話構造を構成する。
In the morphological analysis, a sentence is segmented into morphemes, which are the smallest semantic units, and a part-of-speech recognition process is performed. In the syntactic analysis, a sentence structure such as a phrase structure is analyzed based on grammatical rules. Since the grammar rules have a tree structure,
The syntactic analysis result generally has a tree structure in which individual morphemes are joined based on the dependency relationship. In the semantic analysis, based on the meaning (concept) of the words in the sentence and the semantic relationship between the words, the semantic structure expressing the meaning conveyed by the sentence is obtained, and the semantic structures are synthesized. In context analysis, a sentence (discourse), which is a series of sentences, is regarded as a basic unit of analysis, and a discourse structure is constructed by obtaining a semantic unity between sentences.

【0008】ところで、数多の自然言語の中でもとりわ
け日本語があいまい性が高いとされている。その一因
は、一般に副助詞と呼ばれる品詞の存在に依拠する。
By the way, among the many natural languages, Japanese is said to be highly ambiguous. One of the reasons depends on the existence of a part-of-speech, which is generally called a sub particle.

【0009】例えば、「ほど」、「ばかり」、「だけ」
などの副助詞は、文の中でさまざまな位置に出現すると
いう性質(名詞、動詞、助詞、形容詞のいずれの後にも
付くことができる)と、1つの単語が複数の意味機能を
持つ場合があるという特徴を持つ。すなわち、副助詞は
使い方に応じて意味が変わることから、文のあいまいさ
を増し、文の正確な解釈・翻訳を困難にしている。
For example, "do", "just", "only"
Adverbs such as, etc. have the property of appearing at various positions in the sentence (can be attached after any of nouns, verbs, particles, and adjectives), and one word may have multiple semantic functions. It has the characteristic of being. That is, since the meaning of the sub particle changes depending on the usage, it increases the ambiguity of the sentence and makes it difficult to correctly interpret and translate the sentence.

【0010】例えば、以下に示す2つの文例はいずれも
副助詞「ばかり」を含んでいる。
For example, the following two sentence examples both include the sub particle "saku".

【0011】(a)彼はりんごばかり食べている。 (b)彼は3個ばかりりんごを食べた。(A) He eats only apples. (B) He ate only three apples.

【0012】文例(a)では、副助詞「ばかり」は動詞
の目的語を示す格助詞「を」がある位置に現れている。
一方、文例(b)では、副助詞「ばかり」は数量詞「3
個」の接尾辞として現れている。そして、文例(a)で
の「ばかり」は、「他のものに比べてりんごを数多く食
べている」という「限定」の意味を表しているが、文例
(b)の「ばかり」は「3個ほど」という「程度」の意
味を表している。
In the sentence example (a), the auxiliary particle "saku" appears at the position where the case particle "wo" indicating the object of the verb is located.
On the other hand, in the sentence example (b), the subposition particle “saku” is the quantifier “3
It appears as a suffix of "individual". And, “saku” in sentence example (a) means “limited”, which means “eating more apples than other things”, but “saku” in sentence example (b) is “3”. It means the "degree" of "about individual pieces".

【0013】上掲の各文例を日本語から英語に翻訳する
場合、副助詞がどのような意味で使われているかという
情報は必要不可欠である。何故ならば、文例(a)の訳
文は"He eats apples only"であるが、文例(b)は"He
ate about three apples"と訳されなければならないか
らである。
When translating each of the above sentence examples from Japanese to English, it is indispensable to know what meaning the sub particle is used for. Because the translation of sentence example (a) is "He eats apples only", but the sentence example (b) is "He eats apples only"
because it must be translated as "ate about three apples".

【0014】従来の構文解析システムなどでは、文例
(a)に示すような用法で使用される副助詞「ばかり」
が目的語を示す「ヲ」格の代用であり、文例(b)に示
すような用法の副助詞「ばかり」は接尾辞相当である、
という統語情報を出力している。
In the conventional syntax analysis system, etc., the sub particle "simple" used in the usage as shown in the sentence example (a).
Is a substitute for the "wo" case, which indicates the object, and the auxiliary particle "sword" in the usage shown in sentence example (b) is equivalent to the suffix,
The syntactic information is output.

【0015】しかしながら、上述したような「限定」、
「程度」といった意味情報は出力されないので、副助詞
に複数の意味がある場合のあいまい性を解消することは
困難である。日本語において、副助詞を含む表現は極め
て標準的に用いられていることからも、副助詞の意味を
正確に解析することは重要な課題である。
However, the above-mentioned "limitation",
Since the semantic information such as “degree” is not output, it is difficult to eliminate the ambiguity when the sub particle has a plurality of meanings. It is an important task to accurately analyze the meaning of a sub particle because the expressions including a sub particle are used in the Japanese language very standardly.

【0016】《注釈》助詞には、「格助詞」、「接続助
詞」、「副助詞」、「終助詞」の4つの種類がある。格
助詞は、「が」、「で」、「の」など、体言などの活用
のない語に付いて、その体言と他の語との格関係を表す
働きを持つ。接続助詞は、「ば」、「ども」、「ところ
が」など、動詞・形容詞・助動詞に付いて、その文や節
を下の文・節に接続して、条件・並列などを表す働きを
持つ。副助詞は、「さへ」、「のみ」など、体言や副詞
などに付いて、限定、程度、強調,類推などのさまざま
な意味を添える働きがある。終助詞は、「か」、
「な」、「ども」など、文や句の終わりに用いて、その
文や節をしたの文・節に接続し、条件・並列などの話者
の態度や気持ちを示す働きがある。係助詞は、「は」、
「も」、「しか」など、述語に関係する語に付いて、そ
の語の陳述に影響を及ぼし、またその句末に付いて文の
成立を助ける働きを持つ。間投助詞は、「や」、
「を」、「し」など、文節の切れ目にはさんで、語勢を
加え、語調を整え、余情を添える働きを持つ。
<< Commentary >> There are four types of particles: "case particle", "connecting particle", "sub particle", and "final particle". The case particle is attached to a word such as “ga”, “de”, and “no” that is not used, such as a word, and has a function of expressing a case relationship between the word and another word. Conjunctive particles have a function to attach conditions or parallels to verbs, adjectives, and auxiliary verbs such as "ba", "domo", and "tokoroga" and connect the sentence or clause to the sentence or clause below. . The adverbial particle has a function of adding various meanings such as limitation, degree, emphasis, and analogy to a word or adverb such as "sahe" or "only". The final particle is "ka",
It is used at the end of a sentence or phrase such as "na" or "domo" to connect the sentence or clause to the sentence or clause to indicate the attitude or feeling of the speaker such as conditions or parallelism. The particle is "ha",
For words related to predicates such as "mo" and "shika", it has an effect on the statement of the word, and at the end of the phrase, it has the function of helping the formation of a sentence. The interjection particle is "ya",
It is inserted between breaks such as "o" and "shi", and has the function of adding vocabulary, adjusting tone, and adding feelings.

【0017】[0017]

【発明が解決しようとする課題】本発明の目的は、文法
ルールに従って日本語構文の統語・意味解析を行なうこ
とができる、優れた自然言語処理システム及び自然言語
処理方法、並びにコンピュータ・プログラムを提供する
ことにある。
SUMMARY OF THE INVENTION An object of the present invention is to provide an excellent natural language processing system, natural language processing method, and computer program capable of performing syntactic and semantic analysis of Japanese syntax according to grammatical rules. To do.

【0018】本発明のさらなる目的は、複数の意味機能
を持つ品詞の意味情報を正確に判定することができる、
優れた自然言語処理システム及び自然言語処理方法、並
びにコンピュータ・プログラムを提供することにある。
A further object of the present invention is to accurately determine the semantic information of a part of speech having a plurality of semantic functions.
An object is to provide an excellent natural language processing system, natural language processing method, and computer program.

【0019】本発明のさらなる目的は、使用方法などに
応じて複数の意味を持つ品詞の意味情報を正確に出力す
ることができる、優れた自然言語処理システム及び自然
言語処理方法、並びにコンピュータ・プログラムを提供
することにある。
A further object of the present invention is to provide an excellent natural language processing system, natural language processing method, and computer program capable of accurately outputting the semantic information of a part of speech having a plurality of meanings depending on the method of use. To provide.

【0020】本発明のさらなる目的は、出現位置に応じ
て複数の意味機能を持つ可能性がある副助詞の意味情報
を正確に出力することができる、優れた自然言語処理シ
ステム及び自然言語処理方法、並びにコンピュータ・プ
ログラムを提供することにある。
A further object of the present invention is to provide an excellent natural language processing system and natural language processing method capable of accurately outputting the semantic information of a subparticle that may have a plurality of semantic functions depending on the appearance position. , And providing a computer program.

【0021】[0021]

【課題を解決するための手段及び作用】本発明は、上記
課題を参酌してなされたものであり、その第1の側面
は、複数の意味を持つ品詞の意味情報を解析する自然言
語システム又は自然言語処理方法であって、入力文に含
まれる複数の意味を持つ品詞における意味の候補を設定
する意味候補設定手段又はステップと、入力文に含まれ
る該品詞の構文情報を抽出する構文情報抽出手段又はス
テップと、抽出された該品詞の構文情報に応じて意味の
候補のうち1つを該品詞の意味として選択する意味出力
手段又はステップと、を具備することを特徴とする自然
言語システム又は自然言語処理方法である。
The present invention has been made in consideration of the above problems, and a first aspect thereof is a natural language system for analyzing semantic information of a part of speech having a plurality of meanings, or A natural language processing method, which is a meaning candidate setting means or step for setting meaning candidates in a part of speech having a plurality of meanings included in an input sentence, and a syntactic information extraction for extracting syntactic information of the part of speech included in the input sentence. A natural language system comprising: a means or step; and a meaning output means or step for selecting one of the meaning candidates as the meaning of the part of speech according to the extracted syntactic information of the part of speech. It is a natural language processing method.

【0022】ここで言う複数の意味を持つ品詞は、例え
ば副助詞である。「ほど」、「ばかり」、「だけ」など
の副助詞は、文の中でさまざまな位置に出現するという
性質と、1つの単語が複数の意味機能を持つ場合がある
という特徴を持つ。副助詞は使い方に応じて意味が変わ
ることから、文のあいまいさを増し、文の正確な解釈・
翻訳を困難にしている。
The part of speech having a plurality of meanings referred to here is, for example, an auxiliary particle. Adverbs such as “ho”, “just”, and “only” have the property of appearing at various positions in a sentence, and one word may have a plurality of semantic functions. Since the meaning of the sub particle changes depending on the usage, it increases the ambiguity of the sentence and
Making translation difficult.

【0023】本発明の第1の側面に係る自然言語システ
ム又は自然言語処理方法によれば、前記意味候補設定手
段又はステップは品詞の意味機能を記述した辞書に問い
合わせることによって品詞の意味の候補を取得する。
According to the natural language system or the natural language processing method according to the first aspect of the present invention, the meaning candidate setting means or step searches the dictionary describing the meaning function of the part of speech to find the candidate of the part of speech. get.

【0024】そして、前記構文情報抽出手段は、該品詞
の構文情報としてその係り先や接続先を抽出する。例え
ば、構文解析を経た入力文を用いることにより、c−s
tructureのように文章の句構造(係り受け関係
や品詞の接続関係など)が明確に記述されているので、
品詞の構文情報を容易に取得することができる。
Then, the syntactic information extraction means extracts the related party or the connection destination as the syntactic information of the part of speech. For example, by using an input sentence that has undergone syntax analysis, cs
Since the phrase structure of sentences (such as dependency relations and connection of parts of speech) is clearly described like "structure",
It is possible to easily acquire the part-of-speech syntax information.

【0025】そして、意味出力手段又はステップは、抽
出された該品詞の構文情報に応じて意味の候補のうち1
つを該品詞の意味として選択する。この結果、複数の意
味候補を持つ品詞の入力文における意味を明確にして、
意味解析結果として出力することができる。
Then, the meaning output means or step selects one of the meaning candidates according to the extracted syntactic information of the part of speech.
Choose one as the meaning of the part of speech. As a result, the meaning in the input sentence of the part of speech having multiple meaning candidates is clarified,
It can be output as a semantic analysis result.

【0026】意味出力手段又はステップは、例えば、
「程度」と「限定」という2つの意味を持つ副助詞「ば
かり」を、構文上の係り先が数量詞であればその意味を
「程度」に決定し、それ以外の場合は「限定」に決定す
るようにしてもよい。
The meaning output means or step is, for example,
If the syntactic subordinate is a quantifier, the meaning of the auxiliary particle “saku”, which has two meanings, “degree” and “limit”, is determined to be “degree”, and otherwise it is determined to be “limit”. You may do it.

【0027】また、意味出力手段又はステップは、例え
ば、「強調」と「程度」という2つの意味を持つ副助詞
「まで」を、格助詞又は省略されている格助詞に接続さ
れていない場合並びに省略された格助詞「に」又は
「へ」に接続されている場合にはその意味を「程度」に
決定し、それ以外の場合は「強調」に決定するようにし
てもよい。
Further, the meaning output means or step may be used, for example, when the sub particle "up to" having two meanings of "emphasis" and "degree" is not connected to the case particle or the omitted case particle. When the omitted case particle “ni” or “he” is connected, its meaning may be determined as “degree”, and in other cases, it may be determined as “emphasized”.

【0028】このような、複数の意味を持つ副助詞など
の品詞の意味機能を文中における当該品詞の構文情報に
応じて決定するということを、文法ルール記述として備
えておくこともできる。また、文法ルール記述として用
意しておくことにより、通常の統語・意味解析処理を行
なえば、入力文に含まれる副助詞の正確な意味を出力す
ることができる。
It can be provided as a grammar rule description that the meaning function of a part of speech such as a subparticle having a plurality of meanings is determined according to the syntactic information of the part of speech in the sentence. In addition, by preparing as a grammar rule description, it is possible to output the correct meaning of the auxiliary particle included in the input sentence by performing a normal syntactic / semantic analysis process.

【0029】また、本発明の第2の側面は、複数の意味
を持つ品詞の意味情報を解析する自然言語処理をコンピ
ュータ・システム上で実行するようにコンピュータ可読
形式で記述されたコンピュータ・プログラムであって、
入力文に含まれる複数の意味を持つ品詞における意味の
候補を設定する意味候補設定ステップと、入力文に含ま
れる該品詞の構文情報を抽出する構文情報抽出ステップ
と、抽出された該品詞の構文情報に応じて意味の候補の
うち1つを該品詞の意味として選択する意味出力ステッ
プと、を具備することを特徴とするコンピュータ・プロ
グラムである。
The second aspect of the present invention is a computer program written in a computer-readable format so as to execute natural language processing for analyzing semantic information of a part of speech having a plurality of meanings on a computer system. There
A meaning candidate setting step of setting a meaning candidate in a part of speech having a plurality of meanings included in the input sentence, a syntax information extraction step of extracting syntax information of the part of speech included in the input sentence, and a syntax of the extracted part of speech And a meaning output step of selecting one of the meaning candidates as the meaning of the part-of-speech according to the information, the computer program.

【0030】本発明の第2の側面に係るコンピュータ・
プログラムは、コンピュータ・システム上で所定の処理
を実現するようにコンピュータ可読形式で記述されたコ
ンピュータ・プログラムを定義したものである。換言す
れば、本発明の第2の側面に係るコンピュータ・プログ
ラムをコンピュータ・システムにインストールすること
によって、コンピュータ・システム上では協働的作用が
発揮され、本発明の第1の側面に係る自然言語処理シス
テム及び自然言語処理方法と同様の作用効果を得ること
ができる。
A computer according to the second aspect of the present invention
The program defines a computer program written in a computer-readable format so as to realize a predetermined process on a computer system. In other words, by installing the computer program according to the second aspect of the present invention in the computer system, a cooperative action is exerted on the computer system, and the natural language according to the first aspect of the present invention. It is possible to obtain the same effects as those of the processing system and the natural language processing method.

【0031】本発明のさらに他の目的、特徴や利点は、
後述する本発明の実施形態や添付する図面に基づくより
詳細な説明によって明らかになるであろう。
Further objects, features and advantages of the present invention are as follows.
It will be apparent from the embodiments of the present invention described later and the more detailed description based on the accompanying drawings.

【0032】[0032]

【発明の実施の形態】以下、図面を参照しながら本発明
の実施形態について詳解する。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below in detail with reference to the drawings.

【0033】自然言語の統語・意味解析手法は統計処理
に基づく方法と文法ルール記述に基づく方法に大別する
ことができる。本発明は、とりわけ文法ルール記述に基
づく統語・意味解析に適用することで顕著な効果を奏す
ることができる。
Natural language syntactic / semantic analysis methods can be roughly classified into methods based on statistical processing and methods based on grammar rule description. The present invention can exert a remarkable effect particularly when applied to syntactic / semantic analysis based on grammar rule description.

【0034】本発明に係る自然言語処理システムは、例
えば、LFG(Lexical-FunctionalGrammar)文法理論
に基づく統語・意味解析処理に組み込んで実装すること
ができる。LFGでは、ネイティブ・スピーカの言語知
識すなわち文法を、コンピュータ処理や、コンピュータ
の処理動作に影響を及ぼすその他の非文法的な処理パラ
メータとは切り離したコンポーネントとして構成してい
る。まず、自然言語処理システムの全体像について簡単
に説明する。なお、本実施形態ではLFG文法理論に基
づいて説明するが、勿論、他の文法ルールを備えた解析
システムにおいても本発明を同様に適用することができ
る。
The natural language processing system according to the present invention can be implemented, for example, by incorporating it in the syntactic / semantic analysis processing based on the LFG (Lexical-Functional Grammar) grammar theory. In LFG, the linguistic knowledge, or grammar, of native speakers is organized as a component separate from computer processing and other non-grammatical processing parameters that affect the processing behavior of the computer. First, an overview of the natural language processing system will be briefly described. Although the present embodiment is described based on the LFG grammar theory, the present invention can be similarly applied to an analysis system having other grammar rules.

【0035】図7には、LFGに基づく自然言語処理シ
ステム1の構成を模式的に示している。
FIG. 7 schematically shows the configuration of the natural language processing system 1 based on LFG.

【0036】形態素解析部2は、日本語など特定の言語
に関する形態素ルール2Aと形態素辞書2Bを持ち、入
力文を意味的最小単位である形態素に分節して品詞の認
定処理を行なう。例えば、「私の娘は英語を話しま
す。」という文が入力された場合、形態素解析結果とし
て、「私{Noun} の{up} 娘{Noun} は{up} 英語{Noun}
を{up} 話す{Verb1}{tr} ます{jp} 。{pt}」が出力され
る。
The morpheme analysis unit 2 has a morpheme rule 2A and a morpheme dictionary 2B relating to a specific language such as Japanese, and divides an input sentence into morphemes, which are the smallest semantic units, and performs part-of-speech recognition processing. For example, if the sentence "My daughter speaks English." Is entered, the result of morphological analysis is "I {Noun} {up} daughter {Noun} is {up} English {Noun}.
{Up} speak {Verb1} {tr} and {jp}. {pt} "is output.

【0037】このような形態素解析結果は、次いで、統
語・意味解析部3に入力される。統語・意味解析部は、
文法ルール3Aや結合価辞書3Bなどの辞書を持ち、文
法ルールなどに基づく句構造の解析や、文中の語の語義
や語と語の間の意味関係などに基づいて文が伝える意味
を表現する意味構造の解析を行なう(結合価辞書は動詞
と主語などの文中の他の構成要素との関係を記述したも
のであり、述部とそれに係る語の意味関係を抽出するこ
とができる)。そして、構文解析した結果として、単語
や形態素などからなる文章の句構造を木構造として表し
た"c−structure(constituent structur
e)"と、主語、目的語などの格構造に基づいて入力文を
疑問文、過去形、丁寧文など意味的・機能的に解析した
結果として"f−structure(functional stru
cture)"を出力する。
The result of such morphological analysis is then input to the syntactic / semantic analysis unit 3. The syntactic and semantic analysis department
It has dictionaries such as grammar rules 3A and valence valence dictionary 3B, and analyzes the phrase structure based on grammar rules and expresses the meaning conveyed by the sentence based on the meaning of words in the sentence and the meaning relation between words. Analyze the semantic structure (The valence dictionary describes the relationship between verbs and other constituent elements in the sentence, such as the subject, and can extract the semantic relationship between predicates and related words). Then, as a result of the syntactic analysis, "c-structure (constituent structur), which represents a phrase structure of a sentence including words and morphemes as a tree structure.
e) ", and as a result of semantically and functionally analyzing the input sentence based on the case structure of the subject, object, etc., such as question sentence, past tense, polite sentence," f-structure (functional stru
cture) "is output.

【0038】図8及び図9には、入力文「私の娘は英語
を話します。」を統語・意味解析部1により処理した結
果として得られるc−structure及びf−st
ructureをそれぞれ示している。
In FIG. 8 and FIG. 9, c-structure and f-st obtained as a result of processing the input sentence "My daughter speaks English" by the syntactic / semantic analysis unit 1.
In each of the figures, the figures are shown.

【0039】c−structureは、文中の単語や
句の構造を木構造形式で表したものであり、構文カテゴ
リーによって定義される。例えば音素列を生成するため
の音韻学的な解釈を、c−structureを基に行
なうことができる。一方、f−structureは、
文法的な機能を明確に表現したものであり、文法的な機
能名、意味的形式、並びに特徴シンボルにより構成され
る。f−structureを参照することにより、主
語(subject)、目的語(object)、補語(complemen
t)、修飾語(adjunct)といった意味理解を得ることが
できる。f−structureは、c−struct
ureの各節点に付随する素性の集合であり、図9に示
すように属性−属性値のマトリックスの形で表現され
る。すなわち、[]で囲まれた中の左側は素性(属性)
の名前であり、右側は素性の値(属性値)である。
The c-structure is a tree structure representing the structure of words and phrases in a sentence, and is defined by the syntax category. For example, a phonological interpretation for generating a phoneme string can be performed based on c-structure. On the other hand, f-structure is
It is a clear expression of grammatical functions and is composed of grammatical function names, semantic forms, and feature symbols. By referring to f-structure, the subject, the object, and the complement
t) and modifiers (adjunct) can be understood. f-structure is c-structure
It is a set of features attached to each node of ure, and is expressed in the form of an attribute-attribute value matrix as shown in FIG. In other words, the left side in [] is the feature (attribute)
And the right side is the feature value (attribute value).

【0040】なお、LFGの詳細に関しては、例えばR.
M. Kaplan及びJ. Bresnan共著の論文"Lexical-Functio
nal Grammar: A Formal System for Grammatical Repre
sentation"(The MIT Press, Cambridge (1982). Repr
inted in Formal Issues inLexical-Functional Gramma
r, pp. 29-130. CSLI publications, Stanford Univers
ity(1995).)に記述されている。
Regarding the details of LFG, see R.
Paper "Lexical-Functio" co-authored by M. Kaplan and J. Bresnan
nal Grammar: A Formal System for Grammatical Repre
sentation "(The MIT Press, Cambridge (1982). Repr
inted in Formal Issues in Lexical-Functional Gramma
r, pp. 29-130.CSLI publications, Stanford Univers
ity (1995).).

【0041】日本語には複数の意味を持つ品詞があり、
これが言語のあいまい性を招来している。本発明に係る
自然言語処理システムでは、意味情報を記述した辞書と
文法ルール記述を備えることにより、このような品詞の
意味情報を正確に出力する。より具体的には、副助詞の
意味機能を記述した辞書と文法ルールを備えることによ
って、意味解析の結果の中に副助詞の意味情報を出力す
る。また、単語が複数の意味を持っている場合には、そ
のあいまい性を解消する。
There are several parts of speech in Japanese,
This leads to language ambiguity. The natural language processing system according to the present invention is provided with the dictionary describing the semantic information and the grammar rule description, so that the semantic information of the part of speech is accurately output. More specifically, by providing a dictionary describing the meaning function of the adverb and a grammar rule, the semantic information of the adverb is output in the result of the semantic analysis. Also, when a word has multiple meanings, the ambiguity is resolved.

【0042】図1には、本発明の一実施形態に係る副助
詞の意味機能解析の処理手順をフローチャートの形式で
示している。同図に示す例では、「程度」と「限定」の
意味を持つことができる副助詞「ばかり」の意味機能を
解析することができる。以下、このフローチャートに従
って説明する。
FIG. 1 shows, in the form of a flow chart, the processing procedure of the semantic function analysis of an auxiliary particle according to an embodiment of the present invention. In the example shown in the figure, it is possible to analyze the meaning function of the auxiliary particle "sword" which can have the meanings of "degree" and "limitation". Hereinafter, description will be given according to this flowchart.

【0043】副助詞「ばかり」を含む入力文として、
「彼はりんごを3個ばかり食べた」が当該処理ルーチン
に投入されたとする。但し、入力文は既に構文解析が行
なわれているものとし、c−structureのよう
に文章の句構造(係り受け関係や品詞の接続関係など)
が明確に記述されているものとする。
As an input sentence containing the auxiliary particle "sword",
It is assumed that "he ate only three apples" was put into the processing routine. However, it is assumed that the input sentence has already been parsed, and the phrase structure of the sentence such as c-structure (dependency relation, connection relation of part of speech, etc.)
Should be clearly stated.

【0044】まず、副助詞「ばかり」の意味機能を記述
した辞書に問い合わせる(ステップS1)。
First, an inquiry is made to the dictionary describing the meaning function of the auxiliary particle "sword" (step S1).

【0045】図2には、辞書中の副助詞「ばかり」の記
述内容を例示している。同図に示すように、「ばかり」
には「限定」と「程度」という2つの意味が記載されて
いるので、「ばかり」の意味の候補としてこの2つを取
得する(ステップS2)。なお、辞書に問い合わせた結
果、副助詞が1つの意味しか持たない場合には、そのま
ま単一の意味のみを出力すればよい。
FIG. 2 exemplifies the description content of the auxiliary particle "sword" in the dictionary. As shown in the figure, "just"
Since two meanings of "limitation" and "degree" are described in, the two are acquired as candidates for the meaning of "just" (step S2). If the adjunct particle has only one meaning as a result of the inquiry to the dictionary, it is sufficient to output only the single meaning.

【0046】次いで、入力文に含まれる副助詞「ばか
り」の構文情報を抽出して、副助詞「ばかり」が数量詞
に係っているかどうかについて判断する(ステップS
3)。そして、判断結果が真であれば副助詞「ばかり」
の意味を「程度」に決定し(ステップS4)、それ以外
の場合は副助詞「ばかり」の意味を「限定」に決定して
(ステップS5)、意味解析の結果を出力する(ステッ
プS6)。
Next, the syntactic information of the auxiliary particle "Jun" included in the input sentence is extracted to determine whether the auxiliary particle "Jun" is associated with the quantifier (step S).
3). If the result of the judgment is true, then the auxiliary particle "saku"
Is determined to be "degree" (step S4), and in other cases, the meaning of the auxiliary particle "simply" is determined to be "limited" (step S5), and the result of the semantic analysis is output (step S6). .

【0047】この入力文では、「ばかり」は数量詞「3
個」に係っている。この条件は満たされるので、結果は
真となり(ステップS3)、この場合の副助詞「ばか
り」の意味を「程度」に決定して(ステップS4)、意
味解析の結果を出力する(ステップS6)。
In this input sentence, "saku" is the quantifier "3
Is related to "individuals". Since this condition is satisfied, the result is true (step S3), the meaning of the subposition particle "just" in this case is determined to be "degree" (step S4), and the result of the semantic analysis is output (step S6). .

【0048】図3には、入力文「彼はりんごを3個ばか
り食べた」についての意味解析結果の出力を示してい
る。同図に示す例では、意味解析結果はf−struc
tureすなわち属性−属性値のマトリックスの形で表
現されており、文法的な機能名、意味的形式、並びに特
徴シンボルにより構成される。[]で囲まれた中の左側
は素性(属性)の名前であり、右側は素性の値(属性
値)である。同図に示すように、副助詞「ばかり」の意
味が明示的に表現されている、という点を充分理解され
たい。
FIG. 3 shows the output of the semantic analysis result for the input sentence "He ate only three apples." In the example shown in the figure, the semantic analysis result is f-struc.
It is expressed in the form of a matrix of attributes, ie, attributes-attribute values, and is composed of grammatical function names, semantic forms, and characteristic symbols. The left side in [] is the name of the feature (attribute), and the right side is the value of the feature (attribute value). It should be fully understood that the meaning of the adjunct particle "sword" is explicitly expressed as shown in the figure.

【0049】例えば、副助詞「ばかり」の係り受け関係
に応じてその意味機能を決定するということを文法ルー
ル3Aの記述として備えておくことにより、統語・意味
解析部3は通常の意味解析により入力文に含まれる副助
詞「ばかり」の正確な意味を出力することができる。
For example, by preparing as a description of the grammar rule 3A that the meaning function of the auxiliary particle "sword" is determined according to the dependency relation, the syntactic / semantic analysis unit 3 performs normal semantic analysis. It is possible to output the exact meaning of the auxiliary particle “saku” included in the input sentence.

【0050】また、図4には、本発明の一実施形態に係
る副助詞の意味機能解析の処理手順をフローチャートの
形式で示している。同図に示す例では、「強調」と「程
度」の意味を持つことができる副助詞「まで」の意味機
能を解析することができる。以下、このフローチャート
に従って説明する。
Further, FIG. 4 shows, in the form of a flow chart, the processing procedure of the semantic function analysis of the auxiliary particle according to the embodiment of the present invention. In the example shown in the figure, it is possible to analyze the meaning function of the sub particle “up to” which can have the meanings of “emphasis” and “degree”. Hereinafter, description will be given according to this flowchart.

【0051】副助詞「まで」を含む入力文として、「彼
までりんごを食べた」が当該処理ルーチンに投入された
とする。但し、入力文は既に構文解析が行なわれている
ものとし、c−structureのように文章の句構
造(係り受け関係や品詞の接続関係など)が明確に記述
されているものとする。
It is assumed that "I ate an apple till him" was input to the processing routine as an input sentence containing the sub particle "to". However, it is assumed that the input sentence has already been parsed and that the phrase structure of the sentence (such as the dependency relation and the part-of-speech connection relation) is clearly described like c-structure.

【0052】まず、副助詞「まで」の意味機能を記述し
た辞書に問い合わせる(ステップS11)。
First, an inquiry is made to the dictionary describing the meaning function of the sub particle "to" (step S11).

【0053】図5には、辞書中の副助詞「まで」の記述
内容を例示している。同図に示すように、「まで」には
「程度」と「強調」という2つの意味が記載されている
ので、「まで」の意味の候補としてこの2つを取得する
(ステップS12)。なお、辞書に問い合わせた結果、
副助詞が1つの意味しか持たない場合には、そのまま単
一の意味のみを出力すればよい。
FIG. 5 exemplifies the description content of the sub particle "up" in the dictionary. As shown in the figure, since “up to” has two meanings of “degree” and “emphasis”, these two are acquired as candidates for the meaning of “up to” (step S12). In addition, as a result of inquiry to the dictionary,
When the auxiliary particle has only one meaning, it is sufficient to output only a single meaning as it is.

【0054】次いで、入力文に含まれる副助詞「まで」
の構文情報を抽出して、副助詞「まで」が格助詞又は省
略されている格助詞に接続しているかどうかを判断する
(ステップS13)。なお、格助詞が省略されているか
否かは、動詞(この入力文では「食べる」)の結合価辞
書を参照することによって分かる。結合価辞書は動詞と
主語などの文中の他の構成要素との関係(格関係)を記
述したものであり、述部とそれに係る語の意味関係を抽
出することができる(周知)。
Next, the sub particle "to" included in the input sentence
The syntactic information of is extracted, and it is determined whether or not the sub particle "up to" is connected to the case particle or the omitted case particle (step S13). Whether or not the case particle is omitted can be known by referring to the valence dictionary of the verb (“eat” in this input sentence). The valency dictionary describes the relationship (case relationship) between a verb and other constituent elements in the sentence such as the subject, and can extract the semantic relationship between the predicate and the related word (well known).

【0055】副助詞「まで」が格助詞又は省略されてい
る格助詞に接続していなければ、その意味を「程度」に
決定して(ステップS16)、意味解析の結果を出力す
る(ステップS17)。
If the sub particle "up to" is not connected to the case particle or the omitted case particle, the meaning is determined to be "degree" (step S16), and the result of the semantic analysis is output (step S17). ).

【0056】一方、副助詞「まで」が格助詞又は省略さ
れている格助詞に接続している場合には、さらに、接続
している格助詞が省略された「に」又は「へ」であるか
どうかを判断する。そして、副助詞「まで」が格助詞が
省略された「に」又は「へ」に接続している場合には、
同様に、その意味を「程度」に決定して(ステップS1
6)、意味解析の結果を出力する(ステップS17)。
On the other hand, when the auxiliary particle “up” is connected to the case particle or the omitted case particle, the connected case particle is “ni” or “he” in which the case particle is omitted. Determine if When the sub particle “up” is connected to “ni” or “he” in which the case particle is omitted,
Similarly, the meaning is determined to be "degree" (step S1).
6), the result of the semantic analysis is output (step S17).

【0057】この入力文では、「まで」は省略された格
助詞「が」に連接しているので、判断ブロックS13の
結果は真となるとともに、続く判断ステップS14の結
果は偽になるので、この場合の副助詞「まで」の意味を
「強調」に決定して(ステップS14)、意味解析の結
果を出力する(ステップS17)。
In this input sentence, "up to" is connected to the omitted case particle "ga", so that the result of the decision block S13 is true and the result of the following decision step S14 is false. In this case, the meaning of the sub particle "up to" is determined to be "emphasized" (step S14), and the result of the semantic analysis is output (step S17).

【0058】また、接続している格助詞が省略された
「に」又は「へ」でない場合には、副助詞「まで」の意
味を「強調」に決定して、意味解析の結果を出力する
(ステップS17)。
When the connected case particle is not the omitted "ni" or "he", the meaning of the sub particle "up to" is determined to be "emphasized" and the result of the semantic analysis is output. (Step S17).

【0059】図6には、入力文「彼までりんごを食べ
た」についての意味解析結果の出力を示している。同図
に示す例では、意味解析結果はf−structure
すなわち属性−属性値のマトリックスの形で表現されて
おり、文法的な機能名、意味的形式、並びに特徴シンボ
ルにより構成される。[]で囲まれた中の左側は素性
(属性)の名前であり、右側は素性の値(属性値)であ
る。同図に示すように、副助詞「まで」の意味が明示的
に表現されている、という点を充分理解されたい。
FIG. 6 shows the output of the semantic analysis result for the input sentence "I ate an apple till him". In the example shown in the figure, the semantic analysis result is f-structure.
That is, it is expressed in the form of an attribute-attribute value matrix, and is composed of grammatical function names, semantic forms, and characteristic symbols. The left side in [] is the name of the feature (attribute), and the right side is the value of the feature (attribute value). It should be fully understood that, as shown in the figure, the meaning of the sub particle “up” is explicitly expressed.

【0060】例えば、副助詞「ばかり」の係り受け関係
に応じてその意味機能を決定するということを文法ルー
ル3Aの記述として備えておくことにより、統語・意味
解析部3は通常の意味解析により入力文に含まれる副助
詞「ばかり」の正確な意味を出力することができる。
For example, by preparing as a description of the grammar rule 3A that the meaning function is determined according to the dependency relationship of the auxiliary particle "sword", the syntactic / semantic analysis unit 3 performs normal semantic analysis. It is possible to output the exact meaning of the auxiliary particle “saku” included in the input sentence.

【0061】[追補]以上、特定の実施形態を参照しな
がら、本発明について詳解してきた。しかしながら、本
発明の要旨を逸脱しない範囲で当業者が該実施形態の修
正や代用を成し得ることは自明である。すなわち、例示
という形態で本発明を開示してきたのであり、本明細書
の記載内容を限定的に解釈するべきではない。本発明の
要旨を判断するためには、冒頭に記載した特許請求の範
囲の欄を参酌すべきである。
[Supplement] The present invention has been described in detail with reference to the specific embodiments. However, it is obvious that those skilled in the art can modify or substitute the embodiments without departing from the scope of the present invention. That is, the present invention has been disclosed in the form of exemplification, and the contents of this specification should not be construed in a limited manner. In order to determine the gist of the present invention, the section of the claims described at the beginning should be taken into consideration.

【0062】[0062]

【発明の効果】以上詳記したように、本発明によれば、
複数の意味機能を持つ品詞の意味情報を正確に判定する
ことができる、優れた自然言語処理システム及び自然言
語処理方法、並びにコンピュータ・プログラムを提供す
ることができる。
As described above in detail, according to the present invention,
It is possible to provide an excellent natural language processing system, natural language processing method, and computer program that can accurately determine the semantic information of a part of speech having a plurality of semantic functions.

【0063】また、本発明によれば、使用方法などに応
じて複数の意味を持つ品詞の意味情報を正確に出力する
ことができる、優れた自然言語処理システム及び自然言
語処理方法、並びにコンピュータ・プログラムを提供す
ることができる。
Further, according to the present invention, an excellent natural language processing system and natural language processing method capable of accurately outputting the semantic information of a part of speech having a plurality of meanings depending on the method of use and a computer A program can be provided.

【0064】また、本発明によれば、出現位置に応じて
複数の意味機能を持つ可能性がある副助詞の意味情報を
正確に出力することができる、優れた自然言語処理シス
テム及び自然言語処理方法、並びにコンピュータ・プロ
グラムを提供することができる。
Further, according to the present invention, an excellent natural language processing system and natural language processing capable of accurately outputting the semantic information of a sub particle which may have a plurality of semantic functions depending on the appearance position. Methods as well as computer programs can be provided.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施形態に係る副助詞の意味機能解
析の処理手順を示したフローチャートである。
FIG. 1 is a flowchart showing a processing procedure of a semantic function analysis of an auxiliary particle according to an embodiment of the present invention.

【図2】辞書中の副助詞「ばかり」の記述内容を示した
図である。
FIG. 2 is a diagram showing a description content of a sub particle “sword” in a dictionary.

【図3】入力文「彼はりんごを3個ばかり食べた」につ
いての意味解析結果の出力を示した図である。
FIG. 3 is a diagram showing an output of a semantic analysis result for an input sentence “He ate only three apples”.

【図4】本発明の他の実施形態に係る副助詞の意味機能
解析の処理手順を示したフローチャートである。
FIG. 4 is a flowchart showing a processing procedure of semantic function analysis of an auxiliary particle according to another embodiment of the present invention.

【図5】辞書中の副助詞「まで」の記述内容を示した図
である。
FIG. 5 is a diagram showing a description content of a sub particle “up to” in a dictionary.

【図6】入力文「彼までりんごを食べた」についての意
味解析結果の出力を示した図である。
FIG. 6 is a diagram showing the output of the semantic analysis result for the input sentence “I ate an apple till him”.

【図7】LFGに基づく自然言語処理システム1の構成
を模式的に示した図である。
FIG. 7 is a diagram schematically showing a configuration of a natural language processing system 1 based on LFG.

【図8】入力文「私の娘は英語を話します。」を統語・
意味解析部1により処理した結果として得られるf−s
tructureを示した図である。
[Fig.8] Syntactically the input sentence "My daughter speaks English."
Fs obtained as a result of processing by the semantic analysis unit 1
It is the figure which showed structure.

【図9】入力文「私の娘は英語を話します。」を統語・
意味解析部1により処理した結果として得られるc−s
tructureを示した図である。
[Figure 9] Syntactically the input sentence "My daughter speaks English."
Cs obtained as a result of processing by the semantic analysis unit 1
It is the figure which showed structure.

【符号の説明】[Explanation of symbols]

1…自然言語処理システム 2…形態素解析部 2A…形態素ルール,2B…形態素辞書 3…統語・意味解析部 3A…文法ルール,3B…結合価辞書 1. Natural language processing system 2 ... Morphological analysis unit 2A ... Morphological rules, 2B ... Morphological dictionary 3 ... Syntactic and Semantic Analysis Department 3A ... Grammar rule, 3B ... Bond valence dictionary

Claims (17)

【特許請求の範囲】[Claims] 【請求項1】複数の意味を持つ品詞の意味情報を解析す
る自然言語システムであって、 入力文に含まれる複数の意味を持つ品詞における意味の
候補を設定する意味候補設定手段と、 入力文に含まれる該品詞の構文情報を抽出する構文情報
抽出手段と、 抽出された該品詞の構文情報に応じて意味の候補のうち
1つを該品詞の意味として選択する意味出力手段と、を
具備することを特徴とする自然言語システム。
1. A natural language system for analyzing semantic information of a part of speech having a plurality of meanings, wherein a meaning candidate setting means for setting a meaning candidate of a part of speech having a plurality of meanings included in an input sentence, and an input sentence. Syntactic information extracting means for extracting the syntactic information of the part of speech included in, and meaning output means for selecting one of the meaning candidates as the meaning of the part of speech according to the extracted syntactic information of the part of speech. A natural language system characterized by:
【請求項2】複数の意味を持つ品詞は副助詞である、こ
とを特徴とする請求項1に記載の自然言語処理システ
ム。
2. The natural language processing system according to claim 1, wherein the part of speech having a plurality of meanings is an auxiliary particle.
【請求項3】前記意味候補設定手段は品詞の意味機能を
記述した辞書に問い合わせることによって品詞の意味の
候補を取得する、ことを特徴とする請求項1に記載の自
然言語処理システム。
3. The natural language processing system according to claim 1, wherein the meaning candidate setting means obtains candidates for the meaning of a part of speech by making an inquiry to a dictionary describing the meaning function of the part of speech.
【請求項4】前記構文情報抽出手段は、該品詞の係り先
を抽出する、ことを特徴とする請求項1に記載の自然言
語処理システム。
4. The natural language processing system according to claim 1, wherein the syntactic information extraction means extracts a destination of the part of speech.
【請求項5】前記構文情報抽出手段は、該品詞の接続先
を抽出する、ことを特徴とする請求項1に記載の自然言
語処理システム。
5. The natural language processing system according to claim 1, wherein the syntax information extracting means extracts a connection destination of the part of speech.
【請求項6】前記意味出力手段は、「程度」と「限定」
という2つの意味を持つ副助詞「ばかり」を、構文上の
係り先が数量詞であればその意味を「程度」に決定し、
それ以外の場合は「限定」に決定する、ことを特徴とす
る請求項1に記載の自然言語処理システム。
6. The meaning output means includes "degree" and "limitation".
If the syntactic derivation is a quantifier, the meaning of the auxiliary particle "just", which has two meanings, is determined to be "degree",
The natural language processing system according to claim 1, wherein "limited" is determined in other cases.
【請求項7】前記意味出力手段は、「強調」と「程度」
という2つの意味を持つ副助詞「まで」を、格助詞又は
省略されている格助詞に接続されていない場合並びに省
略された格助詞「に」又は「へ」に接続されている場合
にはその意味を「程度」に決定し、それ以外の場合は
「強調」に決定する、ことを特徴とする請求項1に記載
の自然言語処理システム。
7. The meaning output means is "emphasized" and "degree".
When the sub particle "up to" that has two meanings is not connected to the case particle or the omitted case particle, and when it is connected to the omitted case particle "ni" or "he", The natural language processing system according to claim 1, wherein the meaning is determined to be "degree", and in other cases, it is determined to be "emphasis".
【請求項8】品詞の構文情報に応じた意味の候補の選択
方法をあらかじめ文法ルールとして記述しておき、 前記意味出力手段は、前記文法ルール記述に従って品詞
の意味を選択する、ことを特徴とする請求項1に記載の
自然言語処理システム。
8. A method of selecting a candidate for meaning according to syntactic information of a part of speech is described in advance as a grammar rule, and the meaning output means selects the meaning of the part of speech according to the description of the grammar rule. The natural language processing system according to claim 1.
【請求項9】複数の意味を持つ品詞の意味情報を解析す
る自然言語方法であって、 入力文に含まれる複数の意味を持つ品詞における意味の
候補を設定する意味候補設定ステップと、 入力文に含まれる該品詞の構文情報を抽出する構文情報
抽出ステップと、 抽出された該品詞の構文情報に応じて意味の候補のうち
1つを該品詞の意味として選択する意味出力ステップ
と、を具備することを特徴とする自然言語方法。
9. A natural language method for analyzing semantic information of a part of speech having a plurality of meanings, comprising a meaning candidate setting step of setting a candidate of a meaning in a part of speech having a plurality of meanings included in an input sentence, and an input sentence. A syntactic information extraction step of extracting the syntactic information of the part of speech included in the part of speech, and a meaning output step of selecting one of the meaning candidates according to the extracted syntactic information of the part of speech as the meaning of the part of speech. A natural language method characterized by:
【請求項10】複数の意味を持つ品詞は副助詞である、
ことを特徴とする請求項9に記載の自然言語処理方法。
10. A part-of-speech having a plurality of meanings is an auxiliary particle,
The natural language processing method according to claim 9, wherein.
【請求項11】前記意味候補設定ステップでは、品詞の
意味機能を記述した辞書に問い合わせることによって品
詞の意味の候補を取得する、ことを特徴とする請求項9
に記載の自然言語処理方法。
11. The candidate for the meaning of part of speech is obtained in the step of setting the meaning candidate by obtaining an inquiry from a dictionary describing the meaning function of the part of speech.
Natural language processing method described in.
【請求項12】前記構文情報抽出ステップでは、該品詞
の係り先を抽出する、ことを特徴とする請求項9に記載
の自然言語処理方法。
12. The natural language processing method according to claim 9, wherein in the syntactic information extracting step, a destination of the part of speech is extracted.
【請求項13】前記構文情報抽出ステップでは、該品詞
の接続先を抽出する、ことを特徴とする請求項9に記載
の自然言語処理方法。
13. The natural language processing method according to claim 9, wherein in the syntax information extracting step, a connection destination of the part of speech is extracted.
【請求項14】前記意味出力ステップでは、「程度」と
「限定」という2つの意味を持つ副助詞「ばかり」を、
構文上の係り先が数量詞であればその意味を「程度」に
決定し、それ以外の場合は「限定」に決定する、ことを
特徴とする請求項9に記載の自然言語処理方法。
14. In the meaning output step, a subposition particle “saku” having two meanings of “degree” and “limitation”,
10. The natural language processing method according to claim 9, wherein if the syntactically related destination is a quantifier, its meaning is determined to be “degree”, and otherwise, it is determined to be “limited”.
【請求項15】前記意味出力ステップでは、「強調」と
「程度」という2つの意味を持つ副助詞「まで」を、格
助詞又は省略されている格助詞に接続されていない場合
並びに省略された格助詞「に」又は「へ」に接続されて
いる場合にはその意味を「程度」に決定し、それ以外の
場合は「強調」に決定する、ことを特徴とする請求項9
に記載の自然言語処理方法。
15. In the meaning output step, a sub particle “up to” having two meanings of “emphasis” and “degree” is omitted when it is not connected to a case particle or an omitted case particle. 10. When the case particle is connected to "ni" or "he", its meaning is determined as "degree", and in other cases, it is determined as "emphasis".
Natural language processing method described in.
【請求項16】品詞の構文情報に応じた意味の候補の選
択方法をあらかじめ文法ルールとして記述しておき、 前記意味出力ステップでは、前記文法ルール記述に従っ
て品詞の意味を選択する、ことを特徴とする請求項9に
記載の自然言語処理方法。
16. A method of selecting a meaning candidate according to syntax information of a part of speech is described in advance as a grammar rule, and in the meaning output step, the meaning of the part of speech is selected according to the description of the grammar rule. The natural language processing method according to claim 9.
【請求項17】複数の意味を持つ品詞の意味情報を解析
する自然言語処理をコンピュータ・システム上で実行す
るようにコンピュータ可読形式で記述されたコンピュー
タ・プログラムであって、 入力文に含まれる複数の意味を持つ品詞における意味の
候補を設定する意味候補設定ステップと、 入力文に含まれる該品詞の構文情報を抽出する構文情報
抽出ステップと、 抽出された該品詞の構文情報に応じて意味の候補のうち
1つを該品詞の意味として選択する意味出力ステップ
と、を具備することを特徴とするコンピュータ・プログ
ラム。
17. A computer program written in a computer-readable format so as to execute natural language processing for analyzing semantic information of a part of speech having a plurality of meanings on a computer system, the plurality of computer programs included in an input sentence. A meaning candidate setting step of setting a meaning candidate in a part of speech having the meaning of, a syntactic information extraction step of extracting the syntactic information of the part of speech included in the input sentence, and a meaning determination step according to the extracted syntactic information of the part of speech. And a meaning output step of selecting one of the candidates as the meaning of the part of speech.
JP2002079626A 2002-03-20 2002-03-20 System and method of processing natural language, and computer program Pending JP2003281138A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002079626A JP2003281138A (en) 2002-03-20 2002-03-20 System and method of processing natural language, and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002079626A JP2003281138A (en) 2002-03-20 2002-03-20 System and method of processing natural language, and computer program

Publications (1)

Publication Number Publication Date
JP2003281138A true JP2003281138A (en) 2003-10-03

Family

ID=29229017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002079626A Pending JP2003281138A (en) 2002-03-20 2002-03-20 System and method of processing natural language, and computer program

Country Status (1)

Country Link
JP (1) JP2003281138A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021033136A1 (en) * 2019-08-21 2021-02-25 International Business Machines Corporation Extracting meaning representation from text

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021033136A1 (en) * 2019-08-21 2021-02-25 International Business Machines Corporation Extracting meaning representation from text
US11138383B2 (en) 2019-08-21 2021-10-05 International Business Machines Corporation Extracting meaning representation from text

Similar Documents

Publication Publication Date Title
JP2004355625A (en) Method and system for training machine translator
WO1999063456A1 (en) Language conversion rule preparing device, language conversion device and program recording medium
JP4007413B2 (en) Natural language processing system, natural language processing method, and computer program
JP4033011B2 (en) Natural language processing system, natural language processing method, and computer program
JP2005284723A (en) Natural language processing system, natural language processing method, and computer program
JP4033093B2 (en) Natural language processing system, natural language processing method, and computer program
JP3441400B2 (en) Language conversion rule creation device and program recording medium
JP2008077512A (en) Document analysis device, document analysis method and computer program
JP4039282B2 (en) Natural language processing system, natural language processing method, and computer program
JP2003281138A (en) System and method of processing natural language, and computer program
Gasser A dependency grammar for Amharic
Nenadić Local grammars and parsing coordination of nouns in Serbo-Croatian
JP3903820B2 (en) Natural language processing system, natural language processing method, and computer program
JP4033012B2 (en) Natural language processing system, natural language processing method, and computer program
JP3972697B2 (en) Natural language processing system, natural language processing method, and computer program
JP4033088B2 (en) Natural language processing system, natural language processing method, and computer program
JP4114580B2 (en) Natural language processing system, natural language processing method, and computer program
JP3972699B2 (en) Natural language processing system, natural language processing method, and computer program
KR20200066009A (en) Information processing system using Korean parcing
JP4036172B2 (en) Natural language processing system, natural language processing method, and computer program
Bloodgood et al. Acquisition of translation lexicons for historically unwritten languages via bridging loanwords
JP4289822B2 (en) Natural language processing system, natural language processing method, and computer program
JP3972698B2 (en) Natural language processing system, natural language processing method, and computer program
JP2003281131A (en) System and method of processing natural language, and computer program
JP2005092616A (en) Natural language processing system, natural language processing method, and computer program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041014

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061219

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070216

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070313