JP3972697B2 - 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム - Google Patents

自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム Download PDF

Info

Publication number
JP3972697B2
JP3972697B2 JP2002079625A JP2002079625A JP3972697B2 JP 3972697 B2 JP3972697 B2 JP 3972697B2 JP 2002079625 A JP2002079625 A JP 2002079625A JP 2002079625 A JP2002079625 A JP 2002079625A JP 3972697 B2 JP3972697 B2 JP 3972697B2
Authority
JP
Japan
Prior art keywords
phrase
sentence
predicate
connector
case frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002079625A
Other languages
English (en)
Other versions
JP2003281132A (ja
Inventor
博 増市
智子 大熊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2002079625A priority Critical patent/JP3972697B2/ja
Publication of JP2003281132A publication Critical patent/JP2003281132A/ja
Application granted granted Critical
Publication of JP3972697B2 publication Critical patent/JP3972697B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、人間が日常的なコミュニケーションに使用する自然言語を数学的に取り扱うための自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに係り、特に、日本語構文の統語・意味解析を行なう自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに関する。
【0002】
さらに詳しくは、本発明は、日本語文のように主語や目的語といった本来は必須と考えられるが構成要素が省略された文をより正確に統語意味解析を行なう自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに係り、特に、文中から省略された主語や目的語すなわちゼロ代名詞の情報を高精度に出力する自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに関する。
【0003】
【従来の技術】
日本語や英語など、人間が日常的なコミュニケーションに使用する言葉のことを「自然言語」と呼ぶ。多くの自然言語は、自然発生的な起源を持ち、人類、民族、社会の歴史とともに進化してきた。勿論、人は身振りや手振りなどによっても意思疎通を行なうことが可能であるが、自然言語により最も自然で且つ高度なコミュニケーションを実現することができる。
【0004】
他方、情報技術の発展に伴い、コンピュータが人間社会に定着し、各種産業や日常生活の中に深く浸透している。いまやコンピュータ・データだけでなく、画像や音響などほとんどすべての情報コンテンツがコンピュータ上で取り扱われ、情報の編集・加工、蓄積、管理、伝達、共有など高度な処理を行なうことが可能となっている。
【0005】
自然言語は、本来抽象的であいまい性が高い性質を持つが、文章を数学的に取り扱うことにより、コンピュータ処理を行なうことができる。この結果、機械翻訳や対話システム、検索システムなど、自動化処理により自然言語に関するさまざまなアプリケーション/サービスが実現される。
【0006】
自然言語処理は一般に、形態素解析、構文解析、意味解析、文脈解析という各処理フェーズに区分される。
【0007】
形態素解析では、文を意味的最小単位である形態素(morpheme)に分節して品詞の認定処理を行なう。構文解析では、文法規則などを基に句構造などの文の構造を解析する。文法規則が木構造であることから、構文解析結果は一般に個々の形態素が係り受け関係などを基にして接合された木構造となる。意味解析では、文中の語の語義(概念)や、語と語の間の意味関係などに基づいて、文が伝える意味を表現する意味構造を求めて、意味構造を合成する。文脈解析では、文の系列である文章(談話)を解析の基本単位とみなして、文間の意味的なまとまりを得て談話構造を構成する。
【0008】
統語意味解析では、構文解析などで係り受け関係を求めた後の構造文に対して、動詞と主語などの文中の他の構成要素との関係(すなわち、述語の格フレーム)を記述した結合価辞書を用いて、述部とそれに係る語の意味関係を抽出するということが行なわれている。
【0009】
【発明が解決しようとする課題】
日本語文では、主語や目的語といった本来必須の構成要素と考えられるものが頻繁に省略される。このような省略された主語や目的語のことを「ゼロ代名詞」と呼んでいる。
【0010】
ゼロ代名詞の実体が何であるのかを文脈から特定することは、対話システムを始めとする各種の自然言語処理アプリケーションを実現する上で不可欠の処理である。ゼロ代名詞の実体を特定するためのアルゴリズムとして、例えば、M. A. Walker、A. K. Joshi及びE. F. Prince共著の"Centering Theory in Discourse", Clarendon Press, Oxford (1994)に詳細が述べられている「Centering理論」を挙げることができる。
【0011】
しかしながら、このようなゼロ代名詞の実体をいずれの方法で特定するにせよ、その前処理として、文中においてどの構成要素が省略されているかを同定しておく必要がある。
【0012】
例えば、述語の格フレームを基本的な情報に用いて、ゼロ代名詞の出現位置を特定することができる。格フレームは、述部毎にどのような構成要素が結合し得るかを示したものであり、結合価とも呼ばれ、結合価辞書に蓄積されている。
【0013】
図1には、情報処理振興事業協会技術センター(IPA)で開発されたIPAL動詞辞書に記述されている動詞「合う」の選択制限付き格フレームを示している。同図に示すように、動詞「合う」に対して、主語(「ガ格」)のみをとる場合、あるいは主語とニ格を同時にとる場合などの格フレームが記述されている。図1で選択制限として与えられているhum(human:人間)やphe(phenomenon:現象)などは、その格をとる名詞の概念的なカテゴリを示しており、意味素性(semantic feature)又は意味マーカ(semantic marker)と呼ばれる。ゼロ代名詞の出現位置を特定するための基本的な情報は述語の格フレームと呼ばれるものである。
【0014】
ここで、格フレーム情報を使用してゼロ代名詞の出現位置を探索する方法について考察してみる。述語の格フレームを参照することによって、文中で省略されている可能性がある主語や述語の出現位置を容易に特定することができる。
【0015】
例えば、以下の文(1)の中で、格フレームを基にゼロ代名詞化されている可能性のある個所を探索して、ゼロ代名詞に対応する記号として「NULL」を挿入していく。この結果、元の文は(2)に示すような形になってしまうが、本来必要でないゼロ代名詞を解析結果に含めてしまうことは明かであろう。
【0016】
(1)考えてみていなかったが、恐らく正しくない。
(2)(NULLが)(NULLを)考えて(NULLが) (NULLを)みて(NULLが)いて(NULLが)なかったが、恐らく(NULLは)正しく(NULLは)ない。
【0017】
本発明の目的は、上述したような技術的課題を鑑みたものであり、日本語文のように主語や目的語といった本来は必須と考えられるが構成要素が省略された文をより正確に統語意味解析を行なうことができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することにある。
【0018】
本発明のさらなる目的は、文中から省略された主語や目的語すなわちゼロ代名詞の情報を高精度に出力することができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することにある。
【0019】
【課題を解決するための手段及び作用】
本発明は、上記課題を参酌してなされたものであり、その第1の側面は、必須の構成要素が省略されている文を統語・意味解析する自然言語処理システム又は自然言語処理方法であって、
述語に後続する場合には格フレームを持つべきでない述語に対応する品詞カテゴリAUXを定義する品詞カテゴリ定義手段又はステップと、
入力文中で他の述語の直後あるいは一定の助詞を挟んでその後に存在する該品詞カテゴリAUXに属する述語を探索する述語探索又はステップと、
前記述語探索又はステップにより抽出された述語の格フレームを削除する格フレーム削除又はステップと、
を具備することを特徴とする自然言語処理システム又は自然言語処理方法である。
【0020】
また、本発明の第1の側面に係る自然言語処理システム又は自然言語処理方法は、
直前の句の述部が文頭に出現する「は」や「が」を伴う名詞句を受けない傾向を示す第1の句結合子を文中で探索する第1の句結合子探索手段又はステップと、
文中で該第1の句結合子が発見されたことに応じて、文頭に「が」を伴う名詞句があれば該第1の句結合子の直後の句の述部の主語に対応する格フレームに該名詞句を挿入し、及び/又は、文頭に「は」を伴う名詞句があれば該第1の句結合子の直後の句の述部に対応する格フレームに該名詞句を挿入する第1の格フレーム処理手段又はステップと、
をさらに備えていてもよい。
【0021】
また、本発明の第1の側面に係る自然言語処理システム又は自然言語処理方法は、
直前の句の述部が文頭に出現する「は」を伴う名詞句を受けない傾向を示す第2の句結合子を文中で探索する第2の句結合子探索手段又はステップと、
文中で該第2の句結合子が発見されたことに応じて、文頭に「は」を伴う名詞句があれば該第2の句結合子の直後の句の述部に対応する格フレームに該名詞句を挿入する第2の格フレーム処理手段又はステップと、
をさらに備えていてもよい。
【0022】
本発明の第1の側面に係る自然言語処理システム又は自然言語処理方法によれば、補助的述語及び句結合子に注目して、不要な格フレームを削除して、格構造のあいまい性を減ずることができる。
【0023】
したがって、その後、通常の意味解析(格構造解析)により、格フレームを基にゼロ代名詞化されている可能性のある個所を探索して、ゼロ代名詞に対応する記号として「NULL」を挿入していくという処理により、ゼロ代名詞の出現位置をより正確に特定することができる。
【0024】
また、本発明の第2の側面は、必須の構成要素が省略されている文を統語・意味解析する自然言語処理をコンピュータ・システム上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、
述語に後続する場合には格フレームを持つべきでない述語に対応する品詞カテゴリAUXを定義する品詞カテゴリ定義ステップと、
入力文中で他の述語の直後あるいは一定の助詞を挟んでその後に存在する該品詞カテゴリAUXに属する述語を探索する述語探索ステップと、
前記述語探索ステップにより抽出された述語の格フレームを削除する格フレーム削除ステップと、
を具備することを特徴とするコンピュータ・プログラムである。
【0025】
本発明の第2の側面に係るコンピュータ・プログラムは、コンピュータ・システム上で所定の処理を実現するようにコンピュータ可読形式で記述されたコンピュータ・プログラムを定義したものである。換言すれば、本発明の第2の側面に係るコンピュータ・プログラムをコンピュータ・システムにインストールすることによって、コンピュータ・システム上では協働的作用が発揮され、本発明の第1の側面に係る自然言語処理装置又は自然言語処理方法と同様の作用効果を得ることができる。
【0026】
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。
【0027】
【発明の実施の形態】
以下、図面を参照しながら本発明の実施形態について詳解する。
【0028】
自然言語の構文解析手法は、統計処理に基づく方法と文法ルール記述に基づく方法に大別することができる。本発明は、とりわけ文法ルール記述に基づく統語・意味解析に適用することで顕著な効果を奏することができる。
【0029】
本発明に係る自然言語処理システムは、例えば、LFG(Lexical-Functional Grammar)文法理論に基づく統語・意味解析処理に組み込んで実装することができる。LFGでは、ネイティブ・スピーカの言語知識すなわち文法を、コンピュータ処理や、コンピュータの処理動作に影響を及ぼすその他の非文法的な処理パラメータとは切り離したコンポーネントとして構成している。まず、自然言語処理システムの全体像について簡単に説明する。なお、本実施形態ではLFG文法理論に基づいて説明するが、勿論、他の文法ルールを備えた解析システムにおいても本発明を同様に適用することができる。
【0030】
図2には、LFGに基づく自然言語処理システム1の構成を模式的に示している。
【0031】
形態素解析部2は、日本語など特定の言語に関する形態素ルール2Aと形態素辞書2Bを持ち、入力文を意味的最小単位である形態素に分節して品詞の認定処理を行なう。例えば、「私の娘は英語を話します。」という文が入力された場合、形態素解析結果として、「私{Noun} の{up} 娘{Noun} は{up} 英語{Noun} を{up} 話す{Verb1}{tr} ます{jp} 。{pt}」が出力される。
【0032】
このような形態素解析結果は、次いで、統語・意味解析部3に入力される。統語・意味解析部は、文法ルール3Aや結合価辞書3Bなどの辞書を持ち、文法ルールなどに基づく句構造の解析や、文中の語の語義や語と語の間の意味関係などに基づいて文が伝える意味を表現する意味構造の解析を行なう(結合価辞書は動詞と主語などの文中の他の構成要素との関係を記述したものであり、述部とそれに係る語の意味関係を抽出することができる)。
【0033】
そして、構文解析した結果として、単語や形態素などからなる文章の句構造を木構造として表した"c−structure(constituent structure)"と、主語、目的語などの格構造に基づいて入力文を疑問文、過去形、丁寧文など意味的・機能的に解析した結果として"f−structure(functional structure)"を出力する。
【0034】
図3及び図4には、入力文「私の娘は英語を話します。」を統語・意味解析部1により処理した結果として得られるc−structure及びf−structureをそれぞれ示している。
【0035】
c−structureは、文中の単語や句の構造を木構造形式で表したものであり、構文カテゴリーによって定義される。例えば音素列を生成するための音韻学的な解釈を、c−structureを基に行なうことができる。一方、f−structureは、文法的な機能を明確に表現したものであり、文法的な機能名、意味的形式、並びに特徴シンボルにより構成される。f−structureを参照することにより、主語(subject)、目的語(object)、補語(complement)、修飾語(adjunct)といった意味理解を得ることができる。f−structureは、c−structureの各節点に付随する素性の集合であり、図4に示すように属性−属性値のマトリックスの形で表現される。すなわち、[]で囲まれた中の左側は素性(属性)の名前であり、右側は素性の値(属性値)である。
【0036】
なお、LFGの詳細に関しては、例えばR. M. Kaplan及びJ. Bresnan共著の論文"Lexical-Functional Grammar: A Formal System for Grammatical Representation"(The MIT Press, Cambridge (1982). Reprinted in Formal Issues in Lexical-Functional Grammar, pp. 29-130. CSLI publications, Stanford University(1995).)に記述されている。
【0037】
日本語文では、主語や目的語といった本来必須の構成要素と考えられるものが省略されることが多い。より正確な文脈解析を行なうためには、このようなゼロ代名詞の実体を特定することは不可欠である。したがって、その前処理として,統語・意味解析部3において文中においてどの構成要素が省略されているかを同定しておく必要がある。
【0038】
そこで、本発明では、まず「述語に後続する場合、格フレームを持つべきでない述語」に対応する品詞カテゴリAUXを定義する。例えば、上述した文例(1)に含まれている「みる」「いる」「ない」などがAUXのカテゴリに属する語である。これらの語が述語に後続する場合は格フレームを持たないものとする。
【0039】
また、ゼロ代名詞の出現位置を特定する場合、2つ以上の句が結合している場合の処理が特に問題になる。この場合、文頭に係助詞「は」や格助詞「が」を伴って現れる名詞句の係り先がどの句の述部であるかの特定が問題となる。
【0040】
これに対し、本発明では、句と句をつなぐ句結合子に注目する。句結合子は、「が」「から」「し」などの接続助詞、連用形接続、「なら」「たら」などの条件化、「ものの」「ところが」などのモノノ類、「時」「頃」などの特殊名詞などに分類できる。本発明では、これらの句結合子(あるいはそれらの組み合わせ)を従属句構造の観点から再分類する。例えば、句結合子を以下の3種に分類する。
【0041】
句結合子A:
直前の句の述部が、文頭に出現する「は」や「が」を伴う名詞句を受けないという傾向を示す句結合子。「つつ」、「動詞連用形の反復」などがここに分類される。
【0042】
句結合子B:
直前の句の述部が、文頭に出現する「は」を伴う名詞句を受けないという傾向を示す句結合子。「ずに」、「ないで」、「たら(条件化)」、「ても」などがここに分類される。
【0043】
句結合子C:
上記以外の句結合子。直前の句の述部が、文頭に出現する「は」や「が」を伴う名詞句を受け得る句結合子。
【0044】
なお、これらの句結合子の分類については、例えば南不二男著の『現代日本語文法の輪郭』(大修館書店,1993)に詳細が述べられている。
【0045】
図5には、本発明の一実施形態に係るゼロ代名詞解析の処理手順をフローチャートの形式で示している。以下、このフローチャートを参照しながらゼロ代名詞の解析処理について詳解する。
【0046】
まず入力文に対して構文解析処理を実行する(ステップS1)。
【0047】
そして、例えばf−structure形式で記述されている構文解析木を基に、前述した品詞カテゴリAUXに属する述語が他の述語の直後(あるいは一定の助詞を挟んでその後)に存在するかどうかを判断する(ステップS2)。
【0048】
このような述語が存在する場合には、この品詞カテゴリAUXに属する述語の格フレームを必要ないものとして削除する(ステップS3)。
【0049】
次いで、入力文中に前述した結合子Aが存在するかどうかを判断する(ステップS4)。そして、結合子Aが存在する場合、以下の処理I及びIIを実行する(ステップS5)。
【0050】
処理1:
文頭に「が」を伴う名詞句があれば、結合子Aの直後の句の述部の主語に対応する格フレームに該名詞句を挿入する。
【0051】
同様に、入力文中に前述した結合子が存在するかどうかを判断して(ステップS6)、結合子Bが存在する場合、以下の処理IIを実行する(ステップS8)。
【0052】
処理2:
文頭に「は」を伴う名詞句があれば結合子A又はBの直後の句の述部に対応する格フレームに該名詞句を挿入する。但し、格フレームが複数存在する場合は、曖昧性を残しておき後の意味解析であいまい性を解消する。
【0053】
以上の処理によって、構文解析木から不要な格フレームを削除して、格構造の曖昧性を減じることができるので、通常の意味解析(格構造解析)により(ステップS8)、ゼロ代名詞の出現位置をより正確に特定することができる。
【0054】
図6には、文例「私は彼の本を読んで発見した。」を構文解析した結果を示している。
【0055】
また、図7には、図6に示した構文解析木に対してさらに意味解析(格構造解析)を適用した結果を示している。同図において、ゼロ代名詞は「NULL」で表記されている。同図からも判るように、構文解析木の適切な位置にNULLが付与されている。単一文のゼロ代名詞解析として正しい結果が得られている。したがって、文例「私は彼の本を読んで発見した」を本手法で解析した結果によれば、「I read his book and discovered something.」と正しい翻訳結果を得ることができる。
【0056】
[追補]
以上、特定の実施形態を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施形態の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本発明の要旨を判断するためには、冒頭に記載した特許請求の範囲の欄を参酌すべきである。
【0057】
【発明の効果】
以上詳記したように、本発明によれば、日本語文のように主語や目的語といった本来は必須と考えられるが構成要素が省略された文をより正確に統語意味解析を行なうことができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することができる。
【0058】
また、本発明によれば、文中から省略された主語や目的語すなわちゼロ代名詞の情報を高精度に出力することができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することができる。
【0059】
本発明では、補助的述語及び句結合子に注目して、不要な格フレームを削除して、格構造のあいまい性を減ずる点に特徴があり、これにより精度の高いゼロ代名詞の解析を行なうことができる。
【図面の簡単な説明】
【図1】情報処理振興事業協会技術センター(IPA)で開発されたIPAL動詞辞書に記述されている動詞「合う」の選択制限付き格フレームを示した図である。
【図2】LFGに基づく自然言語処理システム1の構成を模式的に示した図である。
【図3】入力文「私の娘は英語を話します。」を統語・意味解析部1により処理した結果として得られるc−structureを示した図である。
【図4】入力文「私の娘は英語を話します。」を統語・意味解析部1により処理した結果として得られるf−structureを示した図である。
【図5】本発明の一実施形態に係るゼロ代名詞解析の処理手順をフローチャートの形式で示した図である。
【図6】文例「私は彼の本を読んで発見した。」に対する文構文解析結果を示した図である。
【図7】文例「私は彼の本を読んで発見した。」に対する意味(格構造)解析結果を示した図である。
【符号の説明】
1…自然言語処理システム
2…形態素解析部
2A…形態素ルール,2B…形態素辞書
3…統語・意味解析部
3A…文法ルール,3B…結合価辞書

Claims (6)

  1. 必須の構成要素が省略されている文を統語・意味解析する自然言語処理システムであって、
    述語に後続する場合には格フレームを持つべきでない述語に対応する品詞カテゴリAUXを定義する品詞カテゴリ定義手段と、
    入力文中で他の述語の直後あるいは一定の助詞を挟んでその後に存在する該品詞カテゴリAUXに属する述語を探索する述語探索手段と、
    前記述語探索手段により抽出された述語の格フレームを削除する格フレーム削除手段と、
    を具備することを特徴とする自然言語処理システム。
  2. 直前の句の述部が文頭に出現する「は」や「が」を伴う名詞句を受けない傾向を示す第1の句結合子を文中で探索する第1の句結合子探索手段と、
    文中で該第1の句結合子が発見されたことに応じて、文頭に「が」を伴う名詞句があれば該第1の句結合子の直後の句の述部の主語に対応する格フレームに該名詞句を挿入し、又は、文頭に「は」を伴う名詞句があれば該第1の句結合子の直後の句の述部に対応する格フレームに該名詞句を挿入する第1の格フレーム処理手段と、
    をさらに備えることを特徴とする請求項1に記載の自然言語処理システム。
  3. 直前の句の述部が文頭に出現する「は」を伴う名詞句を受けない傾向を示す第2の句結合子を文中で探索する第2の句結合子探索手段と、
    文中で該第2の句結合子が発見されたことに応じて、文頭に「は」を伴う名詞句があれば該第2の句結合子の直後の句の述部に対応する格フレームに該名詞句を挿入する第2の格フレーム処理手段と、
    をさらに備えることを特徴とする請求項1に記載の自然言語処理システム。
  4. コンピュータを用いて構築される自然言語処理システムにおいて、必須の構成要素が省略されている文を統語・意味解析する自然言語処理方法であって、
    前記コンピュータが備える品詞カテゴリ定義手段が、述語に後続する場合には格フレームを持つべきでない述語に対応する品詞カテゴリAUXを定義する品詞カテゴリ定義ステップと、
    前記コンピュータが備える述語探索手段が、入力文中で他の述語の直後あるいは一定の助詞を挟んでその後に存在する該品詞カテゴリAUXに属する述語を探索する述語探索ステップと、
    前記コンピュータが備える格フレーム削除手段が、前記述語探索ステップにより抽出された述語の格フレームを削除する格フレーム削除ステップと、
    を具備することを特徴とする自然言語処理方法。
  5. 前記コンピュータが備える第1の句結合子探索手段が、直前の句の述部が文頭に出現する「は」や「が」を伴う名詞句を受けない傾向を示す第1の句結合子を文中で探索する第1の句結合子探索ステップと、
    前記コンピュータが備える第1の格フレーム処理手段が、文中で該第1の句結合子が発見されたことに応じて、文頭に「が」を伴う名詞句があれば該第1の句結合子の直後の句の述部の主語に対応する格フレームに該名詞句を挿入し、又は、文頭に「は」を伴う名詞句があれば該第1の句結合子の直後の句の述部に対応する格フレームに該名詞句を挿入する第1の格フレーム処理ステップと、
    をさらに備えることを特徴とする請求項4に記載の自然言語処理方法。
  6. 前記コンピュータが備える第2の句結合子探索手段が、直前の句の述部が文頭に出現する「は」を伴う名詞句を受けない傾向を示す第2の句結合子を文中で探索する第2の句結合子探索ステップと、
    前記コンピュータが備える第2の格フレーム処理手段が、文中で該第2の句結合子が発見されたことに応じて、文頭に「は」を伴う名詞句があれば該第2の句結合子の直後の句の述部に対応する格フレームに該名詞句を挿入する第2の格フレーム処理ステップと、
    をさらに備えることを特徴とする請求項4に記載の自然言語処理方法。
JP2002079625A 2002-03-20 2002-03-20 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム Expired - Fee Related JP3972697B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002079625A JP3972697B2 (ja) 2002-03-20 2002-03-20 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002079625A JP3972697B2 (ja) 2002-03-20 2002-03-20 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007011060A Division JP4007413B2 (ja) 2007-01-22 2007-01-22 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Publications (2)

Publication Number Publication Date
JP2003281132A JP2003281132A (ja) 2003-10-03
JP3972697B2 true JP3972697B2 (ja) 2007-09-05

Family

ID=29229016

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002079625A Expired - Fee Related JP3972697B2 (ja) 2002-03-20 2002-03-20 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Country Status (1)

Country Link
JP (1) JP3972697B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111597794B (zh) * 2020-05-11 2023-06-06 浪潮软件集团有限公司 一种基于依存关系的“是”字句关系抽取方法和装置

Also Published As

Publication number Publication date
JP2003281132A (ja) 2003-10-03

Similar Documents

Publication Publication Date Title
WO2010046782A2 (en) Hybrid machine translation
JPH0644296A (ja) 機械翻訳装置
JPH02165378A (ja) 機械翻訳システム
Ouersighni A major offshoot of the DIINAR-MBC project: AraParse, a morphosyntactic analyzer for unvowelled Arabic texts
JP4007413B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3441400B2 (ja) 言語変換規則作成装置、及びプログラム記録媒体
JP4033011B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2005284723A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2008077512A (ja) 文書解析装置、および文書解析方法、並びにコンピュータ・プログラム
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4039282B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4033012B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3903820B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4114580B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4033088B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2005092616A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3972699B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4289822B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4036172B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3972698B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPS63109572A (ja) 派生語処理方式
JP2003281138A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPH0320866A (ja) テキストベース検索方式
JP2003281131A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061128

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070122

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070213

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070413

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070522

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070604

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100622

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110622

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110622

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120622

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130622

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130622

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140622

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees