JPH0756918A - 日本語解析方法 - Google Patents

日本語解析方法

Info

Publication number
JPH0756918A
JPH0756918A JP5201651A JP20165193A JPH0756918A JP H0756918 A JPH0756918 A JP H0756918A JP 5201651 A JP5201651 A JP 5201651A JP 20165193 A JP20165193 A JP 20165193A JP H0756918 A JPH0756918 A JP H0756918A
Authority
JP
Japan
Prior art keywords
parallel relation
relation
analysis
bunsetsu
dependency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5201651A
Other languages
English (en)
Inventor
Satoshi Shirai
諭 白井
Akio Yokoo
昭男 横尾
Hajime Uchino
一 内野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5201651A priority Critical patent/JPH0756918A/ja
Publication of JPH0756918A publication Critical patent/JPH0756918A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 文節の一部に並列関係が存在するような日本
文に対する係り受け関係の認定を可能とする日本語解析
方法を提供する。 【構成】 入力文を形態素解析部2で形態素辞書5を参
照して単語分割して形態素解析結果を得、この形態素解
析結果を係り受け解析部3で係り受け辞書6と参照して
文節の並列関係を検出し、この検出した並列関係におい
て文節を構成する単語列の一部に並列関係が認められる
場合、並列関係が認められる単語列の直前または直後で
文節を切断して、文節全体同志の並列関係として係り受
け関係を認定する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文節間の係り受け関係
を認定することにより日本語入力文の構文解析を行う日
本語解析方法に関する。
【0002】
【従来の技術】従来、日本文における構文解析として
は、各文節の働きを分類し、この分類に従って、いわゆ
る句構造文法に基づく係り受けの一般的法則、すなわ
ち、(1)係りの文節は受けの文節より前に置かれる、
(2)係りの文節は受けの文節を1つしか持ちえない、
(3)係り受けの関係に交差を生じない、を用いて、各
文節間の係り受けを試行錯誤しながら認定することによ
り、文全体の係り受けパターンを決定する方法がよく知
られている。
【0003】また、一般的法則では並列に関する解析精
度が悪いため、最近、文節列の類似性に着目することに
より並列関係を検出する方法(黒橋、長尾、「長い日本
語文における並列構造の推定(情報処理学会の研究会資
料NL−86−2,1991年11月15日)」および
「並列構造の検出に基づく長い日本語文の構文解析(情
報処理学会の研究会資料NL−88−1,1992年3
月12日)」)が提案されている。
【0004】
【発明が解決しようとする課題】上述した係り受けの一
般法則および黒橋らの方法では、文節同志の並列関係し
か認定できないという問題がある。
【0005】例えば、「前記|音声|と‖画像|等|が
‖出力さ|れる|。」(ここで、‖は文節境界を表し、
|は単語境界を表す)という文章では、文章の意図とし
ては、「音声」と「画像」が並列関係にあると考えられ
るが、従来技術による解析では、「前記音声」と「画像
等」の並列関係が認定される。
【0006】従来の技術の範囲内において、このような
誤った並列関係の認定を防止するには、形態素解析にお
ける文節の切り方を変更する必要があるが、係り受け解
析の前段として行う形態素解析の段階で係り受け関係が
認定されていなければならないという自己矛盾に陥り、
現実的ではないという問題がある。
【0007】本発明は、上記に鑑みてなされたもので、
その目的とするところは、文節の一部に並列関係が存在
するような日本文に対する係り受け関係の認定を可能と
する日本語解析方法を提供することにある。
【0008】
【課題を解決するための手段】上記目的を達成するた
め、本発明の日本語解析方法は、日本語により表現され
る入力文に含まれる単語を認定し、1個以上の単語から
なるまとまりである文節を基本単位として文節間の係り
受け関係を認定することにより入力文の構文解析を行う
日本語解析方法であって、文節対の並列関係を認定する
際、文節を構成する単語列の一部に並列関係が認められ
る場合、並列関係が認められる単語列の直前または直後
で文節を切断して、文節全体同志の並列関係として係り
受け関係を認定することを要旨とする。
【0009】
【作用】本発明の日本語解析方法では、文節を構成する
単語列の一部に並列関係が求められる場合、並列関係が
認められる単語列の直前または直後で文節を切断して、
文節全体同志の並列関係として係り受け関係を認定す
る。
【0010】
【実施例】以下、図面を用いて本発明の実施例を説明す
る。
【0011】図1は、本発明の一実施例に係わる日本語
解析方法を実施する日本語解析システムの構成を示すブ
ロック図である。同図において、1は日本語の文を入力
するための入力部、2は形態素辞書5を用いて入力文を
単語分割する形態素解析部、3は形態素解析部で得られ
た形態素解析結果から係り受け辞書6を用いて文節間の
係り受け関係を解析する係り受け解析部、4は係り受け
解析結果を出力する出力部を示している。
【0012】本実施例に示す日本語解析システムの動作
の概要は次の通りである。
【0013】入力部1から入力された日本語の入力文
は、形態素解析部2で単語分割される。次に、係り受け
解析部3では、形態素解析部2からの出力に基づいて、
係り受け辞書6を用いて文節間の係り受け解析を行う。
この結果は、出力部4から出力される。
【0014】図2は、図1に示す日本語解析システムに
使用されている係り受け解析部3の詳細な構成を示すブ
ロック図である。図2に示すように、係り受け解析部3
は並列関係検出部31、文節分割部32、並列関係認定
部33および係り受け関係認定部34から構成されてい
る。
【0015】また、係り受け辞書6は、図3に示すよう
に構成されている。すなわち、係り受け辞書6は、文節
の単語構成として、種々の係り元となる文節に対応する
係り先となる文節を列挙し、これらのそれぞれにルール
番号を付するとともに、両者間の係り受け属性を示した
ものである。なお、図3において、*は任意の0個以上
の単語(品詞が指定されることもある)を表し、W1
2 は任意の1個の単語(品詞が指定される)を表して
いる。
【0016】次に、図4に示すフローチャートを参照す
るとともに、図5に示す解析結果例を用いて図1に示す
実施例の作用を説明する。
【0017】まず、入力文が「前記音声と画像等を出力
する。」である場合について説明する。この入力文は、
図1に示す入力部1を介して形態素解析部2に入力さ
れ、この形態素解析部2において形態素辞書5を参照し
ながら単語分割され、図5に示すように文節10,2
0,30からなる形態素解析結果が得られる(図のステ
ップ110)。
【0018】この形態素解析結果は、係り受け解析部3
に供給され、係り受け解析部3の並列関係検出部31に
おいて前記形態素解析結果の各々を係り受け辞書6の各
文節の単語構成と照合し、文節の並列関係を検出する
(ステップ120)。この結果、例えば係り受け辞書6
のルール201によって文節10と文節20が並列関係
になることが見いだされる。
【0019】この文節10と20は共に複数単語からな
るので、各文節の各単語同志の並列関係を検出する。こ
れは、図5の並列関係の検出の表で示すように、それぞ
れの文節から1単語ずつ取り出して並列関係を調べ、文
節10の「音声」と文節20の「画像」の間に並列関係
を検出する(ステップ130)。
【0020】この並列関係の検出結果は、文節分割部3
2に供給され、文節分割部32は、文節10の「音声」
の直前と、文節20の「画像」の直後でそれぞれの文節
を切断し、これにより図5に示すように文節10,1
5,20,25,30からなる文節分割結果を得る(ス
テップ140)。そして、並列関係認定部33は、この
文節分割結果に従って文節15と文節20との間の並列
関係を認定する(ステップ150)。
【0021】最後に、係り受け関係認定部34は、係り
受け辞書6を参照して、各文節の係り受け解析結果を得
る(ステップ160)。これは、図5の係り受け解析結
果に示すように、ルール101により文節10と文節1
5の連体関係、ルール102により文節20と文節25
の連体関係、ルール301により文節25と文節30の
格関係を決定する。この結果は図5の木構造表示のよう
な構造になっており、係り受けの関係はすべて文節間の
個別の関係として記述されており、このような分割を行
わない場合に認定される「前記音声」と「画像等」のよ
うな不均一な係り受け関係がないため、この解析結果を
用いて自然言語の応用システム、例えば機械翻訳システ
ムなどを構築する上できわめて便利な形式となってい
る。
【0022】
【発明の効果】以上説明したように、本発明によれば、
文節を構成する単語列の一部に並列関係が認められる場
合、並列関係が認められる単語列の直前または直後で文
節を切断して、文節全体同志の並列関係として係り受け
関係を認定するので、形態素解析で設定された文節の一
部分同志で並列関係が成立するような日本文に対しても
正しい並列関係を設定することが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施例に係わる日本語解析方法を実
施する日本語解析システムの構成を示すブロック図であ
る。
【図2】図1に示すシステムに使用されている係り受け
解析部の詳細な構成を示すブロック図である。
【図3】図1,2に示す係り受け辞書の構成を示す図で
ある。
【図4】図1に示す実施例の作用を示すフローチャート
である。
【図5】入力日本文の例に対する解析結果を示す図であ
る。
【符号の説明】
1 入力部 2 形態素解析部 3 係り受け解析部 4 出力部 5 形態素辞書 6 係り受け辞書 31 並列関係検出部 32 文節分割部 33 並列関係認定部 34 係り受け関係認定部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 日本語により表現される入力文に含まれ
    る単語を認定し、1個以上の単語からなるまとまりであ
    る文節を基本単位として文節間の係り受け関係を認定す
    ることにより入力文の構文解析を行う日本語解析方法で
    あって、文節対の並列関係を認定する際、文節を構成す
    る単語列の一部に並列関係が認められる場合、並列関係
    が認められる単語列の直前または直後で文節を切断し
    て、文節全体同志の並列関係として係り受け関係を認定
    することを特徴とする日本語解析方法。
JP5201651A 1993-08-13 1993-08-13 日本語解析方法 Pending JPH0756918A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5201651A JPH0756918A (ja) 1993-08-13 1993-08-13 日本語解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5201651A JPH0756918A (ja) 1993-08-13 1993-08-13 日本語解析方法

Publications (1)

Publication Number Publication Date
JPH0756918A true JPH0756918A (ja) 1995-03-03

Family

ID=16444629

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5201651A Pending JPH0756918A (ja) 1993-08-13 1993-08-13 日本語解析方法

Country Status (1)

Country Link
JP (1) JPH0756918A (ja)

Similar Documents

Publication Publication Date Title
JP3971373B2 (ja) ルールベース方式と翻訳パターン方式とを混合したハイブリッド自動翻訳装置
JPH0242572A (ja) 共起関係辞書生成保守方法
WO2003056450A1 (fr) Procede et appareil d'analyse syntaxique
CN109800430B (zh) 一种语义理解方法及系统
Carter et al. Handling compound nouns in a Swedish speech-understanding system
JPH0756918A (ja) 日本語解析方法
CN109783820B (zh) 一种语义解析方法及系统
JPH05224687A (ja) 日本文読み上げ単語変換編集処理方式
JP2004347732A (ja) 言語自動識別方法及び装置
JPH09152883A (ja) アクセント句分割位置検出方法及びテキスト音声変換装置
KR100420474B1 (ko) 부분문틀을 이용한 장문 번역 장치 및 그 방법
JPH0619968A (ja) 専門用語自動抽出装置
Che et al. A Chinese text correction and intention identification method for speech interactive context
JP2812511B2 (ja) キーワード抽出装置
KR100286649B1 (ko) 연어패턴에 기초한 어휘 변환방법
JPH06186994A (ja) 音声認識装置
JP3698454B2 (ja) 並列句解析装置および学習データ自動作成装置
JPH11338863A (ja) 未知名詞および表記ゆれカタカナ語自動収集・認定装置、ならびにそのための処理手順を記録した記録媒体
JP3140894B2 (ja) 言語処理装置
JPH0322083A (ja) 自然言語処理装置
JPH0756919A (ja) 日本語解析方法
JPH1091628A (ja) 構文解析システム
JP3143906B2 (ja) 未知語の存在の判定装置
JPH0869467A (ja) 日本語文書処理装置
JP2004326584A (ja) 対訳固有表現抽出装置及び方法、対訳固有表現抽出プログラム