JP3216725B2 - 文章構造解析装置 - Google Patents

文章構造解析装置

Info

Publication number
JP3216725B2
JP3216725B2 JP03341791A JP3341791A JP3216725B2 JP 3216725 B2 JP3216725 B2 JP 3216725B2 JP 03341791 A JP03341791 A JP 03341791A JP 3341791 A JP3341791 A JP 3341791A JP 3216725 B2 JP3216725 B2 JP 3216725B2
Authority
JP
Japan
Prior art keywords
clause
extended semantic
phrase
modified
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP03341791A
Other languages
English (en)
Other versions
JPH04248671A (ja
Inventor
博人 稲垣
史彦 小橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP03341791A priority Critical patent/JP3216725B2/ja
Publication of JPH04248671A publication Critical patent/JPH04248671A/ja
Application granted granted Critical
Publication of JP3216725B2 publication Critical patent/JP3216725B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文章の構造を解析し、
その文章の係り受け関係を生成,表示する文章構造解析
装置に関するものである。
【0002】
【従来の技術】従来の文章解析装置は、形態素解析や係
り受け解析を国文法に則り、正確に文節間の係り受け関
係を求めていた。例えば自然言語処理装置(特願昭63
−194362号)では入力文章を形態素解析で文節単
位に分割し、その後、係り受け解析により文章の係り受
け関係を求めていた。そのため、文章の解析精度は高い
ものの、処理時間は入力文章が長くなればなるほど増加
し、実時間並の処理を行うことはできなかった。
【0003】
【発明が解決しようとする課題】上記従来技術において
は、国文法に則り、形態素解析,係り受け解析を行って
いるため、文章の構造を正確に解析することができる
が、一方で、実時間並に処理することが難しかった。そ
こで、アプリケ−ション等で使用しない文章構造解析情
報については処理を行わず、表層的な手段で文章構造を
解析する手法が必要となる。
【0004】本発明の目的は、必要最低限の情報の処理
によって文章構造を解析することができる文章構造解析
装置を提供することにある。
【0005】
【課題を解決するための手段】第1の本発明に係る文章
構造解析装置は、入力文章を文字種の切れ目と例外用の
辞書を用いて自立語と付属成分を認定し、前記付属成分
から名詞・動詞の品詞を判断する形態素解析部と、前記
形態素解析部により判断された品詞を用いて「の」で結
ばれた名詞を結合して一つの拡張意味文節を生成する処
を行うとともに、 前記形態素解析部により判断され
た品詞を用いて、動詞の自立語の前方が「を」の付属成
分を持つ文節の場合、該文節をヲ格成分であるとして該
動詞の文節に対してヲ格成分を含めた形で拡張意味文節
を生成する文節拡張処理を行い、更に、前記処理により
生成された拡張意味文節を入力とし、少なくとも並列構
文判定用辞書と、ト格単語辞書とを用い、当該拡張意味
文節において並列構文の有無を判定する名詞句並列構文
判定処理を行い、そして、前記名詞句並列構文判定処理
の判定結果と、付属成分を属性辞書を参照することで当
該付属成分に与えられる少なくとも「アップ」「パラ」
「リセット」の拡張意味文節間の関係を判定する修飾関
係判定処理を行う係り受け解析部を有し、前記係り受け
解析部により全ての拡張意味文節に対して修飾関係を決
定し、前記決定された少なくとも「アップ」「パラ」
「リセット」の修飾関係に基づき文章の全ての拡張意味
文節を被修飾部と、修飾部という2種類に分け、被修飾
部を右側に表示し、修飾部を左側に表示する表示処理部
で表示することを特徴とすることで被修飾、修飾関係を
表示することにより判読しやすい文章の構造表示を行う
文章構造表示部とを備えたものである。さらに、第2の
発明は、第1の発明の、文章構造解析装置において、文
章構造解析装置の中の文書構造表示部の処理動作が、各
拡張意味文節の付属成分の属性を取得し、文章の最後尾
およびそれと並列構文をなす拡張意味文節を被修飾部に
入れ、スタックにも入れ、スタックに入った該拡張意味
文節より1個前の拡張意味文節の属性を取得し、該属性
が「アップ」である場合には、該拡張意味文節を修飾部
に入れ、または、該属性が「パラ」である場合には、対
象拡張意味文節を修飾部に入れ、さらに、対象拡張意味
文節と並列構文をなす拡張意味文節を被修飾部に入れ、
かつ、スタックにも入れ、または、該属性が「リセッ
ト」である場合には、対象拡張意味文節を修飾部に入
れ、スタックに入った文節の1個前の文節が無くなるま
で、全ての拡張意味文節について被修飾部と修飾部とい
う2種類に分ける処理を繰り返し、さらに、被修飾部を
右側に表示、修飾部を左側に表示する、ことを特徴とす
るものである。また、第3の発明は、第2の発明の、文
章構造解析装置において、文章構造表示部の処理動作
が、第2の発明に記載の全ての拡張意味文節について被
修飾部と修飾部という2種類に分ける処理により得られ
た修飾部を構成している句を入力として、修飾部を構成
している句の中の係り受け関係を解析し、修飾部と被修
飾部に分けることにより、被修飾部と修飾部を2段階以
上の多段階で表示することを特徴とするものである。
【0006】
【作用】本発明においては、従来技術の形態素解析や係
り受け解析と全く同じ処理を行うわけではなく、アプリ
ケ−ション側で利用する情報のみを取得できるような簡
易で、かつ処理精度が高く,処理速度が速い。また、形
態素解析用の辞書を用いず、文字種の切れ目と例外処理
で形態素解析と同様な処理を行い、さらに、拡張意味文
節という通常の係り受け解析と異なる、意味に着目した
文節の間の関係を付属成分等の表層表現から判断するこ
とにより係り受け解析とほぼ同様な処理を行う。そし
て、本発明では、アップだけでなく、パラ(並列)とリ
セット(修飾関係をリセットする)との属性を導入する
ことにより、単純に階段上ではなく、左側に、文章の枝
葉(つまり、比較的重要ではない部分)を表示し、右側
に、文章の幹(つまり、文章での重要な要旨)部分を表
示することが可能となる。したがって、従来必要であっ
た大規模な単語辞書や辞書に関わる種々の問題点を回避
できる。さらに、必要最低限の情報を処理するため、処
理に必要なデ−タ量,処理時間などが従来技術に比べて
格段に優れる。
【0007】
【実施例】以下、この発明の実施例について説明する。
まず、この発明の文章構造解析装置の全体構成について
述べる。図1はこの発明の一実施例を示すブロック図で
ある。1は形態素解析部で、入力文章を文節単位に分割
するとともに、必要な品詞情報を付与する。2は係り受
け解析部で、形態素解析部1の形態素解析結果を用いて
拡張意味文節単位に区切り、さらに、その拡張意味文節
の係り受け関係,並列関係を求める。3は文章構造表示
部で、係り受け解析部2の係り受け解析情報を用いて文
章構造を判読しやすい形で表示する。
【0008】図2は、本発明の形態素解析部1と係り受
け解析部2の処理の流れを示すフロ−チャ−トである。
この処理の流れに従って実施例を説明する。なお、S1
〜S8は各ステップを示す。ステップS1〜Sまでが
形態素解析部1の処理であり、ステップS5〜S7が係
り受け解析部2の処理である。形態素解析では、単語の
自立語,付属成分の認定処理と品詞の決定処理を行う。
単語の認定は、文字種で自立語か付属成分かを判定し、
文字種の切れ目で文節区切れを判定する。ル−ルを以下
に示す。 (1)自立語成分=漢字の部分 (2)付属成分(活用語尾,付属語)=平仮名の部分 (3)平仮名から平仮名以外(漢字,英字,数字,記号
等)=文節の切れ目 また、上記ル−ルで処理できない単語に対処するため、
例外処理用の辞書(単語認定用辞書11)を用意してあ
る。(1)のル−ルの例外は、自立語が漢字と平仮名の
組み合わせで構成されている場合である。例えば“読み
書き”、“読みこみ”等である。これらの単語は単語認
定用辞書11に登録しておき、それらの単語に対して
は、漢字(自立語)扱いするようなフラグを付与する
(Kフラグ)。また、この種の漢字,平仮名混じりの自
立語の中でよく使われる1漢字+1平仮名が連続する単
語については単語認定用辞書11に登録せず、プログラ
ム上で1漢字+1平仮名が連続する単語は漢字扱い語で
あるとしておく。(2)のル−ルの例外としては補助体
言がある。例えば“に対して”、“に於て”等である。
これらの語は漢字表記であるが、付属成分として扱わな
ければならない語である。これらの単語は単語認定用辞
書11に登録し、入力文章にそれらの単語がある場合に
は、平仮名(付属成分)扱いとする。また、係り受け解
析の係り受け単位である拡張意味文節を決定するため
に、単語認定用辞書11に不要語を登録し、不要語と同
じ語が入力文章中で出現した場合、不要語扱いをする。
単語の認定が終了した後は各単語の品詞の決定処理を行
う。
【0009】さて、図2において、ステップS1はフラ
グ付与処理で、単語認定用辞書11を用いて単語認定用
辞書の辞書項目と一致する語に対してフラグを付与す
る。単語認定用辞書11の例を図3に示す。単語認定用
辞書11は、単語表記,フラグ,接続条件の3つの情報
が記述されている。フラグはその単語表記を自立語,付
属成分,不要語に分類するために使用される。ここで、
各フラグの意味は以下の通りである。 Kフラグ:漢字フラグ、自立語 Hフラグ:平仮名フラグ、付属成分 Sフラグ:不要語 また、接続条件とは、フラグを与える時の条件を示す。
接続条件がない場合は単語表記が同じならば無条件で前
記フラグを与えることを示す。接続条件の記述として
は、 BH:前がHフラグを持つ単語でなければならない。 AH:後ろがHフラグを持つ単語でなければならない。 P:後ろに読点がなければならない。 である。これらの接続条件はそれぞれ組み合わせること
ができる。例えば“読みこみ”という単語は、接続条件
がないので絶えずKフラグが与えられる。図4に示す例
では、は自立語(Kフラグ)を表し、─は付属成分
(Hフラグ)を表す。
【0010】図2のステップS1のフラグ付与処理手順
は、単語認定用辞書11を読みこみ、入力文章と一致
している単語表記を検索する。一致している単語の中
で接続条件を満たしている単語については、該当するフ
ラグを付与する。フラグが付与されていない単語につ
いては、文章の表記に従って、漢字表記にはKフラグ、
平仮名表記にはHフラグを与える。
【0011】ステップS2は文節認定処理で、ステップ
S1で付与したフラグを基にして文節単位に区切る。こ
こでの文節は、係り受けで使用される文節単位“N個の
自立語+M個の付属成分”ではなく、各文節に必ず意味
を持った単位とする拡張意味文節を使用している。その
ため、文節の決定では、フラグを使ってN個のKフラグ
単語+M個のHフラグ単語を1文節とした。ただし、こ
こで文節は意味を持つ最小単位とするため、Sフラグを
持つ単語(不要語)については特殊な処理が行われる。
つまり、不要語に対して付与されるSフラグを持つ単語
は文節の構成語ではない。そのため、意味を持たない
(Sフラグをもつような)自立語については、それ自身
では独立した文節を構成することができない。Sフラグ
単語がN個のKフラグ単語+M個のHフラグ単語の前方
に存在する場合、KフラグとHフラグ単語の間に存在す
る場合、Hフラグ単語の間に存在する場合には同一文節
に組み込む。
【0012】図5の例では、文節の判定結果を示す。判
定結果では、は自立語(Kフラグ)を表し、─は付属
成分(Hフラグ)を表し、縦線間を拡張意味文節とす
る。例では“装置”がSフラグ単語(不要語)であるた
め1つの文節を構成できず、“固定する”の句と結合さ
れて1拡張意味文節を構成している例である。さらに、
拡張意味文節の処理では、名詞,動詞に対して特殊な拡
張が成されている。名詞では、「の」で接続された名詞
句を1つの文節として扱う。動詞については、対象格
(ヲ格)がある場合、その対象格を含めて1つの文節を
構成するものとする。この名詞と動詞の文節拡張処理
は、単語の品詞判定処理(ステップS3,S4)を終了
した後、行う(ステップS5)。
【0013】図6の例では、「の」で結合された名詞句
が1つの拡張意味文節を構成している。図7の例で示す
ように、通常“入力文章を”と“読みこみながら”とい
う句は別々の文節を構成するが、拡張意味文節では、動
詞に対してヲ格がついた単位を1拡張意味文節としてい
る。
【0014】ステップS3およびS4はそれぞれ名詞判
定処理,動詞判定処理で、単語の品詞を判定する。ここ
で、判定する品詞項目としては、名詞,動詞(連体形,
連用形)である。それ以外は判定しない。単語の判定に
は、ステップS2で決定した付属成分を用いる。ステッ
プS3では、名詞判定用辞書12を用いて名詞を決定す
る。名詞判定用辞書12には、自立語が名詞である場合
の付属成分が記述されており、その付属成分と拡張意味
文節中の付属成分が一致した場合には名詞として判定す
る。名詞判定用辞書12の一部を図8に示す。
【0015】ステップS4では動詞判定用辞書13を用
いて動詞を決定する。動詞判定用辞書13には、自立語
が動詞である場合の付属成分が記述されており、その付
属成分と拡張意味文節中の付属成分が一致した場合には
動詞として判定する。動詞判定用辞書13の一部を図9
に示す。さらに、付属成分の末尾が“う列”の平仮名の
場合は連体形、“い列”の平仮名の場合は連用形である
と判定する。その例を図10に示す。
【0016】係り受け解析部2におけるステップS5で
は文節拡張処理を行う。この処理では、「の」で結ばれ
た名詞を結合して1つの拡張意味文節にする処理と、動
詞に対してヲ格成分を含めた形で拡張意味文節とする処
理の2つからなる。「の」で結ばれた名詞の結合は、先
に判定した品詞を用いて行う。ヲ格の判定方法として
は、動詞の自立語の前方が“を”の付属成分を持つ文節
の場合、その文節をヲ格成分であるとして動詞の文節中
に含める。
【0017】ステップS6とS7は、係り受け解析部2
における文章の係り受け関係を解析する部分である。係
り受けの単位は拡張意味文節である。この単位ごとに係
り受け関係を判定する。基本的には係り受け解析ではア
プリケ−ションに応じて求める係り受けのレベルを決定
する。最小レベルとしては、2階層の係り受け関係のみ
求める場合がある。これは、被修飾部と修飾部の2階層
に分類するだけの処理で、被修飾部は拡張意味文節とな
り、修飾部には被修飾部を修飾する句が含まれる。処理
レベルを上げた場合、さらに、修飾部を構成している句
の中に係り受け関係を解析し、被修飾部と修飾部に分け
る。最終的には、通常の係り受け解析と同様に、各拡張
意味文節間の係り受け関係を求めることができる。ここ
では、最小レベルの2階層の係り受け関係を求める例に
ついて説明する。
【0018】ステップS6では名詞句の並列構文を解析
する。並列構文のパタ−ンは、並列構文判定用辞書21
に記述されている。並列構文判定用辞書21の一部を図
11に示す。並列構文判定用辞書21には並列パタ−ン
と終了パタ−ンが登録されている。並列パタ−ンは、並
列構文が開始時か並列構文中のときの付属成分であり、
終了パタ−ンは並列構文の終了を示す付属成分である。
処理は、並列構文判定用辞書21に記述されている並
列パタ−ンと同じ付属成分を持つものを見付ける。ただ
し、ト格との混同をさけるため、ト格を持つことのでき
る単語(動詞,形容詞,形容動詞)が“と”の直後に存
在する場合には、その“と”は並列接続助詞の“と”で
はなく、格助詞の“と”であると判定する。ト格を持つ
単語は、ト格単語辞書22に登録されている。ト格単語
辞書22の一部を図12に示す。並列パタ−ンが存在し
ない場合、その分には並列構文はないと判定する。あ
る並列構文のパタ−ンの終了前に別の並列パタ−ンが現
れたら、並列構文の埋め込みであると判定して、別の並
列パタ−ンの並列構文の解析を進める。ただし、並列構
文の交差は認めない。終了パタ−ンの付属成分を検出
後、並列構文を完成させ、に戻る。同一の終了パタ−
ンを持つ並列構文の場合、読点がつく並列構文を優先的
に扱う。例えば「と、」型並列構文>「と」型並列構
文。また、終了パタ−ンになにも記述されていない並列
構文は、並列パタ−ン直後の句が並列要素であると判定
する。
【0019】図13の例では、並列パタ−ン“と”と、
終了パタ−ン“とを”があるので、“電話”と“FA
X”が並列構文を構成していると判定する。
【0020】図14の例では、並列パタ−ン中に“と”
格助詞が存在している並列構文であるが、ト格単語辞書
22を使用することにより接続助詞と格助詞の区別がで
きる例である。
【0021】ステップS7ではステップS6の並列構文
判定結果と付属成分により拡張意味文節間の修飾関係を
判定する処理である。付属成分に“up”“para”
“reset”の属性を与え、その属性により修飾関係
を決定する。それぞれの属性の意味は以下の通りであ
る。 up:対象とする拡張意味文節が修飾句であり、次の拡
張意味文節を修飾することを示す。 para:対象の拡張意味文節と次の拡張意味文節が同
じ関係であることを示す。両方の文節とも、修飾部か被
修飾部。 reset:対象の拡張意味文節と次の拡張意味文節に
は互いに修飾関係がないことを示す。
【0022】並列構文は、“para”属性に近いが、
これらの属性は2つの連続した拡張意味文節の関係しか
判定していない。属性辞書23には、これらの属性とそ
の付属成分が記述されており、それを参照しつつ処理を
行う。属性辞書23の例を図15に示す。また、2段階
の修飾関係を抽出する処理の流れを図16に示す。すべ
ての修飾関係を求める場合には、2段階処理で修飾部に
配置された拡張意味文節に対して同様な処理を再帰的に
行い、すべての修飾関係を決定する。係り受け解析の処
理は以上で終了する。
【0023】ステップS8で文章構造表示部3は2つの
係り受け解析部2の結果を利用し、文章の構造を陽に示
す処理を行う。文章構造表示部3ではデフォルトで2段
階の修飾関係の結果を利用して文章構造を表示する。ユ
−ザ−が指定することにより、多段階の修飾関係の表示
も可能である。2段階表示では、修飾部を左側に表示
し、被修飾部を右側に表示する。その表示例を図17に
示す。さらに、多段階表示では、修飾部は被修飾部の左
側というル−ルに則り表示を行う。
【0024】
【発明の効果】本発明は以上説明したように、請求項1
では、文章解析装置が入力文章を文字種の切れ目と例外
用の辞書を用いて自立語と付属成分を認定し、前記付属
成分から名詞・動詞の品詞を判断する形態素解析部と、
前記形態素解析部により判断された品詞を用いて「の」
で結ばれた名詞を結合して一つの拡張意味文節を生成す
る処理を行うとともに、前記形態素解析部により判断さ
れた品詞を用いて、動詞の自立語の前方が「を」の付属
成分を持つ文節の場合、該文節をヲ格成分であるとして
該動詞の文節に対してヲ格成分を含めた形で拡張意味文
節を生成する文節拡張処理を行い、更に、前記処理によ
り生成された拡張意味文節を入力とし、少なくとも並列
構文判定用辞書と、ト格単語辞書とを用い、当該拡張意
味文節において並列構文の有無を判定する名詞句並列構
文判定処理を行い、そして、前記名詞句並列構文判定処
理の判定結果と、付属成分を属性辞書を参照することで
当該付属成分に与えられる少なくとも「アップ」「パ
ラ」「リセット」の拡張意味文節間の関係を判定する修
飾関係判定処理を行う係り受け解析部を有し、前記係り
受け解析部により全ての拡張意味文節に対して少なくと
も「アップ」「パラ」「リセット」の修飾関係を決定
し、前記決定された修飾関係に基づき文章の全ての拡張
意味文節を被修飾部と、修飾部という2種類に分け、被
修飾部を右側に表示し、修飾部を左側に表示する表示処
理部で表示することを特徴とすることで被修飾、修飾関
係を表示することにより判読しやすい文章の構造表示を
行う文章構造表示部とを備え、また、請求項2では、文
章構造解析装置において、文章構造解析装置の中の文書
構造表示部の処理動作が、各拡張意味文節の付属成分の
属性を取得し、文章の最後尾およびそれと並列構文をな
す拡張意味文節を被修飾部に入れ、スタックにも入れ、
スタックに入った該拡張意味文節より1個前の拡張意味
文節の属性を取得し、該属性が「アップ」である場合に
は、該拡張意味文節を修飾部に入れ、または、該属性が
パラ」である場合には、対象拡張意味文節を修飾部に
入れ、さらに、対象拡張意味文節と並列構文をなす拡張
意味文節を被修飾部に入れ、かつ、スタックにも入れ、
または、該属性が「リセット」である場合には、対象拡
張意味文節を修飾部に入れ、スタックに入った文節の1
個前の文節が無くなるまで、全ての拡張意味文節につい
て被修飾部と修飾部という2種類に分ける処理を繰り返
し、さらに、被修飾部を右側に表示、修飾部を左側に表
示するようにし、また、請求項3では、文章構造解析装
置において、文章構造表示部の処理動作が、請求項2に
記載の全ての拡張意味文節について被修飾部と修飾部と
いう2種類に分ける処理により得られた修飾部を構成し
ている句を入力として、修飾部を構成している句の中の
係り受け関係を解析し、修飾部と被修飾部に分けること
により、被修飾部と修飾部を2段階以上の多段階で表示
するようにしたので、従来技術と異なり、大規模な単語
辞書を使用せず、ユ−ザ−の必要とする文章構造を得る
だけの処理を選択的に処理することができ、処理時間が
短く、処理精度の高い利点がある。そして、本発明で
は、アップだけでなく、パラ(並列)とリセット(修飾
関係をリセットする)との属性を導入することにより、
単純に階段上ではなく、左側に、文章の枝葉(つまり、
比較的重要ではない部分)を表示し、右側に、文章の幹
(つまり、文章での重要な要旨)部分を表示することが
可能となる。また、本発明では、文章の幹、つまり、重
要な部分だけを速読する場合では、図17の右側の部
分、すなわち、被修飾部に分類された文節だけを読め
ば、対象とする文章の要旨だけを短時間に読むことが可
能となる。また、表示における上下は、解析対象の文章
の流れが、上から下であることを示しており、文章を読
む場合、上から下に順に読んでいけば、1つの文章にな
る。
【図面の簡単な説明】
【図1】本発明を説明するためのブロック図である。
【図2】本発明の形態素解析と係り受け解析の処理の流
れを示すフロ−チャ−トである。
【図3】単語認定用辞書の一部を示す図である。
【図4】文例を示す図である。
【図5】文例を示す図である。
【図6】文例を示す図である
【図7】文例を示す図である
【図8】名詞判定用辞書の一部を示す図である。
【図9】動詞判定用辞書の一部を示す図である。
【図10】文例を示す図である。
【図11】並列構文判定用辞書の一部を示す図である。
【図12】ト格単語辞書の一部を示す図である。
【図13】文例を示す図である。
【図14】文例を示す図である。
【図15】属性辞書の一部を示す図である。
【図16】修飾関係判定処理の詳細な処理の流れを示す
フロ−チャ−トである。
【図17】文章構造表示部の表示結果を示す図である。
【符号の説明】
1 形態素解析部 2 係り受け解析部 3 文章構造表示部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/20 - 17/28 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力文章を文字種の切れ目と例外用の辞
    書を用いて自立語と付属成分を認定し、 前記付属成分から名詞・動詞の品詞を判断する形態素解
    析部と、 前記形態素解析部により判断された品詞を用いて「の」
    で結ばれた名詞を結合して一つの拡張意味文節を生成す
    る処理を行うとともに前記形態素解析部により判断され
    た品詞を用いて、動詞の自立語の前方が「を」の付属成
    分を持つ文節の場合、該文節をヲ格成分であるとして該
    動詞の文節に対してヲ格成分を含めた形で拡張意味文節
    を生成する文節拡張処理を行い、 更に 前記処理により生成された拡張意味文節を入力と
    し、少なくとも並列構文判定用辞書と、ト格単語辞書と
    を用い、当該拡張意味文節において並列構文の有無を判
    定する名詞句並列構文判定処理を行い、 そして、 前記名詞句並列構文判定処理の判定結果と、付
    属成分を属性辞書を参照することで当該付属成分に与え
    られる少なくとも「アップ」「パラ」「リセット」の拡
    張意味文節間の関係を判定する修飾関係判定処理を行う
    係り受け解析部を有し、 前記係り受け解析部により全ての拡張意味文節に対して
    修飾関係を決定し、 前記決定された少なくとも「アップ」「パラ」「リセッ
    ト」の修飾関係に基づき文章の全ての拡張意味文節を被
    修飾部と、修飾部という2種類に分け、被修飾部を右側
    に表示し、修飾部を左側に表示する表示処理部で表示す
    ることを特徴とすることで被修飾、修飾関係を表示する
    ことにより判読しやすい文章の構造表示を行う文章構造
    表示部とを備えたことを特徴とする文章構造解析装置。
  2. 【請求項2】 請求項1記載の文章構造解析装置におい
    て、文章構造解析装置の中の文書構造表示部の処理動作
    が、 各拡張意味文節の付属成分の属性を取得し、 文章の最後尾およびそれと並列構文をなす拡張意味文節
    を被修飾部に入れ、かつ、スタックにも入れ、 スタックに入った該拡張意味文節より1個前の拡張意味
    文節の属性を取得し、該属性が「アップ」である場合に
    は、該拡張意味文節を修飾部に入れ、 または、該属性が「パラ」である場合には、対象拡張意
    味文節を修飾部に入れ、さらに、対象拡張意味文節と並
    列構文をなす拡張意味文節を被修飾部に入れ、かつ、ス
    タックにも入れ、 または、該属性が「リセット」である場合には、対象拡
    張意味文節を修飾部に入れ、 スタックに入った文節の1個前の文節が無くなるまで、
    全ての拡張意味文節について被修飾部と修飾部という2
    種類に分ける処理を繰り返し、 さらに、 被修飾部を右側に表示、修飾部を左側に表示する、 ことを特徴とする文書構造解析装置。
  3. 【請求項3】 請求項2記載の文章構造解析装置におい
    て、文章構造表示部の処理動作が、 請求項2に記載の全ての拡張意味文節について被修飾部
    と修飾部という2種類に分ける処理により得られた修飾
    部を構成している句を入力として、 修飾部を構成している句の中の係り受け関係を解析し、 修飾部と被修飾部に分けることにより、 被修飾部と修飾部を2段階以上の多段階で表示すること
    を特徴とする文章構造解析装置。
JP03341791A 1991-02-04 1991-02-04 文章構造解析装置 Expired - Lifetime JP3216725B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03341791A JP3216725B2 (ja) 1991-02-04 1991-02-04 文章構造解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03341791A JP3216725B2 (ja) 1991-02-04 1991-02-04 文章構造解析装置

Publications (2)

Publication Number Publication Date
JPH04248671A JPH04248671A (ja) 1992-09-04
JP3216725B2 true JP3216725B2 (ja) 2001-10-09

Family

ID=12386000

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03341791A Expired - Lifetime JP3216725B2 (ja) 1991-02-04 1991-02-04 文章構造解析装置

Country Status (1)

Country Link
JP (1) JP3216725B2 (ja)

Also Published As

Publication number Publication date
JPH04248671A (ja) 1992-09-04

Similar Documents

Publication Publication Date Title
US5745602A (en) Automatic method of selecting multi-word key phrases from a document
KR100359265B1 (ko) 텍스트 프로세서
US4994967A (en) Information retrieval system with means for analyzing undefined words in a natural language inquiry
JP3372532B2 (ja) 感情情報抽出方法および感情情報抽出プログラムの計算機読み取り可能な記録媒体
JP5231698B2 (ja) 日本語の表意文字の読み方を予測する方法
JP2001084250A (ja) 膨大な文書データからの知識抽出方法、その装置及び媒体
US11436278B2 (en) Database creation apparatus and search system
JP4361299B2 (ja) 評価表現抽出装置、プログラム、及び記憶媒体
JP3216725B2 (ja) 文章構造解析装置
JPH1139313A (ja) 文書自動分類システム、文書分類向け知識ベース生成方法及びそのプログラムを記録した記録媒体
JP2002073644A (ja) 重要文抽出処理装置、重要文抽出処理方法、および重要文抽出処理プログラムを格納したコンピュータ読み取り可能な記憶媒体
JP2001060199A (ja) 文書分類装置、文書分類方法および文書分類プログラムを格納したコンピュータ読取り可能な記録媒体
JP5326781B2 (ja) 抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム
JPH0619968A (ja) 専門用語自動抽出装置
JPH09185632A (ja) 情報検索・編集方法及び装置
JP2812511B2 (ja) キーワード抽出装置
JPH11344998A (ja) 読み韻律情報設定方法及び装置及び読み韻律情報設定プログラムを格納した記憶媒体
JP2004206659A (ja) 読み情報決定方法及び装置及びプログラム
JP2002366556A (ja) 情報検索方法
JPH0773200A (ja) キーワード抽出方法
JP2000090110A (ja) 全文検索方法、装置、および全文検索プログラムを記録した記録媒体
JPH0477857A (ja) 不適切表現検出装置
JP3363636B2 (ja) 音声合成に関わるアクセント制御装置及び方法
JP3001334B2 (ja) 認識用言語処理装置
JP2001142876A (ja) 漢字検索システム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070803

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080803

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080803

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090803

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090803

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100803

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100803

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110803

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110803

Year of fee payment: 10