JPH0468464A - 文章構造解析装置 - Google Patents

文章構造解析装置

Info

Publication number
JPH0468464A
JPH0468464A JP2180696A JP18069690A JPH0468464A JP H0468464 A JPH0468464 A JP H0468464A JP 2180696 A JP2180696 A JP 2180696A JP 18069690 A JP18069690 A JP 18069690A JP H0468464 A JPH0468464 A JP H0468464A
Authority
JP
Japan
Prior art keywords
sentence
sentences
type
analysis
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2180696A
Other languages
English (en)
Other versions
JPH0711801B2 (ja
Inventor
Junichi Fukumoto
淳一 福本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
Agency of Industrial Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency of Industrial Science and Technology filed Critical Agency of Industrial Science and Technology
Priority to JP2180696A priority Critical patent/JPH0711801B2/ja
Publication of JPH0468464A publication Critical patent/JPH0468464A/ja
Publication of JPH0711801B2 publication Critical patent/JPH0711801B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文章の要約等に利用され、文章中の各文の接
続間1系や文のタイプなとの言語的情報を用いて文章の
構造の解析を行う文章構造解析装置に関するものである
(従来の技術) 従来、この種の分野の技術としては、文献1ニアj炎話
理解モテルとその応用」シンポジウム(1989〜11
)情報処理学会、「日本語テキスト理解における文脈構
造抽出法J木下、小野、浮田、大野、P、125−13
6、文献2; 「自然言語処理技術」シンポジウム(1
988−1>情報処理学会、「文脈処理J達弁P、75
−87に記載規則を制約として記述しておき、その制約
によって文章構造の解析を行っている。
また、上記文献2に記載さh7′、−文脈構造の解析方
法は、文のタイプを文の言語的情報から決定し、そのタ
イプ間の関係を規則として2述しておき、それぞれを用
いることで文章構造を捉えていく手法である。
(発明が解決しようとする課題) しかしながら、上記のような文脈構造の解析方法を用い
る文章構造解析装置では、実間の接続詞等の情報の少な
い文章において、その文章構造を解析した場合、接続詞
等のない部分の実間の関係を正確に捉えることができず
、その結果として文章全体の構造を解析することが困難
になるという問題があった。
さらに、文のタイプのみを用いて文章構造を解析する場
合、そのタイプは文の文末表現のみから決定されること
から、これだけでは文末表現の連銀形態を文章構造とし
て扱うことになるため文章の構造としては不十分なもの
であった。
本発明は前記従来技術の持っていた課題として、文章全
体の構造を正確に解析することが困難であ章を文節レベ
ルて゛分割する文解析部と、前記文解析部により分割さ
れた入力文章中の各文の支間関係を解析する文脈解析部
とを、備えた文章構造解析装置において、前記文脈解析
部は、前記各文より接続表現情報を抽出する接続表現抽
出手段と、前記各文の文タイプを解析する文タイプ解析
手段と、前記各文の文タイプを抽出する文タイプ解析手
段と、前記接続表現抽出手段の抽出結果、前記文タイプ
解析手段の解析結果及び文タイプ解析手段の抽出結果に
基づき、前記各文の支間関係を解析する大間関係解析手
段とで、構成したものである。
(作用) 本発明は、以上のように文章構造解析装置を構成したの
で、大間関係解析手段は、接続表現抽出手段により抽出
された接続詞等の接続表現情報、文タイプ解析手段によ
り解析された文タイプ、文タイプ解析手段により抽出さ
れた主属情報を組み合すせて用い、文章中の各文の又聞
関1系をより正確に解析する。これにより、正、確な文
章の構造を得ることか可能となる5 したがって、前記課題を解決できるのである。
合等に陸用され、解析対象の文章を入力するイメージス
キャナ等の文章入力部50と、文章入力部30の出力側
に接続され文章中の各文の文節レベルまでの形態素の解
析を行う文解析部51とを、備えている。形態素の解析
とは、文を構成する基本単位である単語や述語より小さ
い単位である形態素(活用語尾、接頭語や接尾語など〉
を解析して単語の認定を行うことをいう。
文解析部31の出力側には、文解析部51により分割さ
れた各文の支間関係を解析する文脈解析部52と、文章
中の各実間において決定された又聞関1系を用いて文章
の構造の表示を行うプリンタやデイスプレィ等の文章構
造出力部53とが、順次接続されている。
文脈解析部32は、コンピュータにより構成され、文解
析部ヲ1により分割された文章中の各文よつ接続詞や接
続助詞等の接続表現情報を抽出する接続表現抽出手段5
2aと、前記各文の文タイプを解析する文タイプ解析手
段52bとを有している。ここで、文タイプとしては、
7問い掛は文」主題情報を抽出する文タイプ解析手段3
2Cと、接続表現抽出手段52aの抽出結果、文タイプ
解析手段ヲ2bの解析結果及び文タイプ解析手段52c
の抽出結果に組み合わせて用い、文章構造を決めるため
の各文の支間関係を解析する大間関係解析手段52dと
で、構成されている。
ここで、支間関係としては、「補足」、「転換」−展開
」、7前提J、「原因理由」、「並列」「累加1、「継
続」、「逆説」、及び「例示」がある。
第2図〜第5図を参照しつつ、第1図の動作を説明する
まず、文章入力部ジOより解析対象となる文章を光電変
換して入力する。文解析部51において、入力された文
章中の各文を形態素レベルまでの解析を行った後、この
解析結果である解析対象文の解析データを大間関係解析
手段52dへ出力する。
又聞関1系解析手段52dは、接続表現抽出手段52a
、文タイプ解析手段52b、及び文タイプ解析手段部の
付属情報と動詞の種類の情報を用い、第2図に示すよう
にして文タイプ解析が行われる。第2図は、文タイプ解
析手段52bの動作を示すフローチャートであり、文間
関係を解析するために必要となる文章中の各文の文タイ
プの解析を示すものである。なお、叙述文以外のタイプ
の文に対しては、メタタイプ(上位ターイブ)として主
張文というタイプ分類を行う9 文タイプ解析が開始されると(ステップ60)、ます、
文末表現が「が−1で終わる疑問文になっているか否か
が判定される。その判定結果がイエスであれば、その文
の文タイプを問い掛は文と決定する(ステップ62)。
ノーであれば、文末表現が「たい」で終わるが、または
主動詞が逐行動詞の行為指導型の動詞であるかが判定さ
れる(ステップ63)。そこで、判定結果がイエスであ
れば、文タイプを要望文としくステップ64〉、ノーで
あれば、主動詞が逐行動詞の陳述表示型の評定タイプの
動詞であるかが判定される(ステップ65)。その判定
結果が、イエスであれば、文タイプを(ステップ”68
)、ノーて°あれば、文末表現が−だろう−1で終わる
推量形になっているか否かが判定される(ステップ69
〉。その判定結果が、イエスであれば、文クイズを推量
文とする(ステップ70)。ノーであれば、文末表現が
Fからた」や「ためだ」で終わる形になっているか否か
が判定される(ステップ71)。
さらに、ステップ71の判定結果がイエスて′あれば、
文タイプを理由文としくステップ72)、ノーであれば
、文末表現が「である」、「だJで終わる断定的表現に
なっているか否かが判定される(ステップ73)。判定
結果が、イエスであれば、文タイプを断定文とする(ス
テップ74〉。
ノーであれば、文のタイプを叙述文とする(ステップ7
5)。そして、ステップ62〜ステツプ74の判定がな
されると、文のメタタイプを主張文として(ステップ7
6)、文タイプ解析が終了する(ステップ77)。
一方、文タイプ解析手段52cでは、各文の文節におい
て、付属語として主題提示語である「は」等を取るもの
の抽出を行う6 以上の接続表現抽出手段32a、文クイズ解析手段52
b、及び文タイプ解析手段52cにおいて抽出または解
析された情報に基つき、又聞関1系解析手段52dにお
いて、第3図(a)〜(e>に示すようにして、又聞関
1系の解析か行われる。
第3図(a)〜(e)は、又聞関1系解析を示すフロー
チャートであり、同図(a>は文章中の各文の文間関係
を決定するための全体の動作を示すフローチャート同図
(b)は大間の関係を解析するために選択された2文の
内の前文の文のメタタイプが主張文で、それに続く文の
タイプが叙述文であった場合の文間関係を決定するため
のフローチャート、同図(c)は大間の関係を解析する
ために選択された2文の内の前文の文のタイプが叙述文
で、それに続く文のメタタイプが主張文であった場合の
文間関係を決定するためのフローチャート、同図(d)
は大間の関係を解析するために選択された2文の文のメ
タタイプか共に主張文であった場合の文間関係を決定す
るためのフローチャート、同図(e)は大間の関1系を
解析するために選択された2文の文のタイプが共に叙述
文であった場合の支間関係を決定するためのフローチャ
ートである5 第3図(a>において、支間関係の解析が開始されると
くステップ80)、まず、文章中の1文係を逆接とする
(ステップ8B>。ノーであれば、Bが例示を示す副詞
(=例えばヨ等)をとるが否かを判定する(ステップ8
4)。判定結果が、イエスであれば、支間関係を例示と
する(ステップ85)。
ステップ85の判定結果がノーであれば、Aの文のメタ
タイプが主張文で、Bの文のタイプが叙述文であるか否
かを判定する(ステップ86)。
その判定結果がイエスであれば、結合子(1)に進む(
ステップ87)。ノーであれば、Aの文のタイプが叙述
文で、Bの文のタイプか主張文て°あるか否かを判定す
る(ステップ゛88)。判定結果かイエスであれば、結
合子(2)に進む(ステップ89)。ノーであれば、A
の文のメタタイプか主張文で、Bの文のメタタイプか主
張文であるか否かを判定する(ステップ90>。その判
定結果がイエスであれば、結合子(3〉に進む(ステッ
プ91)。ノーであれば、Aの文のタイプが叙述文で、
Bの文のタイプが叙述文であるか否かを判定する(ステ
・ツブ92〉。その判定結果かイエスであれば、結合子
(4〉に進む(ステップ93)。
であれば、ステップ81に戻る。
第3図(b)において、結合子(1)のステップ87に
続き、叙述文の指示語によって主張文の内容指示を行っ
ているか否かを判定する(ステップ87a)。その判定
結果がイエスであれば、又聞関1系を補足とする(ステ
ップ゛87b)。ノーて。
あれば、叙述文において口は」によって新たな主題提示
が行われているか否かを判定する(ステ・ツブ87c)
。判定結果が、イエスであれば、支間関係を転換とする
(ステップ87d)。ノーであれば、又聞関1系を補足
とする(ステップ87e)。
そして、ステップ87b、87d、87eにおける決定
が行われると、前文の文のメタタイプが主張文で、それ
に続く文のタイプが叙述文であった場合の支間関係の解
析は終了する(ステップ87f)。
第3図(c>において、結合子(2)のステップ89に
続き、主張文の指示語によって叙述文の内容指示を行っ
ているか否かを判定する(ステップ89a)。判定結果
がイエスであれば、又聞関。その判定結果が、イエスで
あれば、支間関係を展開とする(ステップ89d)。ノ
ーであれば、主張文のタイプか意見文または要望文か否
かを判定する(ステ・ノブ89e)、その判定結果か、
イエスであれば、又聞関1系そ前提とする(ステップ8
9f)。ノーであれば、主張文のタイプか理由文である
か否かを判定する(ステップ89g)。
イエスであれば、支間関係を原因理由としくステップ8
9h)、ノーであれば、支間関係を補足とする(ステッ
プ89j)。そして、ステップ89b、89d、89f
、89h、89iにおける決定か行われると、前文の文
のタイプか叙述文で、それに続く文のメタタイプが主張
文であった場合の支間関係の解析は終了する(ステップ
89j)。
第3図(d)において、結合子(3)のステップ91に
続き、AとBが同じタイプの文であるか否かを判定する
(ステップ91a〉。その判定結果がイエスであれば、
支間関係を並列とする(ステップ91b)。ノーであれ
ば、Aが意見文でBが判断文であるか否かを判定する(
ステップ91C)。その判定結果が、イエスであれば、
支間関係を累加とする(ステップ91d)。ノーであれ
は、Aか推量たてBか断定文であるが否かを判定結果が
、イエスであれば、又聞関1系を原因理由とする(ステ
ップ91h)。ノーであれば、大間関係を補足とする(
ステップ911〉。そして、ステップ91b、91d、
91f、91h、91iにおける決定が行われると、2
文の文のメタタイプが共に主張文であった場合の大間関
係の解析か終了する(ステップ91j)。
第3図(e)において、結合子(4)のステップ93に
続き、叙述文人中の指示語によって叙述文B文の内容指
示を行っているか否かを判定する(ステップ93a〉。
その判定結果がイエスであれば、大間関係を補足とする
(ステップ93b)。
ノーであれば、叙述文Bにおいて新たな主題提示が行わ
れないか否かを判定する(ステップ93c)。その判定
結果が、イエスであれば、又聞関1系を継続とする(ス
テップ93d〉。ノーて’アrLL’、又聞関1系を補
足とする(ステップ93f〉。そして、ステップ93b
、93d、93’eにおける決定が行われると、2文の
文のタイプが共に叙述文であった場合の又聞関1系の解
析が終了する(ステップ93f)。
以上の又聞関1系の解析結果が第4図(a)。
う。解析された文章構造の一例を第5図に示す。
その文章構造が文章構造出力部53から出力される。
本発明は、次のような利点を有している。
(1)文章構造を決定する際、従来技術では、接続詞等
による大間の修辞関係や文の文末表現のみから決定され
る文のタイプ間の関係のみでは正しい文章構造を決める
ことができなかった。これに対して、本発明では、筆者
がどの様な主張を行っているかという観点から文章中の
各文について文のタイプを分類し、それらの各タイプ間
の大間の接続関係、接続詞による修辞関係および各文で
話題になっている事柄である主題情報を組み合わせて用
いるようにしたので、より正確な文章構造を決定するこ
とができる。
(2)−転換」関係で結ばれた部分で文章を切るように
したので、文章をいくつかのまとまりに分割することが
でき、その中の文で主張文のタイプを持つものを抜き出
すことで、文章全体を読まなくとも文章の大まかな流れ
を読み取ることが可能(イ)上記実施例の文タイプを、
「問い掛は文」、「要望文」、「判断文」、「意見文」
 「推量文」、「理由文」、「断定文」及び「叙述文」
に分類しへたが、本発明の趣旨に沿ったものであれば、
これに限定されない。
(ロ)上記実施例では、大間関係を、「補足J、転換2
、−展開4、−前提ヨ、「原因理由」、:並列」、:累
力旧、7継続J、7逆説J、及び−例示Jとした力板本
発明の趣旨に沿ったものて′あれば、これに限定されな
い。
(発明の効果) 以上詳細に説明したように、本発明によれば、文章中の
各文より、接続表現情報の抽出、文タイプの解析、主題
情報の抽出を行い、それら抽出された接続表現情報、解
析された文タイプ、及び主題情報を用いて、各文の大間
関係を解析するようにしたので、文章中に接続詞等の修
辞関係の情報が少ない文章でも正しく大間関係が解析で
き、正確な文章の構造を得ることが可能である。
【図面の簡単な説明】
(a)、(b)、(c)は大間関係の解析結果を示す図
、第5図は解析された文章信造の一例を示す図である。 50・・・・・・文章入力部、ラド・・・・・文解析部
、52・・・・・・文脈解析部、32a・・・・・・接
続表現抽出手段、ヲ2b・・・・・・文タイプ解析手段
、32c・・・・・・文タイプ解析手段、52d・・・
・・・大間関係解析手段、53・・・・・・文章構造出
力部。 出願人  工業技術院長  杉油 賢 図面の浄書 52・ 文脈解析部 本発明の実3色′関 究1図 Cつ μ) す 解析さ机右文章携迄のり」 蝉5図 C) 手続主甫正書(方式) %式% 事件の表示 平成2年特許願第180696号 2゜ 発明の名称 文章構造解析装置 3゜ 補正をする者 事件との関係

Claims (1)

  1. 【特許請求の範囲】 入力文章を文節レベルで分割する文解析部と、前記文解
    析部により分割された入力文章中の各文の文間関係を解
    析する文脈解析部とを、備えた文章構造解析装置におい
    て、 前記文脈解析部は、 前記各文より接続表現情報を抽出する接続表現抽出手段
    と、 前記各文の文タイプを解析する文タイプ解析手段と、 前記各文より主題情報を抽出する主題抽出手段と、 前記接続表現抽出手段の抽出結果、前記文タイプ解析手
    段の解析結果及び主題抽出手段の抽出結果に基づき、前
    記各文の文間関係を解析する文間関係解析手段とで、 構成したことを特徴とする文章構造解析装置。
JP2180696A 1990-07-10 1990-07-10 文章構造解析装置 Expired - Lifetime JPH0711801B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2180696A JPH0711801B2 (ja) 1990-07-10 1990-07-10 文章構造解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2180696A JPH0711801B2 (ja) 1990-07-10 1990-07-10 文章構造解析装置

Publications (2)

Publication Number Publication Date
JPH0468464A true JPH0468464A (ja) 1992-03-04
JPH0711801B2 JPH0711801B2 (ja) 1995-02-08

Family

ID=16087710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2180696A Expired - Lifetime JPH0711801B2 (ja) 1990-07-10 1990-07-10 文章構造解析装置

Country Status (1)

Country Link
JP (1) JPH0711801B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09319768A (ja) * 1996-05-29 1997-12-12 Oki Electric Ind Co Ltd 要点抽出方法
JP2005228075A (ja) * 2004-02-13 2005-08-25 Institute Of Physical & Chemical Research 日常言語プログラム処理システム、その方法および修辞構造解析方法
KR102379830B1 (ko) * 2020-10-08 2022-03-29 주식회사 서감도 문장의 흐름을 시각적으로 구분되도록 표현하여 문맥파악을 용이하게 하는 시각처리장치 및 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7610190B2 (en) * 2003-10-15 2009-10-27 Fuji Xerox Co., Ltd. Systems and methods for hybrid text summarization

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09319768A (ja) * 1996-05-29 1997-12-12 Oki Electric Ind Co Ltd 要点抽出方法
JP2005228075A (ja) * 2004-02-13 2005-08-25 Institute Of Physical & Chemical Research 日常言語プログラム処理システム、その方法および修辞構造解析方法
KR102379830B1 (ko) * 2020-10-08 2022-03-29 주식회사 서감도 문장의 흐름을 시각적으로 구분되도록 표현하여 문맥파악을 용이하게 하는 시각처리장치 및 방법

Also Published As

Publication number Publication date
JPH0711801B2 (ja) 1995-02-08

Similar Documents

Publication Publication Date Title
Al‐Sughaiyer et al. Arabic morphological analysis techniques: A comprehensive survey
Lewis Representation and learning in information retrieval
Fagan Experiments in automatic phrase indexing for document retrieval: A comparison of syntactic and nonsyntactic methods
US8265925B2 (en) Method and apparatus for textual exploration discovery
US20080040339A1 (en) Learning question paraphrases from log data
US10540442B2 (en) Evaluating temporal relevance in question answering
US6941513B2 (en) System and method for text structuring and text generation
Atwell How to detect grammatical errors in a text without parsing it
Hoch Using IR techniques for text classification in document analysis
Kasper FEATURE STRUCTURES: A LOGICAL THEORY WITH APPLICATION TO LANGUAGE ANALYSIS (SYSTEMICS, LINGUISTICS, GRAMMAR)
Pollard Strong generative capacity in HPSG
WO2002089004A2 (en) Search data management
Hassel Evaluation of automatic text summarization
Almotairi et al. Developing a Semantic Question Answering System for E-Learning Environments Using Linguistic Resources.
JPH0468464A (ja) 文章構造解析装置
Metzler et al. Constituent object parsing for information retrieval and similar text processing problems
Xu Exploration of English Composition Diagnosis System Based on Rule Matching.
Mery et al. Computing the semantics of plurals and massive entities using many-sorted types
Daniels Retrieval of passages for information reduction
Hmeidi Design and implementation of automatic word and phrase indexing for information retrieval with Arabic documents
Bagga Coreference, cross-document coreference, and information extraction methodologies
EP1460562A1 (en) Computerized method and system for searching for text passages from text documents
JP4098764B2 (ja) 文書処理装置及びプログラム
Hatzivassiloglou Automatic acquisition of lexical semantic knowledge from large corpora: the identification of semantically related words, markedness, polarity, and antonymy
Johnson An Analyzer for the Information Content of Sentences (Semantics)

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term