JPH04157567A

JPH04157567A - 文脈構造表示装置

Info

Publication number: JPH04157567A
Application number: JP2281971A
Authority: JP
Inventors: Kazuhiro Kimura; 和広木村; Kenji Ono; 顕司小野; Kazuo Sumita; 一男住田
Original assignee: Agency of Industrial Science and Technology
Current assignee: National Institute of Advanced Industrial Science and Technology AIST
Priority date: 1990-10-22
Filing date: 1990-10-22
Publication date: 1992-05-29

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

［発明の目的］（産業上の利用分野）本発明は文章の論理的構造を解析し、その文脈構造を視
覚的に表示する二とで文章の作成・編集を効果的に支援
することのできる文脈構造表示装置に関する。（従来の技術）近年、アウトラインプロセッサ、或いはアイディアプロ
セッサと称される文書編集装置が種々開発され、次第に
普及しつつある。この種の装置は、メモ書き程度に書き
留められた文章のフラグ明確に指示されることから、こ
の構造についての情報を用いて上述した如く体系的に纏
め上げた文章の構造を視覚的に表示することができる。これ故、利用者としては、装置が提示する文章構造をモ
ニタすることにより、その文章についての構成法の再検
討や文章修正（構造変更）等を容易に行うことが可能と
なる。然し乍ら、一般的には必ずしも上述したような構造化支
援手段を用いながら文章を作成するとは限らず、通常の
ワードプロセッサなどを用いて文章作成することが多い
と考えられる。このようにしてワードプロセッサを用い
て文章を作成した場合、その文章からは構造に関する情
報が明示的に与えられない。従って前述した構造化支援
手段を用いた時のように文章の構造を表示する為には、
何らかの手法を用いて文章を解析して、その文章構造を
抽出することが必要となる。さてこのような文章構造の抽出の手法の１つに、例えば
文章の形態的情報である章・節番号、改行。字下げ、下線１強調文字などを求め、これらの形−Ｔ二
！！Ｌｒな情報に基づいて、表題などの書誌的事項、−
所細章立てを抽出する手法が提唱されている。ニー崎１・のｊうな手法を用いれば、文章全体の見掛は上の一
階層的構造を求めることができるので、これを文諭旨の
展開の仕方や、段落間の論理的な繋がりなどの精密な文
章構造である、所謂文脈構造については利用者に示すこ
とができない。また当然のことながら章立てのない文章
に対しては、その文章構造を示すことができないと云う
問題がある。（発明が解決しようとする課題）このように従来にあっては、ワードプロセッサ等を用い
て作成された一般的な文章については、例えば章立て等
の形態的な情報に基づいて書誌的事項を求めているだけ
なので、その文章の文脈構造を利用者に提示することが
できないと云う問題があった。本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、文章の内容を解析してその文章
の論理的な構造である文脈構造を明らかにし、この文脈
構造を分かり易く利用者に提示することのできる文脈構
造表示装置を提供することにある。［発明の構成コ承部とを具備し、文章を構成する複数の文を、前記単文解析部にて１文毎
に解析して少なくともその構文情報を求め、その解析結
果と当該文の前記文章における出現順序の情報とを文情
報管理部に保存する。そしてこの文情報管理部に記憶さ
れた情報に従って前記文脈構造解析部にて前記文章の大
間または段落間の関係を解析してその関係名を推定し、
前記文脈構造表示部では前記文脈構造解析部にて推定さ
れた関係名に対応した所定の配置規則に基づいて、前記
文章を構成する複数の文または段落と、これらの間の関
係名とを所定の空間上に展開配置し、木彫状または箱形
状にイメージ化して表示するようにしたことを特徴とす
るものである。（作　用）本発明によれば、与えられた文章の内容を解析してその
文章の論理的な構造を明らかにし、これを上記文章の文
脈構造として利用者に提示するので、アウトラインプロ
セッサ等の文章の構造化の思考過程を反映したものであ
り、また文や段落等の論理的な繋がりを表現したもので
ある。従って利用者は、提示された文脈構造を見ること
によりその文章の論理的構造を容易に、且つ適確に確認
することが可能となり、この文脈構造を再検討すること
でより明確で論旨の通った文章に容易に校正・編集する
ことが可能となる。（実施例）以下、図面を参照して本発明の一実施例に係る文脈構造
表示装置について説明する。第１図は実施例装置の全体的な構成を示す図であり、大
略的には単文解析部１１文情報管理部２゜文脈構造解析
部３．および文脈構造表示部４を具備して構成される。単文解析部１は文脈構造の解析対象となる文章を入力し
、その文章を構成する複数の文を１文毎に解析処理して
その構文構造を求めるもので、基本的には書式整形部１
１．形態素解析部１２．構文解析部１３を備えて構成さ
れる。上記書式整形部１１は、例えばＪＩＳ漢字コードる。形
態素解析部１２は上記書式整形部１１にて分離された複
数の文を１分づつ形態素解析し、その形態素解析結果を
保持するものである。このような形態素解析部１２によ
る各文の形態素解析結果を得て、前記構文解析部１３は
各文についての大まかな構文構造の抽出処理を実行する
。この構文解析部１３にて行われる構文構造の抽８処理
は、例えば複文の判定とその分割、主文の述部とその表
層路および格フィラー（以下タームと呼ぶ）の決定、お
よび各ターム内の等位接続関係の抽出等を行うことによ
り実行される。このようにして単文解析部１にて求められた各文につい
ての構文情報は、文情報管理部２に転送される。そして
前記文章中における文の出現順序の情報である文番号２
１が付され、文番号２１と構文解析結果２２とからなる
データフォーマットの情報として文情報管理部２に保持
・管理される。尚、前述した構文解析において複文として判定された文
については、その時点で複数の文に分割されているので
、それぞれ独立の文番号２１と構文解析結果２２とを持
つ。果２２に対して、その文中に現れている接続詞や接続詞
相当の語句をピックアップ抽出し、その文の前文との接
続関係を決定するものである。このようにしてピックア
ップすべき語（以下クルーワードと呼ぶ）については、
例えば第２図にその一部を抽出して示すように５つのフ
ィールド項目からなるデータとして与えられる。この第２図に示す例では、文頭制約を示すフィールド項
目３ａ、語の読みを示すフィールド項目３ｂ。クルーワードを示すフィールド項目３ｅ、品詞（列）を
示すフィールド項目３ｄ、そして接続関係分類を示すフ
ィールド項目３ｅの計５つのフィールド項目情報として
与えられる。上記フィールド項目３ａの文頭制約は［０コまたは［１
］の数値として与えられ、［０］であるときはその語の
出現が文頭でなければならないことを示している。また
［１］であるときはその語の出現が文中のどこであって
も良いことを示している。更には上記フィールド項目３
ｃ、或いはフィールド項目３ｂ中に示されるストリンク
の最後に句点［。コが付された場合には、そのストリン
グの出ちなみにこれらの制約を満たさない場合には、そ
の語の出現は無視されることになる。尚、文中に引用部分（引用文）がある場合には、その中
はクルーワード抽出の対象外とする。従って引用部分の
中に文が幾つ含まれていても、それらの全体は１ターム
（１名詞）扱いとなり、それらの相互の接続関係、およ
び主文との（接続）関係は無視されることになる。この
ことは、所謂埋込み文についても同様である。また文章を構成する複数の文の中には、例えば［それば
かりではない。］や［即ち、こうである。］等のように、形式的には１文でありながら内容的には
１つの接続詞に相当するような文もある。前者は接続詞［更にコと同等であり、後者は［即ち］と
同等である。従ってこのような接続詞に相当するような
文（慣用的接続詞相当文）については、これを接続詞相
当大としてそのまま抽出するようにすれば良い。しかしてクルーワードの抽出（ピックアップ）処理を行
った後には、その文についての接続関係えばピックアッ
プされた複数の藷が同じ接続関係名に類しているときは
、その接続関係名をその文の接続関係名として認定する
。しかし複数の語にマツチングする接続関係名が異なり
、その一方が文頭に出現している場合には、文頭に出現
した語についての接続関係名を優先して採用する。しか
しその両者がそれぞれ文中での出現である場合には、例
えば文末に近いほうの語についての接続関係名を優先し
て採用する。更には、成る文字列が複数のクルーワード
にマツチングするときには、長いほうの語を優先させて
その接続関係名を決定するようにすれば良い。また前述した形態素解析結果が一意でない部分や、誤解
析が生じた場合を想定して、ここでは１１語も抽出でき
ないような場合には、その文についての係名として［ε
］を割り当てる。の基本的な機構は前記関係抽出部３１と同様であるが、
クルーワードについての情報が若干異なる。第３図は属性抽出処理に用いられるクルーワーついての
情報は、第３図（ａ）　（ｂ）　（ｃ）としてそれぞれ
示すように３つのタイプに分類される。第３図（ａ）に示す第１のタイプ＃１は文の形態、ミ・５゜＝１景）文・事実文をそれぞれを抽出する為のもの、そして
第３図（Ｃ）に示す第３のタイプ＃３は動詞の時制やそ
の相を決定する為のものである。また属性抽出部３２では上述したクルーワードの抽出と
は別に、各文の１節の述語（その文の最後の文節に含ま
れる動詞相当語）の原形（終止形）。および付属語（付属語の全体）をそれぞれ抽出する。尚、各タイプのクルーワードが１つも抽出できないよう
な場合には、例えば上述した第１のタイプ＃１の属性名
として［現在］を付与する。また「宣言文」については
第２のタイプ＃２の属性名として、また「事実文」につ
いては第３のタイプまた前記語分布解析部３３は、前述
した構文解析結果２２に対して同じ語（名詞、動詞）が
どのように複数の文やタームに渡って分布しているかを
調べ、その調査結果（分布の情報）を保持するものであ
る。以上のように文脈構造解析部３は、上述した関係抽出部
３１．属性抽出部３２１語分布解析部３３をそれぞれ駆
動した後、これらの各部の出力である処理結果を統合し
て、例えば以下に示すような形式％式％］尚、上記文番号は処理対象とする文章から分離抽出され
た複数の文のそれぞれに対して、前記文情報管理部２で
割り当てられた数字を示しており、一般的には文章中で
の文の８現順序に従ってその文番号か付与される。また
上記処理結果中に示される関係名は前記各文について前
述した関係抽ａ部３１にてそれぞれ抽出された関係名で
ある。この関係名は、例えば第４図に示すように背景文
にっの関係名の抽出、属性の抽出１語分布の解析を行っ
た文脈構造解析部３は、次にこれらの情報に従って前記
文章に対する構造候補の生成と、構造規則の適用とを同
期的に行いながら文脈構造を構築する。以下に、この構造候補の生成処理と構造規則の適用処理
とについて、その詳細を説明する。構造候補の生成は基本的には次のようにして行われる。上述したように文章を構成する複数の文１或いは複数の
バラグラフについての系列は、以下に示すような形式で
表現される。［Ｉ　Ｒ１２Ｒ２３・＝　　−＝　Ｆｉｎ−Ｉ　Ｎ　］
但し、上記数値［１，２，・・・、Ｎ］は前述した各文
にそれぞれ対応する文番号であり、［Ｒ１，Ｒ２゜・、
　Ｒｎ−１］は又聞の接続関係を示す関係名をそれぞれ
示している。しかして文章の構造候補は上述した文番号［１゜２、・
・・、Ｎ］をそれぞれ終端ノードとし、また上述した関
係名［Ｒ１，Ｒ２，・・・、　Ｒｎ−１１をそれぞれ候
補はＮ個の終端ノードからなる２分木構造として構築可
能な全ての構造として求められる。但し、この２分木構
造からなる構造候補の生成は、例えば左側のノードの接
続関係を示す、左構造のバリエーションを優先しながら
生成する。具体的には、４つの文（文番号）［１，２，３゜４］に
ついて、それらの又聞の接続関係が関係名［’ａ、ｂ、
ｃコ　として［１ａ２ｂ８ｃ４］として与えられるような場合、次のようにしてその構造
候補を生成する。構造候補１；　　［［［１ａ２コｂ３］ｃ４コ構造候補
２；　　［［ｌａ［２ｂ３コ］ｃ４］構造候補３；　　
［［ｌａ２コｂ［３ｃ４ココ構造候補４；　　［１ａ［
［２ｂ３コｃ４］コ構造候補５；　　［ｌａ［２ｂ［３
ｃ４コ］コこのようにして生成される構造候補の数は、
その系列中の文の数ｎに対するカタラン数として、以下
の漸化式にて定義される。ｐ　（ＩＩ）　１　Σ　ｐ　（楓）　＊　ｐ　（ｉ−ｋ
ｌ　　＋従って構造候補の数が徒に多くなることを避け
るべく、ここではその構造上で特定の接続関係。或いは同じグループに属する接続関係が２つ以上隣接し
ているような構造候補があるような場合、それらの間の
構造化は行わないことにする。このような構造化から除
外するグループは、例えば次のような７つの接続関係と
する。 ■　［ｃｈｏｕｆ’ｕｋｕ　（三）］ ■　　［ｄｏｕｒｅｔｓｕ　（＝　）’］■　　［ａｐ
ｐｅｎｄ　　　（ａｐ）］■　　［ｈｅｉｒｅｔｓｕ　
（＋　）］うにして行われる。尚、ここでは又聞の接続
関係については、その関係名を前述した第４図に示した
簡略記号を用いて表現する。例えば５つの文からなる文章の文の系列か［１＋　２　
ａｐ　３　＋　４　ａｐ　５　］として与えられた場合
、その構造候補は、候補１　　［［［［１＋２　］　ａ
ｐ　３　］　＋　４　］　ａｐ　５　］候補２　　［［
［１＋　［２ａｐ　３　］　］　＋　４　］　ａｐ　５
　］候補３　　［［［１＋　２１　ａｐ　［３＋　４コ
］　ａｐ　５　］候補４　　［［１＋　［［２ａｐ　３
　］　＋　４１　］　ａｐ　５　］候補５　　［［１＋
　［２ａｐ［３＋　４　］コココミル５コ候補６　　［
［［１＋　２　］　ａｐ　３　］　＋［４ａｐ　５　］
　］候補　７　　　　［［１＋　　［２ａｐ　　３　　
コ　］　　＋　　Ｃ４ａｐ　　５　　コ　］候補８　　
［［１＋　２　］　ａｐ　［［３＋　４　］　ａｐ　５
　］　Ｅ候補９　　［［１＋２コａｐ　［３＋　［４ａ
ｐ　５　］］コ候補ｉｏ　　［１＋　［［［２ａｐ　３
　］　十＋４］　ａｐ　５　］　］候補１１　　［１＋
　［［２ａｐ　［，３＋　４］］　ａｐ　５コ］候補１
２　　［１＋　［［２ａｐ　３　］　＋　［４ａｐ　５
　］　］　］候補１３　［１斗［２ａｐ　［Ｅ　’ａ　
＋　４　］　ａｐ　５　］　］　］候補１４　　［１＋
　［２ａｐ　［３＋　Ｃ４ａｐ　５　］　］　］　］［
［Ａ＋Ｂ］＋Ｃ］、　　［＾　＋　［Ｂ　　＋　　Ｃ］
　　］なる形式となっていることが分かる。このような
接続関係の部分については、これを構造化せず、以下の
形式で単純に表現する。［Ａ　　　十　　Ｂ　　　＋　　　Ｃ１従って上述した
候補２．候補４については、それぞれ［［１＋　　［２ａｐ　　　３　　　］　　　＋　　　
４　　　］　　　ａｐ　　　５　　　］としてまとめら
れることになる。同様にして候補７、候補１２について
も［１＋　　ｌ：　　２　　ａｐ　　３　　］　　＋　　
［ｔ　　ａｐ　　５　　コ　コとしてまとめることがで
き、更に候補３と候補８については［［１＋　　２　　］　　ａｐ　　［３＋　　４　　コ
　ａｐ　　５　　］として、更に候補１１と候補１３に
ついては［１＋　　［２ａｐ　　［３十　４　　］　　
ａｐ　　５　　コ　］としてそれぞれまとめ、その接続
関係を縮約することができる。従ってこの文の系列につ
いての構造候補としては、全体として１０個求められる
ことになる。れた各種の構文パターンが含まれているか否か、また構
文パターンが含まれている場合には、その構造中のどこ
に含まれているかをチエツクすることにより実現される
。しかして構造候補の中から検出すべき構文パターンは、
［１，・・・、Ｎ−１，Ｎ、　　Ｎ＋ｌ、　　・・・１
Ｍコをそれぞれノード（文）とし、Ｅ　Ｒａ、　Ｒｂ、
−、Ｒ１゜Ｒ２，−、Ｒｎ−１，Ｒｎ、　Ｒｎ＋１．−
］をノード（文）間の接続関係としたとき、［・・　　　　　　　・・・］を任意の構造部分、 υ・・　　［コ　　・・・　コをそれぞれ左括弧１右括弧の１個以上の並びを示すもの
とし、旦つ［・・・コ、Ａ、Ｂ、Ｃ，・・・を１文、または括弧内の右括弧および左括弧が同じよう
な部分構造であるとした場合、次のように定義される。Ｃｐｏｐ型規則ｌ］［・・・　　　Ｒａ　　　　Ｎ　　　　コ　　　　Ｉ？
ｂ　　　　・・・　コ但し、接続関係ＲｃとＲｄとの組
は、第５図におい但し、接続関係ＲｅとＲｒとの組は、
第５図においてｎなる関係を持つ組とする。（ｐｕｓｈ型規則２　（ｎｏ−ｐｏｐ型規則２）】［・
・・　Ｒｇ　　［・・・［［Ｎ＋Ｉ　　Ｒｈ　　・・・
］但し、接続関係ＲｇとＲｈとの組は、第５図において
ｎなる関係を持つ組とする。

【オーダリング規則】

［−１ｓｔ　　　　　　［［−・・　コ　　　　Ｒｎ　
　　　　［−１Ｒｎ＋１〜　［・・・Ｉ　　Ｒｍ　　［
・・・］］・・・］但し、Ｒｎ、・・・、　Ｒｍは前述
した構造化を行わない接続関係２ｎｄ、　３ｒｄ、　　
（４ｔｈ、−’）　、　ｎｅｘｔ、　１ａｓｔのいずれ
かであり、以下の規則を満たすものである。 ■　ｎｅｘｔ型以外の接続関係については、その系列に
含まれていたとしても高々１つだけである。 ■　２ｎｄ型の接続関係は、必ず３ｒｄ型の接続関係よ
りも先に出現する。（３ｒｄ型の接続関係は４ｔｈ型の
接続関係よりも必す先に出現する。）■　１ａｓｔ型の
接続関係か含まれるときは、その接続関係Ｒｎ＋は必す
その系列の最後に出現する。

【接続詞相当文に関する規則１】Ｌ−Ｒｎ−１［Ｎ　　　８Ｎ＋１　　］−］但し、Ｎは
接続詞相当のフラグか立っている文である。

【接続詞相当文に関する規則２】［・・・　　　Ｒｎ−１［Ｎ　　　　　Ｅ　　　　　［
・　　］　　コ　　・・　コ［−Ｒｎ−１［Ｎ　　１ｓ
ｔ　　　［−１］＝コ但し、Ｎは接続詞相当のフラグが
立っている文である。

【述語規則】

［・・・　Ｎ−Ｉ　　Ｒｎ−４［・・・［Ｎ　　Ｒｎ　　・・　Ｍ　］・・］Ｒｍ　　
Ｍ＋１　　・・・］但し、Ｎ、・・・１Ｍは前述した語分布解析部３３にお
ける語分布解析で同じ述語を持っていると判定された文
の系列である。後述する関数ｆを用いて表現するならばｆ　（Ｎ−１，述語）≠ｆ　（Ｎ、述語）−ｆ（Ｍ、述
語） ≠ｆ　（Ｍ＋１．述語）の部分を構造Ｂとしたとき、ｆ　（Ａ、語）ｌ’ｊ　ｆ　（Ｂ、語）≠φなる関係を
有する文である。ここで上述した関数ｆは次のように再帰的に定義される
関数である。ｆ　（Ｎ、語）−（文Ｎの語（の識別子））そしてこの
間数ｆは、整合部分構造を引き数（ａｒｇｕＩＩｌｅｎ
ｔ）とする語または語の集合を値として、例えば次のよ
うにそれぞれ定義される。ｆ（［Ａ　　ｂｉ　　Ｂ］、語）−ｆ（Ａ、語）ｆ（［
Ａｄｅｆ’Ｂコ２語）−ｆ（Ａ、語）ｆ（［Ａ　　ｈｌ
　　Ｂ］、語）−ｆ（Ａ、語）ｆ（［Ａ−Ｂ］２語）−
ｆ（Ａ、語）ｆ（［Ａ−８１８語）−ｆ（Ａ、語）ｆ（［Ａ　　Ｖ　　Ｂ］、語）−ｆ（Ａ、語）ｆ（［Ａ
　　−Ｂｌ、語）−’ｆ（Ｂ、語）ｆ（［Ａ　　Ｘ　　
Ｂ］、語）　−ｆ　（Ｂ、語）ｆ（［Ａ　　−Ｂ］、語
）−ｆ（Ｂ、語）ｆ（［Ａ　　＃　　Ｂ］、語）−ｆ（
Ａ、語）ｆ　（［Ａ　　ｒｑ　　Ｂ］、語）−ｆ（Ａ、
語）されている。また並列関係にある文の系列はｆ（［Ａ＋Ｂ　　＋　・・・　＋　Ｚ］、語）−−ｆ　
（［Ａ　２ｎｄ　　Ｂ　　３ｒｄ　　−１ａｓｔ　Ｚ］
、　藷）−ｆ（［Ａ　　−Ｂ　　−・・・　−ｚ］、語
）−ｆ（［Ａ　　　　Ｅ　　　　　Ｂ　　　　　三　　
　　・・・　　　　三　　　　Ｚ］、　　　語　）−ｆ
　　　（［Ａ　　　　ａｐ　　　Ｂ　　　　ａｐ−ａｐ
　　　Ｚ　　コ　、　　語）−ｆ（［Ａ　　／　　Ｂ　
　／　　・・・　／　２３１語）−ｆ（［Ａ　　ＥＢ　
　ε　・・・　ε　Ｚ］、語）−ｆ（［Ａ］、語）ｆ（
［８３１語）　・・・・・・　　　　ｆ（［Ｚ　　コ　
　５　　語）なる関係をそれぞれ有する。

【語の分布に関する規則２】反復語ａＬ）・・・ａｊ）・・・ａｒｃ）の各々に対し
て［・・・［・・・［Ｎ・・・Ｍ］・・・コ・・・コな
る文の系列の下線を付した［・・・［Ｎ　・・・　Ｍ］
・・・コなる部分が整合するときａｔ）　　　　ｆ（Ｎ、語）ａｉ）　　　　ｆ（Ｍ、語）なる関係かあるとする。但し、文Ｎは語ａｉ）で示

【語
の分布に関する規則２】は、複数の文にまたがって分布
しているとして前記語分布解析部３３にて解析された、
述語や語０語の識別子毎にそれぞれ適用される。この外、この構造規則の適用を行うに際しては、次のよ
うな関数ｆが定義される。［ｆ　（整合構造部分１文）】この間数ｆはｆ（文Ｍ　、文）−ｉＭ（数字））であること以外は、ｆ　（文１語）と同様に定義される
ものである。［ｃｏｕｎｔ　（整合部分構造）】この関数は、与えられた整合部分構造中の右結合数を返
す関数である。具体的にはこのｃｏｕｎｔ（整合部分構
造）は、例えばｃｏｕｎｔ（［［［［ｌ　　Ｒ１２コ　Ｒ２３］　　Ｒ
３４］　　Ｒ４５］）−０ｃｏｕｎｔ（［Ｉ　　Ｒ１［
２Ｒ２［［３Ｒ３４］　　Ｒ４５コ］］）−２ｃｏｕｎ
ｔ（［Ｉ　Ｒ１［２Ｒ２Ｃ３Ｒ３［：４　Ｒ４５］］］
］）−３等として与えられる。前述した如く解析された文章を構成する複数の文の系列
に対して、以上のような構造候補の生成処理と、構造規
則の適用を繰り返すことにより、その文章についての文
脈構造の候補が生成される。そして生成されたこれらの文脈構造の候補に対し−３、
前述した構造規則を組み合わせて定義される：゛評価関
数を適用し、その結果（評価点）を元に、二上位数個の
構造候補を得れば、これを前記文脈構造解析部３の出力
として求めることが可能となる。しかしてこの文脈構造解析部３からの出力（構・造候補
）は、又聞の関わりを示す［、コなる記号、文番号、関
係名（略号）からなる記号列として与えられる。従って
、例えばその出力として［［１２コ　→　［３＋４＋５
１　　］なる文脈構造候補が求められた場合、１文１の
例示として文２があり、また文３と文４と文５とがそれ
ぞれ並列の関係にある」ことが表現される。そして更に１文１と文２とが前提となって、文３と文４
と文５が帰結されている」ことが示される。さて前述した文脈構造表示部４は、上述した如く機能す
る前記文脈構造解析部３の出力結果である文脈構造、或
いは指定された１つの文脈構造を入力し、これを図の表
現に変換してイメージ化し、これを利用者に提示する。この際、利用者からの指示に従い、例えば ■　段落内構造（指定された段落の構造を表示）■　段
落間構造（段落間の構造を表示）■　全体（章全体）として選択的にその構造を表現する。、文脈構造のイメージ化による表示の形式としては、こ
こでは、例えば ■　木形式 ■　箱形式の２種類をメニュー選択可能となっている。尚、イメー
ジ化した文脈構造が表示ウィンドウに入りきらないよう
な場合には、適宜スクロール機能が用いられる。しかして木形式で文脈構造をイメージ化する場合には、
前記文脈構造解析部３の出力結果を、例えば第６図に示
すような図としてイメージ化する。この第６図に示す例は、［［１−［２＋３−１−４　　コ　］　口　５］なる文
脈構造の図変換（イメージ化）を示している。尚、この変換例においては、文脈構造として図示される
文については、文番号と共に表層の文である、漢字かな
混じり文を表示するようになっている。またここでは前
記文情報管理部２が文番号に対応して、その構文解析結
果と共に保持している表層の文の文字列を参照すること
で、各文の表示を行っている。但し、この実施例では表層の文を全て表示しているが、
文が長くて１文全体を表示することが適すリたけを表示
し、残りについてはピリオド等の特定の文字列で省略表
示するようにしても良い。またその全てを表示しないよ
うに構成することも可能であり、文番号のみを表示する
ように構成しても良い。またこの実施例では、文脈構造として図示される関係名
の記号を第４図に示した表に従って［順接］、〔並列コ
等の記号の名前（関係名）に変換して表示している。然
し乍ら、関係名を表示することに代えてその記号をその
まま表示したり、その記号か意味する代表的な文言例で
表示するように構成することも勿論可能である。例えば
［順接］の代わりに［−］なる記号や、［従って］と云
う文字列でその関係を表示するようにすれば良く、その
実現は容易である。また解析された文脈構造を箱形式で表示する場合には、
例えば以下に定義する関係名のグループ分けに応じて、
個々の文を表現する箱の配置を決定してその表示を行う
ようにすれば良い。具体的にはそのグループ分けを次の
ようにする。縦　型；　　（−、Ｘ、　−、ＩＳｔ　、口）−。右上型；　　ｉｈｌ、　　＃、　ｒｑ、※）［［［１ｂ
ｉ　　２］　　＋　　［［３−＝　　４］　　※　　５
］］−６コで与えられる場合、その箱形式表示は第７図
に示すようになる。この第７図に示す例では文番号や、
又聞の関係名を示す記号をそのまま表示しているが、前
述した第６図で示したように、実際の文を表示するよう
に構成できることは云うまでもない。また文番号部分をマウスクリックする等して、利用者の
要求により適宜文を表示するように構成するようにして
も良い。また文章全体の文脈構造の木形式でイメージ化して表示
する場合には、例えば第８図に示すようにすれば良い。但し、この第８図に示す例では、その段落番号をローマ
数字で、また文番号を英数字で表示している。またこの
例は、前述した第６図に示した例とは別の木形式で表示
を行った例でもある。その他、本発明はその要旨を逸脱
しない範囲で種々変形して実施することができる。〔発明の効果コ以上説明したように本発明によれば、特殊なアウトライ
ンプロセッサ等の文章の構造化を支援する装置を使用し
て作成された文章でなくとも、：その文章の内容を解析
し、文章の論理的な構造を・明らかにし、これを文脈構
造として利用者に提示（することかできる。しかして文
脈構造はその文章作成者の思考過程を反映したものであ
り、文や段落等の論理的な繋がりを表現したものである
から、利用者は提示された文脈構造を見ることにより、
その文章の論理的構造や文章の流れ、思考の流れといっ
たものを容易に確認することができ、これを再検討する
ことでより明確で論旨の通った文章に容易に、且つ効率
的に構成・編集することが可能となる。特に本発明においては文脈上での文の役割（関係名）に
応じて、その文脈構造を表示する位置に特徴をもたせて
いる。例えば箱型式で文脈構造を表示す゛る場合には、
論理の進行を示す関係が縦方向に、また同値的な関係を
横方向に配置している。また背景的な文／段落を左上に、強調的な文／段落を右
上に配置してその特徴付を行っている。この結果、例え
ば左上の鞘部分が肥大しているような構造であれば、そ
の背景説明が非常に多い文章であると容易に把握するこ
とが可能となる。このように本発明によれば、イメージ
化されて表示される文脈構造を一見しただけで、その全
体の文章

【図面の簡単な説明】

図は本発明の一実施例に係る文脈構造表示装置について
示すもので、第１図は実施例装置の全体構成を示す図、第２図は関係
抽出部が参照するクルーワード情報の例を示す図、第３
図は属性抽出部が参照するクルーワード情報の例を示す
図、第４図は文もしくは段落間の関係を表す記号の例を
示す図、第５図は文脈構造構成規則を示す図、第６図は
文脈構造の本形式での表示例を示す図、第７図は文脈構
造の箱形式での表示例を示す図、第８図は文章全体の文
脈構造の表示例を示す図である。 ■・・・単文解析部、　２・・・文情報管理部、３・・
・文脈構造解析部、４・・文脈構造表示部、１１・・・
書式整形部、１２・・・形態素解析部、１３・・・構文
解析部、２１・・・文番号、２２・・・構文解析結果、
３１・・・関係抽出部、３２・・・属性抽出部、３３・
・・語分布解析部、３ａ・・・文頭制約、３ｂ・・・読
み、３Ｃ・・・クルーワード、３ｄ・・・品詞、８ｅ・
・・関係名。出願人　工業技術院長　松浦　賢第１図第２図第５図第７図第８図

Claims

【特許請求の範囲】

文章を構成する複数の文を１文毎に解析して少なくとも
その構文情報を求める単文解析部と、この単文解析部に
よる文の解析結果と当該文の前記文章における出現順序
の情報とを記憶する文情報管理部と、この文情報管理部
に記憶された情報に従って前記文章の文間または段落間
の関係を解析してその関係名を推定する文脈構造解析部
と、この文脈構造解析部にて推定された関係名に対応し
た所定の配置規則に基づいて前記文章を構成する各文ま
たは段落と前記関係名とを所定の空間上に展開配置し、
木形状または箱形状にイメージ化して表示する文脈構造
表示部とを具備したことを特徴とする文脈構造表示装置
。