JPH04157567A - 文脈構造表示装置 - Google Patents

文脈構造表示装置

Info

Publication number
JPH04157567A
JPH04157567A JP2281971A JP28197190A JPH04157567A JP H04157567 A JPH04157567 A JP H04157567A JP 2281971 A JP2281971 A JP 2281971A JP 28197190 A JP28197190 A JP 28197190A JP H04157567 A JPH04157567 A JP H04157567A
Authority
JP
Japan
Prior art keywords
sentence
word
context structure
sentences
context
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2281971A
Other languages
English (en)
Inventor
Kazuhiro Kimura
和広 木村
Kenji Ono
顕司 小野
Kazuo Sumita
一男 住田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
Agency of Industrial Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency of Industrial Science and Technology filed Critical Agency of Industrial Science and Technology
Priority to JP2281971A priority Critical patent/JPH04157567A/ja
Publication of JPH04157567A publication Critical patent/JPH04157567A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
[発明の目的] (産業上の利用分野) 本発明は文章の論理的構造を解析し、その文脈構造を視
覚的に表示する二とで文章の作成・編集を効果的に支援
することのできる文脈構造表示装置に関する。 (従来の技術) 近年、アウトラインプロセッサ、或いはアイディアプロ
セッサと称される文書編集装置が種々開発され、次第に
普及しつつある。この種の装置は、メモ書き程度に書き
留められた文章のフラグ明確に指示されることから、こ
の構造についての情報を用いて上述した如く体系的に纏
め上げた文章の構造を視覚的に表示することができる。 これ故、利用者としては、装置が提示する文章構造をモ
ニタすることにより、その文章についての構成法の再検
討や文章修正(構造変更)等を容易に行うことが可能と
なる。 然し乍ら、一般的には必ずしも上述したような構造化支
援手段を用いながら文章を作成するとは限らず、通常の
ワードプロセッサなどを用いて文章作成することが多い
と考えられる。このようにしてワードプロセッサを用い
て文章を作成した場合、その文章からは構造に関する情
報が明示的に与えられない。従って前述した構造化支援
手段を用いた時のように文章の構造を表示する為には、
何らかの手法を用いて文章を解析して、その文章構造を
抽出することが必要となる。 さてこのような文章構造の抽出の手法の1つに、例えば
文章の形態的情報である章・節番号、改行。 字下げ、下線1強調文字などを求め、これらの形−T二
!!Lrな情報に基づいて、表題などの書誌的事項、−
所細章立てを抽出する手法が提唱されている。ニー崎 1・のjうな手法を用いれば、文章全体の見掛は上の一
階層的構造を求めることができるので、これを文諭旨の
展開の仕方や、段落間の論理的な繋がりなどの精密な文
章構造である、所謂文脈構造については利用者に示すこ
とができない。また当然のことながら章立てのない文章
に対しては、その文章構造を示すことができないと云う
問題がある。 (発明が解決しようとする課題) このように従来にあっては、ワードプロセッサ等を用い
て作成された一般的な文章については、例えば章立て等
の形態的な情報に基づいて書誌的事項を求めているだけ
なので、その文章の文脈構造を利用者に提示することが
できないと云う問題があった。 本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、文章の内容を解析してその文章
の論理的な構造である文脈構造を明らかにし、この文脈
構造を分かり易く利用者に提示することのできる文脈構
造表示装置を提供することにある。 [発明の構成コ 承部とを具備し、 文章を構成する複数の文を、前記単文解析部にて1文毎
に解析して少なくともその構文情報を求め、その解析結
果と当該文の前記文章における出現順序の情報とを文情
報管理部に保存する。そしてこの文情報管理部に記憶さ
れた情報に従って前記文脈構造解析部にて前記文章の大
間または段落間の関係を解析してその関係名を推定し、
前記文脈構造表示部では前記文脈構造解析部にて推定さ
れた関係名に対応した所定の配置規則に基づいて、前記
文章を構成する複数の文または段落と、これらの間の関
係名とを所定の空間上に展開配置し、木彫状または箱形
状にイメージ化して表示するようにしたことを特徴とす
るものである。 (作 用) 本発明によれば、与えられた文章の内容を解析してその
文章の論理的な構造を明らかにし、これを上記文章の文
脈構造として利用者に提示するので、アウトラインプロ
セッサ等の文章の構造化の思考過程を反映したものであ
り、また文や段落等の論理的な繋がりを表現したもので
ある。従って利用者は、提示された文脈構造を見ること
によりその文章の論理的構造を容易に、且つ適確に確認
することが可能となり、この文脈構造を再検討すること
でより明確で論旨の通った文章に容易に校正・編集する
ことが可能となる。 (実施例) 以下、図面を参照して本発明の一実施例に係る文脈構造
表示装置について説明する。 第1図は実施例装置の全体的な構成を示す図であり、大
略的には単文解析部11文情報管理部2゜文脈構造解析
部3.および文脈構造表示部4を具備して構成される。 単文解析部1は文脈構造の解析対象となる文章を入力し
、その文章を構成する複数の文を1文毎に解析処理して
その構文構造を求めるもので、基本的には書式整形部1
1.形態素解析部12.構文解析部13を備えて構成さ
れる。 上記書式整形部11は、例えばJIS漢字コードる。形
態素解析部12は上記書式整形部11にて分離された複
数の文を1分づつ形態素解析し、その形態素解析結果を
保持するものである。このような形態素解析部12によ
る各文の形態素解析結果を得て、前記構文解析部13は
各文についての大まかな構文構造の抽出処理を実行する
。この構文解析部13にて行われる構文構造の抽8処理
は、例えば複文の判定とその分割、主文の述部とその表
層路および格フィラー(以下タームと呼ぶ)の決定、お
よび各ターム内の等位接続関係の抽出等を行うことによ
り実行される。 このようにして単文解析部1にて求められた各文につい
ての構文情報は、文情報管理部2に転送される。そして
前記文章中における文の出現順序の情報である文番号2
1が付され、文番号21と構文解析結果22とからなる
データフォーマットの情報として文情報管理部2に保持
・管理される。 尚、前述した構文解析において複文として判定された文
については、その時点で複数の文に分割されているので
、それぞれ独立の文番号21と構文解析結果22とを持
つ。 果22に対して、その文中に現れている接続詞や接続詞
相当の語句をピックアップ抽出し、その文の前文との接
続関係を決定するものである。このようにしてピックア
ップすべき語(以下クルーワードと呼ぶ)については、
例えば第2図にその一部を抽出して示すように5つのフ
ィールド項目からなるデータとして与えられる。 この第2図に示す例では、文頭制約を示すフィールド項
目3a、語の読みを示すフィールド項目3b。 クルーワードを示すフィールド項目3e、品詞(列)を
示すフィールド項目3d、そして接続関係分類を示すフ
ィールド項目3eの計5つのフィールド項目情報として
与えられる。 上記フィールド項目3aの文頭制約は[0コまたは[1
]の数値として与えられ、[0]であるときはその語の
出現が文頭でなければならないことを示している。また
[1]であるときはその語の出現が文中のどこであって
も良いことを示している。更には上記フィールド項目3
c、或いはフィールド項目3b中に示されるストリンク
の最後に句点[。コが付された場合には、そのストリン
グの出ちなみにこれらの制約を満たさない場合には、そ
の語の出現は無視されることになる。 尚、文中に引用部分(引用文)がある場合には、その中
はクルーワード抽出の対象外とする。従って引用部分の
中に文が幾つ含まれていても、それらの全体は1ターム
(1名詞)扱いとなり、それらの相互の接続関係、およ
び主文との(接続)関係は無視されることになる。この
ことは、所謂埋込み文についても同様である。 また文章を構成する複数の文の中には、例えば[それば
かりではない。]や[即ち、こうである。 ]等のように、形式的には1文でありながら内容的には
1つの接続詞に相当するような文もある。 前者は接続詞[更にコと同等であり、後者は[即ち]と
同等である。従ってこのような接続詞に相当するような
文(慣用的接続詞相当文)については、これを接続詞相
当大としてそのまま抽出するようにすれば良い。 しかしてクルーワードの抽出(ピックアップ)処理を行
った後には、その文についての接続関係えばピックアッ
プされた複数の藷が同じ接続関係名に類しているときは
、その接続関係名をその文の接続関係名として認定する
。しかし複数の語にマツチングする接続関係名が異なり
、その一方が文頭に出現している場合には、文頭に出現
した語についての接続関係名を優先して採用する。しか
しその両者がそれぞれ文中での出現である場合には、例
えば文末に近いほうの語についての接続関係名を優先し
て採用する。更には、成る文字列が複数のクルーワード
にマツチングするときには、長いほうの語を優先させて
その接続関係名を決定するようにすれば良い。 また前述した形態素解析結果が一意でない部分や、誤解
析が生じた場合を想定して、ここでは11語も抽出でき
ないような場合には、その文についての係名として[ε
]を割り当てる。 の基本的な機構は前記関係抽出部31と同様であるが、
クルーワードについての情報が若干異なる。 第3図は属性抽出処理に用いられるクルーワーついての
情報は、第3図(a) (b) (c)としてそれぞれ
示すように3つのタイプに分類される。 第3図(a)に示す第1のタイプ#1は文の形態、ミ・ 5゜ =1 景)文・事実文をそれぞれを抽出する為のもの、そして
第3図(C)に示す第3のタイプ#3は動詞の時制やそ
の相を決定する為のものである。 また属性抽出部32では上述したクルーワードの抽出と
は別に、各文の1節の述語(その文の最後の文節に含ま
れる動詞相当語)の原形(終止形)。 および付属語(付属語の全体)をそれぞれ抽出する。 尚、各タイプのクルーワードが1つも抽出できないよう
な場合には、例えば上述した第1のタイプ#1の属性名
として[現在]を付与する。また「宣言文」については
第2のタイプ#2の属性名として、また「事実文」につ
いては第3のタイプまた前記語分布解析部33は、前述
した構文解析結果22に対して同じ語(名詞、動詞)が
どのように複数の文やタームに渡って分布しているかを
調べ、その調査結果(分布の情報)を保持するものであ
る。 以上のように文脈構造解析部3は、上述した関係抽出部
31.属性抽出部321語分布解析部33をそれぞれ駆
動した後、これらの各部の出力である処理結果を統合し
て、例えば以下に示すような形式%式% ] 尚、上記文番号は処理対象とする文章から分離抽出され
た複数の文のそれぞれに対して、前記文情報管理部2で
割り当てられた数字を示しており、一般的には文章中で
の文の8現順序に従ってその文番号か付与される。また
上記処理結果中に示される関係名は前記各文について前
述した関係抽a部31にてそれぞれ抽出された関係名で
ある。この関係名は、例えば第4図に示すように背景文
にっの関係名の抽出、属性の抽出1語分布の解析を行っ
た文脈構造解析部3は、次にこれらの情報に従って前記
文章に対する構造候補の生成と、構造規則の適用とを同
期的に行いながら文脈構造を構築する。 以下に、この構造候補の生成処理と構造規則の適用処理
とについて、その詳細を説明する。 構造候補の生成は基本的には次のようにして行われる。 上述したように文章を構成する複数の文1或いは複数の
バラグラフについての系列は、以下に示すような形式で
表現される。 [I R12R23・=  −= Fin−I N ]
但し、上記数値[1,2,・・・、N]は前述した各文
にそれぞれ対応する文番号であり、[R1,R2゜・、
 Rn−1]は又聞の接続関係を示す関係名をそれぞれ
示している。 しかして文章の構造候補は上述した文番号[1゜2、・
・・、N]をそれぞれ終端ノードとし、また上述した関
係名[R1,R2,・・・、 Rn−11をそれぞれ候
補はN個の終端ノードからなる2分木構造として構築可
能な全ての構造として求められる。但し、この2分木構
造からなる構造候補の生成は、例えば左側のノードの接
続関係を示す、左構造のバリエーションを優先しながら
生成する。 具体的には、4つの文(文番号)[1,2,3゜4]に
ついて、それらの又聞の接続関係が関係名[’a、b、
cコ として [1a2b8c4] として与えられるような場合、次のようにしてその構造
候補を生成する。 構造候補1;  [[[1a2コb3]c4コ構造候補
2;  [[la[2b3コ]c4]構造候補3;  
[[la2コb[3c4ココ構造候補4;  [1a[
[2b3コc4]コ構造候補5;  [la[2b[3
c4コ]コこのようにして生成される構造候補の数は、
その系列中の文の数nに対するカタラン数として、以下
の漸化式にて定義される。 p (II) 1 Σ p (楓) * p (i−k
l  +従って構造候補の数が徒に多くなることを避け
るべく、ここではその構造上で特定の接続関係。 或いは同じグループに属する接続関係が2つ以上隣接し
ているような構造候補があるような場合、それらの間の
構造化は行わないことにする。このような構造化から除
外するグループは、例えば次のような7つの接続関係と
する。 ■ [chouf’uku (三)] ■  [douretsu (= )’]■  [ap
pend   (ap)]■  [heiretsu 
(+ )]うにして行われる。尚、ここでは又聞の接続
関係については、その関係名を前述した第4図に示した
簡略記号を用いて表現する。 例えば5つの文からなる文章の文の系列か[1+ 2 
ap 3 + 4 ap 5 ]として与えられた場合
、その構造候補は、候補1  [[[[1+2 ] a
p 3 ] + 4 ] ap 5 ]候補2  [[
[1+ [2ap 3 ] ] + 4 ] ap 5
 ]候補3  [[[1+ 21 ap [3+ 4コ
] ap 5 ]候補4  [[1+ [[2ap 3
 ] + 41 ] ap 5 ]候補5  [[1+
 [2ap[3+ 4 ]コココミル5コ候補6  [
[[1+ 2 ] ap 3 ] +[4ap 5 ]
 ]候補 7    [[1+  [2ap  3  
コ ]  +  C4ap  5  コ ]候補8  
[[1+ 2 ] ap [[3+ 4 ] ap 5
 ] E候補9  [[1+2コap [3+ [4a
p 5 ]]コ候補io  [1+ [[[2ap 3
 ] 十+4] ap 5 ] ]候補11  [1+
 [[2ap [,3+ 4]] ap 5コ]候補1
2  [1+ [[2ap 3 ] + [4ap 5
 ] ] ]候補13 [1斗[2ap [E ’a 
+ 4 ] ap 5 ] ] ]候補14  [1+
 [2ap [3+ C4ap 5 ] ] ] ][
[A+B]+C]、  [^ + [B  +  C]
  ]なる形式となっていることが分かる。このような
接続関係の部分については、これを構造化せず、以下の
形式で単純に表現する。 [A   十  B   +   C1従って上述した
候補2.候補4については、それぞれ [[1+  [2ap   3   ]   +   
4   ]   ap   5   ]としてまとめら
れることになる。同様にして候補7、候補12について
も [1+  l:  2  ap  3  ]  +  
[t  ap  5  コ コとしてまとめることがで
き、更に候補3と候補8については [[1+  2  ]  ap  [3+  4  コ
 ap  5  ]として、更に候補11と候補13に
ついては[1+  [2ap  [3十 4  ]  
ap  5  コ ]としてそれぞれまとめ、その接続
関係を縮約することができる。従ってこの文の系列につ
いての構造候補としては、全体として10個求められる
ことになる。 れた各種の構文パターンが含まれているか否か、また構
文パターンが含まれている場合には、その構造中のどこ
に含まれているかをチエツクすることにより実現される
。 しかして構造候補の中から検出すべき構文パターンは、
[1,・・・、N−1,N、  N+l、  ・・・1
Mコをそれぞれノード(文)とし、E Ra、 Rb、
−、R1゜R2,−、Rn−1,Rn、 Rn+1.−
]をノード(文)間の接続関係としたとき、 [・・       ・・・] を任意の構造部分、 υ・・  [コ  ・・・ コ をそれぞれ左括弧1右括弧の1個以上の並びを示すもの
とし、旦つ [・・・コ、A、B、C,・・・ を1文、または括弧内の右括弧および左括弧が同じよう
な部分構造であるとした場合、次のように定義される。 Cpop型規則l] [・・・   Ra    N    コ    I?
b    ・・・ コ但し、接続関係RcとRdとの組
は、第5図におい但し、接続関係ReとRrとの組は、
第5図においてnなる関係を持つ組とする。 (push型規則2 (no−pop型規則2)】[・
・・ Rg  [・・・[[N+I  Rh  ・・・
]但し、接続関係RgとRhとの組は、第5図において
nなる関係を持つ組とする。
【オーダリング規則】
[−1st      [[−・・ コ    Rn 
    [−1Rn+1〜 [・・・I  Rm  [
・・・]]・・・]但し、Rn、・・・、 Rmは前述
した構造化を行わない接続関係2nd、 3rd、  
(4th、−’) 、 next、 1astのいずれ
かであり、以下の規則を満たすものである。 ■ next型以外の接続関係については、その系列に
含まれていたとしても高々1つだけである。 ■ 2nd型の接続関係は、必ず3rd型の接続関係よ
りも先に出現する。(3rd型の接続関係は4th型の
接続関係よりも必す先に出現する。)■ 1ast型の
接続関係か含まれるときは、その接続関係Rn+は必す
その系列の最後に出現する。
【接続詞相当文に関する規則1】 L−Rn−1[N   8N+1  ]−]但し、Nは
接続詞相当のフラグか立っている文である。
【接続詞相当文に関する規則2】 [・・・   Rn−1[N     E     [
・  ]  コ  ・・ コ[−Rn−1[N  1s
t   [−1]=コ但し、Nは接続詞相当のフラグが
立っている文である。
【述語規則】
[・・・ N−I  Rn−4 [・・・[N  Rn  ・・ M ]・・]Rm  
M+1  ・・・] 但し、N、・・・1Mは前述した語分布解析部33にお
ける語分布解析で同じ述語を持っていると判定された文
の系列である。後述する関数fを用いて表現するならば f (N−1,述語)≠f (N、述語)−f(M、述
語) ≠f (M+1.述語) の部分を構造Bとしたとき、 f (A、語)l’j f (B、語)≠φなる関係を
有する文である。 ここで上述した関数fは次のように再帰的に定義される
関数である。 f (N、語)−(文Nの語(の識別子))そしてこの
間数fは、整合部分構造を引き数(arguIIlen
t)とする語または語の集合を値として、例えば次のよ
うにそれぞれ定義される。 f([A  bi  B]、語)−f(A、語)f([
Adef’Bコ2語)−f(A、語)f([A  hl
  B]、語)−f(A、語)f([A−B]2語)−
f(A、語) f([A−818語)−f(A、語) f([A  V  B]、語)−f(A、語)f([A
  −Bl、語)−’f(B、語)f([A  X  
B]、語) −f (B、語)f([A  −B]、語
)−f(B、語)f([A  #  B]、語)−f(
A、語)f ([A  rq  B]、語)−f(A、
語)されている。 また並列関係にある文の系列は f([A+B  + ・・・ + Z]、語)−−f 
([A 2nd  B  3rd  −1ast Z]
、 藷)−f([A  −B  −・・・ −z]、語
)−f([A    E     B     三  
  ・・・    三    Z]、   語 )−f
   ([A    ap   B    ap−ap
   Z  コ 、  語)−f([A  /  B 
 /  ・・・ / 231語)−f([A  EB 
 ε ・・・ ε Z]、語)−f([A]、語)f(
[831語) ・・・・・・    f([Z  コ 
 5  語)なる関係をそれぞれ有する。
【語の分布に関する規則2】 反復語aL)・・・aj)・・・arc)の各々に対し
て[・・・[・・・[N・・・M]・・・コ・・・コな
る文の系列の下線を付した[・・・[N ・・・ M]
・・・コなる部分が整合するとき at)    f(N、語) ai)    f(M、語) なる関係かあるとする。但し、文Nは語ai)で示
【語
の分布に関する規則2】は、複数の文にまたがって分布
しているとして前記語分布解析部33にて解析された、
述語や語0語の識別子毎にそれぞれ適用される。 この外、この構造規則の適用を行うに際しては、次のよ
うな関数fが定義される。 [f (整合構造部分1文)】 この間数fは f(文M 、文)−iM(数字)) であること以外は、f (文1語)と同様に定義される
ものである。 [count (整合部分構造)】 この関数は、与えられた整合部分構造中の右結合数を返
す関数である。具体的にはこのcount(整合部分構
造)は、例えば count([[[[l  R12コ R23]  R
34]  R45])−0count([I  R1[
2R2[[3R34]  R45コ]])−2coun
t([I R1[2R2C3R3[:4 R45]]]
])−3等として与えられる。 前述した如く解析された文章を構成する複数の文の系列
に対して、以上のような構造候補の生成処理と、構造規
則の適用を繰り返すことにより、その文章についての文
脈構造の候補が生成される。 そして生成されたこれらの文脈構造の候補に対し−3、
前述した構造規則を組み合わせて定義される:゛評価関
数を適用し、その結果(評価点)を元に、二上位数個の
構造候補を得れば、これを前記文脈構造解析部3の出力
として求めることが可能となる。 しかしてこの文脈構造解析部3からの出力(構・造候補
)は、又聞の関わりを示す[、コなる記号、文番号、関
係名(略号)からなる記号列として与えられる。従って
、例えばその出力として[[12コ → [3+4+5
1  ]なる文脈構造候補が求められた場合、1文1の
例示として文2があり、また文3と文4と文5とがそれ
ぞれ並列の関係にある」ことが表現される。 そして更に1文1と文2とが前提となって、文3と文4
と文5が帰結されている」ことが示される。 さて前述した文脈構造表示部4は、上述した如く機能す
る前記文脈構造解析部3の出力結果である文脈構造、或
いは指定された1つの文脈構造を入力し、これを図の表
現に変換してイメージ化し、これを利用者に提示する。 この際、利用者からの指示に従い、例えば ■ 段落内構造(指定された段落の構造を表示)■ 段
落間構造(段落間の構造を表示)■ 全体(章全体) として選択的にその構造を表現する。 、文脈構造のイメージ化による表示の形式としては、こ
こでは、例えば ■ 木形式 ■ 箱形式 の2種類をメニュー選択可能となっている。尚、イメー
ジ化した文脈構造が表示ウィンドウに入りきらないよう
な場合には、適宜スクロール機能が用いられる。 しかして木形式で文脈構造をイメージ化する場合には、
前記文脈構造解析部3の出力結果を、例えば第6図に示
すような図としてイメージ化する。 この第6図に示す例は、 [[1−[2+3−1−4  コ ] 口 5]なる文
脈構造の図変換(イメージ化)を示している。 尚、この変換例においては、文脈構造として図示される
文については、文番号と共に表層の文である、漢字かな
混じり文を表示するようになっている。またここでは前
記文情報管理部2が文番号に対応して、その構文解析結
果と共に保持している表層の文の文字列を参照すること
で、各文の表示を行っている。 但し、この実施例では表層の文を全て表示しているが、
文が長くて1文全体を表示することが適すリたけを表示
し、残りについてはピリオド等の特定の文字列で省略表
示するようにしても良い。またその全てを表示しないよ
うに構成することも可能であり、文番号のみを表示する
ように構成しても良い。 またこの実施例では、文脈構造として図示される関係名
の記号を第4図に示した表に従って[順接]、〔並列コ
等の記号の名前(関係名)に変換して表示している。然
し乍ら、関係名を表示することに代えてその記号をその
まま表示したり、その記号か意味する代表的な文言例で
表示するように構成することも勿論可能である。例えば
[順接]の代わりに[−]なる記号や、[従って]と云
う文字列でその関係を表示するようにすれば良く、その
実現は容易である。 また解析された文脈構造を箱形式で表示する場合には、
例えば以下に定義する関係名のグループ分けに応じて、
個々の文を表現する箱の配置を決定してその表示を行う
ようにすれば良い。具体的にはそのグループ分けを次の
ようにする。 縦 型;  (−、X、 −、ISt 、口)−。 右上型;  ihl、  #、 rq、※)[[[1b
i  2]  +  [[3−=  4]  ※  5
]]−6コで与えられる場合、その箱形式表示は第7図
に示すようになる。この第7図に示す例では文番号や、
又聞の関係名を示す記号をそのまま表示しているが、前
述した第6図で示したように、実際の文を表示するよう
に構成できることは云うまでもない。 また文番号部分をマウスクリックする等して、利用者の
要求により適宜文を表示するように構成するようにして
も良い。 また文章全体の文脈構造の木形式でイメージ化して表示
する場合には、例えば第8図に示すようにすれば良い。 但し、この第8図に示す例では、その段落番号をローマ
数字で、また文番号を英数字で表示している。またこの
例は、前述した第6図に示した例とは別の木形式で表示
を行った例でもある。その他、本発明はその要旨を逸脱
しない範囲で種々変形して実施することができる。 〔発明の効果コ 以上説明したように本発明によれば、特殊なアウトライ
ンプロセッサ等の文章の構造化を支援する装置を使用し
て作成された文章でなくとも、:その文章の内容を解析
し、文章の論理的な構造を・明らかにし、これを文脈構
造として利用者に提示(することかできる。しかして文
脈構造はその文章作成者の思考過程を反映したものであ
り、文や段落等の論理的な繋がりを表現したものである
から、利用者は提示された文脈構造を見ることにより、
その文章の論理的構造や文章の流れ、思考の流れといっ
たものを容易に確認することができ、これを再検討する
ことでより明確で論旨の通った文章に容易に、且つ効率
的に構成・編集することが可能となる。 特に本発明においては文脈上での文の役割(関係名)に
応じて、その文脈構造を表示する位置に特徴をもたせて
いる。例えば箱型式で文脈構造を表示す゛る場合には、
論理の進行を示す関係が縦方向に、また同値的な関係を
横方向に配置している。 また背景的な文/段落を左上に、強調的な文/段落を右
上に配置してその特徴付を行っている。この結果、例え
ば左上の鞘部分が肥大しているような構造であれば、そ
の背景説明が非常に多い文章であると容易に把握するこ
とが可能となる。このように本発明によれば、イメージ
化されて表示される文脈構造を一見しただけで、その全
体の文章
【図面の簡単な説明】
図は本発明の一実施例に係る文脈構造表示装置について
示すもので、 第1図は実施例装置の全体構成を示す図、第2図は関係
抽出部が参照するクルーワード情報の例を示す図、第3
図は属性抽出部が参照するクルーワード情報の例を示す
図、第4図は文もしくは段落間の関係を表す記号の例を
示す図、第5図は文脈構造構成規則を示す図、第6図は
文脈構造の本形式での表示例を示す図、第7図は文脈構
造の箱形式での表示例を示す図、第8図は文章全体の文
脈構造の表示例を示す図である。 ■・・・単文解析部、 2・・・文情報管理部、3・・
・文脈構造解析部、4・・文脈構造表示部、11・・・
書式整形部、12・・・形態素解析部、13・・・構文
解析部、21・・・文番号、22・・・構文解析結果、
31・・・関係抽出部、32・・・属性抽出部、33・
・・語分布解析部、3a・・・文頭制約、3b・・・読
み、3C・・・クルーワード、3d・・・品詞、8e・
・・関係名。 出願人 工業技術院長 松浦 賢 第1図 第2図 第5図 第7図 第8図

Claims (1)

    【特許請求の範囲】
  1. 文章を構成する複数の文を1文毎に解析して少なくとも
    その構文情報を求める単文解析部と、この単文解析部に
    よる文の解析結果と当該文の前記文章における出現順序
    の情報とを記憶する文情報管理部と、この文情報管理部
    に記憶された情報に従って前記文章の文間または段落間
    の関係を解析してその関係名を推定する文脈構造解析部
    と、この文脈構造解析部にて推定された関係名に対応し
    た所定の配置規則に基づいて前記文章を構成する各文ま
    たは段落と前記関係名とを所定の空間上に展開配置し、
    木形状または箱形状にイメージ化して表示する文脈構造
    表示部とを具備したことを特徴とする文脈構造表示装置
JP2281971A 1990-10-22 1990-10-22 文脈構造表示装置 Pending JPH04157567A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2281971A JPH04157567A (ja) 1990-10-22 1990-10-22 文脈構造表示装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2281971A JPH04157567A (ja) 1990-10-22 1990-10-22 文脈構造表示装置

Publications (1)

Publication Number Publication Date
JPH04157567A true JPH04157567A (ja) 1992-05-29

Family

ID=17646452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2281971A Pending JPH04157567A (ja) 1990-10-22 1990-10-22 文脈構造表示装置

Country Status (1)

Country Link
JP (1) JPH04157567A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06259420A (ja) * 1993-03-10 1994-09-16 Fuji Xerox Co Ltd 文章編集支援装置
JP2008191948A (ja) * 2007-02-05 2008-08-21 Ricoh Co Ltd レイアウト処理装置、レイアウト処理方法、プログラムおよび記録媒体
JP2017016695A (ja) * 2013-03-18 2017-01-19 フリー株式会社 会計処理装置、会計処理方法及び会計処理プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0259860A (ja) * 1988-08-24 1990-02-28 Ricoh Co Ltd 機械翻訳装置
JPH02188870A (ja) * 1989-01-18 1990-07-24 Agency Of Ind Science & Technol 文脈処理装置
JPH02224066A (ja) * 1988-11-15 1990-09-06 Fuji Xerox Co Ltd 文書解析装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0259860A (ja) * 1988-08-24 1990-02-28 Ricoh Co Ltd 機械翻訳装置
JPH02224066A (ja) * 1988-11-15 1990-09-06 Fuji Xerox Co Ltd 文書解析装置
JPH02188870A (ja) * 1989-01-18 1990-07-24 Agency Of Ind Science & Technol 文脈処理装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06259420A (ja) * 1993-03-10 1994-09-16 Fuji Xerox Co Ltd 文章編集支援装置
JP2008191948A (ja) * 2007-02-05 2008-08-21 Ricoh Co Ltd レイアウト処理装置、レイアウト処理方法、プログラムおよび記録媒体
JP2017016695A (ja) * 2013-03-18 2017-01-19 フリー株式会社 会計処理装置、会計処理方法及び会計処理プログラム

Similar Documents

Publication Publication Date Title
US11475209B2 (en) Device, system, and method for extracting named entities from sectioned documents
CA2193706C (en) Medical text structuring and selection system
US7885807B2 (en) Text analysis, transliteration and translation method and apparatus for hieroglypic, hieratic, and demotic texts from ancient Egyptian
Boudlal et al. Alkhalil morpho sys1: A morphosyntactic analysis system for arabic texts
AU2004294094B2 (en) Extraction of facts from text
Hickey Corpus presenter: software for language analysis with a manual and" A corpus of Irish English" as sample data
US20060200336A1 (en) Creating a lexicon using automatic template matching
US20060200338A1 (en) Method and system for creating a lexicon
WO2001082111A2 (en) Computer-aided reading system and method with cross-language reading wizard
Camps et al. Corpus and models for lemmatisation and POS-tagging of classical french theatre
Yona et al. A finite-state morphological grammar of Hebrew
Sheremetyeva Automatic text simplification for handling intellectual property (the case of multiple patent claims)
JP2020068011A (ja) 特許書類図面資料ガイド内容自動獲得表示設備
JP2007149087A (ja) 文書作成支援装置
Huet et al. Design of a lean interface for Sanskrit corpus annotation
Holan et al. A prototype of a grammar checker for Czech
JPH04157567A (ja) 文脈構造表示装置
Novák et al. Morphological annotation of Old and Middle Hungarian corpora
JPH08329108A (ja) テキストのハイパーテキスト化方法
JP2004318809A (ja) 情報抽出規則生成装置および方法
Novák A model of computational morphology and its application to Uralic languages
JP4229457B2 (ja) データ表示装置及びデータ表示方法
JPH04167049A (ja) 文書処理装置
JP3470930B2 (ja) 自然語解析方法及び装置
JP2762934B2 (ja) テスト項目設計支援システム