JP2829264B2 - 文書レイアウト方法 - Google Patents

文書レイアウト方法

Info

Publication number
JP2829264B2
JP2829264B2 JP7329490A JP32949095A JP2829264B2 JP 2829264 B2 JP2829264 B2 JP 2829264B2 JP 7329490 A JP7329490 A JP 7329490A JP 32949095 A JP32949095 A JP 32949095A JP 2829264 B2 JP2829264 B2 JP 2829264B2
Authority
JP
Japan
Prior art keywords
document
sentence
heading
layout
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP7329490A
Other languages
English (en)
Other versions
JPH08227416A (ja
Inventor
勇 岩井
美和子 土井
利夫 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7329490A priority Critical patent/JP2829264B2/ja
Publication of JPH08227416A publication Critical patent/JPH08227416A/ja
Application granted granted Critical
Publication of JP2829264B2 publication Critical patent/JP2829264B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 【0001】 【発明の属する技術の分野】本発明は文書データの文書
構造を解析して求められる階層的論理構造に従って、そ
の文書データの出力レイアウト形式を効果的に支援する
ことのできる文書レイアウト方法である。 【0002】 【従来の技術】ワ―ドプロセッサ等の文書処理装置にあ
っては、文字コ―ドや句読点コ―ド等のコ―ド情報の系
列として文書デ―タが入力される。そして、そのコ―ド
情報の系列で示される文書デ―タを文書ファイルに登録
したり、プリンタやディスプレイに出力したりする。 【0003】然し乍ら、コ―ド情報で示される文字列を
そのまま出力するだけでは、その文書が非常に読み難
い。 【0004】そこで一般的には、或るまとまりのある文
の区切り位置に改行コ―ドを挿入し、またその改行位置
の次の先頭にスペ―ス・コ―ドを挿入して段落をつけた
りして、その文書形式を整えることが行われる。 【0005】更には文書全体を、例えば章・節等の複数
の範囲に分割し、そのまとまり毎に見出しを付したり、
更にその文書を読み易くするべく、タブやインデント等
の制御コ―ドを挿入することも行われる。 【0006】 【発明が解決しようとする課題】ところが本来の文書デ
―タとは直接関係のない、例えば上述した改行コ―ド等
の制御コ―ドを挿入しながら文書作成することは文書作
成の思考の妨げとなり、文書作成効率の低下の原因とな
っている。 【0007】また、このようにして作成した文書を編集
し直す場合には、上述した制御コ―ドを削除したり、ま
た別の箇所に挿入したりすることが必要となる。この
際、文書デ―タに挿入される制御コ―ドによって文書構
造が変化することから、例えば数ペ―ジに亙る文書を再
編集するような場合、その文書構造を全体的に統一する
には多大な労力を必要とする等の問題があった。例えば
文書形式を統一する為には、数ペ―ジ前の文書形式を参
照する等の手続きが必要となる。これ故、簡易に文書の
編集処理を進めることができず、その処理効率の向上を
図ることが望めなかった。 【0008】本発明はこのような事情を考慮してなされ
たもので、その目的とするところは、文書が持つ階層的
論理構造を積極的に利用して文書処理を行なうことによ
り、上述した文書処理の煩わしさを解消して効果的な文
書処理を可能ならしめる文書処理装置を提供することに
ある。 【0009】 【課題を解決するための手段】本発明は、コ―ド情報の
系列として与えられる文書デ―タに対して見出し語辞書
および見出し規則辞書を参照して上記文書デ―タ中から
見出し文を抽出し、見出し文と見出しでない文とに分け
られた各文について文書構造規則辞書を参照してその文
書構造を判定し、この文書構造に従って前記文書デ―タ
の、例えば章・節・箇条書き・段落等の文書構造で示さ
れる階層的論理構造を求め、この階層的論理構造によっ
て各文の文書構造に対応したレイアウト規則に従って上
記各文の文書デ―タをそれぞれ出力部に展開するように
したものである。 【0010】つまり入力された文書デ―タについて求め
られた階層的論理構造に従って、その文書を構成する各
文の論理構造に対応するレイアウト規則に基き、その文
書デ―タをそれぞれ出力部に展開するようにしたもので
ある。 【0011】かくして本発明によれば、与えられた文書
デ―タの階層的論理構造に従って各文の文書デ―タの出
力部への展開構造、つまり出力レイアウト形式が自動的
に決定され、その文書構造に応じたレイアウト形式でデ
ィスプレイ表示、またはプリント出力されることにな
る。 【0012】従って文書デ―タの入力時、またはその編
集処理時に一々その出力レイアウト形式を配慮すること
なく、つまり改行コ―ドの挿入位置を配慮したり、イン
デントやタブの設定を行うことなしにその文書処理する
ことが可能となる。しかもこのようにして任意に文書処
理しても、その文書デ―タは予め定められたレイアウト
形式に展開されてディスプレス表示、またはプリント出
力されることになる。 【0013】 【発明の実施の形態】以下、図面を参照して本発明の一
実施形態につき説明する。 【0014】図1は実施例装置の概略構成図である。図
1において1は装置本体をなす文書管理部である。キ―
ボ―ド等からなる入力部2を介してコ―ド情報の系列と
して入力される文書デ―タは、例えば図2に示すような
文書構造を持つものであり、上記文書管理部1の制御の
下で原文記憶部3に格納され、文書処理に供される。そ
して文書管理部1にて文書処理された文書デ―タは、表
示制御部4の制御の下で表示部5にて表示されるように
なっている。 【0015】図3は入力文書デ―タに対する文書構造解
析の処理手続きを示すものであり、この流れに沿って本
装置の機能を説明する。文書管理部1は前記入力部2か
ら文書デ―タを入力し(ステップa)、これを上記原文
記憶部3に格納すると共に、該文書デ―タ中の区切りコ
―ド、例えば改行コ―ドを検出し、この区切りコ―ドに
より区切られる1まとまりの文を順に抽出している。同
時にその1文の長さを計測している。そして抽出した1
文を単位として、以下に示す処理の実行を管理・制御し
ている。 【0016】見出し抽出部6は、文書管理部1にて抽出
された1文が見出しとしての可能性があるか否かを、上
記の如く計測された1文の長さの情報と、見出し語辞書
6aを参照して判定する(ステップb)。この見出し語
辞書6aは、見出しとして出現頻度の高い語句や記号
を、例えば図4に示すようにそのカテゴリ毎に分類して
予め登録したものである。具体的には見出しとして出現
頻度の高い、例えば「はじめに」「あらすじ」等の語句
を『見出し予約語』なるカテゴリにまとめて登録し、ま
た見出しとして出現頻度の高い数字・記号を、それぞれ
のカテゴリ毎にまとめて登録している。 【0017】見出し抽出部6は、抽出された文の長さが
所定の文字数(例えば40文字)以内であるか否かを判
定し、所定の文字数以内である場合には見出しの可能性
があると判定している。そしてこの文について、その文
(コ―ド情報の系列で示される語句や数字・記号)が見
出し語辞書6aに登録されているか否かを検索し(ステ
ップb)、見出し語辞書6aに該当する語句が登録され
ている場合には、これを見出し候補としている(ステッ
プc)。 【0018】しかして見出し判定部7は、その見出し規
則辞書7aに格納された図5、図6および図7(a)
(b)に示す如き見出し規則に基いて、前記見出し抽出
部6で見出し候補として抽出された文が上記見出し規則
にマッチングするか否かを判定し(ステップc)、その
見出し候補が見出し規則にマッチングした場合、これを
見出し文であると判定している(ステップe)。尚、前
記見出し抽出部6にて見出し語が検出されなかった文、
および見出し候補として判定された文であっても前記見
出し規則に該当しなかった文は、見出し文でないと判定
される(ステップf)。つまり段落等の文書本文である
と判定される。 【0019】文書構造判定部8は、上記の如く見出し
文、或いはそれ以外の文として決定された各文に対し
て、文書構造規則辞書8aに格納された、例えば図8、
図9および図10(a)(b)に示す如き文書構造規則
に従い、その文が章見出しであるか、節見出しである
か、段落であるか等の文書論理構造をそれぞれ判定して
いる(ステップg)。この文書構造判定部8にて判定さ
れた前記各文の論理構造を求め(ステップh)、その論
理構造の情報を各文にそれぞれ対応付けて論理構造記憶
部10に格納している(ステップi)。 【0020】尚、文書構造規則に基く論理構造解析に失
敗した文については、その論理的構造に誤りがあるとし
て、例えば入力文書デ―タの誤り修正を促す等のエラ―
処理が行われる(ステップj)。 【0021】文書展開部9は、以上の文書構造解析処理
によって求められた入力文書デ―タに対する階層的論理
構造に従って、入力された各文をその論理構造に応じて
定められたレイアウト形式で出力部に展開する。即ち、
文書展開部9のレイアウト規則辞書9aには、その論理
構造の種類に応じて定められた出力レイアウト形式を決
定するレイアウト規則が格納されている。文書展開部9
は、上述した如く各文についてそれぞれ求められた論理
構造に従って、各文の文書デ―タを前記表示部5にて表
示する為のレイアウト規則を上記レイアウト規則辞書9
aから求め、そのレイアウト規則に従って各文の文書デ
―タを前記表示制御部4にそれぞれ展開している。 【0022】前記表示制御部4は、このように展開され
た文書デ―タの展開構造に従って前述した文書デ―タの
表示部5による表示を制御することになる。 【0023】かくしてこのように構成された装置によれ
ば、次のようにして入力文書デ―タの階層的論理構造が
解析される。 【0024】入力部2から文書デ―タが入力されると、
その文書デ―タは原文記憶部3に順次格納されると共
に、文書管理部1にて区切り処理される。この区切り処
理は、入力コ―ド情報が改行コ―ドやスペ―ス・コ―ド
か、或いは「…」「;」「:」等の区切り記号であるか
を判定し、これらの区切りコ―ドによって入力コ―ド情
報の系列を1文毎に切り出すことによって行われる。こ
の際、上記区切りコ―ドによって区切られるコ―ド情報
の系列の長さを計数する等して、その文の長さ(文字
数)が計測される。 【0025】しかして今、前記図2に示す文書デ―タが
入力された場合について説明すると、改行コ―ドによっ
て区切られた第1行目の文『文書構造理解システム』、
および第2行目の文『大川太郎』が与えられると、これ
らの各文については該当する語句が見出し語辞書6aに
登録されていないことから、見出し抽出部6にてそれぞ
れ見出しでないと判定される。文書構造判定部8はこの
第1行目の文を、例えば文書の冒頭に出現する名詞句で
ある等の規則に適合することから、その属性が標題であ
るとして判定する。また第2行目の文については、固有
名詞、特に人名を示す固有名詞であり、標題の後に出現
する文である等の規則に従って著者名であると判定す
る。 【0026】しかる後、第3行目の文『1.はじめに』
が与えられると、この文を構成している『1』『.』
『はじめに』なる語句が前記見出し語辞書6aからそれ
ぞれ見出される。この結果、この文は見出し候補Aとし
て判定され、同時にその見出し候補を構成しているカテ
ゴリが『(数字部)(後置部)(見出し予約語)』とし
て求められる。 【0027】すると見出し判定部7は、この見出し候補
Aとして判定された文の構造が見出し規則に適合してい
るか否かを見出し規則辞書7aを参照して調べる。この
見出しの判定処理は、先ず見出し候補Aを構成するカテ
ゴリの並びを解析し、その解析構造が前記図5に示す見
出しとしての条件を満しているか否かを判定する。この
場合、上記カテゴリ『(数字部)(後置部)(見出し予
約語)』が、図5、図6および図7(a)(b)に示す
規則に従って図11に示す如く解析され、見出しパタ―
ンを構成していることが確認されるから、見出しBであ
ると判定される。尚、この判定処理によって上記カテゴ
リの並びが図5、図6および図7(a)(b)に示す条
件のいずれにも一致しないことが判定されたならば、上
記見出し候補は見出しでないと決定されることになる。 【0028】しかして上記見出しBが求められると、次
に前記文書構造判定部8にてその文書構造が図8、図9
および図10(a)(b)に例示する規則のどれに該当
するかが判定される。この場合には、今までに分析され
た文の論理構造が前述したように「標題」と「著者名」
であり、章見出しが出現していないことから図8に示す
見出し規則と照合される。この照合によって上記文
『1.はじめに』なる見出し候補が図8に示す規則の条
件(1)(1,1)(1,1,1)(1,1,1,1)
に一致すことが見出され、該見出し『1.はじめに』が
章見出しCを構成していることが一意に決定される。そ
してその論理構造の情報が、論理構造記憶部10に格納
される。 【0029】しかる後、第4〜5行目に亙る文が入力さ
れると、その文字数が見出しとして可能性の或る所定の
文字数を越えることから、見出し以外の文であると判定
される。そしてこの場合には、その文が図10(a)に
示す文書構造規則に該当していることから、段落を構成
する文であると判定される。 【0030】以下、同様にして区切りコ―ドによって区
切られた文が見出し文であるか否かが判定され、文書構
造規則辞書8aと照合されてその文書構造が順次求めら
れる。 【0031】例えば見出しを構成する文が再び入力され
ると、先の例と同様にして見出し候補Aとして検出さ
れ、図5、図6および図7(a)(b)に示す見出し規
則に適合することが判定される。そしてこの見出しBに
ついては、前記論理構造記憶部10の内容から既に章見
出しが検出されていることが示されるので、先ず図9に
示す文書構造規則を参照し、上記見出しBのパタ―ンが
どの条件に該当するかを調べる。そしてその見出し候補
のパタ―ンが条件(1,1)(2,1)(3,1)
(4,1)に該当する場合には、先に求められた章見出
しCと同じレベルの見出しである可能性があることが判
定される。しかる後、前記図8に示す規則に適合するか
否かを調べ、図8に示す文書構造規則の条件(1)
(1,1)(1,1,2)(1,1,2,2)(1,
1,2,2,1)に一致する場合には、その見出しを既
に判定された先の章見出しと同一レベルの章見出しであ
ると判定する。 【0032】尚、丸数字を冒頭に付した見出し文が与え
られた場合には、それ以前に同様なパタ―ンの見出しが
検出されていないので図9に示す規則(条件)との照合
にてマッチング不成功となる。この結果、先に求められ
た見出しとはレベルの異なる見出しであることが判定さ
れる。その後、図8に示す文書構造規則に対する照合に
より、例えば条件(1)(1,1)(1,1,2)
(1,1,2,2)(1,1,2,2,2)(1,1,
2,2,2,1)との一致が検出されてその見出し文が
箇条書き見出しであると判定される。 【0033】尚、文が段落であるとして判定された場合
には、その段落がどのレベルの見出しを受けたものかが
わからない場合がある。このようなときには、例えば図
10(b)に示す規則を参照して、段落と見出しとの接
続関係を判定し、そのレベルを定めるようにすれば良
い。 【0034】このような文書構造解析処理によって、そ
の入力文書デ―タを構成する各文の文書構造がそれぞれ
求められ、その階層的論理構造の情報が入力文書デ―タ
にそれぞれ対応して、例えば図12に示すように論理構
造記憶部10に格納される。 【0035】この図12に示す文書の論理構造デ―タに
ついて簡単に説明すると、その文書の情報は、[ ]で
囲んで示した文書デ―タにそれぞれ対応付けて、{ }
で囲んで示され、冒頭の数値にてその文の階層レベル、
次の情報でその文属性を、そして記号zで始まるデ―タ
にて文書デ―タの解析結果を示している。この文書デ―
タの解析結果は、例えば次のような意味を持っている。 【0036】ここで、z1は記号部、z2は英数字括弧
始め、z3は予約語部、z4は英数字部1、z5は英数
字部2、z6は英数字括弧終り、z7は後置部1、〜、
z21は見出し予約語、z22は主見出し本体始め位
置、z23は主見出し本体終り位置、z24は後見出し
記号、〜、z28は内容部始め位置、z29は内容部終
り位置である。 【0037】このような意味を持つ記号の後に、その文
書デ―タが何であるか、或いは何文字目であるかの情報
を付して、その解析結果が表現される。 【0038】さて前記文書展開部9は、上述した如く求
められた文書デ―タに対する階層的論理構造の情報に従
い、該文書デ―タを次のようにして出力部に展開してい
る。 【0039】図13は文書展開部9のハ―ドウエア構成
を示すものである。論理構造デ―タ読出し部11は、前
記論理構造記憶部10に格納された前記図12に示す如
き文書デ―タとその論理構造デ―タを読出すもので、そ
の文書デ―タは1文字切出し部12にて1文字毎に切出
されて文書デ―タ割当て部13に与えられる。この際、
文属性取出し部14は、前記図12に示す「titl
e」「auther」等の文属性デ―タを抽出してレイ
アウト情報検出部15に与えてやり、またレイアウト情
報解析部16は、前述したzの記号を付されて記述され
た論理構造情報を読出している。 【0040】ここでレイアウト規則辞書9aには、例え
ば図14(a)(b)に示すように、文書デ―タを出力
するフレ―ム(文書枠)に関する情報と、文属性に応じ
てその文をどのようにレイアウト出力するかの情報から
なるレイアウト規則が格納されている。具体的には上記
フレ―ム情報は、図14(a)に示すようにディスプレ
イやプリンタ等の出力装置上でのフレ―ム管理番号、そ
の出力位置の情報、およびそのフレ―ムの大きさの情報
からなり、これによって文書デ―タが出力される表示画
面、または印刷用紙におけるフレ―ムの構成が、例えば
図15に示す如く定義されるものとなっている。これら
のフレ―ム情報は、文書デ―タを出力するべく設定され
た複数のフレ―ム毎にそれぞれ定義される。 【0041】レイアウト規則読出し部17は、このよう
なフレ―ム規則をレイアウト規則辞書9aから読出して
フレ―ム形式情報バッファ18に格納すると共に、その
情報を演算部19に与え、そのフレ―ムの最大カラム
数、および最大ライン数を求めている。この最大カラム
数・ライン数のデ―タは最大カラム・ライン値バッファ
20にセットされて後述する文字デ―タの展開出力制御
に用いられる。 【0042】また前記レイアウト規則辞書9aに格納さ
れた文属性に関するレイアウト規則は、例えば図14
(b)に示すように定義される。このレイアウト規則に
よって、その文属性の種別毎にその文書デ―タを、前述
した如く定義されるフレ―ム上にどのようにレイアウト
するかが規定される。 【0043】ここでは、例えば「lf」にて対象文字列
の最後を強制改行すること、「Ce」にてその対象文字
列をセンタリングすることがそれぞれ示される。また
「ds;1」にて対象文書デ―タを出力した後に1行分
の改行を行うことが示され、「us;1」にて対象文書
デ―タを出力する前に1行分の改行を行うことが示され
る。更に「ls;1」にてフレ―ムの左側から1文字分
のマ―ジン(空白)を設けることが示される。尚、段落
の場合にはその先頭行の1文字目を空白とする。 【0044】このようなレイアウト規則が前記レイアウ
ト情報検出部15の制御の下で、その文属性の種別に従
って上記レイアウト規則辞書9aから読出されて前記レ
イアウト情報解析部16に与えられる。 【0045】レイアウト情報解析部16は、このように
して求められるレイアウト規則に基いて文書デ―タ割当
て部13を制御し、上記の如く1文字づつ切出される文
書デ―タを指定されたフレ―ムに順に展開している。 【0046】即ち、レイアウト情報解析部16は、前記
フレ―ムの情報に従って文書デ―タを展開するフレ―ム
を判定し、同時にそのフレ―ムの大きさを判定してい
る。そしてその指定されたフレ―ムに、前記文属性に応
じてレイアウト規則に従って、その文書デ―タを展開制
御している。 【0047】この際、1文字切出し部12にて文書デ―
タが1文字毎に切出される都度、これに同期してカラム
・ラインカウンタ21の計数値がカウントアップされ
る。このカラム・ラインカウンタ21による計数値は、
比較部22にて前記最大カラム・ライン値バッファ20
にセットされた値と逐次比較されており、その比較結果
は判定部23にて判定されている。この判定部23にて
前記1文字切出し部12にて切出された文字のレイアウ
ト位置が、そのとき指定されているフレ―ム内であるか
否かが判定される。 【0048】そしてレイアウト制御されて展開される文
書デ―タの割当て位置がその指定されたフレ―ムを越え
たことが判定されると、フレ―ム切り換え部24が起動
されて、前記文書デ―タ割当て部13による文書デ―タ
の割当てフレ―ムが次のフレ―ムに更新制御されるよう
になっている。 【0049】このようにして文書展開部9は、そのレイ
アウト規則辞書9aに設定されているレイアウト規則に
従って、その文書デ―タを出力すべきフレ―ムを設定し
ている。そしてその設定されたフレ―ムに、上記文属性
に応じて設定されたレイアウト規則に従ってその文書デ
―タを展開している。 【0050】例えば図12に示す如く求められた論理構
造の文書デ―タにあっては、第1文が標題であり、その
レイアウト規則が「lf」「Ce」「ds;1」で示さ
れることから、先ずレイアウト情報解析部16では前記
最大カラム・ライン値バッファ20から、その設定され
たフレ―ムの最大カラム・ライン数を求め、例えば (MAXライン−対象文の文字数)÷2 等として、そのセンタリングして表示出力すべき文字位
置を求めている。このデ―タによって前記カラム・ライ
ンカウンタ21の計数値がプリセット的に変更され、そ
の変更位置からその対象文の文書デ―タの展開、つまり
文字位置の割当てが行われる。 【0051】その後、対象文の文字デ―タの出力割当て
が終了した時点で、「ds;1」なる情報に従って強制
改行され、出力された標題を示す文字列の下に1行文の
空白行が設定される。 【0052】このような文書デ―タの出力(展開)制御
が、前述した如く切出された各文毎に、その文について
求められた論理構造に従って順次行われ、その文書デ―
タが所定のフレ―ムに順に展開されていく。この結果、
例えば図16に例示するように、前記図12に示す如く
階層的論理構造が求められた文書デ―タが、それに対し
て指定されたレイアウト規則に従って出力展開されるこ
とになる。 【0053】かくしてこのように構成された装置によれ
ば、入力文書デ―タからその文書の階層的論理構造が求
められ、その階層的論理構造に従う文書デ―タのレイア
ウト規則に従ってその文書デ―タが、設定されたフレ―
ム毎にその文属性に応じてそれぞれ定められたレイアウ
ト形式で展開されることになる。 【0054】具体的には定められたフレ―ムに文書デ―
タが順に割付けられ、またその文章の階層的論理構造に
従う各文の文書構造の情報、つまりその文属性に従っ
て、例えば強制改行やセンタリング等の制御が行われて
文書デ―タの展開が行われる。 【0055】従って文書作成時や文書編集時等の文書処
理を、そのレイアウト形式を配慮することなしに文書内
容のみに着目して効率良く実行することができる。しか
も、このようにして文書処理しても、上述した如く解析
された階層的文書構造、およびその文書構造(文属性)
によって指定されるレイアウト規則によって、その文書
デ―タの出力レイアウト形式が自動的に制御されるの
で、全体的に統一のとれた文書形式でその文書を作成す
ることが可能となる。 【0056】従って文書の出力形式の制御の為に文書作
成等の思考が妨げられることがなく、その文書処理を簡
易に、且つ効果的に行うことが可能となる等の実用上多
大なる効果が奏せられる。 【0057】尚、本発明は上述した実施例に限定される
ものではない。例えば文書の論理構造を示すデ―タ形式
や、その論理構造を求める為の規則、更には文書デ―タ
の出力形式を定めるレイアウト規則は、その仕様に応じ
て定めれば良いものである。また字体(文字フォント)
の変形を考慮した見出しの抽出と、文書構造の判定処
理、更にはその出力制御を行うようにしても良い。この
場合、出力文字の高輝度表示や反転表示等を同時に制御
することも勿論可能であり、そのような制御情報をレイ
アウト規則として設定しておけば十分である。 【0058】また上述した例では、文書デ―タの階層的
論理構造を求めた後、その出力レイアウト形式の制御を
行ったが、1文毎にそのレイアウト展開処理を行っても
良い。この場合、その論理構造を一旦蓄積することな
く、直接的にレイアウト展開処理に用いるようにしても
良い。更には、1つの文属性について複数のレイアウト
規則を準備しておき、その中から選択的にレイアウト規
則を適用することも可能である。これによって同一文属
性で異なった用途のレイアウト形式、例えば学会論文形
式と社内報告書形式等に適宜変換することができ、種々
のレイアウト編集を容易に行うことが可能となる。また
ここでは日本語を例に説明したが、他国語に対しても同
様に適用可能なことは勿論のことである。その他、本発
明はその要旨を逸脱しない範囲で種々変形して実施する
ことができる。 【0059】 【発明の効果】以上説明したように本発明によれば、入
力文書デ―タからその文書の章・節・箇条書き・段落等
の論理構造を求め、その論理構造に対応したレイアウト
規則に従って文書デ―タを所定の出力レイアウト形式で
展開出力することができるので、文書出力形式の制御の
為にその思考過程が妨げられることがなく、その文書処
理を効果的に進めることを可能ならしめる等の実用上多
大なる効果が奏せられる。
【図面の簡単な説明】 【図1】本発明の一実施例の概略構成図。 【図2】入力文書デ―タの一例を示す図。 【図3】実施例装置における文書構造解析処理の手続き
の流れを示す図。 【図4】見出し語辞書の一例を示す図。 【図5】見出し抽出規則辞書の構成例を示す図。 【図6】見出し抽出規則辞書の構成例を示す図。 【図7】見出し抽出規則辞書の構成例を示す図。 【図8】文書構造規則辞書の構成例を示す図。 【図9】文書構造規則辞書の構成例を示す図。 【図10】文書構造規則辞書の構成例を示す図。 【図11】見出し文の解析構造を示す図。 【図12】論理構造記憶部に格納された文書構造の情報
の例を示す図。 【図13】文書展開部の構成例を示す図。 【図14】レイアウト規則辞書の構成例を示す図。 【図15】レイアウト規則によって示されるフレ―ム
(文書枠)の例を示す図。 【図16】レイアウト展開処理されて出力される文書形
式の例を示す図。 【符号の説明】 1…文書管理部、2…入力部、3…原文記憶部、4…表
示制御部、5…表示部、6…見出し抽出部、6a…見出
し語辞書、7…見出し判定部、7a…見出し規則辞書、
8…文書構造判定部、8a…文書構造規則部、9…文書
展開部、9a…レイアウト規則辞書、10…論理構造記
憶部。

Claims (1)

  1. (57)【特許請求の範囲】 1.入力された文書データから、予め見出し規則辞書に
    記憶された見出し規則をもとに見出しとなる文を抽出
    し、 この抽出された見出し文と見出し文でない各文について
    予め文書構造規則辞書に記憶された文書構造を判定する
    ための規則をもとに、順次前記各文の章・節・箇条書き
    ・段落等の階層的論理構造に従う文属性を求め、 この求められた文属性毎に対応する予めレイアウト規則
    辞書に記憶されたレイアウトの規則に応じて、前記各文
    のうち抽出された前記見出し文の改行またはセンタリン
    グ等のレイアウトを制御する ことを特徴とする文書レイ
    アウト方法。
JP7329490A 1995-11-27 1995-11-27 文書レイアウト方法 Expired - Lifetime JP2829264B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7329490A JP2829264B2 (ja) 1995-11-27 1995-11-27 文書レイアウト方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7329490A JP2829264B2 (ja) 1995-11-27 1995-11-27 文書レイアウト方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP6095145A Division JP2680540B2 (ja) 1994-05-09 1994-05-09 文書レイアウト方法

Publications (2)

Publication Number Publication Date
JPH08227416A JPH08227416A (ja) 1996-09-03
JP2829264B2 true JP2829264B2 (ja) 1998-11-25

Family

ID=18221959

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7329490A Expired - Lifetime JP2829264B2 (ja) 1995-11-27 1995-11-27 文書レイアウト方法

Country Status (1)

Country Link
JP (1) JP2829264B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002157238A (ja) 2000-09-06 2002-05-31 Seiko Epson Corp 閲覧情報作成システム、ディジタルコンテンツ作成システム及びディジタルコンテンツ配信システム、並びにディジタルコンテンツ作成プログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH077410A (ja) * 1993-02-10 1995-01-10 Natl Semiconductor Corp <Ns> 多重電源分離を備えたフルスイングパワーダウンバッファ回路

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH077410A (ja) * 1993-02-10 1995-01-10 Natl Semiconductor Corp <Ns> 多重電源分離を備えたフルスイングパワーダウンバッファ回路

Also Published As

Publication number Publication date
JPH08227416A (ja) 1996-09-03

Similar Documents

Publication Publication Date Title
US6533822B2 (en) Creating summaries along with indicators, and automatically positioned tabs
US7756871B2 (en) Article extraction
JP4717049B2 (ja) 文書のページ番号を検出する方法及びシステム
JPH077410B2 (ja) 文書レイアウト方法
JP4808705B2 (ja) 文書情報マイニングツール
JP5248845B2 (ja) 文書処理装置、文書処理方法、プログラムおよび記憶媒体
JPH0823864B2 (ja) 見出し判定方法
US5835921A (en) Data processing apparatus for creating and storing a text file from input data
JP2829264B2 (ja) 文書レイアウト方法
JPH0612447A (ja) 要約文章作成装置
JP2680540B2 (ja) 文書レイアウト方法
JP2682570B2 (ja) 文書レイアウト方法
JP2680501B2 (ja) 文書出力方法
JP2763227B2 (ja) 書式決定方法
JP2680500B2 (ja) 文書レイアウト方法
JPH0668748B2 (ja) 文書整形方法
JPH06290209A (ja) 文切り装置
JPS62245366A (ja) 文書処理装置
JPH10293811A (ja) 文書認識装置及び方法並びにプログラム記憶媒体
JP2002297574A (ja) ルビ付与システムおよびプログラム
JPS6366665A (ja) 文書解析整形装置
JPH08190570A (ja) 文書データの比較検証システム
JPH07141366A (ja) 文書作成装置及び注釈付き文書作成方法
Greenberg A Simplified Introduction to LАTE
Hofmann et al. Frank Holzwarth, Anna Kramer, and Erika Siebert-Cole Springer-Verlag, Computer Science Editorial, Tiergartenstr. 17, 69121 Heidelberg, Germany {Alfred. Hofmann, Ingrid. Beyer, Christine. Guenther, Frank. Holzwarth, Anna. Kramer, Erika. Siebert-Cole, LNCS}@ Springer. com

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term