JP2682570B2 - Document layout method - Google Patents

Document layout method

Info

Publication number
JP2682570B2
JP2682570B2 JP4066951A JP6695192A JP2682570B2 JP 2682570 B2 JP2682570 B2 JP 2682570B2 JP 4066951 A JP4066951 A JP 4066951A JP 6695192 A JP6695192 A JP 6695192A JP 2682570 B2 JP2682570 B2 JP 2682570B2
Authority
JP
Japan
Prior art keywords
sentence
document
headline
document data
heading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP4066951A
Other languages
Japanese (ja)
Other versions
JPH0581253A (en
Inventor
勇 岩井
美和子 土井
利夫 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=13330838&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2682570(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP4066951A priority Critical patent/JP2682570B2/en
Publication of JPH0581253A publication Critical patent/JPH0581253A/en
Application granted granted Critical
Publication of JP2682570B2 publication Critical patent/JP2682570B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 【0001】 【産業上の利用分野】本発明は、文書データの出力レイ
アウト形式を効果的に支援することのできる文書レイア
ウト方法に関する。 【0002】 【従来の技術】ワードプロセッサ等の文書処理装置にあ
っては、文字コードや句読点コード等のコード情報の系
列として文書データが入力される。そして、そのコード
情報の系列で示される文書データを文書ファイルに登録
したり、プリンタやディスプレイに出力したりする。 【0003】然し乍ら、コード情報で示される文字列を
そのまま出力するだけでは、その文書が非常に読み難
い。そこで一般的には、或るまとまりのある文の区切り
位置に改行コードを挿入し、またその改行位置の次の文
の先頭にスペース・コードを挿入して段落をつけたりし
て、その文書形式を整えることが行われる。 【0004】更には文書全体を、例えば章・節等の複数
の範囲に分割し、そのまとまり毎に見出しを付したり、
更にその文書を読み易くするべく、例えば、見出し文と
それに続く本文の位置関係を一見して区別できるように
するため、タブやインデント等の制御コードを挿入する
ことも行われる。 【0005】ところが本来の文書データとは直接関係の
ない、例えば上述した改行コード等の制御コードを挿入
しながら文書作成することは文書作成の思考の妨げとな
り、文書作成効率の低下の原因となっている。 【0006】また、このようにして作成した文書を編集
し直す場合には、上述した制御コードを削除したり、ま
た別の箇所に挿入したりすることが必要となる。この
際、文書データに挿入される制御コードによって文書構
造が変化することから、例えば数ページに亙る文書を再
編集するような場合、その文書構造を全体的に統一する
には多大な労力を必要とする等の問題があった。例えば
文書形式を統一する為には、数ページ前の文書形式を参
照する等の手続きが必要となる。これ故、簡易に文書の
編集処理を進めることができず、その処理効率の向上を
図ることが望めなかった。 【0007】 【発明が解決しようとする課題】本発明はこのような事
情を考慮してなされたもので、文書データを、特に見出
し文とこれに続く本文とが一見して区別できるようにレ
イアウト処理することができ、文書処理の煩わしさを解
消して効果的な文書処理を可能ならしめる文書レイアウ
ト方法を提供することを目的とする。 【0008】 【課題を解決するための手段】本発明の第1の発明に係
る文書レイアウト方法は、入力される文書データから見
出しとなる文とこの見出し文に続く文とを判別し、文の
種類と展開開始位置とを関係付けるための予め記憶され
た規則に従って複数の見出し文の展開開始位置を揃える
とともにこれら見出し文に続く文の展開開始位置を対応
する見出し文のそれと異ならせた位置で揃えるように処
理し、この処理の施された文書データを出力手段に展開
することを特徴とする本発明の第2の発明に係る文書
レイアウト方法は、入力される文書データから見出しと
なる文とこの見出し文に続く文とを判別し、見出し文で
あると判別された文の階層レベルを解析し、文の種類と
展開開始位置とを関係付けるための予め記憶された規則
に従って同一の階層レベルを有する複数の見出し文の展
開開始位置を異なる階層レベルを有する他の見出し文の
展開開始位置とは異なる位置で揃えるとともに前記複数
の見出し文に続く文の展開開始位置を対応する見出し文
のそれと異ならせた位置で揃えるように処理し、この処
理の施された文書データを出力手段に展開することを特
徴とする。 【0009】 【作用】本発明の第1の発明によれば、文の種類(見出
し文か見出し文に続く文か)と展開開始位置とを関係付
けるための規則が予め記憶されており、入力される文書
データが出力レイアウト形式に配慮せずに作成されたも
のであっても、該文書データから見出し文と見出し文に
続く文とを判別し、上記規則に従って複数の見出し文の
展開開始位置を揃えるとともにこれら見出し文に続く文
の展開開始位置を対応する見出し文のそれと異ならせた
位置で揃えることができ、見出し文とこれに続く本文と
が一見して区別できる見易い文書を自動的に作成でき
本発明の第2の発明によれば、文の種類(見出し文
か見出し文に続く文か及びどの階層レベルか)と展開開
始位置とを関係付けるための規則が予め記憶されてお
り、入力される文書データが出力レイアウト形式に配慮
せずに作成されたものであっても、該文書データから見
出し文と見出し文に続く文とを判別し、見出し文である
と判別された文の階層レベルを解析し、上記規則に従っ
て同一の階層レベルを有する複数の見出し文の展開開始
位置を異なる階層レベルを有する他の見出し文の展開開
始位置とは異なる位置で揃えるとともに前記複数の見出
し文に続く文の展開開始位置を対応する見出し文のそれ
と異ならせた位置で揃えることができ、階層レベルの異
なる見出し文同士が一見して区別でき、かつ、見出し文
とこれに続く本文とが一見して区別できる見易い文書を
自動的に作成できる。 【0010】 【実施例】以下、図面を参照して本発明の実施例につき
説明する。 【0011】図1は実施例の概略構成を示す図である。
図1において1は装置本体をなす文書管理部である。キ
ーボード等からなる入力部2を介してコード情報の系列
として入力される文書データは、例えば図2に示すよう
な文書構造を持つものであり、上記文書管理部1の制御
の下で原文記憶部3に格納され、文書処理に供される。
そして文書管理部1にて文書処理された文書データは、
表示制御部4の制御の下で表示部5にて表示されるよう
になっている。 【0012】図3は入力文書データに対する文書構造解
析の処理手続きを示すものであり、この流れに沿って本
装置の機能を説明する。文書管理部1は前記入力部2か
ら文書データを入力し(ステップa)、これを上記原文
記憶部3に格納すると共に、該文書データ中の区切りコ
ード、例えば改行コードを検出し、この区切りコードに
より区切られる1まとまりの文を順に抽出している。同
時にその1文の長さを計測している。そして抽出した1
文を単位として、以下に示す処理の実行を管理・制御し
ている。 【0013】見出し抽出部6は、文書管理部1にて抽出
された1文が見出しとしての可能性があるか否かを、上
記の如く計測された1文の長さの情報と、見出し語辞書
6aを参照して判定する(ステップb)。この見出し語辞
書6aは、見出しとして出現頻度の高い語句や記号を、例
えば図4に示すようにそのカテゴリ毎に分類して予め登
録したものである。具体的には見出しとして出現頻度の
高い、例えば「はじめに」「あらすじ」等の語句を『見
出し予約語』なるカテゴリにまとめて登録し、また見出
しとして出現頻度の高い数字・記号を、それぞれのカテ
ゴリ毎にまとめて登録している。 【0014】見出し抽出部6は、抽出された文の長さが
所定の文字数(例えば40文字)以内であるか否かを判定
し、所定の文字数以内である場合には見出しの可能性が
あると判定している。そしてこの文について、その文
(コード情報の系列で示される語句や数字・記号)が見
出し語辞書6aに登録されているか否かを検索し(ステッ
プb)、見出し語辞書6aに該当する語句が登録されてい
る場合には、これを見出し候補としている(ステップ
c)。 【0015】しかして見出し判定部7は、その見出し規
則辞書7aに格納された図5〜図7に示す如き見出し規則
に基いて、前記見出し抽出部6で見出し候補として抽出
された文が上記見出し規則にマッチングするか否かを判
定し(ステップc)、その見出し候補が見出し規則にマ
ッチングした場合、これを見出し文であると判定してい
る(ステップe)。尚、前記見出し抽出部6にて見出し
語が検出されなかった文、および見出し候補として判定
された文であっても前記見出し規則に該当しなかった文
は、見出し文でないと判定される(ステップf)。つま
り段落等の文書本文であると判定される。 【0016】文書構造判定部8は、上記の如く見出し
文、或いはそれ以外の文として決定された各文に対し
て、文書構造規則辞書8aに格納された、例えば図8〜図
10に示す如き文書構造規則に従い、その文が章見出し
であるか、節見出しであるか、段落であるか等の文書論
理構造をそれぞれ判定している(ステップg)。この文
書構造判定部8にて判定された前記各文の論理構造を求
め(ステップh)、その論理構造の情報を各文にそれぞ
れ対応付けて論理構造記憶部10に格納している(ステッ
プi)。 【0017】尚、文書構造規則に基く論理構造解析に失
敗した文については、その文の論理的構造に誤りがある
として、例えば入力文書データの誤り修正を促す等のエ
ラー処理が行われる(ステップj)。 【0018】文書展開部9は、以上の文書構造解析処理
によって求められた入力文書データに対する階層的論理
構造に従って、入力された各文をその論理構造に応じて
定められたレイアウト形式で出力部に展開する。即ち、
文書展開部9のレイアウト規則辞書9aには、その論理構
造の種類に応じて定められた出力レイアウト形式を決定
するレイアウト規則が格納されている。文書展開部9
は、上述した如く各文についてそれぞれ求められた論理
構造に従って、各文の文書データを前記表示部5にて表
示する為のレイアウト規則を上記レイアウト規則辞書9a
から求め、そのレイアウト規則に従って各文の文書デー
タを前記表示制御部4にそれぞれ展開している。前記表
示制御部4は、このように展開された文書データの展開
構造に従って前述した文書データの表示部5による表示
を制御することになる。かくしてこのように構成された
装置によれば、次のようにして入力文書データの階層的
論理構造が解析される。 【0019】入力部2から文書データが入力されると、
その文書データは原文記憶部3に順次格納されると共
に、文書管理部1にて区切り処理される。この区切り処
理は、入力コード情報が改行コードやスペース・コード
か、或いは「…」「;」「:」等の区切り記号であるか
を判定し、これらの区切りコードによって入力コード情
報の系列を1文毎に切出すことによって行われる。この
際、上記区切りコードによって区切られるコード情報の
系列の長さを計数する等して、その文の長さ(文字数)
が計測される。 【0020】しかして今、図2に示す文書データが入力
された場合について説明すると、改行コードによって区
切られた第1行目の文『文書構造理解システム』、およ
び第2行目の文『大川太郎』が与えられると、これらの
各文については該当する語句が見出し語辞書6aに登録さ
れていないことから、見出し抽出部6にてそれぞれ見出
しでないと判定される。文書構造判定部8はこの第1行
目の文を、例えば文書の冒頭に出現する各詞句である等
の規則に適合することから、その属性が標題であるとし
て判定する。また第2行目の文については、固有名詞、
特に人名を示す固有名詞であり、標題の後に出現する文
である等の規則に従って著者名であると判定する。 【0021】しかる後、第3行目の文『1.はじめに』
が与えられると、この文を構成している『1』『.』
『はじめに』なる語句が前記見出し語辞書6aからそれぞ
れ見出される。この結果、この文は見出し候補Aとして
判定され、同時にその見出し候補を構成しているカテゴ
リが『(数字部)(後置部)(見出し予約語)』として
求められる。 【0022】すると見出し判定部7は、この見出し候補
Aとして判定された文の構造が見出し規則に適合してい
るか否かを見出し規則辞書7aを参照して調べる。この見
出しの判定処理は、先ず見出し候補Aを構成するカテゴ
リの並びを解析し、その解析構造が前記図5〜図7に示
す見出しとしての条件を満しているか否かを判定する。
この場合、上記カテゴリ『(数字部)(後置部)(見出
し予約語)』が、図5〜図7に示す規則に従って図11
に示す如く解析され、見出しパターンを構成しているこ
とが確認されるから、見出しBであると判定される。
尚、この判定処理によって上記カテゴリの並びが図5〜
図7に示す条件のいずれにも一致しないことが判定され
たならば、上記見出し候補は見出しでないと決定される
ことになる。 【0023】しかして、上記見出しBが求められると、
次に前記文書構造判定部8にてその文書構造が図8〜図
10に例示する規則のどれに該当するかが判定される。
この場合には、今までに分析された文の論理構造が前述
したように「標題」と「著者名」であり、章見出しが出
現していないことから図8に示す見出し規則と照合され
る。この照合によって上記文『1.はじめに』なる見出
し候補が図8に示す規則の条件(1)(1,1)(1,
1,1)(1,1,1,1)に一致することが見出さ
れ、該見出し『1.はじめに』が章見出しCを構成して
いることが一意に決定される。そしてその論理構造の情
報が、論理構造記憶部10に格納される。 【0024】しかる後、第4〜5行目に亙る文が入力さ
れると、その文字数が見出しとして可能性の或る所定の
文字数を越えることから、見出し以外の文であると判定
される。そしてこの場合には、その文が図10(a)に
示す文書構造規則に該当していることから、段落を構成
する文であると判定される。以下、同様にして区切りコ
ードによって区切られた文が見出し文であるか否かが判
定され、文書構造規則辞書8aと照合されてその文書構造
が順次求められる。 【0025】例えば見出しを構成する文が再び入力され
ると、先の例と同様にして見出し候補Aとして検出さ
れ、図5〜図7に示す見出し規則に適合することが判定
される。そしてこの見出しBについては、前記論理構造
記憶部10の内容から既に章見出しが検出されていること
が示されるので、先ず図9に示す文書構造規則を参照
し、上記見出しBのパターンがどの条件に該当するかを
調べる。そしてその見出し候補のパターンが条件(1,
1)(2,1)(3,1)(4,1)に該当する場合に
は、先に求められた章見出しCと同じレベルの見出しで
ある可能性があることが判定される。しかる後、図8に
示す規則に適合するか否かを調べ、図8に示す文書構造
規則の条件(1)(1,1)(1,1,2)(1,1,
2,2)(1,1,2,2,1)に一致する場合には、
その見出しを既に判定された先の章見出しと同一レベル
の章見出しであると判定する。 【0026】尚、丸数字を冒頭に付した見出し文が与え
られた場合には、それ以前に同様なパターンの見出しが
検出されていないので図9に示す規則(条件)との照合
にてマッチング不成功となる。この結果、先に求められ
た見出しとはレベルの異なる見出しであることが判定さ
れる。その後、図8に示す文書構造規則に対する照合に
より、例えば条件(1)(1,1)(1,1,2)
(1,1,2,2)(1,1,2,2,2)(1,1,
2,2,2,1)との一致が検出されてその見出し文が
箇条書き見出しであると判定される。 【0027】尚、文が段落であるとして判定された場合
には、その段落がどのレベルの見出しを受けたものかが
わからない場合がある。このようなときには、例えば図
10(b)に示す規則を参照して、段落と見出しとの接
続関係を判定し、そのレベルを定めるようにすれば良
い。 【0028】このような文書構造解析処理によって、そ
の入力文書データを構成する各文の文書構造がそれぞれ
求められ、その階層的論理構造の情報が入力文書データ
にそれぞれ対応して、例えば図12に示すように論理構
造記憶部10に格納される。 【0029】この図12に示す文書の論理構造データに
ついて簡単に説明すると、その文書構造の情報は、[
]で囲んで示した文書データにそれぞれ対応付けて、
{ }で囲んで示され、冒頭の数値にてその文の階層レ
ベル、次の情報でその文属性を、そしてzで始まるデー
タにて文書データの解析結果を示している。この文書デ
ータの解析結果は、例えば次のような意味を持ってい
る。 【0030】z1:記号部、z2:英数字括弧始め、z
3:予約語部、z4:英数字部1、z5:英数字部2、
z6:英数字括弧終り、z7:後置部1、z21:見出し
予約語、z22:主見出し本体始め位置、z23:主見出し
本体終り位置、z24:後見出し記号、z28:内容部始め
位置、z29:内容部終り位置。 このような意味を持つ記号の後に、その文書データが何
であるか、或いは何文字目であるかの情報を付して、そ
の解析結果が表現される。さて前記文書展開部9は、上
述した如く求められた文書データに対する階層的論理構
造の情報に従い、該文書データを次のようにして出力部
に展開している。 【0031】図13は文書展開部9のハードウエア構成
を示すものである。論理構造データ読出し部11は、前記
論理構造記憶部10に格納された図12に示す如き文書デ
ータとその論理構造データを読出すもので、その文書デ
ータは1文字切出し部12にて1文字毎に切出されて文書
データ割当て部13に与えられる。この際、文属性取出し
部14は、図12に示す「title 」「auther」等の文属性
データを抽出してレイアウト情報検出部15に与えてお
り、またレイアウト情報解析部16は、前述したzの記号
を付されて記述された論理構造情報を読出している。 【0032】ここでレイアウト規則辞書9aには、例えば
図14(a)(b)に示すように、文書データを出力す
るフレーム(文書枠)に関する情報と、文属性に応じて
その文をどのようにレイアウト出力するかの情報からな
るレイアウト規則が格納されている。具体的には上記フ
レーム情報は、図14(a)に示すようにディスプレイ
やプリンタ等の出力装置上でのフレーム管理番号、その
出力位置の情報、およびそのフレームの大きさの情報か
らなり、これによって文書データが出力される表示画
面、または印刷用紙におけるフレームの構成が、例えば
図15(a)(b)に示す如く定義されるものとなって
いる。これらのフレーム情報は、文書データを出力する
べく設定された複数のフレーム毎にそれぞれ定義され
る。 【0033】レイアウト規則読出し部17は、このような
フレーム規則をレイアウト規則辞書9aから読出してフレ
ーム形式情報バッファ18に格納すると共に、その情報を
演算部19に与え、そのフレームの最大カラム数、および
最大ライン数を求めている。この最大カラム数・ライン
数のデータは最大カラム・ライン値バッファ20にセット
されて後述する文字データの展開出力制御に用いられ
る。 【0034】また前記レイアウト規則辞書9aに格納され
た文属性に関するレイアウト規則は、例えば図14
(b)に示すように定義される。このレイアウト規則に
よって、その文属性の種別毎にその文書データを、前述
した如く定義されるフレーム上にどのようにレイアウト
するかが規定される。 【0035】ここでは、例えば「lf」にて対象文字列
の最後を強制改行すること、「Ce」にてその対象文字
列をセンタリングすることがそれぞれ示される。また
「ds;1」にて対象文書データを出力した後に1行分
の改行を行なうことが示され、「us;1」にて対象文
書データを出力する前に1行分の改行を行なうことが示
される。更に「ls;1」にてフレームの左側から1文
字分のマージン(空白)を設けることが示される。図1
4(b)によれば、例えば各見出し文に関しては、「l
s;3」としておくことにより、行頭が各段落とは異な
る位置で、また階層レベルの異なる見出し(例えばitem
のls;4)とも異なる位置で揃えられることになる。尚、
段落の場合にはその先頭行の1文字目を空白とする。 【0036】このようなレイアウト規則が前記レイアウ
ト情報検出部15の制御の下で、その文属性の種別に従っ
て上記レイアウト規則辞書9aから読出されて前記レイア
ウト情報解析部16に与えられる。 【0037】レイアウト情報解析部16は、このようにし
て求められるレイアウト規則に基いて文書データ割当て
部13を制御し、上記の如く1文字づつ切出される文書デ
ータを指定されたフレームに順に展開している。 【0038】即ち、レイアウト情報解析部16は、前記フ
レームの情報に従って文書データを展開するフレームを
判定し、同時にそのフレームの大きさを判定している。
そして、その指定されたフレームに、前記文属性に応じ
てレイアウト規則に従って、その文書データを展開制御
している。 【0039】この際、1文字切出し部12にて文書データ
が1文字毎に切出される都度、これに同期してカラム・
ラインカウンタ21の計数値がカウントアップされる。こ
のカラム・ラインカウンタ21による計数値は、比較部22
にて前記最大カラム・ライン値バッファ20にセットされ
た値と逐次比較されており、その比較結果は判定部23に
て判定されている。この判定部23にて前記1文字切出し
部12にて切出された文字のレイアウト位置が、そのとき
指定されているフレーム内であるか否かが判定される。 【0040】そして、レイアウト制御されて展開される
文書データの割当て位置が、その指定されたフレームを
越えたことが判定されると、フレーム切換え部24が起動
されて、前記文書データ割当て部13による文書データの
割当てフレームが次のフレームに更新制御されるように
なっている。 【0041】このようにして文書展開部9は、そのレイ
アウト規則辞書9aに設定されているレイアウト規則に従
って、その文書データを出力すべきフレームを設定して
いる。そして設定したフレームに、上記文属性に応じて
設定されたレイアウト規則に従ってその文書データを展
開している。 【0042】例えば図12に示す如く求められた論理構
造の文書データにあっては、第1文が標題であり、その
レイアウト規則が「lf」「Ce」「ds;1」で示さ
れることから、先ずレイアウト情報解析部16では前記最
大カラム・ライン値バッファ20から、その設定されたフ
レームの最大カラム・ライン数を求め、例えば (MAXライン−対象文の文字数)÷2 等として、そのセンタリングして表示出力すべき文字位
置を求めている。このデータによって前記カラム・ライ
ンカウンタ21の計数値がプリセット的に変更され、その
変更位置からその対象文の文書データの展開、つまり文
字位置の割当てが行われる。 【0043】その後、対象文の文字データの出力割当て
が終了した時点で、「ds;1」なる情報に従って強制
改行され、出力された標題を示す文字列の下に1行分の
空白行が設定される。 【0044】このような文書データの出力(展開)制御
が、前述した如く切出された各文毎に、その文について
求められた論理構造に従って順次行われ、その文書デー
タが所定のフレームに順に展開されていく。 【0045】この結果として、例えば図16に例示する
ように、図12に示す如く階層的論理構造が求められた
文書データが、それに対して指定されたレイアウト規則
に従って出力展開されることになる。 【0046】かくしてこのように構成された装置によれ
ば、入力文書データからその文書の階層的論理構造が求
められ、その階層的論理構造に従う文書データのレイア
ウト規則に従ってその文書データが、設定されたフレー
ム毎にその文属性に応じてそれぞれ定められたレイアウ
ト形式で展開されることになる。具体的には定められた
フレームに文書データが順に割付けられ、またその文章
の階層的論理構造に従う各文の文書構造の情報、つまり
その文属性に従って、例えば強制改行やセンタリング等
の制御が行われて文書データの展開が行われる。従っ
て、特に各見出し文と、これら見出し文に続く本文の関
係について、各見出し文の展開開始位置を揃え、これら
各見出し文に続く本文の展開開始位置を、対応する見出
し文のそれと異ならした位置で揃えるようにもできるよ
うになり、見出し文とこれに続く本文とが一見して区別
できる見易い文書を自動的に作成できることになる。ま
た、文書作成時や文書編集時等の文書処理を、そのレイ
アウト形式を配慮することなしに文書内容のみに着目し
て効率良く実行することができる。しかも、このように
して文書処理しても、上述した如く解析された階層的文
書構造、およびその文書構造(文属性)によって指定さ
れるレイアウト規則によって、その文書データの出力レ
イアウト形式が自動的に制御されるので、全体的に統一
のとれた文書形式でその文書を作成することが可能とな
る。 【0047】従って文書の出力形式の制御の為に文書作
成等の思考が妨げられることがなく、その文書処理を簡
易に、且つ効果的に行なうことが可能となる等の実用上
多大なる効果が奏せられる。 【0048】尚、本発明は上述した実施例に限定される
ものではない。例えば文書の論理構造を示すデータ形式
や、その論理構造を求める為の規則、更には文書データ
の出力形式を定めるレイアウト規則は、その仕様に応じ
て定めれば良いものである。また字体(文字フォント)
の変形を考慮した見出しの抽出と、文書構造の判定処
理、更にはその出力制御を行なうようにしても良い。こ
の場合、出力文字の高輝度表示や反転表示等を同時に制
御することも勿論可能であり、そのような制御情報をレ
イアウト規則として設定しておけば十分である。 【0049】また上述した例では、文書データの階層的
論理構造を求めた後、その出力レイアウト形式の制御を
行なったが、1文毎にそのレイアウト展開処理を行なっ
ても良い。この場合、その論理構造を一旦蓄積すること
なく、直接的にレイアウト展開処理に用いるようにして
も良い。更には、1つの文属性について複数のレイアウ
ト規則を準備しておき、その中から選択的にレイアウト
規則を適用することも可能である。これによって同一文
属性で異なった用途のレイアウト形式、例えば学会論文
形式と社内報告書形式等に適宜変換することができ、種
々のレイアウト編集を容易に行うことが可能となる。ま
たここでは日本語を例に説明したが、他国語に対しても
同様に適用可能なことは勿論のことである。その他、本
発明はその要旨を逸脱しない範囲で種々変形して実施す
ることができる。 【0050】 【発明の効果】以上説明したように本発明によれば、
出し文とこれに続く本文とが一見して区別できる見易い
文書を自動的に作成できる。したがって、ユーザが文書
データの入力時や編集時に一々文書の出力レイアウト形
式のためにその思考過程が妨げられることなく、すなわ
ち、見出し文と本文との位置関係を整えることを考慮す
ることなく、文書処理を効果的に進めることが可能にな
DETAILED DESCRIPTION OF THE INVENTION [0001] BACKGROUND OF THE INVENTION The present invention relates to a document data output layer.
Document layers that can effectively support out-of-format
Uto method. [0002] 2. Description of the Related Art In a document processing device such as a word processor.
Is a system of code information such as character codes and punctuation marks.
Document data is input as a column. And that code
Register the document data represented by a series of information in a document file
Or output to a printer or display. However, the character string indicated by the code information is
The document is very difficult to read if you just output it.
No. So, in general, a group of sentence breaks
Insert a line feed code at the position and the next sentence after the line feed position
Insert a space code at the beginning of the
Then, the document format is adjusted. Furthermore, the entire document is divided into a plurality of chapters and sections, for example.
Divide into the range of, and add a heading for each group,
To make the document easier to read, for example,
To be able to distinguish the positional relationship of the text that follows at a glance
Insert control codes such as tabs and indents to
Things are also done. However, it is directly related to the original document data.
No, for example, insert the control code such as the above line feed code
However, writing documents does not hinder the thinking of writing.
This causes a decrease in document creation efficiency. Further, the document created in this way is edited.
When re-doing, delete the control code mentioned above or
It is necessary to insert it in another place. this
At this time, the document structure is controlled by the control code inserted in the document data.
Due to changes in structure, for example, a document with several pages
When editing, unify the document structure as a whole
Had problems such as requiring a lot of labor. For example
To unify the document formats, see the document format several pages before.
Procedures such as lighting are required. Therefore, you can easily
It is impossible to proceed with the editing process and the processing efficiency is improved.
I couldn't hope for it. [0007] SUMMARY OF THE INVENTION
It was made with consideration given to the situation, especially when finding document data.
Check that the text and the text that follows it are visually distinguishable.
Can be processed out, eliminating the hassle of document processing.
Document layout that can be erased to enable effective document processing
The purpose is to provide a method of [0008] Means for Solving the Problems The present inventionRelating to the first invention of
The document layout method to be used depends on the input document data.
Distinguish between the starting sentence and the sentence following this heading sentence,
Pre-stored for associating type and deployment start position
Align the start positions of multiple headline sentences according to the rules
Corresponds with the expansion start position of the sentence following these headline sentences
Align it at a position different from that of the headline
Then, the document data that has undergone this processing is expanded to output means.
Characterized by.Document according to the second invention of the present invention
The layout method uses headings from the input document data.
Is distinguished from the sentence following this heading sentence,
By analyzing the hierarchical level of the sentence that is determined to be present,
Pre-stored rules for associating with deployment start position
Of multiple headlines with the same hierarchical level according to
The start position of other headings with different hierarchical levels
In addition to aligning at a position different from the deployment start position,
Heading sentence corresponding to the expansion start position of the sentence following the heading sentence of
Process it so that it is aligned at a position different from that of
A special feature is that the processed document data is expanded to output means.
Sign. [0009] [Action]According to the first aspect of the present invention, sentence types (found
(Sentence or sentence following headline) and the expansion start position
Document to be input with rules for skipping stored in advance
The data was created without consideration of the output layout format.
Even if it is,
It distinguishes between the following sentence and
Sentences that follow the headline sentence while aligning the expansion start positions
The starting position of the expansion of the is different from that of the corresponding headline
They can be aligned by position, and the headline and the text that follows
Can automatically create easy-to-read documents that can be distinguished at first glance
To.According to the second aspect of the present invention, the type of sentence (heading sentence
Or the sentence following the headline and which hierarchical level)
The rules for associating with the start position are stored in advance.
And input document data considers output layout format
Even if it was created without
It is a heading sentence by distinguishing between the beginning sentence and the sentence following the heading sentence.
Analyze the hierarchical level of the sentence determined to be
Start expansion of multiple headline sentences that have the same hierarchical level
Expanding the position of other headings with different hierarchical levels
Aligning at a position different from the start position and finding the multiple
The expansion start position of the sentence following the sentence is that of the corresponding heading sentence.
Can be aligned at different positions, and different levels of hierarchy
Can be distinguished at first glance, and the headline
And an easy-to-read document that can be distinguished at a glance from the text that follows
Can be created automatically. [0010] Embodiments of the present invention will now be described with reference to the drawings.
explain. FIG. 1 is a diagram showing a schematic configuration of the embodiment.
In FIG. 1, reference numeral 1 is a document management unit that constitutes the main body of the apparatus. Ki
Sequence of code information via the input unit 2 consisting of a keyboard etc.
The document data input as is, for example, as shown in FIG.
Has a unique document structure, and controls the document management unit 1 described above.
Is stored in the original text storage section 3 and is used for document processing.
Then, the document data subjected to the document processing by the document management unit 1 is
Under the control of the display control unit 4, it is displayed on the display unit 5.
It has become. FIG. 3 shows a document structure solution for input document data.
It shows the analysis processing procedure, and along with this flow
The function of the device will be described. Is the document management unit 1 the input unit 2?
Document data (step a),
The delimiter code in the document data is stored in the storage unit 3.
Mode, for example, a line feed code is detected,
A group of sentences that are further separated is extracted in order. same
Sometimes the length of one sentence is measured. And extracted 1
Manages and controls the execution of the following processes in units of statements
ing. The headline extraction unit 6 is extracted by the document management unit 1.
Check whether there is a possibility that the one sentence
Information on the length of one sentence measured as described above, and the entry word dictionary
The determination is made by referring to 6a (step b). This headword
Book 6a is an example of words and symbols that appear frequently as headings.
For example, as shown in Fig. 4, the categories are classified into categories and registered in advance.
It was recorded. Specifically, the appearance frequency
High, such as "Introduction" or "Synopsis"
Registered collectively in the category of "delivery reserved words" and found again
Use the numbers and symbols that appear frequently as
It is registered collectively for each Gori. The headline extraction unit 6 determines that the length of the extracted sentence is
Determine if it is within a predetermined number of characters (eg 40 characters)
However, if it is within the specified number of characters, there is a possibility of heading.
It is determined that there is. And about this sentence, that sentence
(Words, numbers, and symbols shown in the sequence of code information)
Search whether it is registered in the word dictionary 6a (step
B), the corresponding word / phrase is registered in the entry word dictionary 6a.
If this is the case, use this as a heading candidate (step
c). Therefore, the headline judging section 7 determines the headline rule.
Heading rules as shown in FIGS. 5 to 7 stored in the rule dictionary 7a
On the basis of the
To determine whether or not the generated sentence matches the above heading rules.
(Step c), the heading candidate is mapped to the heading rule.
If this is the case, it is judged that this is a headline.
(Step e). In addition, the headline extraction unit 6
Judge as a sentence in which no word was detected and as a candidate for heading
Sentences that are not included in the above heading rules
Is determined not to be a headline sentence (step f). Toes
It is determined that the text is a document body such as a paragraph. The document structure determination unit 8 finds the index as described above.
For each sentence determined to be a sentence or other sentence
Stored in the document structure rule dictionary 8a, for example, FIGS.
According to the document structure rules as shown in 10, the sentence is a chapter heading.
, Section headings, paragraphs, etc.
Each physical structure is judged (step g). This sentence
The logical structure of each sentence determined by the call structure determination unit 8 is obtained.
(Step h), the information of the logical structure is added to each sentence.
These are associated and stored in the logical structure storage unit 10 (step
I). Note that the logical structure analysis based on the document structure rule is lost.
There is an error in the logical structure of the lost sentence
For example, an error such as urging the input document data to be corrected
Error processing is performed (step j). The document expansion unit 9 is for the above document structure analysis processing.
Hierarchical Logic for Input Document Data Obtained by
According to the structure, each sentence that is input according to its logical structure
It is expanded to the output part in the specified layout format. That is,
The layout rule dictionary 9a of the document expansion unit 9 has its logical structure.
Determine the output layout format determined according to the type of manufacturing
The layout rule to be used is stored. Document development unit 9
Is the logic obtained for each sentence as described above.
The document data of each sentence is displayed on the display unit 5 according to the structure.
The layout rules for showing the above layout rule dictionary 9a
And the document data of each sentence according to the layout rules.
Data are expanded in the display control unit 4. The table
The display control unit 4 expands the document data expanded in this way.
Display of document data by the display unit 5 described above according to the structure
Will be controlled. Thus configured like this
According to the device, the input document data is hierarchically structured as follows.
The logical structure is analyzed. When the document data is input from the input unit 2,
When the document data is sequentially stored in the original text storage unit 3,
Then, the document management unit 1 performs a division process. This break
The reason is that the input code information is line feed code or space code.
Or is it a delimiter such as "..." ";" ":"
The input code information based on these delimiter codes.
This is done by cutting out a series of reports for each sentence. this
Of the code information delimited by the above delimiter code
The length of the sentence (number of characters) by counting the length of the sequence
Is measured. Now, the document data shown in FIG. 2 is input.
The case where the line is separated is explained by the line feed code.
The first sentence, "Document Structure Understanding System", and
And the sentence “Taro Okawa” on the second line,
For each sentence, the corresponding phrase is registered in the entry word dictionary 6a.
It is not found in the headline extraction unit 6
It is determined that it is not. The document structure determination unit 8 uses this first line
The eye sentence is, for example, each phrase that appears at the beginning of the document, etc.
The attribute is a title because it conforms to the rules of
To judge. For the sentence on the second line, the proper noun,
A sentence that appears after the title, especially a proper noun that indicates a person's name
It is determined to be the author's name according to the rules such as Then, the sentence "1. Introduction ”
Is given, "1" ". 』
The word "Introduction" comes from the entry word dictionary 6a.
Found. As a result, this sentence becomes heading candidate A
The categories that have been judged and that also constitute the heading candidate
Re as "(number part) (postfix part) (heading reserved word)"
Desired. Then, the headline judging section 7 determines the headline candidate.
The sentence structure judged as A conforms to the heading rules
It is checked whether or not there is a reference to the heading rule dictionary 7a. This look
First, the categorization of the heading candidate A
The analysis structure is analyzed and the analysis structure is shown in Fig. 5 to Fig. 7.
It is determined whether the conditions for the headline are satisfied.
In this case, the above category “(number part) (postfix part) (found
Reserved words) ”in accordance with the rules shown in FIGS.
It is analyzed as shown in Fig.
Is confirmed, it is determined to be the heading B.
It should be noted that, by this determination processing, the arrangement of the above categories is shown in FIG.
It is determined that none of the conditions shown in FIG.
If so, the above heading candidate is determined not to be a heading.
Will be. When the above-mentioned heading B is obtained,
Next, the document structure is determined by the document structure determination unit 8 as shown in FIGS.
It is determined which of the rules illustrated in 10 is applicable.
In this case, the logical structure of the sentence analyzed so far is
As described above, the title is the title and the author is the title, and the chapter heading is displayed.
Since it does not appear, it is checked against the heading rule shown in FIG.
You. By this collation, the above sentence “1. Introduction ”
Then, the candidates are conditions (1) (1,1) (1,
Found to match (1,1,1) (1,1,1,1)
And the headline “1. "Introduction" constitutes chapter heading C
Is uniquely determined. And the information of its logical structure
The information is stored in the logical structure storage unit 10. Then, the sentences on the 4th to 5th lines are input.
If the number of characters is
Since it exceeds the number of characters, it is judged as a sentence other than the headline
Is done. And in this case, the sentence is shown in FIG.
A paragraph is constructed because it conforms to the document structure rules shown below.
It is determined that the sentence is In the same way,
It is determined whether the sentence delimited by the
And the document structure is checked against the document structure rule dictionary 8a.
Are sequentially requested. For example, the sentences forming the headline are input again.
Then, it is detected as the heading candidate A in the same manner as the previous example.
Then, it is determined that the heading rules shown in FIGS.
Is done. And for this heading B, the logical structure
The chapter headings have already been detected from the contents of the storage unit 10.
First, refer to the document structure rule shown in FIG.
The condition of the pattern of heading B above
Find out. Then, the pattern of the heading candidate is the condition (1,
1) (2,1) (3,1) (4,1)
Is a heading of the same level as the previously requested chapter heading C
It is determined that there is a possibility. After that, in Figure 8
The document structure shown in FIG. 8 is checked by checking whether or not it conforms to the rules shown.
Rule condition (1) (1,1) (1,1,2) (1,1,
2,2) (1,1,2,2,1)
Same level as the previous chapter heading that has already been determined
It is determined to be the chapter heading. A headline sentence with a circled number at the beginning gives
If you get a headline with a similar pattern
Matching with the rules (conditions) shown in Fig. 9 because they have not been detected
Matching is unsuccessful. As a result of this,
It is determined that the
It is. After that, in the collation with the document structure rule shown in FIG.
Therefore, for example, condition (1) (1,1) (1,1,2)
(1,1,2,2) (1,1,2,2,2) (1,1,
2, 2, 2, 1) is detected and the headline
Judged as a bulleted heading. When the sentence is determined to be a paragraph
Tells you what level of heading the paragraph received.
I may not understand. In such a case, for example,
Refer to the rules shown in 10 (b), and connect paragraphs and headings.
You should determine the continuity relationship and set the level.
No. By such document structure analysis processing,
The document structure of each sentence that makes up the input document data of
Required document data is the information of its hierarchical logical structure
For example, as shown in FIG.
It is stored in the manufacturing storage unit 10. In the logical structure data of the document shown in FIG.
To explain briefly, the information on the document structure is [
 ] Are associated with the document data enclosed in
Enclosed in {}, the numerical value at the beginning indicates the hierarchical level of the sentence.
Bell, the sentence attribute with the following information, and the data starting with z
Shows the analysis result of document data. This document data
The data analysis results have the following meanings, for example:
You. Z1: symbol part, z2: start of alphanumeric brackets, z
3: reserved word part, z4: alphanumeric part 1, z5: alphanumeric part 2,
z6: end of alphanumeric brackets, z7: postfix 1, z21: heading
Reserved words, z22: Main headline start position, z23: Main headline
End position of main unit, z24: Heading symbol after back, z28: Beginning of content section
Position, z29: End position of content section. After the symbol having such a meaning, what the document data is
Or the number of the character
The analysis result of is expressed. Now, the document expansion unit 9
A hierarchical logical structure for the document data obtained as described above.
According to the manufacturing information, the document data is output as follows.
Have been deployed to. FIG. 13 shows the hardware structure of the document expanding section 9.
It shows. The logical structure data reading unit 11 is
The document data stored in the logical structure storage unit 10 as shown in FIG.
The data and its logical structure data are read out, and the document data
The data is cut out for each character by the 1-character cutout unit 12
It is given to the data allocation unit 13. At this time, sentence attribute extraction
Part 14 is a sentence attribute such as "title" or "auther" shown in FIG.
Data is extracted and given to the layout information detection unit 15.
In addition, the layout information analysis unit 16 uses the symbol z described above.
The logical structure information described by being added is read out. Here, in the layout rule dictionary 9a, for example,
As shown in FIGS. 14A and 14B, the document data is output.
According to the information about the frame (document frame) and the sentence attribute
It consists of information on how to output the sentence in layout.
The layout rules for the Specifically,
The frame information is displayed as shown in FIG. 14 (a).
Frame management number on the output device such as a printer
Information on output position and size of the frame
Display image from which the document data is output.
The surface or the frame configuration on the printing paper is, for example,
It is defined as shown in FIGS. 15 (a) and 15 (b).
I have. These frame information outputs document data
Is defined for each of the multiple frames set accordingly.
You. The layout rule reading unit 17
Read the frame rules from the layout rule dictionary 9a
The buffer format information buffer 18
The maximum number of columns in the frame, and
Seeking the maximum number of lines. This maximum number of columns / line
Number data set in max column / line value buffer 20
Is used to control the expansion and output of character data described below.
You. Also stored in the layout rule dictionary 9a
The layout rule regarding the sentence attribute is, for example, as shown in FIG.
It is defined as shown in (b). To this layout rule
Therefore, the document data for each type of sentence attribute is
How to lay out on a frame defined as
Whether to do it is regulated. Here, for example, the target character string is "lf"
Force a line break at the end of, the target character in "Ce"
Centering the columns is shown respectively. Also
One line after outputting the target document data with "ds; 1"
Is indicated as a line break, and the target sentence is indicated by "us; 1"
It is indicated that a line break for one line is performed before the call data is output.
Is done. In addition, 1 sentence from the left side of the frame with "ls; 1"
It is shown that a margin (blank) for a character is provided. FIG.
According to 4 (b), for example, for each headline, "l
s; 3 ”, the beginning of each lineDifferent from paragraph
At different positions and at different levels of hierarchy (eg item
Ls; 4) withThey will be aligned at different positions. still,
In the case of a paragraph, the first character of the first line is blank. Such a layout rule is used for the layout.
According to the type of sentence attribute,
Read from the layout rule dictionary 9a
It is given to the auto information analysis unit 16. The layout information analysis unit 16
Document data allocation based on required layout rules
Controls part 13 and cuts the document data cut out character by character as described above.
Data in the specified frames in order. That is, the layout information analysis unit 16 is
A frame that expands the document data according to the information of the frame
The size of the frame is determined at the same time.
Then, according to the sentence attribute, in the designated frame
Control the document data according to the layout rule
doing. At this time, the document data is extracted by the one-character cutout unit 12.
Whenever is cut out character by character, the column
The count value of the line counter 21 is incremented. This
The count value of the column / line counter 21 of the
At the maximum column / line value buffer 20
Values are sequentially compared with each other, and the comparison result is sent to the judgment unit 23.
Has been determined. This determination unit 23 cuts out the one character
The layout position of the characters cut out in part 12 is
It is determined whether the frame is within the designated frame. The layout is controlled and expanded.
The assigned position of the document data changes the specified frame
When it is determined that the frame number has been exceeded, the frame switching unit 24 is activated.
Of the document data by the document data allocation unit 13
Allocation frame is updated to the next frame
Has become. In this way, the document expanding unit 9
Follow the layout rules set in the OUT rule dictionary 9a.
Then, set the frame that should output the document data
I have. Then, in the set frame, according to the above sentence attribute
Display the document data according to the set layout rules.
We are open. For example, the logical structure obtained as shown in FIG.
The first sentence is the title of the created document data.
Layout rules are indicated by "lf", "Ce", "ds; 1"
Therefore, first, the layout information analysis unit 16
From the large column line value buffer 20,
Find the maximum number of columns and lines in the rem (MAX line-number of characters in target sentence) / 2 The character position that should be centered and displayed as output, etc.
I'm asking for a place. Based on this data, the column
The count value of the counter 21 is preset and changed.
Expand the document data of the target sentence from the change position, that is, the sentence
Character positions are assigned. After that, output allocation of character data of the target sentence
When is finished, it is forced according to the information "ds; 1"
One line below the character string indicating the title that has been inserted and output
A blank line is set. Output (expansion) control of such document data
However, for each sentence cut out as described above,
Sequentially according to the required logical structure, the document data
Data is sequentially expanded into a predetermined frame. As a result of this, an example is shown in FIG.
Thus, a hierarchical logical structure was obtained as shown in FIG.
The layout rule specified for the document data
The output will be expanded according to. Thus, according to the device thus constructed,
For example, the hierarchical logical structure of the document is obtained from the input document data.
And the layer of document data that follows the hierarchical logical structure
The document data is set according to the
A layout that is set according to the sentence attributes of each
It will be expanded in the format. Specifically stipulated
Document data is sequentially assigned to the frame, and the text
Information on the document structure of each sentence that follows the hierarchical logical structure of
According to the sentence attributes, for example, forced line feed and centering
Is controlled to develop the document data. Follow
The relationship between each headline and the text that follows these headings.
For the clerk, align the expansion start position of each heading
The starting position of the expansion of the text following each headline is found
You can even align them in a different position than the one in the sentence
At first glance, the headline sentence and the text that follows is distinguishable
You will be able to automatically create easy-to-read documents. Ma
Also, document processing such as document creation and document editing
Focus on only the document content without considering the out format
Can be executed efficiently. Moreover, like this
Hierarchical sentences analyzed as described above
Specified by the document structure and its document structure (sentence attribute)
The output rule of the document data
-Out format is automatically controlled, so it is unified throughout
It is possible to create the document in a well-documented format.
You. Therefore, in order to control the output format of the document, the document
Easy to process documents without disturbing thoughts such as success
Practical use such as easy and effective
A great effect is produced. The present invention is limited to the above-mentioned embodiments.
Not something. For example, a data format that indicates the logical structure of a document
And rules for obtaining its logical structure, and document data
The layout rule that determines the output format of
It is good to set it. Also font (character font)
Extraction of headings in consideration of transformation of documents and judgment process of document structure
Alternatively, the output control may be performed. This
In the case of
Of course, it is also possible to control such control information.
It is sufficient to set it as an out rule. In the above example, the document data is hierarchical.
After determining the logical structure, control the output layout format.
I did, but I did the layout expansion processing for each sentence
May be. In this case, temporarily accumulate the logical structure
Instead, use it directly for layout expansion processing
Is also good. Furthermore, multiple layouts for one sentence attribute
Prepared rules, and select layout from them
It is also possible to apply the rules. This makes the same sentence
Layout formats with different uses depending on attributes, such as academic papers
Formats and internal report formats can be converted as appropriate.
It is possible to easily edit each layout. Ma
Although here, Japanese is used as an example, but for other languages
Of course, the same applies. Other books
The invention is carried out with various modifications without departing from the scope of the invention.
Can be [0050] As described above, according to the present invention,You see
It is easy to see the printed text and the text that follows it at a glance
Documents can be created automatically. Therefore, the user can
Document output layout type when inputting or editing data
That is, the expression does not interfere with the thought process
Consider to arrange the positional relation between the headline and the main text
It is possible to effectively process documents without
To.

【図面の簡単な説明】 【図1】本発明の一実施例の概略構成を示す図。 【図2】入力文書データの一例を示す図。 【図3】文書構造解析処理の手続きの流れを示す図。 【図4】見出し語辞書の一例を示す図。 【図5】見出し抽出規則辞書の構成例を示す図。 【図6】見出し抽出規則辞書の構成例を示す図。 【図7】見出し抽出規則辞書の構成例を示す図。 【図8】文書構造規則辞書の構成例を示す図。 【図9】文書構造規則辞書の構成例を示す図。 【図10】文書構造規則辞書の構成例を示す図。 【図11】見出し文の解析構造を示す図。 【図12】論理構造記憶部に格納された文書構造の情報
の例を示す図。 【図13】文書展開部の構成例を示す図。 【図14】レイアウト規則辞書の構成例を示す図。 【図15】レイアウト規則によって示されるフレーム
(文書枠)の例を示す図。 【図16】レイアウト展開処理されて出力される文書形
式の例を示す図。 【符号の説明】 1…文書管理部、2…入力部、3…原文記憶部、4…表
示制御部、5…表示部、6…見出し抽出部、6a…見出し
語辞書、7…見出し判定部、7a…見出し規則辞書、8…
文書構造判定部、8a…文書構造規則部、9…文書展開
部、9a…レイアウト規則辞書、10…論理構造記憶部。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a diagram showing a schematic configuration of an embodiment of the present invention. FIG. 2 is a diagram showing an example of input document data. FIG. 3 is a diagram showing a procedure flow of document structure analysis processing. FIG. 4 is a diagram showing an example of a headword dictionary. FIG. 5 is a diagram showing a configuration example of a heading extraction rule dictionary. FIG. 6 is a diagram showing a configuration example of a heading extraction rule dictionary. FIG. 7 is a diagram showing a configuration example of a heading extraction rule dictionary. FIG. 8 is a diagram showing a configuration example of a document structure rule dictionary. FIG. 9 is a diagram showing a configuration example of a document structure rule dictionary. FIG. 10 is a diagram showing a configuration example of a document structure rule dictionary. FIG. 11 is a diagram showing an analysis structure of a headline sentence. FIG. 12 is a diagram showing an example of document structure information stored in a logical structure storage unit. FIG. 13 is a diagram illustrating a configuration example of a document development unit. FIG. 14 is a diagram showing a configuration example of a layout rule dictionary. FIG. 15 is a diagram showing an example of a frame (document frame) indicated by a layout rule. FIG. 16 is a diagram showing an example of a document format output after layout development processing. [Explanation of Codes] 1 ... Document management unit, 2 ... Input unit, 3 ... Original text storage unit, 4 ... Display control unit, 5 ... Display unit, 6 ... Headword extraction unit, 6a ... Headword dictionary, 7 ... Headword determination unit , 7a ... Heading rule dictionary, 8 ...
Document structure determination unit, 8a ... Document structure rule unit, 9 ... Document expansion unit, 9a ... Layout rule dictionary, 10 ... Logical structure storage unit.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 岡本 利夫 神奈川県川崎市幸区小向東芝町1番地 株式会社東芝総合研究所内 (56)参考文献 特開 昭60−24622(JP,A) bit 1983年12月号別冊 (Acm Computing Surveys ’82 コンピュータ・サイエンス), P.143   ────────────────────────────────────────────────── ─── Continuation of front page    (72) Inventor Toshio Okamoto               1 Komukai Toshiba-cho, Saiwai-ku, Kawasaki-shi, Kanagawa               Toshiba Research Institute, Ltd.                (56) References JP-A-60-24622 (JP, A)                 bit December 1983 separate volume (Acm                 Computing Surveys               '82 Computer Science),               P. 143

Claims (1)

(57)【特許請求の範囲】 1.入力される文書データから見出しとなる文とこの見
出し文に続く文とを判別し、 文の種類と展開開始位置とを関係付けるための予め記憶
された規則に従って複数の見出し文の展開開始位置を揃
えるとともにこれら見出し文に続く文の展開開始位置を
対応する見出し文のそれと異ならせた位置で揃えるよう
に処理し、 この処理の施された文書データを出力手段に展開する
とを特徴とする文書レイアウト方法。2. 入力される文書データから見出しとなる文とこの見
出し文に続く文とを判別し、 見出し文であると判別された文の階層レベルを解析し、 文の種類と展開開始位置とを関係付けるための予め記憶
された規則に従って同一の階層レベルを有する複数の見
出し文の展開開始位置を異なる階層レベルを有する他の
見出し文の展開開始位置とは異なる位置で揃えるととも
に前記複数の見出し文に続く文の展開開始位置を対応す
る見出し文のそれと異ならせた位置で揃えるように処理
し、 この処理の施された文書データを出力手段に展開するこ
とを特徴とする文書レイアウト方法。
(57) [Claims] 1. The sentence that becomes the headline from the input document dataThis look
Determines the sentence that follows the message, Pre-stored to correlate sentence type and expansion start position
Align the start positions of multiple headline sentences according to the rules
And the start position of the expansion of the sentence following these headline sentences.
Align at a position different from that of the corresponding headline
Processed into The document data that has undergone this processing is expanded to the output means. This
A document layout method characterized by:2. From the input document data, the sentence that becomes the headline and this
Determines the sentence that follows the message, Analyze the hierarchical level of the sentence that is determined to be a headline sentence, Pre-stored to correlate sentence type and expansion start position
Multiple views with the same hierarchical level according to the specified rules
The start position of the output sentence is different from that of other hierarchical levels.
When aligning at a position different from the start position of the headline
Corresponds to the expansion start position of the sentence following the plurality of headline sentences.
Processing to align at a position different from that of the headline
And The document data that has undergone this processing can be expanded to output means.
A document layout method characterized by:
JP4066951A 1992-03-25 1992-03-25 Document layout method Expired - Lifetime JP2682570B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4066951A JP2682570B2 (en) 1992-03-25 1992-03-25 Document layout method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4066951A JP2682570B2 (en) 1992-03-25 1992-03-25 Document layout method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP61072161A Division JPH077410B2 (en) 1986-03-29 1986-03-29 Document layout method

Publications (2)

Publication Number Publication Date
JPH0581253A JPH0581253A (en) 1993-04-02
JP2682570B2 true JP2682570B2 (en) 1997-11-26

Family

ID=13330838

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4066951A Expired - Lifetime JP2682570B2 (en) 1992-03-25 1992-03-25 Document layout method

Country Status (1)

Country Link
JP (1) JP2682570B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002157238A (en) 2000-09-06 2002-05-31 Seiko Epson Corp Browsing information preparing system, digital contents preparing system, digital contents distributing system and digital contents preparing program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6024622A (en) * 1983-07-21 1985-02-07 Toshiba Corp Document preparing device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
bit 1983年12月号別冊 (Acm Computing Surveys’82 コンピュータ・サイエンス),P.143

Also Published As

Publication number Publication date
JPH0581253A (en) 1993-04-02

Similar Documents

Publication Publication Date Title
EP0423683B1 (en) Apparatus for automatically generating index
US8447588B2 (en) Region-matching transducers for natural language processing
US8266169B2 (en) Complex queries for corpus indexing and search
US7797622B2 (en) Versatile page number detector
US4876665A (en) Document processing system deciding apparatus provided with selection functions
JP4808705B2 (en) Document information mining tool
JPH077410B2 (en) Document layout method
US20100161314A1 (en) Region-Matching Transducers for Text-Characterization
US20080065671A1 (en) Methods and apparatuses for detecting and labeling organizational tables in a document
US6125377A (en) Method and apparatus for proofreading a document using a computer system which detects inconsistencies in style
JP2682570B2 (en) Document layout method
US5835921A (en) Data processing apparatus for creating and storing a text file from input data
JPH0612447A (en) Summary sentence preparing device
JP2680500B2 (en) Document layout method
JP2680540B2 (en) Document layout method
JP2680501B2 (en) Document output method
JPS62249270A (en) Document processor
JP2829264B2 (en) Document layout method
JP2763227B2 (en) Format determination method
JPH09284446A (en) Information processor, digital copying machine and information recording medium
JPH0668748B2 (en) Document formatting method
Ernst-Gerlach et al. Identifying quotations in reference works and primary materials
Ilson An integrated approach to formatted document production
JPH07104865B2 (en) Sentence cutting device
JPH10293811A (en) Document recognition device and method, and program storage medium