JPS6364162A - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JPS6364162A
JPS6364162A JP61206835A JP20683586A JPS6364162A JP S6364162 A JPS6364162 A JP S6364162A JP 61206835 A JP61206835 A JP 61206835A JP 20683586 A JP20683586 A JP 20683586A JP S6364162 A JPS6364162 A JP S6364162A
Authority
JP
Japan
Prior art keywords
display control
document data
information
logical structure
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61206835A
Other languages
English (en)
Inventor
Miwako Doi
美和子 土井
Isamu Iwai
岩井 勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61206835A priority Critical patent/JPS6364162A/ja
Publication of JPS6364162A publication Critical patent/JPS6364162A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の目的〕 (産業上の利用分野) 本発明は文書データの論理構造を求め、それに基づき整
形表示を行う文書処理装置に関する。
(従来の技術) 一般的に文書は、その全体を章や節などのいくつかのま
とまりに分割されている。このまとまりごとに「1.は
じめに」や「第4節 CAD分野の特徴」などの見出し
がつけられている。
ユーザはこれらのまとまり単位に文書を作成したり1編
集したりする。ところが、従来の日本語ワードプロセッ
サなどの文書処理装置では、上述のような構造とは全く
関係のない単位1例えばページ単位などで文書データを
扱っている。このため例えばユーザが第1章と第3章を
入れ換えたりするような編集を行うには、まず、第1章
が何ページ目にあるかを捜し、第1章の先頭位置と最後
尾位置とを指定する。この後移動先を指定する。
しかし、この章が複数ページにわたっている場合には、
ページ単位にしか扱えないので、ページ単位に複数回の
指定を行わねばならない。又、同様のことを第3章に関
しても行わねばならない。さらに表示画面が数回変更さ
れるためにむだな時間がかかったりする。しかも、この
ときその操作が繁雑になるためミスも生じやすい。
以上のように従来の文書処理装置では1文書の構造に全
く関知しないため、様々な不都合が生じた。このような
問題を解決するものとして、文書の形態的特徴−見出し
に含まれる番号(「1.はじめに」の「1」)や見出し
を囲むかっこ((CADとCAE)のr(IJ)−にも
とづいて、章2節などの論理構造を求める文書処理装置
が提案されている。この文書処理装置によれば、上述の
ような章の入れかえは目次上で第1章と第3章を指示す
ることにより、簡単に実行できる。又、入れ替えると章
番号は自動的に修正されるので、ユーザは繁雑な手間か
ら免れる。
但し、この文書処理装置では1文書データのうち1文′
4i構造抽出に必要な形態的特徴のみを抽出して利用し
ている。このため、例えば!番号と見出し本体の間にあ
るスペース(「zロロCAD分野」の「ロロ」)や章見
出しと、章段落の間にある空行などの表示制御に関わる
情報は利用されていない。このため、ユーザが望んだ表
示と異なった整形結果が表示される場合が生じる。さら
に、ユーザが表示に対し、修正を行った場合はユーザが
入力した悄−報のうち、表示ii+J御て関わる情報は
捨てられてしまう。このため、「2.CAD分野」が気
にいらず、「20口CAD分野」と1で正してももう一
度処理を貴行すると、「2.cAD分封」にもどってし
まう。
(発明が解決しようとする問題点) 本発明はこのような事情を考慮してなされたもので、そ
の目的は文書データのうち1表示制御に関わる情報も積
極的に利用して処理を行うことにより、ユーザの意図を
いかして統一的な整形処理を可能とする文書処理装置を
提供することにある。
〔発明の構成〕
(問題点を解決するための手段) 本発明は、コード情報の系列として与える文書データを
解析し、論理構造の解析に必要な形態要素と表示制御に
関わる表示制御要素とを抽出するための規則を格納した
規則辞書を参照して、形態要素と表示制御要素を抽出し
、抽出された形態要素を解析して、前記文書データの章
? ?il’i J段落などの論理構造を求め前記表示
制御要素とあわせて整形表示するようにしたものである
(作用) かくして本発明によれば、与えられた文書データの論理
構造と、表示制御要素が抽出される。この結果、文書デ
ータの論理構造に沿って整形表示を行うときに、ユーザ
が入力した表示制御情報を再生して表示することが可能
となる。
(実施例) 以下1図面を参照して本発明の一実施例につき説明する
第1図は本発明の一実施例の概略構成図である。
1は装置本体をなす文書管理部である。2はキーボード
等からなる入力部で文書データや削除、挿入などの操作
指示が入力される。入力された文書データは原文記憶部
3に格納されると同時に表示制御部4の制御の下に表示
部5に、例えば第2図のように表示される。
文書管理部1は、基本的には原文記憶部に格納された文
書データの区切りコード(例えば改行コードで、第2図
中のCR)を検出し、これを1文として(これにより文
番号が付される)以下の処理実行を管理制御する。情報
抽出部8は、1文がいかなる形態要素と表示制御要素か
ら構成されているかその規則を格納した例えば、第3図
に示すような規則辞書9を参照して上記1文を解析して
形態要素と表示制御要素に分離する。第4図は、この抽
出処理の流れを示すものである。形態要素は章2節など
を解析する論理構造解析部6へ送られる。一方の表示制
御要素は、個別表示制御情報記憶部11へ送られ、格納
される。論理構造解析部6は、この形態要素のつながり
関係、前後の文の構造をもとに章2節などの論理構造を
判定する。
第10図は、このような論理構造の解析処理の流れを示
すものである。解析された論理構造は、論理構造記憶部
7に格納される。その結果は、例えば第5図に示すよう
になっている。
表示制御部4は、論理構造記憶部7に格納された論理構
造に沿って表示に関する標準的な情報を記憶した表示制
御情報記憶部10の内容と、上記文書データに固有な表
示制御情報を記憶した個別表示制御情報記憶部11の内
容を参照して、整形して、表示部5に表示する。その結
果は1例えば第6図のようになる。第7図は、上記の表
示制御の流れを示すものである。以下、まず第4図にそ
って抽出処理の流れを、次に第7図にそって表示制御の
流れを説明する。例えば、第2図1行目の文(CRまで
)が情報抽出部8に送られてきたとする。情報抽出部8
は第3図に示すような規則辞書9の内容を参照し、一致
する規則があるか(ステップa)を調べる。上から順に
調べるとこの場合規則■が一致する。右辺には非終端記
号(<〉)があるので(ステップC)、又ステップaに
戻り一致する規則を調べる。この場合、規則■につづけ
て規則■に一致する。「2」は〔番号〕。
「・」は〔記号〕となる。更に、ステップaに戻り、今
度は規則■に一致する。「口」は(見出し空白)となる
。次には規則0に一致し、非終端記号はなくなるので、
ステップdに移る。形態要素であるr2J  r、j 
 r文法」は論理構造解析部6に送る。又、表示制御要
素である「口」は、個別表示制御情報記憶部10に例え
ば、第8図のように書き込むC文番号1)。第2行目は
、規則■のみに一致し、第8図のように書き込まれる。
以下同様にして分析され、第2図の文書の表示制御要素
は、第8図のようになる。
次に、第7図にそって表示制御処理を説明する。
まず、第9図に示すような表示制御情報記憶部10の内
容にもとづき、各カテゴリの各属性の値をセットする。
値が複数ある場合には、2g1位の値にセットされる(
ステップa)。セットされた値を第9図では「★」印で
示されている。セットフラグ1行列の引数kを0に、そ
して1行列f1gk)をOにする(ステップb)。文番
号iiを1にセットする(ステップC)。第11番目の
文の論理属性を論理属性記憶部7(第5図)から、固有
の表示制御情報を個別表示制御情報記憶部11(第8図
)から読み込む(ステップd)。ここで固有表示制御情
報はあるとする(ステップe)。今、1行列月g(k)
はすべてOであるので、第1文目の論理属性とは等しく
ない(ステップh)。従って、表示制御情報を固有情報
に従ってセットしなおす。
この場合は、「見出し空白」の「個数1」なので、カテ
ゴリ: 「見出し」の属性: 「見出し空白」のセット
を「空白O」から「空白1」1こセットしなおす。(第
9図の矢印2)このとき、第2文月の固有情報は空行で
あるが、属性:「後文」の値−空行1と−rするので、
この情報は無視される。
又、1行列月g(k)には、iiの値1がセットされ。
kには1加算される(ステップg)。
次に、この表示制御情報にそつて第6図の1行目〜3行
目のように表示される。つまり、属性:「前文」の値が
「空行1」なので、1行目は空行、属性:「後文」の値
が「空行1」なので、見出しの後には空行が表示される
。又「番号種」は「一般数字」で「フォント」は「ロー
マン」であるので「2」が「下線」は「有」なので、見
出し全体に下線が引かれる。又「見出し空白」は新しく
セットされた「空白1」にそって、「、」の後に空白1
文字が表示され1次に見出し本体である「文法」が表示
される。次に、ilは1加算され(ステップj )、次
の文の処理が実行される。しかし。
第3文の属性はrNulJなので(ステップt)処理は
、ステップjに戻り、第4文月の処理に移る。
以下、同様にして、処理が行われる。但し、第15文(
第2図で300行目の処理では、この文の固有情報はN
ullである。従って、カテゴリ:「章見出し」の表示
制御部1aをそのまま用いる。
その結果、第6図32〜33行目のようになる。
このとき、第2図の30行目では、前後の空行かなく、
かつ見出しと番号との間に空白はなかったが、第6図3
2〜33行目では先出の第2章の章見出しと同様に表示
されている。又、例えば、ひと度、第6図のように整形
表示されたものに対しユーザが修正を行い、例えば第4
行目の番号「2゜1」が全角から半角に修正されたとす
る。すると修正があったこの3文目のみに関する解析が
やり直され、第8図の個別表示制御情報記憶部11の内
容は、「番号種:牛角」に書きかえられ、以下節見出し
の番号はすべて半角に書きかえられる。
さらに文番号の第15文月(第6図の32行目)に対し
て、偏集があり下線が消されたとする。このとき個別表
示制御情報記憶部の内容は%l’Nulljから「下線
:無」に、書き換えられる。表示のとき、第7図ステッ
プhで、第15文の論理属性はflg(0) (今は文
番号1を指している)文の論理属性と等しいことが判る
。つまり、この文書データでは「章見出し」の表示制御
情報は文番号1において既に一度セットし直されている
。従って、第7図のフローチャートでは、先のセットが
有効であるので、セットし直しがおこらない。
この問題点を改良するには、ステップhでyesと判定
された後の処理を第11図のように変更すればよい。つ
まり、表示制御情報を後に修正された値にセットし直す
(ステップm)。もし、先にセットされた文番号f1g
(kk)がiIより小さければ(ステップn)、つまり
、その文と同一の論理構造の文が前方にある場合には、
前にさかのぼって(ステップ0)、核間−の文の表示を
やり直す。
文が後方にある場合には、そのまま表示を行う。
今の場合は、第1文にさかのぼって表示の修正が行われ
る。
以上のように、本装置によれば、ユーザが入力した表示
制御情報を忠実に再現するだけでなく、同一の論理属性
に関しては、同一の表示となるように表示制御がなされ
るので、ユーザへの負担が少なく、かつユーザの望んだ
表示を文書全体に対して統一的に実行できるのでその効
果は゛大きい。
なお1本発明は上述の実施例に限定されるものではない
。例えば、表示制御情報の属性や値は他の形式をとるよ
うに変えることもできる。又1日本語を例に説明したが
他国語に対しても同様に適用可能である。又、抽出に用
いる規則も対象とする文書の特徴に応じて変更すること
もできる。更に個別表示制御情報が重複したときに先に
指定されている情報を選ぶか、あるいは後から指定され
た情報を選ぶかをユーザが判断し、指示するようにする
ことも可能である。これらの種々の変形、応用は本発明
の要旨を逸脱しない範囲ですべて本発明に含まれる。
〔発明の効果〕
以上本発明によれば、章9節などの論理属性と。
これらに関する個別表示制御情報を抽出することができ
るので、これらに従ってユーザの意図を生かした文書処
理を効果的に進めることができるのでその効果は大きい
【図面の簡単な説明】
第1図は本発明の一実施例装置の概略構成図。 第2図は入力文書データの一例を示す図、第3図は抽出
規則の一例を示す図、第4図は抽出処理の流れを示す図
、第5図は論理構造記憶部の構成を示す図、第6図は入
力文書データの整形結果例を示す図、第7図は表示制御
処理の流れを示す図、第8図は入力文書データに固有な
個別表示制御情報記憶部の構成を示す図、第9図は一般
の表示制御情報記憶部の構成を示す図、第10因は論理
構造の解析処理の流れを示す図、第11図は第7図の流
れ図の改良を示す図である。 1・・・文書管理部、2・・・入力部、3・・・原文記
憶部、4・・・表示制御部、5・・・表示部、6・・・
論理構造解析部、7・・・論理構造記憶部、8・・・情
報抽出部、9・・・規則辞書、10・・・表示制御情報
記憶部% 11・・・個別表示制御情報記憶部。 代理人 弁理士 則 近 憲 佑 同    竹 花 喜久男 第  2 図 第  3 図 第  4 図 −第  7 図 第  8 図 第9図 第10図

Claims (3)

    【特許請求の範囲】
  1. (1)コード情報の系列からなる文書データを入力する
    ための入力手段と、入力された文書データから形態的特
    徴に関する情報及び表示制御に関する情報を抽出する抽
    出手段と、この抽出手段より抽出された前記文書データ
    の形態的特徴に関する情報により章、節等の論理構造を
    生成する論理構造解析手段と、この論理構造解析手段に
    より生成された前記文書データの論理構造を記憶する論
    理構造記憶手段と、前記抽出手段より抽出された前記文
    書データの表示制御に関する情報を記憶する個別情報記
    憶手段と、前記論理構造記憶手段及び個別情報記憶手段
    の内容に基いて前記文書データを整形表示するための表
    示制御手段とを具備したことを特徴とする文書処理装置
  2. (2)表示制御手段は、前記個別情報記憶手段に記憶さ
    れた表示制御に関する情報が重複する場合、これらに基
    いて整形表示された夫々の文書データを表示するもので
    あり、入力手段はこれらの1候補を選択するものである
    特許請求の範囲第1項記載の文書処理装置。
  3. (3)抽出手段は前記入力手段より入力された操作系列
    情報から表示制御に関する情報を抽出するものである特
    許請求の範囲第1項記載の文書処理装置。
JP61206835A 1986-09-04 1986-09-04 文書処理装置 Pending JPS6364162A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61206835A JPS6364162A (ja) 1986-09-04 1986-09-04 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61206835A JPS6364162A (ja) 1986-09-04 1986-09-04 文書処理装置

Publications (1)

Publication Number Publication Date
JPS6364162A true JPS6364162A (ja) 1988-03-22

Family

ID=16529855

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61206835A Pending JPS6364162A (ja) 1986-09-04 1986-09-04 文書処理装置

Country Status (1)

Country Link
JP (1) JPS6364162A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0573548A (ja) * 1990-12-18 1993-03-26 Casio Comput Co Ltd 文書整形装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0573548A (ja) * 1990-12-18 1993-03-26 Casio Comput Co Ltd 文書整形装置

Similar Documents

Publication Publication Date Title
JPH11316760A (ja) 位置指示情報を使用してドキュメントの要約を生成する方法とシステム
US20070242071A1 (en) Character Display System
KR920002668B1 (ko) 문서정형장치
JPS62245367A (ja) 文書処理装置
JPS58192173A (ja) 機械翻訳装置
JPS59165179A (ja) 辞書引方式
JPH08221417A (ja) 構造化文書の新旧対照編集装置
JPS6364162A (ja) 文書処理装置
JPS61166676A (ja) 文字処理装置における辞書作成方式
JP3029822B2 (ja) 文書処理装置、文書処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3131432B2 (ja) 機械翻訳方法及び機械翻訳装置
JPH03233669A (ja) 文書作成装置
JPS62245366A (ja) 文書処理装置
JPH03185559A (ja) 文書整形装置及び文書整形方法
JP3847801B2 (ja) 文字処理装置及びその処理方法
JPS58151677A (ja) 翻訳文編集方法
JP2893239B2 (ja) 翻訳支援辞書検索表示システム
JPH0612453A (ja) 未知語抽出登録装置
JPS59135533A (ja) 校正方式
JPH11316792A (ja) 情報処理装置及び帳表作成方法
JPS6366663A (ja) 文書構造管理方式
JPH07160720A (ja) 機械で読み取り可能な情報の翻訳を支援し、効率化する装置及びその方法
JPH01261775A (ja) 文書編集装置における文書の登録方法
JPH02136956A (ja) レイアウト情報の抽出方法
JPS62202259A (ja) 文書作成装置