JPS6366663A - 文書構造管理方式 - Google Patents

文書構造管理方式

Info

Publication number
JPS6366663A
JPS6366663A JP61210566A JP21056686A JPS6366663A JP S6366663 A JPS6366663 A JP S6366663A JP 61210566 A JP61210566 A JP 61210566A JP 21056686 A JP21056686 A JP 21056686A JP S6366663 A JPS6366663 A JP S6366663A
Authority
JP
Japan
Prior art keywords
sentence
document
attribute
document structure
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61210566A
Other languages
English (en)
Inventor
Isamu Iwai
岩井 勇
Miwako Doi
美和子 土井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61210566A priority Critical patent/JPS6366663A/ja
Publication of JPS6366663A publication Critical patent/JPS6366663A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の目的〕 (産業上の利用分野) この発明は、文書データの章9節、箇条妥き等の論理構
造を記憶し、論理構造の編集処理を効果的に行ない得る
ようにした文書構造管理方式に関する。
(従来の技術) 従来のワードプロセッサはカナ漢字変換などで文書デー
タを入力すると、計算機の内部では文書データは単に漢
字コード列あるいはレイアウトのための制御コードを含
むデータ列として記憶されているだけであった。そのた
め1こ文書データのbi集、例えば削除、訂正等はユー
ザが編集する範囲を表示された文字列上を指示すること
により行なっていた。また、第1章と第2章の間に別文
書から新たに章を挿入する場合、第2章は第3章に、第
4章は第5章に以下文章の最後才での章番号が繰り上が
るが、この場合従来のワードプロセッサでは、ユーザが
第2章の文のr2Jの文字にカーソルを移動し、「2」
をr3Jに訂正するという操作を全文に渡ってユーザが
操作しなければならなかった。そのため、多くの時間を
費し、また訂正誤りを起す原因となっていた。
同様な問題点として、文中において1〜図1に示す〜“
のように、図拳表番号を参照したり1文献〔1〕で述べ
ているようにへ“のように参考文献の参照など、文中に
おいて参照を行なう場合において、例えば図1の前に新
たに図を挿入しようとすると、文中の1〜図1で示すへ
“の「図1jは「図2」になる。この時、従来のワード
プロセッサでは上記の述べた章の挿入と、同様、全文に
渡って文中の「図1」の文字列を「図2jに・変更しな
ければならなかった。このように従来のワードプロセッ
サにおいては、計算機の内部メモリには単に文列コード
の羅列でしかなく、すべてユーザが編集範囲、編集箇所
を指定しなければならず、多くの時間を費し、操作上多
くの問題があった。
(発明が解決しようとする問題点) 本発明はこのような事情を考慮してなされたもので、そ
の目的とするところはユーザの論理的編集操作を簡易か
つ効果的に行なうために、文書が持つ論理的な構造を計
算機の内部メモリに記憶することにより、上記した文書
編集処理の煩わしさを解消し、また誤りの発生を抑えて
効果的で迅速な文書編集処理を可能ならしめる文書処理
装置の文書構造管理方式を提供することにある。
〔発明の構成〕
(問題点を解決するための手段) 本発明は、コード情報の系列として与えられた文書デー
タに対して、見出し語辞書、見出し規則辞書2文書構造
規則辞書等を参照してその文書の構造を判定し、文と文
の物理的関係、文と文の論理的関係、文中で参照してい
る図・表番号等の参照関係、原文データとの対応関係等
を計算機メモリ上に階層的にリンクさせる・ため、各情
報をポインタで結合したセル構造からなる文書構造記憶
部を供するようにしたものである。
(作 用) かくして本発明によれば、入力された原文データから抽
出された論理情報のうち、改行コード等の制御コードで
区切られた文を一文とする単位に文書構造情報を記憶す
る複数のセル形式の記憶部を有する。先ず文と文の物理
的関係は1文のセル群の1つのセル(文属性セル)上の
物理的接続情報記憶部に隣接した文のセル群のアドレス
を記憶する。次に該文の章・節・箇条書き等の論理属性
は、セル群の1つのセル(論理属性セル)上の論理属性
記憶部に値として記憶される。文と文の論理的な関係、
すなわち文の論理的親子・兄弟等の階層関係はセル群の
1つのセル(論理属性セル)上の論理的接続情報記憶部
に、該当する文のセル群のアドレスが記憶される。
文中で参照される図・表番号、参考文献番号と参照対照
とのリンク関係は、該セル群の1つのセル(参照属性セ
ル)上の参照関係記憶部に、該当する参照対象文のセル
群のアドレスを記憶する。
また、原文データの対応は各文のセル群の1つのセル(
文、属性セル)上の原文データ対応記憶部に、原文デー
タ記憶部の該当文が記憶されている先頭アドレスを記憶
する。
各文の形態的構成要素の情報は、各文のセル群の1つの
セル(形態属性セル)上の形態属性記憶部に該当文の構
成要素情報が値として記憶される。
この結果、文書の各文の物理的あるいは論理的関係はセ
ル形式で階層的にリンクされ、記憶される。これにより
、文書の偏集処理、例えば章単位の削除処理等に対して
は、論理属性セルの論理的接続情報記憶部の接続ポイン
タを書き替えるだけで、倫理構造の編集処理を容易に行
なうことが可能となる。
(冥施例) 以下、図面を゛参照して本発明の一笑洩例につき説明す
る。
第1図は実施例装置の概略構成図である。第1図におい
て1は装置本体をなす文書管理部である。
キーボード等からなる入力部2を介してコード情報の系
列として入力される文書データは、上記文書管理部1の
制御の下で原文データ記憶部9に格納され、文書処理に
供される。そして文書管理部1にて文書処理された文書
データは、表示制御部12の制御の下で表示部13にて
表示されるようになっている。
入力された原文データに対して、1文検出部3は該原文
データ中の区切りコード、例えば改行コードを検出し、
この区切りコードにより区切られる1まとまりの文を/
[に検出している。そして抽出した1文を単位として、
以下に示す処理の実行を管理Φ制御している。
1文解析部5では、前記の区切りコードにより区切られ
た1大半位に処理される。第7図に入力部2から入力さ
れた原文データの例を示しである。
この原文データが1大半位に切り出されるき、原文デー
タ記憶部9に第8図(a)のように、1大半位に記憶さ
れる。
次に文書管理部1は情報記憶領域設定部4に対して、文
書構造記憶部10上に跋文の文属性セル領域を確保する
。と同時に、原文データ記憶部9に第・8図世)に示す
ように、原文データ格納アドレスと、文書構造記憶部1
0中の文属性セルの格納アドレスを対比させて記憶した
対応表を作成する。
さらに、情報記憶領域設定部4は、跋文の論理属性、形
態属性、参照属性を格納するための論理属性セル、形態
属性セル、参照属性セルの領域を確保し、上記4種類の
セルをポインタで接続する(第5図)。
次に、1文解析部5では該1文が文書中の見出し文であ
るかそうでないかを判定するために、見出し語辞書14
により、見出し語となりつる文字データを含むかのチェ
ックがなされ、1文データの構成要素を見出し規則辞書
15と対比しながら形態属性値を決定する。
これにより、属性登録部6により形態属性値を文書構造
記憶部中の該形態属性セルに登録、格納する。
次に構造解析部7では、文書全体に対して該1文が章の
見出しであるか、節の見出しであるか、あるいは段落で
あるのか等の論理的属性を決定するために、即に形態属
性セルに登録した該文以前の形態属性値も含めて、文書
構造規則辞書16とマツチングをとりながら文書の論理
構造を決定していく。
見出し語辞書14には第2図に示すデータが格納されて
いる。第3図には、見出し規則辞書15の具体例の一部
を示している。
第4図は、文書構造規則辞書16の具体例の一部である
構造解析部7で生成された論理構造属性値は遂次、大吉
管理部1を介して文書溝造登録部8により文書構造記憶
部10中の該論理属性セルへ格納登録される。
例えば、跋文が「章jの見出しと決定されると論理属性
値は「草jとして登録される。
また、同時に跋文の他の文との接続関係、すなわち入力
された文の順序である物理的関係、「第1章」・「第2
章」・・・のように「章Jの論理属性を持つ文は兄弟関
係にあるという論理的関係、あるいは「第2章」から「
第3章Jまでの1節」 「段落4文は「第2章Jの文の
子供の文であるという親子関係を示す論理的関係、さら
に、該文中で参照している図・表番号や参考文献番号が
文書中のどの文を参照しているかを示す参照関係等を、
文書構造記憶部10上の文属性セル、論理属性セル、参
照属性セル上に、前記物理的、論理的、参照関係を持つ
他の文属性セルのメモリ上のアドレスをポインタ形式で
登鎌−格納する。
第9図は生成された文書構造の文書構造記憶部10内の
セルの接続関係を概略的に示したものである。各セルの
先頭にはセル識別IDがあり、 (1は文属性セル、f
2は論理属性セル、f3は形態属性セル、  f4は参
照属性セルを表わしている。尚、本図において、文属性
セルの原・文データ記憶部へのポインタは省略しである
以上は文書の論理構造を文書構造記憶部に生成する場合
の実施例について説明したもので、第6図(a)でその
処理フロー・を示した。次に文書編集に伴う文書構造記
憶部中の編集処理について説明する。(第5図参照) 
例えば、文書の第2章全体を削除する場合には、「第1
章」の文の論理属性セルの第ポインタを「第2章Jの文
の文属性セルのアドレスを示していたものを「第3章」
の文の文属性セルのアドレスに置きかえ、さらに物理的
関係を示す「第1章」の文の文属性セル中の構文ポイン
タを[第3章jの文の文属性セルのアドレスに置き換え
る。また同時に、「第3章」の文の文属性セルの前文ポ
インタを「第1章」の文の文属性セルのアドレスに置−
換える処理を、文書構造編集部11が行う。まず原文デ
ータ記憶部中の原文データアドレスと文属性セルアドレ
スの対応テーブル(第8図(b))に対して、原文デー
タアドレ性セルアドレスに対する文書構造記憶部中の文
属性セル位置を検出し、さらに文属性セル中の論理属性
ポインタが指し示めす論理属性セル位置を検出する。そ
の時の論理属性セル中の兄ポインタの値が示す文属性セ
ルのアドレスは「第1章」の先頭の文の文属性アドレス
である。「第2章j全体を削除する場合では、「第2章
」の文の第ポインタの示す文属性セルは「第3章」を示
しているから、[第3章Jを示す[第2章Jの論理属性
セル中の第ポインタの値を「第1章Jの論理属性セル中
の第ポインタの値に置換えることにより、論理的関係は
「第2章」は切り離され、「第1章Jと「第3章Jが接
続されたことになる。物理的関係を示す次文、前文ポイ
ンタの付は換えは「第1@の文属性セル中の構文ポイン
タの値は、それまでri2章Jの先頭の文属性セルのア
ドレスであったが、削除処理によって「第3章Jの文の
先頭文の文属性セルアドレスを格納するようにする。ま
た「第3章Jの先頭文の文属性セル中の前文ポインタは
、「第1章」の先頭文の文属性セルアドレスの値を格納
する。
以上の処理について第6図(b)に処理フローとして示
した。
以上は、r章ノ単位の削除処理における文書構造記憶部
の編集処理であったが、r節j単位や、「箇条書きJ単
位も同様な処理で可能である。
また、削除処理だけでなく、「章J単位等の訂正、挿入
、コピー、移動等の編集処理においても上記のようにポ
インタの付は替え処理で容易に構造の編集を行なうこと
ができる。
また、編集処理の結果2章番号9節番号、あるいは図9
表番号、参考文献番号のシーケンスが崩れた場合には、
親、第ポインタをサーチし、その時の形態属性セル中の
ナンバリング情報をシーケンシャルになるように偏集す
ると同時に、対応する原文データの該当カラム位置のデ
ータを変更することにより、シーケンシャルなナンバリ
ングをユーザの指示によらず内部的に付は替えることが
可能である。
尚、本発明は上述した実施例に限定されるものではない
。例えば日本語文書だけでなく、英文やその他の言語に
おいても適用することが可能である。
また、本発明のセル情報以外にも、原文データにおいて
形態素解析や、構文解析によって得られた言語文法情報
を記憶するセル情報を付加することも可能である。また
、文の出力形態属性、すなわち出力文字の字体や字株あ
るいはサイズ、色。
文字1行ピッチあるいは高輝度1反転、下線付等のアト
リピート属性を属性値として付加してもよい。
また、本実施例において、文と文の接α関係を物理的関
係、章・節・箇条書き等の論理的関係、図・表番号・参
考文献番号等の参照関係で説明したが、文書構造解析に
おいて文書の文脈や起承転結といった意味的展開を表わ
す関係を解析し、その接読関係をポインタ形式で接続し
てもよい。
また、本実施例で文書構造の解析として、1大半位に見
出し語辞書、見出し規則辞書を用いて解析し、さらに文
書構造規則辞書を用いて論理構造を決定したが、原文に
論理構造を指示する割御コ−ドを含む文を解析する1文
解析部、文書構造解析部であってもよい。ようするに、
文書の1大半位に文と文の接続関係をポインタで接続し
たセル型式の記憶領域を有し、ポインタの接続状態をサ
ーチすることにより、特有の属性値を持つ該当する文を
抽出することを容易にした構造を有するものであればよ
く、その要旨を逸脱しない範囲で種々変形して実施する
ことができる。
〔発明の効果〕
以上説明したように、本発明によれば入力文書データか
ら、その文書の章e節・箇条書き・段落等の論理構造や
図・表や参考文献等の参照構造を求め、文書構造記憶部
へ階層化、あるいはネットワーク化された論理構造、参
照構造をセル型式で表現し、各セルをポインタで接続す
ることにより文書の論理構造単位、例えば章曇節単位の
挿入。
訂正、削除の編集をポインタの切り換え処理により、迅
速かつ効果的にならしめる等の実用上の多大なる効果が
奏せられる。また、章単位等の偏集に伴う章番号の変更
は内部的に行なうことが可能になり、ユーザの操作を大
幅に削減することができると伴に、誤りの発生を低減さ
せることができる。
【図面の簡単な説明】
第1図は本発明の一実施例の概略構成図、第2図は見出
し語辞書の一例を示す図、第3図は見出し規則辞書の構
成例を示す図、′第4図は文書構造規則辞書の構成例を
示す図、第5図は記憶単位となるセル形式の種類を示す
図、第6図は文書構造を記憶させるための処理フロー及
び文書構造の偏集に伴う処理フローの図、第7図は原文
データの例を示す図、第8図(a)は原文データ記憶部
での原文データ格納状態を示す図、第8図(b)は原文
データアドレスと文属性セルアドレスの対応テーブルを
示す図、第9図は文書構造セル9接続状態を概略的に示
した図である。 1・・・文書管理部、2・・・入力部、3・・・1文検
出部、4・・・情報記憶領域設定部、5・・・1文解析
部、6・・・属性登録部、7・・・構造解析部、8・・
・文書構造登録部、9・・・原文データ記憶部、10・
・・文書構造記憶部、11・・・文書構造編集部、12
・・・表示制御部、13・・・表示部、14・・・見出
し語辞書、15・・・見出し規則辞書、16・・・文書
構造規則辞書。

Claims (3)

    【特許請求の範囲】
  1. (1)文書データを入力するための入力手段と、この入
    力手段より入力された文書データに対し1文単位に分割
    する1文検出手段と、この1文検出手段より分割された
    1文毎にセル形式の情報記憶領域を設定する設定手段と
    、前記1文に対して属性の解析を行う1文解析手段と、
    この1文解析手段により得られた属性情報を対応する情
    報記憶領域に登録する属性登録手段と、前記1文解析手
    段より得られた属性情報から文相互の接続関係を示す文
    書構造情報を生成する構造解析手段と、この構造解析手
    段より得られた文書構造情報を対応する情報記憶領域に
    ポインタ形式で登録する文書構造登録手段と、前記情報
    記憶領域に登録された属性情報及び文書構造情報を参照
    して特定文の情報記憶領域に対して編集を施す文書構造
    編集手段とを具備したことを特徴とする文書構造管理方
    式。
  2. (2)構造解析手段は文と文との物理的関係、章、節等
    の論理的関係、文書中の図表、参考文献等の参照関係を
    解析するものである特許請求の範囲第1項記載の文書構
    造管理方式。
  3. (3)1文解析手段は1文を構成する形態的構成要素、
    文法構造等を解析するものである特許請求の範囲第1項
    記載の文書構造管理方式。
JP61210566A 1986-09-09 1986-09-09 文書構造管理方式 Pending JPS6366663A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61210566A JPS6366663A (ja) 1986-09-09 1986-09-09 文書構造管理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61210566A JPS6366663A (ja) 1986-09-09 1986-09-09 文書構造管理方式

Publications (1)

Publication Number Publication Date
JPS6366663A true JPS6366663A (ja) 1988-03-25

Family

ID=16591443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61210566A Pending JPS6366663A (ja) 1986-09-09 1986-09-09 文書構造管理方式

Country Status (1)

Country Link
JP (1) JPS6366663A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63250771A (ja) * 1987-04-07 1988-10-18 Canon Inc データ処理装置
JP2021174474A (ja) * 2020-04-30 2021-11-01 株式会社日本法務システム研究所 プログラム、端末及び情報処理システム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61157971A (ja) * 1984-12-28 1986-07-17 Matsushita Electric Ind Co Ltd 文書編集装置
JPS61190653A (ja) * 1985-02-20 1986-08-25 Toshiba Corp 文書処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61157971A (ja) * 1984-12-28 1986-07-17 Matsushita Electric Ind Co Ltd 文書編集装置
JPS61190653A (ja) * 1985-02-20 1986-08-25 Toshiba Corp 文書処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63250771A (ja) * 1987-04-07 1988-10-18 Canon Inc データ処理装置
JP2021174474A (ja) * 2020-04-30 2021-11-01 株式会社日本法務システム研究所 プログラム、端末及び情報処理システム

Similar Documents

Publication Publication Date Title
US5553216A (en) Structured database system together with structure definition frame storing document body data
EP0423683B1 (en) Apparatus for automatically generating index
US5200893A (en) Computer aided text generation method and system
JP2987099B2 (ja) 文書作成支援システム及び用語辞書
US5587902A (en) Translating system for processing text with markup signs
JP3300866B2 (ja) テキスト処理システムにより使用されるテキストを準備する方法及び装置
Reid A high-level approach to computer document formatting
EP0361464A2 (en) Method and apparatus for producing an abstract of a document
US20070179932A1 (en) Method for finding data, research engine and microprocessor therefor
JPS62245367A (ja) 文書処理装置
JPH05303590A (ja) 自動翻訳装置
US5289376A (en) Apparatus for displaying dictionary information in dictionary and apparatus for editing the dictionary by using the above apparatus
US20040098673A1 (en) System and method for managing reference values
Van Halteren et al. Linguistic Exploitation of Syntactic Databases: The Use of the Nijmegen LDB Program
US5835921A (en) Data processing apparatus for creating and storing a text file from input data
Nagao et al. An attempt to computerized dictionary data bases
JPS6366663A (ja) 文書構造管理方式
JP3398729B2 (ja) キーワード自動抽出装置およびキーワード自動抽出方法
Chen et al. Automating index preparation
JP3470930B2 (ja) 自然語解析方法及び装置
JP2621999B2 (ja) 文書処理装置
JPH08115330A (ja) 類似文書検索方法および装置
JPH01136270A (ja) ワードプロセッサ装置
JP3316884B2 (ja) 言語翻訳装置
JPH0612453A (ja) 未知語抽出登録装置