JP3074191B2 - Document processing device that inspects the table of contents - Google Patents

Document processing device that inspects the table of contents

Info

Publication number
JP3074191B2
JP3074191B2 JP03051562A JP5156291A JP3074191B2 JP 3074191 B2 JP3074191 B2 JP 3074191B2 JP 03051562 A JP03051562 A JP 03051562A JP 5156291 A JP5156291 A JP 5156291A JP 3074191 B2 JP3074191 B2 JP 3074191B2
Authority
JP
Japan
Prior art keywords
record
contents
heading
text
inspection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03051562A
Other languages
Japanese (ja)
Other versions
JPH04286054A (en
Inventor
康代 渥美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP03051562A priority Critical patent/JP3074191B2/en
Publication of JPH04286054A publication Critical patent/JPH04286054A/en
Application granted granted Critical
Publication of JP3074191B2 publication Critical patent/JP3074191B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は,ワードプロセッサなど
の文書作成装置で作成した文書の目次に関する処理を行
う目次の検査を行う文書処理装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document processing apparatus for inspecting a table of contents for performing a table of contents of a document prepared by a document processing apparatus such as a word processor.

【0002】マニュアル等を執筆する場合には,執筆す
る前の設計段階で,どのような情報を収集するかとか,
どういった順番で説明していくかといったことを吟味す
る必要がある。この設計段階が終了すると,ほぼ目次案
ができあがり,その目次で執筆の分担等を決める。この
ため,最初にできた目次案を活かす必要があり,執筆し
た原稿が目次案とどれくらい相違したかなどをわかるよ
うにする必要がある。
When writing a manual or the like, what kind of information to collect at the design stage before writing,
It is necessary to examine the order of explanation. When this design stage is completed, a draft of the table of contents is almost completed, and the assignment of writing etc. is determined based on the table of contents. For this reason, it is necessary to make use of the first draft of the table of contents, and to understand how much the written manuscript differs from the first draft of the table of contents.

【0003】これは相違した点を再考することによっ
て,最初の目次案と書き上げた原稿とは,どちらがより
構成がしっかりしているかなどの判断ができ,マニュア
ルなどの原稿をより良くするのに役に立つ。
[0003] By reconsidering the differences, it is possible to judge which of the original table of contents and the written manuscript are more rigid, and to help improve the manuscript such as a manual. .

【0004】また,目次案に従って原稿を作成したにも
かかわらず,入力ミスなどにより,見出しの用語が違っ
ていたり,項番がずれてしまったりということが多々あ
る。従来技術による原稿から目次を自動作成する方法で
は,見出しの用語の入力ミスなどによる誤りが修正され
ないまま,そのまま目次となってしまう危険性があっ
た。執筆した原稿が目次案とどれくらい相違したかがわ
かれば,入力ミスなどによる相違点も見つけることがで
き,こうした危険性も防ぐことができる。
[0004] In addition, despite the fact that a manuscript is prepared in accordance with the table of contents, there are many cases where the term of the heading is different or the item number is shifted due to an input error or the like. In the method of automatically creating a table of contents from a manuscript according to the related art, there is a risk that the table of contents may be used as it is without correcting errors caused by erroneous entry of heading terms. If you know how much the written manuscript differs from the table of contents, you can also find differences due to typographical errors and prevent such dangers.

【0005】[0005]

【従来の技術】従来,文書作成装置などにおいて,あら
かじめ見出し認識用の記号等を原稿に挿入しておき,そ
の部分を抽出して目次を作成したり,章・節・項・小項
等の見出しの形式を定めておき(例えば,章の見出しは
“第○章”で書き始めるなど),その形式を認識して目
次を自動作成する技術が用いられている。
2. Description of the Related Art Conventionally, in a document creating apparatus, a symbol for heading recognition is inserted in a manuscript in advance, and a portion thereof is extracted to create a table of contents, or a chapter, section, section, subsection, etc. A technique is used in which the format of a heading is determined (for example, a chapter heading starts to be written in “Chapter” ”), and the table of contents is automatically created by recognizing the format.

【0006】しかし,電子化された原稿について,目次
があるかどうかを調べたり,既にある目次について,本
文中の見出しと一致するかどうかなどを自動的に調べる
ことはできなかった。そのため,目次と本文との見出し
が一致するかどうかを調べる場合には,電子化された原
稿をディスプレイに表示させたり,プリンタで印刷させ
たりして,人間が1項目ずつ目で確認することが必要で
あった。
However, it has not been possible to automatically check whether or not a digitized manuscript has a table of contents, and whether or not an existing table of contents matches a headline in the text. Therefore, when examining whether the table of contents matches the heading of the text, it is necessary for a human to check each item visually by displaying the digitized original on a display or printing it with a printer. Was needed.

【0007】[0007]

【発明が解決しようとする課題】マニュアル等の査読と
修正を繰り返すうちに,目次の見出しと本文の見出しと
が不一致になってしまうことがある。すなわち,目次に
ある見出しが,本文中にある見出しと一致しないとか,
目次にはあるのに,本文中にはその見出しがないとか,
反対に本文中にはあるのに,目次にはないといったこと
が起こることが多々あった。
[0006] As the review and correction of a manual or the like are repeated, the headings of the table of contents may not match the headings of the text. That is, if the headings in the table of contents do not match the headings in the text,
Although there is a table of contents, there is no headline in the text,
Conversely, it often happened that it was in the text but not in the table of contents.

【0008】このようなことを調べる場合,従来,人間
が行わなければならなかったので,非常な労力と時間を
要するという問題があった。また,検査もれが生じるこ
とがあるという問題があった。本発明は上記問題点の解
決を図り,電子化された原稿を用いて,目次にある見出
しと本文中にある見出しとの不一致箇所を自動的に検査
し指摘する手段を提供することを目的としている。
In the case of examining such a problem, there has been a problem that a great deal of labor and time are required since a human had to perform the above. In addition, there is a problem that inspection leakage may occur. SUMMARY OF THE INVENTION An object of the present invention is to solve the above-mentioned problems and to provide a means for automatically checking and indicating a mismatch between a heading in a table of contents and a heading in a text using an electronic manuscript. I have.

【0009】[0009]

【課題を解決するための手段】図1は,本発明の原理構
成図である。図1において,10は文書情報を記憶する
外部記憶装置,11は計算機の文書作成機能により作成
された電子化された原稿,12はCPUおよびメモリな
どからなる処理装置,13は見出し抽出処理部,14は
目次有無検査処理部,15は目次ページ判定処理部,1
6は目次・本文比較検査処理部,17は目次の見出しと
本文の見出しとの一致または不一致を示す出力結果を表
す。
FIG. 1 is a block diagram showing the principle of the present invention. In FIG. 1, 10 is an external storage device for storing document information, 11 is an electronic manuscript created by a document creation function of a computer, 12 is a processing device including a CPU and a memory, 13 is a headline extraction processing unit, 14 is a table of contents presence / absence check processing unit, 15 is a table of contents page judgment processing unit, 1
Reference numeral 6 denotes a table of contents / text comparison / inspection processing unit, and reference numeral 17 denotes an output result indicating coincidence or non-coincidence between the heading of the table of contents and the heading of the text.

【0010】見出し抽出処理部13は,電子化された原
稿11のレコードを読み込み,章・節・項・小項などの
見出しや,図・表の見出しがあるかどうかを調べ,それ
らの見出しを含むレコードを抽出する処理を行うもので
ある。
The heading extraction processing unit 13 reads a record of the digitized manuscript 11, checks whether there is a heading such as a chapter, a section, a section, a subsection, or a heading of a figure or a table. A process for extracting the record including the record is performed.

【0011】目次有無検査処理部14は,見出し抽出処
理部13が抽出した見出しのレコード群について,同じ
見出しが存在するかどうかを調べ,その結果に基づい
て,検査対象の電子化された原稿11中に目次があるか
どうかを検査する処理を行うものである。
The table-of-contents presence / absence check processing unit 14 checks whether or not the same headline exists in the record group of the headline extracted by the headline extraction processing unit 13, and, based on the result, the digitized original 11 to be checked. A process for checking whether or not there is a table of contents is performed.

【0012】目次ページ判定処理部15は,目次有無検
査処理部14の検査結果により,目次があることがわか
った場合,目次がどこまで占めるかを調べ,目次と本文
とを切り分ける処理を行うものである。
When the table of contents presence / absence check processing unit 14 determines that there is a table of contents based on the inspection result, the table of contents page determination processing unit 15 checks how much the table of contents occupies and separates the table of contents from the table of contents. is there.

【0013】目次・本文比較検査処理部16は,目次の
見出しと本文の見出しとの比較検査を行い,不一致箇所
があった場合などにその位置を示す出力結果17を出力
するものである。
The table of contents / text comparison / inspection processing section 16 performs a comparison test between the table of contents index and the table of text, and outputs an output result 17 indicating the position of a mismatched part when there is a mismatch.

【0014】[0014]

【作用】見出し抽出処理部13により,見出しを含むレ
コード群を抽出し,目次有無検査処理部14により,目
次の有無を自動的に調べ,目次ページ判定処理部15に
より,見出しと本文とを切り分け,目次・本文比較検査
処理部16により,目次の見出しと本文中の見出しの異
同を調べるので,最初に検査する文書を指定するだけ
で,自動的に所望する結果を得ることができる。
The heading extraction processing unit extracts a record group including a heading, the table of contents presence / absence checking processing unit automatically checks presence / absence of a table of contents, and the table of contents page determination processing unit 15 separates the heading from the text. Since the table of contents / text comparison / inspection processing unit 16 checks the difference between the table of contents and the table of contents, it is possible to automatically obtain the desired result only by specifying the first document to be checked.

【0015】特に,電子化された原稿11中の目次の範
囲を指定したり,目次対象の見出しであるか否かなどを
一つずつ人間が指摘したりする必要がないので,操作が
非常に簡単である。
In particular, since there is no need to specify the range of the table of contents in the digitized manuscript 11 or to point out one by one whether or not the heading is the target of the table of contents, the operation is extremely difficult. Easy.

【0016】[0016]

【実施例】図2は本発明の一実施例処理フローチャー
ト,図3は本発明の一実施例に係る見出し抽出処理の例
を示す図,図4は本発明の一実施例に係る目次有無の検
査処理説明図,図5は本発明の一実施例に係る目次ペー
ジの判定処理説明図,図6は本発明の一実施例による出
力結果の例を示す図である。
FIG. 2 is a flowchart showing a process of an embodiment of the present invention, FIG. 3 is a diagram showing an example of a headline extraction process according to an embodiment of the present invention, and FIG. FIG. 5 is an explanatory diagram of an inspection process, FIG. 5 is an explanatory diagram of a table of contents page determination process according to an embodiment of the present invention, and FIG. 6 is a diagram illustrating an example of an output result according to an embodiment of the present invention.

【0017】以下,図2に示すフローチャートに従っ
て,図3ないし図6を参照しつつ,本発明の実施例を説
明する。 [1]図2に示す処理20により,指定された電子化さ
れた原稿11を入力する。
An embodiment of the present invention will now be described with reference to FIGS. 3 to 6 in accordance with the flowchart shown in FIG. [1] The designated digitized original 11 is input by the processing 20 shown in FIG.

【0018】[2]次に,図2に示す処理21により,
図3に示すように,入力した電子化された原稿11から
見出しのレコード群30の作成を行う。ここでは,電子
化された原稿11から,章・節・項・小項などの見出し
や,図・表の見出しを持つレコードを選び出す。そし
て,章・節・項・小項・図・表などの見出しのどれで認
識したかを判断できるフラグ等の記号と,その見出しが
実際にあったページ数を付加したレコードを作成する。
作成したレコードを,原稿から抽出した順番に並べて,
見出しのレコード群30とする。
[2] Next, by processing 21 shown in FIG.
As shown in FIG. 3, a heading record group 30 is created from the input electronic document 11. Here, from the digitized manuscript 11, a record having a heading such as a chapter, section, section, subsection, or a heading of a figure or table is selected. Then, a record is created by adding a symbol, such as a flag, which can determine which of the headings such as chapter, section, section, subsection, figure, table, etc. has been recognized, and the number of pages where the heading actually exists.
Arrange the created records in the order extracted from the manuscript,
The heading record group 30 is set.

【0019】この見出しのレコード群30の各レコード
には,図3に示すように,例えば見出しの種類を示す見
出し種別フラグ31,後に使用する比較元のレコードで
あるか比較先のレコードであるかを識別するための比較
元/比較先フラグ32,また同じ見出しを持つレコード
が他にあるかどうかを示す同じ見出しの有無フラグ33
などが設けられる。
As shown in FIG. 3, each record of the heading record group 30 includes, for example, a heading type flag 31 indicating the type of heading, and a comparison source record to be used later or a comparison destination record. Flag 32 for identifying a record, and a flag 33 indicating the presence or absence of the same heading indicating whether there is another record having the same heading.
Are provided.

【0020】[3]次に,図2に示す処理22によっ
て,その原稿に目次があるかどうかを調べる。調べ方
は,以下の手順による。 a.まず,見出しのレコード群30から先頭のレコー
ドを取り上げ,それを比較元レコードとする。
[3] Next, it is checked whether or not the original has a table of contents by the processing 22 shown in FIG. The checking method is as follows. a. First, the head record is taken from the heading record group 30, and is set as the comparison source record.

【0021】b.比較元レコード以降のレコードを,比
較先のレコード群とする。比較先レコード群の中で,比
較元レコードと同じ見出し種別フラグ31を持つレコー
ドで,かつ同じ見出しの有無フラグ33が立っていない
レコードを,比較先のレコードとする。そして,比較元
レコードと比較先レコードの項番と項目名の部分を比較
する。このとき,空白は比較対象に入れない。比較した
結果,比較元レコードと比較先レコードとが一致した場
合には,同じ見出しがあるとして,比較元と比較先の両
方のレコードの同じ見出しの有無フラグ33を立てる。
また,比較元レコードか比較先レコードかを区別する比
較元/比較先フラグ32を立てる。
B. Records after the comparison source record are regarded as a comparison destination record group. In the comparison target record group, a record having the same heading type flag 31 as the comparison source record and having no same heading presence / absence flag 33 is set as a comparison destination record. Then, the item number and the item name of the comparison source record and the comparison destination record are compared. At this time, blanks are not included in the comparison. If the comparison result shows that the comparison source record and the comparison destination record match, it is determined that the same heading exists, and the presence / absence flag 33 of the same heading is set for both the comparison source and the comparison destination records.
Also, a comparison source / comparison destination flag 32 for distinguishing between the comparison source record and the comparison destination record is set.

【0022】ただし,比較元レコードの同じ見出しの有
無フラグ33が既に立てられていた場合には,比較先レ
コードにこのフラグ(同じ見出しの有無フラグ33)を
立てる。また,比較元レコードか比較先レコードかを区
別する比較元/比較先フラグ32を立てる。
However, if the same index presence / absence flag 33 of the comparison source record has already been set, this flag (the same index presence / absence flag 33) is set in the comparison destination record. Also, a comparison source / comparison destination flag 32 for distinguishing between the comparison source record and the comparison destination record is set.

【0023】比較元/比較先フラグ32は,後に目次の
レコードか本文のレコードかを識別するために使用す
る。以上の比較を比較先のレコード群の最後まで行う。
The comparison source / comparison destination flag 32 is used later to identify whether the record is a table of contents record or a body record. The above comparison is performed up to the end of the record group of the comparison destination.

【0024】c.一つの比較元レコードについて,bの
処理が終了したならば,次の比較元レコードを決める。
それには,現在の比較先のレコード群の中で,同じ見出
しの有無フラグ33が立っていない(同じ見出しがまだ
見つけられていない)レコードで,比較元レコードから
最も近くにあるレコードを次の比較元レコードとする。
C. When the processing of b is completed for one comparison source record, the next comparison source record is determined.
To do this, the next record in the current comparison destination record group that does not have the same heading flag 33 (the same heading has not yet been found) and is closest to the comparison source record is compared. Original record.

【0025】d.比較元になるレコードが存在しなくな
るまで,上記の処理b〜cを繰り返す。図4は,上記処
理の例を示しており,(イ)に示すように,検査済レコ
ードの次を比較元レコードとして,それ以降の比較先レ
コード群と1レコードずつ同じ見出しがあるかどうかを
調べていく。その検査が終わると,図4の(ロ)に示す
ように,同じ見出しの有無フラグ33と比較元/比較先
フラグ32とが設定される。
D. The above processes b to c are repeated until there is no more record to be compared. FIG. 4 shows an example of the above processing. As shown in FIG. 4A, the next record after the checked record is set as the comparison source record, and it is determined whether or not there is the same heading one by one with the subsequent comparison destination record group. I will investigate. When the check is completed, the presence / absence flag 33 of the same headline and the comparison source / comparison destination flag 32 are set as shown in FIG.

【0026】 以上のの処理を施した結果,すべて
のレコードに同じ見出しがあるというフラグ(同じ見出
しの有無フラグ33)が立っていない場合には,目次が
ない本文だけの原稿だとみなす。
As a result of performing the above-described processing, if a flag indicating that all records have the same heading (the same heading presence / absence flag 33) is not set, it is regarded that the document is a text-only original having no table of contents.

【0027】同じ見出しがあるというフラグが立ってい
る場合には,目次と本文の両方が存在する可能性がある
ので,さらに次の処理により判定を行う。 a.比較元/比較先フラグ32に比較先のレコードとい
うフラグが立っているレコードで,かつ,同じ見出し有
無フラグ33に同じ見出しがあるというフラグが立って
いるレコードの数をカウントする。その数をAとする。
If the flag indicating that the same heading is present is set, there is a possibility that both the table of contents and the text exist, so the determination is made by the following processing. a. The number of records in which the comparison source / comparison destination flag 32 is set as a comparison target record flag and the same heading presence / absence flag 33 is set as a flag indicating that the same heading is present is counted. Let the number be A.

【0028】b.比較元/比較先フラグ32に比較先の
レコードというフラグが立っているレコードで,かつ,
同じ見出し有無フラグ33に同じ見出しがあるというフ
ラグが立っているレコードで,かつ,見出し種別フラグ
31に節,図,付図,表,付表または小見出しがあると
いうフラグが立っているレコードの数をカウントする。
その数をBとする。
B. A record whose comparison source / comparison destination flag 32 has a flag of a comparison destination record, and
Counts the number of records that have the same heading flag 33 in the same heading flag 33 and the flag that the heading type flag 31 has a section, figure, figure, table, table or subheading. I do.
Let the number be B.

【0029】c.A=Bであった場合には,目次がない
本文だけの原稿とみなす。A≠Bであった場合には,目
次と本文の両方がある原稿だとみなす。節・図・付図・
表・付表・小見出しは,本文だけの原稿であっても,同
じ見出しが何度も出てくる可能性がある。節は章とびら
がある場合に複数使われることがあり,図や表は複数ペ
ージにまたがる図や表がある場合に複数使われるからで
ある。また,小見出しについても,同じものが何度も使
われることがある。
C. If A = B, it is regarded as a manuscript consisting only of a text without a table of contents. If A ≠ B, it is considered that the manuscript has both the table of contents and the text. Section, figure, appendix,
For tables, appendixes, and subheadings, the same headline may appear many times, even if the manuscript consists only of the text. A section is sometimes used multiple times when there is a chapter door, and a figure or table is used multiple times when there is a figure or table that spans multiple pages. Also, the same headline may be used many times.

【0030】ここで本文ページだけの原稿を考える。本
文ページだけの原稿ならば,同じ章の見出しや同じ項の
見出しなどがあることはない。一方,本文だけの原稿で
あっても,節・図・付図・表・付表・小見出しは同じ見
出しは何度も出てくる可能性があるので,これらが比較
先のレコードになる。すなわち,本文ページだけの原稿
ならば,比較先のレコードの数Aと,比較先のレコード
のうち節・図・付図・表・付表・小見出しの数Bは一致
する。そのため,A=Bの場合には,目次がない本文だ
けの原稿だとみなす。
Here, consider a manuscript having only a text page. If the manuscript is only a text page, there is no heading for the same chapter or section. On the other hand, even in a manuscript containing only the text, the same heading may appear many times in sections, figures, attached figures, tables, attached tables, and subheadings, and these are the records to be compared. That is, in the case of a manuscript consisting only of a text page, the number A of records to be compared and the number B of sections, figures, attached figures, tables, attached tables, and subheadings in the compared records match. Therefore, in the case of A = B, it is regarded as a manuscript of only the text without a table of contents.

【0031】[4]目次と本文の両方があるとみなした
原稿については,図2に示す処理23により,目次のレ
コードがレコード群のどこまでを占めているかを,次の
手順で検査する。 見出し種別フラグ31に章の見出
しであるというフラグがたっているレコードのうち,一
番先頭のものを検査元のレコードとする。検査元のレコ
ード以降にあるレコードで,見出し種別フラグ31に章
の見出しであるというフラグが立っているレコードを検
査先のレコードとする。
[4] For a manuscript that is considered to have both a table of contents and a text, the following procedure is used to check how much the record of the table of contents occupies in the record group by the process 23 shown in FIG. Of the records in which the heading type flag 31 has a flag indicating that it is a chapter heading, the head record is the inspection source record. Records that are located after the inspection source record and for which a flag indicating that the heading is a chapter heading in the heading type flag 31 are set as inspection destination records.

【0032】 検査元のレコードの章番号と検査先の
レコードの章番号とが,一致しているかを調べる。
検査元のレコードの章番号と検査先のレコードの章番号
とが一致したなら,その検査先のレコードの前にある見
出しのレコード群を目次とみなし,検査先レコード以降
のレコード群を本文とみなす。この結果から,例えば図
5に示すように,目次の見出しというフラグ(*)と,
本文の見出しというフラグ(◎)を,それぞれのレコー
ド群に立てる。そして,すべてのレコードの同じ見出し
の有無フラグ33をクリアする。
It is checked whether the chapter number of the inspection source record matches the chapter number of the inspection destination record.
If the chapter number of the record of the inspection source and the chapter number of the record of the inspection destination match, the record group of the heading preceding the record of the inspection destination is regarded as the table of contents, and the record group after the inspection destination record is regarded as the text. . From this result, for example, as shown in FIG.
A flag (◎) indicating a headline of the text is set for each record group. Then, the presence / absence flag 33 of the same heading of all records is cleared.

【0033】検査元のレコードの章番号と検査先のレコ
ードの章番号とが一致しなかった場合には,検査先レコ
ード以降にあるレコードで,見出し種別フラグ31に章
の見出しであるというフラグが立っているレコードを次
の検査先のレコードとし,上記の処理をする。以上の
処理を検査元のレコードの章番号と検査先のレコードの
章番号が一致するまで繰り返す。
When the chapter number of the record of the inspection source and the chapter number of the record of the inspection destination do not match, in the records after the inspection destination record, a flag indicating that the chapter is a chapter heading is set in the heading type flag 31. The standing record is set as the next inspection destination record, and the above processing is performed. The above processing is repeated until the chapter number of the inspection source record matches the chapter number of the inspection destination record.

【0034】[5]次に,図に示す処理24により,目
次にある見出しと,本文にある見出しとが一致している
かを検査する。調べ方は,以下の手順に従う。目次の
見出しというフラグが立っているレコードを検査元のレ
コードとして,本文の見出しというフラグが立っている
レコードで,かつ検査元のレコードと同じ見出し種別フ
ラグ31を持つレコードを検査先のレコードとする。
検査元のレコードの見出し(項番と項目名)と,検査
先のレコードの見出し(項番と項目名)とが一致してい
るかを,一文字ずつ対応させて検査する。このとき,空
白は検査の対象としない。
[5] Next, by processing 24 shown in the figure, it is checked whether or not the heading in the table of contents matches the heading in the text. Follow the procedure below. The record with the flag of the index of the table of contents set as the inspection source record, and the record with the heading of the text flag set and having the same heading type flag 31 as the inspection source record as the inspection destination record .
It checks whether the heading (item number and item name) of the inspection source record matches the heading (item number and item name) of the inspection destination record, one character at a time. At this time, blanks are not subject to inspection.

【0035】 一致したものが見つかった場合には,
検査元のレコードと検査先のレコードの両方の同じ見出
しの有無フラグ33に,一致したものがあるということ
を示すフラグを立てる。そして,検査元のレコードの次
のレコードを検査元のレコードとし,本文の見出しとい
うフラグが立っているレコードで,かつ検査元のレコー
ドと同じ見出し種別フラグ31を持つレコードを検査先
のレコードとして,上記処理の検査を繰り返す。一致
しなかった場合には,検査元のレコードはそのままにし
て,検査先のレコード以降のレコードで,かつ検査元の
レコードと同じ見出し種別フラグ31を持つレコードを
検査先のレコードとして,処理を行う。
If a match is found,
A flag indicating that there is a match is set in the presence / absence flag 33 of the same heading in both the inspection source record and the inspection destination record. Then, the record next to the record of the inspection source is set as the inspection source record, and the record with the flag of the headline of the text and having the same heading type flag 31 as the inspection source record is set as the inspection destination record. The inspection of the above processing is repeated. If they do not match, the inspection source record is left as it is, and a record after the inspection destination record and a record having the same heading type flag 31 as the inspection source record are processed as the inspection destination record. .

【0036】 検査先のレコードが,本文の見出しと
いうフラグが立っているレコード群の最後までいって
も,検査元のレコードと一致するものが見つからなかっ
た場合には,今,検査した検査元のレコードの次のレコ
ードを新たな検査元のレコードとし,また,本文の見出
しというフラグが立っているレコード群の先頭から,検
査元のレコードと同じ見出し種別フラグ31を持つレコ
ードを調べ,それを検査先のレコードとして,および
の処理を繰り返す。 目次の見出しというフラグの
レコード群の最後まで,上記〜の処理を繰り返す。
Even if the record to be inspected reaches the end of the record group flagged as the headline of the text, if no record matching the record of the inspection source is found, The record next to the record is set as a new inspection source record, and a record having the same heading type flag 31 as the inspection source record is searched from the head of the record group flagged with the heading of the text, and is checked. Repeat the processing of and for the previous record. The above processing is repeated until the end of the record group with the flag of the index of the table of contents.

【0037】 処理〜を実行した後で,目次の見
出しというフラグが立っているレコード群と,本文の見
出しというフラグが立っているレコード群の中で,一致
しているものがあるというフラグが立っていないレコー
ドすべてに,一致するものがないことを示すフラグを立
てる。
After executing the processing (1) to (4), a flag indicating that there is a match between a record group in which the flag of the head of the table of contents is set and a record group in which the flag of the head of the body is set is set. Flags all unmatched records as having no match.

【0038】 目次の見出しというフラグの立ってい
るレコード群と,本文の見出しというフラグの立ってい
るレコード群の見出し部分を出力したリストを作成す
る。このとき,一致するものがないことを示すフラグが
立っているレコードの見出し部分には,一致するものが
ないということを示す記号(例えば★)を付加する。ま
た,紙面出力だけでなく,リストを画面で表示し,不一
致箇所をカーソル等の移動などで明示させることもでき
る。
A list is created by outputting a record group flagged as a heading of a table of contents and a heading portion of a record group flagged as a heading of a text. At this time, a symbol (for example, ★) indicating that there is no match is added to the heading portion of the record in which the flag indicating that there is no match is set. In addition to the paper output, a list can be displayed on a screen, and a mismatched portion can be clearly indicated by moving a cursor or the like.

【0039】[6]図2に示す処理25により,以上の
処理で検査した結果を出力する。図6に,その出力結果
の例を示す。図6の(イ)は目次の出力結果17aを示
し,(ロ)は本文の出力結果17bを示している。目次
の場合,1.1節の項目名が「××の全体像」であり,
本文の場合,1.1節の項目名が「××の概要」となっ
ている。したがって,一致しないことを示す記号★を,
それぞれの見出し部分に付加して,それを表示または印
刷する。
[6] By the process 25 shown in FIG. 2, the result of the inspection by the above process is output. FIG. 6 shows an example of the output result. 6A shows the output result 17a of the table of contents, and FIG. 6B shows the output result 17b of the text. In the case of the table of contents, the item name in section 1.1 is "Overall image of xx"
In the case of the text, the item name in section 1.1 is "Overview of XX". Therefore, the symbol ★ indicating no match is
Add to each heading and display or print it.

【0040】見出しの不一致には,以下の5つの場合が
あり,これらを全部この処理の検査で指摘することがで
きる。図6は,(a) の例を示している。 (a) 用語が違っている場合。 例:目次では“〜全体像”となっているのを,本文では
“〜の概要”と記述するなど。 (b) 入力ミスなどによる用語等の誤りの場合。 例:目次では“動作するための環境”となっているの
を,本文では“動作すための環境”と記述するなど。ま
た,目次では“〜の構成”となっているのを,本文では
“〜の攻勢”と記述するなど。 (c) 項番がずれている場合。 (d) 見出しが目次にあって,本文にない場合。 (e) 見出しが本文にあって,目次にない場合。 これにより,目次または本文を修正し,正しい目次を持
つ文書を作り上げることができる。
There are the following five cases of heading inconsistency, all of which can be pointed out by inspection of this processing. FIG. 6 shows an example of (a). (a) The terms are different. Example: In the table of contents, "-Overview" is described as "Overview" in the text. (b) In the case of an error in a term or the like due to an input error or the like. Example: In the table of contents, "environment for operation" is described as "environment for operation" in the text, and so on. In the table of contents, “composition of” is described, but in the text, “offensive of” is described. (c) When the item numbers are incorrect. (d) The heading is in the table of contents but not in the text. (e) The headline is in the text and not in the table of contents. As a result, the table of contents or the text can be modified, and a document having the correct table of contents can be created.

【0041】この方式は,章とびらの見出しと本文の見
出しの検査にも利用することができ,章とびらと本文の
見出しとの不一致も,これにより簡単に検査することが
できる。なお,図6ではラインプリンタによる出力例を
示したが,他の表示手段であるディスプレイなどによる
出力でも,同等に本技術を適用して出力することが可能
である。
This method can also be used to check the heading of a chapter and a header and the heading of the text, and the mismatch between the chapter and the heading of the text can easily be checked. Note that FIG. 6 shows an example of output by a line printer, but output by a display, which is another display means, can also be output by applying the present technology equally.

【0042】[0042]

【発明の効果】以上説明したように,本発明によれば,
検査したい文書を指定するだけという,きわめて簡単な
操作で,今まで見落としていた目次と本文の不一致を,
正確かつ迅速に検査することができる。また,入力ミス
などによる見出し用語の誤りや項番のずれなども見つけ
ることができるので,誤りを含んだまま目次を作成して
しまうという危険性もなくすことができる。
As described above, according to the present invention,
By simply specifying the document to be inspected, the inconsistency between the table of contents and the text that has been overlooked so far can be determined.
It can be inspected accurately and quickly. In addition, since errors in heading terms and deviations in item numbers due to input errors and the like can be found, there is no danger of creating a table of contents while including errors.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の原理構成図である。FIG. 1 is a principle configuration diagram of the present invention.

【図2】本発明の一実施例処理フローチャートである。FIG. 2 is a processing flowchart of an embodiment of the present invention.

【図3】本発明の一実施例に係る見出し抽出処理の例を
示す図である。
FIG. 3 is a diagram illustrating an example of a headline extraction process according to an embodiment of the present invention.

【図4】本発明の一実施例に係る目次有無の検査処理説
明図である。
FIG. 4 is an explanatory diagram of an inspection process for the presence or absence of a table of contents according to an embodiment of the present invention.

【図5】本発明の一実施例に係る目次ページの判定処理
説明図である。
FIG. 5 is an explanatory diagram of a table of contents page determination process according to an embodiment of the present invention.

【図6】本発明の一実施例による出力結果の例を示す図
である。
FIG. 6 is a diagram illustrating an example of an output result according to an embodiment of the present invention.

【符号の説明】[Explanation of symbols]

10 外部記憶装置 11 電子化された原稿 12 処理装置 13 見出し抽出処理部 14 目次有無検査処理部 15 目次ページ判定処理部 16 目次・本文比較検査処理部 17 出力結果 REFERENCE SIGNS LIST 10 external storage device 11 digitized manuscript 12 processing device 13 index extraction processing unit 14 table of contents existence inspection processing unit 15 table of contents page determination processing unit 16 table of contents / text comparison inspection processing unit 17 output result

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 電子化された原稿(11)を計算機によって
処理する文書処理装置において, 電子化された原稿(11)から見出しを含むレコードを抽出
する見出し抽出処理部(13)と, 抽出した見出しのレコード群に同じ見出しのレコードが
あるかどうかを調べ,ある特定の種類の見出しについて
同じ見出しを持つレコードが存在するかどうかにより,
電子化された原稿中に目次が存在するかどうかを検査す
る目次有無検査処理部(14)と, 目次がある場合に,ある特定の種類の見出しのうち最初
に現れるレコードを検査元のレコードとし,それと同じ
種類の見出しで同じ番号を含むレコードを検査先のレコ
ードとして,レコード群の先頭から順番に調べ,見つか
ったならば,検査先のレコードの前にあるレコード群を
目次とみなし,検査先のレコード以降のレコード群を本
文とみなして,目次と本文とを切り分ける目次ページ判
定処理部(15)と, 目次の見出しと本文の見出しとの比較検査を行い,その
検査結果を出力する目次・本文比較検査処理部(16)とを
備えたことを特徴とする目次の検査を行う文書処理装
置。
A document processing apparatus for processing a digitized document (11) by a computer, comprising: a header extraction processing unit (13) for extracting a record including a heading from the digitized document (11); It examined whether the record group of heading there is a record of the same heading, for a heading of a particular type
Depending on whether there is a record with the same heading,
A table of contents inspection processing unit (14) that checks whether a table of contents exists in the digitized manuscript, and if there is a table of contents, the first of a certain type of heading
Is the same as the record that appears in
Records that contain the same number in the type heading
As records, check the records in order from the beginning, and find
The records before the record to be checked
The table of contents is regarded as a table of contents, and the record group after the record of the inspection destination is
The table of contents page determination processing unit (15), which separates the table of contents from the body of text as a sentence , performs a comparison check between the headings of the table of contents and the headings of the body, and outputs a check result to the table of contents / text comparison processing (16 And a document processing apparatus for inspecting a table of contents.
JP03051562A 1991-03-15 1991-03-15 Document processing device that inspects the table of contents Expired - Fee Related JP3074191B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03051562A JP3074191B2 (en) 1991-03-15 1991-03-15 Document processing device that inspects the table of contents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03051562A JP3074191B2 (en) 1991-03-15 1991-03-15 Document processing device that inspects the table of contents

Publications (2)

Publication Number Publication Date
JPH04286054A JPH04286054A (en) 1992-10-12
JP3074191B2 true JP3074191B2 (en) 2000-08-07

Family

ID=12890421

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03051562A Expired - Fee Related JP3074191B2 (en) 1991-03-15 1991-03-15 Document processing device that inspects the table of contents

Country Status (1)

Country Link
JP (1) JP3074191B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07210185A (en) * 1993-11-30 1995-08-11 Sony Corp Reading information preparing device and reading device
JPH11232439A (en) * 1998-02-16 1999-08-27 Toshinari Hayashi Document picture structure analysis method
JP5278996B2 (en) * 2008-02-12 2013-09-04 Necカシオモバイルコミュニケーションズ株式会社 Document processing apparatus and document processing program
JP5489257B2 (en) * 2013-03-28 2014-05-14 Necカシオモバイルコミュニケーションズ株式会社 Document processing apparatus and document processing program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59148944A (en) * 1983-02-14 1984-08-25 Matsushita Electric Ind Co Ltd Document forming device provided with function forming table of contents
JPH02297284A (en) * 1989-03-22 1990-12-07 Hitachi Ltd Document processing system and version control system

Also Published As

Publication number Publication date
JPH04286054A (en) 1992-10-12

Similar Documents

Publication Publication Date Title
US20020010719A1 (en) Method and system for generating document summaries with location information
US20070271510A1 (en) Error checking web documents
JPS62229368A (en) Document processor
US11520987B2 (en) Automated document analysis comprising a user interface based on content types
JPS62229364A (en) Document processor
CN106960058A (en) A kind of structure of web page alteration detection method and system
CN112084748A (en) Text comparison method
US20050044488A1 (en) Technique to validate electronic books
JP3074191B2 (en) Document processing device that inspects the table of contents
JP2003022269A (en) Cartoon translation device and its system and cartoon translation method
JP2004252881A (en) Text data correction method
CN114220113A (en) Paper quality detection method, device and equipment
JP2014137613A (en) Translation support program, method and device
JPH0883280A (en) Document processor
JP3591109B2 (en) Keyword setting device
JPH0869469A (en) Mechanical translation method
JPH044467A (en) Sentence structure analyzing device
JPS62249269A (en) Document processor
JPH08190560A (en) Structure test device
JP2902138B2 (en) How to correct misread characters
JP4044158B2 (en) Code verification device and code verification method
JPH08190570A (en) Comparison and verification system for document data
JP2023119766A (en) Document input support program and document editing system
JP2023121482A (en) Document input support program and document editing system
JPH11110386A (en) Information processor having sentence segmenting function and sentence segmenting method

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000523

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090602

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees