JPH05342325A - Document processor and form register device therefor - Google Patents

Document processor and form register device therefor

Info

Publication number
JPH05342325A
JPH05342325A JP4168310A JP16831092A JPH05342325A JP H05342325 A JPH05342325 A JP H05342325A JP 4168310 A JP4168310 A JP 4168310A JP 16831092 A JP16831092 A JP 16831092A JP H05342325 A JPH05342325 A JP H05342325A
Authority
JP
Japan
Prior art keywords
document
image
character
area
holding means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4168310A
Other languages
Japanese (ja)
Inventor
Junichi Osumi
大住淳一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP4168310A priority Critical patent/JPH05342325A/en
Publication of JPH05342325A publication Critical patent/JPH05342325A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To easily efficiently prepare a document having a form for presentation in accordance with contents of general document which is without preliminarily determining the position, the number of stages, and the number of characters. CONSTITUTION:This device is provided with an area dividing means 2 which divides the document picture held in a document picture holding means 11 into meaningful areas as document elements, an identifier giving means 3 which gives identifiers to divided areas respectively, a form data holding means 4 which holds form data including layout information of the document to be prepared and a form frame picture, a document constituting element converting means 5 which converts picture elements in each area in accordance with the identifier based on the form data, and a picture synthesizing means 6 which successively synthesizes converted elements into a form picture.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】オーバヘッドプロジェクタ(OH
P)によるプレゼンテーション用の文書のように、所定
のフォーム枠を持つ文書を作成するための文書処理装置
およびその文書処理装置のためのフォーム登録装置に関
する。
[Industrial application] Overhead projector (OH
The present invention relates to a document processing apparatus for creating a document having a predetermined form frame such as a presentation document according to P) and a form registration apparatus for the document processing apparatus.

【0002】[0002]

【従来の技術】一般にOHPなどを用いたプレゼンテー
ションを行う時には、見やすさ・見栄えを良くするため
に、特定のフォームに入れて原稿を作成したり、使用す
る文字を大きくしたりすることが多い。従来、このよう
な文書を作成する場合、文字と図形を同時に扱えるデス
クトップパブリッシング(DTP)システムを用いる
か、複写機で文書画像の拡大や切り張りを行って原稿を
作っていた。しかし、DTPシステムは高価であり、普
及していない、また、操作も容易で無く、誰でも使える
と言う状況にはない。一方複写機を用いて切り張りを行
う方法は誰でも行うことが可能であるが、糊とハサミで
行う手仕事になり、効率的とは言えない、また、目測で
張り合わせるので、見栄えが悪くなることも有る。複写
機で切り張り作業を電子的にかつ自動的に行う方法とし
ては、特開平2−297464号公報、特開平1−24
6665号公報、特開平1−246959号公報で述べ
ているような、文書画像の特定フォームへの合成技術を
用いることが考えられる。しかし、従来のフォーム合成
技術は、あらかじめ設計した原稿上の特定の位置、大き
さの領域をフォームに合成することしかできない。つま
り、プレゼンテーション資料のように、中身の段落の数
や文字数が不定のものには適応できなかった。
2. Description of the Related Art Generally, when giving a presentation using an OHP or the like, a manuscript is often put in a specific form or a character to be used is enlarged in order to improve visibility and appearance. Conventionally, when creating such a document, a desktop publishing (DTP) system capable of simultaneously handling characters and graphics was used, or a document image was enlarged or cut by a copying machine to create a document. However, the DTP system is expensive, has not spread, is not easy to operate, and cannot be used by anyone. On the other hand, the method of cutting using a copying machine can be done by anyone, but it is not efficient because it is a manual work done with glue and scissors. It may be. As a method for electronically and automatically performing the cutting work in a copying machine, there are disclosed in Japanese Patent Laid-Open Nos. 2-297464 and 1-24.
It is conceivable to use a technique for synthesizing a document image into a specific form as described in Japanese Patent No. 6665 and Japanese Patent Application Laid-Open No. 1-246959. However, the conventional form synthesizing technique can only synthesize a region of a specific position and size on a document designed in advance into a form. In other words, it could not be applied to items with an indefinite number of paragraphs or characters, such as presentation materials.

【0003】[0003]

【発明が解決しようとする課題】本発明は、位置や段
数、文字数をあらかじめ決めないで作成した一般的な文
書の内容を、所定のレイアウトのフォームに電子的かつ
自動的に合成することにより、容易にかつ効率良くフォ
ーム枠を持つ文書を作成することのできる文書処理装置
を得ることを課題とするものである。また、本発明は、
文書処理装置のためのフォームを簡単に登録することの
できるフォーム登録装置を得ることを課題とするもので
ある。
SUMMARY OF THE INVENTION According to the present invention, the contents of a general document created without previously determining the position, the number of columns, and the number of characters are electronically and automatically combined into a form having a predetermined layout. An object of the present invention is to obtain a document processing device capable of easily and efficiently creating a document having a form frame. Further, the present invention is
An object of the present invention is to obtain a form registration device capable of easily registering a form for a document processing device.

【0004】[0004]

【課題を解決するための手段】本発明の文書処理装置
は、文書画像を保持する文書画像保持手段(図1の1)
と、その文書画像保持手段に保持された文書画像を文書
要素として意味の有る領域に分割する領域分割手段(図
1の2)と、領域分割手段により分割されたそれぞれの
領域に識別子を付与する識別子付与手段(図1の3)
と、生成する文書のレイアウト情報およびフォーム枠画
像を含むフォームデータを保持するフォームデータ保持
手段(図1の4)と、そのフォームデータ保持手段に保
持されたフォームデータを参照することにより各領域内
の画像要素を前記識別子付与手段により付与された識別
子に応じて変換する文書構成要素変換手段(図1の5)
と、その文書構成要素変換手段により変換された各要素
を順次フォーム画像に合成する画像合成手段(図1の
6)とを備えている。
A document processing apparatus according to the present invention is a document image holding means (1 in FIG. 1) for holding a document image.
An area dividing means (2 in FIG. 1) that divides the document image held by the document image holding means into meaningful areas as document elements, and an identifier is given to each area divided by the area dividing means. Identifier assigning means (3 in FIG. 1)
By referring to the form data holding unit (4 in FIG. 1) holding the form data including the layout information of the document to be generated and the form frame image, and the form data held in the form data holding unit, Document component conversion means (5 in FIG. 1) for converting the image element of FIG. 1 according to the identifier assigned by the identifier assigning means.
And image synthesizing means (6 in FIG. 1) for sequentially synthesizing each element converted by the document constituent element converting means into a form image.

【0005】また、本発明の一態様においては、上記構
成の文書処理装置において、各要素を順次フォーム画像
に合成する際に、1ページのフォームに前記要素が入る
か否かを判断し、入りきらないと判断した場合に次のペ
ージへの合成を指示するページ・オーバーフロー判定手
段を設ける。
Further, according to one aspect of the present invention, in the document processing apparatus having the above configuration, when each element is sequentially combined into a form image, it is determined whether or not the element is included in a form of one page, and the form is entered. A page overflow determination means is provided for instructing composition to the next page when it is determined that the page cannot be exhausted.

【0006】本発明は、前記構成の文書処理装置のフォ
ームデータ保持手段にフォームデータを登録するための
フォームデータ登録装置に関する。その構成は、文書画
像を保持する文書画像保持手段(図2の1)と、その文
書画像保持手段に保持された文書画像を解析し、フォー
ム画像と文字領域を抽出するフォーム解析手段(図2の
9)と、そのフォーム解析手段により抽出された文字領
域の位置に基づいて各それぞれの文字領域に属性を付与
する文字領域属性付与手段(図2の10)と、各文字領
域をフォームとして登録するか否かをユーザーに確認す
るフォーム構成要素選択手段(図2の11)と、以上よ
り抽出されたフォーム枠画像、文字領域属性を含むレイ
アウト情報を格納するフォームデータ保持手段(図2の
4)とを備えている。
The present invention relates to a form data registration device for registering form data in the form data holding means of the document processing device having the above structure. The structure is such that a document image holding unit (1 in FIG. 2) holding a document image and a form analysis unit (FIG. 2) that analyzes the document image held in the document image holding unit and extracts the form image and the character area. 9), a character area attribute assigning means (10 in FIG. 2) for assigning an attribute to each respective character area based on the position of the character area extracted by the form analyzing means, and each character area is registered as a form. Form component selection means (11 in FIG. 2) for confirming to the user whether or not to do so, and form data holding means (4 in FIG. 2) for storing the layout information including the form frame image and the character region attribute extracted as described above. ) And.

【0007】[0007]

【作用】本発明の作用は、まず、文書画像保持手段に保
持された文書画像を、領域分割手段により文書要素とし
て意味の有る領域、たとえば文字領域、図形領域等に分
割する。識別子付与手段は、領域分割手段により分割さ
れたそれぞれの領域に識別子を付与する。識別子は、資
料名称、作成者、作成日、本文/見出し、本文/内容等
のような文書の論理的な意味を表すものである。フォー
ムデータ保持手段は、生成する文書の各項目の配置や文
字サイズ等のレイアウト情報、およびフォーム枠画像を
含むフォームデータを、たとえばレイアウトパラメータ
テーブル(図7、図8)などの形式で、保持する。文書
構成要素変換手段は、文書画像保持手段に保持された各
領域内の画像要素を切り出し、前記識別子付与手段によ
り付与された識別子ごとにフォームデータ保持手段に保
持されたフォームデータを参照して、配置やサイズを決
定し、画像の変換をする。画像合成手段は、その文書構
成要素変換手段により変換された各要素と、順次フォー
ムデータ保持手段に保持されたフォーム画像と合成し出
力画像を生成する。このように、本発明によれば、対象
の文書画像が領域分割手段と論理識別子付与手段により
解析され、その解析結果とフォーム保持手段により予め
用意したフォームデータとに基づいて、文書画像を加工
して所定の出力画像を自動的に生成するので、容易にか
つ効率的良くフォーム枠に内容をレイアウトした文書を
得ることができる。また、フォームデータは文書のデザ
インのパラメータを含むので、利用者は文書デザインに
関する知識を持たなくても、見栄えの良い文書を得るこ
とができる。
According to the operation of the present invention, first, the document image held in the document image holding means is divided by the area dividing means into meaningful areas such as character areas and graphic areas as document elements. The identifier assigning means assigns an identifier to each area divided by the area dividing means. The identifier represents a logical meaning of a document such as a material name, creator, creation date, text / heading, text / content, and the like. The form data holding unit holds layout information such as the layout of each item of the generated document and the character size, and form data including a form frame image, for example, in the form of a layout parameter table (FIGS. 7 and 8). .. The document component conversion means cuts out the image element in each area held in the document image holding means, refers to the form data held in the form data holding means for each identifier given by the identifier giving means, Determine the layout and size, and convert the image. The image synthesizing means synthesizes each element converted by the document constituent element converting means and the form image sequentially held in the form data holding means to generate an output image. As described above, according to the present invention, the target document image is analyzed by the area dividing unit and the logical identifier assigning unit, and the document image is processed based on the analysis result and the form data prepared in advance by the form holding unit. Since a predetermined output image is automatically generated by the above, a document in which the contents are laid out in the form frame can be obtained easily and efficiently. Further, since the form data includes the document design parameters, the user can obtain a good-looking document without knowledge of the document design.

【0008】ページ・オーバーフロー判定手段は、各要
素を順次フォーム画像に合成する際に、1ページのフォ
ームに前記要素が入るか否かを判断し、入りきらないと
判断した場合に次のページへの合成を指示するので、2
ページ以上にわたる文書でも各ページが一定のフォーム
に従った見栄えの良い文書を生成することができる。
The page overflow determination means determines whether or not the above-mentioned elements fit in the form of one page when synthesizing each element into the form image in sequence, and moves to the next page when it is determined that the elements do not fit. Since it instructs the synthesis of 2
It is possible to generate a good-looking document in which each page conforms to a certain form even for a document having more than one page.

【0009】また、本発明のフォーム登録装置におい
て、文書画像保持手段は、適宜の入力手段により入力さ
れた登録したいフォームのディジタル画像を保持する。
この画像に対してフォーム解析手段は文書のフォーム枠
画像と文字領域を抽出し、フォーム枠画像はフォームデ
ータ保持手段に保持される。文字領域属性付与手段は、
前記抽出された文字領域に対し、その位置に基づいて本
文、フッタ、ヘッダ等の属性を付与する。フォーム構成
要素選択手段は、ユーザの指示によりフォーム構成要素
として登録するか否かを決定し、登録の場合に文字領域
属性がフォームデータ保持手段に保持される。ユーザ
は、新たなフォームを使用したいとか、システムが内蔵
するオーバレイフォーム以外の指定のフォームを使用し
なければならないときに、このフォーム登録装置を用い
ることにより、簡単に所望のフォームを入力し使用する
ことができる。
Further, in the form registration apparatus of the present invention, the document image holding means holds the digital image of the form to be registered which is input by the appropriate input means.
For this image, the form analysis means extracts the form frame image and the character area of the document, and the form frame image is held by the form data holding means. The character area attribute adding means is
Attributes such as a body, a footer, and a header are added to the extracted character area based on its position. The form component selecting means determines whether or not to register as a form component according to a user's instruction, and in the case of registration, the character area attribute is held in the form data holding means. When the user wants to use a new form or has to use a designated form other than the overlay form built into the system, the user can easily input and use a desired form by using this form registration device. be able to.

【0010】[0010]

【実施例】本発明をデジタル複写機に適用した場合の実
施例について説明する。図1に、本実施例のプレゼンテ
ーション用文書処理装置の概略の構成を示す。この装置
は、文書原稿をデジタル画像として読み込み、保持する
原稿保持手段1、保持された原稿の画像を文書要素とし
て意味の有る領域に分割する領域分割手段2、それぞれ
の領域に対応する文書項目を識別子として付与する識別
子付与手段3、生成する文書のレイアウト、フォーム枠
画像を保持するフォームデータ保持手段4、このデータ
を参照することにより各領域内の画像要素を付与された
識別子に応じて変換する文書構成要素変換手段5、変換
された各要素を順次フォーム画像に合成する画像合成手
段6、その画像合成手段6による画像合成にかいて各要
素を順次流し込む際に、1ページのフォームに入るか否
かを判断し、入りきらないと判断した場合に次のページ
への合成を指示するページ・オーバーフロー判定手段
7、および合成された画像を可視化するための画像可視
化手段8からなっている。
EXAMPLE An example in which the present invention is applied to a digital copying machine will be described. FIG. 1 shows a schematic configuration of a presentation document processing apparatus of this embodiment. This apparatus reads a document original as a digital image and holds it, a document holding unit 1, an area dividing unit 2 that divides the held image of the document into meaningful regions as document elements, and a document item corresponding to each region. An identifier assigning unit 3 assigned as an identifier, a layout of a generated document, a form data holding unit 4 holding a form frame image, and referring to this data, an image element in each area is converted according to the assigned identifier. Document constituent element converting means 5, image combining means 6 for sequentially combining the converted elements into a form image, and whether to enter a one-page form when sequentially injecting each element in the image combining by the image combining means 6 Page overflow determination means 7 for determining whether or not the page is full, and for instructing to synthesize to the next page, and The made image has an image visualizing means 8 for visualizing.

【0011】まず、ユーザーは、資料名称、作成者、作
成日、プレゼンテーションに使用する文字内容等の各項
目の内容をワードプロッセッサ(W/P)等で順次作成
する。この際、各項目の間に空白行を挿入する以外、特
別の配慮をする必要はない。図3に、ワードプロセッサ
で作成したプレゼンテーション用資料原稿の例を示す。
ユーザーはこの原稿を本発明を適用したデジタル複写機
のプラテンに原稿を置き、コピー・スタートボタンを押
すことにより、図4a〜図4cに示すようなOHP文書
を作成できる。
First, the user sequentially creates the contents of each item such as the material name, the creator, the creation date, and the contents of characters used in the presentation using a word processor (W / P) or the like. At this time, it is not necessary to give special consideration other than inserting a blank line between each item. FIG. 3 shows an example of a presentation material manuscript created by a word processor.
The user places the original on the platen of the digital copying machine to which the present invention is applied and presses the copy start button to create an OHP document as shown in FIGS. 4a to 4c.

【0012】図1に従って、動作を説明する。まず、ワ
ードプロセッサで作成した図3に示すような原稿がデジ
タル複写機の読み取り系により読み取られ、原稿保持手
段1に取り込まれる。この画像は次に領域分割手段2に
より、文字列あるいは文字ブロックを抽出する。文字列
を抽出した様子を図5に示す。文字列を抽出する手法と
しては、文書認識技術における領域分割処理を用いても
よい。つまり、文書のデジタル画像を入力として、文字
領域、図表領域などに分割する処理に対応する。これは
公知の技術、例えば特開昭64−15889号公報、特
公昭61−32712号公報に示されている技術によっ
て実現される。ここでの領域分割処理はそれぞれの領域
を矩形に分割し、その領域の位置・大きさ、下位要素領
域列、分類(文字領域、図表領域などの区別)を組にし
て出力する。この処理を行う前に傾き補正等の前処理を
行ってもよいことはいうまでもない。なお、領域を表現
する矩形は原稿画像の主走査方向・副走査方向に平行な
辺を持ち、対象となる領域を囲む最小矩形とする。
The operation will be described with reference to FIG. First, a document as shown in FIG. 3 created by a word processor is read by a reading system of a digital copying machine and taken into the document holding means 1. This image is then extracted by the area dividing means 2 into a character string or a character block. A state in which the character string is extracted is shown in FIG. As a method of extracting a character string, area division processing in document recognition technology may be used. That is, it corresponds to a process of inputting a digital image of a document and dividing it into a character area, a graphic area, and the like. This is realized by known techniques, for example, the techniques disclosed in JP-A-64-15889 and JP-B-61-32712. In the area division processing here, each area is divided into rectangles, and the position / size of the area, the lower element area sequence, and the classification (discrimination of the character area, the figure area, etc.) are output as a set. It goes without saying that preprocessing such as inclination correction may be performed before this processing. It should be noted that the rectangle representing the area has a side parallel to the main scanning direction and the sub-scanning direction of the original image, and is the smallest rectangle that surrounds the target area.

【0013】本実施例では文字画像のみを対象にして、
文字列を抽出しているので、更に単純化した手法の適応
も可能である。例えば、傾き補正した画像に対して、水
平方向に射影を取り、射影成分が、有る部分を文字列候
補領域とする。次に、この領域に対して垂直方向に射影
をとる。射影成分の有る範囲が文字の部分になるので、
文字列候補領域において左右の射影成分が無い部分を除
いた範囲が文字列領域となる。
In this embodiment, only character images are targeted,
Since the character string is extracted, it is possible to apply a further simplified method. For example, a projection is taken in the horizontal direction with respect to an image whose inclination has been corrected, and a portion having a projection component is set as a character string candidate area. Next, a projection is taken in the direction perpendicular to this area. Since the range with the projection component is the character part,
In the character string candidate area, the range excluding the left and right projection component-free parts is the character string area.

【0014】次に、文字ブロックは段落に相当し、文字
列の集合から構成される。ここでは、確実に検出できる
ように、原稿作成時に、空白行を入れるようにしている
ので、空白行を検出して行う。空白行の検出手法として
は、各文字列を囲む矩形の左下の点のY座標の間隔のヒ
ストグラムを用いることが出来る。Y座標の取り方は図
3に示す。通常の行間隔、一行空白行を挿入した時の行
間隔がヒストグラムで二つのピークとして現れる。間隔
の広い方のピークが空白行の間隔に相当する。広い行間
隔の部分が空白行となるので、検知された前後で文字ブ
ロックとして分割する。尚、空白行以外例えば、字下げ
等を用いて文字ブロックを抽出することも可能である。
Next, a character block corresponds to a paragraph and is composed of a set of character strings. Here, since a blank line is inserted at the time of creating an original so that the blank line can be detected with certainty, the blank line is detected. As a method of detecting a blank line, a histogram of Y coordinate intervals of the lower left point of a rectangle surrounding each character string can be used. How to obtain the Y coordinate is shown in FIG. The normal line spacing and the line spacing when one blank line is inserted appear as two peaks in the histogram. The peak with the wider spacing corresponds to the spacing of the blank lines. Since a wide line interval part becomes a blank line, it is divided into character blocks before and after being detected. It is also possible to extract the character block by using indentation or the like other than the blank line.

【0015】次に、分割された各領域(テキスト・ブロ
ック)は識別子付与手段3において、識別子となる文書
項目が付与される。具体的には、本出願人によって先に
出願された特願平3−313186号「文書論理構造認
識および文書内容認識のための装置および方法」(発明
者:尾崎正治 石田祐介)に記載されている技術等にお
いて開示しているようなモデルとのマッチング方式を簡
略化した方法によって行う。図6に、文書モデルの例を
示す。文書は資料名、作成者、作成日、本文ブロックが
上下関係を持ち構成される。上下の関係はY座標の大き
さに基づく。本文ブロック要素は繰り返しの構造を持
つ。また、本文ブロックは下位構造として、見出し行、
内容行を持つ。内容行は繰り返し構造を許す。先に文字
ブロックとして分割された入力原稿は、図6のような構
造を持つ文書モデルと順次マッチングを行うことによっ
て、各ブロックに識別子を付与することが可能である。
図5で示した各ブロックは上から順に、資料名、作成
者、作成日、本文ブロック1、本文ブロック2、本文ブ
ロック3、と識別される。
Next, each divided area (text block) is given a document item as an identifier in the identifier assigning means 3. Specifically, it is described in Japanese Patent Application No. 3-313186, “Apparatus and method for document logical structure recognition and document content recognition” (inventor: Masaharu Ozaki, Yusuke Ishida) previously filed by the present applicant. The method of matching with the model as disclosed in the existing technology is simplified. FIG. 6 shows an example of the document model. A document is composed of a document name, a creator, a creation date, and a body block in a hierarchical relationship. The top-bottom relationship is based on the size of the Y coordinate. The body block element has a repeating structure. In addition, the body block is a substructure,
Has a content line. Content lines allow repeating structures. The input manuscript previously divided into character blocks can be given an identifier to each block by sequentially matching the document model having the structure shown in FIG.
The blocks shown in FIG. 5 are identified as a material name, a creator, a creation date, a body block 1, a body block 2, and a body block 3 in order from the top.

【0016】次に、識別された各文書構成要素は文書構
成要素変換手段5において、フォームデータ保持手段4
に格納されているレイアウトパラメータに従って、その
配置文字サイズなどが変換される。レイアウトパラメー
タの一例を図7に示す。図7の各パラメータの内容を簡
単に説明する。上下位置は本文領域内で、文字列を置く
場所を指定する。正の数値が設定されているものは、本
文領域内の上端からの位置を示す。つまり、文字列の下
端が領域の上から、指定の位置になるようにする。−1
が設定される場合は、相対位置になり、領域の上端ある
いは前の文字行の下端に続けて置くことを意味する。行
左右位置は、行を置く場合に領域の左右方向のどの位置
に置くかを示す。左右マージンはその行を置く際に、領
域の左右に対してどの程度余白を設けるかを指す。行間
隔は、行を置く際にいくらの間隔で、繰り返し置くかを
指定する。ブロック前スペースは各テキストブロックを
置く際に、前のブロック(行)からどの程度離すかを指
定する。文字サイズは合成する文字の大きさ(文字の高
さ)を指定する。
Next, each identified document constituent element is converted by the document constituent element converting means 5 into the form data holding means 4
The layout character size and the like are converted according to the layout parameters stored in. FIG. 7 shows an example of layout parameters. The contents of each parameter in FIG. 7 will be briefly described. The vertical position specifies where to place the character string in the body area. If a positive numerical value is set, it indicates the position from the top of the text area. That is, the lower end of the character string is located at the specified position from the top of the area. -1
When set to, it means a relative position, and it is placed continuously at the top of the area or the bottom of the previous character line. The row left / right position indicates at which position in the left / right direction the area is placed when the row is placed. The left and right margins indicate how much margin is provided on the left and right of the area when the line is placed. The line spacing specifies how many lines are placed when placing lines and how many lines are placed repeatedly. Pre-block space specifies how far apart each text block is from the previous block (line). For the character size, specify the size of the characters to be composed (character height).

【0017】OHP文書内で使用可能な領域はフォーム
枠の位置との関係で大きさ/位置が定められているもの
とする。各文書構成要素は文字サイズパラメータに従っ
て、まず拡大縮小される。倍率は、文字列を切り出した
際の文字行の高さを基に、変倍後の文字高さが指定のポ
イント数相当になるようにする。例の様に24ポイント
相当であれば、約8mm程度の高さにする。従って、入
力文字列の高さが4mmであれば、2倍の大きさにする
ことになる。次に、上記の使用可能な領域の幅、各領域
の左右マージン等に基づいて、各文字行が使用可能な横
幅が決定できるので、拡大した文字行の各文字をこの幅
に順次流しこむ。この文字の流し込みは文字ごとに切り
出されている画像をある幅に収まるように再配置すると
いうものでこれは公知の技術を用いればよく、たとえば
特開平3−122773号公報記載の技術がある。ある
いは、公知ではないが本出願人が先に出願した特願平4
−090146号(「文書処理装置」、発明者:倉橋政
之)の発明の技術を用いるのが好適である。
The size / position of the usable area in the OHP document is determined in relation to the position of the form frame. Each document component is first scaled according to the character size parameter. The magnification is based on the height of the character line when the character string is cut out, so that the character height after scaling corresponds to the specified number of points. If it is equivalent to 24 points as in the example, the height is set to about 8 mm. Therefore, if the height of the input character string is 4 mm, the size will be doubled. Next, since the horizontal width that can be used for each character line can be determined based on the width of the usable area, the left and right margins of each area, and the like, the characters of the enlarged character row are sequentially poured into this width. This character pouring is to rearrange an image cut out for each character so that the image fits within a certain width, and a known technique may be used. For example, there is a technique described in Japanese Patent Laid-Open No. 122773/93. Alternatively, although not known, Japanese Patent Application No. 4 filed by the applicant earlier
It is preferable to use the technology of the invention of No. 090146 (“Document processing device”, inventor: Masayuki Kurahashi).

【0018】文字流し込みを上記特願平4−09014
6号の発明を用いて行う場合は、図16に示すように流
し込み処理に関連する部分を構成する。すなわち、領域
分割手段2には、原稿保持手段1に保持されている文書
画像から、サブ文字パターンを抽出するサブ文字パター
ン抽出部164と、前記抽出の結果得られたサブ文字パ
ターンに関する情報を記憶するサブ文字パターン情報記
憶部165を設ける。また、文書構成要素変換部には、
サブ文字パターン情報記憶部165に記憶されたサブ文
字パターン情報をもとに、原稿保持手段1に記憶された
イメージ情報における各サブ文字パターンを切り出し、
所望の領域内に配置ルールに従って再配置する流し込み
処理部160を設ける。その流し込み処理部160は、
サブ文字パターンの配置に関する配置ルールを格納する
配置ルール記憶部163と、サブ文字パターン情報記憶
部165に記憶されたサブ文字パターン情報と配置ルー
ル記憶部163に記憶された配置ルールをもとに行末行
頭の配置の是非を判定する配置判定部162と、その配
置判定部162の判定結果と前記サブ文字パターン情報
記憶部165の記憶するサブ文字パターン情報に基づ
き、原稿保持手段1に記憶された文書画像からサブ文字
パターンを切り出して所望の領域内に配置する配置処理
部161とを有する。
Character flow is described in Japanese Patent Application No. 4-09014 mentioned above.
In the case of using the invention of No. 6, the portion related to the pouring process is configured as shown in FIG. That is, the area dividing unit 2 stores a sub-character pattern extracting unit 164 that extracts a sub-character pattern from the document image held in the document holding unit 1 and information about the sub-character pattern obtained as a result of the extraction. A sub character pattern information storage unit 165 is provided. In addition, the document component conversion unit,
Based on the sub character pattern information stored in the sub character pattern information storage unit 165, each sub character pattern in the image information stored in the document holding means 1 is cut out,
A pouring processing unit 160 for rearranging in a desired area according to the arrangement rule is provided. The pouring processing unit 160,
An arrangement rule storage unit 163 that stores arrangement rules related to the arrangement of sub character patterns, a line end based on the sub character pattern information stored in the sub character pattern information storage unit 165 and the arrangement rule stored in the arrangement rule storage unit 163. A document stored in the document holding unit 1 based on the layout determination unit 162 that determines whether the beginning of the line is aligned, the determination result of the layout determination unit 162, and the sub-character pattern information stored in the sub-character pattern information storage unit 165. An arrangement processing unit 161 that cuts out a sub-character pattern from an image and arranges it in a desired area.

【0019】サブ文字パターン抽出部164は、前記イ
メージ情報に対して、例えば黒画素塊に外接する矩形領
域を求め、一定の条件を満たすものを抽出するなどして
サブ文字パターンを抽出する。サブ文字パターン情報記
憶部165は、前記抽出したサブ文字パターンに関する
情報、例えば外接矩形領域の位置、範囲、行の高さに対
する相対位置等の情報、を記憶する。
The sub-character pattern extraction unit 164 extracts a sub-character pattern by, for example, obtaining a rectangular area circumscribing a black pixel block in the image information and extracting a rectangular area that satisfies a certain condition. The sub-character pattern information storage unit 165 stores information on the extracted sub-character pattern, such as information on the position, range, and relative position of the circumscribed rectangular area with respect to the line height.

【0020】流し込み処理部160は、サブ文字パター
ン情報をもとに、原稿保持手段1から各サブ文字パター
ンを切り出し、これを所望の領域内に配置ルールに従っ
て流し込む。配置ルールは、例えば改行する際に行末、
行頭へ配置してはならないサブ文字パターンの条件を定
めるものである。すなわち、配置ルール記憶部153
は、例えば改行する際に行末、行頭へ配置してはならな
いサブ文字パターンの条件を定める配置ルールを記憶し
ており、配置判定手段152は、サブ文字パターン情報
記憶部155に記憶された外接矩形情報等のサブ文字パ
ターンの属性情報を配置ルールと照合して、改行可能
性、サブ文字パターン間へのスペース挿入の要否などを
判定する。配置処理部161は、サブ文字パターン情報
における位置、範囲情報により原稿保持手段1からサブ
文字パターンを読み出して、配置判定部152の判定結
果に応じた再配置処理を行う。各ブロックの各文字行を
それぞれ使用可能な幅に流しこむことにより、各構成要
素(文字行)が最終的に合成される際の大きさ、配置を
持った画像になる。これは、ヘッダ/フッタ領域の文字
列も同様である。
The pouring processing unit 160 cuts out each sub-character pattern from the document holding means 1 based on the sub-character pattern information, and pours it into a desired area according to the arrangement rule. The placement rule is,
It defines conditions for sub-character patterns that should not be placed at the beginning of a line. That is, the arrangement rule storage unit 153
Stores an arrangement rule that defines the condition of the sub-character pattern that should not be arranged at the end of the line or the beginning of the line when a line is broken, and the arrangement determination unit 152 stores the circumscribed rectangle stored in the sub-character pattern information storage unit 155. The attribute information of the sub-character pattern such as information is collated with the placement rule to determine the possibility of line breaks, the necessity of inserting a space between the sub-character patterns, and the like. The placement processing unit 161 reads the sub-character pattern from the document holding unit 1 based on the position and range information in the sub-character pattern information, and performs the rearrangement process according to the determination result of the placement determination unit 152. By pouring each character line of each block into a usable width, an image having a size and arrangement when each constituent element (character line) is finally combined is obtained. The same applies to the character string in the header / footer area.

【0021】次に、ここで生成された画像を、OHPの
フォーム画像に順次合成してゆく。合成の手順は、以下
の様にする。この際、ページ・オーバーフロー判定手段
7により、入力原稿を複数枚の文書に合成する制御を行
う。図9aおよび図9bに処理手順をフローチャートで
示す。フローチャート中のiは文字ブロックの番号を、
jは各文字ブロック内における文字行(見出し行、内容
行)の番号を示す。 S1 OHPフォーム枠画像にヘッダ、フッタ文字画
像を合成する。 S2 OHPフォーム枠内領域に、資料名、作成者、
作成日文字行を合成する。(表紙ページ) S3 文字ブロック番号iを1にする。 S4 文字ブロックiの変換画像からそのブロックの
高さhiを求める。 S5 フォーム内の使用可能領域の高さをHとする。 S6 合成画像を退避する。 S7 OHPフォーム枠画像にヘッダ、フッタ文字画
像を合成する。 S8 hiがHより大きいならば、ブロック分割処理
を実行後ステップS13へ。 hiがHより小さいならば、ステップS9へ。 S9 文字ブロックiの画像をOHPフォーム画像に
合成する。H=H◆hi、i=i+1とする。 S10 文字ブロックiは存在するか?。存在しないな
らば、終了する。存在するならば、ステップS11へ。 S11 文字ブロックiの変換画像からブロックの高さ
hiを求める。 S12 hiがHより小さいならば、ステップS9へ。 hiがHより大きいならば、ステップS5へ。 S13 i=i+1(次の文字ブロック)。 S14 文字ブロックiは存在するか?。存在しないな
らば、終了する。存在するならば、ステップS4へ。
Next, the images generated here are sequentially combined with the OHP form image. The synthetic procedure is as follows. At this time, the page overflow determination means 7 controls the input document to be combined into a plurality of documents. 9a and 9b are flowcharts showing the processing procedure. I in the flowchart is the character block number,
j indicates the number of a character line (heading line, content line) in each character block. The header and footer character images are combined with the S1 OHP form frame image. In the area inside the S2 OHP form frame, the material name, creator,
Create date character line is synthesized. (Cover page) S3 Set the character block number i to 1. From the converted image of the S4 character block i, the height hi of the block is obtained. Let H be the height of the usable area in the S5 form. S6 Save the composite image. The header and footer character images are combined with the S7 OHP form frame image. If S8 hi is larger than H, the block division process is executed and then the process proceeds to step S13. If hi is smaller than H, go to step S9. S9 The image of the character block i is combined with the OHP form image. Let H = H ◆ hi and i = i + 1. S10 Does the character block i exist? .. If it does not exist, exit. If it exists, go to step S11. S11 The block height hi is obtained from the converted image of the character block i. If S12 hi is smaller than H, go to step S9. If hi is greater than H, go to step S5. S13 i = i + 1 (next character block). S14 Does the character block i exist? .. If it does not exist, exit. If it exists, go to step S4.

【0022】次に、ブロック分割処理の手順を示す。こ
れは、一つの文字ブロックが1ページのOHPフォーム
に入らなかった場合の処理である。同様に処理のフロー
を図10に示す。 S15 文字ブロックiに含まれる文字行(見出し行、
内容行)を文字行jとする。j=1とする。 S16 変換画像から文字行jの高さhjを求める S17 hjがHより小さいならば、ステップS21
へ。 hjがHより大きいならば、ステップS18へ。 S18 合成画像を退避する。 S19 OHPフォーム枠画像にヘッダ、フッタ文字画
像を合成する。 S20 フォーム内の使用可能領域の高さをHとする。 S21 文字行jの画像をOHPフォーム画像に合成す
る。H=H◆hjとする。j=j+1とする。 S22 文字行jは存在するか?。存在するなら、ステ
ップS16へ。存在しないならば、終了して、図9の処
理に戻る。 以上で、複数のOHP文書の画像が合成され、最終ペー
ジ以外は退避された状態になっている。次に最終処理と
して、合成された文書画像および退避された画像をデジ
タル複写機のマーキング部に順次送り、OHP文書とし
て生成する。
Next, the procedure of block division processing will be described. This is the processing when one character block does not fit in the OHP form of one page. Similarly, the processing flow is shown in FIG. S15 Character lines included in the character block i (heading line,
The content line) is a character line j. Let j = 1. S16 Obtain the height hj of the character line j from the converted image. S17 If hj is smaller than H, step S21
What. If hj is larger than H, go to step S18. S18 The composite image is saved. The header and footer character images are combined with the S19 OHP form frame image. Suppose the height of the usable area in the S20 form is H. S21 The image of the character line j is combined with the OHP form image. Let H = H ◆ hj. Let j = j + 1. S22 Does the character line j exist? .. If it exists, go to step S16. If it does not exist, the process ends and returns to the process of FIG. As described above, the images of the plurality of OHP documents are combined, and the pages other than the final page are saved. Next, as a final process, the combined document image and the saved image are sequentially sent to the marking unit of the digital copying machine to generate an OHP document.

【0023】以上の説明は、ユーザーがシステムが内蔵
するオーバーレイフォームをそのまま使用する場合につ
いて述べたものである。しかし、ユーザーとしては、新
たなフォームを使用したいとか、指定のフォームを使用
しなければならない場合もある。この場合に、どのよう
に新たなフォームを登録するかを図2を参照しながら、
説明する。例えば、図11に示すようなOHPフォーム
を登録して使用したいとする。ユーザーはまずデジタル
複写機の原稿読み取り手段によりフォームをデジタル画
像とし、原稿保持手段1に取り込む。この画像に対し
て、フォーム解析手段9により、文書のフォーム枠画像
と文字列を抽出する。手法としては、先述の領域分離手
法を適用できる。通常フォーム枠画像は単独の連結画像
としては文字画像に比べ極端に大きいため、画像の大き
さを基に分離することができる。フォーム枠が、上下に
分割されている場合も、それぞれ画像としては大きいの
で、それぞれ抽出する。残りの文字画像に関しては、統
合することにより、図12に示すように、文字列14〜
19として抽出することができる。解析結果としては、
フォーム枠画像13そのものの画像、フォーム枠画像の
存在位置を示すフォーム基準枠データ、各文字列を包含
する矩形の位置大きさデータが得られる。フォーム基準
枠はフォーム枠画像が二つ以上に分割されて抽出された
場合は全体を包含するように作成する。フォーム基準枠
12の位置は絶対座標で示される。また、各文字列14
〜19は、フォーム基準枠12からの相対座標で示され
る。
The above description is for the case where the user uses the overlay form built in the system as it is. However, as a user, there are cases where the user wants to use a new form or has to use a designated form. In this case, referring to FIG. 2 how to register a new form,
explain. For example, suppose that the user wants to register and use an OHP form as shown in FIG. The user first converts the form into a digital image by the document reading unit of the digital copying machine and takes it into the document holding unit 1. From this image, the form analysis unit 9 extracts the form frame image and the character string of the document. As the method, the above-mentioned area separation method can be applied. Since the normal form frame image is extremely larger than the character image as a single connected image, it can be separated based on the size of the image. Even when the form frame is divided into upper and lower parts, each image is large, and therefore each is extracted. By integrating the remaining character images, as shown in FIG.
It can be extracted as 19. As an analysis result,
The image of the form frame image 13 itself, the form reference frame data indicating the existing position of the form frame image, and the position size data of the rectangle including each character string are obtained. The form reference frame is created so as to include the whole when the form frame image is divided into two or more and extracted. The position of the form reference frame 12 is indicated by absolute coordinates. In addition, each character string 14
To 19 are indicated by relative coordinates from the form reference frame 12.

【0024】次に、文字領域属性付与手段10の動作に
ついて説明する。まず、フォーム枠画像を越えない範囲
で文字列の上下関係を調べる。上下に文字列が存在する
場合は一つの領域として、外接矩形を作る。結果の例を
図13に示す。このようにすることにより、ヘッダ部、
本文部、フッタ部に相等する文字ブロックを抽出でき
る。本文の合成可能領域は抽出された本文部より通常大
きいので、別の手順で検出する。具体的には、図14に
示す様にまずフォーム基準枠の中心点21を求め、そこ
から水平垂直に走査を行い、フォーム枠画像を最初に検
出する場所22を捜す。これが、最大の合成可能領域に
なるが、実際には、見やすさの観点から、一定のマージ
ン領域を設ける。図のハッチング領域に相当する。マー
ジンの大きさとしては、例えば上下8mm、左右12m
m程度を取る。これで本文部の大きさ、位置を定めるこ
とができる。最大合成可能領域の高さからマージンを引
いたものが、先の合成手順のフローチャートの使用可能
領域の高さHに相当する。通常Hは150mm程度を想
定して、合成する1ページ目の文字列レイアウトパラメ
ータを設定しているが、この値より大きくずれる場合
は、図7のレイアウトパラメータの行上下位置パラメー
タを比例的に変更する。
Next, the operation of the character area attribute adding means 10 will be described. First, check the vertical relationship of character strings within the range that does not exceed the form frame image. If there are upper and lower strings, create a circumscribed rectangle as one area. An example of the result is shown in FIG. By doing this, the header part,
It is possible to extract character blocks that are equivalent to the body part and footer part. Since the synthesizable area of the body is usually larger than the extracted body part, it is detected by another procedure. Specifically, as shown in FIG. 14, first, the center point 21 of the form reference frame is obtained, and then the horizontal and vertical scanning is performed to search for the location 22 where the form frame image is first detected. Although this is the maximum synthesizable area, a certain margin area is actually provided from the viewpoint of visibility. It corresponds to the hatched area in the figure. The size of the margin is, for example, 8 mm vertically and 12 m horizontally.
Take about m. With this, the size and position of the text part can be determined. The height obtained by subtracting the margin from the height of the maximum synthesizable area corresponds to the height H of the usable area in the flowchart of the previous synthesizing procedure. Normally, H is set to about 150 mm and the character string layout parameter of the first page to be combined is set, but if it deviates by more than this value, the line vertical position parameter of the layout parameter of FIG. 7 is changed proportionally. To do.

【0025】次に、ヘッダ/フッタ部のテキスト領域部
は存在位置により、異なる属性を付与する。文字の存在
可能位置としては、ヘッダ/フッタともに左、中央、右
の3か所が考えられる。そこで、図15に示すように、
各文字列矩形のX軸方向の中心座標とフォーム基準枠を
水平に3等分する基準線の位置関係を調べる。基準線1
より左に有る場合は、左ヘッダあるいは左フッタ、基準
線1、2の間にある場合は中央ヘッダあるいは中央フッ
タ、基準線2より右にある場合は右ヘッダあるいは右フ
ッタ、とする。左ヘッダ/フッタの場合は文字列矩形の
左下角を、中央ヘッダ/フッタの場合は文字列矩形の中
心下部を、右ヘッダ/フッタの場合は文字列矩形の右下
角を文字合成の原点にする。図中の太矢印の位置。また
その文字サイズは文字列の高さに相当するサイズとす
る。
Next, the text area portion of the header / footer portion is given different attributes depending on the existing position. There are three possible positions for the characters in the header / footer: left, center, and right. Therefore, as shown in FIG.
The positional relationship between the center coordinates of each character string rectangle in the X-axis direction and a reference line that horizontally divides the form reference frame into three equal parts is examined. Reference line 1
If it is on the further left, it is the left header or footer, if it is between the reference lines 1 and 2, it is the center header or center footer, and if it is on the right of the reference line 2, it is the right header or right footer. Use the lower left corner of the string rectangle for the left header / footer, the lower center of the string rectangle for the center header / footer, and the lower right corner of the string rectangle for the right header / footer as the origin of character composition. .. The position of the thick arrow in the figure. The character size is the size corresponding to the height of the character string.

【0026】次に、どのフッタ/ヘッダをどのように使
用するかをフォーム構成要素選択手段11により指定す
る。これは、各フッタ/ヘッダ位置に、図3で示したよ
うな、文書の何番目の要素を合成するかを指定すること
により行う。ユーザーとのインタフェースとしては、デ
ジタル複写機の表示パネルとテン・キーが使用可能であ
る。表示パネルに以下のようなメッセージを順次表示
し、ユーザーに数字を入力させる。 『 ヘッダ、フッタはどのような順番で使用しますか。 順番を入力してください。 使用しない場合は、0を入力してください。 ヘッダ(中央)? 1「確認] フッタ(左)? 3[確認] フッタ(右)? 2[確認]
Next, the form component selecting means 11 specifies which footer / header and how to use it. This is done by designating at each footer / header position what number element of the document to synthesize, as shown in FIG. As a user interface, the display panel and the numeric keypad of the digital copying machine can be used. Display the following messages in sequence on the display panel and let the user enter a number. “In what order should headers and footers be used? Please enter the order. Enter 0 if not used. Header (center)? 1 "Confirmation" footer (left)? 3 [Confirmation] footer (right)? 2 [Confirmation]

【0027】この後、確認の表示をしてもよい。また、
この例ではすべて使用することにしているが、使わない
ヘッダ、フッタが有ってもよい。この場合は、0を入力
すればよい。尚、上の例でアンダーラインの付してある
所がユーザー入力である。また、[確認]は設定確認の
ための専用キーである。ユーザーに確認する順序は特に
規定する必要はないが、左ヘッダ、中央ヘッダ、右ヘッ
ダ、左フッタ、中央フッタ、右フッタ等の順で、しかも
先のフォーム解析で検出された領域のみについて、表示
すればよい。
After that, confirmation may be displayed. Also,
In this example, we decided to use all of them, but there may be headers and footers that are not used. In this case, 0 may be input. The underlined portion in the above example is the user input. [Confirm] is a dedicated key for setting confirmation. The order to confirm with the user does not need to be specified, but only the areas detected by the previous form analysis are displayed in the order of left header, center header, right header, left footer, center footer, right footer, etc. do it.

【0028】これで、1ページ目の本文領域と選択指示
された文字領域について先に与えられた属性に基づい
て、レイアウトパラメータとして、フォーム枠画像等と
供に、フォームデータ保持手段4に格納される。ヘッ
ダ、フッタのレイアウトのパラメータ記述例は図8と同
様である。
With this, the form data is stored in the form data holding means 4 together with the form frame image and the like as a layout parameter based on the attributes previously given to the body area of the first page and the character area selected and instructed. It A parameter description example of the layout of the header and footer is the same as in FIG.

【0029】以上で、本発明をデジタル複写機に適用し
た例を説明した。しかし、本発明はデジタル複写機のみ
に適用されるものではない。例えば、スキャナとプロジ
ェクタを用いたプレゼンテーションシステムにおいて、
通常の文書を読み取らせて、フォームと合成して表示す
ることも可能である。また、本発明では、画像レベルの
入力を処理することを前提としたが、入力文書をワード
プロセッサで生成した電子文書とし、文字コードレベル
で文書レイアウトを解析し、自動的に項目を抽出し、フ
ォームに合成することも同様の考え方で実現できる。ま
た、文書のレイアウトパラメータの記述法は実施例の説
明で用いたものに限る必要は無い。更に、説明中ではフ
ォームとして用いているものはフォーム枠画像と文字列
であるが、ロゴ画像等にまで、拡張してもよい。
The example in which the present invention is applied to a digital copying machine has been described above. However, the present invention is not applied only to digital copying machines. For example, in a presentation system that uses a scanner and projector,
It is also possible to read a normal document and display it by combining with a form. Although the present invention is premised on processing image level input, the input document is an electronic document generated by a word processor, the document layout is analyzed at the character code level, items are automatically extracted, and a form is created. It can be realized by the same idea. Further, the description method of the layout parameter of the document is not limited to the one used in the description of the embodiment. Further, although the form frame image and the character string are used as the form in the description, they may be extended to a logo image and the like.

【0030】[0030]

【発明の効果】本発明の文書処理装置によれば、位置や
段数、文字数をあらかじめ決めないで作成した一般的な
文書の内容を自動的に所定のフォームに電子的かつ自動
的に合成することにより、容易にかつ効率的良く所定の
フォーム枠を持つ文書を作成することができる。すなわ
ち、本発明によれば、対象の文書画像が領域分割手段と
論理識別子付与手段により解析され、その解析結果とフ
ォーム保持手段により予め用意したフォームデータとに
基づいて、文書画像を加工して所定の出力画像を自動的
に生成するので、容易にかつ効率的良くフォーム枠を持
つ文書を得ることができる。また、フォームデータは文
書のデザインのパラメータを含むので、利用者は文書デ
ザインに関する知識を持たなくても、見栄えの良い文書
を得ることができる。
According to the document processing apparatus of the present invention, the contents of a general document created without previously determining the position, the number of columns, and the number of characters can be automatically and electronically combined into a predetermined form. This makes it possible to easily and efficiently create a document having a predetermined form frame. That is, according to the present invention, the target document image is analyzed by the area dividing unit and the logical identifier assigning unit, and the document image is processed and predetermined based on the analysis result and the form data prepared in advance by the form holding unit. Since the output image of is automatically generated, a document having a form frame can be obtained easily and efficiently. Further, since the form data includes the document design parameters, the user can obtain a good-looking document without knowledge of the document design.

【0031】また、本発明によれば、ページ・オーバー
フロー判定手段を設けることにより、2ページ以上にわ
たる文書でも各ページが一定のフォームに従った見栄え
の良い文書を生成することができる。
Further, according to the present invention, by providing the page overflow determining means, it is possible to generate a good-looking document in which each page conforms to a fixed form even in a document having two or more pages.

【0032】また、本発明のフォーム登録手段によれ
ば、簡単な操作によりフォームの登録をすることがで
き、ユーザーの所望のフォームも使用可能である。
Further, according to the form registration means of the present invention, the form can be registered by a simple operation, and the user's desired form can be used.

【図面の簡単な説明】[Brief description of drawings]

【図1】プレゼンテーション用文書処理装置の概略の構
成を示す図
FIG. 1 is a diagram showing a schematic configuration of a presentation document processing apparatus.

【図2】フォーム登録装置の概略の構成を示す図FIG. 2 is a diagram showing a schematic configuration of a form registration device.

【図3】入力するワードプロセッサ原稿の例を示す図FIG. 3 is a diagram showing an example of a word processing document to be input.

【図4】出力されるOHP文書の例を示す図FIG. 4 is a diagram showing an example of an output OHP document.

【図5】ワードプロセッサ原稿を領域分割した結果を示
す図
FIG. 5 is a diagram showing a result of area division of a word processor document.

【図6】文書モデルの例を示す図FIG. 6 is a diagram showing an example of a document model.

【図7】レイアウトパラメータの例を示す図FIG. 7 is a diagram showing an example of layout parameters.

【図8】ヘッダ/フッタレイアウトパラメータの例を示
す図
FIG. 8 is a diagram showing an example of header / footer layout parameters.

【図9】合成処理手順を示す図FIG. 9 is a diagram showing a synthesis processing procedure.

【図10】ブロック分割処理手順を示す図FIG. 10 is a diagram showing a block division processing procedure.

【図11】使いたいOHPフォームの例を示す図FIG. 11 is a diagram showing an example of an OHP foam to be used.

【図12】フォーム解析結果の例を示す図FIG. 12 is a diagram showing an example of a form analysis result.

【図13】文字列を統合した例を示す図FIG. 13 is a diagram showing an example in which character strings are integrated.

【図14】本文合成可能領域の検出を示す図FIG. 14 is a diagram showing detection of a text compositable area.

【図15】文字列存在位置の検出を示す図FIG. 15 is a diagram showing detection of a character string existing position.

【図16】文字流し込みのための構成を示す図FIG. 16 is a diagram showing a configuration for character flow.

【符号の説明】[Explanation of symbols]

1…原稿保持手段、2…領域分割手段、3…識別子付与
手段、4…フォームデータ保持手段、5…文書構成要素
変換手段、6…画像合成手段、7…ページオーバーフロ
ー判定手段、8…画像生成手段、9…フォーム解析手
段、10…文字領域属性付与部、11…フォーム構成要
素選択手段、12…フォーム基準枠、13…フォーム枠
画像
DESCRIPTION OF SYMBOLS 1 ... Original document holding means, 2 ... Area dividing means, 3 ... Identifier assigning means, 4 ... Form data holding means, 5 ... Document component conversion means, 6 ... Image combining means, 7 ... Page overflow determination means, 8 ... Image generation Means, 9 ... Form analysis means, 10 ... Character area attribute imparting section, 11 ... Form component selection means, 12 ... Form reference frame, 13 ... Form frame image

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 文書画像を保持する文書画像保持手段
と、 この文書画像保持手段に保持された文書画像を文書要素
として意味の有る領域に分割する領域分割手段と、 領域分割手段により分割されたそれぞれの領域に識別子
を付与する識別子付与手段と、 生成する文書のレイアウト情報およびフォーム枠画像を
含むフォームデータを保持するフォームデータ保持手段
と、 このフォームデータ保持手段に保持されたフォームデー
タを参照することにより各領域内の画像要素を前記識別
子付与手段により付与された識別子に応じて変換する文
書構成要素変換手段と、 この文書構成要素変換手段により変換された各要素を順
次フォーム画像に合成する画像合成手段とを備えたこと
を特徴とする文書処理装置。
1. A document image holding means for holding a document image, an area dividing means for dividing the document image held by the document image holding means into meaningful areas as document elements, and an area dividing means. An identifier giving means for giving an identifier to each area, a form data holding means for holding form data including layout information and a form frame image of a generated document, and a reference to the form data held by the form data holding means By doing so, a document constituent element converting means for converting the image element in each area according to the identifier given by the identifier giving means, and an image for sequentially synthesizing each element converted by the document constituent element converting means into a form image A document processing apparatus comprising: a synthesizing unit.
【請求項2】各要素を順次フォーム画像に合成する際
に、1ページのフォームに前記要素が入るか否かを判断
し、入りきらないと判断した場合に次のページへの合成
を指示するページ・オーバーフロー判定手段を設けたこ
とを特徴とする請求項1記載の文書処理装置。
2. When synthesizing each element sequentially into a form image, it is determined whether or not the element is included in a form of one page, and if it is determined that the element cannot be included in the form image, an instruction to synthesize to the next page is issued. The document processing apparatus according to claim 1, further comprising page overflow determination means.
【請求項3】 文書画像を保持する文書画像保持手段
と、 この文書画像保持手段に保持された文書画像を解析し、
フォーム画像と文字領域を抽出するフォーム解析手段
と、 このフォーム解析手段により抽出された文字領域の位置
に基づいて各それぞれの文字領域に属性を付与する文字
領域属性付与手段と、 各文字領域をフォームとして登録するか否かをユーザー
に確認するフォーム構成要素選択手段と、 以上より抽出されたフォーム枠画像、文字領域属性を含
むレイアウト情報を格納するフォームデータ保持手段と
を備えたことを特徴とする請求項1の文書処理装置のた
めのフォーム登録装置。
3. A document image holding means for holding a document image, and analyzing the document image held by the document image holding means,
Form analysis means for extracting a form image and a character area, character area attribute assigning means for assigning an attribute to each character area based on the position of the character area extracted by this form analysis means, and each character area Form component selection means for confirming to the user whether or not to register as, and form data holding means for storing the layout information including the form frame image and the character area attribute extracted as described above. A form registration device for the document processing device of claim 1.
JP4168310A 1992-06-04 1992-06-04 Document processor and form register device therefor Pending JPH05342325A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4168310A JPH05342325A (en) 1992-06-04 1992-06-04 Document processor and form register device therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4168310A JPH05342325A (en) 1992-06-04 1992-06-04 Document processor and form register device therefor

Publications (1)

Publication Number Publication Date
JPH05342325A true JPH05342325A (en) 1993-12-24

Family

ID=15865659

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4168310A Pending JPH05342325A (en) 1992-06-04 1992-06-04 Document processor and form register device therefor

Country Status (1)

Country Link
JP (1) JPH05342325A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11289450A (en) * 1997-10-13 1999-10-19 Matsushita Electric Ind Co Ltd Fuzzy inference method, its image, image forming method and its system
JP2005293589A (en) * 2004-03-30 2005-10-20 Ricoh Co Ltd Method for creating compound electronic expressive article, computer program and data processing system
JP2009278198A (en) * 2008-05-12 2009-11-26 Konica Minolta Business Technologies Inc Image processor
US8027550B2 (en) 2007-03-30 2011-09-27 Sharp Kabushiki Kaisha Image-document retrieving apparatus, method of retrieving image document, program, and recording medium

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11289450A (en) * 1997-10-13 1999-10-19 Matsushita Electric Ind Co Ltd Fuzzy inference method, its image, image forming method and its system
JP2005293589A (en) * 2004-03-30 2005-10-20 Ricoh Co Ltd Method for creating compound electronic expressive article, computer program and data processing system
US8027550B2 (en) 2007-03-30 2011-09-27 Sharp Kabushiki Kaisha Image-document retrieving apparatus, method of retrieving image document, program, and recording medium
JP2009278198A (en) * 2008-05-12 2009-11-26 Konica Minolta Business Technologies Inc Image processor

Similar Documents

Publication Publication Date Title
EP0690415B1 (en) Editing scanned document images using simple interpretations
JP2695844B2 (en) Document shaping device
US6208744B1 (en) Document image processor and method for setting a document format conforming to a document image
JPH0668300A (en) Method and apparatus for forming layout model of document picture
JPH09171557A (en) Method for processing image and device therefor
JP5033277B2 (en) Image processing apparatus, image processing method, and computer-readable recording medium
JP2010123002A (en) Document image layout device
JPH05342325A (en) Document processor and form register device therefor
JPH0612540B2 (en) Document creation support device
JP4599693B2 (en) Image processing apparatus, image processing method, and computer-readable recording medium
JPH08180068A (en) Electronic filing device
JP2008108114A (en) Document processor and document processing method
JP2000168294A (en) Electronic white board system
JP4501731B2 (en) Image processing device
JP2608276B2 (en) Document display device
JP4334987B2 (en) DTP editing apparatus having area designation function and data cutout function
JPH07107711B2 (en) Document image processing device
JP2800254B2 (en) Image single character processing device
JP3424942B2 (en) Bilingual image forming device
JPH10320412A (en) Document generation device
JP2002185763A (en) Digital copying machine
JP3306969B2 (en) Document editing device
JPH103516A (en) Method and device for processing information
JPH06187333A (en) Document preparing device
JPH0728934A (en) Document image processor