JPH0460759A - Document preparation support device - Google Patents

Document preparation support device

Info

Publication number
JPH0460759A
JPH0460759A JP2172326A JP17232690A JPH0460759A JP H0460759 A JPH0460759 A JP H0460759A JP 2172326 A JP2172326 A JP 2172326A JP 17232690 A JP17232690 A JP 17232690A JP H0460759 A JPH0460759 A JP H0460759A
Authority
JP
Japan
Prior art keywords
area
document
layout
graphic
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2172326A
Other languages
Japanese (ja)
Other versions
JPH0612540B2 (en
Inventor
Junichi Osumi
大住 淳一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2172326A priority Critical patent/JPH0612540B2/en
Priority to GB9113488A priority patent/GB2247803B/en
Priority to DE4121564A priority patent/DE4121564C2/en
Publication of JPH0460759A publication Critical patent/JPH0460759A/en
Publication of JPH0612540B2 publication Critical patent/JPH0612540B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents

Abstract

PURPOSE:To improve the efficiency of document preparation by providing a layout analysis part, a layout preparation instruction part giving the instruction of setting an area similar to a document becoming a model in a document to be prepared based on obtained layout information. CONSTITUTION:A picture input part 2 inputs an original picture becoming the model and analyzes a binarized document picture in an area analysis part. A character part analysis part analyzes the internal structure of the area extracted as a character area in the area analysis part. In a graphic part analysis part, the area judged to be a graphic in the area analysis part is analyzed and a linear graphic is made into vector. Thus, the analysis of a layout terminates and the original picture which the picture input part 2 reads is separated into respective areas of the character area, a picture area and a graphic area. The layout preparation instruction part 4 gives the instruction of layout to a layout allocation part 5 and allocates respective areas.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発胡は、ワードプロセッサ、ワークステーション等の
文書作成装置に関し、特に、文字1図形画像等が混在し
た複雑なレイアウト構造の文書のレイアウトを電子的に
作成する文書作成支援装置に関する。
[Detailed Description of the Invention] [Field of Industrial Application] This invention relates to document creation devices such as word processors and workstations, and in particular, the present invention relates to document creation devices such as word processors and workstations. The present invention relates to a document creation support device for manually creating documents.

〔従来の技術〕[Conventional technology]

ワードプロセッサ、ワークステーション等の文書作成装
置により、文書を作成する場合、一つの文書中に、文字
の他に、直線1曲線等のベクトル情報で規定されるベク
トル表示図形、或いは、イメージリーグで読み込まれた
画像のようなビットパターンで規定されるビットマツプ
画像を混在させたい場合がある。このような、文字、ベ
クトル表示図形、ビットマツプ画像等が混在する文書を
作成する場合、文字、ベクトル表示図形、ピットマツプ
画像のそれぞれに対する装置内でのデータ処理の形態が
異なる。そこで、処理効率を高めるため、文書中にそれ
ぞれ文字枠1図形枠1画像枠と呼ばれる特別な領域を設
定し、文書の作成或いは編集に際しては、処理の対象と
なった領域の属性を判別し、その属性に応じた処理を行
っている。
When creating a document using a document creation device such as a word processor or workstation, in addition to characters, a single document may include vector display figures defined by vector information such as straight lines and curves, or images read in image leagues. There are cases where it is desired to mix bitmap images defined by bit patterns, such as images with bitmap images. When creating a document containing a mixture of characters, vector display figures, bitmap images, etc., the data processing format within the apparatus is different for each of the characters, vector display figures, and pitmap images. Therefore, in order to improve processing efficiency, special areas called character frames, figure frames, and image frames are set in each document, and when creating or editing a document, the attributes of the areas targeted for processing are determined. Processing is performed according to its attributes.

なお、本明細書においては、画像という用語は広義には
、文字、ベクトル表示図形、ピットマツプ画像等を含み
、狭義にはピットマツプ画像のみを示すものとする。
In this specification, the term "image" in a broad sense includes characters, vector display figures, pit map images, etc., and in a narrow sense refers only to pit map images.

このような、文字、ベクトル表示図形、ピットマツプ画
像等が混在する文書を作成する場合、文書作成者がレイ
アウトを考えながら該当する属性の枠を文書内に設定し
、大きさ1位置を調整する作業を行う必要があった。
When creating a document containing a mixture of text, vector display figures, pit map images, etc., the document creator must consider the layout, set a frame for the relevant attributes within the document, and adjust the size and position. It was necessary to do this.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

しかしながら、この枠の設定、調整は、文字枠、図形枠
、画像枠のそれぞれに対して行う必要があり、また、同
属性の枠が複数ある場合も同様な作業を繰り返さなけれ
ばならなかった。このため、文書の作成作業が煩雑とな
り手間がかかるという問題があった。特に、類似の文書
が既に存在していて、同様のレイアウトを使いたい場合
でも、作成者が一々全て入力する必要があり、労力を要
するばかりではなく、精神的にも苦痛であった。
However, this setting and adjustment of frames must be performed for each character frame, graphic frame, and image frame, and the same operations must be repeated even when there are multiple frames with the same attribute. For this reason, there was a problem in that document creation work was complicated and time-consuming. In particular, even if a similar document already exists and the author wants to use a similar layout, the author has to input everything one by one, which is not only labor-intensive but also mentally painful.

これを改善するための方法としては、基本的なレイアウ
トをもった文書を多種あらかじめ作成しておき、必要の
つと検索、コピーし、内容を入力するようにする方法が
考えられる。
One possible way to improve this is to create a variety of documents with basic layouts in advance, then search for, copy, and input the contents as needed.

しかし、この方法では、必要なレイアウトをあらかじめ
登録する必要があり、初期の入力作業の労力が非常に大
きい。また、必要なレイアウトの文書がすべて登録され
ている必要があり、膨大な記憶容量が必要になる。これ
らの登録済レイアウトを使う際には、目的のレイアウト
を検索する必要があるが、多数登録されていると容易に
検索できない等の問題がある。
However, with this method, it is necessary to register the necessary layout in advance, and the initial input work is very labor-intensive. Furthermore, all documents with required layouts must be registered, which requires a huge amount of storage capacity. When using these registered layouts, it is necessary to search for the desired layout, but there are problems such as difficulty in searching if a large number of layouts are registered.

本発明は、以上のような問題点を解決するものであり、
作成したいものと類似のレイアウト文書が有る場合、そ
の場で各種の枠のレイアウトを自動的に生成し文書作成
の効率を改善しようとするものである。
The present invention solves the above problems, and
If there is a layout document similar to the one you want to create, the system automatically generates layouts of various frames on the spot to improve the efficiency of document creation.

〔課題を解決するための手段〕[Means to solve the problem]

本発悶の文書作成支援装置は、前記目的を達成するため
、文書を作成するに際し作成すべき文書に含まれる画像
の属性に応じてそれぞれ異なった領域を設定し各領域に
対してそれぞれ異なった処理を行う文書作成装置におい
て使用される文書作成支援袋ばてあって、雛形となる文
書を画像として入力する画像入力部と、入力された文書
の画像の属性を判別し、この属性の相違に基づいて前記
各領域の大きさ1位置及び属性を示すレイアウト情報を
抽出するレイアウト解析部と、得られたレイアウト情報
に基づいて作成すべき文書に加配雛形となる文書と同様
な領域の設定を指示するレイアウト生成指示部とを備え
ていることを特徴とする。
In order to achieve the above-mentioned purpose, this document creation support device sets different areas according to the attributes of images included in the document to be created when creating a document, and sets different areas for each area. A document creation support bag used in a document creation device that performs processing includes an image input section that inputs a template document as an image, and an image input section that determines the attributes of the image of the input document and detects differences in these attributes. a layout analysis unit that extracts layout information indicating the size, position, and attributes of each area based on the layout information, and an instruction to set an area similar to a document that will be an addition template in a document to be created based on the obtained layout information. The present invention is characterized by comprising a layout generation instruction section that performs the following steps.

前8己レイアウト解析部は、文書の画像から文字領域1
図形領域及び画像領域を抽出する領域解析部と、前記文
字領域内の文字部の属性を解析する文字部解析部と、前
記図形領域内の図形部を解析して図形中の線成分を抽出
しベクトルデータとして出力する図形部解析部から構成
することができる。
The layout analysis section extracts character area 1 from the document image.
a region analysis unit that extracts a graphic area and an image area; a character part analysis unit that analyzes the attributes of a character part in the character area; and a character part analysis part that analyzes the graphic part in the graphic area to extract line components in the figure. It can be composed of a graphic part analysis section that outputs vector data.

〔作用〕[Effect]

本発明においては、文書のレイアウトを設定するに際し
て、雛形となる文書の画像が入力され、レイアウト解析
部によりその領域の種別が識別される。たとえば、文書
に含まれる連結画像の外接矩形が求められ、この外接矩
形の大きさ、配置等により、文字領域1図形領域及び画
像領域が判別される。これらの解析された領域に基づき
、レイアウト生成指示部からの指示により新たに作成す
る文書に対して対応する領域が設定される。したがって
、新たに作成する文書には、雛形となる文書と同様なレ
イアウトで各領域が設定されることになる。
In the present invention, when setting the layout of a document, an image of the document serving as a template is input, and the type of the area is identified by the layout analysis section. For example, a circumscribed rectangle of a connected image included in a document is obtained, and a character area, a graphic area, and an image area are determined based on the size, arrangement, etc. of this circumscribed rectangle. Based on these analyzed areas, corresponding areas are set for the newly created document according to instructions from the layout generation instruction section. Therefore, in a newly created document, each area will be set in the same layout as the template document.

〔実施例〕〔Example〕

以下、図面を参照しながら実施例に基づいて本発明の特
徴を具体的に説明する。
DETAILED DESCRIPTION OF THE INVENTION Hereinafter, features of the present invention will be specifically described based on examples with reference to the drawings.

第1図に本発明の文書作成支援装置が適用されたワード
プロセッサ等の文書作成装置の構成を示す。文書作成支
援装置1は、文書を画像として入力する画像入力部2、
入力した文書の画像から文書のレイアウトを抽出するレ
イアウト解析部3、解析したレイアウトに従って、図形
枠2文字枠。
FIG. 1 shows the configuration of a document creation device such as a word processor to which the document creation support device of the present invention is applied. The document creation support device 1 includes an image input unit 2 that inputs a document as an image;
A layout analysis unit 3 extracts a document layout from an input document image, and a graphic frame 2 character frame according to the analyzed layout.

画像枠等の生成を指示するレイアウト生成指示部4を備
えている。レイアウト生成指示部4から指定されたレイ
アウトは、レイアウト割り付は部5により実際にユーザ
ーに見える形に表現される。
It includes a layout generation instruction section 4 that instructs generation of image frames and the like. The layout specified by the layout generation instruction unit 4 is expressed by the layout allocation unit 5 in a form that is actually visible to the user.

また、キーボード/マウス6から入力されたデータは、
文字・図形入力部7により文字や図形として変換されて
取り込まれ、内容割り付は部8において、先にレイアウ
トされた各粋の中に入力され、表示B9で表示される。
In addition, data input from the keyboard/mouse 6 is
The text is converted into characters and graphics by the character/graphic input unit 7 and inputted, and the content allocation is inputted into each of the previously laid out blocks in the unit 8 and displayed on the display B9.

また、レイアウトがキーボード/マウス6から手操作で
入力されるときは、レイアウト座標・属性入力部10に
おいて、キーボード/マウス6から入力されたデータを
変換し、レイアウト生成指示部4へ送る。
Further, when a layout is manually input from the keyboard/mouse 6, the data input from the keyboard/mouse 6 is converted in the layout coordinate/attribute input section 10 and sent to the layout generation instruction section 4.

第2図にレイアウト解析部3の構成を示す。画像入力部
2から入力された文書の画像は、領域解析部11におい
て、文字、ベクトル表示図形、ビットマツプ画像の各領
域に分けられ、文字領域では文字部解析部12において
、文字領域の場所、文字の大きさ、文字列の間隔、文字
列の方向等のデータ(文字枠/文字部属性データ)が抽
出される。
FIG. 2 shows the configuration of the layout analysis section 3. The document image input from the image input section 2 is divided into regions of characters, vector display figures, and bitmap images by the region analysis section 11. Data (character frame/character part attribute data) such as the size of the text, the spacing between character strings, and the direction of character strings are extracted.

図形領域では、図形部解析部13において、図の囲み枠
9表の枠、けい線、段の仕切り線等の縦横線が検出され
、ベクトルデータ(図形枠/けい線データ)として出力
される。また、画像部は枠データとして出力される。
In the graphic area, the graphic part analysis unit 13 detects vertical and horizontal lines such as the frame of the enclosing frame 9 of the figure, the horizontal lines, the column partition lines, etc., and outputs them as vector data (graphic frame/cross line data). Further, the image portion is output as frame data.

次に、上述のレイアウト解析部3の動作について説明す
る。
Next, the operation of the above-mentioned layout analysis section 3 will be explained.

まず、画像入力部2 (第1図参照)で雛形となる原稿
画像を入力し、2値化した文書画像を領域解析部11て
解析する。領域解析の方法は特に限定しないが、一方法
としては、連結した画像をそれぞれ囲む外接矩形をとり
、外接矩形の大きさ、配置等により分類する方法がある
First, a document image serving as a template is input to the image input unit 2 (see FIG. 1), and the binarized document image is analyzed by the area analysis unit 11. The area analysis method is not particularly limited, but one method is to take circumscribed rectangles surrounding each connected image and classify them based on the size, arrangement, etc. of the circumscribed rectangles.

第3図に領域解析の手順の例を示す。FIG. 3 shows an example of the procedure for area analysis.

まず、外接矩形を抽出する(ステップ101)。この際
、重なりあった外接矩形は全体を包含する外接矩形に置
き換えて統合しておく (ステップ102)。
First, a circumscribed rectangle is extracted (step 101). At this time, the overlapping circumscribed rectangles are replaced with a circumscribed rectangle that encompasses the entire area and integrated (step 102).

外接矩形の縦或いは横の長さが文字の大きさを越えるも
のはビットマツプ画像或いはベクトル表示図形と識別す
ることができる(ステップ103)。たとえば、36ポ
イントまでの文字を扱うとすると、高さ又は幅が約13
mmより大きいものは、ビットマツプ画像或いはベクト
ル表示図形と見做す。また、大きい外接矩形の内、縦横
比が1に近く、外接矩形内の黒画素の比率が高いものは
画像領域と識別できる(ステップ104)。なお、縦横
比が1に近いとは、1/3〜3の範囲にあることを意味
する。
A circumscribed rectangle whose vertical or horizontal length exceeds the character size can be identified as a bitmap image or a vector display figure (step 103). For example, if you are dealing with characters up to 36 points, the height or width is approximately 13
Anything larger than mm is regarded as a bitmap image or vector display figure. Furthermore, among large circumscribed rectangles, those with an aspect ratio close to 1 and a high ratio of black pixels within the circumscribed rectangle can be identified as image areas (step 104). Note that the aspect ratio close to 1 means that the aspect ratio is in the range of 1/3 to 3.

他の大きい外接矩形は図形領域と考えることができる。Other large circumscribed rectangles can be considered graphic areas.

才だ、小さい外接矩形は文字と判定されるが、さらに水
平・垂直方向の文字の周期性を調べることにより、確認
可能である(ステップ105)。
The small circumscribed rectangle is determined to be a character, but this can be confirmed by further examining the periodicity of the character in the horizontal and vertical directions (step 105).

このとき得られた水平・垂直の文字周期がほぼ一定の外
接矩形の集合が、同一の属性をもった文字群すなわち文
字領域として抽出される(ステップ106)。以上の処
理により、文字領域、図形領域、画像領域が抽出され、
各領域の大きさ・位置情報が得られる。
A set of circumscribed rectangles with substantially constant horizontal and vertical character periods obtained at this time is extracted as a character group having the same attribute, that is, a character area (step 106). Through the above processing, character areas, graphic areas, and image areas are extracted.
Size and position information of each area can be obtained.

上述の領域解析においては、外接矩形大きさ。In the area analysis described above, the size of the circumscribed rectangle.

縦横比等により各領域を識別したが、この他にも、木田
他「文書自動認識システムの構成法」1画像電子学会誌
1 第15巻第2号(1986)、 P2O3〜115
 に記載されているような、周辺分布法と黒連結法を併
用したアルゴリズム等を採用することができる。
Although each area was identified based on the aspect ratio, etc., there are also other examples, such as Kida et al., "Configuration Method of Automatic Document Recognition System," 1 Journal of the Institute of Image Electronics Engineers, Vol. 15, No. 2 (1986), P2O3-115.
It is possible to employ an algorithm that uses a combination of the marginal distribution method and the black connection method, as described in .

次に、文字部解析部12について説明する。ここては、
領域解析部11で文字領域として抽出された領域の内部
の構造を解析する。ここでも、特に方法は限定しない。
Next, the character part analysis section 12 will be explained. Here,
The area analysis unit 11 analyzes the internal structure of the area extracted as a character area. Here, too, the method is not particularly limited.

一方法として、先に抽出した外接矩形及びその周期を用
いる。概略の手順の例を第4図に示す。
One method uses the previously extracted circumscribed rectangle and its period. An example of a schematic procedure is shown in FIG.

まず、文字列の方向を検出する。通常、文字間隔の方が
文字列間隔より狭い。そこで矩形間の間隔を抽出しくス
テップ201)、水平方向・垂直方向の外接矩形の平均
の間隔の小さい方向が文字列の並んでいる方向であるき
判断する(ステップ202)。
First, detect the direction of the string. Character spacing is usually narrower than string spacing. Therefore, the intervals between the rectangles are extracted (step 201), and it is determined whether the direction in which the average interval between the circumscribed rectangles in the horizontal and vertical directions is smaller is the direction in which the character strings are lined up (step 202).

すなわち、垂直の間隔が水平の間隔より大きいときは、
横書きと判断して文字列間隔を垂直周期としくステップ
203)、そうでないときは縦書きと判断して文字列間
隔を水平周期とする(ステップ204)。
That is, when the vertical spacing is greater than the horizontal spacing,
If horizontal writing is determined, the character string spacing is set to the vertical period (step 203); otherwise, vertical writing is determined and the character string spacing is set to the horizontal period (step 204).

次に、領域内の外接矩形の幅と高さのそれぞれの最大値
から文字の大きさを求める(ステップ205)。
Next, the character size is determined from the maximum values of the width and height of the circumscribed rectangle within the area (step 205).

これで、各文字領域内の属性を特定することができる。This allows the attributes within each character area to be specified.

次に、図形部解析部13において、領域解析部11で図
形と判定された領域を解析し、線図形をベクトル化する
。なお、検出された全ての線図形をベクトル化すること
も可能であるが、ここでは、枠情報や罫線、縦横の直線
からなる表の枠、段組みの仕切り線等の構造的に重要で
再利用の価値の高いと考えられる縦横の長い線分のみを
抽出する。
Next, the graphic part analysis unit 13 analyzes the area determined to be a graphic by the region analysis unit 11, and vectorizes the line figure. It is also possible to vectorize all detected line shapes, but here we focus on structurally important and reusable information such as frame information, ruled lines, table frames made of vertical and horizontal straight lines, and column partition lines. Extract only long vertical and horizontal line segments that are considered to be of high use value.

第5図に解析の手順の例を示す。FIG. 5 shows an example of the analysis procedure.

縦横線抽出方法としては、黒画素を水平及び垂直にたど
り、所定の長さ以上の物だけを残すようにする(ステッ
プ301.302)  。この後、得られた縦横線を始
点終点情報と太さ等で示されるベクトル情報に変換する
(ステップ303)。このベクトル化された線の内、−
本の線分のみが単独に存在するものは、罫線や段組みの
仕切り線と見做す(ステップ304)。また、複数の水
平垂直線が組合わさって構成される部分は表の部分と見
做しくステップ305)、水平・垂直線で一つの矩形を
構成する場合は図形の枠と見做す(ステップ306)。
The method for extracting vertical and horizontal lines is to trace black pixels horizontally and vertically, leaving only those with a predetermined length or more (steps 301 and 302). Thereafter, the obtained vertical and horizontal lines are converted into vector information indicated by starting point and ending point information, thickness, etc. (step 303). Of this vectorized line, −
A line segment of a book that exists alone is regarded as a ruled line or a column partition line (step 304). Furthermore, a part made up of a combination of horizontal and vertical lines is regarded as a table part (step 305), and a part made up of horizontal and vertical lines is regarded as a frame of a figure (step 306). ).

なお、これ以外のものは、−膜面形と見做す。In addition, anything other than this is considered to be a -film surface type.

以上によって、レイアウト解析が終了し、画像入力部2
で読み込まされた原稿の画像が、それぞれ文字領域、画
像領域、図形領域の各領域に分離される。なお、図形領
域には表及び線も含まれている。また、文字の領域では
内部の文字サイズ、文字列間隔、文字列方向等の属性も
付加される。
With the above steps, the layout analysis is completed and the image input section 2
The image of the document read in is separated into character areas, image areas, and graphic areas. Note that the graphic area also includes tables and lines. Further, in the character area, attributes such as internal character size, character string spacing, and character string direction are also added.

これらの情報をもとに、第1図に示すレイアウト生成指
示部4は、レイアウトをレイアウト割り付は部5に対し
て指示し、各領域の割り付けを行う。
Based on this information, the layout generation instruction section 4 shown in FIG. 1 instructs the layout allocation section 5 to perform layout and allocation of each area.

たとえば、第6図(a)に示すような文字部a、ビット
マツプ画像部す1図形部C9仕切り線d1表e等を含ん
だ雛形となる文書を、画像入力部2て読み込んだ場合、
この画像に対してレイアウト解析を行うと模式的に同図
ら)に示すような結果が得られる。同図(b)において
、Aは文字領域、Bは画像領域、Cは図形領域、Dは仕
切り線、Eは裏構造を示す。文書が表示される表示部9
の画面上には、レイアウト解析に基づいた各領域が表示
されるので、文書作成者は、キーボード/マウス6によ
り文字或いは図形を入力すべき領域を指定し、キーボー
ド/マウス6を使用して各領域に所望の内容を入力する
のみで、所望のレイアウトをもった文書を生成できる。
For example, when a document serving as a template containing a character part a, a bitmap image part, a graphic part C9, a partition line d1, a table e, etc. as shown in FIG. 6(a) is read by the image input part 2,
When layout analysis is performed on this image, results as schematically shown in the same figure are obtained. In the same figure (b), A is a character area, B is an image area, C is a graphic area, D is a partition line, and E is a back structure. Display section 9 where documents are displayed
Each area is displayed on the screen based on the layout analysis, so the document creator uses the keyboard/mouse 6 to specify the area in which characters or figures are to be input, and uses the keyboard/mouse 6 to enter each area. A document with the desired layout can be generated simply by inputting the desired content into the area.

なお、ビットマツプ画像を直接文書の中に埋めこむとき
は、画像入力部2から入力した画像データを内容割り付
は部6へ送り、合成すればよい。
Note that when a bitmap image is directly embedded in a document, the image data input from the image input section 2 may be sent to the content allocation section 6 and then synthesized.

また、レイアウト解析により生成された各領域に対して
、文書作成者が修正を加えて所望のレイアウトに編集し
たのち、内容を入力するようにしてもよい。
Alternatively, the document creator may edit each region generated by layout analysis to a desired layout, and then input the contents.

なお、上述の実施例においては、文書作成を例にとって
説明したが、文書のみ成らず、伝票等の予め決tられ様
式の作成等にも適用することができる。
In the above-described embodiments, document creation was explained as an example, but the present invention can be applied not only to document creation, but also to the creation of predetermined formats such as slips.

また、本実施例においては、表の部分は解析により得ら
れたベクトルデータに基づいて縦横線を再現するのみに
したが、文書作成装置側で、裏構造の発生、管理が可能
であれば、ベクトルデータを直接出力するのではなく、
何行、何列の表であると言う表の属性を示す情報として
出力することも可能である。
In addition, in this embodiment, only the vertical and horizontal lines are reproduced for the front part based on the vector data obtained by analysis, but if it is possible to generate and manage the back structure on the document creation device side, Rather than outputting vector data directly,
It is also possible to output information indicating attributes of the table, such as how many rows and columns the table has.

また、上述の実施例においては、文字部で抽出した情報
は、文字の大きさ9文字列間隔、縦書き横書きのみであ
ったが、書体の相違や、言語の相違たとえば日本語と英
語の相違を識別してこれらの属性を付加してもよい。
In addition, in the above example, the information extracted in the character part was only the character size, 9 character string spacing, vertical writing and horizontal writing, but there are also differences in fonts, language differences, for example, differences between Japanese and English. These attributes may be added by identifying the

更に、文字部においては文字認識を行い、また、図形部
においては図形認識を行うことによってレイアウト情報
だけでなく、内容そのものも再利用が可能となる。
Furthermore, by performing character recognition in the character portion and performing graphic recognition in the graphic portion, not only the layout information but also the content itself can be reused.

〔発明の効果〕 以上に述べたように、本発明においては、読み取った原
稿の画像に基づいて自動的にレイアウトを生成している
ので、類似のレイアウトの文書を作成する際に、文書作
成者が各領域の設定、修正等を行う作業が不要或いは簡
単になり、文書作成の効率が改善される。また、標準レ
イアウト文書を予め作成したり、登録しておく必要がな
いため、準備段階のだめの手順が不要となり、また、大
容量の記憶装置を必要としない。
[Effects of the Invention] As described above, in the present invention, the layout is automatically generated based on the image of the read document, so when creating a document with a similar layout, the document creator can The work of setting and modifying each area becomes unnecessary or easy, and the efficiency of document creation is improved. Further, since there is no need to create or register a standard layout document in advance, there is no need for any preliminary steps in the preparation stage, and there is no need for a large-capacity storage device.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の文書作成支援装置が適用された文書作
成装置の構成を示すブロック図、第2図はレイアウト解
析部の構成を示すブロック図、第3図は領域解析の手順
の例を示すフローチャート、第4図は文学部解析の手順
の例を示すフローチャート、第5図は図形部解析の手順
の例を示すフローチャート、第6図(a)、(b)は原
稿画像とレイアウト解析の結果例を模式的に示す説明図
である。 1 ; 3 : 4 : 5 : 6 ニ ア ; 9 : 10 : 11 ; 13 : 文書作成支援装置!  2:画像入力部レイアウト解析
部 レイアウト生成指示部 レイアウト割り付は部 キーボード/マウス 文字・図形入力部 8:内容割り付は部表示部 レイアウト座標・属性入力部 領域解析部    12:文字部解析部図形部解析部
FIG. 1 is a block diagram showing the configuration of a document creation device to which the document creation support device of the present invention is applied, FIG. 2 is a block diagram showing the configuration of a layout analysis section, and FIG. 3 is an example of the procedure for area analysis. Figure 4 is a flowchart showing an example of the procedure for analyzing the literature section, Figure 5 is a flowchart showing an example of the procedure for analyzing the graphic section, and Figures 6 (a) and (b) are the results of manuscript image and layout analysis. It is an explanatory view showing an example typically. 1; 3: 4: 5: 6 near; 9: 10: 11; 13: Document creation support device! 2: Image input section Layout analysis section Layout generation instruction section Layout allocation section Keyboard/Mouse Character/Graphic input section 8: Content allocation section Display section Layout coordinate/attribute input section Area analysis section 12: Character section Analysis section Graphics Department analysis department

Claims (1)

【特許請求の範囲】 1、文書を作成するに際し作成すべき文書に含まれる画
像の属性に応じてそれぞれ異なった領域を設定し各領域
に対してそれぞれ異なった処理を行う文書作成装置にお
いて使用される文書作成支援装置であって、雛形となる
文書を画像として入力する画像入力部と、入力された文
書の画像の属性を判別し、この属性の相違に基づいて前
記各領域の大きさ、位置及び属性を示すレイアウト情報
を抽出するレイアウト解析部と、得られたレイアウト情
報に基づいて作成すべき文書に前記雛形となる文書と同
様な領域の設定を指示するレイアウト生成指示部とを備
えていることを特徴とする文書作成支援装置。 2、前記レイアウト解析部は、文書の画像から文字領域
、図形領域及び画像領域を抽出する領域解析部と、前記
文字領域内の文字部の属性を解析する文字部解析部と、
前記図形領域内の図形部を解析して図形中の線成分を抽
出しベクトルデータとして出力する図形部解析部から構
成されることを特徴とする請求項1記載の文書作成支援
装置。
[Claims] 1. Used in a document creation device that sets different areas depending on the attributes of an image included in the document to be created and performs different processing on each area when creating a document. This document creation support device includes an image input unit that inputs a template document as an image, and determines the attributes of the image of the input document, and determines the size and position of each area based on the difference in attributes. and a layout analysis unit that extracts layout information indicating attributes, and a layout generation instruction unit that instructs setting of areas similar to the template document in a document to be created based on the obtained layout information. A document creation support device characterized by: 2. The layout analysis unit includes an area analysis unit that extracts a text area, a graphic area, and an image area from an image of a document, and a text part analysis unit that analyzes attributes of a text part in the text area.
2. The document creation support device according to claim 1, further comprising a graphic part analysis section that analyzes a graphic part in the graphic area, extracts line components in the graphic, and outputs the extracted line components as vector data.
JP2172326A 1990-06-28 1990-06-28 Document creation support device Expired - Fee Related JPH0612540B2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2172326A JPH0612540B2 (en) 1990-06-28 1990-06-28 Document creation support device
GB9113488A GB2247803B (en) 1990-06-28 1991-06-21 Document creation aid
DE4121564A DE4121564C2 (en) 1990-06-28 1991-06-28 Device for creating documents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2172326A JPH0612540B2 (en) 1990-06-28 1990-06-28 Document creation support device

Publications (2)

Publication Number Publication Date
JPH0460759A true JPH0460759A (en) 1992-02-26
JPH0612540B2 JPH0612540B2 (en) 1994-02-16

Family

ID=15939835

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2172326A Expired - Fee Related JPH0612540B2 (en) 1990-06-28 1990-06-28 Document creation support device

Country Status (3)

Country Link
JP (1) JPH0612540B2 (en)
DE (1) DE4121564C2 (en)
GB (1) GB2247803B (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006318142A (en) * 2005-05-11 2006-11-24 Fujitsu Ltd Page space layout method
JP2008080621A (en) * 2006-09-27 2008-04-10 Oki Data Corp Printing system and composite terminal device

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4330242A1 (en) * 1993-09-07 1995-03-09 Hell Ag Linotype Method and device for the electronic assembly of printed sheets
US5808747A (en) * 1996-05-30 1998-09-15 Eastman Kodak Company Apparatus and method for production of signatures
WO2001055869A1 (en) 2000-01-25 2001-08-02 Vistaprint Usa, Inc. Managing print jobs
FR2804231B1 (en) 2000-01-25 2002-11-08 Vistaprint Usa Inc CENTRALIZED PRINTING OF LOW-VOLUME COMMERCIAL DOCUMENTS ON MACHINES PREVIOUSLY LIMITED TO VERY LARGE PRINTS
US6728946B1 (en) 2000-10-31 2004-04-27 Franklin M. Schellenberg Method and apparatus for creating photolithographic masks
US7493292B2 (en) * 2001-02-15 2009-02-17 Glenn Petkovsek System and a method for automating delivery of communication by a special service
US7542155B2 (en) 2006-09-25 2009-06-02 Vistaprint Technologies Limited Preparation of aggregate jobs for production

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6159568A (en) * 1984-08-31 1986-03-27 Hitachi Ltd Document understanding system
JPH0214392A (en) * 1988-07-01 1990-01-18 Fuji Electric Co Ltd Document area analyzing device

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01185762A (en) * 1988-01-21 1989-07-25 Toshiba Corp Document shaping device
JPH03290774A (en) * 1990-04-06 1991-12-20 Fuji Facom Corp Sentence area extracting device for document picture

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6159568A (en) * 1984-08-31 1986-03-27 Hitachi Ltd Document understanding system
JPH0214392A (en) * 1988-07-01 1990-01-18 Fuji Electric Co Ltd Document area analyzing device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006318142A (en) * 2005-05-11 2006-11-24 Fujitsu Ltd Page space layout method
JP2008080621A (en) * 2006-09-27 2008-04-10 Oki Data Corp Printing system and composite terminal device

Also Published As

Publication number Publication date
GB2247803B (en) 1995-01-18
DE4121564C2 (en) 1995-02-16
GB2247803A (en) 1992-03-11
JPH0612540B2 (en) 1994-02-16
GB9113488D0 (en) 1991-08-07
DE4121564A1 (en) 1992-01-09

Similar Documents

Publication Publication Date Title
KR101334483B1 (en) Apparatus and method for digitizing a document, and computer-readable recording medium
US8539342B1 (en) Read-order inference via content sorting
US7788579B2 (en) Automated document layout design
US7705848B2 (en) Method of identifying semantic units in an electronic document
US6952803B1 (en) Method and system for transcribing and editing using a structured freeform editor
JP4165042B2 (en) Image layout evaluation method, image layout evaluation system, and image layout evaluation processing program
US8819545B2 (en) Digital comic editor, method and non-transitory computer-readable medium
US8952985B2 (en) Digital comic editor, method and non-transitory computer-readable medium
JPH06236367A (en) Control method for word processor
JPH0460759A (en) Document preparation support device
JP5950700B2 (en) Image processing apparatus, image processing method, and program
JPH04148475A (en) Document processor
JP2008108114A (en) Document processor and document processing method
JPS58208865A (en) Document producing device
JP2005267463A (en) Edit device, edit method, program and recording medium
CN112416340A (en) Webpage generation method and system based on sketch
JP2011186835A (en) Image processing apparatus and image processing program
JPS61107467A (en) Specification method of framing for character-graphics editing device
JP4574347B2 (en) Image processing apparatus, method, and program
JPH1069480A (en) Method and processor for document processing, and storage medium
JPH07107711B2 (en) Document image processing device
JPH05342325A (en) Document processor and form register device therefor
JPH1185906A (en) Device and method for understanding document and recording medium
JPS63108456A (en) Formula input system
JPH0793329A (en) Document processor and allocating method for document

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080216

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090216

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100216

Year of fee payment: 16

LAPS Cancellation because of no payment of annual fees