JP2010009146A - Document processing method and document processor - Google Patents
Document processing method and document processor Download PDFInfo
- Publication number
- JP2010009146A JP2010009146A JP2008165069A JP2008165069A JP2010009146A JP 2010009146 A JP2010009146 A JP 2010009146A JP 2008165069 A JP2008165069 A JP 2008165069A JP 2008165069 A JP2008165069 A JP 2008165069A JP 2010009146 A JP2010009146 A JP 2010009146A
- Authority
- JP
- Japan
- Prior art keywords
- document
- layout
- configuration data
- information
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
Description
本発明はコンテンツのレイアウトを決定するためのレイアウト技術に関する。 The present invention relates to a layout technique for determining a layout of content.
スキャンした文書から画像や文字列などの領域(以下、文書構成データ)を抽出する技術が知られている。抽出された文書構成データは、文書のレイアウト変更などに応用されている(例えば、特許文献1)。
しかしながら、レイアウト変更を行うとレイアウト変更前の情報は破棄されてしまう。したがって、レイアウト変更後の文書からレイアウト変更前の状態を復元することが困難であるという問題があった。 However, if the layout is changed, the information before the layout change is discarded. Therefore, there is a problem that it is difficult to restore the state before the layout change from the document after the layout change.
そこで、レイアウト変更後の文書から変更前の状態を復元可能とすることを目的とする。 Therefore, it is an object to make it possible to restore the state before the change from the document after the layout change.
上記の課題を解決するために、本発明に係る文書処理方法は、文書を入力する文書入力工程と、前記文書入力工程により入力された文書を解析して、文書を構成する文書構成ブロックと前記文書構成ブロックのレイアウト情報とを取得する文書解析工程と、前記文書解析工程により取得された文書構成ブロックのレイアウトを変更するレイアウト変更工程と、前記レイアウト変更された文書構成ブロックに対して、前記文書解析工程で取得したレイアウト情報を埋め込む埋め込み工程とを備える。 In order to solve the above problems, a document processing method according to the present invention includes a document input step for inputting a document, a document composition block for analyzing the document input by the document input step, A document analysis step for acquiring document configuration block layout information; a layout change step for changing the layout of the document configuration block acquired by the document analysis step; and the document for the layout-changed document configuration block And an embedding process for embedding the layout information acquired in the analysis process.
本発明によれば、レイアウトを変更した後の文書から変更前の状態を復元することができる。 According to the present invention, the state before the change can be restored from the document after the layout is changed.
<実施形態1>
以下、図面を参照して本発明の好適な実施形態を詳細に説明する。
<
Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the drawings.
図1は、本発明に係る情報処理装置より構成されるネットワークシステムを示す図である。ネットワークシステムは各種データの伝送媒体となるネットワーク102上に複数の情報処理装置が接続されている。ネットワーク102は例えばEthernet(登録商標)のようなLAN(Local Area Network)あるいはインターネットのような広域情報通信網であってもよい。各情報処理装置1乃至情報処理装置5は図2において後述する通信部208を介して接続されている。
FIG. 1 is a diagram showing a network system including information processing apparatuses according to the present invention. In the network system, a plurality of information processing apparatuses are connected to a
図2は、本発明に係る情報処理装置(文書処理装置)のハードウェア構成を示す図である。図2において201は、マイクロプロセッサCPU(Central Processing Unit)であり、各処理のための演算、論理判断等を行い、バス209を介してそれらのバスに接続された各構成要素を制御する。
FIG. 2 is a diagram showing a hardware configuration of the information processing apparatus (document processing apparatus) according to the present invention. In FIG. 2,
202は読み出し専用の固定メモリROM(Read Only Memory)であり、実行される処理プログラム等の制御プログラムコードを記憶する。 Reference numeral 202 denotes a read-only fixed memory ROM (Read Only Memory), which stores control program codes such as processing programs to be executed.
203は書き込み可能なRAM(Random Access Memory)であり、各構成要素からの各種データの一時記憶に用いられる。
204は入力部であり、情報(データ)の入力に用いられる。
An
205は陰極線管CRT(Cathod−Ray Tube)や液晶パネル等の表示部であり、その表示部におけるドット構成の表示パターンおよびカーソルの表示を表示コントローラ206で制御する。
207は記憶部であり、種々の情報が格納される。また、これらのデータおよびプログラムを格納する記憶媒体としては、ROM、フロッピー(登録商標)ディスク、CD−ROM、DVD−ROM、メモリカード、光磁気ディスクなどを用いることができる。
A
208は通信部であり、Ethernet(登録商標)などのネットワークに接続し、ネットワークシステムにおいて複数の情報処理装置同士を接続する役割を担う。
A
210はスキャナなどの画像読取部であり、原稿やフィルムなどを読み取って、画像信号を取得する。
An
係る各構成要素からなる情報処理装置においては、入力部204からの各種の入力および通信部208から提供されるネットワーク経由の各種入力に応じて作動するものである。入力部204からの入力および通信部208からの入力が供給されると、まず、インタラプト信号がCPU201に送られる。そして、そのCPU201が記憶部207内に記憶してある各種の制御信号を読み出し、それらの制御信号に従って、各種の制御が行われる。
The information processing apparatus including such constituent elements operates in response to various inputs from the
次に、本実施形態における処理全体の概要を図3により説明する。 Next, the outline of the entire processing in this embodiment will be described with reference to FIG.
図3は本発明の実施形態における処理全体の概要を示すフローチャートである。 FIG. 3 is a flowchart showing an outline of the entire processing according to the embodiment of the present invention.
ステップS300では、文書入力工程であり、入力部204により紙原稿をラスタ状に走査して読み取り、画像信号を得る。たとえば、スキャナなどの画像読取部210で原稿を読み取り、600DPI−8ビットの画像信号を得る。この画像信号は、RAM203もしくは記憶部207に画像データとして記憶される。
In step S300, a document input process is performed. The
ステップS301では、入力原稿に対するコピー処理を行うか判定を行う。コピー処理の指示は、ポインティングデバイスなどの入力部204を用いてユーザにより明示的に行われる。ユーザによる指示がコピーである場合、ステップS311へ移行する。ユーザによりコピーを行わないと指示があった場合は、ステップS303へ移行する。
In step S301, it is determined whether or not to perform copy processing on the input document. The copy processing instruction is explicitly given by the user using the
ステップS302では、ステップS300で取得した画像データを解析し、文書を構成するデータとレイアウト情報を取得する。具体的には、文字/線画部分とハーフトーン画像部分に領域分割する。文字/線画部分は段落でまとまっているブロック、あるいは線で構成された表、図表に分割処理を行う。一方、ハーフトーン画像部分は、矩形に分離されたブロックの画像部分、背景部分等、ブロック毎に独立したオブジェクトに分割する。 In step S302, the image data acquired in step S300 is analyzed, and data constituting the document and layout information are acquired. Specifically, the area is divided into a character / line drawing part and a halftone image part. The character / line drawing part is divided into blocks organized in paragraphs, or tables and charts composed of lines. On the other hand, the halftone image portion is divided into independent objects for each block, such as an image portion of a block separated into a rectangle and a background portion.
ステップS303では、入力原稿のレイアウトを変更するか判定する。レイアウト変更処理の指示は、ステップS301のコピー処理と同様にポインティングデバイスなどの入力部204を用いてユーザにより明示的に行われる。ユーザによる指示がレイアウト変更実施である場合には、ステップS304へ移行する。レイアウト変更を実行しないと指示があった場合は、ステップS307へ移行する。
In step S303, it is determined whether to change the layout of the input document. The layout change processing instruction is explicitly given by the user using the
ステップS304では、ステップS302において抽出した構成データをもとに、どのようなレイアウト変更が可能かユーザに提示し、ユーザに選択させる。具体的には、構成データの種別(文字(列)、画像)とその個数から、当てはめることができるテンプレートを判断し、検索結果のテンプレートをユーザに提示する。ユーザは、提示されたテンプレートから希望するテンプレートを選択する。テンプレートはRAM203もしくは記憶部207に記憶されている。
In step S304, based on the configuration data extracted in step S302, the user is presented with what layout changes are possible, and the user is allowed to select. Specifically, a template that can be applied is determined from the type (character (string), image) of the configuration data and the number thereof, and the search result template is presented to the user. The user selects a desired template from the presented templates. The template is stored in the
ステップS305では、ステップS304でユーザにより指示されたテンプレートにしたがって、ステップS302において取得した文書構成データのレイアウトを変更する。 In step S305, the layout of the document configuration data acquired in step S302 is changed according to the template instructed by the user in step S304.
ステップS306では、各文書構成データに対してステップS305によりレイアウトが変更される前のレイアウト情報を埋め込む。言い換えると、ステップS302において取得し、記憶したレイアウト情報を各文書構成データに埋め込む。 In step S306, the layout information before the layout is changed in step S305 is embedded in each document configuration data. In other words, the layout information acquired and stored in step S302 is embedded in each document configuration data.
ステップS304からステップS306までのレイアウト変更処理に関する詳細は後述する。 Details regarding the layout change processing from step S304 to step S306 will be described later.
ステップS307では、入力原稿のレイアウトを復元するか判定する。レイアウト復元処理の指示は、ステップS301、ステップS303と同様にポインティングデバイスなどの入力部204を用いてユーザにより明示的に行われる。ユーザによる指示がレイアウト復元である場合、ステップS308へ移行する。レイアウト復元を実行しないと指示があった場合、処理を終了する。
In step S307, it is determined whether to restore the layout of the input document. The layout restoration processing instruction is explicitly given by the user using the
ステップS308では、ステップS302において取得した各文書構成データからレイアウト変更前のレイアウト情報を抽出する。 In step S308, layout information before the layout change is extracted from each document configuration data acquired in step S302.
ステップS309では、ステップS308においてレイアウト情報が抽出されたかを判定する。レイアウト情報が抽出できてたと判定された場合、ステップS310へ移行する。レイアウト情報が抽出されなかった場合は、処理を終了する。 In step S309, it is determined whether layout information has been extracted in step S308. If it is determined that the layout information has been extracted, the process proceeds to step S310. If layout information has not been extracted, the process ends.
ステップS310では、ステップS308において抽出したレイアウト情報に基づき各文書構成データの配置を決定し、復元する。 In step S310, the arrangement of each document configuration data is determined based on the layout information extracted in step S308, and is restored.
ステップS308からステップS310までのレイアウト復元処理に関する詳細は、後述する。 Details regarding the layout restoration processing from step S308 to step S310 will be described later.
ステップS311では、各文書構成データの位置情報に基づき印刷処理を行う。単純なコピー処理の場合は、ステップS300において取得した画像データをそのまま印刷する。レイアウト変更、復元処理が行われていた場合は、各構成文書データの位置情報から文書内の配置位置を決定し、当該配置位置に基づき文書画像を生成し、印刷処理を行う。 In step S311, print processing is performed based on the position information of each document configuration data. In the case of simple copy processing, the image data acquired in step S300 is printed as it is. If layout change or restoration processing has been performed, an arrangement position in the document is determined from position information of each component document data, a document image is generated based on the arrangement position, and printing processing is performed.
このように、本システムでは入力原稿を解析し、各文書構成データに対して、オリジナルのレイアウト情報を埋め込み印刷する。したがって、印刷物から得られる情報のみで元の状態へ復元することができる。このため、ネットワーク障害などデータへアクセスできない場合も処理への影響がなくなるという効果がある。 In this way, the system analyzes the input document and embeds and prints the original layout information in each document configuration data. Therefore, it is possible to restore the original state only with information obtained from the printed matter. For this reason, there is an effect that there is no influence on processing even when data cannot be accessed such as a network failure.
以下、各処理の詳細について説明する。 Details of each process will be described below.
まず、図3のステップS302の文書画像解析処理について説明する。文書画像解析処理とは、画像から意味のあるブロックをかたまりとして認識して、該ブロック各々の属性を判定し、異なる属性を持つブロックに分割する処理である。たとえば、図4(a)のラスタ画像に対して文書画像解析処理を行うと、図4(b)のように文字、画像などのブロックとして分割される。 First, the document image analysis process in step S302 of FIG. 3 will be described. The document image analysis process is a process of recognizing a meaningful block from an image as a block, determining the attribute of each block, and dividing the block into blocks having different attributes. For example, when the document image analysis process is performed on the raster image of FIG. 4A, it is divided into blocks such as characters and images as shown in FIG. 4B.
文書画像解析処理は、既存の文書画像解析処理技術を用いて行う。以下、簡単に文書画像解析技術の一例を示す。 The document image analysis processing is performed using an existing document image analysis processing technique. An example of a document image analysis technique will be briefly described below.
入力画像を受け取ると、白黒画像に二値化する。そして、輪郭線追跡を行い黒画素輪郭で囲まれる画素のかたまりを抽出する。一定面積以上の黒画素の場合は、内部にある白画素に対しても輪郭線追跡を行い白画素のかたまりを抽出する。抽出した白画素のかたまりが一定面積以上であれば、さらに黒画素のかたまりを抽出する。当該抽出処理は、抽出されたかたまりが一定面積以上であれば、再帰的に実行する。 When an input image is received, it is binarized into a black and white image. Then, outline tracing is performed to extract a block of pixels surrounded by a black pixel outline. In the case of a black pixel having a certain area or more, contour tracing is performed for white pixels inside to extract a block of white pixels. If the extracted white pixel block is larger than a certain area, a black pixel block is further extracted. The extraction process is recursively executed if the extracted cluster is larger than a certain area.
上記の処理で得られた黒画素のかたまりを大きさおよび形状により様々な属性を持つブロックとして分類する。たとえば、縦横比が1に近いブロックは文字相当の画素のかたまりとし、隣接する文字相当の画素のかたまりが整列されていてグループ化可能な場合は文字列ブロックとする。また、不定形の画素のかたまりが散在する場合は、写真ブロック、それ以外は図面ブロックなどに分類する。 The block of black pixels obtained by the above processing is classified as a block having various attributes according to size and shape. For example, a block whose aspect ratio is close to 1 is a block of pixels corresponding to a character, and a block of pixels corresponding to a character is aligned and can be grouped to be a character string block. In addition, when a block of irregular pixels is scattered, the block is classified into a photograph block, and the others are classified into drawing blocks.
文書画像解析処理では、分類したブロックの位置情報や属性などを文書構成データ情報(レイアウト情報)としてRAM203もしくは記憶部207に記憶する。
In the document image analysis process, the position information and attributes of the classified blocks are stored in the
図5を用いて、文書構成データ情報の一例を示す。 An example of document configuration data information is shown using FIG.
図5に示すように、文書構成データ情報は、各構成データを一意に決定するためのID、構成データの属性を示すデータ属性(1:文字列、2:図画、3:写真)、構成データの位置座標(X,Y)、構成データの外接矩形の幅Wおよび高さHで構成される。 As shown in FIG. 5, the document configuration data information includes an ID for uniquely determining each configuration data, a data attribute indicating an attribute of the configuration data (1: character string, 2: drawing, 3: photograph), and configuration data. Position coordinates (X, Y), the width W and the height H of the circumscribed rectangle of the configuration data.
構成データの位置座標は、原稿画像の左上を原点(0,0)とした場合の位置座標である。構成データの幅Wおよび高さHは画素数で表現される。 The position coordinates of the configuration data are the position coordinates when the upper left corner of the document image is the origin (0, 0). The width W and the height H of the configuration data are expressed by the number of pixels.
次に、本実施形態の情報処理装置の機能ブロック図を図6に示す。 Next, a functional block diagram of the information processing apparatus of this embodiment is shown in FIG.
図6に示すように、本実施形態の情報処理装置は、入力部601、文書解析部602、レイアウト変更部603、埋め込み情報処理部604、出力部605から構成される。
As illustrated in FIG. 6, the information processing apparatus according to the present exemplary embodiment includes an input unit 601, a
入力部601は、原稿の入力を受け付けるスキャナやユーザの指示を受け付けるキーボード、ポインティングデバイスなどである。 The input unit 601 is a scanner that accepts input of a document, a keyboard that accepts user instructions, a pointing device, or the like.
文書解析部602は、入力部601に入力された入力原稿画像を解析し、文書構成データを抽出する。
The
レイアウト変更部603は、文書解析部602により抽出された文書構成データを任意のレイアウトへ変更する。
The
埋め込み情報処理部604は、文書解析部602により抽出された文書構成データに対して、情報の埋め込み、抽出処理を行う。
The embedded
出力部605は、レイアウト変更部603によりレイアウト変更された文書の出力やユーザインタフェースを表示するプリンタやディスプレイである。
An output unit 605 is a printer or a display that displays an output of a document whose layout has been changed by the
次に、図3のステップS304からステップS306までのレイアウト変更処理の詳細について、図8を用いて説明する。 Next, details of the layout change processing from step S304 to step S306 in FIG. 3 will be described with reference to FIG.
図8はレイアウト変更処理の詳細を示すフローチャートである。 FIG. 8 is a flowchart showing details of the layout change process.
ステップS800では、テンプレート表示処理を行う。テンプレート表示処理では、文書画像解析処理で取得された構成データ数に基づきレイアウト変更可能なテンプレートを表示部205に表示する。テンプレートは、記憶部207に格納されており、各テンプレートには対応可能なデータ数が関連付けられている。
In step S800, template display processing is performed. In the template display process, a template whose layout can be changed based on the number of configuration data acquired in the document image analysis process is displayed on the
ここで、入力原稿が、図7(a)に示した文書であった場合を説明する。図7(b)は、入力原稿から抽出された文書構成データ(文書構成ブロック)のイメージ図である。矩形で囲まれた部分が文書画像解析処理により抽出された各文書構成データであり、入力原稿は、4つの構成データから構成されている。したがって、4つの構成データに対応するテンプレートが表示部205に表示されることとなる(図7(c))。 Here, a case where the input document is the document shown in FIG. 7A will be described. FIG. 7B is an image diagram of the document configuration data (document configuration block) extracted from the input document. A portion surrounded by a rectangle is each piece of document configuration data extracted by the document image analysis process, and the input original is composed of four pieces of configuration data. Therefore, templates corresponding to the four pieces of configuration data are displayed on the display unit 205 (FIG. 7C).
ステップS801では、テンプレートを選択する。テンプレート選択処理では、ステップS800において提示されたテンプレートをユーザにより選択させる。ユーザによる選択時には、キーボードやポインティングデバイスなど入力部204を用いて行う。
In step S801, a template is selected. In the template selection process, the template presented in step S800 is selected by the user. The selection by the user is performed using the
ステップS802では、レイアウト変更処理を行う。レイアウト変更処理では、ステップS801で選択されたテンプレートに対して、どのように文書構成データを配置するか決定する。ステップS801で、図7(c)のテンプレート3が選択された場合は、ステップS802で、選択されたテンプレート3にあわせて文書構成データを配置される(図7(d))。
In step S802, layout change processing is performed. In the layout change process, it is determined how to arrange the document configuration data for the template selected in step S801. If the
具体的には、入力原稿から抽出した文書構成データとステップS801において決定したテンプレートをユーザに提示する。そして、マウスによるドラッグ&ドロップなどの操作により各文書構成データと当該データを配置したいテンプレート中のブロックを関連付けることで配置を決定する。 Specifically, the document configuration data extracted from the input document and the template determined in step S801 are presented to the user. Then, the arrangement is determined by associating each document configuration data with a block in the template where the data is to be arranged by an operation such as drag and drop with the mouse.
テンプレートに定義される領域が文書構成データを配置するのに不十分な場合、文書構成データの拡大・縮小などの形状変更を行うことでテンプレート中の領域内に文書構成データを配置する。すなわち、文書構成データは、テンプレートに定義される領域に収まるように形状が変更される。 When the area defined in the template is insufficient for arranging the document configuration data, the document configuration data is arranged in the area in the template by changing the shape such as enlargement / reduction of the document configuration data. That is, the shape of the document configuration data is changed so as to fit in the area defined in the template.
ステップS803では、変更内容判定処理を行う。変更内容判定処理では、ステップS802におけるレイアウト変更処理の結果、各文書構成データにどのような変更が加えられたのか判定する。 In step S803, a change content determination process is performed. In the change content determination process, it is determined what change has been made to each document configuration data as a result of the layout change process in step S802.
具体的には、文書構成データ毎に、レイアウト前の文書構成データと、レイアウト変更後の文書構成データとを比較する。そして、文書構成データ毎に何も変化がないのか、位置のみに変更があったのか、位置および形状に変更があったのかという3タイプに分類する。分類結果は、RAM203に一時的に記憶する。記憶した分類結果は、後述するステップS8040の埋め込み情報生成処理により用いられる。
Specifically, the document configuration data before layout is compared with the document configuration data after layout change for each document configuration data. Then, it is classified into three types: whether there is no change for each document configuration data, whether only the position has changed, or whether the position and shape have changed. The classification result is temporarily stored in the
図9を用いて、変更内容種別の一例を説明する。 An example of the change content type will be described with reference to FIG.
図9(a)は、レイアウト変更前の状態、すなわち入力原稿の画像を示す。矩形で囲まれた部分が文書画像解析処理により抽出された各文書構成データである。4つの文書構成データ(901A、901B、901C、901D)から構成されることがわかる。 FIG. 9A shows the state before the layout change, that is, the image of the input document. A portion surrounded by a rectangle is each piece of document configuration data extracted by the document image analysis process. It can be seen that it is composed of four pieces of document configuration data (901A, 901B, 901C, 901D).
図9(b)は、レイアウト変更内容を示すテンプレートである。テンプレートには、文書構成データを関連付ける矩形領域902〜905が4つ定義されている。
FIG. 9B is a template showing layout change contents. The template defines four
図9(c)は、図9(a)の入力原稿を図9(b)のテンプレートに基づきレイアウト変更を行った例である。文書構成データAに注目すると、図9(a)の901Aと図9(c)の906Aとでは、位置および形状に変化がないので、何も変更が加えられていないと判定される。次に、文書構成データBに注目すると、形状に変化はないが、位置が変わっているので、位置のみに変更があったと判定される。文書構成データC、Dは、位置および形状に変更が加えられているので、位置および形状に変更があったと判定される。 FIG. 9C shows an example in which the layout of the input document in FIG. 9A is changed based on the template in FIG. 9B. Focusing on the document configuration data A, since there is no change in position and shape between 901A in FIG. 9A and 906A in FIG. 9C, it is determined that no change has been made. Next, paying attention to the document configuration data B, the shape is not changed, but the position is changed, so that it is determined that only the position is changed. Since the document configuration data C and D have been changed in position and shape, it is determined that the position and shape have been changed.
ステップS804では、各文書構成データに埋め込む情報を生成する。埋め込み情報生成処理では、ステップS803において判定された分類結果に応じて生成する情報を変更する。具体的には、位置および形状に変化がない、すなわち何も変更されてない場合、埋め込み情報を生成しない。位置のみに変更がある場合は、変更前の位置情報のみを埋め込み情報として生成する。位置情報は、文書構成データの外接矩形の左上の座標とする。位置および形状に変更がある場合は、変更前の位置情報と、形状の変更割合を埋め込み情報として生成する。位置情報は、文書構成データの外接矩形の左上の座標であり、変更割合は、変更前の矩形から幅および高さが変更した割合(%)とする。 In step S804, information to be embedded in each document configuration data is generated. In the embedded information generation process, information to be generated is changed according to the classification result determined in step S803. Specifically, when there is no change in position and shape, that is, when nothing has been changed, no embedding information is generated. When only the position is changed, only the position information before the change is generated as the embedded information. The position information is the upper left coordinates of the circumscribed rectangle of the document configuration data. When there is a change in the position and shape, the position information before the change and the change rate of the shape are generated as embedded information. The position information is the upper left coordinates of the circumscribed rectangle of the document configuration data, and the change ratio is a ratio (%) in which the width and height are changed from the rectangle before the change.
このように、レイアウト変更処理による文書構成データの変更種別に応じて生成する埋め込み情報を変えることで、埋め込み情報量を削減できる。 As described above, the amount of embedded information can be reduced by changing the embedded information to be generated according to the change type of the document configuration data by the layout change processing.
生成した埋め込み情報が文書構成データに埋め込むことができないと判断した場合、文書構成データを任意の記憶装置に格納しておき、当該格納場所を埋め込み情報として生成しても良い。文書構成データに十分なデータ量を埋め込めない場合に有効である。 When it is determined that the generated embedded information cannot be embedded in the document configuration data, the document configuration data may be stored in an arbitrary storage device, and the storage location may be generated as embedded information. This is effective when a sufficient amount of data cannot be embedded in the document configuration data.
文書構成データを任意の記憶装置に格納しておくと同時に、文書構成データの格納場所を管理する管理テーブルを別途作成しておき、当該テーブル上を一意に決定可能な情報のみを埋め込み情報としても良い。この場合も、文書構成データに十分なデータ量を埋め込めない場合に有効である。 The document configuration data is stored in an arbitrary storage device, and at the same time, a management table for managing the storage location of the document configuration data is separately created, and only information that can be uniquely determined on the table may be used as embedded information. good. This case is also effective when a sufficient amount of data cannot be embedded in the document configuration data.
文書構成データを任意の記憶装置に格納し、アクセスする手段を埋め込む手法は、文書構成データの形状が変更された場合にも応用できる。具体的には、変更割合に許容範囲を定めておき、許容範囲外の場合は文書構成データを任意の記憶装置に格納する。こうすることで、写真など拡大・縮小により大きく画質が変更され、元の状態に戻すことが難しい場合にも対応することができる。 The technique of storing the document configuration data in an arbitrary storage device and embedding the means for accessing can be applied even when the shape of the document configuration data is changed. Specifically, an allowable range is set for the change ratio, and if it is out of the allowable range, the document configuration data is stored in an arbitrary storage device. In this way, it is possible to cope with a case where the image quality is greatly changed due to enlargement / reduction, such as a photograph, and it is difficult to return to the original state.
ステップS805では、各文書構成データにステップS804で生成した情報を埋め込む。情報埋め込み処理では、各文書構成データの種別に応じて電子透かし埋め込み手法を変更することが望ましい。文書構成データの種別と埋め込み手法との対応は、別途埋め込み技術対応テーブルに定めておく(不図示)。たとえば、文書構成データが文字列の場合、文字列に対する埋め込み技術を使用し、図画・写真であれば、図画・写真に対する埋め込み技術を使用するという対応付けを行っておく。 In step S805, the information generated in step S804 is embedded in each document configuration data. In the information embedding process, it is desirable to change the digital watermark embedding method according to the type of each document configuration data. The correspondence between the type of document configuration data and the embedding method is determined separately in an embedding technology correspondence table (not shown). For example, when the document configuration data is a character string, an embedding technique for the character string is used, and for a drawing / photo, the embedding technique for the drawing / photo is used.
以上、説明したように本実施形態によるレイアウト変更処理では、文書構成データの変更内容種別に応じて、埋め込む情報を変更することで、埋め込み情報量を削減できる。 As described above, in the layout change process according to the present embodiment, the amount of embedded information can be reduced by changing the embedded information in accordance with the change content type of the document configuration data.
続いて、図3のステップS308からステップS310までのレイアウト復元処理の詳細について、図10を用いて説明する。 Next, details of the layout restoration processing from step S308 to step S310 in FIG. 3 will be described with reference to FIG.
レイアウト復元処理は、レイアウト変更処理により変更された文書から変更前の文書を生成する処理である。 The layout restoration process is a process for generating a document before change from a document changed by the layout change process.
図10はレイアウト復元処理の詳細を示すフローチャートである。 FIG. 10 is a flowchart showing details of the layout restoration process.
ステップS1000では、各文書構成データから埋め込まれているレイアウト情報を抽出する。埋め込み情報抽出処理では、文書構成データの種別に応じて抽出手法を変更する。文書構成データの種別と埋め込み情報抽出手法との対応は、別途埋め込み情報抽出技術対応テーブルに定めておく(不図示)。たとえば、文書構成データが文字列の場合、文字列に対する抽出技術を使用し、図画・写真であれば、図画・写真に対する抽出技術を使用するという対応付けを行っておく。 In step S1000, the embedded layout information is extracted from each document configuration data. In the embedded information extraction process, the extraction method is changed according to the type of document configuration data. The correspondence between the type of document configuration data and the embedded information extraction method is determined separately in an embedded information extraction technology correspondence table (not shown). For example, when the document configuration data is a character string, an extraction technique for the character string is used, and when the document structure data is a drawing / photo, the extraction technique for the drawing / photo is used.
ステップS1001では、ステップS1000においてレイアウト情報が抽出されたかを判定する。レイアウト情報が抽出できたと判定された場合、ステップS310へ移行する。レイアウト情報が抽出されなかった場合は、処理を終了する。 In step S1001, it is determined whether layout information has been extracted in step S1000. If it is determined that the layout information has been extracted, the process proceeds to step S310. If layout information has not been extracted, the process ends.
ステップS1002では、ステップS1000で抽出したレイアウト情報に基づきレイアウト変更前の各文書構成データを生成する。抽出したレイアウト情報が、位置情報のみの場合は、文書構成データ生成処理は行わない。この場合の文書構成データは、レイアウト復元時に文書画像解析処理により抽出されたものと同じである。ステップS1000にて抽出されたレイアウト情報が、変更割合もしくは文書構成データへの参照情報を含む場合、当該埋め込み情報に基づき文書構成データを生成する。たとえば、変更割合が幅90%、高さ100%という情報が埋め込まれていた場合、レイアウト復元時に文書画像解析処理により抽出された文書構成データの幅×0.9の幅を持つ文書構成データを生成する。また、抽出した情報がURLである場合は、当該URLに示される場所に格納されるデータを取得し、レイアウト復元用の文書構成データとする。 In step S1002, each document configuration data before the layout change is generated based on the layout information extracted in step S1000. When the extracted layout information is only the position information, the document configuration data generation process is not performed. The document configuration data in this case is the same as that extracted by the document image analysis process at the time of layout restoration. When the layout information extracted in step S1000 includes change ratio or reference information to the document configuration data, the document configuration data is generated based on the embedded information. For example, when the information that the change ratio is 90% width and 100% height is embedded, the document structure data having a width of 0.9 times the width of the document structure data extracted by the document image analysis process at the time of layout restoration is obtained. Generate. If the extracted information is a URL, the data stored at the location indicated by the URL is acquired and used as document configuration data for layout restoration.
ステップS1003では、レイアウト処理を行う。レイアウト処理では、ステップS1000にて抽出された位置情報をもとにステップS1002で生成された文書構成データを配置する。配置結果が、レイアウト変更前の文書となる。 In step S1003, layout processing is performed. In the layout process, the document configuration data generated in step S1002 is arranged based on the position information extracted in step S1000. The arrangement result is the document before the layout change.
以上、説明したように本実施形態によるレイアウト復元処理では、入力原稿から文書画像解析により文書構成データを抽出する。抽出された文書構成データから元のレイアウト情報を取得することで、入力原稿のみで元のレイアウトを復元することができる。 As described above, in the layout restoration process according to the present embodiment, document configuration data is extracted from an input original by document image analysis. By acquiring the original layout information from the extracted document configuration data, the original layout can be restored using only the input document.
前述した実施形態では、レイアウト変更時にテンプレートにあわせて文書構成データの形状変更を行った。文書構成データが文字列の場合も文字列領域の画像の形状変更を行っていたが、文字列の場合は個々の文字画像を切り出すことで文字の形状を変更することなくレイアウト変更が可能である。 In the above-described embodiment, the shape of the document configuration data is changed according to the template when the layout is changed. Even when the document structure data is a character string, the shape of the image in the character string area was changed. However, in the case of a character string, the layout can be changed without changing the character shape by cutting out individual character images. .
たとえば、縦長の領域の文書構成データ(文字列)をテンプレート内の横長の領域に関連付けた場合、文書構成データの形状変更を行うだけでは、文字列画像は縦につぶされ、横に引き伸ばされることになる(図11(a))。一方、文書構成データ(文字列)から個々の文字画像を切り出し、テンプレート内の領域にあわせて文字画像を並び替えることで、個々の文字画像の形状を崩すことなくレイアウト変更が可能である(図11(b))。 For example, when document composition data (character strings) in a vertically long area is associated with a horizontally long area in a template, the character string image is crushed vertically and stretched horizontally only by changing the shape of the document structure data. (FIG. 11A). On the other hand, by cutting out individual character images from the document configuration data (character string) and rearranging the character images according to the area in the template, the layout can be changed without breaking the shape of the individual character images (see FIG. 11 (b)).
このように文字列画像を個々の文字画像に分割した場合も、前述した実施形態によりレイアウト変更および復元が可能である。 Thus, even when the character string image is divided into individual character images, the layout can be changed and restored by the above-described embodiment.
具体的には、並び替えられた個々の文字画像に対して、図8におけるステップS803およびS804の処理を行うことで、個々の文字画像に情報を埋め込むことができる。 Specifically, information can be embedded in each character image by performing the processing of steps S803 and S804 in FIG. 8 on the rearranged individual character images.
レイアウト復元時は、文書構成データが文字列であれば、個々の文字画像を切り出し、個々の文字画像から情報を抽出することによりレイアウト復元が可能である。 At the time of layout restoration, if the document configuration data is a character string, layout restoration is possible by cutting out individual character images and extracting information from the individual character images.
ここでは、個々の文字画像単位で扱ったが、文字列から単語を切り出し単語画像単位で情報埋め込み、抽出を行ってもよい。 Here, each character image is handled, but a word may be cut out from the character string and information may be embedded and extracted in word image units.
また、行単位や任意の文字数単位で画像を切り出し、情報埋め込み、抽出を行ってもよい。 In addition, an image may be cut out in units of lines or in an arbitrary number of characters, and information may be embedded and extracted.
<その他の実施形態>
本発明の目的は前述した実施例の機能を実現するソフトウエアのプログラムコードを記録した記録媒体を装置に供給し、その装置のコンピュータが記録媒体に格納されたプログラムコード(手順)を読み出し実行することによっても実現可能である。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することとなり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
<Other embodiments>
An object of the present invention is to supply a recording medium on which a program code of software for realizing the functions of the above-described embodiments is recorded to a device, and the computer of the device reads and executes the program code (procedure) stored on the recording medium. Can also be realized. In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiment, and the storage medium storing the program code constitutes the present invention.
また、コンピュータが読み出したプログラムコードの指示に基づいて、コンピュータ上で稼働しているオペレーティングシステム(OS)等が実際の処理の一部又は全部を実行することによって、前述した実施形態の機能が実現される場合も含まれる。 Further, the functions of the above-described embodiments are realized by an operating system (OS) running on the computer executing part or all of the actual processing based on the instruction of the program code read by the computer. This is also included.
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、プログラムコードの指示に基づいて、その機能拡張カードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を実行することによって、前述した実施形態の機能が実現される場合も含まれる。 Further, the program code read from the recording medium is written in a memory provided in a function expansion card inserted into the computer or a function expansion unit connected to the computer. Thereafter, the function of the above-described embodiment is realized by executing part or all of the actual processing by the CPU or the like provided in the function expansion card or function expansion unit based on the instruction of the program code. It is.
本発明を上記記録媒体に適用する場合には、その記録媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。 When the present invention is applied to the recording medium, program code corresponding to the flowchart described above is stored in the recording medium.
Claims (5)
前記文書入力工程により入力された文書を解析して、文書を構成する文書構成ブロックと前記文書構成ブロックのレイアウト情報とを取得する文書解析工程と、
前記文書解析工程により取得された文書構成ブロックのレイアウトを変更するレイアウト変更工程と、
前記レイアウト変更された文書構成ブロックに対して、前記文書解析工程で取得したレイアウト情報を埋め込む埋め込み工程とを備えることを特徴とする文書処理方法。 A document input process for inputting a document;
A document analysis step of analyzing the document input in the document input step to obtain a document configuration block constituting the document and layout information of the document configuration block;
A layout change step for changing the layout of the document constituent block acquired by the document analysis step;
A document processing method comprising: an embedding step of embedding layout information acquired in the document analysis step in the document composition block whose layout has been changed.
前記文書入力手段に入力された文書を解析して、文書を構成する文書構成ブロックと前記文書構成ブロックのレイアウト情報とを取得する文書解析手段と、
前記文書解析手段で取得された文書構成ブロックのレイアウトを変更するレイアウト変更工程と、
前記レイアウト変更された文書構成ブロックに対して、前記文書解析手段で取得したレイアウト情報を埋め込む埋め込み工程とを備えることを特徴とする文書処理装置。 A document input means for inputting a document;
A document analysis unit that analyzes a document input to the document input unit and obtains a document configuration block constituting the document and layout information of the document configuration block;
A layout change step for changing the layout of the document constituent block acquired by the document analysis means;
A document processing apparatus comprising: an embedding step of embedding layout information acquired by the document analysis means in the document configuration block whose layout has been changed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008165069A JP2010009146A (en) | 2008-06-24 | 2008-06-24 | Document processing method and document processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008165069A JP2010009146A (en) | 2008-06-24 | 2008-06-24 | Document processing method and document processor |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010009146A true JP2010009146A (en) | 2010-01-14 |
Family
ID=41589596
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008165069A Pending JP2010009146A (en) | 2008-06-24 | 2008-06-24 | Document processing method and document processor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010009146A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016167148A (en) * | 2015-03-09 | 2016-09-15 | コニカミノルタ株式会社 | Information processing apparatus, information processing program, and recording medium |
JP2019046306A (en) * | 2017-09-05 | 2019-03-22 | ブラザー工業株式会社 | Data processing program and data processing apparatus |
-
2008
- 2008-06-24 JP JP2008165069A patent/JP2010009146A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016167148A (en) * | 2015-03-09 | 2016-09-15 | コニカミノルタ株式会社 | Information processing apparatus, information processing program, and recording medium |
JP2019046306A (en) * | 2017-09-05 | 2019-03-22 | ブラザー工業株式会社 | Data processing program and data processing apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101334483B1 (en) | Apparatus and method for digitizing a document, and computer-readable recording medium | |
JP4533273B2 (en) | Image processing apparatus, image processing method, and program | |
JPH11282829A (en) | Font sharing system and method, and storage medium storing program to execute the sharing method | |
JP2000200350A (en) | Method and device for processing information | |
US8144988B2 (en) | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program | |
US20060280373A1 (en) | Information processing apparatus and method | |
US20070127085A1 (en) | Printing system, printing method and program thereof | |
JP2012203491A (en) | Document processing device and document processing program | |
JP2005303880A (en) | Image forming apparatus, image forming method, and program | |
JP4165435B2 (en) | Image forming apparatus and program | |
JP2010009146A (en) | Document processing method and document processor | |
JP2006244248A (en) | Image processing device, image processing method, and program for executing image processing method | |
US8194982B2 (en) | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program | |
JP2004127203A (en) | Image processor, image processing method, program for causing computer to execute the method, and computer readable recording medium with the program recorded thereon | |
JP2000168294A (en) | Electronic white board system | |
JP2005157928A (en) | Stamp processor, electronic approval system, program and recording medium | |
JP2009034963A (en) | Image forming apparatus having adaptive automatic layout function | |
JP2002232679A (en) | Method and device for image processing, computer program, and storage medium | |
JP5528410B2 (en) | Viewer device, server device, display control method, electronic comic editing method and program | |
JP2003046746A (en) | Method and apparatus for processing image | |
JP2011186835A (en) | Image processing apparatus and image processing program | |
JP2006054817A (en) | Document processor | |
JP4334987B2 (en) | DTP editing apparatus having area designation function and data cutout function | |
JP2009141525A (en) | Apparatus and method of processing image | |
JP2001202362A (en) | Character editing processor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100201 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20100630 |