JP2011061358A - Apparatus and program for processing information - Google Patents

Apparatus and program for processing information Download PDF

Info

Publication number
JP2011061358A
JP2011061358A JP2009207079A JP2009207079A JP2011061358A JP 2011061358 A JP2011061358 A JP 2011061358A JP 2009207079 A JP2009207079 A JP 2009207079A JP 2009207079 A JP2009207079 A JP 2009207079A JP 2011061358 A JP2011061358 A JP 2011061358A
Authority
JP
Japan
Prior art keywords
information
image
module
item
inspection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009207079A
Other languages
Japanese (ja)
Inventor
Kazutaka Hayashi
千登 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2009207079A priority Critical patent/JP2011061358A/en
Publication of JP2011061358A publication Critical patent/JP2011061358A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide an information processing apparatus which prevents a problem that it is not possible to discriminate whether an information image and a pixel block fit in an image. <P>SOLUTION: An image read means of the information processing apparatus reads the image, an extraction means extracts information from the information image embedded in the image read by the image read means, a first inspection means inspects whether the information extracted by the extraction means and the pixel block in a predetermined position relation with a region with the information image fit. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、情報処理装置及び情報処理プログラムに関する。   The present invention relates to an information processing apparatus and an information processing program.

特許文献1には、プログラム量の増大を招くことのない帳票集計装置を提供することを目的とし、帳票集計装置は、任意数の項目からなる明細項目とこの明細項目の合計項目とからなる項目群をコードに対応付けて、かつ、前記合計項目に特異のコードを付して記憶するとともに、前記明細項目の集計値を記憶した記憶手段と、新たに集計すべき前記コードに対応付けた明細項目の各値を読み込み、前記項目群の各コードを参照してそのコードが特異のコードであれば前記明細項目の集計値を合計値として前記記憶手段に格納し、コードが特異のコードでなければ新たに集計すべき値を当該明細項目の集計値に積算する演算制御手段とを有するものであり、これにより、処理すべき帳票が異なるごとに基本となるプログラムを変更する必要性がなくなり、プログラム量の増大、開発工数の増加を無くしつつ迅速な集計処理を行うことができることが開示されている。   Patent Document 1 aims to provide a form totaling apparatus that does not cause an increase in the amount of programs. The form totaling apparatus is an item composed of a detailed item composed of an arbitrary number of items and a total item of the detailed items. A group is associated with a code, and the total item is stored with a unique code, and a storage unit that stores the aggregate value of the detail item, and a detail associated with the code to be newly aggregated If each item value is read and each code of the item group is referred to and the code is a unique code, the total value of the item is stored in the storage means as a total value, and the code must be a unique code For example, it is necessary to change the basic program every time a form to be processed is different. Whilst the increase in program amount, it is disclosed that it is possible to perform rapid aggregation process while eliminating the increase in development steps.

また、特許文献2には、印刷文書における改ざん箇所を確実かつ容易に検出するとともに、改ざんの修正をも行うことの可能な、印刷文書の改ざん検出装置及び改ざん検出方法を提供することを課題とし、記載内容の少なくとも一部を電子透かしとして背景に埋め込んだ印刷文書の改ざん検出装置であって、印刷文書を読み取って、印刷文書の画像を生成する読み取り部と、印刷文書に埋め込まれた電子透かしから記載内容を検出する透かし検出部と、印刷文書の画像に関する第1の表示枠と、記載内容に関する第2の表示枠とを、比較可能な状態で表示する出力部を含むことを特徴とし、文書情報の内容と印刷文書の画像とをユーザが目で見て比較することができ、また、改ざん前の情報を知ることができるので、改ざん行為によるデータの喪失を防止することが可能であることが開示されている。   Further, it is an object of Patent Document 2 to provide a falsification detection apparatus and a falsification detection method for a print document that can reliably and easily detect a falsification position in a print document and can also correct the falsification. A tamper detection device for a print document in which at least a part of the description is embedded as a digital watermark in the background, the read unit for reading the print document and generating an image of the print document, and a digital watermark embedded in the print document A watermark detection unit for detecting the description content, a first display frame relating to the image of the print document, and a second display frame relating to the description content in an incomparable state, Since the user can visually compare the contents of the document information and the image of the printed document, and can know the information before the tampering, data by tampering It discloses that it is possible to prevent loss.

特開平07−098736号公報Japanese Patent Laid-Open No. 07-098736 特開2004−343523号公報JP 2004-343523 A

本発明は、画像内の情報画像と画素塊が適合するか否かを判断することができないという問題を防止するようにした情報処理装置及び情報処理プログラムを提供することを目的としている。   An object of the present invention is to provide an information processing apparatus and an information processing program that prevent the problem that it is impossible to determine whether or not an information image in an image matches a pixel block.

かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、画像を読み込む画像読込手段と、前記画像読込手段によって読み込まれた画像内に埋め込まれた情報画像から情報を抽出する抽出手段と、前記抽出手段によって抽出された情報と、前記情報画像が存在する領域と予め定められた位置関係にある画素塊とが適合するか否かを検査する第1の検査手段を具備することを特徴とする情報処理装置である。
The gist of the present invention for achieving the object lies in the inventions of the following items.
The invention of claim 1 is an image reading means for reading an image, an extracting means for extracting information from an information image embedded in an image read by the image reading means, information extracted by the extracting means, An information processing apparatus comprising: a first inspection unit that inspects whether or not a region where the information image exists and a pixel block having a predetermined positional relationship are matched.

請求項2の発明は、前記抽出手段は、前記画像読込手段によって読み込まれた画像内に埋め込まれた情報画像から、項目に関する情報である項目情報、系統だって並べられた一連の情報である系列情報、該項目情報と該系列情報との関係を示す関係情報を抽出し、前記第1の検査手段の検査結果として適合である場合は、前記関係情報に基づいて、前記項目情報と前記系列情報の関係を検査する第2の検査手段をさらに具備することを特徴とする請求項1に記載の情報処理装置である。   The invention of claim 2 is characterized in that the extraction means includes item information that is information related to an item from the information image embedded in the image read by the image reading means, and series information that is a series of information arranged systematically. , Extracting the relationship information indicating the relationship between the item information and the sequence information, and when the inspection result of the first inspection means is suitable, based on the relationship information, the item information and the sequence information The information processing apparatus according to claim 1, further comprising a second inspection unit that inspects the relationship.

請求項3の発明は、前記第2の検査手段は、前記項目情報が計算式を含む場合、前記関係情報に基づいて前記系列情報を該計算式に当てはめて該計算式による検査を行うことを特徴とする請求項2に記載の情報処理装置である。   According to a third aspect of the present invention, when the item information includes a calculation formula, the second checking means applies the series information to the calculation formula based on the relation information and performs an inspection using the calculation formula. The information processing apparatus according to claim 2.

請求項4の発明は、前記画像内に埋め込まれた情報画像が存在する領域の周辺にある画素塊に基づいて、前記画像が改変されているか否かを検査する第3の検査手段をさらに具備し、前記第2の検査手段は、前記第1の検査手段の検査結果として適合である場合であって、前記第3の検査手段の検査結果として改変されていない場合に、前記項目情報と前記系列情報の関係を検査することを特徴とする請求項2又は3に記載の情報処理装置である。   The invention of claim 4 further comprises third inspection means for inspecting whether or not the image has been modified based on a pixel block around an area where the information image embedded in the image exists. When the second inspection unit is suitable as the inspection result of the first inspection unit and is not modified as the inspection result of the third inspection unit, the item information and the 4. The information processing apparatus according to claim 2, wherein the relationship of the series information is inspected.

請求項5の発明は、コンピュータを、画像を読み込む画像読込手段と、前記画像読込手段によって読み込まれた画像内に埋め込まれた情報画像から情報を抽出する抽出手段と、前記抽出手段によって抽出された情報と、前記情報画像が存在する領域と予め定められた位置関係にある画素塊とが適合するか否かを検査する第1の検査手段として機能させることを特徴とする情報処理プログラムである。   According to a fifth aspect of the present invention, there is provided a computer, an image reading means for reading an image, an extracting means for extracting information from an information image embedded in an image read by the image reading means, and the extraction means An information processing program that causes information to function as a first inspection unit that inspects whether or not a region in which the information image is present matches a pixel block having a predetermined positional relationship.

請求項1の情報処理装置によれば、画像内の情報画像と画素塊が適合するか否かを判断することができる。   According to the information processing apparatus of the first aspect, it is possible to determine whether or not the information image in the image matches the pixel block.

請求項2の情報処理装置によれば、項目情報と系列情報の関係を検査することができる。   According to the information processing apparatus of the second aspect, the relationship between the item information and the sequence information can be inspected.

請求項3の情報処理装置によれば、項目情報に計算式を含む場合であっても、対応する系列情報を当てはめて計算を行う検査ができる。   According to the information processing apparatus of the third aspect, even when the item information includes a calculation formula, it is possible to perform inspection by applying the corresponding series information.

請求項4の情報処理装置によれば、情報画像の周辺にある画素塊による改変を検査することができる。   According to the information processing apparatus of the fourth aspect, it is possible to inspect the alteration caused by the pixel block around the information image.

請求項5の情報処理プログラムによれば、画像内の情報画像と画素塊が適合するか否かを判断することができる。   According to the information processing program of the fifth aspect, it is possible to determine whether or not the information image in the image matches the pixel block.

本実施の形態(文書出力装置)の構成例についての概念的なモジュール構成図である。It is a conceptual module block diagram about the structural example of this Embodiment (document output device). 文書出力装置の処理例を示すフローチャートである。It is a flowchart which shows the process example of a document output device. 文書の例を示す説明図である。It is explanatory drawing which shows the example of a document. 文書内の埋め込み情報画像付き表の例を示す説明図である。It is explanatory drawing which shows the example of the table | surface with an embedded information image in a document. 文書内の埋め込み情報画像付き式の例を示す説明図である。It is explanatory drawing which shows the example of the type | formula with an embedded information image in a document. 本実施の形態(文書検査装置)の構成例についての概念的なモジュール構成図である。It is a conceptual module block diagram about the structural example of this Embodiment (document inspection apparatus). 文書検査装置の処理例を示すフローチャートである。It is a flowchart which shows the process example of a document inspection apparatus. 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。It is a block diagram which shows the hardware structural example of the computer which implement | achieves this Embodiment.

以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
本実施の形態は、文書出力装置と文書検査装置とに分かれている。図1は、本実施の形態(文書出力装置)の構成例についての概念的なモジュール構成図である。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、「保持する」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
Hereinafter, an example of a preferred embodiment for realizing the present invention will be described with reference to the drawings.
The present embodiment is divided into a document output device and a document inspection device. FIG. 1 is a conceptual module configuration diagram of an exemplary configuration of the present embodiment (document output apparatus).
The module generally refers to components such as software (computer program) and hardware that can be logically separated. Therefore, the module in the present embodiment indicates not only a module in a computer program but also a module in a hardware configuration. Therefore, the present embodiment also serves as an explanation of a computer program, a system, and a method. However, for the sake of explanation, the words “store”, “store”, “hold”, and the equivalent are used. However, these words are stored in the storage device when the embodiment is a computer program. It is the control to be stored or stored in the storage device. In addition, the modules correspond almost one-to-one with the functions. However, in mounting, one module may be composed of one program, or a plurality of modules may be composed of one program. A plurality of programs may be used. The plurality of modules may be executed by one computer, or one module may be executed by a plurality of computers in a distributed or parallel environment. Note that one module may include other modules. Hereinafter, “connection” is used not only for physical connection but also for logical connection (data exchange, instruction, reference relationship between data, etc.).
In addition, the system or device is configured by connecting a plurality of computers, hardware, devices, and the like by communication means such as a network (including one-to-one correspondence communication connection), etc., and one computer, hardware, device. The case where it implement | achieves by etc. is included. “Apparatus” and “system” are used as synonymous terms. “Predetermined” means that the process is determined before the target process, and not only before the process according to this embodiment starts but also after the process according to this embodiment starts. In addition, if it is before the target processing, it is used in accordance with the situation / state at that time or with the intention to be decided according to the situation / state up to that point.

本実施の形態である文書出力装置は、情報画像を埋め込んだ文書を出力するものであって、図1の例に示すように、受付モジュール102、項目定義モジュール104、系列情報定義モジュール106、依存関係定義モジュール108、一時記憶モジュール110、表示モジュール112、成形モジュール114、領域情報算出モジュール116、埋め込み情報生成モジュール118、出力モジュール120、出力装置122を有している。   The document output apparatus according to the present embodiment outputs a document in which an information image is embedded. As shown in the example of FIG. 1, a reception module 102, an item definition module 104, a series information definition module 106, a dependency It has a relationship definition module 108, a temporary storage module 110, a display module 112, a molding module 114, an area information calculation module 116, an embedded information generation module 118, an output module 120, and an output device 122.

なお、情報画像とは、機械可読な態様で電子データを表すために体系的に作られた画像コードをいい、具体的には、1次元バーコード、2次元コード等がある。例えば、角度の異なる斜線でデータを表現するグリフコード(例えば、特開平6−103390号公報、特開平6−75795号公報)等がある。また、情報画像は、不可視又は不可視と同等の情報画像であってもよい。不可視又は不可視と同等の情報画像とは、肉眼ではその情報画像があることを判別できない情報画像又はそれに相当する情報画像のことである。つまり、人に意識されにくい情報画像である。例えば、ある波長の光(例えば、赤外線)でだけ読めるトナーによる印刷等がある。
本実施の形態では、情報画像によって、後述する項目情報、系列情報、依存関係情報を表す。
The information image refers to an image code that is systematically created to represent electronic data in a machine-readable manner, and specifically includes a one-dimensional bar code, a two-dimensional code, and the like. For example, there are glyph codes (for example, JP-A-6-103390 and JP-A-6-75795) that express data with oblique lines having different angles. The information image may be an invisible or an invisible information image. An information image that is invisible or equivalent to invisible is an information image that cannot be identified with the naked eye, or an information image that corresponds to the information image. That is, it is an information image that is not easily recognized by humans. For example, printing with toner that can be read only with light of a certain wavelength (for example, infrared rays).
In the present embodiment, item information, series information, and dependency relationship information, which will be described later, are represented by an information image.

受付モジュール102は、一時記憶モジュール110と接続されており、文書データを受け付けて一時記憶モジュール110に送信する。ここで、文書データとは、少なくともテキストデータを含み、場合によっては画像、動画、音声等の電子データ、又はこれらの組み合わせを含み、記憶、編集及び検索等の対象となり、システム又は利用者間で個別の単位として交換できるものをいい、これらに類似するものを含む。なお、画像である場合は、文字認識処理を行ってテキストデータを生成する。   The receiving module 102 is connected to the temporary storage module 110 and receives document data and transmits it to the temporary storage module 110. Here, the document data includes at least text data, and in some cases includes electronic data such as images, moving images, and audio, or a combination thereof, and is subject to storage, editing, search, etc., between systems or users. Those that can be exchanged as individual units, including those similar to these. In the case of an image, text recognition processing is performed to generate text data.

項目定義モジュール104は、一時記憶モジュール110と接続されており、数値やテキストの確認が必要な項目や依存関係で参照される項目などの指定を受け付けて、一時記憶モジュール110に送信する。
系列情報定義モジュール106は、一時記憶モジュール110と接続されており、表中の列や行など一連のまとまった数値列や記号列の指定を受け付けて、一時記憶モジュール110に送信する。
依存関係定義モジュール108は、一時記憶モジュール110と接続されており、予め定められた依存関係の種類を提示してユーザの選択を受け付け、選択された依存関係の種類に応じてどの項目や系列情報を参照する依存関係であるかの指定を受け付けて依存関係の種類情報とともに、一時記憶モジュール110に送信する。
The item definition module 104 is connected to the temporary storage module 110, receives designation of an item that requires confirmation of numerical values and texts, an item that is referred to by a dependency relationship, and transmits the designation to the temporary storage module 110.
The series information definition module 106 is connected to the temporary storage module 110, receives designation of a series of numerical strings and symbol strings such as columns and rows in the table, and transmits them to the temporary storage module 110.
The dependency relationship definition module 108 is connected to the temporary storage module 110, presents a predetermined dependency relationship type, accepts a user's selection, and determines which items and series information according to the selected dependency relationship type. Is received, and is transmitted to the temporary storage module 110 together with dependency type information.

一時記憶モジュール110は、受付モジュール102、項目定義モジュール104、系列情報定義モジュール106、依存関係定義モジュール108、表示モジュール112、成形モジュール114、領域情報算出モジュール116と接続されている。受付モジュール102、項目定義モジュール104、系列情報定義モジュール106、依存関係定義モジュール108から文書データ、項目情報、系列情報、依存関係情報を受け取り、一時的に保持する。そして、必要に応じて表示モジュール112、成形モジュール114、領域情報算出モジュール116へ保持している文書データ、項目情報、系列情報、依存関係情報を送信する。
表示モジュール112は、一時記憶モジュール110と接続されており、一時記憶モジュール110に保持されている文書データ、項目情報、系列情報、依存関係情報をディスプレイ等の表示装置に表示する。
The temporary storage module 110 is connected to the reception module 102, the item definition module 104, the series information definition module 106, the dependency relationship definition module 108, the display module 112, the molding module 114, and the area information calculation module 116. Document data, item information, sequence information, and dependency relationship information are received from the reception module 102, the item definition module 104, the sequence information definition module 106, and the dependency relationship definition module 108, and temporarily stored. Then, the document data, item information, series information, and dependency relationship information held are transmitted to the display module 112, the forming module 114, and the area information calculation module 116 as necessary.
The display module 112 is connected to the temporary storage module 110 and displays document data, item information, sequence information, and dependency relationship information held in the temporary storage module 110 on a display device such as a display.

成形モジュール114は、一時記憶モジュール110、領域情報算出モジュール116、出力モジュール120と接続されている。一時記憶モジュール110に保持されている文書データを印刷用のページ割付を行うなどして印刷や表示用に成形するための計算を行い、成形を行う。具体的には、例えば、PDF(Portable Document Format)、印刷用データを生成する。そして、その印刷用の文書データを領域情報算出モジュール116、出力モジュール120へ送信する。   The molding module 114 is connected to the temporary storage module 110, the area information calculation module 116, and the output module 120. The document data held in the temporary storage module 110 is subjected to calculation for shaping for printing or display, for example, by allocating pages for printing, and shaping is performed. Specifically, for example, PDF (Portable Document Format) and print data are generated. Then, the print document data is transmitted to the area information calculation module 116 and the output module 120.

領域情報算出モジュール116は、一時記憶モジュール110、成形モジュール114、埋め込み情報生成モジュール118と接続されている。一時記憶モジュール110から、項目情報と系列情報と依存関係情報を読み出し、成形モジュール114の動作の際に指定された各情報を表示割付すべき位置に関する情報(具体的には、例えば、ページ、位置座標、範囲の情報)を取得して、埋め込み情報生成モジュール118に送信する。   The area information calculation module 116 is connected to the temporary storage module 110, the molding module 114, and the embedded information generation module 118. The item information, the series information, and the dependency relationship information are read from the temporary storage module 110, and the information (specifically, for example, page, Information of coordinates and range) is acquired and transmitted to the embedded information generation module 118.

埋め込み情報生成モジュール118は、領域情報算出モジュール116、出力モジュール120と接続されている。領域情報算出モジュール116から送信された情報に基づいて、予め定められた情報埋め込み位置に関する計算を行って、各埋め込み情報とそれらの配置情報を作成して出力モジュール120に送信する。   The embedded information generation module 118 is connected to the area information calculation module 116 and the output module 120. Based on the information transmitted from the area information calculation module 116, a calculation regarding a predetermined information embedding position is performed, and each embedding information and their arrangement information are created and transmitted to the output module 120.

出力モジュール120は、成形モジュール114、埋め込み情報生成モジュール118、出力装置122と接続されている。成形モジュール114と埋め込み情報生成モジュール118から情報を受け取り、出力する情報を作成して出力装置122に送信する。
出力装置122は、出力モジュール120と接続されており、出力モジュール120から出力情報を受け取って、プリンタ等の印刷装置から印刷する。
The output module 120 is connected to the molding module 114, the embedded information generation module 118, and the output device 122. Information is received from the molding module 114 and the embedding information generation module 118, information to be output is created and transmitted to the output device 122.
The output device 122 is connected to the output module 120, receives output information from the output module 120, and prints it from a printing device such as a printer.

図2は、文書出力装置の処理例を示すフローチャートである。
ステップS202では、受付モジュール102が文書データを受け付けると、次に、項目定義モジュール104が検査の自動化を定義したい項目を、図示しないユーザインタフェースを用いて選択する。この選択は、ユーザの操作に応じて行われるものである。この選択された情報から項目に関する情報である項目情報を生成する。
FIG. 2 is a flowchart illustrating a processing example of the document output apparatus.
In step S202, when the receiving module 102 receives document data, the item definition module 104 next selects an item for which automation of inspection is to be defined using a user interface (not shown). This selection is performed according to the user's operation. Item information that is information related to the item is generated from the selected information.

受け付けた文書データとして、図3に示した文書300を例示して説明する。文書300には、文章領域310、表320、表330、式340、表350が記載されている。
ユーザの操作によって、例えば図3に示した式340が選択されると、項目定義モジュール104は選択された式340の内容を、受け付けた文書データの種類により、例えば、文書データ中の該当箇所の情報から取得したり、又は、例えば、該当部分が画像データである場合には、文字認識処理等の抽出処理を行うなどして取得したりする。
As the received document data, the document 300 shown in FIG. 3 will be described as an example. The document 300 includes a text area 310, a table 320, a table 330, a formula 340, and a table 350.
When, for example, the expression 340 shown in FIG. 3 is selected by the user's operation, the item definition module 104 changes the content of the selected expression 340 according to the type of received document data, for example, the corresponding part in the document data. For example, when the corresponding portion is image data, the information is acquired by performing extraction processing such as character recognition processing.

そして、項目定義モジュール104はこの式340の場合には、文字列情報「式1」、計算式情報「ポイント = 月度売上げ ÷ 100,000 ×1.2 + 調整ポイント」を抽出する。さらに、計算式情報の中の「ポイント」には項目種別「種別:ポイント」、「月度売上げ」には項目種別「種別:月度売上げ」と「種別:売上げ」、「調整ポイント」には項目種別「種別:調整ポイント」と「種別:ポイント」の項目種別属性をそれぞれ付与する。この項目種別属性は図示しないユーザインタフェースを用いてユーザが指示してもよいが、予め定められた対応付けルールにしたがって付与するようにしてもよい。
該当項目の元データが画像データの場合にはさらに、項目情報「式1」の位置情報(何ページのどの領域であるかの座標情報)と計算式情報から該当する画像データへの変換方式(例えば、元の画像データを取り出す方式、計算式情報に応じて印刷データを生成する方式等がある)の選択を行う。この選択は例えば、計算式情報の変換方式の選択肢をいくつも用意しておき適用した結果と元画像の比較評価により選択してもよい。この際に選択した方式での元画像との差分情報も一時記憶モジュール110に保持する。
In the case of this formula 340, the item definition module 104 extracts character string information “formula 1” and calculation formula information “point = monthly sales / 100,000 × 1.2 + adjustment points”. In addition, the item type “Type: Point” for “Point” in the formula information, the item type “Type: Monthly Sales” and “Type: Sales” for “Monthly Sales”, and the item type for “Adjustment Point” Item type attributes of “type: adjustment point” and “type: point” are assigned respectively. The item type attribute may be instructed by the user using a user interface (not shown), or may be given according to a predetermined association rule.
In the case where the original data of the corresponding item is image data, the position information (coordinate information of which area of which page) and the calculation formula information are converted into the corresponding image data (item 1). For example, there is a method of extracting original image data, a method of generating print data according to calculation formula information, and the like. This selection may be made, for example, by comparing and evaluating the result of applying and applying a number of calculation method information conversion method options. Difference information from the original image in the method selected at this time is also stored in the temporary storage module 110.

ステップS204では、系列情報定義モジュール106が検査の自動化を定義したい系列情報を、図示しないユーザインタフェースを用いて選択する。この選択は、ユーザの操作に応じて行われるものである。この選択された情報から系統だって並べられた一連の情報である系列情報を生成する。ここで、系列情報とは、系統だって並べられた一連の情報をいい、具体的には、例えば、表を構成している情報が該当する。ステップS204では、例えば文書中の表の行や列を指定する。   In step S204, the sequence information definition module 106 selects the sequence information for which inspection automation is to be defined using a user interface (not shown). This selection is performed according to the user's operation. Sequence information, which is a series of information arranged systematically from the selected information, is generated. Here, the series information refers to a series of information arranged in a system, and specifically, for example, information constituting a table. In step S204, for example, a table row or column in the document is designated.

例えば図3に示した表330(タイトル「表2 D地区の売上げ」のある表)の列を指定する。「A店」とラベルのついた列を例に取り上げると、系列情報定義モジュール106は、表情報「表2」の列情報「表2 A店」は縦方向に3つの項目が配置され、それぞれ「A1k円」、「A2k円」、「A3k円」の値であり、各項目別の属性(表内の左端にある「月度」の欄)として「1月」、「2月」、「3月」がそれぞれ付与されていることを抽出する。これらの情報の抽出は表の認識技術などを組み合わせて実現してもよいし、図示しないユーザインタフェースを通じてユーザが指定してもよい。さらに、列情報「表2 A店」は項目種別「種別:D地区売上げ」、「種別:売上げ」、「種別:A店」を抽出する。項目種別は前記抽出した情報に予め定められた種別対応ルールを適用して実現してもよいし、図示しないユーザインタフェースを通じてユーザが付与してもよい。例えば、簡単には、抽出した情報から文字列情報を形態素解析で分割して予め定められたルールで形態素の組み合わせを合成するという方法などで実現してもよい。このとき、表2の列情報の組には識別名として「表2」、ラベルとして「D地区の売上げ」の情報も付与する。   For example, the column of the table 330 shown in FIG. 3 (the table with the title “Table 2 Sales in D district”) is designated. Taking the column labeled “Store A” as an example, the sequence information definition module 106 has three items in the column information “Table 2 Store A” in the table information “Table 2” arranged in the vertical direction. “A1k yen”, “A2k yen”, “A3k yen”, and “January”, “February”, “3” as attributes for each item (“Monthly” column at the left end of the table) Extract that each month is given. The extraction of the information may be realized by combining table recognition techniques or the like, or may be specified by the user through a user interface (not shown). Further, the column information “Table 2 A store” extracts the item types “type: D district sales”, “type: sales”, and “type: A store”. The item type may be realized by applying a predetermined type correspondence rule to the extracted information, or may be given by the user through a user interface (not shown). For example, it may be simply realized by a method of dividing character string information from extracted information by morphological analysis and synthesizing a combination of morphemes according to a predetermined rule. At this time, the information of “Table 2” as the identification name and “Sales in D district” as the label are also given to the set of column information in Table 2.

また、図3に示した表320、表350についても表330と同様にして各列や各行の抽出を実現する。
表320についてはさらに、区分の情報(表1の左側の欄)を解釈して「〜100,000k円」に対して「< 100,000 × 1000 円」、「100,000〜1,000,000k 円」に対して「(≧ 100,000 × 1000) AND (< 1,000,000 × 1000) 円」と数値を判定できる式を抽出してもよい。このとき、抽出した式から元の文字列に再変換する変換方式も、予め定められたルールの中から選択して保持する。このルールとは例えば「{X} 〜 {Y}」と「(≧ {X}) AND (< {Y})」が対応するといった対応関係の組を用意しておくことで実現するようにしてもよい。表320の列情報の組には識別名として「表1」、ラベルとして「調整ポイント」を、表350の列情報の組には識別名として「表3」、ラベルとして「D地区各店のポイント」を付与する。
受け付けた文書データが画像など外観や構成要素の配置が固定されたものである場合には、各系列情報の出現した位置座標を含めた領域情報も抽出して一時記憶モジュール110に保持する。
In addition, the columns 320 and 350 shown in FIG. 3 are also extracted in the same manner as the table 330.
Further, regarding the table 320, the classification information (the column on the left side of Table 1) is interpreted so that “<100,000 × 1000 yen”, “<100,000 × 1000 yen”, “100,000 to 1,000,000”. An expression that can determine a numerical value such as “(≧ 100,000 × 1000) AND (<1,000,000 × 1000) yen” may be extracted for “000 k yen”. At this time, a conversion method for re-converting the extracted expression into the original character string is also selected from predetermined rules and held. This rule is realized by, for example, preparing a set of correspondences such that “{X} to {Y}” and “(≧ {X}) AND (<{Y})” correspond to each other. Also good. In the column information set of Table 320, “Table 1” as the identification name, “Adjustment Point” as the label, “Table 3” as the identification name in the column information set of Table 350, and “Point of each D district store” as the label Is given.
If the received document data is an image such as an image whose appearance and arrangement of components are fixed, area information including the position coordinates where each series information appears is extracted and held in the temporary storage module 110.

ステップS206では、依存関係定義モジュール108が検査の自動化を定義したい依存関係情報を、図示しないユーザインタフェースを用いて選択する。この選択は、ユーザの操作に応じて行われるものである。この選択された情報から項目情報と系列情報との関係を示す関係情報を生成する。   In step S206, the dependency relationship definition module 108 selects dependency relationship information for which inspection automation is to be defined, using a user interface (not shown). This selection is performed according to the user's operation. Relation information indicating the relation between the item information and the series information is generated from the selected information.

文書データ中の文字列の中から、項目情報や系列情報の関係を記述した部分を指定する。例えば図5に示した説明文315(「表2にD地区の売上げを、表3にD地区各店のポイントを示した(ポイントは式1と表1の調整ポイントにより算出)。」)を指定すると、この部分に予め用意した依存関係テンプレートの中から「{A. 識別名} に{A. ラベル} を、{B. 識別名} に{B. ラベル} を示した({B. 項目種別} は{C. 識別名} と{D. 識別名} の{D. 項目種別} により算出)。」を選択する。この選択は表や式などの文字列を含んだ文や段落やラベルなどについて、テンプレートの記述をパターンマッチの方法で検査して選択するようにしてもよいし、文字列の類似計算を行って候補を選択してユーザに選択させるようにしてもよいし、図示しないユーザインタフェースからユーザが選択することによって実現させてもよい。   A part describing the relationship between item information and series information is specified from a character string in document data. For example, the explanatory text 315 shown in FIG. 5 (“Table 2 shows the sales of D district and Table 3 shows the points of each store in D district (the points are calculated by the formula 1 and the adjustment points of Table 1)”) is specified. Then, {A. Label} is indicated in {A. Distinguished Name} and {B. Label} is indicated in {B. Distinguished Name} from among the dependency templates prepared in advance in this part ({B. Item Type } Is selected from {C. Distinguished name} and {D. Distinguished name} based on {D. Item type}. This selection may be made by selecting the template description by examining the description of the template using the pattern matching method for sentences, paragraphs, labels, etc. that contain character strings such as tables and expressions, or by performing similarity calculations on character strings. The candidate may be selected and allowed to be selected by the user, or may be realized by the user selecting from a user interface (not shown).

テンプレートのA,B,C,D は定義された項目情報や系列情報の中から検索されて選ばれてもよいし、図示しないユーザインタフェースを介してユーザが選択するようにしてもよい。図3に示す例では対応は下のようになる。
A・・・系列情報:「表2:A店」、「表2:B店」、「表2:C店」
B・・・系列情報:「表3:A店」、「表3:B店」、「表3:C店」
C・・・項目情報:「式1」
D・・・系列情報:「表1:調整」
Templates A, B, C, and D may be searched and selected from the defined item information and series information, or may be selected by the user via a user interface (not shown). In the example shown in FIG. 3, the correspondence is as follows.
A ... Series information: "Table 2: Store A", "Table 2: Store B", "Table 2: Store C"
B ... Series information: "Table 3: Store A", "Table 3: Store B", "Table 3: Store C"
C ... Item information: "Formula 1"
D: Series information: “Table 1: Adjustment”

ステップS208では、領域情報算出モジュール116が領域情報を算出する。印刷処理時に行われるコード情報のラスタライズの処理に沿って、一時記憶モジュール110に保持されている項目情報と系列情報のそれぞれについて、何ページ目のどの領域に配置されて描画されるかの情報が算出される。配置の情報は例えば、項目情報の内容が印字される領域の外接矩形を算出するなどの方法で実現するようにしてもよい。系列情報に対しては、その系列情報に含まれる各項目や対応する属性情報のそれぞれについての外接矩形も算出して対応を保持する。
依存関係情報に対しては、内容を表す文字列が印字される領域の外接矩形や、外接多角形を求める。ページをまたぐ場合や領域が分断されて配置される場合には、それぞれの外接矩形や外接多角形を求める。また、前述の対応が検出されたそれぞれの系列情報や項目情報について、算出されている領域情報(ページ、位置、範囲情報)を取得して関連付けて一時記憶モジュール110に保持する。
In step S208, the area information calculation module 116 calculates area information. In accordance with the rasterization process of the code information performed at the time of the printing process, information on which page and in which area is drawn for each of the item information and the series information held in the temporary storage module 110 is displayed. Calculated. For example, the arrangement information may be realized by a method of calculating a circumscribed rectangle of an area in which the content of the item information is printed. For series information, a circumscribed rectangle for each item included in the series information and corresponding attribute information is also calculated and held.
For the dependency relationship information, a circumscribed rectangle or circumscribed polygon of an area where a character string representing the content is printed is obtained. When straddling a page or when an area is divided and arranged, each circumscribed rectangle or circumscribed polygon is obtained. In addition, for each series information or item information for which the above correspondence is detected, the calculated area information (page, position, range information) is acquired and associated and stored in the temporary storage module 110.

ステップS210では、埋め込み情報生成モジュール118が埋め込み情報の生成処理を行う。各項目情報や系列情報、依存関係情報のそれぞれが持つ情報(識別名、ラベル、値、属性情報、項目種別、印字データへの変換方式情報など)に加えて、領域情報算出モジュール116による領域情報算出処理によって算出された領域情報に対応する埋め込み情報画像を生成する。   In step S210, the embedded information generation module 118 performs an embedded information generation process. In addition to the information (identification name, label, value, attribute information, item type, conversion method information to print data, etc.) held by each item information, series information, and dependency relationship information, region information by the region information calculation module 116 An embedded information image corresponding to the area information calculated by the calculation process is generated.

ステップS212では、出力モジュール120が出力情報を合成処理する。受け付けた文書データの印刷用情報に埋め込み情報生成モジュール118で生成された埋め込み情報画像を合成して印刷用データを作成して出力装置122へ送信する。例えば、合成は受け付けた文書データの印刷用情報に埋め込み情報画像を上書き(又は論理和合成等)するなどの方法で実現できる。埋め込み情報画像の配置位置は、ページの余白部分などの予め定められた領域でもよいし、それぞれの項目情報、系列情報、依存関係情報の描画された位置やその周辺位置でもよい。また、項目情報、系列情報、依存関係情報を囲むように埋め込み情報画像を描画してもよい。
そして、出力装置122が、出力モジュール120によって生成された印刷用データを紙等の媒体に印刷する。この印刷された文書は、後に検査、確認される対象となる。
In step S212, the output module 120 synthesizes the output information. The print information of the received document data is combined with the embedded information image generated by the embedded information generation module 118 to generate print data, which is transmitted to the output device 122. For example, the synthesis can be realized by a method of overwriting an embedded information image (or logical sum synthesis or the like) on print information of received document data. The placement position of the embedded information image may be a predetermined area such as a margin of the page, or may be a position where each item information, series information, dependency information is drawn or its peripheral position. Further, an embedded information image may be drawn so as to surround item information, series information, and dependency relationship information.
Then, the output device 122 prints the print data generated by the output module 120 on a medium such as paper. This printed document is a target to be inspected and confirmed later.

情報画像が印刷された文書を説明する。図4(a)に例示する表は、その文書内の埋め込み情報画像付き表400の例を示す説明図である。これは、図3に例示した文書300の表320に情報画像を上書きしたものである。区分欄410内に、埋め込み情報画像411、412、413を上書きしたものであり、調整欄420内に、埋め込み情報画像421、422、423を有している。
図5(a)に例示する式は、印刷された文書内の埋め込み情報画像付き式500の例を示す説明図である。これは、図3に例示した文書300の式340に情報画像を上書きしたものである。このように式全体を囲むように埋め込み情報画像501を上書きする。
A document on which an information image is printed will be described. The table illustrated in FIG. 4A is an explanatory diagram illustrating an example of the embedded information image-added table 400 in the document. This is an information image overwritten on the table 320 of the document 300 illustrated in FIG. The section information 410 is overwritten with the embedded information images 411, 412, and 413, and the adjustment section 420 has embedded information images 421, 422, and 423.
The formula illustrated in FIG. 5A is an explanatory diagram illustrating an example of a formula 500 with an embedded information image in a printed document. This is an information image overwritten on the expression 340 of the document 300 illustrated in FIG. In this way, the embedded information image 501 is overwritten so as to surround the entire expression.

印刷された文書に改ざんが施された場合について説明する。図4(b)に例示する表は調整欄420内に改ざん文字422b、423bを付加する変更が加えられている。また、図5(b)に例示する式には、改ざん文字501bを付加する変更が加えられている。   A case where the printed document has been tampered with will be described. In the table illustrated in FIG. 4B, a change to add the falsified characters 422 b and 423 b in the adjustment column 420 is added. In addition, the expression illustrated in FIG. 5B is changed to add the falsified character 501b.

図6は、本実施の形態(文書検査装置)の構成例についての概念的なモジュール構成図である。
本実施の形態である文書検査装置は、前述の文書出力装置によって印刷された文書を画像として読み込んで検査、確認するものであって、図6の例に示すように、読み込みモジュール602、保持モジュール604、埋め込み情報解釈モジュール606、依存関係構造処理モジュール608、読み込み画像処理モジュール610、埋め込み情報領域処理モジュール612、対応関係処理モジュール614、提示モジュール616を有している。
FIG. 6 is a conceptual module configuration diagram of an exemplary configuration of the present embodiment (document inspection apparatus).
The document inspection apparatus according to the present embodiment reads and inspects and confirms a document printed by the document output apparatus described above. As shown in the example of FIG. 6, a reading module 602, a holding module 604, an embedded information interpretation module 606, a dependency structure processing module 608, a read image processing module 610, an embedded information area processing module 612, a correspondence processing module 614, and a presentation module 616.

読み込みモジュール602は、保持モジュール604、埋め込み情報解釈モジュール606と接続されている。スキャナなどにより画像を読み込む。また、その読み込みに付随して文字認識処理を行ってもよい。そして、画像、文字認識結果を保持モジュール604に送信するとともに、埋め込み情報画像の存在を検知して、画像情報を埋め込み情報解釈モジュール606に送信する。
保持モジュール604は、読み込みモジュール602、読み込み画像処理モジュール610、提示モジュール616と接続されている。読み込みモジュール602から送信された画像情報を保持し、必要に応じて読み込み画像処理モジュール610や提示モジュール616に送信する。
The reading module 602 is connected to the holding module 604 and the embedded information interpretation module 606. Read the image with a scanner. Moreover, you may perform a character recognition process accompanying the reading. Then, the image and character recognition result is transmitted to the holding module 604, the presence of the embedded information image is detected, and the image information is transmitted to the embedded information interpretation module 606.
The holding module 604 is connected to the reading module 602, the reading image processing module 610, and the presentation module 616. The image information transmitted from the reading module 602 is held and transmitted to the reading image processing module 610 and the presentation module 616 as necessary.

埋め込み情報解釈モジュール606は、読み込みモジュール602、依存関係構造処理モジュール608、読み込み画像処理モジュール610、埋め込み情報領域処理モジュール612、対応関係処理モジュール614と接続されている。読み込みモジュール602から埋め込み情報画像を読み込んで解釈し、その解釈結果(その埋め込み情報画像から抽出した項目情報、系列情報、依存関係情報)を一時保持し、必要に応じて依存関係構造処理モジュール608、読み込み画像処理モジュール610、埋め込み情報領域処理モジュール612、対応関係処理モジュール614へ送信する。   The embedded information interpretation module 606 is connected to the reading module 602, the dependency relationship structure processing module 608, the read image processing module 610, the embedded information area processing module 612, and the correspondence relationship processing module 614. An embedded information image is read from the reading module 602, interpreted, and the interpretation results (item information, series information, dependency information extracted from the embedded information image) are temporarily stored, and a dependency structure processing module 608, as necessary. The read image processing module 610, the embedded information area processing module 612, and the correspondence relationship processing module 614 are transmitted.

読み込み画像処理モジュール610は、保持モジュール604、埋め込み情報解釈モジュール606、埋め込み情報領域処理モジュール612、対応関係処理モジュール614と接続されている。埋め込み情報解釈モジュール606の指示にしたがって、保持モジュール604内の読み込んだ画像情報や文字認識処理の結果から指示された部分情報を取り出す。埋め込み情報解釈モジュール606の指示として、埋め込み画像情報が描画されていた領域の画像を取り出す等がある。取り出した部分情報を埋め込み情報領域処理モジュール612、対応関係処理モジュール614へ送信する。   The read image processing module 610 is connected to a holding module 604, an embedded information interpretation module 606, an embedded information area processing module 612, and a correspondence processing module 614. In accordance with the instruction of the embedded information interpretation module 606, the instructed partial information is extracted from the image information read in the holding module 604 and the result of the character recognition process. An instruction of the embedded information interpretation module 606 includes taking out an image of an area where the embedded image information has been drawn. The extracted partial information is transmitted to the embedded information area processing module 612 and the correspondence processing module 614.

埋め込み情報領域処理モジュール612は、埋め込み情報解釈モジュール606、読み込み画像処理モジュール610、提示モジュール616と接続されている。埋め込み情報解釈モジュール606から受け取った項目情報、系列情報と、埋め込み情報画像が存在する領域と予め定められた位置関係にある画素塊とが適合するか否かを検査する。なお、画素塊とは、4連結又は8連結で連続する画素領域を少なくとも含み、これらの画素領域の集合をも含む。これらの画素領域の集合とは、4連結等で連続した画素領域が複数あり、その複数の画素領域は近傍にあるものをいう。ここで、近傍にあるものとは、例えば、互いの画素領域が距離的に近いもの、文章としての1行から1文字ずつ切り出すように縦又は横方向に射影し、空白地点で切り出した画像領域、又は予め定められた間隔で切り出した画像領域等がある。この画素塊は一般的には文字の画像となる。ノイズの画像との区別を行うために前述の処理を採用してもよい。
より具体的には、例えば、埋め込み情報解釈モジュール606から受け取った埋め込み情報画像の中の項目情報の箇所、系列情報の箇所について、埋め込まれた情報画像内の項目情報、系列情報と読み込み画像処理モジュール610から受け取った画像の情報が適合するか否かを検査する。
さらに、埋め込み情報領域処理モジュール612は、文書の画像内の埋め込み情報画像が存在する領域の周辺にある画素塊に基づいて、その文書の画像が改変されているか否かを検査するようにしてもよい。
そして、検査結果を提示モジュール616へ送信する。
The embedded information area processing module 612 is connected to the embedded information interpretation module 606, the read image processing module 610, and the presentation module 616. It is checked whether the item information and the series information received from the embedded information interpretation module 606 match the area where the embedded information image exists and the pixel block having a predetermined positional relationship. Note that the pixel block includes at least a pixel area that is continuous in four or eight connections, and includes a set of these pixel areas. The set of these pixel areas means that there are a plurality of continuous pixel areas such as 4-connected, and the plurality of pixel areas are in the vicinity. Here, what is in the vicinity is, for example, an image area in which the pixel areas are close to each other in distance, an image area that is projected vertically or horizontally so as to cut out one character at a time from a line as a sentence, and cut out at a blank spot Or an image region cut out at a predetermined interval. This pixel block generally becomes a character image. The above-described processing may be employed to distinguish the image from noise.
More specifically, for example, the item information portion and the sequence information portion in the embedded information image with respect to the item information portion and the sequence information portion in the embedded information image received from the embedded information interpretation module 606. It is checked whether the image information received from 610 matches.
Further, the embedded information area processing module 612 may check whether the image of the document has been altered based on a pixel block around the area where the embedded information image exists in the image of the document. Good.
Then, the inspection result is transmitted to the presentation module 616.

依存関係構造処理モジュール608は、埋め込み情報解釈モジュール606、提示モジュール616と接続されている。埋め込み情報解釈モジュール606から受け取った依存関係情報に基づいて、文書内の依存関係の連鎖を繋げた構造情報を作り、ユーザに文書内の依存関係構造を示す情報(検査結果等を含む)を作成する。その依存関係構造を示す情報を提示モジュール616へ送信する。   The dependency relationship structure processing module 608 is connected to the embedded information interpretation module 606 and the presentation module 616. Based on the dependency information received from the embedded information interpretation module 606, structure information that links the dependency relationships in the document is created, and information (including the inspection results) indicating the dependency structure in the document is created for the user. To do. Information indicating the dependency structure is transmitted to the presentation module 616.

対応関係処理モジュール614は、埋め込み情報解釈モジュール606、読み込み画像処理モジュール610、提示モジュール616と接続されている。埋め込み情報領域処理モジュール612の検査結果が適合である場合は、依存関係情報に基づいて、項目情報と系列情報の関係を検査する。また、項目情報が計算式を含む場合、依存関係情報に基づいて系列情報をその計算式に当てはめて計算式による検査を行うようにしてもよい。また、埋め込み情報領域処理モジュール612による埋め込み情報画像が表す情報と画像との検査結果が適合であって、埋め込み情報領域処理モジュール612による周辺の画素塊に関する検査結果が「改変されていない」である場合に、項目情報と系列情報の関係を検査するようにしてもよい。
具体的には、例えば、埋め込み情報解釈モジュール606から受け取った埋め込み画像情報の中の依存関係情報に基づいて、各関係の出現ごとに依存関係の種類や計算式にしたがって読み込み画像処理モジュール610によって処理された文書の画像情報の検査を実行する。検査結果を提示モジュール616へ送信する。
The correspondence processing module 614 is connected to the embedded information interpretation module 606, the read image processing module 610, and the presentation module 616. When the inspection result of the embedded information region processing module 612 is appropriate, the relationship between the item information and the series information is inspected based on the dependency relationship information. In addition, when the item information includes a calculation formula, the series information may be applied to the calculation formula based on the dependency relationship information, and the examination based on the calculation formula may be performed. Further, the inspection result of the information and the image represented by the embedded information image by the embedded information region processing module 612 is compatible, and the inspection result regarding the surrounding pixel block by the embedded information region processing module 612 is “not modified”. In this case, the relationship between the item information and the series information may be inspected.
Specifically, for example, based on the dependency relationship information in the embedded image information received from the embedded information interpretation module 606, the read image processing module 610 performs processing according to the type and calculation formula of the dependency for each appearance of each relationship. The image information of the printed document is inspected. The inspection result is transmitted to the presentation module 616.

提示モジュール616は、保持モジュール604、依存関係構造処理モジュール608、埋め込み情報領域処理モジュール612、対応関係処理モジュール614と接続されている。保持モジュール604から文書の画像情報を受け取り、その画像情報に関連付けて依存関係構造処理モジュール608、埋め込み情報領域処理モジュール612、対応関係処理モジュール614からの検査結果をディスプレイ等の表示装置に表示する。   The presentation module 616 is connected to the holding module 604, the dependency structure processing module 608, the embedded information area processing module 612, and the correspondence processing module 614. The image information of the document is received from the holding module 604, and the examination results from the dependency structure processing module 608, the embedded information area processing module 612, and the correspondence processing module 614 are displayed on a display device such as a display in association with the image information.

図7は、文書検査装置の処理例を示すフローチャートである。
ステップS702では、読み込みモジュール602が、スキャナなどを通して、媒体に印刷された文書の読み込み処理を行う。
ステップS704では、埋め込み情報解釈モジュール606が、埋め込み画像情報の解釈処理を行う。文書画像内に埋め込み画像情報を検出した場合、その埋め込み画像情報を解釈して、項目情報、系列情報、依存関係情報を抽出する処理を行う。この処理は埋め込み情報のデコード処理であり、採用した情報画像の埋め込み技術に応じて処理されるものである。
FIG. 7 is a flowchart illustrating a processing example of the document inspection apparatus.
In step S702, the reading module 602 reads a document printed on a medium through a scanner or the like.
In step S704, the embedded information interpretation module 606 performs an embedded image information interpretation process. When embedded image information is detected in the document image, the embedded image information is interpreted, and processing for extracting item information, series information, and dependency relationship information is performed. This process is a process of decoding embedded information, and is performed according to the employed information image embedding technique.

ステップS706では、埋め込み情報領域処理モジュール612が、領域検査処理を行う。埋め込み情報領域処理モジュール612は、読み込み画像処理モジュール610から文書画像内の検査該当領域の画像(項目情報、系列情報内の指定された領域、例えば、埋め込み情報画像が描画されていた領域の画像)を受け取る。ステップS704で抽出された項目情報、系列情報それぞれについて、読み出された領域情報の示す領域に描画されている図形や文字等の情報と、それぞれの項目情報、系列情報が表示しているはずの情報が適合するか否かを確認する。例えば、各項目情報、系列情報について、予め定められた又はその項目情報、系列情報内に指定された、印字データへの変換方式にしたがって印字データを作成する。そして、作成した印字データと受け付けた文書画像内の該当する領域内の画像とを比較することによって検査を行う。比較としては、例えば、両者の画像の排他的論理和によって差分を取り、その差分が予め定められた閾値以下であるか否かによって判断(その閾値以下であれば適合し、閾値より大である場合は改ざんの可能性がある)してもよい。その検査結果を提示モジュール616に送信する。印字データへの変換方式の情報としては、例えば、フォントの大きさや種類、文字の入れ替えルール、文字間距離、行間距離などのパラメータを含めておくようにしてもよい。
また、項目情報、系列情報から印字データへ変換して、文書画像内の該当領域内の画像とその印字データを比較することの他に、文書画像内の該当領域内の画像を文字認識して、その文字認識結果と項目情報、系列情報を比較するようにしてもよい。
In step S706, the embedded information area processing module 612 performs area inspection processing. The embedded information area processing module 612 reads from the read image processing module 610 an image of the inspection relevant area in the document image (item information, a specified area in the series information, for example, an image of an area where the embedded information image was drawn). Receive. For each item information and series information extracted in step S704, information such as graphics and characters drawn in the area indicated by the read area information, and each item information and series information should be displayed. Check if the information is relevant. For example, for each item information and series information, print data is created according to a conversion method to print data that is predetermined or specified in the item information and series information. Then, the inspection is performed by comparing the created print data with the image in the corresponding area in the received document image. For comparison, for example, a difference is obtained by exclusive OR of both images, and a determination is made based on whether or not the difference is equal to or less than a predetermined threshold (if it is equal to or less than the threshold, it is suitable and greater than the threshold) In some cases, there is a possibility of falsification). The inspection result is transmitted to the presentation module 616. The information on the conversion method to print data may include parameters such as font size and type, character replacement rules, distance between characters, and distance between lines.
In addition to converting item information and series information to print data and comparing the print data with the image in the corresponding area in the document image, character recognition is performed on the image in the corresponding area in the document image. The character recognition result may be compared with item information and series information.

ステップS708では、埋め込み情報領域処理モジュール612が、領域の周辺についての検査を行う。この検査処理では、各検査該当領域について予め定められた範囲の周囲を調査して文字や記号が配置されていないことの検査を行う。例えば、図4(b)に例示した調整欄420内の2段目の改ざん文字422b、3段目の改ざん文字423bのように、埋め込み情報画像422、423内に示された領域情報の範囲で印字データと項目の数値が適合していたとしても、ユーザには別の値の情報に見えるような仕組みを入れることを防ぐための処理である。例えば、領域情報が指定する矩形や多角形の領域を上下、左右等に予め定められた距離分だけ広げて、その広げた領域内に記号や数字などの画素塊が配置されているか否かの検査処理を行う。そして、検査結果を提示モジュール616に送信する。   In step S708, the embedded information area processing module 612 performs an inspection on the periphery of the area. In this inspection process, the surroundings of a predetermined range are examined for each inspection relevant region, and an inspection is made that no characters or symbols are arranged. For example, in the range of the area information shown in the embedded information images 422 and 423, like the second-stage falsified character 422b and the third-stage falsified character 423b in the adjustment column 420 illustrated in FIG. 4B. Even if the print data and the numerical value of the item match, this is a process for preventing the user from putting a mechanism that makes the information look like another value. For example, whether or not a rectangular or polygonal area specified by the area information is expanded by a predetermined distance vertically or horizontally, and whether or not pixel blocks such as symbols and numbers are arranged in the expanded area Perform the inspection process. Then, the inspection result is transmitted to the presentation module 616.

ステップS710では、対応関係処理モジュール614が、対応関係の検査を行う。つまり、依存関係情報に基づいて、項目情報と系列情報との対応関係の検査を行う。
図3に例示した文書300には、依存関係情報として表320の系列情報、表330の系列情報、表350の系列情報と式340の項目情報が関連付けられていることが、説明文315の埋め込み画像情報に記述されている。
これらの間で、属性種別情報、属性情報などの対応関係で適合するものを算出することにより、例えば、表350のA店の系列情報の各項目がそれぞれ、表330のA店の系列情報の各項目との間で式340と表320の調整欄の系列情報で関連付けられていることが検出される。
この検出された関係を式340と表320にしたがって計算処理を行って、関係式の確認処理(計算結果と表350の系列情報が適合するか否かの確認)を行い、依存関係情報にしたがって関係式の対応関係が確認されたか否かについて検査する。その検査結果を提示モジュール616に送信する。
In step S710, the correspondence processing module 614 checks the correspondence. That is, the correspondence between the item information and the series information is inspected based on the dependency relationship information.
In the document 300 illustrated in FIG. 3, it is embedded in the explanation 315 that the sequence information of the table 320, the sequence information of the table 330, the sequence information of the table 350, and the item information of the expression 340 are associated as dependency relationship information. Described in the image information.
Among these, by calculating the matching type of attribute type information, attribute information, etc., for example, each item of the affiliate information of the store A in the table 350 is each of the affiliate information of the store A in the table 330. It is detected that each item is associated with the expression 340 and the series information in the adjustment column of the table 320.
The detected relationship is calculated according to the formula 340 and the table 320, the relational expression is confirmed (checking whether the calculation result and the sequence information in the table 350 are compatible), and according to the dependency information. Inspect whether the relation of the relational expression is confirmed. The inspection result is transmitted to the presentation module 616.

ステップS712では、提示モジュール616が、検査結果の出力を行う。例えば、検査で異常が検出された領域の情報をディスプレイに表示してユーザに示す他に、検査で確認された領域の情報をユーザに表示して示すようにしてもよい。
特に、依存関係構造処理モジュール608によって作成された依存関係情報を用いて、文書内のテキスト記述等の中に含まれている依存関係の検査について、その検査で確認された領域を示す、又は検査が行われていない領域を示すようにしてもよい。これは、本実施の形態(文書検査装置)が検査したところ以外の領域に対して、ユーザが注意を集中して検査作業をし得るようにするためである。
In step S712, the presentation module 616 outputs the examination result. For example, in addition to displaying information on a region where an abnormality has been detected by inspection on a display and showing it to the user, information on a region confirmed by inspection may be displayed and displayed on the user.
In particular, the dependency information created by the dependency structure processing module 608 is used to indicate the region confirmed by the inspection or the inspection of the dependency included in the text description in the document. It may be possible to indicate an area where no is performed. This is because the user can concentrate the attention on the area other than the area inspected by the present embodiment (document inspection apparatus).

図8を参照して、本実施の形態の文書出力装置、文書検査装置のハードウェア構成例について説明する。図8に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部817と、プリンタなどのデータ出力部818を備えたハードウェア構成例を示している。   With reference to FIG. 8, a hardware configuration example of the document output apparatus and the document inspection apparatus according to the present embodiment will be described. The configuration shown in FIG. 8 is configured by a personal computer (PC), for example, and shows a hardware configuration example including a data reading unit 817 such as a scanner and a data output unit 818 such as a printer.

CPU(Central Processing Unit)801は、前述の実施の形態において説明した各種のモジュール、すなわち、領域情報算出モジュール116、成形モジュール114、埋め込み情報生成モジュール118、埋め込み情報解釈モジュール606、依存関係構造処理モジュール608、読み込み画像処理モジュール610、埋め込み情報領域処理モジュール612、対応関係処理モジュール614等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。   A CPU (Central Processing Unit) 801 includes various modules described in the above-described embodiments, that is, a region information calculation module 116, a molding module 114, an embedded information generation module 118, an embedded information interpretation module 606, and a dependency structure processing module. Reference numeral 608 denotes a control unit that executes processing according to a computer program describing an execution sequence of each module such as a read image processing module 610, an embedded information region processing module 612, a correspondence processing module 614, and the like.

ROM(Read Only Memory)802は、CPU801が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)803は、CPU801の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス804により相互に接続されている。   A ROM (Read Only Memory) 802 stores programs used by the CPU 801, operation parameters, and the like. A RAM (Random Access Memory) 803 stores programs used in the execution of the CPU 801, parameters that change as appropriate during the execution, and the like. These are connected to each other via a host bus 804 including a CPU bus.

ホストバス804は、ブリッジ805を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス806に接続されている。   The host bus 804 is connected to an external bus 806 such as a PCI (Peripheral Component Interconnect / Interface) bus via a bridge 805.

キーボード808、マウス等のポインティングデバイス809は、操作者により操作される入力デバイスである。ディスプレイ810は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。   A keyboard 808 and a pointing device 809 such as a mouse are input devices operated by an operator. The display 810 includes a liquid crystal display device or a CRT (Cathode Ray Tube), and displays various types of information as text or image information.

HDD(Hard Disk Drive)811は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU801によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、受け付けた文書情報、項目情報、系列情報、依存関係情報、読み込んだ文書の画像などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。   An HDD (Hard Disk Drive) 811 includes a hard disk, drives the hard disk, and records or reproduces a program executed by the CPU 801 and information. The hard disk stores received document information, item information, series information, dependency information, an image of the read document, and the like. Further, various computer programs such as various other data processing programs are stored.

ドライブ812は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体813に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース807、外部バス806、ブリッジ805、及びホストバス804を介して接続されているRAM803に供給する。リムーバブル記録媒体813も、ハードディスクと同様のデータ記録領域として利用可能である。   The drive 812 reads out data or a program recorded in a removable recording medium 813 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory, and reads the data or program as an interface 807 or an external bus 806. , And supplied to the RAM 803 connected via the bridge 805 and the host bus 804. The removable recording medium 813 can also be used as a data recording area similar to a hard disk.

接続ポート814は、外部接続機器815を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート814は、インタフェース807、及び外部バス806、ブリッジ805、ホストバス804等を介してCPU801等に接続されている。通信部816は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部817は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部818は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。   The connection port 814 is a port for connecting the external connection device 815, and has a connection unit such as USB or IEEE1394. The connection port 814 is connected to the CPU 801 and the like via the interface 807, the external bus 806, the bridge 805, the host bus 804, and the like. The communication unit 816 is connected to a network and executes data communication processing with the outside. The data reading unit 817 is a scanner, for example, and executes document reading processing. The data output unit 818 is, for example, a printer, and executes document data output processing.

なお、図8に示す文書出力装置、文書検査装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図8に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図8に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。   Note that the hardware configuration of the document output device and the document inspection device shown in FIG. 8 shows one configuration example, and the present embodiment is not limited to the configuration shown in FIG. 8 and will be described in the present embodiment. Any configuration can be used as long as the module can be executed. For example, some modules may be configured with dedicated hardware (for example, Application Specific Integrated Circuit (ASIC), etc.), and some modules are in an external system and connected via a communication line In addition, a plurality of systems shown in FIG. 8 may be connected to each other via communication lines so as to cooperate with each other. Further, it may be incorporated in a copying machine, a fax machine, a scanner, a printer, a multifunction machine (an image processing apparatus having any two or more functions of a scanner, a printer, a copying machine, a fax machine, etc.).

依存関係情報のテンプレートはユーザの操作によって作成するようにしてもよいが、例えば特開2009−093402号公報に開示されている方法などで、頻繁に使用される表現のパターンを抽出して用いるようにしてもよい。特開2009−093402号公報に開示されている方法を用いて、複数の実データを受け付け、パターン抽出を行い、一致する文字列を表現の細部まで抽出するようにしてもよい。つまり、処理対象となった文の各々を、語の列に分割するモジュールと、当該分割して得られた語の列に含まれる語を、(1)独立して、出力対象の語列の要素候補とする独立要素候補語と、(2)同一文節中の独立要素候補語とともに出力対象の語列の要素候補とする後接語と、(3)同一文節中の独立要素候補語に連接して出力対象の語列の要素とする前接語と、に分別するモジュールと、前記語の列から、前記独立要素候補語の少なくとも1つを要素候補として抽出するモジュールと、前記抽出した独立要素候補語と同一文節中に属する後接語から、要素候補となる語を抽出するモジュールと、前記抽出した要素候補を含む出力対象語列を決定するモジュールと、前記決定された出力対象語列を出力するモジュールと、を含む文書処理装置を用いてもよい。また、前記独立要素候補語の少なくとも1つを要素候補として抽出するモジュールは、前記語の列に含まれる独立要素候補語の各々が、前記処理対象となった文に現れる回数に基づいて、独立要素候補語の少なくとも1つを要素候補として抽出するようにしてもよい。前接語と、当該前接語と同一文節中の独立要素候補語とを連接した語列のうち、当該語列の前記処理対象となった文に現れる回数が予め定められた回数を超えるものを、要素候補として抽出するモジュールをさらに含むようにしてもよい。   The dependency information template may be created by a user operation. For example, a frequently used expression pattern may be extracted and used by a method disclosed in Japanese Unexamined Patent Application Publication No. 2009-093402. It may be. Using the method disclosed in Japanese Patent Laid-Open No. 2009-093402, a plurality of actual data may be received, pattern extraction may be performed, and matching character strings may be extracted to the details of the expression. In other words, a module that divides each sentence to be processed into word strings and words included in the word strings obtained by the division are (1) independently of the word strings to be output. An independent element candidate word as an element candidate, (2) a postfix word as an element candidate of an output target word string together with an independent element candidate word in the same phrase, and (3) a concatenation to an independent element candidate word in the same phrase A pre-word as an element of the word string to be output, a module for extracting at least one of the independent element candidate words as an element candidate from the word string, and the extracted independent A module for extracting a word as an element candidate from a suffix word belonging to the same phrase as the element candidate word, a module for determining an output target word string including the extracted element candidate, and the determined output target word string A document processing module including It may be used as the location. The module for extracting at least one of the independent element candidate words as an element candidate is based on the number of times each of the independent element candidate words included in the word string appears in the sentence to be processed. At least one of the element candidate words may be extracted as an element candidate. Of the word string that concatenates the antecedent word and the independent element candidate word in the same phrase as the antecedent word, the number of times that appears in the sentence that is the processing target of the word string exceeds a predetermined number of times May be further included as a component candidate.

本実施の形態では、系列情報として説明の簡単のために表のデータを用いたが、グラフとして表現された系列情報であってもよい。表では系列中の各個目の値が配置される位置が一次元方向に変化し、値の印字データが文字や数字の印刷イメージとなるのに対して、グラフでは各項目の配置位置が2次元的に変動することがあるため2次元的な位置にある情報を各項目に対応させて保持する。また、対応する印字データが数字や文字とは限らず、図形になることがある点が異なるが、本実施の形態では印字方式の情報を各データに保持するようにしてもよいので、この印字方式のバリエーションとして対応するようにしてもよい。   In the present embodiment, table data is used as sequence information for simplicity of explanation, but sequence information expressed as a graph may be used. In the table, the position where each individual value in the series is arranged changes in a one-dimensional direction, and the print data of the value becomes a print image of characters and numbers, whereas in the graph, the placement position of each item is two-dimensional. Therefore, information in a two-dimensional position is held corresponding to each item. Also, the corresponding print data is not limited to numbers and characters, but may differ from the print data. In this embodiment, the print method information may be held in each data. You may make it respond | correspond as a variation of a system.

また、本実施の形態では、埋め込み画像情報を合成して出力し、後に読み込まれる文書を紙等の媒体に印刷された文書として説明したが、PDF等の電子的な印刷イメージを持つ文書であってもよい。
なお、前述の文書出力装置と文書検査装置を組み合わせてもよく、各モジュールの処理内容として背景技術で説明した技術を採用してもよい。
In this embodiment, the embedded image information is synthesized and output, and the document read later is described as a document printed on a medium such as paper. However, the document is an electronic print image such as PDF. May be.
The document output device and the document inspection device described above may be combined, and the technology described in the background art may be adopted as the processing content of each module.

なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
The program described above may be provided by being stored in a recording medium, or the program may be provided by communication means. In that case, for example, the above-described program may be regarded as an invention of a “computer-readable recording medium recording the program”.
The “computer-readable recording medium on which a program is recorded” refers to a computer-readable recording medium on which a program is recorded, which is used for program installation, execution, program distribution, and the like.
The recording medium is, for example, a digital versatile disc (DVD), which is a standard established by the DVD Forum, such as “DVD-R, DVD-RW, DVD-RAM,” and DVD + RW. Standard “DVD + R, DVD + RW, etc.”, compact disc (CD), read-only memory (CD-ROM), CD recordable (CD-R), CD rewritable (CD-RW), Blu-ray disc ( Blu-ray Disc (registered trademark), magneto-optical disk (MO), flexible disk (FD), magnetic tape, hard disk, read-only memory (ROM), electrically erasable and rewritable read-only memory (EEPROM), flash Includes memory, random access memory (RAM), etc. .
The program or a part of the program may be recorded on the recording medium for storage or distribution. Also, by communication, for example, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), a wired network used for the Internet, an intranet, an extranet, etc., or wireless communication It may be transmitted using a transmission medium such as a network or a combination of these, or may be carried on a carrier wave.
Furthermore, the program may be a part of another program, or may be recorded on a recording medium together with a separate program. Moreover, it may be divided and recorded on a plurality of recording media. Further, it may be recorded in any manner as long as it can be restored, such as compression or encryption.

102…受付モジュール
104…項目定義モジュール
106…系列情報定義モジュール
108…依存関係定義モジュール
110…一時記憶モジュール
112…表示モジュール
114…成形モジュール
116…領域情報算出モジュール
118…埋め込み情報生成モジュール
120…出力モジュール
122…出力装置
602…読み込みモジュール
604…保持モジュール
606…埋め込み情報解釈モジュール
608…依存関係構造処理モジュール
610…読み込み画像処理モジュール
612…埋め込み情報領域処理モジュール
614…対応関係処理モジュール
616…提示モジュール
DESCRIPTION OF SYMBOLS 102 ... Reception module 104 ... Item definition module 106 ... Series information definition module 108 ... Dependency definition module 110 ... Temporary storage module 112 ... Display module 114 ... Molding module 116 ... Area information calculation module 118 ... Embedded information generation module 120 ... Output module DESCRIPTION OF SYMBOLS 122 ... Output device 602 ... Reading module 604 ... Holding module 606 ... Embedded information interpretation module 608 ... Dependency structure processing module 610 ... Reading image processing module 612 ... Embedded information area processing module 614 ... Corresponding relationship processing module 616 ... Presentation module

Claims (5)

画像を読み込む画像読込手段と、
前記画像読込手段によって読み込まれた画像内に埋め込まれた情報画像から情報を抽出する抽出手段と、
前記抽出手段によって抽出された情報と、前記情報画像が存在する領域と予め定められた位置関係にある画素塊とが適合するか否かを検査する第1の検査手段
を具備することを特徴とする情報処理装置。
Image reading means for reading an image;
Extracting means for extracting information from an information image embedded in the image read by the image reading means;
1st inspection means which inspects whether information extracted by the extraction means and a pixel block having a predetermined positional relationship with a region where the information image exists are matched. Information processing apparatus.
前記抽出手段は、前記画像読込手段によって読み込まれた画像内に埋め込まれた情報画像から、項目に関する情報である項目情報、系統だって並べられた一連の情報である系列情報、該項目情報と該系列情報との関係を示す関係情報を抽出し、
前記第1の検査手段の検査結果として適合である場合は、前記関係情報に基づいて、前記項目情報と前記系列情報の関係を検査する第2の検査手段
をさらに具備することを特徴とする請求項1に記載の情報処理装置。
The extraction means includes, from the information image embedded in the image read by the image reading means, item information that is information about items, series information that is a series of information arranged in a systematic manner, the item information and the series Extract relationship information that shows the relationship with the information,
2. The apparatus according to claim 1, further comprising: a second inspection unit that inspects a relationship between the item information and the sequence information based on the relationship information when the inspection result of the first inspection unit is suitable. Item 4. The information processing apparatus according to Item 1.
前記第2の検査手段は、前記項目情報が計算式を含む場合、前記関係情報に基づいて前記系列情報を該計算式に当てはめて該計算式による検査を行う
ことを特徴とする請求項2に記載の情報処理装置。
The said 2nd test | inspection means applies the said series information to this calculation formula based on the said relationship information, and performs the test | inspection by this calculation formula, when the said item information contains a calculation formula. The information processing apparatus described.
前記画像内に埋め込まれた情報画像が存在する領域の周辺にある画素塊に基づいて、前記画像が改変されているか否かを検査する第3の検査手段
をさらに具備し、
前記第2の検査手段は、前記第1の検査手段の検査結果として適合である場合であって、前記第3の検査手段の検査結果として改変されていない場合に、前記項目情報と前記系列情報の関係を検査する
ことを特徴とする請求項2又は3に記載の情報処理装置。
A third inspection unit for inspecting whether or not the image has been modified based on a pixel block around a region where the information image embedded in the image exists;
When the second inspection means is suitable as the inspection result of the first inspection means and is not modified as the inspection result of the third inspection means, the item information and the series information The information processing apparatus according to claim 2, wherein the information processing apparatus is inspected.
コンピュータを、
画像を読み込む画像読込手段と、
前記画像読込手段によって読み込まれた画像内に埋め込まれた情報画像から情報を抽出する抽出手段と、
前記抽出手段によって抽出された情報と、前記情報画像が存在する領域と予め定められた位置関係にある画素塊とが適合するか否かを検査する第1の検査手段
として機能させることを特徴とする情報処理プログラム。
Computer
Image reading means for reading an image;
Extracting means for extracting information from an information image embedded in the image read by the image reading means;
It is made to function as a first inspection means for inspecting whether or not the information extracted by the extraction means and a region where the information image is present match a pixel block having a predetermined positional relationship. Information processing program.
JP2009207079A 2009-09-08 2009-09-08 Apparatus and program for processing information Pending JP2011061358A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009207079A JP2011061358A (en) 2009-09-08 2009-09-08 Apparatus and program for processing information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009207079A JP2011061358A (en) 2009-09-08 2009-09-08 Apparatus and program for processing information

Publications (1)

Publication Number Publication Date
JP2011061358A true JP2011061358A (en) 2011-03-24

Family

ID=43948516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009207079A Pending JP2011061358A (en) 2009-09-08 2009-09-08 Apparatus and program for processing information

Country Status (1)

Country Link
JP (1) JP2011061358A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014131278A (en) * 2012-12-28 2014-07-10 Konicaminolta Laboratory Usa Inc Method of authenticating printed document

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014131278A (en) * 2012-12-28 2014-07-10 Konicaminolta Laboratory Usa Inc Method of authenticating printed document

Similar Documents

Publication Publication Date Title
JP5663866B2 (en) Information processing apparatus and information processing program
US8155945B2 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
US8391607B2 (en) Image processor and computer readable medium
JP2007006058A (en) Image processing apparatus, image processing method and computer program
US11670067B2 (en) Information processing apparatus and non-transitory computer readable medium
KR101248449B1 (en) Information processor, information processing method, and computer readable medium
JP2008054147A (en) Image processor and image processing program
JP2015005100A (en) Information processor, template generation method, and program
JP2009251872A (en) Information processing device and information processing program
US8749854B2 (en) Image processing apparatus, method for performing image processing and computer readable medium
JP5720182B2 (en) Image processing apparatus and image processing program
JP2011061358A (en) Apparatus and program for processing information
JP4518212B2 (en) Image processing apparatus and program
JP6007720B2 (en) Information processing apparatus and information processing program
JP4517822B2 (en) Image processing apparatus and program
JP6682827B2 (en) Information processing apparatus and information processing program
JP2007219682A (en) Information processor, information processing method, and computer program
JP2020030722A (en) Document image processing system, document image processing method, and document image processing program
JP2009223391A (en) Image processor and image processing program
JP6260181B2 (en) Information processing apparatus and information processing program
JP5928714B2 (en) Information processing apparatus and information processing program
JP2022178723A (en) Document image processing system, document image processing method, and document image processing program
JP4973536B2 (en) Image processing apparatus and image processing program
JP2019212209A (en) Character recognition device, method for character recognition, and program
JP2010039810A (en) Image processor and image processing program