JP5089524B2 - Document processing apparatus, document processing system, document processing method, and document processing program - Google Patents
Document processing apparatus, document processing system, document processing method, and document processing program Download PDFInfo
- Publication number
- JP5089524B2 JP5089524B2 JP2008202158A JP2008202158A JP5089524B2 JP 5089524 B2 JP5089524 B2 JP 5089524B2 JP 2008202158 A JP2008202158 A JP 2008202158A JP 2008202158 A JP2008202158 A JP 2008202158A JP 5089524 B2 JP5089524 B2 JP 5089524B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- rectangular area
- image data
- document processing
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Description
本発明は、文書処理装置、文書処理システム、文書処理方法、及び、文書処理プログラムに関する。 The present invention relates to a document processing apparatus, a document processing system, a document processing method, and a document processing program.
記入済みの紙帳票をスキャナ等のイメージデバイスを用いて読取り、記入内容に対しマーク認識、文字認識など各種認識処理を行うシステムがいくつか公知となっているが、帳票処理方法の設定に関しては、その帳票を作成した設計アプリケーションから行う場合がある。 There are some known systems that read completed paper forms using an image device such as a scanner and perform various recognition processes such as mark recognition and character recognition on the entered contents. There is a case where it is performed from the design application that created the form.
例えば、特許第3770656号公報(特許文献1)のように、処理対象帳票のイメージデータから表・枠・罫線などを抽出し、処理対象候補領域としてユーザに提示し、ユーザはその中から本来処理すべき処理対象領域を、マウスとキーボードを使用して選択することで帳票処理の設定を行うことが提案されている。 For example, as disclosed in Japanese Patent No. 3770656 (Patent Document 1), a table, a frame, a ruled line, etc. are extracted from the image data of the processing target form and presented to the user as processing target candidate areas, and the user originally processes the extracted data. It has been proposed to set a form processing by selecting a processing target region to be processed using a mouse and a keyboard.
また、特開2007−4523号公報(特許文献2)は、問題用紙を一度プリントアウトし、問題文の伏せたい部分、つまり回答をマーカで指定した後にスキャナで読ませることで、回答の文字列の抽出と回答文字列の消去を同時に行い、穴埋め問題を作成する方法が開示されている。
しかしながら、特許文献1の技術では、帳票の種類、および、帳票内の記入領域の数が増大すると、処理内容を設定しなければならないPC上の作業も増えてしまい、帳票処理設計者にも負担となる場合が多い。また、ツール毎に設定方法が異なる場合は、ツール毎に設定方法を覚えなければならない。したがって、できるだけ簡易に各種帳票処理設定が可能な方法が求められる。
However, in the technique of
また、特許文献2の技術では、どのような画像が入力されるかを予め知っておくことができないため、回答文字列で指定されたマーカの色を抽出するために、入力された画像の中の全ての領域を探索しなければならず、装置の処理効率が低下する恐れがある。
Further, in the technique of
本発明は、上記問題に鑑みてなされたものであり、帳票に係る画像データ(電子ファイル)を生成し、帳票の記入領域に相当する画像データの矩形領域に対して、属性情報の設定を容易にすることができる文書処理装置、文書処理システム、文書処理方法、及び、文書処理プログラムを提供することを目的とする。 The present invention has been made in view of the above problems, and generates image data (electronic file) related to a form, and easily sets attribute information for a rectangular area of image data corresponding to an entry area of the form. An object of the present invention is to provide a document processing apparatus, a document processing system, a document processing method, and a document processing program.
本発明の一局面の文書処理装置は、画像データの識別情報と、該識別情報に関連付けられた前記画像データの矩形領域に関する矩形領域情報とを含む矩形領域データを格納する第1記憶手段と、前記画像データが印刷された用紙に付されている前記識別情報を取得する取得手段と、前記取得手段により取得された識別情報に対応する矩形領域情報を、前記矩形領域データから読み出す読出手段と、前記読出手段により読み出された矩形領域情報に基づいて、前記画像データの矩形領域を特定する特定手段と、前記特定手段により特定された矩形領域内に示された色を含む特徴情報を抽出する抽出手段と、前記抽出手段により抽出された特徴情報に基づいて前記矩形領域に対する記入の条件を表す属性を示す属性情報を設定し、該属性情報を、前記矩形領域情報に関連付けて前記矩形領域データに書き込む設定手段と、を備える。 The document processing apparatus according to one aspect of the present invention includes a first storage unit that stores rectangular area data including identification information of image data and rectangular area information related to the rectangular area of the image data associated with the identification information; An acquisition unit that acquires the identification information attached to a sheet on which the image data is printed; a reading unit that reads rectangular area information corresponding to the identification information acquired by the acquisition unit from the rectangular area data ; Based on the rectangular area information read by the reading means, the specifying means for specifying the rectangular area of the image data, and the feature information including the color indicated in the rectangular area specified by the specifying means are extracted. extraction means, based on the feature information extracted by said extraction means sets the attribute information indicating an attribute representing the condition of entries for the rectangular region, the attribute information, In association with the serial rectangular area information and a setting means for writing the rectangular area data.
また、本発明の他の局面の文書処理システムは、ネットワークを介して接続された情報処理装置と文書処理装置とを備える文書処理システムであって、前記情報処理装置は、矩形領域を有する画像データを生成する生成手段と、前記生成手段により生成された画像データを前記文書処理装置に送信する送信手段と、を備え、前記文書処理装置は、前記情報処理装置から前記画像データを受信する受信手段と、前記受信手段により受信された画像データ毎に前記識別情報を付加する付加手段と、前記受信手段により受信された画像データを解析して、前記画像データの前記矩形領域を抽出する解析手段と、前記付加手段により付加された識別情報と、前記解析手段により抽出された矩形領域の矩形領域情報とを含む矩形領域データを格納する記憶手段と、前記画像データが印刷された用紙に付されている前記識別情報を取得する取得手段と、前記取得手段により取得された識別情報に対応する矩形領域情報を、前記矩形領域データから読み出す読出手段と、前記読出手段により読み出された矩形領域情報に基づいて、前記画像データの矩形領域を特定する特定手段と、前記特定手段により特定された矩形領域内に示された色を含む特徴情報を抽出する抽出手段と、前記抽出手段により抽出された特徴情報に基づいて前記矩形領域に対する記入の条件を表す属性を示す属性情報を設定し、該属性情報を、前記矩形領域情報に関連付けて前記矩形領域データに書き込む設定手段と、を備える。 A document processing system according to another aspect of the present invention is a document processing system including an information processing apparatus and a document processing apparatus connected via a network, and the information processing apparatus includes image data having a rectangular area. Generating means, and transmitting means for transmitting the image data generated by the generating means to the document processing apparatus, wherein the document processing apparatus receives the image data from the information processing apparatus. Adding means for adding the identification information for each image data received by the receiving means; analyzing means for analyzing the image data received by the receiving means and extracting the rectangular area of the image data; , serial to store the identification information added by said adding means, the rectangular area data including the rectangular area information of the rectangular region extracted by the analysis means Means, obtaining means said image data to obtain the identifying information attached to the print paper, the rectangular area information corresponding to the acquired identification information by the acquisition unit, read read from the rectangular region data Characteristic information including means, a specifying means for specifying the rectangular area of the image data based on the rectangular area information read by the reading means , and a color indicated in the rectangular area specified by the specifying means Extraction means for extracting, and attribute information indicating an attribute indicating an entry condition for the rectangular area based on the feature information extracted by the extraction means, and the attribute information is associated with the rectangular area information Setting means for writing to rectangular area data .
また、本発明に係る一局面の文書処理方法は、画像データの識別情報と、該識別情報に関連付けられた前記画像データの矩形領域に関する矩形領域情報とを含む矩形領域データを格納する記憶手段を備える文書処理装置における文書処理方法であって、前記画像データが印刷された用紙に付されている前記識別情報を取得する取得ステップと、前記取得ステップにより取得された識別情報に対応する矩形領域情報を、前記矩形領域データから読み出す読出ステップと、前記読出ステップにより読み出された矩形領域情報に基づいて、前記画像データの矩形領域を特定する特定ステップと、前記特定ステップにより特定された矩形領域内に示された色を含む特徴情報を抽出する抽出ステップと、前記抽出ステップにより抽出された特徴情報に基づいて前記矩形領域に対する記入の条件を表す属性を示す属性情報を設定し、該属性情報を、前記矩形領域情報に関連付けて前記矩形領域データに書き込む設定ステップと、を有する。 According to another aspect of the document processing method of the present invention, there is provided storage means for storing rectangular area data including identification information of image data and rectangular area information relating to the rectangular area of the image data associated with the identification information. A document processing method in a document processing apparatus comprising: an acquisition step of acquiring the identification information attached to a sheet on which the image data is printed; and rectangular area information corresponding to the identification information acquired by the acquisition step Reading from the rectangular area data , a specifying step for specifying the rectangular area of the image data based on the rectangular area information read by the reading step, and a rectangular area specified by the specifying step an extraction step of extracting feature information including the colors shown, based on the feature information extracted by the extraction step There by setting attribute information indicating an attribute representing the condition of entries for the rectangular region, the attribute information, having a setting step of writing to the rectangular area data in association with the rectangular area information.
なお、本発明の構成要素をコンピュータに実行させることができる文書処理プログラムに適用しても本発明の目的を達成することができる。 Note that the object of the present invention can also be achieved by applying the components of the present invention to a document processing program that can be executed by a computer.
本発明によれば、帳票に係る画像データを生成し、帳票の記入領域に相当する画像データの矩形領域に対して、属性情報の設定を容易にすることができる文書処理装置、文書処理システム、文書処理方法、及び、文書処理プログラムを提供することができる。 According to the present invention, a document processing apparatus, a document processing system, which can generate image data relating to a form and can easily set attribute information for a rectangular area of the image data corresponding to the entry area of the form, A document processing method and a document processing program can be provided.
以下、本発明の実施例を図面に基づいて説明する。 Embodiments of the present invention will be described below with reference to the drawings.
<文書処理システムの概要について>
図1は、本発明に係る文書処理システムにおける帳票設定シート作成についての概要を示す図である。以下、帳票設定シートを例に説明するが、帳票設定シートに限られることなく、電子的な画像データ上の任意の領域に属性情報を付与する場合であれば本発明を適用することができる。
<Overview of document processing system>
FIG. 1 is a diagram showing an outline of creating a form setting sheet in the document processing system according to the present invention. Hereinafter, the form setting sheet will be described as an example. However, the present invention is not limited to the form setting sheet, and the present invention can be applied to the case where attribute information is added to an arbitrary area on electronic image data.
図1に示す文書処理システムにおいて、まず、帳票作成者がPC(Personal Computer)上で作成した矩形領域を含む帳票デザインファイル101を文書処理装置100に送信する。文書処理装置100の設定画像作成手段410は、画像データ101から矩形領域を抽出し、また、帳票を識別するための識別子を付与し、識別子が付与された帳票デザインファイルを印刷して帳票設定シート102を出力する。ここで、帳票設定シートとは、識別子が付与された帳票デザインファイルを印刷した文書(用紙)のことをいう。
In the document processing system shown in FIG. 1, first, a
具体的には、まず、帳票作成者は、PC内のWord(登録商標)、Excel(登録商標)、Acrobat(登録商標)などの一般的な文書エディタを用いて、チェックボックスなどの矩形や、表形式の記入領域などを帳票用紙に見立てたエディタ内の領域に配置することで、帳票のレイアウトのデザイン(罫線や矩形などで記入欄を描いたもの)を行い、それを帳票デザインファイルとして保存する。 Specifically, first, the form creator uses a general document editor such as Word (registered trademark), Excel (registered trademark), or Acrobat (registered trademark) in the PC to check a rectangle such as a check box, Design the layout of the form (drawing entry fields with ruled lines, rectangles, etc.) by placing the tabular entry area in the editor area that looks like a form, and save it as a form design file To do.
次に、帳票作成者は先に作成した帳票デザインファイルを、ネットワークを介して文書処理装置100に送信する。帳票デザインファイルを受信した文書処理装置100は、設定画像作成手段410において、帳票デザインファイルの各ページの中から記入領域の候補となる領域を抽出し、その座標値(領域情報)を記憶媒体に保存した後に、各ページの領域情報を一意に特定できるよう各ページの識別子を発行する。
Next, the form creator transmits the previously created form design file to the
次に、文書処理装置100の設定画像作成手段410は、発行した帳票の識別子をQR(Quick Response)コード(登録商標)やバーコードなどのシンボルに符号化し、各ページに重畳した後に帳票デザインファイル101を印刷して帳票設定シート102を出力する。ここで、識別子をQRコード(登録商標)などのシンボルに符号化したが、識別子は必ずしも符号化する必要はなく、帳票を識別できるものであれば何でもよい。次に、帳票設定シート102を用いた属性情報設定、すなわち各記入領域に属性情報(以下、記入属性ともいう)を設定する流れについて説明する。
Next, the setting
図2は、本発明に係る文書処理システムにおける属性情報設定についての概要を示す図である。図2に示すように、文書処理装置100の属性情報設定手段420により、特徴が記入された帳票設定シート103をスキャンし、スキャンした画像から記入領域の特徴を抽出し、抽出した特徴に対応する記入属性を付与して記憶装置に保存する。
FIG. 2 is a diagram showing an outline of attribute information setting in the document processing system according to the present invention. As illustrated in FIG. 2, the
ここで、記入属性とは、各記入領域への記入が必須であるか否か、さらに記入時にマーク認識、文字認識、イメージ保存など、どのような処理を行うかを定義する情報を意味する。 Here, the entry attribute means information that defines whether or not entry in each entry area is indispensable, and what processing is performed such as mark recognition, character recognition, and image storage at the time of entry.
具体的には、帳票作成者は、印刷された帳票設定シート102内の各記入領域を、設定したい記入属性に対応した色の筆記具で塗り潰す。その後、文書処理装置100内のカラースキャナを用いてその帳票設定シート103をスキャンする。
Specifically, the form creator fills each entry area in the printed
この例では記入属性に対応した色を塗り潰すことについて説明したが、これに限られず、例えば、記入属性に対応した文字、記号、数字などを用いてもよい。また、色と文字、記号、数字の組み合わせ(例えば、赤字の数字など)を記入領域に記入するようにすれば、記入領域の特徴を抽出するときの誤検出を減らすことができる。 In this example, the color corresponding to the entry attribute has been painted. However, the present invention is not limited to this. For example, characters, symbols, numbers, or the like corresponding to the entry attribute may be used. In addition, if a combination of colors, letters, symbols, and numbers (for example, red numbers) is entered in the entry area, it is possible to reduce false detection when extracting the characteristics of the entry area.
次に、帳票設定シート103のスキャン画像(以降、「設定シート画像」ともいう)を取得した文書処理装置100は、属性情報設定手段420により、設定シート画像内から印刷時に重畳したQRコード(登録商標)などのシンボルを探し、それを復号することで帳票の識別子を取得し、その識別子を使用して記憶装置内にある(設定シート画像に対応した)記入領域候補の領域情報を取得する。
Next, the
次に、属性情報設定手段420は、取得した領域情報の座標を用いて、設定シート画像の記入領域を特定し、特定した記入領域内の塗り潰し色(記入領域の特徴)を抽出し、その色に対応する記入属性を領域情報に加え、再び記憶装置に保存する。
Next, the attribute
属性情報設定完了後、帳票利用者は属性情報が設定済みの帳票デザインファイルを印刷し、印刷した帳票(属性情報が設定済みの帳票デザインファイルを印刷した用紙)への記入後にスキャナを用いて文書処理装置100内の帳票処理手段104に入力する。記入済み帳票の画像を受信した帳票処理手段104は、保存済みの記入領域に対応する記入属性に従い、各記入領域内の記入有無のチェックや記入に対する処理を行い、その結果を保存する。
After the attribute information setting is completed, the form user prints the form design file with the attribute information set, fills in the printed form (paper with the form design file with the attribute information set), and then uses the scanner The data is input to the
<文書処理装置のハードウェア構成について>
本発明に係る文書処理装置のハードウェア構成について説明する。図3は、本発明に係る文書処理装置300のハードウェアの概略構成を示す図である。
<Hardware configuration of document processing apparatus>
A hardware configuration of the document processing apparatus according to the present invention will be described. FIG. 3 is a diagram showing a schematic hardware configuration of the
図3に示すように、文書処理装置300は、制御部301、主記憶部302、補助記憶部303、ネットワークI/F304、QRコード/バーコードリーダ部305、入力部306、表示部307、印刷部308、スキャナ部309、などにより構成されている。
As shown in FIG. 3, the
制御部301は、コンピュータの中で、各装置の制御やデータの演算、加工を行うCPUである。制御部301は、主記憶部302に記憶されたプログラムを実行する演算装置で、入力装置や記憶装置からデータを受け取り、演算、加工した上で、出力装置や記憶装置に出力する。
The
主記憶部302は、ROM(Read Only Memory)やRAM(Random Access Memory)などであり、制御部301が実行する基本ソフトウェアであるOSやアプリケーションソフトウェアなどのプログラムやデータを記憶又は1次保存する記憶装置である。
The
補助記憶部303は、HD(Hard Disk)などであり、アプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。また、補助記憶部303には、文書処理装置が管理する各種情報(例えば、ユーザ情報など)が格納され、データベース(DB:DataBase)、ファイルシステム(FS:File System)などの機能により管理される。
The
ネットワークI/F304は、有線及び/又は無線回線などのデータ伝送路により構築されたLAN(Local Area Network)、WAN(Wide Area Network)などのネットワークを介して接続された通信機能を有する周辺機器と当該文書処理装置などのインタフェースである。
A network I /
QRコード/バーコードリーダ部305は、記録媒体上に付されたQRコード(登録商標)やバーコードなどを読み込む機器である。
The QR code / bar
入力部306や表示部307は、キースイッチ(ハードキー)とタッチパネル機能(GUIのソフトウェアキーを含む:Graphical User Interface)を備えたLCD(Liquid Crystal Display)とから構成され、文書処理装置300が有する機能を利用する際のUI(User Interface)として機能する表示及び/又は入力装置である。
The
印刷部308は、C(シアン)、M(マゼンダ)、Y(イエロー)、K(ブラック)からなる画像データを受け取ると、インクジェット方式を用いて、受け取った画像データを記録媒体(印刷用紙)に出力(印刷)するプロッタ装置である。
When the
スキャナ部309は、CCD(Charge Coupled Devices)光電変換素子からなるラインセンサとA/Dコンバータとこれらを駆動する駆動回路を備え、原稿読み取り面(コンタクトガラス上)にセットされた原稿をスキャンすることでRGB各8ビットのデジタル画像データを生成(原稿から情報を読み取り電子化)する読取装置である。
The
このように、文書処理装置300は、主記憶部302や補助記憶部103などの記憶装置に格納されたプログラムを制御部301で実行し、制御信号(制御命令)を各装置へ送出すること(各装置を制御すること)で、文書処理装置が有するコピー、スキャナ、プリンタなどのアプリケーションを実現し、文書処理装置で管理する情報、又は文書処理装置が接続されたシステム内で管理する情報を処理することができる。
In this way, the
<実施例1に係る文書処理装置の主要機能構成について>
図4は、実施例1に係る文書処理装置の主要機能構成を示すブロック図である。図4に示すように、文書処理装置400は、帳票設定シートを作成する機能(設定画像作成手段410)と、帳票設定シートの記入領域に記入属性を設定する機能(属性情報設定手段420)とを含む。
<Main Functional Configuration of Document Processing Device According to
FIG. 4 is a block diagram illustrating the main functional configuration of the document processing apparatus according to the first embodiment. As shown in FIG. 4, the
まず、図4に示す点線で囲まれる設定画像作成手段410について説明する。設定画像作成手段410は、受信手段411、画像データ作成手段412、解析手段413、画像データ管理手段414、記憶手段415、出力手段416を含む。
First, the setting image creation means 410 surrounded by a dotted line shown in FIG. 4 will be described. The setting
受信手段411は、ネットワークを介して、帳票作成者によりPC401を用いて作成された帳票デザインファイルを受信し、受信した帳票デザインファイルを画像データ作成手段412に出力する。なお、帳票デザインファイルはネットワークを介して取得する以外にも、SDカードなどの記憶媒体を文書処理装置100に直接接続することで取得することも可能である。
The receiving
画像データ作成手段412は、受信手段411から帳票デザインファイルを取得すると、取得した帳票デザインファイルを解析手段413に出力する。また、画像データ作成手段412は、画像データ管理手段414から帳票の識別子を取得すると、識別子を符号化してQRコード(登録商標)を生成し、QRコード(登録商標)を帳票デザインファイルの各ページ画像に重畳することで印刷データを作成する。次に、画像データ作成手段412は、作成した印刷データを出力手段416に出力する。
When the image
解析手段413は、画像データ作成手段412から帳票デザインファイルを取得すると、取得した帳票デザインファイルをページ単位に分解し、各ページの中から記入領域の候補となる領域を、ページ単位の記入領域情報として抽出する。
When the
この抽出処理の例として、以下では帳票デザインファイルのデータ形式としてPDF(Portable Document Format)形式のものを扱う例について説明する。PDF形式では図形をベクター形式で表現することができる。PDF文書を読み込み、そのPDF文書内のページごとに記入領域候補抽出処理を行う。 As an example of this extraction process, an example of handling a PDF (Portable Document Format) format as the data format of the form design file will be described below. In the PDF format, a figure can be expressed in a vector format. A PDF document is read, and entry area candidate extraction processing is performed for each page in the PDF document.
図5は、記入領域候補抽出処理の一例を示す図である。図5中[1]は矩形領域抽出対象である帳票デザインファイル内のページで、文字情報と図形情報により構成されている。ここから図形情報だけを抽出したものが[2]である。ここでいう図形情報とはPDF形式のデータであれば、"re"、"m"、"l"といったパス構築オペレータで表現されているオブジェクトの情報のことである。 FIG. 5 is a diagram illustrating an example of the entry area candidate extraction process. In FIG. 5, [1] is a page in the form design file that is a rectangular area extraction target, and is composed of character information and graphic information. [2] is obtained by extracting only graphic information. In this case, the graphic information is information of an object expressed by a path construction operator such as “re”, “m”, and “l” in the case of PDF format data.
ここで、この図形情報は電子文書の内部的には[2']のように1つの長方形と3つの線分により表現されている。ここで、長方形を4つの線分に分解して図形情報を線分だけで表現したものが[3]となる。この7本の線分の組み合わせにより、図形情報中に存在するすべての矩形を探索する。この例では[4]のように5つの矩形領域が抽出された。 Here, this graphic information is represented by one rectangle and three line segments as in [2 ′] inside the electronic document. Here, the rectangle is divided into four line segments and the graphic information is expressed by only the line segments as [3]. By using the combination of these seven line segments, all rectangles existing in the graphic information are searched. In this example, five rectangular areas are extracted as shown in [4].
また、文字情報に特定の図形文字が存在する場合は、その図形文字の座標を取得することで矩形とする。ここでいう矩形文字とは「□」、「○」、「◇」のような、帳票において一般的にチェックボックスの役目として使われるような文字のことである。 Further, when a specific graphic character exists in the character information, a rectangle is obtained by acquiring the coordinates of the graphic character. The rectangular characters here are characters such as “□”, “◯”, and “◇” that are generally used as a check box role in a form.
以上より、記入領域候補抽出処理において抽出されたこの5つの矩形領域には、互いに重なりあう矩形の組み合わせが存在する。本実施例では、他の矩形を内包しない矩形には最小矩形であるという情報を付加し、他の矩形を内包する矩形には最小矩形でないという情報を付加する。 As described above, in these five rectangular areas extracted in the entry area candidate extraction process, there are combinations of rectangles that overlap each other. In the present embodiment, information that the minimum rectangle is added to a rectangle that does not contain another rectangle, and information that is not the minimum rectangle is added to a rectangle that contains another rectangle.
よって、図5に示す例では、図5の[4]に示すように5つの矩形が得られ、そのうち、図5の[5]に示すように3つが最小矩形であるという結果が得られる。ここで得られた最小矩形を、記入領域候補として、抽出された記入領域候補の領域情報(以下、記入領域情報という)をまとめて画像データ管理手段414に出力する。 Therefore, in the example shown in FIG. 5, five rectangles are obtained as shown in [4] in FIG. 5, and among them, the result is that three are the minimum rectangles as shown in [5] in FIG. The minimum rectangle obtained here is used as an entry area candidate, and the extracted entry area candidate area information (hereinafter referred to as entry area information) is collected and output to the image data management means 414.
以上の処理を、帳票デザインファイル内の各ページに対し実行し、帳票デザインファイルのページ数の数だけ、記入領域情報を画像データ管理手段414に出力する。また、前述した処理ではPDF形式のファイルを例に説明したが、この形式に限らず、ベクター情報を取り扱うことのできる電子ファイル形式であれば同様の処理を適用することができる。
The above processing is executed for each page in the form design file, and entry area information is output to the image
図4に戻り、画像データ管理手段414は、解析手段413から取得した記入領域情報を記憶手段415に保存し、各ページの記入領域を一意に特定するための識別子を発行する。さらに、画像データ管理手段414は、各ページに対して帳票の識別子を発行し、発行した帳票の識別子を画像データ作成手段412に出力する。
Returning to FIG. 4, the image
また、画像データ管理手段414は、この識別子による記入領域情報の検索を行う。画像データ管理手段414は、記入領域の識別子と記入領域情報を用いることで、その識別子に対応する記入領域情報が記憶手段415に既に存在するか否かを判断することができる。このとき、既に記入領域情報が記憶手段415に存在する場合は、画像データ管理手段414は、記入領域情報の上書き保存を行なって、記入領域情報の更新を行う。なお、画像データ管理手段414は、設定画像作成手段410、および属性情報設定手段420の両機能で用いられる。
Further, the image data management means 414 searches the entry area information by this identifier. The image data management means 414 can determine whether or not entry area information corresponding to the identifier already exists in the storage means 415 by using the entry area identifier and entry area information. At this time, if the entry area information already exists in the
記憶手段415は、帳票デザインファイルのページ毎に記入領域情報を保持する。図6は、記憶手段415が保持する記入領域情報の一例を示す図である。図6に示すテーブルの各行が一つの記入領域候補の領域情報に相当し、各記入領域候補の識別子番号と位置情報(x座標、y座標、幅、高さ)と属性とが格納される。
The
図6に示す例では、「識別子」は、帳票デザインファイルのページ毎に付与され、「番号」は、抽出された記入領域毎に付与される。「属性」は、記入領域を抽出した段階ではまだ情報が格納されていない。この「属性」については後述する。 In the example shown in FIG. 6, an “identifier” is assigned to each page of the form design file, and a “number” is assigned to each extracted entry area. In the “attribute”, information is not yet stored at the stage where the entry area is extracted. This “attribute” will be described later.
図4に戻り、出力手段416は、例えば印刷部308などであり、画像データ作成手段412から印刷データを取得すると、印刷データを印刷して帳票設定シートを出力する。このとき、図7に示すように記入領域候補を他の領域とは区別できるようにして出力してもよい。
Returning to FIG. 4, the
図7は、記入領域の強調処理の一例を示す図である。記入領域候補を強調した印刷処理を行いたい場合には、画像データ作成手段412内に加工手段を設ける。加工手段は、画像データ管理手段414から記入領域情報を取得して記入領域を特定し、この記入領域に係る罫線を太線に変更したり、記入領域以外の領域を薄い色(例えばグレー色)にしたりして、記入領域を強調する。 FIG. 7 is a diagram illustrating an example of an emphasis process for an entry area. When printing processing with emphasis on the entry area candidate is desired, processing means is provided in the image data creation means 412. The processing means acquires the entry area information from the image data management means 414, specifies the entry area, changes the ruled line related to the entry area to a thick line, or changes the area other than the entry area to a light color (for example, gray). Or highlight the entry area.
図4に示す画像データ作成手段412は、加工手段により加工された帳票デザインファイル(識別子付与済み)を出力手段416に出力すると、図7に示すように記入領域が強調された帳票設定シートが印刷されることになる。 When the image data creation means 412 shown in FIG. 4 outputs the form design file (identifier assigned) processed by the processing means to the output means 416, as shown in FIG. Will be.
これより、記入領域の強調処理を行なうことによって、帳票作成者は、どの領域に色を塗り潰せばよいか、又は、どの領域に記号、文字、又は数字を記入すればよいかが容易に認識できるようになる。 Thus, by performing the emphasis processing of the entry area, the form creator can easily recognize which area should be filled with color, or which area should be filled with symbols, characters, or numbers. It becomes like this.
また、画像データ作成手段412は、後述する記憶手段428が保持する記入属性と記入色との対応表(図8)を取得し、この対応表を印刷するために帳票デザインファイルに付加して出力手段416に出力してもよい。このとき、対応表は帳票設定シートのフロントページとして印刷されてもよいし、帳票設定シートの裏に印刷されてもよい。
Also, the image data creation means 412 obtains a correspondence table (FIG. 8) between entry attributes and entry colors held by the storage means 428, which will be described later, and adds the correspondence table to the form design file for printing. You may output to the
これより、帳票作成者は、記入属性と記入色との対応関係を覚えておく必要はなく、印刷された対応表を見ながら記入領域に記入属性の特徴(図8に示す例では記入色)を記入することができる。 Thus, the form creator does not need to remember the correspondence between the entry attribute and the entry color, and the feature of the entry attribute in the entry area while looking at the printed correspondence table (entry color in the example shown in FIG. 8). Can be filled in.
以上、設定画像作成手段410の主要機能について説明した。次に、属性情報設定手段420について説明する。属性情報設定手段420は、読取手段421、画像処理設定手段422、特徴抽出手段426、属性情報管理手段427、記憶手段428、画像データ管理手段414、記憶手段415を含む。
The main functions of the setting
読取手段421は、スキャナ部309などであり、記入領域に特徴が記入された帳票設定シートをスキャンし、帳票設定シートのスキャン画像である設定シート画像を取得し、画像処理設定手段422に出力する。
The
画像処理設定手段422は、取得手段423、特定手段424、設定手段425を含む。画像処理設定手段422は、読取手段421から設定シート画像を取得し、取得した設定シート画像に対して取得手段423により次の処理を行う。取得手段423は設定シート画像から帳票の識別子を取得し、取得した識別子を画像データ管理手段414に出力する。
The image
画像データ管理手段414は、画像処理設定手段422内の取得手段423から帳票の識別子を取得し、取得した識別子に対応する記入領域候補を、記憶手段415を参照することで取得する。画像データ管理手段414は、記憶手段415から取得した記入領域候補を特定手段424に出力する。ここで、記入領域候補とは、図6に示すような領域の位置情報を含んでいることとする。
The image
画像処理設定手段422内の特定手段424は、画像データ管理手段414から記入領域候補を取得し、取得した記入領域候補に基づいて設定シート画像内の記入領域を特定し、特定した記入領域の画像を切り抜いて特徴抽出手段426に出力する。なお、この特定手段424は、特徴抽出手段426により行われる処理としてもよい。
The specifying
特徴抽出手段426は、特定手段424から特定された記入領域の画像から特徴を抽出する。ここでは、記入領域の画像内の特徴として記入色を用いる。記入色を抽出するには、まず切り抜き画像全体に対し、メディアンフィルタ処理などの平滑化処理を実行し、記入色の細かい変動を取り除く。次に画像の各画素の色を赤・緑・青の三色に分解し、画像全体での赤・緑・青、それぞれのヒストグラムを作成する。以上の処理を一つの切り抜き画像に対して実行すると、3つのヒストグラムを作成する。このヒストグラムのそれぞれのピーク値を使って、再度一つの色に合成することで、一つの切り抜き画像の中の記入色を取得する。
The
次に、特徴抽出手段426は、記入領域の識別番号と抽出した特徴(ここでは記入色)とを属性情報管理手段427に出力する。なお、記入領域の画像の特徴として記号、文字、数字などを用いる場合は、OCR(Optical Character Reader)処理を行って、これらを認識するようにすればよい。
Next, the
属性情報管理手段427は、特徴抽出手段426から特徴(記入色)を取得すると、記憶手段428に保持されている記入属性と記入色との対応表を参照し、参照した取得した記入属性を、記入領域の識別番号と共に画像処理設定手段422内の設定手段425に出力する。
When the attribute
図8は、記憶手段428が保持する記入属性とリファレンス記入色との対応表の一例を示す図である。図8に示すように、記入属性とリファレンス記入色とが関連付けられている。例えば、「自由記述の必須記入領域」は「赤」、「チェックの必須記入領域」は「マゼンダ」と関連付けられている。
FIG. 8 is a diagram showing an example of a correspondence table between entry attributes held by the
実施例1では、記入領域内の特徴として記入色を用いるので、特徴抽出手段426から検索要求と共に記入色が入力されると、属性管理手段427は、記入色とリファレンス記入色との間で、赤/緑/青の各色成分の差の二乗を計算し、それらを合算することで、記入色とリファレンス記入色との「距離」を計算する。この記入色との「距離」の計算を、図8に示す対応表の各リファレンス記入色の全てに対して行い、最も記入色との「距離」が短いリファレンス記入色に対応する記入属性を取得し、取得した記入属性と記入領域の識別番号とを検索結果として設定手段425に出力する。
In the first embodiment, the entry color is used as the feature in the entry area. Therefore, when the entry color is input together with the search request from the
図4に戻り、画像処理設定手段422内の設定手段425は、属性情報管理手段427から取得した記入領域の識別番号と記入属性、及び、取得手段423から取得した帳票の識別子を画像データ管理手段414に出力する。
Returning to FIG. 4, the
画像データ管理手段414は、記憶手段415が保持する記入領域情報に対して、設定手段425から取得した記入属性を「属性」に書き込む。このとき、書き込む「属性」を含む記入領域情報は、設定手段425から取得した帳票の識別子に対応する記入領域情報であり、書き込む「属性」は、設定手段425から取得した各記入属性の識別番号に対応する「属性」である。
The image
図9は、「属性」に記入属性が書き込まれた(更新された)後の記入領域情報の一例を示す図である。図9に示すように記入領域の識別番号「1」に対応する記入属性は「1」であり、これより、記入領域「1」は「自由記述の必須記入領域」であることがわかる。なお、図9に示す記入領域情報は、図6に示す記入領域情報を更新した時の状態を表している。 FIG. 9 is a diagram illustrating an example of entry area information after the entry attribute is written (updated) in “attribute”. As shown in FIG. 9, the entry attribute corresponding to the identification number “1” of the entry area is “1”, which indicates that the entry area “1” is an “essential entry area for free description”. The entry area information shown in FIG. 9 represents a state when the entry area information shown in FIG. 6 is updated.
以上、実施例1に係る文書処理装置100の主要機能構成について説明したが、本発明に係る文書処理装置は前述した構成に限定されることはなく、各構成を組み合わせて1つの構成としたり、1つの構成を分離して2つの構成としたり、前述した処理内容を実現できるのであればいかなる構成をとってもよい。
The main functional configuration of the
<実施例1における帳票設定シート作成処理について>
図10は、実施例1における帳票設定シート作成を説明するためのシーケンス図である。ステップ101では、受信手段411は、PC401などから帳票デザインファイルを受信し、画像データ作成手段412に出力する。ステップ101に続いてステップ102に進み、画像データ作成手段412は、受信手段411から取得した帳票デザインファイルを解析手段413に出力する。
<Regarding Form Setting Sheet Creation Processing in
FIG. 10 is a sequence diagram for explaining the creation of the form setting sheet in the first embodiment. In
ステップ103に続いてステップ104に進み、解析手段413は、画像データ作成手段412から取得した帳票デザインファイルに対して領域抽出処理を行なって、矩形領域などを記入領域候補として抽出する。次にステップ105において、解析手段413は、抽出した記入領域候補を画像データ作成手段412に出力する。
Progressing to step 104 following
ステップ105に続いてステップ106に進み、画像データ作成手段412は、解析手段413から取得した記入領域候補を画像データ管理手段414に出力する。ステップ106に続いてステップ107に進み、画像データ管理手段414は、帳票デザインファイルのページ毎に帳票識別子を生成する。ステップ107に続いてステップ108、109に進み、画像データ管理手段414は、画像データ作成手段412から取得した記入領域候補と、生成した帳票識別子とを記憶媒体415に書き込んで保存させる。
Progressing to step 106 following
ステップ109に続いてステップ110に進み、記憶手段415は、画像データ管理手段414に保存完了を通知する。ステップ110に続いてステップ111に進み、画像データ管理手段414は、生成した帳票識別子を画像データ作成手段412に出力する。
Proceeding to step 110 following
ステップ111に続いてステップ112に進み、画像データ作成手段412は、画像データ管理手段414から取得した帳票識別子に対して符号化処理を行う。ここでは、QRコード(登録商標)を作成したりバーコードを作成したりする。なお、この処理は必ずしも必要ではない。
Progressing to step 112 following step 111, the image
ステップ112に続いてステップ113に進み、画像データ作成手段412は、符号化された帳票識別子を帳票デザインファイルに重畳することで印刷データを作成する。ステップ113に続いてステップ114に進み、画像データ作成手段412は、出力手段416に印刷データを出力する。
Progressing to step 113 following
ステップ114に続いてステップ115に進み、出力手段416は、画像データ作成手段412から取得した印刷データを印刷する。ステップ115に続いてステップ116に進み、出力手段416は、画像データ作成手段412に印刷が完了した旨通知する。
Progressing to step 115 following step 114, the output means 416 prints the print data acquired from the image data creation means 412. Progressing to step 116 following
<実施例1における属性情報設定処理について>
図11は、実施例1における属性情報設定処理を説明するためのシーケンス図である。なお、図11では、図4に示す特定手段424が行う処理については、特徴抽出手段426により行うものとして説明する。
<About Attribute Information Setting Processing in
FIG. 11 is a sequence diagram for explaining the attribute information setting process according to the first embodiment. In FIG. 11, the processing performed by the specifying
ステップ201、202において、読取手段421は、帳票作成者により記入領域に特徴が記入された帳票設定シートをスキャンし、スキャン画像(設定シート画像)を画像処理設定手段422に出力する。ステップ202に続いてステップ203、204、205に進み、画像処理設定手段422は、読取手段421から取得したスキャン画像に対して取得手段423を用いて帳票識別子を抽出し、抽出した帳票識別子を取得する。
In
ステップ205に続いてステップ206に進み、画像処理手段422は、取得手段423により抽出した帳票識別子を画像データ管理手段414に出力する。ステップ206に続いてステップ207に進み、画像データ管理手段414は、画像処理設定手段422から取得した帳票識別子に対応する記入領域候補を、記憶手段415から読み出すための要求を行う。
Progressing to step 206 following step 205, the image processing means 422 outputs the form identifier extracted by the acquisition means 423 to the image data management means 414. Proceeding to step 207 following
ステップ207に続いてステップ208に進み、記憶手段415が保持する記入領域情報から帳票識別子に対応する記入領域候補が読み出され、ステップ209において、記入領域候補が画像データ管理手段414に返される。
Progressing to step 208 following
ステップ209に続いてステップ210に進み、画像データ管理手段414は、記憶手段415から読み出した記入領域候補を画像処理設定手段422に出力する。ステップ210に続いてステップ211に進み、画像処理設定手段422は、画像データ作成手段414から取得した記入領域候補に加えてスキャン画像を特徴抽出手段426に出力する。
In
ステップ211に続いてステップ212に進み、特徴抽出手段426は、画像処理設定手段422から取得した記入領域候補に含まれる座標、幅、高さなどの情報から記入領域を特定する。次に、特徴抽出手段426は、特定した記入領域に対応するスキャン画像の領域を切り出し、切り出した領域の特徴を抽出する。ここでは、記入色を抽出するとする。ステップ213において、特徴抽出手段426は、抽出した記入色と記入領域候補に含まれる記入領域識別子(図6に示す「番号」)とを属性情報管理手段427に出力する。
Proceeding to step 212 following
ステップ213に続いてステップ214、215に進み、属性情報管理手段427は、特徴抽出手段426から取得した記入色に対応する記入属性の読み出し要求を記憶手段428に行う。記入属性の読み出しに係る処理としては、前述したとおり、抽出した記入色と、記憶手段428が保持する対応表のリファレンス記入色との距離を算出し、一番距離が短いリファレンス記入色に対応する記入属性を読み出す。
Proceeding to step 214 or 215 following
ステップ215に続いてステップ216に進み、属性情報管理手段427は、記憶手段428から読み出した記入属性と、特徴抽出手段426から取得した記入領域識別子とを関連付けて画像処理設定手段422に出力する。
Proceeding to step 216 following
ステップ216に続いてステップ217に進み、画像処理設定手段422は、帳票識別子と、属性情報管理手段427から取得した記入領域識別子と記入属性とを画像データ管理手段414に出力する。
Proceeding to step 217 following step 216, the image
ステップ217に続いてステップ218、219に進み、画像データ管理手段414は、画像処理設定手段422から取得した帳票識別子と記入領域識別子とに基づいて、記憶手段415に保持される記入領域情報の「属性」に属性情報を書き込む(更新する)。具体的には、帳票識別子に基づいて図6に示すような記入領域情報を特定し、記入領域情報に含まれる記入領域識別子に対応する「属性」に、画像処理設定手段422から取得した記入属性を記憶手段415に書き込む。
Progressing to
ステップ219に続いてステップ220に進み、画像データ管理手段414は、記憶手段415から記入領域情報の更新が完了したことを通知される。ステップ221において、画像データ管理手段414は、画像処理設定手段422に対して記入領域情報の更新が完了したことを通知する。
Proceeding to step 220 following step 219, the image data management means 414 is notified from the storage means 415 that the update of the entry area information has been completed. In
以上、実施例1によれば、帳票に係る画像データを生成し、帳票の記入領域に相当する画像データの矩形領域に対して、属性情報の設定を容易にすることができる。 As described above, according to the first embodiment, image data relating to a form can be generated, and attribute information can be easily set for a rectangular area of image data corresponding to a form entry area.
また、帳票デザインファイルを印刷する場合、抽出した記入領域を、記入領域以外の領域とは区別できるように印刷することで、帳票作成者は、どの領域に、属性情報に対応する特徴を記入すればよいかが容易に認識できるようになる。 Also, when printing a form design file, the form creator prints out the extracted entry area so that it can be distinguished from areas other than the entry area, so that the form creator can enter the characteristics corresponding to the attribute information in any area. It becomes easy to recognize what should be done.
また、帳票デザインファイルを印刷する場合、記入属性と特徴(実施例1の例では記入色)との対応表を合わせて印刷するようにすることにより、帳票作成者はこの対応関係を覚えておく必要はなく、対応関係を見ながら、属性情報(記入属性)に対応する特徴を記入領域に記入していくことができる。 In addition, when the form design file is printed, the form creator remembers this correspondence by printing a correspondence table of entry attributes and features (entry color in the example of Embodiment 1) together. The feature corresponding to the attribute information (entry attribute) can be entered in the entry area while looking at the correspondence.
実施例2における文書処理装置は、帳票デザインファイルを印刷して帳票設定シートを作成する際、設定色指定領域を設けることで、記入属性と、記入属性に対応する特徴との対応関係を新規に作成したり更新したりすることができる。 When the document processing apparatus according to the second exemplary embodiment creates a form setting sheet by printing a form design file, a setting color designation area is provided to newly establish a correspondence relationship between an entry attribute and a feature corresponding to the entry attribute. Can be created or updated.
<実施例2に係る文書処理装置の主要機能構成について>
図12は、実施例2に係る文書処理装置の主要機能構成を示すブロック図である。ここで、図12に示す構成において、図4と同様の構成には図4と同じ符号を付しその説明を省略する。
<Main Functional Configuration of Document Processing Apparatus According to Second Embodiment>
FIG. 12 is a block diagram illustrating the main functional configuration of the document processing apparatus according to the second embodiment. Here, in the configuration shown in FIG. 12, the same reference numerals as those in FIG.
図12に示すように、文書処理装置500は、設定画像作成手段510と属性情報設定手段520とを含む。設定画像作成手段510について、実施例1と異なるところは、属性情報管理手段511を含むことである。
As illustrated in FIG. 12, the
属性情報管理手段511は、実施例1の属性情報管理手段427に加えて特徴指定領域を設けるための初期情報を保持している。図13は、属性情報管理手段511が保持する特徴指定領域601の初期情報の一例を示す図である。図13に示す例では、設定させるための特徴として色(以下、設定色という)を用いている。図13に示す初期情報により、後述する図14に示す設定色を記入(塗り潰し)させるためのボックス602に対応する「表示文字列」、指定領域内における「表示位置」を特定することができる。
The attribute
なお、「表示位置」については、相対的な位置情報ではなく、後述する図14に示す設定色指定領域601内における具体的な座標で表してもよい。 The “display position” may be expressed not by relative position information but by specific coordinates in the set color designation area 601 shown in FIG.
画像データ管理手段414は、属性情報管理手段511から図13に示すような初期情報を取得し、画像データ作成手段412に出力する。これより、画像データ作成手段412は、取得した設定色指定領域601の情報に基づいて、帳票デザインファイルに設定色指定領域601を付加することができる。
The image
図14は、設定色指定領域601を追加する処理の一例を示す図である。図14に示すように、印刷された帳票設定シートの下部には、設定色指定領域601が付加されている。なお、この設定色指定領域601は図13に示す所期情報に基づいて作成されている。例えば、設定色指定領域601における左上のボックスには、「必須記入領域(自由記述)」が印刷されている。また、設定色指定領域における右上のボックスには、「必須記入領域(チェック)」が印刷されている。 FIG. 14 is a diagram illustrating an example of a process for adding the set color designation area 601. As shown in FIG. 14, a setting color designation area 601 is added to the lower part of the printed form setting sheet. This set color designation area 601 is created based on the expected information shown in FIG. For example, “required entry area (free description)” is printed in the upper left box in the set color designation area 601. In the upper right box in the set color designation area, “required entry area (check)” is printed.
これより、設定色指定領域601内で抽出された特徴(記入色)の位置に基づいて、どの記入属性に対応する特徴(記入色)であるのかを判断することができる。 Thus, based on the position of the feature (entry color) extracted in the set color designation area 601, it can be determined which feature (entry color) corresponds to which entry attribute.
また、設定色指定領域601の領域情報は、記憶手段415に保存される。図15は、記憶手段415が保持する設定色指定領域601の領域情報の一例を示す図である。図15(a)は、記入領域情報と同じように格納される場合を示している。このとき、設定色指定領域601であることを示す情報が必要になるので、「設定」という項目を設けて、この「設定」にフラグが立っている領域が、設定色指定領域601であることを示すことにする。図15(a)に示す例では、領域番号「n」の領域が設定色指定領域を表している。
The area information of the set color designation area 601 is stored in the
また、図15(b)は、図6に示す記入領域情報とは別に設定色指定領域601の領域情報を設ける場合を示している。図15(b)に示すように、記入領域情報と設定色指定領域601とを区別して保存する場合は、設定色指定領域601の位置情報のみを保存すればよい。 FIG. 15B shows a case where the area information of the set color designation area 601 is provided separately from the entry area information shown in FIG. As shown in FIG. 15B, when the entry area information and the set color designation area 601 are stored separately, only the position information of the set color designation area 601 needs to be saved.
次に、図12に戻り、文書処理装置500における属性情報設定手段520について説明する。実施例1と異なるところは、属性情報更新手段521が新たに設けられていることである。属性情報更新手段521は、特徴抽出手段426の特徴抽出処理を行うことができるよう構成されている。
Next, returning to FIG. 12, the attribute
属性情報更新手段521は、スキャン画像と設定色指定領域601の領域情報とを画像処理設定手段422から取得する。このとき、画像処理設定手段422は、画像データ管理手段414を介して、記憶手段415から事前に設定色指定領域601の領域情報を取得しておく。また、属性情報更新手段521は、属性情報管理手段511が保持する初期情報についても画像処理設定手段422を介して取得する。
The attribute
次に、属性情報更新手段521は、設定色指定領域601の領域情報に基づいて設定色指定領域601の領域を特定し、初期情報に基づいて設定色が記入されている位置を特定し、設定色を抽出する。属性情報更新手段521は、抽出した設定色を記入属性毎に記憶手段428が保持する対応表に書き込む。
Next, the attribute
<実施例2における帳票設定シート作成処理について>
図16は、実施例2における帳票設定シート作成処理を説明するためのシーケンス図である。図16に示す処理において、図10と同様の処理を行うものは図10と同じ符号を付し、その説明を省略する。
<Regarding Form Setting Sheet Creation Processing in
FIG. 16 is a sequence diagram for explaining the form setting sheet creation process according to the second embodiment. In the processing shown in FIG. 16, the same reference numerals as those in FIG. 10 are given to those performing the same processing as in FIG.
ステップ301において、画像データ作成手段412は、属性情報管理手段511に対して、特徴指定領域の初期情報(実施例2では設定色指定領域の初期情報)の取得要求を行なう。ステップ301に続いてステップ302に進み、属性情報管理手段511は、保持している特徴指定領域の初期情報を画像データ作成手段412に出力する。
In
ステップ303において、画像データ作成手段412は、属性情報管理手段511から取得した特徴指定領域の初期情報に基づく特徴指定領域を帳票デザインファイルに付加して印刷データを生成する。以降、この印刷データを出力手段416により印刷処理を行わせれば、図14に示すような設定色指定領域が付加された帳票設定シートを取得することができる。
In
<実施例2における属性情報設定処理について>
図17は、実施例2における属性情報設定処理を説明するためのシーケンス図である。図17に示す処理において、図11と同じ処理をするものは図11と同じ符号を付し、その説明を省略する。
<About Attribute Information Setting Processing in
FIG. 17 is a sequence diagram for explaining the attribute information setting process according to the second embodiment. In the processing shown in FIG. 17, the same reference numerals as those in FIG. 11 are assigned to the same processing as in FIG.
ステップ401において、画像データ管理手段414は、記憶手段415から特徴指定領域情報と記入領域候補を読み出して取得する。ステップ401に続いてステップ402に進み、画像データ管理手段414は、記憶手段415から取得した特徴指定領域情報と記入領域候補とを画像処理設定手段422に出力する。
In
ステップ402に続いてステップ403に進み、画像処理設定手段422は、画像データ管理手段414から取得した特徴領域指定情報とスキャン画像とを属性情報更新手段521に出力する。
Progressing to step 403 following
ステップ403に続いてステップ404、405に進み、属性情報更新手段521は、特徴領域指定情報からスキャン画像における特徴指定領域を特定し、特定した特徴指定領域から初期情報に基づいて記入属性に対応する特徴を抽出し、抽出した特徴を記憶手段428が保持する対応表に上書きする(更新処理)。
Proceeding to Steps 404 and 405 following Step 403, the attribute
なお、ここでは、属性情報更新手段521は、特徴指定領域の初期情報を予め保持していることとするが、属性情報管理手段511から適宜取得するようにしてもよい。
Here, the attribute
ステップ405に続いてステップ406に進み、記憶手段428は対応表の特徴の更新が終了すると属性情報更新手段521に対して、対応表の更新が完了したことを通知する。ステップ406に続いてステップ407に進み、属性情報更新手段521は、記憶手段428から更新完了通知を取得すると、画像処理手段422に対応表の更新が完了したことを通知する。以降の処理については、更新された対応表に基づいて属性情報の設定処理が行われる。
Proceeding to step 406 following step 405, the
以上、実施例2によれば、帳票作成者が設定色指定領域601に記入した設定色に基づいて、記憶手段428に保持される対応表を更新することができる。また、更新された対応表に基づいて属性情報が設定されるので、帳票作成者が設定した特徴を用いて属性情報を設定することが可能となり、帳票作成者にとっての利便性が向上したと言える。
As described above, according to the second embodiment, the correspondence table held in the
[変形例1]
変形例1に係る文書処理装置について説明する。変形例1では、受信手段411が受信した画像データから矩形領域を抽出するだけではなく、読取手段421により取得したスキャン画像からも矩形領域を抽出する。
[Modification 1]
A document processing apparatus according to
解析手段413は、前述した記入領域候補抽出処理以外にも、スキャン画像に対してOCR処理を施してレイアウト解析を行い、記入領域候補を抽出するようにする。このとき、解析手段413は、受信手段411から画像データを取得した場合は前述した記入領域候補抽出処理を行い、読取手段421からスキャン画像を取得した場合はOCR処理を行うというように処理を切り替える。
In addition to the entry area candidate extraction process described above, the
画像データ管理手段414によりスキャン画像にも帳票の識別子を割り振ることで、以降の処理は前述した処理と同様に行うことができ、本発明の目的を達成することができる。 By assigning the form identifier to the scanned image by the image data management means 414, the subsequent processing can be performed in the same manner as the processing described above, and the object of the present invention can be achieved.
また、識別子が付与された帳票設定シートに矩形領域を手書きで追加して帳票設定シートを修正する場合は以下の処理を行う。まず、修正後の帳票設定シートを読取手段421にスキャンさせ、取得手段423により識別子を取得させ、取得された識別子と同じ識別子が記憶手段415にあるときには、OCR処理を行って記入領域候補を抽出し、抽出した記入領域候補を記憶手段415に上書きする。
Further, when a form setting sheet is corrected by adding a rectangular area to the form setting sheet to which the identifier is assigned, the following processing is performed. First, the corrected form setting sheet is scanned by the
これより、容易に帳票設定シートの修正を行うことができる。なお、帳票設定シートをスキャンさせるときには、帳票設定シートの修正処理を行うのか、属性情報設定処理を行うのかのモード設定を行うことにより、明示的にこれらの処理を分けて行うことができるようにすればよい。 Thus, the form setting sheet can be easily corrected. Note that when scanning a form setting sheet, it is possible to explicitly perform these processes separately by setting the mode setting for whether to perform form setting sheet correction processing or attribute information setting processing. do it.
また、帳票設定シートの修正の別の例としては、属性情報設定処理を行うときに、記入領域候補のみの特徴抽出でいいかどうかを帳票作成者に確認させるようにしてもよい。このとき、記入領域候補以外の領域も特徴抽出することを帳票作成者により選択された場合、特徴抽出手段426は、記入領域候補以外の領域も特徴抽出することで、帳票作成者が記入領域以外にも特徴を記入した領域を抽出することができる。
As another example of the correction of the form setting sheet, the form creator may be made to confirm whether or not the feature extraction of only the entry area candidate may be performed when the attribute information setting process is performed. At this time, when the form creator selects to extract features other than the entry area candidates, the
次に、記入領域以外に特徴が抽出された領域の位置情報等を記憶手段415に追加で記憶する。これより、帳票に係る画像データを容易に修正することができる。このとき、新たに抽出された領域に関しては、領域の特徴も抽出されているので、この領域に記入された特徴に対応する記入属性も合わせて記憶手段415に保存するようにすればよい。これより、再度の特徴抽出は不要となる。
Next, the
以上、本発明の実施例について詳述したが、本発明は係る特定の実施例に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、上記変形例以外にも種々の変形・変更が可能である。また、上記各実施例、変形例を組み合わせて1つの構成することも可能である。その際は、それぞれに対応する各モードを設けて、帳票作成者にモードを選択させて処理を実行させるようにすればよい。 Although the embodiments of the present invention have been described in detail above, the present invention is not limited to such specific embodiments, and other than the above-described modifications within the scope of the gist of the present invention described in the claims. In addition, various modifications and changes can be made. Moreover, it is also possible to configure one by combining the above embodiments and modifications. In that case, each mode corresponding to each may be provided so that the form creator can select the mode and execute the process.
また、上記実施例及び変形例において、文書処理装置は出力手段411、読取手段421を備える構成としたが、出力手段411、読取手段421を外部に設けて、文書処理装置はこれらから電子データを受信する構成とすることもできる。
In the above-described embodiments and modifications, the document processing apparatus is configured to include the
なお、各実施例及び変形例において説明した処理内容をプログラムとし、このプログラムをコンピュータに実行させて前述した処理を文書処理装置に実行させることも可能である。また、このプログラムを記録媒体に記録し、このプログラムが記録された記録媒体をコンピュータに読み取らせて、前述した処理を文書処理装置に実行させることも可能である。 It should be noted that the processing content described in each embodiment and modification may be a program, and the program may be executed by a computer to cause the document processing apparatus to execute the processing described above. It is also possible to record the program on a recording medium, cause the computer to read the recording medium on which the program is recorded, and cause the document processing apparatus to execute the processing described above.
100、200、300、400、500 文書処理装置
101 帳票デザインファイル(画像データ)
102 帳票設定シート
103 設定シート画像
301 制御部
302 主記憶部
303 補助記憶部
304 ネットワークI/F部
305 QRコード/バーコードリーダ部
306 入力部
307 表示部
308 印字部
309 スキャナ部
401 PC
410、510 設定画像作成手段
411 受信手段
412 画像データ作成手段
413 解析手段
414 画像データ管理手段
415、428 記憶手段
416 出力手段
420、520 属性情報設定手段
421 読取手段
422 画像処理設定手段
423 取得手段
424 特定手段
425 設定手段
426 特徴抽出手段
427、511 属性情報管理手段
521 属性情報更新手段
601 設定色指定領域
602 ボックス
100, 200, 300, 400, 500
102
410, 510 Setting image creation means 411 Reception means 412 Image data creation means 413 Analysis means 414 Image data management means 415, 428 Storage means 416 Output means 420, 520 Attribute information setting means 421 Reading means 422 Image processing setting means 423 Acquisition means 424 Identification means 425 Setting means 426 Feature extraction means 427, 511 Attribute information management means 521 Attribute information update means 601 Setting color designation area 602 Box
Claims (10)
前記画像データが印刷された用紙に付されている前記識別情報を取得する取得手段と、
前記取得手段により取得された識別情報に対応する矩形領域情報を、前記矩形領域データから読み出す読出手段と、
前記読出手段により読み出された矩形領域情報に基づいて、前記画像データの矩形領域を特定する特定手段と、
前記特定手段により特定された矩形領域内に示された色を含む特徴情報を抽出する抽出手段と、
前記抽出手段により抽出された特徴情報に基づいて前記矩形領域に対する記入の条件を表す属性を示す属性情報を設定し、該属性情報を、前記矩形領域情報に関連付けて前記矩形領域データに書き込む設定手段と、
を備える文書処理装置。 First storage means for storing rectangular area data including identification information of image data and rectangular area information related to the rectangular area of the image data associated with the identification information;
Obtaining means for obtaining the identification information attached to the paper on which the image data is printed;
Reading means for reading rectangular area information corresponding to the identification information acquired by the acquiring means from the rectangular area data ;
Identifying means for identifying a rectangular area of the image data based on the rectangular area information read by the reading means;
Extracting means for extracting feature information including the color indicated in the rectangular area specified by the specifying means;
Set the attribute information indicating an attribute representing the condition of entries for the rectangular area based on the feature information extracted by the extraction means, the attribute information, in association with the rectangular area information written in the rectangular area data setting means When,
A document processing apparatus comprising:
前記受信手段により受信された画像データ毎に前記識別情報を付加する付加手段と、
前記受信手段により受信された画像データを解析して、前記画像データの前記矩形領域を抽出する解析手段と、
前記付加手段により付加された識別情報と、前記解析手段により抽出された矩形領域の矩形領域情報とを関連付けて前記矩形領域データに書き込む書込手段と、
前記識別情報が付加された画像データを印刷する出力手段と、
を備える請求項1記載の文書処理装置。 Receiving means for receiving the image data;
An adding means for adding the identification information for each image data received by the receiving means;
Analyzing the image data received by the receiving means, and extracting the rectangular area of the image data;
A writing means for associating the identification information added by the adding means with the rectangular area information of the rectangular area extracted by the analyzing means, and writing it in the rectangular area data ;
Output means for printing the image data to which the identification information is added;
A document processing apparatus according to claim 1.
前記設定手段は、前記属性データから、前記抽出手段により抽出された特徴情報に対応する前記属性情報を取得し、取得した属性情報を設定する請求項1又は2記載の文書処理装置。 Second storage means for storing attribute data associating the attribute information with the feature information;
The document processing apparatus according to claim 1, wherein the setting unit acquires the attribute information corresponding to the feature information extracted by the extraction unit from the attribute data , and sets the acquired attribute information.
前記画像データを印刷する場合、前記第2記憶手段に格納される属性データも印刷する請求項3記載の文書処理装置。 The output means includes
4. The document processing apparatus according to claim 3, wherein when the image data is printed, the attribute data stored in the second storage means is also printed.
前記書込手段は、さらに、前記特徴設定領域に関する特徴設定領域情報を前記識別情報に関連付けて前記矩形領域データに書き込み、
前記読出手段は、さらに、前記取得手段により取得された識別情報に対応する特徴設定領域情報を読み出し、
前記特定手段は、さらに、前記読出手段により読み出された特徴設定領域情報に基づいて、前記画像の特徴設定領域を特定し、
前記抽出手段は、さらに、前記特定手段により特定された特徴設定領域に設定された前記属性情報と前記特徴情報との対応関係を抽出し、
前記設定手段は、前記抽出手段により抽出された対応関係と前記特徴情報とに基づいて、前記矩形領域毎に前記属性情報を設定する請求項2記載の文書処理装置。 The adding means further adds a feature setting area for setting a correspondence relationship between the attribute information and the feature information to the image data,
The writing means further writes feature setting area information relating to the feature setting area to the rectangular area data in association with the identification information,
The reading means further reads feature setting area information corresponding to the identification information acquired by the acquiring means,
The specifying means further specifies a feature setting area of the image based on the feature setting area information read by the reading means,
The extraction unit further extracts a correspondence relationship between the attribute information and the feature information set in the feature setting area specified by the specifying unit,
The document processing apparatus according to claim 2, wherein the setting unit sets the attribute information for each rectangular area based on the correspondence relationship extracted by the extraction unit and the feature information.
前記印刷手段は、前記加工手段により加工された画像データを印刷する請求項2乃至5いずれか一項に記載の文書処理装置。 Processing means for processing the image data so that a rectangular area of the image data can be distinguished from an area other than the rectangular area;
The document processing apparatus according to claim 2, wherein the printing unit prints the image data processed by the processing unit.
前記情報処理装置は、
矩形領域を有する画像データを生成する生成手段と、
前記生成手段により生成された画像データを前記文書処理装置に送信する送信手段と、
を備え、
前記文書処理装置は、
前記情報処理装置から前記画像データを受信する受信手段と、
前記受信手段により受信された画像データ毎に前記識別情報を付加する付加手段と、
前記受信手段により受信された画像データを解析して、前記画像データの前記矩形領域を抽出する解析手段と、
前記付加手段により付加された識別情報と、前記解析手段により抽出された矩形領域の矩形領域情報とを含む矩形領域データを格納する記憶手段と、
前記画像データが印刷された用紙に付されている前記識別情報を取得する取得手段と、
前記取得手段により取得された識別情報に対応する矩形領域情報を、前記矩形領域データから読み出す読出手段と、
前記読出手段により読み出された矩形領域情報に基づいて、前記画像データの矩形領域を特定する特定手段と、
前記特定手段により特定された矩形領域内に示された色を含む特徴情報を抽出する抽出手段と、
前記抽出手段により抽出された特徴情報に基づいて前記矩形領域に対する記入の条件を表す属性を示す属性情報を設定し、該属性情報を、前記矩形領域情報に関連付けて前記矩形領域データに書き込む設定手段と、
を備える文書処理システム。 A document processing system comprising an information processing apparatus and a document processing apparatus connected via a network,
The information processing apparatus includes:
Generating means for generating image data having a rectangular area;
Transmitting means for transmitting the image data generated by the generating means to the document processing apparatus;
With
The document processing apparatus includes:
Receiving means for receiving the image data from the information processing apparatus;
An adding means for adding the identification information for each image data received by the receiving means;
Analyzing the image data received by the receiving means, and extracting the rectangular area of the image data;
Storage means for storing rectangular area data including identification information added by the adding means and rectangular area information of the rectangular area extracted by the analyzing means;
Obtaining means for obtaining the identification information attached to the paper on which the image data is printed;
Reading means for reading rectangular area information corresponding to the identification information acquired by the acquiring means from the rectangular area data ;
Identifying means for identifying a rectangular area of the image data based on the rectangular area information read by the reading means;
Extracting means for extracting feature information including the color indicated in the rectangular area specified by the specifying means;
Set the attribute information indicating an attribute representing the condition of entries for the rectangular area based on the feature information extracted by the extraction means, the attribute information, in association with the rectangular area information written in the rectangular area data setting means When,
A document processing system comprising:
前記画像データが印刷された用紙に付されている前記識別情報を取得する取得ステップと、
前記取得ステップにより取得された識別情報に対応する矩形領域情報を、前記矩形領域データから読み出す読出ステップと、
前記読出ステップにより読み出された矩形領域情報に基づいて、前記画像データの矩形領域を特定する特定ステップと、
前記特定ステップにより特定された矩形領域内に示された色を含む特徴情報を抽出する抽出ステップと、
前記抽出ステップにより抽出された特徴情報に基づいて前記矩形領域に対する記入の条件を表す属性を示す属性情報を設定し、該属性情報を、前記矩形領域情報に関連付けて前記矩形領域データに書き込む設定ステップと、
を有する文書処理方法。 A document processing method in a document processing apparatus comprising storage means for storing rectangular area data including identification information of image data and rectangular area information related to the rectangular area of the image data associated with the identification information,
An acquisition step of acquiring the identification information attached to a sheet on which the image data is printed;
Reading out the rectangular area information corresponding to the identification information acquired by the acquiring step from the rectangular area data ;
A specifying step of specifying a rectangular area of the image data based on the rectangular area information read by the reading step;
An extraction step of extracting feature information including the color indicated in the rectangular area specified by the specifying step;
Setting step of the extraction on the basis of the feature information extracted by the step to set the attribute information indicating an attribute representing the condition of entries for the rectangular region, the attribute information, in association with the rectangular area information written in the rectangular region data When,
A document processing method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008202158A JP5089524B2 (en) | 2008-08-05 | 2008-08-05 | Document processing apparatus, document processing system, document processing method, and document processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008202158A JP5089524B2 (en) | 2008-08-05 | 2008-08-05 | Document processing apparatus, document processing system, document processing method, and document processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010039783A JP2010039783A (en) | 2010-02-18 |
JP5089524B2 true JP5089524B2 (en) | 2012-12-05 |
Family
ID=42012263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008202158A Expired - Fee Related JP5089524B2 (en) | 2008-08-05 | 2008-08-05 | Document processing apparatus, document processing system, document processing method, and document processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5089524B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102194123B (en) * | 2010-03-11 | 2015-06-03 | 株式会社理光 | Method and device for defining table template |
JP6390518B2 (en) * | 2015-05-29 | 2018-09-19 | 京セラドキュメントソリューションズ株式会社 | Information processing device |
JP6682827B2 (en) * | 2015-11-30 | 2020-04-15 | 富士ゼロックス株式会社 | Information processing apparatus and information processing program |
US20200265278A1 (en) * | 2019-02-19 | 2020-08-20 | Toshiba Tec Kabushiki Kaisha | Colored region barcode printing |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0696272A (en) * | 1992-09-17 | 1994-04-08 | Fujitsu Ltd | Business form format definition body generating device |
JPH07195873A (en) * | 1993-12-29 | 1995-08-01 | Dainippon Printing Co Ltd | Slip for fax-ocr |
JP3770656B2 (en) * | 1996-07-23 | 2006-04-26 | 沖電気工業株式会社 | Format creation device and format control program creation method |
JP2000339405A (en) * | 1999-05-28 | 2000-12-08 | Toshiba Corp | Optical character recognition system, format control generation method of slip in the same and storage medium storing format control generation method |
JP2005056255A (en) * | 2003-08-06 | 2005-03-03 | Fuji Xerox Co Ltd | Form generating/totalizing device and recording medium |
JP2007004523A (en) * | 2005-06-24 | 2007-01-11 | Fuji Xerox Co Ltd | Apparatus and method for preparing question sheet |
JP4741363B2 (en) * | 2005-12-19 | 2011-08-03 | 株式会社リコー | Image processing apparatus, image processing method, and image processing program |
-
2008
- 2008-08-05 JP JP2008202158A patent/JP5089524B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010039783A (en) | 2010-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4251629B2 (en) | Image processing system, information processing apparatus, control method, computer program, and computer-readable storage medium | |
US8310689B2 (en) | Document managing apparatus, document managing system, and document managing method | |
JP3796500B2 (en) | Image processing apparatus, control method therefor, and program | |
JP5712487B2 (en) | Image processing apparatus, image processing system, image processing method, and program | |
EP2264995B1 (en) | Image processing apparatus, image processing method, and computer program | |
US8170338B2 (en) | Information processing apparatus and method for correcting electronic information obtained from handwritten information | |
US11418658B2 (en) | Image processing apparatus, image processing system, image processing method, and storage medium | |
JP5089524B2 (en) | Document processing apparatus, document processing system, document processing method, and document processing program | |
JP2010130463A (en) | Print data generation apparatus, printing device, and print data processing system | |
JP2000322417A (en) | Device and method for filing image and storage medium | |
JP7302175B2 (en) | Information processing device and information processing program | |
JP7147544B2 (en) | Information processing device and information processing method | |
JP2012048637A (en) | Image processing apparatus, image processing method, computer program | |
JP2003046746A (en) | Method and apparatus for processing image | |
JP4543741B2 (en) | Graph creating apparatus, program, and recording medium | |
JP5424858B2 (en) | Image processing apparatus, control method therefor, and program | |
JP4741363B2 (en) | Image processing apparatus, image processing method, and image processing program | |
JP5935376B2 (en) | Copy machine | |
JP2012190357A (en) | Image processing device, image processing method and program | |
JP4922151B2 (en) | Form reading system, form reading method, and program | |
JP2006293970A (en) | Image processor, image processing method and image processing program | |
JP2024035965A (en) | Information processing device, control method for information processing device, and program | |
JP2022144740A (en) | OCR target area position acquisition system, OCR target area position acquisition program, actual document, actual document generation system, and actual document generation program | |
JP2022140208A (en) | Data output system, information processing system, processing method, and program | |
JP5390880B2 (en) | External character bitmap data extraction method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110607 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120517 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120522 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120723 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120814 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120911 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150921 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5089524 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |