JP4651407B2 - Image processing apparatus, computer program, and storage medium - Google Patents

Image processing apparatus, computer program, and storage medium Download PDF

Info

Publication number
JP4651407B2
JP4651407B2 JP2005043980A JP2005043980A JP4651407B2 JP 4651407 B2 JP4651407 B2 JP 4651407B2 JP 2005043980 A JP2005043980 A JP 2005043980A JP 2005043980 A JP2005043980 A JP 2005043980A JP 4651407 B2 JP4651407 B2 JP 4651407B2
Authority
JP
Japan
Prior art keywords
designated area
image
template
area
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005043980A
Other languages
Japanese (ja)
Other versions
JP2006228106A (en
Inventor
敏文 山合
直宏 石丸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2005043980A priority Critical patent/JP4651407B2/en
Publication of JP2006228106A publication Critical patent/JP2006228106A/en
Application granted granted Critical
Publication of JP4651407B2 publication Critical patent/JP4651407B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は文書画像において指定された指定領域をテンプレートとして保持するとともに、前記テンプレートを作るための画像について指定領域の内部及び周辺の特徴情報を取得してその特徴を保持し、入力画像に対して前記指定領域と同じ位置を抽出する画像処理装置、および、コンピュータプログラム、および、記憶媒体に関する。 The present invention holds a designated area designated in a document image as a template, acquires feature information inside and around the designated area for the image for creating the template, holds the feature, and The present invention relates to an image processing apparatus that extracts the same position as the designated area, a computer program, and a storage medium.

既存の帳票処理というのは、帳票フォームが完全な定型で、どのフォームにも固定の文字や罫線、枠やタイミングマークなどが存在することがほとんどである。そういった帳票フォームの記入部分を処理するようなシステムは公知なものが既にたくさんある。   In the existing form processing, the form form is completely fixed, and there are almost fixed characters, ruled lines, frames, timing marks, etc. in any form. There are already many known systems for processing the entry part of such a form.

例えば、罫線の交差する十字点を利用して位置合わせする手法(特許文献1参照)、画像中の所定のマークを形状認識手法により抽出することによって、画像のずれを検出して補正する方法(特許文献2参照)   For example, a method of performing alignment using cross points where ruled lines intersect (see Patent Document 1), and a method of detecting and correcting image deviation by extracting a predetermined mark in an image by a shape recognition method ( (See Patent Document 2)

しかし、これらの方法は、先に書いたように、位置合わせをする基準となるなんらかの固定のマーク、罫線、枠、文字が必要となる。そのために、例えば論文のタイトルのように、同じレイアウトで書かれているが、帳票フォームのようなものではないものを大量に、高速に入力したいというような場合には使うことができない。   However, as described above, these methods require some fixed mark, ruled line, frame, and character as a reference for alignment. For this reason, it cannot be used when you want to input a lot of things that are written in the same layout, such as the title of a paper, but are not like a form, at high speed.

そういったレイアウト情報を利用して書誌的事項を的確に抽出する技術には、例えば、特許文献3に開示されているように、入力画像に対して領域分割を行い、レイアウト構造に関する特徴抽出を行ってモデルを作成し、あらかじめ作成されているモデルと一致したものに関して望む書誌事項を抽出するという使い方が可能である。この方法は、論文誌の書誌事項を取ってくるような場合には非常に有効であるが、レイアウトで分類する必要のない場合には無駄な処理が多い、領域識別の性能に非常に依存するが、安定した領域識別結果を得るのは難しい、取得する位置以外のレイアウトが微妙に違っていると、別モデルを作成する必要がある、という課題がある。   As a technique for accurately extracting bibliographic items using such layout information, for example, as disclosed in Patent Document 3, region segmentation is performed on an input image, and features regarding the layout structure are extracted. It is possible to use a method of creating a model and extracting a bibliographic item desired for a model that matches a model created in advance. This method is very effective when retrieving bibliographic items of journals, but it is very useless when there is no need to classify by layout, and it is very dependent on the performance of area identification. However, there is a problem that it is difficult to obtain a stable region identification result, and that it is necessary to create another model if the layout other than the acquisition position is slightly different.

さらに、本出願人による、特許文献4の「帳票データ読取方法、記録媒体、及び、帳票データ読取装置」では表の構造認識と文字認識結果を利用して、項目の左(または下)に何を認識すべき領域があるかを記述しておくことで、帳票フォーマットの自由度を高めたものでも認識可能なシステムを提案している。   Further, in the “form data reading method, recording medium, and form data reading apparatus” of Patent Document 4 by the present applicant, the structure recognition of the table and the character recognition result are used to determine what is to the left (or below) of the item. We have proposed a system that can recognize even if the degree of freedom of the form format is increased by describing whether there is an area that should be recognized.

しかし、この方法で効果がみられるほど自由度が高くない文書では、文字認識までかけるこの方法は処理時間もリソースも消費し、OCR結果に依存することで安定性も欠く。さらに、複数の表がある文書では、この方法の上位概念としてどの表の認識を行うべきかという判断処理が必要であり、提案手法でのみ解決できるものではない。
特開平10−091783号公報 特開平4−261259号公報 特開平11−328306号公報 特開2000−29986号公報
However, for documents that do not have such a high degree of freedom as to be effective with this method, this method for character recognition consumes processing time and resources, and lacks stability because it depends on the OCR result. Furthermore, in a document having a plurality of tables, it is necessary to determine which table should be recognized as a superordinate concept of this method, which cannot be solved only by the proposed method.
Japanese Patent Laid-Open No. 10-091783 JP-A-4-261259 JP 11-328306 A JP 2000-29986 A

本発明は、かかる実情に鑑みてなされたものであり、記入項目などの順番、表内部の相対位置などは制限されるが、記入されている項目や、構造が比較的同じ(準定型)とされる文書、例えば、プリンの違いによる微妙なフォントや枠の大きさ、用紙サイズの若干の違い、スキャンする解像度の違い、あるいは、プリンタで印刷したものに何らかの記入が行われ、それをスキャンして処理する通常の流れの次に、スキャンしたデータを後過程で再び印刷して追加記入し、それを再スキャンした場合など、スキャン時、プリント時のマージンなどで、微妙に大きさが変わるといった、サイズの違いに耐えられ、かつ、処理時間や必要なメモリ量を抑制することができる画像処理装置およびコンピュータプログラムおよび記憶媒体を提供すること目的とする。 The present invention has been made in view of such circumstances, and the order of entry items, the relative position in the table, etc. are limited, but the entered items and structure are relatively the same (quasi-standard). documents, for example, the size of the subtle fonts and frames by the printer differences, slight differences in paper size, resolution scanning difference, or some entry is made to those printed by the printer, scan it After the normal flow of processing, the scanned data is printed again in a later process and added again, and when it is re-scanned, the size slightly changes depending on the margin at the time of scanning and printing. such, it tolerates differences in size, and processing time and required memory capacity images processing device and computer Ru can be suppressed and storage medium providing child The interest.

本発明は、文書画像において指定された指定領域をテンプレートとして保持するとともに、前記テンプレートを作るための画像について指定領域の内部及び周辺の特徴情報を取得してその特徴を保持し、入力画像に対して前記指定領域と同じ位置を抽出する画像処理装置において、前記テンプレート作成画像上で、指定領域が表枠の一部であるかどうかを判定し、表であった場合には、前記指定領域を囲む枠を含む表の内部を解析して、表の構造上でどの位置が指定されたのかを認識し、保持するようにし、前記指定領域が表枠の一部であるかどうかを判定する際、ユーに対して指定領域についての情報を入力要求し、それによって取得した情報を参照するようにしたものである The present invention holds a designated area designated in a document image as a template, acquires feature information inside and around the designated area for the image for creating the template, holds the feature, and In the image processing apparatus for extracting the same position as the designated area, it is determined whether or not the designated area is a part of a table frame on the template creation image. analyzes the internal tables containing frame surrounding recognizes what position on the structure of the table is specified, so as to retain, determined before SL designated area if it is part of a table frame time, the input request information about the specified area relative to the user is thereby that to refer to the acquired information.

また、コンピュータを上記画像処理装置として機能させるためのコンピュータプログラムである。 It is also because of the computer program cause the computer to function as the image processing apparatus.

また、上記記載のコンピュータプログラムを格納した記憶媒体である。 Moreover, it is a storage medium storing the computer program described above .

したがって、本発明によれば、定型に近い文書の位置合わせを行うもので、完全に定型ではない文書の特定の位置を、あらかじめ定められた処理を行うように作成されたシステムで効果的に使うことができる。例えば、位置合わせして、ある表構造をもった文書の表の一部を取ってきたいなどといったことを実現することができるという効果を得る。   Therefore, according to the present invention, alignment of a document that is close to a fixed form is performed, and a specific position of a document that is not completely fixed is used effectively in a system that is created to perform a predetermined process. be able to. For example, it is possible to realize an effect that, for example, it is desired to obtain a part of a table of a document having a certain table structure by alignment.

以下、添付図面を参照しながら、本発明の実施の形態を詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

図1は、本発明の一実施例にかかる画像処理装置の構成例を示している。   FIG. 1 shows a configuration example of an image processing apparatus according to an embodiment of the present invention.

同図において、CPU(中央処理装置)1は、この画像処理装置の動作制御を行うものであり、ROM(リード・オンリ・メモリ)2は、CPU1が起動時に実行するプログラムや必要なデータ等を記憶するためのものであり、RAM(ランダム・アクセス・メモリ)3は、CPU1のワークエリア等を構成するためのものである。   In the figure, a CPU (Central Processing Unit) 1 controls the operation of the image processing unit, and a ROM (Read Only Memory) 2 stores programs executed by the CPU 1 at startup and necessary data. A RAM (Random Access Memory) 3 is for configuring a work area of the CPU 1 and the like.

キャラクタジェネレータ4は、図形文字の表示データを発生するためのものであり、時計回路5は、現在日時情報を出力するためのものであり、ローカルエリアネットワークインターフェース回路6は、この画像処理装置をローカルエリアネットワーク(図示略)に接続するためのものであり、ローカルエリアネットワーク伝送制御部7は、ローカルエリアネットワークを介して、他のデータ端末装置との間で種々のデータをやりとりするための各種所定の通信制御処理を実行するためのものである。   The character generator 4 is for generating graphic character display data, the clock circuit 5 is for outputting the current date and time information, and the local area network interface circuit 6 is for localizing this image processing device. The local area network transmission control unit 7 is used for connection to an area network (not shown), and the local area network transmission control unit 7 performs various types of data for exchanging various data with other data terminal devices via the local area network. This is for executing the communication control process.

磁気ディスク装置8は、種々のアプリケーションプログラム、ワークデータ、ファイルデータ、画情報データなどの種々のデータを記憶するためのものであり、CD−ROM装置9は、交換可能な記録媒体であるCD−ROM10のデータを読み込むためのものであり、CRT画面表示装置11は、この画像処理装置を操作するための画面を表示するためのものであり、表示制御部12は、CRT画面表示装置11の表示内容を制御するためのものである。   The magnetic disk device 8 is for storing various data such as various application programs, work data, file data, image information data, and the CD-ROM device 9 is a CD-ROM which is an exchangeable recording medium. The CRT screen display device 11 is used to read data in the ROM 10, and the CRT screen display device 11 is used to display a screen for operating the image processing device. The display control unit 12 is a display of the CRT screen display device 11. It is for controlling the contents.

キーボード装置13は、この画像処理装置に種々のキー操作を行うためのものであり、画面指示装置14は、CRT画面表示装置11の任意の点を指示する等の操作作業を行うためのものであり、入力制御部15は、キーボード装置13および画面指示装置14の入力情報を取り込む等するためのものである。   The keyboard device 13 is for performing various key operations on the image processing device, and the screen instruction device 14 is for performing operation operations such as instructing an arbitrary point on the CRT screen display device 11. Yes, the input control unit 15 is for capturing input information of the keyboard device 13 and the screen instruction device 14.

スキャナ16は、原稿画像を所定の解像度で読取入力するためのものである。   The scanner 16 is for reading and inputting a document image at a predetermined resolution.

これらのCPU1、ROM2、RAM3、キャラクタジェネレータ4、時計回路5、ローカルエリアネット伝送制御部7、磁気ディスク装置8、CD−ROM装置9、表示制御部12、入力制御部15、および、スキャナ16は、内部バス17に接続されており、これらの各要素間のデータのやりとりは、主としてこの内部バス17を介して行われる。   These CPU 1, ROM 2, RAM 3, character generator 4, clock circuit 5, local area net transmission control unit 7, magnetic disk device 8, CD-ROM device 9, display control unit 12, input control unit 15, and scanner 16 Are connected to the internal bus 17, and data exchange between these elements is mainly performed via the internal bus 17.

本発明では、例えば、帳票原稿を読み取って得た画像データについて、表組みの特定項目、例えば、発行日の記載内容や、表題の記載内容等を抽出する画像処理を行う。その際、抽出項目については、例えば、ユーザが読み込ませた原稿画像(テンプレート作成画像)を表示して、ユーザ操作により、所望の抽出項目を含む領域を指定させる。そして、指定領域をあらわすテンプレート情報を作成し、この作成したテンプレート情報に基づいて、抽出項目を抽出する。   In the present invention, for example, for image data obtained by reading a form document, image processing for extracting specific items of a table, for example, description contents of an issue date, description contents of a title, and the like is performed. At that time, for the extraction item, for example, a document image (template creation image) read by the user is displayed, and an area including a desired extraction item is designated by a user operation. Then, template information representing the designated area is created, and extracted items are extracted based on the created template information.

図2は、本発明の一実施例にかかるテンプレート作成処理の一例の要部を示している。   FIG. 2 shows a main part of an example of template creation processing according to an embodiment of the present invention.

まず、テンプレート作成画像を入力し(処理101)、入力画像を表示して(処理102)、ユーザに指定領域の選択作業を行わせる(処理103)。また、ユーザが指定した指定領域について、表に囲まれているか否かの問い合わせを行う。   First, a template creation image is input (process 101), the input image is displayed (process 102), and the user is allowed to select a designated area (process 103). Also, an inquiry is made as to whether or not the designated area designated by the user is surrounded by a table.

表に囲まれている場合で、判断104の結果がYESになるときには、指定領域を含む表内部の構造を解析する(処理105)。次いで、指定領域が表の構造のどの位置にあるかを認識し(処理106)、テンプレートを保存するテンプレート辞書(図示略)に、当該指定領域について、「表中にあること」、「表構造のどの位置にあるか」、および、「表構造解析結果」を登録して(処理107)、この処理を終了する。   If the result of determination 104 is YES in the case of being surrounded by a table, the structure inside the table including the designated area is analyzed (processing 105). Next, the position of the specified area is recognized in the table structure (process 106), and the template dictionary (not shown) for storing the template stores the “specified in the table” and “table structure” for the specified area. "In which position" and "table structure analysis result" are registered (process 107), and this process ends.

また、判断104の結果がNOになるときには、通常のテンプレート辞書に登録して(処理108)、この処理を終了する。   If the result of determination 104 is NO, it is registered in a normal template dictionary (process 108), and this process ends.

図3は、本発明の他の実施例にかかるテンプレート作成処理の一例の要部を示している。この場合は、あらかじめ画像全体で表抽出を行った後に、指定領域についての判定を行っている。   FIG. 3 shows a main part of an example of a template creation process according to another embodiment of the present invention. In this case, the specified area is determined after the table is extracted in advance for the entire image.

まず、テンプレート作成画像を入力し(処理201)、入力画像を表示して(処理202)、ユーザに指定領域の選択作業を行わせる(処理203)。   First, a template creation image is input (process 201), the input image is displayed (process 202), and the user is allowed to select a designated area (process 203).

次に、入力画像全体について、含まれている表を抽出し(処理204)、見つかった全ての表内部の構造を解析する(処理205)。   Next, a table included in the entire input image is extracted (process 204), and the structures inside all the found tables are analyzed (process 205).

そして、指定領域が表に囲まれているかどうかを調べる(判断206)。このとき、ユーザに対し、指定した指定領域について、表に囲まれているか否かの問い合わせを行うことができる。   Then, it is checked whether or not the designated area is surrounded by a table (decision 206). At this time, the user can be inquired as to whether or not the designated area is surrounded by a table.

指定領域が表に囲まれている場合で、判断206の結果がYESになるときには、テンプレートを保存するテンプレート辞書(図示略)に、当該指定領域について、「表中にあること」、「表構造のどの位置にあるか」、および、「表構造解析結果」を登録して(処理207)、この処理を終了する。   If the designated area is surrounded by a table and the result of determination 206 is YES, the template dictionary (not shown) for storing the template stores “there is in the table”, “table structure” for the designated area. "In which position" and "table structure analysis result" are registered (process 207), and this process ends.

また、判断206の結果がNOになるときには、通常のテンプレート辞書に登録して(処理208)、この処理を終了する。   If the result of determination 206 is NO, it is registered in a normal template dictionary (process 208), and this process ends.

このようにして、この場合は、先に画像に含まれる全ての表について構造解析を行うので、複数の領域が設定される場合などに、処理効率が上がる。   In this way, in this case, since the structural analysis is performed on all the tables included in the image first, the processing efficiency increases when a plurality of areas are set.

図4は、本発明のさらに他の実施例にかかるテンプレート作成処理の一例の要部を示している。   FIG. 4 shows the main part of an example of template creation processing according to still another embodiment of the present invention.

まず、テンプレート作成画像を入力し(処理301)、入力画像を表示して(処理302)、ユーザに指定領域の選択作業を行わせる(処理303)。   First, a template creation image is input (process 301), the input image is displayed (process 302), and the user is allowed to select a designated area (process 303).

次に、入力画像全体について、含まれている表を抽出し(処理304)、指定領域が表に囲まれているかどうかを調べる(判断305)。このとき、ユーザに対し、指定した指定領域について、表に囲まれているか否かの問い合わせを行うことができる。   Next, a table included in the entire input image is extracted (processing 304), and it is checked whether or not the designated area is surrounded by the table (decision 305). At this time, the user can be inquired as to whether or not the designated area is surrounded by a table.

表に囲まれている場合で、判断305の結果がYESになるときには、指定領域が囲まれている表内部の構造を解析する(処理306)。次いで、テンプレートを保存するテンプレート辞書(図示略)に、当該指定領域について、「表中にあること」、「表構造のどの位置にあるか」、および、「表構造解析結果」を登録して(処理307)、この処理を終了する。   If the result of determination 305 is YES in the case of being surrounded by a table, the structure inside the table in which the specified area is surrounded is analyzed (processing 306). Next, register “being in the table”, “in which position in the table structure”, and “table structure analysis result” for the designated area in the template dictionary (not shown) for storing the template. (Process 307), this process is terminated.

また、判断305の結果がNOになるときには、通常のテンプレート辞書に登録して(処理308)、この処理を終了する。   When the result of determination 305 is NO, it is registered in a normal template dictionary (process 308), and this process ends.

ここで、指定領域が表に囲まれているかどうの判断は、入力画像に基づいて自動的に処理することもできる。例えば、指定領域の大きさを幅W、高さHとすると、指定領域の上下にWの一定閾値以上の割合、例えば、100%以上の長さの黒ランがあるかどうかを探索すればよい。指定領域は、通常の場合、文字が記入される部分より大きめに設定される(特にすでに文字が書いてある帳票をテンプレートとして使用する場合)ため、このような手法でもよい。なお、閾値を小さくしすぎると、縦の場合は、「1」などの文字で、横の場合はアンダーラインで反応してしまう可能性があるため、設定には気をつける必要がある。   Here, the determination of whether the designated area is surrounded by the table can be automatically processed based on the input image. For example, assuming that the size of the designated area is width W and height H, it is only necessary to search whether there is a black run having a ratio equal to or greater than a certain threshold of W, for example, a length of 100% or more above and below the designated area. . Since the designated area is usually set larger than the part where characters are written (especially when a form on which characters are already written is used as a template), such a method may be used. Note that if the threshold value is too small, characters such as “1” may be reacted in the vertical direction and underlined in the horizontal direction, so the setting needs to be taken care of.

また、表の構造上の位置とは、テンプレート上の表の座標値、表の重心の位置、指定領域の座標値、指定領域の重心の位置、指定領域を囲む罫線の位置、および、その重心の位置、および、各表の開始点を原点と考えたときの相対座標値での指定領域の位置および重心の位置、および、表のセルIDの情報のうち少なくとも1つ以上である。   The position of the table structure is the table coordinate value on the template, the position of the center of gravity of the table, the coordinate value of the specified area, the position of the center of gravity of the specified area, the position of the ruled line surrounding the specified area, and its center of gravity. , The position of the designated area and the position of the center of gravity in the relative coordinate values when the starting point of each table is considered as the origin, and information on the cell ID of the table.

なお、セルIDについては、特開2003−223611号公報を参照のこと。このセルIDを使用することで、座標の相対位置の自由度が高まり、構造(罫線の数、セルの数)が同じであれば、枠の大きさが変わっても、セルIDの値が同じ値であるため、適切に指定領域を判断することができる。   Regarding the cell ID, refer to Japanese Patent Laid-Open No. 2003-223611. By using this cell ID, the degree of freedom of the relative position of the coordinate increases, and if the structure (number of ruled lines, number of cells) is the same, the cell ID value is the same even if the frame size changes. Since it is a value, the designated area can be appropriately determined.

このようにして作成したテンプレート辞書を用いて、入力画像に含まれる指定領域を判定する際の処理の一例を図5に示す。   FIG. 5 shows an example of processing for determining the designated area included in the input image using the template dictionary created in this way.

まず、テンプレート辞書を読み込み(処理501)、認識対象となる画像を入力し(処理502)、入力画像の全面について、含まれる表を抽出する(処理503)。そして、抽出した全ての表の構造を解析し(処理505)、テンプレートの表構造位置と照合して(処理505)、ユーザが指定した領域を抽出する(処理506)。   First, a template dictionary is read (process 501), an image to be recognized is input (process 502), and an included table is extracted for the entire input image (process 503). Then, the structure of all the extracted tables is analyzed (process 505), collated with the table structure position of the template (process 505), and an area designated by the user is extracted (process 506).

そして、抽出した領域について、指定された処理を適用する(処理507)。   Then, the designated process is applied to the extracted area (process 507).

ここで、認識対象の入力画像に表があるかどうかを判定するには、例えば、特許第2940936号に記載されているように、外接矩形を抽出し、その内部の一定以上の長さのランで構成される矩形を罫線として抽出して、抽出した罫線の数で表を判定できるという方法など既知の方法があり、ここでも利用可能である。   Here, in order to determine whether or not there is a table in the input image to be recognized, for example, as described in Japanese Patent No. 2940936, a circumscribed rectangle is extracted, and a run with a certain length or more inside is extracted. There is a known method such as a method of extracting a rectangle formed by the above as a ruled line and determining a table based on the number of extracted ruled lines, which is also available here.

また、表構造解析方法には、例えば、特開平4−167194号公報に記載されているように、主走査方向の罫線抽出、副走査方向の罫線抽出を行い、罫線と枠の情報を解析する方法がある。あるいは、罫線が外側にない表でも、特許第2812982号に記載されている方法のように、仮想的に罫線を作成する方法で解析が行えるし、また、点線についても、特許第3140079号に記載された方法を適用することで、黒ランと白ランの長さのヒストグラムを利用して抽出が可能である。このような既存の方法を組み合わせて、表判定機能、表処理機能は構成される。また、ここに書いてない既知の方法を利用することも可能である。   In the table structure analysis method, for example, as described in JP-A-4-167194, ruled line extraction in the main scanning direction and ruled line extraction in the sub-scanning direction are performed, and information on ruled lines and frames is analyzed. There is a way. Alternatively, even a table without ruled lines can be analyzed by a method of virtually creating ruled lines as in the method described in Japanese Patent No. 28129982, and dotted lines are also described in Japanese Patent No. 3140079. By applying the method described above, it is possible to perform extraction using a histogram of the lengths of black runs and white runs. The table determination function and the table processing function are configured by combining such existing methods. It is also possible to use known methods not described here.

また、表構造照合方法では、テンプレート辞書に格納されている表構造位置と、入力画像から抽出された表構造を照らし合わせる。これには、例えば、テンプレート上の表の座標値、表の重心の位置、指定領域の座標値、指定領域の重心の位置、指定領域を囲む罫線の位置、および、その重心の位置、および、各表の開始点を原点と考えたときの相対座標値での指定領域の位置および重心の位置、および、表のセルIDの情報のうち少なくとも1つ以上を採用することができる。   In the table structure collation method, the table structure position stored in the template dictionary is compared with the table structure extracted from the input image. This includes, for example, the coordinate value of the table on the template, the position of the center of gravity of the table, the coordinate value of the specified area, the position of the center of gravity of the specified area, the position of the ruled line surrounding the specified area, and the position of the center of gravity. At least one of the position of the designated area and the position of the center of gravity in the relative coordinate values when the starting point of each table is considered as the origin, and information on the cell ID of the table can be adopted.

また、表枠に囲まれているという情報が重要なのと共に、付近に表枠がないという情報も位置合わせの再には非常に重要な情報となる。例えば、探索範囲に唯一の枠しかない場合、多少位置がずれていようとも、その枠の位置が所望の位置と一致する可能性は非常に高い。   In addition, information that is surrounded by a table frame is important, and information that there is no table frame in the vicinity is also very important information for realignment. For example, if there is only one frame in the search range, even if the position is slightly shifted, the possibility that the position of the frame matches the desired position is very high.

逆に、付近にたくさんの表枠がある場合は、微妙なずれが隣の枠と所望の枠を間違える原因になりうる。   On the other hand, when there are many table frames in the vicinity, a slight shift can cause the adjacent frame and the desired frame to be mistaken.

そこで、指定領域が表枠内部だったとして、その付近に他の表枠がない場合は探索マージンを広くとるという制御や、その逆に指定領域が表枠かつ付近にも表枠がいくつかある場合は探索マージンを小さくとるという制御をすることで、より、高精度に表構造の照合を行うことができる。   Therefore, even if the specified area is inside the table frame, if there is no other table frame in the vicinity, control to increase the search margin, and conversely, the specified area is the table frame and there are several table frames in the vicinity. In this case, it is possible to perform collation of the table structure with higher accuracy by controlling the search margin to be small.

本発明の一実施例にかかる画像処理装置の構成例を示したブロック図。1 is a block diagram showing a configuration example of an image processing apparatus according to an embodiment of the present invention. 本発明の一実施例にかかるテンプレート作成処理の一例の要部を示したフローチャート。The flowchart which showed the principal part of an example of the template preparation process concerning one Example of this invention. 本発明の他の実施例にかかるテンプレート作成処理の一例の要部を示したフローチャート。The flowchart which showed the principal part of an example of the template preparation process concerning the other Example of this invention. 本発明のさらに他の実施例にかかるテンプレート作成処理の一例の要部を示したフローチャート。The flowchart which showed the principal part of an example of the template preparation process concerning the further another Example of this invention. テンプレート辞書を用いて、入力画像に含まれる指定領域を判定する際の処理の一例を示したフローチャート。The flowchart which showed an example of the process at the time of determining the designated area | region contained in an input image using a template dictionary.

符号の説明Explanation of symbols

1 CPU(中央処理装置)
2 ROM(リード・オンリ・メモリ)
3 RAM(ランダム・アクセス・メモリ)
11 CRT画面表示装置
13 キーボード装置
14 画面指示装置
16 スキャナ
1 CPU (Central Processing Unit)
2 ROM (Read Only Memory)
3 RAM (Random Access Memory)
11 CRT screen display device 13 Keyboard device 14 Screen pointing device 16 Scanner

Claims (3)

文書画像において指定された指定領域をテンプレートとして保持するとともに、前記テンプレートを作るための画像について指定領域の内部及び周辺の特徴情報を取得してその特徴を保持し、入力画像に対して前記指定領域と同じ位置を抽出する画像処理装置において、
前記テンプレート作成画像上で、指定領域が表枠の一部であるかどうかを判定し、表であった場合には、前記指定領域を囲む枠を含む表の内部を解析して、表の構造上でどの位置が指定されたのかを認識し、保持するようにし、
前記指定領域が表枠の一部であるかどうかを判定する際、ユーに対して指定領域についての情報を入力要求し、それによって取得した情報を参照することを特徴とする画像処理装置。
The designated area designated in the document image is held as a template, and the feature information of the inside and the surrounding of the designated area is acquired for the image for creating the template, the feature is held, and the designated area for the input image In the image processing apparatus that extracts the same position as
On the template creation image, it is determined whether or not the designated area is a part of a table frame. If the designated area is a table, the inside of the table including the frame surrounding the designated area is analyzed to determine the structure of the table. Recognize and hold which position is specified above,
When the designated area is to determine whether a part of the table frame, enter requests information about a specified area relative to the user, the image processing apparatus characterized by referring to the information acquired by it.
コンピュータを請求項記載の画像処理装置として機能させるためのコンピュータプログラム。 Because the computer programs cause the computer to function as the image processing apparatus according to claim 1. 請求項記載のコンピュータプログラムを格納した記憶媒体。 A storage medium storing the computer program according to claim 2 .
JP2005043980A 2005-02-21 2005-02-21 Image processing apparatus, computer program, and storage medium Expired - Fee Related JP4651407B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005043980A JP4651407B2 (en) 2005-02-21 2005-02-21 Image processing apparatus, computer program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005043980A JP4651407B2 (en) 2005-02-21 2005-02-21 Image processing apparatus, computer program, and storage medium

Publications (2)

Publication Number Publication Date
JP2006228106A JP2006228106A (en) 2006-08-31
JP4651407B2 true JP4651407B2 (en) 2011-03-16

Family

ID=36989415

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005043980A Expired - Fee Related JP4651407B2 (en) 2005-02-21 2005-02-21 Image processing apparatus, computer program, and storage medium

Country Status (1)

Country Link
JP (1) JP4651407B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008252862A (en) * 2007-03-05 2008-10-16 Ricoh Co Ltd Image processing apparatus, image processing method, and image processing program

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1091783A (en) * 1996-09-11 1998-04-10 Ricoh Co Ltd Method for positioning picture and device for recognizing facsimile character and computer storage medium
JP2940936B2 (en) * 1989-06-06 1999-08-25 株式会社リコー Tablespace identification method
JPH11282957A (en) * 1998-03-26 1999-10-15 Oki Electric Ind Co Ltd Method for deciding recognition object area
JP2002157545A (en) * 2000-11-22 2002-05-31 Nippon Express Co Ltd Method for reading and transferring document
JP2003223611A (en) * 2003-01-09 2003-08-08 Ricoh Co Ltd Table identification unit

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2940936B2 (en) * 1989-06-06 1999-08-25 株式会社リコー Tablespace identification method
JPH1091783A (en) * 1996-09-11 1998-04-10 Ricoh Co Ltd Method for positioning picture and device for recognizing facsimile character and computer storage medium
JPH11282957A (en) * 1998-03-26 1999-10-15 Oki Electric Ind Co Ltd Method for deciding recognition object area
JP2002157545A (en) * 2000-11-22 2002-05-31 Nippon Express Co Ltd Method for reading and transferring document
JP2003223611A (en) * 2003-01-09 2003-08-08 Ricoh Co Ltd Table identification unit

Also Published As

Publication number Publication date
JP2006228106A (en) 2006-08-31

Similar Documents

Publication Publication Date Title
JP5361574B2 (en) Image processing apparatus, image processing method, and program
US8508756B2 (en) Image forming apparatus having capability for recognition and extraction of annotations and additionally written portions
JP5121599B2 (en) Image processing apparatus, image processing method, program thereof, and storage medium
US8213717B2 (en) Document processing apparatus, document processing method, recording medium and data signal
US7596271B2 (en) Image processing system and image processing method
US20060285748A1 (en) Document processing device
US7796817B2 (en) Character recognition method, character recognition device, and computer product
JP4785655B2 (en) Document processing apparatus and document processing method
CN101377855B (en) Document image processing apparatus, and information processing method
US11418658B2 (en) Image processing apparatus, image processing system, image processing method, and storage medium
JP2008145611A (en) Information processor and program
JP2006025129A (en) System and method for image processing
JP2019159633A (en) Image processing apparatus, image processing method, and image processing program
JP5769131B2 (en) Image processing apparatus and program
JP2008108114A (en) Document processor and document processing method
JP2022092119A (en) Image processing apparatus, image processing method, and program
JP2002109521A (en) Device and method for processing document
JP4651407B2 (en) Image processing apparatus, computer program, and storage medium
JP2006253842A (en) Image processor, image forming apparatus, program, storage medium and image processing method
JP4754236B2 (en) Information processing apparatus, acquisition method, and acquisition program
JP4143245B2 (en) Image processing method and apparatus, and storage medium
JP4501731B2 (en) Image processing device
JP2007299321A (en) Information processor, information processing method, information processing program and information storage medium
JP2006092207A (en) Document attribute acquisition device, document attribute acquisition method and document attribute acquisition program
JP6489041B2 (en) Information processing apparatus and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080122

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090131

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100914

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101207

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101214

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131224

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees