JP2008210327A - Character image output system and character image output method - Google Patents

Character image output system and character image output method Download PDF

Info

Publication number
JP2008210327A
JP2008210327A JP2007048688A JP2007048688A JP2008210327A JP 2008210327 A JP2008210327 A JP 2008210327A JP 2007048688 A JP2007048688 A JP 2007048688A JP 2007048688 A JP2007048688 A JP 2007048688A JP 2008210327 A JP2008210327 A JP 2008210327A
Authority
JP
Japan
Prior art keywords
image
image data
data
character
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007048688A
Other languages
Japanese (ja)
Inventor
Masayuki Karasawa
正行 唐澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information and Telecommunication Engineering Ltd
Original Assignee
Hitachi Computer Peripherals Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Computer Peripherals Co Ltd filed Critical Hitachi Computer Peripherals Co Ltd
Priority to JP2007048688A priority Critical patent/JP2008210327A/en
Publication of JP2008210327A publication Critical patent/JP2008210327A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Facsimiles In General (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To improve the accuracy of a database and to perform high-speed registration of a character and image data. <P>SOLUTION: This character image output system comprises: a scanner 10 for imaging and reading first image data for character recognition and second image data for image storage from the images of forms on which the character is written; an image input device 20 for recognizing, from the first image data, the character data included in the first image data and outputting it, recognizing, from the second image data, the basic image property including the image width and height of the second image data and the form coordinate information of the forms, and outputting the basic image property, the form coordinate information, and the second image data; and an image processor 30 for performing the image processing of the second image data output from the image input device based on the basic image property and the form coordinate information and outputting the processed image data having undergone the image processing. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、帳票類に記載された文字データ及び画像データを読み取ってデータベースに登録する文字画像出力システム及び文字画像出力方法に係り、特に文字データ及び画像データをデータベースに高速に登録することができる文字画像出力システム及び文字画像出力方法に関する。   The present invention relates to a character image output system and a character image output method for reading character data and image data described in a form and registering them in a database, and in particular, character data and image data can be registered in a database at high speed. The present invention relates to a character image output system and a character image output method.

一般に光学文字認識装置は、文字が記載された帳票類の画像データを読み取り、該読み取った画像データから文字データを認識する機能を有しており、近年、この光学文字認識装置が、例えばパスポート(旅券)に記載された氏名/旅券番号等の文字データ並びに顔写真及び頁全体を画像データとしてデータベースに登録する文字画像情報の出力装置として使用されている。   In general, an optical character recognition device has a function of reading image data of a form in which characters are described, and recognizing character data from the read image data. It is used as an output device for character image information for registering character data such as name / passport number, etc. written on the passport) and a face photograph and the entire page as image data in a database.

尚、前述の文字データ及び画像データの読み取りを行うコンピュータシステムに関する技術が記載された文献としては下記特許文献が挙げられる。
特開平7−49541号公報
Note that the following patent documents are listed as documents describing the technology relating to the computer system for reading the character data and the image data.
JP 7-49541 A

前述の特許文献記載の技術は、医療分野におけるX線フィルムの画像データと該X線フィルムに含まれる患者情報を文字データとを読み取る技術が記載されているものの、このような画像及び文字データを高速にデータベース等に登録する点に関しては考慮されていないものであった。   The technique described in the above-mentioned patent document describes a technique for reading image data of X-ray film in the medical field and character data of patient information included in the X-ray film. The point of registering in the database etc. at high speed was not taken into consideration.

即ち従来技術による画像及び文字データの両者を読み取ってデータベース等へ出力する文字画像出力システムは、例えば多数の帳票類をスキャンにより画像データとして読み込む工程と、該読み込んだ多数の画像データの傾き補正や2値化等の画像処理を行った後に記憶する工程と、該記憶した多数の画像データから文字認識技術を用いて文字を認識する文字認識工程とを順次バッチ処理し、これら全工程のバッチ処理が完了してから画像データ及び文字データをデータベースに格納するため、前述の全バッチ処理が完了してからでないとデータベースに登録するデータを構築することができず、データベースへのデータ登録時間が冗長になると言う不具合があった。   That is, a text image output system that reads both image and text data according to the prior art and outputs it to a database or the like includes, for example, a step of reading a large number of forms as image data by scanning, A batch process including a process of storing after performing image processing such as binarization and a character recognition process of recognizing characters using a character recognition technology from a large number of stored image data, and batch processing of all these processes Since the image data and character data are stored in the database after the completion of the process, the data to be registered in the database cannot be constructed until all the batch processes described above are completed, and the data registration time in the database is redundant. There was a problem to say.

例えば前記データベースを用いて何等かの情報を検索する検索者は、画像データを含む完成された情報の検索を望むよりは、タイムラグが短く且つ検索対象がヒットする確率が大きい精度(検索された情報に占める、検索された適合情報の割合)の向上を望んでおり、従来技術においては、保管用の画像データを含むデータが完成してからでないとデータをデータベースに登録できず、このためにデータベースの精度を向上することが困難であると言う不具合があった。   For example, a searcher who searches for any information using the database has a short time lag and a high probability that the search target will be hit (searched information), rather than searching for completed information including image data. In the conventional technology, the data cannot be registered in the database until the data including the image data for storage is completed. For this reason, the database cannot be registered. There was a problem that it was difficult to improve the accuracy of the.

本発明の目的は、前述の不具合を除去することであり、画像データ及び文字データのデータベースへの登録を高速に行うことができる文字画像出力システム及び文字画像出力方法を提供することである。   An object of the present invention is to eliminate the above-mentioned problems, and to provide a character image output system and a character image output method capable of registering image data and character data in a database at high speed.

前記目的を達成するために本発明は、文字が記載された帳票類の画像を撮像し、該画像から文字データを認識すると共に画像データを切り出し、該文字データ及び画像データを出力する文字画像出力システムであって、前記帳票類の文字を含む画像から文字認識用の第1画像データ及び画像保存用の第2画像データを読み取るスキャナと、前記第1画像データから該第1画像データに含まれる文字データを認識しデータベースへ登録し、前記第2画像データから該第2画像データの画像幅高さを含む基本画像プロパティと前記帳票類の帳票座標情報とを認識し、前記認識した文字データと基本画像プロパティと帳票座標情報と第2画像データとを出力する画像入力装置と、該画像入力装置から出力した第2画像データを前記基本画像プロパティ及び帳票座標情報に基づいて画像処理を行い、該画像処理を行った処理済画像データを出力する画像処理装置とを備えたことを第1の特徴とする。   To achieve the above object, the present invention captures an image of a form or the like on which characters are described, recognizes character data from the image, cuts out the image data, and outputs the character data and the image data. A system that includes a scanner that reads first image data for character recognition and second image data for image storage from an image including characters of the form, and the first image data includes the first image data. Recognizing and registering character data in a database, recognizing basic image properties including image width height of the second image data and form coordinate information of the forms from the second image data; An image input device that outputs basic image properties, form coordinate information, and second image data, and second image data output from the image input device is used as the basic image property. And performs image processing on the basis of the form coordinate information, the first feature in that an image processing apparatus for outputting the processed image data subjected to the image processing.

また本発明は、前記第1の特徴の文字画像出力システムにおいて、前記画像入力装置が、前記第2の画像データから該第2の画像データの出力形式と出力解像度とスキュー補正情報とを含む編集情報を認識し、前記画像処理装置が、前記基本画像プロパティ及び帳票座標情報を基に前記第2の画像データから切り出し画像データを切り出すと共に、前記スキュー補正情報を基に前記切り出し画像データの傾きを補正することを第2の特徴とし、前記何れかの特徴の請求項1記載の文字画像出力システムにおいて、前記スキャナが帳票類の画像データを読み込む処理と、前記画像入力装置が前記読み込んだ画像データから認識した文字データのデータベースへの登録と、基本画像プロパティと帳票座標情報と第2画像データとを出力する処理と、前記画像処理装置が前記処理済画像データを出力する処理とを連続的に行うことを第3の特徴とする。   Further, the present invention provides the character image output system according to the first feature, wherein the image input device includes an output format, an output resolution, and skew correction information of the second image data from the second image data. Recognizing information, the image processing apparatus cuts out the cut-out image data from the second image data based on the basic image property and the form coordinate information, and determines the inclination of the cut-out image data based on the skew correction information. 2. The character image output system according to claim 1, wherein correction is a second feature, wherein the scanner reads image data of a form, and the image data read by the image input device Registration of character data recognized from the database, processing for outputting basic image properties, form coordinate information, and second image data; The image processing apparatus to a third feature be carried out continuously and processing for outputting the processed image data.

また本発明は、文字が記載された帳票類の画像をスキャナが撮像し、画像入力装置及び画像処理装置が、画像から文字データを認識しデータベースへ登録すると共に画像データを切り出し、該文字データ及び画像データを出力する文字画像出力システムにおける文字画像出力方法であって、前記スキャナが、前記帳票類の文字を含む画像から文字認識用の第1画像データ及び画像保存用の第2画像データを読み取る第1工程と、前記画像入力装置が、前記第1画像データから該第1画像データに含まれる文字データを認識しデータベースへ登録と、前記第2画像データから該第2画像データの画像幅高さを含む基本画像プロパティと前記帳票類の帳票座標情報とを認識し、基本画像プロパティと帳票座標情報と第2画像データとを出力する第2工程と、前記画像処理装置が、前記画像入力装置から出力した第2画像データを前記基本画像プロパティ及び帳票座標情報に基づいて画像処理を行い、該画像処理を行った処理済画像データを出力する第3工程を実行することを第4の特徴とする。   Further, according to the present invention, a scanner captures an image of a form or the like on which characters are described, and the image input device and the image processing device recognize character data from the image and register it in a database and cut out the image data. A character image output method in a character image output system for outputting image data, wherein the scanner reads first image data for character recognition and second image data for image storage from an image including characters of the forms. A first step, wherein the image input device recognizes character data included in the first image data from the first image data and registers it in a database, and increases the image width of the second image data from the second image data. A basic image property including the size and form coordinate information of the form, and outputting a basic image property, form coordinate information, and second image data. And the image processing device performs image processing on the second image data output from the image input device based on the basic image property and the form coordinate information, and outputs processed image data subjected to the image processing. The fourth feature is to execute the third step.

また本発明は、前記特徴の文字画像出力方法において、前記第2工程が、前記第2の画像データから該第2の画像データの出力形式と出力解像度とスキュー補正情報とを含む編集情報を認識する工程を含み、前記第3工程が、前記基本画像プロパティ及び帳票座標情報を基に前記第2の画像データから切り出し画像データを切り出す工程と、前記スキュー補正情報を基に前記切り出し画像データの傾きを補正する工程とを含むことを第5の特徴とし、前記何れかの特徴の文字画像出力方法において、前記第1工程によるスキャナが帳票類の画像データを読み込む処理と、前記第2工程乃至第3工程による画像入力装置が前記認識した文字データと基本画像プロパティと帳票座標情報と第2画像データとを出力する処理と、前記第3工程による画像処理装置が処理済画像データ及び文字データとを出力する処理とを連続的に行うことを第6の特徴とする。   According to the present invention, in the character image output method having the characteristics described above, the second step recognizes editing information including an output format, output resolution, and skew correction information of the second image data from the second image data. The third step includes a step of cutting out the cut-out image data from the second image data based on the basic image property and the form coordinate information, and an inclination of the cut-out image data based on the skew correction information. And a character image output method according to any one of the above features, wherein the scanner according to the first step reads the image data of the forms, and the second step through the second step. A process in which the image input device in three steps outputs the recognized character data, basic image properties, form coordinate information, and second image data; And sixth aspect of the performing the processing image processing apparatus outputs the processed image data and character data continuously.

本発明による文字画像出力システム及び方法は、スキャナが帳票類の文字を含む画像から文字認識用の第1画像データ及び画像保存用の第2画像データを読み取り、画像入力装置が該読み取った画像データから文字データの認識して出力、及び画像編集用の基本画像プロパティと帳票座標情報を認識する処理を最初に行い、この次に該基本画像プロパティと帳票座標情報を基に第2画像データの画像処理を行って出力するため、文字データのデータベース等に対する出力をバッチ処理に比べて高速に行うことができる。   In a character image output system and method according to the present invention, a scanner reads first image data for character recognition and second image data for image storage from an image including characters of a form, and the image input device reads the read image data. First, processing for recognizing and outputting character data and recognizing basic image properties and form coordinate information for image editing is performed, and then the image of the second image data is based on the basic image properties and form coordinate information. Since processing is performed and output, output of character data to a database or the like can be performed at a higher speed than batch processing.

以下、本発明による文字画像出力方法を適用した文字画像出力システムの一実施形態を図面を参照して詳細に説明する。
図1は本実施形態による文字画像出力システムの構成を示す図、図2は本実施形態による本文字画像出力システムが読み取る2種の画像データを示す図、図3は本実施形態によりスプールされる情報を説明するための図、図4は本実施形態の画像入力装置による1枚の画像データ入力のフローを示す図、図5は本実施形態の画像処理装置による1枚の画像データ入力のフローを示す図である。
Hereinafter, an embodiment of a character image output system to which a character image output method according to the present invention is applied will be described in detail with reference to the drawings.
FIG. 1 is a diagram showing a configuration of a character image output system according to the present embodiment, FIG. 2 is a diagram showing two types of image data read by the character image output system according to the present embodiment, and FIG. 3 is spooled by the present embodiment. FIG. 4 is a diagram for explaining information, FIG. 4 is a diagram showing a flow of one image data input by the image input device of the present embodiment, and FIG. 5 is a flow of one image data input by the image processing device of the present embodiment. FIG.

<構成>
本実施形態による文字画像出力システムは、図1に示す如く、帳票類の画像データを連続的に撮像して読み取るマルチセンサスキャナ10と、該マルチセンサスキャナ10がスキャンした画像データから後述するスプールデータを作成し、イメージ(画像)データと共に出力する画像入力装置20と、該画像入力装置20から前記スプールデータ及びイメージ(画像)データを入力とし、画像処理を行う画像処理装置30とから構成される。尚、本明細書で述べる帳票類とは、紙葉に限るものではなくパスポート等の冊子状のものも含むものとする。
<Configuration>
As shown in FIG. 1, the character image output system according to the present embodiment includes a multi-sensor scanner 10 that continuously captures and reads image data of forms, and spool data that will be described later from image data scanned by the multi-sensor scanner 10. And an image input device 20 that outputs the image data together with the image (image) data, and an image processing device 30 that receives the spool data and the image (image) data from the image input device 20 and performs image processing. . Note that the forms described in this specification are not limited to paper sheets but also include booklets such as passports.

前記マルチセンサスキャナ10は、図2に示した文字認識用のモノクロ画像であるOCR画像データ60を読み込む(撮像する)ためのOCR用読取部と、カラーの画像データであるイメージ画像データ61を読み込む(撮像する)ためのイメージ用読取部とを備え、1回のスキャンにおいて前記OCR画像データ60及びイメージ画像データ61を読み込むものである。   The multi-sensor scanner 10 reads the OCR image data 60 which is a monochrome image for character recognition shown in FIG. 2 and reads the image data 61 which is color image data. And an image reading unit for capturing an image. The OCR image data 60 and the image image data 61 are read in one scan.

前記画像入力装置20は、前記マルチセンサスキャナ10から読み込んだ両画像データを入力するための入出力ポート21と、該入出力ポート21から読み込んだ両画像データを一時的に記憶して処理を行うためのメモリ24と、前記メモリ24に記憶した画像データ他を記憶するためのハードディスク装置25と、前記画像処理装置30にデータを出力するためのI/F(インタフェース)ポート23と、前記各回路等を制御するCPU22とから構成される。   The image input device 20 inputs / outputs both image data read from the multi-sensor scanner 10 and temporarily stores both image data read from the input / output port 21 for processing. Memory 24, hard disk device 25 for storing image data and the like stored in memory 24, I / F (interface) port 23 for outputting data to image processing device 30, and each circuit The CPU 22 controls the above.

前記スプールデータとは、前記OCR画像データ60及びイメージ画像データ61を基に認識したものであって、図3に符号70として示す如く、該OCR画像データ60他に含まれる読み取り番号等のヘッダ部74と、画像幅/画像高/解像度/ビット深度/圧縮情報等の読み込んだ画像データが持つ基本的情報を示す基本画像プロパティ75と、画像データ60及び61中の帳票類の左上座標/右上座標/左下座標/右下座標を含む帳票座標情報76と、イメージ画像データ61の出力形式(BMP,JPEG,GIF他の画像データ形式)/出力解像度(DPI)/ビット変換情報/縁取り幅/網点除去情報/スキュー補正情報(帳票の傾きを補正するための情報)を含む編集情報77と、前述のイメージ保管用の画像データ61とから構成される。   The spool data is recognized based on the OCR image data 60 and the image image data 61, and as indicated by reference numeral 70 in FIG. 3, a header portion such as a reading number included in the OCR image data 60 and others. 74, basic image properties 75 indicating basic information of read image data such as image width / image height / resolution / bit depth / compression information, and upper left coordinates / upper right coordinates of the forms in the image data 60 and 61 / Form coordinate information 76 including lower left coordinates / lower right coordinates and output format of image data 61 (BMP, JPEG, GIF and other image data formats) / output resolution (DPI) / bit conversion information / border width / halftone dot Edit information 77 including removal information / skew correction information (information for correcting the inclination of the form) and the image data 61 for image storage described above. Constructed.

前記画像処理装置30は、前記画像入力装置20から出力されたスプールデータ及びイメージデータを入力とするI/F(インタフェース)ポート31と、該入力したスプールデータ及びイメージデータを一時的に記憶して処理するためのメモリ33と、該処理を行ったイメージデータ他を記憶するためのハードディスク装置34と、前記各回路等を制御するCPU32とから構成される。   The image processing device 30 temporarily stores the input spool data and image data, and an I / F (interface) port 31 to which the spool data and image data output from the image input device 20 are input. It comprises a memory 33 for processing, a hard disk device 34 for storing the processed image data, etc., and a CPU 32 for controlling the respective circuits.

<動作>
次いで本実施形態による文字画像出力システムの動作を図4及び図5を参照して説明する。
本文字画像出力システムは、図4に示す如く、マルチセンサスキャナ10が帳票類の両画像データ60及び61の読み込みを処理を開始するステップ40と、画像入力装置20のCPU22が、前記スキャナ10からの両画像データ60及び61を入出力ポート21を介して入力してメモリ24に記憶するステップ41と、この読み込んだ画像データ60又は61中の帳票等の帳票類の四辺隅の4点座標を背景との対比により検出するステップ42と、該4点座標に囲まれた画像データを基に文字データの認識および図示しないデータベースへの出力を開始するステップ43と、前述のスプールデータを作成するステップ44と、該作成したスプールデータと前記画像データ61を画像処理装置30へI/Fポート23を介して転送するステップ45と、前述の認識スレッドのステップ44乃至転送スレッドのステップ45の終了を待つステップ46とを経て、当該処理を終了するステップ47とを実行する。これによって本文字画像出力システムは、文字認識を行った文字データのデータベースへの登録及び画像処理用の基本画像プロパティ他の情報を含むスプールデータとイメージ保管用の画像データの出力を行うように動作する。尚、前記ステップ45によるデータ転送に際してCPU22が転送速度を上げるために画像データを圧縮し、圧縮した画像データを転送する様に構成しても良い。
<Operation>
Next, the operation of the character image output system according to the present embodiment will be described with reference to FIGS.
As shown in FIG. 4, the character image output system includes a step 40 in which the multi-sensor scanner 10 starts reading both the image data 60 and 61 of the form, and a CPU 22 of the image input device 20 from the scanner 10. Are input via the input / output port 21 and stored in the memory 24, and the four-point coordinates of the four corners of the form such as the form in the read image data 60 or 61 are stored. Step 42 for detection by comparison with the background, Step 43 for starting recognition of character data based on the image data surrounded by the four-point coordinates and output to a database (not shown), and step for creating the aforementioned spool data 44, and the created spool data and the image data 61 are transferred to the image processing apparatus 30 via the I / F port 23. And flop 45, through the step 46 to wait for the end of step 45 in step 44 to transfer threads of the aforementioned recognition thread, it executes the step 47 to end the process. As a result, the character image output system operates to register the character data that has undergone character recognition in the database, and output spool data including basic image properties and other information for image processing and image data for image storage. To do. The CPU 22 may compress the image data in order to increase the transfer speed during the data transfer in the step 45, and transfer the compressed image data.

この様に本実施形態による文字画像出力システムは、マルチセンサスキャナ10が1枚の帳票類から文字認識用のOCR画像データ60と画像保管用の画像データであるイメージ画像データ61とを同時にスキャンし、この両データ60及び61を入力した画像入力装置20が、前記OCR画像データ60他から認識したスプールデータ(基本画像プロパティ/帳票座標情報/編集情報)とイメージ画像データ61とを順次画像処理装置30に出力するように動作する。   As described above, in the character image output system according to the present embodiment, the multi-sensor scanner 10 simultaneously scans the OCR image data 60 for character recognition and the image image data 61 which is image data for image storage from one form. The image input device 20 that has received the data 60 and 61 receives the spool data (basic image property / form coordinate information / edit information) recognized from the OCR image data 60 and the like, and the image image data 61 sequentially. It operates to output to 30.

次いで本文字画像出力システムは、図5に示す如く、画像処理装置30のCPU32が、前記画像入力装置20から送出されたスプールデータとイメージ画像データ61をI/Fポート31を介した入力を開始するステップ50〜51と、該読み込んだ保管用の画像データ61が圧縮されているか否かを判定するステップ52と、該ステップ52において圧縮されていると判定したとき当該画像データを展開(解凍)するステップ53と、前記ステップ52において圧縮されていないと判定したとき、該画像データ61からスプールデータに含まれる基本画像プロパティ及び座標情報76(帳票類隅の4点座標である帳票座標情報)を基に帳票類部分(斜線で示す)の画像データを切り出すステップ54と、該切り出した切り出し画像データの傾き補正を前記編集情報に含まれるスキュー補正情報を基に行うステップ55と、該ステップ55に続き前記切り出し画像データの解像度や変更や色補正等のその他の画像処理を行うステップ56と、該画像処理を行った処理後の画像データをハードディスク装置34に一旦記録し、図示しないデータベースシステムに出力するステップ57と、前記スプールデータを削除するステップ58とを経、当該処理を終了するステップ59とを実行することによって、画像保管用の画像データを出力する様に動作する。   Next, in this character image output system, as shown in FIG. 5, the CPU 32 of the image processing apparatus 30 starts inputting spool data and image image data 61 sent from the image input apparatus 20 via the I / F port 31. Steps 50 to 51, step 52 for determining whether or not the read storage image data 61 is compressed, and decompressing (decompressing) the image data when it is determined in step 52 that the image data 61 is compressed. Step 53, and when it is determined in step 52 that the image data 61 is not compressed, the basic image property and coordinate information 76 (form coordinate information that is the four-point coordinates of the form category) included in the spool data from the image data 61 are obtained. Step 54 for cutting out image data of a form part (indicated by oblique lines) based on the cut-out image data Step 55 for performing skew correction based on skew correction information included in the editing information; Step 56 for performing other image processing such as resolution and change of the cut-out image data and color correction following the step 55; Step 57 for temporarily recording the processed image data on the hard disk device 34 and outputting the processed image data to a database system (not shown) and step 58 for deleting the spool data, and then ending the processing. By executing, it operates to output image data for image storage.

このように本実施形態による文字画像出力システムは、画像入力装置20が、帳票類の文字認識用のOCR画像データ60と画像保管用の画像データであるイメージ画像データ61とを入力し、OCR画像データ60他から文字データを抽出してデータベースへ出力し、画像編集用情報(基本画像プロパティ75/座標情報76/編集情報77)を含むスプールデータを抽出してイメージ画像データ61と共に画像処理装置30に送出し、これを受けた画像処理装置30が、前記受信したスプールデータに含まれる帳票類切り出しの座標値を含む座標情報76や画像処理の編集情報77を用いて保存用の画像データの画像処理を行って出力する様に動作し、この処理を帳票類1枚毎に連続処理を行うことによって、従来技術の如く、多数の帳票類の画像データ読み込みを先に行い、次いで文字データの認識を行うバッチ処理に比較して、1枚毎に文字データの認識及び保存用画像データの編集を実行するため、データベース等へのデータ出力を高速に行うことができる。   As described above, in the character image output system according to the present embodiment, the image input device 20 inputs the OCR image data 60 for character recognition of forms and the image image data 61 which is image data for image storage, and the OCR image is input. Character data is extracted from the data 60 and the like and output to the database, spool data including image editing information (basic image property 75 / coordinate information 76 / editing information 77) is extracted, and the image processing apparatus 30 together with the image image data 61 is extracted. The image processing apparatus 30 that has received and received the image data of the image data to be stored using the coordinate information 76 including the coordinate values for cutting out the forms included in the received spool data and the editing information 77 for the image processing. It operates so that it is processed and output, and this process is continuously performed for each form, so that a large number of books can be obtained as in the prior art. Compared to batch processing, which first reads image data of the same type and then recognizes character data, it outputs character data to a database, etc. to execute character data recognition and image data storage for each image. Can be performed at high speed.

特に本実施形態においては、従来技術によるバッチ処理でデータを作成した際には、検索用の文字データのデータベースへの登録が遅れるのに対し、本例においては帳票類一枚毎に文字データを認識してデータベースに登録するため、検索用の文字データを従来に比較して早くデータベースに登録することができ、従って検索対象とするデータをデータベース等により早く登録することができる。   In particular, in this embodiment, when data is created by batch processing according to the prior art, registration of character data for search in the database is delayed, whereas in this example, character data is stored for each form. Since it is recognized and registered in the database, the character data for search can be registered in the database earlier than in the prior art, and therefore the data to be searched can be registered in the database or the like earlier.

即ち本実施形態による文字画像出力システム及び方法は、スキャナ10が帳票類の画像データを読み込む処理と、前記画像入力装置20が読み込んだ画像データから認識した文字データのデータベースへの出力と基本画像プロパティと帳票座標情報と第2画像データとを出力する処理と、前記画像処理装置30が前記処理済画像データを出力する処理とを連続的に行うことによって、検索対象とするデータをデータベース等により早く登録することができる。   That is, the character image output system and method according to the present embodiment includes a process in which the scanner 10 reads form image data, output to the database of character data recognized from the image data read by the image input device 20, and basic image properties. And the process of outputting the form coordinate information and the second image data, and the process of outputting the processed image data by the image processing apparatus 30 are continuously performed, so that the data to be searched can be quickly stored in a database or the like. You can register.

本発明の一実施形態による文字画像出力システムの構成を示す図。The figure which shows the structure of the character image output system by one Embodiment of this invention. 本実施形態による本文字画像出力システムが読み取る2種の画像データを示す図。The figure which shows two types of image data which the character image output system by this embodiment reads. 本実施形態によりスプールされる情報を説明するための図。The figure for demonstrating the information spooled by this embodiment. 本実施形態の画像入力装置による処理フローを示す図。The figure which shows the processing flow by the image input device of this embodiment. 本実施形態の画像処理装置による処理フローを示す図。The figure which shows the processing flow by the image processing apparatus of this embodiment.

符号の説明Explanation of symbols

10:マルチセンサスキャナ、20:画像入力装置、23:I/Fポート、24:メモリ、25:ハードディスク装置、30:画像処理装置、31:I/Fポート、33:メモリ、34:ハードディスク装置、60:OCR用画像データ、61:イメージ画像データ、74:ヘッダ部、75:基本画像プロパティ、76:帳票座標情報、77:編集情報。   10: Multi-sensor scanner, 20: Image input device, 23: I / F port, 24: Memory, 25: Hard disk device, 30: Image processing device, 31: I / F port, 33: Memory, 34: Hard disk device, 60: OCR image data, 61: Image image data, 74: Header part, 75: Basic image property, 76: Form coordinate information, 77: Editing information.

Claims (6)

文字が記載された帳票類の画像を撮像し、該画像から文字データを認識すると共に画像データを切り出し、該文字データ及び画像データを出力する文字画像出力システムであって、
前記帳票類の文字を含む画像から文字認識用の第1画像データ及び画像保存用の第2画像データを読み取るスキャナと、
前記第1画像データから該第1画像データに含まれる文字データを認識し、前記第2画像データから該第2画像データの画像幅高さを含む基本画像プロパティと前記帳票類の帳票座標情報とを認識し、前記認識した文字データの出力と基本画像プロパティと帳票座標情報と第2画像データとを出力する画像入力装置と、
該画像入力装置から出力した第2画像データを前記基本画像プロパティ及び帳票座標情報に基づいて画像処理を行い、該画像処理を行った処理済画像データを出力する画像処理装置とを備えた文字画像出力システム。
A character image output system that captures an image of a form in which characters are described, recognizes character data from the image, cuts out the image data, and outputs the character data and the image data,
A scanner for reading first image data for character recognition and second image data for image storage from an image including characters of the forms;
Character data included in the first image data is recognized from the first image data, basic image properties including the image width height of the second image data from the second image data, and form coordinate information of the forms An image input device that outputs the recognized character data, basic image properties, form coordinate information, and second image data;
A character image comprising: an image processing device that performs image processing on the second image data output from the image input device based on the basic image property and form coordinate information, and outputs processed image data subjected to the image processing Output system.
前記画像入力装置が、前記第2の画像データから該第2の画像データの出力形式と出力解像度とスキュー補正情報とを含む編集情報を認識し、前記画像処理装置が、前記基本画像プロパティ及び帳票座標情報を基に前記第2の画像データから切り出し画像データを切り出すと共に、前記スキュー補正情報を基に前記切り出し画像データの傾きを補正する請求項1記載の文字画像出力システム。   The image input device recognizes editing information including an output format, output resolution, and skew correction information of the second image data from the second image data, and the image processing device recognizes the basic image property and the form. The character image output system according to claim 1, wherein cutout image data is cut out from the second image data based on coordinate information, and an inclination of the cutout image data is corrected based on the skew correction information. 前記スキャナが帳票類の画像データを読み込む処理と、前記画像入力装置が前記読み込んだ画像データから認識した文字データの出力と基本画像プロパティと帳票座標情報と第2画像データとを出力する処理と、前記画像処理装置が前記処理済画像データを出力する処理とを連続的に行う請求項1又は2記載の文字画像出力システム。   A process in which the scanner reads form image data, a process in which the image input device recognizes the read image data, outputs basic image properties, form coordinate information, and second image data; The character image output system according to claim 1, wherein the image processing apparatus continuously performs a process of outputting the processed image data. 文字が記載された帳票類の画像をスキャナが撮像し、画像入力装置及び画像処理装置が、画像から文字データを認識すると共に画像データを切り出し、該文字データ及び画像データを出力する文字画像出力システムにおける文字画像出力方法であって、
前記スキャナが、前記帳票類の文字を含む画像から文字認識用の第1画像データ及び画像保存用の第2画像データを読み取る第1工程と、
前記画像入力装置が、前記第1画像データから該第1画像データに含まれる文字データを認識して出力し、前記第2画像データから該第2画像データの画像幅高さを含む基本画像プロパティと前記帳票類の帳票座標情報とを認識し、基本画像プロパティと帳票座標情報と第2画像データとを出力する第2工程と、
前記画像処理装置が、前記画像入力装置から出力した第2画像データを前記基本画像プロパティ及び帳票座標情報に基づいて画像処理を行い、該画像処理を行った処理済画像データを出力する第3工程を実行する文字画像出力方法。
A character image output system in which a scanner captures an image of a form in which characters are described, and the image input device and the image processing device recognize character data from the image, cut out the image data, and output the character data and image data A character image output method in
A first step in which the scanner reads first image data for character recognition and second image data for image storage from an image including characters of the forms;
The image input device recognizes and outputs character data included in the first image data from the first image data, and includes basic image properties including an image width height of the second image data from the second image data. Recognizing the form coordinate information of the form, and outputting a basic image property, form coordinate information, and second image data;
Third step in which the image processing device performs image processing on the second image data output from the image input device based on the basic image property and form coordinate information, and outputs processed image data on which the image processing has been performed. Character image output method to execute.
前記第2工程が、前記第2の画像データから該第2の画像データの出力形式と出力解像度とスキュー補正情報とを含む編集情報を認識する工程を含み、前記第3工程が、前記基本画像プロパティ及び帳票座標情報を基に前記第2の画像データから切り出し画像データを切り出す工程と、前記スキュー補正情報を基に前記切り出し画像データの傾きを補正する工程とを含む請求項4記載の文字画像出力方法。   The second step includes a step of recognizing edit information including an output format, output resolution, and skew correction information of the second image data from the second image data, and the third step includes the basic image. 5. The character image according to claim 4, comprising: a step of cutting out cutout image data from the second image data based on properties and form coordinate information; and a step of correcting the inclination of the cutout image data based on the skew correction information. output method. 前記第1工程によるスキャナが帳票類の画像データを読み込む処理と、前記第2工程乃至第3工程による画像入力装置が前記認識した文字データの出力と基本画像プロパティと帳票座標情報と第2画像データとを出力する処理と、前記第3工程による画像処理装置が処理済画像データを出力する処理とを連続的に行う請求項4又は5記載の文字画像出力方法。   A process in which the scanner in the first step reads image data of a form, an output of the character data recognized by the image input device in the second to third steps, basic image properties, form coordinate information, and second image data. 6. The character image output method according to claim 4, wherein the process of outputting the image data and the process of outputting the processed image data by the image processing apparatus according to the third step are continuously performed.
JP2007048688A 2007-02-28 2007-02-28 Character image output system and character image output method Withdrawn JP2008210327A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007048688A JP2008210327A (en) 2007-02-28 2007-02-28 Character image output system and character image output method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007048688A JP2008210327A (en) 2007-02-28 2007-02-28 Character image output system and character image output method

Publications (1)

Publication Number Publication Date
JP2008210327A true JP2008210327A (en) 2008-09-11

Family

ID=39786542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007048688A Withdrawn JP2008210327A (en) 2007-02-28 2007-02-28 Character image output system and character image output method

Country Status (1)

Country Link
JP (1) JP2008210327A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013501304A (en) * 2009-08-04 2013-01-10 アイキュー ビジョン テクノロジーズ リミテッド System and method for object extraction
US9595108B2 (en) 2009-08-04 2017-03-14 Eyecue Vision Technologies Ltd. System and method for object extraction

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013501304A (en) * 2009-08-04 2013-01-10 アイキュー ビジョン テクノロジーズ リミテッド System and method for object extraction
US9409084B2 (en) 2009-08-04 2016-08-09 Eyecue Vision Technologies Ltd. System and method for object extraction
US9498721B2 (en) 2009-08-04 2016-11-22 Eyecue Vision Technologies Ltd. System and method for object extraction
US9595108B2 (en) 2009-08-04 2017-03-14 Eyecue Vision Technologies Ltd. System and method for object extraction
US9636588B2 (en) 2009-08-04 2017-05-02 Eyecue Vision Technologies Ltd. System and method for object extraction for embedding a representation of a real world object into a computer graphic
US9669312B2 (en) 2009-08-04 2017-06-06 Eyecue Vision Technologies Ltd. System and method for object extraction

Similar Documents

Publication Publication Date Title
JP4181892B2 (en) Image processing method
JP4350414B2 (en) Information processing apparatus, information processing method, storage medium, and program
JP4251629B2 (en) Image processing system, information processing apparatus, control method, computer program, and computer-readable storage medium
JP4854491B2 (en) Image processing apparatus and control method thereof
US7640269B2 (en) Image processing system and image processing method
JP4785655B2 (en) Document processing apparatus and document processing method
US20060008113A1 (en) Image processing system and image processing method
JP2001358925A (en) Unit and method for image processing and recording medium
JP4227432B2 (en) Image processing method
JP2007141159A (en) Image processor, image processing method, and image processing program
JP2008204184A (en) Image processor, image processing method, program and recording medium
JP2008210327A (en) Character image output system and character image output method
JP2007041709A (en) Document processing system, control method of document processing system, document processing device, computer program and computer readable storage medium
JP2009031937A (en) Form image processing apparatus and form image processing program
JP2006253842A (en) Image processor, image forming apparatus, program, storage medium and image processing method
JP2008028716A (en) Image processing method and apparatus
JP2002024838A (en) Image processing device and method, and recording medium
JP2006072839A (en) Image processing method, image processing apparatus, image processing program and recording medium
JP4862942B2 (en) Image processing apparatus, image processing method and program thereof
JP2008181383A (en) Character recognition apparatus, and method and program for controlling the same
JP2005208934A (en) Document distribution processing device and program
JP2007334437A (en) Image processor and image processing method, program and storage medium
JP2006251864A (en) File management method and device and program for file management
JP2005208872A (en) Image processing system
JP2007034923A (en) Image processing system

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20091211

A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20100511