JP2007086956A - Image processor, image processing method and computer program - Google Patents

Image processor, image processing method and computer program Download PDF

Info

Publication number
JP2007086956A
JP2007086956A JP2005273255A JP2005273255A JP2007086956A JP 2007086956 A JP2007086956 A JP 2007086956A JP 2005273255 A JP2005273255 A JP 2005273255A JP 2005273255 A JP2005273255 A JP 2005273255A JP 2007086956 A JP2007086956 A JP 2007086956A
Authority
JP
Japan
Prior art keywords
character recognition
processing
image
image processing
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005273255A
Other languages
Japanese (ja)
Inventor
Etsuko Ito
悦子 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2005273255A priority Critical patent/JP2007086956A/en
Publication of JP2007086956A publication Critical patent/JP2007086956A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a device and method for changing the working configurations of an original image to be stored in the case of character recognition processing according to OCR probability. <P>SOLUTION: The probability of character recognition processing is calculated. As for a data region whose probability is high, original image working is executed by increasing a data reduction rate, and as for a data region whose probability is low, image working is executed by decreasing a data reduction rate. Thus, as for the data region whose character recognition probability is low, and whose original image reference possibility is high, the image data can be accurately restored, and as for the region data whose character recognition probability is high, and whose image reference possibility is low, a worked image can be generated and stored by increasing the data reduction rate, and data quantity to be stored in a storage means is reduced. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、画像処理装置、および画像処理方法、および画像処理方法、並びにコンピュータ・プログラムに関する。さらに詳細には、文字認識処理(OCR:Optical Caracter Recognition)によって電子化文書データを生成し、オリジナル文書画像データを保存する構成を持つ画像処理装置、および画像処理方法、並びにコンピュータ・プログラムに関する。   The present invention relates to an image processing apparatus, an image processing method, an image processing method, and a computer program. More specifically, the present invention relates to an image processing apparatus, an image processing method, and a computer program that generate electronic document data by character recognition processing (OCR: Optical Character Recognition) and store original document image data.

文書原稿を電子保存する場合、原稿を画像データ化した状態で保持しておくことが一般的である。特にデータの再利用性の観点からみると、テキスト領域については、文字認識処理(OCR:Optical Caracter Recognition)によって、コード化して保存することが好ましい。   When a document document is stored electronically, it is common to store the document as image data. In particular, from the viewpoint of data reusability, the text region is preferably encoded and stored by character recognition processing (OCR: Optical Character Recognition).

OCRによる文字認識率は電子文書の信頼度に大きく関わってくる。しかしながらOCRの認識率、文字判定確からしさは100%ではなく、多くの場合、文書を電子化して保存する場合には、電子化データとともに、オリジナル原稿画像の保存が必要となる。これは、電子化データの確認や、修正などのOCR処理結果精査の際に、オリジナル原稿画像を参照可能とするためである。   The character recognition rate by OCR is greatly related to the reliability of electronic documents. However, the OCR recognition rate and the accuracy of character determination are not 100%. In many cases, when an electronic document is stored, it is necessary to store the original document image together with the electronic data. This is to make it possible to refer to the original document image when checking the digitized data and examining the OCR processing result such as correction.

OCR処理結果精査時の原稿画像確認処理構成を開示した従来技術としては、例えば、OCR処理時に、認識精度の低いと判定される領域を表示し、ユーザによる修正の際の参照とする構成が特許文献1に開示されている。また、OCR精度を利用した従来技術としては、文字毎に文字認識精度を判定し、精度が低いと判定された文字を、スペースまたは特定文字などで置き換える構成が特許文献2に開示されている。   As a conventional technique that discloses a document image confirmation processing configuration at the time of examining an OCR processing result, for example, a configuration in which an area determined to have low recognition accuracy at the time of OCR processing is displayed and used as a reference for correction by a user is patented. It is disclosed in Document 1. Further, as a conventional technique using the OCR accuracy, Patent Document 2 discloses a configuration in which character recognition accuracy is determined for each character, and a character determined to have low accuracy is replaced with a space or a specific character.

OCRにおいて誤認識された文字については、オペレータによってオリジナル原稿画像が参照され、修正することが可能となる。具体的には、人間がオリジナル文書画像データと電子化されたテキストデータ(OCR結果)を目視等で比較し、テキストを修正するという作業である。しかし、情報欠落を恐れるあまりに文書画像を圧縮なし、または低い圧縮率で保存してしまうと、容量の大きい画像データはディスク容量を圧迫することになる。一方、高圧縮率の非可逆圧縮処理などを行なってしまうと、オリジナル画像データの復元に失敗し、オリジナルデータに基づく修正が困難なる場合がある。
特開平8−96075号公報 特開2003−203204号公報
Characters that are erroneously recognized in the OCR can be corrected by referring to the original document image by the operator. Specifically, it is an operation in which a human compares the original document image data with the digitized text data (OCR result) visually to correct the text. However, if the document image is stored without compression or at a low compression rate because of fear of missing information, large-capacity image data will squeeze the disk capacity. On the other hand, if irreversible compression processing with a high compression ratio is performed, restoration of original image data may fail, and correction based on the original data may be difficult.
JP-A-8-96075 JP 2003-203204 A

本発明は、上述の問題点に鑑みてなされたものであり、文字認識処理(OCR)によって電子化文書データを生成し、オリジナル文書画像データを保存する場合の、オリジナル文書画像データの保存態様、すなわち圧縮処理などの画像加工処理態様を、文字認識の確からしさに応じて動的に変更する構成として、効率的なデータ保存を実現する画像処理装置、および画像処理方法、並びにコンピュータ・プログラムを提供することを目的とする。   The present invention has been made in view of the above-mentioned problems, and a storage mode of original document image data when electronic document data is generated by character recognition processing (OCR) and the original document image data is stored. That is, an image processing apparatus, an image processing method, and a computer program that realize efficient data storage are provided as a configuration that dynamically changes an image processing processing mode such as compression processing according to the probability of character recognition. The purpose is to do.

本発明の第1の側面は、
入力画像データに基づく文字認識処理を実行する文字認識処理手段と、
前記文字認識処理手段において実行された文字認識処理の確からしさを、データ領域毎に算出する文字認識確からしさ算出部と、
前記文字認識確からしさ算出部の算出したデータ領域毎の文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データのデータ領域ごとの加工処理態様を決定し、決定した処理態様での画像加工処理を実行する画像加工部と、
前記画像加工部の加工した加工画像データを格納する記憶部と、
を有することを特徴とする画像処理装置にある。
The first aspect of the present invention is:
Character recognition processing means for executing character recognition processing based on input image data;
A character recognition probability calculating unit for calculating the probability of the character recognition processing executed in the character recognition processing means for each data area;
Based on the character recognition probability for each data area calculated by the character recognition probability calculation unit, a processing mode for each data area of the original image data to be subjected to character recognition processing is determined, and an image in the determined processing mode is determined. An image processing unit for executing processing,
A storage unit for storing processed image data processed by the image processing unit;
An image processing apparatus characterized by comprising:

さらに、本発明の画像処理装置の一実施態様において、前記文字認識処理手段は、レイアウト解析によって検出されたレイアウト区分ごとの文字認識処理を実行する構成であり、前記文字認識確からしさ算出部は、前記文字認識処理手段において実行された文字認識処理の確からしさを、前記レイアウト区分ごとに算出し、前記画像加工部は、前記文字認識確からしさ算出部の算出したレイアウト区分ごとの文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データについて、レイアウト区分ごとに加工処理態様を決定し、決定した処理態様で、レイアウト区分単位で画像加工処理を実行する構成であることを特徴とする。   Furthermore, in an embodiment of the image processing apparatus of the present invention, the character recognition processing unit is configured to execute a character recognition process for each layout category detected by layout analysis, and the character recognition probability calculation unit includes: The probability of the character recognition processing executed in the character recognition processing means is calculated for each layout category, and the image processing unit determines the character recognition probability for each layout category calculated by the character recognition probability calculation unit. Based on the above, the original image data to be subjected to the character recognition process is characterized in that a processing mode is determined for each layout section, and an image processing process is executed for each layout section in the determined processing mode.

さらに、本発明の画像処理装置の一実施態様において、前記画像加工部は、文字認識確からしさ算出部の算出した文字認識確からしさが高い値を持つデータ領域については、データ削減率を高く設定した態様の画像加工処理を実行し、文字認識確からしさ算出部の算出した文字認識確からしさが低い値を持つデータ領域については、データ削減率を低く設定した態様の画像加工処理を実行する構成であることを特徴とする。   Furthermore, in an embodiment of the image processing apparatus of the present invention, the image processing unit sets a high data reduction rate for a data region having a high character recognition probability value calculated by the character recognition probability calculation unit. The image processing of the aspect is executed, and for the data area having a low character recognition probability calculated by the character recognition probability calculation unit, the image processing of the aspect in which the data reduction rate is set low is executed. It is characterized by that.

さらに、本発明の画像処理装置の一実施態様において、前記画像加工部は、文字認識確からしさ算出部の算出した文字認識確からしさが高い値を持つデータ領域については、非可逆圧縮処理を実行し、文字認識確からしさ算出部の算出した文字認識確からしさが低い値を持つデータ領域については、可逆圧縮処理を実行する構成であることを特徴とする。   Furthermore, in one embodiment of the image processing apparatus of the present invention, the image processing unit performs irreversible compression processing on a data region having a high character recognition probability calculated by the character recognition probability calculation unit. The data region having a low character recognition probability calculated by the character recognition probability calculation unit is configured to perform a reversible compression process.

さらに、本発明の画像処理装置の一実施態様において、前記画像加工部は、圧縮処理、解像度変換処理、解像度変換モード、縮小処理、カラーモード変換処理の少なくともいずれかの処理について、文字認識確からしさ算出部の算出した文字認識確からしさに応じて処理態様を変更した画像加工処理を実行する構成であることを特徴とする。   Furthermore, in an embodiment of the image processing apparatus of the present invention, the image processing unit performs character recognition accuracy for at least one of compression processing, resolution conversion processing, resolution conversion mode, reduction processing, and color mode conversion processing. The image processing is performed by changing the processing mode in accordance with the character recognition probability calculated by the calculation unit.

さらに、本発明の第2の側面は、
入力画像データに基づく文字認識処理を実行する文字認識処理ステップと、
前記文字認識処理ステップにおいて実行された文字認識処理の確からしさを、データ領域毎に算出する文字認識確からしさ算出ステップと、
前記文字認識確からしさ算出ステップにおいて算出したデータ領域毎の文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データのデータ領域ごとの加工処理態様を決定し、決定した処理態様での画像加工処理を実行する画像加工ステップと、
を有することを特徴とする画像処理方法にある。
Furthermore, the second aspect of the present invention provides
A character recognition processing step for executing character recognition processing based on input image data;
A character recognition probability calculating step for calculating the certainty of the character recognition processing executed in the character recognition processing step for each data area;
Based on the character recognition probability for each data area calculated in the character recognition probability calculation step, a processing mode for each data area of the original image data to be subjected to character recognition processing is determined, and an image in the determined processing mode is determined. An image processing step for executing the processing,
An image processing method characterized by comprising:

さらに、本発明の画像処理方法の一実施態様において、前記文字認識処理ステップは、レイアウト解析によって検出されたレイアウト区分ごとの文字認識処理を実行するステップを有し、前記文字認識確からしさ算出ステップは、前記文字認識処理ステップにおいて実行された文字認識処理の確からしさを、前記レイアウト区分ごとに算出し、前記画像加工ステップは、前記文字認識確からしさ算出ステップにおいて算出したレイアウト区分ごとの文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データについて、レイアウト区分ごとに加工処理態様を決定し、決定した処理態様で、レイアウト区分単位で画像加工処理を実行するステップであることを特徴とする。   Furthermore, in an embodiment of the image processing method of the present invention, the character recognition processing step includes a step of executing character recognition processing for each layout category detected by layout analysis, and the character recognition probability calculation step includes The probability of the character recognition processing executed in the character recognition processing step is calculated for each layout category, and the image processing step is the character recognition probability for each layout category calculated in the character recognition accuracy calculation step. On the basis of the above, for the original image data to be subjected to character recognition processing, a processing mode is determined for each layout section, and image processing is executed in units of layout sections in the determined processing mode. .

さらに、本発明の画像処理方法の一実施態様において、前記画像加工ステップは、文字認識確からしさ算出ステップにおいて算出した文字認識確からしさが高い値を持つデータ領域については、データ削減率を高く設定した態様の画像加工処理を実行し、文字認識確からしさ算出ステップの算出した文字認識確からしさが低い値を持つデータ領域については、データ削減率を低く設定した態様の画像加工処理を実行することを特徴とする。   Furthermore, in one embodiment of the image processing method of the present invention, the image processing step sets a high data reduction rate for a data region having a high value of the character recognition probability calculated in the character recognition probability calculation step. The image processing of the aspect is executed, and for the data region having a low character recognition probability calculated by the character recognition probability calculation step, the image processing of the aspect in which the data reduction rate is set low is executed. And

さらに、本発明の画像処理方法の一実施態様において、前記画像加工ステップは、文字認識確からしさ算出ステップにおいて算出した文字認識確からしさが高い値を持つデータ領域については、非可逆圧縮処理を実行し、文字認識確からしさ算出ステップにおいて算出した文字認識確からしさが低い値を持つデータ領域については、可逆圧縮処理を実行することを特徴とする。   Furthermore, in an embodiment of the image processing method of the present invention, the image processing step performs irreversible compression processing on a data area having a high value of the character recognition probability calculated in the character recognition probability calculation step. A reversible compression process is performed for a data region having a low character recognition probability value calculated in the character recognition probability calculation step.

さらに、本発明の画像処理方法の一実施態様において、前記画像加工ステップは、圧縮処理、解像度変換処理、解像度変換モード、縮小処理、カラーモード変換処理の少なくともいずれかの処理について、文字認識確からしさ算出部の算出した文字認識確からしさに応じて処理態様を変更した画像加工処理を実行するステップであることを特徴とする。   Furthermore, in one embodiment of the image processing method of the present invention, the image processing step includes character recognition probability for at least one of compression processing, resolution conversion processing, resolution conversion mode, reduction processing, and color mode conversion processing. It is a step of executing an image processing process in which the processing mode is changed according to the character recognition probability calculated by the calculation unit.

さらに、本発明の第3の側面は、
画像処理を画像処理装置において実行させるコンピュータ・プログラムであり、
入力画像データに基づく文字認識処理を実行する文字認識処理ステップと、
前記文字認識処理ステップにおいて実行された文字認識処理の確からしさを、データ領域毎に算出する文字認識確からしさ算出ステップと、
前記文字認識確からしさ算出ステップにおいて算出したデータ領域毎の文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データのデータ領域ごとの加工処理態様を決定し、決定した処理態様での画像加工処理を実行する画像加工ステップと、
を有することを特徴とするコンピュータ・プログラムにある。
Furthermore, the third aspect of the present invention provides
A computer program for causing an image processing apparatus to execute image processing;
A character recognition processing step for executing character recognition processing based on input image data;
A character recognition probability calculating step for calculating the certainty of the character recognition processing executed in the character recognition processing step for each data area;
Based on the character recognition probability for each data area calculated in the character recognition probability calculation step, a processing mode for each data area of the original image data to be subjected to character recognition processing is determined, and an image in the determined processing mode is determined. An image processing step for executing the processing,
There is a computer program characterized by comprising:

なお、本発明のコンピュータ・プログラムは、例えば、様々なプログラム・コードを実行可能なコンピュータシステムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体、例えば、CDやFD、MOなどの記録媒体、あるいは、ネットワークなどの通信媒体によって提供可能なコンピュータ・プログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、コンピュータシステム上でプログラムに応じた処理が実現される。   Note that the computer program of the present invention is a recording medium provided in a computer-readable format for a computer system capable of executing various program codes, for example, a recording medium such as a CD, FD, or MO. A computer program that can be provided by a medium or a communication medium such as a network. By providing such a program in a computer-readable format, processing corresponding to the program is realized on the computer system.

本発明のさらに他の目的、特徴や利点は、後述する本発明の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。   Other objects, features, and advantages of the present invention will become apparent from a more detailed description based on embodiments of the present invention described later and the accompanying drawings. In this specification, the system is a logical set configuration of a plurality of devices, and is not limited to one in which the devices of each configuration are in the same casing.

本発明の構成によれば、文字認識処理手段(OCR)において、入力画像データに基づく文字認識処理を実行し、実行された文字認識処理の確からしさを算出して、算出した文字認識確からしさに基づいて、保存用オリジナル画像データの加工態様を決定して、画像加工を施して記憶部に格納する構成とした。具体的には、文字認識処理手段において実行された文字認識処理の確からしさを、データ領域毎に算出して、データ領域毎の文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データのデータ領域ごとの加工処理態様を決定し、決定した処理態様での画像加工処理を実行して生成した加工画像データを記憶部に格納する。   According to the configuration of the present invention, the character recognition processing means (OCR) executes the character recognition processing based on the input image data, calculates the likelihood of the executed character recognition processing, and calculates the probability of the calculated character recognition. Based on this, the processing mode of the original image data for storage is determined, the image processing is performed, and the data is stored in the storage unit. Specifically, the probability of the character recognition processing executed in the character recognition processing means is calculated for each data area, and based on the character recognition probability for each data area, the original image data that is the character recognition processing target The processing mode for each data area is determined, and the processed image data generated by executing the image processing in the determined processing mode is stored in the storage unit.

すなわち、文字認識確からしさが高い値を持つデータ領域については、データ削減率を高く設定した態様の画像加工処理を実行し、文字認識確からしさが低い値を持つデータ領域については、データ削減率を低く設定した態様の画像加工処理を実行する。本構成によって、文字認識確からしさが低く、オリジナル画像の参照可能性の高い領域対応のオリジナル画像データについては確実な復元を可能とし、文字認識確からしさが高く、オリジナル画像の参照可能性の低い領域対応のオリジナル画像データについてはデータ削減率を高くして記憶保持することが可能となり、記憶手段に記憶するデータ量削減が実現される。   That is, for a data area having a high character recognition probability, an image processing process with a high data reduction rate is performed, and for a data area having a low character recognition probability, a data reduction rate is set. The image processing of the aspect set low is performed. With this configuration, it is possible to reliably restore original image data corresponding to an area that has a low character recognition accuracy and a high possibility of referring to the original image, and has a high character recognition accuracy and a low possibility of referring to the original image. Corresponding original image data can be stored and held at a high data reduction rate, and the amount of data stored in the storage means can be reduced.

以下、図面を参照しながら本発明の実施形態に係る画像処理装置、および画像処理方法、並びにコンピュータ・プログラムの詳細について説明する。   Hereinafter, an image processing apparatus, an image processing method, and a computer program according to embodiments of the present invention will be described in detail with reference to the drawings.

まず、図1を参照して、本発明の一実施例に係る画像処理装置の構成および処理について説明する。図1は、本発明の一実施例に係る画像処理装置100の構成を示すブロック図である。なお、本発明の画像処理装置100の実行するデータ処理は、画像処理装置100の有するハードウェアと、ソフトウェアとしてのコンピュータ・プログラムを適用することによって実行されるものであり、図1に示す図は、本発明の画像処理装置において実行される複数の処理を個別に説明するために各処理ごとのブロックとして示したブロック図である。なお、画像処理装置のハードウェア構成の具体例については、後段で説明する。   First, the configuration and processing of an image processing apparatus according to an embodiment of the present invention will be described with reference to FIG. FIG. 1 is a block diagram illustrating a configuration of an image processing apparatus 100 according to an embodiment of the present invention. The data processing executed by the image processing apparatus 100 of the present invention is executed by applying the hardware of the image processing apparatus 100 and a computer program as software, and the diagram shown in FIG. FIG. 5 is a block diagram showing a plurality of processes executed in the image processing apparatus of the present invention as blocks for each process in order to individually explain the processes. A specific example of the hardware configuration of the image processing apparatus will be described later.

画像処理装置100は、図1に示すように、画像入力部101、文字認識処理手段としてのOCR(Optical Caracter Recognition)手段102、OCR結果出力部103、文字認識確からしさ算出部104、ユーザ入力部105、画像加工部106、データ記憶部107を有する。なお、OCR手段102は、二値化部111、レイアウト解析部113、文字認識部113を有する。   As shown in FIG. 1, the image processing apparatus 100 includes an image input unit 101, an OCR (Optical Character Recognition) unit 102 as a character recognition processing unit, an OCR result output unit 103, a character recognition probability calculation unit 104, a user input unit. 105, an image processing unit 106, and a data storage unit 107. The OCR unit 102 includes a binarization unit 111, a layout analysis unit 113, and a character recognition unit 113.

画像入力部101は、文字認識処理対象となる画像データ、すなわち文字を含む文書ドキュメントの画像データを入力する。例えばスキャナによって読み取られた画像データ、あるいはハードディスクなどのデータベースから入力する。なお、入力ドキュメントは、イメージデータ、テキストデータ、さらにレイアウト情報などの属性データを含むドキュメントなど様々なデータが含まれる。   The image input unit 101 inputs image data to be subjected to character recognition processing, that is, image data of a document document including characters. For example, it is input from image data read by a scanner or a database such as a hard disk. Note that the input document includes various data such as image data, text data, and a document including attribute data such as layout information.

画像入力部101に入力された文書データは、OCR手段102において、文字認識処理(OCR:Optical Caracter Recognition)が実行される。OCR手段102は、二値化部111、レイアウト解析部113、文字認識部113を有する。二値化部111では、画像入力部101から入力する画像データを、予め設定された閾値を適用して二値化処理を行なう、すなわち、例えば濃淡レベルを指定するある閾値を適用して、画像データについて、白[0]、黒[1]の二値化処理を実行する。   The document data input to the image input unit 101 is subjected to character recognition processing (OCR: Optical Character Recognition) in the OCR unit 102. The OCR unit 102 includes a binarization unit 111, a layout analysis unit 113, and a character recognition unit 113. In the binarization unit 111, the image data input from the image input unit 101 is binarized by applying a preset threshold value, that is, by applying a threshold value that specifies, for example, a gray level, A binarization process of white [0] and black [1] is performed on the data.

レイアウト解析部112は、解析対象のドキュメントの画像データを入力し、ドキュメントのレイアウト解析を実行する。なお、原本ドキュメントに属性情報としてレイアウト情報が含まれる場合は、その情報を適用してもよい。レイアウト情報が含まれない場合は、ドキュメントの画像データに基づいてレイアウト解析を実行する。レイアウト解析手段112におけるレイアウト解析は、ドキュメントに含まれる文字領域の区分処理によって複数のレイアウト区分領域を設定する処理などである。   The layout analysis unit 112 inputs image data of a document to be analyzed, and executes document layout analysis. If layout information is included as attribute information in the original document, that information may be applied. If layout information is not included, layout analysis is performed based on document image data. The layout analysis in the layout analysis unit 112 includes a process of setting a plurality of layout division areas by a division process of character areas included in the document.

文字認識部113は、二値化部111において生成した画像データの二値化情報に基づいて文字認識を実行する。なお、文字認識処理は、レイアウト解析手段112におけるレイアウト解析結果としてのレイアウト区分毎に実行される。   The character recognition unit 113 performs character recognition based on the binarization information of the image data generated by the binarization unit 111. The character recognition process is executed for each layout category as a layout analysis result in the layout analysis unit 112.

文字認識部113の処理結果は、図1に示すOCR結果出力部103を介して、ディスプレイまたはプリンタなどに出力される。さらに、文字認識部113の処理結果は、文字認識確からしさ算出部104に算出される。文字認識確からしさ算出部104では、OCR手段102において実行された文字認識処理の確からしさを各レイアウト単位で検証する処理を実行する。   The processing result of the character recognition unit 113 is output to a display or a printer via the OCR result output unit 103 shown in FIG. Further, the processing result of the character recognition unit 113 is calculated by the character recognition probability calculation unit 104. The character recognition probability calculation unit 104 executes processing for verifying the probability of the character recognition processing executed in the OCR unit 102 for each layout unit.

図2を参照して、OCR手段102および文字認識確からしさ算出部104において実行される具体的な処理例について説明する。画像入力部101には、例えばスキャン処理対象となる原稿画像201に基づく画像データの読み取りが実行される。図2に示すステップS11のスキャン処理が画像入力部101の処理に相当する。   With reference to FIG. 2, a specific processing example executed in the OCR unit 102 and the character recognition probability calculation unit 104 will be described. For example, the image input unit 101 reads image data based on a document image 201 to be scanned. The scan process in step S11 illustrated in FIG. 2 corresponds to the process of the image input unit 101.

その後、図2に示すステップS12において、OCR手段による二値化処理、レイアウト解析処理が実行される。図2に示す解析画像データ202が、二値化処理、レイアウト解析処理の結果の一例である。画像データは、複数のレイアウト区分L1〜Lnに区分される。その後、ステップS13において、文字認識部105における文字認識処理が実行され、例えば図2に示す文字認識結果データ203が生成される。   Thereafter, in step S12 shown in FIG. 2, binarization processing and layout analysis processing by the OCR means are executed. The analysis image data 202 shown in FIG. 2 is an example of the result of binarization processing and layout analysis processing. The image data is divided into a plurality of layout sections L1 to Ln. Thereafter, in step S13, character recognition processing in the character recognition unit 105 is executed, and for example, character recognition result data 203 shown in FIG. 2 is generated.

図2に示す例では、レイアウト区分L3では、全ての文字が正しく認識されているが、レイアウト区分L1,L2には誤って認識された文字が含まれる。図1に示す文字認識確からしさ算出部104は、文字認識部113の文字認識の確からしさをレイアウト区分毎に算出する。   In the example shown in FIG. 2, all characters are correctly recognized in the layout segment L3, but the erroneously recognized characters are included in the layout segments L1 and L2. The character recognition probability calculation unit 104 illustrated in FIG. 1 calculates the character recognition probability of the character recognition unit 113 for each layout category.

この確からしさは、文字認識部113の文字認識結果として得られた文字コード情報の信頼度を示す値として算出される値である。例えば、特許2991779号公報に記載の文字の信頼度値を適用することができる。文字認識確からしさ算出部104は、図2に示すように文字認識部113の文字認識の確からしさを、レイアウト解析手段112におけるレイアウト解析結果としてのレイアウト区分毎に算出する。   The certainty is a value calculated as a value indicating the reliability of the character code information obtained as a character recognition result of the character recognition unit 113. For example, the reliability value of a character described in Japanese Patent No. 2991779 can be applied. As shown in FIG. 2, the character recognition probability calculation unit 104 calculates the character recognition probability of the character recognition unit 113 for each layout category as a layout analysis result in the layout analysis unit 112.

図2に示す例では、
レイアウト区分L1の確からしさ=60%
レイアウト区分L2の確からしさ=75%
レイアウト区分L3の確からしさ=100%
というような結果を文字認識確からしさ算出部104において算出した例を示している。このように、文字認識確からしさ算出部104は、レイアウト区分ごとに文字認識の確からしさを算出する。
In the example shown in FIG.
Probability of layout division L1 = 60%
Probability of layout division L2 = 75%
Probability of layout division L3 = 100%
An example in which the result is calculated by the character recognition probability calculation unit 104 is shown. Thus, the character recognition probability calculation unit 104 calculates the probability of character recognition for each layout category.

このレイアウト区分ごとの文字認識の確からしさの値は、図1に示す画像加工部106に入力される。画像加工部106には、画像入力部101から文字認識処理対象とされたオリジナル画像データが入力され、例えばユーザ入力部105からのユーザ入力情報に従って、オリジナル画像データに基づく加工データ(例えば圧縮処理、カラーモード変更処理などによる加工データ)が生成され、生成された加工画像データが、データ記憶部107に格納される。   The value of the probability of character recognition for each layout section is input to the image processing unit 106 shown in FIG. Original image data to be subjected to character recognition processing is input from the image input unit 101 to the image processing unit 106. For example, in accordance with user input information from the user input unit 105, processed data (for example, compression processing, Processed data by color mode change processing) is generated, and the generated processed image data is stored in the data storage unit 107.

データ記憶部107には、OCR結果出力部103から出力されるOCR結果と、画像加工部106においてオリジナル画像に基づいて生成された加工画像データが併せて格納される。画像加工部106では、レイアウト区分ごとの文字認識の確からしさの値に応じて、各レイアウト区分毎に最適な画像加工処理が選択されて実行される。   The data storage unit 107 stores the OCR result output from the OCR result output unit 103 and the processed image data generated based on the original image by the image processing unit 106. In the image processing unit 106, an optimal image processing process is selected and executed for each layout section in accordance with the probability of character recognition for each layout section.

図3を参照して、画像加工部106における処理例について説明する。先に図2を参照して説明したように、文字認識確からしさ算出部104は、レイアウト区分ごとに文字認識の確からしさを算出する。図3に示すように、
レイアウト区分L1の確からしさ=60%
レイアウト区分L2の確からしさ=75%
レイアウト区分L3の確からしさ=100%
というような結果が、文字認識確からしさ算出部104において算出される。
A processing example in the image processing unit 106 will be described with reference to FIG. As described above with reference to FIG. 2, the character recognition probability calculation unit 104 calculates the probability of character recognition for each layout category. As shown in FIG.
Probability of layout division L1 = 60%
Probability of layout division L2 = 75%
Probability of layout division L3 = 100%
Such a result is calculated by the character recognition probability calculation unit 104.

画像加工部106は、これらの確からしさの値に応じて、オリジナル画像データの加工処理態様を変更する。例えば、図3に示すように、文字認識確からしさ=60%のレイアウト区分L1については、可逆圧縮処理、文字認識確からしさ=75%のレイアウト区分L2については、非可逆圧縮処理、文字認識確からしさ=100%のレイアウト区分L3については、非可逆圧縮処理というように、処理態様を変更する。なお、可逆圧縮としては、LZW方式、ハフマン符号化方式、JPEG方式などが適用可能であり、また非可逆圧縮としては非可逆型のJPEG圧縮などが適用可能である。   The image processing unit 106 changes the processing mode of the original image data in accordance with these certainty values. For example, as shown in FIG. 3, for the layout segment L1 with character recognition accuracy = 60%, the lossless compression processing and for the layout segment L2 with character recognition accuracy = 75%, the lossy compression processing and the character recognition accuracy are performed. For the layout category L3 = 100%, the processing mode is changed, such as lossy compression processing. As the lossless compression, an LZW method, a Huffman coding method, a JPEG method, or the like can be applied. As the lossy compression, an irreversible JPEG compression or the like can be applied.

これは、確からしさの値の低い、レイアウト区分、例えばレイアウト区分L1については、オリジナル画像に基づくOCR結果の修正を行なう必要性が高いため、確実にオリジナル画像の復元が可能な可逆圧縮を行い、その他のレイアウト区分については、確からしさの値が高く、オリジナル画像を参照する可能性が少ないため、より圧縮率を高くしてデータ削減が可能な非可逆圧縮としたものである。   This is because, for a layout category having a low probability value, for example, the layout category L1, it is highly necessary to correct the OCR result based on the original image. Therefore, lossless compression that can reliably restore the original image is performed. The other layout sections have high probability values and are less likely to refer to the original image, and are therefore irreversible compression capable of reducing the data by increasing the compression rate.

なお、画像加工部106では、レイアウト単位に圧縮態様を変更するのみではなく、その他のデータ加工態様についても、OCR認識の確からしさの値に応じて変更する処理を行なう。処理態様の変更の種類について、図4を参照して説明する。   Note that the image processing unit 106 not only changes the compression mode for each layout, but also performs processing for changing other data processing modes according to the probability of OCR recognition. The types of processing mode changes will be described with reference to FIG.

図4には、処理態様を変更する画像加工処理の種類として、
(1)圧縮処理、
(2)解像度変換処理、
(3)解像度変換モード、
(4)縮小処理、
(5)カラーモード変換処理、
これ5つの処理態様を例として示している。
In FIG. 4, as the types of image processing to change the processing mode,
(1) compression processing,
(2) Resolution conversion processing,
(3) Resolution conversion mode,
(4) Reduction processing,
(5) Color mode conversion processing,
These five processing modes are shown as examples.

例えば、
(1)圧縮処理については、
レイアウト区分のOCR認識確からしさの値[高い→低い]に応じて、
(a)確からしさ高:高圧縮率パラメータを適用した非可逆圧縮、
(b)確からしさ中高:中圧縮率パラメータを適用した非可逆圧縮、
(c)確からしさ中低:低圧縮率パラメータを適用した非可逆圧縮、
(b)確からしさ低:可逆圧縮、
これらの処理態様を設定して各レイアウト区分ごとに圧縮処理を実行する。
For example,
(1) About compression processing
Depending on the value of OCR recognition accuracy [high → low] of the layout category,
(A) High probability: lossy compression applying a high compression ratio parameter,
(B) Probability Medium-high: lossy compression applying a medium compression ratio parameter,
(C) Prediction medium low: lossy compression applying a low compression ratio parameter,
(B) Low probability: lossless compression,
These processing modes are set and the compression process is executed for each layout section.

(2)解像度変換処理については、
(a)確からしさ高:100dpi、
(b)確からしさ中:300dpi、
(c)確からしさ低:600dpi、
これらの処理態様を設定して各レイアウト区分ごとに解像度変換を実行する。
(2) About resolution conversion processing
(A) Probability height: 100 dpi,
(B) Medium probability: 300 dpi,
(C) Low probability: 600 dpi,
These processing modes are set, and resolution conversion is executed for each layout section.

(3)解像度変換モードについては、
(a)確からしさ高:最近傍法、
(b)確からしさ中:双線形補間法、
(c)確からしさ低:CubicConvolution法、
これらの処理態様を設定して各レイアウト区分ごとに異なる解像度変換モードを適用する。
(3) For resolution conversion mode,
(A) High probability: nearest neighbor method,
(B) Medium probability: bilinear interpolation,
(C) Low probability: CubicConvolution method,
These processing modes are set, and different resolution conversion modes are applied to the respective layout sections.

なお、最近傍法とは、単純変換法の一種。変換後の画素値を、原画上に逆写像した際に周囲4点に位置する画素のうち最も近い画素の値と等しくする処理であり、速度優先手法であり画質面では他の手法に劣る解像度変換モードである。また、双線形補間法は、補間による拡縮方式(内挿方式)の一種であり、変換後の画素値を、原画像上に逆写像した際に周囲4点に位置する画素の値から直線的に(線形に)補間して求める方法であり、それほど計算量も多くなく、比較的滑らかな画像が得られるが若干ボケが生じる。また、Cubic Convolution法は、補間による拡縮方式(畳み込み方式)の一種であり、変換後の画素値を、原画像上に逆写像した際の周囲16点と、逆写像位置を中心としたsinc(x)=sin(x)/x関数の近似関数との畳み込み演算により求める手法である。この手法は、計算量は多いが、縮小による折り返し歪みが抑えられるなどの特徴から画質は最も良い。   The nearest neighbor method is a kind of simple conversion method. This is a process to make the converted pixel value equal to the value of the nearest pixel among the pixels located at the four surrounding points when reversely mapped on the original image, and is a speed-priority method and inferior to other methods in terms of image quality Conversion mode. The bilinear interpolation method is a kind of enlargement / reduction method (interpolation method) by interpolation. When the converted pixel values are inversely mapped on the original image, linear values are obtained from the values of the pixels located at the surrounding four points. (Linearly) is obtained by interpolation, and the amount of calculation is not so large, and a relatively smooth image can be obtained, but a slight blur occurs. The Cubic Convolution method is a kind of enlargement / reduction method (convolution method) by interpolation, and 16 pixel points when the converted pixel values are inversely mapped on the original image and sinc ( x) = sin (x) / x is a technique for obtaining by a convolution operation with an approximate function. Although this method has a large amount of calculation, it has the best image quality because of its features such as suppression of aliasing distortion due to reduction.

(4)縮小処理については、
(a)確からしさ高:縮小率75%、
(b)確からしさ中:縮小率50%、
(c)確からしさ低:縮小率0%、
これらの処理態様を設定して各レイアウト区分ごとに縮小処理を実行する。
(4) About reduction processing,
(A) High probability: reduction rate 75%,
(B) Medium probability: reduction rate 50%,
(C) Low probability: reduction rate 0%,
These processing modes are set, and the reduction process is executed for each layout section.

(5)カラーモードについては、
(a)確からしさ高:白黒二値、
(b)確からしさ高中:白黒グレー、
(c)確からしさ中低:インデックスカラー法、
(d)確からしさ低:フルカラー、
これらの処理態様を設定して各レイアウト区分ごとに異なるカラーモード設定を行う。
(5) For color mode,
(A) High probability: black and white binary,
(B) High probability medium: black and white gray,
(C) Prediction medium to low: index color method,
(D) Low probability: full color,
By setting these processing modes, different color modes are set for each layout section.

このように、画像加工部106は、確からしさの値の低いレイアウト区分については、データ削減率よりも確実なデータ復元を可能とするデータ加工処理を実行し、確からしさの値の高いレイアウト区分については、データ削減率をより高めの態様でのデータ加工処理を実行し、加工データをデータ記憶部107に格納する。   As described above, the image processing unit 106 performs the data processing process that enables data restoration more reliably than the data reduction rate for the layout category having a low probability value, and the layout category having a high probability value. Performs data processing in a manner of increasing the data reduction rate, and stores the processed data in the data storage unit 107.

なお、ユーザ入力部105を介して、データ加工部106において実行するデータ加工の種類を指定し、指定された種類に対応するデータ加工を行なう構成としてもよい。例えば、圧縮処理のみ、あるいはカラーモード設定のみといった指定、処理が実現される。なお、ユーザ入力に基づく処理実行構成とすることなく、予め、レイアウトの確からしさの値に基づいて実行する処理態様を対応付けて設定した処理決定テーブルをデータ加工部106のメモリに記憶し、各レイアウト区分の確からしさの値に基づいて、処理決定テーブルから実行する処理を選択して実行する構成としてもよい。   Note that the type of data processing to be executed in the data processing unit 106 may be specified via the user input unit 105, and data processing corresponding to the specified type may be performed. For example, designation and processing such as only compression processing or only color mode setting are realized. In addition, without setting the processing execution configuration based on the user input, the processing determination table in which the processing mode to be executed based on the value of the probability of layout is set in advance in association with each other is stored in the memory of the data processing unit 106. A configuration may be adopted in which processing to be executed is selected and executed from the processing determination table based on the probability value of the layout category.

以上、説明したように、本発明の画像処理装置によれば、OCR等の文字認識処理において、各レイアウト区分ごとの確からしさを算出し、確からしさの値に応じて、オリジナル画像データのレイアウト区分ごとの圧縮態様などの画像加工処理態様を決定して、決定した加工態様に従った加工画像データを生成して記憶部に格納する構成としたので、文字認識確からしさが低く、オリジナル画像の参照可能性の高いレイアウト区分に対応するオリジナル画像データについては確実な復元が可能となり、一方、文字認識確からしさが高く、オリジナル画像の参照可能性の低いレイアウト区分に対応するオリジナル画像データについてはデータ削減率を高くした加工画像を生成する構成としたので、記憶手段に記憶するデータ量を削減することが可能となる。   As described above, according to the image processing apparatus of the present invention, in character recognition processing such as OCR, the probability for each layout category is calculated, and the layout category of the original image data is determined according to the value of the probability. Since the image processing processing mode such as each compression mode is determined, and processed image data according to the determined processing mode is generated and stored in the storage unit, the character recognition accuracy is low, and the original image is referred to Original image data corresponding to a highly likely layout category can be reliably restored, while data reduction is possible for original image data corresponding to a layout category with a high probability of character recognition and a low possibility of referring to the original image. Since it is configured to generate processed images with a high rate, it is possible to reduce the amount of data stored in the storage means The ability.

次に、図5に示すフローチャートを参照して、本実施例に係る画像処理装置の処理手順について説明する。ステップS101において、例えばスキャナによって読み取られた画像データ、あるいはハードディスクなどのデータベースからOCR処理対象となる画像データを入力する。   Next, a processing procedure of the image processing apparatus according to the present embodiment will be described with reference to a flowchart shown in FIG. In step S101, for example, image data read by a scanner or image data to be subjected to OCR processing is input from a database such as a hard disk.

次に、ステップS102〜S104において、OCR手段による処理が実行される。ステップS102は、図1に示す二値化部111の処理であり、入力画像データを、予め設定された閾値を適用して二値化処理を行なう、ステップS103は、レイアウト解析部112の処理であり、解析対象のドキュメントの画像データを入力し、ドキュメントのレイアウト解析を実行する。ステップS104は、文字認識部113の処理であり、二値化部111において生成した画像データの二値化情報に基づいて文字認識を実行する。なお、文字認識処理は、例えば、予め各文字毎に準備されたパターンデータとの一致度を判別して、認識文字を決定するパターンマッチング処理として実行される。   Next, in steps S102 to S104, processing by the OCR means is executed. Step S102 is a process of the binarization unit 111 shown in FIG. 1, and the input image data is binarized by applying a preset threshold value. Step S103 is a process of the layout analysis unit 112. Yes, image data of the document to be analyzed is input, and layout analysis of the document is executed. Step S104 is processing of the character recognition unit 113, and performs character recognition based on the binarization information of the image data generated by the binarization unit 111. The character recognition process is executed as a pattern matching process for determining the degree of coincidence with pattern data prepared for each character in advance and determining a recognized character.

次のステップS105は、OCR処理における結果データを出力、保存する処理であり、ディスプレイまたはプリンタ出力、または記憶手段に対する格納処理を行なう。   The next step S105 is a process for outputting and saving the result data in the OCR process, and a display process or a printer output process or a storage process for the storage means is performed.

次のステップS106は、文字認識確からしさ算出部104の処理であり、レイアウト解析手段112におけるレイアウト解析結果としてのレイアウト区分毎に文字認識の確からしさを算出する。   The next step S106 is a process of the character recognition probability calculation unit 104, which calculates the probability of character recognition for each layout category as a layout analysis result in the layout analysis means 112.

次のステップS107は、データ加工法の決定処理であり、図1に示す画像加工部106において、各レイアウト区分に適用する画像加工法を各レイアウト区分の確からしさの値に基づいて決定する。なお、どのような種類の加工処理を実行するかの情報についてはユーザの指定情報を適用してもよいし、または予め設定された情報を適用してもよい。   The next step S107 is a data processing method determination process, in which the image processing unit 106 shown in FIG. 1 determines an image processing method to be applied to each layout section based on the probability value of each layout section. Note that user-specified information may be applied as information on what type of processing is executed, or preset information may be applied.

ステップS108では、ステップS107において決定した加工法を適用して、各レイアウト区分に対応するオリジナル画像データの加工処理を実行する。具体的には、図4を参照して説明した
(1)圧縮処理、
(2)解像度変換処理、
(3)解像度変換モード、
(4)縮小処理、
(5)カラーモード変換処理、
これらの処理が、各レイアウト区分に対応して算出された確からしさの値に応じた処理態様に基づいて画像加工処理が実行される。
In step S108, the processing method determined in step S107 is applied to execute processing of original image data corresponding to each layout category. Specifically, (1) compression processing described with reference to FIG.
(2) Resolution conversion processing,
(3) Resolution conversion mode,
(4) Reduction processing,
(5) Color mode conversion processing,
In these processes, an image processing process is executed based on a processing mode corresponding to the probability value calculated corresponding to each layout category.

ステップS109では、ステップS108において、生成された加工画像データを記憶部に格納する。なお、この加工画像データは、OCR結果データに対応付けたデータとして記憶手段に記憶する構成とすることが好ましい。   In step S109, the processed image data generated in step S108 is stored in the storage unit. The processed image data is preferably stored in the storage unit as data associated with the OCR result data.

最後に、図6を参照して、本発明の画像処理装置のハードウェア構成例について説明する。図6に示す構成は、例えばPCなどによって構成される画像処理装置であり、スキャナ等のデータ読み取り部531と、プリンタなどのデータ出力部532を備えたハード構成例を示している。   Finally, with reference to FIG. 6, a hardware configuration example of the image processing apparatus of the present invention will be described. The configuration illustrated in FIG. 6 is an image processing apparatus configured by, for example, a PC, and illustrates a hardware configuration example including a data reading unit 531 such as a scanner and a data output unit 532 such as a printer.

CPU(Central Processing Unit)501は、上述の実施例において説明した各種のデータ処理、すなわち、OCR処理、確からしさ算出処理、画像加工処理等の各処理の実行シーケンスを記述したコンピュータ・プログラムに従った処理を実行する制御部である。   A CPU (Central Processing Unit) 501 complies with a computer program that describes execution sequences of various types of data processing described in the above-described embodiments, that is, OCR processing, probability calculation processing, image processing processing, and the like. It is a control part which performs a process.

ROM(Read Only Memory)502は、CPU501が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)503は、CPU501の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス504により相互に接続されている。   A ROM (Read Only Memory) 502 stores programs used by the CPU 501, calculation parameters, and the like. A RAM (Random Access Memory) 503 stores programs used in the execution of the CPU 501, parameters that change as appropriate during the execution, and the like. These are connected to each other by a host bus 504 including a CPU bus.

ホストバス504は、ブリッジ505を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス506に接続されている。   The host bus 504 is connected to an external bus 506 such as a PCI (Peripheral Component Interconnect / Interface) bus via a bridge 505.

キーボード508、ポインティングデバイス509は、ユーザにより操作される入力デバイスである。ディスプレイ510は、液晶表示装置またはCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージ情報として表示する。   A keyboard 508 and a pointing device 509 are input devices operated by the user. The display 510 includes a liquid crystal display device, a CRT (Cathode Ray Tube), or the like, and displays various information as text or image information.

HDD(Hard Disk Drive)511は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU501によって実行するプログラムや情報を記録または再生させる。ハードディスクは、入力された画像データに基づくOCR結果データ、さらに前述した処理によって加工された加工画像データなどが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。   An HDD (Hard Disk Drive) 511 includes a hard disk, drives the hard disk, and records or reproduces a program executed by the CPU 501 and information. The hard disk stores OCR result data based on input image data, and further processed image data processed by the above-described processing. Further, various computer programs such as various other data processing programs are stored.

ドライブ512は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体521に記録されているデータまたはプログラムを読み出して、そのデータまたはプログラムを、インタフェース507、外部バス506、ブリッジ505、およびホストバス504を介して接続されているRAM503に供給する。リムーバブル記録媒体521も、ハードディスクと同様のデータ記録領域として利用可能である。   The drive 512 reads data or a program recorded on a removable recording medium 521 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory, and the data or program is read out from the interface 507 and the external bus 506. , And supplied to the RAM 503 connected via the bridge 505 and the host bus 504. The removable recording medium 521 can also be used as a data recording area similar to a hard disk.

接続ポート514は、外部接続機器522を接続するポートであり、USB,IEEE1394等の接続部を持つ。接続ポート514は、インタフェース507、および外部バス506、ブリッジ505、ホストバス504等を介してCPU501等に接続されている。通信部515は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部531は、ドキュメントの読み取り処理を実行し、データ出力部532は、ドキュメントデータの出力処理を実行する。   The connection port 514 is a port for connecting the external connection device 522 and has a connection unit such as USB or IEEE1394. The connection port 514 is connected to the CPU 501 and the like via the interface 507, the external bus 506, the bridge 505, the host bus 504, and the like. The communication unit 515 is connected to a network and executes data communication processing with the outside. The data reading unit 531 executes document reading processing, and the data output unit 532 executes document data output processing.

なお、図6に示す画像処理装置のハードウェア構成例は、1つの装置例を示すものであり、本発明の画像処理装置は、図6に示す構成に限らず、上述した実施例において説明した処理を実行可能な構成であればよい。   Note that the hardware configuration example of the image processing device shown in FIG. 6 shows one device example, and the image processing device of the present invention is not limited to the configuration shown in FIG. Any configuration capable of executing the process may be used.

以上、特定の実施例を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本発明の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。   The present invention has been described in detail above with reference to specific embodiments. However, it is obvious that those skilled in the art can make modifications and substitutions of the embodiments without departing from the gist of the present invention. In other words, the present invention has been disclosed in the form of exemplification, and should not be interpreted in a limited manner. In order to determine the gist of the present invention, the claims should be taken into consideration.

なお、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。   The series of processes described in the specification can be executed by hardware, software, or a combined configuration of both. When executing processing by software, the program recording the processing sequence is installed in a memory in a computer incorporated in dedicated hardware and executed, or the program is executed on a general-purpose computer capable of executing various processing. It can be installed and run.

例えば、プログラムは記録媒体としてのハードディスクやROM(Read Only Memory)に予め記録しておくことができる。あるいは、プログラムはフレキシブルディスク、CD−ROM(Compact Disc Read Only Memory),MO(Magneto optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウエアとして提供することができる。   For example, the program can be recorded in advance on a hard disk or ROM (Read Only Memory) as a recording medium. Alternatively, the program is temporarily or permanently stored on a removable recording medium such as a flexible disk, a CD-ROM (Compact Disc Read Only Memory), an MO (Magneto optical) disk, a DVD (Digital Versatile Disc), a magnetic disk, or a semiconductor memory. It can be stored (recorded). Such a removable recording medium can be provided as so-called package software.

なお、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールする他、ダウンロードサイトから、コンピュータに無線転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。   The program is installed on the computer from the removable recording medium as described above, or is wirelessly transferred from the download site to the computer, or is wired to the computer via a network such as a LAN (Local Area Network) or the Internet. The computer can receive the program transferred in this manner and install it on a recording medium such as a built-in hard disk.

なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。   Note that the various processes described in the specification are not only executed in time series according to the description, but may be executed in parallel or individually according to the processing capability of the apparatus that executes the processes or as necessary. Further, in this specification, the system is a logical set configuration of a plurality of devices, and the devices of each configuration are not limited to being in the same casing.

以上、説明したように、本発明の構成によれば、文字認識処理手段(OCR)において、入力画像データに基づく文字認識処理を実行し、実行された文字認識処理の確からしさを算出して、算出した文字認識確からしさに基づいて、保存用オリジナル画像データの加工態様を決定して、画像加工を施して記憶部に格納する構成とした。具体的には、文字認識処理手段において実行された文字認識処理の確からしさを、データ領域毎に算出して、データ領域毎の文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データのデータ領域ごとの加工処理態様を決定し、決定した処理態様での画像加工処理を実行して生成した加工画像データを記憶部に格納する。   As described above, according to the configuration of the present invention, the character recognition processing means (OCR) executes the character recognition processing based on the input image data, calculates the certainty of the executed character recognition processing, Based on the calculated character recognition probability, the processing mode of the original image data for storage is determined, and the image is processed and stored in the storage unit. Specifically, the probability of the character recognition processing executed in the character recognition processing means is calculated for each data area, and based on the character recognition probability for each data area, the original image data that is the character recognition processing target The processing mode for each data area is determined, and the processed image data generated by executing the image processing in the determined processing mode is stored in the storage unit.

すなわち、文字認識確からしさが高い値を持つデータ領域については、データ削減率を高く設定した態様の画像加工処理を実行し、文字認識確からしさが低い値を持つデータ領域については、データ削減率を低く設定した態様の画像加工処理を実行する。本構成によって、文字認識確からしさが低く、オリジナル画像の参照可能性の高い領域対応のオリジナル画像データについては確実な復元を可能とし、文字認識確からしさが高く、オリジナル画像の参照可能性の低い領域対応のオリジナル画像データについてはデータ削減率を高くして記憶保持することが可能となり、記憶手段に記憶するデータ量削減が実現される。   That is, for a data area having a high character recognition probability, an image processing process with a high data reduction rate is performed, and for a data area having a low character recognition probability, a data reduction rate is set. The image processing of the aspect set low is performed. With this configuration, it is possible to reliably restore original image data corresponding to an area that has a low character recognition accuracy and a high possibility of referring to the original image, and has a high character recognition accuracy and a low possibility of referring to the original image. Corresponding original image data can be stored and held at a high data reduction rate, and the amount of data stored in the storage means can be reduced.

本発明の一実施例に係る画像処理装置の構成を示すブロック図である。1 is a block diagram illustrating a configuration of an image processing apparatus according to an embodiment of the present invention. 本発明の一実施例に係る画像処理装置の実行する処理例について説明する図である。It is a figure explaining the process example which the image processing apparatus which concerns on one Example of this invention performs. 本発明の一実施例に係る画像処理装置の実行する確からしさの値に基づく画像加工処理について説明する図である。It is a figure explaining the image process based on the value of the probability which the image processing apparatus which concerns on one Example of this invention performs. 本発明の一実施例に係る画像処理装置の実行する画像加工処理の種類、態様について説明する図である。It is a figure explaining the kind and aspect of an image processing process which the image processing apparatus which concerns on one Example of this invention performs. 本発明の一実施例に係る画像処理装置の実行する処理シーケンスについて説明するフローチャートを示す図である。It is a figure which shows the flowchart explaining the process sequence which the image processing apparatus which concerns on one Example of this invention performs. 本発明の画像処理装置のハードウェア構成例について説明する図である。It is a figure explaining the hardware structural example of the image processing apparatus of this invention.

符号の説明Explanation of symbols

100 画像処理装置
101 画像入力部
102 OCR手段
103 OCR結果出力部
104 文字認識確からしさ算出部
105 ユーザ入力部
106 画像加工部
107 データ記憶部
111 二値化部
112 レイアウト解析部
113 文字認識部
501 CPU(Central Processing Unit)
502 ROM(Read-Only-Memory)
503 RAM(Random Access Memory)
504 ホストバス
505 ブリッジ
506 外部バス
507 インタフェース
508 キーボード
509 ポインティングデバイス
510 ディスプレイ
511 HDD(Hard Disk Drive)
512 ドライブ
514 接続ポート
515 通信部
521 リムーバブル記録媒体
522 外部接続機器
531 データ読み取り部
532 データ出力部
DESCRIPTION OF SYMBOLS 100 Image processing apparatus 101 Image input part 102 OCR means 103 OCR result output part 104 Character recognition probability calculation part 105 User input part 106 Image processing part 107 Data storage part 111 Binarization part 112 Layout analysis part 113 Character recognition part 501 CPU (Central Processing Unit)
502 ROM (Read-Only-Memory)
503 RAM (Random Access Memory)
504 Host bus 505 Bridge 506 External bus 507 Interface 508 Keyboard 509 Pointing device 510 Display 511 HDD (Hard Disk Drive)
512 drive 514 connection port 515 communication unit 521 removable recording medium 522 external connection device 531 data reading unit 532 data output unit

Claims (11)

入力画像データに基づく文字認識処理を実行する文字認識処理手段と、
前記文字認識処理手段において実行された文字認識処理の確からしさを、データ領域毎に算出する文字認識確からしさ算出部と、
前記文字認識確からしさ算出部の算出したデータ領域毎の文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データのデータ領域ごとの加工処理態様を決定し、決定した処理態様での画像加工処理を実行する画像加工部と、
前記画像加工部の加工した加工画像データを格納する記憶部と、
を有することを特徴とする画像処理装置。
Character recognition processing means for executing character recognition processing based on input image data;
A character recognition probability calculating unit for calculating the probability of the character recognition processing executed in the character recognition processing means for each data area;
Based on the character recognition probability for each data area calculated by the character recognition probability calculation unit, a processing mode for each data area of the original image data to be subjected to character recognition processing is determined, and an image in the determined processing mode is determined. An image processing unit for executing processing,
A storage unit for storing processed image data processed by the image processing unit;
An image processing apparatus comprising:
前記文字認識処理手段は、
レイアウト解析によって検出されたレイアウト区分ごとの文字認識処理を実行する構成であり、
前記文字認識確からしさ算出部は、
前記文字認識処理手段において実行された文字認識処理の確からしさを、前記レイアウト区分ごとに算出し、
前記画像加工部は、
前記文字認識確からしさ算出部の算出したレイアウト区分ごとの文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データについて、レイアウト区分ごとに加工処理態様を決定し、決定した処理態様で、レイアウト区分単位で画像加工処理を実行する構成であることを特徴とする請求項1に記載の画像処理装置。
The character recognition processing means includes:
It is a configuration that executes character recognition processing for each layout category detected by layout analysis,
The character recognition accuracy calculation unit
The probability of the character recognition process executed in the character recognition processing means is calculated for each layout category,
The image processing unit
Based on the character recognition probability for each layout category calculated by the character recognition accuracy calculation unit, for the original image data targeted for character recognition processing, determine the processing mode for each layout category, in the determined processing mode, The image processing apparatus according to claim 1, wherein the image processing processing is executed in units of layout sections.
前記画像加工部は、
文字認識確からしさ算出部の算出した文字認識確からしさが高い値を持つデータ領域については、データ削減率を高く設定した態様の画像加工処理を実行し、
文字認識確からしさ算出部の算出した文字認識確からしさが低い値を持つデータ領域については、データ削減率を低く設定した態様の画像加工処理を実行する構成であることを特徴とする請求項1に記載の画像処理装置。
The image processing unit
For a data region having a high character recognition probability calculated by the character recognition accuracy calculation unit, an image processing process in which the data reduction rate is set high is executed,
The data area having a low character recognition probability calculated by the character recognition probability calculation unit is configured to execute an image processing process in a mode in which the data reduction rate is set low. The image processing apparatus described.
前記画像加工部は、
文字認識確からしさ算出部の算出した文字認識確からしさが高い値を持つデータ領域については、非可逆圧縮処理を実行し、
文字認識確からしさ算出部の算出した文字認識確からしさが低い値を持つデータ領域については、可逆圧縮処理を実行する構成であることを特徴とする請求項1に記載の画像処理装置。
The image processing unit
For a data area having a high character recognition probability calculated by the character recognition accuracy calculation unit, a lossy compression process is performed,
The image processing apparatus according to claim 1, wherein a reversible compression process is executed for a data area having a low character recognition probability calculated by the character recognition probability calculation unit.
前記画像加工部は、
圧縮処理、解像度変換処理、解像度変換モード、縮小処理、カラーモード変換処理の少なくともいずれかの処理について、文字認識確からしさ算出部の算出した文字認識確からしさに応じて処理態様を変更した画像加工処理を実行する構成であることを特徴とする請求項1に記載の画像処理装置。
The image processing unit
An image processing process in which the processing mode is changed according to the character recognition probability calculated by the character recognition probability calculation unit for at least one of compression processing, resolution conversion processing, resolution conversion mode, reduction processing, and color mode conversion processing The image processing apparatus according to claim 1, wherein the image processing apparatus is configured to execute
入力画像データに基づく文字認識処理を実行する文字認識処理ステップと、
前記文字認識処理ステップにおいて実行された文字認識処理の確からしさを、データ領域毎に算出する文字認識確からしさ算出ステップと、
前記文字認識確からしさ算出ステップにおいて算出したデータ領域毎の文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データのデータ領域ごとの加工処理態様を決定し、決定した処理態様での画像加工処理を実行する画像加工ステップと、
を有することを特徴とする画像処理方法。
A character recognition processing step for executing character recognition processing based on input image data;
A character recognition probability calculating step for calculating the certainty of the character recognition processing executed in the character recognition processing step for each data area;
Based on the character recognition probability for each data area calculated in the character recognition probability calculation step, a processing mode for each data area of the original image data to be subjected to character recognition processing is determined, and an image in the determined processing mode is determined. An image processing step for executing the processing,
An image processing method comprising:
前記文字認識処理ステップは、
レイアウト解析によって検出されたレイアウト区分ごとの文字認識処理を実行するステップを有し、
前記文字認識確からしさ算出ステップは、
前記文字認識処理ステップにおいて実行された文字認識処理の確からしさを、前記レイアウト区分ごとに算出し、
前記画像加工ステップは、
前記文字認識確からしさ算出ステップにおいて算出したレイアウト区分ごとの文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データについて、レイアウト区分ごとに加工処理態様を決定し、決定した処理態様で、レイアウト区分単位で画像加工処理を実行するステップであることを特徴とする請求項6に記載の画像処理方法。
The character recognition processing step includes:
A step of performing character recognition processing for each layout category detected by layout analysis;
The character recognition probability calculating step includes:
The probability of the character recognition process executed in the character recognition process step is calculated for each layout category,
The image processing step includes
Based on the character recognition probability for each layout category calculated in the character recognition accuracy calculation step, for the original image data targeted for character recognition processing, determine the processing mode for each layout category, in the determined processing mode, The image processing method according to claim 6, wherein the image processing is a step of executing image processing in units of layout sections.
前記画像加工ステップは、
文字認識確からしさ算出ステップにおいて算出した文字認識確からしさが高い値を持つデータ領域については、データ削減率を高く設定した態様の画像加工処理を実行し、
文字認識確からしさ算出ステップの算出した文字認識確からしさが低い値を持つデータ領域については、データ削減率を低く設定した態様の画像加工処理を実行することを特徴とする請求項6に記載の画像処理方法。
The image processing step includes
For a data region having a high character recognition probability value calculated in the character recognition probability calculation step, an image processing process in which the data reduction rate is set high is executed,
7. The image according to claim 6, wherein an image processing process in which the data reduction rate is set low is executed for a data area having a low character recognition probability calculated by the character recognition probability calculation step. Processing method.
前記画像加工ステップは、
文字認識確からしさ算出ステップにおいて算出した文字認識確からしさが高い値を持つデータ領域については、非可逆圧縮処理を実行し、
文字認識確からしさ算出ステップにおいて算出した文字認識確からしさが低い値を持つデータ領域については、可逆圧縮処理を実行することを特徴とする請求項6に記載の画像処理方法。
The image processing step includes
For a data region having a high character recognition probability calculated in the character recognition probability calculation step, an irreversible compression process is executed,
The image processing method according to claim 6, wherein a lossless compression process is executed for a data area having a low character recognition probability calculated in the character recognition probability calculation step.
前記画像加工ステップは、
圧縮処理、解像度変換処理、解像度変換モード、縮小処理、カラーモード変換処理の少なくともいずれかの処理について、文字認識確からしさ算出部の算出した文字認識確からしさに応じて処理態様を変更した画像加工処理を実行するステップであることを特徴とする請求項6に記載の画像処理方法。
The image processing step includes
An image processing process in which the processing mode is changed according to the character recognition probability calculated by the character recognition probability calculation unit for at least one of compression processing, resolution conversion processing, resolution conversion mode, reduction processing, and color mode conversion processing The image processing method according to claim 6, wherein the image processing method is a step of executing the following.
画像処理を画像処理装置において実行させるコンピュータ・プログラムであり、
入力画像データに基づく文字認識処理を実行する文字認識処理ステップと、
前記文字認識処理ステップにおいて実行された文字認識処理の確からしさを、データ領域毎に算出する文字認識確からしさ算出ステップと、
前記文字認識確からしさ算出ステップにおいて算出したデータ領域毎の文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データのデータ領域ごとの加工処理態様を決定し、決定した処理態様での画像加工処理を実行する画像加工ステップと、
を有することを特徴とするコンピュータ・プログラム。
A computer program for causing an image processing apparatus to execute image processing;
A character recognition processing step for executing character recognition processing based on input image data;
A character recognition probability calculating step for calculating the certainty of the character recognition processing executed in the character recognition processing step for each data area;
Based on the character recognition probability for each data area calculated in the character recognition probability calculation step, a processing mode for each data area of the original image data to be subjected to character recognition processing is determined, and an image in the determined processing mode is determined. An image processing step for executing the processing,
A computer program characterized by comprising:
JP2005273255A 2005-09-21 2005-09-21 Image processor, image processing method and computer program Pending JP2007086956A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005273255A JP2007086956A (en) 2005-09-21 2005-09-21 Image processor, image processing method and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005273255A JP2007086956A (en) 2005-09-21 2005-09-21 Image processor, image processing method and computer program

Publications (1)

Publication Number Publication Date
JP2007086956A true JP2007086956A (en) 2007-04-05

Family

ID=37973903

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005273255A Pending JP2007086956A (en) 2005-09-21 2005-09-21 Image processor, image processing method and computer program

Country Status (1)

Country Link
JP (1) JP2007086956A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010098744A (en) * 2008-10-20 2010-04-30 Toshiba Corp Image processing apparatus and image processing method
JP2015055951A (en) * 2013-09-11 2015-03-23 株式会社リコー Information processing system and information processing method
JP2016206839A (en) * 2015-04-20 2016-12-08 沖電気工業株式会社 Medium recognition device and transaction device
WO2017042981A1 (en) * 2015-09-11 2017-03-16 富士通株式会社 Input processing method, input processing device, input processing program, and input processing system
CN112232195A (en) * 2020-10-15 2021-01-15 北京临近空间飞行器系统工程研究所 Handwritten Chinese character recognition method, device and storage medium

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010098744A (en) * 2008-10-20 2010-04-30 Toshiba Corp Image processing apparatus and image processing method
JP2015055951A (en) * 2013-09-11 2015-03-23 株式会社リコー Information processing system and information processing method
JP2016206839A (en) * 2015-04-20 2016-12-08 沖電気工業株式会社 Medium recognition device and transaction device
WO2017042981A1 (en) * 2015-09-11 2017-03-16 富士通株式会社 Input processing method, input processing device, input processing program, and input processing system
CN112232195A (en) * 2020-10-15 2021-01-15 北京临近空间飞行器系统工程研究所 Handwritten Chinese character recognition method, device and storage medium
CN112232195B (en) * 2020-10-15 2024-02-20 北京临近空间飞行器系统工程研究所 Handwritten Chinese character recognition method, device and storage medium

Similar Documents

Publication Publication Date Title
US8411955B2 (en) Image processing apparatus, image processing method and computer-readable medium
US7567716B2 (en) Method and device for randomly accessing a region of an encoded image for the purpose of decoding it and a method and device for encoding an image
US8213727B2 (en) Image encoding apparatus and image decoding apparatus, and control method thereof
JP2007086954A (en) Character recognition processing device, character recognition processing method, and computer program
JP2004140764A (en) Image processing device and method therefor
US8837770B2 (en) Non-transitory computer readable storage medium, marker creating apparatus, and marker creating method
JP2010206438A (en) Image processing apparatus and image processing program
JP2007086956A (en) Image processor, image processing method and computer program
JP2000048036A (en) Image processor and its method
JP3872217B2 (en) Dither image binary expression processing method, dither image compression binary expression decompression method, and dither image compression and decompression system
JPH08180180A (en) Electronic filing device
JP2005204206A (en) Image processing apparatus, image processing program, and storage medium
JP4802853B2 (en) Image processing apparatus and image processing program
JP6569242B2 (en) Image processing apparatus, image processing system, and image processing program
JPH08237404A (en) Selection of optical character recognition mode
JP4383187B2 (en) Image processing apparatus, image processing program, and storage medium
JP4872780B2 (en) Image processing system and image processing program
US8059906B2 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
JP4237642B2 (en) Image processing apparatus, image processing program, and storage medium
JP5407582B2 (en) Image processing apparatus and image processing program
JP2008109386A (en) Image encoding apparatus and method
KR100611903B1 (en) Method for saving flash memory of mobile communication terminal
JP4992758B2 (en) Image processing apparatus and image processing program
JP4526069B2 (en) Image information arithmetic coding apparatus and image information arithmetic decoding apparatus
JP4935732B2 (en) Image processing apparatus and image processing program