JP2007086956A - Image processor, image processing method and computer program - Google Patents
Image processor, image processing method and computer program Download PDFInfo
- Publication number
- JP2007086956A JP2007086956A JP2005273255A JP2005273255A JP2007086956A JP 2007086956 A JP2007086956 A JP 2007086956A JP 2005273255 A JP2005273255 A JP 2005273255A JP 2005273255 A JP2005273255 A JP 2005273255A JP 2007086956 A JP2007086956 A JP 2007086956A
- Authority
- JP
- Japan
- Prior art keywords
- character recognition
- processing
- image
- image processing
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims description 20
- 238000004590 computer program Methods 0.000 title claims description 14
- 238000012545 processing Methods 0.000 claims abstract description 313
- 238000000034 method Methods 0.000 claims abstract description 69
- 230000009467 reduction Effects 0.000 claims abstract description 33
- 238000004364 calculation method Methods 0.000 claims description 48
- 230000008569 process Effects 0.000 claims description 48
- 238000007906 compression Methods 0.000 claims description 41
- 230000006835 compression Effects 0.000 claims description 34
- 238000006243 chemical reaction Methods 0.000 claims description 24
- 238000004458 analytical method Methods 0.000 claims description 23
- 230000002427 irreversible effect Effects 0.000 claims description 6
- 230000002441 reversible effect Effects 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 abstract 1
- 238000012015 optical character recognition Methods 0.000 description 41
- 238000013500 data storage Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Abstract
Description
本発明は、画像処理装置、および画像処理方法、および画像処理方法、並びにコンピュータ・プログラムに関する。さらに詳細には、文字認識処理(OCR:Optical Caracter Recognition)によって電子化文書データを生成し、オリジナル文書画像データを保存する構成を持つ画像処理装置、および画像処理方法、並びにコンピュータ・プログラムに関する。 The present invention relates to an image processing apparatus, an image processing method, an image processing method, and a computer program. More specifically, the present invention relates to an image processing apparatus, an image processing method, and a computer program that generate electronic document data by character recognition processing (OCR: Optical Character Recognition) and store original document image data.
文書原稿を電子保存する場合、原稿を画像データ化した状態で保持しておくことが一般的である。特にデータの再利用性の観点からみると、テキスト領域については、文字認識処理(OCR:Optical Caracter Recognition)によって、コード化して保存することが好ましい。 When a document document is stored electronically, it is common to store the document as image data. In particular, from the viewpoint of data reusability, the text region is preferably encoded and stored by character recognition processing (OCR: Optical Character Recognition).
OCRによる文字認識率は電子文書の信頼度に大きく関わってくる。しかしながらOCRの認識率、文字判定確からしさは100%ではなく、多くの場合、文書を電子化して保存する場合には、電子化データとともに、オリジナル原稿画像の保存が必要となる。これは、電子化データの確認や、修正などのOCR処理結果精査の際に、オリジナル原稿画像を参照可能とするためである。 The character recognition rate by OCR is greatly related to the reliability of electronic documents. However, the OCR recognition rate and the accuracy of character determination are not 100%. In many cases, when an electronic document is stored, it is necessary to store the original document image together with the electronic data. This is to make it possible to refer to the original document image when checking the digitized data and examining the OCR processing result such as correction.
OCR処理結果精査時の原稿画像確認処理構成を開示した従来技術としては、例えば、OCR処理時に、認識精度の低いと判定される領域を表示し、ユーザによる修正の際の参照とする構成が特許文献1に開示されている。また、OCR精度を利用した従来技術としては、文字毎に文字認識精度を判定し、精度が低いと判定された文字を、スペースまたは特定文字などで置き換える構成が特許文献2に開示されている。 As a conventional technique that discloses a document image confirmation processing configuration at the time of examining an OCR processing result, for example, a configuration in which an area determined to have low recognition accuracy at the time of OCR processing is displayed and used as a reference for correction by a user is patented. It is disclosed in Document 1. Further, as a conventional technique using the OCR accuracy, Patent Document 2 discloses a configuration in which character recognition accuracy is determined for each character, and a character determined to have low accuracy is replaced with a space or a specific character.
OCRにおいて誤認識された文字については、オペレータによってオリジナル原稿画像が参照され、修正することが可能となる。具体的には、人間がオリジナル文書画像データと電子化されたテキストデータ(OCR結果)を目視等で比較し、テキストを修正するという作業である。しかし、情報欠落を恐れるあまりに文書画像を圧縮なし、または低い圧縮率で保存してしまうと、容量の大きい画像データはディスク容量を圧迫することになる。一方、高圧縮率の非可逆圧縮処理などを行なってしまうと、オリジナル画像データの復元に失敗し、オリジナルデータに基づく修正が困難なる場合がある。
本発明は、上述の問題点に鑑みてなされたものであり、文字認識処理(OCR)によって電子化文書データを生成し、オリジナル文書画像データを保存する場合の、オリジナル文書画像データの保存態様、すなわち圧縮処理などの画像加工処理態様を、文字認識の確からしさに応じて動的に変更する構成として、効率的なデータ保存を実現する画像処理装置、および画像処理方法、並びにコンピュータ・プログラムを提供することを目的とする。 The present invention has been made in view of the above-mentioned problems, and a storage mode of original document image data when electronic document data is generated by character recognition processing (OCR) and the original document image data is stored. That is, an image processing apparatus, an image processing method, and a computer program that realize efficient data storage are provided as a configuration that dynamically changes an image processing processing mode such as compression processing according to the probability of character recognition. The purpose is to do.
本発明の第1の側面は、
入力画像データに基づく文字認識処理を実行する文字認識処理手段と、
前記文字認識処理手段において実行された文字認識処理の確からしさを、データ領域毎に算出する文字認識確からしさ算出部と、
前記文字認識確からしさ算出部の算出したデータ領域毎の文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データのデータ領域ごとの加工処理態様を決定し、決定した処理態様での画像加工処理を実行する画像加工部と、
前記画像加工部の加工した加工画像データを格納する記憶部と、
を有することを特徴とする画像処理装置にある。
The first aspect of the present invention is:
Character recognition processing means for executing character recognition processing based on input image data;
A character recognition probability calculating unit for calculating the probability of the character recognition processing executed in the character recognition processing means for each data area;
Based on the character recognition probability for each data area calculated by the character recognition probability calculation unit, a processing mode for each data area of the original image data to be subjected to character recognition processing is determined, and an image in the determined processing mode is determined. An image processing unit for executing processing,
A storage unit for storing processed image data processed by the image processing unit;
An image processing apparatus characterized by comprising:
さらに、本発明の画像処理装置の一実施態様において、前記文字認識処理手段は、レイアウト解析によって検出されたレイアウト区分ごとの文字認識処理を実行する構成であり、前記文字認識確からしさ算出部は、前記文字認識処理手段において実行された文字認識処理の確からしさを、前記レイアウト区分ごとに算出し、前記画像加工部は、前記文字認識確からしさ算出部の算出したレイアウト区分ごとの文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データについて、レイアウト区分ごとに加工処理態様を決定し、決定した処理態様で、レイアウト区分単位で画像加工処理を実行する構成であることを特徴とする。 Furthermore, in an embodiment of the image processing apparatus of the present invention, the character recognition processing unit is configured to execute a character recognition process for each layout category detected by layout analysis, and the character recognition probability calculation unit includes: The probability of the character recognition processing executed in the character recognition processing means is calculated for each layout category, and the image processing unit determines the character recognition probability for each layout category calculated by the character recognition probability calculation unit. Based on the above, the original image data to be subjected to the character recognition process is characterized in that a processing mode is determined for each layout section, and an image processing process is executed for each layout section in the determined processing mode.
さらに、本発明の画像処理装置の一実施態様において、前記画像加工部は、文字認識確からしさ算出部の算出した文字認識確からしさが高い値を持つデータ領域については、データ削減率を高く設定した態様の画像加工処理を実行し、文字認識確からしさ算出部の算出した文字認識確からしさが低い値を持つデータ領域については、データ削減率を低く設定した態様の画像加工処理を実行する構成であることを特徴とする。 Furthermore, in an embodiment of the image processing apparatus of the present invention, the image processing unit sets a high data reduction rate for a data region having a high character recognition probability value calculated by the character recognition probability calculation unit. The image processing of the aspect is executed, and for the data area having a low character recognition probability calculated by the character recognition probability calculation unit, the image processing of the aspect in which the data reduction rate is set low is executed. It is characterized by that.
さらに、本発明の画像処理装置の一実施態様において、前記画像加工部は、文字認識確からしさ算出部の算出した文字認識確からしさが高い値を持つデータ領域については、非可逆圧縮処理を実行し、文字認識確からしさ算出部の算出した文字認識確からしさが低い値を持つデータ領域については、可逆圧縮処理を実行する構成であることを特徴とする。 Furthermore, in one embodiment of the image processing apparatus of the present invention, the image processing unit performs irreversible compression processing on a data region having a high character recognition probability calculated by the character recognition probability calculation unit. The data region having a low character recognition probability calculated by the character recognition probability calculation unit is configured to perform a reversible compression process.
さらに、本発明の画像処理装置の一実施態様において、前記画像加工部は、圧縮処理、解像度変換処理、解像度変換モード、縮小処理、カラーモード変換処理の少なくともいずれかの処理について、文字認識確からしさ算出部の算出した文字認識確からしさに応じて処理態様を変更した画像加工処理を実行する構成であることを特徴とする。 Furthermore, in an embodiment of the image processing apparatus of the present invention, the image processing unit performs character recognition accuracy for at least one of compression processing, resolution conversion processing, resolution conversion mode, reduction processing, and color mode conversion processing. The image processing is performed by changing the processing mode in accordance with the character recognition probability calculated by the calculation unit.
さらに、本発明の第2の側面は、
入力画像データに基づく文字認識処理を実行する文字認識処理ステップと、
前記文字認識処理ステップにおいて実行された文字認識処理の確からしさを、データ領域毎に算出する文字認識確からしさ算出ステップと、
前記文字認識確からしさ算出ステップにおいて算出したデータ領域毎の文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データのデータ領域ごとの加工処理態様を決定し、決定した処理態様での画像加工処理を実行する画像加工ステップと、
を有することを特徴とする画像処理方法にある。
Furthermore, the second aspect of the present invention provides
A character recognition processing step for executing character recognition processing based on input image data;
A character recognition probability calculating step for calculating the certainty of the character recognition processing executed in the character recognition processing step for each data area;
Based on the character recognition probability for each data area calculated in the character recognition probability calculation step, a processing mode for each data area of the original image data to be subjected to character recognition processing is determined, and an image in the determined processing mode is determined. An image processing step for executing the processing,
An image processing method characterized by comprising:
さらに、本発明の画像処理方法の一実施態様において、前記文字認識処理ステップは、レイアウト解析によって検出されたレイアウト区分ごとの文字認識処理を実行するステップを有し、前記文字認識確からしさ算出ステップは、前記文字認識処理ステップにおいて実行された文字認識処理の確からしさを、前記レイアウト区分ごとに算出し、前記画像加工ステップは、前記文字認識確からしさ算出ステップにおいて算出したレイアウト区分ごとの文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データについて、レイアウト区分ごとに加工処理態様を決定し、決定した処理態様で、レイアウト区分単位で画像加工処理を実行するステップであることを特徴とする。 Furthermore, in an embodiment of the image processing method of the present invention, the character recognition processing step includes a step of executing character recognition processing for each layout category detected by layout analysis, and the character recognition probability calculation step includes The probability of the character recognition processing executed in the character recognition processing step is calculated for each layout category, and the image processing step is the character recognition probability for each layout category calculated in the character recognition accuracy calculation step. On the basis of the above, for the original image data to be subjected to character recognition processing, a processing mode is determined for each layout section, and image processing is executed in units of layout sections in the determined processing mode. .
さらに、本発明の画像処理方法の一実施態様において、前記画像加工ステップは、文字認識確からしさ算出ステップにおいて算出した文字認識確からしさが高い値を持つデータ領域については、データ削減率を高く設定した態様の画像加工処理を実行し、文字認識確からしさ算出ステップの算出した文字認識確からしさが低い値を持つデータ領域については、データ削減率を低く設定した態様の画像加工処理を実行することを特徴とする。 Furthermore, in one embodiment of the image processing method of the present invention, the image processing step sets a high data reduction rate for a data region having a high value of the character recognition probability calculated in the character recognition probability calculation step. The image processing of the aspect is executed, and for the data region having a low character recognition probability calculated by the character recognition probability calculation step, the image processing of the aspect in which the data reduction rate is set low is executed. And
さらに、本発明の画像処理方法の一実施態様において、前記画像加工ステップは、文字認識確からしさ算出ステップにおいて算出した文字認識確からしさが高い値を持つデータ領域については、非可逆圧縮処理を実行し、文字認識確からしさ算出ステップにおいて算出した文字認識確からしさが低い値を持つデータ領域については、可逆圧縮処理を実行することを特徴とする。 Furthermore, in an embodiment of the image processing method of the present invention, the image processing step performs irreversible compression processing on a data area having a high value of the character recognition probability calculated in the character recognition probability calculation step. A reversible compression process is performed for a data region having a low character recognition probability value calculated in the character recognition probability calculation step.
さらに、本発明の画像処理方法の一実施態様において、前記画像加工ステップは、圧縮処理、解像度変換処理、解像度変換モード、縮小処理、カラーモード変換処理の少なくともいずれかの処理について、文字認識確からしさ算出部の算出した文字認識確からしさに応じて処理態様を変更した画像加工処理を実行するステップであることを特徴とする。 Furthermore, in one embodiment of the image processing method of the present invention, the image processing step includes character recognition probability for at least one of compression processing, resolution conversion processing, resolution conversion mode, reduction processing, and color mode conversion processing. It is a step of executing an image processing process in which the processing mode is changed according to the character recognition probability calculated by the calculation unit.
さらに、本発明の第3の側面は、
画像処理を画像処理装置において実行させるコンピュータ・プログラムであり、
入力画像データに基づく文字認識処理を実行する文字認識処理ステップと、
前記文字認識処理ステップにおいて実行された文字認識処理の確からしさを、データ領域毎に算出する文字認識確からしさ算出ステップと、
前記文字認識確からしさ算出ステップにおいて算出したデータ領域毎の文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データのデータ領域ごとの加工処理態様を決定し、決定した処理態様での画像加工処理を実行する画像加工ステップと、
を有することを特徴とするコンピュータ・プログラムにある。
Furthermore, the third aspect of the present invention provides
A computer program for causing an image processing apparatus to execute image processing;
A character recognition processing step for executing character recognition processing based on input image data;
A character recognition probability calculating step for calculating the certainty of the character recognition processing executed in the character recognition processing step for each data area;
Based on the character recognition probability for each data area calculated in the character recognition probability calculation step, a processing mode for each data area of the original image data to be subjected to character recognition processing is determined, and an image in the determined processing mode is determined. An image processing step for executing the processing,
There is a computer program characterized by comprising:
なお、本発明のコンピュータ・プログラムは、例えば、様々なプログラム・コードを実行可能なコンピュータシステムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体、例えば、CDやFD、MOなどの記録媒体、あるいは、ネットワークなどの通信媒体によって提供可能なコンピュータ・プログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、コンピュータシステム上でプログラムに応じた処理が実現される。 Note that the computer program of the present invention is a recording medium provided in a computer-readable format for a computer system capable of executing various program codes, for example, a recording medium such as a CD, FD, or MO. A computer program that can be provided by a medium or a communication medium such as a network. By providing such a program in a computer-readable format, processing corresponding to the program is realized on the computer system.
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。 Other objects, features, and advantages of the present invention will become apparent from a more detailed description based on embodiments of the present invention described later and the accompanying drawings. In this specification, the system is a logical set configuration of a plurality of devices, and is not limited to one in which the devices of each configuration are in the same casing.
本発明の構成によれば、文字認識処理手段(OCR)において、入力画像データに基づく文字認識処理を実行し、実行された文字認識処理の確からしさを算出して、算出した文字認識確からしさに基づいて、保存用オリジナル画像データの加工態様を決定して、画像加工を施して記憶部に格納する構成とした。具体的には、文字認識処理手段において実行された文字認識処理の確からしさを、データ領域毎に算出して、データ領域毎の文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データのデータ領域ごとの加工処理態様を決定し、決定した処理態様での画像加工処理を実行して生成した加工画像データを記憶部に格納する。 According to the configuration of the present invention, the character recognition processing means (OCR) executes the character recognition processing based on the input image data, calculates the likelihood of the executed character recognition processing, and calculates the probability of the calculated character recognition. Based on this, the processing mode of the original image data for storage is determined, the image processing is performed, and the data is stored in the storage unit. Specifically, the probability of the character recognition processing executed in the character recognition processing means is calculated for each data area, and based on the character recognition probability for each data area, the original image data that is the character recognition processing target The processing mode for each data area is determined, and the processed image data generated by executing the image processing in the determined processing mode is stored in the storage unit.
すなわち、文字認識確からしさが高い値を持つデータ領域については、データ削減率を高く設定した態様の画像加工処理を実行し、文字認識確からしさが低い値を持つデータ領域については、データ削減率を低く設定した態様の画像加工処理を実行する。本構成によって、文字認識確からしさが低く、オリジナル画像の参照可能性の高い領域対応のオリジナル画像データについては確実な復元を可能とし、文字認識確からしさが高く、オリジナル画像の参照可能性の低い領域対応のオリジナル画像データについてはデータ削減率を高くして記憶保持することが可能となり、記憶手段に記憶するデータ量削減が実現される。 That is, for a data area having a high character recognition probability, an image processing process with a high data reduction rate is performed, and for a data area having a low character recognition probability, a data reduction rate is set. The image processing of the aspect set low is performed. With this configuration, it is possible to reliably restore original image data corresponding to an area that has a low character recognition accuracy and a high possibility of referring to the original image, and has a high character recognition accuracy and a low possibility of referring to the original image. Corresponding original image data can be stored and held at a high data reduction rate, and the amount of data stored in the storage means can be reduced.
以下、図面を参照しながら本発明の実施形態に係る画像処理装置、および画像処理方法、並びにコンピュータ・プログラムの詳細について説明する。 Hereinafter, an image processing apparatus, an image processing method, and a computer program according to embodiments of the present invention will be described in detail with reference to the drawings.
まず、図1を参照して、本発明の一実施例に係る画像処理装置の構成および処理について説明する。図1は、本発明の一実施例に係る画像処理装置100の構成を示すブロック図である。なお、本発明の画像処理装置100の実行するデータ処理は、画像処理装置100の有するハードウェアと、ソフトウェアとしてのコンピュータ・プログラムを適用することによって実行されるものであり、図1に示す図は、本発明の画像処理装置において実行される複数の処理を個別に説明するために各処理ごとのブロックとして示したブロック図である。なお、画像処理装置のハードウェア構成の具体例については、後段で説明する。
First, the configuration and processing of an image processing apparatus according to an embodiment of the present invention will be described with reference to FIG. FIG. 1 is a block diagram illustrating a configuration of an
画像処理装置100は、図1に示すように、画像入力部101、文字認識処理手段としてのOCR(Optical Caracter Recognition)手段102、OCR結果出力部103、文字認識確からしさ算出部104、ユーザ入力部105、画像加工部106、データ記憶部107を有する。なお、OCR手段102は、二値化部111、レイアウト解析部113、文字認識部113を有する。
As shown in FIG. 1, the
画像入力部101は、文字認識処理対象となる画像データ、すなわち文字を含む文書ドキュメントの画像データを入力する。例えばスキャナによって読み取られた画像データ、あるいはハードディスクなどのデータベースから入力する。なお、入力ドキュメントは、イメージデータ、テキストデータ、さらにレイアウト情報などの属性データを含むドキュメントなど様々なデータが含まれる。
The
画像入力部101に入力された文書データは、OCR手段102において、文字認識処理(OCR:Optical Caracter Recognition)が実行される。OCR手段102は、二値化部111、レイアウト解析部113、文字認識部113を有する。二値化部111では、画像入力部101から入力する画像データを、予め設定された閾値を適用して二値化処理を行なう、すなわち、例えば濃淡レベルを指定するある閾値を適用して、画像データについて、白[0]、黒[1]の二値化処理を実行する。
The document data input to the
レイアウト解析部112は、解析対象のドキュメントの画像データを入力し、ドキュメントのレイアウト解析を実行する。なお、原本ドキュメントに属性情報としてレイアウト情報が含まれる場合は、その情報を適用してもよい。レイアウト情報が含まれない場合は、ドキュメントの画像データに基づいてレイアウト解析を実行する。レイアウト解析手段112におけるレイアウト解析は、ドキュメントに含まれる文字領域の区分処理によって複数のレイアウト区分領域を設定する処理などである。
The
文字認識部113は、二値化部111において生成した画像データの二値化情報に基づいて文字認識を実行する。なお、文字認識処理は、レイアウト解析手段112におけるレイアウト解析結果としてのレイアウト区分毎に実行される。
The
文字認識部113の処理結果は、図1に示すOCR結果出力部103を介して、ディスプレイまたはプリンタなどに出力される。さらに、文字認識部113の処理結果は、文字認識確からしさ算出部104に算出される。文字認識確からしさ算出部104では、OCR手段102において実行された文字認識処理の確からしさを各レイアウト単位で検証する処理を実行する。
The processing result of the
図2を参照して、OCR手段102および文字認識確からしさ算出部104において実行される具体的な処理例について説明する。画像入力部101には、例えばスキャン処理対象となる原稿画像201に基づく画像データの読み取りが実行される。図2に示すステップS11のスキャン処理が画像入力部101の処理に相当する。
With reference to FIG. 2, a specific processing example executed in the
その後、図2に示すステップS12において、OCR手段による二値化処理、レイアウト解析処理が実行される。図2に示す解析画像データ202が、二値化処理、レイアウト解析処理の結果の一例である。画像データは、複数のレイアウト区分L1〜Lnに区分される。その後、ステップS13において、文字認識部105における文字認識処理が実行され、例えば図2に示す文字認識結果データ203が生成される。
Thereafter, in step S12 shown in FIG. 2, binarization processing and layout analysis processing by the OCR means are executed. The
図2に示す例では、レイアウト区分L3では、全ての文字が正しく認識されているが、レイアウト区分L1,L2には誤って認識された文字が含まれる。図1に示す文字認識確からしさ算出部104は、文字認識部113の文字認識の確からしさをレイアウト区分毎に算出する。
In the example shown in FIG. 2, all characters are correctly recognized in the layout segment L3, but the erroneously recognized characters are included in the layout segments L1 and L2. The character recognition
この確からしさは、文字認識部113の文字認識結果として得られた文字コード情報の信頼度を示す値として算出される値である。例えば、特許2991779号公報に記載の文字の信頼度値を適用することができる。文字認識確からしさ算出部104は、図2に示すように文字認識部113の文字認識の確からしさを、レイアウト解析手段112におけるレイアウト解析結果としてのレイアウト区分毎に算出する。
The certainty is a value calculated as a value indicating the reliability of the character code information obtained as a character recognition result of the
図2に示す例では、
レイアウト区分L1の確からしさ=60%
レイアウト区分L2の確からしさ=75%
レイアウト区分L3の確からしさ=100%
というような結果を文字認識確からしさ算出部104において算出した例を示している。このように、文字認識確からしさ算出部104は、レイアウト区分ごとに文字認識の確からしさを算出する。
In the example shown in FIG.
Probability of layout division L1 = 60%
Probability of layout division L2 = 75%
Probability of layout division L3 = 100%
An example in which the result is calculated by the character recognition
このレイアウト区分ごとの文字認識の確からしさの値は、図1に示す画像加工部106に入力される。画像加工部106には、画像入力部101から文字認識処理対象とされたオリジナル画像データが入力され、例えばユーザ入力部105からのユーザ入力情報に従って、オリジナル画像データに基づく加工データ(例えば圧縮処理、カラーモード変更処理などによる加工データ)が生成され、生成された加工画像データが、データ記憶部107に格納される。
The value of the probability of character recognition for each layout section is input to the
データ記憶部107には、OCR結果出力部103から出力されるOCR結果と、画像加工部106においてオリジナル画像に基づいて生成された加工画像データが併せて格納される。画像加工部106では、レイアウト区分ごとの文字認識の確からしさの値に応じて、各レイアウト区分毎に最適な画像加工処理が選択されて実行される。
The
図3を参照して、画像加工部106における処理例について説明する。先に図2を参照して説明したように、文字認識確からしさ算出部104は、レイアウト区分ごとに文字認識の確からしさを算出する。図3に示すように、
レイアウト区分L1の確からしさ=60%
レイアウト区分L2の確からしさ=75%
レイアウト区分L3の確からしさ=100%
というような結果が、文字認識確からしさ算出部104において算出される。
A processing example in the
Probability of layout division L1 = 60%
Probability of layout division L2 = 75%
Probability of layout division L3 = 100%
Such a result is calculated by the character recognition
画像加工部106は、これらの確からしさの値に応じて、オリジナル画像データの加工処理態様を変更する。例えば、図3に示すように、文字認識確からしさ=60%のレイアウト区分L1については、可逆圧縮処理、文字認識確からしさ=75%のレイアウト区分L2については、非可逆圧縮処理、文字認識確からしさ=100%のレイアウト区分L3については、非可逆圧縮処理というように、処理態様を変更する。なお、可逆圧縮としては、LZW方式、ハフマン符号化方式、JPEG方式などが適用可能であり、また非可逆圧縮としては非可逆型のJPEG圧縮などが適用可能である。
The
これは、確からしさの値の低い、レイアウト区分、例えばレイアウト区分L1については、オリジナル画像に基づくOCR結果の修正を行なう必要性が高いため、確実にオリジナル画像の復元が可能な可逆圧縮を行い、その他のレイアウト区分については、確からしさの値が高く、オリジナル画像を参照する可能性が少ないため、より圧縮率を高くしてデータ削減が可能な非可逆圧縮としたものである。 This is because, for a layout category having a low probability value, for example, the layout category L1, it is highly necessary to correct the OCR result based on the original image. Therefore, lossless compression that can reliably restore the original image is performed. The other layout sections have high probability values and are less likely to refer to the original image, and are therefore irreversible compression capable of reducing the data by increasing the compression rate.
なお、画像加工部106では、レイアウト単位に圧縮態様を変更するのみではなく、その他のデータ加工態様についても、OCR認識の確からしさの値に応じて変更する処理を行なう。処理態様の変更の種類について、図4を参照して説明する。
Note that the
図4には、処理態様を変更する画像加工処理の種類として、
(1)圧縮処理、
(2)解像度変換処理、
(3)解像度変換モード、
(4)縮小処理、
(5)カラーモード変換処理、
これ5つの処理態様を例として示している。
In FIG. 4, as the types of image processing to change the processing mode,
(1) compression processing,
(2) Resolution conversion processing,
(3) Resolution conversion mode,
(4) Reduction processing,
(5) Color mode conversion processing,
These five processing modes are shown as examples.
例えば、
(1)圧縮処理については、
レイアウト区分のOCR認識確からしさの値[高い→低い]に応じて、
(a)確からしさ高:高圧縮率パラメータを適用した非可逆圧縮、
(b)確からしさ中高:中圧縮率パラメータを適用した非可逆圧縮、
(c)確からしさ中低:低圧縮率パラメータを適用した非可逆圧縮、
(b)確からしさ低:可逆圧縮、
これらの処理態様を設定して各レイアウト区分ごとに圧縮処理を実行する。
For example,
(1) About compression processing
Depending on the value of OCR recognition accuracy [high → low] of the layout category,
(A) High probability: lossy compression applying a high compression ratio parameter,
(B) Probability Medium-high: lossy compression applying a medium compression ratio parameter,
(C) Prediction medium low: lossy compression applying a low compression ratio parameter,
(B) Low probability: lossless compression,
These processing modes are set and the compression process is executed for each layout section.
(2)解像度変換処理については、
(a)確からしさ高:100dpi、
(b)確からしさ中:300dpi、
(c)確からしさ低:600dpi、
これらの処理態様を設定して各レイアウト区分ごとに解像度変換を実行する。
(2) About resolution conversion processing
(A) Probability height: 100 dpi,
(B) Medium probability: 300 dpi,
(C) Low probability: 600 dpi,
These processing modes are set, and resolution conversion is executed for each layout section.
(3)解像度変換モードについては、
(a)確からしさ高:最近傍法、
(b)確からしさ中:双線形補間法、
(c)確からしさ低:CubicConvolution法、
これらの処理態様を設定して各レイアウト区分ごとに異なる解像度変換モードを適用する。
(3) For resolution conversion mode,
(A) High probability: nearest neighbor method,
(B) Medium probability: bilinear interpolation,
(C) Low probability: CubicConvolution method,
These processing modes are set, and different resolution conversion modes are applied to the respective layout sections.
なお、最近傍法とは、単純変換法の一種。変換後の画素値を、原画上に逆写像した際に周囲4点に位置する画素のうち最も近い画素の値と等しくする処理であり、速度優先手法であり画質面では他の手法に劣る解像度変換モードである。また、双線形補間法は、補間による拡縮方式(内挿方式)の一種であり、変換後の画素値を、原画像上に逆写像した際に周囲4点に位置する画素の値から直線的に(線形に)補間して求める方法であり、それほど計算量も多くなく、比較的滑らかな画像が得られるが若干ボケが生じる。また、Cubic Convolution法は、補間による拡縮方式(畳み込み方式)の一種であり、変換後の画素値を、原画像上に逆写像した際の周囲16点と、逆写像位置を中心としたsinc(x)=sin(x)/x関数の近似関数との畳み込み演算により求める手法である。この手法は、計算量は多いが、縮小による折り返し歪みが抑えられるなどの特徴から画質は最も良い。 The nearest neighbor method is a kind of simple conversion method. This is a process to make the converted pixel value equal to the value of the nearest pixel among the pixels located at the four surrounding points when reversely mapped on the original image, and is a speed-priority method and inferior to other methods in terms of image quality Conversion mode. The bilinear interpolation method is a kind of enlargement / reduction method (interpolation method) by interpolation. When the converted pixel values are inversely mapped on the original image, linear values are obtained from the values of the pixels located at the surrounding four points. (Linearly) is obtained by interpolation, and the amount of calculation is not so large, and a relatively smooth image can be obtained, but a slight blur occurs. The Cubic Convolution method is a kind of enlargement / reduction method (convolution method) by interpolation, and 16 pixel points when the converted pixel values are inversely mapped on the original image and sinc ( x) = sin (x) / x is a technique for obtaining by a convolution operation with an approximate function. Although this method has a large amount of calculation, it has the best image quality because of its features such as suppression of aliasing distortion due to reduction.
(4)縮小処理については、
(a)確からしさ高:縮小率75%、
(b)確からしさ中:縮小率50%、
(c)確からしさ低:縮小率0%、
これらの処理態様を設定して各レイアウト区分ごとに縮小処理を実行する。
(4) About reduction processing,
(A) High probability:
(B) Medium probability:
(C) Low probability:
These processing modes are set, and the reduction process is executed for each layout section.
(5)カラーモードについては、
(a)確からしさ高:白黒二値、
(b)確からしさ高中:白黒グレー、
(c)確からしさ中低:インデックスカラー法、
(d)確からしさ低:フルカラー、
これらの処理態様を設定して各レイアウト区分ごとに異なるカラーモード設定を行う。
(5) For color mode,
(A) High probability: black and white binary,
(B) High probability medium: black and white gray,
(C) Prediction medium to low: index color method,
(D) Low probability: full color,
By setting these processing modes, different color modes are set for each layout section.
このように、画像加工部106は、確からしさの値の低いレイアウト区分については、データ削減率よりも確実なデータ復元を可能とするデータ加工処理を実行し、確からしさの値の高いレイアウト区分については、データ削減率をより高めの態様でのデータ加工処理を実行し、加工データをデータ記憶部107に格納する。
As described above, the
なお、ユーザ入力部105を介して、データ加工部106において実行するデータ加工の種類を指定し、指定された種類に対応するデータ加工を行なう構成としてもよい。例えば、圧縮処理のみ、あるいはカラーモード設定のみといった指定、処理が実現される。なお、ユーザ入力に基づく処理実行構成とすることなく、予め、レイアウトの確からしさの値に基づいて実行する処理態様を対応付けて設定した処理決定テーブルをデータ加工部106のメモリに記憶し、各レイアウト区分の確からしさの値に基づいて、処理決定テーブルから実行する処理を選択して実行する構成としてもよい。
Note that the type of data processing to be executed in the
以上、説明したように、本発明の画像処理装置によれば、OCR等の文字認識処理において、各レイアウト区分ごとの確からしさを算出し、確からしさの値に応じて、オリジナル画像データのレイアウト区分ごとの圧縮態様などの画像加工処理態様を決定して、決定した加工態様に従った加工画像データを生成して記憶部に格納する構成としたので、文字認識確からしさが低く、オリジナル画像の参照可能性の高いレイアウト区分に対応するオリジナル画像データについては確実な復元が可能となり、一方、文字認識確からしさが高く、オリジナル画像の参照可能性の低いレイアウト区分に対応するオリジナル画像データについてはデータ削減率を高くした加工画像を生成する構成としたので、記憶手段に記憶するデータ量を削減することが可能となる。 As described above, according to the image processing apparatus of the present invention, in character recognition processing such as OCR, the probability for each layout category is calculated, and the layout category of the original image data is determined according to the value of the probability. Since the image processing processing mode such as each compression mode is determined, and processed image data according to the determined processing mode is generated and stored in the storage unit, the character recognition accuracy is low, and the original image is referred to Original image data corresponding to a highly likely layout category can be reliably restored, while data reduction is possible for original image data corresponding to a layout category with a high probability of character recognition and a low possibility of referring to the original image. Since it is configured to generate processed images with a high rate, it is possible to reduce the amount of data stored in the storage means The ability.
次に、図5に示すフローチャートを参照して、本実施例に係る画像処理装置の処理手順について説明する。ステップS101において、例えばスキャナによって読み取られた画像データ、あるいはハードディスクなどのデータベースからOCR処理対象となる画像データを入力する。 Next, a processing procedure of the image processing apparatus according to the present embodiment will be described with reference to a flowchart shown in FIG. In step S101, for example, image data read by a scanner or image data to be subjected to OCR processing is input from a database such as a hard disk.
次に、ステップS102〜S104において、OCR手段による処理が実行される。ステップS102は、図1に示す二値化部111の処理であり、入力画像データを、予め設定された閾値を適用して二値化処理を行なう、ステップS103は、レイアウト解析部112の処理であり、解析対象のドキュメントの画像データを入力し、ドキュメントのレイアウト解析を実行する。ステップS104は、文字認識部113の処理であり、二値化部111において生成した画像データの二値化情報に基づいて文字認識を実行する。なお、文字認識処理は、例えば、予め各文字毎に準備されたパターンデータとの一致度を判別して、認識文字を決定するパターンマッチング処理として実行される。
Next, in steps S102 to S104, processing by the OCR means is executed. Step S102 is a process of the
次のステップS105は、OCR処理における結果データを出力、保存する処理であり、ディスプレイまたはプリンタ出力、または記憶手段に対する格納処理を行なう。 The next step S105 is a process for outputting and saving the result data in the OCR process, and a display process or a printer output process or a storage process for the storage means is performed.
次のステップS106は、文字認識確からしさ算出部104の処理であり、レイアウト解析手段112におけるレイアウト解析結果としてのレイアウト区分毎に文字認識の確からしさを算出する。
The next step S106 is a process of the character recognition
次のステップS107は、データ加工法の決定処理であり、図1に示す画像加工部106において、各レイアウト区分に適用する画像加工法を各レイアウト区分の確からしさの値に基づいて決定する。なお、どのような種類の加工処理を実行するかの情報についてはユーザの指定情報を適用してもよいし、または予め設定された情報を適用してもよい。
The next step S107 is a data processing method determination process, in which the
ステップS108では、ステップS107において決定した加工法を適用して、各レイアウト区分に対応するオリジナル画像データの加工処理を実行する。具体的には、図4を参照して説明した
(1)圧縮処理、
(2)解像度変換処理、
(3)解像度変換モード、
(4)縮小処理、
(5)カラーモード変換処理、
これらの処理が、各レイアウト区分に対応して算出された確からしさの値に応じた処理態様に基づいて画像加工処理が実行される。
In step S108, the processing method determined in step S107 is applied to execute processing of original image data corresponding to each layout category. Specifically, (1) compression processing described with reference to FIG.
(2) Resolution conversion processing,
(3) Resolution conversion mode,
(4) Reduction processing,
(5) Color mode conversion processing,
In these processes, an image processing process is executed based on a processing mode corresponding to the probability value calculated corresponding to each layout category.
ステップS109では、ステップS108において、生成された加工画像データを記憶部に格納する。なお、この加工画像データは、OCR結果データに対応付けたデータとして記憶手段に記憶する構成とすることが好ましい。 In step S109, the processed image data generated in step S108 is stored in the storage unit. The processed image data is preferably stored in the storage unit as data associated with the OCR result data.
最後に、図6を参照して、本発明の画像処理装置のハードウェア構成例について説明する。図6に示す構成は、例えばPCなどによって構成される画像処理装置であり、スキャナ等のデータ読み取り部531と、プリンタなどのデータ出力部532を備えたハード構成例を示している。
Finally, with reference to FIG. 6, a hardware configuration example of the image processing apparatus of the present invention will be described. The configuration illustrated in FIG. 6 is an image processing apparatus configured by, for example, a PC, and illustrates a hardware configuration example including a
CPU(Central Processing Unit)501は、上述の実施例において説明した各種のデータ処理、すなわち、OCR処理、確からしさ算出処理、画像加工処理等の各処理の実行シーケンスを記述したコンピュータ・プログラムに従った処理を実行する制御部である。 A CPU (Central Processing Unit) 501 complies with a computer program that describes execution sequences of various types of data processing described in the above-described embodiments, that is, OCR processing, probability calculation processing, image processing processing, and the like. It is a control part which performs a process.
ROM(Read Only Memory)502は、CPU501が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)503は、CPU501の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス504により相互に接続されている。
A ROM (Read Only Memory) 502 stores programs used by the
ホストバス504は、ブリッジ505を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス506に接続されている。
The
キーボード508、ポインティングデバイス509は、ユーザにより操作される入力デバイスである。ディスプレイ510は、液晶表示装置またはCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージ情報として表示する。
A
HDD(Hard Disk Drive)511は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU501によって実行するプログラムや情報を記録または再生させる。ハードディスクは、入力された画像データに基づくOCR結果データ、さらに前述した処理によって加工された加工画像データなどが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
An HDD (Hard Disk Drive) 511 includes a hard disk, drives the hard disk, and records or reproduces a program executed by the
ドライブ512は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体521に記録されているデータまたはプログラムを読み出して、そのデータまたはプログラムを、インタフェース507、外部バス506、ブリッジ505、およびホストバス504を介して接続されているRAM503に供給する。リムーバブル記録媒体521も、ハードディスクと同様のデータ記録領域として利用可能である。
The
接続ポート514は、外部接続機器522を接続するポートであり、USB,IEEE1394等の接続部を持つ。接続ポート514は、インタフェース507、および外部バス506、ブリッジ505、ホストバス504等を介してCPU501等に接続されている。通信部515は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部531は、ドキュメントの読み取り処理を実行し、データ出力部532は、ドキュメントデータの出力処理を実行する。
The
なお、図6に示す画像処理装置のハードウェア構成例は、1つの装置例を示すものであり、本発明の画像処理装置は、図6に示す構成に限らず、上述した実施例において説明した処理を実行可能な構成であればよい。 Note that the hardware configuration example of the image processing device shown in FIG. 6 shows one device example, and the image processing device of the present invention is not limited to the configuration shown in FIG. Any configuration capable of executing the process may be used.
以上、特定の実施例を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本発明の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。 The present invention has been described in detail above with reference to specific embodiments. However, it is obvious that those skilled in the art can make modifications and substitutions of the embodiments without departing from the gist of the present invention. In other words, the present invention has been disclosed in the form of exemplification, and should not be interpreted in a limited manner. In order to determine the gist of the present invention, the claims should be taken into consideration.
なお、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。 The series of processes described in the specification can be executed by hardware, software, or a combined configuration of both. When executing processing by software, the program recording the processing sequence is installed in a memory in a computer incorporated in dedicated hardware and executed, or the program is executed on a general-purpose computer capable of executing various processing. It can be installed and run.
例えば、プログラムは記録媒体としてのハードディスクやROM(Read Only Memory)に予め記録しておくことができる。あるいは、プログラムはフレキシブルディスク、CD−ROM(Compact Disc Read Only Memory),MO(Magneto optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウエアとして提供することができる。 For example, the program can be recorded in advance on a hard disk or ROM (Read Only Memory) as a recording medium. Alternatively, the program is temporarily or permanently stored on a removable recording medium such as a flexible disk, a CD-ROM (Compact Disc Read Only Memory), an MO (Magneto optical) disk, a DVD (Digital Versatile Disc), a magnetic disk, or a semiconductor memory. It can be stored (recorded). Such a removable recording medium can be provided as so-called package software.
なお、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールする他、ダウンロードサイトから、コンピュータに無線転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。 The program is installed on the computer from the removable recording medium as described above, or is wirelessly transferred from the download site to the computer, or is wired to the computer via a network such as a LAN (Local Area Network) or the Internet. The computer can receive the program transferred in this manner and install it on a recording medium such as a built-in hard disk.
なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。 Note that the various processes described in the specification are not only executed in time series according to the description, but may be executed in parallel or individually according to the processing capability of the apparatus that executes the processes or as necessary. Further, in this specification, the system is a logical set configuration of a plurality of devices, and the devices of each configuration are not limited to being in the same casing.
以上、説明したように、本発明の構成によれば、文字認識処理手段(OCR)において、入力画像データに基づく文字認識処理を実行し、実行された文字認識処理の確からしさを算出して、算出した文字認識確からしさに基づいて、保存用オリジナル画像データの加工態様を決定して、画像加工を施して記憶部に格納する構成とした。具体的には、文字認識処理手段において実行された文字認識処理の確からしさを、データ領域毎に算出して、データ領域毎の文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データのデータ領域ごとの加工処理態様を決定し、決定した処理態様での画像加工処理を実行して生成した加工画像データを記憶部に格納する。 As described above, according to the configuration of the present invention, the character recognition processing means (OCR) executes the character recognition processing based on the input image data, calculates the certainty of the executed character recognition processing, Based on the calculated character recognition probability, the processing mode of the original image data for storage is determined, and the image is processed and stored in the storage unit. Specifically, the probability of the character recognition processing executed in the character recognition processing means is calculated for each data area, and based on the character recognition probability for each data area, the original image data that is the character recognition processing target The processing mode for each data area is determined, and the processed image data generated by executing the image processing in the determined processing mode is stored in the storage unit.
すなわち、文字認識確からしさが高い値を持つデータ領域については、データ削減率を高く設定した態様の画像加工処理を実行し、文字認識確からしさが低い値を持つデータ領域については、データ削減率を低く設定した態様の画像加工処理を実行する。本構成によって、文字認識確からしさが低く、オリジナル画像の参照可能性の高い領域対応のオリジナル画像データについては確実な復元を可能とし、文字認識確からしさが高く、オリジナル画像の参照可能性の低い領域対応のオリジナル画像データについてはデータ削減率を高くして記憶保持することが可能となり、記憶手段に記憶するデータ量削減が実現される。 That is, for a data area having a high character recognition probability, an image processing process with a high data reduction rate is performed, and for a data area having a low character recognition probability, a data reduction rate is set. The image processing of the aspect set low is performed. With this configuration, it is possible to reliably restore original image data corresponding to an area that has a low character recognition accuracy and a high possibility of referring to the original image, and has a high character recognition accuracy and a low possibility of referring to the original image. Corresponding original image data can be stored and held at a high data reduction rate, and the amount of data stored in the storage means can be reduced.
100 画像処理装置
101 画像入力部
102 OCR手段
103 OCR結果出力部
104 文字認識確からしさ算出部
105 ユーザ入力部
106 画像加工部
107 データ記憶部
111 二値化部
112 レイアウト解析部
113 文字認識部
501 CPU(Central Processing Unit)
502 ROM(Read-Only-Memory)
503 RAM(Random Access Memory)
504 ホストバス
505 ブリッジ
506 外部バス
507 インタフェース
508 キーボード
509 ポインティングデバイス
510 ディスプレイ
511 HDD(Hard Disk Drive)
512 ドライブ
514 接続ポート
515 通信部
521 リムーバブル記録媒体
522 外部接続機器
531 データ読み取り部
532 データ出力部
DESCRIPTION OF
502 ROM (Read-Only-Memory)
503 RAM (Random Access Memory)
504
512
Claims (11)
前記文字認識処理手段において実行された文字認識処理の確からしさを、データ領域毎に算出する文字認識確からしさ算出部と、
前記文字認識確からしさ算出部の算出したデータ領域毎の文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データのデータ領域ごとの加工処理態様を決定し、決定した処理態様での画像加工処理を実行する画像加工部と、
前記画像加工部の加工した加工画像データを格納する記憶部と、
を有することを特徴とする画像処理装置。 Character recognition processing means for executing character recognition processing based on input image data;
A character recognition probability calculating unit for calculating the probability of the character recognition processing executed in the character recognition processing means for each data area;
Based on the character recognition probability for each data area calculated by the character recognition probability calculation unit, a processing mode for each data area of the original image data to be subjected to character recognition processing is determined, and an image in the determined processing mode is determined. An image processing unit for executing processing,
A storage unit for storing processed image data processed by the image processing unit;
An image processing apparatus comprising:
レイアウト解析によって検出されたレイアウト区分ごとの文字認識処理を実行する構成であり、
前記文字認識確からしさ算出部は、
前記文字認識処理手段において実行された文字認識処理の確からしさを、前記レイアウト区分ごとに算出し、
前記画像加工部は、
前記文字認識確からしさ算出部の算出したレイアウト区分ごとの文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データについて、レイアウト区分ごとに加工処理態様を決定し、決定した処理態様で、レイアウト区分単位で画像加工処理を実行する構成であることを特徴とする請求項1に記載の画像処理装置。 The character recognition processing means includes:
It is a configuration that executes character recognition processing for each layout category detected by layout analysis,
The character recognition accuracy calculation unit
The probability of the character recognition process executed in the character recognition processing means is calculated for each layout category,
The image processing unit
Based on the character recognition probability for each layout category calculated by the character recognition accuracy calculation unit, for the original image data targeted for character recognition processing, determine the processing mode for each layout category, in the determined processing mode, The image processing apparatus according to claim 1, wherein the image processing processing is executed in units of layout sections.
文字認識確からしさ算出部の算出した文字認識確からしさが高い値を持つデータ領域については、データ削減率を高く設定した態様の画像加工処理を実行し、
文字認識確からしさ算出部の算出した文字認識確からしさが低い値を持つデータ領域については、データ削減率を低く設定した態様の画像加工処理を実行する構成であることを特徴とする請求項1に記載の画像処理装置。 The image processing unit
For a data region having a high character recognition probability calculated by the character recognition accuracy calculation unit, an image processing process in which the data reduction rate is set high is executed,
The data area having a low character recognition probability calculated by the character recognition probability calculation unit is configured to execute an image processing process in a mode in which the data reduction rate is set low. The image processing apparatus described.
文字認識確からしさ算出部の算出した文字認識確からしさが高い値を持つデータ領域については、非可逆圧縮処理を実行し、
文字認識確からしさ算出部の算出した文字認識確からしさが低い値を持つデータ領域については、可逆圧縮処理を実行する構成であることを特徴とする請求項1に記載の画像処理装置。 The image processing unit
For a data area having a high character recognition probability calculated by the character recognition accuracy calculation unit, a lossy compression process is performed,
The image processing apparatus according to claim 1, wherein a reversible compression process is executed for a data area having a low character recognition probability calculated by the character recognition probability calculation unit.
圧縮処理、解像度変換処理、解像度変換モード、縮小処理、カラーモード変換処理の少なくともいずれかの処理について、文字認識確からしさ算出部の算出した文字認識確からしさに応じて処理態様を変更した画像加工処理を実行する構成であることを特徴とする請求項1に記載の画像処理装置。 The image processing unit
An image processing process in which the processing mode is changed according to the character recognition probability calculated by the character recognition probability calculation unit for at least one of compression processing, resolution conversion processing, resolution conversion mode, reduction processing, and color mode conversion processing The image processing apparatus according to claim 1, wherein the image processing apparatus is configured to execute
前記文字認識処理ステップにおいて実行された文字認識処理の確からしさを、データ領域毎に算出する文字認識確からしさ算出ステップと、
前記文字認識確からしさ算出ステップにおいて算出したデータ領域毎の文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データのデータ領域ごとの加工処理態様を決定し、決定した処理態様での画像加工処理を実行する画像加工ステップと、
を有することを特徴とする画像処理方法。 A character recognition processing step for executing character recognition processing based on input image data;
A character recognition probability calculating step for calculating the certainty of the character recognition processing executed in the character recognition processing step for each data area;
Based on the character recognition probability for each data area calculated in the character recognition probability calculation step, a processing mode for each data area of the original image data to be subjected to character recognition processing is determined, and an image in the determined processing mode is determined. An image processing step for executing the processing,
An image processing method comprising:
レイアウト解析によって検出されたレイアウト区分ごとの文字認識処理を実行するステップを有し、
前記文字認識確からしさ算出ステップは、
前記文字認識処理ステップにおいて実行された文字認識処理の確からしさを、前記レイアウト区分ごとに算出し、
前記画像加工ステップは、
前記文字認識確からしさ算出ステップにおいて算出したレイアウト区分ごとの文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データについて、レイアウト区分ごとに加工処理態様を決定し、決定した処理態様で、レイアウト区分単位で画像加工処理を実行するステップであることを特徴とする請求項6に記載の画像処理方法。 The character recognition processing step includes:
A step of performing character recognition processing for each layout category detected by layout analysis;
The character recognition probability calculating step includes:
The probability of the character recognition process executed in the character recognition process step is calculated for each layout category,
The image processing step includes
Based on the character recognition probability for each layout category calculated in the character recognition accuracy calculation step, for the original image data targeted for character recognition processing, determine the processing mode for each layout category, in the determined processing mode, The image processing method according to claim 6, wherein the image processing is a step of executing image processing in units of layout sections.
文字認識確からしさ算出ステップにおいて算出した文字認識確からしさが高い値を持つデータ領域については、データ削減率を高く設定した態様の画像加工処理を実行し、
文字認識確からしさ算出ステップの算出した文字認識確からしさが低い値を持つデータ領域については、データ削減率を低く設定した態様の画像加工処理を実行することを特徴とする請求項6に記載の画像処理方法。 The image processing step includes
For a data region having a high character recognition probability value calculated in the character recognition probability calculation step, an image processing process in which the data reduction rate is set high is executed,
7. The image according to claim 6, wherein an image processing process in which the data reduction rate is set low is executed for a data area having a low character recognition probability calculated by the character recognition probability calculation step. Processing method.
文字認識確からしさ算出ステップにおいて算出した文字認識確からしさが高い値を持つデータ領域については、非可逆圧縮処理を実行し、
文字認識確からしさ算出ステップにおいて算出した文字認識確からしさが低い値を持つデータ領域については、可逆圧縮処理を実行することを特徴とする請求項6に記載の画像処理方法。 The image processing step includes
For a data region having a high character recognition probability calculated in the character recognition probability calculation step, an irreversible compression process is executed,
The image processing method according to claim 6, wherein a lossless compression process is executed for a data area having a low character recognition probability calculated in the character recognition probability calculation step.
圧縮処理、解像度変換処理、解像度変換モード、縮小処理、カラーモード変換処理の少なくともいずれかの処理について、文字認識確からしさ算出部の算出した文字認識確からしさに応じて処理態様を変更した画像加工処理を実行するステップであることを特徴とする請求項6に記載の画像処理方法。 The image processing step includes
An image processing process in which the processing mode is changed according to the character recognition probability calculated by the character recognition probability calculation unit for at least one of compression processing, resolution conversion processing, resolution conversion mode, reduction processing, and color mode conversion processing The image processing method according to claim 6, wherein the image processing method is a step of executing the following.
入力画像データに基づく文字認識処理を実行する文字認識処理ステップと、
前記文字認識処理ステップにおいて実行された文字認識処理の確からしさを、データ領域毎に算出する文字認識確からしさ算出ステップと、
前記文字認識確からしさ算出ステップにおいて算出したデータ領域毎の文字認識確からしさに基づいて、文字認識処理対象としたオリジナル画像データのデータ領域ごとの加工処理態様を決定し、決定した処理態様での画像加工処理を実行する画像加工ステップと、
を有することを特徴とするコンピュータ・プログラム。 A computer program for causing an image processing apparatus to execute image processing;
A character recognition processing step for executing character recognition processing based on input image data;
A character recognition probability calculating step for calculating the certainty of the character recognition processing executed in the character recognition processing step for each data area;
Based on the character recognition probability for each data area calculated in the character recognition probability calculation step, a processing mode for each data area of the original image data to be subjected to character recognition processing is determined, and an image in the determined processing mode is determined. An image processing step for executing the processing,
A computer program characterized by comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005273255A JP2007086956A (en) | 2005-09-21 | 2005-09-21 | Image processor, image processing method and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005273255A JP2007086956A (en) | 2005-09-21 | 2005-09-21 | Image processor, image processing method and computer program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007086956A true JP2007086956A (en) | 2007-04-05 |
Family
ID=37973903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005273255A Pending JP2007086956A (en) | 2005-09-21 | 2005-09-21 | Image processor, image processing method and computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007086956A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010098744A (en) * | 2008-10-20 | 2010-04-30 | Toshiba Corp | Image processing apparatus and image processing method |
JP2015055951A (en) * | 2013-09-11 | 2015-03-23 | 株式会社リコー | Information processing system and information processing method |
JP2016206839A (en) * | 2015-04-20 | 2016-12-08 | 沖電気工業株式会社 | Medium recognition device and transaction device |
WO2017042981A1 (en) * | 2015-09-11 | 2017-03-16 | 富士通株式会社 | Input processing method, input processing device, input processing program, and input processing system |
CN112232195A (en) * | 2020-10-15 | 2021-01-15 | 北京临近空间飞行器系统工程研究所 | Handwritten Chinese character recognition method, device and storage medium |
-
2005
- 2005-09-21 JP JP2005273255A patent/JP2007086956A/en active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010098744A (en) * | 2008-10-20 | 2010-04-30 | Toshiba Corp | Image processing apparatus and image processing method |
JP2015055951A (en) * | 2013-09-11 | 2015-03-23 | 株式会社リコー | Information processing system and information processing method |
JP2016206839A (en) * | 2015-04-20 | 2016-12-08 | 沖電気工業株式会社 | Medium recognition device and transaction device |
WO2017042981A1 (en) * | 2015-09-11 | 2017-03-16 | 富士通株式会社 | Input processing method, input processing device, input processing program, and input processing system |
CN112232195A (en) * | 2020-10-15 | 2021-01-15 | 北京临近空间飞行器系统工程研究所 | Handwritten Chinese character recognition method, device and storage medium |
CN112232195B (en) * | 2020-10-15 | 2024-02-20 | 北京临近空间飞行器系统工程研究所 | Handwritten Chinese character recognition method, device and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8411955B2 (en) | Image processing apparatus, image processing method and computer-readable medium | |
US7567716B2 (en) | Method and device for randomly accessing a region of an encoded image for the purpose of decoding it and a method and device for encoding an image | |
US8213727B2 (en) | Image encoding apparatus and image decoding apparatus, and control method thereof | |
JP2007086954A (en) | Character recognition processing device, character recognition processing method, and computer program | |
JP2004140764A (en) | Image processing device and method therefor | |
US8837770B2 (en) | Non-transitory computer readable storage medium, marker creating apparatus, and marker creating method | |
JP2010206438A (en) | Image processing apparatus and image processing program | |
JP2007086956A (en) | Image processor, image processing method and computer program | |
JP2000048036A (en) | Image processor and its method | |
JP3872217B2 (en) | Dither image binary expression processing method, dither image compression binary expression decompression method, and dither image compression and decompression system | |
JPH08180180A (en) | Electronic filing device | |
JP2005204206A (en) | Image processing apparatus, image processing program, and storage medium | |
JP4802853B2 (en) | Image processing apparatus and image processing program | |
JP6569242B2 (en) | Image processing apparatus, image processing system, and image processing program | |
JPH08237404A (en) | Selection of optical character recognition mode | |
JP4383187B2 (en) | Image processing apparatus, image processing program, and storage medium | |
JP4872780B2 (en) | Image processing system and image processing program | |
US8059906B2 (en) | Image processing apparatus, image processing method, computer-readable medium and computer data signal | |
JP4237642B2 (en) | Image processing apparatus, image processing program, and storage medium | |
JP5407582B2 (en) | Image processing apparatus and image processing program | |
JP2008109386A (en) | Image encoding apparatus and method | |
KR100611903B1 (en) | Method for saving flash memory of mobile communication terminal | |
JP4992758B2 (en) | Image processing apparatus and image processing program | |
JP4526069B2 (en) | Image information arithmetic coding apparatus and image information arithmetic decoding apparatus | |
JP4935732B2 (en) | Image processing apparatus and image processing program |