JP2015225559A - Image processor - Google Patents
Image processor Download PDFInfo
- Publication number
- JP2015225559A JP2015225559A JP2014110750A JP2014110750A JP2015225559A JP 2015225559 A JP2015225559 A JP 2015225559A JP 2014110750 A JP2014110750 A JP 2014110750A JP 2014110750 A JP2014110750 A JP 2014110750A JP 2015225559 A JP2015225559 A JP 2015225559A
- Authority
- JP
- Japan
- Prior art keywords
- image
- image data
- character recognition
- character
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
Description
本発明は、画像処理装置に関するものである。 The present invention relates to an image processing apparatus.
ある装置では、原稿画像内のモノクロ画像を分離し、分離したモノクロ画像を2値化して得られるモノクロ2値画像に対して文字認識(OCR:Optical Character Recognition)処理で、原稿画像内の文字を検出している(例えば特許文献1参照)。 In some apparatuses, a monochrome image in a document image is separated, and a character in the document image is processed by character recognition (OCR: Optical Character Recognition) processing on a monochrome binary image obtained by binarizing the separated monochrome image. It is detected (see, for example, Patent Document 1).
また、一般的に、原稿画像内には、様々な言語で様々なサイズの文字が含まれている可能性があるため、文字認識率を高くするために、良好な画質の原稿画像に対してOCR処理を行うことが望ましい。 In general, since there is a possibility that characters of various sizes are included in various languages in an original image, in order to increase the character recognition rate, It is desirable to perform OCR processing.
しかしながら、上述の装置の場合、原稿画像内の文字に色ずれが発生していると、文字部分がモノクロ画像として正確に分離されなくなるため、OCR処理において文字として正確に検出されなくなる可能性がある。 However, in the case of the above-described apparatus, if color misregistration occurs in characters in the document image, the character portion is not accurately separated as a monochrome image, and may not be accurately detected as a character in the OCR process. .
また、一般的に、文字(特に、小さい文字)に色ずれが発生しているカラー原稿画像に対してOCR処理を行うと、文字部分のエッジが有彩色を伴ってぼやけるため、写真などの多階調画像に近くなり、文字部分がOCR処理において文字として正確に検出されなくなる可能性がある。 Further, generally, when an OCR process is performed on a color original image in which a color shift occurs in characters (especially small characters), the edge of the character portion is blurred with a chromatic color. There is a possibility that the character portion becomes close to a gradation image and the character portion is not accurately detected as a character in the OCR processing.
そのような原稿画像内の文字の色ずれは、カラー原稿印刷時に発生していたり、原稿のカラースキャン時に発生したりする。 Such color misregistration of characters in a document image may occur when a color document is printed or may occur when a document is color scanned.
本発明は、上記の問題に鑑みてなされたものであり、原稿画像内の文字に色ずれが発生していても原稿画像から文字が検出されやすい画像処理装置を得ることを目的とする。 The present invention has been made in view of the above problems, and an object of the present invention is to obtain an image processing apparatus in which characters can be easily detected from a document image even if color misregistration occurs in the characters in the document image.
本発明に係る画像処理装置は、原稿画像の文字認識用画像データを取得する文字認識画像取得部と、前記文字認識画像取得部により取得された前記文字認識用画像データに対して文字認識処理を行う文字認識処理部とを備える。そして、前記文字認識画像取得部は、(a)前記原稿画像の色ずれ量を特定し、(b)前記色ずれ量に応じて、前記文字認識用画像データをカラー画像データおよびモノクロ画像データのいずれかとする。 An image processing apparatus according to the present invention includes a character recognition image acquisition unit that acquires image data for character recognition of a document image, and character recognition processing for the character recognition image data acquired by the character recognition image acquisition unit. And a character recognition processing unit. The character recognition image acquisition unit (a) specifies the color misregistration amount of the document image, and (b) converts the character recognition image data into color image data and monochrome image data according to the color misregistration amount. Either.
本発明によれば、原稿画像内の文字に色ずれが発生していても原稿画像から文字が検出されやすい画像処理装置を得ることができる。 According to the present invention, it is possible to obtain an image processing apparatus in which characters are easily detected from a document image even if color deviation occurs in the characters in the document image.
以下、図に基づいて本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図1は、本発明の実施の形態に係る画像処理装置の構成を示すブロック図である。 FIG. 1 is a block diagram showing a configuration of an image processing apparatus according to an embodiment of the present invention.
図1に示す画像処理装置は、複合機であって、画像読取装置1、画像入力部2、画像処理部3、OCR処理部4、表示部5、操作部6、印刷制御部7、印刷装置8、状態記憶部9、ファイル作成部10、データ通信部11、およびシステム制御部12を備える。
The image processing apparatus illustrated in FIG. 1 is a multifunction peripheral, and includes an
画像読取装置1は、原稿から原稿画像を光学的に読み取り、原稿画像の画像データを生成する。画像読取装置1は、複数の色成分(ここでは、RGB)に対してそれぞれ設けられている複数のラインセンサーを有し、複数のラインセンサーで原稿をスキャンし、カラー画像データとして原稿画像の画像データを生成する。
The
画像入力部2は、画像読取装置1により生成された原稿画像の画像データまたはデータ通信部11により受信された原稿画像の画像データを取得する。
The
画像処理部3は、原稿画像の文字認識用画像データを取得する。具体的には、画像入力部2により取得された原稿画像の画像データから、原稿画像の1ページごとに文字認識用画像データを生成したり、その原稿画像の画像データを文字認識用画像データとして使用したりする。
The
OCR処理部4は、画像処理部3により取得された文字認識用画像データに対してOCR処理を行い、原稿画像内の文字を検出する。
The OCR processing unit 4 performs OCR processing on the character recognition image data acquired by the
画像処理部3は、(a)原稿画像の色ずれ量を特定し、(b)特定した色ずれ量に応じて、文字認識用画像データをカラー画像データおよびモノクロ画像データのいずれかとする。なお、モノクロ画像データとしては、グレイスケール画像データまたはモノクロ2値画像データが使用される。 The image processing unit 3 (a) specifies the color misregistration amount of the original image, and (b) sets the character recognition image data as either color image data or monochrome image data according to the specified color misregistration amount. As the monochrome image data, gray scale image data or monochrome binary image data is used.
図2は、図1に示す画像処理装置で使用される色ずれ量について説明する図である。 FIG. 2 is a diagram for explaining the amount of color shift used in the image processing apparatus shown in FIG.
例えば図2に示すように、主走査方向および副走査方向においてRGB(あるいはCMY)の色成分の画像31〜33がずれている場合、主走査方向における中央の画像32から両側の画像31,33までのそれぞれの距離(あるいは画素数)をDp1,Dp2とし、副走査方向における中央の画像32から両側の画像31,33までのそれぞれの距離(あるいは画素数)をDs1,Ds2とすると、主走査方向の色ずれ量は、Dp1とDp2の大きい方とされ、副走査方向の色ずれ量は、Ds1とDs2の大きい方とされる。そして、原稿画像の色ずれ量としては、例えば、主走査方向の色ずれ量、副走査方向の色ずれ量、および両者のうちの大きい方のいずれかが使用される。
For example, as shown in FIG. 2, when the RGB (or CMY)
なお、例えば、Dp1とDp2との和を主走査方向の色ずれ量とし、Ds1とDs2との和を副走査方向の色ずれ量としてもよい。 For example, the sum of Dp1 and Dp2 may be used as the color misregistration amount in the main scanning direction, and the sum of Ds1 and Ds2 may be used as the color misregistration amount in the sub scanning direction.
また、1色の画像だけがずれている場合、その1色の画像と残りの2色の画像との距離(あるいは画素数)が色ずれ量とされる。 When only one color image is shifted, the distance (or the number of pixels) between the one color image and the remaining two color images is used as the color shift amount.
この実施の形態では、原稿画像として画像読取装置1によるスキャンで得られた画像を使用する場合、画像処理部3は、画像読取装置1からラインセンサー間のスキャンタイミングのずれを示す色ずれ情報を取得し、取得した色ずれ情報から原稿画像の色ずれ量を特定する。
In this embodiment, when an image obtained by scanning by the
また、画像処理部3は、文字認証用画像データをモノクロ画像データとする場合、複数のラインセンサーのうちの1つだけを使用して画像読取装置1にスキャンさせ、画像読取装置1によるスキャンで得られたモノクロ画像データを文字認証用画像データとして使用するようにしてもよいし、複数のラインセンサーを使用して画像読取装置1にスキャンさせ、画像読取装置1によるスキャンで得られたカラー画像データから変換されたモノクロ画像データを文字認証用画像データとして使用するようにしてもよい。
In addition, when the character authentication image data is monochrome image data, the
なお、その際、画像処理部3および文字認識処理部4は、複数ページの原稿画像に対して、文字認識用画像データの生成および文字認識処理を順番に行っていき、画像処理部3は、文字認証用画像データをモノクロ画像データとするページについて、複数のラインセンサーのうちの1つだけを使用して画像読取装置1にスキャンさせ、画像読取装置1によるスキャンで得られたモノクロ画像データを文字認証用画像データとして使用してもよい。その場合、使用されるラインセンサーに対応して使用される光源には、白色光源が使用される。
At that time, the
あるいは、画像処理部3は、文字認証用画像データをモノクロ画像データとするページについては、複数のラインセンサーを使用した画像読取装置1によるスキャンで得られたカラー画像データから変換されたモノクロ画像データを文字認証用画像データとして使用し、次ページ以降の各ページについては、複数のラインセンサーのうちの1つだけを使用して画像読取装置1にスキャンさせ、画像読取装置1によるスキャンで得られたモノクロ画像データを文字認証用画像データとして使用してもよい。
Alternatively, the
表示部5は、例えば液晶ディスプレイ、インジケーターなどを含み、当該画像処理装置の状態、OCR処理の画質設定の変更などを表示する。操作部6は、例えばタッチパネル、ハードキーなどを含み、ユーザー操作を受け付け、電気信号として出力する。
The
印刷制御部7は、印刷装置8を制御して原稿画像などの印刷を印刷装置8に実行させる。印刷装置8は、例えば電子写真方式で原稿画像を印刷用紙に印刷する。
The
状態記憶部9は、当該画像処理装置の状態、各種設定などを記憶する記憶装置である。 The state storage unit 9 is a storage device that stores the state of the image processing apparatus, various settings, and the like.
ファイル作成部10は、原稿画像のラスターイメージデータと、OCR処理部4の文字認識により得られたテキストとを含むファイルを作成する。例えば、ファイル作成部10は、原稿画像のラスターイメージデータのレイヤーと、OCR処理部4の文字認識により得られたテキストのレイヤーとを含むPDF(Portable Document Format)ファイルを作成する。
The
データ通信部11は、例えばネットワークインターフェイスなどであって、パーソナルコンピューターなどの端末装置とデータ通信し、原稿画像の画像データを端末装置から受信したり、ファイル作成部10により作成されたファイルを所定のプロトコルで端末装置へ送信したりする。
The
システム制御部12は、画像読取装置1、画像入力部2、画像処理部3、OCR処理部4、表示部5、操作部6、印刷制御部7、印刷装置8、状態記憶部9、ファイル作成部10、およびデータ通信部11を制御して各種ジョブを実行する。
The
なお、上述の画像入力部2、画像処理部3、OCR処理部4、印刷制御部7、ファイル作成部10、およびシステム制御部12は、所定のプログラムを実行するコンピューター、ASIC(Application Specific Integrated Circuit)などで実現される。
The
次に、上記画像処理装置の動作について説明する。図3は、図1に示す画像処理装置の動作を説明するフローチャートである。 Next, the operation of the image processing apparatus will be described. FIG. 3 is a flowchart for explaining the operation of the image processing apparatus shown in FIG.
ユーザーは、原稿を画像読取装置1の原稿台または自動原稿搬送装置に載置し、所定のジョブ(例えば、スキャントゥセンド)の実行指示のための操作(例えばスタートボタンの押下)を操作部6に対して行う。システム制御部12は、操作部6からその所定のジョブの実行指示を受け付けると、画像入力部2を使用して、画像読取装置1に、原稿画像を1ページずつ読み取らせ、画像処理部3およびOCR処理部4に以下の処理を実行させる。
The user places an original on the original table of the
画像処理部3は、画像入力部2を介して、例えば1ページ分の原稿画像の元画像データ(カラー原稿画像データ)および色ずれ情報を画像読取装置1から取得し(ステップS1)、色ずれ情報から色ずれ量を特定する(ステップS2)。
The
そして、画像処理部3は、特定した色ずれ量が所定の閾値以上であるか否かを判定する(ステップS3)。
Then, the
特定した色ずれ量が所定の閾値以上である場合、画像処理部3は、原稿画像の元画像データを(グレイスケールまたはモノクロ2値の)モノクロ画像データに変換し、そのモノクロ画像データを文字認識用画像データとするか、画像入力部2を介して、1つのラインセンサーを使用したグレイスキャンで同一のページのスキャンを画像読取装置1に実行させてモノクロ画像データを文字認識用画像データとして取得する(ステップS4)。このように、文字認識用画像データとしてモノクロ画像データを使用することで、文字部分のエッジの彩度や色相のばらつきが無くなるため、文字認識率が向上する。
When the specified color misregistration amount is equal to or greater than a predetermined threshold, the
一方、特定した色ずれ量が所定の閾値未満である場合、画像処理部3は、原稿画像の元画像データ、あるいは原稿画像の元画像データに対して所定の画像処理を施して得られるカラー画像データを、文字認識用画像データとする(ステップS5)。
On the other hand, when the specified color misregistration amount is less than a predetermined threshold, the
そして、OCR処理部4は、画像処理部3により生成された文字認識用画像データに対してOCR処理を実行し、原稿画像内の文字を検出する(ステップS6)。
Then, the OCR processing unit 4 performs OCR processing on the character recognition image data generated by the
以上のように、上記実施の形態によれば、OCR処理部4は、画像処理部3により取得された原稿画像の文字認識用画像データに対して文字認識処理を行う。画像処理部3は、(a)原稿画像の色ずれ量を特定し、(b)特定した色ずれ量に応じて、文字認識用画像データをカラー画像データおよびモノクロ画像データのいずれかとする。
As described above, according to the above embodiment, the OCR processing unit 4 performs the character recognition process on the character recognition image data of the document image acquired by the
これにより、原稿画像内の文字に色ずれが発生していても原稿画像から文字が検出されやすくなる。 As a result, even if a color shift occurs in the characters in the document image, the characters are easily detected from the document image.
なお、上述の実施の形態は、本発明の好適な例であるが、本発明は、これらに限定されるものではなく、本発明の要旨を逸脱しない範囲において、種々の変形、変更が可能である。 The above-described embodiments are preferred examples of the present invention, but the present invention is not limited to these, and various modifications and changes can be made without departing from the scope of the present invention. is there.
例えば、上記実施の形態における色ずれ量の閾値は、ユーザーによる操作部6に対する入力値、または外部の端末装置からデータ通信部11により受信される入力値で設定可能としてもよい。
For example, the threshold value of the color misregistration amount in the above embodiment may be set by an input value to the
また、上記実施の形態において、画像処理部3は、原稿画像の元画像データを取得し、元画像データに基づいて原稿画像の色ずれ量を特定するようにしてもよい。その場合、例えば、画像処理部3は、原稿画像内で所定の複数の色成分(例えばRGBまたはCMY)のエッジが並行している箇所を色ずれ箇所として検出し、その箇所の色ずれ量を特定する。
In the above-described embodiment, the
本発明は、例えば、スキャナー、複合機などの画像形成装置に適用可能である。 The present invention can be applied to an image forming apparatus such as a scanner or a multifunction peripheral.
3 画像処理部(文字認識画像取得部の一例)
4 OCR処理部(文字認識処理部の一例)
3 Image processing unit (an example of a character recognition image acquisition unit)
4 OCR processing unit (an example of a character recognition processing unit)
Claims (6)
前記文字認識画像取得部により取得された前記文字認識用画像データに対して文字認識処理を行う文字認識処理部とを備え、
前記文字認識画像取得部は、(a)前記原稿画像の色ずれ量を特定し、(b)前記色ずれ量に応じて、前記文字認識用画像データをカラー画像データおよびモノクロ画像データのいずれかとすること、
を特徴とする画像処理装置。 A character recognition image acquisition unit that acquires image data for character recognition of a document image;
A character recognition processing unit that performs character recognition processing on the character recognition image data acquired by the character recognition image acquisition unit;
The character recognition image acquisition unit (a) specifies a color misregistration amount of the document image, and (b) determines the character recognition image data as one of color image data and monochrome image data according to the color misregistration amount. To do,
An image processing apparatus.
前記文字認識画像取得部は、前記画像読取装置から前記ラインセンサー間のスキャンタイミングのずれを示す色ずれ情報を取得し、前記色ずれ情報から前記原稿画像の色ずれ量を特定すること、
を特徴とする請求項1記載の画像処理装置。 A plurality of line sensors respectively provided for a plurality of color components, further comprising an image reading device that scans a document with the plurality of line sensors;
The character recognition image acquisition unit acquires color misregistration information indicating scan timing misalignment between the line sensors from the image reading device, and specifies the color misregistration amount of the document image from the color misregistration information;
The image processing apparatus according to claim 1.
前記文字認識画像取得部は、前記文字認証用画像データをモノクロ画像データとするページについて、前記複数のラインセンサーのうちの1つだけを使用して前記画像読取装置に再スキャンさせ、前記画像読取装置によるスキャンで得られたモノクロ画像データを前記文字認証用画像データとして使用すること、
を特徴とする請求項3記載の画像処理装置。 The character recognition image acquisition unit and the character recognition processing unit sequentially perform generation of character recognition image data and character recognition processing on the plurality of pages of the document image,
The character recognition image acquisition unit causes the image reading apparatus to re-scan the page using the character authentication image data as monochrome image data by using only one of the plurality of line sensors. Using monochrome image data obtained by scanning with an apparatus as the image data for character authentication;
The image processing apparatus according to claim 3.
前記文字認識画像取得部は、前記文字認証用画像データをモノクロ画像データとするページについて、前記複数のラインセンサーを使用した前記画像読取装置によるスキャンで得られたカラー画像データから変換されたモノクロ画像データを文字認証用画像データとして使用し、次ページ以降の各ページについては、前記複数のラインセンサーのうちの1つだけを使用して前記画像読取装置にスキャンさせ、前記画像読取装置によるスキャンで得られたモノクロ画像データを前記文字認証用画像データとして使用すること、
を特徴とする請求項3記載の画像処理装置。 The character recognition image acquisition unit and the character recognition processing unit sequentially perform generation of character recognition image data and character recognition processing on the plurality of pages of the document image,
The character recognition image acquisition unit is a monochrome image converted from color image data obtained by scanning with the image reading apparatus using the plurality of line sensors for a page having the character authentication image data as monochrome image data. The data is used as image data for character authentication, and each page after the next page is scanned by the image reading device using only one of the plurality of line sensors, and scanning by the image reading device is performed. Using the obtained monochrome image data as the character authentication image data;
The image processing apparatus according to claim 3.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014110750A JP2015225559A (en) | 2014-05-29 | 2014-05-29 | Image processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014110750A JP2015225559A (en) | 2014-05-29 | 2014-05-29 | Image processor |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015225559A true JP2015225559A (en) | 2015-12-14 |
Family
ID=54842238
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014110750A Pending JP2015225559A (en) | 2014-05-29 | 2014-05-29 | Image processor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015225559A (en) |
-
2014
- 2014-05-29 JP JP2014110750A patent/JP2015225559A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9917970B2 (en) | Image reading apparatus, method for controlling the same, and storage medium | |
US9485368B2 (en) | Electronic document generation apparatus, recording medium, and electronic document generation system | |
US10291794B2 (en) | Implementation of distributed processing using device, information processing apparatus, information processing system, and information processing method to reduce network lag | |
US10070001B2 (en) | Document reading apparatus, method for controlling document reading apparatus, and storage medium | |
US20150146224A1 (en) | Image processing apparatus and image processing method | |
EP2602987B1 (en) | Display control apparatus and computer program | |
JP5407627B2 (en) | Image processing apparatus, image processing method, and program | |
JP2014232946A (en) | Information processing apparatus, information processing method, system, and program | |
JP2016184914A (en) | Image processing apparatus | |
JP4420058B2 (en) | Image processing apparatus and image processing method | |
JP5955822B2 (en) | Color conversion apparatus, image forming apparatus, color conversion method, and color conversion program | |
US9906654B1 (en) | White area defect detection for image based controls applications | |
JP5884362B2 (en) | Image processing method, image reading apparatus, and image processing program | |
JP2016103749A (en) | Image processing apparatus and image forming apparatus | |
US20160072966A1 (en) | Non-transitory computer readable medium and image processing device | |
JP2015225559A (en) | Image processor | |
JP2015177265A (en) | Image processing apparatus, image processing system, information storage method and program | |
JP2014093553A (en) | Image forming apparatus and image forming method | |
US9639791B2 (en) | Color registration error compensation in color printing | |
JP5992956B2 (en) | Image processing device | |
US10484557B2 (en) | Image processing apparatus and non-transitory computer readable medium for addition of different image data to acquired image data | |
US10587775B2 (en) | Image processing apparatus, image processing method, and storage medium for edge enhancement based on plural conditions | |
US9876937B1 (en) | Saving marking material using threshold arrays and toner reduction mask | |
JP6002618B2 (en) | Image processing apparatus, image forming apparatus, and image processing program | |
JP6578854B2 (en) | Image reading apparatus and program |