JP6362632B2 - 画像処理装置、画像処理方法 - Google Patents
画像処理装置、画像処理方法 Download PDFInfo
- Publication number
- JP6362632B2 JP6362632B2 JP2016007423A JP2016007423A JP6362632B2 JP 6362632 B2 JP6362632 B2 JP 6362632B2 JP 2016007423 A JP2016007423 A JP 2016007423A JP 2016007423 A JP2016007423 A JP 2016007423A JP 6362632 B2 JP6362632 B2 JP 6362632B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- compression
- image processing
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
図1は、実施例1におけるシステム構成を示す概略図である。図1では、複合機(MFP)101とコンピュータ(以下、PC)102が、ネットワーク103を介して接続されている。
制御ユニット204は、スキャナ部201、プリンタ部202、操作部203と接続し、一方では、LAN209と接続することで、画像情報やデバイス情報の入出力を行うコントローラである。CPU205はシステム全体を制御するプロセッサである。RAM206はCPU205が動作するためのシステムワークメモリであり、画像データを一時記憶するための画像メモリでもある。ROM210はブートROMであり、システムのブートプログラム等のプログラムが格納されている。記憶部211は、ハードディスクドライブ等の不揮発性記憶媒体であり、システム制御ソフトウェアや画像データを格納する。操作部I/F207は操作部(UI)203とのインターフェース部で、操作部203に表示するための画像データを操作部203に対して出力する。また、操作部I/F207は、操作部203を介して本画像処理装置のユーザが指示した情報を、CPU205に伝える役割をする。ネットワークI/F208は本画像処理装置をLAN209に接続し、データの入出力を行う(例えば、PDF形式の圧縮データを別の装置に送信したり、別の装置からPDF形式の圧縮データを受信したりする)。以上のデバイスがシステムバス216上に配置される。また、イメージバスインターフェース212は、システムバス216と画像データを高速で転送する画像バス217とを接続し、データ構造を変換するバスブリッジである。画像バス217は、例えば、PCIバスやIEEE1394で構成される。
画像バス217上には以下のデバイスが配置される。ラスターイメージプロセッサ(RIP)213は、PDL(ページ記述言語)コードを解析し、指定された解像度のビットマップイメージに展開する、いわゆるレンダリング処理を実現する。デバイスI/F部214は、信号線218を介して画像入力デバイスであるスキャナ部201を接続し、信号線219を介して画像出力デバイスであるプリンタ部202を接続しており、画像データの同期系/非同期系の変換を行う。データ処理部215では、PDF高圧縮やOCRなどの処理を行うことで、PDF形式の圧縮データ(515)を生成する。生成された圧縮データ(515)は、ネットワークI/F208及びLAN209を介して、指定された宛先(例えば、クライアントPC102)に送信される。また、このデータ処理部215は、ネットワークI/F208及びLAN209を介して受信した圧縮データの伸長を行うこともできる。伸長画像は、デバイスI/F214を介してプリンタ部202に送られ、印刷されることになる。
次に、図2のデータ処理部215により実現される画像圧縮処理部の構成と画像伸長処理部の構成について、図5及び図6のブロック図を用いて説明する。データ処理部215は、プロセッサがコンピュータプログラムを実行することにより、図5または図6の各処理部として機能するように構成してもよいし、その一部または全部をASICや電子回路等のハードウェアで構成するようにしてもよい。
そうすることにより、本当の文字領域だけをMMR圧縮すべき対象であると判定できるようになる。
領域判定の結果、704と706は文字領域と判定され、705は写真領域として判定されたものとする。文字領域707と708は、2値画像703から、領域判定部503により文字領域と判定された部分画像を抽出したものである。709は、文字切り出し部504により切り出された文字切り矩形の概略図を示す。710は文字領域704内から切り出された文字切り矩形である。また、711、712、713は、文字領域706内から切り出された文字切り矩形である。
拡大部604は、JPEG伸長部(603)で伸長された縮小多値画像に対して、拡大処理を行うことで、圧縮前の入力画像501のサイズと同じサイズの多値画像を生成する。
実施例1では、図4の401に示すように比較的文字品位の良い入力画像を例として挙げた。しかしながら、図10の1101に示すように文字品位が悪くノイズ等が多い画像(例えば、スキャン原稿や圧縮画像)に対してエッジ検出処理を行うと、図11の1102に示すように文字の内部で多くのエッジが出現する場合がある。文字内部におけるエッジの出現は、特に大きな文字になるほど、顕著になりやすい。
次に、図11を用いて図5の領域判定部2(505)内のエッジ検出部(302)が行う処理の詳細について説明を行う。エッジ検出部(302)は、分散値検出部1001、エッジ判定閾値算出部1002、エッジ抽出部1003から構成される。エッジ検出部(302)の処理をより詳細に説明するため、図12も合わせて説明を行う。図12の1101、1102、1103はそれぞれ図4内に示した401及び、406と同じく入力画像に対し文字切り矩形情報を参照しながら、文字切り矩形単位で切り出された入力画像を示している。1101、1102、1103はそれぞれ、スキャナ部201で取得された際の信号値が異なっている画像例である。より具体化するために、L*a*b*表色系での信号値をしめしており、L*が明度、a*およびb*で色度を示している。なお、本例ではL*a*b*表色系で示しているが、限定するものでなく例えば、RGB表色系など別の色空間の信号値でも同様の処理が可能である。1101の1104で示す領域の信号値は{L*, a*, b*}={1128, −50, +30}である。1105で示す領域の信号値は{L*, a*, b*}={128, +50, −60}である。1104と1105の領域間で大きな信号値差がある例を示している。一方、1102の1106で示す領域の信号値は{L*, a*, b*}={128, −50, +30}である。1107で示す領域の信号値は{L*, a*, b*}={128, −60, +30}である。1106と1107の領域間で小さな信号値差しかない例を示している。更に、1103の1108で示す領域の信号値は{L*, a*, b*}={128, −50, +30}である。1109で示す領域の信号値は{L*, a*, b*}={128, −52, +30}である。1108と1109の領域間ではほぼ信号値差がない例を示している。例えば、エッジ検出部(302)を本構成ではなく、単純に隣り合う画素との信号値比較を元に行うエッジ検出や、フィルタ処理によって行うエッジ検出を行った場合には以下の問題がある。即ち、闘値によっては1101では1104と1105との境界で輪郭エッジが取得できるが、1102の1106と1107との境界で輪郭エッジが取得できない。また、1102の1106と1107との境界で輪郭エッジを取得できる閾値にした場合には1103の1108と1109との境界の輪郭エッジが取得されてしまう。その結果、スキャナの読み取りバラつきやJpegノイズなどの小さなノイズもエッジとして検出されてしまう。
実施例4では、エッジの抽出を行う際の閾値算出において、信号値の分散値を元に閾値を切り替える手法を説明した。入力画像が3チャンネル等を持つカラー画像の場合には、チャンネル数に応じた数だけの分散値を算出ができ、精度よく閾値の決定に用いる事ができる。しかしながら、入力画像がグレースケールの場合には、チャンネル数が1つのため、閾値算出に用いる事ができる分散値が1つになってしまい、高精度に閾値を算出する事が難しい。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (19)
- 原稿の読み取りに基づいて得られる画像に、文字領域を特定するための所定の処理を行う処理手段と、文字認識処理を行う文字認識処理手段と、2値圧縮を行う2値圧縮手段と、を有する画像処理装置において、
前記処理手段が前記所定の処理を行うことで前記画像から特定された複数の文字領域それぞれに対して、当該文字領域が、2値圧縮が行われるべき文字領域であるかを判定する判定手段と、
複数の文字領域それぞれに対して前記文字認識処理手段による文字認識処理を行い、前記複数の文字領域のそれぞれに対する前記判定結果にしたがって、前記複数の文字領域のうち、2値圧縮が行われるべきであると判定された文字領域に対して、前記2値圧縮手段による2値圧縮を行うようにする制御手段と、
を有することを特徴とする画像処理装置。 - 前記判定手段は、背景と文字との濃度差が閾値未満である文字領域を、2値圧縮が行われるべきでない文字領域であると判定することを特徴とする請求項1に記載の画像処理装置。
- 前記判定手段は、閾値以上に濃い背景を持つ部分の内部に当該背景よりも濃い文字が含まれる文字領域を、2値圧縮が行われるべきでない文字領域であると判定することを特徴とする請求項1に記載の画像処理装置。
- 前記判定手段は、文字領域における閾値以上に濃い部分の内部に閾値個数以上のエッジ画素が含まれる場合に、当該文字領域を、2値圧縮が行われるべきでない文字領域であると判定することを特徴とする請求項1に記載の画像処理装置。
- 前記判定手段は、文字領域における閾値以上に濃い部分の内部に前記閾値個数未満しかエッジ画素が含まれない場合に、当該文字領域を、2値圧縮が行われるべき文字領域であると判定することを特徴とする請求項4に記載の画像処理装置。
- 多値圧縮を行う多値圧縮手段を有し、
前記制御手段は、2値圧縮が行われるべきでないと前記判定手段によって判定された文字領域には、前記2値圧縮手段による2値圧縮を行わずに前記多値圧縮手段による多値圧縮を行うようすることを特徴とする請求項1乃至5のいずれか1項に記載の画像処理装置。 - 前記制御手段は、少なくとも、前記複数の文字領域それぞれに対する文字認識処理の結果と、前記複数の文字領域のうちの該当文字領域に対する2値圧縮の結果と、前記画像を多値圧縮した結果とを、所定のフォーマットのファイルにまとめることを特徴とする請求項6に記載の画像処理装置。
- 前記制御手段は、前記画像を多値圧縮した結果も、前記ファイルにまとめることを特徴とする請求項7に記載の画像処理装置。
- 前記ファイルを外部装置に送信する送信手段を有する請求項7または8に記載の画像処理装置。
- 原稿の読み取りに基づいて得られる画像に、文字領域を特定するための所定の処理を行う処理工程と、文字認識処理を行う文字認識処理工程と、2値圧縮を行う2値圧縮工程と、を有する画像処理方法において、
前記処理工程が前記所定の処理を行うことで前記画像から特定された複数の文字領域それぞれに対して、当該文字領域が、2値圧縮が行われるべき文字領域であるかを判定する判定工程と、
複数の文字領域それぞれに対して前記文字認識処理工程による文字認識処理を行い、前記複数の文字領域のそれぞれに対する前記判定結果にしたがって、前記複数の文字領域のうち、2値圧縮が行われるべきであると判定された文字領域に対して、前記2値圧縮工程による2値圧縮を行うようにする制御工程と、
を有することを特徴とする画像処理方法。 - 前記判定工程は、背景と文字との濃度差が閾値未満である文字領域を、2値圧縮が行われるべきでない文字領域であると判定することを特徴とする請求項10に記載の画像処理方法。
- 前記判定工程は、閾値以上に濃い背景を持つ部分の内部に当該背景よりも濃い文字が含まれる文字領域を、2値圧縮が行われるべきでない文字領域であると判定することを特徴とする請求項10に記載の画像処理方法。
- 前記判定工程は、文字領域における閾値以上に濃い部分の内部に閾値個数以上のエッジ画素が含まれる場合に、当該文字領域を、2値圧縮が行われるべきでない文字領域であると判定することを特徴とする請求項10に記載の画像処理方法。
- 前記判定工程は、文字領域における閾値以上に濃い部分の内部に前記閾値個数未満しかエッジ画素が含まれない場合に、当該文字領域を、2値圧縮が行われるべき文字領域であると判定することを特徴とする請求項13に記載の画像処理方法。
- 多値圧縮を行う多値圧縮工程を有し、
前記制御工程は、2値圧縮が行われるべきでないと前記判定工程によって判定された文字領域には、前記2値圧縮工程による2値圧縮を行わずに前記多値圧縮工程による多値圧縮を行うようすることを特徴とする請求項10乃至14のいずれか1項に記載の画像処理方法。 - 前記制御工程は、少なくとも、前記複数の文字領域それぞれに対する文字認識処理の結果と、前記複数の文字領域のうちの該当文字領域に対する2値圧縮の結果と、前記画像を多値圧縮した結果とを、所定のフォーマットのファイルにまとめることを特徴とする請求項15に記載の画像処理方法。
- 前記制御工程は、前記画像を多値圧縮した結果も、前記ファイルにまとめることを特徴とする請求項16に記載の画像処理方法。
- 前記ファイルを外部装置に送信する送信工程を有する請求項16または17に記載の画像処理方法。
- 請求項10乃至18の何れか1項に記載の画像処理方法をコンピュータに実行させるためのプログラム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013262763 | 2013-12-19 | ||
JP2013262763 | 2013-12-19 | ||
JP2014054163 | 2014-03-17 | ||
JP2014054163 | 2014-03-17 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014139870A Division JP5875637B2 (ja) | 2013-12-19 | 2014-07-07 | 画像処理装置、画像処理方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018116076A Division JP6743092B2 (ja) | 2013-12-19 | 2018-06-19 | 画像処理装置、画像処理の制御方法、及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016054564A JP2016054564A (ja) | 2016-04-14 |
JP2016054564A5 JP2016054564A5 (ja) | 2017-08-17 |
JP6362632B2 true JP6362632B2 (ja) | 2018-07-25 |
Family
ID=55745364
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016007423A Active JP6362632B2 (ja) | 2013-12-19 | 2016-01-18 | 画像処理装置、画像処理方法 |
JP2018116076A Active JP6743092B2 (ja) | 2013-12-19 | 2018-06-19 | 画像処理装置、画像処理の制御方法、及びプログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018116076A Active JP6743092B2 (ja) | 2013-12-19 | 2018-06-19 | 画像処理装置、画像処理の制御方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP6362632B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108805116B (zh) * | 2018-05-18 | 2022-06-24 | 浙江蓝鸽科技有限公司 | 图像文本检测方法及其系统 |
JP6868057B2 (ja) * | 2019-05-27 | 2021-05-12 | 株式会社東芝 | 読取システム、読取方法、プログラム、記憶媒体、及び移動体 |
JP7382834B2 (ja) | 2020-01-07 | 2023-11-17 | シャープ株式会社 | 画像処理装置、画像処理方法、及びプログラム |
CN112070708B (zh) * | 2020-08-21 | 2024-03-08 | 杭州睿琪软件有限公司 | 图像处理方法、图像处理装置、电子设备、存储介质 |
CN115995091B (zh) * | 2023-02-09 | 2023-08-25 | 清华大学 | 一种流程图读取方法及装置、电子设备和存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4963559B2 (ja) * | 2006-03-17 | 2012-06-27 | 株式会社リコー | 画像処理装置、画像形成装置、画像処理方法、その方法をコンピュータに実行させるプログラム |
US20070237408A1 (en) * | 2006-04-05 | 2007-10-11 | Kabushiki Kaisha Toshiba | Image processing apparatus and image processing method |
JP2012074852A (ja) * | 2010-09-28 | 2012-04-12 | Sharp Corp | 画像処理装置、画像形成装置、画像読取装置、画像処理方法、画像処理プログラムおよび記録媒体 |
JP5933987B2 (ja) * | 2012-02-21 | 2016-06-15 | キヤノン株式会社 | 画像符号化装置及びその制御方法 |
JP5875637B2 (ja) * | 2013-12-19 | 2016-03-02 | キヤノン株式会社 | 画像処理装置、画像処理方法 |
-
2016
- 2016-01-18 JP JP2016007423A patent/JP6362632B2/ja active Active
-
2018
- 2018-06-19 JP JP2018116076A patent/JP6743092B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016054564A (ja) | 2016-04-14 |
JP2018139457A (ja) | 2018-09-06 |
JP6743092B2 (ja) | 2020-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5875637B2 (ja) | 画像処理装置、画像処理方法 | |
JP5132530B2 (ja) | 画像符号化装置及び画像処理装置及びそれらの制御方法 | |
JP6743092B2 (ja) | 画像処理装置、画像処理の制御方法、及びプログラム | |
US6999619B2 (en) | Processing for accurate reproduction of symbols and other high-frequency areas in a color image | |
US8384964B2 (en) | Image processing apparatus and image processing method | |
US8774511B2 (en) | Image processing apparatus and image processing method | |
JP5645612B2 (ja) | 画像処理装置、画像処理方法、プログラム、及び記憶媒体 | |
US8971647B2 (en) | Image compression apparatus, image compression method, and storage medium | |
US11736652B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP6370080B2 (ja) | 画像処理装置、画像処理方法及びプログラム。 | |
US8810877B2 (en) | Image processing apparatus, image processing method, and storage medium for eliminating blurring of scanned image | |
US8577132B2 (en) | Electronic document generation system, electronic document generation method, and program | |
JP7134045B2 (ja) | 画像処理装置と画像処理方法、及びプログラム | |
JP7301529B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP5517028B2 (ja) | 画像処理装置 | |
JP7362405B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
US11924390B2 (en) | Apparatus, method, and storage medium for performing color reduction processing | |
JP7185451B2 (ja) | 画像処理装置と画像処理方法、及びプログラム | |
JP4228905B2 (ja) | 画像処理装置及びプログラム | |
JP2012231261A (ja) | 画像処理装置およびその制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170707 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170707 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180313 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180510 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180529 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180626 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6362632 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |