JP7134045B2 - 画像処理装置と画像処理方法、及びプログラム - Google Patents
画像処理装置と画像処理方法、及びプログラム Download PDFInfo
- Publication number
- JP7134045B2 JP7134045B2 JP2018180941A JP2018180941A JP7134045B2 JP 7134045 B2 JP7134045 B2 JP 7134045B2 JP 2018180941 A JP2018180941 A JP 2018180941A JP 2018180941 A JP2018180941 A JP 2018180941A JP 7134045 B2 JP7134045 B2 JP 7134045B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- rectangle
- area
- image
- determined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32358—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device using picture signal storage, e.g. at transmitter
- H04N1/32459—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device using picture signal storage, e.g. at transmitter for changing the arrangement of the stored data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40012—Conversion of colour to monochrome
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40062—Discrimination between different image types, e.g. two-tone, continuous tone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
- H04N1/56—Processing of colour picture signals
- H04N1/60—Colour correction or control
- H04N1/6072—Colour correction or control adapting to different types of images, e.g. characters, graphs, black and white image portions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0094—Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Facsimile Image Signal Circuits (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Character Input (AREA)
Description
多値の入力画像から2値画像を生成する2値化手段と、
前記2値画像から文字領域と非文字領域とを検出する検出手段と、
前記検出手段により検出された前記文字領域に含まれる文字のそれぞれを囲む領域を、文字切り矩形として切り出す切り出し手段と、
前記文字切り矩形に含まれる前記2値画像の黒画素密度に基づいて当該文字切り矩形が文字領域か否かを判定する第1判定手段と、
前記第1判定手段で非文字領域と判定された文字切り矩形に含まれる画素数と前記検出手段によって検出された前記文字領域に含まれる他の文字切り矩形に含まれる画素数とに基づいて、当該非文字領域と判定された文字切り矩形が文字領域か否かを判定する第2判定手段と、を有することを特徴とする。
図1は、本発明の実施形態1に係る画像処理装置を含むシステムの全体構成を示す図である。実施形態1では、本発明に係る画像処理装置の一例である複合機(MFP:multi-function peripheral)101とコンピュータ(以下、PC)102とが、ネットワーク103を介して接続されている。図において、点線104と105は処理の流れを示しており、点線104は、ユーザがMFP101のスキャナを用いて紙文書を読み込ませる処理を示す。その際、ユーザは、後述するMFP101のユーザインタフェース(図2の操作部203)を用いて、スキャン画像を送信する宛先(例えば、PC102)と、スキャンや送信に関わる各種設定を行うことができる。その各種設定として、ユーザは、解像度、圧縮率、データ書式(例えば、JPEG、TIFF、PDF、PDF高圧縮、PDF高圧縮(OCR結果付き))等を指定できる。実施形態1では、データ書式としてPDF高圧縮が指定された場合で説明する。PDF高圧縮の詳細については後述する。点線105は、指定された各種設定に基づいて、MFP101のソフトウェア或いはハードウェア機能を利用してデータを生成し、指定された宛先に送信する処理を示す。ここで、PC102へ送信される画像データは、PDF等のファイルフォーマットで送信されることになるので、PC102の有する汎用的なビューアで閲覧可能である。
(1)2値画像に対して黒画素の輪郭を追跡することにより、黒画素の塊(黒画素塊)を抽出する。輪郭の追跡では、左上、左、左下、下、右下、右、右上、上の8つの方向の何れかで黒画素が連続しているかで判断する。例えば図16(1)において枠線部分の黒画素塊を抽出する。
(2)抽出された黒画素塊の中に、一定の大きさを越える黒画素塊があれば、その領域内に白画素塊があるか判定する。即ち、黒画素塊の領域内で白画素の輪郭を追跡することにより白画素塊を抽出する。例えば図16(2)の枠線の内側の白画素の輪郭を追跡して白画素塊を抽出する。更に、抽出した白画素塊が一定の大きさを越える場合には、再度、白画素塊内の黒画素の輪郭を追跡することにより黒画素塊を抽出する。例えば図16(2)の黒文字部分の輪郭を追跡して黒画素塊を抽出する。これらの処理は、画素塊が一定の大きさ以下になるまで繰り返し行う。この処理は枠線などで囲まれた領域内の文字領域を抽出するために行う。
(3)得られた黒画素塊を、大きさや形状、黒画素密度の内の少なくとも1つを用いて、文字か写真かに分類する。例えば、図16(3)の文字「A」のように、縦横比が1に近く、かつ、大きさが定められた範囲の黒画素塊であれば、その黒画素塊は、文字を構成する黒画素塊であると判定する。そして、残りの黒画素塊を、写真を構成する画素塊と判定する。
(4)文字を構成する黒画素塊同士の端部からの距離が近接している場合に、その黒画素塊同士を同じグループに分類する。その上で、同じグループに分類された黒画素塊の何れをも包含する外接矩形領域を文字領域と判定する。例えば図16(4)に示すように、文字間の距離が近い場合は、ABCの文字列を1つの文字領域として判定する。尚、文字を構成する他の黒画素塊が所定の距離内に無い場合、文字を構成する黒画素塊は、それ単独で一つのグループを構成することになる。従って、その単独の黒画素塊の外接矩形領域が文字領域と判定されることになる。尚、写真を構成する黒画素塊に対しても(4)で説明した処理と同様の処理がなされるものとする。そして、各領域の位置と、その領域の属性判定情報(文字か写真か)とを判定結果として出力する。
(A)文字領域を選択する(例えば、図7(D)の領域704を選択する)。
(B)選択した文字領域704に対して、矢印708の方向(横方向)に、黒画素がいくつあるかを数える。その結果を、図7(E)の709で表す。709において、閾値thより多くの黒画素があった縦方向に連続するラインを1つのグループにする。この結果、図7(E)の710で表すように、2つのグループ711,712が抽出される。これら2つのグループ711,712は、706で示す「突然の雨に驚く」の文字列が存在するライン群を含むグループ711と、707で示すカメラで撮影された画像が存在するライン群を含むグループ712である。
(C)これらグループ711,712のそれぞれに対して、図7(F)の矢印713の方向(縦方向)に、黒画素がいくつあるかを数え、連続するラインを1つのグループにする。例えば、グループ711に対して処理を行った場合、714で示すように、7つのグループが抽出される。これら7つのグループは、それぞれ文字「突」、「然」、「の」、「雨」、「に」、「驚」、「く」が存在するライン群である。
(D)(C)で得られた各ライン群のグループの外接矩形を文字切出し矩形として切り出す。その結果、例えば、各文字の外接矩形が文字切出し矩形として切り出されることになる。切り出された結果は、図7(F)(G)の715,716で示す通りである。
(E)以上(A)~(D)の処理を、選択されていない文字領域が無くなるまで繰り返す。
図15は、実施形態2に係る文字切り矩形修正部505の機能構成を示すブロック図である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (8)
- 多値の入力画像から2値画像を生成する2値化手段と、
前記2値画像から文字領域と非文字領域とを検出する検出手段と、
前記検出手段により検出された前記文字領域に含まれる文字のそれぞれを囲む領域を、文字切り矩形として切り出す切り出し手段と、
前記文字切り矩形に含まれる前記2値画像の黒画素密度に基づいて当該文字切り矩形が文字領域か否かを判定する第1判定手段と、
前記第1判定手段で非文字領域と判定された文字切り矩形に含まれる画素数と前記検出手段によって検出された前記文字領域に含まれる他の文字切り矩形に含まれる画素数とに基づいて、当該非文字領域と判定された文字切り矩形が文字領域か否かを判定する第2判定手段と、
を有することを特徴とする画像処理装置。 - 前記第2判定手段は、前記第1判定手段で文字領域と判定された文字切り矩形に含まれる画素の平均画素数を算出する第1算出手段を有し、
前記平均画素数と、前記第1判定手段で非文字領域と判定された文字切り矩形に含まれる前記画素数との差の絶対値が所定値よりも小さい場合に、前記非文字領域と判定された文字切り矩形が文字領域であると判定することを特徴とする請求項1に記載の画像処理装置。 - 前記所定値は、前記平均画素数の50%~150%の値であることを特徴とする請求項2に記載の画像処理装置。
- 前記第1判定手段は、前記文字切り矩形に含まれる前記2値画像の黒画素密度が所定の閾値よりも大きい場合に、当該文字切り矩形が非文字領域であると判定することを特徴とする請求項1乃至3のいずれか1項に記載の画像処理装置。
- 前記検出手段は、前記2値画像に含まれる黒画素塊の大きさや形状、前記黒画素密度のうち少なくとも1つを用いて文字領域と非文字領域とを検出することを特徴とする請求項1乃至4のいずれか1項に記載の画像処理装置。
- 前記検出手段は、前記2値画像に含まれる黒画素塊の縦横比が1に近く、かつ当該黒画素塊の大きさが所定の範囲であれば、当該黒画素塊を文字領域として検出することを特徴とする請求項5に記載の画像処理装置。
- 多値の入力画像から2値画像を生成する2値化工程と、
前記2値画像から文字領域と非文字領域とを検出する検出工程と、
前記検出工程で検出された前記文字領域に含まれる文字のそれぞれを囲む領域を、文字切り矩形として切り出す切り出し工程と、
前記文字切り矩形に含まれる前記2値画像の黒画素密度に基づいて当該文字切り矩形が文字領域か否かを判定する第1判定工程と、
前記第1判定工程で非文字領域と判定された文字切り矩形に含まれる画素数と前記検出工程で検出された前記文字領域に含まれる他の文字切り矩形に含まれる画素数とに基づいて、当該非文字領域と判定された文字切り矩形が文字領域か否かを判定する第2判定工程と、
を有することを特徴とする画像処理方法。 - コンピュータを、請求項1乃至6のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018180941A JP7134045B2 (ja) | 2018-09-26 | 2018-09-26 | 画像処理装置と画像処理方法、及びプログラム |
US16/574,383 US10931852B2 (en) | 2018-09-26 | 2019-09-18 | Image processing apparatus, image processing method, and storage medium, with determining whether or not character clipping rectangle determined to be non-character region is character region |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018180941A JP7134045B2 (ja) | 2018-09-26 | 2018-09-26 | 画像処理装置と画像処理方法、及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2020053818A JP2020053818A (ja) | 2020-04-02 |
JP2020053818A5 JP2020053818A5 (ja) | 2021-10-28 |
JP7134045B2 true JP7134045B2 (ja) | 2022-09-09 |
Family
ID=69885089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018180941A Active JP7134045B2 (ja) | 2018-09-26 | 2018-09-26 | 画像処理装置と画像処理方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10931852B2 (ja) |
JP (1) | JP7134045B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020110703A1 (ja) * | 2018-11-27 | 2020-06-04 | 凸版印刷株式会社 | 画像データの生成方法、表示体の製造方法、プログラム、コンピュータ読み取り可能な記録媒体及び表示体の製造装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002042055A (ja) | 2000-07-24 | 2002-02-08 | Japan Science & Technology Corp | カラー文書画像からの文字抽出方法 |
JP2005184404A (ja) | 2003-12-18 | 2005-07-07 | Fuji Xerox Co Ltd | 画像処理装置 |
JP2015195549A (ja) | 2013-12-19 | 2015-11-05 | キヤノン株式会社 | 画像処理装置、画像処理方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3086653B2 (ja) * | 1996-03-15 | 2000-09-11 | 三洋電機株式会社 | 文字認識方法及び文字認識装置 |
JP4366003B2 (ja) | 2000-08-25 | 2009-11-18 | キヤノン株式会社 | 画像処理装置及び画像処理方法 |
US7133565B2 (en) | 2000-08-25 | 2006-11-07 | Canon Kabushiki Kaisha | Image processing apparatus and method |
JP5893379B2 (ja) * | 2011-12-13 | 2016-03-23 | キヤノン株式会社 | 画像圧縮装置、画像圧縮方法、コンピュータプログラム |
JP6099961B2 (ja) * | 2012-12-18 | 2017-03-22 | キヤノン株式会社 | 画像表示装置、画像表示装置の制御方法およびコンピュータプログラム |
-
2018
- 2018-09-26 JP JP2018180941A patent/JP7134045B2/ja active Active
-
2019
- 2019-09-18 US US16/574,383 patent/US10931852B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002042055A (ja) | 2000-07-24 | 2002-02-08 | Japan Science & Technology Corp | カラー文書画像からの文字抽出方法 |
JP2005184404A (ja) | 2003-12-18 | 2005-07-07 | Fuji Xerox Co Ltd | 画像処理装置 |
JP2015195549A (ja) | 2013-12-19 | 2015-11-05 | キヤノン株式会社 | 画像処理装置、画像処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2020053818A (ja) | 2020-04-02 |
US20200099821A1 (en) | 2020-03-26 |
US10931852B2 (en) | 2021-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5875637B2 (ja) | 画像処理装置、画像処理方法 | |
JP5132530B2 (ja) | 画像符号化装置及び画像処理装置及びそれらの制御方法 | |
US8384964B2 (en) | Image processing apparatus and image processing method | |
US8401306B2 (en) | Image processing apparatus and control method | |
JP6743092B2 (ja) | 画像処理装置、画像処理の制御方法、及びプログラム | |
US8774511B2 (en) | Image processing apparatus and image processing method | |
JP4364809B2 (ja) | 画像処理装置、画像処理方法、プログラム、及び記録媒体 | |
JP5645612B2 (ja) | 画像処理装置、画像処理方法、プログラム、及び記憶媒体 | |
US8229214B2 (en) | Image processing apparatus and image processing method | |
US8532385B2 (en) | Image processing apparatus and image processing method | |
JP5893379B2 (ja) | 画像圧縮装置、画像圧縮方法、コンピュータプログラム | |
US20090110313A1 (en) | Device for performing image processing based on image attribute | |
JP6370080B2 (ja) | 画像処理装置、画像処理方法及びプログラム。 | |
JP7134045B2 (ja) | 画像処理装置と画像処理方法、及びプログラム | |
JP2011013900A (ja) | 画像処理装置、画像処理方法、プログラム、及び記憶媒体 | |
JP7301529B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP5517028B2 (ja) | 画像処理装置 | |
JP7185451B2 (ja) | 画像処理装置と画像処理方法、及びプログラム | |
JP7362405B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP7543023B2 (ja) | 画像処理装置及び画像処理方法、プログラム | |
JP2024097205A (ja) | 画像処理装置、画像処理装置の制御方法、及びプログラム | |
JP2024080365A (ja) | 画像処理装置、その制御方法およびプログラム | |
JP2023111408A (ja) | 画像処理装置及びその制御方法とプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20210103 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210913 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210913 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220523 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220527 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220721 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220801 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220830 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7134045 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |