JP2009141597A - 画像処理装置、文字領域特定方法、および文字領域特定プログラム - Google Patents
画像処理装置、文字領域特定方法、および文字領域特定プログラム Download PDFInfo
- Publication number
- JP2009141597A JP2009141597A JP2007314902A JP2007314902A JP2009141597A JP 2009141597 A JP2009141597 A JP 2009141597A JP 2007314902 A JP2007314902 A JP 2007314902A JP 2007314902 A JP2007314902 A JP 2007314902A JP 2009141597 A JP2009141597 A JP 2009141597A
- Authority
- JP
- Japan
- Prior art keywords
- character
- rectangle
- image
- area
- row
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
【解決手段】画像に基づいて2値画像を生成する生成手段11と、2値画像から余白領域とそれ以外の非余白領域とを抽出する第1の抽出手段12と、非余白領域内で膨張処理を行うことにより、少なくとも1つの第1の行矩形を生成する膨張手段13と、第1の行矩形の形状に基づいて2値画像の文字行方向を判定する判定手段14と、判定手段により判定された文字行方向に第1の行矩形同士を連結することによって第2の行矩形を生成する第1の連結手段17と、2値画像における第2の行矩形に対応する領域に基づいて文字領域を特定する第1の特定手段18とを備える。
【選択図】図3
Description
図1は、本実施の形態にかかるMFP10のハードウェア構成の具体例を示す図である。図1を参照して、本実施の形態にかかるMFP10は、複数の画素(画素データ)からなる画像(画像データ)を処理するものであって、スキャン処理部1と、入力画像処理部2と、記憶部3と、CPU(Central Processing Unit)4と、ネットワークI/F(インタフェース)5と、出力画像処理部6と、エンジン部7と、モデム・NCU(Network Control Unit)8と、操作部9とを含んで構成される。
図2は、本実施の形態にかかるMFP10において画像データの圧縮を行ってPDF(Portable Document Format)ファイルを作成するための機能構成の具体例を示すブロック図である。図2に示される各部は、主にCPU4が記憶部3に記憶されるプログラムを実行することによって実現される機能であるが、いくつかの機能がたとえばスキャン処理部1や入力画像処理部2などの他の専用のハードウェア構成によって実現されてもよい。
Group)、BMP(Bit MaP)などのデータフォーマットで前処理部103に入力する。つまり、画像データ取得部101は、MFP10のスキャナ部分であり、原稿を読み取り、画像データを出力する部分である。
図17は、本実施の形態にかかるMFP10において画像データの圧縮を行ってPDFファイルを作成する処理手順を示すフローチャートである。図17のフローチャートに示される処理は、主にCPU4が記憶部3に記憶されるプログラムを実行して図2および図3に示される各部を制御することで実現される処理である。
図18は、文字領域特定処理S300の処理手順を示すフローチャートである。図18を参照して、CPU4もしくは入力画像処理部2は、まず、入力された画像データに対して、2値画像生成処理を行う(S310)。より詳細には、CPU4もしくは入力画像処理部2は、入力された画像データに対して、減色処理を施してから、複数種類のしきい値に基づいて2値化処理を施す(S310)。ここでの2値画像生成処理においては、CPU4もしくは入力画像処理部2が、1つの画像データに対して、複数種類の色毎に2値画像を生成する。本実施の形態に係るMFP10においては、記憶部3に記憶された図19に示すカラーの画像に基づき、CPU4もしくは入力画像処理部2が、4種類のしきい値に基づいて、図20(a)から図20(d)に示す4種類の2値画像を生成する。そして、余白領域抽出処理S320へと移行する。
以下、本実施の形態に係る画像処理装置(MFP10)についての特徴をまとめる。本実施の形態に係る文字行矩形の形成方法は、一度連結を行って行単位に形成された矩形群の情報(縦長の矩形か横長の矩形か)を用い、文字間に余白があると判定してしまった文字行を縦方向か横方向のどちらに最連結を行えば良いか文字行方向を決定し、再度、連結処理を行うことで、正確に行矩形を生成する。また、画像全体を見たときの文字行方向と垂直な方向の文字行を正確に抽出するために、画像全体で見たときの文字行方向と垂直な方向に走査し、規定しきい値以上のサイズを持った矩形について、垂直方向に同一サイズの矩形があるかを判定し、同一サイズの矩形があれば順次連結を行うことで、行矩形を生成する。
なお、本実施の形態ではPDFファイルを作成する前の画像処理としての文字判定処理に適用した場合を示しているが、本発明はこれに限定されることなく、たとえばOCR(Optical Character Reader)のような文字認識処理の前処理として文字を誤認識しないように文字判定する処理にも適用できる。
されて実行される。なお、プログラム製品は、プログラム自体と、プログラムが記録された記録媒体とを含む。
Claims (8)
- 複数の画素からなる画像の中から文字領域を特定する画像処理装置であって、
前記画像に基づいて2値画像を生成する生成手段と、
前記2値画像から余白領域とそれ以外の非余白領域とを抽出する第1の抽出手段と、
前記非余白領域内で膨張処理を行うことにより、少なくとも1つの第1の行矩形を生成する膨張手段と、
前記第1の行矩形の形状に基づいて前記2値画像の文字行方向を判定する判定手段と、
前記判定手段により判定された前記文字行方向に前記第1の行矩形同士を連結することによって第2の行矩形を生成する第1の連結手段と、
前記2値画像における前記第2の行矩形に対応する領域に基づいて文字領域を特定する第1の特定手段とを備える、画像処理装置。 - 前記判定手段は、
前記第1の行矩形のうち、その縦横比が第1の所定条件を満たす行矩形の個数と、その縦横比が第2の所定条件を満たす行矩形の個数と、を算出する算出手段と、
前記2つの個数に基づいて前記2値画像の文字行方向を決定する第1の決定手段とを含む、請求項1に記載の画像処理装置。 - 前記第1の特定手段は、
前記第2の行矩形に含まれる少なくとも1つの小矩形を抽出する第2の抽出手段と、
各前記第2の行矩形について、前記第2の行矩形の縦横比と前記小矩形の個数との関係が第3の所定条件を満たす場合に、前記第2の行矩形に対応する領域を文字領域として決定する第2の決定手段とを含む、請求項1または2に記載の画像処理装置。 - 前記第1の特定手段は、
前記第2の行矩形に含まれる少なくとも1つの小矩形を抽出する第2の抽出手段と、
各前記第2の行矩形について、前記第2の行矩形のサイズと前記小矩形のサイズとの関係が第4の所定条件を満たす場合に、前記第2の行矩形に対応する領域を文字領域として決定する第3の決定手段とを含む、請求項1から3のいずれか1項に記載の画像処理装置。 - 前記第1の特定手段によって文字領域として特定された領域以外の前記第1の行矩形同士を、前記判定手段により判定された文字行方向と垂直な方向に連結することによって第3の行矩形を生成する第2の連結手段と、
前記2値画像における第3の行矩形に対応する領域に基づいて文字領域を特定する第2の特定手段とをさらに備える、請求項1から4のいずれか1項に記載の画像処理装置。 - 前記生成手段は、前記画像から複数種類の2値画像を生成し、
前記第1の抽出手段と、前記膨張手段と、前記判定手段と、前記第1の連結手段とは、各前記2値画像に対して処理を行い、
前記特定手段は、それぞれの前記2値画像における前記第2の行矩形に対応する領域の和集合に基づいて文字領域を特定する、請求項1から5のいずれか1項に記載の画像処理装置。 - 複数の画素からなる画像の中から文字領域を特定するための画像処理装置を用いた文字領域特定方法であって、
前記画像処理装置は、
制御部を備え、
前記画像処理方法は、
前記制御部が、前記画像に基づいて2値画像を生成するステップと、
前記制御部が、前記2値画像から余白領域とそれ以外の非余白領域とを抽出するステップと、
前記制御部が、前記非余白領域内で膨張処理を行うことにより、少なくとも1つの第1の行矩形を生成するステップと、
前記制御部が、前記第1の行矩形の形状に基づいて前記2値画像の文字行方向を判定するステップと、
前記制御部が、前記文字行方向に前記第1の行矩形同士を連結することによって第2の行矩形を生成するステップと、
前記制御部が、前記2値画像における前記第2の行矩形に対応する領域に基づいて文字領域を特定するステップとを備える、文字領域特定方法。 - コンピュータに複数の画素からなる画像の中から文字領域を特定させるための文字領域特定プログラムであって、
前記プログラムは、前記コンピュータに、
前記画像に基づいて2値画像を生成するステップと、
前記2値画像から余白領域とそれ以外の非余白領域とを抽出するステップと、
前記非余白領域内で膨張処理を行うことにより、少なくとも1つの第1の行矩形を生成するステップと、
前記第1の行矩形の形状に基づいて前記2値画像の文字行方向を判定するステップと、
前記文字行方向に前記第1の行矩形同士を連結することによって第2の行矩形を生成するステップと、
前記2値画像における前記第2の行矩形に対応する領域に基づいて文字領域を特定するステップとを実行させる、文字領域特定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007314902A JP5003445B2 (ja) | 2007-12-05 | 2007-12-05 | 画像処理装置、文字領域特定方法、および文字領域特定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007314902A JP5003445B2 (ja) | 2007-12-05 | 2007-12-05 | 画像処理装置、文字領域特定方法、および文字領域特定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009141597A true JP2009141597A (ja) | 2009-06-25 |
JP5003445B2 JP5003445B2 (ja) | 2012-08-15 |
Family
ID=40871786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007314902A Expired - Fee Related JP5003445B2 (ja) | 2007-12-05 | 2007-12-05 | 画像処理装置、文字領域特定方法、および文字領域特定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5003445B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012132051A1 (ja) * | 2011-03-31 | 2012-10-04 | 株式会社ナナオ | 細線・文字検出方法及び装置 |
JP2013211678A (ja) * | 2012-03-30 | 2013-10-10 | Brother Ind Ltd | 画像処理装置 |
US8577132B2 (en) | 2010-12-01 | 2013-11-05 | Konica Minolta Business Technologies, Inc. | Electronic document generation system, electronic document generation method, and program |
KR20200065684A (ko) * | 2018-11-30 | 2020-06-09 | 카페24 주식회사 | 온라인 전자상거래의 쇼핑몰의 디자인 자동 생성 방법 및 장치 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1031716A (ja) * | 1996-05-13 | 1998-02-03 | Matsushita Electric Ind Co Ltd | 文字行抽出方法および装置 |
JP2007193750A (ja) * | 2006-01-23 | 2007-08-02 | Konica Minolta Business Technologies Inc | 画像処理装置、文字判定プログラム、および文字判定方法 |
-
2007
- 2007-12-05 JP JP2007314902A patent/JP5003445B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1031716A (ja) * | 1996-05-13 | 1998-02-03 | Matsushita Electric Ind Co Ltd | 文字行抽出方法および装置 |
JP2007193750A (ja) * | 2006-01-23 | 2007-08-02 | Konica Minolta Business Technologies Inc | 画像処理装置、文字判定プログラム、および文字判定方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8577132B2 (en) | 2010-12-01 | 2013-11-05 | Konica Minolta Business Technologies, Inc. | Electronic document generation system, electronic document generation method, and program |
WO2012132051A1 (ja) * | 2011-03-31 | 2012-10-04 | 株式会社ナナオ | 細線・文字検出方法及び装置 |
JP2012216956A (ja) * | 2011-03-31 | 2012-11-08 | Nanao Corp | 細線・文字検出方法及び装置 |
JP2013211678A (ja) * | 2012-03-30 | 2013-10-10 | Brother Ind Ltd | 画像処理装置 |
KR20200065684A (ko) * | 2018-11-30 | 2020-06-09 | 카페24 주식회사 | 온라인 전자상거래의 쇼핑몰의 디자인 자동 생성 방법 및 장치 |
KR102198545B1 (ko) * | 2018-11-30 | 2021-01-06 | 카페24 주식회사 | 온라인 전자상거래의 쇼핑몰의 디자인 자동 생성 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
JP5003445B2 (ja) | 2012-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4424309B2 (ja) | 画像処理装置、文字判定プログラム、および文字判定方法 | |
JP4329764B2 (ja) | 画像処理装置および罫線抽出プログラム | |
JP5049920B2 (ja) | 画像処理装置及び画像処理方法 | |
JP2005045404A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP7071564B2 (ja) | 画像処理システム、画像処理方法、及び画像処理装置 | |
JP2009135796A (ja) | 画像処理装置、画像処理方法、画像処理プログラム、画像形成装置、記憶媒体 | |
JP5049921B2 (ja) | 画像処理装置及び画像処理方法 | |
JP5003445B2 (ja) | 画像処理装置、文字領域特定方法、および文字領域特定プログラム | |
JP5049922B2 (ja) | 画像処理装置及び画像処理方法 | |
JP6249240B2 (ja) | 画像処理装置 | |
JP4140519B2 (ja) | 画像処理装置、プログラムおよび記録媒体 | |
US8577132B2 (en) | Electronic document generation system, electronic document generation method, and program | |
JP4695914B2 (ja) | 画像処理装置及び画像処理方法 | |
JP2007019673A (ja) | 画像処理装置、画像圧縮方法、画像圧縮プログラムおよび圧縮画像のデータ構造 | |
JP2007088912A (ja) | 画像処理装置およびプログラム | |
JP4710672B2 (ja) | 文字色判別装置、文字色判別方法、およびコンピュータプログラム | |
JP2000022943A (ja) | 画像領域判別装置および方法ならびに画像領域判別プログラムを記録した記録媒体 | |
JP5517028B2 (ja) | 画像処理装置 | |
JP6025803B2 (ja) | 画像処理装置 | |
JP2009105541A (ja) | 画像処理装置、方法、および、プログラム | |
US8553294B2 (en) | Outlining method for properly representing curved line and straight line, and image compression method using the same | |
JP7185451B2 (ja) | 画像処理装置と画像処理方法、及びプログラム | |
JP2006311193A (ja) | 画像処理装置及びこれを備えた画像読取装置並びに画像処理方法 | |
JPH11127353A (ja) | 画像処理装置及び画像処理方法 | |
JP2001351068A (ja) | 文字認識装置、文字認識方法、画像処理装置、画像処理方法、並びにコンピュータ読み取り可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100601 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111006 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111018 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120424 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120507 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150601 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |