JP2011188293A - 画像処理装置、画像処理システム、及び画像処理プログラム - Google Patents
画像処理装置、画像処理システム、及び画像処理プログラム Download PDFInfo
- Publication number
- JP2011188293A JP2011188293A JP2010052068A JP2010052068A JP2011188293A JP 2011188293 A JP2011188293 A JP 2011188293A JP 2010052068 A JP2010052068 A JP 2010052068A JP 2010052068 A JP2010052068 A JP 2010052068A JP 2011188293 A JP2011188293 A JP 2011188293A
- Authority
- JP
- Japan
- Prior art keywords
- character
- color
- image processing
- characters
- extracted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000003086 colorant Substances 0.000 claims abstract description 15
- 230000010354 integration Effects 0.000 claims description 68
- 238000000034 method Methods 0.000 claims description 39
- 238000000605 extraction Methods 0.000 claims description 38
- 239000000284 extract Substances 0.000 claims description 8
- 230000000694 effects Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Landscapes
- Facsimile Image Signal Circuits (AREA)
- Color Image Communication Systems (AREA)
Abstract
【解決手段】文字画像からOCR部20で文字を抽出し、文字情報抽出部21で抽出された文字情報である文字の大きさ及び相対的位置に基づいて、抽出された文字を第1文字統合部22が文字行または文字列に統合する。背景色抽出部24で各文字毎に背景色を抽出して、統合された文字行毎または文字列毎に背景色の頻度情報を生成する。また、文字情報抽出部21で抽出された文字の色に基づいて各文字行毎または各文字列毎に文字の色頻度情報を生成する。さらに文字行または文字列毎に、背景色の頻度情報及び文字色の頻度情報に基づいて、当該文字行または文字列の背景色を決定する。第2文字統合部26は、決定された背景色が同じ隣接する文字行または文字列を文字群に統合する。
【選択図】図1
Description
また、本実施の形態では、第2文字統合部26で統合された文字群の数が設定されている出力先のフォーマットの制限を超える場合は、制限を越えない数以内に文字群の数を収めるように、統合された文字群の数が少なくなる文字の統合方法に文字の統合方法を変更するため、文字群の数が出力先の制限を超えることを抑制する。従って、再利用性が向上される。
12 制御部
14 画像読取部
20 OCR部
21 文字情報抽出部
22 第1文字統合部
24 背景色抽出部
26 第2文字統合部
28 フォーマット変換部
30 U/I部
43 プログラム
Claims (9)
- 画像データから複数の文字を抽出する第1の抽出手段と、
前記第1の抽出手段で抽出された文字の背景となる背景領域の色を文字毎に抽出する第2の抽出手段と、
前記第1の抽出手段で抽出された文字を予め定められた方向毎の第1の文字群に統合する第1の統合手段と、
前記第2の抽出手段で抽出された背景領域の色が同一であるとみなせる、隣接する前記第1の統合手段で統合された前記第1の文字群が複数の場合には該第1の文字群を、第2の文字群に統合する第2の統合手段と、
を備えた画像処理装置。 - 前記第1の文字群毎に、前記第2の抽出手段で抽出された背景領域の色に基づいて前記第1の文字群毎に当該第1の文字群の背景となる背景領域の色を決定する決定手段を備え、前記第2の統合手段は、前記決定手段で決定した背景領域の色が同一とみなす、隣接する前記第1の文字群を第2の文字群に統合する、請求項1に記載の画像処理装置。
- 前記決定手段は、前記第1の文字群の背景となる背景領域の面積に対する、前記第2の抽出手段で抽出された背景領域の色を示す領域の面積の割合に基づいて、前記第1の文字群の背景となる背景領域の色を決定する、請求項2に記載の画像処理装置。
- 前記第1の抽出手段で抽出された文字に関する情報を文字毎に抽出する第3の抽出手段を備え、前記第1の統合手段は、前記第3の抽出手段で抽出された文字に関する情報が同一であるとみなせる、予め定められた方向に隣接する文字を統合する、請求項1から請求項3のいずれか1項に記載の画像処理装置。
- 前記文字に関する情報は、文字同士の距離及び文字の大きさを含む、請求項4に記載の画像処理装置。
- 前記文字に関する情報は、文字の色を含む、請求項5に記載の画像処理装置。
- 予め文字群の数が設定される設定手段と、
前記設定手段に設定されている文字群の数に基づいて、前記第2の統合手段で前記第1の文字群を前記第2の文字群に統合するか否かを判定し、前記第2の文字群に統合しない場合は、前記第1の文字群を前記第2の文字群に統合しないように前記第2の統合手段を制御する制御手段と、
を備えた請求項1から請求項6のいずれか1項に記載の画像処理装置。 - 文字を含む画像を読み取る読取手段と、
前記読取手段で読み取った画像の画像データから抽出した文字を、第1の文字群に統合し、統合された第1の文字群を第2の文字群に統合する請求項1から請求項7のいずれか1項に記載の画像処理装置と、
を備えた画像処理システム。 - 第1の抽出手段により、画像データから複数の文字を抽出するステップと、
第2の抽出手段により、前記第1の抽出手段で抽出された文字の背景となる背景領域の色を文字毎に抽出するステップと、
第1の統合手段により、前記第1の抽出手段で抽出された文字を予め定められた方向毎の第1の文字群に統合するステップと、
第2の統合手段により、前記第2の抽出手段で抽出された背景領域の色が同一であるとみなせる、隣接する前記第1の統合手段で統合された前記第1の文字群が複数の場合には該第1の文字群を、第2の文字群に統合するステップと、
を備えた処理をコンピュータに実行させるための画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010052068A JP5577763B2 (ja) | 2010-03-09 | 2010-03-09 | 画像処理装置、画像処理システム、及び画像処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010052068A JP5577763B2 (ja) | 2010-03-09 | 2010-03-09 | 画像処理装置、画像処理システム、及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011188293A true JP2011188293A (ja) | 2011-09-22 |
JP5577763B2 JP5577763B2 (ja) | 2014-08-27 |
Family
ID=44794028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010052068A Expired - Fee Related JP5577763B2 (ja) | 2010-03-09 | 2010-03-09 | 画像処理装置、画像処理システム、及び画像処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5577763B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112418224A (zh) * | 2021-01-22 | 2021-02-26 | 成都无糖信息技术有限公司 | 一种基于机器学习的通用ocr的训练数据生成系统及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11288465A (ja) * | 1998-02-06 | 1999-10-19 | Fujitsu Ltd | カラー画像処理装置及びパターン抽出装置 |
JP2001283153A (ja) * | 2000-01-27 | 2001-10-12 | Fujitsu Ltd | カラー画像から文字列パターンを抽出する装置および方法 |
JP2002077658A (ja) * | 2000-09-04 | 2002-03-15 | Minolta Co Ltd | 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体 |
JP2006013590A (ja) * | 2004-06-22 | 2006-01-12 | Ricoh Co Ltd | 画像処理装置、画像処理方法、プログラム及び情報記録媒体 |
JP2006155588A (ja) * | 2004-11-05 | 2006-06-15 | Fuji Xerox Co Ltd | 画像処理装置、画像処理方法及び画像処理プログラム |
JP2007317034A (ja) * | 2006-05-27 | 2007-12-06 | Ricoh Co Ltd | 画像処理装置、画像処理方法、プログラムおよび記録媒体 |
-
2010
- 2010-03-09 JP JP2010052068A patent/JP5577763B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11288465A (ja) * | 1998-02-06 | 1999-10-19 | Fujitsu Ltd | カラー画像処理装置及びパターン抽出装置 |
JP2001283153A (ja) * | 2000-01-27 | 2001-10-12 | Fujitsu Ltd | カラー画像から文字列パターンを抽出する装置および方法 |
JP2002077658A (ja) * | 2000-09-04 | 2002-03-15 | Minolta Co Ltd | 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体 |
JP2006013590A (ja) * | 2004-06-22 | 2006-01-12 | Ricoh Co Ltd | 画像処理装置、画像処理方法、プログラム及び情報記録媒体 |
JP2006155588A (ja) * | 2004-11-05 | 2006-06-15 | Fuji Xerox Co Ltd | 画像処理装置、画像処理方法及び画像処理プログラム |
JP2007317034A (ja) * | 2006-05-27 | 2007-12-06 | Ricoh Co Ltd | 画像処理装置、画像処理方法、プログラムおよび記録媒体 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112418224A (zh) * | 2021-01-22 | 2021-02-26 | 成都无糖信息技术有限公司 | 一种基于机器学习的通用ocr的训练数据生成系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5577763B2 (ja) | 2014-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021190146A1 (zh) | 图片处理方法、装置、存储介质及电子设备 | |
US10467466B1 (en) | Layout analysis on image | |
JP7132654B2 (ja) | レイアウト解析方法、読取り支援デバイス、回路および媒体 | |
US8538154B2 (en) | Image processing method and image processing apparatus for extracting heading region from image of document | |
JP5526874B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2012022575A5 (ja) | ||
JP5769131B2 (ja) | 画像処理装置およびプログラム | |
JP2010074342A (ja) | 画像処理装置、画像形成装置、及びプログラム | |
JP5577763B2 (ja) | 画像処理装置、画像処理システム、及び画像処理プログラム | |
JP5612882B2 (ja) | 印刷制御装置、印刷プログラムおよび画像形成装置 | |
JP6191256B2 (ja) | 画像処理装置及びプログラム | |
US8165404B2 (en) | Method and apparatus for creating document data, and computer program product | |
JP2012022413A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP6051675B2 (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
CN106598934A (zh) | 电子书数据的显示方法、装置及终端设备 | |
JP2011186835A (ja) | 画像処理装置及び画像処理プログラム | |
JP2001222717A (ja) | 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体 | |
JP2016139869A (ja) | 画像処理装置 | |
JP5884509B2 (ja) | 画像処理装置、画像読取装置およびプログラム | |
JP2013178400A (ja) | 画像投影装置、画像生成方法及びプログラム | |
JP7383882B2 (ja) | 情報処理装置、及び情報処理プログラム | |
US9292770B2 (en) | Information processing apparatus, method and medium | |
JP4973603B2 (ja) | 画像処理装置および画像処理プログラム | |
JP5560780B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5640403B2 (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140610 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140623 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5577763 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |