JP2014044470A - 画像処理装置、画像処理方法、及びプログラム - Google Patents
画像処理装置、画像処理方法、及びプログラム Download PDFInfo
- Publication number
- JP2014044470A JP2014044470A JP2012184906A JP2012184906A JP2014044470A JP 2014044470 A JP2014044470 A JP 2014044470A JP 2012184906 A JP2012184906 A JP 2012184906A JP 2012184906 A JP2012184906 A JP 2012184906A JP 2014044470 A JP2014044470 A JP 2014044470A
- Authority
- JP
- Japan
- Prior art keywords
- area
- region
- image
- character
- super
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1473—Recognising objects as potential recognition candidates based on visual cues, e.g. shapes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18105—Extraction of features or characteristics of the image related to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40062—Discrimination between different image types, e.g. two-tone, continuous tone
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
【解決手段】特徴点検出部40は、対象画像内のエッジのコーナーを特徴点として検出する。領域取得部42は、特徴点検出部40の検出結果に基づいて、略直線上に並ぶ複数の特徴点を含む領域を取得する。文字領域検出部44は、領域取得部42によって取得される領域に基づいて、対象画像内の文字領域を検出する。
【選択図】図3
Description
(1)特徴点50は互いに直交する縦方向又は横方向の直線上に並ぶ。
(2)一つの直線上に並ぶ特徴点50は同一又は類似の色を有する。
(A)複数の特徴点50が縦、横、又は斜め方向に略直線上に並んでいる。
(B)複数の特徴点50が同一又は類似の色を有している。
(C)隣り合う特徴点50同士の距離が第1の閾値以下である。
(D)一方の端側の特徴点50から他方の端側の特徴点50までの距離が第2の閾値(第1の閾値よりも大きい閾値)以上である。
Claims (8)
- 対象画像内のエッジのコーナーを特徴点として検出する特徴点検出手段と、
前記特徴点検出手段の検出結果に基づいて、略直線上に並ぶ複数の特徴点を含む領域を取得する領域取得手段と、
前記領域取得手段によって取得される領域に基づいて、前記対象画像内の文字領域を検出する文字領域検出手段と、
を含むことを特徴とする画像処理装置。 - 請求項1に記載の画像処理装置において、
前記文字領域検出手段は、前記領域取得手段によって取得される領域のうちの、互いに近接する領域に基づいて、前記文字領域を検出する、
ことを特徴とする画像処理装置。 - 請求項1又は2に記載の画像処理装置において、
前記領域取得手段は、略直線上に並び、かつ、同一又は類似の色を有する複数の特徴点を含む領域を取得する、
ことを特徴とする画像処理装置。 - 請求項3に記載の画像処理装置において、
前記文字領域検出手段は、前記領域取得手段によって取得される領域のうちの、互いに近接する領域を結合することによって、前記文字領域を検出し、
前記文字領域検出手段は、前記領域取得手段によって取得された第1の領域及び第2の領域が互いに近接している場合、前記第1の領域に含まれる特徴点の色と、前記第2の領域に含まれる特徴点の色と、が同一又は類似でなかったとしても、前記第1の領域と前記第2の領域とを結合することによって、前記文字領域を検出する、
ことを特徴とする画像処理装置。 - 請求項1乃至4のいずれかに記載の画像処理装置において、
前記特徴点検出手段は、
前記対象画像内のエッジのコーナーを第1特徴点として検出する第1検出手段と、
前記対象画像を縮小してなる縮小画像内のエッジのコーナーを第2特徴点として検出する第2検出手段と、を含み、
前記領域取得手段は、
前記第1検出手段の検出結果に基づいて、略直線上に並ぶ複数の第1特徴点を含む領域を取得する第1取得手段と、
前記第2検出手段の検出結果に基づいて、略直線上に並ぶ複数の第2特徴点を含む領域を取得する第2取得手段と、を含み、
前記文字領域検出手段は、前記第1取得手段によって取得される領域と、前記第2取得手段によって取得される領域と、に基づいて、前記対象画像内の文字領域を検出する、
ことを特徴とする画像処理装置。 - 請求項1乃至5のいずれかに記載の画像処置装置において、
前記文字領域検出手段は、
グラフカット法を用いて、前記領域取得手段によって取得された領域のうちから、前記文字領域に含まれる領域を抽出する抽出手段と、
前記抽出手段によって抽出された領域に基づいて、前記対象画像内の文字領域を検出する手段と、を含む、
ことを特徴とする画像処理装置。 - 対象画像内のエッジのコーナーを特徴点として検出する特徴点検出ステップと、
前記特徴点検出ステップにおける検出結果に基づいて、略直線上に並ぶ複数の特徴点を含む領域を取得する領域取得ステップと、
前記領域取得ステップにおいて取得される領域に基づいて、前記対象画像内の文字領域を検出する文字領域検出ステップと、
を含むことを特徴とする画像処理方法。 - 対象画像内のエッジのコーナーを特徴点として検出する特徴点検出手段、
前記特徴点検出手段の検出結果に基づいて、略直線上に並ぶ複数の特徴点を含む領域を取得する領域取得手段、及び、
前記領域取得手段によって取得される領域に基づいて、前記対象画像内の文字領域を検出する文字領域検出手段、
としてコンピュータを機能させることを特徴とするプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012184906A JP5679229B2 (ja) | 2012-08-24 | 2012-08-24 | 画像処理装置、画像処理方法、及びプログラム |
US14/423,437 US9619700B2 (en) | 2012-08-24 | 2013-05-30 | Image processing device, image processing method, program, and information storage medium |
PCT/JP2013/065115 WO2014030406A1 (ja) | 2012-08-24 | 2013-05-30 | 画像処理装置、画像処理方法、プログラム、及び情報記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012184906A JP5679229B2 (ja) | 2012-08-24 | 2012-08-24 | 画像処理装置、画像処理方法、及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2014044470A true JP2014044470A (ja) | 2014-03-13 |
JP2014044470A5 JP2014044470A5 (ja) | 2015-01-08 |
JP5679229B2 JP5679229B2 (ja) | 2015-03-04 |
Family
ID=50149724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012184906A Active JP5679229B2 (ja) | 2012-08-24 | 2012-08-24 | 画像処理装置、画像処理方法、及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9619700B2 (ja) |
JP (1) | JP5679229B2 (ja) |
WO (1) | WO2014030406A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106372632A (zh) * | 2016-08-23 | 2017-02-01 | 山西同方知网数字出版技术有限公司 | 一种基于ocr的漏识文字自动检测的方法 |
JP2019192959A (ja) * | 2018-04-18 | 2019-10-31 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2599401A (en) | 1999-12-23 | 2001-07-03 | David Todjar Hengami | Multiple compartment package design |
TW201421423A (zh) * | 2012-11-26 | 2014-06-01 | Pixart Imaging Inc | 影像感測器及其運作方法 |
WO2017089865A1 (en) * | 2015-11-24 | 2017-06-01 | Czech Technical University In Prague, Department Of Cybernetics | Efficient unconstrained stroke detector |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08212292A (ja) * | 1995-02-03 | 1996-08-20 | Matsushita Electric Ind Co Ltd | 枠線認識装置 |
JP2000235618A (ja) * | 1999-02-16 | 2000-08-29 | Mitsubishi Electric Corp | 文字検出装置 |
JP2009043265A (ja) * | 2007-08-09 | 2009-02-26 | Fujitsu Ltd | 字幕領域抽出装置、字幕領域抽出方法および字幕領域抽出プログラム |
JP2011087144A (ja) * | 2009-10-16 | 2011-04-28 | Nippon Telegr & Teleph Corp <Ntt> | テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060045346A1 (en) * | 2004-08-26 | 2006-03-02 | Hui Zhou | Method and apparatus for locating and extracting captions in a digital image |
JP2007335920A (ja) * | 2006-06-12 | 2007-12-27 | Fuji Xerox Co Ltd | 画像処理装置および画像処理プログラム |
US8351707B2 (en) * | 2007-07-31 | 2013-01-08 | Sharp Kabushiki Kaisha | Image processing apparatus, image forming apparatus, image processing system, and image processing method |
JP5368141B2 (ja) | 2009-03-25 | 2013-12-18 | 凸版印刷株式会社 | データ生成装置およびデータ生成方法 |
KR101207127B1 (ko) * | 2010-03-19 | 2012-11-30 | 전남대학교산학협력단 | 문자 인식 전처리 방법 및 장치 |
JP5857704B2 (ja) * | 2011-12-13 | 2016-02-10 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
US8917910B2 (en) * | 2012-01-16 | 2014-12-23 | Xerox Corporation | Image segmentation based on approximation of segmentation similarity |
JP6061502B2 (ja) * | 2012-06-04 | 2017-01-18 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
-
2012
- 2012-08-24 JP JP2012184906A patent/JP5679229B2/ja active Active
-
2013
- 2013-05-30 US US14/423,437 patent/US9619700B2/en active Active
- 2013-05-30 WO PCT/JP2013/065115 patent/WO2014030406A1/ja active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08212292A (ja) * | 1995-02-03 | 1996-08-20 | Matsushita Electric Ind Co Ltd | 枠線認識装置 |
JP2000235618A (ja) * | 1999-02-16 | 2000-08-29 | Mitsubishi Electric Corp | 文字検出装置 |
JP2009043265A (ja) * | 2007-08-09 | 2009-02-26 | Fujitsu Ltd | 字幕領域抽出装置、字幕領域抽出方法および字幕領域抽出プログラム |
JP2011087144A (ja) * | 2009-10-16 | 2011-04-28 | Nippon Telegr & Teleph Corp <Ntt> | テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106372632A (zh) * | 2016-08-23 | 2017-02-01 | 山西同方知网数字出版技术有限公司 | 一种基于ocr的漏识文字自动检测的方法 |
JP2019192959A (ja) * | 2018-04-18 | 2019-10-31 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP7031465B2 (ja) | 2018-04-18 | 2022-03-08 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5679229B2 (ja) | 2015-03-04 |
WO2014030406A1 (ja) | 2014-02-27 |
US20150213312A1 (en) | 2015-07-30 |
US9619700B2 (en) | 2017-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10885644B2 (en) | Detecting specified image identifiers on objects | |
JP6000899B2 (ja) | テキストを自動的に検出する方法 | |
US8000529B2 (en) | System and method for creating an editable template from a document image | |
JP5679229B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
US7613363B2 (en) | Image superresolution through edge extraction and contrast enhancement | |
US9424479B2 (en) | Systems and methods for resizing an image | |
JP4646797B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
CN112612911A (zh) | 一种图像处理方法、系统、设备及介质、程序产品 | |
JP2012044634A (ja) | デジタルメディアの提供方法、物品及びプログラム | |
Chen et al. | Improved seam carving combining with 3D saliency for image retargeting | |
CN107679442A (zh) | 单证信息录入的方法、装置、计算机设备及存储介质 | |
JP2016162420A (ja) | 注目領域検出装置、注目領域検出方法及びプログラム | |
WO2008101422A1 (fr) | Procédé et système de recherche d'image | |
JPWO2013171857A1 (ja) | 画像処理装置、画像処理装置の制御方法、プログラム、及び情報記憶媒体 | |
US8824778B2 (en) | Systems and methods for depth map generation | |
JP3471578B2 (ja) | 行方向判定装置、画像傾き検出装置及び画像傾き補正装置 | |
TW200937342A (en) | Line drawing processor, program and line drawing processing method | |
Bloomberg et al. | Document image applications | |
CN106951897A (zh) | 一种医疗单据相片的倾斜程度判断方法 | |
US20170017370A1 (en) | Device and method for processing data | |
JP2008181015A (ja) | 画像表示装置、画像表示プログラム | |
AU2014277851A1 (en) | Detecting a gap between text columns from text line fragments | |
KR101458155B1 (ko) | 편집 문서 생성 장치 및 방법 | |
JP6438369B2 (ja) | 帳票画像判定プログラム、帳票画像判定方法および帳票画像判定システム | |
Liu et al. | Embedded media barcode links: optimally blended barcode overlay on paper for linking to associated media |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141114 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141114 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20141114 |
|
TRDD | Decision of grant or rejection written | ||
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20141205 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141216 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141224 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5679229 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |