JP2016029546A - 画像処理装置、画像処理方法、および画像処理プログラム - Google Patents
画像処理装置、画像処理方法、および画像処理プログラムInfo
- Publication number
- JP2016029546A JP2016029546A JP2014151883A JP2014151883A JP2016029546A JP 2016029546 A JP2016029546 A JP 2016029546A JP 2014151883 A JP2014151883 A JP 2014151883A JP 2014151883 A JP2014151883 A JP 2014151883A JP 2016029546 A JP2016029546 A JP 2016029546A
- Authority
- JP
- Japan
- Prior art keywords
- area
- swt
- region
- pixels
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/333—Preprocessing; Feature extraction
- G06V30/347—Sampling; Contour coding; Stroke extraction
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Abstract
【解決手段】一実施形態に係る画像処理装置は第1抽出部、第2抽出部、および特定部を備える。第1抽出部は、画像に対してストローク幅変換を実行することでSWT領域を該画像から抽出する。SWT領域は、エッジが連続しかつストローク幅が設定の範囲内である領域である。第2抽出部は、画像に対して画素値に基づくクラスタリングを実行することで単色領域を該画像から抽出する。単色領域は、画素値が設定の範囲内でありかつ連続して存在する複数の画素で構成される領域である。特定部は、単色領域の画素数に対する、SWT領域および単色領域の重複部分の画素数の割合が第1の基準値以上または該第1の基準値より大きい場合に、少なくとも該単色領域に基づいて、文字領域候補に含まれる画素群を特定する。
【選択図】図3
Description
・SWT領域の外接矩形の基準座標(Xe,Ye)
・外接矩形の幅We
・外接矩形の高さHe
・SWT領域に含まれる各画素peiの座標およびストローク幅(xei,yei,wi)
例えば、SWT領域が20個の画素pe1〜pe20で構成される場合には、コンポーネントデータは(xe1,ye1,w1),(xe2,ye2,w2),…,(xe20,ye20,w20)を含む。
(参考文献1)仙田修司,美濃導彦,池田克夫、“文字列の単色性に着目したカラー画像からの文字パタン抽出法”、電子情報通信学会技術研究報告.PRU,パターン認識・理解 94(242),17−24,1994年9月22日
・単色領域の外接矩形の基準座標(Xc,Yc)
・外接矩形の幅Wc
・外接矩形の高さHc
・単色領域に含まれる各画素pciの座標および色番号(xci,yci,ci)
例えば、単色領域が20個の画素pc1〜pc20で構成される場合には、コンポーネントデータは(xc1,yc1,c1),(xc2,yc2,c2),…,(xc20,yc20,c20)を含む。
Claims (11)
- 画像に対してストローク幅変換を実行することでSWT領域を該画像から抽出する第1抽出部であって、該SWT領域が、エッジが連続しかつストローク幅が設定の範囲内である領域である、該第1抽出部と、
前記画像に対して画素値に基づくクラスタリングを実行することで単色領域を該画像から抽出する第2抽出部であって、該単色領域が、画素値が設定の範囲内でありかつ連続して存在する複数の画素で構成される領域である、該第2抽出部と、
前記単色領域の画素数に対する、前記SWT領域および前記単色領域の重複部分の画素数の割合が第1の基準値以上または該第1の基準値より大きい場合に、少なくとも該単色領域に基づいて、文字領域候補に含まれる画素群を特定する特定部と
を備える画像処理装置。 - 前記特定部が、前記割合が第2の基準値未満である場合に、前記SWT領域および前記単色領域から文字領域候補を特定しない、
請求項1に記載の画像処理装置。 - 前記第1の基準値と前記第2の基準値とが等しく、
前記第2抽出部が複数の前記単色領域を抽出した場合に、前記特定部が、前記SWT領域との重複部分の画素数が最大の前記単色領域を選択し、選択された単色領域の画素数に対する、前記SWT領域および該選択された単色領域の重複部分の画素数の割合が前記第1の基準値以上である場合には、前記文字領域候補に含まれる画素群を該SWT領域および該選択された単色領域に基づいて特定し、該割合が該第1の基準値未満である場合には前記文字領域候補を特定しない、
請求項2に記載の画像処理装置。 - 前記第2抽出部が、前記第1抽出部により抽出されたSWT領域に基づいて前記画像の一部をクラスタリング対象領域として設定し、該クラスタリング対象領域から前記単色領域を抽出する、
請求項1〜3のいずれか一項に記載の画像処理装置。 - 前記特定部が、前記SWT領域の欠落部分を前記単色領域の画素で補完することで、前記文字領域候補に含まれる画素群を特定する、
請求項1〜4のいずれか一項に記載の画像処理装置。 - 前記特定部が、前記SWT領域および前記単色領域の論理和を前記文字領域候補に含まれる画素群として特定する、
請求項5に記載の画像処理装置。 - 前記特定部が、前記単色領域の画素のうち前記SWT領域のエッジの外側に位置する画素を用いることなく、該単色領域の他の画素を用いて前記欠落部分を補完する、
請求項5に記載の画像処理装置。 - 前記第1抽出部が第1のエッジ閾値を用いて前記ストローク幅変換を実行し、
前記特定部が、
前記単色領域のうち前記SWT領域と重複しない領域に対して、前記第1のエッジ閾値よりも低い第2のエッジ閾値を用いてストローク幅変換を実行することで追加のエッジを探索し、該追加のエッジを用いて該SWT領域を拡張し、
前記単色領域の画素のうち拡張後のSWT領域のエッジの外側に位置する画素を用いることなく、該単色領域の他の画素を用いて該拡張後のSWT領域の欠落部分を補完する、
請求項7に記載の画像処理装置。 - 前記第2抽出部が、カラー・クラスタリングを実行することで前記単色領域を抽出する、
請求項1〜8のいずれか一項に記載の画像処理装置。 - プロセッサを備えた画像処理装置により実行される画像処理方法であって、
画像に対してストローク幅変換を実行することでSWT領域を該画像から抽出する第1抽出ステップであって、該SWT領域が、エッジが連続しかつストローク幅が設定の範囲内である領域である、該第1抽出ステップと、
前記画像に対して画素値に基づくクラスタリングを実行することで単色領域を該画像から抽出する第2抽出ステップであって、該単色領域が、画素値が設定の範囲内でありかつ連続して存在する複数の画素で構成される領域である、該第2抽出ステップと、
前記単色領域の画素数に対する、前記SWT領域および前記単色領域の重複部分の画素数の割合が第1の基準値以上または該第1の基準値より大きい場合に、少なくとも該単色領域に基づいて、文字領域候補に含まれる画素群を特定する特定ステップと
を含む画像処理方法。 - 画像に対してストローク幅変換を実行することでSWT領域を該画像から抽出する第1抽出部であって、該SWT領域が、エッジが連続しかつストローク幅が設定の範囲内である領域である、該第1抽出部と、
前記画像に対して画素値に基づくクラスタリングを実行することで単色領域を該画像から抽出する第2抽出部であって、該単色領域が、画素値が設定の範囲内でありかつ連続して存在する複数の画素で構成される領域である、該第2抽出部と、
前記単色領域の画素数に対する、前記SWT領域および前記単色領域の重複部分の画素数の割合が第1の基準値以上または該第1の基準値より大きい場合に、少なくとも該単色領域に基づいて、文字領域候補に含まれる画素群を特定する特定部と
してコンピュータを機能させるための画像処理プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014151883A JP5695257B1 (ja) | 2014-07-25 | 2014-07-25 | 画像処理装置、画像処理方法、および画像処理プログラム |
US14/562,888 US9477885B2 (en) | 2014-07-25 | 2014-12-08 | Image processing apparatus, image processing method and image processing program |
ES15162549T ES2819221T3 (es) | 2014-07-25 | 2015-04-07 | Aparato de procesamiento de imágenes, método de procesamiento de imágenes y programa de procesamiento de imágenes |
EP15162549.8A EP2977932B1 (en) | 2014-07-25 | 2015-04-07 | Image processing apparatus, image processing method and image processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014151883A JP5695257B1 (ja) | 2014-07-25 | 2014-07-25 | 画像処理装置、画像処理方法、および画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5695257B1 JP5695257B1 (ja) | 2015-04-01 |
JP2016029546A true JP2016029546A (ja) | 2016-03-03 |
Family
ID=52830858
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014151883A Active JP5695257B1 (ja) | 2014-07-25 | 2014-07-25 | 画像処理装置、画像処理方法、および画像処理プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US9477885B2 (ja) |
EP (1) | EP2977932B1 (ja) |
JP (1) | JP5695257B1 (ja) |
ES (1) | ES2819221T3 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101763376B1 (ko) | 2016-03-11 | 2017-07-31 | 광주과학기술원 | 신뢰 기반 재귀적 깊이 영상 필터링 방법 |
JP2018156274A (ja) * | 2017-03-16 | 2018-10-04 | 株式会社リコー | 画像処理装置、画像処理方法およびプログラム |
WO2024043602A1 (ko) * | 2022-08-26 | 2024-02-29 | 삼성전자 주식회사 | 이미지로부터 텍스트를 획득하는 방법 및 서버 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016098589A1 (ja) * | 2014-12-15 | 2016-06-23 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム、および情報処理システム |
US10136148B2 (en) * | 2015-05-18 | 2018-11-20 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods, receiving device and sending device for managing a picture |
CN107688806B (zh) * | 2017-08-21 | 2021-04-20 | 西北工业大学 | 一种基于仿射变换的自由场景文本检测方法 |
CN108256493A (zh) * | 2018-01-26 | 2018-07-06 | 中国电子科技集团公司第三十八研究所 | 一种基于车载视频的交通场景文字识别系统及识别方法 |
US11042969B2 (en) * | 2019-05-23 | 2021-06-22 | Adobe Inc. | Automatic synthesis of a content-aware sampling region for a content-aware fill |
CN112270356B (zh) * | 2020-10-28 | 2023-10-13 | 杭州海康威视数字技术股份有限公司 | 一种图像识别方法、装置及电子设备 |
US12062246B2 (en) * | 2021-09-30 | 2024-08-13 | Konica Minolta Business Solutions U.S.A., Inc. | Extracting text from an image |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4275866B2 (ja) * | 2000-01-27 | 2009-06-10 | 富士通株式会社 | カラー画像から文字列パターンを抽出する装置および方法 |
FR2857481A1 (fr) * | 2003-07-08 | 2005-01-14 | Thomson Licensing Sa | Procede et dispositif de detection de visages dans une image couleur |
US8917935B2 (en) * | 2008-05-19 | 2014-12-23 | Microsoft Corporation | Detecting text using stroke width based text detection |
JP5027201B2 (ja) * | 2009-10-16 | 2012-09-19 | 日本電信電話株式会社 | テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム |
US9076056B2 (en) * | 2013-08-20 | 2015-07-07 | Adobe Systems Incorporated | Text detection in natural images |
-
2014
- 2014-07-25 JP JP2014151883A patent/JP5695257B1/ja active Active
- 2014-12-08 US US14/562,888 patent/US9477885B2/en active Active
-
2015
- 2015-04-07 EP EP15162549.8A patent/EP2977932B1/en active Active
- 2015-04-07 ES ES15162549T patent/ES2819221T3/es active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101763376B1 (ko) | 2016-03-11 | 2017-07-31 | 광주과학기술원 | 신뢰 기반 재귀적 깊이 영상 필터링 방법 |
JP2018156274A (ja) * | 2017-03-16 | 2018-10-04 | 株式会社リコー | 画像処理装置、画像処理方法およびプログラム |
WO2024043602A1 (ko) * | 2022-08-26 | 2024-02-29 | 삼성전자 주식회사 | 이미지로부터 텍스트를 획득하는 방법 및 서버 |
Also Published As
Publication number | Publication date |
---|---|
US20160026859A1 (en) | 2016-01-28 |
EP2977932A2 (en) | 2016-01-27 |
JP5695257B1 (ja) | 2015-04-01 |
ES2819221T3 (es) | 2021-04-15 |
EP2977932B1 (en) | 2020-08-19 |
EP2977932A3 (en) | 2016-02-24 |
US9477885B2 (en) | 2016-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5695257B1 (ja) | 画像処理装置、画像処理方法、および画像処理プログラム | |
CN106254933B (zh) | 字幕提取方法及装置 | |
CN109376681B (zh) | 一种多人姿态估计方法及系统 | |
US9530071B2 (en) | Hierarchical interlinked multi-scale convolutional network for image parsing | |
US8798373B2 (en) | Image restoration system, image restoration method, and image restoration program | |
US10007846B2 (en) | Image processing method | |
KR101932009B1 (ko) | 다중 객체 검출을 위한 영상 처리 장치 및 방법 | |
US8989437B2 (en) | Salient object detection by composition | |
JP6569500B2 (ja) | 画像処理装置及び画像処理方法 | |
JP6904182B2 (ja) | 画像視点変換装置及び方法 | |
US9153203B2 (en) | Temporally consistent superpixels | |
US20160259990A1 (en) | Region-of-interest detection apparatus, region-of-interest detection method, and recording medium | |
US11915465B2 (en) | Apparatus and methods for converting lineless tables into lined tables using generative adversarial networks | |
JP2011065643A (ja) | 文字認識方法及び文字認識装置 | |
JP5656768B2 (ja) | 画像特徴量抽出装置およびそのプログラム | |
US11410278B2 (en) | Automatic artifact removal in a digital image | |
US9064179B2 (en) | Region extraction apparatus, region extraction method, and computer program product | |
JP2014197342A (ja) | 物体位置検出装置、物体位置検出方法、及びプログラム | |
JP5027201B2 (ja) | テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム | |
JP2020017136A (ja) | 物体検出認識装置、方法、及びプログラム | |
KR20110087620A (ko) | 레이아웃 기반의 인쇄매체 페이지 인식방법 | |
JP2016053763A (ja) | 画像処理装置、画像処理方法及びプログラム | |
KR101592087B1 (ko) | 배경 영상의 위치를 이용한 관심맵 생성 방법 및 이를 기록한 기록 매체 | |
JP2016081472A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2016075993A (ja) | 画像処理装置及びその制御方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20150123 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150203 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5695257 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |