JP6430914B2 - 画像処理装置および画像処理方法 - Google Patents
画像処理装置および画像処理方法 Download PDFInfo
- Publication number
- JP6430914B2 JP6430914B2 JP2015193735A JP2015193735A JP6430914B2 JP 6430914 B2 JP6430914 B2 JP 6430914B2 JP 2015193735 A JP2015193735 A JP 2015193735A JP 2015193735 A JP2015193735 A JP 2015193735A JP 6430914 B2 JP6430914 B2 JP 6430914B2
- Authority
- JP
- Japan
- Prior art keywords
- region
- image processing
- image
- area
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
- G06V20/42—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items of sport video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/245—Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Studio Devices (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
- Geometry (AREA)
Description
[第1の実施形態]
図示の画像処理装置100は、パーソナルコンピュータ(PC)などの装置である。携帯電話や、PDA、スマートフォンやタブレット端末などの装置でもよい。
<画像処理装置100の処理フロー>
<検出領域について>
<傾き補正について>
<奥行き補正について>
[第2の実施形態]
<画像処理装置110の処理フロー>
<隠れている文字の推測について>
[第3の実施形態]
<画像処理装置900の処理フロー>
101:画像読み込み部
102:被写体検出部
103:ゼッケン領域推定部
104:ゼッケン文字領域検出部
105:画像処理部
106:文字認識部
107:フレーム領域検出部
108:文字数推測部
901:動画再生部
Claims (9)
- 入力画像から特定の被写体を1つまたは複数検出する被写体検出部と、
前記被写体検出部が検出した前記被写体の位置から前記被写体を特定するための識別情報が存在する第一の領域を推定する第一領域推定部と、
前記第一領域推定部が推定した前記第一の領域内において前記識別情報を含む第二の領域を検出する第二領域検出部と、
前記第二領域検出部が検出した前記第二の領域に対して画像処理を行う画像処理部と、
前記画像処理部の処理結果に対して前記識別情報の認識処理を行い、当該認識処理結果と前記入力画像との紐付けを行う識別情報認識部と、を備え、
前記画像処理部は、前記被写体検出部が検出した前記被写体の向きに基づいて、前記第二の領域内に配置されていると推定した前記識別情報に対して所定の画像処理の実行を制御することを特徴とする画像処理装置。 - 入力画像から特定の被写体を1つまたは複数検出する被写体検出部と、
前記被写体検出部が検出した前記被写体の位置から前記被写体を特定するための識別情報が存在する第一の領域を推定する第一領域推定部と、
前記第一の領域内において前記識別情報のサイズまたは領域を示す情報から第三の領域を検出する第三領域検出部と、
前記第三領域検出部が検出した前記第三の領域から前記識別情報内の情報数を推測する情報数推測部と、
前記第三領域検出部が検出した前記第三の領域に対して画像処理を行う画像処理部と、
前記画像処理部の処理結果に対して前記識別情報の認識処理を行い、当該認識処理結果と前記入力画像との紐付けを行う識別情報認識部と、を備え、
前記情報数に応じた情報領域を算出し、前記情報領域のうち他の領域と幅または高さが異なる領域が存在するか否かに基づき、当該領域に対応する仮の情報を割り当てる処理の実行を制御することを特徴とする画像処理装置。 - 入力画像から特定の被写体を1つまたは複数検出する被写体検出ステップと、
前記被写体検出ステップにおいて検出した前記被写体の位置から前記被写体を特定するための識別情報が存在する第一の領域を推定する第一領域推定ステップと、
前記第一領域推定ステップにおいて推定した前記第一の領域内において前記識別情報を含む第二の領域を検出する第二領域検出ステップと、
前記第二領域検出ステップにおいて検出した前記第二の領域に対して画像処理を行う画像処理ステップであって、前記被写体検出ステップにおいて検出した前記被写体の向きに基づいて、前記第二の領域内に配置されていると推定した前記識別情報に対して所定の画像処理の実行を制御する画像処理ステップと、
前記画像処理ステップの処理結果に対して前記識別情報の認識処理を行い、当該認識処理結果と前記入力画像との紐付けを行う識別情報認識ステップと、
を備えることを特徴とする画像処理方法。 - 前記第一の領域内において前記識別情報のサイズまたは領域を示す情報から第三の領域を検出する第三領域検出ステップと、
前記第三領域検出ステップにおいて検出した前記第三の領域から前記識別情報内の情報数を推測する情報数推測ステップをさらに備え、
前記画像処理ステップは、前記第二領域検出ステップにおいて検出した前記第二の領域または前記情報数推測ステップにおいて検出した前記情報数に応じた前記第三の領域内の各領域に対して画像処理を行うことを特徴とする請求項3に記載の画像処理方法。 - 前記情報数推測ステップは、前記第三の領域の幅または高さから前記情報数を推測し、前記第三の領域内の各領域のうち他の領域と幅または高さが異なる領域が存在する場合に、当該領域に対して、仮の情報を割り当てることを特徴とする請求項4に記載の画像処理方法。
- 前記被写体検出ステップは、前記被写体の顔位置、前記被写体の頭部から肩にかけた形状、前記被写体の肌領域の少なくとも1つを検出することで被写体を検出することを特徴とする請求項3乃至請求項5の何れか1項に記載の画像処理方法。
- 前記画像処理ステップは、前記第二の領域の画像を前記入力画像の基準線に対する傾き角度から所定方向に写像し、文字の間隔を調整する画像処理を行うことを特徴とする請求項3乃至請求項6の何れか1項に記載の画像処理方法。
- 入力画像から特定の被写体を1つまたは複数検出する被写体検出ステップと、
前記被写体検出ステップにおいて検出した前記被写体の位置から前記被写体を特定するための識別情報が存在する第一の領域を推定する第一領域推定ステップと、
前記第一の領域内において前記識別情報のサイズまたは領域を示す情報から第三の領域を検出する第三領域検出ステップと、
前記第三領域検出ステップにおいて検出した前記第三の領域から前記識別情報内の情報数を推測する情報数推測ステップであって、前記情報数に応じた情報領域を算出し、前記情報領域のうち他の領域と幅または高さが異なる領域が存在するか否かに基づき、当該領域に対する仮の情報を割り当てる処理の実行を制御する情報数推測ステップと、
前記第三領域検出ステップにおいて検出した前記第三の領域に対して画像処理を行う画像処理ステップと、
前記画像処理ステップの処理結果に対して前記識別情報の認識処理を行い、当該認識処理結果と前記入力画像との紐付けを行う識別情報認識ステップと、
を備えることを特徴とする画像処理方法。 - 前記情報数推測ステップは、前記第三の領域の幅または高さから前記情報数を推測することを特徴とする請求項8に記載の画像処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/084585 WO2016104156A1 (ja) | 2014-12-22 | 2015-12-03 | 画像処理方法 |
US15/287,066 US10007846B2 (en) | 2014-12-22 | 2016-10-06 | Image processing method |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014259258 | 2014-12-22 | ||
JP2014259258 | 2014-12-22 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016119059A JP2016119059A (ja) | 2016-06-30 |
JP2016119059A5 JP2016119059A5 (ja) | 2018-11-15 |
JP6430914B2 true JP6430914B2 (ja) | 2018-11-28 |
Family
ID=56243121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015193735A Active JP6430914B2 (ja) | 2014-12-22 | 2015-09-30 | 画像処理装置および画像処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10007846B2 (ja) |
JP (1) | JP6430914B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6251336B1 (ja) * | 2016-08-01 | 2017-12-20 | 株式会社アールビーズ | ゼッケンの組およびゼッケン画像管理システム |
TWI607387B (zh) * | 2016-11-25 | 2017-12-01 | 財團法人工業技術研究院 | 字符辨識系統及其字符辨識方法 |
JP2020119284A (ja) * | 2019-01-24 | 2020-08-06 | 日本電気株式会社 | 情報処理装置、情報処理方法及びプログラム |
EP3912132A4 (en) | 2019-02-28 | 2022-12-07 | Stats Llc | SYSTEM AND METHOD FOR GENERATION OF PLAYER TRACKING DATA FROM BROADCAST VIDEO |
CN111814514A (zh) * | 2019-04-11 | 2020-10-23 | 富士通株式会社 | 号码识别装置、方法以及电子设备 |
TWI702547B (zh) * | 2019-07-03 | 2020-08-21 | 利凌企業股份有限公司 | 車牌辨識方法及其系統 |
US11176362B1 (en) | 2020-06-24 | 2021-11-16 | Bank Of America Corporation | System for character recognition in a digital image processing environment |
CN112036319B (zh) * | 2020-08-31 | 2023-04-18 | 北京字节跳动网络技术有限公司 | 一种图片处理方法、装置、设备及存储介质 |
JP2024036017A (ja) * | 2022-09-05 | 2024-03-15 | ダイキン工業株式会社 | 情報端末、文字認識方法及び文字認識プログラム |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03250280A (ja) * | 1990-02-28 | 1991-11-08 | Hitachi Ltd | 文字認識方法及び装置並びに情報処理装置 |
TW197509B (ja) | 1990-01-31 | 1993-01-01 | Hitachi Seisakusyo Kk | |
JP4659569B2 (ja) * | 2005-09-13 | 2011-03-30 | キヤノン株式会社 | 撮像装置 |
WO2010075430A1 (en) * | 2008-12-24 | 2010-07-01 | Strands, Inc. | Sporting event image capture, processing and publication |
JP2011078009A (ja) * | 2009-10-01 | 2011-04-14 | Olympus Corp | 撮像装置および撮像装置用プログラム |
JP5598751B2 (ja) * | 2010-03-05 | 2014-10-01 | 日本電気株式会社 | 動作認識装置 |
US8774558B2 (en) * | 2010-11-29 | 2014-07-08 | Microsoft Corporation | Rectification of characters and text as transform invariant low-rank textures |
JP5762730B2 (ja) * | 2010-12-09 | 2015-08-12 | パナソニック株式会社 | 人検出装置および人検出方法 |
JP5647919B2 (ja) * | 2011-03-07 | 2015-01-07 | 株式会社Nttドコモ | 文字認識装置、文字認識方法、文字認識システム、および文字認識プログラム |
US9092674B2 (en) * | 2011-06-23 | 2015-07-28 | International Business Machines Corportion | Method for enhanced location based and context sensitive augmented reality translation |
JP5845764B2 (ja) | 2011-09-21 | 2016-01-20 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
CN104346370B (zh) * | 2013-07-31 | 2018-10-23 | 阿里巴巴集团控股有限公司 | 图像搜索、获取图像文本信息的方法及装置 |
US10354145B2 (en) * | 2014-09-11 | 2019-07-16 | Carnegie Mellon University | Associating a user identity with a mobile device identity |
-
2015
- 2015-09-30 JP JP2015193735A patent/JP6430914B2/ja active Active
-
2016
- 2016-10-06 US US15/287,066 patent/US10007846B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US10007846B2 (en) | 2018-06-26 |
US20170024626A1 (en) | 2017-01-26 |
JP2016119059A (ja) | 2016-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6430914B2 (ja) | 画像処理装置および画像処理方法 | |
CN106254933B (zh) | 字幕提取方法及装置 | |
JP5106271B2 (ja) | 画像処理装置、画像処理方法、及びコンピュータプログラム | |
JP4597391B2 (ja) | 顔領域検出装置およびその方法並びにコンピュータ読み取り可能な記録媒体 | |
US9536132B2 (en) | Facilitating image capture and image review by visually impaired users | |
JP5695257B1 (ja) | 画像処理装置、画像処理方法、および画像処理プログラム | |
JP2009211177A (ja) | 特徴点位置決定方法及び装置 | |
CN109886223B (zh) | 人脸识别方法、底库录入方法、装置及电子设备 | |
JP2011076255A (ja) | ジェスチャ認識装置、ジェスチャ認識方法、およびジェスチャ認識プログラム | |
KR20130064039A (ko) | 실루엣 보정 방법 및 시스템과 실루엣 묘출 방법 및 시스템 | |
JP6061502B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2016194858A (ja) | 画像処理装置、画像処理方法および画像処理システム | |
KR20190080388A (ko) | Cnn을 이용한 영상 수평 보정 방법 및 레지듀얼 네트워크 구조 | |
US20230410361A1 (en) | Image processing system, processing method, and non-transitory storage medium | |
CN111182207B (zh) | 图像拍摄方法、装置、存储介质及电子设备 | |
WO2016104156A1 (ja) | 画像処理方法 | |
JP5861530B2 (ja) | 利用者検知装置、方法、及びプログラム | |
CN113490009B (zh) | 内容信息植入方法、装置、服务器和存储介质 | |
JP4522323B2 (ja) | 画像処理装置及びその制御方法 | |
Wu et al. | FlagDetSeg: Multi-nation flag detection and segmentation in the wild | |
JP2015060421A (ja) | 類似画像検索方法及び類似画像検索装置 | |
JP6256738B2 (ja) | 動画選択装置、動画選択方法とプログラム | |
JP2000132692A (ja) | 曲線の特徴点抽出方法及びこの方法を記録した記録媒体 | |
JP2017033390A (ja) | 画像解析装置及びプログラム | |
JP2021026723A (ja) | 画像処理装置、画像処理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180928 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180928 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20180928 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20181003 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181018 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181026 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181101 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6430914 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |