JP2009087251A - パターン認識方法、パターン認識装置及びプログラム - Google Patents
パターン認識方法、パターン認識装置及びプログラム Download PDFInfo
- Publication number
- JP2009087251A JP2009087251A JP2007259059A JP2007259059A JP2009087251A JP 2009087251 A JP2009087251 A JP 2009087251A JP 2007259059 A JP2007259059 A JP 2007259059A JP 2007259059 A JP2007259059 A JP 2007259059A JP 2009087251 A JP2009087251 A JP 2009087251A
- Authority
- JP
- Japan
- Prior art keywords
- accuracy
- pattern
- classification
- input information
- pattern recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003909 pattern recognition Methods 0.000 title claims abstract description 50
- 238000012567 pattern recognition method Methods 0.000 title claims description 31
- 238000001514 detection method Methods 0.000 claims abstract description 98
- 238000000034 method Methods 0.000 claims description 106
- 230000008569 process Effects 0.000 claims description 86
- 238000000605 extraction Methods 0.000 claims description 53
- 230000009466 transformation Effects 0.000 description 46
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 38
- 238000010586 diagram Methods 0.000 description 23
- 238000004364 calculation method Methods 0.000 description 20
- 230000009467 reduction Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000012886 linear function Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/162—Detection; Localisation; Normalisation using pixel segmentation or colour matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/763—Non-hierarchical techniques, e.g. based on statistics of modelling distributions
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】入力情報である画像データ401の各画像領域において認識を行うパターンを含んでいる確度を第1の識別器402で求め、第1の識別器402で求めた確度の中で相対的に上位の確度を有する領域を2値化処理部407で1つ以上選択し、2値化処理部407で選択された領域に対して、前記パターンの検出処理を第2の識別器409及び閾値判定処理部411で行うようにする。
【選択図】図4
Description
図1は、本発明の第1の実施形態に係るパターン認識装置のハードウェア構成の一例を示すブロック図である。ここで、第1の実施形態に係るパターン認識装置100は、例えば、情報処理装置で構成されている。また、本実施形態では、複数の領域を有する入力情報として画像データを適用し、認識する画像データのパターンとして顔を適用した例を示す。
また、切り出しアフィン変換処理部901の処理では、0度、30度、60度、90度、120度、150度、180度、210度、240度、270度、300度及び330度の回転に対応させるようにする。このようにすることで、より精度の高い顔検出処理を実現できる。
第2の実施形態では、本発明に係るパターン認識装置として、トーン信号検出装置を適用した形態であり、添付の図面を参照して以下に説明する。また、本実施形態では、入力情報として後述のPCM信号を適用し、認識するパターンとしてトーン信号を適用した例を示す。
図11に示すように、第2の実施形態のパターン認識装置1100は、CPU1101、プログラムメモリ1102、RAM1103、電話端子1104、A/D変換器1105、表示装置1106、及び、制御バス・データバス1110を有して構成されている。
表示画面1201は、表示装置1106の画面全体を表している。ボタン1202は、通話相手の電話機のボタンを模式的に表したものである。この図12に示すボタン1202には、"0"から"9"までの数字のボタンと、"A"から"D"までのローマ字のボタンと、"*"のボタンと、"#"のボタンとが並べられて設けられている。なお、通常の電話機においては、"A"から"D"のボタンは、装備されていない。円1203は、通話相手がボタンを押したときに現れるものであり、押されたボタンを表す文字の周りに円として表示される。ここで、図12に示す例では、通話相手が、"1"の数字のボタンを押したことを表している。また、例えば、"#"のボタンが押された場合には、"#"の周りに円1203が表示され、"1"の数字の周りには表示されない。逆に、ボタンを押していない状態の時には、円1203は表示されない。
101 CPU
102 プログラムメモリ
103 RAM
104 ハードディスク(画像データベース)
105 フラッシュメモリ
110 制御バス・データバス
201 画像読み込み部
202 顔検出部
203 画像書き込み部
401 画像データ
402 第1の識別器
403 第1の確度情報
404 振り分け処理部
405 第1の確度情報の集計結果情報
406 閾値決定処理部
407 2値化処理部
408 第1の検出結果情報
409 第2の識別器
410 第2の確度情報
411 顔検出結果情報
Claims (19)
- 複数の領域を有する入力情報のパターンを認識するパターン認識方法であって、
前記入力情報の各領域において前記パターンを含んでいる確度を求める確度抽出ステップと、
前記確度抽出ステップにより求めた確度の中で相対的に上位の確度を有する領域を1つ以上選択する上位選択ステップと、
前記上位選択ステップにより選択された領域に対して、前記パターンの検出処理を行う検出ステップと
を含むことを特徴とするパターン認識方法。 - 入力情報のパターンを認識するパターン認識方法であって、
前記入力情報が、第1の分類のパターンから第n(nは2以上の自然数)の分類のパターンまでのそれぞれの分類のパターンを含んでいる確度を求める確度抽出ステップと、
前記確度抽出ステップにより求めた確度の中で相対的に上位の確度を有する分類を1つ以上選択する上位選択ステップと、
前記上位選択ステップにより選択された分類に基づいて、前記入力情報のパターンの検出処理を行う検出ステップと
を含むことを特徴とするパターン認識方法。 - 複数の領域を有する入力情報のパターンを識別するパターン認識方法であって、
前記入力情報の各領域が、第1の分類のパターンから第n(nは2以上の自然数)の分類のパターンまでのそれぞれの分類のパターンを含んでいる確度を求める確度抽出ステップと、
前記確度抽出ステップにより求めた確度の中で相対的に上位の確度を有する領域と分類との組を1つ以上選択する上位選択ステップと、
前記上位選択ステップにより選択された、領域と分類との組の組み合わせに応じて、前記入力情報のパターンの検出処理を行う検出ステップと
を含むことを特徴とするパターン認識方法。 - 前記確度抽出ステップでは、前記入力情報をn通りの方法で変換することによって、前記確度を求めることを特徴とする請求項2又は3に記載のパターン認識方法。
- 前記入力情報は、画像データであり、
前記確度抽出ステップでは、前記第1の分類のパターンを第1の画像パターンとし、前記第nの分類のパターンを第nの画像パターンとして、前記確度を求めることを特徴とする請求項2乃至4のいずれか1項に記載のパターン認識方法。 - 前記確度抽出ステップでは、前記第1の画像パターンを第1の傾きの画像パターンとし、前記第nの画像パターンを第nの傾きの画像パターンとして、前記確度を求めることを特徴とする請求項5に記載のパターン認識方法。
- 前記確度抽出ステップにより求めた確度に係る確度分布を生成する確度分布生成ステップと、
前記確度分布に基づいて閾値を決定する閾値決定ステップと
を更に含み、
前記上位選択ステップでは、前記閾値以上の確度を有する領域または分類を選択することを特徴とする請求項1乃至6のいずれか1項に記載のパターン認識方法。 - 前記上位選択ステップでは、前記確度抽出ステップにより求めた確度のうちの有効な確度を用いて前記相対的に上位の確度に基づく選択を行うことを特徴とする請求項1乃至7のいずれか1項に記載のパターン認識方法。
- 複数の領域を有する入力情報のパターンを認識するパターン認識装置であって、
前記入力情報の各領域において前記パターンを含んでいる確度を求める確度抽出手段と、
前記確度抽出手段により求めた確度の中で相対的に上位の確度を有する領域を1つ以上選択する上位選択手段と、
前記上位選択手段により選択された領域に対して、前記パターンの検出処理を行う検出手段と
を含むことを特徴とするパターン認識装置。 - 入力情報のパターンを認識するパターン認識装置であって、
前記入力情報が、第1の分類のパターンから第n(nは2以上の自然数)の分類のパターンまでのそれぞれの分類のパターンを含んでいる確度を求める確度抽出手段と、
前記確度抽出手段により求めた確度の中で相対的に上位の確度を有する分類を1つ以上選択する上位選択手段と、
前記上位選択手段により選択された分類に基づいて、前記入力情報のパターンの検出処理を行う検出手段と
を含むことを特徴とするパターン認識装置。 - 複数の領域を有する入力情報のパターンを識別するパターン認識装置であって、
前記入力情報の各領域が、第1の分類のパターンから第n(nは2以上の自然数)の分類のパターンまでのそれぞれの分類のパターンを含んでいる確度を求める確度抽出手段と、
前記確度抽出手段により求めた確度の中で相対的に上位の確度を有する領域と分類との組を1つ以上選択する上位選択手段と、
前記上位選択手段により選択された、領域と分類との組の組み合わせに応じて、前記入力情報のパターンの検出処理を行う検出手段と
を含むことを特徴とするパターン認識装置。 - 前記確度抽出手段は、前記入力情報をn通りの方法で変換することによって、前記確度を求めることを特徴とする請求項10又は11に記載のパターン認識装置。
- 前記入力情報は、画像データであり、
前記確度抽出手段は、前記第1の分類のパターンを第1の画像パターンとし、前記第nの分類のパターンを第nの画像パターンとして、前記確度を求めることを特徴とする請求項10乃至12のいずれか1項に記載のパターン認識装置。 - 前記確度抽出手段は、前記第1の画像パターンを第1の傾きの画像パターンとし、前記第nの画像パターンを第nの傾きの画像パターンとして、前記確度を求めることを特徴とする請求項13に記載のパターン認識装置。
- 前記確度抽出手段により求めた確度に係る確度分布を生成する確度分布生成手段と、
前記確度分布に基づいて閾値を決定する閾値決定手段と
を更に含み、
前記上位選択手段は、前記閾値以上の確度を有する領域または分類を選択することを特徴とする請求項9乃至14のいずれか1項に記載のパターン認識装置。 - 前記上位選択手段は、前記確度抽出手段により求めた確度のうちの有効な確度を用いて前記相対的に上位の確度に基づく選択を行うことを特徴とする請求項9乃至15のいずれか1項に記載のパターン認識装置。
- 複数の領域を有する入力情報のパターンを認識するパターン認識方法をコンピュータに実行させるためのプログラムであって、
前記入力情報の各領域において前記パターンを含んでいる確度を求める確度抽出ステップと、
前記確度抽出ステップにより求めた確度の中で相対的に上位の確度を有する領域を1つ以上選択する上位選択ステップと、
前記上位選択ステップにより選択された領域に対して、前記パターンの検出処理を行う検出ステップと
をコンピュータに実行させるためのプログラム。 - 入力情報のパターンを認識するパターン認識方法をコンピュータに実行させるためのプログラムであって、
前記入力情報が、第1の分類のパターンから第n(nは2以上の自然数)の分類のパターンまでのそれぞれの分類のパターンを含んでいる確度を求める確度抽出ステップと、
前記確度抽出ステップにより求めた確度の中で相対的に上位の確度を有する分類を1つ以上選択する上位選択ステップと、
前記上位選択ステップにより選択された分類に基づいて、前記入力情報のパターンの検出処理を行う検出ステップと
をコンピュータに実行させるためのプログラム。 - 複数の領域を有する入力情報のパターンを識別するパターン認識方法をコンピュータに実行させるためのプログラムであって、
前記入力情報の各領域が、第1の分類のパターンから第n(nは2以上の自然数)の分類のパターンまでのそれぞれの分類のパターンを含んでいる確度を求める確度抽出ステップと、
前記確度抽出ステップにより求めた確度の中で相対的に上位の確度を有する領域と分類との組を1つ以上選択する上位選択ステップと、
前記上位選択ステップにより選択された、領域と分類との組の組み合わせに応じて、前記入力情報のパターンの検出処理を行う検出ステップと
をコンピュータに実行させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007259059A JP4995024B2 (ja) | 2007-10-02 | 2007-10-02 | パターン認識方法、パターン認識装置及びプログラム |
US12/242,470 US8625858B2 (en) | 2007-10-02 | 2008-09-30 | Method, apparatus, and computer-readable storage medium for pattern recognition |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007259059A JP4995024B2 (ja) | 2007-10-02 | 2007-10-02 | パターン認識方法、パターン認識装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009087251A true JP2009087251A (ja) | 2009-04-23 |
JP4995024B2 JP4995024B2 (ja) | 2012-08-08 |
Family
ID=40508427
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007259059A Expired - Fee Related JP4995024B2 (ja) | 2007-10-02 | 2007-10-02 | パターン認識方法、パターン認識装置及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8625858B2 (ja) |
JP (1) | JP4995024B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8351699B2 (en) * | 2008-12-18 | 2013-01-08 | Accusoft Corporation | Methods and apparatus for auto image binarization |
RU2427911C1 (ru) * | 2010-02-05 | 2011-08-27 | Фирма "С1 Ко., Лтд." | Способ обнаружения лиц на изображении с применением каскада классификаторов |
US9053562B1 (en) | 2010-06-24 | 2015-06-09 | Gregory S. Rabin | Two dimensional to three dimensional moving image converter |
CN102929884B (zh) | 2011-08-10 | 2016-05-04 | 阿里巴巴集团控股有限公司 | 一种收缩虚拟磁盘镜像文件的方法及装置 |
JP5814700B2 (ja) * | 2011-08-25 | 2015-11-17 | キヤノン株式会社 | 画像処理システム及び画像処理方法 |
US9992021B1 (en) | 2013-03-14 | 2018-06-05 | GoTenna, Inc. | System and method for private and point-to-point communication between computing devices |
US10657424B2 (en) | 2016-12-07 | 2020-05-19 | Samsung Electronics Co., Ltd. | Target detection method and apparatus |
US11514530B2 (en) * | 2020-05-14 | 2022-11-29 | Ccc Information Services Inc. | Image processing system using convolutional neural networks |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1173510A (ja) * | 1997-08-29 | 1999-03-16 | Matsushita Electric Works Ltd | 位置検出装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6940545B1 (en) * | 2000-02-28 | 2005-09-06 | Eastman Kodak Company | Face detecting camera and method |
US20060020597A1 (en) * | 2003-11-26 | 2006-01-26 | Yesvideo, Inc. | Use of image similarity in summarizing a collection of visual images |
JP4482796B2 (ja) * | 2004-03-26 | 2010-06-16 | ソニー株式会社 | 情報処理装置および方法、記録媒体、並びにプログラム |
JP4619927B2 (ja) * | 2005-11-01 | 2011-01-26 | 富士フイルム株式会社 | 顔検出方法および装置並びにプログラム |
US20070288419A1 (en) * | 2006-06-07 | 2007-12-13 | Motorola, Inc. | Method and apparatus for augmenting data and actions with semantic information to facilitate the autonomic operations of components and systems |
-
2007
- 2007-10-02 JP JP2007259059A patent/JP4995024B2/ja not_active Expired - Fee Related
-
2008
- 2008-09-30 US US12/242,470 patent/US8625858B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1173510A (ja) * | 1997-08-29 | 1999-03-16 | Matsushita Electric Works Ltd | 位置検出装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4995024B2 (ja) | 2012-08-08 |
US8625858B2 (en) | 2014-01-07 |
US20090087040A1 (en) | 2009-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4995024B2 (ja) | パターン認識方法、パターン認識装置及びプログラム | |
JP5668932B2 (ja) | 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 | |
JP5335536B2 (ja) | 情報処理装置及び情報処理方法 | |
KR101015663B1 (ko) | 문자인식장치에서의 문자인식방법 및 그 장치 | |
JP5235691B2 (ja) | 情報処理装置及び情報処理方法 | |
KR100708130B1 (ko) | 동영상 추출장치 및 방법 | |
JPWO2005086091A1 (ja) | 指紋掌紋画像処理システムおよび指紋掌紋画像処理方法 | |
JP2007065844A (ja) | 顔検出方法および装置並びにプログラム | |
US9911204B2 (en) | Image processing method, image processing apparatus, and recording medium | |
WO2014074959A1 (en) | Real-time face detection using pixel pairs | |
CN111768760B (zh) | 一种多模态语音端点检测方法及装置 | |
KR20170087817A (ko) | 얼굴 검출 방법 및 장치 | |
JP4498203B2 (ja) | メータ認識システム、メータ認識方法、およびメータ認識プログラム | |
KR20130120175A (ko) | 캐리커처 자동 생성 장치, 방법 및 컴퓨터 판독 가능한 기록 매체 | |
JP2008102611A (ja) | 画像処理装置 | |
CN104023160A (zh) | 上置型扫描仪装置和图像获取方法 | |
US11348254B2 (en) | Visual search method, computer device, and storage medium | |
JP2010271792A (ja) | 画像処理装置及び画像処理方法 | |
JP2007193404A (ja) | 顔検出方法および装置並びにプログラム | |
CN115004245A (zh) | 目标检测方法、装置、电子设备和计算机存储介质 | |
JP2858530B2 (ja) | エッジ強調装置 | |
CN111797921A (zh) | 一种图像数据对比方法及装置 | |
JP2859681B2 (ja) | 指紋データの2値化方法 | |
US11921816B2 (en) | Information processing apparatus that specifies a subject and method, image capturing apparatus, and image capturing system | |
US20150049945A1 (en) | Image processing apparatus and image processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101004 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120410 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120509 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150518 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4995024 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150518 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |