JP2005202932A - データを複数のクラスに分類する方法 - Google Patents
データを複数のクラスに分類する方法 Download PDFInfo
- Publication number
- JP2005202932A JP2005202932A JP2004335075A JP2004335075A JP2005202932A JP 2005202932 A JP2005202932 A JP 2005202932A JP 2004335075 A JP2004335075 A JP 2004335075A JP 2004335075 A JP2004335075 A JP 2004335075A JP 2005202932 A JP2005202932 A JP 2005202932A
- Authority
- JP
- Japan
- Prior art keywords
- likelihood
- data
- space
- distribution
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000009826 distribution Methods 0.000 claims abstract description 119
- 239000013598 vector Substances 0.000 claims description 49
- 238000012549 training Methods 0.000 claims description 10
- 230000000007 visual effect Effects 0.000 claims description 10
- 230000002441 reversible effect Effects 0.000 claims description 5
- 238000005259 measurement Methods 0.000 claims description 4
- 239000000203 mixture Substances 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000007477 logistic regression Methods 0.000 claims description 2
- 230000005236 sound signal Effects 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 description 7
- 238000013507 mapping Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000002427 irreversible effect Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24317—Piecewise classification, i.e. whereby each classification requires several discriminant rules
Abstract
【解決手段】方法は、データを複数のクラス105に分類し、各クラス105のデータがクラス条件確率分布を有するようにする。測定データのクラス条件確率分布は尤度空間103に投影される。尤度空間103に投影されたクラス条件確率分布は次に、尤度空間103の判別分類器104に従って分類される。
【選択図】図1
Description
本発明は、例えば、聴覚または視覚信号を表すデータをN個のクラスに分類する。ここで、PX(X|C1),PX(X|C2),...PX(X|CN)は、各クラスの実際のデータ分布を表す。この表記において、下付き文字のXは、ランダムベクトルを表し、括弧内のXは、ランダムベクトルの特定のインスタンスを表し、Pは、値XがクラスCiに属すると仮定してランダムベクトルXが値Xをとる確率を表す。
尤度ベクトル表現は、尤度空間における分類に関連する以下の特性を有する。
特性2の結果として、尤度空間における最適な分類器の性能は、データ空間における投影分布に基づく最適なベイズ分類器を用いて得られる分類精度を下限とする。したがって、投影分布から推定される最適なベイズ分類器よりも性能が良い尤度空間の分類器を推定することを実際に可能とすることができる。
尤度空間において分類誤りが減るのは、データ空間におけるクラス分布のモデル化誤差を補償した結果である。分類の状況では、分布のモデル化誤差は、2つの原因で起こる可能性がある。
尤度投影は、任意の尤度ベクトルに投影されるデータベクトルが1つだけであることが保証されている場合に可逆である。しかし、図4に示すように、尤度投影は、通常可逆でなく、データベクトルの尤度投影は、データベクトルを一意に識別することを保証できない。
視覚テクスチャイメージの分類、取り出し、および合成に関する多くの研究が報告されているが、視覚テクスチャの正確な定義はない。ほとんどの研究者は、視覚テクスチャイメージがある程度の均質性を特徴とし、通常は、ランダムな変化をしばしば有する反復構造を含むことに同意する。したがって、水面、布、曇り空、さらには壁紙のイメージが全てテクスチャとみなされる。
本発明の方法を、TIMIT音声データベース(Zue著「Speech database development at MIT: TIMIT and beyond」(Speech Communication, 9, 351-356, 1990))にも適用した。TIMITは、音声研究者が信号処理および分類アルゴリズムの開発に用いる標準的なデータベースである。
Claims (16)
- データを複数のクラスに分類する方法であって、各クラスのデータは、クラス条件確率分布を有し、
測定データの前記クラス条件確率分布を尤度空間に投影することと、
該尤度空間に投影された前記クラス条件確率分布を前記尤度空間の判別分類器に従って分類することと
を含むデータを複数のクラスに分類する方法。 - 前記投影することは、非線形である請求項1に記載の方法。
- 前記データは、離散している請求項1に記載の方法。
- 前記データは、連続している請求項1に記載の方法。
- 投影された前記クラス条件確率分布を推定することをさらに含む請求項1に記載の方法。
- 推定された前記クラス条件確率分布を得るために尤度最大化プロセスを訓練データに適用することをさらに含む請求項5に記載の方法。
- 前記データは、音声信号を表す請求項1に記載の方法。
- 前記データは、視覚信号を表す請求項1に記載の方法。
- 前記判別分類器は、傾きが1の一次判別式である請求項1に記載の方法。
- 前記分類器は、二次判別式である請求項1に記載の方法。
- 前記分類器は、ロジスティック回帰である請求項1に記載の方法。
- 前記尤度空間における前記分類器は、分布に基づく分類器である請求項1に記載の方法。
- 前記投影分布は、ガウス関数である請求項1に記載の方法。
- 前記投影分布は、ガウス関数の混合である請求項1に記載の方法。
- 前記投影することは、可逆である請求項1に記載の方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/717,361 US7305132B2 (en) | 2003-11-19 | 2003-11-19 | Classification in likelihood spaces |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005202932A true JP2005202932A (ja) | 2005-07-28 |
Family
ID=34574591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004335075A Pending JP2005202932A (ja) | 2003-11-19 | 2004-11-18 | データを複数のクラスに分類する方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7305132B2 (ja) |
JP (1) | JP2005202932A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007087379A (ja) * | 2005-09-02 | 2007-04-05 | Mitsubishi Electric Research Laboratories Inc | コンピュータによるデータ分類方法、コンピュータによる分類方法 |
JP2007094388A (ja) * | 2005-09-26 | 2007-04-12 | Samsung Electronics Co Ltd | 音声区間検出装置及び音声区間検出方法 |
KR100745980B1 (ko) * | 2006-01-11 | 2007-08-06 | 삼성전자주식회사 | 분류기 통합을 위한 스코어 합성 방법 및 장치 |
JP2009511937A (ja) * | 2005-10-07 | 2009-03-19 | ミツビシ・エレクトリック・リサーチ・ラボラトリーズ・インコーポレイテッド | プライベートデータを安全に分類する方法 |
JP2009271885A (ja) * | 2008-05-12 | 2009-11-19 | Panasonic Corp | 年齢推定方法及び年齢推定装置 |
JP2010250391A (ja) * | 2009-04-10 | 2010-11-04 | Nippon Telegr & Teleph Corp <Ntt> | データ分類方法及び装置及びプログラム |
JP2017032857A (ja) * | 2015-08-04 | 2017-02-09 | 本田技研工業株式会社 | 音声処理装置及び音声処理方法 |
WO2018066263A1 (ja) * | 2016-10-06 | 2018-04-12 | 日本電気株式会社 | 光受信装置及び制御方法 |
CN110688484A (zh) * | 2019-09-24 | 2020-01-14 | 北京工商大学 | 一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4481663B2 (ja) * | 2004-01-15 | 2010-06-16 | キヤノン株式会社 | 動作認識装置、動作認識方法、機器制御装置及びコンピュータプログラム |
US7827011B2 (en) * | 2005-05-03 | 2010-11-02 | Aware, Inc. | Method and system for real-time signal classification |
US7680341B2 (en) * | 2006-05-05 | 2010-03-16 | Xerox Corporation | Generic visual classification with gradient components-based dimensionality enhancement |
US8000538B2 (en) * | 2006-12-22 | 2011-08-16 | Palo Alto Research Center Incorporated | System and method for performing classification through generative models of features occurring in an image |
US8843370B2 (en) * | 2007-11-26 | 2014-09-23 | Nuance Communications, Inc. | Joint discriminative training of multiple speech recognizers |
US8037001B2 (en) * | 2008-04-14 | 2011-10-11 | Honeywell International Inc. | Determining corrective actions using a geometrically-based determination of sufficient confidence |
EP2178049A1 (en) * | 2008-10-16 | 2010-04-21 | Bernardo Kastrup | Method and apparatus for generating visual patterns |
WO2011010604A1 (ja) * | 2009-07-21 | 2011-01-27 | 日本電信電話株式会社 | 音声信号区間推定装置と音声信号区間推定方法及びそのプログラムと記録媒体 |
US8737747B2 (en) * | 2011-02-14 | 2014-05-27 | Xerox Corporation | Method for automated tire detection and recognition |
US8891884B2 (en) | 2011-12-27 | 2014-11-18 | Microsoft Corporation | Regression tree fields |
US9070047B2 (en) | 2011-12-27 | 2015-06-30 | Microsoft Technology Licensing, Llc | Decision tree fields to map dataset content to a set of parameters |
US9251394B2 (en) | 2012-04-05 | 2016-02-02 | Ancestry.Com Operations Inc. | System and method for estimating/determining the date of a photo |
US10311863B2 (en) | 2016-09-02 | 2019-06-04 | Disney Enterprises, Inc. | Classifying segments of speech based on acoustic features and context |
US10789533B2 (en) | 2017-07-26 | 2020-09-29 | LogMeln, Inc. | Generating a consistently labeled training dataset by automatically generating and displaying a set of most similar previously-labeled texts and their previously assigned labels for each text that is being labeled for the training dataset |
US10657423B2 (en) * | 2017-09-08 | 2020-05-19 | Denise Reeves | Methods for using feature vectors and machine learning algorithms to determine discriminant functions of minimum risk linear classification systems |
US10299864B1 (en) * | 2018-08-07 | 2019-05-28 | Sony Corporation | Co-localization of multiple internal organs based on images obtained during surgery |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4246570A (en) * | 1978-04-20 | 1981-01-20 | Computer Gesellschaft Konstanz Mbh | Optical wand for mechanical character recognition |
JP2690027B2 (ja) * | 1994-10-05 | 1997-12-10 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | パターン認識方法及び装置 |
JP2003015684A (ja) * | 2001-05-21 | 2003-01-17 | Mitsubishi Electric Research Laboratories Inc | 1つの音源から生成される音響信号から特徴を抽出するための方法及び複数の音源から生成される音響信号から特徴を抽出するための方法 |
US6532305B1 (en) * | 1998-08-04 | 2003-03-11 | Lincom Corporation | Machine learning method |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5060277A (en) * | 1985-10-10 | 1991-10-22 | Palantir Corporation | Pattern classification means using feature vector regions preconstructed from reference data |
US4773099A (en) * | 1985-10-10 | 1988-09-20 | The Palantir Corporation | Pattern classification means for use in a pattern recognition system |
US5181259A (en) * | 1990-09-25 | 1993-01-19 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | General method of pattern classification using the two domain theory |
JP3088171B2 (ja) * | 1991-02-12 | 2000-09-18 | 三菱電機株式会社 | 自己組織型パタ−ン分類システム及び分類方法 |
US5337371A (en) * | 1991-08-09 | 1994-08-09 | Matsushita Electric Industrial Co., Ltd. | Pattern classification system |
US6058205A (en) * | 1997-01-09 | 2000-05-02 | International Business Machines Corporation | System and method for partitioning the feature space of a classifier in a pattern classification system |
-
2003
- 2003-11-19 US US10/717,361 patent/US7305132B2/en not_active Expired - Fee Related
-
2004
- 2004-11-18 JP JP2004335075A patent/JP2005202932A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4246570A (en) * | 1978-04-20 | 1981-01-20 | Computer Gesellschaft Konstanz Mbh | Optical wand for mechanical character recognition |
JP2690027B2 (ja) * | 1994-10-05 | 1997-12-10 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | パターン認識方法及び装置 |
US6532305B1 (en) * | 1998-08-04 | 2003-03-11 | Lincom Corporation | Machine learning method |
JP2003015684A (ja) * | 2001-05-21 | 2003-01-17 | Mitsubishi Electric Research Laboratories Inc | 1つの音源から生成される音響信号から特徴を抽出するための方法及び複数の音源から生成される音響信号から特徴を抽出するための方法 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007087379A (ja) * | 2005-09-02 | 2007-04-05 | Mitsubishi Electric Research Laboratories Inc | コンピュータによるデータ分類方法、コンピュータによる分類方法 |
JP2007094388A (ja) * | 2005-09-26 | 2007-04-12 | Samsung Electronics Co Ltd | 音声区間検出装置及び音声区間検出方法 |
US7711558B2 (en) | 2005-09-26 | 2010-05-04 | Samsung Electronics Co., Ltd. | Apparatus and method for detecting voice activity period |
JP2009511937A (ja) * | 2005-10-07 | 2009-03-19 | ミツビシ・エレクトリック・リサーチ・ラボラトリーズ・インコーポレイテッド | プライベートデータを安全に分類する方法 |
KR100745980B1 (ko) * | 2006-01-11 | 2007-08-06 | 삼성전자주식회사 | 분류기 통합을 위한 스코어 합성 방법 및 장치 |
JP2009271885A (ja) * | 2008-05-12 | 2009-11-19 | Panasonic Corp | 年齢推定方法及び年齢推定装置 |
JP2010250391A (ja) * | 2009-04-10 | 2010-11-04 | Nippon Telegr & Teleph Corp <Ntt> | データ分類方法及び装置及びプログラム |
JP2017032857A (ja) * | 2015-08-04 | 2017-02-09 | 本田技研工業株式会社 | 音声処理装置及び音声処理方法 |
US10622008B2 (en) | 2015-08-04 | 2020-04-14 | Honda Motor Co., Ltd. | Audio processing apparatus and audio processing method |
WO2018066263A1 (ja) * | 2016-10-06 | 2018-04-12 | 日本電気株式会社 | 光受信装置及び制御方法 |
US11190278B2 (en) | 2016-10-06 | 2021-11-30 | Nec Corporation | Optical reception apparatus and control method |
CN110688484A (zh) * | 2019-09-24 | 2020-01-14 | 北京工商大学 | 一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法 |
Also Published As
Publication number | Publication date |
---|---|
US7305132B2 (en) | 2007-12-04 |
US20050105795A1 (en) | 2005-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005202932A (ja) | データを複数のクラスに分類する方法 | |
US9978002B2 (en) | Object recognizer and detector for two-dimensional images using Bayesian network based classifier | |
Schneiderman et al. | Object detection using the statistics of parts | |
JP4588575B2 (ja) | デジタル画像の複数対象物検出方法および装置並びにプログラム | |
Qureshi et al. | Adaptive discriminant wavelet packet transform and local binary patterns for meningioma subtype classification | |
Kingma et al. | Regularized estimation of image statistics by score matching | |
US9026404B2 (en) | Methods of improving detectors and classifiers using optimized stochastic resonance noise | |
Pyun et al. | Image segmentation using hidden Markov Gauss mixture models | |
CN110414299B (zh) | 一种基于计算机视觉的猴脸亲缘关系分析方法 | |
Zuobin et al. | Feature regrouping for cca-based feature fusion and extraction through normalized cut | |
CN113378620B (zh) | 监控视频噪声环境下跨摄像头行人重识别方法 | |
CN107563287B (zh) | 人脸识别方法和装置 | |
Yao | A compressed deep convolutional neural networks for face recognition | |
Kumar et al. | Pixel-based skin color classifier: A review | |
Krupiński et al. | Improved two-step binarization of degraded document images based on Gaussian mixture model | |
Ajitha et al. | Face recognition system using Combined Gabor Wavelet and DCT approach | |
CN107341485B (zh) | 人脸识别方法和装置 | |
King | A survey of methods for face detection | |
Jensch et al. | A comparative evaluation of three skin color detection approaches | |
Li et al. | Multi-level Fisher vector aggregated completed local fractional order derivative feature vector for face recognition | |
US20240144447A1 (en) | Saliency maps and concept formation intensity for diffusion models | |
Zhang et al. | Artificial Intelligence Technology in the Operation and Management of Rail Transit System | |
Bashar | BM3D Image Denoising using Learning-Based Adaptive Hard Thresholding | |
Li et al. | Fast Fuzzy C-means Clustering Method for Image Segmentation | |
Shankar et al. | Frames extracted from video streaming to recognition of face: LBPH, FF and CNN |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071001 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100622 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100823 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101026 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20101112 |