JP2018022014A - 特徴量抽出装置、特徴量抽出関数情報生成装置、これらの方法及びプログラム - Google Patents
特徴量抽出装置、特徴量抽出関数情報生成装置、これらの方法及びプログラム Download PDFInfo
- Publication number
- JP2018022014A JP2018022014A JP2016152571A JP2016152571A JP2018022014A JP 2018022014 A JP2018022014 A JP 2018022014A JP 2016152571 A JP2016152571 A JP 2016152571A JP 2016152571 A JP2016152571 A JP 2016152571A JP 2018022014 A JP2018022014 A JP 2018022014A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- feature quantity
- function
- quantity extraction
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】特徴量抽出装置は、観測データを特徴量抽出関数に入力することにより観測データの特徴量を計算する特徴量抽出部11を含み、特徴量抽出関数は、ネイマン・ピアソンの基準に基づく最適化指標を用いて勾配法により最適化されている。
【選択図】図1
Description
特徴量マッチングによる登録音検知を行う登録音検知装置のブロック図を図1に示す。
登録音検知装置は、図1に示すように、特徴量抽出装置1、類似度計算部2、閾値判定部3、登録音記憶部51を例えば備えている。登録音検知方法は、特徴量抽出、類似度計算、閾値判定の3つの処理、言い換えれば、図3及び以下に説明するステップS1からステップS3の処理で実現される。
この登録音検知の性能指標を示す。登録音検知の目標は、以下の2つの条件
(i) 観測音が登録音と同じ種類なら、同一と判定する。
(ii) 観測音が登録音と違う種類なら、同一でないと判定する。
を同時に満たすような検出器の設計である。ここで、(i) 確率をζ0、(ii)の確率をζ1としたとき、登録音検知の目的は、ζ0,ζ1を同時最大化することである。ここで、ζ0,ζ1は、g(Lτ,φ)の期待値として、以下のように表現できる。
「帰無仮説(H0): xはsと異なる音である。」
「対立仮説(H1): xはsと同じ音である。」
をしたときに、第1種過誤(xとsは同じ音なのに、異なる音と判定する)率をΓと固定したときに、第2種過誤(xとs は異なる音なのに、同じ音と判定する)率を最小化することが知られている。つまり、式(8)の最大化による登録音検知の最適化は、第1種過誤率をΓと固定したときに、第2種過誤率を最小化するための最適化であり、「ネイマン・ピアソンの基準」に基づく最適化である。
行われてなかった。
登録音検知装置の性能はJで測ることができる。ゆえに、ネイマン・ピアソンの基準に従って音響特徴量抽出関数F()を最適化すれば、特徴量抽出は最適化できる。ここでは、ネイマン・ピアソンの基準に基づく特徴量抽出の最適化を以下の式で表現し、これを最適化する。
ここでは、(16)のような時間周波数重みの特徴量抽出関数を、勾配法や期待値最大化(EM)アルゴリズムなどで統計的に最適化する際に、効率的かつ安定的に最適化するための工夫を述べる。
特徴量抽出関数情報生成装置4は、図2に示すように、特徴量抽出部41、更新部42、正則化部43、時間周波数平滑化部44及び収束判定部45を例えば備えている。特徴量抽出関数情報生成方法は、特徴量抽出関数情報生成装置4の各部が、図4及び以下に説明するステップS41からステップ45の処理を行うことにより実現される。
特徴量抽出装置1又は特徴量抽出関数情報生成装置4における各処理をコンピュータによって実現する場合、特徴量抽出装置1又は特徴量抽出関数情報生成装置4が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、その各処理がコンピュータ上で実現される。
特徴量抽出関数の学習アルゴリズムの用途は、異常音検知のための登録音検知に限られない。例えば、聴覚障がい者向けのアプリケーションとして、玄関のベルや電話のアラーム音を検知するための技術としても用いることができる。このように、特徴量抽出装置1の入力は、音データ以外の任意のデータであってもよい。
Claims (9)
- 観測データを特徴量抽出関数に入力することにより上記観測データの特徴量を計算する特徴量抽出部を含み、
上記特徴量抽出関数は、ネイマン・ピアソンの基準に基づく最適化指標を用いて勾配法により最適化されている、
特徴量抽出装置。 - 請求項2の特徴量抽出装置であって、
上記特徴量抽出関数は、入力されたデータに基づいて得られる複数の仮特徴量を重み付けする関数である、
特徴量抽出装置。 - 請求項4の特徴量抽出装置であって、
上記仮特徴量に付けられた重みは、時間周波数方向に平滑化されている、
特徴量抽出装置。 - 登録音検知のために用いられる特徴量抽出関数を、ネイマン・ピアソンの基準に基づく最適化指標を用いて勾配法により更新を行う更新部を含む、
特徴量抽出関数情報生成装置。 - 特徴量抽出部が、観測データを特徴量抽出関数に入力することにより上記観測データの特徴量を計算する特徴量抽出計算ステップを含み、
上記特徴量抽出関数は、ネイマン・ピアソンの基準に基づく最適化指標を用いて勾配法により最適化されている、
特徴量抽出方法。 - 更新部が、登録音検知のために用いられる特徴量抽出関数を、ネイマン・ピアソンの基準に基づく最適化指標を用いて勾配法により更新を行う更新ステップを含む、
特徴量抽出関数情報生成方法。 - 請求項1から5の何れかの特徴量抽出装置の各部又は請求項6の特徴量抽出関数情報生成装置の各部としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016152571A JP6472417B2 (ja) | 2016-08-03 | 2016-08-03 | 特徴量抽出装置、特徴量抽出関数情報生成装置、これらの方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016152571A JP6472417B2 (ja) | 2016-08-03 | 2016-08-03 | 特徴量抽出装置、特徴量抽出関数情報生成装置、これらの方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018022014A true JP2018022014A (ja) | 2018-02-08 |
JP6472417B2 JP6472417B2 (ja) | 2019-02-20 |
Family
ID=61165980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016152571A Active JP6472417B2 (ja) | 2016-08-03 | 2016-08-03 | 特徴量抽出装置、特徴量抽出関数情報生成装置、これらの方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6472417B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020067750A (ja) * | 2018-10-23 | 2020-04-30 | 日本製鉄株式会社 | 学習方法、装置及びプログラム、並びに設備の異常診断方法 |
CN111832910A (zh) * | 2020-06-24 | 2020-10-27 | 陕西法士特齿轮有限责任公司 | 一种多指标异响判定阈值确定方法、系统和计算机设备 |
WO2021019671A1 (ja) * | 2019-07-30 | 2021-02-04 | 日本電信電話株式会社 | 特徴量抽出装置、異常度推定装置、それらの方法、およびプログラム |
WO2021019672A1 (ja) * | 2019-07-30 | 2021-02-04 | 日本電信電話株式会社 | 異常度推定装置、異常度推定方法、およびプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07146157A (ja) * | 1993-11-24 | 1995-06-06 | Nec Corp | 実時間信号検定方法 |
JP2007017620A (ja) * | 2005-07-06 | 2007-01-25 | Kyoto Univ | 発話区間検出装置、そのためのコンピュータプログラム及び記録媒体 |
-
2016
- 2016-08-03 JP JP2016152571A patent/JP6472417B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07146157A (ja) * | 1993-11-24 | 1995-06-06 | Nec Corp | 実時間信号検定方法 |
JP2007017620A (ja) * | 2005-07-06 | 2007-01-25 | Kyoto Univ | 発話区間検出装置、そのためのコンピュータプログラム及び記録媒体 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020067750A (ja) * | 2018-10-23 | 2020-04-30 | 日本製鉄株式会社 | 学習方法、装置及びプログラム、並びに設備の異常診断方法 |
JP7127477B2 (ja) | 2018-10-23 | 2022-08-30 | 日本製鉄株式会社 | 学習方法、装置及びプログラム、並びに設備の異常診断方法 |
WO2021019672A1 (ja) * | 2019-07-30 | 2021-02-04 | 日本電信電話株式会社 | 異常度推定装置、異常度推定方法、およびプログラム |
WO2021019671A1 (ja) * | 2019-07-30 | 2021-02-04 | 日本電信電話株式会社 | 特徴量抽出装置、異常度推定装置、それらの方法、およびプログラム |
JPWO2021019671A1 (ja) * | 2019-07-30 | 2021-02-04 | ||
JPWO2021019672A1 (ja) * | 2019-07-30 | 2021-02-04 | ||
US20220283057A1 (en) * | 2019-07-30 | 2022-09-08 | Nippon Telegraph And Telephone Corporation | Anomaly score estimation apparatus, anomaly score estimation method, and program |
JP7188597B2 (ja) | 2019-07-30 | 2022-12-13 | 日本電信電話株式会社 | 特徴量抽出装置、異常度推定装置、それらの方法、およびプログラム |
JP7188598B2 (ja) | 2019-07-30 | 2022-12-13 | 日本電信電話株式会社 | 異常度推定装置、異常度推定方法、およびプログラム |
US11835430B2 (en) | 2019-07-30 | 2023-12-05 | Nippon Telegraph And Telephone Corporation | Anomaly score estimation apparatus, anomaly score estimation method, and program |
US11971332B2 (en) | 2019-07-30 | 2024-04-30 | Nippon Telegraph And Telephone Corporation | Feature extraction apparatus, anomaly score estimation apparatus, methods therefor, and program |
CN111832910A (zh) * | 2020-06-24 | 2020-10-27 | 陕西法士特齿轮有限责任公司 | 一种多指标异响判定阈值确定方法、系统和计算机设备 |
CN111832910B (zh) * | 2020-06-24 | 2024-03-12 | 陕西法士特齿轮有限责任公司 | 一种多指标异响判定阈值确定方法、系统和计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
JP6472417B2 (ja) | 2019-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3680639B1 (en) | Abnormality model learning device, method, and program | |
US11480497B2 (en) | Anomalous sound detection training apparatus, acoustic feature extraction apparatus, anomalous sound sampling apparatus, and methods and programs for the same | |
EP3584573B1 (en) | Abnormal sound detection training device and method and program therefor | |
CN110472675B (zh) | 图像分类方法、图像分类装置、存储介质与电子设备 | |
Althubiti et al. | Applying long short-term memory recurrent neural network for intrusion detection | |
JP6472417B2 (ja) | 特徴量抽出装置、特徴量抽出関数情報生成装置、これらの方法及びプログラム | |
JP2015057630A (ja) | 音響イベント識別モデル学習装置、音響イベント検出装置、音響イベント識別モデル学習方法、音響イベント検出方法及びプログラム | |
CN109840413B (zh) | 一种钓鱼网站检测方法及装置 | |
Dawoud et al. | Deep learning for network anomalies detection | |
EP3916597B1 (en) | Detecting malware with deep generative models | |
Hacine-Gharbi et al. | A new histogram-based estimation technique of entropy and mutual information using mean squared error minimization | |
US20220283057A1 (en) | Anomaly score estimation apparatus, anomaly score estimation method, and program | |
US20220122629A1 (en) | Sound generation apparatus, data generation apparatus, anomaly score calculation apparatus, and program | |
CN114331731A (zh) | 基于pca与rf的区块链异常检测方法及相关装置 | |
JP2019066339A (ja) | 音による診断装置、診断方法、および診断システム | |
EP3423989B1 (en) | Uncertainty measure of a mixture-model based pattern classifer | |
Castro-Cabrera et al. | Adaptive classification using incremental learning for seismic-volcanic signals with concept drift | |
Tuma et al. | Hydroacoustic signal classification using support vector machines | |
JP6082679B2 (ja) | 信号源数推定装置、信号源数推定方法及びプログラム | |
CN117540791B (zh) | 一种对抗训练的方法及装置 | |
Mittal et al. | An improved SVM using predator prey optimization and Hooke-Jeeves method for speech recognition | |
Affek et al. | Open-Set Speaker Identification Using Closed-Set Pretrained Embeddings | |
Mondal et al. | Improved Speech Activity Detection Using Cochleagram Spectral Basis by Nonnegative Matrix Factorization | |
Musthafa et al. | Evaluation of IDS model by improving accuracy and reducing overfitting using stacking LSTM | |
Habashy | Comparing Machine Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180228 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190111 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190122 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6472417 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |