JP2006235243A - 音響信号分析装置及び音響信号分析プログラム - Google Patents
音響信号分析装置及び音響信号分析プログラム Download PDFInfo
- Publication number
- JP2006235243A JP2006235243A JP2005049782A JP2005049782A JP2006235243A JP 2006235243 A JP2006235243 A JP 2006235243A JP 2005049782 A JP2005049782 A JP 2005049782A JP 2005049782 A JP2005049782 A JP 2005049782A JP 2006235243 A JP2006235243 A JP 2006235243A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- acoustic signal
- analysis
- spectrum
- power spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】 任意に設定し得る分析周波数において、当該分析周波数に対応する複素正弦波と分析対象の音響信号との畳み込み演算を行い、パワースペクトルを生成する(S220)。線形予測分析等、パワースペクトルの微細構造のピークに重みを置いたスペクトル包絡抽出演算を行って、スペクトル包絡情報を生成する(S230〜S250)。
【選択図】 図3
Description
S. Davis and P. Mermelstein, "Comparison of parametric representationsfor monosyllabic word recognition", In Proc. 1980 ICASSP, pages 357-366,1980. H. Hermansky, "Perceptuallinear predictive (PLP) analysis of speech", J. Acoust. Soc. Amer., vol.87, pp. 1738-1752, 1990.
第1の実施形態は、音響信号分析装置である。ここでは、電話回線を通して入力された音響信号に対する分析を例にとって説明する。周知のように電話回線は伝送周波数帯域が約300〜3400Hzに限られているなどの伝送周波数特性を持っている。本実施形態では、このような知見に基づき、電話回線経由の音響信号に適合した分析周波数帯制限をかけつつ聴覚特性を反映した周波数軸変換を施した分析を行う。
MEL(f0)=MEL(300)=401.97
MEL(fM)=MEL(3400)=1992.1
及び、8kHzサンプリング、30mSフレーム長の場合に対応した、
M=120
を代入することにより、分析周波数fmを計算することができる。
第2の実施形態は、音声認証装置への応用例である。本音声認証装置は、利用者の音声を予め登録しておき、装置に入力された音声と登録音声とを照合して入力音声を発声した話者(入力話者)が登録音声を発声した話者(登録話者)とみなせるか否かを判定し、入力話者と登録話者とが同一話者とみなしたときに認証を与える装置である。
Claims (6)
- 予め設定された複数の注目周波数それぞれについて、当該注目周波数に対応する複素正弦波と分析対象の音響信号との畳み込み演算を行って当該注目周波数におけるパワーを求め、前記音響信号のパワースペクトルを生成するパワースペクトル生成部と、
前記パワースペクトルの微細構造のピークに重みを置いたスペクトル包絡抽出演算を行って、スペクトル包絡情報を生成するスペクトル包絡情報生成部と、
を有することを特徴とする音響信号分析装置。 - 請求項1に記載の音響信号分析装置において、
前記注目周波数は、聴覚特性に対応する非線形周波数軸上で等周波数間隔に設定されること、
を特徴とする音響信号分析装置。 - 請求項1又は請求項2に記載の音響信号分析装置において、
前記注目周波数は、0Hz以上で前記音響信号のサンプリング周波数の2分の1より低い下限値と、前記下限値より高く前記音響信号のサンプリング周波数の2分の1以下の上限値との間で設定されること、
を特徴とする音響信号分析装置。 - 請求項1から請求項3のいずれか1つに記載の音響信号分析装置において、
前記スペクトル包絡情報生成部は、
前記パワースペクトルをフーリエ変換して自己相関関数を求める自己相関関数演算部と、
前記自己相関関数に基づいて線形予測分析を行い、前記スペクトル包絡情報を求める線形予測演算部と、
を有することを特徴とする音響信号分析装置。 - 請求項1から請求項4のいずれか1つに記載の音響信号分析装置において、
パワースペクトル生成部は、前記畳み込み演算にて前記音響信号の各サンプリング値に乗じられる、前記各複素正弦波の値に応じた係数を予め格納した係数格納部を有すること、
を特徴とする音響信号分析装置。 - 音響信号をサンプリングした音響データからスペクトル包絡情報を算出する手段としてコンピュータを機能させるプログラムであって、
予め設定された複数の注目周波数それぞれについて、当該注目周波数に対応する複素正弦波と前記音響データとの畳み込み演算を行って当該注目周波数におけるパワーを求め、前記音響データのパワースペクトルを生成するパワースペクトル生成手段と、
前記パワースペクトルの微細構造のピークに重みを置いたスペクトル包絡抽出演算を行って、スペクトル包絡情報を生成するスペクトル包絡情報生成手段と、
を実現し、
前記注目周波数は、分析目的に応じて任意に設定可能であること、
を特徴とする音響信号分析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005049782A JP2006235243A (ja) | 2005-02-24 | 2005-02-24 | 音響信号分析装置及び音響信号分析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005049782A JP2006235243A (ja) | 2005-02-24 | 2005-02-24 | 音響信号分析装置及び音響信号分析プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006235243A true JP2006235243A (ja) | 2006-09-07 |
Family
ID=37042957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005049782A Pending JP2006235243A (ja) | 2005-02-24 | 2005-02-24 | 音響信号分析装置及び音響信号分析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006235243A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015161810A (ja) * | 2014-02-27 | 2015-09-07 | 日本電信電話株式会社 | サンプル列生成方法、符号化方法、復号方法、これらの装置及びプログラム |
JP2016045462A (ja) * | 2014-08-26 | 2016-04-04 | 日本電信電話株式会社 | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置及びプログラム |
JP2017531237A (ja) * | 2014-08-13 | 2017-10-19 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 多因子のキャンセル可能なバイオメトリックデータに基づく認証 |
CN111824879A (zh) * | 2020-07-02 | 2020-10-27 | 南京安杰信息科技有限公司 | 智能语音无接触梯控方法、系统及存储介质 |
JP2021508076A (ja) * | 2017-12-19 | 2021-02-25 | ドルビー・インターナショナル・アーベー | 音声音響統合復号および符号化のqmfに基づく高調波トランスポンダの改良のための方法、機器、およびシステム |
JP2021508083A (ja) * | 2017-12-19 | 2021-02-25 | ドルビー・インターナショナル・アーベー | 音声音響統合復号および符号化非相関フィルタの改良のための方法、機器、およびシステム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06310985A (ja) * | 1993-04-27 | 1994-11-04 | Hitachi Ltd | 音声信号処理回路 |
JPH11327600A (ja) * | 1997-10-03 | 1999-11-26 | Matsushita Electric Ind Co Ltd | オーディオ信号圧縮方法、オーディオ信号圧縮装置、音声信号圧縮方法、音声信号圧縮装置,音声認識方法および音声認識装置 |
JP2002091486A (ja) * | 2000-09-18 | 2002-03-27 | Matsushita Electric Ind Co Ltd | 音声認識装置、音声認識方法、および音声認識プログラムを記録した記録媒体 |
-
2005
- 2005-02-24 JP JP2005049782A patent/JP2006235243A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06310985A (ja) * | 1993-04-27 | 1994-11-04 | Hitachi Ltd | 音声信号処理回路 |
JPH11327600A (ja) * | 1997-10-03 | 1999-11-26 | Matsushita Electric Ind Co Ltd | オーディオ信号圧縮方法、オーディオ信号圧縮装置、音声信号圧縮方法、音声信号圧縮装置,音声認識方法および音声認識装置 |
JP2002091486A (ja) * | 2000-09-18 | 2002-03-27 | Matsushita Electric Ind Co Ltd | 音声認識装置、音声認識方法、および音声認識プログラムを記録した記録媒体 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015161810A (ja) * | 2014-02-27 | 2015-09-07 | 日本電信電話株式会社 | サンプル列生成方法、符号化方法、復号方法、これらの装置及びプログラム |
JP2017531237A (ja) * | 2014-08-13 | 2017-10-19 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 多因子のキャンセル可能なバイオメトリックデータに基づく認証 |
JP2016045462A (ja) * | 2014-08-26 | 2016-04-04 | 日本電信電話株式会社 | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置及びプログラム |
JP2021508076A (ja) * | 2017-12-19 | 2021-02-25 | ドルビー・インターナショナル・アーベー | 音声音響統合復号および符号化のqmfに基づく高調波トランスポンダの改良のための方法、機器、およびシステム |
JP2021508083A (ja) * | 2017-12-19 | 2021-02-25 | ドルビー・インターナショナル・アーベー | 音声音響統合復号および符号化非相関フィルタの改良のための方法、機器、およびシステム |
JP7326285B2 (ja) | 2017-12-19 | 2023-08-15 | ドルビー・インターナショナル・アーベー | 音声音響統合復号および符号化のqmfに基づく高調波トランスポーザーの改良のための方法、機器、およびシステム |
JP7326286B2 (ja) | 2017-12-19 | 2023-08-15 | ドルビー・インターナショナル・アーベー | 音声音響統合復号および符号化非相関フィルタの改良のための方法、機器、およびシステム |
CN111824879A (zh) * | 2020-07-02 | 2020-10-27 | 南京安杰信息科技有限公司 | 智能语音无接触梯控方法、系统及存储介质 |
CN111824879B (zh) * | 2020-07-02 | 2021-03-30 | 南京安杰信息科技有限公司 | 智能语音无接触梯控方法、系统及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11056097B2 (en) | Method and system for generating advanced feature discrimination vectors for use in speech recognition | |
Campbell | Speaker recognition: A tutorial | |
US8160877B1 (en) | Hierarchical real-time speaker recognition for biometric VoIP verification and targeting | |
US7957959B2 (en) | Method and apparatus for processing speech data with classification models | |
Singh et al. | Multimedia utilization of non-computerized disguised voice and acoustic similarity measurement | |
Kumar et al. | Design of an automatic speaker recognition system using MFCC, vector quantization and LBG algorithm | |
US20070185715A1 (en) | Method and apparatus for generating a frequency warping function and for frequency warping | |
Pawar et al. | Review of various stages in speaker recognition system, performance measures and recognition toolkits | |
Shanthi et al. | Review of feature extraction techniques in automatic speech recognition | |
Senthil Raja et al. | Speaker recognition under stressed condition | |
Sumithra et al. | A study on feature extraction techniques for text independent speaker identification | |
Jin et al. | Overview of front-end features for robust speaker recognition | |
Shanthi Therese et al. | Review of feature extraction techniques in automatic speech recognition | |
Cao et al. | An improved endpoint detection algorithm based on MFCC Cosine Value | |
JP2006235243A (ja) | 音響信号分析装置及び音響信号分析プログラム | |
US20020065649A1 (en) | Mel-frequency linear prediction speech recognition apparatus and method | |
CN110838294B (zh) | 一种语音验证方法、装置、计算机设备及存储介质 | |
Omer | Joint MFCC-and-vector quantization based text-independent speaker recognition system | |
Chow et al. | Speaker identification based on log area ratio and Gaussian mixture models in narrow-band speech: speech understanding/interaction | |
Imam et al. | Speaker recognition using automated systems | |
Sharma et al. | Speech recognition of Punjabi numerals using synergic HMM and DTW approach | |
Jagtap et al. | Speaker verification using Gaussian mixture model | |
Nair et al. | A reliable speaker verification system based on LPCC and DTW | |
Bora et al. | Speaker identification for biometric access control using hybrid features | |
Aliyu et al. | Development of a text-dependent speaker recognition system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071203 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100618 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100706 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100902 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101102 |