JP5180139B2 - 発声検出装置 - Google Patents
発声検出装置 Download PDFInfo
- Publication number
- JP5180139B2 JP5180139B2 JP2009100710A JP2009100710A JP5180139B2 JP 5180139 B2 JP5180139 B2 JP 5180139B2 JP 2009100710 A JP2009100710 A JP 2009100710A JP 2009100710 A JP2009100710 A JP 2009100710A JP 5180139 B2 JP5180139 B2 JP 5180139B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- correlation
- cross
- frame
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001514 detection method Methods 0.000 title claims description 30
- 238000004364 calculation method Methods 0.000 claims description 52
- 230000005236 sound signal Effects 0.000 claims description 11
- 238000009434 installation Methods 0.000 abstract description 11
- 238000012545 processing Methods 0.000 description 35
- 238000007792 addition Methods 0.000 description 26
- 238000000034 method Methods 0.000 description 22
- 230000008569 process Effects 0.000 description 16
- 230000002087 whitening effect Effects 0.000 description 16
- 238000001228 spectrum Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000001174 ascending effect Effects 0.000 description 6
- 101100161473 Arabidopsis thaliana ABCB25 gene Proteins 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000003321 amplification Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 238000005314 correlation function Methods 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002945 steepest descent method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Description
Impulse Response)型、IIR(Infinite Impulse Response)型の制限は無い。さらに、FFT(Fast Fourier
Transform)を利用した周波数軸上での処理であっても良い。
Fourier Transform)処理を行う。その後、FFT処理の結果に対してスペクトル包絡にて除算することで、音響信号を白色化する。
ここでは、一つ前のフレームの純音付加係数を使って所望の正規化相互相関値に漸近するように再帰的に新しい純音付加係数を計算しているが、それ以外でも、最急降下法を使ったニュートン法や適応信号処理のLMS(Least Mean Squares)法の応用などが適用可能である。暗騒音フレーム選別部16からの出力である暗騒音フレーム群の統計的性質が隣接するフレーム間で急激な変化をしないことから、特に速い収束性は必要なく、前述の更新方式で十分実用的である。
なお、付加する純音は、音声信号の帯域と被らない信号、例えば40Hzのトーン信号であり、直流であってもよく、70Hz以下での周波数変調をさせた人工音としてもよい。
X2(k,t)と、逆フーリエ変換の計算が必要である。しかしながら、両信号のフーリエ変換X1(k,t), X2(k,t)と純音のフーリエ変換であるD(k)には、周波数的に重なりが無いので数式2の2段目の近似式が得られる。
X2(k,t)は低域カット処理部12により低域信号をカットしてあること、およびD(k)が低域成分のみを有することから近似式が高精度に成り立つ。この式を逆フーリエ変換したものの0次項がφ(0,t,α(t))であるが、フーリエ変換の定義式より、分子を周波数kに関して総和したものであるので数式3が得られる。
X2(k,t)はフレームtにおける左右の音響信号のフーリエ変換をそれぞれ示している。
以上により記憶容量と演算量の違いは明らかである。これは、音響信号と付加する純音がスペクトル的に重ならないことに着目して、相関関数の演算に近似式が成立することを利用しているためである。むろん、記憶容量と演算パワーに余裕がある場合には、FFT結果の履歴をもち、逆フーリエ変換を多用して数式1を更新しても構わないが、演算結果で比較して、近似式を使った低記憶容量・低演算を使った場合と優位な差は無い。
Fourier Transform)のサイズ、X1(k,t), X2(k,t)はフレームtにおける左右の音響信号をのフーリエ変換、(・)*は複素共役をそれぞれ示す。かかるΦ(k,t)に対して、逆フーリエ変換を行うことで、フレームtにおける正規化相互相関値列が得られる。
10・・・増幅器
11・・・A/Dコンバータ
12・・・低域カット処理部
13・・・フレーム切出部
14・・・白色化処理部
15・・・瞬時パワー相関計算部
16・・・暗騒音フレーム選別部
17・・・純音付加係数計算部
18・・・純音付加部
19・・・相互相関計算部
20・・・発声推定部
2・・・マイクロホン
3・・・ATM
4・・・話者
Claims (3)
- 2つの集音器にて取得した音響信号から所定方向の発声を検出する発声検出装置であって、
前記2つの集音器による音響信号から所定の低周波数域成分をカットし、当該2つの音響信号ごとの瞬時パワー情報および特定方向瞬時相互相関値をセットとするフレームごとのデータセットを計算する瞬時パワー相関計算部と、
前記瞬時パワー相関計算部にて計算したデータセットをフレーム毎に記憶する記憶部と、
前記記憶部に記憶されたデータセットから前記特定方向瞬時相互相関値の絶対値が小さい所定数のデータセットのフレームを選別するフレーム選別部と、
前記フレーム選別部にて選別されたフレームから人工音付加係数を算出する付加係数計算部と、
前記人工音付加係数を用いて増幅させた相互に逆位相となる前記低周波数域成分の2つの人工信号を生成し、2つの集音器からの前記所定の低周波数域成分がカットされた音響信号にそれぞれ異なる人工信号を付加する人工音付加部と、
前記人工音付加部にて人工信号が付加された2つの音響信号について正規化相互相関値を計算する相互相関計算部と、
前記相互相関計算部の出力により発声を検出する発声検出部と、
を具備することを特徴とした発声検出装置。 - 前記付加係数計算部は、選択されたフレームのデータセットを使用して前記相互相関計算部における所定方向の正規化相互相関値がほぼ目標値になるような人工音付加係数を算出する請求項1に記載の発声検出装置。
- 前記目標値は正規化相互相関値が−1から0までの所定の値である請求項2に記載の発声検出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009100710A JP5180139B2 (ja) | 2009-04-17 | 2009-04-17 | 発声検出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009100710A JP5180139B2 (ja) | 2009-04-17 | 2009-04-17 | 発声検出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010250152A JP2010250152A (ja) | 2010-11-04 |
JP5180139B2 true JP5180139B2 (ja) | 2013-04-10 |
Family
ID=43312538
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009100710A Expired - Fee Related JP5180139B2 (ja) | 2009-04-17 | 2009-04-17 | 発声検出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5180139B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9674607B2 (en) | 2014-01-28 | 2017-06-06 | Mitsubishi Electric Corporation | Sound collecting apparatus, correction method of input signal of sound collecting apparatus, and mobile equipment information system |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3588576B2 (ja) * | 2000-04-28 | 2004-11-10 | 日本電信電話株式会社 | 収音装置および収音方法 |
JP2005227512A (ja) * | 2004-02-12 | 2005-08-25 | Yamaha Motor Co Ltd | 音信号処理方法及びその装置、音声認識装置並びにプログラム |
-
2009
- 2009-04-17 JP JP2009100710A patent/JP5180139B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010250152A (ja) | 2010-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5666444B2 (ja) | 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法 | |
EP1208563B1 (en) | Noisy acoustic signal enhancement | |
US9959886B2 (en) | Spectral comb voice activity detection | |
JP4279357B2 (ja) | 特に補聴器における雑音を低減する装置および方法 | |
JP5870476B2 (ja) | 雑音推定装置、雑音推定方法および雑音推定プログラム | |
JP5156043B2 (ja) | 音声判別装置 | |
EP1973104B1 (en) | Method and apparatus for estimating noise by using harmonics of a voice signal | |
JPH09212196A (ja) | 雑音抑圧装置 | |
EP3411876B1 (en) | Babble noise suppression | |
JP2011033717A (ja) | 雑音抑圧装置 | |
US8326621B2 (en) | Repetitive transient noise removal | |
JP6174856B2 (ja) | 雑音抑制装置、その制御方法、及びプログラム | |
EP3757993B1 (en) | Pre-processing for automatic speech recognition | |
US20120095753A1 (en) | Noise power estimation system, noise power estimating method, speech recognition system and speech recognizing method | |
JP2005257817A (ja) | 雑音除去装置、方法、及びプログラム | |
JP5180139B2 (ja) | 発声検出装置 | |
JP5271734B2 (ja) | 話者方向推定装置 | |
CN111508512A (zh) | 语音信号中的摩擦音检测 | |
JP5234788B2 (ja) | 暗騒音推定装置 | |
JP6439174B2 (ja) | 音声強調装置、および音声強調方法 | |
CN111226278B (zh) | 低复杂度的浊音语音检测和基音估计 | |
JP5439221B2 (ja) | 発声検出装置 | |
Krishnamoorthy et al. | Modified spectral subtraction method for enhancement of noisy speech | |
JP7435948B2 (ja) | 収音装置、収音方法及び収音プログラム | |
Hamid et al. | Noise estimation for Speech Enhancement by the Estimated Degree of Noise without Voice Activity Detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120111 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121005 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121016 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121211 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130110 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5180139 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |