JP5271734B2 - 話者方向推定装置 - Google Patents
話者方向推定装置 Download PDFInfo
- Publication number
- JP5271734B2 JP5271734B2 JP2009020305A JP2009020305A JP5271734B2 JP 5271734 B2 JP5271734 B2 JP 5271734B2 JP 2009020305 A JP2009020305 A JP 2009020305A JP 2009020305 A JP2009020305 A JP 2009020305A JP 5271734 B2 JP5271734 B2 JP 5271734B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- unit
- cross
- speaker direction
- correlation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 claims description 47
- 230000002087 whitening effect Effects 0.000 claims description 21
- 238000001228 spectrum Methods 0.000 claims description 12
- 238000000034 method Methods 0.000 description 19
- 238000005314 correlation function Methods 0.000 description 17
- 238000004364 calculation method Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 6
- 230000035945 sensitivity Effects 0.000 description 5
- 238000009434 installation Methods 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 230000003321 amplification Effects 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 101100161473 Arabidopsis thaliana ABCB25 gene Proteins 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Description
前記相互相関計算部の出力により話者方向を推定する話者方向推定部を具備する話者方向推定装置を提供する。
そこで、ATM3の上部左右両端に設置した2つのマイクロホン2からの音声信号を解析することで、ATM3の正面にて携帯電話で被害者が発声していることを正確に検知するものである。
Fourier Transform)処理を行う。その後、FFT(Fast Fourier Transform)処理の結果に対してスペクトル包絡にて除算することで、音声信号を白色化する。
数式1は、正規化相互相関関数をフーリエ変換した結果の一般式である。
10・・・増幅器
11・・・A/Dコンバータ
12・・・フレーム切出部
13・・・白色化処理部
14・・・低域カット処理部
15・・・パワー計算部
16・・・ノイズレベル推定部
17・・・純音付加部
18・・・相互相関計算部
19・・・話者方向推定部
2・・・マイクロホン
3・・・ATM
4・・・話者
Claims (3)
- 複数の集音器から取得した音声信号の話者方向を推定する装置であって、
前記集音器ごとに、白色化処理部にて白色化した音声信号の低周波数域成分をカットする低域カット処理部と、
前記低域カット処理部にてカットした低周波数域の人工信号を当該音声信号に付加する人工信号付加部と、
前記複数の集音器からの前記人工信号が付加された音声信号について相互相関を計算する相互相関計算部と、
前記相互相関計算部の出力により話者方向を推定する話者方向推定部と、
を具備することを特徴とした話者方向推定装置。 - 更に、前記集音器ごとに、前記音声信号のパワー情報の時間平均からノイズレベルを推定するノイズレベル推定部を有し、
前記人工信号付加部は、前記ノイズレベル推定部が推定したノイズレベルが高いと前記人工信号のレベルを高く、
前記ノイズレベルが低いと前記人工信号のレベルが低くなるように人工信号のレベルを制御する請求項1に記載の話者方向推定装置。 - 前記白色化処理部は、前記白色化した音声信号に対し周波数軸上においてスペクトル強度に右肩下がりの傾斜を更に付ける請求項1または請求項2に記載の話者方向推定装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009020305A JP5271734B2 (ja) | 2009-01-30 | 2009-01-30 | 話者方向推定装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009020305A JP5271734B2 (ja) | 2009-01-30 | 2009-01-30 | 話者方向推定装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010175465A JP2010175465A (ja) | 2010-08-12 |
JP5271734B2 true JP5271734B2 (ja) | 2013-08-21 |
Family
ID=42706576
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009020305A Active JP5271734B2 (ja) | 2009-01-30 | 2009-01-30 | 話者方向推定装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5271734B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2647213C2 (ru) * | 2012-07-24 | 2018-03-14 | Конинклейке Филипс Н.В. | Направленное маскирование звука |
CN104200813B (zh) * | 2014-07-01 | 2017-05-10 | 东北大学 | 基于声源方向实时预测跟踪的动态盲信号分离方法 |
JP6969597B2 (ja) * | 2017-07-31 | 2021-11-24 | 日本電信電話株式会社 | 音響信号処理装置、方法及びプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58181099A (ja) * | 1982-04-16 | 1983-10-22 | 三菱電機株式会社 | 音声識別装置 |
JPH04322599A (ja) * | 1991-04-22 | 1992-11-12 | Matsushita Electric Ind Co Ltd | 話者方位検出装置 |
JP4815661B2 (ja) * | 2000-08-24 | 2011-11-16 | ソニー株式会社 | 信号処理装置及び信号処理方法 |
JP4729927B2 (ja) * | 2005-01-11 | 2011-07-20 | ソニー株式会社 | 音声検出装置、自動撮像装置、および音声検出方法 |
-
2009
- 2009-01-30 JP JP2009020305A patent/JP5271734B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010175465A (ja) | 2010-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9959886B2 (en) | Spectral comb voice activity detection | |
US8065115B2 (en) | Method and system for identifying audible noise as wind noise in a hearing aid apparatus | |
JP5519689B2 (ja) | 音響処理装置、音響処理方法及び補聴器 | |
KR101905234B1 (ko) | 풍 잡음 검출을 위한 방법 및 장치 | |
EP1208563B1 (en) | Noisy acoustic signal enhancement | |
US8762137B2 (en) | Target voice extraction method, apparatus and program product | |
JP5339501B2 (ja) | 音声収集方法、システム及びプログラム | |
JP5870476B2 (ja) | 雑音推定装置、雑音推定方法および雑音推定プログラム | |
US20090154726A1 (en) | System and Method for Noise Activity Detection | |
EP2083417B1 (en) | Sound processing device and program | |
JP2011033717A (ja) | 雑音抑圧装置 | |
JP4816711B2 (ja) | 通話音声処理装置および通話音声処理方法 | |
US9437213B2 (en) | Voice signal enhancement | |
KR101250668B1 (ko) | Gmm을 이용한 응급 단어 인식 방법 | |
JP5115818B2 (ja) | 音声信号強調装置 | |
JP5271734B2 (ja) | 話者方向推定装置 | |
US20170213556A1 (en) | Methods And Apparatus For Speech Segmentation Using Multiple Metadata | |
JP2012113173A (ja) | 雑音抑制装置、雑音抑制方法、及びプログラム | |
JP5234788B2 (ja) | 暗騒音推定装置 | |
JP5180139B2 (ja) | 発声検出装置 | |
CN111226278B (zh) | 低复杂度的浊音语音检测和基音估计 | |
JP3520430B2 (ja) | 左右音像方向抽出方法 | |
Zhang et al. | Fundamental frequency estimation combining air-conducted speech with bone-conducted speech in noisy environment | |
JP5439221B2 (ja) | 発声検出装置 | |
KR100345402B1 (ko) | 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120111 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130411 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130430 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130513 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5271734 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |