JP6542705B2 - 発話検出装置、発話検出方法、プログラム、記録媒体 - Google Patents
発話検出装置、発話検出方法、プログラム、記録媒体 Download PDFInfo
- Publication number
- JP6542705B2 JP6542705B2 JP2016077462A JP2016077462A JP6542705B2 JP 6542705 B2 JP6542705 B2 JP 6542705B2 JP 2016077462 A JP2016077462 A JP 2016077462A JP 2016077462 A JP2016077462 A JP 2016077462A JP 6542705 B2 JP6542705 B2 JP 6542705B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- power spectrum
- power
- microphone
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
以下、図1〜図2を参照して実施形態1の発話検出装置100を説明する。図1は、発話検出装置100の構成を示すブロック図である。図2は、発話検出装置100の動作を示すフローチャートである。図1に示すように発話検出装置100は、周波数領域変換部110−1、…、110−Nと、パワースペクトル計算部120−1、…、120−Nと、パワースペクトル記録部130−1、…、130−Nと、発話チャネル影響量計算部140と、発話チャネル影響量減算部150−1、…、150−Nと、パワー計算部160−1、…、160−Nと、最大パワー検出部170を含む(ただし、Nは2以上の整数とする)。発話検出装置100は、発話者の音声を収音信号として収音するためにマイクロホン910−1、…、910−Nに接続している。
<実施形態2>
マイクロホンで収音される信号には、発話者の発話音声以外に空調の音やパソコンのファンの音などの定常雑音が含まれている。そこで、定常雑音を推定し、パワースペクトルPn(ω)から定常雑音を除去したものを用いて補正後パワースペクトルYn(ω)を計算する。これにより、空調やファンの音による誤動作を防ぐことができる。
実施形態1では、減算係数を事前に減算係数記録部190に記録しているものとした。しかし、このように減算係数を事前に設定したものに固定すると、配置変更などマイクロホンの相対的位置関係が変わるような場合、発話チャネル影響量αmn・Ym(ω)を正しく計算することができなくなる。そこで、発話を検出したチャネルのパワースペクトルの平均と当該チャネルを含むすべてのチャネルのパワースペクトルの平均の比を適宜計算し、この比を減算係数として減係数テーブルを更新する。これにより、マイクロホンの相対的位置関係に変動があった場合でも発話チャネル影響量αmn・Ym(ω)を正しく計算することができるようになる。
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD−ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
110 周波数領域変換部
120 パワースペクトル計算部
130 パワースペクトル記録部
140 発話チャネル影響量計算部
141 発話チャネルパワースペクトル選択部
142 発話チャネルパワースペクトル記録部
143 減算係数乗算部
150 発話チャネル影響量減算部
160 パワー計算部
170 最大パワー検出部
190 減算係数記録部
200 発話検出装置
230 定常雑音推定部
235 時間平均パワー計算部
236 ディップホールド処理部
239 重み記録部
240 定常雑音減算部
300 発話検出装置
330 減算係数更新部
331 平均パワー計算部
332 パワー比計算部
910 マイクロホン
Claims (7)
- Nを2以上の整数とし、
マイクロホンn(n=1,…,N)で収音した収音信号を用いて発話があったマイクロホンを発話チャネルとして検出する発話検出装置であって、
前記マイクロホンnで収音した収音信号を周波数領域変換した周波数変換信号Xn(ω)(ωは周波数)のパワースペクトルPn(ω)を補正後パワースペクトルYn(ω)の初期値とし、
前記補正後パワースペクトルYn(ω)から前記発話チャネルに対応する周波数領域信号のパワースペクトルである発話チャネルスペクトルの影響である発話チャネル影響量を減算することにより、前記補正後パワースペクトルYn(ω)を更新する発話チャネル影響量減算部と、
前記補正後パワースペクトルYn(ω)から周波数平均パワーZnを計算するパワー計算部と、
前記周波数平均パワーZnが最大となるmを選択し、マイクロホンm(mは1以上N以下の整数)を前記発話チャネルとして検出する最大パワー検出部と
を含む発話検出装置。 - Nを2以上の整数とし、
マイクロホンn(n=1,…,N)で収音した収音信号を用いて発話があったマイクロホンを発話チャネルとして検出する発話検出装置であって、
Rn(ω)をマイクロホンnで収音される定常雑音成分とし、
前記マイクロホンnで収音した収音信号を周波数領域変換した周波数変換信号Xn(ω)(ωは周波数)のパワースペクトルPn(ω)から前記定常雑音成分Rn(ω)を減算した値を補正後パワースペクトルYn(ω)の初期値とし、
前記補正後パワースペクトルYn(ω)から前記発話チャネルに対応する周波数領域信号のパワースペクトルである発話チャネルスペクトルの影響である発話チャネル影響量を減算することにより、前記補正後パワースペクトルYn(ω)を更新する発話チャネル影響量減算部と、
前記補正後パワースペクトルYn(ω)から周波数平均パワーZnを計算するパワー計算部と、
前記周波数平均パワーZnが最大となるmを選択し、マイクロホンm(mは1以上N以下の整数)を前記発話チャネルとして検出する最大パワー検出部と
を含む発話検出装置。 - 請求項1または2に記載の発話検出装置であって、
αmnをマイクロホンmとマイクロホンnの相対的位置に応じて定まる減算係数とし、
前記発話チャネル影響量は、αmn・Pm(ω)として計算されることを特徴とする発話検出装置。 - 請求項3に記載の発話検出装置であって、
さらに、
前記パワースペクトルPn(ω)の時間周波数平均である平均パワースペクトルQnから計算される比Qn/Qmを前記減算係数αmnとして更新する減算係数更新部を含む発話検出装置。 - Nを2以上の整数とし、
発話チャネル影響量減算部と、パワー計算部と、最大パワー検出部とを含む発話検出装置が、マイクロホンn(n=1,…,N)で収音した収音信号を用いて発話があったマイクロホンを発話チャネルとして検出する発話検出方法であって、
前記マイクロホンnで収音した収音信号を周波数領域変換した周波数変換信号Xn(ω)(ωは周波数)のパワースペクトルPn(ω)を補正後パワースペクトルYn(ω)の初期値とし、
前記発話チャネル影響量減算部が、前記補正後パワースペクトルYn(ω)から前記発話チャネルに対応する周波数領域信号のパワースペクトルである発話チャネルスペクトルの影響である発話チャネル影響量を減算することにより、前記補正後パワースペクトルYn(ω)を更新する発話チャネル影響量減算ステップと、
前記パワー計算部が、前記補正後パワースペクトルYn(ω)から周波数平均パワーZnを計算するパワー計算ステップと、
前記最大パワー検出部が、前記周波数平均パワーZnが最大となるmを選択し、マイクロホンm(mは1以上N以下の整数)を前記発話チャネルとして検出する最大パワー検出ステップと
を含む発話検出方法。 - 請求項1ないし4のいずれか1項に記載の発話検出装置としてコンピュータを機能させるためのプログラム。
- 請求項6に記載したいずれかのプログラムを記録したコンピュータで読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016077462A JP6542705B2 (ja) | 2016-04-07 | 2016-04-07 | 発話検出装置、発話検出方法、プログラム、記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016077462A JP6542705B2 (ja) | 2016-04-07 | 2016-04-07 | 発話検出装置、発話検出方法、プログラム、記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017187688A JP2017187688A (ja) | 2017-10-12 |
JP6542705B2 true JP6542705B2 (ja) | 2019-07-10 |
Family
ID=60046395
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016077462A Active JP6542705B2 (ja) | 2016-04-07 | 2016-04-07 | 発話検出装置、発話検出方法、プログラム、記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6542705B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7001029B2 (ja) | 2018-09-11 | 2022-01-19 | 日本電信電話株式会社 | キーワード検出装置、キーワード検出方法、およびプログラム |
-
2016
- 2016-04-07 JP JP2016077462A patent/JP6542705B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017187688A (ja) | 2017-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5452655B2 (ja) | 音声状態モデルを使用したマルチセンサ音声高品質化 | |
CN103650040B (zh) | 使用多特征建模分析语音/噪声可能性的噪声抑制方法和装置 | |
RU2407074C2 (ru) | Улучшение речи с помощью нескольких датчиков с использованием предшествующей чистой речи | |
JP6668995B2 (ja) | 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム | |
JP6135106B2 (ja) | 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム | |
JP4787851B2 (ja) | エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置と、装置プログラムと記録媒体 | |
JP2013250548A (ja) | 処理装置、処理方法、プログラム及び処理システム | |
US9601124B2 (en) | Acoustic matching and splicing of sound tracks | |
CN113613112B (zh) | 抑制麦克风的风噪的方法和电子装置 | |
JP6542705B2 (ja) | 発話検出装置、発話検出方法、プログラム、記録媒体 | |
JP5769671B2 (ja) | エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム | |
JP5889224B2 (ja) | エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム | |
JP5769672B2 (ja) | エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム | |
JP5769670B2 (ja) | エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム | |
JP4051325B2 (ja) | 話者位置検出方法、装置、プログラム、および記録媒体 | |
JP5044594B2 (ja) | 多チャネルエコー消去装置とその方法、そのプログラム | |
JP6537997B2 (ja) | エコー抑圧装置、その方法、プログラム、及び記録媒体 | |
JP6556657B2 (ja) | 音源分離装置、音源分離方法、プログラム、記録媒体 | |
CN110265048B (zh) | 回声消除方法、装置、设备及存储介质 | |
JP5562451B1 (ja) | エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム | |
JP4478071B2 (ja) | エコー抑圧装置、エコー抑圧方法、エコー抑圧プログラムおよびその記録媒体 | |
JP7235117B2 (ja) | エコー消去装置、エコー消去方法、プログラム | |
JP5097148B2 (ja) | 音響結合量算出装置とその方法と、プログラム | |
CN112544088B (zh) | 拾音扩音装置、其方法以及记录介质 | |
WO2023013019A1 (ja) | 発話フィードバック装置、発話フィードバック方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180626 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190513 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190611 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190613 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6542705 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |