JP6802145B2 - Snr推定装置、snr推定方法、プログラム - Google Patents
Snr推定装置、snr推定方法、プログラム Download PDFInfo
- Publication number
- JP6802145B2 JP6802145B2 JP2017251645A JP2017251645A JP6802145B2 JP 6802145 B2 JP6802145 B2 JP 6802145B2 JP 2017251645 A JP2017251645 A JP 2017251645A JP 2017251645 A JP2017251645 A JP 2017251645A JP 6802145 B2 JP6802145 B2 JP 6802145B2
- Authority
- JP
- Japan
- Prior art keywords
- section
- snr
- signal
- pose
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Description
音声区間検出部11は、クリーン音声信号を受信し、クリーン音声信号の音声区間と無音声区間を検出する(S11、図5参照)。例えば、音声区間検出部11は、クリーン音声信号の各フレームのパワーを算出し、予め規定されたしきい値を元に、各フレームを無音、パワー小、パワー中、パワー大に分類し、無音と分類されたフレーム(複数フレーム連続している場合にはその区間)を無音声区間とし、それ以外のフレーム(複数フレーム連続している場合にはその区間)を音声区間として検出してもよい。
無音声区間分類部12は、ステップS11における検出結果を取得し、無音声区間を、音声区間に挟まれた無音声区間(別の表現では、発話区間内の短時間無音声区間)である第1ポーズ、それ以外の無音声区間であるサイレントの何れかに分類する(S12、図5参照)。さらに、無音声区間分類部12はサイレントと分類されたフレームのうち、所定の区間(例えば、発話区間の直前直後の数十ミリ秒、数十フレームの区間、図5、図6におけるドットハッチングの区間)を第2ポーズと分類する(S12)。
第1ポーズフレーム数判定部13は、ステップS12における分類結果を取得し、クリーン音声信号に第1ポーズのフレームが所定のフレーム数以上存在するか否かを判定する(S13)。具体的には、第1ポーズフレーム数判定部13は、第1ポーズがG.160に規定されるフレーム数以上存在するか否かを判定する。
SNR算出部14は、ステップS11における検出結果、ステップS12における分類結果、ステップS13における判定結果を取得し、第1ポーズのフレームが所定のフレーム数以上存在する場合に、第1ポーズに基づいて収録信号のSNRを算出し、第1ポーズのフレームが所定のフレーム数以上存在しない場合に、少なくとも第2ポーズに基づいて収録信号のSNRを算出する(S14)。
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD−ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
Claims (4)
- スピーカーから再生される前の信号であるクリーン音声信号と、前記クリーン音声信号を前記スピーカーで再生してマイクロホンで収録した信号である収録信号を用いるSNR推定装置であって、
前記クリーン音声信号の音声区間と無音声区間を検出する音声区間検出部と、
前記無音声区間を、前記音声区間に挟まれた前記無音声区間である第1ポーズ、それ以外の前記無音声区間であるサイレントの何れかに分類し、前記サイレントのうち、前記クリーン音声信号の最初のフレームと最後のフレームに該当するフレームを除く所定の区間を第2ポーズに分類する無音声区間分類部と、
前記クリーン音声信号に前記第1ポーズのフレームが所定のフレーム数以上存在するか否かを判定する第1ポーズフレーム数判定部と、
前記第1ポーズのフレームが所定のフレーム数以上存在する場合に、前記第1ポーズに基づいて前記収録信号のSNRを算出し、前記第1ポーズのフレームが所定のフレーム数以上存在しない場合に、少なくとも前記第2ポーズに基づいて前記収録信号の前記SNRを算出するSNR算出部を含む
SNR推定装置。 - 請求項1に記載のSNR推定装置であって、
前記無音声区間分類部は、
前記サイレントのうち、前記音声区間に隣接するフレームを含む所定の区間を前記第2ポーズに分類する
SNR推定装置。 - スピーカーから再生される前の信号であるクリーン音声信号と、前記クリーン音声信号を前記スピーカーで再生してマイクロホンで収録した信号である収録信号を用いるSNR推定方法であって、
前記クリーン音声信号の音声区間と無音声区間を検出する音声区間検出ステップと、
前記無音声区間を、前記音声区間に挟まれた前記無音声区間である第1ポーズ、それ以外の前記無音声区間であるサイレントの何れかに分類し、前記サイレントのうち、前記クリーン音声信号の最初のフレームと最後のフレームに該当するフレームを除く所定の区間を第2ポーズに分類する無音声区間分類ステップと、
前記クリーン音声信号に前記第1ポーズのフレームが所定のフレーム数以上存在するか否かを判定する第1ポーズフレーム数判定ステップと、
前記第1ポーズのフレームが所定のフレーム数以上存在する場合に、前記第1ポーズに基づいて前記収録信号のSNRを算出し、前記第1ポーズのフレームが所定のフレーム数以上存在しない場合に、少なくとも前記第2ポーズに基づいて前記収録信号の前記SNRを算出するSNR算出ステップを含む
SNR推定方法。 - コンピュータを請求項1または2に記載のSNR推定装置として機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017251645A JP6802145B2 (ja) | 2017-12-27 | 2017-12-27 | Snr推定装置、snr推定方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017251645A JP6802145B2 (ja) | 2017-12-27 | 2017-12-27 | Snr推定装置、snr推定方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019117317A JP2019117317A (ja) | 2019-07-18 |
JP6802145B2 true JP6802145B2 (ja) | 2020-12-16 |
Family
ID=67304375
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017251645A Active JP6802145B2 (ja) | 2017-12-27 | 2017-12-27 | Snr推定装置、snr推定方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6802145B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6108610A (en) * | 1998-10-13 | 2000-08-22 | Noise Cancellation Technologies, Inc. | Method and system for updating noise estimates during pauses in an information signal |
JP2013062609A (ja) * | 2011-09-12 | 2013-04-04 | Yawata Electric Industrial Co Ltd | 放送音声の音量制御装置、及びその音量制御方法 |
-
2017
- 2017-12-27 JP JP2017251645A patent/JP6802145B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019117317A (ja) | 2019-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200357427A1 (en) | Voice Activity Detection Using A Soft Decision Mechanism | |
JP4202090B2 (ja) | スムージングフィルタを用いた音声合成システム及びその方法並びにスムージングフィルタ特性制御装置及びその方法 | |
JP4972107B2 (ja) | 通話状態判定装置、通話状態判定方法、プログラム、記録媒体 | |
JP6958723B2 (ja) | 信号処理システム、信号処理装置、信号処理方法、およびプログラム | |
JP6812381B2 (ja) | 音声認識精度劣化要因推定装置、音声認識精度劣化要因推定方法、プログラム | |
JP4769673B2 (ja) | オーディオ信号補間方法及びオーディオ信号補間装置 | |
JP6495792B2 (ja) | 音声認識装置、音声認識方法、プログラム | |
Ragano et al. | Adapting the quality of experience framework for audio archive evaluation | |
WO2021014612A1 (ja) | 発話区間検出装置、発話区間検出方法、プログラム | |
US11037583B2 (en) | Detection of music segment in audio signal | |
WO2019107170A1 (ja) | 緊急度推定装置、緊急度推定方法、プログラム | |
JP6802145B2 (ja) | Snr推定装置、snr推定方法、プログラム | |
JP7151606B2 (ja) | コマンド解析装置、コマンド解析方法、プログラム | |
Yadava et al. | Performance evaluation of spectral subtraction with VAD and time–frequency filtering for speech enhancement | |
JP6257537B2 (ja) | 顕著度推定方法、顕著度推定装置、プログラム | |
JP6538002B2 (ja) | 目的音集音装置、目的音集音方法、プログラム、記録媒体 | |
JP6618885B2 (ja) | 音声区間検出装置、音声区間検出方法、プログラム | |
JP4981850B2 (ja) | 音声認識装置とその方法と、プログラムと記録媒体 | |
JP6695830B2 (ja) | 音声認識精度劣化要因推定装置、音声認識精度劣化要因推定方法、プログラム | |
JP2020052611A (ja) | タグ推定装置、タグ推定方法、プログラム | |
JP7176629B2 (ja) | 識別モデル学習装置、識別装置、識別モデル学習方法、識別方法、プログラム | |
JP7218810B2 (ja) | 音声非音声判定装置、音声非音声判定用モデルパラメータ学習装置、音声非音声判定方法、音声非音声判定用モデルパラメータ学習方法、プログラム | |
JP7026358B2 (ja) | 回帰関数学習装置、回帰関数学習方法、プログラム | |
JP2017207546A (ja) | 残響環境判定装置、残響環境判定方法、プログラム | |
JP2019090930A (ja) | 音源強調装置、音源強調学習装置、音源強調方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200207 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201126 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6802145 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |