JP2019117317A - Snr推定装置、snr推定方法、プログラム - Google Patents
Snr推定装置、snr推定方法、プログラム Download PDFInfo
- Publication number
- JP2019117317A JP2019117317A JP2017251645A JP2017251645A JP2019117317A JP 2019117317 A JP2019117317 A JP 2019117317A JP 2017251645 A JP2017251645 A JP 2017251645A JP 2017251645 A JP2017251645 A JP 2017251645A JP 2019117317 A JP2019117317 A JP 2019117317A
- Authority
- JP
- Japan
- Prior art keywords
- snr
- voice
- signal
- pose
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
Description
音声区間検出部11は、クリーン音声信号を受信し、クリーン音声信号の音声区間と無音声区間を検出する(S11、図5参照)。例えば、音声区間検出部11は、クリーン音声信号の各フレームのパワーを算出し、予め規定されたしきい値を元に、各フレームを無音、パワー小、パワー中、パワー大に分類し、無音と分類されたフレーム(複数フレーム連続している場合にはその区間)を無音声区間とし、それ以外のフレーム(複数フレーム連続している場合にはその区間)を音声区間として検出してもよい。
無音声区間分類部12は、ステップS11における検出結果を取得し、無音声区間を、音声区間に挟まれた無音声区間(別の表現では、発話区間内の短時間無音声区間)である第1ポーズ、それ以外の無音声区間であるサイレントの何れかに分類する(S12、図5参照)。さらに、無音声区間分類部12はサイレントと分類されたフレームのうち、所定の区間(例えば、発話区間の直前直後の数十ミリ秒、数十フレームの区間、図5、図6におけるドットハッチングの区間)を第2ポーズと分類する(S12)。
第1ポーズフレーム数判定部13は、ステップS12における分類結果を取得し、クリーン音声信号に第1ポーズのフレームが所定のフレーム数以上存在するか否かを判定する(S13)。具体的には、第1ポーズフレーム数判定部13は、第1ポーズがG.160に規定されるフレーム数以上存在するか否かを判定する。
SNR算出部14は、ステップS11における検出結果、ステップS12における分類結果、ステップS13における判定結果を取得し、第1ポーズのフレームが所定のフレーム数以上存在する場合に、第1ポーズに基づいて収録信号のSNRを算出し、第1ポーズのフレームが所定のフレーム数以上存在しない場合に、少なくとも第2ポーズに基づいて収録信号のSNRを算出する(S14)。
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD−ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
Claims (4)
- スピーカーから再生される前の信号であるクリーン音声信号と、前記クリーン音声信号を前記スピーカーで再生してマイクロホンで収録した信号である収録信号を用いるSNR推定装置であって、
前記クリーン音声信号の音声区間と無音声区間を検出する音声区間検出部と、
前記無音声区間を、前記音声区間に挟まれた前記無音声区間である第1ポーズ、それ以外の前記無音声区間であるサイレントの何れかに分類し、前記サイレントのうち、前記クリーン音声信号の最初のフレームと最後のフレームに該当するフレームを除く所定の区間を第2ポーズに分類する無音声区間分類部と、
前記クリーン音声信号に前記第1ポーズのフレームが所定のフレーム数以上存在するか否かを判定する第1ポーズフレーム数判定部と、
前記第1ポーズのフレームが所定のフレーム数以上存在する場合に、前記第1ポーズに基づいて前記収録信号のSNRを算出し、前記第1ポーズのフレームが所定のフレーム数以上存在しない場合に、少なくとも前記第2ポーズに基づいて前記収録信号の前記SNRを算出するSNR算出部を含む
SNR推定装置。 - 請求項1に記載のSNR推定装置であって、
前記無音声区間分類部は、
前記サイレントのうち、前記音声区間に隣接するフレームを含む所定の区間を前記第2ポーズに分類する
SNR推定装置。 - スピーカーから再生される前の信号であるクリーン音声信号と、前記クリーン音声信号を前記スピーカーで再生してマイクロホンで収録した信号である収録信号を用いるSNR推定方法であって、
前記クリーン音声信号の音声区間と無音声区間を検出する音声区間検出ステップと、
前記無音声区間を、前記音声区間に挟まれた前記無音声区間である第1ポーズ、それ以外の前記無音声区間であるサイレントの何れかに分類し、前記サイレントのうち、前記クリーン音声信号の最初のフレームと最後のフレームに該当するフレームを除く所定の区間を第2ポーズに分類する無音声区間分類ステップと、
前記クリーン音声信号に前記第1ポーズのフレームが所定のフレーム数以上存在するか否かを判定する第1ポーズフレーム数判定ステップと、
前記第1ポーズのフレームが所定のフレーム数以上存在する場合に、前記第1ポーズに基づいて前記収録信号のSNRを算出し、前記第1ポーズのフレームが所定のフレーム数以上存在しない場合に、少なくとも前記第2ポーズに基づいて前記収録信号の前記SNRを算出するSNR算出ステップを含む
SNR推定方法。 - コンピュータを請求項1または2に記載のSNR推定装置として機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017251645A JP6802145B2 (ja) | 2017-12-27 | 2017-12-27 | Snr推定装置、snr推定方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017251645A JP6802145B2 (ja) | 2017-12-27 | 2017-12-27 | Snr推定装置、snr推定方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019117317A true JP2019117317A (ja) | 2019-07-18 |
JP6802145B2 JP6802145B2 (ja) | 2020-12-16 |
Family
ID=67304375
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017251645A Active JP6802145B2 (ja) | 2017-12-27 | 2017-12-27 | Snr推定装置、snr推定方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6802145B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002527785A (ja) * | 1998-10-13 | 2002-08-27 | エヌシーティー グループ インコーポレーテッド | 情報信号にある休止期間の間にノイズ推定値を更新する方法とシステム |
JP2013062609A (ja) * | 2011-09-12 | 2013-04-04 | Yawata Electric Industrial Co Ltd | 放送音声の音量制御装置、及びその音量制御方法 |
-
2017
- 2017-12-27 JP JP2017251645A patent/JP6802145B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002527785A (ja) * | 1998-10-13 | 2002-08-27 | エヌシーティー グループ インコーポレーテッド | 情報信号にある休止期間の間にノイズ推定値を更新する方法とシステム |
JP2013062609A (ja) * | 2011-09-12 | 2013-04-04 | Yawata Electric Industrial Co Ltd | 放送音声の音量制御装置、及びその音量制御方法 |
Non-Patent Citations (3)
Title |
---|
"Voice enhancement devices Amendment 2: Revised Appendix II - Objective measures for the characteriza", RECOMMENDATION ITU-T G.160 (2008) AMENDMENT 2, JPN6020045210, 11 March 2011 (2011-03-11), ISSN: 0004393089 * |
SAITO, SHOICHIRO ET AL.: ""Noise suppressing microphone array for highly noisy environments using power spectrum density estim", PROC. OF 2017 IEEE INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS (ICCE), JPN6020045212, 8 January 2017 (2017-01-08), ISSN: 0004393091 * |
齊藤翔一郎 他: ""局所PSD推定を利用した高騒音環境用雑音抑圧マイクロホンの実装"", 日本音響学会2016年秋季研究発表会講演論文集CD-ROM, JPN6020045211, 16 September 2016 (2016-09-16), pages 519 - 520, ISSN: 0004393090 * |
Also Published As
Publication number | Publication date |
---|---|
JP6802145B2 (ja) | 2020-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11670325B2 (en) | Voice activity detection using a soft decision mechanism | |
JP6958723B2 (ja) | 信号処理システム、信号処理装置、信号処理方法、およびプログラム | |
JP4572218B2 (ja) | 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体 | |
JP6812381B2 (ja) | 音声認識精度劣化要因推定装置、音声認識精度劣化要因推定方法、プログラム | |
JP6495792B2 (ja) | 音声認識装置、音声認識方法、プログラム | |
JP6553015B2 (ja) | 話者属性推定システム、学習装置、推定装置、話者属性推定方法、およびプログラム | |
JP2010266522A (ja) | 対話状態分割装置とその方法、そのプログラムと記録媒体 | |
JP6676009B2 (ja) | 話者判定装置、話者判定情報生成方法、プログラム | |
JP7409381B2 (ja) | 発話区間検出装置、発話区間検出方法、プログラム | |
US11037583B2 (en) | Detection of music segment in audio signal | |
JP6996570B2 (ja) | 緊急度推定装置、緊急度推定方法、プログラム | |
JP6802145B2 (ja) | Snr推定装置、snr推定方法、プログラム | |
JP6216809B2 (ja) | パラメータ調整システム、パラメータ調整方法、プログラム | |
CN111553144A (zh) | 基于人工智能的话题挖掘方法、装置及电子设备 | |
Yadava et al. | Performance evaluation of spectral subtraction with VAD and time–frequency filtering for speech enhancement | |
JP7279800B2 (ja) | 学習装置、推定装置、それらの方法、およびプログラム | |
JP7151606B2 (ja) | コマンド解析装置、コマンド解析方法、プログラム | |
JP6257537B2 (ja) | 顕著度推定方法、顕著度推定装置、プログラム | |
WO2018216511A1 (ja) | 属性識別装置、属性識別方法、プログラム | |
JP6618885B2 (ja) | 音声区間検出装置、音声区間検出方法、プログラム | |
JP4981850B2 (ja) | 音声認識装置とその方法と、プログラムと記録媒体 | |
JP6538002B2 (ja) | 目的音集音装置、目的音集音方法、プログラム、記録媒体 | |
JP7176629B2 (ja) | 識別モデル学習装置、識別装置、識別モデル学習方法、識別方法、プログラム | |
JP7218810B2 (ja) | 音声非音声判定装置、音声非音声判定用モデルパラメータ学習装置、音声非音声判定方法、音声非音声判定用モデルパラメータ学習方法、プログラム | |
JP2020052611A (ja) | タグ推定装置、タグ推定方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200207 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201126 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6802145 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |