JP2009210836A - 音声検出方法、音声検出装置および音声検出プログラム - Google Patents
音声検出方法、音声検出装置および音声検出プログラム Download PDFInfo
- Publication number
- JP2009210836A JP2009210836A JP2008054109A JP2008054109A JP2009210836A JP 2009210836 A JP2009210836 A JP 2009210836A JP 2008054109 A JP2008054109 A JP 2008054109A JP 2008054109 A JP2008054109 A JP 2008054109A JP 2009210836 A JP2009210836 A JP 2009210836A
- Authority
- JP
- Japan
- Prior art keywords
- autocorrelation
- acoustic signal
- voice
- unit
- continuity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】音響信号の入力を受け付けると、入力された当該音響信号と所定の時間間隔でずらした当該音響信号との相関の度合いを示す自己相関値を、複数の時間間隔各々に関して算出し、算出した自己相関値各々が、複数の時間間隔において極大値をとる場合に、当該極大値をとる場合の時間間隔でずらした各々の中から、全てもしくはいずれか複数の時間間隔でずらした音響信号各々を、音響信号の基本周期の候補である基本周期候補各々として選択し、選択した複数の基本周期候補各々の連続性を解析し、解析した連続性が所定の閾値以下の場合に、音声信号が含まれているか否かを検出する。
【選択図】 図1
Description
まず、図1を用いて、実施例1に係る音声検出装置の概要および特徴を説明する。図1は、実施例1に係る音声検出装置の概要および特徴を説明するための図である。
次に、図2〜図14を用いて、実施例1に係る音声検出装置の構成を説明する。図2は、実施例1に係る音声検出装置の構成を示すブロック図であり、図3は、自己相関の算出について説明するための図であり、図4は、自己相関の算出(雑音がある場合とない場合との比較)について説明するための図であり、図5は、自己相関が最大となる周期の時間変化について説明するための図であり、図6は、自己相関の平滑化について説明するための図であり、図7は、自己相関が極大となるラグの検出について説明するための図であり、図8は、基本周期候補の蓄積について説明するための図であり、図9は、基本周期の推移について説明するための図であり、図10は、連続する基本周期候補の解析方法について説明するための図であり、図11は、連続する基本周期候補の解析例(c1から始まる場合)について説明するための図であり、図12は、連続する基本周期候補の解析例について説明するための図であり、図13および図14は、連続性の算出方法について説明するための図である。
続いて、図15を用いて、実施例1に係る音声検出装置による処理の手順を説明する。図15は、実施例1に係る音声検出装置による処理の手順を示すフローチャートである。
上記してきたように、実施例1に係る音声検出装置によれば、相関値が最大となるラグを基本周期として選択してその時間変化を観測する一般的な手法とは異なり、複数のラグを基本周期候補として選択して基本周期候補各々の時間変化を観測する。この結果、実施例1に係る音声検出装置は、本来音声の基本周期ではないラグが基本周期として判断されてしまうおそれや、音声の基本周期が見落とされるおそれを回避することができるので、騒音下において適切に音声を検出することが可能になるのである。
って判別する手法に適用することが可能である。
さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。
また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき(例えば、音響信号波形サンプルの入力を手動的に行うなど)、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順(図15、図17など)、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、上記の実施例で説明した各種の処理は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。そこで、以下では、図18を用いて、上記の実施例と同様の機能を有する音声検出プログラムを実行するコンピュータの一例を説明する。図18は、音声検出プログラムを実行するコンピュータを示す図である。
前記自己相関算出部が、音響信号の入力を受け付けると、入力された当該音響信号と所定の時間間隔でずらした当該音響信号との相関の度合いを示す自己相関値を、複数の時間間隔各々に関して算出する自己相関算出工程と、
前記選択部が、前記自己相関算出工程によって算出された自己相関値各々が、複数の時間間隔において極大値をとる場合に、当該極大値をとる場合の時間間隔でずらした各々の中から、全てもしくはいずれか複数の時間間隔でずらした音響信号各々を、前記音響信号の基本周期の候補である基本周期候補各々として選択する選択工程と、
前記連続性解析部が、前記選択工程によって選択された複数の基本周期候補各々の連続性を解析する連続性解析工程と、
前記音声検出部が、前記連続性解析工程によって解析された連続性が所定の閾値以下の場合に、音声信号が含まれているか否かを検出する音声検出工程と、
を有することを特徴とする音声検出方法。
前記比較部が、前記連続性解析工程によって解析された結果として、前記基本周期候補の時間的な変化を示す軌跡が取得された場合に、音声の基本周期の時間的な変化を示す軌跡として標準的なパターンを記憶する音声パターン記憶部に記憶されている当該標準的なパターンと、取得された軌跡とを比較する比較工程をさらに含み、
前記音声検出工程は、前記比較工程によって比較された結果に基づいて、前記入力された音響信号に音声信号が含まれるか否かを検出することを特徴とする付記1〜4のいずれか一つに記載の音声検出方法。
前記出力部が、前記音声検出工程によって、前記入力された音響信号に音声が存在すると検出された場合に、当該検出の事実を所定の出力部に出力することで通知する通知工程をさらに含んだことを特徴とする付記1〜5のいずれか一つに記載の音声検出方法。
音響信号の入力を受け付けると、入力された当該音響信号と所定の時間間隔でずらした当該音響信号との相関の度合いを示す自己相関値を、複数の時間間隔各々に関して算出する自己相関算出手段と、
前記自己相関算出手段によって算出された自己相関値各々が、複数の時間間隔において極大値をとる場合に、当該極大値をとる場合の時間間隔でずらした各々の中から、全てもしくはいずれか複数の時間間隔でずらした音響信号各々を、前記音響信号の基本周期の候補である基本周期候補各々として選択する選択手段と、
前記選択手段によって選択された複数の基本周期候補各々の連続性を解析する連続性解析手段と、
前記連続性解析手段によって解析された連続性が所定の閾値以下の場合に、音声信号が含まれているか否かを検出する音声検出手段と、
を備えたことを特徴とする音声検出装置。
音響信号の入力を受け付けると、入力された当該音響信号と所定の時間間隔でずらした当該音響信号との相関の度合いを示す自己相関値を、複数の時間間隔各々に関して算出する自己相関算出手順と、
前記自己相関算出手順によって算出された自己相関値各々が、複数の時間間隔において極大値をとる場合に、当該極大値をとる場合の時間間隔でずらした各々の中から、全てもしくはいずれか複数の時間間隔でずらした音響信号各々を、前記音響信号の基本周期の候補である基本周期候補各々として選択する選択手順と、
前記選択手順によって選択された複数の基本周期候補各々の連続性を解析する連続性解析手順と、
前記連続性解析手順によって解析された連続性が所定の閾値以下の場合に、音声信号が含まれているか否かを検出する音声検出手順と、
をコンピュータに実行させることを特徴とする音声検出プログラム。
11 入力部
12 出力部
13 入出力制御I/F部
20 記憶部
21 音響信号波形サンプル記憶部
22 判定結果記憶部
30 制御部
31 A/D変換部
32 自己相関演算部
33 自己相関平滑化部
34 自己相関極大値算出部
35 基本周期候補選択部
36 連続性解析部
37 連続性判定部
40 音声検出プログラム(コンピュータ)
41 キャッシュ
42 HDD
43 RAM
44 ROM
45 CPU
46 バス
Claims (10)
- 自己相関算出部と選択部と連続性解析部と音声検出部とを備えたコンピュータが、音響信号に音声信号が含まれているか否かを検出する音声検出方法であって、
前記自己相関算出部が、音響信号の入力を受け付けると、入力された当該音響信号と所定の時間間隔でずらした当該音響信号との相関の度合いを示す自己相関値を、複数の時間間隔各々に関して算出する自己相関算出工程と、
前記選択部が、前記自己相関算出工程によって算出された自己相関値各々が、複数の時間間隔において極大値をとる場合に、当該極大値をとる場合の時間間隔でずらした各々の中から、全てもしくはいずれか複数の時間間隔でずらした音響信号各々を、前記音響信号の基本周期の候補である基本周期候補各々として選択する選択工程と、
前記連続性解析部が、前記選択工程によって選択された複数の基本周期候補各々の連続性を解析する連続性解析工程と、
前記音声検出部が、前記連続性解析工程によって解析された連続性が所定の閾値以下の場合に、音声信号が含まれているか否かを検出する音声検出工程と、
を有することを特徴とする音声検出方法。 - 前記自己相関算出工程は、前記入力された音響信号と前記所定の時間間隔でずらした音響信号とについて、当該入力された音響信号を単位時間に区分したフレームごとに分解し、当該フレームごとの音響信号ごとに複数の時間間隔各々に関して自己相関値を求める相関処理を行うことで、当該フレームごとに自己相関値を算出することを特徴とする請求項1に記載の音声検出方法。
- 前記選択工程は、前記フレームごとに算出された自己相関値各々が、複数の時間間隔において極大値をとる場合に、当該極大値をとる場合の時間間隔でずらした各々の中から、全てもしくはいずれか複数の時間間隔でずらした音響信号各々を、当該フレームごとの前記基本周期候補各々として選択することを特徴とする請求項2に記載の音声検出方法。
- 前記連続性解析工程は、前記選択工程によってフレームごとに選択された複数の基本周期候補各々を複数のフレームにわたって記憶部に蓄積し、蓄積した当該複数の基本周期候補各々について、当該複数のフレームにわたる連続性を解析することを特徴とする請求項3に記載の音声検出方法。
- 前記コンピュータは、更に、比較部を有し、
前記比較部が、前記連続性解析工程によって解析された結果として、前記基本周期候補の時間的な変化を示す軌跡が取得された場合に、音声の基本周期の時間的な変化を示す軌跡として標準的なパターンを記憶する音声パターン記憶部に記憶されている当該標準的なパターンと、取得された軌跡とを比較する比較工程をさらに含み、
前記音声検出工程は、前記比較工程によって比較された結果に基づいて、前記入力された音響信号に音声信号が含まれるか否かを検出することを特徴とする請求項1〜4のいずれか一つに記載の音声検出方法。 - 前記コンピュータは、更に、出力部を備え、
前記出力部が、前記音声検出工程によって、前記入力された音響信号に音声が存在すると検出された場合に、当該検出の事実を所定の出力部に出力することで通知する通知工程をさらに含んだことを特徴とする請求項1〜5のいずれか一つに記載の音声検出方法。 - 音響信号に音声信号が含まれているか否かを検出する音声検出装置であって、
音響信号の入力を受け付けると、入力された当該音響信号と所定の時間間隔でずらした当該音響信号との相関の度合いを示す自己相関値を、複数の時間間隔各々に関して算出する自己相関算出手段と、
前記自己相関算出手段によって算出された自己相関値各々が、複数の時間間隔において極大値をとる場合に、当該極大値をとる場合の時間間隔でずらした各々の中から、全てもしくはいずれか複数の時間間隔でずらした音響信号各々を、前記音響信号の基本周期の候補である基本周期候補各々として選択する選択手段と、
前記選択手段によって選択された複数の基本周期候補各々の連続性を解析する連続性解析手段と、
前記連続性解析手段によって解析された連続性が所定の閾値以下の場合に、音声信号が含まれているか否かを検出する音声検出手段と、
を備えたことを特徴とする音声検出装置。 - 前記自己相関算出手段は、前記入力された音響信号と前記所定の時間間隔でずらした音響信号とについて、当該入力された音響信号を単位時間に区分したフレームごとに分解し、当該フレームごとの音響信号ごとに複数の時間間隔各々に関して自己相関値を求める相関処理を行うことで、当該フレームごとに自己相関値を算出することを特徴とする請求項7に記載の音声検出装置。
- 音響信号に音声信号が含まれているか否かを検出する音声検出方法をコンピュータに実行させる音声検出プログラムであって、
音響信号の入力を受け付けると、入力された当該音響信号と所定の時間間隔でずらした当該音響信号との相関の度合いを示す自己相関値を、複数の時間間隔各々に関して算出する自己相関算出手順と、
前記自己相関算出手順によって算出された自己相関値各々が、複数の時間間隔において極大値をとる場合に、当該極大値をとる場合の時間間隔でずらした各々の中から、全てもしくはいずれか複数の時間間隔でずらした音響信号各々を、前記音響信号の基本周期の候補である基本周期候補各々として選択する選択手順と、
前記選択手順によって選択された複数の基本周期候補各々の連続性を解析する連続性解析手順と、
前記連続性解析手順によって解析された連続性が所定の閾値以下の場合に、音声信号が含まれているか否かを検出する音声検出手順と、
をコンピュータに実行させることを特徴とする音声検出プログラム。 - 前記自己相関算出手順は、前記入力された音響信号と前記所定の時間間隔でずらした音響信号とについて、当該入力された音響信号を単位時間に区分したフレームごとに分解し、当該フレームごとの音響信号ごとに複数の時間間隔各々に関して自己相関値を求める相関処理を行うことで、当該フレームごとに自己相関値を算出することを特徴とする請求項9に記載の音声検出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008054109A JP5012579B2 (ja) | 2008-03-04 | 2008-03-04 | 音声検出方法、音声検出装置および音声検出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008054109A JP5012579B2 (ja) | 2008-03-04 | 2008-03-04 | 音声検出方法、音声検出装置および音声検出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009210836A true JP2009210836A (ja) | 2009-09-17 |
JP5012579B2 JP5012579B2 (ja) | 2012-08-29 |
Family
ID=41184057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008054109A Expired - Fee Related JP5012579B2 (ja) | 2008-03-04 | 2008-03-04 | 音声検出方法、音声検出装置および音声検出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5012579B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012019927A (ja) * | 2010-07-14 | 2012-02-02 | Nippon Telegr & Teleph Corp <Ntt> | 周期推定装置、周期推定方法、及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6254296A (ja) * | 1985-05-28 | 1987-03-09 | 日本電気株式会社 | ピツチ抽出装置 |
JPS6455956A (en) * | 1987-08-26 | 1989-03-02 | Nec Corp | Identification equipment for call signal |
-
2008
- 2008-03-04 JP JP2008054109A patent/JP5012579B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6254296A (ja) * | 1985-05-28 | 1987-03-09 | 日本電気株式会社 | ピツチ抽出装置 |
JPS6455956A (en) * | 1987-08-26 | 1989-03-02 | Nec Corp | Identification equipment for call signal |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012019927A (ja) * | 2010-07-14 | 2012-02-02 | Nippon Telegr & Teleph Corp <Ntt> | 周期推定装置、周期推定方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5012579B2 (ja) | 2012-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107928673B (zh) | 音频信号处理方法、装置、存储介质和计算机设备 | |
US7912709B2 (en) | Method and apparatus for estimating harmonic information, spectral envelope information, and degree of voicing of speech signal | |
KR101437830B1 (ko) | 음성 구간 검출 방법 및 장치 | |
US8050910B2 (en) | Pitch extraction with inhibition of harmonics and sub-harmonics of the fundamental frequency | |
Janicki | Spoofing countermeasure based on analysis of linear prediction error. | |
US8694314B2 (en) | Voice authentication apparatus | |
US8046215B2 (en) | Method and apparatus to detect voice activity by adding a random signal | |
JP2009008823A (ja) | 音響認識装置、音響認識方法、及び、音響認識プログラム | |
JP6439682B2 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
US8086449B2 (en) | Vocal fry detecting apparatus | |
JP2007328228A (ja) | 信号処理装置、信号処理方法、及びプログラム | |
JP2013022188A (ja) | 歩容解析方法、歩容解析装置及びそのプログラム | |
US8532986B2 (en) | Speech signal evaluation apparatus, storage medium storing speech signal evaluation program, and speech signal evaluation method | |
JP6758890B2 (ja) | 音声判別装置、音声判別方法、コンピュータプログラム | |
JP4099576B2 (ja) | 情報識別装置及び方法、並びにプログラム及び記録媒体 | |
JP5012579B2 (ja) | 音声検出方法、音声検出装置および音声検出プログラム | |
US10956792B2 (en) | Methods and apparatus to analyze time series data | |
JP4585590B2 (ja) | 基本周波数変化量抽出装置、方法及びプログラム | |
CN113421590B (zh) | 异常行为检测方法、装置、设备及存储介质 | |
JP7152112B2 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
JP2013235050A (ja) | 情報処理装置及び方法、並びにプログラム | |
JP7293826B2 (ja) | 問題検出装置、問題検出方法および問題検出プログラム | |
JP2012185195A (ja) | オーディオデータ特徴抽出方法、オーディオデータ照合方法、オーディオデータ特徴抽出プログラム、オーディオデータ照合プログラム、オーディオデータ特徴抽出装置、オーディオデータ照合装置及びオーディオデータ照合システム | |
WO2020059498A1 (ja) | 情報処理装置、情報処理方法、プログラム | |
JP2009237254A (ja) | プログラム、情報記憶媒体、及び特定音認識システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101018 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120409 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120508 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120521 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150615 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |