WO2000079516A1

WO2000079516A1 - Dispositif et procede de determination de trames voisees/non voisees

Info

Publication number: WO2000079516A1
Application number: PCT/JP2000/003954
Authority: WO
Inventors: Masahiro Serizawa
Original assignee: Nec Corporation
Priority date: 1999-06-23
Filing date: 2000-06-16
Publication date: 2000-12-28
Also published as: CA2375330A1; EP1217607A4; JP2001005473A; EP1217607A1

Description

明細書音声 · 無音声フレーム判定装置及びその判定方法この発明は音声'無音声フレーム判定装置及びその判定方法に関し、特に一定区間（一定フレーム）毎に入力信号が音声か音声以外かを判定する音声 ·無音声フレーム判定方式に関するものである。従来技術

この種の音声フレーム検出に関する従来装置は、無音声区間を音声区間に比べて低レ一トで符号化して平均伝送レートを低減するために、無音声区間と音声区間とを判定することを目的として用いられている。例えば、 " I TU— T勧告 G. 7 2 9 A n n e x B"で使用されている判定装置がある。この従来装置では、 1 0 m s e c フレーム毎に入力信号から抽出した 4種の特徴パラメータを用いて、そのフレームが音声区間（音声フレーム）か無音声区間（フレーム）かの判定を行なう。この場合の判定は予め定めた判定パラメータ（閾値）と抽出した特徴パラメ一タとを比較して行なうものである。

図 8を参照して従来装置を説明する。単位長分割回路 2 0は入力端子 1 0から入力された信号を、一定区間のフレーム長（例えば、 1 0 m s e c ) 毎に分割して、検定回路 4 0に渡す。検定回路 4 0は単位長分割回路 2 0からフレーム単位で渡された入力信号に対して音声区間か無音声区間かを判定し、フレーム単位での判定結果を出力端子 6 0から出力する様になつている。発明が解決しようとする課題

図 8に示した従来方式の問題点は、周波数帯域や判定を行なう単位長（フレーム長）が異なる種々の入力信号に対応可能な音声 ·無音声フレーム判定装置を構築する際に、全ての場合で妥当な判定結果を得るためには、各々の場合に対して個別に判定パラメ一タを設計する必要があることである。その理由は、単一の判定パラメータを用いると、判定能力が低下するためである。

本発明の目的は、入力信号の周波数帯域や区間長が複数種類ある場合でも、単一アルゴリズムを用いて剌定を行うことが可能な音声 ·無音声フレーム判定装置及びその方法を提供することである。発明の開示

本発明によれば、一定区間毎に入力信号が音声か音声以外かの判定を行う音声 · 無音声フレーム判定装置であって、前記入力信号を帯域変換する帯域変換手段と、この帯域変換後の信号に基づいて前記判定を行う判定手段とを含むことを特徴とする音声 ·無音声フレーム判定装置が得られる。そして、この判定手段は、予め定められた帯域に制限された信号に対して設計されていることを特徴としている。

また、本発明によれば、一定区間毎に入力信号が音声か音声以外かの判定を行う音声 · 無音声フレーム判定装置であって、前記一定区間をより短い短区間に分割する分割手段と、この短区間毎に前記判定を行う判定手段と、この判定結果に基づいて前記一定区間に対する判定を行う単位長変換手段とを含むことを特徴とする音声 · 無音声フレーム判定装置が得られる。

そして、前記単位長変換手段は、前記短区間のいずれか一つが音声であると判定されたときに、前記一定区間に対応する判定を音声であると判定する様にした特徴とする。また前記入力信号を帯域変換する帯域変換手段を更に含み、前記判定手段は、この帯域変換後の信号に基づいて前記判定を行う様にしたことを特徴とする。更に、前記判定手段は、予め定められた帯域及び単位長に制限された信号に対して設計されていることを特徴としている。

更に本発明によれば、一定区間毎に入力信号が音声か音声以外かの判定を行う音声 · 無音声フレーム判定方法であって、前記入力信号を帯域変換するステップと、この帯域変換後の信号に基づいて前記判定を行うステップとを含むことを特徴とする音声 · 無音声フレーム判定方法が得られる。

更にはまた、一定区間毎に入力信号が音声か音声以外かの判定を行う音声 ·無音声フレーム判定方法であって、前記一定区間をより短い短区間に分割するステップと、この短区間毎に前記判定を行ぅステツプと、この判定結果に基づいて前記一定区間に対する判定を行うステップとを含むことを特徴とする音声 · 無音声フレーム判定方法が得られる。

そして、前記短区間のいずれか一つが音声であると判定されたときに、前記一定区間に対応する判定を音声であると判定する様にした特徴とする。また、前記入力信号を帯域変換するステップを更に含み、この帯域変換後の信号に基づいて前記短区間毎の判定を行う様にしたことを特徴とする。

本発明の作用を述べる。予め定めた周波数帯域及び予め定めた単位時間長を使用して音声 · 無音声判定を行なうことができる設定パラメータを用意する。すなわち、予め定めた帯域及び単位時間長に制限された信号に対して設計された設定パラメータを有する判定回路を用意するのである。そして、入力信号は必ずこの予め定めた周波数帯域と同じ帯域になるように帯域制限を施した後に、判定を行なう。これにより、異なる帯域に対応するために新たな設定パラメ一タを必要としない。但し、入力信号が持つ帯域は予め定めた帯域と同一あるいはより広い必要がある。

また、フレーム長が予め定めた単位時間長と異なる場合は、予め定めた単位長毎に得た判定結果をまとめて該フレームに対応する判定結果を決定する。例えば、予め定めた単位長に対する判定結果のいずれか一つが "音声"である場合は、該フレームに対応する判定結果を "音声" とすることができる。ここで、フレーム長は予め定めた単位時間長と同一あるいはより長い必要がある。図面の簡単な説明

図 1は、本発明による第一の音声 · 無音声フレーム判定装置の構成例を説明するブロック図である。

図 2は、図 1のブロックの動作を示すフロー図である。

図 3は、発明による第二の音声 · 無音声フレーム判定装置の構成例を説明するブロック図である。

図 4は、図 3のブロックの動作を示すフロー図である。

図 5は、図 3のブロックの動作を説明するためのフレーム構成を示す図である。

図 6は、発明による第三の音声 · 無音声フレーム判定装置の構成例を説明するブロック図である。

図 7は、図 6のブロックの動作を示すフロー図である。

図 8は、従来の音声 · 無音声フレーム判定装置の構成例を説明するブロック図である。発明を実施するための最良の形態

以下に、図面を参照して本発明の実施例を説明する。図 1は本発明による第一の音声 ' 無音声フレーム判定装置の構成を示すプロック図であり、図 8 と同等部分は同一符号にて示している。また、図 2はその動作の流れを示すフロー図である。単位長分割回路 2 0は入力端子 1 0から入力された信号を、予め定められた一定区間であるフレーム長（例えば、 1 0 m s e c ) に分割して（ステップ S 1 0 )、帯域変換回路 3 0に渡す。

この帯域変換回路 3 0は、単位長分割回路 2 0から渡されたフレーム長の入力信号が持つ周波数帯域を、検定回路 4 0が検定可能な周波数帯域に制限し（ステップ S 1 1 )、検定回路 4 0に渡す。この検定回路 4 0は、単位長分割回路 2 0から渡されたフレーム単位の入力信号に対して、音声区間か無音声区間かを判定し（ステップ S 1 2 )、その判定結果を出力端子 6 0から出力する。

この場合の帯域変換回路は、例えば、バンドパスフィルタ機能や、ローパスフィルタ機能を有する回路を使用することができるが、入力信号が持つ帯域は、この帯域変換回路による変換後の帯域と同一あるいはより広い必要があることは勿論である。

図 3は本発明による第二の音声 · 無音声フレーム判定装置を示すブロック図であり、図 1， 8 と同等部分は同一符号にて示している。また、図 4はその動作の流れを示すフロー図である。単位長分割回路 2 0は入力端子 1 0から入力された信号を、図 5 (A) に示す様に、フレーム長（例えば、 1 0 m s e c ) より短い単位長（例えば、 2. 5 m s e c ) に分割して（ステップ S 2 0 ) 検定回路 4 0に渡す。検定回路 4 0は単位長分割回路 2 0から渡された短い単位長毎に音声区間か無音声区間かを判定し（ステップ S 2 1 )、これ等の判定結果を入力信号のフレーム単位毎に単位長変換回路 5 0に渡す。

単位長変換回路 5 0は、各フレームに対応する検定回路 4 0から渡された複数の判定結果（図 5 (A) の短区間の "有"、 "無" の判定結果）から、その 1フレームの判定結果を決定し（ステップ S 2 2)、出力端子 6 0から出力する。この場合、図 5 (A) に示した様に、 1 フレームを構成する短区間のうち一つでも "有" と判定されれば、 1 フレームの判定結果は図 5 (B) に示す様に、 "有" と判定されることになる。ここで、フレーム長は予め定めた単位時間長と同一あるいはより長い必要があることは勿論である。

図 6は本発明による第三の音声■ 無音声フレーム判定装置を示すブロック図であり、図 1， 3 , 8 と同等部分は同一符号にて示す。また、図 7はその動作の流れを示すフロー図である。単位長分割回路 2 0は入力端子から入力された信号を、図 5 (A) に示す様に、フレーム長 (例えば、 1 0 m s e c ) より短い単位長（例えば、 2. 5 m s e c ) に分割して（ステップ S 3 0 ) 帯域変換回路 3 0に渡す。帯域変換回路 3 0は、単位長分割回路 2 0から渡されたフレーム長の入力信号が持つ周波数帯域を、検定回路 4 0が検定可能な周波数帯域に制限し（ステツプ S 3 1 ) 検定回路 4 0に渡す。

検定回路 4 0は帯域変換回路 3 0から渡された短い単位長毎に音声区間か無音声区間かを夫々判定し（ステップ S 3 2 )、これ等の判定結果を入力信号のフレーム単位毎に単位長変換回路 5 0に渡す。この単位長変換回路 5 0は各フレームに対応する検定回路 4 0から渡された複数の判定結果（図 5 ( A ) の短区間の "有"、 "無" の判定結果）からそのフレームの判定結果を決定し（ステップ S 3 3 )、出力端子 6 0 から出力する。

この場合も、図 5 ( A ) に示した様に、 1 フレームを構成する短区間のうち一つでも "有" と判定されれば、 1 フレームの判定結果は図 5 ( B ) に示す様に、 "有" と判定されることになる。産業上の利用可能性

第一の効果は、周波数帯域が異なる種々の入力信号に対応可能な音声 ·無音声フレーム判定装置を構築する際に、全ての場合で妥当な判定結果を得ることが可能なことである。その理由は、単一の判定パラメータで判定可能なためである。

第二の効果は、判定を行なう単位長（フレーム長）が異なる種々の入力信号に対応可能な音声'無音声フレーム判定装置を構築する際に、全ての場合で妥当な判定結果を得ることが可能なことである。その理由は、単一の判定パラメータで反映可能なためである。

Claims

請求の範囲

1 . 一定区間毎に入力信号が音声か音声以外かの判定を行う音声 ·無音声フレーム判定装置であって、前記入力信号を帯域変換する帯域変換手段と、この帯域変換後の信号に基づいて前記判定を行う判定手段とを含むことを特徴とする音声 ·無音声フレーム判定装置。

2 . 前記判定手段は、予め定められた帯域に制限された信号に対して設計されていることを特徴とする請求項 1記載の音声 ·無音声フレーム判定装置。

3 . 一定区間毎に入力信号が音声か音声以外かの判定を行う音声 ·無音声フレーム判定装置であって、前記一定区間をより短い短区間に分割する分割手段と、この短区間毎に前記判定を行う判定手段と、この判定結果に基づいて前記一定区間に対する判定を行う単位長変換手段とを含むことを特徴とする音声 ·無音声フレーム判定装置。

4 . 前記単位長変換手段は、前記短区間のいずれか一つが音声であると判定されたときに、前記一定区間に対応する判定を音声であると判定する様にしたことを特徴とする請求項 3記載の音声 ·無音声フレーム判定装置。

5 . 前記判定手段は、予め定められた帯域に制限された信号に対して設計されていることを特徴とする請求項 3または 4記載の音声■ 無音声フレーム判定装置。

6 . 前記入力信号を帯域変換する帯域変換手段を更に含み、前記判定手段は、この帯域変換後の信号に基づいて前記判定を行う様にしたことを特徴とする請求項 3または 4記載の音声 ·無音声フレーム判定装置。

7 . 前記判定手段は、予め定められた帯域及び単位長に制限された信号に対して設計されていることを特徴とする請求項 6記載の音声 ·無音声フレーム判定装置。

8 . 一定区間毎に入力信号が音声か音声以外かの判定を行う音声 ·無音声フレーム判定方法であって、前記入力信号を帯域変換するステップと、この帯域変換後の信号に基づいて前記判定を行ぅステツプとを含むことを特徴とする音声 . 無音声フレーム判定方法。

9 . 前記判定を行うステップは、予め定められた帯域に制限された信号に対して設計されていることを特徴とする請求項 8記載の音声 · 無音声フレーム判定方法。

1 0 . —定区間毎に入力信号が音声か音声以外かの判定を行う音声 · 無音声フレーム判定方法であって、前記一定区間をより短い短区間に分割するステップと、この短区間毎に前記判定を行うステップと、この判定結果に基づいて前記一定区間に対する判定を行うステツプとを含むことを特徴とする音声 · 無音声フレーム判定方法。

1 1 . 前記短区間のいずれか一つが音声であると判定されたときに、前記一定区間に対応する判定を音声であると判定する様にしたことを特徴とする請求項 1 0記載の音声■ 無音声フレーム判定方法。

1 2 . 前記判定を行うステップは、予め定められた帯域に制限された信号に対して設計されていることを特徴とする請求項 1 0または 1 1記載の音声 · 無音声フレーム判定方法。

1 3 . 前記入力信号を帯域変換するステップを更に含み、この帯域変換後の信号に基づいて前記短区間毎の判定を行う様にしたことを特徴とする請求項 1 0または 1 1記載の音声 .無音声フレーム判定方法。

1 4 . 前記判定を行うステップは、予め定められた帯域及び単位長に制限された信号に対して設計されていることを特徴とする請求項 1 3記載の音声 · 無音声フレーム判定方法。