WO2017119368A1

WO2017119368A1 - 信号処理方法および信号処理装置

Info

Publication number: WO2017119368A1
Application number: PCT/JP2016/088935
Authority: WO
Inventors: 竜之介大道
Original assignee: ヤマハ株式会社
Priority date: 2016-01-06
Filing date: 2016-12-27
Publication date: 2017-07-13

Abstract

信号処理装置は、各々異なるカットオフ周波数を有し、入力信号におけるカットオフ周波数を越える帯域の信号を減衰させ、入力信号の基本周波数の推定に用いられる信号を各々出力する複数の調波減衰フィルタ（３＿１～３＿ｍ）を有する。複数の調波減衰フィルタ（３＿１～３＿ｍ）の各々は、自身に対する入力信号を累算する累算器（３０ａ）と、自身に対する入力信号とカットオフ周波数に基づいて決定された遅延時間だけ当該入力信号を遅延した信号との差分を出力するコムフィルタ（３０ｂ）とからなる巡回型移動平均フィルタを複数段縦続接続した構成を有する。

Description

信号処理方法および信号処理装置

　この開示は、信号処理技術に係り、特に音信号の基本周波数の推定に好適な信号処理方法および信号処理装置に関する。

　基本周波数は、人間が知覚する音の高さ（ピッチと呼ばれる）と強く関係する量であるので、その値自体の利用価値が高い。一般会話におけるイントネーションの分析、歌声における音高の分析（カラオケ採点等）、音声符号化における音高情報の表現等にも基本周波数が用いられる。また、近年の高品質な音声分析においても、基本周波数は、分析のための補助情報として重要な役割を果たす。

　しかし、音の基本周波数を推定するのは一般的に難しい。この基本周波数の推定を難しくしている要因の１つとして、基本周波数成分とともに音に含まれている高次調波成分（倍音成分とも呼ばれる）の存在がある。音の基本周波数を求めるために、ローパスフィルタ等により高次調波成分を音から除去することが考えられる。しかし、基本周波数自体が不明であるため、高次調波成分を除去するためのローパスフィルタのカットオフ周波数を決定することができない。

　この問題を解決するための技術として、非特許文献１に開示された技術がある。この非特許文献１に開示の技術では、カットオフ周波数の異なる複数のローパスフィルタに対し、基本周波数が未知である入力信号を与える。ここで、複数のローパスフィルタは、入力信号が各々のカットオフ周波数以上の周波数の高次調波成分を含む場合にそれらの高次調波成分を減衰させる役割を果たす。従って、以下では便宜上、これらのローパスフィルタを調波減衰フィルタと呼ぶ。非特許文献１に開示の技術では、複数の調波減衰フィルタの出力信号から入力信号の基本周期を推定し、それらの推定結果の中から最も信頼することができる推定結果を選択することにより基本周波数を求める。

森勢将雅、河原英紀、西浦敬信、「基本波検出に基づく高ＳＮＲの音声を対象とした高速なＦ０推定法」、電子情報通信学会論文誌、社団法人電子情報通信学会、２０１０年２月１日、Ｖｏｌ．Ｊ９３－Ｄ　Ｎｏ．２、ｐｐ．１０９－１１７

ＤＲＵＧＭＡＮ，　Ｔｈｏｍａｓ；　ＤＵＴＯＩＴ，　Ｔｈｉｅｒｒｙ．　Ｇｌｏｔｔａｌ　ｃｌｏｓｕｒｅ　ａｎｄ　ｏｐｅｎｉｎｇ　ｉｎｓｔａｎｔ　ｄｅｔｅｃｔｉｏｎ　ｆｒｏｍ　ｓｐｅｅｃｈ　ｓｉｇｎａｌｓ．　Ｉｎ：　Ｉｎｔｅｒｓｐｅｅｃｈ．　２００９．　ｐ．　２８９１－２８９４．

　ところで、上述した従来の技術では、入力信号の基本周波数を正確に推定するために、調波減衰フィルタを多数設ける必要がある。従って、基本周波数を推定するための手段を信号処理装置が実行する演算処理により実現する場合には、信号処理装置の演算量が嵩み、入力信号の基本周波数の推定を高速に行うのが困難になるという問題がある。また、基本周波数を推定するための手段を電子回路等のハードウェアにより実現する場合には、ハードウェアが大規模なものとなり、価格が高価になる問題がある。

　この開示は以上のような事情に鑑みてなされたものであり、演算量を低減することができ、あるいは小規模のハードウェアで実現でき、入力信号の基本周波数の推定を高速に行うことができる信号処理のための技術的手段を提供することを目的としている。

　本開示は、各々、異なる帯域通過特性に従って、入力信号の帯域制限を行って、前記入力信号の基本周波数の推定に用いられる信号を各々生成する複数の調波減衰フィルタ処理過程を有し、前記複数の調波減衰フィルタ処理過程の各々では、一方の過程の出力信号が他方の過程の入力信号となる累算過程およびコムフィルタ処理過程からなるフィルタ処理を１または複数回再帰的に実行し、前記累算過程では、当該累算過程に対する入力信号を累算し、前記コムフィルタ処理過程では、当該コムフィルタ処理過程に対する入力信号と当該入力信号を遅延させた信号との差分を出力する信号処理方法を提供する。

　また、本開示は、入力信号に関する複数種類の状態の中から検出対象とする状態を所定の順序で選択しつつ前記入力信号から検出対象の状態を検出する状態検出過程と、前記状態検出過程による前記状態の検出タイミングに基づいて前記入力信号の周期を推定する周期推定過程とを具備する信号処理方法を提供する。

　また、本開示は、複数の基本波推定部から入力信号の基本波成分に関する推定結果である基本波情報を受け取り、これらの基本波情報から１つの基本波情報を選択する選択過程を具備し、前記選択過程では、先行する選択結果である基本波情報と前記複数の基本波推定部から各々受け取る基本波情報との差分を独立変数とするコスト関数であって、前記差分に対して関数値が非線形であるコスト関数を用いて前記基本波情報の選択を行う信号処理方法を提供する。

　また、本開示は、各々、異なる帯域通過特性に従って、入力信号の帯域制限を行って出力する複数の調波減衰フィルタ処理過程と、前記複数の調波減衰フィルタの出力信号に基づいて、前記入力信号の基本波成分を各々推定する複数の基本波推定過程と、前記複数の調波減衰フィルタ処理過程の出力信号に基づいて、前記複数の基本波推定過程により推定させる基本波の１周期毎にピッチマークを各々推定する複数のピッチマーク推定過程と、前記複数の基本波推定過程により推定された基本波成分および前記複数のピッチマーク推定過程により推定されたピッチマークの中から共通の調波減衰フィルタの出力信号に基づいて推定された基本波成分およびピッチマークを選択する選択過程とを具備する情報処理方法を提供する。

　この開示によれば、少ない個数の調波減衰フィルタまたは調波減衰フィルタ処理過程により、基本周波数の推定に利用可能な信号を得ることができる。よって、基本周波数の推定のための演算量あるいはハードウェアを少なくし、基本周波数の推定を高速に行うことができる。

図１は、この開示の第１実施形態である信号処理装置の機能構成を示すブロック図である。図２は、第１実施形態における調波減衰フィルタの機能構成を例示するブロック図である。図３は、同調波減衰フィルタの周波数－振幅特性の例を示す図である。図４は、同調波減衰フィルタの周波数－振幅特性の他の例を示す図である。図５は、第１実施形態におけるダウンサンプラの構成例を示すブロック図である。図６は、第１実施形態における直流除去フィルタの基本構成を示すブロック図である。図７は、同直流除去フィルタの具体的構成例を示すブロック図である。図８は、第１実施形態における周期検出部の構成を示すブロック図である。図９は、同周期検出部の処理内容を示すフローチャートである。図１０は、同周期検出部の基本周期推定部の処理内容を説明するための波形図である。図１１は、同周期検出部の動作例を示す波形図である。図１２（ａ）および（ｂ）は、基本周波数の誤推定を招き易い音声信号の例を示す図である。図１３は、第１実施形態における選択部の処理内容を示す図である。図１４は、同選択部において使用される非線形関数を示す図である。図１５（ａ）～（ｃ）は、同選択部の動作例を示す図である。図１６（ａ）および（ｂ）は、ピッチマークを利用した信号処理の例を示す波形図である。図１７（ａ）～（ｅ）は、従来のピッチマークの推定方法を説明する図である。図１８（ａ）～（ｃ）は、ピッチマークと基本周期との整合性が要求される理由を説明する波形図である。図１９は、この開示の第２実施形態である信号処理装置の機能構成を示すブロック図である。図２０は、第２実施形態におけるピッチマークの推定方法を示す波形図である。図２１は、同推定方法の他の例を示す波形図である。図２２（ａ）～（ｃ）は、第２実施形態の効果を示す波形図である。図２３は、第２実施形態における極性判定のための機能構成を示すブロック図である。図２４は、同極性判定の例を示す波形図である。

　以下、図面を参照しつつ本開示の実施の形態について説明する。

［第１実施形態］
＜全体構成＞
　図１はこの開示の第１実施形態である信号処理装置の機能構成を示すブロック図である。本実施形態による信号処理装置は、音信号の基本周波数を推定する装置である。図１に示すように、この信号処理装置の機能は、ダウンサンプラ１と、直流除去フィルタ２と、ｍ個（ｍは２以上の整数）の調波減衰フィルタ３＿１～３＿ｍと、ｍ個の周期検出部４＿１～４＿ｍと、選択部５とに大別することができる。

　ここで、ダウンサンプラ１は、所定のサンプリング周波数の音信号サンプル列をより低いサンプリング周波数の音信号サンプル列に変換する手段である。このダウンサンプラ１は、直流除去フィルタ２以降の各部の演算量を低減するために設けられている。

　直流除去フィルタ２は、ダウンサンプラ１が出力する音信号サンプル列から直流成分を除去し、直流成分の除去された音信号サンプル列を出力する手段である。

　調波減衰フィルタ３＿１～３＿ｍは、各々異なるカットオフ周波数を有するローパスフィルタである。これらの調波減衰フィルタ３＿１～３＿ｍは、直流除去フィルタ２の出力する音信号サンプル列における第２調波以上の高調波成分の周波数が各々のカットオフ周波数よりも高い場合に、それらの高調波成分を減衰させる役割を果たすフィルタである。

　周期検出部４＿１～４＿ｍは、各々の入力信号の基本波成分に関する推定結果である基本波情報を出力する基本波推定部として機能する。さらに詳述すると、周期検出部４＿１～４＿ｍは、調波減衰フィルタ３＿１～３＿ｍの出力信号を解析し、各出力信号の基本波成分に関する基本波情報として、各出力信号の基本周期を推定して、基本周期情報を出力するとともに、各出力信号の基本波らしさの尺度である信頼度情報を算出して出力する。

　選択部５は、周期検出部４＿１～４＿ｍが各々出力する基本波情報である基本周期情報および信頼度情報に基づいて、周期検出部４＿１～４＿ｍの１つが出力した基本周期情報を選択し、選択した基本周期情報の逆数である基本周波数Ｆ０を出力する手段である。

　以上が本実施形態による信号処理装置の概略である。本実施形態では、以上説明した信号処理装置の性能を高めるため、信号処理装置の各部に様々な改良が施されている。以下、その詳細を説明する。

＜調波減衰フィルタ＞
　図２は、本実施形態における調波減衰フィルタ３＿１の構成例を示すブロック図である。なお、この図２では、調波減衰フィルタ３＿１の構成を例示しているが、他の調波減衰フィルタ３＿２～３＿ｍも、調波減衰フィルタ３＿１と同様な構成を有している。

　調波減衰フィルタ３＿１は、同じ構成のＭ１個（Ｍ１は２以上の整数）の巡回型移動平均フィルタ３０＿１～３０＿Ｍ１を縦続接続してなるものである。ここで、巡回型移動平均フィルタ３０＿１は、加算器３１および遅延器３２からなる累算器３０ａと、遅延器３３および減算器３４からなるコムフィルタ３０ｂと、シフタ３０ｃとを縦続接続した構成となっている。

　巡回型移動平均フィルタ３０＿１の累算器３０ａにおいて、加算器３１は、直流除去フィルタ２が出力する音信号サンプルと遅延器３２が出力する音信号サンプルを加算して出力する。遅延器３２は、加算器３１が出力する音信号サンプルを１サンプリング周期遅延させて加算器３１に供給する。この累算器３０ａでは、１サンプリング周期毎に、直流除去フィルタ２が出力する音信号サンプルを現状の累算値に加えて累算値を更新する累算処理が行われる。

　コムフィルタ３０ｂにおいて、遅延器３３は、累算器３０ａが出力する累算値をＮサンプリング周期（Ｎは２の冪乗）遅延させる。減算器３４は、累算器３０ａが出力する累算値からこの遅延器３３の出力信号を減算して出力する。

　ここで、累算器３０ａの累算値（具体的には加算器３１の出力信号値）には、１サンプリング周期毎に直流除去フィルタ２から出力された１個の音信号サンプル値が加わる。そして、減算器３４は、この累算器３０ａの累算値からＮサンプリング周期前の累算器３０ａの累算値を減算する。従って、減算器３４の出力信号値は、現在までのＮサンプリング周期の間に直流除去フィルタ２が出力した音信号サンプル値の総和になる。

　また、本実施形態では、累算器３０ａの累算値にオーバーフローが発生する可能性がある。しかしながら、本実施形態では、信号処理の対象である信号値が２の補数形式で表現されている。このため、累算器３０ａの累算値にオーバーフローが発生したとしても、コムフィルタ３０ｂの出力信号は、累算値にオーバーフローが発生しない場合（オーバーフローしないように信号のビット幅を拡大した場合）と同様な正常な信号値となる。

　本実施形態において、遅延器３３の遅延段数Ｎは２の冪乗である。そこで、シフタ３０ｃは、コムフィルタ３０ｂの出力信号をｌｏｇ_２Ｎビットだけ右シフトすることにより、コムフィルタ３０ｂの出力信号を１／Ｎにした信号を出力する。

　このようにして巡回型移動平均フィルタ３０＿１により直流除去フィルタ２から出力される音信号サンプル列についてのＮサンプリング周期に亙る移動平均値が得られる。
　他の巡回型移動平均フィルタ３０＿２～３０＿Ｍ１も、巡回型移動平均フィルタ３０＿１と同様である。

　図３および図４は、本実施形態における調波減衰フィルタの周波数－振幅特性を示す図である。ここで、図３は巡回型移動平均フィルタの縦続段数Ｍ１が６段である調波減衰フィルタの周波数－振幅特性を示し、図４は巡回型移動平均フィルタの縦続段数Ｍ１が８段である調波減衰フィルタの周波数－振幅特性を示している。

　図２に示す巡回型移動平均フィルタ３０＿１の周波数－振幅特性では、遅延器３３のサンプリング周波数Ｆｓを遅延段数Ｎにより除算した周波数Ｆｓ／Ｎにおいてノッチ（ゲインの局所的な低下）が発生する。そして、巡回型移動平均フィルタ３０＿１～３０＿Ｍ１の縦続段数Ｍ１を増加させるに従って、この周波数Ｆｓ／Ｎ付近での減衰量が大きくなり、調波減衰フィルタは、カットオフ周波数Ｆｓ／Ｎを有するローパスフィルタとして機能するものになる。この調波減衰フィルタでは、巡回型移動平均フィルタ３０＿１～３０＿Ｍ１の各々の遅延器３３の遅延段数Ｎによりカットオフ周波数が定まる。

　調波減衰フィルタでは、巡回型移動平均フィルタ３０＿１～３０＿Ｍ１の縦続段数Ｍ１が多くなる程、カットオフ周波数以上の周波数成分に与えられる減衰量が大きくなる。調波減衰フィルタにおける巡回型移動平均フィルタ３０＿１～３０＿Ｍ１の縦続段数Ｍ１を６段にした場合、図３に示すように、サイドローブにおける減衰量は８０ｄＢになる。調波減衰フィルタにおける巡回型移動平均フィルタ３０＿１～３０＿Ｍ１の縦続段数Ｍ１を８段にすると、図４に示すように、サイドローブにおける減衰量は１００ｄＢに及ぶ。

　また、図３および図４に示すように、本実施形態における調波減衰フィルタの周波数－振幅特性は、肩特性（ｓｈｏｕｌｄｅｒ　ｃｈａｒａｃｔｅｒｉｓｔｉｃ）が緩やかな特性となる。

　仮に肩特性が急峻な調波減衰フィルタを採用したとすると、調波減衰フィルタの通過帯域に入力信号の基本周波数の他、一部の高次調波の周波数が含まれる場合に、それらの高次調波成分が大きな強度で含まれた信号が調波減衰フィルタから出力され、調波減衰フィルタの出力信号から基本周波数を正確に推定するのが困難になる。

　しかしながら、本実施形態では、図３および図４に示すように肩特性が緩やかな周波数－振幅特性を有する調波減衰フィルタが用いられる。従って、調波減衰フィルタにおいて、入力信号中の高次調波成分が適度に減衰される。ここで、調波減衰フィルタの周波数－振幅特性は肩特性が緩やかであるため、入力信号の高次調波成分に与えられる減衰量は少ないかも知れない。しかし、調波減衰フィルタの周波数－振幅特性の肩特性では、周波数が高くなる程、入力信号に対する減衰量が大きくなるので、入力信号中の高次調波成分には基本波成分に対する減衰量よりも大きな減衰量が与えられる。従って、調波減衰フィルタの出力信号は、入力信号よりも高次調波成分が少なくて基本波らしい波形となる。よって、調波減衰フィルタの出力信号から基本周期を推定する処理が容易になる。

　また、本実施形態における調波減衰フィルタでは、コムフィルタ３０ｂの遅延器３３の遅延段数Ｎを２の冪乗で表せる数値とすることで、乗算器を使用せず、ｌｏｇ_２Ｎビットの右シフトを行うシフタ３０ｃにより１／Ｎの乗算処理と等価な処理を実現している。従って、調波減衰フィルタに関して信号処理装置が実行する演算処理の演算量を各段と低減することができ、高速動作が可能な調波減衰フィルタを実現することができる。

＜ダウンサンプラ＞
　図５は本実施形態におけるダウンサンプラ１の構成例を示すブロック図である。上述したように、このダウンサンプラ１は、直流除去フィルタ２以降の各部の演算量を減らすために必要な手段である。本実施形態では、ダウンサンプラ１として、高速かつ線形位相のダウンサンプラを採用している。

　図５に示すように、ダウンサンプラ１は、加算器１１および遅延器１２からなる累算器１０ａをＮ１段（Ｎ１は２の冪乗である整数）に亙って縦続接続したものと、デシメータ１０ｃと、遅延器１３および減算器１４からなるコムフィルタ１０ｂをＮ１段に亙って縦続接続したものと、シフタ１０ｄとを縦続接続した構成となっている。

　このダウンサンプラ１は、図２に示す調波減衰フィルタ３＿１にダウンサンプリング機能を付加したものである。さらに詳述すると、ダウンサンプラ１は、図２に示す調波減衰フィルタ３＿１に対して次の変更を加えたものである。
ａ．図２の巡回型移動平均フィルタ３０＿１～３０＿Ｍ１の中のＭ１個の累算器３０ａを前段側に集めるとともに、巡回型移動平均フィルタ３０＿１～３０＿Ｍ１の中のＭ１個のコムフィルタ３０ｂを後段側に集める。
ｂ．前段側のＭ１個の累算器３０ａと後段側のＭ１個のコムフィルタ３０ｂの間にデシメータ１０ｃを配置する。
ｃ．コムフィルタ３０ｂ内の遅延器３３の遅延段数を１段に変更する。

　図２に示す調波減衰フィルタ３＿１において、累算器３０ａやコムフィルタ３０ｂは線形要素であるので、それらの位置を変更しても調波減衰フィルタ３＿１の機能は変わらない。従って、図５において、Ｎ１段の累算器１０ａと、Ｎ１段のコムフィルタ１０ｂと、シフタ１０ｄとからなる部分は、図２の巡回型移動平均フィルタ３０＿１～３０＿Ｍ１と同様にローパスフィルタとして機能する。

　デシメータ１０ｃは、Ｒ＝２^ｒ個（ｒは整数）に対して１個の割合で入力サンプルを通過させる間引き処理を行う。コムフィルタ１０ｂにおける遅延器１３は、デシメータ１０ｃを１個のサンプルが通過する周期をサンプリング周期として動作する。図２のコムフィルタ３０ｂの遅延器３３は、前段の累算器３０ａの遅延器３２と同じサンプリング周期で動作する。従って、巡回型移動平均フィルタ３０＿１にＮサンプリング周期に亙るサンプルの移動平均を算出させるために、コムフィルタ３０ｂの遅延器３３をＮ段の遅延器にする必要があった。しかしながら、図５に示すダウンサンプラ１では、コムフィルタ１０ｂにおける遅延器１３は、累算器１０ａの遅延器１２のサンプリング周期のＲ倍のサンプリング周期で動作する。従って、図５に示すダウンサンプラ１では、コムフィルタ１０ｂにおける遅延器１３の遅延段数が１段で済む。従って、ダウンサンプラ１では、遅延器１３を実現するためのメモリ容量を削減することができる。

＜直流除去フィルタ＞
　図６は本実施形態における直流除去フィルタ２の構成例を示すブロック図である。この直流除去フィルタ２は、ダウンサンプラ１の出力信号が各々入力される遅延部２１および移動平均部２２と、遅延部２１の出力信号から移動平均部２２の出力信号を減算し、直流成分の除去された信号として出力する減算器２３とを有する。ここで、移動平均部２２は、Ｄサンプリング周期（Ｄは所定の整数）に亙る入力サンプル列の移動平均を算出する回路である。

　図７は図６の直流除去フィルタ２をさらに具体化した直流除去フィルタ２ａの構成を示すブロック図である。この直流除去フィルタ２ａは、移動平均部ＭＡ１およびＭＡ２と減算器２３とにより構成されている。そして、この直流除去フィルタ２ａでは、移動平均部ＭＡ１の一部が図６の遅延部２１としての役割を果たしている。

　図７において、前段のダウンサンプラ１の出力信号は、遅延段数がＤ－１段である遅延器２２１と、遅延段数が１段である遅延器２２２を順次通過して減算器２２３に入力される。減算器２２３は、前段のダウンサンプラ１の出力信号から遅延器２２２の出力信号、すなわち、ダウンサンプラ１の出力信号をＤサンプリング周期だけ遅延させた信号を減算して出力する。加算器２２４および遅延器２２５からなる累算器は、この減算器２２３の出力信号を累算する。乗算器２２６は、この累算器の出力信号に係数１／Ｄを乗算する。これによりダウンサンプラ１から入力されるサンプル列についてのＤサンプリング周期に亙る移動平均が乗算器２２６から出力される。遅延段数Ｄが２の冪乗で表される数値である場合には、乗算器２２６をｌｏｇ_２Ｄビットの右シフトを行うシフタに置き換えてもよい。

　移動平均部ＭＡ２も移動平均部ＭＡ１と基本的に同様な構成である。減算器２３は、ダウンサンプラ１の出力信号をＤ－１サンプリング周期だけ遅延させた信号から移動平均部ＭＡ２の出力信号を減算し、直流成分の除去された信号として出力する。

＜周期検出部＞
　本実施形態では、高調波成分に起因した基本周期の推定誤りに対して頑健な周期検出部４＿１～４＿ｍが用いられている。図８は一例として周期検出部４＿１の機能構成を示すブロック図である。他の周期検出部４＿２～４＿ｍも、この周期検出部４＿１と同様な構成を有している。

　図８に示すように、周期検出部４＿１は、状態検出部４１と、基本周期推定部４２とを有する。また、状態検出部４１は、状態情報保持部４１ａを含む。

　状態検出部４１には、前段の調波減衰フィルタ３＿１の出力信号が入力信号として与えられる。状態検出部４１は、この入力信号に関する複数種類の状態の中から検出対象とする状態を所定の順序で選択しつつ入力信号から検出対象の状態を検出する手段である。

　さらに詳述すると、状態検出部４１は、入力信号が正方向に零レベルと交差する状態ＳＴａと、入力信号が正ピークとなる状態ＳＴｂと、入力信号が負方向に零レベルと交差する状態ＳＴｃと、入力信号が負ピークとなる状態ＳＴｄとが、ＳＴａ→ＳＴｂ→ＳＴｃ→ＳＴｄ→ＳＴａ→…という順序で繰り返し発生することを前提として入力信号の状態の検出を繰り返す。

　具体的には、状態検出部４１は、例えば入力信号に状態ＳＴａが発生したことを検出した後は、検出対象を状態ＳＴｂとし、他の状態ＳＴａ、ＳＴｃ、ＳＴｄは無視して、入力信号に状態ＳＴｂが発生するのを待つ。そして、入力信号に状態ＳＴｂが発生したことを検出すると、状態検出部４１は、検出対象を状態ＳＴｃとし、他の状態ＳＴａ、ＳＴｂ、ＳＴｄは無視して、入力信号に状態ＳＴｃが発生するのを待つのである。以下、同様であり、状態検出部４１は、検出対象とする状態をＳＴｄ→ＳＴａ→ＳＴｂ→ＳＴｃ→ＳＴｄ→…という具合に所定の順序で選択し、選択した検出対象を入力信号から検出するのである。

　この状態検出部４１により行われる入力信号の状態の検出には例外がある。すなわち、所定の順序に従って選択した状態が入力信号において発生した場合であっても、一定の条件を満たす場合には、その状態を検出対象から除外する、という例外である。

　具体的には、周期検出部４＿１は、現在の検出対象が状態ＳＴｄ（負ピーク）となっており、入力信号に負ピークが発生したことを検出した場合において、その直前の正ピークの振幅値の絶対値に比べて、検出した負ピークの振幅値の絶対値が極端に小さい場合には、当該負ピークを検出しなかったものとみなす。また、周期検出部４＿１は、現在の検出対象が状態ＳＴｂ（正ピーク）となっており、入力信号に正ピークが発生したことを検出した場合において、その直前の負ピークの振幅値の絶対値に比べて、検出した正ピークの振幅値の絶対値が極端に小さい場合には、当該正ピークを検出しなかったものとみなす。これは、音信号の基本波の波形では、ピークの振幅値の絶対値が先行ピークに比べて極端に小さくなることは考えにくいという前提に基づくものである。この除外処理を実行するため、状態検出部４１により検出された状態ＳＴａ～ＳＴｄの種別、検出タイミング、検出した振幅値を示す状態情報を保持する状態情報保持部４１ａが状態検出部４１に設けられている。

　検出したピークの振幅値の絶対値が先行ピークに比べて極端に小さいか否かを判断するための方法には、各種の方法が考えられる。一例として、閾値ｔｈを適当に定め、先行ピークの振幅値の絶対値に対する検出したピークの振幅値の絶対値の比ｒが閾値ｔｈ未満である場合に、検出したピークの振幅値の絶対値が先行ピークに比べて極端に小さいと判断するようにしてもよい。

　基本周期推定部４２は、状態検出部４１による状態ＳＴａ、ＳＴｂ、ＳＴｃ、ＳＴｄの検出タイミングに基づいて入力信号の基本周期情報ＴＦを推定する手段である。本実施形態における基本周期推定部４２は、入力信号の基本周期情報ＴＦを推定して出力することに加えて、入力信号波形の基本波らしさを示す信頼度情報ＮＦを算出して出力する。

　図９は周期検出部４＿１の処理内容を示すフローチャートである。周期検出部４＿１は、調波減衰フィルタ３＿１から入力信号のサンプルを取り込む都度、図９に示す処理を実行する。図９においてステップＳａ１、Ｓａ２、Ｓａ４は、状態検出部４１としての処理であり、ステップＳａ３は基本周期推定部４２としての処理である。

　周期検出部４＿１は、調波減衰フィルタ３＿１から入力信号のサンプルを取り込むと、現時点までに取り込んだサンプル列が示す入力信号波形に現在選択している検出対象の状態が発生したか否かを判断する（ステップＳａ１）。具体的には、現在選択している検出対象が状態ＳＴｂ（正ピーク）である場合、現時点までに取り込んだサンプル列が示す入力信号波形に正ピークが出現したか否かを判断する。この判断結果が「ＮＯ」である場合、周期検出部４＿１は、処理を終了し、調波減衰フィルタ３＿１から新たな入力信号のサンプルが供給されるのを待つ。

　一方、ステップＳａ１の判断結果が「ＹＥＳ」である場合、周期検出部４＿１は、ステップＳａ１において検出した状態の種別、検出タイミング、検出した振幅値を示す状態情報を状態情報保持部４１ａに保持させ、当該状態が上述した除外対象に当たるか否かを判断する（ステップＳａ２）。具体的には、例えば検出対象が正ピークであり、ステップＳａ１において正ピークを検出した場合、状態情報保持部４１ａを参照し、直前の負ピークの振幅値の絶対値に対する当該正ピークの振幅値の絶対値の比が所定の閾値未満か否かを判断する。そして、この判断結果が「ＹＥＳ」である場合、周期検出部４＿１は、処理を終了し、調波減衰フィルタ３＿１から新たな入力信号のサンプルが供給されるのを待つ。

　一方、ステップＳａ２の判断結果が「ＮＯ」である場合、周期検出部４＿１は、状態情報保持部４１ａにおいてステップＳａ２の判断対象となった状態情報に対して、除外対象にならなかった状態情報である旨を示す情報を付加するとともに、状態情報保持部４１ａを参照し、基本周期情報および信頼度情報の算出を行う（ステップＳａ３）。

　ここで、図１０を参照し、周期検出部４＿１により行われる基本周期情報および信頼度情報の算出処理について説明する。図１０は、周期検出部４＿１により取り込まれたサンプル列が示す入力信号波形を例示している。例えば図１０における最も右側の状態ＳＴｃがステップＳａ１において検出され、ステップＳａ２を介してステップＳａ３に進んだとすると、周期検出部４＿１の基本周期推定部４２は、状態情報保持部４１ａを参照して、当該状態ＳＴｃのタイミングまでの入力信号約２．５周期分の期間内の各状態、すなわち、左から順にＳＴｄ、ＳＴａ、ＳＴｂ、ＳＴｃ、ＳＴｄ、ＳＴａ、ＳＴｂ、ＳＴｃの検出タイミングを求める。そして、周期検出部４＿１は、この求めた各検出タイミングを用いることにより、図１０に示す入力信号波形において、隣り合った正方向零交差タイミング間の時間Ｔａと、隣り合った負方向零交差タイミング間の時間Ｔｂと、隣り合った正ピーク間の時間Ｔｃと、隣り合った負ピーク間の時間Ｔｄを算出する。そして、周期検出部４＿１は、次式に従って、入力信号の基本周期情報ＴＦを算出する。

　また、周期検出部４＿１は、次式に従って、入力信号波形の基本波らしさを示す信頼度情報ＮＦを算出する。

　なお、この式（２）は例示であり、信頼度情報ＮＦは、時間Ｔａ、Ｔｂ、Ｔｃ、Ｔｄのばらつきを表現可能なものであればよい。

　このようにして基本周期情報ＴＦおよび信頼度情報ＮＦを算出すると、周期検出部４＿１の基本周期推定部４２は、その算出結果である基本周期情報ＴＦおよび信頼度情報ＮＦを出力用レジスタに保持する。周期検出部４＿１の後段の選択部５は、この出力用レジスタに基本周期情報ＴＦおよび信頼度情報ＮＦを取り込んで基本周波数推定のための演算処理に利用する。

　このステップＳａ３の処理が終了すると、周期検出部４＿１の状態検出部４１は、検出対象を更新する（ステップＳａ４）。すなわち、状態検出部４１は、現在の検出対象が状態ＳＴａである場合は検出対象を状態ＳＴｂとし、現在の検出対象が状態ＳＴｂである場合は検出対象を状態ＳＴｃとし、現在の検出対象が状態ＳＴｃである場合は検出対象を状態ＳＴｄとし、現在の検出対象が状態ＳＴｄである場合は検出対象を状態ＳＴａとする。そして、周期検出部４＿１は、処理を終了し、調波減衰フィルタ３＿１から新たな入力信号のサンプルが供給されるのを待つ。
　以上が周期検出部４＿１の処理内容である。

　図１１は周期検出部４＿１の動作例を示す波形図である。この図１１には、周期検出部４＿１が調波減衰フィルタ３＿１から取り込んだサンプル列が示す入力信号波形が例示されている。この例において、点Ｓ_１～Ｓ_１９は、状態ＳＴａ～ＳＴｄのいずれかに該当している。また、点Ｓ_１～Ｓ_１９のうち黒丸マークが示されたものは、図９のステップＳａ１の判断結果が「ＹＥＳ」、ステップＳａ２の判断結果が「ＮＯ」となって、基本周期情報ＴＦおよび信頼度情報ＮＦの算出に使用された点である。また、点Ｓ_１～Ｓ_１９のうち×マークが示されたものは、ステップＳａ１の判断結果が「ＮＯ」、あるいはステップＳａ２の判断結果が「ＹＥＳ」となって、基本周期情報ＴＦおよび信頼度情報ＮＦの算出に使用されなかった点である。

　具体的には、点Ｓ_３は状態ＳＴｄ（負ピーク）に該当するが、状態ＳＴｂ（正ピーク）である点Ｓ_２の検出の後、状態ＳＴｃ（負方向零交差）の検出を経ることなく検出されたため、ステップＳａ１において検出対象でないと判断されている。また、点Ｓ_４は状態ＳＴｂ（正ピーク）に該当するが、状態ＳＴａ（正方向零交差）の検出を経ることなく検出されたため、ステップＳａ１において検出対象でないと判断されている。点Ｓ_９およびＳ_１０も点Ｓ_３およびＳ_４と同様である。

　点Ｓ１６は、状態ＳＴｄ（負ピーク）に該当するが、この点Ｓ_１６の絶対値は、直前の状態ＳＴｂ（正ピーク）である点Ｓ_１４の絶対値から掛け離れている。このため、点Ｓ_１６に関しては、ステップＳａ２の判断結果が「ＹＥＳ」となり、検出対象から除外されている。
　点Ｓ_１７およびＳ_１８は、検出対象が状態ＳＴｄ（負ピーク）であるのに、それに該当しないため、ステップＳａ１において検出対象でないと判断されている。

　以上、周期検出部４＿１を例に説明したが、他の周期検出部４＿２～４＿ｍにおいても周期検出部４＿１と同様な処理が行われる。

　本実施形態による周期検出部４＿１～４＿ｍによれば、以上説明したように、所定の順序に従って現れない状態の出現、先行ピークに対して極端に小さいピーク等、基本波らしさを妨げる入力信号の状態を検出対象から除外しつつ、入力信号の各種の状態を検出し、基本周期情報ＴＦおよび信頼度情報ＮＦを算出することができる。従って、入力信号が高調波成分を含み、基本周期情報の推定が困難な状況においても正確に基本周期情報を推定することができる。

＜選択部＞
　選択部５は、所定のフレームレート（例えば１フレーム＝数１０サンプリング周期）で、周期検出部４＿１～４＿ｍの各出力用レジスタから基本周期情報ＴＦおよび信頼度情報ＮＦを取り込んで、基本周波数推定のための演算処理を実行する。ある時刻における最終的な基本周波数推定結果を得るためには、基本的には、周期検出部４＿１～４＿ｍのうち該当時刻において最も低い信頼度情報ＮＦを出力している周期検出部（最も基本波らしい入力信号から基本周期を推定した周期検出部）を選択し、その周期検出部が出力した基本周期情報ＴＦに基づいて基本周波数Ｆ０を算出すればよい。

　しかし、各周期検出部４＿１～４＿ｍのいずれかが、入力信号に含まれる基本波以外の高次調波を基本波と誤認し、この誤認した基本波の周期を基本周期とした場合における当該入力信号の基本波らしさが大きくなり（式（２）で算出した基本周期情報ＴＦを使用し、式（３）で算出した信頼度情報ＮＦが小さくなり）、そのような誤認に基づく「基本波らしさ」が他の周期検出部の入力信号の基本波らしさを上回る場合がある。そのような場合、基本周波数の推定に誤りが生じる。

　このような基本周波数の誤推定を防止するための一手段として、動的計画法に基づく基本周波数の推定方法が考えられる。具体的には、推定結果である基本周期情報ＴＦの時間連続性が保たれるように基本周期情報ＴＦの推定結果を選択するのである。しかしながら、この方法は、サブハーモニックを多く含む音声や雑音が混入した音声の入力信号が周期検出部４＿１～４＿ｍに与えられる場合に、却って基本周波数の誤推定を招き易くなる問題がある。

　図１２（ａ）および（ｂ）は、基本周波数の誤推定を招きやすい音声信号の例を示す図である。これらの図において、横軸は時間、縦軸は音声信号の周波数である。図１２（ａ）において領域ＶａおよびＶｂでは、音声信号の周波数変調が発生している。領域Ｖａ内の音声信号は、グロウルによる周波数変調が掛かっており、その変調周波数は約１３５Ｈｚである。領域Ｖｂ内の音声信号は、ビブラートによる周波数変調が掛かっており、その変調周波数は約５Ｈｚである。図１２（ｂ）は、図１２（ａ）における領域Ｖａ内の波形の拡大図である。このような周波数変調の掛かった音声信号、特にグロウルによる周波数変調のような高い変調周波数での周波数変調の掛かった音声信号が入力信号として与えられると、選択部５において基本周期の誤選択による基本周波数の誤推定が発生し易い。

　そこで、本実施形態では、周期検出部４＿１～４＿ｍの推定結果である基本周期情報ＴＦに基づいて最終的な基本周波数Ｆ０を求める選択部５として、非線形なコスト関数を利用した選択部５を採用している。以下、本実施形態による選択部５の詳細を説明する。

　本実施形態による選択部５は、周期検出部４＿１～４＿ｍが処理した入力信号波形の「基本波らしさ」（すなわち、推定した基本周期が入力信号の基本周期であることの確からしさ）に関するコスト関数と、基本周期の時間連続性に関するコスト関数であって非線形なコスト関数の両方を含むコスト関数の値を算出し、コスト関数値が最小となる周期検出部４＿ｋが出力した基本周期情報ＴＦ_ｋを選択して基本周波数Ｆ０を算出する。

　具体的には、選択部５は、各フレームｉにおいて、周期検出部４＿１～４＿ｍから基本周期情報ＴＦ_ｉ，ｊ（ｊ＝１～ｍ）および信頼度情報ＮＦ_ｉ，ｊ（ｊ＝１～４）を受け取る都度、次式に示すコスト関数値Ｄ_ｉ，ｊを算出する。

　上記式（３）において、Ｄ_ｉ，ｊは、フレームｉにおいて周期検出部４＿ｊ（ｊ＝１～ｍ）が出力した基本周期情報ＴＦ_ｉ，ｊを基本周波数Ｆ０の算出のために選択することについてのコスト関数値である。Ｄ_{ｉ－１，ｋ}は、フレームｉの１つ前のフレームｉ－１において行った周期検出部４＿ｋの基本周期情報ＴＦ_{ｉ－１，ｋ}の選択についてのコスト関数値である。ｄ_ｉ，ｊは、基本周期情報ＴＦ_ｉ，ｊの推定のために用いられた入力信号波形の基本波らしさに基づくコスト関数値である。また、δ_{ｉ，ｊ，ｋ}は、フレームｉにおいて周期検出部４＿ｊの基本周期情報ＴＦ_ｉ，ｊを選択する場合における基本周期の時間連続性に関するコスト関数値である。

　図１３は選択部５により行われる処理を模式的に示す図である。図１３は、選択部５が、フレームｉにおいて、基本周期に関するｊ＝２番目の仮説である基本周期情報ＴＦ_ｉ，２を選択する場合の累積コストを算出する例を示している。図示のように、選択部５は、フレームｉの１つ前のフレームｉ－１のｋ番目（ｋ＝１～Ｉ_ｉ－１）の各仮説からフレームｉのｊ＝２番目の仮説までの遷移について累積コストＤ_{ｉ－１，ｋ}＋δ_{ｉ，２，ｋ}を各々算出し、それらの累積コストの中で最小のものを選択する。そして、この最小の累積コストに対し、フレームｉのｊ＝２番目の仮説の元となった入力信号波形の基本波らしさに基づくコスト関数値ｄ_ｉ，２を加え、ｊ＝２番目の仮説である基本周期情報ＴＦ_ｉ，２を選択する場合の累積コストＤ_ｉ，２を算出するのである。以上、ｊ＝２の場合を例に説明したが、選択部５は、ｊ＝２を含む全てのｊ（＝１～Ｉ_ｉ）について式（３）に示す累積コストＤ_ｉ，ｊを算出し、その中で累積コストＤ_ｉ，ｊが最小となる基本周期情報ＴＦ_ｉ，ｊを選択し、その逆数を基本周波数Ｆ０として出力するのである。

　ここで、入力信号波形の基本波らしさに基づくコスト関数値ｄ_ｉ，ｊは、下記式（４）に従って算出される。

　この式（４）においてβは所定の定数である。

　また、基本周期情報ＴＦ_ｉ，ｊの時間連続性に関するコスト関数値δ_{ｉ，ｊ，ｋ}は、下記式（５）に従って算出される。

　この式（５）において、ＦＲＥＱ＿ＷＴは所定の定数である。また、ｇＮＬ（ξ_ｊ，ｋ）は、基本周期情報ＴＦ_{ｉ－１，ｋ}から基本周期情報ＴＦ_ｉ，ｊへの遷移量ξ_ｊ，ｋの非線形関数値である。遷移量は、例えば基本周期情報ＴＦ_{ｉ－１，ｋ}の対数と基本周期情報ＴＦ_ｉ，ｊの対数の差分である。

　図１４は非線形関数ｇＮＬ（ξ_ｊ，ｋ）の例を示す図である。図１４に示すように、非線形関数ｇＮＬ（ξ_ｊ，ｋ）は、基本周期情報の遷移量ξ_ｊ，ｋが許容範囲内である領域では関数値が僅かであり、基本周期情報の遷移量ξ_ｊ，ｋが許容範囲を越えた領域では、遷移量の増加に応じて関数値が大きく増加する関数となっている。

　本実施形態によれば、基本周期の時間連続性に関するコスト関数δ_{ｉ，ｊ，ｋ}として、このような非線形関数ｇＮＬ（ξ_ｊ，ｋ）を含むコスト関数δ_{ｉ，ｊ，ｋ}を採用している。このため、周期検出部４＿ｊ（ｊ＝１～ｍ）に対して周波数変動の激しい入力信号が与えられる状況であっても、その周波数変動の変動幅が許容範囲内である限り、コスト関数値δ_{ｉ，ｊ，ｋ}が著しく増加することはない。従って、本実施形態によれば、基本周期情報ＴＦの時間連続性を維持しつつ、ビブラートによる周波数変調やグロウルによる周波数変調の掛かった音声信号等が有する許容範囲内の周波数変動を受け容れ、音声信号の基本周波数Ｆ０を正確に推定することができる。

　図１５（ａ）～（ｃ）は本実施形態の効果を示す図である。これらの図１５（ａ）～（ｃ）には、ｍ＝４である場合の本実施形態の効果が示されている。図１５（ａ）～（ｃ）の横軸は時間である。図１５（ａ）および（ｃ）の縦軸は周波数、図１５（ｂ）の縦軸は０～１の間の数値となる信頼度情報である。

　図１５（ａ）には、周期検出部４＿１～４＿４が出力する基本周期情報ＴＦ１～ＴＦ４の逆数である各基本周波数情報Ｓ１～Ｓ４が示されている。また、図１５（ｂ）には、基本周波数情報Ｓ１～Ｓ４の元となった各基本周期情報に対応した信頼度情報が示されている。そして、図１５（ｃ）には、選択部５によって最終的に出力された基本周波数情報Ｓ２が示されている。

　図１５（ｂ）に示すように、丸囲みした区間では、基本周波数情報Ｓ２に対応した信頼度情報が一時的に低下しており、このため、基本周波数情報Ｓ４に対応した信頼度情報が基本周波数情報Ｓ２に対応した信頼度情報を上回っている。しかしながら、本実施形態では、基本周期の時間連続性に関するコスト関数を使用して基本周波数の算出に用いる基本周期情報を選択しているので、図１５（ｃ）に示すように、全区間に亙って基本周波数情報Ｓ４を推定結果として出力している。

　その一方、本実施形態では、基本周期の時間連続性に関して非線形なコスト関数δ_{ｉ，ｊ，ｋ}を採用しているので、許容範囲内の周波数変動を有する音声信号の基本周波数Ｆ０を正確に推定することができる。

［第２実施形態］
　音信号を取り扱う信号処理の中には、ＰＳＯＬＡ（Ｐｉｔｃｈ　Ｓｙｎｃｈｒｏｎｏｕｓ　ＯｖｅｒＬａｐ　Ａｄｄ）等、音信号波形中のピッチマークを利用して行う信号処理がある。ここで、ピッチマークとは、音信号における基本波の１周期毎に設定されるタイミングである。

　図１６（ａ）および（ｂ）は、ＰＳＯＬＡに基づく信号処理の例を示す波形図である。図１６（ａ）には、複数基本周期に亙る音信号Ｓａの波形と、この音信号の基本周期毎に設定されたピッチマークＭｐが示されている。ＰＳＯＬＡでは、図１６（ａ）に示すように、音信号Ｓａの基本周期毎に当該基本周期のピッチマークＭｐにおいて極大値となる窓関数Ｗ１～Ｗ５が乗算される。そして、図１６（ｂ）に示すように、窓関数の乗算された各基本周期の音信号を時間軸に沿って移動させて加算する操作が行われる。図１６（ｂ）の例では、図１６（ａ）において窓関数Ｗ２の乗算された音信号Ｓａが省略され、窓関数Ｗ１、Ｗ３、Ｗ４，Ｗ５の乗算された音信号Ｓａが時間軸上において図１６（ａ）よりも詰めて配置され、加算されている。この図１６（ｂ）の例では、音信号Ｓａのピッチが元の音信号（図１６（ａ））よりも低下している。

　このようなピッチマークを利用した信号処理において、ピッチマークは信号処理の品質を左右する重要な要素である。ＰＳＯＬＡ等では、ピッチマークの位置において極大となる窓関数を音信号に乗算するので、音波形の基本周期内において音の特徴が現れやすい位置、すなわち、窓関数の乗算により波形を変化させたくない位置をピッチマークとすることが好ましい。そのようなピッチマークとして、ＧＣＩ（Ｇｌｏｔｔａｌ　Ｃｌｏｓｕｒｅ　Ｉｎｓｔａｎｔ；声帯が閉じる瞬間）付近が良いとされている。

　ＧＣＩを検出するための技術として非特許文献２に開示されたＳＥＤＲＥＡＭＳ（Ｓｐｅａｃｈ　Ｅｖｅｎｔ　Ｄｅｔｅｃｔｉｏｎ　ｕｓｉｎｇ　Ｒｅｓｉｄｕａｌ　Ｅｘｃｉｔａｔｉｏｎ　Ａｎｄ　Ｍｅａｎ－Ｂａｓｅｄ　Ｓｉｇｎａｌ）がある。この技術では、次のようにして音信号波形からＧＣＩを検出する。

　図１７（ａ）は処理対象である音声信号の波形を例示している。この音声信号をＬＰＦに与え、音声信号の基本周波数以下の帯域の濾波信号を得る。図１７（ｂ）はこの濾波信号の波形を例示している。次に、音声信号の線形予測残差信号を生成する。図１７（ｅ）は、この線形予測残差信号の波形を例示している。音声信号において、ＧＣＩ付近は情報量が多いので線形残差予測信号にピークが発生し易い。次に図１７（ｂ）において濾波信号の負ピークから正方向零交差点までの期間をＧＣＩの検索を行う検索期間とする。図１７（ｃ）はこの検索期間を示す波形である。この図１７（ｃ）に示される波形においてＨレベルとなる期間が検索期間である。そして、線形予測残差信号の中から検索期間内の正ピークをＧＣＩとして選択する。図１７（ｅ）において×マークを記した正ピークは、このようにして選択されたＧＣＩを示している。なお、○マークを記した正ピークは、検索期間外の正ピークである。非特許文献２では、ＳＥＤＲＥＡＭＳの性能を評価するため、図１７（ａ）の音声信号を発声する人の喉の動きを示す微分ＥＧＧ（ＥｌｅｃｔｒｏＧｌｏｔｔｏＧｒａｐｈ）信号（図１７（ｄ）参照）をＧＣＩの正解値とし、この正解値とＳＤＲＥＡＭＳにより検出されたＧＣＩとの比較を行っている。この微分ＥＧＧは、ＥＧＧ測定器により得られるＥＧＧ信号を微分することにより得られる信号である。図１７（ｄ）および（ｅ）を比較すると、ＳＥＤＲＥＡＭＳにより検出されるＧＣＩ（図１７（ｅ）の×マーク）は、正解値（図１７（ｄ）の負ピーク）とよく一致していることが分かる。

　ところで、このＳＥＤＲＥＡＭＳには次のような問題がある。まず、図１７（ｂ）の濾波信号を得るために、処理対象である音声信号の基本周波数が予め分かっていなければならない。また、ＰＳＯＬＡ等の信号処理を行う場合、処理対象である信号の基本周波数とピッチマークを利用する。しかし、ＳＥＤＲＥＡＭＳでは、ピッチマークは得られるものの、このピッチマークと整合する基本周波数が得られる保障がないという問題がある。

　また、ＳＥＤＲＥＡＭＳでは、処理対象である音声信号の線形予測残差信号を利用する。これには次のような問題がある。まず、線形予測残差信号を生成するためには、少なくとも自己相関関数または自己共分散関数の計算が必要なので計算コストが大きい問題がある。また、音声信号の線形予測分析を行う際、分析窓幅や分析次数の設定が処理対象である信号の性質に合っていないと、線形予測残差信号においてＧＣＩを示すピークが明確に現れないことがある。また、線形予測残差信号では、ＧＣＩのような声帯振動に起因したピークよりも、子音や外的雑音に起因したピークが大きく出る場合が少なくなく、それらの場合にＧＣＩを検出するのが困難である。また、やわらかい発声や声帯振動の開始または終了付近の不安定期間の音声信号等、声帯がしっかり閉じていない発声により得られた音声信号の場合、線形予測残差信号にピークが現れないこともある。この場合、ＧＣＩを求めることができない。

　また、ＳＥＤＲＥＡＭＳは、処理対象である音声信号の基本周期と推定されるピッチマークとの整合性が保障されていないという問題がある。以下、この問題について説明する。

　まず、ピッチマークは、その間隔の逆数が基本波周波数と正確に一致していることが望ましい。しかし、ＳＥＤＲＥＡＭＳのようなピーク検出を基礎とする手法では、この要件を満たすことは難しい。ＳＤＲＥＡＭＳでは、時間軸上において線形予測残差信号に離散的に出現するピークのいずれかを選択することしかできないため、より連続的な基本波周波数の推移とは必ずしも一致しないのである。

　仮に基本波周波数がほぼ一定の音声信号を考える。そのような信号に対する線形予測残差信号は、図１８（ａ）のようになることがしばしばある。この線形予測残差信号のピークをピッチマークとして検出すると、それは例えば図１８（ｂ）に黒丸で示すようなものとなる。本来、この信号の基本波周波数はほぼ一定であるにも拘わらず、図中のピーク間の期間Ｔ２は期間Ｔ０や期間Ｔ１よりも突然大きくなり、期間Ｔ３は突然に小さくなる。さらにこの結果を利用して、ＰＳＯＬＡ法によりこの信号を任意の一定の基本波周波数Ｆｍ＝１／Ｔｍに変更して再合成すると、その結果は図１８（ｃ）のようになる。ピッチマークが一定間隔になるように操作したにも拘わらず、操作後の波形の基本波周波数は乱れている。すなわち、ジッタが発生する。このような合成音声は、基本波周波数の不連続性に伴う雑音を含むように聴こえる。

　この開示の第２実施形態は、以上のような事情に鑑みてなされたものであり、少ない計算コストで、処理対象である音信号の基本周波数に整合したピッチマークを安定して推定することができる信号処理装置を提供するものである。

　図１９はこの開示の第２実施形態である信号処理装置の機能構成を示すブロック図である。本実施形態による信号処理装置では、上記第１実施形態による信号処理装置（図１）の周期検出部４＿１～４＿ｍがピッチマーク推定機能の追加された周期検出部４＿１’～４＿ｍ’に置き換えられている。また、本実施形態による信号処理装置には、ピッチマークバッファ６＿１～６＿ｍと選択部７が追加されている。

　図２０は周期検出部４＿１’～４＿ｍ’が行うピッチマーク推定処理の内容を示す波形図である。図２０には、周期検出部４＿ｊ’の前段の調波減衰フィルタ３＿ｊの出力信号波形が例示されている。本実施形態において周期検出部４＿ｊ’は、調波減衰フィルタ３＿ｊの出力信号波形の負ピークとその次の正方向零交差点との間のタイミングをピッチマークとして推定する。

　具体的には、周期検出部４＿ｊ’は、調波減衰フィルタ３＿ｊの出力信号から図１９の最も右側に示された負ピークを検出したとき、図２０に示す時刻ｔ１～ｔ４を求める。ここで、時刻ｔ４は、当該負ピークとそれよりも１つ前の負ピークとの間の期間Ｔ４を２等分する時刻である。また、時刻ｔ３は、当該負ピークの直前の負方向零交差点とそれより１つ前の負方向零交差点との間の期間Ｔ３を２等分する時刻である。また、時刻ｔ２は、当該負ピークの直前の正ピークとそれより１つ前の正ピークとの間の期間Ｔ２を２等分する時刻である。また、時刻ｔ１は、当該負ピークの直前の正方向零交差点とそれより１つ前の正方向零交差点との間の期間Ｔ１を２等分する時刻である。そして、周期検出部４＿ｊ’は、次式に従ってピッチマークＭｐの時刻情報を算出する。

　調波減衰フィルタ３＿ｊの出力信号波形が完全な正弦波である場合、このピッチマークＭｐは、調波減衰フィルタ３＿ｊの出力信号波形の負ピークとその後の正方向零交差点との間に位置する。周期検出部４＿ｊ’は、調波減衰フィルタ３＿ｊの出力信号に負ピークが発生する都度、上記ｔ１～ｔ４を求め、式（６）の演算を行ってピッチマークＭｐを算出する。

　図２１は周期検出部４＿１’～４＿ｍ’が行うピッチマーク推定処理の他の例を示す波形図である。この例において、周期検出部４＿ｊ’は、調波減衰フィルタ３＿ｊの出力信号波形に正方向零交差点が発生する都度、当該正方向零交差点とその直前の正方向零交差点との間の期間Ｔの７／８の時間７Ｔ／８を求め、直前の正方向零交差点から時間７Ｔ／８だけ経過したタイミングをピッチマークＭｐとする。

　周期検出部４＿１’～４＿ｍ’は、以上のようにして調波減衰フィルタ３＿１～３＿ｍの出力信号波形からピッチマークＭｐを各々推定し、推定結果であるピッチマークＭｐを示す情報をピッチマークバッファ４＿１’～４＿ｍ’に蓄積する。選択部７は、ピッチマークバッファ４＿１’～４＿ｍ’からピッチマークＭｐの情報を各々読み出し、それらの中から１つのピッチマークＭｐの情報を選択して出力する。この選択部７の選択動作は、選択部５の選択動作と連動して行われる。すなわち、選択部５が、周期検出部４＿１’～４＿ｍ’から基本周期情報ＴＦおよび信頼度情報ＮＦを取り込み、それらの中から１つの周期検出部４＿ｊ’が出力した基本周期情報ＴＦを選択した場合、選択部７は、基本波検出部４＿ｊ’が出力したピッチマークＭｐの情報であって、選択された基本周期情報ＴＦが示す基本周期に属するピッチマークＭｐの情報を選択して出力する。従って、選択部７によって選択されるピッチマークＭｐは、選択部５から出力される基本波周波数に整合したものとなる。
　以上が本実施形態による信号処理装置の詳細である。

　図２２（ａ）～（ｃ）は本実施形態の動作を示す図である。図２２（ａ）～（ｃ）において横軸は時間である。図２２（ａ）には、本実施形態による信号処理装置の入力信号波形と選択部７から出力されるピッチマークＭｐが示されている。また、図２２（ｂ）は、図２２（ａ）の入力信号に対応した音声の発声者の喉から取得した微分ＥＧＧ信号の波形を示している。また、図２２（ｃ）は図２２（ａ）の入力信号から生成された線形予測誤差信号の波形を示している。図２２（ａ）および（ｂ）を見比べると、本実施形態において推定されたピッチマークＭｐのタイミングは、微分ＥＧＧ信号に負ピークが発生するタイミングとよく一致していることが分かる。また、本実施形態では、微分ＥＧＧ信号に負ピークが現れない期間Ｔｕにおいても、適切にピッチマークＭｐの推定が行われていることが分かる。また、時刻０．５から時刻０．６４までの期間は線形予測残差信号に明確なピークが現れないが、本実施形態では、この期間においても適切にピッチマークＭｐの推定が行われていることが分かる。

　以上のように本実施形態によれば、微分ＥＧＧ信号を利用することなく、少ない計算コストで、処理対象である音信号の基本周波数に整合したピッチマークを安定して推定することができる。

　ところで、本実施形態による信号処理装置に本来の入力信号を極性反転した信号が入力される場合がある。例えば事前に波形処理された信号が信号処理装置に入力される場合等である。このような場合、例えば図２０に示す方法でピッチマークＭｐの推定を行うとすると、調波減衰フィルタ３＿ｊの出力信号の負ピークではなく、正ピークが発生したタイミングにおいてピッチマークＭｐ推定のための演算を行う必要がある。そこで、好ましい態様では、入力信号の極性判定を行う機能が信号処理装置に設けられる。

　図２３は正負判定機能が追加された信号処理装置の構成を示すブロック図である。なお、図２３では、図面が煩雑になるのを防止するため、図１９のピッチマークバッファ６＿１～６＿ｍと選択部７の図示は省略されている。

　この態様では、調波減衰フィルタ３＿１～３＿ｍの出力信号の正負各期間毎に元の入力信号の振幅を調べることにより入力信号の極性判定を行う。これは、音声波形の振幅はＧＣＩの前後で１周期内の最大値と最小値をとるという経験的事実に基づくものである。

　この信号処理装置において、選択部５は、周期検出部４＿１’～４＿ｍ’が出力する基本周期の推定結果を選択した場合、その選択結果を候補選択部１１０に供給する。ここで、選択結果とは、基本周期の推定結果の選択を行った周期検出部４＿ｊ’の前段の調波減衰フィルタ３＿ｊの通過帯域を示すインデックスｊである。

　調波減衰フィルタ３＿１～３＿ｍの出力信号はｍ個の追加遅延部１０１に各々供給される。これらの追加遅延部１０１は、調波減衰フィルタ３＿１～３＿ｍの出力信号を遅延させ、候補選択部１１０に供給する。この遅延処理は、調波減衰フィルタ３＿１～３＿ｍの出力信号のうち最も群遅延が大きい帯域の信号に他の帯域の信号の遅延を合わせるために行われる。

　候補選択部１１０は、選択部５からの選択結果に従って、遅延処理を経た調波減衰フィルタ３＿１～３＿ｍの各出力信号のうちの１つの出力信号を選択して正負判定部１２０に供給する。さらに詳述すると、候補選択部１１０は、選択部５からの選択結果が調波減衰フィルタ３＿ｊを示している場合に、追加遅延部１０１の遅延処理を経た調波減衰フィルタ３＿ｊの出力信号を選択して正負判定部１２０に供給する。

　正負判定部１２０は、候補選択部１１０の出力信号が正である期間、正極信号ＴＰをアクティブレベル、負極信号ＴＮを非アクティブレベルとし、候補選択部１１０の出力信号が負である期間、正極信号ＴＰを非アクティブレベル、負極信号ＴＮをアクティブレベルとする。

　Ｍａｘ－ｍｉｎ部１３１は、正極信号ＴＰがアクティブレベルである期間内の直流除去フィルタ２の出力信号の最大値ｍａｘと最小値ｍｉｎの差分ｍａｘ－ｍｉｎを保持して比較部１４０に供給する。Ｍａｘ－ｍｉｎ部１３２は、負極信号ＴＮがアクティブレベルである期間内の直流除去フィルタ２の出力信号の最大値ｍａｘと最小値ｍｉｎの差分ｍａｘ－ｍｉｎを保持して比較部１４０に供給する。

　比較部１４０は、Ｍａｘ－ｍｉｎ部１３１から供給される正極性期間の差分ｍａｘ－ｍｉｎとＭａｘ－ｍｉｎ部１３２から供給される負極性期間の差分ｍａｘ－ｍｉｎとを比較する。そして、負極性期間の差分ｍａｘ－ｍｉｎが正極性期間の差分ｍａｘ－ｍｉｎより大きい場合には、入力信号が正極性であると判定し、正極性期間の差分ｍａｘ－ｍｉｎが負極性期間の差分ｍａｘ－ｍｉｎより大きい場合には、入力信号が負極性であると判定する。

　周期検出部４＿１’～４＿ｍ’では、この比較部１４０の判定結果に従って、ピッチマークの推定処理を実行する。例えば周期検出部４＿１’～４＿ｍ’は、図２０に示す処理によりピッチマークを推定するものとすると、入力信号の極性が正である場合には、調波減衰フィルタ３＿ｊの出力信号に負ピークが発生したときにピッチマーク推定のための演算処理を実行し、入力信号の極性が負である場合には、調波減衰フィルタ３＿ｊの出力信号に正ピークが発生したときにピッチマーク推定のための演算処理を実行する。あるいは，このようにピッチマーク推定のための演算処理方法を切り換える代わりに、正負判定結果に基づいて、直流除去フィルタ２の出力信号の極性を反転するか否かの切り換え制御を行ってもよい。
　以上が信号処理装置における正負判定のための機能の詳細である。

　図２４は正負判定のための処理の例を示す波形図である。この図２４において横軸は時間であり、縦軸は直流除去フィルタ２の出力信号ＳＳ２の信号値または候補選択部１１０の出力信号ＳＳ１１０の信号値である。図２４に示す例では、候補選択部１１０の出力信号ＳＳ１１０が正である期間ＴＰ内の直流除去フィルタ２の出力信号ＳＳ２の最大値と最小値との差分ｍａｘ－ｍｉｎよりも、候補選択部１１０の出力信号ＳＳ１１０が負である期間ＴＮ内の直流除去フィルタ２の出力信号ＳＳ２の最大値と最小値との差分ｍａｘ－ｍｉｎの方が大きい。このため、比較部１４０は、入力信号が正極性であると判定する。

　この正負判定は、数周期分の信号ＳＳ２について実施し、多数決により正負を決定することが好ましい。その理由は次の通りである。まず、発声開始から最初の数周期の間は、声帯振動そのものが不安定だからである。また、母音の音声信号に直前の子音（特に破裂音）の影響が残っているからである。また、雑音の混入等が原因で正負判定の誤りが発生する可能性もあるからである。

　さて、正負判定結果が切り換わると、上述したようにピッチマーク推定のための演算処理方法の切り換え、あるいは直流除去フィルタ２の出力信号の極性の反転を行うこととなる。このピッチマーク推定のための演算処理方法の切り換えや直流除去フィルタ２の出力信号の極性の反転が、有声区間の途中で行われるのは好ましくない。そこで、好ましい態様では、次のいずれかの処理により正負判定の実行タイミングを制御する。

処理ａ：選択部５に処理対象の音声信号が有声区間に属するか無声区間に属するかを判定させる。そして、最初に有声と判定された区間内の数周期を利用して正負判定を行い、以後、その正負判定結果を利用する。すなわち、その正負判定結果に基づいて、必要であればピッチマーク推定のための演算処理方法の切り換え、あるいは直流除去フィルタ２の出力信号の極性の反転を行う。音声信号が有声区間のものであるか無声区間のものであるかの判定は、例えば選択部５が選択した基本周期情報の基本波の周期らしさを示す信頼度情報に基づいて行えばよい。

処理ｂ：選択部５に処理対象の音声信号が有声区間に属するか無声区間に属するかを継続的に判定させる。そして、有声区間と判定される毎に、その有声区間の最初の数周期を利用して正負判定を行い、その正負判定結果に基づいて、必要であればピッチマーク推定のための演算処理方法の切り換え、あるいは直流除去フィルタ２の出力信号の極性の反転を行う。

処理ｃ：有声区間は常に、各有声区間の正負判定結果を蓄積してゆく。入力信号の極性が途中で変化しない場合には、時間の経過につれて正負判定結果の蓄積量が増えるので、正負判定結果の多数決の信頼度が上がってゆく。しかし、正負判定結果に基づく極性の切り換えは有声区間の途中で行うべきではないので、無声区間から有声区間の遷移時にのみ、正負判定結果に基づくピッチマーク推定のための演算処理方法の切り換え、あるいは直流除去フィルタ２の出力信号の極性の反転を実行する。なお、入力信号の極性が途中で変わる可能性も考える場合には、無声区間から有声区間への遷移タイミングにおいて、過去のすべてではなく一定時間内、例えば過去５秒間以内の正負判定結果の蓄積を参照して正負判定を行ってもよい。

　以上説明したように、この態様によれば、入力信号の極性を判定することができるので、入力信号の極性が不明である場合にも、適切にピッチマーク推定を行うことができる。

［他の実施形態］
　以上、この開示の各実施形態について説明したが、この開示には他にも実施形態が考えられる。例えば次の通りである。

（１）上記第１実施形態において信号処理装置は、ダウンサンプラ１、直流除去フィルタ２、調波減衰フィルタ３＿１～３＿ｍ、周期検出部４＿ｍおよび選択部５としての全ての演算処理を実行するものであった。しかし、信号処理装置は、これらのうちの一部の演算を他の演算装置に実行させ、その実行結果を利用するものであってもよい。例えば調波減衰フィルタ３＿１～３＿ｍの演算処理をコプロセッサに実行させ、信号処理装置がこのコプロセッサを利用して調波減衰フィルタ３＿１～３＿ｍ以外の演算処理を実行する、といった態様が考えられる。上記第２実施形態についても同様である。

（２）上記第１実施形態において、ダウンサンプラ１、直流除去フィルタ２、調波減衰フィルタ３＿１～３＿ｍ、周期検出部４＿ｍおよび選択部５の各演算処理を実行する各アプリケーションプログラムをＡＳＰ（Ａｐｐｌｉｃａｔｉｏｎ　Ｓｅｒｖｉｃｅ　Ｐｒｏｖｉｄｅｒ）のサーバに記憶させ、ユーザが所望のアプリケーションプログラムをサーバから受け取ってコンピュータに実行させるようにしてもよい。上記第２実施形態についても同様である。

（３）上記第１実施形態において、周期検出部４＿１～４＿ｍに代えて、推定した基本周期情報に基づいて基本周波数情報を算出して出力するｍ個の基本周波数検出部を設け、選択部５が、これらの基本周波数検出部が出力した基本周波数情報の中から１つの基本周波数情報を選択するようにしてもよい。上記第２実施形態についても同様である。

　ここで、本開示の実施形態を以下のようにまとめる。

　本開示の信号処理方法は、各々、異なる帯域通過特性に従って、入力信号の帯域制限を行って、前記入力信号の基本周波数の推定に用いられる信号を各々生成する複数の調波減衰フィルタ処理過程を有し、前記複数の調波減衰フィルタ処理過程の各々では、一方の過程の出力信号が他方の過程の入力信号となる累算過程およびコムフィルタ処理過程からなるフィルタ処理を１または複数回再帰的に実行し、前記累算過程では、当該累算過程に対する入力信号を累算し、前記コムフィルタ処理過程では、当該コムフィルタ処理過程に対する入力信号と当該入力信号を遅延させた信号との差分を出力する。

　本開示の信号処理方法は、例えば、前記複数の調波減衰フィルタ処理過程の後に行う複数の周期検出過程を具備し、前記複数の周期検出過程の各々は、入力信号に関する複数種類の状態の中から検出対象とする状態を所定の順序で選択しつつ前記入力信号から検出対象の状態を検出する状態検出過程と、前記状態検出過程による前記状態の検出タイミングに基づいて前記入力信号の周期を推定する周期推定過程とを具備する。

　本開示の信号処理方法は、例えば、前記状態検出過程では、前記入力信号から先行ピークを検出した後、後続ピークを検出し、当該先行ピークの振幅値の絶対値に対して当該後続ピークの振幅値の絶対値が所定の限度を越えて小さい場合に、当該後続ピークを検出しなかったものとみなす。

　本開示の信号処理方法は、例えば、前記周期推定過程では、入力信号の基本波らしさを示す信頼度情報を出力する。

　本開示の信号処理方法は、例えば、前記複数の周期検出過程から入力信号の基本周期についての推定結果を少なくとも含む出力情報を受け取り、各出力情報が示す基本周期から前記入力信号の基本周期を選択する選択過程を具備し、前記選択過程では、先行する選択結果である基本周期と前記複数の周期検出過程から各々受け取る出力情報が示す基本周期との差分を独立変数とするコスト関数であって、差分に対して関数値が非線形であるコスト関数を用いて前記基本周期の選択を行う。

　本開示の信号処理装置は、各々、異なる帯域通過特性を有し、入力信号の帯域制限を行って、前記入力信号の基本周波数の推定に用いられる信号を各々出力する複数の調波減衰フィルタを有し、前記複数の調波減衰フィルタの各々が、自身に対する入力信号を累算する累算器と、自身に対する入力信号と当該入力信号を遅延させた信号との差分を出力するコムフィルタとを縦続接続してなるフィルタを含む。

　縦続接続された累算器とコムフィルタとを含む調波減衰フィルタは、緩やかな肩特性を有するローパスフィルタとして機能し、入力信号中の基本波成分と適度に減衰された高次調波成分を含む信号を出力する。いずれの調波減衰フィルタの出力信号も、入力信号に比べれば高次調波成分が基本波成分よりも減衰しており、入力信号波形よりも基本波らしい波形の信号となる。従って、この開示によれば、少ない個数の調波減衰フィルタにより、基本周波数の推定に利用可能な信号を得ることができる。よって、基本周波数の推定のための演算量あるいはハードウェアを少なくし、基本周波数の推定を高速に行うことができる。

　入力信号の基本周波数を推定するための一方法として、その基本周波数に対応した基本周期を入力信号から推定することが考えられる。ここで、基本周期を推定する対象である入力信号が高次調波成分を含む場合、その高次調波成分の影響により基本波成分と関係のないピークが入力信号波形に現れる等の原因により基本周期の推定が困難になる場合がある。そこで、入力信号が高次調波を含む場合には、高次調波に起因した基本周期の誤推定に対して頑健な基本周期の推定手段が必要である。

　そこで、この開示の信号処理装置は、入力信号に関する複数種類の状態の中から検出対象とする状態を所定の順序で選択しつつ前記入力信号から検出対象の状態を検出する状態検出手段と、前記状態検出手段による前記状態の検出タイミングに基づいて前記入力信号の基本周期を推定する周期推定手段とを具備する。

　また、本開示の信号処理方法は、入力信号に関する複数種類の状態の中から検出対象とする状態を所定の順序で選択しつつ前記入力信号から検出対象の状態を検出する状態検出過程と、前記状態検出過程による前記状態の検出タイミングに基づいて前記入力信号の周期を推定する周期推定過程とを具備する。

　この開示によれば、複数種類の状態の中から検出対象とする状態を所定の順序で選択しつつ入力信号から検出対象の状態を検出するので、入力信号中に含まれる高次調波成分の影響を避けて、基本周期の推定に有用な各種の状態の出現タイミングを検出することができる。従って、高次調波に起因した基本周期の誤推定に対して頑健な基本周期推定を実現することができる。

　入力信号波形に基づいて基本周期の推定を行う基本周期推定手段を利用した場合、入力信号に含まれる高次調波成分の強度や雑音の影響が大きくなると、高次調波成分を基本波成分と誤認する可能性が高くなる。この対策として、例えば異なる帯域通過特性を有する複数の調波減衰フィルタに入力信号を与え、各調波減衰フィルタの出力信号を複数の基本周期推定手段に与え、基本周期の時間連続性が維持されるように各基本周期推定手段が推定した基本周期の中から１つの基本周期を選択するという構成を採用することが考えられる。

　この構成によれば、一部の基本周期推定手段において基本周期の誤推定が発生したとしても、基本周期の時間連続性が維持されるように他の基本周期推定手段の推定した基本周期が選択されるので、誤推定による基本周期が選択されるのを防止することができる。

　しかしながら、基本周期の推定対象である入力信号が周波数変動の激しい音声信号であるような場合、実際に基本周期が変動しているにも拘わらず、基本周期の時間連続性が優先され、誤った基本周期が選択される可能性がある。

　そこで、この開示の信号処理装置は、複数の基本波推定部から入力信号の基本波成分に関する推定結果である基本波情報を受け取り、これらの基本波情報から１つの基本波情報を選択する選択部を具備し、前記選択部は、先行する選択結果である基本波情報と前記複数の基本波推定部から各々受け取る基本波情報との差分を独立変数とするコスト関数であって、前記差分に対して関数値が非線形であるコスト関数を用いて前記基本波情報の選択を行う。

　また、本開示の信号処理方法は、複数の基本波推定部から入力信号の基本波成分に関する推定結果である基本波情報を受け取り、これらの基本波情報から１つの基本波情報を選択する選択過程を具備し、前記選択過程では、先行する選択結果である基本波情報と前記複数の基本波推定部から各々受け取る基本波情報との差分を独立変数とするコスト関数であって、前記差分に対して関数値が非線形であるコスト関数を用いて前記基本波情報の選択を行う。

　ここで、基本波情報とは、例えば基本周期または基本周波数を示す情報である。この開示によれば、基本周波数情報の時間連続性を維持しつつ許容範囲内の基本周波数情報の時間変動を許容して、適切に基本周波数情報の選択を行うことができる。

　音信号に関する信号処理の中には、ピッチマークを利用した信号処理がある。このようなピッチマークを利用した信号処理では、音信号の基本周期が連続的に時間変化する場合に、信号処理に用いられるピッチマークが音信号の基本周期と整合するものでないと、質のよい信号処理とならない。しかしながら、これまで音信号の基本周期との整合性がよいピッチマークが得られるピッチマーク推定手段は提供されていなかった。

　そこで、この開示は、各々、異なる帯域通過特性を有し、入力信号の帯域制限を行って出力する複数の調波減衰フィルタと、前記複数の調波減衰フィルタの出力信号に基づいて、前記入力信号の基本波成分を各々推定する複数の基本波推定部と、前記複数の調波減衰フィルタの出力信号に基づいて、前記複数の基本波推定部により推定される基本波の１周期毎にピッチマークを各々推定する複数のピッチマーク推定部と、前記複数の基本波推定部により推定された基本波成分および前記複数のピッチマーク推定部により推定されたピッチマークの中から１つの共通の調波減衰フィルタの出力信号に基づいて推定された基本波成分およびピッチマークを選択する選択手段とを具備することを特徴とする信号処理装置を提供する。

　また、本開示の情報処理方法は、各々、異なる帯域通過特性に従って、入力信号の帯域制限を行って出力する複数の調波減衰フィルタ処理過程と、前記複数の調波減衰フィルタの出力信号に基づいて、前記入力信号の基本波成分を各々推定する複数の基本波推定過程と、前記複数の調波減衰フィルタ処理過程の出力信号に基づいて、前記複数の基本波推定過程により推定させる基本波の１周期毎にピッチマークを各々推定する複数のピッチマーク推定過程と、前記複数の基本波推定過程により推定された基本波成分および前記複数のピッチマーク推定過程により推定されたピッチマークの中から共通の調波減衰フィルタの出力信号に基づいて推定された基本波成分およびピッチマークを選択する選択過程とを具備する。

　本開示の信号処理方法は、例えば、前記ピッチマーク推定過程は、前記調波減衰フィルタ処理過程の出力信号の負ピークと正方向零交差点との中間のタイミングを前記ピッチマークとして推定する。

　本開示の信号処理方法は、例えば、前記調波減衰フィルタ処理過程の出力信号の正期間および負期間の各々における前記調波減衰フィルタ処理過程の入力信号の最大値と最小値の差分を比較することにより前記調波減衰フィルタ処理過程の入力信号の極性を判定する極性判定過程を具備し、前記ピッチマーク推定過程は、前記極性判定過程の判定結果に基づいて前記ピッチマークの推定を行う。

　この開示によれば、入力信号の基本周期が時間変化する場合に、その基本周期との整合性がよいピッチマークが得られる。従って、ピッチマークを利用した信号処理の質を高めることができる。

　本出願は、２０１６年１月６日に出願された日本特許出願（特願２０１６－００１３７０）及び２０１６年３月２５日に出願された日本特許出願（特願２０１６－０６１９２８）に基づくものであり、ここに参照として取り込まれる。

　本開示によれば、調波減衰フィルタ処理過程により、基本周波数の推定に利用可能な信号を得ることができる。よって、基本周波数の推定のための演算量あるいはハードウェアを少なくし、基本周波数の推定を高速に行うことができるため有用である。

１……ダウンサンプラ
２……直流除去フィルタ
３＿１～３＿ｍ……調波減衰フィルタ
４＿１～４＿ｍ，４＿１～４＿ｍ’……周期検出部
５，７……選択部
３０＿１～３０＿Ｍ１……巡回型移動平均フィルタ
３０ａ，１０ａ……累算器
３０ｂ，１０ｂ……コムフィルタ
３１……加算器
３４，２３，２２３……減算器
３２，３３，２２１，２２２，２２５……遅延器
１０ｃ……デシメータ
３０ｃ，１０ｄ……シフタ
２１……遅延部
２２，ＭＡ１，ＭＡ２……移動平均部
２２６……乗算器
４１……状態検出部
４１ａ……状態情報保持部
４２……基本周期推定部
６＿１～６＿ｍ……ピッチマークバッファ
１０１……追加遅延部
１１０……候補選択部
１２０……正負判定部
１３１，１３２……Ｍａｘ－ｍｉｎ部
１４０……比較部

Claims

　各々、異なる帯域通過特性に従って、入力信号の帯域制限を行って、前記入力信号の基本周波数の推定に用いられる信号を各々生成する複数の調波減衰フィルタ処理過程を有し、
　前記複数の調波減衰フィルタ処理過程の各々では、一方の過程の出力信号が他方の過程の入力信号となる累算過程およびコムフィルタ処理過程からなるフィルタ処理を１または複数回再帰的に実行し、
　前記累算過程では、当該累算過程に対する入力信号を累算し、
　前記コムフィルタ処理過程では、当該コムフィルタ処理過程に対する入力信号と当該入力信号を遅延させた信号との差分を出力することを特徴とする信号処理方法。
　前記複数の調波減衰フィルタ処理過程の後に行う複数の周期検出過程を具備し、
　前記複数の周期検出過程の各々は、
　入力信号に関する複数種類の状態の中から検出対象とする状態を所定の順序で選択しつつ前記入力信号から検出対象の状態を検出する状態検出過程と、
　前記状態検出過程による前記状態の検出タイミングに基づいて前記入力信号の周期を推定する周期推定過程と
　を具備することを特徴とする請求項１に記載の信号処理方法。
　前記状態検出過程では、前記入力信号から先行ピークを検出した後、後続ピークを検出し、当該先行ピークの振幅値の絶対値に対して当該後続ピークの振幅値の絶対値が所定の限度を越えて小さい場合に、当該後続ピークを検出しなかったものとみなすことを特徴とする請求項２に記載の信号処理方法。
　前記周期推定過程では、入力信号の基本波らしさを示す信頼度情報を出力することを特徴とする請求項２または３に記載の信号処理方法。
　前記複数の周期検出過程から入力信号の基本周期についての推定結果を少なくとも含む出力情報を受け取り、各出力情報が示す基本周期から前記入力信号の基本周期を選択する選択過程を具備し、
　前記選択過程では、先行する選択結果である基本周期と前記複数の周期検出過程から各々受け取る出力情報が示す基本周期との差分を独立変数とするコスト関数であって、差分に対して関数値が非線形であるコスト関数を用いて前記基本周期の選択を行うことを特徴とする請求項２～４のいずれか１項に記載の信号処理方法。
　入力信号に関する複数種類の状態の中から検出対象とする状態を所定の順序で選択しつつ前記入力信号から検出対象の状態を検出する状態検出過程と、
　前記状態検出過程による前記状態の検出タイミングに基づいて前記入力信号の周期を推定する周期推定過程と
　を具備することを特徴とする信号処理方法。
　複数の基本波推定部から入力信号の基本波成分に関する推定結果である基本波情報を受け取り、これらの基本波情報から１つの基本波情報を選択する選択過程を具備し、
　前記選択過程では、先行する選択結果である基本波情報と前記複数の基本波推定部から各々受け取る基本波情報との差分を独立変数とするコスト関数であって、前記差分に対して関数値が非線形であるコスト関数を用いて前記基本波情報の選択を行うことを特徴とする信号処理方法。
　各々、異なる帯域通過特性に従って、入力信号の帯域制限を行って出力する複数の調波減衰フィルタ処理過程と、
　前記複数の調波減衰フィルタの出力信号に基づいて、前記入力信号の基本波成分を各々推定する複数の基本波推定過程と、
　前記複数の調波減衰フィルタ処理過程の出力信号に基づいて、前記複数の基本波推定過程により推定させる基本波の１周期毎にピッチマークを各々推定する複数のピッチマーク推定過程と、
　前記複数の基本波推定過程により推定された基本波成分および前記複数のピッチマーク推定過程により推定されたピッチマークの中から共通の調波減衰フィルタの出力信号に基づいて推定された基本波成分およびピッチマークを選択する選択過程と
　を具備することを特徴とする信号処理方法。
　前記ピッチマーク推定過程は、前記調波減衰フィルタ処理過程の出力信号の負ピークと正方向零交差点との中間のタイミングを前記ピッチマークとして推定することを特徴とする請求項８に記載の信号処理方法。
　前記調波減衰フィルタ処理過程の出力信号の正期間および負期間の各々における前記調波減衰フィルタ処理過程の入力信号の最大値と最小値の差分を比較することにより前記調波減衰フィルタ処理過程の入力信号の極性を判定する極性判定過程を具備し、
　前記ピッチマーク推定過程は、前記極性判定過程の判定結果に基づいて前記ピッチマークの推定を行うことを特徴とする請求項８または９に記載の信号処理方法。
　各々、異なる帯域通過特性を有し、入力信号の帯域制限を行って、前記入力信号の基本周波数の推定に用いられる信号を各々出力する複数の調波減衰フィルタを有し、
　前記複数の調波減衰フィルタの各々が、
　自身に対する入力信号を累算する累算器と、
　自身に対する入力信号と当該入力信号を遅延させた信号との差分を出力するコムフィルタと
　を縦続接続してなるフィルタを含むことを特徴とする信号処理装置。
　入力信号に関する複数種類の状態の中から検出対象とする状態を所定の順序で選択しつつ前記入力信号から検出対象の状態を検出する状態検出手段と、
　前記状態検出手段による前記状態の検出タイミングに基づいて前記入力信号の周期を推定する周期推定手段と
　を具備することを特徴とする信号処理装置。
　複数の基本波推定部から入力信号の基本波成分に関する推定結果である基本波情報を受け取り、これらの基本波情報から１つの基本波情報を選択する選択部を具備し、
　前記選択部は、先行する選択結果である基本波情報と前記複数の基本波推定部から各々受け取る基本波情報との差分を独立変数とするコスト関数であって、前記差分に対して関数値が非線形であるコスト関数を用いて前記基本波情報の選択を行うことを特徴とする信号処理装置。
　各々、異なる帯域通過特性を有し、入力信号の帯域制限を行って出力する複数の調波減衰フィルタと、
　前記複数の調波減衰フィルタの出力信号に基づいて、前記入力信号の基本波成分を各々推定する複数の基本波推定部と、
　前記複数の調波減衰フィルタの出力信号に基づいて、前記複数の基本波推定部により推定される基本波の１周期毎にピッチマークを各々推定する複数のピッチマーク推定部と、
　前記複数の基本波推定部により推定された基本波成分および前記複数のピッチマーク推定部により推定されたピッチマークの中から１つの共通の調波減衰フィルタの出力信号に基づいて推定された基本波成分およびピッチマークを選択する選択手段と
　を具備することを特徴とする信号処理装置。