WO2024053353A1

WO2024053353A1 - 信号処理装置、及び、信号処理方法

Info

Publication number: WO2024053353A1
Application number: PCT/JP2023/029675
Authority: WO
Inventors: 旭原田; 宏幸江原
Original assignee: パナソニックインテレクチュアルプロパティコーポレーションオブアメリカ
Priority date: 2022-09-08
Filing date: 2023-08-17
Publication date: 2024-03-14

Abstract

信号処理装置は、ステレオ信号に関するパラメータに応じて、ステレオ信号のクロススペクトルの振幅に基づく重み付け係数を異ならせる制御回路と、重み付け係数を用いて重み付けされたクロススペクトルに基づいて、ステレオ信号のチャネル間時間差を検出する検出回路と、を具備する。

Description

信号処理装置、及び、信号処理方法

　本開示は、信号処理装置、及び、信号処理方法に関する。

　例えば、ステレオ音声音響信号（以下、ステレオ信号とも呼ぶ）に対する符号化技術がある（例えば、特許文献１を参照）。

特開２０２０－６０７８８号公報

Charles H. Knapp and G. Clifford Carter, "The Generalized Correlation Method for Estimation of Time Delay," IEEE Trans. on Acoustics, Speech, and Signal Processing, vol. ASSP-24, no.4, pp.320-327, 1976

　ステレオ信号の符号化において、チャネル間時間差（ITD：inter-channel time difference）の推定方法について検討の余地がある。

　本開示の非限定的な実施例は、ステレオ信号の符号化におけるITD推定性能を向上できる信号処理装置、及び、信号処理方法の提供に資する。

　本開示の一実施例に係る信号処理装置は、ステレオ信号に関するパラメータに応じて、前記ステレオ信号のクロススペクトルの振幅に基づく重み付け係数を異ならせる制御回路と、前記重み付け係数を用いて重み付けされた前記クロススペクトルに基づいて、前記ステレオ信号のチャネル間時間差を検出する検出回路と、を具備する。

　なお、これらの包括的または具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラム、または、記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。

　本開示の一実施例によれば、ステレオ信号の符号化におけるITD推定性能を向上できる。

　本開示の一実施例における更なる利点および効果は、明細書および図面から明らかにされる。かかる利点および／または効果は、いくつかの実施形態並びに明細書および図面に記載された特徴によってそれぞれ提供されるが、１つまたはそれ以上の同一の特徴を得るために必ずしも全てが提供される必要はない。

音声音響信号の伝送システムの構成例を示す図 ITD分析符号化部の構成例を示すブロック図 ITD分析符号化処理の例を示すフローチャート ITD分析符号化部の構成例を示すブロック図 ITD分析符号化処理の例を示すフローチャート ITD分析符号化部の構成例を示すブロック図 ITD分析符号化処理の例を示すフローチャート ITD分析符号化処理の例を示すフローチャート

　以下、本開示の実施の形態について図面を参照して詳細に説明する。

　ステレオ信号の符号化方法の一つに、Lチャネル（Left channel又はL-ch）及びRチャネル（Right channel又はR-ch）を含むステレオ信号に対するチャネル間時間差（ITD：inter-channel time difference）によってステレオ信号をパラメータ化する方法がある。

　ステレオ信号のチャネル間時間差（ITD）は、LチャネルとRチャネルとの間の音が到達する時間差に関するパラメータである。例えば、ITDの推定（又は、検出）では、ステレオ信号に含まれるチャネル信号のペアの高速フーリエ変換（FFT：Fast Fourier Transform）スペクトルに基づいてクロススペクトルが計算される。そして、クロススペクトルを逆高速フーリエ変換（IFFT：Inverse Fast Fourier Transform）した時間領域のチャネル間相互相関（ICC：inter-channel cross correlation）のピーク位置に対するタイムラグに基づいてITDが推定される。

　ITDの推定方法の一つとして、GCC-PHAT（generalized cross-correlation phase transform）法がある（例えば、非特許文献１を参照）。なお、GCC-PHAT法は、CSP（cross-power spectrum phase analysis）法と呼ばれることもある。

　GCC-PHAT法では、例えば、ステレオ信号に含まれるチャネル信号のペアのFFTスペクトルから計算されるクロススペクトルに対して、当該クロススペクトルの振幅の逆数で重み付けが行われる。そして、GCC-PHAT法では、重み付けされたクロススペクトルをIFFTした時間領域のチャネル間相互相関（ICC）のピーク位置に対するタイムラグに基づいてITDが推定される。

　GCC-PHAT法によるITD推定では、クロススペクトルに対する当該クロススペクトル振幅の逆数による重み付けによって、クロススペクトルを白色化し、クロススペクトルの位相成分（例えば、位相情報）を利用してITDを推定することを特徴とする。

　ここで、例えば、ステレオ信号にゼロ振幅の周波数成分が多く含まれる場合が有り得る。ステレオ信号にゼロ振幅の周波数成分が多く含まれる場合として、例えば、ステレオ信号のトーン性（tonality）が高い場合が挙げられる。例えば、ステレオ信号にゼロ振幅の周波数成分が多く含まれる場合において、GCC-PHAT法によるITD推定では、ゼロ振幅の周波数成分に対する、振幅成分の逆数による重み付け（例えば、白色化）が適当でなくなる場合があり得る。この場合、ITDの推定性能が劣化する可能性がある（例えば、ITDがゼロになり得る）。

　本開示の非限定的な一実施例では、ステレオ信号にゼロ振幅の周波数成分が多く含まれる場合でも、ITDの推定性能を向上させ、符号化性能を向上させる方法について説明する。

　本開示の非限定的な一実施例では、入力信号（例えば、ステレオ信号）がゼロ振幅の周波数成分を多く含む場合（例えば、トーン性が高い場合）に対してロバストなITD推定方法について説明する。例えば、ITD推定を行う際に、ステレオ信号に関するパラメータ（例えば、クロススペクトルの最大振幅、スペクトル平坦度（SFM：spectral flatness measurement）等）に応じて、クロススペクトル振幅に基づく重み付けを適応的に変化させる（又は、異ならせる）。これにより、ステレオ信号にゼロ振幅の周波数成分が多く含まれる場合（例えば、トーン性が高い場合）でも、ITDの推定性能を向上できる。

　（実施の形態１）
　［音声音響信号の伝送システムの構成例］
　図１は、音声信号又は音響信号（例えば、音声音響信号と呼ぶ）の伝送システムの構成例を示す図である。図１（ａ）は、音声音響信号符号化装置（以下、「符号化装置」と呼ぶ）の構成例を示し、図１（ｂ）は、音声音響信号復号装置（以下、「復号装置」と呼ぶ）の構成例を示す。

　［符号化装置の構成例］
　図１（ａ）に示す符号化装置１０は、例えば、入力部１１、A/D変換部１２、ITD分析符号化部１３、時間差調整部１４、ステレオ符号化部１５、及び、多重化部１６を備えてよい。

　入力部１１は、例えば、入力される音声音響信号（例えば、空気の振動）を電気信号（例えば、アナログ信号）に変換し、アナログ信号をA/D変換部１２に出力する。

　A/D変換部１２は、例えば、入力部１１から入力されるアナログ信号をデジタル信号に変換し、デジタル信号をITD分析符号化部１３及び時間差調整部１４に出力する。

　なお、符号化装置１０において、入力部１１及びA/D変換部１２の少なくとも一つは、ステレオ信号を扱うために複数（例えば２つ）備えてもよい。

　ITD分析符号化部１３は、例えば、A/D変換部１２から入力されるステレオ信号のチャネル間時間差（ITD）を推定して符号化する。ITD分析符号化部１３は、推定したITD（例えば、符号化結果を復号したITD）を時間差調整部１４に出力し、ITDの符号化結果を多重化部１６に出力する。例えば、ITD分析符号化部１３は、ステレオ信号のチャネル信号のペアのFFTスペクトルから計算されるクロススペクトルをIFFTした時間領域のチャネル間相互相関のピーク位置に対するタイムラグを特定する処理を行ってよい。また、ITD分析符号化部１３は、例えば、ITD推定の際に、クロススペクトルの振幅の逆数に基づく重み付けを行ってもよい。ITD分析符号化部１３における処理の例については後述する。

　時間差調整部１４は、ITD分析符号化部１３から入力されるITDを用いて、A/D変換部１２から入力されるステレオ信号のLチャネルとRチャネルとの時間差を調整する処理（例えば、時間的なずれをなくして揃える処理）を行い、調整後のステレオ信号をステレオ符号化部１５に出力する。

　ステレオ符号化部１５は、時間差調整部１４から入力される時間調整後のステレオ信号の符号化を行い、符号化結果を多重化部１６に出力する。

　以下、ステレオ符号化部１５の内部の構成例について説明する。

　ステレオ符号化部１５は、例えば、信号を時間領域から周波数領域の信号に変換する変換部（例えば、FFT部）と、ステレオ情報抽出部と、ダウンミックス部と、符号化部と、を備えてよい（図示せず）。

　変換部は、例えば、ステレオ符号化部１５に入力されるステレオ信号（例えば、Lチャネル信号及びRチャネル信号）をチャネル毎に時間領域から周波数領域のデータ（例えば，FFTスペクトル）に変換し、ステレオ情報抽出部及びダウンミックス部へ出力する。

　ステレオ情報抽出部は、例えば、各チャネルのFFTスペクトルに基づいて、ステレオ情報を抽出してよい。一例として、ステレオ情報抽出部は、チャネル間レベル差（ILD：inter-channel level difference）、ICC、チャネル間位相差（IPD：inter-channel phase difference）といったバイノーラルキューによってステレオ信号をパラメータ化し、ダウンミックス部及び符号化部へ出力してよい。

　ダウンミックス部は、例えば、変換部から出力される各チャネルのFFTスペクトルと、ステレオ情報抽出部から出力されるバイノーラルキューのパラメータとに基づいて、Lチャネル及びRチャネルの少なくとも一つのFFTスペクトルを修正（又は、操作）し、ダウンミックス処理を行い、Mid信号（例えば、M信号とも呼ぶ）及びSide信号（例えば、S信号とも呼ぶ）を生成してよい。例えば、ダウンミックス部は、M=(L'+R')/2、及び、S=(L'-R')/2となるダウンミックスを行い、M信号及びS信号を符号化部へ出力してよい。ここで、MはMid信号、SはSide信号、L'は修正したLチャネルのFFTスペクトル、R'は修正したRチャネルのFFTスペクトルを示す。

　符号化部は、例えば、ダウンミックス部から出力されるM信号とS信号、及び、ステレオ情報抽出部から出力されるバイノーラルキューのパラメータをそれぞれ符号化し、符号化データを、ステレオ符号化部１５の出力信号として出力する。

　以上、ステレオ符号化部１５の内部の構成例について説明した。

　なお、ステレオ符号化部１５は、上述した符号化方式に限定されず、例えば、Moving Picture Experts Group（MPEG）、3rd Generation Partnership Project（3GPP）又はInternational Telecommunication Union Telecommunication Standardization Sector（ITU-T）といった標準化された種々の音声音響コーデックを備えてもよい。

　多重化部１６は、ステレオ符号化部１５から入力される符号化データ（例えば、ステレオ符号化情報と呼ぶ）と、ITD分析符号化部１３から入力される符号化データ（例えば、ITD符号化情報と呼ぶ）とを多重化して、通信網又は記憶媒体（図示せず）を介して、多重化した符号化情報を復号装置２０に送信する。

　［復号装置の構成例］
　図１（ｂ）に示す復号装置２０は、例えば、分離部２１、ITD復号部２２、ステレオ復号部２３、時間差調整部２４、D/A変換部２５、及び、出力部２６を備えてよい。

　分離部２１は、例えば、通信網又は記憶媒体（図示せず）を介して符号化情報を受信し、多重化された符号化情報を分離し、ITD符号化情報をITD復号部２２に出力し、ステレオ符号化情報をステレオ復号部２３に出力する。

　ITD復号部２２は、分離部２１から入力されるITD符号化情報からITDを復号して、復号されたITD（以下、復号ITDと呼ぶ）を時間差調整部２４に出力する。

　ステレオ復号部２３は、分離部２１から入力されるステレオ符号化情報からステレオ信号を復号して、復号されたステレオ信号（以下、復号ステレオ信号と呼ぶ）を時間差調整部２４に出力する。

　以下、ステレオ復号部２３の内部の構成例について説明する。

　ステレオ復号部２３は、例えば、復号部、アップミックス部、ステレオ情報合成部、及び、信号を周波数領域から時間領域の信号に変換する変換部（例えば、IFFT部）を備えてよい（図示せず）。

　復号部は、入力されるステレオ符号化情報を、符号化装置１０側で使用された符号化方式に対応する復号方式を用いて復号し、例えば、M信号とS信号、及び、バイノーラルキューのパラメータをアップミックス部及びステレオ情報合成部へ出力する。復号部は、例えば、MPEG、3GPP、又はITU-Tといった標準化された種々の音声音響コーデックを備えてもよい。

　アップミックス部は、例えば、復号部から入力されるM信号及びS信号に基づいて、アップミックス処理を行ってよい。例えば、アップミックス部は、L'=M+S、R'=M-Sとなるアップミックス処理を行い、FFTスペクトルのL'信号及びR'信号をステレオ情報合成部へ出力する。

　ステレオ情報合成部は、例えば、復号部から入力されるバイノーラルキューのパラメータ、及び、アップミックス部から入力されるFFTスペクトルのL'信号及びR'信号を用いて、符号化装置１０（例えば、ステレオ情報抽出部）と逆の操作を行い、FFTスペクトルのL信号及びR信号を変換部へ出力してよい。

　変換部は、例えば、FFTスペクトルのL信号及びR信号を、時間領域のLチャネル及びRチャネルのデジタル信号にチャネル毎に変換して、デジタル信号をステレオ復号部２３の出力信号（例えば、復号ステレオ信号）として出力する。

　以上、ステレオ復号部２３の構成例について説明した。

　時間差調整部２４は、ITD復号部２２から入力される復号ITDを用いて、ステレオ復号部２３から入力される復号ステレオ信号に対して、チャネル間時間差の調整（例えば、時間を揃えた信号を元の時間差を有した信号に戻す処理）を行い、時間調整後の復号ステレオ信号を、D/A変換部２５に出力する。

　D/A変換部２５は、例えば、時間差調整部２４から入力されるデジタル信号を音声音響信号（アナログ信号）に変換し、出力部２６に出力する。

　出力部２６は、D/A変換部２５から入力されるアナログ信号を、例えば、スピーカを介して空気振動に変換して出力する。

　なお、復号装置２０は、ステレオ信号を扱うために、D/A変換部２５及び出力部２６の少なくとも一つを複数（例えば2つ）備えてもよい。

　［ITD分析符号化部の構成例］
　次に、ITD分析符号化部１３の構成例について説明する。図２は、ITD分析符号化部１３の構成例を示すブロック図である。また、図３は、図２に示すITD分析符号化部１３の動作例を示すフローチャートである。

　ITD分析符号化部１３は、例えば、クロススペクトルの振幅の逆数を用いてクロススペクトルの重み付けを行う。

　図２に示すITD分析符号化部１３（例えば、信号処理装置に対応）は、例えば、FFT部１０１、クロススペクトル算出部１０２、振幅計算部１０３、クロススペクトル重み付け部１０４（例えば、制御回路に対応）、IFFT部１０５、及び、ITD検出部１０６（例えば、検出回路に対応）を備えてよい。

　FFT部１０１には、例えば、時間領域のステレオ信号（例えば、Lチャネル（例えば、lで表す）、及び、Rチャネル（例えば、rで表す））が１チャネルずつ独立して入力されてよい。FFT部１０１は、例えば、時間領域のチャネル信号を周波数領域信号（以下、「FFTスペクトル」と呼ぶ）に変換する（例えば、図３のＳ１１）。FFT部１０１は、FFTスペクトルに関する情報をクロススペクトル算出部１０２へ出力する。なお、時間領域信号から周波数領域信号へ変換する方法は、FFTに限定されず、他の方法でもよい。

　クロススペクトル算出部１０２は、FFT部１０１から入力される各チャネルのFFTスペクトルに基づいて、クロススペクトルを計算する（例えば、図３のＳ１２）。クロススペクトル算出部１０２は、得られたクロススペクトルに関する情報を振幅計算部１０３及びクロススペクトル重み付け部１０４に出力する。

　振幅計算部１０３は、例えば、クロススペクトル算出部１０２から入力されるクロススペクトルに関する情報に基づいて、クロススペクトルの振幅（又は、振幅スペクトルと呼ぶ）を計算し、クロススペクトルの振幅スペクトルに関する情報をクロススペクトル重み付け部１０４に出力する。

　クロススペクトル重み付け部１０４は、例えば、振幅計算部１０３から入力されるクロススペクトルの振幅スペクトルの逆数を計算し、振幅スペクトルの逆数を重み付け係数に設定する。そして、クロススペクトル重み付け部１０４は、クロススペクトル算出部１０２から入力されるクロススペクトルに対して、重み付け係数（例えば、クロススペクトル振幅の逆数）で重み付けを行う（例えば、図３のＳ１３）。クロススペクトル重み付け部１０４は、重み付けされたクロススペクトルをIFFT部１０５へ出力する。

　IFFT部１０５は、例えば、クロススペクトル重み付け部１０４において重み付けされたクロススペクトルを周波数領域から時間領域の信号へ変換する（例えば、図３のＳ１４）。IFFT部１０５は、重み付けされた相互相関関数（例えば、白色化された相互相関関数）としてITD検出部１０６へ出力する。なお、周波数領域信号から時間領域信号へ変換する方法は、IFFTに限定されず、他の方法でもよい。

　ITD検出部１０６は、例えば、IFFT部１０５から出力される相互相関関数（例えば、白色化相互相関関数とも呼ぶ）に基づいて、ITDを検出（又は、推定）する（例えば、図３のＳ１４）。

　例えば、IFFT部１０５において得られる相互相関関数CSP_1,2(τ)は、次式(1-1)のように表される。

　式(1-1)において、Φ_1,2(ω)はクロススペクトルを示す。また、Wgは重み付け係数を示し、次式(1-2)のように表される。

　式(1-2)において、|Φ_1,2(ω)|は、クロススペクトルの振幅（振幅スペクトル）を示す。

　このように、図２に示すITD分析符号化部１３は、ステレオ信号のクロススペクトル振幅|Φ_1,2(ω)|に基づく重み付け係数Wgを用いて重み付けされたクロススペクトルに基づいてITDを検出する。

　上述したように、ITD分析符号化部１３では、例えば、ステレオ信号にゼロ振幅の周波数成分（例えば、FFTスペクトル成分）が多く含まれる場合、クロススペクトル振幅の逆数に基づく重み付け係数Wgによるクロススペクトルの白色化において、重み付けが適当でなくなり、ITDの推定性能が低下する可能性がある。以下では、一例として、ステレオ信号にゼロ振幅の周波数成分（例えば、FFTスペクトル成分）が多く含まれる場合でもITDの推定精度を向上する方法について説明する。

　図４は、本実施の形態に係るITD分析符号化部１３ａの構成例を示すブロック図である。

　図４に示すITD分析符号化部１３ａ（例えば、信号処理装置に対応）は、例えば、図２に示すITD分析符号化部１３の構成と比較して、最大振幅検出部１１１が追加され、クロススペクトル重み付け部１０４がクロススペクトル重み付け部１１２（例えば、制御回路に対応）に置き換わる。図４に示すITD分析符号化部１３ａにおいて、最大振幅検出部１１１及びクロススペクトル重み付け部１１２と異なる構成部は、例えば、図２と同様でよい。

　また、図５は、図４に示すITD分析符号化部１３ａの動作例を示すフローチャートである。図５において、図３と同様の処理には同様の符号を付し、その説明を省略する。

　図４において、最大振幅検出部１１１は、振幅計算部１０３から入力される現フレームのクロススペクトルの振幅スペクトルに基づいて、クロススペクトルの振幅の最大値（例えば、最大振幅と呼ぶ）を検出する（図５に示すＳ２１）。最大振幅検出部１１１は、検出したクロススペクトルの最大振幅に関する情報をクロススペクトル重み付け部１１２へ出力する。

　クロススペクトル重み付け部１１２は、例えば、振幅計算部１０３から入力されるクロススペクトルの振幅スペクトル、及び、最大振幅検出部１１１から入力されるクロススペクトルの最大振幅に基づいて、重み付け係数を設定（又は、算出）する。そして、クロススペクトル重み付け部１１２は、クロススペクトル算出部１０２から入力されるクロススペクトルに対して、重み付け係数で重み付けを行う（例えば、図５のＳ２２）。クロススペクトル重み付け部１１２は、重み付けされたクロススペクトルをIFFT部１０５へ出力する。

　なお、最大振幅検出部１１１は、クロススペクトルの最大振幅に関する情報の代わりに、クロススペクトルの最大振幅の位置に関する情報（例えば、どのスペクトル成分が最大振幅であるかを示す情報）をクロススペクトル重み付け部１１２へ出力してもよい。この場合、クロススペクトル重み付け部１１２は、振幅計算部１０３から入力されるクロススペクトルの振幅スペクトルのうち、最大振幅検出部１１１から入力される最大振幅の位置に対応する振幅スペクトルをクロススペクトルの最大振幅に決定してよい。

　例えば、IFFT部１０５において得られる相互相関関数AdpCSP_1,2(τ)は、次式(2-1)のように表される。

　式(2-1)において、Φ_1,2(ω)はクロススペクトルを示す。また、AdpWgは重み付け係数を示し、次式(2-2)のように表される。

　式(2-2)において、|Φ_1,2(ω)|は、クロススペクトルの振幅（振幅スペクトル）を示し、Cは、クロススペクトルの最大振幅に応じて重み付け係数AdpWgを変化させるための重み制御係数を示す。このように、ITD分析符号化部１３ａは、クロススペクトルの最大振幅に応じて、クロススペクトルの振幅|Φ_1,2(ω)|に基づく重み付け係数AdpWgを異ならせる。

　例えば、式(2-2)において、Cの値は、クロススペクトルの最大振幅の1万分の1～10万分の1程度の定数に設定されてもよい。この場合、式(2-2)に示す重み制御係数Cは、振幅|Φ_1,2(ω)|の大きい成分（例えば、ピーク成分）に対して十分に小さく、重み付け係数AdpWgの設定に対して影響を及ぼしにくい（例えば、誤差程度の値となる）。その一方で、式(2-2)に示す重み制御係数Cは、振幅|Φ_1,2(ω)|の小さい成分（例えば、ゼロ振幅成分）に対して大きく、重み付け係数AdpWgの設定に対して影響を及ぼしやすくなる。このため、例えば、式(2-2)に示す重み付け係数AdpWgは、振幅|Φ_1,2(ω)|の大きい成分（例えば、ピーク成分）に対して、ほぼ振幅の逆数の値となり、振幅がゼロに近い成分（例えば、ゼロ振幅成分）に対して、ほぼゼロの値となり得る。

　これにより、例えば、重み付け係数AdpWgの計算式（例えば、式(2-2)）は、式(1-2)からの変更を少なく抑え（例えば、重み制御係数Cの追加のみ）、クロススペクトル重み付け部１１２は、クロススペクトルの最大振幅に応じたクロススペクトルの重み付けが可能となる。

　このように、本実施の形態では、ITD分析符号化部１３ａは、クロススペクトルの最大振幅に応じて、クロススペクトルに対する重み付け係数を異ならせる。

　例えば、ITD分析符号化部１３ａは、振幅の大きい成分に対して、クロススペクトル振幅の逆数と同程度の値で重み付けを行い、クロススペクトルを白色化できる。また、例えば、ITD分析符号化部１３ａは、振幅の小さい成分に対して、クロススペクトル振幅の逆数よりも小さい値で重み付けを行い、振幅成分をより低減できる（例えば、抑圧できる、又は、弱められる）。これにより、ステレオ信号にゼロ振幅の周波数成分が多く含まれる場合（例えば、トーン性が高い場合）でも、ITD分析符号化部１３ａは、クロススペクトルの重み付けを適切に行うことができ、ITDの推定精度を向上できる。

　よって、本実施の形態によれば、ステレオ信号にゼロ振幅の周波数成分が多く含まれる場合でも、ITDの推定精度を向上させ、符号化性能を向上できる。

　なお、重み制御係数Cは、例えば、C=|CrSpMax|・Dで表されてもよい。ここで、CrSpMaxは、最大振幅検出部１１１において検出されるクロススペクトルの最大振幅を示す。また、Dは、Cの調整を行う係数であり、例えば、D=10^-α又はD=2^-βといった値を取り得る。例えば、α及びβは、重み付けの強さの影響（例えば、度合い）を調整するための係数である。

　例えば、係数αは、正の値を取りうる。係数αの値が小さいほど、重み付け係数AdpWgは小さくなり、ゼロ振幅の周波数成分を弱めやすくなる。その一方で、係数αの値が大きいほど、重み付け係数AdpWgは大きくなる。例えば、α>10では、重み制御係数Cを用いない重み付けづけ（例えば、式(1-2)）と同等となる。また、例えば、3≦α≦6の範囲の値が望ましいことが実験的に分かっている。

　また、例えば、係数βは、正の値を取りうる。係数βの値が小さいほど、重み付け係数AdpWgは小さくなり、ゼロ振幅の周波数成分を弱めやすくなる。その一方で、係数βの値が大きいほど、重み付け係数AdpWgは大きくなる。例えば、10≦β≦20の範囲の値が望ましいことが実験的に分かっている。

　なお、Cの算出方法、及び、Dの算出方法（例えば、α、βの設定値）は上述した例に限定されない。

　（実施の形態２）
　本実施の形態では、スペクトル平坦度（SFM）を用いてITD推定を行う場合について説明する。

　図６は、本実施の形態に係るITD分析符号化部１３ｂの構成例を示すブロック図である。

　図６に示すITD分析符号化部１３ｂ（例えば、信号処理装置に対応）は、例えば、図４に示すITD分析符号化部１３ａの構成と比較して、SFM算出部１２１が追加され、クロススペクトル重み付け部１１２がクロススペクトル重み付け部１２２（例えば、制御回路に対応）に置き換わる。図６に示すITD分析符号化部１３ｂにおいて、SFM算出部１２１及びクロススペクトル重み付け部１２２と異なる構成部は、例えば、図２又は図４と同様でよい。

　また、図７は、図６に示すITD分析符号化部１３ｂの動作例を示すフローチャートである。図７において、図５と同様の処理には同様の符号を付し、その説明を省略する。

　図６において、SFM算出部１２１は、例えば、FFT部１０１から入力される各チャネルのFFTスペクトルに基づいて、スペクトル平坦度（SFM）を算出する（例えば、図７のＳ３１）。例えば、入力信号のトーン性（又は、調性、tonality）又は周期性が強いほど、SFMは低くなる（例えば、SFMについては特許文献１を参照）。SFM算出部１２１は、算出したSFMに関する情報をクロススペクトル重み付け部１２２に出力する。

　クロススペクトル重み付け部１２２は、例えば、振幅計算部１０３から入力されるクロススペクトルの振幅スペクトル、最大振幅検出部１１１から入力されるクロススペクトルの最大振幅、及び、SFM算出部１２１から入力されるSFMに基づいて、重み付け係数を設定（又は、算出）する。そして、クロススペクトル重み付け部１２２は、クロススペクトル算出部１０２から入力されるクロススペクトルに対して、重み付け係数で重み付けを行う（例えば、図７のＳ３２）。クロススペクトル重み付け部１２２は、重み付けされたクロススペクトルをIFFT部１０５へ出力する。

　例えば、IFFT部１０５において得られる相互相関関数AdpCSP_1,2(τ)は、次式(3-1)のように表される。

　式(3-1)において、Φ_1,2(ω)はクロススペクトルを示す。また、AdpWgは重み付け係数を示し、次式(3-2)のように表される。

　式(3-2)において、|Φ_1,2(ω)|は、クロススペクトルの振幅（振幅スペクトル）を示し、Cは、クロススペクトルの最大振幅に応じて重み付け係数AdpWgを変化させるための重み制御係数を示し、sfmはスペクトル平坦度を示すパラメータである。

　例えば、ステレオ信号のFFTスペクトルが平坦であるほど（又は、トーン性が低いほど）、sfmは1.0に近い値となり、ステレオ信号のFFTスペクトルが平坦でないほど（又は、トーン性が高いほど）、sfmは0に近い値となる。よって、例えば、式(3-2)では、ステレオ信号のFFTスペクトルが平坦であるほど（又は、トーン性が低いほど）、(1-sfm)は0に近い値となり、ステレオ信号のFFTスペクトルが平坦でないほど（又は、トーン性が高いほど）、(1-sfm)は1.0に近い値となる。

　また、式(3-2)において、係数Cは、実施の形態１と同様の重み制御係数でよい。

　式(3-2)では、重み制御係数Cに(1-sfm)が乗じられる。これにより、スペクトル平坦度sfmが低いほど（例えば、トーン性が高いほど）、重み付け係数AdpWgはより小さく設定される。

　例えば、式(3-2)において、トーン性が低いほど（sfmが大きいほど）、重み付け係数AdpWgの設定に対する重み制御係数Cの影響が小さくなり、重み付け係数AdpWgは、式(1-2)に示すWgの値に近づくように制御される。よって、トーン性が低いほど、振幅が小さい成分に対する重み付け係数Adpwgは大きくなり、クロススペクトルが白色化されやすくなる。

　その一方で、例えば、式(3-2)において、トーン性が高いほど（sfmが小さいほど）、重み付け係数AdpWgの設定に対する重み制御係数Cの影響が大きくなり、重み付け係数AdpWgは、式(2-2)に示すAdpWgの値に近づくように制御される。よって、トーン性が高いほど、振幅が小さい成分（例えば、ゼロ振幅成分）に対する重み付け係数AdpWgは小さくなり、クロススペクトルの当該成分は低減される（例えば、弱められる）。

　これにより、例えば、重み付け係数AdpWgの計算式（例えば、式(3-2)）は、式(1-2)からの変更を少なく抑え（例えば、重み制御係数C及びスペクトル平坦度sfmの追加のみ）、クロススペクトル重み付け部１２２は、クロススペクトルの最大振幅及びスペクトルの平坦度（又は、トーン性）に応じたクロススペクトルの重み付けが可能となる。

　このように、本実施の形態では、ITD分析符号化部１３ｂは、クロススペクトルの最大振幅、及び、ステレオ信号のスペクトル平坦度に応じて、クロススペクトルに対する重み付け係数を異ならせる。

　例えば、ITD分析符号化部１３ｂは、トーン性が低いステレオ信号に対して、クロススペクトル振幅の逆数と同程度の値で重み付けを行い、クロススペクトルを白色化できる。また、例えば、ITD分析符号化部１３ｂは、トーン性が高いステレオ信号に対して、振幅の大きさ（例えば、クロススペクトルの最大振幅）に応じた重み付けを行い、クロススペクトルの振幅が小さい成分をより低減できる（例えば、抑圧できる、又は、弱められる）。

　これにより、ステレオ信号にゼロ振幅の周波数成分が多く含まれる場合（例えば、トーン性が高い場合）でも、ITD分析符号化部１３ｂは、クロススペクトルの重み付けを適切に行うことができ、ITDの推定精度を向上できる。また、ITD分析符号化部１３ｂは、スペクトル平坦度（SFM）に基づいて、トーン性に応じてITD推定を安定して行うことができ、ITDの推定精度を向上できる。

　（実施の形態２の変形例１）
　例えば、クロススペクトル重み付け部１２２は、スペクトル平坦度sfmと閾値Thとを比較して、フレーム処理毎に重み付け係数を異ならせてもよい。

　例えば、クロススペクトル重み付け部１２２は、スペクトル平坦度sfmが閾値Th以上の場合に第１重み付け係数を設定し、スペクトル平坦度sfmが閾値Th未満の場合に、第１重み付け係数より小さい第２重み付け係数を設定してよい。これにより、例えば、スペクトル平坦度sfmが閾値Th未満の場合（例えば、トーン性が高い場合）、重み付けにより、振幅の小さい成分を低減できる。

　以下、重み付け係数の設定例について説明する。なお、以下の重み付け係数の意味は、上述した実施の形態１及び実施の形態２で説明した通りである。

　＜例１＞
　例えば、クロススペクトル重み付け部１２２は、sfm≧Thの場合、以下の重み付け係数に設定してよい。

　また、例えば、クロススペクトル重み付け部１２２は、sfm＜Thの場合、以下の重み付け係数に設定してよい。

　＜例２＞
　例えば、クロススペクトル重み付け部１２２は、sfm≧Thの場合、以下の重み付け係数に設定してよい。

　＜例３＞
　例えば、クロススペクトル重み付け部１２２は、sfm≧Th1の場合、以下の重み付け係数に設定してよい。

　また、例えば、クロススペクトル重み付け部１２２は、Th2≦sfm＜Th1の場合、以下の重み付け係数に設定してよい。

　また、例えば、クロススペクトル重み付け部１２２は、sfm＜Th2の場合、以下の重み付け係数に設定してよい。

　（実施の形態２の変形例２）
　図８は、変形例２に係るITD分析符号化部１３ｂの動作例を示すフローチャートである。図８において、図３、図５又は図７と同様の処理には同様の符号を付し、その説明を省略する。

　クロススペクトル重み付け部１２２は、sfm≧Th1の場合（Ｓ４１：Ｙｅｓ）、例えば、式(1-2)のように、クロススペクトル振幅の逆数に基づく重み付け係数でクロススペクトルの重み付けを行う（Ｓ４２）。

　また、クロススペクトル重み付け部１２２は、Th2≦sfm＜Th1の場合（Ｓ４１：ＮｏかつＳ４３：Ｎｏ）、例えば、式(3-2)のように、クロススペクトル振幅、クロススペクトルの最大振幅、及び、SFMに基づく重み付け係数でクロススペクトルの重み付けを行う（Ｓ４４）。なお、Ｓ４４の処理における重み付けは、これに限定されず、例えば、式(2-2)のように、クロススペクトルの振幅、及び、クロススペクトルの最大振幅に基づく重み付け係数に基づく重み付けでもよい。

　また、クロススペクトル重み付け部１２２は、sfm＜Th2の場合（Ｓ４３：Ｙｅｓ）、例えば、クロススペクトル振幅、クロススペクトルの最大振幅及びSFMに加え、クロススペクトル振幅の桁数とクロススペクトルの最大振幅の桁数との差（以下、振幅の桁数差とも呼ぶ）に基づく重み付け係数でクロススペクトルの重み付けを行う（Ｓ４５）。

　また、例えば、Ｓ４２の処理及びＳ４４の処理では、クロススペクトル重み付け部１２２は、各フレーム内のクロススペクトル全てに対する一律の重み付けを適用する。その一方で、Ｓ４５の処理では、クロススペクトル重み付け部１２２は、例えば、各フレーム内のスペクトル成分（例えば、スペクトルビン）毎に重み付けを個別に適用してもよい。

　例えば、クロススペクトル重み付け部１２２は、振幅の桁数差（例えば、クロススペクトル最大振幅の桁数－クロススペクトル振幅の桁数）に応じて、クロススペクトルの最大振幅に応じた重み制御係数C（=|CrSpMax|・D、ただし、D=10^-α）のパラメータであるαの値を異ならせてもよい。クロススペクトル重み付け部１２２は、例えば、振幅の桁数差が大きいほど、αの値を小さく設定し（例えば、重み制御係数Cを大きく設定し）、重み付け係数を小さく設定してもよい。

　例えば、重み制御係数Cにおいて、αの値のデフォルト値をα=5に設定し、図８に示すsfmの閾値Th2をTh2=0.2に設定する場合について説明する。なお、Th2の値は0.2に限定されず、他の値でもよい。

　例えば、sfm<Th2（例えば、sfm<0.2）の場合、クロススペクトル重み付け部１２２は、スペクトルビン（ω）毎に重み付け係数を設定し、設定した重み付け係数に基づいてクロススペクトルの重み付けを行ってよい。

　例えば、ω=ω₁において、振幅の桁数差が3以下の場合（例えば、クロススペクトル最大振幅の桁数－クロススペクトル振幅の桁数≦3）、クロススペクトル重み付け部１２２は、αの値を5に設定してよい。例えば、重み制御係数C=|CrSpMax|・10^-5に設定される。

　また、例えば、ω=ω₂において、振幅の桁数差が3より大きく、かつ、5以下の場合（例えば、3＜（クロススペクトル最大振幅の桁数－クロススペクトル振幅の桁数）≦5）、クロススペクトル重み付け部１２２は、αの値を4に設定（又は、置換）してよい。例えば、重み制御係数C=|CrSpMax|・10^-4に設定される。これにより、デフォルト値（α=5）と比較して、重み付け係数はより小さく設定され、クロススペクトルの振幅は低減されやすくなる。

　また、例えば、ω=ω₃において、振幅の桁数が5より大きい場合（例えば、クロススペクトル最大振幅の桁数－クロススペクトル振幅の桁数＞5）、クロススペクトル重み付け部１２２は、αの値を3に設定（又は、置換）してよい。例えば、重み制御係数C=|CrSpMax|・10^-3に設定される。これにより、デフォルト値（α=5）及びα=4の場合と比較して、重み付け係数は更に小さく設定され、クロススペクトルの振幅はより低減されやすくなる。

　このように、クロススペクトルの振幅の桁数差が大きいほど、重み付け係数をより小さく設定することにより、クロススペクトルの各成分において、ピーク（最大振幅）に対する振幅が小さい成分（例えば、ゼロ振幅の周波数成分）を重み付けにより弱めることができ、ITDの推定性能を向上できる。

　なお、図８では、Ｓ４５の処理において、クロススペクトル振幅、クロススペクトルの最大振幅、SFM、及び、振幅の桁数差を用いて重み付けが行われる場合について説明したが、これに限定されない。例えば、クロススペクトル重み付け部１２２は、クロススペクトル振幅、クロススペクトルの最大振幅、及び、振幅の桁数差を用いて（例えば、SFMを用いずに）、重み付けを行ってもよい。

　または、例えば、クロススペクトル重み付け部１２２は、クロススペクトル振幅、及び、振幅の桁数差を用いて（例えば、クロススペクトルの最大振幅及びSFMを用いずに）、重み付けを行ってもよい。この場合、例えば、重み付け係数における重み制御係数Cとして、C=10^αを適用し、振幅の桁数差に応じて、重み制御係数C（αの値）が設定されてもよい。

　また、図８では、２つの閾値Th1及びTh2を用いる場合について説明したが、閾値が１つの場合、又は、閾値が３つ以上の場合についても適用可能である。

　また、αの値は、3～5の範囲に限定されず、他の値でもよい。

　また、変形例２では、クロススペクトルの振幅の桁数差に応じて重み付け係数を設定する例について説明したが、これに限定されない。例えば、重み付け係数は、クロススペクトルの各スペクトルビンの振幅と、クロススペクトルの最大振幅との差分（又は、比率）を表す値に応じて設定されてもよい。

　また、変形例２では、一例として、スペクトルビン毎の重み付け係数の設定について説明したが、重み付け係数を設定する単位は、スペクトルビンの単位に限定されず、例えば、スペクトルビンを少なくとも一つ含むグループの単位でもよい。

　（実施の形態２の変形例３）
　変形例３では、クロススペクトル重み付け部１２２は、例えば、スペクトルの極大又は極小（以下、「スペクトルのピーク」と呼ぶ）に対して、スペクトルビンの重み付け係数を適応的に制御する。

　例えば、スペクトルのピーク位置は、差分スペクトルの正負が反転する位置に基づいて検出されてもよい。なお、スペクトルのピーク位置の検出方法は、差分スペクトルの正負反転位置に基づく方法に限定されず、他の方法でもよい。

　また、スペクトルのピーク位置は、スペクトルの最大振幅を基準とした或る閾値より大きいピークに限定してもよい。例えば、クロススペクトル重み付け部１２２は、閾値以下の振幅のピークをスペクトルのピーク位置として用いなくてもよい。

　クロススペクトル重み付け部１２２は、例えば、sfm、及び、sfmに対する閾値Thを用いて、フレーム処理毎に、下記のように重み付け係数を設定（又は、変更、切り替え）してもよい。なお、重み付け係数の意味は、上述した実施の形態１、実施の形態２、及び、変形例の通りである。

　例えば、クロススペクトル重み付け部１２２は、sfm≧Thの場合、以下の重み付け係数に設定してよい。

　また、例えば、クロススペクトル重み付け部１２２は、sfm＜Thの場合、以下の重み付け係数に設定してよい。例えば、クロススペクトル重み付け部１２２は、検出したピーク位置に対して第１重み付け係数を設定し、ピーク位置と異なる位置に対して、第１重み付け係数より小さい第２重み付け係数を設定してよい。

　このように、sfmがTh未満の場合（例えば、トーン性が高い場合）、ピーク位置では、クロススペクトルは、当該クロススペクトルの振幅の逆数によって白色化される。

　また、sfmがTh未満の場合（例えば、トーン性が高い場合）、ピーク位置以外の位置では、クロススペクトルの振幅は、ピーク位置と比較してより低減される。例えば、重み付け係数=(sfm×A)/|Φ_1,2(ω)|の場合、sfmが低いほど、重み付け係数が小さく設定され、クロススペクトルの振幅が低減される。また、例えば、重み付け係数=0の場合、sfmの値に依らず、クロススペクトルの振幅が0に設定される。

　このように、クロススペクトルのピーク位置に基づいて重み付け係数を適応的に制御することにより、クロススペクトルのピーク位置では、クロススペクトルを白色化し、ピーク位置と異なる位置では、クロススペクトルのピークに対する振幅が小さい成分（例えば、ゼロ振幅の周波数成分）を低減しやすくなり、ITDの推定精度を向上できる。

　なお、ピーク位置以外のクロススペクトルの重み付け係数には、上述した複数の例のうち何れか一つが適用されてもよく、または、スペクトルピークの大きさ又は振幅スペクトルの大きさに応じて、上述した複数の例が切り替えられてもよい。

　また、sfmに対する閾値Thは、１つに限定されず、複数の閾値が設定されてもよい。クロススペクトル重み付け部１２２は、例えば、sfmと複数の閾値との比較に応じて、上述した重み付け係数の何れかを適用してもよい。

　以上、実施の形態２の変形例について説明した。

　なお、式(3-2)において、(1-sfm)の代わりに、(Th-sfm)を用いてもよい。ここで、Thは、sfmに対する閾値を示す。例えば、Thは、0<Th≦1の範囲の値に設定されてよい。一例として、Th=0.2に設定されてよい。

　また、例えば、(Th-sfm)の項をσ=γ-ε×sfmで表してもよい。例えば、γ=1、ε=1の場合、σ=1-sfmで表され、式(3-2)と同様となる。また、例えば、γ=Th、ε=1の場合、σ=Th-sfmで表される。

　また、例えば、（γ-ε×sfm）が0以下の場合（例えば、ε×sfm≧γの場合）には、σ=0に設定されてよい。一例として、γ=Th=0.2、ε=1の場合、(Th-sfm)が0以下の場合、すなわち、sfm≧0.2の場合、σ=0に設定される。これにより、sfm≧0.2の場合には、重み付け係数AdpWgは、式(1-2)のように、クロススペクトルの振幅|Φ_1,2(ω)|の逆数に設定される。その一方で、sfm＜0.2の場合には、重み付け係数AdpWgは、重み制御係数C（例えば、クロススペクトルの最大振幅）に応じた値に設定される。

　このように、σ=γ-ε×sfmを用いることにより、上述したようなsfmとThとの比較による重み付け係数AdpWgの計算式の切り替えを行うことなく、重み付け係数AdpWgを適切に設定できる。

　例えば、γ及びεは、sfmに応じて設定されてよい。例えば、γ及びεは、振幅の小さい成分に対する重み付け（例えば、重み付け係数）をどの程度小さく設定するかを制御する係数として使用されてよい。例えば、γが大きいほど、重み付け係数AdpWgの設定に対する重み制御係数Cの影響度は高く、振幅の小さい成分に対する重み付けを小さくしやすい。また、例えば、εが小さいほど、重み付け係数AdpWgの設定に対する重み制御係数Cの影響度は高く、振幅の小さい成分に対する重み付けを小さくしやすい。

　なお、γ及びεの少なくとも一つは、上述した値に限定されず、他の値でもよい。また、γ及びεの少なくとも一つは、固定の値でもよく、可変の値でもよい。

　以上、本開示の実施の形態について説明した。

　なお、上記実施の形態では、クロススペクトルの最大振幅に応じた重み制御係数Cの設定について説明したが、重み制御係数Cの設定に用いるパラメータは、クロススペクトルの最大振幅に限定されない。例えば、重み制御係数Cは、クロススペクトル振幅の最大振幅、平均値、及び、最小振幅のうち少なくとも一つに応じて設定されてもよい。または、重み制御係数Cの設定に用いるパラメータは、クロススペクトルの振幅に依らない固定値でもよい。

　また、上記実施の形態では、ステレオ信号に含まれるゼロ振幅の周波数成分が多いか否か（例えば、トーン性又は周期性を有するか否か）を判断するためのパラメータとして、SFMを用いる場合について説明したが、これに限定されず、他のパラメータでもよい。

　以上、図面を参照しながら各種の実施形態について説明したが、本開示はかかる例に限定されないことは言うまでもない。また、上述した各実施の形態における各構成要素を任意に組み合わせてもよい。

　また、上述した実施の形態における「・・・部」という表記は、「・・・回路（circuitry）」、「・・・デバイス」、「・・・ユニット」、又は、「・・・モジュール」といった他の表記に置換されてもよい。

　本開示はソフトウェア、ハードウェア、又は、ハードウェアと連携したソフトウェアで実現することが可能である。上記実施の形態の説明に用いた各機能ブロックは、部分的に又は全体的に、集積回路であるＬＳＩとして実現され、上記実施の形態で説明した各プロセスは、部分的に又は全体的に、一つのＬＳＩ又はＬＳＩの組み合わせによって制御されてもよい。ＬＳＩは個々のチップから構成されてもよいし、機能ブロックの一部または全てを含むように一つのチップから構成されてもよい。ＬＳＩはデータの入力と出力を備えてもよい。ＬＳＩは、集積度の違いにより、ＩＣ、システムＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩと呼称されることもある。

　集積回路化の手法はＬＳＩに限るものではなく、専用回路、汎用プロセッサ又は専用プロセッサで実現してもよい。また、ＬＳＩ製造後に、プログラムすることが可能なＦＰＧＡ（Field Programmable Gate Array）や、ＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。本開示は、デジタル処理又はアナログ処理として実現されてもよい。

　さらには、半導体技術の進歩または派生する別技術によりＬＳＩに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。

　本開示は、通信機能を持つあらゆる種類の装置、デバイス、システム（通信装置と総称）において実施可能である。通信装置は無線送受信機（トランシーバー）と処理／制御回路を含んでもよい。無線送受信機は受信部と送信部、またはそれらを機能として、含んでもよい。無線送受信機（送信部、受信部）は、ＲＦ（Ｒａｄｉｏ　Ｆｒｅｑｕｅｎｃｙ）モジュールと１または複数のアンテナを含んでもよい。ＲＦモジュールは、増幅器、ＲＦ変調器／復調器、またはそれらに類するものを含んでもよい。通信装置の、非限定的な例としては、電話機（携帯電話、スマートフォン等）、タブレット、パーソナル・コンピューター（ＰＣ）（ラップトップ、デスクトップ、ノートブック等）、カメラ（デジタル・スチル／ビデオ・カメラ等）、デジタル・プレーヤー（デジタル・オーディオ／ビデオ・プレーヤー等）、着用可能なデバイス（ウェアラブル・カメラ、スマートウオッチ、トラッキングデバイス等）、ゲーム・コンソール、デジタル・ブック・リーダー、テレヘルス・テレメディシン（遠隔ヘルスケア・メディシン処方）デバイス、通信機能付きの乗り物又は移動輸送機関（自動車、飛行機、船等）、及び上述の各種装置の組み合わせがあげられる。

　通信装置は、持ち運び可能又は移動可能なものに限定されず、持ち運びできない又は固定されている、あらゆる種類の装置、デバイス、システム、例えば、スマート・ホーム・デバイス（家電機器、照明機器、スマートメーター又は計測機器、コントロール・パネル等）、自動販売機、その他ＩｏＴ（Ｉｎｔｅｒｎｅｔ　ｏｆ　Ｔｈｉｎｇｓ）ネットワーク上に存在し得るあらゆる「モノ（Things）」をも含む。

　通信には、セルラーシステム、無線ＬＡＮ（Local Area Network）システム、通信衛星システム等によるデータ通信に加え、これらの組み合わせによるデータ通信も含まれる。

　また、通信装置には、本開示に記載される通信機能を実行する通信デバイスに接続又は連結される、コントローラやセンサー等のデバイスも含まれる。例えば、通信装置の通信機能を実行する通信デバイスが使用する制御信号やデータ信号を生成するような、コントローラやセンサーが含まれる。

　また、通信装置には、上記の非限定的な各種装置と通信を行う、あるいはこれら各種装置を制御する、インフラストラクチャ設備、例えば、基地局、アクセスポイント、その他あらゆる装置、デバイス、システムが含まれる。

　本開示の一実施例において、前記パラメータは、前記クロススペクトルの振幅の最大値を含み、前記制御回路は、前記最大値に基づいて、前記重み付け係数を設定する。

　本開示の一実施例において、前記パラメータは、前記ステレオ信号のスペクトル平坦度を含み、前記制御回路は、前記スペクトル平坦度が低いほど、前記重み付け係数を小さく設定する。

　本開示の一実施例において、前記パラメータは、前記ステレオ信号のスペクトル平坦度を含み、前記制御回路は、前記スペクトル平坦度が閾値以上の場合に第１の重み付け係数を設定し、前記スペクトル平坦度が前記閾値未満の場合に、前記第１の重み付け係数より小さい第２の重み付け係数を設定する。

　本開示の一実施例において、前記制御回路は、前記クロススペクトルの成分毎に、当該成分の振幅値と、前記クロススペクトルの振幅の最大値との差分を表す値に応じて、前記重み付け係数を設定する。

　本開示の一実施例において、前記差分を表す値は、前記成分の振幅値と前記最大値との間の桁数の差であり、前記制御回路は、前記桁数の差が大きいほど、前記成分に対する前記重み付け係数を小さく設定する。

　本開示の一実施例において、前記制御回路は、前記クロススペクトルのピーク位置を検出し、前記ピーク位置に対して第１の重み付け係数を設定し、前記ピーク位置と異なる位置に対して、前記第１の重み付け係数より小さい第２の重み付け係数を設定する。

　本開示の一実施例において、前記パラメータは、前記ステレオ信号のスペクトル平坦度を含み、前記制御回路は、前記スペクトル平坦度に基づいて、前記第２の重み付け係数を設定する。

　本開示の一実施例に係る信号処理方法において、信号処理装置は、ステレオ信号に関するパラメータに応じて、前記ステレオ信号のクロススペクトルの振幅に基づく重み付け係数を異ならせ、前記重み付け係数を用いて重み付けされた前記クロススペクトルに基づいて、前記ステレオ信号のチャネル間時間差を検出する。

　２０２２年９月８日出願の特願２０２２－１４２８９９の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。

　本開示の一実施例は、符号化システム等に有用である。

　１０　符号化装置
　１１　入力部
　１２　A/D変換部
　１３，１３ａ，１３ｂ　ITD分析符号化部１３
　１４，２４　時間差調整部
　１５　ステレオ符号化部
　１６　多重化部
　２０　復号装置
　２１　分離部
　２２　ITD復号部
　２３　ステレオ復号部
　２５　D/A変換部
　２６　出力部
　１０１　FFT部
　１０２　クロススペクトル算出部
　１０３　振幅計算部
　１０４，１１２，１２２　クロススペクトル重み付け部
　１０５　IFFT部
　１０６　ITD検出部
　１１１　最大振幅検出部
　１２１　SFM算出部

Claims

　ステレオ信号に関するパラメータに応じて、前記ステレオ信号のクロススペクトルの振幅に基づく重み付け係数を異ならせる制御回路と、
　前記重み付け係数を用いて重み付けされた前記クロススペクトルに基づいて、前記ステレオ信号のチャネル間時間差を検出する検出回路と、
　を具備する信号処理装置。
　前記パラメータは、前記クロススペクトルの振幅の最大値を含み、
　前記制御回路は、前記最大値に基づいて、前記重み付け係数を設定する、
　請求項１に記載の信号処理装置。
　前記パラメータは、前記ステレオ信号のスペクトル平坦度を含み、
　前記制御回路は、前記スペクトル平坦度が低いほど、前記重み付け係数を小さく設定する、
　請求項２に記載の信号処理装置。
　前記パラメータは、前記ステレオ信号のスペクトル平坦度を含み、
　前記制御回路は、前記スペクトル平坦度が閾値以上の場合に第１の重み付け係数を設定し、前記スペクトル平坦度が前記閾値未満の場合に、前記第１の重み付け係数より小さい第２の重み付け係数を設定する、
　請求項２に記載の信号処理装置。
　前記制御回路は、前記クロススペクトルの成分毎に、当該成分の振幅値と、前記クロススペクトルの振幅の最大値との差分を表す値に応じて、前記重み付け係数を設定する、
　請求項１に記載の信号処理装置。
　前記差分を表す値は、前記成分の振幅値と前記最大値との間の桁数の差であり、
　前記制御回路は、前記桁数の差が大きいほど、前記成分に対する前記重み付け係数を小さく設定する、
　請求項５に記載の信号処理装置。
　前記制御回路は、前記クロススペクトルのピーク位置を検出し、前記ピーク位置に対して第１の重み付け係数を設定し、前記ピーク位置と異なる位置に対して、前記第１の重み付け係数より小さい第２の重み付け係数を設定する、
　請求項１に記載の信号処理装置。
　前記パラメータは、前記ステレオ信号のスペクトル平坦度を含み、
　前記制御回路は、前記スペクトル平坦度に基づいて、前記第２の重み付け係数を設定する、
　請求項７に記載の信号処理装置。
　信号処理装置は、
　ステレオ信号に関するパラメータに応じて、前記ステレオ信号のクロススペクトルの振幅に基づく重み付け係数を異ならせ、
　前記重み付け係数を用いて重み付けされた前記クロススペクトルに基づいて、前記ステレオ信号のチャネル間時間差を検出する、
　信号処理方法。