WO2011052191A1 - トーン判定装置およびトーン判定方法 - Google Patents

トーン判定装置およびトーン判定方法 Download PDF

Info

Publication number
WO2011052191A1
WO2011052191A1 PCT/JP2010/006329 JP2010006329W WO2011052191A1 WO 2011052191 A1 WO2011052191 A1 WO 2011052191A1 JP 2010006329 W JP2010006329 W JP 2010006329W WO 2011052191 A1 WO2011052191 A1 WO 2011052191A1
Authority
WO
WIPO (PCT)
Prior art keywords
tone
input signal
correlation
tone determination
vector sequence
Prior art date
Application number
PCT/JP2010/006329
Other languages
English (en)
French (fr)
Inventor
佐藤薫
Original Assignee
パナソニック株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パナソニック株式会社 filed Critical パナソニック株式会社
Priority to EP10826327.8A priority Critical patent/EP2495721B1/en
Priority to JP2011538245A priority patent/JP5511839B2/ja
Priority to US13/503,766 priority patent/US8670980B2/en
Publication of WO2011052191A1 publication Critical patent/WO2011052191A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Abstract

 現フレームの周波数成分と前フレームの周波数成分との相関により入力信号のトーン性を判定するトーン判定装置において、計算量を低減させることができる。この装置において、周波数変換部(101)は、入力信号を周波数変換し、ダウンサンプリング部(102)は、周波数変換後の信号のベクトル系列長を短縮する短縮処理を行い、定常性判定部(107)は、入力信号の定常性を判定し、ベクトル選択部(104)は、入力信号の定常性に応じて、周波数変換後の信号のベクトル系列、または、ベクトル系列長短縮後のベクトル系列のいずれかを選択し、相関分析部(105)は、ベクトル選択部(104)で選択されたベクトル系列を用いて相関を求め、トーン判定部(106)は、相関を用いて入力信号のトーン性を判定する。

Description

トーン判定装置およびトーン判定方法
 本発明は、トーン判定装置およびトーン判定方法に関する。
 ディジタル無線通信、インターネット通信に代表されるパケット通信、または、音声蓄積等の分野においては、電波等の伝送路の容量または記憶媒体の有効利用を図るため、音声信号の符号化/復号技術が不可欠であり、これまでに多くの音声符号化/復号方式が開発されてきた。その中で、CELP(Code Excited Linear Prediction)方式の音声符号化/復号方式が主流の方式として実用化されている。
 CELP方式の音声符号化装置は、予め記憶された音声モデルに基づいて入力音声をコード化する。具体的には、CELP方式の音声符号化装置は、ディジタル化された音声信号を10~20ms程度のフレームに区切り、フレーム毎に音声信号の線形予測分析を行い、線形予測係数および線形予測残差ベクトルを求め、線形予測係数および線形予測残差ベクトルをそれぞれ個別に符号化する。
 また、入力信号に応じてビットレートを変更する可変レート符号化装置も実現されている。可変レート符号化装置では、入力信号が主に音声情報を多く含む場合には高いビットレートで入力信号を符号化し、入力信号が主に雑音情報を多く含む場合には低いビットレートで入力信号を符号化することが可能である。すなわち、重要な情報を多く含む場合には高品質な符号化により、復号装置側で再生される出力信号の高品質化を図る。一方で、重要性が低い場合には低品質な符号化に抑えることにより、電力、伝送帯域等を節約することができる。このように、入力信号の特徴(例えば、有声性、無声性、トーン性等)を検出し、検出結果に応じて符号化方法を変更することにより、入力信号の特徴に適した符号化を行うことができ、符号化性能を向上させることができる。
 入力信号が音声情報であるか、雑音情報であるかを分類する方法としてVAD(Voice Active Detector)がある。具体的には、(1)入力信号を量子化してクラス分類を行い、クラス情報から音声情報/雑音情報を分類する方法、(2)入力信号の基本周期を求め、基本周期の長さだけ遡った信号と現信号との相関の高さに応じて音声情報/雑音情報を分類する方法、(3)入力信号の周波数成分の時間変動を調べ、変動情報に応じて音声情報/雑音情報を分類する方法等がある。
 また、SDFT(Shifted Discrete Fourier Transform)により入力信号の周波数成分を求め、現フレームの周波数成分と前フレームの周波数成分との相関の高さに応じて入力信号のトーン性を分類する技術がある(例えば、特許文献1)。上記特許文献1開示の技術では、トーン性に応じて周波数帯域拡張の方法を切り替えることにより、符号化性能の向上を図っている。
国際公開第2007/052088号パンフレット
 しかしながら、上記特許文献1開示のようなトーン判定装置、すなわち、SDFTにより入力信号の周波数成分(入力信号のSDFT係数)を求め、現フレームのSDFT係数と前フレームのSDFT係数との相関により入力信号のトーン性を検出するトーン判定装置においては、SDFT係数のすべての周波数帯域を考慮して相関を求めているため、計算量が大きくなってしまうという課題があった。
 本発明は、かかる点に鑑みてなされたものであり、入力信号の周波数成分(入力信号のSDFT係数)を求め、現フレームのSDFT係数と前フレームのSDFT係数との相関により入力信号のトーン性を判定するトーン判定装置およびトーン判定方法において、計算量を低減させることを目的とする。
 本発明のトーン判定装置は、入力信号を周波数変換する変換手段と、周波数変換後の信号のベクトル系列長を短縮する短縮処理を行う短縮手段と、前記入力信号の定常性を判定する定常性判定手段と、前記入力信号の定常性に応じて、周波数変換後の信号のベクトル系列、または、ベクトル系列長短縮後のベクトル系列のいずれかを選択する選択手段と、前記選択手段で選択されたベクトル系列を用いて相関を求める相関手段と、前記相関を用いて前記入力信号のトーン性を判定するトーン判定手段と、を具備する構成を採る。
 本発明のトーン判定方法は、入力信号を周波数変換する変換ステップと、周波数変換後の信号のベクトル系列長を短縮する短縮処理を行う短縮ステップと、前記入力信号の定常性を判定する定常性判定ステップと、前記定常性に応じて、周波数変換後の信号のベクトル系列、または、ベクトル系列長短縮後のベクトル系列のいずれかを選択する選択ステップと、前記選択ステップで選択されたベクトル系列を用いて相関を求める相関ステップと、前記相関を用いて前記入力信号のトーン性を判定するトーン判定ステップと、を具備する構成を採る。
 本発明によれば、トーン判定に要する計算量を低減させることができる。
本発明の実施の形態1に係るトーン判定装置の主要な構成を示すブロック図 本発明の実施の形態1に係るSDFT係数の短縮処理の様子を表す図 本発明の実施の形態1に係るSDFT係数の短縮処理の様子を表す図 本発明の実施の形態1に係るSDFT係数の短縮処理のその他の様子を表す図 本発明の実施の形態2に係るSDFT係数の短縮処理の様子を表す図 本発明の実施の形態3に係る符号化装置の主要な構成を示すブロック図 本発明のバリエーションを示す図 本発明のバリエーションを示す図
 以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
 (実施の形態1)
 図1は、本実施の形態に係るトーン判定装置100の主要な構成を示すブロック図である。ここでは、トーン判定装置100が、入力信号のトーン性を判定し、判定結果を出力する場合を例にとって説明する。
 図1において、周波数変換部101は、SDFTを用いて入力信号の周波数変換を行い、周波数変換により求められる周波数成分であるSDFT係数(周波数変換後の信号のベクトル系列)をダウンサンプリング部102とバッファ103とに出力する。
 ダウンサンプリング部102は、周波数変換部101から入力されるSDFT係数に対してダウンサンプリング処理を行い、SDFT係数の系列長(つまり、周波数変換後の信号のベクトル系列長)を短縮する短縮処理を行う。そして、ダウンサンプリング部102は、ダウンサンプリング後のSDFT係数(ベクトル系列長短縮後のベクトル系列)をバッファ103に出力する。
 バッファ103は、前フレームのSDFT係数と、前フレームのダウンサンプリング後のSDFT係数とを内部に格納しており、これら2つのSDFT係数をベクトル選択部104に出力する。次いで、バッファ103は、周波数変換部101から現フレームのSDFT係数を入力されるとともに、ダウンサンプリング部102から現フレームのダウンサンプリング後のSDFT係数を入力され、これらの2つのSDFT係数をベクトル選択部104に出力する。そして、バッファ103は、内部に格納されている前フレームの上記2つのSDFT係数(前フレームのSDFT係数および前フレームのダウンサンプリング後のSDFT係数)と、現フレームの上記2つのSDFT係数(現フレームのSDFT係数および現フレームのダウンサンプリング後のSDFT係数)とをそれぞれ入れ替えることにより、バッファ103の内部に格納するSDFT係数を更新する。
 ベクトル選択部104は、バッファ103から前フレームのSDFT係数と、前フレームのダウンサンプリング後のSDFT係数と、現フレームのSDFT係数と、現フレームのダウンサンプリング後のSDFT係数とを入力されるとともに、定常性判定部107から定常性情報を入力される。ここで、定常性情報とは、定常性判定部107が入力信号のトーン性の定常性を判定し、判定結果に基づいて、どのようにベクトルの決定を行うかをベクトル選択部104に指示する情報である。次いで、ベクトル選択部104は、定常性情報に応じて、トーン判定部106でのトーン判定に用いるSDFT係数を決定する。具体的には、ベクトル選択部104は、定常性に応じて、周波数変換により求められるSDFT係数(周波数変換後の信号のベクトル系列)またはダウンサンプリング後のSDFT係数(ベクトル系列長短縮後のベクトル系列)のいずれかを選択する。そして、ベクトル選択部104は、選択したSDFT係数を相関分析部105に出力する。
 相関分析部105は、ベクトル選択部104から入力される前フレームのSDFT係数および現フレームのSDFT係数を用いて、SDFT係数のフレーム間での相関を求め、求めた相関をトーン判定部106に出力する。
 トーン判定部106は、相関分析部105から入力される相関の値を用いて入力信号のトーン性を判定する。そして、トーン判定部106は、判定結果を示すトーン情報を定常性判定部107に出力する。また、トーン判定部106は、トーン判定装置100の出力としてトーン情報を出力する。
 定常性判定部107は、トーン判定部106からトーン情報を入力される。また、定常性判定部107の内部には過去のトーン情報が格納されている。定常性判定部107は、トーン判定部106から入力されるトーン情報と、過去のトーン情報とに基づいて、入力信号のトーン性の定常性を判定する。そして、定常性判定部107は、判定結果を定常性情報としてベクトル選択部104に出力する。この定常性情報は、次のフレームでのトーン判定の際にベクトル選択部104で用いられる。また、定常性判定部107は、トーン判定部106から入力されたトーン情報を、過去のトーン情報として内部に格納する。
 次に、トーン判定対象となる入力信号の次数が2N次(Nは1以上の整数)である場合を例にとって、トーン判定装置100の動作について説明する。なお、以下の説明では、入力信号をx(n)(n=0,1,…,2N-1)と記す。
 周波数変換部101は、入力信号x(n)(n=0,1,…,2N-1)を入力され、下記の式(1)に従って周波数変換を行い、得られたSDFT係数Y(k)(k=0,1,…,N)をダウンサンプリング部102とバッファ103とに出力する。
Figure JPOXMLDOC01-appb-M000001
 ここで、h(n)は窓関数であり、MDCT窓関数等が使用される。また、uは時間シフトの係数、vは周波数シフトの係数であり、例えば、u=(N+1)/2、v=1/2のように設定される。
 ダウンサンプリング部102は、周波数変換部101からSDFT係数Y(k)(k=0,1,…,N)を入力され、下記の式(2)に従ってダウンサンプリング処理を行う。
Figure JPOXMLDOC01-appb-M000002
 ここで、n=m×2が成り立ち、mは1からN/2-1までの値をとる。m=0の場合は、ダウンサンプリングを行わずにY_re(0)=Y(0)としてもよい。ここで、フィルタ係数[j0,j1,j2,j3]には折り返し歪みが生じないように設計された低域通過フィルタ係数を設定する。例えば、入力信号のサンプリング周波数が32000Hzであるとき、j0=0.195、j1=0.3、j2=0.3、j3=0.195に設定すると良好な結果が得られることが判っている。
 そして、ダウンサンプリング部102は、ダウンサンプリング後のSDFT係数Y_re(k)(k=0,1,…,N/2-1)をバッファ103に出力する。
 バッファ103は、周波数変換部101からSDFT係数Y(k)(k=0,1,…,N)を入力されるとともに、ダウンサンプリング部102からダウンサンプリング後のSDFT係数Y_re(k)(k=0,1,…,N/2-1)を入力される。また、バッファ103は、内部に格納されている前フレームのSDFT係数Y_pre(k)(k=0,1,…,N)と、前フレームのダウンサンプリング後のSDFT係数Y_re_pre(k)(k=0,1,…,N/2-1)とをベクトル選択部104に出力する。また、バッファ103は、現フレームのSDFT係数Y(k)(k=0,1,…,N)と、現フレームのダウンサンプリング後のSDFT係数Y_re(k)(k=0,1,…,N/2-1)とをベクトル選択部104に出力する。そして、バッファ103は、現フレームのSDFT係数Y(k)(k=0,1,…,N)をY_pre(k)(k=0,1,…,N)として内部に格納し、現フレームのダウンサンプリング後のSDFT係数Y_re(k)(k=0,1,…,N/2-1)をY_re_pre(k)(k=0,1,…,N/2-1)として内部に格納する。すなわち、バッファ103は、現フレームのSDFT係数と前フレームのSDFT係数とを入れ替えることにより、バッファ103の更新を行う。
 ベクトル選択部104は、バッファ103から現フレームのSDFT係数Y(k)(k=0,1,…,N)と、現フレームのダウンサンプリング後のSDFT係数Y_re(k)(k=0,1,…,N/2-1)と、前フレームのSDFT係数Y_pre(k)(k=0,1,…,N)と、前フレームのダウンサンプリング後のSDFT係数Y_re_pre(k)(k=0,1,…,N/2-1)とを入力されるとともに、定常性判定部107から定常性情報SIを入力される。次いで、ベクトル選択部104は、定常性情報SIに応じて、相関分析部105に出力するSDFT係数を決定する。
 ここでは、定常性情報SIが、SI=0(入力信号に定常性が無い場合)およびSI=1(入力信号に定常性が有る場合)の2通りのいずれかを示す場合について説明する。定常性情報SI=0の場合(入力信号に定常性が無い場合)、ベクトル選択部104は、ダウンサンプリングしていないSDFT係数を選択する。そして、ベクトル選択部104は、定常性情報SIと、現フレームのSDFT係数Y(k)(k=0,1,…,N)と、前フレームのSDFT係数Y_pre(k)(k=0,1,…,N)と、を相関分析部105に出力する。
 一方、定常性情報SI=1の場合(入力信号に定常性が有る場合)、ベクトル選択部104は、ダウンサンプリング後のSDFT係数を選択する。そして、ベクトル選択部104は、定常性情報SIと、現フレームのダウンサンプリング後のSDFT係数Y_re(k)(k=0,1,…,N/2-1)と、前フレームのダウンサンプリング後のSDFT係数Y_re_pre(k)(k=0,1,…,N/2-1)と、を相関分析部105に出力する。
 相関分析部105は、ベクトル選択部104から定常性情報SIと、SDFT係数とを入力され、定常性情報SIに応じて、SDFT係数のフレーム間での相関を計算する。具体的には、定常性情報SI=0の場合、相関分析部105は、下記の式(3)に従って、相関Sを求める。
Figure JPOXMLDOC01-appb-M000003
 一方、定常性情報SI=1の場合、相関分析部105は、下記の式(4)に従って、相関Sを求める。
Figure JPOXMLDOC01-appb-M000004
 そして、相関分析部105は、求めた相関Sをトーン判定部106に出力する。
 トーン判定部106は、相関分析部105から入力される相関Sを用いてトーン性を判定し、判定したトーン性をトーン情報として出力する。具体的には、トーン判定部106は、相関Sと、トーン判定の基準値である閾値Tとを比較し、T>Sが成り立つ場合は現フレームを「トーン」と判定し、成り立たない場合は現フレームを「非トーン」と判定すればよい。閾値Tの値は、学習により統計的に適した値を求めておけばよい。また、上記特許文献1に開示されている方法でトーン性を判定してもよい。また、複数の閾値を設定し、段階的にトーンの度合いを判定してもよい。そして、トーン判定部106は、トーン情報(例えば、「トーン」を1とし、「非トーン」を0とする)を定常性判定部107に出力する。
 定常性判定部107は、トーン判定部106から入力されるトーン情報を用いて、入力信号のトーン性の定常性を判定する。例えば、定常性判定部107は、入力されるトーン情報と過去に入力されたトーン情報とを参照し、トーン情報に示されるトーン性が「トーン」であるフレームが、現フレームまでに一定数以上連続している場合、入力信号のトーン性に定常性が有ると判定し、定常性情報SIをSI=1に設定する。そして、定常性判定部107は、次のフレームのトーン判定処理の際に定常性情報SI(=1)をベクトル選択部104に出力する。これは、入力信号が「トーン」の状態で比較的安定していることを考慮し、計算量の削減を重視してダウンサンプリング後のSDFT係数を用いて相関Sを計算するようにベクトル選択部104および相関分析部105に指示することを意味する。
 一方、定常性判定部107は、トーン情報に示されるトーン性が「トーン」であるフレームが現フレームまでに一定数以上連続していない場合、入力信号のトーン性に定常性が無いと判定し、定常性情報SIをSI=0に設定する。そして、定常性判定部107は、次のフレームのトーン判定処理の際に定常性情報SI(=0)をベクトル選択部104に出力する。これは、入力信号のトーン性が不安定であることを考慮し、ダウンサンプリングしていないSDFT係数を用いて相関Sを精確に計算するようにベクトル選択部104および相関分析部105に指示することを意味する。
 ここで、トーン判定装置100におけるSDFT係数(ベクトル系列)の短縮処理の様子を表すと図2Aおよび図2Bに示すようになる。図2Aおよび図2Bにおいて、トーン判定部106で入力信号のトーン性が「トーン」と判定された場合におけるトーン情報を「1」とし、トーン判定部106で入力信号のトーン性が「非トーン」と判定された場合におけるトーン情報を「0」とする。
 例えば、図2Aに示すフレーム#(α-1)では、トーン情報が1(つまり、「トーン」)であるフレームが現フレームまでに一定数以上連続していないとする。そのため、定常性判定部107は、入力信号のトーン性に定常性が無いと判定し、定常性情報SIをSI=0に設定する。そして、定常性判定部107は、次のフレーム#αのトーン判定処理の際に、定常性情報SI=0をベクトル選択部104に出力する。
 よって、ベクトル選択部104は、図2Aに示すフレーム#αでは、定常性判定部107から入力される定常性情報SIがSI=0であるので、ダウンサンプリングしていないSDFT係数(現フレーム(図2Aに示すフレーム#α)のSDFT係数Y(k)、および、前フレーム(図2Aに示すフレーム#(α-1))のSDFT係数Y_pre(k))を選択する。そして、ベクトル選択部104は、定常性情報SI(=0)および選択したSDFT係数(ベクトル系列)を相関分析部105に出力する。
 次いで、相関分析部105は、ベクトル選択部104から入力される定常性情報SIがSI=0であるので、上式(3)に従って、相関Sを求める。つまり、相関分析部105は、入力信号のトーン性に定常性が無い場合には、ダウンサンプリングしていないSDFT係数を用いて相関Sを求める。
 次いで、図2Aに示すフレーム#αでは、トーン判定部106で判定されたトーン性が「トーン」(つまり、トーン情報が1)であるとする。また、図2Aに示すフレーム#αでは、トーン情報が1(つまり、「トーン」)であるフレームが現フレームまでに一定数以上連続したとする。そのため、定常性判定部107は、入力信号のトーン性に定常性が有ると判定し、定常性情報SIをSI=1に設定する。そして、定常性判定部107は、次のフレーム#(α+1)のトーン判定処理の際に、定常性情報SI=1をベクトル選択部104に出力する。
 よって、ベクトル選択部104は、図2Aに示すフレーム#(α+1)では、定常性判定部107から入力される定常性情報SIがSI=1であるので、ダウンサンプリング後のSDFT係数(現フレーム(図2Aに示すフレーム#(α+1))のダウンサンプリング後のSDFT係数Y_re(k)、および、前フレーム(図2Aに示すフレーム#α)のダウンサンプリング後のSDFT係数Y_re_pre(k))を選択する。そして、ベクトル選択部104は、定常性情報SI(=1)および選択したSDFT係数(ベクトル系列)を相関分析部105に出力する。
 次いで、相関分析部105は、ベクトル選択部104から入力される定常性情報SIがSI=1であるので、上式(4)に従って、相関Sを求める。つまり、相関分析部105は、入力信号のトーン性に定常性が有る場合には、ダウンサンプリング後のSDFT係数を用いて相関Sを求める。
 また、図2Aにおいて、フレーム#(α+2)以降でも、トーン情報が「トーン」であるフレームが現フレームまでに一定数以上連続する場合には、上述したフレーム#(α+1)と同様、ベクトル選択部104は、次のフレームにおいて、ダウンサンプリング後のSDFT係数を選択し、相関分析部105は、ダウンサンプリング後のSDFT係数を用いて相関Sを求める。
 このようにして、トーン判定装置100は、トーン性が「トーン」であるフレームが現フレームまでに一定数以上連続する場合(例えば、音声区間または音楽区間が連続している場合)には、入力信号が定常的(入力信号のトーン性が安定している状態)であると判断する。そして、トーン判定装置100は、トーン性が安定している状態では、ダウンサンプリング後のSDFT係数、つまり、系列長が短縮されたSDFT係数を用いて相関Sを求める。このように、トーン性が安定している状態では、トーン性が強くなっている(相関Sと閾値Tとの間でS<<Tが成り立つ)と考えられる。このため、比較的粗い精度でトーン性判定を行っても良好な判定が行えるという根拠に基づき、トーン判定装置100は、SDFT係数の系列長を短縮することで、トーン性判定の誤りを起こさない程度に計算量を削減することができる。
 次に、例えば、図2Bに示すフレーム#(β-2)および#(β-1)では、トーン情報が1(つまり、「トーン」)であるフレームが現フレームまでに一定数以上連続しているとする。そのため、定常性判定部107は、入力信号のトーン性に定常性が有ると判定し、定常性情報SIをSI=1に設定する。そして、定常性判定部107は、次のフレーム#(β-1)および#βのトーン判定処理の際に、定常性情報SI=1をベクトル選択部104に出力する。そして、図2Aに示すフレーム#(α+1)と同様にして、ベクトル選択部104は、フレーム#(β-1)および#βでは、ダウンサンプリング後のSDFT係数を選択し、相関分析部105は上式(4)に従って相関Sを求める。
 次いで、図2Bに示すフレーム#βでは、トーン判定部106で判定されたトーン性が「非トーン」(つまり、トーン情報が0)であるとする。つまり、図2Bに示すフレーム#βでは、トーン情報が1(つまり、「トーン」)であるフレームは現フレームまでに一定数以上連続していない。そのため、定常性判定部107は、入力信号のトーン性に定常性が無いと判定し、定常性情報SIをSI=0に設定する。そして、定常性判定部107は、次のフレーム#(β+1)のトーン判定処理の際に、定常性情報SI=0をベクトル選択部104に出力する。
 よって、ベクトル選択部104は、図2Bに示すフレーム#(β+1)では、定常性判定部107から入力される定常性情報SIがSI=0であるので、ダウンサンプリングしていないSDFT係数(現フレーム(図2Bに示すフレーム#(β+1))のSDFT係数Y(k)、および、前フレーム(図2Bに示すフレーム#β)のSDFT係数Y_pre(k))を選択する。そして、ベクトル選択部104は、定常性情報SI(=0)および選択したSDFT係数(ベクトル系列)を相関分析部105に出力する。
 次いで、相関分析部105は、ベクトル選択部104から入力される定常性情報SIがSI=0であるので、上式(3)に従って、相関Sを求める。つまり、相関分析部105は、入力信号のトーン性に定常性が無い場合には、ダウンサンプリングしていないSDFT係数を用いて相関Sを求める。
 このようにして、トーン性が安定している状態(トーン性が「トーン」であるフレームが一定数以上連続する場合)から、トーン性の判定結果が反転した場合(トーン性が「非トーン」に反転した場合)、トーン判定装置100は、入力信号が非定常的(入力信号のトーン性が不安定な状態)であると判断する。そして、トーン判定装置100は、トーン性の判定結果が「トーン」から「非トーン」へ反転した場合には、SDFT係数の短縮をリセットして、ダウンサンプリングしていないSDFT係数を用いて相関Sを求める。すなわち、トーン判定装置100は、トーン性が不安定な状態ではSDFT係数すべての系列を用いるため、フレーム間の相関Sを精確に求めることができる。
 このように、本実施の形態によれば、入力信号のトーン性が定常的である場合には、フレーム間の相関を求める前にダウンサンプリングを行ってSDFT係数(ベクトル系列)を短縮する。このため、相関の計算に用いるSDFT係数(ベクトル系列)の長さが従来に比べて短くなる。よって、本実施の形態によれば、入力信号のトーン性の判定に要する計算量を低減することができる。
 また、本実施の形態によれば、トーン判定装置は、入力信号のトーン性が「トーン」として安定している場合にのみSDFT係数(ベクトル系列)の短縮を行うことで、入力信号のトーン判定に要する計算量を低減する。一方、トーン判定装置は、入力信号のトーン性が不安定な状態には、SDFT係数の短縮を行わないことで、トーン判定に用いる相関を精確に求めることができる。すなわち、本実施の形態では、トーン判定装置は、入力信号のトーン性の定常性に応じてフレーム間の相関算出に用いるSDFT係数を選択することで、相関の精度を粗くして計算量を削減したトーン判定と、計算量を削減せずに相関の精度を重視したトーン判定とを適応的に切り替えることができる。
 なお、トーン判定によるトーン性の分類は通常2~3種類程度(例えば、上記説明では「トーン」と「非トーン」の2種類)と少なく、細かい精度の判定結果が要求される訳ではない。よって、SDFT係数(ベクトル系列)を短縮しても、最終的に、SDFT係数(ベクトル系列)を短縮しないときと同様の分類結果に収束する可能性が高い。
 また、本実施の形態では、トーン判定装置が、入力信号のトーン性の定常性に応じて、ダウンサンプリングしていないSDFT係数およびダウンサンプリング後のSDFT係数のいずれか一方を選択する場合を一例として説明した。しかし、本発明では、トーン判定装置は、入力信号が定常的である継続時間に応じて、SDFT係数の短縮の度合を変更してもよい。例えば、トーン判定装置100は、図3に示すように、ダウンサンプリング(短縮)していないSDFT係数に加えて、2分の1の系列長に短縮させたSDFT係数、および、4分の1の系列長に短縮させたSDFT係数を求めておく。そして、トーン判定装置100は、入力信号のトーン性が「トーン」の状態で安定している場合、安定している継続時間が長いほど、トーン判定に用いるSDFT係数を、系列長がより短い系列へと徐々に変更していってもよい。これにより、入力信号のトーン性が定常的である時間(継続時間)が長いほど、入力信号のトーン性の判定に要する計算量をより低減することができる。
 (実施の形態2)
 実施の形態1のようにSDFT係数(ベクトル系列)の系列長を短縮する場合には、トーン判定の精度が若干劣化する。そのため、SDFT係数の短縮を用いたトーン性判定を続けていくうちに「トーン」と「非トーン」との切り分けが不明瞭になってくると、トーン判定を誤ってしまうことがあり得る。
 そこで、本実施の形態に係るトーン判定装置は、「トーン」と「非トーン」との切り分けが不明瞭になってきた場合には、SDFT係数の短縮を取り止めて、精確なトーン判定処理を行う。
 以下、本実施の形態について具体的に説明する。
 本実施の形態に係るトーン判定装置100(図1)において、トーン判定部106は、実施の形態1と同様の処理に加え、相関分析部105から入力される相関Sと、トーン判定の基準値である閾値Tとの距離が近い場合(例えば、相関Sと閾値Tとの差|T-S|が予め設定された定数C未満の場合、つまり、C>|T-S|が成り立つ場合)、相関Sが閾値Tの近傍に達したと判断する。つまり、トーン判定部106は、C>|T-S|が成り立つ場合、「トーン」と「非トーン」との切り分けが不明瞭であると判断する。そして、トーン判定部106は、C>|T-S|が成り立つ場合には、「トーン」と「非トーン」とが近いうちに(近い将来)反転しそうであることを示す情報(反転情報)を定常性判定部107に出力する。
 定常性判定部107は、トーン判定部106からトーン情報、および、反転情報(閾値Tと相関Sとの差が定数C未満の場合のみ)を入力される。
 トーン判定部106から反転情報が入力された場合、定常性判定部107は、入力信号のトーン性の定常性が近いうちに無くなると判定し、定常性情報SIをSI=0に設定して、次のフレームのトーン判定処理の際に定常性情報SIをベクトル選択部104に出力する。これは、入力信号が「トーン」と「非トーン」との間で曖昧になってきたことを考慮し、ダウンサンプリングしていないSDFT係数を用いて相関Sを精確に計算するようにベクトル選択部104および相関分析部105に指示することを意味する。
 すなわち、ベクトル選択部104は、相関Sと閾値Tとの差がある値C未満の場合(C>|T-S|が成り立つ場合)には、入力信号のトーン性が定常的である場合でも、ダウンサンプリングしていないSDFT係数を選択する。
 また、トーン判定部106から反転情報が入力されない場合、定常性判定部107は、実施の形態1と同様にして、トーン判定部106から入力されるトーン情報を用いて、入力信号のトーン性の定常性を判定する。
 ここで、トーン判定装置100におけるSDFT係数(ベクトル系列)の短縮処理の様子を表すと図4に示すようになる。図4に示すフレーム#(α-2)および#(α-1)では、相関値Sが閾値Tより小さい(T>Sである)ため、トーン判定部106は、入力信号のトーン性が「トーン」であると判定する。また、図4に示すフレーム#(α-2)および#(α-1)では、定常性判定部107は、トーン性が「トーン」であるフレームが現フレームまでに一定数以上連続したとする。そのため、相関分析部105は、次のフレーム(図4に示すフレーム#(α-1)および#αでは、ダウンサンプリング後のSDFT係数を用いてフレーム間の相関の値を求めている。また、図4に示すフレーム#(α-2)および#(α-1)では、相関Sと閾値Tとの差|T-S|は定数C以上である(C≦|T-S|)。
 図4に示すフレーム#αでは、相関値Sは閾値Tより小さい(T>Sである)ものの、相関Sと閾値Tとの差|T-S|が定数C未満の(C>|T-S|)。よって、トーン判定部106は、相関Sが閾値Tの近傍に達したと判断する。そこで、トーン判定部106は、図4に示すフレーム#αでは、反転情報を定常性判定部107に出力する。
 次いで、定常性判定部107は、トーン判定部106から反転情報が入力されると、入力信号のトーン性の定常性が近いうちに無くなりそうであると判定し、定常性情報SIをSI=0に設定する。そして、定常性判定部107は、次のフレーム#(α+1)のトーン判定処理の際に、定常性情報SI=0をベクトル選択部104に出力する。
 よって、ベクトル選択部104は、図4に示すフレーム#(α+1)では、定常性判定部107から入力される定常性情報SIがSI=0であるので、ダウンサンプリングしていないSDFT係数(現フレーム(図4に示すフレーム#(α+1)のSDFT係数Y(k)、および、前フレーム(図4に示すフレーム#α)のSDFT係数Y_pre(k))を選択する。そして、ベクトル選択部104は、定常性情報SI=0および選択したSDFT係数(ベクトル系列)を相関分析部105に出力する。
 次いで、相関分析部105は、ベクトル選択部104から入力される定常性情報SIがSI=0であるので、上式(3)に従って、相関Sを求める。つまり、相関分析部105は、入力信号のトーン性が近いうちに反転しそうである場合(すなわち、入力信号のトーン性の定常性が近いうちに無くなる場合)には、ダウンサンプリングしていないSDFT係数を用いて相関Sを求める。
 このようにして、相関Sと閾値Tとの差が定数C未満の場合、つまり、相関Sが閾値Tの近傍にある場合には、トーン判定装置100は、「トーン」と「非トーン」との切り分けが不明瞭であり、トーン判定を誤ってしまう可能性が高いと判断する。そして、トーン判定装置100は、相関Sが閾値Tの近傍にある場合には、SDFT係数の短縮をリセットして、ダウンサンプリングしていないSDFT係数を用いて相関Sを求める。つまり、トーン判定装置100は、相関Sが閾値Tの近傍にある場合には、SDFT係数すべての系列を用いるため、フレーム間の相関Sを精確に求め、トーン判定の判定誤りを回避することができる。
 このように、本実施の形態によれば、実施の形態1と同様にして、相関を求める前にダウンサンプリングを行ってSDFT係数(ベクトル系列)を短縮するため、相関の計算に用いるSDFT係数(ベクトル系列)の長さが従来に比べて短くなる。よって、本実施の形態によれば、入力信号のトーン性の判定に要する計算量を低減することができる。さらに、本実施の形態によれば、入力信号のトーン性が「トーン」として安定している状態であっても、「トーン」と「非トーン」とが反転しそうな状況になった場合には、SDFT係数の短縮を取り止めることで精確なトーン判定を行うことができる。これにより、入力信号のトーン性が反転する可能性があるフレーム付近(「トーン」と「非トーン」との切り分けが不明瞭となるフレーム付近)では、トーン判定に用いる相関Sの精度を向上させることができるため、SDFT係数の短縮によるトーン性の判定誤りを回避することができる。
 (実施の形態3)
 図5は、本実施の形態に係る符号化装置200の主要な構成を示すブロック図である。ここでは、符号化装置200が、入力信号のトーン性を判定し、判定結果に応じて符号化方法を切り替える場合を例にとって説明する。
 図5に示す符号化装置200は、上記実施の形態1に係るトーン判定装置100(図1)を備える。
 図5において、トーン判定装置100は、上記実施の形態1において説明したように、入力信号からトーン情報を得る。次いで、トーン判定装置100は、トーン情報を選択部201に出力する。
 選択部201は、トーン判定装置100よりトーン情報を入力され、トーン情報に応じて入力信号の出力先を選択する。例えば、選択部201は、入力信号が「トーン」である場合には入力信号の出力先として符号化部202を選択し、入力信号が「非トーン」である場合には入力信号の出力先として符号化部203を選択する。符号化部202と符号化部203とは、互いに異なる符号化方法により入力信号を符号化するものである。よって、このような選択により、入力信号のトーン性に応じて、入力信号の符号化に用いる符号化方法を切り替えることができる。
 符号化部202は、入力信号を符号化し、符号化により生成される符号を出力する。符号化部202に入力される入力信号は「トーン」であるため、符号化部202は、楽音の符号化に適している、例えば周波数変換符号化により入力信号を符号化する。
 符号化部203は、入力信号を符号化し、符号化により生成される符号を出力する。符号化部203に入力される入力信号は「非トーン」であるため、符号化部203は、音声の符号化に適している、例えばCELP符号化により入力信号を符号化する。
 なお、符号化部202,203が符号化に用いる符号化方法は上記のものに限定されず、従来の符号化方法の中から最も適しているものを適宜用いてもよい。
 また、本実施の形態では符号化部が2つである場合を一例として説明したが、互いに異なる符号化方法により符号化を行う符号化部が3つ以上あってもよい。この場合、段階的に判定されるトーンの度合いに応じて、3つ以上の符号化部のうちいずれかの符号化部を選択すればよい。
 また、本実施の形態では入力信号が音声信号または楽音信号のいずれかであるとして説明したが、本発明はその他の信号に対しても上記同様にして実施することが可能である。
 このようして、本実施の形態によれば、入力信号のトーン性に応じた最適な符号化方法により入力信号を符号化することができる。
 以上、本発明の実施の形態について説明した。
 なお、上記実施の形態では、入力信号の定常性を判定する方法として、トーン性の判定結果(トーン情報)を用いる場合を一例として説明した。しかし、入力信号の定常性を判定する方法としては、トーン性の判定結果を用いる場合に限らず、他の指標を用いて入力信号の定常性を判定してもよい。例えば、トーン判定装置は、CELP符号化の適応符号帳において求められる基本周波数の変動の度合を測定することにより、定常性を判定してもよい。または、トーン判定装置は、CELP符号化における基本レイヤのCELP符号化器から得られるピッチラグ(またはパワー)のフレーム間での変動を測定することにより、定常性を判定してもよい。具体的には、図6Aに示すように、トーン判定装置は、ピッチラグの変動Dが閾値T未満(D<T)であるフレームが現フレームまでに一定数以上連続しない場合(例えば、図6Aに示すフレーム#α)には、入力信号に定常性が無いと判定する。そして、トーン判定装置は、そのフレーム#αでは、ダウンサンプリングしていないSDFT係数を用いて相関を求める。また、図6Aに示すように、トーン判定装置は、ピッチラグの変動Dが閾値T未満(D<T)であるフレームが現フレームまでに一定数以上連続する場合(例えば図6Aに示すフレーム#(α+1))には、入力信号に定常性が有ると判定する。そして、トーン判定装置は、そのフレーム#(α+1)では、ダウンサンプリング後のSDFT係数を用いて相関を求める。また、図6Bに示すように、ピッチラグの変動Dが閾値T未満(D<T)である状態から、ピッチラグの変動Dが閾値T以上(D≧T)である状態に反転した場合(図6Bではフレーム#(β+1))、つまり、ピッチラグの変動Dが閾値T未満(D<T)であるフレームが現フレームまでに一定数以上連続しなくなった場合には、トーン判定装置はSDFT係数の短縮をリセットする。
 また、入力信号の周波数変換は、SDFT以外の周波数変換、例えば、DFT(離散フーリエ変換)、FFT(高速フーリエ変換)、DCT(離散コサイン変換)、MDCT(修正離散コサイン変換)等により行ってもよい。
 また、上記実施の形態に係るトーン判定装置および符号化装置は、音声や楽音等の伝送が行われる移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記同様の作用効果を有する通信端末装置および基地局装置を提供することができる。
 また、上記実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るトーン判定方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係るトーン判定装置と同様の機能を実現することができる。
 また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部またはすべてを含むように1チップ化されてもよい。
 また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
 また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
 さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてあり得る。
 2009年10月26日出願の特願2009-245624の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
 本発明は、音声符号化および音声復号等の用途に適用することができる。
100 トーン判定装置
101 周波数変換部
102 ダウンサンプリング部
103 バッファ
104 ベクトル選択部
105 相関分析部
106 トーン判定部
107 定常性判定部
200 符号化装置
201 選択部
202,203 符号化部

Claims (9)

  1.  入力信号を周波数変換する変換手段と、
     周波数変換後の信号のベクトル系列長を短縮する短縮処理を行う短縮手段と、
     前記入力信号の定常性を判定する定常性判定手段と、
     前記入力信号の定常性に応じて、周波数変換後の信号のベクトル系列、または、ベクトル系列長短縮後のベクトル系列のいずれかを選択する選択手段と、
     前記選択手段で選択されたベクトル系列を用いて相関を求める相関手段と、
     前記相関を用いて前記入力信号のトーン性を判定するトーン判定手段と、
     を具備するトーン判定装置。
  2.  前記選択手段は、前記入力信号に定常性が無い場合には、周波数変換後の信号のベクトル系列を選択し、前記入力信号に定常性が有る場合には、ベクトル系列長短縮後のベクトル系列を選択する、
     請求項1記載のトーン判定装置。
  3.  前記選択手段は、前記相関と、トーン判定の基準値との差が、予め設定された値未満の場合、周波数変換後の信号のベクトル系列を選択する、
     請求項1記載のトーン判定装置。
  4.  前記定常性判定手段は、前記入力信号のトーン性に基づいて、前記入力信号の定常性を判定する、
     請求項1記載のトーン判定装置。
  5.  前記定常性判定手段は、CELP(Code Excited Linear Prediction)符号化における基本レイヤで得られる、前記入力信号のピッチラグに基づいて、前記入力信号の定常性を判定する、
     請求項1記載のトーン判定装置。
  6.  請求項1記載のトーン判定装置と、
     前記入力信号を互いに異なる符号化方法を用いて符号化する複数の符号化手段と、
     前記トーン判定手段での判定結果に応じて、前記入力信号の符号化を行う符号化手段を前記複数の符号化手段の中から選択する選択手段と、
     を具備する符号化装置。
  7.  請求項1記載のトーン判定装置を具備する通信端末装置。
  8.  請求項1記載のトーン判定装置を具備する基地局装置。
  9.  入力信号を周波数変換する変換ステップと、
     周波数変換後の信号のベクトル系列長を短縮する短縮処理を行う短縮ステップと、
     前記入力信号の定常性を判定する定常性判定ステップと、
     前記定常性に応じて、周波数変換後の信号のベクトル系列、または、ベクトル系列長短縮後のベクトル系列のいずれかを選択する選択ステップと、
     前記選択ステップで選択されたベクトル系列を用いて相関を求める相関ステップと、
     前記相関を用いて前記入力信号のトーン性を判定するトーン判定ステップと、
     を具備するトーン判定方法。
PCT/JP2010/006329 2009-10-26 2010-10-26 トーン判定装置およびトーン判定方法 WO2011052191A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP10826327.8A EP2495721B1 (en) 2009-10-26 2010-10-26 Tone determination device and method
JP2011538245A JP5511839B2 (ja) 2009-10-26 2010-10-26 トーン判定装置およびトーン判定方法
US13/503,766 US8670980B2 (en) 2009-10-26 2010-10-26 Tone determination device and method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009-245624 2009-10-26
JP2009245624 2009-10-26

Publications (1)

Publication Number Publication Date
WO2011052191A1 true WO2011052191A1 (ja) 2011-05-05

Family

ID=43921625

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2010/006329 WO2011052191A1 (ja) 2009-10-26 2010-10-26 トーン判定装置およびトーン判定方法

Country Status (4)

Country Link
US (1) US8670980B2 (ja)
EP (1) EP2495721B1 (ja)
JP (1) JP5511839B2 (ja)
WO (1) WO2011052191A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995012879A1 (en) * 1993-11-02 1995-05-11 Telefonaktiebolaget Lm Ericsson Discriminating between stationary and non-stationary signals
WO2007052088A1 (en) 2005-11-04 2007-05-10 Nokia Corporation Audio compression
JP2009245624A (ja) 2008-03-28 2009-10-22 Mitsubishi Materials Corp 燃料電池用セパレータおよびその製造方法
WO2010098130A1 (ja) * 2009-02-27 2010-09-02 パナソニック株式会社 トーン判定装置およびトーン判定方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5642466A (en) * 1993-01-21 1997-06-24 Apple Computer, Inc. Intonation adjustment in text-to-speech systems
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
US6233550B1 (en) * 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US6182036B1 (en) * 1999-02-23 2001-01-30 Motorola, Inc. Method of extracting features in a voice recognition system
US6766021B2 (en) * 2001-03-13 2004-07-20 Adaptive Digital Technologies Echo canceller
US6892193B2 (en) * 2001-05-10 2005-05-10 International Business Machines Corporation Method and apparatus for inducing classifiers for multimedia based on unified representation of features reflecting disparate modalities
US6920194B2 (en) * 2001-05-29 2005-07-19 Tioga Technologies, Ltd. Method and system for detecting, timing, and correcting impulse noise
US7065485B1 (en) * 2002-01-09 2006-06-20 At&T Corp Enhancing speech intelligibility using variable-rate time-scale modification
JP3840129B2 (ja) * 2002-03-15 2006-11-01 株式会社東芝 動きベクトル検出方法と装置、補間画像作成方法と装置及び画像表示システム
EP1501191A1 (en) * 2003-07-25 2005-01-26 STMicroelectronics S.r.l. Method for echo cancellation in a DMT modem apparatus, DMT modem apparatus and computer program product thereof
US8712768B2 (en) * 2004-05-25 2014-04-29 Nokia Corporation System and method for enhanced artificial bandwidth expansion
EP2055014B1 (en) * 2006-08-25 2013-03-06 Ikanos Technology Ltd. Systems and methods for mimo precoding in an xdsl system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995012879A1 (en) * 1993-11-02 1995-05-11 Telefonaktiebolaget Lm Ericsson Discriminating between stationary and non-stationary signals
WO2007052088A1 (en) 2005-11-04 2007-05-10 Nokia Corporation Audio compression
JP2009245624A (ja) 2008-03-28 2009-10-22 Mitsubishi Materials Corp 燃料電池用セパレータおよびその製造方法
WO2010098130A1 (ja) * 2009-02-27 2010-09-02 パナソニック株式会社 トーン判定装置およびトーン判定方法

Also Published As

Publication number Publication date
JP5511839B2 (ja) 2014-06-04
EP2495721B1 (en) 2018-05-30
JPWO2011052191A1 (ja) 2013-03-14
EP2495721A1 (en) 2012-09-05
US20120215524A1 (en) 2012-08-23
EP2495721A4 (en) 2016-08-03
US8670980B2 (en) 2014-03-11

Similar Documents

Publication Publication Date Title
KR101092167B1 (ko) 피치-조정 및 비-피치-조정 코딩을 이용한 신호 인코딩
EP1738355B1 (en) Signal encoding
EP0770987B1 (en) Method and apparatus for reproducing speech signals, method and apparatus for decoding the speech, method and apparatus for synthesizing the speech and portable radio terminal apparatus
KR100487136B1 (ko) 음성복호화방법및장치
EP0573398B1 (en) C.E.L.P. Vocoder
US6134518A (en) Digital audio signal coding using a CELP coder and a transform coder
KR101437127B1 (ko) 가중 윈도우들을 사용한 저-지연 변환 코딩
US7664650B2 (en) Speech speed converting device and speech speed converting method
JP4132154B2 (ja) 音声合成方法及び装置、並びに帯域幅拡張方法及び装置
KR101019398B1 (ko) 오디오 코딩 및 디코딩에서의 여기의 프로세싱
Kroon et al. Predictive coding of speech using analysis-by-synthesis techniques
US20080255860A1 (en) Audio decoding apparatus and decoding method
WO2010098130A1 (ja) トーン判定装置およびトーン判定方法
KR20230129581A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
JP5511839B2 (ja) トーン判定装置およびトーン判定方法
WO2018073486A1 (en) Low-delay audio coding
EP1164577A2 (en) Method and apparatus for reproducing speech signals

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10826327

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2011538245

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 13503766

Country of ref document: US

Ref document number: 2010826327

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE