JP2010164809A - デコード装置および音声符号化方式推定方法 - Google Patents

デコード装置および音声符号化方式推定方法 Download PDF

Info

Publication number
JP2010164809A
JP2010164809A JP2009007496A JP2009007496A JP2010164809A JP 2010164809 A JP2010164809 A JP 2010164809A JP 2009007496 A JP2009007496 A JP 2009007496A JP 2009007496 A JP2009007496 A JP 2009007496A JP 2010164809 A JP2010164809 A JP 2010164809A
Authority
JP
Japan
Prior art keywords
data
frame
encoded data
encoding method
bit position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009007496A
Other languages
English (en)
Other versions
JP5182112B2 (ja
Inventor
Michiya Suzuki
道也 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009007496A priority Critical patent/JP5182112B2/ja
Publication of JP2010164809A publication Critical patent/JP2010164809A/ja
Application granted granted Critical
Publication of JP5182112B2 publication Critical patent/JP5182112B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】符号化データの音声符号化方式を短時間で推定できるデコード装置および音声符号化方式推定方法を提供する。
【解決手段】本発明のデコード装置は、外部から未知の音声符号化方式で符号化された符号化データを受信するデータ入力部と、デコード可能な音声符号化方式が互いに異なる複数のデコーダを備えるデコーダ部と、前記データ入力部から受信した符号化データを周波数解析することにより音声フレームのフレーム長を推定し、前記推定したフレーム長に基づいて前記符号化データの音声符号化方式を判別し、前記デコーダ部から前記判別した音声符号化方式に対応するデコーダを選択し、前記符号化データを該デコーダにデコードさせるデータ処理部を有する。
【選択図】図1

Description

本発明は、デコード装置および音声符号化方式推定方法に関する。
近年、音声の帯域を対象とした多様な音声符号化方式が開発され、当該多様な音声符号化方式で符号化された音声データ(以降、符号化データと称する)が通信に用いられている。一方、日本の電波法では、あらかじめ届け出られていない音声符号化方式の符号化データを用いた通信波の発信は禁止されている。テロリズムや犯罪などの防止を目的として通信波を監視する場合、発信された通信波の音声符号化方式を推定し、当該音声符号化方式が届け出されているか否かを判別する必要がある。
音声符号化方式を推定するために、符号化データを規格が公開されている音声符号化方式のデコーダで順次デコードし、音声が出力されるか否かによって判別する方法がある。
なお、特許文献1では、符号化データに対して各音声符号化方式の特徴から分布をとり、その分布の特徴を見ることにより音声符号化方式を自動的に判別する方法が提示されている。
特開2007−243650号公報
符号化データを規格が公開されている音声符号化方式のデコーダで順次デコードし、音声が出力されたか否かを判別するためには、音声の出力レベルあるいは周波数帯域を判別するための回路が必要となり、デコード装置の構成が複雑となる。音声の出力レベルあるいは出力周波数帯域から音声が出力されたか否かを判別すると、背景雑音などの影響により判別ミスが発生する場合もある。操作者の聴音により音声が出力されたか否かを判別することも可能であるが、操作者の多大な労力を必要とすることになる。また、現在、ITU−T(International Telecommunication Union Telecommunication Standardization Sector)あるいはETSI(European Telecommunications Standards Institute)などで規格が公開されている音声の帯域を対象とした音声符号化方式は約20種類ある。規格が公開されている全ての音声符号化方式でデコードすると音声符号化方式を推定するまでに多大な時間を要することになる。
また、上述した特許文献1では、符号化データを判別するための処理が音声符号化方式ごとに異なる。音声符号化方式ごとに異なる処理を実施する必要があるため、判別に時間を要する。
本発明の目的は、符号化データの音声符号化方式を短時間で推定できるデコード装置および音声符号化方式推定方法を提供することである。
上記目的を達成するために、本発明のデコード装置は、外部から未知の音声符号化方式で符号化された符号化データを受信するデータ入力部と、デコード可能な音声符号化方式が互いに異なる複数のデコーダを備えるデコーダ部と、前記データ入力部から受信した符号化データを周波数解析することにより音声フレームのフレーム長を推定し、前記推定したフレーム長に基づいて前記符号化データの音声符号化方式を判別し、前記デコーダ部から前記判別した音声符号化方式に対応するデコーダを選択し、前記符号化データを該デコーダにデコードさせるデータ処理部を有する。
本発明によれば、符号化データの音声符号化方式を短時間で推定できる。
第1の実施の形態のデコード装置の構成を示すブロック図である。 図1に示したデータ処理部の処理手順を示すフローチャートである。 G.729 CS−ACELPの符号化データの周波数スペクトルの波形図である。 G.729 CS−ACELP(8.0kbps)の符号化データの連長ヒストグラムの分布図である。 G.729 CS−ACELP(6.4kbps)の符号化データの連長ヒストグラムの分布図である。 G.729 CS−ACELP(11.8kbps)の符号化データの連長ヒストグラムの分布図である。 ACELP(6.7kbps)の符号化データの連長ヒストグラムの分布図である。 LD−CELP(16kbps)の符号化データの連長ヒストグラムの分布図である。 DoD MELP(54kbps)の符号化データの連長ヒストグラムの分布図である。 G.726 ADPCM(16kbps)の符号化データの連長ヒストグラムの分布図である。 G.726 ADPCM(24kbps)の符号化データの連長ヒストグラムの分布図である。 G.726 ADPCM(32kbps)の符号化データの連長ヒストグラムの分布図である。 G.726 ADPCM(40kbps)の符号化データの連長ヒストグラムの分布図である。 第2の実施の形態のデコード装置の構成を示すブロック図である。
次に本発明について図面を参照して詳細に説明する。
現在、規格が公開されている音声の帯域を対象とした音声符号化方式として、G.729 CS−ACELP(Conjugate Structure Algebraic Code Excited Linear Prediction)、G.728 LD−CELP(low delay-code excited linear prediction)、電波産業会(ARIB)が規定するACELP(Conjugate Structure Algebraic Code Excited Linear Prediction)、アメリカ国防総省(DoD)が規定するMELP(United States Department of Defense Mixed Excitation Linear Prediction)、G.726 ADPCM(Adaptive Differential Pulse Code Modulation)あるいはG722 SB−ADPCM(Sub-Band Adaptive Differential Pulse Code Modulation)などがある。
原音声データは、それぞれの音声符号化方式でサイズが規定されている音声フレームごとに符号化される。符号化データは、データ値の連続性について、音声符号化方式とビットレートの組み合わせ(以降、符号化仕様と称する)ごとに異なる特徴を有する。同一の符号化仕様では、データ値が0から1、あるいは1から0に変化する、音声フレーム内のビット位置および当該ビット位置から同一のデータ値が連続する長さをあらわす連長が類似する傾向にある。
符号化データが音声フレームの生成周期で類似した値を有するため、当該符号化データを、高速フーリエ変換(以降、FFTと称する)を用いて周波数解析すると、音声フレームが生成される周波数の倍数の周波数で波の強さが大きくなる。これを利用して、音声フレームのフレーム長を推定できる。フレーム長は、音声符号化方式およびビットレートごとに規定されるので、推定したフレーム長に基づいて符号化データの音声符号化方式を判別できる。
本発明のデコード装置は、外部から受信した符号化データ(以降、受信データと称する)を周波数解析することにより音声フレームのフレーム長を推定し、推定したフレーム長に基づいて当該受信データの音声符号化方式を判別する。
また、本発明のデコード装置は、受信データの音声フレームのビット位置ごとの連長のヒストグラムを作成し、符号化仕様ごとにあらかじめ作成しておいた連長のヒストグラムと比較することにより当該受信データの音声符号化方式を判別する。
(第1の実施の形態)
図1は本発明の第1の実施の形態のデコード装置の構成を示すブロック図である。
図1に示すように、第1の実施の形態のデコード装置1は、データ入力部10、データ処理部11、デコーダ部12、DA変換器13およびデータベース14を有する。
データ入力部10は、図示しない外部の通信機器あるいはハードディスクなどの記憶装置から入力された受信データをデータ処理部11に出力する。
データ処理部11は、データ入力部10から受信した受信データを周波数解析し、音声フレームのフレーム長を推定し、推定したフレーム長に基づいて当該受信データの音声符号化方式を判別する。
また、データ処理部11は、符号化仕様ごとの所定のサイズの符号化データに対する音声フレームのビット位置ごとの連長のヒストグラム(以降、参照ヒストグラムと称する)をあらかじめ作成しておく。データ処理部11は、受信データから参照ヒストグラムを作成したサイズと同サイズのデータを抽出し、音声フレームのビット位置ごとの連長のヒストグラム(以降、連長ヒストグラムと称する)を作成する。データ処理部11は、連長ヒストグラムと参照ヒストグラムを比較し、当該受信データの音声符号化方式を判別する。
また、データ処理部11は、連長ヒストグラムと参照ヒストグラムとを比較することで、音声フレーム内のビット位置のずれを推定し、推定したビット位置のずれに相当するデータを破棄し、音声同期ずれを補償する。
さらに、データ処理部11は、判別した音声符号化方式に応じてデコーダ部12が備える入力スイッチ15および出力スイッチ16を切り替え、デコーダ部12が備える、判別した音声符号化方式のデコーダに受信データを出力する。
デコーダ部12は、デコード可能な音声符号化方式が互いに異なる複数のデコーダを備える。デコーダの例として、CS−ACELPデコーダ、LD−CELPデコーダ、ACELPデコーダ、MELPデコーダ、ADPCMデコーダあるいはSB−ADPCMデコーダなどがある。さらに、デコーダ部12は、デコードするデコーダを選択するための入力スイッチ15および出力スイッチ16を備える。デコーダ部12は、データ処理部11から受信した受信データを、データ処理部11によって選択されたデコーダでデコードし、デコードされたデータ(以降、デコードデータと称する)をDA変換器13に出力する。
DA変換器13は、デコーダ部12から受信したデコードデータをアナログ値に変換して出力する。
データベース14は、参照ヒストグラムを記憶するための記憶装置である。
データ処理部11は、例えば各種の論理回路からなるLSIによって実現できる。
次に図1に示したデコード装置1のデータ処理部11の処理手順について図2のフローチャートを参照して説明する。
データ処理部11は、処理を開始すると、まず、データ入力部10から受信データを受信するまで待機する(ステップS1)。
データ処理部11は、データ入力部10から受信データを受信すると、当該受信データの音声フレームのフレーム長を推定する(ステップS2)。同一の符号化仕様では、データ値が0から1、あるいは1から0に変化する、音声フレーム内のビット位置および当該ビット位置以降同一のデータ値が連続する長さを示す連長が類似する傾向にある。符号化データが音声フレームの生成周期で類似した値を有するため、符号化データを周波数軸にならべかえた周波数スペクトルを作成すると、音声フレームが生成される周波数の倍数の周波数で波の強さが大きくなることが示される。これを利用して音声フレームのフレーム長を推定する方法を、G.729 CS−ACELPの音声符号化方式を例に説明する。図3は、G.729 CS−ACELPの符号化データの周波数スペクトルの波形図である。図3の横軸は、周波数を示し、縦軸は、各周波数の波の強さを示している。なお、現在、規格が公開されている、音声の帯域を対象とした音声符号化方式のサンプリング周波数は、G722 SB−ADPCMでは16kHzであり、それ以外では8kHzである。本発明では、FFTにより抽出する最大の周波数は、想定されるサンプリング周波数のうち最小のサンプリング周波数の半分である4kHzとしている。G.729 CS−ACELPでは、サンプリング周波数が8kHzであり、音声フレームのフレーム長が80ビットであるため、音声フレームは100Hz周期で生成される。図3に示す周波数スペクトルでは、100Hzの倍数の周波数で波の強さが大きくなることが示されている。つまり、符号化データを周波数軸にならべかえた周波数スペクトルの波の強さが大きくなる周期を測定することにより、符号化データの音声フレームのフレーム長を推定できる。
したがって、まず、データ処理部11は、受信データを、FFTを用いて周波数軸にならべかえた周波数スペクトルを作成する。
次に、データ処理部11は、周波数スペクトルから波の強さのピークを抽出する。周波数軸にならべかえた周波数スペクトルをあらかじめ設定された範囲で低周波数領域から高周波数領域に順に走査し、各周波数の波の強さとあらかじめ設定された上限閾値および下限閾値を比較していく。波の強さが上限閾値以上の状態になってから下限閾値以下の状態になるまでの間に波の強さが最大となる箇所をピークとして抽出する。
続いて、データ処理部11は、隣り合うピークの間隔を測定し、全てのピーク間隔の平均値を算出する。なお、周波数スペクトルは、周波数軸にならべられているため、算出したピーク間隔の平均値は、周波数を示す。符号化データは、当該周波数の逆数で示される周期で類似した値を有していると考えられる。このため、音声フレームは、当該周波数で生成されると推定できる。したがって、当該周波数をサンプリング周波数で割った値が、音声フレームのフレーム長であると推定できる。図3に示したG.729 CS−ACELPの符号化データの周波数スペクトルでは、ピーク間隔の平均値が100Hzであり、サンプリング周波数が8kHzであるため、音声フレームのフレーム長は、80フレームであると推定される。音声フレームのフレーム長は、符号化仕様に応じて規定されているため、推定したフレーム長から符号化仕様を推定できる。なお、ステップS2では受信データのサンプリング周波数が判明していないため、サンプリング周波数が8kHzであると仮定して音声フレームのフレーム長を算出する。当該算出したフレーム長を規定フレーム長とする。音声符号化方式がG722 SB−ADPCMの場合、サンプリング周波数は16kHzであり、規定フレーム長は、実際のフレーム長の半分になる。
規定フレーム長を推定すると、データ処理部11は、推定した規定フレーム長と規格が公開されている全ての符号化仕様の規定フレーム長を比較する(ステップS3)。なお、ステップS2で、データ処理部11は、受信データのサンプリング周波数が8kHzであると仮定して規定フレーム長を算出した。このため、サンプリング周波数が16kHzの音声符号化方式と比較する場合、その符号化仕様の実際のフレーム長の半分を規定フレーム長とする。データ処理部11は、推定した規定フレーム長が、規格が公開されている符号化仕様の規定フレーム長と一致すると、当該符号化仕様を受信データの符号化仕様の候補としてピックアップする。
規格が公開されているいずれの符号化仕様も受信データの符号化仕様の候補としてピックアップされなかった場合、データ処理部11は、受信データの音声符号化方式が不明と判断し、ステップS9へ移行する。ステップS9へ移行すると、データ処理部11は、利用者に音声符号化方式が不明であることを通知し(ステップS9)、処理を終了する。
一方、1つ以上の符号化仕様が受信データの符号化仕様の候補としてピックアップされた場合、データ処理部11は、ステップS4へ移行し、受信データの連長ヒストグラムを作成する(ステップS4)。
図4は、G.729 CS−ACELP(8.0kbps)の符号化データの連長ヒストグラムの分布図である。図4の左側の図は、0の連長ヒストグラムを示し、右側の図は、1の連長ヒストグラムを示している。図4のY軸は、音声フレーム内のビット位置を示し、X軸は、連長数を示し、Z軸は、連長の度数をログスケールで示している。Y軸の最大値は、ステップS2で推定した規定フレーム長である。
図4に示した連長ヒストグラムの分布図の作成手順例を以下に示す。データ処理部11は、受信データを先頭から走査し、データ値が1から0に変化すると、データ値が変化した音声フレーム内のビット位置をY軸上の値とし、当該ビット位置からデータ値0が連続する長さをX軸上の値として、0の連長ヒストグラムにプロットする。データ処理部11は、同様に、データ値が0から1に変化すると、データ値が変化した音声フレーム内のビット位置をY軸上の値とし、当該ビット位置からデータ値1が連続する長さをX軸上の値として、1の連長ヒストグラムにプロットする。なお、データ値0が連続する長さが0の連長であり、データ値1が連続する長さが1の連長である。
データ処理部11は、受信データの連長ヒストグラムを作成すると、作成した連長ヒストグラムを、ステップS3で受信データの符号化仕様の候補としてピックアップした全ての符号化仕様の参照ヒストグラムと比較する(ステップS5)。
図5は、G.729 CS−ACELP(6.4kbps)の符号化データの連長ヒストグラムの分布図である。図6は、G.729 CS−ACELP(11.8kbps)の符号化データの連長ヒストグラムの分布図である。図7は、ACELP(6.7kbps)の符号化データの連長ヒストグラムの分布図である。図8は、LD−CELP(16kbps)の符号化データの連長ヒストグラムの分布図である。図9は、DoD MELP(54kbps)の符号化データの連長ヒストグラムの分布図である。図10は、G.726 ADPCM(16kbps)の符号化データの連長ヒストグラムの分布図である。図11は、G.726 ADPCM(24kbps)の符号化データの連長ヒストグラムの分布図である。図12は、G.726 ADPCM(32kbps)の符号化データの連長ヒストグラムの分布図である。図13は、G.726 ADPCM(40kbps)の符号化データの連長ヒストグラムの分布図である。図4から図13までに示したように、連長ヒストグラムは、符号化仕様によって異なる特徴を有する。また、同一の符号化仕様では、データ値が0から1に、あるいは1から0に変化する、音声フレーム内のビット位置および当該ビット位置での連長が類似する傾向にある。したがって、ステップS4で作成した連長ヒストグラムを規格が公開されている符号化仕様ごとにあらかじめ作成しておいた参照ヒストグラムと比較し、その相関性を求めることにより、受信データの音声符号化方式を推定できる。
ステップS4で作成した0の連長ヒストグラムをf0(x、y)、1の連長ヒストグラムをf1(x、y)とする。また、規格が公開されている符号化仕様ごとにあらかじめ作成しておいた0の参照ヒストグラムをg0(x、y)、1の参照ヒストグラムをg1(x、y)とする。ここで、xは、各音声フレーム内のビット位置における連長数であり、連長数の最大値をMとすると、1≦x≦Mの範囲の値となる。また、yは、音声フレーム内のビット位置であり、音声フレームの規定フレーム長をNとすると、0≦y≦(N−1)の範囲の値となる。
また、デコード装置1は、図示しないエンコード装置と必ずしも同期をとっているわけではない。このため、デコード装置1は、エンコード装置がエンコードした符号化データを必ずしも先頭から受信しているとは限らない。したがって、ステップS4で作成した連長ヒストグラムと参照ヒストグラムとの相関性は、音声フレーム内のビット位置のずれを考慮して、求められなければならない。
そこで、データ処理部11は、連長ヒストグラムの音声フレーム内のビット位置を値kずつずらして参照ヒストグラムとの相関値を求める。なお、kは、音声フレーム内のビット位置の範囲内の値であり、音声フレームの規定フレーム長以上の値にはならない。
式(1)に示すように、相関値は、連長ヒストグラムと参照ヒストグラムの音声フレーム内のビット位置ごとの0の連長の差分絶対値と1の連長の差分絶対値の総和で算出される。
Figure 2010164809
0≦k≦(N−1)の範囲で、式(1)により算出される相関値が最小となるkが、音声フレーム内のビット位置のずれであると推定できる。
データ処理部11は、ステップS3で受信データの符号化仕様の候補としてピックアップした全ての符号化仕様の参照ヒストグラムに対して相関値を算出する。データ処理部11は、当該相関値が最小となる参照ヒストグラムの音声符号化方式が受信データの音声符号化方式であると推定する。なお、ステップS3で受信データの符号化仕様の候補としてピックアップした符号化仕様が1種類のみである場合、当該符号化仕様の音声符号化方式が受信データの音声符号化方式であると推定する。
続いて、データ処理部11は、ステップS5で算出した相関値が、あらかじめ設定された閾値以下であるか否かを判別する(ステップS6)。ステップS5で算出した相関値があらかじめ設定された閾値以下でない場合、データ処理部11は、受信データの音声符号化方式が不明と判断し、ステップS9へ移行する。ステップS9へ移行すると、データ処理部11は、利用者に音声符号化方式が不明であることを通知し(ステップS9)、処理を終了する。
一方、ステップS5で算出した相関値があらかじめ設定された閾値以下の場合、データ処理部11は、受信データがステップS5で推定した符号化仕様の音声符号化方式で符号化されたと判断し、ステップS7へ移行する。
ステップS7へ移行すると、データ処理部11は、受信データの先頭からステップS6で推定した音声フレーム内のビット位置のずれに相当するデータを破棄し、音声フレームの同期をあわせる(ステップS7)。
続いて、デコーダ部12が備える入力スイッチ15および出力スイッチ16を切り替え、推定した音声符号化方式のデコーダを選択し(ステップS8)、処理を終了する。
第1の実施の形態のデコード装置は、ステップS2でフレーム長を推定した後に、ステップS4に移行し、受信データの連長ヒストグラムに基づいて、音声符号化方式を限定する。ステップS2でフレーム長を推定したときに、受信データの音声符号化方式が限定できる場合、ステップS4からステップS7を省略し、フレーム長から推定した音声符号化方式のデコーダを選択してもよい。この場合、データ処理部11で同期ずれ補償ができず、デコーダ部12で同期ずれ補償を実施する必要があるが、ステップS4からステップS7を省略できるため、より高速に受信データの音声符号化方式を推定できる。
第1の実施の形態のデコード装置は、受信データを周波数解析することにより、音声フレームのフレーム長を推定する。推定したフレーム長が、規格が公開されている符号化仕様のうち、1種類のみの符号化仕様で規定されているフレーム長と一致する場合、当該符号化仕様の音声符号化方式が受信データの音声符号化方式であると推定できる。また、推定したフレーム長が、規格が公開されている全ての符号化仕様で規定されているフレーム長と一致しない場合、受信データは、不明な音声符号化方式で符号化されていると推定できる。
また、第1の実施の形態のデコード装置は、受信データの連長ヒストグラムを作成し、規格が公開されている符号化仕様ごとにあらかじめ作成しておいた参照ヒストグラムと比較することにより、受信データの音声符号化方式を推定する。受信データの音声フレームのフレーム長から音声符号化方式を限定できなかった場合、連長ヒストグラムと参照ヒストグラムを比較することにより当該音声符号化方式を1種類に限定できる。また、連長ヒストグラムと参照ヒストグラムを比較することにより受信データの音声符号化方式の推定の確度を高めることができる。
また、第1の実施の形態のデコード装置は、連長ヒストグラムの音声フレーム内のビット位置のずれを考慮して、参照ヒストグラムとの相関性を求める。このため、デコード装置とエンコード装置の同期が取られていない場合でも、デコード装置は、受信データの音声符号化方式を推定できる。デコード装置は、音声フレーム内のビット位置のずれに相当するデータを破棄した受信データをデコーダ部に供給するため、デコーダ部で音声フレームの同期をとる必要がなくなり、デコード処理を実施するまでの時間を短縮できる。
これらにより、受信データの音声符号化方式を短時間に推定できる。
(第2の実施の形態)
第1の実施の形態のデータ処理部の処理はプログラムによって実現されても良い。
図14は第2の実施の形態のデコード装置の構成を示すブロック図である。
図14に示すように、第2の実施の形態のデコード装置1は、CPU20と、主記憶装置21と、補助記憶装置22と、記録媒体インタフェース装置23と、記録媒体24と、データ入力部10と、データベース14と、デコーダ部12と、DA変換器13とを備え、それらが内部バス30を介して接続される。
記録媒体24には、第1の実施の形態のデータ処理部の機能を実現するためのプログラムが記録される。記録媒体24に記録されたプログラムはCPU20によって記憶媒体インタフェース装置23を介して主記憶装置21に読み込まれる。CPU20は主記憶装置21に読み込んだプログラムにしたがって処理を実行する。なお、記録媒体24は、磁気ディスク、半導体メモリ、光ディスクあるいはその他の記録媒体であってもよい。
1 デコード装置
10 データ入力部
11 データ処理部
12 デコーダ部
13 DA変換器
14 データベース
15 入力スイッチ
16 出力スイッチ
20 CPU
21 主記憶装置
22 補助記憶装置
23 記録媒体インタフェース部
24 記録媒体

Claims (6)

  1. 外部から未知の音声符号化方式で符号化された符号化データを受信するデータ入力部と、
    デコード可能な音声符号化方式が互いに異なる複数のデコーダを備えるデコーダ部と、
    前記データ入力部から受信した符号化データを周波数解析することにより音声フレームのフレーム長を推定し、前記推定したフレーム長に基づいて前記符号化データの音声符号化方式を判別し、前記デコーダ部から前記判別した音声符号化方式に対応するデコーダを選択し、前記符号化データを該デコーダにデコードさせるデータ処理部と、
    を有するデコード装置。
  2. 前記データ処理部は、
    前記符号化データの音声フレームのビット位置ごとの連長のヒストグラムを作成し、規格が公開されている音声符号化方式およびビットレートの組み合わせごとにあらかじめ作成しておいた音声フレームのビット位置ごとの連長のヒストグラムと比較することにより前記符号化データの音声符号化方式を判別する請求項1記載のデコード装置。
  3. 前記データ処理部は、
    前記符号化データの音声フレームのビット位置ごとの連長のヒストグラムと、前記規格が公開されている音声符号化方式およびビットレートの組み合わせごとにあらかじめ作成しておいた音声フレームのビット位置ごとの連長のヒストグラムの比較により、音声フレーム内のビット位置のずれを推定し、前記推定したビット位置のずれに相当するデータを破棄した前記符号化データを前記デコーダ部に供給する請求項2記載のデコード装置。
  4. 互いにデコード可能な音声符号化方式が異なる複数のデコーダを備えるデコード装置の音声符号化方式推定方法であって、
    受信した符号化データを周波数解析することにより音声フレームのフレーム長を推定し、
    前記推定したフレーム長に基づいて前記符号化データの音声符号化方式を判別し、
    前記判別した音声符号化方式に対応するデコーダを選択し、前記符号化データを該デコーダにデコードさせる音声符号化方式推定方法。
  5. 前記符号化データの音声フレームのビット位置ごとの連長のヒストグラムを作成し、規格が公開されている音声符号化方式およびビットレートの組み合わせごとにあらかじめ作成しておいた音声フレームのビット位置ごとの連長のヒストグラムと比較することにより前記符号化データの音声符号化方式を判別する請求項4記載の音声符号化方式推定方法。
  6. 前記符号化データの音声フレームのビット位置ごとの連長のヒストグラムと、前記規格が公開されている音声符号化方式およびビットレートの組み合わせごとにあらかじめ作成しておいた音声フレームのビット位置ごとの連長のヒストグラムの比較により、音声フレーム内のビット位置のずれを推定し、
    前記推定したビット位置のずれに相当するデータを破棄した前記符号化データを前記デコーダに供給する請求項5記載の音声符号化方式推定方法。
JP2009007496A 2009-01-16 2009-01-16 デコード装置および音声符号化方式推定方法 Active JP5182112B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009007496A JP5182112B2 (ja) 2009-01-16 2009-01-16 デコード装置および音声符号化方式推定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009007496A JP5182112B2 (ja) 2009-01-16 2009-01-16 デコード装置および音声符号化方式推定方法

Publications (2)

Publication Number Publication Date
JP2010164809A true JP2010164809A (ja) 2010-07-29
JP5182112B2 JP5182112B2 (ja) 2013-04-10

Family

ID=42581016

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009007496A Active JP5182112B2 (ja) 2009-01-16 2009-01-16 デコード装置および音声符号化方式推定方法

Country Status (1)

Country Link
JP (1) JP5182112B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107770540A (zh) * 2016-08-21 2018-03-06 上海天荷电子信息有限公司 融合多种具有不同参考关系的基元的数据压缩方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002006888A (ja) * 2000-06-21 2002-01-11 Ando Electric Co Ltd コーデック方式判定方式及びコーデック方式の自動選択回路
JP2005217486A (ja) * 2004-01-27 2005-08-11 Matsushita Electric Ind Co Ltd ストリーム復号装置
JP2007043559A (ja) * 2005-08-04 2007-02-15 Mitsubishi Electric Corp 符号化方式判定装置
JP2007243650A (ja) * 2006-03-09 2007-09-20 Nec Corp 復号方法及び復号装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002006888A (ja) * 2000-06-21 2002-01-11 Ando Electric Co Ltd コーデック方式判定方式及びコーデック方式の自動選択回路
JP2005217486A (ja) * 2004-01-27 2005-08-11 Matsushita Electric Ind Co Ltd ストリーム復号装置
JP2007043559A (ja) * 2005-08-04 2007-02-15 Mitsubishi Electric Corp 符号化方式判定装置
JP2007243650A (ja) * 2006-03-09 2007-09-20 Nec Corp 復号方法及び復号装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSND199900348003; 鈴木 孝尚 ほか1名: 'ソフトウエア受信機,1台で任意の無線変調方式に対応(上)' 日経エレクトロニクス Vol.732, 19981214, pp.183-193, 日経BP社 *
CSNJ200810033487; 細谷 晴彦 ほか6名: '隣接シンボル位相差を用いた変調方式識別の一検討' 電子情報通信学会2000年総合大会講演論文集 通信1 , 20000307, pp.487, 社団法人電子情報通信学会 *
JPN6012065116; 細谷 晴彦 ほか6名: '隣接シンボル位相差を用いた変調方式識別の一検討' 電子情報通信学会2000年総合大会講演論文集 通信1 , 20000307, pp.487, 社団法人電子情報通信学会 *
JPN6012065117; 鈴木 孝尚 ほか1名: 'ソフトウエア受信機,1台で任意の無線変調方式に対応(上)' 日経エレクトロニクス Vol.732, 19981214, pp.183-193, 日経BP社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107770540A (zh) * 2016-08-21 2018-03-06 上海天荷电子信息有限公司 融合多种具有不同参考关系的基元的数据压缩方法和装置
CN107770540B (zh) * 2016-08-21 2024-01-09 上海天荷电子信息有限公司 融合多种具有不同参考关系的基元的数据压缩方法和装置

Also Published As

Publication number Publication date
JP5182112B2 (ja) 2013-04-10

Similar Documents

Publication Publication Date Title
US11282529B2 (en) Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver, and system for transmitting audio signals
EP2693430B1 (en) Encoding apparatus and method, and program
EP2492911B1 (en) Audio encoding apparatus, decoding apparatus, method, circuit and program
US8990094B2 (en) Coding and decoding a transient frame
JP2010286853A (ja) 合成による分析celp型音声符号化のための適応型ウィンドウ
US8265296B2 (en) Method and apparatus for encoding and decoding noise signal
JP4550176B2 (ja) 音声符号化方法
JP5182112B2 (ja) デコード装置および音声符号化方式推定方法
US7177802B2 (en) Pitch cycle search range setting apparatus and pitch cycle search apparatus
US8392177B2 (en) Method and apparatus for frequency encoding, and method and apparatus for frequency decoding
JP2008203315A (ja) オーディオ符号化・復号化装置、方法、及びソフトウェア
JP2006510938A (ja) 音声符号化における正弦波の選択
JP3559485B2 (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
JP2006510937A (ja) オーディオ符号化における正弦波選択
KR102424897B1 (ko) 상이한 손실 은닉 도구들의 세트를 지원하는 오디오 디코더
JP2009003388A (ja) ピッチ探索範囲決定装置、ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体
JPH10105196A (ja) 音声符号化装置
KR20060080263A (ko) 디지털 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111109

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121231

R150 Certificate of patent or registration of utility model

Ref document number: 5182112

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160125

Year of fee payment: 3