JP2003264466A5 - - Google Patents

Download PDF

Info

Publication number
JP2003264466A5
JP2003264466A5 JP2002061400A JP2002061400A JP2003264466A5 JP 2003264466 A5 JP2003264466 A5 JP 2003264466A5 JP 2002061400 A JP2002061400 A JP 2002061400A JP 2002061400 A JP2002061400 A JP 2002061400A JP 2003264466 A5 JP2003264466 A5 JP 2003264466A5
Authority
JP
Japan
Prior art keywords
data
tap
class
prediction
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002061400A
Other languages
Japanese (ja)
Other versions
JP2003264466A (en
JP4000589B2 (en
Filing date
Publication date
Application filed filed Critical
Priority to JP2002061400A priority Critical patent/JP4000589B2/en
Priority claimed from JP2002061400A external-priority patent/JP4000589B2/en
Publication of JP2003264466A publication Critical patent/JP2003264466A/en
Publication of JP2003264466A5 publication Critical patent/JP2003264466A5/ja
Application granted granted Critical
Publication of JP4000589B2 publication Critical patent/JP4000589B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Claims (57)

データを符号化した符号化データであって、少なくとも、前記データの特性を表す特性データを含む符号化データを復号する復号装置において、
前記特性データの正しさを判定し、その判定結果を表すミスマッチ情報を出力する判定手段と、
前記ミスマッチ情報に基づいて、前記符号化データを復号する復号手段と
を備えることを特徴とする復号装置。
In a decoding device that decodes encoded data that is encoded data and includes at least characteristic data that represents the characteristics of the data,
Determination means for determining the correctness of the characteristic data and outputting mismatch information representing the determination result;
A decoding device comprising: decoding means for decoding the encoded data based on the mismatch information.
前記判定手段は、前記符号化データを復号した復号結果、または前記符号化データを復号する過程で得られる情報に基づいて、前記特性データの正しさを判定する
ことを特徴とする請求項1に記載の復号装置。
The determination unit determines the correctness of the characteristic data based on a decoding result obtained by decoding the encoded data or information obtained in a process of decoding the encoded data. The decoding device described.
前記符号化データから前記特性データを抽出する特性データ抽出手段と、
前記符号化データから、その符号化データに対応する元のデータの実際の特性である実特性を抽出する実特性抽出手段と
をさらに備え、
前記判定手段は、前記特性データと実特性とを比較することにより、その特性データの正しさを判定する
ことを特徴とする請求項1に記載の復号装置。
Characteristic data extracting means for extracting the characteristic data from the encoded data;
An actual characteristic extracting means for extracting an actual characteristic that is an actual characteristic of the original data corresponding to the encoded data from the encoded data; and
The decoding apparatus according to claim 1, wherein the determination unit determines the correctness of the characteristic data by comparing the characteristic data with an actual characteristic.
前記復号手段は、
前記符号化データを復号した復号データのうちの、注目している注目復号データについて、その注目復号データを、複数のクラスのうちのいずれかのクラスにクラス分類するのに用いるクラスタップを、前記符号化データから抽出するクラスタップ抽出手段と、
前記クラスタップに基づいて、前記注目復号データをクラス分類し、対応するクラスのクラスコードを出力するクラス分類手段と、
前記クラスごとの所定のタップ係数から、前記クラスコードに対応するタップ係数を取得するタップ係数取得手段と、
前記注目復号データについて、前記タップ係数との所定の予測演算に用いる予測タップを、前記符号化データから抽出する予測タップ抽出手段と、
前記予測タップとタップ係数とを用いて予測演算を行うことにより、前記注目復号データを求める予測演算手段と
を有する
ことを特徴とする請求項1に記載の復号装置。
The decoding means includes
Of the decoded data obtained by decoding the encoded data, a class tap used for classifying the focused decoded data of interest into any one of a plurality of classes, Class tap extraction means for extracting from encoded data;
Classifying means for classifying the decoded data of interest based on the class tap and outputting a class code of a corresponding class;
From a predetermined tap coefficient for each class, tap coefficient acquisition means for acquiring a tap coefficient corresponding to the class code;
A prediction tap extraction means for extracting, from the encoded data, a prediction tap used for a predetermined prediction calculation with the tap coefficient for the target decoded data;
The decoding apparatus according to claim 1, further comprising: a prediction calculation unit that obtains the decoded data of interest by performing a prediction calculation using the prediction tap and the tap coefficient.
前記クラスタップ抽出手段は、前記ミスマッチ情報に基づき、前記符号化データから、クラスタップを抽出する
ことを特徴とする請求項4に記載の復号装置。
The decoding device according to claim 4, wherein the class tap extraction unit extracts a class tap from the encoded data based on the mismatch information.
前記クラス分類手段は、前記ミスマッチ情報にも基づいて、前記注目復号データをクラス分類する
ことを特徴とする請求項4に記載の復号装置。
The decoding apparatus according to claim 4, wherein the class classification unit classifies the target decoded data based on the mismatch information.
前記予測タップ抽出手段は、前記ミスマッチ情報に基づき、前記符号化データから、予測タップを抽出する
ことを特徴とする請求項4に記載の復号装置。
The decoding apparatus according to claim 4, wherein the prediction tap extraction unit extracts a prediction tap from the encoded data based on the mismatch information.
前記符号化データは、音声データを、CELP(Code Excited Liner Prediction coding)方式によって符号化することにより得られたものである
ことを特徴とする請求項1に記載の復号装置。
The decoding apparatus according to claim 1, wherein the encoded data is obtained by encoding audio data by a CELP (Code Excited Linear Prediction coding) method.
前記符号化データから、ラグを表すLコードを、前記特性データとして抽出する特性データ抽出手段と、
前記符号化データを復号し、その結果得られる復号音声データのピッチ周期を、元の音声データの実際の特性である実特性として求める実特性抽出手段と
をさらに備え、
前記判定手段は、前記Lコードが表す時間と、前記実特性としてのピッチ周期との差分に基づいて、前記Lコードの正しさを判定する
ことを特徴とする請求項8に記載の復号装置。
Characteristic data extracting means for extracting an L code representing lag from the encoded data as the characteristic data;
An actual characteristic extraction unit that decodes the encoded data and obtains a pitch period of the decoded audio data obtained as a result as an actual characteristic that is an actual characteristic of the original audio data;
The decoding apparatus according to claim 8, wherein the determination unit determines the correctness of the L code based on a difference between a time represented by the L code and a pitch period as the actual characteristic.
前記復号手段は、
前記符号化データを、CELP方式にしたがって復号し、CELP復号データを出力するCELP復号手段と、
前記CELP復号データを高品質化した高品質化データのうちの、注目している注目高品質化データについて、その注目高品質化データを、複数のクラスのうちのいずれかのクラスにクラス分類するのに用いるクラスタップを、前記CELP復号データから抽出するクラスタップ抽出手段と、
前記クラスタップに基づいて、前記注目高品質化データをクラス分類し、対応するクラスのクラスコードを出力するクラス分類手段と、
前記クラスごとの所定のタップ係数から、前記クラスコードに対応するタップ係数を取得するタップ係数取得手段と、
前記注目高品質化データについて、前記タップ係数との所定の予測演算に用いる予測タップを、前記CELP復号データから抽出する予測タップ抽出手段と、 前記予測タップとタップ係数とを用いて予測演算を行うことにより、前記注目高品質化データを求める予測演算手段と
を有する
ことを特徴とする請求項8に記載の復号装置。
The decoding means includes
CELP decoding means for decoding the encoded data according to a CELP scheme and outputting CELP decoded data;
Of the quality-enhanced data that is focused on among the quality-enhanced data obtained by improving the quality of the CELP decoded data, classify the quality-enhanced data of interest into one of a plurality of classes. Class tap extracting means for extracting the class tap used for the above from the CELP decoded data;
Based on the class tap, classifying the focused high quality data, class classification means for outputting the class code of the corresponding class,
From a predetermined tap coefficient for each class, tap coefficient acquisition means for acquiring a tap coefficient corresponding to the class code;
A prediction tap extraction unit that extracts a prediction tap used for a predetermined prediction calculation with the tap coefficient from the CELP decoded data, and a prediction calculation using the prediction tap and the tap coefficient with respect to the high quality data of interest. The decoding apparatus according to claim 8, further comprising: a prediction calculation unit that obtains the attention-enhanced quality-enhanced data.
前記クラスタップ抽出手段は、前記ミスマッチ情報に基づき、前記CELP復号データから、クラスタップを抽出する
ことを特徴とする請求項10に記載の復号装置。
The decoding device according to claim 10, wherein the class tap extraction unit extracts a class tap from the CELP decoded data based on the mismatch information.
前記クラス分類手段は、前記ミスマッチ情報にも基づいて、前記注目復号データをクラス分類する
ことを特徴とする請求項10に記載の復号装置。
The decoding apparatus according to claim 10, wherein the class classification unit classifies the target decoded data based on the mismatch information.
前記予測タップ抽出手段は、前記ミスマッチ情報に基づき、前記CELP復号データから、予測タップを抽出する
ことを特徴とする請求項10に記載の復号装置。
The decoding device according to claim 10, wherein the prediction tap extraction unit extracts a prediction tap from the CELP decoded data based on the mismatch information.
前記クラスタップ抽出手段は、前記符号化データからも、前記クラスタップを抽出する
ことを特徴とする請求項10に記載の復号装置。
The decoding device according to claim 10, wherein the class tap extraction unit extracts the class tap from the encoded data.
前記予測タップ抽出手段は、前記符号化データからも、前記予測タップを抽出する
ことを特徴とする請求項10に記載の復号装置。
The decoding device according to claim 10, wherein the prediction tap extraction unit extracts the prediction tap also from the encoded data.
前記復号手段は、
前記符号化データを復号し、音声合成フィルタを駆動する残差信号を出力する残差信号復号手段と、
高品質の音声合成フィルタ出力を得るための残差信号である高品質化残差信号のうちの、注目している注目高品質化残差信号について、その注目高品質化残差信号を、複数のクラスのうちのいずれかのクラスにクラス分類するのに用いるクラスタップを、前記残差信号から抽出するクラスタップ抽出手段と、
前記クラスタップに基づいて、前記注目高品質化残差信号をクラス分類し、対応するクラスのクラスコードを出力するクラス分類手段と、
前記クラスごとの所定のタップ係数から、前記クラスコードに対応するタップ係数を取得するタップ係数取得手段と、
前記注目高品質化残差信号について、前記タップ係数との所定の予測演算に用いる予測タップを、前記残差信号から抽出する予測タップ抽出手段と、
前記予測タップとタップ係数とを用いて予測演算を行うことにより、前記注目高品質化残差信号を求める予測演算手段と、
前記高品質化残差信号をフィルタリングし、高品質の復号音声を出力する前記音声合成フィルタと
を有する
ことを特徴とする請求項8に記載の復号装置。
The decoding means includes
Residual signal decoding means for decoding the encoded data and outputting a residual signal for driving a speech synthesis filter;
Among the high-quality residual signals, which are residual signals for obtaining high-quality speech synthesis filter outputs, a plurality of high-quality residual signals of interest for the high-quality residual signals of interest. Class tap extracting means for extracting a class tap used for classifying into any one of the classes of the residual signal from the residual signal;
Classifying means for classifying the attention-enhanced residual signal based on the class tap and outputting a class code of a corresponding class;
From a predetermined tap coefficient for each class, tap coefficient acquisition means for acquiring a tap coefficient corresponding to the class code;
A prediction tap extraction unit that extracts a prediction tap used for a predetermined prediction calculation with the tap coefficient for the attention-enhanced residual signal, from the residual signal;
Prediction calculation means for obtaining the attention-enhanced quality residual signal by performing a prediction calculation using the prediction tap and the tap coefficient;
The decoding apparatus according to claim 8, further comprising: the speech synthesis filter that filters the quality-enhanced residual signal and outputs high-quality decoded speech.
前記クラスタップ抽出手段は、前記ミスマッチ情報に基づき、前記残差信号から、クラスタップを抽出する
ことを特徴とする請求項16に記載の復号装置。
The decoding device according to claim 16, wherein the class tap extraction unit extracts a class tap from the residual signal based on the mismatch information.
前記クラス分類手段は、前記ミスマッチ情報にも基づいて、前記注目高品質化残差信号をクラス分類する
ことを特徴とする請求項16に記載の復号装置。
The decoding apparatus according to claim 16, wherein the class classification unit classifies the attention-enhanced quality-enhanced residual signal based on the mismatch information.
前記予測タップ抽出手段は、前記ミスマッチ情報に基づき、前記残差信号から、予測タップを抽出する
ことを特徴とする請求項16に記載の復号装置。
The decoding apparatus according to claim 16, wherein the prediction tap extraction unit extracts a prediction tap from the residual signal based on the mismatch information.
前記クラスタップ抽出手段は、前記符号化データからも、前記クラスタップを抽出する
ことを特徴とする請求項16に記載の復号装置。
The decoding apparatus according to claim 16, wherein the class tap extraction unit extracts the class tap from the encoded data.
前記予測タップ抽出手段は、前記符号化データからも、前記予測タップを抽出する
ことを特徴とする請求項16に記載の復号装置。
The decoding apparatus according to claim 16, wherein the prediction tap extraction unit extracts the prediction tap also from the encoded data.
前記復号手段は、
前記符号化データを復号し、音声合成フィルタのフィルタ係数となる線形予測係数を出力する線形予測係数復号手段と、
高品質の音声合成フィルタ出力を得るための線形予測係数である高品質化線形予測係数のうちの、注目している注目高品質化線形予測係数について、その注目高品質化線形予測係数を、複数のクラスのうちのいずれかのクラスにクラス分類するのに用いるクラスタップを、前記線形予測係数から抽出するクラスタップ抽出手段と、
前記クラスタップに基づいて、前記注目高品質化線形予測係数をクラス分類し、対応するクラスのクラスコードを出力するクラス分類手段と、
前記クラスごとの所定のタップ係数から、前記クラスコードに対応するタップ係数を取得するタップ係数取得手段と、
前記注目高品質化線形予測係数について、前記タップ係数との所定の予測演算に用いる予測タップを、前記線形予測係数から抽出する予測タップ抽出手段と、 前記予測タップとタップ係数とを用いて予測演算を行うことにより、前記注目高品質化線形予測係数を求める予測演算手段と、
前記高品質化線形予測係数をフィルタ係数としてフィルタリングを行い、高品質の復号音声を出力する前記音声合成フィルタと
を有する
ことを特徴とする請求項8に記載の復号装置。
The decoding means includes
Linear prediction coefficient decoding means for decoding the encoded data and outputting linear prediction coefficients that serve as filter coefficients of a speech synthesis filter;
Among the high-quality linear prediction coefficients that are the linear prediction coefficients for obtaining a high-quality speech synthesis filter output, the target high-quality linear prediction coefficients of the high-quality linear prediction coefficients of interest A class tap extracting means for extracting a class tap used for classifying into any of the classes of the linear prediction coefficients;
Classifying means for classifying the focused high-quality linear prediction coefficient based on the class tap and outputting a class code of a corresponding class;
From a predetermined tap coefficient for each class, tap coefficient acquisition means for acquiring a tap coefficient corresponding to the class code;
A prediction tap extracting unit that extracts a prediction tap used for a predetermined prediction calculation with the tap coefficient from the linear prediction coefficient, and a prediction calculation using the prediction tap and the tap coefficient. By performing the prediction calculation means for obtaining the attention high quality linear prediction coefficient,
The decoding apparatus according to claim 8, further comprising: the speech synthesis filter that performs filtering using the high-quality linear prediction coefficient as a filter coefficient and outputs high-quality decoded speech.
前記クラスタップ抽出手段は、前記ミスマッチ情報に基づき、前記線形予測係数から、クラスタップを抽出する
ことを特徴とする請求項22に記載の復号装置。
The decoding device according to claim 22, wherein the class tap extraction unit extracts a class tap from the linear prediction coefficient based on the mismatch information.
前記クラス分類手段は、前記ミスマッチ情報にも基づいて、前記注目高品質化線形予測係数をクラス分類する
ことを特徴とする請求項22に記載の復号装置。
23. The decoding apparatus according to claim 22, wherein the class classification unit classifies the focused high-quality linear prediction coefficient based on the mismatch information.
前記予測タップ抽出手段は、前記ミスマッチ情報に基づき、前記線形予測係数から、予測タップを抽出する
ことを特徴とする請求項22に記載の復号装置。
The decoding apparatus according to claim 22, wherein the prediction tap extraction unit extracts a prediction tap from the linear prediction coefficient based on the mismatch information.
前記クラスタップ抽出手段は、前記符号化データからも、前記クラスタップを抽出する
ことを特徴とする請求項22に記載の復号装置。
The decoding apparatus according to claim 22, wherein the class tap extraction unit extracts the class tap from the encoded data.
前記予測タップ抽出手段は、前記符号化データからも、前記予測タップを抽出する
ことを特徴とする請求項22に記載の復号装置。
The decoding apparatus according to claim 22, wherein the prediction tap extraction unit extracts the prediction tap also from the encoded data.
前記符号化データは、画像データを、MPEG(Moving Picture Experts Group)方式によって符号化することにより得られたものである
ことを特徴とする請求項1に記載の復号装置。
The decoding apparatus according to claim 1, wherein the encoded data is obtained by encoding image data according to an MPEG (Moving Picture Experts Group) method.
前記符号化データから、ブロックのDCT(Discrete Cosine Transform)タイプを、前記特性データとして抽出する特性データ抽出手段と、
前記符号化データを復号した復号画像データのライン間の相関であるライン相関を、元の画像データの実際の特性である実特性として求める実特性抽出手段と
をさらに備え、
前記判定手段は、前記ライン相関に基づいて、前記DCTタイプの正しさを判定する
ことを特徴とする請求項28に記載の復号装置。
Characteristic data extraction means for extracting a DCT (Discrete Cosine Transform) type of a block from the encoded data as the characteristic data;
An actual characteristic extracting means for obtaining a line correlation that is a correlation between lines of decoded image data obtained by decoding the encoded data as an actual characteristic that is an actual characteristic of the original image data;
The decoding device according to claim 28, wherein the determination unit determines the correctness of the DCT type based on the line correlation.
前記実特性抽出手段は、
前記符号化データをMPEG復号し、前記復号画像データを出力するMPEG復号手段と、
前記復号画像データに基づいて、前記ライン相関を求めるライン相関演算手段と
を有する
ことを特徴とする請求項29に記載の復号装置。
The actual characteristic extracting means includes
MPEG decoding means for decoding the encoded data and outputting the decoded image data;
30. The decoding device according to claim 29, further comprising: a line correlation calculation unit that obtains the line correlation based on the decoded image data.
前記実特性抽出手段は、
前記符号化データから、2次元DCT係数を抽出する2次元DCT係数抽出手段と、
前記2次元DCT係数に基づいて、前記ライン相関を求めるライン相関演算手段と
を有する
ことを特徴とする請求項29に記載の復号装置。
The actual characteristic extracting means includes
Two-dimensional DCT coefficient extraction means for extracting a two-dimensional DCT coefficient from the encoded data;
30. The decoding apparatus according to claim 29, further comprising: line correlation calculation means for obtaining the line correlation based on the two-dimensional DCT coefficient.
前記実特性抽出手段は、
前記符号化データから、2次元DCT係数を抽出する2次元DCT係数抽出手段と、
前記2次元DCT係数から、1次元DCT係数を求める1次元DCT係数算出手段と、
前記1次元DCT係数に基づいて、前記ライン相関を求めるライン相関演算手段と
を有する
ことを特徴とする請求項29に記載の復号装置。
The actual characteristic extracting means includes
Two-dimensional DCT coefficient extraction means for extracting a two-dimensional DCT coefficient from the encoded data;
One-dimensional DCT coefficient calculating means for obtaining a one-dimensional DCT coefficient from the two-dimensional DCT coefficient;
30. The decoding apparatus according to claim 29, further comprising: line correlation calculation means for obtaining the line correlation based on the one-dimensional DCT coefficient.
前記復号手段は、
前記符号化データを、MPEG方式にしたがって復号し、MPEG復号データを出力するMPEG復号手段と、
前記MPEG復号データを高品質化した高品質化データのうちの、注目している注目高品質化データについて、その注目高品質化データを、複数のクラスのうちのいずれかのクラスにクラス分類するのに用いるクラスタップを、前記MPEG復号データから抽出するクラスタップ抽出手段と、
前記クラスタップに基づいて、前記注目高品質化データをクラス分類し、対応するクラスのクラスコードを出力するクラス分類手段と、
前記クラスごとの所定のタップ係数から、前記クラスコードに対応するタップ係数を取得するタップ係数取得手段と、
前記注目高品質化データについて、前記タップ係数との所定の予測演算に用いる予測タップを、前記MPEG復号データから抽出する予測タップ抽出手段と、 前記予測タップとタップ係数とを用いて予測演算を行うことにより、前記注目高品質化データを求める予測演算手段と
を有する
ことを特徴とする請求項28に記載の復号装置。
The decoding means includes
MPEG decoding means for decoding the encoded data according to the MPEG system and outputting MPEG decoded data;
Of the high quality data obtained by improving the quality of the MPEG decoded data, the high quality data of interest is classified into one of a plurality of classes. Class tap extracting means for extracting the class tap used for the above from the MPEG decoded data;
Based on the class tap, classifying the focused high quality data, class classification means for outputting the class code of the corresponding class,
From a predetermined tap coefficient for each class, tap coefficient acquisition means for acquiring a tap coefficient corresponding to the class code;
Predictive tap extraction means for extracting prediction taps used for predetermined prediction calculation with the tap coefficients from the MPEG decoded data, and prediction calculation using the prediction taps and tap coefficients for the high quality data of interest 29. The decoding apparatus according to claim 28, further comprising: predictive calculation means for obtaining the attention-enhanced quality data.
前記クラスタップ抽出手段は、前記ミスマッチ情報に基づき、前記MPEG復号データから、クラスタップを抽出する
ことを特徴とする請求項33に記載の復号装置。
The decoding device according to claim 33, wherein the class tap extraction unit extracts a class tap from the MPEG decoded data based on the mismatch information.
前記クラス分類手段は、前記ミスマッチ情報にも基づいて、前記注目復号データをクラス分類する
ことを特徴とする請求項33に記載の復号装置。
The decoding device according to claim 33, wherein the class classification means classifies the focused decoded data based on the mismatch information.
前記予測タップ抽出手段は、前記ミスマッチ情報に基づき、前記MPEG復号データから、予測タップを抽出する
ことを特徴とする請求項33に記載の復号装置。
The decoding device according to claim 33, wherein the prediction tap extraction unit extracts a prediction tap from the MPEG decoded data based on the mismatch information.
前記クラスタップ抽出手段は、前記符号化データからも、前記クラスタップを抽出する
ことを特徴とする請求項33に記載の復号装置。
The decoding device according to claim 33, wherein the class tap extraction unit extracts the class tap also from the encoded data.
前記予測タップ抽出手段は、前記符号化データからも、前記予測タップを抽出する
ことを特徴とする請求項33に記載の復号装置。
The decoding apparatus according to claim 33, wherein the prediction tap extraction unit extracts the prediction tap also from the encoded data.
前記復号手段は、
前記符号化データから、画像データを2次元DCT変換した2次元DCT係数を取得する2次元DCT係数取得手段と、
前記符号化データをMPEG復号したMPEG復号データを高品質化した高品質化データのうちの、注目している注目高品質化データについて、その注目高品質化データを、複数のクラスのうちのいずれかのクラスにクラス分類するのに用いるクラスタップを、前記2次元DCT係数から抽出するクラスタップ抽出手段と、
前記クラスタップに基づいて、前記注目高品質化データをクラス分類し、対応するクラスのクラスコードを出力するクラス分類手段と、
前記クラスごとの所定のタップ係数から、前記クラスコードに対応するタップ係数を取得するタップ係数取得手段と、
前記注目高品質化データについて、前記タップ係数との所定の予測演算に用いる予測タップを、前記2次元DCT係数から抽出する予測タップ抽出手段と、
前記予測タップとタップ係数とを用いて予測演算を行うことにより、前記注目高品質化データを求める予測演算手段と
を有する
ことを特徴とする請求項28に記載の復号装置。
The decoding means includes
Two-dimensional DCT coefficient acquisition means for acquiring a two-dimensional DCT coefficient obtained by two-dimensional DCT-transforming image data from the encoded data;
Of the quality-enhanced data to which attention is paid out of the quality-enhanced data obtained by improving the quality of MPEG-decoded data obtained by MPEG-decoding the encoded data, the noticed quality-enhanced data is selected from any of a plurality of classes. A class tap extracting means for extracting a class tap used for classifying into the class from the two-dimensional DCT coefficient;
Based on the class tap, classifying the focused high quality data, class classification means for outputting the class code of the corresponding class,
From a predetermined tap coefficient for each class, tap coefficient acquisition means for acquiring a tap coefficient corresponding to the class code;
A prediction tap extracting means for extracting a prediction tap used for a predetermined prediction calculation with the tap coefficient from the two-dimensional DCT coefficient with respect to the attention-enhanced quality data;
The decoding apparatus according to claim 28, further comprising: a prediction calculation unit that calculates the attention-enhanced quality-enhanced data by performing a prediction calculation using the prediction tap and the tap coefficient.
前記クラスタップ抽出手段は、前記ミスマッチ情報に基づき、前記2次元DCT係数から、クラスタップを抽出する
ことを特徴とする請求項39に記載の復号装置。
The decoding apparatus according to claim 39, wherein the class tap extraction unit extracts a class tap from the two-dimensional DCT coefficient based on the mismatch information.
前記クラス分類手段は、前記ミスマッチ情報にも基づいて、前記注目高品質化データをクラス分類する
ことを特徴とする請求項39に記載の復号装置。
The decoding device according to claim 39, wherein the class classification means classifies the attention-enhanced quality-enhanced data based on the mismatch information.
前記予測タップ抽出手段は、前記ミスマッチ情報に基づき、前記2次元DCT係数から、予測タップを抽出する
ことを特徴とする請求項39に記載の復号装置。
The decoding device according to claim 39, wherein the prediction tap extraction unit extracts a prediction tap from the two-dimensional DCT coefficient based on the mismatch information.
前記クラスタップ抽出手段は、前記符号化データからも、前記クラスタップを抽出する
ことを特徴とする請求項39に記載の復号装置。
40. The decoding apparatus according to claim 39, wherein the class tap extraction unit extracts the class tap from the encoded data.
前記予測タップ抽出手段は、前記符号化データからも、前記予測タップを抽出する
ことを特徴とする請求項39に記載の復号装置。
The decoding apparatus according to claim 39, wherein the prediction tap extraction unit extracts the prediction tap also from the encoded data.
前記復号手段は、
前記符号化データから、画像データを2次元DCT変換した2次元DCT係数を取得する2次元DCT係数取得手段と、
高品質の復号画像を求めるための2次元DCT係数である高品質化2次元DCT係数のうちの、注目している注目高品質化2次元DCT係数について、その注目高品質化2次元DCT係数を、複数のクラスのうちのいずれかのクラスにクラス分類するのに用いるクラスタップを、前記2次元DCT係数から抽出するクラスタップ抽出手段と、
前記クラスタップに基づいて、前記注目高品質化2次元DCT係数をクラス分類し、対応するクラスのクラスコードを出力するクラス分類手段と、
前記クラスごとの所定のタップ係数から、前記クラスコードに対応するタップ係数を取得するタップ係数取得手段と、
前記注目高品質化2次元DCT係数について、前記タップ係数との所定の予測演算に用いる予測タップを、前記2次元DCT係数から抽出する予測タップ抽出手段と、
前記予測タップとタップ係数とを用いて予測演算を行うことにより、前記注目高品質化2次元DCT係数を求める予測演算手段と、
前記高品質化2次元DCT係数を2次元逆DCT変換し、高品質の復号画像を求める2次元逆DCT変換手段と
を有する
ことを特徴とする請求項28に記載の復号装置。
The decoding means includes
Two-dimensional DCT coefficient acquisition means for acquiring a two-dimensional DCT coefficient obtained by two-dimensional DCT-transforming image data from the encoded data;
Among the high-quality two-dimensional DCT coefficients that are high-quality two-dimensional DCT coefficients for obtaining a high-quality decoded image, the target high-quality two-dimensional DCT coefficient is selected as the target high-quality two-dimensional DCT coefficient of interest. Class tap extraction means for extracting a class tap used for classifying into any one of a plurality of classes from the two-dimensional DCT coefficient;
Class classifying means for classifying the focused high quality two-dimensional DCT coefficient based on the class tap and outputting a class code of a corresponding class;
From a predetermined tap coefficient for each class, tap coefficient acquisition means for acquiring a tap coefficient corresponding to the class code;
A prediction tap extracting means for extracting, from the two-dimensional DCT coefficient, a prediction tap used for a predetermined prediction calculation with the tap coefficient for the attention-enhanced two-dimensional DCT coefficient;
Prediction calculation means for obtaining the attention-enhanced quality two-dimensional DCT coefficient by performing a prediction calculation using the prediction tap and the tap coefficient;
29. The decoding apparatus according to claim 28, further comprising: a two-dimensional inverse DCT transform unit that performs a two-dimensional inverse DCT transform on the high-quality two-dimensional DCT coefficient to obtain a high-quality decoded image.
前記クラスタップ抽出手段は、前記ミスマッチ情報に基づき、前記2次元DCT係数から、クラスタップを抽出する
ことを特徴とする請求項45に記載の復号装置。
The decoding device according to claim 45, wherein the class tap extraction unit extracts a class tap from the two-dimensional DCT coefficient based on the mismatch information.
前記クラス分類手段は、前記ミスマッチ情報にも基づいて、前記注目高品質化2次元DCT係数をクラス分類する
ことを特徴とする請求項45に記載の復号装置。
The decoding apparatus according to claim 45, wherein the class classification unit classifies the high-quality two-dimensional DCT coefficient of interest based on the mismatch information.
前記予測タップ抽出手段は、前記ミスマッチ情報に基づき、前記2次元DCT係数から、予測タップを抽出する
ことを特徴とする請求項45に記載の復号装置。
The decoding apparatus according to claim 45, wherein the prediction tap extraction unit extracts a prediction tap from the two-dimensional DCT coefficient based on the mismatch information.
前記クラスタップ抽出手段は、前記符号化データからも、前記クラスタップを抽出する
ことを特徴とする請求項45に記載の復号装置。
The decoding device according to claim 45, wherein the class tap extraction unit extracts the class tap also from the encoded data.
前記予測タップ抽出手段は、前記符号化データからも、前記予測タップを抽出する
ことを特徴とする請求項45に記載の復号装置。
The decoding apparatus according to claim 45, wherein the prediction tap extraction unit extracts the prediction tap also from the encoded data.
データを符号化した符号化データであって、少なくとも、前記データの特性を表す特性データを含む符号化データを復号する復号方法において、
前記特性データの正しさを判定し、その判定結果を表すミスマッチ情報を出力する判定ステップと、
前記ミスマッチ情報に基づいて、前記符号化データを復号する復号ステップと を備えることを特徴とする復号方法。
In a decoding method for decoding encoded data obtained by encoding data, and at least encoded data including characteristic data representing characteristics of the data,
A determination step of determining the correctness of the characteristic data and outputting mismatch information representing the determination result;
And a decoding step of decoding the encoded data based on the mismatch information.
データを符号化した符号化データであって、少なくとも、前記データの特性を表す特性データを含む符号化データを復号する復号処理を、コンピュータに行わせるプログラムにおいて、
前記特性データの正しさを判定し、その判定結果を表すミスマッチ情報を出力する判定ステップと、
前記ミスマッチ情報に基づいて、前記符号化データを復号する復号ステップと を備えることを特徴とするプログラム。
In a program that causes a computer to perform a decoding process that decodes encoded data that is encoded data and includes at least characteristic data that represents the characteristic of the data,
A determination step of determining the correctness of the characteristic data and outputting mismatch information representing the determination result;
And a decoding step of decoding the encoded data based on the mismatch information.
データを符号化した符号化データであって、少なくとも、前記データの特性を表す特性データを含む符号化データを復号する復号処理を、コンピュータに行わせるプログラムが記録されている記録媒体において、
前記特性データの正しさを判定し、その判定結果を表すミスマッチ情報を出力する判定ステップと、
前記ミスマッチ情報に基づいて、前記符号化データを復号する復号ステップと を備えるプログラムが記録されている
ことを特徴とする記録媒体。
In a recording medium recorded with a program for causing a computer to perform decoding processing for decoding encoded data including encoded data that is at least characteristic data representing the characteristics of the data.
A determination step of determining the correctness of the characteristic data and outputting mismatch information representing the determination result;
A recording medium is recorded, comprising: a decoding step of decoding the encoded data based on the mismatch information.
データを符号化した符号化データであって、少なくとも、前記データの特性を表す特性データを含む符号化データを復号するのに用いられるタップ係数を学習する学習装置において、
学習用のデータから、前記タップ係数の学習の教師となる教師データを生成して出力する教師データ生成手段と、
前記学習用のデータから、前記タップ係数の学習の生徒となる生徒データを生成して出力する生徒データ生成手段と、
前記学習用のデータを符号化し、そのデータについての前記特性データを含む学習用の符号化データを出力する符号化手段と、
前記学習用の符号化データに含まれる前記特性データの正しさを判定し、その判定結果を表すミスマッチ情報を出力する判定手段と、
前記ミスマッチ情報に基づき、前記教師データと生徒データを用いて、前記タップ係数を学習する学習手段と
を備えることを特徴とする学習装置。
In a learning device that learns tap coefficients used to decode encoded data that is encoded data and includes at least characteristic data that represents the characteristic of the data,
Teacher data generation means for generating and outputting teacher data serving as a teacher for learning the tap coefficient from learning data;
Student data generation means for generating and outputting student data to be students of learning of the tap coefficient from the learning data;
Encoding means for encoding the learning data and outputting encoded learning data including the characteristic data for the data;
Determination means for determining the correctness of the characteristic data included in the encoded data for learning and outputting mismatch information representing the determination result;
A learning apparatus comprising: learning means for learning the tap coefficient using the teacher data and student data based on the mismatch information.
データを符号化した符号化データであって、少なくとも、前記データの特性を表す特性データを含む符号化データを復号するのに用いられるタップ係数を学習する学習方法において、
学習用のデータから、前記タップ係数の学習の教師となる教師データを生成して出力する教師データ生成ステップと、
前記学習用のデータから、前記タップ係数の学習の生徒となる生徒データを生成して出力する生徒データ生成ステップと、
前記学習用のデータを符号化し、そのデータについての前記特性データを含む学習用の符号化データを出力する符号化ステップと、
前記学習用の符号化データに含まれる前記特性データの正しさを判定し、その判定結果を表すミスマッチ情報を出力する判定ステップと、
前記ミスマッチ情報に基づき、前記教師データと生徒データを用いて、前記タップ係数を学習する学習ステップと
を備えることを特徴とする学習方法。
In a learning method for learning tap coefficients used for decoding encoded data including encoded data including at least characteristic data representing the characteristics of the data, which is encoded data obtained by encoding data,
A teacher data generation step for generating and outputting teacher data to be a teacher for learning the tap coefficient from the learning data;
A student data generation step of generating and outputting student data to be students of learning of the tap coefficient from the learning data;
An encoding step of encoding the learning data and outputting encoded learning data including the characteristic data for the data;
A determination step of determining the correctness of the characteristic data included in the learning encoded data and outputting mismatch information indicating the determination result;
A learning method comprising: a learning step of learning the tap coefficient using the teacher data and student data based on the mismatch information.
データを符号化した符号化データであって、少なくとも、前記データの特性を表す特性データを含む符号化データを復号するのに用いられるタップ係数を学習する学習処理を、コンピュータに行わせるプログラムにおいて、
学習用のデータから、前記タップ係数の学習の教師となる教師データを生成して出力する教師データ生成ステップと、
前記学習用のデータから、前記タップ係数の学習の生徒となる生徒データを生成して出力する生徒データ生成ステップと、
前記学習用のデータを符号化し、そのデータについての前記特性データを含む学習用の符号化データを出力する符号化ステップと、
前記学習用の符号化データに含まれる前記特性データの正しさを判定し、その判定結果を表すミスマッチ情報を出力する判定ステップと、
前記ミスマッチ情報に基づき、前記教師データと生徒データを用いて、前記タップ係数を学習する学習ステップと
を備えることを特徴とするプログラム。
In a program for causing a computer to perform learning processing for learning tap coefficients used to decode encoded data including encoded data including at least characteristic data representing encoded data, wherein the encoded data is data encoded.
A teacher data generation step for generating and outputting teacher data to be a teacher for learning the tap coefficient from the learning data;
A student data generation step of generating and outputting student data to be students of learning of the tap coefficient from the learning data;
An encoding step of encoding the learning data and outputting encoded learning data including the characteristic data for the data;
A determination step of determining the correctness of the characteristic data included in the learning encoded data and outputting mismatch information indicating the determination result;
And a learning step for learning the tap coefficient using the teacher data and student data based on the mismatch information.
データを符号化した符号化データであって、少なくとも、前記データの特性を表す特性データを含む符号化データを復号するのに用いられるタップ係数を学習する学習処理を、コンピュータに行わせるプログラムが記録されている記録媒体において、
学習用のデータから、前記タップ係数の学習の教師となる教師データを生成して出力する教師データ生成ステップと、
前記学習用のデータから、前記タップ係数の学習の生徒となる生徒データを生成して出力する生徒データ生成ステップと、
前記学習用のデータを符号化し、そのデータについての前記特性データを含む学習用の符号化データを出力する符号化ステップと、
前記学習用の符号化データに含まれる前記特性データの正しさを判定し、その判定結果を表すミスマッチ情報を出力する判定ステップと、
前記ミスマッチ情報に基づき、前記教師データと生徒データを用いて、前記タップ係数を学習する学習ステップと
を備えるプログラムが記録されている
ことを特徴とする記録媒体。
A program that causes a computer to perform a learning process of learning tap coefficients used to decode at least encoded data including encoded data that is encoded data and includes characteristic data representing the characteristics of the data is recorded. In the recorded recording medium,
A teacher data generation step for generating and outputting teacher data to be a teacher for learning the tap coefficient from the learning data;
A student data generation step of generating and outputting student data to be students of learning of the tap coefficient from the learning data;
An encoding step of encoding the learning data and outputting encoded learning data including the characteristic data for the data;
A determination step of determining the correctness of the characteristic data included in the learning encoded data and outputting mismatch information indicating the determination result;
A recording medium, comprising: a learning step for learning the tap coefficient using the teacher data and student data based on the mismatch information.
JP2002061400A 2002-03-07 2002-03-07 Decoding device, decoding method, program, and recording medium Expired - Fee Related JP4000589B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002061400A JP4000589B2 (en) 2002-03-07 2002-03-07 Decoding device, decoding method, program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002061400A JP4000589B2 (en) 2002-03-07 2002-03-07 Decoding device, decoding method, program, and recording medium

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007147720A Division JP4748113B2 (en) 2007-06-04 2007-06-04 Learning device, learning method, program, and recording medium

Publications (3)

Publication Number Publication Date
JP2003264466A JP2003264466A (en) 2003-09-19
JP2003264466A5 true JP2003264466A5 (en) 2005-08-25
JP4000589B2 JP4000589B2 (en) 2007-10-31

Family

ID=29195729

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002061400A Expired - Fee Related JP4000589B2 (en) 2002-03-07 2002-03-07 Decoding device, decoding method, program, and recording medium

Country Status (1)

Country Link
JP (1) JP4000589B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8503530B2 (en) * 2004-05-27 2013-08-06 Zhourong Miao Temporal classified filtering for video compression
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
WO2021172053A1 (en) * 2020-02-25 2021-09-02 ソニーグループ株式会社 Signal processing device and method, and program

Similar Documents

Publication Publication Date Title
CN100380975C (en) Method for generating hashes from a compressed multimedia content
Liu et al. Detection of double MP3 compression
TWI301953B (en) Methods and apparatuses for video encoding
JP2006217340A5 (en)
RU2008151990A (en) ENCODING DEVICE, METHOD OF ENCODING, RECORDING MEDIA AND PROGRAM FOR IT AND DECODING DEVICE, METHOD OF DECODING, RECORDING MEDIA AND PROGRAM FOR IT
Huang et al. Detection of double compression with the same bit rate in MPEG-2 videos
US7747435B2 (en) Information retrieving method and apparatus
Lei et al. Text+ sketch: Image compression at ultra low rates
KR101861781B1 (en) Encoder, decoder, coding method, decoding method, coding program, decoding program, and recording medium
JP2012523579A (en) Method and apparatus for forming mixed signals, method and apparatus for separating signals, and corresponding signals
KR100847179B1 (en) Data processing apparatus
JP2003264466A5 (en)
Chen et al. A new image codec paradigm for human and machine uses
US20090048849A1 (en) Audio encoding method and apparatus, and audio decoding method and apparatus, for processing death sinusoid and general continuation sinusoid
US20220377342A1 (en) Video encoding and video decoding
JP4888048B2 (en) Audio signal encoding / decoding method, apparatus and program for implementing the method
JP4748113B2 (en) Learning device, learning method, program, and recording medium
JP2003264837A5 (en)
JP4000589B2 (en) Decoding device, decoding method, program, and recording medium
JP5351094B2 (en) Image coding method, image coding apparatus, and image coding program
CN115880737B (en) Subtitle generation method, system, equipment and medium based on noise reduction self-learning
JP4438655B2 (en) Encoding device, decoding device, encoding method, and decoding method
JP2008124955A5 (en)
JP5351093B2 (en) Image coding method, image coding apparatus, and image coding program
US20090063161A1 (en) Method and apparatus for encoding and decoding continuation sinusoidal signal of audio signal