KR100847179B1 - 데이터 처리 장치, 방법 및 기록 매체 - Google Patents

데이터 처리 장치, 방법 및 기록 매체 Download PDF

Info

Publication number
KR100847179B1
KR100847179B1 KR20027012587A KR20027012587A KR100847179B1 KR 100847179 B1 KR100847179 B1 KR 100847179B1 KR 20027012587 A KR20027012587 A KR 20027012587A KR 20027012587 A KR20027012587 A KR 20027012587A KR 100847179 B1 KR100847179 B1 KR 100847179B1
Authority
KR
South Korea
Prior art keywords
data
tap
prediction
decoding
class
Prior art date
Application number
KR20027012587A
Other languages
English (en)
Other versions
KR20030062230A (ko
Inventor
데쯔지로 곤도
쯔또무 와따나베
Original Assignee
소니 가부시끼 가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 가부시끼 가이샤 filed Critical 소니 가부시끼 가이샤
Publication of KR20030062230A publication Critical patent/KR20030062230A/ko
Application granted granted Critical
Publication of KR100847179B1 publication Critical patent/KR100847179B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]

Abstract

본 발명은 화상이나 음성 등의 복호 데이터의 품질을 더욱 향상시키는 데이터 처리 장치에 관한 것이다. 복호부(21)는 예를 들면 화상을 JPEG 부호화한 부호화 데이터를 복호하고, 부호화부(22)는 그 결과 얻어지는 제1 복호 데이터를 부호화하여, 재부호화 데이터를 출력한다. 또한, 복호부(23)는 재부호화 데이터를 복호하여, 제2 복호 데이터를 얻는다. 클래스 분류 적응 처리 회로(24)는 학습을 행함으로써 구해진 탭 계수와의 소정의 예측 연산을 행하는 예측 탭을, 제1 복호 데이터와 제2 복호 데이터로부터 생성하고, 예측 탭과 탭 계수를 이용하여 소정의 예측 연산을 행함으로써, 학습에 있어서 교사로서 이용된 교사 데이터에 대응하는 예측값을 구한다. 본 발명은 화상이나 음성을 부호화하여 전송하는 전송 시스템에 적용할 수 있다.
Figure R1020027012587
데이터 처리 장치, 복호, 부호화, 전송 시스템, 탭 계수, 클래스 분류 적응 처리

Description

데이터 처리 장치{DATA PROCESSING APPARATUS}
본 발명은 데이터 처리 장치에 관한 것으로, 특히 예를 들면 화질이 좋은 화상이나, 음질이 좋은 음성 등을 복호할 수 있도록 하는 데이터 처리 장치에 관한 것이다.
본건 출원인은 화상의 화질이나 음성의 음질을 향상시키는 방법으로서, 클래스 분류 적응 처리를 앞서 제안한 바 있다.
클래스 분류 적응 처리는 클래스 분류 처리와 적응 처리로 이루어지며, 클래스 분류 처리에 의하여, 데이터를 그 성질에 의거하여 클래스 구분하고, 각 클래스마다 적응 처리를 실시하는 것으로, 적응 처리는 이하와 같은 방법으로 이루어진다.
즉 예를 들면 화상을 대상으로 하면, 적응 처리에서는 예를 들면 저화질의 화상의 화소값과 소정의 탭 계수의 선형 결합에 의해, 고화질의 화상의 화소값의 예측값을 구함으로써, 저화질의 화상이 고화질의 화상으로 변환된다.
구체적으로는, 예를 들면 어떤 고화질의 화상을 교사(敎師) 데이터로 함과 아울러, 그 고화질의 화상을, 예를 들면 JPEG(Joint Photographic Experts Group) 방식이나 MPEG(Moving Picture Experts Group) 방식 등에 의해 부호화하고, 다시 그 부호화 데이터를 복호하여 얻어지는, 화질이 저하된 복호 화상을 생도(生徒) 데이터로 하여, 교사 데이터인 고화질의 화소값 y의 예측값 E[y]를, 생도 데이터인 저화질의 화소값중의 몇 개 x1, x2, ···의 집합과, 소정의 탭 계수 w1, w2, ···의 선형 결합에 의해 규정되는 선형 1차 결합 모델에 의해 구하는 것을 생각할 수 있다. 이 경우, 예측값 E[y]는 다음 식으로 표시할 수 있다.
E[y]=w1x1+w2x2+··· ···(1)
식(1)을 일반화하기 위하여, 탭 계수 wj의 집합으로 이루어진 행렬 W, 생도 데이터 xij의 집합으로 이루어진 행렬 X, 및 예측값 E[yj]의 집합으로 이루어진 행렬 Y’를,
Figure 112002031028257-pct00001
로 정의하면, 다음과 같은 관측 방정식이 성립한다.
XW=Y’ ···(2)
여기에서, 행렬 X의 성분 xij는 i건째의 생도 데이터의 집합(i건째의 교사 데이터 yi의 예측에 사용하는 생도 데이터의 집합) 중의 j번째의 생도 데이터를 의미 하고, 행렬 W의 성분 wj는 생도 데이터의 집합 중의 j번째의 생도 데이터와의 곱이 연산되는 탭 계수를 표시한다. 또한, yi는 i건째의 교사 데이터를 표시하고, 따라서 E[yi]는 i건째의 교사 데이터의 예측값을 표시한다. 식(1)의 좌변에서의 y는 행렬 Y의 성분 yi의 첨자 i를 생략한 것이고, 또한 식(1)의 우변에서의 x1, x2 , ···도 행렬 X의 성분 xij의 첨자 i를 생략한 것이다.
식(2)의 관측 방정식에 최소 자승법을 적용하여, 화질이 좋은 화소값 y에 가까운 예측값 E[y]를 구하는 것을 생각해보자. 이 경우, 교사 데이터가 되는 화소값 y의 집합으로 이루어진 행렬 Y, 및 화소값 y에 대한 예측값 E[y]의 잔차(殘差) e의 집합으로 이루어지는 행렬 E를,
Figure 112002031028257-pct00002
로 정의하면, 식(2)로부터 다음과 같은 잔차 방정식이 성립한다.
XW=Y+E ···(3)
이 경우, 원래의 화소값 y에 가까운 예측값 E[y]를 구하기 위한 탭 계수 wj는 제곱오차
Figure 112002031028257-pct00003
을 최소로 함으로써 구할 수 있다.
따라서, 상술한 제곱오차를 탭 계수 wj로 미분한 것이 0이 될 경우, 즉 다음 식을 만족하는 탭 계수 wj가 화소값 y에 가까운 예측값 E[y]를 구하기 위한 최적값이라고 할 수 있게 된다.
Figure 112002031028257-pct00004
따라서, 먼저 식(3)을 탭 계수 wj로 미분함으로써, 다음 식이 성립한다.
Figure 112002031028257-pct00005
식(4) 및 식(5)로부터, 식(6)이 얻어진다.
Figure 112002031028257-pct00006
또한, 식(3)의 잔차 방정식에 있어서의 생도 데이터 xij, 탭 계수 wj, 교사 데이터 yi, 및 잔차 ei의 관계를 고려하면, 식(6)으로부터 다음과 같은 정규 방정식을 얻을 수 있다.
Figure 112002031028257-pct00007
한편, 식(7)에 나타낸 정규 방정식은 행렬(공분산 행렬) A 및 벡터 v를,
Figure 112002031028257-pct00008
으로 정의함과 아울러, 벡터 W를 수학식 1로 나타낸 바와 같이 정의하면, 식
AW=v ···(8)
로 표시할 수 있다.
식(7)에 있어서의 각 정규 방정식은 생도 데이터 xij 및 교사 데이터 yi의 세트를, 어느 정도의 수만큼 준비함으로써, 구해야 할 탭 계수 xj의 수 J와 동일한 수만큼 세울 수 있으며, 따라서 식(8)을, 벡터 W에 대하여 풀이하여(단, 식(8)을 풀기 위해서는 식(8)에 있어서의 행렬 A가 정칙일 필요가 있다), 통계적인 예측 오차를 최소로 하는 탭 계수(여기에서는, 제곱오차를 최소로 하는 탭 계수) wj를 구할 수 있다. 식(8)을 풀 때에는, 예를 들면 가우스 졸단(Gauss-Jordan) 소거법 등을 이용하는 것이 가능하다.
이상과 같이 하여, 통계적인 예측 오차를 최소로 하는 탭 계수 wj를 구하고 있으며, 또한 그 탭 계수 wj를 사용하여, 식(1)에 의해, 고화질의 화소값 y에 가까운 예측값 E[y]를 구하는 것이 적응 처리이다.
한편, 예를 들면, 교사 데이터로서, 부호화하는 화상과 동일 화질의 화상을 사용함과 아울러, 생도 데이터로서, 그 교사 데이터를 부호화하고 다시 복호하여 얻어지는 복호 화상을 사용한 경우, 탭 계수로서는, 부호화된 화상 데이터를, 원래의 화상 데이터로 복호하는데, 예측 오차가 통계적으로 최소가 되는 것이 얻어지게 된다.
또한, 예를 들면 교사 데이터로서, 부호화하는 화상보다도 고해상도의 화상을 사용함과 아울러, 생도 데이터로서, 그 교사 데이터의 해상도를, 부호화하는 화상과 동일 화질로 열화시키고, 그것을 부호화하여 복호함으로써 얻어지는 복호 화상을 사용한 경우, 탭 계수로서는, 부호화된 화상 데이터를, 고해상도의 화상 데이터로 복호하는데, 예측 오차가 통계적으로 최소가 되는 것이 얻어지게 된다.
따라서, 이 경우, 적응 처리에 따르면, 교사 데이터 또는 생도 데이터가 되는 화상의 선택 방법에 따라서, 복호 화상의 화질을 임의로 조정하는 것이 가능한 탭 계수를 얻을 수 있다.
한편, 적응 처리는 학습에 의해 예측 오차가 통계적으로 최소가 되는 탭 계수가 사용되는 점, 및 그러한 탭 계수를 이용함으로써, 부호화된 화상에는 포함되어 있지 않은 고주파수 성분이 재현될 수 있는 점 등에서, 필터에 의한 단순한 필터링과는 크게 다르다.
이상으로부터, 부호화 데이터를 복호한 복호 화상을 대상으로, 클래스 분류 적응 처리를 실행한 경우에는, 화질을 향상시킨 복호 화상을 얻을 수 있다.
그러나, 부호화 데이터를 복호한 복호 화상의 화질이, 예를 들면 부호화 데이터를 전송하는 전송로의 상태나, 화상 데이터의 부호화시에 있어서의 압축율 등에 기인하여 크게 열화되어 있는 경우에는, 복호 화상만을 사용하여 클래스 분류 적응 처리를 실행하더라도, 그 화질을 충분히 개선하는 것이 곤란한 경우가 있었다.
본 발명은 이와 같은 상황을 감안하여 이루어진 것으로, 품질이 충분히 개선된 데이터를 얻을 수 있도록 하는 것이다.
본 발명의 제1 데이터 처리 장치는 부호화 데이터를 복호하고 복호 데이터를 출력하는 복호 수단과, 복호 데이터를 부호화하고 재부호화 데이터를 출력하는 재부호화 수단과, 학습을 행함으로써 구해진 탭 계수와의 소정의 예측 연산을 행하는 예측 탭을, 복호 데이터 및 재부호화 데이터로부터 얻어지는 정보로부터 생성하는 예측 탭 생성 수단과, 예측 탭과 탭 계수를 이용하여 소정의 예측 연산을 행함으로써, 학습에 있어서 교사로서 이용된 교사 데이터에 대응하는 예측값을 구하는 예측 수단을 구비하는 것을 특징으로 한다.
본 발명의 제1 데이터 처리 방법은 부호화 데이터를 복호하고 복호 데이터를 출력하는 복호 단계와, 복호 데이터를 부호화하고 재부호화 데이터를 출력하는 재부호화 단계와, 학습을 행함으로써 구해진 탭 계수와의 소정의 예측 연산을 행하는 예측 탭을, 복호 데이터 및 재부호화 데이터로부터 얻어지는 정보로부터 생성하는 예측 탭 생성 단계와, 예측 탭과 탭 계수를 이용하여, 소정의 예측 연산을 행함으로써, 학습에 있어서 교사로서 이용된 교사 데이터에 대응하는 예측값을 구하는 예측 단계를 구비하는 것을 특징으로 한다.
본 발명의 제1 프로그램은 부호화 데이터를 복호하고 복호 데이터를 출력하는 복호 단계와, 복호 데이터를 부호화하고 재부호화 데이터를 출력하는 재부호화 단계와, 학습을 행함으로써 구해진 탭 계수와의 소정의 예측 연산을 행하는 예측 탭을, 복호 데이터 및 재부호화 데이터로부터 얻어지는 정보로부터 생성하는 예측 탭 생성 단계와, 예측 탭과 탭 계수를 이용하여, 소정의 예측 연산을 행함으로써, 학습에 있어서 교사로서 이용된 교사 데이터에 대응하는 예측값을 구하는 예측 단계를 구비하는 것을 특징으로 한다.
본 발명의 제1 기록 매체는 부호화 데이터를 복호하고 복호 데이터를 출력하는 복호 단계와, 복호 데이터를 부호화하고 재부호화 데이터를 출력하는 재부호화 단계와, 학습을 행함으로써 구해진 탭 계수와의 소정의 예측 연산을 행하는 예측 탭을, 복호 데이터 및 재부호화 데이터로부터 얻어지는 정보로부터 생성하는 예측 탭 생성 단계와, 예측 탭과 탭 계수를 이용하여, 소정의 예측 연산을 행함으로써, 학습에 있어서 교사로서 이용된 교사 데이터에 대응하는 예측값을 구하는 예측 단계를 구비하는 프로그램이 기록되어 있는 것을 특징으로 한다.
본 발명의 제2 데이터 처리 장치는 교사가 되는 교사 데이터로부터, 그 교사 데이터를 부호화하여 복호한 복호 데이터와, 그 복호 데이터를 부호화한 재부호화 데이터로부터 얻어지는 정보를, 생도가 되는 생도 데이터로서 생성하는 생도 데이터 생성 수단과, 교사 데이터를 예측하는데 이용하는 예측 탭을, 생도 데이터로부터 생성하는 예측 탭 생성 수단과, 예측 탭과 탭 계수를 이용하여, 소정의 예측 연산을 행함으로써 얻어지는 교사 데이터의 예측값의 예측 오차가, 통계적으로 최소가 되도록 학습을 행하고, 탭 계수를 구하는 학습 수단을 구비하는 것을 특징으로 한다.
본 발명의 제2 데이터 처리 방법은 교사가 되는 교사 데이터로부터, 그 교사 데이터를 부호화하여 복호한 복호 데이터, 및 그 복호 데이터를 부호화한 재부호화 데이터로부터 얻어지는 정보를, 생도가 되는 생도 데이터로서 생성하는 생도 데이터 생성 단계와, 교사 데이터를 예측하는데 이용하는 예측 탭을, 생도 데이터로부터 생성하는 예측 탭 생성 단계와, 예측 탭과 탭 계수를 이용하여, 소정의 예측 연산을 행함으로써 얻어지는 교사 데이터의 예측값의 예측 오차가, 통계적으로 최소가 되도록 학습을 행하고, 탭 계수를 구하는 학습 단계를 구비하는 것을 특징으로 한다.
본 발명의 제2 프로그램은 교사가 되는 교사 데이터로부터, 그 교사 데이터를 부호화하여 복호한 복호 데이터, 및 그 복호 데이터를 부호화한 재부호화 데이터로부터 얻어지는 정보를, 생도가 되는 생도 데이터로서 생성하는 생도 데이터 생성 단계와, 교사 데이터를 예측하는데 이용하는 예측 탭을, 생도 데이터로부터 생성하는 예측 탭 생성 단계와, 예측 탭과 탭 계수를 이용하여, 소정의 예측 연산을 행함으로써 얻어지는 교사 데이터의 예측값의 예측 오차가, 통계적으로 최소가 되도록 학습을 행하고, 탭 계수를 구하는 학습 단계를 구비하는 것을 특징으로 한다.
본 발명의 제2 기록 매체는 교사가 되는 교사 데이터로부터, 그 교사 데이터를 부호화하여 복호한 복호 데이터, 및 그 복호 데이터를 부호화한 재부호화 데이터로부터 얻어지는 정보를, 생도가 되는 생도 데이터로서 생성하는 생도 데이터 생성 단계와, 교사 데이터를 예측하는데 이용하는 예측 탭을, 생도 데이터로부터 생성하는 예측 탭 생성 단계와, 예측 탭과 탭 계수를 이용하여, 소정의 예측 연산을 행함으로써 얻어지는 교사 데이터의 예측값의 예측 오차가, 통계적으로 최소가 되도록 학습을 행하고, 탭 계수를 구하는 학습 단계를 구비하는 프로그램이 기록되어 있는 것을 특징으로 한다.
본 발명의 제3 데이터 처리 장치는 데이터를 부호화한 부호화 데이터를 복호하고 복호 데이터를 출력하는 복호 수단과, 복호 데이터를 부호화하고 재부호화 데이터를 출력하는 재부호화 수단과, 클래스 분류에 이용하는 클래스 탭을, 복호 데이터 및 재부호화 데이터로부터 얻어지는 정보로부터 생성하는 클래스 탭 생성 수단과, 클래스 탭에 의거하여 클래스 분류를 행하는 클래스 분류 수단을 구비하는 것을 특징으로 한다.
본 발명의 제3 데이터 처리 방법은 데이터를 부호화한 부호화 데이터를 복호하고 복호 데이터를 출력하는 복호 단계와, 복호 데이터를 부호화하고 재부호화 데이터를 출력하는 재부호화 단계와, 클래스 분류에 이용하는 클래스 탭을, 복호 데이터 및 재부호화 데이터로부터 얻어지는 정보로부터 생성하는 클래스 탭 생성 단계와, 클래스 탭에 의거하여 클래스 분류를 행하는 클래스 분류 단계를 구비하는 것을 특징으로 한다.
본 발명의 제3 프로그램은 데이터를 부호화한 부호화 데이터를 복호하고 복호 데이터를 출력하는 복호 단계와, 복호 데이터를 부호화하고 재부호화 데이터를 출력하는 재부호화 단계와, 클래스 분류에 이용하는 클래스 탭을, 복호 데이터, 및 재부호화 데이터로부터 얻어지는 정보로부터 생성하는 클래스 탭 생성 단계와, 클래스 탭에 의거하여 클래스 분류를 행하는 클래스 분류 단계를 구비하는 것을 특징으로 한다.
본 발명의 제3 기록 매체는 데이터를 부호화한 부호화 데이터를 복호하고 복 호 데이터를 출력하는 복호 단계와, 복호 데이터를 부호화하고 재부호화 데이터를 출력하는 재부호화 단계와, 클래스 분류에 이용하는 클래스 탭을, 복호 데이터, 및 재부호화 데이터로부터 얻어지는 정보로부터 생성하는 클래스 탭 생성 단계와, 상기 클래스 탭에 의거하여 클래스 분류를 행하는 클래스 분류 단계를 구비하는 프로그램이 기록되어 있는 것을 특징으로 한다.
본 발명의 제1 데이터 처리 장치 및 데이터 처리 방법, 그리고 프로그램 및 기록 매체에서는, 부호화 데이터가 복호되고, 그 결과 얻어지는 복호 데이터가 부호화되어, 재부호화 데이터가 출력된다. 그리고, 학습을 행함으로써 구해진 탭 계수와의 소정의 예측 연산을 행하는 예측 탭이, 복호 데이터 및 재부호화 데이터로부터 얻어지는 정보로부터 생성되며, 예측 탭과 탭 계수를 이용하여 소정의 예측 연산을 행함으로써, 학습에 있어서 교사로서 이용된 교사 데이터에 대응하는 예측값이 구해진다,
본 발명의 제2 데이터 처리 장치 및 데이터 처리 방법, 그리고 프로그램 및 기록 매체에서는, 교사가 되는 교사 데이터로부터, 그 교사 데이터를 부호화하여 복호한 복호 데이터와, 그 복호 데이터를 부호화한 재부호화 데이터로부터 얻어지는 정보가, 생도가 되는 생도 데이터로서 생성된다. 그리고, 교사 데이터를 예측하는데 이용하는 예측 탭이, 생도 데이터로부터 생성되며, 예측 탭과 탭 계수를 이용하여, 소정의 예측 연산을 행함으로써 얻어지는 교사 데이터의 예측값의 예측 오차가 통계적으로 최소가 되도록 학습이 행해지고, 탭 계수가 구해진다.
본 발명의 제3 데이터 처리 장치 및 데이터 처리 방법, 그리고 프로그램 및 기록 매체에서는, 데이터를 부호화한 부호화 데이터가 복호되고, 그 결과 얻어지는 복호 데이터가 부호화되어, 재부호화 데이터가 출력된다. 그리고, 클래스 분류에 이용하는 클래스 탭이, 복호 데이터 및 재부호화 데이터로부터 얻어지는 정보로부터 생성되고, 그 클래스 탭에 의거하여 클래스 분류가 실행된다.
도 1은 본 발명을 적용한 데이터 전송 시스템의 한 실시 형태의 구성예를 나타낸 도면이다.
도 2는 디코더(2)의 구성예를 나타낸 블록도이다.
도 3은 클래스 분류 적응 처리 회로(24)의 구성예를 나타낸 블록도이다,
도 4A 내지 도 4D는 클래스 분류부(33 및 59)의 구성예를 나타낸 블록도이다.
도 5는 디코더(2)의 처리를 설명하는 플로우차트이다.
도 6은 본 발명을 적용한 학습 장치의 한 실시 형태의 구성예를 나타낸 블록도이다.
도 7은 학습 장치의 처리를 설명하는 플로우차트이다.
도 8은 인코더(1), 부호화부(22, 52 및 55)의 제1 구성예를 나타낸 블록도이다.
도 9는 복호부(21, 23, 54 및 56)의 제1 구성예를 나타낸 블록도이다.
도 10은 인코더(1), 부호화부(22, 52 및 55)의 제2 구성예를 나타낸 블록도이다.
도 11은 복호부(21, 23, 54 및 56)의 제2 구성예를 나타낸 블록도이다.
도 12는 인코더(1), 부호화부(22, 52 및 55)의 제3 구성예를 나타낸 블록도이다.
도 13은 복호부(21, 23, 54 및 56)의 제3 구성예를 나타낸 블록도이다.
도 14는 본 발명을 적용한 컴퓨터의 한 실시 형태의 구성예를 나타낸 블록도이다.
도 1은 본 발명을 적용한 데이터 전송 시스템의 한 실시 형태의 구성예를 나타내고 있다.
전송할 데이터는 인코더(1)에 공급되도록 되어 있으며, 인코더(1)는 그곳에 공급되는 데이터를, 예를 들면 소정의 부호화 방식에 따라서 부호화하여, 부호화 데이터로 한다. 이 부호화 데이터는 예를 들면 반도체 메모리, 광 자기 디스크, 자기 디스크, 광 디스크, 자기 테이프, 상 변화 디스크 등으로 이루어지는 기록 매체(3)에 기록되거나, 및/또는 예를 들면 지상파, 위성 회선, CATV(Cable Television)망, 인터넷, 공중 회선 등으로 이루어지는 전송 매체(4)를 통하여 전송된다.
디코더(2)는 기록 매체(3) 또는 전송 매체(4)를 통하여 제공되는 부호화 데이터를 수신하여 복호하고, 그 결과 얻어지는 복호 데이터를 출력한다. 복호 데이터가 예를 들면 화상 데이터인 경우에는, 그 화상 데이터는 예를 들면 도시하지 않은 디스플레이에 공급되어 표시된다. 또한, 부호화 데이터가 예를 들면 음성 데이 터인 경우에는, 그 음성 데이터는 예를 들면 도시하지 않은 스피커에 공급되어 출력된다.
다음에, 도 2는 도 1의 디코더(2)의 구성예를 나타내고 있다.
부호화 데이터는 복호부(21)에 공급되도록 되어 있으며, 복호부(21)는 예를 들면 인코더(1)에 있어서의 부호화 방식에 대응하는 복호 방식에 따라서, 부호화 데이터를 복호하고, 그 결과 얻어지는 복호 데이터를, 부호화부(22)와 클래스 분류 적응 처리 회로(24)에 공급한다. 또한, 복호부(21)는 부호화 데이터를 복호하는 과정에서 얻어지는 정보를, 부가 정보로서 클래스 분류 적응 처리 회로(24)에 공급한다.
부호화부(22)는 복호부(21)로부터 공급되는 복호 데이터를, 예를 들면 도 1의 인코더(1)에서와 동일한 부호화 방식에 따라서 부호화(재부호화)하여, 재부호화 데이터를 얻는다. 이 재부호화 데이터는 부호화부(22)로부터 복호부(23)에 공급된다.
복호부(23)는 예를 들면 복호부(21)와 동일하게 하여, 부호화부(22)로부터의 재부호화 데이터를 복호하고, 그 결과 얻어지는 복호 데이터를, 클래스 분류 적응 처리 회로(4)에 공급한다. 또한, 복호부(23)는 재부호화 데이터를 복호하는 과정에서 얻어지는 정보를, 부가 정보로서 클래스 분류 적응 처리 회로(24)에 공급한다.
여기에서, 이하에서는 최초의 복호를 행하는 복호부(21)가 출력하는 복호 데이터를 제1 복호 데이터라고 기술하고, 2번째의 복호를 행하는 복호부(23)가 출력 하는 복호 데이터를 제2 복호 데이터라고 기술하겠다. 마찬가지로, 이하에서는 최초의 복호를 행하는 복호부(21)가 출력하는 부가 정보를 제1 부가 정보라고 기술하고, 2번째의 복호를 행하는 복호부(23)가 출력하는 부가 정보를 제2 부가 정보라고 기술하겠다. 또한, 이하에서는 제1 복호 데이터와 제2 복호 데이터를 합쳐서, 간단히 복호 데이터라고도 기술하겠다. 마찬가지로, 이하에서는 제1 부가 정보와 제2 부가 정보를 합쳐서, 간단히 부가 정보라고도 기술하겠다.
클래스 분류 적응 처리 회로(24)는 복호부(21)로부터 공급되는 제1 복호 데이터와 제1 부가 정보, 또한 복호부(23)로부터 공급되는 제2 복호 데이터와 제2 부가 정보를 사용하여, 클래스 분류 적응 처리를 실행하고, 부호화 데이터의 최종적인 복호 결과로서의 복호 데이터(이하에서는, 간단히 최종적인 복호 데이터라고 함)를 출력한다.
따라서, 클래스 분류 적응 처리 회로(24)에서는, 부호화 데이터를 복호하여 얻어지는 제1 복호 데이터 외에도, 그 복호 과정에서 얻어지는 제1 부가 정보, 또한 제1 복호 데이터를 재부호화하고, 그 재부호화 데이터를 복호한 제2 복호 데이터 및 재부호화 데이터를 복호하는 과정에서 얻어지는 제2 부가 정보를 사용하여, 클래스 분류 적응 처리가 실행되므로, 제1 복호 데이터의 품질이 크게 열화되어 있는 경우이더라도, 최종적인 복호 데이터로서, 충분히 품질이 개선된 것을 얻는 것이 가능해진다.
한편, 복호부(23)의 후단에는, 부호화부(22)와 복호부(23)의 세트와 동일한 세트를, 1개 이상 형성할 수 있으며, 이에 따라, 클래스 분류 적응 처리 회로(24) 에는, 제2 복호 데이터를 부호화하고, 그 결과 얻어지는 부호화 데이터를 복호한 제3 복호 데이터나, 그 복호 과정에서 얻어지는 제3 부가 정보를 공급하여, 클래스 분류 적응 처리를 실행시키는 것이 가능하다.
다음에, 도 3은 도 2의 클래스 분류 적응 처리 회로(24)의 구성예를 나타내고 있다.
제1 복호 데이터, 제1 부가 정보, 제2 복호 데이터 및 제2 부가 정보는 탭 생성부(31, 32)에 공급된다.
탭 생성부(31)는 제1 복호 데이터, 제1 부가 정보, 제2 복호 데이터 및 제2 부가 정보로부터, 후술하는 예측부(35)에 있어서의 예측 연산에 사용되는 예측 탭이 되는 것을 생성한다. 즉 탭 생성부(31)는 예를 들면 품질을 개선하고자 하여 주목하고 있는 주목 데이터에 대하여, 시간적 또는 공간적으로 가까운 위치에 있는 제1 복호 데이터와 제2 복호 데이터를 추출함과 아울러, 그 제1 복호 데이터와 제2 복호 데이터의 복호에 각각 사용된 제1 부가 정보와 제2 부가 정보를 추출하고, 그 추출한 데이터(정보)를, 예측 탭으로서 예측부(35)에 공급한다.
탭 생성부(32)는 제1 복호 데이터, 제1 부가 정보, 제2 복호 데이터, 및 제2 부가 정보로부터, 후술하는 클래스 분류부(33)에 있어서의 클래스 분류에 사용되는 클래스 탭이 되는 것을 생성한다. 즉 탭 생성부(32)는 예를 들면 주목 데이터에 대하여, 탭 생성부(31)에서 생성되는 예측 탭과 동일한 구성의 클래스 탭을 생성하고, 클래스 분류부(35)에 공급한다.
여기에서는, 설명을 간단히 하기 위하여, 동일한 클래스 탭 및 예측 탭을 구 성하도록 하였으나, 클래스 탭과 예측 탭은 다른 구성으로 하는 것이 가능한데, 즉 제1 복호 데이터, 제1 부가 정보, 제2 복호 데이터 및 제2 부가 정보로부터, 다른 데이터를 추출하여 생성하는 것이 가능하다.
클래스 분류부(33)는 탭 생성부(32)로부터의 클래스 탭에 의거하여, 주목 데이터에 대하여 클래스 분류를 실행하고, 그 결과 얻어지는 클래스에 대응하는 클래스 코드를, 계수 메모리(34)로 출력한다.
계수 메모리(34)는 후술하는 도 6의 학습 장치에 있어서 학습 처리가 실행됨으로써 얻어지는, 각 클래스의 탭 계수를 기억하고 있으며, 클래스 분류부(33)가 출력하는 클래스 코드에 대응하는 어드레스에 기억되어 있는 탭 계수를, 예측부(35)로 출력한다.
예측부(35)는 탭 생성부(31)가 출력하는 예측 탭과, 계수 메모리(34)가 출력하는 탭 계수를 취득하고, 그 예측 탭과 탭 계수를 이용하여, 식(1)에 나타낸 선형 예측 연산(곱의 합 연산)을 실행하고, 주목 데이터에 대하여 품질을 개선한 데이터, 즉 주목 데이터를 고품질로 한 것의 예측값을 구하여 출력한다.
다음에, 도 4는 도 3의 클래스 분류부(33)의 구성예를 나타내고 있다.
클래스 분류부(33)는 예를 들면 도 4A에 나타낸 바와 같이, ADRC(Adaptive Dynamic Range Coding) 회로(41A, 41B), 및 합성 회로(41C)로 구성할 수 있다.
이 경우, ADRC 회로(41A, 41B)는 클래스 탭을 구성하는 복호 데이터와 부가 정보를 각각 K비트 ADRC 처리하고, 그 결과 얻어지는 ADRC 코드를, 합성 회로(41C)로 출력한다.
여기에서, K비트 ADRC 처리에서는, 예를 들면 클래스 탭을 구성하는 정보의 최대값 MAX와 최소값 MIN이 검출되며, DR〓MAX-MIN을, 집합의 국소적인 다이나믹 레인지로 하고, 이 다이나믹 레인지 DR에 의거하여, 클래스 탭을 구성하는 정보가 K비트로 재양자화(再量子化)된다. 즉 클래스 탭을 구성하는 각 정보로부터, 최소값 MIN이 감산되고, 그 감산값이 DR/2K로 제산(양자화)된다. 그리고, 이상과 같이 하여 얻어지는, 클래스 탭을 구성하는 각 정보의 K비트의 값을, 소정의 순서로 나란히 한 비트열이 ADRC 코드로서 출력된다.
합성 회로(41C)는 ADC 회로(41A)가 출력하는 복호 데이터의 ADRC 코드와, ADRC 회로(41B)가 출력하는 부가 정보의 ADRC 코드를, 1개의 코드에 합성하고, 클래스 코드로서 출력한다.
여기에서, 후술하는 바와 같이, 클래스 탭을 구성하는 부가 정보는 1종류에 한정되지 않지만, 부가 정보가 복수 종류 존재하는 경우에는, ADRC 회로(41B)에서는, 그 복수 종류의 부가 정보 각각에 대하여, ADRC 처리가 실행되고, 복수의 ADRC 코드가 출력된다. 그리고 합성 회로(41C)에서는, 그 복수의 ADRC 코드로부터 1개의 코드가 생성된다. 후술하는 도 4B 내지 도 4D 각각에 나타낸 클래스 분류부(33)에 있어서도 마찬가지이다.
다음에, 클래스 분류부(33)는 예를 들면 도 4B에 나타낸 바와 같이, 연산기(42A 및 41B)와, 도 4A에 나타낸 ADRC 회로(41A 및 41B), 및 합성 회로(41C)로 구성할 수도 있다.
즉 이 경우, 연산기(42A)는 클래스 탭을 구성하는 제1 복호 데이터와, 그 제1 복호 데이터에 대응하는 제2 복호 데이터의 차분(差分)을 연산하고, 그 차분값을 ADRC 회로(41A)에 공급한다. 연산기(42B)는 클래스 탭을 구성하는 제1 부가 정보와, 그 제1 부가 정보에 대응하는 제2 부가 정보의 차분을 연산하고, 그 차분값을 ADRC 회로(41B)로 출력한다.
따라서, 제1 복호 데이터에 대응하는 제2 복호 데이터라고 하는 것은 예를 들면 복호 데이터가 화상인 경우에는, 제1 복호 데이터로서 얻어진 복호 화소와 동일한, 제2 복호 데이터로서 얻어진 복호 화소를 의미한다. 즉 어떤 프레임 f에 있어서의 위치(x, y)에 있어서의 제1 복호 데이터와 제2 복호 데이터로서의 복호 화소를, 각각 p1(f, x, y)와 p2(f, x, y)로 표시하기로 하면, 제1 복호 데이터 p1(f, x, y)에 대응하는 제2 복호 데이터라고 하는 것은 p2(f, x, y)를 의미한다.
또한, 제1 부가 정보에 대응하는 제2 부가 정보라고 하는 것은 예를 들면 복호 데이터가 후술하는 CELP(Code Excited Liner Prediction coding) 방식으로 복호된 음성 데이터이며, 또한, 부가 정보가 그 복호 과정에서 얻어지는 선형 예측 계수인 경우에는, 제1 부가 정보로서 얻어진 선형 예측 계수와 동일 차수의, 제2 부가 정보로서 얻어진 선형 예측 계수를 의미한다. 즉 어떤 프레임(또는 서브 프레임) f에 있어서의 제1 복호 데이터와 제2 복호 데이터로서의 음성의 복호에 사용되는 제p차 선형 예측 계수를, 각각 α1(f, p)와 α2(f, p)로 표시하기로 하면, 제1 부가 정보 α1(f, p)에 대응하는 제2 부가 정보라고 하는 것은 α2(f, p)을 의미한다. 또한, 예를 들면 복호 데이터가 후술하는 JPEG 방식으로 복호된 화상 데이터 이고, 또한 부가 정보가 그 복호 과정에서 얻어지는 DCT 계수인 경우에는, 제1 부가 정보에 대응하는 제2 부가 정보라고 하는 것은 제1 부가 정보로서 얻어진 DCT 계수와 동일 공간 주파수 성분의, 제2 부가 정보로서 얻어진 DCT 계수를 의미한다. 즉 어떤 프레임 f의, 어떤 8×8의 블록 b에 있어서의 위치(x, y)의 제1 부가 정보와 제2 부가 정보로서의 DCT 계수를, 각각 d1(f, b, x, y)와 d2(f, b, x, y)로 표시하기로 하면, 제1 부가 정보 d1(f, b, x, y)에 대응하는 제2 부가 정보라고 하는 것은 d2(f, b, x, y)를 의미한다.
이하에서는, 제1 복호 데이터와 제2 복호 데이터의 차분값, 및 제1 부가 정보와 제2 부가 정보의 차분값에 대하여, 도 4A에 있어서의 경우와 동일한 처리가 실행되어, 클래스 코드가 구해진다.
또한, 클래스 분류 회로(33)는 예를 들면 도 4C에 나타낸 바와 같이 구성하는 것도 가능하다.
이 경우에도, 도 4B에 있어서의 경우와 마찬가지로, 연산기(42A)에 있어서, 제1 복호 데이터와 제2 복호 데이터의 차분값이 구해짐과 아울러, 연산기(42B)에 있어서, 제1 부가 정보와 제2 부가 정보의 차분값이 구해진다.
제1 복호 데이터와 제2 복호 데이터의 차분값은 연산기(42A)로부터 극성 판별 회로(43C)에 공급되고, 극성 판별 회로(43C)는 제1 복호 데이터와 제2 복호 데이터의 차분값의 극성(부호)을 판별하고, 그 극성에 따라서 0 또는 1을, 합성 회로(43E)로 출력한다.
또한, 제1 부가 정보와 제2 부가 정보의 차분값은 연산기(42B)로부터 극성 판별 회로(43D)에 공급되고, 극성 판별 회로(43D)는 제1 부가 정보와 제2 부가 정보의 차분값의 극성을 판별하고, 역시 그 극성에 따라서 0 또는 1을 합성 회로(43E)로 출력한다.
합성 회로(43E)는 극성 판별 회로(43C 및 44C) 각각으로부터의, 극성에 대응하는 0 또는 1의 계열을, 1개의 코드에 합성하고, 클래스 코드로서 출력한다.
또한, 클래스 분류부(33)는 도 4D에 나타낸 바와 같이, 지연 회로(44A 및 44B), 및 연산기(44C 및 44D)와, 도 4A에 나타낸 ADRC 회로(41A 및 41B), 및 합성 회로(41C)로 구성하는 것도 가능하다.
이 경우, 지연 회로(44A)는 클래스 탭을 구성하는 복호 데이터를, 예를 들면 1샘플분(1클래스 탭분)의 시간만큼 지연하여, 연산기(44C)에 공급한다. 연산기(44C)는 클래스 탭을 구성하는 복호 데이터와, 지연 회로(44A)로부터의, 그 복호 데이터를 지연한 것의 차분을 연산하고, 그 차분값을 ADRC 회로(41A)에 공급한다.
한편, 지연 회로(44B)는 클래스 탭을 구성하는 부가 정보를, 예를 들면 1샘플분의 시간만큼 지연하여, 연산기(44D)에 공급한다. 연산기(44D)는 클래스 탭을 구성하는 부가 정보와, 지연 회로(44)로부터의, 그 부가 정보를 지연한 것의 차분을 연산하고, 그 차분값을 ADRC 회로(41B)에 공급한다.
이하에서는, ADRC 회로(41A 및 41B) 및 합성 회로(41C)에서는, 상술한 차분값을 대상으로, 도 4A에 있어서의 경우와 동일한 처리가 실행되고, 클래스 코드가 출력된다.
한편, 클래스 분류부(33)는 그 밖에, 예를 들면 도 4A 내지 도 4D에 나타낸 회로 중의 임의의 2이상의 출력을 1개의 코드에 합성하여 출력하는 회로에 의하여 구성하는 것도 가능하다.
또한, 클래스 분류부(33)는 도 4에 나타낸 회로 이외의 회로에 의해 구성하는 것도 가능하다. 즉 예를 들면 부호화 데이터가 JPEG나 MPEG 부호화된 것과 같은, 그 복호 과정에서, 직교 변환 계수 중의 하나인 DCT(Discrete Cosine Transform) 계수가 얻어지는 것이며, 클래스 탭을 구성하는 부가 정보에, 그와 같은 DCT 계수가 포함되는 경우에는, 클래스 분류부(33)는 8×8 블록의 DCT 계수로부터 얻어지는 화상의 액티비티(activity)에 의거한 클래스 코드를 출력하거나, 주목하고 있는 화소의 블록내의 위치에 의거한 클래스 코드를 출력하도록 구성하는 것이 가능하다. 또한, 클래스 분류부(33)는 예를 들면 클래스 탭을 구성하는 복호 데이터나 부가 정보의 벡터 양자화 결과를, 클래스 코드로서 출력하도록 구성하는 것도 가능하다.
다음에, 도 5의 플로우차트를 참조하여, 도 2의 디코더(2)의 처리(복호 처리)에 관하여 설명한다.
복호부(21)는 인코더(1)에 있어서의 부호화 방식에 대응하는 복호 방식에 따라서, 부호화 데이터를 복호하고, 그 결과 얻어지는 제1 복호 데이터를, 부호화부(22)와 클래스 분류 적응 처리 회로(24)에 공급한다. 또한, 복호부(21)는 부호화 데이터를 복호하는 과정에서 얻어지는 정보를, 제1 부가 정보로서, 클래스 분류 적응 처리 회로(24)에 공급한다. 부호화부(22)는 복호부(21)로부터 공급되는 부호화 데이터를 재부호화하고, 그 결과 얻어지는 재부호화 데이터를, 복호부(23)에 공급한다. 복호부(23)는 복호부(21)와 마찬가지로 하여, 부호화부(22)로부터의 재부호화 데이터를 복호하고, 그 결과 얻어지는 제2 복호 데이터를 클래스 분류 적응 처리 회로(24)에 공급한다. 또한, 복호부(23)는 재부호화 데이터를 복호하는 과정에서 얻어지는 정보를, 제2 부가 정보로서 클래스 분류 적응 처리 회로(24)에 공급한다.
클래스 분류 적응 처리 회로(24)(도 3)에서는, 단계 S1에 있어서, 탭 생성부(31)가 그곳에 공급되는 제1 복호 데이터를, 순차로 주목 데이터로 하고, 예를 들면 그 주목 데이터에 대하여, 시간적 또는 공간적으로 가까운 위치에 있는 제1 복호 데이터, 주목 데이터에 대응하는 제2 복호 데이터에 대하여, 시간적 또는 공간적으로 가까운 위치에 있는 제2 복호 데이터, 주목 데이터의 복호 과정에서 얻어진 제1 부가 정보, 주목 데이터에 대응하는 제2 복호 데이터의 복호 과정에서 얻어진 제2 부가 정보로부터, 주목 데이터에 대한 예측 탭을 생성하고, 예측부(35)로 출력한다. 또한, 단계 S1에서는, 탭 생성부(32)가 예를 들면 탭 생성부(31)와 마찬가지로 하여, 주목 데이터에 대한 클래스 탭을 생성하고, 클래스 분류부(33)로 출력한다.
그리고, 단계 S2로 진행하여, 클래스 분류부(33)는 탭 생성부(32)로부터 공급되는 클래스 탭에 의거하여, 클래스 분류를 실행하고, 그 결과 얻어지는 클래스 코드를 계수 메모리(34)에 공급하여, 단계 S3으로 진행한다.
단계 S3에서는, 계수 메모리(34)는 클래스 분류부(33)로부터 공급되는 클래 스 코드에 대응하는 어드레스로부터, 탭 계수를 판독하고, 예측부(35)에 공급한다.
그리고, 단계 S4로 진행하여, 예측부(35)는 계수 메모리(34)가 출력하는 탭 계수를 취득하고, 그 탭 계수와 탭 생성부(31)로부터의 예측 탭을 사용하여, 식(1)에 나타낸 곱의 합 연산을 행하고, 주목 데이터를 고품질로 한 데이터(의 예측값)을 얻어서, 단계 S5로 진행한다.
단계 S5에서는, 아직 주목 데이터로서 처리해야 할 제1 복호 데이터가 있는지의 여부가 판정되며, 있다고 판정된 경우, 단계 S1로 되돌아가고, 다음으로 주목 데이터라고 할 제1 복호 데이터를, 새롭게 주목 데이터로 하여, 이하에서는 동일한 처리를 반복한다. 또한, 단계 S5에 있어서, 주목 데이터로서 처리해야 할 데이터가 없다고 판정된 경우, 처리를 종료한다.
다음에, 도 6은 도 3의 계수 메모리(34)에 기억시키는 탭 계수의 학습 처리를 실행하는 학습 장치의 한 실시 형태의 구성예를 나타내고 있다.
학습 장치에는 도 1의 인코더(1)에 있어서 부호화의 대상이 되는 데이터의, 예를 들면 고품질의 것이, 학습용 데이터로서 공급된다. 이 학습용 데이터는 학습 교사가 되는 교사 데이터로서, 생도 데이터 생성부(51)와 정규 방정식 가산 회로(60)에 공급된다.
생도 데이터 생성부(51)는 그곳에 공급되는 교사 데이터로부터 학습의 생도가 되는 생도 데이터를 생성한다.
즉 생도 데이터 생성부(51)는 부호화부(52), 매체 특성 반영부(53), 복호부(54), 부호화부(55) 및 복호부(56)로 구성된다.
부호화부(52)는 교사 데이터를, 도 1의 인코더(1)와 마찬가지로 하여 부호화하고, 그 결과 얻어지는 부호화 데이터를, 매체 특성 반영부(53)에 공급한다. 매체 특성 반영부(53)는 도 1의 기록 매체(3) 또는 전송 매체(4)를 개재함으로써 신호에 부가되는 잡음을, 부호화부(52)로부터의 부호화 데이터에 부가하고(반영하고), 복호부(54)에 공급한다.
복호부(54), 부호화부(55), 복호부(56)는 도 2에 나타낸 디코더(2)의 복호부(21), 부호화부(22), 복호부(23)와 각각 동일하게 구성된다. 따라서, 복호부(54), 부호화부(55), 복호부(56)에서는, 매체 특성 반영부(53)가 출력하는 부호화 데이터가, 도 2의 복호부(21), 부호화부(22), 복호부(23) 각각에 있어서의 경우와 동일하게 처리되며, 그 결과 복호부(54)는 제1 복호 데이터 및 제1 부가 정보를, 복호부(56)는 제2 복호 데이터 및 제2 부가 정보를, 각각 생도 데이터로서 출력한다. 이 생도 데이터로서의 제1 복호 데이터 및 제1 부가 정보, 및 제2 복호 데이터 및 제2 부가 정보는 탭 생성부(57 및 58)에 공급된다.
한편, 도 2의 디코더(2)는 상술한 바와 같이 복호부(23)의 후단에, 부호화부(22)와 복호부(23)의 세트와 동일한 세트를, 1이상 형성하여 구성할 수 있으나, 이 경우, 도 6의 학습 장치의 생도 데이터 생성부(51)는 디코더(2)와 마찬가지로, 복호부(54)의 후단에, 부호화부(55)와 복호부(56)의 세트와 동일한 세트를 1이상 형성하여 구성할 필요가 있다.
탭 생성부(57)는 도 3의 클래스 분류 적응 처리 회로(24)의 탭 생성부(31)와 동일하게 구성되며, 그곳에 공급되는 생도 데이터로서의 제1 복호 데이터 및 제1 부가 정보, 그리고 제2 복호 데이터 및 제2 부가 정보로부터, 탭 생성부(31)에 있어서의 경우와 동일하게 하여, 예측 탭을 생성하고, 정규 방정식 가산 회로(60)에 공급한다.
탭 생성부(58)는 도 3의 클래스 분류 적응 처리 회로(24)의 탭 생성부(32)와 동일하게 구성되며, 그곳에 공급되는 생도 데이터로서의 제1 복호 데이터 및 제1 부가 정보, 그리고 제2 복호 데이터 및 제2 부가 정보로부터, 탭 생성부(32)에 있어서의 경우와 동일하게 하여, 클래스 탭을 생성하고, 클래스 분류부(59)에 공급한다.
클래스 분류부(59)는 탭 생성부(58)로부터 공급되는 클래스 탭에 의거하여, 도 3의 클래스 분류 적응 처리 회로(24)의 클래스 분류부(33)에 있어서의 경우와 동일한 클래스 분류를 실행하고, 그 결과 얻어지는 클래스 코드를, 정규 방정식 가산 회로(60)에 공급한다.
정규 방정식 가산 회로(60)는 그곳에 공급되는 교사 데이터를 순차로 주목 교사 데이터로 하여, 탭 생성부(57)로부터 공급되는, 주목 교사 데이터에 대하여 생성된 예측 탭과, 주목 교사 데이터를 대상으로 한 대입을, 클래스 분류부(59)로부터 공급되는 클래스 코드가 표시하는 클래스마다 실행한다.
즉 정규 방정식 가산 회로(60)는 클래스 분류부(59)로부터 공급되는 클래스 코드에 대응하는 클래스마다, 예측 탭(생도 데이터)을 사용하여, 식(8)의 행렬 A에 있어서의 각 컴포넌트로 되어 있는, 생도 데이터끼리의 승산(xinxim)과, 합계(Σ)에 상응하는 연산을 행한다.
또한, 정규 방정식 가산 회로(60)는 역시 클래스 분류부(59)로부터 공급되는 클래스 코드에 대응하는 클래스마다, 예측 탭(생도 데이터) 및 주목 교사 데이터를 사용하여, 식(8)의 벡터 v에 있어서의 각 컴포넌트로 되어 있는, 생도 데이터와 주목 교사 데이터의 승산(xinyi)과, 합계(Σ)에 상응하는 연산을 행한다.
정규 방정식 가산 회로(60)는 이상의 대입을, 그곳에 공급되는 교사 데이터 전부를 주목 교사 데이터로 하여 실행하고, 이에 따라 각 클래스에 대하여 식(8)에 나타낸 정규 방정식을 세운다.
탭 계수 결정 회로(61)는 정규 방정식 가산 회로(60)에 있어서 클래스마다 생성된 정규 방정식을 풀어서, 클래스마다 탭 계수를 구하고, 계수 메모리(62)의, 각 클래스에 대응하는 어드레스에 공급한다.
한편, 학습용 데이터의 양이나 내용 등에 따라서는, 정규 방정식 가산 회로(60)에 있어서, 탭 계수를 구하는데 필요한 수의 정규 방정식이 얻어지지 않는 클래스가 생기는 경우가 있을 수 있으나, 탭 계수 결정 회로(61)는 그와 같은 클래스에 대해서는, 예를 들면 디폴트의 탭 계수를 출력한다.
계수 메모리(62)는 탭 계수 결정 회로(61)로부터 공급되는 각 클래스의 탭 계수를 기억한다.
다음에, 도 7의 플로우차트를 참조하여, 도 6의 학습 장치의 처리(학습 처리)에 관하여 설명한다.
학습 장치에는, 학습용 데이터가 공급되며, 이 학습용 데이터는 교사 데이터로서, 생도 데이터 생성부(51)와 정규 방정식 가산 회로(60)에 공급된다. 그리고, 단계 S11에서, 생도 데이터 생성부(51)는 교사 데이터로부터 생도 데이터를 출력한다.
즉 단계 S11에서는, 부호화부(52)가 교사 데이터를 도 1의 인코더(1)와 동일하게 부호화하고, 그 결과 얻어지는 부호화 데이터를, 매체 특성 반영부(53)를 통하여 복호부(54)에 공급한다. 복호부(54)는 그곳에 공급되는 부호화 데이터를 복호하고, 그 결과 얻어지는 제1 복호 데이터를 부호화부(55)에 공급함과 아울러, 생도 데이터로서 탭 생성부(57 및 58)에 공급한다. 또한, 복호부(54)는 부호화 데이터를 제1 복호 데이터에 복호하는 과정에서 얻어지는 제1 부가 정보도, 생도 데이터로서 탭 생성부(57 및 58)에 공급한다.
또한, 단계 S11에서는, 부호화부(55)가, 복호부(54)로부터의 제1 복호 데이터를 재부호화하고, 그 결과 얻어지는 재부호화 데이터를, 복호부(56)에 공급한다. 복호부(56)는 부호화부(55)로부터의 재부호화 데이터를 복호하고, 그 결과 얻어지는 제2 복호 데이터와, 재부호화 데이터를 제2 복호 데이터에 복호하는 과정에서 얻어지는 제2 부가 정보를, 생도 데이터로서 탭 생성부(57 및 58)에 공급한다.
그 후, 정규 방정식 가산 회로(60)에 있어서, 그곳에 공급되는 교사 데이터가 주목 교사 데이터가 되며, 단계 S12로 진행하여, 탭 생성부(57, 58)가 그곳에 공급되는 생도 데이터로부터, 주목 교사 데이터에 대하여, 예측 탭과 클래스 탭을 각각 생성한다. 탭 생성부(57)에서 생성된 예측 탭은 정규 방정식 가산 회로(61) 에 공급되고, 탭 생성부(58)에서 생성된 클래스 탭은 클래스 분류부(59)에 공급된다.
그리고, 단계 S13으로 진행하여, 클래스 분류부(59)가 탭 생성부(58)로부터의 클래스 탭에 의거하여, 클래스 분류를 실행하고, 그 결과 얻어지는 클래스 코드를, 정규 방정식 가산 회로(60)에 공급하여, 단계 S14로 진행한다.
단계 S14에서는, 정규 방정식 가산 회로(60)는 클래스 분류부(59)로부터 공급되는 클래스 코드가 표시하는 클래스에 대하여, 그곳에 공급되는 주목 교사 데이터와, 탭 생성부(57)로부터 공급되는 예측 탭을 구성하는 생도 데이터를 대상으로 한, 식(8)의 행렬 A와 벡터 v의, 상술한 바와 같은 대입을 행하고, 단계 S15로 진행한다.
단계 S15에서는, 아직 주목 교사 데이터로서 처리해야 할 교사 데이터가 있는지의 여부가 판정되고, 있다고 판정된 경우, 단계 S11로 되돌아가서, 예를 들면 다음에 공급되는 교사 데이터를 새롭게 주목 교사 데이터로 하여, 이하에서는 동일한 처리가 반복된다.
또한, 단계 S15에 있어서, 주목 교사 데이터로서 처리해야 할 교사 데이터가 없다고 판정된 경우, 즉 예를 들면 정규 방정식 가산 회로(60)에 있어서, 각 클래스에 대하여, 정규 방정식이 얻어진 경우, 단계 S16으로 진행하여, 탭 계수 결정 회로(61)는 각 클래스마다 생성된 정규 방정식을 풀이함으로써, 각 클래스의 탭 계수를 구하고, 계수 메모리(62)의, 각 클래스에 대응하는 어드레스에 공급하여 기억시키고, 처리를 종료한다.
이상과 같이 하여, 계수 메모리(62)에 기억된 각 클래스의 탭 계수가, 도 3의 계수 메모리(34)에 기억되어 있다.
따라서, 도 3의 계수 메모리(34)에 기억된 탭 계수는 선형 예측 연산을 행함으로써 얻어지는, 학습용 데이터와 동일한 품질의 데이터의 예측값에 대하여, 그 예측 오차(여기에서는 제곱오차)가 통계적으로 최소가 되도록 학습을 행하여 구해진 것이기 때문에, 도 3의 예측부(35)가 출력하는 최종적인 복호 데이터는 학습용 데이터와 동일한 품질의 것이 된다.
다음에, 도 8은 도 1의 데이터 전송 시스템이 음성 신호(음성 데이터)를 CELP(예를 들면 VSELP(Vector Sum Excited Liner Prediction), PSI-CELP(Pitch Synchronous Innovation CELP), CS-ACELP(Conjugate Structure Algebraic CELP) 등의 각종 CELP를 포함함) 방식으로 부호화하여 전송하는 경우의, 도 1의 인코더(1)의 구성예를 나타내고 있다. 상술한 바와 같이, 도 1의 인코더(1)가 도 8에 나타낸 바와 같이 구성되는 경우에는, 도 2의 부호화부(22) 및 도 6의 부호화부(52 및 55)도 도 8에 나타낸 것과 동일하게 구성된다.
부호화의 대상이 되는 음성 신호(사람의 음성 외에, 곡 등의 신호도 포함)는 예를 들면 아날로그 음성 신호를, 8㎑ 등의 샘플링 주파수로 샘플링함으로써, 디지털 음성 신호로 A/D 변환하고, 또한 소정의 비트수로 양자화하여 얻어진 것으로, 연산기(71)와 LPC(Liner Prediction Coefficient) 분석부(72)에 공급된다.
LPC 분석부(72)는 그곳에 공급되는 부호화 대상의 음성 신호를, 예를 들면 160 샘플분의 길이의 프레임마다 LPC 분석하고, P차의 선형 예측 계수 α1, α2, ···, αp를 구한다. 그리고 LPC 분석부(72)는 이 P차의 선형 예측 계수 αp(p=1, 2, ···, P)를 요소로 하는 벡터를, 음성의 특징 벡터로서, 벡터 양자화부(73)에 공급한다.
벡터 양자화부(73)는 선형 예측 계수를 요소로 하는 코드 벡터와 코드를 대응시킨 코드 북을 기억하고 있으며, 그 코드 북에 의거하여 LPC 분석부(72)로부터의 특징 벡터 α를 벡터 양자화하고, 그 벡터 양자화의 결과 얻어지는 코드(이하에서는 A코드(A_code)라고 함)를, 코드 결정부(83)에 공급한다.
또한, 벡터 양자화부(73)는 A코드에 대응하는 코드 벡터 α’를 구성하는 요소로 되어 있는 선형 예측 계수 α1’, α2’,···, αP’를, 음성 합성 필터(74)에 공급한다.
음성 합성 필터(74)는 예를 들면 IIR(Infinite Impulse Response)형의 디지털 필터로, 벡터 양자화부(73)로부터의 선형 예측 계수 αP’(p=1, 2, ···, P)를 IIR 필터의 탭 계수로 함과 아울러, 연산기(82)로부터 공급되는 잔차(殘差) 신호 e를 입력 신호로 하여, 음성 합성을 행한다.
즉 LPC 분석부(72)에서 실행되는 LPC 분석은 현재 시각 n의 음성 신호(샘플값) sn, 및 이것에 인접하는 과거의 P개의 샘플값 sn-1, sn-2, ···, sn-p에, 식
sn+α1sn-1+α2sn-2+···, αPs n-p = en ···(9)
으로 나타낸 선형 1차 결합이 성립한다고 가정하고, 현재 시각 n의 샘플값 sn의 예측값(선형 예측값) sn’을, 과거의 P개의 표본값 sn-1, sn-2 , ···sn-p를 사용하여 식
sn-(α1sn-1α2sn-2+···, αPsn-p) ···(10)
에 의해 선형 예측하였을 때에, 실제의 샘플값 sn과 선형 예측값 sn’사이의 제곱오차를 최소로 하는 선형 예측 계수 αP를 구하는 것이다.
여기에서, 식(9)에 있어서, {en}(···, en-1, en, en+1, ···)은 평균값이 0이고, 분산이 소정값 σ2인 서로 상관없는 확률 변수이다.
식(9)로부터 샘플값 sn은 식
sn = en 1sn-1+α2sn-2 +···, αPsn-p) ···(11)
으로 표시할 수 있으며, 이것을 Z 변환하면 다음 식이 성립한다.
S = E/(1+α1z-1+α2z-2+···, αPz-p ) ···(12)
다만, 식(12)에 있어서, S와 E는 식(11)에 있어서의 sn과 en의 Z 변환을 각각 표시한다.
여기에서, 식(9) 및 식(10)으로부터, en은 식
en = sn - sn’ ···(13)
으로 표시할 수 있으며, 실제의 샘플값 sn과 변형 예측값 sn’ 사이의 잔차 신호라고 불리워진다.
따라서, 식(12)로부터 선형 예측 계수 αP를 IIR 필터의 탭 계수로 함과 아울러, 잔차 신호 en을 IIR 필터의 입력 신호로 함으로써, 음성 신호 sn을 구할 수 있다.
따라서, 음성 합성 필터(74)는 상술한 바와 같이, 벡터 양자화부(73)으로부터의 선형 예측 계수 αP’를 탭 계수로 함과 아울러, 연산기(82)로부터 공급되는 잔차 신호 e를 입력 신호로 하여, 식(12)를 연산하고, 음성 신호(합성음 신호) ss를 구할 수 있다.
음성 합성 필터(74)에서는, LPC 분석부(72)에 의한 LPC 분석의 결과 얻어지는 선형 예측 계수 αP가 아니라, 그 벡터 양자화의 결과 얻어지는 코드에 대응하는 코드 벡터로서의 선형 예측 계수 αP’가 사용되기 때문에, 음성 합성 필터(74)가 출력하는 합성음 신호는 LPC 분석전의 음성 신호와는 기본적으로 동일하지 않다.
음성 합성 필터(74)가 출력하는 합성음 신호 ss는 연산기(71)에 공급된다. 연산기(71)는 음성 합성 필터(74)로부터의 합성음 신호 ss로부터 원래의 음성 신호 s를 감산하고(합성음 신호 ss의 각 샘플로부터, 그 샘플에 대응하는 원래의 음성 신호 s의 샘플을 감산하고), 그 감산값을, 제곱오차 연산부(75)에 공급한다. 제곱오차 연산부(75)는 연산기(71)로부터의 감산값의 제곱합(예를 들면 LPC 분석부(72) 가 LPC 분석을 실행하는 프레임 단위에서의 제곱합)을 연산하고, 그 결과 얻어지는 제곱오차를, 제곱오차 최소 판정부(76)에 공급한다.
제곱오차 최소 판정부(76)는 제곱오차 연산부(75)가 출력하는 제곱오차에 대응시켜서, 래그(lag)를 나타내는 코드로서의 L 코드(L_code), 게인을 나타내는 코드로서의 G 코드(G_code) 및 부호어(여기 코드 북)을 나타내는 코드로서의 I 코드(I_code)를 기억하고 있으며, 제곱오차 연산부(75)가 출력하는 제곱오차에 대응하는 L 코드, G 코드 및 L 코드를 출력한다. L 코드는 적응 코드 북 기억부(77)에, G 코드는 게인 복호기(78)에, I 코드는 여기 코드 북 기억부(79)에 각각 공급된다. 또한, L 코드, G 코드 및 I 코드는 코드 결정부(83)에도 공급된다.
적응 코드 북 기억부(77)는 예를 들면 7비트의 L 코드와, 소정의 지연 시간(래그)을 대응시킨 적응 코드 북을 기억하고 있으며, 연산기(82)로부터 공급되는 잔차 신호 e를, 제곱오차 최소 판정부(76)로부터 공급되는 L 코드에 대응된 지연 시간만큼 지연하여, 연산기(80)로 출력한다.
여기에서, 적응 코드 북 기억부(77)는 잔차 신호 e를 L 코드에 대응하는 시간만큼 지연하여 출력하기 때문에, 그 출력 신호는 그 지연 시간을 주기로 하는 주기 신호에 가까운 신호가 된다. 이 신호는 선형 예측 계수를 사용한 음성 합성에 있어서 주로 유성음의 합성음을 생성하기 위한 구동 신호가 된다.
게인 복호기(78)는 G 코드와, 소정의 게인 β 및 γ을 대응시킨 테이블을 기억하고 있으며, 제곱오차 최소 판정부(76)로부터 공급되는 G 코드에 대응된 게인 β 및 γ를 출력한다. 게인 β 및 γ는 연산기(80)와 (81)에 각각 공급된다. 여 기에서, 게인 β는 장기 필터 상태 출력 게인이라고 불리우는 것이며, 또한 게인 γ은 여기 코드 북 게인이라고 불리우는 것이다.
여기 코드 북 기억부(79)는 예를 들면 9비트의 I 코드와, 소정의 여기 신호를 대응시킨 여기 코드 북을 기억하고 있으며, 제곱오차 최소 판정부(76)로부터 공급되는 I 코드에 대응된 여기 신호를, 연산기(81)로 출력한다.
여기에서, 여기 코드 북에 기억되어 있는 여기 신호는 예를 들면 백색 잡음 등에 가까운 신호이며, 선형 예측 계수를 사용한 음성 합성에 있어서, 주로 무성음의 합성음을 생성하기 위한 구동 신호가 된다.
연산기(80)는 적응 코드 북 기억부(77)의 출력 신호와, 게인 복호기(78)가 출력하는 게인 β를 환승하고, 그 환승값 1을 연산기(82)에 공급한다. 연산기(81)는 여기 코드 북 기억부(79)의 출력 신호와, 게인 복호기(78)가 출력하는 게인 γ을 환승하고, 그 환승값 n을 연산기(82)에 공급한다. 연산기(82)는 연산기(80)로부터의 환승값 1과, 연산기(81)로부터의 환승값 n을 가산하고, 그 가산값을 잔차 신호 e로 하여, 음성 합성 필터(74)와 적응 코드 북 기억부(77)에 공급한다.
음성 합성 필터(74)에서는 이상과 같이 하여, 연산기(82)로부터 공급되는 잔차 신호 e가 벡터 양자화부(73)로부터 공급되는 선형 예측 계수 αP’를 탭 계수로 하는 IIR 필터로 필터링되며, 그 결과 얻어지는 합성음 신호가 연산기(71)에 공급된다. 그리고, 연산기(71) 및 제곱오차 연산부(75)에 있어서, 상술한 경우와 동일한 처리가 실행되며, 그 결과 얻어지는 제곱오차가 제곱오차 최소 판정부(76)에 공 급된다.
제곱오차 최소 판정부(76)는 제곱오차 연산부(75)로부터의 제곱오차가 최소(극소)가 되었는지의 여부를 판정한다. 그리고, 제곱오차 최소 판정부(76)는 제곱오차가 최소로 되어 있지 않다고 판정한 경우, 상술한 바와 같이, 그 제곱오차에 대응하는 L 코드, G 코드 및 L 코드를 출력하고, 이하에서는 동일한 처리가 반복된다.
한편, 제곱오차 최소 판정부(76)는 제곱오차가 최소로 되었다고 판정한 경우, 확정 신호를 코드 결정부(83)로 출력한다. 코드 결정부(83)는 벡터 양자화(73)로부터 공급되는 A 코드를 래치함과 아울러, 제곱오차 최소 판정부(76)로부터 공급되는 L 코드, G 코드 및 I 코드를 순차로 래치하도록 되어 있으며, 제곱오차 최소 판정부(76)로부터 확정 신호를 수신하면, 이 때 래치되어 있는 A 코드, L 코드, G 코드 및 I 코드를, 채널 인코더(84)에 공급한다. 채널 인코더(84)는 코드 결정부(83)로부터의 A 코드, L 코드, G 코드 및 I 코드를 다중화하고, 그 다중화 효과인 코드 데이터를, 부호화 데이터로서 출력한다.
또, 이하에서는, 설명을 간단히 하기 위하여, A 코드, L 코드, G 코드 및 I 코드는 프레임마다 구해지는 것으로 한다. 다만, 예를 들면 한 프레임을 4개의 서브 프레임으로 분할하고, L 코드, G 코드 및 I 코드는 서브 프레임마다 구하도록 하는 것 등이 가능하다.
여기에서, 도 8(후술하는 도 9에서도 동일)에서는, 각 변수에 [k]가 부여되며, 배열 변수로 되어 있다. 이 k는 프레임수를 나타내는데, 명세서중에서는 그 설명을 생략한다.
다음에, 도 9는 도 1의 인코더(1)가 도 8에 나타낸 바와 같이 구성되는 경우의, 도 2의 복호부(21)의 구성예를 나타내고 있다. 상술한 바와 같이, 도 2의 복호부(21)가 도 9에 나타낸 바와 같이 구성되는 경우에는 도 2의 복호부(23) 및 도 6의 복호부(54 및 56)도 도 9에 나타낸 것과 동일하게 구성된다.
도 8의 인코더(1)가 출력하는 부호화 데이터로서의 코드 데이터는 채널 디코더(91)에서 수신된다. 채널 디코더(91)는 코드 데이터로부터, L 코드, G 코드, I 코드, A 코드를 분리하고, 각각을 적응 코드 북 기억부(92), 게인 복호기(93), 여기 코드 북 기억부(94), 필터 계수 복호기(95)에 공급한다.
적응 코드 북 기억부(92), 게인 복호기(93), 여기 코드 북 기억부(94), 연산기(96 내지 98)는 도 8의 적응 코드 북 기억부(77), 게인 복호기(78), 여기 코드 북 기억부(79), 연산기(80 내지 82)와 각각 동일하게 구성되는 것으로, 도 8에서 설명한 경우와 동일한 처리가 실행됨으로써, L 코드, G 코드 및 I 코드가 잔차 신호 e로 복호된다. 이 잔차 신호 e는 음성 합성 필터(99)에 대하여, 입력 신호로서 부여됨과 아울러, 적응 코드 북 기억부(92)에 공급된다.
필터 계수 복호기(95)는 도 8의 벡터 양자화부(73)가 기억하고 있는 것과 동일한 코드 북을 기억하고 있으며, A 코드를, 선형 예측 계수 αP’로 복호하고, 음성 합성 필터(99)에 공급한다.
음성 합성 필터(99)는 도 8의 음성 합성 필터(74)와 동일하게 구성되어 있으 며, 필터 계수 복호기(95)로부터의 선형 예측 계수 αP’를 탭 계수로 함과 아울러, 연산기(98)로부터 공급되는 잔차 신호 e를 입력 신호로 하여, 식(12)을 연산하고, 이에 따라 도 8의 제곱오차 최소 판정부(76)에 있어서 제곱오차가 최소로 판정되었을 때의 합성음 신호를 생성한다. 이 합성음 신호는 부호화 데이터의 복호 결과(복호 데이터)로서 출력된다.
한편, 부가 정보 출력부(100)는 상술한 바와 같이, 부호화 데이터를, 복호 데이터로서의 합성음 신호로 복호하는 과정에서 얻어지는 정보를 취득하고, 그 정보 중의 일부 또는 전부를, 부가 정보로서 출력한다.
즉, 부가 정보 출력부(100)에는 채널 디코더(91)가 출력하는 L 코드, G 코드, I 코드 및 A 코드나, 게인 복호기(93)가 출력하는 게인 β 및 γ, 필터 계수 복호기(95)가 출력하는 선형 예측 계수 αP, 연산기(96)가 출력하는 연산 결과 1, 연산기(97)가 출력하는 연산 결과 γ, 연산기(98)가 출력하는 잔차 신호 e 등이 공급되게 되어 있으며, 부가 정보 출력부(100)는 이들 정보 중의 일부 또는 전부를, 부가 정보로서 출력한다.
다음에, 도 10은 도 1의 데이터 전송 시스템이 정지화의 화상 데이터를 JPEG 방식으로 부호화하여 전송하는 경우의, 도 1의 인코더(1)의 구성예를 나타내고 있다. 도 1의 인코더(1)가 도 10에 나타낸 바와 같이 구성되는 경우에는, 도 2의 부호화부(22) 및 도 6의 부호화부(52 및 55)도, 도 10에 나타낸 것과 같이 구성된다.
부호화 대상의 화상 데이터는 블록화 회로(111)에 입력되고, 블록화 회로(111)는 그곳에 입력되는 화상 데이터를 8×8 화소인 64 화소로 이루어진 블록으로 분할한다. 블록화 회로(111)에서 얻어지는 각 블록은 DCT 회로(112)에 공급된다. DCT 회로(112)는 블록화 회로(111)로부터의 블록에 대하여, DCT(이산 코사인 변환) 처리를 실시하고, 1개의 DC(Direct Current) 성분과, 수평 방향 및 수직 방향에 대한 63개의 주파수 성분(AC(Alternating Cerrent) 성분)의, 합계 64개의 DCT 계수로 변환한다. 각 블록마다의 64개의 DCT 계수는 DCT 회로(112)로부터 양자화 회로(113)에 공급된다.
양자화 회로(113)는 소정의 양자화 테이블에 따라서, DCT 회로(112)로부터의 DCT 계수를 양자화하고, 그 양자화 결과(이하에서는 양자화 DCT 계수라 함)를, 양자화에 사용한 양자화 테이블과 함께, 엔트로피 부호화 회로(114)에 공급한다.
여기에서, 양자화 회로(113)에서 사용된 양자화 테이블에는, 일반적으로 인간의 시각 특성을 고려하여, 중요성이 높은 저주파수의 DCT 계수는 미세하게 양자화하고, 중요성이 낮은 고주파수의 DCT 계수는 성기게 양자화하는 양자화 단계이 설정되어 있으며, 이에 따라서 화상의 품질 열화를 억제하여, 효율이 좋은 압축이 행해지게 되어 있다.
또한, JPEG 부호화에 있어서, 어떠한 양자화 테이블을 사용하는가는, 예를 들면 사용자가 설정하는 압축율 등에 의거하여 결정된다.
엔트로피 부호화 회로(114)는 양자화 회로(113)로부터의 양자화 DCT 계수에 대하여, 예를 들면 허프만 부호화 등의 엔트로피 부호화 처리를 실시하여, 양자화 회로(113)로부터의 양자화 테이블을 부가하고, 그 결과 얻어지는 부호화 데이터를 출력한다.
다음에, 도 11은 도 1의 인코더(1)가 도 10에 나타낸 바와 같이 구성되는 경우의, 도 2의 복호부(21)의 구성예를 나타내고 있다. 도 2의 복호부(21)가 도 11에 나타낸 바와 같이 구성되는 경우에는, 도 2의 복호부(23) 및 도 5의 복호부(54 및 56)도 도 11에 나타낸 것과 동일하게 구성된다.
부호화 데이터는 엔트로피 복호 회로(121)에 입력되며, 엔트로피 복호 회로(121)는 부호화 데이터를, 엔트로피 부호화된 양자화 DCT 계수와, 양자화 테이블로 분리한다. 또한, 엔트로피 복호 회로(121)는 엔트로피 부호화된 양자화 DCT 계수를 엔트로피 복호하고, 그 결과 얻어지는 양자화 DCT 계수를, 양자화 테이블과 함께 역양자화 회로(122)에 공급한다. 역양자화 회로(122)는 엔트로피 복호 회로(121)로부터의 양자화 DCT 계수를, 마찬가지로 엔트로피 복호 회로(121)로부터의 양자화 테이블에 따라서 역양자화하고, 그 결과 얻어지는 DCT 계수를, 역DCT 회로(123)에 공급한다. 역DCT 회로(123)는 역양자화 회로(12)로부터의 DCT 계수에, 역DCT 처리를 실시하고, 그 결과 얻어지는 8×8 화소의 복호 블록을, 블록 분해 회로(124)에 공급한다. 블록 분해 회로(124)는 역DCT 회로(123)로부터의 복호 블록의 블록화를 풀어서, 복호 화상 데이터를 얻어서 출력한다.
한편, 부가 정보 출력부(125)는 상술한 바와 같이 부호화 데이터를, 복호 화상 데이터로 복호하는 과정에서 얻어지는 정보를 취득하며, 그 정보 중의 일부 또는 전부를, 부가 정보로서 출력한다.
즉 부가 정보 출력부(125)에는, 엔트로피 복호 회로(121)가 출력하는 양자화 테이블 및 양자화 DCT 계수나, 역양자화 회로(122)가 출력하는 DCT 계수 등이 공급되게 되어 있으며, 부가 정보 출력부(125)는 이들 정보 중의 일부 또는 전부를, 부가 정보로서 출력한다.
다음에, 도 12는 도 1의 데이터 전송 시스템이, 동화(動畵)의 화상 데이터를 MPEG2 방식으로 부호화하여 전송하는 경우의, 도 1의 인코더(1)의 구성예를 나타내고 있다. 도 1의 인코더(1)가 도 12에 나타낸 바와 같이 구성되는 경우에는 도 2의 부호화부(22) 및 도 6의 부호화부(52 및 55)도 도 12에 나타낸 것과 동일하게 구성된다.
MPEG 부호화의 대상인 동화를 구성하는 프레임(또는 필드)는 순차로 움직임 검출 회로(131)와 연산기(132)에 공급된다.
움직임 검출 회로(131)는 그곳에 공급되는 프레임에 대하여, 매크로 블록 단위로, 움직임 벡터를 검출하고, 엔트로피 부호화 회로(136) 및 움직임 보상 회로(140)에 공급한다.
연산기(132)는 그곳에 공급되는 화상이, I(Intra) 픽쳐이라면, 그대로 블록화 회로(133)에 공급하고, P(Predictive) 또는 B(Bidrectionally predictive) 픽쳐이라면, 움직임 보상 회로(140)로부터 공급되는 참조 화상과의 차분을 연산하여, 그 차분값을 블록화 회로(133)에 공급한다.
블록화 회로(133)는 연산기(132)의 출력을 8×8 화소인 화소 블록으로 블록화하고, DCT 회로(134)에 공급한다. DCT 회로(134)는 블록화 회로(133)로부터의 화소 블록을 DCT 처리하고, 그 결과 얻어지는 DCT 계수를, 양자화 회로(135)에 공 급한다. 양자화 회로(135)는 DCT 회로(133)로부터의 블록 단위의 DCT 계수를 소정의 양자화 테이블에 따라서 양자화하고, 그 결과 얻어지는 양자화 DCT 계수를, 사용한 양자화 테이블과 함께, 엔트로피 부호화 회로(136)에 공급한다. 엔트로피 부호화 회로(136)는 양자화 회로(135)로부터의 양자화 DCT 계수를 엔트로피 부호화하고, 움직임 검출 회로(131)로부터의 움직임 벡터나, 양자화 회로(135)로부터의 양자화 테이블, 그 밖의 필요한 정보(예를 들면 MPEG 스트림의 각 레이어의 헤더가 되는 정보 등)을 부가하여, 그 결과 얻어지는 부호화 데이터를 MPEG 부호화 결과로서 출력한다.
양자화 회로(135)가 출력하는 양자화 DCT 계수 중에서, I 픽쳐 및 P 픽쳐는 나중에 부호화되는 P 픽쳐나 B 픽쳐의 참조 화상으로 사용하는데 로컬 디코드할 필요가 있기 때문에, 엔트로피 부호화 회로(136) 외에, 역양자화 회로(137)에도 공급된다. 또한, 역양자화 회로(137)에는 양자화 회로(135)에서 사용된 양자화 테이블도 공급된다.
역양자화 회로(137)는 양자화 회로(135)로부터의 양자화 DCT 계수를, 마찬가지로 양자화 회로(135)로부터의 양자화 테이블에 따라서 역양자화함으로써, DCT 계수로 하고, 역DCT 회로(138)에 공급한다. 역DCT 회로(138)는 역양자화 회로(137)로부터의 DCT 계수를 역DCT 처리하고, 연산기(139)로 출력한다. 연산기(139)에는 역DCT 회로(138)의 출력 외에, 움직임 보상 회로(140)가 출력하는 참조 화상도 공급되게 되어 있으며, 연산기(139)는 역DCT 회로(138)의 출력이, P 픽쳐의 것인 경우에는 그 출력과, 움직임 보상 회로(140)의 출력을 가산함으로써, 원래의 화상을 복호하고, 움직임 보상 회로(140)에 공급한다. 또한, 연산기(139)는 역DCT 회로(138)의 출력이 I 픽쳐의 것인 경우에는, 그 출력은 I 픽쳐의 복호 화상으로 되어 있으므로, 그대로 움직임 보상 회로(140)에 공급한다.
움직임 보상 회로(140)는 연산기(139)로부터 공급되는, 로컬 디코드된 화상에 대하여, 움직임 검출 회로(131)로부터의 움직임 벡터에 따른 움직임 보상을 실시하고, 그 움직임 보상후의 화상을, 참조 화상으로 하여, 연산기(132 및 139)에 공급한다.
다음에, 도 13은 도 1의 인코더(1)가 도 12에 나타낸 바와 같이 구성되는 경우의, 도 2의 복호부(21)의 구성예를 나타내고 있다. 도 2의 복호부(21)가 도 13에 나타낸 바와 같이 구성되는 경우에는, 도 2의 복호부(23) 및 도 6의 복호부(54 및 56)도 도 13에 나타낸 것과 동일하게 구성된다.
부호화 데이터는 엔트로피 복호 회로(151)에 공급되며, 엔트로피 복호 회로(151)는 부호화 데이터를 엔트로피 복호하고, 양자화 DCT 계수를 얻음과 아울러, 그 부호화 데이터에 포함되는 움직임 벡터, 양자화 테이블, 그 밖의 필요한 정보를 분리한다. 그리고, 양자화 DCT 계수 및 양자화 테이블은 역양자화 회로(152)에 공급되며, 움직임 벡터는 움직임 보상 회로(156)에 공급된다.
역양자화 회로(152)는 엔트로피 복호 회로(151)로부터의 양자화 DCT 계수를, 마찬가지로 엔트로피 복호 회로(11)로부터의 양자화 테이블에 따라서 역양자화함으로써, DCT 계수로 하고, 역DCT 회로(153)에 공급한다. 역DCT 회로(153)는 역양자화 회로(152)로부터의 DCT 계수를 역DCT 처리하고, 연산기(154)로 출력한다. 연산 기(154)에는 역양자화 회로(153)의 출력 외에, 움직임 보상 회로(156)가 출력하는, 이미 복호된 I 픽쳐 또는 P 픽쳐를, 엔트로피 복호 회로(151)로부터의 움직임 벡터에 따라서 움직임 보상한 것이 참조 화상으로서 공급되도록 되어 있으며, 연산기(154)는 역DCT 회로(153)의 출력이 P 또는 B 픽쳐의 것인 경우에는, 그 출력과, 움직임 보상 회로(156)의 출력을 가산함으로써, 원래의 화상을 복호하고, 블록 분해 회로(155)에 공급한다. 또한, 연산기(154)는 역DCT 회로(153)의 출력이 I 픽쳐의 것인 경우에는, 그 출력은 I 픽쳐의 복호 화상으로 되어 있으므로, 그대로 블록 분해 회로(155)에 공급한다.
블록 분해 회로(155)는 연산기(154)로부터 화소 블록 단위로 공급되는 복호 화상의 블록화를 풀어서, 복호 화상 데이터를 얻어 출력한다.
또한, 움직임 보상 회로(156)는 연산기(154)가 출력하는 복호 화상 중의 I 픽쳐와 P 픽쳐를 수신하고, 엔트로피 복호 회로(151)로부터의 움직임 벡터에 따른 움직임 보상을 실시한다. 그리고, 움직임 보상 회로(156)는 그 움직임 보상후의 화상을, 참조 화상으로서 연산기(154)에 공급한다.
한편, 부가 정보 출력부(157)는 상술한 바와 같이, 부호화 데이터를, 복호 화상 데이터로 복호하는 과정에서 얻어지는 정보를 취득하고, 그 정보 중의 일부 또는 전부를, 부가 정보로서 출력한다.
즉, 부가 정보 출력부(157)에는, 엔트로피 복호 회로(151)가 출력하는 양자화 테이블, 양자화 DCT 계수, 및 움직임 벡터나, 역양자화 회로(122)가 출력하는 DCT 계수가 공급되도록 되어 있다. 또한, 부가 정보 출력부(157)에는, 엔트로피 복호 회로(151)가 부호화 데이터를 엔트로피 복호함으로써 얻어지는 MPEG 스트림의 각 레이어에 배치된 정보(예를 들면 픽쳐 타입이나, 블록의 위치 정보, 프레임 DCT 모드/필드 DCT 모드 등)도 공급되도록 되어 있다. 부가 정보 출력부(157)는 이들 정보 중의 일부 또는 전부를, 부가 정보로서 출력한다.
다음에, 상술한 일련의 처리는 하드웨어에 의해 행할 수도 있으며, 소프트웨어에 의해 행할 수도 있다. 일련의 처리를 소프트웨어에 의해 행할 경우에는, 그 소프트웨어를 구성하는 프로그램이, 범용 컴퓨터 등에 인스톨된다.
따라서, 도 14는 상술한 일련의 처리를 실행하는 프로그램이 인스톨되는 컴퓨터의 한 실시 형태의 구성예를 나타내고 있다.
프로그램은 컴퓨터에 내장되어 있는 기록 매체로서의 하드 디스크(205)나 ROM(203)에 미리 기록해 둘 수 있다.
또는, 프로그램은 플로피 디스크, CD-ROM(Compact Disc Read Only Memory), MO(Magneto optical) 디스크, DVD(Digital Versatile Disc), 자기 디스크, 반도체 메모리 등의 착탈가능(removable) 기록 매체(211)에, 일시적 또는 영속적으로 저장(기록)해 둘 수 있다. 이와 같은 착탈가능 기록 매체(211)는 이른바 패키지 소프트웨어로서 제공할 수 있다.
한편, 프로그램은 상술한 바와 같은 착탈가능 기록 매체(211)로부터 컴퓨터에 인스톨하는 외에, 다운 로드 사이트로부터, 디지털 위성 방송용의 인공 위성을 통하여, 컴퓨터에 무선으로 전송하거나, LAN(Local Area Network), 인터넷과 같은 네트워크를 통하여, 컴퓨터에 유선으로 전송하고, 컴퓨터에서는, 그와 같이 하여 전송되어 오는 프로그램을, 통신부(208)에서 수신하고, 내장한 하드 디스크(205)에 인스톨할 수 있다.
컴퓨터는 CPU(Central Processing Unit)(202)을 내장하고 있다. CPU(202)에는 버스(201)를 통하여, 입출력 인터페이스(210)가 접속되어 있으며, CPU(202)는 입출력 인터페이스(210)를 통하여, 사용자에 의하여 키보드나 마우스, 마이크 등으로 구성되는 입력부(207)가 조작됨으로써, 지령이 입력되면, 그에 따라서 ROM(Read Only Memory)(203)에 저장되어 있는 프로그램을 실행한다. 또는, CPU(202)는 하드 디스크(205)에 저장되어 있는 프로그램, 위성 또는 네트워크로부터 전송되며, 통신부(208)에서 수신되어 하드 디스크(205)에 인스톨된 프로그램, 또는 드라이브(209)에 장착된 착탈가능 기록 매체(211)로부터 판독되어 하드 디스크(205)에 장착된 착탈가능 기록 매체(211)로부터 판독되어 하드 디스크(205)에 인스톨된 프로그램을, RAM(Random Access Memory)(204)에 로드하여 실행한다. 이에 따라서, CPU(202)는 상술한 플로우차트에 따른 처리, 또는 상술한 블록도의 구성에 의해 실행되는 처리를 실행한다. 그리고, CPU(202)는 그 처리 결과를, 필요에 따라서, 예를 들면 입출력 인터페이스(210)를 통하여, LCD(Liquid Crystal Display)나 스피커 등으로 구성되는 출력부(206)로부터 출력, 또는 통신부(208)로부터 송신, 그리고 하드 디스크(205)에 기록시킨다.
여기에서, 본 명세서에 있어서, 컴퓨터에 각종 처리를 실행시키기 위한 프로그램을 설명하는 처리 단계은 반드시 플로우차트로서 기재된 순서에 따라서 시계열적으로 처리할 필요는 없으며, 병렬적 또는 개별적으로 실행되는 처리(예를 들면 병렬 처리 또는 오브젝트에 의한 처리)도 포함하는 것이다.
또한, 프로그램은 한 컴퓨터에 의해 처리되는 것이어도 되고, 복수의 컴퓨터에 의해 분산 처리되는 것이어도 된다. 또한, 프로그램은 원방의 컴퓨터에 전송되어 실행되는 것이어도 된다.
한편, 본 발명은 특정의 부호화/복호 방식에 한정되지 않고 적용가능하다. 즉, 본 실시 형태에서는, CELP 방식, JPEG 방식, MPEG2 방식에 관하여 설명하였으나, 본 발명은 그 밖에도 예를 들면 M-JPEG(Motion JPEG) 방식이나, MPEG1, 4, MP3(MPEG-1 Audio Layer 3) 방식, ATRAC(Adaptive TRansform Acoustic Coding) 방식 등의 여러 가지 부호화/복호 방식에 적용가능하다.
또한, 본 실시 형태에서는, 부호화 데이터를, 그 부호화 방식에 대응한 복호 방식에 의해 복호하도록 하였으나, 부호화 데이터의 복호는 클래스 분류 적응 처리에 의해 행하는 것이 가능하다. 클래스 분류 적응 처리에 의한 부호화 데이터의 복호는 부호화의 대상이 되는 데이터를 교사 데이터로 함과 아울러, 그 데이터를 부호화한 부호화 데이터를 생도 데이터로 하여 학습을 행하여 얻어지는 탭 계수를 이용함으로써 실행하는 것이 가능하다.
또한, 본 실시 형태에서는, 탭 계수를 이용한 선형 1차 예측 연산에 의해, 고품질의 데이터의 예측값을 구하도록 하였으나, 이 예측값은 그 밖에 2차 이상의 고차 예측 연산에 의해 구하는 것도 가능하다.
또한, 본 실시 형태에서는, 디코더(2)의 클래스 분류 적응 처리 회로(24)에 있어서, 품질을 향상시키기 위한 탭 계수를, 미리 기억해 두도록 하였으나, 탭 계 수는 부호화 데이터에 포함하여, 디코더(2)에 제공하도록 하는 것이 가능하다.
또한, 본 실시 형태에서는, 예측 탭을, 제1 복호 데이터 및 제2 복호 데이터 외에, 제1 부가 정보 및 제2 부가 정보로부터 생성하도록 하였으나, 예측 탭은 그 밖에 예를 들면 제1 복호 데이터 및 제2 복호 데이터으로부터만 생성하도록 하는 것이 가능하다. 클래스 탭에 관해서도 동일하다.
본 발명의 제1 데이터 처리 장치 및 데이터 처리 방법, 그리고 프로그램 및 기록 매체에 따르면, 부호화 데이터가 복호되고, 그 결과 얻어지는 복호 데이터가 부호화되어, 재부호화 데이터가 출력된다. 그리고, 학습을 행함으로써 구해진 탭 계수와의 소정의 예측 연산을 행하는 예측 탭이, 복호 데이터 및 재부호화 데이터로부터 얻어지는 정보로부터 생성되며, 예측 탭과 탭 계수를 이용하여 소정의 예측 연산을 행함으로써, 학습에 있어서 교사로서 이용된 교사 데이터에 대응하는 예측값이 구해진다. 따라서, 예를 들면 품질이 충분히 개선된 데이터를 얻는 것이 가능해진다.
본 발명의 제2 데이터 처리 장치 및 데이터 처리 방법, 그리고 프로그램 및 기록 매체에 따르면, 교사가 되는 교사 데이터로부터, 그 교사 데이터를 부호화하여 복호한 복호 데이터, 및 그 복호 데이터를 부호화한 재부호화 데이터로부터 얻어지는 정보가, 생도가 되는 생도 데이터로서 생성된다. 그리고, 교사 데이터를 예측하는데 이용하는 예측 탭이, 생도 데이터로부터 생성되며, 예측 탭과 탭 계수를 이용하여, 소정의 예측 연산을 행함으로써 얻어지는 교사 데이터의 예측값의 예 측 오차가 통계적으로 최소가 되도록 학습이 행해지고, 탭 계수가 구해진다. 따라서, 그 탭 계수를 이용하여 예측 연산을 행함으로써, 예를 들면 품질이 충분히 개선된 데이터를 얻는 것이 가능해진다.
본 발명의 제3 데이터 처리 장치 및 데이터 처리 방법, 그리고 프로그램 및 기록 매체에 따르면, 데이터를 부호화한 부호화 데이터가 복호되고, 그 결과 얻어지는 복호 데이터가 부호화되어, 재부호화 데이터가 출력된다. 그리고, 클래스 분류에 이용하는 클래스 탭이, 복호 데이터 및 재부호화 데이터로부터 얻어지는 정보로부터 생성되며, 그 클래스 탭에 의거하여 클래스 분류가 실행된다. 따라서, 데이터의 적절한 클래스 구분이 가능하게 된다.

Claims (43)

  1. 데이터를 부호화하여 얻어지는 부호화 데이터를 처리하는 데이터 처리 장치에 있어서,
    상기 부호화 데이터를 복호하고 복호 데이터를 출력하는 복호 수단과,
    상기 복호 데이터를 부호화하고 재부호화 데이터를 출력하는 재부호화 수단과,
    학습을 행함으로써 구해진 탭 계수와의 소정의 예측 연산을 행하는 예측 탭을, 상기 복호 데이터 및 상기 재부호화 데이터로부터 얻어지는 정보로부터 생성하는 예측 탭 생성 수단과,
    상기 탭 계수를 취득하는 탭 계수 취득 수단과,
    상기 예측 탭과 탭 계수를 이용하여 소정의 예측 연산을 행함으로써, 상기 학습에 있어서 교사로서 이용된 교사 데이터에 대응하는 예측값을 구하는 예측 수단
    을 구비하는 것을 특징으로 하는 데이터 처리 장치.
  2. 제1항에 있어서, 상기 예측 수단은 상기 예측 탭과 탭 계수를 이용하여 선형 1차 예측 연산을 행함으로써 상기 예측값을 구하는 것을 특징으로 하는 데이터 처리 장치.
  3. 제1항에 있어서, 상기 복호 수단은 상기 부호화 데이터를 복호하는 과정에서 얻어지는 정보를 부가 정보로서 출력하고,
    상기 예측 탭 생성 수단은 상기 부가 정로로부터도 상기 예측 탭을 생성하는 것을 특징으로 하는 데이터 처리 장치.
  4. 제1항에 있어서, 상기 재부호화 데이터를 복호하고 재복호 데이터를 출력하는 재복호 수단을 더 구비하며,
    상기 예측 탭 생성 수단은 상기 복호 데이터 및 재복호 데이터로부터 상기 예측 탭을 생성하는 것을 특징으로 하는 데이터 처리 장치.
  5. 제4항에 있어서, 상기 재복호 수단은 상기 재부호화 데이터를 복호하는 과정에서 얻어지는 정보를 부가 정보로서 출력하고,
    상기 예측 탭 생성 수단은 상기 부가 정보로부터도 상기 예측 탭을 생성하는 것을 특징으로 하는 데이터 처리 장치.
  6. 제1항에 있어서, 정보를 클래스를 구분하는 클래스 분류를 행하는데 이용되는 클래스 탭을, 상기 복호 데이터 및 상기 재부호화 데이터로부터 얻어지는 정보로부터 생성하는 클래스 탭 생성 수단과,
    상기 클래스 탭에 의거하여 클래스 분류를 행하는 클래스 분류 수단
    을 더 구비하며,
    상기 탭 계수 취득 수단은 상기 클래스 분류 수단이 출력하는 클래스에 대응하는 상기 탭 계수를 취득하고,
    상기 예측 수단은 상기 클래스 분류 수단이 출력하는 클래스에 대응하는 상기 탭 계수를 이용하여 상기 예측값을 구하는 것을 특징으로 하는 데이터 처리 장치.
  7. 제6항에 있어서, 상기 복호 수단은 상기 부호화 데이터를 복호하는 과정에서 얻어지는 정보를 부가 정보로서 출력하고,
    상기 클래스 탭 생성 수단은 상기 부가 정보로부터도 상기 클래스 탭을 생성하는 것을 특징으로 하는 데이터 처리 장치.
  8. 제6항에 있어서, 상기 재부호화 데이터를 복호하고 재복호 데이터를 출력하는 재복호 수단을 더 구비하며,
    상기 클래스 탭 생성 수단은 상기 복호 데이터 및 재복호 데이터로부터 상기 클래스 탭을 생성하는 것을 특징으로 하는 데이터 처리 장치.
  9. 제8항에 있어서, 상기 재복호 수단은 상기 재부호화 데이터를 복호하는 과정에서 얻어지는 정보를 부가 정보로서 출력하고,
    상기 클래스 탭 생성 수단은 상기 부가 정보로부터도 상기 클래스 탭을 생성하는 것을 특징으로 하는 데이터 처리 장치.
  10. 제1항에 있어서, 상기 데이터는 화상 데이터인 것을 특징으로 하는 데이터 처리 장치.
  11. 제10항에 있어서, 상기 부호화 데이터는 상기 화상 데이터를 적어도 직교 변환하여 얻어지는 데이터를 포함하는 것을 특징으로 하는 데이터 처리 장치.
  12. 제1항에 있어서, 상기 데이터는 음성 데이터인 것을 특징으로 하는 데이터 처리 장치.
  13. 제12항에 있어서, 상기 부호화 데이터는 적어도 선형 예측 계수와 잔차(殘差) 신호에 대응하는 코드를 포함하는 것을 특징으로 하는 데이터 처리 장치.
  14. 데이터를 부호화하여 얻어지는 부호화 데이터를 처리하는 데이터 처리 방법에 있어서,
    상기 부호화 데이터를 복호하고 복호 데이터를 출력하는 복호 단계와,
    상기 복호 데이터를 부호화하고 재부호화 데이터를 출력하는 재부호화 단계와,
    학습을 행함으로써 구해진 탭 계수와의 소정의 예측 연산을 행하는 예측 탭을, 상기 복호 데이터 및 상기 재부호화 데이터로부터 얻어지는 정보로부터 생성하 는 예측 탭 생성 단계와,
    상기 탭 계수를 취득하는 탭 계수 취득 단계와,
    상기 예측 탭과 탭 계수를 이용하여, 소정의 예측 연산을 행함으로써, 상기 학습에 있어서 교사로서 이용된 교사 데이터에 대응하는 예측값을 구하는 예측 단계
    를 구비하는 것을 특징으로 하는 데이터 처리 방법.
  15. 삭제
  16. 데이터를 부호화하여 얻어지는 부호화 데이터를, 컴퓨터에 처리시키는 프로그램이 기록되어 있는 기록 매체에 있어서,
    상기 부호화 데이터를 복호하고 복호 데이터를 출력하는 복호 단계와,
    상기 복호 데이터를 부호화하고 재부호화 데이터를 출력하는 재부호화 단계와,
    학습을 행함으로써 구해진 탭 계수와의 소정의 예측 연산을 행하는 예측 탭을, 상기 복호 데이터 및 상기 재부호화 데이터로부터 얻어지는 정보로부터 생성하는 예측 탭 생성 단계와,
    상기 탭 계수를 취득하는 탭 계수 취득 단계와,
    상기 예측 탭과 탭 계수를 이용하여, 소정의 예측 연산을 행함으로써, 상기 학습에 있어서 교사로서 이용된 교사 데이터에 대응하는 예측값을 구하는 예측 단계
    를 구비하는 프로그램이 기록되어 있는 것을 특징으로 하는 기록 매체.
  17. 데이터를 부호화하여 얻어지는 부호화 데이터를 처리하는데 이용하는 소정의 탭 계수를 학습하는 데이터 처리 장치에 있어서,
    교사가 되는 교사 데이터로부터, 그 교사 데이터를 부호화하여 복호한 복호 데이터 및 그 복호 데이터를 부호화한 재부호화 데이터로부터 얻어지는 정보를, 생도(生徒)가 되는 생도 데이터로서 생성하는 생도 데이터 생성 수단과,
    상기 교사 데이터를 예측하는데 이용하는 예측 탭을, 상기 생도 데이터로부터 생성하는 예측 탭 생성 수단과,
    상기 예측 탭과 탭 계수를 이용하여, 소정의 예측 연산을 행함으로써 얻어지는 상기 교사 데이터의 예측값의 예측 오차가, 통계적으로 최소가 되도록 학습을 행하고, 상기 탭 계수를 구하는 학습 수단
    을 구비하는 것을 특징으로 하는 데이터 처리 장치.
  18. 제17항에 있어서, 상기 학습 수단은 상기 예측 탭과 탭 계수를 이용하여 선형 1차 예측 연산을 행함으로써 얻어지는 상기 교사 데이터의 예측값의 예측 오차가 통계적으로 최소가 되도록 학습을 행하는 것을 특징으로 하는 데이터 처리 장치.
  19. 제17항에 있어서, 상기 생도 데이터 생성 수단은 상기 교사 데이터를 부호화한 부호화 데이터를 복호하는 과정에서 얻어지는 정보도 상기 생도 데이터로서 출력하는 것을 특징으로 하는 데이터 처리 장치.
  20. 제17항에 있어서, 상기 생도 데이터 생성 수단은 상기 재부호화 데이터를 복호하고, 그 결과 얻어지는 재복호 데이터를 상기 생도 데이터로서 출력하는 것을 특징으로 하는 데이터 처리 장치.
  21. 제20항에 있어서, 상기 생도 데이터 생성 수단은 상기 재부호화 데이터를 복호하는 과정에서 얻어지는 정보도 상기 생도 데이터로서 출력하는 것을 특징으로 하는 데이터 처리 장치.
  22. 제17항에 있어서, 정보를 클래스 구분하는 클래스 분류를 행하는데 이용되는 클래스 탭을, 상기 생도 데이터로부터 생성하는 클래스 탭 생성 수단과,
    상기 클래스 탭에 의거하여 클래스 분류를 행하는 클래스 분류 수단
    을 더 구비하며,
    상기 학습 수단은 상기 클래스 분류 수단이 출력하는 클래스마다, 상기 탭 계수를 구하는 것을 특징으로 하는 데이터 처리 장치.
  23. 제22항에 있어서, 상기 생도 데이터 생성 수단은 상기 교사 데이터를 부호화한 부호화 데이터를 복호하는 과정에서 얻어지는 정보도 상기 생도 데이터로서 출력하는 것을 특징으로 하는 데이터 처리 장치.
  24. 제22항에 있어서, 상기 생도 데이터 생성 수단은 상기 재부호화 데이터를 복호하고, 그 결과 얻어지는 재복호 데이터를 상기 생도 데이터로서 출력하는 것을 특징으로 하는 데이터 처리 장치.
  25. 제24항에 있어서, 상기 생도 데이터 생성 수단은 상기 재부호화 데이터를 복 호하는 과정에서 얻어지는 정보도 상기 생도 데이터로서 출력하는 것을 특징으로 하는 데이터 처리 장치.
  26. 제17항에 있어서, 상기 교사 데이터는 화상 데이터인 것을 특징으로 하는 데이터 처리 장치.
  27. 제26항에 있어서, 상기 생도 데이터 생성 수단은 상기 화상 데이터를 적어도 직교 변환함으로써 부호화하는 것을 특징으로 하는 데이터 처리 장치.
  28. 제17항에 있어서, 상기 데이터는 음성 데이터인 것을 특징으로 하는 데이터 처리 장치.
  29. 제28항에 있어서, 상기 생도 데이터 생성 수단은 상기 음성 데이터를 적어도 선형 예측 계수와 잔차 신호에 대응하는 코드로 부호화하는 것을 특징으로 하는 데이터 처리 장치.
  30. 데이터를 부호화하여 얻어지는 부호화 데이터를 처리하는데 이용하는 소정의 탭 계수를 학습하는 데이터 처리 방법에 있어서,
    교사가 되는 교사 데이터로부터, 그 교사 데이터를 부호화하여 복호한 복호 데이터 및 그 복호 데이터를 부호화한 재부호화 데이터로부터 얻어지는 정보를, 생 도가 되는 생도 데이터로서 생성하는 생도 데이터 생성 단계와,
    상기 교사 데이터를 예측하는데 이용하는 예측 탭을, 상기 생도 데이터로부터 생성하는 예측 탭 생성 단계와,
    상기 예측 탭과 탭 계수를 이용하여, 소정의 예측 연산을 행함으로써 얻어지는 상기 교사 데이터의 예측값의 예측 오차가, 통계적으로 최소가 되도록 학습을 행하고, 상기 탭 계수를 구하는 학습 단계
    를 구비하는 것을 특징으로 하는 데이터 처리 방법.
  31. 삭제
  32. 데이터를 부호화하여 얻어지는 부호화 데이터를 처리하는데 이용하는 소정의 탭 계수를 학습하는 데이터 처리를, 컴퓨터에 실행시키는 프로그램이 기록되어 있는 기록 매체에 있어서,
    교사가 되는 교사 데이터로부터, 그 교사 데이터를 부호화하여 복호한 복호 데이터 및 그 복호 데이터를 부호화한 재부호화 데이터로부터 얻어지는 정보를, 생도가 되는 생도 데이터로서 생성하는 생도 데이터 생성 단계와,
    상기 교사 데이터를 예측하는데 이용하는 예측 탭을, 상기 생도 데이터로부터 생성하는 예측 탭 생성 단계와,
    상기 예측 탭과 탭 계수를 이용하여, 소정의 예측 연산을 행함으로써 얻어지는 상기 교사 데이터의 예측값의 예측 오차가, 통계적으로 최소가 되도록 학습을 행하고, 상기 탭 계수를 구하는 학습 단계
    를 구비하는 프로그램이 기록되어 있는 것을 특징으로 하는 기록 매체.
  33. 정보를 클래스 구분하는 클래스 분류를 행하는 데이터 처리 장치에 있어서,
    데이터를 부호화한 부호화 데이터를 복호하고 복호 데이터를 출력하는 복호 수단과,
    상기 복호 데이터를 부호화하고 재부호화 데이터를 출력하는 재부호화 수단과,
    상기 클래스 분류에 이용하는 클래스 탭을, 상기 복호 데이터 및 상기 재부호화 데이터로부터 얻어지는 정보로부터 생성하는 클래스 탭 생성 수단과,
    상기 클래스 탭에 의거하여 클래스 분류를 행하는 클래스 분류 수단
    을 구비하는 것을 특징으로 하는 데이터 처리 장치.
  34. 제33항에 있어서, 상기 복호 수단은 상기 부호화 데이터를 복호하는 과정에서 얻어지는 정보를 부가 정보로서 출력하고,
    상기 클래스 탭 생성 수단은 상기 부가 정보로부터도 상기 클래스 탭을 생성하는 것을 특징으로 하는 데이터 처리 장치.
  35. 제33항에 있어서, 상기 재부호화 데이터를 복호하고 재복호 데이터를 출력하는 재복호 수단을 더 구비하며,
    상기 클래스 탭 생성 수단은 상기 복호 데이터와 재복호 데이터로부터 상기 클래스 탭을 생성하는 것을 특징으로 하는 데이터 처리 장치.
  36. 제35항에 있어서, 상기 재복호 수단은 상기 재부호화 데이터를 복호하는 과정에서 얻어지는 정보를 부가 정보로서 출력하고,
    상기 예측 탭 생성 수단은 상기 부가 정보로부터도 상기 예측 탭을 생성하는 것을 특징으로 하는 데이터 처리 장치.
  37. 제33항에 있어서, 상기 데이터는 화상 데이터인 것을 특징으로 하는 데이터 처리 장치.
  38. 제37항에 있어서, 상기 부호화 데이터는 상기 화상 데이터를 적어도 직교 변환하여 얻어지는 데이터를 포함하는 것을 특징으로 하는 데이터 처리 장치.
  39. 제33항에 있어서, 상기 데이터는 음성 데이터인 것을 특징으로 하는 데이터 처리 장치.
  40. 제39항에 있어서, 상기 부호화 데이터는 적어도 선형 예측 계수와 잔차 신호에 대응하는 코드를 포함하는 것을 특징으로 하는 데이터 처리 장치.
  41. 정보를 클래스 구분하는 클래스 분류를 행하는 데이터 처리 방법에 있어서,
    데이터를 부호화한 부호화 데이터를 복호하고 복호 데이터를 출력하는 복호 단계와,
    상기 복호 데이터를 부호화하고 재부호화 데이터를 출력하는 재부호화 단계와,
    상기 클래스 분류에 이용하는 클래스 탭을, 상기 복호 데이터 및 상기 재부호화 데이터로부터 얻어지는 정보로부터 생성하는 클래스 탭 생성 단계와,
    상기 클래스 탭에 의거하여 클래스 분류를 행하는 클래스 분류 단계
    를 구비하는 것을 특징으로 하는 데이터 처리 방법.
  42. 삭제
  43. 정보를 클래스 구분하는 클래스 분류를 행하는 데이터 처리를, 컴퓨터에 실행시키는 프로그램이 기록되어 있는 기록 매체에 있어서,
    데이터를 부호화한 부호화 데이터를 복호하고 복호 데이터를 출력하는 복호 단계와,
    상기 복호 데이터를 부호화하고 재부호화 데이터를 출력하는 재부호화 단계와,
    상기 클래스 분류에 이용하는 클래스 탭을, 상기 복호 데이터 및 상기 재부호화 데이터로부터 얻어지는 정보로부터 생성하는 클래스 탭 생성 단계와,
    상기 클래스 탭에 의거하여 클래스 분류를 행하는 클래스 분류 단계
    를 구비하는 프로그램이 기록되어 있는 것을 특징으로 하는 기록 매체.
KR20027012587A 2001-01-25 2002-01-24 데이터 처리 장치, 방법 및 기록 매체 KR100847179B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001016869A JP4507046B2 (ja) 2001-01-25 2001-01-25 データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
JPJP-P-2001-00016869 2001-01-25
PCT/JP2002/000490 WO2002060069A1 (en) 2001-01-25 2002-01-24 Data processing apparatus

Publications (2)

Publication Number Publication Date
KR20030062230A KR20030062230A (ko) 2003-07-23
KR100847179B1 true KR100847179B1 (ko) 2008-07-17

Family

ID=18883164

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20027012587A KR100847179B1 (ko) 2001-01-25 2002-01-24 데이터 처리 장치, 방법 및 기록 매체

Country Status (6)

Country Link
EP (1) EP1355428B1 (ko)
JP (1) JP4507046B2 (ko)
KR (1) KR100847179B1 (ko)
CN (1) CN1269314C (ko)
DE (1) DE60211854T2 (ko)
WO (1) WO2002060069A1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4462823B2 (ja) * 2002-11-20 2010-05-12 ソニー株式会社 画像信号の処理装置および処理方法、それに使用される係数データの生成装置および生成方法、並びに各方法を実行するためのプログラム
US8140849B2 (en) 2004-07-02 2012-03-20 Microsoft Corporation Security for network coding file distribution
US7756051B2 (en) * 2004-07-02 2010-07-13 Microsoft Corporation Content distribution using network coding
TW200834537A (en) 2006-12-18 2008-08-16 Sony Corp Dynamic image signal processing device
TWI384437B (zh) 2006-12-18 2013-02-01 Sony Corp An image signal processing device, an image signal processing method, and a computer program product
JP2008178075A (ja) 2006-12-18 2008-07-31 Sony Corp 表示制御装置、表示制御方法、及びプログラム
JP4656452B2 (ja) * 2008-05-20 2011-03-23 ソニー株式会社 画像信号処理装置および画像信号処理方法、予測係数生成装置および予測係数生成処理方法、並びに各方法をコンピュータに実行させるためのプログラム
JP5326465B2 (ja) * 2008-09-26 2013-10-30 富士通株式会社 オーディオ復号方法、装置、及びプログラム
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06152432A (ja) * 1992-11-13 1994-05-31 Sony Corp 高能率符号化及び/又は復号化装置
JPH08307835A (ja) * 1995-05-10 1996-11-22 Sony Corp クラス分類適応処理装置および方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3627291B2 (ja) * 1995-05-25 2005-03-09 ソニー株式会社 ブロック歪み除去装置および方法
JP3334468B2 (ja) * 1995-12-28 2002-10-15 ソニー株式会社 量子化ビット数変換装置および方法
JP3946812B2 (ja) * 1997-05-12 2007-07-18 ソニー株式会社 オーディオ信号変換装置及びオーディオ信号変換方法
JP3787823B2 (ja) * 1997-07-31 2006-06-21 ソニー株式会社 画像処理装置および画像処理方法
JP4362895B2 (ja) * 1999-06-21 2009-11-11 ソニー株式会社 データ処理装置およびデータ処理方法、並びに記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06152432A (ja) * 1992-11-13 1994-05-31 Sony Corp 高能率符号化及び/又は復号化装置
JPH08307835A (ja) * 1995-05-10 1996-11-22 Sony Corp クラス分類適応処理装置および方法

Also Published As

Publication number Publication date
CN1457552A (zh) 2003-11-19
JP2002223167A (ja) 2002-08-09
DE60211854T2 (de) 2007-05-24
EP1355428B1 (en) 2006-05-31
WO2002060069A1 (en) 2002-08-01
KR20030062230A (ko) 2003-07-23
EP1355428A1 (en) 2003-10-22
JP4507046B2 (ja) 2010-07-21
DE60211854D1 (de) 2006-07-06
EP1355428A4 (en) 2005-09-07
CN1269314C (zh) 2006-08-09

Similar Documents

Publication Publication Date Title
US7082220B2 (en) Data processing apparatus
EP2849180B1 (en) Hybrid audio signal encoder, hybrid audio signal decoder, method for encoding audio signal, and method for decoding audio signal
EP1335353A2 (en) Decoding apparatus, encoding apparatus, decoding method and encoding method
JPH08123494A (ja) 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
CN102105930A (zh) 用于编码采样音频信号的帧的音频编码器和解码器
WO2003085644A1 (en) Encoding device and decoding device
CN101432802A (zh) 使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备
KR100847179B1 (ko) 데이터 처리 장치, 방법 및 기록 매체
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
JP3266178B2 (ja) 音声符号化装置
JP4399185B2 (ja) 符号化装置および復号化装置
JP4857468B2 (ja) データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
JPH09127995A (ja) 信号復号化方法及び信号復号化装置
Edler et al. A time-warped MDCT approach to speech transform coding
JP4748113B2 (ja) 学習装置および学習方法、並びにプログラムおよび記録媒体
KR100875783B1 (ko) 데이터 처리 장치
JP4000589B2 (ja) 復号装置および復号方法、並びにプログラムおよび記録媒体
Werner et al. An enhanced SBR tool for low-delay applications
JP4736266B2 (ja) 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体
JP2003264466A5 (ko)
KR20230023560A (ko) 부호화 방법 및 복호화 방법, 상기 방법을 수행하는 부호화기 및 복호화기
JP4517262B2 (ja) 音声処理装置および音声処理方法、学習装置および学習方法、並びに記録媒体
JP3714786B2 (ja) 音声符号化装置
JPH02120898A (ja) 音声符号化方式
JP2001346209A (ja) データ処理装置およびデータ処理方法、並びに記録媒体

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120702

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee