CN1269314C - 数据处理装置 - Google Patents

数据处理装置 Download PDF

Info

Publication number
CN1269314C
CN1269314C CNB028005414A CN02800541A CN1269314C CN 1269314 C CN1269314 C CN 1269314C CN B028005414 A CNB028005414 A CN B028005414A CN 02800541 A CN02800541 A CN 02800541A CN 1269314 C CN1269314 C CN 1269314C
Authority
CN
China
Prior art keywords
data
decoded
coded
obtains
tap
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB028005414A
Other languages
English (en)
Other versions
CN1457552A (zh
Inventor
近藤哲二郎
渡边勉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1457552A publication Critical patent/CN1457552A/zh
Application granted granted Critical
Publication of CN1269314C publication Critical patent/CN1269314C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Discrete Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

一种能够改善关于图像或声音的已解码数据的质量的数据处理装置。例如,解码部分(21)对通过将图像进行JPEG编码而产生的已编码数据进行解码。编码部分(22)对解码所产生的第一已解码数据进行编码并输出再编码数据。此外,解码部分(23)对再编码数据进行解码并产生第二已解码数据。类-分类自适应处理电路(24)使用通过学习而获得的抽头系数,根据第一已解码数据和第二已解码数据,产生预测抽头,用于与通过学习而确定的抽头系数执行通过使用所述预测抽头和抽头系数的预定的预测计算,从而确定相应于学习中被用作教师(teacher)的教师数据的预测值。本发明可被应用于发送编码的图像和声音的传输系统。

Description

数据处理装置
技术领域
本发明涉及数据处理装置,尤其涉及一种允许对诸如高质量图像和高质量声音进行解码的数据处理装置。
背景技术
本申请人已经提出把类别(class)分类自适应处理作为一种用于提高图像和声音质量方法。
类别分类自适应处理由类别分类处理和自适应处理组成。在类别分类处理中数据按照它的特性被分为几类,而自适应处理则被应用于每类。自适应处理按如下方法执行。
具体地,例如,现在假定图像在自适应处理中被处理,例如,低质量图像的像素值和预定的抽头系数线性地耦合(couple with)以获得高质量图像的像素值的预测值,于是低质量图像就被转化为高质量图像。
更具体地,例如,现在假定高质量图像被设置为主数据(master data);例如,把通过JPEG(联合图像专家组)方法或MPEG(移动图像专家组)方法对高质量图像编码接着对已编码的数据进行解码而获得的具有降低的图像质量的已解码图像设置成学徒数据(apprentice data);和作为主数据的高质量像素值“Y”的预测值E[Y]通过由一组作为学徒数据的低质量像素值x1、x2...和预定抽头系数w1、w2,...的线性耦合模型所定义的线性耦合而获得。在此情况下,预测值E[Y]可以由如下的表达式来表示。
E[Y]=w1x1+w2x2+... (1)
为了使表达式(1)具有一般性,当由一组抽头系数“wj”组成的矩阵“W”,由一组学徒数据“xij”组成的矩阵X和,由一组预测值E[Yj]组成的矩阵“Y”由如下表达式定义时,
[表达式1]
X = x 11 x 12 · · · x 1 J x 21 x 22 · · · x 2 J · · · · · · · · · · · · x I 1 x I 2 · · · x IJ ,
W = w 1 w 2 · · · w J , Y ′ = E [ y 1 ] E [ y 2 ] · · · E [ y I ]
如下的经验方程成立。
XW=Y′      (2)
这里,矩阵X中的元素xij表示学徒数据的第i组(用于预测第i个主数据的学徒数据组)的第j个学徒数据,矩阵W中的元素wj表示被用于和学徒数据组中第j个学徒数据相乘的一个抽头系数,以及yi表示第i个主数据。因此,E[yi]表示对第i个主数据的预测值。在表达式(1)中,矩阵Y中的元素yi的下标i被省略而只示出左手的y,矩阵X中的元素xij的下标i被省略而只示出右手的x1,x2...。
假定最小二乘法被应用到此经验方程(2)中以获得一个逼近高质量像素值“y”的预测值E[y]。在此情况下,当由一组作为主数据的像素值“y”组成的矩阵“Y”,和由一组相对于像素值“y”的预测值E[Y]的余数“e”组成的矩阵“E”按如下方法定义时,
[表达式2]
E = e 1 e 2 · · · e T , Y = y 1 y 2 · · · y T
根据表达式(2),下面的余数方程成立。
XW=Y+E     (3)
在此情况下,当如下的方差(square error)最小时,可得到用于获得一个逼近高质量像素值“y”的预测值E[y]的抽头系数wi
[表达式3]
Σ i = 1 I e i 2
因此,当由预测系数wj对上述方差求微分(differentiate)而获得的结果是0时,换言之,满足如下表达式的预测系数wj是用于获得逼近像素值“y”的预测值E[y]的最佳值。
[表达式4]
e 1 ∂ e 1 ∂ w j + e 2 ∂ e 2 ∂ w j + · · · e I ∂ e I ∂ w J = 0 ( j = 1,2 , · · · J ) · · · ( 4 )
当表达式(3)被预测系数wi求微分时,如下表达式成立。
[表达式5]
∂ e i ∂ w 1 = x i 1 , ∂ e i ∂ w 2 = x i 2 , · · · , ∂ e i ∂ w J = x iJ , ( i = 1,2 , · · · , I ) · · · ( 5 )
根据表达式(4)和表达式(5),得到表达式(6)
Σ i = 1 I e i x i 1 = 0 , Σ i = 1 I e i x i 2 = 0 , · · · , Σ i = 1 I e i x iJ = 0 · · · ( 6 )
此外,当考虑余数方程(3)中学徒数据“xij”、抽头系数“wj”、主数据“yi”和余数“ei”之间的关系时,从公式(6)推导出如下正规方程(normal equation)。
[表达式7]
( Σ i = 1 I x i 1 x i 1 ) w 1 + ( Σ i = 1 I x i 1 x i 2 ) w 2 + · · · + ( Σ i = 1 I x i 1 x iJ ) w J = ( Σ i = 1 I x i 1 y i ) ( Σ i = 1 I x i 2 x i 1 ) w 1 + ( Σ i = 1 I x i 2 x i 2 ) w 2 + · · · + ( Σ i = 1 I x i 2 x iJ ) w J = ( Σ i = 1 I x i 2 y i ) ( Σ i = 1 I x iJ x i 1 ) w 1 + ( Σ i = 1 I x iJ x i 2 ) w 2 + · · · + ( Σ i = 1 I x iJ x iJ ) w J = ( Σ i = 1 I x iJ y i ) · · · ( 7 )
当矩阵(协方差矩阵)A和矢量“v”按如下方式定义时,
[表达式8]
A = Σ i = 1 I x i 1 x i 1 Σ i = 1 I x i 1 x i 2 · · · Σ i = 1 I x i 1 x iJ Σ i = 1 I x i 2 x i 1 Σ i = 1 I x i 2 x i 2 · · · Σ i = 1 I x i 2 x iJ · · · Σ i = 1 I x iJ x i 1 Σ i = 1 I x iJ x i 2 Σ i = 1 I x iJ x iJ
v = Σ i = 1 I x i 1 y i Σ i = 1 I x i 2 y i · · · Σ i = 1 I x iJ y i
并且矢量W按表达式(1)所示出的形式定义时,(7)式示出的正规方程能按如下方式表达。
AW=V            (8)
如果一定数目的学徒数据组xij和主数据yI组被准备好的话,与将获得的抽头系数“wj”的J相同数目的正规方程可以用公式表达。因此,通过解关于矢量W的方程(8)(为了解方程(8),在方程(8)中的矩阵A必须是非奇异矩阵),能得到使统计预测误差最小(在这里,就是使方差最小)的抽头系数“wj”。例如,可以使用sweep off法(Gauss-Jordan删除法)解方程(8)。
如上所述,在自适应处理过程中,能得到使统计预测误差最小的抽头系数“wj”,然后,通过使用抽头系数“wj”从表达式(1)中能得到逼近高质量像素值“y”的预测值E[y]。
例如,当与将被编码的图像具有相同图像质量的图像被用作主数据,并把首先对主数据编码接着进行解码所获得的已解码图像用作学徒数据时,在对已编码的图像数据进行解码以生成原始图像数据的处理中,能获得使统计预测误差最小的抽头系数“wj”。
又例如,当比将被编码的图像具有更高分辨率的图像被用作主数据,并通过把所述主数据的分辨率降低到和将被编码的图像一样的图像质量并接着对它编码然后解码而获得的解码图像用作学徒数据时,在解码编码的图像以生成高分辨率图像的处理中,能获得使统计预测误差最小的抽头系数“wj”。
因此,在此情况下,依据自适应处理,根据用于主数据或学徒数据的图像选择,能得到能够按需要调整已解码图像的图像质量的抽头系数。
自适应处理和通常的通过滤波器实现的滤波处理的很大不同之处在于,使用了通过学习的方式而使统计预测误差最小的抽头系数,并且,不包括在将被编码的图像中的高频成份被再现。
因此,当分类自适应处理被应用到通过对已编码数据进行解码而获得的已解码图像时,该已解码图像具有一个被改善的图像质量。
例如,如果由于传输已编码数据的传输路径的状态和图像数据被编码的压缩率,通过对已编码数据进行解码而获得的已解码图像的图像质量很差,但是,即使当仅仅通过使用已解码图像而进行分类自适应处理时,在有些情况下,仍很难充分改善它的图像质量。
发明内容
本发明已经考虑到上述情况。本发明的一个目的在于让数据能获得充分改善的质量。
根据本发明的第一数据处理装置,其特征在于:包括:解码部件,用于对已编码数据进行解码并输出已解码数据;再编码部件,用于对所述已解码数据进行编码并输出再编码数据;预测抽头生成部件,用于根据所述已解码数据和从再编码数据获得的信息,产生用于与通过学习而获得的抽头系数进行预定的预测计算的预测抽头;抽头系数采集部件,用于采集抽头系数;和预测部件,用于通过使用所述预测抽头和所述抽头系数进行预定的预测计算,获得对应于在学习中作为教师使用的主数据的预测值。
根据本发明的第一数据处理方法,特征在于:包括:解码步骤,用于对已编码数据进行解码并输出已解码数据;再编码步骤,用于对已解码数据进行编码并输出再编码数据;预测抽头生成步骤,根据所述已解码数据和从再编码数据获得的信息,产生用于与通过学习而获得的抽头系数进行预定的预测计算的预测抽头;抽头系数采集步骤,用于采集抽头系数;和预测步骤,用于通过使用所述预测抽头和所述抽头系数进行预定的预测计算,获得对应于在学习中作为教师使用的主数据的预测值。
根据本发明的第一程序,其特征在于:包括:解码步骤,用于对已编码数据进行解码并输出已解码数据;再编码步骤,用于对已解码数据进行编码并输出再编码数据;预测抽头生成步骤,根据所述已解码数据和从再编码数据获得的信息,产生用于与通过学习而获得的抽头系数进行预定的预测计算的预测抽头;抽头系数采集步骤,用于采集抽头系数;和预测步骤,用于通过使用所述预测抽头和所述抽头系数进行预定的预测计算,获得对应于在学习中作为教师使用的主数据的预测值。
根据本发明的用于记录程序的第一记录介质,特征在于:该程序包括:解码步骤,用于对已编码数据进行解码并输出已解码数据;再编码步骤,用于对已解码数据进行编码并输出再编码数据;预测抽头生成步骤,根据所述已解码数据和从再编码数据获得的信息,产生用于与通过学习而获得的抽头系数进行预定的预测计算的预测抽头;抽头系数采集步骤,用于采集抽头系数;和预测步骤,用于通过使用所述预测抽头和所述抽头系数进行预定的预测计算,获得对应于在学习中作为教师使用的主数据的预测值。
根据本发明的第二数据处理装置,其特征在于:包括:学徒数据(apprentice-data)生成部件,用于根据作为教师的主数据、通过对主数据进行编码接着又进行解码而获得的已解码数据、和根据通过对已解码的数据进行编码而获得的再编码数据而获得的信息,生成作为学徒的学徒数据;预测抽头生成部件,用于根据学徒数据,生成用于预测主数据的预测抽头;以及学习部件,用于获得抽头系数和执行学习,这样通过使用所述预测抽头和抽头系数而执行预定的预测计算所获得的对主数据的预测值的预测误差在统计意义上最小。
根据本发明的第二数据处理方法,其特征在于,包括:学徒数据生成步骤,用于根据作为教师的主数据、通过对主数据进行编码接着又进行解码而获得的已解码数据、和根据通过对已解码的数据进行编码而获得的再编码数据而获得的信息,生成作为学徒的学徒数据;预测抽头生成步骤,用于根据学徒数据生成用于预测主数据的预测抽头;以及学习步骤,用于获得抽头系数和执行学习,这样通过使用所述预测抽头和抽头系数而执行预定的预测计算所获得的对主数据的预测值的预测误差在统计意义上最小。
根据本发明的第二程序,其特征在于:包括:学徒数据生成步骤,用于根据作为教师的主数据、通过对主数据进行编码接着又进行解码而获得的已解码数据、和根据通过对已解码的数据进行编码而获得的再编码数据而获得的信息,生成作为学徒的学徒数据;预测抽头生成步骤,用于根据学徒数据生成用于预测主数据的预测抽头;以及学习步骤,用于获得抽头系数和执行学习,这样通过使用所述预测抽头和抽头系数而执行预定的预测计算所获得的对主数据的预测值的预测误差在统计意义上最小。
第二记录介质,其特征在于,记录程序,该程序包括:学徒数据生成步骤,用于根据作为教师的主数据、通过对主数据进行编码接着又进行解码而获得的已解码数据、和根据通过对已解码的数据进行编码而获得的再编码数据而获得的信息,生成作为学徒的学徒数据;预测抽头生成步骤,用于根据学徒数据生成用于预测主数据的预测抽头;以及学习步骤,用于获得抽头系数和执行学习,这样通过使用所述预测抽头和抽头系数而执行预定的预测计算所获得的对主数据的预测值的预测误差在统计意义上最小。
根据本发明的第三数据处理装置,其特征在于:包括:解码部件,用于对编码数据而获得的已编码数据进行解码并输出已解码数据;再编码部件,用于编码已解码数据并输出再编码数据;类抽头生成部件,用于根据所述已解码数据和从再编码数据获得的信息,生成用于分类的类抽头;以及分类部件,用于根据所述类抽头执行分类。
根据本发明的第三数据处理方法,其特征在于:包括:解码步骤,用于对通过编码数据而获得的已编码数据进行解码并输出已解码数据;再编码步骤,用于对已解码数据进行编码并输出再编码数据;类抽头生成步骤,用于根据所述已解码数据和从再编码数据获得的信息,生成用于分类的类抽头;以及分类步骤,用于根据所述类抽头执行分类。
根据本发明的第三程序,其特征在于,包括:解码步骤,用于对通过编码数据而获得的已编码数据进行解码并输出已解码数据;再编码步骤,用于对已解码数据进行编码并输出再编码数据;类抽头生成步骤,用于根据所述已解码数据和从再编码数据获得的信息,生成用于分类的类抽头;以及分类步骤,用于根据所述类抽头执行分类。
根据本发明的第三记录介质,其特征在于,记录程序,该程序包括:解码步骤,用于对通过编码数据而获得的已编码数据进行解码并输出已解码数据;再编码步骤,用于对已解码数据进行编码并输出再编码数据;类抽头生成步骤,用于根据所述已解码数据和从再编码数据获得的信息,生成用于分类的类抽头;以及分类步骤,用于根据所述类抽头执行分类。
在根据本发明的第一数据处理装置、第一数据处理方法、第一程序和第一记录介质中,对已编码的数据进行解码,并对作为结果的已解码数据进行编码而输出再编码数据。用于与通过学习而获得的抽头系数进行预定的预测计算的预测抽头,是从已解码数据和从再编码数据获得的信息而生成的。预测抽头和抽头系数被用于进行预定的预测计算,以获得相应于在学习中被用作教师(master)的主数据的预测值。
在根据本发明的第二数据处理装置、第二数据处理方法、第二程序和第二记录介质中,通过对主数据进行编码接着又进行解码而获得的已解码数据、和从编码已解码的数据而获得再编码数据而获得的信息,被从用作教师的主数据生成,作为用作学徒的学徒数据。然后根据学徒数据生成用于预测主数据的预测抽头并执行学习步骤,这样通过使用所述预测抽头和抽头系数而执行预定的预测计算所获得的对主数据的预测值的预测误差在统计意义上最小。
在根据本发明的第三数据处理装置、第三数据处理方法、第三程序和第三记录介质中,对通过编码数据而获得的编码数据进行解码并输出已解码数据,并对已解码数据进行编码并输出再编码数据。然后,根据已解码数据和从再编码数据获得的信息,生成用于分类的类抽头。依据所述类抽头执行分类。
根据本发明的一个方面,提供了一种数据处理装置,用于对通过编码数据而获得的已编码数据进行处理,包括:解码部分,用于对已编码数据进行解码并输出已解码数据;抽头系数获取部分,用于获取抽头系数;其特征在于,还包括:再编码部分,用于对所述已解码数据进行编码并输出再编码数据;再解码部分,用于对再编码数据进行解码并输出再解码数据;预测抽头生成部分,用于根据所述已解码数据和再解码数据,产生用于与通过学习而获得的抽头系数进行预定的预测计算的预测抽头;和预测部分,用于通过使用所述预测抽头和所述抽头系数进行预定的预测计算,获得对应于在学习中作为教师(master)使用的主数据的预测值。
根据本发明的另一方面,还提供了一种用于对编码数据而获得的已编码数据进行处理的数据处理方法,包括:解码步骤,用于对已编码数据进行解码并输出已解码数据;抽头系数获取步骤,用于获取抽头系数;其特征在于,还包括:再编码步骤,用于对已解码数据进行编码并输出再编码数据;再解码步骤,用于对再编码数据进行解码并输出再解码数据;预测抽头生成步骤,根据所述已解码数据和再解码数据,产生用于与通过学习而获得的抽头系数进行预定的预测计算的预测抽头;和预测步骤,用于通过使用所述预测抽头和所述抽头系数进行预定的预测计算,获得对应于在学习中作为教师使用的主数据的预测值。
根据本发明的另一方面,还提供了一种数据处理装置,用于学习预定的抽头系数,该预定的抽头系数用于处理编码数据而获得的已编码数据,其特征在于,包括:学徒数据(apprentice-data)生成部分,用于根据作为教师的主数据、通过对主数据进行编码接着又进行解码而获得的已解码数据、和作为对通过对已解码数据进行编码而获得的再编码数据进行解码的结果而获得的再解码数据,生成作为学徒的学徒数据;预测抽头生成部分,用于根据学徒数据,生成用于预测主数据的预测抽头;以及学习部分,用于获得抽头系数和执行学习,这样通过使用所述预测抽头和抽头系数而执行预定的预测计算所获得的对主数据的预测值的预测误差在统计意义上最小。
根据本发明的另一方面,还提供了一种用于学习预定的抽头系数的数据处理方法,该抽头系数用于处理通过编码数据而获得的已编码数据,其特征在于,该方法包括:学徒数据生成步骤,用于根据作为教师的主数据、通过对主数据进行编码接着又进行解码而获得的已解码数据、和作为对通过对已解码数据进行编码而获得的再编码数据进行解码的结果而获得的再解码数据,生成作为学徒的学徒数据;预测抽头生成步骤,用于根据学徒数据生成用于预测主数据的预测抽头;以及学习步骤,用于获得抽头系数和执行学习,这样通过使用所述预测抽头和抽头系数而执行预定的预测计算所获得的对主数据的预测值的预测误差在统计意义上最小。
根据本发明的另一方面,还提供了一种用于执行分类而将信息分类的数据处理装置,包括:解码部分,用于对编码数据而获得的已编码数据进行解码并输出已解码数据;其特征在于,还包括:再编码部分,用于编码已解码数据并输出再编码数据;再解码部分,用于对再编码数据进行解码并输出再解码数据;类抽头生成部分,用于根据所述已解码数据和再解码数据,生成用于分类的类抽头;以及分类部分,用于根据所述类抽头执行分类。
根据本发明的另一方面,还提供了一种用于执行分类而对信息进行分类的数据处理方法,包括:解码步骤,用于对通过编码数据而获得的已编码数据进行解码并输出已解码数据;其特征在于,还包括:再编码步骤,用于对已解码数据进行编码并输出再编码数据;再解码步骤,用于对再编码数据进行解码并输出再解码数据;类抽头生成步骤,用于根据所述已解码数据和再解码数据,生成用于分类的类抽头;以及分类步骤,用于根据所述类抽头执行分类。
附图说明
图1示出了根据本发明的实施例的数据转发系统的示例结构视图;
图2是示出解码器2的示例结构的方框图;
图3是示出分类自适应处理电路24的示例结构的方框图;
图4A至图4D是分类部分33和59的示例结构的方框图;
图5是描述解码器2实施处理的流程图;
图6是示出根据本发明的实施例的学习装置的示例结构的方框图;
图7是描述学习装置实施处理的流程图;
图8是示出编码器1和编码部分22,52,和55的第一示例结构的方框图;
图9是示出解码部分21,23,54,和56的第一示例结构的方框图;
图10是示出编码器1和编码部分22,52,和55的第二示例结构的方框图;
图11是示出解码部分21,23,54,和56的第二示例结构的方框图;
图12是示出编码器1和编码部分22,52,和55的第三示例结构的方框图;
图13是示出解码部分21,23,54,和56的第三示例结构的方框图;
图14是示出根据本发明的实施例的计算机示例结构的方框图。
具体实施方式
图1示出了根据本发明的实施例的数据转发系统的示例结构。
被转发的数据被输入到编码器1。编码器1根据例如预定的编码方法编码输入的数据以产生已编码数据。该已编码数据被记录到例如半导体存储器、磁光碟(magneto-optical disk)、磁盘、光盘、磁带、或换相盘的记录介质3中,或者通过例如地面电波、卫星链路、CATV(有线电视)网、因特网、或公共线路的转发媒体4被转发。
解码器2接收通过记录介质3或转发媒体4发送的已编码数据,对其解码并输出作为结果得到的已解码数据。例如,当解码数据是图像数据时,图像数据被发送到,例如,一个没有示出的显示器并在显示器上显示。例如,当已解码的数据是音频数据时,该音频数据,例如,被发送到一个没有标出的扩音器并从扩音器输出。
接下来,图2是示出如图1所示的解码器2的示例结构的方框图。
编码数据被发送到解码部分21。解码部分21按照与在编码器1中使用的编码方法对应的解码方法对已编码数据进行解码,并把作为结果获得的已解码数据发送到编码部分22和类-分类自适应处理电路24。解码部分21也把在对已编码数据进行解码处理过程中所获得的信息作为附加信息发送到类-分类自适应处理电路24。
编码部分22对从解码部分21发送的解码数据按照,例如,和在如图1所示的编码器1中使用的相同的方法对已解码数据编码(再编码)以产生再编码数据。该再编码数据从编码部分22发送到解码部分23。
例如,按在解码部分21中同样的方法,解码部分23对从编码部分22发送来的再编码数据进行解码,并把作为结果而获得的已解码数据发送到类-分类自适应处理电路24。解码部分23也把在对再编码数据进行解码的处理过程中获得的信息作为附加信息发送到类-分类自适应处理电路24。
如有必要,以后把进行第一次解码从解码部分21输出的已解码数据称作第一已解码数据,而把进行第二次解码从解码部分23输出的已解码数据称作第二已解码数据。同样地,以后,如有必要,把进行第一次解码从解码部分21输出的附加信息称作第一附加信息,而把进行第二次解码从解码部分23输出的附加信息称作第二附加信息。此外,如有必要,以后把第一已解码数据和第二已解码数据合起来而只称作已解码数据。同样地,如有必要,以后把第一附加信息和第二附加信息合起来而只称作附加信息。
类-分类自适应处理电路24使用从解码部分21发送的第一已解码数据和第一附加信息和从解码部分23发送的第二已解码数据和第二附加信息,执行分类自适应处理,并输出用作编码数据的最终解码结果的已解码数据(如有必要,以后称作最终已解码数据)。
因此,由于类-分类自适应处理电路24使用通过对已编码数据进行解码而获得的第一已解码数据、在解码处理过程中所获得的第一附加信、通过对第一已解码数据再编码接着对再编码数据进行解码而获得的第二已解码数据、和在对再编码数据进行解码的过程中所获得的第二附加信息,执行类-分类自适应处理,即使第一已解码数据的质量大大降低,获得质量得到充分改善的最终解码数据也是可能的。
可以在解码部分23的后续级提供类似于编码部分22和解码部分23的一套或多套装置。在此情形下,通过对第二已解码数据编码继而对作为结果而获得的已编码数据解码而获得第三已解码数据,和在解码处理过程中获得的第三附加信息被送到类-分类自适应处理电路24以执行分类自适应处理是可能的。
图3示出了如图2所示的类-分类自适应处理电路24的示例结构的方框图。
第一解码数据、第一附加信息、第二解码数据和第二附加信息被输入到抽头生成部分31和32。
抽头生成部分31根据第一解码数据、第一附加信息、第二解码数据和第二附加信息,生成在以后将要描述到的预测部分35中用于进行预测计算的预测抽头。更具体地,例如,抽头生成部分31,提取在时间上和空间上都更为接近的第一解码数据和第二解码数据,针对将要改善其质量的目标数据(aimed-at),也提取用于解码所述第一已解码数据和第二已解码数据的第一和第二附加信息,然后把已提取的数据(信息)作为预测抽头发送到预测部分35。
抽头生成部分32从第一已解码数据、第一附加信息、第二已解码数据和第二附加信息,生成在以后描述的类别分类部分33中用于实行分类的类抽头。更具体地,例如,抽头生成部分32生成一个类抽头并将其送到类别分类部分35,该类抽头与由抽头生成部分31为目标数据而生成的预测抽头具有相同的结构。
为了使描述更简单,这里规定类抽头和预测抽头具有相同的结构。类抽头和预测抽头具有不同的结构是可能的,更具体地,它们通过从第一解码数据、第一附加信息、第二解码数据和第二附加信息中提取不同的数据项而生成。
类别分类部分33按照从抽头生成部分32发送的类抽头执行目标数据的分类,并且把对应于作为结果而获得的某类的类代码输出到系数存储器34。
系数存储器34存储如下将描述的图6所示的学习装置执行的信息处理中所获得的每类的抽头系数,并把存储在相应于从类别分类部分33输出的类代码的地址的抽头系数输出到预测部分35。
预测部分35获得从抽头生成部分31输出的预测抽头和从系数存储器34输出的抽头系数,使用该预测抽头和抽头系数来执行表达式(1)所表达的预测计算(先积后和运算),获得并输出通过改善目标数据的质量而得到的数据,即,具有更高质量的目标数据的预测值。
接下来,图4示出了如图3所示的类别分类部分33的示例结构。
如图4A所示,例如,分类部分33可以由ADRC(自适应动态范围编码)电路41A和41B以及一个综合电路41C组成。
在此情况下,ADRC电路41A和41B把K-bit ADRC处理应用到组成类抽头的已解码数据和附加信息,并把作为结果而获得的ADRC代码输出到综合电路41C。
例如,在K-bit ADRC处理过程中,组成类抽头的信息的最大值MAX和最小值MIN被检测,它们之间的差DR=MAX-MIN被设置成装置的本地动态范围,组成类抽头的信息根据此动态范围DR被重新量化为K位。换言之,最小值MIN从每个组成类抽头的信息中被减去,并且,余数被DR/2K除(即量化)。其中如上所述获得的组成类抽头的信息的K-bit值按预定顺序排列的比特串,作为一个ADRC代码输出。
综合电路41C把从ADRC电路41A输出的已解码数据的ADRC代码和从ADRC电路41G输出的附加信息的ADRC代码综合为一个代码并把它作为类代码输出。
如以后所述,组成类抽头的附加信息不限于一种类型。当存在多个附加信息时,ADRC电路41B应用ADRC处理到多个附加信息的每一个,并输出多个ADRC代码。然后,综合电路41C从多个ADRC代码生成一个代码。也可应用于如后所述的在图4B到图4D中的每个图所示的类别分类部分33。
然后,类别分类部分33也可由例如计算器42A和42B,和如图4A所示的ADRC电路41A和41B以及综合电路41C组成。
更具体地,在此情况下,计算器42A计算组成类抽头的第一已解码数据和相应于该第一已解码数据的第二已解码数据之间的差值,并把差值送到ADRC电路41A。计算器42B计算组成类抽头的第一附加信息和相应于该第一附加信息的第二附加信息之间的差值,并把差值送到ADRC电路41B。
与第一已解码数据对应的第二已解码数据意味着,当已解码数据是图像时,例如,作为第一已解码数据而获得的像素和作为第二已解码数据而获得像素一样。换言之,当在帧f中的位置(x,y)处的作为第一已解码数据和第二已解码数据的像素被称作P1(f,x,y)和P2(f,x,y)时,对应于第一已解码数据P1(f,x,y)的第二已解码数据是P2(f,x,y)。
对应于第一附加信息的第二附加信息意味着,当已解码数据是通过如以后所述的CELP(码激励线性预测编码)方法解码的音频数据,并且,附加信息是在该解码处理过程中所获得的线性预测系数时,作为第二附加信息所获得的线性预测系数和作为第一附加信息所获得的线性预测系数具有相同的阶(order)。换言之,当帧(或子帧)f中作为第一已解码数据和第二已解码数据的用于音频编码的第P阶线性预测系数被称作α1(f,p)和α2(f,p)时,对应于第一附加信息α1(f,p)的第二附加信息是α2(f,p)。此外,例如,当已解码数据是通过如以后所述的JPEG方法所解码的图像数据,并且附加信息是在该解码处理过程中所获得的DCT系数时,对应于第一附加信息的第二附加信息意味着,作为第二附加信息而获得的DCT的系数与作为第一附加信息而获得的DCT的系数具有一样的空间频率(spatial frequency)。换言之,当在帧f上8×8方块b中的(x,y)位置的、作为第一附加信息和第二附加信息的DCT系数被称作d1(f,b,x,y)和d2(f,b,x,y)时,对应于第一附加信息d1(f,b,x,y)的第二附加信息是d2(f,b,x,y)。
和图4A所示情形一样的处理被应用于第一已解码数据和第二已解码数据之间的差值,第一附加信息和第二附加信息之间的差值,以获得类代码。
此外,类别分类电路33可以被如图4C所示配置。
在此情况下,也以如图4B中所示的情形中一样的方法,计算器42A计算第一已解码数据和第二已解码数据之间的差值,计算器42B计算第一附加信息和第二附加信息之间的差值。
第一已解码数据和第二已解码数据之间的差值从计算器42A发送到极性判决电路43C。极性判决电路43C判决第一已解码数据和第二已解码数据之间的差值的极性(符号),并根据极性把“0”或“1”输出到综合电路43E。
第一附加信息和第二附加信息之间的差值从计算器42B发送到极性判决电路43D。极性判决电路43D判决第一附加信息和第二附加信息之间的差值的极性(符号),并根据极性把“0”或“1”输出到综合电路43E。
综合电路43E把对应于从极性判决电路43C和43D发送的极性的“0”或“1”序列综合成一个代码并把它作为类代码输出。
此外,如图4D所示,类别分类部分33也可以由延迟电路44A和44B、计算器44C和44D、以及如图4A所示的ADRC电路41A和41B以及综合电路41C组成。
在此情况下,例如,延迟电路44A把组成类抽头的已解码数据延迟对应于一个采样(一个类抽头)的周期,并把它发送到计算器44C。计算器44C计算组成类抽头的已解码数据和从延迟电路44A输出的已延迟的已解码数据之间的差值,并把该差值送到ADRC电路41A。
例如,延迟电路44B把组成类抽头的附加信息延迟对应于一个采样(一个类抽头)的周期,并把它发送到计算器44D。计算器44D计算组成类抽头的附加信息和从延迟电路44B输出的已延迟的附加信息之间的差值,并把该差值送到ADRC电路41B。
接着,ADRC电路41A和41B和综合电路41C把如图4A所示的情形中一样的处理应用到如上所述的差值以输出一个类代码。
此外,例如,类别分类部分33也可以由用于把如图4A至图4D所示电路的任何两个或更多个输出综合成一个代码并输出该代码的电路组成。
更进一步地,类别分类部分33可以由一个不是如图4所示的电路组成。更具体地,当DCT(离散余弦变换)系数、一种正交转换系数在对已编码数据,例如基于JPEG编码的数据或基于MPEG编码的数据进行解码的过程中被获得,并且组成类抽头的附加信息包括DCT系数时,类别分类部分33可以被这样配置,即它输出一个基于从8×8块中的DCT系数获得图像的活动中的类代码,或输出一个基于方块中的目的像素的位置的类代码。此外,例如,类别分类部分33也可以被这样配置,例如,它输出当矢量量化被应用于组成类抽头的已解码数据或附加信息时而获得的结果作为类代码。
通过参考图5所示的流程图,接下来描述如图2所示的解码器2所执行的处理(解码处理)。
解码部分21根据在编码器1中使用的编码方法所对应的解码方法,对已编码数据进行解码,并且把作为结果获得的第一已解码数据发送到编码部分22和类-分类自适应处理电路24。解码部分21也把在对已编码数据进行解码的过程中所获得的信息作为第一附加信息发送到类-分类自适应处理电路24。编码部分22对从解码部分21发送的已解码数据进行再编码并把作为结果而获得的再编码数据发送到解码部分23。解码部分23以在解码部分21中相同的方式,解码从编码部分22发送的再编码数据,并作为结果获得的第二已解码数据发送到类-分类自适应处理电路24。解码部分23也把解码该再编码数据的处理过程中所获得的信息发送到类-分类自适应处理电路24,作为第二附加信息。
在类-分类自适应处理电路24(如图3)中,在步骤S1,抽头生成部分31连续地把输入给它的第一已解码数据设置为目标数据,例如,根据与目标数据在时间或空间上更接近的第一已解码数据、与对应于目标数据的第二已解码数据在时间空间上更接近的第二已解码数据、在目标数据的解码处理中获得的第一附加信息、和在对应于目标数据的第二已解码数据的解码处理中获得的第二附加信息,产生用于目标数据的预测抽头,并把该预测抽头输出到预测部分35。也在步骤S1中,抽头生成部分32例如按照如抽头生成部分31中同样的方法产生一个用于目标数据的类抽头,并把该类抽头输出到类别分类部分33。
接着,处理过程进行到步骤S2,并且,类别分类处理部分33依据从抽头生成部分32发送的类抽头执行分类,并把作为结果而获得的类代码发送到系数存储器34。接着,处理过程进行到步骤S3。
在步骤S3中,系数存储器34读取在从类别分类部分33发送的类代码对应的地址的抽头系数,并把该抽头系数发送到预测部分35。
接着,处理过程进行到步骤S4,预测部分35获得从系数存储器34输出的抽头系数,并通过使用该抽头系数和从抽头生成部分31发送的预测抽头,执行如表达式(1)所示的先积后和运算,以获得通过改善目标数据的质量而得到的数据(的预测值)。该处理过程进行到步骤S5。
在步骤S5中,判断是否仍然还有要被作为目标数据处理的第一已解码数据。当判断存在时,处理返回到步骤S1,将被设置为目标数据的第一已解码数据被设置为一个新的目标数据,并重复相同的处理。在步骤S5中,当判断没有要被作为目标数据处理的数据时,处理结束。
接下来,图6示出了根据本发明的实施例,对将被存储在图3所示的系数存储器34中的抽头系数执行学习处理的学习装置的示例结构。
例如,相应于将被图1所示的编码器1编码的数据的高质量数据被输入到该学习装置作为学习数据。此学习数据作为在学习中被当作教师的主数据被发送到学徒数据生成部分51和正规方程加法器60。
学徒数据生成部分51根据输入给它的主数据,生成在学习中作为学徒的学徒数据。
更具体地,学徒数据生成部分51由编码部分52、介质特征反映部分53、解码部分54、编码部分55和解码部分56组成。
编码部分52按图1所示的编码器1的相同方法编码主数据,并把作为结果而获得的编码数据发送到介质特征反映部分53。介质特征反映部分53把当信号通过如图1所示的记录介质3或转发介质4时,附加到信号的噪声和其他加到从编码部分52发送的已编码数据,并把结果发送到解码部分54。
解码部分54、编码部分55和解码部分56分别具有与图2所示的解码器2的解码部分21、编码部分22和解码部分23类似的结构。因此,解码部分54、编码部分55和解码部分56分别以与如图2所示的解码部分21、编码部分22和解码部分23的类似的方法对从介质特征反映部分53输出的已编码数据施加处理。结果,解码部分54输出第一已解码数据和第一附加信息作为学徒数据,解码部分56输出第二已解码数据和第二附加信息作为学徒数据。第一已解码数据和第一附加信息,第二已解码数据和第二附加信息,被作为学徒数据发送到抽头生成部分57和58。
在如图2所示的解码器2中,如上所述,可在解码部分23的后级提供类似于编码部分22和解码部分23的一套或多套装置。在此情形下,在如图6所示的学习装置的学徒数据生成部分51中,按照如同解码器2中的相同方法,需在解码部分54的后级提供类似于编码部分55和解码部分56的一套或多套装置。
抽头生成部分57按照如图3所示的类-分类自适应处理电路24中的抽头生成部分31相同的方法被配置。按照同抽头生成部分31相同的方法,抽头生成部分57从输入给它的作为学徒数据的第一解码数据、第一附加信息、第二解码数据和第二附加信息,生成预测抽头,并把该预测抽头发送到正规方程加法器60。
抽头生成部分58按照和图3所示的类-分类自适应处理电路24中的抽头生成部分32相同的方法被配置。按照同抽头生成部分32相同的方法,抽头生成部分58从输入给它的作为学徒数据的第一解码数据、第一附加信息、第二解码数据和第二附加信息,生成类抽头,并把该类抽头发送到类别分类部分59。
类别分类部分59按照与图3所示的类-分类自适应处理电路24中的类别分类部分33相同的方法,根据从抽头生成部分58发送的类抽头,执行分类,并把作为结果获得的类代码发送到正规方程加法器60。
正规方程加法器60接着把输入给它的主数据设置为目标主数据,并对为目标主数据所生成的从抽头生成部分57发送的预测抽头,和从分类部分59发送的类代码所表示每一类中的目标主数据进行加法运算。
具体地,正规方程加法器60为对应于从类别分类部分59发送的类代码的每一类,在学徒数据之间,使用预测抽头(学徒数据)执行相应的乘法(xinxim)和加法(∑)运算,以产生在表达式(8)中的矩阵A的元素。
正规方程加法器60也为对应于从类别分类部分59发送的类代码的每一类,在学徒数据目标主数据之间,使用预测抽头(学徒数据)和目标主数据,执行相应的乘法(xinyi)和加法(∑)运算,以产生在表达式(8)中的矢量V的元素。
正规方程加法器60为所有输入给它被设置为目标主数据的主数据,执行上述加法运算,并为每一类产生如表达式(8)所示的正规方程。
抽头系数判决电路61对在正规方程加法器60中为每一类所产生的方程求解,以获得每一类的抽头系数,并按在系数存储器62中的相应于每一类的地址发送它们。
在某些情况下,依靠学习数据的数量和内容,在正规方程加法器60中不可能获得用于获得抽头系数所需数目的正规方程。例如,对于这样的类,抽头系数判决电路61输出缺省的抽头系数。
系数存储器62为每一类存储从抽头系数判决电路61发送的抽头系数。
参照图7所示的流程图,接着将描述处理过程(由如图6所示的学习装置所执行的学习处理)。
学习数据被发送到学习装置。该学习数据被输入到学徒数据生成部分51和正规方程加法器60作为主数据。在步骤S11中,学徒数据生成部分51根据主数据生成学徒数据。
更具体地,在步骤S11中,编码部分52按与图1所示的编码器1相同方法编码主数据,并把作为结果而获得的已编码数据通过介质特征反映部分53发送到解码部分54。解码部分54对输入给它的已编码数据进行解码,并把作为结果而获得的第一已解码数据发送到编码部分55,也作为学徒数据发送到抽头生成部分57和58。解码部分54也把在对已编码数据进行解码以便于生成第一已解码数据的处理中所获得的第一附加信息作为学徒数据发送到抽头生成部分57和58。
此外,在步骤S11中,编码部分55对从解码部分54发送的第一已解码数据进行再编码,并把作为结果而获得的再编码数据发送到解码部分56。解码部分56对从编码部分55发送的再编码数据进行解码,并把作为结果而获得的第二已解码数据,和在对再编码数据进行解码以便于生成第二已解码数据的处理中获得的第二附加信息,作为学徒数据发送到抽头生成部分57和58。
接着,正规方程加法器60把输入给它的主数据设置为目标主数据,处理进行到步骤S12。抽头生成部分57和58根据输入给它的学徒数据,为目标主数据产生预测抽头和类抽头。由抽头生成部分57产生的预测抽头被发送到正规方程加法器60,并且,由抽头生成部分58产生的类抽头被发送到类别分类部分59。
接着,处理进行到步骤S13,类别分类部分59根据从抽头生成部分58发送的类抽头执行分类,并把作为结果而获得的类代码发送到正规方程加法器60。处理进行到步骤S14。
在步骤S14,正规方程加法器60把如上所述的对于表达式(8)中的矩阵A和矢量V的加法,应用到输入给它的目标主数据和从类别分类部分59发送的类代码所指的类中的所述学徒数据,该学徒数据组成从抽头生成部分57发送的预测抽头。处理进行到步骤S15。
在步骤S15,判断是否存在要被作为目标数据处理的主数据。当判断存在时,处理返回到步骤S11,并重复相同的处理,例如,下一个被发送的主数据被设置成新的目标主数据。
当在步骤S15中判断没有要被作为目标主数据处理的主数据时,换言之,例如,正规方程加法器60得到了每一类的正规方程,处理进行到步骤S16。抽头系数判决电路61对为每一类产生的正规方程求解,以获得每一类的抽头系数,并按在系数存储器62中的每一类对应的地址发送和存储它们。接着,结束处理。
如上所述,存储在系数存储器62中的每一类的抽头系数存储在如图3所示的系数存储器34中。
因此,由于存储在如图3所示的系数存储器34中的抽头系数是通过实行学习而获得的,这样当执行线性预测计算时获得的、和学习数据具有相同质量的数据的预测值的预测误差(在此,是方差),变得在统计意义上最小,所以,从如图3所示的预测部分35输出的最终已解码数据具有和学习数据相同的质量。
接下来,图8示出了当图1所示的数据转发系统通过CELP(包括各种类型的CELP诸如VSELP(矢量和激励线性预测)、PSI-CELP(调同步改进型CELP)和CS-ACELP(共轭结构代数CELP))方法编码音频信号(音频数据)并转发它时,所使用的图1所示的编码器的示例结构。如上所述,当图1所示的编码器1被如图8所示配置时,图2所示的编码部分22和图6所示的编码部分52和55也如图8所示配置。
例如,通过对模拟音频信号按8KHZ等的采样率进行采样以模数转换为数字音频信号,并且通过按预定数目的比特量化,而获得将要被编码的音频信号(包括声音和音乐片段),并把它发送到计算器71和LPC(线性预测系数)分析部分72。
LPC分析部分72例如,以每一个具有160个采样的帧为单位,把LPC分析应用于输入给它的被编码的音频信号,以获得P阶线性预测系数α1,α2,…αp。接着,LPC分析部分72把P阶线性预测系数αp(p=1,2,…p)作为它的元素的矢量发送到矢量量化部分73作为音频特征矢量。
矢量量化部分73存储码本,其中,把线性预测系数作为其元素的代码矢量和这些代码相关联,并且,该部分把矢量量化应用于从LPC分析部分72发送的特征矢量α,并把作为矢量量化的结果而获得的代码(如果必要的话,以后被称作A代码(A_code))发送到代码判别部分83。
此外,矢量量化部分73把与A代码对应的作为代码α′的元素的线性预测系数α1′,α2′,…αp′发送到音频综合滤波器74。
例如,音频综合滤波器74是一个IIR(无限冲击响应)类型数字滤波器,并且使用从矢量量化部分73发送的线性预测系数αp′(p=1,2,…p)作为IIR滤波器的抽头系数,并使用从计算器82发送的余数信号3作为输入信号来进行音频综合。
更具体地,在LPC分析部分72所实施的LPC分析中,假定在当前时刻n的音频信号(采样值)sn和过去的与该处相邻的P个采样值sn-1,sn-2,…,sn-p满足由下式表示的线性耦合,
sn1sn-12sn-2+…αpsn-p=en    (9)
当通过使用过去P个采样值sn-1,sn-2,…,sn-p由下式线性预测当前时刻n的采样值sn的预测值(线性预测值)sn′时,
sn′=-(α1sn-12sn-2+…αpsn-p)    (10)
将得到使实际采样值sn和线性预测值sn′之间的方差最小的线性预测系数αp
在表达式(9)中,{en}(…,en-1,en,en+1,…)表示具有均值0、预定值σ2的方差、而且彼此不相关的随机变量。
根据表达式(9),采样值sn可由如下表达式表示。
sn=en-(α1sn-12sn-2+…αpsn-p)    (11)
当Z变换被应用到此表达式时,如下表达式成立。
S=E/(1+α1z-12z-2+…αpz-p)    (12)
在表达式(12)中,S和E分别表示当Z变换被应用到表达式(11)中的sn和en时得到的值。
根据表达式(9)和(10),en能按如下表达式表示:
en=sn-sn′        (13)
并被称作实际采样值sn和线性预测值sn′之间的余数信号。
因此,根据表达式(12),当线性预测系数αp被用作IIR滤波器的抽头系数并且余数信号en被当作IIR滤波器的输入时,可以得到音频信号sn
如上所述,音频综合滤波器74使用从矢量量化部分73发送的线性预测系数αp′作为抽头系数,并使用从计算器82发送的余数信号e作为输入信号,来计算表达式(12)以获得音频信号(已综合的音频信号)ss。
音频综合滤波器74不使用作为由LPC分析部分72所实施的LPC分析的结果而获得的线性预测系数αp,而使用作为与线性预测系数αp的矢量量化结果而获得的代码相应的代码矢量的线性预测系数αp′,从音频综合滤波器74输出的已综合音频信号与LPC分析之前所获得的音频信号基本上不一样。
从音频综合滤波器74输出的已综合音频信号ss被发送到计算器71。计算器71从自音频综合滤波器74发送的已综合音频信号ss中,减去原始音频信号s(从每个已综合音频信号ss的采样中减去与已综合音频信号的采样对应的原始音频信号s的采样),并把余数发送到方差计算部分75。方差计算部分75计算从计算器71发送的余数的平方和(例如,平方和以LPC分析部分72应用LPC分析的帧为单位),并把作为结果而获得的方差发送到最小方差判决部分76。
最小方差判决部分76存储与从方差计算部分75输出的方差相关联的L代码(L_code)作为表示延迟的代码,G代码(G_code)作为表示增益的代码,和I代码(I_code)作为表示码字(激励码本)的代码,并且输出与从方差计算部分75输出的方差相关联的L代码(L_code)、G代码和I代码。该L代码被送到自适应码本存储部分77,该G代码被送到增益解码器78,和I代码被送到激励码本存储部分79。此外,该L代码(L_code)、G代码和I代码也被发送到代码判决部分。
例如,自适应码本存储部分77存储其中7比特L代码和预定的延迟时间(多个延迟)相关联的自适应码本,并将从计算器82发送的余数信号e延迟与从最小方差判决部分76发送的L代码相对应的延迟时间,并输出到计算器80。
由于自适应码本存储部分77将余数信号e延迟与L代码相对应的时间并输出它,该输出信号与把该延迟时间作为周期的周期信号类似。该信号主要作为驱动信号,用于在使用线性预测系数的声音综合中产生语声综合声音。
增益解码器78存储其中G代码和预定增益β和γ相关联的表,并且输出与从最小方差判决部分76发送的G代码相关联的增益β和γ。该增益β和γ分别被送到计算器80和81。增益β被称作长期滤波器状态输出增益,增益γ被称作激励码本增益。
例如,激励码本存储部分79存储其中9比特I代码和预定激励信号相关联的激励码本,并且向计算器81输出与从最小方差判决部分76发送的I代码相关联的激励信号。
例如,存储在激励码本中的激励信号和白噪声类似,并且主要用作在使用线性预测系数的声音综合中产生非语声综合声音的驱动信号。
计算器80用从增益解码器78输出的增益β和自适应码本存储部分77中的输出信号相乘,并把积1发送到计算器82。计算器81用从增益解码器78输出的增益γ和自适应码本存储部分77的输出信号相乘,并把积n发送到计算器82。计算器82把从计算器80发送的积1与从计算器81发送的积n相加,并把和作为余数信号e发送到音频综合滤波器74和自适应码本存储部分77。
在音频综合滤波器74中,如上所述从计算器82发送的余数信号e被把从矢量量化部分73发送的线性预测系数αp′当作抽头系数的IIR滤波器滤波,并且把作为结果而获得的已综合音频信号发送到计算器71。在计算器71和方差计算部分75中执行如上所述相同的处理,并且把作为结果而获得的方差发送到最小方差判决部分76。
最小方差判决部分76判决从方差计算部分75发送的方差是否最小。当最小方差判决部分76判决方差不是最小时,如上所述,它输出方差对应的L代码、G代码和I代码。接着,重复相同处理。
相反地,当最小方差判决部分76判决方差是最小时,它向代码判别部分83输出判决信号。代码判别部分83锁存从矢量量化部分73发送的A代码,并相继锁存从最小方差判决部分76发送的L代码、G代码和I代码。当代码判别部分83收到来自最小方差判决部分76的判决信号时,它把被锁存的A代码、L代码、G代码和I代码发送到通道编码器84。通道编码器84把从代码判别部分83发送的A代码、L代码、G代码和I代码进行多路复用,并把作为多路复用的结果而获得的代码数据作为已编码数据发送。
为了简化描述,假定在每个帧中都能得到A代码,L代码,G代码和I代码。也可能例如,一个帧被分成4个子帧,并且在每个子帧得到A代码、L代码、G代码和I代码。
图8中(同时也在以后描述的图9中),[k]被加到每个变量使之成为一个阵列变量。这个“k”表示帧的号。“k”的描述在本说明中将被适当省略。
图9示出了当图1所示的编码器1如图8所示配置时,所使用的图2所示的解码部分21的示例结构。如上所述,当图2所示的解码部分21被如图9所示配置时,图2所示的解码器23以及图6所示的解码器54和56也如图9所示配置。
从图8所示的编码器1输出的、作为已编码数据的代码数据,被通道解码器91接收。通道解码器91从代码数据分离L代码、G代码、I代码和A代码,并且把它们分别发送到自适应码本存储部分92、增益解码器93、激励码本存储部分94和滤波器系数解码器95。
自适应码本存储部分92、增益解码器93、激励码本存储部分94和计算器96至98按与自适应码本存储部分77、增益解码器78、激励码本存储部分79、计算器80至81相同的方式配置。参照图8如上所述的相同处理被执行,于是L代码、G代码、I代码被解码以产生余数信号e。余数信号3作为输入信号被发送到音频综合滤波器99,同时发送到自适应码本存储部分92。
滤波器系数解码器95存储如图8所示的矢量量化部分73中存储的相同的码本,并对A代码进行解码以产生线性预测系数αp′,并把它发送到音频综合滤波器99。
音频综合滤波器99按如图9所示的音频综合滤波器74相同的方式配置。音频综合滤波器99把从滤波器系数解码器95发送的线性预测系数αp′作为抽头系数,并把从计算器98发送的余数信号e作为输入信号计算表达式(12)以获得当最小方差判决部分76判决方差最小时所获得的已综合音频信号。已综合音频信号作为对已编码数据的解码结果(已解码数据)输出。
如上所述,附加信息输出部分100采集在对已编码数据进行解码以产生作为已解码数据的已综合音频信号的处理过程中所获得的信息,并输出部分或整个的信息作为附加信息。
更具体地,该附加信息输出部分100接收从通道解码器91输出的L代码、G代码、I代码和A代码,以及从增益解码器93输出的增益β和γ,从滤波器系数解码器95输出的线性预测系数αp,从计算器96输出的计算结果1,从计算器97输出的计算结果γ,以及从计算器98输出的余数信号e,以及其他,并输出部分或整个这些信息作为附加信息。
接下来,图10示出了当如图1所示的数据转发系统通过JPEG方法编码静止图像并转发它时所使用的、如图1所示的编码器1的示例结构。当图1所示的编码器1如图10所示一样配置时,图2所示的编码部分22和图6所示的编码部分52和55也按如图10所示的相同方法配置。
将被编码的图像数据被输入到分块电路111。分块电路111把输入给它的图像数据分成每个由64个像素、8×8像素组成的块。通过分块电路111获得的每个块被送到DCT电路112。该DCT电路112把处理对从分块电路111发送的每个块应用DCT(离散余弦变换),以变换为水平方向和垂直方向总共64个DCT系数,即一个DC(直流)成分和63个频率成分(AC(交流)成分)。在每个块中的64个DCT系数从DCT电路112发送到量化电路113。
量化电路113按预定的量化表对从DCT电路112发送的DCT系数进行量化,并把量化结果(如果必要,以后称作已量化DCT系数)和用于量化的量化表一起发送到熵编码电路114。
在量化电路113中使用的量化表总的来说有一些量化步骤,这样在考虑到人类视觉特征的情况下,含有比较重要的低频率的DCT系数被精细地量化,而含有不太重要的高频率的DCT系数被粗糙地量化。
例如,在JPEG编码中,被使用的量化表根据由用户指定的压缩率来决定。
熵编码电路114把诸如huffman编码的熵编码处理应用到从量化电路113发送的已量化DCT系数,并和从量化电路113发送的量化表相加,并输出作为结果而获得的已编码数据。
接着,图11示出了当图1所示的编码器1如图10所示配置时,所使用的图2所示的解码部分21的示例结构。
当图2所示的解码部分21如图11所示配置时,图2所示的解码部分23和图6所示的解码部分54和56也按如图11所示的相同方式配置。
已编码数据被输入到熵解码电路121。熵解码电路121把已编码数据分成熵编码的已量化DCT系数和量化表。此外,熵解码电路121把熵解码处理应用到熵编码的已量化DCT系数,并把作为结果而获得的已量化DCT系数和量化表一起发送到去量化(dequantization)电路122。去量化电路122按照也是从熵解码电路121发送的量化表,对从熵解码电路121发送的已量化DCT系数进行去量化处理,并把作为结果而获得的DCT系数发送到逆DCT电路123。该逆DCT电路123把逆DCT处理应用到从去量化电路122发送的DCT系数,并把作为结果而获得的8×8像素的已解码块发送到块切分电路124。块切分电路124把从逆DCT电路123发送的已解码块进行去块(unblock)处理以获得并输出已解码图像数据。
附加信息输出部分125采集在对已编码数据进行解码以便于产生如上所述的已解码图像数据的处理过程中获得的信息,并且输出部分和整个的信息作为附加信息。
更具体地,附加信息输出部分125接收从熵解码电路121输出的量化表和已量化DCT系数,从去量化电路122中输出的DCT系数和其他信息,并且输出这些信息片中的部分和整个的信息作为附加信息。
接下来,图12示出了,当图1所示的数据转发系统通过MPEG2方法编码运动图像并转发它时所使用的、图1所示的编码器1的示例结构。当图1所示的编码器1如图12所示配置时,图2所示的编码部分22和图6所示的编码部分52和55也按图12所示的相同方法配置。
组成基于MPEG编码的运动图像的帧(或字段)被相继发送到运动检测电路131和计算器132。
运动检测电路131对输入给它的帧,检测单元宏块(units macro-block)中的运动矢量,并把它发送到熵编码电路136和运动补偿电路140。
当I(帧内)图像被输入到计算器132时,计算器132原样把它发送到分块电路133,当P(预测)或B(双向预测)图像被输入到计算器132时,计算器132计算该图像和从运动补偿电路140发送的参考图像之间的差值,并把该差值送到分块电路133。
分块电路133把计算器132的输出分块(block)为每个具有8×8像素的像素块,并把它们发送到DCT电路134。DCT电路134把DCT处理应用到从分块电路133发送的像素块,并把作为结果而获得的DCT系数发送到量化电路135。量化电路135按照预定的量化表以块为单位对从DCT电路133发送的DCT系数进行量化,并把作为结果而获得的已量化DCT系数和被使用的量化表一起发送到熵编码电路136。熵编码电路136把熵编码应用到从量化电路135发送的已量化DCT系数,并把从运动检测电路131发送的运动矢量,从量化电路135发送的量化表和其他必要的信息(诸如在每个层中作为MPEG流的头信息)相加,并输出获得的已编码数据作为MPEG编码的结果。
在从量化电路135输出的已量化DCT系数中,由于I图像和P图像需要进行本地解码以便于被作为在以后将要进行编码的P图像和B图像的参考图像使用,所以,用于I图像和P图像的系数被送到熵编码电路136和去量化电路137。量化电路135中使用的量化表也被发送到去量化电路137。
去量化电路137根据从量化电路135发送的量化表对从量化电路135发送的已量化DCT系数进行去量化,以产生DCT系数并把它们发送到逆DCT电路138。该逆DCT电路138把逆DCT处理应用到从去量化电路137发送的DCT系数,并发送到计算器139。除了逆DCT电路138的输出以外,从运动补偿电路140输出的参考图像也被发送到计算器139。当逆DCT电路138的输出是用于P图像时,计算器139把该输出加到运动补偿电路140的输出以产生一个原始图像,并输出到运动补偿电路140。当逆DCT电路138的输出是用于I图像时,由于该输出是I图像的已解码图像,计算器139把它输出到运动补偿电路140。
运动补偿电路140基于从运动检测电路131发送的运动矢量,对从计算器139发送的本地已解码图像应用运动补偿,并把运动补偿后获得的图像作为参考图像发送到计算器132和139。
接下来,图13示出了当图1所示的编码器1如图12所示配置时所使用的、图2所示的解码部分21的示例结构。当解码部分21如图13所示配置时,图2所示的解码部分23和图6所示的解码部分54和56也如图13所示的相同方法配置。
编码数据被发送到熵解码电路151。熵解码电路151把熵解码应用到已编码数据,以获得已量化的DCT系数,并从已编码数据中分出运动矢量、量化表和其他必要信息。已量化DCT系数和量化表被发送到去量化电路152,以及运动矢量被发送到运动补偿电路156。
去量化电路152对从熵解码电路151发送的已量化DCT系数按照也是从熵解码电路151发送的量化表进行去量化处理,以获得DCT系数,并把它们发送到逆DCT电路153。逆DCT电路153把逆DCT处理应用到从去量化电路152发送的DCT系数,并输出到计算器154。计算器154除了从去量化电路153的输出外,接收按照从熵解码电路151发送的运动矢量进行运动补偿并从运动补偿电路156作为参考图像输出的已解码的I图像或P图像。当逆DCT电路153的输出是用于P图像或B图像时,计算器154把该输出加到运动补偿电路156的输出,以通过解码产生原始图像,并发送到块切分电路155。当逆DCT电路153的输出是用于I图像时,由于该输出是I图像的已解码图像,计算器154原样把它输出到块切分电路155。
块切分电路155把从计算器154发送的已解码图像以像素块为单位进行去块(unblock)处理,以获得已解码图像数据并输出。
运动补偿电路156接收从计算器154输出的已解码图像中的I图像和P图像,并基于从熵解码电路151发送的运动矢量应用运动补偿。接着,运动补偿电路156把运动补偿后得到的图像作为参考图像发送到计算器154。
附加信息输出部分157采集在对已编码数据进行解码以便于产生如上所述的已解码图像数据的处理中而获得的信息,并且输出部分和整个的信息作为附加信息。
更具体地,附加信息输出部分157接收从熵解码电路151输出的量化表、已量化DCT系数和运动矢量,以及从去量化电路122中输出的DCT系数。此外,附加信息输出部分157也接收当熵解码电路151把熵解码应用到已编码数据时,所获得的MPEG数据流的每层中被处理的信息(例如,图像类型,块位置信息,帧DCT模式/字段DCT模式)。附加信息输出部分157把这些信息片中的部分和整个的信息作为附加信息。
接下来,如上所述的系列处理不仅可以通过硬件实现而且可以通过软件实现。当该系列处理是通过软件实现时,组成软件的程序被安装在通用计算机或其他计算机中。
图14示出了依照一个实施例,安装执行如上所述的系列处理的程序的计算机的示例结构。
该程序可被事先记录在作为计算机内置的记录介质的硬盘205或ROM203中。
可替代地,该程序可被临时或永远被存储在(记录在)例如软盘、CD-ROM(光碟只读存储器)、DVD(数字多功能盘)、磁盘和半导体存储器的可移动记录介质211中。这样的可移动记录介质211可被提供作为所谓的软件包。
程序可以从如上所述的可移动记录介质211被安装在计算机中。此外,该程序也能从下载点(downloading site)通过无线从用于数字卫星广播的人造卫星,或通过有线从诸如因特网的网络转发到计算机;并且,该计算机能接收通过通信部分208的方式转发的程序,并安装在计算机内置的硬盘205中。
计算机包括一个CPU(中央处理单元)202。该CPU 202通过总线201连到输入输出接口210。当用户操作由键盘、鼠标、麦克风等组成的输入部分207以通过输入输出总线210输入命令时,CPU 202执行存储在ROM(只读存储器)203中的程序。可替换地,CPU 202把存储在硬盘205中的程序、通过卫星或网络被转发且由通信部分208接收并安装在硬盘205中的程序、或从安装在驱动器209的可移动记录介质211读取并且安装在硬盘205的程序,加载到RAM(随机访问存储器)204;并执行它。在该操作下,CPU202执行基于如上所述流程图的处理或由如上所述方框图所示的结构实行的处理。接着,例如,CPU 202通过输入输出接口202把处理结果输出到由LCD(液晶示出器)扬声器等组成的示出部分206;从通信部分208发送;或按要求记录在硬盘205中。
在本说明中,描述用于执行各种类型处理的程序的处理步骤没必要以如流程图描述的步骤的顺序的时间先后方式进行。也包括按并行方式实施或单独实施的处理。
此外,程序可以由一台计算机或由多个计算机以分布式处理方式执行。此外,程序可以被转发并由远端计算机执行。
在没有使用特定的编码/解码部件情况下,也能应用本发明。更具体地,在本实施例中,已经描述了CELP方法、JPEG方法、MPEG2方法。本发明也能应用各种类型的编码/解码部件,例如,M-JPEG(运动JPEG)方法、MPEG1方法、MPEG4方法、MP3(JPEG-1音频层3)方法以及ATRAC(自适应变换语声编码)方法。
在本实施例中,已编码数据按照与编码方法对应的解码部件被解码。已编码数据能通过分类自适应处理被解码。在分类自适应处理中,已编码数据能通过使用因执行学习而获得的抽头系数被解码,在此学习中,将被编码的数据被设置成主数据而通过对数据编码而获得的已编码数据设置成学徒数据。
此外,在本实施例中,用于高质量数据的预测值通过使用抽头系数由线性预测计算获得。该预测值也能通过更高阶、二价等预测计算获得。
此外,在本实施例中,解码器2中的分类自适应处理电路24事先存储了用于改善质量的抽头系数。该抽头系数可被包括在已解码数据中并能提供给解码器2。
此外,在本实施例中,除了第一已解码数据和第二已解码数据外,预测抽头从第一附加信息和第二附加信息产生。例如,该预测抽头也能仅从第一已解码数据和第二已解码数据中产生。相同方法也能用于类抽头。
工业适用性
根据本发明的第一数据处理装置、第一数据处理方法、第一程序和第一记录介质,已编码数据被解码,并且作为结果而获得的已解码数据被编码以输出再编码数据。与通过学习而获得抽头系数用于预定的预测计算的预测抽头被从已解码数据和再编码数据获得的信息中产生。预测抽头和抽头系数被用于执行预定的预测计算以获得一个预测值,该预测值与在学习中作为教师使用的主数据相对应。因此,例如,能获得质量充分改善的数据。
根据本发明的第二数据处理装置、第二数据处理方法、第二程序和第二录介质,通过对主数据进行编码接着进行解码而获得的已解码数据,和从对已解码数据进行编码而获得的再编码数据中获得的信息,从作为教师的主数据中产生,如作为学徒的学徒数据。接着,用于预测主数据的预测抽头从学徒数据中产生,并且执行学习,这样主数据的预测值的预测误差,能通过使用预测抽头和抽头系数以获得抽头系数来执行预定的预测计算而获得的。因此,例如,通过使用抽头系数执行预测计算,可以获得质量充分改善的数据。
根据本发明的第三数据处理装置、第三数据处理方法、第三程序和第三记录介质,通过对数据编码而获得的已编码数据被解码,作为结果而获得的已解码数据被编码以输出再编码数据。接着,用于分类的类抽头从已解码数据和再编码数据获得的信息中产生。根据类抽头执行分类。因此,数据能被适当地划分成几类。

Claims (29)

1.一种数据处理装置,用于对通过编码数据而获得的已编码数据进行处理,包括:
解码部分,用于对已编码数据进行解码并输出已解码数据;
抽头系数获取部分,用于获取抽头系数;
其特征在于,还包括:
再编码部分,用于对所述已解码数据进行编码并输出再编码数据;
再解码部分,用于对再编码数据进行解码并输出再解码数据;
预测抽头生成部分,用于根据所述已解码数据和再解码数据,产生用于与通过学习而获得的抽头系数进行预定的预测计算的预测抽头;和
预测部分,用于通过使用所述预测抽头和所述抽头系数进行预定的预测计算,获得对应于在学习中作为教师使用的主数据的预测值。
2.根据权利要求1所述的数据处理装置,其特征在于:
所述预测部分通过使用所述预测抽头和所述抽头系数进行线性预测计算获得所述预测值。
3.根据权利要求1所述的数据处理装置,其特征在于:
所述解码部分输出在对已编码数据进行解码处理过程中获得的信息作为第一附加信息,
所述再解码部分输出在对再编码数据进行解码处理过程中获得的信息作为第二附加信息,以及
所述预测抽头生成部分也通过使用所述第一附加信息和第二附加信息产生预测抽头。
4.根据权利要求1所述的数据处理装置,其特征在于,还包括:
类抽头生成部分,用于根据所述已解码数据和所述再解码数据,产生用于分类的类抽头用于分类信息;和
分类部分,用于根据所述类抽头进行分类,其特征在于:
所述抽头系数获取部分获取相应于从所述分类部分输出的类的抽头系数,以及
所述预测部分通过使用相应于从所述分类部分输出的类的抽头系数,获得所述预测值。
5.根据权利要求4所述的数据处理装置,其特征在于:
所述解码部分输出在对已编码数据进行解码处理过程中所获得的信息作为第一附加信息,
所述再解码部分输出在对再编码数据进行解码处理过程中获得的信息作为第二附加信息,以及
所述类抽头生成部分也通过使用该第一附加信息和第二附加信息而产生所述类抽头。
6.根据权利要求1所述的数据处理装置,其特征在于:
所述数据是图像数据。
7.根据权利要求6所述的数据处理装置,其特征在于:
所述已编码数据包括通过对所述图像数据至少进行正交变换而获得的数据。
8.根据权利要求1所述的数据处理装置,其特征在于:
所述数据是音频数据。
9.根据权利要求8所述的数据处理装置,其特征在于:
已编码数据包括至少一个相应于线性预测系数和余数信号的代码。
10.一种用于对编码数据而获得的已编码数据进行处理的数据处理方法,包括:
解码步骤,用于对已编码数据进行解码并输出已解码数据;
抽头系数获取步骤,用于获取抽头系数;
其特征在于,还包括:
再编码步骤,用于对已解码数据进行编码并输出再编码数据;
再解码步骤,用于对再编码数据进行解码并输出再解码数据;
预测抽头生成步骤,根据所述已解码数据和再解码数据,产生用于与通过学习而获得的抽头系数进行预定的预测计算的预测抽头;和
预测步骤,用于通过使用所述预测抽头和所述抽头系数进行预定的预测计算,获得对应于在学习中作为教师使用的主数据的预测值。
11.一种数据处理装置,用于学习预定的抽头系数,该预定的抽头系数用于处理编码数据而获得的已编码数据,其特征在于,包括:
学徒数据生成部分,用于根据作为教师的主数据、通过对主数据进行编码接着又进行解码而获得的已解码数据、和作为对通过对已解码数据进行编码而获得的再编码数据进行解码的结果而获得的再解码数据,生成作为学徒的学徒数据;
预测抽头生成部分,用于根据学徒数据,生成用于预测主数据的预测抽头;以及
学习部分,用于获得抽头系数和执行学习,这样通过使用所述预测抽头和抽头系数而执行预定的预测计算所获得的对主数据的预测值的预测误差在统计意义上最小。
12.根据权利要求11所述的数据处理装置,其特征在于:
所述学习部分执行学习,这样通过使用所述预测抽头和抽头系数执行线性预测计算而获得的对主数据的预测值的预测误差在统计意义上最小。
13.根据权利要求11所述的数据处理装置,其特征在于:
所述学徒数据生成部分也输出对编码主数据而获得的已编码数据进行解码的处理过程中所获得的信息,作为所述学徒数据。
14.根据权利要求11所述的数据处理装置,其特征在于:
所述学徒数据生成部分也输出对再编码数据进行解码的处理过程中所获得的信息,作为所述学徒数据。
15.根据权利要求11所述的数据处理装置,其特征在于,还包括:
类抽头生成部分,用于根据所述学徒数据生成用于执行分类的类抽头,用于分类信息;以及
分类部分,用于根据所述类抽头执行分类,以及其特征在于:
所述学习部分为从分类部分输出的每一类获得抽头系数。
16.根据权利要求15所述的数据处理装置,其特征在于:
所述学徒数据生成部分也输出对通过编码主数据而获得的已编码数据进行解码的处理过程中所获得的信息,作为所述学徒数据。
17.根据权利要求15所述的数据处理装置,其特征在于:
所述学徒数据生成部分也输出对再编码数据进行解码处理过程中所获得的信息,作为所述学徒数据。
18.根据权利要求11所述的数据处理装置,其特征在于:
所述主数据是图像数据。
19.根据权利要求18所述的数据处理装置,其特征在于:
所述学徒数据生成部分至少通过正交变换编码图像数据。
20.根据权利要求11所述的数据处理装置,其特征在于:
所述数据是音频数据。
21.根据权利要求20所述的数据处理装置,其特征在于:
所述学徒数据生成部分编码音频数据以生成至少一个相应于线性预测系数和余数信号的代码。
22.一种用于学习预定的抽头系数的数据处理方法,该抽头系数用于处理通过编码数据而获得的已编码数据,其特征在于,该方法包括:
学徒数据生成步骤,用于根据作为教师的主数据、通过对主数据进行编码接着又进行解码而获得的已解码数据、和作为对通过对已解码数据进行编码而获得的再编码数据进行解码的结果而获得的再解码数据,生成作为学徒的学徒数据;
预测抽头生成步骤,用于根据学徒数据生成用于预测主数据的预测抽头;以及
学习步骤,用于获得抽头系数和执行学习,这样通过使用所述预测抽头和抽头系数而执行预定的预测计算所获得的对主数据的预测值的预测误差在统计意义上最小。
23.一种用于执行分类而将信息分类的数据处理装置,包括:
解码部分,用于对编码数据而获得的已编码数据进行解码并输出已解码数据;
其特征在于,还包括:
再编码部分,用于编码已解码数据并输出再编码数据;
再解码部分,用于对再编码数据进行解码并输出再解码数据;
类抽头生成部分,用于根据所述已解码数据和再解码数据,生成用于分类的类抽头;以及
分类部分,用于根据所述类抽头执行分类。
24.根据权利要求23所述的数据处理装置,其特征在于:
所述解码部分输出对已编码数据进行解码处理过程中所获得的信息,作为第一附加信息,
所述再解码部分输出在对再编码数据进行解码处理过程中获得的信息作为第二附加信息,以及
所述类抽头生成部分,也通过使用该第一附加信息和第二附加信息而生成所述类抽头。
25.根据权利要求23所述的数据处理装置,其特征在于:
所述数据是图像数据。
26.根据权利要求25所述的数据处理装置,其特征在于:
所述已编码数据包括通过对所述图像数据至少进行正交变换而获得的数据。
27.根据权利要求23所述的数据处理装置,其特征在于:
所述数据是音频数据。
28.根据权利要求27所述的数据处理装置,其特征在于:
所述已编码数据包括至少一个与线性预测系数和余数信号对应的代码。
29.一种用于执行分类而对信息进行分类的数据处理方法,包括:
解码步骤,用于对通过编码数据而获得的已编码数据进行解码并输出已解码数据;
其特征在于,还包括:
再编码步骤,用于对已解码数据进行编码并输出再编码数据;
再解码步骤,用于对再编码数据进行解码并输出再解码数据;
类抽头生成步骤,用于根据所述已解码数据和再解码数据,生成用于分类的类抽头;以及
分类步骤,用于根据所述类抽头执行分类。
CNB028005414A 2001-01-25 2002-01-24 数据处理装置 Expired - Fee Related CN1269314C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP16869/01 2001-01-25
JP2001016869A JP4507046B2 (ja) 2001-01-25 2001-01-25 データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
JP16869/2001 2001-01-25

Publications (2)

Publication Number Publication Date
CN1457552A CN1457552A (zh) 2003-11-19
CN1269314C true CN1269314C (zh) 2006-08-09

Family

ID=18883164

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028005414A Expired - Fee Related CN1269314C (zh) 2001-01-25 2002-01-24 数据处理装置

Country Status (6)

Country Link
EP (1) EP1355428B1 (zh)
JP (1) JP4507046B2 (zh)
KR (1) KR100847179B1 (zh)
CN (1) CN1269314C (zh)
DE (1) DE60211854T2 (zh)
WO (1) WO2002060069A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4462823B2 (ja) * 2002-11-20 2010-05-12 ソニー株式会社 画像信号の処理装置および処理方法、それに使用される係数データの生成装置および生成方法、並びに各方法を実行するためのプログラム
US8140849B2 (en) 2004-07-02 2012-03-20 Microsoft Corporation Security for network coding file distribution
US7756051B2 (en) * 2004-07-02 2010-07-13 Microsoft Corporation Content distribution using network coding
TW200834537A (en) 2006-12-18 2008-08-16 Sony Corp Dynamic image signal processing device
TWI384437B (zh) 2006-12-18 2013-02-01 Sony Corp An image signal processing device, an image signal processing method, and a computer program product
JP2008178075A (ja) 2006-12-18 2008-07-31 Sony Corp 表示制御装置、表示制御方法、及びプログラム
JP4656452B2 (ja) * 2008-05-20 2011-03-23 ソニー株式会社 画像信号処理装置および画像信号処理方法、予測係数生成装置および予測係数生成処理方法、並びに各方法をコンピュータに実行させるためのプログラム
JP5326465B2 (ja) * 2008-09-26 2013-10-30 富士通株式会社 オーディオ復号方法、装置、及びプログラム
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3104439B2 (ja) * 1992-11-13 2000-10-30 ソニー株式会社 高能率符号化及び/又は復号化装置
JP3870428B2 (ja) * 1995-05-10 2007-01-17 ソニー株式会社 画像情報変換装置および方法並びに係数データ生成装置および方法
JP3627291B2 (ja) * 1995-05-25 2005-03-09 ソニー株式会社 ブロック歪み除去装置および方法
JP3334468B2 (ja) * 1995-12-28 2002-10-15 ソニー株式会社 量子化ビット数変換装置および方法
JP3946812B2 (ja) * 1997-05-12 2007-07-18 ソニー株式会社 オーディオ信号変換装置及びオーディオ信号変換方法
JP3787823B2 (ja) * 1997-07-31 2006-06-21 ソニー株式会社 画像処理装置および画像処理方法
JP4362895B2 (ja) * 1999-06-21 2009-11-11 ソニー株式会社 データ処理装置およびデータ処理方法、並びに記録媒体

Also Published As

Publication number Publication date
CN1457552A (zh) 2003-11-19
JP2002223167A (ja) 2002-08-09
DE60211854T2 (de) 2007-05-24
EP1355428B1 (en) 2006-05-31
WO2002060069A1 (en) 2002-08-01
KR20030062230A (ko) 2003-07-23
EP1355428A1 (en) 2003-10-22
JP4507046B2 (ja) 2010-07-21
DE60211854D1 (de) 2006-07-06
EP1355428A4 (en) 2005-09-07
KR100847179B1 (ko) 2008-07-17

Similar Documents

Publication Publication Date Title
CN1324558C (zh) 编码设备,解码设备以及音频数据分配系统
CN1252681C (zh) 一种码激励线性预测语音编码器的增益量化
CN1165892C (zh) 对宽带信号进行解码时的周期性增强的方法和设备
CN1595985A (zh) 内容提供装置和方法以及记录介质
CN1890711A (zh) 将数字信号编码成可扩缩比特流的方法和对可扩缩比特流解码的方法
CN1097396C (zh) 声音编码装置和方法
CN101076853A (zh) 宽带编码装置、宽带线谱对预测装置、频带可扩展编码装置以及宽带编码方法
CN1922886A (zh) 图像编码方法及其设备和其控制程序
CN101039422A (zh) 图像编码装置、图像解码装置及它们的控制方法
CN1488135A (zh) 线性预测编码参数的矢量量化装置
CN1685369A (zh) 视频编码的低复杂性和统一标准的变换
CN101052127A (zh) 信息处理装置、信息处理方法、记录介质和程序
CN1270541C (zh) 编码设备和方法
CN1269314C (zh) 数据处理装置
CN1947173A (zh) 分层编码装置及分层编码方法
CN1835548A (zh) 解码装置、解码方法及其程序产品
CN1767648A (zh) 信息处理设备和信息处理方法、记录介质、以及程序
CN1531824A (zh) 图象编码与解码方法以及对应的装置和应用
CN1222926C (zh) 语音编码方法及其装置
CN1306807C (zh) 数据转换装置及方法、学习设备及方法
CN1220376C (zh) 信息信号处理器和处理信息信号的方法
CN1154234C (zh) 图像编解码设备和方法以及图像数据发送方法
CN1275222C (zh) 信号编码装置和信号编码方法
CN101039406A (zh) 图像处理装置和方法、以及程序
CN1215460C (zh) 数据处理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060809

Termination date: 20140124