CN1462558A

CN1462558A - 编码装置,编码方法,程序和记录媒体

Info

Publication number: CN1462558A
Application number: CN01816111A
Authority: CN
Inventors: 片山崇; 西尾孝祐; 松本正治; 川村明久; 藤田刚史; 末吉雅弘; 阿部一任
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 2000-09-21
Filing date: 2001-09-20
Publication date: 2003-12-17
Anticipated expiration: 2021-09-20
Also published as: WO2002025953A2; EP1366626B1; EP1366626A2; US7106943B2; DE60120777D1; DE60120777T2; WO2002025953A3; KR100750523B1; KR20030032047A; CN1242624C; US20020034376A1

Abstract

本发明的编码装置包括：解码器，用于解码第一数据流信号，其中第一视频数据流和第一音频数据流被复合，所述第一视频数据流包括通过对第一视频信号进行编码而产生的第一视频数据流信息，所述第一音频数据流包括通过对第一音频信号进行编码而产生的第一音频数据流信息；和再编码器，用于根据解码的第一数据流信号，产生第二视频数据流和第二音频数据流，所述第二视频数据流包括位速率低于第一视频数据流信息的第二视频数据流信息，所述第二音频数据流包括位速率低于第一音频数据流信息的第二音频数据流信息，并复合第二视频数据流和第二音频数据流以产生第二数据流信号。

Description

编码装置，编码方法，程序和记录媒体

技术领域

本发明涉及一种用于改变编码信号的位速率的编码装置和编码方法，用于实现编码处理的程序，以及其上记录有这种程序的程序记录媒体。

背景技术

通常，由电视节目广播等传输的视频和音频信息被记录在如录像带等的磁带媒体上。在这种录像带上记录视频和音频信息的记录模式包括标准模式和长模式(long mode)。与标准模式相比，长模式允许视频和音频信号更长时间地被记录在具有相同长度的磁带上。为了在长模式下实现这种长时间的记录，视频信号被部分删除，以缩短将视频信息记录单位时间所需的磁带长度。

近些年来，用于实现数字卫星广播的专用技术已经被开发。用于这种广播的视频和音频信号被确定以数字编码信号的形式来传输。在数字卫星广播中，传输音频信号的信道数被设置为5.1，并且最大传输速率被标准化为320kbps。

在数字卫星广播中所传输的视频和音频信号量大于在传统的电视节目广播中所传输的视频和音频信号量。这就要求以具有更高密度的记录媒体作为用于在其上记录视频和音频信号的记录媒体，并且开发出作为一种光盘媒体的、利用了DVD-RAM的记录技术。然而，一个记录媒体，诸如一个光盘的总记录容量是固定的。因此，为了在具有固定记录容量的记录媒体上进行更长时间的记录，就需要将包含在编码信号中的信息记录到记录媒体上，使得记录的信息量小于传输时的信息量。

本发明的一个目的是提供一种对信号进行编码以使包括在编码信号中的信息能够被记录在具有小于传输时信息量的信息量的记录媒体上。

本发明的另外一个目的是提供一种实现这种编码处理的程序和其上记录有这样一个程序的记录媒体。

发明内容

根据本发明的一个方面，提供一种编码装置，包括：一个解码器，用于解码第一数据流信号，其中第一视频数据流和第一音频数据流被复合，所述第一视频数据流包括通过对第一视频信号进行编码而产生的第一视频数据流信息，所述第一音频数据流包括通过对第一音频信号进行编码而产生的第一音频数据流信息；和一个再编码器，用于根据解码的第一数据流信号产生第二视频数据流和第二音频数据流，其中所述第二视频数据流包括一个位速率低于第一视频数据流信息的第二视频数据流信息，所述第二音频数据流包括一个位速率低于第一音频数据流信息的第二音频数据流信息，并复合第二视频数据流和第二音频数据流以产生第二数据流信号。

在本发明的一个实施例中，第一音频数据流信息是通过执行将第一音频信号转变成一个频域信号从而量化频域信号的时频变换而获得的；再编码器计算音质模型信息，其表示由听觉特性屏蔽的第一音频信号的频带；以及再编码器根据音质模型信息把第一音频数据流信息转变成位速率低于第一音频数据流信息的第二音频数据流信息，以产生第二音频数据流。

在本发明的一个实施例中，执行频域信号的量化以通过尾数部分和指数部分表示出该频域信号各频带的频谱；每个指数部分是各个频带的每个频谱的比例因子；再编码器根据包括在量化后的频率信息中的各频带频谱的比例因子来计算音质模型信息；并且再编码器根据音质模型信息通过对分配给尾数部分的位数进行重新分配，把第一音频数据流信息转变成位速率低于第一音频数据流信息的第二音频数据流信息。

在本发明的一个实施例中，执行频域信号的量化以通过尾数部分和指数部分表示出频域信号各频带的频谱；每个指数部分是一个用于各频带的每个频谱的比例因子；再编码器根据通过对第一音频数据流信息去量化而产生的各频带的去量化频谱来计算音质模型信息；并且再编码器根据音质模型信息，通过重新分配分配给尾数部分的位数，把第一音频数据流信息转变成位速率低于第一音频数据流信息的第二音频数据流信息。

在本发明的一个实施例中，当执行下混频(downmix)处理以将第二音频数据流的信道数减到少于第一音频数据流的信道数时，再编码器根据已执行过下混频处理的各频带的去量化频谱来计算音质模型信息。

在本发明的一个实施例中，编码装置还包括：用于接收第一数据流信号的接收部分，控制部分，用于向再编码部分表示第二视频数据流信息和第二音频数据流信息的位速率，和记录部分，用于把第二数据流信号记录在记录媒体上。

根据本发明的另一方面，提供一种编码方法，包括：第一步，解码第一数据流信号，其中第一视频数据流和第一音频数据流被复合，所述第一视频数据流包括通过对第一视频信号进行编码而产生的第一视频数据流信息，所述第一音频数据流包括通过对第一音频信号进行编码而产生的第一音频数据流信息；和第二步，根据解码的第一数据流信号而产生第二视频数据流和第二音频数据流，其中所述第二视频数据流包括位速率低于第一视频数据流信息的第二视频数据流信息，所述第二音频数据流包括位速率低于第一音频数据流信息的第二音频数据流信息，并复合第二视频数据流和第二音频数据流以产生一个第二数据流信号，其中，第一音频数据流信息是通过执行将第一音频信号转变成频域信号以量化频域信号的时频变换而获得的；并且所述第二步包括：第三步，计算音质模型信息，该信息表示由听觉特性屏蔽的第一音频信号的频带；和第四步，根据音质模型信息，把第一音频数据流信息转变成位速率低于第一音频数据流信息的第二音频数据流信息，以产生第二音频数据流。

在本发明的一个实施例中，执行频域信号的量化处理以通过尾数部分和指数部分表示出该频域信号的各频带的频谱；每个指数部分是各频带每个频谱的比例因子；第三步，根据包括在量化信息中的各频带的频谱比例因子来计算音质模型信息；和在第四步，根据音质模型信息，通过重新分配分配给尾数部分的位数，把第一音频数据流信息转变成位速率低于第一音频数据流信息的第二音频数据流信息。

在本发明的一个实施例中，执行频域信号的量化处理以通过尾数部分和指数部分表示出该频域信号的各频带的频谱；每个指数部分是各频带的每个频谱的比例因子；在第三步，根据通过对第一音频数据流信息去量化而产生的各频带的去量化的频谱来计算音质模型信息；和在第四步，根据音质模型信息，通过重新分配分配给尾数部分的位数，把第一音频数据流信息转变成位速率低于第一音频数据流信息的第二音频数据流信息。

在本发明的一个实施例中，当执行下混频处理以将第二音频数据流的信道数减到少于第一音频数据流的信道数时，第三步根据已执行过下混频处理的各频带的去量化频谱来计算音质模型信息。

根据本发明的另一方面，提供一种使计算机执行编码处理的程序，所述编码处理包括：第一步，解码第一数据流信号，其中第一视频数据流和第一音频数据流被复合，所述第一视频数据流包括通过对第一视频信号进行编码而产生的第一视频数据流信息，所述第一音频数据流包括通过对第一音频信号进行编码而产生的第一音频数据流信息；和第二步，根据解码的第一数据流信号，产生第二视频数据流和第二音频数据流，所述第二视频数据流包括位速率低于第一视频数据流信息的第二视频数据流信息，所述第二音频数据流包括位速率低于第一音频数据流信息的第二音频数据流信息，并复合第二视频数据流和第二音频数据流以产生一个第二数据流信号，其中第一音频数据流信息是通过执行一个将第一音频信号转变成一个频域信号以量化该频域信号的时频变换而获得的；和第二步骤包括：第三步，计算音质模型信息，该信息表示由听觉特性屏蔽的第一音频信号的频带；和第四步，根据音质模型信息，把第一音频数据流信息转变成位速率低于第一音频数据流信息的第二音频数据流信息，以产生第二音频数据流。

在本发明的一个实施例中，执行频域信号的量化处理以通过尾数部分和指数部分表示出该频域信号的各频带的频谱；每个指数部分是各频带的每个频谱的比例因子；第三步根据包括在量化信息中的各频带的频谱比例因子来计算音质模型信息；且第四步根据音质模型信息，通过重新分配分配给尾数部分的位数，把第一音频数据流信息转变成位速率低于第一音频数据流信息的第二音频数据流信息。

在本发明的一个实施例中，执行频域信号的量化处理以通过尾数部分和指数部分表示出该频域信号的各频带的频谱；每个指数部分是各频带的每个频谱的比例因子；在第三步，根据通过对第一音频数据流信息去量化而产生的各频带的去量化的频谱来计算音质模型信息；且第四步根据音质模型信息，通过重新分配分配给尾数部分的位数，把第一音频数据流信息转变成位速率低于第一音频数据流信息的第二音频数据流信息。

根据本发明的另一方面，提供一种计算机可读记录媒体，其上记录有一个能够使计算机执行编码处理的程序，其中编码处理包括：第一步，解码第一数据流信号，其中第一视频数据流和第一音频数据流被复合，所述第一视频数据流包括通过对第一视频信号进行编码而产生的第一视频数据流信息，所述第一音频数据流包括通过对第一音频信号进行编码而产生的第一音频数据流信息；和第二步，根据解码的第一数据流信号，产生第二视频数据流和第二音频数据流，所述第二视频数据流包括位速率低于第一视频数据流信息的第二视频数据流信息，所述第二音频数据流包括位速率低于第一音频数据流信息的第二音频数据流信息，并复合第二视频数据流和第二音频数据流以产生一个第二数据流信号，其中第一音频数据流信息是通过执行一个将第一音频信号转变成一个频域信号以量化该频域信号的时频变换而获得的；和第二步骤包括：第三步，计算音质模型信息，该信息表示由听觉特性屏蔽的第一音频信号的频带；和第四步，根据音质模型信息，把第一音频数据流信息转变成位速率低于第一音频数据流信息的第二音频数据流信息，以产生第二音频数据流。

附图说明

图1是说明根据本发明的例子1的编码装置的示意图。

图2是说明根据本发明的例子1的编码装置的音频解码器和再编码器的示意图。

图3是说明根据本发明的例子1的另一种编码装置的示意图。

图4是说明根据本发明的例子2的编码装置的示意图。

图5A是说明根据本发明的例子2到4的音质模型计算部分的计算过程的曲线图。

图5B是说明根据本发明的例子2到4的音质模型计算部分的计算过程的曲线图。

图5C是说明根据本发明的例子2到4的音质模型计算部分的计算过程的曲线图。

图5D是说明根据本发明的例子2到4的音质模型计算部分的计算过程的曲线图。

图6是说明根据本发明的例子3的编码装置的示意图。

图7是说明根据本发明的例子4的编码装置的示意图。

图8是说明根据本发明的用于执行编码处理的计算机的示意图。

图9是说明程序数据流的结构的示意图。

图10是说明传输数据流的结构的示意图。

图11是说明根据本发明的编码装置1000的操作的流程图。

图12是说明音频编码器402的编码处理的流程图。

具体实施方式

(例子1)

图1说明了本发明的例子1的编码装置1000。

编码装置1000包括：第一接收部分101，用于接收由数字卫星广播、光盘等提供的编码数据流信号120；解码器106，用于解码由第一接收部分101接收到的数据流信号120，以产生一个系统信息信号121，一个视频信号127和一个音频信号126；再编码器102，用于把系统信息信号121，视频信号127和音频信号126编码成一个数据流信号122，该数据流信号包括一个位速率低于包括在数据流信号120中的视频和音频信息的视频和音频信息(即视频和音频数据流信息)；记录/再现部分104，用于把包括在数据流信号122中的视频、音频和系统信息记录在光盘等记录媒体107上；第二接收部分103，用于接收来自遥控器108等的无线信号125，并输出一个接收信号124；用于承载信号以发送和接收这些信号的总线109；和控制部分105，用于控制编码装置1000中的信号处理。

数据流信号120是例如从诸如数字卫星广播等的传播媒体发送的传输数据流(TS)信号、从记录媒体中读取的程序数据流(PS)信号等。TS信号的结构示例如图9所示，PS信号的结构示例如图10所示。

参考图9，PS信号包括多个数据包901，每个数据包包括数据包头911，系统头912，和PES(子包化基本数据流)子数据包913。数据包头911包括作为系统信息的数据包起始代码、SCR(系统基准时钟)等。系统头912包括作为系统信息的位速率信息和每个基本数据流的缓冲区大小等。每个PES子数据包913包括表示视频信息的视频基本数据流922或者表示音频信息的音频基本数据流923。PES子数据包头921被加到每个视频和音频基本数据流922和923中。PES子数据包头921包括用于识别基本数据流的代码、子数据包大小、作为时间标记的PTS(显示时间标记)和DTS(解码时间标记)和信道数信息等作为表示专用于一个编码信号的信息的系统信息。

参考图10，TS信号包括多个TS子数据包951。每个TS子数据包951包括至少一个匹配域962和963与收费负载(pay load)962’和963’。匹配域962和963包括一个作为系统信息的时间标记PCR(程序基准时钟)。每个收费负载962’和963’是视频或音频信息中的一个并对应于视频或音频基本数据流。一个子数据包头961被加到每个匹配域962，963和收费负载962’，963’中。子数据包头961包括作为系统信息的一个子数据包识别符、标记信息、信道数信息和位速率。

参考图1，在编码装置1000中，可以选择标准模式或者长模式作为在记录媒体107上记录信息的记录模式。与标准模式相比，长模式允许更长时间地记录信息。关于使用何种模式进行记录的指令通过例如遥控器108被发送到第二接收部分103。控制部分105接收从第二接收部分103输出的接收信号124并确定以标准模式还是以长模式进行记录。

当在标准模式下进行记录时，由第一接收部分101接收到的数据流信号120通过总线109被直接输出到记录/再现部分120，并且包括在数据流信号120中的视频、音频和系统信息通过激光束130被记录在记录媒体107上。

当在长模式下进行记录时，由第一接收部分101接收到的数据流信号120被输出到解码器106。

下面将参考图1，2和11描述例1的解码器106，音频解码器145和音频编码器142的相应结构以及编码装置1000的操作。

图1是说明编码装置1000的示意图，图2是说明编码装置1000的音频解码器145和音频编码器142的示意图，而图11是说明编码装置1000的操作的流程图。

参考图1，解码器106包括一个系统解码器144，一个音频解码器145和一个视频解码器146。数据流信号120首先被输入到系统解码器144。输入的数据流信号120被设置在系统解码器144中的多路信号分离器(未示出)分成一个视频基本数据流128，一个音频基本数据流129和一个系统信息数据流。系统解码器144解码系统信息数据流以产生系统信息信号121。视频基本数据流128被输入到视频解码器146。视频解码器146解码视频基本数据流128以产生一个视频信号127(图11中的S101)。使用本技术领域中熟知的技术在系统解码器144和视频解码器146中执行信号处理，在此省略详细的描述。音频基本数据流129被输入到音频解码器145。音频解码器145解码音频基本数据流129以产生一个音频信号126(图11中的S102)。

下面将参考图2描述音频解码器145中的解码处理过程。

参考图2，音频解码器145包括一个数据流输入部分201，一个数据流分析部分202，一个存储器部分203，一个去量化部分208，一个频率-时间转换部分211，和一个时域下混频部分212。

音频基本数据流129被输入到数据流输入部分201。数据流输入部分201可以充当一个缓冲器。数据流输入部分201输出音频基本数据流129作为一个包括音频信息的输入数据流信号221。通过把一个时间序列信号转变成一个频域信号，然后把该频域信号量化成一个尾数部分和一个比例因子以产生多个量化信号并对多个量化信号进行编码而生成该输入数据流信号221。

更具体地，输入数据流信号221包括数据流信息，该数据流信息是通过执行将一个音频信号转换成一个频域信号以量化该频域信号的时间-频率转换而获得的。执行频域信号的量化处理以通过尾数部分和指数部分表示出该频域信号的各频带的频谱。每个指数部分是各频带的每个频谱的比例因子。在此术语“频带”指的是一个比例因子带(scale factor band)、子带等，其为对应于一个比例因子的频率数据的一部分。

数据流分析部分202分析和解码从数据流输入部分201输出的输入数据流信号221来产生数据流信息信号222。该数据流信息信号222包括量化后的信息，诸如比例因子信息和位分配信息等，所述比例因子信息表示一个频谱的指数部分信息和频谱的尾数部分信息，而所述位分配信息表示分配给尾数部分的位数。数据流信息信号222被存储在存储器部分203中。去量化部分208从存储器部分203中读取该数据流信息信号222并对其去量化以按照信道排序的形式产生一个频谱信号223，每个信道进一步按照频带排序。频率-时间转换部分211把频谱信号223转变成一个时间轴数据信号224。

当在输入数据流信号221和输出数据流信号228中信道数不同时，执行下混频处理。在这种情况下，时域下混频部分212根据来自控制部分105的一个控制信号123来确定信道数。时域下混频部分212对时间轴数据信号224执行下混频处理使得时间轴数据信号224的信道数与输出数据流信号228的信道数相同。时间轴数据信号224通过下混频处理被转换成一个时域信号225。该时域信号225作为一个音频信号126被输出到再编码器102。

当输入数据流信号221的信道数等于输出数据流信号228的信道数时，不执行下混频处理并且时间轴数据信号224作为一个音频信号126被输出到再编码器102。

参考图1，再编码器102包括一个系统编码器141，一个音频编码器142和一个视频编码器143。系统信息信号121被输入到系统编码器141。音频信号126被输入到音频编码器142。视频信号127被输入到视频编码器143。

系统编码器141根据在解码器106和再编码器102中被改变的位速率、信道数信息、时间信息等，重新生成系统信息信号121。视频编码器143利用已知的视频压缩技术，诸如MPEG(运动图象专家组)标准，对视频信号127执行编码处理，以产生一个视频基本数据流151，该视频基本数据流151包括具有由控制信号123表示的位速率的视频信息(图11中的S103)。由控制信号123表示的位速率低于视频基本数据流128的位速率。通过对视频信号127执行编码处理来实现更低的位速率，产生压缩视频信息。视频基本数据流151被输出到系统编码器141。利用本技术领域中公知的技术，在系统编码器141和视频编码器143中执行信号处理，故其详细描述在此被省略。

参考图2，说明音频编码器142的编码处理。音频编码器142包括一个时间-频率转换部分213，一个量化部分214和一个编码部分205。时间-频率转换部分213接收作为音频信号126的时间轴数据信号224或时域信号225并把它转换成一个频谱信号226。量化部分214量化该频谱信号226以产生一个量化信号227。编码部分205对该量化信号227进行再编码，以使该量化信号227具有由来自控制部分105的控制信号所表示的位速率。由该控制信号123表示的位速率低于音频基本数据流129的位速率。为了实现更低的位速率，通过再编码量化信号227，生成一个包括低位速率音频信息的输出数据流信号228(图11中的S104)。该输出数据流信号228作为一个音频基本数据流150被输出到系统编码器141。

参考图1，音频基本数据流150、视频基本数据流151和系统信息信号通过包括在系统编码器141中的多路复用器(未示出)被组合成一个数据流信号122(图11中的S105)。数据流信号122的结构可以为参考图9和10如上所述的程序数据流或者传输数据流的形式。

数据流信号122通过总线109被输出到记录/再现部分104，包括在数据流信号122中的视频、音频和系统信息通过激光束130被记录在记录媒体107上。

记录/再现部分104接收由记录媒体107反射的激光束130并将其转换成数据流信号120(或数据流信号122)以再现记录在记录媒体107上的视频、音频和系统信息。解码器106解码从记录/再现部分104输出的数据流信号120(或者数据流信号122)以产生一个音频信号126和一个视频信号127。该音频信号126和视频信号127被输出到外部设备(未示出)并通过一个D/A转换器(未示出)被转换成一个模拟信号，然后被输出到一个显示器(未示出)和多个扬声器(未示出)中。

根据本发明，解码器106和再编码器102可被整合为一体。在这种情况下，例如，解码器106和再编码器102被安装在同一基板上。

可选择地，在如图3所示的编码装置1001的情况下，除了解码器106之外，解码器106’可以被设置在再编码器102中。解码器106’包括一个系统解码器，一个音频解码器和一个视频解码器，并对数据流信号120进行解码以产生视频信号127、音频信号126和系统信息信号121。由解码器106’产生的视频信号127、音频信号126和系统信息信号121被分别输入到视频编码器143、音频编码器142和系统编码器141中。数据流信号122是通过以和上述再编码器102相同的方式执行信号处理而产生的。编码装置1001的解码器106解码从记录/再现装置104输出的数据流信号120或者数据流信号122并将一个音频信号126’和一个视频信号127’输出到外部装置(未示出)。

如上所述，根据本发明的例子1，可以通过降低包括在数据流信号120中的音频信息的位速率，来减少要被记录在记录媒体107上的信息量。因此，与包括在数据流信号120中的信息被原样记录在记录媒体107上相比，可以在记录媒体107上记录对应于更长时间的信息。

此外，通过降低包括在数据流信号120中的视频信息和音频信息二者的位速率，与仅仅降低视频信息的位速率的情况相比，能够减少要被记录在记录媒体107上的信息量。因此，与仅仅降低视频信息的位速率的情况相比，能够在记录媒体107上记录对应于更长时间的信息。

此外，除了降低音频信息的位速率之外，通过对通过解码而产生的音频信号执行下混频处理，能够进一步减少包括在音频信号中的信息量，从而允许在记录媒体107上记录对应于更长时间的信息。

(例2)

下面将参考图4，5A-5D，和12描述本发明的例子2。

图4说明了根据本发明的例子2的解码器401和音频编码器402的相应结构，图5A-5D是说明音质模型计算部分的计算过程的曲线图，图12是说明音频编码器402的编码处理的流程图。

参考图4，解码器401和音频编码器402代替图2中的音频解码器145和音频编码器142而被设置在图1所示的编码装置1000中。在本发明的例2中，输入数据流的信道数与输出数据流的信道数相同。系统解码器144，视频解码器146，系统编码器141和视频编码器143以类似于例1的方式进行操作。

音频解码器401包括一个数据流输入部分201和一个数据流分析部分202。以与例1相似的方式，数据流输入部分201可以充当一个缓冲器。数据流输入部分201输出音频基本数据流129作为一个包括音频信息的输入数据流信号221。数据流分析部分202分析和解码从数据流部分201输出的输入数据流信号221以产生一个数据流信息信号222。该数据流信息信号222包括比例因子信息和位分配信息等，所述比例因子信息表示频谱的指数部分信息和频谱的尾数部分信息，所述位分配信息表示分配给尾数部分的位数。数据流信息信号222作为音频信号126(图1)被输出到音频编码器402。

参照图4，描述由音频编码器402执行的编码处理。音频编码器402包括一个存储器部分403，一个音质模型计算部分404和一个编码部分405。作为音频信号126被输入到音频编码器402中的数据流信息信号222被存储在存储器部分403中。

音质模型计算部分404从存储器部分403中读取数据流信息信号222并利用包括在数据流信息信号222中的一个音频信号计算音质模型。通常，利用频谱信息来计算音质模型。然而，在例2中，利用比例因子信息代替频谱信息来计算音质模型(图12的S201和S202)。通过使用比例因子信息来计算音质模型，能够比使用频谱时更快地执行信号处理。

下面将参考图5A和5D描述依据包括在一个音频信号中的数据流信息来计算音质模型的过程。图5A说明了在各频带f₁，f₂，f₃，f₄，f₅和f₆具有a₁，a₂，a₃，a₄，a₅和a₆级的频谱信号。由于频谱信号的级别a₁，a₃和a₅在频谱信号的级别a₁到a₆中是相对较高的级别，所以形成了图5B中所示的听觉屏蔽(audibility masking)曲线A。普通听众的最低可听阈值如图5C中的曲线B所示。通过组合听觉屏蔽曲线A和最低可听阈值，产生了图5D所示的完整屏蔽曲线C。整个屏蔽曲线C穿过频带f₁，f₂，f₃，f₄，f₅和f₆的屏蔽阈值。具有级别为a₂，a₄和a₆等于或小于整个屏蔽曲线C(即等于或者小于屏蔽阈值)的频谱信号不能被听众听到。因此，即使具有级a₂，a₄和a₆的频谱信号被删除，其余的频谱信号也能被听众听到。因此，参考图4，音质模型计算部分404向编码部分405输出一个包括音质模型信息的音质模型信息信号421，该音质模型信息表示仅输出频谱信号a₁，a₃和a₅就足以了。

在音质模型计算部分404中，包括在音质模型信息信号421中的频谱信号被转换成一个如下面公式所示的信号：

F*x∧(α*S)其中F是尾数部分信息，S是比例因子，x是指数部分的底数，α是一个常数，∧是乘幂符号。

根据例2的音质模型计算部分404根据对应于包括在数据流信息信号222中的a₁，a₃和a₅级频谱信号的比例因子S₁，S₃和S₅的值来计算整个屏蔽曲线C作为音质模型。包括这种音质模型信息的音质模型信息信号421被输出到编码部分405。

编码部分405依据整个屏蔽曲线C确定分配给每个频带的位。可以使用任何方法来执行位的分配。例如，根据SMR(频谱屏蔽比)和一个位速率来确定对每个频率的位分配，所述SMR是每个频谱信号与整个屏蔽曲线C的比率。编码部分405根据所确定的位分配估计频谱信号的尾数部分信息F的位数。由位速率信息指定的位速率可以是取自一种编码方法定义的范围内的任何值。编码部分405根据计算出的音质模型和由从控制部分105(图1)输出的控制信号123表示的位速率信息，对数据流信息信号222进行再编码，使得平均位速率是一个指定的位速率，从而产生一个输出数据流信号422(图12的S204)。由控制信号123表示的位速率低于音频数据流信号129的位速率。为了具有这种低位速率，通过再编码数据流信息信号222，产生一个包括低位速率音频信息的输出数据流信号422作为音频数据流信号150。

以与例1相似的方式，音频基本数据流150、视频基本数据流151和系统信息信号通过包括在系统编码器141内的多路复合器被组合成数据流信号122。

参照图1和4，数据流信号122通过总线109被输出到记录/再现部分104，包括在数据流信号122内的视频和音频信息通过激光束130被记录在记录媒体107上。

在例2中，不执行诸如频率-时间转换、时间-频率转换、去量化和量化等的信号处理。因此，可以省略图2所示的频率-时间转换部分211、时间-频率转换部分213、去量化部分208、量化部分214和存储器部分203。包括在输入数据流信号221内的音频信息和包括在输出数据流信号422内的音频信息是通过对一个频域信号进行编码获得的信息，而且它们仅在位速率方面是不同的。因此，在它们之间不会发生听觉上的暂时延迟和相移。

如上所述，根据例2的音频解码器401和音频编码器402，编码部分405在不执行去量化处理的情况下再编码输入数据流信息。与例1中使用音频解码器145和音频编码器142的情况相比，减少了要被处理的信号量和信号处理所需的存储容量。此外，能够产生具有低位速率的编码信号而不发生暂时延迟和相移。

本发明的例2实现了用于执行音频信息编码处理的编码装置400，其包括音频解码器401和音频编码器402。音频数据流信号129被输入到编码装置400并且由解码器401和音频编码器402以上述方式被处理。因此，产生了输出数据流信号422，其包括位速率低于包括在音频数据流信号129中的音频信息的位速率的音频信息。该输出数据流信号422从编码装置400作为音频数据流信号150被输出。

(例3)

图6说明了根据本发明的例3的音频解码器401和音频编码器602的相应结构。音频解码器401和音频编码器602代替图2中的音频解码器145和音频编码器142被设置在图1所示的编码装置1000中。在本发明的例3中，一个输入数据流的信道数与一个输出数据流的信道数相同。系统解码器144、视频解码器146、系统编码器141和视频编码器143以与例1相似的方式进行操作。

参照图1和6，如例2所述，音频解码器401把数据流信息信号222作为音频信号126输出到音频编码器602。

下面将参照图6和12描述由音频编码器602执行的编码处理。音频编码器602包括存储器部分403，去量化部分603，音质模型计算部分404和编码部分405。输入到音频编码器602中的数据流信息信号222被存储在存储器部分403中。

去量化部分603从存储器部分403接收包括在数据流信息信号222内的比例因子信息和尾数部分信息，并对该信息执行去量化处理以为每个信道产生一个频谱信号620。音质模型计算部分604利用各信道每个频带的频谱信号620来计算音质模型(图12的S201和S202)。在本发明的例3中，根据频谱信号620本身产生图5D所显示的整个屏蔽曲线C。与根据例2的音质模型相比，根据此过程产生的音质模型更为精确。音质模型计算部分604把包括音质模型信息的音质模型信息信号621输出到编码部分605。

编码部分605根据音质模型信息和由控制信号123表示的位速率信息对数据流信息信号222进行再编码，使得平均位速率是一个指定的位速率，借此产生一个输出数据流信号622(图12的S204)。由控制信号123表示的位速率可以是取自利用一种编码方法所定义的范围内的任何值。由控制信号123表示的位速率低于音频数据流信号129的位速率。为了实现这种位速率或者更低的位速率，通过对数据流信息信号222进行再编码，产生一个包括压缩音频信息的输出数据流信号622作为音频基本数据流150。

参照图1和6，数据流信号122通过总线109被输出到记录/再现部分104，包括在数据流信号122内的视频、音频和系统信息通过激光束130被记录在记录媒体107上。

在例3的编码装置600中，没有执行诸如频率-时间转换、时间-频率转换和量化等信号处理。因此，省略了图2所示的频率-时间转换部分211、时间-频率转换部分213、量化部分214和存储器部分203。包括在输入数据流信号221内的音频信息和包括在输出数据流信号622内的音频信息是通过对频域信号进行编码而获得的，并且它们仅在位速率方面上是不同的。因此，在它们之间不会发生听觉暂时延迟和相移。

如上所述，根据例3的音频解码器401和音频编码器602，编码部分605对未执行去量化处理的输入数据流信息222进行再编码。与例1中使用音频解码器145和音频编码器142的情况相比，减少了要被处理的信号量和信号处理所需的存储容量。此外，能够产生具有低位速率且不发生暂时延迟和相移的输出数据流信号622。

本发明的例3实现了用于执行音频信息编码处理的编码装置600，其包括音频解码器401和音频编码器602。音频数据流信号129被输入到编码装置600并且以上述方式由音频解码器401和音频编码器602处理。因此，产生了输出数据流信号622，其包括位速率低于包括在音频数据流信号129中的音频信息的音频信息。输出数据流信号622从编码装置600作为音频数据流信号150被输出。

(例4)

图7说明了根据本发明的例4的音频解码器401和音频编码器702的相应结构。音频解码器401和音频编码器702代替图2中的音频解码器145和音频编码器142被设置在图1所示的编码装置1000中。在本发明的例4中，输入数据流和输出数据流中的信道数可以是不同的。系统解码器144、视频解码器146、系统编码器141和视频编码器143以与例1相似的方式操作。

如例2所述，音频解码器401把数据流信息信号222作为音频信号126输出到音频编码器102。

下面参照图7和12描述由音频编码器702执行的编码处理。音频编码器702包括存储器部分403，去量化部分703，音质模型计算部分704和编码部分705。输入到音频编码器702的数据流信息信号222被存储在存储器部分403中。

去量化部分703从存储器部分403接收包括在数据流信息信号222内的比例因子信息和尾数部分信息，并对该信息执行去量化处理以为每个信道产生一个频谱信号720。

下混频部分706对去量化部分703所产生的频谱信号720进行下混频，以使频谱信号720的信道数减少到由控制信号123表示的输出信道数。这里，例如一个输入数据流由L，R，C，SL和SR 5个信道形成，并且一个输出数据流是由例如L和R2个信道形成。在这种情况下，下混频处理可通过下面的表达式(1)和(2)表示：

L＝β(L+CMIX*C+SMIX*SL) ……表达式(1)

R＝β(R+CMIX*C+SMIX*SR) ……表达式(2)

这里，β是一个校正系数，需要将其设置为一个不使L和R溢出的值。CMIX和SMIX是任意系数。用于下混频处理的表达式不限于表达式(1)和(2)。可以利用不同于这些表达式的其它表达式来执行该下混频处理。

为了使信道数与频谱的输出信道数相同，在以上述方式对输入数据流的频谱下混频后，音质模型计算部分704利用每个频带的下混频频谱信号722来计算音质模型(图12的S201和S203)。音质模型计算部分704根据频谱信号722本身产生图5D显示的整个屏蔽曲线C。与根据例2的音质模型相比，利用这个过程产生的音质模型更为精确。音质模型计算部分704把包括音质模型信息的音质模型信息信号721输出到编码部分705。

编码部分705基于由控制信号123表示的音质模型信息和位速率信息对数据流信息信号222进行再编码，以使平均位速率是一个指定的位速率，借此产生一个输出数据流信号723(图12的S204)。由控制信号123表示的位速率可以是取自利用一种编码方法所定义的范围内的任何值。由控制信号123表示的位速率低于音频数据流信号129的位速率。为了实现这种位速率或者较低的位速率，通过对数据流信息信号222再编码，生成包括压缩音频信息的输出数据流信号723作为音频基本数据流150。

参照图1和7，数据流信号122通过总线109被输出到记录/再现部分104，包括在数据流信号122内的视频、音频和系统信息通过激光束130被记录在记录媒体107上。

在例4的编码装置700中，没有执行诸如频率-时间转换、时间-频率转换和量化等信号处理。因此，省略了图2所示的频率-时间转换部分211、时间-频率转换部分213、量化部分214和存储器部分203。包括在输入数据流信号221内的音频信息和包括在输出数据流信号723内的音频信息是通过对频域信号进行编码而获得的，并且它们仅在位速率方面上是不同的。因此，在它们之间不会发生听觉暂时延迟和相移。

如上所述，根据例4的音频解码器401和音频编码器702，编码部分705对从下混频部分706输出的频谱信号722进行再编码。与例1中使用音频解码器145和音频编码器142的情况相比，减少了要被处理的信号量和信号处理所需的存储容量。此外，能够产生具有减少的信道数和低位速率、且不会引起暂时延迟和相移的输出数据流信号723。

本发明的例4实现了用于执行音频信息编码处理的编码装置700，其包括音频解码器401和音频编码器702。音频数据流信号129被输入到编码装置700并且以上述方式通过音频解码器401和音频编码器702被处理。因此，产生了输出数据流信号723，其包括位速率低于包括在音频数据流信号129中的音频信息的音频信息。输出数据流信号723从编码装置700作为音频数据流信号150被输出。

上述根据本发明的例1到4的编码处理可以以程序的形式被记录在记录媒体上。作为记录媒体，可以使用任何类型的计算机可读记录媒体，例如软盘或者CD-ROM。通过把从记录媒体上读取的编码程序安装在任何计算机上，其能输入和输出诸如数据流信号的数字信号，计算机能起到编码处理装置的功能。在这种情况下，编码处理可以通过编码处理装置被执行，其可以与计算机整合在一起或者连到计算机上。计算机可以执行软件上的至少一部分编码处理。

图8显示了执行这种编码处理的一个计算机例子。计算机90包括CPU 91，用来读取存储在记录盘96上并使计算机90执行编码处理的程序的盘驱动装置92，存储器93，用来存储由盘驱动装置92读取的程序，输入/输出部分94，用来输入/输出通过对数据流信号120和音频数据流信号129进行编码而产生的数据流信号97，以及总线95。在计算机90中，通过CPU 91和存储器93执行根据例1到4的编码处理。存储器93可以是硬盘等。由计算机90产生的数据流信号97可以被存储在存储器93中或者可以被记录在安装在盘驱动装置92上的记录媒体中。

程序可以由诸如记录盘96的记录媒体提供或者可以由通过因特网的数据分配提供。

工业应用性

根据本发明，通过对数据流信号进行解码而产生的视频信号和音频信号被编码，以产生一个编码信号，该编码信号包括位速率低于包括在数据流信号中的视频和音频信息的视频和音频信息。通过降低视频信号和音频信号的位速率，与仅仅降低视频信息的位速率的情况相比，可以减少要被记录在记录媒体上的信息量。因此，与仅仅降低视频信息的位速率的情况相比，可以在记录媒体上记录对应于更长时间的信息。

根据本发明，根据一个音质模型对通过对数据流信号进行解码而产生的数据流信息信号进行编码，以产生一个编码信号，该编码信号包括位速率低于包括在数据流信号中的音频信息的音频信息。在这种情况下，在没有执行诸如频率-时间转换过程、时间-频率转换、去量化和量化的过程的情况下，通过再编码数据流信息信号产生编码信号。用这种方式，除了降低音频信息的位速率之外，还可以通过在没有把输入数据流信号转换成时域信号的情况下直接编码数据流信息信号并对该转换信号进行再编码，来减少要处理的信号量和编码处理所需的存储容量。因此，可以在固定记录容量的记录媒体上记录用于更大数量程序的大量内容或音频信息。包括在输入数据流信号内的音频信息和包括在输出数据流信号内的音频信息是通过对频域信号进行编码而获得的，并且它们仅在位速率方面上是不同的。因此，在它们之间不会发生听觉暂时延迟和相移。因此，能够产生具有低位速率且不会发生暂时延迟和相移的输出数据流信号。

根据本发明，利用通过对数据流信息信号去量化产生的频谱信号来计算音质模型，该数据流信息信号是通过解码数据流信号产生的。根据计算出的音质模型，对数据流信息信号进行编码以产生一个包括音频信息的编码信号，该音频信息具有比包括在数据流信号中的音频信息低的位速率。用这种方式，除了降低音频信息的位速率以外，通过使用去量化的频谱信号计算音质模型，还能获得更高精度的音质模型。此外，在不执行诸如频率-时间转换，时间-频率转换，和量化等过程的情况下，可以通过对输入数据流信息进行再编码来产生编码信号。这就减少了要被处理的信号量和编码处理所需的存储容量。

根据本发明，对通过解码数据流信号而产生的数据流信息信号进行去量化和下混频，以产生一个频谱信号。利用所产生的频谱信号来计算音质模型。根据计算出的音质模型对数据流信息信号进行编码，以产生一个编码信号，该编码信号包括位速率低于包括在数据流信号中的音频信息的音频信息。用这种方式，除了降低音频信息的位速率之外，通过对该数据流信息信号进行下混频，可以减少包括在编码信号内的信息量。

对本技术领域中的技术人员而言，在不偏离本发明的范围和精神的前提下，各种修改是明显和易于实现的。因此本发明的保护范围不应仅限于说明书，还应包括后附的权利要求。

Claims

1.一种编码装置，包括：解码器，用于解码第一数据流信号，其中第一视频数据流和第一音频数据流被复合，所述第一视频数据流包括通过对第一视频信号进行编码而产生的第一视频数据流信息，所述第一音频数据流包括通过对第一音频信号进行编码而产生的第一音频数据流信息；和

再编码器，用于根据解码的第一数据流信号，产生第二视频数据流和第二音频数据流，所述第二视频数据流包括位速率低于第一视频数据流信息的第二视频数据流信息，所述第二音频数据流包括位速率低于第一音频数据流信息的第二音频数据流信息，并复合第二视频数据流和第二音频数据流以产生第二数据流信号。

2.根据权利要求1的编码装置，其中：

所述第一音频数据流信息是通过执行将第一音频信号转变成一个频域信号以量化该频域信号的时间-频率转换而获得的；

所述再编码器计算音质模型信息，该信息表示由听觉特性屏蔽的第一音频信号的频带；和

所述再编码器根据该音质模型信息把第一音频数据流信息转变成位速率低于第一音频数据流信息的第二音频数据流信息，从而产生第二音频数据流。

3.根据权利要求2的编码装置，其中：

执行频域信号的量化处理以通过尾数部分和指数部分表示出该频域信号的各频带的频谱；

每个指数部分是各频带的每个频谱的比例因子；

再编码器基于包括在量化的频率信息中的用于各个频带的频谱的比例因子计算音质模型信息；和

根据音质模型信息，通过重新分配分配给尾数部分的位数，再编码器把第一音频数据流信息转变成位速率低于第一音频数据流信息的第二音频数据流信息。

4.根据权利要求2的编码装置，其中：

每个指数部分是各频带的每个频谱的比例因子；

再编码器根据通过对第一音频数据流信息去量化而产生的各频带的去量化频谱来计算音质模型信息；和

5.根据权利要求4的编码装置，其中，当执行下混频处理以将第二音频数据流的信道数减到少于第一音频数据流的信道数时，再编码器根据已经执行过下混频处理的各频带的去量化频谱来计算音质模型信息。

6.根据权利要求1的编码装置，还包括：

用于接收第一数据流信号的接收部分，

控制部分，用于向再编码器表示第二视频数据流信息和第二音频数据流信息的位速率，和

记录部分，用于把第二数据流信号记录在记录媒体上。

7.一种编码方法，包括：

第一步，解码第一数据流信号，其中第一视频数据流和第一音频数据流被复合，所述第一视频数据流包括通过对第一视频信号进行编码而产生的第一视频数据流信息，所述第一音频数据流包括通过对第一音频信号进行编码而产生的第一音频数据流信息；和

第二步，根据解码的第一数据流信号，产生第二视频数据流和第二音频数据流，所述第二视频数据流包括位速率低于第一视频数据流信息的第二视频数据流信息，所述第二音频数据流包括位速率低于第一音频数据流信息的第二音频数据流信息，并复合第二视频数据流和第二音频数据流以产生第二数据流信号，其中，

所述第一音频数据流信息是通过执行将第一音频信号转变成一个频域信号以量化该频域信号的时间-频率转换而获得的；并且

第二步包括：

第三步，计算音质模型信息，该信息表示由听觉特性屏蔽的第一音频信号的频带；和

第四步，根据音质模型信息，把第一音频数据流信息转变成位速率低于第一音频数据流信息的第二音频数据流信息，以产生第二音频数据流。

8.根据权利要求7的编码方法，其中，

每个指数部分是各频带的每个频谱的比例因子；

在第三步中，根据包括在量化信息中的各频带的频谱比例因子来计算音质模型信息；和

在第四步中，根据音质模型信息，通过重新分配分配给尾数部分的位数，把第一音频数据流信息转变成位速率低于第一音频数据流信息的第二音频数据流信息。

9.根据权利要求7的编码方法，其中：

每个指数部分是各频带的每个频谱的比例因子；

在第三步中，根据通过对第一音频数据流信息去量化而产生的各频带的去量化频谱来计算音质模型信息；且

10.根据权利要求9的编码方法，其中：

当执行下混频处理以将第二音频数据流的信道数减到少于第一音频数据流的信道数时，在第三步中根据已执行过下混频处理的各频带的去量化频谱来计算音质模型信息。

11.一种使计算机执行编码处理的程序，该编码处理包括：

所述第一音频数据流信息是通过执行将第一音频信号转变成一个频域信号以量化该频域信号的时间-频率转换而获得的；和

第二步包括：

12.根据权利要求11的程序，其中：

每个指数部分是各频带的每个频谱的比例因子；

13.根据权利要求11的程序，其中：

每个指数部分是各频带的每个频谱的比例因子；

在第三步，根据通过对第一音频数据流信息去量化而产生的各频带的去量化的频谱来计算音质模型信息；和

在第四步，根据音质模型信息，通过重新分配分配给尾数部分的位数，把第一音频数据流信息转变成位速率低于第一音频数据流信息的第二音频数据流信息。

14.根据权利要求13的程序，其中当执行下混频处理以将第二音频数据流的信道数减到少于第一音频数据流的信道数时，在第三步中根据已执行过下混频处理的各频带的去量化频谱来计算音质模型信息。

15.一种计算机可读记录媒体，其上记录有一个能够使计算机执行编码处理的程序，其中编码处理包括：

第二步包括：

16.根据权利要求15的计算机可读媒体，其中：

每个指数部分是各频带的每个频谱的比例因子；

17.根据权利要求15的计算机可读媒体，其中：

每个指数部分是各频带的每个频谱的比例因子；

在第三步，根据通过对第一音频数据流信息去量化而产生的各频带的去量化频谱来计算音质模型信息；和

18.根据权利要求17的计算机可读媒体，其中当执行下混频处理以将第二音频数据流的信道数减到少于第一音频数据流的信道数时，在第三步中根据已执行过下混频处理的各频带的去量化频谱来计算音质模型信息。