CN102804263A - 编码方法、解码方法、利用了这些方法的装置、程序 - Google Patents

编码方法、解码方法、利用了这些方法的装置、程序 Download PDF

Info

Publication number
CN102804263A
CN102804263A CN2010800265515A CN201080026551A CN102804263A CN 102804263 A CN102804263 A CN 102804263A CN 2010800265515 A CN2010800265515 A CN 2010800265515A CN 201080026551 A CN201080026551 A CN 201080026551A CN 102804263 A CN102804263 A CN 102804263A
Authority
CN
China
Prior art keywords
signal
train
string
duplicate
decoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010800265515A
Other languages
English (en)
Inventor
堤公孝
佐佐木茂明
日和崎佑介
福井胜宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of CN102804263A publication Critical patent/CN102804263A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

高质量地合成解码信号。本发明的编码方法具有本地解码系数搜索步骤。本地解码系数搜索步骤包括复制判定子步骤、复制偏移候补信号串生成子步骤、距离计算子步骤、以及距离最小偏移量检测子步骤。复制判定子步骤对每个编码对象信号串,根据解码信号串判定是否生成复制偏移候补信号串,并输出复制判定标记。复制偏移候补信号串生成子步骤在复制判定标记表示生成复制偏移候补信号串的情况下,对预先决定的全部的信号偏移量的候补,生成复制偏移候补信号串。距离计算子步骤计算用于表示预先决定的信号串之间的距离的参数。距离最小偏移量检测子步骤求出距离最小的信号偏移量。

Description

编码方法、解码方法、利用了这些方法的装置、程序
技术领域
本发明涉及语音等声音信号的编码方法、解码方法、利用了这些方法的装置、程序。尤其涉及用于插补在编码以及传输信息时丢失的信息的技术,且对要传输的码附加利用损失的信息的一部分而得到的码,从而在解码时复原已损失的信息的技术。
背景技术
当以较少的比特率对输入信号进行编码时或将编码的数据进行传输时产生了数据的缺失的情况下,由于比特数不足或比特缺失,有时输入信号与解码信号的误差(编码失真)非常大。当编码失真大的情况下,这成为作为刺耳的噪声而被察觉的原因。作为用于隐藏在由于传输而产生了数据的缺失的情况下的噪声的现有技术,存在关注某特征量,并复制具有接近解码信号的特征量的值的过去的解码信号的方法(专利文献1)。
图1表示专利文献1的语音信号的发送装置1的功能结构例,图2表示语音信号接收装置2的功能结构例。在发送装置1中,输入语音信号被存储在输入缓冲器10中,将语音信号按被称为帧的一定的时间进行划分,即进行帧分割,从而发送给语音波形编码单元30。在语音波形编码单元30中,将输入语音信号变换为语音码。语音码被发送至分组构成单元70。在语音特征量计算单元40中,利用存储在输入缓冲器10中的语音信号,计算该帧中的该语音信号的语音特征量。语音特征量是指间距(pitch)周期(相当于语音的基本频率)、功率,有时仅利用这些特征量中的其中一个,有时还全部都利用。
在语音特征量编码单元50中,对所述语音特征量进行量化以便能够将其以决定的比特数来表示,之后变换为码。被编码的语音特征量被送入偏移缓冲器60。在偏移缓冲器60中,对预先指定的数量的帧保持语音特征量的码。然后,在偏移缓冲器60中,若输入了后述的延迟量控制信息,则将由延迟控制信息指定的帧数量之前的、即过去的帧的语音信号的语音特征量的码(又被称为“辅助信息”)发送给分组构成单元70。此外,缓冲器余量编码单元20若被输入缓冲器余量,则对缓冲器余量进行编码。该缓冲器余量码也被发送到分组构成单元70。在分组构成单元70中,利用对所述语音信号波形进行编码后的码、语音特征量的码、延迟量控制信息、缓冲器余量码,构成分组。分组送出单元80接受在分组构成单元70生成的分组的信息,并作为语音分组而送出到分组通信网。
语音信号接收装置2的分组接收单元81从分组通信网接收语音分组,并存储在接收缓冲器71中。接收到的语音分组中包含的对语音信号波形进行了编码的码被发送至语音分组解码单元31,并解码为语音信号波形。在不产生分组损耗的帧中,语音分组解码单元31的输出信号通过切换开关32作为输出语音信号而输出。在缓冲器余量解码单元21中,根据接收到的语音分组中包含的缓冲器余量码,求出用于指定将辅助信息偏移至几个帧而附加在分组中的延迟量控制信息。被求出的延迟量控制信息送入图1中的偏移缓冲器60与分组构成单元70。接收到的语音分组中包含的延迟量控制信息用于遗失处理控制单元。接收缓冲器余量判定单元22检测在接收缓冲器71中存储的分组的帧数。该缓冲器余量被发送到图1中的缓冲器余量编码单元20。
遗失检测单元90检测分组损耗(遗失)。在分组接收单元81中接收到的分组根据其分组号,即按照分组号的顺序存储在接收缓冲器71中。从接收缓冲器71读出已存储的分组,但在读出时没有要读出的分组的情况下,遗失检测单元90判定为在该读出动作之前发生了分组损耗(遗失),将切换开关32切换到遗失处理控制单元的输出侧。专利文献1的发明通过这样的处理,隐藏在由于传输而发生了数据的缺失的情况下的噪声。
另外,遗失处理控制单元如下工作。设在帧n中发生了分组损耗。在发生了分组损耗的情况下,接收缓冲器搜索单元100搜索在接收缓冲器71中存储了的接收分组,在帧n+1以后接收的分组中,搜索时间接近遗失帧n的(时戳最接近的)分组。分组中包含的对语音信号波形进行了编码的码被预测语音波形解码单元32解码,得到语音信号波形。此外,在接收缓冲器搜索单元100中从在接收缓冲器71中存储的分组中,搜索附加了与遗失帧n的语音信号对应的辅助信息的分组。若通过该分组搜索而发现,则与被搜索到的遗失帧n的语音信号对应的辅助信息在语音特征量解码单元51中解码为遗失帧n的语音信号的间距信息以及功率信息,并发送到遗失信号生成单元110。另一方面,输出语音信号被存储在输出语音缓冲器130中,若通过分组检索未被找到,则输出语音缓冲器130的输出语音信号在间距提取单元120中进行间距周期的分析。在间距提取单元120中提取的间距是与遗失帧的前一帧n-1的语音信号对应的间距。对应于前一帧n-1的语音信号的间距被发送到遗失信号生成单元110。遗失信号生成单元110利用从语音特征量解码单元51或间距提取单元120发送的间距信息,以间距为单位提取输出语音分组中的语音波形,并设为与遗失的分组对应的语音波形。通过以对应于遗失的分组的语音波形的间距为单位重复波形,而非以遗失的分组的前一分组的间距为单位重复波形,从而即使分组遗失,也能够得到更加自然的解码语音。
现有技术
专利文献
专利文献1:国际公开第2005/109401号
发明内容
发明要解决的问题
在专利文献1的发明的情况下,对间距和功率这样的特征量进行编码,并时间上偏移地进行传输,因此即使解码对象的分组遗失,通过对编码后的特征量进行解码,并从接收侧的缓冲器求出具有接近该特征量的值的信号,也能够合成接近遗失的信号的信号。但是,存在以下的课题:需要对几个特征量进行编码后传输,针对与接收侧的缓冲器有关的信息需要与发送侧进行通信等,不能仅在编码器/解码器进行用于生成高质量的解码语音的运算。
用于解决课题的方法
本发明的编码方法包括:编码对象信号串生成步骤、信号编码步骤、信号解码步骤、本地解码系数搜索步骤、以及码复用步骤。编码对象信号串生成步骤根据声音信号,生成由预先决定的数量的信号构成的信号串作为编码对象信号串。例如,将声音信号按照每预定的数量进行分割而形成一个帧,并将构成帧的信号串作为编码对象信号串而输出。或者,也可以输出用于构成将帧进一步细分的子帧的信号串作为编码对象信号串。或者,输出以该帧单位或附近几个帧单位进行频率变换后的频域信号串作为编码对象信号串。此外,将频域信号串分割为几个子带,并输出用于构成子带的频域信号作为编码对象信号串。信号编码步骤对每个编码对象信号串将信号串进行编码,并输出码索引。信号解码步骤对码索引进行解码,并输出解码信号串。本地解码系数搜索步骤根据编码对象信号串与解码信号串,输出复制偏移信息。码复用步骤至少对码索引与复制偏移信息进行复用而生成发送信号。
本地解码系数搜索步骤包括复制判定子步骤、复制偏移候补信号串生成子步骤、距离计算子步骤、距离最小偏移量检测子步骤。复制判定子步骤对每个编码对象信号串,根据解码信号串判定是否生成复制偏移候补信号串,并输出复制判定标记。例如,复制判定子步骤在解码信号串的功率是阈值以下的情况下输出用于表示生成复制偏移候补信号串复制判定标记即可。或者,复制判定子步骤在编码对象信号串与解码信号串的误差的功率大于阈值的情况下输出用于表示生成复制偏移候补信号串的复制判定标记即可。或者,在信号解码步骤中,也可以计算对每个编码对象信号串分配的比特数,并作为分配比特信息而输出,复制判定子步骤在对编码对象信号串分配的比特数是阈值以下的情况下输出用于表示生成复制偏移候补信号串的复制判定标记。
复制偏移候补信号串生成子步骤在复制判定标记表示生成复制偏移候补信号串的情况下,对预先决定的全部的信号偏移量的候补,生成复制偏移候补信号串。例如,根据解码信号串S^[k]求出复制偏移候补信号串S· τ[k](其中,k=0,...,L-1、L是编码对象信号串的信号的数量)即可。此外,当编码对象信号串是将频域信号串以频带进行分割所得的子带频域信号串S(w)[k](其中,w=0,...,W-1、k=0,...,L’-1,W是分割的数量,L’是一个子带频域信号串中包含的信号的数量)的情况下,复制偏移候补信号串生成子步骤利用对于从同一个频域信号串分割的子带频域信号串的解码信号串S^(w)[k]求出复制偏移候补信号串S· τ (w)[k]即可。
距离计算子步骤计算用于表示预先决定的信号串之间的距离的参数。用于表示预先决定的信号串之间的距离的参数可以是表示复制偏移候补信号串与编码对象信号串的距离的参数,也可以是表示将复制偏移候补信号串与复原信号串进行加法运算后的插补解码候补信号串与编码对象信号串的距离的参数。此外,也可以将信号串看做矢量,表示信号串之间的距离的参数可以设为各要素的差的平方和(欧几里得距离),也可以设为两个信号串之间的内积。距离最小偏移量检测子步骤根据距离计算子步骤的计算结果(表示距离的参数),求出距离最小的信号偏移量。根据距离计算子步骤的计算方法(表示距离的参数)来决定要选择哪个信号偏移量即可,当表示距离的参数是欧几里得距离的情况下选择用于表示距离的参数最小的信号偏移量即可,当表示距离的参数是内积的情况下选择用于表示距离的参数最大的信号偏移量即可。
本发明的解码方法包括码分离步骤、信号解码步骤、本地解码系数复制步骤、复原信号生成步骤。码分离步骤从接收信号读出码索引与复制偏移信息,并将其输出。另外,当接收信号中还包含复制判定标记的情况下,还输出复制判定标记。信号解码步骤对码索引进行解码,输出解码信号串。本地解码系数复制步骤根据解码信号串与复制偏移信息,生成插补解码信号串。复原信号生成步骤根据插补解码信号串,生成用于表示原来的声音信息的信号即复原信号。在编码方法的说明中表示了编码对象信号串的例子,但插补解码信号串对应于编码对象信号串。即,作为插补解码信号串,例如有用于构成帧的信号串、用于构成子帧的信号串、频域信号串、用于构成子带的信号串等。复原信号生成步骤是将这些插补解码信号串复原为原来的声音信号的步骤,根据插补解码信号串是哪个信号串而决定适当的处理即可。
本地解码系数复制步骤包括复制判定子步骤、复制偏移信号串生成子步骤、插补解码信号串生成子步骤。复制判定子步骤根据利用解码信号串、或者第一解码信号进行了比特分配的结果来判定是否生成复制偏移信号串,并输出复制判定标记。另外,当接收信号中还包含复制判定标记的情况下,不需要复制判定子步骤。
复制偏移信号串生成子步骤在复制判定标记表示生成复制偏移候补信号串的情况下,基于复制偏移信息所表示的偏移量生成复制偏移信号串。例如,根据解码信号串S^[k]与复制偏移信息所表示的偏移量τ求出复制偏移候补信号串S· τ[k]即可。此外,当解码信号串S^(w)[k]是对应于将频域信号串以频带进行分割后的子带频域信号串S(w)[k]的信号串的情况下,复制偏移信号串生成子步骤利用对于从同一个频域信号串分割的子带频域信号串的解码信号串S^(w)[k]求出复制偏移信号串S·(w)[k]即可。
插补解码信号串生成子步骤在复制判定标记表示生成复制偏移候补信号串的情况下,将复制偏移信号串设为插补解码信号串,在复制判定标记表示不生成复制偏移候补信号串的情况下,将解码信号串设为插补解码信号串,并输出该插补解码信号串。当复制判定标记表示生成复制偏移候补信号串的情况下,也可以将解码信号串与复制偏移信号串之和设为插补解码信号串。
发明效果
根据本发明的编码方法、解码方法,将在时域或频域将解码信号偏移而得到的信号,复制或加到解码信号,从而减少编码失真,并降低听觉上的噪声。
首先,将复制源的信号设为在时域或频域将解码信号偏移而得到的信号,从而得到以下的效果。由于不需要用于发送复制源的信号的比特,因此能够节约为了降低噪声所需的比特数。尤其在将频带分割为等间隔的多个频带(以下,称为“子带”)时,由于对应于各子带的信号之间存在相关性,因此尤其在4~14kHz这样的高频通过复制或加上附近的子带的信号而设为该子带的信号,能够减少听觉上的噪声。此外,对于时域的信号也在将帧分割为一定的间隔(以下称为“子帧”)时,对应于各子帧的信号之间存在相关性,因此通过复制或加上附近的子帧的信号而设为该子帧的信号,能够减少听觉上的噪声。
此外,在时域或频域将解码信号偏移而生成用于对解码信号复制或加上的信号,且以较少的比特数对由原来的解码信号与生成的信号生成的新的解码信号与输入信号成为最短的距离时的偏移量进行编码而传输,因此能够以较少的比特数来指定为了降低编码失真而对解码信号加上或复制的信号。
从而,以较少的比特数降低从编码失真较大的频带或时间性范围产生的听觉性噪声,且能够提高解码信号的主观质量。
附图说明
图1是表示以往的语音信号发送装置的功能结构例的图。
图2是表示以往的语音信号接收装置的功能结构例的图。
图3是表示实施例1的编码装置的结构例与解码装置的结构例的图。
图4是表示实施例1的本地解码系数搜索单元的结构例与本地解码系数复制单元的结构例的图。
图5是表示实施例1的编码装置的处理流程例与解码装置的处理流程例的图。
图6是表示将时域信号串变换为频域信号串时的示意图。
图7是表示用于生成复制偏移候补信号串的方法的图。
图8是表示实施例1变形例的编码装置的结构例与解码装置的结构例的图。
图9是表示实施例1变形例的编码装置的处理流程例与解码装置的处理流程例的图。
图10是表示实施例2的编码装置的结构例与解码装置的结构例的图。
图11是表示实施例2的本地解码系数搜索单元的结构例与本地解码系数复制单元的结构例的图。
图12是表示实施例2的编码装置的处理流程例与解码装置的处理流程例的图。
图13是表示用于生成插补解码候补信号串的方法的图。
图14是表示实施例3的编码装置的结构例与解码装置的结构例的图。
图15是表示实施例3的本地解码系数搜索单元的结构例与本地解码系数复制单元的结构例的图。
图16是表示实施例3的编码装置的处理流程例与解码装置的处理流程例的图。
图17是表示在将频域信号串变换为子带频域信号串时的示意、以及将子带插补解码信号串变换为插补解码信号串时的示意图。
图18是表示解码信号串与子带解码信号串以及子带复制偏移候补信号串之间的关系的图。
图19是表示子带复制偏移信号串的生成方法的图。
图20是表示实施例3变形例的编码装置的结构例与解码装置的结构例的图。
图21是表示实施例3变形例的编码装置的处理流程例与解码装置的处理流程例的图。
图22是表示实施例4的编码装置的结构例与解码装置的结构例的图。
图23是表示实施例4的信号编码单元的结构例与信号解码单元的结构例的图。
图24是表示实施例4的本地解码系数搜索单元的结构例与本地解码系数复制单元的结构例的图。
图25是表示实施例4的编码装置的处理流程例与解码装置的处理流程例的图。
图26是表示子带分配比特信息的算出方法的图。
图27是表示比特分配表与码块的关系的图。
图28是表示用于选择码索引的方法的图。
图29是表示实施例4变形例的编码装置的结构例与解码装置的结构例的图。
图30是表示实施例4变形例的编码装置的处理流程例与解码装置的处理流程例的图。
图31是表示实施例5与实施例5变形例1的编码装置的结构例的图。
图32是表示实施例5与实施例5变形例1的解码装置的结构例的图。
图33是表示实施例5的信号编码单元的结构例的图。
图34是表示实施例5的信号解码单元的结构例的图。
图35是表示实施例5与实施例5变形例1的编码装置的处理流程例与解码装置的处理流程例的图。
图36是表示码索引的生成方法与数据组的结构的图。
图37是表示实施例5变形例1的信号编码单元的结构例的图。
图38是表示实施例5变形例1的信号解码单元的结构例的图。
图39是表示动态比特再分配单元9060的处理步骤的图。
图40是表示实施例5变形例2的信号编码单元的结构例的图。
图41是表示实施例5变形例2的信号解码单元的结构例的图。
图42是表示实施例5变形例2的编码装置的处理流程例与解码装置的处理流程例的图。
图43是表示计算机的功能结构例的图。
具体实施方式
以下,详细说明本发明的实施方式。另外,对具有相同功能的结构单元附加相同标号,并省略重复说明。此外,在以下的说明中称为“信号串”时是指为了编码或解码,分割为每规定的数量的信号的组。信号串还能够认为是具有规定的数量的要素的矢量,此时将各信号考虑为矢量的要素。此外,简单称为“信号”时是指没有分割为每规定的数量的信号的排列或单独的信号。
实施例1
图3~图7是用于说明实施例1的图。图3A表示编码装置的结构例,图3B表示解码装置的结构例。图4A表示本地解码系数搜索单元的结构例,图4B表示本地解码系数复制单元的结构例。图5A表示编码装置的处理流程例,图5B表示解码装置的处理流程例。图6是表示将时域信号串变换为频域信号串时的示意图。图7是表示用于生成复制偏移候补信号串的方法的图。
编码装置
编码装置100包括帧构成单元1010、信号编码单元1030、信号解码单元1031、本地解码系数搜索单元1000、码复用单元1040。帧构成单元1010将利用麦克风等传感器收录的声音信号形成为数字形式的声音信号样本,并汇集一定数量L的声音信号样本而构成帧。然后,以帧为单位进行时域频域变换,输出与一定数量L的声音信号样本对应的频域信号串S[k](k=0、...、L-1)(S1010)。作为时域频域变换,利用离散傅立叶变换、离散余弦变换、校正离散余弦变换(以下,称为“MDCT”。)等。图6表示这些时域频域变换的示意。在本实施例中,频域信号串是成为编码的对象的信号串(以下,称为“编码对象信号串”)。从而,在本实施例中,帧构成单元1010相当于编码对象信号串生成单元1012。
信号编码单元1030按照每个编码对象信号串,对信号串进行编码,输出码索引(S1030)。例如,信号编码单元1030对将频域信号串S[k](k=0、...、L-1)看做L维矢量的频域信号矢量,进行矢量量化,输出码索引Ic。在矢量量化时,从码块中,选择与频域信号矢量之间的距离最小的码矢量,并输出所选择的码矢量的索引作为码索引Ic。当作为表示距离的参数的定义而利用了欧几里德距离的情况下,根据以下的式(1)而选择码矢量。
[数1]
I c = arg min p ( Σ k = 0 L - 1 ( S [ k ] - c k ( p ) ) 2 ) - - - ( 1 )
当作为表示距离的参数的定义而利用矢量之间的内积的情况下,根据式(2),选择码矢量。
[数2]
I c = arg max p ( Σ k = 0 L - 1 ( S [ k ] · c k ( p ) ) ) - - - ( 2 )
这里,将在码本中存储着的第p个码矢量设为C(p)=(C0 (p)、C1 (p)、...、CL-1 (p)。Ck (p)表示第p个矢量的第k维的要素。
信号解码单元1031对码索引进行解码,并输出解码信号串(S1031)。例如,信号解码单元1031从码本中读出与码索引Ic对应的码矢量C(c)=(C0 (c)、C1 (c)、...、CL-1 (c),输出解码信号串S^[k](k=0、...、L-1)。另外,解码信号串S^[k]利用码矢量C(c),求出S^[0]=C0 (c)、S^[1]=C1 (c)、...、S^[L-1]=CL-1 (c)
本地解码系数搜索单元1000根据相当于编码对象信号串的频域信号串S[k]与解码信号串S^[k],输出复制偏移信息τr(S1000)。如图4A所示,本地解码系数搜索单元1000包括复制判定单元1001、复制偏移候补信号串生成单元1002、距离计算单元1003、距离最小偏移量检测单元1004。复制判定单元1001根据解码信号串S^[k](k=0、...、L-1),判定是否生成复制偏移候补信号串S·τ[k](τ=τ0、...、τM,M是信号偏移量τ的候补的数量),并输出复制判定标记Flagd(S1001)。例如,复制判定单元1001只要在解码信号串S^[k](k=0、...、L-1)的功率P是阈值以下的情况下输出用于表示生成复制偏移候补信号串S·τ[k]的复制判定标记Flagd(例如,Flagd=1),在比阈值大的情况下输出用于表示不生成复制偏移候补信号串S·τ[k]的复制判定标记Flagd(例如,Flagd=0)即可。另外,解码信号串S^[k](k=0、...、L-1)的功率例如根据式(3)而计算即可。
[数3]
P = Σ k = 0 L - 1 S ^ 2 [ k ] - - - ( 3 )
复制偏移候补信号串生成单元1002在复制判定标记Flagd表示不生成复制偏移候补信号串的情况下(Flagd=0的情况下),不进行处理。此外,复制偏移候补信号串生成单元1002在复制判定标记Flagd表示生成复制偏移候补信号串的情况下(Flagd=1的情况下),对预先决定的全部的信号偏移量的候补τ=τ0、...、τM,生成复制偏移候补信号串S·τ[k](S1002)。例如,如下求出复制偏移候补信号串S·τ[k]即可(参照图7)。
τ[k]=S^[-L-τ+k]
距离计算单元1003计算用于表示复制偏移候补信号串S·τ[k]与频域信号串S[k]之间的距离的参数(以下,称为“距离参数”)(S1003)。该距离参数只要将各信号串看做矢量,并通过式(4)或式(5)所示的方法等求出矢量之间的距离参数d[τ](τ=τ0、...、τM)即可。另外,式(4)表示欧几里德距离,式(5)表示内积,但无需限定于这些式。
[数4]
d [ τ ] = Σ k = 0 L - 1 ( S [ k ] - S · τ [ k ] ) 2 - - - ( 4 )
d [ τ ] = Σ k = 0 L - 1 ( S [ k ] · S · τ [ k ] ) - - - ( 5 )
在通过式(4)来求出距离参数的情况下,距离最小偏移量检测单元1004求出距离参数d[τ]成为最小的信号偏移量τ,并作为复制偏移信息τr来输出(S1004)。即,根据式(6)来求出复制偏移信息τr
[数5]
τr==arg min d[τ]       (6)
τ={τ0…τL-1}
此外,在通过式(5)来求出距离参数的情况下,距离最小偏移量检测单元1004求出距离参数d[τ]成为最大的信号偏移量τ,并作为复制偏移信息τr来输出(S1004)。即,根据式(7)来求出复制偏移信息τr
[数6]
τr=arg max d[τ]         (7)
τ={τ0…τL-1}
码复用单元1040复用码索引Ic与复制偏移信息τr而生成发送信号(S1040)。具体来说,码复用单元1040将码索引Ic与复制偏移信息τr作为输入,按照规定的顺序排列而生成一个数据组。此外,在利用IP网等进行传输的情况下,附加必要的报头信息而生成分组。
解码装置
解码装置200包括码分离单元2041、信号解码单元2031、本地解码系数复制单元2100、频域时域变换单元2021、重叠加法运算单元2011。另外,将频域时域变换单元2021与重叠加法运算单元2011合并而称为复原信号生成单元2012。码分离单元2041从接收信号中读出码索引Ic与复制偏移信息τr而输出(S2041)。信号解码单元2031对码索引Ic进行解码,并输出解码信号串S^[k](k=0、...、L-1)(S2031)。
本地解码系数复制单元2100根据解码信号串S^[k]与复制偏移信息τr而生成插补解码信号串S~[k](k=0、...、L-1)(S2100)。如图4B所示,本地解码系数复制单元2100包括复制判定单元2001、复制偏移信号串生成单元2002、插补解码信号串生成单元2006。复制判定单元2001根据解码信号串S^[k]判定是否生成复制偏移信号串S·τ[k],并输出复制判定标记Flagd(S2001)。复制判定单元2001的处理与编码装置100的复制判定单元1001相同。
复制偏移信号串生成单元2002在复制判定标记Flagd表示生成复制偏移候补信号串的情况下(Flagd=1的情况下),基于复制偏移信息τr所表示的偏移量τ而生成复制偏移信号串S·τ[k](S2002)。例如,根据解码信号串S^[k]与复制偏移信息所表示的偏移量τ,如下求出复制偏移候补信号串S·τ[k]即可。
τ[k ]=S^[-L-τ+k]
插补解码信号串生成单元2006在复制判定标记Flagd表示生成复制偏移候补信号串的情况下(Flagd=1的情况下),将复制偏移信号串S·τ[k]设为插补解码信号串S~[k],在复制判定标记Flagd表示不生成复制偏移候补信号串的情况下(Flagd=0的情况下),将解码信号串S^[k]设为插补解码信号串S~[k],并输出插补解码信号串S~[k](S2006)。即,如下那样求出插补解码信号串S~[k]。
[数7]
复原信号生成单元2012根据插补解码信号串S~[k],生成作为表示原来的声音信息的信号的复原信号(S2012)。在本实施方式中,编码对象信号串是频域信号串S[k]。即,插补解码信号串S~[k]是频域的信号。因此,复原信号生成单元2012由频域时域变换单元2021与重叠加法运算单元2011构成。频域时域变换单元2021将频域信号串S[k]变换为L样本的时域的信号串(S2021)。然后,重叠加法运算单元2011通过将对时域的信号串乘以窗口函数而获得的信号各重叠半个帧长度而进行加法运算,从而计算复原信号,并将其设为复原信号(S2011)。
根据实施例1的编码装置、解码装置,将在时域或频域对解码信号进行偏移而得到的信号,复制或加到解码信号,从而降低编码失真,并降低听觉上的噪声。从而,通过较少的比特数,进行听觉上的噪声的降低,能够提高解码信号的主观质量。
[变形例]
图8、9表示将编码对象信号串设为帧单位的时域的信号串的情况下的功能结构与处理流程。图8A表示编码装置的功能结构例,图8B表示解码装置的功能结构例,图9A表示编码装置的处理流程例,图9B表示解码装置的处理流程例。
编码装置100’、解码装置200’与编码装置100、解码装置200的不同之处仅在于编码对象信号串。从而,作为结构单元的处理,只有编码对象信号串生成单元1012’与复原信号生成单元2012’不同。
编码对象信号串生成单元1012’由帧构成单元1010’构成。帧构成单元1010’将利用麦克风等传感器收录的声音信号形成为数字形式的声音信号样本,并汇集一定数量L的声音信号样本而构成帧。然后,输出帧单位的信号串(以下,称为“帧信号串”)s[k](k=0、...、L-1)(S1010’)。编码装置100’的其他的结构单元的处理与编码装置100相同。
在解码装置200’中,插补解码信号串s~[k]对应于帧信号串s[k]。即,在本变形例中,差补解码信号串s~[k]是时域的信号串。从而,复原信号生成单元2012’不需要频域时域变换单元,仅由重叠加法运算单元2011的构成。重叠加法运算单元2011通过将对时域的信号串乘以窗口函数而得到的信号各重叠半个帧长度而进行加法运算,从而计算复原信号,并将其设为复原信号(S2011)。
由于是这样的结构,因此本变形例的编码装置、解码装置也能够得到与实施例1相同的效果。
实施例2
图10~图13是用于说明实施例2的图。图10A表示编码装置的结构例,图10B表示解码装置的结构例。图11A表示本地解码系数搜索单元的结构例,图11B表示本地解码系数复制单元的结构例。图12A表示编码装置的处理流程例,图12B表示解码装置的处理流程例。图13是表示用于生成插补解码候补信号串的方法的图。另外,实施例2的编码对象信号串是频域信号串(与实施例1相同)。
编码装置
编码装置150包括帧构成单元1010、信号编码单元1030、信号解码单元1031、本地解码系数搜索1500、码复用单元1540。帧构成单元1010、信号编码单元1030、信号解码单元1031与实施例1的编码装置100相同。
本地解码系数搜索单元1500根据相当于编码对象信号串的频域信号串S[k]与解码信号串S^[k],输出复制偏移信息τr与复制判定标记Flagd(S1500)。如图11A所示,本地解码系数搜索单元1500包括复制判定单元1501、复制偏移候补信号串生成单元1002、距离计算单元1503、距离最小偏移量检测单元1004。复制判定单元1501根据频域信号串S[k](k=0、...、L-1)与解码信号串S^[k](k=0、...、L-1)的误差信号的功率,判定是否生成复制偏移候补信号串S·τ[k](τ=τ0、...、τM,M是信号偏移量τ的候补的数量),并输出复制判定标记Flagd(S1501)。例如,复制判定单元1501只要在频域信号串S[k]与解码信号串S^[k]的误差信号(S[k]-S^[k])的功率P超过阈值的情况下输出用于表示生成复制偏移候补信号串S·τ[k]的复制判定标记Flagd(例如,Flagd=1),在阈值以下的情况下输出用于表示不生成复制偏移候补信号串S·τ[k]的复制判定标记Flagd(例如,Flagd=0)即可。另外,误差信号(S[k]-S^[k])的功率例如根据式(9)计算即可。
P = Σ k = 0 L - 1 ( S [ k ] - S ^ [ k ] ) 2 - - - ( 9 )
复制偏移候补信号串生成单元1002与实施例1相同。距离计算单元1503计算将复制偏移候补信号串S·τ[k]与解码信号串S^[k]相加后的插补解码候补信号串S ~τ[k]与频域信号串S[k]的距离参数(S1503)。该距离参数只要将各信号串看做矢量,并通过式(10)与式(11)所示的方法等求出矢量之间的距离参数d[τ](τ=τ0、...、τM)即可。另外,式(10)表示欧几里德距离,式(11)表示内积,但并不限定于这些式子。
[数9]
d [ τ ] = Σ k = 0 L - 1 ( S [ k ] - S ~ τ [ k ] ) 2
= Σ k = 0 L - 1 ( S [ k ] - S ^ [ k ] - S · τ [ k ] ) 2 - - - ( 10 )
d [ τ ] = Σ k = 0 L - 1 ( S [ k ] · S ~ τ [ k ] )
= Σ k = 0 L - 1 S [ k ] · ( S ^ [ k ] + S · τ [ k ] ) - - - ( 11 )
距离最小偏移量检测单元1004与实施例1相同。
码复用单元1540将码索引Ic、复制偏移信息τr、以及复制判定标记Flagd进行复用而生成发送信号(S1040)。具体来说,码复用单元1540将码索引Ic、复制偏移信息τr、以及复制判定标记Flagd作为输入,以规定的顺序排列而生成一个数据组。此外,在利用IP网等进行传输的情况下,附加必要的报头信息而生成分组。
解码装置
解码装置250包括码分离单元2541、信号解码单元2031、本地解码系数复制单元2500、频域时域变换单元2021、重叠加法运算单元2011。另外,将频域时域变换单元2021与重叠加法运算单元2011合并而称为复原信号生成单元2012。码分离单元2541从接收信号中读出码索引Ic与复制偏移信息τr、以及复制判定标记Flagd而输出(S2541)。信号解码单元2031与实施例1相同。
本地解码系数复制单元2500根据解码信号串S^[k]与复制偏移信息τr以及复制判定标记Flagd而生成插补解码信号串S~[k](k=0、...、L-1)(S2500)。如图11B所示,本地解码系数复制单元2500包括复制偏移信号串生成单元2002、插补解码信号串生成单元2506。在本实施例的情况下,由于接收信号内包含有复制判定标记Flagd,因此不需要复制判定单元。复制偏移信号串生成单元2002与实施例1相同。
如图13所示,插补解码信号串生成单元2506通过对复制偏移信号串S·τ[k]与解码信号串S^[k]进行加法运算,从而生成并输出插补解码信号串S~[k](S2006)。即如下那样求出插补解码信号串S~[k]。
[数10]
S ~ [ k ] = S ^ [ k ] + S · τ [ k ] (k=0,…,L-1)    (12)
复原信号生成单元2012与实施例1相同。
通过这样的结构,在解码信号串与编码对象信号串的误差大时能够降低编码失真。
实施例3
图14~图19是用于说明实施例3的图。图14A表示编码装置的结构例,图14B表示解码装置的结构例,图15B表示本地解码系数搜索单元的结构例,图15B表示本地解码系数复制单元的结构例,图16A表示编码装置的处理流程例,图16B表示解码装置的处理流程例。图17A是表示在将频域信号串变换为子带频域信号串时的示意,图17B是表示将子带插补解码信号串变换为插补解码信号串时的示意图。图18是表示解码信号串、子带解码信号串、样本复制偏移候补信号串的关系的图。图19是表示子带复制偏移信号串的生成方法的图。在本实施方式中,与实施例2的不同点在于,将频域信号串按照几个频带进行分割的子带的信号串作为编码对象信号串。
编码装置
编码装置300包括帧构成单元1010、子带分割单元3050、信号编码单元3030、信号解码单元3031、本地解码系数搜索单元3000、码复用单元1540。帧构成单元1010、码复用单元1540与实施例2的编码装置150相同。如图17A所示,子带分割单元3050将频域信号串S[k](k=0、...、L-1)分割为多个子带频域信号串S(w)[k](w=0,...,W-1、k=0,...,L’-1)(S3050)。W表示分割的数量,L’表示子带频域信号串中包含的信号的数量。图17A表示W=4、L=4L’的例子。此外,以下,在表示是第几个子带频域信号串时将S(w)[k]称为“第w子带频域信号串”,在无需确定是第几个时,简称为“子带频域信号串”。在本实施例,子带频域信号串为编码对象信号串。
信号编码单元3030仅仅是将编码对象信号串从频域信号串变更为子带频域信号串,其处理本身与实施例1的信号编码单元1030相同。然后,信号编码单元3030输出对于子带频域信号串S(w)[k]的码索引Ic (w)(S3030)。
信号解码单元3031也仅仅是对于码索引Ic (w)的编码对象信号串从频域信号串变更为子带频域信号串,处理本身与实施例1的信号解码单元1031相同。此外,信号解码单元3031输出解码信号串S^(w)[k](w=0,...,W-1、k=0,...L’-1)(S3031)。
本地解码系数搜索单元3000根据子带频域信号串S(w)[k]与解码信号串S^(w)[k],输出复制偏移信息τr (w)与复制判定标记Flagd (w)(S3000)。如图15A所示,本地解码系数搜索单元3000包括复制判定单元3001、复制偏移候补信号串生成单元3002、距离计算单元3003、距离最小偏移量检测单元3004。
复制判定单元3001仅仅是编码对象信号串中包含的信号的数量有所改变,与实施例2相同。即,复制判定单元3001根据子带频域信号串S(w)[k]与解码信号串S^(w)[k]的误差信号的功率,判定是否生成复制偏移候补信号串S·τ (w)[k](τ=τ0、...、τM,M是信号偏移量τ的候补的数量),并输出复制判定标记Flagd (w)(S3001)。例如,复制判定单元3001只要在子带频域信号串S(w)[k]与解码信号串S^(w)[k]的误差信号(S(w)[k]-S^(w)[k])的功率P超过阈值的情况下输出用于表示生成复制偏移候补信号串S ·τ (w)[k]的复制判定标记Flagd (w)(例如,Flagd (w)=1),在阈值以下的情况下输出用于表示不生成复制偏移候补信号串S ·τ (w)[k]的复制判定标记Flagd (w)(例如,Flagd (w)=0)即可。另外,误差信号(S(w)[k]-S^(w)[k])的功率例如根据式(9)计算即可。
[数11]
P = Σ k = 0 L - 1 ( S ( w ) [ k ] - S ^ ( w ) [ k ] ) 2 - - - ( 13 )
复制偏移候补信号串生成单元3002在复制判定标记Flagd (w)表示不生成复制偏移候补信号串的情况下(Flagd (w)=0的情况下),不进行处理。此外,复制偏移候补信号串生成单元3002在复制判定标记Flagd (w)表示生成复制偏移候补信号串的情况下(Flagd (w)=1的情况下),对预先决定的全部的信号偏移量的候补τ=τ0、...、τM,生成复制偏移候补信号串S ·τ (w)[k](S3002)。例如,如下式那样根据附近子带的解码信号串,生成子带复制偏移候补信号串S ·τ (w)[k]。
[数12]
若如式(14)那样生成复制偏移候补信号串S ·τ (w)[k],则复制偏移候补信号串S·τ (w)[k]根据对于原先从相同的频域信号串分割的子带频域信号串的解码信号串而生成。通常,由于从相同的频域信号串分割的子带频域信号串互相相关性强,因此能够得到距离较近的子带复制偏移候补信号串S·τ (w)[k]。图18表示生成S·τ (2)[k]的例子。
距离计算单元3003、距离最小偏移量检测单元3004仅仅是信号串内的信号的数量有所变化,与实施例1或实施例2相同。此外,码复用单元1540与实施例2相同。
解码装置
解码装置400包括码分离单元4041、信号解码单元4031、本地解码系数复制单元4100、子带结合单元4051、频域时域变换单元2021、重叠加法运算单元2011。另外,将子带结合单元4051与频域时域变换单元2021以及重叠加法运算单元2011合并而称为复原信号生成单元4012。码分离单元4041从接收信号读出码索引Ic (w)、复制偏移信息τr (w)、以及复制判定标记Flagd (w)而输出(S4041)。信号解码单元4031对码索引Ic (w)进行解码,输出子带解码信号串S^(w)[k](k=0、...、L’-1)(S4031)。
本地解码系数复制单元4100根据子带解码信号串S^(w)[k]与复制偏移信息τr (w)、以及复制判定标记Flagd (w),生成子带插补解码信号串S~(w)[k](k=0、...、L-1)(S4100)。如图15B所示,本地解码系数复制单元4100包括复制偏移信号串生成单元4002、插补解码信号串生成单元4005。
复制偏移信号串生成单元4002通过与复制偏移候补信号串生成单元3002的方法相同的方法,输出子带复制偏移信号串S·(w)[k](w=0,...,W-1、k=0,...L’-1)(S4002)。例如,若复制偏移候补信号串生成单元3002根据式(14)生成了复制偏移候补信号串S·τ (w)[k],则复制偏移信号串生成单元4002只要根据式(15)生成子带复制偏移信号串S·(w)[k]即可。
[数13]
Figure BDA0000120465260000181
另外,图19表示式(15)的处理。
插补解码信号串生成单元4005通过将子带复制偏移信号串S·(w)[k]与解码信号串S^(w)[k]进行加法运算,从而生成并输出子带插补解码信号串S~(w)[k](S4005)。
如图17B所示,子带结合单元4051结合多个子带插补解码信号串,生成插补解码信号串(S4051)。频域时域变换单元2021与重叠加法运算单元2011与实施例1或实施例2相同。
通过以上的结构,实施例3的编码装置、解码装置也能够得到与实施例1、实施例2相同的效果。此外,由于能够降低编码引起的失真较大的频带的误差,因此能够进一步减少听觉上的噪声。
[变形例]
图20、21表示将编码对象信号串设为子帧单位的时域的信号串的情况下的功能结构与处理流程。图20A表示编码装置的功能结构例,图21B表示解码装置的功能结构例,图21A表示编码装置的处理流程例,图21B表示解码装置的处理流程例。
编码装置300’、解码装置400’与编码装置300、解码装置400的不同点在于编码对对象信号串。从而,作为结构单元的处理,只有编码对象信号串生成单元3012’与复原信号生成单元4012’不同。
编码对象信号串生成单元3012’由帧构成单元1010’与子帧分割单元3050’构成。帧构成单元1010’将利用麦克风等传感器收录的声音信号形成为数字形式的声音信号样本,并汇集一定数量L的声音信号样本而构成帧。然后,输出帧单位的信号串(以下,称为“帧信号串”)s[k](k=0、...、L-1)(S1010’)。子帧分割单元3050’将帧信号串分割为几个,生成子帧信号串s(w)[k](w=0,...,W-1,k=0,...,L’-1)(S3050’)。编码装置300’的其他的结构单元的处理与编码装置300相同。
在解码装置400’中,子帧插补解码信号串s~(w)[k](w=0,...,W-1、k=0,...L’-1)对应于子帧信号串s(w)[k]。即,在本变形例中,子帧插补解码信号串s~(w)[k]是时域的信号串。从而,复原信号生成单元4012’无需频域时域变换单元,由子帧结合单元4051’与重叠加法运算单元2011构成。子帧结合单元4051’结合子帧插补解码信号串s~(w)[k],生成插补解码信号串s~[k](S4051’)。重叠加法运算单元2011将对插补解码信号串s~[k]乘以窗口函数而得到的信号,各重叠半个帧长度而进行加法运算,从而计算复原信号,并将其设为复原信号(S2011)。
由于是这样的结构,因此本变形例的编码装置、解码装置也能够得到与实施例3相同的效果。
实施例4
图22~图28是用于说明实施例4的图。图22A表示编码装置的结构例,图22B表示解码装置的结构例。图23A表示信号编码单元的结构例,图23B表示信号解码单元的结构例。图24A表示本地解码系数搜索单元的结构例,图24B表示本地解码系数复制单元的结构例。图25A表示编码装置的处理流程例,图25B表示解码装置的处理流程例。图26是表示子带分配比特信息的计算方法的图,图27是表示比特分配表格与码块的关系的图,图28是表示用于选择码索引的方法的图。另外,本实施例的编码对象信号串是子带频域信号串(与实施例3相同)。
编码装置
编码装置500包括帧构成单元1010、子带分割单元3050、信号编码单元5030、信号解码单元5031、本地解码系数搜索单元5000、码复用单元5040。帧构成单元1010与子帧分割单元3050与实施例3的编码装置300相同。
如图23A所示,信号编码单元5030包括参数计算单元5032、第一编码单元5033、第一本地解码单元5034、动态比特分配单元5035、第二编码单元5036、本地码复用单元5037。参数计算单元5032根据子带频域信号串S(w)[k](w=0,...,W-1、k=0,...L’-1),算出第w子带第一参数。作为第w子带第一参数,例如可以利用第w子带频域信号串S(w)[k]的平均幅度指标A~[k](w=0,...,W-1)(以下,称为“第w子带平均幅度指标”)等。第w子带平均幅度指标按照下式而算出。
[数14]
A ~ [ w ] = round ( A [ w ] )
A [ w ] = 1 2 log 2 [ 1 L ′ Σ k = 0 L ′ - 1 S ^ ( w ) 2 [ k ] + ϵ rms ] - - - ( 16 )
εrms=2-24
另外,利用第w子带平均幅度指标,根据下式能够算出第w子带平均幅度A’[w]。
[数15]
A ′ [ w ] = 2 A ~ [ w ]
接着,第一编码单元5033对第w子带第一参数(w=0,...,W-1)进行量化,输出第一信号码索引IA。当作为第w子带第一参数而利用第w子带平均幅度指标A~[k](w=0,...,W-1)的情况下,例如,将第w子带平均幅度指标A~[k]看做W维矢量而进行矢量量化,并将被选择的码矢量的索引作为第一信号码索引IA而输出。另外,也可以通过二进制编码或Huffman编码,将第w子带第一参数对每个子带进行编码。
第一本地解码单元5034对第一信号码索引IA进行解码,输出第w子带第一解码参数(w=0,...,W-1)。例如,在第一编码单元5033对第w子带平均幅度指标A~[k]进行了编码的情况下,第一本地解码单元5034输出第w子带解码平均幅度指标A^[k](w=0,...,W-1)作为第w子带第一解码参数。
动态比特分配单元5035根据第w子带第一解码参数,计算分配给各子带的比特数,输出第w子带分配比特信息。例如,在作为第w子带第一解码参数而利用了第w子带解码平均幅度指标A~[k]的情况下,通过以下的步骤算出第w子带的分配比特信息B[k](w=0,...,W-1)。首先,根据第w子带平均幅度指标A^[k](w=0,...,W-1),算出由下式决定的第w子带听觉性重要度ip[w](w=0,...,W-1)。
ip[w]=A^[w]/2
接着通过利用了第w子带听觉性重要度ip[k]与比特分配表格R的二分搜索法,输出第w子带的分配比特信息B[w]。在动态比特分配中,通过基于以下的式子的二分搜索而选择“water Level”,并利用“water Leverλ”与第w子带听觉性重要度ip[k],算出下式的第w子带分配比特信息B[w]。
[数16]
B [ w ] = arg min b ∈ R | L ′ · ( ip [ w ] - λ ) - b |
具体来说,例如通过图26所示的方法算出即可。首先,将参数(maxIP,minIP,λ,i)设定为初始值(S50351)。作为临时的B[w]的值,计算Bt[w],求出与已经计算的Bt[w]的合计Sum_Bt(S50352)。确认Sum_Bt是否超过可分配的总比特数(total_bit_budget)(S50353)。当步骤S50353为“是”的情况下,变更参数(minIP,λ,i)(S50354)。当步骤S50353为“否”的情况下,将Bt[w]设为Bi[w],并变更参数(maxIP,λ,i)(S50355)。确认i是否小于事先决定的常数(S50356)。当步骤S50356为“是”的情况下,返回步骤S50352。当步骤S50356为“否”的情况下,输出Bi[w]作为第w子带的分配比特信息B[w]。此外,在事先决定的次数的反复搜索结束的时刻,进行上述的B[w]的式子的评价。也可以另定义用于结束反复处理的收敛条件而结束处理。例如,考虑在分配比特数的合计与可分配的总比特数(total_bit_budget)相等的情况下结束处理等方法。当最终的比特数的合计超过可分配的总比特数的情况下,例如从ip[w]小的子带起依次分配比通过上式选择的比特小一个表格的比特,从而减少比特数,并进行调整使得分配比特数的合计比总比特数的合计小,决定最终的第w子带分配比特信息。
第二编码单元5036利用分配比特信息B[w],对第w子带频域信号串S(w)[k]进行量化,输出第w子带第二信号码索引IB (w)(w=0,...,W-1)。这里,如图27A与图27B所示,设比特分配表格中的比特数与码块的搜索范围一对一对应。另外,该搜索范围之间也可以具有重复部分。图27A表示搜索范围之间不具有重复部分的情况下的例子,图27B表示搜索范围之间具有重复部分的情况下的例子。第二编码单元5036通过图28所示的步骤,对第w子带频域信号串S(w)[k]进行量化,并输出第w子带第二信号码索引IB (w)。首先,利用分配比特信息B[w],决定第二编码单元5036中的码本搜索的范围。这里,在B[w]为阈值以下时,不进行编码。接着,从根据分配比特信息B[w]决定的码本搜索范围中选择与将第w子带频域信号串S(w)[k]看做矢量的第w子带频域信号矢量之间的距离最小的码矢量,并输出被选择的码矢量的索引作为第w子带第二信号码索引IB (w)。在作为表示距离的参数而利用了欧几里德距离的情况下,根据式(17)而选择码矢量。
[数17]
I B ( w ) = arg min p ( Σ k = 0 L ′ - 1 ( S ( w ) [ k ] - c k ( p ) ) 2 ) - - - ( 17 )
此外,在作为表示距离的参数而利用了矢量之间的内积的情况下,根据式(18)而选择码矢量。
[数18]
I B ( w ) = arg max p ( Σ k = 0 L ′ - 1 ( S ( w ) [ k ] · c k ( p ) ) ) - - - ( 18 )
这里,设在码本中存储的第p个码矢量设为C(p)=(C0 (p),C1 (p),...,CL’-1 (p))。Ck (p)表示第p个矢量的第k维要素。
本地码复用单元5037将第w子带第一信号码索引IA (w)与第w子带第二信号码索引IB (w)按照规定的顺序排列而设为数据组,并作为码索引Ic而输出。
信号解码单元5031对码索引Ic进行解码,并输出解码信号串S^(w)[k](k=0,...,L’-1)与分配比特信息B[w](S5031)。信号解码单元5031包括本地码分离单元5038、第一本地解码单元5034、动态比特分配单元5035、第二解码单元5039、解码参数处理单元5044。本地码分离单元5038从码索引Ic读出在规定的位置的比特数,并输出第w子带第一信号码索引IA (w)与第w子带第二信号码索引IB (w)
第一本地解码单元5034对第w子带第一信号码索引IA (w)进行解码,并输出第w子带第一解码参数。第一本地解码单元5034的动作与信号编码单元5030中的第一本地解码单元5034相同。动态比特分配单元5035根据第w子带第一解码参数,计算对各子带分配的比特数,并作为第w子带的分配比特信息来输出。动态比特分配单元5035的动作与信号编码单元5030中的动态比特分配单元5035相同。
第二解码单元5039利用第w子带的分配比特信息B[w],对第w子带第二信号码索引IB (w)进行解码,并输出第w子带第二解码参数。另外,如信号编码单元5030中的第二编码单元5036那样,设比特分配表格中的比特数与码本的搜索范围一对一对应。解码的步骤如下。首先,利用第w子带的分配比特信息B[w],决定码本搜索的范围。接着,从根据分配比特信息B[w]决定的码本搜索范围中选择与第w子带第二信号码索引IB (w)对应的码矢量,并输出与所选择的码矢量对应的码矢量C(p)=(C0 (p),C1 (p),...,CL’-1 (p))作为第w子带第二解码参数。
解码参数处理单元5044利用第w子带第一解码参数与第w子带第二解码参数,输出解码信号串S^(w)[k]。例如,当作为第w子带第一解码参数而利用第w子带的平均幅度指标A~[k],且作为第w子带第二解码参数而利用进行标准化而使得平均幅度成为1的码矢量的情况下,进行对第w子带第二解码参数的各系数乘以根据第w子带平均幅度指标而算出的第w子带平均幅度等处理,并算出解码信号串S^(w)[k]。
本地解码系数搜索单元5000根据子带频域信号串S(w)[k]与解码信号串S^(w)[k],输出复制偏移信息τr (w)(S5000)。如图24A所示,本地解码系数搜索单元5000包括复制判定单元5001、复制偏移候补信号串生成单元3002、距离计算单元3003、距离最小偏移量检测单元3004。复制判定单元5001在第w子带的分配比特信息B[w]为阈值以下的情况下,输出用于表示生成复制偏移候补信号串S·τ[k]的复制判定标记Flagd (w)(例如,Flagd (w)=1)。另一方面,在第w子带的分配比特信息B[w]大于阈值的情况下,输出用于表示不生成复制偏移候补信号串S·τ[k]的复制判定标记Flagd (w)(例如,Flagd (w)=0)。
复制偏移候补信号串生成单元3002、距离计算单元3003、距离最小偏移量检测单元3004与实施例3的编码装置300相同。
码复用单元5040对码索引Ic与复制偏移信息τr (w)进行复用而生成发送信号(S5040)。具体来说,码复用单元5040将码索引Ic与复制偏移信息τr (w)作为输入,按照规定的顺序排列而生成数据组。此外,当利用IP网等进行传输的情况下,附加必要的报头而生成分组。
解码装置
解码装置600包括码分离单元6041、信号解码单元6031、本地解码系数复制单元6100、子带结合单元4051、频域时域变换单元2021、重叠加法运算单元2011。另外,将子带结合单元4051、频域时域变换单元2021以及重叠加法运算单元2011而称为复原信号生成单元4012。码分离单元6041从接收信号中读出码索引Ic与复制偏移信息τr (w),并将其输出(S6041)。信号解码单元6031对码索引Ic进行解码,输出解码信号串S^(w)[k](k=0,...,L’-1)与分配比特信息B[w](S6031)。信号解码单元6031的处理步骤与信号解码单元5031相同。
本地解码系数复制单元6100根据解码信号串S^(w)[k]与复制偏移信息τr (w),生成子带插补解码信号串S~(w)[k](k=0,...,L-1)(S6100)。如图24B所示,本地解码系数复制单元6100包括复制判定单元6001、复制偏移信号串生成单元4002、插补解码信号串生成单元4005。复制判定单元6001在第w子带的分配比特信息B[w]为阈值以下的情况下,输出用于表示生成复制偏移候补信号串S·τ[k]的复制判定标记Flagd (w)(例如,Flagd (w)=1)。另一方面,在第w子带的分配比特信息B[w]大于阈值的情况下,输出用于表示不生成S·τ[k]的复制判定标记Flagd (w)(例如,Flagd (w)=0)(S6001)。
复制偏移信号串生成单元4002、插补解码信号串生成单元4005与实施例3的解码装置400相同。此外,子带结合单元4051、频域时域变换单元2021、重叠加法运算单元2011也与实施例3的解码装置400相同。
通过以上的结构,本实施例的编码装置、解码装置也可得到与实施例3相同的效果。
[变形例]
图29、30表示在将编码对象信号串设为子帧单位的时域的信号串的情况下的功能结构与处理流程。图29A表示编码装置的功能结构例,图29B表示解码装置的功能结构例,图30A表示编码装置的处理流程例,图30B表示解码装置的处理流程例。
编码装置500’、解码装置600’与编码装置500、解码装置600的不同点仅在于编码对象信号串。从而,作为结构单元的处理,只有编码对象信号串生成单元3012’与复原信号生成单元4012’不同。编码对象信号串生成单元3012’与实施例3变形例的编码装置300’相同,复原信号生成单元4012’与实施例3变形例的解码装置400’相同。
由于是这样的结构,因此本变形例的编码装置、解码装置也可得到与实施例4相同的效果。
实施例5
利用图31~图36,说明实施例5。图31表示编码装置的结构例,图32表示解码装置的结构例。图33表示信号编码单元的结构例,图34A表示编码装置内的信号解码单元的结构例,图34B表示解码装置内的信号解码单元的结构例。图35A表示编码装置的处理流程例,图35B表示解码装置的处理流程例。图36是表示码索引的生成方法与数据组的结构的图。另外,本实施例的编码对象信号串是子带频域信号串(与实施例3、4相同)。
编码装置
编码装置700包括帧构成单元1010、子带分割单元3050、信号编码单元7030、信号解码单元7031、本地数据系数搜索单元5000、码复用单元7040。帧构成单元1010和子带分割单元3050与实施例3的编码装置300或实施例4的编码装置500相同。
如图33所示,信号编码单元7030包括参数计算单元5032、第一编码单元5033、第一本地解码单元5034、动态比特分配单元5035、第二编码单元5036,与实施例4的信号编码单元5030的不同之处在于没有本地码复用单元5037。参数计算单元5032、第一编码单元5033、第一本地解码单元5034、动态比特分配单元5035、第二编码单元5036与信号编码单元5030相同。信号编码单元7030将子带频域信号串S(w)[k](w=0,...,W-1、k=0,...,L’-1)作为输入,输出第一信号码索引IA与第二信号码索引IB (w)(S7030)。
信号解码单元7031对第一信号码索引IA与第二信号码索引IB (w)进行解码,输出解码信号串S^(w)[k](k=0,...,L’-1)与分配比特信息B[w](S7031)。如图34(A)所示,信号解码单元7031包括第一本地解码单元5034、动态比特分配单元5035、第二解码单元5039、解码参数处理单元5044。第一本地解码单元5034、动态比特分配单元5035、第二解码单元5039、解码参数处理单元5044与实施例4的编码装置500相同。
本地解码系数搜索单元5000与实施例4的编码装置500相同。码复用单元7040对第一信号码索引IA、第二信号码索引IB (w)、分配比特信息B[w]以及复制偏移信息τr (w)进行复用而生成发送信号(S7040)。例如,如图36所示,码复用单元7040输出第一信号码索引IA作为由一定比特数的比特串构成的数据组(S7041)。接着,将分配比特信息B[w]与阈值进行比较(S7042),当大于阈值的情况下将第w子带的第二信号码索引IB (w)作为B[w]比特的比特串而追加到数据组的最后(S7043)。另一方面,当分配比特信息B[w]为阈值以下的情况下,将第w子带的复制偏移信息τr (w)作为B[w]比特的比特串而追加在数据组的最后(S7044)。对w=0,...,W-1进行步骤S7042~S7044的处理(S7045、S7046),输出发送信号。
解码装置
解码装置800包括码分离单元8041、信号解码单元8032、本地解码系数复制单元6100、子带结合单元4051、频域时域变换单元2021、重叠加法运算单元2011。另外,合并子带结合单元4051、频域时域变换单元2021以及重叠加法运算单元2011而称为复原信号生成单元4012。码分离单元8041从接收信号读出第一信号码索引IA与第二信号码索引IB (w),并将其输出(S8041)。
信号解码单元8032对第一信号码索引IA与第二信号码索引IB (w)进行解码,输出子带的解码信号串S^(w)[k](k=0,...,L’-1)、分配比特信息B[w]以及复制偏移信息τr (w)(S8032)。信号解码单元8032包括第一本地解码单元8043、动态比特分配单元5035、第二解码单元8042、解码参数处理单元5044。首先,第一本地解码单元8043对第一信号码索引IA进行解码,并输出第w子带第一解码参数。动态比特分配单元5035根据子带第一参数输出分配比特信息。动态比特分配单元5035与实施例4的解码装置600相同。第二解码单元8042利用第w子带的分配比特信息B[w],对第w子带第二信号码索引IB (w)进行解码,输出第w子带第二解码参数与复制偏移信息τr (w)。例如,对于全部的w(w=0,...,W-1),在第w子带的分配比特信息B[w]为阈值以下的情况下,第二解码单元8042从第二信号码索引IB (w)读出B[w]比特的比特串并对其进行解码,从而输出子带复制偏移信息τr (w)。当第w子带的分配比特信息B[w]大于阈值的情况下,第二解码单元8043从第二信号码索引IB (w)读出B[w]比特的比特串并对其进行解码,从而输出子带第二解码参数。解码参数处理单元5044与实施例4的解码装置600相同。
本地解码系数复制单元6100、子带结合单元4051、频域时域变换单元2021、重叠加法运算单元2011与实施例4的解码装置600相同。
通过以上的结构,本实施例的编码装置、解码装置也可得到与实施例4相同的效果。
[变形例1]
在本变形例中,对动态比特分配单元5035组合动态比特再分配单元9060。图31表示编码装置的结构例,图32表示解码装置的结构例,图35A表示编码装置的处理流程,图35B表示解码装置的处理流程。图37表示信号编码单元的结构例,图38A表示编码装置内的信号解码单元的结构例,图38B表示解码装置内的信号解码单元的结构例。图39是表示动态比特再分配单元9060的处理步骤的图。
如图37所示,信号编码单元9030包括参数计算单元5032、第一编码单元5033、第一本地解码单元5034、动态比特分配单元5035、动态比特再分配单元9060、第二编码单元5036。参数计算单元5032、第一编码单元5033、第一本地解码单元5034、动态比特分配单元5035、第二编码单元5036与实施例5的信号编码单元7030相同。
如图39所示,动态比特再分配单元9060按照以下的步骤生成分配比特信息。比较动态比特分配单元5035的输出(在本变形例内,称为“第一分配比特信息B[w]”)与阈值,当阈值以下的情况下,将子带的分配比特信息设为B[w]=bmin。将对阈值以下的子带赋予了比特后的剩余的比特数设为bbotal。对剩余的子带,通过与动态比特分配单元5035相同的动作而分配剩余的比特btotal,从而对全部的w决定第w子带的分配比特信息的值而输出。
由于是这样的结构,因此本实施例的编码装置、解码装置也可得到与实施例5相同的效果。此外,由于能够将对子带分配的比特数设为更加适合的数量,因此能够进一步提高主观质量。
[变形例2]
图40~图42表示将编码对象信号串设为子帧单位的时域的信号串的情况下的功能结构与处理流程。图40表示编码装置的功能结构例,图41表示解码装置的功能结构例,图42A表示编码装置的处理流程例,图42B表示解码装置的处理流程例。
编码单元700’、解码装置800’与编码装置700、解码装置800的不同点仅在于编码对象信号串。从而,作为结构单元的处理,只有编码对象信号串生成单元3012’与复原信号生成单元4012’不同。编码对象信号串生成单元3012’与实施例3变形例的编码装置300’相同,复原信号生成单元4012’与实施例3变形例的解码装置400’相同。
由于是这样的结构,因此本变形例的编码装置、解码装置可得到与实施例5相同的效果。
图43表示计算机的功能结构例。另外,本发明的编码方法、解码方法能够通过使计算机2000的记录单元2020读入使计算机2000执行本发明的各步骤的程序,并使处理单元2010、输入单元2030、输出单元2040等工作来实现。此外,作为使计算机读入的方法,存在预先将程序记录在计算机可读取的记录介质,并使程序从记录介质读入到计算机的方法;以及将记录在服务器等的程序通过电通信线路等读入计算机的方法等。
标号说明
100、150、300、500、700、900编码装置
200、250、400、600、800、950解码装置
1000、1500、3000、5000本地解码系数搜索单元
1001、1501、2001、3001、5001、6001复制判定单元
1002、3002复制偏移候补信号串生成单元
1003、1503、3003距离计算单元
1004、3004距离最小偏移量检测单元
1010帧构成单元
1012、3012编码对象信号串生成单元
1030、3030、5030、7030、9030信号编码单元
1031、2031、3031、4031、5031、6031、7031、8032信号解码单元
1040、1540、5040、7040码复用单元
2002、4002复制偏移信号串生成单元
2006、2506、4005插补解码信号串生成单元
2011重叠加法运算单元
2012、4012复原信号生成单元
2021频域时域变换单元
2041、2541、4041、6041、8041码分离单元
2100、2500、4100、6100本地解码系数复制单元
3050子带分割单元            4051子带结合单元
5032参数计算单元            5033第一编码单元
5034、8043第一本地解码单元  5035动态比特分配单元
5036第二编码单元            5037本地码复用单元
5038本地码分离单元          5039、8042第二解码单元
5044解码参数处理单元        9060动态比特再分配单元

Claims (15)

1.一种编码方法,其特征在于,包括:
编码对象信号串生成步骤,根据声音信号生成由预先决定的数量的信号构成的信号串作为编码对象信号串,并作为要输出的编码对象信号串;
信号编码步骤,对每个所述编码对象信号串,输出与该编码对象信号串对应的码索引;
信号解码步骤,对所述码索引进行解码,并输出解码信号串;
本地解码系数搜索步骤,从所述编码对象信号串与所述解码信号串,输出复制偏移信息;以及
码复用步骤,至少对所述码索引与所述复制偏移信息进行复用,从而生成发送信号,
所述本地解码系数搜索步骤包括:
复制判定子步骤,对每个所述编码对象信号串,利用所述解码信号串判定是否生成复制偏移候补信号串,并输出复制判定标记;
复制偏移候补信号串生成子步骤,在所述复制判定标记表示生成复制偏移候补信号串的情况下,对预先决定的全部的信号偏移量的候补,生成复制偏移候补信号串;
距离计算子步骤,计算用于表示各复制偏移候补信号串或利用各复制偏移候补信号串而生成的信号串与所述编码对象信号串的距离的参数;以及
距离最小偏移量检测子步骤,根据所述距离计算子步骤的计算结果,求出距离最小的信号偏移量。
2.如权利要求1所述的编码方法,其特征在于,
所述复制判定子步骤在所述解码信号串的功率为阈值以下的情况下,输出用于表示生成复制偏移候补信号串的复制判定标记,
所述复制偏移候补信号串生成子步骤根据所述解码信号串求出复制偏移候补信号串,
在所述距离计算子步骤中计算的表示距离的参数是表示所述复制偏移候补信号串与所述编码对象信号串的距离的参数。
3.如权利要求1所述的编码方法,其特征在于,
所述复制判定子步骤在所述编码对象信号串与所述解码信号串的误差的功率大于阈值的情况下,输出用于表示生成复制偏移候补信号串的复制判定标记,
所述复制偏移候补信号串生成子步骤根据所述解码信号串求出复制偏移候补信号串,
在所述距离计算子步骤中计算的用于表示距离的参数是表示将所述复制偏移候补信号串与所述复原信号串进行加法运算的插补解码候补信号串与所述编码对象信号串的距离的参数。
4.如权利要求1所述的编码方法,其特征在于,
所述信号解码步骤还计算对每个编码对象信号串分配的比特数,并作为分配比特信息来输出,
所述复制判定子步骤在对所述编码对象信号串分配的比特数是阈值以下的情况下,输出用于表示生成复制偏移候补信号串的复制判定标记,
所述复制偏移候补信号串生成子步骤根据所述解码信号串求出复制偏移候补信号串,
在所述距离计算子步骤中计算的用于表示距离的参数是用于表示所述复制偏移候补信号串与所述编码对象信号串的距离的参数。
5.如权利要求1所述的编码方法,其特征在于,
所述信号解码步骤还计算对每个编码对象信号串分配的比特数,并作为分配比特信息来输出,
所述复制判定子步骤在对所述编码对象信号串分配的比特数为阈值以下的情况下,输出用于表示生成复制偏移候补信号串的复制判定标记,
所述复制偏移候补信号串生成子步骤根据所述解码信号串求出复制偏移候补信号串,
在所述距离计算子步骤中计算的用于表示距离的参数是表示将所述复制偏移候补信号串与所述复原信号串进行加法运算的插补解码候补信号串与所述编码对象信号串的距离的参数。
6.如权利要求2至5的任一项所述的编码方法,其特征在于,
所述编码对象信号串是将频域信号串以频带进行分割所得的子带频域信号串S(w)[k](其中,w=0,...,W-1、k=0,...,L’-1,W是分割的数量,L’是一个子带频域信号串中包含的信号的数量),
所述复制偏移候补信号串生成子步骤利用对于从同一个频域信号串分割的子带频域信号串的所述解码信号串S^(w)[k],求出复制偏移候补信号串S· τ (w)[k]。
7.一种解码方法,其特征在于,包括:
码分离步骤,从接收信号中读出码索引与复制偏移信息,并将其输出;
信号解码步骤,对所述码索引进行解码,并输出解码信号串;
本地解码系数复制步骤,根据所述解码信号串与所述复制偏移信息,生成插补解码信号串;以及
复原信号生成步骤,根据所述插补解码信号串,生成用于表示原来的声音信息的信号即复原信号,
所述本地解码系数复制步骤包括:
复制判定子步骤,利用所述解码信号串,判定是否生成复制偏移信号串,并输出复制判定标记;
复制偏移信号串生成子步骤,在所述复制判定标记表示生成复制偏移候补信号串的情况下,基于所述复制偏移信息所表示的偏移量,生成复制偏移信号串;以及
插补解码信号串生成子步骤,在所述复制判定标记表示生成复制偏移候补信号串的情况下,将所述复制偏移信号串设为插补解码信号串,在所述复制判定标记表示不生成复制偏移候补信号串的情况下,将所述解码信号串设为插补解码信号串,并输出该插补解码信号串。
8.一种解码方法,其特征在于,包括:
码分离步骤,从接收信号读出码索引、复制偏移信息、以及复制判定标记,并将其输出;
信号解码步骤,对所述码索引进行解码,并输出解码信号串;
本地解码系数复制步骤,根据所述解码信号串、所述复制偏移信息以及复制判定标记,生成插补解码信号串;以及
复原信号生成步骤,根据所述插补解码信号串,输出用于表示原来的声音信息的信号即复原信号,
所述本地解码系数复制步骤包括:
复制偏移信号串生成子步骤,在所述复制判定标记表示生成复制偏移候补信号串的情况下,基于所述复制偏移信息所表示的偏移量,生成复制偏移信号串;以及
插补解码信号串生成子步骤,在所述复制判定标记表示生成复制偏移候补信号串的情况下,将所述复制偏移信号串设为插补解码信号串,在所述复制判定标记表示不生成复制偏移候补信号串的情况下,将所述解码信号串设为插补解码信号串,并输出该插补解码信号串。
9.一种解码方法,其特征在于,包括:
码分离步骤,从接收信号读出码索引、复制偏移信息,并将其输出;
信号解码步骤,对所述码索引进行解码,并输出解码信号串;
本地解码系数复制步骤,根据所述解码信号串、所述复制偏移信息,生成插补解码信号串;以及
复原信号生成步骤,根据所述插补解码信号串,生成用于表示原来的声音信息的信号即复原信号,
所述本地解码系数复制步骤包括:
复制判定子步骤,根据所述解码信号串判定是否生成复制偏移信号串,并输出复制判定标记;
复制偏移信号串生成子步骤,在所述复制判定标记表示生成复制偏移候补信号串的情况下,基于所述复制偏移信息所表示的偏移量,生成复制偏移信号串;以及
插补解码信号串生成子步骤,将所述解码信号串与所述复制偏移信号串之和作为插补解码信号串,并输出该插补解码信号串。
10.一种解码方法,其特征在于,包括:
码分离步骤,从接收信号读出码索引、复制偏移信息以及复制判定标记,并将其输出;
信号解码步骤,对所述码索引进行解码,并输出解码信号串;
本地解码系数复制步骤,根据所述解码信号串、所述复制偏移信息以及复制判定标记,生成插补解码信号串;以及
复原信号生成步骤,根据所述插补解码信号串,生成用于表示原来的声音信息的信号即复原信号,
所述本地解码系数复制步骤包括:
复制偏移信号串生成子步骤,在所述复制判定标记表示生成复制偏移候补信号串的情况下,基于所述复制偏移信息所表示的偏移量,生成复制偏移信号串;以及
插补解码信号串生成子步骤,将所述解码信号串与所述复制偏移信号串之和作为插补解码信号串,并输出该插补解码信号串。
11.如权利要求7值10的任一项所述的解码方法,其特征在于,
所述解码信号串S^(w)[k]是将频域信号串以频带进行分割所得的子带频域信号串S(w)[k](其中,w=0,...,W-1、k=0,...,L’-1,W是分割的数量,L’是一个子带频域信号串中包含的信号的数量),
所述复制偏移信号串生成子步骤利用对于从同一个频域信号串分割的子带频域信号串的所述解码信号串S^(w)[k],求出复制偏移信号串S·(w)[k]。
12.一种编码装置,其特征在于,包括:
编码对象信号串生成单元,根据声音信号生成由预先决定的数量的信号构成的信号串作为编码对象信号串,并作为要输出的编码对象信号串;
信号编码单元,对每个所述编码对象信号串,输出与该编码对象信号串对应的码索引;
信号解码单元,对所述码索引进行解码,并输出解码信号串;
本地解码系数搜索单元,根据所述编码对象信号串与所述解码信号串,输出复制偏移信息;以及
码复用单元,至少对所述码索引以及所述复制偏移信息进行复用,从而生成发送信号,
所述本地解码系数搜索单元包括:
复制判定部件,对每个所述编码对象信号串,利用所述解码信号串判定是否生成复制偏移候补信号串,并输出复制判定标记;
复制偏移候补信号串生成部件,在所述复制判定标记表示生成复制偏移候补信号串的情况下,对预先决定的全部的信号偏移量的候补,生成复制偏移候补信号串;
距离计算部件,计算用于表示各复制偏移候补信号串或利用各复制偏移候补信号串而生成的信号串与所述编码对象信号串的距离的参数;以及
距离最小偏移量检测部件,根据所述距离计算部件的计算结果,求出距离最小的信号偏移量。
13.一种解码装置,其特征在于,包括:
码分离单元,从接收信号中至少读出码索引与复制偏移信息,并将其输出;
信号解码单元,对所述码索引进行解码,并输出解码信号串;
本地解码系数复制单元,根据所述解码信号串与所述复制偏移信息,生成插补解码信号串;以及
复原信号生成单元,根据所述插补解码信号串,生成用于表示原来的声音信息的信号即复原信号,
所述本地解码系数复制单元包括:
复制判定部件,利用所述解码信号串,判定是否生成复制偏移信号串,并输出复制判定标记;
复制偏移信号串生成部件,在所述复制判定标记表示生成复制偏移候补信号串的情况下,基于所述复制偏移信息所表示的偏移量,生成复制偏移信号串;以及
插补解码信号串生成部件,在所述复制判定标记表示生成复制偏移候补信号串的情况下,将所述复制偏移信号串设为插补解码信号串,在所述复制判定标记表示不生成复制偏移候补信号串的情况下,将所述解码信号串设为插补解码信号串,并输出该插补解码信号串,或者将所述解码信号串与所述复制偏移信号串之和作为插补解码信号串,并输出该插补解码信号串。
14.一种解码装置,其特征在于,包括:
码分离单元,从接收信号至少读出码索引、复制偏移信息以及复制判定标记,并将其输出;
信号解码单元,对所述码索引进行解码,并输出解码信号串;
本地解码系数复制单元,根据所述解码信号串、所述复制偏移信息以及复制判定标记,生成插补解码信号串;以及
复原信号生成单元,根据所述插补解码信号串,生成用于表示原来的声音信息的信号即复原信号,
所述本地解码系数复制单元包括:
复制偏移信号串生成部件,在所述复制判定标记表示生成复制偏移候补信号串的情况下,基于所述复制偏移信息所表示的偏移量,生成复制偏移信号串;以及
插补解码信号串生成部件,在所述复制判定标记表示生成复制偏移候补信号串的情况下,将所述复制偏移信号串设为插补解码信号串,在所述复制判定标记表示不生成复制偏移候补信号串的情况下,将所述解码信号串设为插补解码信号串,并输出该插补解码信号串,或者将所述解码信号串与所述复制偏移信号串之和设为插补解码信号串,并输出该插补解码信号串。
15.一种程序,使计算机执行权利要求1至11的任一项所述的方法的各步骤。
CN2010800265515A 2009-06-23 2010-06-22 编码方法、解码方法、利用了这些方法的装置、程序 Pending CN102804263A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2009148793 2009-06-23
JP2009-148793 2009-06-23
PCT/JP2010/060522 WO2010150767A1 (ja) 2009-06-23 2010-06-22 符号化方法、復号方法、それらの方法を用いた装置、プログラム

Publications (1)

Publication Number Publication Date
CN102804263A true CN102804263A (zh) 2012-11-28

Family

ID=43386536

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010800265515A Pending CN102804263A (zh) 2009-06-23 2010-06-22 编码方法、解码方法、利用了这些方法的装置、程序

Country Status (6)

Country Link
US (1) US20120123788A1 (zh)
EP (1) EP2447943A4 (zh)
JP (1) JP5400880B2 (zh)
CN (1) CN102804263A (zh)
CA (1) CA2765523A1 (zh)
WO (1) WO2010150767A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9516531B2 (en) 2011-11-07 2016-12-06 Qualcomm Incorporated Assistance information for flexible bandwidth carrier mobility methods, systems, and devices
US9848339B2 (en) * 2011-11-07 2017-12-19 Qualcomm Incorporated Voice service solutions for flexible bandwidth systems
US20130114571A1 (en) 2011-11-07 2013-05-09 Qualcomm Incorporated Coordinated forward link blanking and power boosting for flexible bandwidth systems
US10951292B2 (en) * 2018-01-26 2021-03-16 California Institute Of Technology Systems and methods for random access communication

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002515612A (ja) * 1998-05-14 2002-05-28 テレフオンアクチーボラゲツト エル エム エリクソン 遅延パケット隠蔽方法および装置
JP2002268697A (ja) * 2001-03-13 2002-09-20 Nec Corp パケット誤り耐性付き音声復号装置、音声符号化復号装置、及びその方法
JP2003050598A (ja) * 2001-08-06 2003-02-21 Mitsubishi Electric Corp 音声復号装置
WO2005109401A1 (ja) * 2004-05-10 2005-11-17 Nippon Telegraph And Telephone Corporation 音響信号のパケット通信方法、送信方法、受信方法、これらの装置およびプログラム
JP4050961B2 (ja) * 2002-08-21 2008-02-20 松下電器産業株式会社 パケット型音声通信端末
CN101308659A (zh) * 2007-05-16 2008-11-19 中兴通讯股份有限公司 一种基于先进音频编码器的心理声学模型的处理方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
KR100268623B1 (ko) * 1991-06-28 2000-10-16 이데이 노부유끼 압축 데이타 기록 재생 장치 및 신호 처리 방법
JP3343965B2 (ja) * 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
JP3153075B2 (ja) * 1994-08-02 2001-04-03 日本電気株式会社 音声符号化装置
CA2154911C (en) * 1994-08-02 2001-01-02 Kazunori Ozawa Speech coding device
JPH08179795A (ja) * 1994-12-27 1996-07-12 Nec Corp 音声のピッチラグ符号化方法および装置
JPH08190764A (ja) * 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
TW384434B (en) * 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
US6745162B1 (en) * 2000-06-22 2004-06-01 Sony Corporation System and method for bit allocation in an audio encoder
EP1489599B1 (en) * 2002-04-26 2016-05-11 Panasonic Intellectual Property Corporation of America Coding device and decoding device
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
WO2007043648A1 (ja) * 2005-10-14 2007-04-19 Matsushita Electric Industrial Co., Ltd. 変換符号化装置および変換符号化方法
CN102081926B (zh) * 2009-11-27 2013-06-05 中兴通讯股份有限公司 格型矢量量化音频编解码方法和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002515612A (ja) * 1998-05-14 2002-05-28 テレフオンアクチーボラゲツト エル エム エリクソン 遅延パケット隠蔽方法および装置
JP2002268697A (ja) * 2001-03-13 2002-09-20 Nec Corp パケット誤り耐性付き音声復号装置、音声符号化復号装置、及びその方法
JP2003050598A (ja) * 2001-08-06 2003-02-21 Mitsubishi Electric Corp 音声復号装置
JP4050961B2 (ja) * 2002-08-21 2008-02-20 松下電器産業株式会社 パケット型音声通信端末
WO2005109401A1 (ja) * 2004-05-10 2005-11-17 Nippon Telegraph And Telephone Corporation 音響信号のパケット通信方法、送信方法、受信方法、これらの装置およびプログラム
CN101308659A (zh) * 2007-05-16 2008-11-19 中兴通讯股份有限公司 一种基于先进音频编码器的心理声学模型的处理方法

Also Published As

Publication number Publication date
US20120123788A1 (en) 2012-05-17
JPWO2010150767A1 (ja) 2012-12-10
WO2010150767A1 (ja) 2010-12-29
JP5400880B2 (ja) 2014-01-29
EP2447943A1 (en) 2012-05-02
EP2447943A4 (en) 2013-01-09
CA2765523A1 (en) 2010-12-29

Similar Documents

Publication Publication Date Title
US11990147B2 (en) Adaptive transition frequency between noise fill and bandwidth extension
CN103229234B (zh) 音频编码装置、方法以及音频解码装置、方法
CN101223577B (zh) 对低比特率音频信号进行编码/解码的方法和设备
CN1878001B (zh) 对音频数据编码及解码的设备及方法
CN101878504B (zh) 使用时间分辨率能选择的低复杂性频谱分析/合成
KR101180202B1 (ko) 다중채널 오디오 코딩 시스템 내에 인핸스먼트 레이어를 생성하기 위한 방법 및 장치
US5384891A (en) Vector quantizing apparatus and speech analysis-synthesis system using the apparatus
CN102089808B (zh) 音频编码器、音频解码器、用于编码及解码音频信号的方法
EP2301022B1 (en) Multi-reference lpc filter quantization device and method
CN1809872B (zh) 编码音频信号的设备和方法及解码已编码音频信号的设备和方法
CN102272832B (zh) 基于峰值检测的选择性缩放掩码计算
CN1702974B (zh) 用于对数字信号编码/解码的方法和设备
US8639519B2 (en) Method and apparatus for selective signal coding based on core encoder performance
CN101971253B (zh) 编码装置、解码装置以及其方法
TW296517B (zh)
WO1998000837A1 (fr) Procedes de codage et de decodage de signaux audio, et codeur et decodeur de signaux audio
CN102272831A (zh) 基于峰值检测的选择性缩放掩码计算
CN100590712C (zh) 编码装置和译码装置
Kuo et al. Covert audio watermarking using perceptually tuned signal independent multiband phase modulation
CN1890713B (zh) 用于数字信号压缩编码的多脉冲字典的索引间的编码转换的方法及系统
CN102804263A (zh) 编码方法、解码方法、利用了这些方法的装置、程序
US9830919B2 (en) Acoustic signal coding apparatus, acoustic signal decoding apparatus, terminal apparatus, base station apparatus, acoustic signal coding method, and acoustic signal decoding method
US20090306994A1 (en) method and an apparatus for identifying frame type
CN101292285B (zh) 编码和解码多声道音频信号的方法及其装置
Ostergaard et al. Perceptual audio coding using n-channel lattice vector quantization

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121128