CN101061533B - 语音编码装置和语音编码方法 - Google Patents
语音编码装置和语音编码方法 Download PDFInfo
- Publication number
- CN101061533B CN101061533B CN200580035271XA CN200580035271A CN101061533B CN 101061533 B CN101061533 B CN 101061533B CN 200580035271X A CN200580035271X A CN 200580035271XA CN 200580035271 A CN200580035271 A CN 200580035271A CN 101061533 B CN101061533 B CN 101061533B
- Authority
- CN
- China
- Prior art keywords
- conversion coefficient
- analysis
- frame
- signal
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 18
- 238000004458 analytical method Methods 0.000 claims abstract description 184
- 238000006243 chemical reaction Methods 0.000 claims description 137
- 238000004891 communication Methods 0.000 claims description 10
- 230000002123 temporal effect Effects 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 description 25
- 238000003786 synthesis reaction Methods 0.000 description 23
- 239000002131 composite material Substances 0.000 description 8
- 230000007704 transition Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 206010023198 Joint ankylosis Diseases 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 208000008822 Ankylosis Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
能够将延迟量抑制为低延迟,并且能够减轻连接失真的语音编码装置。在该装置中,在长分析单元(21),由窗口乘法单元(211)对分析长度M1的长分析帧信号乘以分析窗口,并将乘以了该分析窗口的信号输出到MDCT单元(212),由MDCT单元(212)对所输入的信号进行MDCT而获得长分析帧的变换系数,并输出到变换系数编码单元(30)。另一方面,在短分析单元(22),窗口乘法单元(221)对分析长度M2(M2<M1)的短分析帧信号乘以分析窗口,并将乘以了该分析窗口的信号输出到MDCT单元(222),由MDCT单元(222)对所输入的信号进行MDCT而获得短分析帧的变换系数,并输出到变换系数编码单元(30)。变换系数编码单元(30)对这些变换系数进行编码并输出。
Description
技术领域
本发明涉及语音编码装置和语音编码方法。
背景技术
在语音编码中,将时间信号变换到频域并对变换系数进行编码的变换编码,能够有效率地去除时间信号所包含的冗余性。另外,在变换编码,通过利用以频带表示的人的听觉特性,即使为低比特率,也能够实现难以感觉到量化失真的编码。
近年来,在变换编码中,多利用被称为重叠正交变换(LOT;LappedOrthogonal Transform)的变换技术。这种技术是基于除了块内的正交性以外还考虑与相邻块之间的正交性的正交基,进行变换的技术,作为其代表的方法,可以举MDCT(Modified Discrete Cosine Transform)。在MDCT,以当前的分析帧和其前后的分析帧重叠的方式配置分析帧而进行分析。这时,变换后的系数中,只将分析长度的一半的系数作为编码对象即可,因此通过利用MDCT能够有效率地进行编码。并且,在合成时将当前帧与相邻的帧重叠相加,因此有以下特点,即,即使在对每个帧发生不同的量化失真的情况下,也难以发生在帧边界的间断。
一般来说,在利用MDCT进行分析/合成时,将作为窗口函数的分析窗口和合成窗口分别与对象信号相乘。这时所使用的分析窗口/合成窗口与相邻帧重叠的位置的部分倾斜(slope)。该重叠区间的长度(即,斜坡长)与输入帧的缓存所需的延迟相当于因MDCT分析/合成而发生的延迟的长度。在双向通信中,如果该延迟变大,使得来自通信对方终端的响应达到本终端为止要费较长时间,无法形成流畅的会话。因此期望延迟尽量短。
下面,说明现有的MDCT。
在MDCT所使用的分析窗口/合成窗口,在满足式(1)所示的条件时,能够实现完全重构(在没有量化失真的前提下,变换造成的失真为0)。
(式1)
win(i)·wout(i)+win(i+N/2)·wout(i+N/2)=1
(0≤i<N)
作为满足式(1)的条件的有代表性的窗口,在非专利文献1提出了式(2)所示的正弦窗口。另外,图1是用图表示该正弦窗口的图。在使用这样的正弦窗口时,因为正弦窗口的谱特性能够充分的衰减旁瓣,所以能够以较高的精度分析频谱。
(式2)
(0≤i<N)
另外,在非专利文献2提出了使用式(3)所示的窗口作为满足式(1)的条件的窗口,来进行MDCT分析/合成的方法。其中,N表示分析窗口的长度,L表示重叠区间的长度。另外,图2是用图表示式(3)所示的窗口的图。在使用这种窗口时,因为重叠区间为L,所以由该窗口产生的延迟表示为L。因此,通过将重叠区间L设定得短,能够抑制延迟的发生。
(式3)
(非专利文献1)守谷健弘著,“音声符号化”,(社)电子情报通信学会,1998年10月20日,pp.36-38
(非专利文献2)M.Iwadare,et al.,“A 128 kb/s Hi-Fi Audio CODEC Basedon Adaptive Transform Coding with Adaptive Block Size MDC T,”IEEE Journalon SelectedAreas in Communications,Vol.10,No.1,PP.138-144,Jan.1992.
发明内容
本发明需要解决的问题
在使用式(2)所示的正弦窗口时,如图1所示,相邻的分析帧的重叠区间为分析帧的1/2的长度。在本例子中,因为分析帧长为N,所以重叠区间为N/2。因此,在合成端,合成位于N/2~N-1的信号时,除非获得下一个分析帧的信息,否则无法合成信号。也就是说,直到获得位于(3N/2)-1的采样值为止,不能在下一个分析帧进行MDCT分析,获得(3N/2)-1的位置的样本后,才能在下一个分析帧进行MDCT分析,能够使用该分析帧的变换系数来合成N/2~N-1的信号。因此,在使用正弦窗口时,发生N/2长度的延迟。
另一方面,在使用式(3)所示的窗口时,由于重叠区间L较短,容易发生帧间的间断。对当前分析帧和下一个分析帧分别进行MDCT分析并量化其变换系数时,因为分别独立进行量化,在当前分析帧和下分析帧分别发生不同的量化失真。将附加了量化失真的变换系数逆变换到时域的话,对该时间信号在整个合成帧附加量化失真。也就是说,无相关地发生当前的合成帧的量化失真和下一个合成帧的量化失真。因此,在重叠区间较短时,在合成帧间的相邻部分,不能充分的吸收起因于量化失真的解码信号的间断性,而会感觉到帧间的连接失真。使重叠区间越短,这种倾向越显著地发生。
本发明的目的为提供能够将延迟量抑制为低延迟,并且能够减轻连接失真的语音编码装置和语音编码方法。
解决问题的方案
本发明的语音编码装置,对时域的语音信号的每个帧进行编码,其包括:分析单元,对各个帧,按一部分互相重叠的分析长度M1的分析长度和分析长度M2的分析长度分别进行改进的离散余弦变换分析,从而获得频域的与所述分析长度M1对应的第一变换系数和与所述分析长度M2对应的第二变换系数,其中M1>M2,M1和M2的重叠区间为M2/2;以及编码单元,对所述第一变换系数和所述第二变换系数进行编码,其中所述编码单元利用以下的比特分配方式对所述第一变换系数和所述第二变换系数进行编码:在与所述第一变换系数相邻的所述第二变换系数的编码中使用的每个变换系数的比特数,大于在所述第一变换系数的编码中使用的每个变换系数的比特数。
本发明的语音编码装置,对时域的语音信号的每个帧进行编码,其包括:判定单元,监视语音信号的特征量的时间上的变化,并根据其变化量与规定量之间的大小关系,判定所述帧中所包含的信号是所述语音信号的稳定部分 还是非稳定部分;第一分析单元,在所述判定单元判定所述帧中所包含的信号是稳定部分时,对各个帧,按一部分互相重叠的分析长度M1的分析长度和分析长度M2的分析长度分别进行改进的离散余弦变换分析,从而获得频域的与所述分析长度M1对应的第一变换系数和与所述分析长度M2对应的第二变换系数,其中M1>M2,M1和M2的重叠区间为M2/2;第二分析单元,在所述判定单元判定所述帧中所包含的信号是非稳定部分时,对各个帧,按分析长度M2多次重复进行改进的离散余弦变换分析,从而获得频域的第三变换系数;以及编码单元,在所述判定单元判定所述帧中所包含的信号是稳定部分时,对所述第一变换系数和所述第二变换系数进行编码,在所述判定单元判定所述帧中所包含的信号是非稳定部分时,对所述第三变换系数进行编码,其中所述编码单元在对所述第一变换系数和所述第二变换系数进行编码时,利用以下的比特分配方式进行编码:在与所述第一变换系数相邻的所述第二变换系数的编码中使用的每个变换系数的比特数,大于在所述第一变换系数的编码中使用的每个变换系数的比特数。
本发明的语音编码方法,用于对时域的语音信号每个帧进行编码的语音编码装置,其包括:分析步骤,对各个帧,按一部分互相重叠的分析长度M1的分析长度和分析长度M2的分析长度分别进行改进的离散余弦变换分析,从而获得频域的与所述分析长度M1对应的第一变换系数和与所述分析长度M2对应的第二变换系数,其中M1>M2,M1和M2的重叠区间为M2/2;以及编码步骤,对所述第一变换系数和所述第二变换系数进行编码,其中在所述编码步骤中,利用以下的比特分配方式对所述第一变换系数和所述第二变换系数进行编码:在与所述第一变换系数相邻的所述第二变换系数的编码甲使用的每个变换系数的比特数,大于在所述第一变换系数的编码中使用的每个变换系数的比特数。
本发明的语音编码方法,用于对时域的语音信号每个帧进行编码的语音编码装置,其包括:判定步骤,监视语音信号的特征量的时间上的变化,并根据其变化量与规定量之间的大小关系,判定所述帧中所包含的信号是所述语音信号的稳定部分还是非稳定部分;第一分析步骤,在所述判定步骤中判定所述帧中所包含的信号是稳定部分时,对各个帧,按一部分互相重叠的分析长度M1的分析长度和分析长度M2的分析长度分别进行改进的离散余弦变换分析,从而获得频域的与所述分析长度M1对应的第一变换系数和与所述 分析长度M2对应的第二变换系数,其中M1>M2,M1和M2的重叠区间为M2/2;第二分析步骤,在所述判定步骤中判定所述帧中所包含的信号是非稳定部分时,对各个帧,按分析长度M2多次重复进行改进的离散余弦变换分析,从而获得频域的第三变换系数;以及编码步骤,在所述判定步骤中判定所述帧中所包含的信号是稳定部分时,对所述第一变换系数和所述第二变换系数进行编码,在所述判定步骤中判定所述帧中所包含的信号是非稳定部分时,对所述第三变换系数进行编码,其中在所述编码步骤中,在对所述第一变换系数和所述第二变换系数进行编码时,利用以下的比特分配方式进行编码:在与所述第一变换系数相邻的所述第二变换系数的编码中使用的每个变换系数的比特数,大于在所述第一变换系数的编码中使用的每个变换系数的比特数。
发明的有益效果
根据本发明,能够将延迟量抑制为低延迟,并且能够减轻连接失真。
附图说明
图1是表示以往的分析窗口的图。
图2是表示以往的分析窗口的图。
图3是表示本发明实施方式1的语音编码装置和语音解码装置的结构的图。
图4是表示本发明实施方式1的语音编码装置的结构的方框图。
图5是本发明实施方式1的语音编码装置的信号状态转移图。
图6是表示本发明实施方式1的分析窗口的图。
图7是表示本发明实施方式1的语音解码装置的结构的方框图。
图8是本发明实施方式1的语音解码装置的信号状态转移图。
图9是本发明实施方式1的语音编码装置的动作说明图。
图10是表示本发明实施方式1的分析窗口的图。
图11是表示本发明实施方式1的分析窗口的图。
图12是表示本发明实施方式2的分析窗口的图。
图13是表示本发明实施方式2的语音编码装置的结构的方框图。
图14是表示本发明实施方式2的语音解码装置的结构的方框图。
具体实施方式
下面,参照附图详细地说明本发明的实施方式。
(实施方式1)
本发明实施方式1的语音编码装置和语音解码装置的结构为如图3所示。如该图所示,语音编码装置包括:帧构成单元10、分析单元20和变换系数编码单元30。另外,语音解码装置包括:变换系数解码单元50、合成单元60和帧连接单元70。
在语音编码装置中,帧构成单元10对所输入的时域的语音信号进行帧化。分析单元20将所帧化的时域的语音信号通过MDCT分析而变换到频域信号。变换系数编码单元30对由分析单元20获得的变换系数进行编码,并输出编码参数。该编码参数通过传输路径被发送到语音解码装置。
在语音解码装置中,变换系数解码单元50对通过传输路径发送来的编码参数进行解码。合成单元60通过MDCT合成,由解码的变换系数生成时域信号。帧连接单元70连接时域信号以在相邻的帧间不产生间断,并输出解码语音信号。
接着,进一步详细地说明语音编码装置。语音编码装置的更详细的结构为如图4所示,信号的状态迁移为如图5所示。其中,图4所示的信号A~G分别与图5所示的信号A~G对应。
语音信号A被输入到帧构成单元10后,由帧构成单元10决定用于长分析的分析帧区间(长分析帧)和用于短分析的分析帧区间(短分析帧)。然后,帧 构成单元10将长分析帧信号B输出到长分析单元21的窗口乘法单元211,并将短分析帧信号C输出到短分析单元22的窗口乘法单元221。另外,长分析帧长(长分析窗口长)和短分析帧长(短分析窗口长)是预先决定的,这里假设长分析帧长为M1,短分析帧长为M2(M1>M2)的情况进行说明。因此,产生的延迟为M2/2。
在长分析单元21,窗口乘法单元211对分析长度(分析窗口长)M1的长分析帧信号B乘以分析窗口,并将乘以该分析窗口的信号D输出到MDCT单元212。作为分析窗口使用如图6所示的长分析窗口。该长分析窗口是基于式(3),以分析长度为M1、重叠区间为M2/2的条件而设计的分析窗口。
MDCT单元212根据式(4)对信号D施以MDCT。然后,MDCT单元212将通过该MDCT而获得的变换系数F输出到变换系数编码单元30。另外,在式(4)中,{s1(i);0≤i<M1}代表长分析帧所包含的时间信号,{X1(k);0≤k<M1/2}代表通过长分析而获得的变换系数F。
(式4)
另一方面,在短分析单元22,窗口乘法单元221对分析长度(分析窗口长)M2的短分析帧信号C乘以分析窗口,并将乘以该分析窗口的信号E输出到MDCT单元222。作为分析窗口使用如图6所示的短分析窗口。该短分析窗口是基于式(2)以分析长度为M2(M2<M1)的条件而设计的分析窗口。
MDCT单元222根据式(5)对信号E进行MDCT。然后,MDCT单元222将通过该MDCT而获得的变换系数G输出到变换系数编码单元30。另外,在式(5)中,{s2(i);0≤i<M2}表示短分析帧所包含的时间信号,{X2(k);0≤k<M2/2}表示通过短分析而获得的变换系数G。
(式5)
变换系数编码单元30对变换系数F:{X1(k)}和变换系数G:{X2(k)}进行编码,将各个编码参数时分复用并输出。这时,变换系数编码单元30对变换系数{X2(k)},进行与变换系数{X1(k)}的编码相比精度更高的(量化误差更小的)编码。例如,变换系数编码单元30将变换系数{X2(k)}的每个变换系数的编码比特数设定得比变换系数{X1(k)}的每个变换系数的编码比特数高,从而对 变换系数{X1(k)}和变换系数{X2(k)}进行编码。也就是说,在变换系数编码单元30,以与变换系数{X1(k)}相比使变换系数{X2(k)}的量化失真较小的方式进行编码。另外,作为在变换系数编码单元30的编码方法,还可采用例如特开2003-323166号公报所记载的编码方法等。
接着,更详细地说明语音解码装置。语音解码装置的更详细的结构为如图7所示,信号的状态迁移为如图8所示。其中,图7所示的信号A~1分别与图8所示的信号A~I对应。
编码参数被输入到变换系数解码单元50后,在编码系数解码单元50对解码变换系数(长分析){X1q(k);0≤k<M1/2}:A和解码变换系数(短分析){X2q(k);0≤k<M2/2}:B进行解码。然后,变换系数解码单元50将解码变换系数{X1q(k)}:A输出到长合成单元61的IMDCT单元611,并将解码变换系数{X2q(k)}:B输出到短合成单元62的IMDCT单元621。
在长合成单元61,IMDCT单元611对解码变换系数{X1q(k)}进行IMDCT(在MDCT单元212进行的MDCT的逆变换)而生成长合成信号C,并将该长合成信号C输出到窗口乘法单元612。
窗口乘法单元612对长合成信号C乘以合成窗口,并将该乘以合成窗口的信号E输出到帧内连接单元71。就合成窗口来说,与语音编码装置的窗口乘法单元211相同地,使用如图6所示的长分析窗口。
另一方面,在短合成单元62,IMDCT单元621对解码变换系数{X2q(k)}进行IMDCT(在MDCT单元222进行的MDCT的逆变换)来生成短合成信号D,并将该短合成信号D输出到窗口乘法单元622。
窗口乘法单元622对短合成信号D乘以合成窗口,并将该乘以合成窗口的信号F输出到帧内连接单元71。就合成窗口来说,与语音编码装置的窗口乘法单元211相同地,使用如图6所示的短分析窗口。
然后,在帧内连接单元71生成第n帧的解码信号G,接着由帧间连接单元73,将第n帧的解码信号G和第n-1帧的解码信号H的对应的区间重叠相加,从而生成解码语音信号。也就是说,在帧内连接单元71,将信号E和信号F的对应的区间重叠相加而生成第n帧的解码信号{sq(i);0≤i<M1}:G。并且,在帧间连接单元73,将第n帧的解码信号G和缓存器72所缓存的第n-1帧的解码信号H的对应的区间重叠相加,从而生成解码语音信号I。然后,将第n帧的解码信号G存储于缓存器72,以便用于下一帧(第n+1帧)的处理。
接着,图9表示语音信号的各个帧与分析单元20中的分析位置之间的对应关系。如图9所示,在本实施方式中,一帧区间(生成编码参数的单位)的语音信号的分析,对任何一帧都必需通过长分析和短分析的组合来进行。
这样,在本实施方式,因为以较长的分析长度(长分析)和较短的分析长度(短分析)的组合方式进行MDCT分析,并且,以使通过短分析而获得的变换系数的量化误差较小的方式进行编码处理,所以能够在延迟较短的状态下取较长的分析长度以便高效率地去除冗余性,同时能够使短分析的变换系数的量化失真小。由此,能够将延迟量抑制为M2/2的低延迟,并且能够减轻连接失真。
另外,有关在一帧区间中的长分析窗口和短分析窗口的配置,在图6中,从时间上来说,在长分析窗口的后面配置短分析窗口,但是也可例如图10所示,从时间上来说,在短分析窗口的后面配置长分析窗口。即使进行如图10所示的配置,与如图6所示的配置一样,也能够将延迟量抑制为低延迟,并且能够减轻连接失真。
并且,在本实施方式,基于式(2)来设计短分析窗口,但只要短分析窗口的分析长度M2和长分析窗口的分析长度M1的关系为M2<M1,也可使用式(3)所示的窗口作为短分析窗口。即,也可将基于式(3)以分析长度为M2的条件来设计的窗口作为短分析窗口使用。图11表示其一例。在这样的分析窗口的结构中,也能够将延迟量抑制为低延迟,并且能够减轻连接失真。
(实施方式2)
在输入到语音编码装置的语音信号是起头部或特性急剧变化的迁移部时,与频率分辨率相比,更需要时间分辨率。对于这样的语音信号,在使用短分析帧分析所有的分析帧时,能够进一步提高语音质量。
因此,在本实施方式,将对各个帧进行的MDCT分析根据输入语音信号的特性切换为(1)由长分析和短分析的组合来进行的模式(长短混合分析模式)和(2)多次重复进行短分析的模式(全短分析模式)。图12表示在全短分析模式时,对各个帧使用的分析/合成窗口的例子。另外,长短混合分析模式的说明为如在实施方式1所述。
图13表示本发明实施方式2的语音编码装置的结构。如本图所示,本实施方式的语音编码装置除了实施方式1的结构(图4)以外,还包括:判定单元15、复用单元35、SW(开关)11和SW12。在图13中,对与图4相同的结构 赋予相同的标号,并省略其说明。另外,实际上,如图4所示并行地进行从帧构成单元10到分析单元20的输出和从分析20到变换系数编码单元30的输出,但这里为了图示上的方便,用一条信号线表示。
判定单元15对输入语音信号进行分析而判定信号的特性。在特性判定中,监视语音信号的特征量的时间上的变化,在其变化量低于规定量时,判定为稳定部分,在规定量以上时,判定为非稳定部分。作为语音信号的特征量,例如可以举短区间功率、短区间频谱等。
然后,判定单元15根据判定结果,将MDCT分析的分析模式切换为长短混合分析模式或全部短分析模式。也就是说,判定单元15,在所输入的语音信号为稳定部分时,将SW11和SW12接到分析单元20端,并使用分析单元20以长短混合分析模式进行MDCT分析。另一方面,所输入的语音信号为非稳定部分时,将SW11和SW12接到全部短分析单元25端,使用全短分析单元25以全部短分析模式进行MDCT分析。通过该切换,对于语音信号的帧,在它是稳定部分时如实施方式1所示地由长分析和短分析的组合进行分析,在它是非稳定部分时多次重复进行短分析。
由判定单元15选择全部短分析模式时,全部短分析单元25使用式(2)所示的分析窗口,其中假设分析窗口长为M2,通过式(5)所示的MDCT进行分析。
另外,在判定单元15,对表示是稳定部分还是非稳定部分的判定信息进行编码,并输出到复用单元35。由复用单元35将该判定信息与从变换系数编码单元30输出的编码参数复用并输出。
另一方面,图14表示本发明实施方式2的语音解码装置的结构。如本图所示,本实施方式的语音解码装置除了实施方式1的结构(图7)以外,还包括:分离单元45、判定信息解码单元55、全部短合成单元65、SW21和SW22。在图14中,对与图7相同的结构赋予相同的标号,并省略其说明。另外,实际上,如图7所示并行地进行从变换系数解码单元50到合成单元60的输出和从合成单元60到帧内连接单元71的输出,但这里为了图示上的方便,用一条信号线表示。
分离单元45将输入的编码参数分离为表示判定信息的编码参数和表示变换系数的编码参数,分别输出到判定信息解码单元55和变换系数解码单元50。
判定信息解码单元55对所输入的判定信息进行解码。然后,判定信息解码单元55,在判定信息表示稳定部分时,将SW21和SW22连接到合成单元60端上,并使用合成单元60来生成合成信号。另外,关于使用合成单元60的合成信号的生成,如实施方式1所述。另一方面,判定信息表示非稳定部分时,将SW21和SW22连接到全部短合成单元65端上,并使用全部短合成单元65来生成合成信号。全部短合成单元65对一帧中的多个解码变换系数(短分析)的每一个进行IMDCT处理,从而生成合成信号。
这样,在本实施方式,在一帧中,在输入语音信号为稳定部分而稳定时,对该帧的语音信号以长分析和短分析的组合进行分析,而在输入语音信号为非稳定部分时(在输入语音信号急剧变化时),对该帧的语音信号都以短分析进行分析以便提高时间分辨率,因此,能够根据输入语音信号的特性能够进行最适合的MDCT分析,即使在输入语音信号的特性变化时,也能够良好地保持语音质量。
另外,在本实施方式,使长短混合分析模式的重叠区间与全短分析模式的重叠区间为同一区间。因此,不需使用例如ISO/IEC IS 13818-7 Informationtechnology--Generic coding of moving pictures and associated audio information--Part 7:Advanced Audio Coding(AAC)所记载的LONG_START_WINDOW或LONG_STOP_WINDOW等转移用的分析帧。
另外,作为判定是长短混合分析模式还是全部短分析模式的另外一个方法,可以列举下述方法,即,根据位于与下一帧的连接部的信号的、相对于原本信号的SNR的大小来判定的方法。通过使用该判定方法,能够根据连接部的SNR决定下一帧的分析模式,因此能够降低分析模式的误判定。
另外,上述各个实施方式可适用于层数为二以上的分层编码的扩展层。
另外,上述各个实施方式的语音编码装置、语音解码装置可装载于在移动通信系统中所使用的无线通信移动装置和无线通信基站装置等无线通信装置。
另外,在上述实施方式中,举例说明由硬件构成本发明的情况,但本发明还可由软件实现。
另外,用于上述实施方式的说明中的各功能块通常被作为集成电路的LSI来实现。这些块既可以被单独地集成为一个芯片,也可以是一部分或全部被集成为一个芯片。虽然此处称为LSI,但根据集成程度,可以被称为IC、 系统LSI、超级LSI(Super LSI)、或特大LSI(Ultra LSI)。
另外,实现集成电路化的方法不仅限于LSI,也可使用专用电路或通用处理器来实现。也可以使用在LSI制造后,可编程的FPGA(Field ProgrammableGate Array),或者可重构LSI内部的电路单元的连接和设定的可重构处理器。
再者,随着半导体的技术进步或随之派生的其它技术的出现,如果能够出现替代LSI集成电路化的新技术,当然可利用新技术进行功能块的集成化。还存在着适用生物技术等的可能性。
本说明书是根据2004年10月26日申请的日本专利申请第2004-311143号。其内容全部包含于此。
工业实用性
本发明可适用于移动通信系统和采用互联网协议的分组通信系统等的通信装置。
Claims (6)
1.一种语音编码装置,对时域的语音信号的每个帧进行编码,其包括:
分析单元,对各个帧,按一部分互相重叠的分析长度M1的分析长度和分析长度M2的分析长度分别进行改进的离散余弦变换分析,从而获得频域的与所述分析长度M1对应的第一变换系数和与所述分析长度M2对应的第二变换系数,其中M1>M2,M1和M2的重叠区间为M2/2;以及
编码单元,对所述第一变换系数和所述第二变换系数进行编码,其中
所述编码单元利用以下的比特分配方式对所述第一变换系数和所述第二变换系数进行编码:在与所述第一变换系数相邻的所述第二变换系数的编码中使用的每个变换系数的比特数,大于在所述第一变换系数的编码中使用的每个变换系数的比特数。
2.一种语音编码装置,对时域的语音信号的每个帧进行编码,其包括:
判定单元,监视语音信号的特征量的时间上的变化,并根据其变化量与规定量之间的大小关系,判定所述帧中所包含的信号是所述语音信号的稳定部分还是非稳定部分;
第一分析单元,在所述判定单元判定所述帧中所包含的信号是稳定部分时,对各个帧,按一部分互相重叠的分析长度M1的分析长度和分析长度M2的分析长度分别进行改进的离散余弦变换分析,从而获得频域的与所述分析长度M1对应的第一变换系数和与所述分析长度M2对应的第二变换系数,其中M1>M2,M1和M2的重叠区间为M2/2;
第二分析单元,在所述判定单元判定所述帧中所包含的信号是非稳定部分时,对各个帧,按分析长度M2多次重复进行改进的离散余弦变换分析,从而获得频域的第三变换系数;以及
编码单元,在所述判定单元判定所述帧中所包含的信号是稳定部分时,对所述第一变换系数和所述第二变换系数进行编码,在所述判定单元判定所述帧中所包含的信号是非稳定部分时,对所述第三变换系数进行编码,其中
所述编码单元在对所述第一变换系数和所述第二变换系数进行编码时,利用以下的比特分配方式进行编码:在与所述第一变换系数相邻的所述第二变换系数的编码中使用的每个变换系数的比特数,大于在所述第一变换系数的编码中使用的每个变换系数的比特数。
3.一种无线通信移动台装置,包括如权利要求1或2所述的语音编码装置。
4.一种无线通信基站装置,包括如权利要求1或2所述的语音编码装置。
5.一种语音编码方法,用于对时域的语音信号每个帧进行编码的语音编码装置,其包括:
分析步骤,对各个帧,按一部分互相重叠的分析长度M1的分析长度和分析长度M2的分析长度分别进行改进的离散余弦变换分析,从而获得频域的与所述分析长度M1对应的第一变换系数和与所述分析长度M2对应的第二变换系数,其中M1>M2,M1和M2的重叠区间为M2/2;以及
编码步骤,对所述第一变换系数和所述第二变换系数进行编码,其中
在所述编码步骤中,利用以下的比特分配方式对所述第一变换系数和所述第二变换系数进行编码:在与所述第一变换系数相邻的所述第二变换系数的编码中使用的每个变换系数的比特数,大于在所述第一变换系数的编码中使用的每个变换系数的比特数。
6.一种语音编码方法,用于对时域的语音信号每个帧进行编码的语音编码装置,其包括:
判定步骤,监视语音信号的特征量的时间上的变化,并根据其变化量与规定量之间的大小关系,判定所述帧中所包含的信号是所述语音信号的稳定部分还是非稳定部分;
第一分析步骤,在所述判定步骤中判定所述帧中所包含的信号是稳定部分时,对各个帧,按一部分互相重叠的分析长度M1的分析长度和分析长度M2的分析长度分别进行改进的离散余弦变换分析,从而获得频域的与所述分析长度M1对应的第一变换系数和与所述分析长度M2对应的第二变换系数,其中M1>M2,M1和M2的重叠区间为M2/2;
第二分析步骤,在所述判定步骤中判定所述帧中所包含的信号是非稳定部分时,对各个帧,按分析长度M2多次重复进行改进的离散余弦变换分析,从而获得频域的第三变换系数;以及
编码步骤,在所述判定步骤中判定所述帧中所包含的信号是稳定部分时,对所述第一变换系数和所述第二变换系数进行编码,在所述判定步骤中判定所述帧中所包含的信号是非稳定部分时,对所述第三变换系数进行编码,其中
在所述编码步骤中,在对所述第一变换系数和所述第二变换系数进行编码时,利用以下的比特分配方式进行编码:在与所述第一变换系数相邻的所述第二变换系数的编码中使用的每个变换系数的比特数,大于在所述第一变换系数的编码中使用的每个变换系数的比特数。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004311143 | 2004-10-26 | ||
JP311143/2004 | 2004-10-26 | ||
PCT/JP2005/019578 WO2006046546A1 (ja) | 2004-10-26 | 2005-10-25 | 音声符号化装置および音声符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101061533A CN101061533A (zh) | 2007-10-24 |
CN101061533B true CN101061533B (zh) | 2011-05-18 |
Family
ID=36227786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200580035271XA Active CN101061533B (zh) | 2004-10-26 | 2005-10-25 | 语音编码装置和语音编码方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8326606B2 (zh) |
EP (1) | EP1793372B1 (zh) |
JP (1) | JP5100124B2 (zh) |
KR (1) | KR20070068424A (zh) |
CN (1) | CN101061533B (zh) |
AT (1) | ATE537536T1 (zh) |
BR (1) | BRPI0517513A (zh) |
WO (1) | WO2006046546A1 (zh) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8326606B2 (en) * | 2004-10-26 | 2012-12-04 | Panasonic Corporation | Sound encoding device and sound encoding method |
BRPI0616624A2 (pt) | 2005-09-30 | 2011-06-28 | Matsushita Electric Ind Co Ltd | aparelho de codificação de fala e método de codificação de fala |
US7991611B2 (en) * | 2005-10-14 | 2011-08-02 | Panasonic Corporation | Speech encoding apparatus and speech encoding method that encode speech signals in a scalable manner, and speech decoding apparatus and speech decoding method that decode scalable encoded signals |
EP2323131A1 (en) * | 2006-04-27 | 2011-05-18 | Panasonic Corporation | Audio encoding device, audio decoding device, and their method |
US7987089B2 (en) | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
US8036903B2 (en) | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
BRPI0718738B1 (pt) | 2006-12-12 | 2023-05-16 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo |
CN101548318B (zh) * | 2006-12-15 | 2012-07-18 | 松下电器产业株式会社 | 编码装置、解码装置以及其方法 |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
ES2619277T3 (es) * | 2007-08-27 | 2017-06-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Detector de transitorio y método para soportar la codificación de una señal de audio |
WO2009047675A2 (en) * | 2007-10-10 | 2009-04-16 | Koninklijke Philips Electronics N.V. | Encoding and decoding of an audio signal |
CN101604983B (zh) * | 2008-06-12 | 2013-04-24 | 华为技术有限公司 | 编解码装置、系统及其方法 |
AU2009267518B2 (en) * | 2008-07-11 | 2012-08-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
CN102216982A (zh) | 2008-09-18 | 2011-10-12 | 韩国电子通信研究院 | 在基于修正离散余弦变换的译码器与异质译码器间转换的编码设备和解码设备 |
WO2011013980A2 (en) | 2009-07-27 | 2011-02-03 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
EP3998606B8 (en) | 2009-10-21 | 2022-12-07 | Dolby International AB | Oversampling in a combined transposer filter bank |
CN102243872A (zh) * | 2010-05-10 | 2011-11-16 | 炬力集成电路设计有限公司 | 对音频数字信号进行编码、解码的方法及系统 |
WO2012070866A2 (ko) * | 2010-11-24 | 2012-05-31 | 엘지전자 주식회사 | 스피치 시그널 부호화 방법 및 복호화 방법 |
FR2977439A1 (fr) * | 2011-06-28 | 2013-01-04 | France Telecom | Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard. |
EP2795617B1 (en) * | 2011-12-21 | 2016-08-10 | Dolby International AB | Audio encoders and methods with parallel architecture |
KR101390551B1 (ko) * | 2012-09-24 | 2014-04-30 | 충북대학교 산학협력단 | 저 지연 변형된 이산 코사인 변환 방법 |
KR20140075466A (ko) * | 2012-12-11 | 2014-06-19 | 삼성전자주식회사 | 오디오 신호의 인코딩 및 디코딩 방법, 및 오디오 신호의 인코딩 및 디코딩 장치 |
ES2634621T3 (es) | 2013-02-20 | 2017-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para generar una señal de audio o imagen codificada o para descodificar una señal de audio o imagen codificada en presencia de transitorios utilizando una parte de superposición múltiple |
EP2830058A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frequency-domain audio coding supporting transform length switching |
EP3230980B1 (en) * | 2014-12-09 | 2018-11-28 | Dolby International AB | Mdct-domain error concealment |
RU2718418C2 (ru) * | 2015-11-09 | 2020-04-02 | Сони Корпорейшн | Устройство декодирования, способ декодирования и программа |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0797313A2 (en) * | 1996-03-19 | 1997-09-24 | Lucent Technologies Inc. | Switched filterbank for use in audio signal coding |
US5848391A (en) * | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
CN1361594A (zh) * | 2000-12-25 | 2002-07-31 | 松下电器产业株式会社 | 编码音频信号的设备、方法和计算机程序产品 |
CN1487746A (zh) * | 2002-08-28 | 2004-04-07 | ��ķɭ���ó��˾ | 编码或解码音频信号的方法和设备 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ZA921988B (en) * | 1991-03-29 | 1993-02-24 | Sony Corp | High efficiency digital data encoding and decoding apparatus |
US5487086A (en) * | 1991-09-13 | 1996-01-23 | Comsat Corporation | Transform vector quantization for adaptive predictive coding |
US5285498A (en) | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
JP3531177B2 (ja) * | 1993-03-11 | 2004-05-24 | ソニー株式会社 | 圧縮データ記録装置及び方法、圧縮データ再生方法 |
US5533052A (en) * | 1993-10-15 | 1996-07-02 | Comsat Corporation | Adaptive predictive coding with transform domain quantization based on block size adaptation, backward adaptive power gain control, split bit-allocation and zero input response compensation |
US6167093A (en) * | 1994-08-16 | 2000-12-26 | Sony Corporation | Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission |
KR100373294B1 (ko) * | 1994-08-22 | 2003-05-17 | 소니 가부시끼 가이샤 | 송수신장치 |
US5701389A (en) * | 1995-01-31 | 1997-12-23 | Lucent Technologies, Inc. | Window switching based on interblock and intrablock frequency band energy |
US5825320A (en) * | 1996-03-19 | 1998-10-20 | Sony Corporation | Gain control method for audio encoding device |
US6138120A (en) * | 1998-06-19 | 2000-10-24 | Oracle Corporation | System for sharing server sessions across multiple clients |
JP2000134106A (ja) * | 1998-10-29 | 2000-05-12 | Matsushita Electric Ind Co Ltd | オーディオ変換符号化のための周波数領域でのブロックサイズ判定適応方法 |
DE19921122C1 (de) * | 1999-05-07 | 2001-01-25 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
US20020147652A1 (en) * | 2000-10-18 | 2002-10-10 | Ahmed Gheith | System and method for distruibuted client state management across a plurality of server computers |
AU2001276588A1 (en) * | 2001-01-11 | 2002-07-24 | K. P. P. Kalyan Chakravarthy | Adaptive-block-length audio coder |
JP2003066998A (ja) | 2001-08-28 | 2003-03-05 | Mitsubishi Electric Corp | 音響信号符号化装置 |
US7460993B2 (en) * | 2001-12-14 | 2008-12-02 | Microsoft Corporation | Adaptive window-size selection in transform coding |
JP2003216188A (ja) | 2002-01-25 | 2003-07-30 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化方法、符号化装置、及び記憶媒体 |
JP2004252068A (ja) | 2003-02-19 | 2004-09-09 | Matsushita Electric Ind Co Ltd | デジタルオーディオ信号の符号化装置及び方法 |
US7325023B2 (en) * | 2003-09-29 | 2008-01-29 | Sony Corporation | Method of making a window type decision based on MDCT data in audio encoding |
US7315822B2 (en) * | 2003-10-20 | 2008-01-01 | Microsoft Corp. | System and method for a media codec employing a reversible transform obtained via matrix lifting |
US8326606B2 (en) * | 2004-10-26 | 2012-12-04 | Panasonic Corporation | Sound encoding device and sound encoding method |
US7386445B2 (en) * | 2005-01-18 | 2008-06-10 | Nokia Corporation | Compensation of transient effects in transform coding |
-
2005
- 2005-10-25 US US11/577,638 patent/US8326606B2/en active Active
- 2005-10-25 BR BRPI0517513-5A patent/BRPI0517513A/pt not_active Application Discontinuation
- 2005-10-25 JP JP2006543162A patent/JP5100124B2/ja active Active
- 2005-10-25 EP EP05799362A patent/EP1793372B1/en active Active
- 2005-10-25 KR KR1020077009506A patent/KR20070068424A/ko not_active Application Discontinuation
- 2005-10-25 CN CN200580035271XA patent/CN101061533B/zh active Active
- 2005-10-25 AT AT05799362T patent/ATE537536T1/de active
- 2005-10-25 WO PCT/JP2005/019578 patent/WO2006046546A1/ja active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0797313A2 (en) * | 1996-03-19 | 1997-09-24 | Lucent Technologies Inc. | Switched filterbank for use in audio signal coding |
US5848391A (en) * | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
CN1361594A (zh) * | 2000-12-25 | 2002-07-31 | 松下电器产业株式会社 | 编码音频信号的设备、方法和计算机程序产品 |
CN1487746A (zh) * | 2002-08-28 | 2004-04-07 | ��ķɭ���ó��˾ | 编码或解码音频信号的方法和设备 |
Also Published As
Publication number | Publication date |
---|---|
JP5100124B2 (ja) | 2012-12-19 |
KR20070068424A (ko) | 2007-06-29 |
JPWO2006046546A1 (ja) | 2008-05-22 |
WO2006046546A1 (ja) | 2006-05-04 |
EP1793372A1 (en) | 2007-06-06 |
EP1793372A4 (en) | 2008-01-23 |
US20080065373A1 (en) | 2008-03-13 |
US8326606B2 (en) | 2012-12-04 |
CN101061533A (zh) | 2007-10-24 |
ATE537536T1 (de) | 2011-12-15 |
BRPI0517513A (pt) | 2008-10-14 |
EP1793372B1 (en) | 2011-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101061533B (zh) | 语音编码装置和语音编码方法 | |
CN101425294B (zh) | 声音编解码与发送接收设备及编码方法、通信终端和基站 | |
CN101615396B (zh) | 语音编码设备、以及语音解码设备 | |
CN101878504B (zh) | 使用时间分辨率能选择的低复杂性频谱分析/合成 | |
CN102280109B (zh) | 编码装置、解码装置及它们的方法 | |
CN101067931B (zh) | 一种高效可配置的频域参数立体声及多声道编解码方法与系统 | |
TWI332193B (en) | Method and apparatus of processing time-varying signals coding and decoding and computer program product | |
JP5123303B2 (ja) | 不可逆的符号化データ・ストリームと可逆的伸張データ・ストリームを用いて原信号を可逆的に符号化する方法及び装置 | |
CN1849647B (zh) | 采样速率转换装置、编码装置、解码装置及它们的方法 | |
CN102150205A (zh) | 用于编码和解码统合的语音与音频的设备 | |
JP2001522156A (ja) | オーディオ信号をコーディングする方法及び装置並びにビットストリームをデコーディングする方法及び装置 | |
CN101006495A (zh) | 语音编码装置、语音解码装置、通信装置以及语音编码方法 | |
CN101162584A (zh) | 使用带宽扩展技术对音频信号编码和解码的方法和设备 | |
US8983830B2 (en) | Stereo signal encoding device including setting of threshold frequencies and stereo signal encoding method including setting of threshold frequencies | |
KR960006301A (ko) | 음향 신호 부호화/복호화 방법 | |
US8027242B2 (en) | Signal coding and decoding based on spectral dynamics | |
JP3144009B2 (ja) | 音声符号復号化装置 | |
CN101393743A (zh) | 一种可配置参数的立体声编码装置及其编码方法 | |
CN105957533B (zh) | 语音压缩方法、语音解压方法及音频编码器、音频解码器 | |
US9524727B2 (en) | Method and arrangement for scalable low-complexity coding/decoding | |
Venkateswaran et al. | An Efficient Time Domain Speech Compression Algorithm Based on LPC and Sub-Band Coding Techniques. | |
JPH08129400A (ja) | 音声符号化方式 | |
CN102598124A (zh) | 编码装置、解码装置及其方法 | |
CN1199959A (zh) | 音频编码方法和装置 | |
CN102610233A (zh) | 采用自适应声码器的数字对讲机 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
ASS | Succession or assignment of patent right |
Owner name: OPTICAL WIRELESS TECHNOLOGY CO., LTD. Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD. Effective date: 20141021 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20141021 Address after: texas Patentee after: Optical Wireless Technology Co., Ltd. Address before: Osaka Japan Patentee before: Matsushita Electric Industrial Co., Ltd. |