CN110491402A - 周期性综合包络序列生成装置、方法、程序、记录介质 - Google Patents
周期性综合包络序列生成装置、方法、程序、记录介质 Download PDFInfo
- Publication number
- CN110491402A CN110491402A CN201910728067.XA CN201910728067A CN110491402A CN 110491402 A CN110491402 A CN 110491402A CN 201910728067 A CN201910728067 A CN 201910728067A CN 110491402 A CN110491402 A CN 110491402A
- Authority
- CN
- China
- Prior art keywords
- envelope sequence
- code
- sequence
- audio signal
- periodically
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000001228 spectrum Methods 0.000 claims abstract description 122
- 238000004364 calculation method Methods 0.000 claims abstract description 78
- 230000005236 sound signal Effects 0.000 claims abstract description 75
- 230000008859 change Effects 0.000 claims description 10
- 238000010606 normalization Methods 0.000 description 60
- 230000000737 periodic effect Effects 0.000 description 38
- 241000209094 Oryza Species 0.000 description 29
- 235000007164 Oryza sativa Nutrition 0.000 description 29
- 235000009566 rice Nutrition 0.000 description 29
- 238000009499 grossing Methods 0.000 description 28
- 238000012545 processing Methods 0.000 description 26
- 230000008569 process Effects 0.000 description 19
- 230000000694 effects Effects 0.000 description 10
- 230000009466 transformation Effects 0.000 description 9
- 108010076504 Protein Sorting Signals Proteins 0.000 description 5
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 3
- 241000208340 Araliaceae Species 0.000 description 3
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 3
- 235000003140 Panax quinquefolius Nutrition 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000003795 desorption Methods 0.000 description 3
- 235000008434 ginseng Nutrition 0.000 description 3
- 230000005284 excitation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Peptides Or Proteins (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Error Detection And Correction (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
提供能够提高音频信号的基音周期引起的波峰的附近的近似精度的包络序列以及周期性综合包络序列生成装置、方法、程序、记录介质。本发明的周期性综合包络序列生成装置,将预定的时间区间即帧单位的时域的音频数字信号作为输入音频信号,作为包络序列而生成周期性综合包络序列。本发明的周期性综合包络序列生成装置至少包括频谱包络序列计算部和周期性综合包络生成部。频谱包络序列计算部基于输入音频信号的时域的线性预测,计算输入音频信号的频谱包络序列。周期性综合包络生成部基于输入音频信号在频域中的周期性分量,对频谱包络序列进行变形,并设为周期性综合包络序列。
Description
本申请为以下专利申请的分案申请:申请日为2015年2月20日,申请号为201580022816.7,发明名称为“周期性综合包络序列生成装置、周期性综合包络序列生成方法、记录介质”。
技术领域
本发明涉及对音频信号的频谱包络进行计算的周期性综合包络序列生成装置、周期性综合包络序列生成方法、周期性综合包络序列生成程序、以及记录介质。
背景技术
作为低比特(例如10kbit/s~20kbit/s左右)的语音信号或音频信号的编码方法,已知DFT(离散傅里叶变换)或MDCT(变形离散余弦变换)等对于正交变换系数的自适应编码。例如在非专利文献1中使用的TCX(transform coded excitation:变换编码激励)编码方法中,求出从作为所输入的声音信号的频域表现的系数串X[1],…,X[N]消除了振幅频谱包络的影响的序列(归一化序列串XN[1],…,XN[N]),并对其进行可变长度编码。其中,[]内的N是正整数。
振幅频谱包络通过以下的步骤算出。
(步骤1)以作为预定的时间区间的帧单位,进行对所输入的时域的音频数字信号(以下,输入音频信号)的线性预测分析从而求出线性预测系数α1,…,αP。其中,P是表示预测阶数的正整数。例如,通过作为全极点模型的P阶自回归过程,在时刻t的输入音频信号x(t),根据回溯至P时点的过去的自身的值x(t-1),…,x(t-P)、预测残差e(t)、以及线性预测系数α1,…,αP,通过式(1)表示。
x(t)=α1x(t-1)+…+αpx(t-P)+e(t)(1)
(步骤2)对线性预测系数α1,…,αP进行量化,求出已量化线性预测系数^α1,…,^αP。使用已量化线性预测系数^α1,…,^αP求出N点的输入音频信号的振幅频谱包络序列W[1],…,W[N]。例如,振幅频谱包络序列的各值W[n]能够通过式(2)求出。其中,n是1≦n≦N的整数,exp(·)是以纳皮尔数作为底的指数函数,j是虚数单位,σ是预测残差信号的振幅。
另外,在本说明书中,在右上角以没有用括号的方式标记的符号表示幂乘运算。也就是说,σ2表示σ的平方。此外,文中使用的符号“~”、“^”等本来应记载在紧随其后的字符的正上方,但由于文本记法的限制,记载在该字符的紧跟前。在数学式中这些符号表示在本来的位置、即字符的正上方。
[现有技术文献]
[非专利文献]
[非专利文献1]Anthony Vetro,“MPEG Unified Speech and Audio Coding”,Industry and Standards,IEEE MultiMedia,April-June,2013.
发明内容
发明要解决的课题
在音频信号的编码中,为了在解码侧也得到频谱包络的信息,需要将与频谱包络对应的码传送到解码侧。在如非专利文献1那样通过线性预测系数求得频谱包络的情况下,传送到解码侧的“与频谱包络对应的码”是“与线性预测系数对应的码”,具有只需较少码量即可的优点。另一方面,通过线性预测系数求出的频谱包络的信息,有时会在输入音频信号的基音周期引起的波峰的附近的近似精度变差。并且,这有时也会导致对归一化系数串进行可变长度编码时的编码效率的降低。
鉴于这样的问题,在本发明中,提供能够提高音频信号的基音周期引起的波峰的附近的近似精度的包络序列。
用于解决课题的方案
本发明的周期性综合包络序列生成装置,将预定的时间区间即帧单位的时域的音频数字信号作为输入音频信号,作为包络序列而生成周期性综合包络序列。本发明的周期性综合包络序列生成装置至少包括频谱包络序列计算部和周期性综合包络生成部。频谱包络序列计算部基于输入音频信号的时域的线性预测,计算输入音频信号的频谱包络序列。周期性综合包络生成部基于输入音频信号在频域中的周期性分量,对频谱包络序列进行变形,并设为周期性综合包络序列。
发明效果
根据由本发明的周期性综合包络序列生成装置所生成的周期性综合包络序列,输入音频信号的基音周期引起的波峰附近的近似精度也会变好。
附图说明
图1是表示实施例1的周期性综合包络序列生成装置的功能结构例的图。
图2是表示实施例1的周期性综合包络序列生成装置的处理流程的图。
图3是表示周期性包络序列P[1],…,P[N]的例子的图。
图4A是用于说明针对相同的音频信号所生成的序列的差异的例子的图,是表示对数列X[1],…,X[N]进行了插补的曲线的形状的图。
图4B是用于说明针对相同的音频信号所生成的序列的差异的例子的图,是表示对周期性包络序列P[1],…,P[N]进行了插补的曲线的形状的图。
图4C是用于说明针对相同的音频信号所生成的序列的差异的例子的图,是表示对平滑化振幅频谱包络序列~W[1],…,~W[N]进行了插补的曲线的形状的图。
图4D是用于说明针对相同的音频信号所生成的序列的差异的例子的图,是表示对周期性综合包络序列WM[1],…,WM[N]进行了插补的曲线的形状的图。
图5是表示实施例2的编码装置的功能结构例的图。
图6是表示实施例2的编码装置的处理流程的图。
图7是表示实施例2的解码装置的功能结构例的图。
图8是表示实施例2的解码装置的处理流程的图。
图9是表示实施例3的编码装置的功能结构例的图。
图10是表示实施例3的编码装置的处理流程的图。
图11是表示实施例3的解码装置的功能结构例的图。
图12是表示实施例3的解码装置的处理流程的图。
具体实施方式
以下,详细说明本发明的实施方式。另外,对具有相同的功能的构成部附加相同的编号,省略重复说明。
[实施例1]
在图1中示出本发明的周期性综合包络序列生成装置的功能结构例,在图2中示出本发明的周期性综合包络序列生成装置的处理流程。周期性综合包络序列生成装置100包括频谱包络序列计算部120、频域变换部110、周期性分析部130、周期性包络序列生成部140、周期性综合包络生成部150,将所输入的时域的音频数字信号作为输入音频信号x(t),生成基于序列串的频率分量对振幅频谱包络序列进行了变形的周期性综合包络序列。
<频谱包络序列计算部120>
频谱包络序列计算部120基于输入音频信号x(t)的时域的线性预测,计算输入音频信号的振幅频谱包络序列W[1],…,W[N](S120)。其中,N是正整数。频谱包络序列计算部120与现有技术相同,通过以下的步骤计算即可。
(步骤1)以作为预定的时间区间的帧单位,进行对输入音频信号的线性预测分析从而求出线性预测系数α1,…,αP。其中,P是表示预测阶数的正整数。例如,通过作为全极点模型的P阶自回归过程,在时刻t的输入音频信号x(t),根据回溯至P时点的过去的自身的值x(t-1),…,x(t-P)、预测残差e(t)、以及线性预测系数α1,…,αP,通过式(1)表示。
(步骤2)使用线性预测系数α1,…,αP求出N点的输入音频信号的振幅频谱包络序列W[1],…,W[N]。例如,振幅频谱包络序列的各值W[n]能够使用与线性预测系数α1,…,αP对应的已量化线性预测系数^α1,…,^αP通过式(2)求出。或者,振幅频谱包络序列的各值W[n]能够使用线性预测系数α1,…,αP,通过将式(2)的^αp置换成αp后的公式求出。
<频域变换部110>
频域变换部110以作为预定的时间区间的帧单位,将所输入的时域的输入音频信号变换为频域的N点的系数串X[1],…,X[N]之后输出(S110)。向频域的变换通过MDCT(变形离散余弦变换)或DFT(离散傅里叶变换)等方法进行即可。
<周期性分析部130>
周期性分析部130以系数串X[1],…,X[N]作为输入,求出该系数串X[1],…,X[N]的周期T,并输出周期T(S130)。
周期T是与来自输入音频信号的频域的系数串例如系数串X[1],…,X[N]的、具有周期性的分量的间隔(系数串周期性地成为较大的值的间隔)对应的信息。在以下,有时也会将周期T表示为间隔T,但只是表达上的差异,是相同的含义。T是正值,可以是整数,也可以是小数(例如,5.0、5.25、5.5、5.75)。
此外,周期性分析部130也可以根据需要,以系数串X[1],…,X[N]作为输入,还求出并输出表示周期性的程度的指标S。在该情况下,例如,基于系数串X[1],…,X[N]的具有周期性的分量的部分的能量与除此之外的部分的能量之比等,求出表示周期性的程度的指标S。在该情况下,指标S成为表示频域的样本串的周期性的程度的指标。另外,具有周期性的分量的大小越大、即周期T的整数倍的样本或位于其附近的样本的振幅(样本值的绝对值)越大,频域的样本串的“周期性的程度”越大。
另外,周期性分析部130也可以根据时域的输入音频信号求出时域的周期,通过将求出的时域的周期变换为频域的周期而求出周期T。此外,也可以求出将时域的周期变换为频域的周期后的值的常数倍或其附近的值作为周期T。同样地,周期性分析部130也可以根据时域的输入音频信号,例如基于时间偏移了时域的周期的信号串之间的相关的大小等,求出表示周期性的程度的指标S。
总之,根据时域的输入音频信号或来自它的频域系数串而求出周期T或指标S的方法从以往开始就存在各种方法,因而可以选择并利用其中的任意方法。
<周期性包络序列生成部140>
周期性包络序列生成部140将间隔T作为输入,输出周期性包络序列P[1],…,P[N](S140)。周期性包络序列P[1],…,P[N]是,以基音周期引起的周期来具有波峰的频域的离散序列、即与谐波模型对应的离散序列。在图3中示出周期性包络序列P[1],…,P[N]的例子。如图3所示的波形那样,周期性包络序列P[1],…,P[N]是如下的序列,即只有与作为间隔T的整数倍的附近的整数值的索引及其前后的预定数量的索引对应的周期性包络的值具有正值,除此之外则为0。作为间隔T的整数倍的附近的整数值的索引会周期性地取最大值(波峰),与其前后的预定数量的索引对应的P[n]的值,处于随着其索引n远离与波峰对应的索引而单调递减的关系。图3的横轴的1,2,…,表示离散样本点的索引(以下,“频率索引”)。
例如,将n作为表示频率索引的变量,将τ作为与极大值(波峰)对应的频率索引,波峰的形状通过以下的函数Q(n)来表示。其中,间隔T的小数点以下的位数为L位,将间隔T’设为T’=T×2L。
h=2.8·(1.125-exp(-0.07·T′/2L)),
PD=0.5·(2.6-exp(-0.05·T′/2L))
h表示波峰的高度,间隔T越大则波峰的高度变得越高。此外,PD表示波峰部分的宽度,间隔T越大则宽度变得越宽。
将U设为表示从1到波峰的数量为止的正整数(例如,图3的情况下为1~10),将v设为1以上的整数(例如,1到3左右),将floor(·)设为舍去小数点以下而返回整数值的函数,则周期性包络序列P[n]例如如下计算即可。
其中,(U×T’)/2L-v≦n≦(U×T’)/2L+v。例如,在L=2时,若T=20.00则T’=80、若T=20.25则T’=81、若T=20.50则T’=82、若T=20.75则T’=83。另外,周期性包络序列P[n]也可以使用将小数点第一位进行四舍五入而返回整数值的函数Round(·),并如下计算。
<周期性综合包络生成部150>
周期性综合包络生成部150至少将周期性包络序列P[1],…,P[N]、振幅频谱包络序列W[1],…,W[N]作为输入,求出周期性综合包络序列WM[1],…,WM[N](S150)。具体而言,如下式那样求出周期性综合包络WM[n]。
WM[n]=W[n]·(1+δ·P[n])(6)
另外,δ是被决定为周期性综合包络WM[n]和系数X[n]的绝对值序列的形状变得接近的值或者是预先确定的值。
在周期性综合包络生成部150中决定δ使得周期性综合包络WM[n]和系数X[n]的绝对值序列的形状变得接近的情况下,周期性综合包络生成部150将系数串X[1],…,X[N]也作为输入,输出所决定的δ和此时的周期性综合包络序列WM[1],…,WM[N]即可。例如,δ从δ的几个候选例如0.4和0.8这两个δ的候选中决定为通过以下的公式定义的E成为最小的δ即可。换言之,决定为周期性综合包络WM[n]和系数X[n]的绝对值序列的形状变得接近的δ即可。
δ是决定要在周期性综合包络WM[n]中将周期性包络P[n]考虑多少的值。换言之,可以说δ是决定周期性综合包络WM[n]中的振幅频谱包络W[n]和周期性包络P[n]的混合比率的值。此外,式(9)的G是系数串X[1],…,X[N]的各系数X[n]的绝对值的序列与周期性综合包络序列的倒数的序列的内积。式(8)的~WM[n]是,通过G对周期性综合包络的各值WM[n]进行了归一化的归一化周期性综合包络。在式(7)中,计算系数串X[1],…,X[N]与归一化周期性综合包络序列~WM[1],…,~WM[N]的内积的四次方是为了强调绝对值特别大的系数X[n]而减小取得内积后的值(距离)。也就是说,意味着决定δ以便在系数串X[1],…,X[N]中绝对值特别大的系数X[n]与周期性综合包络WM[n]变得接近。
此外,在周期性综合包络生成部150中根据周期性的程度来决定δ的候选数的情况下,周期性综合包络生成部150也可以将表示周期性的程度的指标S也作为输入,在指标S表示对应于周期性高的帧的情况时从大量候选数的δ的候选中选择通过式(7)定义的E变得最小的δ,在指标S表示对应于周期性低的帧的情况时将δ设为预先确定的值。即,在周期性综合包络生成部150中根据周期性的程度来决定δ的候选数的情况下,周期性越高,越是增加δ的候选的数量即可。
<实施例1的发明的效果>
在图4A~图4D中示出用于说明针对相同的音频信号所生成的序列的差异的例子。在图4A中示出对系数串X[1],…,X[N]进行插补后的曲线的形状,在图4B中示出对周期性包络序列P[1],…,P[N]进行插补后的曲线的形状,在图4C中示出对平滑化振幅频谱包络序列~W[1],…,~W[N]进行插补后的曲线的形状,在图4D中示出对周期性综合包络序列WM[1],…,WM[N]进行插补后的曲线的形状。如图4A~图4D所示,与平滑化振幅频谱包络序列~W[1],…,~W[N]相比,周期性综合包络序列WM[1],…,WM[N]成为包含在系数串X[1],…,X[N]中出现的周期性的波峰的形状。此外,只要在有作为表示频谱包络的信息的线性预测系数或者已量化线性预测系数之外,还有间隔T、或者间隔T和值δ的信息,就能够生成周期性综合包络序列WM[1],…,WM[N]。因此,仅凭对表示输入音频信号的频谱包络的信息追加少量的信息量,就能够比通过线性预测系数求出的频谱包络更高精度地表现输入音频信号的基音周期引起的振幅的波峰。即,通过线性预测系数或者已量化线性预测系数、以及间隔T、或者间隔T和值δ这样的少量信息量,能够高精度地估计输入音频信号的振幅。另外,平滑化振幅频谱包络~W[n]是通过下式表现的包络,γ是用于对振幅频谱系数进行钝化(平滑化)的1以下的正的常数。
此外,在编码装置和解码装置中使用本发明的周期性综合包络序列生成装置的情况下,在编码装置所包含的周期性综合包络序列生成装置以外的处理部中得到的用于确定已量化线性预测系数^αp的码(线性预测系数码CL)、和用于确定周期T或时域的周期的码(周期码CT)被输入到解码装置,因此如果从本发明的周期性综合包络序列生成装置输出表示δ的信息的码,则在解码侧的周期性综合包络序列生成装置中也能够生成与在编码侧的周期性综合包络序列生成装置中生成的周期性综合包络序列相同的周期性综合包络序列。因此,从编码装置对解码装置传送码时增加的码量较少。
<实施例1的发明点>
在实施例1的周期性综合包络序列生成装置100中,周期性综合包络生成部150基于系数串X[1],…,X[N]的周期性分量,对振幅频谱包络序列W[1],…,W[N]进行变形而设为周期性综合包络序列WM[1],…,WM[N]是最重要的关键点。尤其,系数串X[1],…,X[N]的周期性的程度越大、即具有周期性的分量的大小越大,越是较大地变更振幅频谱包络序列W[1],…,W[N]中间隔T(周期)的整数倍及其附近的样本的值,则容易获得上述的效果。“附近的样本”是以作为间隔T的整数倍的附近的整数值的索引表示的样本。此外,“附近”例如设为通过式(3)~(5)等预先确定的方法决定的范围即可。
此外,系数串X[1],…,X[N]的具有周期性的分量的间隔T越宽,由式(4)和式(5)所示的周期性包络序列P[1],…,P[N]具有越大的值,且在较宽的宽度、即间隔T(周期)的整数倍及其附近的多个样本中具有0以外的值。也就是说,系数串的具有周期性的分量的间隔T越宽,周期性综合包络生成部150越是较大地变更振幅频谱包络序列中间隔T(周期)的整数倍及其附近的样本的值。此外,系数串的具有周期性的分量的间隔T越宽,周期性综合包络生成部150越是将振幅频谱包络序列在较宽的宽度、即间隔T(周期)的整数倍及其附近的多个样本中变更样本值。“附近的多个样本中”意味着增加存在于符合“附近”的范围(通过预先确定的方法决定的范围)的样本。也就是说,周期性综合包络生成部150若如此对振幅频谱包络序列进行变形,则容易获得上述的效果。
另外,作为有效地利用周期性综合包络序列具有的“能够更高精度地表现输入音频信号的基音周期引起的振幅的波峰。”这一特征的例子,有编码装置和解码装置,在实施例2、3中表示该例子。其中,周期性综合包络序列的特征的利用例除了编码装置和解码装置之外,还可能有去噪装置或后置滤波器等。因此在实施例1中说明了周期性综合包络序列生成装置。
[变形例1](通过归一化系数串进行周期性分析的例子)
变形例1的周期性综合包络序列生成装置也在图1中示出。变形例1的周期性综合包络序列生成装置的处理流程也在图2中示出。在周期性综合包络序列生成装置101中,还包括频域序列归一化部111,并且频谱包络序列计算部121、周期性分析部131与周期性综合包络序列生成装置100不同,其他的结构相同。以下仅说明不同点。
<频谱包络序列计算部121>
频谱包络序列计算部121不仅求出振幅频谱包络序列W[1],…,W[N],还求出平滑化振幅频谱包络序列~W[1],…,~W[N]。
具体而言,频谱包络序列计算部121除了频谱包络序列计算部120中示出的(步骤1)、(步骤2)之外,还进行以下步骤的处理。
(步骤3)对已量化线性预测系数^αp的每一个乘以γp,求出已量化平滑化线性预测系数^α1γ,^α2γ2,…,^αPγP。γ是用于进行平滑化的1以下的正的常数。并且,根据式(10),求出平滑化振幅频谱包络序列~W[1],…,~W[N](S121)。当然,与频谱包络序列计算部120同样地,也可以取代已量化线性预测系数^αp而使用线性预测系数αp。
<频域序列归一化部111>
频域序列归一化部111对系数串X[1],…,X[N]的各系数除以平滑化振幅频谱包络序列~W[1],…,~W[N]的各系数而得到归一化系数串XN[1],…,XN[N]。即,针对n=1,…,N,进行
XN[n]=X[n]/~W[n](11)
的计算,求出归一化系数串XN[1],…,XN[N](S111)。
<周期性分析部131>
周期性分析部131将归一化系数串XN[1],…,XN[N]作为输入,求出该归一化系数串XN[1],…,XN[N]的周期T,输出周期T(S131)。即,在本变形例中,将来自输入音频信号的频域的系数串即归一化系数串XN[1],…,XN[N]的具有周期性的分量的间隔作为周期T而求出。此外,周期性分析部131也可以根据需要,将系数串X[1],…,X[N]作为输入,还求出并输出表示周期性的程度的指标S。
其他的处理与周期性综合包络序列生成装置100相同。因此,可得到与实施例1同样的效果。另外,在周期性综合包络序列生成装置101的情况下,周期性综合包络生成部150也可以取代振幅频谱包络序列W[1],…,W[N]而使用平滑化振幅频谱包络序列~W[1],…,~W[N]。在该情况下,取代式(6),成为下式的计算。
[变形例2](从外部输入信息的例子)
在编码装置或解码装置在内部具备本发明的周期性综合包络序列生成装置的情况下,有时通过编码装置或解码装置所包含的周期性综合包络序列生成装置以外的处理部求出系数串X[1],…,X[N]、归一化系数串XN[1],…,XN[N]、已量化线性预测系数^αp、已量化平滑化线性预测系数^αpγp、振幅频谱包络序列W[1],…,W[N]、平滑化振幅频谱包络序列~W[1],…,~W[N]、周期T、指标S等。在这样的情况下,也可以设为在周期性综合包络序列生成装置中不具备频域变换部、频域归一化部、频谱包络序列计算部、周期性分析部中的至少其中一个的结构。在该情况下,从编码装置内的周期性综合包络序列生成装置以外的处理部输出用于确定已量化线性预测系数^αp的码(线性预测系数码CL)、用于确定周期T或时域的周期的码(周期码CT)、用于确定指标S的码等,并被输入到解码装置。因此,在该情况下,从编码装置内的周期性综合包络序列生成装置,不需要输出用于确定已量化线性预测系数^αp的码(线性预测系数码CL)、用于确定周期T或时域的周期的码(周期码CT)、用于确定指标S的码等。
此外,在编码装置或解码装置中使用本发明的周期性综合包络序列生成装置的情况下,需要使在编码装置或解码装置中能够得到相同的周期性综合包络序列。因此,需要使用能够根据编码装置输出且输入到解码装置的码而确定的信息,得到周期性综合包络序列。例如,需要在编码装置中使用的周期性综合包络序列生成装置的频谱包络序列计算部中,使用与线性预测系数码CL对应的已量化线性预测系数而求出振幅频谱包络序列,在解码装置中使用的周期性综合包络序列生成装置的频谱包络序列计算部中,使用与从编码装置输出且输入到解码装置的线性预测系数码CL对应的解码线性预测系数,求出振幅频谱包络序列。
另外,在编码装置或解码装置中使用周期性综合包络序列的情况下,不是如上述那样在其内部具备周期性综合包络序列生成装置,而是在编码装置和解码装置中具备周期性综合包络序列生成装置内的必要的处理部即可。在实施例2中说明这样的编码装置或解码装置。
[实施例2]
《编码装置》
在图5中示出实施例2的编码装置的功能结构例,在图6中示出实施例2的编码装置的处理流程。编码装置200包括频谱包络序列计算部221、频域变换部110、频域序列归一化部111、周期性分析部230、周期性包络序列生成部140、周期性综合包络生成部250、可变长度编码参数计算部260、可变长度编码部270。编码装置200将所输入的时域的音频数字信号作为输入音频信号x(t),至少输出表示已量化线性预测系数^α1,…,^αP的码CL、表示归一化系数串XN[1],…,XN[N]的周期的间隔T的码CT、对归一化系数串XN[1],…,XN[N]进行了可变长度编码的可变长度码CX。频域序列归一化部111与实施例1、变形例1相同。频域变换部110和周期性包络序列生成部140与实施例1相同。以下说明不同的构成部。
<频谱包络序列计算部221>
频谱包络序列计算部221基于输入音频信号x(t)的时域的线性预测,计算输入音频信号的振幅频谱包络序列W[1],…,W[N]和平滑化振幅频谱包络序列~W[1],…,~W[N],还求出表示在计算的过程中得到的已量化线性预测系数^α1,…,^αP的码CL(S221)。其中,N是正整数。频谱包络序列计算部221通过以下的步骤进行处理即可。
(步骤1)以作为预定的时间区间的帧单位,进行对输入音频信号的线性预测分析从而求出线性预测系数α1,…,αP。其中,P是表示预测阶数的正整数。例如,通过作为全极点模型的P阶自回归过程,在时刻t的输入音频信号x(t),根据回溯至P时点的过去的自身的值x(t-1),…,x(t-P)、预测残差e(t)、以及线性预测系数α1,…,αP,通过式(1)表示。
(步骤2)对线性预测系数α1,…,αP进行编码而得到并输出码CL,并且求出与码CL对应的已量化线性预测系数^α1,…,^αP。此外,使用已量化线性预测系数^α1,…,^αP求出N点的输入音频信号的振幅频谱包络序列W[1],…,W[N]。例如,振幅频谱包络序列的各值W[n]能够通过式(2)求出。另外,对线性预测系数α1,…,αP进行编码而得到码CL的方法,也可以使用将线性预测系数变换为LSP参数后对LSP参数进行编码而得到码CL等将能够变换为线性预测系数的任意系数进行编码而得到码CL的任意方法。
(步骤3)对已量化线性预测系数^αp的每一个乘以γp,求出已量化平滑化线性预测系数^α1γ,^α2γ2,…,^αPγP。γ是预先确定的用于进行平滑化的1以下的正的常数。并且,根据式(10),求出平滑化振幅频谱包络序列~W[1],…,~W[N]。
<周期性分析部230>
周期性分析部230将归一化系数串XN[1],…,XN[N]作为输入,求出该归一化系数串XN[1],…,XN[N]的间隔T(周期性地成为较大的值的间隔),输出间隔T和表示间隔T的码CT(S230)。此外,周期性分析部230根据需要,还求出并输出表示周期性的程度的指标S(即,表示频域的样本串的周期性的程度的指标)。此外,周期性分析部230根据需要,还得到并输出表示指标S的码CS。另外,指标S和间隔T本身与实施例1、变形例1的周期性分析部131相同。
<周期性综合包络生成部250>
周期性综合包络生成部250至少将周期性包络序列P[1],…,P[N]、振幅频谱包络序列W[1],…,W[N]作为输入,求出周期性综合包络序列WM[1],…,WM[N]而输出周期性综合包络WM[n]。此外,周期性综合包络生成部250选择预先确定的多个候选值中的其中一个作为值δ,而不是将预先确定的一个值作为值δ的情况下,系数串X[1],…,X[N]也作为输入,将预先确定的多个候选值中周期性综合包络WM[n]与系数X[n]的绝对值序列的形状变得接近的候选值作为值δ而求出,还输出表示值δ的码Cδ(S250)。
周期性综合包络WM[n]和值δ与实施例1相同,周期性综合包络WM[n]如式(6),…,(9)那样求出即可。在周期性综合包络生成部250中根据周期性的程度来决定δ的候选数的情况下,周期性综合包络生成部250也可以将表示周期性的程度的指标S也作为输入,在指标S对应于周期性高的帧的情况下从大量候选数的δ的候选中选择通过式(7)定义的E变得最小的δ,在指标S对应于周期性低的帧的情况下将δ设为1个预先确定的值。另外,在将δ设为预先确定的值的情况下,不需要输出表示值δ的码Cδ。
<可变长度编码参数计算部260>
可变长度编码参数计算部260将周期性综合包络序列WM[1],…,WM[N]、平滑化振幅频谱包络序列~W[1],…,~W[N]、以及归一化系数串XN[1],…,XN[N]作为输入,求出可变长度编码参数rn(S260)。可变长度编码参数计算部260的特征在于,依赖于根据周期性综合包络序列WM[1],…,WM[N]求出的振幅值,计算可变长度编码参数rn。
可变长度编码参数是确定编码对象的信号、即归一化系数串XN[1],…,XN[N]的各系数的振幅可取的范围的参数。例如,在赖斯编码(Rice coding)的情况下,赖斯参数相当于可变长度编码参数,在算术编码的情况下编码对象的信号的振幅可取的范围相当于可变长度编码参数。
在按每个样本进行可变长度编码的情况下,针对归一化系数串的各系数XN[n]计算可变长度编码参数。在按由多个样本组成的每个样本群(例如各两个样本)集中进行可变长度编码的情况下,按每个样本群计算可变长度编码参数。也就是说,可变长度编码参数计算部260按照作为归一化系数串的一部分的每个归一化部分系数串,计算可变长度编码参数rn。在此,假设归一化部分系数串有多个,且在多个归一化部分系数串中不重复包含归一化系数串的系数。以下,以按照每个样本进行赖斯编码的情况为例,说明可变长度编码参数的计算方法。
(步骤1)将归一化系数串XN[1],…,XN[N]的各系数的振幅的平均的对数作为成为基准的赖斯参数sb(成为基准的可变长度编码参数),如下式那样算出。
sb按每个帧被编码一次,且作为与成为基准的赖斯参数(成为基准的可变长度编码参数)对应的码Csb,被传送给解码装置400。或者在能够根据传送至解码装置400的其他信息来估计归一化系数串XN[1],…,XN[N]的振幅的平均值的情况下,也可以在编码装置200和解码装置400中公共地决定根据振幅的平均值而近似地决定sb的方法。例如,在另外使用表示包络的斜率的参数、表示每个划分带域的平均包络的大小的参数的编码的情况下,能够根据传送至解码装置400的其他信息来估计振幅的平均值。在该情况下,也可以不用对sb进行编码并将与成为基准的赖斯参数对应的码Csb输出到解码装置400。
(步骤2)通过下述公式算出阈值θ。
θ是将周期性综合包络序列的各值WM[n]除以平滑化振幅频谱包络序列的各值~W[n]得到的值的振幅的平均的对数。
(步骤3)越是|WM[n]/~W[n]|比θ大,就越将用于对归一化系数串XN[n]进行赖斯编码的赖斯参数rn决定为比sb更大的值。越是|WM[n]/~W[n]|比θ小,就越将用于对归一化系数串XN[n]进行赖斯编码的赖斯参数rn决定为比sb更小的值。
(步骤4)针对所有的n=1,2,…,N重复步骤3的处理,求出关于各XN[n]的赖斯参数rn。
<可变长度编码部270>
可变长度编码部270使用由可变长度编码参数计算部260求出的可变长度编码参数rn,对归一化系数串XN[1],…,XN[N]进行可变长度编码,输出可变长度码CX(S270)。例如,可变长度编码部270使用由可变长度编码参数计算部260求出的赖斯参数rn,对归一化系数串XN[1],…,XN[N]进行赖斯编码,将所得到的码作为可变长度码CX而输出。由可变长度编码参数计算部260求出的赖斯参数rn是依赖于周期性综合包络序列的振幅值的可变长度编码参数,周期性综合包络序列的值越大的频率,该参数成为越大的值。赖斯编码是依赖于振幅值的可变长度编码的公知技术之一,使用赖斯参数rn进行依赖于振幅值的可变长度编码。此外,由周期性综合包络生成部250生成的周期性综合包络序列是高精度地表现输入音频信号的频谱包络的序列。即,可变长度编码部270以周期性综合包络序列的值越大的频率,作为所述输入音频信号的频域的序列串的X[1],…,X[N]的振幅就越大为前提,对归一化系数串XN[1],…,XN[N]进行可变长度编码,换言之,使用可变长度编码参数,通过依赖于振幅值的可变长度编码对归一化系数串XN[1],…,XN[N]进行编码。此处的振幅值是指编码对象的系数串的平均振幅值、系数串所包含的各系数的振幅的估计值、系数串的振幅的包络的估计值等。
编码装置200输出表示根据这样的处理所得到的已量化线性预测系数^α1,…,^αP的码CL、表示间隔T的码CT、对归一化系数串XN[1],…,XN[N]进行了可变长度编码的可变长度码CX。此外,根据需要还输出表示值δ的码Cδ和表示成为基准的可变长度编码参数sb的码Csb。从编码装置200输出的码被输入到解码装置400。
[编码装置的变形例1](从外部输入信息的例子)
另外,作为编码装置,也可以仅包括周期性包络序列生成部140、周期性综合包络生成部250、可变长度编码参数计算部260、以及可变长度编码部270,将在编码装置的外部所生成的平滑化振幅频谱包络序列~W[1],…,~W[N]、归一化系数串XN[1],…,XN[N]、以及间隔T作为输入,且根据需要将振幅频谱包络序列W[1],…,W[N]作为输入,根据需要将指标S作为输入,输出可变长度码CX。
[编码装置的变形例2](根据系数串X[n]求出间隔T的例子)
在上述的周期性分析部230中将归一化系数串XN[1],…,XN[N]作为输入而求出间隔T,但在上述的周期性分析部230中也可以将频域变换部110输出的系数串X[1],…,X[N]作为输入而求出间隔T。在该情况下,通过与实施例1的周期性分析部130相同的方法求出间隔T。
《解码装置》
在图7中示出实施例2的解码装置的功能结构例,在图8中示出实施例2的解码装置的处理流程。解码装置400包括频谱包络序列计算部421、周期性包络序列生成部440、周期性综合包络生成部450、可变长度编码参数计算部460、可变长度解码部470、频域序列反归一化部411、频域反变换部410。解码装置400获取表示已量化线性预测系数^α1,…,^αP的码CL、表示间隔T的码CT、对归一化系数串XN[1],…,XN[N]进行了可变长度编码的可变长度码CX,输出音频信号。另外,根据需要还获取表示值δ的码Cδ、表示成为基准的可变长度编码参数sb的码Csb、以及表示指标S的码CS。以下,表示各构成部的细节。
<频谱包络序列计算部421>
频谱包络序列计算部421将码CL作为输入,计算振幅频谱包络序列W[1],…,W[N]和平滑化振幅频谱包络序列~W[1],…,~W[N](S421)。更具体而言,通过以下的步骤进行处理即可。
(步骤1)对码CL进行解码,得到解码线性预测系数^α1,…,^αP。
(步骤2)使用解码线性预测系数^α1,…,^αP求出N点的振幅频谱包络序列W[1],…,W[N]。例如,振幅频谱包络序列的各值W[n]能够通过式(2)求出。
(步骤3)对解码线性预测系数^αp的每一个乘以γp,求出解码平滑化线性预测系数^α1γ,^α2γ2,…,^αPγP。γ是预先确定的用于进行平滑化的1以下的正的常数。并且,根据式(10),求出平滑化振幅频谱包络序列~W[1],…,~W[N]。
<周期性包络序列生成部440>
周期性包络序列生成部440将表示间隔T的码CT作为输入,对码CT进行解码,得到间隔T。并且,通过与编码装置200的周期性包络序列生成部140相同的方法求出周期性包络序列P[1],…,P[N],并输出(S440)。
<周期性综合包络生成部450>
在周期性综合包络生成部450中被输入周期性包络序列P[1],…,P[N]、振幅频谱包络序列W[1],…,W[N]、码Cδ、码CS。其中,有时也会不输入码Cδ、码CS。周期性综合包络生成部450对码Cδ进行解码,得到值δ。其中,在没有输入码Cδ的情况下,不进行码Cδ的解码,而是取得在周期性综合包络生成部450中预先存储的值δ。另外,在输入了码CS的情况下,周期性综合包络生成部450对码CS进行解码而取得指标S,在取得的指标S对应于周期性高的帧的情况下,对码Cδ进行解码而取得值δ,在取得的指标S对应于周期性低的帧的情况下,不进行码Cδ的解码,而是取得在周期性综合包络生成部450中预先存储的值δ。并且,周期性综合包络生成部450根据式(6)求出周期性综合包络序列WM[1],…,WM[N](S450)。
<可变长度编码参数计算部460>
可变长度编码参数计算部460将周期性综合包络序列WM[1],…,WM[N]、平滑化振幅频谱包络序列~W[1],…,~W[N]、以及码Csb作为输入,获得可变长度编码参数rn(S460)。其中,在能够根据传送至解码装置400的其他信息来估计振幅的平均值的情况下,也可以决定根据由其他信息估计出的振幅的平均值的估计值而近似地决定sb的方法。在该情况下,不输入码Csb。以下,以按每个样本进行赖斯解码的情况为例,说明可变长度编码参数的计算方法。
(步骤1)对码Csb进行解码,获得成为基准的赖斯参数sb(成为基准的可变长度编码参数)。另外,在编码装置200和解码装置400中公共地决定了根据振幅的平均值而近似地决定sb的方法的情况下,通过该方法求出。
(步骤2)通过式(14)算出阈值θ。
(步骤3)越是|WM[n]/~W[n]|比θ大,就越将赖斯参数rn设为比sb更大的值,通过与编码装置200的可变长度编码参数计算部260相同的方法来决定。越是|WM[n]/~W[n]|比θ小,就越将赖斯参数rn设为比sb更小的值,通过与编码装置200的可变长度编码参数计算部260相同的方法来决定。
(步骤4)针对所有的n=1,2,…,N重复步骤3的处理,求出关于各XN[n]的赖斯参数rn。
<可变长度解码部470>
可变长度解码部470使用由可变长度编码参数计算部460求出的可变长度编码参数rn,对可变长度码CX进行解码而获得解码归一化系数串^XN[1],…,^XN[N](S470)。例如,可变长度解码部470使用由可变长度编码参数计算部460求出的赖斯参数rn,对可变长度码CX进行解码而获得解码归一化系数串^XN[1],…,^XN[N]。可变长度解码部470的解码方法对应于可变长度编码部270的编码方法。
<频域序列反归一化部411>
频域序列反归一化部411将解码归一化系数串^XN[1],…,^XN[N]和平滑化振幅频谱包络序列~W[1],…,~W[N]作为输入,如下求出解码系数串^X[1],…,^X[N]并输出(S411)。
^X[n]=^XN[n]·~W[n](15)
<频域反变换部410>
频域反变换部410将解码系数串^X[1],…,^X[N]作为输入,将解码系数串^X[1],…,^X[N]变换为预定的时间区间即帧单位的音频信号(时域)(S410)。
[解码装置的变形例1](从外部输入信息的例子)
另外,作为解码装置,也可以仅包括周期性包络序列生成部440、周期性综合包络生成部450、可变长度编码参数计算部460、以及可变长度解码部470,除根据需要而输入到解码装置的码Cδ和码Csb之外,输入在解码装置的外部得到的平滑化振幅频谱包络序列~W[1],…,~W[N]、振幅频谱包络序列W[1],…,W[N]、以及间隔T,且根据需要还输入指标S,输出归一化系数串XN[1],…,XN[N],在外部乘以平滑化振幅频谱包络序列而变换为时域的音频信号。
<实施例2的发明的效果>
可变长度编码是通过配合编码对象的输入值的振幅可取的范围而自适应地决定码,从而提高编码效率的编码方法。在实施例2中将作为频域的系数串的归一化系数串XN[1],…,XN[N]作为编码对象,若利用更准确地使用编码对象的系数串所包含的各系数的振幅的信息而求出的可变长度编码参数来进行可变长度编码,则编码装置进行的可变长度编码本身的编码效率将提高。但是,为了解码装置求出可变长度编码参数,需要从编码装置对解码装置更准确地传送编码对象的系数串所包含的各系数的振幅的信息,导致从编码装置对解码装置传送的码量相应地增大。
为了抑制码量的增大,需要根据较少码量的码而获得编码对象的系数串所包含的各系数的振幅的估计值的方法。实施例2的周期性综合包络序列WM[1],…,WM[N]与系数串X[1],…,X[N]高精度地近似,因而|WM[1]/~W[1]|,…,|WM[N]/~W[N]|能够高精度地近似作为可变长度编码对象的系数的XN[1],XN[2],…,XN[N]的振幅包络。也就是说,|WM[1]/~W[1]|,…,|WM[N]/~W[N]|成为与编码对象的各系数的振幅具有正的相关的序列。
此外,在解码装置侧对|WM[1]/~W[1]|,|WM[2]/~W[2]|,…,|WM[N]/~W[N]|进行复原所需的信息如下。
·已量化线性预测系数^α1,…,^αP的信息(码CL)
·表示间隔T的信息(码CT)
·表示值δ的信息(码Cδ)
即,根据实施例2的编码装置和解码装置,仅凭码CL、码CT、码Cδ的少量信息量,就能够在解码装置中再现包含被输入到编码装置的输入音频信号的基音周期引起的振幅的波峰在内的包络。
另外,实施例2的编码装置和解码装置大多一并使用进行伴随线性预测或基音预测的编码以及解码的编码装置以及解码装置。在该情况下,码CL和码CT是从位于编码装置200之外的进行伴随线性预测或基音预测的编码的编码装置,传送到位于解码装置400之外的进行伴随线性预测或基音预测的解码的解码装置的码。因此,为了在解码装置侧对包含被输入到编码装置侧的输入音频信号的基音周期引起的振幅的波峰在内的包络进行复原,需要从编码装置200传送到解码装置400的是码Cδ。码Cδ的码量少(分别充其量为3比特左右,1比特也能获得效果),比与编码对象的归一化系数串所包含的每个部分序列的可变长度编码参数对应的码的总码量还要少。
因此,根据实施例2的编码装置和解码装置,能够通过较少码量的增加来提高编码效率。
<实施例2的发明点>
若在得到上述效果方面考虑实施例2的编码装置、解码装置,则具有如下特征即可,编码装置200具有:
·周期性综合包络生成部250,基于与根据预定时间区间的输入音频信号求出的线性预测系数码对应的频域的序列即频谱包络序列、以及与根据输入音频信号求出的周期码对应的频域的周期,生成作为频域的序列的周期性综合包络序列;以及
·可变长度编码部270,以周期性综合包络序列的值越大的频率,输入音频信号的振幅就越大作为前提,对来自输入音频信号的频域的序列进行编码,
解码装置400具有:
·周期性综合包络生成部450,基于作为与线性预测系数码对应的频域的序列的频谱包络序列、以及与周期码对应的频域的周期,生成作为频域的序列的周期性综合包络序列;以及
·可变长度解码部470,以周期性综合包络序列的值越大的频率,音频信号的振幅就越大作为前提,对可变长度码进行解码而得到频域的序列。另外,“以周期性综合包络序列的值越大的频率,输入音频信号的振幅就越大作为前提”、和“以周期性综合包络序列的值越大的频率,音频信号的振幅就越大作为前提”是指,周期性综合包络序列的特征在于,其在输入音频信号或者音频信号的振幅大的频率中成为较大的值。此外,“来自输入音频信号”意味着根据输入音频信号求出或与输入音频信号对应。例如,系数串X[1],…,X[N]或归一化系数串XN[1],…,XN[N]是来自输入音频信号的频域的序列。
[实施例3]
《编码装置》
在图9中示出实施例3的编码装置的功能结构例,在图10中示出实施例3的编码装置的处理流程。编码装置300包括频谱包络序列计算部221、频域变换部110、频域序列归一化部111、周期性分析部330、周期性包络序列生成部140、周期性综合包络生成部250、可变长度编码参数计算部260、第二可变长度编码参数计算部380、可变长度编码部370。编码装置300将所输入的时域的音频数字信号作为输入音频信号x(t),至少输出表示已量化线性预测系数^α1,…,^αP的码CL、表示归一化系数串XN[1],…,XN[N]的周期的间隔T的码CT、表示系数串X[1],…,X[N]或者归一化系数串XN[1],…,XN[N]的周期性的程度的预定的指标S和表示指标S的码CS、对归一化系数串XN[1],…,XN[N]进行了可变长度编码的可变长度码CX。频域序列归一化部111与实施例1、变形例1相同。频域变换部110和周期性包络序列生成部140与实施例1相同。振幅频谱包络序列计算部221、周期性综合包络生成部250、可变长度编码参数计算部260与实施例2相同。以下说明不同的构成部。
<周期性分析部330>
周期性分析部330将归一化系数串XN[1],…,XN[N]作为输入,求出表示该归一化系数串XN[1],…,XN[N]的周期性的程度的指标S和间隔T(周期性地成为较大的值的间隔),输出指标S、表示指标S的码CS、间隔T、表示间隔T的码CT(S330)。另外,指标S和间隔T本身与实施例1、变形例1的周期性分析部131相同。
并且,在编码装置300中,在指标S为预先确定的表示周期性的程度大的范围的情况下,可变长度编码参数计算部260计算可变长度编码参数rn,在指标S不是预先确定的表示周期性的程度大的范围的情况下,第二可变长度编码参数计算部380计算可变长度编码参数rn(S390)。“预先确定的表示周期性的程度大的范围”例如设为指标S为预定的阈值以上时即可。
<第二可变长度编码参数计算部380>
第二可变长度编码参数计算部380将振幅频谱包络序列W[1],…,W[N]、平滑化振幅频谱包络序列~W[1],…,~W[N]、归一化系数串XN[1],…,XN[N]作为输入,求出可变长度编码参数rn(S380)。相对于可变长度编码参数计算部260依赖于根据周期性综合包络序列WM[1],…,WM[N]求出的振幅值而计算可变长度编码参数rn,第二可变长度编码参数计算部380的特征在于,依赖于根据振幅频谱包络序列求出的振幅值而计算可变长度编码参数。以下,以按照每个样本进行赖斯编码的情况为例,说明可变长度编码参数的计算方法。
(步骤1)将归一化系数串XN[1],…,XN[N]的各系数的振幅的平均的对数作为成为基准的赖斯参数sb(成为基准的可变长度编码参数),如式(13)那样算出。该处理与可变长度编码参数计算部260相同。
(步骤2)通过下式计算阈值θ。
θ是将振幅频谱包络序列的各值W[n]除以平滑化振幅频谱包络序列的各值~W[n]得到的值的振幅的平均的对数。
(步骤3)越是|W[n]/~W[n]|比θ大,就越将用于对归一化系数串XN[n]进行赖斯编码的赖斯参数rn决定为比sb更大的值。越是|W[n]/~W[n]|比θ小,就越将用于对归一化系数串XN[n]进行赖斯编码的赖斯参数rn决定为比sb更小的值。
(步骤4)针对所有的n=1,2,…,N重复步骤3的处理,求出关于各XN[n]的赖斯参数rn。
<可变长度编码部370>
可变长度编码部370使用可变长度编码参数rn对归一化系数串XN[1],…,XN[N]进行可变长度编码,输出可变长度码CX(S370)。其中,在指标S是预先确定的表示周期性的程度大的范围的情况下,可变长度编码参数rn是由可变长度编码参数计算部260计算出的可变长度编码参数rn,在指标S不是预先确定的表示周期性的程度大的范围的情况下,可变长度编码参数rn是由第二可变长度编码参数计算部380计算出的可变长度编码参数rn。
编码装置300输出表示通过这样的处理而得到的已量化线性预测系数^α1,…,^αP的码CL、表示用于表示周期性的程度的指标S的码CS、表示间隔T的码CT、对归一化系数串XN[1],…,XN[N]进行了可变长度编码的可变长度码CX,并发送到解码侧。此外,根据需要还输出表示值δ的码Cδ、表示成为基准的可变长度编码参数sb的码Csb,并发送到解码侧。
[编码装置的变形例1](从外部输入信息的例子)
另外,作为编码装置,也可以仅包括周期性包络序列生成部140、周期性综合包络生成部250、可变长度编码参数计算部260、第二可变长度编码参数计算部380、以及可变长度编码部370,将在编码装置的外部生成的平滑化振幅频谱包络序列~W[1],…,~W[N]、归一化系数串XN[1],…,XN[N]、间隔T作为输入,且根据需要将振幅频谱包络序列W[1],…,W[N]作为输入,根据需要将指标S作为输入,输出可变长度码CX。
[编码装置的变形例2](根据系数串X[n]求出间隔T的例子)
在上述的周期性分析部330中将归一化系数串XN[1],…,XN[N]作为输入求出间隔T,但在周期性分析部330中也可以将频域变换部110输出的系数串X[1],…,X[N]作为输入求出间隔T。在该情况下,通过与实施例1的周期性分析部130相同的方法求出间隔T。
《解码装置》
在图11中示出实施例3的解码装置的功能结构例,在图12中示出实施例3的解码装置的处理流程。解码装置500包括频谱包络序列计算部421、指标解码部530、周期性包络序列生成部440、周期性综合包络生成部450、可变长度编码参数计算部460、第二可变长度编码参数计算部580、可变长度解码部570、频域序列反归一化部411、频域反变换部410。解码装置500获取表示已量化线性预测系数^α1,…,^αP的码CL、表示指标S的码CS、表示间隔T的码CT、以及对归一化系数串XN[1],…,XN[N]进行了可变长度编码的可变长度码CX,输出音频信号。另外,根据需要还获取表示值δ的码Cδ、表示成为基准的可变长度编码参数sb的码Csb。频谱包络序列计算部421、周期性包络序列生成部440、周期性综合包络生成部450、可变长度编码参数计算部460、频域序列反归一化部411、频域反变换部410与实施例2相同。以下说明不同的构成部。
<指标解码部530>
指标解码部530对码CS进行解码,获得指标S。在解码装置500中,在指标S是预先确定的表示周期性的程度大的范围的情况下,由可变长度编码参数计算部460计算可变长度编码参数rn,在指标S不是预先确定的表示周期性的程度大的范围的情况下,由第二可变长度编码参数计算部580计算可变长度编码参数rn(S590)。另外,“预先确定的表示周期性的程度大的范围”是与编码装置300相同的范围。
<第二可变长度编码参数计算部580>
第二可变长度编码参数计算部580将振幅频谱包络序列W[1],…,W[N]、平滑化振幅频谱包络序列~W[1],…,~W[N]、以及码Csb作为输入,求出可变长度编码参数rn(S580)。其中,在能够根据传送至解码装置500的其他信息来估计振幅的平均值的情况下,也可以决定根据由其他信息估计出的振幅的平均值的估计值而近似地决定sb的方法。在该情况下,不输入码Csb。以下,以按每个样本进行赖斯解码的情况为例,说明可变长度编码参数的计算方法。
(步骤1)对码Csb进行解码,获得成为基准的赖斯参数sb(成为基准的可变长度编码参数)。另外,在编码装置300和解码装置500中公共地决定了根据振幅的估计值而近似地决定sb的方法的情况下,通过该方法求出。
(步骤2)通过式(16)算出阈值θ。
(步骤3)越是|W[n]/~W[n]|比θ大,就越将赖斯参数rn设为比sb更大的值,通过与编码装置300的第二可变长度编码参数计算部380相同的方法来决定。越是|W[n]/~W[n]|比θ小,就越将赖斯参数rn设为比sb更小的值,通过与编码装置300的第二可变长度编码参数计算部380相同的方法来决定。
(步骤4)针对所有的n=1,2,…,N重复步骤3的处理,求出关于各XN[n]的赖斯参数rn。
<可变长度解码部570>
可变长度解码部570使用可变长度编码参数rn,对可变长度码CX进行解码而获得解码归一化系数串^XN[1],…,^XN[N](S570)。其中,在指标S是预先确定的表示周期性的程度大的范围的情况下,可变长度编码参数rn是由可变长度编码参数计算部460计算的可变长度编码参数rn,在指标S不是预先确定的表示周期性的程度大的范围的情况下,可变长度编码参数rn是由第二可变长度编码参数计算部580计算的可变长度编码参数rn。
[解码装置的变形例1](从外部输入信息的例子)
另外,作为解码装置,也可以仅包括周期性包络序列生成部440、周期性综合包络生成部450、可变长度编码参数计算部460、第二可变长度编码参数计算部580、以及可变长度解码部570,除根据需要而输入到解码装置的码Cδ和码Csb之外,将在解码装置的外部获得的平滑化振幅频谱包络序列~W[1],…,~W[N]、振幅频谱包络序列W[1],…,W[N]、间隔T、指标S也作为输入,输出归一化系数串XN[1],…,XN[N],在外部乘以平滑化振幅频谱包络序列而变换为时域的音频信号。
<实施例3的发明的效果>
在输入音频信号的周期性的程度小的情况下,输入音频信号的基音周期引起的振幅的波峰小。因此,实施例3的编码装置、解码装置在成为编码的对象的音频信号的周期性的程度大的情况下使用周期性综合包络序列而求出可变长度编码参数,在成为编码的对象的音频信号的周期性的程度不大的情况下使用振幅频谱包络序列而求出可变长度编码参数,因而能够使用更适合的可变长度编码参数来进行可变长度编码,具有能够提高编码精度的效果。
在上述的实施例1~3中,说明了关于振幅频谱包络序列、平滑化振幅频谱包络序列、周期性综合包络序列等而使用振幅的序列的例子,但也可以取代振幅的序列而使用功率的序列、即作为W[n]、~W[n]、WM[n],使用功率频谱包络序列、平滑化功率频谱包络序列、作为功率的序列的周期性综合包络序列。
[程序、记录介质]
上述的各种处理不仅可以根据记载而时序地执行,也可以根据执行处理的装置的处理能力或者根据需要而并行或者单独地执行。此外,在不脱离本发明的宗旨的范围内能够适当进行变更是不言而喻的。
此外,在通过计算机实现上述的结构的情况下,各装置应具有的功能的处理内容由程序描述。并且,通过由计算机执行该程序,在计算机上实现上述处理功能。
描述了该处理内容的程序能够预先记录在计算机可读取的记录介质中。作为计算机可读取的记录介质,例如可以是磁记录装置、光盘、光磁记录介质、半导体存储器等任意介质。
此外,该程序的流通例如通过对记录了该程序的DVD、CD-ROM等可移动型记录介质进行销售、转让、出租等而进行。进而,也可以设为将该程序存储到服务器计算机的存储装置中,通过经由网络从服务器计算机对其他的计算机转发该程序,从而使该程序流通的结构。
执行这样的程序的计算机例如首先,将在可移动型记录介质中记录的程序或者从服务器计算机转发的程序暂时存储到自身的存储装置。并且,在执行处理时,该计算机读取在自身的记录介质中存储的程序,执行按照所读取的程序的处理。此外,作为该程序的另一实施方式,可以设为计算机从可移动型记录介质直接读取程序,执行按照该程序的处理,进而,也可以设为每当从服务器计算机对该计算机转发程序时,逐步执行按照获取的程序的处理。此外,也可以设为不从服务器计算机对该计算机转发程序,而根据仅凭其执行指示和结果取得来实现处理功能的所谓的ASP(应用服务提供商)型的服务来执行上述的处理的结构。另外,假设在本方式中的程序中包含提供用于电子计算机的处理且符合程序的信息(不是对计算机的直接的指令,但具有规定计算机的处理的性质的数据等)。
此外,在该方式中,设为通过使在计算机上执行预定的程序而构成本装置,但也可以设为将这些处理内容的至少一部分以硬件方式来实现。
标号说明
100、101周期性综合包络序列生成装置
110频域变换部 111频域序列归一化部
120、121、221、421频谱包络序列计算部
130、131、230、330周期性分析部
140、440周期性包络序列生成部
150、250、450周期性综合包络生成部
200、300编码装置
260、360、460可变长度编码参数计算部
270、370可变长度编码部
380、580第二可变长度编码参数计算部
400、500解码装置
410频域反变换部 411频域序列反归一化部
470、570可变长度解码部 530指标解码部
Claims (4)
1.一种周期性综合包络序列生成装置,
将预定的时间区间即帧单位的时域的音频数字信号作为输入音频信号,
所述周期性综合包络序列生成装置包括:
频谱包络序列计算部,基于所述输入音频信号的时域的线性预测,计算所述输入音频信号的频谱包络序列;以及
周期性综合包络生成部,基于所述输入音频信号在频域中的周期性分量,对所述频谱包络序列进行变形,并设为周期性综合包络序列,
所述周期性综合包络生成部将如下变更而得到的序列设为周期性综合包络序列:所述输入音频信号在频域中的周期越大,将所述频谱包络序列中的所述输入音频信号在频域中的周期的整数倍的附近的越多的样本的值进行变更。
2.一种周期性综合包络序列生成方法,
将预定的时间区间即帧单位的时域的音频数字信号作为输入音频信号,
所述周期性综合包络序列生成方法执行以下步骤:
频谱包络序列计算步骤,基于所述输入音频信号的时域的线性预测,计算所述输入音频信号的频谱包络序列;以及
周期性综合包络生成步骤,基于所述输入音频信号在频域中的周期性分量,对所述频谱包络序列进行变形,并设为周期性综合包络序列,
所述周期性综合包络生成步骤将如下变更而得到的序列设为周期性综合包络序列:所述输入音频信号在频域中的周期越大,将所述频谱包络序列中的所述输入音频信号在频域中的周期的整数倍的附近的越多的样本的值进行变更。
3.一种周期性综合包络序列生成程序,用于使计算机执行权利要求2所述的周期性综合包络序列生成方法的各步骤。
4.一种计算机可读取的记录介质,记录了用于使计算机执行权利要求2所述的周期性综合包络序列生成方法的各步骤的周期性综合包络序列生成程序。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014-094880 | 2014-05-01 | ||
JP2014094880 | 2014-05-01 | ||
PCT/JP2015/054718 WO2015166694A1 (ja) | 2014-05-01 | 2015-02-20 | 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体 |
CN201580022816.7A CN106537500B (zh) | 2014-05-01 | 2015-02-20 | 周期性综合包络序列生成装置、周期性综合包络序列生成方法、记录介质 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580022816.7A Division CN106537500B (zh) | 2014-05-01 | 2015-02-20 | 周期性综合包络序列生成装置、周期性综合包络序列生成方法、记录介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110491402A true CN110491402A (zh) | 2019-11-22 |
CN110491402B CN110491402B (zh) | 2022-10-21 |
Family
ID=54358435
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910432900.6A Active CN110289008B (zh) | 2014-05-01 | 2015-02-20 | 周期性综合包络序列生成装置、方法、记录介质 |
CN201580022816.7A Active CN106537500B (zh) | 2014-05-01 | 2015-02-20 | 周期性综合包络序列生成装置、周期性综合包络序列生成方法、记录介质 |
CN201910728046.8A Active CN110491401B (zh) | 2014-05-01 | 2015-02-20 | 周期性综合包络序列生成装置、方法、记录介质 |
CN201910728067.XA Active CN110491402B (zh) | 2014-05-01 | 2015-02-20 | 周期性综合包络序列生成装置、方法、记录介质 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910432900.6A Active CN110289008B (zh) | 2014-05-01 | 2015-02-20 | 周期性综合包络序列生成装置、方法、记录介质 |
CN201580022816.7A Active CN106537500B (zh) | 2014-05-01 | 2015-02-20 | 周期性综合包络序列生成装置、周期性综合包络序列生成方法、记录介质 |
CN201910728046.8A Active CN110491401B (zh) | 2014-05-01 | 2015-02-20 | 周期性综合包络序列生成装置、方法、记录介质 |
Country Status (9)
Country | Link |
---|---|
US (6) | US10204633B2 (zh) |
EP (4) | EP3537439B1 (zh) |
JP (4) | JP6276846B2 (zh) |
KR (4) | KR101837153B1 (zh) |
CN (4) | CN110289008B (zh) |
ES (4) | ES2878061T3 (zh) |
PL (4) | PL3699910T3 (zh) |
TR (1) | TR201910806T4 (zh) |
WO (1) | WO2015166694A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2689120T3 (es) * | 2014-03-24 | 2018-11-08 | Nippon Telegraph And Telephone Corporation | Método de codificación, codificador, programa y soporte de registro |
WO2017125840A1 (en) * | 2016-01-19 | 2017-07-27 | Hua Kanru | Method for analysis and synthesis of aperiodic signals |
US10475471B2 (en) * | 2016-10-11 | 2019-11-12 | Cirrus Logic, Inc. | Detection of acoustic impulse events in voice applications using a neural network |
US10242696B2 (en) | 2016-10-11 | 2019-03-26 | Cirrus Logic, Inc. | Detection of acoustic impulse events in voice applications |
KR102643277B1 (ko) | 2022-03-10 | 2024-03-05 | 주식회사 메사쿠어컴퍼니 | 얼굴인식을 이용한 비밀번호 입력 방법 및 시스템 |
KR20230136288A (ko) | 2022-03-18 | 2023-09-26 | 주식회사 메사쿠어컴퍼니 | 얼굴의 부분영역으로 얼굴인증을 수행하는 방법 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58168094A (ja) * | 1982-03-29 | 1983-10-04 | 藤崎 博也 | 音声分析処理方式 |
JPS5994795A (ja) * | 1982-11-22 | 1984-05-31 | 藤崎 博也 | 音声分析処理方式 |
CN1669075A (zh) * | 2002-07-16 | 2005-09-14 | 皇家飞利浦电子股份有限公司 | 音频编码 |
CN1702736A (zh) * | 2001-08-31 | 2005-11-30 | 株式会社建伍 | 生成基音周期波形信号的装置和方法及处理语音信号的装置和方法 |
CN1790486A (zh) * | 2004-12-14 | 2006-06-21 | Lg电子株式会社 | 语音编码装置及其方法 |
CN101048649A (zh) * | 2004-11-05 | 2007-10-03 | 松下电器产业株式会社 | 可扩展解码装置及可扩展编码装置 |
CN101589430A (zh) * | 2007-08-10 | 2009-11-25 | 松下电器产业株式会社 | 声音分离装置、声音合成装置及音质变换装置 |
CN101925950A (zh) * | 2008-01-04 | 2010-12-22 | 杜比国际公司 | 音频编码器和解码器 |
CN102379004A (zh) * | 2009-04-03 | 2012-03-14 | 株式会社Ntt都科摩 | 语音编码装置、语音解码装置、语音编码方法、语音解码方法、语音编码程序以及语音解码程序 |
US20120296659A1 (en) * | 2010-01-14 | 2012-11-22 | Panasonic Corporation | Encoding device, decoding device, spectrum fluctuation calculation method, and spectrum amplitude adjustment method |
CN103329199A (zh) * | 2011-01-25 | 2013-09-25 | 日本电信电话株式会社 | 编码方法、编码装置、周期性特征量决定方法、周期性特征量决定装置、程序、记录介质 |
EP2696343A1 (en) * | 2011-04-05 | 2014-02-12 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoding device, decoding device, program, and recording medium |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5528723A (en) * | 1990-12-28 | 1996-06-18 | Motorola, Inc. | Digital speech coder and method utilizing harmonic noise weighting |
BE1007617A3 (nl) * | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US7092881B1 (en) * | 1999-07-26 | 2006-08-15 | Lucent Technologies Inc. | Parametric speech codec for representing synthetic speech in the presence of background noise |
AU2001294974A1 (en) * | 2000-10-02 | 2002-04-15 | The Regents Of The University Of California | Perceptual harmonic cepstral coefficients as the front-end for speech recognition |
US7013269B1 (en) * | 2001-02-13 | 2006-03-14 | Hughes Electronics Corporation | Voicing measure for a speech CODEC system |
US7027980B2 (en) * | 2002-03-28 | 2006-04-11 | Motorola, Inc. | Method for modeling speech harmonic magnitudes |
US7580910B2 (en) | 2005-04-06 | 2009-08-25 | Content Analyst Company, Llc | Perturbing latent semantic indexing spaces |
TWI279774B (en) * | 2005-04-14 | 2007-04-21 | Ind Tech Res Inst | Adaptive pulse allocation mechanism for multi-pulse CELP coder |
KR100933548B1 (ko) * | 2005-04-15 | 2009-12-23 | 돌비 스웨덴 에이비 | 비상관 신호의 시간적 엔벨로프 정형화 |
US7930176B2 (en) * | 2005-05-20 | 2011-04-19 | Broadcom Corporation | Packet loss concealment for block-independent speech codecs |
US7596231B2 (en) | 2005-05-23 | 2009-09-29 | Hewlett-Packard Development Company, L.P. | Reducing noise in an audio signal |
US20070011001A1 (en) * | 2005-07-11 | 2007-01-11 | Samsung Electronics Co., Ltd. | Apparatus for predicting the spectral information of voice signals and a method therefor |
KR100770839B1 (ko) * | 2006-04-04 | 2007-10-26 | 삼성전자주식회사 | 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 |
KR100762596B1 (ko) * | 2006-04-05 | 2007-10-01 | 삼성전자주식회사 | 음성 신호 전처리 시스템 및 음성 신호 특징 정보 추출방법 |
US8688437B2 (en) * | 2006-12-26 | 2014-04-01 | Huawei Technologies Co., Ltd. | Packet loss concealment for speech coding |
JP4327241B2 (ja) * | 2007-10-01 | 2009-09-09 | パナソニック株式会社 | 音声強調装置および音声強調方法 |
CA2715432C (en) * | 2008-03-05 | 2016-08-16 | Voiceage Corporation | System and method for enhancing a decoded tonal sound signal |
JP5038995B2 (ja) * | 2008-08-25 | 2012-10-03 | 株式会社東芝 | 声質変換装置及び方法、音声合成装置及び方法 |
JP5901971B2 (ja) * | 2009-02-03 | 2016-04-13 | ヒアワークス ピーティワイ リミテッドHearworks Pty Ltd | 強化エンベロープ符号化音、音声処理装置およびシステム |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
WO2010140590A1 (ja) * | 2009-06-03 | 2010-12-09 | 日本電信電話株式会社 | Parcor係数量子化方法、parcor係数量子化装置、プログラム及び記録媒体 |
JP5223786B2 (ja) * | 2009-06-10 | 2013-06-26 | 富士通株式会社 | 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機 |
CN105374362B (zh) * | 2010-01-08 | 2019-05-10 | 日本电信电话株式会社 | 编码方法、解码方法、编码装置、解码装置以及记录介质 |
JP5749462B2 (ja) * | 2010-08-13 | 2015-07-15 | 株式会社Nttドコモ | オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム |
EP2638541A1 (en) * | 2010-11-10 | 2013-09-18 | Koninklijke Philips Electronics N.V. | Method and device for estimating a pattern in a signal |
BR112013020587B1 (pt) * | 2011-02-14 | 2021-03-09 | Fraunhofer-Gesellschaft Zur Forderung De Angewandten Forschung E.V. | esquema de codificação com base em previsão linear utilizando modelagem de ruído de domínio espectral |
JP5613781B2 (ja) * | 2011-02-16 | 2014-10-29 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体 |
US8620646B2 (en) * | 2011-08-08 | 2013-12-31 | The Intellisis Corporation | System and method for tracking sound pitch across an audio signal using harmonic envelope |
BR112014032735B1 (pt) * | 2012-06-28 | 2022-04-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Codificador e decodificador de áudio com base em predição linear e respectivos métodos para codificar e decodificar |
EP2682941A1 (de) * | 2012-07-02 | 2014-01-08 | Technische Universität Ilmenau | Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne |
JP6145790B2 (ja) * | 2012-07-05 | 2017-06-14 | パナソニックIpマネジメント株式会社 | 符号化・復号化システム、復号化装置、符号化装置、及び符号化・復号化方法 |
CA2887009C (en) * | 2012-10-05 | 2019-12-17 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | An apparatus for encoding a speech signal employing acelp in the autocorrelation domain |
IL294836A (en) * | 2013-04-05 | 2022-09-01 | Dolby Int Ab | Audio encoder and decoder |
US9418671B2 (en) * | 2013-08-15 | 2016-08-16 | Huawei Technologies Co., Ltd. | Adaptive high-pass post-filter |
JP6385433B2 (ja) * | 2013-10-18 | 2018-09-05 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号のスペクトルのスペクトル係数のコード化 |
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
-
2015
- 2015-02-20 KR KR1020167029936A patent/KR101837153B1/ko active IP Right Grant
- 2015-02-20 PL PL20167436T patent/PL3699910T3/pl unknown
- 2015-02-20 PL PL20167434T patent/PL3696816T3/pl unknown
- 2015-02-20 KR KR1020187006358A patent/KR101860146B1/ko active IP Right Grant
- 2015-02-20 KR KR1020187006351A patent/KR101860143B1/ko active IP Right Grant
- 2015-02-20 JP JP2016515879A patent/JP6276846B2/ja active Active
- 2015-02-20 EP EP19163214.0A patent/EP3537439B1/en active Active
- 2015-02-20 EP EP15786322.6A patent/EP3139381B1/en active Active
- 2015-02-20 ES ES20167434T patent/ES2878061T3/es active Active
- 2015-02-20 ES ES19163214T patent/ES2805275T3/es active Active
- 2015-02-20 CN CN201910432900.6A patent/CN110289008B/zh active Active
- 2015-02-20 US US15/302,205 patent/US10204633B2/en active Active
- 2015-02-20 CN CN201580022816.7A patent/CN106537500B/zh active Active
- 2015-02-20 PL PL15786322T patent/PL3139381T3/pl unknown
- 2015-02-20 ES ES20167436T patent/ES2884034T3/es active Active
- 2015-02-20 EP EP20167434.8A patent/EP3696816B1/en active Active
- 2015-02-20 EP EP20167436.3A patent/EP3699910B1/en active Active
- 2015-02-20 CN CN201910728046.8A patent/CN110491401B/zh active Active
- 2015-02-20 PL PL19163214T patent/PL3537439T3/pl unknown
- 2015-02-20 TR TR2019/10806T patent/TR201910806T4/tr unknown
- 2015-02-20 WO PCT/JP2015/054718 patent/WO2015166694A1/ja active Application Filing
- 2015-02-20 KR KR1020187006347A patent/KR101860139B1/ko active IP Right Grant
- 2015-02-20 CN CN201910728067.XA patent/CN110491402B/zh active Active
- 2015-02-20 ES ES15786322T patent/ES2738723T3/es active Active
-
2017
- 2017-09-12 JP JP2017174631A patent/JP6412994B2/ja active Active
-
2018
- 2018-10-01 JP JP2018186413A patent/JP6674992B2/ja active Active
- 2018-12-21 US US16/228,980 patent/US10734009B2/en active Active
-
2020
- 2020-03-09 JP JP2020039489A patent/JP6867528B2/ja active Active
- 2020-05-14 US US15/931,694 patent/US11100938B2/en active Active
-
2021
- 2021-06-18 US US17/351,559 patent/US11501788B2/en active Active
-
2022
- 2022-09-29 US US17/955,980 patent/US11848021B2/en active Active
-
2023
- 2023-10-25 US US18/383,594 patent/US20240062767A1/en active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58168094A (ja) * | 1982-03-29 | 1983-10-04 | 藤崎 博也 | 音声分析処理方式 |
JPS5994795A (ja) * | 1982-11-22 | 1984-05-31 | 藤崎 博也 | 音声分析処理方式 |
CN1702736A (zh) * | 2001-08-31 | 2005-11-30 | 株式会社建伍 | 生成基音周期波形信号的装置和方法及处理语音信号的装置和方法 |
CN1669075A (zh) * | 2002-07-16 | 2005-09-14 | 皇家飞利浦电子股份有限公司 | 音频编码 |
CN101048649A (zh) * | 2004-11-05 | 2007-10-03 | 松下电器产业株式会社 | 可扩展解码装置及可扩展编码装置 |
CN1790486A (zh) * | 2004-12-14 | 2006-06-21 | Lg电子株式会社 | 语音编码装置及其方法 |
CN101589430A (zh) * | 2007-08-10 | 2009-11-25 | 松下电器产业株式会社 | 声音分离装置、声音合成装置及音质变换装置 |
CN101925950A (zh) * | 2008-01-04 | 2010-12-22 | 杜比国际公司 | 音频编码器和解码器 |
CN102379004A (zh) * | 2009-04-03 | 2012-03-14 | 株式会社Ntt都科摩 | 语音编码装置、语音解码装置、语音编码方法、语音解码方法、语音编码程序以及语音解码程序 |
US20120296659A1 (en) * | 2010-01-14 | 2012-11-22 | Panasonic Corporation | Encoding device, decoding device, spectrum fluctuation calculation method, and spectrum amplitude adjustment method |
CN103329199A (zh) * | 2011-01-25 | 2013-09-25 | 日本电信电话株式会社 | 编码方法、编码装置、周期性特征量决定方法、周期性特征量决定装置、程序、记录介质 |
EP2696343A1 (en) * | 2011-04-05 | 2014-02-12 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoding device, decoding device, program, and recording medium |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106537500B (zh) | 周期性综合包络序列生成装置、周期性综合包络序列生成方法、记录介质 | |
JP6744471B2 (ja) | 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体 | |
CN107408390A (zh) | 线性预测编码装置、线性预测解码装置、它们的方法、程序以及记录介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |