CN103413553A - 音频编码方法、音频解码方法、编码端、解码端和系统 - Google Patents

音频编码方法、音频解码方法、编码端、解码端和系统 Download PDF

Info

Publication number
CN103413553A
CN103413553A CN201310364530XA CN201310364530A CN103413553A CN 103413553 A CN103413553 A CN 103413553A CN 201310364530X A CN201310364530X A CN 201310364530XA CN 201310364530 A CN201310364530 A CN 201310364530A CN 103413553 A CN103413553 A CN 103413553A
Authority
CN
China
Prior art keywords
sound signal
signal
audio
frame sound
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310364530XA
Other languages
English (en)
Other versions
CN103413553B (zh
Inventor
陈国明
彭远疆
欧文军
刘洪�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Tencent Cloud Computing Beijing Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201310364530.XA priority Critical patent/CN103413553B/zh
Publication of CN103413553A publication Critical patent/CN103413553A/zh
Priority to PCT/CN2014/082888 priority patent/WO2015024428A1/en
Priority to US14/596,753 priority patent/US9812139B2/en
Application granted granted Critical
Publication of CN103413553B publication Critical patent/CN103413553B/zh
Priority to US15/790,876 priority patent/US9997166B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/09Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being zero crossing rates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明公开了一种音频编码方法、音频解码方法、编码端、解码端和系统,属于网络技术领域。所述方法包括:根据音频参数确定音频信号是否为指定信号类型;对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记;其中,标记过程可以在编码端或者解码端进行,用于在解码时对指定信号类型的音频信号进行增强处理。本发明通过音频参数确定音频信号是否为指定信号类型,只对指定信号类型进行增强,解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强的同时也被增强而影响音频信号的感知的问题;达到了保证音频信号的感知的效果,并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。

Description

音频编码方法、音频解码方法、编码端、解码端和系统
技术领域
本发明涉及网络技术领域,特别涉及一种音频编码方法、音频解码方法、编码端、解码端和系统。
背景技术
音频增强技术是常见的对音频信号进行处理的技术之一。常用的音频增强技术有回声、混响、声像扩展、均衡和3D环绕等。
上述技术一般采用模块的方式将音频信号在时域内处理或者变换到频域内处理。通常来说,如果单纯将音频信号在时域内进行增强处理,往往达不到最优效果;而将音频信号变换到频域内进行增强处理,又会因为时频变换而增加较多额外的运算复杂度,所以一般对音频信号先进行编解码处理,再进行增强处理,从而达到在保证处理效果的前提下节省运算量。
在实现本发明的过程中,发明人发现现有技术至少存在以下缺点:由于在对音频信号进行编解码处理过程中不可避免的会引入量化噪声,而在对音频信号进行增强处理的过程中,可能造成在音频信号被放大的过程中,量化噪声也被放大,从而影响音频信号的感知。
发明内容
为了解决音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题,本发明实施例提供了一种音频编码方法、音频解码方法、编码端、解码端和系统。所述技术方案如下:
第一方面,提供了一种音频编码方法,所述方法包括:
获取连续的若干帧音频信号;
根据每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型;
对属于所述指定信号类型的音频信号和/或不属于所述指定信号类型的音频信号进行标记,得到标记后的音频编码码流;
其中,所述标记用于在解码时对所述指定信号类型的音频信号进行增强处理。
第二方面,提供了一种音频解码方法,所述方法包括:
获取标记后的音频编码码流,所述标记为编码端在一帧音频信号属于指定信号类型和/或不属于所述指定信号类型时进行标记的;
从所述音频编码码流中获取若干帧音频信号,以及全部或者部分帧音频信号的标记;
根据所述标记对属于所述指定信号类型的音频信号进行增强处理,得到增强后的音频信号;
将所述增强后的音频信号加入所述若干帧音频信号的解码码流中,得到音频解码信号。
第三方面,提供了一种音频解码方法,所述方法包括:
获取待解码的音频编码码流;
从所述音频编码码流中获取连续的若干帧音频信号和每帧音频信号的音频参数;
根据每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型;
对属于所述指定信号类型的音频信号进行增强处理,得到增强后的音频信号;
将所述增强后的音频信号加入所述若干帧音频信号的解码码流中,得到音频解码信号。
第四方面,提供了一种音频编码装置,所述装置包括:
信号获取模块,用于获取连续的若干帧音频信号;
第一确定模块,用于根据所述信号获取模块获取到的每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型;
标记模块,用于对属于所述第一确定模块确定的指定信号类型的音频信号和/或不属于所述指定信号类型的音频信号进行标记,得到标记后的音频编码码流;
其中,所述标记用于在解码时对所述指定信号类型的音频信号进行增强处理。
第五方面,提供了一种音频解码装置,所述装置包括:
第一获取模块,用于获取标记后的音频编码码流,所述标记为编码端在一帧音频信号属于指定信号类型和/或不属于所述指定信号类型时进行标记的;
标记获取模块,用于从所述第一获取模块获取到的音频编码码流中获取若干帧音频信号,以及全部或者部分帧音频信号的标记;
第一增强模块,用于根据所述标记获取模块获取到的所述标记对属于所述指定信号类型的音频信号进行增强处理,得到增强后的音频信号;
第一加入模块,用于将所述第一增强模块增强后的音频信号加入所述若干帧音频信号的解码码流中,得到音频解码信号。
第六方面,提供了一种音频解码装置,所述装置包括:
第二获取模块,用于获取待解码的音频编码码流;
第三获取模块,用于从所述第二获取模块获取到的音频编码码流中获取连续的若干帧音频信号和每帧音频信号的音频参数;
第二确定模块,用于根据所述第三获取模块获取到的每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型;
第二增强模块,用于对所述第二确定模块确定的属于所述指定信号类型的音频信号进行增强处理,得到增强后的音频信号;
第二加入模块,用于将所述第二增强模块增强后的音频信号加入所述若干帧音频信号的解码码流中,得到音频解码信号。
第七方面,提供了一种编码端,所述编码端包括第四方面所述的编码装置。
第八方面,提供了一种解码端,所述编码端包括第五方面所述的编码装置。
第九方面,提供了一种解码端,所述编码端包括第六方面所述的编码装置。
第十方面,提供了一种音频编解码系统,包括第七方面所述的编码端和第八方面所述的解码端。
第十一方面,提供了一种音频编解码系统,包括编码端和第九方面所述的解码端。
本发明实施例提供的技术方案带来的有益效果是:
通过每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型,并对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记,得到标记后的音频编码码流,其中,标记用于解码端在解码时对指定信号类型的音频信号进行增强处理;解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题;达到了只对指定信号类型的音频信号进行增强,不对非指定信号类型的音频信号进行增强,使得在音频信号增强过程中保证音频信号的感知的效果,并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的音频编码方法的方法流程图;
图2是本发明实施例二提供的音频解码方法的方法流程图;
图3是本发明实施例三提供的音频解码方法的方法流程图;
图4a是本发明实施例四提供的音频增强方法的编码端逻辑方框示意图;
图4b是本发明实施例四提供的音频增强方法的解码端逻辑方框示意图;
图5a是本发明实施例五提供的音频增强方法的编码端逻辑方框示意图;
图5b是本发明实施例五提供的音频增强方法的解码端逻辑方框示意图;
图6是本发明实施例四提供的音频增强方法的方法流程图;
图7是本发明实施例五提供的音频增强方法的方法流程图;
图8是本发明实施例六提供的音频编码装置的结构方框图;
图9是本发明实施例七提供的音频解码装置的结构方框图;
图10是本发明实施例八提供的音频解码装置的结构方框图;
图11是本发明实施例九提供的音频编解码系统的结构方框图;
图12是本发明实施例十提供的音频编解码系统的结构方框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例一
请参考图1,其示出了本发明实施例一提供的音频编码方法的方法流程图。该音频编码方法,包括:
步骤102,获取连续的若干帧音频信号;
编码端获取连续的若干帧音频信号。
步骤104,根据每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型;
编码端根据每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型。
步骤106,对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记,得到标记后的音频编码码流;
编码端对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记,得到标记后的音频编码码流,其中,标记用于解码端在解码时对指定信号类型的音频信号进行增强处理。
综上所述,本发明实施例提供的音频编码方法,通过每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型,并对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记,得到标记后的音频编码码流,其中,标记用于解码端在解码时对指定信号类型的音频信号进行增强处理;解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题;达到了只对指定信号类型的音频信号进行增强,不对非指定信号类型的音频信号进行增强,使得在音频信号增强过程中保证音频信号的感知的效果,并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。
实施例二
请参考图2,其示出了本发明实施例二提供的音频解码方法的方法流程图。该音频解码方法,包括:
步骤202,获取标记后的音频编码码流;
解码端获取标记后的音频编码码流,该标记为编码端在一帧音频信号属于指定信号类型和/或不属于所述指定信号类型时进行标记的。
步骤204,从音频码流中获取若干帧音频信号,以及全部或者部分帧音频信号的标记;
解码端从音频码流中获取若干帧音频信号,以及全部或者部分帧音频信号的标记。
步骤206,根据标记对属于指定信号类型的音频信号进行增强处理,得到增强后的音频信号;
解码端根据标记对属于指定信号类型的音频信号进行增强处理,得到增强后的音频信号。
步骤208,将增强后的音频信号加入若干帧音频信号的解码码流中,得到音频解码信号;
解码端将增强后的音频信号加入若干帧音频信号的解码码流中,得到音频解码信号。
综上所述,本发明实施例提供的音频解码方法,通过从标记后的音频码流中获取若干帧音频信号,以及全部或者部分帧音频信号的标记,根据标记对属于指定信号类型的音频信号进行增强处理,得到增强后的音频信号,然后将增强后的音频信号加入若干帧音频信号的解码码流中,得到音频解码信号;解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题;达到了只对指定信号类型的音频信号进行增强,不对非指定信号类型的音频信号进行增强,使得在音频信号增强过程中保证音频信号的感知的效果,并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。
实施例三
请参考图3,其示出了本发明实施例三提供的音频解码方法的方法流程图。该音频解码方法,包括:
步骤302,获取待解码的音频编码码流;
解码端获取待解码的音频编码码流。
步骤304,从音频码流中获取连续的若干帧音频信号和每帧音频信号的音频参数;
解码端从音频码流中获取连续的若干帧音频信号和每帧音频信号的音频参数。
步骤306,根据每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型;
解码端根据每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型。
步骤308,对属于指定信号类型的音频信号进行增强处理,得到增强后的音频信号;
解码端对属于指定信号类型的音频信号进行增强处理,得到增强后的音频信号。
步骤310,将增强后的音频信号加入若干帧音频信号的解码码流中,得到音频解码信号;
解码端将增强后的音频信号加入若干帧音频信号的解码码流中,得到音频解码信号。
综上所述,本发明实施例提供的音频解码方法,通过从待解码的音频码流中获取连续的若干帧音频信号和每帧音频信号的音频参数,根据每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型,然后对属于指定信号类型的音频信号进行增强处理,得到增强后的音频信号,将增强后的音频信号加入若干帧音频信号的解码码流中,得到音频解码信号;解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题;达到了只对指定信号类型的音频信号进行增强,不对非指定信号类型的音频信号进行增强,使得在音频信号增强过程中保证音频信号的感知的效果,并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。
为了实现对音频信号的增强处理,本发明实施例提供两种音频编解码系统。第一种音频编解码系统中的编码端和解码端合作来对音频信号进行选择性增强处理,其中编码端包括有内容判决逻辑用以实现根据音频信号的音频参数判断是否需要进行增强处理;第一种音频编解码系统中编码端逻辑框图和解码端逻辑框图分别如图4a和图4b所示。第二种音频编解码系统中只需要解码端即可完成对音频信号进行选择性增强处理,该解码端包含有内容判决逻辑用以实现根据音频信号的音频参数判断是否需要进行增强处理;第二种音频编解码系统中编码端逻辑框图和解码端逻辑框图分别如图5a和图5b所示。
首先对应用于第一种音频编解码系统中的音频增强方法进行详细介绍。
实施例四
请参考图6,其示出了本发明实施例四提供的音频增强方法的方法流程图。该音频解码方法,包括:
步骤601,编码端获取连续的若干帧音频信号;
要实现对音频信号的增强处理,首先编码端需要对时域内的音频信号进行编码,本发明实施例以960点作为一帧音频信号的长度。编码端获取连续的若干帧时域内的音频信号。如图4a中的输入信号即为音频信号的960个采样点的样点值x(n)。
步骤602,编码端获取每帧音频信号的音频参数;
每帧音频信号的音频参数包括对数能量、高过零率比和谱通量,由图4a中的内容判决模块提取每帧音频信号的对数能量、高过零率比和谱通量。
其中,编码端直接根据每帧信号的960个采样点的样点值x(n)得到该帧音频信号的对数能量和高过零率比,根据经过MDCT(Modified Discrete CosineTransform,离散余弦变换)变换后得到的频域信号X(n)得到该帧音频信号的谱通量;
具体的,第i帧音频信号的时域能量定义为:
E ( i ) = Σ n = ( i - 1 ) * L i * L - 1 x 2 ( n )
第i帧音频信号的对数能量为:
Elog(i)=log2(E(i))
其中,x(n)表示第i帧音频信号的采样点n的样点值,L表示帧长,此处L=960,n取0到959。
第i帧音频信号的过零率ZCR(i)定义为:
ZCR ( i ) = Σ n = ( i - 1 ) * L i * L - 1 [ sign ( x ( n ) ) - sign ( x ( n - 1 ) ) ] 2
其中,sign(x)为符号函数,定义为:
sign ( x ) = 1 , x &GreaterEqual; 0 - 1 , x < 0
第i帧音频信号的高过零率比为:
HZCRR = 1 2 N &Sigma; n = 0 N - 1 [ sign ( ZCR ( n ) - 1.5 avZCR ) + 1 ]
其中,avZCR(i)是N帧音频信号的平均过零率,此处N=25。
avZCR ( i ) = 1 N &Sigma; n = 0 N - 1 ZCR ( n ) .
谱通量定义为相邻两帧音频信号的频谱的平均方差:
SF ( i ) = 1 N &Sigma; k = 0 N - 1 [ log ( | X ( i , k ) | + delta ) - log ( | X ( i - 1 , k ) | + delta ) ] 2
其中,X(i,k)为第i帧信号的频谱系数,k为频谱系数下标,delta为一个小量,本实施例中delta=0.0001。
步骤603、编码端根据对数能量、高过零率比和谱通量确定每帧音频信号是否为指定信号类型;
其中,指定信号类型为类音频信号,不属于类音频信号的音频信号包括静音信号和语音信号;
若一帧音频信号的对数能量不小于第一阈值、高过零率比不大于第二阈值、谱通量大于第三阈值,则确定一帧音频信号为类音频信号。
比如,若第i帧音频信号的对数能量不小于特定门限Thr(即小于0)、第i帧音频信号的高过零率比不大于0.2,且第i帧音频信号和第i-1帧信号的频谱的平均方差即第i帧音频信号的谱通量大于20,则确定第i帧音频信号为类音频信号。
对于每帧音频信号的具体确定过程如下:
首先判断该帧音频信号的对数能量是否小于第一阈值,若该帧音频信号的对数能量小于第一阈值,第一阈值可以是0,则确定该帧音频信号为静音信号;若该帧音频信号的对数能量不小于第一阈值,则继续判断该帧音频信号的高过零率比是否大于第二阈值,第二阈值可以是0.2;
若该帧音频信号的高过零率比大于第二阈值,则确定该帧音频信号为语音信号;若该帧音频信号的高过零率比不大于第二阈值,,则继续判断该帧音频信号的谱通量是否大于第三阈值,第三阈值可以是20;
若该帧音频信号的谱通量大于第三阈值,则确定该帧音频信号为类音频信号;若该帧音频信号的谱通量不大于第三阈值,则确定该帧音频信号为语音信号。
步骤604,编码端对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记,得到标记后的音频编码码流,该标记用于在解码时对指定信号类型的音频信号进行增强处理。
具体的,本步骤可以包括如下两个子步骤:
第一,编码端对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记。
第二,编码端对标记后的音频信号进行编码。
其中,第一子步骤可以包括以下几种方式对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记:
对属于类音频信号的音频信号进行第一标记,对不属于类音频信号的音频信号不进行标记;比如,用1个比特位来标记音频信号,对属于类音频信号的音频信号标记为1或者0,对不属于类音频信号的音频信号不添加比特位,以便解码端在解码的时候根据是否含有比特位来判断是否需要对该帧音频信号进行增强处理。
或者,
对属于类音频信号的音频信号进行第一标记,对不属于类音频信号的音频信号进行其它标记;其中,对不属于类音频信号的音频信号进行其它标记包括:对属于静音信号的音频信号进行第二标记,对属于语音信号的音频信号进行第三标记;比如,用1个比特位来标记音频信号,对属于类音频信号的音频信号标记为1,对不属于类音频信号的音频信号标记为0;也可以用2个比特位来标记音频信号,对属于类音频信号的音频信号标记为10,对属于静音信号的音频信号标记为00,对属于语音信号的音频信号标记为01;以便解码端根据标记来判断是否需要对该帧音频信号进行增强处理。
或者,
对属于类音频信号的音频信号不进行标记,对不属于类音频信号的音频信号进行其它标记;其中,对不属于类音频信号的音频信号进行其它标记包括:对属于静音信号的音频信号进行第二标记,对属于语音信号的音频信号进行第三标记;比如,用1个比特位来标记音频信号,对属于类音频信号的音频信号不进行标记,对不属于类音频信号的音频信号标记为1或者0,以便解码端在解码的时候根据是否含有比特位来判断是否需要对该帧音频信号进行增强处理。
需要说明的是,本发明实施例以用两个比特位来标记类音频信号、静音信号和语音信号为例进行说明,即将类音频信号标记为10,将静音信号标记为00,将语音信号标记为01,以便解码端根据标记来判断是否需要对该帧音频信号进行增强处理。
其中,第二子步骤又可以包括以下六个子步骤,结合参考图4a:
1,编码端将音频信号作为输入信号进行正交镜像变换,得到正交镜像变换后的音频信号。
2,编码端对正交镜像变换后的音频信号进行下混,得到下混后的音频信号。
3,编码端将下混后的音频信号进行2倍下采样,得到2倍下采样后的音频信号。
4,编码端将2倍下采样后的音频信号再进行核心编码,得到音频信号的量化编码信号;具体的,核心编码包括MDCT变换和量化编码的过程。将量化编码后得到的量化编码信号加入到音频信号的编码码流中。
5,编码端将正交镜像变换后的音频信号进行立体声编码得到立体声编码参数,将立体声编码参数也加入到音频信号的编码码流中。
6,编码端将下混后的音频信号经过频带复制编码得到频带复制编码参数,将频带复制编码参数也加入到音频信号的编码码流中。
最终得到包含有标记、量化编码信号,立体声编码啊参数和频带复制编码参数的音频编码码流。
需要说明的是,上述步骤601至步骤604可以单独实现成为编码端的音频编码方法。
步骤605,解码端获取标记后的音频编码码流;
该标记为编码端在一帧音频信号属于指定信号类型和/或不属于指定信号类型时进行标记的。
比如,图4b中的解码码流即为解码端获取到的标记后的音频编码码流,该音频编码码流中含有解码端在一帧音频信号属于指定信号类型和/或不属于指定信号类型时进行的标记。
步骤606,解码端从音频码流中获取若干帧音频信号,以及全部或者部分帧音频信号的标记;
若编码端对属于类音频信号的音频信号进行第一标记,对不属于类音频信号的音频信号进行其它标记,则解码端从音频码流中获取若干帧音频信号,以及全部帧音频信号的标记。
比如,本发明实施例中编码端将类音频信号标记为10,将静音信号标记为00,将语音信号标记为01,则解码端从音频码流中获取若干帧音频信号,以及所有帧音频信号的标记。
若编码端对属于类音频信号的音频信号进行第一标记,对不属于类音频信号的音频信号进行其它标记,或者解码端对属于类音频信号的音频信号不进行标记,对不属于类音频信号的音频信号进行其它标记,则解码端从音频码流中获取若干帧音频信号,以及部分帧音频信号的所包含的标记。
比如,若编码端将属于类音频信号的音频信号标记为1或0,则解码端从音频码流中获取若干帧音频信号,以及部分帧音频信号的所包含的标记1或者0;若编码端将不属于类音频信号的音频信号标记为1或0,则解码端从音频码流中获取若干帧音频信号,以及部分帧音频信号的所包含的标记1或者0。
步骤607,解码端根据标记对属于指定信号类型的音频信号进行增强处理,得到增强后的音频信号;
对音频信号进行增强处理包括频谱增强和声像扩展。
请参考图4b,音频解码码流经过核心码流解码后得到解码后的音频信号,对解码后的音频信号根据标记进行内容判决,判断是否需要对该帧音频信号进行增强处理。
比如,经过图4b中的内容判决后,解码端将本发明实施例中标记为10的音频信号进行频谱增强后再进行高频恢复,而对本发明实施例中标记为00和01的音频信号直接进行高频恢复;对于进行高频恢复后的音频信号再次进行判断,根据标记判断是否需要对该帧音频信号进行声像扩展,将标记为10的音频信号进行声像扩展后再进行立体声恢复得到音频解码信号,而对本发明实施例中标记为00和01的音频信号直接进行立体声恢复得到音频解码信号。
另外,在对该帧音频信号进行高频恢复的时候,将音频解码码流经过频带复制解码后得到的频带复制解码参数加入到进行高频恢复前的音频信号中,实现对音频信号的高频恢复;还将音频解码码流经过立体声解码得到的立体声解码参数加入到高频恢复后的音频信号中,对加入立体声解码参数的高频恢复后的音频信号再次跟进标记判断是否需要对该帧音频信号进行声像扩展。
具体的,对类音频信号进行频谱增强,包括如下几个子步骤:
1)、获取每帧音频信号的频率;
2)、根据每帧音频信号的频率确定每帧音频信号的频谱增强系数;
比如,对于频率处于60hz~170hz频段的输入信号,频谱增强系数:
X'(n)=gain_const*X(n),5≤n≤31
其中gain_const为增益常数;
对于频率处于2khz~4khz频段的输入信号,频谱增强系数:
X &prime; ( n ) = ( n - 341 341 - 170 * ( gain _ high - gain _ low ) + gain _ high ) * X ( n ) , 170≤n≤341
其中,gain_high为增益上限值,gain_low为增益下限值;
对于频率处于4khz~8khz频段的输入信号,频谱增强系数:
X &prime; ( n ) = ( n - 682 682 - 341 * ( gain _ low - gain _ high ) + gain _ low ) * X ( n ) , 341<n≤682。
3)、按照每帧音频信号的频谱增强系数对每帧音频信号进行频谱增强。
对类音频信号进行声像扩展时,使用延时参数对类音频信号进行声像扩展,具体的,先根据输入信号X(n)在z域的变换形式Sk(z)通过公式
dk(z)=G(k,z)*Hk(z)*Sk(z)
得到解相关信号dk(z),其中,0≤k≤71,G(k,z)是与瞬间判决相关的函数;
Figure BDA0000369371300000133
其中,0≤k≤2,
Q(k,m)=exp(-iπq(m)fcenter(k))
a(m)、q(m)、qφ和fcenter均为常数,b为常数,通常取1。
步骤608,解码端将增强后的音频信号加入若干帧音频信号的解码码流中,得到音频解码信号;
解码端将增强后的音频信号加入若干帧音频信号的解码码流中,得到音频解码信号,再对音频解码信号进行立体声恢复,得到恢复后的立体声左右声道信号;
比如,设第i帧音频信号经过高频恢复后的单声道信号Sk(z)和解相关信号dk(z)的频域形式分别为S[K,i]和D[K,i],则恢复后的立体声左右声道信号L[K,i]和R[K,i]可以表示为:
L [ K , i ] R [ K , i ] = H [ K , i ] S [ K , i ] D [ K , i ]
其中上混矩阵H为:
H = c l cos ( &alpha; + &beta; ) c l sin ( &alpha; + &beta; ) c r cos ( &beta; - &alpha; ) c r sin ( &beta; - &alpha; )
其中,
c=10IID/20 c l = c * 2 / 1 + c 2 , c r = 2 / 1 + c 2 , α=arccos(ICC)/2, &beta; = &alpha; c r - c l 2 .
上述步骤605至步骤608可以单独实施成为解码端的音频解码方法。
综上所述,本发明实施例提供的音频增强方法,通过编码端根据对数能量、高过零率比和谱通量确定每帧音频信号是否为指定信号类型,对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记,得到标记后的音频编码码流,解码端在获取到编码端标记后的音频编码码流后,根据标记对属于指定信号类型的音频信号进行增强处理,得到增强后的音频信号;解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题;达到了只对指定信号类型的音频信号进行增强,不对非指定信号类型的音频信号进行增强,使得在音频信号增强过程中保证音频信号的感知的效果,并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。还通过在对音频信号进行频谱增强的过程中,根据音频信号的频率来确定每帧音频信号的频谱增强系数,在对音频信号进行声像扩展时采用延时参数对音频信号进行声像扩展,达到了更好的保证音频信号的感知的效果。
其次,对应于于第二种音频编解码系统中的音频增强方法进行介绍。
实施例五
请参考图7,其示出了本发明实施例五提供的音频增强方法的方法流程图。该音频解码方法,包括:
步骤701,编码端对若干帧音频信号进行编码,得到音频编码码流;
编码端按照图5a所示的编码逻辑框图对若干帧音频信号进行编码,先将若干帧音频信号进行正交镜像变换,得到正交镜像变换后的音频信号,再经过下混得到下混后的音频信号,将下混后的音频信号经过2倍下采样得到2倍下采样后的音频信号,将2倍下采样后的音频信号经过MDCT变换后得到的音频信号,再将经过MDCT变换后的音频信号进行量化编码得到编码后的音频信号,将量化编码后的音频信号加入到编码码流中;经过正交镜像变换后的音频信号还通过立体声编码得到该音频信号的立体声编码参数,将立体声编码参数也加入到该音频信号的编码码流中;经过下混后的信号还经过频带复制编码得到频带复制编码参数,将频带复制编码参数也加入到该音频信号的编码码流中,最后得到包含有量化编码、立体声编码参数和频带复制编码参数的音频编码码流。
步骤702,解码端获取待解码的音频编码码流;
解码端获取经过步骤701得到的音频编码码流。比如,图5b中的解码码流即为获取到的音频编码码流。
步骤703,解码端从音频编码码流中获取连续的若干帧音频信号和每帧音频信号的音频参数;
解码端从获取到的音频编码码流中获取连续的若干帧音频信号和每帧音频信号的音频参数,每帧音频信号的音频参数,包括频谱能量总和、修正谱平坦度和谱通量。
比如,图5b中的内容判决模块获取每帧音频信号的频谱能量总和、修正谱平坦度和谱通量。
具体的,第i帧音频信号的频谱能量总和为:
E ( i ) = &Sigma; n = ( i - 1 ) * L i * L - 1 X 2 ( n )
其中,X(n)为输入信号的频谱系数,L表示帧长,此处L=960,n取0到959;
第i帧信号的修正谱平坦度为:
SFM ( i ) = G N ( i ) A n ( i )
其中,
Figure BDA0000369371300000153
{N为Xk的个数,Xk≠0,1≤k≤n≤L}表示第i帧的几何平均;
Figure BDA0000369371300000154
{N为Xk的个数,Xk≠0,1≤k≤n≤L}表示第i帧的算数平均;
谱通量定义为相邻两帧信号的频谱的平均方差:
SF ( i ) = 1 N &Sigma; k = 0 N - 1 [ log ( | X ( i , k ) | + delta ) - log ( | X ( i - 1 , k ) | + delta ) ] 2
其中,X(i,k)为第i帧信号的频谱系数,k为频谱系数下标,0≤k≤959,delta为一个小量,本实施例中delta=0.0001。
步骤704,解码端根据每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型;
其中,指定信号类型为类音频信号,解码端根据每帧音频信号的音频参数确定每帧音频信号是否属于类音频信号;
若一帧音频信号的频谱能量总和大于第四阈值、修正谱平坦度小于第五阈值、谱通量大于第三阈值,则确定所述一帧音频信号为类音频信号。
比如,第i帧频谱信号的频谱能量总和大于105、第i帧信号的修正谱平坦度小于0.8、第i帧信号和第i-1帧信号的频谱的平均方差即第i帧音频信号的谱通量大于20,则确定第i帧音频信号为类音频信号。
对于每帧音频信号的具体确定过程如下:
首先判断该帧音频信号的频谱能量总和是否大于第四阈值,第四阈值可以为105,若该帧音频信号的频谱能量总和不大于第四阈值,则确定该帧音频信号不是类音频信号;若该帧音频信号的频谱能量总和大于第四阈值,则继续判断该帧信号的修正谱平坦度是否小于第五阈值,第五阈值可以为0.8;
若该帧音频信号的修正谱平坦度不小于第五阈值,则确定该帧音频信号不是类音频信号;若该帧音频信号的修正谱平坦度小于第五阈值,则继续判断该帧音频信号的谱通量是否大于第三阈值,第三阈值可以为20;
若该帧音频信号的谱通量大于第三阈值,则确定该帧音频信号为类音频信号;若该帧音频信号的谱通量不大于第三阈值,则确定该帧音频信号不是类音频信号。
需要说明的是,解码端也可以根据判断结果为音频信号进行标记,用以区分类音频信号和非类音频信号,以便在后续判断是否需要进行增强处理时直接根据音频信号的标记来判断是否需要对音频信号进行增强处理。
具体的,对类音频信号的音频信号进行第一标记,对非类音频信号不进行标记;或者,
对类音频信号的音频信号进行第一标记,对非类音频信号进行其它标记;或者,
对类音频信号的音频信号不进行标记,对非类音频信号进行其它标记。
比如,用1个比特位来标记音频信号,编码端可以将类音频信号标记为1或者0,同时不对非类音频信号进行标记;或者,编码可以将类音频信号标记为1,同时对非类音频信号标记为0;或者,编码可以不对类音频信号进行标记,同时对非类音频信号标记为1或者0。
本发明实施例以不对音频信号进行标记,直接根据判断结果对音频信号进行增强处理或不进行增强处理为例进行说明。
步骤703和步骤704包含于图5b中的内容判决过程中。
步骤705,编码端对属于指定信号类型的音频信号进行增强处理,得到增强后的音频信号;
对音频信号进行增强处理包括频谱增强和声像扩展。
请参考图5b,音频解码码流经过核心码流解码后得到解码后的音频信号,对解码后的音频信号根据标记进行内容判决,判断是否需要对该帧音频信号进行增强处理。
比如,经过图5b中的内容判决后,解码端将类音频信号进行频谱增强后再进行高频恢复,而将不是类音频信号的音频信号直接进行高频恢复;对于进行高频恢复后的音频信号再次进行判断,将类音频信号进行声像扩展后再进行立体声恢复,而将不是类音频信号的音频信号直接进行立体声恢复得到音频解码信号。
另外,在对该帧音频信号进行高频恢复的时候,将音频解码码流经过频带复制解码后得到的频带复制解码参数加入到进行高频恢复前的音频信号中,实现对音频信号的高频恢复;还将音频解码码流经过立体声解码得到的立体声解码参数加入到高频恢复后的音频信号中,对加入立体声解码参数的高频恢复后的音频信号再次跟进标记判断是否需要对该帧音频信号进行声像扩展。
具体的,对类音频信号进行频谱增强,包括如下几个子步骤:
1)、获取每帧音频信号的频率;
2)、根据每帧音频信号的频率确定每帧音频信号的频谱增强系数;
比如,对于频率处于60hz~170hz频段的输入信号,频谱增强系数:
X'(n)=gain_const*X(n),5≤n≤31
其中gain_const为增益常数;
对于频率处于2khz~4khz频段的输入信号,频谱增强系数:
X &prime; ( n ) = ( n - 341 341 - 170 * ( gain _ high - gain _ low ) + gain _ high ) * X ( n ) , 170≤n≤341
其中,gain_high为增益上限值,gain_low为增益下限值;
对于频率处于4khz~8khz频段的输入信号,频谱增强系数:
X &prime; ( n ) = ( n - 682 682 - 341 * ( gain _ low - gain _ high ) + gain _ low ) * X ( n ) , 341<n≤682。
3)、解码端按照每帧音频信号的频谱增强系数对每帧音频信号进行频谱增强。
对类音频信号进行声像扩展时,使用延时参数对类音频信号进行声像扩展,具体的,先根据输入信号X(n)在z域的变换形式Sk(z)通过公式
dk(z)=G(k,z)*Hk(z)*Sk(z)
得到解相关信号dk(z),其中,0≤k≤71,G(k,z)是与瞬间判决相关的函数;
Figure BDA0000369371300000182
其中,0≤k≤2,
Q(k,m)=exp(-iπq(m)fcenter(k))
Figure BDA0000369371300000183
a(m)、q(m)、qφ和fcenter均为常数,b为常数,通常取1。
步骤706,解码端将增强后的音频信号加入若干帧音频信号的解码码流中,得到音频解码信号;
解码端将增强后的音频信号加入若干帧音频信号的解码码流中,得到音频解码信号,再对音频解码信号进行立体声恢复,得到恢复后的立体声左右声道信号;
比如,设第i帧音频信号经过高频恢复后的单声道信号Sk(z)和解相关信号dk(z)的频域形式分别为S[K,i]和D[K,i],则恢复后的立体声左右声道信号L[K,i]和R[K,i]可以表示为:
L [ K , i ] R [ K , i ] = H [ K , i ] S [ K , i ] D [ K , i ]
其中上混矩阵H为:
H = c l cos ( &alpha; + &beta; ) c l sin ( &alpha; + &beta; ) c r cos ( &beta; - &alpha; ) c r sin ( &beta; - &alpha; )
其中,
c=10IID/20 c l = c * 2 / 1 + c 2 , c r = 2 / 1 + c 2 , α=arccos(ICC)/2, &beta; = &alpha; c r - c l 2 .
上述步骤702至步骤706可以单独实施成为解码端的音频解码方法。
综上所述,本发明实施例提供的音频增强方法,通过解码端根据频谱能量总和、修正谱平坦度和谱通量确定每帧音频信号是否为指定信号类型,对属于指定信号类型的音频信号进行增强处理,得到增强后的音频信号;解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题;达到了只对指定信号类型的音频信号进行增强,不对非指定信号类型的音频信号进行增强,使得在音频信号增强过程中保证音频信号的感知的效果,并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。还通过在对音频信号进行频谱增强的过程中,根据音频信号的频率来确定每帧音频信号的频谱增强系数,在对音频信号进行声像扩展时采用延时参数对音频信号进行声像扩展,达到了更好的保证音频信号的感知的效果。
实施例六
请参考图8,其示出了本发明实施例六提供的音频编码装置的结构方框图。该音频编码装置可以通过软件、硬件或者两者的结合实现成为编码端的全部或者一部分,该音频编码装置,包括:
信号获取模块810,用于获取连续的若干帧音频信号.
第一确定模块820,用于根据所述信号获取模块810获取到的每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型。
标记模块830,用于对属于所述第一确定模块820确定的指定信号类型的音频信号和/或不属于所述指定信号类型的音频信号进行标记,得到标记后的音频编码码流。
其中,所述标记用于在解码时对所述指定信号类型的音频信号进行增强处理。
综上所述,本发明实施例提供的音频编码装置,通过每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型,并对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记,得到标记后的音频编码码流,其中,标记用于解码端在解码时对指定信号类型的音频信号进行增强处理;解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题;达到了只对指定信号类型的音频信号进行增强,不对非指定信号类型的音频信号进行增强,使得在音频信号增强过程中保证音频信号的感知的效果,并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。
实施例七
请参考图9,其示出了本发明实施例七提供的音频解码装置的结构方框图。该音频编码装置可以通过软件、硬件或者两者的结合实现成为解码端的全部或者一部分,该音频解码装置,包括:
第一获取模块910,用于获取标记后的音频编码码流,所述标记为编码端在一帧音频信号属于指定信号类型和/或不属于所述指定信号类型时进行标记的;
标记获取模块920,用于从所述第一获取模块910获取到的音频编码码流中获取若干帧音频信号,以及全部或者部分帧音频信号的标记;
第一增强模块930,用于根据所述标记获取模块920获取到的所述标记对属于所述指定信号类型的音频信号进行增强处理,得到增强后的音频信号;
第一加入模块940,用于将所述第一增强模块930增强后的音频信号加入所述若干帧音频信号的解码码流中,得到音频解码信号。
综上所述,本发明实施例提供的音频解码装置,通过从标记后的音频码流中获取若干帧音频信号,以及全部或者部分帧音频信号的标记,根据标记对属于指定信号类型的音频信号进行增强处理,得到增强后的音频信号,然后将增强后的音频信号加入若干帧音频信号的解码码流中,得到音频解码信号;解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题;达到了只对指定信号类型的音频信号进行增强,不对非指定信号类型的音频信号进行增强,使得在音频信号增强过程中保证音频信号的感知的效果,并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。
实施例八
请参考图10,其示出了本发明实施例八提供的音频解码装置的结构方框图。该音频编码装置可以通过软件、硬件或者两者的结合实现成为解码端的全部或者一部分,该音频解码装置,包括:
第二获取模块1010,用于获取待解码的音频编码码流;
第三获取模块1020,用于从所述第二获取模块1010获取到的音频编码码流中获取连续的若干帧音频信号和每帧音频信号的音频参数;
第二确定模块1030,用于根据所述第三获取模块1020获取到的每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型;
第二增强模块1040,用于对所述第二确定模块1030确定的属于所述指定信号类型的音频信号进行增强处理,得到增强后的音频信号;
第二加入模块1050,用于将所述第二增强模块1040增强后的音频信号加入所述若干帧音频信号的解码码流中,得到音频解码信号。
综上所述,本发明实施例提供的音频解码装置,通过从待解码的音频码流中获取连续的若干帧音频信号和每帧音频信号的音频参数,根据每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型,然后对属于指定信号类型的音频信号进行增强处理,得到增强后的音频信号,将增强后的音频信号加入若干帧音频信号的解码码流中,得到音频解码信号;解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题;达到了只对指定信号类型的音频信号进行增强,不对非指定信号类型的音频信号进行增强,使得在音频信号增强过程中保证音频信号的感知的效果,并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。
需要说明的是:上述实施例提供的音频编码装置和音频解码装置在对音频进行编解码时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将专职的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的音频编码装置和音频解码装置与音频编码方法和音频解码方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
实施例九
请参考图11,其示出了本发明实施例九提供的音频编解码系统的结构方框图。该音频编解码系统,包括:编码端1110和解码端1150;
所述编码端1110,包括:
信号获取模块1120,用于获取连续的若干帧音频信号。
第一确定模块1130,用于根据所述信号获取模块1120获取到的每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型。
所述指定信号类型为类音频信号,所述第一确定模块1130,包括:
参数获取单元1131,用于获取每帧音频信号的音频参数,所述音频参数包括对数能量、高过零率比和谱通量;
类型确定单元1132,用于根据所述参数获取单元1131获取到的对数能量、高过零率比和谱通量确定每帧音频信号是否为类音频信号。
所述类型确定单元1132具体用于当一帧音频信号的对数能量不小于第一阈值、高过零率比不大于第二阈值、谱通量大于第三阈值时,确定所述一帧音频信号为类音频信号。
标记模块1140,用于对属于所述第一确定模块1130确定的指定信号类型的音频信号和/或不属于所述指定信号类型的音频信号进行标记,得到标记后的音频编码码流。
其中,所述标记用于在解码时对所述指定信号类型的音频信号进行增强处理。
所述标记模块1140,包括:
标记单元1141,用于对指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记;
加入单元1142,用于将标记加入到音频信号的编码码流中,得到包含有标记的音频编码码流;
所述加入单元1142,包括:
正交子单元1142a,用于将音频信号作为输入信号进行正交镜像变换,得到正交镜像变换后的音频信号。
下混子单元1142b,用于对正交镜像变换后的音频信号进行下混,得到下混后的音频信号。
采样子单元1142c,用于将下混后的音频信号进行2倍下采样,得到2倍下采样后的音频信号。
编码子单元1142d,用于将2倍下采样后的音频信号再进行核心编码,得到音频信号的量化编码信号。
立体子单元1142e,用于将正交镜像变换后的音频信号进行立体声编码得到立体声编码参数,将立体声编码参数也加入到音频信号的编码码流中。
频带子单元1142f,用于将下混后的音频信号经过频带复制编码得到频带复制编码参数,将频带复制编码参数也加入到音频信号的编码码流中。
所述解码端1150,包括:
第一获取模块1160,用于获取标记后的音频编码码流,所述标记为编码端在一帧音频信号属于指定信号类型和/或不属于所述指定信号类型时进行标记的;
标记获取模块1170,用于从所述第一获取模块1160获取到的音频编码码流中获取若干帧音频信号,以及全部或者部分帧音频信号的标记;
第一增强模块1180,用于根据所述标记获取模块1170获取到的所述标记对属于所述指定信号类型的音频信号进行增强处理,得到增强后的音频信号;
所述属于所述指定信号类型的音频信号为类音频信号,所述第一增强模块1180,具体用于对所述类音频信号进行频谱增强和声像扩展。
具体的,所述第一增强模块1180,包括:
频率获取单元1181,用于获取每帧音频信号的频率;
系数确定单元1182,用于根据所述频率获取单元1181获取到的每帧音频信号的频率确定每帧音频信号的频谱增强系数;
增强单元1183,用于按照所述系数确定单元1182确定的每帧音频信号的频谱增强系数对每帧音频信号进行频谱增强。
所述第一增强模块1180,还包括:
扩展单元1184,用于使用延时参数对所述类音频信号进行声像扩展。
第一加入模块1190,用于将所述第一增强模块1180增强后的音频信号加入所述若干帧音频信号的解码码流中,得到音频解码信号。
综上所述,本发明实施例提供的音频增强系统,通过编码端根据对数能量、高过零率比和谱通量确定每帧音频信号是否为指定信号类型,对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记,得到标记后的音频编码码流,解码端在获取到编码端标记后的音频编码码流后,根据标记对属于指定信号类型的音频信号进行增强处理,得到增强后的音频信号;解决了不属于指定信号类型的音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题;达到了在音频信号增强过程中保证音频信号的感知的效果,并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。还通过在对音频信号进行频谱增强的过程中,根据音频信号的频率来确定每帧音频信号的频谱增强系数,在对音频信号进行声像扩展时采用延时参数对音频信号进行声像扩展,达到了更好的保证音频信号的感知的效果。
实施例十
请参考图12,其示出了本发明实施例十提供的音频编解码系统的结构方框图。该音频编解码系统,包括:编码端1210和解码端1240;
所述编码端1210,包括:
编码模块1220,用于按照图5a所示的编码算法框图对若干帧音频信号进行编码。
码流输出模块1230,用于将所述编码模块1220进行编码后得到的编码码流输出至解码端。
所述解码端1240,包括:
第二获取模块1250,用于获取待解码的音频编码码流。
第三获取模块1260,用于从所述第二获取模块1250获取到的音频编码码流中获取连续的若干帧音频信号和每帧音频信号的音频参数。
第二确定模块1270,用于根据所述第三获取模块1260获取到的每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型。
所述指定信号类型为类音频信号,所述每帧音频信号的音频参数,包括频谱能量总和、修正谱平坦度和谱通量,所述第二确定模块1270,具体用于当一帧音频信号的频谱能量总和大于第四阈值、修正谱平坦度小于第五阈值、谱通量大于第三阈值时,确定所述一帧音频信号为类音频信号。
第二增强模块1280,用于对所述第二确定模块1270确定的属于所述指定信号类型的音频信号进行增强处理,得到增强后的音频信号。
所述第二增强模块1280,具体用于对所述类音频信号进行频谱增强和声像扩展。
具体的,所述第二增强模块1280,包括:
频率获取单元1281,用于获取每帧音频信号的频率;
系数确定单元1282,用于根据所述频率获取单元1281获取到的每帧音频信号的频率确定每帧音频信号的频谱增强系数;
增强单元1283,用于按照所述系数确定单元1282确定的每帧音频信号的频谱增强系数对每帧音频信号进行频谱增强。
所述第二增强模块1280,还包括:
扩展单元1284,用于使用延时参数对所述类音频信号进行声像扩展。
第二加入模块1290,用于将所述第二增强模块1280增强后的音频信号加入所述若干帧音频信号的解码码流中,得到音频解码信号。
综上所述,本发明实施例提供的音频增强系统,通过解码端根据频谱能量总和、修正谱平坦度和谱通量确定每帧音频信号是否为指定信号类型,对属于指定信号类型的音频信号进行增强处理,得到增强后的音频信号;解决了不属于指定信号类型的音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题;达到了在音频信号增强过程中保证音频信号的感知的效果,并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。还通过在对音频信号进行频谱增强的过程中,根据音频信号的频率来确定每帧音频信号的频谱增强系数,在对音频信号进行声像扩展时采用延时参数对音频信号进行声像扩展,达到了更好的保证音频信号的感知的效果。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (29)

1.一种音频编码方法,其特征在于,所述方法包括:
获取连续的若干帧音频信号;
根据每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型;
对属于所述指定信号类型的音频信号和/或不属于所述指定信号类型的音频信号进行标记,得到标记后的音频编码码流;
其中,所述标记用于在解码时对所述指定信号类型的音频信号进行增强处理。
2.根据权利要求1所述的方法,其特征在于,所述指定信号类型为类音频信号,所述根据每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型,包括:
获取每帧音频信号的音频参数,所述音频参数包括对数能量、高过零率比和谱通量;
根据所述对数能量、高过零率比和谱通量确定每帧音频信号是否为类音频信号。
3.根据权利要求2所述的方法,其特征在于,所述根据所述对数能量、高过零率比和谱通量确定每帧音频信号是否为类音频信号,包括:
若一帧音频信号的对数能量不小于第一阈值、高过零率比不大于第二阈值、谱通量大于第三阈值,则确定所述一帧音频信号为类音频信号。
4.一种音频解码方法,其特征在于,所述方法包括:
获取标记后的音频编码码流,所述标记为编码端在一帧音频信号属于指定信号类型和/或不属于所述指定信号类型时进行标记的;
从所述音频编码码流中获取若干帧音频信号,以及全部或者部分帧音频信号的标记;
根据所述标记对属于所述指定信号类型的音频信号进行增强处理,得到增强后的音频信号;
将所述增强后的音频信号加入所述若干帧音频信号的解码码流中,得到音频解码信号。
5.根据权利要求4所述的方法,其特征在于,所述属于所述指定信号类型的音频信号为类音频信号,所述根据所述标记对属于所述指定信号类型的音频信号进行增强处理,包括:
对所述类音频信号进行频谱增强和声像扩展。
6.根据权利要求5所述的方法,其特征在于,所述对所述类音频信号进行频谱增强,包括:
获取每帧音频信号的频率;
根据每帧音频信号的频率确定每帧音频信号的频谱增强系数;
按照每帧音频信号的频谱增强系数对每帧音频信号进行频谱增强。
7.根据权利要求5所述的方法,其特征在于,所述对所述类音频信号进行声像扩展,包括:
使用延时参数对所述类音频信号进行声像扩展。
8.一种音频解码方法,其特征在于,所述方法包括:
获取待解码的音频编码码流;
从所述音频编码码流中获取连续的若干帧音频信号和每帧音频信号的音频参数;
根据每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型;
对属于所述指定信号类型的音频信号进行增强处理,得到增强后的音频信号;
将所述增强后的音频信号加入所述若干帧音频信号的解码码流中,得到音频解码信号。
9.根据权利要求8所述的方法,其特征在于,所述指定信号类型为类音频信号,所述每帧音频信号的音频参数,包括频谱能量总和、修正谱平坦度和谱通量,所述根据每帧音频信号的音频参数确定每帧信号是否为指定信号类型的音频信号,包括:
若一帧音频信号的频谱能量总和大于第四阈值、修正谱平坦度小于第五阈值、谱通量大于第三阈值,则确定所述一帧音频信号为类音频信号。
10.根据权利要求9所述的方法,其特征在于,所述对属于所述指定信号类型的音频信号进行增强处理,包括:
对所述类音频信号进行频谱增强和声像扩展。
11.根据权利要求10所述的方法,其特征在于,所述对所述类音频信号进行频谱增强,包括:
获取每帧音频信号的频率;
根据每帧音频信号的频率确定每帧音频信号的频谱增强系数;
按照每帧音频信号的频谱增强系数对每帧音频信号进行频谱增强。
12.根据权利要求10所述的方法,其特征在于,所述对所述类音频信号进行声像扩展,包括:
使用延时参数对所述类音频信号进行声像扩展。
13.一种音频编码装置,其特征在于,所述装置包括:
信号获取模块,用于获取连续的若干帧音频信号;
第一确定模块,用于根据所述信号获取模块获取到的每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型;
标记模块,用于对属于所述第一确定模块确定的指定信号类型的音频信号和/或不属于所述指定信号类型的音频信号进行标记,得到标记后的音频编码码流;
其中,所述标记用于在解码时对所述指定信号类型的音频信号进行增强处理。
14.根据权利要求13所述的装置,其特征在于,所述指定信号类型为类音频信号,所述第一确定模块,包括:
参数获取单元,用于获取每帧音频信号的音频参数,所述音频参数包括对数能量、高过零率比和谱通量;
类型确定单元,用于根据所述参数获取单元获取到的对数能量、高过零率比和谱通量确定每帧音频信号是否为类音频信号。
15.根据权利要求14所述的装置,其特征在于,所述类型确定单元具体用于当一帧音频信号的对数能量不小于第一阈值、高过零率比不大于第二阈值、谱通量大于第三阈值时,确定所述一帧音频信号为类音频信号。
16.一种音频解码装置,其特征在于,所述装置包括:
第一获取模块,用于获取标记后的音频编码码流,所述标记为编码端在一帧音频信号属于指定信号类型和/或不属于所述指定信号类型时进行标记的;
标记获取模块,用于从所述第一获取模块获取到的音频编码码流中获取若干帧音频信号,以及全部或者部分帧音频信号的标记;
第一增强模块,用于根据所述标记获取模块获取到的所述标记对属于所述指定信号类型的音频信号进行增强处理,得到增强后的音频信号;
第一加入模块,用于将所述第一增强模块增强后的音频信号加入所述若干帧音频信号的解码码流中,得到音频解码信号。
17.根据权利要求16所述的装置,其特征在于,所述属于所述指定信号类型的音频信号为类音频信号,所述第一增强模块,具体用于对所述类音频信号进行频谱增强和声像扩展。
18.根据权利要求17所述的装置,其特征在于,所述第一增强模块,包括:
频率获取单元,用于获取每帧音频信号的频率;
系数确定单元,用于根据所述频率获取单元获取到的每帧音频信号的频率确定每帧音频信号的频谱增强系数;
增强单元,用于按照所述系数确定单元确定的每帧音频信号的频谱增强系数对每帧音频信号进行频谱增强。
19.根据权利要求17所述的装置,其特征在于,所述第一增强模块,还包括:
扩展单元,用于使用延时参数对所述类音频信号进行声像扩展。
20.一种音频解码装置,其特征在于,所述装置包括:
第二获取模块,用于获取待解码的音频编码码流;
第三获取模块,用于从所述第二获取模块获取到的音频编码码流中获取连续的若干帧音频信号和每帧音频信号的音频参数;
第二确定模块,用于根据所述第三获取模块获取到的每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型;
第二增强模块,用于对所述第二确定模块确定的属于所述指定信号类型的音频信号进行增强处理,得到增强后的音频信号;
第二加入模块,用于将所述第二增强模块增强后的音频信号加入所述若干帧音频信号的解码码流中,得到音频解码信号。
21.根据权利要求20所述的装置,其特征在于,所述指定信号类型为类音频信号,所述每帧音频信号的音频参数,包括频谱能量总和、修正谱平坦度和谱通量,所述第二确定模块,具体用于当一帧音频信号的频谱能量总和大于第四阈值、修正谱平坦度小于第五阈值、谱通量大于第三阈值时,确定所述一帧音频信号为类音频信号。
22.根据权利要求21所述的装置,其特征在于,所述第二增强模块,具体用于对所述类音频信号进行频谱增强和声像扩展。
23.根据权利要求22所述的装置,其特征在于,所述第二增强模块,包括:
频率获取单元,用于获取每帧音频信号的频率;
系数确定单元,用于根据所述频率获取单元获取到的每帧音频信号的频率确定每帧音频信号的频谱增强系数;
增强单元,用于按照所述系数确定单元确定的每帧音频信号的频谱增强系数对每帧音频信号进行频谱增强。
24.根据权利要求22所述的装置,其特征在于,所述第二增强模块,还包括:
扩展单元,用于使用延时参数对所述类音频信号进行声像扩展。
25.一种编码端,其特征在于,所述编码端包括如权利要求13至15所述的音频编码装置。
26.一种解码端,其特征在于,所述解码端包括如权利要求16至19所述的音频解码装置。
27.一种解码端,其特征在于,所述解码端包括如权利要求20至24所述的音频解码装置。
28.一种音频编解码系统,其特征在于,所述系统包括权利要求25所述的编码端和权利要求26所述的解码端。
29.一种音频编解码系统,其特征在于,所述系统包括编码端和权利要求27所述的解码端。
CN201310364530.XA 2013-08-20 2013-08-20 音频编码方法、音频解码方法、编码端、解码端和系统 Active CN103413553B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201310364530.XA CN103413553B (zh) 2013-08-20 2013-08-20 音频编码方法、音频解码方法、编码端、解码端和系统
PCT/CN2014/082888 WO2015024428A1 (en) 2013-08-20 2014-07-24 Method, terminal, system for audio encoding/decoding/codec
US14/596,753 US9812139B2 (en) 2013-08-20 2015-01-14 Method, terminal, system for audio encoding/decoding/codec
US15/790,876 US9997166B2 (en) 2013-08-20 2017-10-23 Method, terminal, system for audio encoding/decoding/codec

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310364530.XA CN103413553B (zh) 2013-08-20 2013-08-20 音频编码方法、音频解码方法、编码端、解码端和系统

Publications (2)

Publication Number Publication Date
CN103413553A true CN103413553A (zh) 2013-11-27
CN103413553B CN103413553B (zh) 2016-03-09

Family

ID=49606556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310364530.XA Active CN103413553B (zh) 2013-08-20 2013-08-20 音频编码方法、音频解码方法、编码端、解码端和系统

Country Status (3)

Country Link
US (2) US9812139B2 (zh)
CN (1) CN103413553B (zh)
WO (1) WO2015024428A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015024428A1 (en) * 2013-08-20 2015-02-26 Tencent Technology (Shenzhen) Company Limited Method, terminal, system for audio encoding/decoding/codec
CN106796798A (zh) * 2014-07-28 2017-05-31 弗劳恩霍夫应用研究促进协会 用于使用独立噪声填充生成增强信号的装置和方法
WO2017177782A1 (zh) * 2016-04-15 2017-10-19 腾讯科技(深圳)有限公司 语音信号级联处理方法、终端和计算机可读存储介质
CN107710324A (zh) * 2015-04-09 2018-02-16 弗劳恩霍夫应用研究促进协会 音频编码器和用于对音频信号进行编码的方法
CN113113032A (zh) * 2020-01-10 2021-07-13 华为技术有限公司 一种音频编解码方法和音频编解码设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10375131B2 (en) * 2017-05-19 2019-08-06 Cisco Technology, Inc. Selectively transforming audio streams based on audio energy estimate

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101647059A (zh) * 2007-02-26 2010-02-10 杜比实验室特许公司 娱乐音频中的语音增强
CN101894558A (zh) * 2010-08-04 2010-11-24 华为技术有限公司 丢帧恢复方法、设备以及语音增强方法、设备和系统
CN101965612A (zh) * 2008-03-03 2011-02-02 Lg电子株式会社 用于处理音频信号的方法和装置
CN102007534A (zh) * 2008-03-04 2011-04-06 Lg电子株式会社 用于处理音频信号的方法和装置
CN103000172A (zh) * 2011-09-09 2013-03-27 中兴通讯股份有限公司 信号分类方法和装置

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020016698A1 (en) * 2000-06-26 2002-02-07 Toshimichi Tokuda Device and method for audio frequency range expansion
KR20050021484A (ko) * 2002-07-16 2005-03-07 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
EP1611772A1 (en) * 2003-03-04 2006-01-04 Nokia Corporation Support of a multichannel audio extension
US20050096898A1 (en) * 2003-10-29 2005-05-05 Manoj Singhal Classification of speech and music using sub-band energy
DE60320414T2 (de) * 2003-11-12 2009-05-20 Sony Deutschland Gmbh Vorrichtung und Verfahren zur automatischen Extraktion von wichtigen Ereignissen in Audiosignalen
EP1719115A1 (en) * 2004-02-17 2006-11-08 Koninklijke Philips Electronics N.V. Parametric multi-channel coding with improved backwards compatibility
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7123714B2 (en) * 2004-08-25 2006-10-17 Motorola, Inc. Speakerphone having improved outbound audio quality
US8521529B2 (en) * 2004-10-18 2013-08-27 Creative Technology Ltd Method for segmenting audio signals
CN101151658B (zh) * 2005-03-30 2011-07-06 皇家飞利浦电子股份有限公司 多声道音频编码和解码方法、编码器和解码器
TWI312982B (en) * 2006-05-22 2009-08-01 Nat Cheng Kung Universit Audio signal segmentation algorithm
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
CN101874266B (zh) * 2007-10-15 2012-11-28 Lg电子株式会社 用于处理信号的方法和装置
US8856049B2 (en) * 2008-03-26 2014-10-07 Nokia Corporation Audio signal classification by shape parameter estimation for a plurality of audio signal samples
US8428949B2 (en) * 2008-06-30 2013-04-23 Waves Audio Ltd. Apparatus and method for classification and segmentation of audio content, based on the audio signal
KR101261677B1 (ko) * 2008-07-14 2013-05-06 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
ES2592416T3 (es) * 2008-07-17 2016-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Esquema de codificación/decodificación de audio que tiene una derivación conmutable
EP2396637A1 (en) * 2009-02-13 2011-12-21 Nokia Corp. Ambience coding and decoding for audio applications
CN101556799B (zh) * 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
TWI404050B (zh) * 2009-06-08 2013-08-01 Mstar Semiconductor Inc 多聲道音頻信號解碼方法與裝置
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
JP6185457B2 (ja) * 2011-04-28 2017-08-23 ドルビー・インターナショナル・アーベー 効率的なコンテンツ分類及びラウドネス推定
CN102982804B (zh) * 2011-09-02 2017-05-03 杜比实验室特许公司 音频分类方法和系统
CN103035248B (zh) * 2011-10-08 2015-01-21 华为技术有限公司 音频信号编码方法和装置
WO2013184520A1 (en) * 2012-06-04 2013-12-12 Stone Troy Christopher Methods and systems for identifying content types
CN104078050A (zh) * 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
CN103413553B (zh) * 2013-08-20 2016-03-09 腾讯科技(深圳)有限公司 音频编码方法、音频解码方法、编码端、解码端和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101647059A (zh) * 2007-02-26 2010-02-10 杜比实验室特许公司 娱乐音频中的语音增强
CN101965612A (zh) * 2008-03-03 2011-02-02 Lg电子株式会社 用于处理音频信号的方法和装置
CN102007534A (zh) * 2008-03-04 2011-04-06 Lg电子株式会社 用于处理音频信号的方法和装置
CN101894558A (zh) * 2010-08-04 2010-11-24 华为技术有限公司 丢帧恢复方法、设备以及语音增强方法、设备和系统
CN103000172A (zh) * 2011-09-09 2013-03-27 中兴通讯股份有限公司 信号分类方法和装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015024428A1 (en) * 2013-08-20 2015-02-26 Tencent Technology (Shenzhen) Company Limited Method, terminal, system for audio encoding/decoding/codec
US9997166B2 (en) 2013-08-20 2018-06-12 Tencent Technology (Shenzhen) Company Limited Method, terminal, system for audio encoding/decoding/codec
CN106796798A (zh) * 2014-07-28 2017-05-31 弗劳恩霍夫应用研究促进协会 用于使用独立噪声填充生成增强信号的装置和方法
US10885924B2 (en) 2014-07-28 2021-01-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
US11264042B2 (en) 2014-07-28 2022-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling information which comprises energy information and is included in an input signal
US11908484B2 (en) 2014-07-28 2024-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling at random values and scaling thereupon
CN107710324A (zh) * 2015-04-09 2018-02-16 弗劳恩霍夫应用研究促进协会 音频编码器和用于对音频信号进行编码的方法
CN107710324B (zh) * 2015-04-09 2021-12-03 弗劳恩霍夫应用研究促进协会 音频编码器和用于对音频信号进行编码的方法
WO2017177782A1 (zh) * 2016-04-15 2017-10-19 腾讯科技(深圳)有限公司 语音信号级联处理方法、终端和计算机可读存储介质
US10832696B2 (en) 2016-04-15 2020-11-10 Tencent Technology (Shenzhen) Company Limited Speech signal cascade processing method, terminal, and computer-readable storage medium
US11605394B2 (en) 2016-04-15 2023-03-14 Tencent Technology (Shenzhen) Company Limited Speech signal cascade processing method, terminal, and computer-readable storage medium
CN113113032A (zh) * 2020-01-10 2021-07-13 华为技术有限公司 一种音频编解码方法和音频编解码设备

Also Published As

Publication number Publication date
US20150127356A1 (en) 2015-05-07
US9812139B2 (en) 2017-11-07
WO2015024428A1 (en) 2015-02-26
US9997166B2 (en) 2018-06-12
CN103413553B (zh) 2016-03-09
US20180047400A1 (en) 2018-02-15

Similar Documents

Publication Publication Date Title
US11798568B2 (en) Methods, apparatus and systems for encoding and decoding of multi-channel ambisonics audio data
CN103413553B (zh) 音频编码方法、音频解码方法、编码端、解码端和系统
RU2645271C2 (ru) Стереофонический кодер и декодер аудиосигналов
CN1947172B (zh) 方法、装置、编码器设备、解码器设备以及音频系统
US8352280B2 (en) Scalable multi-channel audio coding
JP5442995B2 (ja) マルチチャンネルオーディオ信号のエンコーディング/デコーディングシステム、記録媒体及び方法
EP2992689B1 (en) Method and apparatus for compressing and decompressing a higher order ambisonics representation
CN104681030B (zh) 用于编码/解码信号的装置和方法
TWI393119B (zh) 多通道編碼器、編碼方法、電腦程式產品及多通道解碼器
CN102834863B (zh) 用于包括通用音频和语音帧的音频信号的解码器
TWI332193B (en) Method and apparatus of processing time-varying signals coding and decoding and computer program product
WO2005081229A1 (ja) オーディオエンコーダ及びオーディオデコーダ
CN104282309A (zh) 丢包掩蔽装置和方法以及音频处理系统
CN104718572A (zh) 音频编码方法和装置、音频解码方法和装置及采用该方法和装置的多媒体装置
JP6031201B2 (ja) オーディオ符号器及び復号器
JP2004046179A (ja) 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置
Liutkus et al. Informed audio source separation: A comparative study
JP2005530206A (ja) 合成されたスペクトル成分に適合するようにデコードされた信号の特性を使用するオーディオコーディングシステム
CN106165451B (zh) 对高阶高保真立体声信号应用动态范围压缩的方法和设备
CN110660401B (zh) 一种基于高低频域分辨率切换的音频对象编解码方法
CN101350197B (zh) 立体声音频编/解码方法及编/解码器
US20140278446A1 (en) Device and method for data embedding and device and method for data extraction
CN101981616A (zh) 立体声信号变换装置、立体声信号逆变换装置及其方法
Petrovsky et al. Real-time wavelet packet-based low bit rate audio coding on a dynamic reconfiguration system
CN102074242A (zh) 语音音频混合分级编码中核心层残差提取系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240103

Address after: 518057 Tencent Building, No. 1 High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province, 35 floors

Patentee after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

Patentee after: TENCENT CLOUD COMPUTING (BEIJING) Co.,Ltd.

Address before: 2 East 403 room, SEG science and technology garden, Futian District, Guangdong, Shenzhen 518000, China

Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.