CN103516440A - 语音频信号处理方法和编码装置 - Google Patents
语音频信号处理方法和编码装置 Download PDFInfo
- Publication number
- CN103516440A CN103516440A CN201210223014.0A CN201210223014A CN103516440A CN 103516440 A CN103516440 A CN 103516440A CN 201210223014 A CN201210223014 A CN 201210223014A CN 103516440 A CN103516440 A CN 103516440A
- Authority
- CN
- China
- Prior art keywords
- signal
- harmonic
- peak
- bandwidth
- judgment condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 60
- 238000003672 processing method Methods 0.000 title claims abstract description 21
- 238000000034 method Methods 0.000 claims abstract description 41
- 230000001052 transient effect Effects 0.000 claims description 28
- 230000009467 reduction Effects 0.000 claims description 24
- 230000002123 temporal effect Effects 0.000 claims description 18
- 230000002040 relaxant effect Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 7
- 230000006854 communication Effects 0.000 abstract description 11
- 238000004891 communication Methods 0.000 abstract description 10
- 230000008859 change Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
本发明实施例提供一种基于带宽切换的语音频信号处理方法和编码装置。方法,包括:若第一带宽语音频信号是谐波信号,则调整第二带宽语音频信号被判决为谐波信号的判决条件得到第一判决条件,以提高所述第二带宽语音频信号被判决为谐波信号的可能性;所述第一带宽语音信号为带宽切换前的信号,所述第二带宽语音频信号为带宽切换后的信号;根据所述第一判决条件,判决所述第二带宽语音频信号是否为谐波信号。本发明实施例可以在带宽切换的情况下,尽可能使得语音频信号的信号类型在切换前后保持一致,从而使得解码端设备解码后的语音频信号尽可能连续,进而提高语音通信服务质量。
Description
技术领域
本发明实施例涉及通信技术,尤其涉及一种语音频信号处理方法和编码装置。
背景技术
在数字通信领域,语音、图像、音频、视频的传输有着非常广泛的应用需求,如手机通话、音视频会议、广播电视、多媒体娱乐等。语音频信号被数字化处理,通过通信网络从一个终端传递到另一个终端,这里的终端可以是手机、数字电话终端或其他任何类型的语音频终端,数字电话终端例如VOIP电话或ISDN电话、计算机、电缆通信电话。为了降低语音频信号存储或者传输过程中占用的资源,语音频信号在发送端进行压缩处理后传输到接收端,接收端通过解压缩处理恢复语音频信号并进行播放。
在实际语音通信过程中,语音频信号的带宽会时常发生变化。导致该语音频信号的带宽发生变化的原因既可能是网络状态的变化,也可能是语音频信号本身在带宽上即发生变化,或者是其它能够导致语音频信号在高频带信号和低频带信号间切换的因素。这种语音频信号在高低频带间切换的过程称为带宽切换。
具体来说,网络状态时常会发生变化,而网络带宽会随着网络状态变差而变窄。相应地,语音频信号也需要随着网络带宽的变化而在高频带信号和低频带信号之间切换。在网络带宽变窄时,语音频信号就需要从高频带信号降低到低频带信号,而当网络状况恢复时,语音频信号则需要从低频带信号恢复成高频带信号。其中,高频带信号和低频带信号的带宽大小是相对概念,举例来说,该高频带信号的带宽为0~16kHz,低频带信号的带宽为0~8kHz,或者高频带信号的带宽为0~8kHz,低频带信号的带宽为0~4kHz,该高频带信号也即超宽带信号,低频带信号也即宽带信号。
但是,在编码端采用现有技术进行带宽切换后,解码端时常出现语音频信号不连续的问题,从而导致语音通信服务质量降低。
发明内容
本发明实施例提供一种基于带宽切换的语音频信号处理方法和编码装置。
本发明实施例提供一种基于带宽切换的语音频信号处理方法,包括:
若第一带宽语音频信号是谐波信号,则调整第二带宽语音频信号被判决为谐波信号的判决条件得到第一判决条件,以提高所述第二带宽语音频信号被判决为谐波信号的可能性;所述第一带宽语音信号为带宽切换前的信号,所述第二带宽语音频信号为带宽切换后的信号;
根据所述第一判决条件,判决所述第二带宽语音频信号是否为谐波信号。
本发明实施例还提供一种编码装置,包括:
判决条件调整模块,用于若第一带宽语音频信号是谐波信号,则调整第二带宽语音频信号被判决为谐波信号的判决条件得到第一判决条件,以提高所述第二带宽语音频信号被判决为谐波信号的可能性;所述第一带宽语音信号为带宽切换前的信号,所述第二带宽语音频信号为带宽切换后的信号;
信号类型判决模块,用于根据所述第一判决条件,判决所述第二带宽语音频信号是否为谐波信号。
本发明实施例中,编码装置可以确定带宽切换前的第一带宽语音频信号是否是谐波信号,并在确定是谐波信号的情况下,采用调整带宽切换后的第二带宽语音频信号的谐波信号判决条件的方式,放宽对带宽切换后的第二带宽语音频信号是否是谐波信号的判决条件,尽可能提高该第二带宽语音频信号判决为谐波信号的可能性,因此,本发明实施例可以在带宽切换的情况下,尽可能使得语音频信号的信号类型在切换前后保持一致,从而使得解码端设备解码后的语音频信号尽可能连续,进而提高语音通信服务质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明语音频信号处理方法实施例一的流程图;
图2为本发明语音频信号处理方法实施例二的流程图;
图3为本发明语音频信号处理方法实施例三的流程图;
图4为本发明语音频信号处理方法实施例四的流程图;
图5为本发明语音频信号处理方法实施例五的流程图;
图6为设有本发明编码装置的编码端设备的一种结构示意图;
图7为本发明编码装置实施例一的结构示意图;
图8为本发明编码装置实施例二的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明语音频信号处理方法可以应用于音频编码器中。数字信号处理领域,音频编解码器广泛应用于各种电子设备中,例如:移动电话,无线装置,个人数据助理(PDA),手持式或便携式计算机,GPS接收机/导航器,照相机,音频/视频播放器,摄像机,录像机,监控设备等。通常,这类电子设备中包括音频编码器或音频解码器,音频编码器或者解码器可以直接由数字电路或芯片例如DSP(digital signal processor)实现,或者由软件代码驱动处理器执行软件代码中的流程而实现。
图1为本发明语音频信号处理方法实施例一的流程图,如图1所示,本实施例的方法可以包括:
步骤101、若第一带宽语音频信号是谐波信号,则调整第二带宽语音频信号被判决为谐波信号的判决条件得到第一判决条件,以提高所述第二带宽语音频信号被判决为谐波信号的可能性。
其中,该第一带宽语音频信号为带宽切换前的语音频信号,所述第二带宽语音频信号为带宽切换后的语音频信号。
步骤102、根据所述第一判决条件,判决所述第二带宽语音频信号是否为谐波信号。
具体地,高频带信号可以为超宽带信号,低频带信号可以为宽带信号,本领域技术人员可以根据需求自行设定带宽范围为一定范围以上的信号为超宽带信号,否则为宽带信号,举例来说,可以设定带宽范围为0~8kHz以上的信号为超宽带信号,带宽范围为0~8kHz及以下的信号为宽带信号。在编码端进行编码时,超宽带信号可以被分为谐波信号、普通信号、瞬态信号以及噪声信号,而宽带信号可以被分为谐波信号和普通信号。
本实施例中的第一带宽语音频信号可以是超宽带信号,切换后的第二带宽语音频信号可以是宽带信号,或者第一带宽语音频信号可以是宽带信号,切换后的第二带宽语音频信号可以是超宽带信号。对于超宽带信号来说,其信号类型可以是谐波信号、普通信号、瞬态信号以及噪声信号中的一种,对于宽带信号来说,其信号类型可以是谐波信号和普通信号中的一种。针对超宽带信号来说,编码装置可以采用与超宽带信号对应的谐波信号判决条件判断该超宽带信号的信号类型,对于宽带信号来说,编码装置可以采用与宽带信号对应的谐波信号判决条件判断该宽带信号的信号类型。在现有技术中,与超宽带信号对应的谐波信号判决条件以及与宽带信号对应的谐波信号判决条件在进行谐波信号的判决时均需要采用前一帧信号的信息作为参考信息。
发明人在实践现有技术的过程中发现,在编码端进行带宽切换的情况下,如果带宽切换前的语音频信号是超宽带信号中的谐波信号或者宽带信号中的谐波信号,则在解码端时常出现语音断断续续的情况,从而影响了用户的正常通信,降低了语音通信服务质量。
发明人经过仔细研究发现,出现上述问题的比较主要的原因在于,不管是与超宽带信号对应的谐波信号判决条件还是与宽带信号对应的谐波信号判决条件,其在进行谐波信号的判决时均需要采用前一帧信号的信息作为参考信息,而在带宽切换的情况发生时,由于信号带宽发生变化,导致带宽切换前后的信号能量和频带差别较大,基于这种变化,编码装置如果仍然采用带宽切换前的信号作为对带宽切换后的信号类型进行判断的参考信息,则可能在带宽切换时进行信号类型的切换,例如,带宽切换前的语音频信号为谐波信号,但是在带宽切换后的语音频信号则有可能被判决为瞬态信号。编码端可以采用针对谐波信号的编码方法对带宽切换前的谐波信号进行编码,采用针对非谐波信号的编码方法对带宽切换后的非谐波信号进行编码,之后,编码端即可将编码信号发送给解码端,解码端在接收到该编码信号后,即可采用对应的解码方法对编码信号进行解码,从而可以恢复出谐波信号和非谐波信号。由于谐波信号和非谐波信号在信号特性上相差较远,因此两种信号的输出,将使得解码端的用户听起来的语音频信号是断断续续的。而对于非谐波信号中的噪声信号、瞬态信号以及普通信号这三种信号类型之间的切换,对于解码端设备来说,其解码后的语音频信号并无太大的影响。
为此,本实施例中,编码装置可以确定带宽切换前的第一带宽语音频信号是否是谐波信号。如果带宽切换前的第一带宽语音频信号是谐波信号,则编码装置可以采用调整谐波信号判决条件的方式,来提高带宽切换后的第二带宽语音频信号被确定为谐波信号的可能性,从而在带宽切换的情况下,在对带宽切换后的语音频信号进行判决时,尽量不改变语音频信号的信号类型,从而使得解码端设备接收的语音频信号的信号类型在带宽切换前后是一致的,即可采用相同的解码方式进行解码,从而尽量保证语音频信号的连续性,而只有在切换后的第二带宽语音频信号也不满足放宽后的谐波信号判决条件时,也即该第二带宽语音频信号中的谐波成分确实很少时,才改变该第二带宽语音频信号的信号类型。在本实施例中,若第一带宽语音频信号为超宽带信号,则第二带宽语音频信号即为宽带信号,若第一带宽语音频信号为宽带信号,则第二带宽语音频信号即为超宽带信号。
以第一带宽语音频信号为超宽带信号,第二带宽语音频信号为宽带信号举例来说,编码装置可以采用与超宽带信号对应的谐波信号判决条件确定带宽切换前的超宽带信号是谐波信号还是非谐波信号,该非谐波信号即为瞬态信号、噪声信号以及普通信号中的一种。如果判决结果是谐波信号,则编码装置可以放宽与宽带信号对应的谐波信号判决条件,得到第一判决条件,并根据该第一判决条件对带宽切换后的宽带信号是否是谐波信号进行判断。由于放宽了与宽带信号对应的谐波信号判决条件,因此,切换后的宽带信号被判决为谐波信号的可能性提升,从而使得带宽切换前后的信号类型尽可能不发生变化,进而使得解码端设备解码后的语音频信号尽可能连续。
需要说明的是,本领域技术人员可以根据语音频信号的处理方法自行设计与超宽带信号对应的谐波信号判决条件以及与宽带信号对应的谐波信号判决条件或者采用标准中规定的谐波信号判决条件,本实施例不作限定。
本实施例中,编码装置可以确定带宽切换前的第一带宽语音频信号是否是谐波信号,并在确定是谐波信号的情况下,采用调整带宽切换后的第二带宽语音频信号的谐波信号判决条件的方式,放宽对带宽切换后的第二带宽语音频信号是否是谐波信号的判决条件,尽可能提高该第二带宽语音频信号判决为谐波信号的可能性,因此,本实施例可以在带宽切换的情况下,尽可能使得语音频信号的信号类型在切换前后保持一致,从而使得解码端设备解码后的语音频信号尽可能连续,进而提高语音通信服务质量。
在图1所示方法实施例的基础上,若编码装置确定第一带宽语音频信号不是谐波信号,则编码装置在执行图1所示方法实施例的步骤102之前,还可以包括:
调整谐波信号判决条件得到第二判决条件,以降低第二带宽语音频信号被判决为谐波信号的可能性,进而根据所述第二判决条件,判决所述第二带宽语音频信号是否为谐波信号。
具体来说,如果编码装置在确定带宽切换前的第一带宽语音频信号并非谐波信号,则编码装置可以采用调整谐波信号判决条件的方式,提高该第二带宽语音频信号被判决为谐波信号判决门槛,从而降低该第二带宽语音频信号被判决为谐波信号的可能性。也即,如果带宽切换前的第一带宽语音频信号为非谐波信号,例如为噪声信号、瞬态信号或者普通信号,则带宽切换后的第二带宽语音频信号通过提高谐波信号的判决门槛,可以尽可能被判决为噪声信号、瞬态信号或者普通信号,而尽可能不被判决为谐波信号。编码端在带宽切换时尽可能不改变语音频信号的信号类型,对于解码端来说,其解码后的语音频信号也会尽可能连续。
如上所述,若第一带宽语音频信号为超宽带信号,则第二带宽语音频信号即为宽带信号,若第一带宽语音频信号为宽带信号,则第二带宽语音频信号即为超宽带信号。下面针对不同的带宽切换情况,采用不同的实施例对本发明的技术方案进行详细说明。
首先,对下述实施例中所采用的与超宽带信号对应的谐波信号判决条件和非谐波信号判决条件,以及与宽带信号对应的谐波信号判决条件和非谐波信号判决条件进行详细介绍。需要说明的是,下述实施例以标准中规定的信号类型判决条件为例对语音频信号是谐波信号还是非谐波信号进行判决,本领域技术人员可以理解的是,这些判决条件,可以根据语音频信号的处理方法自行修改。
对于超宽带信号来说,可以采用下述方式来判断该超宽带信号的信号类型:
1)将当前语音频信号分成多个信号段,获得多段时域信号并确定每段时域信号的时域包络参数值,可选地,在确定每段时域信号的时域包络参数值之前,也可以根据各段时域信号在整个语音频信号中的重要程度,给各段时域信号分别乘一个比例系数作为用于确定时域包络参数值的时域信号。
2)判断多个时域信号的时域包络参数值中是否有一个时域包络参数值大于给定的包络阈值T1,该包络阈值T1是由前若干个语音频信号的包络值加权求和,然后乘以预设值计算得到的。
3)若至少有一个时域包络阈值大于T1,则判断当前语音频信号为瞬态信号;
步骤1)~步骤3)为瞬态信号判决条件。
4)若没有一个时域包络阈值大于T1,则将当前语音频信号的频域信号分为多个频带,每个频带中计算1个频域幅度峰值,然后根据这些频域幅度峰值、该频带的频域幅度峰值的平均值以及频带宽度计算每个频带的谐波特性值;
5)判断每个频带的谐波特性值是否大于给定阈值以及该频带的频域幅度峰值是否大于给定阈值T2,若均大于则判断该频带为谐波频带,并执行步骤6),否则进一步判断谐波特性值是否小于给定阈值T3,若小于则判断该频带为噪声频带,否则为普通频带;
6)确定最大峰值参数值,即所有频带的幅度峰值的最大值,并且统计谐波频带数和噪声频带数,计算当前语音频信号的全局能量与前一语音频信号的全局能量的比值;
7)判断最大峰值参数值是否大于给定阈值T4,谐波频带数是否大于给定阈值T5,全局能量比值是否在给定阈值(T6,T7)范围内,如果都判断为是,则判决当前语音频信号为谐波信号,并更新谐波模式计数器,例如其计数值加1;
8)如果3个判断条件不全部为是,则更新谐波模式计数器,例如其计数值减1,然后判断此时谐波模式计数值是否大于给定阈值T8,若是则判断当前语音频信号为谐波信号;
步骤4)~步骤8)即为谐波信号判决条件。
其中,需要说明的是,该谐波模式计数器是可选功能,在当前语音频信号的最大峰值参数值小于等于给定阈值T4,谐波频带数小于等于给定阈值T5且全局能量比值不在给定阈值(T6,T7)范围内时,该谐波模式计数器可以作为判决当前语音频信号是否为谐波信号的参考,如果之前累计谐波信号的个数超过了给定阈值T8,则说明该连续的语音频信号是谐波信号的可能性较大,即使其不满足前三个条件,此时也可以当前语音频信号判决为谐波信号。
9)若不是则进一步判断噪声频带数和其它噪声相关参数是否满足条件,若是则判断当前语音频信号为噪声信号,否则当前语音频信号为普通信号。
对于宽带信号来说,其只需要区分谐波信号和普通信号,而带宽切换过程中对于谐波信号判决条件来说,其与超宽带信号的判决原理类似,具体来说:
在编码装置判断当前语音频信号是否为谐波信号时,只需判断谐波频带数和最大峰值参数值是否分别大于给定阈值T5、T4,若是则判断当前语音频信号为谐波信号,并增加谐波模式计数器的值,例如其计数值加1;若两者不能同时满足,则减少谐波模式计数器的值,例如其计数值减1,然后判断此时谐波模式计数器的计数值是否大于给定阈值T8,若是则判断当前语音频信号为谐波信号,否则为普通信号。
基于上述关于宽带信号和超宽带信号的信号类型判决的介绍,下面对本发明的技术方案进行详细说明。
图2为本发明与音频信号处理方法实施例二的流程图,在本实施例中,第一带宽语音频信号为超宽带信号,第二带宽语音频信号为宽带信号,带宽切换为从超宽带信号向宽带信号切换,如图2所示,本实施例的方法可以包括:
步骤201、计算带宽切换后的宽带信号的谐波频带数和最大峰值参数。
该步骤例如可以采用上述步骤6)实现,此处不再赘述。
步骤202、根据谐波频带数、最大峰值参数和宽带信号的谐波信号判决条件,更新谐波模式计数值。
该步骤例如可以采用上述步骤7)实现,需要说明的是,对于宽带信号来说,可以无需计算全局能量比值,而只采用宽带信号的谐波信号判决条件中对谐波频带数和最大峰值参数的判决,从而可以更新谐波模式计数器,如果谐波频带数大于给定阈值T5且最大峰值参数大于给定阈值T4,则可以确定带宽切换后的宽带信号为谐波信号,此时可以将谐波模式计数器的值加1,如果谐波频带数小于等于给定阈值T5和/或最大峰值参数小于等于给定阈值T4,则可以确定带宽切换后的宽带信号为非谐波信号,此时可以将谐波模式计数器的值减1。由此可知,此处关于带宽切换后的宽带信号是谐波信号还是非谐波信号的判决是基于该宽带信号的客观信号类型,以此更新的谐波模式计数器是为了对后续语音频信号进行判决时,可以参考之前的语音频信号的客观信息。
步骤203、确定带宽切换前的超宽带信号是否是谐波信号,若是,则执行步骤204,否则执行步骤206;
所需说明的是,步骤203的执行顺序只要在步骤204之前即可,而并不限定其一定在步骤201和步骤202之后执行,在实际处理过程中,其在带宽切换前就可以执行。
步骤204、降低宽带信号的谐波信号判决条件中的谐波频带数阈值和最大峰值参数阈值中的至少一个阈值。
由于带宽切换前的超宽带信号为谐波信号,因此,步骤204需要放宽将带宽切换后的宽带信号判决为谐波信号的条件。在本实施例中,可以降低宽带信号的谐波信号判决条件中的谐波频带数阈值T5,以及最大峰值参数阈值T4中的至少一个阈值。可以理解的是,T4和T5均降低的调整方式相对于只降低T4或者只降低T5的调整方式来说,对谐波信号判决条件的放宽程度是较大的。本实施例中可以将降低后的谐波频带数阈值记为T51,该T51<T5,将降低后的最大峰值参数阈值记为T41,该T41<T4。举例来说,该T51可以为T5的一半,T41为T4的一半。
本领域技术人员可以理解的是,T51和T41的具体取值可以根据谐波信号判决需求自行设定。举例来说,如果需要使具有一定谐波特性的宽带信号可以尽量被判决为谐波信号,则可以将T51和T41调整得低一些,从而将谐波信号判决条件放得较宽。
步骤205、若谐波频带数大于降低后的谐波频带数阈值和/或最大峰值参数大于降低后的最大峰值参数阈值,则该宽带信号为谐波信号。
在谐波信号判决条件被放宽后,如果谐波频带数大于T51,或者最大峰值参数大于T41这两个条件中只要有一个条件满足,则带宽切换后的宽带信号即可被判决为谐波信号。需要说明的是,现有技术在进行谐波信号时,需要谐波频带数大于T5和最大峰值参数大于T4这两个条件同时满足,而在本实施例中,不仅降低了T5和T4的判决阈值,而且,在谐波频带数大于T51以及最大峰值参数大于T41这两个条件中只要有一个条件满足时,就可以判决带宽切换后的信号为谐波信号,从而进一步放宽了谐波信号的判决条件。
对于谐波频带数小于等于T51且最大峰值参数小于等于T41的情况,也即上述两个条件都不满足,则本实施例还可以附加谐波模式计数器的值进行判决,若谐波模式计数值大于预设值T8,则带宽切换后的宽带信号即为谐波信号。
步骤206、提高宽带信号的谐波信号判决条件中的谐波频带数阈值和最大峰值参数阈值中的至少一个阈值。
由于带宽切换前的超宽带信号为非谐波信号,例如为瞬态信号,因此,步骤206需要提高将带宽切换后的宽带信号判决为谐波信号的条件。在本实施例中,可以提高宽带信号的谐波信号判决条件中的谐波频带数阈值T5,以及最大峰值参数阈值T4中的至少一个阈值。可以理解的是,T4和T5均提高的调整方式相对于只提高T4或者只提高T5的调整方式来说,对谐波信号判决条件的提高程度是较大的。本实施例中可以将提高后的谐波频带数阈值记为T52,该T52>T5,将提高后的最大峰值参数阈值记为T42,该T42>T4。举例来说,该T52可以为T5的一倍,T42为T4的一倍。
本领域技术人员可以理解的是,T52和T42的具体取值也可以根据谐波信号判决需求自行设定。举例来说,如果需要将存在较多谐波特性的宽带信号判决为谐波信号,则可以将T52和T42调整地较高,从而可以将谐波特性非常明显的宽带信号判决为谐波信号。
步骤207、若谐波频带数大于提高后的谐波频带数阈值和/或最大峰值参数大于提高后的最大峰值参数阈值,则宽带信号为谐波信号。
在谐波信号判决条件被提高后,如果谐波频带数大于T52,或者最大峰值参数大于T42这两个条件中只要有一个条件满足,则带宽切换后的宽带信号即可被判决为谐波信号。
对于谐波频带数小于等于T52且最大峰值参数小于等于T42的情况,也即上述两个条件都不满足,则本实施例也可以附加谐波模式计数器的值进行判决,若谐波模式计数值大于预设值T8,则带宽切换后的宽带信号也可以被判决为谐波信号。
本实施例中,当编码端出现带宽切换的情况时,编码装置可以确定带宽切换前的超宽带信号是谐波信号还是非谐波信号,如果是谐波信号,则可以通过降低用于表征信号中谐波成分的谐波频带数和/或最大峰值参数的判决阈值,从而尽量将带宽切换后的宽带信号判决为谐波信号,如果是非谐波信号,则可以通过提高用于谐波频带数和/或最大峰值参数的判决阈值,从而尽量将带宽切换后的宽带信号也判决为非谐波信号,而且,在谐波信号判决条件调整后,即使带宽切换后的宽带信号不满足前述条件,还可以辅助谐波模式计数器进行判决。因此,本实施例在带宽切换时,尽可能不改变信号类型,从而对于解码端接收的语音频信号来说,可以尽量保证其连续性。
图3为本发明语音频信号处理方法实施例三的流程图,在本实施例中,第一带宽语音频信号为宽带信号,第二带宽语音频信号为超宽带信号,带宽切换为从宽带信号向超宽带信号切换,如图3所示,本实施例的方法可以包括:
步骤301、计算带宽切换后的超宽带信号的谐波频带数和最大峰值参数,根据谐波频带数、最大峰值参数和超宽带信号的谐波信号判决条件,更新谐波模式计数值。
步骤301可以参见前述关于超宽带信号的信号类型判决过程实现,此处不再赘述。
步骤302、默认该超宽带信号不是瞬态信号且默认该超宽带信号的全局能量与带宽切换前的宽带信号的全局能量的比值在预设范围内。
本实施例中,由于带宽切换是从宽带信号向超宽带信号切换,而超宽带信号则包括了四种信号类型,而且,其谐波信号判决条件相比宽带信号的谐波信号判决条件增加了带宽切换后的超宽带信号的全局能量与带宽切换前的宽带信号的全局能量的比值的判定条件。在本实施例中,为了简化判决条件,步骤302可以不执行上述步骤1)~步骤3)而默认带宽前换后的超宽带信号不是瞬态信号,并且还可以默认步骤7)中带宽切换后的超宽带信号的全局能量与带宽切换前的宽带信号的全局能量的比值在预设范围(T6,T7)内。
步骤303、确定带宽切换前的宽带信号是否是谐波信号,若是,则执行步骤304,否则执行步骤306;
步骤304、降低超宽带信号的谐波信号判决条件中的谐波频带数阈值和最大峰值参数阈值中的至少一个阈值。
由于带宽切换前的宽带信号为谐波信号,因此,步骤304需要放宽将带宽切换后的超宽带信号判决为谐波信号的条件。在本实施例中,可以降低超宽带信号的谐波信号判决条件中的谐波频带数阈值T5,以及最大峰值参数阈值T4中的至少一个阈值。降低后的谐波频带数阈值同样记为T51,降低后的最大峰值参数阈值同样记为T41。
步骤305、若谐波频带数大于降低后的谐波频带数阈值和/或最大峰值参数大于降低后的最大峰值参数阈值,则该超宽带信号为谐波信号。
在谐波信号判决条件被放宽后,如果谐波频带数大于降低后的谐波频带数阈值,或者最大峰值参数大于降低后的最大峰值参数阈值这两个条件中只要有一个条件满足,则带宽切换后的超宽带信号即可被判决为谐波信号。
对于谐波频带数小于等于T51且最大峰值参数小于等于T41的情况,也即上述两个条件都不满足,则本实施例还可以附加谐波模式计数器的值进行判决,若谐波模式计数值大于预设值T8,则带宽切换后的超宽带信号即为谐波信号。
步骤306、提高超宽带信号的谐波信号判决条件中的谐波频带数阈值和最大峰值参数阈值中的至少一个阈值。
步骤307、若谐波频带数大于提高后的谐波频带数阈值和/或最大峰值参数大于提高后的最大峰值参数阈值,则该超宽带信号为谐波信号。
在谐波信号判决条件被提高后,如果谐波频带数大于提高后的谐波频带数阈值T52,或者最大峰值参数大于提高后的最大峰值参数阈值T42这两个条件中只要有一个条件满足,则带宽切换后的超宽带信号即可被判决为谐波信号。
对于谐波频带数小于等于T52且最大峰值参数小于等于T42的情况,也即上述两个条件都不满足,则本实施例也可以附加谐波模式计数器的值进行判决,若谐波模式计数值大于预设值T8,则带宽切换后的超宽带信号也可以被判决为谐波信号。
可替代地,本实施例也可以执行步骤1)~3)对带宽切换后的超宽带信号是否是瞬态信号进行判决。而且,为了保证信号的连续性,本实施例可以提高瞬态信号的判决条件,从而可以将确实具有较大的瞬态特性的超宽带信号判决为瞬态信号。
具体实现时,编码装置可以采用上述步骤1)计算超宽带信号的时域包络参数,并提高步骤2)中的时序包络阈值T1,可以将提高后的包络阈值记为T11;若时域包络参数大于T11,则该超宽带信号可以被判决为瞬态信号。举例来说,若带宽切换前的宽带信号为谐波信号,则可以将包络阈值提高3倍;若带宽切换前的宽带信号为非谐波信号,则可以将包络阈值提高2倍。
本实施例中,当编码端出现带宽切换的情况时,编码装置可以确定带宽切换前的宽带信号是谐波信号还是非谐波信号,如果是谐波信号,则可以通过降低用于表征信号中谐波成分的谐波频带数和/或最大峰值参数的判决阈值,尽量将带宽切换后的超宽带信号判决为谐波信号,如果是非谐波信号,则可以通过提高用于谐波频带数和/或最大峰值参数的判决阈值,尽量将带宽切换后的超宽带信号也判决为非谐波信号,而且,在谐波信号判决条件调整后,即使带宽切换后的超宽带信号不满足前述条件,还可以辅助谐波模式计数器进行判决。因此,本实施例在带宽切换时,尽可能不改变信号类型,从而对于解码端接收的语音频信号来说,可以尽量保证其连续性。
图4为本发明基于带宽切换的信号处理方法实施例四的流程图,在本实施例中,第一带宽语音频信号为超宽带信号,第二带宽语音频信号为宽带信号,带宽切换为从超宽带信号向宽带信号切换,如图4所示,本实施例的方法可以包括:
步骤401、计算带宽切换后的宽带信号的谐波频带数和最大峰值参数。
步骤402、根据谐波频带数、最大峰值参数和宽带信号的谐波信号判决条件,更新谐波模式计数值。
步骤403、确定带宽切换前的超宽带信号是否是谐波信号,若是,则执行步骤404,否则执行步骤405;
步骤401~步骤403可参考前述图2所示实施例的步骤201~步骤203的执行过程,此处不再赘述。
步骤404、判决带宽切换后的宽带信号为谐波信号。
步骤405、判决带宽切换后的宽带信号为非谐波信号。
本实施例与前述图2所示方法实施例的区别在于,图2所示方法实施例通过调整谐波信号判决条件中的判决阈值对带宽切换后的宽带信号是否是谐波信号进行判决,而本实施例则将谐波信号判决条件调整为:只要带宽切换前的超宽带信号是谐波信号,则带宽切换后的宽带信号也强制判决为谐波信号,只要带宽切换前的超宽带信号为非谐波信号,则带宽切换后的宽带信号也强制判决为非谐波信号。
本实施例中,当编码端出现带宽切换的情况时,编码装置可以确定带宽切换前的超宽带信号是谐波信号还是非谐波信号,如果是谐波信号,则强制判决带宽切换后的宽带信号为谐波信号,如果是非谐波信号,则强制判决带宽切换后的宽带信号为非谐波信号。因此,本实施例在带宽切换时,不改变信号类型,从而对于解码端接收的语音频信号来说,可以尽量保证语音频信号的连续性。
图5为本发明基于带宽切换的信号处理方法实施例五的流程图,在本实施例中,第一带宽语音频信号为宽带信号,第二带宽语音频信号为超宽带信号,带宽切换为从宽带信号向超宽带信号切换,如图5所示,本实施例的方法可以包括:
步骤501、计算带宽切换后的超宽带信号的谐波频带数和最大峰值参数,根据谐波频带数、最大峰值参数和超宽带信号的谐波信号判决条件,更新谐波模式计数值。
步骤502、默认该超宽带信号不是瞬态信号且默认该超宽带信号的全局能量与带宽切换前的宽带信号的全局能量的比值在预设范围内。
步骤503、确定带宽切换前的宽带信号是否是谐波信号,若是,则执行步骤504,否则执行步骤505;
步骤501~步骤503可参考前述图3所示实施例的步骤301~步骤303的执行过程,此处不再赘述。
步骤504、判决带宽切换后的超宽带信号为谐波信号。
步骤505、判决带宽切换后的超宽带信号为非谐波信号。
本实施例与前述图3所示方法实施例的区别在于,图3所示方法实施例通过调整谐波信号判决条件中的判决阈值对带宽切换后的超宽带信号是否是谐波信号进行判决,而本实施例则将谐波信号判决条件调整为:只要带宽切换前的宽带信号是谐波信号,则带宽切换后的超宽带信号也强制判决为谐波信号,只要带宽切换前的宽带信号为非谐波信号,则带宽切换后的超宽带信号也强制判决为非谐波信号。
本实施例中,当编码端出现带宽切换的情况时,编码装置可以确定带宽切换前的宽带信号是谐波信号还是非谐波信号,如果是谐波信号,则强制判决带宽切换后的超宽带信号为谐波信号,如果是非谐波信号,则强制判决带宽切换后的超宽带信号为非谐波信号。因此,本实施例在带宽切换时,不改变信号类型,从而对于解码端接收的语音频信号来说,可以尽量保证语音频信号的连续性。
与上述方法实施例相关联,本发明还提供一种编码装置,该装置可以位于终端设备,网络设备,或测试设备中。所述编码装置可以由硬件电路来实现,或者由软件配合硬件来实现。例如,参考图6,由一个处理器调用编码装置来实现语音频信号处理。该编码装置可以执行上述方法实施例中的各种方法和流程。该编码装置可以包括判决条件调整模块以及信号类型判决模块。
图7为本发明编码装置实施例一的结构示意图,如图7所示,本实施例的编码装置包括:判决条件调整模块11以及信号类型判决模块12,其中,判决条件调整模块11,用于若第一带宽语音频信号是谐波信号,则调整第二带宽语音频信号被判决为谐波信号的判决条件得到第一判决条件,以提高所述第二带宽语音频信号被判决为谐波信号的可能性;所述第一带宽语音频信号为带宽切换前的语音频信号,所述第二带宽语音频信号为带宽切换后的语音频信号;信号类型判决模块12,用于根据所述第一判决条件,判决所述第二带宽语音频信号是否为谐波信号。
具体地,判决条件调整模块11用于放宽所述第二带宽语音频信号被判决为谐波信号的判决条件,放宽后的判决条件作为所述第一判决条件。
图8为本发明编码装置实施例二的结构示意图,如图8所示,本实施例的装置在图7所示装置的基础上,进一步地,还包括:谐波模式更新模块13;
在本实施例中,判决条件调整模块11,具体用于降低所述第二带宽语音频信号被判决为谐波信号的判决条件中的谐波频带数阈值和最大峰值参数阈值中的至少一个阈值;相应地,信号类型判决模块12可以包括:计算单元121和处理单元122,其中,计算单元121,用于计算所述第二带宽语音频信号的谐波频带数和最大峰值参数;处理单元122,用于若所述谐波频带数大于降低后的谐波频带数阈值和/或所述最大峰值参数大于降低后的最大峰值参数阈值,则所述第二带宽语音频信号为谐波信号。
谐波模式更新模块13,用于根据所述谐波频带数、所述最大峰值参数和所述第二带宽语音频信号被判决为谐波信号的判决条件之间的关系,更新谐波模式计数值;相应地,信号类型判决模块12,还用于若所述谐波频带数小于等于所述降低后的谐波频带数阈值且所述最大峰值参数小于等于所述降低后的最大峰值参数阈值且所述谐波模式计数值大于预设值,则确定所述第二带宽语音频信号为谐波信号。
进一步地,该谐波模式更新模块13,具体用于若所述谐波频带数大于所述谐波频带数阈值且所述最大峰值参数大于所述最大峰值参数阈值,则增加所述谐波模式计数值;若所述谐波频带数小于等于所述谐波频带数阈值和/或所述最大峰值参数小于等于所述最大峰值参数阈值,则减少所述谐波模式计数值。
针对带宽切换为从宽带信号向超宽带信号切换,即第一带宽语音频信号为宽带信号,所述第二带宽语音频信号为超宽带信号的情况,判决条件调整模块11还用于计算所述超宽带信号的时域包络参数,并提高瞬态信号判决条件中的包络阈值;若所述时域包络参数大于等于提高后的包络阈值,则所述超宽带信号为瞬态信号,若所述时域包络参数小于提高后的包络阈值,则默认所述超宽带信号不是瞬态信号且默认所述超宽带信号的全局能量与所述宽带信号的全局能量的比值在预设范围内。在具体实现时,判决条件调整模块11具体用于若所述宽带信号为谐波信号,则将所述包络阈值提高3倍,若所述宽带信号为非谐波信号,则将所述包络阈值提高2倍。
本发明编码装置另一个实施例在图7所示编码装置实施例的基础上,信号类型判决模块12可以具体用于根据所述第一判决条件将所述第二宽带语音频信号判决为谐波信号;或者,信号类型判决模块12还用于若所述第一带宽语音频信号不是谐波信号,则将所述第二宽带语音频信号判决为非谐波信号。
本发明编码装置再一个实施例在图7所示编码装置实施例的基础上,判决条件调整模块11还用于若所述第一带宽语音频信号不是谐波信号,则调整所述谐波信号判决条件得到第二判决条件,以降低所述第二带宽语音频信号被判决为谐波信号的可能性;相应地,信号类型判决模块12,还用于根据所述第二判决条件,判决所述第二带宽语音频信号是否为谐波信号。具体地,判决条件调整模块11用于提高所述第二带宽语音频信号被判决为谐波信号的判决条件中的谐波频带数阈值和最大峰值参数阈值中的至少一个阈值;相应地,信号类型判决模块12,具体用于若所述谐波频带数大于提高后的谐波频带数阈值和/或所述最大峰值参数大于提高后的最大峰值参数阈值,则所述第二带宽语音频信号为谐波信号。
本发明上述实施例的编码装置可以对应地执行图1~图5所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (22)
1.一种语音频信号处理方法,其特征在于,包括:
若第一带宽语音频信号是谐波信号,则调整第二带宽语音频信号被判决为谐波信号的判决条件得到第一判决条件,以提高所述第二带宽语音频信号被判决为谐波信号的可能性;所述第一带宽语音频信号为带宽切换前的语音频信号,所述第二带宽语音频信号为带宽切换后的语音频信号;
根据所述第一判决条件,判决所述第二带宽语音频信号是否为谐波信号。
2.根据权利要求1所述的方法,其特征在于,所述调整第二带宽语音频信号被判决为谐波信号的判决条件得到第一判决条件,以提高所述第二带宽语音频信号被判决为谐波信号的可能性,包括:
放宽所述第二带宽语音频信号被判决为谐波信号的判决条件,放宽后的判决条件作为所述第一判决条件。
3.根据权利要求2所述的方法,其特征在于,所述放宽所述第二带宽语音频信号被判决为谐波信号的判决条件,包括:
降低所述第二带宽语音频信号被判决为谐波信号的判决条件中的谐波频带数阈值和最大峰值参数阈值中的至少一个阈值;
所述根据所述第一判决条件,判决所述第二带宽语音频信号是否为谐波信号,包括:
计算所述第二带宽语音频信号的谐波频带数和最大峰值参数;
若所述谐波频带数大于降低后的谐波频带数阈值和/或所述最大峰值参数大于降低后的最大峰值参数阈值,则所述第二带宽语音频信号为谐波信号。
4.根据权利要求3所述的方法,其特征在于,还包括:
根据所述谐波频带数、所述最大峰值参数和所述第二带宽语音频信号被判决为谐波信号的判决条件之间的关系,更新谐波模式计数值;
若所述谐波频带数小于等于所述降低后的谐波频带数阈值且所述最大峰值参数小于等于所述降低后的最大峰值参数阈值,则所述方法还包括:
若所述谐波模式计数值大于预设值,则确定所述第二带宽语音频信号为谐波信号。
5.根据权利要求4所述的方法,其特征在于,所述根据所述谐波频带数、所述最大峰值参数和所述第二带宽语音频信号被判决为谐波信号的判决条件之间的关系,更新谐波模式计数值,包括:
若所述谐波频带数大于所述谐波频带数阈值且所述最大峰值参数大于所述最大峰值参数阈值,则增加所述谐波模式计数值;
若所述谐波频带数小于等于所述谐波频带数阈值和/或所述最大峰值参数小于等于所述最大峰值参数阈值,则减少所述谐波模式计数值。
6.根据权利要求4或5所述的方法,其特征在于,所述第一带宽语音频信号为宽带信号,所述第二带宽语音频信号为超宽带信号,所述根据所述第一判决条件,判决所述第二带宽语音频信号是否为谐波信号之前,还包括:
计算所述超宽带信号的时域包络参数,并提高瞬态信号判决条件中的包络阈值;
若所述时域包络参数大于等于提高后的包络阈值,则所述超宽带信号为瞬态信号;
若所述时域包络参数小于提高后的包络阈值,则默认所述超宽带信号不是瞬态信号且默认所述超宽带信号的全局能量与所述宽带信号的全局能量的比值在预设范围内。
7.根据权利要求6所述的方法,其特征在于,所述提高瞬态信号判决条件中的包络阈值,具体为:
若所述宽带信号为谐波信号,则将所述包络阈值提高3倍;
若所述宽带信号为非谐波信号,则将所述包络阈值提高2倍。
8.根据权利要求1或2所述的方法,其特征在于,所述根据所述第一判决条件,判决所述第二带宽语音频信号是否为谐波信号,包括:
根据所述第一判决条件将所述第二宽带语音频信号判决为谐波信号。
9.根据权利要求1-8所述的任一方法,其特征在于,还包括:
若所述第一带宽语音频信号不是谐波信号,则调整所述谐波信号判决条件得到第二判决条件,以降低所述第二带宽语音频信号被判决为谐波信号的可能性;
根据所述第二判决条件,判决所述第二带宽语音频信号是否为谐波信号。
10.根据权利要求9所述的方法,其特征在于,所述调整所述谐波信号判决条件得到第二判决条件,以降低所述第二带宽语音频信号被判决为谐波信号的可能性,包括:
提高所述第二带宽语音频信号被判决为谐波信号的判决条件中的谐波频带数阈值和最大峰值参数阈值中的至少一个阈值;
所述根据所述第二判决条件,判决所述第二带宽语音频信号是否为谐波信号,包括:
若所述谐波频带数大于提高后的谐波频带数阈值和/或所述最大峰值参数大于提高后的最大峰值参数阈值,则所述第二带宽语音频信号为谐波信号。
11.根据权利要求1-8所述的任一方法,其特征在于,还包括:
若所述第一带宽语音频信号不是谐波信号,则将所述第二宽带语音频信号判决为非谐波信号。
12.一种编码装置,其特征在于,包括:
判决条件调整模块,若第一带宽语音频信号是谐波信号,则用于调整第二带宽语音频信号被判决为谐波信号的判决条件得到第一判决条件,以提高所述第二带宽语音频信号被判决为谐波信号的可能性;所述第一带宽语音频信号为带宽切换前的语音频信号,所述第二带宽语音频信号为带宽切换后的语音频信号;
信号类型判决模块,用于根据所述第一判决条件,判决所述第二带宽语音频信号是否为谐波信号。
13.根据权利要求12所述的装置,其特征在于,所述判决条件调整模块具体用于放宽所述第二带宽语音频信号被判决为谐波信号的判决条件,放宽后的判决条件作为所述第一判决条件。
14.根据权利要求13所述的装置,其特征在于,所述判决条件调整模块,具体用于降低所述第二带宽语音频信号被判决为谐波信号的判决条件中的谐波频带数阈值和最大峰值参数阈值中的至少一个阈值;
所述信号类型判决模块,包括:
计算单元,用于计算所述第二带宽语音频信号的谐波频带数和最大峰值参数;
处理单元,用于若所述谐波频带数大于降低后的谐波频带数阈值和/或所述最大峰值参数大于降低后的最大峰值参数阈值,则所述第二带宽语音频信号为谐波信号。
15.根据权利要求14所述的装置,其特征在于,还包括:
谐波模式更新模块,用于根据所述谐波频带数、所述最大峰值参数和所述第二带宽语音频信号被判决为谐波信号的判决条件之间的关系,更新谐波模式计数值;
所述信号类型判决模块,还用于若所述谐波频带数小于等于所述降低后的谐波频带数阈值且所述最大峰值参数小于等于所述降低后的最大峰值参数阈值且所述谐波模式计数值大于预设值,则确定所述第二带宽语音频信号为谐波信号。
16.根据权利要求15所述的装置,其特征在于,所述谐波模式更新模块,具体用于若所述谐波频带数大于所述谐波频带数阈值且所述最大峰值参数大于所述最大峰值参数阈值,则增加所述谐波模式计数值;若所述谐波频带数小于等于所述谐波频带数阈值和/或所述最大峰值参数小于等于所述最大峰值参数阈值,则减少所述谐波模式计数值。
17.根据权利要求14或15所述的装置,其特征在于,所述第一带宽语音频信号为宽带信号,所述第二带宽语音频信号为超宽带信号,所述判决条件调整模块还用于计算所述超宽带信号的时域包络参数,并提高瞬态信号判决条件中的包络阈值;若所述时域包络参数大于等于提高后的包络阈值,则所述超宽带信号为瞬态信号,若所述时域包络参数小于提高后的包络阈值,则默认所述超宽带信号不是瞬态信号且默认所述超宽带信号的全局能量与所述宽带信号的全局能量的比值在预设范围内。
18.根据权利要求17所述的装置,其特征在于,所述判决条件调整模块具体用于若所述宽带信号为谐波信号,则将所述包络阈值提高3倍,若所述宽带信号为非谐波信号,则将所述包络阈值提高2倍。
19.根据权利要求12或13所述的装置,其特征在于,所述信号类型判决模块具体用于根据所述第一判决条件将所述第二宽带语音频信号判决为谐波信号。
20.根据权利要求12-19所述的任一装置,其特征在于,所述判决条件调整模块还用于若所述第一带宽语音频信号不是谐波信号,则调整所述谐波信号判决条件得到第二判决条件,以降低所述第二带宽语音频信号被判决为谐波信号的可能性;
所述信号类型判决模块,还用于根据所述第二判决条件,判决所述第二带宽语音频信号是否为谐波信号。
21.根据权利要求20所述的装置,其特征在于,所述判决条件调整模块,具体用于提高所述第二带宽语音频信号被判决为谐波信号的判决条件中的谐波频带数阈值和最大峰值参数阈值中的至少一个阈值;
所述信号类型判决模块,具体用于若所述谐波频带数大于提高后的谐波频带数阈值和/或所述最大峰值参数大于提高后的最大峰值参数阈值,则所述第二带宽语音频信号为谐波信号。
22.根据权利要求12-19所述的任一装置,其特征在于,所述信号类型判决模块还用于若所述第一带宽语音频信号不是谐波信号,则将所述第二宽带语音频信号判决为非谐波信号。
Priority Applications (19)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210223014.0A CN103516440B (zh) | 2012-06-29 | 2012-06-29 | 语音频信号处理方法和编码装置 |
JP2015518805A JP6359529B2 (ja) | 2012-06-29 | 2013-06-06 | 会話/音声信号処理方法および符号化装置 |
KR1020207028813A KR102331531B1 (ko) | 2012-06-29 | 2013-06-06 | 음성 또는 오디오 신호 처리 방법 및 인코딩 장치 |
KR1020157000174A KR101689138B1 (ko) | 2012-06-29 | 2013-06-06 | 음성 또는 오디오 신호 처리 방법 및 인코딩 장치 |
EP20150138.4A EP3748634B1 (en) | 2012-06-29 | 2013-06-06 | Speech/audio signal processing method and coding apparatus |
ES20150138T ES2930240T3 (es) | 2012-06-29 | 2013-06-06 | Método de procesamiento de señal de voz/audio y aparato de codificación |
KR1020167035415A KR101790680B1 (ko) | 2012-06-29 | 2013-06-06 | 음성 또는 오디오 신호 처리 방법 및 인코딩 장치 |
ES13810131.6T ES2654488T3 (es) | 2012-06-29 | 2013-06-06 | Método de procesamiento para señales de voz o audio y aparato de codificación de las mismas |
ES17195365T ES2779857T3 (es) | 2012-06-29 | 2013-06-06 | Método de procesamiento de señal de voz/audio y aparato de codificación |
KR1020187028697A KR102005967B1 (ko) | 2012-06-29 | 2013-06-06 | 음성 또는 오디오 신호 처리 방법 및 인코딩 장치 |
KR1020197021968A KR102165827B1 (ko) | 2012-06-29 | 2013-06-06 | 음성 또는 오디오 신호 처리 방법 및 인코딩 장치 |
EP13810131.6A EP2851897B1 (en) | 2012-06-29 | 2013-06-06 | Processing method for speech or audio signals and encoding apparatus thereof |
PCT/CN2013/076862 WO2014000559A1 (zh) | 2012-06-29 | 2013-06-06 | 语音频信号处理方法和编码装置 |
KR1020177030314A KR101907494B1 (ko) | 2012-06-29 | 2013-06-06 | 음성 또는 오디오 신호 처리 방법 및 인코딩 장치 |
EP17195365.6A EP3376499B1 (en) | 2012-06-29 | 2013-06-06 | Speech/audio signal processing method and coding apparatus |
US14/562,494 US10056090B2 (en) | 2012-06-29 | 2014-12-05 | Speech/audio signal processing method and coding apparatus |
JP2017066354A JP6612808B2 (ja) | 2012-06-29 | 2017-03-29 | 会話/音声信号処理方法および符号化装置 |
US16/051,139 US11107486B2 (en) | 2012-06-29 | 2018-07-31 | Speech/audio signal processing method and coding apparatus |
JP2019198664A JP6892491B2 (ja) | 2012-06-29 | 2019-10-31 | 会話/音声信号処理方法および符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210223014.0A CN103516440B (zh) | 2012-06-29 | 2012-06-29 | 语音频信号处理方法和编码装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103516440A true CN103516440A (zh) | 2014-01-15 |
CN103516440B CN103516440B (zh) | 2015-07-08 |
Family
ID=49782211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210223014.0A Active CN103516440B (zh) | 2012-06-29 | 2012-06-29 | 语音频信号处理方法和编码装置 |
Country Status (7)
Country | Link |
---|---|
US (2) | US10056090B2 (zh) |
EP (3) | EP3748634B1 (zh) |
JP (3) | JP6359529B2 (zh) |
KR (6) | KR101790680B1 (zh) |
CN (1) | CN103516440B (zh) |
ES (3) | ES2779857T3 (zh) |
WO (1) | WO2014000559A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106303878A (zh) * | 2015-05-22 | 2017-01-04 | 成都鼎桥通信技术有限公司 | 一种啸叫检测和抑制方法 |
CN110808056A (zh) * | 2014-03-14 | 2020-02-18 | 瑞典爱立信有限公司 | 音频编码方法和装置 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103516440B (zh) * | 2012-06-29 | 2015-07-08 | 华为技术有限公司 | 语音频信号处理方法和编码装置 |
US10431242B1 (en) * | 2017-11-02 | 2019-10-01 | Gopro, Inc. | Systems and methods for identifying speech based on spectral features |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040002854A1 (en) * | 2002-06-27 | 2004-01-01 | Samsung Electronics Co., Ltd. | Audio coding method and apparatus using harmonic extraction |
US20050065786A1 (en) * | 2003-09-23 | 2005-03-24 | Jacek Stachurski | Hybrid speech coding and system |
CN101641734A (zh) * | 2007-03-23 | 2010-02-03 | 三星电子株式会社 | 对音频信号编码的方法和设备以及对音频信号解码的方法和设备 |
CN101903945A (zh) * | 2007-12-21 | 2010-12-01 | 松下电器产业株式会社 | 编码装置、解码装置以及编码方法 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3070698D1 (en) * | 1979-05-28 | 1985-07-04 | Univ Melbourne | Speech processor |
US5574724A (en) * | 1995-05-26 | 1996-11-12 | Lucent Technologies Inc. | Adjustment of call bandwidth during a communication call |
FI115329B (fi) | 2000-05-08 | 2005-04-15 | Nokia Corp | Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin |
FI119533B (fi) * | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
CN102103860B (zh) * | 2004-09-17 | 2013-05-08 | 松下电器产业株式会社 | 频谱包络信息量化装置及方法、频谱包络信息解码装置及方法 |
KR100707174B1 (ko) * | 2004-12-31 | 2007-04-13 | 삼성전자주식회사 | 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법 |
US8311840B2 (en) * | 2005-06-28 | 2012-11-13 | Qnx Software Systems Limited | Frequency extension of harmonic signals |
JP5009910B2 (ja) | 2005-07-22 | 2012-08-29 | フランス・テレコム | レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法 |
US7734462B2 (en) * | 2005-09-02 | 2010-06-08 | Nortel Networks Limited | Method and apparatus for extending the bandwidth of a speech signal |
JP5547081B2 (ja) * | 2007-11-02 | 2014-07-09 | 華為技術有限公司 | 音声復号化方法及び装置 |
CN101662288B (zh) * | 2008-08-28 | 2012-07-04 | 华为技术有限公司 | 音频编码、解码方法及装置、系统 |
WO2010028301A1 (en) * | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Spectrum harmonic/noise sharpness control |
CN101763856B (zh) * | 2008-12-23 | 2011-11-02 | 华为技术有限公司 | 信号分类处理方法、分类处理装置及编码系统 |
JP4945586B2 (ja) * | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
CN101964189B (zh) * | 2010-04-28 | 2012-08-08 | 华为技术有限公司 | 语音频信号切换方法及装置 |
WO2011156905A2 (en) * | 2010-06-17 | 2011-12-22 | Voiceage Corporation | Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands |
US20120029926A1 (en) * | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals |
CN104011793B (zh) * | 2011-10-21 | 2016-11-23 | 三星电子株式会社 | 帧错误隐藏方法和设备以及音频解码方法和设备 |
CN103999153B (zh) * | 2011-10-24 | 2017-03-01 | Lg电子株式会社 | 用于以带选择的方式量化语音信号的方法和设备 |
GB2502800B (en) * | 2012-06-07 | 2015-05-20 | Jaguar Land Rover Ltd | Crane and related method of operation |
CN103516440B (zh) * | 2012-06-29 | 2015-07-08 | 华为技术有限公司 | 语音频信号处理方法和编码装置 |
CN105408957B (zh) * | 2013-06-11 | 2020-02-21 | 弗朗霍弗应用研究促进协会 | 进行语音信号的频带扩展的装置及方法 |
US9564141B2 (en) * | 2014-02-13 | 2017-02-07 | Qualcomm Incorporated | Harmonic bandwidth extension of audio signals |
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
-
2012
- 2012-06-29 CN CN201210223014.0A patent/CN103516440B/zh active Active
-
2013
- 2013-06-06 JP JP2015518805A patent/JP6359529B2/ja active Active
- 2013-06-06 KR KR1020167035415A patent/KR101790680B1/ko active IP Right Grant
- 2013-06-06 WO PCT/CN2013/076862 patent/WO2014000559A1/zh active Application Filing
- 2013-06-06 KR KR1020177030314A patent/KR101907494B1/ko active Application Filing
- 2013-06-06 ES ES17195365T patent/ES2779857T3/es active Active
- 2013-06-06 ES ES20150138T patent/ES2930240T3/es active Active
- 2013-06-06 KR KR1020187028697A patent/KR102005967B1/ko active IP Right Grant
- 2013-06-06 KR KR1020157000174A patent/KR101689138B1/ko active IP Right Grant
- 2013-06-06 KR KR1020197021968A patent/KR102165827B1/ko active IP Right Grant
- 2013-06-06 EP EP20150138.4A patent/EP3748634B1/en active Active
- 2013-06-06 EP EP17195365.6A patent/EP3376499B1/en active Active
- 2013-06-06 EP EP13810131.6A patent/EP2851897B1/en active Active
- 2013-06-06 KR KR1020207028813A patent/KR102331531B1/ko active IP Right Grant
- 2013-06-06 ES ES13810131.6T patent/ES2654488T3/es active Active
-
2014
- 2014-12-05 US US14/562,494 patent/US10056090B2/en active Active
-
2017
- 2017-03-29 JP JP2017066354A patent/JP6612808B2/ja active Active
-
2018
- 2018-07-31 US US16/051,139 patent/US11107486B2/en active Active
-
2019
- 2019-10-31 JP JP2019198664A patent/JP6892491B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040002854A1 (en) * | 2002-06-27 | 2004-01-01 | Samsung Electronics Co., Ltd. | Audio coding method and apparatus using harmonic extraction |
US20050065786A1 (en) * | 2003-09-23 | 2005-03-24 | Jacek Stachurski | Hybrid speech coding and system |
CN101641734A (zh) * | 2007-03-23 | 2010-02-03 | 三星电子株式会社 | 对音频信号编码的方法和设备以及对音频信号解码的方法和设备 |
CN101903945A (zh) * | 2007-12-21 | 2010-12-01 | 松下电器产业株式会社 | 编码装置、解码装置以及编码方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110808056A (zh) * | 2014-03-14 | 2020-02-18 | 瑞典爱立信有限公司 | 音频编码方法和装置 |
CN110808056B (zh) * | 2014-03-14 | 2023-10-17 | 瑞典爱立信有限公司 | 音频编码方法和装置 |
CN106303878A (zh) * | 2015-05-22 | 2017-01-04 | 成都鼎桥通信技术有限公司 | 一种啸叫检测和抑制方法 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4922455B2 (ja) | パケット・ネットワークでエコーを検出し、抑制する方法および装置 | |
JP6892491B2 (ja) | 会話/音声信号処理方法および符号化装置 | |
JP2012516471A (ja) | デバイス動作条件に基づくオーディオ・コーディング選択 | |
US20090099851A1 (en) | Adaptive bit pool allocation in sub-band coding | |
US8805695B2 (en) | Bandwidth expansion method and apparatus | |
EP4086899A1 (en) | Audio transmission method and electronic device | |
RU2419172C2 (ru) | Системы и способы динамической нормализации для уменьшения потери точности для сигналов с низким уровнем | |
EP2127088A1 (en) | Audio quantization | |
KR100723679B1 (ko) | 착신 대기음 구간에서 cdma 이동통신망의 음성슬롯데이터 구조를 이용해 he aac 비트스트림을 전송하는방법 | |
JP2010158044A (ja) | 信号処理装置および信号処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |