CN106033672A - 确定声道间时间差参数的方法和装置 - Google Patents

确定声道间时间差参数的方法和装置 Download PDF

Info

Publication number
CN106033672A
CN106033672A CN201510103379.3A CN201510103379A CN106033672A CN 106033672 A CN106033672 A CN 106033672A CN 201510103379 A CN201510103379 A CN 201510103379A CN 106033672 A CN106033672 A CN 106033672A
Authority
CN
China
Prior art keywords
sound channel
search
time
complexity
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510103379.3A
Other languages
English (en)
Other versions
CN106033672B (zh
Inventor
张兴涛
苗磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN201510103379.3A priority Critical patent/CN106033672B/zh
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to EP15884409.2A priority patent/EP3255632B1/en
Priority to BR112017018819-8A priority patent/BR112017018819A2/zh
Priority to KR1020177025506A priority patent/KR20170116132A/ko
Priority to CA2977843A priority patent/CA2977843A1/en
Priority to JP2017547578A priority patent/JP2018508047A/ja
Priority to SG11201706997PA priority patent/SG11201706997PA/en
Priority to AU2015385489A priority patent/AU2015385489B2/en
Priority to MX2017011466A priority patent/MX2017011466A/es
Priority to RU2017134756A priority patent/RU2682026C1/ru
Priority to PCT/CN2015/095090 priority patent/WO2016141731A1/zh
Publication of CN106033672A publication Critical patent/CN106033672A/zh
Priority to US15/696,716 priority patent/US10388288B2/en
Application granted granted Critical
Publication of CN106033672B publication Critical patent/CN106033672B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Investigating Or Analyzing Materials By The Use Of Ultrasonic Waves (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供一种确定声道间时间差参数的方法和装置,能够使所确定的ITD参数的精度与信道质量相适应,该方法包括:从至少两个搜索复杂度中,确定目标搜索复杂度,其中,该至少两个搜索复杂度与至少两个信道质量值一一相对应;根据该目标搜索复杂度,对第一声道的信号及第二声道的信号进行搜索处理,以确定与该第一声道及该第二声道相对应的第一声道间时间差ITD参数。

Description

确定声道间时间差参数的方法和装置
技术领域
本发明涉及音频处理领域,并且更具体地,涉及确定声道间时间差参数的方法和装置。
背景技术
随着生活质量的提高,人们对高质量音频的需求不断增大。相对于单声道音频,立体声音频具有各生源的方位感和分布感,能够提高信息的清晰度和可懂度,因而备受人们青睐。
目前,已知一种针对立体声音频信号的传输技术,编码端将立体声信号转换为单声道音频信号和声道间时间差(ITD,Inter-Channel Time Difference)等参数,分别对其进行编码并传输给解码端,解码端得到单声道音频信号后,进一步根据ITD等参数恢复立体声信号,从而,能够实现立体声信号的低比特高质量传输。
在上述技术中,编码端基于输入音频信号的采样率,能够确定该采样率下ITD参数的极限值Tmax,从而,可以基于该输入音频信号,在[-Tmax,Tmax]的搜索范围内,以规定的步长搜索计算,以获得ITD参数。因此,无论信道质量如何,上述搜索范围及搜索步长均相同。
但是,根据信道质量的不同,对ITD参数的精度要求不同,例如,如果信道质量较差,则ITD参数的精度要求较低,此时,如果仍然使用上述较大的搜索范围和较小的搜索步长,将造成对计算资源的浪费,严重影响处理效率。
因此,希望提供一种技术,能够使所确定的ITD参数的精度与信道质量相适应。
发明内容
本发明实施例提供一种确定声道间时间差参数的方法和装置,能够使所确定的ITD参数的精度与信道质量相适应。
第一方面,提供了一种确定声道间时间差参数的方法,该方法包括:从至少两个搜索复杂度中,确定目标搜索复杂度,其中,该至少两个搜索复杂度与至少两个信道质量值一一相对应;根据该目标搜索复杂度,对第一声道的信号及第二声道的信号进行搜索处理,以确定与该第一声道及该第二声道相对应的第一声道间时间差ITD参数。
结合第一方面,在第一方面的第一种实现方式中,该从至少两个搜索复杂度中,确定目标搜索复杂度,包括:获取针对立体声信号的编码参数,该立体声信号是基于该第一声道的信号及该第二声道的信号生成的,该编码参数是根据当前的信道质量值确定的,该编码参数包括以下任一参数:编码比特率、编码比特数或用于指示该搜索复杂度的复杂度控制参数;根据该编码参数,从至少两个搜索复杂度中,确定目标搜索复杂度。
结合第一方面及其上述实现方式,在第一方面的第二种实现方式中,该至少两个搜索复杂度与至少两个搜索步长一一对应,该至少两个搜索复杂度包括第一搜索复杂度和第二搜索复杂度,该至少两个搜索步长包括第一搜索步长和第二搜索步长,其中,与第一搜索复杂度相对应的第一搜索步长小于与第二搜索复杂度相对应的第二搜索步长,该第一搜索复杂度高于该第二搜索复杂度,以及该根据该目标搜索复杂度,对第一声道的信号及第二声道的信号进行搜索处理,包括:确定与该目标搜索复杂度相对应的目标搜索步长;根据该目标搜索步长,对该第一声道的信号及该第二声道的信号进行搜索处理。
结合第一方面及其上述实现方式,在第一方面的第三种实现方式中,该至少两个搜索复杂度与至少两个搜索范围一一对应,该至少两个搜索复杂度包括第三搜索复杂度和第四搜索复杂度,该至少两个搜索范围包括第一搜索范围和第二搜索范围,其中,与第三搜索复杂度相对应的第一搜索范围大于与第四搜索复杂度相对应的第二搜索范围,该第三搜索复杂度高于该第四搜索复杂度,以及该根据该目标搜索复杂度,对第一声道的信号及第二声道的信号进行搜索处理,包括:确定与该目标搜索复杂度相对应的目标搜索范围;在该目标搜索范围上,对该第一声道的信号及该第二声道的信号进行搜索处理。
结合第一方面及其上述实现方式,在第一方面的第四种实现方式中,该确定与该目标搜索复杂度相对应的目标搜索范围,包括:根据该第一声道的时域信号及该第二声道的时域信号,确定基准参数,该基准参数对应于该第一声道的时域信号与该第二声道的时域信号之间的获取顺序,其中,该第一声道的时域信号及该第二声道的时域信号对应于同一时段;根据该目标搜索复杂度、该基准参数和极限值Tmax,确定该目标搜索范围,其中,该极限值Tmax是根据该第一声道的时域信号的采样率确定的,该目标搜索范围属于[-Tmax,0],或该目标搜索范围属于[0,Tmax]。
结合第一方面及其上述实现方式,在第一方面的第五种实现方式中,该根据第一声道的时域信号及第二声道的时域信号,确定基准参数,包括:对该第一声道的时域信号及该第二声道的时域信号进行互相关处理,以确定第一互相关处理值及第二互相关处理值,其中,该第一互相关处理值是该第一声道的时域信号相对于该第二声道的时域信号的互相关函数在预设范围内的最大函数值,该第二互相关处理值是该第二声道的时域信号相对于该第一声道的时域信号的互相关函数在该预设范围内的最大函数值;根据该第一互相关处理值及该第二互相关处理值之间的大小关系,确定该基准参数。
结合第一方面及其上述实现方式,在第一方面的第六种实现方式中,该基准参数是该第一互相关处理值及该第二互相关处理值中较大一方所对应的索引值或者该索引值的相反数。
结合第一方面及其上述实现方式,在第一方面的第七种实现方式中,该根据第一声道的时域信号及第二声道的时域信号,确定基准参数,包括:对该第一声道的时域信号及该第二声道的时域信号进行峰值检测处理,以确定第一索引值及第二索引值,其中,该第一索引值是与该第一声道的时域信号在预设范围内的最大幅度值相对应的索引值,该第二索引值是与该第二声道的时域信号在该预设范围内的最大幅度值相对应的索引值;根据该第一索引值与该第二索引值之间的大小关系,确定该基准参数。
结合第一方面及其上述实现方式,在第一方面的第八种实现方式中,该方法还包括:基于第二ITD参数,对该第一ITD参数进行平滑处理,其中,该第一ITD参数是第一时段的ITD参数,该第二ITD参数是第二时段的ITD参数的平滑值,该第二时段处于该第一时段之前。
第二方面,提供了一种确定声道间时间差参数的装置,该装置包括:确定单元,用于从至少两个搜索复杂度中,确定目标搜索复杂度,其中,该至少两个搜索复杂度与至少两个信道质量值一一相对应;处理单元,用于根据该目标搜索复杂度,对第一声道的信号及第二声道的信号进行搜索处理,以确定与该第一声道及该第二声道相对应的第一声道间时间差ITD参数。
结合第二方面,在第二方面的第一种实现方式中,该确定单元具体用于获取针对立体声信号的编码参数,该立体声信号是基于该第一声道的信号及该第二声道的信号生成的,该编码参数是根据当前的信道质量值确定的,该编码参数包括以下任一参数:编码比特率、编码比特数或用于指示该搜索复杂度的复杂度控制参数;用于根据该编码参数,从至少两个搜索复杂度中,确定目标搜索复杂度。
结合第二方面及其上述实现方式,在第二方面的第二种实现方式中,该至少两个搜索复杂度与至少两个搜索步长一一对应,该至少两个搜索复杂度包括第一搜索复杂度和第二搜索复杂度,该至少两个搜索步长包括第一搜索步长和第二搜索步长,其中,与第一搜索复杂度相对应的第一搜索步长小于与第二搜索复杂度相对应的第二搜索步长,该第一搜索复杂度高于该第二搜索复杂度,以及该处理单元具体用于确定与该目标搜索复杂度相对应的目标搜索步长;用于根据该目标搜索步长,对该第一声道的信号及该第二声道的信号进行搜索处理。
结合第二方面及其上述实现方式,在第二方面的第三种实现方式中,该至少两个搜索复杂度与至少两个搜索范围一一对应,该至少两个搜索复杂度包括第三搜索复杂度和第四搜索复杂度,该至少两个搜索范围包括第一搜索范围和第二搜索范围,其中,与第三搜索复杂度相对应的第一搜索范围大于与第四搜索复杂度相对应的第二搜索范围,该第三搜索复杂度高于该第四搜索复杂度,以及该处理单元具体用于确定与该目标搜索复杂度相对应的目标搜索范围;用于在该目标搜索范围上,对该第一声道的信号及该第二声道的信号进行搜索处理。
结合第二方面及其上述实现方式,在第二方面的第四种实现方式中,该处理单元具体用于根据该第一声道的时域信号及该第二声道的时域信号,确定基准参数,该基准参数对应于该第一声道的时域信号与该第二声道的时域信号之间的获取顺序,其中,该第一声道的时域信号及该第二声道的时域信号对应于同一时段;根据该目标搜索复杂度、该基准参数和极限值Tmax,确定该目标搜索范围,其中,该极限值Tmax是根据该第一声道的时域信号的采样率确定的,该目标搜索范围属于[-Tmax,0],或该目标搜索范围属于[0,Tmax]。
结合第二方面及其上述实现方式,在第二方面的第五种实现方式中,该处理单元具体用于对该第一声道的时域信号及该第二声道的时域信号进行互相关处理,以确定第一互相关处理值及第二互相关处理值,其中,该第一互相关处理值是该第一声道的时域信号相对于该第二声道的时域信号的互相关函数在预设范围内的最大函数值,该第二互相关处理值是该第二声道的时域信号相对于该第一声道的时域信号的互相关函数在该预设范围内的最大函数值;用于根据该第一互相关处理值及该第二互相关处理值之间的大小关系,确定该基准参数。
结合第二方面及其上述实现方式,在第二方面的第六种实现方式中,该基准参数是该第一互相关处理值及该第二互相关处理值中较大一方所对应的索引值或者该索引值的相反数。
结合第二方面及其上述实现方式,在第二方面的第七种实现方式中,该处理单元具体用于对该第一声道的时域信号及该第二声道的时域信号进行峰值检测处理,以确定第一索引值及第二索引值,其中,该第一索引值是与该第一声道的时域信号在预设范围内的最大幅度值相对应的索引值,该第二索引值是与该第二声道的时域信号在该预设范围内的最大幅度值相对应的索引值;用于根据该第一索引值与该第二索引值之间的大小关系,确定该基准参数。
结合第二方面及其上述实现方式,在第二方面的第八种实现方式中,该处理单元还用于基于第二ITD参数,对该第一ITD参数进行平滑处理,其中,该第一ITD参数是第一时段的ITD参数,该第二ITD参数是第二时段的ITD参数的平滑值,该第二时段处于该第一时段之前。
根据本发明实施例的确定声道间时间差参数的方法和装置,通过从至少两个搜索复杂度中确定与当前信道质量相对应的目标搜索复杂度,并根据该目标搜索复杂度对对第一声道的信号及第二声道的信号进行搜索处理,能够使所确定的ITD参数的精度与信道质量相适应,从而,在当前信道质量较差的情况下,可以通过目标搜索复杂度,降低搜索处理的复杂度或计算量,进而,能够支持对计算资源的节约及对处理效率的提高。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的确定声道间时间差参数的方法的示意性流程图。
图2是根据本发明一实施例的搜索范围确定过程的示意图。
图3是根据本发明另一实施例的确定目标搜索范围的过程的示意图。
图4是根据本发明再一实施例的确定目标搜索范围的过程的示意图。
图5是根据本发明实施例的确定声道间时间差参数的装置的示意性框图。
图6是根据本发明实施例的确定声道间时间差参数的设备的示意性结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是示出了本发明实施例的确定声道间时间差参数的方法100的示意性流程图,该方法100的执行主体可以是传输音频信号的编码端设备(也可以称为,发送端设备),如图1所示,该方法100包括:
S110,从至少两个搜索复杂度中,确定目标搜索复杂度,其中,该至少两个搜索复杂度与至少两个信道质量值一一相对应;
S120,根据该目标搜索复杂度,对第一声道的信号及第二声道的信号进行搜索处理,以确定与该第一声道及该第二声道相对应的第一声道间时间差ITD参数。
本发明实施例的确定声道间时间差参数的方法100可以应用于具有至少两个声道的音频系统,在该音频系统中,通过来自至少两个声道(即,包括第一声道和第二声道)的单声道信号合成立体声信号,例如,通过来自左声道(即,第一声道的一例)的单声道信号和来自右声道(即,第二声道的一例)的单声道信号合成立体声信号。
其中,作为传输该立体声信号的方法,可以列举参数立体声(PS)技术,该技术根据空间感知特性,编码端将立体声信号转换为单声道信号和空间感知参数,并分别进行编码,解码端得到单声道音频后,进一步根据空间参数恢复立体声信号。该技术能够实现立体声信号的低比特高质量传输。声道间时间差ITD(ITD,Inter-Channel Time Difference)参数是表示声源水平方位的空间参数,是空间参数的重要组成部分,本发明实施例主要涉及该ITD参数的确定过程。另外,在本发明实施例中,根据ITD参数对立体声信号和单声道信号进行编解码的过程与现有技术相似,这里为了避免赘述,省略其详细说明。
应理解,以上列举的音频系统所具有的声道数量仅为示例性说明,本发明并未限定于此,例如,该音频系统也可以具有三个或三个以上的声道,并且,能够通过任意两个声道的单声道信号合成立体声信号。以下,为了便于理解,以将该方法100应用于具有两个声道(即,左声道和右声道)的音频系统使的处理过程为例,进行说明,并且,为了便于区分,以左声道作为第一声道,以右声道作为第二声道,进行说明。
在本发明实施例中,对于不同搜索复杂度,获取左右声道间的ITD参数的方法也相异,从而,编码端设备在确定ITD参数之前,可以首先确定当前的搜索复杂度。
搜索复杂度与信道质量之间存在映射关系,即,信道质量越好,编码比特率越高,且编码比特数越大,因而对ITD参数精度的要求越高。相反地,信道质量越差,编码比特率越低,且编码比特数越小,因而对ITD参数精度的要求越低。
在本发明实施例中,不同的搜索复杂度对应不同的ITD参数获取方式(随后,对该搜索复杂度和ITD参数获取方式之间的具体关系进行详细说明),搜索复杂度越高,所获得的ITD参数的精度越高。相反地,搜索复杂度越低,所获得的ITD参数的精度越低。
因此,编码端设备通过选择与当前信道质量相对应的搜索复杂度(即,目标搜索复杂度),能够使所获得的ITD参数的精度与当前的信道质量相对应。
即,在本发明实施例中,通过设定与多个(即,至少两个)信道质量彼此之间一一对应多个(即,至少两个)搜索复杂度,能够应对多种(即,至少两种)信道质量相异的通信条件,从而能够灵活应对对于ITD参数的精度的不同要求。
在本发明实施例中,可以直接将多个(即,至少两个)信道质量与多个(即,至少两个)搜索复杂度彼此之间一一对应关系记录在映射表项(为了便于理解和区分,记做:映射表项#1)并存储在编码端设备中,从而,编码端设备可以在获取当前信道质量后,直接在该映射表项#1中查找与当前信道质量相对应的搜索复杂度,作为目标搜索复杂度。
即,可以将搜索复杂度分为M级(或者说,设置M种搜索复杂度,记做:M,M-1,…,1),并且,可以时该M级搜索复杂度与M个信道质量(例如,记做:QM,QM-1,QM-2,…,Q1,其中,QM>QM-1>QM-2>…>Q1)一一对应,即:
例如,信道质量QM所对应的搜索复杂度为M,即,如果当前的信道质量高于或等于信道质量QM,则所确定的目标搜索复杂度可以设定为M。
再例如,信道质量QM-1所对应的搜索复杂度为M-1,即,如果当前的信道质量高于或等于信道质量QM-1且低于信道质量QM,则所确定的目标搜索复杂度可以设定为M-1。
再例如,信道质量QM-2所对应的搜索复杂度为M-2,即,如果当前的信道质量高于或等于信道质量QM-2且低于信道质量QM-1,则所确定的目标搜索复杂度可以设定为M-2。
再例如,信道质量Q2所对应的搜索复杂度为2,即,如果当前的信道质量高于或等于信道质量Q2且低于信道质量Q3,则所确定的目标搜索复杂度可以设定为2。
再例如,信道质量Q1所对应的搜索复杂度为1,即,如果当前的信道质量低于信道质量Q2,则所确定的目标搜索复杂度可以设定为1。
需要说明的是,信道质量是指编码端和解码端之间用于传输音频信号和后述ITD参数等的信道的质量。
应理解,以上列举的确定目标搜索复杂度的方法仅为示例性说明,本发明并不限定于此,例如,还可以列举以下方式,即:
可选地,该从至少两个搜索复杂度中,确定目标搜索复杂度,包括:
获取编码参数,该编码参数是根据当前的信道质量值确定的,该编码参数包括以下任一参数:编码比特率、编码比特数或用于指示该搜索复杂度的复杂度控制参数;
根据该编码参数,从至少两个搜索复杂度中,确定目标搜索复杂度。
具体地说,由于信道质量与编码比特率和编码比特数之间存在对应关系,即,信道质量越好,编码比特率越高,编码比特数越大。相反地,信道质量越差,编码比特率越低,编码比特数越小。
因此,在本发明实施例中,也可以将多个(即,至少两个)编码比特率与多个(即,至少两个)搜索复杂度彼此之间一一对应关系记录在映射表项(为了便于理解和区分,记做:映射表项#2)并存储在编码端设备中,从而,编码端设备可以在获取当前的编码比特率后,直接在该映射表项#2中查找与当前的编码比特率相对应的搜索复杂度,作为目标搜索复杂度。这里,编码端设备获取当前的编码比特率的方法和过程可以与现有技术相似,为了避免赘述,省略其详细说明。
即,可以将搜索复杂度分为M级(或者说,设置M种搜索复杂度,记做:M,M-1,…,1),并且,可以时该M级搜索复杂度与M个编码比特率(记做:BM,BM-1,BM-2,…,B1,其中,BM>BM-1>BM-2>…>B1)一一对应,即:
例如,编码比特率BM所对应的搜索复杂度为M,即,如果当前的编码比特率高于或等于编码比特率BM,则所确定的目标搜索复杂度可以设定为M。
再例如,编码比特率BM-1所对应的搜索复杂度为M-1,即,如果当前的编码比特率高于或等于编码比特率BM-1且低于编码比特率BM,则所确定的目标搜索复杂度可以设定为M-1。
再例如,编码比特率BM-2所对应的搜索复杂度为M-2,即,如果当前的编码比特率高于或等于编码比特率BM-2且低于编码比特率BM-1,则所确定的目标搜索复杂度可以设定为M-2。
再例如,编码比特率B2所对应的搜索复杂度为2,即,如果当前的编码比特率高于或等于编码比特率B2且低于编码比特率B3,则所确定的目标搜索复杂度可以设定为2。
再例如,编码比特率B1所对应的搜索复杂度为1,即,如果当前的编码比特率低于编码比特率B2,则所确定的目标搜索复杂度可以设定为1。
或者,在本发明实施例中,也可以将多个(即,至少两个)编码比特数与多个(即,至少两个)搜索复杂度彼此之间一一对应关系记录在映射表项(为了便于理解和区分,记做:映射表项#3)并存储在编码端设备中,从而,编码端设备可以在获取当前的编码比特数后,直接在该映射表项#3中查找与当前的编码比特数相对应的搜索复杂度,作为目标搜索复杂度。这里,编码端设备获取当前的编码比特数的方法和过程可以与现有技术相似,为了避免赘述,省略其详细说明。
即,可以将搜索复杂度分为M级(或者说,设置M种搜索复杂度,记做:M,M-1,…,1),并且,可以时该M级搜索复杂度与M个编码比特数(记做:CM,CM-1,CM-2,…,C1,其中,CM>CM-1>CM-2>…>C1)一一对应,即:
例如,编码比特数CM所对应的搜索复杂度为M,即,如果当前的编码比特数高于或等于编码比特数CM,则所确定的目标搜索复杂度可以设定为M。
再例如,编码比特数CM-1所对应的搜索复杂度为M-1,即,如果当前的编码比特数高于或等于编码比特数CM-1且低于编码比特数CM,则所确定的目标搜索复杂度可以设定为M-1。
再例如,编码比特数CM-2所对应的搜索复杂度为M-2,即,如果当前的编码比特数高于或等于编码比特数CM-2且低于编码比特数CM-1,则所确定的目标搜索复杂度可以设定为M-2。
再例如,编码比特数C2所对应的搜索复杂度为2,即,如果当前的编码比特数高于或等于编码比特数C2且低于编码比特数C3,则所确定的目标搜索复杂度可以设定为2。
再例如,编码比特数C1所对应的搜索复杂度为1,即,如果当前的编码比特数低于编码比特数C2,则所确定的目标搜索复杂度可以设定为1。
另外,在本发明实施例中,可以为不同的信道质量配置不同的复杂度控制参数,从而,能够使不同的复杂度控制参数值对应不同的搜索复杂度,进而,能够并将多个(即,至少两个)复杂度控制参数值与多个(即,至少两个)搜索复杂度彼此之间一一对应关系记录在映射表项(为了便于理解和区分,记做:映射表项#4)并存储在编码端设备中,从而,编码端设备可以在获取当前的复杂度控制参数值后,直接在该映射表项#4中查找与当前的复杂度控制参数值相对应的搜索复杂度,作为目标搜索复杂度。这里,该复杂度控制参数值可以通过预先写入命令行,从而,编码端设备可以在命令行中读取当前的复杂度控制参数值。
即,可以将搜索复杂度分为M级(或者说,设置M种搜索复杂度,记做:M,M-1,…,1),并且,可以时该M级搜索复杂度与M个复杂度控制参数(记做:NM,NM-1,NM-2,…,N1,其中,NM>NM-1>NM-2>…>N1)一一对应,即:
例如,复杂度控制参数NM所对应的搜索复杂度为M,即,如果当前的复杂度控制参数高于或等于复杂度控制参数NM,则所确定的目标搜索复杂度可以设定为M。
再例如,复杂度控制参数NM-1所对应的搜索复杂度为M-1,即,如果当前的复杂度控制参数高于或等于复杂度控制参数NM-1且低于复杂度控制参数NM,则所确定的目标搜索复杂度可以设定为M-1。
再例如,复杂度控制参数NM-2所对应的搜索复杂度为M-2,即,如果当前的复杂度控制参数高于或等于复杂度控制参数NM-2且低于复杂度控制参数NM-1,则所确定的目标搜索复杂度可以设定为M-2。
再例如,复杂度控制参数N2所对应的搜索复杂度为2,即,如果当前的复杂度控制参数高于或等于复杂度控制参数N2且低于复杂度控制参数N3,则所确定的目标搜索复杂度可以设定为2。
再例如,复杂度控制参数N1所对应的搜索复杂度为1,即,如果当前的复杂度控制参数低于复杂度控制参数N2,则所确定的目标搜索复杂度可以设定为1。
应理解,以上列举的作为编码参数的编码比特率、编码比特数或复杂度控制参数仅为示例性说明,本发明并未限定于此,其他能够由信道质量决定,或者说,能够反映信道质量的信息或参数均落入本发明的保护范围内。
在如上所述确定了目标搜索复杂度之后,在S120,编码端设备可以根据该目标搜索复,进行搜索处理,以获取ITD参数。
在本发明实施例中,不同的搜索复杂度可以对应不同的搜索步长(即,情况1),或者,不同的搜索复杂度可以对应不同的搜索范围(即,情况2),下面,分别对以上两种情况下,编码端基于目标搜索复杂度确定ITD参数的过程进行详细说明。
情况1
该至少两个搜索复杂度与至少两个搜索步长一一对应,该至少两个搜索复杂度包括第一搜索复杂度和第二搜索复杂度,该至少两个搜索步长包括第一搜索步长和第二搜索步长,其中,与第一搜索复杂度相对应的第一搜索步长小于与第二搜索复杂度相对应的第二搜索步长,该第一搜索复杂度高于该第二搜索复杂度,以及
该根据该目标搜索复杂度,对第一声道的信号及第二声道的信号进行搜索处理,包括:
确定与该目标搜索复杂度相对应的目标搜索步长;
根据该目标搜索步长,对该第一声道的信号及该第二声道的信号进行搜索处理。
具体地说,在本发明实施例中,上述M种搜索复杂度(即,M,M-1,…,1),可以与M个搜索步长(记做:LM,LM-1,LM-2,…,L1,其中,LM<LM-1<LM-2<…<L1)一一对应,即:
例如,搜索步长LM所对应的搜索复杂度为M,即,如果如上所述确定的目标搜索复杂度为M,则可以将该搜索复杂度M所对应的搜索步长LM设定为目标搜索步长。
再例如,搜索步长LM-1所对应的搜索复杂度为M-1,即,如果如上所述确定的目标搜索复杂度为M-1,则可以将该搜索复杂度M-1所对应的搜索步长LM-1设定为目标搜索步长。
再例如,搜索步长LM-2所对应的搜索复杂度为M-2,即,如果如上所述确定的目标搜索复杂度为M-2,则可以将该搜索复杂度M-2所对应的搜索步长LM-2设定为目标搜索步长。
再例如,搜索步长L2所对应的搜索复杂度为2,即,如果如上所述确定的目标搜索复杂度为2,则可以将该搜索复杂度2所对应的搜索步长L2设定为目标搜索步长。
再例如,搜索步长L1所对应的搜索复杂度为1,即,如果如上所述确定的目标搜索复杂度为1,则可以将该搜索复杂度1所对应的搜索步长L1设定为目标搜索步长。
作为各步长的设定方式,例如,在本发明实施例中,可以根据以下公式确定M个搜索步长(即,LM,LM-1,LM-2,…,L1)的具体值。
其中,K为预设值,表示复杂度最低时的搜索次数,表示下取整运算。
另外,如果则搜索复杂度为i时的搜索次数增加1次。
需要说明的是,以上列举的确定各步长的方法和具体数值仅为示例性说明,本发明并未限定于此,可以根据需要任意确定,只要确保LM<LM-1<LM-2<…<L1即可。
在如上所述确定了目标搜索步长(以下,为了便于理解和区分,记做Lt)后,可以根据该目标搜索步长对左声道的信号和右声道的信号进行搜索处理,以确定ITD参数。
另外,上述可以搜索处理可以在时域上(即,方式1)进行也可以在频域上(即,方式2)进行,本发明并未特别限定,下面,分别对上述两种方式进行详细说明。
方式1
具体地说,编码端设备可以通过例如,与左声道相对应的麦克风等音频输入设备获取与左声道相对应的音频信号,并根据预设的采样率α(即,第一声道的时域信号的采样率的一例),对该音频信号进行采样处理,以生成左声道的时域信号(即,第一声道的时域信号的一例,以下,为了便于理解和区分,记做时域信号#L)。并且,在本发明实施例中,该获取时域信号#L的过程可以与现有技术相似,这里,为了避免赘述,省略其详细说明。
在本发明实施例中,第一声道的时域信号的采样率与第二声道的时域信号的采样率相同,因此,类似地,编码端设备可以通过例如,与右声道相对应的麦克风等音频输入设备获取与右声道相对应的音频信号,并根据上述采样率α,对该音频信号进行采样处理,以生成右声道的时域信号(即,第二声道的时域信号的一例,以下,为了便于理解和区分,记做时域信号#R)。
需要说明的是,在本发明实施例中,时域信号#L与时域信号#R是对应同一时段的时域信号(或者说,在同一时段内获取的时域信号),例如,该时域信号#L与时域信号#R可以是对应同一帧(即,20ms)的时域信号,此情况下,基于时域信号#L与时域信号#R能够获得与该一帧信号相对应的一个ITD参数。
再例如,该时域信号#L与时域信号#R也可以是对应同一帧内的同一子帧(即,10ms或5ms等)的时域信号,此情况下,基于时域信号#L与时域信号#R能够获得与该一帧信号相对应的多个ITD参数,例如,如果该时域信号#L与时域信号#R所对应的子帧为10ms,则通过该一帧(即,20ms)信号能够获得两个ITD参数。再例如,如果该时域信号#L与时域信号#R所对应的子帧为5ms,则通过该一帧(即,20ms)信号能够获得四个ITD参数。
应理解,以上列举的时域信号#L与时域信号#R所对应的时段的长度仅为示例性说明,本发明并未限定于此,可以根据需要任意变更该时段的长度。
其后,编码端设备可以根据如上所述确定的目标搜索步长(即,Lt),通过以下步骤对上述时域信号#L与时域信号#R进行搜索处理,即:
步骤1.编码端设备可以设置i=0;
步骤2.编码端设备可以根据以下式1确定时域信号#L相对于时域信号#R的互相关函数cn(i),并根据以下式2确定时域信号#R相对于时域信号#L的互相关函数cp(i),即:
c n ( i ) = &Sigma; j = 0 Length - 1 - i x R ( j ) &CenterDot; x L ( j + i ) 式1
c p ( i ) = &Sigma; j = 0 Length - 1 - i x L ( j ) &CenterDot; x R ( j + i ) 式2
其中,xR(j)表示时域信号#R在第j个采样点处的信号值,xL(j+i)表示时域信号#L在第j+i个采样点处的信号值,xL(j)表示时域信号#L在第j个采样点处的信号值,xR(j+i)表示时域信号#R在第j+i个采样点处的信号值,Length表示时域信号#R及时域信号#L包括的采样点的总数量,或者说,时域信号#R及时域信号#L的长度,例如,可以为一个帧的长度(即,20ms)或一个子帧的长度(例如,10ms或5ms等);
步骤3.编码端设备可以令i=i+Lt,并在i∈[0,Tmax]的范围内重复步骤2,
其中,Tmax表示ITD参数的极限值(或者说,左时域信号#L与时域信号#R之间的获取时间差的最大值)可以根据上述采样率α确定,并且,其确定方法可以与现有技术相似,这里为了避免赘述,省略其详细说明;
步骤4.编码端设备可以计算在以目标搜索步长(即,Lt)对时域信号#R和时域信号#L进行搜索处理时所确定的时域信号#L相对于时域信号#R的互相关函数cn(i)的最大值
并且,编码端设备可以计算在以目标搜索步长(即,Lt)对时域信号#R和时域信号#L进行搜索处理时所确定的时域信号#R相对于时域信号#L的互相关函数(cp(i))的最大值
其中,编码端设备可以对进行比较,并根据比较结果,确定ITD参数。
例如,如果 max 0 &le; i &le; T max ( c n ( i ) ) &le; max 0 &le; i &le; T max ( c p ( i ) ) , 则编码端设备可以将所对应的索引值作为ITD参数。
再例如,如果 max 0 &le; i &le; T max ( c n ( i ) ) > max 0 &le; i &le; T max ( c p ( i ) ) , 则编码端设备可以将所对应的索引值的相反数作为ITD参数。
其中,Tmax表示ITD参数的极限值(或者说,时域信号#L与时域信号#R之间的获取时间差的最大值)可以根据上述采样率α确定,并且,其确定方法可以与现有技术相似,这里为了避免赘述,省略其详细说明。
方式2
编码端设备可以对上述时域信号#L进行时频变换处理以获得左声道的频域信号(即,第一声道的频域信号的一例,以下,为了便于理解和区分,记做频域信号#L)。可以对时域信号#R进行时频变换处理以获得右声道的频域信号(即,第二声道的频域信号的一例,以下,为了便于理解和区分,记做频域信号#R)
例如,在本发明实施例中,可以采用快速傅氏变换(FFT,Fast FourierTransformation)技术,基于以下式3,进行时频变换处理。
X ( k ) = &Sigma; n = 0 Length x ( n ) &CenterDot; e - j 2 &pi; &CenterDot; n &CenterDot; k FFT _ LENGTH , 0 &le; k < FFT _ LENGTH 式3
其中,X(k)表示频域信号,FFT_LENGTH表示时频变换长度。x(n)表示时域信号(即,时域信号#L或时域信号#R),Length表示时域信号包括的采样点的总数量。
应理解,以上列举的时频变换处理的过程仅为示例性说明,本发明并不限定于此,该视频变换处理的方法和过程可以与现有技术相似,例如,还可以采用修正离散余弦变换(MDCT,Modified Discrete Cosine Transform)等技术。
其后,可以编码端设备可以根据如上所述确定的目标搜索步长(即,Lt),通过以下步骤对上述频域信号#L与频域信号#R进行搜索处理,即:
步骤a,编码端设备可以根据预设的带宽A,将频域信号的FFT_LENGTH个频点划分为Nsubband个(例如,1个)子带,其中,对于第k个子带Ak,其包含的频点为Ak-1≤b≤Ak-1;
步骤b,设置j=-Tmax
步骤c,根据以下式4计算频域信号#L与频域信号#R的相关函数mag(j)
mag ( j ) = &Sigma; b = A k - 1 A k - 1 X L ( b ) * X R ( b ) * exp ( 2 &pi; * b * j FFT _ LENFTH ) 式4
其中,XL(b)表示频域信号#L在第b个频点的信号值,XR(b)表示频域信号#R在第b个频点的信号值,FFT_LENGTH表示时频变换长度。
步骤d,编码端设备可以令j=j+Lt,并在j∈[-Tmax,Tmax]的范围内重复步骤c,
其中,Tmax表示ITD参数的极限值(或者说,左时域信号#L与时域信号#R之间的获取时间差的最大值)可以根据上述采样率α确定,并且,其确定方法可以与现有技术相似,这里为了避免赘述,省略其详细说明
从而,编码端设备可以确定第k个子带的ITD参数值为 T ( k ) = arg max - T max &le; j &le; T max ( mag ( j ) ) , 即mag(j)的最大值对应的索引值。
由此,可以得到左声道与右声道之间的一个或多个(根据如上所述确定的子带的数量相对应)ITD参数值。
其后,编码端设备还可以对上述ITD参数值进行量化处理等,并将处理后的ITD参数值以及单声道信号(例如,上述时域信号#L、时域信号#R、频域信号#L或频域信号#R)发送给解码端设备(或者说,接收端设备)。
解码端设备可以根据单声道音频信号和ITD参数值,恢复出立体声音频信号。
情况2
该至少两个搜索复杂度与至少两个搜索范围一一对应,该至少两个搜索复杂度包括第三搜索复杂度和第四搜索复杂度,该至少两个搜索范围包括第一搜索范围和第二搜索范围,其中,与第三搜索复杂度相对应的第一搜索范围大于与第四搜索复杂度相对应的第二搜索范围,该第三搜索复杂度高于该第四搜索复杂度,以及
该根据该目标搜索复杂度,对第一声道的信号及第二声道的信号进行搜索处理,包括:
确定与该目标搜索复杂度相对应的目标搜索范围;
在该目标搜索范围上,对该第一声道的信号及该第二声道的信号进行搜索处理。
具体地说,在本发明实施例中,上述M种搜索复杂度(即,M,M-1,…,1),可以与M个搜索范围(记做:FM,FM-1,FM-2,…,F1,其中,FM>FM-1>FM-2>…>F1)一一对应,即:
例如,搜索范围FM所对应的搜索复杂度为M,即,如果如上所述确定的目标搜索复杂度为M,则可以将该搜索复杂度M所对应的搜索范围FM设定为目标搜索范围。
再例如,搜索范围FM-1所对应的搜索复杂度为M-1,即,如果如上所述确定的目标搜索复杂度为M-1,则可以将该搜索复杂度M-1所对应的搜索范围FM-1设定为目标搜索范围。
再例如,搜索范围FM-2所对应的搜索复杂度为M-2,即,如果如上所述确定的目标搜索复杂度为M-2,则可以将该搜索复杂度M-2所对应的搜索范围FM-2设定为目标搜索范围。
再例如,搜索范围F2所对应的搜索复杂度为2,即,如果如上所述确定的目标搜索复杂度为2,则可以将该搜索复杂度2所对应的搜索范围F2设定为目标搜索范围。
再例如,搜索范围F1所对应的搜索复杂度为1,即,如果如上所述确定的目标搜索复杂度为1,则可以将该搜索复杂度1所对应的搜索范围F1设定为目标搜索范围。
需要说明的是,在本发明实施例中,上述搜索范围FM,FM-1,FM-2,…,F1可以均为时域上的搜索范围,或者上述搜索范围FM,FM-1,FM-2,…,F1也可以均为频域上的搜索范围,本发明并未特别限定。
在本发明实施例中,可以将与搜索复杂度最高的频域上的搜索范围FM,确定为[-Tmax,Tmax]。
下面,对确定其他搜索复杂度时在频域上所对应的搜索范围的过程进行详细说明。
该确定与该目标搜索复杂度相对应的目标搜索范围,包括:
根据该第一声道的时域信号及该第二声道的时域信号,确定基准参数,该基准参数对应于该第一声道的时域信号与该第二声道的时域信号之间的获取顺序,其中,该第一声道的时域信号及该第二声道的时域信号是对应于同一时段的时域信号;
根据该目标搜索复杂度、该基准参数和极限值Tmax,确定该目标搜索范围,其中,该极限值Tmax是根据该时域信号的采样率确定的,该目标搜索范围属于[-Tmax,0],或该目标搜索范围属于[0,Tmax]。
具体地说,编码端设备可以根据该时域信号#L和时域信号#R,确定基准参数。其中,该基准参数可以与该时域信号#L和时域信号#R获取顺序(例如,输入至上述音频输入设备的先后顺序)相对应,随后,结合该基准参数的确定过程,对该对应关系进行详细说明。
在本发明实施例中,可以通过对时域信号#L和时域信号#R进行互相关处理来确定该基准参数(即,方式X),也可以通过搜索时域信号#L和时域信号#R的幅度最大值来确定该基准参数(即,方式Y),下面,分别对该方式X和方式Y进行详细说明。
方式X
可选地,该根据第一声道的时域信号及第二声道的时域信号,确定基准参数,包括:
对该第一声道的时域信号及该第二声道的时域信号进行互相关处理,以确定第一互相关处理值及第二互相关处理值,其中,该第一互相关处理值是该第一声道的时域信号相对于该第二声道的时域信号的互相关函数在预设范围内的最大函数值,该第二互相关处理值是该第二声道的时域信号相对于该第一声道的时域信号的互相关函数在该预设范围内的最大函数值;
根据该第一互相关处理值及该第二互相关处理值之间的大小关系,确定该基准参数。
具体地说,在本发明实施例中,编码端设备可以根据以下式5确定时域信号#L相对于时域信号#R的互相关函数cn(i),即:
c n ( i ) = &Sigma; j = 0 Length - 1 - i x R ( j ) &CenterDot; x L ( j + i ) , i &Element; [ 0 , T max ] 式5
其中,Tmax表示ITD参数的极限值(或者说,时域信号#L与时域信号#R之间的获取时间差的最大值)可以根据上述采样率α确定,并且,其确定方法可以与现有技术相似,这里为了避免赘述,省略其详细说明。xR(j)表示时域信号#R在第j个采样点处的信号值,xL(j+i)表示时域信号#L在第j+i个采样点处的信号值,Length表示时域信号#R包括的采样点的总数量,或者说,时域信号#R的长度,例如,可以为一个帧的长度(即,20ms)或一个子帧的长度(例如,10ms或5ms等)。
并且,编码端设备可以确定该互相关函数cn(i)的最大值
类似地,编码端设备可以根据以下式6确定时域信号#R相对于时域信号#L的互相关函数cp(i),即:
c p ( i ) = &Sigma; j = 0 Length - 1 - i x L ( j ) &CenterDot; x R ( j + i ) 式6
并且,编码端设备可以确定该互相关函数cp(i)的最大值
在本发明实施例中,编码端设备可以根据之间的关系,通过以下方式X1或方式X2确定基准参数的值。
方式X1
如图2所示,如果则编码端设备可以确定时域信号#L是先于时域信号#R获取的,即,左右声道之间的ITD参数为正数,此情况下,可以将基准参数T置为1。
从而,在其后的判定过程中,编码端设备可以判定该基准参数大于0,从而确定搜索范围为[0,Tmax],即,当时域信号#L是先于时域信号#R获取时,ITD参数为正数,搜索范围为[0,Tmax](即,搜索范围属于[0,Tmax]的一例)。
或者,如果则编码端设备可以确定时域信号#L是后于时域信号#R获取的,即,左右声道之间的ITD参数为负数,此情况下,可以将基准参数T置为0。
从而,在其后的判定过程中,编码端设备可以判定该基准参数不大于0,从而确定搜索范围为[-Tmax,0],即,当时域信号#L是后于时域信号#R获取时,ITD参数为负数,搜索范围为[-Tmax,0](即,搜索范围属于[-Tmax,0]的一例)。
从而,在包括两种或两种以上搜索复杂度时,能够从上述[-Tmax,0]和[0,Tmax]中确定出搜索复杂度为普通(M=2)时的频域上的搜索范围F2
方式X2
可选地,该基准参数是该第一互相关处理值及该第二互相关处理值中较大一方所对应的索引值或者索引值的相反数。
具体地说,如图3所示,如果则编码端设备可以确定时域信号#L是先于时域信号#R获取的,即,左右声道之间的ITD参数为正数,此情况下,可以将基准参数T置为所对应的索引值。
从而,在其后的判定过程中,编码端设备在判定基准参数T大于0之后,可以进一步判定该基准参数T是否大于或等于Tmax/2,并根据判定结果确定搜索范围,例如,当T≥Tmax/2时,搜索范围为[Tmax/2,Tmax](即,搜索范围属于[0,Tmax]的一例)。当T<Tmax/2时,搜索范围为[0,Tmax/2](即,搜索范围属于[0,Tmax]的另一例)。
或者,如果则编码端设备可以确定时域信号#L是后于时域信号#R获取的,即,左右声道之间的ITD参数为负数,此情况下,可以将基准参数T置为所对应的索引值的相反数。
从而,在其后的判定过程中,编码端设备在判定基准参数T小于或等于0之后,可以进一步判定该基准参数T是否小于于或等于-Tmax/2,并根据判定结果确定搜索范围,例如,当T≤-Tmax/2时,搜索范围为[-Tmax,-Tmax/2](即,搜索范围属于[-Tmax,0]的一例)。当T>-Tmax/2时,搜索范围为[-Tmax/2,0](即,搜索范围属于[-Tmax,0]的另一例)。
从而,在包括三种或三种以上搜索复杂度时,能够从上述[-Tmax,-Tmax/2]、[-Tmax/2,0]、[0,Tmax/2]和[Tmax/2,Tmax]中确定出搜索复杂度为最低(M=1)时的频域上的搜索范围F3
方式Y
可选地,该根据第一声道的时域信号及第二声道的时域信号,确定基准参数,包括:
对该第一声道的时域信号及该第二声道的时域信号进行峰值检测处理,以确定第一索引值及第二索引值,其中,该第一索引值是与该第一声道的时域信号在预设范围内的最大幅度值相对应的索引值,该第二索引值是与该第二声道的时域信号在该预设范围内的最大幅度值相对应的索引值;
根据该第一索引值与该第二索引值之间的大小关系,确定该基准参数。
具体地说,在本发明实施例中,编码端设备可以检测时域信号#L的幅度值(记做:L(j))最大值max(L(j)),j∈[0,Length-1],并记录该max(L(j))所对应的索引值pleft,其中,Length表示时域信号#L包括的采样点的总数量。
并且,编码端设备可以检测时域信号#R的幅度值(记做:R(j))最大值max(R(j)),j∈[0,Length-1],并记录该max(R(j))所对应的索引值pright,其中,Length表示时域信号#R包括的采样点的总数量。
其后,编码端设备可以判定pleft与pright之间的大小关系。
如图4所示,如果pleft≥pright,则编码端设备可以确定时域信号#L是先于时域信号#R获取的,即,左右声道之间的ITD参数为正数,此情况下,可以将基准参数T置为1。
从而,在其后的判定过程中,编码端设备可以判定该基准参数大于0,从而确定搜索范围为[0,Tmax],即,当时域信号#L是先于时域信号#R获取时,ITD参数为正数,搜索范围为[0,Tmax](即,搜索范围属于[0,Tmax]的一例)。
或者,如果pleft<pright,则编码端设备可以确定时域信号#L是后于时域信号#R获取的,即,左右声道之间的ITD参数为负数,此情况下,可以将基准参数T置为0。
从而,在其后的判定过程中,编码端设备可以判定该基准参数不大于0,从而确定搜索范围为[-Tmax,0],即,当时域信号#L是后于时域信号#R获取时,ITD参数为负数,搜索范围为[-Tmax,0](即,搜索范围属于[-Tmax,0]的一例)。
从而,在包括两种或两种以上搜索复杂度时,能够从上述[-Tmax,0]和[0,Tmax]中确定出搜索复杂度为普通(M=2)时的频域上的搜索范围F2
应理解,以上列举的确定搜索范围的方法和搜索范围距具体数值仅为示例性说明,本发明并不限定于此,可以根据需要任意确定,只要确保FM<FM-1<FM-2<…<F1即可
编码端设备可以对时域信号#L进行时频变换处理以获得左声道的频域信号(即,第一声道的频域信号的一例,以下,为了便于理解和区分,记做频域信号#L)。可以对时域信号#R进行时频变换处理以获得右声道的频域信号(即,第二声道的频域信号的一例,以下,为了便于理解和区分,记做频域信号#R)
例如,在本发明实施例中,可以采用快速傅氏变换(FFT,Fast FourierTransformation)技术,基于以下式7,进行时频变换处理。
X ( k ) = &Sigma; n = 0 Length x ( n ) &CenterDot; e - j 2 &pi; &CenterDot; n &CenterDot; k FFT _ LENGTH , 0 &le; k < FFT _ LENGTH 式7
其中,X(k)表示频域信号,FFT_LENGTH表示时频变换长度。x(n)表示时域信号(即,时域信号#L或时域信号#R),Length表示时域信号包括的采样点的总数量。
应理解,以上列举的时频变换处理的过程仅为示例性说明,本发明并不限定于此,该视频变换处理的方法和过程可以与现有技术相似,例如,还可以采用修正离散余弦变换(MDCT,Modified Discrete Cosine Transform)等技术。
从而,编码端设备可以在如上所述确定的搜索范围内,对如上所述确定的频域信号#L和频域信号#R进行搜索处理,以确定左声道与右声道之间的ITD参数,例如,可以列举以下搜索处理的过程:
首先,编码端设备可以根据预设的带宽A,将频域信号的FFT_LENGTH个频点划分为Nsubband个(例如,1个)子带,其中,对于第k个子带Ak,其包含的频点为Ak-1≤b≤Ak-1,
在上述搜索范围内,根据以下式8计算频域信号#L的相关函数mag(j)
mag ( j ) = &Sigma; b = A k - 1 A k - 1 X L ( b ) * X R ( b ) * exp ( 2 &pi; * b * j FFT _ LENFTH ) 式8
其中,XL(b)表示频域信号#L在第b个频点的信号值,XR(b)表示频域信号#R在第b个频点的信号值,FFT_LENGTH表示时频变换长度,j的取值范围是如上所述确定的搜索范围,为了便于理解和说明,将该搜索范围记做[a,b]。
则第k个子带的ITD参数值为即mag(j)的最大值对应的索引值。
由此,可以得到左声道与右声道之间的一个或多个(根据如上所述确定的子带的数量相对应)ITD参数值。
其后,编码端设备还可以对上述ITD参数值进行量化处理等,并将处理后的ITD参数值以及对左右声道的信号进行例如下混处理而得到的单声道信号发送给解码端设备(或者说,接收端设备)。
解码端设备可以根据单声道音频信号和ITD参数值,恢复出立体声音频信号。
可选地,该方法还包括:
基于第二ITD参数,对该第一ITD参数进行平滑处理,其中,该第一ITD参数是第一时段的ITD参数,该第二ITD参数是第二时段的ITD参数的平滑值,该第二时段处于该第一时段之前。
具体地说,在本发明实施例中,在对ITD参数值进行量化处理等之前,编码端设备还可以对如上所述或缺的ITD参数值进行平滑处理,作为示例而非限定,编码端设备可以根据以下式5进行该平滑处理:
Tsm(k)=w1*Tsm [-1](k)+w2*T(k) 式5
其中,Tsm(k)表示第k个帧或第k个子帧所对应的平滑处理后的ITD参数值,Tsm [-1]表示第k-1个帧或第k-1个子帧所对应的平滑处理后的ITD参数值,T(k)表示第k个帧或第k个子帧所对应的未经平滑处理的ITD参数值,w1、w2为平滑因子,w1、w2可以设置为常数,或者w1、w2也可以根据Tsm [-1]和T(k)的差值设置,只要满足w1+w2=1即可。另外,当k=1时,Tsm [-1]可以为预设的数值。
需要说明的是,在本发明实施例的确定声道间时间差参数的方法中,上述平滑处理可以由编码端设备执行,也可以由解码端设备执行,本发明并未特别限定,即,编码端设备也可以不进行上述平滑处理而将如上所述获得的ITD参数值直接发送给解码端设备,并由解码端设备对该ITD参数值进行平滑处理,并且,该解码端设备所进行的平滑处理的方法和过程可以与上述解码端设备所进行的平滑处理的方法和过程相似,这里,为了避免赘述,省略其详细说明。
根据本发明实施例的确定声道间时间差参数的方法,通过从至少两个搜索复杂度中确定与当前信道质量相对应的目标搜索复杂度,并根据该目标搜索复杂度对对第一声道的信号及第二声道的信号进行搜索处理,能够使所确定的ITD参数的精度与信道质量相适应,从而,在当前信道质量较差的情况下,可以通过目标搜索复杂度,降低搜索处理的复杂度或计算量,进而,能够支持对计算资源的节约及对处理效率的提高。
上文中,结合图1至图4,详细描述了根据本发明实施例的确定声道间时间差参数的方法,下面,将结合图5,详细描述根据本发明实施例的根据本发明实施例的确定声道间时间差参数的装置。
图5示出了根据本发明实施例的确定声道间时间差参数的装置200的示意性框图。如图5所示,该装置200包括:
确定单元210,用于从至少两个搜索复杂度中,确定目标搜索复杂度,其中,该至少两个搜索复杂度与至少两个信道质量值一一相对应;
处理单元220,用于根据该目标搜索复杂度,对第一声道的信号及第二声道的信号进行搜索处理,以确定与该第一声道及该第二声道相对应的第一声道间时间差ITD参数。
可选地,该确定单元210具体用于获取针对立体声信号的编码参数,该立体声信号是基于该第一声道的信号及该第二声道的信号生成的,该编码参数是根据当前的信道质量值确定的,该编码参数包括以下任一参数:编码比特率、编码比特数或用于指示该搜索复杂度的复杂度控制参数;用于根据该编码参数,从至少两个搜索复杂度中,确定目标搜索复杂度。
可选地,该至少两个搜索复杂度与至少两个搜索步长一一对应,该至少两个搜索复杂度包括第一搜索复杂度和第二搜索复杂度,该至少两个搜索步长包括第一搜索步长和第二搜索步长,其中,与第一搜索复杂度相对应的第一搜索步长小于与第二搜索复杂度相对应的第二搜索步长,该第一搜索复杂度高于该第二搜索复杂度,以及该处理单元220具体用于确定与该目标搜索复杂度相对应的目标搜索步长;用于根据该目标搜索步长,对该第一声道的信号及该第二声道的信号进行搜索处理。
可选地,该至少两个搜索复杂度与至少两个搜索范围之间一一对应,其中,与第三搜索复杂度相对应的第一搜索范围大于与第四搜索复杂度相对应的第二搜索范围,该第三搜索复杂度高于该第四搜索复杂度,以及该处理单元220具体用于确定与该目标搜索复杂度相对应的目标搜索范围;用于在该目标搜索范围上,对该第一声道的信号及该第二声道的信号进行搜索处理。
可选地,该处理单元220具体用于根据该第一声道的时域信号及该第二声道的时域信号,确定基准参数,该基准参数对应于该第一声道的时域信号与该第二声道的时域信号之间的获取顺序,其中,该第一声道的时域信号及该第二声道的时域信号对应于同一时段;用于根据该目标搜索复杂度、该基准参数和极限值Tmax,确定该目标搜索范围,其中,该极限值Tmax是根据该第一声道的时域信号的采样率确定的,该目标搜索范围属于[-Tmax,0],或该目标搜索范围属于[0,Tmax]。
可选地,该处理单元220具体用于对该第一声道的时域信号及该第二声道的时域信号进行互相关处理,以确定第一互相关处理值及第二互相关处理值,其中,该第一互相关处理值是该第一声道的时域信号相对于该第二声道的时域信号的互相关函数在预设范围内的最大函数值,该第二互相关处理值是该第二声道的时域信号相对于该第一声道的时域信号的互相关函数在该预设范围内的最大函数值;用于根据该第一互相关处理值及该第二互相关处理值之间的大小关系,确定该基准参数。
可选地,该基准参数是该第一互相关处理值及该第二互相关处理值中较大一方所对应的索引值或者该索引值的相反数。
可选地,该处理单元220具体用于对该第一声道的时域信号及该第二声道的时域信号进行峰值检测处理,以确定第一索引值及第二索引值,其中,该第一索引值是与该第一声道的时域信号在预设范围内的最大幅度值相对应的索引值,该第二索引值是与该第二声道的时域信号在该预设范围内的最大幅度值相对应的索引值;用于根据该第一索引值与该第二索引值之间的大小关系,确定该基准参数。
可选地,该处理单元220还用于基于第二ITD参数,对该第一ITD参数进行平滑处理,其中,该第一ITD参数是第一时段的ITD参数,该第二ITD参数是第二时段的ITD参数的平滑值,该第二时段处于该第一时段之前。
根据本发明实施例的确定声道间时间差参数的装置200作为本发明实施例的确定声道间时间差参数的方法100的实施主体,可对应于本发明实施例的方法中的编码端设备,并且,该确定声道间时间差参数的装置200中的各单元及模块和上述其他操作和/或功能分别为了实现图1中的方法100的相应流程,为了简洁,在此不再赘述。
根据本发明实施例的确定声道间时间差参数的装置,通过从至少两个搜索复杂度中确定与当前信道质量相对应的目标搜索复杂度,并根据该目标搜索复杂度对对第一声道的信号及第二声道的信号进行搜索处理,能够使所确定的ITD参数的精度与信道质量相适应,从而,在当前信道质量较差的情况下,可以通过目标搜索复杂度,降低搜索处理的复杂度或计算量,进而,能够支持对计算资源的节约及对处理效率的提高。
上文中,结合图1至图4,详细描述了根据本发明实施例的确定声道间时间差参数的方法,下面,将结合图6,详细描述根据本发明实施例的确定声道间时间差参数的设备。
图6示出了根据本发明实施例的确定声道间时间差参数的设备300的示意性框图。如图6所示,该设备300可以包括:
总线310;
与该总线相连的处理器320;
与该总线相连的存储器330;
其中,该处理器320通过该总线310,调用该存储器330中存储的程序,以用于从至少两个搜索复杂度中,确定目标搜索复杂度,其中,该至少两个搜索复杂度与至少两个信道质量值一一相对应;
用于根据该目标搜索复杂度,对第一声道的信号及第二声道的信号进行搜索处理,以确定与该第一声道及该第二声道相对应的第一声道间时间差ITD参数。
可选地,该处理器320具体用于获取针对立体声信号的编码参数,该立体声信号是基于该第一声道的信号及该第二声道的信号生成的,该编码参数是根据当前的信道质量值确定的,该编码参数包括以下任一参数:编码比特率、编码比特数或用于指示该搜索复杂度的复杂度控制参数;
用于根据该编码参数,从至少两个搜索复杂度中,确定目标搜索复杂度。
可选地,该至少两个搜索复杂度与至少两个搜索步长一一对应,该至少两个搜索复杂度包括第一搜索复杂度和第二搜索复杂度,该至少两个搜索步长包括第一搜索步长和第二搜索步长,其中,与第一搜索复杂度相对应的第一搜索步长小于与第二搜索复杂度相对应的第二搜索步长,该第一搜索复杂度高于该第二搜索复杂度,以及
该处理器320具体用于确定与该目标搜索复杂度相对应的目标搜索步长;
用于根据该目标搜索步长,对该第一声道的信号及该第二声道的信号进行搜索处理。
可选地,该至少两个搜索复杂度与至少两个搜索范围一一对应,该至少两个搜索复杂度包括第三搜索复杂度和第四搜索复杂度,该至少两个搜索范围包括第一搜索范围和第二搜索范围,其中,与第三搜索复杂度相对应的第一搜索范围大于与第四搜索复杂度相对应的第二搜索范围,该第三搜索复杂度高于该第四搜索复杂度,以及
该处理器320具体用于确定与该目标搜索复杂度相对应的目标搜索范围;
用于在该目标搜索范围上,对该第一声道的信号及该第二声道的信号进行搜索处理。
可选地,该处理器320具体用于根据该第一声道的时域信号及该第二声道的时域信号,确定基准参数,该基准参数对应于该第一声道的时域信号与该第二声道的时域信号之间的获取顺序,其中,该第一声道的时域信号及该第二声道的时域信号对应于同一时段;
用于根据该目标搜索复杂度、该基准参数和极限值Tmax,确定该目标搜索范围,其中,该极限值Tmax是根据该第一声道的时域信号的采样率确定的,该目标搜索范围属于[-Tmax,0],或该目标搜索范围属于[0,Tmax]。
可选地,该处理器320具体用于对该第一声道的时域信号及该第二声道的时域信号进行互相关处理,以确定第一互相关处理值及第二互相关处理值,其中,该第一互相关处理值是该第一声道的时域信号相对于该第二声道的时域信号的互相关函数在预设范围内的最大函数值,该第二互相关处理值是该第二声道的时域信号相对于该第一声道的时域信号的互相关函数在该预设范围内的最大函数值;
用于根据该第一互相关处理值及该第二互相关处理值之间的大小关系,确定该基准参数。
可选地,该基准参数是该第一互相关处理值及该第二互相关处理值中较大一方所对应的索引值或者该索引值的相反数。
可选地,该处理器320具体用于对该第一声道的时域信号及该第二声道的时域信号进行峰值检测处理,以确定第一索引值及第二索引值,其中,该第一索引值是与该第一声道的时域信号在预设范围内的最大幅度值相对应的索引值,该第二索引值是与该第二声道的时域信号在该预设范围内的最大幅度值相对应的索引值;
用于根据该第一索引值与该第二索引值之间的大小关系,确定该基准参数。
可选地,该处理器320还用于基于第二ITD参数,对该第一ITD参数进行平滑处理,其中,该第一ITD参数是第一时段的ITD参数,该第二ITD参数是第二时段的ITD参数的平滑值,该第二时段处于该第一时段之前。
在本发明实施例中,设备300的各个组件通过总线310耦合在一起,其中,总线310除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚明起见,在图中将各种总线都标为总线310。
处理器320可以实现或者执行本发明方法实施例中的公开的各步骤及逻辑框图。处理器320可以是微处理器或者该处理器也可以是任何常规的处理器,解码器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用解码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器330,处理器读取存储器330中的信息,结合其硬件完成上述方法的步骤。
应理解,在本发明实施例中,该处理器320可以是中央处理单元(CentralProcessing Unit,简称为“CPU”),该处理器320还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器330可以包括只读存储器和随机存取存储器,并向处理器320提供指令和数据。存储器330的一部分还可以包括非易失性随机存取存储器。例如,存储器330还可以存储设备类型的信息。
在实现过程中,上述方法的各步骤可以通过处理器320中的硬件的集成逻辑电路或者软件形式的指令完成。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。
根据本发明实施例的确定声道间时间差参数的设备300作为本发明实施例的确定声道间时间差参数的方法100的实施主体,可对应于本发明实施例的方法中的编码端设备,并且,该确定声道间时间差参数的设备300中的各单元及模块和上述其他操作和/或功能分别为了实现图1中的方法100的相应流程,为了简洁,在此不再赘述。
根据本发明实施例的确定声道间时间差参数的设备,通过从至少两个搜索复杂度中确定与当前信道质量相对应的目标搜索复杂度,并根据该目标搜索复杂度对对第一声道的信号及第二声道的信号进行搜索处理,能够使所确定的ITD参数的精度与信道质量相适应,从而,在当前信道质量较差的情况下,可以通过目标搜索复杂度,降低搜索处理的复杂度或计算量,进而,能够支持对计算资源的节约及对处理效率的提高。
应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (18)

1.一种确定声道间时间差参数的方法,其特征在于,所述方法包括:
从至少两个搜索复杂度中,确定目标搜索复杂度,其中,所述至少两个搜索复杂度与至少两个信道质量值一一相对应;
根据所述目标搜索复杂度,对第一声道的信号及第二声道的信号进行搜索处理,以确定与所述第一声道及所述第二声道相对应的第一声道间时间差ITD参数。
2.根据权利要求1所述的方法,其特征在于,所述从至少两个搜索复杂度中,确定目标搜索复杂度,包括:
获取针对立体声信号的编码参数,所述立体声信号是基于所述第一声道的信号及所述第二声道的信号生成的,所述编码参数是根据当前的信道质量值确定的,所述编码参数包括以下任一参数:编码比特率、编码比特数或用于指示所述搜索复杂度的复杂度控制参数;
根据所述编码参数,从至少两个搜索复杂度中,确定目标搜索复杂度。
3.根据权利要求1或2所述的方法,其特征在于,所述至少两个搜索复杂度与至少两个搜索步长一一对应,所述至少两个搜索复杂度包括第一搜索复杂度和第二搜索复杂度,所述至少两个搜索步长包括第一搜索步长和第二搜索步长,其中,与第一搜索复杂度相对应的第一搜索步长小于与第二搜索复杂度相对应的第二搜索步长,所述第一搜索复杂度高于所述第二搜索复杂度,以及
所述根据所述目标搜索复杂度,对第一声道的信号及第二声道的信号进行搜索处理,包括:
确定与所述目标搜索复杂度相对应的目标搜索步长;
根据所述目标搜索步长,对所述第一声道的信号及所述第二声道的信号进行搜索处理。
4.根据权利要求1或2所述的方法,其特征在于,所述至少两个搜索复杂度与至少两个搜索范围一一对应,所述至少两个搜索复杂度包括第三搜索复杂度和第四搜索复杂度,所述至少两个搜索范围包括第一搜索范围和第二搜索范围,其中,与第三搜索复杂度相对应的第一搜索范围大于与第四搜索复杂度相对应的第二搜索范围,所述第三搜索复杂度高于所述第四搜索复杂度,以及
所述根据所述目标搜索复杂度,对第一声道的信号及第二声道的信号进行搜索处理,包括:
确定与所述目标搜索复杂度相对应的目标搜索范围;
在所述目标搜索范围上,对所述第一声道的信号及所述第二声道的信号进行搜索处理。
5.根据权利要求4所述的方法,其特征在于,所述确定与所述目标搜索复杂度相对应的目标搜索范围,包括:
根据所述第一声道的时域信号及所述第二声道的时域信号,确定基准参数,所述基准参数对应于所述第一声道的时域信号与所述第二声道的时域信号之间的获取顺序,其中,所述第一声道的时域信号及所述第二声道的时域信号对应于同一时段;
根据所述目标搜索复杂度、所述基准参数和极限值Tmax,确定所述目标搜索范围,其中,所述极限值Tmax是根据所述第一声道的时域信号的采样率确定的,所述目标搜索范围属于[-Tmax,0],或所述目标搜索范围属于[0,Tmax]。
6.根据权利要求5所述的方法,其特征在于,所述根据第一声道的时域信号及第二声道的时域信号,确定基准参数,包括:
对所述第一声道的时域信号及所述第二声道的时域信号进行互相关处理,以确定第一互相关处理值及第二互相关处理值,其中,所述第一互相关处理值是所述第一声道的时域信号相对于所述第二声道的时域信号的互相关函数在预设范围内的最大函数值,所述第二互相关处理值是所述第二声道的时域信号相对于所述第一声道的时域信号的互相关函数在所述预设范围内的最大函数值;
根据所述第一互相关处理值及所述第二互相关处理值之间的大小关系,确定所述基准参数。
7.根据权利要求6所述的方法,其特征在于,所述基准参数是所述第一互相关处理值及所述第二互相关处理值中较大一方所对应的索引值或者所述索引值的相反数。
8.根据权利要求5所述的方法,其特征在于,所述根据第一声道的时域信号及第二声道的时域信号,确定基准参数,包括:
对所述第一声道的时域信号及所述第二声道的时域信号进行峰值检测处理,以确定第一索引值及第二索引值,其中,所述第一索引值是与所述第一声道的时域信号在预设范围内的最大幅度值相对应的索引值,所述第二索引值是与所述第二声道的时域信号在所述预设范围内的最大幅度值相对应的索引值;
根据所述第一索引值与所述第二索引值之间的大小关系,确定所述基准参数。
9.根据权利要求1至8中任一项所述的方法,其特征在于,所述方法还包括:
基于第二ITD参数,对所述第一ITD参数进行平滑处理,其中,所述第一ITD参数是第一时段的ITD参数,所述第二ITD参数是第二时段的ITD参数的平滑值,所述第二时段处于所述第一时段之前。
10.一种确定声道间时间差参数的装置,其特征在于,所述装置包括:
确定单元,用于从至少两个搜索复杂度中,确定目标搜索复杂度,其中,所述至少两个搜索复杂度与至少两个信道质量值一一相对应;
处理单元,用于根据所述目标搜索复杂度,对第一声道的信号及第二声道的信号进行搜索处理,以确定与所述第一声道及所述第二声道相对应的第一声道间时间差ITD参数。
11.根据权利要求10所述的装置,其特征在于,所述确定单元具体用于获取针对立体声信号的编码参数,所述立体声信号是基于所述第一声道的信号及所述第二声道的信号生成的,所述编码参数是根据当前的信道质量值确定的,所述编码参数包括以下任一参数:编码比特率、编码比特数或用于指示所述搜索复杂度的复杂度控制参数;
用于根据所述编码参数,从至少两个搜索复杂度中,确定目标搜索复杂度。
12.根据权利要求10或11所述的装置,其特征在于,所述至少两个搜索复杂度与至少两个搜索步长一一对应,所述至少两个搜索复杂度包括第一搜索复杂度和第二搜索复杂度,所述至少两个搜索步长包括第一搜索步长和第二搜索步长,其中,与第一搜索复杂度相对应的第一搜索步长小于与第二搜索复杂度相对应的第二搜索步长,所述第一搜索复杂度高于所述第二搜索复杂度,以及
所述处理单元具体用于确定与所述目标搜索复杂度相对应的目标搜索步长;
用于根据所述目标搜索步长,对所述第一声道的信号及所述第二声道的信号进行搜索处理。
13.根据权利要求10或11所述的装置,其特征在于,所述至少两个搜索复杂度与至少两个搜索范围之间一一对应,其中,与第三搜索复杂度相对应的第一搜索范围大于与第四搜索复杂度相对应的第二搜索范围,所述第三搜索复杂度高于所述第四搜索复杂度,以及
所述处理单元具体用于确定与所述目标搜索复杂度相对应的目标搜索范围;
用于在所述目标搜索范围上,对所述第一声道的信号及所述第二声道的信号进行搜索处理。
14.根据权利要求13所述的装置,其特征在于,所述处理单元具体用于根据所述第一声道的时域信号及所述第二声道的时域信号,确定基准参数,所述基准参数对应于所述第一声道的时域信号与所述第二声道的时域信号之间的获取顺序,其中,所述第一声道的时域信号及所述第二声道的时域信号对应于同一时段;
根据所述目标搜索复杂度、所述基准参数和极限值Tmax,确定所述目标搜索范围,其中,所述极限值Tmax是根据所述第一声道的时域信号的采样率确定的,所述目标搜索范围属于[-Tmax,0],或所述目标搜索范围属于[0,Tmax]。
15.根据权利要求14所述的装置,其特征在于,所述处理单元具体用于对所述第一声道的时域信号及所述第二声道的时域信号进行互相关处理,以确定第一互相关处理值及第二互相关处理值,其中,所述第一互相关处理值是所述第一声道的时域信号相对于所述第二声道的时域信号的互相关函数在预设范围内的最大函数值,所述第二互相关处理值是所述第二声道的时域信号相对于所述第一声道的时域信号的互相关函数在所述预设范围内的最大函数值;
用于根据所述第一互相关处理值及所述第二互相关处理值之间的大小关系,确定所述基准参数。
16.根据权利要求15所述的装置,其特征在于,所述基准参数是所述第一互相关处理值及所述第二互相关处理值中较大一方所对应的索引值或者所述索引值的相反数。
17.根据权利要求14所述的装置,其特征在于,所述处理单元具体用于对所述第一声道的时域信号及所述第二声道的时域信号进行峰值检测处理,以确定第一索引值及第二索引值,其中,所述第一索引值是与所述第一声道的时域信号在预设范围内的最大幅度值相对应的索引值,所述第二索引值是与所述第二声道的时域信号在所述预设范围内的最大幅度值相对应的索引值;
用于根据所述第一索引值与所述第二索引值之间的大小关系,确定所述基准参数。
18.根据权利要求10至17中任一项所述的装置,其特征在于,所述处理单元还用于基于第二ITD参数,对所述第一ITD参数进行平滑处理,其中,所述第一ITD参数是第一时段的ITD参数,所述第二ITD参数是第二时段的ITD参数的平滑值,所述第二时段处于所述第一时段之前。
CN201510103379.3A 2015-03-09 2015-03-09 确定声道间时间差参数的方法和装置 Active CN106033672B (zh)

Priority Applications (12)

Application Number Priority Date Filing Date Title
CN201510103379.3A CN106033672B (zh) 2015-03-09 2015-03-09 确定声道间时间差参数的方法和装置
MX2017011466A MX2017011466A (es) 2015-03-09 2015-11-20 Metodo y aparato para determinar parametro de diferencia de tiempo inter-canal.
KR1020177025506A KR20170116132A (ko) 2015-03-09 2015-11-20 채널 간 시차 파라미터를 결정하는 방법 및 장치
CA2977843A CA2977843A1 (en) 2015-03-09 2015-11-20 Method and apparatus for determining inter-channel time difference parameter
JP2017547578A JP2018508047A (ja) 2015-03-09 2015-11-20 チャネル間時間差パラメータを決定するための方法および装置
SG11201706997PA SG11201706997PA (en) 2015-03-09 2015-11-20 Method and apparatus for determining inter-channel time difference parameter
EP15884409.2A EP3255632B1 (en) 2015-03-09 2015-11-20 Method and apparatus for determining time difference parameter among sound channels
BR112017018819-8A BR112017018819A2 (zh) 2015-03-09 2015-11-20 Method and apparatus for determining the time difference between the channel parameters
RU2017134756A RU2682026C1 (ru) 2015-03-09 2015-11-20 Способ и устройство для определения параметра межканальной разности времени
PCT/CN2015/095090 WO2016141731A1 (zh) 2015-03-09 2015-11-20 确定声道间时间差参数的方法和装置
AU2015385489A AU2015385489B2 (en) 2015-03-09 2015-11-20 Method and apparatus for determining inter-channel time difference parameter
US15/696,716 US10388288B2 (en) 2015-03-09 2017-09-06 Method and apparatus for determining inter-channel time difference parameter

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510103379.3A CN106033672B (zh) 2015-03-09 2015-03-09 确定声道间时间差参数的方法和装置

Publications (2)

Publication Number Publication Date
CN106033672A true CN106033672A (zh) 2016-10-19
CN106033672B CN106033672B (zh) 2021-04-09

Family

ID=56879889

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510103379.3A Active CN106033672B (zh) 2015-03-09 2015-03-09 确定声道间时间差参数的方法和装置

Country Status (12)

Country Link
US (1) US10388288B2 (zh)
EP (1) EP3255632B1 (zh)
JP (1) JP2018508047A (zh)
KR (1) KR20170116132A (zh)
CN (1) CN106033672B (zh)
AU (1) AU2015385489B2 (zh)
BR (1) BR112017018819A2 (zh)
CA (1) CA2977843A1 (zh)
MX (1) MX2017011466A (zh)
RU (1) RU2682026C1 (zh)
SG (1) SG11201706997PA (zh)
WO (1) WO2016141731A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106033671B (zh) 2015-03-09 2020-11-06 华为技术有限公司 确定声道间时间差参数的方法和装置
CN109215667B (zh) * 2017-06-29 2020-12-22 华为技术有限公司 时延估计方法及装置
KR20210072736A (ko) * 2018-10-08 2021-06-17 돌비 레버러토리즈 라이쎈싱 코오포레이션 인코딩 및 디코딩 동작을 단순화하기 위해 상이한 포맷으로 캡처된 오디오 신호들을 축소된 수의 포맷으로 변환하는 것

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101408615A (zh) * 2008-11-26 2009-04-15 武汉大学 双耳时间差itd临界感知特性的测量方法及其装置
WO2009081567A1 (ja) * 2007-12-21 2009-07-02 Panasonic Corporation ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法
CN101533641A (zh) * 2009-04-20 2009-09-16 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法和装置
US20100014560A1 (en) * 2008-07-21 2010-01-21 SUNGKYUNKWAN UNIVESRITY Foundation for Corporate Collaboration Methods of synchronizing with first multipath component in ultra wideband receiver and ultra wideband receivers using the same
CN102307323A (zh) * 2009-04-20 2012-01-04 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法
WO2012105886A1 (en) * 2011-02-03 2012-08-09 Telefonaktiebolaget L M Ericsson (Publ) Determining the inter-channel time difference of a multi-channel audio signal
CN103403800A (zh) * 2011-02-02 2013-11-20 瑞典爱立信有限公司 确定多声道音频信号的声道间时间差
WO2014174344A1 (en) * 2013-04-26 2014-10-30 Nokia Corporation Audio signal encoder
CN104205211A (zh) * 2012-04-05 2014-12-10 华为技术有限公司 多声道音频编码器以及用于对多声道音频信号进行编码的方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0669811A (ja) * 1992-08-21 1994-03-11 Oki Electric Ind Co Ltd 符号化回路及び復号化回路
FI980132A (fi) * 1998-01-21 1999-07-22 Nokia Mobile Phones Ltd Adaptoituva jälkisuodatin
TW376611B (en) 1998-05-26 1999-12-11 Koninkl Philips Electronics Nv Transmission system with improved speech encoder
WO2003107591A1 (en) * 2002-06-14 2003-12-24 Nokia Corporation Enhanced error concealment for spatial audio
CN1820306B (zh) * 2003-05-01 2010-05-05 诺基亚有限公司 可变比特率宽带语音编码中增益量化的方法和装置
SE0402372D0 (sv) 2004-09-30 2004-09-30 Ericsson Telefon Ab L M Signal coding
US8077893B2 (en) * 2007-05-31 2011-12-13 Ecole Polytechnique Federale De Lausanne Distributed audio coding for wireless hearing aids
GB2453117B (en) 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
WO2010037427A1 (en) * 2008-10-03 2010-04-08 Nokia Corporation Apparatus for binaural audio coding
CN102422347B (zh) * 2009-05-20 2013-07-03 松下电器产业株式会社 编码装置、解码装置及编码和解码方法
KR101615262B1 (ko) * 2009-08-12 2016-04-26 삼성전자주식회사 시멘틱 정보를 이용한 멀티 채널 오디오 인코딩 및 디코딩 방법 및 장치
US8463414B2 (en) * 2010-08-09 2013-06-11 Motorola Mobility Llc Method and apparatus for estimating a parameter for low bit rate stereo transmission
JP5947971B2 (ja) * 2012-04-05 2016-07-06 華為技術有限公司Huawei Technologies Co.,Ltd. マルチチャネルオーディオ信号の符号化パラメータを決定する方法及びマルチチャネルオーディオエンコーダ
CN103534753B (zh) * 2012-04-05 2015-05-27 华为技术有限公司 用于信道间差估计的方法和空间音频编码装置
CN106033671B (zh) * 2015-03-09 2020-11-06 华为技术有限公司 确定声道间时间差参数的方法和装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009081567A1 (ja) * 2007-12-21 2009-07-02 Panasonic Corporation ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法
US20100014560A1 (en) * 2008-07-21 2010-01-21 SUNGKYUNKWAN UNIVESRITY Foundation for Corporate Collaboration Methods of synchronizing with first multipath component in ultra wideband receiver and ultra wideband receivers using the same
CN101408615A (zh) * 2008-11-26 2009-04-15 武汉大学 双耳时间差itd临界感知特性的测量方法及其装置
CN101533641A (zh) * 2009-04-20 2009-09-16 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法和装置
CN102307323A (zh) * 2009-04-20 2012-01-04 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法
CN103403800A (zh) * 2011-02-02 2013-11-20 瑞典爱立信有限公司 确定多声道音频信号的声道间时间差
WO2012105886A1 (en) * 2011-02-03 2012-08-09 Telefonaktiebolaget L M Ericsson (Publ) Determining the inter-channel time difference of a multi-channel audio signal
CN103339670A (zh) * 2011-02-03 2013-10-02 瑞典爱立信有限公司 确定多通道音频信号的通道间时间差
CN104205211A (zh) * 2012-04-05 2014-12-10 华为技术有限公司 多声道音频编码器以及用于对多声道音频信号进行编码的方法
WO2014174344A1 (en) * 2013-04-26 2014-10-30 Nokia Corporation Audio signal encoder

Also Published As

Publication number Publication date
BR112017018819A2 (zh) 2018-04-24
EP3255632A4 (en) 2017-12-13
AU2015385489A1 (en) 2017-09-28
MX2017011466A (es) 2018-01-11
EP3255632B1 (en) 2020-01-08
RU2682026C1 (ru) 2019-03-14
KR20170116132A (ko) 2017-10-18
US10388288B2 (en) 2019-08-20
CA2977843A1 (en) 2016-09-15
AU2015385489B2 (en) 2019-04-04
CN106033672B (zh) 2021-04-09
US20170365265A1 (en) 2017-12-21
SG11201706997PA (en) 2017-09-28
JP2018508047A (ja) 2018-03-22
WO2016141731A1 (zh) 2016-09-15
EP3255632A1 (en) 2017-12-13

Similar Documents

Publication Publication Date Title
US9986365B2 (en) Audio signal processing method and device
CN103403800B (zh) 确定多声道音频信号的声道间时间差
JP5281169B2 (ja) 過渡信号符号化方法及び装置、復号化方法及び装置、並びに処理システム
KR101670313B1 (ko) 음원 분리를 위해 자동적으로 문턱치를 선택하는 신호 분리 시스템 및 방법
CN106033671A (zh) 确定声道间时间差参数的方法和装置
CN105659630A (zh) 用于处理多媒体信号的方法和设备
CN102157152A (zh) 立体声编码的方法、装置
CN101488344B (zh) 一种量化噪声泄漏控制方法及装置
CN101933086A (zh) 处理音频信号的方法和设备
CN103262158B (zh) 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
CN107731238A (zh) 多声道信号的编码方法和编码器
CN109389989A (zh) 混音方法、装置、设备及存储介质
CN106033672A (zh) 确定声道间时间差参数的方法和装置
CN103443854A (zh) 用于混合来自两个编码位流的音频节目的元数据的自动配置
Ma et al. Implementation of an intelligent equalization tool using Yule-Walker for music mixing and mastering
CN104616665B (zh) 基于语音类似度的混音方法
Choi et al. Objective measurement of perceived auditory quality in multichannel audio compression coding systems
CN109800724A (zh) 一种扬声器位置确定方法、装置、终端及存储介质
US20230245671A1 (en) Methods, apparatus, and systems for detection and extraction of spatially-identifiable subband audio sources
US20200314580A1 (en) Method and apparatus for voice or sound activity detection for spatial audio
CN105720939B (zh) 一种音频数据的处理方法和电子设备
CN101499280A (zh) 基于空间感知熵判决的空间参数选取方法及其装置
CN103366748A (zh) 立体声编码的方法、装置
CN104299615A (zh) 一种声道间电平差处理方法及装置
Wang et al. Just noticeable difference of interaural level difference to frequency and interaural level difference

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant