CN105720939A - 一种音频数据的处理方法和电子设备 - Google Patents

一种音频数据的处理方法和电子设备 Download PDF

Info

Publication number
CN105720939A
CN105720939A CN201610113292.9A CN201610113292A CN105720939A CN 105720939 A CN105720939 A CN 105720939A CN 201610113292 A CN201610113292 A CN 201610113292A CN 105720939 A CN105720939 A CN 105720939A
Authority
CN
China
Prior art keywords
energy parameter
voice data
played
harmony
audio data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610113292.9A
Other languages
English (en)
Other versions
CN105720939B (zh
Inventor
金明宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201610113292.9A priority Critical patent/CN105720939B/zh
Publication of CN105720939A publication Critical patent/CN105720939A/zh
Application granted granted Critical
Publication of CN105720939B publication Critical patent/CN105720939B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/16Automatic control
    • H03G5/165Equalizers; Volume or gain control in limited frequency bands

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种音频数据的处理方法和电子设备,方法包括:获取待播放音频数据;确定一段时间内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件;若否,调节所述一段时间内所述待播放音频数据的均衡性;由此可见,本发明能够自动调整均衡性差的双声道音频数据的均衡性,以改善其播放效果,提高了用户体验。

Description

一种音频数据的处理方法和电子设备
技术领域
本发明涉及音量处理技术领域,更具体的说是涉及一种音频数据的方法和电子设备。
背景技术
为了增强音频数据的立体感,现有的音频数据一般为双声道音频数据。双声道音频数据为具有两个声道的音频数据,具体的,通过使用两个采集设备对音频数据进行采集,能够录制到双声道音频数据。而在录制过程中,如果其中一个采集设备预先没有调制好,那么则会导致两个声道所录制的音频数据不均衡。在播放该音频数据时,听众就会感觉不舒服,如听众听到左声道的声音正常,而右声道的声音很小。
现有的用于播放音频数据的电子设备中,有些电子设备具备改善上述情况的功能,如具有Windows系统的电子设备,用户可以在喇叭属性或耳机属性里选择不同的音效以改善听觉效果;但是这种情况操作步骤繁琐,用户体验差。且绝大多数的电子设备均不具备改变听觉效果的功能,如手机。
因此,针对均衡性差的双声道音频数据,如何改善其播放效果且简化用户操作成为本领域技术人员亟待克服的技术难题。
发明内容
有鉴于此,本发明提供一种音频数据的处理方法,以改善均衡性差的双声道音频数据的播放效果且简化用户操作。
为实现上述目的,本发明提供如下技术方案:
一种音频数据的处理方法,该方法包括:
获取待播放音频数据;
确定一段时间内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;
基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件;
若否,调节所述一段时间内所述待播放音频数据的均衡性。
优选的,所述基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件,包括:
基于所述第一能量参数和所述第二能量参数计算所述一段时间内的待播放音频数据的总能量参数;
当确定所述第一能量参数和所述第二能量参数中,任一能量参数与所述总能量参数的比值达到预设的第一阈值时,确定所述待播放音频数据的均衡性不满足预设条件;
当确定所述第一能量参数与所述总能量参数的比值以及所述第二能量参数与所述总能量参数的比值均小于所述第一阈值时,确定所述待播放音频数据的均衡性满足预设条件。
优选的,所述基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件,包括:
确定所述第一能量参数与所述第二能量参数的差值;
计算所述差值与任一能量参数的比值;
当所述比值达到预设的第二阈值时,确定所述待播放音频数据的均衡性不满足预设条件;
当所述比值小于所述第二阈值时,确定所述待播放音频数据的均衡性满足预设条件。
优选的,所述调节所述一段时间内所述待播放音频数据的均衡性,包括:
复制所述第一声道音频数据和所述第二声道音频数据中能量参数较大的声道音频数据;
将所复制的声道音频数据混合到能量参数小的声道中。
优选的,在将所复制的声道音频数据混合到能量参数小的声道的过程中,为所复制的声道音频数据加上预设的时间偏置。
优选的,所述将所复制的声道音频数据混合到能量参数小的声道中之前,还包括:
将所述能量参数小的声道音频数据的能量参数缩小;
所述将所复制的声道音频数据混合到能量参数小的声道中,具体为:将所述复制的声道音频数据混合到能量参数缩小后的声道中;
其中,缩小的幅度用于使得混合后的待播放音频数据的均衡性满足所述预设条件。
优选的,所述将所复制的声道音频数据混合到能量参数小的声道中之后,还包括:
判断混合后的待播放音频数据的均衡性是否满足所述预设条件;
若否,则将混合后的声道音频数据的能量参数缩小,以使得能量参数缩小后的待播放音频数据的均衡性满足所述预设条件。
优选的,所述确定一段时间内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数之前,还包括:
检测所述待播放音频数据所属场景类型;
所述确定一段时间内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数,具体为:
若所述待播放音频数据属于第一场景类型,确定第一时间长度内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;
若所述待播放音频数据属于第二场景类型,确定第二时间长度内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;
其中,所述第一时间长度小于所述第二时间长度。
一种电子设备,包括:
获取数据单元,用于获取待播放音频数据;
确定参数单元,用于确定一段时间内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;
第一判断单元,用于基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件;
第一调节单元,用于在确定所述待播放音频数据的均衡性不满足所述预设条件时,调节所述一段时间内所述待播放音频数据的均衡性。
优选的,所述第一判断单元,包括:
第一计算模块,用于基于所述第一能量参数和所述第二能量参数计算所述一段时间内的待播放音频数据的总能量参数;
第一确定模块,用于当确定所述第一能量参数和所述第二能量参数中,任一能量参数与所述总能量参数的比值达到预设的第一阈值时,确定所述待播放音频数据的均衡性不满足预设条件;
第二确定模块,用于当确定所述第一能量参数与所述总能量参数的比值以及所述第二能量参数与所述总能量参数的比值均小于所述第一阈值时,确定所述待播放音频数据的均衡性满足预设条件。
优选的,所述第一判断单元,包括:
确定差值模块,用于确定所述第一能量参数与所述第二能量参数的差值;
第二计算模块,用于计算所述差值与任一能量参数的比值;
第三确定模块,用于当所述比值达到预设的第二阈值时,确定所述待播放音频数据的均衡性不满足预设条件;
第四确定模块,用于当所述比值小于所述第二阈值时,确定所述待播放音频数据的均衡性满足预设条件。
优选的,所述第一调节单元,包括:
复制数据模块,用于在确定所述待播放音频数据的均衡性不满足所述预设条件时,复制所述第一声道音频数据和所述第二声道音频数据中能量参数较大的声道音频数据;
混合数据模块,用于将所复制的声道音频数据混合到能量参数小的声道中。
优选的,所述混合数据模块具体用于在将所复制的声道音频数据混合到能量参数小的声道的过程中,为所复制的声道音频数据加上预设的时间偏置。
优选的,所述第一调节单元还包括:
第一缩小模块,用于将所述能量参数小的声道音频数据的能量参数缩小;
相应的,所述混合数据模块具体用于将所述复制的声道音频数据混合到能量参数缩小后的声道中;
其中,缩小的幅度用于使得混合后的待播放音频数据的均衡性满足所述预设条件。
优选的,所述第一调节单元还包括:
第一判断模块,用于判断混合后的待播放音频数据的均衡性是否满足所述预设条件;
第二缩小模块,用于在确定混合后的待播放音频数据的均衡性未满足所述预设条件时,将混合后的声道音频数据的能量参数缩小,以使得能量参数缩小后的待播放音频数据的均衡性满足所述预设条件。
优选的,还包括:
检测类型单元,用于检测所述待播放音频数据所属场景类型;
相应的,所述确定参数单元具体用于若所述待播放音频数据属于第一场景类型,确定第一时间长度内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;若所述待播放音频数据属于第二场景类型,确定第二时间长度内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;
其中,所述第一时间长度小于所述第二时间长度。
经由上述的技术方案可知,与现有技术相比,本发明实施例公开了一种音频数据的处理方法,具体的,获取到待播放音频数据,确定一段时间内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数,并基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件,如果确定待播放音频数据的均衡性不满足预设条件,则调节一段时间内的待播放音频数据的均衡性,由此可见,本发明能够自动调整均衡性差的双声道音频数据的均衡性,以改善其播放效果,提高了用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例一公开的一种音频数据的处理方法的流程示意图;
图2为本发明实施例二公开的基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件的一种实现方式的流程示意图;
图3为本发明实施例二公开的基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件的另一种实现方式的流程示意图;
图4为本发明实施例四公开的一种音频数据的处理方法的流程示意图;
图5为本发明实施例五公开的一种音频数据的处理方法的流程示意图;
图6为本发明实施例六公开的一种音频数据的处理方法的流程示意图;
图7为本发明实施例七公开的一种电子设备的结构示意图;
图8为本发明实施例八公开的第一判断单元的一种实现方式的结构示意图;
图9为本发明实施例八公开的第一判断单元的另一种实现方式的结构示意图;
图10为本发明实施例十公开的第一调节单元的结构示意图;
图11为本发明实施例十一公开的第一调节单元的结构示意图;
图12为本发明实施十二公开的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例一公开了一种音频数据的处理方法,如图1所示,该方法包括以下过程:
步骤101:获取待播放音频数据;
需说明的是,本发明的公开的音频数据的处理方法可以应用于如手机、平板电脑、笔记本电脑等各种电子设备中,当接收到音频播放指令时,可以获取待播放音频数据,具体的可以从本地获取也可以从网络上获取。
步骤102:确定一段时间内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;
其中,为了确定待播放音频数据的播放效果,可以对双声道音频数据的均衡性进行检测,那么,在获取待播放音频数据后,可以先检测该待播放音频数据是否为双声道音频数据,如果是,则确定一段时间内的待播放音频数据的第一声道音频数据的第一能量参数和第二声道音频数据的第二能量参数。
需说明的是,“一段时间”可以根据实际情况进行设定,本发明不做限定,如一段时间可以为1分钟,那么,则确定1分钟内的待播放音频数据的第一声道音频数据的第一能量参数和第二声道音频数据的第二能量参数。
第一声道音频数据为左声道音频数据,相应的,第二声道音频数据则为右声道音频数据;第一声道音频数据为右声道音频数据,相应的,第二声道音频数据则为左声道音频数据。
在本发明中,能量参数用于反应待播放音频数据的声音强度,具体可以由待播放音频数据的声音振幅来表示,作为一种计算方式,能量参数En可以由如下公式表示:
E n = Σ m = n n + N - 1 x w 2 ( m )
其中,N为短时取样窗口的长度,xw(n)为原信号x(n)经过加窗处理后的信号,x(n)为原信号的幅度。
当然本发明并不仅限于这一种方式,对于其他确定能量参数的实现方式均在本发明的保护范围之内。
步骤103:基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件;
在本发明中,预设条件为判断待播放音频数据是否均衡的标准,可以有多种实现方式,后文会详细说明。
步骤104:当确定所述待播放音频数据的均衡性不满足所述预设条件时,调节所述一段时间内的所述待播放音频数据的均衡性。
而当确定待播放音频数据的均衡性满足所述预设条件时,则无需调节所述一段时间内的所述待播放音频数据均衡性。
需说明的是,可以将待播放音频数据以所述一段时间为单位划分为多段,当对第一段所述一段时间的音频数据的均衡性处理完毕后,可以针对下一段的所述一段时间的待播放音频数据的均衡性再次进行检测和调节,直至处理完所有时段的待播放音频数据。当然,在本发明中,也可以在获取待播放音频数据时就以所述一段时间为单位进行获取,即步骤101中,获取待播放音频数据具体为,获取所述一段时间的待播放音频数据,当针对该段时间的待播放音频数据的均衡性处理完毕后,再获取下一段时间的待播放音频数据,依次类推。
由此可见,在本实施例中,能够自动调整均衡性差的双声道音频数据的均衡性,以改善其播放效果,提高了用户体验。
本发明实施例二公开了一种音频数据的处理方法,以描述基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件的两种不同实现方式,具体的:
作为一种实现方式,如图2所示,基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件,包括以下步骤:
步骤201:基于所述第一能量参数和所述第二能量参数计算所述一段时间内的待播放音频数据的总能量参数;
即总能量参数为第一能量参数和第二能量参数之和。
步骤202:当确定所述第一能量参数和所述第二能量参数中,任一能量参数与所述总能量参数的比值达到预设的第一阈值时,确定所述待播放音频数据的均衡性不满足预设条件;
其中,第一阈值可以根据实际情况进行设定,本发明不做限定。如,如果某一能量参数与总能量参数的比值达到80%,则可以确定待播放音频数据的均衡性不满足预设条件。
步骤203:当确定所述第一能量参数与所述总能量参数的比值以及所述第二能量参数与所述总能量参数的比值均小于所述第一阈值时,确定所述待播放音频数据的均衡性满足预设条件。
需说明的是,由于获取的是一段时间内的待播放音频数据的不同声道的能量参数,因此,所确定的也是所述一段时间内的待播放音频数据的均衡性是否满足预设条件。
作为另一种实现方式,如图3所示,基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件,包括以下步骤:
步骤301:确定所述第一能量参数与所述第二能量参数的差值;
该差值可以为第一能量参数和第二能量参数的差的绝对值。
步骤302:计算所述差值与任一能量参数的比值;
步骤303:当所述比值达到预设的第二阈值时,确定所述待播放音频数据的均衡性不满足预设条件;
其中,第一阈值可以根据实际情况进行设定,本发明不做限定。
步骤304:当所述比值小于所述第二阈值时,确定所述待播放音频数据的均衡性满足预设条件。
需说明的是,由于获取的是一段时间内的待播放音频数据的不同声道的能量参数,因此,所确定的也是所述一段时间内的待播放音频数据的均衡性是否满足预设条件。
本发明实施例三公开了一种音频数据的处理方法,以在实施例二所介绍的两种实现方式的基础上,描述如何调节一段时间内的待播放音频数据的均衡性,具体的包括以下过程:
首先,复制所述第一声道音频数据和所述第二声道音频数据中能量参数较大的声道音频数据;
其中,通过前文的描述可以确定当第一声道音频数据的能量参数和第二声道音频数据的能量参数具有一定差别时,待播放音频数据的均衡性不满足预设条件时,在这种情况下,确定第一声道音频数据和第二声道音频数据中能量参数较大的声道音频数据,并复制。
其次,将所复制的声道音频数据混合到能量参数小的声道中。
进一步的,为了模拟输出双声道效果,可以在将所复制的声道音频数据混合到能量参数小的声道的过程中,为所复制的声道音频数据加上预设的时间偏置。该时间偏置为一微小的时间偏置即可,具体数值可以根据实际情况预先设定。
在实际应用中,当将能量参数较大的声道音频数据混合到能量参数较小的声道中后,可能会出现混合后的声道音频数据的能量参数增大较多,使得两个声道的音频数据的能量参数相差较大,混合后的音频数据又不均衡的现象,基于该问题,本发明实施例四和实施例五公开了一种音频数据的处理方法,以保证混合后的待播放音频数据的均衡性。
具体的,在实施例四中,如图4所示,该方法包括以下过程:
步骤401:获取待播放音频数据;
步骤402:确定一段时间内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;
步骤403:基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件;
步骤404:当确定所述待播放音频数据的均衡性不满足预设条件时,复制所述第一声道音频数据和所述第二声道音频数据中能量参数较大的声道音频数据;
步骤405:将所述能量参数小的声道音频数据的能量参数缩小;
其中,在将能量参数下的声道音频数据的能量参数缩小之前,可以先基于第一能量参数和第二能量参数判断如果将能量参数大的声道音频数据混合到能量参数小的声道中后,混合后的音频数据的均衡性是否满足预设条件,若是则确定将能量参数小的声道音频数据的能量参数缩小多少才能够保证混合后的音频数据的均衡性满足预设条件,即确定缩小的幅度,从而基于该缩小的幅度将能量参数小的声道音频数据的能量参数缩小。也就是说,缩小的幅度能够用于使得混合后的待播放音频数据的均衡性满足所述预设条件。
需说明的是,如果预先判断如果将能量参数大的声道音频数据混合到能量参数小的声道中后,混合后的音频数据的均衡性满足预设条件,那么,则可以不对能量参数下的声道音频数据的能量参数进行缩小,作为一种实现方式,该缩小的幅度可以为0。
步骤406:将所复制的声道音频数据混合到能量参数缩小后的声道中。
在本实施例中,由于在混合之前预先确定了通过将能量参数下的声道音频数据的能量参数缩小后,能够使得混合后的音频数据的均衡性满足预设条件,因此,在将复制的声道音频数据混合到能量参数缩小后的声道中后,能够确保混合后的音频数据的播放效果。
在实施例五中,如图5所示,该方法包括以下过程:
步骤501:获取待播放音频数据;
步骤502:确定一段时间内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;
步骤503:基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件;
步骤504:当确定所述待播放音频数据的均衡性不满足预设条件时,复制所述第一声道音频数据和所述第二声道音频数据中能量参数较大的声道音频数据;
步骤505:将所复制的声道音频数据混合到能量参数小的声道中;
步骤506:判断混合后的待播放音频数据的均衡性是否满足所述预设条件;
其中,判断混合后的待播放音频数据的均衡性是否满足所述预设条件的实现方式可以参考上述实施例二,此处不再详细说明。
步骤507:当确定混合后的待播放音频数据的均衡性不满足所述预设条件时,则将混合后的声道音频数据的能量参数缩小,以使得能量参数缩小后的待播放音频数据的均衡性满足所述预设条件。
在本实施例中,通过缩小混合后的声道音频数据的能量参数,能够保证混合后的音频数据的播放效果。
本发明实施例六公开了一种音频数据的处理方法,如图6所示,该方法包括以下步骤:
步骤601:获取待播放音频数据;
步骤602:检测所述待播放音频数据所属场景类型;
其中,不同的场景类型对待播放音频数据的能量参数的要求并不相同,例如,如果待播放音频数据中人声占主要部分,则确定待播放音频数据属于人声场景类型,而在人声场景类型下,待播放音频数据的均衡性的好坏对播放效果影响较大。而如果待播放音频数据中人声未占主要部分,则能够确定待播放音频数据属于非人声场景类型,如属于音乐场景类型,而在音乐场景类型下,针对待播放音频数据的有些时段而言,可能需要使得两个声道的能量参数相差较大,但是,这种时段的时间长度一般不会太长。因此,可以通过检测待播放音频数据所属场景类型,以确定获取能量参数的时间长度。
检测待播放音频数据所属场景类型的实现方式有多种,一种方式,可以采集待播放音频数据的频率,通过频率来判断待播放音频数据所属场景类型,例如,人的声音的频域带宽为0.3kHz~5kHz,而音乐的频域带宽相对较大,可以达到22kHz。另一种方式,可以采集待播放音频数据的子带能量比,不同类型的音频能量在各个子带的分布不同,例如音乐在各个子带均匀分布,而人声的音频能量主要集中在第一个子带上,一般占80%。再一种方式,可以确定待播放音频数据的过零率,一般情况下,人声的音频信号的过零率要比音乐的过零率剧烈。
需说明的是,人声场景类型和音乐场景类型仅是待播放音频数据的两种具体类型,本发明并不局限于此。
步骤603:若所述待播放音频数据属于第一场景类型,确定第一时间长度内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;
步骤604:若所述待播放音频数据属于第二场景类型,确定第二时间长度内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;
其中,第一场景类型可以对应于人声场景类型,第二场景类型可以对应于非人声场景类型,如音乐场景类型,由于人声场景类型中音频数据的均衡性对播放效果影响较大,因此,可以将第一时间长度设定的短一些。而在非人声场景类型下,可能在某些时段下会故意使得音频数据的两个声道的能量参数相差较大,因此,可以将第二时间长度设定的长一些。
即,第一时间长度小于第二时间长度。
步骤605:基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件;
步骤606:当确定所述待播放音频数据的均衡性不满足所述预设条件时,调节所述一段时间内的所述待播放音频数据的均衡性。
由此可见,在本实施例中,能够基于待播放音频数据所属的场景类型自动调整均衡性差的双声道音频数据的均衡性,以改善其播放效果,提高了用户体验。
与上述音频数据的处理方法相对应的,本发明还公开了一种电子设备,具体的,在实施例七中,如图7所示,该电子设备包括:获取数据单元701、确定参数单元702、第一判断单元703以及第一调节单元704;其中:
获取数据单元701,用于获取待播放音频数据;
确定参数单元702,用于确定一段时间内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;
其中,为了确定待播放音频数据的播放效果,可以对双声道音频数据的均衡性进行检测,那么,在获取待播放音频数据后,确定参数单元可以先检测该待播放音频数据是否为双声道音频数据,如果是,则确定一段时间内的待播放音频数据的第一声道音频数据的第一能量参数和第二声道音频数据的第二能量参数。
第一声道音频数据为左声道音频数据,相应的,第二声道音频数据则为右声道音频数据;第一声道音频数据为右声道音频数据,相应的,第二声道音频数据则为左声道音频数据。
在本发明中,能量参数用于反应音频数据的声音强度,具体可以由音频数据的声音振幅来表示,作为一种计算方式,能量参数En可以由如下公式表示:
E n = Σ m = n n + N - 1 x w 2 ( m )
其中,N为短时取样窗口的长度,xw(n)为原信号x(n)经过加窗处理后的信号,x(n)为原信号的幅度。
当然本发明并不仅限于这一种方式,对于其他确定能量参数的实现方式均在本发明的保护范围之内。
第一判断单元703,用于基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件;
第一调节单元704,用于在确定所述待播放音频数据的均衡性不满足所述预设条件时,调节所述一段时间内所述待播放音频数据的均衡性。
需说明的是,可以将待播放音频数据以所述一段时间为单位划分为多段,当对第一段所述一段时间的音频数据的均衡性处理完毕后,可以针对下一段的所述一段时间的待播放音频数据的均衡性再次进行检测和调节,直至处理完所有时段的待播放音频数据。当然,在本发明中,也可以在获取待播放音频数据时就以所述一段时间为单位进行获取,即获取数据单元具体用于获取所述一段时间的待播放音频数据,当电子设备的其他单元针对该段时间的待播放音频数据的均衡性处理完毕后,获取数据单元再获取一段时间的待播放音频数据,依次类推。
由此可见,在本实施例中,能够自动调整均衡性差的双声道音频数据的均衡性,以改善其播放效果,提高了用户体验。
本发明实施例八公开了一种电子设备,与实施例七不同的是,本实施例主要介绍第一判断单元的两种实现方式,具体的:
作为一种实现方式,如图8所示,第一判断单元801包括:第一计算模块801A、第一确定模块801B以及第二确定模块801C;其中:
第一计算模块801A,用于基于所述第一能量参数和所述第二能量参数计算所述一段时间内的待播放音频数据的总能量参数;
第一确定模块801B,用于当确定所述第一能量参数和所述第二能量参数中,任一能量参数与所述总能量参数的比值达到预设的第一阈值时,确定所述待播放音频数据的均衡性不满足预设条件;
第二确定模块801C,用于当确定所述第一能量参数与所述总能量参数的比值以及所述第二能量参数与所述总能量参数的比值均小于所述第一阈值时,确定所述待播放音频数据的均衡性满足预设条件。
作为另一种实现方式,如图9所示,第一判断单元901包括:确定差值模块901A、第二计算模块901B、第三确定模块901C以及第四确定模块901D;其中:
确定差值模块901A,用于确定所述第一能量参数与所述第二能量参数的差值;
第二计算模块901B,用于计算所述差值与任一能量参数的比值;
第三确定模块901C,用于当所述比值达到预设的第二阈值时,确定所述待播放音频数据的均衡性不满足预设条件;
第四确定模块901D,用于当所述比值小于所述第二阈值时,确定所述待播放音频数据的均衡性满足预设条件。
本发明实施例九公开了一种电子设备,以在实施例八的基础上,描述第一调节单元如何调节一段时间内的待播放音频数据的均衡性,具体的:
第一调节单元包括:复制数据模块以及混合数据模块;其中:
复制数据模块,用于在确定所述待播放音频数据的均衡性不满足所述预设条件时,复制所述第一声道音频数据和所述第二声道音频数据中能量参数较大的声道音频数据;
混合数据模块,用于将所复制的声道音频数据混合到能量参数小的声道中。
进一步的,为了模拟输出双声道效果,混合数据模块具体可以用于在将所复制的声道音频数据混合到能量参数小的声道的过程中,为所复制的声道音频数据加上预设的时间偏置。该时间偏置为一微小的时间偏置即可。
在实际应用中,当将能量参数较大的声道音频数据混合到能量参数较小的声道中后,可能会出现混合后的声道音频数据的能量参数增大较多,使得混合后的音频数据又不均衡的现象,基于该问题,本发明实施例十和实施例十一公开了电子设备,以保证混合后的待播放音频数据的均衡性。
具体的,在实施例十中,如图10所示,第一调节单元1001包括:复制数据模块1001A、第一缩小模块1001B以及混合数据模块1001C;其中:
复制数据模块1001A,用于在确定所述待播放音频数据的均衡性不满足所述预设条件时,复制所述第一声道音频数据和所述第二声道音频数据中能量参数较大的声道音频数据;
第一缩小模块1001B,用于将所述能量参数小的声道音频数据的能量参数缩小;
其中,在将能量参数下的声道音频数据的能量参数缩小之前,第一缩小模块可以先判断如果将能量参数大的声道音频数据混合到能量参数小的声道中后,混合后的音频数据的均衡性是否满足预设条件,若是则确定将能量参数小的声道音频数据的能量参数缩小多少才能够保证混合后的音频数据的均衡性满足预设条件,即确定缩小的幅度,从而基于该缩小的幅度将能量参数小的声道音频数据的能量参数缩小。也就是说,缩小的幅度能够用于使得混合后的待播放音频数据的均衡性满足所述预设条件。
需说明的是,如果预先判断如果将能量参数大的声道音频数据混合到能量参数小的声道中后,混合后的音频数据的均衡性满足预设条件,那么,则可以不对能量参数下的声道音频数据的能量参数进行缩小,作为一种实现方式,该缩小的幅度可以为0。
混合数据模块1001C,用于将所述复制的声道音频数据混合到能量参数缩小后的声道中。
在本实施例中,由于在混合之前预先确定了通过将能量参数下的声道音频数据的能量参数缩小后,能够使得混合后的音频数据的均衡性满足预设条件,因此,在将复制的声道音频数据混合到能量参数缩小后的声道中后,能够确保混合后的音频数据的播放效果。
在实施例十一中,如图11所示,第一调节单元1101包括:复制数据模块1101A、混合数据模块1101B、第一判断模块1101C以及第二缩小模块1101D,其中:
复制数据模块1101A,用于在确定所述待播放音频数据的均衡性不满足所述预设条件时,复制所述第一声道音频数据和所述第二声道音频数据中能量参数较大的声道音频数据;
混合数据模块1101B,用于将所复制的声道音频数据混合到能量参数小的声道中;
第一判断模块1101C,用于判断混合后的待播放音频数据的均衡性是否满足所述预设条件;
第二缩小模块1101D,用于在确定混合后的待播放音频数据的均衡性未满足所述预设条件时,将混合后的声道音频数据的能量参数缩小,以使得能量参数缩小后的待播放音频数据的均衡性满足所述预设条件。
在本实施例中,通过缩小混合后的声道音频数据的能量参数,能够保证混合后的音频数据的播放效果。
本发明实施例十二公开了一种电子设备,如图12所示,该电子设备包括:获取数据单元801、检测类型单元802、确定参数单元803、第一判断单元804以及第一调节单元805;其中:
获取数据单元801,用于获取待播放音频数据;
检测类型单元802,用于检测所述待播放音频数据所属场景类型;
检测待播放音频数据所属场景类型的实现方式有多种,一种方式,检测类型单元802可以采集待播放音频数据的频率,通过频率来判断待播放音频数据所属场景类型,例如,人的声音的频域带宽为0.3kHz~5kHz,而音乐的频域带宽相对较大,可以达到22kHz。另一种方式,检测类型单元802可以采集待播放音频数据的子带能量比,不同类型的音频能量在各个子带的分布不同,例如音乐在各个子带均匀分布,而人声的音频能量主要集中在第一个子带上,一般占80%。再一种方式,检测类型单元802可以确定待播放音频数据的过零率,一般情况下,人声的音频信号的过零率要比音乐的过零率剧烈。
确定参数单元803,用于若所述待播放音频数据属于第一场景类型,确定第一时间长度内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;若所述待播放音频数据属于第二场景类型,确定第二时间长度内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;
其中,所述第一时间长度小于所述第二时间长度。
第一判断单元804,用于基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件;
第一调节单元805,用于在确定所述待播放音频数据的均衡性不满足所述预设条件时,调节所述一段时间内所述待播放音频数据的均衡性。
由此可见,在本实施例中,能够基于待播放音频数据所属的场景类型自动调整均衡性差的双声道音频数据的均衡性,以改善其播放效果,提高了用户体验。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (16)

1.一种音频数据的处理方法,其特征在于,该方法包括:
获取待播放音频数据;
确定一段时间内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;
基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件;
若否,调节所述一段时间内所述待播放音频数据的均衡性。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件,包括:
基于所述第一能量参数和所述第二能量参数计算所述一段时间内的待播放音频数据的总能量参数;
当确定所述第一能量参数和所述第二能量参数中,任一能量参数与所述总能量参数的比值达到预设的第一阈值时,确定所述待播放音频数据的均衡性不满足预设条件;
当确定所述第一能量参数与所述总能量参数的比值以及所述第二能量参数与所述总能量参数的比值均小于所述第一阈值时,确定所述待播放音频数据的均衡性满足预设条件。
3.根据权利要求1所述的方法,其特征在于,所述基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件,包括:
确定所述第一能量参数与所述第二能量参数的差值;
计算所述差值与任一能量参数的比值;
当所述比值达到预设的第二阈值时,确定所述待播放音频数据的均衡性不满足预设条件;
当所述比值小于所述第二阈值时,确定所述待播放音频数据的均衡性满足预设条件。
4.根据权利要求2-3任一项所述的方法,其特征在于,所述调节所述一段时间内所述待播放音频数据的均衡性,包括:
复制所述第一声道音频数据和所述第二声道音频数据中能量参数较大的声道音频数据;
将所复制的声道音频数据混合到能量参数小的声道中。
5.根据权利要求4所述的方法,其特征在于,在将所复制的声道音频数据混合到能量参数小的声道的过程中,为所复制的声道音频数据加上预设的时间偏置。
6.根据权利要求4所述的方法,其特征在于,所述将所复制的声道音频数据混合到能量参数小的声道中之前,还包括:
将所述能量参数小的声道音频数据的能量参数缩小;
所述将所复制的声道音频数据混合到能量参数小的声道中,具体为:将所述复制的声道音频数据混合到能量参数缩小后的声道中;
其中,缩小的幅度用于使得混合后的待播放音频数据的均衡性满足所述预设条件。
7.根据权利要求4所述的方法,其特征在于,所述将所复制的声道音频数据混合到能量参数小的声道中之后,还包括:
判断混合后的待播放音频数据的均衡性是否满足所述预设条件;
若否,则将混合后的声道音频数据的能量参数缩小,以使得能量参数缩小后的待播放音频数据的均衡性满足所述预设条件。
8.根据权要求1所述的方法,其特征在于,所述确定一段时间内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数之前,还包括:
检测所述待播放音频数据所属场景类型;
所述确定一段时间内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数,具体为:
若所述待播放音频数据属于第一场景类型,确定第一时间长度内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;
若所述待播放音频数据属于第二场景类型,确定第二时间长度内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;
其中,所述第一时间长度小于所述第二时间长度。
9.一种电子设备,其特征在于,包括:
获取数据单元,用于获取待播放音频数据;
确定参数单元,用于确定一段时间内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;
第一判断单元,用于基于所述第一能量参数和所述第二能量参数判断所述待播放音频数据的均衡性是否满足预设条件;
第一调节单元,用于在确定所述待播放音频数据的均衡性不满足所述预设条件时,调节所述一段时间内所述待播放音频数据的均衡性。
10.根据权利要求9所述的电子设备,其特征在于,所述第一判断单元,包括:
第一计算模块,用于基于所述第一能量参数和所述第二能量参数计算所述一段时间内的待播放音频数据的总能量参数;
第一确定模块,用于当确定所述第一能量参数和所述第二能量参数中,任一能量参数与所述总能量参数的比值达到预设的第一阈值时,确定所述待播放音频数据的均衡性不满足预设条件;
第二确定模块,用于当确定所述第一能量参数与所述总能量参数的比值以及所述第二能量参数与所述总能量参数的比值均小于所述第一阈值时,确定所述待播放音频数据的均衡性满足预设条件。
11.根据权利要求9所述的电子设备,其特征在于,所述第一判断单元,包括:
确定差值模块,用于确定所述第一能量参数与所述第二能量参数的差值;
第二计算模块,用于计算所述差值与任一能量参数的比值;
第三确定模块,用于当所述比值达到预设的第二阈值时,确定所述待播放音频数据的均衡性不满足预设条件;
第四确定模块,用于当所述比值小于所述第二阈值时,确定所述待播放音频数据的均衡性满足预设条件。
12.根据权利要求10-11任一项所述的电子设备,其特征在于,
所述第一调节单元,包括:
复制数据模块,用于在确定所述待播放音频数据的均衡性不满足所述预设条件时,复制所述第一声道音频数据和所述第二声道音频数据中能量参数较大的声道音频数据;
混合数据模块,用于将所复制的声道音频数据混合到能量参数小的声道中。
13.根据权利要求12所述的电子设备,其特征在于,所述混合数据模块具体用于在将所复制的声道音频数据混合到能量参数小的声道的过程中,为所复制的声道音频数据加上预设的时间偏置。
14.根据权利要求12所述的电子设备,其特征在于,所述第一调节单元还包括:
第一缩小模块,用于将所述能量参数小的声道音频数据的能量参数缩小;
相应的,所述混合数据模块具体用于将所述复制的声道音频数据混合到能量参数缩小后的声道中;
其中,缩小的幅度用于使得混合后的待播放音频数据的均衡性满足所述预设条件。
15.根据权利要求12所述的电子设备,其特征在于,所述第一调节单元还包括:
第一判断模块,用于判断混合后的待播放音频数据的均衡性是否满足所述预设条件;
第二缩小模块,用于在确定混合后的待播放音频数据的均衡性未满足所述预设条件时,将混合后的声道音频数据的能量参数缩小,以使得能量参数缩小后的待播放音频数据的均衡性满足所述预设条件。
16.根据权要求9所述的电子设备,其特征在于,还包括:
检测类型单元,用于检测所述待播放音频数据所属场景类型;
相应的,所述确定参数单元具体用于若所述待播放音频数据属于第一场景类型,确定第一时间长度内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;若所述待播放音频数据属于第二场景类型,确定第二时间长度内的待播放音频数据的第一声道音频数据的第一能量参数以及第二声道音频数据的第二能量参数;
其中,所述第一时间长度小于所述第二时间长度。
CN201610113292.9A 2016-02-29 2016-02-29 一种音频数据的处理方法和电子设备 Active CN105720939B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610113292.9A CN105720939B (zh) 2016-02-29 2016-02-29 一种音频数据的处理方法和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610113292.9A CN105720939B (zh) 2016-02-29 2016-02-29 一种音频数据的处理方法和电子设备

Publications (2)

Publication Number Publication Date
CN105720939A true CN105720939A (zh) 2016-06-29
CN105720939B CN105720939B (zh) 2018-08-10

Family

ID=56157151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610113292.9A Active CN105720939B (zh) 2016-02-29 2016-02-29 一种音频数据的处理方法和电子设备

Country Status (1)

Country Link
CN (1) CN105720939B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107767880A (zh) * 2016-08-16 2018-03-06 杭州萤石网络有限公司 一种语音检测方法、摄像机和智能家居看护系统
CN113016189A (zh) * 2018-11-16 2021-06-22 三星电子株式会社 识别音频场景的电子设备和方法
CN115529053A (zh) * 2021-06-24 2022-12-27 博泰车联网科技(上海)股份有限公司 一种音频信号调节方法、装置、控制芯片及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4685136A (en) * 1984-12-24 1987-08-04 Don Latshaw Triphonic sound system
CN1964582A (zh) * 2005-11-11 2007-05-16 索尼株式会社 音频信号处理装置以及音频信号处理方法
CN101188132A (zh) * 2006-11-15 2008-05-28 乐金电子(昆山)电脑有限公司 数字音频播放器的均衡器功能自动设置方法及其设备
CN102395097A (zh) * 2011-09-29 2012-03-28 深圳市万兴软件有限公司 一种多声道音频信号缩混方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4685136A (en) * 1984-12-24 1987-08-04 Don Latshaw Triphonic sound system
CN1964582A (zh) * 2005-11-11 2007-05-16 索尼株式会社 音频信号处理装置以及音频信号处理方法
CN101188132A (zh) * 2006-11-15 2008-05-28 乐金电子(昆山)电脑有限公司 数字音频播放器的均衡器功能自动设置方法及其设备
CN102395097A (zh) * 2011-09-29 2012-03-28 深圳市万兴软件有限公司 一种多声道音频信号缩混方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107767880A (zh) * 2016-08-16 2018-03-06 杭州萤石网络有限公司 一种语音检测方法、摄像机和智能家居看护系统
CN107767880B (zh) * 2016-08-16 2021-04-16 杭州萤石网络有限公司 一种语音检测方法、摄像机和智能家居看护系统
CN113016189A (zh) * 2018-11-16 2021-06-22 三星电子株式会社 识别音频场景的电子设备和方法
CN113016189B (zh) * 2018-11-16 2023-12-19 三星电子株式会社 识别音频场景的电子设备和方法
CN115529053A (zh) * 2021-06-24 2022-12-27 博泰车联网科技(上海)股份有限公司 一种音频信号调节方法、装置、控制芯片及存储介质

Also Published As

Publication number Publication date
CN105720939B (zh) 2018-08-10

Similar Documents

Publication Publication Date Title
Nilsson A-weighted sound pressure level as an indicator of short-term loudness or annoyance of road-traffic sound
Skovenborg et al. Evaluation of different loudness models with music and speech material
Mäkivirta et al. Modal equalization of loudspeaker-room responses at low frequencies
CN103369432A (zh) 耳机均衡系统
CN107170463A (zh) 音频信号调节方法及系统
Schepker et al. Perceived listening effort and speech intelligibility in reverberation and noise for hearing-impaired listeners
Sato et al. Relationship between listening difficulty rating and objective measures in reverberant and noisy sound fields for young adults and elderly persons
US11516614B2 (en) Generating sound zones using variable span filters
Blau et al. Toward realistic binaural auralizations–perceptual comparison between measurement and simulation-based auralizations and the real room for a classroom scenario
US20190050194A1 (en) Mobile cluster-based audio adjusting method and apparatus
US11900016B2 (en) Multi-frequency sensing method and apparatus using mobile-clusters
CN105720939A (zh) 一种音频数据的处理方法和电子设备
Olive A multiple regression model for predicting loudspeaker preference using objective measurements: Part I-Listening test results
CN101783656A (zh) 一种音响响度控制方法、模块和装置
Wierstorf et al. Perceptual evaluation of source separation for remixing music
George et al. Development and validation of an unintrusive model for predicting the sensation of envelopment arising from surround sound recordings
Rämö et al. Validating a real-time perceptual model predicting distraction caused by audio-on-audio interference
Zhu et al. Influence of sound source characteristics in determining objective speech intelligibility metrics
Wendt et al. Precedence effect for specular and diffuse reflections
CN106354469A (zh) 一种响度调节方法及装置
Ono et al. Binaural modeling of multiple sound source perception: Coloration of wideband sound
US10972064B2 (en) Audio processing
Francombe et al. Determination and validation of mix parameters for modifying envelopment in object-based audio
CN106128474A (zh) 一种音频处理方法和装置
Francombe et al. Loudness matching multichannel audio program material with listeners and predictive models

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant