CN107889044B - 音频数据的处理方法及装置 - Google Patents
音频数据的处理方法及装置 Download PDFInfo
- Publication number
- CN107889044B CN107889044B CN201711373307.6A CN201711373307A CN107889044B CN 107889044 B CN107889044 B CN 107889044B CN 201711373307 A CN201711373307 A CN 201711373307A CN 107889044 B CN107889044 B CN 107889044B
- Authority
- CN
- China
- Prior art keywords
- data
- impulse response
- channel data
- dual
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 41
- 238000003672 processing method Methods 0.000 title claims abstract description 18
- 230000009977 dual effect Effects 0.000 claims abstract description 95
- 230000004044 response Effects 0.000 claims abstract description 77
- 238000000034 method Methods 0.000 claims abstract description 44
- 230000005540 biological transmission Effects 0.000 claims abstract description 19
- 210000005069 ears Anatomy 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 24
- 240000006409 Acacia auriculiformis Species 0.000 claims description 23
- 238000003860 storage Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 241001269238 Data Species 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 11
- 230000006870 function Effects 0.000 description 13
- 230000008901 benefit Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000006854 communication Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000033001 locomotion Effects 0.000 description 4
- 239000000428 dust Substances 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 210000001367 artery Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 239000004519 grease Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明实施例公开了一种音频数据的处理方法及装置,以解决现有技术中无法使用双麦克风录制高品质声音的问题,该方法应用于内设有双麦克风的移动终端,包括:在预先确定的声音采集位置处获取来自声源的第一双声道数据,将所述第一双声道数据处理为单声道数据;获取所述声源到达所述声音采集位置的传输路径所对应的脉冲响应数据;根据所述脉冲响应数据,将所述单声道数据转换为第二双声道数据。该技术方案解决了现有技术中利用双麦克风录音时左右声道声音不对称的问题,确保录制的声音具有稳定的立体声效果,提高了利用双麦克风录制声音的品质。
Description
技术领域
本发明涉及通信领域,尤其涉及一种音频数据的处理方法及装置。
背景技术
随着手机技术的发展,双麦克风及多麦克风的硬件配置越来越普及。在双麦克风的录音条件下,如何完美地利用双麦克风的硬件资源打造高品质的声音是业界长期探索和优化的方向。
在实际应用中,由于环境和硬件性能等不同原因,使用双麦克风时往往不能顺利录制立体声声音并还原,常见的情况有以下几种:
(1)其中一个麦克风被不小心遮挡住或被油垢灰尘等堵住,导致录制出来的声音出现一个声道声音大、另一个声道声音小的情况,听感很差。
(2)其中一个麦克风故障,导致录制出来的声音很小甚至是静音。
(3)双麦克风的位置在手机的不同方位,录音时,如果手机隔离了其中一个麦克风和声源,而另一个麦克风靠近声源时,就会导致录制出的声音和上述情况(1)、(2)产生同样的现象。
现有技术中,针对上述情况,一般的解决方法是检测声音信号的能量,选择能量大的信号处理,丢弃能量小的信号,或两声道混音输出。显然,无论采用其中哪种方法,都丢失了立体声效果。
发明内容
本发明实施例的目的是提供一种音频数据的处理方法及装置,以解决现有技术中无法使用双麦克风录制高品质声音的问题。
为解决上述技术问题,本发明实施例是这样实现的:
第一方面,本发明实施例提供了一种音频数据的处理方法,应用于内设有双麦克风的移动终端,该方法包括:
在预先确定的声音采集位置处获取来自声源的第一双声道数据,将所述第一双声道数据处理为单声道数据;
获取所述声源到达所述声音采集位置的传输路径所对应的脉冲响应数据;
根据所述脉冲响应数据,将所述单声道数据转换为第二双声道数据。
第二方面,本发明实施例还提供了一种音频数据的处理装置,应用于内设有双麦克风的移动终端,该装置包括:
处理模块,用于在预先确定的声音采集位置处获取来自声源的第一双声道数据,将所述第一双声道数据处理为单声道数据;
获取模块,用于获取所述声源到达所述声音采集位置的传输路径所对应的脉冲响应数据;
转换模块,用于根据所述脉冲响应数据,将所述单声道数据转换为第二双声道数据。
第三方面,本发明实施例还提供了一种移动终端,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述任一项所述的音频数据的处理方法的步骤
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的音频数据的处理方法的步骤。
在本发明实施例中,通过将获取到的第一双声道数据处理为单声道数据,并获取声源到达声音采集位置的传输路径所对应的脉冲响应数据,进而根据脉冲响应数据将单声道数据转换为第二双声道数据,使得最终得到的第二双声道数据不受双麦克风与声源位置的影响,也就是说,即使获取到的第一双声道数据中的左右声道声音大小不一致,也能够利用声源到达声音采集位置的传输路径所对应的脉冲响应数据将第一双声道数据转换为左右声道声音大小一致的第二双声道数据。因此,该技术方案解决了现有技术中利用双麦克风录音时左右声道声音不对称的问题,确保录制的声音具有稳定的立体声效果,提高了利用双麦克风录制声音的品质。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的一个实施例中一种音频数据的处理方法的流程图。
图2是本发明的另一个实施例中一种音频数据的处理方法的流程图。
图3是本发明的一个实施例中音频数据处理之前的双声道数据的波形示意图。
图4是本发明的一个实施例中音频数据处理之后的双声道数据的波形示意图。
图5是本发明的一个实施例中一种音频数据的处理装置的结构示意图。
图6是本发明的一个实施例中移动终端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明的一个实施例中一种音频数据的处理方法的流程图。图1的方法应用于内设有双麦克风的移动终端,可包括:
S101,在预先确定的声音采集位置处获取来自声源的第一双声道数据,将第一双声道数据处理为单声道数据。
其中,声音采集位置包括双麦克风的中轴线上的位置。优选的,为了建立高品质的3D立体声,可将声音采集位置设置于双麦克风中轴线的正前方。
该步骤中,可根据预设混音方式对第一双声道数据进行混音处理,以处理为单声道数据。其中,预设混音方式可以是传统的将多声道数据混音为单声道数据的方式,且混音过程可借助混音器来执行,包括软件类型的混音器以及硬件类型的混音器。
将第一双声道数据混音处理为单声道数据之后,不仅有助于后续解决双声道声音大小不一致的问题,同时由于声音信号比噪声信号有更明显的线性相位特点,因此简单的混音处理即可提升信噪比,从而达到抑制部分噪声的效果,提升了录音质量。
S102,获取声源到达声音采集位置的传输路径所对应的脉冲响应数据。
该步骤中,声源到达声音采集位置的传输路径所对应的脉冲响应数据可根据声源相对于声音采集位置的方位信息从HRTF(Head Related Transfer Functions,头相关传输函数)数据库中查找得到,具体的查找方式将在下述进行详细说明。
S103,根据脉冲响应数据,将单声道数据转换为第二双声道数据。
本实施例中,移动终端(Mobile Terminal)也可称之为用户端(UE,UserEquipment)、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置。接入终端可以是蜂窝电话、无绳电话、SIP(Session Initiation Protocol,会话启动协议)电话、WLL(Wireless Local Loop,无线本地环路)站、PDA(Personal Digital Assistant,个人数字处理)、具有无线通信功能的手持设备、计算设备或连接到无线调制解调器的其它处理设备、车载设备、可穿戴设备,未来5G网络中的终端设备或者未来演进的PLMN(Public Land Mobile Network,公共陆地移动网络)网络中的终端设备。
在本发明实施例中,通过将获取到的第一双声道数据处理为单声道数据,并获取声源到达声音采集位置的传输路径所对应的脉冲响应数据,进而根据脉冲响应数据将单声道数据转换为第二双声道数据,使得最终得到的第二双声道数据不受双麦克风与声源位置的影响,也就是说,即使获取到的第一双声道数据中的左右声道声音大小不一致,也能够利用声源到达声音采集位置的传输路径所对应的脉冲响应数据将第一双声道数据转换为左右声道声音大小一致的第二双声道数据。因此,该技术方案解决了现有技术中利用双麦克风录音时左右声道声音不对称的问题,确保录制的声音具有稳定的立体声效果,提高了利用双麦克风录制声音的品质。
下面,将结合具体的实施例,对本发明实施例的方法作进一步的描述。
在一个实施例中,可通过以下方法获取声源到达声音采集位置的传输路径所对应的脉冲响应数据:
首先,确定声源相对于声音采集位置的方位信息,该方位信息包括仰角和方位角。
其次,从HRTF数据库中查找并获取方位信息对应的左耳脉冲响应数据及右耳脉冲响应数据,HRTF数据库中包括多个方位信息分别对应的左耳脉冲响应数据及右耳脉冲响应数据。
本实施例中,以MIT(Massachusetts Institute of Technology,麻省理工学院)媒体实验室提供的HRTF数据库为例进行说明。
HRTF数据库是利用KEMAR(Knowles Electronics Manikin for AcousticResearch,人工头)模型进行测量,以获得不同仰角和方位角对应的脉冲响应。HRTF数据库中的坐标体系与地理上定义的经纬度一致,方位角与经度一致,仰角与维度一致。其中,方位角的范围为0度到360度,KEMAR模型的正前方为0度,右耳方向为90度,正后方为180度,左耳方向为270度。仰角的范围为-90度到90度,KEMAR模型的水平面的仰角为0度,水平面以上的仰角为正值,水平面以下的为负值,正上方的仰角为90度,正下方的仰角为-90度。
本实施例中的HRTF数据库指完整的HRTF数据库。完整的HRTF数据库以仰角目录的方式存放脉冲响应数据,每个目录名都是如"elevEE"的形式。其中,“EE”为仰角值。具体的,在每个仰角子目录里存放的文件以"XEEeAAAa.dat"的方式命名,其中,“X”为L或R,表示该文件中的数据是左耳还是右耳的脉冲响应,当“X”为L时,表示该文件中的数据为左耳的脉冲响应,当“X”为R时,表示该文件中的数据为右耳的脉冲响应。“EE”为仰角值,“AAA”为方位角的值。例如,文件“R-10e270a.dat”中的数据即为当声源在双耳所在水平面以下10度,正对左耳时的右耳脉冲响应。
由上述HRTF数据库中的数据存放方式可看出,在确定仰角和方位角之后,即可准确查找并获取到仰角和方位角对应的左耳脉冲响应数据和右耳脉冲响应数据。例如,给定方位信息——仰角值为60度,方位角为180度,则根据该方位信息即可从HRTF数据库中查找到文件“L60e180a.dat”以及“R60e180a.dat”。其中,文件“L60e180a.dat”中存放的数据即为该方位信息对应的左耳脉冲响应数据,文件“R60e180a.dat”中存放的数据即为该方位信息对应的右耳脉冲响应数据。
第二双声道数据包括左声道数据及右声道数据。在一个实施例中,可通过以下方式将单声道数据转换为第二双声道数据:将单声道数据与左耳脉冲响应数据进行卷积处理,得到左声道数据;以及,将单声道数据与右耳脉冲响应数据进行卷积处理,得到右声道数据。其中,左耳脉冲响应数据以及右耳脉冲响应数据即为上述从HRTF数据库中获取到的脉冲响应数据。
由上述实施例可知,给定方位信息后,从HRTF数据库中获取到的左耳脉冲响应数据和右耳脉冲响应数据为两组对称的数据,因此经左耳脉冲响应数据和右耳脉冲响应数据分别与单声道数据进行卷积后,获得的左声道数据和右声道数据也必然是对称的,从而解决了最初录制的双声道声音大小不一致的问题。
以下通过一具体实施例来说明本发明提供的音频数据的处理方法。
图2是本发明的一个具体实施例中一种音频数据的处理方法的流程图。图2的方法应用于内设有双麦克风的移动终端,可包括:
S201,设定声音采集位置。
该实施例中,声音采集位置设于双麦克风的中心位置,即双麦克风的中轴线上距离双麦克风最近的位置。
S202,在声音采集位置处获取来自声源的第一双声道数据,并对第一双声道数据进行混音处理,得到单声道数据。
图3是本实施例中获取到的第一双声道数据的波形示意图,由图3可看出,第一双声道数据中的左声道数据和右声道数据并不对称,可能由于其中一个麦克风被不小心遮挡住或被灰尘堵住等原因,使得第一双声道数据中的左声道数据为静音,仅有右声道数据是正常的声音数据。
S203,确定声源相对于声音采集位置的方位信息,该方位信息包括仰角和方位角。
S204,根据方位信息,从HRTF数据库中查找并获取方位信息对应的左耳脉冲响应数据及右耳脉冲响应数据。
其中,HRTF数据库中包括多个方位信息分别对应的左耳脉冲响应数据及右耳脉冲响应数据。
S205,将单声道数据与左耳脉冲响应数据进行卷积处理,得到左声道数据;以及,将单声道数据与右耳脉冲响应数据进行卷积处理,得到右声道数据。
该步骤中,卷积后获得的左声道数据和右声道数据即为最终处理完成的第二双声道数据。
针对不同帧的音频数据,经设定不同的声音采集位置,并针对各声音采集位置分别执行上述S201-S205,即可得到具有稳定的3D立体声效果的第二双声道数据。图4是本实施例中获取到的第二双声道数据的波形示意图,由图4可看出,经本实施例提供的方法对第一双声道数据处理后,得到的声音信号相互对称,左声道数据和右声道数据的声音音量几乎完全相同,且立体声效果明显。
因此,采用本发明实施例提供的音频数据的处理方法,能够有效地解决现有技术中利用双麦克风录音时左右声道声音不对称的问题,确保录制的声音具有稳定的立体声效果,提高了利用双麦克风录制声音的品质。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
图5是本发明的一个实施例中一种音频数据的处理装置的结构示意图。请参考图5,一种音频数据的处理装置可包括:
处理模块510,用于在预先确定的声音采集位置处获取来自声源的第一双声道数据,将第一双声道数据处理为单声道数据;
获取模块520,用于获取声源到达声音采集位置的传输路径所对应的脉冲响应数据;
转换模块530,用于根据脉冲响应数据,将单声道数据转换为第二双声道数据。
在一个实施例中,处理模块510包括:
处理单元,用于根据预设混音方式对第一双声道数据进行混音处理,得到单声道数据。
在一个实施例中,获取模块520包括:
确定单元,用于确定声源相对于声音采集位置的方位信息,方位信息包括仰角和方位角;
获取单元,用于从头相关传输函数数据库中查找并获取方位信息对应的左耳脉冲响应数据及右耳脉冲响应数据,头相关传输函数数据库中包括多个方位信息分别对应的左耳脉冲响应数据及右耳脉冲响应数据。
在一个实施例中,第二双声道数据包括左声道数据及右声道数据;转换模块530包括:
卷积单元,用于将单声道数据与左耳脉冲响应数据进行卷积处理,得到左声道数据;以及,将单声道数据与右耳脉冲响应数据进行卷积处理,得到右声道数据。
在一个实施例中,声音采集位置包括双麦克风的中轴线上的位置。
本发明实施例提供的音频数据的处理装置能够实现图1至图4的方法实施例中音频数据的处理装置实现的各个过程,为避免重复,这里不再赘述。
在本发明实施例中,通过将获取到的第一双声道数据处理为单声道数据,并获取声源到达声音采集位置的传输路径所对应的脉冲响应数据,进而根据脉冲响应数据将单声道数据转换为第二双声道数据,使得最终得到的第二双声道数据不受双麦克风与声源位置的影响,也就是说,即使获取到的第一双声道数据中的左右声道声音大小不一致,也能够利用声源到达声音采集位置的传输路径所对应的脉冲响应数据将第一双声道数据转换为左右声道声音大小一致的第二双声道数据。因此,该技术方案解决了现有技术中利用双麦克风录音时左右声道声音不对称的问题,确保录制的声音具有稳定的立体声效果,提高了利用双麦克风录制声音的品质。
图6为实现本发明各个实施例的一种移动终端的硬件结构示意图。
该移动终端600包括但不限于:射频单元601、网络模块602、音频输出单元603、输入单元604、传感器605、显示单元606、用户输入单元607、接口单元608、存储器609、处理器610、以及电源611等部件。本领域技术人员可以理解,图6中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,移动终端包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
其中,射频单元601,用于在预先确定的声音采集位置处获取来自声源的第一双声道数据;
处理器610,用于将所述第一双声道数据处理为单声道数据;获取所述声源到达所述声音采集位置的传输路径所对应的脉冲响应数据;根据所述脉冲响应数据,将所述单声道数据转换为第二双声道数据。
在本发明实施例中,通过将获取到的第一双声道数据处理为单声道数据,并获取声源到达声音采集位置的传输路径所对应的脉冲响应数据,进而根据脉冲响应数据将单声道数据转换为第二双声道数据,使得最终得到的第二双声道数据不受双麦克风与声源位置的影响,也就是说,即使获取到的第一双声道数据中的左右声道声音大小不一致,也能够利用声源到达声音采集位置的传输路径所对应的脉冲响应数据将第一双声道数据转换为左右声道声音大小一致的第二双声道数据。因此,该技术方案解决了现有技术中利用双麦克风录音时左右声道声音不对称的问题,确保录制的声音具有稳定的立体声效果,提高了利用双麦克风录制声音的品质。
应理解的是,本发明实施例中,射频单元601可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器610处理;另外,将上行的数据发送给基站。通常,射频单元601包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元601还可以通过无线通信系统与网络和其他设备通信。
移动终端通过网络模块602为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元603可以将射频单元601或网络模块602接收的或者在存储器609中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元603还可以提供与移动终端600执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元603包括扬声器、蜂鸣器以及受话器等。
输入单元604用于接收音频或视频信号。输入单元604可以包括图形处理器(Graphics Processing Unit,GPU)6041和麦克风6042,图形处理器6041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元606上。经图形处理器6041处理后的图像帧可以存储在存储器609(或其它存储介质)中或者经由射频单元601或网络模块602进行发送。麦克风6042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元601发送到移动通信基站的格式输出。
移动终端600还包括至少一种传感器605,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板6061的亮度,接近传感器可在移动终端600移动到耳边时,关闭显示面板6061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器605还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元606用于显示由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板6061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1061。
用户输入单元607可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元607包括触控面板6071以及其他输入设备6072。触控面板6071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板6071上或在触控面板6071附近的操作)。触控面板6071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器610,接收处理器610发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板6071。除了触控面板6071,用户输入单元607还可以包括其他输入设备6072。具体地,其他输入设备6072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板6071可覆盖在显示面板6061上,当触控面板6071检测到在其上或附近的触摸操作后,传送给处理器610以确定触摸事件的类型,随后处理器610根据触摸事件的类型在显示面板6061上提供相应的视觉输出。虽然在图6中,触控面板6071与显示面板6061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板6071与显示面板6061集成而实现移动终端的输入和输出功能,具体此处不做限定。
接口单元608为外部装置与移动终端600连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元608可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端600内的一个或多个元件或者可以用于在移动终端600和外部装置之间传输数据。
存储器609可用于存储软件程序以及各种数据。存储器609可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器609可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器610是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器609内的软件程序和/或模块,以及调用存储在存储器609内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器610可包括一个或多个处理单元;优选的,处理器610可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器610中。
移动终端600还可以包括给各个部件供电的电源611(比如电池),优选的,电源611可以通过电源管理系统与处理器610逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,移动终端600包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种移动终端,包括处理器610,存储器609,存储在存储器609上并可在所述处理器610上运行的计算机程序,该计算机程序被处理器610执行时实现上述音频数据的处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述音频数据的处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
Claims (8)
1.一种音频数据的处理方法,其特征在于,应用于内设有双麦克风的移动终端,所述方法包括:
在预先确定的声音采集位置处获取来自声源的第一双声道数据,将所述第一双声道数据处理为单声道数据;
获取所述声源到达所述声音采集位置的传输路径所对应的脉冲响应数据;
根据所述脉冲响应数据,将所述单声道数据转换为第二双声道数据;
其中,所述获取所述声源到达所述声音采集位置的传输路径所对应的脉冲响应数据,包括:
确定所述声源相对于所述声音采集位置的方位信息,所述方位信息包括仰角和方位角;
从头相关传输函数数据库中查找并获取所述方位信息对应的左耳脉冲响应数据及右耳脉冲响应数据,所述头相关传输函数数据库中包括多个方位信息分别对应的左耳脉冲响应数据及右耳脉冲响应数据;
其中,所述第二双声道数据包括左声道数据及右声道数据;所述根据所述脉冲响应数据,将所述单声道数据转换为第二双声道数据,包括:
将所述单声道数据与所述左耳脉冲响应数据进行卷积处理,得到所述左声道数据;以及,将所述单声道数据与所述右耳脉冲响应数据进行卷积处理,得到所述右声道数据。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一双声道数据处理为单声道数据,包括:
根据预设混音方式对所述第一双声道数据进行混音处理,得到所述单声道数据。
3.根据权利要求1所述的方法,其特征在于,所述声音采集位置包括所述双麦克风的中轴线上的位置。
4.一种音频数据的处理装置,其特征在于,应用于内设有双麦克风的移动终端,所述装置包括:
处理模块,用于在预先确定的声音采集位置处获取来自声源的第一双声道数据,将所述第一双声道数据处理为单声道数据;
获取模块,用于获取所述声源到达所述声音采集位置的传输路径所对应的脉冲响应数据;
转换模块,用于根据所述脉冲响应数据,将所述单声道数据转换为第二双声道数据;
其中,所述获取模块包括:
确定单元,用于确定所述声源相对于所述声音采集位置的方位信息,所述方位信息包括仰角和方位角;
获取单元,用于从头相关传输函数数据库中查找并获取所述方位信息对应的左耳脉冲响应数据及右耳脉冲响应数据,所述头相关传输函数数据库中包括多个方位信息分别对应的左耳脉冲响应数据及右耳脉冲响应数据;
其中,所述第二双声道数据包括左声道数据及右声道数据;所述转换模块包括:
卷积单元,用于将所述单声道数据与所述左耳脉冲响应数据进行卷积处理,得到所述左声道数据;以及,将所述单声道数据与所述右耳脉冲响应数据进行卷积处理,得到所述右声道数据。
5.根据权利要求4所述的装置,其特征在于,所述处理模块包括:
处理单元,用于根据预设混音方式对所述第一双声道数据进行混音处理,得到所述单声道数据。
6.根据权利要求4所述的装置,其特征在于,所述声音采集位置包括所述双麦克风的中轴线上的位置。
7.一种移动终端,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至3中任一项所述的音频数据的处理方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至3中任一项所述的音频数据的处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711373307.6A CN107889044B (zh) | 2017-12-19 | 2017-12-19 | 音频数据的处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711373307.6A CN107889044B (zh) | 2017-12-19 | 2017-12-19 | 音频数据的处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107889044A CN107889044A (zh) | 2018-04-06 |
CN107889044B true CN107889044B (zh) | 2019-10-15 |
Family
ID=61771051
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711373307.6A Active CN107889044B (zh) | 2017-12-19 | 2017-12-19 | 音频数据的处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107889044B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111343558B (zh) | 2018-07-26 | 2022-02-15 | Oppo广东移动通信有限公司 | 麦克风堵孔检测方法及相关产品 |
CN113115175B (zh) * | 2018-09-25 | 2022-05-10 | Oppo广东移动通信有限公司 | 3d音效处理方法及相关产品 |
CN111210809B (zh) * | 2018-11-22 | 2024-03-19 | 阿里巴巴集团控股有限公司 | 语音训练数据适配方法和装置、语音数据转换方法以及电子设备 |
WO2021212287A1 (zh) * | 2020-04-20 | 2021-10-28 | 深圳市大疆创新科技有限公司 | 音频信号处理方法、音频处理装置及录音设备 |
CN114501295B (zh) * | 2020-10-26 | 2022-11-15 | 深圳Tcl数字技术有限公司 | 音频数据处理方法、装置、终端和计算机可读存储介质 |
CN112927701B (zh) * | 2021-02-05 | 2024-07-16 | 商汤集团有限公司 | 样本生成、神经网络生成、音频信号生成方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1466401A (zh) * | 2002-07-02 | 2004-01-07 | 矽统科技股份有限公司 | 立体音效的产生方法 |
CN1766992A (zh) * | 2004-10-26 | 2006-05-03 | 三星电子株式会社 | 从多声道音频信号去除噪声的方法和设备 |
CN1794887A (zh) * | 2005-12-09 | 2006-06-28 | 安凯(广州)软件技术有限公司 | 增强三维音效的音频处理方法 |
CN201946291U (zh) * | 2010-12-27 | 2011-08-24 | 广州飞达音响专业器材有限公司 | 一种带录音功能的调音台 |
CN104392744A (zh) * | 2014-08-27 | 2015-03-04 | 贵阳朗玛信息技术股份有限公司 | 一种录制音频的方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5540581B2 (ja) * | 2009-06-23 | 2014-07-02 | ソニー株式会社 | 音声信号処理装置および音声信号処理方法 |
CN105261365A (zh) * | 2015-09-15 | 2016-01-20 | 北京云知声信息技术有限公司 | 一种音频输出方法及装置 |
CN205007537U (zh) * | 2015-09-24 | 2016-02-03 | 上海菜猫健康管理有限公司 | 数字化体能训练场地系统 |
-
2017
- 2017-12-19 CN CN201711373307.6A patent/CN107889044B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1466401A (zh) * | 2002-07-02 | 2004-01-07 | 矽统科技股份有限公司 | 立体音效的产生方法 |
CN1766992A (zh) * | 2004-10-26 | 2006-05-03 | 三星电子株式会社 | 从多声道音频信号去除噪声的方法和设备 |
CN1794887A (zh) * | 2005-12-09 | 2006-06-28 | 安凯(广州)软件技术有限公司 | 增强三维音效的音频处理方法 |
CN201946291U (zh) * | 2010-12-27 | 2011-08-24 | 广州飞达音响专业器材有限公司 | 一种带录音功能的调音台 |
CN104392744A (zh) * | 2014-08-27 | 2015-03-04 | 贵阳朗玛信息技术股份有限公司 | 一种录制音频的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107889044A (zh) | 2018-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107889044B (zh) | 音频数据的处理方法及装置 | |
CN107770760B (zh) | 一种识别蓝牙设备的类型的方法及移动终端 | |
US20200257433A1 (en) | Display method and mobile terminal | |
CN107277216A (zh) | 一种音量调节方法、终端以及计算机可读存储介质 | |
CN107911445A (zh) | 一种消息推送方法、移动终端和存储介质 | |
CN108551534B (zh) | 多终端语音通话的方法及装置 | |
WO2020228537A1 (zh) | 资源确定方法、资源指示方法、终端及网络侧设备 | |
CN110062104A (zh) | 应用程序启动方法、装置及移动终端 | |
CN108566484A (zh) | 消息处理方法、终端设备及计算机可读存储介质 | |
CN109168108A (zh) | 电声器件振幅调整方法、装置和移动终端 | |
CN110180181A (zh) | 精彩时刻视频的截图方法、装置及计算机可读存储介质 | |
CN110138525A (zh) | 解调参考信号的配置方法、传输方法、终端及网络侧设备 | |
CN108495349A (zh) | 一种运营商网络的切换方法及移动终端 | |
CN109002245A (zh) | 一种应用界面的操作方法及移动终端 | |
CN109873894B (zh) | 一种音量调节方法及移动终端 | |
CN109587260A (zh) | 一种资源获取方法、装置以及系统 | |
CN109068084A (zh) | 视频通话画面显示方法、移动终端及计算机可读存储介质 | |
CN109348035A (zh) | 一种电话号码的识别方法和终端设备 | |
CN109151741A (zh) | 一种彩信接收方法及终端 | |
CN108900503A (zh) | 数据通信方法、通信处理设备、终端及可读存储介质 | |
CN108449736A (zh) | 一种数据传输方法、终端和计算机可读存储介质 | |
CN108419283A (zh) | 一种wifi热点扫描的方法及移动终端 | |
CN108600679A (zh) | 一种视频通话方法及终端 | |
CN108055389B (zh) | 未接来电处理方法及移动终端 | |
CN109462829A (zh) | 一种通话转移方法、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |