CN112202778B - 一种信息处理方法、装置和电子设备 - Google Patents
一种信息处理方法、装置和电子设备 Download PDFInfo
- Publication number
- CN112202778B CN112202778B CN202011057425.8A CN202011057425A CN112202778B CN 112202778 B CN112202778 B CN 112202778B CN 202011057425 A CN202011057425 A CN 202011057425A CN 112202778 B CN112202778 B CN 112202778B
- Authority
- CN
- China
- Prior art keywords
- information
- audio
- audio information
- noise
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 37
- 238000003672 processing method Methods 0.000 title claims abstract description 32
- 238000012545 processing Methods 0.000 claims abstract description 87
- 238000005457 optimization Methods 0.000 claims description 50
- 238000003062 neural network model Methods 0.000 claims description 37
- 238000000034 method Methods 0.000 claims description 27
- 238000011156 evaluation Methods 0.000 claims description 15
- 230000009467 reduction Effects 0.000 claims description 15
- 230000000694 effects Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- LFQCEHFDDXELDD-UHFFFAOYSA-N tetramethyl orthosilicate Chemical compound CO[Si](OC)(OC)OC LFQCEHFDDXELDD-UHFFFAOYSA-N 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/80—Responding to QoS
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- Computer Networks & Wireless Communication (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Telephone Function (AREA)
Abstract
本申请提供了一种信息处理方法,该方法应用于电子设备,包括:获取音频采集模组采集的音频信息,所述音频信息中包括目标音频信息和噪声信息,所述音频采集模组采集的音频信息的信噪比满足预设第一条件,所述音频信息的高频谐振点趋向所述音频信息所属音频范围的高频端;对所述音频信息进行处理,得到处理后的第一信息,所述第一信息中噪声的输出功率占比小于所述音频信息中噪声的输出功率占比。本方案中,音频采集模组采集的音频信息的信噪比较高,而且其高频谐振点趋向于高频端,保证了音频信息的质量较高,通过对于该音频信息处理,得到的第一信息中噪声的功率占比降低,使得最终得到的信息质量高,从而提高了VOIP的通话质量。
Description
技术领域
本申请涉及电子设备领域,更具体的说,是涉及一种信息处理方法、装置和电子设备。
背景技术
随着电子技术的发展,电子设备除了能够提供影音功能外,还可以提供VOIP(Voice over Internet Protocol,网络电话)功能,如网络会议、网课教学等均会涉及该功能。
由于涉及该VOIP的功能一般需要传递较重要的信息,因此,通话质量要求较高。
而现有技术中,针对该VOIP功能,电子设备一般常用统计学模型对于音频信息进行处理,但是该处理模型精度差,导致通话质量较差。
发明内容
有鉴于此,本申请提供了一种信息处理方法、装置和电子设备,解决现有技术中网络通话质量较差的问题。
为实现上述目的,本申请提供如下技术方案:
一种信息处理方法,应用于电子设备,所述方法包括:
获取音频采集模组采集的音频信息,所述音频信息中包括目标音频信息和噪声信息,所述音频信息的信噪比满足预设第一条件,所述音频信息的高频谐振点趋向所述音频信息所属音频范围的高频端;
对所述音频信息进行处理,得到处理后的第一信息,所述第一信息中噪声的输出功率占比小于所述音频信息中噪声的输出功率占比。
优选的,上述的方法,所述电子设备还包括音频输出模组,所述音频采集模组采集的音频信息中还包括回声信息,所述回声信息是音频输出模组输出的音频信息,且所述回声信息是所述音频采集模组通过所述电子设备中预设腔体通道采集得到的。
优选的,上述的方法,所述对所述音频信息进行处理,得到处理后的第一信息,包括:
基于预设的深度神经网络模型对所述音频信息进行降噪处理,得到第一信息,所述第一信息中回声和噪声的输出功率占比均小于所述音频信息中回声和噪声的输出功率占比。
优选的,上述的方法,所述基于预设的深度神经网络模型对所述音频信息进行降噪处理,得到第一信息,包括:
基于预设的噪声处理条件,对所述音频信息中的噪声信息进行处理,并且基于预设的回声处理条件,对所述音频信息中的回声信息进行处理,得到第一信息。
优选的,上述的方法,所述对所述音频信息进行处理,得到处理后的第一信息之后,还包括:
基于预设的优化规则,对所述第一信息进行优化处理,得到第二信息,所述第二信息对应的至少两个评价因素值分别大于相应的预设阈值。
优选的,上述的方法,所述基于预设的优化规则,对所述第一信息进行优化处理,得到第二信息,包括:
基于所述音频信息的采集时刻,分析确定在所述采集时刻调用所述音频采集模组的是第一应用;
基于预设的应用与优化参数之间的对应关系,选择与所述第一应用对应的第一优化参数集合;
基于所述第一优化参数集合对于所述第一信息进行优化处理,得到第二信息。
优选的,上述的方法,所述基于预设的深度神经网络模型对所述音频信息进行降噪处理,得到第一信息,包括:
基于所述音频信息携带的标识信息,分析得到采集所述音频信息的音频采集模组个数;
基于预设的深度神经网络模型与音频采集模组个数的对应关系,选择与所述音频采集模组个数对应的深度神经网络模型;
将所述音频信息输入所述与所述音频采集模组个数对应的深度神经网络模型中进行降噪处理,得到第一信息。
优选的,上述的方法,所述音频采集模组采用微机电系统麦克风MEMS MIC。
一种信息处理装置,包括:
获取单元,用于获取音频采集模组采集的音频信息,所述音频信息中包括目标音频信息和噪声信息,所述音频信息的信噪比满足预设第一条件,所述音频信息的高频谐振点趋向所述音频信息所属音频范围的高频端;
处理单元,用于对所述音频信息进行处理,得到处理后的第一信息,所述第一信息中噪声的输出功率占比小于所述音频信息中噪声的输出功率占比。
一种电子设备,包括:
本体;
设置于所述本体内的音频采集模组,用于采集音频信息,所述音频信息中包括目标音频信息和噪声信息,所述音频信息的信噪比满足预设第一条件,所述音频信息的高频谐振点趋向所述音频信息所属音频范围的高频端;
设置于所述本体内的处理器,用于对所述音频信息进行处理,得到处理后的第一信息,所述第一信息中噪声的输出功率占比小于所述音频信息中噪声的输出功率占比。
经由上述的技术方案可知,与现有技术相比,本申请提供了一种信息处理方法,该方法应用于电子设备,包括:获取音频采集模组采集的音频信息,所述音频信息中包括目标音频信息和噪声信息,所述音频采集模组采集的音频信息的信噪比满足预设第一条件,所述音频信息的高频谐振点趋向所述音频信息所属音频范围的高频端;对所述音频信息进行处理,得到处理后的第一信息,所述第一信息中噪声的输出功率占比小于所述音频信息中噪声的输出功率占比。本方案中,音频采集模组采集的音频信息的信噪比较高,而且其高频谐振点趋向于高频端,保证了音频信息的质量较高,通过对于该音频信息处理,得到的第一信息中噪声的功率占比降低,使得最终得到的信息质量高,从而提高了VOIP的通话质量。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请提供的一种信息处理方法实施例1的流程图;
图2为本申请提供的一种信息处理方法实施例2的流程图;
图3为本申请提供的一种信息处理方法实施例2中电子设备的结构示意图;
图4为本申请提供的一种信息处理方法实施例2中腔体通道的纵截面示意图;
图5为本申请提供的一种信息处理方法实施例3的流程图;
图6为本申请提供的一种信息处理方法实施例4的流程图;
图7为本申请提供的一种信息处理装置实施例的结构示意图;
图8为本申请提供的一种电子设备实施例的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1所示的,为本申请提供的一种信息处理方法实施例1的流程图,该方法应用于一电子设备,该方法包括以下步骤:
步骤S101:获取音频采集模组采集的音频信息;
其中,所述音频信息中包括目标音频信息和噪声信息,所述音频采集模组采集的音频信息的信噪比满足预设第一条件,所述音频信息的高频谐振点趋向所述音频信息所属音频范围的高频端;
其中,所述音频采集模组采用MEMS(Microelectro Mechanical Systems,微机电系统)MIC(麦克风)。
具体的,该音频采集模组符合以下要求:SNR(信噪比Signal-Noise Ratio)取值大于65dB;AOP(Acoustic Overload Point,最大录音声压)的取值大于120dBSPL(SoundPressure Level,声压级)。
具体的,该音频信息的信噪比满足第一预设条件是大于一预设阈值。该预设阈值可以是未采用本申请上述要求的音频采集模组采集得到的音频信息的信噪比。
需要说明的是,本申请中的信息采集模组具有如上要求,相对于未采用上述要求的信息采集模组(如ecm)的信噪比,本申请的信息采集模组采集得到的音频信息的信噪比更高,而且,相对于未采用上述要求的信息采集模组的高频谐振点,本申请的信息采集模组采集得到的音频信息的高频谐振点更加靠近(趋向)该音频信息所属音频范围的高频一端,这样使得通话的通频带的带宽更宽,相应的,采集得的音频信号更加细腻。
步骤S102:对所述音频信息进行处理,得到处理后的第一信息。
其中,所述第一信息中噪声的输出功率占比小于所述音频信息中噪声的输出功率占比。
具体的,本步骤中,是对于该音频信息进行处理,以降低其中的噪声,相应的,该处理得到的第一信息中噪声少于该音频信息中的噪声。
具体的,是通过噪声的输出功率占比表征该第一信息或者音频信息中噪声的情况。
需要说明的是,该对于音频信息进行处理的过程后续实施例中会做详细说明,本实施例中不做详述。
综上,本实施例提供的一种信息处理方法,该方法应用于电子设备,包括:获取音频采集模组采集的音频信息,所述音频信息中包括目标音频信息和噪声信息,所述音频采集模组采集的音频信息的信噪比满足预设第一条件,所述音频信息的高频谐振点趋向所述音频信息所属音频范围的高频端;对所述音频信息进行处理,得到处理后的第一信息,所述第一信息中噪声的输出功率占比小于所述音频信息中噪声的输出功率占比。本方案中,音频采集模组采集的音频信息的信噪比较高,而且其高频谐振点趋向于高频端,保证了音频信息的质量较高,通过对于该音频信息处理,得到的第一信息中噪声的功率占比降低,使得最终得到的信息质量高,从而提高了VOIP的通话质量。
如图2所示的,为本申请提供的一种信息处理方法实施例2的流程图,该方法包括以下步骤:
步骤S201:获取音频采集模组采集的音频信息;
其中,步骤S201与实施例1中的步骤S101一致,本实施例中不做赘述。
步骤S202:基于预设的深度神经网络模型对所述音频信息进行降噪处理,得到第一信息。
其中,所述第一信息中回声和噪声的输出功率占比均小于所述音频信息中回声和噪声的输出功率占比。
深度神经网络模型(Deep Neural Network,DNN)作为机器学习(ML,MachineLearning)领域中一种技术,相对于现有技术中的数字信号处理(digital signalprocessing,DSP)中采用的快速傅里叶变换等计算方式,该深度神经网络模型的深度学习算法,可以实现自我学习并且优化,处理结果的准确度更高。
需要说明的是,本实施例中,该电子设备中除了设置有音频采集模组,还包括音频输出模组,所述音频采集模组采集的音频信息中还包括回声信息,所述回声信息是音频输出模组输出的音频信息,且所述回声信息是所述音频采集模组通过所述电子设备中预设腔体通道采集得到的。
需要说明的是,在音频输出模组输出音频时,该音频采集模组采集到该输出的音频(回声信息),所以,该音频采集模组采集得到的音频信息中包括目标音频信息和噪声信息以及回声信息。
如图3所示的为本实施例中电子设备的结构示意图,包括:电子设备301、音频输出模组302、音频采集模组303以及腔体通道304,图中用箭头表示声音传输方向。
其中,电子设备301上设置开孔305,声音通过该开孔305以及腔体通道304进入音频采集模组303。
其中,该音频输出模组302用于输出音频信息,音频采集模组303用于采集音频,音频输出模组302输出的音频信息作为回声信息通过电子设备上开孔305以及腔体通道304进入音频采集模组303;发声物体(人)发出的目标音频信息通过电子设备上开孔305以及腔体通道304进入音频采集模组303;外部的噪声信息也通过电子设备上开孔305以及腔体通道304进入音频采集模组303,最终,该音频采集模组采集得到的音频信息中包括目标音频信息、噪声信息以及回声信息。
为了实现回声信息只通过电子设备的开孔经过腔体通道进入音频采集模组,需要保证该电子设备腔体通道的密封性较好。
具体的,该腔体通道的密封性大于20dB。
其中,音频信息通过音频采集模组上设置的通孔进入该音频采集模组。
该电子设备中腔体通道的结构具有如下要求:电子设备的开孔与音频采集模组的通孔之间的长度与该开孔的直径具有预设的比例关系;腔体通道的纵截面是矩形或者L形;开孔的直径大于预设阈值。
具体实施中,该预设的比例关系是D/d<3,d大于1mm,其中,D是开孔与通孔之间的长度,d是开孔的直径。
如图4所示的为本实施例中腔体通道的纵截面示意图,其中(a)中腔体通道为矩形,(b)中腔体通道为L形,A端表示的为电子设备的开孔,B端表示的为音频采集模组的通孔。
需要说明的是,具体实施中,由于深度神经网络模型是对于数字信号进行处理,而音频采集模组采集得到的音频信息为模拟信号,所以,在步骤S201和步骤S202之间,会对于该音频信息进行模拟数字转换,将模拟信号的音频信息转换为数字信号,并将数字信号形式的音频信息输入该深度神经网络模型中进行处理。
具体的,该步骤S202具体,包括:
基于预设的噪声处理条件,对所述音频信息中的噪声信息进行处理,并且基于预设的回声处理条件,对所述音频信息中的回声信息进行处理,得到第一信息。
由于该音频信息中包含有目标音频信息、噪声信息以及回声信息,因此,对于该音频信息分别进行噪声处理以及回声处理,得到第一信息。
具体的,该深度神经网络模型中具有消除噪声的算法以及消除回声的算法。
需要说明的是,由于该回声信息只通过电子设备的开孔经过腔体通道进入音频采集模组,则该深度神经网络模型中只需要将该音频采集模组采集的音频与该音频输出模组输出的音频进行比对处理即可确定其中的回声信息,进而处理即可,降低了深度神经网络模型中的算法难度。
具体实施中,电子设备可能有多个音频采集模组,相应的,可以对应音频采集模组的个数设置相应的深度神经网络模型,
具体的,该步骤S202具体包括:
基于所述音频信息携带的标识信息,分析得到采集所述音频信息的音频采集模组个数;
基于预设的深度神经网络模型与音频采集模组个数的对应关系,选择与所述音频采集模组个数对应的深度神经网络模型;
将所述音频信息输入所述与所述音频采集模组个数对应的深度神经网络模型中进行降噪处理,得到第一信息。
其中,不同个数的音频采集模组采集的音频信息,由不同的深度神经网络模型进行分析处理。
其中,该音频信息中携带有采集其的音频采集模组的标识信息,通过分析该音频信息携带的标识信息,即可分析得到音频信息是由几个音频采集模组采集得到。进而基于该对应关系,选择与该音频采集模组个数对应的深度神经网络模型,以使得后续基于该深度神经网络模型对于该音频信息进行处理,得到第一信息。
综上,本实施例提供的一种信息处理方法中,该对所述音频信息进行处理,得到处理后的第一信息,包括:基于预设的深度神经网络模型对所述音频信息进行降噪处理,得到第一信息,所述第一信息中回声和噪声的输出功率占比均小于所述音频信息中回声和噪声的输出功率占比。而且,该深度神经网络模型是与采集音频信息是音频采集模组的个数相应的。本方案中,基于神经网络模型对于音频信息进行处理,使得其中的回声和噪声均减少,VOIP通话更加清晰稳定,提升网络会议和网络教学的体验。
如图5所示的,为本申请提供的一种信息处理方法实施例3的流程图,该方法包括以下步骤:
步骤S501:获取音频采集模组采集的音频信息;
步骤S502:对所述音频信息进行处理,得到处理后的第一信息;
其中,步骤S501-502与实施例1中的步骤S101-102一致,本实施例中不做赘述。
步骤S503:基于预设的优化规则,对所述第一信息进行优化处理,得到第二信息。
其中,所述第二信息对应的至少两个评价因素值分别大于相应的预设阈值。
需要说明的是,本实施例中,是对于进行降噪处理后的第一信息进行优化处理。
具体的,第一信息经过优化处理得到第二信息,基于特定评价因素对于该第二信息进行评价,得到评价因素值,而该评价因素值均大于其相应的预设阈值。
其中,不同的评价因素的阈值不同。
例如,该评价因素包括:N-MOS、S-MOS、TMOS_RCV、TMOS_SND。
具体的,该N-MOS表征噪声抑制指数(noise suppression index),该S-MOS表征语音清晰度指数(speech clarity index),该TMOS_RCV表征上行指数(sending index),该TMOS_SND表示下行指数(receiving index)。
以电子设备免提模式为例,其评价因素值分别能够达到:N-MOS>3.28、S-MOS>3.68、TMOS_RCV>3.2、TMOS_SND>3.6。
如下表1所示的,是采用本申请提供的信息处理方法的评价因素与现有技术中进行处理的评价因素的数值表格。
N-MOS | S-MOS | TMOS_RCV | TMOS_SND | |
本方案 | 3.28 | 3.68 | 3.20 | 3.80 |
现有技术 | 2.24 | 3.58 | 2.30 | 2.90 |
表1
基于上表可知的,经过本申请的信息处理方法的第二信息,其各项评价因素的值均大于现有技术中,所以,该第二信息的性能优于该现有技术中的处理结果,采用该第二信息进行VOIP的通话效果更优。
具体的优化过程,后续实施例中会做详细说明,本实施例中不做详述。
需要说明的是,在具体实施中,可以先采用深度神经网络模型对于音频信息进行降低噪声和消除回音的处理,再对处理后的信息进一步进行优化处理。
具体实施中,该第二信息可以发送给VOIP的对端设备,以实现VOIP通话,并且,由于该第二信息是音频信息分别进行处理以及优化后的信息,其通话效果是能够达到的较优的效果。
综上,本实施例提供的一种信息处理方法,还包括:基于预设的优化规则,对所述第一信息进行优化处理,得到第二信息,所述第二信息对应的至少两个评价因素值分别大于相应的预设阈值。本方案中,对于经过处理的音频信息进一步进行优化处理,使得最终得到的第二信息,基于该第二信息进行的VOIP通话效果更佳。
如图6所示的,为本申请提供的一种信息处理方法实施例4的流程图,该方法包括以下步骤:
步骤S601:获取音频采集模组采集的音频信息;
步骤S602:对所述音频信息进行处理,得到处理后的第一信息;
其中,步骤S601-602与实施例3中的步骤S301-302一致,本实施例中不做赘述。
步骤S603:基于所述音频信息的采集时刻,分析确定在所述采集时刻调用所述音频采集模组的是第一应用;
其中,该音频信息中携带有时间信息,分析该音频信息即可得到其采集时刻。
由于该电子设备中可以安装有多个应用,而很多的应用能够调用音频采集模组进行音频采集,但是由于不同的应用针对音频信息的处理算法不同,而针对相同的音频信息,不同的算法会有不同的处理结果,为此,需要对其进行不同的优化处理。
所以,需要先确定调用该音频采集模组的应用是哪一个,再针对该应用进行优化处理。
步骤S604:基于预设的应用与优化参数之间的对应关系,选择与所述第一应用对应的第一优化参数集合;
其中,由于不同的应用对应不同的优化参数。
其中,电子设备中预设有应用与优化参数之间的对应关系,选择调用该音频采集模组的第一应用对应的第一优化参数集合。
具体的,该优化参数具体是针对EQ(Equaliser,均衡器)曲线在特定频率/频段放大或者缩小响度,以使得优化得到的结果能够达到最优效果的EQ曲线。
作为一个示例,该第一应用是skype应用时,该第一优化参数集合包括:EQ曲线在8kHz降低2dB,在3kHz降低1dB;
作为一个示例,该第一应用是zoom应用时,该第一优化参数集合包括:EQ曲线在6kHz降低1dB,在2kHz提升2dB;
作为一个示例,该第一应用是钉钉应用时,该第一优化参数集合包括:EQ曲线在2kHz提升1.5dB,在800Hz-900Hz降低2dB。
步骤S605:基于所述第一优化参数集合对于所述第一信息进行优化处理,得到第二信息。
其中,基于该第一优化参数集合对于该第一信息进行优化处理,实现针对化的优化处理。
针对不同的应用可以实现不同的优化处理,优化结果更加精细。
需要说明的是,经过本申请中的信息处理方法,对于采集的音频信息进行处理后再进行精细的优化处理,能够实现高清通话质量以及高录音质量。
例如,采用本申请中的信息处理方法,高清通话质量具体包括:抑制环境噪音、语音清晰度提升、语音发送质量、语音接收质量;高录音质量包括:提高语音交互的准确性、应用中语音命令有改进以及针对快速语音笔记的高性能记录。
作为一个具体示例,针对skype应用、zoom应用以及钉钉等现有的VIOP通话涉及的应用,相对于现有技术中的处理方法,本申请中的处理方法,高清通话质量具体能够达到环境噪音降低46%、语音清晰度提升28%、语音发送质量提升31%、语音接收质量提升39%。
需要说明的是,由于VOIP通话效果涉及到的方面比较多,本申请中通过对于Mic性能、Mic的结构通道腔体设计、DSP算法和优化等多个模块因素分别进行优化,整体系统做最优搭配,多个模块间的工作协调统一使VOIP的整体效果达到最优。
综上,本实施例提供的一种信息处理方法中,该基于预设的优化规则,对所述第一信息进行优化处理,得到第二信息,具体包括:基于所述音频信息的采集时刻,分析确定在所述采集时刻调用所述音频采集模组的是第一应用;基于预设的应用与优化参数之间的对应关系,选择与所述第一应用对应的第一优化参数集合;基于所述第一优化参数集合对于所述第一信息进行优化处理,得到第二信息。本方案中,针对不同的应用可以实现不同的优化处理,优化结果更加精细。
与上述本申请提供的一种信息处理方法实施例相对应的,本申请还提供了一种信息处理装置实施例。
如图7所示的为本申请提供的一种信息处理装置实施例的结构示意图,该装置包括以下结构:获取单元701和处理单元702;
其中,获取单元,用于获取音频采集模组采集的音频信息,所述音频信息中包括目标音频信息和噪声信息,所述音频信息的信噪比满足预设第一条件,所述音频信息的高频谐振点趋向所述音频信息所属音频范围的高频端;
其中,处理单元,用于对所述音频信息进行处理,得到处理后的第一信息,所述第一信息中噪声的输出功率占比小于所述音频信息中噪声的输出功率占比。
优选的,该电子设备还包括音频输出模组,所述音频采集模组采集的音频信息中还包括回声信息,所述回声信息是音频输出模组输出的音频信息,且所述回声信息是所述音频采集模组通过所述电子设备中预设腔体通道采集得到的。
优选的,所述音频采集模组采用MEMS MIC。
优选的,该处理单元用于:基于预设的深度神经网络模型对所述音频信息进行降噪处理,得到第一信息,所述第一信息中回声和噪声的输出功率占比均小于所述音频信息中回声和噪声的输出功率占比。
优选的,该处理单元具体用于:
基于预设的噪声处理条件,对所述音频信息中的噪声信息进行处理,并且基于预设的回声处理条件,对所述音频信息中的回声信息进行处理,得到第一信息。
优选的,该装置还包括:
优化单元,用于基于预设的优化规则,对所述第一信息进行优化处理,得到第二信息,所述第二信息对应的至少两个评价因素值分别大于相应的预设阈值。
优选的,该优化单元具体用于:
基于所述音频信息的采集时刻,分析确定在所述采集时刻调用所述音频采集模组的是第一应用;
基于预设的应用与优化参数之间的对应关系,选择与所述第一应用对应的第一优化参数集合;
基于所述第一优化参数集合对于所述第一信息进行优化处理,得到第二信息。
优选的,该处理单元用于:
基于所述音频信息携带的标识信息,分析得到采集所述音频信息的音频采集模组个数;
基于预设的深度神经网络模型与音频采集模组个数的对应关系,选择与所述音频采集模组个数对应的深度神经网络模型;
将所述音频信息输入所述与所述音频采集模组个数对应的深度神经网络模型中进行降噪处理,得到第一信息。
综上,本申请提供了一种信息处理装置,包括:获取单元,用于获取音频采集模组采集的音频信息,所述音频信息中包括目标音频信息和噪声信息,所述音频信息的信噪比满足预设第一条件,所述音频信息的高频谐振点趋向所述音频信息所属音频范围的高频端;处理单元,用于对所述音频信息进行处理,得到处理后的第一信息,所述第一信息中噪声的输出功率占比小于所述音频信息中噪声的输出功率占比。本方案中,音频采集模组采集的音频信息的信噪比较高,而且其高频谐振点趋向于高频端,保证了音频信息的质量较高,通过对于该音频信息处理,得到的第一信息中噪声的功率占比降低,使得最终得到的信息质量高,从而提高了VOIP的通话质量。
与上述本申请提供的一种信息处理方法实施例相对应的,本申请还提供了应用该信息处理方法的电子设备实施例。
如图8所示的为本申请提供的一种电子设备实施例的结构示意图,该电子设备包括以下结构:本体801、设置于本体内的音频采集模组802和处理器803。
其中,音频采集模组,用于采集音频信息,所述音频信息中包括目标音频信息和噪声信息,所述音频信息的信噪比满足预设第一条件,所述音频信息的高频谐振点趋向所述音频信息所属音频范围的高频端;
其中,该音频采集模组采用微机电系统麦克风MEMS MIC。
具体的,该音频采集模组符合以下要求:SNR取值大于65dB;AOP的取值大于120dBSPL。
该音频采集模组在本体的设置要求参考信息处理方法实施例2以及图3所述。
其中,处理器,用于对所述音频信息进行处理,得到处理后的第一信息,所述第一信息中噪声的输出功率占比小于所述音频信息中噪声的输出功率占比。
其中,该电子设备还包括音频输出模组,所述音频采集模组采集的音频信息中还包括回声信息,所述回声信息是音频输出模组输出的音频信息,且所述回声信息是所述音频采集模组通过所述电子设备中预设腔体通道采集得到的。
优选的,该处理器用于:
基于预设的深度神经网络模型对所述音频信息进行降噪处理,得到第一信息,所述第一信息中回声和噪声的输出功率占比均小于所述音频信息中回声和噪声的输出功率占比。
优选的,该处理器具体用于:
基于预设的噪声处理条件,对所述音频信息中的噪声信息进行处理,并且基于预设的回声处理条件,对所述音频信息中的回声信息进行处理,得到第一信息。
优选的,该处理器还用于:
基于预设的优化规则,对所述第一信息进行优化处理,得到第二信息,所述第二信息对应的至少两个评价因素值分别大于相应的预设阈值。
优选的,该处理器具体用于:
基于所述音频信息的采集时刻,分析确定在所述采集时刻调用所述音频采集模组的是第一应用;
基于预设的应用与优化参数之间的对应关系,选择与所述第一应用对应的第一优化参数集合;
基于所述第一优化参数集合对于所述第一信息进行优化处理,得到第二信息。
优选的,该处理器具体用于:
基于所述音频信息携带的标识信息,分析得到采集所述音频信息的音频采集模组个数;
基于预设的深度神经网络模型与音频采集模组个数的对应关系,选择与所述音频采集模组个数对应的深度神经网络模型;
将所述音频信息输入所述与所述音频采集模组个数对应的深度神经网络模型中进行降噪处理,得到第一信息。
本申请提供了一种电子设备,包括:获音频采集模组,用于采集音频信息,所述音频信息中包括目标音频信息和噪声信息,所述音频信息的信噪比满足预设第一条件,所述音频信息的高频谐振点趋向所述音频信息所属音频范围的高频端;处理器,用于对所述音频信息进行处理,得到处理后的第一信息,所述第一信息中噪声的输出功率占比小于所述音频信息中噪声的输出功率占比。本方案中,音频采集模组采集的音频信息的信噪比较高,而且其高频谐振点趋向于高频端,保证了音频信息的质量较高,通过对于该音频信息处理,得到的第一信息中噪声的功率占比降低,使得最终得到的信息质量高,从而提高了VOIP的通话质量。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例提供的装置而言,由于其与实施例提供的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所提供的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所提供的原理和新颖特点相一致的最宽的范围。
Claims (9)
1.一种信息处理方法,应用于电子设备,所述方法包括:
获取音频采集模组采集的音频信息,所述音频信息中包括目标音频信息和噪声信息,所述音频信息的信噪比满足预设第一条件,所述音频信息的高频谐振点趋向所述音频信息所属音频范围的高频端;所述音频信息的信噪比满足预设第一条件为所述音频信息的信噪比大于第三预设阈值;
对所述音频信息进行处理,得到处理后的第一信息,所述第一信息中噪声的输出功率占比小于所述音频信息中噪声的输出功率占比;
所述音频信息中还包括回声信息,所述回声信息是所述电子设备中音频输出模组输出、所述音频采集模组通过所述电子设备中预设腔体通道采集得到的,且回声信息只通过电子设备的开孔经过腔体通道进入音频采集模组,其中,所述预设腔体通道的结构具有如下要求以实现提高音频信息质量:电子设备的开孔与音频采集模组的通孔之间的长度与该开孔的直径具有预设的比例关系、腔体通道的纵截面是矩形或者L形、开孔的直径大于第一预设阈值,所述腔体通道的密封性大于第二预设阈值。
2.根据权利要求1所述的方法,所述对所述音频信息进行处理,得到处理后的第一信息,包括:
基于预设的深度神经网络模型对所述音频信息进行降噪处理,得到第一信息,所述第一信息中回声和噪声的输出功率占比均小于所述音频信息中回声和噪声的输出功率占比。
3.根据权利要求2所述的方法,所述基于预设的深度神经网络模型对所述音频信息进行降噪处理,得到第一信息,包括:
基于预设的噪声处理条件,对所述音频信息中的噪声信息进行处理,并且基于预设的回声处理条件,对所述音频信息中的回声信息进行处理,得到第一信息。
4.根据权利要求1所述的方法,所述对所述音频信息进行处理,得到处理后的第一信息之后,还包括:
基于预设的优化规则,对所述第一信息进行优化处理,得到第二信息,所述第二信息对应的至少两个评价因素值分别大于相应的预设阈值。
5.根据权利要求4所述的方法,所述基于预设的优化规则,对所述第一信息进行优化处理,得到第二信息,包括:
基于所述音频信息的采集时刻,分析确定在所述采集时刻调用所述音频采集模组的是第一应用;
基于预设的应用与优化参数之间的对应关系,选择与所述第一应用对应的第一优化参数集合;
基于所述第一优化参数集合对于所述第一信息进行优化处理,得到第二信息。
6.根据权利要求2所述的方法,所述基于预设的深度神经网络模型对所述音频信息进行降噪处理,得到第一信息,包括:
基于所述音频信息携带的标识信息,分析得到采集所述音频信息的音频采集模组个数;
基于预设的深度神经网络模型与音频采集模组个数的对应关系,选择与所述音频采集模组个数对应的深度神经网络模型;
将所述音频信息输入所述与所述音频采集模组个数对应的深度神经网络模型中进行降噪处理,得到第一信息。
7.根据权利要求1-6任一项所述的方法,所述音频采集模组采用微机电系统麦克风MEMS MIC。
8.一种信息处理装置,包括:
获取单元,用于获取音频采集模组采集的音频信息,所述音频信息中包括目标音频信息和噪声信息,所述音频信息的信噪比满足预设第一条件,所述音频信息的高频谐振点趋向所述音频信息所属音频范围的高频端;所述音频信息的信噪比满足预设第一条件为所述音频信息的信噪比大于第三预设阈值;
处理单元,用于对所述音频信息进行处理,得到处理后的第一信息,所述第一信息中噪声的输出功率占比小于所述音频信息中噪声的输出功率占比;
所述音频信息中还包括回声信息,所述回声信息是电子设备中音频输出模组输出、所述音频采集模组通过所述电子设备中预设腔体通道采集得到的,且回声信息只通过电子设备的开孔经过腔体通道进入音频采集模组,其中,所述预设腔体通道的结构具有如下要求以实现提高音频信息质量:电子设备的开孔与音频采集模组的通孔之间的长度与该开孔的直径具有预设的比例关系、腔体通道的纵截面是矩形或者L形、开孔的直径大于第一预设阈值,所述腔体通道的密封性大于第二预设阈值。
9.一种电子设备,包括:
本体;
设置于所述本体内的音频采集模组,用于采集音频信息,所述音频信息中包括目标音频信息和噪声信息,所述音频信息的信噪比满足预设第一条件,所述音频信息的高频谐振点趋向所述音频信息所属音频范围的高频端;所述音频信息的信噪比满足预设第一条件为所述音频信息的信噪比大于第三预设阈值;
设置于所述本体内的处理器,用于对所述音频信息进行处理,得到处理后的第一信息,所述第一信息中噪声的输出功率占比小于所述音频信息中噪声的输出功率占比;
所述音频信息中还包括回声信息,所述回声信息是所述电子设备中音频输出模组输出、所述音频采集模组通过所述电子设备中预设腔体通道采集得到的,且回声信息只通过电子设备的开孔经过腔体通道进入音频采集模组,其中,所述预设腔体通道的结构具有如下要求以实现提高音频信息质量:电子设备的开孔与音频采集模组的通孔之间的长度与该开孔的直径具有预设的比例关系、腔体通道的纵截面是矩形或者L形、开孔的直径大于第一预设阈值,所述腔体通道的密封性大于第二预设阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011057425.8A CN112202778B (zh) | 2020-09-30 | 2020-09-30 | 一种信息处理方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011057425.8A CN112202778B (zh) | 2020-09-30 | 2020-09-30 | 一种信息处理方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112202778A CN112202778A (zh) | 2021-01-08 |
CN112202778B true CN112202778B (zh) | 2022-09-23 |
Family
ID=74008175
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011057425.8A Active CN112202778B (zh) | 2020-09-30 | 2020-09-30 | 一种信息处理方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112202778B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101207644A (zh) * | 2006-12-19 | 2008-06-25 | 中兴通讯股份有限公司 | 在VoIP通信中降低回声对主观感受影响的方法 |
CN101206862A (zh) * | 2006-12-22 | 2008-06-25 | 中兴通讯股份有限公司 | 声学的回声抵消效果定量测试的方法 |
CN103561184A (zh) * | 2013-11-05 | 2014-02-05 | 武汉烽火众智数字技术有限责任公司 | 基于近端音频信号标定和修正的消除变频回声的方法 |
WO2019134146A1 (zh) * | 2018-01-05 | 2019-07-11 | 深圳市沃特沃德股份有限公司 | 语音采集装置和家电设备 |
CN209857286U (zh) * | 2019-03-22 | 2019-12-27 | 广东美的制冷设备有限公司 | 麦克风组件及空调 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103456305B (zh) * | 2013-09-16 | 2016-03-09 | 东莞宇龙通信科技有限公司 | 终端和基于多个声音采集单元的语音处理方法 |
CN104980337B (zh) * | 2015-05-12 | 2019-11-22 | 腾讯科技(深圳)有限公司 | 一种音频处理的性能提升方法及装置 |
CN206585710U (zh) * | 2017-03-14 | 2017-10-24 | 广东小天才科技有限公司 | 麦克风组件及其电子产品 |
CN108335702A (zh) * | 2018-02-01 | 2018-07-27 | 福州大学 | 一种基于深度神经网络的音频降噪方法 |
CN110364145B (zh) * | 2018-08-02 | 2021-09-07 | 腾讯科技(深圳)有限公司 | 一种语音识别的方法、语音断句的方法及装置 |
CN111261179A (zh) * | 2018-11-30 | 2020-06-09 | 阿里巴巴集团控股有限公司 | 回声消除方法及装置和智能设备 |
CN110265053B (zh) * | 2019-06-29 | 2022-04-19 | 联想(北京)有限公司 | 信号降噪控制方法、装置及电子设备 |
-
2020
- 2020-09-30 CN CN202011057425.8A patent/CN112202778B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101207644A (zh) * | 2006-12-19 | 2008-06-25 | 中兴通讯股份有限公司 | 在VoIP通信中降低回声对主观感受影响的方法 |
CN101206862A (zh) * | 2006-12-22 | 2008-06-25 | 中兴通讯股份有限公司 | 声学的回声抵消效果定量测试的方法 |
CN103561184A (zh) * | 2013-11-05 | 2014-02-05 | 武汉烽火众智数字技术有限责任公司 | 基于近端音频信号标定和修正的消除变频回声的方法 |
WO2019134146A1 (zh) * | 2018-01-05 | 2019-07-11 | 深圳市沃特沃德股份有限公司 | 语音采集装置和家电设备 |
CN209857286U (zh) * | 2019-03-22 | 2019-12-27 | 广东美的制冷设备有限公司 | 麦克风组件及空调 |
Also Published As
Publication number | Publication date |
---|---|
CN112202778A (zh) | 2021-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10553235B2 (en) | Transparent near-end user control over far-end speech enhancement processing | |
JP6849797B2 (ja) | 音響信号の聴取試験および変調 | |
US20190066710A1 (en) | Transparent near-end user control over far-end speech enhancement processing | |
KR101626438B1 (ko) | 오디오 데이터 프로세싱을 위한 방법, 디바이스, 및 시스템 | |
US20180130482A1 (en) | Acoustic echo cancelling system and method | |
EP1667416A2 (en) | Reverberation estimation and suppression system | |
CN105657110B (zh) | 语音通信的回声消除方法及装置 | |
AU2011200494A1 (en) | A speech intelligibility predictor and applications thereof | |
US9699554B1 (en) | Adaptive signal equalization | |
CN102246541A (zh) | 原位堵耳效应测量的系统、方法和助听器 | |
WO2012170128A1 (en) | Generating a masking signal on an electronic device | |
US20140365212A1 (en) | Receiver Intelligibility Enhancement System | |
CN104580764B (zh) | 电话会议系统中的超声配对信号控制 | |
CN112019967B (zh) | 一种耳机降噪方法、装置、耳机设备及存储介质 | |
CN111063363B (zh) | 一种语音获取方法、音频设备和具有存储功能的装置 | |
US20230206936A1 (en) | Audio device with audio quality detection and related methods | |
CN110191397B (zh) | 一种降噪方法及蓝牙耳机 | |
EP2247082B1 (en) | Telecommunication device, telecommunication system and method for telecommunicating voice signals | |
US8868417B2 (en) | Handset intelligibility enhancement system using adaptive filters and signal buffers | |
TWI624183B (zh) | 電話語音處理之方法及其電腦程式 | |
US8804981B2 (en) | Processing audio signals | |
CN112202778B (zh) | 一种信息处理方法、装置和电子设备 | |
CN101699837B (zh) | 一种电话语音输出增益调节的方法、装置和通信终端 | |
JP2008294599A (ja) | 放収音装置、および放収音システム | |
JP4534529B2 (ja) | ハウリング抑圧方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |