CN109273010B - 语音数据处理方法、装置、计算机设备和存储介质 - Google Patents

语音数据处理方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN109273010B
CN109273010B CN201810956497.2A CN201810956497A CN109273010B CN 109273010 B CN109273010 B CN 109273010B CN 201810956497 A CN201810956497 A CN 201810956497A CN 109273010 B CN109273010 B CN 109273010B
Authority
CN
China
Prior art keywords
voice data
different types
channel
preset
packet loss
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810956497.2A
Other languages
English (en)
Other versions
CN109273010A (zh
Inventor
谢单辉
张伟彬
陈东鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Voiceai Technologies Co ltd
Original Assignee
Voiceai Technologies Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Voiceai Technologies Co ltd filed Critical Voiceai Technologies Co ltd
Priority to CN201810956497.2A priority Critical patent/CN109273010B/zh
Publication of CN109273010A publication Critical patent/CN109273010A/zh
Application granted granted Critical
Publication of CN109273010B publication Critical patent/CN109273010B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction

Abstract

本申请涉及一种语音数据处理方法、装置、计算机设备和存储介质。一个实施例中的方法包括:获取不同类型的语音数据以及语音数据对应的通信信道;根据语音数据对应的通信信道以及通信信道与均衡器系数的预设对应关系,得到语音数据对应的均衡器系数;根据均衡器系数对不同类型的语音数据分别进行均衡处理,得到均衡后的语音数据。采用本申请的实施例能够有效模拟不同移动通信设备获取语音数据,且语音数据处理过程无需多台通信设备参与即可实现对不同类型语音数据的获取,因而可以实现对语音数据的高效收集。

Description

语音数据处理方法、装置、计算机设备和存储介质
技术领域
本申请涉及语音处理技术领域,特别是涉及一种语音数据处理方法、装置、计算机设备和存储介质。
背景技术
随着科学技术的发展,语音识别广泛应用于人们的生产生活中,以声纹识别为例,声纹识别是生物识别技术的一种,也称为说话人识别,声纹识别包括说话人辨认和说话人确认两类。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。
跨信道的语音识别具有广泛的应用场景,其中,以跨移动通信设备的语音识别最为常见,原因如下:1.移动通信设备是最方便的录音设备之一。2.线上语音通话也是最高效的沟通方式之一。如客服、远程操作等系统。此时,部署在云端的语音识别系统所获取到的数据是经过通信网络传输的语音数据。数据经过通信网络的上行链路或者整个链路(包括有线通信、无线通信、网络通信等)的处理,通信网络的语音处理链大致如下:通信设备采集->语音信号前处理->信源编码->信道编码->信道传输->信道译码->信源译码->语音信号后处理。
由于通信设备的千差万别以及通信网络制式的不同,这些场景下的语音识别系统所获取的语音信号,既受移动通信设备的影响,还受通信网络的影响。从算法的角度来说,跨信道的语音识别算法需要获取尽可能多的不同移动通信设备、通信网络上的数据。一般来说,获取到的语音数据越多,语音识别算法性能越好。针对上述问题,可以采购多台通信设备分别收集数据,但这种数据收集方法效率不高。
发明内容
基于此,有必要针对上述技术问题,提供一种高效率的语音数据处理方法、装置、计算机设备和存储介质。
一种语音数据处理方法,所述方法包括:
获取不同类型的语音数据以及语音数据对应的通信信道;
根据语音数据对应的通信信道以及通信信道与均衡器系数的预设对应关系,得到所述语音数据对应的均衡器系数;
根据所述均衡器系数对所述不同类型的语音数据分别进行均衡处理,得到均衡后的语音数据。
在一个实施例中,所述根据所述语音数据对应的通信信道以及通信信道与均衡器系数的预设对应关系,得到所述语音数据对应的均衡器系数,之前包括:
发送预设扫频信号至预设不同类型的传声器;
接收所述预设不同类型的传声器反馈的频率响应,所述频率响应由所述预设不同类型的传声器响应所述预设扫频信号得到;
根据所述频率响应以及预设移动设备通信标准,得到所述预设不同类型的传声器对应的均衡器系数;
获取所述预设不同类型的传声器对应的通信信道;
根据所述声纹数据以及所述均衡器系数,得到声纹数据与均衡器系数的预设对应关系。
在一个实施例中,所述根据所述均衡器系数对所述不同类型的语音数据分别进行均衡处理,得到均衡后的语音数据,之后包括:
对所述均衡后的语音数据进行信源编码,得到编码后的语音数据;
对所述编码后的语音数据进行信道误码模拟,得到信道误码模拟后的语音数据。
在一个实施例中,所述对所述编码后的语音数据进行信道误码模拟,之前包括:
根据待模拟通信网络,随机生成误码率;
所述对所述编码后的语音数据进行信道误码模拟,包括:
根据所述误码率对所述编码后的语音数据进行信道比特误码模拟。
在一个实施例中,所述根据所述均衡器系数对所述不同类型的语音数据分别进行均衡处理,得到均衡后的声纹数据,之后包括:
对所述均衡后的语音数据进行信源编码,得到编码后的语音数据;
对所述编码后的语音数据进行信道丢包模拟,得到信道丢包模拟后的语音数据。
在一个实施例中,所述对所述编码后的语音数据进行信道丢包模拟,之前包括:
随机生成网络丢包率;
所述对所述编码后的语音数据进行信道丢包模拟,得到信道丢包模拟后的语音数据,包括:
根据所述网络丢包率对所述编码后的语音数据进行信道丢包模拟,得到丢包模拟输出数据;
对所述丢包模拟输出数据进行译码,并对译码后的数据进行变速处理,得到信道丢包模拟后的语音数据。
在一个实施例中,所述获取不同类型的语音数据,包括:
获取不同类型的模拟量语音数据;
所述获取不同类型的语音数据,之后包括:
将所述不同类型的模拟量语音数据转换为不同类型的数字量语音数据。
一种语音数据处理装置,所述装置包括:
数据获取模块,用于获取不同类型的语音数据以及所述语音数据对应的通信信道;
均衡获取模块,用于根据所述语音数据对应的通信信道以及通信信道与均衡器系数的预设对应关系,得到所述语音数据对应的均衡器系数;
均衡处理模块,用于根据所述均衡器系数对所述不同类型的语音数据分别进行均衡处理,得到均衡后的语音数据。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取不同类型的语音数据以及所述语音数据对应的通信信道;
根据所述语音数据对应的通信信道以及通信信道与均衡器系数的预设对应关系,得到所述语音数据对应的均衡器系数;
根据所述均衡器系数对所述不同类型的语音数据分别进行均衡处理,得到均衡后的声纹数据。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取不同类型的声纹数据以及所述语音数据对应的通信信道;
根据所述语音数据对应的通信信道以及通信信道与均衡器系数的预设对应关系,得到所述语音数据对应的均衡器系数;
根据所述均衡器系数对所述不同类型的语音数据分别进行均衡处理,得到均衡后的语音数据。
上述语音数据处理方法、装置、计算机设备和存储介质,通过获取不同类型的语音数据以及语音数据对应的通信信道,根据语音数据对应的通信信道以及通信信道与均衡器系数的预设对应关系,得到语音数据对应的均衡器系数,再根据均衡器系数对不同类型的语音数据分别进行均衡处理,得到均衡后的语音数据,通过均衡处理可以保证均衡后的语音数据符合移动通信设备的入网要求,这样可以有效模拟不同移动通信设备获取语音数据,且上述语音数据处理过程无需多台通信设备参与即可实现对不同类型语音数据的获取,因而可以实现对语音数据的高效收集。
附图说明
图1为一个实施例中语音数据处理方法的应用环境图;
图2为一个实施例中语音数据处理方法的流程示意图;
图3为一个实施例中获取通信信道与均衡器系数的预设对应关系步骤的流程示意图;
图4为一个实施例中均衡器设计的示意图;
图5为一个实施例中离线和线上语音数据获取点示意图;
图6为一个实施例中信道模拟示意图;
图7为一个实施例中信道误码模拟示意图;
图8为一个实施例中网络丢包模拟示意图;
图9为一个实施例中数据流示意图;
图10为一个实施例中语音数据处理装置的结构框图;
图11为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的声纹数据处理方法,可以应用于如图1所示的应用环境中。其中,麦克风板102与终端104连接,麦克风板可通过有线通信或无线通信方式与终端进行通信。麦克风板包括不同类型的麦克风,麦克风接收声音信号并将声音信号转换为电信号形式的语音数据,不同类型的麦克风产生不同类型的语音数据。终端获取不同类型的语音数据以及语音数据对应的通信信道,根据语音数据对应的通信信道以及通信信道与均衡器系数的预设对应关系,得到不同类型的语音数据对应的均衡器系数;根据均衡器系数对不同类型的语音数据分别进行均衡处理,得到均衡后的语音数据。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。
在一个实施例中,如图2所示,提供了一种语音数据处理方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
步骤202,获取不同类型的语音数据以及语音数据对应的通信信道。
通信信道是数据传输的通路,在计算机网络中信道分为物理信道和逻辑信道。物理信道是指用于传输数据信号的物理通路,由传输介质与有关通信设备组成;逻辑信道是指在物理信道的基础上,发送与接收数据信号的双方通过中间结点所实现的逻辑通路。语音数据包括声纹和文本两部分,声纹是指携带语音信息的声波频谱,声纹不仅具有特定性,而且具有相对稳定性的特点。无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不相同。比如,基于声纹具有特定性和相对稳定性两个特征,侦查人员可将获取的犯罪分子的声纹和嫌疑人的声纹,通过声纹鉴定技术进行检验对比,迅速认定罪犯,为侦查破案提供可靠的证据。
语音数据可以通过麦克风采集,麦克风也可称为为传声器,是将声音信号转换为电信号的能量转换器件。不同类型的移动通信设备,比如不同类型的手机等,其采用的麦克风可能不相同,其对应的通信信道也可能不相同,常见的麦克风包括动圈式麦克风、驻极体麦克风、硅麦克风等。不同类型的语音数据可以通过麦克风板采集,麦克风板再将采集到的语音数据发送至终端进行下一步处理,麦克风板可以包括不同类型的麦克风,比如动圈式麦克风、驻极体麦克风、硅麦克风等。
步骤204,根据语音数据对应的通信信道以及通信信道与均衡器系数的预设对应关系,得到语音数据对应的均衡器系数。
均衡器是指用来校正语音信号幅度频率特性和相位频率特性的部件。均衡器可以调节各种频率成分电信号,通过对各种不同频率的电信号的调节来补偿扬声器和声场的缺陷,补偿和修饰各种声源。
在通信系统中,移动通信设备需要满足CTA入网许可要求,CTA是指对接入公用电信网使用的电信终端设备、无线通信设备和涉及王建互换的电信设备实行进网许可,比如通信行业标准YD/T 1214-2006中入网许可要求中对音频性能的入网要求。因此,在模拟移动通信设备时,需要对每颗麦克风的语音数据通过均衡器进行均衡处理,以保证满足入网要求中的音频性能。比如通过发送扫频信号,测量每个麦克风的频率响应,再根据通信行业标准YD/T 1214-2006对发送频响的要求,计算出均衡器系数。不同麦克风通信信道对应不同的均衡器系数。
步骤206,根据均衡器系数对不同类型的语音数据分别进行均衡处理,得到均衡后的声纹数据。
具体来说,均衡器可采用FIR(Finite Impulse Response,有限长单位冲激响应)滤波器。滤波器公式如下:
Figure BDA0001772795660000081
其中,h[n]为均衡器系数,x[n]为输入信号,y[m]为均衡输出。
上述语音数据处理方法,通过获取不同类型的语音数据以及语音数据对应的通信信道,根据语音数据对应的通信信道以及通信信道与均衡器系数的预设对应关系,得到不同类型的语音数据对应的均衡器系数,再根据均衡器系数对不同类型的语音数据分别进行均衡处理,得到均衡后的语音数据,通过均衡处理可以保证均衡后的语音数据符合移动通信设备的入网要求,这样可以有效模拟不同移动通信设备获取语音数据,且上述语音数据处理过程无需多台通信设备参与即可实现对不同类型语音数据的获取,因而可以实现对语音数据的高效收集。
在一个实施例中,在根据语音数据对应的通信信道以及通信信道与与均衡器系数的预设对应关系,得到语音数据对应的均衡器系数之前,获取通信信道与均衡器系数的预设对应关系。如图3所示,获取通信信道与均衡器系数的预设对应关系的步骤包括:步骤302,发送预设扫频信号至预设不同类型的传声器;步骤304,接收预设不同类型的传声器反馈的频率响应,频率响应由预设不同类型的传声器响应预设扫频信号得到;步骤306,根据频率响应以及预设移动设备通信标准,得到预设不同类型的传声器对应的均衡器系数;步骤308,获取预设不同类型的传声器对应的通信信道;步骤310,根据通信信道以及预设不同类型的传声器对应的均衡器系数,得到通信信道与均衡器系数的预设对应关系。
通信信道与均衡器系数的预设对应关系可通过如下方式得到,如图4所示,首先通过人工嘴播放扫频信号,每个麦克风经过音腔和ADC(Analog-to-Digital Converter,指模/数转换器或者模数转换器)转换后,分析数据以获取设备的频响。再根据设备的频响以及YD/T 1214-2006通信标准中对频响和响度的要求,计算出均衡器系数h[n]。之后将均衡器系数h[n]固定,储存在均衡器设计算法中。通过已校正均衡器系数的均衡器对麦克风声纹数据进行均衡处理,得到均衡处理后的数据。
在不同的应用场景,声纹识别系统在移动通信设备的语音数据获取点有离线和线上两个位置,如图5所示。不同设备的声音存在两个方面的差异,一是不同设备录音的传感器之间的差异,二是不同通信网络传输对声音的扭曲。由于用户选择录音设备和通信网络的随意性,使得声纹识别的训练和识别,或者注册和验证存在设备不匹配的问题,从而严重影响声纹识别的性能。因此,需要对线上数据进行模拟。具体来说,不同的通信网络采用不同的编码方式,例如,固话采用G711-A律格式,GSM(Global System for MobileCommunication,全球移动通信系统)2G采用HR(半速率编码译码器)/FR(全速率编码译码器)/EFR(增强型全速率编码译码器),TD-SCDMA(Time Division-Synchronous CodeDivision Multiple Access,时分同步码分多址)和WCDMA(Wideband Code DivisionMultiple Access,宽带码分多址)采用AMR,4G LTE(Long Term Evolution,通用移动通信技术的长期演进)采用AMR-WB(可变速率多模式宽带语音编解码器)和EVS编解码器,对应IP(Internet Protocol,网络之间互连的协议)网络有speex、skype以及微信等通话。
如图5所示,通信音频链除语音编解码器外,信道传输并非百分百正确,是需要考虑信道的误码。此外,在IP网络和LTE网络下,电路交换变成分组交换,链路的延时随时可能出现抖动,带来丢包、数据堆积或者缺失,这时需要丢包隐藏或者慢放/快播数据。具体信道模拟流程如图6所示,原始数据经信源编码后,进行信道误码模拟以及丢包模拟,再进行信源解码,解码之后进行丢包补偿处理及抖动变速模拟,输出信道模拟数据。
在一个实施例中,在根据均衡器系数对不同类型的语音数据分别进行均衡处理,得到均衡后的语音数据之后还包括:对均衡后的语音数据进行信源编码,得到编码后的语音数据;对编码后的语音数据进行信道误码模拟,得到信道误码模拟后的语音数据。其中,在对编码后的语音数据进行信道误码模拟之前包括:根据待模拟通信网络,随机生成误码率;对编码后的语音数据进行信道误码模拟包括:根据误码率对编码后的语音数据进行信道比特误码模拟。根据不同待模拟的通信网络的制式,随机生成一定范围的误码率,对信源编码后的数据进行比特随机误码,即0变1,1变0。如图7所示,对语音PCM(Pulse CodeModulation,脉冲编码调制)数据或wav格式文件进行语音编码,之后经过信道,再进行语音译码,输出语音PCM数据。
在一个实施例中,根据均衡器系数对不同类型的语音数据分别进行均衡处理,得到均衡后的声纹数据之后包括:对均衡后的语音数据进行信源编码,得到编码后的语音数据;对编码后的语音数据进行信道丢包模拟,得到信道丢包模拟后的语音数据。其中,对编码后的语音数据进行信道丢包模拟之前包括:随机生成网络丢包率,对编码后的语音数据进行信道丢包模拟,得到信道丢包模拟后的语音数据,包括:根据网络丢包率对编码后的语音数据进行信道丢包模拟,得到丢包模拟输出数据;对丢包模拟输出数据进行译码,并对译码后的数据进行变速处理,得到信道丢包模拟后的语音数据。如图8所示,对IP网络通信丢包率进行模拟,随机生成丢包率,比如0-10%,对语音PCM数据或wav格式文件进行语音编码,之后经过信道丢包模拟,再进行语音译码,输出语音PCM数据,再对其进行变速处理。在丢包情况下,后处理进行丢包补偿以及抖动隐藏模拟,网络抖动需要对数据进行拉升或者压缩,以隐藏延时的抖动。变速算法可以采用内插或抽取,也可以使用抖动缓冲管理算法。
在一个实施例中,获取不同类型的语音数据包括:获取不同类型的模拟量语音数据,获取不同类型的语音数据之后包括:将不同类型的模拟量语音数据转换为不同类型的数字量语音数据。比如,通过采集器采集数据,采集器包括两块PCB(Printed CircuitBoard,印制电路板)板,其中一块板为麦克风板,可承载多颗不同类型的麦克风。另一块板为同步采集的ADC板卡,对数据进行转换以及进行简单的预处理,将处理后的数据通过USB(Universal Serial Bus,通用串行总线)上传至上位机,通过数字量传输信号可以增强信号的抗干扰性。上位机作为主控设备,对采集到的每个数据进行均衡。其中,均衡操作也可放入板卡中处理,将均衡处理后的数据存储。实际应用中可根据功能场景所需,实时调用对应的通信信道对数据进行模拟。采用即时模拟方法,数据不做任何存储。如果每个模拟后的数据都进行存储,将占用非常大的空间,例如通常模拟10种左右的通信信道,配合8通道的数据,总共有8×10=80倍的数据扩展。即时模拟后的数据不需要存储,可直接送入声纹识别系统进行训练或者作为识别系统的注册,其数据流如图9所示。
应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图10所示,提供了一种语音数据处理装置,包括:数据获取模块1002、均衡获取模块1004和均衡处理模块1006,其中:数据获取模块,用于获取不同类型的语音数据以及语音数据对应的通信信道;均衡获取模块,用于根据语音数据对应的通信信道以及通信信道与均衡器系数的预设对应关系,得到语音数据对应的均衡器系数;均衡处理模块,用于根据均衡器系数对不同类型的语音数据分别进行均衡处理,得到均衡后的语音数据。
在一个实施例中,均衡获取模块之前还包括扫频模块,用于发送预设扫频信号至预设不同类型的传声器;频响模块,用于接收预设不同类型的传声器反馈的频率响应,频率响应由预设不同类型的传声器响应预设扫频信号得到;均衡器系数获取模块,用于根据频率响应以及预设移动设备通信标准,得到预设不同类型的传声器对应的均衡器系数;信道获取模块,用于获取预设不同类型的传声器对应的通信信道;对应关系生成模块,用于根据通信信道以及预设不同类型的传声器对应的均衡器系数,得到通信信道与均衡器系数的预设对应关系。
在一个实施例中,均衡处理模块之后还包括信源编码模块,用于对均衡后的声纹数据进行信源编码,得到编码后的语音数据;误码模拟模块,用于对编码后的语音数据进行信道误码模拟,得到信道误码模拟后的语音数据。
在一个实施例中,误码模拟模块包括误码率生成单元,用于根据待模拟通信网络,随机生成误码率;信道比特误码模拟单元,用于根据误码率对编码后的语音数据进行信道比特误码模拟。
在一个实施例中,均衡处理模块之后还包括编码模块,用于对均衡处理后的语音数据进行信源编码,得到编码后的语音数据;丢包模拟模块,用于对编码后的语音数据进行信道丢包模拟,得到信道丢包模拟后的语音数据。
在一个实施例中,丢包模拟模块之前包括丢包率生成模块,用于随机生成网络丢包率,丢包模拟模块包括丢包输出单元,用于根据网络丢包率对编码后的语音数据进行信道丢包模拟,得到丢包模拟输出数据;丢包处理单元,用于对丢包模拟输出数据进行译码,并对译码后的数据进行变速处理,得到信道丢包模拟后的语音数据。
在一个实施例中,数据获取模块还用于获取不同类型的模拟量语音数据,数据获取模块之后还包括数据转换模块,用于将不同类型的模拟量语音数据转换为不同类型的数字量语音数据。
关于语音数据处理装置的具体限定可以参见上文中对于语音数据处理方法的限定,在此不再赘述。上述语音数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音数据处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取不同类型的语音数据以及语音数据对应的通信信道,根据语音数据对应的通信信道以及通信信道与均衡器系数的预设对应关系,得到语音数据对应的均衡器系数;根据均衡器系数对不同类型的语音数据分别进行均衡处理,得到均衡后的语音数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:发送预设扫频信号至预设不同类型的传声器,接收预设不同类型的传声器反馈的频率响应,频率响应由预设不同类型的传声器响应预设扫频信号得到;根据频率响应以及预设移动设备通信标准,得到预设不同类型的传声器对应的均衡器系数;获取预设不同类型的传声器对应的通信信道,根据通信信道以及预设不同类型的传声器对应的均衡器系数,得到通信信道与均衡器系数的预设对应关系。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对均衡后的语音数据进行信源编码,得到编码后的语音数据;对编码后的语音数据进行信道误码模拟,得到信道误码模拟后的语音数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据待模拟通信网络,随机生成误码率;根据误码率对编码后的语音数据进行信道比特误码模拟。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对均衡后的语音数据进行信源编码,得到编码后的语音数据;对编码后的语音数据进行信道丢包模拟,得到信道丢包模拟后的语音数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:随机生成网络丢包率,根据网络丢包率对编码后的语音数据进行信道丢包模拟,得到丢包模拟输出数据;对丢包模拟输出数据进行译码,并对译码后的数据进行变速处理,得到信道丢包模拟后的语音数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取不同类型的模拟量语音数据,将不同类型的模拟量语音数据转换为不同类型的数字量语音数据。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取不同类型的语音数据以及语音数据对应的通信信道,根据语音数据对应的通信信道以及通信信道与均衡器系数的预设对应关系,得到语音数据对应的均衡器系数;根据均衡器系数对不同类型的语音数据分别进行均衡处理,得到均衡后的语音数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:发送预设扫频信号至预设不同类型的传声器,接收预设不同类型的传声器反馈的频率响应,频率响应由预设不同类型的传声器响应预设扫频信号得到;根据频率响应以及预设移动设备通信标准,得到预设不同类型的传声器对应的均衡器系数;获取预设不同类型的传声器对应的通信信道,根据通信信道以及预设不同类型的传声器对应的均衡器系数,得到通信信道与均衡器系数的预设对应关系。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对均衡后的语音数据进行信源编码,得到编码后的语音数据;对编码后的语音数据进行信道误码模拟,得到信道误码模拟后的语音数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据待模拟通信网络,随机生成误码率;根据误码率对编码后的语音数据进行信道比特误码模拟。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对均衡后的语音数据进行信源编码,得到编码后的语音数据;对编码后的语音数据进行信道丢包模拟,得到信道丢包模拟后的语音数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:随机生成网络丢包率,根据网络丢包率对编码后的语音数据进行信道丢包模拟,得到丢包模拟输出数据;对丢包模拟输出数据进行译码,并对译码后的数据进行变速处理,得到信道丢包模拟后的语音数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取不同类型的模拟量语音数据,将不同类型的模拟量语音数据转换为不同类型的数字量语音数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种语音数据处理方法,所述方法包括:
获取不同类型的语音数据以及所述语音数据对应的通信信道,所述通信信道是指数据传输的通路;
根据所述语音数据对应的通信信道以及通信信道与均衡器系数的预设对应关系,得到所述语音数据对应的均衡器系数;
根据所述均衡器系数对所述不同类型的语音数据分别进行均衡处理,得到均衡后的语音数据;
所述根据所述语音数据对应的通信信道以及通信信道与均衡器系数的预设对应关系,得到所述语音数据对应的均衡器系数之前,包括:
发送预设扫频信号至预设不同类型的传声器;
接收所述预设不同类型的传声器反馈的频率响应,所述频率响应由所述预设不同类型的传声器响应所述预设扫频信号得到;
根据所述频率响应以及预设移动设备通信标准,得到所述预设不同类型的传声器对应的均衡器系数;
获取所述预设不同类型的传声器对应的通信信道;
根据所述通信信道以及所述预设不同类型的传声器对应的均衡器系数,得到通信信道与均衡器系数的预设对应关系。
2.根据权利要求1所述的方法,其特征在于,所述根据所述均衡器系数对所述不同类型的语音数据分别进行均衡处理,得到均衡后的语音数据,之后包括:
对所述均衡后的语音数据进行信源编码,得到编码后的语音数据;
对所述编码后的语音数据进行信道误码模拟,得到信道误码模拟后的语音数据。
3.根据权利要求2所述的方法,其特征在于,所述对所述编码后的语音数据进行信道误码模拟,之前包括:
根据待模拟通信网络,随机生成误码率;
所述对所述编码后的语音数据进行信道误码模拟,包括:
根据所述误码率对所述编码后的语音数据进行信道比特误码模拟。
4.根据权利要求1所述的方法,其特征在于,所述根据所述均衡器系数对所述不同类型的语音数据分别进行均衡处理,得到均衡后的语音数据,之后包括:
对所述均衡后的语音数据进行信源编码,得到编码后的语音数据;
对所述编码后的语音数据进行信道丢包模拟,得到信道丢包模拟后的语音数据。
5.根据权利要求4所述的方法,其特征在于,所述对所述编码后的语音数据进行信道丢包模拟,之前包括:
随机生成网络丢包率;
所述对所述编码后的语音数据进行信道丢包模拟,得到信道丢包模拟后的语音数据,包括:
根据所述网络丢包率对所述编码后的语音数据进行信道丢包模拟,得到丢包模拟输出数据;
对所述丢包模拟输出数据进行译码,并对译码后的数据进行变速处理,得到信道丢包模拟后的语音数据。
6.根据权利要求1所述的方法,其特征在于,所述获取不同类型的语音数据,包括:
获取不同类型的模拟量语音数据;
所述获取不同类型的语音数据,之后包括:
将所述不同类型的模拟量语音数据转换为不同类型的数字量语音数据。
7.一种语音数据处理装置,其特征在于,所述装置包括:
数据获取模块,用于获取不同类型的语音数据以及所述语音数据对应的通信信道,所述通信信道是指数据传输的通路;
均衡获取模块,用于根据所述语音数据对应的通信信道以及通信信道与均衡器系数的预设对应关系,得到所述语音数据对应的均衡器系数;
均衡处理模块,用于根据所述均衡器系数对所述不同类型的语音数据分别进行均衡处理,得到均衡后的语音数据;
所述装置还包括扫频模块,用于发送预设扫频信号至预设不同类型的传声器;频响模块,用于接收预设不同类型的传声器反馈的频率响应,频率响应由预设不同类型的传声器响应预设扫频信号得到;均衡器系数获取模块,用于根据频率响应以及预设移动设备通信标准,得到预设不同类型的传声器对应的均衡器系数;信道获取模块,用于获取预设不同类型的传声器对应的通信信道;对应关系生成模块,用于根据通信信道以及预设不同类型的传声器对应的均衡器系数,得到通信信道与均衡器系数的预设对应关系。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
信源编码模块,用于对均衡后的声纹数据进行信源编码,得到编码后的语音数据;误码模拟模块,用于对编码后的语音数据进行信道误码模拟,得到信道误码模拟后的语音数据。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN201810956497.2A 2018-08-21 2018-08-21 语音数据处理方法、装置、计算机设备和存储介质 Active CN109273010B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810956497.2A CN109273010B (zh) 2018-08-21 2018-08-21 语音数据处理方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810956497.2A CN109273010B (zh) 2018-08-21 2018-08-21 语音数据处理方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN109273010A CN109273010A (zh) 2019-01-25
CN109273010B true CN109273010B (zh) 2020-08-11

Family

ID=65154218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810956497.2A Active CN109273010B (zh) 2018-08-21 2018-08-21 语音数据处理方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN109273010B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111653283B (zh) * 2020-06-28 2024-03-01 讯飞智元信息科技有限公司 一种跨场景声纹比对方法、装置、设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008139623A (ja) * 2006-12-04 2008-06-19 Nippon Telegr & Teleph Corp <Ntt> ディジタル電話機、音補正装置、方法、プログラム及びその記録媒体
RU2626037C2 (ru) * 2012-02-24 2017-07-21 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство для обеспечения аудиосигнала для воспроизведения преобразователем звука, система, способ (варианты) и компьютерная программа
CN104079247B (zh) * 2013-03-26 2018-02-09 杜比实验室特许公司 均衡器控制器和控制方法以及音频再现设备
CN104078050A (zh) * 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
KR20170030384A (ko) * 2015-09-09 2017-03-17 삼성전자주식회사 음향 조절 장치 및 방법과, 장르 인식 모델 학습 장치 및 방법

Also Published As

Publication number Publication date
CN109273010A (zh) 2019-01-25

Similar Documents

Publication Publication Date Title
KR20190026234A (ko) 비선형 특성을 갖는 오디오 필터를 이용하여 오디오 신호를 처리하는 방법 및 장치
US9294834B2 (en) Method and apparatus for reducing noise in voices of mobile terminal
EP3252767B1 (en) Voice signal processing method, related apparatus, and system
CN112017687B (zh) 一种骨传导设备的语音处理方法、装置及介质
BRPI0812029B1 (pt) método de recuperar dados ocultados, dispositivo de telecomunicações, aparelho de ocultar dados, método de ocultar dados e caixa de conjunto superior
JP6608380B2 (ja) 耐雑音性を改良した通信システム、方法および装置
BR112021012308A2 (pt) Aparelho e método para separação de fonte com o uso de uma estimativa e controle de qualidade de som
CN109273010B (zh) 语音数据处理方法、装置、计算机设备和存储介质
JP2023548707A (ja) 音声強調方法、装置、機器及びコンピュータプログラム
US9295423B2 (en) System and method for audio kymographic diagnostics
US20220150624A1 (en) Method, Apparatus and Computer Program for Processing Audio Signals
CN107636757A (zh) 多声道音频信号的编码
CN109215688A (zh) 同场景音频处理方法、装置、计算机可读存储介质及系统
JP2024502287A (ja) 音声強調方法、音声強調装置、電子機器、及びコンピュータプログラム
CN108962273A (zh) 一种麦克风的音频输出方法和装置
CN112992168B (zh) 语音降噪器训练方法、装置、计算机设备和存储介质
US20180254056A1 (en) Sounding device, audio transmission system, and audio analysis method thereof
CN111145793B (zh) 音频处理方法和装置
US20220406317A1 (en) Conference terminal and embedding method of audio watermarks
CN215770500U (zh) 一种声纹识别语音评测装置
JP5792689B2 (ja) 送話ラウドネス定格情報測定装置、及び送話ラウドネス定格情報測定方法
CN107680607B (zh) 一种信号压缩方法、信号解压方法及其装置
CN113707163A (zh) 语音处理方法及其装置和模型训练方法及其装置
CN114267369A (zh) 一种基于均衡器的语音数据增强方法、装置及可读介质
CN115376546A (zh) 受话器异音识别方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant