CN110996208A - 一种无线耳机及其降噪方法 - Google Patents
一种无线耳机及其降噪方法 Download PDFInfo
- Publication number
- CN110996208A CN110996208A CN201911283264.1A CN201911283264A CN110996208A CN 110996208 A CN110996208 A CN 110996208A CN 201911283264 A CN201911283264 A CN 201911283264A CN 110996208 A CN110996208 A CN 110996208A
- Authority
- CN
- China
- Prior art keywords
- noise
- noise reduction
- scene
- learning network
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
- H04R1/1041—Mechanical or electronic switches, or control elements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/05—Noise reduction with a separate noise microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2420/00—Details of connection covered by H04R, not provided for in its groups
- H04R2420/03—Connection circuits to selectively connect loudspeakers or headphones to amplifiers
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
- Headphones And Earphones (AREA)
Abstract
本公开实施例提供了一种无线耳机及其降噪方法,所述无线耳机包括麦克、接口以及存储器。麦克配置为采集音频信号;接口配置为接收所采集的音频信号;存储器上与多个噪声场景类别分别对应地存储有多个学习网络。所述无线耳机还包括处理器,其配置为:对所接收的音频信号进行分类,以确定所处的噪声场景的类别;基于所确定的噪声场景的类别,调用对应的学习网络对所述音频信号进行降噪处理。使得无线耳机能够通过小的学习网络,达到大规模学习网络所能达到的降噪效果,通过降低深度神经网络的运算复杂度,实现减少运算资源,增加运算速度。另外上述技术方案避免了对耳机腔体和尺寸的要求,降低了耳机生产成本。
Description
技术领域
本公开涉及通讯设备领域,尤其涉及一种无线耳机及其降噪方法。
背景技术
随着社会进步和人民生活水平的提高,耳机已成为人们生活中必不可少的生活用品。人们常常在大街,公共汽车,地铁接听和拨打电话,这类环境中的噪声,会被耳机的通话麦克风所拾取,和我们说话的内容混到一起,被上行发送到对方电话的听筒中,从而影响对方接听电话的语音质量,因此耳机的降噪技术是十分有必要的。
目前无线蓝牙耳机的降噪算法的性能及复杂度直接影响着耳机的功耗、成本以及用户体验,因此为了实现较好的降噪效果,多采用多麦克降噪方案。考虑到功耗和成本,双麦克波束成形方案也是常采用的一种方案。该方案对周围环境噪声和方向性干扰声源都有比较好的降噪效果,但缺点是依赖于双麦克之间的相位差来降噪,对腔体设计和双麦克之间的一致性有较高的要求,提高了设计复杂度和产品成本,并且为保证降噪效果双麦克之间要求保留一定的间距,但是目前的耳机尺寸越小越有利于市场推广,因此双麦克耳机方案逐渐满足不了双麦克降噪算法对距离的要求。
发明内容
针对现有技术中存在的上述技术问题,本公开提供了一种无线耳机及其降噪方法,使得无线耳机能够用小的学习网络,达到大规模学习网络所能达到的降噪效果,且无需多麦克或双麦克的结构设计,从而使得耳机尺寸紧凑,结构简单,减少运算资源,增加运算速度,降低耳机成本。
根据本公开的第一方案,提供了一种无线耳机,所述无线耳机包括麦克、接口以及存储器。麦克配置为采集音频信号;接口配置为接收所采集的音频信号;存储器上与多个噪声场景类别分别对应地存储有多个学习网络。
根据本公开的第二方案,还提供了一种无线耳机的降噪方法,所述降噪方法包括:接收由麦克采集的音频信号;对所接收的音频信号进行分类,以确定所处的噪声场景的类别;以及基于所确定的噪声场景的类别,调用对应的学习网络对所述音频信号进行降噪处理。
在一些实施例中,所述麦克为单个。
与现有技术相比,本公开实施例的有益效果在于:本公开实施例无线耳机在存储器上存储有与多个噪声场景类别分别对应的多个学习网络,以及处理器能够基于接收的音频信号按噪声场景的类别进行分类,并调用对应的学习网络对接收的音频信号进行降噪处理,使得无线耳机能够通过小的学习网络,达到大规模学习网络所能达到的降噪效果,通过降低深度神经网络的运算复杂度,实现减少运算资源,增加运算速度。另外上述技术方案不依赖于双麦克或者多麦克的特殊设计,利用单麦克也能够实现高效降噪,降低了对耳机的构件配置、腔体和尺寸的要求,使得耳机结构更紧凑,降低了耳机的制造成本。
附图说明
在不一定按比例绘制的附图中,相同的附图标记可以在不同的视图中描述相似的部件。具有字母后缀或不同字母后缀的相同附图标记可以表示相似部件的不同实例。附图大体上通过举例而不是限制的方式示出各种实施例,并且与说明书以及权利要求书一起用于对所公开的实施例进行说明。在适当的时候,在所有附图中使用相同的附图标记指代同一或相似的部分。这样的实施例是例证性的,而并非旨在作为本装置或方法的穷尽或排他实施例。
图1为根据本公开实施例的无线耳机的结构框图;
图2为根据本公开实施例的无线耳机的降噪方法的第一流程图;
图3为根据本公开实施例的无线耳机的降噪方法的第二流程图;
图4为根据本公开实施例的用于存储学习网络的字段结构的示意图;
图5为根据本公开实施例的对用于降噪的学习网络进行训练的第三流程图;
图6为根据本公开实施例的对用于降噪的学习网络进行训练的第四流程图。
图中的附图标记所表示的构件:
100-无线耳机;110-麦克;120-接口;130-存储器;131-学习网络;132-操作系统;140-处理器。
具体实施方式
为使本领域技术人员更好的理解本公开的技术方案,下面结合附图和具体实施方式对本公开作详细说明。下面结合附图和具体实施例对本公开的实施例作进一步详细描述,但不作为对本公开的限定。
本公开中使用的“包括”或者“包含”等类似的词语意指在该词前的要素涵盖在该词后列举的要素,并不排除也涵盖其他要素的可能。
本公开使用的所有术语(包括技术术语或者科学术语)与本公开所属领域的普通技术人员理解的含义相同,除非另外特别定义。还应当理解,在诸如通用字典中定义的术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非这里明确地这样定义。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
根据本公开实施例,提供了一种无线耳机,如图1所示,所述无线耳机100包括麦克110、接口120以及存储器130。麦克110配置为采集音频信号;接口120配置为接收所采集的音频信号;存储器130上与多个噪声场景类别分别对应地存储有多个学习网络131。所述无线耳机100还可以包括处理器140,其配置为:对所接收的音频信号进行分类,以确定所处的噪声场景的类别;基于所确定的噪声场景的类别,调用对应的学习网络131对所述音频信号进行降噪处理。
存储器130可包括只读存储器(ROM)、闪存、随机存取存储器(RAM)、诸如同步DRAM(SDRAM)或Rambus DRAM的动态随机存取存储器(DRAM)、静态存储器(例如,闪速存储器、静态随机存取存储器)等,在其上存储有任何格式的计算机可执行指令。该计算机程序指令可以由处理器140访问,从ROM或任何其它合适的存储位置读取,加载到RAM以供处理器140执行。例如,存储器130可以存储一个或更多软件应用程序。例如,在一些实施例中,存储在存储器130的软件应用程序可以包括用于常见无线耳机100的软件控制的操作系统132,例如但不限于安卓操作系统、华为鸿蒙操作系统、苹果的iso操作系统等。
在一些实施例中,所述处理器140可以采用ARM公司的微处理器、FPGA(现场可编程门阵列)、ASIC(特定用途集成电路)、SOC(片上系统)和DSP(数字信号处理)芯片中的任何一种来实现。
可以理解的是,在无线耳机100的存储器130上预先存储多个训练好的学习网络131,该学习网络131可以与多个噪声场景类别分别对应的,场景类别可以包括火车站、地铁车厢以及公共汽车等,当然也可为某种特殊环境噪声,例如车辆加工工厂、机械制造厂等具有一定特殊噪音的场景,本申请在此不做出具体限定。如此,基于噪声场景类别,就可以访问/调用存储器130上所存储的与该噪声场景类别对应的、适用于该噪声场景类别下的主动除噪的学习网络131。
可以理解的是,处理器140能够对接口120接收到的音频信号进行分类,再基于确定的噪声场景的类别,对无线耳机100的存储器130中的学习网络131进行调用,以实现对音频信号的降噪处理,为用户提供经降噪后的音频信号。在一些实施例中,所述分类可以利用各种分类算法来实现,例如但不限于逻辑回归算法、基于高斯混合模型的分类算法、基于隐马尔可夫模型的分类算法、以及分类神经网络中的任何一种来实现。为了提高分类算法的精确性并降低分类计算的复杂度,还可以让无线耳机100与智能设备(图中未示出)进行通信,以从其的GPS单元获取当前位置,例如但不限于火车站、隧道、地铁车厢、剧场等,由此能够基于当前位置对噪声场景进行分类。这些分类算法中,例如分类神经网络可以预先利用各种噪声场景下的语音信号及该噪声场景构成的训练样本的集合来进行训练好,训练好的分类神经网络(图中为示出)也可以存储在存储器130上以供处理器140随时调用。
例如,当用户处于地铁站内时,其噪声大多由地铁站内广播以及周围人声所造成的,处于该噪声场景下的无线耳机100的接口120接收到含有人声以及广播声等噪声的音频信号,此时,该无线耳机100的存储器130内已预先存储好与该噪声场景相对应的学习网络131,处理器140在确定该噪声场景的类别后,能够基于确定的结果调用存储器130内相应的学习网络131,以对含有噪声的音频信号进行降噪处理,从而更好的凸显人声,提高用户的收听质量。
无线耳机100在存储器130上存储有与多个噪声场景类别分别对应的多个学习网络131,以及处理器140能够基于接收的音频信号按噪声场景的类别进行分类,并调用对应的学习网络131对接收的音频信号进行降噪处理,使得无线耳机100能够通过小的学习网络,达到大规模学习网络所能达到的降噪效果,通过降低深度神经网络的运算复杂度,实现减少运算资源,增加运算速度。另外,上述技术方案不依赖于双麦克或多麦克的特殊配置,利用单麦克也能够实现良好及时的降噪效果,降低了对耳机腔体和尺寸的要求,降低了耳机生产成本。
在一些实施例中,所述处理器140还配置为:判断所述噪声场景类别是否变化,在噪声场景类别变化的情况下调用与变化后的噪声场景类别所对应的学习网络131进行降噪处理。
可以理解的是,用户在佩戴无线耳机100时,接口120接收到的音频信号所处的噪声场景会经常变化,例如当用户在地铁站内时,其所处的噪声场景的噪声是由广播以及人声产生的噪声,此时该噪声场景为第一噪声场景,当用户由地铁站内进入地铁车厢内时,其所处的噪声场景的噪声是由列车行驶产生的噪声,此时该噪声场景为第二噪声场景,可见,处理器140可以在第一噪声场景下利用与其对应的学习网络131进行降噪处理,而在由所处的第一噪声场景变为第二噪声场景时,可以基于对接收的音频信号进行分类的确认结果而判断出噪声场景类别的该变化,并相应调用变化后的噪声场景类别,也就是与第二噪声场景类别所对应的学习网络131进行降噪处理。如此,既能够在噪声场景类别变化时,对所述音频信号进行实时降噪处理,还能够在噪声场景类别没有变化时,依然持续利用当前学习网络131的降噪处理,从而能够在持续降噪的同时节省处理器140的运算资源,提高运算速度,也能够避免处理器140在确认噪声场景类别没变化时,重新调用存储器130内的学习网络131。
在一些实施例中,如上面所述,所述存储器130上还可以存储有操作系统132,所述处理器140还配置为:利用所述操作系统132的二级线程在后台进行所述分类。上述操作系统132支持多任务操作,包括无线耳机100的常规任务,例如播放、拾音等,使得计算资源和供电优先应用于常规任务,在计算资源和供电富余的情况下,可利用该操作系统132的二级线程在后台进行对噪声场景的分类工作,以提高系统主频利用率以及降低系统运算所需的时钟频率,从而达到降低系统功耗和延长无线耳机100的待机时间的目的。
在一些实施例中,所述多个学习网络131的构造相同而节点的权值不同,所述处理器140还配置为:在噪声场景类别变化的情况下,更新当前调用的学习网络131的各个节点的权值以进行降噪处理。具体说来,学习网络131的构造可以包括其层数、激活函数、各层网络节点数量、网络节点之间的拓扑连接关系等。
根据上述,由于多个学习网络131的构造是相同的,仅是其节点的权值不同,存储器130将分别单独存储与噪声场景类别相对应的各学习网络131节点的权值,可理解的是,各个学习网络131采用的运算方法是相同的,针对不同的噪声场景类别其运算中用到的运算参数是不同的,也就是噪声场景类别与学习网络131的节点的权值是具有一一对应关系的。在无线耳机100的处理器140判断噪声场景类别发生变化时,仅需通过更新当前调用的学习网络131的各个节点的权值,就能够实现降噪处理,有效地节省了处理器140的运算资源,提高了运算速度。
在一些实施例中,所述学习网络131包括长短期记忆网络(LSTM)或门控循环单元(GRU),且深度小于4层。
长短期记忆网络(LSTM:Long-Short Term Memory)是递归神经网络(RNN:Recurrent Neutral Network)的一种。LSTM通过门控机制使循环神经网络不仅能记忆过去的信息,同时还能选择性地忘记一些不重要的信息而对长期语境等关系进行建模,而门控循环单元(GRU)是基于这样的想法在保留长期序列信息下减少梯度消失问题。另外,由于学习网络131的深度层数越小其运算速度越快,学习网络131的深度在小于4层时,能够有效地保证降噪处理的速度。
在一些实施例中,各个学习网络131在服务器上预先训练好并接收自所述服务器,所述预先训练基于不同噪声场景类别的训练样本集分别执行,各个噪声场景类别的训练样本包括相应噪声场景类别的含噪声语音信号和干净语音信号。
可以理解的是,在训练阶段,首先将训练用的训练数据集馈送到服务器中,训练数据集中包含含噪声语音信号以及与该含噪声语音信号对应的干净语音信号,通过利用小批量的训练数据集对学习网络131进行小批量训练,可以兼顾训练速度和准确性。例如,可以采用损失函数对学习网络131以小批量梯度下降法执行训练,以更新学习网络131的权值直至收敛,最终得到能够将含噪声语音信号转为干净语音信号的学习网络131。
在一些实施例中,所述无线耳机100中仅单个麦克110被配置用于进行降噪处理。与现有技术中常采用多麦克110进行降噪的方案不同,本申请能够基于单个麦克110对接收的音频信号进行降噪处理,避免了多麦克110降噪算法对耳机的腔体设计要求高、要求耳机尺寸较大、以及对多麦克110的一致性要求高的问题,既提高了产品的设计灵活性,还降低了无线耳机100的生产成本。
图2为根据本公开实施例的无线耳机的降噪方法的第一流程图,如图2所示,所述降噪方法200始于步骤S201:接收由麦克110采集的音频信号。在步骤S202:对所接收的音频信号进行分类,以确定所处的噪声场景的类别。接着,在步骤S203:基于所确定的噪声场景的类别,调用对应的学习网络131对所述音频信号进行降噪处理。
可以根据本公开的各个实施例所描述的分类算法对音频信号进行划分,以确定噪声场景的类别;再基于确定的噪声场景的类别,调用对应的学习网络131对所述音频信号进行降噪处理,以实现对音频信号的降噪处理,为用户提供经降噪后的音频信号。例如,当用户处于地铁站内时,其噪声大多由地铁站内广播以及周围人声所造成的,处于该噪声场景下接收到的音频信号含有人声以及广播声等噪声,此时,对接收到的音频信号进行分类,在确定该噪声场景的类别后,能够基于确定的结果调用相应的学习网络131,以对含有噪声的音频信号进行降噪处理,从而更好的凸显人声,提高用户的收听质量。
上述无线耳机100的降噪方法使得无线耳机100能够通过小的学习网络,达到大规模学习网络所能达到的降噪效果,通过降低深度神经网络的运算复杂度,实现减少运算资源,增加运算速度。
在一些实施例中,如图3所示,所述降噪方法包括:
S301:在本地预先与多个噪声场景类别分别对应地存储多个所述学习网络131。
此时所述S203具体包括:S302:所述噪声场景类别是否变化,在步骤304:在噪声场景未发生变化时,利用当前的学习网络对所述音频信号进行降噪处理;在步骤303:在噪声场景发生变化时,调用所存储的与变化后的噪声场景类别对应的学习网络进行降噪处理。可以理解的是,在本地预先存储多个训练好的学习网络131,该学习网络131是与多个噪声场景类别分别对应的,场景类别可以包括火车站、地铁车厢以及公共汽车等,当然也可为某种特殊环境噪声,例如车辆加工工厂、机械制造厂等具有一定特殊噪音的场景,本申请在此不做出具体限定。
可以理解的是,用户在佩戴无线耳机100时,接收到的音频信号所处的噪声场景会经常变化,例如当用户在地铁站内时,其所处的噪声场景的噪声是由广播以及人声产生的噪声,此时该噪声场景为第一噪声场景,当用户由地铁站内进入地铁车厢内时,其所处的噪声场景的噪声是由列车行驶产生的噪声,此时该噪声场景为第二噪声场景,可见,用户在由所处的第一噪声场景变为第二噪声场景时,会判断出噪声场景的类别产生变化,从而调用变化后的噪声场景类别,也就是与第二噪声场景类别所对应的学习网络131进行降噪处理,实现既能够在噪声场景类别变化时,对所述音频信号进行实时降噪处理,还能够在噪声场景类别没有变化时,节省运算资源,提高运算速度,避免在确认噪声场景类别没变化时,重新调用预先存储好的学习网络131。
在一些实施例中,对音频信号的分类利用操作系统132的二级线程在后台进行。上述操作系统132支持多任务操作,也就是该操作系统132至少能够将噪声场景进行分类,且利用该操作系统132的二级线程在后台进行对噪声场景的分类工作,以提高系统主频利用率以及降低系统运算所需的时钟频率,从而达到降低系统功耗和延长无线耳机100的待机时间的目的。
在一些实施例中,预先与多个噪声场景类别分别对应地存储多个所述学习网络131包括:预先存储学习网络131的共同构造;以及预先与多个噪声场景类别分别对应地存储节点的权值;
其中,所述降噪方法还包括:在噪声场景类别变化的情况下,更新当前调用的学习网络131的各个节点的权值以进行降噪处理。
根据上述,由于多个学习网络131的构造是相同的,仅是其节点的权值不同。如图4所示,其中,1、n1、n2、n3和n4为字段的地址,1至n4可以划分为多个不同的字段,例如1-n1、n1-n2、n2-n3和n3-n4,W11至W1m为与第一噪声场景所对应的学习网络131各节点的m个权值且存储在地址n1-n2的字段中,W21至W2m为与第二噪声场景所对应的学习网络131各节点的m个权值且存储在地址n2-n3的字段中,W31至W3m为与第三噪声场景所对应的学习网络131各节点的m个权值且存储在地址n3-n4的字段中,以此类推。也就是说,可以预先在地址1到n1的字段内存储唯一的学习网络131的构造,在其他多个字段内分别单独存储与噪声场景类别相对应的各学习网络131节点的权值。可理解的是,各个学习网络131采用的运算方法的差异仅仅在于,对不同的噪声场景类别其运算中用到的运算参数是不同的,也就是噪声场景类别与学习网络131的节点的权值是具有一一对应关系的。在判断噪声场景类别发生变化时,仅需通过更新当前调用的学习网络131的各个节点的权值,就能够实现降噪处理,有效地节省了运算资源,提高了运算速度。
在一些实施例中,利用预先训练好的学习网络对所接收的音频信号进行分类。也就是说,在服务器或其他终端上先对学习网络进行训练,而不是在无线耳机100上对学习网络131进行训练,通过已经在服务器或其他终端上提前训练好的学习网络,将接收到的音频信号进行分类,能够节省无线耳机100的运算资源以及运算速度,且能够将训练好的学习网络在耳机出厂之前存储至多个无线耳机100,增加生产加工效率。
在一些实施例中,所述降噪方法还包括:基于不同噪声场景类别的训练样本集对相应学习网络131分别进行训练;将训练好的学习网络131预先存储在本地以供调用。
可以理解的是,如图5所示,在训练阶段采用的方法包括,S501:输入含噪声语音信号和干净语音信号;S502:对学习网络131进行训练;S503:存储学习网络131各节点的权值。也就是说。首先将训练用的训练数据集馈送到服务器中,训练数据集中包含含噪声语音信号以及与该含噪声语音信号对应的,也就是,通过利用小批量的训练数据集对学习网络131进行小批量训练,可以兼顾训练速度和准确性。例如,可以采用损失函数对学习网络131以小批量梯度下降法执行训练,以更新学习网络131的权值直至收敛,最终得到能够将含噪声语音信号转为干净语音信号的学习网络131。
在一些实施例中,如图6所示,在训练学习网络阶段采用的具体方法可以包括又由步骤S601开始:分别输入与每个噪声场景一一对应的训练数据集中的训练数据。在步骤S602:基于训练数据确定降噪参数。接着在步骤S603:针对损失函数验证降噪参数,直至损失函数收敛。并在步骤S604中判断:是否已经处理了训练数据集中的所有训练数据,在判断已经处理了所有的训练数据后,执行步骤S605:输出学习网络,并存储学习网络各节点的权值;在判断还有未处理的训练数据后,重新执行步骤S601至S604,直至所有的训练数据都被处理。
可理解的是,噪声场景可按类别划分为多种,首先输入第一噪声场景的训练数据集中的训练数据,在完成步骤S602到S604后,存储与第一噪声场景对应的学习网络131各节点的权值;继而输入第二噪声场景的训练数据集中的训练数据,在完成步骤S602到S604后,存储与第二噪声场景对应的学习网络131各节点的权值,后续继续输入不同的噪声场景的训练数据集,并得到与其一一对应的学习网络131各节点的权值。
在一些实施例中,所述麦克110为单个。与现有技术中常采用多麦克110进行降噪的方案不同,本申请能够基于单个麦克110对接收的音频信号进行降噪处理,避免了多麦克110降噪算法对耳机的腔体设计要求高,以及对多麦克110的一致性要求高的问题,既提高了产品的设计灵活性,还降低了无线耳机100的生产成本。
此外,尽管已经在本文中描述了示例性实施例,其范围包括任何和所有基于本公开的具有等同元件、修改、省略、组合(例如,各种实施例交叉的方案)、改编或改变的实施例。权利要求书中的元件将被基于权利要求中采用的语言宽泛地解释,并不限于在本说明书中或本申请的实施期间所描述的示例,其示例将被解释为非排他性的。因此,本说明书和示例旨在仅被认为是示例,真正的范围和精神由以下权利要求以及其等同物的全部范围所指示。
以上描述旨在是说明性的而不是限制性的。例如,上述示例(或其一个或更多方案)可以彼此组合使用。例如本领域普通技术人员在阅读上述描述时可以使用其它实施例。另外,在上述具体实施方式中,各种特征可以被分组在一起以简单化本公开。这不应解释为一种不要求保护的公开的特征对于任一权利要求是必要的意图。相反,本公开的主题可以少于特定的公开的实施例的全部特征。从而,以下权利要求书作为示例或实施例在此并入具体实施方式中,其中每个权利要求独立地作为单独的实施例,并且考虑这些实施例可以以各种组合或排列彼此组合。本公开的范围应参照所附权利要求以及这些权利要求赋权的等同形式的全部范围来确定。
以上实施例仅为本公开的示例性实施例,不用于限制本公开,本公开的保护范围由权利要求书限定。本领域技术人员可以在本公开的实质和保护范围内,对本公开做出各种修改或等同替换,这种修改或等同替换也应视为落在本公开的保护范围内。
Claims (14)
1.一种无线耳机,其特征在于,所述无线耳机包括:
麦克,其配置为采集音频信号;
接口,其配置为接收所采集的音频信号;
存储器,其上与多个噪声场景类别分别对应地存储有多个学习网络;及
处理器,其配置为:
对所接收的音频信号进行分类,以确定所处的噪声场景的类别;
基于所确定的噪声场景的类别,调用对应的学习网络对所述音频信号进行降噪处理。
2.根据权利要求1所述的无线耳机,其特征在于,所述处理器还配置为:判断所述噪声场景类别是否变化,在噪声场景类别变化的情况下调用与变化后的噪声场景类别所对应的学习网络进行降噪处理。
3.根据权利要求1所述的无线耳机,其特征在于,所述存储器上还存储有操作系统,所述处理器还配置为:利用所述操作系统的二级线程在后台进行所述分类。
4.根据权利要求2所述的无线耳机,其特征在于,所述多个学习网络的构造相同而节点的权值不同,所述处理器还配置为:在噪声场景类别变化的情况下,更新当前调用的学习网络的各个节点的权值以进行降噪处理。
5.根据权利要求4所述的无线耳机,其特征在于,所述学习网络包括长短期记忆网络(LSTM)或门控循环单元(GRU),且深度小于4层。
6.根据权利要求1所述的无线耳机,其特征在于,各个学习网络在服务器上预先训练好并接收自所述服务器,所述预先训练基于不同噪声场景类别的训练样本集分别执行,各个噪声场景类别的训练样本包括相应噪声场景类别的含噪声语音信号和干净语音信号。
7.根据权利要求1所述的无线耳机,其特征在于,所述无线耳机中仅单个麦克被配置用于进行降噪处理。
8.一种无线耳机的降噪方法,其特征在于,所述降噪方法包括:
接收由麦克采集的音频信号;
对所接收的音频信号进行分类,以确定所处的噪声场景的类别;以及
基于所确定的噪声场景的类别,调用对应的学习网络对所述音频信号进行降噪处理。
9.根据权利要求8所述的降噪方法,其特征在于,所述降噪方法包括:
在本地预先与多个噪声场景类别分别对应地存储多个所述学习网络;
判断所述噪声场景类别是否变化,在噪声场景类别变化的情况下调用所存储的与变化后的噪声场景类别所对应的学习网络进行降噪处理。
10.根据权利要求8所述的降噪方法,其特征在于,对音频信号的分类利用操作系统的二级线程在后台进行。
11.根据权利要求9所述的降噪方法,其特征在于,预先与多个噪声场景类别分别对应地存储多个所述学习网络包括:预先存储学习网络的共同构造;以及预先与多个噪声场景类别分别对应地存储节点的权值;
其中,所述降噪方法还包括:在噪声场景类别变化的情况下,更新当前调用的学习网络的各个节点的权值以进行降噪处理。
12.根据权利要求11所述的降噪方法,其特征在于,利用预先训练好的学习网络对所接收的音频信号进行分类。
13.根据权利要求8所述的降噪方法,其特征在于,所述降噪方法还包括:基于不同噪声场景类别的训练样本集对相应学习网络分别进行训练;将训练好的学习网络预先存储在本地以供调用。
14.根据权利要求8所述的降噪方法,其特征在于,所述麦克为单个。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911283264.1A CN110996208B (zh) | 2019-12-13 | 2019-12-13 | 一种无线耳机及其降噪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911283264.1A CN110996208B (zh) | 2019-12-13 | 2019-12-13 | 一种无线耳机及其降噪方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110996208A true CN110996208A (zh) | 2020-04-10 |
CN110996208B CN110996208B (zh) | 2021-07-30 |
Family
ID=70093406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911283264.1A Active CN110996208B (zh) | 2019-12-13 | 2019-12-13 | 一种无线耳机及其降噪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110996208B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112767908A (zh) * | 2020-12-29 | 2021-05-07 | 安克创新科技股份有限公司 | 基于关键声音识别的主动降噪方法、电子设备及存储介质 |
CN113411711A (zh) * | 2021-06-29 | 2021-09-17 | 紫优科技(深圳)有限公司 | 一种智能耳机降噪方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105611477A (zh) * | 2015-12-27 | 2016-05-25 | 北京工业大学 | 数字助听器中深度和广度神经网络相结合的语音增强算法 |
CN107750027A (zh) * | 2017-11-30 | 2018-03-02 | 会听声学科技(北京)有限公司 | 场景自适应主动降噪耳机及场景自适应主动降噪设计方法 |
WO2018189513A1 (en) * | 2017-04-10 | 2018-10-18 | Cirrus Logic International Semiconductor Limited | Flexible voice capture front-end for headsets |
CN109859767A (zh) * | 2019-03-06 | 2019-06-07 | 哈尔滨工业大学(深圳) | 一种用于数字助听器的环境自适应神经网络降噪方法、系统及存储介质 |
CN110444214A (zh) * | 2017-11-24 | 2019-11-12 | 深圳市腾讯计算机系统有限公司 | 语音信号处理模型训练方法、装置、电子设备及存储介质 |
-
2019
- 2019-12-13 CN CN201911283264.1A patent/CN110996208B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105611477A (zh) * | 2015-12-27 | 2016-05-25 | 北京工业大学 | 数字助听器中深度和广度神经网络相结合的语音增强算法 |
WO2018189513A1 (en) * | 2017-04-10 | 2018-10-18 | Cirrus Logic International Semiconductor Limited | Flexible voice capture front-end for headsets |
CN110444214A (zh) * | 2017-11-24 | 2019-11-12 | 深圳市腾讯计算机系统有限公司 | 语音信号处理模型训练方法、装置、电子设备及存储介质 |
CN107750027A (zh) * | 2017-11-30 | 2018-03-02 | 会听声学科技(北京)有限公司 | 场景自适应主动降噪耳机及场景自适应主动降噪设计方法 |
CN109859767A (zh) * | 2019-03-06 | 2019-06-07 | 哈尔滨工业大学(深圳) | 一种用于数字助听器的环境自适应神经网络降噪方法、系统及存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112767908A (zh) * | 2020-12-29 | 2021-05-07 | 安克创新科技股份有限公司 | 基于关键声音识别的主动降噪方法、电子设备及存储介质 |
CN112767908B (zh) * | 2020-12-29 | 2024-05-21 | 安克创新科技股份有限公司 | 基于关键声音识别的主动降噪方法、电子设备及存储介质 |
CN113411711A (zh) * | 2021-06-29 | 2021-09-17 | 紫优科技(深圳)有限公司 | 一种智能耳机降噪方法及系统 |
CN113411711B (zh) * | 2021-06-29 | 2022-08-02 | 紫优科技(深圳)有限公司 | 一种智能耳机降噪方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110996208B (zh) | 2021-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110176226B (zh) | 一种语音识别、及语音识别模型训练方法及装置 | |
US11153678B1 (en) | Two-way wireless headphones | |
US10182138B2 (en) | Smart way of controlling car audio system | |
US20130329908A1 (en) | Adjusting audio beamforming settings based on system state | |
CN110996208B (zh) | 一种无线耳机及其降噪方法 | |
Sudharsan et al. | Ai vision: Smart speaker design and implementation with object detection custom skill and advanced voice interaction capability | |
US20080101624A1 (en) | Speaker directionality for user interface enhancement | |
US20190066651A1 (en) | Electronic device and control method of earphone device | |
US20220051660A1 (en) | Hearing Device User Communicating With a Wireless Communication Device | |
US10536191B1 (en) | Maintaining consistent audio setting(s) between wireless headphones | |
CN112770214A (zh) | 耳机的控制方法、装置及耳机 | |
CN111599358A (zh) | 语音交互方法及电子设备 | |
WO2020057624A1 (zh) | 语音识别的方法和装置 | |
CN107395883A (zh) | 语音信号调节方法、通信终端及计算机可读存储介质 | |
CN107172313A (zh) | 提高免提通话质量的方法、装置、移动终端及存储介质 | |
CN113228710B (zh) | 听力装置中的声源分离及相关方法 | |
CN113329372B (zh) | 用于车载通话的方法、装置、设备、介质和产品 | |
US11164591B2 (en) | Speech enhancement method and apparatus | |
CN114333886A (zh) | 音频处理方法、装置、电子设备及存储介质 | |
CN113763940A (zh) | 一种用于ar眼镜的语音信息处理方法及系统 | |
CN113096677A (zh) | 一种智能降噪的方法及相关设备 | |
CN108154886A (zh) | 噪声抑制方法及装置、电子装置及计算机可读存储介质 | |
JP2018092117A (ja) | 音響信号処理のパラメータ予測装置及びパラメータ予測方法 | |
WO2019242415A1 (zh) | 位置提示方法、装置、存储介质及电子设备 | |
US10431199B2 (en) | Electronic device and control method of earphone device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |