CN113160789A - 主动降噪装置及方法 - Google Patents

主动降噪装置及方法 Download PDF

Info

Publication number
CN113160789A
CN113160789A CN202110243915.5A CN202110243915A CN113160789A CN 113160789 A CN113160789 A CN 113160789A CN 202110243915 A CN202110243915 A CN 202110243915A CN 113160789 A CN113160789 A CN 113160789A
Authority
CN
China
Prior art keywords
audio data
noise reduction
training sample
denoised
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110243915.5A
Other languages
English (en)
Inventor
邹天琦
张雨梦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Think Every Moment Intelligent Technology Beijing Co ltd
Original Assignee
Nanjing Meishen Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Meishen Intelligent Technology Co ltd filed Critical Nanjing Meishen Intelligent Technology Co ltd
Priority to CN202110243915.5A priority Critical patent/CN113160789A/zh
Publication of CN113160789A publication Critical patent/CN113160789A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1781Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
    • G10K11/17821Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the input signals only
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1785Methods, e.g. algorithms; Devices
    • G10K11/17853Methods, e.g. algorithms; Devices of the filter
    • G10K11/17854Methods, e.g. algorithms; Devices of the filter the filter being an adaptive filter
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/30Means
    • G10K2210/301Computational
    • G10K2210/3028Filtering, e.g. Kalman filters or special analogue or digital filters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供一种主动降噪装置及方法,属于人工智能技术领域。该装置包括:音频数据采集单元,用于采集待降噪音频数据;声学通道,用于得到待降噪音频信号的待叠加音频数据;音频数据特征提取单元,用于从待降噪音频数据中提取数据特征;分类器,用于根据数据特征,对待降噪音频数据进行分类,得到待降噪音频数据的分类结果;反相音频数据生成单元,用于根据分类结果,载入滤波器参数,对待降噪音频数据进行数据处理,得到待降噪音频数据的反相音频数据;声波叠加单元,使得待降噪音频数据中的噪音被反相音频数据冲抵,得到经过主动降噪后的音频数据。该方法基于该装置而实现。在主动降噪的过程中能够减少设备的功耗。

Description

主动降噪装置及方法
技术领域
本发明涉及人工智能技术领域,特别是涉及一种主动降噪装置及方法。
背景技术
公共场所充斥着各种各样的环境噪音,其已经成为环境公害之一,人体过度暴露在噪声污染环境中,不仅会感到烦躁、严重影响睡眠和心理建海,还会引发学习障碍、耳鸣等疾病,甚至增加患心脏病等疾病的风险,导致寿命缩短。为了减少噪声污染,主要涉及被动降噪技术和主动降噪方法两种技术流派。其中,被动降噪技术主要是对噪声的生源采取隔离、减震、阻尼等方式减弱噪声;主动降噪技术是利用声音作为一种波的特性通过发射反相声波对冲原声波,使原声波减弱直至消失的技术。现有技术中,由于噪声多种多样,导致在主动降噪处理电路需要长时间实时运算,因此功耗较大,导致需要主动降噪设备需要频繁充电,电池的使用寿命十分有限,致使主动降噪设备的成本较大。
发明内容
有鉴于此,本发明提供了一种主动降噪装置及方法,其在主动降噪的过程中能够减少设备的功耗,从而更加适于实用。
为了达到上述第一个目的,本发明提供的主动降噪装置的技术方案如下:
本发明提供的主动降噪装置包括:
音频数据采集单元,用于采集待降噪音频数据;
声学通道,用于得到所述待降噪音频信号的待叠加音频数据;
音频数据特征提取单元,用于从所述待降噪音频数据中提取数据特征;
分类器,用于根据所述数据特征,对所述待降噪音频数据进行分类,得到所述待降噪音频数据的分类结果;
反相音频数据生成单元,用于根据所述分类结果,载入滤波器参数,对所述待降噪音频数据进行数据处理,得到所述待降噪音频数据的反相音频数据;
声波叠加单元,用于对所述待叠加音频数据的声波特性、所述反相音频数据的声波特性,进行声波叠加,使得所述待降噪音频数据中的噪音被所述反相音频数据冲抵,得到经过主动降噪后的音频数据。
本发明提供的主动降噪装置还可采用以下技术措施进一步实现。
作为优选,所述分类器是经过训练的基于深度学习的神经网络分类器。
作为优选,所述基于深度学习的神经网络分类器的训练方法包括以下步骤:
获取已知分类结果的待降噪音频数据训练样本集,定义所述已知分类结果的待降噪音频数据训练样本集中的训练样本为第一种训练样本;
从所述第一种训练样本提取特征数据;
将每一所述第一训练样本的特征数据输入至所述基于深度学习的神经网络分类器,得到每一所述第一种训练样本的分类结果;
根据每一所述第一种训练样本中的数据特征、每一所述第一种训练样本的分类结果、以及对应的第一种分类样本的已知分类结果,对所述基于深度学习的神经网络分类器的分类结果进行调整,直至基于所述基于深度学习的神经网络分类器的分类结果符合准确率要求时,得到所述第一种训练样本的数据特征与分类结果之间的对应关系;
以所述第一种训练样本的数据特征与分类结果之间的对应关系,作为所述基于深度学习的神经网络分类器的分类基准,得到所述经过训练的基于深度学习的神经网络分类器。
作为优选,所述反相音频数据生成单元包括自适应滤波器,所述自适应滤波器能够通过训练不断调整参数,使得所述参数与所述待降噪音频数据的分类结果相适配。
作为优选,所述自适应滤波器的训练方法包括以下步骤:
获取经过分类器分类的待降噪音频数据训练样本集,定义所述经过分类器分类的待降噪音频数据训练样本集中的训练样本为第二种训练样本;
每一所述第二种训练样本经过前处理器件后,得到经过前处理的训练样本;
所述经过前处理的训练样本输入至所述自适应滤波器,得到所述第二种训练样本的反相音频数据;
所述第二种训练样本的反相音频数据经过后处理器件后,得到所述第二种训练样本的第一音频信号;
所述第二种训练样本经过声学通道后,得到所述第二种训练样本的第二音频信号;
比较所述第二种训练样本的第一音频信号、所述第二种训练样本的第二音频信号,得到误差信号;
所述前处理的训练样本经过模拟二级通道所得的样本、再次经过前处理器件所得的误差样本共同反馈得到LMS算法,得到反馈结果;
根据所述反馈结果,调整所述自适应滤波器的设备参数;
重复上述步骤并迭代调整所述自适应滤波器的设备参数,直至所述误差信信号达到降噪要求。
作为优选,所述误差信号达到降噪要求包括所述误差信号完全消失,或者,所述误差信号足够小而达到降噪要求。
作为优选,所述反相音频数据生成单元包括:
前处理器件,用于对已知分类结果的待降噪音频数据进行前处理,得到经过前处理的音频信号;
自适应滤波器,用于对所述经过前处理的音频信号输入至所述自适应滤波器,得到所述待降噪音频数据的反相音频数据;
后处理器件,用于对所述待降噪音频数据的反相音频数据进行后处理,得到所述待降噪音频信号的反相音频。
作为优选,所述前处理器件包括:
前置放大器,用于放大接收到的音频数据;
抗混叠滤波器,用于对经过所述前处理放大器处理的音频数据进行抗混叠处理,将混叠频率分量降低;
模拟数字转换器,用于将经过所述抗混叠滤波器处理的音频数据从模拟信号转换为数字信号。
作为优选,所述后处理器件包括:
数字模拟转换器,用于将所述待降噪音频数据从数字信号转换为模拟信号;
重构滤波器,用于对经过所述数字模拟转换器得到的模拟信号采样点重构采样前的信号,得到重构之后的信号;
功率放大器,用于对重构之后的信号进行功率放大,使得电流被放大,推动低阻的扬声器发声;
扬声器,用于对经过所述功率放大器处理后的信号发声。
为了达到上述第二个目的,本发明提供的主动降噪方法的技术方案如下:
本发明提供的主动降噪方法包括以下步骤:
采集待降噪音频数据;
所述待降噪音频数据经过所述声学通道后,得到待叠加音频数据;
从所述待降噪音频数据中提取数据特征;
根据所述数据特征,对所述待降噪音频数据进行分类,得到所述待降噪音频数据的分类结果;
根据所述分类结果,载入滤波器参数,对所述待降噪音频数据进行数据处理,得到所述待降噪音频数据的反相音频数据;
根据所述待叠加音频数据的声波特性、所述反相音频数据的声波特性,进行声波叠加,使得所述待降噪音频数据中的噪音被所述反相音频数据冲抵,得到经过主动降噪后的音频数据。
本发明提供的主动降噪装置及方法利用声音作为一种波的特性,应用反相音频数据生成单元,得到待降噪音频数据的反相音频数据,在这种情况下,待降噪音频信号的的待叠加音频数据与待降噪音频数据的反相音频数据叠加后,由于二者相位相反,频率、振幅相同,因此,能够对待降噪音频信号中的噪声信号进行抵消,而实现主动降噪。其中,由于生成待降噪音频数据的反相音频数据过程中,滤波器需要与待降噪音频数据进行调整,在此基础上,通过对待降噪音频数据进行分类,然后,根据待降噪音频数据的不同分类结果,以该分类结果为依据,对反相音频数据生成单元中的滤波器参数进行聚类调整,能够减小反相音频数据生成单元中的滤波器参数调整过程中,实时运算的体量,因此,能够极大地减少单位时间内,反相音频数据生成单元中的滤波器处理电路的能耗,因此,能够延长电池单次满充的耗尽时长,从而,减少电池的充电次数或者减少更换电池的次数,从而延长电池的使用寿命,因此,本发明提供的主动降噪装置及方法具有广阔的应用前景。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明实施例提供的主动降噪装置的信号流向关系示意图;
图2为本发明实施提供的主动降噪方法的步骤流程图;
图3为本发明实施例提供的基于深度学习的神经网络分类器的训练步骤流程示意图;
图4为本发明实施提供的自适应滤波器载入参数的训练步骤流程示意图;
图5为本发明实施例提供的主动降噪方法的步骤流程示意图;
图6为本发明实施例提供的主动降噪装置及方法条件下的应用场景示意图。
具体实施方式
有鉴于此,本发明提供了一种主动降噪装置及方法,其在主动降噪的过程中能够减少设备的功耗,从而更加适于实用。
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种主动降噪装置及方法,其具体实施方式、结构、特征及其功效,详细说明如后。在下述说明中,不同的“一实施例”或“实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,具体的理解为:可以同时包含有A与B,可以单独存在A,也可以单独存在B,能够具备上述三种任一种情况。
主动降噪装置实施例
参见附图1,本发明提供的主动降噪装置包括:
音频数据采集单元,用于采集待降噪音频数据;
具体而言,本实施例提供的主动降噪装置中,音频数据采集单元可以为麦克风,其能够采集到待降噪音频数据的模拟信号,例如,该麦克风可以为高灵敏信号传感器。
声学通道,用于得到待降噪音频信号的待叠加音频数据;
具体而言,本实施例提供的主动降噪装置中,声学通道可以为P(z)声学通道,其作用是模拟人耳听到的声音,除此之外,还可以采用本领域技术人员熟知的其他声学通道,只要能够起到模拟人耳听到的声音的作用即可。
音频数据特征提取单元,用于从待降噪音频数据中提取数据特征;
具体而言,本实施例提供的主动降噪装置中,数据特征提取时,利用特征提取办法,比如mfcc进行音频数据特征提取,其中,提取的特征参数会和相位、振幅、频率等参数有关。
分类器,用于根据数据特征,对待降噪音频数据进行分类,得到待降噪音频数据的分类结果;
具体而言,由于外界环境噪音多种多样,例如,包括工厂车间的机器轰鸣噪声;机场、车站等区域的嘈杂噪声;以及视频录制过程中,使有效声音变浑浊的有害噪音等。在这种情况下,如果针对不同分类的噪音不进行分类,就没有对应参数可以载入,那么反相音频的生成就需要进行滤波器参数训练的迭代过程,而生成待降噪音频数据的反相音频数据,滤波器的实时运算数据体量明显较大,因此,滤波器的处理电路单位时间内的能耗较高。在这种情况下,本发明实施例提供的主动降噪装置首先通过分类器,针对待降噪音频数据,数据特征提取时,利用特征提取办法,比如mfcc进行音频数据特征提取,其中,提取的特征参数和相位、振幅、频率等参数有关,得到待降噪音频数据的分类结果,此时,滤波器仅需要在待降噪音频数据的分类结果范围内进行数据实时计算即可,能够在很大程度上减小滤波器的实时运算数据体量。此时,每一噪音环境都可以被分类至其中一小类中。
反相音频数据生成单元,用于根据分类结果,载入滤波器参数,对待降噪音频数据进行数据处理,得到待降噪音频数据的反相音频数据;
具体而言,本发明实施例提供的主动降噪装置中,反相音频数据生成单元能够生成与待降噪音频数据相位相反,振幅、频率相同或者基本相同的反相音频数据,在此基础上,通过二者叠加,即可减小甚至消除噪音。本实施例中,反相音频数据生成单元包括:前处理器件,用于对已知分类结果的待降噪音频数据进行前处理,得到经过前处理的音频信号;自适应滤波器,用于对经过前处理的音频信号输入至自适应滤波器,得到待降噪音频数据的反相音频数据;后处理器件,用于对待降噪音频数据的反相音频数据进行后处理,得到待降噪音频信号的反相音频。
声波叠加单元,用于对待叠加音频数据的声波特性、反相音频数据的声波特性,进行声波叠加,使得待降噪音频数据中的噪音被反相音频数据冲抵,得到经过主动降噪后的音频数据。
具体而言,本发明实施例提供的主动降噪装置中,声波叠加单元仅需要进行简单的声波叠加运算,即可减小甚至消除噪音,在此基础上,声音进入人耳时,收听到的声音即为消除噪音的音频信号。
参见附图5,本发明提供的主动降噪装置利用声音作为一种波的特性,应用反相音频数据生成单元,得到待降噪音频数据的反相音频数据,在这种情况下,待降噪音频信号的的待叠加音频数据与待降噪音频数据的反相音频数据叠加后,由于二者相位相反,频率、振幅相同,因此,能够对待降噪音频信号中的噪声信号进行抵消,而实现主动降噪。其中,由于生成待降噪音频数据的反相音频数据过程中,滤波器需要与待降噪音频数据进行调整,在此基础上,通过对待降噪音频数据进行分类,然后,根据待降噪音频数据的不同分类结果,以该分类结果为依据,对反相音频数据生成单元中的滤波器参数进行聚类调整,能够减小反相音频数据生成单元中的滤波器参数调整过程中,实时运算的体量,因此,能够极大地减少单位时间内,反相音频数据生成单元中的滤波器处理电路的能耗,因此,能够延长电池单次满充的耗尽时长,从而,减少电池的充电次数或者减少更换电池的次数,从而延长电池的使用寿命,因此,本发明提供的主动降噪装置及方法具有广阔的应用前景。
其中,分类器是经过训练的基于深度学习的神经网络分类器。本实施例中,该基于深度学习的神经网络分类器能够根据待降噪音频数据的数据特征进行叠加聚类后,其中,数据特征提取时,利用特征提取办法,比如mfcc进行音频数据特征提取,其中,提取的特征参数会和相位、振幅、频率等参数有关,得到待降噪音频数据的分类结果,使其归入小类中。
其中,参见附图3,基于深度学习的神经网络分类器的训练方法包括以下步骤:
获取已知分类结果的待降噪音频数据训练样本集,定义已知分类结果的待降噪音频数据训练样本集中的训练样本为第一种训练样本;
具体而言,该第一种训练样本即为已知其小类的训练样本,该样本集中的第一种训练样本的数量越大,该基于深度学习的神经网络分类器的训练次数越多,其分类准确度越高,但是,随着第一种训练样本数量的逐渐增大,也会造成训练时间的延长,因此,应当根据分类准确度要求对第一种训练样本的数量进行平衡,在保证分类准确度的情况下,提高训练效率。
从第一种训练样本提取特征数据;
具体而言,第一种训练样本的特征数据应当与待降噪音频数据的特征数据类型完全相同,在此基础上,根据该第一种训练样本进行训练后所得的分类器才能基于相同的分类标准,得到针对待降噪音频数据的更加准确的分类结果。
将每一第一训练样本的特征数据输入至基于深度学习的神经网络分类器,得到每一第一种训练样本的分类结果;
具体而言,在此步骤中,将第一种训练样本输入至基于深度学习的神经网络分类器,能够得到由该基于深度学习的神经网络分类器的分类结果。例如,以其中一个第一种训练样本a1为例,记该第一种训练样本a1的已知分类结果为A1,而该第一种训练样本a1在经过基于深度学习的神经网络分类器进行分类后,所得的分类结果为Ai1,在针对该基于深度学习的神经网络分类器进行训练之初,由于该基于深度学习的神经网络分类器的参数并不准确,A1与Ai1可能并不相同,甚至相差甚远,此时,就需要针对该基于深度学习的神经网络分类器进行参数调整,直至A1与Ai1相同;同样方法继续根据训练样本a2、a3…an进行训练,直至训练样本an的已知分类结果An、经过基于深度学习的神经网络分类器对训练样本an的分类结果Ain的分类结果相同时,即可结束训练。
根据每一第一种训练样本中的数据特征、每一第一种训练样本的分类结果、以及对应的第一种分类样本的已知分类结果,对所述基于深度学习的神经网络分类器的参数进行调整,直至基于所述基于深度学习的神经网络分类器的分类结果符合准确率要求时,得到第一种训练样本的数据特征与分类结果之间的对应关系;
具体而言,在这种情况下,即可建立第一种训练样本的数据特征与基于深度学习的神经网络分类器的分类结果之间的对应关系。在此基础上,由于第一种训练样本的特征数据与待降噪音频数据的数据特征相同,因此,应用该基于深度学习的神经网络分类器,对待降噪音频数据的分类结果具有可靠性。
以第一种训练样本的数据特征与分类结果之间的对应关系,作为基于深度学习的神经网络分类器的分类基准,得到经过训练的基于深度学习的神经网络分类器。
具体而言,在本发明实施例提供的主动降噪方法中,只需要提取待降噪音频数据的特征数据,即可应用已经训练好的基于深度学习的神经网络分类器,得到待降噪音频数据的分类结果。
其中,反相音频数据生成单元包括自适应滤波器,自适应滤波器能够通过训练不断调整参数,使得参数与待降噪音频数据的分类结果相适配。
具体而言,本发明实施例提供的主动降噪装置中应用的自适应滤波器进行参数调整的过程中,只需要根据待降噪音频数据的分类结果在小类范围内进行数据运算,即可滤波器只有在前期进行参数训练的时候会进行自适应调整,在后期使用过程中,分类之后只会根据分类结果载入参数来运算得到反相音频,不会再进行自适应调整,与未分类之前相比,其能够极大地减小实时数据运算体量。
其中,参见附图4,自适应滤波器的训练方法包括以下步骤:
获取经过分类器分类的待降噪音频数据训练样本集,定义经过分类器分类的待降噪音频数据训练样本集中的训练样本为第二种训练样本;
具体而言,本发明实施例提供的主动降噪装置中,该第二种训练样本是指第一种训练样本中的每一个小类中都含有多个第二种训练样本,针对每个小类中的多个第二种训练样本,需要分别训练与每个小类中的多个第二种训练样本相适应的自适应滤波器参数,使得该自适应滤波器能够在已经分为小类的待降噪音频数据的基础上,能够自适应地调整滤波器参数,从而得到与待降噪音频数据相对应的精准的反相音频数据。
每一第二种训练样本经过前处理器件后,得到经过前处理的训练样本;
具体而言,本实施提供的主动降噪装置中,前处理器件包括:前置放大器,用于放大接收到的音频数据;抗混叠滤波器,用于对经过前处理放大器处理的音频数据进行抗混叠处理,将混叠频率分量降低;模拟数字转换器,用于将经过抗混叠滤波器处理的音频数据从模拟信号转换为数字信号。
经过前处理的训练样本输入至自适应滤波器,得到第二种训练样本的反相音频数据;
第二种训练样本的反相音频数据经过后处理器件后,得到第二种训练样本的第一音频信号;
具体而言,本实施例提供的主动降噪装置中,后处理器件包括:数字模拟转换器,用于将待降噪音频数据从数字信号转换为模拟信号;重构滤波器,用于对经过数字模拟转换器得到的模拟信号采样点重构采样前的信号,得到重构之后的信号;功率放大器,用于对重构之后的信号进行功率放大,使得电流被放大,推动低阻的扬声器发声;扬声器,用于对经过功率放大器处理后的信号发声。
第二种训练样本经过声学通道后,得到第二种训练样本的第二音频信号;
比较第二种训练样本的第一音频信号、第二种训练样本的第二音频信号,得到误差信号;
具体而言,在训练之初,第二种训练样本的第一音频信号、第二种训练样本的第二音频信号的误差信号较大。
前处理的训练样本经过模拟二级通道所得的样本、再次经过前处理器件所得的误差样本共同反馈得到LMS算法,得到反馈结果;
根据反馈结果,调整自适应滤波器的设备参数;
重复上述步骤并迭代调整自适应滤波器的设备参数,直至误差信信号达到降噪要求。
具体而言,本发明实施例提供的主动降噪装置中,对自适应滤波器进行参数调整的过程实际是迭代误差降低方法调整,通过迭代减小误差的方法,使得误差降低直至误差很小或者能够达到人耳对噪声的接受程度的要求。
其中,误差信号达到降噪要求包括误差信号完全消失,或者,误差信号足够小而达到降噪要求。
主动降噪方法实施例
参见附图2,本发明提供的主动降噪方法包括以下步骤:
采集待降噪音频数据;
具体而言,本实施例提供的主动降噪方法中,采集待降噪音频数据可以应用麦克风,其能够采集到待降噪音频数据的模拟信号,例如,该麦克风可以为高灵敏信号传感器。
待降噪音频数据经过声学通道后,得到待叠加音频数据;
具体而言,本实施例提供的主动降噪方法中,声学通道可以为P(z)声学通道,其作用是模拟人耳听到的声音,除此之外,还可以采用本领域技术人员熟知的其他声学通道,只要能够起到模拟人耳听到的声音的作用即可。
从待降噪音频数据中提取数据特征;
具体而言,本实施例提供的主动降噪装置中,数据特征提取时,利用特征提取办法,比如mfcc进行音频数据特征提取,其中,提取的特征参数会和相位、振幅、频率等参数有关,除此之外,还可以包括本领域技术人员熟知的其他参数,只要是对主动降噪具有效果即可。
根据数据特征,对待降噪音频数据进行分类,得到待降噪音频数据的分类结果;
具体而言,由于外界环境噪音多种多样,例如,包括工厂车间的机器轰鸣噪声;机场、车站等区域的嘈杂噪声;以及视频录制过程中,使有效声音变浑浊的有害噪音等。在这种情况下,如果针对不同分类的噪音不进行分类而直接由反相音频生成单元直接载入滤波器参数,而生成待降噪音频数据的反相音频数据,滤波器的实时运算数据体量明显较大,因此,滤波器的处理电路单位时间内的能耗较高。在这种情况下,本发明实施例提供的主动降噪装置首先通过分类器,针对待降噪音频数据,数据特征提取时,利用特征提取办法,比如mfcc进行音频数据特征提取,其中,提取的特征参数会和相位、振幅、频率等参数有关,得到待降噪音频数据的分类结果,此时,滤波器仅需要在待降噪音频数据的分类结果范围内进行数据实时计算即可,能够在很大程度上减小滤波器的实时运算数据体量。此时,每一噪音环境都可以被分类至其中一小类中。
根据分类结果,载入滤波器参数,对待降噪音频数据进行数据处理,得到待降噪音频数据的反相音频数据;
具体而言,参见附图6,本发明实施例提供的主动降噪方法中,反相音频数据生成单元能够生成与待降噪音频数据相位相反,振幅、频率相同或者基本相同的反相音频数据,在此基础上,通过二者叠加,即可减小甚至消除噪音。
根据待叠加音频数据的声波特性、反相音频数据的声波特性,进行声波叠加,使得待降噪音频数据中的噪音被反相音频数据冲抵,得到经过主动降噪后的音频数据。
具体而言,本发明实施例提供的主动降噪方法中,声波叠加单元仅需要进行简单的声波叠加运算,即可减小甚至消除噪音,在此基础上,声音进入人耳时,收听到的声音即为消除噪音的音频信号。
本发明提供的主动降噪方法利用声音作为一种波的特性,应用反相音频数据生成单元,得到待降噪音频数据的反相音频数据,在这种情况下,待降噪音频信号的的待叠加音频数据与待降噪音频数据的反相音频数据叠加后,由于二者相位相反,频率、振幅相同,因此,能够对待降噪音频信号中的噪声信号进行抵消,而实现主动降噪。其中,由于生成待降噪音频数据的反相音频数据过程中,滤波器需要与待降噪音频数据进行调整,在此基础上,通过对待降噪音频数据进行分类,然后,根据待降噪音频数据的不同分类结果,以该分类结果为依据,对反相音频数据生成单元中的滤波器参数进行聚类调整,能够减小反相音频数据生成单元中的滤波器参数调整过程中,实时运算的体量,因此,能够极大地减少单位时间内,反相音频数据生成单元中的滤波器处理电路的能耗,因此,能够延长电池单次满充的耗尽时长,从而,减少电池的充电次数或者减少更换电池的次数,从而延长电池的使用寿命,因此,本发明提供的主动降噪装置及方法具有广阔的应用前景。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种主动降噪装置,其特征在于,包括:
音频数据采集单元,用于采集待降噪音频数据;
声学通道,用于得到所述待降噪音频信号的待叠加音频数据;
音频数据特征提取单元,用于从所述待降噪音频数据中提取数据特征;
分类器,用于根据所述数据特征,对所述待降噪音频数据进行分类,得到所述待降噪音频数据的分类结果;
反相音频数据生成单元,用于根据所述分类结果,载入滤波器参数,对所述待降噪音频数据进行数据处理,得到所述待降噪音频数据的反相音频数据;
声波叠加单元,用于对所述待叠加音频数据的声波特性、所述反相音频数据的声波特性,进行声波叠加,使得所述待降噪音频数据中的噪音被所述反相音频数据冲抵,得到经过主动降噪后的音频数据。
2.根据权利要求1所述的主动降噪装置,其特征在于,所述分类器是经过训练的基于深度学习的神经网络分类器。
3.根据权利要求2所述的主动降噪装置,其特征在于,所述基于深度学习的神经网络分类器的训练方法包括以下步骤:
获取已知分类结果的待降噪音频数据训练样本集,定义所述已知分类结果的待降噪音频数据训练样本集中的训练样本为第一种训练样本;
从所述第一种训练样本提取特征数据;
将每一所述第一训练样本的特征数据输入至所述基于深度学习的神经网络分类器,得到每一所述第一种训练样本的分类结果;根据每一所述第一种训练样本中的数据特征、每一所述第一种训练样本的分类结果、以及对应的第一种分类样本的已知分类结果,对所述基于深度学习的神经网络分类器的分类结果进行调整,直至基于所述基于深度学习的神经网络分类器的分类结果符合准确率要求时,得到所述第一种训练样本的数据特征与分类结果之间的对应关系;
以所述第一种训练样本的数据特征与分类结果之间的对应关系,作为所述基于深度学习的神经网络分类器的分类基准,得到所述经过训练的基于深度学习的神经网络分类器。
4.根据权利要求1所述的主动降噪装置,其特征在于,所述反相音频数据生成单元包括自适应滤波器,所述自适应滤波器能够通过训练不断调整参数,使得所述参数与所述待降噪音频数据的分类结果相适配。
5.根据权利要求4所述的主动降噪装置,其特征在于,所述自适应滤波器的训练方法包括以下步骤:
获取经过分类器分类的待降噪音频数据训练样本集,定义所述经过分类器分类的待降噪音频数据训练样本集中的训练样本为第二种训练样本;
每一所述第二种训练样本经过前处理器件后,得到经过前处理的训练样本;
所述经过前处理的训练样本输入至所述自适应滤波器,得到所述第二种训练样本的反相音频数据;
所述第二种训练样本的反相音频数据经过后处理器件后,得到所述第二种训练样本的第一音频信号;
所述第二种训练样本经过声学通道后,得到所述第二种训练样本的第二音频信号;
比较所述第二种训练样本的第一音频信号、所述第二种训练样本的第二音频信号,得到误差信号;
所述前处理的训练样本经过模拟二级通道所得的样本、再次经过前处理器件所得的误差样本共同反馈得到LMS算法,得到反馈结果;
根据所述反馈结果,调整所述自适应滤波器的设备参数;
重复上述步骤并迭代调整所述自适应滤波器的设备参数,直至所述误差信信号达到降噪要求。
6.根据权利要求5所述的主动降噪装置,其特征在于,所述误差信号达到降噪要求包括所述误差信号完全消失,或者,所述误差信号足够小而达到降噪要求。
7.根据权利要求1所述的主动降噪装置,其特征在于,所述反相音频数据生成单元包括:
前处理器件,用于对已知分类结果的待降噪音频数据进行前处理,得到经过前处理的音频信号;
自适应滤波器,用于对所述经过前处理的音频信号输入至所述自适应滤波器,得到所述待降噪音频数据的反相音频数据;
后处理器件,用于对所述待降噪音频数据的反相音频数据进行后处理,得到所述待降噪音频信号的反相音频。
8.根据权利要求5或7所述的主动降噪装置,其特征在于,所述前处理器件包括:
前置放大器,用于放大接收到的音频数据;
抗混叠滤波器,用于对经过所述前处理放大器处理的音频数据进行抗混叠处理,将混叠频率分量降低;
模拟数字转换器,用于将经过所述抗混叠滤波器处理的音频数据从模拟信号转换为数字信号。
9.根据权利要求5或7所述的主动降噪装置,其特征在于,所述后处理器件包括:
数字模拟转换器,用于将所述待降噪音频数据从数字信号转换为模拟信号;
重构滤波器,用于对经过所述数字模拟转换器得到的模拟信号采样点重构采样前的信号,得到重构之后的信号;
功率放大器,用于对重构之后的信号进行功率放大,使得电流被放大,推动低阻的扬声器发声;
扬声器,用于对经过所述功率放大器处理后的信号发声。
10.一种主动降噪方法,其特征在于,包括以下步骤:
采集待降噪音频数据;
所述待降噪音频数据经过所述声学通道后,得到待叠加音频数据;
从所述待降噪音频数据中提取数据特征;
根据所述数据特征,对所述待降噪音频数据进行分类,得到所述待降噪音频数据的分类结果;
根据所述分类结果,载入滤波器参数,对所述待降噪音频数据进行数据处理,得到所述待降噪音频数据的反相音频数据;
根据所述待叠加音频数据的声波特性、所述反相音频数据的声波特性,进行声波叠加,使得所述待降噪音频数据中的噪音被所述反相音频数据冲抵,得到经过主动降噪后的音频数据。
CN202110243915.5A 2021-03-05 2021-03-05 主动降噪装置及方法 Pending CN113160789A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110243915.5A CN113160789A (zh) 2021-03-05 2021-03-05 主动降噪装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110243915.5A CN113160789A (zh) 2021-03-05 2021-03-05 主动降噪装置及方法

Publications (1)

Publication Number Publication Date
CN113160789A true CN113160789A (zh) 2021-07-23

Family

ID=76884207

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110243915.5A Pending CN113160789A (zh) 2021-03-05 2021-03-05 主动降噪装置及方法

Country Status (1)

Country Link
CN (1) CN113160789A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130156214A1 (en) * 2011-12-20 2013-06-20 Texas Instruments Incorporated Method and System for Active Noise Cancellation According to a Type of Noise
CN109346055A (zh) * 2018-11-23 2019-02-15 安克创新科技股份有限公司 主动降噪方法、装置、耳机及计算机存储介质
CN109859767A (zh) * 2019-03-06 2019-06-07 哈尔滨工业大学(深圳) 一种用于数字助听器的环境自适应神经网络降噪方法、系统及存储介质
US10602268B1 (en) * 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
CN111385688A (zh) * 2018-12-29 2020-07-07 安克创新科技股份有限公司 一种基于深度学习的主动降噪方法、装置及系统
CN112289295A (zh) * 2020-06-08 2021-01-29 珠海市杰理科技股份有限公司 主动降噪系统训练方法以及相关设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130156214A1 (en) * 2011-12-20 2013-06-20 Texas Instruments Incorporated Method and System for Active Noise Cancellation According to a Type of Noise
CN109346055A (zh) * 2018-11-23 2019-02-15 安克创新科技股份有限公司 主动降噪方法、装置、耳机及计算机存储介质
US10602268B1 (en) * 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
CN111385688A (zh) * 2018-12-29 2020-07-07 安克创新科技股份有限公司 一种基于深度学习的主动降噪方法、装置及系统
CN109859767A (zh) * 2019-03-06 2019-06-07 哈尔滨工业大学(深圳) 一种用于数字助听器的环境自适应神经网络降噪方法、系统及存储介质
CN112289295A (zh) * 2020-06-08 2021-01-29 珠海市杰理科技股份有限公司 主动降噪系统训练方法以及相关设备

Similar Documents

Publication Publication Date Title
CN110600050B (zh) 基于深度神经网络的麦克风阵列语音增强方法及系统
CN109121057B (zh) 一种智能助听的方法及其系统
AU2010204470B2 (en) Automatic sound recognition based on binary time frequency units
CN105657150A (zh) 一种噪音消除方法、装置及电子设备
Mamun et al. Convolutional neural network-based speech enhancement for cochlear implant recipients
Rawat et al. Emotion recognition through speech using neural network
Jangjit et al. A new wavelet denoising method for noise threshold
CN113823304A (zh) 语音信号的处理方法、装置、电子设备及可读存储介质
CN113191178A (zh) 一种基于听觉感知特征深度学习的水声目标识别方法
CN1742322A (zh) 噪声减小和视听语音活动检测
CN113053400B (zh) 音频信号降噪模型的训练方法、音频信号降噪方法及设备
Zai et al. Reconstruction of audio waveforms from spike trains of artificial cochlea models
TWI819478B (zh) 具端至端神經網路之聽力裝置及音訊處理方法
Do et al. Speech Separation in the Frequency Domain with Autoencoder.
CN114189781A (zh) 双麦神经网络降噪耳机的降噪方法及系统
Ram et al. Use of radial basis function network with discrete wavelet transform for speech enhancement
CN113160789A (zh) 主动降噪装置及方法
Zaman et al. Classification of Harmful Noise Signals for Hearing Aid Applications using Spectrogram Images and Convolutional Neural Networks
CN112908353A (zh) 用于助听器的边缘计算与云计算相结合的语音增强方法
CN111009259B (zh) 一种音频处理方法和装置
CN112349291A (zh) 基于ai降噪模型的扩声系统及方法
CN111739551A (zh) 一种基于低秩与稀疏张量分解的多通道心肺音去噪系统
CN107221338A (zh) 声波提取装置以及提取方法
CN114023352B (zh) 一种基于能量谱深度调制的语音增强方法及装置
TWI749547B (zh) 應用深度學習的語音增強系統

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: No. 29 # 106, Rongyue Dongfang Facade Room, Guandou Street, Jiujiang District, Wuhu City, Anhui Province, 241000

Applicant after: Wuhu Every Moment Deep Thought Intelligent Technology Co.,Ltd.

Address before: Room 401, block C, Yingying building, No.99, Tuanjie Road, yanchuangyuan, Jiangbei new district, Nanjing area, China (Jiangsu) pilot Free Trade Zone, Nanjing 211800, Jiangsu Province

Applicant before: Nanjing Meishen Intelligent Technology Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230905

Address after: Room 1612, 13th Floor, Building B, No.1 Wangzhuang Road, Haidian District, Beijing, 100083

Applicant after: Think every moment Intelligent Technology (Beijing) Co.,Ltd.

Address before: No. 29 # 106, Rongyue Dongfang Facade Room, Guandou Street, Jiujiang District, Wuhu City, Anhui Province, 241000

Applicant before: Wuhu Every Moment Deep Thought Intelligent Technology Co.,Ltd.