CN112349291A - 基于ai降噪模型的扩声系统及方法 - Google Patents
基于ai降噪模型的扩声系统及方法 Download PDFInfo
- Publication number
- CN112349291A CN112349291A CN202011048301.3A CN202011048301A CN112349291A CN 112349291 A CN112349291 A CN 112349291A CN 202011048301 A CN202011048301 A CN 202011048301A CN 112349291 A CN112349291 A CN 112349291A
- Authority
- CN
- China
- Prior art keywords
- voice
- audio
- model
- analog
- noise reduction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003321 amplification Effects 0.000 title claims abstract description 37
- 238000003199 nucleic acid amplification method Methods 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 title claims abstract description 17
- 238000006243 chemical reaction Methods 0.000 claims description 24
- 238000003062 neural network model Methods 0.000 claims description 16
- 230000002787 reinforcement Effects 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 5
- 230000001629 suppression Effects 0.000 abstract description 6
- 230000035945 sensitivity Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011038 discontinuous diafiltration by volume reduction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明涉及语音数据处理技术领域,本发明旨在解决现有的室内扩声方式噪声较大的问题,提出一种基于AI降噪模型的扩声系统及方法,技术方案概括为:采集音频模拟信号,将音频模拟信号转换为音频数字信号;通过AI降噪模型对音频数字信号降噪后得到语音数字信号;将语音数字信号转换为语音模拟信号;对语音模拟信号进行模拟放大;播放放大后的语音模拟信号。本发明能达到较好的噪声抑制效果,对非平稳噪声起到较好的抑制作用,适用于教室和会议室等场景。
Description
技术领域
本发明涉及语音数据处理技术领域,具体来说涉及一种基于AI降噪模型的扩声系统及方法。
背景技术
在教室或会议室场景,通常需要对语音信号进行扩声。室内扩声一般有两种方式,一种是采用手持麦克风采集声音,然后放大声音,手持麦克风的优点是灵敏度低,指向性强,采集到的噪声较少,因此需要人非常靠近麦克风才会采集到人的声音,但手持麦克风的缺点是携带不方便。
另一种是采用吊装麦克风,吊装麦克风的灵敏度较高,采集的覆盖范围较广,能将一个区域内的所有声音都采集到麦克风,因此采集到的声音就包括人声和声场内的其它声音,而这些其它声音就是噪声,如果不经过处理,声音直接通过功放和音箱输出,就会导致噪声也放大。
发明内容
本发明旨在解决现有的室内扩声方式噪声较大的问题,提出一种基于AI降噪模型的扩声系统及方法。
本发明解决上述技术问题所采用的技术方案是:基于AI降噪模型的扩声系统,包括:音频采集模块、第一模数转换模块、第二模数转换模块、AI降噪模型、功放模块和音箱设备;
所述音频采集模块,用于采集音频模拟信号,并将所述音频模拟信号发送至第一模数转换模块;
所述第一模数转换模块,用于接收音频模拟信号,将所述音频模拟信号转换为音频数字信号,并将所述音频数字信号输入至AI降噪模型;
所述AI降噪模型,用于接收音频数字信号,对所述音频数字信号降噪后输出语音数字信号,并将所述语音数字信号输入至第二模数转换模型;
所述第二模数转换模块,用于接收语音数字信号,将所述语音数字信号转换为语音模拟信号,并将所述语音模拟信号输入至功放模块;
所述功放模块,用于接收语音模拟信号,对所述语音模拟信号进行模拟放大,并将模拟放大后的语音模拟信号输入至音箱设备;
所述音箱设备,用于接收并播放放大后的语音模拟信号。
进一步的,所述AI降噪模型通过以下方法得到:
获取噪声样本数据和纯净语音样本数据;
创建神经网络模型,将所述噪声样本数据和纯净语音样本数据输入至神经网络模型中训练,得到AI降噪模型。
进一步的,所述神经网络模型为RNN模型、DNN模型或CNN模型。
进一步的,所述音频采集模块为吊装麦克风。
本发明还提出一种基于AI降噪模型的扩声方法,包括以下步骤:
步骤1、采集音频模拟信号;
步骤2、将所述音频模拟信号转换为音频数字信号;
步骤3、通过AI降噪模型对所述音频数字信号降噪后得到语音数字信号;
步骤4、将所述语音数字信号转换为语音模拟信号;
步骤5、对所述语音模拟信号进行模拟放大;
步骤6、播放放大后的语音模拟信号。
进一步的,所述AI降噪模型通过以下方法得到:
获取噪声样本数据和纯净语音样本数据;
创建神经网络模型,将所述噪声样本数据和纯净语音样本数据输入至神经网络模型中训练,得到AI降噪模型。
进一步的,步骤3中,所述神经网络模型为RNN模型、DNN模型或CNN模型。
进一步的,步骤1中,所述音频模拟信号为通过吊装麦克风采集的音频模拟信号。
本发明的有益效果是:本发明所述的基于AI降噪模型的扩声系统及方法,通过AI智能识别的方法进行噪声处理,通过训练噪声样本,得到训练模型,将训练模型应用到吊麦扩声系统中,能达到较好的噪声抑制效果,对非平稳噪声起到较好的抑制作用。
附图说明
图1为本发明实施例所述的基于AI降噪模型的扩声系统的结构示意图;
图2为本发明实施例所述的基于AI降噪模型的扩声方法的流程示意图。
具体实施方式
下面将结合附图对本发明的实施方式进行详细描述。
本发明所述的基于AI降噪模型的扩声系统,包括:音频采集模块、第一模数转换模块、第二模数转换模块、AI降噪模型、功放模块和音箱设备;所述音频采集模块,用于采集音频模拟信号,并将所述音频模拟信号发送至第一模数转换模块;所述第一模数转换模块,用于接收音频模拟信号,将所述音频模拟信号转换为音频数字信号,并将所述音频数字信号输入至AI降噪模型;所述AI降噪模型,用于接收音频数字信号,对所述音频数字信号降噪后输出语音数字信号,并将所述语音数字信号输入至第二模数转换模型;所述第二模数转换模块,用于接收语音数字信号,将所述语音数字信号转换为语音模拟信号,并将所述语音模拟信号输入至功放模块;所述功放模块,用于接收语音模拟信号,对所述语音模拟信号进行模拟放大,并将模拟放大后的语音模拟信号输入至音箱设备;所述音箱设备,用于接收并播放放大后的语音模拟信号。
在应用之前,需要训练一个AI降噪模型并将其应用到扩声系统中,在具体使用时,首先采集用户输入的音频模拟信号,对采集的音频模拟信号的处理流程为:将音频模拟信号转换为音频数字信号;通过AI降噪模型对音频数字信号降噪后得到语音数字信号;将语音数字信号转换为语音模拟信号;对语音模拟信号进行模拟放大;播放放大后的语音模拟信号。在AI降噪模型中,将数字音频帧进行AI识别,如果识别为噪声,则对音频数据帧进行降噪处理,进而得到纯净的语音数字信号,进而实现对噪声的抑制。
实施例
本发明实施例所述的基于AI降噪模型的扩声系统,如图1所示,包括:音频采集模块、第一模数转换模块、第二模数转换模块、AI降噪模型、功放模块和音箱设备;
所述音频采集模块,用于采集音频模拟信号,并将所述音频模拟信号发送至第一模数转换模块;
其中,音频采集模块可以是麦克风,对于距离用户较远的吊装麦克风来说,本实施例能够取得更好的噪声抑制效果。
所述第一模数转换模块,用于接收音频模拟信号,将所述音频模拟信号转换为音频数字信号,并将所述音频数字信号输入至AI降噪模型;
所述AI降噪模型,用于接收音频数字信号,对所述音频数字信号降噪后输出语音数字信号,并将所述语音数字信号输入至第二模数转换模型;
具体而言,AI降噪模型可以采用RNN、DNN或CNN等神经网络模型得到,神经网络模型的识别精确度主要依赖于通过样本训练得到一个模型数据,本实施例中可以通过如下方式获取到用于噪声识别的AI降噪模型:
获取噪声样本数据和纯净语音样本数据;
创建神经网络模型,将所述噪声样本数据和纯净语音样本数据输入至神经网络模型中训练,得到AI降噪模型。
音频数字信号输入至AI降噪模型后,AI降噪模型对该音频数字信号每一帧进行噪声识别,如果判定该帧语音信号为噪声信号,则进行降噪处理,降噪处理如减小音量。最后输出较为纯净的语音数字信号。
所述第二模数转换模块,用于接收语音数字信号,将所述语音数字信号转换为语音模拟信号,并将所述语音模拟信号输入至功放模块;
所述功放模块,用于接收语音模拟信号,对所述语音模拟信号进行模拟放大,并将模拟放大后的语音模拟信号输入至音箱设备;
所述音箱设备,用于接收并播放放大后的语音模拟信号。
基于上述技术方案,本实施例还提出一种基于AI降噪模型的扩声方法,如图2所示,包括以下步骤:
步骤S1、采集音频模拟信号;
步骤S2、将所述音频模拟信号转换为音频数字信号;
步骤S3、通过AI降噪模型对所述音频数字信号降噪后得到语音数字信号;
步骤S4、将所述语音数字信号转换为语音模拟信号;
步骤S5、对所述语音模拟信号进行模拟放大;
步骤S6、播放放大后的语音模拟信号。
可以理解,由于本发明实施例所述的基于AI降噪模型的扩声方法是基于实施例所述基于AI降噪模型的扩声系统实现的方法,对于实施例公开的方法而言,由于其与实施例公开的系统相对应,所以描述的较为简单,相关之处参见系统的部分说明即可。
Claims (8)
1.基于AI降噪模型的扩声系统,其特征在于,包括:音频采集模块、第一模数转换模块、第二模数转换模块、AI降噪模型、功放模块和音箱设备;
所述音频采集模块,用于采集音频模拟信号,并将所述音频模拟信号发送至第一模数转换模块;
所述第一模数转换模块,用于接收音频模拟信号,将所述音频模拟信号转换为音频数字信号,并将所述音频数字信号输入至AI降噪模型;
所述AI降噪模型,用于接收音频数字信号,对所述音频数字信号降噪后输出语音数字信号,并将所述语音数字信号输入至第二模数转换模型;
所述第二模数转换模块,用于接收语音数字信号,将所述语音数字信号转换为语音模拟信号,并将所述语音模拟信号输入至功放模块;
所述功放模块,用于接收语音模拟信号,对所述语音模拟信号进行模拟放大,并将模拟放大后的语音模拟信号输入至音箱设备;
所述音箱设备,用于接收并播放放大后的语音模拟信号。
2.如权利要求1所述的基于AI降噪模型的扩声系统,其特征在于,所述AI降噪模型通过以下方法得到:
获取噪声样本数据和纯净语音样本数据;
创建神经网络模型,将所述噪声样本数据和纯净语音样本数据输入至神经网络模型中训练,得到AI降噪模型。
3.如权利要求2所述的基于AI降噪模型的扩声系统,其特征在于,所述神经网络模型为RNN模型、DNN模型或CNN模型。
4.如权利要求1所述的基于AI降噪模型的扩声系统,其特征在于,所述音频采集模块为吊装麦克风。
5.基于AI降噪模型的扩声方法,其特征在于,包括以下步骤:
步骤1、采集音频模拟信号;
步骤2、将所述音频模拟信号转换为音频数字信号;
步骤3、通过AI降噪模型对所述音频数字信号降噪后得到语音数字信号;
步骤4、将所述语音数字信号转换为语音模拟信号;
步骤5、对所述语音模拟信号进行模拟放大;
步骤6、播放放大后的语音模拟信号。
6.如权利要求5所述的基于AI降噪模型的扩声方法,其特征在于,所述AI降噪模型通过以下方法得到:
获取噪声样本数据和纯净语音样本数据;
创建神经网络模型,将所述噪声样本数据和纯净语音样本数据输入至神经网络模型中训练,得到AI降噪模型。
7.如权利要求6所述的基于AI降噪模型的扩声方法,其特征在于,步骤3中,所述神经网络模型为RNN模型、DNN模型或CNN模型。
8.如权利要求5所述的基于AI降噪模型的扩声方法,其特征在于,步骤1中,所述音频模拟信号为通过吊装麦克风采集的音频模拟信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011048301.3A CN112349291A (zh) | 2020-09-29 | 2020-09-29 | 基于ai降噪模型的扩声系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011048301.3A CN112349291A (zh) | 2020-09-29 | 2020-09-29 | 基于ai降噪模型的扩声系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112349291A true CN112349291A (zh) | 2021-02-09 |
Family
ID=74361309
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011048301.3A Pending CN112349291A (zh) | 2020-09-29 | 2020-09-29 | 基于ai降噪模型的扩声系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112349291A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113490115A (zh) * | 2021-08-13 | 2021-10-08 | 广州市迪声音响有限公司 | 一种基于声纹识别技术的声反馈抑制方法及系统 |
CN117241202A (zh) * | 2023-11-07 | 2023-12-15 | 深圳市维尔晶科技有限公司 | 一种降噪型户外便携式扩音器及使用方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060233390A1 (en) * | 2002-03-29 | 2006-10-19 | Everest Biomedical Instruments Company | Fast Wavelet Estimation of Weak Bio-signals Using Novel Algorithms for Generating Multiple Additional Data Frames |
CN201294092Y (zh) * | 2008-11-18 | 2009-08-19 | 苏州大学 | 一种耳语音噪声消除器 |
CN103761973A (zh) * | 2013-12-31 | 2014-04-30 | 南宁市公安局 | 一种音频信号处理方法 |
CN107801141A (zh) * | 2017-10-10 | 2018-03-13 | 江苏中协智能科技有限公司 | 一种厅堂扩声系统 |
CN108022597A (zh) * | 2017-12-15 | 2018-05-11 | 北京远特科技股份有限公司 | 一种声音处理系统、方法及车辆 |
CN108766454A (zh) * | 2018-06-28 | 2018-11-06 | 浙江飞歌电子科技有限公司 | 一种语音噪声抑制方法及装置 |
CN109785852A (zh) * | 2018-12-14 | 2019-05-21 | 厦门快商通信息技术有限公司 | 一种增强说话人语音的方法及系统 |
-
2020
- 2020-09-29 CN CN202011048301.3A patent/CN112349291A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060233390A1 (en) * | 2002-03-29 | 2006-10-19 | Everest Biomedical Instruments Company | Fast Wavelet Estimation of Weak Bio-signals Using Novel Algorithms for Generating Multiple Additional Data Frames |
CN201294092Y (zh) * | 2008-11-18 | 2009-08-19 | 苏州大学 | 一种耳语音噪声消除器 |
CN103761973A (zh) * | 2013-12-31 | 2014-04-30 | 南宁市公安局 | 一种音频信号处理方法 |
CN107801141A (zh) * | 2017-10-10 | 2018-03-13 | 江苏中协智能科技有限公司 | 一种厅堂扩声系统 |
CN108022597A (zh) * | 2017-12-15 | 2018-05-11 | 北京远特科技股份有限公司 | 一种声音处理系统、方法及车辆 |
CN108766454A (zh) * | 2018-06-28 | 2018-11-06 | 浙江飞歌电子科技有限公司 | 一种语音噪声抑制方法及装置 |
CN109785852A (zh) * | 2018-12-14 | 2019-05-21 | 厦门快商通信息技术有限公司 | 一种增强说话人语音的方法及系统 |
Non-Patent Citations (1)
Title |
---|
胡学钢等: "《单片机原理及应用》", 30 June 2019, 安徽大学出版社 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113490115A (zh) * | 2021-08-13 | 2021-10-08 | 广州市迪声音响有限公司 | 一种基于声纹识别技术的声反馈抑制方法及系统 |
CN117241202A (zh) * | 2023-11-07 | 2023-12-15 | 深圳市维尔晶科技有限公司 | 一种降噪型户外便携式扩音器及使用方法 |
CN117241202B (zh) * | 2023-11-07 | 2024-03-01 | 深圳市维尔晶科技有限公司 | 一种降噪型户外便携式扩音器及使用方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106782591B (zh) | 一种在背景噪音下提高语音识别率的装置及其方法 | |
CN103873977B (zh) | 基于多麦克风阵列波束成形的录音系统及其实现方法 | |
US8504360B2 (en) | Automatic sound recognition based on binary time frequency units | |
CN205249484U (zh) | 一种麦克风线性阵列增强指向性拾音器 | |
CN103124165A (zh) | 自动增益控制 | |
CN108235181B (zh) | 在音频处理装置中降噪的方法 | |
CN204482023U (zh) | 一种啸叫抑制系统 | |
CN102223428A (zh) | 一种降低噪声的方法及移动终端 | |
CN112349291A (zh) | 基于ai降噪模型的扩声系统及方法 | |
CN105208189B (zh) | 音频处理方法及移动终端 | |
CN107124647A (zh) | 一种全景视频录制时自动生成字幕文件的方法及装置 | |
US8223979B2 (en) | Enhancement of speech intelligibility in a mobile communication device by controlling operation of a vibrator based on the background noise | |
CN113490115A (zh) | 一种基于声纹识别技术的声反馈抑制方法及系统 | |
EP4371112A1 (en) | Speech enhancement | |
CN106340306A (zh) | 一种提高语音识别度的方法及装置 | |
CN106782592A (zh) | 一种用于消除网络声音传输的回音和啸叫的系统和方法 | |
CN113573212B (zh) | 扩声系统、及麦克风通道数据选择方法 | |
CN100407293C (zh) | 一种无线终端语音处理的方法及装置 | |
CN111182416B (zh) | 处理方法、装置及电子设备 | |
CN106161780A (zh) | 具有扬声器降噪功能的通信装置及其降噪方法 | |
CN103050119B (zh) | 一种灯光或电机与声音同步的自适应检测方法 | |
WO2020238703A1 (zh) | 获取语音信号的方法及装置 | |
CN110099328A (zh) | 一种智能音箱 | |
WO2023287782A1 (en) | Data augmentation for speech enhancement | |
CN213547829U (zh) | 麦克风的电路结构及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |