CN116052707A - 一种单通道盲源分离法及系统 - Google Patents
一种单通道盲源分离法及系统 Download PDFInfo
- Publication number
- CN116052707A CN116052707A CN202310038594.4A CN202310038594A CN116052707A CN 116052707 A CN116052707 A CN 116052707A CN 202310038594 A CN202310038594 A CN 202310038594A CN 116052707 A CN116052707 A CN 116052707A
- Authority
- CN
- China
- Prior art keywords
- signal
- signals
- module
- sound source
- channel blind
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000926 separation method Methods 0.000 title claims abstract description 50
- 238000007781 pre-processing Methods 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims abstract description 14
- 230000006798 recombination Effects 0.000 claims description 15
- 238000005215 recombination Methods 0.000 claims description 15
- 230000008030 elimination Effects 0.000 claims description 10
- 238000003379 elimination reaction Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 6
- 230000003321 amplification Effects 0.000 claims description 3
- 238000002592 echocardiography Methods 0.000 claims description 3
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开了一种单通道盲源分离法及系统,包括运行系统;所述运行系统包括多路信号、声源信号预处理模块、单通道盲源分离模块、语音识别模块;所述多路信号为各种声源的混合录制,其与声源信号预处理模块线性连接;所述声源信号预处理模块对接收到的声源信号进行放大处理;所述单通道盲源分离模块与声源信号预处理模块线性连接,用于多路信号的处理;所述语音识别模块与单通道盲源分离模块线性连接,对弱目标信号进行最终信号输出,从而得到目标声源信号;本申请能够将混为一路的多路声源的信号,在不影响后期识别效果的情况下分离出来;在录音设备数量有限的情况下,能够在众多人的录音中准确的找到某个人的声音。
Description
技术领域
本发明涉及信号处理技术领域,尤其涉及一种单通道盲源分离法及系统。
背景技术
盲源分离最经典的应用例子是通常所说的“鸡尾酒会问题″:在一个很多人参加的鸡尾酒会中,大家都在交谈着,各种各样的声音混在一起,假设我们用麦克风录制这些声音信号,现在要求我们从众多声音混合在一起的信号中分离得到某个人的说话声,由于人比较多而麦克风的数量有限。这时若有一种将多路混合为一路的信号进行分离,有效的恢复出多路源始信号,这样就可以得到感兴趣的人交谈的录音。对于多路混合信号的传输,有些采用多接口和连线,但其花费成本较高;或者运用复用和解复用技术,由于其采用的设备复杂度较高,因此现有生活中往往采用后单通道盲源分离法,在多路信号混合后,凭借单通道混合信号再恢复出多路信号。然而单通道盲源分离法在运用时往往由于其信号源混合复杂,信号较弱,导致其后期信号分离效果不明显,不能够得到很好的降噪消声的效果。为此本申请提出一种对多路混合为一路的数字信号进行分离,可以有效地恢复出多路源始信号的单通道盲源分离法及系统。
发明内容
本申请实施例通过提供一种单通道盲源分离法及系统,本申请能够将混为一路的多路声源的信号,将其接收到的多路信号进行放大预处理,能够有效区分出原始信号和噪声,从而在不影响后期识别效果的情况下将原始信号分离出来;在录音设备数量有限的情况下,能够在众多人的录音中准确的找到某个人的声音。
本申请实施例提供了一种单通道盲源分离法及系统,包括运行系统,
所述运行系统包括多路信号、声源信号预处理模块、单通道盲源分离模块、语音识别模块;
所述多路信号为各种声源的混合录制,其与声源信号预处理模块线性连接,用于声源信号之间的传输;
所述声源信号预处理模块对接收到的声源信号进行放大处理,使其能够精确传递声源信号;
所述单通道盲源分离模块与声源信号预处理模块线性连接,用于多路信号的处理;
所述语音识别模块与单通道盲源分离模块线性连接,将分离所得的弱目标信号传输给语音识别模块,经由语音识别模块对弱目标信号进行最终信号输出,从而得到目标声源信号。
进一步的所述声源信号预处理模块可选用音源放大器。
进一步的所述单通道盲源分离模块包括信号分离模块、信号重组模块、信号消除模块;
信号分离模块用于对多路混合声源进行分离处理,从而得到未知强干扰信号的参数特征;
信号重组模块与信号分离模块线性连接,对分离得到的未知强干扰信号进行重组处理,从而得到多组单个的声源信号,以方便后期声源信号的回声、噪声等消除;
信号消除模块与信号重组模块线性连接,对其重组的信号进行消除处理,将信号中多余的回声、噪声等其他杂音做消除处理,从而得到弱目标信号。
进一步的还包括运行过程,其运行过程具体包括以下过程:
S1:通过对多路混合信号进行预处理,将其声源进行信号放大处理;
S2:信号放大后对多路声源进行盲源分离操作,实现信号分离,得到未知强干扰信号的参数特征;
S3:根据所得到的未知强干扰信号的参数特征,对其进行信号重组处理,得到多组单个的声源信号;
S4:根据所得到的多组单个声源信号,对其进行信号消除处理,将多组单个声源信号中的回声以及混响进行消除,得到分离后的弱目标信号;
S5:最后得到的弱目标信号通过语音识别模块进行最终的信号输出,从而得到目标信号。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:本申请能够将混为一路的多路声源的信号,将其接收到的多路信号进行放大预处理,能够有效区分出原始信号和噪声,从而在不影响后期识别效果的情况下将原始信号分离出来;在录音设备数量有限的情况下,能够在众多人的录音中准确的找到某个人的声音。
附图说明
图1为本申请运行系统结构示意图;
图2为本申请运行系统工作流程示意图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施方式。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施方式。相反地,提供这些实施方式的目的是使对本发明的公开内容理解的更加透彻全面。
需要说明的是,当元件被称为“固定于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的,并不表示是唯一的实施方式。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施方式的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
请参阅图1-2,一种单通道盲源分离法及系统,由运行系统和运行过程构成;
其运行系统包括多路信号、声源信号预处理模块、单通道盲源分离模块、语音识别模块;
多路信号为各种声源的混合录制,其与声源信号预处理模块线性连接,用于声源信号之间的传输;
声源信号预处理模块可选用音源放大器,对接收到的声源信号进行放大处理,使其能够精确传递声源信号;
单通道盲源分离模块与声源信号预处理模块线性连接,用于多路信号的处理;单通道盲源分离模块包括信号分离模块、信号重组模块、信号消除模块;
信号分离模块用于对多路混合声源进行分离处理,从而得到未知强干扰信号的参数特征;
信号重组模块与信号分离模块线性连接,对分离得到的未知强干扰信号进行重组处理,从而得到多组单个的声源信号,以方便后期声源信号的回声、噪声等消除;
信号消除模块与信号重组模块线性连接,对其重组的信号进行消除处理,将信号中多余的回声、噪声等其他杂音做消除处理,从而得到弱目标信号;
单通道盲源分离模块与语音识别模块线性连接,将分离所得的弱目标信号传输给语音识别模块,经由语音识别模块对弱目标信号进行最终信号输出,从而得到目标声源信号。
其运行过程具体包括以下过程:
S1:通过对多路混合信号进行预处理,将其声源进行信号放大处理;
S2:信号放大后对多路声源进行盲源分离操作,实现信号分离,得到未知强干扰信号的参数特征;
S3:根据所得到的未知强干扰信号的参数特征,对其进行信号重组处理,得到多组单个的声源信号;
S4:根据所得到的多组单个声源信号,对其进行信号消除处理,将多组单个声源信号中的回声以及混响进行消除,得到分离后的弱目标信号;
S5:最后得到的弱目标信号通过语音识别模块进行最终的信号输出,从而得到目标信号。
上述本申请实施例中的技术方案,至少具有如下的技术效果或优点:本申请能够将混为一路的多路声源的信号,将其接收到的多路信号进行放大预处理,能够有效区分出原始信号和噪声,从而在不影响后期识别效果的情况下将原始信号分离出来;在录音设备数量有限的情况下,能够在众多人的录音中准确的找到某个人的声音。
以上所述仅为本发明的优选实施方式,并不用于限制本发明,对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明精神和原则内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种单通道盲源分离法及系统,包括运行系统,其特征在于:
所述运行系统包括多路信号、声源信号预处理模块、单通道盲源分离模块、语音识别模块;
所述多路信号为各种声源的混合录制,其与声源信号预处理模块线性连接,用于声源信号之间的传输;
所述声源信号预处理模块对接收到的声源信号进行放大处理,使其能够精确传递声源信号;
所述单通道盲源分离模块与声源信号预处理模块线性连接,用于多路信号的处理;
所述语音识别模块与单通道盲源分离模块线性连接,将分离所得的弱目标信号传输给语音识别模块,经由语音识别模块对弱目标信号进行最终信号输出,从而得到目标声源信号。
2.如权利要求1所述的一种单通道盲源分离法及系统,其特征在于:所述声源信号预处理模块可选用音源放大器。
3.如权利要求1所述的一种单通道盲源分离法及系统,其特征在于:所述单通道盲源分离模块包括信号分离模块、信号重组模块、信号消除模块;
信号分离模块用于对多路混合声源进行分离处理,从而得到未知强干扰信号的参数特征;
信号重组模块与信号分离模块线性连接,对分离得到的未知强干扰信号进行重组处理,从而得到多组单个的声源信号,以方便后期声源信号的回声、噪声等消除;
信号消除模块与信号重组模块线性连接,对其重组的信号进行消除处理,将信号中多余的回声、噪声等其他杂音做消除处理,从而得到弱目标信号。
4.如权利要求1所述的一种单通道盲源分离法及系统,其特征在于:还包括运行过程,其运行过程具体包括以下过程:
S1:通过对多路混合信号进行预处理,将其声源进行信号放大处理;
S2:信号放大后对多路声源进行盲源分离操作,实现信号分离,得到未知强干扰信号的参数特征;
S3:根据所得到的未知强干扰信号的参数特征,对其进行信号重组处理,得到多组单个的声源信号;
S4:根据所得到的多组单个声源信号,对其进行信号消除处理,将多组单个声源信号中的回声以及混响进行消除,得到分离后的弱目标信号;
S5:最后得到的弱目标信号通过语音识别模块进行最终的信号输出,从而得到目标信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310038594.4A CN116052707A (zh) | 2023-01-12 | 2023-01-12 | 一种单通道盲源分离法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310038594.4A CN116052707A (zh) | 2023-01-12 | 2023-01-12 | 一种单通道盲源分离法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116052707A true CN116052707A (zh) | 2023-05-02 |
Family
ID=86132743
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310038594.4A Pending CN116052707A (zh) | 2023-01-12 | 2023-01-12 | 一种单通道盲源分离法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116052707A (zh) |
-
2023
- 2023-01-12 CN CN202310038594.4A patent/CN116052707A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101478296B (zh) | 一种多声道系统中的增益控制方法及装置 | |
US7672844B2 (en) | Voice processing apparatus | |
CN1914952A (zh) | 音频/视频系统 | |
CA2464025A1 (en) | System and method for transmitting audio via a serial data port in a hearing instrument | |
JP3483086B2 (ja) | 音声電話会議装置 | |
US8194851B2 (en) | Voice processing apparatus, voice processing system, and voice processing program | |
CN111429939A (zh) | 一种双声源的声音信号分离方法和拾音器 | |
CN110349582B (zh) | 显示装置与远场语音处理电路 | |
WO2003039115A3 (de) | Vorrichtung und verfahren zur mehrkanaligen akustischen echokompensation mit variabler kanalzahl | |
JPH01260967A (ja) | 多チヤネル信号用音声会議装置 | |
Guan et al. | Libri-adhoc40: A dataset collected from synchronized ad-hoc microphone arrays | |
CN116052707A (zh) | 一种单通道盲源分离法及系统 | |
US20070064960A1 (en) | Apparatus to convert analog signal of array microphone into digital signal and computer system including the same | |
DK1479265T3 (da) | Stemmeregistrerings- og skelneapparat | |
JPS6225309B2 (zh) | ||
US20100255878A1 (en) | Audio filter | |
CN114866939A (zh) | 一种新型超强降噪的助听器语音处理系统 | |
JP2002062900A (ja) | 収音装置及び受信装置 | |
JP7349410B2 (ja) | 音響信号を所定の到来方向から再生するシステム及び方法 | |
JP7403392B2 (ja) | 複数のマイクによって収音した環境音信号を再生装置へ送信する収音装置、システム、プログラム及び方法 | |
CN112530411B (zh) | 一种实时分角色转录方法、设备和系统 | |
EP4343760A1 (en) | Transient noise event detection for speech denoising | |
JP2022042234A (ja) | 収音システム | |
US20030021426A1 (en) | Base station, drive through system comprising the same, base station method, and drive through method | |
CN107071369A (zh) | 可监控多对象的监控方法、装置及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |