CN113628633A - 用于企业多方会晤的多通道信息传输的降噪方法 - Google Patents
用于企业多方会晤的多通道信息传输的降噪方法 Download PDFInfo
- Publication number
- CN113628633A CN113628633A CN202111197519.XA CN202111197519A CN113628633A CN 113628633 A CN113628633 A CN 113628633A CN 202111197519 A CN202111197519 A CN 202111197519A CN 113628633 A CN113628633 A CN 113628633A
- Authority
- CN
- China
- Prior art keywords
- noise
- speaker
- voice
- enterprise
- covariance matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000009467 reduction Effects 0.000 title claims abstract description 28
- 230000005540 biological transmission Effects 0.000 title claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims abstract description 39
- 238000013528 artificial neural network Methods 0.000 claims abstract description 18
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims 1
- 238000011084 recovery Methods 0.000 abstract description 5
- 238000004891 communication Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 description 7
- 230000003993 interaction Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/1813—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/34—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means
- H04R1/342—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means for microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Otolaryngology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明涉及通信降噪处理技术领域,具体涉及用于企业多方会晤的多通道信息传输的降噪方法,包括以下步骤:通过人脸识别的方式确定发言者,随后通过麦克风阵列采集发言者的声音数据;利用神经网络计算出声音数据预设时长所划分的声音区间,并依据声音区间中的噪音概率计算出噪音协方差矩阵;根据中噪音的协方差矩阵以及噪音的协方差矩阵的特征向量计算合并多通道的权值;本发明中通过麦克风阵列采集多通道信号,并利用单个滤波器或者多个滤波器组将时域信号转换成频域信号,以此可以有效地保留声音区间中各个频段信号,再利用神经网络计算出各个频段上存在的噪音概率,可以更加快速有效地计算出噪音的协方差矩阵,提高了原始声音的恢复。
Description
技术领域
本发明涉及通信降噪处理技术领域,具体涉及用于企业多方会晤的多通道信息传输的降噪方法。
背景技术
随着商务活动的日益频繁,企业多方会晤的展开也越来越广泛,在多方会晤中,不同的人在不同的位置并基于会议机中的麦克风进行发言,也就是要所有与会晤有关人员都聚集在一起进行多方会晤,顾名思义会有多人发言,且需要将发言进行一定距离的传输并从扬声器播出,而发言者在发言时,其他与会晤无关的人声、桌椅及拍桌等都会带来噪声,不利于会晤人员获取到准确的会议语音信息,还会导致会晤人员疲惫。
但是,目前的降噪方法是通过语音信号前端处理的,无法区分目标发言者声音和发言者以外的声音,因此无法将发言者以外的声音进行有效抑制,而现有的降噪技术是当发言者发言时,只能通过禁止其他人说话的方式降低人声噪声干扰,这种方式对会晤的进行造成了影响,需要频繁禁止其他人说话,导致会议体验很不好。
发明内容
解决的技术问题
针对现有技术所存在的上述缺点,本发明提供了用于企业多方会晤的多通道信息传输的降噪方法,解决了降噪方法是通过语音信号前端处理的,无法区分目标发言者声音和发言者以外的声音,因此无法将发言者以外的声音进行有效抑制,而现有的降噪技术是当发言者发言时,只能通过禁止其他人说话的方式降低人声噪声干扰,这种方式对会晤的进行造成了影响,需要频繁禁止其他人说话,导致会议体验很不好的问题。
技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
第一方面,用于企业多方会晤的多通道信息传输的降噪方法,包括以下步骤:
S1:通过人脸识别的方式确定发言者,随后通过麦克风阵列采集发言者的声音数据;
S2:利用神经网络计算出声音数据预设时长所划分的声音区间,并依据声音区间中的噪音概率计算出噪音协方差矩阵;
S3:根据S2中噪音的协方差矩阵以及噪音的协方差矩阵的特征向量计算合并多通道的权值;
S4:随后会议机中的麦克风阵列采集发言者的语音,并将采集到的语音输入语音降噪模块;
S5:根据S3中的权值判断声音频段是否为发言者;若声音频段是发言者,语音降噪模块增强发言者的语音,若声音频段不是发言者,语音模块对发言者以外的语音进行屏蔽;
S6:根据S5中若声音频段为发言者,语音降噪模块处理后的语音传输至企业会议机中,并通过扬声器进行播放。
更进一步地,所述麦克风阵列采集发言者的声音数据,并利用单个滤波器或者多个滤波器通过快速傅里叶变换,随后将多通道信号中采集的时域信号转换成频域信号,以获取各个频段的信号。
更进一步地,当采集所述发言者的声音数据前,所述发言者通过麦克风朗读一段文字,随后企业登录设备接收所述发言者的声音数据。
更进一步地,所述声音数据包括语音数据和背景声音,并通过声纹信息从所述声音数据中获取所述发言者的语音数据;其中,从所述声音数据中提取声音特征以形成所述声纹信息中的识别集合,随后企业终端设备通过识别集合识别声音数据中的语音数据。
更进一步地,当利用神经网络计算预设时长所划分的声音区间中各个频段的噪音概率方法时,将提前标注好的所述语音数据输入至所述神经网络中,通过所述神经网络的计算后并输出在声音区间中各个频段上存在的噪音概率。
更进一步地,所述噪音的协方差矩阵的计算方法为:若所述噪音的协方差矩阵为
Φf,频域信号为Yit,则Φf =,其中Yit表示第i个信道在t时刻的频域信号,则
Pit表示i个信道在t时刻的频域信号概率,N表示通道的数量,是Yit的共轭转置:
所述噪音的协方差矩阵的特征向量计算方法为φfWf=Wf∧,其中所述噪音的协方差矩阵的特征向量为Wf,噪音的协方差矩阵为Φf,∧表示特征值的矩阵。
第二方面,本发明公开了用于企业多方会晤的多通道信息传输的降噪方法,所述方法用于辅助第一方面所述的用于企业多方会晤的多通道信息传输的降噪方法,包括以下子步骤:
S11:发言者在企业终端设备上通过摄像头拍摄图像,并实名注册;
S12:根据S11注册所生成的注册数据库中包含发言者的图像及用户信息;
S13:发言者通过企业登录设备登录个人用户信息,并进行人脸识别认证,以获取发言登录权限。
更进一步地,所述企业终端设备包括注册模块、自动识别模块、录入模块和数据库存储模块;所述注册模块对首次进入企业多方会晤的所述发言者进行注册,并经所述自动识别模块对所述发言者的身份信息进行验证。
更进一步地,所述录入模块将所述自动识别模块所验证的发言者身份信息进行录入,并将录入的信息储存到所述数据库存储模块中,以获取发言登录权限。
有益效果
采用本发明提供的技术方案,与已知的公有技术相比,具有如下有益效果:
1、本发明中通过麦克风阵列采集多通道信号,并利用单个滤波器或者多个滤波器组将时域信号转换成频域信号,以此可以有效地保留声音区间中各个频段信号,再利用神经网络计算出各个频段上存在的噪音概率,可以更加快速有效地计算出噪音的协方差矩阵,并将噪音概率合并得出合并多通道的权值带入到传统的信号处理框架中,可以快速收敛,计算出噪音的频谱矩阵,而利用具有物理意义的传统信号处理框架,提高了原始声音的恢复,更加真实。
2、本发明中通过用户登录及人脸识别技术验证发言者,并根据发言者的方位及声音频段设置定向拾音的方向,进而通过语音降噪模块增强发言者的语音,同时屏蔽发言者以外的语音进行处理噪音;另外,本案支持发言人与发言人之间的语言交互,同时不会影响会晤室非发言者的听感,提升了企业多方会晤的体验感。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的企业多方会晤降噪方法流程示意图;
图2为本发明的企业多方会晤发言者信息注册流程示意图;
图3为本发明的声音频段线性示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合实施例对本发明作进一步的描述。
实施例1
本实施例的用于企业多方会晤的多通道信息传输的降噪方法,如图1所示,包括以下步骤:
S1:通过人脸识别的方式确定发言者,随后通过麦克风阵列采集发言者的声音数据;
S2:利用神经网络计算出声音数据预设时长所划分的声音区间,并依据声音区间中的噪音概率计算出噪音协方差矩阵;
S3:根据S2中噪音的协方差矩阵以及噪音的协方差矩阵的特征向量计算合并多通道的权值;
S4:随后会议机中的麦克风阵列采集发言者的语音,并将采集到的语音输入语音降噪模块;
S5:根据S3中的权值判断声音频段是否为发言者;若声音频段是发言者,语音降噪模块增强发言者的语音,若声音频段不是发言者,语音模块对发言者以外的语音进行屏蔽;
S6:根据S5中若声音频段为发言者,语音降噪模块处理后的语音传输至企业会议机中,并通过扬声器进行播放。
本实施例通过用户登录及人脸识别技术验证发言者,并根据发言者的方位及声音频段设置定向拾音的方向,进而通过语音降噪模块增强发言者的语音,同时屏蔽发言者以外的语音进行处理噪音。
本实施例支持发言人与发言人之间的语言交互,同时不会影响会晤室非发言者的听感,提升了企业多方会晤的体验感。
本发明中,通过麦克风阵列采集多通道信号,并利用单个滤波器或者多个滤波器组将时域信号转换成频域信号,以此可以有效地保留声音区间中各个频段信号,再利用神经网络计算出各个频段上存在的噪音概率,可以更加快速有效地计算出噪音的协方差矩阵,并将噪音概率合并得出合并多通道的权值带入到传统的信号处理框架中,可以快速收敛,计算出噪音的频谱矩阵,而利用具有物理意义的传统信号处理框架,提高了原始声音的恢复,更加真实。
实施例2
如图1至图2所示,麦克风阵列采集发言者的声音数据,并利用单个滤波器或者多个滤波器通过快速傅里叶变换,随后将多通道信号中采集的时域信号转换成频域信号,以获取各个频段的信号。
本实施例当采集发言者的声音数据前,发言者通过麦克风朗读一段文字,随后企业登录设备接收发言者的声音数据。
本实施例声音数据包括语音数据和背景声音,并通过声纹信息从声音数据中获取发言者的语音数据;其中,从声音数据中提取声音特征以形成声纹信息中的识别集合,随后企业终端设备通过识别集合识别声音数据中的语音数据。
本实施例当利用神经网络计算预设时长所划分的声音区间中各个频段的噪音概率方法时,将提前标注好的语音数据输入至神经网络中,通过神经网络的计算后并输出在声音区间中各个频段上存在的噪音概率。
本实施例噪音的协方差矩阵的计算方法为:若噪音的协方差矩阵为Φf,频域信号
为Yit,则Φf = ,其中Yit表示第i个信道在t时刻的频域信号,则Pit表示i个
信道在t时刻的频域信号概率,N表示通道的数量,是Yit的共轭转置:
本实施例噪音的协方差矩阵的特征向量计算方法为φfWf=Wf∧,其中噪音的协方差矩阵的特征向量为Wf,噪音的协方差矩阵为Φf,∧表示特征值的矩阵。
如图3所示,用于表示甲、乙发言者在同一时间区间中,两者的声音频率,以此会议机中的麦克风根据会晤室内声音区间中的频率进行判断是否为发言者,若是则增强发言者的语音,反之则屏蔽非发言者语音。
本实施例中,通过麦克风阵列采集多通道信号,并利用单个滤波器或者多个滤波器组将时域信号转换成频域信号,以此可以有效地保留声音区间中各个频段信号。
本实施例中,利用神经网络计算出各个频段上存在的噪音概率,可以更加快速有效地计算出噪音的协方差矩阵,并将噪音概率合并得出合并多通道的权值带入到传统的信号处理框架中,可以快速收敛,计算出噪音的频谱矩阵,而利用具有物理意义的传统信号处理框架,提高了原始声音的恢复,更加真实。
本发明中,通过用户登录及人脸识别技术验证发言者,并根据发言者的方位及声音频段设置定向拾音的方向,进而通过语音降噪模块增强发言者的语音,同时屏蔽发言者以外的语音进行处理噪音;另外,本案支持发言人与发言人之间的语言交互,同时不会影响会晤室非发言者的听感,提升了企业多方会晤的体验感。
实施例3
本实施例的用于企业多方会晤的多通道信息传输的降噪方法,方法用于辅助实施例1及实施例2的用于企业多方会晤的多通道信息传输的降噪方法,其用于注册并录入发言者的身份信息,如图2所示,其注册并录入发言者的身份信息方法,包括以下子步骤:
S11:发言者在企业终端设备上通过摄像头拍摄图像,并实名注册;
S12:根据S11注册所生成的注册数据库中包含发言者的图像及用户信息;
S13:发言者通过企业登录设备登录个人用户信息,并进行人脸识别认证,以获取发言登录权限。
本实施例企业终端设备包括注册模块、自动识别模块、录入模块和数据库存储模块;注册模块对首次进入企业多方会晤的发言者进行注册,并经自动识别模块对发言者的身份信息进行验证。
本实施例录入模块将自动识别模块所验证的发言者身份信息进行录入,并将录入的信息储存到数据库存储模块中,以获取发言登录权限。
本实施例中,通过用户登录及人脸识别技术验证发言者,并根据发言者的方位及声音频段设置定向拾音的方向,进而通过语音降噪模块增强发言者的语音,同时屏蔽发言者以外的语音进行处理噪音。
本实施例中,支持发言人与发言人之间的语言交互,同时不会影响会晤室非发言者的听感,提升了企业多方会晤的体验感。
综上,通过麦克风阵列采集多通道信号,并利用单个滤波器或者多个滤波器组将时域信号转换成频域信号,以此可以有效地保留声音区间中各个频段信号,再利用神经网络计算出各个频段上存在的噪音概率,可以更加快速有效地计算出噪音的协方差矩阵,并将噪音概率合并得出合并多通道的权值带入到传统的信号处理框架中,可以快速收敛,计算出噪音的频谱矩阵,而利用具有物理意义的传统信号处理框架,提高了原始声音的恢复,更加真实;通过用户登录及人脸识别技术验证发言者,并根据发言者的方位及声音频段设置定向拾音的方向,进而通过语音降噪模块增强发言者的语音,同时屏蔽发言者以外的语音进行处理噪音;另外,本案支持发言人与发言人之间的语言交互,同时不会影响会晤室非发言者的听感,提升了企业多方会晤的体验感。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.用于企业多方会晤的多通道信息传输的降噪方法,其特征在于,包括以下步骤:
S1:通过人脸识别的方式确定发言者,随后通过麦克风阵列采集发言者的声音数据;
S2:利用神经网络计算出声音数据预设时长所划分的声音区间,并依据声音区间中的噪音概率计算出噪音协方差矩阵;
S3:根据S2中噪音的协方差矩阵以及噪音的协方差矩阵的特征向量计算合并多通道的权值;
S4:随后会议机中的麦克风阵列采集发言者的语音,并将采集到的语音输入语音降噪模块;
S5:根据S3中的权值判断声音频段是否为发言者;若声音频段是发言者,语音降噪模块增强发言者的语音,若声音频段不是发言者,语音模块对发言者以外的语音进行屏蔽;
S6:根据S5中若声音频段为发言者,语音降噪模块处理后的语音传输至企业会议机中,并通过扬声器进行播放。
2.根据权利要求1所述的用于企业多方会晤的多通道信息传输的降噪方法,其特征在于,所述麦克风阵列采集发言者的声音数据,并利用单个滤波器或者多个滤波器通过快速傅里叶变换,随后将多通道信号中采集的时域信号转换成频域信号,以获取各个频段的信号。
3.根据权利要求1所述的用于企业多方会晤的多通道信息传输的降噪方法,其特征在于,当采集所述发言者的声音数据前,所述发言者通过麦克风朗读一段文字,随后企业登录设备接收所述发言者的声音数据。
4.根据权利要求1所述的用于企业多方会晤的多通道信息传输的降噪方法,其特征在于,所述声音数据包括语音数据和背景声音,并通过声纹信息从所述声音数据中获取所述发言者的语音数据;其中,从所述声音数据中提取声音特征以形成所述声纹信息中的识别集合,随后企业终端设备通过识别集合识别声音数据中的语音数据。
5.根据权利要求4所述的用于企业多方会晤的多通道信息传输的降噪方法,其特征在于,当利用神经网络计算预设时长所划分的声音区间中各个频段的噪音概率方法时,将提前标注好的所述语音数据输入至所述神经网络中,通过所述神经网络的计算后并输出在声音区间中各个频段上存在的噪音概率。
8.根据权利要求1所述的用于企业多方会晤的多通道信息传输的降噪方法,所述方法用于辅助如权利要求1-7任一项所述的用于企业多方会晤的多通道信息传输的降噪方法,其特征在于,包括以下子步骤:
S11:发言者在企业终端设备上通过摄像头拍摄图像,并实名注册;
S12:根据S11注册所生成的注册数据库中包含发言者的图像及用户信息;
S13:发言者通过企业登录设备登录个人用户信息,并进行人脸识别认证,以获取发言登录权限。
9.根据权利要求8所述的用于企业多方会晤的多通道信息传输的降噪方法,其特征在于,所述企业终端设备包括注册模块、自动识别模块、录入模块和数据库存储模块;所述注册模块对首次进入企业多方会晤的所述发言者进行注册,并经所述自动识别模块对所述发言者的身份信息进行验证。
10.根据权利要求9所述的用于企业多方会晤的多通道信息传输的降噪方法,其特征在于,所述录入模块将所述自动识别模块所验证的发言者身份信息进行录入,并将录入的信息储存到所述数据库存储模块中,以获取发言登录权限。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111197519.XA CN113628633A (zh) | 2021-10-14 | 2021-10-14 | 用于企业多方会晤的多通道信息传输的降噪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111197519.XA CN113628633A (zh) | 2021-10-14 | 2021-10-14 | 用于企业多方会晤的多通道信息传输的降噪方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113628633A true CN113628633A (zh) | 2021-11-09 |
Family
ID=78391312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111197519.XA Pending CN113628633A (zh) | 2021-10-14 | 2021-10-14 | 用于企业多方会晤的多通道信息传输的降噪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113628633A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102938254A (zh) * | 2012-10-24 | 2013-02-20 | 中国科学技术大学 | 一种语音信号增强系统和方法 |
CN109597022A (zh) * | 2018-11-30 | 2019-04-09 | 腾讯科技(深圳)有限公司 | 声源方位角运算、定位目标音频的方法、装置和设备 |
CN111028857A (zh) * | 2019-12-27 | 2020-04-17 | 苏州蛙声科技有限公司 | 基于深度学习的多通道音视频会议降噪的方法及系统 |
CN111833876A (zh) * | 2020-07-14 | 2020-10-27 | 科大讯飞股份有限公司 | 会议发言控制方法、系统、电子设备及存储介质 |
CN113314135A (zh) * | 2021-05-25 | 2021-08-27 | 北京小米移动软件有限公司 | 声音信号识别方法及装置 |
-
2021
- 2021-10-14 CN CN202111197519.XA patent/CN113628633A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102938254A (zh) * | 2012-10-24 | 2013-02-20 | 中国科学技术大学 | 一种语音信号增强系统和方法 |
CN109597022A (zh) * | 2018-11-30 | 2019-04-09 | 腾讯科技(深圳)有限公司 | 声源方位角运算、定位目标音频的方法、装置和设备 |
CN111028857A (zh) * | 2019-12-27 | 2020-04-17 | 苏州蛙声科技有限公司 | 基于深度学习的多通道音视频会议降噪的方法及系统 |
CN111833876A (zh) * | 2020-07-14 | 2020-10-27 | 科大讯飞股份有限公司 | 会议发言控制方法、系统、电子设备及存储介质 |
CN113314135A (zh) * | 2021-05-25 | 2021-08-27 | 北京小米移动软件有限公司 | 声音信号识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103827966B (zh) | 处理音频信号 | |
CN110797043B (zh) | 会议语音实时转写方法及系统 | |
EP3005362B1 (en) | Apparatus and method for improving a perception of a sound signal | |
US11398220B2 (en) | Speech processing device, teleconferencing device, speech processing system, and speech processing method | |
Khaddour et al. | A novel combined system of direction estimation and sound zooming of multiple speakers | |
CN110012331A (zh) | 一种红外触发的远场双麦远场语音识别方法 | |
CN114333853A (zh) | 一种音频数据的处理方法、设备和系统 | |
CN117480554A (zh) | 语音增强方法及相关设备 | |
CN115482830B (zh) | 语音增强方法及相关设备 | |
CN112363112B (zh) | 一种基于线性麦克风阵列的声源定位方法及装置 | |
Shabtai | Optimization of the directivity in binaural sound reproduction beamforming | |
CN110265038B (zh) | 一种处理方法及电子设备 | |
CN113628633A (zh) | 用于企业多方会晤的多通道信息传输的降噪方法 | |
CN111696515A (zh) | 一种用于教学录播的音频混音方法 | |
Aroudi et al. | TRUNet: Transformer-recurrent-U network for multi-channel reverberant sound source separation | |
CN112543302A (zh) | 一种多人远程会议中智能降噪的方法和设备 | |
Zucatelli et al. | Adaptive reverberation absorption using non-stationary masking components detection for intelligibility improvement | |
Cox et al. | Overview of the 2023 ICASSP SP Clarity Challenge: Speech Enhancement for Hearing Aids | |
CN107819964B (zh) | 提高通话质量的方法、装置、终端和计算机可读存储介质 | |
CN108877825A (zh) | 一种基于语音激励和逻辑控制的网络回声消除装置及方法 | |
Yamada et al. | Non-reference objective quality evaluation for noise-reduced speech using overall quality estimation model | |
US20230421702A1 (en) | Distributed teleconferencing using personalized enhancement models | |
Gans et al. | Binaural Noise Reduction in Hearing Aid Simulations Using a Multichannel Wiener Filter | |
Koutrouvelis et al. | Evaluation of binaural noise reduction methods in terms of intelligibility and perceived localization | |
Tong et al. | Enhanced, blind and robust far-field audio acquisition for portable devices |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211109 |