CN113628632A - 语音降噪方法、装置、设备及存储介质 - Google Patents

语音降噪方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113628632A
CN113628632A CN202111085801.9A CN202111085801A CN113628632A CN 113628632 A CN113628632 A CN 113628632A CN 202111085801 A CN202111085801 A CN 202111085801A CN 113628632 A CN113628632 A CN 113628632A
Authority
CN
China
Prior art keywords
noise reduction
server
target
voice
scheduling terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111085801.9A
Other languages
English (en)
Inventor
刘伟光
铁伟涛
贾文军
王莉
董戈
付静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaxun Feihong Electrical Co Ltd
Original Assignee
Beijing Jiaxun Feihong Electrical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaxun Feihong Electrical Co Ltd filed Critical Beijing Jiaxun Feihong Electrical Co Ltd
Publication of CN113628632A publication Critical patent/CN113628632A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/141Setup of application sessions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • H04L67/63Routing a service request depending on the request content or context

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种语音降噪方法、装置、设备及存储介质,该方法包括:建立与管理服务器的通信链接,并通过通信链接向管理服务器发送语音降噪请求;进而接收管理服务器反馈的与部署场景匹配的目标降噪服务器的IP地址和端口信息;根据目标降噪服务器的IP地址和端口信息,向目标降噪服务器发送采集语音信号,并将目标降噪服务器反馈的与采集语音信号匹配的降噪语音信号进行播放,实现了根据智能降噪算法对语音信号的降噪处理,同时根据调度终端的部署场景,确定匹配的目标降噪服务器,实现了对任意部署场景下语音信号的智能语音降噪处理,增强了调度终端的场景通用性。

Description

语音降噪方法、装置、设备及存储介质
技术领域
本发明实施例涉及语音处理技术领域,尤其涉及一种语音降噪方法、装置、设备及存储介质。
背景技术
在多媒体调度会议中,由于环境或设备等干扰因素的影响,调度终端采集的语音信号中通常会夹杂有大量噪音;在对语音信号进行转发和播放前,对采集语音信号进行降噪处理,如图1所示,对提升通话质量具有重要意义。
目前,通常是在调度终端上部署语音信号降噪算法,以实现对采集语音信号的实时降噪处理。然而,受调度终端中央处理器(Central Processing Unit,CPU)性能的限制,较为复杂的语音信号降噪算法,例如,基于神经网络的智能降噪算法,无法在调度终端上运行;同时,调度终端需要部署在不同的场景中,而一种语音信号降噪算法通常只能适用于一种场景下语音信号的降噪处理,故调度终端无法适用所有场景,导致调度终端的通用性差,无法适用于各类型场景。
发明内容
本发明提供一种语音降噪方法、装置、设备及存储介质,以实现对任意部署场景下语音信号的降噪处理,增强调度终端的场景通用性。
第一方面,本发明实施例提供了一种语音降噪方法,应用于调度终端,包括:
建立与管理服务器的通信链接,并通过所述通信链接向管理服务器发送语音降噪请求;所述语音降噪请求包括调度终端的部署场景;
接收管理服务器反馈的与所述部署场景匹配的目标降噪服务器的网际协议IP地址和端口信息;其中,所述管理服务器管理至少一个降噪服务器,降噪服务器部署有智能降噪算法,智能降噪算法与部署场景一一对应;
根据目标降噪服务器的IP地址和端口信息,向所述目标降噪服务器发送采集语音信号,并将目标降噪服务器反馈的与采集语音信号匹配的降噪语音信号进行播放。
第二方面,本发明实施例还提供了一种语音降噪方法,应用于管理服务器,包括:
建立与目标调度终端的通信链接,并接收目标调度终端通过所述通信链接发送语音降噪请求;所述语音降噪请求包括目标调度终端的部署场景;
根据目标调度终端的部署场景,确定目标调度终端匹配的目标降噪服务器;
将所述语音降噪请求发送至目标降噪服务器,并在检测到目标降噪服务器反馈的语音降噪请求确认消息时,将目标降噪服务器的IP地址和端口信息发送至目标调度终端,以通过所述目标降噪服务器对目标调度终端的采集语音信号进行语音降噪处理。
第三方面,本发明实施例还提供了一种语音降噪装置,应用于调度终端,包括:
语音降噪请求发送模块,用于建立与管理服务器的通信链接,并通过所述通信链接向管理服务器发送语音降噪请求;所述语音降噪请求包括调度终端的部署场景;
信息接收模块,用于接收管理服务器反馈的与所述部署场景匹配的目标降噪服务器的网际协议IP地址和端口信息;其中,降噪服务器部署有智能降噪算法,智能降噪算法与部署场景一一对应;
采集语音信号发送模块,用于根据目标降噪服务器的IP地址和端口信息,向所述目标降噪服务器发送采集语音信号,并将目标降噪服务器反馈的与采集语音信号匹配的降噪语音信号进行播放。
第四方面,本发明实施例还提供了一种语音降噪装置,应用于管理服务器,包括:
语音降噪请求接收模块,用于建立与目标调度终端的通信链接,并接收目标调度终端通过所述通信链接发送语音降噪请求;所述语音降噪请求包括目标调度终端的部署场景;
目标降噪服务器确定模块,用于根据目标调度终端的部署场景,确定目标调度终端匹配的目标降噪服务器;
信息发送模块,用于将所述语音降噪请求发送至目标降噪服务器,并在检测到目标降噪服务器反馈的语音降噪请求确认消息时,将目标降噪服务器的IP地址和端口信息发送至目标调度终端,以通过所述目标降噪服务器对目标调度终端的采集语音信号进行语音降噪处理。
第五方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所述的语音降噪方法。
第六方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行本发明任意实施例所述的语音降噪方法。
本发明实施例提供的技术方案,调度终端通过与管理服务器的通信链接,向管理服务器发送包括部署场景的语音降噪请求;并在接收到管理服务器反馈的与部署场景匹配的目标降噪服务器的IP地址和端口信息后,根据IP地址和端口信息,将采集语音信号发送至目标服务器进行语音降噪处理,最终将目标降噪服务器反馈的降噪语音信号进行播放,实现了根据智能降噪算法对语音信号的降噪处理,同时根据调度终端的部署场景,确定匹配的目标降噪服务器,实现了对任意部署场景下语音信号的降噪处理,增强了调度终端的场景通用性。
附图说明
图1为现有技术提供的调度终端语音处理流程示意图;
图2是本发明提供的一种语音降噪方法的应用场景图;
图3是本发明实施例一提供的一种语音降噪方法的流程图;
图4A是本发明实施例二提供的一种语音降噪方法的流程图;
图4B是本发明实施例二提供的一种语音降噪方法的数据交互流程示意图;
图4C是本发明实施例二提供的一种语音降噪方法的数据交互流程示意图;
图5是本发明实施例三提供的一种语音降噪装置的结构框图;
图6是本发明实施例四提供的一种语音降噪装置的结构框图;
图7是本发明实施例五提供的一种电子设备的结构框图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
本发明实施例提供的一种语音降噪方法,可以应用于如图2所示的应用场景中。
多个调度终端10与管理服务器11连接,管理服务器11与多个降噪服务器12连接。调度终端10作为语音降噪处理的请求方,对应不同的部署场景,降噪服务器12作为语音降噪处理的执行方。调度终端10上安装有语音采集模块和语音播放模块,为用于进行语音信号采集和播放的终端设备;管理服务器11,为用于对多个降噪服务器12进行集中管理,以及为各调度终端10分配对应降噪服务器12的设备;降噪服务器12,为配置有智能语音降噪算法,用于执行语音降噪处理操作,并将语音降噪处理后的语音信号发送至调度终端10的设备。
在本实施例中,以两个调度终端10和两个降噪服务器12为例;调度终端10首先向管理服务器11发送包含当前部署场景的语音降噪请求;管理服务器11根据语音降噪请求中的部署场景,为调度终端10分配匹配的降噪服务器12,并将降噪服务器12的访问路径发送至调度终端10;调度终端10将采集的语音信号,通过接收的访问路径发送至匹配的降噪服务器12;降噪服务器12对接收的语音信号进行降噪处理,并将降噪处理后的降噪语音信号反馈至调度终端10;调度终端10对降噪服务器12反馈的降噪语音信号进行播放,以实现对语音信号的智能语音降噪处理。
实施例一
图3为本发明实施例一提供的一种语音降噪方法的流程图,本实施例可适用于部署于不同场景的调度终端,通过匹配的目标降噪服务器对采集语音信号进行智能语音降噪处理的情况,该方法可以由本发明实施例三中的语音降噪装置来执行,该装置可以通过软件和/或硬件实现,并集成在电子设备上,典型的,可以集成在具有语音采集和播放功能的终端设备上,该方法具体包括如下步骤:
S110、建立与管理服务器的通信链接,并通过所述通信链接向管理服务器发送语音降噪请求。
其中,调度终端与管理服务器间的通信链接,可以基于预设通信协议;典型的,预设通信协议,可以包括用户数据报协议(User Datagram Protocol,UDP);通过基于UDP协议对调度终端的请求信息和采集语音信号进行传输,可以提升数据传输效率,同时可以降低数据传输时延,故可以降低语音信号降噪处理所花费的时间成本,提升语音降噪处理效率。
语音降噪请求,为调度终端向管理服务器发送的,用于请求匹配降噪服务器的指令信息,可以包括调度终端的部署场景,例如,大厅、会议室和户外等。需要说明的是,当调度终端被部署在特定场景时,其采集的语音信号通常会掺杂当前场景下的噪音信号,而不同场景对应噪音信号的特征存在较大区别。其中,智能降噪算法,用于基于神经网络进行语音降噪处理;不同智能降噪算法由不同场景下的语音样本训练得到,故智能降噪算法只能对匹配场景下的语音信号进行降噪处理;因此,在确定调度终端的部署场景后,根据部署场景确定匹配的智能降噪算法,以实现对当前场景下语音信号的有效降噪处理。
在本实施例中,调度终端在检测到用户成功登录调度终端客户端后,根据用户输入的调度终端部署场景,生成对应的语音降噪请求发送至管理服务器;进一步的,管理服务器在接收到调度终端发送的语音降噪请求后,对语音降噪请求进行内容解析,以确定对应的部署场景。需要说明的是,管理服务器负责对所有降噪服务器进行集中管理,通过降噪服务器标识表示各降噪服务器的身份;同时,管理服务器中存储有各降噪服务器与适用部署场景的映射关系,故管理服务器在确定调度终端发送的语音降噪请求中包含的部署场景后,根据当前部署场景,在存储的映射关系中进行匹配查找,可以确定与调度终端匹配的降噪服务器。
S120、接收管理服务器反馈的与所述部署场景匹配的目标降噪服务器的网际协议IP地址和端口信息。
其中,管理服务器管理至少一个降噪服务器,降噪服务器部署有智能降噪算法,智能降噪算法与部署场景一一对应。需要说明的是,一个降噪服务器对应一种智能降噪算法,不同降噪服务器可以对应同一种或不同的智能降噪算法。降噪服务器的数量以及类型可以根据调度终端进行适应性调整,典型的,当调度终端数量较多时,为了更好地提供语音降噪服务,可以适应性增加降噪服务器的数量;或者,当某一部署场景下的调度终端数量增多时,可以增加对应匹配降噪服务器的数量;在本实施例中,对降噪服务器的数量和类型均不作具体限定。
在本实施例中,管理服务器在接收到调度终端发送的语音降噪请求后,确定调度终端当前的部署场景,并根据部署场景确定对应的至少一个降噪服务器,进而在多个降噪服务器中确定目标降噪服务器,以实现对目标降噪服务器的确定。
需要说明的是,管理服务器预先存储有各降噪服务器的网际协议(InternetProtocol,IP)地址,以及与智能语音降噪处理对应的服务器端口信息;故管理服务器在确定与调度终端匹配的目标降噪服务器后,可以获取目标降噪服务器对应的IP地址和端口信息;进而在确定当前降噪服务器可用的情况下,将目标降噪服务器的IP地址和端口信息发送至调度终端。
进一步的,调度终端对管理服务器反馈的目标降噪服务器的IP地址和端口信息进行接收;值的注意的是,后续进行语音信号的降噪处理时,调度终端根据目标降噪服务器的IP地址和端口信息,将采集语音信号直接发送至目标服务器进行智能语音降噪处理,不必再经过管理服务器进行转发,可以简化语音降噪处理流程,进一步提升语音降噪处理效率。
此外,可选的,由调度终端确定与当前部署场景对应的智能降噪算法,并根据部署场景和对应智能降噪算法,生成语音降噪请求发送至管理服务器;管理服务器在接收到语音降噪请求后,根据包含的智能降噪算法,直接确定对应的目标降噪服务器,可以提升确定目标降噪服务器的速度,进而进一步提升语音降噪处理效率。
在本实施例中,可选的,通过所述通信链接向管理服务器发送语音降噪请求之后,还可以包括:若间隔预设第一时间阈值未接收到管理服务器的反馈消息,对采集语音信号进行直接播放;每间隔预设第二时间阈值,通过所述通信链接向管理服务器发送语音降噪请求,直至接收到管理服务器的反馈消息,或者所述通信链接断开。
需要说明的是,为了保障基本的语音通信需求,若调度终端在发出语音降噪请求的预设第一时间阈值(例如,2秒)内,未收到管理服务器反馈的消息,则对获取的采集语音信号进行直接播放,可以避免语音降噪服务故障导致的语音通信中断,提升调度终端的稳定性;进一步的,每间隔预设第二时间阈值(例如,5秒),重复向管理服务器发送语音降噪请求,直至成功接收到管理服务器的反馈消息,或者与管理服务器之间的通信链接断裂,可以实现在语音降噪服务恢复的第一时间,执行语音降噪处理。
S130、根据目标降噪服务器的IP地址和端口信息,向所述目标降噪服务器发送采集语音信号,并将目标降噪服务器反馈的与采集语音信号匹配的降噪语音信号进行播放。
具体的,调度终端对接收的目标降噪服务器的IP地址和端口信息进行存储,并执行语音采集操作,以获取当前部署场景下的采集语音信号;进而对采集语音信号进行脉冲编码调制(Pulse Code Modulation,PCM),并根据目标降噪服务器的IP地址和端口信息,将编码后的采集语音信号发送至目标降噪服务器,以通过目标降噪服务器对采集语音信号进行智能语音降噪处理;最终,接收目标降噪服务器反馈的与采集语音信号匹配的降噪语音信号,并对降噪语音信号进行对应解码以进行播放,实现了对采集语音信号的智能降噪处理。
在本实施例中,可选的,根据目标降噪服务器的IP地址和端口信息,向所述目标降噪服务器发送采集语音信号,并将目标降噪服务器反馈的与采集语音信号匹配的降噪语音信号进行播放,可以包括:
当无法获取到采集语音信号时,每间隔预设第三时间阈值,根据目标降噪服务器的IP地址和端口信息,向所述目标降噪服务器发送预设保活语音信号,并将目标降噪服务器反馈的与预设保活语音信号匹配的预设降噪保活语音信号进行播放;所述预设保活语音信号包括空语音信号。
需要说明的是,在实际场景中,可能存在一段时间内,调度终端采集的语音信号为空的情况;此时,为了避免目标降噪服务器认为当前调度终端已断开连接,从而释放对应端口资源的情况,调度终端每间隔预设第三时间阈值(例如,1秒),向目标降噪服务器发送预设保活语音信号,以实现与目标降噪服务器连接的保活;特别的,预设保活语音信号的内容可以为空。
此外,可选的,调度终端在确定不需要使用语音降噪服务时,主动向管理服务器发送语音降噪终止请求;管理服务器在接收到调度终端的语音降噪终止请求后,向匹配的目标降噪服务器发送占用解除指示,以结束目标调度终端对目标降噪服务器的端口资源占用,实现对调度终端语音降噪处理的及时结束,避免调度终端对目标降噪服务器资源的长时间占用,节省目标降噪服务器的计算能力。
本发明实施例提供的技术方案,调度终端通过与管理服务器的通信链接,向管理服务器发送包括部署场景的语音降噪请求;并在接收到管理服务器反馈的与部署场景匹配的目标降噪服务器的IP地址和端口信息后,根据IP地址和端口信息,将采集语音信号发送至目标服务器进行语音降噪处理,最终将目标降噪服务器反馈的降噪语音信号进行播放,实现了根据智能降噪算法对语音信号的降噪处理,同时根据调度终端的部署场景,确定匹配的目标降噪服务器,实现了对任意部署场景下语音信号的降噪处理,增强了调度终端的场景通用性。
实施例二
图4A为本发明实施例二提供的一种语音降噪方法的流程图,本实施例可适用于服务器根据语音降噪请求中的部署场景,确定与调度终端匹配的目标降噪服务器,该方法可以由本发明实施例四中的语音降噪装置来执行,该装置可以通过软件和/或硬件实现,并集成在服务器上,该方法具体包括如下步骤:
S210、建立与目标调度终端的通信链接,并接收目标调度终端通过所述通信链接发送语音降噪请求。
其中,语音降噪请求包括目标调度终端的部署场景。
S220、根据目标调度终端的部署场景,确定目标调度终端匹配的目标降噪服务器。
其中,管理服务器根据目标调度终端的部署场景,以及预先存储的调度终端部署场景和降噪服务器之间的映射关系,确定与目标调度终端匹配的目标降噪服务器,可以实现对目标降噪服务器的准确确定;同时,管理服务器与降噪服务器采用分布式部署,可以保证功能独立性,便于对降噪服务器的集中管理;此外,当调度终端数量增加时,可以适应性增加对应的降噪服务器,还可以根据调度终端部署场景的变化,适应性调整降噪服务器的类型,进一步增强了语音降噪系统的场景适用性。
在本实施例中,可选的,根据目标调度终端的部署场景,确定目标调度终端匹配的目标降噪服务器,可以包括:根据目标调度终端的部署场景,确定目标调度终端匹配的至少一个降噪服务器;获取各所述降噪服务器的剩余算力,并根据各所述降噪服务器的剩余算力,在各所述降噪服务器中确定目标降噪服务器。
其中,降噪服务器的算力,表示降噪服务器可处理语音信号的数量,由降噪服务器的硬件性能决定;对应的,降噪服务器的剩余算力,表示降噪服务器去除当前已经在处理的语音信号,还可以处理语音信号的数量;例如,降噪服务器最多可对50路语音信号进行降噪处理,则降噪服务器算力为50;若当前正在对20路语音信号进行降噪处理,则降噪服务器的剩余算力为30。
需要说明的是,为了避免降噪服务器超负荷运转,管理服务器可以根据降噪服务器的理论最大算力,确定对应的可使用最大算力;例如,降噪服务器的理论最大算力为50,设定可使用最大算力为理论最大算力的80%,则可使用最大算力为40;其中,可使用最大算力与理论最大算力的比例可以根据任务需要进行自适应设定。通过设置对应比例,以获取降噪服务器对应的可使用最大算力,可以避免降噪服务器的超负荷运行,提升语音降噪业务的稳定性。
具体的,管理服务器首先根据当前目标调度终端的部署场景,在全部降噪服务器中确定匹配的多个降噪服务器;进一步的,统计匹配的多个降噪服务器的剩余算力,并根据各降噪服务器的剩余算力,在匹配的多个降噪服务器中确定目标降噪服务器;例如,比较各匹配降噪服务器的剩余算力,并将当前剩余算力最大的降噪服务器,作为目标降噪服务器;又如,将剩余算力大于预设算力阈值的降噪服务器,作为目标降噪服务器。
在本实施例中,通过获取各降噪服务器的剩余算力,可以将语音降噪任务在对应的降噪服务器之间进行均衡分配,避免个别降噪服务器语音降噪业务处理压力过大,同时可以提升各降噪服务器的语音降噪处理效率。
此外,可选的,根据各所述降噪服务器的剩余算力,在各所述降噪服务器中确定目标降噪服务器之后,还可以包括:更新所述目标降噪服务器的剩余算力;当确定所述目标降噪服务器的剩余算力为零时,将所述目标降噪服务器标记为不可用状态。
需要说明的是,管理服务器在获取到各降噪服务器的剩余算力后,存储降噪服务器标识和剩余算力的映射关系;进一步的,在完成每一次目标调度终端对应目标降噪服务器的分配后,更新映射关系中的剩余算力;典型的,将当前目标降噪服务器对应的剩余算力减一。
值的注意的是,当存储的目标降噪服务器对应的剩余算力变为零时,管理服务器可以将目标降噪服务器标记为不可用状态;对应的,在根据目标调度终端的部署场景,确定目标调度终端匹配的至少一个降噪服务器时,可以包括:根据目标调度终端的部署场景,确定目标调度终端匹配的至少一个处于可用状态的降噪服务器。
在本实施例中,通过对各降噪服务器对应的剩余算力进行不断更新,并将剩余算力为零的降噪服务器标记为不可用状态,以在确定与目标调度终端匹配的目标降噪服务器时,直接忽略不可用状态的降噪服务器,可以提升管理服务器确定目标降噪服务器的速度。
S230、将所述语音降噪请求发送至目标降噪服务器,并在检测到目标降噪服务器反馈的语音降噪请求确认消息时,将目标降噪服务器的IP地址和端口信息发送至目标调度终端,以通过所述目标降噪服务器对目标调度终端的采集语音信号进行语音降噪处理。
具体的,管理服务器在确定与目标调度终端匹配的目标降噪服务器后,将语音降噪请求发送至目标降噪服务器;目标降噪服务器若确定当前自身不存在异常且仍存在可用算力,则向管理服务器反馈语音降噪请求确认消息;管理服务器在接收到目标降噪服务器的语音降噪请求确认消息后,将目标降噪服务器的IP地址和端口信息发送至当前目标调度终端,以通过目标降噪服务器对目标调度终端的采集语音信号进行语音降噪处理。
为了更清楚的介绍本发明实施例的技术方案,如图4B所示,本发明实施例提供的技术方案可以包括:以两个调度终端和两个降噪服务器为例,调度终端0向管理服务器发送语音降噪请求,管理服务器根据语音降噪请求中的部署场景,确定匹配的降噪服务器为降噪服务器1,并将语音降噪请求发送至降噪服务器1;其中,管理服务器预先获取降噪服务器1的剩余算力,并确定当前剩余算力不为零。降噪服务器1在接收到语音降噪请求后,反馈语音降噪请求确定消息,并将自身的剩余算力发送至管理服务器;管理服务器记录降噪服务器1的剩余算力,并将降噪服务器1的IP地址和端口信息发送至调度终端0;调度终端0在接收到管理服务器发送的降噪服务器1的IP地址和端口信息后,基于UDP协议将PCM语音信号发送至降噪服务器1进行语音降噪处理。对应的,调度终端1采用相同的流程获取降噪服务器2的IP地址和端口信息,并通过降噪服务器2对采集语音信号进行语音降噪处理。
进一步的,当需要结束语音降噪处理时,由调度终端0向管理服务器发送语音降噪终止请求;管理服务器在接收到语音降噪终止请求后,将语音降噪终止请求发送至与调度终端0匹配的降噪服务器1,并在接收到降噪服务器反馈的语音降噪终止确认消息与更新后的剩余算力后,更新降噪服务器1的剩余算力,并将语音降噪终止确认消息发送至调度终端0,实现对语音降噪处理的结束。
在本实施例的一个可选的实施方式中,如图4C所示,管理服务器0管理有降噪服务器1和降噪服务器2,降噪服务器1和降噪服务器2匹配相同的部署场景。降噪服务器1和降噪服务器2分别将各自对应的剩余算力发送至管理服务器0,管理服务器0对降噪服务器1和降噪服务器2各自的剩余算力进行存储;当管理服务器0分配一个调度终端到降噪服务器1后,对降噪服务器1的剩余算力进行更新;同时分配一个调度终端到降噪服务器2后,对降噪服务器2的剩余算力进行更新。
进一步的,若降噪服务器1更新后的剩余算力为零,则管理服务器0将降噪服务器1标记为不可用状态;并在再次获取到对应相同部署场景的调度终端的语音降噪请求后,管理服务器0直接将当前调度终端分配至降噪服务器2,并更新降噪服务器2的剩余算力。通过根据各降噪服务器的剩余算力,确定与调度终端匹配的目标降噪服务器,可以实现各降噪服务器的语音降噪业务均衡,避免超负荷运转导致的降噪服务器崩溃,提升语音降噪业务的稳定性。
本发明实施例提供的技术方案,服务器根据目标调度终端发送的语音降噪请求中的部署场景,确定与目标调度终端匹配的目标降噪服务器;并在接收到目标降噪服务器的语音降噪请求确认消息后,将目标降噪服务器的IP地址和端口信息发送至目标调度终端,以通过目标降噪服务器对目标调度终端的采集语音信号进行语音降噪处理,实现了对降噪服务器的集中管理,且实现了对目标调度终端匹配的目标降噪服务器的准确分配。
实施例三
图5为本发明实施例三提供的一种语音降噪装置的结构框图,该装置具体包括:语音降噪请求发送模块310、信息接收模块320和采集语音信号发送模块330;
语音降噪请求发送模块310,用于建立与管理服务器的通信链接,并通过所述通信链接向管理服务器发送语音降噪请求;所述语音降噪请求包括调度终端的部署场景;
信息接收模块320,用于接收管理服务器反馈的与所述部署场景匹配的目标降噪服务器的IP地址和端口信息;其中,降噪服务器部署有智能降噪算法,智能降噪算法与部署场景一一对应;
采集语音信号发送模块330,用于根据目标降噪服务器的IP地址和端口信息,向所述目标降噪服务器发送采集语音信号,并将目标降噪服务器反馈的与采集语音信号匹配的降噪语音信号进行播放。
可选的,在上述技术方案的基础上,所述语音降噪装置,还包括:
语音播放模块,用于若间隔预设第一时间阈值未接收到管理服务器的反馈消息,对采集语音信号进行直接播放;
语音降噪请求发送模块310,还用于每间隔预设第二时间阈值,通过所述通信链接向管理服务器发送语音降噪请求,直至接收到管理服务器的反馈消息,或者所述通信链接断开。
可选的,在上述技术方案的基础上,采集语音信号发送模块330,还用于当无法获取到采集语音信号时,每间隔预设第三时间阈值,根据目标降噪服务器的IP地址和端口信息,向所述目标降噪服务器发送预设保活语音信号,并将目标降噪服务器反馈的与预设保活语音信号匹配的预设降噪保活语音信号进行播放;所述预设保活语音信号包括空语音信号。
本发明实施例所提供的语音降噪装置可执行本发明实施例一所提供的语音降噪方法,具备执行方法相应的功能模块和有益效果。
实施例四
图6为本发明实施例四提供的一种语音降噪装置的结构框图,该装置具体包括:语音降噪请求接收模块410、目标降噪服务器确定模块420和信息发送模块430;
语音降噪请求接收模块410,用于建立与目标调度终端的通信链接,并接收目标调度终端通过所述通信链接发送语音降噪请求;所述语音降噪请求包括目标调度终端的部署场景;
目标降噪服务器确定模块420,用于根据目标调度终端的部署场景,确定目标调度终端匹配的目标降噪服务器;
信息发送模块430,用于将所述语音降噪请求发送至目标降噪服务器,并在检测到目标降噪服务器反馈的语音降噪请求确认消息时,将目标降噪服务器的IP地址和端口信息发送至目标调度终端,以通过所述目标降噪服务器对目标调度终端的采集语音信号进行语音降噪处理。
可选的,在上述技术方案的基础上,目标降噪服务器确定模块420,包括:
降噪服务器确定单元,用于根据目标调度终端的部署场景,确定目标调度终端匹配的至少一个降噪服务器;
目标降噪服务器确定单元,用于获取各所述降噪服务器的剩余算力,并根据各所述降噪服务器的剩余算力,在各所述降噪服务器中确定目标降噪服务器。
可选的,在上述技术方案的基础上,所述语音降噪装置,还包括:
算力更新模块,用于更新所述目标降噪服务器的剩余算力;
状态标记模块,用于当确定所述目标降噪服务器的剩余算力为零时,将所述目标降噪服务器标记为不可用状态;
降噪服务器确定单元,具体用于根据目标调度终端的部署场景,确定目标调度终端匹配的至少一个处于可用状态的降噪服务器。
本发明实施例所提供的语音降噪装置可执行本发明实施例二所提供的语音降噪方法,具备执行方法相应的功能模块和有益效果。
实施例五
图7为本发明实施例五提供的一种电子设备的结构示意图,如图5所示,该电子设备包括处理器50、存储器51、输入装置52和输出装置53;电子设备中处理器50的数量可以是一个或多个,图5中以一个处理器50为例;电子设备中的处理器50、存储器51、输入装置52和输出装置53可以通过总线或其他方式连接,图5中以通过总线连接为例。
存储器51作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的语音降噪方法对应的程序指令/模块(例如,语音降噪装置中的语音降噪请求发送模块310、信息接收模块320和采集语音信号发送模块330,或者语音降噪装置中的语音降噪请求接收模块410、目标降噪服务器确定模块420和信息发送模块430)。处理器50通过运行存储在存储器51中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述的语音降噪方法,即:
建立与管理服务器的通信链接,并通过所述通信链接向管理服务器发送语音降噪请求;所述语音降噪请求包括调度终端的部署场景;
接收管理服务器反馈的与所述部署场景匹配的目标降噪服务器的IP地址和端口信息;其中,所述管理服务器管理至少一个降噪服务器,降噪服务器部署有智能降噪算法,智能降噪算法与部署场景一一对应;
根据目标降噪服务器的IP地址和端口信息,向所述目标降噪服务器发送采集语音信号,并将目标降噪服务器反馈的与采集语音信号匹配的降噪语音信号进行播放;
或者建立与目标调度终端的通信链接,并接收目标调度终端通过所述通信链接发送语音降噪请求;所述语音降噪请求包括目标调度终端的部署场景;
根据目标调度终端的部署场景,确定目标调度终端匹配的目标降噪服务器;
将所述语音降噪请求发送至目标降噪服务器,并在检测到目标降噪服务器反馈的语音降噪请求确认消息时,将目标降噪服务器的IP地址和端口信息发送至目标调度终端,以通过所述目标降噪服务器对目标调度终端的采集语音信号进行语音降噪处理。
存储器51可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器51可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器51可进一步包括相对于处理器50远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置52可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置53可包括显示屏等显示设备。
实施例六
本发明实施例六还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种语音降噪方法,该方法包括:
建立与管理服务器的通信链接,并通过所述通信链接向管理服务器发送语音降噪请求;所述语音降噪请求包括调度终端的部署场景;
接收管理服务器反馈的与所述部署场景匹配的目标降噪服务器的IP地址和端口信息;其中,所述管理服务器管理至少一个降噪服务器,降噪服务器部署有智能降噪算法,智能降噪算法与部署场景一一对应;
根据目标降噪服务器的IP地址和端口信息,向所述目标降噪服务器发送采集语音信号,并将目标降噪服务器反馈的与采集语音信号匹配的降噪语音信号进行播放;
或者建立与目标调度终端的通信链接,并接收目标调度终端通过所述通信链接发送语音降噪请求;所述语音降噪请求包括目标调度终端的部署场景;
根据目标调度终端的部署场景,确定目标调度终端匹配的目标降噪服务器;
将所述语音降噪请求发送至目标降噪服务器,并在检测到目标降噪服务器反馈的语音降噪请求确认消息时,将目标降噪服务器的IP地址和端口信息发送至目标调度终端,以通过所述目标降噪服务器对目标调度终端的采集语音信号进行语音降噪处理。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的语音降噪方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述语音降噪装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种语音降噪方法,其特征在于,应用于调度终端,包括:
建立与管理服务器的通信链接,并通过所述通信链接向管理服务器发送语音降噪请求;所述语音降噪请求包括调度终端的部署场景;
接收管理服务器反馈的与所述部署场景匹配的目标降噪服务器的网际协议IP地址和端口信息;其中,所述管理服务器管理至少一个降噪服务器,降噪服务器部署有智能降噪算法,智能降噪算法与部署场景一一对应;
根据目标降噪服务器的IP地址和端口信息,向所述目标降噪服务器发送采集语音信号,并将目标降噪服务器反馈的与采集语音信号匹配的降噪语音信号进行播放。
2.根据权利要求1所述的方法,其特征在于,通过所述通信链接向管理服务器发送语音降噪请求之后,还包括:
若间隔预设第一时间阈值未接收到管理服务器的反馈消息,对采集语音信号进行直接播放;
每间隔预设第二时间阈值,通过所述通信链接向管理服务器发送语音降噪请求,直至接收到管理服务器的反馈消息,或者所述通信链接断开。
3.根据权利要求1所述的方法,其特征在于,根据目标降噪服务器的IP地址和端口信息,向所述目标降噪服务器发送采集语音信号,并将目标降噪服务器反馈的与采集语音信号匹配的降噪语音信号进行播放,包括:
当无法获取到采集语音信号时,每间隔预设第三时间阈值,根据目标降噪服务器的IP地址和端口信息,向所述目标降噪服务器发送预设保活语音信号,并将目标降噪服务器反馈的与预设保活语音信号匹配的预设降噪保活语音信号进行播放;所述预设保活语音信号包括空语音信号。
4.一种语音降噪方法,其特征在于,应用于管理服务器,包括:
建立与目标调度终端的通信链接,并接收目标调度终端通过所述通信链接发送语音降噪请求;所述语音降噪请求包括目标调度终端的部署场景;
根据目标调度终端的部署场景,确定目标调度终端匹配的目标降噪服务器;
将所述语音降噪请求发送至目标降噪服务器,并在检测到目标降噪服务器反馈的语音降噪请求确认消息时,将目标降噪服务器的IP地址和端口信息发送至目标调度终端,以通过所述目标降噪服务器对目标调度终端的采集语音信号进行语音降噪处理。
5.根据权利要求4所述的方法,其特征在于,根据目标调度终端的部署场景,确定目标调度终端匹配的目标降噪服务器,包括:
根据目标调度终端的部署场景,确定目标调度终端匹配的至少一个降噪服务器;
获取各所述降噪服务器的剩余算力,并根据各所述降噪服务器的剩余算力,在各所述降噪服务器中确定目标降噪服务器。
6.根据权利要求5所述的方法,其特征在于,根据各所述降噪服务器的剩余算力,在各所述降噪服务器中确定目标降噪服务器之后,还包括:
更新所述目标降噪服务器的剩余算力;
当确定所述目标降噪服务器的剩余算力为零时,将所述目标降噪服务器标记为不可用状态;
根据目标调度终端的部署场景,确定目标调度终端匹配的至少一个降噪服务器,包括:
根据目标调度终端的部署场景,确定目标调度终端匹配的至少一个处于可用状态的降噪服务器。
7.一种语音降噪装置,其特征在于,应用于调度终端,包括:
语音降噪请求发送模块,用于建立与管理服务器的通信链接,并通过所述通信链接向管理服务器发送语音降噪请求;所述语音降噪请求包括调度终端的部署场景;
信息接收模块,用于接收管理服务器反馈的与所述部署场景匹配的目标降噪服务器的网际协议IP地址和端口信息;其中,降噪服务器部署有智能降噪算法,智能降噪算法与部署场景一一对应;
采集语音信号发送模块,用于根据目标降噪服务器的IP地址和端口信息,向所述目标降噪服务器发送采集语音信号,并将目标降噪服务器反馈的与采集语音信号匹配的降噪语音信号进行播放。
8.一种语音降噪装置,其特征在于,应用于管理服务器,包括:
语音降噪请求接收模块,用于建立与目标调度终端的通信链接,并接收目标调度终端通过所述通信链接发送语音降噪请求;所述语音降噪请求包括目标调度终端的部署场景;
目标降噪服务器确定模块,用于根据目标调度终端的部署场景,确定目标调度终端匹配的目标降噪服务器;
信息发送模块,用于将所述语音降噪请求发送至目标降噪服务器,并在检测到目标降噪服务器反馈的语音降噪请求确认消息时,将目标降噪服务器的IP地址和端口信息发送至目标调度终端,以通过所述目标降噪服务器对目标调度终端的采集语音信号进行语音降噪处理。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-3中任一所述的,或者如权利要求4-6中任一所述的语音降噪方法。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-3中任一所述的,或者如权利要求4-6中任一所述的语音降噪方法。
CN202111085801.9A 2021-07-26 2021-09-16 语音降噪方法、装置、设备及存储介质 Pending CN113628632A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110844971 2021-07-26
CN2021108449714 2021-07-26

Publications (1)

Publication Number Publication Date
CN113628632A true CN113628632A (zh) 2021-11-09

Family

ID=78390203

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111085801.9A Pending CN113628632A (zh) 2021-07-26 2021-09-16 语音降噪方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113628632A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116994599A (zh) * 2023-09-13 2023-11-03 湖北星纪魅族科技有限公司 用于电子设备的音频降噪方法、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050065797A1 (en) * 2003-09-24 2005-03-24 International Business Machines Corporation System and method for providing global navigation information for voice portlets
US20050246174A1 (en) * 2004-04-28 2005-11-03 Degolia Richard C Method and system for presenting dynamic commercial content to clients interacting with a voice extensible markup language system
CN109151182A (zh) * 2018-07-30 2019-01-04 桂林电子科技大学 一种基于智能手机的环境音远程采集系统及方法
KR20190096305A (ko) * 2019-07-29 2019-08-19 엘지전자 주식회사 지능적 음성 인식 방법, 음성 인식 장치, 지능형 컴퓨팅 디바이스 및 서버
CN110769111A (zh) * 2019-10-28 2020-02-07 珠海格力电器股份有限公司 一种降噪方法、系统、存储介质以及终端
CN111031186A (zh) * 2019-12-03 2020-04-17 苏宁云计算有限公司 一种噪声处理方法、服务端、客户端
CN112735457A (zh) * 2020-12-11 2021-04-30 中国汽车技术研究中心有限公司 语音去噪方法和系统
CN112767936A (zh) * 2021-01-06 2021-05-07 镁佳(北京)科技有限公司 语音对话方法、装置、存储介质及电子设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050065797A1 (en) * 2003-09-24 2005-03-24 International Business Machines Corporation System and method for providing global navigation information for voice portlets
US20050246174A1 (en) * 2004-04-28 2005-11-03 Degolia Richard C Method and system for presenting dynamic commercial content to clients interacting with a voice extensible markup language system
CN109151182A (zh) * 2018-07-30 2019-01-04 桂林电子科技大学 一种基于智能手机的环境音远程采集系统及方法
KR20190096305A (ko) * 2019-07-29 2019-08-19 엘지전자 주식회사 지능적 음성 인식 방법, 음성 인식 장치, 지능형 컴퓨팅 디바이스 및 서버
CN110769111A (zh) * 2019-10-28 2020-02-07 珠海格力电器股份有限公司 一种降噪方法、系统、存储介质以及终端
CN111031186A (zh) * 2019-12-03 2020-04-17 苏宁云计算有限公司 一种噪声处理方法、服务端、客户端
CN112735457A (zh) * 2020-12-11 2021-04-30 中国汽车技术研究中心有限公司 语音去噪方法和系统
CN112767936A (zh) * 2021-01-06 2021-05-07 镁佳(北京)科技有限公司 语音对话方法、装置、存储介质及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116994599A (zh) * 2023-09-13 2023-11-03 湖北星纪魅族科技有限公司 用于电子设备的音频降噪方法、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN110417915B (zh) 一种推送消息传输方法、装置、存储介质及电子设备
CN107786621B (zh) 一种用户信息管理方法、访问处理方法及装置和系统
CN110839084B (zh) 会话管理方法、装置、设备和介质
CN110633442A (zh) 一种推送方法、装置及电子设备
CN110312046B (zh) 外呼数据优化方法、装置、计算机设备及存储介质
CN109889521B (zh) 存储器、通信通道复用实现方法、装置和设备
CN111294664A (zh) 音视频传输数据方法、电子设备及存储介质
CN106970843B (zh) 远程调用方法和装置
CN113259415B (zh) 一种网络报文处理方法、装置及网络服务器
CN111490947A (zh) 数据包发送方法、数据包接收方法、系统、设备及介质
CN108965359B (zh) 通信方法、通信装置、可读介质和电子设备
CN112152828A (zh) 一种游戏加速方法、装置、vpn终端及存储介质
CN112312061A (zh) 一种视频会议方法、装置、电子设备及存储介质
CN113628632A (zh) 语音降噪方法、装置、设备及存储介质
CN111506443A (zh) 服务调用方法、装置、设备和存储介质
CN112398845B (zh) 数据传输方法、数据传输装置、系统及电子设备
CN109413117B (zh) 分布式数据计算方法、装置、服务器及计算机存储介质
CN113423120A (zh) 基于专网终端的数据分流处理方法、装置及电子设备
CN111277599B (zh) 一种远程调用处理方法及装置
CN111464879B (zh) 一种数据通信的方法及装置
CN117354312A (zh) 访问请求处理方法、装置、系统、计算机设备和存储介质
CN111930482A (zh) 基于节点集群的任务处理方法、装置、设备及存储介质
CN111092952A (zh) 一种数据交互方法及相关产品
CN110708293A (zh) 多媒体业务的分流方法和装置
CN116821215A (zh) 基于端口查询的opc ua服务器搜索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination