CN213935642U

CN213935642U - 一种带声纹识别的语音交互式对讲系统

Info

Publication number: CN213935642U
Application number: CN202022846560.2U
Authority: CN
Inventors: 周亮; 龙程; 黄崇辉
Original assignee: Shibang Communication Co Ltd
Current assignee: Shibang Communication Co Ltd
Priority date: 2020-12-03
Filing date: 2020-12-03
Publication date: 2021-08-10
Anticipated expiration: 2030-12-03

Abstract

本实用新型公开了一种带声纹识别的语音交互式对讲系统，包括视频采集装置、智能语音对讲交互终端和服务器，其中，视频采集装置与智能语音对讲交互终端相连接，用于采集视频信号，并将采集到的视频信号发送给智能语音对讲交互终端；智能语音对讲交互终端分别与视频采集装置和服务器相连接，用于接收视频采集装置发送过来的视频信号，若识别到视频信号中存在人脸时，则进行声纹识别，判定是否有人声；如果判定有人声，则进行语音交互，并将交互的语音对讲信息发送至服务器进行处理。本实用新型可支持多人语音对讲交互和智能报警，自动化程度高；通过语音智能识别声纹并记录巡更人员信息，识别精度高、考勤记录方便。

Description

一种带声纹识别的语音交互式对讲系统

技术领域

本实用新型涉及通信技术领域，尤其公开了一种带声纹识别的语音交互式对讲系统。

背景技术

金融营业场所国标规范(GA-38/GA-745)中，客户活动区应安装对讲装置，银行营业网点内和自助银行区域都安装有IP求助对讲系统，该系统主要是通过安装在银行自助服务区内，通过网络连接到银行后台的远程联网监控中心，通过网络将前端和后台链接，该系统的主要作用是用于客户在紧急情况下可以快速求助报警的紧急报警装置。

银行自助区的IP求助对讲系统，在日常的使用过程中，因为客户的人身财产安全问题而发生紧急救助需求非常少，客户反而会有大量的业务问题通过IP对讲系统呼叫到银行的远程联网监控中心，而远程联网监控中心是安全保卫接警中心，而非业务答疑处理部门，在常规的一些问题下因为专业方向的问题，无法给客户一个满意的答复，时常会引起客户的投诉带来不好的体验。在这个背景情况下，产品设计功能应用和实际产品应用有着很大的差异，紧急求助对讲系统变成了“业务咨询”系统。

现有市场上的IP对讲求助系统，主要应用是音视频语音对讲，通过整合程控交换机可以将IP内部通信对讲系统与电话系统打通，安装在自助银行的IP对讲系统，客户可以通过IP对讲终端呼叫到银行客服中心，进行业务咨询，但是此种方式存在客服电话占线无法接通，设备掉线无法呼叫等问题。另外，银行保卫巡检人员巡更打卡时，无法通过IP对讲系统记录人员信息和巡更时间，需要通过按下对讲终端呼叫到后台，由后台工作人员手动记录巡更人员信息和巡更时间。

因此，目前市面上安装于银行的IP网络对讲终端都是通过主机与分机的形式，无法同时发起对讲求助，是一件亟待解决的技术问题。

实用新型内容

本实用新型提供了一种带声纹识别的语音交互式对讲系统旨在解决现有IP网络对讲终端中存在的一个网点多个人无法同时发起对讲求助的技术问题。

本实用新型提供一种带声纹识别的语音交互式对讲系统，包括视频采集装置、智能语音对讲交互终端和服务器，其中，

视频采集装置与智能语音对讲交互终端相连接，用于采集视频信号，并将采集到的视频信号发送给智能语音对讲交互终端；

智能语音对讲交互终端分别与视频采集装置和服务器相连接，用于接收视频采集装置发送过来的视频信号，若识别到视频信号中存在人脸时，则进行声纹识别，判定是否有人声；如果判定有人声，则进行语音交互，并将交互的语音对讲信息发送至服务器进行处理。

进一步地，智能语音对讲交互终端包括拾音模块、音视频解码模块、声纹识别模块、考勤模块和巡更模块，

拾音模块，用于采集音频信息；

音视频解码模块与拾音模块相连接，用于对拾音模块采集的音频信息进行处理；

声纹识别模块分别与音视频解码模块、考勤模块和巡更模块相连接，用于分析音视频解码模块处理后的音频信息，判断该音频信息是否存在人声信号，若是则触发巡更模块接收语音对讲信息，并通知考勤模块记录考勤信息。

进一步地，智能语音对讲交互终端还包括语音交互模块和IP对讲模块，

语音交互模块分别与声纹识别模块和IP对讲模块相连接，用于接收声纹识别模块发送过来的人声信号，若识别到接收的人声信号和采集的人脸信号均符合预设的信号阈值后，则触发IP对讲模块，完成语音交互工作。

进一步地，智能语音对讲交互终端还包括报警模块和关键词存储模块，

报警模块分别与关键词存储模块和声纹识别模块相连接，用于接收声纹识别模块发送过来的人声信号，若识别到人声信号中包含有预设在关键词存储模块中的关键词时，则触发报警。

进一步地，拾音模块包括麦克风。

进一步地，麦克风包括电动式麦克风、电容式麦克风、压电式麦克风中的任意一种。

进一步地，视频采集装置包括摄像头。

进一步地，摄像头包括全景摄像头和普通摄像头中的任意一种。

进一步地，声纹识别模块采用SpeakIn公司生产的声纹识别模组。

进一步地，报警模块的型号为YF02。

本实用新型所取得的有益效果为：

本实用新型提供的带声纹识别的语音交互式对讲系统，采用视频采集装置、智能语音对讲交互终端和服务器，通过视频采集装置采集视频信号，智能语音对讲交互终端接收视频采集装置发送过来的视频信号，若识别到视频信号中存在人脸时，则进行声纹识别，判定是否有人声；如果判定有人声，则进行语音交互，并将交互的语音对讲信息发送至服务器进行处理。本实用新型提供的带声纹识别的语音交互式对讲系统，所取得的有益效果具体如下所示：

1、IP终端24小时拾取环境声音，当识别到人声之后进行语音分析，分析完语音内容之后即自动进行匹配并触发对应的功能。

2、本地语音交互：根据屏幕提示的内容，识别说话人的声音，当检测到类似的词语时，即可触发本地语音交互。

3、IP对讲/报警：24小时检测环境语音，当检测到相关语句，例如对讲或报警词语时，系统即可自动发起IP对讲呼叫或向后台服务发起报警信息。

4、声纹识别：24小时检测环境语音，巡检人员根据屏幕提示，说出对应的话，即可完成声纹匹配，并自动保存识别记录，陌生人声音不会识别保存。

5、业务统计：根据识别到的类型，逐个标记分类，并输出效能统计。

附图说明

图1为本实用新型提供的带声纹识别的语音交互式对讲系统一实施例的功能框图；

图2为图1中所示的智能语音对讲交互终端第一实施例的功能模块示意图；

图3为图1中所示的智能语音对讲交互终端第二实施例的功能模块示意图；

图4为图1中所示的智能语音对讲交互终端第三实施例的功能模块示意图。

附图标号说明：

10、视频采集装置；20、智能语音对讲交互终端；30、服务器；21、拾音模块；22、音视频解码模块；23、声纹识别模块；24、考勤模块；25、巡更模块；26、语音交互模块；27、IP对讲模块；28、报警模块；29、关键词存储模块。

具体实施方式

为了更好的理解上述技术方案，下面将结合说明书附图以及具体的实施方式对上述技术方案做详细的说明。

如图1所示，本实用新型第一实施例提出一种带声纹识别的语音交互式对讲系统，包括视频采集装置10、智能语音对讲交互终端20和服务器30，视频采集装置10与智能语音对讲交互终端20相连接，用于采集视频信号，并将采集到的视频信号发送给智能语音对讲交互终端20；智能语音对讲交互终端20分别与视频采集装置10和服务器30相连接，用于接收视频采集装置10发送过来的视频信号，若识别到视频信号中存在人脸时，则进行声纹识别，判定是否有人声；如果判定有人声，则进行语音交互，并将交互的语音对讲信息发送至服务器30进行处理。例如，由服务器30将语音对讲信息进行存储和分析等操作。其中，视频采集装置10包括摄像头。摄像头包括全景摄像头和普通摄像头中的任意一种。在本实施例中，通过智能语音对讲交互终端20自动感应人员的方式激活语音交互，并在液晶屏幕上显示常见问题和解决办法。当客户遇到业务问题时，可以通过终端上液晶屏的提示说出自己需要的问题，终端识别到之后即可自助回复。

在上述结构中，请见图2，图2为图1中所示的智能语音对讲交互终端第一实施例的功能模块示意图，智能语音对讲交互终端20包括拾音模块21、音视频解码模块22、声纹识别模块23、考勤模块24和巡更模块25，拾音模块21，用于采集音频信息；音视频解码模块22与拾音模块21相连接，用于对拾音模块21采集的音频信息进行处理；声纹识别模块23分别与音视频解码模块22、考勤模块24和巡更模块25相连接，用于分析音视频解码模块22处理后的音频信息，判断该音频信息是否存在人声信号，若是则触发巡更模块25接收语音对讲信息，并通知考勤模块24记录考勤信息。其中，拾音模块21包括麦克风。麦克风包括电动式麦克风、电容式麦克风、压电式麦克风中的任意一种。声纹识别模块23采用SpeakIn公司生产的声纹识别模组。在本实施例中，将声纹识别模块23内置智能语音对讲交互终端20中，可记录海量声纹数据，通过存储工作人员的声纹信息，识别不同人员的身份，解决银行巡更人员打卡问题。

优选地，参见图3，图3为图1中所示的智能语音对讲交互终端第二实施例的功能模块示意图，第一实施例的基础上，智能语音对讲交互终端20还包括语音交互模块26和IP对讲模块27，语音交互模块26分别与声纹识别模块23和IP对讲模块27相连接，用于接收声纹识别模块23发送过来的人声信号，若识别到接收的人声信号和采集的人脸信号均符合预设的信号阈值后，则触发IP对讲模块27，完成语音交互工作。本实施例提供的带声纹识别的语音交互式对讲系统，24小时检测环境语音，当检测到相关语句，例如对讲或报警词语时，系统即可自动发起IP对讲呼叫。当有些业务需求无法通过语音交互完成时，IP对讲模块27可以向中心值班室或其他目标发起对讲，进入人工模式。触发IP对讲模块27支持多路同时对讲。

进一步地，请见图4，图4为图1中所示的智能语音对讲交互终端第三实施例的功能模块示意图，在第一实施例的基础上，智能语音对讲交互终端20还包括报警模块28和关键词存储模块29，报警模块28分别与关键词存储模块29和声纹识别模块23相连接，用于接收声纹识别模块23发送过来的人声信号，若识别到人声信号中包含有预设在关键词存储模块29中的关键词时，则触发报警。其中，报警模块28的型号为YF02。在本实施例中，关键词存储模块29可预先内置一定数量的关键词，当被识别后报警模块28会自动触发报警，无需人工报警。

本实施例提供的带声纹识别的语音交互式对讲系统，与现有技术相比，采用视频采集装置、智能语音对讲交互终端和服务器，通过视频采集装置采集视频信号，智能语音对讲交互终端接收视频采集装置发送过来的视频信号，若识别到视频信号中存在人脸时，则进行声纹识别，判定是否有人声；如果判定有人声，则进行语音交互，并将交互的语音对讲信息发送至服务器进行处理。本实施例提供的带声纹识别的语音交互式对讲系统，所取得的有益效果具体如下所示：

尽管已描述了本实用新型的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本实用新型范围的所有变更和修改。显然，本领域的技术人员可以对本实用新型进行各种改动和变型而不脱离本实用新型的精神和范围。这样，倘若本实用新型的这些修改和变型属于本实用新型权利要求及其等同技术的范围之内，则本实用新型也意图包含这些改动和变型在内。

Claims

1.一种带声纹识别的语音交互式对讲系统，其特征在于，包括视频采集装置(10)、智能语音对讲交互终端(20)和服务器(30)，其中，

所述视频采集装置(10)与所述智能语音对讲交互终端(20)相连接，用于采集视频信号，并将采集到的视频信号发送给所述智能语音对讲交互终端(20)；

所述智能语音对讲交互终端(20)分别与所述视频采集装置(10)和所述服务器(30)相连接，用于接收所述视频采集装置(10)发送过来的视频信号，若识别到所述视频信号中存在人脸时，则进行声纹识别，判定是否有人声；如果判定有人声，则进行语音交互，并将交互的语音对讲信息发送至所述服务器(30)进行处理。

2.如权利要求1所述的带声纹识别的语音交互式对讲系统，其特征在于，

所述智能语音对讲交互终端(20)包括拾音模块(21)、音视频解码模块(22)、声纹识别模块(23)、考勤模块(24)和巡更模块(25)，

所述拾音模块(21)，用于采集音频信息；

所述音视频解码模块(22)与所述拾音模块(21)相连接，用于对所述拾音模块(21)采集的音频信息进行处理；

所述声纹识别模块(23)分别与所述音视频解码模块(22)、所述考勤模块(24)和所述巡更模块(25)相连接，用于分析所述音视频解码模块(22)处理后的音频信息，判断该音频信息是否存在人声信号，若是则触发所述巡更模块(25)接收语音对讲信息，并通知所述考勤模块(24)记录考勤信息。

3.如权利要求2所述的带声纹识别的语音交互式对讲系统，其特征在于，

所述智能语音对讲交互终端(20)还包括语音交互模块(26)和IP对讲模块(27)，

所述语音交互模块(26)分别与所述声纹识别模块(23)和所述IP对讲模块(27)相连接，用于接收所述声纹识别模块(23)发送过来的人声信号，若识别到接收的人声信号和采集的人脸信号均符合预设的信号阈值后，则触发所述IP对讲模块(27)，完成语音交互工作。

4.如权利要求3所述的带声纹识别的语音交互式对讲系统，其特征在于，

所述智能语音对讲交互终端(20)还包括报警模块(28)和关键词存储模块(29)，

所述报警模块(28)分别与所述关键词存储模块(29)和所述声纹识别模块(23)相连接，用于接收所述声纹识别模块(23)发送过来的人声信号，若识别到人声信号中包含有预设在所述关键词存储模块(29)中的关键词时，则触发报警。

5.如权利要求4所述的带声纹识别的语音交互式对讲系统，其特征在于，

所述拾音模块(21)包括麦克风。

6.如权利要求5所述的带声纹识别的语音交互式对讲系统，其特征在于，

所述麦克风包括电动式麦克风、电容式麦克风、压电式麦克风中的任意一种。

7.如权利要求4所述的带声纹识别的语音交互式对讲系统，其特征在于，

所述视频采集装置(10)包括摄像头。

8.如权利要求7所述的带声纹识别的语音交互式对讲系统，其特征在于，

所述摄像头包括全景摄像头和普通摄像头中的任意一种。

9.如权利要求4所述的带声纹识别的语音交互式对讲系统，其特征在于，

所述声纹识别模块(23)采用SpeakIn公司生产的声纹识别模组。

10.如权利要求4所述的带声纹识别的语音交互式对讲系统，其特征在于，

所述报警模块(28)的型号为YF02。