CN212649640U

CN212649640U - 一种基于ai音频存储阵列的智能交互服务系统

Info

Publication number: CN212649640U
Application number: CN202022045840.3U
Authority: CN
Inventors: 周亮; 童勇; 罗小平; 黄崇辉
Original assignee: Changsha Spon Communication Technology Co ltd
Current assignee: Shibang Communication Co., Ltd
Priority date: 2020-09-17
Filing date: 2020-09-17
Publication date: 2021-03-02
Anticipated expiration: 2030-09-17

Abstract

本实用新型公开了一种基于AI音频存储阵列的智能交互服务系统，包括智能交互主机、AI语音存储阵列和IP对讲服务器，其中，AI语音存储阵列与IP对讲服务器相连接，用于转发IP对讲服务器传送过来的音频文件，同时将转发的音频文件的内容自动转写成文字信息进行存储；智能交互主机与AI语音存储阵列相连接，用于按关键词对AI语音存储阵列中存储的音频文件进行检索，调取包含关键字的音频文件，并将检索结果以列表形式进行实时显示或声文同步回放。本实用新型提供的基于AI音频存储阵列的智能交互服务系统，由原来的分布式布置服务器存储转变为集中式存储，降低内通对讲服务器配置要求，降低成本；提高IP内通对讲系统使用效能。

Description

一种基于AI音频存储阵列的智能交互服务系统

技术领域

本实用新型涉及通信技术领域，尤其公开了一种基于AI音频存储阵列的智能交互服务系统。

背景技术

IP内部通信系统是基于互联网连接而构建的通信系统，在此技术条件下，设备分散于各个角落运行，在一些大型企业里，分支架构遍布全国各地，内通系统的建设也会根据地域的不同，而分别建立服务器，各个地域服务器之间通过网络进行互联互通，各个内通服务器下发生的音频数据一般都是保存在各自的服务器里。在这种使用条件的背景下，录音数据存储分散无法集中存储，保存时间受服务器空间限制等问题。系统的布置特点决定了现有的IP内通系统所有的录音存储都是只能用作事后还原的一种手段，无法通过对讲系统内的音频文件做到相关的数据分析，例如金融行业客户通过对讲系统反馈最多的诉求是什么都无法分析。

现有市场上的IP对讲系统都是多功能集一身，包含IP对讲、IP广播、IP语音会议等，因为业务的需要系统内的终端对讲和语音会议还会有跨地域的通话，市场上该系统的音频数据存储都是通过软件在PC端，或者第三方存储介质存储语音数据。在大量的数据里，后期的音频内容查找和溯源就非常的困难，需要知道事件时间，设备唯一ID标识等信息后，在由人工一条一条的听来确定音频内容，无法快速的找到自己需要的录音数据。

因此，现有IP对讲系统中后期音频内容查找和溯源困难，是一件亟待解决的技术问题。

实用新型内容

本实用新型提供了一种基于AI音频存储阵列的智能交互服务系统，旨在解决现有IP对讲系统中后期音频内容查找和溯源困难的技术问题。

本实用新型提供一种基于AI音频存储阵列的智能交互服务系统，包括智能交互主机、AI语音存储阵列和IP对讲服务器，其中，

AI语音存储阵列与IP对讲服务器相连接，用于转发IP对讲服务器传送过来的音频文件，同时将转发的音频文件的内容自动转写成文字信息进行存储；

智能交互主机与AI语音存储阵列相连接，用于按关键词对AI语音存储阵列中存储的音频文件进行检索，调取包含关键字的音频文件，并将检索结果以列表形式进行实时显示或声文同步回放。

进一步地，AI语音存储阵列包括网络交换机模块、数据采集模块、语音转写模块和存储模块，

网络交换机模块连接多个IP对讲服务器，用于负责数据传输，转发IP对讲服务器传送过来的音频文件；

数据采集模块，用于采集网络交换机模块转发的音频文件，并读取音频文件中携带的IP对讲服务器的名称和IP地址信息；

语音转写模块与数据采集模块相连接，用于将数据采集模块采集的音频文件中的内容转写成文字；

存储模块与语音转写模块相连接，用于存储语音转写模块转写的文字信息、数据采集模块采集的音频文件、以及数据采集模块读取的IP对讲服务器的名称和IP地址信息。

进一步地，网络交换机模块包括网络交换芯片，网络交换芯片的型号为IP1826C。

进一步地，数据采集模块包括数据采集芯片，数据采集芯片的型号为R-8017DAQ。

进一步地，语音转写模块包括语音转写芯片，语音转写芯片的型号为WTK6900。

进一步地，存储模块包括存储芯片，存储芯片的型号为FM25CL64。

进一步地，智能交互主机包括音频采集模块、配置模块、关键字识别模块、缓存模块和声文同步显示模块，

音频采集模块，用于采集语音信号，并将采集的语音信号转化为文本信息；

配置模块，用于预先配置关键字；

关键字识别模块，分别与音频采集模块和配置模块相连接，用于识别文本信息中相应的关键字并标记音频文件和文本文件；

缓存模块，用于存储做了标记的音频文件和文本文件；

声文同步显示模块，用于回放音频文件并同步显示音频文件的内容。

进一步地，音频采集模块包括音频采集芯片，音频采集芯片型号为SV-2602。

进一步地，关键字识别模块包括语音识别芯片，语音识别芯片的型号为LD3320。

进一步地，缓存模块包括SRAM缓存芯片，SRAM缓存芯片的型号为IS61LV51216。

本实用新型所取得的有益效果为：

本实用新型提供的基于AI音频存储阵列的智能交互服务系统，采用智能交互主机、AI语音存储阵列和IP对讲服务器，AI语音存储阵列转IP对讲服务器传送过来的音频文件，同时将转发的音频文件的内容自动转写成文字信息进行存储；智能交互主机按关键词对AI语音存储阵列中存储的音频文件进行检索，调取包含关键字的音频文件，并将检索结果以列表形式进行实时显示或声文同步回放。本实用新型提供的基于AI音频存储阵列的智能交互服务系统，由原来的分布式布置服务器存储转变为集中式存储，降低内通对讲服务器配置要求，降低成本；提高IP内通对讲系统使用效能。

附图说明

图1为本实用新型提供的基于AI音频存储阵列的智能交互服务系统一实施例的功能框图；

图2为图1中所示的AI语音存储阵列一实施例的功能模块示意图；

图3为图1中所示的智能交互主机一实施例的功能模块示意图。

附图标号说明：

10、智能交互主机；20、AI语音存储阵列；30、IP对讲服务器；21、网络交换机模块；22、数据采集模块；23、语音转写模块；24、存储模块；11、音频采集模块；12、配置模块；13、关键字识别模块；14、缓存模块；15、声文同步显示模块。

具体实施方式

为了更好的理解上述技术方案，下面将结合说明书附图以及具体的实施方式对上述技术方案做详细的说明。

如图1所示，本实用新型一实施例提出一种基于AI音频存储阵列的智能交互服务系统，包括智能交互主机10、AI语音存储阵列20和IP对讲服务器30，其中，AI语音存储阵列20与IP对讲服务器30相连接，用于转发IP对讲服务器30传送过来的音频文件，同时将转发的音频文件的内容自动转写成文字信息进行存储；智能交互主机10与AI语音存储阵列20相连接，用于按关键词对AI语音存储阵列20中存储的音频文件进行检索，调取包含关键字的音频文件，并将检索结果以列表形式进行实时显示或声文同步回放。在本实施例中，一个IP对讲服务器30可接入多个IP对讲设备并存储所有接入设备的通话音频文件。IP对讲服务器30通过网线和AI语音存储阵列20相连接，一个AI语音存储阵列20可连接多个IP对讲服务器，可集中存储所有接入IP对讲服务器的音频文件，同时可将音频文件的内容自动转写成文字信息并存储。智能交互主机10和AI语音存储阵列20通过网线相连接。智能交互主机10可按关键词对AI语音存储阵列20中音频文件进行检索，调取所有包含关键字的音频文件，所有检索结果以列表显示出来，并支持声文同步回放。

本实施例提供的基于AI音频存储阵列的智能交互服务系统，采用智能交互主机、AI语音存储阵列和IP对讲服务器，AI语音存储阵列转IP对讲服务器传送过来的音频文件，同时将转发的音频文件的内容自动转写成文字信息进行存储；智能交互主机按关键词对AI语音存储阵列中存储的音频文件进行检索，调取包含关键字的音频文件，并将检索结果以列表形式进行实时显示或声文同步回放。本实施例提供的基于AI音频存储阵列的智能交互服务系统，由原来的分布式布置服务器存储转变为集中式存储，降低内通对讲服务器配置要求，降低成本；提高IP内通对讲系统使用效能。

在上述结构中，请见图2，图2为图1中所示的AI语音存储阵列一实施例的功能模块示意图，在本实施例中，AI语音存储阵列20包括网络交换机模块21、数据采集模块22、语音转写模块23和存储模块24，其中，网络交换机模块21连接多个IP对讲服务器30，用于负责数据传输，转发IP对讲服务器30传送过来的音频文件；数据采集模块22，用于采集网络交换机模块21转发的音频文件，并读取音频文件中携带的IP对讲服务器30的名称和IP地址信息；语音转写模块23与数据采集模块22相连接，用于将数据采集模块22采集的音频文件中的内容转写成文字；存储模块24与语音转写模块23相连接，用于存储语音转写模块23转写的文字信息、数据采集模块22采集的音频文件、以及数据采集模块22读取的IP对讲服务器30的名称和IP地址信息。在本实施例中，网络交换机模块21包括网络交换芯片，网络交换芯片的型号采用IP1826C。数据采集模块22包括数据采集芯片，数据采集芯片的型号采用R-8017DAQ。语音转写模块23包括语音转写芯片，语音转写芯片的型号采用WTK6900。存储模块24包括存储芯片，存储芯片的型号采用FM25CL64。数据采集模块22和网络交换机模块21相连接，在采集IP对讲服务器30音频文件的同时也将IP对讲服务器30的IP地址信息也一并读取，采集后的音频文件经过语音转写模块23将音频文件的中内容转写文字，文字信息和音频文件连同IP对讲服务器30的名称和IP地址信息一并存入存储模块24中。网络交换机模块21连接多个IP对讲服务器30，负责数据传输。存储模块中按IP对讲服务器已经划分了多个区域，存入的文件按以下格式命名：

服务器名称和IP地址信息+设备名称和IP地址信息+任务类型+录音开始时间+音频文件+文字信息

按上述命名方式存储音频文件可供智能交互主机10按需求调取音频文件。音频文件生成的文件与源音频文件路径一致，方便查找。

优选地，参见图3，图3为图1中所示的智能交互主机一实施例的功能模块示意图，在本实施例中，智能交互主机10包括音频采集模块11、配置模块12、关键字识别模块13、缓存模块14和声文同步显示模块15，其中，音频采集模块11，用于采集语音信号，并将采集的语音信号转化为文本信息；配置模块12，用于预先配置关键字；关键字识别模块13分别与音频采集模块11和配置模块12相连接，用于识别文本信息中相应的关键字并标记音频文件和文本文件；缓存模块14与关键字识别模块13相连接，用于存储做了标记的音频文件和文本文件；声文同步显示模块15与缓存模块14相连接，用于回放音频文件并同步显示音频文件的内容。在本实施例中，音频采集模块11包括音频采集芯片，音频采集芯片型号采用SV-2602。关键字识别模块13包括语音识别芯片，语音识别芯片的型号采用LD3320。缓存模块14包括SRAM缓存芯片，SRAM缓存芯片的型号采用IS61LV51216。配置模块12可预先配置适量的关键字(或关键词)，管理人员通过智能交互主机10说出目标关键字(或关键词)，音频采集模块11采集人的语音后，由关键字识别模块13识别文本信息中相应匹配的关键字并标记音频文件和文本文件，AI语音存储阵列20中凡是做了标记的音频文件和文本文件都存入缓存模块14，待检索完成后所有符合要求的目标文件均显示在智能交互主机10上，管理人员可以通过声文同步显示模块15回放音频文件并同步显示音频文件的内容。IP对讲服务器30管理各自服务器下的对讲终端并存储通话音频数据，同时可通过网络交换机模块21并将存储的音频数据转发到AI语音存储阵列20。本实施例提供的基于AI音频存储阵列的智能交互服务系统，可解决分布式对讲系统下录音音频集中存储问题，同时不影响各自服务器下对讲终端本身的录音存储功能。

如图1至图3所示，本实施例提供的基于AI音频存储阵列的智能交互服务系统，可实现的功能如下所示：

一、集中存储：解决IP内通对讲系统音频数据集中存储，支持多个内通服务器将录音数据发送到AI音频分析存储阵列进行音频集中存储，AI语音分析存储阵列可区分显示来自各个服务器下的录音数据，方便数据管理，同时又不影响各自服务器本身的数据存储功能。

二、业务分类：将系统内所有不同类型任务的录音音频文件进行标记，如IP对讲录音、IP广播录音、IP语音会议录音和IP监听录音全部进行标记并做分类存储。

三、语音转写文本：可通过内置的语音识别AI模块，支持录音文件进行文本转写和实时语音转写，转写成文字后的文本内容与源音频文件保存在同一路径下，方便文本内容与音频内容的校对。

四、内容搜索：在大量的录音数据库里，可以根据用户要查找的内容，输入关键字，进行全局文本内容的搜索。并结合自己需要查找的内容选择自己需要的录音文件和转写的文本。

五、关键词标记；可通过内置的语音识别AI模块，将内通系统内的对讲，语音会议等实时数据进行文本转写，同时用户可根据自身的需求，可标记双方或多方通话的过程中出现的敏感词和关键词，进行标记提醒。

六、数据分析：根据业务需要，筛选系统内所有的存储文件进行分类，可用于系统业务数据统计。

尽管已描述了本实用新型的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本实用新型范围的所有变更和修改。显然，本领域的技术人员可以对本实用新型进行各种改动和变型而不脱离本实用新型的精神和范围。这样，倘若本实用新型的这些修改和变型属于本实用新型权利要求及其等同技术的范围之内，则本实用新型也意图包含这些改动和变型在内。

Claims

1.一种基于AI音频存储阵列的智能交互服务系统，其特征在于，包括智能交互主机(10)、AI语音存储阵列(20)和IP对讲服务器(30)，其中，

所述AI语音存储阵列(20)与所述IP对讲服务器(30)相连接，用于转发所述IP对讲服务器(30)传送过来的音频文件，同时将转发的音频文件的内容自动转写成文字信息进行存储；

智能交互主机(10)与所述AI语音存储阵列(20)相连接，用于按关键词对所述AI语音存储阵列(20)中存储的音频文件进行检索，调取包含关键字的音频文件，并将检索结果以列表形式进行实时显示或声文同步回放。

2.如权利要求1所述的基于AI音频存储阵列的智能交互服务系统，其特征在于，

所述AI语音存储阵列(20)包括网络交换机模块(21)、数据采集模块(22)、语音转写模块(23)和存储模块(24)，

所述网络交换机模块(21)连接多个所述IP对讲服务器(30)，用于负责数据传输，转发所述IP对讲服务器(30)传送过来的音频文件；

所述数据采集模块(22)，用于采集所述网络交换机模块(21)转发的音频文件，并读取音频文件中携带的所述IP对讲服务器(30)的名称和IP地址信息；

所述语音转写模块(23)与所述数据采集模块(22)相连接，用于将所述数据采集模块(22)采集的音频文件中的内容转写成文字；

所述存储模块(24)与所述语音转写模块(23)相连接，用于存储所述语音转写模块(23)转写的文字信息、所述数据采集模块(22)采集的音频文件、以及所述数据采集模块(22)读取的所述IP对讲服务器(30)的名称和IP地址信息。

3.如权利要求2所述的基于AI音频存储阵列的智能交互服务系统，其特征在于，

所述网络交换机模块(21)包括网络交换芯片，所述网络交换芯片的型号为IP1826C。

4.如权利要求2所述的基于AI音频存储阵列的智能交互服务系统，其特征在于，

所述数据采集模块(22)包括数据采集芯片，所述数据采集芯片的型号为R-8017DAQ。

5.如权利要求2所述的基于AI音频存储阵列的智能交互服务系统，其特征在于，

所述语音转写模块(23)包括语音转写芯片，所述语音转写芯片的型号为WTK6900。

6.如权利要求2所述的基于AI音频存储阵列的智能交互服务系统，其特征在于，

所述存储模块(24)包括存储芯片，所述存储芯片的型号为FM25CL64。

7.如权利要求1所述的基于AI音频存储阵列的智能交互服务系统，其特征在于，

所述智能交互主机(10)包括音频采集模块(11)、配置模块(12)、关键字识别模块(13)、缓存模块(14)和声文同步显示模块(15)，

所述音频采集模块(11)，用于采集语音信号，并将采集的语音信号转化为文本信息；

所述配置模块(12)，用于预先配置关键字；

所述关键字识别模块(13)分别与所述音频采集模块(11)和所述配置模块(12)相连接，用于识别所述文本信息中相应的关键字并标记音频文件和文本文件；

所述缓存模块(14)与所述关键字识别模块(13)相连接，用于存储做了标记的音频文件和文本文件；

所述声文同步显示模块(15)与所述缓存模块(14)相连接，用于回放音频文件并同步显示音频文件的内容。

8.如权利要求7所述的基于AI音频存储阵列的智能交互服务系统，其特征在于，

所述音频采集模块(11)包括音频采集芯片，所述音频采集芯片型号为SV-2602。

9.如权利要求7所述的基于AI音频存储阵列的智能交互服务系统，其特征在于，

所述关键字识别模块(13)包括语音识别芯片，所述语音识别芯片的型号为LD3320。

10.如权利要求7所述的基于AI音频存储阵列的智能交互服务系统，其特征在于，

所述缓存模块(14)包括SRAM缓存芯片，所述SRAM缓存芯片的型号为IS61LV51216。