CN105303794A

CN105303794A - 一种可通过声纹识别进行报警综合处置管理系统

Info

Publication number: CN105303794A
Application number: CN201510859779.7A
Authority: CN
Inventors: 阚涛
Original assignee: XUNMEI ELECTRONICS TECHNOLOGY Co Ltd
Current assignee: XUNMEI ELECTRONICS TECHNOLOGY Co Ltd
Priority date: 2015-11-30
Filing date: 2015-11-30
Publication date: 2016-02-03

Abstract

本发明公开一种可通过声纹识别进行报警综合处置管理系统，该系统包括：词典场景语音模块，适于对用户词汇表中的词典、场景语音依次进行采集，并将采集的特征矢量作为模版进行保存；相似度比较模块，适于将输入语音信号的特征矢量依次与词典场景语音模块中保存的每个特征矢量模版进行相似度比较，将相似度最高者作为语音识别结果输出；语音识别引擎模块，适于根据语音识别结果寻找一个词模型序列以描述语音输入信号，从而得到词解码序列，并根据转换后的词解码序列在报警管理数据库中搜索到各个子系统的目标信息。本发明能快速找到各个子系统中的目标信息如视频、报警地点等进行描述、辨认、检索和快速执行，从而能将各个子系统有机整合在一起。

Description

一种可通过声纹识别进行报警综合处置管理系统

技术领域

本发明属于报警综合处置管理领域，具体涉及一种可通过声纹识别进行报警综合处置管理系统。

背景技术

报警系统包括防盗报警系统和智能安防报警系统等多种类型；具体地，所述防盗报警系统的设备一般包括前端探测器和报警控制器，其中，报警控制器是一台主机如电脑的主机一样，用来控制包括有线/无线信号的处理，系统本身故障的检测，电源部分，信号输入，信号输出，内置拨号器等这几个方面，一个防盗报警系统中报警控制器是必不可少的。前端探测器包括有门磁开关、玻璃破碎探测器、红外探测器、红外/微波双鉴器和紧急呼救按钮。

所述智能安防报警系统是同家庭的各种传感器、功能键、探测器和执行器共同构成家庭的安防体系，是家庭安防体系的"大脑"。报警功能包括防火、防盗、煤气泄露报警及紧急求助等功能，报警系统采用先进智能型控制网络技术，由微机管理控制，实现对匪情、盗窃、火灾、煤气、紧急求助等意外事故的自动报警。

但是，本发明的发明人经过研究发现，在现有的各种报警系统中，存储的与报警相关的报警数量较多，当收到报警提示信息时，需要通过手工查看视频录像等来了解案件原由，即需要人工手动操作来处置报警，因而效率低下；同时，报警系统中的各个子系统如视频、地图、处置预案、附近工作人员及现场防护设备等各自运行，不能快速将各个子系统快速响应整合在一起，容易导致延误处置。

发明内容

针对现有技术存在的技术问题，本发明提供一种可通过声纹识别进行报警综合处置管理系统，该系统能快速找到视频、报警地点等进行描述、辨认、检索和快速执行，从而能将各个子系统有机整合在一起。

为了实现上述目的，本发明采用如下技术方案：

一种可通过声纹识别进行报警综合处置管理系统，该系统包括：

词典场景语音模块，适于对用户词汇表中的词典、场景语音依次进行采集，并将采集的特征矢量作为模版进行保存；

相似度比较模块，适于将输入语音信号的特征矢量依次与所述词典场景语音模块中保存的每个特征矢量模版进行相似度比较，将相似度最高者作为语音识别结果输出；

语音识别引擎模块，适于根据所述语音识别结果寻找一个词模型序列以描述语音输入信号，从而得到词解码序列，并根据转换后的词解码序列在报警管理数据库中搜索到各个子系统中的目标信息。

本发明提供的可通过声纹识别进行报警综合处置管理系统，通过相似度比较，在模版数据库中找出与输入人体语音波纹信号相似度最高的语音识别结果即相应的文本，并根据语音识别结果即相应的文本获得词解码序列，即将相应的文本转换成机器执行代码或命令进行执行查找，代替传统的通过人工手动操作来进行检索查找，因而能快速找到各个子系统中的目标信息如目标视频、录像视频、报警地点等，工作效率高，智能化程度高，定位速度快，所以能更快满足用户对各个子系统中的目标信息如目标视频、录像视频、报警地点等进行描述、辨认、检索、快速执行如拖拉播放的需要，从而能够将各个子系统中的多个信息整合在一起进行整合分析。

进一步，所述词典场景语音模块中的模版包括监控系统术语模版和人体语音加词典模版。

进一步，所述语音识别引擎模块中搜索所依据的是对公式中的声学模型打分和语言模型打分。

附图说明

图1是本发明提供的可通过声纹识别进行报警综合处置管理系统原理示意图。

图中，1、词典场景语音模块；2、相似度比较模块；3、语音识别引擎模块。

具体实施方式

为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，下面结合具体图示，进一步阐述本发明。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

请参考图1所示，本发明公开一种可通过声纹识别进行报警综合处置管理系统，该系统包括：

词典场景语音模块1，适于对用户词汇表中的词典、场景语音依次进行采集，并将采集的特征矢量作为模版进行保存；

相似度比较模块2，适于将输入语音信号的特征矢量依次与所述词典场景语音模块中保存的每个特征矢量模版进行相似度比较，将相似度最高者作为语音识别结果输出；

语音识别引擎模块3，适于根据所述语音识别结果寻找一个词模型序列以描述语音输入信号，从而得到词解码序列，并根据转换后的词解码序列在报警管理数据库中搜索到各个子系统中的目标信息。

作为具体实施例，所述词典场景语音模块1中的模版包括监控系统术语模版和人体语音加词典模版，所述监控系统术语模版中包括例如网络摄像机(IPC)、网络硬盘录像机(NVR)、出入口控制管理系统等术语；所述人体语音加词典模版中包括例如＂XX支行XX网点加钞间视频＂等人体语音，即将语音智能识别分成两种识别库进行综合分析并转换成系统可执行语言，由此可以提高语音识别的全面性和准确性。

作为具体实施例，所述相似度比较模块2适于将输入语音信号的特征矢量依次与所述词典场景语音模块中保存的每个特征矢量模版进行相似度比较，将相似度最高者作为语音识别结果输出；即所述相似度比较模块2处于识别学习阶段，对输入的人体语音波纹信号进行语言综合分析和语音库比对综合分析，得到与输入人体语音波纹信号相似度最高的相应文本。

作为具体实施例，所述语音识别引擎模块3中预设有词模型序列，当得到相似度最高的语音识别结果后，可根据该相似度最高的语音识别结果在所述语音识别引擎模块3中进行寻找，以找到一个能够准确描述语音输入信号的词模型序列，并将该词模型序列作为所述语音输入信号的词解码序列，并根据转换后的词解码序列在报警管理数据库中搜索到各个子系统的目标信息如目标视频、录像视频、报警地点等。其中，通过语音识别引擎模块3搜索所依据的是对公式中的声学模型打分和语言模型打分，具体为：1、声韵调是适合汉语的音位系统；2、声学模型所运用的语音特征要首先区分发音方法进而区分发音部位；3、在音节层面上就要利用语言模型。其主要是利用市面上成熟的语音识别引擎模块进行检索，通过所述语音识别引擎模块，可以将得到的相应文本转换成机器执行代码或命令进行执行查找，代替了传统的通过人工手动操作来进行检索查找等操作，因而能够快速查找和调用报警管理系统中的各个子系统如视频、地图、处置预案、附近工作人员以及现场防护设备等，能够快速将各个子系统快速响应整合在一起，工作效率高，智能化程度高。

以上仅为本发明的实施方式，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构，直接或间接运用在其他相关的技术领域，均同理在本发明的专利保护范围之内。

Claims

1.一种可通过声纹识别进行报警综合处置管理系统，其特征在于，该系统包括：

2.根据权利要求1所述的可通过声纹识别进行报警综合处置管理系统，其特征在于，所述词典场景语音模块中的模版包括监控系统术语模版和人体语音加词典模版。

3.根据权利要求1所述的可通过声纹识别进行报警综合处置管理系统，其特征在于，所述语音识别引擎模块中搜索所依据的是对公式中的声学模型打分和语言模型打分。