CN113407771A - 监控调度方法、系统、装置及存储介质 - Google Patents

监控调度方法、系统、装置及存储介质 Download PDF

Info

Publication number
CN113407771A
CN113407771A CN202110525805.8A CN202110525805A CN113407771A CN 113407771 A CN113407771 A CN 113407771A CN 202110525805 A CN202110525805 A CN 202110525805A CN 113407771 A CN113407771 A CN 113407771A
Authority
CN
China
Prior art keywords
scheduling
monitoring
determining
word segmentation
operation instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110525805.8A
Other languages
English (en)
Other versions
CN113407771B (zh
Inventor
易作辉
柴炯
陈新伟
李涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Radio & Tv Xinyi Technology Co ltd
Original Assignee
Shenzhen Radio & Tv Xinyi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Radio & Tv Xinyi Technology Co ltd filed Critical Shenzhen Radio & Tv Xinyi Technology Co ltd
Priority to CN202110525805.8A priority Critical patent/CN113407771B/zh
Publication of CN113407771A publication Critical patent/CN113407771A/zh
Application granted granted Critical
Publication of CN113407771B publication Critical patent/CN113407771B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种监控调度方法、系统、装置及存储介质,其中所述方法包括:获取调度语音;根据训练完成的识别模型将调度语音转换为调度文本,并对调度文本进行分词处理,获得分词结果;根据不同的分词结果确定不同的操作指令;根据操作指令显示对应的监控视频。本申请实施例提供了一种将用户语音转换为文本,并根据文本确定操作指令的方法,通过分词处理,提高语音转换、指令生成全过程的准确度。用户只需要输入自然语言下的调度语言,即可实现监控视频的调度,摆脱了传统的使用鼠标、键盘等设备调度监控的复杂操作,大大减轻用户的使用负担。本申请实施例广泛适用于监控调度领域。

Description

监控调度方法、系统、装置及存储介质
技术领域
本申请涉及视频调度领域,尤其涉及一种监控调度方法、系统、装置及存储介质。
背景技术
为响应国家信息化建设的要求,加快政府信息化建设的步伐,近年来,随着平安城市、雪亮工程、智慧城市等一系列政府建设工程的推进,视频监控设备建设速度大大提升,各种视频监控系统应运而生,而大多数监控系统对于视频监控内容的检索、调度基本依赖于人工键盘鼠标操作,甚至于在系统投射到大屏视频指挥场景时极为不便。
对于城市级上万路建设规模的监控视频点播调度,一般需要多人配合才能完成相应操作,且需要安排对视频监控资源相当熟悉的专业操作人员,才能快速、准确的调度监控资源。因此,对用户日常调度指挥、演示汇报工作,造成诸多不便。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请提出一种监控调度方法、系统、装置及存储介质。
第一方面,本申请实施例提供了一种监控调度方法,包括:获取调度语音;根据训练完成的识别模型和所述调度语音,确定调度文本;对所述调度文本进行分词处理,确定分词结果;根据所述分词结果确定操作指令;根据操作指令显示监控视频。
可选地,所述识别模型的获取方法为:获取监控信息,所述监控信息至少包括监控镜头名称、监控所在位置的坐标以及监控所在位置的名称;对所述监控信息进行分类,确定概念模型,所述概念模型包括本地化地址数据;根据概念模型对所述识别模型进行训练,确定所述训练完成的识别模型。
可选地,所述根据所述分词结果确定操作指令,包括:对所述分词结果中的词汇进行词性标注,所述词性至少包括:技能名词、地点名词以及指代实体名词;根据所述分词结果以及所述词性,确定所述操作指令,所述操作指令包括调度字段、元素字段和指代字段;其中,所述操作指令的确定方法具体为:根据所述技能名词确定所述调度字段;根据所述地点名词确定所述元素字段;根据所述指代实体确定所述指代字段。
可选地,所述方法还包括:将若干句所述分词结果存入信息队列;若当前所述操作指令中缺少调度字段、元素字段或指代字段中的至少一个,根据所述信息队列中的所述若干句分词结果,补全所述操作指令。
可选地,所述方法还包括:根据所述分词结果,确定语料库;根据所述语料库,确定所述词性的词频;根据所述语料库和所述词频,确定本地语料规则;根据所述本地语料规则对所述调度文本进行分词处理,确定所述分词结果。
可选地,所述方法还包括:根据所述语料库,确定清洗库;根据所述清洗库对所述调度文本进行纠错,确定清洗后的所述调度文本。
可选地,所述根据操作指令显示监控视频,还包括:获取若干指令评估模式;当所述操作指令的句式与所述指令评估模式匹配,根据所述操作指令,显示所述监控视频。
第二方面,本申请实施例提供了一种监控调度系统,包括:获取模块,用于获取调度语音;语音识别模块,用于根据训练完成的识别模型和所述调度语音,确定调度文本;分词处理模块,用于对所述调度文本进行分句处理以及分词处理,确定分词结果;指令生成模块,用于根据所述分词结果确定操作指令;指令执行模块,用于执行操作指令并显示监控视频。
第三方面,本申请实施例提供了一种装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现第一方面所述的监控调度方法。
第四方面,本申请实施例提供了一种存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由所述处理器执行时用于实现如第一方面所述的监控调度方法。
本申请实施例的有益效果如下:获取调度语音;根据训练完成的识别模型将调度语音转换为调度文本,并对调度文本进行分词处理,获得分词结果;根据不同的分词结果确定不同的操作指令;根据操作指令显示对应的监控视频。本申请实施例提供了一种将用户语音转换为文本,并根据文本确定操作指令的方法,通过分词处理,提高语音转换、指令生成全过程的准确度。用户只需要输入自然语言下的调度语言,即可实现监控视频的调度,摆脱了传统的使用鼠标、键盘等设备调度监控的复杂操作,大大减轻用户的使用负担。
附图说明
附图用来提供对本申请技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
图1是本申请实施例提供的监控调度方法的步骤流程图;
图2为本申请实施例提供的获取识别模型的步骤流程图;
图3为本申请实施例提供的分词处理方法的步骤流程图;
图4为本申请实施例提供的建立本地语料规则的步骤流程图;
图5为本申请实施例提供的建立清洗库的步骤流程图;
图6为本申请实施例提出的补全操作指令的步骤流程图;
图7为本申请实施例提供的监控调度系统的示意图;
图8为本申请一些实施例提供的一种装置。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
需要说明的是,虽然在系统示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于系统中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
下面结合附图,对本申请实施例作进一步阐述。
参考图1,图1是本申请实施例提供的监控调度方法的步骤流程图,该方法包括但不限于步骤S100-S500;
S100、获取调度语音;
具体地,城市中每天会出现许多突发情况,如发生火灾事故或者是交通事故时,用户需要根据快速在城市众多的视频监控中快速调取事发地点附近的监控录像,以便快速掌握现场情况。
具体地,本申请实施例实现基于WebRTC(Web Real-Time Communication,网页即时通信)技术下的自动语音识别ASR音频采集方案,在HTTPS(Hyper Text TransferProtocol over Secure Socket Layer,超文本传输安全协议)安全域下,通过getUserMedia()方法启用外设麦克风的拾音功能,可以采集包括mp3,wav,pcm三种格式在内的的实时音频流。本申请实施例采用时长为30秒的wav语音流作为调度语音,可以达到较高的音质还原度,防止因为调度语音失真引起的语音识别错误。
S200、根据训练完成的识别模型和调度语音,确定调度文本;
具体地,本申请实施例使用语音识别框架FDNN(Feedforward Deep NeuralNetworks,前馈型深度神经网络)训练识别模型,并使用训练好的识别模型识别调度语音,将调度语音转换为自然语言下的调度文本。可以理解的是,在对调度文本的语义消噪方面,通过增加解析中文文本内容“杂质”的过滤,有助于提升转换准确率,代表语义噪音的“杂质”包括但不限于标点符号、语气词等。
参照图2,图2为本申请实施例提供的获取识别模型的步骤流程图,该方法包括但不限于步骤S210-S230;
S210、获取监控信息,监控信息至少包括监控镜头名称、监控所在位置的坐标以及监控所在位置的名称;
具体地,获取城市中大量的监控信息,这些监控信息至少包括监控镜头名称、监控所在位置的坐标以及监控所在位置的名称,根据获取到的监控信息,可以确定监控所在的具体地点或者是监控覆盖的范围。另外,监控信息还可以包括视频编组预案信息、以及视频监控镜头“一机一档”等结构化数据。其中,“一机一档”指的是一台监控设备的专属档案信息,这些档案信息包括但不限于设备编码、视频编目、所属机构、设备类型、应用模式、安装杆号、控制模式、接入方式、传输方式、点位类型、画面清晰度、画面码率、承建单位、维护单位等档案信息。
可以理解的是,由于城市视频监控由不同项目,不同单位建设,例如监控镜头名称字段在起初定义时就没有统一的规范,也就是说,本步骤获取到的监控信息中包含大量冗余信息,因此需要对监控信息进行数据预处理。数据预处理主要是指对监控信息统一数据格式,统一数值单位,去除噪音数据。示例性地,例如有监控名称为“白石路与沙河西路交界生态园三期A座向西北人脸1”,其中,“人脸1”标识这个镜头是用于人脸识别,由于人脸识别功能与本申请实施例提出监控调度方法关联度较低,因此对于本方案来说,该字段属于冗余的噪音数据,需要在预处理阶段将其去除。另外,将中文大写数字统一转换为阿拉伯数字,将有关路网的数据单独分出,可以得到转换后的监控名称为:“生态园3期A座向西北”。对于其他监控信息,也需要完成数据预处理。
S220、对监控信息进行分类,确定概念模型,概念模型包括本地化地址数据;
具体地,根据步骤S220获取到的监控信息,对监控信息中涉及到的相关业务地点的词语建立概念模型,对这些词语进行管理拓展。概念模型包括本地化地址数据,这些数据包括但不限于本地化的机关单位、银行、学校、医院、企业、河道、社区、酒店宾馆以及路网等数据,概念模型对这些地址数据进行分类,并记录对应的坐标,本申请实施例使用的是标准84坐标系。通过包含本地化地址数据的概念模型,使得本申请实施例的调度语音与本地化的时空场景有了关联分析的基础。
可以理解的是,根据概念模型中的本地化地址数据,可以对概念模型的地址信息作进一步拓展,例如补充方位名词某某路交叉处,某某路以北或者是城市易涝点位等等信息,相应标注这些地址的坐标。
S230、根据概念模型对识别模型进行训练,确定训练完成的识别模型;
具体地,本申请实施例使用本申请实施例使用语音识别框架FDNN训练识别模型,在识别模型训练初期,可以使用thchs-30、aishell的训练数据集进行训练,令识别模型可以识别基础的语言内容。但由于在本申请实施例的监控调度方案中,涉及到大量的本地化词汇,为了提高识别模型识别调度语音的准确度,因此需要使用概念模型中大量的本地化地址数据对识别模型进行训练,本地化地址数据包括但不限于本地的机关单位、商业场所、景点、银行网点、社区、学校、幼儿园、酒店宾馆、医院、企业、路网、地点、河道等。根据概念模型中的本地化地址数据完成识别模型的训练,得到训练完成的识别模型。
通过步骤S210-S230,本申请实施例通过概念模型中本地化的地址数据完成对识别模型的训练,提高识别模型对本地地名的识别精准度。
对获取识别模型的相关步骤上述内容已阐述完毕,下面开始阐述图1中的步骤S300。
S300、对调度文本进行分词处理,确定分词结果;
具体地,为了从自然语言状态下的调度文本中获取有效的调度信息,需要对调度文本进行分词处理。本申请实施例基于统计算法中的HMM(隐马可夫)算法和朴素贝叶斯算法的自然语义分析框架HanLP实现对调度文本的分词、词法分析、句法分析、文本分析和情感分析等功能。对调度文本进行分词处理后,得到若干词汇的集合,这些词汇的集合称为分词结果。
S400、根据分词结果确定操作指令;
具体地,对调度文本进行分词处理后,根据分词结果确定操作指令。
参照图3,图3为本申请实施例提供的分词处理方法的步骤流程图,该方法包括但不限于步骤S410-S420;
S410、对分词结果中的词汇进行词性标注,词性至少包括:技能名词、地点名词以及指代实体名词;
具体地,根据分词处理后获得的分词结果,对分词结果中的不同词汇进行词性的标注。参照表1,表1为本申请实施例中提供的词性标注分类表,本申请实施例中所提到的词性至少包括技能名词、地点名词以及指代实体名词。技能名词一般为表示动作的词,例如“点播”、“播放”、“定位”;地点名词则为本地化的地址数据,如本地的银行、公司、工厂等;而指代实体名词则是指技能名词所操控的实体,如“监控”、“监控视频”、“云台”。参照表1,示例性地,如有转换好的调度文本“播放生态科技园第一路监控”,根据分词处理后的分词结果,其中“播放”为sk技能名词,“生态科技园”为ns地点名词,“第一路”为m数词,“监控”为nks指代实体名词。
Figure BDA0003065687900000061
表1
S420、根据分词结果以及词性,确定操作指令,操作指令包括调度字段、元素字段和指代字段;
具体地,根据步骤410得到标注好词性的分词结果,确定操作指令。操作指令至少包括三个字段,分别为调度字段、元素字段和指代字段。调度字段是指表示调度业务场景中明确指向性的操作概念的字段,具体为用单个动词词汇或一组词汇表达的概念,调度字段指向元素字段,调度字段用于调度元素字段对应的内容。示例性的,如分词结果为“请播放生态科技园视频监控”,则对应得到的操作指令的调度字段为“播放”。元素字段是指业务相关的元素概念,是业务常用的企业、机构、地名、属性等概念。元素字段可以由单个元素或多个元素组成,元素字段由词性标签为m、nr、nkj、ns等词汇组成。示例性的,如分词结果为“请播放生态科技园视频监控”,则对应得到的元素字段为“生态科技园”。指代字段是指用于调度字段调度的实体,由词性标签为nks的词汇组成。示例性的,如分词结果为“请播放生态科技园视频监控”,则对应得到的操作指令的指代实体字段为“视频监控”。因此,,根据分词结果“请播放生态科技园视频监控”,可以得到“播放”“生态科技园”“视频监控”的操作指令。
可以理解的是,操作指令的各个字段与分词结果的不同词性相对应,操作指令的确定方法具体为:根据技能名词确定调度字段;根据地点名词确定元素字段;根据指代实体确定指代字段。
通过步骤S410-S420,对分词结果进行词性标注,并根据标注好词性后的分词结果,确定操作指令。
在一些实施例中,本申请实施例还建立了若干指令评估模式,指令评估模式是指对应特定的调度场景,操作指令的具体组成。上文中提到,操作指令至少包括调度字段、元素字段和指代字段,当操作指令的句式与其中一个指令评估模式相匹配,则操作指令根据特定的调度场景执行指令。参照表2,表2为本申请实施例提供的指令评估模式表,其中“___”表示不同的元素指令。示例性地,例如操作指令为“播放”“生态科技园”“监控”,参照表2,该操作指令符合指令评估模式“打开___监控”,因此对应的是系统的播放技能,则对应执行播放的操作。需要说明的是,由于系统执行不同的操作指令在逻辑上有一定的顺序,例如需要先查找到对应的视频资源,才能播放该视频资源,因此需要为各个调度场景对应的评估模型设定优先级,便于系统按优先级顺序进行操作。例如参照表2,范围查找的优先级高于播放技能。
Figure BDA0003065687900000071
表2
在一些实施例中,参照图4,图4为本申请实施例提供的建立本地语料规则的步骤流程图,该方法包括但不限于步骤S430-S460:
S430、根据分词结果,确定语料库;
具体地,将步骤S300获得的分词结果汇总为语料库。
S440、根据语料库,确定词性的词频;
具体地,根据步骤S410对分词结果进行词性标注,根据分词结果的不同词性,确定词性对应的词频。词频是指语言材料中该词汇的使用频率,用以评估一个词对于一个文件或者一个语料库中的一个领域文件集的重复程度。示例性地,参考表1,如技能词汇sk的词频为5000。以此类推,统计出词性对应的词频。
S450、根据语料库和词频,确定本地语料规则;
具体地,得到统计好各词汇词频的语料库后,由于词频越高,说明该词汇在当前语料库中的出现频率越高,因此可以将词汇的词频作为一种作用向量,用于推导分词的优先性。示例性地,例如调度文本为“播放下塘路口监控”,“播放”是一个正确的词汇,“放下”也是一个正确的词汇,可以理解的是,作为一个用于监控调度的语料库,“播放”的词频远高于“放下”,因此词频更高的“播放”拥有分词的优先性,则将调度文本分词处理后,得到的分词结果应为“播放/下塘/路口/监控”。根据语料库不同词汇的词频,推导出分词的优先性,形成本地语料规则。
S460、根据本地语料规则对调度文本进行分词处理,确定分词结果;
具体地,根据步骤S450确定的本地语料规则,HanLp自然语言引擎使用本地预料规则进行调度文本的分词处理,可以有效提高分词的准确度。
通过步骤S430-S460,通过确定语料库中不同词汇的词频确定本地语料规则,并根据本地语料规则对调度文本进行分词处理,提高分词处理的准确度。
在一些实施例中,参照图5,图5为本申请实施例提供的建立清洗库的步骤流程图,该方法包括但不限于步骤S470-S480:
S470、根据语料库,确定清洗库;
具体地,将语料库中易混淆的词进行汇总,确定清洗库。易混淆词汇主要是指受用户口音、识别准确度、麦克风收音质量等影响,容易混淆的两个或多个发音相似的词汇,例如“尽头”对应“镜头”、“达到”对应“大道”、“蓝山/兰山/岚山/阑珊/澜山/男三”对应“南山”等。
S480、根据清洗库对调度文本进行纠错,确定清洗后的调度文本;
具体地,确定清洗库后,与语音转换得到的调度文本进行对比,对调度文本进行纠错,确定清洗后的调度文本。
通过步骤S470-S480,根据易混淆词汇确定清洗库,并根据清洗库对调度文本进行纠错,有利于提高调度文本的准确度,提高语音识别的容错率。
对如何确定操作指令等内容,在上文中已经阐述完毕,下面阐述图1中的步骤S500。
S500、执行操作指令,显示监控视频;
具体地,参照上述步骤S410-S420,根据分词结果的词性确定了操作指令的各个字段,根据操作指令的各个字段,监控调度系统可以控制显示指定的监控视频。示例性地,如操作指令以调度字段、元素字段和指代字段的顺序排列为“播放”“生态科技园”“视频监控”,则监控调度系统通过该指令可以明确,需要在视频监控数据库中寻找生态科技园对应的视频资源,并在显示设备上显示出来。另外,本申请实施例除了显示监控视频,还可以显示调度语音转换得到的调度文本,以便用户确定调度语音是否被正确理解,完善了交互式的用户体验。
需要说明的是,参照内容以及表2的内容,可以理解的是,本申请实施例所提到的操作指令,除了可以用于调度显示指定的监控,还可以用于对其他指代实体进行控制,以满足多样的调度场景需求,例如监控设备与云台连接,操作指令可以通过接口控制云台8个方向的转动,并下达关于转动幅度、雨刷、转速、画面变焦变倍等指令,通过预留接口层使得调度语音转换为的机器指令可以调用对应的监控设备接口。
通过步骤S100-S500,本申请实施例获得调度语音,并利用训练好的识别模型将调度语音转换为调度文本,对调度文本进行分词处理得到分词结果,根据分词结果确定操作指令,并根据操作指令来显示指定的监控视频,用户只需要输入自然语言下的调度语言,即可实现监控视频的调度。
在一些实施例中,本申请实施例提出的监控调度方法还包括:利用信息队列来提高操作指令的准确度。参照图6,图6为本申请实施例提出的补全操作指令的步骤流程图,该方法包括但不限于步骤S600-S610:
S600、将若干句分词结果存入信息队列;
具体地,在自然语言环境下,调度语音所包含的指令是一种各语句之间具有很强相关性的复杂时变指令,这种相关性主要体现在说话时的上下文主体对象前置现象上,往往前后好几句话对人当前想表达的意思都有影响,也就是语音的前后句之间具有长时相关性。因此,采用拼接语句的方式获取到一定程度的上下文信息,上下文信息有助于提高对当前想要表达的意思的理解。但是由于FDNN输入的窗长是固定的,识别模型学习到的是固定输入到输入的映射关系,从而导致FDNN对于时序信息的长时相关性的建模是较弱的。因此,本申请实施提出可以通过信息队列的辅助,增加上下文的语句理解,为提高人机交互的友好性提供帮助。
具体地,本申请实施例将分词结果中多条语句放入信息队列中,根据语义理解上下文并进行记录,并在大于若干轮对话后再将当前语句移出队列。
S610、若当前操作指令中缺少元素指令,根据信息队列中的若干句分词结果,补全操作指令;
具体地,根据步骤S600将分词结果中的多条语句放入了信息队列中,若当前语句不能得到包含调度字段、元素字段和指代字段的完成操作指令,则根据信息队列中语句的上下文补全该操作指令。示例性地,以信息队列中的四条语句为例:“定位生态科技园主门,查找周边视频监控,播放第二路视频画面,视频云台拉近。”其中,第一句“定位生态科技园主门”包含元素字段“生态科技园”,而第二句“查找周边视频监控”则只包含调度字段“查找”和指代字段“监控”,缺少元素指令,则联系上下文,从第一句中对操作指令进行补全,得到完整的操作指令为:“查找”“生态科技园”“周边”“监控”,根据该操作指令,监控调度系统则可以查询生态科技园周边直径若干米的范围内视频监控资源。另外,第三句“播放第二路视频画面”包含元素字段“第二路”,结合第一、第二句,监控调度系统则可以查询生态科技园第二路监控的监控资源。
通过步骤S600-S610,将分词结果存入信息队列,并根据分词结果内多条语句的上下文理解,补全操作指令。通过上下语句的理解,能够切实提高操作指令的准确性,并有利于实现各路监控视频的切换。
综上,本申请实施例提供了一种监控调度方法,通过转换用户的调度语音获得调度文本,并对调度文本进行分词处理,根据分词结果确定操作指令,根据操作指令来调度显示对应的监控视频。本申请实施例提供了用户用语音完成监控调度的方法,首先摆脱了传统的使用鼠标、键盘等设备调度监控的复杂操作,大大减轻用户的使用负担;再者,通过分词处理,提高语音转换、指令生成全过程的准确度;另外,通过概念模型、语料库等语言库的建立,有效提高监控调度系统的拓展性;最后,通过使用信息队列、建立本地语料规则、建立清洗库等等步骤,有效提高了语音识别以及分词的准确度、容错率,令语音调度监控的准确率可以达到实战要求。
参照图7,图7为本申请实施例提供的监控调度系统的示意图,该系统700包括获取模块710、语音识别模块720、分词处理模块730、指令生成模块740以及指令执行模块750,获取模块,用于获取调度语音;语音识别模块,用于根据训练完成的识别模型和调度语音,确定调度文本;分词处理模块,用于对调度文本进行分句处理以及分词处理,确定分词结果;指令生成模块,用于根据分词结果确定操作指令;指令执行模块,用于执行操作指令并显示监控视频。
参考图8,图8为本申请一些实施例提供的一种装置,该装置800包括至少一个处理器810,还包括至少一个存储器820,用于存储至少一个程序;图8中以一个处理器及一个存储器为例。
处理器和存储器可以通过总线或者其他方式连接,图8中以通过总线连接为例。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本申请的另一个实施例还提供了一种装置,该装置可用于执行如上任意实施例中的控制方法,例如,执行以上描述的图1中的方法步骤。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本申请实施例还公开了一种计算机存储介质,其中存储有处理器可执行的程序,其特征在于,处理器可执行的程序在由处理器执行时用于实现本申请提出的监控调度方法。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上是对本申请的较佳实施进行了具体说明,但本申请并不局限于上述实施方式,熟悉本领域的技术人员在不违背本申请精神的前提下还可作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (10)

1.一种监控调度方法,其特征在于,包括:
获取调度语音;
根据训练完成的识别模型和所述调度语音,确定调度文本;
对所述调度文本进行分词处理,确定分词结果;
根据所述分词结果确定操作指令;
根据操作指令显示监控视频。
2.根据权利要求1所述的监控调度方法,其特征在于,所述识别模型的获取方法为:
获取监控信息,所述监控信息至少包括监控镜头名称、监控所在位置的坐标以及监控所在位置的名称;
对所述监控信息进行分类,确定概念模型,所述概念模型包括本地化地址数据;
根据概念模型对所述识别模型进行训练,确定所述训练完成的识别模型。
3.根据权利要求1所述的监控调度方法,其特征在于,所述根据所述分词结果确定操作指令,包括:
对所述分词结果中的词汇进行词性标注,所述词性至少包括:技能名词、地点名词以及指代实体名词;
根据所述分词结果以及所述词性,确定所述操作指令,所述操作指令包括调度字段、元素字段和指代字段;
其中,所述操作指令的确定方法具体为:
根据所述技能名词确定所述调度字段;
根据所述地点名词确定所述元素字段;
根据所述指代实体确定所述指代字段。
4.根据权利要求3所述的监控调度方法,其特征在于,所述方法还包括:
将若干句所述分词结果存入信息队列;
若当前所述操作指令中缺少调度字段、元素字段或指代字段中的至少一个,根据所述信息队列中的所述若干句分词结果,补全所述操作指令。
5.根据权利要求3所述的监控调度方法,其特征在于,所述方法还包括:
根据所述分词结果,确定语料库;
根据所述语料库,确定所述词性的词频;
根据所述语料库和所述词频,确定本地语料规则;
根据所述本地语料规则对所述调度文本进行分词处理,确定所述分词结果。
6.根据权利要求5所述的监控调度方法,其特征在于,所述方法还包括:
根据所述语料库,确定清洗库;
根据所述清洗库对所述调度文本进行纠错,确定清洗后的所述调度文本。
7.根据权利要求3所述的监控调度方法,其特征在于,所述根据操作指令显示监控视频,还包括:
获取若干指令评估模式;
当所述操作指令的句式与所述指令评估模式匹配,根据所述操作指令,显示所述监控视频。
8.一种监控调度系统,其特征在于,包括:
获取模块,用于获取调度语音;
语音识别模块,用于根据训练完成的识别模型和所述调度语音,确定调度文本;
分词处理模块,用于对所述调度文本进行分句处理以及分词处理,确定分词结果;
指令生成模块,用于根据所述分词结果确定操作指令;
指令执行模块,用于执行操作指令并显示监控视频。
9.一种装置,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-7中任一项所述的监控调度方法。
10.一种存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由所述处理器执行时用于实现如权利要求1-7任一项所述的监控调度方法。
CN202110525805.8A 2021-05-14 2021-05-14 监控调度方法、系统、装置及存储介质 Active CN113407771B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110525805.8A CN113407771B (zh) 2021-05-14 2021-05-14 监控调度方法、系统、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110525805.8A CN113407771B (zh) 2021-05-14 2021-05-14 监控调度方法、系统、装置及存储介质

Publications (2)

Publication Number Publication Date
CN113407771A true CN113407771A (zh) 2021-09-17
CN113407771B CN113407771B (zh) 2024-05-17

Family

ID=77678695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110525805.8A Active CN113407771B (zh) 2021-05-14 2021-05-14 监控调度方法、系统、装置及存储介质

Country Status (1)

Country Link
CN (1) CN113407771B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109036425A (zh) * 2018-09-10 2018-12-18 百度在线网络技术(北京)有限公司 用于操作智能终端的方法和装置
CN109614501A (zh) * 2018-12-13 2019-04-12 浙江工商大学 一种基于知识图谱的工业隐患规范化上报方法及系统
CN110099246A (zh) * 2019-02-18 2019-08-06 深度好奇(北京)科技有限公司 监控调度方法、装置、计算机设备及存储介质
CN110704641A (zh) * 2019-10-11 2020-01-17 零犀(北京)科技有限公司 一种万级意图分类方法、装置、存储介质及电子设备
CN111090730A (zh) * 2019-12-05 2020-05-01 中科数智(北京)科技有限公司 智能语音调度系统及方法
CN112669851A (zh) * 2021-03-17 2021-04-16 北京远鉴信息技术有限公司 一种语音识别方法、装置、电子设备及可读存储介质
CN112735413A (zh) * 2020-12-25 2021-04-30 浙江大华技术股份有限公司 一种基于摄像装置的指令分析方法、电子设备和存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109036425A (zh) * 2018-09-10 2018-12-18 百度在线网络技术(北京)有限公司 用于操作智能终端的方法和装置
CN109614501A (zh) * 2018-12-13 2019-04-12 浙江工商大学 一种基于知识图谱的工业隐患规范化上报方法及系统
CN110099246A (zh) * 2019-02-18 2019-08-06 深度好奇(北京)科技有限公司 监控调度方法、装置、计算机设备及存储介质
CN110704641A (zh) * 2019-10-11 2020-01-17 零犀(北京)科技有限公司 一种万级意图分类方法、装置、存储介质及电子设备
CN111090730A (zh) * 2019-12-05 2020-05-01 中科数智(北京)科技有限公司 智能语音调度系统及方法
CN112735413A (zh) * 2020-12-25 2021-04-30 浙江大华技术股份有限公司 一种基于摄像装置的指令分析方法、电子设备和存储介质
CN112669851A (zh) * 2021-03-17 2021-04-16 北京远鉴信息技术有限公司 一种语音识别方法、装置、电子设备及可读存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HAOJIN YANG ET AL.: "Content Based Lecture Video Retrieval Using Speech and Video Text Information", 《IEEE TRANSACTIONS ON LEARNING TECHNOLOGIES ( VOLUME: 7, ISSUE: 2, APRIL-JUNE 2014)》, 27 February 2014 (2014-02-27), pages 142 - 154 *
欧阳秀平 等: "电信运营商网络运维智能化的应用思路与实践", 《信息通信技术》, 15 February 2019 (2019-02-15), pages 14 - 25 *
薛凌鸿: "基于Flex的多媒体智能答疑系统的设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 August 2012 (2012-08-15), pages 138 - 503 *

Also Published As

Publication number Publication date
CN113407771B (zh) 2024-05-17

Similar Documents

Publication Publication Date Title
US10522136B2 (en) Method and device for training acoustic model, computer device and storage medium
CN111883110B (zh) 语音识别的声学模型训练方法、系统、设备及介质
US10909328B2 (en) Sentiment adapted communication
CN111489748A (zh) 一种调度智能语音辅助系统
US8914285B2 (en) Predicting a sales success probability score from a distance vector between speech of a customer and speech of an organization representative
WO2022105861A1 (zh) 用于识别语音的方法、装置、电子设备和介质
CN111933129A (zh) 音频处理方法、语言模型的训练方法、装置及计算机设备
CN111098312A (zh) 窗口政务服务机器人
CN104392721A (zh) 基于语音识别的智能应急指挥系统及其语音识别方法
CN113614825A (zh) 用于自动语音识别的字词网格扩增
WO2021103712A1 (zh) 一种基于神经网络的语音关键词检测方法、装置及系统
CN110047481A (zh) 用于语音识别的方法和装置
CN108710653B (zh) 一种绘本朗读点播方法、装置及系统
CN111554284A (zh) 一种倒闸操作监控方法、装置、设备及存储介质
CN110890097A (zh) 语音处理方法及装置、计算机存储介质、电子设备
CN108153875B (zh) 语料处理方法、装置、智能音箱和存储介质
CN112466279A (zh) 一种英语口语发音自动纠正方法和装置
CN115910066A (zh) 用于区域配电网的智能调度指挥与运营系统
CN110647613A (zh) 一种课件构建方法、装置、服务器和存储介质
CN111400463B (zh) 对话响应方法、装置、设备和介质
CN113393841B (zh) 语音识别模型的训练方法、装置、设备及存储介质
CN116450799B (zh) 一种应用于交通管理服务的智能对话方法及设备
Furui et al. Ubiquitous speech processing
CN113407771B (zh) 监控调度方法、系统、装置及存储介质
CN112506405B (zh) 一种基于互联网监管领域的人工智能语音大屏指挥方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant