CN112509583B - 一种基于调度操作票系统的辅助监督方法及系统 - Google Patents
一种基于调度操作票系统的辅助监督方法及系统 Download PDFInfo
- Publication number
- CN112509583B CN112509583B CN202011367399.9A CN202011367399A CN112509583B CN 112509583 B CN112509583 B CN 112509583B CN 202011367399 A CN202011367399 A CN 202011367399A CN 112509583 B CN112509583 B CN 112509583B
- Authority
- CN
- China
- Prior art keywords
- voice
- operation ticket
- recognition
- dispatch
- scheduling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000010606 normalization Methods 0.000 claims abstract description 4
- 238000012795 verification Methods 0.000 claims description 23
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000009826 distribution Methods 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 238000003064 k means clustering Methods 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 239000004065 semiconductor Substances 0.000 claims 2
- 238000012360 testing method Methods 0.000 description 10
- 238000003860 storage Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 5
- 238000004088 simulation Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 210000001503 joint Anatomy 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于调度操作票系统的辅助监督方法及系统,包括,对调度语音进行声纹识别,验证下令人与受令人的身份;对所述调度语音进行语音识别并转写成调度文本,与操作票文本进行对比,找到所述调度语音不符合操作票的位置;基于电网调度规程搭建的知识库与所述操作票文本进行对比,识别出所述调度语音与所述操作票的差异及其本身不满足电网调规的条件。本发明实现了全自动化和实时化,大幅提高了电网调度操作过程规范性监督的效率和准确性。
Description
技术领域
本发明涉及辅助电网调度操作的技术领域,尤其涉及一种基于调度操作票系统的辅助监督方法及系统。
背景技术
现有技术主要通过对调度电话系统配置录音功能,离线取到调度录音之后通过人工听取或调用语音识别系统的方式转为调度文本,然后从调度操作系统导出操作票,通过人工比对和判断的方式找出调度过程中的操作票行文或用语不规范行为。
现有技术主要通过计算机辅助下人工方式进行调度操作过程的监督,存在非实时、效率低下耗费大量人工成本和人工判断容易遗漏等问题,并且无法判断电话双方的真实身份。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明解决的技术问题是:调度操作监督过程中存在效率低下、耗费大量人工成本和人工判断容易遗漏的问题。
为解决上述技术问题,本发明提供如下技术方案:包括,对调度语音进行声纹识别,验证下令人与受令人的身份;对所述调度语音进行语音识别并转写成调度文本,与操作票文本进行对比,找到所述调度语音不符合操作票的位置;基于电网调度规程搭建的知识库与所述操作票文本进行对比,识别出所述调度语音与所述操作票的差异及其本身不满足电网调规的条件。
作为本发明所述的基于调度操作票系统的辅助监督方法的一种优选方案,其中:进行所述声纹识别之前包括,利用无监督聚类算法基于识别特征将所述调度语音分类为多个待识别任务组;结合所述聚类算法预建立的训练模型对所述待识别任务组的特征分配参数进行调整;若满足设定阈值要求,则所述特征分配参数作为所述下一周期的识别调度条件。
作为本发明所述的基于调度操作票系统的辅助监督方法的一种优选方案,其中:还包括,采集所述调度语音的使用数据进行分析,得到所述识别特征。
作为本发明所述的基于调度操作票系统的辅助监督方法的一种优选方案,其中:对所述调度语音进行识别对比分析需建立识别分析模型,包括,叠加多个残差网络ResNet,;建立区域生成网络,/> ,设置阈值为0.5,若/>超过0.5,则保留候选区域,若/>低于0.5,则舍弃;生成分类分支,;
生成掩码分支,;其中,y:残差网络的输出,x:残差网络的输入,F:卷积运算函数,f:残差网络输出的语音特征,/>:候选区域,:池化运算,/>分别为第一层、第二层全连接层运算,/>:候选区域/>属于前景(即包含待识别特征)的概率,/>:保留的候选区域,/>分别为第三层、第四层全连接层运算,/>:候选区域/>待识别物体c的概率,/>分别为第五层、第六层全连接层运算,矩阵/>与候选区域/>像素大小一致,/>中每个位置代表候选区域内该目标点属于识别特征的概率。
作为本发明所述的基于调度操作票系统的辅助监督方法的一种优选方案,其中:初步识别包括,利用所述残差网络提取语音待识别特征;所述区域生成网络利用所述语音待识别特征对待识别语音进行分析,且将候选区域的特征分别送入所述分类分支和所述掩码分支中;所述分类分支识别所述待识别特征的种类;所述掩码分支定位所述待识别特征在所述调度语音中的波点。
作为本发明所述的基于调度操作票系统的辅助监督方法的一种优选方案,其中:进行所述验证包括,若声纹识别结果通过身份验证,则直接进入所述语音识别;若所述声纹识别结果未通过身份验证,则对所述下令人身份进行ID地址核实,若核实正确,则重新继续所述身份验证,若核实错误,则终止对当前所述语音的声纹识别。
作为本发明所述的基于调度操作票系统的辅助监督方法的一种优选方案,其中:还包括,随机取样所述调度语音数据;定义划分维度并将所述维度中小于划分点的所述调度语音数据放在当前节点的左侧,大于所述划分点的所述调度语音数据放在右侧;循环迭代,直至所述调度语音数据不可再分时停止;利用K-means聚类策略选择k个点作为初始质心并计算其余所有点与所述质心的欧式距离;将所有与质心点距离值小于所述阈值的点划分为一个聚类;重新计算所述聚类的中心点并进行标签定义,找到所述调度语音不符合所述操作票的位置。
作为本发明所述的基于调度操作票系统的辅助监督系统的一种优选方案,其中:包括,识别采集模块,用于采集所述调度语音信息及操作票系统的相关关系信息,获取所述调度语音的特征数据;数据处理中心模块连接于所述采集模块,其用于接收、计算、存储、输出待处理的数据信息,其包括运算单元、数据库和输入输出管理单元,所述运算单元与所述采集模块相连接,用于接收所述信息采集模块获取的数据信息以进行识别定位运算处理和归一化处理,计算识别种类、大小、位置数据,所述数据库连接于各个模块,用于存储接收的所有数据信息,为所述数据处理中心模块提供调配供应服务,所述输入输出管理单元用于接收各个模块的信息并输出所述运算单元的运算结果;定位模块与所述数据处理中心模块相连接,其用于接收所述运算单元的运算结果,通过调取解码体分析判断大小是否超过阈值、位置是否在区域内,综合判断目标识别及数据的匹配是否对应,以进行异常位置的定位。
作为本发明所述的基于调度操作票系统的辅助监督系统的一种优选方案,其中:还包括,辅助监督机器人服务后台,其通过websocket接口实时给辅助监督机器人推送操作票信息、电话语音识别结果、调规监督结果,所述辅助监督机器人通过HTTP接口向所述辅助监督机器人服务后台完成登陆操作。
本发明的有益效果:本发明综合应用了电话语音获取还原、声纹识别、语音识别、知识图谱等技术,同时与调度操作系统和调度电话系统对接将电话通话双方身份识别、电话语音转写为文本,通话语音文本与操作票文本对比、以及通过知识库的方式将它们和调度规程进行对比并找出不规范处的全过程拉通串联,实现了全自动化和实时化,大幅提高了电网调度操作过程规范性监督的效率和准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明第一个实施例所述的基于调度操作票系统的辅助监督方法的流程示意图;
图2为本发明第二个实施例所述的基于调度操作票系统的辅助监督系统的网络拓扑结构示意图;
图3为本发明第二个实施例所述的基于调度操作票系统的辅助监督系统的整体框架分布示意图;
图4为本发明第二个实施例所述的基于调度操作票系统的辅助监督系统的模块结构分布示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1,为本发明的第一个实施例,提供了一种基于调度操作票系统的辅助监督方法,包括:
S1:对调度语音进行声纹识别,验证下令人与受令人的身份。其中需要说明的是,进行声纹识别之前包括:
利用无监督聚类算法基于识别特征将调度语音分类为多个待识别任务组;结合聚类算法预建立的训练模型对待识别任务组的特征分配参数进行调整;若满足设定阈值要求,则特征分配参数作为下一周期的识别调度条件;采集调度语音的使用数据进行分析,得到识别特征。
进一步的,进行验证包括:
若声纹识别结果通过身份验证,则直接进入语音识别;若声纹识别结果未通过身份验证,则对下令人身份进行ID地址核实,若核实正确,则重新继续身份验证,若核实错误,则终止对当前语音的声纹识别。
S2:对调度语音进行语音识别并转写成调度文本,与操作票文本进行对比,找到调度语音不符合操作票的位置。本步骤需要说明的是,对调度语音进行识别对比分析需建立识别分析模型,包括:
叠加多个残差网络ResNet,。
建立区域生成网络,,设置阈值为0.5,若/>超过0.5,则保留候选区域,若/>低于0.5,则舍弃。
生成分类分支,。
生成掩码分支,。
进行初步识别:
其中,y:残差网络的输出,x:残差网络的输入,F:卷积运算函数,f:残差网络输出的语音特征,:候选区域,/>:池化运算,/>分别为第一层、第二层全连接层运算,/>:候选区域/>属于前景(即包含待识别特征)的概率,/>:保留的候选区域,分别为第三层、第四层全连接层运算,/>:候选区域/>待识别物体c的概率,分别为第五层、第六层全连接层运算,矩阵/>与候选区域/>像素大小一致,中每个位置代表候选区域内该目标点属于识别特征的概率。
具体的,初步识别包括:
利用残差网络提取语音待识别特征;区域生成网络利用语音待识别特征对待识别语音进行分析,且将候选区域的特征分别送入分类分支和掩码分支中;分类分支识别待识别特征的种类;掩码分支定位待识别特征在调度语音中的波点;随机取样调度语音数据;定义划分维度并将维度中小于划分点的调度语音数据放在当前节点的左侧,大于划分点的调度语音数据放在右侧;循环迭代,直至调度语音数据不可再分时停止;利用K-means聚类策略选择k个点作为初始质心并计算其余所有点与质心的欧式距离;将所有与质心点距离值小于阈值的点划分为一个聚类;重新计算聚类的中心点并进行标签定义,找到调度语音不符合操作票的位置。
S3:基于电网调度规程搭建的知识库与操作票文本进行对比,识别出调度语音与操作票的差异及其本身不满足电网调规的条件。
优选的,本发明方法综合应用了电话语音获取还原、声纹识别、语音识别、知识图谱,同时与调度操作系统和调度电话系统对接将电话通话双方身份识别、电话语音转写为文本,通话语音文本与操作票文本对比、以及通过知识库的方式将它们和调度规程进行对比并找出不规范处的全过程拉通串联,实现了全自动化和实时化,大幅提高了电网调度操作过程规范性监督的效率和准确性。
优选的是,为了更好地对本发明方法中所采用的的技术效果加以验证,本实施例选择传统的调度操作票系统监督方法与本发明方法进行对比测试,以科学论证的手段对比试验结果,验证本发明方法所具有的真实效果。
传统的调度操作票系统监督方法通过计算机辅助下人工方式进行调度操作过程的监督,存在非实时、效率低下耗费大量人工成本和人工判断容易遗漏问题,并且无法判断电话双方的真实身份;为验证本发明方法相对于传统方法具有较高的实时性、效率性、准确性,本实施例中将采用传统方法与本发明方法分别对仿真调度操作票系统的监督进行实时测量对比。
测试环境:将调度操作票系统运行在仿真平台模拟调度并模拟监督场景,采用100组历史调度语音作为测试样本,分别利用传统方法的人工操作进行监督测试并获得测试结果数据;采用本发明方法,则开启自动化测试设备并运用MATLB实现本发明方法的仿真测试,根据实验结果得到仿真数据;每种方法各测试十组数据,计算获得每组数据的时间,与仿真模拟输入的实际预测时间进行对比计算误差,结果如下表所示:
表1:实验数据结果对比表
。
参照表1,能够直观的看出,因传统方法无法自主实现对语音数据进行差异一致性的预处理,需人工干预,故其在相同的测试样本数量下,误差度较大,即精确度较低,而本发明方法基于聚类策略和识别分析模型,通过最优迭代策略获得最优解,极大的提高语音识别精确度,故其误差度较小,效率更高。
实施例2
参照图2、图3和图4,为本发明的第二个实施例,该实施例不同于第一个实施例的是,提供了一种基于调度操作票系统的辅助监督系统,包括:
识别采集模块100,用于采集调度语音信息及操作票系统的相关关系信息,获取调度语音的特征数据。
数据处理中心模块200连接于识别采集模块100,其用于接收、计算、存储、输出待处理的数据信息,其包括运算单元201、数据库202和输入输出管理单元203,运算单元201与识别采集模块100相连接,用于接收识别采集模块100获取的数据信息以进行识别定位运算处理和归一化处理,计算识别种类、大小、位置数据,数据库202连接于各个模块,用于存储接收的所有数据信息,为数据处理中心模块200提供调配供应服务,输入输出管理单元203用于接收各个模块的信息并输出运算单元201的运算结果。
定位模块300与数据处理中心模块200相连接,其用于接收运算单元201的运算结果,通过调取解码体分析判断大小是否超过阈值、位置是否在区域内,综合判断目标识别及数据的匹配是否对应,以进行异常位置的定位。
参照图2,本实施例在现有调度机房增加以下四个软件实体:
(1)声纹识别;(2)语音识别;(3)辅助监督机器人;(4)辅助监督机器人管理后台。
具体的,辅助监督机器人与调度操作系统对接,实时获取调度终端下发给厂站调度终端的调度操作票文本,辅助监督机器人与调度电话系统对接,实时获取调度电话和厂站调度电话之间的调度通话内容,并还原为PCM语音静荷,将其发送给声纹识别系统进行电话两端通话人的身份核实,将其发送给语音识别系统,将通话内容实时转写为文本,对比调度操作票文本与转写文本,并与基于调规构建的知识库进行对比,找出不规范内容,并将其传送给调度终端上的监督机器人进行实时提示;且辅助监督机器人安装在调度终端上的C/S架构桌面程序,对调度双方身份识别结果、调度过程监督结果进行实时提醒和显示;而辅助监督机器人管理后台通过系统管理员终端访问的B/S架构Web应用,用于用户管理、系统配置管理、调度监督过程归档结果查询。
参照图3,辅助监督机器人服务后台通过websocket接口实时给辅助监督机器人推送操作票信息、电话语音识别结果、调规监督结果,辅助监督机器人通过HTTP接口向辅助监督机器人服务后台完成登陆操作;且辅助监督机器人管理应用通过HTTP接口调用辅助监督机器人管理后台完成一系列管理操作;辅助监督机器人服务后台通过HTTP接口调用知识图谱完成知识图谱查询,通过HTTP接口接受操作票系统实时推送的操作票信息,通过GRPC接口接受电话语音还原引擎输出的语音转写文本;电话语音还原引擎通过HTTP接口调用语音识别引擎和声纹识别引擎,通过以太网卡直连的方式与调度电话系统对接。
通俗的说,数据处理中心模块200主要分为三个层次,包括控制层、运算层及存储层,控制层是数据处理中心模块200的指挥控制中心,由指令寄存器IR、指令译码器ID和操作控制器OC组成,控制层能够根据用户预先编好的程序,依次从存储器中取出各条指令,放在指令寄存器IR中,通过指令译码器分析确定,通知操作控制器OC进行操作,按照确定的时序向相应的部件发出微操作控制信号;运算层是计算单元201的核心,能够执行算术运算(如加减乘除及其附加运算)和逻辑运算(如移位、逻辑测试或两个值比较),其连接于控制层,通过接受控制层的控制信号进行运算操作;存储层是数据处理中心模块200的数据库,能够存放数据(待处理及已经处理过的数据)。
应当认识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
此外,可按任何合适的顺序来执行本文描述的过程的操作,除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机系统的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、RAM、ROM等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。计算机程序能够应用于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。
如在本申请所使用的,术语“组件”、“模块”、“系统”等等旨在指代计算机相关实体,该计算机相关实体可以是硬件、固件、硬件和软件的结合、软件或者运行中的软件。例如,组件可以是,但不限于是:在处理器上运行的处理、处理器、对象、可执行文件、执行中的线程、程序和/或计算机。作为示例,在计算设备上运行的应用和该计算设备都可以是组件。一个或多个组件可以存在于执行中的过程和/或线程中,并且组件可以位于一个计算机中以及/或者分布在两个或更多个计算机之间。此外,这些组件能够从在其上具有各种数据结构的各种计算机可读介质中执行。这些组件可以通过诸如根据具有一个或多个数据分组(例如,来自一个组件的数据,该组件与本地系统、分布式系统中的另一个组件进行交互和/或以信号的方式通过诸如互联网之类的网络与其它系统进行交互)的信号,以本地和/或远程过程的方式进行通信。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (5)
1.一种基于调度操作票系统的辅助监督方法,其特征在于:包括,
对调度语音进行声纹识别,验证下令人与受令人的身份;
采集调度语音的使用数据,通过识别分析模型进行识别对比分析,得到识别特征,进行身份验证;
对所述调度语音进行语音识别并转写成调度文本,与操作票文本进行对比,找到所述调度语音不符合操作票的位置;
基于电网调度规程搭建的知识库与所述操作票文本进行对比,识别出所述调度语音与所述操作票的差异及其本身不满足电网调规的条件;
所述识别分析模型包括,叠加多个残差网络ResNet,;
建立区域生成网络,,设置阈值为0.5,若/>超过0.5,则保留候选区域,若/>低于0.5,则舍弃;
生成分类分支,;
生成掩码分支,;
进行初步识别;
其中,y:残差网络的输出,x:残差网络的输入,F:卷积运算函数,f:残差网络输出的语音特征,:候选区域,/>:池化运算,/>分别为第一层、第二层全连接层运算,/>:候选区域/>属于前景(即包含待识别特征)的概率,/>:保留的候选区域,分别为第三层、第四层全连接层运算,/>:候选区域/>待识别物体c的概率,分别为第五层、第六层全连接层运算,矩阵/>与候选区域/>像素大小一致,中每个位置代表候选区域内该目标点属于识别特征的概率;
所述初步识别包括,利用所述残差网络提取语音待识别特征;
所述区域生成网络利用所述语音待识别特征对待识别语音进行分析,且将候选区域的特征分别送入所述分类分支和所述掩码分支中;
所述分类分支识别所述待识别特征的种类;
所述掩码分支定位所述待识别特征在所述调度语音中的波点;
所述进行身份验证包括,若声纹识别结果通过身份验证,则直接进入所述语音识别;
若所述声纹识别结果未通过身份验证,则对所述下令人身份进行ID地址核实,若核实正确,则重新继续所述身份验证,若核实错误,则终止对当前所述语音的声纹识别。
2.根据权利要求1所述的基于调度操作票系统的辅助监督方法,其特征在于:进行所述声纹识别之前包括,
利用无监督聚类算法基于识别特征将所述调度语音分类为多个待识别任务组;
结合所述聚类算法预建立的训练模型对所述待识别任务组的特征分配参数进行调整;
若满足设定阈值要求,则所述特征分配参数作为下一周期的识别调度条件。
3.根据权利要求1所述的基于调度操作票系统的辅助监督方法,其特征在于:还包括,
随机取样所述调度语音数据;
定义划分维度并将所述维度中小于划分点的所述调度语音数据放在当前节点的左侧,大于所述划分点的所述调度语音数据放在右侧;
循环迭代,直至所述调度语音数据不可再分时停止;
利用K-means聚类策略选择k个点作为初始质心并计算其余所有点与所述质心的欧式距离;
将所有与质心点距离值小于所述阈值的点划分为一个聚类;
重新计算所述聚类的中心点并进行标签定义,找到所述调度语音不符合所述操作票的位置。
4.一种基于调度操作票系统的辅助监督系统,用于执行权利要求1~3任一所述的辅助监督方法,其特征在于:包括,
识别采集模块(100),用于采集调度语音信息及操作票系统的相关关系信息,获取所述调度语音的特征数据;
数据处理中心模块(200)连接于所述识别采集模块(100),其用于接收、计算、存储、输出待处理的数据信息,其包括运算单元(201)、数据库(202)和输入输出管理单元(203),所述运算单元(201)与所述识别采集模块(100)相连接,用于接收所述识别采集模块(100)获取的数据信息以进行识别定位运算处理和归一化处理,计算识别种类、大小、位置数据,所述数据库(202)连接于各个模块,用于存储接收的所有数据信息,为所述数据处理中心模块(200)提供调配供应服务,所述输入输出管理单元(203)用于接收各个模块的信息并输出所述运算单元(201)的运算结果;
定位模块(300)与所述数据处理中心模块(200)相连接,其用于接收所述运算单元(201)的运算结果,通过调取解码体分析判断大小是否超过阈值、位置是否在区域内,综合判断目标识别及数据的匹配是否对应,以进行异常位置的定位。
5.根据权利要求4所述的基于调度操作票系统的辅助监督系统,其特征在于:还包括,
辅助监督机器人服务后台,其通过websocket接口实时给辅助监督机器人推送操作票信息、电话语音识别结果、调规监督结果,所述辅助监督机器人通过HTTP接口向所述辅助监督机器人服务后台完成登陆操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011367399.9A CN112509583B (zh) | 2020-11-27 | 2020-11-27 | 一种基于调度操作票系统的辅助监督方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011367399.9A CN112509583B (zh) | 2020-11-27 | 2020-11-27 | 一种基于调度操作票系统的辅助监督方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112509583A CN112509583A (zh) | 2021-03-16 |
CN112509583B true CN112509583B (zh) | 2023-07-18 |
Family
ID=74967502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011367399.9A Active CN112509583B (zh) | 2020-11-27 | 2020-11-27 | 一种基于调度操作票系统的辅助监督方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112509583B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112530438B (zh) * | 2020-11-27 | 2023-04-07 | 贵州电网有限责任公司 | 一种基于知识图谱辅助声纹识别的身份认证方法 |
CN112951624A (zh) * | 2021-04-07 | 2021-06-11 | 张磊 | 一种语音控制的紧急断电系统 |
CN113314149A (zh) * | 2021-04-19 | 2021-08-27 | 贵州电网有限责任公司 | 一种基于人工智能的电力调度智慧坐席指令优化方法 |
CN113506576A (zh) * | 2021-06-30 | 2021-10-15 | 贵州电网有限责任公司 | 一种基于操作票与调度语音的电力调度实时监督方法 |
CN113408637A (zh) * | 2021-06-30 | 2021-09-17 | 贵州电网有限责任公司 | 一种基于相似度算法的操作票匹配方法 |
CN116825140B (zh) * | 2023-08-29 | 2023-10-31 | 北京龙德缘电力科技发展有限公司 | 一种用于操作票中规范动作流程的语音交互方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104732974A (zh) * | 2013-12-19 | 2015-06-24 | 国家电网公司 | 智能录音识别系统 |
KR20180073424A (ko) * | 2016-12-22 | 2018-07-02 | 삼성전자주식회사 | 소프트 라벨링을 이용한 딥 러닝 훈련 방법 및 장치 |
WO2018232592A1 (en) * | 2017-06-20 | 2018-12-27 | Microsoft Technology Licensing, Llc. | SEMANTIC SEGMENTATION TAKING INTO ACCOUNT AN EVENT WITH COMPLETE CONVOLUTION |
CN109559737A (zh) * | 2018-12-13 | 2019-04-02 | 朱明增 | 电力系统调度语音模型建立方法 |
CN209374053U (zh) * | 2018-11-29 | 2019-09-10 | 朱明增 | 调度操作票智能监护与校验系统 |
CN111048080A (zh) * | 2019-11-22 | 2020-04-21 | 广东电网有限责任公司 | 一种基于语音识别技术的调度智能指挥系统 |
CN111353487A (zh) * | 2019-08-20 | 2020-06-30 | 国网浙江省电力有限公司台州供电公司 | 用于变电站的设备信息提取方法 |
US10803885B1 (en) * | 2018-06-29 | 2020-10-13 | Amazon Technologies, Inc. | Audio event detection |
CN111985231A (zh) * | 2020-08-07 | 2020-11-24 | 中移(杭州)信息技术有限公司 | 无监督角色识别方法、装置、电子设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080312928A1 (en) * | 2007-06-12 | 2008-12-18 | Robert Patrick Goebel | Natural language speech recognition calculator |
-
2020
- 2020-11-27 CN CN202011367399.9A patent/CN112509583B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104732974A (zh) * | 2013-12-19 | 2015-06-24 | 国家电网公司 | 智能录音识别系统 |
KR20180073424A (ko) * | 2016-12-22 | 2018-07-02 | 삼성전자주식회사 | 소프트 라벨링을 이용한 딥 러닝 훈련 방법 및 장치 |
WO2018232592A1 (en) * | 2017-06-20 | 2018-12-27 | Microsoft Technology Licensing, Llc. | SEMANTIC SEGMENTATION TAKING INTO ACCOUNT AN EVENT WITH COMPLETE CONVOLUTION |
US10803885B1 (en) * | 2018-06-29 | 2020-10-13 | Amazon Technologies, Inc. | Audio event detection |
CN209374053U (zh) * | 2018-11-29 | 2019-09-10 | 朱明增 | 调度操作票智能监护与校验系统 |
CN109559737A (zh) * | 2018-12-13 | 2019-04-02 | 朱明增 | 电力系统调度语音模型建立方法 |
CN111353487A (zh) * | 2019-08-20 | 2020-06-30 | 国网浙江省电力有限公司台州供电公司 | 用于变电站的设备信息提取方法 |
CN111048080A (zh) * | 2019-11-22 | 2020-04-21 | 广东电网有限责任公司 | 一种基于语音识别技术的调度智能指挥系统 |
CN111985231A (zh) * | 2020-08-07 | 2020-11-24 | 中移(杭州)信息技术有限公司 | 无监督角色识别方法、装置、电子设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
Region Proposal Network Based Small-Footprint Keyword Spotting;Hou, JY;《 IEEE SIGNAL PROCESSING LETTERS 》;20191031;1471-1475 * |
SPEAKER DIARIZATION WITH REGION PROPOSAL NETWORK;Huang, ZL;《IEEE International Conference on Acoustics, Speech, and Signal Processing》;20200414;6514-6518 * |
复杂声学场景下鲁棒性语音识别研究;何人可;《中国优秀硕士学位论文全文数据库信息科技辑》;20200731;I136-234 * |
Also Published As
Publication number | Publication date |
---|---|
CN112509583A (zh) | 2021-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112509583B (zh) | 一种基于调度操作票系统的辅助监督方法及系统 | |
CN110147726B (zh) | 业务质检方法和装置、存储介质及电子装置 | |
US10957339B2 (en) | Speaker recognition method and apparatus, computer device and computer-readable medium | |
CN109871807B (zh) | 人脸图像处理方法和装置 | |
US20210312163A1 (en) | Face recognition method, device and electronic equipment, and computer non-volatile readable storage medium | |
CN112420055A (zh) | 基于声纹特征的变电站状态识别方法及装置 | |
CN112232276B (zh) | 一种基于语音识别和图像识别的情绪检测方法和装置 | |
CN116342332B (zh) | 基于互联网的辅助审判方法、装置、设备及存储介质 | |
CN109961041A (zh) | 一种视频识别方法、装置及存储介质 | |
KR20200143940A (ko) | 인공지능 기반의 언어 능력 평가 방법 및 시스템 | |
CN113886792A (zh) | 一种声纹识别和人脸识别相结合的印控仪应用方法和系统 | |
CN116738204A (zh) | 基于生成对抗Transformer的电力负荷数据异常检测方法 | |
CN114245204B (zh) | 基于人工智能的视频面签方法、装置、电子设备及介质 | |
CN109088793B (zh) | 用于检测网络故障的方法和装置 | |
TWI762193B (zh) | 圖像瑕疵檢測方法、裝置、電子設備及存儲介質 | |
CN113469237B (zh) | 用户意图识别方法、装置、电子设备及存储介质 | |
CN112992156B (zh) | 一种基于声纹认证的配电网调度身份认证系统 | |
CN114282598A (zh) | 多源异构电网数据融合方法、装置、设备及计算机介质 | |
CN113642443A (zh) | 模型的测试方法、装置、电子设备及存储介质 | |
CN109285559B (zh) | 角色转换点检测方法及装置、存储介质、电子设备 | |
CN114648978B (zh) | 一种语音验证处理的方法以及相关装置 | |
CN111950332B (zh) | 视频时序定位方法、装置、计算设备和存储介质 | |
CN113837075B (zh) | 基于人脸识别的业务办理方法、装置、电子设备及介质 | |
CN115001941B (zh) | 一种通信网管故障的确定方法及装置 | |
CN115471893B (zh) | 训练人脸识别模型、人脸识别的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |