CN116501915B - 一种能量管理端语音页面检索方法及系统 - Google Patents
一种能量管理端语音页面检索方法及系统 Download PDFInfo
- Publication number
- CN116501915B CN116501915B CN202310778387.2A CN202310778387A CN116501915B CN 116501915 B CN116501915 B CN 116501915B CN 202310778387 A CN202310778387 A CN 202310778387A CN 116501915 B CN116501915 B CN 116501915B
- Authority
- CN
- China
- Prior art keywords
- page
- page file
- file link
- data
- confidence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000006243 chemical reaction Methods 0.000 claims abstract description 10
- 239000011159 matrix material Substances 0.000 claims description 29
- 230000015654 memory Effects 0.000 claims description 19
- 238000012706 support-vector machine Methods 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 17
- 238000012549 training Methods 0.000 claims description 13
- 238000010276 construction Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/635—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/64—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种能量管理端语音页面检索方法及系统,一种能量管理端语音页面检索方法,包括:采集语音操作指令,将语音操作指令进行语音识别转换,生成指令文本;获取组态页面中绑定数据点的图元数据,基于绑定数据点的图元数据构建组态页面数据集;基于组态页面数据集确定各页面文件链接对应的置信度;基于组态页面数据集构建页面类别预测模型,并将指令文本输入页面类别预测模型,生成分类页面文件链接;基于各页面文件链接对应的置信度将分类页面文件链接进行排序,选取置信度最高的预测页面文件链接作为定位页面。该方法减少了页面检索时间,提升了操作效率,降低了掌握难度。
Description
技术领域
本发明涉及语音页面检索技术领域,尤其是涉及一种能量管理端语音页面检索方法及系统。
背景技术
能量管理系统(EMS)是对能源进行实时监测和控制的系统,包括工程、设计、应用以及扩展的对电源系统的维修等,来为以电能作为能源的系统达到最佳性能,主要实现能量的安全优化调度。
能量管理系统庞大,一般涉及多个数据源,页面与数据点关联绑定关系复杂,操作人员很难在短时间内定位到所需动作的操作入口,通常需要逐个页面扫查,一方面导致操作时间延长,无法及时响应变化;另一方面不利于初次接触系统的人学习掌握。
发明内容
因此,本发明技术方案主要解决现有技术中能量管理系统进行页面检索时操作时间长、无法及时响应变化,以及不利于初次接触系统的人学习掌握的缺陷,从而提供一种能量管理端语音页面检索方法及系统。
第一方面,本发明实施例提供了一种能量管理端语音页面检索方法,包括:
采集语音操作指令,将所述语音操作指令进行语音识别转换,生成指令文本;
获取组态页面中绑定数据点的图元数据,基于所述绑定数据点的图元数据构建组态页面数据集;
基于所述组态页面数据集确定各页面文件链接对应的置信度;
基于所述组态页面数据集构建页面类别预测模型,并将所述指令文本输入所述页面类别预测模型,生成分类页面文件链接;
基于所述各页面文件链接对应的置信度将所述分类页面文件链接进行排序,选取置信度最高的预测页面文件链接作为定位页面。
本发明实施例提供的一种能量管理端语音页面检索方法,通过构建组态页面数据集将页面检索问题转化为单标签多分类问题,并基于组态页面数据集确定各页面文件链接对应的置信度,利用置信度为页面文件链接分类结果的选择提供了参考依据,并且,利用页面类别预测模型实现了对页面文件链接的快速检索,减少了页面检索时间,提升了操作效率,降低了掌握难度,解决了大型能量管理端中页面检索速度慢、上手难的问题。
结合第一方面,在一种可能的实施方式中,所述基于所述绑定数据点的图元数据构建组态页面数据集,包括:
基于所述绑定数据点的图元数据生成数据项,根据所述数据项构建所述组态页面数据集;其中,所述数据项包括设备表名-数据点名-图元类型-页面文件链接、设备表名-数据点名-页面文件链接和数据点名-页面文件链接。
结合第一方面,在另一种可能的实施方式中,所述基于所述组态页面数据集确定各页面文件链接对应的置信度,包括:
基于所述组态页面数据集分别确定先决条件为设备表名时各页面文件链接的置信度、先决条件为设备表名和数据点名时各页面文件链接的置信度与先决条件为数据点名时各页面文件链接的置信度。
结合第一方面,在另一种可能的实施方式中,所述基于所述组态页面数据集构建页面类别预测模型,并将所述指令文本输入所述页面类别预测模型,生成分类页面文件链接,包括:
基于所述组态页面数据集构建编码矩阵,所述编码矩阵的行向量为所述组态页面数据集中的页面文件链接,所述编码矩阵的每一列向量为所述组态页面数据集中的任意两个不重复的页面文件链接;
利用所述组态页面数据集对多个支持向量机二值分类器进行训练,生成所述页面类别预测模型;其中支持向量机二值分类器的个数与编码矩阵的列数相同;
将所述指令文本进行拆分,生成指令四元组;其中,所述指令四元组为设备表名-数据点名-图元类型-操作;
将所述指令四元组输入所述页面类别预测模型中,生成所述分类页面文件链接。
结合第一方面,在另一种可能的实施方式中,所述将所述指令四元组输入所述页面类别预测模型中,生成所述分类页面文件链接,包括:
将所述指令四元组中的设备表名输入所述页面类别预测模型中,生成第一类页面文件链接;
将所述指令四元组中的设备表名和数据点名输入所述页面类别预测模型中,生成第二类页面文件链接;
将所述指令四元组中的数据点名输入所述页面类别预测模型中,生成第三类页面文件链接。
结合第一方面,在另一种可能的实施方式中,所述基于所述各页面文件链接对应的置信度将所述分类页面文件链接进行排序,选取置信度最高的预测页面文件链接作为定位页面,包括:
基于所述先决条件为设备表名时各页面文件链接的置信度、所述先决条件为设备表名和数据点名时各页面文件链接的置信度与所述先决条件为数据点名时各页面文件链接的置信度分别确定第一类页面文件链接的置信度、第二类页面文件链接的置信度和第三类页面文件链接的置信度;
将所述第一类页面文件链接的置信度、所述第二类页面文件链接的置信度和所述第三类页面文件链接的置信度进行排序;
基于排序结果选取置信度最高的分类页面文件链接作为定位页面。
结合第一方面,在另一种可能的实施方式中,所述基于所述各页面文件链接对应的置信度将所述分类页面文件链接进行排序,选取置信度最高的预测页面文件链接作为定位页面,还包括:
当所述第一类页面文件链接的置信度、所述第二类页面文件链接的置信度和所述第三类页面文件链接的置信度相同时,则采用投票原则确定所述定位页面。
第二方面,本发明实施例还提供了一种能量管理端语音页面检索系统,包括:
识别转换模块,用于采集语音操作指令,将所述语音操作指令进行语音识别转换,生成指令文本;
构建模块,用于获取组态页面中绑定数据点的图元数据,基于所述绑定数据点的图元数据构建组态页面数据集;
确定模块,用于基于所述组态页面数据集确定各页面文件链接对应的置信度;
生成模块,用于基于所述组态页面数据集构建页面类别预测模型,并将所述指令文本输入所述页面类别预测模型,生成分类页面文件链接;
排序模块,用于基于所述各页面文件链接对应的置信度将所述分类页面文件链接进行排序,选取置信度最高的预测页面文件链接作为定位页面。
第三方面,本发明实施例还公开了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如第一方面或第一方面任一可选实施方式所述的一种能量管理端语音页面检索方法的步骤。
第四方面,本发明实施方式还公开了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面或第一方面任一可选实施方式所述的一种能量管理端语音页面检索方法的步骤。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种能量管理端语音页面检索方法的流程图;
图2为本发明实施例提供的S104的流程图;
图3为本发明实施例提供的S1044的流程图;
图4为本发明实施例提供的S105的流程图;
图5为本发明实施例提供的一种能量管理端语音页面检索系统的框图;
图6为本发明实施例中电子设备的一个具体示例图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。另外,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接、机械连接,也可以是电连接;或者可以是直接相连,也可以通过中间媒介间接相连,还可以是两个元件内部的连通,可以是无线连接,也可以是有线连接。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
本发明实施例提供了一种能量管理端语音页面检索方法,如图1所示,包括:
S101、采集语音操作指令,将语音操作指令进行语音识别转换,生成指令文本。
具体地,操作员输入规范化语音操作指令,格式为:“设备名+数据点名+图元名+操作”,经语音识别转换为文本信息的指令文本,并拆分为设备表名-数据点名-图元类型-操作的指令四元组。
S102、获取组态页面中绑定数据点的图元数据,基于绑定数据点的图元数据构建组态页面数据集。
具体地,基于绑定数据点的图元数据生成数据项,根据数据项构建组态页面数据集;其中,数据项包括设备表名-数据点名-图元类型-页面文件链接、设备表名-数据点名-页面文件链接和数据点名-页面文件链接。
进一步地,数据项的数量与绑定数据点的图元数据的数量相等,利用声控巡屏系统获取能量管理系统组态页面绘制过程分析能量管理系统组态页面绘制过程,建立数据点与页面文件关系,对组态页面中所有绑定数据点的图元数据按照上述方式生成数据项,并加入组态页面数据集,能量管理端中所有组态页面对应生成的数据项共同组成组态页面数据集。
S103、基于组态页面数据集确定各页面文件链接对应的置信度。
具体地,基于组态页面数据集分别确定先决条件为设备表名时各页面文件链接的置信度、先决条件为设备表名和数据点名时各页面文件链接的置信度与先决条件为数据点名时各页面文件链接的置信度;其中,置信度反映了各元素(即设备表名、数据点名和图元类型)与页面文件链接的关系紧密度,用作页面文件链接分类结果选择的参考依据。
进一步地,当先决条件为设备表名时,假设设备表名为X,页面文件链接为Y,组态页面数据集中设备表名X在数据项中出现的概率为P(X),组态页面数据集中设备表名X和页面文件链接Y在数据项中同时出现的概率为P(XY),则先决条件为设备表名时各页面文件链接的置信度的计算公式为:
(1)
进一步地,先决条件为设备表名和数据点名时各页面文件链接的置信度、先决条件为数据点名时各页面文件链接的置信度的计算过程与上述先决条件为设备表名时各页面文件链接的置信度的计算过程相同。
S104、基于组态页面数据集构建页面类别预测模型,并将指令文本输入页面类别预测模型,生成分类页面文件链接。
S105、基于各页面文件链接对应的置信度将分类页面文件链接进行排序,选取置信度最高的预测页面文件链接作为定位页面。
具体地,打开置信度最高的预测页面文件链接,弹窗询问操作员该页面是否准确,若定位不准确则提示“请人工查找跳转到定位页面”,进行人工操作定位;否则操作员直接确认,结束过程。
进一步地,通过语音指令操控声控巡屏系统直接定位到操作指令所在页面,对于能量管理系统动辄十万点数据点、几十个操作页面来说,可以大大提高操作员下发指令前的检索时间,提升操作效率,降低掌握难度。
本实施例提出的一种能量管理端语音页面检索方法,通过构建组态页面数据集将页面检索问题转化为单标签多分类问题,并基于组态页面数据集确定各页面文件链接对应的置信度,利用置信度为页面文件链接分类结果的选择提供了参考依据,并且,利用页面类别预测模型实现了对页面文件链接的快速检索,减少了页面检索时间,提升了操作效率,降低了掌握难度,解决了大型能量管理端中页面检索速度慢、上手难的问题。
作为本发明一个可选实施方式,如图2所示,上述S104,即上述基于组态页面数据集构建页面类别预测模型,并将指令文本输入页面类别预测模型,生成分类页面文件链接,包括:
S1041、基于组态页面数据集构建编码矩阵,编码矩阵的行向量为组态页面数据集中的页面文件链接,所述编码矩阵的每一列向量为所述组态页面数据集中的任意两个不重复的页面文件链接。
具体地,采用一对一的方法构建包含M行(页面文件链接),N列(随机抽取两个页面文件链接作为一列)的编码矩阵,其中,N=M(M-1)/2,行向量为页面文件链接作为类别数,列向量为支持向量机二值分类器的个数,矩阵元素的取值为{1,-1};矩阵元素1代表一类,-1代表另一类。
S1042、利用所述组态页面数据集对多个支持向量机二值分类器进行训练,生成所述页面类别预测模型;其中支持向量机二值分类器的个数与编码矩阵的列数相同。
具体地,分别利用组态页面数据集中数据项作为输入,针对每两类页面链接,训练一个分辨该页面文件链接的支持向量机二值分类器,依次对N个支持向量机二值分类器进行训练,支持向量机二值分类器的个数与编码矩阵的列数相同,N个支持向量机二值分类器构成页面类别预测模型。
S1043、将指令文本进行拆分,生成指令四元组;其中,指令四元组为设备表名-数据点名-图元类型-操作。
S1044、将指令四元组输入页面类别预测模型中,生成分类页面文件链接。
作为本发明一个可选实施方式,如图3所示,上述S1044,即上述将指令四元组输入页面类别预测模型中,生成分类页面文件链接,包括:
S10441、将指令四元组输入页面类别预测模型中,生成第一类页面文件链接。
具体地,以指令四元组输入训练后的N个支持向量机二值分类器中,输出值构成编码向量,其中,h i(x)表示第i个支持向量机二值分类器的输出值,计算编码向量H(x)与编码矩阵的每一行对应的页面文件链接之间的汉明距离,选择最小汉明距离对应的页面文件链接作为分类页面文件链接。
S10442、将指令四元组中的设备表名和数据点名输入页面类别预测模型中,生成第二类页面文件链接。
具体地,将指令四元组中的设备表名和数据点名输入页面类别预测模型中,生成第二类页面文件链接的步骤与上述S10441中的步骤相同。
S10443、将指令四元组中的数据点名输入页面类别预测模型中,生成第三类页面文件链接。
具体地,将指令四元组中的数据点名输入页面类别预测模型中,生成第三类页面文件链接的步骤与上述S10441中的步骤相同。
作为本发明一个可选实施方式,如图4所示,上述S105,即上述基于各页面文件链接对应的置信度将分类页面文件链接进行排序,选取置信度最高的预测页面文件链接作为定位页面,包括:
S1051、基于先决条件为设备表名时各页面文件链接的置信度、先决条件为设备表名和数据点名时各页面文件链接的置信度与先决条件为数据点名时各页面文件链接的置信度分别确定第一类页面文件链接的置信度、第二类页面文件链接的置信度和第三类页面文件链接的置信度。
具体地,将第一类页面文件链接与先决条件为设备表名时各页面文件链接进行匹配,进而得到第一类页面文件链接的置信度,第二类页面文件链接的置信度和第三类页面文件链接的置信度的确定步骤与第一类页面文件链接的置信度的确定步骤相同。
S1052、将第一类页面文件链接的置信度、第二类页面文件链接的置信度和第三类页面文件链接的置信度进行排序。
S1053、基于排序结果选取置信度最高的分类页面文件链接作为定位页面。
进一步地,当第一类页面文件链接的置信度、第二类页面文件链接的置信度和第三类页面文件链接的置信度相同时,则采用投票原则确定定位页面。
下面通过一个具体的实施例来说明一种能量管理端语音页面检索方法。
实施例1:
以某能量管理系统为例,该系统中共5个组态页面,编号分别为1,2,3,4,5,则能量管理端语音页面检索方法的具体步骤如下:
(1)生成数据集:若编号1的组态页面的页面文件链接为:yuanjing/windTurbine_01.xml,其中存在一个遥测图元ID为5072,绑定数据点:远景1号风机(设备表名)-远景1号风机发电机转速(数据点名),则该图元生成的数据项为:(远景1号风机,远景1号风机发电机转速,遥测,yuanjing/windTurbine_01.xml)、(远景1号风机,远景1号风机发电机转速,yuanjing/windTurbine_01.xml)和(远景1号风机发电机转速,yuanjing/windTurbine_01.xml),将三者均加入训练数据集;同理,对所有组态页面中绑定数据点的图元生成三个数据项,并加入训练数据集,共同组成数据集。
(2)置信度计算:以(1)的数据项四元组(远景1号风机,远景1号风机发电机转速,遥测,yuanjing/windTurbine_01.xml)中设备表名“远景1号风机”为X,页面文件链接yuanjing/windTurbine_01.xml为Y。数据集共有数据项2000项,若X在数据项中出现的频数为200,X和Y在数据项中同时出现的频数为160,则P(XY)=200/2000=0.1,其中P(X)=160/2000=0.08;在先决条件X发生的条件下,由(X->Y)推出Y的概率P(Y)=0.08/0.1=0.8;同理,分别以“远景1号风机,远景1号风机发电机转速”、“远景1号风机发电机转速”为X,页面文件链接yuanjing/windTurbine_01.xml为Y,计算P(Y),假设两者均为0.6。
(3)模型构建与训练:采用一对一的方法构建包含5行,10列的编码矩阵C,矩阵元素的取值为{1,-1},编码矩阵C表格形式如下表1所示:
表1:
上表1中,f1-f10分别表示任意两类不重复的页面文件链接,例如,f1表示1号页面文件链接和2号页面文件链接,f2表示1号页面文件链接和3号页面文件链接,f3表示1号页面文件链接和4号页面文件链接,f4表示1号页面文件链接和5号页面文件链接,f5表示2号页面文件链接和3号页面文件链接,f6表示2号页面文件链接和4号页面文件链接,f7表示2号页面文件链接和5号页面文件链接,f8表示3号页面文件链接和4号页面文件链接,f9表示3号页面文件链接和5号页面文件链接,f10表示4号页面文件链接和5号页面文件链接。
利用训练集中数据项作为输入,针对每两类页面文件链接,训练一个分辨该页面文件链接的支持向量机二值分类器,依次对10个支持向量机二值分类器进行训练;例如:(远景1号风机,远景1号风机发电机转速,遥测)为输入,训练每两类页面链接的二值分类器。
(4)语音信息处理:操作员输入规范化语音操作指令:“远景1号风机,发电机转速,遥测,查看”,经语音识别转换为文本信息的指令文本,并拆分表示为(远景1号风机,发电机转速,遥测,查看)的指令四元组格式,作为后续步骤输入。
(5)类别识别:以指令四元组(远景1号风机,发电机转速,遥测,查看)的“远景1号风机”作为输入,采用训练后的10个分类器对测试集样本进行预测,输出值构成向量H(x)=[1,-1,1,1,-1,-1,-1,-1,-1,1],与编码矩阵C每一行做汉明距离计算,分别为:“2,6,8,4,4”,选择最小距离2对应的行作为预测类别,得到1号页面文件链接P E=yuanjing/windTurbine_01.xml;同理以“远景1号风机发电机转速”和“发电机转速”为输入得到分类页面文件链接P EP和P P,假设P EP为2号页面文件链接,P P为3号页面文件链接。
(6)选择比较页面:根据(2)的置信度对(5)的三个分类页面文件链接进行排序,序列为:P E、P EP、P P,输出置信度最高P E的1号页面文件链接yuanjing/windTurbine_01.xml。
(7)操作员确认:打开P E的页面文件链接,弹窗询问操作员该页面是否准确,操作员直接确认,结束过程。
本发明实施例还公开了一种能量管理端语音页面检索系统,如图5所示,包括:
识别转换模块51,用于采集语音操作指令,将语音操作指令进行语音识别转换,生成指令文本;详细内容参见上述方法实施例中S101的相关描述。
构建模块52,用于获取组态页面中绑定数据点的图元数据,基于绑定数据点的图元数据构建组态页面数据集;详细内容参见上述方法实施例中S102的相关描述。
确定模块53,用于基于组态页面数据集确定各页面文件链接对应的置信度;详细内容参见上述方法实施例中S103的相关描述。
生成模块54,用于基于组态页面数据集构建页面类别预测模型,并将指令文本输入页面类别预测模型,生成分类页面文件链接;详细内容参见上述方法实施例中S104的相关描述。
排序模块55,用于基于各页面文件链接对应的置信度将分类页面文件链接进行排序,选取置信度最高的预测页面文件链接作为定位页面;详细内容参见上述方法实施例中S105的相关描述。
本发明提供的一种能量管理端语音页面检索系统,通过构建组态页面数据集将页面检索问题转化为单标签多分类问题,并基于组态页面数据集确定各页面文件链接对应的置信度,利用置信度为页面文件链接分类结果的选择提供了参考依据,并且,利用页面类别预测模型实现了对页面文件链接的快速检索,减少了页面检索时间,提升了操作效率,降低了掌握难度,解决了大型能量管理端中页面检索速度慢、上手难的问题。
作为本发明一个可选实施方式,上述生成模块54,包括:
构建子模块,用于基于组态页面数据集构建编码矩阵,编码矩阵的行向量为组态页面数据集中的页面文件链接,编码矩阵的列向量为组态页面数据集中的任意两个页面文件链接;训练子模块,用于利用编码矩阵中的列向量对支持向量机二值分类器进行训练,生成页面类别预测模型;拆分子模块,用于将指令文本进行拆分,生成指令四元组;其中,指令四元组为设备表名-数据点名-图元类型-操作;生成子模块,用于将指令四元组输入页面类别预测模型中,生成分类页面文件链接。
作为本发明一个可选实施方式,上述生成子模块,包括:第一生成单元,用于将指令四元组中的设备表名输入页面类别预测模型中,生成第一类页面文件链接;第二生成单元,用于将指令四元组中的设备表名和数据点名输入页面类别预测模型中,生成第二类页面文件链接;第三生成单元,用于将指令四元组中的数据点名输入页面类别预测模型中,生成第三类页面文件链接。
作为本发明一个可选实施方式,上述排序模块55,包括:确定子模块,用于基于先决条件为设备表名时各页面文件链接的置信度、先决条件为设备表名和数据点名时各页面文件链接的置信度与先决条件为数据点名时各页面文件链接的置信度分别确定第一类页面文件链接的置信度、第二类页面文件链接的置信度和第三类页面文件链接的置信度;排序子模块,用于将第一类页面文件链接的置信度、第二类页面文件链接的置信度和第三类页面文件链接的置信度进行排序;选取子模块,用于基于排序结果选取置信度最高的分类页面文件链接作为定位页面。
另外,本发明实施例还提供了一种电子设备,如图6所示,该电子设备可以包括处理器110和存储器120,其中处理器110和存储器120可以通过总线或者其他方式连接,图6中以通过总线连接为例。此外,该电子设备中还包括至少一个接口130,该至少一个接口130可以是通信接口或其他接口,本实施例对此不做限制。
其中,处理器110可以为中央处理器(Central Processing Unit,CPU)。处理器110还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器120作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的视频合成方法对应的程序指令/模块。处理器110通过运行存储在存储器120中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的一种能量管理端语音页面检索方法。
存储器120可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器110所创建的数据等。此外,存储器120可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器120可选包括相对于处理器110远程设置的存储器,这些远程存储器可以通过网络连接至处理器110。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
另外,至少一个接口130用于电子设备与外部设备的通信,比如与服务器通信等。可选的,至少一个接口130还可以用于连接外设输入、输出设备,比如键盘、显示屏等。
所述一个或者多个模块存储在所述存储器120中,当被所述处理器110执行时,执行如图1所示实施例中的一种能量管理端语音页面检索方法。
上述电子设备具体细节可以对应参阅图1所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random AccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (5)
1.一种能量管理端语音页面检索方法,其特征在于,包括:
采集语音操作指令,将所述语音操作指令进行语音识别转换,生成指令文本;
获取组态页面中绑定数据点的图元数据,基于所述绑定数据点的图元数据构建组态页面数据集;
基于所述组态页面数据集确定各页面文件链接对应的置信度;其中,基于所述组态页面数据集分别确定先决条件为设备表名时各页面文件链接的置信度、先决条件为设备表名和数据点名时各页面文件链接的置信度与先决条件为数据点名时各页面文件链接的置信度;
基于所述组态页面数据集构建页面类别预测模型,并将所述指令文本输入所述页面类别预测模型,生成分类页面文件链接;
基于所述各页面文件链接对应的置信度将所述分类页面文件链接进行排序,选取置信度最高的预测页面文件链接作为定位页面;
所述基于所述组态页面数据集构建页面类别预测模型,并将所述指令文本输入所述页面类别预测模型,生成分类页面文件链接,包括:
基于所述组态页面数据集构建编码矩阵,所述编码矩阵的行向量为所述组态页面数据集中的页面文件链接,所述编码矩阵的每一列向量为所述组态页面数据集中的任意两个不重复的页面文件链接;
利用所述组态页面数据集对多个支持向量机二值分类器进行训练,生成所述页面类别预测模型;其中支持向量机二值分类器的个数与编码矩阵的列数相同;
将所述指令文本进行拆分,生成指令四元组;其中,所述指令四元组为设备表名-数据点名-图元类型-操作;
将所述指令四元组输入所述页面类别预测模型中,生成所述分类页面文件链接;
所述将所述指令四元组输入所述页面类别预测模型中,生成所述分类页面文件链接,包括:
将所述指令四元组中的设备表名输入所述页面类别预测模型中,生成第一类页面文件链接;
将所述指令四元组中的设备表名和数据点名输入所述页面类别预测模型中,生成第二类页面文件链接;
将所述指令四元组中的数据点名输入所述页面类别预测模型中,生成第三类页面文件链接;
所述基于所述各页面文件链接对应的置信度将所述分类页面文件链接进行排序,选取置信度最高的预测页面文件链接作为定位页面,包括:
基于所述先决条件为设备表名时各页面文件链接的置信度、所述先决条件为设备表名和数据点名时各页面文件链接的置信度与所述先决条件为数据点名时各页面文件链接的置信度分别确定第一类页面文件链接的置信度、第二类页面文件链接的置信度和第三类页面文件链接的置信度;
将所述第一类页面文件链接的置信度、所述第二类页面文件链接的置信度和所述第三类页面文件链接的置信度进行排序;
基于排序结果选取置信度最高的分类页面文件链接作为定位页面;
所述基于所述各页面文件链接对应的置信度将所述分类页面文件链接进行排序,选取置信度最高的预测页面文件链接作为定位页面,还包括:
当所述第一类页面文件链接的置信度、所述第二类页面文件链接的置信度和所述第三类页面文件链接的置信度相同时,则采用投票原则确定所述定位页面。
2.根据权利要求1所述的一种能量管理端语音页面检索方法,其特征在于,所述基于所述绑定数据点的图元数据构建组态页面数据集,包括:
基于所述绑定数据点的图元数据生成数据项,根据所述数据项构建所述组态页面数据集;其中,所述数据项包括设备表名-数据点名-图元类型-页面文件链接、设备表名-数据点名-页面文件链接和数据点名-页面文件链接。
3.一种能量管理端语音页面检索系统,其特征在于,包括:
识别转换模块,用于采集语音操作指令,将所述语音操作指令进行语音识别转换,生成指令文本;
构建模块,用于获取组态页面中绑定数据点的图元数据,基于所述绑定数据点的图元数据构建组态页面数据集;
确定模块,用于基于所述组态页面数据集确定各页面文件链接对应的置信度;其中,基于所述组态页面数据集分别确定先决条件为设备表名时各页面文件链接的置信度、先决条件为设备表名和数据点名时各页面文件链接的置信度与先决条件为数据点名时各页面文件链接的置信度;
生成模块,用于基于所述组态页面数据集构建页面类别预测模型,并将所述指令文本输入所述页面类别预测模型,生成分类页面文件链接;
排序模块,用于基于所述各页面文件链接对应的置信度将所述分类页面文件链接进行排序,选取置信度最高的预测页面文件链接作为定位页面;
所述生成模块,包括:
构建子模块,用于基于组态页面数据集构建编码矩阵,编码矩阵的行向量为组态页面数据集中的页面文件链接,编码矩阵的列向量为组态页面数据集中的任意两个页面文件链接;训练子模块,用于利用编码矩阵中的列向量对支持向量机二值分类器进行训练,生成页面类别预测模型;拆分子模块,用于将指令文本进行拆分,生成指令四元组;其中,指令四元组为设备表名-数据点名-图元类型-操作;生成子模块,用于将指令四元组输入页面类别预测模型中,生成分类页面文件链接;
所述生成子模块,包括:第一生成单元,用于将指令四元组中的设备表名输入页面类别预测模型中,生成第一类页面文件链接;第二生成单元,用于将指令四元组中的设备表名和数据点名输入页面类别预测模型中,生成第二类页面文件链接;第三生成单元,用于将指令四元组中的数据点名输入页面类别预测模型中,生成第三类页面文件链接;
所述排序模块,包括:确定子模块,用于基于先决条件为设备表名时各页面文件链接的置信度、先决条件为设备表名和数据点名时各页面文件链接的置信度与先决条件为数据点名时各页面文件链接的置信度分别确定第一类页面文件链接的置信度、第二类页面文件链接的置信度和第三类页面文件链接的置信度;排序子模块,用于将第一类页面文件链接的置信度、第二类页面文件链接的置信度和第三类页面文件链接的置信度进行排序;选取子模块,用于基于排序结果选取置信度最高的分类页面文件链接作为定位页面;
所述排序模块还用于当所述第一类页面文件链接的置信度、所述第二类页面文件链接的置信度和所述第三类页面文件链接的置信度相同时,则采用投票原则确定所述定位页面。
4.一种电子设备,其特征在于,包括处理器和存储器,所述存储器与所述处理器耦合;
所述存储器上存储有计算机可读程序指令,当所述指令被所述处理器执行时,实现如权利要求1至2任一项所述的方法。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至2中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310778387.2A CN116501915B (zh) | 2023-06-29 | 2023-06-29 | 一种能量管理端语音页面检索方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310778387.2A CN116501915B (zh) | 2023-06-29 | 2023-06-29 | 一种能量管理端语音页面检索方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116501915A CN116501915A (zh) | 2023-07-28 |
CN116501915B true CN116501915B (zh) | 2023-10-20 |
Family
ID=87317039
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310778387.2A Active CN116501915B (zh) | 2023-06-29 | 2023-06-29 | 一种能量管理端语音页面检索方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116501915B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112417166A (zh) * | 2020-11-20 | 2021-02-26 | 山东省计算中心(国家超级计算济南中心) | 一种知识图谱三元组置信度评价方法 |
US11011160B1 (en) * | 2017-01-17 | 2021-05-18 | Open Water Development Llc | Computerized system for transforming recorded speech into a derived expression of intent from the recorded speech |
CN114978624A (zh) * | 2022-05-09 | 2022-08-30 | 深圳大学 | 钓鱼网页检测方法、装置、设备及存储介质 |
CN115204179A (zh) * | 2022-05-20 | 2022-10-18 | 国家电网有限公司大数据中心 | 基于电网公共数据模型的实体关系预测的方法及装置 |
WO2022271369A1 (en) * | 2021-06-25 | 2022-12-29 | Microsoft Technology Licensing, Llc | Training of an object linking model |
CN115662431A (zh) * | 2022-09-07 | 2023-01-31 | 北海淇诚信息科技有限公司 | 采用高泛化多任务意图识别的语音机器人通话方法及装置 |
CN115688879A (zh) * | 2022-10-21 | 2023-02-03 | 中电智恒信息科技服务有限公司 | 一种基于知识图谱的智能客服语音处理系统及方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8612364B2 (en) * | 2009-10-29 | 2013-12-17 | Xerox Corporation | Method for categorizing linked documents by co-trained label expansion |
-
2023
- 2023-06-29 CN CN202310778387.2A patent/CN116501915B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11011160B1 (en) * | 2017-01-17 | 2021-05-18 | Open Water Development Llc | Computerized system for transforming recorded speech into a derived expression of intent from the recorded speech |
CN112417166A (zh) * | 2020-11-20 | 2021-02-26 | 山东省计算中心(国家超级计算济南中心) | 一种知识图谱三元组置信度评价方法 |
WO2022271369A1 (en) * | 2021-06-25 | 2022-12-29 | Microsoft Technology Licensing, Llc | Training of an object linking model |
CN114978624A (zh) * | 2022-05-09 | 2022-08-30 | 深圳大学 | 钓鱼网页检测方法、装置、设备及存储介质 |
CN115204179A (zh) * | 2022-05-20 | 2022-10-18 | 国家电网有限公司大数据中心 | 基于电网公共数据模型的实体关系预测的方法及装置 |
CN115662431A (zh) * | 2022-09-07 | 2023-01-31 | 北海淇诚信息科技有限公司 | 采用高泛化多任务意图识别的语音机器人通话方法及装置 |
CN115688879A (zh) * | 2022-10-21 | 2023-02-03 | 中电智恒信息科技服务有限公司 | 一种基于知识图谱的智能客服语音处理系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116501915A (zh) | 2023-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111177095A (zh) | 日志分析方法、装置、计算机设备及存储介质 | |
CN111522704A (zh) | 告警信息处理方法、装置、计算机装置及存储介质 | |
CN110703057B (zh) | 基于数据增强和神经网络的电力设备局部放电诊断方法 | |
CN111368636A (zh) | 目标分类方法、装置、计算机设备和存储介质 | |
CN113111578B (zh) | 电力负荷预测方法、装置、计算机设备及存储介质 | |
CN110691003A (zh) | 一种网络流量分类方法、装置和存储介质 | |
CN109542737A (zh) | 平台告警处理方法、装置、电子装置及存储介质 | |
CN114151293B (zh) | 风机变桨系统的故障预警方法、系统、设备及存储介质 | |
CN111898247A (zh) | 滑坡位移预测方法、设备及存储介质 | |
CN111784401A (zh) | 下单率预测方法、装置、设备及可读存储介质 | |
CN114996936A (zh) | 设备运维方法、设备运维装置、设备运维设备及存储介质 | |
CN116501915B (zh) | 一种能量管理端语音页面检索方法及系统 | |
US11003960B2 (en) | Efficient incident management in large scale computer systems | |
CN113313134A (zh) | 集群故障修复方法及其模型训练方法、装置及服务器 | |
CN111613219A (zh) | 语音数据识别方法、设备及介质 | |
CN116257455A (zh) | 一种模糊测试用例的生成方法、装置、设备及存储介质 | |
CN115348551A (zh) | 一种轻量化业务识别方法、装置、电子设备及存储介质 | |
CN114821309A (zh) | 一种室内变电站开关及指示灯状态识别方法及系统 | |
Firos et al. | Fault Detection in Power Transmission Lines Using AI Model | |
KR102418541B1 (ko) | 와이어 번들 생산 방법 및 장치 | |
CN114064900A (zh) | 一种配电自动化终端故障诊断方法、装置、设备及存储介质 | |
CN112836346A (zh) | 基于cn和pca的电机故障诊断方法、电子设备及介质 | |
CN109992712B (zh) | 数据处理方法、装置、介质和计算设备 | |
CN110442692A (zh) | 一种用于问题派单及其训练的方法和装置 | |
CN117725402B (zh) | 一种基于设备运行音频的设备异常状态确定方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |