CN113609264A - 电力系统节点的数据查询方法、装置 - Google Patents
电力系统节点的数据查询方法、装置 Download PDFInfo
- Publication number
- CN113609264A CN113609264A CN202110721849.8A CN202110721849A CN113609264A CN 113609264 A CN113609264 A CN 113609264A CN 202110721849 A CN202110721849 A CN 202110721849A CN 113609264 A CN113609264 A CN 113609264A
- Authority
- CN
- China
- Prior art keywords
- determining
- similarity
- preset
- power supply
- supply station
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012423 maintenance Methods 0.000 claims abstract description 33
- 239000013598 vector Substances 0.000 claims description 89
- 238000012549 training Methods 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 13
- 238000003860 storage Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 description 31
- 238000004422 calculation algorithm Methods 0.000 description 22
- 238000004458 analytical method Methods 0.000 description 16
- 238000009826 distribution Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 12
- 238000013528 artificial neural network Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 230000002452 interceptive effect Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 230000008030 elimination Effects 0.000 description 4
- 238000003379 elimination reaction Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 4
- 238000007619 statistical method Methods 0.000 description 4
- 230000001629 suppression Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000002411 adverse Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Human Resources & Organizations (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种电力系统节点的数据查询方法、装置。其中,该方法包括:获取拾音设备采集的目标音频;确定目标音频的语义信息,其中,语义信息中至少包含查询指令,查询指令用于确定为目标对象供电的电网中各个供电站节点的名称,以及查询供电站节点的供电站节点状态;确定预设知识图谱中与名称和查询指令对应的相关实体和相关关系;在预设知识图谱中,确定与实体之间的关系为相关关系的实体,记为目标实体;依据目标实体,生成并输出回复信息。本发明解决了由于现有技术对运维人员的运行经验依赖性较强造成的非专业人员不能及时确定电力系统节点的数据的技术问题。
Description
技术领域
本发明涉及自然语言处理领域,具体而言,涉及一种电力系统节点的数据查询方法、装置。
背景技术
为了更好的应对重大活动供电保障需求,大型重要保电工作通常会进行协同化电力保障系统建设,充分借助现代信息手段,建立一套覆盖各专业和单位的智能系统,实现全程统一指挥、在线监控、数据共享、快速响应和协同处置。随着智能电网的高速发展,当前的供电保障电力指挥系统具备以下功能:保电信息汇集、集成和可视化展示功能;管理体系实时通信管控功能;现场监控及指挥调度功能;资源优化管理调配功能;质量监控和评价分析功能。由于系统功能繁多,统合性高,专业性强,并且日常巡视以运维人员手动操作的模式为主,因此对运维人员的运行经验依赖性较强,不能避免由于人为因素带来的安全操作困扰,系统主动响应的速度较慢,影响重大活动保障期间的分析决策效率。并且现有技术中的三维GIS模型过大,界面复杂,人工查找效率较低,对人员经验依赖性强。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种电力系统节点的数据查询方法、装置,以至少解决由于现有技术对运维人员的运行经验依赖性较强造成的非专业人员不能及时确定电力系统节点的数据的技术问题。
根据本发明实施例的一个方面,提供了一种电力系统节点的数据查询方法,包括:获取拾音设备采集的目标音频;确定目标音频的语义信息,其中,语义信息中至少包含查询指令,查询指令用于确定为目标对象供电的电网中各个供电站节点的名称,以及查询供电站节点的供电站节点状态;确定预设知识图谱中与名称和查询指令对应的相关实体和相关关系,其中,预设知识图谱由实体和实体间的关系组成,实体和实体间的关系至少用于表示电网中各个供电站节点的连接关系,各个供电站节点的运行状态以及维护信息;在预设知识图谱中,确定与实体之间的关系为相关关系的实体,记为目标实体;依据目标实体,生成并输出回复信息。
可选地,确定目标音频的语义信息,包括:将目标音频输入至语义识别模型至进行分析,得到语义信息,其中,语义识别模型是通过多组数据训练得到的,每组数据中均包括:样本音频数据和与样本音频数据对应的语义信息。
可选地,将目标音频输入至语义识别模型至进行分析之前,方法还包括:将目标音频转化为特征向量;依据特征向量,确定与目标音频对应的发音序列,其中,发音序列由多个音素组成;依据发音序列,确定与目标音频对应的文字序列,其中,将文字序列作为语义识别模型的输入。
可选地,确定预设知识图谱中与名称和查询指令对应的相关实体和相关关系,包括:确定语义信息中的关键词,其中,关键词至少包含查询指令;依据关键词,确定文字序列和预设数据库中的预设文字序列的第一相似度;获取文字序列的句向量,确定句向量和预设文字序列的句向量的第二相似度;依据第一相似度和第二相似度,确定最终相似度;当最终相似度不小于预设阈值时,确定预设文字序列的预设关键词,并依据预设关键词确定预设知识图谱中的目标实体。
可选地,确定文字序列和预设数据库中的预设文字序列的第一相似度和确定句向量和预设文字序列的第二相似度,包括:依据关键词,计算文字序列和预设数据库中的每个预设文字序列的相似度,并确定最大的相似度为第一相似度;确定句向量和预设数据库中的每个预设文字序列的句向量的相似度,并确定最大的相似度为第二相似度。
可选地,依据目标实体,生成并输出回复信息,包括:确定与目标实体关联的数据库,并输出数据库中的信息,其中,数据库用于存储回复信息;将回复信息发送至拼接屏系统,以在拼接屏系统展示回复信息。
可选地,各个供电站节点的运行状态至少包括供电站节点自身的运行状态和外部环境状态,各个供电站节点的维护信息至少包括维护团队信息和维护时间信息。根据本发明实施例的另一方面,还提供了一种电力系统节点的数据查询装置,包括:拾音模块,拾音模块用于获取拾音设备采集的目标音频;提取模块,提取模块用于确定目标音频的语义信息,其中,语义信息中至少包含查询指令,查询指令用于确定为目标对象供电的电网中各个供电站节点的名称,以及查询供电站节点的供电站节点状态;处理模块,处理模块用于确定预设知识图谱中与名称和查询指令对应的相关实体和相关关系,其中,预设知识图谱由实体和实体间的关系组成,实体和实体间的关系至少用于表示电网中各个供电站节点的连接关系,各个供电站节点的运行状态以及维护信息;确定模块,确定模块用于在预设知识图谱中,确定与实体之间的关系为相关关系的实体,记为目标实体;输出模块,输出模块用于依据目标实体,生成并输出回复信息。
根据本发明实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备执行电力系统节点的数据查询方法。
根据本发明实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行电力系统节点的数据查询方法。
在本发明实施例中,采用获取拾音设备采集的目标音频;确定目标音频的语义信息,其中,语义信息中至少包含查询指令,查询指令用于确定为目标对象供电的电网中各个供电站节点的名称,以及查询供电站节点的供电站节点状态;确定预设知识图谱中与名称和查询指令对应的相关实体和相关关系,其中,预设知识图谱由实体和实体间的关系组成,实体和实体间的关系至少用于表示电网中各个供电站节点的连接关系,各个供电站节点的运行状态以及维护信息;在预设知识图谱中,确定与实体之间的关系为相关关系的实体,记为目标实体;依据目标实体,生成并输出回复信息的方式,通过分析目标音频的语义信息,达到了查询电力系统节点的数据的目的,从而实现了非本专业人员也可以快速确定电力系统节点的数据的技术效果,进而解决了由于现有技术对运维人员的运行经验依赖性较强造成的非专业人员不能及时确定电力系统节点的数据技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种电力系统节点的数据查询方法的流程示意图;
图2是根据本发明实施例的一种运维人员查询电力系统节点数据的示意图;
图3是根据本发明实施例的一种语音交互系统的音频处理流程图;
图4是根据本发明实施例的一种电力系统节点的数据查询装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,提供了一种电力系统节点的数据查询方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的电力系统节点的数据查询方法,如图1所示,该方法包括如下步骤:
步骤S102,获取拾音设备采集的目标音频;
在本申请的一些实施例中,上述拾音设备可以是终端中的麦克风。
在本申请的一些实施例中,由于运维人员查询电力系统节点数据时通常处于较复杂的场景下,即远场条件。这种情况下,麦克风接收信号除了目标信号的直达声外,还包括目标信号的混响声、噪声和其它干扰信号,对于带播报功能的设备还包括其本身播放的自噪声信号(音乐、TTS等)。除了目标信号外,麦克风接收到的其它信号成分均会给语音识别带来非常不利的影响,因此,需要消除目标音频中的无关噪声,仅保留目标信号,以提升复杂场景下的语音识别率。
步骤S104,确定目标音频的语义信息,其中,所述语义信息中至少包含查询指令,所述查询指令用于确定为目标对象供电的电网中各个供电站节点的名称,以及查询所述供电站节点的供电站节点状态;
具体地,为了保证某个场馆的供电,在电网中需要多个供电站点对其提供供电保障,例如,供电站节点A、供电站节点B、供电站节点C、供电站节点D,而要实现稳定供电,需要对各个供电站节点的运行状态进行监控。为了便于工作人员对运行状态的监控查询,其可以通过语音的方式去查询相应的供电站节点的状态,例如,在查询供电站节点A的运行状态时,工作人员发出语音“查询供电站节点A的运行状态”,则终端采集上述语音信息,并依据所述查询指令确定知识图谱中的目标节点,然后调动存储在与目标节点关联的数据库中的回复信息,在显示屏上向工作人员展示,同时生成语音提示信息。
上述目标对象可以是举行重大活动的场馆,如举办某项体育赛事的体育馆等。
在本申请的一些实施例中,在确定所述目标音频的语义信息之前,还需要将目标音频输入至语义识别模型进行分析,得到所述语义信息,其中,所述语义识别模型是通过多组数据训练得到的,每组数据中均包括:保电领域的样本音频数据和与所述样本音频数据对应的保电领域的语义信息。
可选地,为了便于对目标音频进行处理,将所述目标音频输入至语义识别模型至进行分析之前,还需要:将所述目标音频转化为特征向量;依据所述特征向量,确定与所述目标音频对应的发音序列,其中,所述发音序列由多个音素组成;依据所述发音序列,确定与所述目标音频对应的文字序列,其中,将所述文字序列作为所述语义识别模型的输入。
在本申请的一些实施例中,确定预设知识图谱中与所述名称和所述查询指令对应的相关实体和相关关系的方法如下:确定所述语义信息中的关键词,其中,所述关键词至少包含所述名称和所述查询指令;依据所述关键词,确定所述文字序列和预设数据库中的预设文字序列的第一相似度;获取所述文字序列的句向量,确定所述句向量和所述预设文字序列的句向量的第二相似度;依据所述第一相似度和所述第二相似度,确定最终相似度;当所述最终相似度不小于预设阈值时,确定所述预设文字序列的预设关键词,并依据所述预设关键词确定所述预设知识图谱中的所述目标实体。其中,在确定最终相似度时,可以采用多种方式确定,例如,将所述第一相似度和所述第二相似度的乘积作为最终相似度,或者,将第一相似度和第二相似度之和作为最终相似度。
可选地,确定所述文字序列和预设数据库中的预设文字序列的第一相似度和确定所述句向量和所述预设文字序列的第二相似度,包括:依据所述关键词,计算所述文字序列和所述预设数据库中的每个预设文字序列的相似度,并确定最大的相似度为所述第一相似度;确定所述句向量和所述预设数据库中的每个预设文字序列的句向量的相似度,并确定最大的相似度为所述第二相似度。
具体地,计算第一相似度的公式如下:
其中,P为预设文字序列,Q为输入的文字序列。其中,|P∩Q|的含义为文字序列Q和文字序列P中相同的关键词的数量,|P∪Q|的含义为文字序列P和文字序列Q中所包含的全部关键词的数量,并且,若某个关键词在文字序列P和文字序列Q中均出现,则该关键词的数量只统计一次。
在本申请的一些实施例中,计算第二相似度的方法为将输入的文字序列转换为句向量,再来计算输入的文字序列对应的句向量和预设文字序列对应的句向量的余弦相似度。
在本申请的一些实施例中,在计算第一相似度和第二相似度之前,还可以将输入的文字序列中与某个具体的实体名称对应的关键词替换为与该类实体的类别名称对应的关键词,例如,文字序列中有具体的站点名称“变电站A”,则在计算相似度之前,可以将具体的站点名称“变电站A”替换为与变电站这一类站点对应的“变电站”。
可以理解的,此时对应的预设文字序列中的关键词也是与某类实体的类别名称对应的关键词,以及与实体间的关系对应的关键词。
通过上述在计算相似度前,将输入的文字序列中与某个具体的实体名称对应的关键词替换为与该类实体的类别名称对应的关键词,并且预设的文字序列中的关键词也是与某类实体的类别名称对应的关键词,以及与实体间的关系对应的关键词的方法,可以快速确定与输入的文字序列对应的问题模板,也就是能够更快速的确定与获取的运维人员的音频信息对应的问题模板,然后将之前被替换的关键词填入到对应的问题模板中,例如,将“变电站A”填入到问题模板中,得到完整的查询问题,该查询问题可以认为是被调整为便于语义识别模型进行语义识别的预设格式的输入文字序列,且该查询问题的语义信息中也包含有上文中所说的查询指令,即可以从该查询问题的语义信息中确定相关实体和相关关系,进而在知识图谱中确定与所述相关实体之间的关系为相关关系的目标实体。
在本申请的一些实施例中,拾音设备采集到目标音频后,可以通过如图3所示的语音识别系统来实现确定目标音频的语义信息。
如图3所示,完整的语音识别系统结构主要分为前端和后端两个模块。前端主要是对语音信号进行处理,提取所需的特征来训练模型或者测试。后端包括声学模型、语言模型和解码器部分。经过前端处理后的语音数据,在后端进一步处理可以得到识别结果,即文本数据。最后将文本数据经过自然语言理解步骤,转化为机器能够识别的结果,从而完成确定目标音频的语义信息。
在本申请的一些实施例中,前端模块主要的功能包括回声消除、混响消除、声源定位、波束形成,以实现对麦克风接收信号中的自噪声消除、噪声干扰抑制,提高输出目标语音的信号质量,最终达到提升语音识别率的目的。
具体地,前端信号处理流程大致如下:首先对麦克风接收的目标音频通过回声消除算法将设备自噪声消除,随后由混响消除算法抑制信号成分中的晚期混响,最后由声源定位与波束形成相结合完成对噪声干扰的抑制,对目标语音信号进行增强,将增强后的信号输入至识别系统进行识别。
可选地,在对目标音频进行语音识别前,还需要用信号处理手段将原始语音波形信号转换成特征矢量,常用特征有梅尔频率倒谱系数(Mel-frequency CepstrumCoefficients,MFCC),感知线性预测(Perceptual Linear Prediction,PLP),梅尔标度滤波器组(Mel-scale Filter Bank,fbank)等。
在本申请的一些实施例中,如图3所示,还需要通过声学模型和语言模型来对目标音频的特征矢量进行处理,才能得到识别结果。
其中,声学模型是把语音转化为声学表示的输出,即找到给定的语音源于某个声学符号的概率。对于声学符号,最直接的表达方式是词组,但是在训练数据量不充分的情况下,很难得到一个好的模型。词组是由多个音素的连续发音构成,另外,音素不但有清晰的定义而且数量有限。因而,在语音识别中,通常把声学模型转换成了一个语音序列到发音序列(音素)的模型和一个发音序列到输出文字序列的字典。语言模型可以对一段文本的概率进行估计,对信息检索,机器翻译,语音识别等任务有着重要的作用。语言模型分为统计语言模型和神经网络语言模型。现在主流的语言模型主要是N元文法(N-Gram)[28]和基于神经网络的循环神经网络-长短期记忆(Recurrent Neural Network with Long Short-TermMemory,RNN-LSTM)语音模型。
需要注意的是,由于人类发声器官运动的连续性,以及某些语言中特定的拼读习惯,会导致音素的发音受到前后音素的影响。为了对不同语境的音素加以区分,通常使用能够考虑前后各一个音素的三音子作为建模单元。
另外,在声学模型中,可以把三音子分解为更小的颗粒—状态,通常一个三音子对应3个状态,但是这会引起建模参数的指数增长,常用的解决方案是使用决策树先对这些三音子模型进行聚类,然后使用聚类的结果作为分类目标。
在本申请的一些实施例中,语音识别最终的分类目标可以是状态。最常用的声学建模方式是隐马尔科夫模型(HMM)。在HMM下,状态是隐变量,语音是观测值,状态之间的跳转符合马尔科夫假设。其中,状态转移概率密度多采用几何分布建模,而拟合隐变量到观测值的观测概率的模型常用高斯混合模型(GMM)。基于深度学习的发展,深度神经网络(DNN)、卷积神经网络(CNN)、循环神经网络(RNN)等模型被应用到观测概率的建模中,并取得了非常好的效果。
在本申请的一些实施例中,智能语音识别的识别结果一系列离散的无关联的概念节点,在本体关联计算中,可以将无关联的本体用语义关联(关系)进行连接。语义关联是语义数据模型中实体之间二维关系的知识表示形式,即实体之间的复杂关系。关联挖掘,即从一个或多个数据集中查找存在于对象集合之间的频繁模式、关联、相关性结构,进而描述对象的某个或某类属性同时出现的规律和模式之间的隐藏关系。在本申请的一些实施例中,可以采用以下几种方式来确定目标音频的语义。
1POS-CBOW语言模型
POS-CBOW是一种无监督的机器学习算法,是一种基于词向量表示的语言模型,能够深层次的挖掘文本中的语言学规律和词的语义关系。该方法综合了词性、词的分布特点,采用Word2vec改进模型,对情报语料进行训练,自动提取出语义关联关系。为了完成无监督的、自动化的语义分析任务,本项目利用POS-CBOW语言模型对以构建好的语义语料进行深度学习。
(1)POS-CBOW语言模型的过滤层
文本通常会加入一些符号来辅助情感的表达。这些附加信息虽然具有一定含义,但在本文的实际工作中,它改变了训练语料的正常语句结构,对训练模型产生了干扰。又因为短文本这一特点,使得这些符号在语句中占据相对较大权重,而这对于传统的长文本分析算法来说是无法处理的难题。
POS-CBOW语言模型的过滤层介于输入层和投影层之间,使用整理的微博文本停用词表对训练语料进行语句修正,从而达到优化词向量空间的目的。过滤层处理基本步骤如下:
步骤1:初始化哈希表Vocab,初始值为-1;
步骤2:循环读取训练语料句子的词,计算哈希值,并以哈希值为下标,Vocab[h]=1;
步骤3:初始化过滤层Filter,大小为停用词表个数,循环读取停用词,并计算通用词哈希值,记录到过滤层Filter表;
步骤4:遍历读取Filter表值每项的值h,并查询Vocab[h]是否等于1,等于1则将Vocab[h]=-1,否则循环继续,直到Filter遍历完毕,过滤完毕;
(2)POS-CBOW语言模型的词性标注层
CBOW语言模型是一种概率模型,通过将语料中的词的上下文信息生成相应的词向量映射到高维空间中,然后以词向量在高维空间中的关系来计算词与词之间的相似度。这样虽然提高了训练效率,加快了计算速度,但是,同时忽略了上下文信息中一些不符合相似词定义的词向量。
为了排除伪相似词的干扰,得到更加准确的相似词结果,引入了词性标注层。
POS-CBOW语言模型的词性标注层介于投影层和输出层之间,通过中文分词工具NLPIR对生成词向量进行词性标注,所用词性为计算所汉语词性标记集。针对词的多词性的这一性质,对词语的词性建立了词性体系,目的是为相似词计算提供词性参考体系,以便得出更加完善的相似词集。词性体系的构造步骤如下:
步骤1:以R为根节点,创建以R为根节点的所有子节点;
步骤2:以上一级子节点为根节点,创建相应节点下的子节点;
步骤3:查看上一级节点是否有子节点,如果有,重复步骤2,否则树构造完毕。
2基于POS-CBOW语言模型的语义关联算法
POS-CBOW语言模型生成的词向量不仅包含潜在的语义关系,还包含着语法关系。语法关系的加入完善了语义关系的不足。在相似词计算中以余弦相似度为计算方式,以语法关系为计算准则,进行词向量的相似性计算。例如,计算词向量“两栖攻击舰”的相似词,计算模型将会查找与词向量“两栖攻击舰”同在一个父类词性下的词,再计算词向量的余弦相似度,从而得到两个词向量的相似度。其中考虑到新词的问题,我们把未知词性的词也加入了我们的结果集。本文中采用了两种择优算法,一是TopN算法,选择N个最优结果;二是通过建立统计模型,选出最优结果集。
(1)TopN词向量计算
TopN算法是择优的经典算法之一,通过排名得出前N个最优项作为结果。本文在相似词的计算中利用了TopN的思想,通过结合余弦相似度和词性信息两个条件,对整个词向量空间遍历计算后,对相似词进行排序,选出前N个词作为结果集。TopN个相似词计算的基本步骤:
步骤1:取词向量空间第i个词向量Vi,在词性体系中查找Vi的父类词性,如果与W为同一父类词性或为“un”,进入步骤2,否则,查看向量空间是否遍历完,是则结束计算,否,重复1操作;
步骤2:计算余弦相似度Sim(W,V)=WV(|W|·|V|),如果Sim(W,V)<0,返回步骤1,否则倒叙遍历Set集合,比较相似度值,如果小于Sim(W,V),将该位置后值后移,插入V到该位置。重复步骤1。
通过在TopN算法中加入词性分析,使在同一词性体系的词聚集在一起,而不同词性的词向量则被排除在外。
(2)词向量的统计分析模型
TopN算法中相似词的计算结果往往受到N值得限定的,从而导致一些较优的词向量的丢失。为了能够更加充分的获取最优结果集,本文给出了另一种相似词计算方法,采用了一种动态阈值的统计分析模型,来选出结果集。
首先,计算出余弦相似度大于0的所有词向量,获取相似度集合,计算集合的三阶标准化矩,统计分析出相似度值得概率分布,如上图所示。根据相似度集合的偏度,得出词向量相似度值的整体分布情况。如果词向量相似度集合为正偏态,阈值设为集合的平均数,即结果集合为平均数的右侧部分,如果集合偏度为负偏度,那么阈值就选择集合的中位数,即结果集合为中位数的右侧部分,如下表1为Set集合概率分布及阈值选取。
表1 Set集合概率分布及阈值选取
偏度 | 分布状态 | 阈值 |
<0 | 平均数﹤中位数﹤众数 | 平均数 |
>0 | 众数<中位数<平均数 | 中位数 |
=0 | 平均数=中位数 | 平均数或中位数 |
基于POS-CBOW的语言模型,完成对各种信息的语句修正和词性标注层等工作,进而以空间向量的余弦值和向量的词性比较为条件,再计算词的相似性。该方法在各类语义分析中有较高的准确率。
步骤S106,确定预设知识图谱中与名称和查询指令对应的相关实体和相关关系,其中,所述预设知识图谱由实体和实体间的关系组成,所述实体和所述实体间的关系至少用于表示所述电网中各个供电站节点的连接关系,各个供电站节点的运行状态以及维护信息;
在本申请的一些实施例中,所述各个供电站节点的运行状态至少包括供电站节点自身的运行状态和外部环境状态,所述各个供电站节点的维护信息至少包括维护团队信息和维护时间信息。
具体地,上述运行状态信息包括以下至少之一:每个节点的三相电流、电压信息以及功率信息等。
步骤S108,在预设知识图谱中,确定与实体之间的关系为相关关系的实体,记为目标实体;
例如,如图2所示,当运维人员希望查询的是A站的运行情况时,上述相关实体即为“A站”,上述相关关系即为“运行情况”,对应的目标实体即为“A站运行情况”。
步骤S110,依据目标实体,生成并输出回复信息。
在本申请的一些实施例中,在确定了目标实体后,依据目标实体,生成并输出回复信息的具体生成过程如下:
确定与所述目标实体关联的数据库,并输出所述数据库中的信息,其中,所述数据库用于存储所述回复信息,然后将所述回复信息发送至拼接屏系统,以在所述拼接屏系统展示所述回复信息。
其中,所述拼接屏系统为多块屏幕拼接的系统,通过多块屏幕的协同展示同一供电站节点的回复信息,这样,由于扩大了回复信息的展示面积,可以提升用户体验。在另一些可选的实施例中,由于上述拼接屏系统是由多个屏幕组成的,并且,供电站节点也是多个,因此,可以将多个屏幕依据供电站节点的数量进行分组,例如,每个供电站节点对应其中的一个分组,每个分组中包含一个或多个屏幕。这样可以同时展示多个供电站节点的运行状况。
例如,如图2所示,当运维人员通过拾音设备(即交互机器人)发出查询指令后,拾音设备会获取目标音频,并将目标音频发送至云端的预设模型中,其中,所述预设模型包括语音识别模型和保电领域的知识图谱。云端的预设模型会识别目标音频的语义,并依据语义确定对应的目标实体,然后调用相关的数据并展示在大屏幕中,同时交互机器人会发出语音提示信息。
通过上述步骤,可以实现基于智能语音的指挥平台人机交互,采用先进的语音全链路交互技术,包含交互机器人上的降噪拾音、声源定位功能,云端的语音识别、语义理解、语音合成等技术,结合针对保电领域词汇训练的专有模型,可以做到较好的保电领域指令识别及理解能力,结合保电业务数据,能够让指挥人员通过语音指令快速直达要查询的目标信息。通过对语音指令进行语义分析和语义相似度计算,对信息汇聚形成的信息集进行精准推荐。
实施例2
根据本发明实施例,提供了一种如图4所示的电力系统节点的数据查询装置的装置实施例。
如图4所示,电力系统节点的数据查询装置,包括:拾音模块40,拾音模块用于获取拾音设备采集的目标音频;提取模块42,提取模块用于确定目标音频的语义信息,其中,语义信息中至少包含查询指令,查询指令用于确定为目标对象供电的电网中各个供电站节点的名称,以及查询供电站节点的供电站节点状态;处理模块44,处理模块用于确定预设知识图谱中与名称和查询指令对应的相关实体和相关关系,其中,预设知识图谱由实体和实体间的关系组成,实体和实体间的关系至少用于表示电网中各个供电站节点的连接关系,各个供电站节点的运行状态以及维护信息;确定模块46,确定模块用于在预设知识图谱中,确定与实体之间的关系为相关关系的实体,记为目标实体;输出模块48,输出模块用于依据目标实体,生成并输出回复信息。
在本申请的一些实施例中,所述各个供电站节点的运行状态至少包括供电站节点自身的运行状态和外部环境状态,所述各个供电站节点的维护信息至少包括维护团队信息和维护时间信息。
在本申请的一些实施例中,在确定了目标实体后,依据目标实体,生成并输出回复信息的方法为确定与所述目标实体关联的数据库,并输出所述数据库中的信息,其中,所述数据库用于存放所述回复信息,然后将所述回复信息发送至拼接屏系统,以在所述拼接屏系统展示所述回复信息。
例如,如图2所示,当运维人员通过拾音设备(即交互机器人)发出查询指令后,拾音设备会获取目标音频,并将目标音频发送至云端的预设模型中,其中,所述预设模型包括语音识别模型和保电领域的知识图谱。云端的预设模型会识别目标音频的语义,并依据语义确定对应的目标实体,然后调用相关的数据并展示在大屏幕中。
在本申请的一些实施例中,由于运维人员查询电力系统节点数据时通常处于较复杂的场景下,即远场条件。这种情况下,拾音模块40接收信号除了目标信号的直达声外,还包括目标信号的混响声、噪声和其它干扰信号,对于带播报功能的设备还包括其本身播放的自噪声信号(音乐、TTS等)。除了目标信号外,麦克风接收到的其它信号成分均会给语音识别带来非常不利的影响,因此,需要消除目标音频中的无关噪声,仅保留目标信号,以提升复杂场景下的语音识别率。
在本申请的一些实施例中,上述提取模块40的工作流程如下:
在本申请的一些实施例中,在确定所述目标音频的语义信息之前,还需要将目标音频输入至语义识别模型进行分析,得到所述语义信息,其中,所述语义识别模型是通过多组数据训练得到的,每组数据中均包括:样本音频数据和与所述样本音频数据对应的语义信息。
可选地,为了便于对目标音频进行处理,将所述目标音频输入至语义识别模型至进行分析之前,还需要:将所述目标音频转化为特征向量;依据所述特征向量,确定与所述目标音频对应的发音序列,其中,所述发音序列由多个音素组成;依据所述发音序列,确定与所述目标音频对应的文字序列,其中,将所述文字序列作为所述语义识别模型的输入。
在本申请的一些实施例中,确定预设知识图谱中与所述名称和所述查询指令对应的相关实体和相关关系的方法如下:确定所述语义信息中的关键词,其中,所述关键词至少包含所述名称和所述查询指令;依据所述关键词,确定所述文字序列和预设数据库中的预设文字序列的第一相似度;获取所述文字序列的句向量,确定所述句向量和所述预设文字序列的句向量的第二相似度;依据所述第一相似度和所述第二相似度,确定最终相似度,其中,所述最终相似度等于所述第一相似度和所述第二相似度的乘积;当所述最终相似度不小于预设阈值时,确定所述预设文字序列的预设关键词,并依据所述预设关键词确定所述预设知识图谱中的所述目标实体。
可选地,确定所述文字序列和预设数据库中的预设文字序列的第一相似度和确定所述句向量和所述预设文字序列的第二相似度,包括:依据所述关键词,计算所述文字序列和所述预设数据库中的每个预设文字序列的相似度,并确定最大的相似度为所述第一相似度;确定所述句向量和所述预设数据库中的每个预设文字序列的句向量的相似度,并确定最大的相似度为所述第二相似度。
在本申请的一些实施例中,拾音设备采集到目标音频后,可以通过如图3所示的语音识别系统来实现确定目标音频的语义信息。
如图3所示,完整的语音识别系统结构主要分为前端和后端两个模块。前端主要是对语音信号进行处理,提取所需的特征来训练模型或者测试。后端包括声学模型、语言模型和解码器部分。经过前端处理后的语音数据,在后端进一步处理可以得到识别结果,即文本数据。最后将文本数据经过自然语言理解步骤,转化为机器能够识别的结果,从而完成确定目标音频的语义信息。
在本申请的一些实施例中,前端模块主要的功能包括回声消除、混响消除、声源定位、波束形成,以实现对麦克风接收信号中的自噪声消除、噪声干扰抑制,提高输出目标语音的信号质量,最终达到提升语音识别率的目的。
具体地,前端信号处理流程大致如下:首先对麦克风接收的目标音频通过回声消除算法将设备自噪声消除,随后由混响消除算法抑制信号成分中的晚期混响,最后由声源定位与波束形成相结合完成对噪声干扰的抑制,对目标语音信号进行增强,将增强后的信号输入至识别系统进行识别。
可选地,在对目标音频进行语音识别前,还需要用信号处理手段将原始语音波形信号转换成特征矢量,常用特征有梅尔频率倒谱系数(Mel-frequency CepstrumCoefficients,MFCC),感知线性预测(Perceptual Linear Prediction,PLP),梅尔标度滤波器组(Mel-scale Filter Bank,fbank)等。
在本申请的一些实施例中,如图3所示,还需要通过声学模型和语言模型来对目标音频的特征矢量进行处理,才能得到识别结果。
其中,声学模型是把语音转化为声学表示的输出,即找到给定的语音源于某个声学符号的概率。对于声学符号,最直接的表达方式是词组,但是在训练数据量不充分的情况下,很难得到一个好的模型。词组是由多个音素的连续发音构成,另外,音素不但有清晰的定义而且数量有限。因而,在语音识别中,通常把声学模型转换成了一个语音序列到发音序列(音素)的模型和一个发音序列到输出文字序列的字典。语言模型可以对一段文本的概率进行估计,对信息检索,机器翻译,语音识别等任务有着重要的作用。语言模型分为统计语言模型和神经网络语言模型。现在主流的语言模型主要是N元文法(N-Gram)[28]和基于神经网络的循环神经网络-长短期记忆(Recurrent Neural Network with Long Short-TermMemory,RNN-LSTM)语音模型。
需要注意的是,由于人类发声器官运动的连续性,以及某些语言中特定的拼读习惯,会导致音素的发音受到前后音素的影响。为了对不同语境的音素加以区分,通常使用能够考虑前后各一个音素的三音子作为建模单元。
另外,在声学模型中,可以把三音子分解为更小的颗粒—状态,通常一个三音子对应3个状态,但是这会引起建模参数的指数增长,常用的解决方案是使用决策树先对这些三音子模型进行聚类,然后使用聚类的结果作为分类目标。
在本申请的一些实施例中,语音识别最终的分类目标可以是状态。最常用的声学建模方式是隐马尔科夫模型(HMM)。在HMM下,状态是隐变量,语音是观测值,状态之间的跳转符合马尔科夫假设。其中,状态转移概率密度多采用几何分布建模,而拟合隐变量到观测值的观测概率的模型常用高斯混合模型(GMM)。基于深度学习的发展,深度神经网络(DNN)、卷积神经网络(CNN)、循环神经网络(RNN)等模型被应用到观测概率的建模中,并取得了非常好的效果。
在本申请的一些实施例中,智能语音识别的识别结果一系列离散的无关联的概念节点,在本体关联计算中,可以将无关联的本体用语义关联(关系)进行连接。语义关联是语义数据模型中实体之间二维关系的知识表示形式,即实体之间的复杂关系。关联挖掘,即从一个或多个数据集中查找存在于对象集合之间的频繁模式、关联、相关性结构,进而描述对象的某个或某类属性同时出现的规律和模式之间的隐藏关系。在本申请的一些实施例中,可以采用以下几种方式来确定目标音频的语义。
1POS-CBOW语言模型
POS-CBOW是一种无监督的机器学习算法,是一种基于词向量表示的语言模型,能够深层次的挖掘文本中的语言学规律和词的语义关系。该方法综合了词性、词的分布特点,采用Word2vec改进模型,对情报语料进行训练,自动提取出语义关联关系。为了完成无监督的、自动化的语义分析任务,本项目利用POS-CBOW语言模型对以构建好的语义语料进行深度学习。
(1)POS-CBOW语言模型的过滤层
文本通常会加入一些符号来辅助情感的表达。这些附加信息虽然具有一定含义,但在本文的实际工作中,它改变了训练语料的正常语句结构,对训练模型产生了干扰。又因为短文本这一特点,使得这些符号在语句中占据相对较大权重,而这对于传统的长文本分析算法来说是无法处理的难题。
POS-CBOW语言模型的过滤层介于输入层和投影层之间,使用整理的微博文本停用词表对训练语料进行语句修正,从而达到优化词向量空间的目的。过滤层处理基本步骤如下:
步骤1:初始化哈希表Vocab,初始值为-1;
步骤2:循环读取训练语料句子的词,计算哈希值,并以哈希值为下标,Vocab[h]=1;
步骤3:初始化过滤层Filter,大小为停用词表个数,循环读取停用词,并计算通用词哈希值,记录到过滤层Filter表;
步骤4:遍历读取Filter表值每项的值h,并查询Vocab[h]是否等于1,等于1则将Vocab[h]=-1,否则循环继续,直到Filter遍历完毕,过滤完毕;
(2)POS-CBOW语言模型的词性标注层
CBOW语言模型是一种概率模型,通过将语料中的词的上下文信息生成相应的词向量映射到高维空间中,然后以词向量在高维空间中的关系来计算词与词之间的相似度。这样虽然提高了训练效率,加快了计算速度,但是,同时忽略了上下文信息中一些不符合相似词定义的词向量。
为了排除伪相似词的干扰,得到更加准确的相似词结果,引入了词性标注层。
POS-CBOW语言模型的词性标注层介于投影层和输出层之间,通过中文分词工具NLPIR对生成词向量进行词性标注,所用词性为计算所汉语词性标记集。针对词的多词性的这一性质,对词语的词性建立了词性体系,目的是为相似词计算提供词性参考体系,以便得出更加完善的相似词集。词性体系的构造步骤如下:
步骤1:以R为根节点,创建以R为根节点的所有子节点;
步骤2:以上一级子节点为根节点,创建相应节点下的子节点;
步骤3:查看上一级节点是否有子节点,如果有,重复步骤2,否则树构造完毕。
2基于POS-CBOW语言模型的语义关联算法
POS-CBOW语言模型生成的词向量不仅包含潜在的语义关系,还包含着语法关系。语法关系的加入完善了语义关系的不足。在相似词计算中以余弦相似度为计算方式,以语法关系为计算准则,进行词向量的相似性计算。例如,计算词向量“两栖攻击舰”的相似词,计算模型将会查找与词向量“两栖攻击舰”同在一个父类词性下的词,再计算词向量的余弦相似度,从而得到两个词向量的相似度。其中考虑到新词的问题,我们把未知词性的词也加入了我们的结果集。本文中采用了两种择优算法,一是TopN算法,选择N个最优结果;二是通过建立统计模型,选出最优结果集。
(1)TopN词向量计算
TopN算法是择优的经典算法之一,通过排名得出前N个最优项作为结果。本文在相似词的计算中利用了TopN的思想,通过结合余弦相似度和词性信息两个条件,对整个词向量空间遍历计算后,对相似词进行排序,选出前N个词作为结果集。TopN个相似词计算的基本步骤:
步骤1:取词向量空间第i个词向量Vi,在词性体系中查找Vi的父类词性,如果与W为同一父类词性或为“un”,进入步骤2,否则,查看向量空间是否遍历完,是则结束计算,否,重复1操作;
步骤2:计算余弦相似度Sim(W,V)=WV(|W|·|V|),如果Sim(W,V)<0,返回步骤1,否则倒叙遍历Set集合,比较相似度值,如果小于Sim(W,V),将该位置后值后移,插入V到该位置。重复步骤1。
通过在TopN算法中加入词性分析,使在同一词性体系的词聚集在一起,而不同词性的词向量则被排除在外。
(2)词向量的统计分析模型
TopN算法中相似词的计算结果往往受到N值得限定的,从而导致一些较优的词向量的丢失。为了能够更加充分的获取最优结果集,本文给出了另一种相似词计算方法,采用了一种动态阈值的统计分析模型,来选出结果集。
首先,计算出余弦相似度大于0的所有词向量,获取相似度集合,计算集合的三阶标准化矩,统计分析出相似度值得概率分布,如上图所示。根据相似度集合的偏度,得出词向量相似度值的整体分布情况。如果词向量相似度集合为正偏态,阈值设为集合的平均数,即结果集合为平均数的右侧部分,如果集合偏度为负偏度,那么阈值就选择集合的中位数,即结果集合为中位数的右侧部分,如下表1为Set集合概率分布及阈值选取。
表1 Set集合概率分布及阈值选取
偏度 | 分布状态 | 阈值 |
<0 | 平均数﹤中位数﹤众数 | 平均数 |
>0 | 众数<中位数<平均数 | 中位数 |
=0 | 平均数=中位数 | 平均数或中位数 |
基于POS-CBOW的语言模型,完成对各种信息的语句修正和词性标注层等工作,进而以空间向量的余弦值和向量的词性比较为条件,再计算词的相似性。该方法在各类语义分析中有较高的准确率。
实施例3
根据本发明实施例,提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备执行以下电力系统节点的数据查询方法:
获取拾音设备采集的目标音频;确定目标音频的语义信息,其中,语义信息中至少包含查询指令,查询指令用于确定为目标对象供电的电网中各个供电站节点的名称,以及查询供电站节点的供电站节点状态;确定预设知识图谱中与名称和查询指令对应的相关实体和相关关系,其中,预设知识图谱由实体和实体间的关系组成,实体和实体间的关系至少用于表示电网中各个供电站节点的连接关系,各个供电站节点的运行状态以及维护信息;在预设知识图谱中,确定与实体之间的关系为相关关系的实体,记为目标实体;依据目标实体,生成并输出回复信息。
根据本发明实施例,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行以下电力系统节点的数据查询方法:
获取拾音设备采集的目标音频;确定目标音频的语义信息,其中,语义信息中至少包含查询指令,查询指令用于确定为目标对象供电的电网中各个供电站节点的名称,以及查询供电站节点的供电站节点状态;确定预设知识图谱中与名称和查询指令对应的相关实体和相关关系,其中,预设知识图谱由实体和实体间的关系组成,实体和实体间的关系至少用于表示电网中各个供电站节点的连接关系,各个供电站节点的运行状态以及维护信息;在预设知识图谱中,确定与实体之间的关系为相关关系的实体,记为目标实体;依据目标实体,生成并输出回复信息。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种电力系统节点的数据查询方法,其特征在于,包括:
获取拾音设备采集的目标音频;
确定所述目标音频的语义信息,其中,所述语义信息中至少包含查询指令,所述查询指令用于确定为目标对象供电的电网中各个供电站节点的名称,以及查询所述供电站节点的供电站节点状态;
确定预设知识图谱中与所述查询指令对应的相关实体和相关关系,其中,所述预设知识图谱由实体和实体间的关系组成,所述实体和所述实体间的关系至少用于表示所述电网中各个供电站节点的连接关系,各个供电站节点的运行状态以及维护信息;
在所述预设知识图谱中,确定与所述实体之间的关系为所述相关关系的实体,记为目标实体;
依据所述目标实体,生成并输出回复信息。
2.根据权利要求1所述的方法,其特征在于,确定所述目标音频的语义信息,包括:
将所述目标音频输入至语义识别模型至进行分析,得到所述语义信息,其中,所述语义识别模型是通过多组数据训练得到的,每组数据中均包括:样本音频数据和与所述样本音频数据对应的语义信息。
3.根据权利要求2所述的方法,其特征在于,将所述目标音频输入至语义识别模型至进行分析之前,所述方法还包括:
将所述目标音频转化为特征向量;
依据所述特征向量,确定与所述目标音频对应的发音序列,其中,所述发音序列由多个音素组成;
依据所述发音序列,确定与所述目标音频对应的文字序列,其中,将所述文字序列作为所述语义识别模型的输入。
4.根据权利要求3所述的方法,其特征在于,确定预设知识图谱中与所述查询指令对应的相关实体和相关关系,包括:
确定所述语义信息中的关键词,其中,所述关键词至少包含所述查询指令;
依据所述关键词,确定所述文字序列和预设数据库中的预设文字序列的第一相似度;
获取所述文字序列的句向量,确定所述句向量和所述预设文字序列的句向量的第二相似度;
依据所述第一相似度和所述第二相似度,确定最终相似度;
当所述最终相似度不小于预设阈值时,确定所述预设文字序列的预设关键词,并依据所述预设关键词确定所述预设知识图谱中的所述目标实体。
5.根据权利要求4所述的方法,其特征在于,确定所述文字序列和预设数据库中的预设文字序列的第一相似度和确定所述句向量和所述预设文字序列的第二相似度,包括:
依据所述关键词,计算所述文字序列和所述预设数据库中的每个预设文字序列的相似度,并确定最大的相似度为所述第一相似度;
确定所述句向量和所述预设数据库中的每个预设文字序列的句向量的相似度,并确定最大的相似度为所述第二相似度。
6.根据权利要求1所述的方法,其特征在于,依据所述目标实体,生成并输出回复信息,包括:
确定与所述目标实体关联的数据库,并调取所述数据库中的信息,其中,所述数据库用于存储所述回复信息;
将所述回复信息发送至拼接屏系统,以在所述拼接屏系统展示所述回复信息。
7.根据权利要求1所述的方法,其特征在于,所述各个供电站节点的运行状态至少包括供电站节点自身的运行状态和外部环境状态,所述各个供电站节点的维护信息至少包括维护团队信息和维护时间信息。
8.一种电力系统节点的数据查询装置,其特征在于,包括:
拾音模块,所述拾音模块用于获取拾音设备采集的目标音频;
提取模块,所述提取模块用于确定所述目标音频的语义信息,其中,所述语义信息中至少包含查询指令,所述查询指令用于确定为目标对象供电的电网中各个供电站节点的名称,以及查询所述供电站节点的供电站节点状态;
处理模块,所述处理模块用于确定预设知识图谱中与所述名称和所述查询指令对应的相关实体和相关关系,其中,所述预设知识图谱由实体和实体间的关系组成,所述实体和所述实体间的关系至少用于表示所述电网中各个供电站节点的连接关系,各个供电站节点的运行状态以及维护信息;
确定模块,所述确定模块用于在所述预设知识图谱中,确定与所述实体之间的关系为所述相关关系的实体,记为目标实体;
输出模块,所述输出模块用于依据所述目标实体,生成并输出回复信息。
9.一种非易失性存储介质,其特征在于,所述非易失性存储介质包括存储的程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行权利要求1至7中任意一项所述电力系统节点的数据查询方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述电力系统节点的数据查询方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110721849.8A CN113609264B (zh) | 2021-06-28 | 2021-06-28 | 电力系统节点的数据查询方法、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110721849.8A CN113609264B (zh) | 2021-06-28 | 2021-06-28 | 电力系统节点的数据查询方法、装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113609264A true CN113609264A (zh) | 2021-11-05 |
CN113609264B CN113609264B (zh) | 2022-09-02 |
Family
ID=78336877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110721849.8A Active CN113609264B (zh) | 2021-06-28 | 2021-06-28 | 电力系统节点的数据查询方法、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113609264B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115033657A (zh) * | 2022-08-10 | 2022-09-09 | 广东美的暖通设备有限公司 | 基于知识图谱的查询方法、装置、设备及存储介质 |
EP4148654A3 (en) * | 2021-12-24 | 2023-06-21 | Beijing Baidu Netcom Science Technology Co., Ltd. | Method and apparatus of dispatching power, device, storage medium, and program |
CN118040908A (zh) * | 2024-04-11 | 2024-05-14 | 江苏合纵智慧能源有限公司 | 基于图像处理的变电站监控方法及系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6507573B1 (en) * | 1997-03-27 | 2003-01-14 | Frank Brandt | Data transfer method and system in low voltage networks |
WO2010014082A1 (en) * | 2008-07-29 | 2010-02-04 | Textwise Llc | Method and apparatus for relating datasets by using semantic vectors and keyword analyses |
CN106951517A (zh) * | 2017-03-19 | 2017-07-14 | 北京工业大学 | 狭隘范围内文献的多样性查询方法 |
CN110277086A (zh) * | 2019-06-25 | 2019-09-24 | 中国科学院自动化研究所 | 基于电网调度知识图谱的语音合成方法、系统及电子设备 |
US20190377797A1 (en) * | 2017-08-11 | 2019-12-12 | Tencent Technology (Shenzhen) Company Limited | Mathematical processing method, apparatus and device for text problem, and storage medium |
CN111933129A (zh) * | 2020-09-11 | 2020-11-13 | 腾讯科技(深圳)有限公司 | 音频处理方法、语言模型的训练方法、装置及计算机设备 |
CN112199602A (zh) * | 2020-12-03 | 2021-01-08 | 中电科新型智慧城市研究院有限公司 | 岗位推荐方法、推荐平台及服务器 |
CN112417102A (zh) * | 2020-11-26 | 2021-02-26 | 中国科学院自动化研究所 | 一种语音查询方法、装置、服务器和可读存储介质 |
CN112527997A (zh) * | 2020-12-18 | 2021-03-19 | 中国南方电网有限责任公司 | 一种基于电网领域调度场景知识图谱的智能问答方法及系统 |
CN112948572A (zh) * | 2019-12-11 | 2021-06-11 | 中国科学院沈阳计算技术研究所有限公司 | 通过知识图谱可视化展示电力系统设备信息与关系的方法 |
-
2021
- 2021-06-28 CN CN202110721849.8A patent/CN113609264B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6507573B1 (en) * | 1997-03-27 | 2003-01-14 | Frank Brandt | Data transfer method and system in low voltage networks |
WO2010014082A1 (en) * | 2008-07-29 | 2010-02-04 | Textwise Llc | Method and apparatus for relating datasets by using semantic vectors and keyword analyses |
CN106951517A (zh) * | 2017-03-19 | 2017-07-14 | 北京工业大学 | 狭隘范围内文献的多样性查询方法 |
US20190377797A1 (en) * | 2017-08-11 | 2019-12-12 | Tencent Technology (Shenzhen) Company Limited | Mathematical processing method, apparatus and device for text problem, and storage medium |
CN110277086A (zh) * | 2019-06-25 | 2019-09-24 | 中国科学院自动化研究所 | 基于电网调度知识图谱的语音合成方法、系统及电子设备 |
CN112948572A (zh) * | 2019-12-11 | 2021-06-11 | 中国科学院沈阳计算技术研究所有限公司 | 通过知识图谱可视化展示电力系统设备信息与关系的方法 |
CN111933129A (zh) * | 2020-09-11 | 2020-11-13 | 腾讯科技(深圳)有限公司 | 音频处理方法、语言模型的训练方法、装置及计算机设备 |
CN112417102A (zh) * | 2020-11-26 | 2021-02-26 | 中国科学院自动化研究所 | 一种语音查询方法、装置、服务器和可读存储介质 |
CN112199602A (zh) * | 2020-12-03 | 2021-01-08 | 中电科新型智慧城市研究院有限公司 | 岗位推荐方法、推荐平台及服务器 |
CN112527997A (zh) * | 2020-12-18 | 2021-03-19 | 中国南方电网有限责任公司 | 一种基于电网领域调度场景知识图谱的智能问答方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4148654A3 (en) * | 2021-12-24 | 2023-06-21 | Beijing Baidu Netcom Science Technology Co., Ltd. | Method and apparatus of dispatching power, device, storage medium, and program |
CN115033657A (zh) * | 2022-08-10 | 2022-09-09 | 广东美的暖通设备有限公司 | 基于知识图谱的查询方法、装置、设备及存储介质 |
CN118040908A (zh) * | 2024-04-11 | 2024-05-14 | 江苏合纵智慧能源有限公司 | 基于图像处理的变电站监控方法及系统 |
CN118040908B (zh) * | 2024-04-11 | 2024-06-11 | 江苏合纵智慧能源有限公司 | 基于图像处理的变电站监控方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113609264B (zh) | 2022-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113609264B (zh) | 电力系统节点的数据查询方法、装置 | |
US10446148B2 (en) | Dialogue system, a dialogue method and a method of adapting a dialogue system | |
CN1321401C (zh) | 语音识别设备、语音识别方法、会话控制设备以及会话控制方法 | |
CN106297800B (zh) | 一种自适应的语音识别的方法和设备 | |
CN111026886B (zh) | 一种针对专业场景的多轮对话处理方法 | |
US20080071533A1 (en) | Automatic generation of statistical language models for interactive voice response applications | |
CN110717018A (zh) | 一种基于知识图谱的工业设备故障维修问答系统 | |
CN108304372A (zh) | 实体提取方法和装置、计算机设备和存储介质 | |
CN108288468A (zh) | 语音识别方法及装置 | |
CN110096567A (zh) | 基于qa知识库推理的多轮对话回复选择方法、系统 | |
CN109977215B (zh) | 基于关联兴趣点的语句推荐方法和装置 | |
CN108538294B (zh) | 一种语音交互方法及装置 | |
CN105654940B (zh) | 一种语音合成方法和装置 | |
CN112420026A (zh) | 优化关键词检索系统 | |
JP2015219583A (ja) | 話題決定装置、発話装置、方法、及びプログラム | |
CN112151015A (zh) | 关键词检测方法、装置、电子设备以及存储介质 | |
CN104750677A (zh) | 语音传译装置、语音传译方法及语音传译程序 | |
CN115497465B (zh) | 语音交互方法、装置、电子设备和存储介质 | |
CN109271459A (zh) | 基于Lucene和文法网络的聊天机器人及其实现方法 | |
Harwath et al. | Zero resource spoken audio corpus analysis | |
CN117435716A (zh) | 电网人机交互终端的数据处理方法及系统 | |
Moyal et al. | Phonetic search methods for large speech databases | |
CN118173092A (zh) | 一种基于ai语音交互的在线客服平台 | |
CN114299920A (zh) | 用于语音识别的语言模型的训练、语音识别方法及装置 | |
CN116978367A (zh) | 语音识别方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |