CN116010626B - 电力用户知识图谱分析方法、装置和计算机设备 - Google Patents

电力用户知识图谱分析方法、装置和计算机设备 Download PDF

Info

Publication number
CN116010626B
CN116010626B CN202310296133.7A CN202310296133A CN116010626B CN 116010626 B CN116010626 B CN 116010626B CN 202310296133 A CN202310296133 A CN 202310296133A CN 116010626 B CN116010626 B CN 116010626B
Authority
CN
China
Prior art keywords
name
entity
service provider
names
service providers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310296133.7A
Other languages
English (en)
Other versions
CN116010626A (zh
Inventor
郭杨运
罗敏
周尚礼
王名俊
杨景旭
向睿
赖雨辰
陈敏娜
张英楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southern Power Grid Digital Grid Research Institute Co Ltd
Original Assignee
Southern Power Grid Digital Grid Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southern Power Grid Digital Grid Research Institute Co Ltd filed Critical Southern Power Grid Digital Grid Research Institute Co Ltd
Priority to CN202310296133.7A priority Critical patent/CN116010626B/zh
Publication of CN116010626A publication Critical patent/CN116010626A/zh
Application granted granted Critical
Publication of CN116010626B publication Critical patent/CN116010626B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种电力用户知识图谱分析方法、装置和计算机设备。通过预设词典解析服务提供者的名称,得到位置信息、提供的服务和服务提供者的标识名称,根据标识名称对各服务提供者进行分组和对齐后,关联服务提供者数据库中各身份信息至对应的各个服务提供者,分别创建名称、位置信息、所提供的服务和标识名称对应的实体,确定各实体的实体属性,根据多个实体、各实体属性以及各实体之间的关联关系,构建待分析电力系统对应的知识图谱,基于知识图谱分析电力系统。相较于传统通过关系型数据库进行分析,本方案基于服务提供者的各项属性构建知识图谱后对电力系统进行分析,降低了分析难度。

Description

电力用户知识图谱分析方法、装置和计算机设备
技术领域
本申请涉及电力系统技术领域,特别是涉及一种电力用户知识图谱分析方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
基于电能量数据开展用户行为分析,能够准确了解用户的相关需求,提高电力数据产品分配的合理性。目前对电力数据进行分析的方式通常是通过关系型数据库中的关联关系进行分析。然而,通过关系型数据库进行分析,对于多维关联的信息分析难度大。
因此,目前的电力用户知识图谱分析方法存在分析难度大的缺陷。
发明内容
基于此,有必要针对上述技术问题,提供一种能够降低分析难度的电力用户知识图谱分析方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种电力用户知识图谱分析方法,所述方法包括:
获取待分析电力系统中各个服务提供者的关联信息;所述关联信息包括所述服务提供者的用电量和所述服务提供者的名称;
根据预设词典解析所述名称,得到各个所述服务提供者的名称中包含的位置信息、所提供的服务以及所述服务提供者的标识名称;根据所述标识名称对各个服务提供者进行分组,并根据每个分组中服务提供者的名称相似度对所述名称进行对齐,得到对齐后的名称;
根据所述对齐后的名称查询服务提供者数据库,关联各身份信息至对应的各个服务提供者;
分别创建所述服务提供者的名称、位置信息、所提供的服务和标识名称对应的实体,得到多个实体,并根据所述用电量和所述身份信息确定各个实体对应的实体属性;
根据所述多个实体、各个实体对应的实体属性以及各个实体之间的关联关系,构建所述待分析电力系统对应的知识图谱,根据所述知识图谱对所述待分析电力系统进行分析;所述知识图谱包括所述服务提供者、所述名称、位置信息、所提供的服务和标识名称分别对应的实体。
在其中一个实施例中,所述获取待分析电力系统中各个服务提供者的关联信息,包括:
获取待分析电力系统中的多个候选服务提供者的关联信息;所述候选服务提供者的关联信息包括候选服务提供者的名称、候选服务提供者的用户类型、候选服务提供者对应的多个计量点以及各个计量点的用电量;
根据所述候选服务提供者对应的所述用户类型和所述各个计量点的用电量,从所述多个候选服务提供者确定出用电量满足设定条件的多个服务提供者,并获取所述多个服务提供者的关联信息。
在其中一个实施例中,所述用户类型包括公线专变类型和专线专变类型;
所述根据所述候选服务提供者对应的所述用户类型和所述各个计量点的用电量,从所述多个候选服务提供者确定出用电量满足设定条件的多个服务提供者,包括:
获取所述多个候选服务提供者中用户类型为公线专变类型和专线专变类型的多个候选服务提供者;
根据所述多个候选服务提供者中目标计量点的用电量,对所述多个候选服务提供者进行倒序排序,得到候选服务提供者列表;所述目标计量点表征各个候选服务提供者对应的用于检测用电量对应的资源数值的计量点;
将所述候选服务提供者列表中排在前预设名次的多个候选服务提供者,确定为所述多个服务提供者。
在其中一个实施例中,所述获取待分析电力系统中各个服务提供者的关联信息,还包括:
获取所述待分析电力系统中各个服务提供者对应的原始名称以及各个服务提供者的用电量;所述原始名称中包括所述服务提供者的名称,以及线路名称和/或变电站名称;
根据预设正则表达式,去除所述原始名称中的线路名称和/或变电站名称,得到所述服务提供者的名称;
根据各个服务提供者的名称和所述服务提供者的用电量,得到各个服务提供者的关联信息。
在其中一个实施例中,所述根据预设词典解析所述名称,得到所述各个服务提供者的名称中包含的位置信息、所提供的服务以及所述服务提供者的标识名称,包括:
获取预设词典;所述预设词典包地理信息词典、行业信息词典和组织后缀词典;
针对每个名称,根据所述词典生成该名称对应的前缀树;所述前缀树中每层包括所述预设词典中的一个字符;
根据所述前缀树扫描该名称,得到由该名称中的各个字符组成的有向无环图;
根据动态规划算法,获取所述有向无环图中对应的多个候选词,根据所述地理信息词典解析所述多个候选词中的位置信息、根据所述行业信息词典解析所述多个候选词中的所提供的服务、根据所述组织后缀词典解析所述多个候选词中所述名称对应的组织后缀,以及根据解析所述位置信息、所提供的服务和组织后缀后剩余的候选词,作为所述标识名称。
在其中一个实施例中,所述根据所述标识名称对各个服务提供者进行分组,并根据每个分组中服务提供者的名称相似度对所述名称进行对齐,得到对齐后的名称,包括:
根据包含相同标识名称的至少两个服务提供者的名称,得到同类服务提供者的名称集;
将所述同类服务提供者的名称集中相似度大于或等于预设相似度阈值的至少两个标识名称,对齐至同一服务提供者的名称,得到对齐后的名称。
在其中一个实施例中,所述分别创建所述服务提供者的名称、位置信息、所提供的服务和标识名称对应的实体,得到多个实体,并根据所述用电量和所述身份信息确定各个实体对应的实体属性,包括以下三项:
创建所述位置信息中的省份实体、地市实体和区县实体;获取所述服务提供者的身份信息,分别作为所述省份实体、地市实体和区县实体的实体属性;
创建所述服务提供者对应的用户实体,获取所述服务提供者对应的用电类型、用户类型和电压等级,作为所述用户实体的实体属性;
创建所述名称对应的名称实体、所述所提供的服务的服务实体、以及所述标识名称对应的标识名称实体;将所述服务提供者的身份信息,分别作为所述名称实体、所述服务实体和所述标识名称实体的实体属性。
在其中一个实施例中,所述根据所述多个实体、各个实体对应的实体属性以及各个实体之间的关联关系,构建所述待分析电力系统对应的知识图谱,包括:
根据所述地市实体与对应的省份实体间的上级组织关系,创建第一关联关系;
根据所述区县实体与对应的地市实体间的上级组织关系,创建第二关联关系;
根据所述用户实体与对应的服务实体间的所属行业关系,创建第三关联关系;
根据所述用户实体与对应的区县实体间的所处位置关系,创建第四关联关系;
根据所述用户实体与对应的名称实体间的所属主体关系,创建第五关联关系;
根据所述名称与对应的标识名称间的所属品牌关系,创建第六关联关系;
根据所述第一关联关系、所述第二关联关系、第三关联关系、所述第四关联关系、所述第五关联关系和所述第六关联关系,构建所述知识图谱。
第二方面,本申请提供了一种电力用户知识图谱分析装置,所述装置包括:
第一获取模块,用于获取待分析电力系统中各个服务提供者的关联信息;所述关联信息包括所述服务提供者的用电量和所述服务提供者的名称;
第二获取模块,用于根据预设词典解析所述名称,得到各个所述服务提供者的名称中包含的位置信息、所提供的服务以及所述服务提供者的标识名称;根据所述标识名称对各个服务提供者进行分组,并根据每个分组中服务提供者的名称相似度对所述名称进行对齐,得到对齐后的名称;
关联模块,用于根据所述对齐后的名称查询服务提供者数据库,关联各身份信息至对应的各个服务提供者;
实体创建模块,用于分别创建所述服务提供者的名称、位置信息、所提供的服务和标识名称对应的实体,得到多个实体,并根据所述用电量和所述身份信息确定各个实体对应的实体属性;
分析模块,用于根据所述多个实体、各个实体对应的实体属性以及各个实体之间的关联关系,构建所述待分析电力系统对应的知识图谱,根据所述知识图谱对所述待分析电力系统进行分析;所述知识图谱包括所述服务提供者、所述名称、位置信息、所提供的服务和标识名称分别对应的实体。
第三方面,本申请提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
第五方面,本申请提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤。
上述电力用户知识图谱分析方法、装置、计算机设备、存储介质和计算机程序产品,通过预设词典解析服务提供者的名称,得到其中包含的位置信息、所提供的服务和服务提供者的标识名称,根据标识名称对各个服务提供者进行分组和对齐,根据对齐后的名称查询服务提供者数据库,关联各身份信息至对应的各个服务提供者,分别创建上述名称、位置信息、所提供的服务和标识名称对应的实体,根据用电量和身份信息确定各个实体的实体属性,并根据多个实体、各个实体属性以及各个实体之间的关联关系,构建待分析电力系统对应的知识图谱,基于知识图谱分析电力系统。相较于传统的通过关系型数据库进行分析,本方案通过基于服务提供者的各项属性构建知识图谱,基于知识图谱对电力系统中各个服务提供者进行分析,降低了分析难度。
附图说明
图1为一个实施例中电力用户知识图谱分析方法的流程示意图;
图2为一个实施例中知识图谱的结构示意图;
图3为另一个实施例中知识图谱的结构示意图;
图4为又一个实施例中知识图谱的结构示意图;
图5为另一个实施例中电力用户知识图谱分析方法的流程示意图;
图6为一个实施例中电力用户知识图谱分析装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种电力用户知识图谱分析方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现,包括以下步骤:
步骤S202,获取待分析电力系统中各个服务提供者的关联信息;关联信息包括服务提供者的用电量和服务提供者的名称。
其中,待分析电力系统可以是需要进行分析的电力系统,电力系统中包括多种类型的用电用户,其中这些用电用户中包括服务提供者类型的用电用户,每个服务提供者可以是一个用电个体。其中,服务提供者可以是企业用户,企业用户在对外提供相应服务时,需要消耗电量。终端对电力系统中各个服务提供者进行用电分析时,可以首先获取待分析电力系统中各个服务提供者的关联信息。其中,关联信息包括与服务提供者有关的信息,例如可以包括服务提供者的用电量和服务提供者的名称等。其中,服务提供者可以对应有多个类型的计量点,每个计量点的用途可以不一样,终端可以从多个计量点中筛选出用于计算用电代价用途的计量点,即用于计费的计量点,将该计量点的用电量作为服务提供者的用电量。服务提供者的名称可以是服务提供者的完整名称,服务提供者的名称可以由多个部分组成,其中包括服务提供者所在位置、标识名称和组织后缀等。例如对于企业用户,其名称可以是企业的完整名称。
其中,终端获取到的上述服务提供者对应的信息可以是未经处理的,此时信息中包括其他杂糅信息,因此终端需要对服务提供者的信息进行清洗,进而得到服务提供者的关联信息。例如,在一些实施例中,终端可以获取待分析电力系统中各个服务提供者对应的原始名称以及各个服务提供者的用电量。其中,原始名称中包括服务提供者的名称,还可以包括线路名称和变电站名称中的至少一种。终端可以根据预设正则表达式,去除原始名称中的线路名称,还可以去除原始名称中的变电站名称,从而得到服务提供者的名称。终端可以根据各个服务提供者的名称和服务提供者的用电量,得到各个服务提供者的关联信息。具体地,以服务提供者是企业为例,电力系统中存储有包含多个用电用户的信息的用户档案,用户档案所记录的用户名称通常带有电网供电线路、变电站名称等信息,无法和企业名称一一对应,因此终端可以对企业用户的名称进行清洗,去除名称中的线路、变电站等电网相关的字符串,保留企业用户的名称。其中,终端可以通过正则表达式对企业用户的名称中的非企业名称字符串进行模型匹配的清洗,模型匹配中用到的相关正则表达式可以如下所示:“^\d+[kK][vV].*?[线回]+\d*”、“^\d+[kK][vV].*?交易结算[((]”、“[((].*\d+[kK][vV].*[))]$”、“^[((].+[))]”、“[((].+[))]$”、“[·’!"\#$%&\'()#!()*+,-./:;<=>?\@,:?¥★、….>【】[]《》?“”‘’\[\\]^_`{|}~1-9]+'”。
终端可以通过上述正则表达式,去除企业用户的原始名称中的电网供电线路、变电站名称等无关信息,从而得到上述企业用户的关联信息。
步骤S204,根据预设词典解析名称,得到各个服务提供者的名称中包含的位置信息、所提供的服务以及服务提供者的标识名称;根据标识名称对各个服务提供者进行分组,并根据每个分组中服务提供者的名称相似度对名称进行对齐,得到对齐后的名称。
其中,预设词典可以是包括多种类型的名词信息的集合,上述服务提供者可以包括多个,终端可以根据预设词典解析上述各个服务提供者的名称,从而终端可以得到各个服务提供者的名称中包含的位置信息、所提供的服务以及服务提供者的标识名称。其中,位置信息可以是服务提供者提供服务时的位置,所提供的服务可以是服务提供者对外提供的服务,标识名称可以是各个服务提供者对应的标识,例如对于企业用户来说,标识名称可以是企业的品牌名称。
终端获取上述各项信息后,由于档案录入人员操作习惯不同、不同单位录入要求规范不统一等问题,可能出现同一个服务提供者的名称在建立电网用户档案时录入不同用户名称的情况,而由于标识名称对于同一服务提供者来说是一致的,因此终端可以根据标识名称对各个服务提供者进行分组,并根据每个分组中服务提供者的名称相似度对各个服务提供者的名称进行对齐,得到对齐后的名称,即终端可以将指向同一服务提供者的不同名称进行对齐,减少最终构建知识图谱的稀疏性。
步骤S206,根据对齐后的名称查询服务提供者数据库,关联各身份信息至对应的各个服务提供者。
其中,服务提供者数据库可以包括多个服务提供者的身份信息。终端根据对齐后的名称查询服务提供者数据库后,可以将查询到的身份信息关联至对应的各个服务提供者。具体地,以服务提供者是企业用户为例,终端可以通过将企业用户的对齐后的名称查询相关数据库,得到企业用户的身份信息,其中该身份信息可以是企业用户对应的拓展信息,包括企业名称、曾用名、统一信用代码、经营范围、成立时间、注册资本、法定代表人、所属国民经济行业、省份、城市、注册地址、邮编、企业网站等。终端可以将上述查询到的相关身份信息关联至对应的服务提供者,从而实现对服务提供者的信息拓展。
步骤S208,分别创建服务提供者的名称、位置信息、所提供的服务和标识名称对应的实体,得到多个实体,并根据用电量和身份信息确定各个实体对应的实体属性。
其中,终端得到上述各个服务提供者的名称、位置信息、所提供的服务和标识名称后,可以分别创建服务提供者的名称对应的实体,创建位置信息对应的实体,创建所提供的服务对应的实体和创建标识名称对应的实体,从而终端可以得到各个服务提供者对应的多个实体。其中,每个实体还可以对应有实体属性,终端可以根据上述用电量和身份信息,确定各个实体对应的实体属性。
步骤S210,根据多个实体、各个实体对应的实体属性以及各个实体之间的关联关系,构建待分析电力系统对应的知识图谱,根据知识图谱对待分析电力系统进行分析;知识图谱包括服务提供者、名称、位置信息、所提供的服务和标识名称分别对应的实体。
其中,终端创建了各个服务提供者对应的多个实体,以及确定各个实体对应的实体属性后,可以得到各个实体之间的关联关系。例如对于同一个服务提供者,其对应的各个实体之间的关联关系可以根据其关联信息和身份信息确定,对于不同的服务提供者,各个服务提供者之间的实体关联关系可以根据实体之间存在的共同点确定,例如位置信息对应的实体可以根据位置关系确定实体之间的关联关系等。终端可以根据上述多个实体、各个实体对应的实体属性以及各个实体之间的关联关系,构建上述待分析电力系统对应的知识图谱。上述知识图谱中包括服务提供者对应的实体、上述名称对应的实体、上述位置信息对应的实体、上述所提供的服务对应的实体和上述标识名称对应的实体。从而终端可以根据上述知识图谱,对待分析电力系统进行分析。例如,终端可以通过上述知识图谱,直观展示各个服务提供者的用电的相关信息,终端还可以通过图算法,对各类信息之间的关系进行深度搜索。
上述电力用户知识图谱分析方法中,通过预设词典解析服务提供者的名称,得到其中包含的位置信息、所提供的服务和服务提供者的标识名称,根据标识名称对各个服务提供者进行分组和对齐,根据对齐后的名称查询服务提供者数据库,关联各身份信息至对应的各个服务提供者,分别创建上述名称、位置信息、所提供的服务和标识名称对应的实体,根据用电量和身份信息确定各个实体的实体属性,并根据多个实体、各个实体属性以及各个实体之间的关联关系,构建待分析电力系统对应的知识图谱,基于知识图谱分析电力系统。相较于传统的通过关系型数据库进行分析,本方案通过基于服务提供者的各项属性构建知识图谱,基于知识图谱对电力系统中各个服务提供者进行分析,降低了分析难度。
在一个实施例中,获取待分析电力系统中各个服务提供者的关联信息,包括:获取待分析电力系统中的多个候选服务提供者的关联信息;候选服务提供者的关联信息包括候选服务提供者的名称、候选服务提供者的用户类型、候选服务提供者对应的多个计量点以及各个计量点的用电量;根据候选服务提供者对应的用户类型和各个计量点的用电量,从多个候选服务提供者确定出用电量满足设定条件的多个服务提供者,并获取多个服务提供者的关联信息。
本实施例中,终端可以从多个候选服务提供者中筛选出用于分析的服务网提供者。终端可以预先获取待分析电力系统中的多个候选服务提供者的关联信息。其中,候选服务提供者的关联信息包括候选服务提供者的名称、候选服务提供者的用户类型、候选服务提供者对应的多个计量点以及各个计量点的用电量。终端可以根据上述候选服务提供者对应的用户类型和各个计量点的用电量,从多个候选服务提供者中确定出用电量满足设定条件的多个服务提供者,从而终端可以获取到筛选出的多个服务提供者的关联信息。其中,上述用户类型可以包括公线专变类型和专线专变类型,公线专变类型表示服务提供者使用的是公共输电线路,以及专用的变电站;专线专变类型表示服务提供者使用的是专用的线路,以及专用的变电站。
终端可以通过筛选特定类型且用电量达到设定条件的候选服务提供者,作为参与分析的服务提供者。例如,在一些实施例中,终端可以获取上述多个候选服务提供者中用户类型为公线专变类型和专线专变类型的多个候选服务提供者,并获取这些候选服务提供者中目标计量点的用电量,其中,目标计量点表示各个候选服务提供者对应的用户检测用电量对应的资源数值的计量点,例如计费用途的计量点。终端可以根据这些用电量对多个候选服务提供者进行倒序排序,得到候选服务提供者列表。其中服务提供者列表中包括按照用电量从大到小排序的多个候选服务提供者,终端可以将候选服务提供者列表中排在前预设名次的多个候选服务提供者,确定为上述参与知识图谱构建和分析的多个服务提供者。
具体地,上述用电量可以通过计量点的电能表统计得到,终端可以预先从电力系统中获取用户档案、计量点档案、电能表档案,从计量自动化系统中获取电能表电量数据。为管控线损和核对电量等业务需求,电力系统中会设置多种类型的用户,包括变电站考核户、线路考核户、台区考核户等考核用户,以及上述服务提供者所代表的企业用户等,终端可以通过筛选电力系统中的公线专变类型和专线专变类型的用户,得到符合用户类型条件的多个候选服务提供者。终端还可以关联企业用户的资源数值计算的计量点,即上述目标计量点,每个用户可能有多个计量点,计量点的用途包括考核表、参考表、资源数值计量表等,终端可以筛选出每个用户的作为资源数值计算用途的计量点,各个计量点包括对应的电能表,从而终端可以关联筛选后的计量点对应的主电能表,并关联电能表对应的电量,终端通过逐级计算单表电量、计量点电量、用户电量。按照电能表电量、计量点电量、用户电量的顺序逐级计算电量,从而得到上述候选服务提供者的用电量。终端可以根据用电量从上述筛选出的多个候选服务提供者中确定出用电量符合条件的服务提供者。例如,终端可以汇总上述各个候选服务提供者的在一年内的用电量,并根据各服务提供者所属的省份、行业信息,基于服务提供者的用电量进行分省分行业排序,从而终端可以统计得到各省份每个行业前预设名次用电量的多个服务提供者,例如各省各行业对应的用电量在前两百名的服务提供者,作为参与知识图谱构建和用电分析的服务提供者。从而终端可以获取这些服务提供者的关联信息,基于关联信息进行电力知识图谱的构建和分析。
通过上述实施例,终端可以基于候选服务提供者的用户类型和用电量,筛选出参与电力知识图谱构建和电力系统分析的服务提供者,降低了电力系统分析的难度。
在一个实施例中,根据预设词典解析名称,得到各个服务提供者的名称中包含的位置信息、所提供的服务以及服务提供者的标识名称,包括:获取预设词典;预设词典包地理信息词典、行业信息词典和组织后缀词典;针对每个名称,根据词典生成该名称对应的前缀树;前缀树中每层包括预设词典中的一个字符;根据前缀树扫描该名称,得到由该名称中的各个字符组成的有向无环图;根据动态规划算法,获取有向无环图中对应的多个候选词,根据地理信息词典解析多个候选词中的位置信息、根据行业信息词典解析多个候选词中的所提供的服务、根据组织后缀词典解析多个候选词中名称对应的组织后缀,以及根据解析位置信息、所提供的服务和组织后缀后剩余的候选词,作为标识名称。
本实施例中,终端可以基于预设词典解析上述服务提供者的名称,从而得到名称中包含的多项信息。终端可以首先获取预设词典,其中预设词典中包括地理信息词典、行业信息词典和组织后缀词典,每个词典中包括对应类型的多种预设词语。对于每个服务提供者的名称,终端可以根据上述词典,生成该名称对应的前缀树,其中前缀树可以包括多层节点,每层节点包括预设词典中的一个字符,终端可以根据该前缀树扫描该名称,并得到由该名称中各个字符组成的有向无环图。其中,有向无环图指的是一个无回路的有向图。如果有一个非有向无环图,且A点出发向B经C可回到A,形成一个环。将从C到A的边方向改为从A到C,则变成有向无环图。从而终端可以根据动态规划算法,获取有向无环图中对应的多个候选词,根据地理信息词典解析多个候选词中的位置信息,根据行业信息词典解析多个候选词中的所提供的服务,根据组织后缀词典解析多个候选词中名称对应的组织后缀,并根据解析上述各项信息后剩余的候选词,作为标识名称。
具体地,以服务提供者是企业用户为例,企业的名称可以由四个部分组成:地理信息、品牌名称、所属行业、组织后缀,其中,地理信息即为上述位置信息,品牌名称即为上述标识名称,所属行业即为上述所提供的服务。终端可以对清洗后的名称进行分词、归类,并解析出上述各项信息。终端可以预先整理词典。其中,词典中包括地理信息,终端可以按照行政区划,收集省级行政区、地级行政区、县级行政区三个层级地名信息,针对不同层级行政区分别建立数据集。其中,对于行政区,终端可以在词典中新增去除省、市、区、县后缀的行政区。并且由于部分行政区有别名,终端可以对行政区名进行统一,例如黔西南布依族苗族自治州简称黔西南、西双版纳傣族自治州简称西双版纳。词典中还可以包括所属行业信息,例如合金制品、合金材料、有色金属、焊接设备、吊车、复合材料、服装、服装服饰、专业包装、化学、化工、化肥、电信、灯饰、机械、食品、工艺品等。词典中还可以包括组织后缀等信息,例如有限公司、有限责任公司、股份公司、股份有限公司、技术有限公司、科技有限公司、服务有限公司等词语。需要说明的是,终端还可以通过其他方式对上述名称进行分词。
终端整理词典后,可以根据词典解析各个企业用户的名称,终端可以基于上述词典生成前缀树,其中,前缀树的第一层包括词典中所有单词的第一个字符,树的第二层包括所有单词的第二个字符,以此类推,终端可以得到包含词典中各个字的前缀树。终端可以基于上述前缀树扫描企业的名称,生成词图,即生成上述名称中汉字所有可能成词的情况所构成的有向无环图。即有向无环图中包括由名称中各个字组成的各个词语组合,终端可以通过动态规划查找最大概率路径,找出基于词频的最大切分组合,从而得到在当前词语类型的词典下,名称中对应的词语,例如通过地理信息词典解析出名称中的位置信息,通过行业信息词典解析出名称中的所提供的服务,通过组织后缀词典解析出名称中的组织后缀。终端解析出上述位置信息、所提供的服务和组织后缀后,还可以将名称中余下的词语作为标识名称,即企业用户的品牌名称。
通过本实施例,终端可以通过词典和动态规划方式,解析出名称中包含的各项信息,从而终端可以基于解析出的各项信息进行知识图谱的构建以及电力系统的解析,降低了电力系统解析的难度。
在一个实施例中,根据标识名称对各个服务提供者进行分组,并根据每个分组中服务提供者的名称相似度对名称进行对齐,得到对齐后的名称,包括:根据包含相同标识名称的至少两个服务提供者的名称,得到同类服务提供者的名称集;将同类服务提供者的名称集中相似度大于或等于预设相似度阈值的至少两个标识名称,对齐至同一服务提供者的名称,得到对齐后的名称。
本实施例中,由于档案录入人员的操作习惯以及不同单位录入要求规范不一致等原因,可能出现同一服务提供者对应有不同名称的情况,因此,终端可以对上述各个服务提供者的名称进行对齐。终端可以将包含相同标识名称的至少两个服务提供者的名称进行聚类,得到同类服务提供者的名称集,终端还可以获取上述同类服务提供者的名称集中各个标识名称之间的相似度,并将相似度大于或等于预设相似度阈值的至少两个标识名称,对应至同一服务提供者的名称,从而得到对齐后的名称。
具体地,对于同一服务提供者,其名称可能出现符号差异、字数差异等情况,例如“XX印刷(深圳)有限公司”和“XX印刷(深圳)有限公司”应对应同一企业,用户名称“龙门县XX有限公司”和“龙门XX有限公司”应对应同一企业。终端可以对这些名称进行对齐。终端可以根据上述解析名称得到的品牌信息,即标识名称,进行分组,将相同品牌名称的服务提供者分到一组,对于每个组,终端可以计算分组内每个服务提供者与其他服务提供者的名称相似度,其中相似度算法可以使用格式塔模式匹配(gestalt pattern matching),终端可以将相似度大于或等于0.7的名称对齐至同一个服务提供者的名称。需要说明的是,终端还可以通过编辑距离、词向量映射后计算余弦相似度等方式确定上述相似度。
通过本实施例,终端可以通过相似度计算方式,将属于同一服务提供者的名称进行对齐,从而降低了构件图谱时的稀疏性,并方便电网外部的企业数据进行关联,降低了电力分析的难度。
在一个实施例中,分别创建服务提供者的名称、位置信息、所提供的服务和标识名称对应的实体,得到多个实体,并根据用电量和身份信息确定各个实体对应的实体属性,包括以下三项:创建位置信息中的省份实体、地市实体和区县实体;获取服务提供者的身份信息,分别作为省份实体、地市实体和区县实体的实体属性;创建服务提供者对应的用户实体,获取服务提供者对应的用电类型、用户类型和电压等级,作为用户实体的实体属性;创建名称对应的名称实体、所提供的服务的服务实体、以及标识名称对应的标识名称实体;将服务提供者的身份信息,分别作为名称实体、服务实体和标识名称实体的实体属性。
本实施例中,终端可以根据解析出的多种词语,分别构建不同类型的实体。其中位置信息包括省份、地市和区县等信息,终端可以创建位置信息中的省份实体、地市实体和区县实体,并获取服务提供者的身份信息,分别作为省份实体、地市实体和区县实体的实体属性。终端还可以创建服务提供者对应的用户实体,并获取服务提供者对应的用电类型、用户类型和电压等级,作为用户实体的实体属性。其中,上述用电类型、用户类型和电压等级可以根据服务提供者的用电量得到。终端还可以创建上述名称对应的名称实体,创建所提供的服务对应的服务实体,以及创建标识名称对应的标识名称实体,终端还可以将上述服务提供者的身份信息,分别作为上述名称实体、服务实体和标识名称实体的实体属性。
具体地,上述服务提供者可以是各个行业中用定量前预设名次的服务提供者,终端已经对这些用户的用户档案关联、用户名称清洗、用户名称解析、企业名称对齐、企业信息关联,从而终端可以可得到一张宽表,该宽表中包括各个服务提供者的名称中包含的各县信息,知识图谱可以选用neo4j图数据库,Neo4j是一个高性能的NOSQL图形数据库,它将结构化数据存储在网络上而不是表中。终端可以基于上述宽表并结合neo4j构建知识图谱。需要说明的是,终端也可以使用其他图数据库作为创建知识图谱时的图数据库。例如,终端可以创建实体,包括分别创建省份、地市、区县、行业实体,上述数据来源于上述宽表中的用户档案对应省份、地市、区县、行业字段去重。终端还可以创建品牌实体,每个实体的名称为名称解析出的品牌名称。终端还可以创建企业实体,即上述名称实体,每个实体的名称为宽表中的企业用户的名称,并且,终端还可以将关联到的企业信息中的企业名称、曾用名、统一信用代码、经营范围、成立时间、注册资本、法定代表人、所属国民经济行业、省份、城市、注册地址、邮编、企业网站等作为实体属性。终端还可以创建用户实体,每个实体的名称为宽表中的用户编号,并且,终端还可以将用户档案信息中的用电类型,包括一般工商业用电和大工业用电等类型,用户类型,包括专线转变和公线专变等,以及电压等级,包括10kv,20kv等数值等级,作为用户实体的属性。
通过本实施例,终端可以根据服务提供者的名称中包含的多种类型的词语,分别创建对应的实体,从而终端可以基于多种类型的实体构建知识图谱,降低了电力分析的难度。
在一个实施例中,根据多个实体、各个实体对应的实体属性以及各个实体之间的关联关系,构建待分析电力系统对应的知识图谱,包括:根据地市实体与对应的省份实体间的上级组织关系,创建第一关联关系;根据区县实体与对应的地市实体间的上级组织关系,创建第二关联关系;根据用户实体与对应的服务实体间的所属行业关系,创建第三关联关系;根据用户实体与对应的区县实体间的所处位置关系,创建第四关联关系;根据用户实体与对应的名称实体间的所属主体关系,创建第五关联关系;根据名称与对应的标识名称间的所属品牌关系,创建第六关联关系;根据第一关联关系、第二关联关系、第三关联关系、第四关联关系、第五关联关系和第六关联关系,构建知识图谱。
本实施例中,上述不同类型的实体之间存在不同的关联关系。对于位置信息对应的各个实体,终端可以根据地市实体与对应的省份实体间的上级组织关系,创建第一关联关系。终端可以根据区县实体与对应的地市实体间的上级组织关系,创建第二关联关系。终端还可以根据用户实体与对应的服务实体间的所属行业关系,创建第三关联关系。终端可以根据用户实体与对应的区县实体间的所处位置关系,创建第四关联关系。终端可以根据用户实体与对应的名称实体间的所属主体关系,创建第五关联关系。终端还可以根据名称与对应的标识名称间的所属品牌关系,创建第六关联关系。从而终端可以根据上述第一关联关系、第二关联关系、第三关联关系、第四关联关系、第五关联关系和第六关联关系,构建知识图谱。
具体地,如图2、图3和图4所示,图2为一个实施例中知识图谱的结构示意图。图3为另一个实施例中知识图谱的结构示意图。图4为又一个实施例中知识图谱的结构示意图。终端构建知识图谱时,可以创建实体与实体之间的关系。其中实体与实体之间的关系可以按照“(实体)-[关系]-(实体)”的形式展示,终端可以分别创建(地市)-[上级组织]-(省份)、(区县)-[上级组织]-(地市)、(用户)-[所属行业]-(行业)、(用户)-[所处位置]-(区县)、(用户)-[所属企业]-(企业)、(企业)-[所属品牌]-(品牌)、(企业)-[所处位置]-(地市)等关系。其中,行业可以是上述所提供的服务的服务实体,用户可以是上述用户实体,企业可以是上述名称实体,品牌可以是上述标识名称实体。终端可以根据上述各项关系,构建如图2、图3和图4所示的服务提供者对应的知识图谱。其中图2表示的是(地市)-[上级组织]-(省份)的关系;图3表示的是(企业)-[所处位置]-(地市)的关系;图4表示的是(用户)-[所属行业]-(行业)、(用户)-[所属企业]-(企业)、(企业)-[所属品牌]-(品牌)等关系。
通过本实施例,终端可以通过构建各个实体之间的关系,进而得到电力系统中服务提供者对应的知识图谱,从而终端可以基于该知识图谱进行电力系统的分析,降低了电力系统分析的难度。
在一个实施例中,如图5所示,图5为另一个实施例中电力用户知识图谱分析方法的流程示意图。本实施例中,终端可以首先获取电力系统中的用户档案、计量点档案、电能表档案,通过计量自动化系统获取电能表电量数据。终端可以从上述用户档案中筛选出公线专变类型和专线专变类型的用户,即服务提供者,并筛选计费计量点,筛选在运行的主电能表,关联电能表对应电量后,逐级计算单表电量、计量点电量和用户电量。终端可以汇总各行业用户一年内的用电量,基于用户所属省份、行业信息,基于用户用电量进行分省分行业的排序,获取各行业用电量在前预设名次的用户。终端还可以对用户的名称进行清洗,去除名称中的线路、变电站等电网相关字符串,保留企业的名称。清洗后,终端可以对企业的名称进行解析,解析出地理信息、品牌名称、所属行业和组织后缀,终端可以根据上述提取的品牌信息进行分组,计算分组内每个用户名称与其他用户名称的相似度,并将相似度大于或等于0.7的名称对齐至同一服务提供者。终端还可以对已对齐的服务提供者的名称进行身份信息的拓展,并分别创建省份、地市、区县、行业、品牌、企业和用户的实体,从而终端可以获取上述各个实体之间的关系,包括(地市)-[上级组织]-(省份)、(区县)-[上级组织]-(地市)、(用户)-[所属行业]-(行业)、(用户)-[所处位置]-(区县)、(用户)-[所属企业]-(企业)、(企业)-[所属品牌]-(品牌)等关系。终端可以基于上述关系构建服务提供者对应的知识图谱。
通过上述实施例,终端通过基于服务提供者的各项属性构建知识图谱,基于知识图谱对电力系统中各个服务提供者进行分析,降低了分析难度。并且,终端通过图谱可视化的方式更直观地展示了企业用电的相关信息,还可以使用图算法,对各类信息之间的关系进行深度搜索。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的电力用户知识图谱分析方法的电力用户知识图谱分析装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个电力用户知识图谱分析装置实施例中的具体限定可以参见上文中对于电力用户知识图谱分析方法的限定,在此不再赘述。
在一个实施例中,如图6所示,提供了一种电力用户知识图谱分析装置,包括:第一获取模块500、第二获取模块502 、关联模块504、实体创建模块506和分析模块508,其中:
第一获取模块500,用于获取待分析电力系统中各个服务提供者的关联信息;关联信息包括服务提供者的用电量和服务提供者的名称。
第二获取模块502,用于根据预设词典解析名称,得到各个服务提供者的名称中包含的位置信息、所提供的服务以及服务提供者的标识名称;根据标识名称对各个服务提供者进行分组,并根据每个分组中服务提供者的名称相似度对名称进行对齐,得到对齐后的名称。
关联模块504,用于根据对齐后的名称查询服务提供者数据库,关联各身份信息至对应的各个服务提供者。
实体创建模块506,用于分别创建服务提供者的名称、位置信息、所提供的服务和标识名称对应的实体,得到多个实体,并根据用电量和身份信息确定各个实体对应的实体属性。
分析模块508,用于根据多个实体、各个实体对应的实体属性以及各个实体之间的关联关系,构建待分析电力系统对应的知识图谱,根据知识图谱对待分析电力系统进行分析;知识图谱包括服务提供者、名称、位置信息、所提供的服务和标识名称分别对应的实体。
在一个实施例中,上述第一获取模块500,具体用于获取待分析电力系统中的多个候选服务提供者的关联信息;候选服务提供者的关联信息包括候选服务提供者的名称、候选服务提供者的用户类型、候选服务提供者对应的多个计量点以及各个计量点的用电量;根据候选服务提供者对应的用户类型和各个计量点的用电量,从多个候选服务提供者确定出用电量满足设定条件的多个服务提供者,并获取多个服务提供者的关联信息。
在一个实施例中,上述第一获取模块500,具体用于获取多个候选服务提供者中用户类型为公线专变类型和专线专变类型的多个候选服务提供者;根据多个候选服务提供者中目标计量点的用电量,对多个候选服务提供者进行倒序排序,得到候选服务提供者列表;目标计量点表征各个候选服务提供者对应的用于检测用电量对应的资源数值的计量点;将候选服务提供者列表中排在前预设名次的多个候选服务提供者,确定为多个服务提供者。
在一个实施例中,上述第一获取模块500,具体用于获取待分析电力系统中各个服务提供者对应的原始名称以及各个服务提供者的用电量;原始名称中包括服务提供者的名称,以及线路名称和/或变电站名称;根据预设正则表达式,去除原始名称中的线路名称和/或变电站名称,得到服务提供者的名称;根据各个服务提供者的名称和服务提供者的用电量,得到各个服务提供者的关联信息。
在一个实施例中,上述第二获取模块502,具体用于获取预设词典;预设词典包地理信息词典、行业信息词典和组织后缀词典;针对每个名称,根据词典生成该名称对应的前缀树;前缀树中每层包括预设词典中的一个字符;根据前缀树扫描该名称,得到由该名称中的各个字符组成的有向无环图;根据动态规划算法,获取有向无环图中对应的多个候选词,根据地理信息词典解析多个候选词中的位置信息、根据行业信息词典解析多个候选词中的所提供的服务、根据组织后缀词典解析多个候选词中名称对应的组织后缀,以及根据解析位置信息、所提供的服务和组织后缀后剩余的候选词,作为标识名称。
在一个实施例中,上述第二获取模块502,具体用于根据包含相同标识名称的至少两个服务提供者的名称,得到同类服务提供者的名称集;将同类服务提供者的名称集中相似度大于或等于预设相似度阈值的至少两个标识名称,对齐至同一服务提供者的名称,得到对齐后的名称。
在一个实施例中,上述实体创建模块506,具体用于创建位置信息中的省份实体、地市实体和区县实体;获取服务提供者的身份信息,分别作为省份实体、地市实体和区县实体的实体属性;创建服务提供者对应的用户实体,获取服务提供者对应的用电类型、用户类型和电压等级,作为用户实体的实体属性;创建名称对应的名称实体、所提供的服务的服务实体、以及标识名称对应的标识名称实体;将服务提供者的身份信息,分别作为名称实体、服务实体和标识名称实体的实体属性。
在一个实施例中,上述分析模块508,具体用于根据地市实体与对应的省份实体间的上级组织关系,创建第一关联关系;根据区县实体与对应的地市实体间的上级组织关系,创建第二关联关系;根据用户实体与对应的服务实体间的所属行业关系,创建第三关联关系;根据用户实体与对应的区县实体间的所处位置关系,创建第四关联关系;根据用户实体与对应的名称实体间的所属主体关系,创建第五关联关系;根据名称与对应的标识名称间的所属品牌关系,创建第六关联关系;根据第一关联关系、第二关联关系、第三关联关系、第四关联关系、第五关联关系和第六关联关系,构建知识图谱。
上述电力用户知识图谱分析装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种电力用户知识图谱分析方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述的电力用户知识图谱分析方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的电力用户知识图谱分析方法。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的电力用户知识图谱分析方法。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random AccessMemory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种电力用户知识图谱分析方法,其特征在于,所述方法包括:
获取待分析电力系统中各个服务提供者的关联信息;所述关联信息包括所述服务提供者的用电量和所述服务提供者的名称;
根据预设词典解析所述名称,得到各个所述服务提供者的名称中包含的位置信息、所提供的服务以及所述服务提供者的标识名称,包括:获取预设词典;所述预设词典包地理信息词典、行业信息词典和组织后缀词典;针对每个名称,根据所述词典生成该名称对应的前缀树;所述前缀树中每层包括所述预设词典中的一个字符;根据所述前缀树扫描该名称,得到由该名称中的各个字符组成的有向无环图;根据动态规划算法,获取所述有向无环图中对应的多个候选词,根据所述地理信息词典解析所述多个候选词中的位置信息、根据所述行业信息词典解析所述多个候选词中的所提供的服务、根据所述组织后缀词典解析所述多个候选词中所述名称对应的组织后缀,以及根据解析所述位置信息、所提供的服务和组织后缀后剩余的候选词,作为所述标识名称;所述标识名称表征所述服务提供者的品牌名称;
根据所述标识名称对各个服务提供者进行分组,并根据每个分组中服务提供者的名称相似度对所述名称进行对齐,得到对齐后的名称,包括:根据包含相同标识名称的至少两个服务提供者的名称,得到同类服务提供者的名称集;将所述同类服务提供者的名称集中相似度大于或等于预设相似度阈值的至少两个标识名称,对齐至同一服务提供者的名称,得到对齐后的名称;
根据所述对齐后的名称查询服务提供者数据库,关联各身份信息至对应的各个服务提供者;
分别创建所述服务提供者的名称、位置信息、所提供的服务和标识名称对应的实体,得到多个实体,并根据所述用电量和所述身份信息确定各个实体对应的实体属性;
根据所述多个实体、各个实体对应的实体属性以及各个实体之间的关联关系,构建所述待分析电力系统对应的知识图谱,根据所述知识图谱对所述待分析电力系统进行分析;所述知识图谱包括所述服务提供者、所述名称、位置信息、所提供的服务和标识名称分别对应的实体。
2.根据权利要求1所述的方法,其特征在于,所述获取待分析电力系统中各个服务提供者的关联信息,包括:
获取待分析电力系统中的多个候选服务提供者的关联信息;所述候选服务提供者的关联信息包括候选服务提供者的名称、候选服务提供者的用户类型、候选服务提供者对应的多个计量点以及各个计量点的用电量;
根据所述候选服务提供者对应的所述用户类型和所述各个计量点的用电量,从所述多个候选服务提供者确定出用电量满足设定条件的多个服务提供者,并获取所述多个服务提供者的关联信息。
3.根据权利要求2所述的方法,其特征在于,所述用户类型包括公线专变类型和专线专变类型;
所述根据所述候选服务提供者对应的所述用户类型和所述各个计量点的用电量,从所述多个候选服务提供者确定出用电量满足设定条件的多个服务提供者,包括:
获取所述多个候选服务提供者中用户类型为公线专变类型和专线专变类型的多个候选服务提供者;
根据所述多个候选服务提供者中目标计量点的用电量,对所述多个候选服务提供者进行倒序排序,得到候选服务提供者列表;所述目标计量点表征各个候选服务提供者对应的用于检测用电量对应的资源数值的计量点;
将所述候选服务提供者列表中排在前预设名次的多个候选服务提供者,确定为所述多个服务提供者。
4.根据权利要求1所述的方法,其特征在于,所述获取待分析电力系统中各个服务提供者的关联信息,还包括:
获取所述待分析电力系统中各个服务提供者对应的原始名称以及各个服务提供者的用电量;所述原始名称中包括所述服务提供者的名称,以及线路名称和/或变电站名称;
根据预设正则表达式,去除所述原始名称中的线路名称和/或变电站名称,得到所述服务提供者的名称;
根据各个服务提供者的名称和所述服务提供者的用电量,得到各个服务提供者的关联信息。
5.根据权利要求1所述的方法,其特征在于,所述分别创建所述服务提供者的名称、位置信息、所提供的服务和标识名称对应的实体,得到多个实体,并根据所述用电量和所述身份信息确定各个实体对应的实体属性,包括以下三项:
创建所述位置信息中的省份实体、地市实体和区县实体;获取所述服务提供者的身份信息,分别作为所述省份实体、地市实体和区县实体的实体属性;
创建所述服务提供者对应的用户实体,获取所述服务提供者对应的用电类型、用户类型和电压等级,作为所述用户实体的实体属性;
创建所述名称对应的名称实体、所述所提供的服务的服务实体、以及所述标识名称对应的标识名称实体;将所述服务提供者的身份信息,分别作为所述名称实体、所述服务实体和所述标识名称实体的实体属性。
6.根据权利要求5所述的方法, 其特征在于,所述根据所述多个实体、各个实体对应的实体属性以及各个实体之间的关联关系,构建所述待分析电力系统对应的知识图谱,包括:
根据所述地市实体与对应的省份实体间的上级组织关系,创建第一关联关系;
根据所述区县实体与对应的地市实体间的上级组织关系,创建第二关联关系;
根据所述用户实体与对应的服务实体间的所属行业关系,创建第三关联关系;
根据所述用户实体与对应的区县实体间的所处位置关系,创建第四关联关系;
根据所述用户实体与对应的名称实体间的所属主体关系,创建第五关联关系;
根据所述名称与对应的标识名称间的所属品牌关系,创建第六关联关系;
根据所述第一关联关系、所述第二关联关系、第三关联关系、所述第四关联关系、所述第五关联关系和所述第六关联关系,构建所述知识图谱。
7.一种电力用户知识图谱分析装置,其特征在于,所述装置包括:
第一获取模块,用于获取待分析电力系统中各个服务提供者的关联信息;所述关联信息包括所述服务提供者的用电量和所述服务提供者的名称;
第二获取模块,用于根据预设词典解析所述名称,得到各个所述服务提供者的名称中包含的位置信息、所提供的服务以及所述服务提供者的标识名称,具体用于获取预设词典;所述预设词典包地理信息词典、行业信息词典和组织后缀词典;针对每个名称,根据所述词典生成该名称对应的前缀树;所述前缀树中每层包括所述预设词典中的一个字符;根据所述前缀树扫描该名称,得到由该名称中的各个字符组成的有向无环图;根据动态规划算法,获取所述有向无环图中对应的多个候选词,根据所述地理信息词典解析所述多个候选词中的位置信息、根据所述行业信息词典解析所述多个候选词中的所提供的服务、根据所述组织后缀词典解析所述多个候选词中所述名称对应的组织后缀,以及根据解析所述位置信息、所提供的服务和组织后缀后剩余的候选词,作为所述标识名称;所述标识名称表征所述服务提供者的品牌名称;根据所述标识名称对各个服务提供者进行分组,并根据每个分组中服务提供者的名称相似度对所述名称进行对齐,得到对齐后的名称,具体用于根据包含相同标识名称的至少两个服务提供者的名称,得到同类服务提供者的名称集;将所述同类服务提供者的名称集中相似度大于或等于预设相似度阈值的至少两个标识名称,对齐至同一服务提供者的名称,得到对齐后的名称;
关联模块,用于根据所述对齐后的名称查询服务提供者数据库,关联各身份信息至对应的各个服务提供者;
实体创建模块,用于分别创建所述服务提供者的名称、位置信息、所提供的服务和标识名称对应的实体,得到多个实体,并根据所述用电量和所述身份信息确定各个实体对应的实体属性;
分析模块,用于根据所述多个实体、各个实体对应的实体属性以及各个实体之间的关联关系,构建所述待分析电力系统对应的知识图谱,根据所述知识图谱对所述待分析电力系统进行分析;所述知识图谱包括所述服务提供者、所述名称、位置信息、所提供的服务和标识名称分别对应的实体。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202310296133.7A 2023-03-24 2023-03-24 电力用户知识图谱分析方法、装置和计算机设备 Active CN116010626B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310296133.7A CN116010626B (zh) 2023-03-24 2023-03-24 电力用户知识图谱分析方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310296133.7A CN116010626B (zh) 2023-03-24 2023-03-24 电力用户知识图谱分析方法、装置和计算机设备

Publications (2)

Publication Number Publication Date
CN116010626A CN116010626A (zh) 2023-04-25
CN116010626B true CN116010626B (zh) 2023-06-27

Family

ID=86021319

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310296133.7A Active CN116010626B (zh) 2023-03-24 2023-03-24 电力用户知识图谱分析方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN116010626B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115292507A (zh) * 2022-06-28 2022-11-04 北京北大千方科技有限公司 基于知识图谱的交通出行分析方法、装置、设备及介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2014233499A1 (en) * 2013-03-15 2015-11-05 Neura Labs Corp. Intelligent internet system with adaptive user interface providing one-step access to knowledge
CN114996467A (zh) * 2021-03-01 2022-09-02 天津科技大学 基于语义相似度的知识图谱实体属性对齐算法
CN113591457B (zh) * 2021-07-30 2023-10-24 平安科技(深圳)有限公司 文本纠错方法、装置、设备及存储介质
CN115730087A (zh) * 2022-12-07 2023-03-03 城云科技(中国)有限公司 基于知识图谱的矛盾纠纷分析和预警方法及其应用
CN115659985B (zh) * 2022-12-09 2023-03-31 南方电网数字电网研究院有限公司 电力知识图谱实体对齐方法、装置和计算机设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115292507A (zh) * 2022-06-28 2022-11-04 北京北大千方科技有限公司 基于知识图谱的交通出行分析方法、装置、设备及介质

Also Published As

Publication number Publication date
CN116010626A (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
CN106250568B (zh) 服务范围确定方法、物流服务提供方推荐方法及相应装置
Fournier-Viger et al. Mining correlated high-utility itemsets using various measures
Zhang et al. Mesoscale structures in world city networks
WO2016110121A1 (zh) 数据栅格化、用户行为分析的方法和装置
CN102682059A (zh) 用于将用户分配到集群的方法和系统
CN111046237A (zh) 用户行为数据处理方法、装置、电子设备及可读介质
CN104281891A (zh) 一种时间序列数据挖掘方法及系统
CN111310032A (zh) 资源推荐方法、装置、计算机设备及可读存储介质
Liu et al. Coupled clustering of time-series and networks
Cao et al. SoLoMo analytics for telco Big Data monetization
CN107798450B (zh) 业务分配方法和装置
CN116010626B (zh) 电力用户知识图谱分析方法、装置和计算机设备
CN109522934A (zh) 一种基于聚类算法的电力用户聚类方法
CN117390011A (zh) 报表数据处理方法、装置、计算机设备和存储介质
CN116228374A (zh) 物流行业市场单量数据预警方法、装置、设备及存储介质
CN116340354A (zh) 数据查询方法、装置、计算机设备及计算机可读存储介质
CN115658779A (zh) 一种人口数据显示方法和装置
CN113934729A (zh) 一种基于知识图谱的数据管理方法、相关设备及介质
Wang et al. Integrating algebraic multigrid method in spatial aggregation of massive trajectory data
CN107766380B (zh) 一种业务数据的均衡分布及搜索方法及其装置、系统
CN114416235B (zh) 单据展示方法、装置、计算机设备和存储介质
CN117131245B (zh) 一种运用知识图谱技术实现目录资源推荐机制的方法
CN113590732B (zh) 遥感解译样本点的显示方法、装置、电子设备及存储介质
CN114490569B (zh) 地块历史数据追溯方法、装置、设备及存储介质
Cheng et al. Communities discovery in mobile call records

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant