CN113094515A - 基于电力营销数据的知识图谱实体及链接提取方法 - Google Patents

基于电力营销数据的知识图谱实体及链接提取方法 Download PDF

Info

Publication number
CN113094515A
CN113094515A CN202110394352.XA CN202110394352A CN113094515A CN 113094515 A CN113094515 A CN 113094515A CN 202110394352 A CN202110394352 A CN 202110394352A CN 113094515 A CN113094515 A CN 113094515A
Authority
CN
China
Prior art keywords
marketing data
power marketing
entity
name
electric
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110394352.XA
Other languages
English (en)
Inventor
张禄
陆斯悦
李香龙
段大鹏
邱明泉
林华
赵宇彤
马龙飞
王培祎
马慧远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Beijing Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Beijing Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Beijing Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202110394352.XA priority Critical patent/CN113094515A/zh
Publication of CN113094515A publication Critical patent/CN113094515A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种基于电力营销数据的知识图谱实体及链接提取方法。该方法包括:获取电力营销数据库名;获取电力营销数据表名;获取电力营销数据字段名;获取电力营销数据内容;基于电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接,链接包括电力营销数据库与电力营销数据表之间的关系和电力营销数据表与电力营销数据字段之间的关系。本方案实现了将知识图谱技术应用于电力营销数据领域,实现了基于电力营销数据的知识图谱实体及链接的提取。

Description

基于电力营销数据的知识图谱实体及链接提取方法
技术领域
本申请涉及电力营销领域,具体而言,涉及一种基于电力营销数据的知识图谱实体及链接提取方法、装置、计算机可读存储介质和处理器。
背景技术
知识图谱以结构化的形式描述客观世界中概念、实体及实体之间的关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。知识图谱给互联网语义搜索带来了活力,已经成为互联网知识驱动的智能应用的基础设施。知识图谱与大数据和深度学习一起,成为推动互联网和人工智能发展的核心驱动力之一。
知识图谱技术是知识图谱建立和应用的技术,是语义Web、自然语言处理和机器学习等的交叉学科。我们将知识图谱技术分为三个部分:知识图谱构建技术、知识图谱查询和推理技术,以及知识图谱应用。在大数据环境下,从互联网开放环境的大数据中获得知识,用这些知识提供智能服务互联网/行业,同时通过互联网可以获得更多的知识。这是一个迭代的相互增强过程,可以实现从互联网信息服务到智能知识服务的跃迁。
目前大部分知识图谱的提取是基于互联网大数据全业务的实体及链接提取、存储,并不能对部分的传统业务进行充分提取、存储实体。具体地,现有技术中缺乏一种基于电力营销数据的知识图谱实体及链接提取、存储方法。
发明内容
本申请的主要目的在于提供一种基于电力营销数据的知识图谱实体及链接提取方法、装置、计算机可读存储介质和处理器,以解决现有技术中缺乏一种基于电力营销数据的知识图谱实体及链接提取方法的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种基于电力营销数据的知识图谱实体及链接提取方法,包括:获取电力营销数据库名;获取电力营销数据表名;获取电力营销数据字段名;获取电力营销数据内容;基于所述电力营销数据库名、所述电力营销数据表名、所述电力营销数据字段名和所述电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接,所述链接包括电力营销数据库与电力营销数据表之间的关系和所述电力营销数据表与电力营销数据字段之间的关系。
进一步地,从电力营销数据中提取出实体,包括:根据所述电力营销数据库名的业务含义,提取所述实体。
进一步地,从电力营销数据中提取出实体,包括:根据所述电力营销数据表名的业务含义,提取出所述实体;结合所述实体和所述电力营销数据库名的业务含义,提取出隐含实体。
进一步地,从电力营销数据中提取出实体,包括:根据所述电力营销数据字段名,提取出所述实体;结合所述实体、所述电力营销数据表名的业务含义和所述电力营销数据库名的业务含义,提取出隐含实体。
进一步地,从电力营销数据中提取出实体,包括:根据所述电力营销数据内容,提取出所述实体;结合所述实体、所述电力营销数据字段名、所述电力营销数据表名的业务含义和所述电力营销数据库名的业务含义,提取出隐含实体。
进一步地,从电力营销数据中提取出链接,包括:提取出具有从属关系的所述电力营销数据库和所述电力营销数据表之间的关系;提取出具有从属关系的所述电力营销数据表和所述电力营销数据字段之间的关系;提取出不具有从属关系的所述电力营销数据表和所述电力营销数据字段之间的关系。
进一步地,在从电力营销数据中提取出实体和链接之后,所述方法还包括:构建实体表,所述实体表用于存储提取出的所述实体;构建实体链接表,所述实体链接表用于存储所述链接;构建实体主题表,所述实体主题表用于存储不同的主题以区分所述实体表和所述实体链接表。
根据本申请的一个方面,提供了一种基于电力营销数据的知识图谱实体及链接提取装置,包括:第一获取单元,用于获取电力营销数据库名;第二获取单元,用于获取电力营销数据表名;第三获取单元,用于获取电力营销数据字段名;第四获取单元,用于获取电力营销数据内容;提取单元,用于基于所述电力营销数据库名、所述电力营销数据表名、所述电力营销数据字段名和所述电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接,所述链接包括电力营销数据库与电力营销数据表之间的关系和所述电力营销数据表与电力营销数据字段之间的关系。
根据本申请的另一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行任意一种所述的基于电力营销数据的知识图谱实体及链接提取方法。
根据本申请的一个方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行任意一种所述的基于电力营销数据的知识图谱实体及链接提取方法。
应用本申请的技术方案,通过获取电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容,再根据电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接。本方案实现了将知识图谱技术应用于电力营销数据领域,实现了基于电力营销数据的知识图谱实体及链接的提取。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了根据本申请的实施例的基于电力营销数据的知识图谱实体及链接提取方法流程图;
图2示出了根据本申请的实施例的基于电力营销数据的知识图谱实体及链接提取装置示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应该理解的是,当元件(诸如层、膜、区域、或衬底)描述为在另一元件“上”时,该元件可直接在该另一元件上,或者也可存在中间元件。而且,在说明书以及权利要求书中,当描述有元件“连接”至另一元件时,该元件可“直接连接”至该另一元件,或者通过第三元件“连接”至该另一元件。
正如背景技术中所介绍的,现有技术中缺乏一种基于电力营销数据的知识图谱实体及链接提取方法,为解决如上现有技术中缺乏一种基于电力营销数据的知识图谱实体及链接提取方法的问题,本申请的实施例提供了一种基于电力营销数据的知识图谱实体及链接提取方法、装置、计算机可读存储介质和处理器。
根据本申请的实施例,提供了一种基于电力营销数据的知识图谱实体及链接提取方法。
图1是根据本申请实施例的基于电力营销数据的知识图谱实体及链接提取方法的流程图。如图1所示,该方法包括以下步骤:
步骤S101,获取电力营销数据库名;
步骤S102,获取电力营销数据表名;
步骤S103,获取电力营销数据字段名;
步骤S104,获取电力营销数据内容;
步骤S105,基于上述电力营销数据库名、上述电力营销数据表名、上述电力营销数据字段名和上述电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接,上述链接包括电力营销数据库与电力营销数据表之间的关系和上述电力营销数据表与电力营销数据字段之间的关系。
具体地,电力营销数据内容包括分词、词频、词义。
具体地,在基于电力营销数据的知识图谱提取实体及链接之前,建立电力营销数据库、电力营销数据表、电力营销数据字段和电力营销数据内容。
上述方案中,通过获取电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容,再根据电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接。本方案实现了将知识图谱技术应用于电力营销数据领域,实现了基于电力营销数据的知识图谱实体及链接的提取。且提取出的实体更有效和实用。推动了电力相关实体及链接的发掘进程。从业务梳理方面来说,加快了业务整理、关联的步伐。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请的一种实施例中,从电力营销数据中提取出实体,包括:根据上述电力营销数据库名的业务含义,提取上述实体。即可以仅仅根据电力营销数据库名的业务含义,提取出对应的实体,该实体是一个相对较上位的概念。
本申请的一种实施例中,从电力营销数据中提取出实体,包括:根据上述电力营销数据表名的业务含义,提取出上述实体;结合上述实体和上述电力营销数据库名的业务含义,提取出隐含实体。即可以先根据数据表名的业务含义,提取出实体,然后再结合数据库名的业务含义,将提取出的实体的隐含含义提出出来,即提取出隐含实体。例如,根据数据表名提出的实体为“用户用电量”,将“用户用电量”放在“小区用电量”这一数据库中可以得到“该用户在本小区的用电量排名”,将“用户用电量”放在“城市用电量”这一数据库中可以得到“该用户在本市的用电量排名”,其中,“该用户在本小区的用电量排名”和“该用户在本市的用电量排名”即为隐含实体。
本申请的一种实施例中,从电力营销数据中提取出实体,包括:根据上述电力营销数据字段名,提取出上述实体;结合上述实体、上述电力营销数据表名的业务含义和上述电力营销数据库名的业务含义,提取出隐含实体。即先根据电力营销数据字段名提取出实体,再结合电力营销数据表名的业务含义和上述电力营销数据库名的业务含义提取出实体的隐藏的含义。
本申请的一种实施例中,从电力营销数据中提取出实体,包括:根据上述电力营销数据内容,提取出上述实体;结合上述实体、上述电力营销数据字段名、上述电力营销数据表名的业务含义和上述电力营销数据库名的业务含义,提取出隐含实体。
本申请的一种实施例中,从电力营销数据中提取出链接,包括:提取出具有从属关系的上述电力营销数据库和上述电力营销数据表之间的关系;提取出具有从属关系的上述电力营销数据表和上述电力营销数据字段之间的关系;提取出不具有从属关系的上述电力营销数据表和上述电力营销数据字段之间的关系。由于实体基于电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容得到的,所以得到电力营销数据库和上述电力营销数据表之间的关系、电力营销数据表和上述电力营销数据字段之间的关系自然就可以得到提取出的不同的实体之间的关系。例如,第一实体是从第一电力营销数据库中提取得到的,第二实体是从第一电力营销数据表中提取得到的,由于第一电力营销数据表隶属于第一电力营销数据库,显然第二实体隶属于第一实体。
具体地,数据表一般包含自己拥有的所有字段,所以可以直接提取具有从属关系的数据表与字段的关系;有的数据表可以包括其他数据表的字段,所以也可以提取其他数据表的字段与本数据表的关系。当然,由于相同的字段可以位于不同的数据表中,也可以提取出位于不同的数据表中的相同的字段之间的关系。
本申请的一种实施例中,从电力营销数据中提取出链接,包括:提取出电力营销数据表与电力营销数据表之间的关系,由于数据表有基本表、关联表、父子表,其中关联表和父子表是可以根据主外键去提取业务关系的。
本申请的一种实施例中,从电力营销数据中提取出链接,包括:提取出电力营销数据内容与电力营销数据字段之间的关系。
本申请的一种实施例中,在从电力营销数据中提取出实体和链接之后,上述方法还包括:构建实体表,上述实体表用于存储提取出的上述实体;构建实体链接表,上述实体链接表用于存储上述链接;构建实体主题表,上述实体主题表用于存储不同的主题以区分上述实体表和上述实体链接表。实现了对电力营销数据的专业存储,更有针对性,构建的业务关联更加准确。具体地,实体表如表1所示,实体链接表如表2所示,实体主题表如表3所示。
表1实体表
Figure BDA0003017974590000051
Figure BDA0003017974590000061
表2实体链接表
名称 描述 备注
ID 唯一标识 备注
NAME 边名称
SOURCE 边开始端 同一主题下可以重复
TARGET 边结束端
L_DESC 边描述
JSON_DESC 边json描述
L_TYPE_DESC 边类型描述
GRAPH_THEME_ID 主题ID
表3实体主题表
名称 描述 备注
ID 唯一标识
PARENT_ID 父id
THEME_CODE 主题编码
THEME_NAME 主题名称
THEME_DESC 主题描述
THEME_PATH 节点路径
LEAFED 是否为子节点 (1是,0否)
SORT_NUM 排序
本申请实施例还提供了一种基于电力营销数据的知识图谱实体及链接提取装置,需要说明的是,本申请实施例的基于电力营销数据的知识图谱实体及链接提取装置可以用于执行本申请实施例所提供的用于基于电力营销数据的知识图谱实体及链接提取方法。以下对本申请实施例提供的基于电力营销数据的知识图谱实体及链接提取装置进行介绍。
图2是根据本申请实施例的基于电力营销数据的知识图谱实体及链接提取装置的示意图。如图2所示,该装置包括:
第一获取单元10,用于获取电力营销数据库名;
第二获取单元20,用于获取电力营销数据表名;
第三获取单元30,用于获取电力营销数据字段名;
第四获取单元40,用于获取电力营销数据内容;
提取单元50,用于基于上述电力营销数据库名、上述电力营销数据表名、上述电力营销数据字段名和上述电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接,上述链接包括电力营销数据库与电力营销数据表之间的关系和上述电力营销数据表与电力营销数据字段之间的关系。
具体地,电力营销数据内容包括分词、词频、词义。
具体地,在基于电力营销数据的知识图谱提取实体及链接之前,建立电力营销数据库、电力营销数据表、电力营销数据字段和电力营销数据内容。
上述方案中,第一获取单元获取电力营销数据库名、第二获取单元获取电力营销数据表名、第三获取单元获取电力营销数据字段名和第四获取单元获取电力营销数据内容,提取单元根据电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接。本方案实现了将知识图谱技术应用于电力营销数据领域,实现了基于电力营销数据的知识图谱实体及链接的提取。且提取出的实体更有效和实用。推动了电力相关实体及链接的发掘进程。从业务梳理方面来说,加快了业务整理、关联的步伐。
本申请的一种实施例中,提取单元还用于根据上述电力营销数据库名的业务含义,提取上述实体。即可以仅仅根据电力营销数据库名的业务含义,提取出对应的实体,该实体是一个相对较上位的概念。
本申请的一种实施例中,提取单元包括第一提取模块和第二提取模块,第一提取模块用于根据上述电力营销数据表名的业务含义,提取出上述实体;第二提取模块用于结合上述实体和上述电力营销数据库名的业务含义,提取出隐含实体。即可以先根据数据表名的业务含义,提取出实体,然后再结合数据库名的业务含义,将提取出的实体的隐含含义提出出来,即提取出隐含实体。例如,根据数据表名提出的实体为“用户用电量”,将“用户用电量”放在“小区用电量”这一数据库中可以得到“该用户在本小区的用电量排名”,将“用户用电量”放在“城市用电量”这一数据库中可以得到“该用户在本市的用电量排名”,其中,“该用户在本小区的用电量排名”和“该用户在本市的用电量排名”即为隐含实体。
本申请的一种实施例中,提取单元包括第三提取模块和第四提取模块,第三提取模块用于根据上述电力营销数据字段名,提取出上述实体;第四提取模块用于结合上述实体、上述电力营销数据表名的业务含义和上述电力营销数据库名的业务含义,提取出隐含实体。即先根据电力营销数据字段名提取出实体,再结合电力营销数据表名的业务含义和上述电力营销数据库名的业务含义提取出实体的隐藏的含义。
本申请的一种实施例中,提取单元包括第五提取模块和第六提取模块,第五提取模块用于根据上述电力营销数据内容,提取出上述实体;第六提取模块用于结合上述实体、上述电力营销数据字段名、上述电力营销数据表名的业务含义和上述电力营销数据库名的业务含义,提取出隐含实体。
本申请的一种实施例中,提取单元包括第七提取模块、第八提取模块和第九提取模块,第七提取模块用于提取出具有从属关系的上述电力营销数据库和上述电力营销数据表之间的关系;第八提取模块用于提取出具有从属关系的上述电力营销数据表和上述电力营销数据字段之间的关系;第九提取模块用于提取出不具有从属关系的上述电力营销数据表和上述电力营销数据字段之间的关系。由于实体基于电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容得到的,所以得到电力营销数据库和上述电力营销数据表之间的关系、电力营销数据表和上述电力营销数据字段之间的关系自然就可以得到提取出的不同的实体之间的关系。例如,第一实体是从第一电力营销数据库中提取得到的,第二实体是从第一电力营销数据表中提取得到的,由于第一电力营销数据表隶属于第一电力营销数据库,显然第二实体隶属于第一实体。
本申请的一种实施例中,上述装置还包括第一构建单元、第二构建单元和第三构建单元,第一构建单元用于在从电力营销数据中提取出实体和链接之后,构建实体表,上述实体表用于存储提取出的上述实体;第二构建单元用于在从电力营销数据中提取出实体和链接之后,构建实体链接表,上述实体链接表用于存储上述链接;第三构建单元用于在从电力营销数据中提取出实体和链接之后,构建实体主题表,上述实体主题表用于存储不同的主题以区分上述实体表和上述实体链接表。实现了对电力营销数据的专业存储,更有针对性,构建的业务关联更加准确。
所述基于电力营销数据的知识图谱实体及链接提取装置包括处理器和存储器,上述第一获取单元、第二获取单元、第三获取单元、第四获取单元和提取单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现基于电力营销数据的知识图谱实体及链接的提取。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行所述基于电力营销数据的知识图谱实体及链接提取方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述基于电力营销数据的知识图谱实体及链接提取方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现至少以下步骤:
步骤S101,获取电力营销数据库名;
步骤S102,获取电力营销数据表名;
步骤S103,获取电力营销数据字段名;
步骤S104,获取电力营销数据内容;
步骤S105,基于上述电力营销数据库名、上述电力营销数据表名、上述电力营销数据字段名和上述电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接,上述链接包括电力营销数据库与电力营销数据表之间的关系和上述电力营销数据表与电力营销数据字段之间的关系。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有至少如下方法步骤的程序:
步骤S101,获取电力营销数据库名;
步骤S102,获取电力营销数据表名;
步骤S103,获取电力营销数据字段名;
步骤S104,获取电力营销数据内容;
步骤S105,基于上述电力营销数据库名、上述电力营销数据表名、上述电力营销数据字段名和上述电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接,上述链接包括电力营销数据库与电力营销数据表之间的关系和上述电力营销数据表与电力营销数据字段之间的关系。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
从以上的描述中,可以看出,本申请上述的实施例实现了如下技术效果:
1)、本申请的基于电力营销数据的知识图谱实体及链接提取方法,通过获取电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容,再根据电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接。本方案实现了将知识图谱技术应用于电力营销数据领域,实现了基于电力营销数据的知识图谱实体及链接的提取。
2)、本申请的基于电力营销数据的知识图谱实体及链接提取装置,第一获取单元获取电力营销数据库名、第二获取单元获取电力营销数据表名、第三获取单元获取电力营销数据字段名和第四获取单元获取电力营销数据内容,提取单元根据电力营销数据库名、电力营销数据表名、电力营销数据字段名和电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接。本方案实现了将知识图谱技术应用于电力营销数据领域,实现了基于电力营销数据的知识图谱实体及链接的提取。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于电力营销数据的知识图谱实体及链接提取方法,其特征在于,包括:
获取电力营销数据库名;
获取电力营销数据表名;
获取电力营销数据字段名;
获取电力营销数据内容;
基于所述电力营销数据库名、所述电力营销数据表名、所述电力营销数据字段名和所述电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接,所述链接包括电力营销数据库与电力营销数据表之间的关系和所述电力营销数据表与电力营销数据字段之间的关系。
2.根据权利要求1所述的方法,其特征在于,从电力营销数据中提取出实体,包括:
根据所述电力营销数据库名的业务含义,提取所述实体。
3.根据权利要求1所述的方法,其特征在于,从电力营销数据中提取出实体,包括:
根据所述电力营销数据表名的业务含义,提取出所述实体;
结合所述实体和所述电力营销数据库名的业务含义,提取出隐含实体。
4.根据权利要求1所述的方法,其特征在于,从电力营销数据中提取出实体,包括:
根据所述电力营销数据字段名,提取出所述实体;
结合所述实体、所述电力营销数据表名的业务含义和所述电力营销数据库名的业务含义,提取出隐含实体。
5.根据权利要求1所述的方法,其特征在于,从电力营销数据中提取出实体,包括:
根据所述电力营销数据内容,提取出所述实体;
结合所述实体、所述电力营销数据字段名、所述电力营销数据表名的业务含义和所述电力营销数据库名的业务含义,提取出隐含实体。
6.根据权利要求1所述的方法,其特征在于,从电力营销数据中提取出链接,包括:
提取出具有从属关系的所述电力营销数据库和所述电力营销数据表之间的关系;
提取出具有从属关系的所述电力营销数据表和所述电力营销数据字段之间的关系;
提取出不具有从属关系的所述电力营销数据表和所述电力营销数据字段之间的关系。
7.根据权利要求1所述的方法,其特征在于,在从电力营销数据中提取出实体和链接之后,所述方法还包括:
构建实体表,所述实体表用于存储提取出的所述实体;
构建实体链接表,所述实体链接表用于存储所述链接;
构建实体主题表,所述实体主题表用于存储不同的主题以区分所述实体表和所述实体链接表。
8.一种基于电力营销数据的知识图谱实体及链接提取装置,其特征在于,包括:
第一获取单元,用于获取电力营销数据库名;
第二获取单元,用于获取电力营销数据表名;
第三获取单元,用于获取电力营销数据字段名;
第四获取单元,用于获取电力营销数据内容;
提取单元,用于基于所述电力营销数据库名、所述电力营销数据表名、所述电力营销数据字段名和所述电力营销数据内容一个或者多个,从电力营销数据中提取出实体和链接,所述链接包括电力营销数据库与电力营销数据表之间的关系和所述电力营销数据表与电力营销数据字段之间的关系。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至7中任意一项所述的基于电力营销数据的知识图谱实体及链接提取方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的基于电力营销数据的知识图谱实体及链接提取方法。
CN202110394352.XA 2021-04-13 2021-04-13 基于电力营销数据的知识图谱实体及链接提取方法 Pending CN113094515A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110394352.XA CN113094515A (zh) 2021-04-13 2021-04-13 基于电力营销数据的知识图谱实体及链接提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110394352.XA CN113094515A (zh) 2021-04-13 2021-04-13 基于电力营销数据的知识图谱实体及链接提取方法

Publications (1)

Publication Number Publication Date
CN113094515A true CN113094515A (zh) 2021-07-09

Family

ID=76677110

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110394352.XA Pending CN113094515A (zh) 2021-04-13 2021-04-13 基于电力营销数据的知识图谱实体及链接提取方法

Country Status (1)

Country Link
CN (1) CN113094515A (zh)

Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101515290A (zh) * 2009-03-25 2009-08-26 中国工商银行股份有限公司 具有双向互动特征的元数据管理系统及其实现方法
CN104866593A (zh) * 2015-05-29 2015-08-26 中国电子科技集团公司第二十八研究所 一种基于知识图谱的数据库搜索方法
CN105184074A (zh) * 2015-09-01 2015-12-23 哈尔滨工程大学 一种基于多模态医学影像数据模型的医学数据提取和并行加载方法
CN106355627A (zh) * 2015-07-16 2017-01-25 中国石油化工股份有限公司 一种用于生成知识图谱的方法及系统
CN107609052A (zh) * 2017-08-23 2018-01-19 中国科学院软件研究所 一种基于语义三角的领域知识图谱的生成方法及装置
CN108304463A (zh) * 2017-12-26 2018-07-20 中国广核电力股份有限公司 一种用于数据库的数据管理方法及其数据库应用组件
CN108549731A (zh) * 2018-07-11 2018-09-18 中国电子科技集团公司第二十八研究所 一种基于本体模型的知识图谱构建方法
CN109255034A (zh) * 2018-08-08 2019-01-22 数据地平线(广州)科技有限公司 一种基于产业链的行业知识图谱构建方法
CN109597855A (zh) * 2018-11-29 2019-04-09 北京邮电大学 基于大数据驱动的领域知识图谱构建方法及系统
CN109800278A (zh) * 2018-12-29 2019-05-24 亚信科技(南京)有限公司 数据资产图谱使用方法、装置、计算机设备和存储介质
CN110795417A (zh) * 2019-10-30 2020-02-14 北京明略软件系统有限公司 一种知识图谱的存储系统及方法
CN110807100A (zh) * 2019-10-30 2020-02-18 安阳师范学院 一种基于多模态数据的甲骨学知识图谱构建方法及系统
CN110929042A (zh) * 2019-11-26 2020-03-27 昆明能讯科技有限责任公司 一种基于电力企业的知识图谱构建和查询方法
CN111026883A (zh) * 2019-12-11 2020-04-17 南方电网数字电网研究院有限公司 电力业务数据的知识图谱构建方法、装置、设备和介质
CN111159365A (zh) * 2019-11-26 2020-05-15 国网湖南省电力有限公司 调度模型本体智能问答系统的实现方法、系统及存储介质
CN111309868A (zh) * 2020-02-20 2020-06-19 全球能源互联网研究院有限公司 一种知识图谱构建、检索方法及装置
CN111475655A (zh) * 2020-03-05 2020-07-31 国网浙江省电力有限公司 一种基于配电网知识图谱的电力调度文本实体链接方法
CN112069817A (zh) * 2020-07-17 2020-12-11 中国科学院计算机网络信息中心 一种学者知识抽取与融合方法及装置
CN112148735A (zh) * 2020-09-23 2020-12-29 上海爱数信息技术股份有限公司 一种用于结构化表格数据知识图谱的构建方法

Patent Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101515290A (zh) * 2009-03-25 2009-08-26 中国工商银行股份有限公司 具有双向互动特征的元数据管理系统及其实现方法
CN104866593A (zh) * 2015-05-29 2015-08-26 中国电子科技集团公司第二十八研究所 一种基于知识图谱的数据库搜索方法
CN106355627A (zh) * 2015-07-16 2017-01-25 中国石油化工股份有限公司 一种用于生成知识图谱的方法及系统
CN105184074A (zh) * 2015-09-01 2015-12-23 哈尔滨工程大学 一种基于多模态医学影像数据模型的医学数据提取和并行加载方法
CN107609052A (zh) * 2017-08-23 2018-01-19 中国科学院软件研究所 一种基于语义三角的领域知识图谱的生成方法及装置
CN108304463A (zh) * 2017-12-26 2018-07-20 中国广核电力股份有限公司 一种用于数据库的数据管理方法及其数据库应用组件
CN108549731A (zh) * 2018-07-11 2018-09-18 中国电子科技集团公司第二十八研究所 一种基于本体模型的知识图谱构建方法
CN109255034A (zh) * 2018-08-08 2019-01-22 数据地平线(广州)科技有限公司 一种基于产业链的行业知识图谱构建方法
CN109597855A (zh) * 2018-11-29 2019-04-09 北京邮电大学 基于大数据驱动的领域知识图谱构建方法及系统
CN109800278A (zh) * 2018-12-29 2019-05-24 亚信科技(南京)有限公司 数据资产图谱使用方法、装置、计算机设备和存储介质
CN110795417A (zh) * 2019-10-30 2020-02-14 北京明略软件系统有限公司 一种知识图谱的存储系统及方法
CN110807100A (zh) * 2019-10-30 2020-02-18 安阳师范学院 一种基于多模态数据的甲骨学知识图谱构建方法及系统
CN110929042A (zh) * 2019-11-26 2020-03-27 昆明能讯科技有限责任公司 一种基于电力企业的知识图谱构建和查询方法
CN111159365A (zh) * 2019-11-26 2020-05-15 国网湖南省电力有限公司 调度模型本体智能问答系统的实现方法、系统及存储介质
CN111026883A (zh) * 2019-12-11 2020-04-17 南方电网数字电网研究院有限公司 电力业务数据的知识图谱构建方法、装置、设备和介质
CN111309868A (zh) * 2020-02-20 2020-06-19 全球能源互联网研究院有限公司 一种知识图谱构建、检索方法及装置
CN111475655A (zh) * 2020-03-05 2020-07-31 国网浙江省电力有限公司 一种基于配电网知识图谱的电力调度文本实体链接方法
CN112069817A (zh) * 2020-07-17 2020-12-11 中国科学院计算机网络信息中心 一种学者知识抽取与融合方法及装置
CN112148735A (zh) * 2020-09-23 2020-12-29 上海爱数信息技术股份有限公司 一种用于结构化表格数据知识图谱的构建方法

Similar Documents

Publication Publication Date Title
CN108229337B (zh) 一种数据处理的方法、装置及设备
CN113434685B (zh) 一种资讯分类处理的方法及系统
CN113408284A (zh) 文本处理模型的训练方法、装置、电子设备及存储介质
CN117150050B (zh) 一种基于大语言模型的知识图谱构建方法及系统
US9355166B2 (en) Clustering signifiers in a semantics graph
CN112015896A (zh) 基于人工智能的情感分类方法、以及装置
CN111652286A (zh) 一种基于图嵌入的物体识别方法、设备及介质
CN112241458B (zh) 文本的知识结构化处理方法、装置、设备和可读存储介质
CN113094515A (zh) 基于电力营销数据的知识图谱实体及链接提取方法
CN108255891B (zh) 一种判别网页类型的方法及装置
Potts Creative industries & cultural science: A definitional odyssey
CN115374259A (zh) 一种问答数据挖掘方法、装置及电子设备
CN114519106A (zh) 一种基于图神经网络的文档级实体关系抽取方法及系统
CN110210518B (zh) 提取降维特征的方法和装置
CN111552706B (zh) 一种舆情信息的分组方法、装置及设备
CN113190731A (zh) 一种标签构建方法、装置、设备和存储介质
CN112765340A (zh) 一种确定云服务资源的方法、装置、电子设备及存储介质
CN112749269A (zh) 实体舆情计算方法及系统
CN109816007A (zh) 应用程序文字信息的行业分类方法、存储介质及终端设备
CN117349422A (zh) 一种细粒度问答场景下的问答数据生成方法、设备及介质
CN117709456A (zh) 金融数据的知识图谱的构建方法、装置和电子设备
CN115049372B (zh) 针对人力资源信息的数字基础设施构建方法、设备及介质
Ropuszyńska-Surma et al. The identification of the pro-ecological factors influencing a decision to become a prosumer
CN117807177A (zh) 数据处理方法、装置、设备及存储介质
CN117033789A (zh) 业务推荐方案的确定方法、装置、处理器以及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210709