CN115238094A - 基于知识图谱的指标数据分析方法、装置、设备及介质 - Google Patents

基于知识图谱的指标数据分析方法、装置、设备及介质 Download PDF

Info

Publication number
CN115238094A
CN115238094A CN202210883787.5A CN202210883787A CN115238094A CN 115238094 A CN115238094 A CN 115238094A CN 202210883787 A CN202210883787 A CN 202210883787A CN 115238094 A CN115238094 A CN 115238094A
Authority
CN
China
Prior art keywords
index
data
knowledge
graph
knowledge graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210883787.5A
Other languages
English (en)
Inventor
李盼
李彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yuannian Technology Co ltd
Original Assignee
Beijing Yuannian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yuannian Technology Co ltd filed Critical Beijing Yuannian Technology Co ltd
Priority to CN202210883787.5A priority Critical patent/CN115238094A/zh
Publication of CN115238094A publication Critical patent/CN115238094A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Animal Behavior & Ethology (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种基于知识图谱的指标数据分析方法、装置、电子设备及计算机可读存储介质。该基于知识图谱的指标数据分析方法,包括:构建指标知识图谱;在获取指标数据后,利用指标知识图谱对指标数据进行分析。根据本申请实施例,能够提高指标数据分析的准确性和时效性。

Description

基于知识图谱的指标数据分析方法、装置、设备及介质
技术领域
本申请属于数据分析领域,尤其涉及一种基于知识图谱的指标数据分析方法、装置、电子设备及计算机可读存储介质。
背景技术
当今社会,企业竞争日益激烈,数据化运营作为提升企业竞争力的重要手段,目前“经营分析系统”,在各行各业都得到了广泛的应用。经营分析系统的经典应用场景,就是利用指标,进行科学决策,一旦发现指标异常,决策层和执行层都需要马上定位问题,分析原因并制定解决方案。
指标的计算过程往往是非常复杂的,而高层一旦关注,对时效性和准确性就会提出很高的要求,执行层为了短时间内能查清楚问题,不得不投入大量人力,甚至不惜加班加点分析。
现有的系统不能提供很高的支持,仅能提供计算公式的查询,相关数据处理过程的查询等手段,整个分析过程,需要人工一步步分析,耗时费力。
因此,如何提高指标数据分析的准确性和时效性是本领域技术人员亟需解决的技术问题。
发明内容
本申请实施例提供一种基于知识图谱的指标数据分析方法、装置、电子设备及计算机可读存储介质,能够提高指标数据分析的准确性和时效性。
第一方面,本申请实施例提供一种基于知识图谱的指标数据分析方法,包括:
构建指标知识图谱;
在获取指标数据后,利用指标知识图谱对指标数据进行分析。
进一步地,构建指标知识图谱,包括:
获取指标计算相关数据;其中,指标计算相关数据来源于经营分析系统;
根据指标计算相关数据,构建指标本体数据;其中,指标本体数据包括指标的指标名、分类、描述、公式、计算单位、计算周期、关联表、关联表字段;
对指标本体数据进行指标知识提取;
通过图数据库进行指标知识关联的存储。
进一步地,对指标本体数据进行指标知识提取,包括:
获取指标本体数据中指标的指标名、分类、描述、公式、计算单位、计算周期、关联表、关联表字段;
通过信息分类、摘要提取、数据去重、命名实体识别和实体关系抽取技术对这些信息进行处理并构建指标关系组合。
进一步地,命名实体识别,包括:
识别文本中具有特定意义的目标实体;其中,目标实体至少包括人名、地名、机构名、专有名词。
进一步地,图数据库至少包括Neo4j、HugeGraph、JanusGraph。
进一步地,在获取指标数据后,利用指标知识图谱对指标数据进行分析,包括:
通过经营分析系统查看指标数据;
在判断指标数据偏离正常值的情况下,通过经营分析系统向指标知识图谱发起HTTP请求;
指标知识图谱收到HTTP请求后,调用图数据API查询指标知识图谱;
指标知识图谱向经营分析系统返回目标数据;
经营分析系统调用JDBC接口,将目标数据展示给用户进行查看。
进一步地,目标数据的数据格式为指标和计算公式、关联指标以及其相关的表、表字段。
第二方面,本申请实施例提供了一种基于知识图谱的指标数据分析装置,包括:
构建模块,用于构建指标知识图谱;
分析模块,用于在获取指标数据后,利用指标知识图谱对指标数据进行分析。
进一步地,构建模块,用于:
获取指标计算相关数据;其中,指标计算相关数据来源于经营分析系统;
根据指标计算相关数据,构建指标本体数据;其中,指标本体数据包括指标的指标名、分类、描述、公式、计算单位、计算周期、关联表、关联表字段;
对指标本体数据进行指标知识提取;
通过图数据库进行指标知识关联的存储。
进一步地,构建模块,用于:
获取指标本体数据中指标的指标名、分类、描述、公式、计算单位、计算周期、关联表、关联表字段;
通过信息分类、摘要提取、数据去重、命名实体识别和实体关系抽取技术对这些信息进行处理并构建指标关系组合。
进一步地,命名实体识别,包括:
识别文本中具有特定意义的目标实体;其中,目标实体至少包括人名、地名、机构名、专有名词。
进一步地,图数据库至少包括Neo4j、HugeGraph、JanusGraph。
进一步地,分析模块,用于:
通过经营分析系统查看指标数据;
在判断指标数据偏离正常值的情况下,通过经营分析系统向指标知识图谱发起HTTP请求;
指标知识图谱收到HTTP请求后,调用图数据API查询指标知识图谱;
指标知识图谱向经营分析系统返回目标数据;
经营分析系统调用JDBC接口,将目标数据展示给用户进行查看。
进一步地,目标数据的数据格式为指标和计算公式、关联指标以及其相关的表、表字段。
第三方面,本申请实施例提供了一种电子设备,电子设备包括:处理器以及存储有计算机程序指令的存储器;
处理器执行计算机程序指令时实现如第一方面所示的基于知识图谱的指标数据分析方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面所示的基于知识图谱的指标数据分析方法。
本申请实施例的基于知识图谱的指标数据分析方法、装置、电子设备及计算机可读存储介质,能够提高指标数据分析的准确性和时效性。
该基于知识图谱的指标数据分析方法,包括:构建指标知识图谱;在获取指标数据后,利用指标知识图谱对指标数据进行分析。
可见,该方法利用指标知识图谱对指标数据进行分析,能够提高指标数据分析的准确性和时效性。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例提供的经营分析系统和外部数据的结构示意图;
图2是本申请一个实施例提供的指标示意图;
图3是本申请一个实施例提供的基于知识图谱的指标数据分析方法的流程示意图;
图4是本申请一个实施例提供的知识图谱构建示意图;
图5是本申请一个实施例提供的分析数据示意图;
图6是本申请一个实施例提供的基于知识图谱的指标数据分析装置的结构示意图;
图7是本申请一个实施例提供的电子设备的结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了解决现有技术问题,本申请实施例提供了一种基于知识图谱的指标数据分析方法、装置、电子设备及计算机可读存储介质。
在对基于知识图谱的指标数据分析方法进行介绍之前,首先对本申请提供的经营分析系统和外部数据进行说明,具体可参见图1。
经营分析系统:经营分析系统是以业务运营支撑系统中其他系统的数据(外部数据)为基础,各项技术构建统一的系统,帮助企业的经营决策层了解企业经营的现状,发现企业运营的优势和劣势,预测未来趋势;帮助细分市场和客户,指导营销、客服部门进行有针对性的营销和高效的客户关系管理;对决策的执行情况和结果进行客观准确的评估。
外部数据:外部数据范围比较广,无法一概而论,每家企业的数据不尽相同,相同行业的数据会有雷同,但又不完全一样。
本申请涉及一个重要概念——指标,下面对该指标进行举例说明。如图2所示,图2中的销量(549775.955吨)、销量的同比(-)、环比(-57.69%)、完成率(17.29%)均是指标。
下面以完成率为例子,说明完成率(指标)是如何计算的:
完成率=实际销量/目标销量。其中,样例数据为表1所示:
表1
Figure BDA0003765192170000061
Figure BDA0003765192170000071
全公司的完成率(17.29%)=各个部门的实际销量/各个部门的目标销量
下面对本申请实施例所提供的基于知识图谱的指标数据分析方法进行介绍。
图3示出了本申请一个实施例提供的基于知识图谱的指标数据分析方法的流程示意图。如图3所示,该基于知识图谱的指标数据分析方法,包括:
S301、构建指标知识图谱;
为了更加准确地构建指标知识图谱,在一个实施例中,构建指标知识图谱,包括:
获取指标计算相关数据(例如,上例所示的实际销量、目标销量、完成率);其中,指标计算相关数据来源于经营分析系统;
根据指标计算相关数据,构建指标本体数据;其中,指标本体数据包括指标的指标名、分类、描述、公式、计算单位、计算周期、关联表、关联表字段(多个表直接联系的纽带。比如说一个订单的数据中出现了一个用户的id,这个用户id就是关联字段);
对指标本体数据进行指标知识提取;
通过图数据库进行指标知识关联的存储。图数据库能够方便地存储关联密集型数据,可以做到当加入新的数据或属性时,不需要重构网络,并提供了快速查询数据的能力。在一个实施例中,图数据库至少包括Neo4j、HugeGraph、JanusGraph。
该实施例,在根据指标计算相关数据,构建指标本体数据后,对指标本体数据进行指标知识提取,并通过图数据库进行指标知识关联的存储,可以更加准确地构建指标知识图谱。
进一步地,为了更加准确地对指标本体数据进行指标知识提取,在一个实施例中,对指标本体数据进行指标知识提取,包括:
获取指标本体数据中指标的指标名、分类、描述、公式、计算单位、计算周期、关联表、关联表字段;
通过信息分类、摘要提取、数据去重、命名实体识别和实体关系抽取技术对这些信息进行处理并构建指标关系组合。其中,命名实体识别,包括:识别文本中具有特定意义的目标实体;其中,目标实体至少包括人名、地名、机构名、专有名词。
该实施例通过信息分类、摘要提取、数据去重、命名实体识别和实体关系抽取技术对这些信息进行处理并构建指标关系组合,能够更加准确地对指标本体数据进行指标知识提取。
在一个实施例中,如图4所示,先是获取指标计算相关数据,然后构建指标本体,再对该指标本体进行指标知识提取(包括实体抽取、关系抽取、属性抽取),最后依据指标知识关联,构建指标知识图谱。
S302、在获取指标数据后,利用指标知识图谱对指标数据进行分析。
为了更加准确地对指标数据进行分析,在一个实施例中,在获取指标数据后,利用指标知识图谱对指标数据进行分析,包括:
通过经营分析系统查看指标数据;
在判断指标数据偏离正常值的情况下,通过经营分析系统向指标知识图谱发起HTTP请求;
指标知识图谱收到HTTP请求后,调用图数据API查询指标知识图谱;
指标知识图谱向经营分析系统返回目标数据;其中,目标数据的数据格式为指标和计算公式、关联指标以及其相关的表、表字段。以上面的例子为例,将返回完成率(指标)、完成率计算公式(计算公式),实际销量和目标销量(关联指标),实际销量的数据表和字段,目录销量的表和字段(其相关的表、表字段)。
经营分析系统调用JDBC接口,将目标数据展示给用户进行查看。沿用上例,分析数据示意图如图5所示。
图6是本申请一个实施例提供的基于知识图谱的指标数据分析装置的结构示意图,如图6所示,该基于知识图谱的指标数据分析装置,包括:
构建模块601,用于构建指标知识图谱;
分析模块602,用于在获取指标数据后,利用指标知识图谱对指标数据进行分析。
在一个实施例中,构建模块601,用于:
获取指标计算相关数据;其中,指标计算相关数据来源于经营分析系统;
根据指标计算相关数据,构建指标本体数据;其中,指标本体数据包括指标的指标名、分类、描述、公式、计算单位、计算周期、关联表、关联表字段;
对指标本体数据进行指标知识提取;
通过图数据库进行指标知识关联的存储。
在一个实施例中,构建模块601,用于:
获取指标本体数据中指标的指标名、分类、描述、公式、计算单位、计算周期、关联表、关联表字段;
通过信息分类、摘要提取、数据去重、命名实体识别和实体关系抽取技术对这些信息进行处理并构建指标关系组合。
在一个实施例中,命名实体识别,包括:
识别文本中具有特定意义的目标实体;其中,目标实体至少包括人名、地名、机构名、专有名词。
在一个实施例中,图数据库至少包括Neo4j、HugeGraph、JanusGraph。
在一个实施例中,分析模块602,用于:
通过经营分析系统查看指标数据;
在判断指标数据偏离正常值的情况下,通过经营分析系统向指标知识图谱发起HTTP请求;
指标知识图谱收到HTTP请求后,调用图数据API查询指标知识图谱;
指标知识图谱向经营分析系统返回目标数据;
经营分析系统调用JDBC接口,将目标数据展示给用户进行查看。
在一个实施例中,目标数据的数据格式为指标和计算公式、关联指标以及其相关的表、表字段。
图6所示装置中的各个模块/单元具有实现图3中各个步骤的功能,并能达到其相应的技术效果,为简洁描述,在此不再赘述。
图7示出了本申请实施例提供的电子设备的结构示意图。
电子设备可以包括处理器701以及存储有计算机程序指令的存储器702。
具体地,上述处理器701可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器702可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器702可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器702可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器702可在电子设备的内部或外部。在特定实施例中,存储器702可以是非易失性固态存储器。
在一个实施例中,存储器702可以是只读存储器(Read Only Memory,ROM)。在一个实施例中,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器701通过读取并执行存储器702中存储的计算机程序指令,以实现上述实施例中的任意一种基于知识图谱的指标数据分析方法。
在一个示例中,电子设备还可包括通信接口703和总线710。其中,如图7所示,处理器701、存储器702、通信接口703通过总线710连接并完成相互间的通信。
通信接口703,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线710包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线710可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
另外,结合上述实施例中的基于知识图谱的指标数据分析方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种基于知识图谱的指标数据分析方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能模块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本申请的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本申请的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。

Claims (10)

1.一种基于知识图谱的指标数据分析方法,其特征在于,包括:
构建指标知识图谱;
在获取指标数据后,利用所述指标知识图谱对所述指标数据进行分析。
2.根据权利要求1所述的基于知识图谱的指标数据分析方法,其特征在于,所述构建指标知识图谱,包括:
获取指标计算相关数据;其中,所述指标计算相关数据来源于经营分析系统;
根据所述指标计算相关数据,构建指标本体数据;其中,所述指标本体数据包括指标的指标名、分类、描述、公式、计算单位、计算周期、关联表、关联表字段;
对所述指标本体数据进行指标知识提取;
通过图数据库进行指标知识关联的存储。
3.根据权利要求2所述的基于知识图谱的指标数据分析方法,其特征在于,所述对所述指标本体数据进行指标知识提取,包括:
获取所述指标本体数据中指标的指标名、分类、描述、公式、计算单位、计算周期、关联表、关联表字段;
通过信息分类、摘要提取、数据去重、命名实体识别和实体关系抽取技术对这些信息进行处理并构建指标关系组合。
4.根据权利要求3所述的基于知识图谱的指标数据分析方法,其特征在于,所述命名实体识别,包括:
识别文本中具有特定意义的目标实体;其中,所述目标实体至少包括人名、地名、机构名、专有名词。
5.根据权利要求2所述的基于知识图谱的指标数据分析方法,其特征在于,所述图数据库至少包括Neo4j、HugeGraph、JanusGraph。
6.根据权利要求1所述的基于知识图谱的指标数据分析方法,其特征在于,所述在获取指标数据后,利用所述指标知识图谱对所述指标数据进行分析,包括:
通过经营分析系统查看所述指标数据;
在判断所述指标数据偏离正常值的情况下,通过所述经营分析系统向所述指标知识图谱发起HTTP请求;
所述指标知识图谱收到所述HTTP请求后,调用图数据API查询所述指标知识图谱;
所述指标知识图谱向所述经营分析系统返回目标数据;
所述经营分析系统调用JDBC接口,将所述目标数据展示给用户进行查看。
7.根据权利要求6所述的基于知识图谱的指标数据分析方法,其特征在于,所述目标数据的数据格式为指标和计算公式、关联指标以及其相关的表、表字段。
8.一种基于知识图谱的指标数据分析装置,其特征在于,包括:
构建模块,用于构建指标知识图谱;
分析模块,用于在获取指标数据后,利用所述指标知识图谱对所述指标数据进行分析。
9.一种电子设备,其特征在于,所述电子设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-7任意一项所述的基于知识图谱的指标数据分析方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-7任意一项所述的基于知识图谱的指标数据分析方法。
CN202210883787.5A 2022-07-26 2022-07-26 基于知识图谱的指标数据分析方法、装置、设备及介质 Pending CN115238094A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210883787.5A CN115238094A (zh) 2022-07-26 2022-07-26 基于知识图谱的指标数据分析方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210883787.5A CN115238094A (zh) 2022-07-26 2022-07-26 基于知识图谱的指标数据分析方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN115238094A true CN115238094A (zh) 2022-10-25

Family

ID=83675823

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210883787.5A Pending CN115238094A (zh) 2022-07-26 2022-07-26 基于知识图谱的指标数据分析方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN115238094A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117076484A (zh) * 2023-09-04 2023-11-17 北京大学 基于时序知识图谱的人力资源数据分析方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117076484A (zh) * 2023-09-04 2023-11-17 北京大学 基于时序知识图谱的人力资源数据分析方法
CN117076484B (zh) * 2023-09-04 2024-04-19 北京大学 基于时序知识图谱的人力资源数据分析方法

Similar Documents

Publication Publication Date Title
CN110163457B (zh) 一种业务指标的异常定位方法和装置
CN111414376A (zh) 一种数据预警方法和装置
CN114422267A (zh) 流量检测方法、装置、设备及介质
CN115238094A (zh) 基于知识图谱的指标数据分析方法、装置、设备及介质
CN114036147A (zh) 数据仓库构建方法、装置、设备及存储介质
CN114095332A (zh) 信息处理方法、装置、设备及计算机存储介质
CN110765100B (zh) 标签的生成方法、装置、计算机可读存储介质及服务器
CN112800333A (zh) 企业用户服务的推荐方法、装置、设备及存储介质
CN111045915A (zh) 一种基于产品功能测试用例的安全测试的方法和装置
CN114817750A (zh) 信息处理方法、装置、设备、介质及产品
CN112434195A (zh) 数据解析方法、装置、电子设备及计算机可读存储介质
CN114675952A (zh) 信息处理方法、装置、电子设备、介质和程序产品
CN107346329B (zh) 一种数据处理方法和装置
CN112328595A (zh) 一种数据查找方法、装置、设备及存储介质
CN114895959B (zh) 数据处理方法、装置、设备及计算机存储介质
CN112527621A (zh) 测试路径构建方法、装置、设备及存储介质
CN114547133B (zh) 基于多维数据集的对话式归因分析方法、装置及设备
CN116861285A (zh) App复核的方法、装置、设备和存储介质
CN110874386A (zh) 建立类目映射关系的方法和装置
CN115576912A (zh) 业务数据模型信息的确定方法、装置、设备及存储介质
CN113392105B (zh) 业务数据处理方法和终端设备
CN110532561B (zh) 数据检测方法及装置、存储介质、电子装置
CN118733619A (zh) 信息处理方法、系统、装置和电子设备
CN116226105A (zh) 数据治理方法、装置、电子设备及计算机存储介质
CN118014532A (zh) 项目管理方法、装置、设备、可读存储介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination