CN114780619A - 一种自动工程审价审计数据的异常预警方法 - Google Patents

一种自动工程审价审计数据的异常预警方法 Download PDF

Info

Publication number
CN114780619A
CN114780619A CN202210635761.9A CN202210635761A CN114780619A CN 114780619 A CN114780619 A CN 114780619A CN 202210635761 A CN202210635761 A CN 202210635761A CN 114780619 A CN114780619 A CN 114780619A
Authority
CN
China
Prior art keywords
knowledge graph
time
real
historical
time sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210635761.9A
Other languages
English (en)
Other versions
CN114780619B (zh
Inventor
厉理
王冬法
陶涛
俞芳
徐高瞻
罗振
徐荣东
单建东
钱英
王哲
张聪慧
傅文渊
刘石
胡叶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Zhejiang Electric Power Co Ltd
Jinhua Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Ningbo Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
State Grid Zhejiang Electric Power Co Ltd
Jinhua Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Ningbo Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Zhejiang Electric Power Co Ltd, Jinhua Power Supply Co of State Grid Zhejiang Electric Power Co Ltd, Ningbo Power Supply Co of State Grid Zhejiang Electric Power Co Ltd filed Critical State Grid Zhejiang Electric Power Co Ltd
Priority to CN202210635761.9A priority Critical patent/CN114780619B/zh
Publication of CN114780619A publication Critical patent/CN114780619A/zh
Application granted granted Critical
Publication of CN114780619B publication Critical patent/CN114780619B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种自动工程审价审计数据的异常预警方法,包括:S100:通过历史工程审价审计数据,更新历史数据节点之间的有向边,形成历史知识图谱;S200:通过实时工程审价审计数据,确定实时数据节点之间的有向边,形成实时知识图谱;S300:将实时知识图谱与历史知识图谱进行三元组匹配,若三元组匹配完全一致,则将历史知识图谱作为标准对照知识图谱并执行S500,否则执行S400;S400:选取历史知识图谱进行知识图谱补全,得到标准对照知识图谱,若满足预设条件,则执行S500;S500:根据有向边生成时序特征矩阵,判断是否生成时序属性异常预警。本申请通过设置有向边的方向来表征数据实体之间的时序特征,从而对工程审价审计数据的时序关系进行审核。

Description

一种自动工程审价审计数据的异常预警方法
技术领域
本发明属于异常数据处理领域,尤其涉及一种自动工程审价审计数据的异常预警方法。
背景技术
工程审价审计是由专业审计人员通过行使独立审计职权,检查工程建设各基建环节的管理是否合规合法、建设成本的真实性和相关规定的贯彻执行情况等,通过检查,纠正工程管理中存在的不规范行为。随着大数据技术的快速发展,现有的工程审价审计方法也逐渐从传统人工手段发展为以大数据技术、人工智能技术为辅助手段的自动工程审价审计模式,从而提升审价审计的效率与质量,其中,知识图谱作为一种结合应用数学、图像学、信息可视化技术等学科的人工智能技术,在自动工程审价审计领域得到了广泛应用。
在工程审价审计的应用领域中,通常针对审价审计主体之间的实体关系建立形式为“实体1-关系-实体2”的三元组,有多个三元组构成审价审计主体之间的知识图谱。例如,名称为《一种基于知识图谱的数据审计方法》申请号为“202110282367.7”的中国发明专利提出了针对审计数据的实体关系建立知识图谱并得到审计规则的方法。但现有的基于知识图谱实现自动工程审价审计的技术方案仅以靠建立实体关系实现知识图谱的应用,而在实际的审价审计过程中,处理审核众多数据之间的实体时序关系之外,还需要审核数据之间的时序关系是否异常。而现有的利用知识图谱实现审价审计的方案中,通常仅关注于审核实体时序关系,而审核数据产生过程中的时序问题仍需要人工判断。
发明内容
针对目前利用知识图谱实现自动工程审价审计过程中,对审价审计数据的产生时序方面的忽略,本发明提出了一种自动工程审价审计数据的异常预警方法,包括:
S100:通过历史工程审价审计数据生成历史数据节点,根据当前适用的审价审计法规,更新历史数据节点之间的有向边,形成历史知识图谱并存储在对照库中;
S200:通过实时工程审价审计数据生成实时数据节点,根据实时数据节点的时序关系,确定实时数据节点之间的有向边,形成实时知识图谱;
S300:将实时知识图谱与对照库中的历史知识图谱进行三元组匹配,若三元组匹配完全一致,则将匹配的历史知识图谱作为标准对照知识图谱并执行S500,否则执行S400;
S400:在对照库中选取与实时知识图谱的三元组重合程度最高的历史知识图谱,结合审价审计法规进行知识图谱补全,得到标准对照知识图谱,若实时数据节点与标准对照知识图谱的三元组相似度满足预设条件,则执行S500,否则生成数据实体异常预警;
S500:根据标准对照知识图谱和实时知识图谱中有向边生成时序特征矩阵,根据时序特征矩阵判断是否生成时序属性异常预警。
可选的,所述根据当前适用的审价审计法规,更新历史数据节点之间的有向边,包括:
根据所述审价审计法规的逻辑关系,在具有实体时序关系的历史数据节点之间生成有向边;
根据所述审价审计法规对历史数据节点的规定时序,更新有向边的指向方向。
可选的,所述有向边的指向方向为:由规定时序早的历史数据节点指向规定时序晚的历史数据节点。
可选的,所述根据实时数据节点的时序关系,确定实时数据节点之间的有向边,包括:
确定每两个具有关联关系的实时数据节点之间的时序关系,根据时序关系将实时数据节点之间的有向边的方向设置为:由时序早的实时数据节点指向时序晚的数据节点。
可选的,所述S400包括:
对实时知识图谱中的三元组进行词嵌入处理,得到实时节点向量;
将历史知识图谱中的三元组进行词嵌入处理,得到历史节点向量;
计算实时节点向量与历史节点向量的相似度,筛选出相似度符合匹配条件的历史知识图谱;
将筛选的历史知识图谱的重合部分输入预先训练好的图注意力网络模型,通过图注意力网络模型对未重合部分进行知识图谱补全,得到标准对照图谱。
可选的,所述图注意力网络模型包括输入层、图注意层以及输出层,其中,所述图注意层用于对输入的重合部分的实体时序关系进行学习,基于注意力机制根据审价审计法规对未重合部分进行知识补全。
可选的,所述异常预警方法还包括对所述图注意力网络模型的训练,包括:
将历史知识图谱拆分为若干个子图谱作为训练集,将历史知识图谱作为测试集,利用所述训练集和所述测试集对图注意力网络模型进行训练。
可选的,所述S500包括:
S510:分别根据实时知识图谱和标准对照知识图谱中各个节点之间是否存在有向边以及有向边的方向,设置不同数值表示时序特征,生成时序特征矩阵;
S520:计算实时知识图谱和标准对照知识图谱的时序特征矩阵的重合比例;
S530:若重合比例满足预设条件,则判定实时工程审价审计数据不存在时序属性异常,否则生成时序属性异常预警。
可选的,所述S510包括:
S511:对于节点i和节点j,其时序特征值为:若有向边的方向指向节点i,则将特征值Vij记为第一数值,若有向边的方向指向节点j,则将特征值Vij记为第二数值,若节点i和节点j之间有向边的方向未定义,则将特征值Vij记为第三数值;
S512:生成由第一数值、第二数值和第三数值组成的时序特征矩阵V,其中V的维度为n*n,n为节点的总数量。
本发明提供的技术方案带来的有益效果是:
本申请利用工程审价审计数据生成实时知识图谱,并在实时知识图谱中通过设置有向边的方向来表征各个数据实体之间的时序特征,从而对工程审价审计数据的时序关系进行审核,进一步提高了审价审计的效果与效率。
同时,本发明提出的技术方案能够针对不同实体时序关系,自动匹配相应的标准对照知识图谱,从而提高了利用知识图谱比对进行异常判断的准确性。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提出的一种自动工程审价审计数据的异常预警方法的流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本发明中,“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含A、B和C”、“包含A、B、C”是指A、B、C三者都包含,“包含A、B或C”是指包含A、B、C三者之一,“包含A、B和/或C”是指包含A、B、C三者中任1个或任2个或3个。
应当理解,在本发明中,“与A对应的B”、“与A相对应的B”、“A与B相对应”或者“B与A相对应”,表示B与A相关联,根据A可以确定B。根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。A与B的匹配,是A与B的相似度大于或等于预设的阈值。
取决于语境,如在此所使用的“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
实施例:
如图1所示,本实施例提出了一种自动工程审价审计数据的异常预警方法,包括:
S100:通过历史工程审价审计数据生成历史数据节点,根据当前适用的审价审计法规,更新历史数据节点之间的有向边,形成历史知识图谱并存储在对照库中;
S200:通过实时工程审价审计数据生成实时数据节点,根据实时数据节点的时序关系,确定实时数据节点之间的有向边,形成实时知识图谱;
S300:将实时知识图谱与对照库中的历史知识图谱进行三元组匹配,若三元组匹配完全一致,则将匹配的历史知识图谱作为标准对照知识图谱并执行S500,否则执行S400;
S400:在对照库中选取与实时知识图谱的三元组重合程度最高的历史知识图谱,结合审价审计法规进行知识图谱补全,得到标准对照知识图谱,若实时数据节点与标准对照知识图谱的三元组相似度满足预设条件,则执行S500,否则生成数据实体异常预警;
S500:根据标准对照知识图谱和实时知识图谱中有向边生成时序特征矩阵,根据时序特征矩阵判断是否生成时序属性异常预警。
利用知识图谱在利用知识图谱进行自动审价审计过程中,通常侧重于基于实体自身关系的知识提取,以判断审价审计数据中一些关键词是否在实体关系上符合相关法规。考虑到在审价审计领域中,存在大量时序上的审核,例如审核工程可研批复日期是否早于中标通知书日期等问题上的审核,而常规的知识图谱通常忽略了时序特征在知识图谱上的体现,本实施例在实时知识图谱中通过设置有向边的方向来表征各个数据实体之间的时序特征,从而对工程审价审计数据的时序关系进行审核,进一步提高了审价审计的效果与效率。
在本实施例中,分别基于历史工程审价审计数据和实时工程审价审计数据,生成历史知识图谱和实时知识图谱。本实施例中所述历史知识图谱、实时知识图谱与常规知识图谱的区别在于,在常规知识图谱的实体节点直接设置有向边,以有向边的方向定义表示数据之间的前后时序关系。
为了实现历史知识图谱与实时知识图谱之间的对照,本实施例中历史知识图谱和实时知识图谱两者总体的生成过程一致,此外历史知识图谱生成后,会随着当前适用的审价审计法规的变化而更新历史数据节点之间的有向边,具体包括:
根据所述审价审计法规的逻辑关系,在具有实体时序关系的历史数据节点之间生成有向边;
根据所述审价审计法规对历史数据节点的规定时序,更新有向边的指向方向。
在本实施例中,所述有向边的指向方向为:由规定时序早的历史数据节点指向规定时序晚的历史数据节点。
以上述工程可研批复日期与中标通知书日期的实体数据时序问题为例,由于当前适用的审价审计法规规定,可研未经批复,不得开展设计招标,同时规定了项目未经核准、初步设计未经批复,不得开展物资、施工招标,即中标通知书日期应当晚于工程可研批复日期,因此在历史知识图谱中,有向边的方向设置更新为由工程可研批复日期对应的历史数据节点指向中标通知书日期对应的历史数据节点。
同理,在生成实时知识图谱时,根据实时数据节点的时序关系,确定实时数据节点之间的有向边,包括:确定每两个具有关联关系的实时数据节点之间的时序关系,根据时序关系将实时数据节点之间的有向边的方向设置为:由时序早的实时数据节点指向时序晚的数据节点。
本实施例通过数据节点之间的有向边的方向,来表征不同实体之间的时序关系,因此在需要在知识图谱中添加有关时序的知识时,无需另外增加时序秩序对应的知识图谱节点,仅对知识图谱节点之间的边进行改变即可,降低了知识图谱的复杂程度,也提高了知识修改更新的效率。
需要注意的是,由于本实施例在审价审计领域的常规知识图谱匹配方案的基础上,增加了时序特征的审核,因此,本实施例在进行历史知识图谱与实时知识图谱的对照时,分为实体关系和时序关系两方面的审价审计。
在实体关系对照中,本实施例在历史知识图谱和实时知识图谱的基础上,以历史知识图谱作为对照,按照常规的三元组匹配方式进行数据实体的异常分析。若三元组匹配完全一致,说明实时知识图谱与匹配到的历史知识图谱的实体关系完全一致,视为实时工程施加审计数据在实体关系的部分通过审核,同时将这个三元组匹配完全一致的历史知识图谱作为标准对照图谱,用于后续的时序关系对照。
但考虑到一定的容错性,本实施例还通过执行S400采用了知识图谱补全的方式作为补偿方案,具体包括:
对实时知识图谱中的三元组进行词嵌入处理,得到实时节点向量;
将历史知识图谱中的三元组进行词嵌入处理,得到历史节点向量;
计算实时节点向量与历史节点向量的相似度,筛选出相似度符合匹配条件的历史知识图谱;
将筛选的历史知识图谱的重合部分输入预先训练好的图注意力网络模型,通过图注意力网络模型对未重合部分进行知识图谱补全,得到标准对照图谱。
图注意力网络(Graph Attention Networks, GAT)模型是在图卷积神经网络(Graph Convolutional Network, GCN)的基础上加入注意力机制而改进的网络,在知识图谱补全领域,往往通过GAT模型能够基于机器学习,对不完整的知识图谱进行学习,进而挖掘出隐含的实体间关系来实现知识图谱的补全。具体的,所述图注意力网络模型包括输入层、图注意层以及输出层,其中,所述图注意层用于对输入的重合部分的实体时序关系进行学习,基于注意力机制根据审价审计法规对未重合部分进行知识补全。
在本实施例中,在选取与实时知识图谱的三元组重合程度最高的历史知识图谱时,可采用聚类算法和加权算法结合的方式,选取出重合程度最高的历史知识图谱,具体包括:
首先对所有历史知识图谱的图结构进行低精度聚类,得到第一集群,确定每个第一集群中作为聚类中心的历史知识图谱,先将实时知识图谱分别与作为聚类中心的历史知识图谱进行对照,选取出三元组重合程度最好的聚类中心,以此提高重合程度最高的历史知识图谱的查找选取速度。
再针对选取的聚类中心所属类,对其中的历史知识图谱进行高精度聚类,得到第二集群,将实时知识图谱分别与每个第二集群的聚类中心进行对照,计算三元组的重合度,在根据各个第二集群中的历史知识图谱总个数生成权重系数,将所述重合度和所述权重系数的乘积作为表征重合程度的指标,即所述乘积最高的第二集群对应的聚类中心,视为三元组重合程度最高的历史知识图谱。
需要注意的是,本实施例中,所述三元组的重合度为重合的三元组与聚类中心的三元组总个数的比值。
在得到标准对照知识图谱后,本实施例通过执行S500实现时序关系上的对照,具体包括:
S510:分别根据实时知识图谱和标准对照知识图谱中各个节点之间是否存在有向边以及有向边的方向,设置不同数值表示时序特征,生成时序特征矩阵;
S520:计算实时知识图谱和标准对照知识图谱的时序特征矩阵的重合比例;
S530:若重合比例满足预设条件,则判定实时工程审价审计数据不存在时序属性异常,否则生成时序属性异常预警。
其中,设置不同数值表示时序特征,生成时序特征矩阵,具体包括:
S511:对于节点i和节点j,其时序特征值为:若有向边的方向指向节点i,则将特征值Vij记为第一数值,若有向边的方向指向节点j,则将特征值Vij记为第二数值,若节点i和节点j之间有向边的方向未定义,则将特征值Vij记为第三数值;
S512:生成由第一数值、第二数值和第三数值组成的时序特征矩阵V,其中V的维度为n*n,n为节点的总数量。
需要注意的是,上述S511中,有向边的方向指向节点i,即表示节点i的时序在节点j之后;有向边的方向指向节点j,即表示节点j的时序在节点i之后;节点i和节点j之间有向边的方向未定义,即表示节点i和节点j之间不存在时序关系。
基于上述过程,本实施例最后通过比较标准对照知识图谱和实时知识图谱的时序特征矩阵中元素的重合程度,实现时序属性异常的判断。当重合程度低于一定限值时,生成时序属性异常预警。
上述实施例中的各个序号仅仅为了描述,不代表各部件的组装或使用过程中的先后顺序。
以上所述仅为本发明的实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种自动工程审价审计数据的异常预警方法,其特征在于,包括:
S100:通过历史工程审价审计数据生成历史数据节点,根据当前适用的审价审计法规,更新历史数据节点之间的有向边,形成历史知识图谱并存储在对照库中;
S200:通过实时工程审价审计数据生成实时数据节点,根据实时数据节点的时序关系,确定实时数据节点之间的有向边,形成实时知识图谱;
S300:将实时知识图谱与对照库中的历史知识图谱进行三元组匹配,若三元组匹配完全一致,则将匹配的历史知识图谱作为标准对照知识图谱并执行S500,否则执行S400;
S400:在对照库中选取与实时知识图谱的三元组重合程度最高的历史知识图谱,结合审价审计法规进行知识图谱补全,得到标准对照知识图谱,若实时数据节点与标准对照知识图谱的三元组相似度满足预设条件,则执行S500,否则生成数据实体异常预警;
S500:根据标准对照知识图谱和实时知识图谱中有向边生成时序特征矩阵,根据时序特征矩阵判断是否生成时序属性异常预警。
2.根据权利要求1所述的一种自动工程审价审计数据的异常预警方法,其特征在于,所述根据当前适用的审价审计法规,更新历史数据节点之间的有向边,包括:
根据所述审价审计法规的逻辑关系,在具有实体时序关系的历史数据节点之间生成有向边;
根据所述审价审计法规对历史数据节点的规定时序,更新有向边的指向方向。
3.根据权利要求2所述的一种自动工程审价审计数据的异常预警方法,其特征在于,所述有向边的指向方向为:由规定时序早的历史数据节点指向规定时序晚的历史数据节点。
4.根据权利要求1所述的一种自动工程审价审计数据的异常预警方法,其特征在于,所述根据实时数据节点的时序关系,确定实时数据节点之间的有向边,包括:
确定每两个具有关联关系的实时数据节点之间的时序关系,根据时序关系将实时数据节点之间的有向边的方向设置为:由时序早的实时数据节点指向时序晚的数据节点。
5.根据权利要求1所述的一种自动工程审价审计数据的异常预警方法,其特征在于,所述S400包括:
对实时知识图谱中的三元组进行词嵌入处理,得到实时节点向量;
将历史知识图谱中的三元组进行词嵌入处理,得到历史节点向量;
计算实时节点向量与历史节点向量的相似度,筛选出相似度符合匹配条件的历史知识图谱;
将筛选的历史知识图谱的重合部分输入预先训练好的图注意力网络模型,通过图注意力网络模型对未重合部分进行知识图谱补全,得到标准对照图谱。
6.根据权利要求5所述的一种自动工程审价审计数据的异常预警方法,其特征在于,所述图注意力网络模型包括输入层、图注意层以及输出层,其中,所述图注意层用于对输入的重合部分的实体时序关系进行学习,基于注意力机制根据审价审计法规对未重合部分进行知识补全。
7.根据权利要求5所述的一种自动工程审价审计数据的异常预警方法,其特征在于,所述异常预警方法还包括对所述图注意力网络模型的训练,包括:
将历史知识图谱拆分为若干个子图谱作为训练集,将历史知识图谱作为测试集,利用所述训练集和所述测试集对图注意力网络模型进行训练。
8.根据权利要求1所述的一种自动工程审价审计数据的异常预警方法,其特征在于,所述S500包括:
S510:分别根据实时知识图谱和标准对照知识图谱中各个节点之间是否存在有向边以及有向边的方向,设置不同数值表示时序特征,生成时序特征矩阵;
S520:计算实时知识图谱和标准对照知识图谱的时序特征矩阵的重合比例;
S530:若重合比例满足预设条件,则判定实时工程审价审计数据不存在时序属性异常,否则生成时序属性异常预警。
9.根据权利要求8所述的一种自动工程审价审计数据的异常预警方法,其特征在于,所述S510包括:
S511:对于节点i和节点j,其时序特征值为:若有向边的方向指向节点i,则将特征值Vij记为第一数值,若有向边的方向指向节点j,则将特征值Vij记为第二数值,若节点i和节点j之间有向边的方向未定义,则将特征值Vij记为第三数值;
S512:生成由第一数值、第二数值和第三数值组成的时序特征矩阵V,其中V的维度为n*n,n为节点的总数量。
CN202210635761.9A 2022-06-07 2022-06-07 一种自动工程审价审计数据的异常预警方法 Active CN114780619B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210635761.9A CN114780619B (zh) 2022-06-07 2022-06-07 一种自动工程审价审计数据的异常预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210635761.9A CN114780619B (zh) 2022-06-07 2022-06-07 一种自动工程审价审计数据的异常预警方法

Publications (2)

Publication Number Publication Date
CN114780619A true CN114780619A (zh) 2022-07-22
CN114780619B CN114780619B (zh) 2022-09-13

Family

ID=82421917

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210635761.9A Active CN114780619B (zh) 2022-06-07 2022-06-07 一种自动工程审价审计数据的异常预警方法

Country Status (1)

Country Link
CN (1) CN114780619B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116757462A (zh) * 2023-06-21 2023-09-15 国网浙江省电力有限公司宁波供电公司 基于工程数据分析模型的异常数据监控方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120197854A1 (en) * 2009-03-24 2012-08-02 International Business Machines Corporation Mining sequential patterns in weighted directed graphs
CN105808923A (zh) * 2016-02-29 2016-07-27 北京航空航天大学 一种数据序列的异常检测方法和装置
CN109213616A (zh) * 2018-09-25 2019-01-15 江苏润和软件股份有限公司 一种基于调用图分析的微服务软件系统异常检测方法
CN111090679A (zh) * 2019-10-31 2020-05-01 国网浙江省电力有限公司 基于时序影响和图嵌入的时序数据表示学习方法
CN111639196A (zh) * 2020-06-03 2020-09-08 核工业湖州工程勘察院有限公司 一种多层渐进增强的地灾知识图谱及其自动补全方法
CN112257760A (zh) * 2020-09-30 2021-01-22 北京航空航天大学 一种基于时序模体的主机网络通信行为异常检测方法
CN113553444A (zh) * 2021-07-27 2021-10-26 之江实验室 一种基于超边的审计知识图谱表示模型及关联推理方法
CN113722510A (zh) * 2021-09-13 2021-11-30 中国人民解放军国防科技大学 一种基于图神经网络的知识图谱复杂问题生成方法及系统
CN113722383A (zh) * 2021-09-13 2021-11-30 福韵数据服务有限公司 一种基于时序情报调查装置及方法
CN114066262A (zh) * 2021-11-18 2022-02-18 国网江苏省电力有限公司 一种电网调度后评估异常指标溯因推理方法、系统、装置及存储介质
CN114153942A (zh) * 2021-11-17 2022-03-08 中国人民解放军国防科技大学 一种基于动态注意力机制的事件时序关系抽取方法
CN114282003A (zh) * 2021-11-30 2022-04-05 中国建设银行股份有限公司 基于知识图谱的金融风险预警方法及装置
CN114398479A (zh) * 2021-11-13 2022-04-26 重庆邮电大学 基于时序交互图神经网络的文本分类方法、装置及介质

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120197854A1 (en) * 2009-03-24 2012-08-02 International Business Machines Corporation Mining sequential patterns in weighted directed graphs
CN105808923A (zh) * 2016-02-29 2016-07-27 北京航空航天大学 一种数据序列的异常检测方法和装置
CN109213616A (zh) * 2018-09-25 2019-01-15 江苏润和软件股份有限公司 一种基于调用图分析的微服务软件系统异常检测方法
CN111090679A (zh) * 2019-10-31 2020-05-01 国网浙江省电力有限公司 基于时序影响和图嵌入的时序数据表示学习方法
CN111639196A (zh) * 2020-06-03 2020-09-08 核工业湖州工程勘察院有限公司 一种多层渐进增强的地灾知识图谱及其自动补全方法
CN112257760A (zh) * 2020-09-30 2021-01-22 北京航空航天大学 一种基于时序模体的主机网络通信行为异常检测方法
CN113553444A (zh) * 2021-07-27 2021-10-26 之江实验室 一种基于超边的审计知识图谱表示模型及关联推理方法
CN113722510A (zh) * 2021-09-13 2021-11-30 中国人民解放军国防科技大学 一种基于图神经网络的知识图谱复杂问题生成方法及系统
CN113722383A (zh) * 2021-09-13 2021-11-30 福韵数据服务有限公司 一种基于时序情报调查装置及方法
CN114398479A (zh) * 2021-11-13 2022-04-26 重庆邮电大学 基于时序交互图神经网络的文本分类方法、装置及介质
CN114153942A (zh) * 2021-11-17 2022-03-08 中国人民解放军国防科技大学 一种基于动态注意力机制的事件时序关系抽取方法
CN114066262A (zh) * 2021-11-18 2022-02-18 国网江苏省电力有限公司 一种电网调度后评估异常指标溯因推理方法、系统、装置及存储介质
CN114282003A (zh) * 2021-11-30 2022-04-05 中国建设银行股份有限公司 基于知识图谱的金融风险预警方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YU LIU ET AL.: ""Building Graphs at Scale via Sequence of Edges: Model and Generation Algorithms"", 《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》 *
方拓迁: ""基于时序知识图谱的足球知识问答系统"", 《中国优秀硕士学位论文全文数据库 社会科学Ⅱ辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116757462A (zh) * 2023-06-21 2023-09-15 国网浙江省电力有限公司宁波供电公司 基于工程数据分析模型的异常数据监控方法
CN116757462B (zh) * 2023-06-21 2023-11-28 国网浙江省电力有限公司宁波供电公司 基于工程数据分析模型的异常数据监控方法

Also Published As

Publication number Publication date
CN114780619B (zh) 2022-09-13

Similar Documents

Publication Publication Date Title
CN109800875A (zh) 基于粒子群优化和降噪稀疏编码机的化工故障检测方法
CN108470022B (zh) 一种基于运维管理的智能工单质检方法
CN110636066B (zh) 基于无监督生成推理的网络安全威胁态势评估方法
CN109472088A (zh) 一种页岩气调产井生产压力动态预测方法
CN111798991A (zh) 基于lstm的新冠肺炎疫情群体态势预测方法
CN111488946A (zh) 基于信息融合的雷达伺服系统故障诊断方法
CN108647691A (zh) 一种基于点击特征预测的图像分类方法
CN109787821B (zh) 一种大规模移动客户流量消费智能预测方法
CN112100403A (zh) 一种基于神经网络的知识图谱不一致性推理方法
CN110807485B (zh) 基于高分遥感影像二分类语义分割图融合成多分类语义图的方法
CN114780619B (zh) 一种自动工程审价审计数据的异常预警方法
CN113221960B (zh) 一种高质量漏洞数据收集模型的构建方法及收集方法
WO2023116565A1 (zh) 智能设计网络安全架构图的方法
CN111898867A (zh) 一种基于深度神经网络的飞机总装生产线产能预测方法
CN106097094A (zh) 一种面向中小企业的人机结合信贷评估新模型
CN113033678A (zh) 一种基于自适应对抗网络的锂电池组故障诊断方法
CN116894113A (zh) 基于深度学习的数据安全分类方法及数据安全管理系统
CN109635008B (zh) 一种基于机器学习的设备故障检测方法
Li Research on Bank Credit Risk Assessment Based on BP Neural Network
CN113870052A (zh) 基于多输入lstm-cnn的工作票安全措施识别方法及终端
CN115080386A (zh) 基于自动驾驶功能要求的场景有效性分析方法与设备
EP4002230A1 (en) Information processing apparatus and information processing method
CN112199287B (zh) 基于强化混合专家模型的跨项目软件缺陷预测方法
CN114553468A (zh) 一种基于特征交叉与集成学习的三级网络入侵检测方法
CN112488321B (zh) 面向广义非负矩阵分解算法的对抗性机器学习防御方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant