CN111914101A - 档案关联关系的异常识别方法、装置和计算机设备 - Google Patents

档案关联关系的异常识别方法、装置和计算机设备 Download PDF

Info

Publication number
CN111914101A
CN111914101A CN202010825347.5A CN202010825347A CN111914101A CN 111914101 A CN111914101 A CN 111914101A CN 202010825347 A CN202010825347 A CN 202010825347A CN 111914101 A CN111914101 A CN 111914101A
Authority
CN
China
Prior art keywords
user
identification
entity
archive
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010825347.5A
Other languages
English (en)
Other versions
CN111914101B (zh
Inventor
曾璐琨
张文瀚
周尚礼
郑楷洪
杨劲锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Southern Power Grid Co Ltd
Southern Power Grid Digital Grid Research Institute Co Ltd
Original Assignee
China Southern Power Grid Co Ltd
Southern Power Grid Digital Grid Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Southern Power Grid Co Ltd, Southern Power Grid Digital Grid Research Institute Co Ltd filed Critical China Southern Power Grid Co Ltd
Priority to CN202010825347.5A priority Critical patent/CN111914101B/zh
Publication of CN111914101A publication Critical patent/CN111914101A/zh
Application granted granted Critical
Publication of CN111914101B publication Critical patent/CN111914101B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种档案关联关系的异常识别方法、装置和计算机设备。所述方法包括:获取用户的用户标识,根据所述用户标识从档案数据库中获取所述用户的多个档案数据表;对各个所述档案数据表进行关键字提取处理,根据提取到的目标关键字及目标关键字之间的关系,构建所述用户的档案知识图谱;所述档案知识图谱包括根据所述目标关键字确定的多个目标实体;获取所述档案知识图谱中所述目标实体的实体参数,根据所述实体参数对所述用户的档案关联关系进行识别,得到识别结果。采用本方法能够提高对档案关联关系异常识别的效率,实现档案关联关系异常识别的智能化。

Description

档案关联关系的异常识别方法、装置和计算机设备
技术领域
本申请涉及档案管理技术领域,特别是涉及一种档案关联关系的异常识别方法、装置、计算机设备和存储介质。
背景技术
电能量数据为电力营销、财务结算、计划以及电网线损等结算和计算的依据,电能量数据分析应用过程的本质是由计量自动化系统基于所关联的营销档案来采集电量明细数据,进而根据所采集的电量明细数据进行计算、统计分析等一系列数据分析过程。因此,在电能量数据分析应用过程中,营销档案中“站-线-变-户-计量点-运行电能表”关系的准确性十分重要,直接影响计量自动化系统对电量明细数据的获取,从而影响电能量数据分析应用效果及营销计费算费的结果。而由于营销系统建设初期使用不太规范、人工生成档案存在失误等原因,导致存量营销档案中少量用户档案关联关系存在问题。
现阶段对档案关联关系的异常识别,多是通过人工在现场与系统进行比对排查时发现或通过用户对用电量的质疑投诉等事后间接途径发现,由于人工进行比对排查往往需要涉及多个部门之间的协作,效率较低且速度较慢。
因此,现有技术中对档案关联关系的异常识别方式存在效率较低且速度较慢的问题。
发明内容
基于此,有必要针对现阶段档案关联关系的异常识别方式存在的效率极低且速度较慢的技术问题,提供一种档案关联关系的异常识别方法、装置、计算机设备和存储介质。
一种档案关联关系的异常识别方法,所述方法包括:
获取用户的用户标识,根据所述用户标识从档案数据库中获取所述用户的多个档案数据表;
对各个所述档案数据表进行关键字提取处理,根据提取到的目标关键字及目标关键字之间的关系,构建所述用户的档案知识图谱;所述档案知识图谱包括根据所述目标关键字确定的多个目标实体;
获取所述档案知识图谱中所述目标实体的实体参数,根据所述实体参数对所述用户的档案关联关系进行识别,得到识别结果。
在其中一个实施例中,所述对各个所述档案数据表进行关键字提取处理,根据提取到的目标关键字及目标关键字之间的关系,构建所述用户的档案知识图谱,包括:
分别提取各个所述档案数据表中的多个目标关键字及各个目标关键字之间的关系;所述目标关键字包括:用户编号、计量点编号、运行电能表标识、电能表资产编号、台区标识、线路标识和变电站标识;
根据所述用户编号、所述计量点编号、所述运行电能表标识、所述电能表资产编号、所述台区标识、所述线路标识和所述变电站标识及所述用户编号、所述计量点编号、所述运行电能表标识、所述电能表资产编号、所述台区标识、所述线路标识和所述变电站标识之间的关系,构建所述用户的档案知识图谱。
在其中一个实施例中,所述实体参数包括:单个实体的关联度、各类实体的关联度和各类实体的数量;
所述获取所述档案知识图谱中所述目标实体的实体参数,包括:
获取预设的实体参数计算模型;
通过所述实体参数计算模型,输出所述档案知识图谱中各个目标实体的关联度、各类目标实体的关联度和各类目标实体的数量,作为所述档案知识图谱中所述目标实体的实体参数。
在其中一个实施例中,所述根据所述实体参数对所述用户的档案关联关系进行识别,得到识别结果,包括:
将所述实体参数与预设识别条件进行比对,当所述实体参数不符合所述预设识别条件时,则判定所述用户的档案关联关系存在异常。
在其中一个实施例中,所述预设识别条件包括:单个实体的关联度≠0、变电站标识类实体的关联度=线路标识类实体的关联度=台区标识类实体的关联度=用户编号类实体的关联度≤计量点编号类实体的关联度≤运行电能表标识类实体的关联度=电能表资产编号类实体的关联度、运行电能表标识实体的关联度=1和台区标识数量=1中的至少一种。
在其中一个实施例中,在获取用户的用户标识之前,还包括:
获取用户的识别标识;
当所述用户的识别标识为未识别用户时,则获取所述用户的用户标识。
一种档案关联关系的异常识别装置,所述装置包括:
数据表获取模块,用于获取用户的用户标识,根据所述用户标识从档案数据库中获取所述用户的多个档案数据表;
知识图谱构建模块,用于对各个所述档案数据表进行关键字提取处理,根据提取到的目标关键字及目标关键字之间的关系,构建所述用户的档案知识图谱;所述档案知识图谱包括根据所述目标关键字确定的多个目标实体;
关系识别模块,用于获取所述档案知识图谱中所述目标实体的实体参数,根据所述实体参数对所述用户的档案关联关系进行识别,得到识别结果。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取用户的用户标识,根据所述用户标识从档案数据库中获取所述用户的多个档案数据表;
对各个所述档案数据表进行关键字提取处理,根据提取到的目标关键字及目标关键字之间的关系,构建所述用户的档案知识图谱;所述档案知识图谱包括根据所述目标关键字确定的多个目标实体;
获取所述档案知识图谱中所述目标实体的实体参数,根据所述实体参数对所述用户的档案关联关系进行识别,得到识别结果。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取用户的用户标识,根据所述用户标识从档案数据库中获取所述用户的多个档案数据表;
对各个所述档案数据表进行关键字提取处理,根据提取到的目标关键字及目标关键字之间的关系,构建所述用户的档案知识图谱;所述档案知识图谱包括根据所述目标关键字确定的多个目标实体;
获取所述档案知识图谱中所述目标实体的实体参数,根据所述实体参数对所述用户的档案关联关系进行识别,得到识别结果。
上述档案关联关系的异常识别方法、装置、计算机设备和存储介质,通过获取用户的用户标识,根据用户标识从档案数据库中获取用户的多个档案数据表;对各个档案数据表进行关键字提取处理,根据提取到的目标关键字及各个目标关键字之间的关系,构建用户的档案知识图谱;其中,档案知识图谱包括根据提取的目标关键字所确定的多个目标实体;进一步获取档案知识图谱中目标实体的实体参数,根据该实体参数对用户的档案关联关系进行识别,得到识别结果,该方法基于用户的档案,构建以用户为中心的档案知识图谱,通过用户的档案知识图谱中目标实体的实体参数实现对用户的档案关联关系的智能识别,该方法将用户档案异常识别工作由人工被动排查状态变为系统主动识别状态,提高了对档案关联关系异常识别的效率,实现了档案关联关系异常识别的智能化,从而,解决了传统识别方法存在的识别效率低、速度慢的技术问题。
附图说明
图1为一个实施例中档案关联关系的异常识别方法的应用场景图;
图2为一个实施例中档案关联关系的异常识别方法的流程示意图;
图3为一个实施例中档案知识图谱概念的示意图;
图4为一个应用实施例中档案知识图谱的示意图;
图5为一个应用实施例中档案知识图谱的识别结果示意图;
图6为另一个实施例中档案关联关系的异常识别方法的流程示意图;
图7为一个实施例中档案关联关系的异常识别装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的档案关联关系的异常识别方法,可以应用于如图1所示的应用环境中。其中,终端102与档案数据库104通过网络进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。在档案关联关系的异常识别方法的应用场景中,终端102获取用户的用户标识,根据用户标识从档案数据库104中获取用户的多个档案数据表,并对各个档案数据表进行关键字提取处理,根据提取到的目标关键字及目标关键字之间的关系,构建用户的档案知识图谱;档案知识图谱包括根据目标关键字确定的多个目标实体;最后获取档案知识图谱中目标实体的实体参数,根据实体参数对用户的档案关联关系进行识别,得到识别结果。
可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现,其中,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。实际应用中,由于用户的档案信息为保密信息,因此,本申请提供的档案关联关系的异常识别方法,可以应用于档案数据表管理中心的系统内部的终端或服务器或包括终端和服务器的系统,也可以通过在内部系统服务器中设置功能模块来实现本申请提供的档案关联关系的异常识别方法。
在一个实施例中,如图2所示,提供了一种档案关联关系的异常识别方法,以该方法应用于图1中的终端102为例进行说明,包括以下步骤:
步骤S202,获取用户的用户标识,根据用户标识从档案数据库中获取用户的多个档案数据表。
其中,用户标识为表示用户唯一性的标识,可以为用户编号、用户姓名等。
其中,档案数据表为按标准格式所构建的表,每张表蕴含了不同关键字之间的关系,例如,计量点表包含计量点编号和用户编号这两个关键字,表明该用户编号与该计量点编号相关联。其中,档案数据表包括用电客户表、计量点表、计量点电能表关系表、运行电能表、电能表资产表、台区表、台区线路表、线路线段、变电站线路关系表和变电站表。
具体实现中,终端102获取各个用户的用户标识,根据用户标识从档案数据库104中获取与该用户对应的各个档案数据表。
步骤S204,对各个档案数据表进行关键字提取处理,根据提取到的目标关键字及目标关键字之间的关系,构建用户的档案知识图谱;档案知识图谱包括根据目标关键字确定的多个目标实体。
其中,目标关键字包括:用户编号、计量点编号、运行电能表标识、电能表资产编号、台区标识、线路标识和变电站标识。
其中,档案知识图谱为反映各个目标关键字之间关联关系的网络。
具体实现中,在得到与用户标识对应的多个档案数据表后,可分别提取各个档案数据表中的关键字,从各个关键字中筛选出目标关键字,并提取各个目标关键字之间的关系,将每个目标关键字作为一个目标实体,根据得到的目标关键字和不同目标关键字之间的关系构建用户的档案知识图谱,由此得到包含多个目标实体及目标实体之间关系的档案知识图谱。例如,如图3所示,为以用户为中心所构建的档案知识图谱概念的示意图,包括具有关联关系的用户编号与计量点编号、运行电能表标识、电能表资产标识、台区标识、线路标识和变电站标识。
步骤S206,获取档案知识图谱中目标实体的实体参数,根据实体参数对用户的档案关联关系进行识别,得到识别结果。
其中,实体参数包括:单个实体的关联度、各类实体的关联度和各类实体的数量。
具体实现中,可预先设定档案知识图谱对应的实体参数计算模型,终端102在获取该实体参数计算模型和完成用户的档案知识图谱的构建后,可通过该实体参数计算模型计算档案知识图谱中各个实体的关联度、各类实体的关联度和各类实体的数量,作为档案知识图谱中实体的实体参数,进一步地,将得到的实体参数与预设的识别条件进行比对,通过判断该实体参数是否符合预设的识别条件,得到对用户的档案异常关联关系的识别结果。
上述档案关联关系的异常识别方法中,通过获取用户的用户标识,根据用户标识从档案数据库中获取用户的多个档案数据表;对各个档案数据表进行关键字提取处理,根据提取到的关键字及各个关键字之间的关系,构建用户的档案知识图谱;其中,档案知识图谱包括根据提取的关键字所确定的多个目标实体;进一步获取档案知识图谱中目标实体的实体参数,根据该实体参数对用户的档案关联关系进行识别,得到识别结果,该方法基于用户的档案,构建以用户为中心的档案知识图谱,通过用户的档案知识图谱中目标实体的实体参数实现对用户的档案关联关系的智能识别,该方法将用户档案异常识别工作由人工被动排查状态变为系统主动识别状态,提高了对档案关联关系异常识别的效率,实现了档案关联关系异常识别的智能化,从而,解决了传统识别方法存在的识别效率低、速度慢的技术问题,且可避免长期依靠人工排查的方式,由于效率较低、不能及时发现异常,导致用户质疑投诉,而损害单位名誉的问题。
在一个实施例中,上述步骤S204具体包括:分别提取各个档案数据表中的多个目标关键字及各个目标关键字之间的关系;目标关键字包括:用户编号、计量点编号、运行电能表标识、电能表资产编号、台区标识、线路标识和变电站标识;根据用户编号、计量点编号、运行电能表标识、电能表资产编号、台区标识、线路标识和变电站标识及用户编号、计量点编号、运行电能表标识、电能表资产编号、台区标识、线路标识和变电站标识之间的关系,构建用户的档案知识图谱。
具体实现中,当提取到多个相同目标关键字时,可将各个目标关键字进行标记,以进行区分,例如,若提取到两个计量点编号,则可将这两个计量点编号分别标记为计量点编号1和计量点编号2。如图4所示,为一个应用实例中用户的档案知识图谱的示意图,根据提取到的目标关键字所确定的目标实体包括一个用户编号(用户编号1)、两个计量点编号(计量点编号1和计量点编号2)、一个运行电能表标识(运行电能表标识1)、两个电能表资产编号(电能表资产编号1和电能表资产编号2)、两个台区标识(台区标识1和台区标识2)、两个线路标识(线路标识1和线路标识2)和两个变电站标识(变电站标识1和变电站标识2)。
本实施例中,通过分别提取各个档案数据表中的目标关键字及目标关键字之间的关联关系构建用户的档案知识图谱,以便于进一步通过用户的档案知识图谱对用户的档案关联关系进行异常识别处理。
在一个实施例中,上述步骤S206还包括:获取预设的实体参数计算模型;通过实体参数计算模型,输出档案知识图谱中各个目标实体的关联度、各类目标实体的关联度和各类目标实体的数量,作为档案知识图谱中目标实体的实体参数。
具体实现中,可将各个目标实体关联度的定义为该目标实体与电能表资产编号存在直接或间接关联关系的数量,将各类目标实体的关联度定义为该类目标实体的关联度之和;将各类目标实体的数量为类目标实体中具体的目标实体的数量,将单个电能表资产编号这一目标实体的关联度定义为1,将上述定义内容作为档案知识图谱的实体参数计算规则,根据实体参数计算规则构建档案知识图谱的实体参数计算模型。进而通过实体参数计算模型,输出用户编号、计量点编号、运行电能表标识、电能表资产编号、台区标识、线路标识和变电站标识等目标实体对应的单个目标实体的关联度、各类目标实体的关联度,以及各类目标实体的数量,作为用户的档案知识图谱的实体参数。
以下将以图4为例,说明以某用户为中心的知识图谱各类目标实体和单个目标实体的关联度计算方法以及各类目标实体的数量计算方法。
在图4中,单个目标实体的关联度计算包括:由于预先定义电能表资产编号的关联度为1,因此,电能表资产编号1和电能表资产编号2的关联度均为1。运行电能表标识1的关联度为2(分别与电能表资产编号1和电能表资产编号2关联),计量点编号1与运行电能表标识1相关联,其关联度与运行电能表标识1的关联度相同,也为2。类似地,计量点编号2与运行电能表标识1没有关联关系,其关联度为0,用户编号1与计量点编号1相关联,其关联度为2,由此类推,可得到台区标识1的关联度为2,线路标识1的关联度为2,变电站标识1的关联度为2,台区标识2的关联度为2,线路标识2的关联度为2,变电站标识2的关联度为2。
各类实体的关联度计算包括:电能表资产编号类实体的关联度=各个电能表资产编号实体的关联度之和=等于电能表资产编号1的关联度=2,运行电能表标识类实体=各个运行电能表标识实体的关联度之和=运行电能表标识1的关联度=2,类似地,可得到计量点类实体的关联度为2,用户编号类实体的关联度为2,台区标识类实体的关联度为4,线路标识类实体的关联度为4,变电站标识类实体的关联度为4。
对于各类实体的数量的,在图4中,可得到电能表资产编号数量为2,运行电能表标识数量为1,计量点编号数量为2,用户编号数量为1,台区标识数量为2,线路标识数量为2,变电站标识数量为2。
本实施例中,通过预设的实体参数计算模型,输出得到档案知识图谱中单个实体的关联度、各类实体的关联度和各类实体的数量,作为档案知识图谱中实体的实体参数,以便于根据实体参数,对用户的档案异常关联关系进行识别。
在一个实施例中,上述步骤S206还包括:将实体参数与预设识别条件进行比对,当实体参数不符合预设识别条件时,则判定用户的档案关联关系存在异常。
具体实现中,由于实际应用中各实体存在如下的关系:①各实体与电能表资产编号都存在直接或间接的关系;②对于某用户,只能关联1个台区、1条线路和1个变电站,1个用户可以关联多个计量点,1个计量点可以关联多个运行电能表,1个运行电能只能关联1个电能表资产编号。因此,可设定识别条件包括:规则1:单个实体的关联度≠0;规则2:变电站标识类实体的关联度=线路标识类实体的关联度=台区标识类实体的关联度=用户编号类实体的关联度≤计量点编号类实体的关联度≤运行电能表标识类实体的关联度=电能表资产编号类实体的关联度;规则3:运行电能表标识实体的关联度=1;规则4:台区标识数量=1。当得到的用户的档案知识图谱中目标实体的实体参数不满足上述规则中的任何一项,即不符合预设的识别条件时,则判定用户的档案关联关系存在异常。
例如,按照上述4个规则作为识别条件,对图4所示的某用户档案关系进行异常识别,识别的结果如图5所示,由于计量点编号2的关联度为0,因此不符合规则1;由于运行电能表标识1关联了两个电能表资产编号,其关联度为2,因此不符合规则3;由于用户编号1关联了两个台区标识,台区标识类实体的关联度为4,而用户编号类实体的关联度为2,不符合规则2中的“台区标识类实体的关联度=用户编号类实体的关联度”和规则4,因此,图4所示的用户的档案关联关系存在异常。
本实施例中,通过设定基于实体参数的异常关系判断规则,实现对用户档案异常关联关系的智能识别,将用户档案异常识别工作由人工被动排查状态变为系统主动识别状态,提高了异常档案识别的效率,实现了档案异常识别的智能化。
在一个实施例中,在上述步骤S202之前,还包括:获取用户的识别标识;当用户的识别标识为未识别用户时,则获取用户的用户标识。
其中,识别标识为对各个用户的识别标记,包括已识别用户和未识别用户。
具体实现中,终端102在获取用户的用户标识之前,先获取用户的识别标识,判断是否已完成对该用户的档案异常关联关系的识别,根据识别结果确定是否还需要对该用户的档案异常关联关系进行识别,具体地,当用户的识别标识为未识别用户时,则获取用户的用户标识,返回上述步骤S202;反之,当用户的识别标识为已识别用户时,则获取下一个用户的识别标识。
可选地,在完成对用户的档案关联关系的识别后,可将该用户标记为已识别用户,以避免对该用户进行重复识别。
进一步地,还可按照预设的时间间隔定期对各个用户的关联关系进行异常排查,以便于及时发现异常的档案关联关系,进行处理,实现对档案数据库中存储的档案异常关联关系的定期识别,从而避免由于未及时发现和修正异常的关联关系,导致用户的电量数据异常,给用户带来不便。
本实施例中,通过获取用户的识别标识,当用户的识别标识为未识别用户时,才获取用户的用户标识,以避免对同一用户进行重复识别,造成时间的浪费,且影响识别速率的问题。
在一个实施例中,如图6所示,为另一个实施例中档案关联关系的异常识别的流程示意图,包括:
步骤S602,获取用户的识别标识;当用户的识别标识为未识别用户时,则获取用户的用户标识;
步骤S604,根据用户标识从档案数据库中获取用户的多个档案数据表;
步骤S606,分别提取各个档案数据表中的多个目标关键字及各个目标关键字之间的关系;目标关键字包括:用户编号、计量点编号、运行电能表标识、电能表资产编号、台区标识、线路标识和变电站标识;
步骤S608,根据用户编号、计量点编号、运行电能表标识、电能表资产编号、台区标识、线路标识和变电站标识及其之间的关系,构建用户的档案知识图谱;
步骤S610,获取预设的实体参数计算模型,通过实体参数计算模型,输出档案知识图谱中各个目标实体的关联度、各类目标实体的关联度和各类目标实体的数量,作为档案知识图谱中目标实体的实体参数;
步骤S612,将实体参数与预设识别条件进行比对,当实体参数不符合预设识别条件时,则判定用户的档案关联关系存在异常。
应该理解的是,虽然图2和图6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和图6中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7所示,提供了一种档案关联关系的异常识别装置,包括:数据表获取模块702、知识图谱构建模块704和关系识别模块706,其中:
数据表获取模块702,用于获取用户的用户标识,根据用户标识从档案数据库中获取用户的多个档案数据表;
知识图谱构建模块704,用于对各个档案数据表进行关键字提取处理,根据提取到的目标关键字及目标关键字之间的关系,构建用户的档案知识图谱;档案知识图谱包括根据目标关键字确定的多个目标实体;
关系识别模块706,用于获取档案知识图谱中目标实体的实体参数,根据实体参数对用户的档案关联关系进行识别,得到识别结果。
在一个实施例中,上述知识图谱构建模块704,具体用于分别提取各个档案数据表中的多个目标关键字及各个目标关键字之间的关系;目标关键字包括:用户编号、计量点编号、运行电能表标识、电能表资产编号、台区标识、线路标识和变电站标识;根据用户编号、计量点编号、运行电能表标识、电能表资产编号、台区标识、线路标识和变电站标识及用户编号、计量点编号、运行电能表标识、电能表资产编号、台区标识、线路标识和变电站标识之间的关系,构建用户的档案知识图谱。
在一个实施例中,实体参数包括:单个实体的关联度、各类实体的关联度和各类实体的数量;上述关系识别模块706,还用于获取预设的实体参数计算模型;通过实体参数计算模型,输出档案知识图谱中各个目标实体的关联度、各类目标实体的关联度和各类目标实体的数量,作为档案知识图谱中目标实体的实体参数。
在一个实施例中,上述关系识别模块706,还用于将实体参数与预设识别条件进行比对,当实体参数不符合预设识别条件时,则判定用户的档案关联关系存在异常。
在一个实施例中,预设识别条件包括:单个实体的关联度≠0、变电站标识类实体的关联度=线路标识类实体的关联度=台区标识类实体的关联度=用户编号类实体的关联度≤计量点编号类实体的关联度≤运行电能表标识类实体的关联度=电能表资产编号类实体的关联度、运行电能表标识实体的关联度=1和台区标识数量=1中的至少一种。
在一个实施例中,上述装置还包括:
识别标识获取模块,用于获取用户的识别标识;
用户标识获取模块,用于当用户的识别标识为未识别用户时,则获取用户的用户标识。
需要说明的是,本申请的档案关联关系的异常识别装置与本申请的档案关联关系的异常识别方法一一对应,在上述档案关联关系的异常识别方法的实施例阐述的技术特征及其有益效果均适用于档案关联关系的异常识别装置的实施例中,具体内容可参见本申请方法实施例中的叙述,此处不再赘述,特此声明。
此外,上述档案关联关系的异常识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种档案关联关系的异常识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
获取用户的用户标识,根据用户标识从档案数据库中获取用户的多个档案数据表;
对各个档案数据表进行关键字提取处理,根据提取到的目标关键字及目标关键字之间的关系,构建用户的档案知识图谱;档案知识图谱包括根据目标关键字确定的多个目标实体;
获取档案知识图谱中目标实体的实体参数,根据实体参数对用户的档案关联关系进行识别,得到识别结果。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取用户的用户标识,根据用户标识从档案数据库中获取用户的多个档案数据表;
对各个档案数据表进行关键字提取处理,根据提取到的目标关键字及目标关键字之间的关系,构建用户的档案知识图谱;档案知识图谱包括根据目标关键字确定的多个目标实体;
获取档案知识图谱中目标实体的实体参数,根据实体参数对用户的档案关联关系进行识别,得到识别结果。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种档案关联关系的异常识别方法,其特征在于,所述方法包括:
获取用户的用户标识,根据所述用户标识从档案数据库中获取所述用户的多个档案数据表;
对各个所述档案数据表进行关键字提取处理,根据提取到的目标关键字及目标关键字之间的关系,构建所述用户的档案知识图谱;所述档案知识图谱包括根据所述目标关键字确定的多个目标实体;
获取所述档案知识图谱中所述目标实体的实体参数,根据所述实体参数对所述用户的档案关联关系进行识别,得到识别结果。
2.根据权利要求1所述的方法,其特征在于,所述对各个所述档案数据表进行关键字提取处理,根据提取到的目标关键字及目标关键字之间的关系,构建所述用户的档案知识图谱,包括:
分别提取各个所述档案数据表中的多个目标关键字及各个目标关键字之间的关系;所述目标关键字包括:用户编号、计量点编号、运行电能表标识、电能表资产编号、台区标识、线路标识和变电站标识;
根据所述用户编号、所述计量点编号、所述运行电能表标识、所述电能表资产编号、所述台区标识、所述线路标识和所述变电站标识及所述用户编号、所述计量点编号、所述运行电能表标识、所述电能表资产编号、所述台区标识、所述线路标识和所述变电站标识之间的关系,构建所述用户的档案知识图谱。
3.根据权利要求1所述的方法,其特征在于,所述实体参数包括:单个实体的关联度、各类实体的关联度和各类实体的数量;
所述获取所述档案知识图谱中所述目标实体的实体参数,包括:
获取预设的实体参数计算模型;
通过所述实体参数计算模型,输出所述档案知识图谱中各个目标实体的关联度、各类目标实体的关联度和各类目标实体的数量,作为所述档案知识图谱中所述目标实体的实体参数。
4.根据权利要求1所述的方法,其特征在于,所述根据所述实体参数对所述用户的档案关联关系进行识别,得到识别结果,包括:
将所述实体参数与预设识别条件进行比对,当所述实体参数不符合所述预设识别条件时,则判定所述用户的档案关联关系存在异常。
5.根据权利要求4所述的方法,其特征在于,所述预设识别条件包括:单个实体的关联度≠0、变电站标识类实体的关联度=线路标识类实体的关联度=台区标识类实体的关联度=用户编号类实体的关联度≤计量点编号类实体的关联度≤运行电能表标识类实体的关联度=电能表资产编号类实体的关联度、运行电能表标识实体的关联度=1和台区标识数量=1中的至少一种。
6.根据权利要求1所述的方法,其特征在于,在获取用户的用户标识之前,还包括:
获取用户的识别标识;
当所述用户的识别标识为未识别用户时,则获取所述用户的用户标识。
7.一种档案关联关系的异常识别装置,其特征在于,所述装置包括:
数据表获取模块,用于获取用户的用户标识,根据所述用户标识从档案数据库中获取所述用户的多个档案数据表;
知识图谱构建模块,用于对各个所述档案数据表进行关键字提取处理,根据提取到的目标关键字及目标关键字之间的关系,构建所述用户的档案知识图谱;所述档案知识图谱包括根据所述目标关键字确定的多个目标实体;
关系识别模块,用于获取所述档案知识图谱中所述目标实体的实体参数,根据所述实体参数对所述用户的档案关联关系进行识别,得到识别结果。
8.根据权利要求7所述的装置,其特征在于,所述知识图谱构建模块,具体用于分别提取各个所述档案数据表中的多个目标关键字及各个目标关键字之间的关系;所述目标关键字包括:用户编号、计量点编号、运行电能表标识、电能表资产编号、台区标识、线路标识和变电站标识;根据所述用户编号、所述计量点编号、所述运行电能表标识、所述电能表资产编号、所述台区标识、所述线路标识和所述变电站标识及所述用户编号、所述计量点编号、所述运行电能表标识、所述电能表资产编号、所述台区标识、所述线路标识和所述变电站标识之间的关系,构建所述用户的档案知识图谱。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202010825347.5A 2020-08-17 2020-08-17 档案关联关系的异常识别方法、装置和计算机设备 Active CN111914101B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010825347.5A CN111914101B (zh) 2020-08-17 2020-08-17 档案关联关系的异常识别方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010825347.5A CN111914101B (zh) 2020-08-17 2020-08-17 档案关联关系的异常识别方法、装置和计算机设备

Publications (2)

Publication Number Publication Date
CN111914101A true CN111914101A (zh) 2020-11-10
CN111914101B CN111914101B (zh) 2023-10-20

Family

ID=73278222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010825347.5A Active CN111914101B (zh) 2020-08-17 2020-08-17 档案关联关系的异常识别方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN111914101B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112486992A (zh) * 2020-11-30 2021-03-12 深圳供电局有限公司 一种数据存储方法及系统
CN113657872A (zh) * 2021-09-02 2021-11-16 南方电网数字电网研究院有限公司 电力用户的档案信息异常分析方法、装置和计算机设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130204894A1 (en) * 2012-02-02 2013-08-08 Patrick Faith Multi-Source, Multi-Dimensional, Cross-Entity, Multimedia Analytical Model Sharing Database Platform Apparatuses, Methods and Systems
US20200073932A1 (en) * 2018-08-30 2020-03-05 Intelligent Fusion Technology, Inc Method and system for pattern discovery and real-time anomaly detection based on knowledge graph
US20200118009A1 (en) * 2017-11-21 2020-04-16 Google Llc Improved onboarding of entity data
CN111209317A (zh) * 2020-01-15 2020-05-29 同济大学 一种知识图谱异常社区检测方法及装置
CN111324609A (zh) * 2020-02-17 2020-06-23 腾讯云计算(北京)有限责任公司 知识图谱构建方法、装置、电子设备及存储介质
CN111353310A (zh) * 2020-02-28 2020-06-30 腾讯科技(深圳)有限公司 基于人工智能的命名实体识别方法、装置及电子设备
CN111460174A (zh) * 2020-04-03 2020-07-28 中国建设银行股份有限公司 基于实体知识推理的简历异常检测方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130204894A1 (en) * 2012-02-02 2013-08-08 Patrick Faith Multi-Source, Multi-Dimensional, Cross-Entity, Multimedia Analytical Model Sharing Database Platform Apparatuses, Methods and Systems
US20200118009A1 (en) * 2017-11-21 2020-04-16 Google Llc Improved onboarding of entity data
US20200073932A1 (en) * 2018-08-30 2020-03-05 Intelligent Fusion Technology, Inc Method and system for pattern discovery and real-time anomaly detection based on knowledge graph
CN111209317A (zh) * 2020-01-15 2020-05-29 同济大学 一种知识图谱异常社区检测方法及装置
CN111324609A (zh) * 2020-02-17 2020-06-23 腾讯云计算(北京)有限责任公司 知识图谱构建方法、装置、电子设备及存储介质
CN111353310A (zh) * 2020-02-28 2020-06-30 腾讯科技(深圳)有限公司 基于人工智能的命名实体识别方法、装置及电子设备
CN111460174A (zh) * 2020-04-03 2020-07-28 中国建设银行股份有限公司 基于实体知识推理的简历异常检测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BIN JIA等: "Pattern discovery and anomaly detection via knowledge graph", 《2018 21ST INTERNATIONAL CONFERENCE ON INFORMATION FUSION》, pages 1 - 7 *
刘艺: "基于知识图谱的海量数据错误标签的纠正", 《中国优秀硕士学位论文全文数据库 信息科技辑》, pages 140 - 22 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112486992A (zh) * 2020-11-30 2021-03-12 深圳供电局有限公司 一种数据存储方法及系统
CN112486992B (zh) * 2020-11-30 2023-11-21 深圳供电局有限公司 一种数据存储方法及系统
CN113657872A (zh) * 2021-09-02 2021-11-16 南方电网数字电网研究院有限公司 电力用户的档案信息异常分析方法、装置和计算机设备

Also Published As

Publication number Publication date
CN111914101B (zh) 2023-10-20

Similar Documents

Publication Publication Date Title
CN108090567B (zh) 电力通信系统故障诊断方法及装置
WO2021208079A1 (zh) 获取动力电池寿命数据的方法、装置、计算机设备及介质
CN113326991B (zh) 自动授权方法、装置、计算机设备及存储介质
CN112100219B (zh) 基于数据库查询处理的报表生成方法、装置、设备和介质
CN109597979B (zh) 清单表格生成方法、装置、计算机设备和存储介质
CN111914101B (zh) 档案关联关系的异常识别方法、装置和计算机设备
CN110990390A (zh) 数据协同处理方法、装置、计算机设备和存储介质
CN113723810A (zh) 基于图数据库的电网建模方法
CN114493255A (zh) 基于知识图谱的企业异常监控方法及其相关设备
CN113538370A (zh) 电网巡检方法、装置、计算机设备和存储介质
CN109542962B (zh) 数据处理方法、装置、计算机设备和存储介质
CN115936895A (zh) 基于人工智能的风险评估方法、装置、设备及存储介质
CN113871018A (zh) 基于元数据模型的医疗数据治理方法、系统、计算机设备
CN111949845B (zh) 处理测绘信息的方法、装置、计算机设备和存储介质
CN112433753A (zh) 基于参数信息的接口文档生成方法、装置、设备和介质
CN117093556A (zh) 日志分类方法、装置、计算机设备及计算机可读存储介质
CN113159537B (zh) 电网新技术项目的评估方法、装置和计算机设备
CN114496139A (zh) 电子病历的质控方法、装置、设备、系统及可读介质
CN113837467A (zh) 点对点能源项目评估方法、装置、计算机设备和存储介质
CN113806372B (zh) 新数据信息构建方法、装置、计算机设备及存储介质
CN117273962A (zh) 保险保全处理方法、装置、设备及介质
CN116150157A (zh) 一种设备台账数据的处理方法、装置、设备及介质
CN115225609A (zh) 用户数据处理方法及装置、服务器
CN115036913A (zh) 一种低压台区拓扑生成方法、装置、电子设备和存储介质
CN115936312A (zh) 电子元器件评估方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 86, room 406, No.1, Yichuang street, Zhongxin Guangzhou Knowledge City, Huangpu District, Guangzhou City, Guangdong Province

Applicant after: Southern Power Grid Digital Grid Research Institute Co.,Ltd.

Applicant after: CHINA SOUTHERN POWER GRID Co.,Ltd.

Address before: 511458 Room 1301, Chengtou Building, 106 Fengze East Road, Nansha District, Guangzhou City, Guangdong Province (self-compiled 1301-12159)

Applicant before: Southern Power Grid Digital Grid Research Institute Co.,Ltd.

Applicant before: CHINA SOUTHERN POWER GRID Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Room 86, room 406, No.1, Yichuang street, Zhongxin Guangzhou Knowledge City, Huangpu District, Guangzhou City, Guangdong Province

Patentee after: Southern Power Grid Digital Grid Research Institute Co.,Ltd.

Country or region after: China

Patentee after: CHINA SOUTHERN POWER GRID Co.,Ltd.

Address before: Room 86, room 406, No.1, Yichuang street, Zhongxin Guangzhou Knowledge City, Huangpu District, Guangzhou City, Guangdong Province

Patentee before: Southern Power Grid Digital Grid Research Institute Co.,Ltd.

Country or region before: China

Patentee before: CHINA SOUTHERN POWER GRID Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240314

Address after: Room 86, room 406, No.1, Yichuang street, Zhongxin Guangzhou Knowledge City, Huangpu District, Guangzhou City, Guangdong Province

Patentee after: Southern Power Grid Digital Grid Research Institute Co.,Ltd.

Country or region after: China

Address before: Room 86, room 406, No.1, Yichuang street, Zhongxin Guangzhou Knowledge City, Huangpu District, Guangzhou City, Guangdong Province

Patentee before: Southern Power Grid Digital Grid Research Institute Co.,Ltd.

Country or region before: China

Patentee before: CHINA SOUTHERN POWER GRID Co.,Ltd.