CN116308824A - 基于知识图谱的团伙欺诈风险识别方法及相关设备 - Google Patents
基于知识图谱的团伙欺诈风险识别方法及相关设备 Download PDFInfo
- Publication number
- CN116308824A CN116308824A CN202310295749.2A CN202310295749A CN116308824A CN 116308824 A CN116308824 A CN 116308824A CN 202310295749 A CN202310295749 A CN 202310295749A CN 116308824 A CN116308824 A CN 116308824A
- Authority
- CN
- China
- Prior art keywords
- data
- user
- named entity
- risk
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
Abstract
本申请公开了一种基于知识图谱的团伙欺诈风险识别方法,应用于风险控制领域。本申请提供的方法包括:获取保险用户的用户信息数据、业务关联数据作为待处理数据;对所述待处理数据依次进行实体抽取、属性抽取、关系抽取,分别得到用户命名实体、用户命名实体属性、用户命名实体关联关系;将所述用户命名实体、所述用户命名实体属性和所述用户命名实体关联关系导入第一图数据库,得到用户信息知识图谱;通过知识图谱分析工具根据历史欺诈黑名单用户数据和所述用户信息知识图谱得到团伙欺诈风险关联规则;将所述团伙欺诈风险关联规则发送至预警平台,以使所述预警平台根据所述团伙欺诈风险关联规则实时扫描全平台数据以产生预警风险异常信息。
Description
技术领域
本申请涉及风险控制领域,尤其涉及一种基于知识图谱的团伙欺诈风险识别方法及相关设备。
背景技术
随着互联网的快速发展,保险业务线上化的程度不断加深,线上投保、线上理赔等保险业务为用户带来了便利与服务体验提升的同时,也给保险风险控制能力提出了更大的挑战。其中,团伙欺诈风险具有危害性大、隐蔽性强等特点。
但是,现有技术针对团伙欺诈风险的管控措施由于利用的数据信息有限和分析方法简单,在团伙欺诈风险的识别准确率和识别覆盖率较低,难以满足保险业务的发展需求。
发明内容
本申请实施例提供一种基于知识图谱的团伙欺诈风险识别方法、装置、计算机设备及存储介质,以解决现有技术识别保险团伙欺诈风险准确率和覆盖率低的问题。
本申请的第一方面,提供一种基于知识图谱的团伙欺诈风险识别方法,包括:
从预设数据源获取所有保险用户的用户信息数据、业务关联数据,将所述用户信息数据和所述业务关联数据作为待处理数据,其中,所述数据源包括企业内部各系统历史数据、公网采集数据以及第三方机构提供数据;
对所述待处理数据依次进行实体抽取、属性抽取、关系抽取,分别得到用户命名实体、所述用户命名实体关联的用户命名实体属性、所述用户命名实体之间的用户命名实体关联关系;
将所述用户命名实体、所述用户命名实体属性和所述用户命名实体关联关系导入已经部署的第一图数据库,得到用户信息知识图谱;
获取历史欺诈黑名单用户数据,通过知识图谱分析工具根据所述历史欺诈黑名单用户数据和所述用户信息知识图谱得到目标团伙欺诈风险关联规则,其中,所述目标团伙欺诈风险关联规则包含目标用户命名实体、目标用户命名实体属性和目标用户命名实体关联关系;
将所述目标团伙欺诈风险关联规则发送至对应的预警平台,以使所述预警平台根据所述目标团伙欺诈风险关联规则实时扫描全平台数据,若所述实时扫描产生预警风险异常信息,则发送所述预警风险异常信息至相关业务人员,其中,所述预警风险异常信息包含对应的用户信息、用户属性信息和用户关联关系。
本申请的第二方面,提供一种基于知识图谱的团伙欺诈风险识别装置,包括:
第一数据获取模块,用于从预设数据源获取所有保险用户的用户信息数据、业务关联数据,将所述用户信息数据和所述业务关联数据作为待处理数据,其中,所述数据源包括企业内部各系统历史数据、公网采集数据以及第三方机构提供数据;
第一数据抽取模块,用于对所述待处理数据依次进行实体抽取、属性抽取、关系抽取,分别得到用户命名实体、所述用户命名实体关联的用户命名实体属性、所述用户命名实体之间的用户命名实体关联关系;
第一图数据库模块,用于将所述用户命名实体、所述用户命名实体属性和所述用户命名实体关联关系导入已经部署的第一图数据库,得到用户信息知识图谱;
第一知识图谱分析模块,用于获取历史欺诈黑名单用户数据,通过知识图谱分析工具根据所述历史欺诈黑名单用户数据和所述用户信息知识图谱得到目标团伙欺诈风险关联规则,其中,所述目标团伙欺诈风险关联规则包含目标用户命名实体、目标用户命名实体属性和目标用户命名实体关联关系;
团伙欺诈风险预警模块,用于将所述目标团伙欺诈风险关联规则发送至对应的预警平台,以使所述预警平台根据所述目标团伙欺诈风险关联规则实时扫描全平台数据,若所述实时扫描产生预警风险异常信息,则发送所述预警风险异常信息至相关业务人员,其中,所述预警风险异常信息包含对应的用户信息、用户属性信息和用户关联关系。
本申请的第三方面,提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于知识图谱的团伙欺诈风险识别方法的步骤。
本申请的第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于知识图谱的团伙欺诈风险识别方法的步骤。
上述基于知识图谱的团伙欺诈风险识别方法、装置、计算机设备及存储介质,通过获取保险用户的用户信息数据、业务关联数据作为待处理数据;对所述待处理数据依次进行实体抽取、属性抽取、关系抽取,分别得到用户命名实体、用户命名实体属性、用户命名实体关联关系;将所述用户命名实体、所述用户命名实体属性和所述用户命名实体关联关系导入第一图数据库,得到用户信息知识图谱;通过知识图谱分析工具根据历史欺诈黑名单用户数据和所述用户信息知识图谱得到团伙欺诈风险关联规则;将所述团伙欺诈风险关联规则发送至对应的预警平台,以使所述预警平台根据所述团伙欺诈风险关联规则实时扫描全平台数据以产生预警风险异常信息。不仅充分利用了企业内部和外部的关联数据,充分挖掘了保险行业多元实体间的关联信息,提升了保险行业对团伙欺诈风险的防范管理能力。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例中基于知识图谱的团伙欺诈风险识别方法的一应用环境示意图;
图2是本申请一实施例中基于知识图谱的团伙欺诈风险识别方法的一流程图;
图3是本申请一实施例中基于知识图谱的团伙欺诈风险识别装置的结构示意图;
图4是本申请一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请提供的基于知识图谱的团伙欺诈风险识别方法,可应用在如图1的应用环境中,其中,计算机设备可以但不限于各种个人计算机、笔记本电脑,计算机设备还可以是服务器,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。可以理解的是图1中的计算机设备的数量仅仅是示意性的,可以根据实际需求进行任意数量的扩展。
在一实施例中,如图2所示,提供一种基于知识图谱的团伙欺诈风险识别方法,以该方法应用在图1中的计算机设备为例进行说明,包括如下步骤S101至S105:
S101、从预设数据源获取所有保险用户的用户信息数据、业务关联数据,将所述用户信息数据和所述业务关联数据作为待处理数据,其中,所述数据源包括企业内部各系统历史数据、公网采集数据以及第三方机构提供数据。
进一步地,所述用户信息数据和所述业务关联数据,不仅包含从所述预设数据源获得的初始数据,还包括根据业务数据需求通过数据统计分析工具对所述获得的初始数据进行统计分析得到的关联统计分析数据。例如某一金融科技平台的保险业务子系统,根据保险用户提交的社交媒体账号信息获取在公网中该用户的该社交媒体账号下发表所有的个人动态信息数据,然后通过社交数据统计分析工具对该个人动态信息数据进行统计分析,得到该保险用户在该社交媒体领域的社交属性数据,比如用户活跃时间段、用户职业等。
S102、对所述待处理数据依次进行实体抽取、属性抽取、关系抽取,分别得到用户命名实体、所述用户命名实体关联的用户命名实体属性、所述用户命名实体之间的用户命名实体关联关系。
进一步地,若存在针对目标业务的数据抽取需求,则从所述待处理数据中抽取所述数据抽取需求指定的数据内容,例如若所述数据抽取需求中指定了属性抽取时具体的属性变量,则从所述待处理数据中进行属性抽取时只抽取该属性变量对应的数据内容。由于数据抽取需求能够进一步缩小数据处理的范围,而不是对所述待处理数据进行全量处理,可以进一步提高本实施例的运行效率。其中,所述实体抽取、所述属性抽取、所述关系抽的具体实施方法因为不是本实施例的核心部分故在此不再赘述。
进一步地,所述对所述待处理数据依次进行实体抽取、属性抽取、关系抽取,分别得到用户命名实体、所述用户命名实体关联的用户命名实体属性、所述用户命名实体之间的用户命名实体关联关系之后,还包括:首先,对所述目标用户命名实体、所述目标用户命名实体属性、所述目标用户命名实体关联关系进行知识图谱实体对齐处理。其中,实体对齐(Entity Alignment,EA)在本实施例中是指从所述待处理数据中不同数据中发现相同或等价实体。其次,对所述目标用户命名实体、所述目标用户命名实体属性、所述目标用户命名实体关联关系进行知识图谱冲突消解处理。其中,所述冲突消解按照使用技术可以分为:基于投票的方式和基于质量估计的方式。所述基于投票的方式一般是根据不同实例出现频率进行投票后得票数最多的为最终结果。所述基于质量估计的方式一般是根据不同数据来源的可信度选择最高质量的结果。最后,对所述目标用户命名实体、所述目标用户命名实体属性、所述目标用户命名实体关联关系进行知识图谱知识融合处理。其中,所述知识融合是指对所述待处理数据中不同来源的数据在统一规范下进行异构数据整合。由于知识图谱中的知识来源不同,存在知识质量良莠不齐、来自不同数据源的知识重复、知识间的关联不够明确等问题,所以需要进行知识的融合。
S103、将所述用户命名实体、所述用户命名实体属性和所述用户命名实体关联关系导入已经部署的第一图数据库,得到用户信息知识图谱。
其中,图数据库(Graph Database,GDB)是一种使用图结构进行语义查询的非关系型数据库,图数据库使用节点、边和属性来表示和存储数据。图数据库直接将存储中的数据项与数据节点和节点间表示关系的边的集合关联。进一步地,所述第一图数据库在本实施例中可选用但不限于:Neo4j、OrientDB、ArangoDB、JanusGraph、Dgraph、HugeGraph等。
S104、获取历史欺诈黑名单用户数据,通过知识图谱分析工具根据所述历史欺诈黑名单用户数据和所述用户信息知识图谱得到目标团伙欺诈风险关联规则,其中,所述目标团伙欺诈风险关联规则包含目标用户命名实体、目标用户命名实体属性和目标用户命名实体关联关系。
其中,所述历史欺诈黑名单用户数据一方面来源于企业内部各个系统汇总的系统安全平台,另一方面来源于从企业外部的第三方数据获取渠道。其中,企业内各个系统会将各自系统中安全模块发现的黑名单用户汇总于所述系统安全平台。除此之外,所述系统安全平台还通过启动不同定时任务从公网渠道采集系统安全领域数据,其中,所述系统安全领域数据包含了各行各业的黑名单数据。在更具体的一个实施例中,从企业外部的信用评估机构获取存在信用欺诈历史的用户作为历史欺诈黑名单用户。
进一步地,所述获取历史欺诈黑名单用户数据,通过知识图谱分析工具根据所述历史欺诈黑名单用户数据和所述用户信息知识图谱得到目标团伙欺诈风险关联规则之后,还包括:首先,使用社区发现算法遍历处理所述用户信息知识图谱,得到所述用户信息知识图谱对应的目标层次性社区结构。在更具体的一个实施例中,所述社区发现算法采用Louvain算法。然后,计算所述目标层次性社区结构对应的保险赔付指标数据,根据所述目标层次性社区结构和所述保险赔付指标数据生成对应的保险风控规则。其中,所述保险赔付指标数据包含但不限于:赔付率、历年制赔付率、已报告赔付率、综合赔付率、事故年度制满期赔付率等。最后,将所述保险风控规则发送至需要进行保险风险控制的保险业务系统。
进一步地,所述计算所述目标层次性社区结构对应的保险赔付指标数据,根据所述目标层次性社区结构和所述保险赔付指标数据生成对应的保险风控规则之后,还包括:首先,在所述用户信息知识图谱中校验所述保险风控规则得到保险风控规则校验结果。其中,对所述保险风控规则增加进一步地校验过程能够增加所述保险风控规则的鲁棒性和准确性。然后,将所述保险风控规则校验结果与所述历史欺诈黑名单用户数据进行比较,移除未包含所述历史欺诈黑名单用户数据的所述保险风控规则校验结果对应的保险风控规则。最后,移除不满足预设风控精度和预设风控覆盖率的所述保险风控规则校验结果对应的保险风控规则。所述风控精度和风控覆盖率是根据目标保险业务进行灵活设置的,例如设置一风控精度是详细至检测用户汽车保险关联的汽车的每一次汽车维修保养记录,又例如设置一风控覆盖率的范围是涉嫌保险欺诈团伙的人数的覆盖率是至少5人。
进一步地,所述使用社区发现算法遍历处理所述用户信息知识图谱,得到所述用户信息知识图谱对应的目标层次性社区结构之后,还包括:首先,以所述用户命名实体属性为统计维度,统计所述目标层次性社区结构中所述目标用户命名实体对应的第一用户属性风险统计数据。然后,提取所述目标层次性社区结构中所述目标用户命名实体对应的第一embedding特征风险数据。最后,将所述第一用户属性风险统计数据和所述第一embedding特征风险数据发送至包含单用户粒度风险控制的保险业务系统。其中,embedding特征技术由于不是本实施例的核心部分故在此不再赘述。例如,某一科技金融平台通过统计数据发现汽车保险中某一年龄段且家庭收入在某一范围内的目标汽车保险用户的汽车维修保养记录存在异常的概率较高,则分析该目标汽车保险用户的用户基本信息和用户属性信息用于生成单用户粒度的风险控制信息。
所述将所述目标团伙欺诈风险关联规则发送至对应的预警平台,以使所述预警平台根据所述目标团伙欺诈风险关联规则实时扫描全平台数据,若所述实时扫描产生预警风险异常信息,则发送所述预警风险异常信息至相关业务人员之后,还包括:首先,创建用户信息知识图谱更新线程,使用所述用户信息知识图谱更新线程按照预设时间频率执行前述步骤,更新所述用户信息知识图谱。同时,创建用户信息知识图谱监控线程,使用所述用户信息知识图谱监控线程监控所述用户信息知识图谱对应的第一图数据库的数据量和性能参数是否同时达到数据量阈值范围和性能参数阈值范围。若是,则暂停所述用户信息知识图谱更新线程和所述用户信息知识图谱监控线程,将所述第一图数据库全部数据迁移至预设第二图数据库,以使得所述第二图数据库替换所述第一图数据库,其中,所述第二图数据库的最大存储数据量大于所述第一图数据库,所述第二图数据库的性能参数优于所述第一图数据库。最后,重新启动所述用户信息知识图谱更新线程和所述用户信息知识图谱监控线程。其中,若所述第一图数据库和所述第二图数据库的数据量达到一定数量级,还可以采取数据库技术中的分表、分库等拓展方案,由于数据库的拓展方案并不是本实施例的核心部分故在此不再赘述。
S105、将所述目标团伙欺诈风险关联规则发送至对应的预警平台,以使所述预警平台根据所述目标团伙欺诈风险关联规则实时扫描全平台数据,若所述实时扫描产生预警风险异常信息,则发送所述预警风险异常信息至相关业务人员,其中,所述预警风险异常信息包含对应的用户信息、用户属性信息和用户关联关系。
本实施例提供的基于知识图谱的团伙欺诈风险识别方法,通过获取保险用户的用户信息数据、业务关联数据作为待处理数据;对所述待处理数据依次进行实体抽取、属性抽取、关系抽取,分别得到用户命名实体、用户命名实体属性、用户命名实体关联关系;将所述用户命名实体、所述用户命名实体属性和所述用户命名实体关联关系导入第一图数据库,得到用户信息知识图谱;通过知识图谱分析工具根据历史欺诈黑名单用户数据和所述用户信息知识图谱得到团伙欺诈风险关联规则;将所述团伙欺诈风险关联规则发送至对应的预警平台,以使所述预警平台根据所述团伙欺诈风险关联规则实时扫描全平台数据以产生预警风险异常信息。不仅充分利用了企业内部和外部的关联数据,充分挖掘了保险行业多元实体间的关联信息,在保险业务的多个环节采用多种方式对团伙欺诈风险信息进行应用,提升了保险行业对团伙欺诈风险的防范管理能力。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
在一实施例中,提供一种基于知识图谱的团伙欺诈风险识别装置100,该基于知识图谱的团伙欺诈风险识别装置100与上述实施例中基于知识图谱的团伙欺诈风险识别方法一一对应。如图3所示,该基于知识图谱的团伙欺诈风险识别装置100包括第一数据获取模块11、第一数据抽取模块12、第一图数据库模块13、第一知识图谱分析模块14和团伙欺诈风险预警模块15。各功能模块详细说明如下:
第一数据获取模块11,用于从预设数据源获取所有保险用户的用户信息数据、业务关联数据作为待处理数据,其中,所述数据源包括企业内部各系统历史数据、公网采集数据以及第三方机构提供数据;
第一数据抽取模块12,用于从所述待处理数据中依次进行实体抽取、属性抽取、关系抽取,对应得到目标用户命名实体、所述目标用户命名实体关联的目标用户命名实体属性、所述目标用户命名实体之间的目标用户命名实体关联关系;
第一图数据库模块13,用于将所述目标用户命名实体、所述目标用户命名实体属性和所述目标用户命名实体关联关系导入已经部署的第一图数据库,得到用户信息知识图谱;
第一知识图谱分析模块14,用于获取历史欺诈黑名单用户数据,通过知识图谱分析工具根据所述历史欺诈黑名单用户数据和所述用户信息知识图谱得到目标团伙欺诈风险关联规则,其中,所述目标团伙欺诈风险关联规则包含所述目标用户命名实体、所述目标用户命名实体属性和所述目标用户命名实体关联关系;
团伙欺诈风险预警模块15,用于将所述目标团伙欺诈风险关联规则发送至对应的预警平台,所述预警平台根据所述目标团伙欺诈风险关联规则实时扫描全平台数据,若所述实时扫描产生预警风险异常信息,则发送所述预警风险异常信息至相关业务人员,其中,所述预警风险异常信息包含对应的用户信息、用户属性信息和用户关联关系。
进一步地,所述第一数据抽取模块12还包括:
实体对齐处理子模块,用于对所述目标用户命名实体、所述目标用户命名实体属性、所述目标用户命名实体关联关系进行知识图谱实体对齐处理;
冲突消解处理子模块,用于对所述目标用户命名实体、所述目标用户命名实体属性、所述目标用户命名实体关联关系进行知识图谱冲突消解处理;
知识融合处理子模块,用于对所述目标用户命名实体、所述目标用户命名实体属性、所述目标用户命名实体关联关系进行知识图谱知识融合处理。
进一步地,所述第一知识图谱分析模块14还包括:
社区结构生成子模块,用于使用社区发现算法遍历处理所述用户信息知识图谱,得到所述用户信息知识图谱对应的目标层次性社区结构;
保险风控规则子模块,用于计算所述目标层次性社区结构对应的保险赔付指标数据,根据所述目标层次性社区结构和所述保险赔付指标数据生成对应的保险风控规则;
风控规则推送子模块,用于将所述保险风控规则发送至需要进行保险风险控制的保险业务系统。
进一步地,所述保险风控规则子模块还包括:
风控规则校验子单元,用于在所述用户信息知识图谱中校验所述保险风控规则得到保险风控规则校验结果;
风控规则第一筛选子单元,用于将所述保险风控规则校验结果与所述历史欺诈黑名单用户数据进行比较,移除未包含所述历史欺诈黑名单用户数据的所述保险风控规则校验结果对应的保险风控规则;
风控规则第二筛选子单元,用于移除不满足预设风控精度和预设风控覆盖率的所述保险风控规则校验结果对应的保险风控规则。
进一步地,所述保险风控规则子模块还包括:
用户属性风险子单元,用于以所述用户命名实体属性为统计维度,统计所述目标层次性社区结构中所述目标用户命名实体对应的第一用户属性风险统计数据;
embedding特征风险子单元,用于提取所述目标层次性社区结构中所述目标用户命名实体对应的第一embedding特征风险数据;
风险数据推送子单元,用于将所述第一用户属性风险统计数据和所述第一embedding特征风险数据发送至包含单用户粒度风险控制的保险业务系统。
进一步地,所述团伙欺诈风险预警模块15还包括:
知识图谱更新子模块,用于创建用户信息知识图谱更新线程,使用所述用户信息知识图谱更新线程按照预设时间频率执行前述步骤,更新所述用户信息知识图谱;
知识图谱监控子模块,用于创建用户信息知识图谱监控线程,使用所述用户信息知识图谱监控线程监控所述用户信息知识图谱对应的第一图数据库的数据量和性能参数是否同时达到数据量阈值范围和性能参数阈值范围;
图数据库迁移子模块,用于若是,则暂停所述用户信息知识图谱更新线程和所述用户信息知识图谱监控线程,将所述第一图数据库全部数据迁移至预设第二图数据库,以使得所述第二图数据库替换所述第一图数据库,其中,所述第二图数据库的最大存储数据量大于所述第一图数据库,所述第二图数据库的性能参数优于所述第一图数据库;
线程重启子模块,用于重新启动所述用户信息知识图谱更新线程和所述用户信息知识图谱监控线程。
其中上述模块/单元中的“第一”和“第二”的意义仅在于将不同的模块/单元加以区分,并不用于限定哪个模块/单元的优先级更高或者其它的限定意义。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块,本申请中所出现的模块的划分,仅仅是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式。
关于基于知识图谱的团伙欺诈风险识别装置的具体限定可以参见上文中对于基于知识图谱的团伙欺诈风险识别方法的限定,在此不再赘述。上述基于知识图谱的团伙欺诈风险识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于知识图谱的团伙欺诈风险识别方法中涉及到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于知识图谱的团伙欺诈风险识别方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中基于知识图谱的团伙欺诈风险识别方法的步骤,例如图2所示的步骤S101至步骤S105及该方法的其它扩展和相关步骤的延伸。或者,处理器执行计算机程序时实现上述实施例中基于知识图谱的团伙欺诈风险识别装置的各模块/单元的功能,例如图3所示模块11至模块15的功能。为避免重复,这里不再赘述。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、视频数据等)等。
所述存储器可以集成在所述处理器中,也可以与所述处理器分开设置。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中基于知识图谱的团伙欺诈风险识别方法的步骤,例如图2所示的步骤S101至步骤S105及该方法的其它扩展和相关步骤的延伸。或者,计算机程序被处理器执行时实现上述实施例中基于知识图谱的团伙欺诈风险识别装置的各模块/单元的功能,例如图3所示模块11至模块15的功能。为避免重复,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种基于知识图谱的团伙欺诈风险识别方法,其特征在于,包括:
从预设数据源获取所有保险用户的用户信息数据、业务关联数据,将所述用户信息数据和所述业务关联数据作为待处理数据,其中,所述数据源包括企业内部各系统历史数据、公网采集数据以及第三方机构提供数据;
对所述待处理数据依次进行实体抽取、属性抽取、关系抽取,分别得到用户命名实体、所述用户命名实体关联的用户命名实体属性、所述用户命名实体之间的用户命名实体关联关系;
将所述用户命名实体、所述用户命名实体属性和所述用户命名实体关联关系导入已经部署的第一图数据库,得到用户信息知识图谱;
获取历史欺诈黑名单用户数据,通过知识图谱分析工具根据所述历史欺诈黑名单用户数据和所述用户信息知识图谱得到目标团伙欺诈风险关联规则,其中,所述目标团伙欺诈风险关联规则包含目标用户命名实体、目标用户命名实体属性和目标用户命名实体关联关系;
将所述目标团伙欺诈风险关联规则发送至对应的预警平台,以使所述预警平台根据所述目标团伙欺诈风险关联规则实时扫描全平台数据,若所述实时扫描产生预警风险异常信息,则发送所述预警风险异常信息至相关业务人员,其中,所述预警风险异常信息包含对应的用户信息、用户属性信息和用户关联关系。
2.根据权利要求1所述的基于知识图谱的团伙欺诈风险识别方法,其特征在于,所述对所述待处理数据依次进行实体抽取、属性抽取、关系抽取,分别得到用户命名实体、所述用户命名实体关联的用户命名实体属性、所述用户命名实体之间的用户命名实体关联关系之后,还包括:
对所述目标用户命名实体、所述目标用户命名实体属性、所述目标用户命名实体关联关系进行知识图谱实体对齐处理;
对所述目标用户命名实体、所述目标用户命名实体属性、所述目标用户命名实体关联关系进行知识图谱冲突消解处理;
对所述目标用户命名实体、所述目标用户命名实体属性、所述目标用户命名实体关联关系进行知识图谱知识融合处理。
3.根据权利要求1所述的基于知识图谱的团伙欺诈风险识别方法,其特征在于,所述获取历史欺诈黑名单用户数据,通过知识图谱分析工具根据所述历史欺诈黑名单用户数据和所述用户信息知识图谱得到目标团伙欺诈风险关联规则之后,还包括:
使用社区发现算法遍历处理所述用户信息知识图谱,得到所述用户信息知识图谱对应的目标层次性社区结构;
计算所述目标层次性社区结构对应的保险赔付指标数据,根据所述目标层次性社区结构和所述保险赔付指标数据生成对应的保险风控规则;
将所述保险风控规则发送至需要进行保险风险控制的保险业务系统。
4.根据权利要求3所述的基于知识图谱的团伙欺诈风险识别方法,其特征在于,所述计算所述目标层次性社区结构对应的保险赔付指标数据,根据所述目标层次性社区结构和所述保险赔付指标数据生成对应的保险风控规则之后,还包括:
在所述用户信息知识图谱中校验所述保险风控规则得到保险风控规则校验结果;
将所述保险风控规则校验结果与所述历史欺诈黑名单用户数据进行比较,移除未包含所述历史欺诈黑名单用户数据的所述保险风控规则校验结果对应的保险风控规则;
移除不满足预设风控精度和预设风控覆盖率的所述保险风控规则校验结果对应的保险风控规则。
5.根据权利要求3所述的基于知识图谱的团伙欺诈风险识别方法,其特征在于,所述使用社区发现算法遍历处理所述用户信息知识图谱,得到所述用户信息知识图谱对应的目标层次性社区结构之后,还包括:
以所述用户命名实体属性为统计维度,统计所述目标层次性社区结构中所述目标用户命名实体对应的第一用户属性风险统计数据;
提取所述目标层次性社区结构中所述目标用户命名实体对应的第一embedding特征风险数据;
将所述第一用户属性风险统计数据和所述第一embedding特征风险数据发送至包含单用户粒度风险控制的保险业务系统。
6.根据权利要求1所述的基于知识图谱的团伙欺诈风险识别方法,其特征在于,所述将所述目标团伙欺诈风险关联规则发送至对应的预警平台,以使所述预警平台根据所述目标团伙欺诈风险关联规则实时扫描全平台数据,若所述实时扫描产生预警风险异常信息,则发送所述预警风险异常信息至相关业务人员之后,还包括:
创建用户信息知识图谱更新线程,使用所述用户信息知识图谱更新线程按照预设时间频率执行前述步骤,更新所述用户信息知识图谱;
创建用户信息知识图谱监控线程,使用所述用户信息知识图谱监控线程监控所述用户信息知识图谱对应的第一图数据库的数据量和性能参数是否同时达到数据量阈值范围和性能参数阈值范围;
若是,则暂停所述用户信息知识图谱更新线程和所述用户信息知识图谱监控线程,将所述第一图数据库全部数据迁移至预设第二图数据库,以使得所述第二图数据库替换所述第一图数据库,其中,所述第二图数据库的最大存储数据量大于所述第一图数据库,所述第二图数据库的性能参数优于所述第一图数据库;
重新启动所述用户信息知识图谱更新线程和所述用户信息知识图谱监控线程。
7.一种基于知识图谱的团伙欺诈风险识别装置,其特征在于,包括:
第一数据获取模块,用于从预设数据源获取所有保险用户的用户信息数据、业务关联数据,将所述用户信息数据和所述业务关联数据作为待处理数据,其中,所述数据源包括企业内部各系统历史数据、公网采集数据以及第三方机构提供数据;
第一数据抽取模块,用于对所述待处理数据依次进行实体抽取、属性抽取、关系抽取,分别得到用户命名实体、所述用户命名实体关联的用户命名实体属性、所述用户命名实体之间的用户命名实体关联关系;
第一图数据库模块,用于将所述用户命名实体、所述用户命名实体属性和所述用户命名实体关联关系导入已经部署的第一图数据库,得到用户信息知识图谱;
第一知识图谱分析模块,用于获取历史欺诈黑名单用户数据,通过知识图谱分析工具根据所述历史欺诈黑名单用户数据和所述用户信息知识图谱得到目标团伙欺诈风险关联规则,其中,所述目标团伙欺诈风险关联规则包含目标用户命名实体、目标用户命名实体属性和目标用户命名实体关联关系;
团伙欺诈风险预警模块,用于将所述目标团伙欺诈风险关联规则发送至对应的预警平台,以使所述预警平台根据所述目标团伙欺诈风险关联规则实时扫描全平台数据,若所述实时扫描产生预警风险异常信息,则发送所述预警风险异常信息至相关业务人员,其中,所述预警风险异常信息包含对应的用户信息、用户属性信息和用户关联关系。
8.根据权利要求7所述的基于知识图谱的团伙欺诈风险识别装置,其特征在于,所述第一数据抽取模块还包括:
实体对齐处理子模块,用于对所述目标用户命名实体、所述目标用户命名实体属性、所述目标用户命名实体关联关系进行知识图谱实体对齐处理;
冲突消解处理子模块,用于对所述目标用户命名实体、所述目标用户命名实体属性、所述目标用户命名实体关联关系进行知识图谱冲突消解处理;
知识融合处理子模块,用于对所述目标用户命名实体、所述目标用户命名实体属性、所述目标用户命名实体关联关系进行知识图谱知识融合处理。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述基于知识图谱的团伙欺诈风险识别方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述基于知识图谱的团伙欺诈风险识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310295749.2A CN116308824A (zh) | 2023-03-23 | 2023-03-23 | 基于知识图谱的团伙欺诈风险识别方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310295749.2A CN116308824A (zh) | 2023-03-23 | 2023-03-23 | 基于知识图谱的团伙欺诈风险识别方法及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116308824A true CN116308824A (zh) | 2023-06-23 |
Family
ID=86784893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310295749.2A Pending CN116308824A (zh) | 2023-03-23 | 2023-03-23 | 基于知识图谱的团伙欺诈风险识别方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116308824A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117575782A (zh) * | 2024-01-15 | 2024-02-20 | 杭银消费金融股份有限公司 | 一种基于Leiden社区发现算法的团伙欺诈识别方法 |
CN117575782B (zh) * | 2024-01-15 | 2024-05-07 | 杭银消费金融股份有限公司 | 一种基于Leiden社区发现算法的团伙欺诈识别方法 |
-
2023
- 2023-03-23 CN CN202310295749.2A patent/CN116308824A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117575782A (zh) * | 2024-01-15 | 2024-02-20 | 杭银消费金融股份有限公司 | 一种基于Leiden社区发现算法的团伙欺诈识别方法 |
CN117575782B (zh) * | 2024-01-15 | 2024-05-07 | 杭银消费金融股份有限公司 | 一种基于Leiden社区发现算法的团伙欺诈识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200389495A1 (en) | Secure policy-controlled processing and auditing on regulated data sets | |
US9111235B2 (en) | Method and system to evaluate risk of configuration changes in an information system | |
CN110956269A (zh) | 数据模型的生成方法、装置、设备以及计算机存储介质 | |
CN110674247A (zh) | 弹幕信息的拦截方法、装置、存储介质及设备 | |
US11645386B2 (en) | Systems and methods for automated labeling of subscriber digital event data in a machine learning-based digital threat mitigation platform | |
CN113379301A (zh) | 通过决策树模型对用户进行分类的方法、装置和设备 | |
CN111488594A (zh) | 一种基于云服务器的权限检查方法、装置、存储介质及终端 | |
US20120330928A1 (en) | Method and Apparatus for Generating a Fused View of One or More People | |
CN113157734B (zh) | 基于搜索框架的数据处理方法、装置、设备及存储介质 | |
CN111815454B (zh) | 数据上链方法及装置、电子设备、存储介质 | |
CN112286930A (zh) | redis业务方资源共享的方法、装置、存储介质及电子设备 | |
CN110502549B (zh) | 用户数据处理方法、装置、计算机设备和存储介质 | |
CN116308824A (zh) | 基于知识图谱的团伙欺诈风险识别方法及相关设备 | |
US10970341B2 (en) | Predictive modeling in event processing systems for big data processing in cloud | |
CN114969187A (zh) | 数据分析系统及方法 | |
CN115051859A (zh) | 情报分析方法、情报分析装置、电子设备及介质 | |
CN114860732A (zh) | 关键报表处理方法、装置、计算机设备及存储介质 | |
CN113297436A (zh) | 基于关系图网络的用户策略分配方法、装置及电子设备 | |
CN112632371A (zh) | 银行业务反欺诈方法与系统 | |
CN112667730B (zh) | 一种外部数据验证方法、系统、设备及存储介质 | |
CN116703184B (zh) | 数据处理方法、数据处理装置、电子设备及可读存储介质 | |
CN110008220B (zh) | 黑名单传导图谱衰减系数获取方法、装置和计算机设备 | |
CN116112264B (zh) | 一种基于区块链的策略隐藏大数据访问控制方法和装置 | |
US20220038892A1 (en) | Mathematical Summaries of Telecommunications Data for Data Analytics | |
CN116452266A (zh) | 广告资源分配方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |