CN110826311B - 对象识别方法以及装置 - Google Patents

对象识别方法以及装置 Download PDF

Info

Publication number
CN110826311B
CN110826311B CN202010031000.3A CN202010031000A CN110826311B CN 110826311 B CN110826311 B CN 110826311B CN 202010031000 A CN202010031000 A CN 202010031000A CN 110826311 B CN110826311 B CN 110826311B
Authority
CN
China
Prior art keywords
similarity
position data
text
target
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010031000.3A
Other languages
English (en)
Other versions
CN110826311A (zh
Inventor
刘斐
王修坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ant Shengxin (Shanghai) Information Technology Co.,Ltd.
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010031000.3A priority Critical patent/CN110826311B/zh
Publication of CN110826311A publication Critical patent/CN110826311A/zh
Application granted granted Critical
Publication of CN110826311B publication Critical patent/CN110826311B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/387Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Library & Information Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书提供对象识别方法以及装置,其中所述对象识别方法包括:根据预设时间周期内各个待识别对象的位置数据组成位置数据组;计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵;将所述各个位置数据对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图;采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标对象集;基于所述目标对象集中目标对象所属的业务类型,对所述目标对象参与的业务项目的业务策略进行调整。

Description

对象识别方法以及装置
技术领域
本说明书涉及计算机技术领域,特别涉及一种对象识别方法。本说明书同时涉及一种目标团队识别方法,一种对象识别装置,一种目标团队识别装置,两种计算设备,以及两种计算机可读存储介质。
背景技术
随着互联网技术的发展,各式各样的项目都开启了线上模式,例如保险、购物、租赁等项目都具有线上店铺和服务网点,为用户的生活带来了更便捷的服务。
然而,由于线上模式的特殊性,很多场景下只能通过线上的方式对目标对象进行识别和审核,从而可能导致一些非正常目标对象利用该漏洞进行一些非正常操作,比如非正常目标对象对订单数据进行随意篡改的行为,或者针对订单数据进行刷单的行为,都会对场景对应的业务项目的安全性造成影响,并且现有技术针对目标对象的识别通常是基于事实性关系进行图计算实现的,存在着计算效率低且计算量大的问题,很难精准的对目标对象进行识别,进而亟需一种更精准有效的方法以解决上述存在的问题。
发明内容
有鉴于此,本说明书实施例提供了一种对象识别方法。本说明书同时涉及一种目标团队识别方法,一种对象识别装置,一种目标团队识别装置,两种计算设备,以及两种计算机可读存储介质。以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种对象识别方法,包括:
根据预设时间周期内各个待识别对象的位置数据组成位置数据组;
计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵;
将所述各个位置数据对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图;
采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标对象集;
基于所述目标对象集中目标对象所属的业务类型,对所述目标对象参与的业务项目的业务策略进行调整。
可选的,所述计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵,包括:
提取所述位置数据组中包含的所述各个位置数据对应的文本数据;
计算所述文本数据之间的文本相似度;
判断所述文本数据之间的文本相似度是否存在小于预设文本相似度阈值的文本相似度;
若否,根据所述文本相似度确定所述相似度矩阵。
可选的,若所述判断所述文本数据之间的文本相似度是否存在小于预设文本相似度阈值的文本相似度子步骤的判断结果为是,还包括:
将小于所述预设文本相似度阈值的文本相似度对应的文本数据的位置数据添加至位置数据集合;
通过查询预先建立的位置数据之间的标准距离,确定所述位置数据集合中包含的各个位置数据之间的实际距离;
根据所述实际距离计算所述位置数据集合中包含的各个位置数据之间的距离相似度,根据所述距离相似度确定所述位置数据集合对应的距离相似度矩阵;
根据大于等于所述预设文本相似度阈值的文本数据之间的文本相似度确定文本相似度矩阵;
将所述文本相似度矩阵和所述距离相似度矩阵进行整合,根据整合结果确定所述相似度矩阵。
可选的,所述计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵,包括:
提取所述位置数据组中包含的所述各个位置数据对应的文本地址数据,并计算所述文本地址数据之间的第一相似度,根据所述第一相似度确定所述相似度矩阵;
或者,
提取所述位置数据组中包含的所述各个位置数据对应的地理坐标,计算所述地理坐标之间的坐标距离,并基于所述坐标距离计算所述各个位置数据之间的第二相似度,根据所述第二相似度确定所述相似度矩阵。
可选的,所述计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵,包括:
通过对所述位置数据组中包含的各个位置数据进行解析,获得所述各个位置数据对应的文本地址数据和地理坐标;
计算所述各个位置数据对应的地理坐标之间的坐标距离,并基于所述坐标距离计算所述各个位置数据之间的第三相似度,以及计算所述各个位置数据对应的文本地址数据之间第四相似度;
基于所述第三相似度和所述第四相似度确定所述相似度矩阵。
可选的,所述采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标对象集,包括:
对所述关系图中包含的各个节点分配标签;
将所述相似度矩阵作为所述关系图的权重对携带有所述标签的节点进行聚类处理,根据聚类处理结果将标签相同且具有联通关系的节点确定为目标节点集合;
基于所述目标节点集合确定所述目标对象集。
可选的,所述基于所述目标对象集中目标对象所属的业务类型,对所述目标对象参与的业务项目的业务策略进行调整,包括:
确定所述目标对象集中包含的所述目标对象所属的所述业务类型;
选择所述业务类型相同的目标对象创建目标业务对象集;
将所述目标业务对象集中包含的目标对象添加至黑名单,并根据所述黑名单中各个目标对象的位置数据对所述业务策略进行调整。
根据本说明书实施例的第二方面,提供了一种目标团队识别方法,包括:
根据预设时间周期内各个用户的位置数据组成位置数据组;
计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵;
将所述各个位置数据对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图;
采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标团队。
可选的,所述计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵,包括:
提取所述位置数据组中包含的所述各个位置数据对应的文本数据;
计算所述文本数据之间的文本相似度;
判断所述文本数据之间的文本相似度是否存在小于预设文本相似度阈值的文本相似度;
若否,根据所述文本相似度确定所述相似度矩阵。
可选的,若所述判断所述文本数据之间的文本相似度是否存在小于预设文本相似度阈值的文本相似度子步骤的判断结果为是,还包括:
将小于所述预设文本相似度阈值的文本相似度对应的文本数据的位置数据添加至位置数据集合;
通过查询预先建立的位置数据之间的标准距离,确定所述位置数据集合中包含的各个位置数据之间的实际距离;
根据所述实际距离计算所述位置数据集合中包含的各个位置数据之间的距离相似度,根据所述距离相似度确定所述位置数据集合对应的距离相似度矩阵;
根据大于等于所述预设文本相似度阈值的文本数据之间的文本相似度确定文本相似度矩阵;
将所述文本相似度矩阵和所述距离相似度矩阵进行整合,根据整合结果确定所述相似度矩阵。
可选的,所述根据预设时间周期内各个用户的位置数据组成位置数据组步骤执行之后,所述计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵步骤执行之前,还包括:
将所述位置数据组中包含的所述各个位置数据按照地理区域进行标准化处理,获得标准位置数据组成的标准位置数据组;
相应的,所述计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵,包括:
计算所述标准位置数据组中包含的各个标准位置数据之间的标准相似度,并根据所述标准相似度确定所述相似度矩阵。
可选的,所述计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵,包括:
提取所述位置数据组中包含的所述各个位置数据对应的文本地址数据,并计算所述文本地址数据之间的第一相似度,根据所述第一相似度确定所述相似度矩阵;
或者,
提取所述位置数据组中包含的所述各个位置数据对应的地理坐标,计算所述地理坐标之间的坐标距离,并基于所述坐标距离计算所述各个位置数据之间的第二相似度,根据所述第二相似度确定所述相似度矩阵。
可选的,所述计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵,包括:
通过对所述位置数据组中包含的各个位置数据进行解析,获得所述各个位置数据对应的文本地址数据和地理坐标;
计算所述各个位置数据对应的地理坐标之间的坐标距离,并基于所述坐标距离计算所述各个位置数据之间的第三相似度,以及计算所述各个位置数据对应的文本地址数据之间第四相似度;
基于所述第三相似度和所述第四相似度确定所述相似度矩阵。
可选的,所述采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标团队,包括:
对所述关系图中包含的各个节点分配标签;
将所述相似度矩阵作为所述关系图的权重对携带有所述标签的节点进行聚类处理,根据聚类处理结果将标签相同且具有联通关系的节点确定为目标节点集合;
基于所述目标节点集合对应的目标用户集合确定所述目标团队。
可选的,所述采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标团队步骤执行之后,还包括:
确定所述目标团队中包含的目标成员所属的业务类型;
选择所述业务类型相同的目标成员创建目标业务团队,并将所述目标业务团队中包含的目标成员加入黑名单。
可选的,所述地理区域包括下述至少一项:
省份地理区域、城市地理区域、街道地理区域;
相应的,所述将所述位置数据组中包含的所述各个位置数据按照地理区域进行标准化处理,获得标准位置数据组成的标准位置数据组,包括:
将所述位置数据组中包含的所述各个位置数据按照所述街道地理区域进行标准化处理,获得所述街道地理区域中包含的标准位置数据组成的所述标准位置数据组。
根据本说明书实施例的第三方面,提供了一种对象识别装置,包括:
组成位置数据组模块,被配置为根据预设时间周期内各个待识别对象的位置数据组成位置数据组;
确定相似度矩阵模块,被配置为计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵;
生成关系图模块,被配置为将所述各个位置数据对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图;
处理相似度矩阵模块,被配置为采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标对象集;
调整业务策略模块,被配置为基于所述目标对象集中目标对象所属的业务类型,对所述目标对象参与的业务项目的业务策略进行调整。
根据本说明书实施例的第四方面,提供了一种目标团队识别装置,包括:
组成模块,被配置为根据预设时间周期内各个用户的位置数据组成位置数据组;
确定模块,被配置为计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵;
生成模块,被配置为将所述各个位置数据对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图;
处理模块,被配置为采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标团队。
根据本说明书实施例的第五方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
根据预设时间周期内各个待识别对象的位置数据组成位置数据组;
计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵;
将所述各个位置数据对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图;
采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标对象集;
基于所述目标对象集中目标对象所属的业务类型,对所述目标对象参与的业务项目的业务策略进行调整。
根据本说明书实施例的第六方面,提供了另一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
根据预设时间周期内各个用户的位置数据组成位置数据组;
计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵;
将所述各个位置数据对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图;
采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标团队。
根据本说明书实施例的第七方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述对象识别方法的步骤。
根据本说明书实施例的第八方面,提供了另一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述目标团队识别方法的步骤。
本说明书一实施例实现了通过在预设的时间周期内获取待识别对象的位置数据,并计算位置数据之间的相似度,根据相似度确定相似度矩阵,将位置数据对应的位置坐标作为节点,结合相似度矩阵对建立节点之间的联通关系,生成关系图,采用传播聚类的方式对关系图中包含的节点按照相似度矩阵进行聚类处理,确定目标对象集,最后基于目标对象集对所述业务项目的业务策略进行调整,实现了可以在减少计算量的情况下,精准的确定所述目标对象集,进而降低了所述目标对象集对所述业务项目带来的损失,进一步提高了所述业务项目的安全性。
附图说明
图1是本说明书一实施例提供的一种对象识别方法的流程图;
图2是本说明书一实施例提供的一种目标团队识别方法的流程图;
图3是本说明书一实施例提供的一种应用于保险项目中的对象识别方法的处理流程图;
图4是本说明书一实施例提供的一种对象识别装置的结构示意图;
图5是本说明书一实施例提供的一种目标团队识别装置的结构示意图;
图6是本说明书一实施例提供的一种计算设备的结构框图;
图7是本说明书一实施例提供的另一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
在本说明书中,提供了一种对象识别方法。同时涉及一种目标团队识别方法,一种对象识别装置,一种目标团队识别装置,两种计算设备,以及两种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
图1示出了根据本说明书一实施例提供的一种对象识别方法的流程图,具体包括以下步骤:
步骤102:根据预设时间周期内各个待识别对象的位置数据组成位置数据组。
本说明书一实施例中所述待识别对象可以是待识别用户或者待识别终端,在所述待识别对象为待识别用户的情况下,对应的所述位置数据具体是指用户参与业务项目的过程中填写的位置信息,在所述待识别对象为待识别终端的情况下,对应的所述位置数据具体是指用户通过多个终端参与业务项目时所对应的地理位置。
实际应用中,很多场景都涉及到安全性的问题,比如导航数据、订单数据、购物订单数据等都需要进行一定的安全布置,以防止存在非正常对象篡改数据或针对数据进行恶意操作的情况发生,但是由于很多非正常对象为了突破业务项目的安全防控,通常会采用集合更多的非正常对象进行非正常操作,而此时业务项目的安全性将会下降,很容易造成数据的损失或损坏。
具体实施时,在非正常对象为待识别用户的情况下,此时将会出现用户的异常操作造成业务项目产生一定的损失,以此用户可以谋取一定的利益,而往往在用户进行异常操作的过程中通常是团队作案,例如在购物场景中可能存在团队组团刷购物订单的情况发生,此时不仅会对业务项目造成一定的损失,还会将业务项目的业务环境变得更差,可能进一步造成更多的用户流失;有鉴于此,为了能够降低目标对象集对业务项目带来的损失,可以通过识别目标对象集的方式,对所述业务项目的业务策略进行调整,进而可以实现对目标对象集带来的异常操作进行防控,以实现降低目标对象集带来的损失的同时提高业务项目的安全性。
本说明书提供的对象识别方法,通过在预设的时间周期内获取待识别对象的位置数据,并计算位置数据之间的相似度,根据相似度确定相似度矩阵,将位置数据对应的位置坐标作为节点,结合相似度矩阵对建立节点之间的联通关系,生成关系图,采用传播聚类的方式对关系图中包含的节点按照相似度矩阵进行聚类处理,确定目标对象集,最后基于目标对象集对所述业务项目的业务策略进行调整,实现了可以在减少计算量的情况下,精准的确定所述目标对象集,进而降低了所述目标对象集对所述业务项目带来的损失,并且通过对所述业务项目的业务策略进行调整,实现了可以对所述目标对象集造成的损失进行控制,进一步提高了所述业务项目的安全性。
实际应用中,所述待识别对象即为与所述业务项目的相关的用户或者终端,而所述终端即为通过用户进行操控。
步骤104:计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵。
实际应用中,所述相似度可以是各个位置数据之间的文本相似度和/或距离相似度,所述相似度用于体现各个待识别对象对应的位置数据之间的相关程度,相似度越大表示两个位置数据之间的相关程度越高,进而越能表明两个位置数据可能是同一地理位置,反之,相似度越小表示两个位置数据之间的相关程度越低,进而越能表明两个位置数据不是同一地理位置。
进一步的,在确定所述相似度矩阵的过程中,为了能够在后续精准的确定所述目标对象集,以实现对可以对所述业务项目的业务策略进行准确的调整,进而实现降低业务项目的损失,本实施例的一个或多个实施方式中,可以通过判断相似度大小的方式实现,具体实现方式如下所述:
提取所述位置数据组中包含的所述各个位置数据对应的文本数据;
计算所述文本数据之间的文本相似度;
判断所述文本数据之间的文本相似度是否存在小于预设文本相似度阈值的文本相似度;
若否,根据所述文本相似度确定所述相似度矩阵;
若是,将小于所述预设文本相似度阈值的文本相似度对应的文本数据的位置数据添加至位置数据集合;
通过查询预先建立的位置数据之间的标准距离,确定所述位置数据集合中包含的各个位置数据之间的实际距离;
根据所述实际距离计算所述位置数据集合中包含的各个位置数据之间的距离相似度,根据所述距离相似度确定所述位置数据集合对应的距离相似度矩阵;
根据大于等于所述预设文本相似度阈值的文本数据之间的文本相似度确定文本相似度矩阵;
将所述文本相似度矩阵和所述距离相似度矩阵进行整合,根据整合结果确定所述相似度矩阵。
实际应用中,所述文本数据具体是指描述所述位置数据的文本,所述文本相似度用于表示各个位置之间的关系,所述文本相似度越大说明所述位置数据对应的位置是同一位置的概率越高,反之文本相似度越小说明所述位置数据对应的位置是同一位置的概率越低;
进一步的,在计算完成所述位置数据组中包含的各个位置数据对应文本数据之间的文本相似度的情况下,判断所述文本数据之间的文本相似度是否存在小于预设文本相似度阈值的文本相似度,若否,说明所述各个位置数据对应的文本数据之间文本相似度均大于等于所述预设文本相似度阈值,进一步说明各个位置数据对应的位置是同一位置概率的可能性越大,则根据所述文本相似度确定相似度矩阵即可,用于后续识别出目标对象集对所述业务策略进行调整;
若是,说明所述各个位置数据对应的文本数据之间文本相似度存在小于所述预设文本相似度阈值的文本数据,存在位置数据对应的位置可能不是同一位置,此时为了能够进一步的确定文本相似度小于预设文本相似度阈值的文本数据对应位置数据之间的相似度是准确的,可以再对小于预设文本相似度阈值的文本数据对应的位置数据进行距离相似度计算;
首先将小于所述预设文本相似度阈值的文本相似度对应的文本数据的位置数据添加至位置数据集合,所述位置数据集合中包含的位置数据是相互之间文本相似度不高的位置数据,再通过查询预先建立的位置数据之间的标准距离,确定所述位置数据集合中包含的各个位置数据之间的实际距离,其中所述实际距离具体是指各个位置数据之间的地理距离,根据所述实际距离计算所述各个位置数据之间的距离相似度,所述距离相似度用于体现位置数据之间的关系,所述实际距离越小说明位置数据之间的距离相似度也就越高,进而说明是同一位置的概率也就越高,反之,所述实际距离越大说明位置数据之间的距离相似度也就越低,进而说明是同一位置的概率也就越低;
最后,根据大于等于预设文本相似度阈值的文本数据之间的文本相似度确定文本相似度矩阵,将小于所述预设文本相似度阈值的文本数据对应位置数据计算其距离相似度确定距离相似度矩阵,通过将所述文本相似度矩阵和所述距离相似度矩阵进行整合,根据整合结果确定所述相似度矩阵,用于后续识别出目标对象集对所述业务策略进行调整。
具体实施时,对所述业务策略进行调整具体是指屏蔽所述目标对象集中包含的目标对象的位置数据,避免出现目标对象对所述业务项目带来二次损失;或者针对存在与目标对象集中包含的目标的位置数据之间的关系图相似的其他对象集,可以拒绝向该对象集中包含的目标对象提供所述业务项目相关的业务服务。
实际应用中,可以针对不同的业务项目选择不同的相似度矩阵确定方法,本实施例的一个或多个实施方式中,所述相似度矩阵的确定方法,还包括:
提取所述位置数据组中包含的所述各个位置数据对应的文本地址数据,并计算所述文本地址数据之间的第一相似度,根据所述第一相似度确定所述相似度矩阵;或者,提取所述位置数据组中包含的所述各个位置数据对应的地理坐标,计算所述地理坐标之间的坐标距离,并基于所述坐标距离计算所述各个位置数据之间的第二相似度,根据所述第二相似度确定所述相似度矩阵。
实际应用中,在识别出目标对象集存在破坏业务项目规则较多的场景中,可以选择计算第二相似度确定相似度矩阵的方式,而在识别出目标对象集存在骗取行为较多的场景中,可以选择计算第一相似度确定相似度矩阵的方式,具体应用中可以结合实际应用场景进行选择确定相似度矩阵的方式,本说明书在此不作任何限定。
除此之外,还可以同时计算第三相似度和第四相似度用于确定所述相似度矩阵,本实施例的一个或多个实施方式中,确定所述相似度矩阵的具体过程如下所述:
通过对所述位置数据组中包含的各个位置数据进行解析,获得所述各个位置数据对应的文本地址数据和地理坐标;
计算所述各个位置数据对应的地理坐标之间的坐标距离,并基于所述坐标距离计算所述各个位置数据之间的第三相似度,以及计算所述各个位置数据对应的文本地址数据之间第四相似度;
基于所述第三相似度和所述第四相似度确定所述相似度矩阵。
通过同时在两个维度进行相似度的计算,避免任意一个维度计算相似度单一不稳定的问题,避免偶然现象的发生,使得后续基于目标对象集对业务策略进行调整的过程中可以精准的对业务策略进行调整,以实现降低业务项目的损失,并提高所述业务项目的安全性。
步骤106:将所述各个位置数据对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图。
实际应用中,所述关系图是将预设时间周期内的各个待识别对象的位置数据对应的位置坐标作为节点,以及各个待识别对象的位置数据之间的相似度作为边,即基于所述相似度矩阵建立所述节点之间的联通关系,即可生成所述关系图,用于后续通过聚类的方式在关系图中聚类出目标对象集,以实现对所述业务项目的业务策略进行调整,提高所述业务项目的安全性。
步骤108:采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标对象集。
实际应用中,所述传播聚类处理具体是指在所述关系图中识别出具有联通关系的节点,且根据所述相似度矩阵确定节点对应的位置数据之间相似度足够高的情况下,即可将多个节点对应的多个待识别对象确定为目标对象集,实际应用中,所述传播聚类的方式可以采用传播聚类算法(Label Propagation Algorithm,简称LPA)实现聚类处理。
本实施例的一个或多个实施方式中,在对所述关系图中的节点按照所述相似度矩阵进行聚类处理的过程中,是指对所述关系图中的节点分配标签,根据标签传播的方式不断的迭代,直到每个节点的标签不再变化的情况下,即可根据具有相同标签且具有联通关系的节点集合确定目标对象集,具体实现方式如下所述:
对所述关系图中包含的各个节点分配标签;
将所述相似度矩阵作为所述关系图的权重对携带有所述标签的节点进行聚类处理,根据聚类处理结果将标签相同且具有联通关系的节点确定为目标节点集合;
基于所述目标节点集合确定所述目标对象集。
实际应用中,为所述关系图中包含的各个节点分配标签,其中所述每个节点具有唯一的标签,在标签分配完成之后将所述相似度矩阵作为所述关系图中各个节点之间的相似度权重,通过所述相似度矩阵对携带有所述标签的节点进行聚类处理,所述聚类处理具体是指遍历每个节点,每个节点找到邻近节点的标签并替换,而标签替换的过程需要根据所述相似度矩阵进行替换,通过不断的迭代,直到关系图中各个节点的标签不再变化的情况下,即可确定聚类处理完成;再根据聚类处理结果将此时关系图中标签相同且具有联通关系的节点确定为目标节点集合,即标签相同且具有联通关系的节点对应的待识别对象之间可能具有一定的关系,基于所述目标节点集合即可确定所述目标对象集。
通过采用传播聚类的方式对所述关系图中包含的节点进行聚类处理,可以在短时间内确定目标节点集合,进而确定所述目标对象集,很大程度上提高了目标对象集的识别效率,进而可以在更短的时间内识别出目标对象,以实现更快速的对业务策略进行调整。
步骤110:基于所述目标对象集中目标对象所属的业务类型,对所述目标对象参与的业务项目的业务策略进行调整。
具体的,所述业务类型具体是指在所述业务项目中目标对象所参与的子业务项目的业务类型,所述业务策略具体是指所述业务项目针对存在异常的事件或者漏洞所作出的策略;
基于此,在确定所述目标对象集的基础上,即可确定所述目标对象集中包含的目标对象可能对所述业务项目造成损失或者破坏,此时为了避免该情况发生,可以通过对目标对象进行屏蔽或者禁止的方式对所述业务策略进行调整,进而提高所述业务项目的安全性。
本实施例的一个或多个实施方式中,调整所述业务策略的具体过程如下所述:
确定所述目标对象集中包含的所述目标对象所属的所述业务类型;
选择所述业务类型相同的目标对象创建目标业务对象集;
将所述目标业务对象集中包含的目标对象添加至黑名单,并根据所述黑名单中各个目标对象的位置数据对所述业务策略进行调整。
实际应用中,为了避免出现确定的目标对象集中的目标对象不存在对所述业务项目造成损失的对象,可以根据所述业务类型在所述目标对象集中选择业务类型相同的目标对象创建目标业务对象集,表明在所述目标业务对象集中包含的目标对象是通过一种方式或者相同手段可能对所述业务项目造成损失,此时选择所述目标业务对象集中包含的目标对象添加至黑名单,并根据所述黑名单中各个目标对象的位置数据对所述业务策略进行调整。
具体实施时,基于黑名单中的各个目标对象的位置数据对所述业务策略进行调整具体是指通过在所述业务策略中增加对所述目标对象的位置数据进行屏蔽或者禁止的方式,实现不对所述被屏蔽或者禁止的位置数据对应的用户或者终端提供业务项目相关的服务,进而避免目标对象对所述业务项目造成二次损失,从而使得所述业务项目的安全性得到了有效的提高。
除此之外,在对所述业务项目的业务策略进行调整的过程中,还可以是根据所述目标对象之间存在的关系图确定为异常关系图,若再次识别出存在的关系图与异常关系图相似度较高的情况下,即可确定是目标对象,此时可以不对其提供相应的业务服务,从而实现了对异常对象的防控,进而提高了所述业务项目的安全性。
本说明书提供的对象识别方法,通过在预设的时间周期内获取待识别对象的位置数据,并计算位置数据之间的相似度,根据相似度确定相似度矩阵,将位置数据对应的位置坐标作为节点,结合相似度矩阵对建立节点之间的联通关系,生成关系图,采用传播聚类的方式对关系图中包含的节点按照相似度矩阵进行聚类处理,确定目标对象集,最后基于目标对象集对所述业务项目的业务策略进行调整,实现了可以在减少计算量的情况下,精准的确定所述目标对象集,进而降低了所述目标对象集对所述业务项目带来的损失,并且通过对所述业务项目的业务策略进行调整,实现了可以对所述目标对象集造成的损失进行控制,进一步提高了所述业务项目的安全性。
本说明书还提供了一种目标团队识别方法如图2所示,其中,图2示出了根据本说明书一实施例提供的一种目标团队识别方法的流程图,具体包括如下步骤:
步骤202:根据预设时间周期内各个用户的位置数据组成位置数据组。
实际应用中,所述位置数据具体是指用户参与项目过程中填写的位置信息,例如,用户进行网路购物的情况下,该用户的位置数据为用户填写的收货地址,或者用户参与保险项目的情况下,该用户的位置数据为用户填写的接收理赔订单的收货地址;
基于此,本实施例将以所述用户参与保险项目为例进行描述,用户在通过线上购买保险之后,在发生理赔的情况下,核保的方式只能通过线上的方式进行审核,而在此过程中提供线上保险服务的平台由于线上保险服务特性的影响,对用户的核保精准度并不是很高,很容易让一些异常用户有可乘之机,异常用户可能通过团队的方式进行组团骗保等行为,进而造成了提供线上保险服务平台的损失。
本实施例提供的目标团队识别方法,为了避免上述情况发生,且在减少计算量的情况下精准的确定目标团队,通过在预设的时间周期内获取用户的位置数据,并计算位置数据之间的相似度,根据相似度确定相似度矩阵,将位置数据对应的位置坐标作为节点,结合相似度矩阵对建立节点之间的联通关系,生成关系图,采用传播聚类的方式对关系图中包含的节点按照相似度矩阵进行聚类处理,确定目标团队,实现了可以在减少计算量的情况下,精准的确定目标团队,进而降低了目标团队带来的损失。
具体实施时,所述目标团队即为可能对业务项目带来损失的异常团队,由于目标团队可能随时进行骗保或者刷购物订单,为了避免目标团队多次进行骗保或者刷购物订单的行为,设置在一定的时间周期内对参与项目的用户进行异常识别,以确定目标团队;其中所述用户参与的项目可以是保险项目,此时识别出的目标团队即为具有骗保行为的团队;在所述用户参与的项目是购物项目,此时识别出的目标团队即为具有非正常手段刷购物订单行为的团队。其中,所述预设时间周期可以设置为24小时,48小时或者1周,具体的时间长度可以根据实际应用场景进行设定,本说明书在此不作任何限定。
在保险项目中,可以获取1周时间周期内参与保险项目且获得理赔的用户的位置数据,基于各个用户的位置数据组成所述位置数据组,用于后续目标团队的识别。
进一步的,在获取预设时间周期内的各个用户的位置数据的情况下,由于用户在填写位置数据的过程中可能填写地址的格式并不统一,即目标团队为了避免被识别出来,可能将同一地址用多种不同的方式进行填写,例如,用户A填写的地址是A城市B路1号院1单元,而用户B填写的地址是A城市甲小区1单元,实则用户A和用户B填写的地址是同一地址,只是填写的格式不同,可能造成混淆,为了避免这一情况发生,可以对所述位置数据组中包含的各个位置数据进行标准化处理,本实施例的一个或多个实施方式中,对所述位置数据组中包含的各个位置数据进行标准化处理的过程如下所述:
将所述位置数据组中包含的所述各个位置数据按照地理区域进行标准化处理,获得标准位置数据组成的标准位置数据组;相应的,执行下述步骤204,所述步骤204为计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵,具体是指计算所述标准位置数据组中包含的各个标准位置数据之间的标准相似度,并根据所述标准相似度确定所述相似度矩阵。
本实施例的一个或多个实施方式中,所述地理区域包括下述至少一项:省份地理区域、城市地理区域、街道地理区域;更进一步的,对所述位置数据进行标准化处理的过程具体是指:将所述位置数据组中包含的所述各个位置数据按照所述街道地理区域进行标准化处理,获得所述街道地理区域中包含的标准位置数据组成的所述标准位置数据组。
具体的,在对所述位置数据组中包含的各个位置数据进行标准化处理的过程,所述标准化处理具体是指将各个用户对应位置数据按照地理区域进行标准化处理,所述地理区域具体是指省份地理区域、城市地理区域和街道地理区域等,按照所述地理区域进行标准化处理具体是指首先确定所述位置数据所属的省份,再确定所述位置数据在该省份中所属的城市,再确定所述位置数据在该城市中所属的街道,按照该层级关系最终确定所述位置数据的地理位置;通过按照地理区域进行标准化处理可以精准的确定位置数据对应的标准位置数据,提高了后续目标团队识别的精准度;
基于此,在按照所述地理区域对所述位置数据进行标准化处理的过程中,还可以将所述位置数据中的冗余内容进行删除,例如A城市,B街道,其中多了标点符号,可以将标点符号进行删除,获得该位置数据对应的标准位置数据。
例如,用户C在购买保险后发生理赔的情况下,用户C填写接收理赔订单的位置数据是A城市甲小区1号楼1单元101,通过对用户C对应位置数据进行标准化处理,获得的标准位置数据是A省A城市A街道1号院1号楼1单元101。
除此之外,在用户填写位置数据的过程中,可能存在填写重复,填写不规范等情况,例如,用户A填写的地址是A省B城市C区B城市C区甲小区1单元,此时用户A的位置数据中存在重复填写,或者用户A填写的地址是A省B市区C区甲社区1单元,此时用户A的位置数据中存在填写不规范;基于上述两种情况都可以对位置数据进行标准化处理,获得标准位置数据,再进行后续的目标团队识别。
通过将所述位置数据组中包含的各个位置数据进行标准化处理,避免出现同一位置不同填写方式造成的影响,进一步提高了计算相似度的准确性,使得最终确定目标团队的准确度也得到越高。
步骤204:计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵。
具体的,在上述根据所述各个用户对应的位置数据组成位置数据组的基础上,进一步的,计算所述位置数据组中包含的各个位置数据之间的相似度,再根据所述相似度确定所述相似度矩阵,其中,所述相似度为各个位置数据之间的文本相似度和/或距离相似度。
具体实施时,所述相似度用于体现各个用户对应的位置数据之间的相关程度,相似度越大表示两个位置数据之间的相关程度越高,进而越能表明两个位置数据可能是同一地理位置,反之,相似度越小表示两个位置数据之间的相关程度越低,进而越能表明两个位置数据不是同一地理位置。
进一步的,在根据所述相似度确定所述相似度矩阵的过程中,为了能够在后续更精准的识别出目标团队,可以先计算所述位置数据组中包含的各个位置数据之间的文本相似度,根据文本相似度的大小进行判断,再计算将文本相似度较小的位置数据之间的距离相似度,实现了可以对所述位置数据组中包含的各个位置数据之间的相似度进行精准的确定,可以提高后续识别目标团队的精准度,本实施例的一个或多个实施方式中,根据相似度确定相似度矩阵的过程如下所述:
提取所述位置数据组中包含的所述各个位置数据对应的文本数据;
计算所述文本数据之间的文本相似度;
判断所述文本数据之间的文本相似度是否存在小于预设文本相似度阈值的文本相似度;
若否,根据所述文本相似度确定所述相似度矩阵;
若是,将小于所述预设文本相似度阈值的文本相似度对应的文本数据的位置数据添加至位置数据集合;
通过查询预先建立的位置数据之间的标准距离,确定所述位置数据集合中包含的各个位置数据之间的实际距离;
根据所述实际距离计算所述位置数据集合中包含的各个位置数据之间的距离相似度,根据所述距离相似度确定所述位置数据集合对应的距离相似度矩阵;
根据大于等于所述预设文本相似度阈值的文本数据之间的文本相似度确定文本相似度矩阵;
将所述文本相似度矩阵和所述距离相似度矩阵进行整合,根据整合结果确定所述相似度矩阵。
具体的,所述文本数据具体是指描述所述位置数据的文本,例如,位置数据是A省B城市甲小区,则文本数据即为位置数据对应的文本内容“A省B城市甲小区”,通过提取所述位置数据组中包含的各个位置数据对应的文本数据,再计算所述各个文本数据之间的文本相似度,根据各个文本数据之间的文本相似度确定所述各个位置数据之间的关系,所述文本相似度越大说明所述位置数据对应的位置是同一位置的概率越高,反之文本相似度越小说明所述位置数据对应的位置是同一位置的概率越低;
进一步的,在计算完成所述位置数据组中包含的各个位置数据对应文本数据之间的文本相似度的情况下,判断所述文本数据之间的文本相似度是否存在小于预设文本相似度阈值的文本相似度,若否,说明所述各个位置数据对应的文本数据之间文本相似度均大于等于所述预设文本相似度阈值,进一步说明各个位置数据对应的位置是同一位置概率的可能性越大,则根据所述文本相似度确定相似度矩阵即可,用于后续识别目标团队;
若是,说明所述各个位置数据对应的文本数据之间文本相似度存在小于所述预设文本相似度阈值的文本数据,存在位置数据对应的位置可能不是同一位置,此时为了能够进一步的确定文本相似度小于预设文本相似度阈值的文本数据对应位置数据之间的相似度是准确的,可以再对小于预设文本相似度阈值的文本数据对应的位置数据进行距离相似度计算;
首先将小于所述预设文本相似度阈值的文本相似度对应的文本数据的位置数据添加至位置数据集合,所述位置数据集合中包含的位置数据是相互之间文本相似度不高的位置数据,再通过查询预先建立的位置数据之间的标准距离,确定所述位置数据集合中包含的各个位置数据之间的实际距离,其中所述实际距离具体是指各个位置数据之间的地理距离,根据所述实际距离计算所述各个位置数据之间的距离相似度,所述距离相似度用于体现位置数据之间的关系,所述实际距离越小说明位置数据之间的距离相似度也就越高,进而说明是同一位置的概率也就越高,反之,所述实际距离越大说明位置数据之间的距离相似度也就越低,进而说明是同一位置的概率也就越低;
最后,根据大于等于预设文本相似度阈值的文本数据之间的文本相似度确定文本相似度矩阵,将小于所述预设文本相似度阈值的文本数据对应位置数据计算其距离相似度确定距离相似度矩阵,通过将所述文本相似度矩阵和所述距离相似度矩阵进行整合,根据整合结果确定所述相似度矩阵,用于后续目标团队识别。
例如,在2019年9月1日至2019年9月7日城市A中有用户A、用户B和用户C在同一保险服务平台获得理赔,而保险服务平台为了识别用户A、用户B和用户C是否存在团队骗保行为,需要对用户A、用户B和用户C进行目标团队识别,通过采集用户A、用户B和用户C的位置数据,确定用户A的位置数据是A城市甲大楼101,用户B的位置数据是A城市甲广场1号楼101,用户C的位置数据是A城市乙街道13号;
首先提取用户A、用户B和用户C对应的位置数据的文本数据,计算用户A、用户B和用户C对应的文本数据之间的文本相似度,确定用户A和用户B的位置数据的文本相似度是85%,用户B和用户C的位置数据的文本相似度是20%,用户A和用户C的位置数据的文本相似度是21%,而文本相似度阈值是80%,可以确定用户A和用户B的文本相似度是较高的,根据用户A和用户B的文本相似度确定文本相似度矩阵,而用户A和用户C、用户B和用户C之间的文本相似度是较低的,需要再根据实际距离进行确定用户A和用户C、用户B和用户C之间的距离相似度,通过查询A城市甲大楼101至A城市乙街道13号的标准距离确定用户A和用户C的第一实际距离是2千米,通过查询A城市甲广场1号楼101至A城市乙街道13号的标准距离确定用户B和用户C的第二实际距离是2.1千米,则根据第一实际距离确定用户A和用户C的距离相似度是10%,根据第二实际距离确定用户B和用户C的距离相似度是9%,根据距离相似度确定距离相似度矩阵,通过将文本相似度矩阵和距离相似度矩阵进行整合,作为所述用户A、用户B和用户C对应的相似度矩阵用于后续目标团队的识别。
在确定所述相似度矩阵的过程中,为了能够提高后续可以精准的确定目标团队,首先计算各个位置数据之间的文本相似度,再计算小于预设相似度阈值的文本数据对应的位置数据之间的距离相似度,通过将所述文本相似度确定的文本相似度矩阵和距离相似度确定的距离相似度矩阵进行整合,确定所述相似度矩阵,实现了通过文本对位置数据进行初步位置审核的基础上,再结合实际距离对位置数据进行更进一步的位置审核,使得目标团队识别的精准度更高,且避免目标团队通过将文本格式更改的方式降低识别准确率的情况发生。
具体实施时,由于在一些特殊场景下,采用文本相似度和/或距离相似度确定相似度矩阵的效果并不是很好,可以针对不同的场景采用不同的方式确定所述相似度矩阵用于后续的目标团队识别,本实施例的一个或多个实施方式中,所述相似度矩阵的确定方式还包括:
提取所述位置数据组中包含的所述各个位置数据对应的文本地址数据,并计算所述文本地址数据之间的第一相似度,根据所述第一相似度确定所述相似度矩阵;或者,提取所述位置数据组中包含的所述各个位置数据对应的地理坐标,计算所述地理坐标之间的坐标距离,并基于所述坐标距离计算所述各个位置数据之间的第二相似度,根据所述第二相似度确定所述相似度矩阵。
实际应用中,在识别目标团队刷购物订单的场景中,可以选择计算第二相似度确定相似度矩阵的方式,而在识别目标团队刷好评率的场景中,可以选择计算第一相似度确定相似度矩阵的方式,具体应用中可以结合实际应用场景进行选择确定相似度矩阵的方式,本说明书在此不作任何限定。
除此之外,还可以同时计算第三相似度和第四相似度用于确定所述相似度矩阵,本实施例的一个或多个实施方式中,确定所述相似度矩阵的具体过程如下所述:
通过对所述位置数据组中包含的各个位置数据进行解析,获得所述各个位置数据对应的文本地址数据和地理坐标;
计算所述各个位置数据对应的地理坐标之间的坐标距离,并基于所述坐标距离计算所述各个位置数据之间的第三相似度,以及计算所述各个位置数据对应的文本地址数据之间第四相似度;
基于所述第三相似度和所述第四相似度确定所述相似度矩阵。
具体的,同时计算各个位置数据之间的文本相似度和距离相似度,确定所述第三相似度和第四相似度,再通过所述第三相似度和所述第四相似度确定所述相似度矩阵即可。
通过同时在两个维度进行相似度的计算,避免任意一个维度计算相似度单一不稳定的问题,避免偶然现象的发生,使得可以在后续目标团队识别的过程中可以提高目标团队识别的精准度。
步骤206:将所述各个位置数据对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图。
具体的,在上述计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定所述相似度矩阵的基础上,进一步的,根据所述位置数据和所述相似度矩阵构建关系图;
基于此,所述关系图是将预设时间周期内的各个用户的位置数据对应的位置坐标作为节点,以及所述各个用户的位置数据之间的相似度作为边,即基于所述相似度矩阵建立所述节点之间的联通关系,即可生成所述关系图,用于后续通过聚类的方式在关系图中聚类出目标团队。
步骤208:采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标团队。
具体的,在上述将所述各个位置数据对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图的基础上,进一步的,通过采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果即可确定所述目标团队。
其中,所述传播聚类处理具体是指在所述关系图中识别出具有联通关系的节点,且根据所述相似度矩阵确定节点对应的位置数据之间相似度足够高的情况下,即可将多个节点对应的多个用户确定为目标团队。
本实施例的一个或多个实施方式中,在对所述关系图中的节点按照所述相似度矩阵进行聚类处理的过程中,是指对所述关系图中的节点分配标签,根据标签传播的方式不断的迭代,直到每个节点的标签不再变化的情况下,即可根据具有相同标签且具有联通关系的节点集合确定目标团队,具体实现方式如下所述:
对所述关系图中包含的各个节点分配标签;
将所述相似度矩阵作为所述关系图的权重对携带有所述标签的节点进行聚类处理,根据聚类处理结果将标签相同且具有联通关系的节点确定为目标节点集合;
基于所述目标节点集合对应的目标用户集合确定所述目标团队。
具体的,在生成所述关系图的基础上,进一步的,为所述关系图中包含的各个节点分配标签,其中所述每个节点具有唯一的标签,在标签分配完成之后将所述相似度矩阵作为所述关系图中各个节点之间的相似度权重,通过所述相似度矩阵对携带有所述标签的节点进行聚类处理,所述聚类处理具体是指遍历每个节点,每个节点找到邻近节点的标签并替换,而标签替换的过程需要根据所述相似度矩阵进行替换,通过不断的迭代,直到关系图中各个节点的标签不再变化的情况下,即可确定聚类处理完成;
基于此,再根据聚类处理结果将此时关系图中标签相同且具有联通关系的节点确定为目标节点集合,即标签相同且具有联通关系的节点对应的用户之间可能具有一定的关系,基于所述目标节点集合对应的目标用户集合即可确定所述目标团队。
例如,在关系图中具有10000个节点,每个节点对应一个获得保险理赔的用户,并且这10000个用户的位置数据之间的相似度计算完成,并确定相似度矩阵,通过为这10000个节点分配标签1,标签2,标签3……标签10000,并将相似度矩阵作为关系图的权重对携带有标签的节点进行聚类处理,根据聚类处理结果确定其中存在10个节点的标签是标签20,且这10个节点之间具有联通关系,则将这10个节点确定为目标节点集合,确定这10个节点对应的用户,将这10个用户确定为目标团队,并确定该目标团队可能存在组团骗取理赔金额的可能。
通过采用传播聚类的方式对所述关系图中包含的节点进行聚类处理,可以在短时间内确定目标节点集合,进而确定所述目标团队,很大程度上提高了目标团队的识别效率,进而可以在更短时间内识别出目标团队,可以加快止损速率。
具体实施时,在确定所述目标团队的基础上,可以结合业务类型对所述目标团队进行更进一步的检测,避免将非目标用户确定为目标用户,本实施例的一个或多个实施方式中,具体实现方式如下所述:
确定所述目标团队中包含的目标成员所属的业务类型;
选择所述业务类型相同的目标成员创建目标业务团队,并将所述目标业务团队中包含的目标成员加入黑名单。
具体的,在确定所述目标团队的基础上,检测所述目标团队中包含的目标成员所属的业务类型,将业务类型相同的目标用户创建目标业务团队,在确定所述目标业务团队的情况下,即可确定目标业务团队中的目标用户是具有相同业务类型,且位置数据相似度较高的,即可将所述目标业务团队中的目标成员添加至黑名单,禁止目标业务团队中的目标成员参与所述业务类型所属的业务项目。
此外,在创建所述目标业务团队的过程中,为了能够确保所述业务类型相同的目标成员相对于所述业务类型所属的业务项目是风险用户,还可以针对业务类型相同的目标成员进行信息采集,通过选择距离所述业务类型相同的目标成员较近的查勘员进行信息采集,再根据查勘员的信息采集结果结合所述业务类型相同的目标成员创建目标业务团队,最后将目标业务团队中包含的目标成员加入黑名单即可。
例如,保险服务平台通过目标团队识别,确定目标团队中包括用户A,用户B,用户C,用户D和用户E,其中用户A在保险服务平台获得理赔金额是10000元,理赔案件是意外骨折,而用户B,用户C,用户D和用户E在保险服务平台获得的理赔金额均为5000元,理赔案件是食物中毒,并且用户B,用户C,用户D和用户E的位置数据之间的相似度达到95%,则可以确定用户B,用户C,用户D和用户E存在骗保的可能;再通过选择距离用户B,用户C,用户D和用户E较近的查勘员采集其投保信息、理赔信息和治疗信息等,根据查勘员的信息采集结果确定用户B,用户C,用户D和用户E的治疗信息不属实(相关医院没有用户B,用户C,用户D和用户E的治疗证明和用药证明),此时确定用户B,用户C,用户D和用户E存在骗保可能,基于用户B,用户C,用户D和用户E创建目标业务团队,并将用户B,用户C,用户D和用户E加入黑名单,禁止用户B,用户C,用户D和用户E在该保险服务平台购买保险即可。
通过对相同业务类型的目标用户创建目标业务团队,并将所述目标业务团队中包含的目标成员加入黑名单,实现了可以对目标团队进行制裁,进一步的降低了业务类型所属的业务项目的损失。
本实施例提供的目标团队识别方法,通过在预设的时间周期内获取用户的位置数据,并计算位置数据之间的相似度,根据相似度确定相似度矩阵,将位置数据对应的位置坐标作为节点,结合相似度矩阵对建立节点之间的联通关系,生成关系图,采用传播聚类的方式对关系图中包含的节点按照相似度矩阵进行聚类处理,确定目标团队,实现了可以在减少计算量的情况下,精准的确定目标团队,进而降低了目标团队带来的损失,并且采用传播聚类的方式进行聚类处理,进一步的提高了目标团队的识别效率,进而可以在较短的时间内止损,提高了业务类型所属的业务项目的安全性。
下述结合附图3,以本说明书提供的对象识别方法在保险项目中的应用为例,对所述对象识别方法进行进一步说明。其中,图3示出了本说明书一实施例提供的一种应用于保险项目中的对象识别方法的处理流程图,具体包括以下步骤:
步骤302:采集在预设时间周期内获得理赔的用户的位置数据,并根据位置数据组成位置数据组。
具体的,保险服务平台为了避免出现团队骗保的情况发生,需要每周对获得理赔的用户进行风险团队识别;基于此,在风险团队识别的过程中需要根据获得理赔的用户的位置数据进行风险识别的过程。
步骤304:将位置数据组中包含的位置数据按照地理区域进行标准化处理,获得标准位置数据组。
具体的,由于获得理赔的用户填写的位置数据可能格式并不统一,则需要按照地理区域对位置数据组中包含的位置数据进行标准化处理,获得由标准位置数据组成的标准位置数据组。
步骤306:提取标准位置数据组中包含的各个标准位置数据的文本数据,并计算各个文本数据之间的文本相似度。
具体的,通过提取标准位置数据组中包含的各个标准位置数据的文本数据,确定获得理赔的用户填写的文本数据,通过计算各个文本数据之间的文本相似度,用于判断是否存在同一地址存在多个理赔用户的现象。
步骤308:判断各个文本数据之间的文本相似度是否存在小于预设文本相似度阈值的文本数据;若否,则执行步骤310;若是,则执行步骤312。
步骤310:根据各个文本数据之间的文本相似度确定相似度矩阵。
具体的,在各个文本数据之间的文本相似度未存在小于预设文本相似度阈值的文本数据的情况下,说明在这一周内获得理赔的用户之间的位置比较接近或是同一位置,则可以根据文本相似度确定相似度矩阵,进一步的识别风险团队;基于此在确定相似度矩阵的情况下,继续执行所述步骤322即可。
步骤312:将小于预设文本相似度阈值的文本数据对应的标准位置数据添加至位置数据集合。
具体的,在各个文本数据之间的文本相似度存在小于预设文本相似度阈值的文本数据的情况下,则将小于预设文本相似度阈值的文本数据对应的标准位置数据添加至位置数据集合,用于后续识别风险团队。
步骤314:通过查询预先建立的标准位置数据之间的标准距离,确定位置数据集合中包含的各个标准位置数据之间的实际距离。
具体的,各个标准位置数据之间的实际距离具体是指各个用户之间的实际距离。
步骤316:根据实际距离计算位置数据集合中包含的各个标准位置数据之间的距离相似度,根据距离相似度确定距离相似度矩阵。
步骤318:根据大于等于预设文本相似度阈值的文本数据之间的文本相似度确定文本相似度矩阵。
具体的,在标准位置数据组中存在部分文本相似度大于等于预设文本相似度阈值的标准位置数据,也存在部分文本相似度小于预设文本相似度阈值的标准位置数据;根据大于等于预设文本相似度的位置数据之间的文本相似度确定文本相似度矩阵,根据小于预设文本相似度的位置数据之间的距离相似度确定距离相似度矩阵。
步骤320:将文本相似度矩阵和距离相似度矩阵进行整合,获得相似度矩阵。
步骤322:将各个标准位置数据对应的位置坐标作为节点,并基于相似度矩阵建立节点之间的联通关系,生成标准位置数据组对应的关系图。
具体的,将获得理赔用户的位置坐标作为节点,以及基于各个用户对应的标准位置数据之间的相似度建立各个节点的联通关系即可确定关系图。
步骤324:对关系图中包含的各个节点分配标签。
步骤326:将相似度矩阵作为关系图的权重对携带有标签的节点进行聚类处理,根据处理结果将标签相同且具有联通关系的节点确定为风险节点集合。
步骤328:基于风险节点集合对应的风险用户集合确定风险团队。
具体的,通过LPA算法对关系图进行聚类处理,将具有相同标签且具有联通关系的节点确定为风险节点集合,基于风险节点集合即可确定多个风险用户,多个风险用户即可确定为风险团队。
步骤330:在风险团队中选择理赔类型相同的风险成员创建目标风险团队,并将目标风险团队中的风险成员添加至黑名单。
具体的,在确定风险团队的情况下,可以确定该风险团队可能存在集体骗保的可能,此时对风险团队中的风险用户的理赔类型进行确定,将理赔类型相同的用户确定为目标风险团队中的成员,可以确定目标风险团队中的风险成员是位置数据相似度高且理赔类型相同,具有较高的骗保可能,则可以将目标风险团队中的风险成员添加至黑名单,禁止目标风险团队中的风险用户再次购买保险服务平台下的保险。
本实施例提供的对象识别方法,通过在预设的时间周期内获取用户的位置数据,并计算位置数据之间的相似度,根据相似度确定相似度矩阵,将位置数据对应的位置坐标作为节点,结合相似度矩阵对建立节点之间的联通关系,生成关系图,采用传播聚类的方式对关系图中包含的节点按照相似度矩阵进行聚类处理,确定风险团队,实现了可以在减少计算量的情况下,精准的确定风险团队,进而降低了风险团队带来的损失,并且采用传播聚类的方式进行聚类处理,进一步的提高了风险团队的识别效率,进而可以在较短的时间内止损,在确定所述风险团队的基础上将风险成员添加至黑名单,进一步提高了业务类型所属的业务项目的安全性。
与上述方法实施例相对应,本说明书还提供了对象识别装置实施例,图4示出了本说明书一实施例提供的一种对象识别装置的结构示意图。如图4所示,该装置包括:
组成位置数据组模块402,被配置为根据预设时间周期内各个待识别对象的位置数据组成位置数据组;
确定相似度矩阵模块404,被配置为计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵;
生成关系图模块406,被配置为将所述各个位置数据对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图;
处理相似度矩阵模块408,被配置为采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标对象集;
调整业务策略模块410,被配置为基于所述目标对象集中目标对象所属的业务类型,对所述目标对象参与的业务项目的业务策略进行调整。
一个可选的实施例中,所述确定相似度矩阵模块404,包括:
提取文本数据单元,被配置为提取所述位置数据组中包含的所述各个位置数据对应的文本数据;
计算文本相似度单元,被配置为计算所述文本数据之间的文本相似度;
判断单元,被配置为判断所述文本数据之间的文本相似度是否存在小于预设文本相似度阈值的文本相似度;
若否,运行确定相似度矩阵单元;
所述确定相似度矩阵单元,被配置为根据所述文本相似度确定所述相似度矩阵。
一个可选的实施例中,若所述判断单元的运行结果为是,所述确定相似度矩阵模块404,还包括:
添加位置数据单元,被配置为将小于所述预设文本相似度阈值的文本相似度对应的文本数据的位置数据添加至位置数据集合;
确定实际距离单元,被配置为通过查询预先建立的位置数据之间的标准距离,确定所述位置数据集合中包含的各个位置数据之间的实际距离;
确定距离相似度矩阵单元,被配置为根据所述实际距离计算所述位置数据集合中包含的各个位置数据之间的距离相似度,根据所述距离相似度确定所述位置数据集合对应的距离相似度矩阵;
确定文本相似度矩阵单元,被配置为根据大于等于所述预设文本相似度阈值的文本数据之间的文本相似度确定文本相似度矩阵;
整合相似度矩阵单元,被配置为将所述文本相似度矩阵和所述距离相似度矩阵进行整合,根据整合结果确定所述相似度矩阵。
一个可选的实施例中,所述确定相似度矩阵模块404进一步被配置为:
提取所述位置数据组中包含的所述各个位置数据对应的文本地址数据,并计算所述文本地址数据之间的第一相似度,根据所述第一相似度确定所述相似度矩阵;
或者,
提取所述位置数据组中包含的所述各个位置数据对应的地理坐标,计算所述地理坐标之间的坐标距离,并基于所述坐标距离计算所述各个位置数据之间的第二相似度,根据所述第二相似度确定所述相似度矩阵。
一个可选的实施例中,所述确定相似度矩阵模块404,包括:
解析位置数据单元,被配置为通过对所述位置数据组中包含的各个位置数据进行解析,获得所述各个位置数据对应的文本地址数据和地理坐标;
计算相似度单元,被配置为计算所述各个位置数据对应的地理坐标之间的坐标距离,并基于所述坐标距离计算所述各个位置数据之间的第三相似度,以及计算所述各个位置数据对应的文本地址数据之间第四相似度;
确定单元,被配置为基于所述第三相似度和所述第四相似度确定所述相似度矩阵。
一个可选的实施例中,所述处理相似度矩阵模块408,包括:
分配标签单元,被配置为对所述关系图中包含的各个节点分配标签;
聚类处理单元,被配置为将所述相似度矩阵作为所述关系图的权重对携带有所述标签的节点进行聚类处理,根据聚类处理结果将标签相同且具有联通关系的节点确定为目标节点集合;
确定目标对象集单元,被配置为基于所述目标节点集合确定所述目标对象集。
一个可选的实施例中,所述调整业务策略模块410,包括:
确定业务类型单元,被配置为确定所述目标对象集中包含的所述目标对象所属的所述业务类型;
选择单元,被配置为选择所述业务类型相同的目标对象创建目标业务对象集;
调整业务策略单元,被配置为将所述目标业务对象集中包含的目标对象添加至黑名单,并根据所述黑名单中各个目标对象的位置数据对所述业务策略进行调整。
本说明书提供的对象识别装置,通过在预设的时间周期内获取待识别对象的位置数据,并计算位置数据之间的相似度,根据相似度确定相似度矩阵,将位置数据对应的位置坐标作为节点,结合相似度矩阵对建立节点之间的联通关系,生成关系图,采用传播聚类的方式对关系图中包含的节点按照相似度矩阵进行聚类处理,确定目标对象集,最后基于目标对象集对所述业务项目的业务策略进行调整,实现了可以在减少计算量的情况下,精准的确定所述目标对象集,进而降低了所述目标对象集对所述业务项目带来的损失,并且通过对所述业务项目的业务策略进行调整,实现了可以对所述目标对象集造成的损失进行控制,进一步提高了所述业务项目的安全性。
上述为本实施例的一种对象识别装置的示意性方案。需要说明的是,该对象识别装置的技术方案与上述的对象识别方法的技术方案属于同一构思,对象识别装置的技术方案未详细描述的细节内容,均可以参见上述对象识别方法的技术方案的描述。
与上述方法实施例相对应,本说明书还提供了目标团队识别装置实施例,图5示出了本说明书一实施例提供的一种目标团队识别装置的结构示意图。如图5所示,该装置包括:
组成模块502,被配置为根据预设时间周期内各个用户的位置数据组成位置数据组;
确定模块504,被配置为计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵;
生成模块506,被配置为将所述各个位置数据对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图;
处理模块508,被配置为采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标团队。
一个可选的实施例中,所述确定模块504,包括:
提取文本数据单元,被配置为提取所述位置数据组中包含的所述各个位置数据对应的文本数据;
计算文本相似度单元,被配置为计算所述文本数据之间的文本相似度;
判断单元,被配置为判断所述文本数据之间的文本相似度是否存在小于预设文本相似度阈值的文本相似度;
若否,运行确定相似度矩阵单元;
所述确定相似度矩阵单元,被配置为根据所述文本相似度确定所述相似度矩阵。
一个可选的实施例中,若所述判断单元的运行结果为是,则所述确定模块504,还包括:
添加单元,被配置为将小于所述预设文本相似度阈值的文本相似度对应的文本数据的位置数据添加至位置数据集合;
确定实际距离单元,被配置为通过查询预先建立的位置数据之间的标准距离,确定所述位置数据集合中包含的各个位置数据之间的实际距离;
确定距离相似度矩阵单元,被配置为根据所述实际距离计算所述位置数据集合中包含的各个位置数据之间的距离相似度,根据所述距离相似度确定所述位置数据集合对应的距离相似度矩阵;
确定文本相似度矩阵单元,被配置为根据大于等于所述预设文本相似度阈值的文本数据之间的文本相似度确定文本相似度矩阵;
整合单元,被配置为将所述文本相似度矩阵和所述距离相似度矩阵进行整合,根据整合结果确定所述相似度矩阵。
一个可选的实施例中,所述目标团队识别装置,还包括:
标准化处理模块,被配置为将所述位置数据组中包含的所述各个位置数据按照地理区域进行标准化处理,获得标准位置数据组成的标准位置数据组;
相应的,所述确定模块504进一步被配置为:
计算所述标准位置数据组中包含的各个标准位置数据之间的标准相似度,并根据所述标准相似度确定所述相似度矩阵。
一个可选的实施例中,所述确定模块504,包括:
第一确定单元,被配置为提取所述位置数据组中包含的所述各个位置数据对应的文本地址数据,并计算所述文本地址数据之间的第一相似度,根据所述第一相似度确定所述相似度矩阵;
或者,
第二确定单元,被配置为提取所述位置数据组中包含的所述各个位置数据对应的地理坐标,计算所述地理坐标之间的坐标距离,并基于所述坐标距离计算所述各个位置数据之间的第二相似度,根据所述第二相似度确定所述相似度矩阵。
一个可选的实施例中,所述确定模块504,包括:
解析单元,被配置为通过对所述位置数据组中包含的各个位置数据进行解析,获得所述各个位置数据对应的文本地址数据和地理坐标;
计算单元,被配置为计算所述各个位置数据对应的地理坐标之间的坐标距离,并基于所述坐标距离计算所述各个位置数据之间的第三相似度,以及计算所述各个位置数据对应的文本地址数据之间第四相似度;
第三确定单元,被配置为基于所述第三相似度和所述第四相似度确定所述相似度矩阵。
一个可选的实施例中,所述处理模块508,包括:
分配单元,被配置为对所述关系图中包含的各个节点分配标签;
聚类处理单元,被配置为将所述相似度矩阵作为所述关系图的权重对携带有所述标签的节点进行聚类处理,根据聚类处理结果将标签相同且具有联通关系的节点确定为目标节点集合;
确定目标团队单元,被配置为基于所述目标节点集合对应的目标用户集合确定所述目标团队。
一个可选的实施例中,所述目标团队识别装置,还包括:
确定业务类型模块,被配置为确定所述目标团队中包含的目标成员所属的业务类型;
加入模块,被配置为选择所述业务类型相同的目标成员创建目标业务团队,并将所述目标业务团队中包含的目标成员加入黑名单。
一个可选的实施例中,所述地理区域包括下述至少一项:
省份地理区域、城市地理区域、街道地理区域;
相应的,所述标准化处理模块进一步被配置为:
将所述位置数据组中包含的所述各个位置数据按照所述街道地理区域进行标准化处理,获得所述街道地理区域中包含的标准位置数据组成的所述标准位置数据组。
本实施例提供的目标团队识别装置,通过在预设的时间周期内获取用户的位置数据,并计算位置数据之间的相似度,根据相似度确定相似度矩阵,将位置数据对应的位置坐标作为节点,结合相似度矩阵对建立节点之间的联通关系,生成关系图,采用传播聚类的方式对关系图中包含的节点按照相似度矩阵进行聚类处理,确定目标团队,实现了可以在减少计算量的情况下,精准的确定目标团队,进而降低了目标团队带来的损失,并且采用传播聚类的方式进行聚类处理,进一步的提高了目标团队的识别效率,进而可以在较短的时间内止损,提高了业务类型所属的业务项目的安全性。
上述为本实施例的一种目标团队识别装置的示意性方案。需要说明的是,该目标团队识别装置的技术方案与上述的目标团队识别方法的技术方案属于同一构思,目标团队识别装置的技术方案未详细描述的细节内容,均可以参见上述目标团队识别方法的技术方案的描述。
图6示出了根据本说明书一实施例提供的一种计算设备600的结构框图。该计算设备600的部件包括但不限于存储器610和处理器620。处理器620与存储器610通过总线630相连接,数据库650用于保存数据。
计算设备600还包括接入设备640,接入设备640使得计算设备600能够经由一个或多个网络660通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备640可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备600的上述部件以及图6中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图6所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备600可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备600还可以是移动式或静止式的服务器。
其中,处理器620用于执行如下计算机可执行指令:
根据预设时间周期内各个待识别对象的位置数据组成位置数据组;
计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵;
将所述各个位置数据对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图;
采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标对象集;
基于所述目标对象集中目标对象所属的业务类型,对所述目标对象参与的业务项目的业务策略进行调整。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的对象识别方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述对象识别方法的技术方案的描述。
图7示出了根据本说明书一实施例提供的一种计算设备700的结构框图。该计算设备700的部件包括但不限于存储器710和处理器720。处理器720与存储器710通过总线730相连接,数据库750用于保存数据。
计算设备700还包括接入设备740,接入设备740使得计算设备700能够经由一个或多个网络760通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备740可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备700的上述部件以及图7中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图7所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备700可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备700还可以是移动式或静止式的服务器。
其中,处理器720用于执行如下计算机可执行指令:
根据预设时间周期内各个用户的位置数据组成位置数据组;
计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵;
将所述各个位置数据对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图;
采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标团队。
上述为本实施例的另一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的目标团队识别方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述目标团队识别方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时以用于:
根据预设时间周期内各个待识别对象的位置数据组成位置数据组;
计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵;
将所述各个位置数据对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图;
采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标对象集;
基于所述目标对象集中目标对象所属的业务类型,对所述目标对象参与的业务项目的业务策略进行调整。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的对象识别方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述对象识别方法的技术方案的描述。
本说明书一实施例还提供另一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时以用于:
根据预设时间周期内各个用户的位置数据组成位置数据组;
计算所述位置数据组中包含的各个位置数据之间的相似度,并根据所述相似度确定相似度矩阵;
将所述各个位置数据对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图;
采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标团队。
上述为本实施例的另一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的目标团队识别方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述目标团队识别方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书并不受所描述的动作顺序的限制,因为依据本说明书,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims (8)

1.一种目标团队识别方法,包括:
根据预设时间周期内各个获得理赔的用户填写的接收理赔订单的地址组成位置数据组;
提取所述位置数据组中包含的各个地址对应的文本数据,计算所述文本数据之间的文本相似度,并判断所述文本相似度中是否存在小于预设文本相似度阈值的文本相似度;
若是,将小于所述预设文本相似度阈值的文本相似度对应的文本数据的地址添加至位置数据集合,通过查询预先建立的地址之间的标准距离,确定所述位置数据集合中包含的各个地址之间的实际距离,根据所述实际距离计算所述位置数据集合中包含的各个地址之间的距离相似度,根据所述距离相似度确定所述位置数据集合对应的距离相似度矩阵,根据大于等于所述预设文本相似度阈值的文本数据之间的文本相似度确定文本相似度矩阵,将所述文本相似度矩阵和所述距离相似度矩阵进行整合,根据整合结果确定相似度矩阵;
将所述位置数据组中包含的各个地址对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图;
采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标团队;
在所述目标团队中选择理赔类型相同的目标成员创建目标风险团队,并将所述目标风险团队中的风险成员添加至黑名单。
2.根据权利要求1所述的目标团队识别方法,所述判断所述文本相似度中是否存在小于预设文本相似度阈值的文本相似度的判断结果为否,还包括:
根据所述文本相似度确定所述相似度矩阵。
3.根据权利要求1所述的目标团队识别方法,所述根据预设时间周期内各个获得理赔的用户填写的接收理赔订单的地址组成位置数据组步骤执行之后,所述提取所述位置数据组中包含的各个地址对应的文本数据,计算所述文本数据之间的文本相似度,并判断所述文本相似度中是否存在小于预设文本相似度阈值的文本相似度步骤执行之前,还包括:
将所述位置数据组中包含的所述各个地址按照地理区域进行标准化处理,获得标准地址组成的标准位置数据组;
相应的,所述提取所述位置数据组中包含的各个地址对应的文本数据,计算所述文本数据之间的文本相似度,并判断所述文本相似度中是否存在小于预设文本相似度阈值的文本相似度,包括:
提取所述标准位置数据组中包含的各个标准地址对应的文本数据,计算所述文本数据之间的文本相似度,并判断所述文本相似度中是否存在小于预设文本相似度阈值的文本相似度。
4.根据权利要求1所述的目标团队识别方法,所述采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标团队,包括:
对所述关系图中包含的各个节点分配标签;
将所述相似度矩阵作为所述关系图的权重对携带有所述标签的节点进行聚类处理,根据聚类处理结果将标签相同且具有联通关系的节点确定为目标节点集合;
基于所述目标节点集合对应的目标用户集合确定所述目标团队。
5.根据权利要求3所述的目标团队识别方法,所述地理区域包括下述至少一项:
省份地理区域、城市地理区域、街道地理区域;
相应的,所述将所述位置数据组中包含的所述地址按照地理区域进行标准化处理,获得标准地址组成的标准位置数据组,包括:
将所述位置数据组中包含的所述各个地址按照所述街道地理区域进行标准化处理,获得所述街道地理区域中包含的标准地址组成的所述标准位置数据组。
6.一种目标团队识别装置,包括:
组成模块,被配置为根据预设时间周期内各个获得理赔的用户填写的接收理赔订单的地址组成位置数据组;
判断模块,被配置为提取所述位置数据组中包含的各个地址对应的文本数据,计算所述文本数据之间的文本相似度,并判断所述文本相似度中是否存在小于预设文本相似度阈值的文本相似度;
确定模块,被配置为若是,将小于所述预设文本相似度阈值的文本相似度对应的文本数据的地址添加至位置数据集合,通过查询预先建立的地址之间的标准距离,确定所述位置数据集合中包含的各个地址之间的实际距离,根据所述实际距离计算所述位置数据集合中包含的各个地址之间的距离相似度,根据所述距离相似度确定所述位置数据集合对应的距离相似度矩阵,根据大于等于所述预设文本相似度阈值的文本数据之间的文本相似度确定文本相似度矩阵,将所述文本相似度矩阵和所述距离相似度矩阵进行整合,根据整合结果确定相似度矩阵;
生成模块,被配置为将所述位置数据组中包含的各个地址对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图;
处理模块,被配置为采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标团队;
加入模块,被配置为在所述目标团队中选择理赔类型相同的目标成员创建目标风险团队,并将所述目标风险团队中的风险成员添加至黑名单。
7.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
根据预设时间周期内各个获得理赔的用户填写的接收理赔订单的地址组成位置数据组;
提取所述位置数据组中包含的各个地址对应的文本数据,计算所述文本数据之间的文本相似度,并判断所述文本相似度中是否存在小于预设文本相似度阈值的文本相似度;
若是,将小于所述预设文本相似度阈值的文本相似度对应的文本数据的地址添加至位置数据集合,通过查询预先建立的地址之间的标准距离,确定所述位置数据集合中包含的各个地址之间的实际距离,根据所述实际距离计算所述位置数据集合中包含的各个地址之间的距离相似度,根据所述距离相似度确定所述位置数据集合对应的距离相似度矩阵,根据大于等于所述预设文本相似度阈值的文本数据之间的文本相似度确定文本相似度矩阵,将所述文本相似度矩阵和所述距离相似度矩阵进行整合,根据整合结果确定相似度矩阵;
将所述位置数据组中包含的各个地址对应的位置坐标作为节点,并基于所述相似度矩阵建立所述节点之间的联通关系,生成所述位置数据组对应的关系图;
采用传播聚类的方式对所述关系图中包含的节点按照所述相似度矩阵进行聚类处理,根据处理结果确定目标团队;
在所述目标团队中选择理赔类型相同的目标成员创建目标风险团队,并将所述目标风险团队中的风险成员添加至黑名单。
8.一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现权利要求1至5任意一项所述目标团队识别方法的步骤。
CN202010031000.3A 2020-01-13 2020-01-13 对象识别方法以及装置 Active CN110826311B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010031000.3A CN110826311B (zh) 2020-01-13 2020-01-13 对象识别方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010031000.3A CN110826311B (zh) 2020-01-13 2020-01-13 对象识别方法以及装置

Publications (2)

Publication Number Publication Date
CN110826311A CN110826311A (zh) 2020-02-21
CN110826311B true CN110826311B (zh) 2020-05-05

Family

ID=69546615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010031000.3A Active CN110826311B (zh) 2020-01-13 2020-01-13 对象识别方法以及装置

Country Status (1)

Country Link
CN (1) CN110826311B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111861733B (zh) * 2020-07-31 2023-09-15 重庆富民银行股份有限公司 基于地址模糊匹配的欺诈防控系统及方法
CN112541530B (zh) * 2020-12-06 2023-06-20 支付宝(杭州)信息技术有限公司 针对聚类模型的数据预处理方法及装置
CN112650853A (zh) * 2021-01-13 2021-04-13 拉卡拉支付股份有限公司 短文本聚类方法、装置、电子设备、存储介质及程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105812280A (zh) * 2016-05-05 2016-07-27 四川九洲电器集团有限责任公司 一种分类方法及电子设备
CN106096024A (zh) * 2016-06-24 2016-11-09 北京京东尚科信息技术有限公司 地址相似度的评估方法和评估装置
CN109271418A (zh) * 2018-08-14 2019-01-25 阿里巴巴集团控股有限公司 可疑团伙识别方法、装置、设备及计算机可读存储介质
CN110602101A (zh) * 2019-09-16 2019-12-20 北京三快在线科技有限公司 网络异常群组的确定方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105812280A (zh) * 2016-05-05 2016-07-27 四川九洲电器集团有限责任公司 一种分类方法及电子设备
CN106096024A (zh) * 2016-06-24 2016-11-09 北京京东尚科信息技术有限公司 地址相似度的评估方法和评估装置
CN109271418A (zh) * 2018-08-14 2019-01-25 阿里巴巴集团控股有限公司 可疑团伙识别方法、装置、设备及计算机可读存储介质
CN110602101A (zh) * 2019-09-16 2019-12-20 北京三快在线科技有限公司 网络异常群组的确定方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
微信亿级用户异常检测框架的设计与实践;青原行思;《https://cloud.tencent.com/developer/article/1028442》;20180124;第1-10页 *

Also Published As

Publication number Publication date
CN110826311A (zh) 2020-02-21

Similar Documents

Publication Publication Date Title
CN110826311B (zh) 对象识别方法以及装置
CN107230008B (zh) 一种风险信息输出、风险信息构建方法及装置
CN105160173B (zh) 安全评估方法和装置
CN110599312A (zh) 基于信用的交互信用评估方法以及装置
CN114492605A (zh) 联邦学习特征选择方法、装置、系统以及电子设备
CN111931047B (zh) 基于人工智能的黑产账号检测方法及相关装置
CN110619535B (zh) 一种数据处理方法及其装置
CN106604281B (zh) 一种确定手机号码稳定性的方法及设备
CN111127062A (zh) 一种基于空间搜索算法的群体欺诈识别方法及装置
CN110717758B (zh) 异常交易识别方法和装置
CN113033717B (zh) 一种模型生成方法、装置以及用于模型生成的装置
CN106161824B (zh) 一种通讯号码活跃度确定方法及装置
CN110363648B (zh) 一种基于同一地理类型多维度属性校验方法、装置和电子设备
EP3879418B1 (en) Identity verification method and device
CN105988998B (zh) 关系网络构建方法及装置
CN110705994A (zh) 一种风险用户检测方法及装置
CN110942395B (zh) 保险保全风险控制方法、装置、设备及存储介质
CN111401478B (zh) 数据异常识别方法以及装置
CN115049330A (zh) 一种网格化推送订单智能分配方法及相关产品
CN105718767B (zh) 一种基于风险识别的信息处理方法及装置
CN112085590A (zh) 规则模型的安全性的确定方法、装置和服务器
CN112115513A (zh) 一种社交网络中用户节点隐私信息保护方法
CN110995696A (zh) 一种伪造mac群体的发现方法及装置
CN113051128B (zh) 功耗检测方法、装置、电子设备及存储介质
CN115802490B (zh) 一种定位基站高精度无线定位方法、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211209

Address after: Room 610, floor 6, No. 618, Wai Road, Huangpu District, Shanghai 200010

Patentee after: Ant Shengxin (Shanghai) Information Technology Co.,Ltd.

Address before: 801-11, Section B, 8th floor, 556 Xixi Road, Xihu District, Hangzhou City, Zhejiang Province, 310013

Patentee before: Alipay (Hangzhou) Information Technology Co.,Ltd.

TR01 Transfer of patent right