CN115115843B - 数据处理方法及装置 - Google Patents
数据处理方法及装置 Download PDFInfo
- Publication number
- CN115115843B CN115115843B CN202210622202.4A CN202210622202A CN115115843B CN 115115843 B CN115115843 B CN 115115843B CN 202210622202 A CN202210622202 A CN 202210622202A CN 115115843 B CN115115843 B CN 115115843B
- Authority
- CN
- China
- Prior art keywords
- image
- user
- target
- determining
- identified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 claims abstract description 52
- 238000012545 processing Methods 0.000 claims description 62
- 238000000605 extraction Methods 0.000 claims description 56
- 238000003062 neural network model Methods 0.000 claims description 51
- 230000009467 reduction Effects 0.000 claims description 32
- 238000003860 storage Methods 0.000 claims description 18
- 238000011176 pooling Methods 0.000 claims description 16
- 230000007246 mechanism Effects 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 7
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 230000000875 corresponding effect Effects 0.000 description 192
- 238000004364 calculation method Methods 0.000 description 27
- 238000010586 diagram Methods 0.000 description 22
- 230000002265 prevention Effects 0.000 description 18
- 230000008569 process Effects 0.000 description 16
- 238000004590 computer program Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 238000010276 construction Methods 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 230000001419 dependent effect Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 230000002349 favourable effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 229920001872 Spider silk Polymers 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 210000004209 hair Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 210000003739 neck Anatomy 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 210000000697 sensory organ Anatomy 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0609—Buyer or seller confidence or verification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Finance (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Accounting & Taxation (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Software Systems (AREA)
- Development Economics (AREA)
- Medical Informatics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Technology Law (AREA)
- Collating Specific Patterns (AREA)
Abstract
本申请公开了一种数据处理方法及装置。所述方法包括:获取待识别用户的第一位置信息和第一图像;根据第一位置信息,确定位于目标位置范围内的第一目标用户及其第二用户身份信息;根据每个第二用户身份信息和目标用户图像集,获取第一目标用户的第二图像特征;根据第一图像特征和第二图像特征之间的图像特征相似度,将图像特征相似度大于或等于预设相似度阈值的第一目标用户作为第二目标用户;根据第一目标用户的数量确定待识别用户的第一风险概率值,根据第二目标用户的数量确定待识别用户的第二风险概率值;根据第一风险概率值和第二风险概率值确定待识别用户的风险等级。该技术方案能够提升风险用户识别的准确性。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据处理方法及装置。
背景技术
随着人工智能技术的不断发展,风控领域(如金融风控领域、互联网消费行业风控领域等)内的机器学习也得到了不断的发展。然而,存在一些用户(如个人或群体)趁虚而入,想方设法地从搭建的风险防控网络中寻得蛛丝马迹,这就使得风险防控网络模型及系统变得尤为重要。
目前的风险防控手段主要是通过地址进行风险防控。例如,用户在点外卖、网购、申请信用卡等业务场景中都需要填写地址,通过这些渠道获取用户提供的地址信息,进而利用地址信息的正确与否对用户进行风险识别。由于地址信息存在不准确的情况,比如用户误填了错误的地址信息,使得仅基于地址信息来识别风险用户的结果不准确,导致将风险识别结果应用于某些重要业务场景中(如互联网消费业务、借贷业务等)时不具备说服力。为解决这一问题,亟需提供一种能够准确进行风险识别的方法。
发明内容
本申请实施例的目的是提供一种数据处理方法及装置,用以解决现有的风险识别结果不准确、导致风险防控效果差的问题。
为解决上述技术问题,本申请实施例是这样实现的:
一方面,本申请实施例提供一种数据处理方法,包括:
获取待识别用户的第一用户信息,所述第一用户信息包括第一位置信息和第一图像;
根据所述第一位置信息,确定位于目标位置范围内的至少一个第一目标用户以及所述第一目标用户的第二用户身份信息;
根据每个所述第二用户身份信息和预先构建的目标用户图像集,获取每个所述第一目标用户的第二图像特征,所述目标用户图像集包括多个目标用户的用户身份信息和图像特征;
获取所述第一图像的第一图像特征,根据所述第一图像特征和所述第二图像特征之间的图像特征相似度,确定第二目标用户,其中,所述第二目标用户为所述图像特征相似度大于或等于预设相似度阈值的第一目标用户;
根据所述第一目标用户的数量确定所述待识别用户的第一风险概率值,根据所述第二目标用户的数量确定所述待识别用户的第二风险概率值;
根据所述第一风险概率值和所述第二风险概率值,确定所述待识别用户对应的风险等级。
另一方面,本申请实施例提供一种数据处理方法,包括:
获取N个样本图像,所述N个样本图像对应多个图像类别,其中,N为大于1的整数;
将所述N个样本图像输入预先训练的深度神经网络模型中进行特征提取,输出每个所述样本图像分别对应的目标样本图像特征,其中,所述目标样本图像特征用于表征所述样本图像中的图像关键点的特征;
将所述N个目标样本图像特征,按照各自对应的图像类别进行分类,并将分类后的所述目标样本图像特征存储至图像特征检索库。
另一方面,本申请实施例提供一种数据处理方法,包括:
获取待分类的第一图像和预先构建的图像特征检索库,其中,所述图像特征检索库中存储有多个样本图像对应的目标样本图像特征;
将所述第一图像输入预先训练的深度神经网络模型中进行特征提取,输出所述第一图像对应的第三图像特征,其中,所述第三图像特征包括所述第一图像中的图像关键点的特征;
计算所述第三图像特征和每个所述目标样本图像特征的相似度,得到所述第三图像特征和至少一个所述目标样本图像特征之间的图像特征相似度;
从多个所述图像特征相似度中,将大于或等于预设相似度阈值的图像特征相似度对应的样本图像的图像类别,确定为所述第一图像对应的目标图像类别。
另一方面,本申请实施例提供一种数据处理装置,包括:
第一获取模块,用于获取待识别用户的第一用户信息,所述第一用户信息包括第一位置信息和第一图像;
第一确定模块,用于根据所述第一位置信息,确定位于目标位置范围内的至少一个第一风险用户以及所述第一目标用户的第二用户身份信息;
第二获取模块,用于根据所述第二用户身份信息和预先构建的目标用户图像集,获取每个所述第一目标用户的第二图像特征,所述目标用户图像集包括多个目标用户的用户身份信息和图像特征;
第二确定模块,用于根据所述第一图像特征和所述第二图像特征之间的图像特征相似度,确定第二目标用户,其中,所述第二目标用户为所述图像特征相似度大于或等于预设相似度阈值的第一目标用户;
第三确定模块,用于根据所述第一目标用户的数量确定所述待识别用户的第一风险概率值,根据所述第二目标用户的数量确定所述待识别用户的第二风险概率值;
第四确定模块,用于根据所述第一风险概率值和所述第二风险概率值,确定所述待识别用户对应的风险等级。
再一方面,本申请实施例提供一种数据处理设备,包括处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令被配置由所述处理器执行,所述可执行指令用于执行所述数据处理方法。
再一方面,本申请实施例提供一种存储介质,所述存储介质用于存储计算机可执行指令,所述计算机可执行指令使得计算机执行所述数据处理方法。
采用本申请实施例的技术方案,首先获取待识别用户的位置信息和图像,然后根据待识别用户的位置信息,确定出位于目标位置范围内的至少一个第一目标用户的用户身份信息,从而筛选出与待识别用户所在位置(即第一位置信息对应的位置)相匹配的目标位置范围内的第一目标用户。进而,根据每个第一目标用户的用户身份信息和预先构建的目标用户图像集,获取每个第一目标用户的图像特征,由于目标用户图像集包括多个目标用户的用户身份信息和图像特征,因此通过将每个第一目标用户的用户身份信息与目标用户图像集进行匹配,即可快速获取到每个第一目标用户的图像特征,从而根据待识别用户的图像特征和每个第一目标用户的图像特征,确定出第一目标用户中与待识别用户的图像特征之间的图像特征相似度大于或等于预设相似度阈值的第二目标用户,进而根据第一目标用户的数量确定待识别用户的第一风险概率值,根据第二目标用户的数量确定待识别用户的第二风险概率值,最后根据待识别用户对应的第一风险概率值和第二风险概率值确定待识别用户对应的风险等级。可见,该技术方案在对待识别用户进行风险等级的确定过程中,综合考虑了用户所在位置和用户对应的图像特征,而不仅仅是单一地依赖于位置信息或者依赖于图像特征,多种数据的综合计算结果使得待识别用户的风险等级确定结果更加准确。此外,由于第二目标用户是基于与待识别用户的图像特征之间的图像特征相似度筛选出的,而图像特征能够在一定程度上表征各个用户之间的关联性和相似性,因此,该技术方案在识别风险用户的同时,还能够识别出与风险用户之间具有关联性和相似性的其他用户,即具有一定风险性的群体,从而极大地提高了风险用户及其群体的识别力度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请一实施例的一种数据处理方法的示意性流程图;
图2是根据本申请另一实施例的一种数据处理方法的示意性流程图;
图3是根据本申请一实施例的一种数据处理方法的实现原理示意图;
图4是根据本申请另一实施例的一种数据处理方法的实现原理示意图;
图5是根据本申请再一实施例的一种数据处理方法的示意性流程图;
图6是根据本申请一实施例的一种数据处理方法中构建图像特征检索库的示意性原理图;
图7是根据本申请再一实施例的一种数据处理方法的示意性流程图;
图8是根据本申请一实施例的一种数据处理装置的示意性框图;
图9是根据本申请另一实施例的一种数据处理装置的示意性框图;
图10是根据本申请再一实施例的一种数据处理装置的示意性框图;
图11是根据本申请一实施例的一种数据处理设备的示意性框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
在风险防控方面,如果仅依赖于位置信息识别风险用户,或者仅依赖于图像数据识别风险用户,均无法达到很好地风险防控效果。具体的,针对仅依赖于位置信息识别风险用户的方法,通常是判断位置信息是否与风险用户黑名单中各风险用户的位置信息相匹配,如果匹配,则确定识别到风险用户。针对仅依赖于图像数据识别风险用户的方法,通常是判断图像数据(比如人脸图像数据)是否与风险用户黑名单中各风险用户的图像数据(比如人脸图像数据)相匹配,如果匹配,则确定识别到风险用户。显然,采用上述两种方式识别风险用户的效果均不佳。基于此,本申请通过综合考虑用户的位置信息和图像特征这两种因素,首先根据待识别用户的位置信息筛选出与待识别用户所在位置相匹配的目标位置范围内的第一目标用户,该第一目标用户由于是基于位置信息匹配出来的,因此与待识别用户之间具有一定的位置关联性。此外,考虑到风险用户(如欺诈用户)在提供图像数据时,如果风险用户具备群体性质,通常会采用相同或相似的背景拍摄图像,因此,本申请根据待识别用户的图像特征,进一步从第一目标用户中筛选出与待识别用户之间具有高相似度的第二目标用户,尤其是第一目标用户中背景图像特征与待识别用户对应的背景图像特征具有高相似度的第二目标用户,从而准确地将风险用户及其关联用户(即属于同一组织或群体的用户)识别出来。
图1是根据本申请一实施例的一种数据处理方法的示意性流程图,如图1所示,该方法包括:
S102,获取待识别用户的第一用户信息,第一用户信息包括第一位置信息和第一图像。
其中,第一位置信息可包括用户所在的地理位置信息、用户所使用的电子设备的地理位置信息、用户所使用的电子设备的IP(Internet Protocol,互联网协议)地址信息等中的一项或多项。可选地,待识别用户在处理业务时会提供位置信息,比如在申请信用卡、网购商品等场景中均会向相应平台输入位置信息(如输入家庭地址、办公地址、收货地址等),因此,数据处理系统(如风险用户的识别系统)可通过互联网,从上述平台中获取到待识别用户的第一位置信息。其中,地理位置信息可包括GPS(Global Positioning System,全球定位系统)经纬度信息。若数据处理系统通过互联网未获取到待识别用户的GPS经纬度信息,也可以在获取到其他位置信息(比如家庭地址、办公地址、收货地址等)信息后,使用GPS定位系统基于其他位置信息进行定位,从而确定出待识别用户的GPS经纬度信息。
第一图像可包括用户的活体图像和背景图像。可选地,待识别用户在处理业务时会提供图像数据,比如在申请信用卡、网购商品等需要进行实名认证的场景中,均会向相应平台输入图像数据(如实时拍摄人脸图像数据),因此,数据处理系统可通过互联网,从上述平台中获取到待识别用户的第一图像。
可选地,第一用户信息还可包括待识别用户的第一用户身份信息。第一用户身份信息可包括能够唯一标识用户身份的姓名、昵称、证件号码、通讯号码等中的一项或多项。可选地,待识别用户在处理业务时会提供用户身份信息,比如在申请信用卡、网购商品等场景中均会向相应平台输入用户身份信息,因此,数据处理系统可通过互联网,从上述平台中获取到待识别用户的第一用户身份信息。
上述所提及的数据处理系统,即为用于执行数据处理方法的系统。
S104,根据第一位置信息,确定位于目标位置范围内的至少一个第一风险用户,以及第一目标用户的第二用户身份信息。
其中,目标位置范围可根据第一位置信息所确定。可选地,目标位置范围为以第一位置信息对应的位置为中心、且与第一位置信息对应的位置(即中心位置)之间相距第一距离的位置范围。第一距离小于或等于预设距离阈值。例如,第一位置信息对应的位置为A小区,则目标位置范围可以是以A小区为中心的周围200米内的位置范围。当然,在一些实施例中,第一位置信息对应的位置也可以不是目标位置范围的中心位置,本实施例对此不作限定。
S106,根据每个第二用户身份信息和预先构建的目标用户图像集,获取每个第一目标用户的第二图像特征,目标用户图像集包括多个目标用户的用户身份信息和图像特征。
可选地,目标用户图像集的构建方式为:首先获取多个目标用户分别对应的图像(如包括活体图像和背景图像),提取出每个图像中的图像特征,然后将提取出的每个目标用户的图像特征与目标用户地图中对应的目标用户关联存储,得到目标用户图像集。其中,图像特征的提取方式可以是:将图像输入预先训练的深度神经网络模型中进行特征提取,得到图像特征。目标用户图像集中的图像特征,可按照图像特征各自对应的图像类别进行分类存储,划分为一组的图像特征之间的图像特征相似度均大于或等于预设相似度阈值。具体如何利用深度神经网络模型提取图像特征,以及如何对多个图像特征进行分类,将在下述实施例中详细说明,此处先不赘述。
S108,获取第一图像的第一图像特征,根据第一图像特征和第二图像特征之间的图像特征相似度,确定第二目标用户,其中,第二目标用户为图像特征相似度大于或等于预设相似度阈值的第一目标用户。
可选地,将第一图像输入预先训练的深度神经网络模型中进行特征提取,得到第一图像的第一图像特征。在从第一目标用户中确定第二目标用户时,可计算第一图像特征和第二图像特征之间的欧式距离,根据该欧式距离确定图像特征相似度,进而根据图像特征相似度,确定第二目标用户。
可选地,计算第一图像特征和第二图像特征之间的欧式距离,根据欧式距离确定第一图像特征和每个第二图像特征之间的图像特征相似度,进而筛选出大于或等于预设相似度阈值的图像特征相似度对应的第二图像特征,确定筛选出的第二图像特征对应的第一目标用户为第二风险用户。其中,欧式距离越大,则图像特征相似度越低;欧氏距离越小,则图像特征相似度越高。假设第一图像特征和第二图像特征均为n维特征向量,其中,第一图像特征表示为(x1x2,...,xn),第二图像特征表示为(y1,y2,...,yn),则第一图像特征和第二图像特征之间的欧氏距离d可表示为如下公式(1)。
可选地,计算第一图像特征和第二图像特征之间的欧式距离,根据该欧式距离确定图像特征相似度,也可以通过模型来实现。具体的,将第一图像特征和每个第一目标用户的第二图像特征输入图像相似性模型,以通过图像相似性模型计算第一图像特征和第二图像特征之间的欧式距离。也就是说,通过利用欧式距离的计算公式构建的图像相似性模型来进行欧式距离的计算。
S110,根据第一目标用户的数量确定待识别用户的第一风险概率值,根据第二目标用户的数量确定待识别用户的第二风险概率值。
S112,根据第一风险概率值和第二风险概率值,确定待识别用户对应的风险等级。
其中,第一目标用户的数量越多,则第一风险概率值越高,说明待识别用户属于风险用户的概率也就越高。同理,第二目标用户的数量越多,则第二风险概率值越高,说明待识别用户属于风险用户的概率也就越高。如何基于第一风险概率值和第二风险概率值确定目标用户的风险等级,将在下述实施例中详细说明。
本实施例中,目标用户图像集基于目标用户地图所构建,目标用户地图包括多个目标用户的用户身份信息和位置信息。其中,目标用户地图可以预先构建,可选的构建方式为:首先获取多个目标用户的用户身份信息和位置信息,然后根据多个目标用户的用户身份信息和位置信息构建目标用户地图。其中,多个目标用户可通过目标用户黑名单所确定,目标用户黑名单用于记录被确定为目标用户(如风险用户)的用户信息。其中,目标用户可以是满足以下至少一项条件a~f的用户:
条件a、在第一指定时长内,使用同一设备的注册次数大于或等于第一预设阈值。例如,一天之内使用同一设备的注册次数大于或等于第一预设阈值4。
条件b、在第二指定时长内,使用同一设备的登录次数大于或等于第二预设阈值。例如,一个小时之内使用同一设备的登录次数大于或等于第二预设阈值10。
条件c、在第三指定时长内,使用同一设备的登录账号的数量大于或等于第三预设阈值。例如,一天之内使用同一设备的登录账号的数量大于或等于第三预设阈值5。
条件d、在第四指定时长内,使用同一设备对其他用户的邀请次数大于或等于第四预设阈值。例如,一天之内使用同一设备对其他用户的邀请次数大于或等于第四预设阈值15。
条件e、在第五指定时长内,使用同一设备的实名认证次数大于或等于第五预设阈值。例如,一天之内使用同一设备的实名认证次数大于或等于第五预设阈值5。
条件f、在第六指定时长内,使用同一设备执行指定类业务的次数大于或等于第六预设阈值。例如,一天之内使用同一设备执行指定类业务(如申请贷款)的次数大于或等于第六预设阈值5。
在一个实施例中,可监测特定区域内的用户是否为风险用户,也就是说,待识别用户为特定区域内的用户。可根据用户的位置信息判断用户是否位于特定区域,若是,则将该用户作为待识别用户,并进一步针对待识别用户执行步骤S104-S112;若否,则可以在一定程度上认为该用户属于风险用户的概率较低,此时可不对该用户进行风险识别。
可选地,特定区域满足以下至少一项条件g~k:
条件g、区域内,击中高风险名单的用户数量大于或等于第一数量阈值。高风险名单用于记录风险用户的用户身份信息。若某一用户的用户身份信息与高风险名单上记录的用户身份信息相匹配,即高风险名单上记录有某一用户的用户信息,则说明该用户击中高风险名单。
条件h、区域内,每个用户身份信息所关联的设备平均值大于或等于第二数量阈值。其中,每个用户身份信息,指的是每个用户对应的用户身份信息。与用户身份信息关联的设备,包括利用用户身份信息进行注册或登录等的设备。
条件i、区域内,被检测为模拟器的设备数量大于或等于第三数量阈值。其中,设备被检测为模拟器,说明该设备可能存在不合规注册或者登录的情况,因此存在风险用户的概率相对较高。
条件j、区域内,安装第一类应用的设备数量大于或等于第四数量阈值。其中,第一类应用可包括博彩、借贷等违规应用。
条件k、区域内,存在篡改第二类应用的设备数量大于或等于第五数量阈值。其中,第二类应用可包括权威类应用,例如GPS(Global Positioning System,全球定位系统)。
采用本申请实施例的技术方案,首先获取待识别用户的位置信息和图像,然后根据待识别用户的位置信息,确定出位于目标位置范围内的至少一个第一目标用户及其对应的用户身份信息,从而筛选出与待识别用户所在位置(即第一位置信息对应的位置)相匹配的目标位置范围内的第一目标用户。进而,根据每个第一目标用户的用户身份信息和预先构建的目标用户图像集,获取每个第一目标用户的图像特征,由于目标用户图像集包括多个目标用户的用户身份信息和图像特征,因此通过将每个第一目标用户的用户身份信息与目标用户图像集进行匹配,即可快速获取到每个第一目标用户的图像特征,从而根据待识别用户的图像特征和每个第一目标用户的图像特征,确定出第一目标用户中与待识别用户的图像特征之间的图像特征相似度大于或等于预设相似度阈值的第二目标用户,进而根据第一目标用户的数量确定待识别用户的第一风险概率值,根据第二目标用户的数量确定待识别用户的第二风险概率值,最后根据待识别用户对应的第一风险概率值和第二风险概率值确定待识别用户对应的风险等级。可见,该技术方案在对待识别用户进行风险等级的确定过程中,综合考虑了用户所在位置和用户对应的图像特征,而不仅仅是单一地依赖于位置信息或者依赖于图像特征,多种数据的综合计算结果使得待识别用户的风险等级确定结果更加准确。此外,由于第二目标用户是基于与待识别用户的图像特征之间的图像特征相似度筛选出的,而图像特征能够在一定程度上表征各个用户之间的关联性和相似性,因此,该技术方案在识别风险用户的同时,还能够识别出与风险用户之间具有关联性和相似性的其他用户,即具有一定风险性的群体,从而极大地提高了风险用户及其群体的识别力度。
在一个实施例中,根据第一位置信息,确定位于目标位置范围内的至少一个第一风险用户时,可首先根据第一位置信息确定目标位置范围,以及获取多个目标用户的位置信息;其次,将目标用户的位置信息与目标位置范围进行匹配,若二者相匹配,则将与目标位置范围匹配的位置信息对应的目标用户确定为第一目标用户。
可选地,在匹配目标用户的位置信息与目标位置范围时,可将目标位置范围与预先构建的目标用户图像集或者目标用户地图进行匹配。其中,目标用户图像集和目标用户地图中均存储有多个目标用户对应的用户身份信息和位置信息。二者的区别仅在于,目标用户地图中仅存储有目标用户对应的用户身份信息和位置信息,而目标用户图像集除此之外,还存储有目标用户对应的图像特征。
目标用户图像集可基于目标用户地图进行构建,可选地,首先获取多个目标用户分别对应的目标图像,并提取出每个目标图像的图像特征,然后将提取出的多个图像特征添加至目标用户地图中,并与目标用户地图中对应的目标用户的用户身份信息和/或位置信息进行关联存储,即可得到目标用户图像集。其中,进行信息的关联存储时,可通过目标用户的用户身份信息进行关联。可选地,提取目标图像的图像特征时,可将目标图像输入预先训练的深度神经网络模型中进行特征提取,从而输出目标图像对应的图像特征。如何利用深度神经网络模型提取图像特征,将在下述实施例中详细说明。
具体的,目标用户图像集中存储有多个目标用户分别对应的用户身份信息、图像特征和位置信息。将目标位置范围和预先构建的目标用户图像集进行匹配时,可将目标位置范围和目标用户图像集中的每个位置信息进行匹配,并将与目标位置范围相匹配的位置信息对应的目标用户确定为第一目标用户。
可选地,目标用户地图中存储有多个目标用户分别对应的用户身份信息和位置信息。将目标位置范围和预先构建的目标用户地图进行匹配时,可将目标位置范围和目标用户地图中的每个位置信息进行匹配,并将与目标位置范围相匹配的位置信息对应的目标用户确定为第一目标用户。
本实施例中,通过将目标位置范围与预先构建的目标用户图像集或者目标用户地图进行匹配,以匹配出与位于目标位置范围内的第一目标用户,从而能够快速、准确地筛选出与待识别用户所在位置(即第一位置信息对应的位置)相匹配的目标位置范围内的第一目标用户,为后续对待识别用户进行风险识别提供准确的数据依据。
在一个实施例中,确定出位于目标位置范围内的至少一个第一目标用户之后,可根据第一目标用户对应的位置信息,以及各目标用户的位置信息和用户身份信息之间的对应关系,确定第一目标用户对应的第二用户身份信息。其中,各目标用户的位置信息和用户身份信息之间的对应关系可存储于目标用户地图和/或目标用户图像集中。若该对应关系存储于目标用户地图中,则可通过将第一目标用户的位置信息和目标用户地图进行匹配,从而匹配出第一目标用户对应的第二用户身份信息。若该对应关系存储于目标用户图像集中,则可通过将第一目标用户的位置信息和目标用户图像集进行匹配,从而匹配出第一目标用户对应的第二用户身份信息。
在一个实施例中,第一图像和第二图像均包括活体图像和背景图像。在根据第一图像特征和第二图像特征之间的图像特征相似度确定第二目标用户时,可先去除每个图像(包括第一图像和第二图像)中的活体图像,使每个图像中仅包括背景图像,进而计算第一图像中的背景图像和每个第二图像中的背景图像之间的图像特征相似度,进而将背景图像之间的图像特征相似度大于或等于预设相似度阈值的第一目标用户作为第二目标用户。
可选地,从图像中提取出背景图像的方式可以有多种,以下示例性地列举几种:
一种可选方式、利用现有的轮廓识别算法,识别出图像中活体图像对应的活体轮廓,比如人脸轮廓,进而确定除活体轮廓之外的图像为背景图像。
另一种可选方式、活体图像和背景图像分别对应的像素分布不同,通常情况下,背景图像的像素分布较为单一,而活体图像的像素分布则较为混乱,基于此,通过图像中各个图像子区域分别对应的像素分布信息来区分出活体图像和背景图像。其中,针对图像所划分的图像子区域的数量越多、区域面积越小,则基于该种方式确定出的背景图像越准确。
再一种可选方式:利用现有的人脸识别技术,识别出图像中能够表征活体图像的关键区域,比如人脸上的五官、头发、脖子等关键区域,从而根据关键区域所在的位置确定出背景图像。
本实施例中,在根据图像从第一目标用户中筛选第二目标用户时,通过图像中的背景图像来确定各第一目标用户和待识别用户之间的图像特征相似度,使得与待识别用户使用相同或相似背景图像的第二目标用户被准确识别到,由于使用相同或相似背景图像的用户之间通常为同一组织或群体,因此本实施例的技术方案能够准确识别出待识别用户的关联用户(即第二目标用户)。
可选地,在确定待识别用户为风险用户的情况下,确定第二目标用户为待识别用户的关联用户。即,如果待识别用户为风险用户,那么本实施例的技术方案还能够准确识别出风险用户的关联用户,从而有利于识别出风险用户的群体或组织。
在一个实施例中,获取待识别用户的第一用户信息之前,可先基于位置信息确定待识别用户。具体地,可执行为以下步骤B1-B2:
步骤B1,获取多个待筛选用户分别对应的第二位置信息,第二位置信息包括待筛选用户的地理位置信息、待筛选用户所使用的电子设备的地理位置信息、电子设备的IP地址中的至少一项。其中,地理位置信息可包括GPS经纬度信息。
步骤B2,若第二位置信息满足预设筛选条件,则将第二位置信息对应的待筛选用户确定为目标用户。其中,预设筛选条件包括以下至少一项:第二位置信息对应的位置与待筛选用户的驻留位置不匹配、第二位置信息的信息内容不完整、第二位置信息中包含预设异常符号。
其中,可预先确定待筛选用户的驻留位置。可选地,将以下至少一种位置确定为驻留位置:最近一段时间内停留次数达到预设次数、停留频率达到预设频率(如每周至少前往3次)、单次停留时长达到预设时长,等等。若第二位置信息对应的位置与待筛选用户的驻留位置不匹配,则说明第二位置信息可能为虚假信息。信息内容不完整表示根据第二位置信息无法确定出准确的位置,即位置模糊。预设异常符号可以是任一种或多种与位置信息无关的字符,比如第二位置信息中包括“*”、“%”或“……”等字符,即可确认第二位置信息包含预设异常符号。
在一个实施例中,目标位置范围根据第一位置信息所确定。可选地,根据第一位置信息,确定位于目标位置范围内的至少一个第一目标用户时,可执行为以下步骤:首先,确定以第一位置信息对应的位置为中心、且与第一位置信息对应的位置(即中心位置)之间的距离小于或等于预设距离的多个位置点,确定包括该多个位置点的范围为目标位置范围。其次,将目标位置范围与每个目标用户的位置信息进行匹配,以匹配出位于目标位置范围内的第一目标用户。
本实施例中,考虑到多个风险用户之间的关联性,比如在位置维度有一定关联性(如相距较近)、在图像维度有一定关联性(如具有相似的背景图像),因此,将包含以第一位置信息对应的位置为中心、且与该中心位置之间的距离小于或等于预设距离的多个位置点的范围作为目标位置范围,能够快速将在位置维度上有一定关联性的用户筛选出来,从而有利于提升识别风险用户的效率及准确度。并且,考虑到风险用户及其关联用户之间往往在位置维度上有一定关联性(如相距较近),因此本实施例通过匹配目标位置范围内的目标用户,能够提升识别风险用户及其关联用户的准确度。
在一个实施例中,根据第一目标用户的数量,计算待识别用户对应的第一风险概率值,可具体执行为以下步骤:
首先,确定第一目标用户的数量,第一目标用户的数量可根据目标位置范围和目标用户的位置信息的匹配结果确定得到。
其次,若第一目标用户的数量大于第一预设数量阈值,则将第一预设概率值确定为待识别用户对应的第一风险概率值。若第一目标用户的数量小于或等于第一预设数量阈值,则计算第一目标用户的数量与第三预设数量之间的第一占比,将该第一占比确定为第一风险概率值,其中,第一预设概率值大于第一占比。第一预设数量阈值、第一预设概率值和第三预设数量均可根据实际需求进行设定。
例如,第一预设数量阈值为100,第一预设概率值为0.9,那么当第一目标用户的数量大于100时,即可确定待识别用户对应的第一风险概率值为0.9。第一风险概率值通常设置为较大的值,用以表示待识别用户属于风险用户的概率较高。
当第一目标用户的数量小于或等于100时,可按照以下公式(2)计算第一目标用户的数量与第三预设数量之间的第一占比P1:
P1=[x-x(min)]/[x(max)-x(min)] (2)
其中,x为第一目标用户的数量,x(max)-x(min)的值即为第三预设数量,x(max)为目标位置范围内可能出现的风险用户的最大数量,x(min)为目标位置范围内可能出现的风险用户的最小数量,x(max)和x(min)的值均可预先设置。
例如,x(max)=100,x(min)=0。若第一目标用户的数量为20,即x=20,则利用上述公式(2)可计算出P1=0.2,即待识别用户对应的第一风险概率值为0.2。
在一个实施例中,根据第二目标用户的数量,计算待识别用户对应的第二风险概率值,可具体执行为以下步骤:
首先,确定第二目标用户的数量,第二目标用户的数量可根据第一图像和每个第一目标用户的第二图像的匹配结果确定得到。
其次,若第二目标用户的数量大于第二预设数量阈值,则将第二预设概率值确定为待识别用户对应的第二风险概率值。若第二目标用户的数量小于或等于第二预设数量阈值,则计算第二目标用户的数量与第四预设数量之间的第二占比,将该第二占比确定为第二风险概率值,其中,第二预设概率值大于第二占比。第二预设数量阈值、第二预设概率值和第四预设数量均可根据实际需求进行设定。
例如,第二预设数量阈值为100,第二预设概率值为0.9,那么当第二目标用户的数量大于100时,即可确定待识别用户对应的第二风险概率值为0.9。第二风险概率值通常设置为较大的值,用以表示待识别用户属于风险用户的概率较高。
当第二目标用户的数量小于或等于100时,可按照以下公式(3)计算第二目标用户的数量与第四预设数量之间的第一占比P2:
P2=[y-y(min)]/[y(max)-y(min)] (3)
其中,y为第二目标用户的数量,y(max)-y(min)的值即为第四预设数量,y(max)为目标用户图像集内存在的第二目标用户的最大数量,y(min)为目标用户图像集内存在的第二目标用户的最小数量,y(max)和y(min)的值均可预先设置。
例如,y(max)=100,y(min)=0。若第二目标用户的数量为20,即y=20,则利用上述公式(3)可计算出P2=0.2,即待识别用户对应的第二风险概率值为0.2。
在一个实施例中,根据第一图像特征和每个第一目标用户的第二图像特征之间的图像特征相似度,确定第二目标用户的过程中,若存在至少一个图像特征相似度大于或等于预设相似度阈值,则将大于或等于预设相似度阈值的图像特征相似度对应的第一目标用户确定为第二目标用户。若每个图像特征相似度均小于预设相似度阈值,则减小预设相似度阈值,根据每个图像特征相似度以及减小后的预设相似度阈值,重新确定第二目标用户。
本实施例中,减小预设相似度阈值时,可按照预设的减小步长来减小预设相似度阈值,比如将预设相似度阈值减小0.2。也可以将预设相似度阈值减小至预设值,比如减小至0.6。在减小预设相似度阈值之后,根据新的预设相似度阈值重新确定第二目标用户。如果减小预设相似度阈值之后仍然不存在第二目标用户,则继续减小预设相似度阈值,直至从第一目标用户中确定出至少一个第二目标用户。
在一个实施例中,根据第一风险概率值和第二风险概率值,确定待识别用户对应的风险等级之后,若确定待识别用户对应的风险等级为目标风险等级,则将待识别用户的第一用户信息存储至目标用户图像集,以更新目标用户图像集,使得目标用户图像集中的目标用户的信息更完善、全面,从而为后续识别风险用户提供更加准确的数据依据。
在一个实施例中,根据第一风险概率值和第二风险概率值,确定待识别用户对应的风险等级时,可根据第一风险概率值和第二风险概率值,以及第一风险概率值和第二风险概率值分别对应的权重,计算待识别用户的风险概率值。若待识别用户的风险概率值大于或等于预设风险阈值,则确定待识别用户对应的风险等级为目标风险等级,其中,目标风险等级用于表征待识别用户为风险用户。可选地,若待识别用户的风险概率值小于预设风险阈值,则确定待识别用户对应的风险等级不为目标风险等级,即,待识别用户不为风险用户。可选地,若确定待识别用户为风险用户,还可确定第二目标用户为待识别用户的关联用户。
本实施例中,第一风险概率值和第二风险概率值分别对应的权重可根据风险防控侧重点进行设置。具体的,如果更加侧重基于位置信息进行风险识别,则可以为第一风险概率值设置较高的权重,反之,如果更加侧重基于图像数据进行风险识别,则可以为第二风险概率值设置较高的权重。第一风险概率值和第二风险概率值分别对应的权重之和为1。
例如,第一风险概率值对应的权重为0.6,第二风险概率值对应的权重为0.4,则待识别用户属于风险用户的风险概率值P可按照以下公式(4)计算:
P=0.6*P1+0.4*P2 (4)
其中,P1为第一风险概率值,P2为第二风险概率值。
图2是根据本申请另一实施例的一种数据处理方法的示意性流程图,如图2所示,该方法包括:
S201,获取待识别用户的第一用户信息,第一用户信息包括第一位置信息和第一图像。
其中,第一位置信息可包括用户所在的地理位置信息、用户所使用的电子设备的地理位置信息、用户所使用的电子设备的IP地址信息等中的一项或多项。可选地,待识别用户在处理业务时会提供位置信息,比如在申请信用卡、网购商品等场景中均会向相应平台输入位置信息(如输入家庭地址、办公地址、收货地址等),因此,数据处理系统可通过互联网,从上述平台中获取到待识别用户的第一位置信息。其中,地理位置信息可包括GPS经纬度信息。若数据处理系统通过互联网未获取到待识别用户的GPS经纬度信息,也可以在获取到其他位置信息(比如家庭地址、办公地址、收货地址等)信息后,使用GPS定位系统基于其他位置信息进行定位,从而确定出待识别用户的GPS经纬度信息。
第一图像可包括用户的活体图像和背景图像。可选地,待识别用户在处理业务时会提供图像,比如在申请信用卡、网购商品等需要进行实名认证的场景中,均会向相应平台输入图像(如实时拍摄人脸图像),因此,数据处理系统可通过互联网,从上述平台中获取到待识别用户的第一图像。
S202,确定出以第一位置信息对应的位置为中心、且与该中心位置之间相距预设距离的多个位置点,确定包括该多个位置点的目标位置范围。
其中,预设距离小于或等于预设距离阈值,比如,预设距离阈值为200米,则目标位置范围即为以第一位置信息对应的位置为中心、且距离该中心位置不超过200米的范围。
S203,从目标用户地图中确定出位于目标位置范围内的至少一个第一目标用户的用户身份信息。
其中,目标位置范围根据第一位置信息所确定,目标用户地图包括多个目标用户的用户身份信息和位置信息。
S204,根据第一目标用户的数量,计算待识别用户对应的第一风险概率值。
其中,第一风险概率值的计算方式已在上述实施例中详述,此处不再赘述。
S205,将每个第一目标用户的用户身份信息和预先构建的目标用户图像集进行匹配,根据匹配结果获取每个第一目标用户的第二图像特征。
该步骤中,通过将每个第一目标用户的用户身份信息和预先构建的目标用户图像集进行匹配,使得匹配出的每个第一目标用户的第二图像特征、以及每个第一目标用户的用户身份信息和位置信息,关联构成了一个集合(即目标用户图像集),该集合即为以背景图像的图像特征进行风险识别的数据底库。在该数据底库中,包括每个第一目标用户的第二图像特征、用户身份信息和位置信息。
S206,将第一图像输入预先训练的深度神经网络模型中进行特征提取,得到第一图像对应的第一图像特征。
该步骤中,如何利用深度神经网络模型提取图像特征,将在下述实施例中详细说明。
S207,计算第一图像特征和每个第二图像特征之间的欧式距离,根据欧式距离确定每个第二图像特征与第一图像特征之间的图像特征相似度。
该步骤中,如何进行图像特征相似度计算已在上述实施例中详述,此处不再重复。
S208,确定图像特征相似度大于或等于预设相似度阈值的第二图像数据对应的第一目标用户为第二目标用户。
S209,根据第二目标用户的数量,计算待识别用户对应的第二风险概率值。
其中,第二风险概率值的计算方式已在上述实施例中详述,此处不再赘述。
S210,根据第一风险概率值和第二风险概率值,以及第一风险概率值和第二风险概率值分别对应的权重,计算待识别用户的风险概率值。
S211,若风险概率值大于或等于预设概率阈值,则确定待识别用户属于风险用户,并确定第二目标用户为待识别用户的关联用户。
可见,采用本申请实施例的技术方案,首先获取待识别用户的位置信息和图像数据,然后根据待识别用户的位置信息,确定出位于目标位置范围内的至少一个第一目标用户的用户身份信息,从而筛选出与待识别用户所在位置(即第一位置信息对应的位置)相匹配的目标位置范围内的第一目标用户。进而,根据每个第一目标用户的用户身份信息和预先构建的目标用户图像集,获取每个第一目标用户的图像特征,由于目标用户图像集包括多个目标用户的用户身份信息、位置信息和图像特征,因此通过将每个第一目标用户的用户身份信息与目标用户图像集进行匹配,即可快速获取到每个第一目标用户的图像特征,从而根据待识别用户的图像特征和每个第一目标用户的图像特征,确定出第一目标用户中与待识别用户的图像特征之间的图像特征相似度大于或等于预设相似度阈值的第二目标用户,进而根据第一目标用户的数量确定待识别用户的第一风险概率值,根据第二目标用户的数量确定待识别用户的第二风险概率值,最后根据待识别用户对应的第一风险概率值和第二风险概率值确定待识别用户对应的风险等级。可见,该技术方案在对待识别用户进行风险等级的确定过程中,综合考虑了用户所在位置和用户对应的图像特征,而不仅仅是单一地依赖于位置信息或者依赖于图像特征,多种数据的综合计算结果使得待识别用户的风险等级确定结果更加准确。此外,由于第二目标用户是基于与待识别用户的背景图像之间的图像特征相似度筛选出的,而背景图像特征能够在一定程度上表征各个用户之间的关联性和相似性,因此,该技术方案在识别风险用户的同时,还能够识别出与风险用户之间具有关联性和相似性的其他用户,即具有一定风险性的群体,从而极大地提高了风险用户及其群体的识别力度。
图3是根据本申请一实施例的一种数据处理方法的实现原理示意图。如图3所示,目标用户图像集包括多个目标用户的用户身份信息(图中未示出)、位置信息和图像特征,其中,位置信息可以是经纬度信息,图3以经纬度坐标(Xn,Yn)表示位置信息。在图3所示实现原理中:
首先,将待识别用户的第一用户信息和预先构建的目标用户地图进行匹配,第一用户信息包括第一位置信息(X0,Y0)和第一图像,通过提取第一图像中的图像特征,得到待识别用户的图像特征M0。目标用户地图包括多个目标用户的用户身份信息(如图中所示用户信息A、B……)和位置信息(如图中所示经纬度坐标(X1,Y1)、(X2,Y2)……),匹配结果包括:位于目标位置范围内的至少一个第一目标用户、第一目标用户的第二用户身份信息(假设以N表示)以及第一目标用户的数量。由于目标用户地图包括各目标用户的位置信息,因此匹配结果还可包括每个第一目标用户的位置信息(Xn,Yn)。其中,目标位置范围基于第一位置信息所确定,比如,目标位置范围为以第一位置信息所在位置为中心、且距离该中心位置200米内的位置范围。
其次,将第一目标用户的用户身份信息和预先构建的目标用户图像集进行匹配,目标用户图像集包括多个目标用户的用户身份信息、位置信息和图像特征,图3中以M1、M2……Mn来表示图像特征。匹配结果包括每个第一目标用户的图像特征M1。通过计算待识别用户的图像特征M0和每个第一目标用户的图像特征M1之间的图像特征相似度,从而从第一目标用户中筛选出图像特征相似度大于或等于预设相似度阈值的第二目标用户。如图3所示,通过和目标用户图像集进行匹配、计算图像特征相似度之后,输出多个第二目标用户的图像特征M2。多个图像特征M2,与图像特征M1之间的图像特征相似度均大于或等于预设相似度阈值,图像特征M2对应的第二目标用户为与待识别用户对应的关联用户。需要说明的是,图3中示意的多个图像特征M2仅是为了表征输出均是第二目标用户的图像特征,而并非指输出的图像特征相同。
可选地,目标用户图像集中的各图像特征可按照对应的图像类别进行划分,且划分为一组的图像特征之间的图像特征相似度均大于或等于预设相似度阈值。图像特征M2与图像特征M1对应的图像对应相同的图像类别。
之后,根据第一目标用户的数量确定待识别用户的第一风险概率值,根据第二目标用户的数量确定待识别用户的第二风险概率值。根据第一风险概率值和第二风险概率值,确定风险识别结果,风险识别结果包括待识别用户对应的风险等级,以及待识别用户的关联用户(即第二目标用户)。
图3所示实施例中,在确定位于目标位置范围内的至少一个第一目标用户、第一用户目标的第二用户身份信息以及第一目标用户的数量时,是通过将待识别用户的第一用户信息和预先构建的目标用户地图进行匹配得到的。在另一实施例中,还可通过将待识别用户的第一用户信息和预先构建的目标用户图像集进行匹配。目标用户图像集基于目标用户地图所构建,其具体的构建方式已在上述实施例中详细说明,此处不再赘述。
如图4所示为另一实施例的一种数据处理方法的实现原理示意图。在图4所示实现原理中:将待识别用户的第一用户信息和预先构建的目标用户图像集进行匹配,第一用户信息包括第一位置信息(X0,Y0)和第一图像,通过提取第一图像中的图像特征,得到待识别用户的图像特征M0。目标用户图像集包括多个目标用户的用户身份信息、位置信息和图像特征,匹配结果包括:位于目标位置范围内的至少一个第一目标用户、第一用户目标的第二用户身份信息以及第一目标用户的数量。然后,进一步将第一目标用户的用户身份信息和目标用户图像集进行匹配,得到每个第一目标用户的图像特征M1。在得到图像特征M1之后的步骤和图3所示实施例相同,因此不再赘述。
图5是根据本申请再一实施例的一种数据处理方法的示意性流程图。如图5所示,数据处理方法包括以下步骤S502-S506:
S502,获取N个样本图像,N个样本图像对应多个图像类别,其中,N为大于1的整数。
其中,样本图像可包括样本用户的活体图像和背景图像。N个样本图像中,每个样本图像分别对应唯一的图像类别,且不同的样本图像对应的图像类别可相同、也可不同。
S504,将N个样本图像输入预先训练的深度神经网络模型中进行特征提取,输出每个样本图像分别对应的目标样本图像特征,其中,目标样本图像特征用于表征样本图像中的图像关键点的特征。
可选地,可将样本图像直接输入深度神经网络模型中进行特征提取;或者,去除样本图像中的活体图像,以得到仅包括背景图像的样本图像,进而将仅包括背景图像的样本图像输入深度神经网络模型中进行特征提取。
S506,将N个目标样本图像特征,按照各自对应的图像类别进行分类,并将分类后的目标样本图像特征存储至图像特征检索库。
其中,目标样本图像特征对应的图像类别,指的是目标样本图像特征对应的样本图像所属的图像类别。
在一个实施例中,深度神经网络模型包括:卷积层、池化层、关键特征提取层、通道降维层,在执行S504时,可通过深度神经网络模型中的各个层依次对样本图像或者中间数据进行处理。具体地,卷积层用于对样本图像进行特征提取,得到第一样本图像特征。池化层用于对第一样本图像特征进行降维处理,得到第二样本图像特征。关键特征提取层用于基于注意力机制对第二样本图像特征进行特征提取,以得到第二样本图像特征中的关键点特征。通道降维层用于对关键点特征的通道数进行降维处理,得到目标样本图像特征。
图6是根据本申请一实施例的一种数据处理方法中构建图像特征检索库的示意性原理图。下面结合图6,详细说明如何利用深度神经网络模型构建图像特征检索库。
首先获取到N个样本图像,例如,N个样本图像包括如下数据:
(x11,x12,...,x1m)、(x21,x22,...,x2m)……(xn1,xn2,...,xnm)。其中,xnm表示一张样本图像,n为样本图像对应的图像类别总数,m表示每个图像类别下的样本图像数量,每张样本图像的尺寸为K*K*3。需要说明的是,本示例中,为了方便说明,每个图像类别下均包括m个样本图像,但在实际应用中,不同图像类别下可以包括不同数量的样本图像。
其次,将获取到的N个样本图像的数据输入深度神经网络模型中的卷积层进行特征提取,得到第一样本图像特征。
可选地,深度神经网络模型可采用Delf(DEep Local Features)模型,或者其它具备注意力机制的图像检索模型。
之后,将第一样本图像特征输入池化层进行降维处理,得到第二样本图像特征。
可选地,卷积层和池化层可通过ResNet 50网络结构来实现,ResNet 50网络结构包括卷积层和池化层。例如,图像尺寸为224*224*3的样本图像,通过ResNet 50进行特征提取后,可提取到7*7*2048的特征向量。ResNet 50进行特征提取的过程为现有技术,此处不再赘述。
之后,将第二样本图像特征输入关键特征提取层,关键特征提取层基于注意力机制对第二样本图像特征进行特征提取,以提取出第二样本图像特征中的关键点特征。其中,关键点特征即为样本图像中的关键点的特征,例如,7*7*2048的特征向量中,有一部分点的值相对较大,说明这些点在特征提取过程中的响应相对更强烈,因此这些点很可能是关键点,就会被关键特征提取层提取出来。
注意力机制可通过构建注意力矩阵来实现。若以θ表示注意力矩阵,以fn表示池化层输出的第二样本图像特征,则注意力机制可通过表达式θ*fn来实现。例如,构建一个7*7的注意力矩阵,将ResNet 50提取得到的特征向量和注意力矩阵相乘,从而得到关键点特征。关键点特征相较于第二样本图像特征而言维度不变,即,关键点特征仍然是7*7*2048的特征向量。
之后,将关键点特征输入通道降维层,通道降维层对关键点特征的通道数进行降维处理,得到目标样本图像特征。由于关键特征提取层输出的关键点特征的特征维度较高,尤其是特征通道数较多,导致参数量巨大,进而导致图像特征检索库的构建过程中任务量巨大,因此需要进一步对关键点特征的通道数进行降维处理。
可选地,通道降维层可利用PCA(Principal Component Analysis,主成分分析法)来实现降维。例如,7*7*2048的特征向量经过PCA处理后,可得到1*512的特征向量。显然,特征向量的维度得到明显降低。
在一个实施例中,将目标样本图像特征按照各自对应的图像类别进行分类之后,可通过构建损失函数的方式对深度神经网络模型的参数(包括模型中引入的所有参数,如注意力矩阵)进行优化。假设设计损失函数L1如下式(5):
L1=y*log(p)+(1-y)log(1-p) (5)
其中,p=w*{a(fn;θ)*fn},a(.)表示矩阵之间的乘法运算,fn表示第二样本图像特征,w为预先设置好的全连接层,由n个神经元组成,n为样本图像的图像类别数量,y为用于表征图像类别的标签信息,假设用one-hot编码定义图像类别,n=5,即样本图像共有5个图像类别,那么第1个图像类别可编码为y1=[1,0,0,0,0],第2个图像类别可编码为y2=[0,1,0,0,0],等等。构建好损失函数之后,利用反向传播方法,并基于损失函数对深度神经网络模型的参数进行优化,直至损失函数收敛或者达到预设的迭代次数。
由图6可看出,通过深度神经网络模型输出多个目标样本图像特征,进而将多个目标样本图像特征进行分类后,得到图像特征检索库,其中包括多个图像类别的目标样本图像特征。Y1、Y2为不同图像类别的标签信息,每个图像类别下的图像数量可相同、也可不同。
可见,采用本申请实施例的技术方案,通过获取多个图像类别的样本图像,将样本图像输入预先训练的深度神经网络模型中进行特征提取,输出每个样本图像分别对应的目标样本图像特征,进而将目标样本图像特征按照各自对应的图像类别进行分类,并将分类后的目标样本图像特征存储至图像特征检索库,使图像特征检索库中的图像特征按照各自对应的图像类别划分好,从而可将图像特征检索库应用在图像检索场景中。例如应用在上述实施例中的风险防控场景中,将目标用户的图像作为样本图像来构建图像特征检索库,这样,图像特征检索库中存储的多个图像类别的图像特征,即为多个目标用户对应的图像特征,其中包括第一目标用户对应的第二图像特征。利用深度神经网络模型提取出待识别用户的第一图像特征之后,将待识别用户的第一图像特征和图像特征检索库中的第二图像特征进行相似度计算,得到第一图像特征和每个第二图像特征之间的图像特征相似度,进而确定图像特征相似度大于或等于预设相似度阈值的第二图像特征与第一图像特征对应相同的图像类别,并且,与第一图像特征对应同一图像类别的第二图像特征所对应的第一目标用户,即为与待识别用户具有关联关系的第二目标用户。若确定待识别用户为风险用户,则第二目标用户即为风险用户的群体。可见,将图像特征检索库的构建和使用方式,为风险防控场景提供了有利的技术支撑,使得风险用户及其群体的识别更加精确。
图7是根据本申请再一实施例的一种数据处理方法的示意性流程图。如图7所示,数据处理方法包括以下步骤:
S702,获取待分类的第一图像和预先构建的图像特征检索库,其中,图像特征检索库中存储有多个样本图像对应的目标样本图像特征。
图像特征检索库的构建方式如图5至图6所示实施例,此处不再重复。
S704,将第一图像输入预先训练的深度神经网络模型中进行特征提取,输出第一图像对应的第三图像特征,其中,第三图像特征包括第一图像中的图像关键点的特征。
S706,计算第三图像特征和至少一个目标样本图像特征的相似度,得到第三图像特征和每个目标样本图像特征之间的图像特征相似度。
其中,可将第三图像特征和部分目标样本图像特征之间进行相似度计算,也可将第三图像特征和全部目标样本图像特征之间进行相似度计算。
一种场景中,不考虑其他维度上的信息,仅根据图像特征相似度进行图像分类时,可将第一图像对应的第三图像特征和全部目标样本图像特征之间进行相似度计算。根据计算得到的图像特征相似度对第一图像进行分类。
另一种场景中,结合其他维度上的信息(如位置信息)进行图像分类,如上述实施例提及的风险防控场景中,首先根据位置信息筛选出第一目标用户,第一目标用户对应的第二图像特征为图像特征检索库中的部分图像特征。这种情况下,仅将第三图像特征和图像特征检索库中的部分图像特征(即第二图像特征)进行相似度计算,从而根据计算得到的图像特征相似度对第一图像进行分类。
S708,从多个图像特征相似度中,将大于或等于预设相似度阈值的图像特征相似度对应的样本图像的图像类别,确定为第一图像对应的目标图像类别。
可选地,若将本实施例中的数据处理方法应用于风险防控场景中,则待分类的第一图像即为待识别用户的第一图像,第一图像对应的第三图像特征即为待识别用户对应的第一图像特征。在构建图像特征检索库时,将目标用户的图像作为样本图像,通过执行图5所示步骤,构建出的图像特征检索库中包括的目标样本图像特征,即为多个目标用户的第二图像特征,且多个目标用户的第二图像特征按照各自对应的图像类别进行分类。在确定出位于目标位置范围内的至少一个第一目标用户之后,将待识别用户对应的第一图像特征和图像特征检索库中第一目标用户对应的第二图像特征进行相似度计算,从而根据计算得到的图像特征相似度对待识别用户的第一图像进行分类。
在一个实施例中,深度神经网络模型包括,卷积层、池化层、关键特征提取层和通道降维层。在执行S704时,可通过深度神经网络模型中的各个层依次对第一图像或者中间数据进行处理。其中,卷积层用于对样本图像进行特征提取,得到第一样本图像特征;池化层用于对第一样本图像特征进行降维处理,得到第二样本图像特征;关键特征提取层用于基于注意力机制对第二样本图像特征进行特征提取,以得到第二样本图像特征中的关键点特征;通道降维层用于对关键点特征的通道数进行降维处理,得到目标样本图像特征。本实施例中,通过深度神经网络模型提取第一图像的第三图像特征的过程,和上述实施例中通过深度神经网络模型提取样本图像的目标样本图像特征过程相同,此处不再重复。
可见,采用本申请实施例的技术方案,通过将待分类的第一图像输入深度神经网络模型中进行特征提取,得到第一图像对应的第三图像特征,进而计算第三图像特征和图像特征检索库中至少一个目标样本图像特征的相似度,得到第三图像特征和每个目标样本图像特征之间的图像特征相似度,进而将大于或等于预设相似度阈值的图像特征相似度对应的样本图像的图像类别,确定为第一图像对应的目标图像类别,实现了对待分类的第一图像的精确分类,若将图像特征检索库应用在上述实施例中的风险防控场景中,则将目标用户的图像作为样本图像来构建图像特征检索库,这样,图像特征检索库中存储的多个图像类别的图像特征,即为多个目标用户对应的图像特征,其中包括第一目标用户对应的第二图像特征。利用深度神经网络模型提取出待识别用户的第一图像特征之后,将待识别用户的第一图像特征和图像特征检索库中的第二图像特征进行相似度计算,得到第一图像特征和每个第二图像特征之间的图像特征相似度,进而确定图像特征相似度大于或等于预设相似度阈值的第二图像特征与第一图像特征对应相同的图像类别,并且,与第一图像特征对应同一图像类别的第二图像特征所对应的第一目标用户,即为与待识别用户具有关联关系的第二目标用户。若确定待识别用户为风险用户,则第二目标用户即为风险用户的群体。可见,将图像特征检索库的构建和使用方式,为风险防控场景提供了有利的技术支撑,使得风险用户及其群体的识别更加精确。
综上,已经对本主题的特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作可以按照不同的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序,以实现期望的结果。在某些实施方式中,多任务处理和并行处理可以是有利的。
以上为本申请实施例提供的数据处理方法,基于同样的思路,本申请实施例还提供一种数据处理装置。
图8根据本申请一实施例的一种数据处理装置的示意性框图,如图8所示,该装置包括:
第一获取模块81,用于获取待识别用户的第一用户信息,所述第一用户信息包括第一位置信息和第一图像;
第一确定模块82,用于根据所述第一位置信息,确定位于目标位置范围内的至少一个第一目标用户以及第一目标用户的第二用户身份信息;
第二获取模块83,用于根据每个所述第二用户身份信息和预先构建的目标用户图像集,获取每个所述第一目标用户的第二图像特征;所述目标用户图像集包括多个目标用户的用户身份信息和图像特征;
第二确定模块84,用于获取所述第一图像的第一图像特征,根据所述第一图像特征和所述第二图像特征之间的图像特征相似度,确定第二目标用户,其中,所述第二目标用户为所述图像特征相似度大于或等于预设相似度阈值的第一目标用户;
第三确定模块85,用于根据所述第一目标用户的数量确定所述待识别用户的第一风险概率值,根据所述第二目标用户的数量确定所述待识别用户的第二风险概率值;
第四确定模块86,用于根据所述第一风险概率值和所述第二风险概率值,确定所述待识别用户对应的风险等级。
在一个实施例中,所述第一确定模块82包括:
第一确定单元,用于根据所述第一位置信息,确定所述目标位置范围;
第一获取单元,用于获取所述多个目标用户的位置信息;
第二确定单元,用于若所述目标用户的位置信息与所述目标位置范围相匹配,则将所述目标用户确定为所述第一目标用户。
在一个实施例中,所述第一确定模块82包括:
第三确定单元,用于在将所述目标用户确定为所述第一目标用户之后,确定所述第一目标用户的位置信息;
第四确定单元,用于根据各所述目标用户分别对应的位置信息和用户身份信息,确定与所述第一目标用户的位置信息相对应的用户身份信息,作为所述第二用户身份信息。
在一个实施例中,所述装置还包括:
第三获取模块,用于在所述根据每个所述第二用户身份信息和预先构建的目标用户图像集,获取每个所述第一目标用户的第二图像特征之前,获取所述多个目标用户分别对应的目标图像;
第一提取模块,用于将所述目标图像输入预先训练的深度神经网络模型中进行特征提取,得到所述目标图像对应的图像特征;
存储模块,用于将所述图像数据添加至预先构建的目标用户地图中,并与对应的所述目标用户的用户身份信息和/或位置信息关联存储,得到所述目标用户图像集,其中,所述目标用户地图中包括所述多个目标用户的用户身份信息和位置信息。
在一个实施例中,所述第二确定模块84包括:
第一提取单元,用于将所述第一图像输入所述深度神经网络模型中进行特征提取,得到所述第一图像对应的第一图像特征;
第一计算单元,用于计算所述第一图像特征和所述第二图像特征之间的图像特征相似度;
第五确定单元,用于根据所述图像特征相似度,确定所述第二目标用户。
在一个实施例中,所述装置还包括:
第四获取模块,用于获取多个待筛选用户分别对应的第二位置信息,所述第二位置信息包括所述待筛选用户的地理位置信息、所述待筛选用户所使用的电子设备的地理位置信息、所述电子设备的IP地址中的至少一项;
第五确定模块,用于若所述第二位置信息满足预设筛选条件,则将所述第二位置信息对应的待筛选用户确定为目标用户,所述预设筛选条件包括以下至少一项:所述第二位置信息对应的位置与所述待筛选用户的驻留位置不匹配、所述第二位置信息的信息内容不完整、所述第二位置信息中包含预设异常符号。
在一个实施例中,所述第三确定模块85包括:
第六确定单元,用于确定所述第一目标用户的数量;
第七确定单元,用于若所述第一目标用户的数量大于第一预设数量阈值,则将第一预设概率值确定为所述待识别用户对应的第一风险概率值;
第八确定单元,用于若所述第一目标用户的数量小于或等于所述第一预设数量阈值,则计算所述第一目标用户的数量与第三预设数量之间的第一占比,将所述第一占比确定为待识别用户对应的第一风险概率值;
其中,所述第一预设概率值大于所述第一占比。
在一个实施例中,所述第三确定模块85包括:
第九确定单元,用于确定所述第二目标用户的数量;
第十确定单元,用于若所述第二目标用户的数量大于第二预设数量阈值,则将第二预设概率值确定为所述待识别用户对应的第二风险概率值;
第八确定单元,用于若所述第二目标用户的数量小于或等于所述第二预设数量阈值,则计算所述第二目标用户的数量与第四预设数量之间的第二占比,将所述第二占比确定为待识别用户对应的第二风险概率值;
其中,所述第二预设概率值大于所述第二占比。
在一个实施例中,所述装置还包括:
第六确定模块,用于所述确定所述待识别用户对应的风险等级之后,若所述待识别用户对应的风险等级为目标风险等级,则将所述待识别用户的第一用户信息存储至所述目标用户图像集,以更新所述目标用户图像集。
在一个实施例中,所述第四确定模块86包括:
第二计算单元,用于根据所述第一风险概率值和所述第二风险概率值,以及所述第一风险概率值和所述第二风险概率值分别对应的权重,计算所述待识别用户的风险概率值;
第十一确定单元,用于若所述风险概率值大于或等于预设风险阈值,则确定所述待识别用户对应的风险等级为目标风险等级,其中,所述目标风险等级用于表征所述待识别用户为风险用户。
在一个实施例中,所述目标用户满足以下至少一项条件:
在第一指定时长内,使用同一设备的注册次数大于或等于第一预设阈值;
在第二指定时长内,使用同一设备的登录次数大于或等于第二预设阈值;
在第三指定时长内,使用同一设备的登录账号的数量大于或等于第三预设阈值;
在第四指定时长内,使用同一设备对其他用户的邀请次数大于或等于第四预设阈值;
在第五指定时长内,使用同一设备的实名认证次数大于或等于第五预设阈值;
在第六指定时长内,使用同一设备执行指定类业务的次数大于或等于第六预设阈值。
采用本申请实施例的装置,首先获取待识别用户的位置信息和图像,然后根据待识别用户的位置信息,确定出位于目标位置范围内的至少一个第一目标用户及其对应的用户身份信息,从而筛选出与待识别用户所在位置(即第一位置信息对应的位置)相匹配的目标位置范围内的第一目标用户。进而,根据每个第一目标用户的用户身份信息和预先构建的目标用户图像集,获取每个第一目标用户的图像特征,由于目标用户图像集包括多个目标用户的用户身份信息和图像特征,因此通过将每个第一目标用户的用户身份信息与目标用户图像集进行匹配,即可快速获取到每个第一目标用户的图像特征,从而根据待识别用户的图像数据和每个第一目标用户的图像特征,确定出第一目标用户中与待识别用户的图像特征之间的图像特征相似度大于或等于预设相似度阈值的第二目标用户,进而根据第一目标用户的数量确定待识别用户的第一风险概率值,根据第二目标用户的数量确定待识别用户的第二风险概率值,最后根据待识别用户对应的第一风险概率值和第二风险概率值确定待识别用户对应的风险等级。可见,该技术方案在对待识别用户进行风险等级的确定过程中,综合考虑了用户所在位置和用户对应的图像特征,而不仅仅是单一地依赖于位置信息或者依赖于图像特征,多种数据的综合计算结果使得待识别用户的风险等级确定结果更加准确。此外,由于第二目标用户是基于与待识别用户的图像特征之间的图像特征相似度筛选出的,而图像特征能够在一定程度上表征各个用户之间的关联性和相似性,因此,该技术方案在识别风险用户的同时,还能够识别出与风险用户之间具有关联性和相似性的其他用户,即具有一定风险性的群体,从而极大地提高了风险用户及其群体的识别力度。
图9根据本申请另一实施例的一种数据处理装置的示意性框图,如图9所示,该装置包括:
第五获取模块91,用于获取N个样本图像,所述N个样本图像对应多个图像类别,其中,N为大于1的整数;
第二提取模块92,用于将所述N个样本图像输入预先训练的深度神经网络模型中进行特征提取,输出每个所述样本图像分别对应的目标样本图像特征,其中,所述目标样本图像特征用于表征所述样本图像中的图像关键点的特征;
分类模块93,用于将所述N个目标样本图像特征,按照各自对应的图像类别进行分类,并将分类后的所述目标样本图像特征存储至图像特征检索库。
在一个实施例中,所述深度神经网络模型包括:卷积层、池化层、关键特征提取层和通道降维层;
所述第二提取模块92具体用于:
所述卷积层用于对所述样本图像进行特征提取,得到第一样本图像特征;
所述池化层用于对所述第一样本图像特征进行降维处理,得到第二样本图像特征;
所述关键特征提取层用于基于注意力机制对所述第二样本图像特征进行特征提取,以得到所述第二样本图像特征中的关键点特征;
所述通道降维层用于对所述关键点特征的通道数进行降维处理,得到所述目标样本图像特征。
采用本申请实施例的技术方案,通过获取多个图像类别的样本图像,将样本图像输入预先训练的深度神经网络模型中进行特征提取,输出每个样本图像分别对应的目标样本图像特征,进而将目标样本图像特征按照各自对应的图像类别进行分类,并将分类后的目标样本图像特征存储至图像特征检索库,使图像特征检索库中的图像特征按照各自对应的图像类别划分好,从而可将图像特征检索库应用在图像检索场景中。例如应用在上述实施例中的风险防控场景中,将目标用户的图像作为样本图像来构建图像特征检索库,这样,图像特征检索库中存储的多个图像类别的图像特征,即为多个目标用户对应的图像特征,其中包括第一目标用户对应的第二图像特征。利用深度神经网络模型提取出待识别用户的第一图像特征之后,将待识别用户的第一图像特征和图像特征检索库中的第二图像特征进行相似度计算,得到第一图像特征和每个第二图像特征之间的图像特征相似度,进而确定图像特征相似度大于或等于预设相似度阈值的第二图像特征与第一图像特征对应相同的图像类别,并且,与第一图像特征对应同一图像类别的第二图像特征所对应的第一目标用户,即为与待识别用户具有关联关系的第二目标用户。若确定待识别用户为风险用户,则第二目标用户即为风险用户的群体。可见,将图像特征检索库的构建和使用方式,为风险防控场景提供了有利的技术支撑,使得风险用户及其群体的识别更加精确。
图10根据本申请再一实施例的一种数据处理装置的示意性框图,如图10所示,该装置包括:
第六获取模块101,用于获取待分类的第一图像和预先构建的图像特征检索库,其中,所述图像特征检索库中存储有多个样本图像对应的目标样本图像特征;
第三提取模块102,用于将所述第一图像输入预先训练的深度神经网络模型中进行特征提取,输出所述第一图像对应的第三图像特征,其中,所述第三图像特征包括所述第一图像中的图像关键点的特征;
计算模块103,用于计算所述第三图像特征和每个所述目标样本图像特征的相似度,得到所述第三图像特征和至少一个所述目标样本图像特征之间的图像特征相似度;
第七确定模块104,用于从多个所述图像特征相似度中,将大于或等于预设相似度阈值的图像特征相似度对应的样本图像的图像类别,确定为所述第一图像对应的目标图像类别。
在一个实施例中,所述深度神经网络模型包括:卷积层、池化层、关键特征提取层和通道降维层;
所述第三提取模块102具体用于:
所述卷积层用于对所述样本图像进行特征提取,得到第一样本图像特征;
所述池化层用于对所述第一样本图像特征进行降维处理,得到第二样本图像特征;
所述关键特征提取层用于基于注意力机制对所述第二样本图像特征进行特征提取,以得到所述第二样本图像特征中的关键点特征;
所述通道降维层用于对所述关键点特征的通道数进行降维处理,得到所述目标样本图像特征。
采用本申请实施例的装置,通过将待分类的第一图像输入深度神经网络模型中进行特征提取,得到第一图像对应的第三图像特征,进而计算第三图像特征和图像特征检索库中至少一个目标样本图像特征的相似度,得到第三图像特征和每个目标样本图像特征之间的图像特征相似度,进而将大于或等于预设相似度阈值的图像特征相似度对应的样本图像的图像类别,确定为第一图像对应的目标图像类别,实现了对待分类的第一图像的精确分类,若将图像特征检索库应用在上述实施例中的风险防控场景中,则将目标用户的图像作为样本图像来构建图像特征检索库,这样,图像特征检索库中存储的多个图像类别的图像特征,即为多个目标用户对应的图像特征,其中包括第一目标用户对应的第二图像特征。利用深度神经网络模型提取出待识别用户的第一图像特征之后,将待识别用户的第一图像特征和图像特征检索库中的第二图像特征进行相似度计算,得到第一图像特征和每个第二图像特征之间的图像特征相似度,进而确定图像特征相似度大于或等于预设相似度阈值的第二图像特征与第一图像特征对应相同的图像类别,并且,与第一图像特征对应同一图像类别的第二图像特征所对应的第一目标用户,即为与待识别用户具有关联关系的第二目标用户。若确定待识别用户为风险用户,则第二目标用户即为风险用户的群体。可见,将图像特征检索库的构建和使用方式,为风险防控场景提供了有利的技术支撑,使得风险用户及其群体的识别更加精确。
本领域的技术人员应可理解,上述数据处理装置能够用来实现前文所述的数据处理方法,其中的细节描述应与前文方法部分描述类似,为避免繁琐,此处不另赘述。
基于同样的思路,本申请实施例还提供一种数据处理设备,如图11所示。数据处理设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器1101和存储器1102,存储器1102中可以存储有一个或一个以上存储应用程序或数据。其中,存储器1102可以是短暂存储或持久存储。存储在存储器1102的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对数据处理设备中的一系列计算机可执行指令。更进一步地,处理器1101可以设置为与存储器1102通信,在数据处理设备上执行存储器1102中的一系列计算机可执行指令。数据处理设备还可以包括一个或一个以上电源1103,一个或一个以上有线或无线网络接口1104,一个或一个以上输入输出接口1105,一个或一个以上键盘1106。
具体在本实施例中,数据处理设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对数据处理设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取待识别用户的第一用户信息,所述第一用户信息包括第一位置信息和第一图像;
根据所述第一位置信息,确定位于目标位置范围内的至少一个第一目标用户以及所述第一目标用户的第二用户身份信息;
根据每个所述第二用户身份信息和预先构建的目标用户图像集,获取每个所述第一目标用户的第二图像数据,所述目标用户图像集包括多个目标用户的用户身份信息和图像特征;
获取所述第一图像的第一图像特征,根据所述第一图像特征和所述第二图像特征之间的图像特征相似度,确定第二目标用户,其中,所述第二目标用户为所述图像特征相似度大于或等于预设相似度阈值的第一目标用户;
根据所述第一目标用户的数量确定所述待识别用户的第一风险概率值,根据所述第二目标用户的数量确定所述待识别用户的第二风险概率值;
根据所述第一风险概率值和所述第二风险概率值,确定所述待识别用户对应的风险等级。
采用本申请实施例的技术方案,首先获取待识别用户的位置信息和图像,然后根据待识别用户的位置信息,确定出位于目标位置范围内的至少一个第一目标用户的用户身份信息,从而筛选出与待识别用户所在位置(即第一位置信息对应的位置)相匹配的目标位置范围内的第一目标用户。进而,根据每个第一目标用户的用户身份信息和预先构建的目标用户图像集,获取每个第一目标用户的图像特征,由于目标用户图像集包括多个目标用户的用户身份信息和图像特征,因此通过将每个第一目标用户的用户身份信息与目标用户图像集进行匹配,即可快速获取到每个第一目标用户的图像特征,从而根据待识别用户的图像特征和每个第一目标用户的图像特征,确定出第一目标用户中与待识别用户的图像特征之间的图像特征相似度大于或等于预设相似度阈值的第二目标用户,进而根据第一目标用户的数量确定待识别用户的第一风险概率值,根据第二目标用户的数量确定待识别用户的第二风险概率值,最后根据待识别用户对应的第一风险概率值和第二风险概率值确定待识别用户对应的风险等级。可见,该技术方案在对待识别用户进行风险等级的确定过程中,综合考虑了用户所在位置和用户对应的图像特征,而不仅仅是单一地依赖于位置信息或者依赖于图像特征,多种数据的综合计算结果使得待识别用户的风险等级确定结果更加准确。此外,由于第二目标用户是基于与待识别用户的图像特征之间的图像特征相似度筛选出的,而图像特征能够在一定程度上表征各个用户之间的关联性和相似性,因此,该技术方案在识别风险用户的同时,还能够识别出与风险用户之间具有关联性和相似性的其他用户,即具有一定风险性的群体,从而极大地提高了风险用户及其群体的识别力度。
具体在另一实施例中,数据处理设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对数据处理设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取N个样本图像,所述N个样本图像对应多个图像类别,其中,N为大于1的整数;
将所述N个样本图像输入预先训练的深度神经网络模型中进行特征提取,输出每个所述样本图像分别对应的目标样本图像特征,其中,所述目标样本图像特征用于表征所述样本图像中的图像关键点的特征;
将所述N个目标样本图像特征,按照各自对应的图像类别进行分类,并将分类后的所述目标样本图像特征存储至图像特征检索库。
具体在另一实施例中,数据处理设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对数据处理设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取待分类的第一图像和预先构建的图像特征检索库,其中,所述图像特征检索库中存储有多个样本图像对应的目标样本图像特征;
将所述第一图像输入预先训练的深度神经网络模型中进行特征提取,输出所述第一图像对应的第三图像特征,其中,所述第三图像特征包括所述第一图像中的图像关键点的特征;
计算所述第三图像特征和每个所述目标样本图像特征的相似度,得到所述第三图像特征和至少一个所述目标样本图像特征之间的图像特征相似度;
从多个所述图像特征相似度中,将大于或等于预设相似度阈值的图像特征相似度对应的样本图像的图像类别,确定为所述第一图像对应的目标图像类别。
本申请实施例还提出了一种存储介质,该存储介质存储一个或多个计算机程序,该一个或多个计算机程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行上述一种数据处理方法,并具体用于执行:
获取待识别用户的第一用户信息,所述第一用户信息包括第一位置信息和第一图像;
根据所述第一位置信息,确定位于目标位置范围内的至少一个第一目标用户以及所述第一目标用户的第二用户身份信息;
根据每个所述第二用户身份信息和预先构建的目标用户图像集,获取每个所述第一目标用户的第二图像特征,所述目标用户图像集包括多个目标用户的用户身份信息和图像特征;
获取所述第一图像的第一图像特征,根据所述第一图像特征和所述第二图像特征之间的图像特征相似度,确定第二目标用户,其中,所述第二目标用户为所述图像特征相似度大于或等于预设相似度阈值的第一目标用户;
根据所述第一目标用户的数量确定所述待识别用户的第一风险概率值,根据所述第二目标用户的数量确定所述待识别用户的第二风险概率值;
根据所述第一风险概率值和所述第二风险概率值,确定所述待识别用户对应的风险等级。采用本申请实施例的技术方案,首先获取待识别用户的位置信息和图像,然后根据待识别用户的位置信息,确定出位于目标位置范围内的至少一个第一目标用户的用户身份信息,从而筛选出与待识别用户所在位置(即第一位置信息对应的位置)相匹配的目标位置范围内的第一目标用户。进而,根据每个第一目标用户的用户身份信息和预先构建的目标用户图像集,获取每个第一目标用户的图像特征,由于目标用户图像集包括多个目标用户的用户身份信息和图像特征,因此通过将每个第一目标用户的用户身份信息与目标用户图像集进行匹配,即可快速获取到每个第一目标用户的图像特征,从而根据待识别用户的图像特征和每个第一目标用户的图像特征,确定出第一目标用户中与待识别用户的图像特征之间的图像特征相似度大于或等于预设相似度阈值的第二目标用户,进而根据第一目标用户的数量确定待识别用户的第一风险概率值,根据第二目标用户的数量确定待识别用户的第二风险概率值,最后根据待识别用户对应的第一风险概率值和第二风险概率值确定待识别用户对应的风险等级。可见,该技术方案在对待识别用户进行风险等级的确定过程中,综合考虑了用户所在位置和用户对应的图像特征,而不仅仅是单一地依赖于位置信息或者依赖于图像特征,多种数据的综合计算结果使得待识别用户的风险等级确定结果更加准确。此外,由于第二目标用户是基于与待识别用户的图像特征之间的图像特征相似度筛选出的,而图像特征能够在一定程度上表征各个用户之间的关联性和相似性,因此,该技术方案在识别风险用户的同时,还能够识别出与风险用户之间具有关联性和相似性的其他用户,即具有一定风险性的群体,从而极大地提高了风险用户及其群体的识别力度。
本申请实施例还提出了一种存储介质,该存储介质存储一个或多个计算机程序,该一个或多个计算机程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行上述一种数据处理方法,并具体用于执行:
获取N个样本图像,所述N个样本图像对应多个图像类别,其中,N为大于1的整数;
将所述N个样本图像输入预先训练的深度神经网络模型中进行特征提取,输出每个所述样本图像分别对应的目标样本图像特征,其中,所述目标样本图像特征用于表征所述样本图像中的图像关键点的特征;
将所述N个目标样本图像特征,按照各自对应的图像类别进行分类,并将分类后的所述目标样本图像特征存储至图像特征检索库。
本申请实施例还提出了一种存储介质,该存储介质存储一个或多个计算机程序,该一个或多个计算机程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行上述一种数据处理方法,并具体用于执行:
获取待分类的第一图像和预先构建的图像特征检索库,其中,所述图像特征检索库中存储有多个样本图像对应的目标样本图像特征;
将所述第一图像输入预先训练的深度神经网络模型中进行特征提取,输出所述第一图像对应的第三图像特征,其中,所述第三图像特征包括所述第一图像中的图像关键点的特征;
计算所述第三图像特征和每个所述目标样本图像特征的相似度,得到所述第三图像特征和至少一个所述目标样本图像特征之间的图像特征相似度;
从多个所述图像特征相似度中,将大于或等于预设相似度阈值的图像特征相似度对应的样本图像的图像类别,确定为所述第一图像对应的目标图像类别。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (18)
1.一种数据处理方法,其特征在于,包括:
获取待识别用户的第一用户信息,所述第一用户信息包括第一位置信息和第一图像;
根据所述第一位置信息,确定位于目标位置范围内的至少一个第一目标用户以及所述第一目标用户的第二用户身份信息;
根据每个所述第二用户身份信息和预先构建的目标用户图像集,获取每个所述第一目标用户的第二图像特征,所述目标用户图像集包括多个目标用户的用户身份信息和图像特征;
获取所述第一图像的第一图像特征,根据所述第一图像特征和所述第二图像特征之间的图像特征相似度,确定第二目标用户,其中,所述第二目标用户为所述图像特征相似度大于或等于预设相似度阈值的第一目标用户;根据所述第一目标用户的数量确定所述待识别用户的第一风险概率值,根据所述第二目标用户的数量确定所述待识别用户的第二风险概率值;
根据所述第一风险概率值和所述第二风险概率值,确定所述待识别用户对应的风险等级。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一位置信息,确定位于目标位置范围内的至少一个第一目标用户,包括:
根据所述第一位置信息,确定所述目标位置范围;
获取所述多个目标用户的位置信息;
若所述目标用户的位置信息与所述目标位置范围相匹配,则将所述目标用户确定为所述第一目标用户。
3.根据权利要求2所述的方法,其特征在于,在将所述目标用户确定为所述第一目标用户之后,所述根据所述第一位置信息,确定位于目标位置范围内的至少一个第一目标用户以及所述第一目标用户的第二用户身份信息,还包括:
确定所述第一目标用户的位置信息;
根据各所述目标用户分别对应的位置信息和用户身份信息,确定与所述第一目标用户的位置信息相对应的用户身份信息,作为所述第二用户身份信息。
4.根据权利要求2所述的方法,其特征在于,所述根据每个所述第二用户身份信息和预先构建的目标用户图像集,获取每个所述第一目标用户的第二图像特征之前,所述方法还包括:
获取所述多个目标用户分别对应的目标图像;
将所述目标图像输入预先训练的深度神经网络模型中进行特征提取,得到所述目标图像对应的图像特征;
将所述目标图像对应的图像特征添加至预先构建的目标用户地图中,并与对应的所述目标用户的用户身份信息和/或位置信息关联存储,得到所述目标用户图像集,其中,所述目标用户地图中包括所述多个目标用户的用户身份信息和位置信息。
5.根据权利要求4所述的方法,其特征在于,所述获取所述第一图像的第一图像特征,根据所述第一图像特征和所述第二图像特征之间的图像特征相似度,确定第二目标用户,包括:
将所述第一图像输入所述深度神经网络模型中进行特征提取,得到所述第一图像对应的第一图像特征;
计算所述第一图像特征和所述第二图像特征之间的欧式距离,根据所述欧式距离确定所述图像特征相似度;
根据所述图像特征相似度,确定所述第二目标用户。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取多个待筛选用户分别对应的第二位置信息,所述第二位置信息包括所述待筛选用户的地理位置信息、所述待筛选用户所使用的电子设备的地理位置信息、所述电子设备的IP地址中的至少一项;
若所述第二位置信息满足预设筛选条件,则将所述第二位置信息对应的待筛选用户确定为目标用户,所述预设筛选条件包括以下至少一项:所述第二位置信息对应的位置与所述待筛选用户的驻留位置不匹配、所述第二位置信息的信息内容不完整、所述第二位置信息中包含预设异常符号。
7.根据权利要求1所述的方法,其特征在于,所述根据所述第一目标用户的数量确定所述待识别用户的第一风险概率值,包括:
确定所述第一目标用户的数量;
若所述第一目标用户的数量大于第一预设数量阈值,则将第一预设概率值确定为所述待识别用户对应的第一风险概率值;
若所述第一目标用户的数量小于或等于所述第一预设数量阈值,则计算所述第一目标用户的数量与第三预设数量之间的第一占比,将所述第一占比确定为待识别用户对应的第一风险概率值;
其中,所述第一预设概率值大于所述第一占比。
8.根据权利要求1所述的方法,其特征在于,所述根据所述第二目标用户的数量确定所述待识别用户的第二风险概率值,包括:
确定所述第二目标用户的数量;
若所述第二目标用户的数量大于第二预设数量阈值,则将第二预设概率值确定为所述待识别用户对应的第二风险概率值;
若所述第二目标用户的数量小于或等于所述第二预设数量阈值,则计算所述第二目标用户的数量与第四预设数量之间的第二占比,将所述第二占比确定为待识别用户对应的第二风险概率值;
其中,所述第二预设概率值大于所述第二占比。
9.根据权利要求1所述的方法,其特征在于,所述根据所述第一风险概率值和所述第二风险概率值,确定所述待识别用户对应的风险等级,包括:
根据所述第一风险概率值、所述第二风险概率值,以及所述第一风险概率值和所述第二风险概率值分别对应的权重,确定所述待识别用户的风险概率值;
若所述风险概率值大于或等于预设风险阈值,则确定所述待识别用户对应的风险等级为目标风险等级,其中,所述目标风险等级用于表征所述待识别用户为风险用户。
10.根据权利要求1所述的方法,其特征在于,所述确定所述待识别用户对应的风险等级之后,所述方法还包括:
若所述待识别用户对应的风险等级为目标风险等级,则将所述待识别用户的第一用户信息存储至所述目标用户图像集,以更新所述目标用户图像集。
11.根据权利要求1或6所述的方法,其特征在于,所述目标用户满足以下至少一项条件:
在第一指定时长内,使用同一设备的注册次数大于或等于第一预设阈值;
在第二指定时长内,使用同一设备的登录次数大于或等于第二预设阈值;
在第三指定时长内,使用同一设备的登录账号的数量大于或等于第三预设阈值;
在第四指定时长内,使用同一设备对其他用户的邀请次数大于或等于第四预设阈值;
在第五指定时长内,使用同一设备的实名认证次数大于或等于第五预设阈值;
在第六指定时长内,使用同一设备执行指定类业务的次数大于或等于第六预设阈值。
12.一种数据处理方法,其特征在于,包括:
获取N个样本图像,所述N个样本图像对应多个图像类别,其中,N为大于1的整数;所述样本图像包括目标用户的活体图像和背景图像;
将所述N个样本图像中的所述活体图像去除,得到N个仅包括背景图像的样本图像;将所述N个仅包括背景图像的样本图像输入预先训练的深度神经网络模型中进行特征提取,输出每个所述仅包括背景图像的样本图像分别对应的目标样本图像特征,其中,所述目标样本图像特征用于表征所述仅包括背景图像的样本图像中的图像关键点的特征;
将所述N个目标样本图像特征,按照各自对应的图像类别进行分类,并将分类后的所述目标样本图像特征存储至图像特征检索库;其中,所述N个目标样本图像特征中图像特征相似度大于或等于预设相似度阈值的目标样本图像特征对应相同的图像类别。
13.根据权利要求12所述的方法,其特征在于,所述深度神经网络模型包括:卷积层、池化层、关键特征提取层和通道降维层;
所述将所述N个样本图像输入预先训练的深度神经网络模型中进行特征提取,输出每个所述样本图像分别对应的目标样本图像特征,包括:
所述卷积层用于对所述样本图像进行特征提取,得到第一样本图像特征;
所述池化层用于对所述第一样本图像特征进行降维处理,得到第二样本图像特征;
所述关键特征提取层用于基于注意力机制对所述第二样本图像特征进行特征提取,以得到所述第二样本图像特征中的关键点特征;
所述通道降维层用于对所述关键点特征的通道数进行降维处理,得到所述目标样本图像特征。
14.一种数据处理方法,其特征在于,包括:
获取待分类的第一图像和预先构建的图像特征检索库,其中,所述图像特征检索库中存储有多个仅包括背景图像的样本图像对应的目标样本图像特征;每个所述目标样本图像特征按照各自对应的图像类别进行分类存储,多个所述目标样本图像特征中图像特征相似度大于或等于预设相似度阈值的目标样本图像特征对应相同的图像类别;
将所述第一图像输入预先训练的深度神经网络模型中进行特征提取,输出所述第一图像对应的第三图像特征,其中,所述第三图像特征包括所述第一图像中的图像关键点的特征;
计算所述第三图像特征和每个所述目标样本图像特征的相似度,得到所述第三图像特征和至少一个所述目标样本图像特征之间的图像特征相似度;
从所述第三图像特征和至少一个所述目标样本图像特征之间的图像特征相似度中,将大于或等于预设相似度阈值的图像特征相似度对应的样本图像的图像类别,确定为所述第一图像对应的目标图像类别。
15.根据权利要求14所述的方法,其特征在于,所述深度神经网络模型包括:卷积层、池化层、关键特征提取层和通道降维层;
所述将所述第一图像输入预先训练的深度神经网络模型中进行特征提取,得到所述第一图像对应的第一图像特征,包括:
所述卷积层用于对所述样本图像进行特征提取,得到第一样本图像特征;
所述池化层用于对所述第一样本图像特征进行降维处理,得到第二样本图像特征;
所述关键特征提取层用于基于注意力机制对所述第二样本图像特征进行特征提取,以得到所述第二样本图像特征中的关键点特征;
所述通道降维层用于对所述关键点特征的通道数进行降维处理,得到所述目标样本图像特征。
16.一种数据处理装置,其特征在于,包括:
第一获取模块,用于获取待识别用户的第一用户信息,所述第一用户信息包括第一位置信息和第一图像;
第一确定模块,用于根据所述第一位置信息,确定位于目标位置范围内的至少一个第一目标用户以及所述第一目标用户的第二用户身份信息;
第二获取模块,用于根据所述第二用户身份信息和预先构建的目标用户图像集,获取每个所述第一目标用户的第二图像特征,所述目标用户图像集包括多个目标用户的用户身份信息和图像特征;
第二确定模块,用于根据所述第一图像特征和所述第二图像特征之间的图像特征相似度,确定第二目标用户,其中,所述第二目标用户为所述图像特征相似度大于或等于预设相似度阈值的第一目标用户;
第三确定模块,用于根据所述第一目标用户的数量确定所述待识别用户的第一风险概率值,根据所述第二目标用户的数量确定所述待识别用户的第二风险概率值;
第四确定模块,用于根据所述第一风险概率值和所述第二风险概率值,确定所述待识别用户对应的风险等级。
17.一种数据处理设备,其特征在于,所述设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令被配置由所述处理器执行,所述可执行指令用于执行如权利要求1-15任一项所述的数据处理方法。
18.一种存储介质,其特征在于,所述存储介质用于存储计算机可执行指令,所述计算机可执行指令使得计算机执行如权利要求1-15任一项所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210622202.4A CN115115843B (zh) | 2022-06-02 | 2022-06-02 | 数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210622202.4A CN115115843B (zh) | 2022-06-02 | 2022-06-02 | 数据处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115115843A CN115115843A (zh) | 2022-09-27 |
CN115115843B true CN115115843B (zh) | 2023-08-22 |
Family
ID=83326769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210622202.4A Active CN115115843B (zh) | 2022-06-02 | 2022-06-02 | 数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115115843B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109508694A (zh) * | 2018-12-10 | 2019-03-22 | 上海众源网络有限公司 | 一种人脸识别方法及识别装置 |
CN110069988A (zh) * | 2019-01-31 | 2019-07-30 | 中国平安财产保险股份有限公司 | 基于多维数据的ai驾驶风险分析方法、服务器及存储介质 |
CN110489951A (zh) * | 2019-07-08 | 2019-11-22 | 招联消费金融有限公司 | 风险识别的方法、装置、计算机设备和存储介质 |
CN111914769A (zh) * | 2020-08-06 | 2020-11-10 | 腾讯科技(深圳)有限公司 | 用户合法性判定方法、装置、计算机可读存储介质及设备 |
CN112132099A (zh) * | 2020-09-30 | 2020-12-25 | 腾讯科技(深圳)有限公司 | 身份识别方法、掌纹关键点检测模型训练方法和装置 |
CN112926515A (zh) * | 2021-03-26 | 2021-06-08 | 支付宝(杭州)信息技术有限公司 | 活体模型训练方法和装置 |
CN113076533A (zh) * | 2020-01-03 | 2021-07-06 | 中国移动通信集团广东有限公司 | 一种业务处理方法及装置 |
CN113094682A (zh) * | 2021-04-12 | 2021-07-09 | 中国工商银行股份有限公司 | 反欺诈身份识别方法及装置 |
CN114238904A (zh) * | 2021-12-08 | 2022-03-25 | 马上消费金融股份有限公司 | 身份识别方法、双通道超分模型的训练方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11170484B2 (en) * | 2017-09-19 | 2021-11-09 | Aic Innovations Group, Inc. | Recognition of suspicious activities in medication administration |
-
2022
- 2022-06-02 CN CN202210622202.4A patent/CN115115843B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109508694A (zh) * | 2018-12-10 | 2019-03-22 | 上海众源网络有限公司 | 一种人脸识别方法及识别装置 |
CN110069988A (zh) * | 2019-01-31 | 2019-07-30 | 中国平安财产保险股份有限公司 | 基于多维数据的ai驾驶风险分析方法、服务器及存储介质 |
CN110489951A (zh) * | 2019-07-08 | 2019-11-22 | 招联消费金融有限公司 | 风险识别的方法、装置、计算机设备和存储介质 |
CN113076533A (zh) * | 2020-01-03 | 2021-07-06 | 中国移动通信集团广东有限公司 | 一种业务处理方法及装置 |
CN111914769A (zh) * | 2020-08-06 | 2020-11-10 | 腾讯科技(深圳)有限公司 | 用户合法性判定方法、装置、计算机可读存储介质及设备 |
CN112132099A (zh) * | 2020-09-30 | 2020-12-25 | 腾讯科技(深圳)有限公司 | 身份识别方法、掌纹关键点检测模型训练方法和装置 |
CN112926515A (zh) * | 2021-03-26 | 2021-06-08 | 支付宝(杭州)信息技术有限公司 | 活体模型训练方法和装置 |
CN113094682A (zh) * | 2021-04-12 | 2021-07-09 | 中国工商银行股份有限公司 | 反欺诈身份识别方法及装置 |
CN114238904A (zh) * | 2021-12-08 | 2022-03-25 | 马上消费金融股份有限公司 | 身份识别方法、双通道超分模型的训练方法及装置 |
Non-Patent Citations (1)
Title |
---|
基于概率图隐马尔科夫随机场与Google InceptionNet V3模型的图像分类识别;焦阳等;《数字化用户》(第16期);第223-226页 * |
Also Published As
Publication number | Publication date |
---|---|
CN115115843A (zh) | 2022-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106709800B (zh) | 一种基于特征匹配网络的社团划分方法和装置 | |
CN108111489B (zh) | Url攻击检测方法、装置以及电子设备 | |
CN107577945B (zh) | Url攻击检测方法、装置以及电子设备 | |
CN112348117B (zh) | 场景识别方法、装置、计算机设备和存储介质 | |
CN108805583B (zh) | 基于地址映射的电商欺诈检测方法、装置、设备及介质 | |
CN110688974B (zh) | 一种身份识别方法及装置 | |
CN109299594B (zh) | 身份验证方法及装置 | |
CN109002784B (zh) | 街景识别方法和系统 | |
CN112818995B (zh) | 图像分类方法、装置、电子设备及存储介质 | |
US20200218772A1 (en) | Method and apparatus for dynamically identifying a user of an account for posting images | |
CN111126623B (zh) | 一种模型更新方法、装置及设备 | |
CN112819073B (zh) | 分类网络训练、图像分类方法、装置和电子设备 | |
CN111090807A (zh) | 一种基于知识图谱的用户识别方法及装置 | |
CN111008335A (zh) | 一种信息处理方法、装置、设备及存储介质 | |
CN112818868B (zh) | 基于行为序列特征数据的违规用户识别方法和装置 | |
US10410095B2 (en) | Method and system for identifying a payment card design | |
CN111260372B (zh) | 资源转移用户群确定方法、装置、计算机设备和存储介质 | |
CN115115843B (zh) | 数据处理方法及装置 | |
CN110097258B (zh) | 一种用户关系网络建立方法、装置及计算机可读存储介质 | |
CN110717817A (zh) | 贷前审核方法及装置、电子设备和计算机可读存储介质 | |
CN113448876B (zh) | 一种业务测试方法、装置、计算机设备及存储介质 | |
CN112100604A (zh) | 终端设备信息处理方法、装置 | |
CN112967044B (zh) | 一种支付业务的处理方法及装置 | |
CN117993910A (zh) | 异常交易应对策略的验证方法及相关装置 | |
CN111126503B (zh) | 一种训练样本的生成方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |