CN111783039A - 风险确定方法、装置、计算机系统和存储介质 - Google Patents

风险确定方法、装置、计算机系统和存储介质 Download PDF

Info

Publication number
CN111783039A
CN111783039A CN202010616218.5A CN202010616218A CN111783039A CN 111783039 A CN111783039 A CN 111783039A CN 202010616218 A CN202010616218 A CN 202010616218A CN 111783039 A CN111783039 A CN 111783039A
Authority
CN
China
Prior art keywords
application
risk
application program
information
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010616218.5A
Other languages
English (en)
Other versions
CN111783039B (zh
Inventor
许韩晨玺
贾壮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010616218.5A priority Critical patent/CN111783039B/zh
Publication of CN111783039A publication Critical patent/CN111783039A/zh
Application granted granted Critical
Publication of CN111783039B publication Critical patent/CN111783039B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Abstract

本申请公开了一种风险确定方法、装置、计算机系统和存储介质,涉及云计算技术领域。具体实现方案为:获取用户的应用程序列表,其中,应用程序列表中包括至少一个第一应用程序信息;将应用程序列表中的每个第一应用程序信息与N个应用程序集合中的每个第二应用程序信息分别进行匹配,得到匹配结果,其中,每个应用程序集合中包括至少一个第二应用程序信息,N为大于1的正整数;根据匹配结果确定用户的风险特征向量,其中,用户的风险特征向量的维度为N维;以及利用风险预测模型处理用户的风险特征向量,以便确定用户的风险信息。通过本申请公开的技术方案,可以充分挖掘用户数据在金融风控方面的价值,实现数据资产价值化。

Description

风险确定方法、装置、计算机系统和存储介质
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种风险确定方法、 一种风险确定装置、一种计算机系统和一种计算机可读存储介质。
背景技术
风险控制,或简称为风控,对于信贷和保险等金融业务至关重要。 风控的目的在于通过对申请业务的用户相关信息进行分析,确定用户 的逾期率、欺诈率等不良行为的可能性,从而决定对该用户的申请进 行批准或者驳回,以及申请被批准后如何定价(如贷款利率、保险赔 付率等)。因此,有效地分析用户相关信息对于风控场景至关重要。
在实现本公开的过程中,发明人发现,随着时间的不断推移,用 户相关信息也越来越多。如何对用户相关信息进行分析,并形成有价 值的用户特征,对风控的判断等相关方面具有较为重要的意义。
发明内容
有鉴于此,本公开提供了一种风险确定方法、一种风险确定装置、 一种计算机系统和一种计算机可读存储介质。
本公开的一个方面提供了一种风险确定方法,包括:获取用户的 应用程序列表,其中,上述应用程序列表中包括至少一个第一应用程 序信息;将上述应用程序列表中的每个上述第一应用程序信息与N个 应用程序集合中的每个第二应用程序信息分别进行匹配,得到匹配结 果,其中,每个上述应用程序集合中包括至少一个第二应用程序信息, N为大于1的正整数;根据上述匹配结果确定上述用户的风险特征向 量,其中,上述用户的风险特征向量的维度为N维;以及利用风险预 测模型处理上述用户的风险特征向量,以便确定上述用户的风险信息。
本公开的另一个方面提供了一种风险确定装置,包括:第一获取 模块、匹配模块、第一确定模块和处理模块。
第一获取模块,用于获取用户的应用程序列表,其中,上述应用 程序列表中包括至少一个第一应用程序信息。
匹配模块,用于将上述应用程序列表中的每个上述第一应用程序 信息与N个应用程序集合中的每个第二应用程序信息分别进行匹配, 得到匹配结果,其中,每个上述应用程序集合中包括至少一个第二应 用程序信息,N为大于1的正整数。
第一确定模块,用于根据上述匹配结果确定上述用户的风险特征 向量,其中,上述用户的风险特征向量的维度为N维。
处理模块,用于利用风险预测模型处理上述用户的风险特征向量, 以便确定上述用户的风险信息。
本公开的另一个方面提供了一种计算机系统,包括:一个或多个 处理器;存储器,用于存储一个或多个程序,其中,当上述一个或多 个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器 实现如上所述的方法。
本公开的另一个方面提供了一种计算机可读存储介质,其上存储 有可执行指令,该指令被处理器执行时使处理器实现如上所述的方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括 计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
根据本公开的实施例,可以充分挖掘用户数据在金融风控方面的 价值,从而更好地实现数据资产价值化,支撑和辅助金融风控方面的 相关项目实践和产品建设。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其 他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的可以应用风险确定方法及装 置的示例性系统架构;
图2示意性示出了根据本公开实施例的风险确定方法方法的流程图;
图3示意性示出了根据本公开实施例的将应用程序列表中的每个第 一应用程序信息与N个应用程序集合中的每个第二应用程序信息分别 进行匹配的示意图;
图4示意性示出了根据本公开实施例的生成N个应用程序集合的流 程图;
图5示意性示出了根据本公开实施例的对多个样本用户的应用程序 列表中的第二应用程序信息进行聚类分析的流程图;
图6示意性示出了根据本公开实施例的将每个风险等级中的第二应 用程序信息聚类为K个类簇的示意图;
图7示意性示出了根据本公开实施例的生成样本用户的风险特征向 量的流程图;
图8示意性示出了根据本公开实施例的风险确定装置的框图;以及
图9示意性示出了根据本公开实施例的适于实现风险确定方法的计 算机系统的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些 描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述 中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全 面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情 况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术 的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本 公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、 操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、 步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人 员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解 释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于 刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下, 一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释 (例如,“具有A、B和C中至少一个的系统”应包括但不限于单独 具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有 B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C 等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术 人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中 至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具 有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C 的系统等)。
随着终端设备(例如,智能手机和笔记本电脑等)的普及和广泛 使用,用户终端设备中的应用程序的类别与数量也日益增加。对于每 个用户而言,其终端设备中所安装和使用的应用程序可以较为有效地 刻画用户的一些个人属性与特质。
例如,知识类应用程序(扇贝单词、知乎等)一般可以预示用户 的受教育水平;电商类和团购类应用程序(如淘宝、拼多多等)可以 反映用户的消费水平和消费习惯;借贷类应用程序(马上金融、拍拍 贷等)可以用来推断用户的经济状况和借贷频率。另外,由于互联网 金融行业的发展,借贷类应用程序种类繁多,在信用较差(逾期风险 较高)的用户中,借贷类应用程序的数量相对较多。
因此,应用程序列表中具有与用户特质相关性较强的信息,可以 用来作为用户特征进行建模,并对用户的风险信息进行评估。
本公开的实施例提供了一种风险确定方法及装置,该方法包括:获 取用户的应用程序列表,其中,应用程序列表中包括至少一个第一应用 程序信息;将应用程序列表中的每个第一应用程序信息与N个应用程序 集合中的每个第二应用程序信息分别进行匹配,得到匹配结果,其中, 每个应用程序集合中包括至少一个第二应用程序信息,N为大于1的正整数;根据匹配结果确定用户的风险特征向量,其中,用户的风险特征 向量的维度为N维;以及利用风险预测模型处理用户的风险特征向量, 以便确定用户的风险信息。
图1示意性示出了根据本公开实施例的可以应用风险确定方法及装 置的示例性系统架构。需要注意的是,图1所示仅为可以应用本公开实 施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容, 但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的系统架构100可以包括终端设备101、 102、103,网络104和服务器105。网络104用以在终端设备101、102、 103和服务器105之间提供通信链路的介质。网络104可以包括各种连 接类型,例如有线和/或无线通信链路等等。
用户可以使用终端设备101、102、103通过网络104与服务器105 交互,以接收或发送消息等。终端设备101、102、103上可以安装有各 种通讯客户端应用,例如购物类应用、借贷类应用程序、网页浏览器应 用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅 为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各 种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和 台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设 备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。 后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将 处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反 馈给终端设备。
需要说明的是,本公开实施例所提供的风险确定方法一般可以由服 务器105执行。相应地,本公开实施例所提供的风险确定装置一般可以 设置于服务器105中。本公开实施例所提供的风险确定方法也可以由不 同于服务器105且能够与终端设备101、102、103和/或服务器105通信 的服务器或服务器集群执行。相应地,本公开实施例所提供的风险确定 装置也可以设置于不同于服务器105且能够与终端设备101、102、103 和/或服务器105通信的服务器或服务器集群中。或者,本公开实施例所 提供的风险确定方法也可以由终端设备101、102、或103执行,或者也 可以由不同于终端设备101、102、或103的其他终端设备执行。相应地, 本公开实施例所提供的风险确定装置也可以设置于终端设备101、102、 或103中,或设置于不同于终端设备101、102、或103的其他终端设备 中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性 的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2示意性示出了根据本公开实施例的风险确定方法方法的流程图。
如图2所示,该方法包括操作S210~S240。
在操作S210,获取用户的应用程序列表,其中,应用程序列表中 包括至少一个第一应用程序信息。
根据本公开的实施例,用户的应用程序列表中的第一应用程序信息 与用户具有关联关系,可以用于刻画用户的一些个人属性与特质。第一 应用程序信息例如可以是用户使用的应用程序的标识信息。用户的应用 程序列表可以包括用户使用的终端设备上安装的应用程序信息,也可以 包括用户使用的终端设备上运行的但没有安装的应用程序信息。
在操作S220,将应用程序列表中的每个第一应用程序信息与N个 应用程序集合中的每个第二应用程序信息分别进行匹配,得到匹配结果, 其中,每个应用程序集合中包括至少一个第二应用程序信息,N为大于 1的正整数。
根据本公开的实施例,N个应用程序集合可以是预先设置得到的, 其中,N可以根据实际情况进行设定。例如,可以根据风险特征向量的 维数确定N,或者,也可以根据风险等级的数量确定N。例如,风险等 级可以包括低风险、较低风险、高风险、极高风险4个等级,那么可 以确定N等于4或者4的倍数等,当然,本公开并不限于此,每个应 用程序集合可以分别对应一个风险等级。根据本公开的实施例,每个应 用程序集合中可以包括一个或多个第二应用程序。
图3示意性示出了根据本公开实施例的将应用程序列表中的每个 第一应用程序信息与N个应用程序集合中的每个第二应用程序信息分别 进行匹配的示意图。
如图3所示,用户的应用程序列表301中包括应用程序1~应用程序 5。以N等于3为例,应用程序集合302中包括应用程序a~应用程序c, 应用程序集合303中包括应用程序d~应用程序g,应用程序集合304 中包括应用程序u~应用程序y。
将用户的应用程序列表中的每个第一应用程序信息与N个应用程序 集合中的每个第二应用程序信息分别进行匹配可以按照如下方式。
首先,将应用程序列表301中的每个第一应用程序先与第一个应 用程序集合302中的第二应用程序进行匹配,计算应用程序列表301 中与应用程序集合302中的第二应用程序匹配的第一应用程序的第一 数量。例如,第一数量为2。
然后,可以将应用程序列表301中没有匹配的第一应用程序与第 二个应用程序集合303中的第二应用程序进行匹配,计算应用程序列 表301中与应用程序集合303中的第二应用程序匹配的第一应用程序 的第二数量。例如,第二数量为1。
随后,可以将应用程序列表301中没有匹配的第一应用程序与第 三个应用程序集合304中的第二应用程序进行匹配,计算应用程序列 表301中与应用程序集合304中的第二应用程序匹配的第一应用程序 的第三数量。例如,第三数量为2。
根据本公开的上述实施例,匹配结果为与应用程序集合302中的 第二应用程序匹配的第一数量为2,与应用程序集合303中的第二应 用程序匹配的第二数量为1,与应用程序集合304中的第二应用程序 匹配的的第三数量为2。
根据本公开的实施例,针对N个应用程序集合,可以分别计算应 用程序列表中与第i个应用程序集合中的第二应用程序相匹配的第一 应用程序的第i数量,其中,i大于等于1且小于等于N。
根据本公开的上述实施例,在分别计算应用程序列表中与第i个 应用程序集合中的第二应用程序相匹配的第一应用程序的第i数量时, 可以采用上述对图3的描述方式,在此不再赘述。
在操作S230,根据匹配结果确定用户的风险特征向量,其中,用 户的风险特征向量的维度为N维。
根据本公开的实施例,每个第i数量可以代表用户的风险特征向 量中一个维度上的数值。其中,第i数量的值可以等于0,也可以大于 0,具体数值与第i个应用程序集合中的第二应用程序相匹配的第一应 用程序的数量相关。
根据本公开的上述实施例,以N等于3为例,例如,用户的风险 特征向量例如可以是(2,1,2)。
在操作S240,利用风险预测模型处理用户的风险特征向量,以便 确定用户的风险信息。
根据本公开的实施例,风险预测模型可以是分类模型,例如可以是 支持向量机,神经网络模型等等。用户的风险信息例如可以是用户属于 不同风险等级的概率。
根据本公开的实施例,通过将用户的应用程序列表中的每个第一 应用程序信息与N个应用程序集合中的每个第二应用程序信息分别进 行匹配得到匹配结果,根据匹配结果确定该用户的风险特征向量,并 利用风险预测模型处理用户的风险特征向量,从而可以确定用户的风 险信息。由于用户的应用程序列表中的应用程序可以较为有效地刻画 用户的一些个人属性与特质,通过将应用程序列表中的应用程序信息 与应用程序集合中的每个应用程序信息分别进行匹配,根据匹配结果 确定用户的风险特征向量,可以用来作为用户特征进行风险预测,充 分挖掘了用户数据在金融风控方面的价值,从而更好地实现数据资产 价值化,以便支撑和辅助金融风控方面的相关项目实践和产品建设。 所以至少部分地克服了采用相关技术确定的用户风险特征用于风险评 估导致评估效果差的技术问题,进而达到了提高风险评估准确度的技 术效果。
根据本公开的实施例,在确定新用户的风险信息之前,可以利用样 本用户集获得N个应用程序集合,其中,不同应用程序集合中的第二应 用程序的特征可以不同。
根据本公开的实施例,例如,可以利用具有风险标签(如逾期、欺 诈等)的用户对应的应用程序列表,以已有风险标签作为监督,对应用 程序列表进行挖掘,生成N个应用程序集合。进一步的,还可以利用N 个应用程序集合对每个样本用户的应用程序列表进行特征化,形成适用 于风控场景的风险特征向量。利用每个样本用户的风险特征向量进行建模,并对新客户风险信息进行预测。
下面参考图4~图9,结合具体实施例对图2所示的方法做进一步说 明。
图4示意性示出了根据本公开实施例的生成N个应用程序集合的流 程图。
如图4所示,该方法包括操作S410~S430。
在操作S410,获取具有标签的多个样本用户中每个样本用户的应 用程序列表。
根据本公开的实施例,样本用户的标签指示了样本用户的风险信 息。样本用户的标签例如可以是有风险用户和无风险用户。样本用户 的数量可以根据模型精度和训练耗时等因素进行确定。
在操作S420,对多个样本用户的应用程序列表中的第二应用程序 信息进行聚类分析,得到N个类簇。
根据本公开的实施例,利用应用程序的产品描述对应用程序进行 聚类,将应用程序分成不同功能的集合,从而将同类或类似的应用程 序集中在一个簇中。
根据本公开的实施例,例如,对多个样本用户的应用程序列表中 的第二应用程序信息进行聚类分析可以采用如下方式。
首先,获取每个第二应用程序信息的描述,根据每个第二应用程 序信息的描述生成每个第二应用程序信息的向量;对每个第二应用程 序信息的向量进行聚类分析,得到N个类簇。
在操作S430,将N个类簇中的每个类簇作为一个应用程序集合, 得到N个应用程序集合。
根据本公开的实施例,通过对第二应用程序信息的向量进行聚类 分析,使得同一个应用程序集合中的应用程序具有相同或相似的特征 属性。
根据本公开的实施例,根据每个第二应用程序信息的描述生成每 个第二应用程序信息的向量包括:可以针对每个第二应用程序信息, 对第二应用程序信息的描述进行分词处理,得到多个词;确定多个词 中每个词的词向量,得到多个词向量;以及根据多个词向量生成第二 应用程序信息的向量。
根据本公开的实施例,以第二应用程序为淘宝为例,淘宝的描述 为:满足生活消费和线上购物需求的软件。根据本公开的实施例,可 以对上述描述进行分词处理,得到“满足”、“生活消费”、“线上购物”、 “需求”、“软件”这些词。根据本公开的实施例,可以对每个词进行 向量化,得到每个词的词向量,最后根据多个词向量生成关于淘宝的 向量。
根据本公开的实施例,根据多个词向量生成第二应用程序信息的 向量包括:计算多个词向量的均值,然后将均值作为第二应用程序信 息的向量。
根据本公开的实施例,例如,可以将所有词向量在对应维度上的 数值进行加权求和,然后求每个维度上的平均数,将计算得到的向量 作为第二应用程序信息的向量。
根据本公开的实施例,通过将样本用户的风险标签作为监督,对 多个样本用户的应用程序列表中的第二应用程序信息划分为M个风险 等级,使得不同风险等级中的应用程序信息具有不同的风控场景的含 义,例如低风险、较低风险、高风险、极高风险等,并且再对每个风 险等级中的第二应用程序信息进行聚类。
图5示意性示出了根据本公开实施例的对多个样本用户的应用程序 列表中的第二应用程序信息进行聚类分析的流程图。
如图5所示,对多个样本用户的应用程序列表中的第二应用程序信 息进行聚类分析,得到N个类簇包括操作S510~S530。
在操作S510,计算每个第二应用程序信息的风险概率。
根据本公开的实施例,例如,可以按照如下方式计算每个第二应 用程序信息的风险概率。
针对每个第二应用程序信息,确定在多个样本用户的应用程序列 表中,记录有第二应用程序信息的应用程序列表的第一列表数量,以 及确定在多个样本用户的应用程序列表中,记录有第二应用程序信息 的应用程序列表且标签指示有风险的第二列表数量,将第二列表数量 与第一列表数量的比值作为第二应用程序信息的风险概率。
根据本公开的实施例,例如,使用了1000个样本用户的应用程序 列表。该1000个样本用户中包括200个有风险用户和800个无风险用 户。针对该1000个样本用户的应用程序列表中的每个第二应用程序 APPi计算风险概率。
一方面,计算记录了APPi的应用程序列表的数量,换言之,计算 使用了APPi的样本用户的数量,例如,可以是400个。另一方面,计 算记录了APPi的应用程序列表,并且样本用户的标签为有风险的应用 程序列表的数量,例如,可以是150个。将150与400之间的比值作为APPi的风险概率。
在操作S520,根据每个第二应用程序信息的风险概率,将多个样 本用户的应用程序列表中的第二应用程序信息划分为M个风险等级, 其中,M为大于1的正整数。
根据本公开的实施例,例如,风险等级可以包括低风险、较低风 险、高风险、极高风险等等,当然,本公开并不限于此。风险等级的 划分可以利用风险概率进行划分。例如,风险概率在0~20%之间属于 低风险,风险概率在20%~40%之间属于较低风险,风险概率在60%~80% 之间属于高风险,风险概率在80%~100%之间属于极高风险。
在操作S530,针对M个风险等级中的每个风险等级,将每个风 险等级中的第二应用程序信息聚类为K个类簇,其中,K为大于0的 正整数,并且K和M的乘积等于N。
图6示意性示出了根据本公开实施例的将每个风险等级中的第二应 用程序信息聚类为K个类簇的示意图。
如图6所示,将多个样本用户的应用程序列表中的第二应用程序 信息(以APP为示例)划分为低风险APP集合、较低风险APP集合、 较高风险APP集合、高风险APP集合等。
根据本公开的实施例,针对每个风险等级,将每个风险等级中的 第二应用程序信息聚类为K个类簇,可以得到K*M个类簇,每个类 簇可以作为一个应用程序集合。例如,将低风险APP集合中的APP 进行聚类分析,得到K个类簇。将高风险APP集合中的APP进行聚 类分析,得到K个类簇。
根据本公开的实施例,利用第二应用程序的风险概率作为监督分 级,使得不同集合中的第二应用程序获得不同的风控场景的含义,实 现了将第二应用程序与金融风控的属性体现在风险特征向量中,达到 了在将应用程序列表中的每个第一应用程序信息与N个应用程序集合 中的每个第二应用程序信息分别进行匹配后,生成的风险特征向量更 具有风险评估的实际参考价值。
根据本公开的实施例,在利用风险预测模型处理新的用户的风险 特征向量之前,可以预先训练得到风险预测模型。
根据本公开的实施例,可以获取具有标签的多个样本用户中每个 样本用户的应用程序列表,然后生成每个样本用户的风险特征向量; 利用多个样本用户的风险特征向量和多个样本用户的标签对初始模型 进行训练,得到风险预测模型。
在实现本公开的过程中,发明人发现如果直接对安装频率高的应 用程序进行向量化,并利用特征向量进行风控模型建模,存在以下不 足:首先,这样生成的应用程序的特征向量维度高,存储和训练开销 较大;其次,由于用户安装的应用程序与应用市场的所有常见应用程 序总数相比数量级差异较大,从而导致特征稀疏,易于过拟合。应用 程序与金融风险相关的属性未能体现在特征向量中,各维度的应用程 序在特征中的向量距离都相等,因此金融风险相关的应用程序与非金 融风险的普通应用程序之间没有区分度,难以体现风控属性。
根据本公开的实施例,可以利用N个应用程序集合生成每个样本 用户的风险特征向量,以降低风险特征向量维度,并使得风险特征向 量体现了风控属性。
例如,将每个样本用户的应用程序列表中的每个第一应用程序信 息与N个应用程序集合中的每个第二应用程序信息分别进行匹配,得 到匹配结果,并根据匹配结果确定用户的风险特征向量。具体处理过 程可以参考上述图2中的描述,在此不再赘述。
根据本公开的实施例,样本用户的风险特征向量是利用N个应用 程序集合生成的,N个应用程序集合中的每个应用程序集合具有相同 风险级别的同类功能应用程序,使得风险特征向量具有风控属性,并 降低了维度,便于处理和建模。
图7示意性示出了根据本公开实施例的生成样本用户的风险特征向 量的流程图。
如图7所示,生成样本用户的风险特征向量的方法包括操作 S710~S780。
在操作S710,获取有标签y的样本用户的APP列表信息,作为后 续处理的原始数据,其中,标签y=0表示无风险用户,标签y=1表示有 风险用户。
在操作S720,统计各APP对应的风险概率P(y=1|APPi)。即在安装 了APPi的所有样本用户中,标签y=1的用户,即有风险用户(正样本, 即风险样本)所占的比例。并按照该风险概率的高低进行排序。
在操作S730,根据上述的排序结果,按照风险概率的大小分为不 同的M个风险级别。例如:高风险级别(对应某个风险概率区间pl1< P(y=1|APPi)<ph1),较高风险级别(对应某个风险概率区间pl2< P(y=1|APPi)<ph2),以此类推。
在操作S740,对于每个APPi,分别从应用市场获取其对应的应用 描述文本texti。对texti进行分词,并利用无监督的模型方法对各应用描 述文本的分词结果进行预训练,可以采用的模型或方法如fastText等。 得到APP简介语料词向量的预训练模型。
在操作S750,针对每个风险级别的APP集合(参考图6),利用预 训练模型对APP描述文本进行切词并处理,获取该APPi的向量sen_veci
在操作S760,利用每个风险级别m对应的APP集合中的所有APP 对应的句向量,对该风险级别m中的APP进行聚类,获得K个簇 Cm1,……,CmK。每个簇对应的APP集合分别为Setm1,Setm2,……, SetmK
在操作S770,得到各级各类别的APP集合。可以得到M*K个APP 集合:Set11,Set12,……,Set1K;Set21,Set22,……,Set2K;……;SetM1……, SetMK
在操作S780,利用每个样本用户的应用程序与M*K个APP集合中 的每个APP进行匹配计数,生成每个样本用户的风险特征向量。具体的, 例如,首先,生成一个M*K维度的零向量VMK,对于每个用户的已安 装APP列表,逐个检查APP列表中APP是否属于M*K个APP集合中的任一个。例如,APP列表中APPi属于第j个APP集合,则VMK[j]=VMK[j] +1,其中,VMK[j]表征第j维上的数值。在全部遍历完成之后,所得的 向量VMK即该样本用户的风险特征向量。
根据本公开的实施例,样本用户的风险特征向量是利用N个应用程 序集合生成的,使得风险特征向量具有风控属性,并降低了维度,有利 于存储和降低训练开销,便于处理和建模。
图8示意性示出了根据本公开实施例的风险确定装置的框图。
如图8所示,风险确定装置800包括:第一获取模块810、匹配 模块820、第一确定模块830和处理模块840。
第一获取模块810用于获取用户的应用程序列表,其中,上述应 用程序列表中包括至少一个第一应用程序信息。
匹配模块820用于将上述应用程序列表中的每个上述第一应用程 序信息与N个应用程序集合中的每个第二应用程序信息分别进行匹配, 得到匹配结果,其中,每个上述应用程序集合中包括至少一个第二应 用程序信息,N为大于1的正整数。
第一确定模块830用于根据上述匹配结果确定上述用户的风险特 征向量,其中,上述用户的风险特征向量的维度为N维。
处理模块840用于利用风险预测模型处理上述用户的风险特征向 量,以便确定上述用户的风险信息。
根据本公开的实施例,通过将用户的应用程序列表中的每个第一 应用程序信息与N个应用程序集合中的每个第二应用程序信息分别进 行匹配得到匹配结果,根据匹配结果确定该用户的风险特征向量,并 利用风险预测模型处理用户的风险特征向量,从而可以确定用户的风 险信息。由于用户的应用程序列表中的应用程序可以较为有效地刻画 用户的一些个人属性与特质,通过将应用程序列表中的应用程序信息 与应用程序集合中的每个应用程序信息分别进行匹配,根据匹配结果 确定用户的风险特征向量,可以用来作为用户特征进行风险预测,充 分挖掘了用户数据在金融风控方面的价值,从而更好地实现数据资产 价值化,支撑和辅助金融风控方面的相关项目实践和产品建设。所以 至少部分地克服了采用相关技术确定的用户风险特征用于风险评估导 致评估效果差的技术问题,进而达到了提高风险评估准确度的技术效 果。
根据本公开的实施例,风险确定装置800还包括:第二获取模块、 聚类模块和第二确定模块。
第二获取模块,用于获取具有标签的多个样本用户中每个样本用 户的应用程序列表。
聚类模块,用于对多个上述样本用户的应用程序列表中的第二应 用程序信息进行聚类分析,得到N个类簇。
第二确定模块,用于将上述N个类簇中的每个类簇作为一个上述 应用程序集合,得到上述N个应用程序集合。
根据本公开的实施例,上述聚类模块包括:计算单元、划分单元 和第一聚类单元。
计算单元,用于计算每个上述第二应用程序信息的风险概率。
划分单元,用于根据每个上述第二应用程序信息的风险概率,将 多个上述样本用户的应用程序列表中的第二应用程序信息划分为M个 风险等级,其中,M为大于1的正整数。
第一聚类单元,用于针对上述M个风险等级中的每个风险等级, 将每个上述风险等级中的第二应用程序信息聚类为K个类簇,其中, K为大于0的正整数,并且K和M的乘积等于N。
根据本公开的实施例,上述标签指示了样本用户的风险信息;上 述计算单元用于针对每个上述第二应用程序信息,确定在多个上述样 本用户的应用程序列表中,记录有上述第二应用程序信息的应用程序 列表的第一列表数量,以及确定在多个上述样本用户的应用程序列表 中,记录有上述第二应用程序信息的应用程序列表且标签指示有风险 的第二列表数量;以及将上述第二列表数量与上述第一列表数量的比 值作为上述第二应用程序信息的风险概率。
根据本公开的实施例,风险确定装置800还包括:生成模块和训 练模块。
生成模块,用于利用上述N个应用程序集合生成每个样本用户的 风险特征向量。
训练模块,用于利用多个上述样本用户的风险特征向量和多个上 述样本用户的标签对初始模型进行训练,得到上述风险预测模型。
根据本公开的实施例,上述聚类模块包括:获取单元、生成单元 和第二聚类单元。
获取单元,用于获取每个上述第二应用程序信息的描述。
生成单元,用于根据每个上述第二应用程序信息的描述生成每个 上述第二应用程序信息的向量。
第二聚类单元,用于对每个上述第二应用程序信息的向量进行聚 类分析,得到N个上述类簇。
根据本公开的实施例,上述生成单元用于针对每个上述第二应用 程序信息,对上述第二应用程序信息的描述进行分词处理,得到多个 词;确定上述多个词中每个词的词向量,得到多个词向量;以及根据 多个上述词向量生成上述第二应用程序信息的向量。
根据本公开的实施例,根据多个上述词向量生成上述第二应用程 序信息的向量包括:计算多个上述词向量的均值;以及将上述均值作 为上述第二应用程序信息的向量。
根据本公开的实施例,上述匹配模块用于针对上述N个应用程序 集合,分别计算上述应用程序列表中与第i个应用程序集合中的第二 应用程序相匹配的上述第一应用程序的第i数量,其中,i大于等于1 且小于等于N;其中,每个上述第i数量代表上述用户的风险特征向 量中一个维度上的数值。
根据本公开的实施例的模块和单元中的任意多个、或其中任意多 个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块 和单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公 开实施例的模块和单元中的任意一个或多个可以至少被部分地实现为 硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、 片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC), 或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固 件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其 中任意几种的适当组合来实现。或者,根据本公开实施例的模块和单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计 算机程序模块被运行时,可以执行相应的功能。
例如,第一获取模块810、匹配模块820、第一确定模块830和处 理模块840中的任意多个可以合并在一个模块/单元/子单元中实现,或 者其中的任意一个模块/单元/子单元可以被拆分成多个模块/单元/子单 元。或者,这些模块/单元/子单元中的一个或多个模块/单元/子单元的至 少部分功能可以与其他模块/单元/子单元的至少部分功能相结合,并在 一个模块/单元/子单元中实现。根据本公开的实施例,第一获取模块810、 匹配模块820、第一确定模块830和处理模块840中的至少一个可以至 少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程 逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集 成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理 方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任 意一种或以其中任意几种的适当组合来实现。或者,第一获取模块810、 匹配模块820、第一确定模块830和处理模块840中的至少一个可以至 少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可 以执行相应的功能。
需要说明的是,本公开的实施例中风险确定装置部分与本公开的实 施例中风险确定方法部分是相对应的,风险确定装置部分的描述具体参 考风险确定方法部分,在此不再赘述。
图9示意性示出了根据本公开实施例的适于实现上文描述的方法的 计算机系统的框图。图9示出的计算机系统仅仅是一个示例,不应对本 公开实施例的功能和使用范围带来任何限制。
如图9所示,根据本公开实施例的计算机系统900包括处理器901, 其可以根据存储在只读存储器(ROM)902中的程序或者从存储部分908 加载到随机访问存储器(RAM)903中的程序而执行各种适当的动作和 处理。处理器901例如可以包括通用微处理器(例如CPU)、指令集处 理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器901还可以包括用于缓存用途的板载存储器。处理器901 可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处 理单元或者是多个处理单元。
在RAM 903中,存储有系统900操作所需的各种程序和数据。处 理器901、ROM 902以及RAM 903通过总线904彼此相连。处理器901 通过执行ROM 902和/或RAM 903中的程序来执行根据本公开实施例的 方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 902 和RAM 903以外的一个或多个存储器中。处理器901也可以通过执行 存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方 法流程的各种操作。
根据本公开的实施例,系统900还可以包括输入/输出(I/O)接口 905,输入/输出(I/O)接口905也连接至总线904。系统900还可以包 括连接至I/O接口905的以下部件中的一项或多项:包括键盘、鼠标等 的输入部分906;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等 以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括 诸如LAN卡、调制解调器等的网络接口卡的通信部分909。通信部分 909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接 至I/O接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存 储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机 程序根据需要被安装入存储部分908。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为 计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其 包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用 于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程 序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质 911被安装。在该计算机程序被处理器901执行时,执行本公开实施例 的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设 备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质 可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独 存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载 有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本 公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算 机可读存储介质。例如可以包括但不限于:便携式计算机磁盘、硬盘、 随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存 储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光 存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计 算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以 被指令执行系统、装置或者器件使用或者与其结合使用。
例如,根据本公开的实施例,计算机可读存储介质可以包括上文描 述的ROM 902和/或RAM 903和/或ROM 902和RAM 903以外的一个 或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方 法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上, 流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部 分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定 的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两 个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相 反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图 中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的 功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计 算机指令的组合来实现。本领域技术人员可以理解,本公开的各个实施 例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样 的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神 和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以 进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了 说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各 实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。 本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围, 本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本 公开的范围之内。

Claims (20)

1.一种风险确定方法,包括:
获取用户的应用程序列表,其中,所述应用程序列表中包括至少一个第一应用程序信息;
将所述应用程序列表中的每个所述第一应用程序信息与N个应用程序集合中的每个第二应用程序信息分别进行匹配,得到匹配结果,其中,每个所述应用程序集合中包括至少一个第二应用程序信息,N为大于1的正整数;
根据所述匹配结果确定所述用户的风险特征向量,其中,所述用户的风险特征向量的维度为N维;以及
利用风险预测模型处理所述用户的风险特征向量,以便确定所述用户的风险信息。
2.根据权利要求1所述的方法,还包括:
获取具有标签的多个样本用户中每个样本用户的应用程序列表;
对多个所述样本用户的应用程序列表中的第二应用程序信息进行聚类分析,得到N个类簇;以及
将所述N个类簇中的每个类簇作为一个所述应用程序集合,得到所述N个应用程序集合。
3.根据权利要求2所述的方法,其中,对多个所述样本用户的应用程序列表中的第二应用程序信息进行聚类分析,得到N个类簇包括:
计算每个所述第二应用程序信息的风险概率;
根据每个所述第二应用程序信息的风险概率,将多个所述样本用户的应用程序列表中的第二应用程序信息划分为M个风险等级,其中,M为大于1的正整数;以及
针对所述M个风险等级中的每个风险等级,将每个所述风险等级中的第二应用程序信息聚类为K个类簇,其中,K为大于0的正整数,并且K和M的乘积等于N。
4.根据权利要求3所述的方法,其中,所述标签指示了样本用户的风险信息;
所述计算每个所述第二应用程序信息的风险概率包括:
针对每个所述第二应用程序信息,确定在多个所述样本用户的应用程序列表中,记录有所述第二应用程序信息的应用程序列表的第一列表数量,以及确定在多个所述样本用户的应用程序列表中,记录有所述第二应用程序信息的应用程序列表且标签指示有风险的第二列表数量;以及
将所述第二列表数量与所述第一列表数量的比值作为所述第二应用程序信息的风险概率。
5.根据权利要求1所述的方法,还包括:
利用所述N个应用程序集合生成每个样本用户的风险特征向量;以及
利用多个所述样本用户的风险特征向量和多个所述样本用户的标签对初始模型进行训练,得到所述风险预测模型。
6.根据权利要求2所述的方法,其中,对多个所述样本用户的应用程序列表中的第二应用程序信息进行聚类分析,得到N个类簇包括:
获取每个所述第二应用程序信息的描述;
根据每个所述第二应用程序信息的描述生成每个所述第二应用程序信息的向量;以及
对每个所述第二应用程序信息的向量进行聚类分析,得到N个所述类簇。
7.根据权利要求6所述的方法,其中,根据每个所述第二应用程序信息的描述生成每个所述第二应用程序信息的向量包括:
针对每个所述第二应用程序信息,对所述第二应用程序信息的描述进行分词处理,得到多个词;
确定所述多个词中每个词的词向量,得到多个词向量;以及
根据多个所述词向量生成所述第二应用程序信息的向量。
8.根据权利要求7所述的方法,其中,根据多个所述词向量生成所述第二应用程序信息的向量包括:
计算多个所述词向量的均值;以及
将所述均值作为所述第二应用程序信息的向量。
9.根据权利要求1所述的方法,其中,将所述应用程序列表中的每个所述第一应用程序信息与N个应用程序集合中的每个第二应用程序信息分别进行匹配,得到匹配结果包括:
针对所述N个应用程序集合,分别计算所述应用程序列表中与第i个应用程序集合中的第二应用程序相匹配的所述第一应用程序的第i数量,其中,i大于等于1且小于等于N;
其中,每个所述第i数量代表所述用户的风险特征向量中一个维度上的数值。
10.一种风险确定装置,包括:
第一获取模块,用于获取用户的应用程序列表,其中,所述应用程序列表中包括至少一个第一应用程序信息;
匹配模块,用于将所述应用程序列表中的每个所述第一应用程序信息与N个应用程序集合中的每个第二应用程序信息分别进行匹配,得到匹配结果,其中,每个所述应用程序集合中包括至少一个第二应用程序信息,N为大于1的正整数;
第一确定模块,用于根据所述匹配结果确定所述用户的风险特征向量,其中,所述用户的风险特征向量的维度为N维;以及
处理模块,用于利用风险预测模型处理所述用户的风险特征向量,以便确定所述用户的风险信息。
11.根据权利要求10所述的装置,还包括:
第二获取模块,用于获取具有标签的多个样本用户中每个样本用户的应用程序列表;
聚类模块,用于对多个所述样本用户的应用程序列表中的第二应用程序信息进行聚类分析,得到N个类簇;以及
第二确定模块,用于将所述N个类簇中的每个类簇作为一个所述应用程序集合,得到所述N个应用程序集合。
12.根据权利要求11所述的装置,其中,所述聚类模块包括:
计算单元,用于计算每个所述第二应用程序信息的风险概率;
划分单元,用于根据每个所述第二应用程序信息的风险概率,将多个所述样本用户的应用程序列表中的第二应用程序信息划分为M个风险等级,其中,M为大于1的正整数;以及
第一聚类单元,用于针对所述M个风险等级中的每个风险等级,将每个所述风险等级中的第二应用程序信息聚类为K个类簇,其中,K为大于0的正整数,并且K和M的乘积等于N。
13.根据权利要求12所述的装置,其中,所述标签指示了样本用户的风险信息;
所述计算单元用于:
针对每个所述第二应用程序信息,确定在多个所述样本用户的应用程序列表中,记录有所述第二应用程序信息的应用程序列表的第一列表数量,以及确定在多个所述样本用户的应用程序列表中,记录有所述第二应用程序信息的应用程序列表且标签指示有风险的第二列表数量;以及
将所述第二列表数量与所述第一列表数量的比值作为所述第二应用程序信息的风险概率。
14.根据权利要求11所述的装置,还包括:
生成模块,用于利用所述N个应用程序集合生成每个样本用户的风险特征向量;以及
训练模块,用于利用多个所述样本用户的风险特征向量和多个所述样本用户的标签对初始模型进行训练,得到所述风险预测模型。
15.根据权利要求11所述的装置,其中,所述聚类模块包括:
获取单元,用于获取每个所述第二应用程序信息的描述;
生成单元,用于根据每个所述第二应用程序信息的描述生成每个所述第二应用程序信息的向量;以及
第二聚类单元,用于对每个所述第二应用程序信息的向量进行聚类分析,得到N个所述类簇。
16.根据权利要求15所述的装置,其中,所述生成单元用于:
针对每个所述第二应用程序信息,对所述第二应用程序信息的描述进行分词处理,得到多个词;
确定所述多个词中每个词的词向量,得到多个词向量;以及
根据多个所述词向量生成所述第二应用程序信息的向量。
17.根据权利要求16所述的装置,其中,根据多个所述词向量生成所述第二应用程序信息的向量包括:
计算多个所述词向量的均值;以及
将所述均值作为所述第二应用程序信息的向量。
18.根据权利要求10所述的装置,其中,所述匹配模块用于:
针对所述N个应用程序集合,分别计算所述应用程序列表中与第i个应用程序集合中的第二应用程序相匹配的所述第一应用程序的第i数量,其中,i大于等于1且小于等于N;
其中,每个所述第i数量代表所述用户的风险特征向量中一个维度上的数值。
19.一种计算机系统,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至9中任一项所述的方法。
20.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现权利要求1至9中任一项所述的方法。
CN202010616218.5A 2020-06-30 2020-06-30 风险确定方法、装置、计算机系统和存储介质 Active CN111783039B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010616218.5A CN111783039B (zh) 2020-06-30 2020-06-30 风险确定方法、装置、计算机系统和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010616218.5A CN111783039B (zh) 2020-06-30 2020-06-30 风险确定方法、装置、计算机系统和存储介质

Publications (2)

Publication Number Publication Date
CN111783039A true CN111783039A (zh) 2020-10-16
CN111783039B CN111783039B (zh) 2023-08-18

Family

ID=72759994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010616218.5A Active CN111783039B (zh) 2020-06-30 2020-06-30 风险确定方法、装置、计算机系统和存储介质

Country Status (1)

Country Link
CN (1) CN111783039B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348663A (zh) * 2020-10-21 2021-02-09 深圳乐信软件技术有限公司 一种信用风险评估方法、装置、计算机设备及存储介质
CN113222258A (zh) * 2021-05-17 2021-08-06 北京百度网讯科技有限公司 用于输出信息的方法、装置、设备以及存储介质
CN113392149A (zh) * 2021-06-15 2021-09-14 浙江大学 一种基于多源异构数据融合的贷款逾期预测方法
CN113919669A (zh) * 2021-09-26 2022-01-11 德联易控科技(北京)有限公司 一种确定风险控制对象的风险信息的方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104376258A (zh) * 2014-11-20 2015-02-25 工业和信息化部电信研究院 安卓应用程序的安全风险检测方法及装置
CN109685645A (zh) * 2018-12-18 2019-04-26 北京三快在线科技有限公司 用户信用风险评估方法及装置、存储介质
CN110197315A (zh) * 2018-04-08 2019-09-03 腾讯科技(深圳)有限公司 风险评估方法、装置及其存储介质
WO2020019521A1 (zh) * 2018-07-27 2020-01-30 平安科技(深圳)有限公司 一种风险检测方法和装置
CN111210335A (zh) * 2019-12-16 2020-05-29 北京淇瑀信息科技有限公司 用户风险识别方法、装置及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104376258A (zh) * 2014-11-20 2015-02-25 工业和信息化部电信研究院 安卓应用程序的安全风险检测方法及装置
CN110197315A (zh) * 2018-04-08 2019-09-03 腾讯科技(深圳)有限公司 风险评估方法、装置及其存储介质
WO2020019521A1 (zh) * 2018-07-27 2020-01-30 平安科技(深圳)有限公司 一种风险检测方法和装置
CN109685645A (zh) * 2018-12-18 2019-04-26 北京三快在线科技有限公司 用户信用风险评估方法及装置、存储介质
CN111210335A (zh) * 2019-12-16 2020-05-29 北京淇瑀信息科技有限公司 用户风险识别方法、装置及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张星明;李和恒;: "基于独立负样本集和SVM的人脸确认算法", 计算机研究与发展, no. 12 *
李璐;: "数据挖掘技术在住房信贷风险防范中的应用", 商场现代化, no. 15 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348663A (zh) * 2020-10-21 2021-02-09 深圳乐信软件技术有限公司 一种信用风险评估方法、装置、计算机设备及存储介质
CN113222258A (zh) * 2021-05-17 2021-08-06 北京百度网讯科技有限公司 用于输出信息的方法、装置、设备以及存储介质
CN113392149A (zh) * 2021-06-15 2021-09-14 浙江大学 一种基于多源异构数据融合的贷款逾期预测方法
CN113919669A (zh) * 2021-09-26 2022-01-11 德联易控科技(北京)有限公司 一种确定风险控制对象的风险信息的方法和装置
CN113919669B (zh) * 2021-09-26 2022-10-11 德联易控科技(北京)有限公司 一种确定风险控制对象的风险信息的方法和装置

Also Published As

Publication number Publication date
CN111783039B (zh) 2023-08-18

Similar Documents

Publication Publication Date Title
CN111783039B (zh) 风险确定方法、装置、计算机系统和存储介质
KR20200123015A (ko) 정보를 추천하는 방법, 장치, 기기 및 저장 매체
CN111210335B (zh) 用户风险识别方法、装置及电子设备
CN111950279B (zh) 实体关系的处理方法、装置、设备及计算机可读存储介质
US20190080352A1 (en) Segment Extension Based on Lookalike Selection
CN111583018A (zh) 一种基于用户金融表现分析的授信策略管理方法、装置和电子设备
CN110717597A (zh) 利用机器学习模型获取时序特征的方法和装置
CN107679916A (zh) 用于获取用户兴趣度的方法及装置
CN113393306A (zh) 产品推荐方法、装置、电子设备及计算机可读介质
CN112598472A (zh) 产品推荐方法、装置、系统、介质和程序产品
CN111191677B (zh) 用户特征数据生成方法、装置及电子设备
CN115689717A (zh) 企业风险预警方法、装置、电子设备、介质和程序产品
CN111553685B (zh) 确定交易路由通道的方法、装置、电子设备和存储介质
CN116308641A (zh) 产品推荐方法、训练方法、装置、电子设备和介质
CN116048463A (zh) 基于标签管理的需求项内容智能推荐方法及装置
CN110163482B (zh) 确定活动方案的安全方案数据的方法、终端设备及服务器
CN113052512A (zh) 风险预测方法、装置和电子设备
CN113010798A (zh) 信息推荐方法、信息推荐装置、电子设备及可读存储介质
CN112836742A (zh) 系统资源调整方法、装置及设备
CN111861493A (zh) 信息处理方法、装置、电子设备及存储介质
US20220207409A1 (en) Timeline reshaping and rescoring
CN117541885A (zh) 样本数据处理方法、装置、存储介质和系统
CN117541884A (zh) 样本数据处理方法、装置、存储介质和系统
Liu et al. DNN2LR: Automatic feature crossing for credit scoring
CN113436001A (zh) 信用卡的推送方法、装置、设备、存储介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant