CN113505369A - 一种时空感知的用户风险识别模型训练的方法及装置 - Google Patents
一种时空感知的用户风险识别模型训练的方法及装置 Download PDFInfo
- Publication number
- CN113505369A CN113505369A CN202111050237.7A CN202111050237A CN113505369A CN 113505369 A CN113505369 A CN 113505369A CN 202111050237 A CN202111050237 A CN 202111050237A CN 113505369 A CN113505369 A CN 113505369A
- Authority
- CN
- China
- Prior art keywords
- user
- matrix
- time
- slice
- matrixes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/55—Detecting local intrusion or implementing counter-measures
- G06F21/552—Detecting local intrusion or implementing counter-measures involving long-term monitoring or reporting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书提供了一种时空感知的用户风险识别模型训练的方法及装置,该方法包括:获取基于用户的多条历史行为记录确定的n个时间切片矩阵和m个空间切片矩阵;时间切片矩阵的维度是位置特征和指定特征,空间切片矩阵的维度是时间特征和指定特征,两类矩阵的元素均为用户做出特定行为的次数;然后将n个时间切片矩阵和m个空间切片矩阵输入用户风险识别模型,此模型中包括卷积层和全连接层;其中,基于n个时间切片矩阵和m个空间切片矩阵,利用该卷积层进行卷积处理,得到用户表征矩阵;再将基于该用户表征矩阵确定的用户表征向量输入所述全连接层,得到风险识别结果;之后,基于该风险识别结果和上述用户对应的风险标签,训练风险识别模型。
Description
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种时空感知的用户风险识别模型训练的方法及装置。
背景技术
随着经济社会的发展和数字科技的进步,大宗商品供应链集成服务领域的上下游企业(包括生产商、客户、供应商、银行、仓储企业、物流企业及保险公司等)越来越多地使用基于现代互联网技术的数字化平台,如在线采购、分销、仓储、物流、配送、融资等供应链业务运营数字化平台,来满足供应链业务运营及企业自身管控的个性化需求。在数字化平台开放使用的过程中,往往存在个别用户进行恶意操作的情况,或者,有不法分子盗用他人账号进行违规使用等情况,将会造成数字化平台和合法用户的损失,包括经济损失、商业机密或隐私数据泄露等。
为应对这些风控异常情况,强化对用户的风险识别、提升自身的风险控制能力成为当前的一大研究热点。然而,传统的风险控制方式都是依赖风控从业人员通过人工方式去收集各种数据、信息和资料,对各种已经发生的案件进行分析,然后再总结、提炼出更多的作案方法与相关特征来提升风控效果、降低企业损失,这种方法将耗费大量人力物力且效率低下、时效性较差,并且难以及时识别出新的作案手法。因此,迫切需要提供一种解决方案,建立一种用户风险识别模型,并在实践过程中对模型不断进行迭代训练,以便更加高效地进行用户风险识别,提升企业的风险管控水平,为企业的高质量发展提供基础保障。
发明内容
本说明书一个或多个实施例描述了一种时空感知的用户风险识别模型训练的方法及装置,通过利用时空特征,可以高效地进行用户风险识别。
根据第一方面,提供一种时空感知的用户风险识别模型训练的方法,包括:获取基于用户的多条历史行为记录确定的n个时间切片矩阵和m个空间切片矩阵;时间切片矩阵的矩阵维度是位置特征和指定特征,空间切片矩阵的矩阵维度是时间特征和所述指定特征,两类矩阵的元素均为所述用户做出特定行为的次数;将所述n个时间切片矩阵和m个空间切片矩阵输入用户风险识别模型,所述用户风险识别模型包括卷积层和全连接层;其中,基于所述n个时间切片矩阵和m个空间切片矩阵,利用所述卷积层进行卷积处理,得到用户表征矩阵;将基于所述用户表征矩阵确定的用户表征向量输入所述全连接层,得到风险识别结果;基于所述风险识别结果和所述用户对应的风险标签,训练所述风险识别模型。
在一个实施例中,所述指定特征对应消费金额或消费次数。
在一个实施例中,获取基于用户的多条历史行为记录确定的n个时间切片矩阵和m个空间切片矩阵,包括:获取所述多条历史行为记录,历史行为记录中包括用户做出所述特定行为的时间信息和位置信息;基于历史行为记录中的时间信息,确定时间统计特征的n个特征值中任一的第一特征值对应的若干历史行为记录;基于所述若干历史行为记录,确定该第一特征值对应的时间切片矩阵,归入所述n个时间切片矩阵。
在一个具体的实施例中,所述n个特征值对应以当前时刻为区间端点的n个时间区间,或者,对应以所述多条历史行为记录中距离当前时刻最近的时刻为区间端点的n个时间区间,或者,对应基于历史行为记录中时间信息的先后进行排名而选取的n个名次范围。
在一个实施例中,获取基于用户的多条历史行为记录确定的n个时间切片矩阵和m个空间切片矩阵,包括:获取所述多条历史行为记录,历史行为记录中包括用户做出所述特定行为的时间信息和位置信息;基于历史行为记录中的位置信息,确定位置统计特征的m个特征值中任一的第二特征值对应的若干历史行为记录;基于所述若干历史行为记录,确定该第二特征值对应的空间切片矩阵,归入所述m个空间切片矩阵。
在一个具体的实施例中,所述m个特征值按照位置区域级别进行划分而得到,或者,所述m个特征值对应m个经纬度范围。
在一个实施例中,所述用户风险识别模型还包括注意力层;在利用所述卷积层进行卷积处理之前,所述方法还包括:利用所述注意力层,处理所述n个时间切片矩阵和m个空间切片矩阵,得到多个注意力处理矩阵;其中,利用所述卷积层进行卷积处理,包括:利用所述卷积层对所述多个注意力处理矩阵进行卷积处理。
在一个实施例中,所述用户风险识别模型还包括池化层;其中,在将基于所述用户表征矩阵确定的用户表征向量输入所述全连接层,得到风险识别结果之前,所述方法还包括:利用所述池化层对所述用户表征矩阵进行池化处理,得到所述用户表征向量。
在一个实施例中,在将基于所述用户表征矩阵确定的用户表征向量输入所述全连接层,得到风险识别结果之前,所述方法还包括:将所述用户表征矩阵按行或者按列进行拼接,得到所述用户表征向量。
根据第二方面,提供一种时空感知的用户风险识别模型训练的装置,包括:切片矩阵获取单元,配置为获取基于用户的多条历史行为记录确定的n个时间切片矩阵和m个空间切片矩阵;时间切片矩阵的矩阵维度是位置特征和指定特征,空间切片矩阵的矩阵维度是时间特征和所述指定特征,两类矩阵的元素均为所述用户做出特定行为的次数;模型处理单元,配置为将所述n个时间切片矩阵和m个空间切片矩阵输入用户风险识别模型,所述用户风险识别模型包括卷积层和全连接层;其中,所述模型处理单元包括以下子单元:卷积子单元,配置为基于所述n个时间切片矩阵和m个空间切片矩阵,利用所述卷积层进行卷积处理,得到用户表征矩阵;结果确定子单元,配置为将基于所述用户表征矩阵确定的用户表征向量输入所述全连接层,得到风险识别结果;训练单元,配置为基于所述风险识别结果和所述用户对应的风险标签,训练所述风险识别模型。
根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
根据第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,处理器执行所述可执行代码时,实现第一方面的方法。
采用本说明书实施例提供的方法和装置,基于用户的多条历史行为记录确定多个时间切片矩阵和多个空间切片矩阵,进而利用设计有卷积层的风险识别模型对其进行处理,从而实现高效、准确地构建出用户行为特征,进而得到准确、可靠的风险识别结果。进一步,风险识别模型中还在卷积层之前设计有注意力层,从而可以从时间切片矩阵和空间切片矩阵中挖掘出重要特征,进而提高模型后续的处理效率和准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出根据一个实施例的时空感知的用户风险识别的实施架构示意图;
图2示出根据一个实施例的时空感知的用户风险识别模型训练的方法流程图;
图3示出根据一个实施例的时空感知的用户风险识别模型训练的装置结构图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
本说明书实施例披露一种用户风险识别方案,通过利用用户行为事件中的时空信息,实现更高效的风控识别。图1示出根据一个实施例的时空感知的用户风险识别的实施架构示意图。如图1所示,为了对某个用户进行风险识别,先获取其行为事件记录,并将其处理为时间、空间和指定特征这三个维度,然后通过特征工程的方式,抽取出多个时间切片和多个空间切片,作为本申请新设计的用户风险识别模型的输入,在该输入依次经过模型中卷积层和全连接层的处理之后,可以得到该某个用户的风险识别结果。
下面结合具体的实施例,描述本申请发明构思的实施步骤。图2示出根据一个实施例的时空感知的用户风险识别模型训练的方法流程图,所述方法的执行主体可以为任何具有计算、处理能力的装置、平台、服务器或设备集群。如图2所示,所述方法包括以下步骤:
步骤S210,获取基于用户(或称样本用户)的多条历史行为记录确定的n个时间切片矩阵和m个空间切片矩阵。
历史行为记录是用户做出特定行为的记录。在一个实施例中,特定行为可以是消费行为、支付行为、身份验证行为、登录行为、访问行为,等等。在一个实施例中,可以采用埋点采集的方式采集历史行为记录。在另一个实施例中,用户通过服务平台(如支付平台)做出特定行为(如支付行为),相应,可以获取服务平台的平台日志,并从中确定用户的历史行为记录。在一个实施例中,历史行为记录中可以包括:用户标识、时间信息、位置信息、网络环境信息等。在一个具体的实施例中,用户标识可以是用户的手机号、邮箱或者系统分配的用于唯一标识用户的字符串。在一个具体的实施例中,其中位置信息可以包括地理位置,如经纬度坐标,地址信息等,又例如,位置信息还可以包括用户预设的位置标签,如家庭、公司等。在一个具体的实施例中,网络环境信息可以包括IP地址、网络类型等。进一步,在一个具体的实施例中,假定特定行为是消费行为或支付行为,相应,历史行为记录中还可以包括金额信息,如消费金额或支付金额。在另一个具体的实施例中,假定特定行为是身份验证行为,相应,历史行为记录中还可以包括验证方式,如手机号密码验证、刷脸认证、指纹验证、虹膜验证,等等。
在一种应用场景中,大宗商品供应链集成服务领域的上下游企业(包括生产商、客户、供应商、银行、仓储企业、物流企业及保险公司等)越来越多地使用基于现代互联网技术的数字化平台,如在线采购、分销、仓储、物流、配送、融资等供应链业务运营数字化平台,来满足供应链业务运营及企业自身管控的个性化需求。相应,上述用户可以是数字化平台的用户。
在一种实施方式中,基于上述多条历史行为记录,可以构建以时间、空间(或称位置)、指定特征为维度的三维矩阵(或称三维张量)。在一个实施例中,其中指定特征可以由工作人员设定,通常是针对特定行为的有代表性的特征。在一个具体的实施例中,指定特征可以是数值特征。例如,假定特定行为是消费行为,则指定特征可以是消费金额或消费次数,又例如,假定特定行为是支付行为,则指定特征可以是支付金额或支付次数。在另一个具体的实施例中,假定特定行为是身份验证行为,则指定特征可以是身份验证方式。
进一步,在一个实施例中,可以按照时间维度对上述三维矩阵进行切片统计,从而得到时间切片矩阵。上述n个时间切片矩阵对应时间统计特征的n(n为大于1的正整数)个特征值,每个时间切片矩阵的矩阵维度是位置特征和指定特征,矩阵的元素为用户做出特定行为的统计次数。在一个具体的实施例中,n个特征值对应以当前时刻为区间端点的n个时间区间,例如,可以包括最近1秒、最近1分钟、最近1小时、最近1天、最近1周、最近一个月、最近一个季度共7个时间区间。在另一个具体的实施例中,n个特征值对应以多条历史行为记录中距离当前时刻最近的时刻为区间端点的n个时间区间。在又一个具体的实施例中,n个特征值对应基于历史行为记录中时间信息的先后进行排名而选取的n个名次范围,例如,最后1个时间点、10个时间点、最后100个时间点、最后1000个时间点等。
在一个具体的实施例中,时间切片矩阵中的不同行对应位置特征维度的不同特征值,不同列对应指定特征维度的不同特征值,反之亦可。在一个示例中,位置特征的特征值可以是地址(如某学校某办公室等),或者,可以是位置标签(如学校、家庭、公司等),又或者,可以是经纬度网格的编号。在一个示例中,指定特征的特征值可以对应数值区间,例如,假定指定特征是金额,相应,可以确定其特征值a、b和c分别对应数值区间[0,100]、(100,500)和[500,1000],其中单位是元。在另一个示例中,指定特征的原始取值是有限、离散的,相应,指定特征的特征值可以是其取值空间中的离散值,例如,身份验证方式的特征值可以是人脸识别、指纹识别等不同核身方式。
另一方面,在一个实施例中,可以按照位置维度对上述三维矩阵进行切片统计,从而得到位置切片矩阵(或称空间切片矩阵)。上述m个位置切片矩阵对应位置统计特征的m(m为大于1的正整数)个特征值,每个空间切片矩阵的矩阵维度是时间特征和上述指定特征,矩阵的元素为用户做出特定行为的次数。在一个具体的实施例中,m个特征值按照位置区域级别进行划分而得到,示例性地,位置区域级别可以包括国家、省、城市、商务中心等,相应,m个特征值可以包括A国、B国、C省、D省,等等。在另一个具体的实施例中,m个特征值对应m个经纬度范围。在一个例子中,m个经纬度范围可以是m个经度区间或m个纬度区间。在另一个例子中,m个经纬度范围可以对应m个经纬度网格。
需说明,空间切片矩阵所涉及的位置统计特征,可以与上述时间切片矩阵所涉及的位置特征相同,也可以不同。在一个示例中,前者的特征值是按照位置区域级别进行划分而得到,后者的特征值对应位置标签。在另一个示例中,二者的特征值均对应经纬度网格。此外,空间切片矩阵所涉及的时间特征,可以与上述时间切片矩阵所涉及的时间统计特征相同,也可以不同。在一个示例中,前者的特征值包括最近1秒、最近1分钟等,后者的特征值包括最后1个时间点、最后10个时间点、最后100个时间点等。另外,空间切片矩阵所涉及的指定特征,可以与上述时间切片矩阵所涉及的指定特征通常相同。
在另一种实施方式中,基于上述多条历史行为记录进行行为记录的筛选和行为特征的统计,从而确定上述n个时间切片矩阵和m个空间切片矩阵。在一个实施例中,上述n个时间切片矩阵的确定可以包括:基于历史行为记录中的时间信息,确定时间统计特征的上述n个特征值中任一的第一特征值对应的若干历史行为记录;基于此若干历史行为记录,确定该第一特征值对应的时间切片矩阵,归入上述n个时间切片矩阵。
在一个实施例中,上述m个空间切片矩阵的确定可以包括:基于历史行为记录中的位置信息,确定位置统计特征的m个特征值中任一的第二特征值对应的若干历史行为记录;基于此若干历史行为记录,确定该第二特征值对应的空间切片矩阵,归入上述m个空间切片矩阵。
由上,可以获取针对样本用户的的n个时间切片矩阵和m个空间切片矩阵,因其分别对应n个时间统计特征和m个位置统计特征,并且,矩阵元素为用户做出特定行为的统计次数,故而基于这样的特征矩阵进行模型训练,可以高效地学到用户的行为习惯等,从而辅助识别出风险用户。
进一步,在步骤S220,将该n个时间切片矩阵和m个空间切片矩阵输入用户风险识别模型,此用户风险识别模型包括卷积层和全连接层。
具体,步骤S220中至少包括步骤S221和步骤S222。在步骤S221,基于所述n个时间切片矩阵和m个空间切片矩阵,利用卷积层进行卷积处理,得到用户表征矩阵。需理解,卷机层的数量可以是一个或多个,并且,卷积层的数量以及每个卷积层的长、宽和高(高即通道数),都可由机器学习工程师进行设定。在一个实施例中,可以直接将n个时间切片矩阵和m个空间切片矩阵作为卷积层的输入,得到输出的用户表征矩阵。
在另一个实施例中,用户风险识别模型还包括注意力层,在步骤S221之前,步骤S220中还包括:利用该注意力层,处理上述n个时间切片矩阵和m个空间切片矩阵,得到多个注意力处理矩阵。如此,可以从n个时间切片矩阵和m个空间切片矩阵中挖掘出重要的时间特征和空间特征。需说明,注意层是指引入了注意力机制的模型处理层;注意力层的数量可以是一个或多个,具体可由机器学习工程师进行设定;注意力处理矩阵是指在注意力层中针对输入矩阵,利用注意力机制计算出注意力权重后,利用注意力权重对该输入矩阵进行加权处理后所得到的矩阵。
在一个具体的实施例中,在注意力层中,针对n个时间切片矩阵中的各个切片矩阵,分别利用自注意力机制(如Transformer机制)进行编码,得到n个编码矩阵,从而归入上述多个注意力处理矩阵。在另一个具体的实施例中,在注意力层中,对n个时间切片矩阵进行拼接,得到时间拼接矩阵,并利用自注意机制对其进行编码,得到对应的编码矩阵,归入上述多个注意力处理矩阵。
在又一个具体的实施例中,针对m个空间切片矩阵中的各个切片矩阵,分别利用自注意力机制进行编码,得到m个编码矩阵,从而归入上述多个注意力处理矩阵。在另一个具体的实施例中,在注意力层中,对n个空间切片矩阵进行拼接,得到空间拼接矩阵,并利用自注意机制对其进行编码,得到对应的编码矩阵,归入上述多个注意力处理矩阵。
在还一个具体的实施例中,在对任一时间切片矩阵进行编码时,可以确定m个空间切片矩阵对该时间切片矩阵的注意力权重,进而利用确定出的m个注意力权重对该m个空间切片矩阵进行加权求和,得到该时间切片矩阵对应的编码矩阵,并归入上述多个注意力处理矩阵。在再一个具体的实施例中,在对任一空间切片矩阵进行编码时,可以确定n个时间切片矩阵对该空间切片矩阵的注意力权重,进而利用确定出的n个注意力权重对该n个时间切片矩阵进行加权求和,得到该空间切片矩阵对应的编码矩阵,并归入上述多个注意力处理矩阵。
在再一个具体的实施例中,可以对n个时间切片矩阵和m个空间切片矩阵进行融合处理,得到融合矩阵,再利用自注意力机制对其进行编码,得到对应的编码矩阵,从而归入上述多个注意力处理矩阵。在一个例子中,其中融合处理可以是矩阵的相加处理,或者,矩阵的拼接处理等。
在以上得到多个注意力处理矩阵后,相应在步骤S221:利用卷积层对该多个注意力处理矩阵进行卷积处理,得到用户表征矩阵。
由上,可以得到用户表征矩阵,并且,得到的用户表征矩阵可能是一个,可能是多个。从而,在步骤S222,将基于该用户表征矩阵确定的用户表征向量输入上述全连接层,得到风险识别结果。
在一个实施例中,用户风险识别模型还包括池化层,在步骤S221之后以及步骤S222之前,步骤S220中还可以包括:利用池化层对用户表征矩阵进行池化处理,得到用户表征向量。在一个具体的实施例中,其中池化处理包括最大值池化处理或平均池化处理。在一个具体的实施例中,可以将池化处理得到的池化向量,作为用户表征向量。在另一个具体的实施例中,可以将对多个用户表征矩阵分别进行池化处理而得到的多个池化向量进行融合处理,得到用户表征向量。在一个例子中,其中融合处理可以包括拼接处理、加和处理或求平均处理等。
在一个实施例中,在步骤S221之后以及步骤S222之前,步骤S220中还可以包括:对所述用户表征矩阵的多个行或者多个列进行融合处理,得到上述用户表征向量。在一个具体的实施例中,可以将用户表征矩阵按行或者按列进行拼接,得到上述用户表征向量。在另一个具体的实施例中,可以对多个行或者多个列进行相加、或求平均等处理,从而得到上述用户表征向量。
基于上述确定的用户表征向量,将其输入全连接层中,可以得到风险识别结果。需理解,全连接层的数量可以是一个或多个。在一个实施例中,风险识别结果可以是风险类别,也可以是风险分数。
以上,利用用户风险识别模型对样本用户的n个时间切片矩阵和m个空间切片矩阵进行处理,可以得到该样本用户的风险识别结果。进而在步骤S230,基于该风险识别结果和样本用户对应的风险标签,训练上述风险识别模型。在一个实施例中,风险标签可以为1(指示有风险)或0(指示无风险)。在另一个实施例中,风险标签所属的标签总集中包括高风险、中风险、低风险等多个风险等级标签。
在一个实施例中,可以基于风险识别结果和风险标签确定训练损失,再利用该训练损失调整风险识别模型的参数。在一个具体的实施例中,其中训练损失的确定可以采用交叉熵损失函数或铰链损失函数。
由上,基于针对多个样本用户采集的历史行为记录,重复执行上述步骤S210、S220和S230,实现对用户风险识别模型的迭代训练,直到达到预定的迭代次数,或者迭代至收敛,从而可以得到训练好的用户风险识别模型,并将其投入使用。
综上,采用本说明书实施例披露的时空感知的用户风险识别模型训练的方法,基于用户的多条历史行为记录确定多个时间切片矩阵和多个空间切片矩阵,进而利用设计有卷积层的风险识别模型对其进行处理,从而实现高效、准确地构建出用户行为特征,进而得到准确、可靠的风险识别结果。进一步,风险识别模型中还在卷积层之前设计有注意力层,从而可以从时间切片矩阵和空间切片矩阵中挖掘出重要特征,进而提高模型后续的处理效率和准确率。
根据另一方面的实施例,本说明书还披露一种训练装置。图3示出根据一个实施例的时空感知的用户风险识别模型训练的装置结构图。如图3所示,所述装置300包括:
切片矩阵获取单元310,配置为获取基于用户的多条历史行为记录确定的n个时间切片矩阵和m个空间切片矩阵;时间切片矩阵的矩阵维度是位置特征和指定特征,空间切片矩阵的矩阵维度是时间特征和所述指定特征,两类矩阵的元素均为所述用户做出特定行为的次数。模型处理单元320,配置为将所述n个时间切片矩阵和m个空间切片矩阵输入用户风险识别模型,所述用户风险识别模型包括卷积层和全连接层;其中,所述模型处理单元包括以下子单元:卷积子单元321,配置为基于所述n个时间切片矩阵和m个空间切片矩阵,利用所述卷积层进行卷积处理,得到用户表征矩阵;结果确定子单元322,配置为将基于所述用户表征矩阵确定的用户表征向量输入所述全连接层,得到风险识别结果。训练单元330,配置为基于所述风险识别结果和所述用户对应的风险标签,训练所述风险识别模型。
在一个实施例中,所述指定特征对应消费金额或消费次数。
在一个实施例中,切片矩阵获取单元310具体配置为:获取所述多条历史行为记录,历史行为记录中包括用户做出所述特定行为的时间信息和位置信息;基于历史行为记录中的时间信息,确定时间统计特征的n个特征值中任一的第一特征值对应的若干历史行为记录;基于所述若干历史行为记录,确定该第一特征值对应的时间切片矩阵,归入所述n个时间切片矩阵。
在一个具体的实施例中,所述n个特征值对应以当前时刻为区间端点的n个时间区间,或者,对应以所述多条历史行为记录中距离当前时刻最近的时刻为区间端点的n个时间区间,或者,对应基于历史行为记录中时间信息的先后进行排名而选取的n个名次范围。
在一个实施例中,切片矩阵获取单元310具体配置为:获取所述多条历史行为记录,历史行为记录中包括用户做出所述特定行为的时间信息和位置信息;基于历史行为记录中的位置信息,确定位置统计特征的m个特征值中任一的第二特征值对应的若干历史行为记录;基于所述若干历史行为记录,确定该第二特征值对应的空间切片矩阵,归入所述m个空间切片矩阵。
在一个具体的实施例中,所述m个特征值按照位置区域级别进行划分而得到,或者,所述m个特征值对应m个经纬度范围。
在一个实施例中,所述用户风险识别模型还包括注意力层;所述装置300还包括:注意力子单元,配置为利用所述注意力层,处理所述n个时间切片矩阵和m个空间切片矩阵,得到多个注意力处理矩阵;卷积子单元321具体配置为:利用所述卷积层对所述多个注意力处理矩阵进行卷积处理。
在一个实施例中,所述用户风险识别模型还包括池化层;所述装置300还包括:池化子单元,配置为利用所述池化层对所述用户表征矩阵进行池化处理,得到所述用户表征向量。
在一个实施例中,所述结果确定子单元322还配置为:将所述用户表征矩阵按行或者按列进行拼接,得到所述用户表征向量。
综上,采用本说明书实施例披露的时空感知的用户风险识别模型训练的方法,基于用户的多条历史行为记录确定多个时间切片矩阵和多个空间切片矩阵,进而利用设计有卷积层的风险识别模型对其进行处理,从而实现高效、准确地构建出用户行为特征,进而得到准确、可靠的风险识别结果。进一步,风险识别模型中还在卷积层之前设计有注意力层,从而可以从时间切片矩阵和空间切片矩阵中挖掘出重要特征,进而提高模型后续的处理效率和准确率。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2所描述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (10)
1.一种时空感知的用户风险识别模型训练的方法,包括:
获取基于用户的多条历史行为记录确定的n个时间切片矩阵和m个空间切片矩阵;时间切片矩阵的矩阵维度是位置特征和指定特征,空间切片矩阵的矩阵维度是时间特征和所述指定特征,两类矩阵的元素均为所述用户做出特定行为的次数;
将所述n个时间切片矩阵和m个空间切片矩阵输入用户风险识别模型,所述用户风险识别模型包括卷积层和全连接层;其中,
基于所述n个时间切片矩阵和m个空间切片矩阵,利用所述卷积层进行卷积处理,得到用户表征矩阵;
将基于所述用户表征矩阵确定的用户表征向量输入所述全连接层,得到风险识别结果;
基于所述风险识别结果和所述用户对应的风险标签,训练所述风险识别模型。
2.根据权利要求1所述的方法,其中,所述指定特征对应消费金额或消费次数。
3.根据权利要求1所述的方法,其中,获取基于用户的多条历史行为记录确定的n个时间切片矩阵和m个空间切片矩阵,包括:
获取所述多条历史行为记录,历史行为记录中包括用户做出所述特定行为的时间信息和位置信息;
基于历史行为记录中的时间信息,确定时间统计特征的n个特征值中任一的第一特征值对应的若干历史行为记录;
基于所述若干历史行为记录,确定该第一特征值对应的时间切片矩阵,归入所述n个时间切片矩阵。
4.根据权利要求3所述的方法,其中,所述n个特征值对应以当前时刻为区间端点的n个时间区间,或者,对应以所述多条历史行为记录中距离当前时刻最近的时刻为区间端点的n个时间区间,或者,对应基于历史行为记录中时间信息的先后进行排名而选取的n个名次范围。
5.根据权利要求1所述的方法,其中,获取基于用户的多条历史行为记录确定的n个时间切片矩阵和m个空间切片矩阵,包括:
获取所述多条历史行为记录,历史行为记录中包括用户做出所述特定行为的时间信息和位置信息;
基于历史行为记录中的位置信息,确定位置统计特征的m个特征值中任一的第二特征值对应的若干历史行为记录;
基于所述若干历史行为记录,确定该第二特征值对应的空间切片矩阵,归入所述m个空间切片矩阵。
6.根据权利要求5所述的方法,其中,所述m个特征值按照位置区域级别进行划分而得到,或者,所述m个特征值对应m个经纬度范围。
7.根据权利要求1所述的方法,其中,所述用户风险识别模型还包括注意力层;在利用所述卷积层进行卷积处理之前,所述方法还包括:
利用所述注意力层,处理所述n个时间切片矩阵和m个空间切片矩阵,得到多个注意力处理矩阵;
其中,利用所述卷积层进行卷积处理,包括:利用所述卷积层对所述多个注意力处理矩阵进行卷积处理。
8.根据权利要求1所述的方法,其中,所述用户风险识别模型还包括池化层;其中,在将基于所述用户表征矩阵确定的用户表征向量输入所述全连接层,得到风险识别结果之前,所述方法还包括:
利用所述池化层对所述用户表征矩阵进行池化处理,得到所述用户表征向量。
9.根据权利要求1所述的方法,其中,在将基于所述用户表征矩阵确定的用户表征向量输入所述全连接层,得到风险识别结果之前,所述方法还包括:
将所述用户表征矩阵按行或者按列进行拼接,得到所述用户表征向量。
10.一种时空感知的用户风险识别模型训练的装置,包括:
切片矩阵获取单元,配置为获取基于用户的多条历史行为记录确定的n个时间切片矩阵和m个空间切片矩阵;时间切片矩阵的矩阵维度是位置特征和指定特征,空间切片矩阵的矩阵维度是时间特征和所述指定特征,两类矩阵的元素均为所述用户做出特定行为的次数;
模型处理单元,配置为将所述n个时间切片矩阵和m个空间切片矩阵输入用户风险识别模型,所述用户风险识别模型包括卷积层和全连接层;其中,所述模型处理单元包括以下子单元:
卷积子单元,配置为基于所述n个时间切片矩阵和m个空间切片矩阵,利用所述卷积层进行卷积处理,得到用户表征矩阵;
结果确定子单元,配置为将基于所述用户表征矩阵确定的用户表征向量输入所述全连接层,得到风险识别结果;
训练单元,配置为基于所述风险识别结果和所述用户对应的风险标签,训练所述风险识别模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111050237.7A CN113505369B (zh) | 2021-09-08 | 2021-09-08 | 一种时空感知的用户风险识别模型训练的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111050237.7A CN113505369B (zh) | 2021-09-08 | 2021-09-08 | 一种时空感知的用户风险识别模型训练的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113505369A true CN113505369A (zh) | 2021-10-15 |
CN113505369B CN113505369B (zh) | 2021-12-10 |
Family
ID=78016939
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111050237.7A Active CN113505369B (zh) | 2021-09-08 | 2021-09-08 | 一种时空感知的用户风险识别模型训练的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113505369B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114708109A (zh) * | 2022-03-01 | 2022-07-05 | 上海钐昆网络科技有限公司 | 风险识别模型的训练方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679982A (zh) * | 2017-09-29 | 2018-02-09 | 电子科技大学 | 一种基于点过程的信用卡风险检测方法 |
CN108985553A (zh) * | 2018-06-05 | 2018-12-11 | 中国平安人寿保险股份有限公司 | 一种异常用户的识别方法及设备 |
CN109359762A (zh) * | 2018-08-23 | 2019-02-19 | 阿里巴巴集团控股有限公司 | 风险预测模型生成方法、风险预测方法、装置及服务器 |
CN111652627A (zh) * | 2020-07-07 | 2020-09-11 | 中国银行股份有限公司 | 风险评估方法及装置 |
-
2021
- 2021-09-08 CN CN202111050237.7A patent/CN113505369B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679982A (zh) * | 2017-09-29 | 2018-02-09 | 电子科技大学 | 一种基于点过程的信用卡风险检测方法 |
CN108985553A (zh) * | 2018-06-05 | 2018-12-11 | 中国平安人寿保险股份有限公司 | 一种异常用户的识别方法及设备 |
CN109359762A (zh) * | 2018-08-23 | 2019-02-19 | 阿里巴巴集团控股有限公司 | 风险预测模型生成方法、风险预测方法、装置及服务器 |
CN111652627A (zh) * | 2020-07-07 | 2020-09-11 | 中国银行股份有限公司 | 风险评估方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114708109A (zh) * | 2022-03-01 | 2022-07-05 | 上海钐昆网络科技有限公司 | 风险识别模型的训练方法、装置、设备及存储介质 |
CN114708109B (zh) * | 2022-03-01 | 2022-11-11 | 上海钐昆网络科技有限公司 | 风险识别模型的训练方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113505369B (zh) | 2021-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230316076A1 (en) | Unsupervised Machine Learning System to Automate Functions On a Graph Structure | |
CN112633962B (zh) | 业务推荐方法、装置、计算机设备和存储介质 | |
US10558987B2 (en) | System identification framework | |
US11080376B2 (en) | Anonymous cross-device, cross-channel, and cross-venue user identification using adaptive deep learning | |
KR102359090B1 (ko) | 실시간 기업정보시스템 이상행위 탐지 서비스를 제공하는 방법과 시스템 | |
CN111639690A (zh) | 基于关系图谱学习的欺诈分析方法、系统、介质及设备 | |
US20120022920A1 (en) | Eliciting customer preference from purchasing behavior surveys | |
CN110543565A (zh) | 基于卷积神经网络模型的审计方法、系统和可读存储介质 | |
CN111181757A (zh) | 信息安全风险预测方法、装置以及计算设备、存储介质 | |
CN114693192A (zh) | 风控决策方法、装置、计算机设备和存储介质 | |
CN113505369B (zh) | 一种时空感知的用户风险识别模型训练的方法及装置 | |
CN107220742B (zh) | 一种基于系统脆弱性分析的信息系统开发通用支撑方法及平台 | |
CN111339163B (zh) | 获取用户流失状态的方法、装置、计算机设备和存储介质 | |
CN112990989A (zh) | 价值预测模型输入数据生成方法、装置、设备和介质 | |
CN112347457A (zh) | 异常账户检测方法、装置、计算机设备和存储介质 | |
CN115689571A (zh) | 异常用户行为监测方法、装置、设备和介质 | |
CN115630221A (zh) | 终端应用界面展示数据处理方法、装置及计算机设备 | |
KR102296420B1 (ko) | 개인정보보호 정책서 분석 기반 개인정보 수집/활용자의 신뢰도 평가 방법 및 장치 | |
CN111737319A (zh) | 用户集群的预测方法、装置、计算机设备和存储介质 | |
Yao | Application of sensor-based speech data mining in E-commerce operations data analysis | |
CN114595323B (zh) | 画像构建、推荐、模型训练方法、装置、设备及存储介质 | |
CN116805039B (zh) | 特征筛选方法、装置、计算机设备和数据扰动方法 | |
CN116484230B (zh) | 识别异常业务数据的方法及ai数字人的训练方法 | |
US20220067034A1 (en) | Collection, structuring, and storage of personal data of a user of an online service | |
CN116542762A (zh) | 用户风险决策方法、装置、计算机设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |