CN113283822A - 一种特征处理方法及装置 - Google Patents

一种特征处理方法及装置 Download PDF

Info

Publication number
CN113283822A
CN113283822A CN202110835193.2A CN202110835193A CN113283822A CN 113283822 A CN113283822 A CN 113283822A CN 202110835193 A CN202110835193 A CN 202110835193A CN 113283822 A CN113283822 A CN 113283822A
Authority
CN
China
Prior art keywords
behavior
feature
pool
model
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110835193.2A
Other languages
English (en)
Inventor
张长浩
傅欣艺
申书恒
王维强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202110835193.2A priority Critical patent/CN113283822A/zh
Publication of CN113283822A publication Critical patent/CN113283822A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书实施例提供一种特征处理方法及装置,所述方法包括:应用于部署有若干业务预测模型的终端设备,终端设备在检测到用户针对终端设备的操作行为的情况下,对操作行为进行数字化编码,得到对应的行为特征;将行为特征存储于第一特征池,若干业务预测模型配置为,利用从第一特征池读取的已编码的行为特征序列,进行对应的业务预测。

Description

一种特征处理方法及装置
技术领域
本说明书涉及数据处理技术领域,尤其涉及一种特征处理方法及装置。
背景技术
随着终端智能的基础建设越来越先进,各种用于业务预测的网络模型被逐渐部署于终端设备上,例如,电子支付的安全风险防控场景中的风控模型被逐渐部署于终端设备上,用于针对终端设备上的电子支付场景进行风险预测。
在一些场景中,用于业务预测的网络模型计算的时效性要求较高,且在终端设备上为串行计算机制,而某些用于业务预测的网络模型,例如风控模型,计算时存在对同一数据重复处理的问题,这就导致其在计算过程中比较耗时。
因此,希望有改进的方案,可以解决用于业务预测的网络模型对数据的重复处理问题,进而优化耗时问题。
发明内容
本说明书实施例提供了一种特征处理方法及装置,通过根据本说明书实施例的技术方案,解决对数据的重复处理问题,优化用于业务预测的网络模型计算过程的耗时。
在本说明书第一方面,提供一种特征处理方法,应用于终端设备,所述终端设备部署有若干业务预测模型,包括:
在检测到用户针对所述终端设备的操作行为的情况下,对所述操作行为进行数字化编码,得到对应的行为特征;
将所述行为特征存储于第一特征池,所述若干业务预测模型配置为,利用从所述第一特征池读取的已编码的行为特征序列,进行对应的业务预测。
一种可实施方式,所述对所述操作行为进行数字化编码,包括:
利用预设编码算法,对所述操作行为进行数字化编码,其中,所述预设编码算法包括如下之一:哈希取模算法、特征映射编码算法、预设特征编码算法。
一种可实施方式,所述第一特征池具有预设容量,所述预设容量用于存储预设数目的行为特征;所述预设数目不小于所述若干业务预测模型所需行为特征的最大个数。
一种可实施方式,所述将所述行为特征存储于第一特征池,包括:
判断所述第一特征池是否被占满;
若判断所述第一特征池未被占满,将所述行为特征添加到所述第一特征池;
若判断所述第一特征池被占满,则丢弃所述第一特征池最早存储的历史行为特征,并在所述第一特征池中存储所述行为特征。
一种可实施方式,所述第一特征池包括队列形式的多个存储位置;所述在所述第一特征池中存储所述行为特征,包括:
分别将第一特征池中已存储的各历史行为特征,转存至更接近队列头部的前一存储位置;
将所述行为特征存储至队列末尾的存储位置。
一种可实施方式,所述在所述第一特征池中存储所述行为特征,包括:
在所述第一特征池中存储所述行为特征及其对应的时间戳。
一种可实施方式,还包括:
将所述行为特征输入目标递归网络模型,得到其所属会话对应的会话特征,其中,所述目标递归网络模型为用于确定各会话对应的会话特征的模型;
将所述会话特征,存储于第二特征池中。
一种可实施方式,还包括:
从所述第一特征池读取所述行为特征之前的指定数目个历史行为特征;
将所述行为特征以及所述历史行为特征,输入所述若干业务预测模型中的第一业务预测模型,得到对应的第一预测结果。
一种可实施方式,还包括:
从所述第二特征池读取最新的会话特征;
将所读取的会话特征,输入所述若干业务预测模型中的第二业务预测模型,得到对应的第二预测结果。
一种可实施方式,第一特征池存储于所述终端设备的内存中。
一种可实施方式,所述若干业务预测模型包括以下中的至少一个:风控模型,推荐模型,用户分类模型。
一种可实施方式,所述若干业务预测模型包括风控模型,所述风控模型包括以下中的一个或多个:欺诈交易检测模型,账户盗用检测模型,终端设备丢失检测模型。
在本说明书第二方面,提供一种特征处理装置,应用于终端设备,所述终端设备部署有若干业务预测模型,包括:
编码模块,配置为在检测到用户针对所述终端设备的操作行为的情况下,对所述操作行为进行数字化编码,得到对应的行为特征;
第一存储模块,配置为将所述行为特征存储于第一特征池,所述若干业务预测模型配置为,利用从所述第一特征池读取的已编码的行为特征序列,进行对应的业务预测。
在本说明书第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行本说明书一个或多个实施例所提供的所述特征处理方法。
在本说明书第四方面,提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现本说明书一个或多个实施例所提供的所述特征处理方法。
根据本说明书一个或多个实施例所提供的特征处理方法及装置,在检测到用户针对终端设备的操作行为的情况下,对实时产生的操作行为进行数字化编码,得到对应的行为特征,并将其存储于第一特征池,以供终端设备部署的若干业务预测模型的使用。任一业务预测模型在进行计算时,可以直接从第一特征池中读取计算所需的已编码的行为特征序列,利用该行为特征序列进行对应的业务预测,解决了对数据的重复编码处理问题,优化了业务预测模型计算过程的耗时,降低对用户的操作行为的计算资源的整体消耗。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出了本说明书披露的一个实施例的实施框架示意图;
图2示出了本说明书实施例提供的特征处理方法的一种流程示意图;
图3示出了第一特征池存储行为特征的一种示意图;
图4示出了本说明书实施例提供的特征处理方法的另一种流程示意图;
图5示出了会话特征获得的一种示意图;
图6示出了本说明书实施例提供的特征处理装置的一种框架示意图。
具体实施方式
下面将结合附图详细描述本说明书实施例的技术方案。
本说明书实施例披露一种特征处理方法及装置,下面对特征处理的应用场景和发明构思进行介绍,具体如下:
随着终端智能的基础建设越来越先进,各种用于业务预测的网络模型被逐渐部署于终端设备上。在一些场景中,用于业务预测的网络模型计算的时效性要求较高,且在终端设备上为串行计算机制,而某些用于业务预测的网络模型,例如风控模型,计算时存在对同一数据重复处理的问题,从而导致其在计算过程中比较耗时。
以风控模型为例进行说明。在一种示例场景下,风控模型A和B在计算时都需要使用数据1-5,即风控模型A在计算时需要先对数据1-5进行编码相关处理,再利用处理后的数据1-5进行对应的业务预测。风控模型B在计算时,也需要先对数据1-5进行上述处理,再利用处理后的数据1-5进行对应的业务预测。不同风控模型A和B在计算时出现对数据1-5重复处理的问题。
在另一种示例场景中,风控模型C在计算时需要利用终端设备最近5个时刻所采集的数据。例如:风控模型C在时刻5进行计算时,其最近5个时刻所采集的数据为时刻1-5所采集的数据,相应的,风控模型C对终端设备时刻1-5所采集的数据分别进行编码相关处理,再利用处理后的时刻1-5所采集的数据进行对应的业务预测。风控模型C在时刻6进行计算时,其最近5个时刻所采集的数据为时刻2-6所采集的数据,相应的,风控模型C对终端设备时刻2-6所采集的数据分别进行上述处理,再利用处理后的时刻2-6所采集的数据进行对应的业务预测。因此,同一风控模型C在不同时刻(时刻5和时刻6)的计算过程中,出现对时刻2-4所采集的数据重复处理的问题。由此可见,上述示例场景中均出现对数据重复处理的问题。
鉴于此,本说明书实施例提供了一种特征处理方法,应用于终端设备。如图1所示,终端设备部署有若干业务预测模型,例如示出为业务预测模型1,业务预测模型2,…,业务预测模型n。终端设备在检测到用户针对终端设备的操作行为的情况下,采集该操作行为,将该操作行为输入终端设备的编码模块。编码模块对该操作行为进行相应编码,得到对应的行为特征,进而将行为特征存储于终端设备的第一特征池中,以供该若干业务预测模型的使用。其中,所采集的该操作行为通常为字符型,为了保证业务模型的正常使用,相应的,上述相应编码可以是:将字符型的操作行为进行数字化编码,得到对应的数字化的行为特征。后续的,将行为特征存储于第一特征池。若干业务预测模型在进行计算时,可以直接利用从第一特征池读取的已编码的行为特征序列,进行对应的业务预测。
一个实施例中,若干业务预测模型可以包括以下中的至少一个:风控模型,推荐模型,用户分类模型。其中,风控模型可以利用用户的行为特征序列进行相应的风险评估。推荐模型可以利用用户的行为特征序列进行信息、商品的推荐。用户分类模型可以利用用户的行为特征序列对用户进行分类。
本实施例中,在检测到用户针对终端设备的操作行为的情况下,对实时产生的操作行为进行数字化编码,得到对应的行为特征,并将其存储于第一特征池,以供终端设备部署的若干业务预测模型的使用。任一业务预测模型在进行计算时,可以直接从第一特征池中读取计算所需的已编码的行为特征序列,利用该行为特征序列进行对应的业务预测,解决了对数据的重复编码处理问题,优化了业务预测模型计算过程的耗时,降低对用户的操作行为的计算资源的整体消耗。
并且,本实施例中,针对实时新增的操作行为进行相应的数字化编码,并存储编码所得的行为特征,以供上层若干业务预测模型的使用,相应的,本方案实现了一种对公共底层数据(如操作行为)的计算和提取的增量式框架的构建。
下面结合具体实施例,对本说明书提供的特征处理方法进行详细阐述。
图2示出了本说明书提供的特征处理方法的一种流程示意图。该方法应用于终端设备。该终端设备可以是任一具有数据计算、处理和存储的设备,例如可以为电脑、手机、平板电脑、智能手表和支付卡等。本说明书一个实施例中,该终端设备部署有若干业务预测模型,所述方法可以包括如下步骤S210-S220:
S210:在检测到用户针对终端设备的操作行为的情况下,对操作行为进行数字化编码,得到对应的行为特征。一种实现中,终端设备可以实时对用户针对终端设备的操作行为进行检测,在检测到用户针对终端设备的操作行为的情况下,采集该操作行为。其中,采集的操作行为通常为字符型。为了保证业务预测模型的正常使用,需要将字符型的数据转化为数字型的数据。相应的,终端设备对字符型的操作行为进行数字化编码,得到对应的数字化的行为特征。该行为特征为:可以抽象表征所对应操作行为的特征,相应的,也可以称行为特征为所对应操作行为的表征。
在一种情况中,若干业务预测模型可以是:针对安装于终端设备的目标应用进行业务预测的模型。相应的,用户针对终端设备的操作行为可以是:用户针对目标应用的操作行为。也就是说,终端设备在检测到目标应用被启动之后,可以实时检测用户在目标应用的相关显示界面上的操作行为。一个实施例中,目标应用可以是某电子支付应用,也可以是电子银行应用或者手机钱包应用。以目标应用为电子支付应用为例,该操作行为可以包括:进入应用首页,进入“我的”页面,进入花呗页面,进入“我的账单”页面等。一种情况中,该一系列操作行为可以表示为:应用首页->“我的”页面->花呗页面-> “我的账单”页面。
本说明书的一个实施例中,若干业务预测模型可以包括以下中的至少一个:风控模型,推荐模型,用户分类模型。其中,风控模型可以利用用户的行为特征序列进行相应的风险评估。推荐模型可以利用用户的行为特征序列进行信息、商品等的推荐。用户分类模型可以利用用户的行为特征序列对用户进行分类。
一种实现方式中,若干业务预测模型包括风控模型,且风控模型可以包括以下中的一个或多个:欺诈交易检测模型,账户盗用检测模型,终端设备丢失检测模型。
其中,欺诈交易检测模型可以根据用户的一系列操作行为对应的行为特征序列进行欺诈交易检测,确定该一系列行为特征序列是否表征用户正在进行的交易为欺诈交易。一种情况,终端设备所检测到的操作行为可以是用户针对某一账户进行的操作,相应的,该账户盗用检测模型可以根据用户的一系列操作行为对应的行为特征,检测该账户是否被盗用。终端设备丢失检测模型可以根据用户的一系列操作行为对应的行为特征序列,检测该终端设备是否处于丢失状态,即检测该用户是否为终端设备的所有者。进而终端设备可以基于业务预测模型所确定的结果实施相应的保障措施。
需要说明的是,在以上描述中,上述若干业务预测模型均需要利用行为特征序列进行业务预测,但是可以理解的是,根据其预测业务的不同,各个模型的预测还可以借助和需要其他输入特征。例如,推荐模型还需要利用备选商品特征,用户分类模型还需要利用用户属性特征,等等。由于在本说明书中,主要关注各个业务预测模型共同需要的行为特征,因此对于各个模型各自需要的专属特征输入不进行详细描述和枚举。
在本说明书的一个实施例中,在所述S210,可以包括如下步骤:利用预设编码算法,对操作行为进行数字化编码。其中,预设编码算法可以包括如下之一:哈希取模算法、特征映射编码算法、预设特征编码算法。预设特征编码算法可以包括但不限于:独热编码、标签编码。
一种实现中,预设编码算法为哈希取模算法的情况下,该对操作行为进行数字化编码的过程,可以是:对操作行为进行哈希值计算,得到操作行为对应的哈希值,对操作行为对应的哈希值进行取模,得到取模结果,将取模结果确定为操作行为对应的行为特征。
另一种实现中,预设编码算法为特征映射编码算法的情况下,终端设备可以预置有映射关系,该映射关系中包括各操作行为与编码特征的对应关系。该对操作行为进行数字化编码的过程,可以是:从前述映射关系中,查找终端设备所检测到的该操作行为对应的编码特征,将查找到的编码特征确定为该操作行为对应的行为特征。
另一种实现中,预设编码算法为预设特征编码算法的情况下,该对操作行为进行数字化编码的过程,可以是:利用预设特征编码算法对操作行为进行编码,将编码所得的结果确定为该操作行为对应的行为特征。
举例而言,在一种编码算法下,若操作行为为进入花呗页面,对应的行为特征编码可以为:2835;若操作行为为进入“我的账单”页面,对应的行为特征编码可以为:4256。
S220:将行为特征存储于第一特征池。若干业务预测模型配置为,利用从第一特征池读取的已编码的行为特征序列,进行对应的业务预测。
终端设备得到行为特征之后,将行为特征存储于第一特征池。可以理解的,若干业务预测模型可以预先与第一特征池关联,相应的,若干业务预测模型可以利用从第一特征池读取的其计算所需的已编码的行为特征序列进行对应的业务预测。
一个实施例中,该第一特征池具有预设容量,预设容量用于存储预设数目的行为特征;该预设数目不小于若干业务预测模型所需行为特征的最大个数,从而保证各业务预测模型在计算时可以从第一特征池中获得其计算所需的行为特征。举例而言,第一特征池关联的业务预测模型分别为业务预测模型A、业务预测模型B和业务预测模型C。其中,业务预测模型A进行业务预测需要使用最近编码所得的3个行为特征,业务预测模型B进行业务预测需要使用最近编码所得的5个行为特征,业务预测模型C进行业务预测需要使用最近编码所得的10个行为特征,10为上述业务预测模型所需行为特征的最大个数,相应的,确定预设数目可以为10,或者为大于10的数值。
一个实施例中,考虑到业务预测模型的时效性,第一特征池可以存储于终端设备的内存中。如此,业务预测模型进行计算时,可以快速地从内存中读取已编码的行为特征序列,直接利用读取的内存数据进行对应的业务预测,保证其时效性。
本实施例中,在检测到用户针对终端设备的操作行为的情况下,对实时产生的操作行为进行数字化编码,得到对应的行为特征,并将其存储于第一特征池,以供终端设备部署的若干业务预测模型的使用。任一业务预测模型在进行计算时,可以直接从第一特征池中读取计算所需的已编码的行为特征序列,利用该行为特征序列进行对应的业务预测,解决了对数据的重复编码处理问题,优化了业务预测模型计算过程的耗时,降低对用户的操作行为的计算资源的整体消耗。
在本说明书的一个实施例中,前述S220,可以包括如下步骤11-13:
步骤11:判断第一特征池是否被占满。
步骤12:若判断第一特征池未被占满,将行为特征添加到第一特征池。
步骤13:若判断第一特征池被占满,则丢弃第一特征池最早存储的历史行为特征,并在第一特征池中存储该行为特征。
考虑到第一特征池的存储空间有限,终端设备得到操作行为对应的行为特征之后,可以首先判断第一特征池是否被占满,若判断第一特征池未被占满,则可以直接将行为特征添加至第一特征池。若判断第一特征池被占满,从第一特征池中确定出最早存储的历史行为特征,丢弃该最早存储的历史行为特征,并在第一特征池中存储该行为特征。
一种实施例中,第一特征池可以包括队列形式的多个存储位置,第一特征池以先进先出的方式存储行为特征,相应的,第一特征池中最早存储的历史行为特征为:队列头部存储的行为特征。在本说明书的一个实施例中,在步骤13,丢弃第一特征池最早存储的行为特征之后,可以包括如下步骤131-132:
步骤131:分别将第一特征池中已存储的各历史行为特征,转存至更接近队列头部的前一存储位置。其中,本说明书中的历史行为特征中的“历史”是相对于终端设备最新编码得到行为特征而言的。
步骤132:将行为特征存储至队列末尾的存储位置。
如图3所示,为第一特征池存储行为特征的一种示意图。其中,第一特征池具有用于存储5个行为特征的预设容量,且第一特征池已存储有5个行为特征,依次为f4、f5、f6、f7以及f8,其中,f4-f8分别为:终端设备以时间先后顺序,依次将采集到的操作行为t4、t5、t6、t7以及t8分别进行数字化编码所得的行为特征。终端设备在检测到用户针对终端设备的操作行为t9的情况下,对操作行为t9进行数字化编码,得到对应的行为特征f9。终端设备判断第一特征池被占满,相应的,将f4丢弃,保留f5-f8,将f5-f8转存至更接近队列头部的前一存储位置,即依次将f5转存至f4的存储位置,将f6转存至f5的存储位置,将f7转存至f6的存储位置,将f8转存至f7的存储位置。在队列末尾的存储位置即f8转存之前的存储位置存储f9。
在一种实施方式中,若判断第一特征池未被占满,将行为特征存储至最靠近队列头部的未存储特征的存储位置。
另一种实施例中,第一特征池中还可以存储有各历史行为特征对应的时间戳,该时间戳可以表征出所对应历史行为特征存储于第一特征池的先后顺序。第一特征池中最早存储的历史行为特征为:第一特征池中所对应时间戳最早的历史行为特征。相应的,在本说明书的另一个实施例中,步骤13,丢弃第一特征池最早存储的行为特征之后,可以包括如下步骤133:在第一特征池中存储该行为特征及其对应的时间戳。其中,丢弃第一特征池最早存储的行为特征可以是:丢弃第一特征池最早存储的行为特征及其对应的时间戳。
另一种实现方式中,若判断第一特征池未被占满,直接在第一特征池中存储该行为特征及其对应的时间戳。
一种实施方式中,业务预测模型可以在其预测周期到来时,利用从第一特征池读取的其计算所需的已编码的行为特征序列,进行业务预测,其中,不同业务预测模型的预测周期可以相同也可以不同。另一种实施方式中,业务预测模型也可以配置为,每当第一特征池存储一次新的行为特征,就利用从第一特征池读取的行为特征序列进行业务预测。在本说明书的一个实施例中,在图1所示流程的基础上,如图4所示,所述方法还可以包括S230-S240:
S230:从第一特征池读取该行为特征之前的指定数目个历史行为特征。
S240:将该行为特征以及该历史行为特征,输入若干业务预测模型中的第一业务预测模型,得到对应的第一预测结果。
其中,指定数目小于或等于预设数目减一。该指定数目为基于第一业务预测模型计算所需的行为特征的个数确定的数目,具体的,该指定数目等于第一业务预测模型计算所需的行为特征的个数减一。
一种可实施方式中,终端设备在得到所检测的操作行为对应的行为特征之后,直接从第一特征池读取该行为特征之前的指定数目个历史行为特征,将该行为特征以及该历史行为特征,组成行为特征序列,将该行为特征序列输入若干业务预测模型中的第一业务预测模型,第一业务预测模型基于所输入的行为特征序列进行业务预测,得到对应的第一预测结果。
另一种可实施方式中,终端设备在得到所检测的操作行为对应的行为特征之后,判断第一业务预测模型的预测周期是否到来,在确定第一业务预测模型的预测周期到来的情况下,从第一特征池读取该行为特征之前的指定数目个历史行为特征,并执行后续步骤。
其中,此处第一业务预测模型中的“第一”并不表示顺序或其他方面的限定,而是泛指某一个或任一个。
若干业务预测模型可以是:针对安装于终端设备的目标应用进行业务预测的模型。相应的,用户针对终端设备的操作行为可以是:用户针对目标应用的操作行为。其中,从启动目标应用到关闭该目标应用或将目标应用押入后台,可以称为一次会话session。一次会话可以包括用户针对目标应用执行的若干操作行为。一个实施例中,业务预测模型可以利用一次会话中的若干操作行为对应的行为特征,进行对应的业务预测。
在本说明书的一个实施例中,为了在一定程度上提高业务预测模型的时效性,终端设备本地或所连接的存储设备中可以预存有目标递归网络模型,该目标递归网络模型为预先基于样本会话及其对应的标签信息训练所得的模型,其用于确定各会话对应的会话特征。相应的,在图1所示流程基础上,所述方法还可以包括如下步骤21-22:
步骤21:将行为特征输入目标递归网络模型,得到其所属会话对应的会话特征。其中,目标递归网络模型为用于确定各会话对应的会话特征的模型。该会话特征可以为所对应会话中若干操作行为对应的行为特征压缩后的抽象特征,或称为会话状态表征stateembedding,该会话状态表征可以作为会话中一系列行为特征序列的累积压缩信息。在一次会话中,每次编码得到新的行为特征,将新的行为特征输入目标递归网络模型,得到其所属会话对应的会话特征,即更新该次会话对应的状态表征state embedding。如图5所示,一次会话中,新的操作行为t9被检测到,终端设备对t9进行数字化编码,得到对应的行为特征f9,将行为特征f9输入目标递归网络模型,得到其所属会话对应的新的会话特征stateembedding。f0-f8为f9所属会话所包含的历史操作行为编码所得的行为特征。
步骤22:将会话特征,存储于第二特征池中。其中,该第二特征池可以为与第一特征池不同的特征池,也可以为与第一特征池相同的特征池。该第二特征池可以存储于终端设备的内存中。
需要说明的,步骤21-22可以在S210之后、 S220之前执行,也可以在S220之后执行。
一种可实施方式中,该目标递归网络模型可以包括但不限于:门控循环单元GRU(Gated Recurrent Unit)模型、长短时记忆LSTM(Long short term memory)网络模型。
在一个实施例中,在一次会话结束时,本次特征处理方法流程结束,相应的,第一特征池存储的行为特征以及第二特征池存储的会话特征被丢弃。目标递归网络模型内各参数的数值重置成本次特征处理方法流程开始之前的初始值。
在本说明书的一个实施例中,在步骤22之后,还可以包括如下步骤23-24:
步骤23:从第二特征池读取最新的会话特征。
步骤24:将所读取的会话特征,输入若干业务预测模型中的第二业务预测模型,得到对应的第二预测结果。其中,此处第二业务预测模型中的“第二”并不表示顺序或其他方面的限定,而是泛指某一个或任一个。
本实现方式中,若存在某些或某个业务预测模型信任目标递归网络模型的递归结果,相应的,在第二业务预测模型的预测周期到来,或者在第二特征池每存储一个新的会话特征的情况下,终端设备可以直接从第二特征池读取最新的会话特征,将所读取的会话特征,输入若干业务预测模型中的第二业务预测模型,得到对应的第二预测结果。如此,可以在一定程度上降低第二业务预测模型计算过程中的时间消耗,降低终端设备的计算资源的占用,提高业务预测模型的时效性。
上述内容对本说明书的特定实施例进行了描述,其他实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行,并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要按照示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的,或者可能是有利的。
相应于上述方法实施例,如图6所示,本说明书实施例提供了一种特征处理装置600,应用于终端设备,所述终端设备部署有若干业务预测模型,包括:
编码模块610,配置为在检测到用户针对所述终端设备的操作行为的情况下,对所述操作行为进行数字化编码,得到对应的行为特征;
第一存储模块620,配置为将所述行为特征存储于第一特征池,所述若干业务预测模型配置为,利用从所述第一特征池读取的已编码的行为特征序列,进行对应的业务预测。
在一种可实施方式中,所述编码模块610,具体配置为利用预设编码算法,对所述操作行为进行数字化编码,其中,所述预设编码算法包括如下之一:哈希取模算法、特征映射编码算法、预设特征编码算法。
在一种可实施方式中,所述第一特征池具有预设容量,所述预设容量用于存储预设数目的行为特征;所述预设数目不小于所述若干业务预测模型所需行为特征的最大个数。
在一种可实施方式中,所述第一存储模块620,包括:
判断单元(图中未示出),配置为判断所述第一特征池是否被占满;
添加单元(图中未示出),配置为若判断所述第一特征池未被占满,将所述行为特征添加到所述第一特征池;
丢弃单元(图中未示出),配置为若判断所述第一特征池被占满,则丢弃所述第一特征池最早存储的历史行为特征;
存储单元(图中未示出),配置为在所述第一特征池中存储所述行为特征。
在一种可实施方式中,所述第一特征池包括队列形式的多个存储位置;所述存储单元,具体配置为分别将第一特征池中已存储的各历史行为特征,转存至更接近队列头部的前一存储位置;
将所述行为特征存储至队列末尾的存储位置。
在一种可实施方式中,所述存储单元,具体配置为在所述第一特征池中存储所述行为特征及其对应的时间戳。
在一种可实施方式中,还包括:第一输入模块(图中未示出),配置为将所述行为特征输入目标递归网络模型,得到其所属会话对应的会话特征,其中,所述目标递归网络模型为用于确定各会话对应的会话特征的模型;
第二存储模块(图中未示出),配置为将所述会话特征,存储于第二特征池中。
在一种可实施方式中,还包括:第一读取模块(图中未示出),配置为从所述第一特征池读取所述行为特征之前的指定数目个历史行为特征;
第二输入模块(图中未示出),配置为将所述行为特征以及所述历史行为特征,输入所述若干业务预测模型中的第一业务预测模型,得到对应的第一预测结果。
在一种可实施方式中,还包括:
第二读取模块(图中未示出),配置为从所述第二特征池读取最新的会话特征;
第三输入模块(图中未示出),配置为将所读取的会话特征,输入所述若干业务预测模型中的第二业务预测模型,得到对应的第二预测结果。
在一种可实施方式中,第一特征池存储于所述终端设备的内存中。
在一种可实施方式中,所述若干业务预测模型包括以下中的至少一个:风控模型,推荐模型,用户分类模型。
在一种可实施方式中,所述若干业务预测模型包括风控模型,所述风控模型包括以下中的一个或多个:欺诈交易检测模型,账户盗用检测模型,终端设备丢失检测模型
上述装置实施例与方法实施例相对应,具体说明可以参见方法实施例部分的描述,此处不再赘述。装置实施例是基于对应的方法实施例得到,与对应的方法实施例具有同样的技术效果,具体说明可参见对应的方法实施例。
本说明书实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行本说明书所提供的所述特征处理方法。
本说明书实施例还提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现本说明书所提供的所述特征处理方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于存储介质和计算设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本说明书实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本说明书实施例的目的、技术方案和有益效果进行了进一步的详细说明。所应理解的是,以上所述仅为本说明书实施例的具体实施方式而已,并不用于限定本说明书的保护范围,凡在本说明书的技术方案的基础之上所做的任何修改、等同替换、改进等,均应包括在本说明书的保护范围之内。

Claims (25)

1.一种特征处理方法,应用于终端设备,所述终端设备部署有若干业务预测模型,包括:
在检测到用户针对所述终端设备的操作行为的情况下,对所述操作行为进行数字化编码,得到对应的行为特征;
将所述行为特征存储于第一特征池,所述若干业务预测模型配置为,利用从所述第一特征池读取的已编码的行为特征序列,进行对应的业务预测。
2.根据权利要求1所述的方法,其中,所述对所述操作行为进行数字化编码,包括:
利用预设编码算法,对所述操作行为进行数字化编码,其中,所述预设编码算法包括如下之一:哈希取模算法、特征映射编码算法、预设特征编码算法。
3.根据权利要求1所述的方法,其中,所述第一特征池具有预设容量,所述预设容量用于存储预设数目的行为特征;所述预设数目不小于所述若干业务预测模型所需行为特征的最大个数。
4.根据权利要求1所述的方法,其中,所述将所述行为特征存储于第一特征池,包括:
判断所述第一特征池是否被占满;
若判断所述第一特征池未被占满,将所述行为特征添加到所述第一特征池;
若判断所述第一特征池被占满,则丢弃所述第一特征池最早存储的历史行为特征,并在所述第一特征池中存储所述行为特征。
5.根据权利要求4所述的方法,其中,所述第一特征池包括队列形式的多个存储位置;所述在所述第一特征池中存储所述行为特征,包括:
分别将第一特征池中已存储的各历史行为特征,转存至更接近队列头部的前一存储位置;
将所述行为特征存储至队列末尾的存储位置。
6.根据权利要求4所述的方法,其中,所述在所述第一特征池中存储所述行为特征,包括:
在所述第一特征池中存储所述行为特征及其对应的时间戳。
7.根据权利要求1-6任一项所述的方法,还包括:
将所述行为特征输入目标递归网络模型,得到其所属会话对应的会话特征,其中,所述目标递归网络模型为用于确定各会话对应的会话特征的模型;
将所述会话特征,存储于第二特征池中。
8.根据权利要求1-6任一项所述的方法,还包括:
从所述第一特征池读取所述行为特征之前的指定数目个历史行为特征;
将所述行为特征以及所述历史行为特征,输入所述若干业务预测模型中的第一业务预测模型,得到对应的第一预测结果。
9.根据权利要求7所述的方法,还包括:
从所述第二特征池读取最新的会话特征;
将所读取的会话特征,输入所述若干业务预测模型中的第二业务预测模型,得到对应的第二预测结果。
10.根据权利要求1所述的方法,其中,第一特征池存储于所述终端设备的内存中。
11.根据权利要求1所述的方法,其中,所述若干业务预测模型包括以下中的至少一个:风控模型,推荐模型,用户分类模型。
12.根据权利要求1所述的方法,其中,所述若干业务预测模型包括风控模型,所述风控模型包括以下中的一个或多个:欺诈交易检测模型,账户盗用检测模型,终端设备丢失检测模型。
13.一种特征处理装置,应用于终端设备,所述终端设备部署有若干业务预测模型,包括:
编码模块,配置为在检测到用户针对所述终端设备的操作行为的情况下,对所述操作行为进行数字化编码,得到对应的行为特征;
第一存储模块,配置为将所述行为特征存储于第一特征池,所述若干业务预测模型配置为,利用从所述第一特征池读取的已编码的行为特征序列,进行对应的业务预测。
14.根据权利要求13所述的装置,其中,所述编码模块,具体配置为利用预设编码算法,对所述操作行为进行数字化编码,其中,所述预设编码算法包括如下之一:哈希取模算法、特征映射编码算法、预设特征编码算法。
15.根据权利要求13所述的装置,其中,所述第一特征池具有预设容量,所述预设容量用于存储预设数目的行为特征;所述预设数目不小于所述若干业务预测模型所需行为特征的最大个数。
16.根据权利要求13所述的装置,其中,所述第一存储模块,包括:
判断单元,配置为判断所述第一特征池是否被占满;
添加单元,配置为若判断所述第一特征池未被占满,将所述行为特征添加到所述第一特征池;
丢弃单元,配置为若判断所述第一特征池被占满,则丢弃所述第一特征池最早存储的历史行为特征;
存储单元,配置为在所述第一特征池中存储所述行为特征。
17.根据权利要求16所述的装置,其中,所述第一特征池包括队列形式的多个存储位置;所述存储单元,具体配置为分别将第一特征池中已存储的各历史行为特征,转存至更接近队列头部的前一存储位置;
将所述行为特征存储至队列末尾的存储位置。
18.根据权利要求16所述的方法,其中,所述存储单元,具体配置为在所述第一特征池中存储所述行为特征及其对应的时间戳。
19.根据权利要求13-18任一项所述的装置,还包括:
第一输入模块,配置为将所述行为特征输入目标递归网络模型,得到其所属会话对应的会话特征,其中,所述目标递归网络模型为用于确定各会话对应的会话特征的模型;
第二存储模块,配置为将所述会话特征,存储于第二特征池中。
20.根据权利要求13-18任一项所述的装置,还包括:
第一读取模块,配置为从所述第一特征池读取所述行为特征之前的指定数目个历史行为特征;
第二输入模块,配置为将所述行为特征以及所述历史行为特征,输入所述若干业务预测模型中的第一业务预测模型,得到对应的第一预测结果。
21.根据权利要求19所述的装置,还包括:
第二读取模块,配置为从所述第二特征池读取最新的会话特征;
第三输入模块,配置为将所读取的会话特征,输入所述若干业务预测模型中的第二业务预测模型,得到对应的第二预测结果。
22.根据权利要求13所述的装置,其中,第一特征池存储于所述终端设备的内存中。
23.根据权利要求13所述的装置,其中,所述若干业务预测模型包括以下中的至少一个:风控模型,推荐模型,用户分类模型。
24.根据权利要求13所述的装置,其中,所述若干业务预测模型包括风控模型,所述风控模型包括以下中的一个或多个:欺诈交易检测模型,账户盗用检测模型,终端设备丢失检测模型。
25.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-12任一项所述的方法。
CN202110835193.2A 2021-07-23 2021-07-23 一种特征处理方法及装置 Pending CN113283822A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110835193.2A CN113283822A (zh) 2021-07-23 2021-07-23 一种特征处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110835193.2A CN113283822A (zh) 2021-07-23 2021-07-23 一种特征处理方法及装置

Publications (1)

Publication Number Publication Date
CN113283822A true CN113283822A (zh) 2021-08-20

Family

ID=77287222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110835193.2A Pending CN113283822A (zh) 2021-07-23 2021-07-23 一种特征处理方法及装置

Country Status (1)

Country Link
CN (1) CN113283822A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108510280A (zh) * 2018-03-23 2018-09-07 上海氪信信息技术有限公司 一种基于移动设备行为数据的金融欺诈行为预测方法
CN109697614A (zh) * 2017-10-23 2019-04-30 北京京东金融科技控股有限公司 用于检测欺诈数据的方法及装置
WO2019119478A1 (zh) * 2017-12-20 2019-06-27 东莞理工学院 一种基于遗传算法的汇率分析方法
CN110232630A (zh) * 2019-05-29 2019-09-13 腾讯科技(深圳)有限公司 恶意账户识别方法、装置及存储介质
CN111222631A (zh) * 2020-01-17 2020-06-02 支付宝(杭州)信息技术有限公司 业务预测方法以及装置
CN111768247A (zh) * 2020-06-30 2020-10-13 深圳前海微众银行股份有限公司 下单率预测方法、设备及可读存储介质
CN111915086A (zh) * 2020-08-06 2020-11-10 上海连尚网络科技有限公司 异常用户预测方法和设备
CN112132345A (zh) * 2020-09-23 2020-12-25 深圳创新奇智科技有限公司 电商用户信息预测方法、装置、电子设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109697614A (zh) * 2017-10-23 2019-04-30 北京京东金融科技控股有限公司 用于检测欺诈数据的方法及装置
WO2019119478A1 (zh) * 2017-12-20 2019-06-27 东莞理工学院 一种基于遗传算法的汇率分析方法
CN108510280A (zh) * 2018-03-23 2018-09-07 上海氪信信息技术有限公司 一种基于移动设备行为数据的金融欺诈行为预测方法
CN110232630A (zh) * 2019-05-29 2019-09-13 腾讯科技(深圳)有限公司 恶意账户识别方法、装置及存储介质
CN111222631A (zh) * 2020-01-17 2020-06-02 支付宝(杭州)信息技术有限公司 业务预测方法以及装置
CN111768247A (zh) * 2020-06-30 2020-10-13 深圳前海微众银行股份有限公司 下单率预测方法、设备及可读存储介质
CN111915086A (zh) * 2020-08-06 2020-11-10 上海连尚网络科技有限公司 异常用户预测方法和设备
CN112132345A (zh) * 2020-09-23 2020-12-25 深圳创新奇智科技有限公司 电商用户信息预测方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN110442498B (zh) 异常数据节点的定位方法、装置、存储介质及计算机设备
CN111325417B (zh) 实现隐私保护的多方协同更新业务预测模型的方法及装置
CN110362999B (zh) 用于检测账户使用异常的方法及装置
CN111695051B (zh) 基于扫码的页面访问方法、装置、电子设备及存储介质
CN108063818B (zh) 数据下载方法、装置、终端和计算机可读存储介质
CN113283822A (zh) 一种特征处理方法及装置
CN110324208B (zh) 一种数据丢失处理方法、智能终端及存储介质
CN113435359A (zh) 一种图像识别方法
CN110598797B (zh) 故障的检测方法及装置、存储介质和电子装置
CN115035605B (zh) 基于深度学习的动作识别方法、装置、设备及存储介质
CN110634018A (zh) 一种流失用户的特征刻画方法、识别方法及相关装置
CN115774602A (zh) 一种容器资源的分配方法、装置、设备及存储介质
CN111263351B (zh) 业务处理方法、业务处理装置、电子设备及存储介质
CN113835950A (zh) 界面显示卡顿的识别方法、装置、存储介质及电子设备
CN113595797A (zh) 告警信息的处理方法、装置、电子设备及存储介质
CN113537087A (zh) 一种智慧交通信息处理方法、装置及服务器
CN112488625A (zh) 退回件识别方法、装置、设备以及存储介质
EP2953266B1 (en) Data compression device, data compression method, and program
CN113031982A (zh) 应用程序运行预测方法、装置以及电子设备
CN111641959A (zh) 一种网络环境信息的检测方法和装置
CN114706737B (zh) 崩溃告警方法、装置、系统、设备及可读存储介质
CN116820658B (zh) 一种云应用页面渲染方法、装置、设备及存储介质
CN113850499B (zh) 一种数据处理方法、装置、电子设备和存储介质
CN117201333A (zh) 限流阈值推荐方法、装置及电子设备
CN116245432A (zh) 业务数据分析方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination