发明内容
本说明书提出一种账户用途的识别方法,所述方法包括:
从交易数据样本集合中统计出与N个目标账户分别对应的M个维度的交易金额频次特征;其中,所述N个目标账户中至少包括K个携带用途标签,并且账户用途互不相同的的单用途账户;
基于所述N个目标账户以及所述M个维度的交易金额频次特征生成N*M维的目标矩阵;
基于预设的概率矩阵分解模型对所述目标矩阵进行矩阵分解,得到由所述N个目标账户以及与所述N个账户分别对应的K个维度的概率值生成的N*K维的目标子矩阵;
查找所述目标子矩阵中与所述单用途账户对应的目标向量,并基于各单用途账户的用途标签,对所述目标向量中取值最大的概率值对应的维度分别进行标记,得到由所述N个目标账户以及与所述N个账户分别对应的K个维度的被标记了用途标签的概率值生成的N*K维的目标子矩阵。
可选的,所述交易数据样本集合中交易数据样本包括账户标识、交易时间、交易场景以及交易金额;
所述交易金额频次特征包括各目标账户的交易金额分别落入多个预设的分位数区间的基础交易频次;以及,基于所述基础交易频次、交易时间以及交易场景交叉构建出的衍生交易频次。
可选的,所述衍生交易频次,包括:
各目标账户的交易金额落入各分位数区间的基础交易频次中,分别隶属于多个预设的交易场景的第一交易频次;以及,所述第一交易频次中,分别隶属于预设的多个交易时间段内的第二交易频次;或者,
各目标账户的交易金额落入各分位数区间的基础交易频次中,分别隶属于多个预设的交易时间段的第三交易频次;以及,所述第三交易频次中,分别隶属于预设的多个预设的交易场景的第四交易频次。
可选的,所述概率矩阵分解模型为概率主题模型;
所述基于预设的概率矩阵分解模型对所述目标矩阵进行矩阵分解,包括:
基于预设的概率主题模型,以及用户输入的矩阵分解参数对所述N*M维的目标矩阵进行矩阵分解;其中,所述矩阵分解参数包括所述K的取值。
可选的,所述概率主题模型为基于贝叶斯估计算法的概率主题模型。
可选的,所述方法还包括:
如果所述N*K维的目标子矩阵中,与任一目标账户对应的向量中,所述K个维度的概率值均相同,则计算该K个维度的概率值的信息熵;
判断计算出的所述信息熵是否大于预设阈值;
如果所述信息熵大于所述预设阈值,则确定该目标账户为多用途账户。
可选的,所述目标账户为支付客户端绑定的银行卡账户。
本说明书还提出一种账户用途的识别装置,所述装置包括:
提取模块,从交易数据样本集合中统计出与N个目标账户分别对应的M个维度的交易金额频次特征;其中,所述N个目标账户中至少包括K个携带用途标签,并且账户用途互不相同的的单用途账户;
生成模块,基于所述N个目标账户以及所述M个维度的交易金额频次特征生成N*M维的目标矩阵;
分解模块,基于预设的概率矩阵分解模型对所述目标矩阵进行矩阵分解,得到由所述N个目标账户以及与所述N个账户分别对应的K个维度的概率值生成的N*K维的目标子矩阵;
标记模块,查找所述目标子矩阵中与所述单用途账户对应的目标向量,并基于各单用途账户的用途标签,对所述目标向量中取值最大的概率值对应的维度分别进行标记,得到由所述N个目标账户以及与所述N个账户分别对应的K个维度的被标记了用途标签的概率值生成的N*K维的目标子矩阵。
可选的,所述交易数据样本集合中交易数据样本包括账户标识、交易时间、交易场景以及交易金额;
所述交易金额频次特征包括各目标账户的交易金额分别落入多个预设的分位数区间的基础交易频次;以及,基于所述基础交易频次、交易时间以及交易场景交叉构建出的衍生交易频次。
可选的,所述衍生交易频次,包括:
各目标账户的交易金额落入各分位数区间的基础交易频次中,分别隶属于多个预设的交易场景的第一交易频次;以及,所述第一交易频次中,分别隶属于预设的多个交易时间段内的第二交易频次;或者,
各目标账户的交易金额落入各分位数区间的基础交易频次中,分别隶属于多个预设的交易时间段的第三交易频次;以及,所述第三交易频次中,分别隶属于预设的多个预设的交易场景的第四交易频次。
可选的,所述概率矩阵分解模型为概率主题模型;
所述分解模块:
基于预设的概率主题模型,以及用户输入的矩阵分解参数对所述N*M维的目标矩阵进行矩阵分解;其中,所述矩阵分解参数包括所述K的取值。
可选的,所述概率主题模型为基于贝叶斯估计算法的概率主题模型。
可选的,所述装置还包括:
确定模块,如果所述N*K维的目标子矩阵中,与任一目标账户对应的向量中,所述K个维度的概率值均相同,则计算该K个维度的概率值的信息熵;
判断模块,判断计算出的所述信息熵是否大于预设阈值;
确定模块,如果所述信息熵大于所述预设阈值,则确定该目标账户为多用途账户。
可选的,所述目标账户为支付客户端绑定的银行卡账户。
本说明书还提出一种账户用途的识别装置,包括:
处理器;
用于存储机器可执行指令的存储器;
其中,通过读取并执行所述存储器存储的与账户用途的识别的控制逻辑对应的机器可执行指令,所述处理器被促使:
从交易数据样本集合中统计出与N个目标账户分别对应的M个维度的交易金额频次特征;其中,所述N个目标账户中至少包括K个携带用途标签,并且账户用途互不相同的的单用途账户;
基于所述N个目标账户以及所述M个维度的交易金额频次特征生成N*M维的目标矩阵;
基于预设的概率矩阵分解模型对所述目标矩阵进行矩阵分解,得到由所述N个目标账户以及与所述N个账户分别对应的K个维度的概率值生成的N*K维的目标子矩阵;
查找所述目标子矩阵中与所述单用途账户对应的目标向量,并基于各单用途账户的用途标签,对所述目标向量中取值最大的概率值对应的维度分别进行标记,得到由所述N个目标账户以及与所述N个账户分别对应的K个维度的被标记了用途标签的概率值生成的N*K维的目标子矩阵。
本说明书中,通过从交易数据样本集合中统计出与N个目标账户分别对应的M个维度的交易金额频次特征;其中,所述N个目标账户中至少包括K个携带用途标签,并且账户用途互不相同的的单用途账户;基于所述N个目标账户以及所述M个维度的交易金额频次特征生成N*M维的目标矩阵,并基于预设的概率矩阵分解模型对所述目标矩阵进行矩阵分解,得到由所述N个目标账户以及与所述N个账户分别对应的K个维度的概率值生成的N*K维的目标子矩阵,然后查找所述目标子矩阵中与所述单用途账户对应的目标向量,并基于各单用途账户的用途标签,对所述目标向量中取值最大的概率值对应的维度分别进行标记,从可以得到由所述N个目标账户以及与所述N个账户分别对应的K个维度的被标记了用途标签的概率值生成的N*K维的目标子矩阵,进而准确学习出所述N个目标账户中的多用途账户,各个多用途账户与K种账户用途之间的对应关系,以及各个多用途账户对应于各种账户用途的概率。
具体实施方式
在本说明书中,旨在提出一种基于概率矩阵分解技术,以及对无监督的矩阵分解结果进行业务语义标注的技术,从由N个目标账户的交易数据组成的交易数据样本集合中,准确学习出该N个目标账户中的多用途账户,以及这些多用途账户与各种账户用途之间的对应关系的技术方案。
在实现时,可以预先准备一个由N个目标账户的交易数据组成的交易数据样本集合,并从该交易数据样本集合中统计出与N个目标账户分别对应的M个维度的交易金额频次特征;其中,上述N个目标账户中至少包括K个携带用途标签,并且账户用途互不相同的的单用途账户。
当统计出与上述N个目标账户分别对应的M个维度的交易频次特征后,可以基于上述N个目标账户以及所述M个维度的交易金额频次特征生成N*M维的目标矩阵,并基于预设的概率矩阵分解模型,对上述目标矩阵进行分解,得到一个由上述N个目标账户,以及与上述N个账户分别对应的K个维度的概率值生成的N*K维的目标子矩阵;其中,K的取值,可以由用户基于上述目标账户实际的账户用途数进行指定。
例如,在实现时,上述概率矩阵分解模型,可以采用较为成熟的概率主题模型,并通过概率主题模型中搭载的矩阵分解算法,基于用户输入的上述K值,对上述目标矩阵进行矩阵分解。
当通过矩阵分解得到了上述目标子矩阵后,由于该目标子矩阵是一个无监督的矩阵,并不包含业务语义,因此可以进一步查找目标子矩阵中与上述单用途账户对应的目标向量,然后基于各单用途账户的用户标签,对该目标当量中取值最大的概率值对应的维度分别进行标记。
当标记完成后,可以得到一个由上述N个目标账户以及与上述N个账户分别对应的K个维度的被标记了用途标签的概率值生成的N*K维的目标子矩阵;比如,以基于概率主题模型对上述目标矩阵进行矩阵分解为例,假设上述目标矩阵为N*M维,那么该目标矩阵基于用户输入的K值进行矩阵分解后,可以得到一个N*K维的子矩阵,以及一个K*M维的子矩阵。
上述N*K维的目标子矩阵,可以描述出N个目标账户中的多用途账户,各个多用途账户与K个用途标签之间的对应关系,以及各个多用途账户对应于K个用途标签的概率;进而,通过这种方式,可以准确学习出各个目标账户中的多用途账户,各个多用途账户与K种账户用途之间的对应关系,以及各个多用途账户对应于各种账户用途的概率,从而可以基于以上学习出的结果来更好的制定交易决策。
下面通过具体实施例并结合具体的应用场景进行详细描述。
请参考图1,图1是本说明书一实施例提供的一种账户用途的识别方法,应用于服务端,执行以下步骤:
步骤102,从交易数据样本集合中统计出与N个目标账户分别对应的M个维度的交易金额频次特征;其中,所述N个目标账户中至少包括K个携带用途标签,并且账户用途互不相同的的单用途账户;
上述服务端,具体可以包括面向用户移动终端上搭载的支付客户端(比如APP)提供服务支撑的服务器、服务器集群或者基于服务器集群搭建的支付平台。
上述目标账户具体可以包括与用户的支付客户端绑定的支付账户;其中,上述支付账户的具体形态,在本说明书不进行特别限定。在实际应用中,上述支付账户具体可以是用户的实体支付账户,也可是用户的虚拟支付账户;
例如,上述支付账户具体可以是诸如用户的银行卡账户等实体账户,也可是诸如支付宝客户端中搭载的“蚂蚁花呗”、“余额宝”等虚拟支付账户或者支付工具。
以下以上述目标账户为用户为支付客户端绑定的银行卡账户为例,对本说明书的技术方案进行详细说明。
在初始状态下,上述服务端可以在后台收集支付客户端产生的交易数据,并从收集到的这些交易数据中采集N个银行卡账户的交易数据,然后基于采集到的这些银行卡账户的交易数据生成一个初始化的交易数据样本集合。
其中,上述交易数据样本集合中交易数据的数据量,以及上述N个银行卡账户的具体数量,在本说明书中不进行特别限定,本领域技术人员可以基于实际的需求进行设置。
另外,需要说明的是,在上述交易数据样本集合中,还需要包含至少K个携带用途标签,并且账户用途互不相同的单用途银行卡账户;
其中,所谓单用途银行卡账户,是指用户仅使用该银行卡账户执行一种单一的支付交易;比如,对于一个银行卡账户而言,如果用户仅仅使用该银行卡账户执行还房贷支付交易,而并不用作其它支付交易,那么该银行卡就是一个单用途的“房贷卡”。
上述用途标签,是指对银行卡账户的具体用途进行标记的标签;比如,假设一个银行卡为一个用于还房贷的单用途卡,那么可以通过为该银行卡增加一个用途标签,将该银行卡标记为“房贷卡”。
上述K值,通常是由用户的银行卡账户所能承载的支付用途的数量所决定的;比如,假设用户的银行卡可以分别作为“车贷卡”、“房贷卡”、“消费卡”以及“工资卡”等,那么可以将上述K值设置为4,表示银行卡最大可以支持4种支付用途。在申请中,上述K值的大小具体可以由用户人工来指定。
在本例中,当生成了上述交易数据样本集合后,上述服务端可以依托于上述交易数据样本集合中的交易数据,统计出与上述N个银行卡账户分别对应的M个维度的交易金额频次特征。
其中,在本例中,上述交易数据具体可以是由账户标识、交易时间、交易场景以及交易金额等字段构成的一个四元组。
当然,在实际应用中,上述交易数据中的字段并不限于以上描述的四元组,本领域技术人员可以基于实际的需要进行扩展,在本说明书仅以交易数据为以上描述的四元组为例进行说明。
在示出的一种实施方式中,上述交易金额频次特征,具体可以包括基础交易频次,和衍生交易频次两类。
一方面,所谓基础交易频次,具体是指各银行卡账户的交易金额分别落入多个预设的分位数区间的交易频次。
在一种实现方式中,可以基于针对各个银行卡账户的交易数据中的交易金额进行大小排序,然后基于排序后的交易金额,划分出多个分位数区间,并统计出各个银行卡账户的交易数据中的交易金额,分别落入划分出的各个分位数区间中的次数,作为基础交易频次。
例如,上述交易数据样本集合中的交易数据的交易金额,通常是一个无序的集合,通过对交易金额进行大小排序,可以得到各个银行卡账户的交易数据中的交易金额所在的数值区间,然后可以基于该数值区间进一步执行分位数划分,得到多个分位数区间,然后统计各个银行卡账户的交易数据中的交易金额,分别落入划分出的各个分位数区间中的次数。
其中,对于交易数据中一些金额较大,离散化程度较高的交易金额,由于其可能是一些瞬时发生的异常交易,并不能真实反映用户日常的支付行为,因此对于这一类交易金额所在的分位数区间可以进行忽略,从而可以确保划分出的分位数区间所对应的交易金额,保持在一个较为合理的区间之中。
比如,假设大小排序后的交易金额为(0.1、0.6、1.0、0.8、100.2…),那么对交易金额完整的区间划分出的分为数据区间具体可以是[0,10]、[10,25]、[25,50]、[50,75]、[75,99],而忽略交易金额大于99的分位数区间。
另一方面,所谓衍生交易频次,具体是指基于上述基础交易频次、交易时间以及交易场景等交易数据中的其它字段,交叉构建出的交易频次。
其中,上述基础交易频次,可以和交易时间和交易场景,按照任意形式的交叉组合,来统计出上述衍生交易频次。
例如,在一种实现方式中,上述衍生交易频次,具体可以包括各银行卡账户的交易金额落入各分位数区间的基础交易频次中,分别隶属于各个交易场景的交易频次(即第一交易频次);以及,上述基础交易频次中,分别隶属于各个交易场景的交易频次中,分别隶属于各个交易时间段的交易频次(即第二交易频次)。
例如,假设划分为出的分位数区间为[0,10]、[10,25]、[25,50]、[50,75]、[75,99],交易场景包括“当面付”、“信用卡还款”两个场景,交易时间段包括[0:00-8:00]、[8:00-12:00]、[12:00-18:00]、[18:00-24:00]四个交易时间段。
假定某银行卡账户A的交易金额,落入区间[0,10]的基础交易频次为100次,那么可以进一步统计出这100频次中,分别隶属于“当面付”、“信用卡还款”两个场景的交易频次。假定这100频次中,隶属于“当面付”场景的交易频次为70,隶属与“信用卡还款”场景的交易频次为30,那么可以进一步统计隶属于“当面付”场景的这70频次中,分别隶属于以上四个交易时间段的交易频次;以及,进一步统计隶属于“信用卡还款”场景的这30频次中,分别隶属于以上四个交易时间段的交易频次。
在另一种实现方式中,上述衍生交易频次,与上述交易金额和交易场景交叉组合的顺序也可以互换;在这种情况下,上述衍生交易频次,具体可以包括各银行卡账户的交易金额落入各分位数区间的基础交易频次中,分别隶属于各个交易时间段的交易频次(即第三交易频次);以及,上述基础交易频次中,分别隶属于各个交易时间段的交易频次中,分别隶属于各个交易场景的交易频次(即第四交易频次),具体的统计方式不再举例论述。
当完成以上示出的衍生交易频次的统计后,每一个统计出的交易频次都可以作为一个维度,上述服务端提取出所有统计出的交易频次的具体数值,最终可以得到M个维度的金额频次特征。
其中,上述M的取值,具体取决于上述分位数区间、交易时间段以及交易场景的数量,可以表示成上述分位数区间的数量,与交易时间段以及交易场景的数量的乘积。
步骤104,基于所述N个目标账户以及所述M个维度的交易金额频次特征生成N*M维的目标矩阵;
在本例中,当上述服务端最终统计出与各个银行账户对应的M个维度的金额频次特征后,可以基于上述N个银行卡账户的账户标识,与上述M个维度的金额频次特征,生成一个N*M维的目标矩阵。
例如,请参见图2,以用行表示银行卡账户,用列表示上述金额频次特征为例,上述N*M维目标矩阵最终可以表示成如图2示出的形式。
步骤106,基于预设的概率矩阵分解模型对所述目标矩阵进行矩阵分解,得到由所述N个目标账户以及与所述N个账户分别对应的K个维度的概率值生成的N*K维的目标子矩阵;
在本例中,当基于上述N个银行卡账户的账户标识,与上述M个金额频次特征,生成一个N*M维的目标矩阵后,可以基于预设的概率矩阵分解模型对该目标矩阵进行矩阵分解。
在示出的一种实施方式中,上述概率矩阵分解模型,具体可以采用概率主题模型(Probabilistic Topic Models)。概率主题模型,是一种较为成熟的对文字隐含主题进行建模的方法,它通过统计一篇文档中每一个词出现的频次,构建一个“词语-文档”的矩阵进行训练,对该词语-文档”矩阵进行分解,学习出一个“词语-主题”矩阵和一个“主题-文档”矩阵,进而发掘出隐含在文档中的主题。
在本例中,可以利用概率主题模型,将基于上述N个银行卡账户的账户标识,与上述M个金额频次特征,生成的N*M维的目标矩阵作为数据输入,基于概率主题模型以及用户输入的矩阵分解参数,对该目标矩阵进行矩阵分解,通过将上述N*M维的目标矩阵作为样本,来发掘出隐含在上述目标矩阵中各银行卡的具体用途。
在示出的一种实施方式中,上述概率主题模型具体可以是将贝叶斯估计算法作为建模算法的概率主题模型。
在本例中,由于输入至概率主题模型的输入数据,与传统的概率主题模型存在差异,因此在本例中上述贝叶斯估计算法可以表示成如下公式:
其中,在上述公式中i和j分别对应上述目标矩阵的行和列(以行表示银行卡账户,列表示金额频次特征为例);ω表示银行卡;Z表示金额频次特征;K、α、β为用户手动输入的矩阵分解参数;K表示主题数,在本说明书中K所指示的主题即为最终通过主题模型学习出的银行卡的具体用途(也称之为银行卡画像)。α、β表示超参数;θ表示由上述N个银行卡账户和与上述N个银行卡账户对应的K个维度的概率值组成的N*K维的子矩阵,φ表示由与上述N个银行卡账户对应的K个维度的概率值和与上述N个银行卡账户对应的M个维度的金额频次特征组成的K*M维的子矩阵。
在实际应用中,当用户利用上述概率主题模型对上述N*M维的目标矩阵进行矩阵分解时,可以将手动输入上述K值,以及超参数α、β。其中,在一种优选的实现方案中,超参数α、β可以采用工程经验值,通过这种方式可以直接使用现有的概率主题模型,来对上述N*M维的目标矩阵进行矩阵分解,而省去复杂的模型训练过程。
当然,在实际应用中,上述超参数α、β,具体也可以通过大量的训练样本,对上述概率主题模型进行不断训练,直至以上示出的算法收敛后确定的出的最优参数。
其中,通过大量的训练样本训练概率主题模型的具体过程,在本说明书中不再进行详述,本领域技术人员在将本说明书的技术方案付诸实现时,可以参考相关技术中的记载。
请参见图3,图3为本例示出的一种利用概率主题模型对上述N*M维的目标矩阵进行矩阵分解的示意图。
如图3所示,当利用上述概率主题模型以及用户输入的矩阵分解参数,对上述N*M维的目标矩阵执行矩阵分解后,上述N*M维的目标矩阵可以分集合为一个由上述N个银行卡账户和与上述N个银行卡账户对应的K个维度(图3中示出的为K值为4)的概率值组成的N*K维的子矩阵θ,和一个由与上述N个银行卡账户对应的K个维度的概率和与上述N个银行卡账户对应的M个维度的金额频次特征组成的K*M维的子矩阵φ的乘积。
其中,上述子矩阵θ,即为本说明书最终要学习的目标子矩阵。
另外,需要补充说明的是,在实际应用中,在利用上述概率主题模型对上述N*M维的目标矩阵执行矩阵分解的过程中,还可以引入吉布斯采样方法来进行近似求解,使得以上示出的贝叶斯估计算法能够在多项式时间内有解,从而可以确保以上示出的贝叶斯估计算法能够快速收敛,
当然,在实际应用中,除了概率主题模型以外,也可以利用其它形式的概率矩阵分解模型,对上述N*M维的目标矩阵执行矩阵分解;例如,还可以使用诸如高斯混合模型,对上述N*M维的目标矩阵执行矩阵分解,具体的实施过程在本说明书中不再进行详述。
步骤108,查找所述目标子矩阵中与所述单用途账户对应的目标向量,并基于各单用途账户的用途标签,对所述目标向量中取值最大的概率值对应的维度分别进行标记。
在本例中,当通过上述概率矩阵分解模型,对上述N*M维的目标矩阵进行矩阵分解,得到由所述N个目标账户以及与所述N个账户分别对应的K个维度的概率值生成的N*K维的目标子矩阵后(即图3中示出的子矩阵θ),此时该目标子矩阵是一个无监督的矩阵,并不包含业务语义。即用户通过查看该目标子矩阵,只知道各个银行卡账户分别对应K个概率值,而并不知道这K个概率值所表示的具体含义。
例如,以K的取值为4为例,提取上述目标子矩阵中的第i行,可以得到一个由4个概率值组成的4维向量,这4个概率值分别表示银行卡账户i对应于4中不同的账户用途的概率,但并无法确定这4个概率值分别对应哪一种账户用途。
在这种情况下,上述服务端可以基于上述交易数据样本集合中,预先标注的K个单用途账户对应的用途标签,对无监督的矩阵分解结果进行业务语义标注,让上述目标子矩阵能够表达出业务语义,使得通过查看该目标子矩阵,能够了解到各个银行卡账户对应的K个概率值所表达的具体含义。
具体地,上述服务端可以查找上述目标子矩阵中,与各单用途账户对应的目标向量;比如,请继续参见图3,可以在上述N*K维的目标子矩阵中,查找与各单用途银行卡账户对应行向量(即上述目标子矩阵中与单用途银行卡账户对应的一行数据);然后,可以进一步计算查找到的各目标向量中取值最大的概率值,并使用该单用途银行卡账户的用途标签,对与该最大的概率值对应的维度进行标记。
其中,对该最大的概率值对应的维度进行标记,是指对该最大的概率值对应的账户用途类别(该最大的概率值在上述目标子矩阵中所对应的列)进行标记。
例如,假设上述目标子矩阵中,与某一个单用途银行卡账户对应的目标向量为(0.9、0.033、0.033、0.033),最大的概率值为0.9,那么可以使用该单用途银行卡账户的用途标签,对上述目标子矩阵中与概率值0.9所对应的列进行标记。
通过这种方式,由于上述交易数据样本集合中,预先标记的单用途银行卡账户的数量,和上述目标子矩阵中概率值的维度数均为K,并且预先标记的这些单用途银行卡账户均为账户用途互不相同的账户,因此通过这种标记方式,可以确保上述N*K维的目标子矩阵中,每一个列的概率值,均能够标记出一个对应的用途标签。
其中,需要说明的是,如果上述服务端在上述目标子矩阵中,与某一个银行卡账户对应的目标向量中的概率值均相同,此时表明该银行卡账户对应于K种账户用途的概率均相同。
在示出的一种实施方式中,与某一个银行卡账户对应的目标向量中的概率值均相同,为了确定该银行卡账户是否为多用途账户,可以进一步该目标向量中的各个概率值的信息熵,并判断计算得到的信息熵是否大于预设阈值;如果该信息熵大于预设阈值时,则可以判定该银行卡账户为多用途账户。
其中,上述预设阈值的具体取值,在本说明书中不进行特别限定,在实际应用中,本领域技术人员可以基于实际的需求进行设置;例如,上述预设阈值可以是一个工程经验值。
请参见图4,当完成上述标记过程中,最终可以得到一个由上述N个目标账户以及与所述N个账户分别对应的K个维度的被标记了用途标签的概率值,生成的N*K维的目标子矩阵。此时,上述目标子矩阵已经能够表达出业务语义,通过查看该目标子矩阵,能够准确学习出上述N个目标账户中的多用途银行卡账户,各个银行卡账户与K种账户用途之间的对应关系,以及各个多用途账户对应于各种账户用途的概率,从而上述服务端可以基于该目标子矩阵来更好的制定交易决策;
例如,以上述目标账户为支付客户端绑定的银行卡账户为例,假设用户在线发起一笔房贷还款的支付交易,那么支付客户端可以基于以上学习出的结果,来确保优先从用户的“房贷卡”;或者,用户的多用途银行卡中,属于“房贷卡”的概率最高的银行卡中完成扣款,尽可能的降低从其它用途的银行卡中错误扣款的问题
与上述方法实施例相对应,本申请还提供了一种账户用途的识别装置的实施例。
本申请的账户用途的识别装置的实施例可以应用在电子设备上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在电子设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图5所示,为本申请的账户用途的识别装置所在电子设备的一种硬件结构图,除了图5所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的电子设备通常根据该电子设备的实际功能,还可以包括其他硬件,对此不再赘述。
图6是本申请一示例性实施例示出的一种账户用途的识别装置的框图。
请参考图6,所述账户用途的识别装置60可以应用在前述图5所示的电子设备中,包括有:提取模块601、生成模块602、分解模块603和标记模块。
其中,提取模块601,从交易数据样本集合中统计出与N个目标账户分别对应的M个维度的交易金额频次特征;其中,所述N个目标账户中至少包括K个携带用途标签,并且账户用途互不相同的的单用途账户;
生成模块602,基于所述N个目标账户以及所述M个维度的交易金额频次特征生成N*M维的目标矩阵;
分解模块603,基于预设的概率矩阵分解模型对所述目标矩阵进行矩阵分解,得到由所述N个目标账户以及与所述N个账户分别对应的K个维度的概率值生成的N*K维的目标子矩阵;
标记模块604,查找所述目标子矩阵中与所述单用途账户对应的目标向量,并基于各单用途账户的用途标签,对所述目标向量中取值最大的概率值对应的维度分别进行标记。
在本例中,所述交易数据样本集合中交易数据样本包括账户标识、交易时间、交易场景以及交易金额;
所述交易金额频次特征包括各目标账户的交易金额分别落入多个预设的分位数区间的基础交易频次;以及,基于所述基础交易频次、交易时间以及交易场景交叉构建出的衍生交易频次。
在本例中,所述衍生交易频次,包括:
各目标账户的交易金额落入各分位数区间的基础交易频次中,分别隶属于多个预设的交易场景的第一交易频次;以及,所述第一交易频次中,分别隶属于预设的多个交易时间段内的第二交易频次;或者,
各目标账户的交易金额落入各分位数区间的基础交易频次中,分别隶属于多个预设的交易时间段的第三交易频次;以及,所述第三交易频次中,分别隶属于预设的多个预设的交易场景的第四交易频次。
在本例中,所述概率矩阵分解模型为概率主题模型;
所述分解模块603:
基于预设的概率主题模型,以及用户输入的矩阵分解参数对所述N*M维的目标矩阵进行矩阵分解;其中,所述矩阵分解参数包括所述K的取值。
在本例中,所述概率主题模型为基于贝叶斯估计算法的概率主题模型。
在本例中,所述装置60还包括:
确定模块605(图6中未示出),如果所述N*K维的目标子矩阵中,与任一目标账户对应的向量中,所述K个维度的概率值均相同,则计算该K个维度的概率值的信息熵;
判断模块606(图6中未示出),判断计算出的所述信息熵是否大于预设阈值;
确定模块607(图6中未示出),如果所述信息熵大于所述预设阈值,则确定该目标账户为多用途账户。
在本例中,所述目标账户为支付客户端绑定的银行卡账户。
上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
与上述方法实施例相对应,本申请还提供了一种账户用途的识别设备的实施例。该账户用途的识别设备包括:处理器以及用于存储机器可执行指令的存储器;其中,处理器和存储器通常通过内部总线相互连接。在其他可能的实现方式中,所述设备还可能包括外部接口,以能够与其他设备或者部件进行通信。
在本实施例中,通过读取并执行所述存储器存储的与数据库损坏的恢复的控制逻辑对应的机器可执行指令,所述处理器被促使:
从交易数据样本集合中统计出与N个目标账户分别对应的M个维度的交易金额频次特征;其中,所述N个目标账户中至少包括K个携带用途标签,并且账户用途互不相同的的单用途账户;
基于所述N个目标账户以及所述M个维度的交易金额频次特征生成N*M维的目标矩阵;
基于预设的概率矩阵分解模型对所述目标矩阵进行矩阵分解,得到由所述N个目标账户以及与所述N个账户分别对应的K个维度的概率值生成的N*K维的目标子矩阵;
查找所述目标子矩阵中与所述单用途账户对应的目标向量,并基于各单用途账户的用途标签,对所述目标向量中取值最大的概率值对应的维度分别进行标记。
在本例中,所述交易数据样本集合中交易数据样本包括账户标识、交易时间、交易场景以及交易金额;所述交易金额频次特征包括各目标账户的交易金额分别落入多个预设的分位数区间的基础交易频次;以及,基于所述基础交易频次、交易时间以及交易场景交叉构建出的衍生交易频次。
在本例中,通过读取并执行所述存储器存储的与数据库损坏的恢复的控制逻辑对应的机器可执行指令,所述处理器还被促使:
各目标账户的交易金额落入各分位数区间的基础交易频次中,分别隶属于多个预设的交易场景的第一交易频次;以及,所述第一交易频次中,分别隶属于预设的多个交易时间段内的第二交易频次;或者,
各目标账户的交易金额落入各分位数区间的基础交易频次中,分别隶属于多个预设的交易时间段的第三交易频次;以及,所述第三交易频次中,分别隶属于预设的多个预设的交易场景的第四交易频次。
在本例中,所述概率矩阵分解模型为概率主题模型;
在本例中,通过读取并执行所述存储器存储的与数据库损坏的恢复的控制逻辑对应的机器可执行指令,所述处理器还被促使:
基于预设的概率主题模型,以及用户输入的矩阵分解参数对所述N*M维的目标矩阵进行矩阵分解;其中,所述矩阵分解参数包括所述K的取值。
在本例中,所述概率主题模型为基于贝叶斯估计算法的概率主题模型。
在本例中,通过读取并执行所述存储器存储的与数据库损坏的恢复的控制逻辑对应的机器可执行指令,所述处理器还被促使:
如果所述N*K维的目标子矩阵中,与任一目标账户对应的向量中,所述K个维度的概率值均相同,则计算该K个维度的概率值的信息熵;
判断计算出的所述信息熵是否大于预设阈值;
如果所述信息熵大于所述预设阈值,则确定该目标账户为多用途账户。
在本例中,所述目标账户为支付客户端绑定的银行卡账户。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。