CN105426365B - 区分交互行为的方法及装置 - Google Patents

区分交互行为的方法及装置 Download PDF

Info

Publication number
CN105426365B
CN105426365B CN201410377277.6A CN201410377277A CN105426365B CN 105426365 B CN105426365 B CN 105426365B CN 201410377277 A CN201410377277 A CN 201410377277A CN 105426365 B CN105426365 B CN 105426365B
Authority
CN
China
Prior art keywords
data
interbehavior
current
interactive object
history
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410377277.6A
Other languages
English (en)
Other versions
CN105426365A (zh
Inventor
包妮娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201410377277.6A priority Critical patent/CN105426365B/zh
Publication of CN105426365A publication Critical patent/CN105426365A/zh
Priority to HK16109295.5A priority patent/HK1221783A1/zh
Application granted granted Critical
Publication of CN105426365B publication Critical patent/CN105426365B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本申请公开了一种区分交互行为的方法及装置。其中,该方法包括:获取用户的当前交互行为对应的当前交互行为数据;按照预设对象关系和预设数据关系对当前交互行为数据的第一交互对象和第一交换数据进行聚类处理,得到当前交互序列,其中,第一交换数据表示当前交互行为交换的数值;使用预设交互行为数据库中的数据对当前交互序列进行匹配处理,得到匹配结果;依据匹配结果确定当前交互行为是否为合法行为。通过本申请,解决了现有技术中对用户交互数据的分析不准确的问题,实现了准确分析用户的交互行为是否合法的效果。

Description

区分交互行为的方法及装置
技术领域
本申请涉及数据处理领域,具体而言,涉及一种区分交互行为的方法及装置。
背景技术
现有技术中在分析用户的交易行为时,一般会考虑到事件发生时涉及的人物、时间、类型和内容的综合关系,具体地,一般只从某些维度考虑行为的异常性。
针对现有技术中对用户交互数据的分析不准确的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中对用户交互数据的分析不准确的问题,目前尚未提出有效的解决方案,为此,本申请的主要目的在于提供一种区分交互行为的方法及装置,以解决上述问题。
为了实现上述目的,根据本申请的一个方面,提供了一种区分交互行为的方法,该方法包括:获取用户的当前交互行为对应的当前交互行为数据;按照预设对象关系和预设数据关系对当前交互行为数据的第一交互对象和第一交换数据进行聚类处理,得到当前交互序列,其中,第一交换数据表示当前交互行为交换的数值;使用预设交互行为数据库中的数据对当前交互序列进行匹配处理,得到匹配结果;依据匹配结果确定当前交互行为是否为合法行为。
进一步地,在使用预设交互行为数据库对当前交互序列进行匹配处理,得到匹配结果之前,方法还包括:采集用户的历史交互行为数据,得到历史交互行为集合;从历史交互行为集合中提取发生频率符合预设阈值的历史交互行为数据,得到合法行为项集;将合法行为项集中的历史交互行为数据转换为历史时间序列,生成预设交互行为数据库。
进一步地,从历史交互行为集合中提取发生频率符合预设阈值的历史交互行为数据,得到合法行为项集包括:对历史交互行为数据中的第二交互对象和第二交换数据进行降维处理得到第三交互对象和第三交换数据,得到更新后的历史交互行为数据;计算对应同一个第三交互对象的更新后的历史交互行为数据的发生频率;将发生频率大于预设阈值的更新后的历史交互行为数据生成合法行为项集。
进一步地,对历史交互行为数据中的第二交互对象和第二交换数据进行降维处理得到第三交互对象和第三交换数据,得到更新后的历史交互行为数据包括:对历史交互行为数据中的第二交互对象进行降维处理得到第三交互对象包括:将对应同一个第二交互对象的历史交互行为数据进行分组得到多个交互对象集合;对每个交互对象集合中的历史交互行为数据的第二交换数据和交互类型进行离散处理得到每个历史交互行为数据的交互分数;查询得到对应交互分数的第三交互对象;对历史交互行为数据中的第二交换数据进行降维处理得到第三交换数据:查询得到与第二交换数据对应的第三交换数据;使用第三交互对象替换第二交互对象,并使用第三交换数据替换第二交换数据,得到更新后的历史交互行为数据。
进一步地,按照预设对象关系和预设数据关系对当前交互行为数据的第一交互对象和第一交换数据进行聚类处理,得到当前交互序列包括:使用预设对象关系查询与第一交互对象对应的第四交互对象;使用预设数据关系查询与第一交换数据对应的第四交换数据;使用第四交互对象替换第一交互对象,使用第四交换数据替换第一交互对象,得到当前交互序列。
进一步地,使用预设交互行为数据库中的数据对当前交互序列进行匹配处理,得到匹配结果包括:将当前交互序列与预设交互行为数据库中的数据逐个进行匹配处理,得到预设交互行为数据库中存在与当前交互序列相匹配的数据的第一匹配结果,或得到预设交互行为数据库中不存在与当前交互序列相匹配的数据的第二匹配结果;依据匹配结果确定当前交互行为是否为合法行为包括:若得到第一匹配结果确定当前交互行为为合法行为;若得到第二匹配结果确定当前交互行为不为合法行为。
为了实现上述目的,根据本申请的另一方面,提供了一种区分交互行为的装置,该装置包括:获取模块,用于获取用户的当前交互行为对应的当前交互行为数据;聚类处理模块,用于按照预设对象关系和预设数据关系对当前交互行为数据的第一交互对象和第一交换数据进行聚类处理,得到当前交互序列,其中,第一交换数据表示当前交互行为交换的数值;匹配模块,用于使用预设交互行为数据库中的数据对当前交互序列进行匹配处理,得到匹配结果;确定模块,用于依据匹配结果确定当前交互行为是否为合法行为。
进一步地,装置还包括:采集模块,用于在使用预设交互行为数据库对当前交互序列进行匹配处理,得到匹配结果之前,采集用户的历史交互行为数据,得到历史交互行为集合;提取模块,用于从历史交互行为集合中提取发生频率符合预设阈值的历史交互行为数据,得到合法行为项集;转换模块,用于将合法行为项集中的历史交互行为数据转换为历史时间序列,生成预设交互行为数据库。
进一步地,提取模块包括:更新模块,用于对历史交互行为数据中的第二交互对象和第二交换数据进行降维处理得到第三交互对象和第三交换数据,得到更新后的历史交互行为数据;第一计算模块,用于计算对应同一个第三交互对象的更新后的历史交互行为数据的发生频率;生成模块,用于将发生频率大于预设阈值的更新后的历史交互行为数据,生成合法行为项集。
进一步地,更新模块包括:第一处理模块,用于对历史交互行为数据中的第二交互对象进行降维处理得到第三交互对象,第一处理模块包括:分组模块,用于将对应同一个第二交互对象的历史交互行为数据进行分组得到多个交互对象集合;离散处理模块,用于对每个交互对象集合中的历史交互行为数据的第二交换数据和交互类型进行离散处理得到每个历史交互行为数据的交互分数;第一查询模块,用于查询得到对应交互分数的第三交互对象;第二处理模块,用于对历史交互行为数据中的第二交换数据进行降维处理得到第三交换数据:第二查询模块,用于查询得到与第二交换数据对应的第三交换数据;第一替换模块,用于使用第三交互对象替换第二交互对象,并使用第三交换数据替换第二交换数据,得到更新后的历史交互行为数据。
进一步地,聚类处理模块包括:第三查询模块,用于使用预设对象关系查询与第一交互对象对应的第四交互对象;第四查询模块,用于使用预设数据关系查询与第一交换数据对应的第四交换数据;第二替换模块,用于使用第四交互对象替换第一交互对象,使用第四交换数据替换第一交互对象,得到当前交互序列。
进一步地,匹配模块包括:匹配子模块,用于将当前交互序列与预设交互行为数据库中的数据逐个进行匹配处理,得到预设交互行为数据库中存在与当前交互序列相匹配的数据的第一匹配结果,或得到预设交互行为数据库中不存在与当前交互序列相匹配的数据的第二匹配结果;确定模块包括:第一确定子模块,用于若得到第一匹配结果确定当前交互行为为合法行为;第二确定子模块,用于若得到第二匹配结果确定当前交互行为不为合法行为。
采用本申请实施例,在获取用户的当前交互行为的当前交互行为数据之后,可以按照预设对象关系和预设数据关系对当前交互行为数据的第一交互对象和第一交换数据进行聚类处理,得到当前交互序列,并根据当前交互序列确定当前交互行为是否为合法行为。在该实施例中,不仅仅是通过交易金额(即上述实施例中的交换数据)判断当前交互行为是否为合法行为,同时考虑到了当前交互行为的交互对象、交互时间,通过多个维度的对当前交互行为数据进行处理,判断交互行为是否为合法行为的准确度更高,解决了现有技术中对用户交互数据的分析不准确的问题,实现了准确分析用户的交互行为是否合法的效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的交互行为数据的处理方法的流程图;
图2是根据本申请实施例的交互行为数据的处理方法的框图;以及
图3是根据本申请实施例的交互行为数据的处理装置的示意图。
具体实施方式
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
项集:由若干项组成的集合。设非空集合I=(i1,i2,…,in)表示所有项的集合,其中ik(1<=k<=n)称为项。
时间序列:由若干项集组成的有序集合。序列S=(s1,s2,sm),其中sj(1<=j<=m)是项集,也称为序列的元素。
多维时间序列:序列S=(s1,s2,sm)的元素包含的项>=2,该序列就称为多维时间序列。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
图1是根据本申请实施例的交互行为数据的处理方法的流程图。如图1所示,该方法可以通过如下步骤实现:
步骤S102:获取用户的当前交互行为对应的当前交互行为数据。
步骤S104:按照预设对象关系和预设数据关系对当前交互行为数据的第一交互对象和第一交换数据进行聚类处理,得到当前交互序列,其中,第一交换数据表示当前交互行为交换的数值。
步骤S106:使用预设交互行为数据库中的数据对当前交互序列进行匹配处理,得到匹配结果。
步骤S108:依据匹配结果确定当前交互行为是否为合法行为。
采用本申请实施例,在获取用户的当前交互行为的当前交互行为数据之后,可以按照预设对象关系和预设数据关系对当前交互行为数据的第一交互对象和第一交换数据进行聚类处理,得到当前交互序列,并根据当前交互序列确定当前交互行为是否为合法行为。在该实施例中,不仅仅是通过交易金额(即上述实施例中的交换数据)判断当前交互行为是否为合法行为,同时考虑到了当前交互行为的交互对象、交互时间,通过多个维度的对当前交互行为数据进行处理,判断交互行为是否为合法行为的准确度更高,解决了现有技术中对用户交互数据的分析不准确的问题,实现了准确分析用户的交互行为是否合法的效果。
在本申请上述实施例中的交互行为可以是通过网络平台(如支付宝、淘宝等)进行虚拟资源或者有形资源的交易的行为。例如,交互行为交换数据(即交易金额)为3000的转账交易,在本实施例中根据交易对象(即上述实施例中的交互对象)及交互时间进行区分对待,如果交易对象是朋友或者家人,那风险系数就很低。此外本实施例中还考虑到交互时间的因素,例如给陌生人对象转账的时间,如果交易时间具有周期性,例如每月的1号发生那该事件风险系数会比同类事件在偶然时间发生的风险系数低。事件发生时刻各因素综合考虑使得用户异常行为的识别更准确和全面。
根据本申请的上述实施例,在使用预设交互行为数据库对当前交互序列进行匹配处理,得到匹配结果之前,方法还可以包括:采集用户的历史交互行为数据,得到历史交互行为集合;从历史交互行为集合中提取发生频率符合预设阈值的历史交互行为数据,得到合法行为项集;将合法行为项集中的历史交互行为数据转换为历史时间序列,生成预设交互行为数据库。
具体地,可以获取用户的历史交易行为(即历史交互行为)的历史交互行为集合,如图2所示的事件库X=(ai1,ai2,...aim),其中,aim表示历史交互行为数据。
在本申请的上述实施例中,从历史交互行为集合中提取发生频率符合预设阈值的历史交互行为数据,得到合法行为项集可以包括:对历史交互行为数据中的第二交互对象和第二交换数据进行降维处理得到第三交互对象和第三交换数据,得到更新后的历史交互行为数据;计算对应同一个第三交互对象的更新后的历史交互行为数据的发生频率;将发生频率大于预设阈值的更新后的历史交互行为数据生成合法行为项集。
其中,上述实施例中的聚类分析指将物理或抽象对象的集合分组成为由类似对象组成的多个类的分析过程。具体到本申请实施例中,聚类处理可以为将第二交互对象分入不同的组中的操作,不同的组使用第三交互对象来表示。具体地,聚类处理的算法可以采用k-均值或者k-中心等聚类算法。上述实施例中的降维处理即为降低数据维数的处理,可以通过线性降维或者非线性降维,通过该种处理方法可以降低数据的复杂度。
通过上述实施例,可以从历史交互行为集合中的数据中提取合法行为项集,在提取合法行为项集之前,可以对其中的历史交互行为数据进行维度离散化处理。具体地,可以通过对事件维度数据(即上述实施例中的历史交互行为数据)进行聚类处理(具体地可以通过降维处理实现聚类处理),去除细节干扰,保留事件(即历史交互行为)的主要形态,从而可以有效地降低挖掘算法的存储和计算代价,提高挖掘的效率和准确性。
例如,在一个月内,用户A的交易对象(即上述实施例中的第二交互对象)可以有15个,其中,包括A1-A15,通过上述的聚类处理可以将15个第二交互对象分为如下几组:亲人、朋友和银行。
上述的亲人、朋友和银行即为第三交互对象,这样将15个第二交互对象降低维数得到三个第三交互对象,降低了数据的复杂度。
需要进一步说明的是,对历史交互行为数据中的第二交互对象和第二交换数据进行降维处理得到第三交互对象和第三交换数据,得到更新后的历史交互行为数据可以包括:对历史交互行为数据中的第二交互对象进行降维处理得到第三交互对象包括:将对应同一个第二交互对象的历史交互行为数据进行分组得到多个交互对象集合;对每个交互对象集合中的历史交互行为数据的第二交换数据和交互类型进行离散处理得到每个历史交互行为数据的交互分数;查询得到对应交互分数的第三交互对象;对历史交互行为数据中的第二交换数据进行降维处理得到第三交换数据:查询得到与第二交换数据对应的第三交换数据;使用第三交互对象替换第二交互对象,并使用第三交换数据替换第二交换数据,得到更新后的历史交互行为数据。
上述实施例中,对第二交互对象进行降维处理和对第二交换数据的降维处理可以是并行进行的。
具体地,对第二交互对象进行降维处理可以通过如下方法实现:统计相对于同一个第二交互对象的历史交互行为的发生频率,对每个历史交互行为数据中的交互类型和发生频率查表评分,得到每个历史交互行为数据的交互对象评分,获取与该交互对象评分对应的第三交互对象。
如表1所示的用户A的2014年上半年历史交互行为(表1仅作示例性说明,本申请上述实施例不受该应用场景的限制):
表1
第二交互对象 交互类型 发生频率 第三交互对象
A1 养老转账 0.5 亲人
A2 购物 0.2 卖家
A3 购物 0.2 卖家
A4 养老转账 0.5 亲人
A5 话费 0.2 通信运行商
A6 话费 0.2 通信运行商
A7 养老转账 0.5 亲人
A8 饭费 0.1 其他
A9 养老转账 0.5 亲人
A10 养老转账 0.5 亲人
如表1所示,用户A的交易对象(即上述实施例中的第二交互对象)可以有10个,其中,包括A1-A10,通过上述的统计,可以对其发生频率和交互类型进行查表评分,具体地,可以通过计算交互类型与评分表中的关键字的相似度,将相似度大于预设相似度阈值的关键字的评分作为所述交互类型的评分,并查询交互对象表中对应该评分的第三交互对象。通过上述处理将10个第二交互对象分为了四类(也可以称之为四组):亲友、卖家、通信运营商和其他。
又如,上述实施例中,如表2所示用户A发生的历史交互行为的交换数据的降维处理。
表2
对历史交互行为数据中的第二交换数据进行降维处理得到第三交换数据:查询得到与第二交换数据对应的第三交换数据(如表2中的高、中、低)。具体地,在第二交换数据符合第一范围时,第三交换数据为高;在第二交换数据符合第二范围时,第三交换数据为中;在第二交换数据符合第三范围时,第三交换数据为低。其中,第一范围可以为[1000,∞);第二范围可以为[300,1000);第三范围可以为(0,300)。
在上述实施例中,第一范围、第二范围以及第三范围共同构成了上述的预设数据关系。
在完成对第二交换数据和第二交互对象的降维处理之后,使用第三交换数据替换第二交换数据,并使用第三交互对象替换第二交互对象,得到更新后的历史交互行为数据,如表3所示。
表3
通过上述实施例,获取到的更新第二交互对象和第二交换数据的历史交互行为集合,然后从该更新后的历史交互行为集合中提取发生频率符合预设阈值的历史交互行为数据,得到合法行为项集。具体到上述的表中,可以提取发生频率大于0.1的历史交互行为数据生成合法行为项集,然后将合法行为项集中的历史交互行为数据转换为历史时间序列,生成预设交互行为数据库,如表4所示的合法行为项集中的历史交互行为数据可以使用六个描述数据来表示,表中的每一行用序列的形式表示即为历史时间序列,如第二行中的历史时间序列为:(2014,1,6,高,养老转账,亲人)。
表4
第三交换数据 交互类型 第三交互对象
2014 1 6 养老转账 亲人
2014 1 18 购物 卖家
2014 2 1 购物 卖家
2014 2 6 养老转账 亲人
2014 2 15 话费 通信运行商
2014 3 5 话费 通信运行商
2014 3 6 养老转账 亲人
2014 4 6 养老转账 亲人
2014 5 6 养老转账 亲人
需要进一步说明的是,获取历史时间序列之后,还可以对其进行进一步地聚类分析,也即,可以将得到的合法行为项集中的历史时间序列进行合并处理得到预设交互行为数据库。
具体地,将得到的合法行为项集中的历史时间序列进行合并处理包括:将得到的历史时间序列中至少三个属性数据相同的数据合并为一条历史时间序列,将其中不同的属性数据使用字符“*”代替。
如,将上述的第二条和第三条的历史时间序列合并为(*,*,*,中,购物,卖家)。
在预设交互行为数据库中还可以保存有上述进行降维处理过程中第二交互对象与第三交互对象的映射关系将其作为预设对象关系。
根据本申请的上述实施例,如图2所示,可以按照预设的交互亲密度模型和交换数据的模型对历史交互行为数据进行聚类处理。
具体地,交互亲密度模型可以根据交易对象(即上述实施例中的第二交互对象)与用户的历史交互数据对交易对象进行分类;交换数据的模型可以根据用户的交易金额进行聚类,实现连续变量的离散化处理。
上述实施例中的获取合法行为项集的过程即为项集频繁项目集挖掘的过程。在该实施例中,执行该步骤是为了发现用户的频繁交易行为,该步骤不会考虑到事件的时间因素影响。
需要进一步说明的是,在该实施例中可以将用户的一次网上交易行为作为一个事务(即作为一条历史交互行为数据),伴随事务发生往往会涉及多维度信息:第二交互时间、第二交互对象、交互类型(如转账、汇款等)以及交易金额(即上述实施例中的交换数据),通过上述实施例,可以挖掘出用户的历史交易行为模式(即上述实施例中的历史交互行为的模式),并建立相应的用户正常交易行为规则库(即上述实施例中的预设交互行为数据库),通过当前交互行为数据与预设交互行为数据库作匹配,以识别用户的风险交易行为。
具体地,假设I是项的集合,给定一个交易数据库D(即上述实施例中的历史交互行为集合),其中每个事务(Transaction)t(即上述实施例中的历史交互行为数据)是I的非空子集,即每一个交易都与一个唯一的标识符TID(Transaction ID)对应。上述实施例中的频繁指某一项集出现的概率相对于所有记录而言必须达到某一水平(即达到预设概率阈值)。项集出现的概率称为支持度(Support),以一个包含A与B两个项的2-itemset为例,事务同时包含A和B的百分比即是{A,B}项的支持度,若支持度大于等于所设定的最小支持度(Minimum Support)门槛值时,则{A,B}称为频繁项集。一个满足最小支持度的k-itemset,则称为高频k-项集(Frequent k-itemset),一般表示为Large k或Frequent k。
通过上述实施例得到合法行为项集之后,可以将合法行为项集中的历史交互行为数据转换为历史时间序列,生成预设交互行为数据库。具体地,获取用户频繁交易项集I(即上述实施例中的合法行为项集),项ik=(object,amount,trade_type),其中的object为第二交互对象,amount为交换数据,trade_type为交互类型,在该历史交互行为数据中并未包含时间维度的数据,可选地,可以将频繁交易项集转换为多维时间序列(即上述实施例中的历史时间序列)S=(s1,s2,…,sn),其中sj=(year,month,day,ik),也即历史时间序列中增加了时间参数sj=(年,月,日,时)。
通过上述实施例,得到的历史时间序列可以是如下的表现形式“1个月以前购买奔腾PC的客户很可能在一个月内订购新的CPU芯片”。
在得到的历史时间序列中可以包括历史交互行为数据的六个属性,该六个属性可以为:年、月、日、第三交互对象、第三交换数据以及交互类型。
例如,用户在2014年3月15日向招商银行信用卡还款1500;在2014年4月15日向招商银行信用卡还款1000;在2014年5月15日向招商银行信用卡还款2500;……。对用户的该历史交互行为进行分析之后,该类交互行为即可成为一个合法行为项集,也即X月的15日向招商银行还款M。
根据本申请的上述实施例,按照预设对象关系和预设数据关系对当前交互行为数据的第一交互对象和第一交换数据进行聚类处理,得到当前交互序列包括:使用预设对象关系查询与第一交互对象对应的第四交互对象;使用预设数据关系查询与第一交换数据对应的第四交换数据;使用第四交互对象替换第一交互对象,使用第四交换数据替换第一交互对象,得到当前交互序列。
需要进一步说明的是,使用预设交互行为数据库中的数据对当前交互序列进行匹配处理,得到匹配结果包括:将当前交互序列与预设交互行为数据库中的数据逐个进行匹配处理,得到预设交互行为数据库中存在与当前交互序列相匹配的数据的第一匹配结果,或得到预设交互行为数据库中不存在与当前交互序列相匹配的数据的第二匹配结果;依据匹配结果确定当前交互行为是否为合法行为包括:若得到第一匹配结果确定当前交互行为为合法行为;若得到第二匹配结果确定当前交互行为不为合法行为。
在通过上述实施例确定当前交互行为不为合法行为的情况下,如图2所示可以进行后续的风险评估。
例如,如果当前交互行为数据表示的交互行为为:8月15日向招商银行信用卡还款5000。通过在预设交互行为数据库中作匹配,匹配到上述的合法行为项集可以如表5所示:
表5
交互对象 交互类型 交换数据
* * 15 招商银行 信用卡还款 *
2014 8 15 招商银行 信用卡还款 5000
如表5所示,上述的合法行为项集中的历史时间序列与当前交互序列相匹配,得到第一匹配结果。
本申请的一种可选的实施例中,还可以通过计算历史时间序列与当前交互序列的相似度,通过相似度得到匹配分数。例如,在历史时间序列中提供的三个属性与当前交互序列完全匹配,则可以查表得到匹配分数为100,判断匹配分数是否大于预设分数阈值75,100>75,则确定当前交互行为数据对应的交互行为为合法行为;如果不符合则确定当前交互行为数据对应的交互行为不为合法行为,则向用户发出报警信号。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图3是根据本申请实施例的交互行为数据的处理装置的示意图。如图3所示,该装置可以包括:获取模块10、聚类处理模块20、匹配模块30以及确定模块40。
其中,获取模块,用于获取用户的当前交互行为对应的当前交互行为数据。
聚类处理模块,用于按照预设对象关系和预设数据关系对当前交互行为数据的第一交互对象和第一交换数据进行聚类处理,得到当前交互序列,其中,第一交换数据表示当前交互行为交换的数值。
匹配模块,用于使用预设交互行为数据库中的数据对当前交互序列进行匹配处理,得到匹配结果。
确定模块,用于依据匹配结果确定当前交互行为是否为合法行为。
采用本申请实施例,在获取用户的当前交互行为的当前交互行为数据之后,可以按照预设对象关系和预设数据关系对当前交互行为数据的第一交互对象和第一交换数据进行聚类处理,得到当前交互序列,并根据当前交互序列确定当前交互行为是否为合法行为。在该实施例中,不仅仅是通过交易金额(即上述实施例中的交换数据)判断当前交互行为是否为合法行为,同时考虑到了当前交互行为的交互对象、交互时间,通过多个维度的对当前交互行为数据进行处理,判断交互行为是否为合法行为的准确度更高,解决了现有技术中对用户交互数据的分析不准确的问题,实现了准确分析用户的交互行为是否合法的效果。
在本申请上述实施例中的交互行为可以是通过网络平台(如支付宝、淘宝等)进行虚拟资源或者有形资源的交易的行为。例如,交互行为交换数据(即交易金额)为3000的转账交易,在本实施例中根据交易对象(即上述实施例中的交互对象)及交互时间进行区分对待,如果交易对象是朋友或者家人,那风险系数就很低。此外本实施例中还考虑到交互时间的因素,例如给陌生人对象转账的时间,如果交易时间具有周期性,例如每月的1号发生那该事件风险系数会比同类事件在偶然时间发生的风险系数低。事件发生时刻各因素综合考虑使得用户异常行为的识别更准确和全面。
在本申请的上述实施例中,装置还可以包括:采集模块,用于在使用预设交互行为数据库对当前交互序列进行匹配处理,得到匹配结果之前,采集用户的历史交互行为数据,得到历史交互行为集合;提取模块,用于从历史交互行为集合中提取发生频率符合预设阈值的历史交互行为数据,得到合法行为项集;转换模块,用于将合法行为项集中的历史交互行为数据转换为历史时间序列,生成预设交互行为数据库。
具体地,提取模块可以包括:更新模块,用于对历史交互行为数据中的第二交互对象和第二交换数据进行降维处理得到第三交互对象和第三交换数据,得到更新后的历史交互行为数据;第一计算模块,用于计算对应同一个第三交互对象的更新后的历史交互行为数据的发生频率;生成模块,用于将发生频率大于预设阈值的更新后的历史交互行为数据,生成合法行为项集。
更进一步地,更新模块可以包括:第一处理模块,用于对历史交互行为数据中的第二交互对象进行降维处理得到第三交互对象,第一处理模块包括:分组模块,用于将对应同一个第二交互对象的历史交互行为数据进行分组得到多个交互对象集合;离散处理模块,用于对每个交互对象集合中的历史交互行为数据的第二交换数据和交互类型进行离散处理得到每个历史交互行为数据的交互分数;第一查询模块,用于查询得到对应交互分数的第三交互对象;第二处理模块,用于对历史交互行为数据中的第二交换数据进行降维处理得到第三交换数据:第二查询模块,用于查询得到与第二交换数据对应的第三交换数据;第一替换模块,用于使用第三交互对象替换第二交互对象,并使用第三交换数据替换第二交换数据,得到更新后的历史交互行为数据。
在本申请的上述实施例中,聚类处理模块可以包括:第三查询模块,用于使用预设对象关系查询与第一交互对象对应的第四交互对象;第四查询模块,用于使用预设数据关系查询与第一交换数据对应的第四交换数据;第二替换模块,用于使用第四交互对象替换第一交互对象,使用第四交换数据替换第一交互对象,得到当前交互序列。
需要进一步说明的是,在本申请一个可选的实施例中,匹配模块包括:匹配子模块,用于将当前交互序列与预设交互行为数据库中的数据逐个进行匹配处理,得到预设交互行为数据库中存在与当前交互序列相匹配的数据的第一匹配结果,或得到预设交互行为数据库中不存在与当前交互序列相匹配的数据的第二匹配结果;确定模块包括:第一确定子模块,用于若得到第一匹配结果确定当前交互行为为合法行为;第二确定子模块,用于若得到第二匹配结果确定当前交互行为不为合法行为。
本实施例中所提供的各个模块与方法实施例对应步骤所提供的使用方法相同、应用场景也可以相同。当然,需要注意的是,上述模块涉及的方案可以不限于上述实施例一中的内容和场景,且上述模块可以运行在计算机终端或移动终端,可以通过软件或硬件实现。
从以上的描述中,可以看出,本申请实现了如下技术效果:
采用本申请实施例,在获取用户的当前交互行为的当前交互行为数据之后,可以按照预设对象关系和预设数据关系对当前交互行为数据的第一交互对象和第一交换数据进行聚类处理,得到当前交互序列,并根据当前交互序列确定当前交互行为是否为合法行为。在该实施例中,不仅仅是通过交易金额(即上述实施例中的交换数据)判断当前交互行为是否为合法行为,同时考虑到了当前交互行为的交互对象、交互时间,通过多个维度的对当前交互行为数据进行处理,判断交互行为是否为合法行为的准确度更高,解决了现有技术中对用户交互数据的分析不准确的问题,实现了准确分析用户的交互行为是否合法的效果。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种区分交互行为的方法,其特征在于,包括:
获取用户的当前交互行为对应的当前交互行为数据;
按照预设对象关系和预设数据关系对所述当前交互行为数据的第一交互对象和第一交换数据进行聚类处理,得到当前交互序列,其中,所述第一交换数据表示所述当前交互行为交换的数值;
使用预设交互行为数据库中的数据对所述当前交互序列进行匹配处理,得到匹配结果;
依据所述匹配结果确定所述当前交互行为是否为合法行为;
其中,按照预设对象关系和预设数据关系对所述当前交互行为数据的第一交互对象和第一交换数据进行聚类处理,得到当前交互序列包括:
使用所述预设对象关系查询与所述第一交互对象对应的第四交互对象;
使用所述预设数据关系查询与所述第一交换数据对应的第四交换数据;
使用所述第四交互对象替换所述第一交互对象,使用所述第四交换数据替换所述第一交互对象,得到所述当前交互序列。
2.根据权利要求1所述的方法,其特征在于,在使用预设交互行为数据库对所述当前交互序列进行匹配处理,得到匹配结果之前,所述方法还包括:
采集所述用户的历史交互行为数据,得到历史交互行为集合;
从所述历史交互行为集合中提取发生频率符合预设阈值的历史交互行为数据,得到合法行为项集;
将所述合法行为项集中的所述历史交互行为数据转换为历史时间序列,生成所述预设交互行为数据库。
3.根据权利要求2所述的方法,其特征在于,从所述历史交互行为集合中提取发生频率符合预设阈值的历史交互行为数据,得到合法行为项集包括:
对所述历史交互行为数据中的第二交互对象和第二交换数据进行降维处理得到第三交互对象和第三交换数据,得到更新后的历史交互行为数据;
计算对应同一个所述第三交互对象的所述更新后的历史交互行为数据的发生频率;
将所述发生频率大于所述预设阈值的所述更新后的历史交互行为数据生成所述合法行为项集。
4.根据权利要求3所述的方法,其特征在于,对所述历史交互行为数据中的所述第二交互对象和所述第二交换数据进行降维处理得到第三交互对象和第三交换数据,得到更新后的历史交互行为数据包括:
对所述历史交互行为数据中的所述第二交互对象进行降维处理得到所述第三交互对象包括:将对应同一个所述第二交互对象的所述历史交互行为数据进行分组得到多个交互对象集合;对每个所述交互对象集合中的所述历史交互行为数据的所述第二交换数据和交互类型进行离散处理得到每个所述历史交互行为数据的交互分数;查询得到对应所述交互分数的所述第三交互对象;
对所述历史交互行为数据中的所述第二交换数据进行降维处理得到所述第三交换数据:查询得到与所述第二交换数据对应的所述第三交换数据;
使用所述第三交互对象替换所述第二交互对象,并使用所述第三交换数据替换所述第二交换数据,得到所述更新后的历史交互行为数据。
5.根据权利要求1至4中任意一项所述的方法,其特征在于,
使用预设交互行为数据库中的数据对所述当前交互序列进行匹配处理,得到匹配结果包括:将所述当前交互序列与所述预设交互行为数据库中的数据逐个进行匹配处理,得到所述预设交互行为数据库中存在与所述当前交互序列相匹配的数据的第一匹配结果,或得到所述预设交互行为数据库中不存在与所述当前交互序列相匹配的数据的第二匹配结果;
依据所述匹配结果确定所述当前交互行为是否为合法行为包括:若得到所述第一匹配结果确定所述当前交互行为为所述合法行为;若得到所述第二匹配结果确定所述当前交互行为不为所述合法行为。
6.一种区分交互行为的装置,其特征在于,包括:
获取模块,用于获取用户的当前交互行为对应的当前交互行为数据;
聚类处理模块,用于按照预设对象关系和预设数据关系对所述当前交互行为数据的第一交互对象和第一交换数据进行聚类处理,得到当前交互序列,其中,所述第一交换数据表示所述当前交互行为交换的数值;
匹配模块,用于使用预设交互行为数据库中的数据对所述当前交互序列进行匹配处理,得到匹配结果;
确定模块,用于依据所述匹配结果确定所述当前交互行为是否为合法行为;
其中,所述聚类处理模块包括:
第三查询模块,用于使用所述预设对象关系查询与所述第一交互对象对应的第四交互对象;
第四查询模块,用于使用所述预设数据关系查询与所述第一交换数据对应的第四交换数据;
第二替换模块,用于使用所述第四交互对象替换所述第一交互对象,使用所述第四交换数据替换所述第一交互对象,得到所述当前交互序列。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
采集模块,用于在使用预设交互行为数据库对所述当前交互序列进行匹配处理,得到匹配结果之前,采集所述用户的历史交互行为数据,得到历史交互行为集合;
提取模块,用于从所述历史交互行为集合中提取发生频率符合预设阈值的历史交互行为数据,得到合法行为项集;
转换模块,用于将所述合法行为项集中的所述历史交互行为数据转换为历史时间序列,生成所述预设交互行为数据库。
8.根据权利要求7所述的装置,其特征在于,所述提取模块包括:
更新模块,用于对所述历史交互行为数据中的第二交互对象和第二交换数据进行降维处理得到第三交互对象和第三交换数据,得到更新后的历史交互行为数据;
第一计算模块,用于计算对应同一个所述第三交互对象的所述更新后的历史交互行为数据的发生频率;
生成模块,用于将所述发生频率大于所述预设阈值的所述更新后的历史交互行为数据,生成所述合法行为项集。
9.根据权利要求8所述的装置,其特征在于,所述更新模块包括:
第一处理模块,用于对所述历史交互行为数据中的所述第二交互对象进行降维处理得到所述第三交互对象,所述第一处理模块包括:分组模块,用于将对应同一个所述第二交互对象的所述历史交互行为数据进行分组得到多个交互对象集合;离散处理模块,用于对每个所述交互对象集合中的所述历史交互行为数据的所述第二交换数据和交互类型进行离散处理得到每个所述历史交互行为数据的交互分数;第一查询模块,用于查询得到对应所述交互分数的所述第三交互对象;
第二处理模块,用于对所述历史交互行为数据中的所述第二交换数据进行降维处理得到所述第三交换数据:第二查询模块,用于查询得到与所述第二交换数据对应的所述第三交换数据;
第一替换模块,用于使用所述第三交互对象替换所述第二交互对象,并使用所述第三交换数据替换所述第二交换数据,得到所述更新后的历史交互行为数据。
10.根据权利要求6至9中任意一项所述的装置,其特征在于,
所述匹配模块包括:匹配子模块,用于将所述当前交互序列与所述预设交互行为数据库中的数据逐个进行匹配处理,得到所述预设交互行为数据库中存在与所述当前交互序列相匹配的数据的第一匹配结果,或得到所述预设交互行为数据库中不存在与所述当前交互序列相匹配的数据的第二匹配结果;
所述确定模块包括:第一确定子模块,用于若得到所述第一匹配结果确定所述当前交互行为为所述合法行为;第二确定子模块,用于若得到所述第二匹配结果确定所述当前交互行为不为所述合法行为。
CN201410377277.6A 2014-08-01 2014-08-01 区分交互行为的方法及装置 Active CN105426365B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410377277.6A CN105426365B (zh) 2014-08-01 2014-08-01 区分交互行为的方法及装置
HK16109295.5A HK1221783A1 (zh) 2014-08-01 2016-08-04 區分交互行爲的方法及裝置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410377277.6A CN105426365B (zh) 2014-08-01 2014-08-01 区分交互行为的方法及装置

Publications (2)

Publication Number Publication Date
CN105426365A CN105426365A (zh) 2016-03-23
CN105426365B true CN105426365B (zh) 2018-11-02

Family

ID=55504578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410377277.6A Active CN105426365B (zh) 2014-08-01 2014-08-01 区分交互行为的方法及装置

Country Status (2)

Country Link
CN (1) CN105426365B (zh)
HK (1) HK1221783A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021134417A1 (zh) * 2019-12-31 2021-07-08 深圳市优必选科技股份有限公司 交互行为预测方法、智能装置和计算机可读存储介质

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107622072B (zh) * 2016-07-15 2021-08-17 阿里巴巴集团控股有限公司 一种针对网页操作行为的识别方法及服务器、终端
CN107426177A (zh) * 2017-06-13 2017-12-01 努比亚技术有限公司 一种用户行为聚类分析方法及终端、计算机可读存储介质
CN108229964B (zh) * 2017-12-25 2021-04-02 同济大学 交易行为轮廓构建与认证方法、系统、介质及设备
CN108449231B (zh) * 2018-03-15 2020-07-07 华青融天(北京)软件股份有限公司 一种交易数据的过滤方法、装置及实现装置
CN108615144A (zh) * 2018-04-11 2018-10-02 北京奇虎科技有限公司 区块链节点的身份信息处理方法、装置及计算设备
US10936950B1 (en) 2019-08-15 2021-03-02 Advanced New Technologies Co., Ltd. Processing sequential interaction data
CN110555469B (zh) * 2019-08-15 2020-07-24 阿里巴巴集团控股有限公司 处理交互序列数据的方法及装置
CN110675140A (zh) * 2019-09-11 2020-01-10 中国银联股份有限公司 支付信息处理方法、装置、设备及计算机可读存储介质
CN111143639B (zh) * 2019-12-27 2021-05-07 同盾(广州)科技有限公司 用户亲密度计算方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1262949C (zh) * 2000-02-14 2006-07-05 奥弗图尔服务公司 确定网络上交互有效性的系统和方法
US7251645B1 (en) * 1999-04-07 2007-07-31 Ns Solutions Corporation Data processing apparatus, data processing system, data processing method, and recording medium
CN102591995A (zh) * 2012-03-12 2012-07-18 浙江大学城市学院 一种基于云数据中心的用户信息处理方法及装置
CN103365969A (zh) * 2013-06-24 2013-10-23 北京奇虎科技有限公司 一种异常数据检测处理的方法和系统
CN103440199A (zh) * 2013-08-27 2013-12-11 百度在线网络技术(北京)有限公司 测试引导方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8204884B2 (en) * 2004-07-14 2012-06-19 Nice Systems Ltd. Method, apparatus and system for capturing and analyzing interaction based content

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7251645B1 (en) * 1999-04-07 2007-07-31 Ns Solutions Corporation Data processing apparatus, data processing system, data processing method, and recording medium
CN1262949C (zh) * 2000-02-14 2006-07-05 奥弗图尔服务公司 确定网络上交互有效性的系统和方法
CN102591995A (zh) * 2012-03-12 2012-07-18 浙江大学城市学院 一种基于云数据中心的用户信息处理方法及装置
CN103365969A (zh) * 2013-06-24 2013-10-23 北京奇虎科技有限公司 一种异常数据检测处理的方法和系统
CN103440199A (zh) * 2013-08-27 2013-12-11 百度在线网络技术(北京)有限公司 测试引导方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021134417A1 (zh) * 2019-12-31 2021-07-08 深圳市优必选科技股份有限公司 交互行为预测方法、智能装置和计算机可读存储介质

Also Published As

Publication number Publication date
CN105426365A (zh) 2016-03-23
HK1221783A1 (zh) 2017-06-09

Similar Documents

Publication Publication Date Title
CN105426365B (zh) 区分交互行为的方法及装置
CN110648185B (zh) 一种目标人群圈选方法、装置及计算机设备
CN106326248B (zh) 数据库数据的存储方法和装置
CN109816482B (zh) 电商平台的知识图谱构建方法、装置、设备及存储介质
CN111079174A (zh) 基于匿名化及差分隐私技术的用电数据脱敏方法及系统
CN104394118A (zh) 一种用户身份识别方法及系统
CN103034680B (zh) 针对终端设备的数据交互方法及装置
CN104866484A (zh) 一种数据处理方法和装置
CN103020128B (zh) 与终端设备交互数据的方法与装置
SG152180A1 (en) Website management method and on-line system
US20200242417A1 (en) Extraction of Anomaly Related Rules Using Data Mining and Machine Learning
CN107291779B (zh) 缓存数据管理方法及装置
Raja et al. Market behavior analysis using descriptive approach
CN107220745A (zh) 一种意图行为数据的识别方法、系统及设备
CN106844588A (zh) 一种基于网络爬虫的用户行为数据的分析方法及系统
Shaohui et al. Customer transaction fraud detection using random forest
Zheng et al. Anomalous telecom customer behavior detection and clustering analysis based on ISP’s operating data
Jiang Credit scoring model based on the decision tree and the simulated annealing algorithm
Urazmatov et al. Analysis of big data processing technologies
CN110347786A (zh) 一种语义模型的调优方法及系统
WO2019213425A2 (en) System and method including accurate scoring and response
Anjum et al. Optimizing coverage of churn prediction in telecommunication industry
CA3046474A1 (en) Portfolio-based text analytics tool
Gao Big Data analysis on E-commerce platform
CN105225116A (zh) 交易操作的识别方法及服务器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1221783

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Patentee before: Alibaba Group Holding Ltd.

TR01 Transfer of patent right