CN109543373B - 一种基于用户行为的信息识别方法及装置 - Google Patents

一种基于用户行为的信息识别方法及装置 Download PDF

Info

Publication number
CN109543373B
CN109543373B CN201811384517.XA CN201811384517A CN109543373B CN 109543373 B CN109543373 B CN 109543373B CN 201811384517 A CN201811384517 A CN 201811384517A CN 109543373 B CN109543373 B CN 109543373B
Authority
CN
China
Prior art keywords
information
determining
operation information
abnormal
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811384517.XA
Other languages
English (en)
Other versions
CN109543373A (zh
Inventor
崔阳
梅健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Advanced New Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced New Technologies Co Ltd filed Critical Advanced New Technologies Co Ltd
Priority to CN201811384517.XA priority Critical patent/CN109543373B/zh
Publication of CN109543373A publication Critical patent/CN109543373A/zh
Application granted granted Critical
Publication of CN109543373B publication Critical patent/CN109543373B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书实施例公开了一种基于用户行为的信息识别方法及装置,该方法包括:获取操作信息;确定所述操作信息的特征信息;确定所述特征信息对应的历史样本集合中的异常样本的占比;根据所述异常样本的占比对所述操作信息进行相应处理。

Description

一种基于用户行为的信息识别方法及装置
技术领域
本申请涉及计算机技术领域,尤其涉及一种基于用户行为的信息识别方法及装置。
背景技术
随着信息技术的发展,互联网技术日新月异,在线系统(如:网站)面临的网络攻击日趋多元化、复杂化、海量化,对在线系统中用户信息的安全构成极大威胁。
现有技术中,在线系统通常采用用户身份校验的方式,保证用户信息的安全,以使得用户可以安全地进行在线操作,也即,用户需要经过相应的身份校验后,才可登录至在线系统中,以进行相应的在线操作。
常见的身份校验方式包括:密码校验、生物特征校验以及设备校验(如:计算机终端校验、移动终端校验)等。上述用户身份校验方式,不仅可以用于防范未经用户本人授权的网络行为,避免用户信息受损,也减少了用户有感知的身份校验过程(如:使用设备校验时,用户无需输入校验信息)。
然而,上述用户身份校验的方式均存在一定的缺陷:
对于密码校验而言,用户每一次校验,都需要输入相应的密码信息,校验过程较为繁琐,并且,如果密码信息丢失后,其他用户使用该密码信息也可以顺利登录,在线系统无法判断登录者的真实身份,从而不能有效保证用户信息的安全。
对于生物特征校验而言,生物特征校验虽然具有较高的安全性,但这种校验方式受到软硬件及识别算法准确性的限制,降低了该方式的普及程度,实用性较差。
对于设备校验而言,设备校验将用户信息与相应设备进行绑定,虽然在进行身份校验时,在线系统直接通过该设备就可以确定出用户信息,无需用户的输入操作,但是,若用户使用其他设备时,需要重新绑定用户信息,绑定过程较为繁琐,而且,如果与用户信息相绑定的设备丢失后,其他用户可以随意使用该设备进行网络操作,对用户信息的安全造成极大威胁。
发明内容
本申请实施例提供一种基于用户行为的信息识别方法及装置,用以解决目前用户身份校验方式的安全性较低且局限性较大的问题。
本申请实施例提供的一种基于用户行为的信息识别方法,包括:
确定当前操作信息对应的特征信息,作为当前特征信息;
确定所述当前特征信息对应的历史样本集合,所述历史样本集合中包含多个历史操作信息;
当根据所述历史样本集合中包含的异常样本,确定所述当前操作信息为异常操作信息时,对所述当前操作信息进行相应处理。
本申请实施例提供的一种基于用户行为的信息识别装置,包括:
特征信息模块,用于确定当前操作信息对应的特征信息,作为当前特征信息;
历史样本集合模块,用于确定所述当前特征信息对应的历史样本集合,所述历史样本集合中包含多个历史操作信息;
处理模块,用于当根据所述历史样本集合中包含的异常样本,确定所述当前操作信息为异常操作信息时,对所述当前操作信息进行相应处理。
本申请实施例提供一种基于用户行为的信息识别方法及装置,通过本方法,服务器接收到当前操作信息后,确定该当前操作信息的当前特征信息,并根据该当前特征信息,确定其对应的历史样本集合,由于历史样本集合中包含已经识别出的异常样本和正常样本,那么,根据该历史样本集合中异常操作信息的占比,就可以确定出当前操作信息为异常操作信息的概率,从而可以较准确的判断出当前操作信息是否为异常操作信息,并且,可以在不使用用户身份校验的方式时,对当前操作信息进行判断校验,有效提升了校验的安全性和实用性。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的基于用户行为的信息识别过程;
图2为本申请实施例提供的在实际应用场景下的基于用户行为的信息识别过程;
图3为本申请实施例提供的基于用户行为的信息识别装置结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请实施例提供的基于用户行为的信息识别过程,该过程具体包括以下步骤:
S101,确定当前操作信息对应的特征信息,作为当前特征信息。
在本申请实施例中,当用户想要通过服务器(如:网站服务器)获得业务服务时,可通过该用户自身的账户,向该服务器发出相应的操作信息,如:下单操作信息、退款操作信息等。
服务器根据用户发出的操作信息,可以确定出该操作信息的特征信息。本申请实施例中,特征信息可以反映出用户的操作习惯。那么,在本申请实施例中,特征信息可以包括操作信息中的基本信息,如:下单额度信息、下单时间信息、退款额度信息等,还可以包括反映用户操作习惯的信息,如:累计下单总额、每一次操作信息的平均额度等等。
例如:对于用户A而言,某网站的服务器根据保存的该用户A过去的4次历史操作记录,可统计出该用户A每天平均进行1次交易操作,每次的交易额度均为10元。可见,用户A的交易操作形成一种规律,则可以根据该用户A在该网站中的4次历史交易操作,确定相应的特征信息。具体地,该特征信息可以是:每一次交易操作的交易金额(即为10元),在一定时间段内(如:4天内)的交易总额为40元。
对于上述步骤S101而言,用户在当前时刻向服务器发出的相应操作信息,就是当前操作信息,显然,该当前操作信息中包含有相应的特征信息,也即,当前特征信息。
在本申请实施例中,所述当前操作信息包括交易操作信息,所述特征信息包括:所述特征信息包括:账户的累计有交易的天数、账户的累计交易总额、账户的历史日均额度、当前交易额度与累计交易总额之比、当前交易额度与历史日均额度之比、从当前时刻起24小时内累计交易额度与累计交易总额之比以及从当前时刻起24小时内累计交易额度与历史日均额度之比中的至少一种。可见,在本申请实施例中,所述特征信息,可以表示成数值或者数值范围的形式。
S102,确定所述当前特征信息对应的历史样本集合,所述历史样本集合中包含多个历史操作信息。
在本申请实施例中,所述历史样本集合中包含多个历史操作信息,这些历史操作信息就是所述历史样本集合中的样本。服务器会将保存的具有相同特征信息的各历史操作信息,划分成同一个历史样本集合,将具有不同特征信息的各历史操作信息,划分成不同的历史样本集合。
例如:对10个历史交易操作信息进行划分时,使用“每一次交易操作的交易额度大于100元”这一特征信息,可以将上述10个历史交易操作信息,划分成两个历史样本集合:一个历史样本集合中包含的各历史交易操作信息,都是交易额度大于100元的;而另一个历史样本集合中包含的各历史交易操作信息,都是交易额度不大于100元的。
当然,在实际应用中,也可以使用多种特征信息同时划分历史操作信息。例如:对于上例中的10个历史交易操作信息,可以使用“交易额度大于100元”以及“交易额度与上一个月的交易总额度的比值小于0.6”这两个特征信息进行划分,从而,上述10个历史交易操作信息中,同时满足这两个特征信息的历史操作信息便会划分在同一个历史样本集合中。
也就是说,对于不同的历史样本集合,都是由不同的特征信息进行划分的,那么,在确定了当前操作信息对应的当前特征信息后,就可以根据当前特征信息以及划分历史样本集合的特征信息,确定出当前特征信息对应的历史样本集合。
需要说明的是,历史样本集合中的各历史操作信息对应的历史特征信息,能够在一定程度上反映一个或多个用户过去的操作习惯,因此,在本申请实施例中,所述历史操作信息是用户使用其账户在相应服务器中已经完成的历史操作信息。当然,对于某个历史样本集合中的各历史操作信息,可以是由不同用户所发出的历史操作信息构成,在某些情况下,也可以由同一用户所发出的历史操作信息构成,这并不构成对本申请的限定。
S103,根据所述历史样本集合中包含的异常样本,判断所述当前操作信息是否为异常操作信息,若是,则执行步骤S104,否则执行步骤S105。
在实际应用中,服务器会保存大量的历史操作信息。在这些历史操作信息中,存在一定数量的非用户本人发出的操作信息,如:其他用户盗取某用户的账户,发出交易操作信息,其交易额度较大,远大于该用户以往的交易额度,那么,对于这一类非用户本人发出的操作信息,可认为是对用户信息安全构成威胁的。
也就是说,在历史操作信息中,含有一定数量的、对用户信息安全构成威胁的异常操作信息,而其他的历史操作信息则属于用户使用自身账户发出的正常操作信息,在本申请实施例中,服务器会针对保存的历史操作信息是异常操作信息还是正常操作信息进行识别,并将识别出的结果也进行保存,从而,在服务器保存的历史操作信息中,异常操作信息和正常操作信息是已知的,那么,在服务器保存的历史操作信息中,对用户信息安全构成威胁的异常操作信息就是异常样本,未对用户信息安全构成威胁的正常操作信息就是正常样本。这样,便可以在历史样本集合包含的样本中,确定出异常样本以及正常样本。
在本申请实施例中,根据所述历史样本集合中包含的异常样本,判断所述当前操作信息是否为异常操作信息,具体包括:在该历史样本集合包含的所有样本中,统计异常样本的占比,当所述占比大于预设阈值时,确定所述当前操作信息为异常操作信息。
在历史样本集合中,异常样本的占比越大,则说明在该历史样本集合中的各历史操作信息为异常操作信息的概率就越大。在本申请实施例中,如果当前操作信息的特征信息对应该历史样本集合,那么,该当前操作信息为异常操作信息的概率也是比较高的。从而,可以将该当前操作信息判定为异常操作信息。
需要说明的是,对于上述历史样本集合,其中包含的历史操作信息的数量越多,即样本量越大,通过其确定出的异常操作信息的概率就越精确。
S104,对所述当前操作信息进行相应处理。
经过上述的判断步骤,确定出的异常操作信息,极有可能威胁用户的信息安全,所以,在本申请实施例中,为了保证用户的信息安全,将对该当前操作信息进行相应的处理,例如:可以采用提升安全监控级别的方式,或者是增加安全校验问题的方式,只有当发出该当前操作信息的用户输入正确的校验信息后,才判定当前操作信息为正常操作信息;又或者,可以采用与该账户相绑定的手机号码,确认该当前操作信息等等风控处理。这些风控处理方式,并不构成对本申请的限定。
S105,根据所述当前操作信息进行处理。
若经过上述的判断步骤,未判定该当前操作信息为异常信息,则可以认为该当前操作信息为正常信息,那么,在本申请实施例中,服务器将根据该当前操作信息,进行相应的操作,以使得用户获得相应的业务服务。
当然,由于上述判断方式是基于历史样本集合中的异常样本或正常样本的占比,来确定该当前操作信息为异常操作信息或是正常操作信息,并不能保证绝对准确,因此,在实际应用中,对于未判定为异常信息的当前操作信息,也可以结合二次认证,或手机号码认证的方式,对当前操作信息进行认证,从而,极大提升对当前操作信息判定的准确率,有效保护用户信息的安全。
通过上述步骤,服务器接收到当前操作信息后,确定该当前操作信息的当前特征信息,并根据该当前特征信息,确定其对应的历史样本集合,由于历史样本集合中包含已经识别出的异常样本和正常样本,那么,根据该历史样本集合中异常操作信息的占比,就可以确定出当前操作信息为异常操作信息的概率,从而可以较准确的判断出当前操作信息是否为异常操作信息,有效提升了对用户身份进行校验的安全性和实用性。
在本申请实施例中,是否能准确确定出当前特征信息所对应的历史样本集合,将影响后续确定当前操作信息是否为异常操作信息的准确性。考虑到在实际应用中,当前操作信息对应的当前特征信息,总会符合某一历史操作信息中的一些特征信息,因此,本申请实施例中,确定所述当前特征信息对应的历史样本集合,具体为:确定各历史样本集合包含的历史操作信息所对应的历史特征信息,将所述当前特征信息与所述历史特征信息进行匹配,将与所述当前特征信息匹配的历史特征信息所属的历史样本集合,确定为所述当前特征信息对应的历史样本集合。
在将历史操作信息划分成不同的历史样本集合后,历史样本集合中包含的历史操作信息对应的特征信息,就是历史特征信息。对于当前操作信息对应的当前特征信息而言,其特征信息中的特征范围值或特征值,可能出现与历史特征信息中的范围值或特征值相符合或相一致的情况,那么,则可以认为该当前特征信息与历史特征信息相匹配。
例如:假设针对某网站中的100个历史交易操作信息,其历史特征信息为交易额度,按照交易额度对这100个历史交易操作信息进行分类,形成如表1的集合。
交易额度(单位:元) 0~60 61~80 81~95
集合/样本量 X/50 Y/30 Z/20
表1
在表1中,集合X、Y、Z为历史样本集合,集合X中包含的历史交易操作信息的数量为50个,表明这50个历史交易操作的交易额度均在0~60元之间。集合Y中包含的历史交易操作信息的数量为30个,这30个历史交易操作的交易额度均在61~80元之间。集合Z中包含的历史交易操作信息的数量为20个,这20个历史交易操作的交易额度均在81~95元之间。
假设当前时刻,用户A使用其账户发出当前交易操作信息,该当前交易操作信息对应的当前交易额度(也即当前特征信息)为60元。那么,结合表1,可确定出当前交易额度在0~60元的范围内,也即,当前交易额度与交易额度0~60元相匹配,从而,可以将集合X确定为当前交易操作信息对应的历史样本集合。这样一来,后续便可以根据该集合X中异常样本的占比,确定出用户A发出的该当前交易操作信息为异常操作信息的概率。
通过上例可见,根据当前操作信息对应的当前特征信息,采用将该当前特征信息与历史特征信息进行匹配的方式,就可以准确确定出当前特征信息所对应的历史样本集合。
在本申请实施例中的一种方式下,可以采用决策树、贝叶斯、人工神经网络等多种分类算法,将历史操作信息划分成多个历史样本集合,其中,在使用决策树算法对历史操作信息进行划分的情况下,服务器会预先根据各历史操作信息对应的历史特征信息,生成决策树,其中,所述决策树中的各叶子节点对应不同的历史特征信息,那么,上述步骤S102中,确定所述当前特征信息对应的历史样本集合,具体为:根据所述决策树和所述当前特征信息,确定所述当前特征信息命中的叶子节点,作为当前节点,确定具有所述当前节点对应的历史特征信息的各历史操作信息所构成的集合,作为所述当前特征信息对应的历史样本集合。
对于上述决策树,该决策树中的根节点以及各叶子节点,对应于不同的历史特征信息,其中,根节点对应于所有历史操作信息的历史特征信息,那么,根据这些历史特征信息的特征值或特征值范围,可将具有相同特征值或特征值范围的历史特征信息划分成一个叶子节点,这样便可以形成相应的决策树。显然,根节点对应的历史特征信息越多,该决策树中所含有的叶子节点的数量也就越多,从而,可以有效提升对当前特征信息进行分类的准确性。
具体例如:假设如图2所示的决策树,是针对某网站的历史交易操作信息对应的历史特征信息进行划分,所形成的决策树。
假设在该网站中,以之前一个月内所有的历史交易操作信息作为样本,其总量为1000(在实际应用中,网站中的历史操作信息数量巨大,为便于描述,在此处仅以1000为例),在该1000个历史交易操作信息中,已识别出的异常交易操作信息U的数量为20个,正常交易操作信息N的数量为980个。如图2所示,决策树的根节点1对应于这1000个历史交易操作信息的全部历史特征信息,为了直观表示,在该决策树的所有节点中,标明了具有该节点中的历史特征信息的历史交易操作信息的数量(例如:对于根节点1,共有20个异常交易操作信息和980个正常交易操作信息,具有该根节点1对应的历史特征信息)。
该决策树中的所有叶子节点对应的历史特征信息,均由该根节点1对应的历史特征信息划分而形成,对于该决策树中的叶子节点,具体将根据以下历史特征信息进行划分:
a,账户的历史日均额度。
b,账户的当前交易额度。
根据上述历史特征信息a和b,可以将上述根节点1划分成叶子节点2和3。其中,对于叶子节点2,其对应的历史特征信息为“账户的历史日均额度不小于10元”,在该叶子节点2中,具有该历史特征信息的异常交易操作信息U的数量为6个,正常交易操作信息N的数量为680个。
相应的,对于叶子节点3,其对应的历史特征信息为“账户的历史日均额度小于10元”。在该叶子节点3中,具有该历史特征信息的异常交易操作信息U的数量为14个,正常交易操作信息N的数量为300个。
以此类推,可以划分得到叶子节点4~7,具体过程不再赘述。
在上述的决策树形成后,若某一用户在当前时刻发出当前操作信息,则可以根据该决策树以及该当前操作信息对应的当前特征信息,确定该当前特征信息所命中的叶子节点,从而,可以根据该叶子节点对应的历史特征信息的历史操作信息所构成的集合中,异常样本的占比,确定该当前操作信息为异常操作信息的概率。
具体例如,在如图2所示的决策树的基础上,某用户在当前时刻,使用其账户M发出当前交易操作信息,假设该当前交易操作信息对应的特征信息为:在之前一个月内,该账户M的历史日均额度为7元,当前交易额度为700元。
那么,针对上述当前交易操作信息的当前特征信息,根据如图2所示的决策树,可以确定出该当前特征信息命中的叶子节点为叶子节点9。在该叶子节点9中,历史样本集合中,异常交易操作信息U的数量为10个,正常交易操作信息N的数量为1个,因此,异常交易操作信息的占比为10/10+1=0.909,也即,该当前操作信息为异常交易操作信息的概率为0.909,这就表明该当前操作信息极有可能为异常交易操作信息。从而,网站可以针对该当前操作信息进行相应的风控处理。
当然,对于上述通过决策树的方式确定所述当前特征信息对应的历史样本集合,以及确定所述当前操作信息为异常操作信息的概率的方式,只是本申请实施例中的一种优选方式,并不作为对本申请的限定。
以上为本申请实施例提供的基于用户行为的信息识别方法,基于同样的思路,本申请实施例还提供一种基于用户行为的信息识别装置,如图3所示。
在图3中,所述基于用户行为的信息识别装置包括:特征信息模块301、历史样本集合模块302以及处理模块303,其中,
所述特征信息模块301,用于确定当前操作信息对应的特征信息,作为当前特征信息。
所述历史样本集合模块302,用于确定所述当前特征信息对应的历史样本集合,所述历史样本集合中包含多个历史操作信息。
所述处理模块303,用于当根据所述历史样本集合中包含的异常样本,确定所述当前操作信息为异常操作信息时,对所述当前操作信息进行相应处理。
其中,所述历史样本集合模块302,具体用于确定各历史样本集合包含的历史操作信息所对应的历史特征信息,将所述当前特征信息与所述历史特征信息进行匹配,将与所述当前特征信息匹配的历史特征信息所属的历史样本集合,确定为所述当前特征信息对应的历史样本集合。
在本申请实施例中的另一种方式下,所述历史样本集合模块302,具体用于预先将各历史操作信息按照不同的历史特征信息进行划分,形成决策树,确定所述当前特征信息中的各特征值,按照所述当前特征信息中每一特征值,遍历该决策树,将遍历后确定的唯一叶子节点对应的历史样本集合,确定为所述当前特征信息对应的历史样本集合。
所述处理模块303,具体用于在该历史样本集合包含的所有样本中,统计异常样本的占比,当所述占比大于预设阈值时,确定所述当前操作信息为异常操作信息。
在本申请实施例中,所述当前操作信息包括交易操作信息,所述特征信息包括:所述特征信息包括:账户的累计有交易的天数、账户的累计交易总额、账户的历史日均额度、当前交易额度与累计交易总额之比、当前交易额度与历史日均额度之比、从当前时刻起24小时内累计交易额度与累计交易总额之比以及从当前时刻起24小时内累计交易额度与历史日均额度之比中的至少一种。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (18)

1.一种基于用户行为的信息识别方法,包括:
获取操作信息;
确定所述操作信息的特征信息;所述确定所述操作信息的特征信息具体包括:确定所述操作信息的基本信息,和/或,用户操作习惯信息;
确定所述特征信息对应的历史样本集合中的异常样本的占比;所述历史样本集合包含已经识别出的异常样本和正常样本;
根据所述异常样本的占比对所述操作信息进行相应处理。
2.如权利要求1所述的方法,所述确定所述特征信息对应的历史样本集合中的异常样本的占比,具体包括:
确定所述特征信息对应的历史样本集合;
获取所述历史样本集合中的异常样本的占比;所述异常样本的占比表示所述异常样本的数量相对于所述历史样本集合中的样本总数的比例。
3.如权利要求2所述的方法,所述确定所述特征信息对应的历史样本集合,具体包括:
确定每个历史样本集合对应的属性信息,得到属性信息集合;所述属性信息表示对应的一个历史样本集合中的全部历史样本的共有属性;
将所述特征信息与所述属性信息集合中的各个属性信息进行匹配;
将与所述特征信息匹配的属性信息对应的历史样本集合,确定为所述特征信息对应的历史样本集合。
4.如权利要求1所述的方法,在所述获取操作信息之后,所述方法还包括:
确定所述操作信息对应的账户;
所述确定所述特征信息对应的历史样本集合中的异常样本的占比,具体包括:
确定所述特征信息在所述账户中对应的历史样本集合的异常样本的占比。
5.如权利要求1所述的方法,所述根据所述异常样本的占比对所述操作信息进行相应处理,具体包括:
当确定所述异常样本的占比大于预设阈值时,确定所述操作信息为异常操作信息。
6.如权利要求5所述的方法,在确定所述操作信息为异常操作信息之后,还包括:
提升对于所述操作信息的安全监控级别。
7.如权利要求6所述的方法,所述提升对于所述操作信息的安全监控级别,具体包括:
确定账户绑定的手机号码;
向所述手机号码发送验证信息。
8.如权利要求1所述的方法,所述基本信息包括:下单额度信息、下单时间信息和退款额度信息中的至少一种;所述用户操作习惯信息包括:累计下单金额、单次操作的平均金额、账户的累计有交易的天数、账户的累计交易总额、账户的历史日均额度、当前交易额度与累计交易总额之比、当前交易额度与历史日均额度之比、从当前时刻起24小时内累计交易额度与累计交易总额之比以及从当前时刻起24小时内累计交易额度与历史日均额度之比中的至少一种。
9.如权利要求1所述的方法,预先根据各历史操作信息对应的历史特征信息,生成决策树,其中,所述决策树中的各叶子节点对应不同的属性信息,各叶子节点标明具有该节点中的属性信息的历史操作信息的数量;
确定所述特征信息对应的历史样本集合中的异常样本的占比,具体包括:
根据所述决策树和所述特征信息,确定所述特征信息命中的叶子节点;
确定所述叶子节点包括的历史操作信息中异常样本的数量和正常样本的数量;
根据异常样本的数量和正常样本的数量确定所述特征信息对应的历史样本集合中的异常样本的占比。
10.一种基于用户行为的信息识别装置,包括:
操作信息获取模块,用于获取操作信息;
特征信息确定模块,用于确定所述操作信息的特征信息;所述确定所述操作信息的特征信息具体包括:确定所述操作信息的基本信息,和/或,用户操作习惯信息;
异常样本占比确定模块,用于确定所述特征信息对应的历史样本集合中的异常样本的占比;所述历史样本集合包含已经识别出的异常样本和正常样本;
操作信息处理模块,用于根据所述异常样本的占比对所述操作信息进行相应处理。
11.如权利要求10所述的装置,所述异常样本占比确定模块,具体包括:
历史样本集合确定单元,用于确定所述特征信息对应的历史样本集合;
异常样本占比获取单元,用于获取所述历史样本集合中的异常样本的占比;所述异常样本的占比表示所述异常样本的数量相对于所述历史样本集合中的样本总数的比例。
12.如权利要求11所述的装置,所述历史样本集合确定单元,具体包括:
属性信息确定子单元,用于确定每个历史样本集合对应的属性信息,得到属性信息集合;所述属性信息表示对应的一个历史样本集合中的全部历史样本的共有属性;
匹配子单元,用于将所述特征信息与所述属性信息集合中的各个属性信息进行匹配;
历史样本集合确定子单元,用于将与所述特征信息匹配的属性信息对应的历史样本集合,确定为所述特征信息对应的历史样本集合。
13.如权利要求10所述的装置,所述装置还包括:
账户确定模块,用于在获取操作信息之后,确定所述操作信息对应的账户;
所述异常样本占比确定模块,具体用于确定所述特征信息在所述账户中对应的历史样本集合的异常样本的占比。
14.如权利要求10所述的装置,所述操作信息处理模块,具体用于当确定所述异常样本的占比大于预设阈值时,确定所述操作信息为异常操作信息。
15.如权利要求14所述的装置,所述装置还包括:
安全监控级别提升模块,用于在确定所述操作信息为异常操作信息之后,提升对于所述操作信息的安全监控级别。
16.如权利要求15所述的装置,所述安全监控级别提升模块,具体包括:
手机号码确定单元,用于确定账户绑定的手机号码;
验证信息发送单元,用于向所述手机号码发送验证信息。
17.如权利要求10所述的装置,所述基本信息包括:下单额度信息、下单时间信息和退款额度信息中的至少一种,所述用户操作习惯信息包括:累计下单金额、单次操作的平均金额、账户的累计有交易的天数、账户的累计交易总额、账户的历史日均额度、当前交易额度与累计交易总额之比、当前交易额度与历史日均额度之比、从当前时刻起24小时内累计交易额度与累计交易总额之比以及从当前时刻起24小时内累计交易额度与历史日均额度之比中的至少一种。
18.如权利要求10所述的装置,所述装置还包括:
决策树生成模块,用于预先根据各历史操作信息对应的历史特征信息,生成决策树,其中,所述决策树中的各叶子节点对应不同的属性信息,各叶子节点标明具有该节点中的属性信息的历史操作信息的数量;
所述异常样本占比确定模块,具体包括:
叶子节点确定单元,用于根据所述决策树和所述特征信息,确定所述特征信息命中的叶子节点;
异常样本的数量和正常样本的数量确定单元,用于确定所述叶子节点包括的历史操作信息中异常样本的数量和正常样本的数量;
异常样本占比确定单元,用于根据异常样本的数量和正常样本的数量确定所述特征信息对应的历史样本集合中的异常样本的占比。
CN201811384517.XA 2014-12-10 2014-12-10 一种基于用户行为的信息识别方法及装置 Active CN109543373B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811384517.XA CN109543373B (zh) 2014-12-10 2014-12-10 一种基于用户行为的信息识别方法及装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201811384517.XA CN109543373B (zh) 2014-12-10 2014-12-10 一种基于用户行为的信息识别方法及装置
CN201410759175.0A CN105740667B (zh) 2014-12-10 2014-12-10 一种基于用户行为的信息识别方法及装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201410759175.0A Division CN105740667B (zh) 2014-12-10 2014-12-10 一种基于用户行为的信息识别方法及装置

Publications (2)

Publication Number Publication Date
CN109543373A CN109543373A (zh) 2019-03-29
CN109543373B true CN109543373B (zh) 2023-11-14

Family

ID=56239055

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201811384517.XA Active CN109543373B (zh) 2014-12-10 2014-12-10 一种基于用户行为的信息识别方法及装置
CN201410759175.0A Active CN105740667B (zh) 2014-12-10 2014-12-10 一种基于用户行为的信息识别方法及装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201410759175.0A Active CN105740667B (zh) 2014-12-10 2014-12-10 一种基于用户行为的信息识别方法及装置

Country Status (1)

Country Link
CN (2) CN109543373B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106507308A (zh) * 2016-11-29 2017-03-15 中国银联股份有限公司 一种身份认证方法及装置
CN108269084A (zh) 2017-01-03 2018-07-10 阿里巴巴集团控股有限公司 一种用于在移动设备上进行扫码支付的方法及装置
CN107169353B (zh) * 2017-04-20 2021-05-14 腾讯科技(深圳)有限公司 异常文件识别方法及装置
CN109145109B (zh) * 2017-06-19 2022-06-03 国家计算机网络与信息安全管理中心 基于社交网络的用户群体消息传播异常分析方法及装置
CN107480698B (zh) * 2017-07-12 2021-02-12 中山大学 基于多个监测指标的质量控制方法
CN108090332A (zh) * 2017-12-06 2018-05-29 国云科技股份有限公司 一种基于用户登录行为分析的风控方法
CN108550052A (zh) * 2018-04-03 2018-09-18 杭州呯嘭智能技术有限公司 基于用户行为数据特征的刷单检测方法及系统
CN109582553A (zh) * 2018-11-12 2019-04-05 咪咕文化科技有限公司 一种媒体播放行为的检测方法、装置及存储介质
TWI725369B (zh) * 2018-12-28 2021-04-21 綠界科技股份有限公司 線上退款系統
CN110020858A (zh) * 2019-03-13 2019-07-16 北京三快在线科技有限公司 支付异常检测方法、装置、存储介质及电子设备
CN110598007B (zh) * 2019-09-09 2023-10-27 腾讯科技(深圳)有限公司 账单文件处理方法、装置、介质及电子设备
CN112712368B (zh) * 2021-02-23 2021-12-14 深圳亚桐荟科技有限公司 一种基于大数据的云安全账户管理方法及云安全平台

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101158999A (zh) * 2007-11-20 2008-04-09 北京派瑞根科技开发有限公司 一种防止计算机病毒的方法和装置
CN101714931A (zh) * 2009-11-26 2010-05-26 成都市华为赛门铁克科技有限公司 一种未知恶意代码的预警方法、设备和系统
CN102163251A (zh) * 2010-02-22 2011-08-24 深圳市腾讯计算机系统有限公司 一种游戏作弊的识别方法和设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902885B (zh) * 2014-03-04 2017-11-17 重庆邮电大学 面向多安全等级虚拟桌面系统虚拟机安全隔离系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101158999A (zh) * 2007-11-20 2008-04-09 北京派瑞根科技开发有限公司 一种防止计算机病毒的方法和装置
CN101714931A (zh) * 2009-11-26 2010-05-26 成都市华为赛门铁克科技有限公司 一种未知恶意代码的预警方法、设备和系统
CN102163251A (zh) * 2010-02-22 2011-08-24 深圳市腾讯计算机系统有限公司 一种游戏作弊的识别方法和设备

Also Published As

Publication number Publication date
CN105740667A (zh) 2016-07-06
CN109543373A (zh) 2019-03-29
CN105740667B (zh) 2018-12-04

Similar Documents

Publication Publication Date Title
CN109543373B (zh) 一种基于用户行为的信息识别方法及装置
CN107563757B (zh) 数据风险识别的方法及装置
CN110609941B (zh) 互联网操作事件的风险识别方法及装置
CN105590055B (zh) 用于在网络交互系统中识别用户可信行为的方法及装置
CN107169499B (zh) 一种风险识别方法及装置
US20200013065A1 (en) Method and Apparatus of Identifying a Transaction Risk
CN106549902B (zh) 一种可疑用户的识别方法及设备
CN106469276B (zh) 数据样本的类型识别方法及装置
US8955143B1 (en) Use of decoy data in a data store
CN110245487B (zh) 账号风险的识别方法及装置
CN106776973B (zh) 黑名单数据生成方法和装置
CN103812961A (zh) 识别指定类别ip地址的方法及设备、防御方法及系统
CN104731816A (zh) 一种处理异常业务数据的方法和装置
CN110691082B (zh) 风险事件的处理方法及装置
EP2715565A2 (en) Dynamic rule reordering for message classification
JP6629973B2 (ja) 携帯電話番号を変更するためのサービス要求を認識する方法及び装置
CN105391594A (zh) 识别特征账号的方法及装置
CN111222994A (zh) 客户风险评估方法、装置、介质和电子设备
Kumar et al. An information theoretic approach for feature selection
CN112819611A (zh) 欺诈识别方法、装置、电子设备和计算机可读存储介质
CN114116802A (zh) Flink计算框架的数据处理方法、装置、设备和存储介质
CN110532773B (zh) 恶意访问行为识别方法、数据处理方法、装置和设备
CN107332806B (zh) 移动设备标识的设置方法及装置
CN114765584A (zh) 一种用户行为监测方法、装置、电子设备及存储介质
CN105991609B (zh) 一种风险事件确定方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20201012

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20201012

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant