CN111242771A - 用户操作行为的处理方法和装置及计算机可读存储介质 - Google Patents
用户操作行为的处理方法和装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111242771A CN111242771A CN202010030380.9A CN202010030380A CN111242771A CN 111242771 A CN111242771 A CN 111242771A CN 202010030380 A CN202010030380 A CN 202010030380A CN 111242771 A CN111242771 A CN 111242771A
- Authority
- CN
- China
- Prior art keywords
- operation behavior
- vector
- user
- behavior
- computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Abstract
本发明实施例公开了一种用户操作行为的处理方法和装置及计算机可读存储介质,包括:分别将用户的每一个操作行为转换为对应的固定维度的向量;其中,固定维度的向量用于表示操作行为对应的操作信息;根据用户的部分或所有操作行为对应的固定维度的向量确定某一个时刻对应的综合表示的向量。本发明实施例从用户每一个操作行为对应的操作信息和基于部分或所有操作行为对应的固定维度的向量得到某一个时刻对应的综合表示的向量,采用了具有完备性和正交性的方式来表示了用户的操作行为。
Description
技术领域
本发明实施例涉及但不限于数据处理技术,尤指一种用户操作行为的处理方法和装置及计算机可读存储介质。
背景技术
随着万维网(web,WorldWide Web)开发与移动端开发技术的发展,开发者可以采集到多种类型的用户行为数据,比如页面访问路径、页面停留时长、应用程序(app,Application)安装列表,甚至鼠标移动轨迹、文本输入停顿等,这些数据背后暗含了一些用户身份、兴趣相关的信息。比如,如果用户近期安装了很多借贷类app,说明用户的收入负债比可能急速下降;如果过去很短时间内一批用户的页面访问路径与页面停留时长都非常相似,可能该app正面临来自中介的攻击;如果用户输入自己手机号码时输入时间长,且每3-4位停顿一下,该客户可能是身份冒用;等等。因此,如何有效且全面的挖掘出用户行为数据背后的价值,成为一个亟待解决的问题。
目前的用户操作行为的处理方法是通过业务专家总结过去的经验教训,将采集到的用户的操作行为相关的原始数据加工成衍生变量,每个衍生变量代表了一条专家经验,衍生变量比如:用户输入手机号码的总时长、借贷类app总个数、用户最近一次登录app的时间间隔等等。衍生变量再交由后续流程处理,比如设置规则:如果“借贷类app总个数”大于5,则借款申请不予通过。这种用户操作行为的处理方法由于衍生变量的数量十分有限,不能保证数据得以充分利用;不同衍生变量之间可能相似性很高,存在语义上的重复;不同时间上的同一用户操作行为之间可能存在关联,一系列事件组合在一起才会暗含某种意图,比如页面访问轨迹,这类衍生变量在实现时往往处理难度会比较大;总之,衍生变量所表示的用户操作行为不具有完备性和正交性,使得后续的数据处理的准确度较低。
发明内容
本发明实施例提供了一种用户操作行为的处理方法和装置及计算机可读存储介质,能够采用具有完备性和正交性的方式来表示用户的操作行为。
本发明实施例提供了一种用户操作行为的处理方法,包括:
分别将用户的每一个操作行为转换为对应的固定维度的向量;其中,固定维度的向量用于表示操作行为对应的操作信息;
根据用户的部分或所有操作行为对应的固定维度的向量确定某一个时刻对应的综合表示的向量。
在本发明实施例中,该方法还包括:
根据所述综合表示的向量进行分类模型的训练或进行异常操作行为的检测。
在本发明实施例中,所述操作信息包括:操作行为类型、起始时间、操作行为的时长、操作行为的内容、操作行为是否有停顿。
在本发明实施例中,所述固定维度的向量包括一个第一部分,所述第一部分包括所述操作信息;
或者,所述固定维度的向量包括N个第二部分,每一个所述第二部分包括一种操作行为类型对应的操作信息;其中,N为大于或等于1的整数。
在本发明实施例中,所述根据用户的部分或所有操作行为对应的固定维度的向量确定某一个时刻对应的综合表示的向量包括:
将用户的部分或所有操作行为对应的固定维度的向量按照时间先后的顺序输入表示模型中,输出某一个时刻对应的综合表示的向量。
在本发明实施例中,所述表示模型为长短期记忆网络LSTM模型,或双向的长短期记忆网络Bi-LSTM模型。
本发明实施例提出了一种用户操作行为的处理装置,包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令被所述处理器执行时,实现上述任一种用户操作行为的处理方法。
本发明实施例提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种用户操作行为的处理方法的步骤。
本发明实施例包括:分别将用户的每一个操作行为转换为对应的固定维度的向量;其中,固定维度的向量用于表示操作行为对应的操作信息;根据用户的部分或所有操作行为对应的固定维度的向量确定某一个时刻对应的综合表示的向量。本发明实施例从用户每一个操作行为对应的操作信息和基于部分或所有操作行为对应的固定维度的向量得到某一个时刻对应的综合表示的向量,采用了具有完备性和正交性的方式来表示了用户的操作行为。
本发明实施例的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例而了解。本发明实施例的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明实施例技术方案的进一步理解,并且构成说明书的一部分,与本发明实施例的实施例一起用于解释本发明实施例的技术方案,并不构成对本发明实施例技术方案的限制。
图1为本发明一个实施例提出的用户操作行为的处理方法的流程图;
图2为本发明另一个实施例提出的用户操作行为的处理装置的结构组成示意图。
具体实施方式
下文中将结合附图对本发明实施例进行详细说明。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
参见图1,本发明一个实施例提出了一种用户操作行为的处理方法,包括:
步骤100、分别将用户的每一个操作行为转换为对应的固定维度的向量;其中,固定维度的向量用于表示操作行为对应的操作信息。
在一个示例性实例中,操作信息包括:操作行为类型、起始时间、操作行为的时长、操作行为的内容、操作行为是否有停顿。
其中,操作行为类型是指用户的操作行为所属的类别,例如,如表1所示,采用1表示页面访问,2表示文字输入,3表示app安装,4表示点击触控,5表示鼠标或手指的移动轨迹,6表示添加或删除联系人;
起始时间是指操作行为开始的时间;
操作行为的时长是指操作行为持续的时间长度;
操作行为的内容是指操作行为所操作的内容,例如,当操作行为类型为输入文字时,操作行为的内容为输入的内容;当操作行为类型为点击触控时,操作行为的内容为点击按钮的ID;当操作行为类型为鼠标或手指的移动轨迹时,操作行为的内容为鼠标或手指的移动轨迹的起始位置的横坐标、纵坐标,终止位置的横坐标、纵坐标;当操作行为类型为页面访问时,操作行为的内容为访问的页面ID;当操作行为类型为app安装时,操作行为的内容为app名称;当操作行为类型为添加或删除联系人时,操作行为的内容为联系人名字、号码、公式、职务等中的一个或多个;
操作行为是否有停顿是指在操作行为持续的时间长度内是否有停顿。
在一个示例性实例中,如表1所示,固定维度的向量包括一个第一部分,所述第一部分包括操作信息。
表1
在另一个实施例中,如表2所示,固定维度的向量包括N个第二部分,每一个第二部分包括一种操作行为类型对应的操作信息。
表2
步骤101、根据用户的部分或所有操作行为对应的固定维度的向量确定某一个时刻对应的综合表示的向量。
本发明实施例可以采用多种方式获得某一个时刻对应的综合表示的向量,具体的获得方式不用于限定本发明实施例的保护范围。例如,可以将用户的部分或所有操作行为对应的固定维度的向量按照时间先后的顺序输入表示模型中,输出某一个时刻对应的综合表示的向量。
在一个示例性实例中,某一个时刻可以是当前时刻,也可以是历史的某一个时刻。
在一个示例性实例中,表示模型可以是长短期记忆网络(LSTM,Long Short-TermMemory)模型,或双向的长短期记忆网络(Bi-LSTM)模型。
以LSTM模型为例来进行说明,LSTM模型包括遗忘模块、输出模块、记忆模块和校正模块。
在本发明另一个实施例中,该方法还包括:
步骤102、根据综合表示的向量进行分类模型的训练或进行异常操作行为的检测。
本发明实施例从用户每一个操作行为对应的操作信息和基于部分或所有操作行为对应的固定维度的向量得到某一个时刻对应的综合表示的向量,采用了具有完备性和正交性的方式来表示了用户的操作行为。
本发明另一个实施例提出了一种用户操作行为的处理装置,包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令被所述处理器执行时,实现上述任一种用户操作行为的处理方法。
本发明另一个实施例提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种用户操作行为的处理方法的步骤。
参见图2,本发明另一个实施例提出了一种用户操作行为的处理装置,包括:
转换模块201,用于分别将用户的每一个操作行为转换为对应的固定维度的向量;其中,固定维度的向量用于表示操作行为对应的操作信息;
处理模块202,用于根据用户的部分或所有操作行为对应的固定维度的向量确定某一个时刻对应的综合表示的向量。
在一个示例性实例中,操作信息包括:操作行为类型、起始时间、操作行为的时长、操作行为的内容、操作行为是否有停顿。
其中,操作行为类型是指用户的操作行为所属的类别,例如,如表1所示,采用1表示页面访问,2表示文字输入,3表示app安装,4表示点击触控,5表示鼠标或手指的移动轨迹,6表示添加或删除联系人;
起始时间是指操作行为开始的时间;
操作行为的时长是指操作行为持续的时间长度;
操作行为的内容是指操作行为所操作的内容,例如,当操作行为类型为输入文字时,操作行为的内容为输入的内容;当操作行为类型为点击触控时,操作行为的内容为点击按钮的ID;当操作行为类型为鼠标或手指的移动轨迹时,操作行为的内容为鼠标或手指的移动轨迹的起始位置的横坐标、纵坐标,终止位置的横坐标、纵坐标;当操作行为类型为页面访问时,操作行为的内容为访问的页面ID;当操作行为类型为app安装时,操作行为的内容为app名称;当操作行为类型为添加或删除联系人时,操作行为的内容为联系人名字、号码、公式、职务等中的一个或多个;
操作行为是否有停顿是指在操作行为持续的时间长度内是否有停顿。
在一个示例性实例中,如表1所示,固定维度的向量包括一个第一部分,所述第一部分包括操作信息。
在另一个实施例中,如表2所示,固定维度的向量包括N个第二部分,每一个第二部分包括一种操作行为类型对应的操作信息。
本发明实施例可以采用多种方式获得某一个时刻对应的综合表示的向量,具体的获得方式不用于限定本发明实施例的保护范围。例如,可以将用户的部分或所有操作行为对应的固定维度的向量按照时间先后的顺序输入表示模型中,输出某一个时刻对应的综合表示的向量。
在一个示例性实例中,某一个时刻可以是当前时刻,也可以是历史的某一个时刻。
在一个示例性实例中,表示模型可以是长短期记忆网络(LSTM,LongShort-TermMemory)模型,或双向的长短期记忆网络(Bi-LSTM)模型。
以LSTM模型为例来进行说明,LSTM模型包括遗忘模块、输出模块、记忆模块和校正模块。
在本发明另一个实施例中,还包括:
检测模块203,用于根据综合表示的向量进行分类模型的训练或进行异常操作行为的检测。
本发明实施例从用户每一个操作行为对应的操作信息和基于部分或所有操作行为对应的固定维度的向量得到某一个时刻对应的综合表示的向量,采用了具有完备性和正交性的方式来表示了用户的操作行为。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
虽然本发明实施例所揭露的实施方式如上,但所述的内容仅为便于理解本发明实施例而采用的实施方式,并非用以限定本发明实施例。任何本发明实施例所属领域内的技术人员,在不脱离本发明实施例所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明实施例的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
Claims (8)
1.一种用户操作行为的处理方法,包括:
分别将用户的每一个操作行为转换为对应的固定维度的向量;其中,固定维度的向量用于表示操作行为对应的操作信息;
根据用户的部分或所有操作行为对应的固定维度的向量确定某一个时刻对应的综合表示的向量。
2.根据权利要求1所述的处理方法,其特征在于,该方法还包括:
根据所述综合表示的向量进行分类模型的训练或进行异常操作行为的检测。
3.根据权利要求1或2所述的处理方法,其特征在于,其中,所述操作信息包括:操作行为类型、起始时间、操作行为的时长、操作行为的内容、操作行为是否有停顿。
4.根据权利要求1或2所述的处理方法,其特征在于,其中,所述固定维度的向量包括一个第一部分,所述第一部分包括所述操作信息;
或者,所述固定维度的向量包括N个第二部分,每一个所述第二部分包括一种操作行为类型对应的操作信息;其中,N为大于或等于1的整数。
5.根据权利要求1或2所述的处理方法,其特征在于,其中,所述根据用户的部分或所有操作行为对应的固定维度的向量确定某一个时刻对应的综合表示的向量包括:
将用户的部分或所有操作行为对应的固定维度的向量按照时间先后的顺序输入表示模型中,输出某一个时刻对应的综合表示的向量。
6.根据权利要求5所述的处理方法,其特征在于,其中,所述表示模型为长短期记忆网络LSTM模型,或双向的长短期记忆网络Bi-LSTM模型。
7.一种用户操作行为的处理装置,包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,其特征在于,当所述指令被所述处理器执行时,实现如权利要求1~6任一项所述的用户操作行为的处理方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~6任一项所述的用户操作行为的处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010030380.9A CN111242771A (zh) | 2020-01-13 | 2020-01-13 | 用户操作行为的处理方法和装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010030380.9A CN111242771A (zh) | 2020-01-13 | 2020-01-13 | 用户操作行为的处理方法和装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111242771A true CN111242771A (zh) | 2020-06-05 |
Family
ID=70874495
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010030380.9A Withdrawn CN111242771A (zh) | 2020-01-13 | 2020-01-13 | 用户操作行为的处理方法和装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111242771A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170293919A1 (en) * | 2016-04-11 | 2017-10-12 | International Business Machines Corporation | Feature learning on customer journey using categorical sequence data |
CN108510280A (zh) * | 2018-03-23 | 2018-09-07 | 上海氪信信息技术有限公司 | 一种基于移动设备行为数据的金融欺诈行为预测方法 |
CN109615454A (zh) * | 2018-10-30 | 2019-04-12 | 阿里巴巴集团控股有限公司 | 确定用户金融违约风险的方法及装置 |
CN109684543A (zh) * | 2018-12-14 | 2019-04-26 | 北京百度网讯科技有限公司 | 用户行为预测和信息投放方法、装置、服务器和存储介质 |
CN109933503A (zh) * | 2019-02-13 | 2019-06-25 | 平安科技(深圳)有限公司 | 用户操作风险系数确定方法、装置及存储介质、服务器 |
CN110020938A (zh) * | 2019-01-23 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 交易信息处理方法、装置、设备及存储介质 |
CN110362999A (zh) * | 2019-06-25 | 2019-10-22 | 阿里巴巴集团控股有限公司 | 用于检测账户使用异常的方法及装置 |
CN110415102A (zh) * | 2019-06-28 | 2019-11-05 | 上海上湖信息技术有限公司 | 用户信用风险评估方法及装置、计算机可读存储介质 |
-
2020
- 2020-01-13 CN CN202010030380.9A patent/CN111242771A/zh not_active Withdrawn
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170293919A1 (en) * | 2016-04-11 | 2017-10-12 | International Business Machines Corporation | Feature learning on customer journey using categorical sequence data |
CN108510280A (zh) * | 2018-03-23 | 2018-09-07 | 上海氪信信息技术有限公司 | 一种基于移动设备行为数据的金融欺诈行为预测方法 |
CN109615454A (zh) * | 2018-10-30 | 2019-04-12 | 阿里巴巴集团控股有限公司 | 确定用户金融违约风险的方法及装置 |
CN109684543A (zh) * | 2018-12-14 | 2019-04-26 | 北京百度网讯科技有限公司 | 用户行为预测和信息投放方法、装置、服务器和存储介质 |
CN110020938A (zh) * | 2019-01-23 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 交易信息处理方法、装置、设备及存储介质 |
CN109933503A (zh) * | 2019-02-13 | 2019-06-25 | 平安科技(深圳)有限公司 | 用户操作风险系数确定方法、装置及存储介质、服务器 |
CN110362999A (zh) * | 2019-06-25 | 2019-10-22 | 阿里巴巴集团控股有限公司 | 用于检测账户使用异常的方法及装置 |
CN110415102A (zh) * | 2019-06-28 | 2019-11-05 | 上海上湖信息技术有限公司 | 用户信用风险评估方法及装置、计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8442926B2 (en) | Information filtering system, information filtering method and information filtering program | |
CN108205674B (zh) | 社交app的内容识别方法、电子设备、存储介质及系统 | |
US10459603B2 (en) | Extension activation for related documents | |
CN107229559B (zh) | 针对业务系统的测试完整度的检测方法和装置 | |
CN105068726B (zh) | 一种信息处理的方法及终端 | |
CN111858242A (zh) | 一种系统日志异常检测方法、装置及电子设备和存储介质 | |
CN108664471B (zh) | 文字识别纠错方法、装置、设备及计算机可读存储介质 | |
CN110096590A (zh) | 一种文档归类方法、装置、介质和电子设备 | |
CN110888756A (zh) | 一种诊断日志生成方法及装置 | |
CN115455166A (zh) | 一种智能对话系统异常检测的方法、装置、介质及设备 | |
CN109492163B (zh) | 一种列表展示的记录方法、装置、终端设备及存储介质 | |
CN110727576B (zh) | 一种web页面测试方法、装置、设备及存储介质 | |
CN111242771A (zh) | 用户操作行为的处理方法和装置及计算机可读存储介质 | |
CN111753328A (zh) | 隐私数据的泄露风险检测方法及系统 | |
CN113220949B (zh) | 一种隐私数据识别系统的构建方法及装置 | |
CN109145308B (zh) | 一种基于改进朴素贝叶斯的涉密文本识别方法 | |
CN109656805B (zh) | 用于业务分析的代码链路的生成方法、装置及业务服务器 | |
CN111143526A (zh) | 一种咨询服务控件配置信息的生成、控制方法及装置 | |
CN112559368A (zh) | 接口自动化测试方法及其用例生成方法、设备及存储介质 | |
CN111666522A (zh) | 信息处理方法、装置、设备和存储介质 | |
CN109445757B (zh) | 新设计图生成方法、装置及终端设备 | |
CN109218411B (zh) | 数据处理方法及装置、计算机可读存储介质、电子设备 | |
KR101900026B1 (ko) | 오탐 방지 및 무결성 향상이 가능한 모바일 포렌식 솔루션에 대한 교차 검증 시스템 | |
CN113011165A (zh) | 一种识别被封锁关键词的方法、装置、设备及介质 | |
CN117851251A (zh) | 接口测试方法及装置、电子设备、可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20200605 |
|
WW01 | Invention patent application withdrawn after publication |