CN113934616B - 一种基于用户操作时序判断异常用户的方法 - Google Patents
一种基于用户操作时序判断异常用户的方法 Download PDFInfo
- Publication number
- CN113934616B CN113934616B CN202111540706.3A CN202111540706A CN113934616B CN 113934616 B CN113934616 B CN 113934616B CN 202111540706 A CN202111540706 A CN 202111540706A CN 113934616 B CN113934616 B CN 113934616B
- Authority
- CN
- China
- Prior art keywords
- time sequence
- connection
- breakpoints
- abnormal
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3438—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3447—Performance evaluation by modeling
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提供了一种基于用户操作时序判断异常用户的方法,通过记录本次请求的用户、请求时间、访问页面及访问节点。判断连接类型,获取操作间隔值及操作时序。判断是否有操作断点,若有则记录所述操作断点的个数。判断操作间隔值是否低于预设的操作间隔低值。对操作断点进行操作断点异常建模,根据连接类型建立单程操作间隔异常建模和多程操作间隔异常建模。根据不同操作类型的操作时序、各时序对应的权值,根据计算最终异常指标F。优点是,在机票搜索业务中,实时记录用户操作过程,通过跟踪操作异常节点,对操作过程进行加权处理,从而识别异常用户,以供后续处理。
Description
技术领域
本发明涉及计算机软件领域,尤其涉及一种基于用户操作时序判断异常用户的方法。
背景技术
在机票搜索领域中,服务器除了接收正常用户的请求之外,往往会收到机器人等异常用户的大量请求。这些请求并不会最终产生收益,最好将其识别以做后续处理。所以如何提供一种能够自动识别异常用户请求的方法成为亟待解决的问题。
发明内容
本发明提供一种基于用户操作时序判断异常用户的方法,用以解决现有技术中无法在机票搜索领域中通过分析用户的行为,判断此用户是否为异常用户的问题。
为了实现上述目的,本发明技术方案提供了一种基于用户操作时序判断异常用户
的方法,包括:记录本次请求的用户、请求时间、访问页面及访问节点。根据访问页面及访问
节点构成的访问路径判断连接类型,获取操作间隔值及操作时序。判断当前操作时序中是
否有操作断点,判断相邻操作的所述操作间隔值是否低于预设的操作间隔低值,若是则异
常,否则正常;若异常则认为当前操作时序中此操作为操作断点,记录所述操作断点。对操
作断点进行操作断点异常建模,具体为,对多个时间段内的每个操作时序的操作断点比例
进行加权。根据连接类型建立单程操作间隔异常建模和多程操作间隔异常建模。根据不同
操作类型的操作时序、各时序对应的权值,根据下式计算出最终异常指标F:;若F超过阈值,可以将此用户判断为异常用户,其中j为加权参数,表
示此类异常的重要程度,为在不考虑连接类型的情况下的操作断点加权后权值,为
单程操作中每个操作时序内的单程操作间隔的异常比例加权相加值,为多程操作中每
个操作时序内的多程操作间隔的异常比例加权相加值;为的重要性加权参数;
为的重要性加权参数;为的重要性加权参数。
作为上述技术方案的优选,较佳的,判断连接类型,获取操作间隔值及操作时序,包括:若连接中的相邻被操作页面间页面序号连续,则为单程连接;若连接中的相邻被操作页面间页面序号不连续,则为多程连接;将用户在一个周期内的所有操作,划分为若干个操作时序。
作为上述技术方案的优选,较佳的,对多个时间段内的每个操作时序的操作断点比例进行加权,包括:
其中,权值为在不考虑连接类型的情况下的操作断点加权后权值,加权参数h
为根据操作时序长度N乘以[0,1]区间值得到的,用以表示此操作时序的重要程度;为
在不考虑连接类型情况下第1个时序中的操作断点个数;为在不考虑连接类型情况下第2
个时序中的操作断点个数;为在不考虑连接类型情况下第3个时序中的操作断点个数;为在不考虑连接类型情况下第n个时序中的操作断点个数;为第1个时序的长度;
为第2个时序的长度;为第3个时序的长度;为第n个时序的长度;为第1个时序的加
权参数;为第2个时序的加权参数;为第3个时序的加权参数;为第n个时序的加权
参数。
作为上述技术方案的优选,较佳的,根据所述操作间隔值采集操作断点,包括;若用户的操作间隔低于预设操作间隔值时,则此次操作为异常,对异常操作计数;
根据异常操作的总量和所述时序长度计算异常操作比例。
作为上述技术方案的优选,较佳的,对所述操作断点进行操作断点异常建模,根据一周期内每个操作时序的操作断点比例进行加权,包括:
加权参数h为根据操作时序长度N乘以[0,1]区间值得到的,x为异常操作次数;为当前连接模式为单程连接的情况下第1个时序中的操作断点个数,为当前连接模
式为单程连接的情况下第2个时序中的操作断点个数,为当前连接模式为单程连接的
情况下第3个时序中的操作断点个数,为当前连接模式为单程连接的情况下第n个时序
中的操作断点个数;为第一个时序的长度,为第2个时序的长度,为第3个时序的长
度,为第n个时序的长度;为第1个时序的加权参数;为第2个时序的加权参数;
为第3个时序的加权参数;为第n个时序的加权参数。
作为上述技术方案的优选,较佳的,对所述操作断点进行操作断点异常建模,根据一周期内每个操作时序的操作断点比例进行加权,包括:
加权参数h为根据操作时序长度N乘以[0,1]区间值得到的,x为异常操作次数;为当前连接模式为多程连接的情况下第1个时序中的操作断点个数;为当前连接
模式为多程连接的情况下第2个时序中的操作断点个数;为当前连接模式为多程连接的
情况下第3个时序中的操作断点个数;为当前连接模式为多程连接的情况下第n个时
序的操作断点个数;为第1个时序的长度;为第2个时序的长度;为第3个时序
的长度;为第n个时序的长度;为第1个时序的加权参数;为第2个时序的加权
参数;为第3个时序的加权参数;为第n个时序的加权参数。
本发明技术方案提供的,所述方法包括:本发明提供了一种基于用户操作时序判断异常用户的方法,通过记录本次请求的用户、请求时间、访问页面及访问节点。根据访问页面及访问节点构成的访问路径判断连接类型,采集操作间隔值及操作时序。判断当前操作时序中是否有操作断点,若有则记录所述操作断点的个数。判断操作间隔值是否低于预设的操作间隔低值,若是则异常,否则正常。对操作断点进行操作断点异常建模,具体为,对多个时间段内的每个操作时序的操作断点比例进行加权。根据连接类型建立单程操作间隔异常建模和多程操作间隔异常建模。根据不同操作类型的操作时序、各时序对应的权值,根据下式计算出最终异常指标F:;若F超过阈值,可以将此用户判断为异常用户,其中j为预设值。
本发明的优点是:在机票搜索业务中,实时记录用户操作过程,通过跟踪操作异常节点,对操作过程进行加权处理,从而识别异常用户,以供后续处理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明技术方案提供的流程图。
图2为本发明实施例提供的页面跳转示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
现结合具体实施方式对本发明进行说明,图1为本发明实施例提供的流程示意图,如图1所示,包括:
步骤101、记录请求日志信息。
服务器接收到终端发出的机票搜索请求时,会记录这次请求的用户信息、请求时间、访问页面等动作。
步骤102、记录访问节点及节点间的连接关系,并获取连接类型。
具体的,用户在某一时间访问的各个页面(首页、列表页、详情页)之间是具有特定的双向连接,双向连接用以表示用户进入当前页面或返回上一页面或进行与页面跳转动作。特殊的,部分页面之间并不存在连接,现详细说明,如图2所示。图2所示中包括单程连接,如P1(页面1)与P2有连接,即表明P1可以进入P2,P2可以返回到P1,但P1无法进入P2之外的页面;图2所示中包括多程连接,P3与P2、P6之间均有连接关系,在此连接关系下,P3返回P2再进入P6,由于页面缓存等因素,可以视为P3与P6存在连接。
步骤103、对不同的连接类型分别设定操作间隔低值。
根据多数用户操作统计可预估一个最小的操作时间间隔,针对两类连接分别设定两个最小值m1和m2。其中,m1为单程操作的预设的操作间隔低值,m2为多程操作的预设的操作间隔低值。
步骤104、记录用户两次操作之间的时间间隔。
判断相邻操作之间的操作间隔值是否低于预设的操作间隔低值,若是,则操作异常,执行步骤107或步骤108,否则正常。其中,操作间隔值是根据两次的操作时间计算得到的。
若连接类型为单程连接则在步骤107之后执行步骤111,若连接类型为多程连接则在步骤108之后执行步骤112。
步骤105、记录用户的会话时间。
会话时间指的是用户进行多次操作的累积时长,在此累积时长内的相邻操作的间隔时间均小于操作间隔低值。若此次操作距离上一次操作的操作间隔大于操作间隔低值,则为此次操作作为新的会话时间起点。
步骤106、记录用户操作时序,获取操作时序长度。
具体示例如图2所示,记录用户在一个会话时间内进行页面跳转的顺序,例如多程连接(P1,P2,P3,P6),表示用户首先进入P1,进入P2再进入P3,返回至P2后进入P6。
若为单程连接则为(P1,P2,P3,P4,P3),表示用户首先进入P1,进入P2再进入P3,再进入P4后返回P3。
一个操作时序内,N个节点表明了N次操作,即长度为N。
步骤104后开始记录操作断点。
结合图2所示,若用户的操作时序为(P1,P2,P6,P4,P8),因P6和P4之间并无连接,无法直接跳转,视(P6,P4)为一个操作断点,此次操作异常。
步骤107、记录单程操作间隔异常。
若一个用户的某次单程操作间隔低于预设的操作间隔低值m1,视此次操作为异常。步骤107后执行步骤111。
步骤108、记录多程操作间隔异常。
若一个用户的某次多程操作间隔低于预设的操作间隔低值m2,视此次操作为异常。步骤108后执行步骤112。
步骤109、计算时序异常比例。
一个操作时序里,x个操作异常表明了不符合常理操作有x次,因此异常操作比例为:x/N,N为操作时序长度。
步骤110、对操作断点进行建模。
用户可能在一天内多个时间段进行操作,即在一个时间范围内有多个操作时序,以每个操作时序内的操作断点比例加权相加可得:
其中,为在不考虑连接类型的情况下的操作断点加权后权值,加权参数h为根
据操作时序长度N乘以[0,1]区间值得到的,用以表示此操作时序的重要程度;步骤110的公
式中:为在不考虑连接类型情况下第1个时序中的操作断点个数;为在不考虑连接类
型情况下第2个时序中的操作断点个数;为在不考虑连接类型情况下第3个时序中的操作
断点个数;为在不考虑连接类型情况下第n个时序中的操作断点个数;为第1个时序的
长度;为第2个时序的长度;为第3个时序的长度;为第n个时序的长度;为第1个
时序的加权参数;为第2个时序的加权参数;为第3个时序的加权参数;为第n个时
序的加权参数。
步骤111、单程操作间隔异常建模。
在单程操作中,以每个操作时序内的单程操作间隔的异常比例加权相加:
为单程操作中每个操作时序内的单程操作间隔的异常比例加权相加值,在步
骤111的公式中:为当前连接模式为单程连接的情况下第1个时序中的操作断点个数,为当前连接模式为单程连接的情况下第2个时序中的操作断点个数,为当前连接模
式为单程连接的情况下第3个时序中的操作断点个数,为当前连接模式为单程连接的情
况下第n个时序中的操作断点个数;为第一个时序的长度,为第2个时序的长度,为
第3个时序的长度,为第n个时序的长度;为第1个时序的加权参数;为第2个时序
的加权参数;为第3个时序的加权参数;为第n个时序的加权参数。
步骤112、多程操作间隔异常建模。
在多程操作中,每个操作时序内的多程操作间隔的异常比例加权相加可得:
为多程操作中每个操作时序内的多程操作间隔的异常比例加权相加值;
为当前连接模式为多程连接的情况下第1个时序中的操作断点个数;为当前连接模式
为多程连接的情况下第2个时序中的操作断点个数;为当前连接模式为多程连接的情况
下第3个时序中的操作断点个数;为当前连接模式为多程连接的情况下第n个时序的
操作断点个数;为第1个时序的长度;为第2个时序的长度;为第3个时序的长
度;为第n个时序的长度;为第1个时序的加权参数;为第2个时序的加权参数;为第3个时序的加权参数;为第n个时序的加权参数。
步骤113,对所有异常操作建模。
在多程操作中,根据异常操作的重要程度分别对三类异常建模进行加权相加可得:
其中加权参数j为根据异常的不同重要性设置的,用以表示此类异常的重要程度。最后计算的F为异常指标,表示此时间范围内的用户操作异常性,当F超过阈值则表示此用户为非正常用户的概率越高。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (6)
1.一种基于用户操作时序判断异常用户的方法,其特征在于,所述方法包括:
记录本次请求的用户、请求时间、访问页面及访问节点;
根据访问页面及访问节点构成的访问路径判断连接类型,获取操作间隔值及操作时序;
根据所述操作间隔值采集操作断点,包括,
判断相邻操作的所述操作间隔值是否低于预设的操作间隔低值,若是则异常,否则正常;
若异常则认为当前操作时序中此操作为操作断点,记录所述操作断点;
对所述操作断点进行操作断点异常建模,具体为,对多个时间段内的每个操作时序的操作断点比例进行加权;
根据连接类型建立单程操作间隔异常建模和多程操作间隔异常建模;
根据不同操作类型的操作时序、各时序对应的权值,根据下式计算出最终异常指标F:
2.根据权利要求1所述的基于用户操作时序判断异常用户的方法,其特征在于,所述判断连接类型,获取操作间隔值及操作时序,包括:
若连接中的相邻被操作页面间页面序号连续,则为单程连接;
若连接中的相邻被操作页面间页面序号不连续,则为多程连接;
将用户在一个周期内的所有操作,划分为若干个操作时序。
3.根据权利要求1所述的基于用户操作时序判断异常用户的方法,其特征在于,所述对多个时间段内的每个操作时序的操作断点比例进行加权,包括:
4.根据权利要求2所述的基于用户操作时序判断异常用户的方法,其特征在于,所述根据所述操作间隔值采集操作断点,包括;
若用户的操作间隔低于预设操作间隔值时,则此次操作为异常,对异常操作计数;
根据异常操作的总量和所述时序长度计算异常操作比例。
5.根据权利要求4所述的基于用户操作时序判断异常用户的方法,其特征在于,所述对所述操作断点进行操作断点异常建模,根据一周期内每个操作时序的操作断点比例进行加权,包括:
6.根据权利要求4所述的基于用户操作时序判断异常用户的方法,其特征在于,所述对所述操作断点进行操作断点异常建模,根据一周期内每个操作时序的操作断点比例进行加权,包括:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111540706.3A CN113934616B (zh) | 2021-12-16 | 2021-12-16 | 一种基于用户操作时序判断异常用户的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111540706.3A CN113934616B (zh) | 2021-12-16 | 2021-12-16 | 一种基于用户操作时序判断异常用户的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113934616A CN113934616A (zh) | 2022-01-14 |
CN113934616B true CN113934616B (zh) | 2022-03-18 |
Family
ID=79289035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111540706.3A Active CN113934616B (zh) | 2021-12-16 | 2021-12-16 | 一种基于用户操作时序判断异常用户的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113934616B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5537559A (en) * | 1994-02-08 | 1996-07-16 | Meridian Semiconductor, Inc. | Exception handling circuit and method |
CN105488697A (zh) * | 2015-12-09 | 2016-04-13 | 焦点科技股份有限公司 | 一种基于客户行为特征的潜在客户挖掘方法 |
CN107977303A (zh) * | 2017-11-30 | 2018-05-01 | 努比亚技术有限公司 | 一种操作行为监控方法、移动终端以及计算机可读存储介质 |
CN109783311A (zh) * | 2018-12-14 | 2019-05-21 | 平安普惠企业管理有限公司 | 断点行为的监控处理方法、装置、设备及可读存储介质 |
CN111143178A (zh) * | 2019-12-12 | 2020-05-12 | 支付宝(杭州)信息技术有限公司 | 用户行为分析方法、装置及设备 |
CN111526119A (zh) * | 2020-03-19 | 2020-08-11 | 北京三快在线科技有限公司 | 异常流量检测方法、装置、电子设备和计算机可读介质 |
CN111538614A (zh) * | 2020-04-29 | 2020-08-14 | 济南浪潮高新科技投资发展有限公司 | 一种操作系统的时序异常操作行为检测方法 |
CN112632446A (zh) * | 2020-12-30 | 2021-04-09 | 江苏苏宁云计算有限公司 | 页面访问路径的构建方法及系统 |
CN112738088A (zh) * | 2020-12-28 | 2021-04-30 | 上海观安信息技术股份有限公司 | 一种基于无监督算法的行为序列异常检测方法及系统 |
-
2021
- 2021-12-16 CN CN202111540706.3A patent/CN113934616B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5537559A (en) * | 1994-02-08 | 1996-07-16 | Meridian Semiconductor, Inc. | Exception handling circuit and method |
CN105488697A (zh) * | 2015-12-09 | 2016-04-13 | 焦点科技股份有限公司 | 一种基于客户行为特征的潜在客户挖掘方法 |
CN107977303A (zh) * | 2017-11-30 | 2018-05-01 | 努比亚技术有限公司 | 一种操作行为监控方法、移动终端以及计算机可读存储介质 |
CN109783311A (zh) * | 2018-12-14 | 2019-05-21 | 平安普惠企业管理有限公司 | 断点行为的监控处理方法、装置、设备及可读存储介质 |
CN111143178A (zh) * | 2019-12-12 | 2020-05-12 | 支付宝(杭州)信息技术有限公司 | 用户行为分析方法、装置及设备 |
CN111526119A (zh) * | 2020-03-19 | 2020-08-11 | 北京三快在线科技有限公司 | 异常流量检测方法、装置、电子设备和计算机可读介质 |
CN111538614A (zh) * | 2020-04-29 | 2020-08-14 | 济南浪潮高新科技投资发展有限公司 | 一种操作系统的时序异常操作行为检测方法 |
CN112738088A (zh) * | 2020-12-28 | 2021-04-30 | 上海观安信息技术股份有限公司 | 一种基于无监督算法的行为序列异常检测方法及系统 |
CN112632446A (zh) * | 2020-12-30 | 2021-04-09 | 江苏苏宁云计算有限公司 | 页面访问路径的构建方法及系统 |
Non-Patent Citations (1)
Title |
---|
基于业务逻辑思想的异常检测研究;蒋梦丹等;《成都信息工程大学学报》;20190415(第02期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113934616A (zh) | 2022-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108959004B (zh) | 磁盘故障预测方法、装置、设备及计算机可读存储介质 | |
CN106462583A (zh) | 用于快速数据分析的系统和方法 | |
US20220156795A1 (en) | Segment content optimization delivery system and method | |
CN110138638B (zh) | 一种网络流量的处理方法及装置 | |
CN111143103A (zh) | 一种关联关系确定方法、装置、设备及可读存储介质 | |
CN111124791A (zh) | 一种系统测试方法及装置 | |
CN113934616B (zh) | 一种基于用户操作时序判断异常用户的方法 | |
CN110991241A (zh) | 异常识别方法、设备及计算机可读介质 | |
CN114064445A (zh) | 一种测试方法、装置、设备及计算机可读存储介质 | |
CN116909862A (zh) | 异常日志的收集方法及装置、电子设备、存储介质 | |
CN109150819B (zh) | 一种攻击识别方法及其识别系统 | |
CN116047223A (zh) | 一种基于实时用电信息及大数据分析的窃电判别方法 | |
CN111125193B (zh) | 多媒体非正常评论的识别方法、装置、设备及存储介质 | |
CN114697127A (zh) | 一种基于云计算的业务会话风险处理方法及服务器 | |
CN111258788B (zh) | 磁盘故障预测方法、装置及计算机可读存储介质 | |
CN111833098A (zh) | 一种信息预测方法、存储介质和电子装置 | |
CN115408182A (zh) | 业务系统故障定位方法及装置 | |
CN114997879B (zh) | 一种支付路由方法、装置、设备和存储介质 | |
CN110471962B (zh) | 活跃数据报表的生成方法和系统 | |
CN113743532B (zh) | 异常检测方法、装置、设备及计算机存储介质 | |
CN115396319B (zh) | 数据流分片方法、装置、设备及存储介质 | |
CN114598904B (zh) | 交互式网络电视iptv业务的故障定位方法和装置 | |
CN115271544B (zh) | 降低噪声投诉率的方法、装置、电子设备及存储介质 | |
CN116069595B (zh) | 一种基于日志的运维监控方法 | |
CN115543445A (zh) | 流数据动态处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |