CN117234399A - 行为数据的分析方法、装置、设备及存储介质 - Google Patents
行为数据的分析方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117234399A CN117234399A CN202311139516.XA CN202311139516A CN117234399A CN 117234399 A CN117234399 A CN 117234399A CN 202311139516 A CN202311139516 A CN 202311139516A CN 117234399 A CN117234399 A CN 117234399A
- Authority
- CN
- China
- Prior art keywords
- page
- behavior
- coordinates
- information
- touch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 15
- 230000006399 behavior Effects 0.000 claims abstract description 163
- 238000000034 method Methods 0.000 claims abstract description 40
- 230000006870 function Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 12
- 230000003542 behavioural effect Effects 0.000 claims description 10
- 230000001960 triggered effect Effects 0.000 claims description 5
- 230000003993 interaction Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 8
- 238000004422 calculation algorithm Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 230000009471 action Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013515 script Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000004791 biological behavior Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012559 user support system Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- User Interface Of Digital Computer (AREA)
Abstract
本公开提供了行为数据的分析方法、装置、设备及存储介质,涉及数据处理技术领域,尤其涉及行为分析、人机识别、业务安全技术领域。具体实现方案为:根据针对页面的触控行为,确定触控行为的位置信息和页面信息;根据位置信息和页面信息,得到行为信息序列;根据行为信息序列,确定触控行为的特征标识;以及根据多个触控行为的特征标识,确定多个触控行为的重复程度。本公开可以有效地识别出机器行为。
Description
技术领域
本公开涉及数据处理技术领域,尤其涉及行为分析、人机识别、业务安全技术领域。
背景技术
随着移动设备和互联网技术的普及,许多业务在移动端上开展,导致大量的恶意用户(例如,黄牛、黑色产业链、恶意经销商等)在移动端上产生,他们常常使用批量化脚本、按键精灵录制脚本、模拟器点击等方式攫取不正当利润。因此如何有效识别出这类机器行为和对应的设备至关重要。
发明内容
本公开提供了一种行为数据的分析方法、装置、设备以及存储介质。
根据本公开的一方面,提供了一种行为数据的分析方法,包括:
根据针对页面的触控行为,确定触控行为的位置信息和页面信息;
根据位置信息和页面信息,得到行为信息序列;
根据行为信息序列,确定触控行为的特征标识;以及
根据多个触控行为的特征标识,确定多个触控行为的重复程度。
根据本公开的另一方面,提供了一种行为数据的分析装置,包括:
信息确定模块,用于根据针对页面的触控行为,确定触控行为的位置信息和页面信息;
序列确定模块,用于根据位置信息和页面信息,得到行为信息序列;
标识确定模块,用于根据行为信息序列,确定触控行为的特征标识;以及
行为分析模块,用于根据多个触控行为的特征标识,确定多个触控行为的重复程度。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开实施例中任一的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使该计算机执行根据本公开实施例中任一的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现根据本公开实施例中任一的方法。
本公开可以有效地识别出机器行为。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开一实施例的行为数据的分析方法的流程示意图;
图2是根据本公开另一实施例的行为数据的分析方法的流程示意图;
图3是根据本公开一实施例的行为数据的分析装置的结构示意图;
图4是用来实现本公开实施例的行为数据的分析方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
在相关技术中,识别机器行为的方案主要围绕一些机械化的方面进行挖掘,例如滑动点击频率,点击是否是直线、曲线等机器行为的数据。或者结合具体业务针对某个点进行异常行为的分析。或者是将原数据输入神经网络里面进行分类。
上述方案中没有深入的抓住移动端上的生物行为特点去识别机器设备。另外基于神经网络的方案主要是以大量参数拟合标签,泛化能力强,但是训练和推理过程复杂,计算量大,还容易出现解释性差的数据,容易造成误判。
为了至少部分地解决上述问题以及其他潜在问题中的一个或者多个问题,本公开的实施方式提供一种行为数据的分析方法,利用本公开的实施方式的技术方案,可以有效地识别出机器行为。
图1是本公开一实施例提供的行为数据的分析方法的流程示意图。如图1所示,该方法至少包括以下步骤:
S101、根据针对页面的触控行为,确定触控行为的位置信息和页面信息。
本公开实施例中,页面是指移动端的应用程序(Application,App)中的显示不同的功能或内容的各类页面,包括但不限于:
主页(Home Page):主页通常是App打开后首先显示的页面,用于展示主要功能或内容,提供导航入口。
登录/注册页面(Login/Registration Page):用户需要在此页面输入用户名和密码进行登录,或者进行新用户注册。
个人资料页面(Profile Page):用于展示用户的个人信息,如头像、用户名、联系信息等。用户通常可以在这里编辑和更新个人资料。
设置页面(Settings Page):用于自定义应用程序的各种偏好和选项,例如通知设置、隐私设置、主题设置等。
搜索页面(Search Page):用于用户在应用内搜索内容,例如商品、文章、用户等。
消息/聊天页面(Message/Chat Page):用户可以在这个页面发送和接收消息,进行即时聊天或查看聊天历史记录。
通知页面(Notification Page):用户可以查看应用程序发送的通知和提醒,包括新消息、活动提醒等。
产品/服务列表页面(Product/Service Listing Page):用于展示应用程序提供的产品或服务,用户可以浏览、筛选和选择。
购物车/订单页面(Shopping Cart/Order Page):用户可以将所选产品添加到购物车,查看已添加的产品,提交订单等。
详细信息页面(Detail Page):用户可以在此页面查看有关特定内容的详细信息,例如商品详情、文章内容、用户资料等。
地图页面(Map Page):用户可以在地图页面查看地图、搜索位置、获取导航指示等。
支付页面(Payment Page):用于进行支付和交易,用户可以输入支付信息、选择支付方式等。
游戏页面(Game Page):如果应用包含游戏功能,用户可以在游戏页面进行游戏。
活动/促销页面(Event/Promotion Page):用于了解和参与应用内的特殊活动、促销或竞赛。
帮助/支持页面(Help/Support Page):用于提供用户支持和帮助信息的页面,包括常见问题解答、联系支持团队等。
反馈页面(Feedback Page):用户可以在这里提供反馈、建议或报告问题。
在一种可能的实施方式中,可以将上述页面中涉及能够获取实际经济收益的页面,以及用于跳转进入该页面的相关页面,作为目标页面,例如:活动/促销页面、支付页面和主页,仅采集在目标页面上的触控行为。
还应当注意的是,本公开实施例所采集的数据只是客户端的通用数据,并不涉及到用户的信息、浏览内容以及其它任何隐私数据。
触控行为,是指用户在触摸屏幕设备上进行的各种操作行为,用于与应用程序或界面进行交互。常用的触控行为包括:
点击(Tap):单次轻触屏幕,用于选择、激活或打开元素或功能。
双击(Double Tap):快速两次轻触屏幕,常用于放大缩小或快速操作。
长按(Long Press):在一个位置长时间按住屏幕,通常会触发上下文菜单或其他选项。
滑动(Swipe):在屏幕上用手指滑动,用于浏览内容、切换页面或执行特定操作。
拖拽(Drag):在屏幕上按住元素并移动,用于移动物体、拖动文件等。
旋转(Rotate):用两个手指在屏幕上旋转,用于旋转元素、调整角度等。
滚动(Scroll):用手指在滚动区域上滑动,用于浏览大量内容。
放大(Zoom In):使用手指将两指分开,用于放大特定区域的内容。
缩小(Zoom Out):使用手指将两指靠拢,用于缩小特定区域的内容。
手势(Gesture):复杂的手指操作组合,如两指放大缩小、旋转等。
边缘滑动(Edge Swipe):从屏幕边缘滑动手指,触发特定功能或快速导航。
手指轻扫(Finger Swipe):用单指在屏幕上滑动,触发特定操作或切换。
上述任一触控行为会在屏幕或页面上产生多个触控点,根据多个触控点的位置可以得到位置信息。例如,点击操作包括按下和抬起两个步骤,对于移动设备而言,可以采集到两个相同的触控点。又例如,长按操作可以采集到多个相同的触控点,触控点的数量根据采集间隔和长按时间确定。
采集触控点的同时也可以获取当前页面的页面信息,例如当前页面的页面标识(activity_id)和当前页面内的控件信息。
S102、根据位置信息和页面信息,得到行为信息序列。
行为信息序列是指一次触控行为所产生的多个触控点的位置信息和对应的页面信息形成的序列。
S103、根据行为信息序列,确定触控行为的特征标识。
特征标识用于唯一标识和识别一种触控行为,相同的行为信息序列会得到相同的特征标识。根据行为信息序列,计算生成特征标识的方式可以包括:
加密算法:使用不可逆加密算法,如安全散列算法(Secure Hash Algorithm 256-bit,SHA-256)、消息摘要算法(Message Digest Algorithm,MD5)等,将信息序列转换为固定长度的哈希值。加密算法通常用于数据的完整性验证和安全性。
摘要算法:类似于加密算法,摘要算法将信息序列转化为固定长度的摘要或校验和,常见的摘要算法包括循环冗余校验32位(Cyclic Redundancy Check 32-bit,CRC32)、SHA-1等。
特征提取:对信息序列进行特征提取,将其转化为一组数值或向量表示,可以使用自然语言处理技术、图像处理技术等来提取特征。
数据签名:使用数字签名技术,对信息序列进行签名生成唯一的标识,数字签名可以用于验证信息的来源和完整性。
编码算法:将信息序列编码为不同的编码方式,如Base64编码、统一资源定位符(Uniform Resource Locator,URL)编码等,编码后的序列可作为标识。
特定领域的标识符:根据具体应用领域的需求,可以定义特定的标识符生成规则,如商品条形码、设备序列号等。
S104、根据多个触控行为的特征标识,确定多个触控行为的重复程度。
多个触控行为是在同一移动端上采集得到的,对多个触控行为分别生成对应的特征标识。多个触控行为中,相同或相近似的触控行为会对应同一个特征标识。根据多个触控行为的特征标识的重复程度,可以判断该移动端的触控行为是真人产生的生物类行为,还是通过机器产生的机器类行为。
根据本公开实施例的方案,可以根据触控行为生成对应的特征标识,根据多个特征标识之间的重复程度简便、高效地识别出机器行为。
在一种可能的实施方式中,步骤S101根据针对页面的触控行为,确定触控行为的位置信息和页面信息,进一步包括步骤:
S1011、根据针对页面的触控行为,确定途经轨迹。其中,途经轨迹包括多个坐标点。
S1012、根据多个坐标点,得到位置信息。
S1013、根据页面的页面标识和触控行为所触发的控件的控件标识,得到页面信息。
本公开实施例中,途经轨迹是通过记录点击、滑动等触控行为在移动端的屏幕上的实施过程而形成的,具体包括屏幕上的多个坐标点。在触控行为是点击或长按的情况下,途经轨迹至少包括按下和抬起两个相同的坐标点。
页面标识是指发生触控行为的当前页面的唯一标识。控件标识是指触控行为所触发的控件的控件的唯一标识。页面信息包括页面标识和控件标识。
根据本公开实施例的方案,获取触控行为的位置信息、页面标识和控件标识三个维度的特征,有助于对触控行为进行识别和分类。
在一种可能的实施方式中,步骤S1012根据多个坐标点,得到位置信息,进一步包括步骤:
根据页面的可滑动方向,确定目标方向。其中,目标方向与可滑动方向不同。
根据多个坐标点在目标方向上的第一坐标,得到位置信息。
本公开实施例中,根据页面的可滑动方向,确定与可滑动方向不同的目标方向。目标方向可以是垂直于可滑动方向。在一种示例中,页面可以上下方向(即y轴方向)滑动,则选取左右方向(即x轴方向)为目标方向。多个坐标点的坐标包含横坐标(x轴坐标)和纵坐标(y轴坐标),此时,第一坐标为x轴坐标,即根据多个坐标点的x轴坐标,得到位置信息。
需要说明的是,恶意用户在设计实施模拟点击、脚本等机器行为时,会把关注点聚焦于某个特定控件,而移动端的控件通常是上下可以滑动,而左右不能滑动,因此x轴坐标比y轴坐标更加稳定。反之,如果部分页面或业务场景左右可以滑动但是上下不能滑动,则使用y轴坐标作为特征。也可以理解为,在目标方向(x轴坐标)上的移动缺少实际作用,因此,机器行为在此方向上的移动更简单,而生物行为在目标方向上的移动也具有很大的复杂性和随机性,由此更易于识别出多个行为之间的差异。
根据本公开实施例的方案,对触控行为产生轨迹的坐标点进行筛选,使用更加稳定的目标方向的坐标作为位置信息,更利于对触控行为进行区分。
在一种可能的实施方式中,S102根据位置信息和页面信息,得到行为信息序列,进一步包括:
根据多个第一坐标、页面标识以及控件标识,得到行为信息序列。
本公开实施例中,行为信息序列为action={X1,X2,X3,X4,...,XT},其中Xi可以理解为组成途经轨迹的每一段子路径,每个Xi是一个三元组Xi={xi,activityi,viewi},xi为第一坐标,activityi为页面标识(activity_id),viewi为控件标识(view_id)。即,一个触控行为的行为信息序列包含多个Xi的序列。
根据本公开实施例的方案,使用目标方向的第一坐标、页面标识和控件标识三个维度的特征得到行为信息序列,可以提高对触控行为识别和分类的准确性。
在一种可能的实施方式中,S103根据行为信息序列,确定触控行为的特征标识,进一步包括:
S1031、根据行为信息序列中的多个第一坐标、页面标识和控件标识,得到组合特征。
S1032、根据预设哈希函数和组合特征,确定触控行为的哈希值,以得到触控行为的特征标识。
本公开实施例中,使用md5算法为每个触控行为的行为信息序列生成一个64位的哈希值(hash key),将该哈希值作为特征标识。
根据本公开实施例的方案,使用md5算法生成64位的哈希值,计算量小,容易获得触控行为的hashkey,提高分析效率。
在一种可能的实施方式中,S1031根据行为信息序列中的多个第一坐标、页面标识和控件标识,得到组合特征,进一步包括:
对行为信息序列中的多个第一坐标取近似值,得到多个第二坐标。
将多个第二坐标、页面标识和控件标识三者拼接,得到组合特征。
本公开实施例中,取第一坐标的近似值,得到第二坐标,用第二坐标作为行为信息序列。使得多个相近的第一坐标可以被标准化为同样的第二坐标。例如,将142.3、144.1都近似到140,将272.6、267.6都近似到270。
根据本公开实施例的方案,可以很大程度上防范黑产利用随机样本进行作弊。
在一种可能的实施方式中,对行为信息序列中的多个第一坐标取近似值,得到多个第二坐标,具体包括:
针对行为信息序列中的多个第一坐标,根据预设约束值和舍入函数,得到多个第一坐标的近似值。
根据多个第一坐标的近似值,得到多个第二坐标。
本公开实施例中,计算第一坐标的近似值方法可以是:round(xi/bound)*bound。其中,bound为预设约束值,用于将第一坐标近似到某个范围。例如,x为142.3,bound为10,通过上述计算公式,将142.3除以10后使用round函数四舍五入,得到14;再乘以10,从而近似到140。需要说明的是,round的具体数值的选取需要结合数据分析和实际业务场景。
根据本公开实施例的方案,可以增加算法的鲁棒性。
在一种可能的实施方式中,预设约束值根据页面中的至少一个交互控件的尺寸确定。
本公开实施例中,为了触发目标控件进行交互,相关的触控行为必须要落在目标控件所占的屏幕范围中,因此,目标控件的外形尺寸会影响相关触控行为的坐标范围,如果目标控件的外形尺寸较大,则需要适当增加预设约束值。
根据本公开实施例的方案,根据控件的尺寸调整预设约束值,可以提高识别的准确性。
在一种可能的实施方式中,如图2所示,本公开实施例的行为数据的分析方法包括以下步骤:
a.采集触控行为的行为信息序列action。
b.从行为信息序列中提取页面标识activity_id、控件标识view_id、x坐标。
c.确定x坐标的近似值。
d.使用activity_id、view_id、x坐标的近似值计算hash key。
hash key的计算公式如下:
hashkey=MD5(activityi+viewi+round(xi/bound)*bound)
其中,activityi为activity_id,viewi为view_id,xi为x坐标。
e.根据多个触控行为的hash key进行筛选,确定触控行为的重复性。
根据本公开实施例的方案,通过抽取有效的特征,容易获得触控行为的hashkey,从而通过对hashkey的重复程度识别出黑产团伙大量的重复性设备,可以有效地识别出机器类别的行为,包括模拟器、黑rom、按键精灵等模拟类设备,帮助平台有效减少机器爬虫、数据收集等损失。
图3是本公开一实施例提供的行为数据的分析装置的结构示意图。如图3所示,该装置至少包括:
信息确定模块301,用于根据针对页面的触控行为,确定触控行为的位置信息和页面信息。
序列确定模块302,用于根据位置信息和页面信息,得到行为信息序列。
标识确定模块303,用于根据行为信息序列,确定触控行为的特征标识。
行为分析模块304,用于根据多个触控行为的特征标识,确定多个触控行为的重复程度。
在一种可能的实施方式中,信息确定模块301包括:
轨迹确定子模块,用于根据针对页面的触控行为,确定途经轨迹。其中,途经轨迹包括多个坐标点。
位置确定子模块,用于根据多个坐标点,得到位置信息。
标识确定子模块,用于根据页面的页面标识和触控行为所触发的控件的控件标识,得到页面信息。
在一种可能的实施方式中,位置确定子模块用于:
根据页面的可滑动方向,确定目标方向。其中,目标方向与可滑动方向不同。
根据多个坐标点在目标方向上的第一坐标,得到位置信息。
在一种可能的实施方式中,序列确定模块302用于:
根据多个第一坐标、页面标识以及控件标识,得到行为信息序列。
在一种可能的实施方式中,标识确定303模块,包括:
拼接子模块,用于根据行为信息序列中的多个第一坐标、页面标识和控件标识,得到组合特征。
计算子模块,用于根据预设哈希函数和组合特征,确定触控行为的哈希值,以得到触控行为的特征标识。
在一种可能的实施方式中,拼接子模块用于:
对行为信息序列中的多个第一坐标取近似值,得到多个第二坐标。
将多个第二坐标、页面标识和控件标识三者拼接,得到组合特征。
在一种可能的实施方式中,拼接子模块用于:
针对行为信息序列中的多个第一坐标,根据预设约束值和舍入函数,得到多个第一坐标的近似值。
根据多个第一坐标的近似值,得到多个第二坐标。
在一种可能的实施方式中,预设约束值根据页面中的至少一个交互控件的尺寸确定。
本公开实施例的装置的各模块、子模块的具体功能和示例的描述,可以参见上述方法实施例中对应步骤的相关描述,在此不再赘述。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图4示出了可以用来实施本公开的实施例的示例电子设备400的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字助理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图4所示,设备400包括计算单元401,其可以根据存储在只读存储器(ROM)402中的计算机程序或者从存储单元408加载到随机访问存储器(RAM)403中的计算机程序,来执行各种适当的动作和处理。在RAM 403中,还可存储设备400操作所需的各种程序和数据。计算单元401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
设备400中的多个部件连接至I/O接口405,包括:输入单元406,例如键盘、鼠标等;输出单元407,例如各种类型的显示器、扬声器等;存储单元408,例如磁盘、光盘等;以及通信单元409,例如网卡、调制解调器、无线通信收发机等。通信单元409允许设备400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元401可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元401的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元401执行上文所描述的各个方法和处理,例如行为数据的分析方法。例如,在一些实施例中,行为数据的分析方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元408。在一些实施例中,计算机程序的部分或者全部可以经由ROM 402和/或通信单元409而被载入和/或安装到设备400上。当计算机程序加载到RAM 403并由计算单元401执行时,可以执行上文描述的行为数据的分析方法的一个或多个步骤。备选地,在其他实施例中,计算单元401可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行行为数据的分析方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入、或者触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (19)
1.一种行为数据的分析方法,包括:
根据针对页面的触控行为,确定所述触控行为的位置信息和所述页面信息;
根据所述位置信息和所述页面信息,得到行为信息序列;
根据所述行为信息序列,确定所述触控行为的特征标识;以及
根据多个触控行为的特征标识,确定所述多个触控行为的重复程度。
2.根据权利要求1所述的方法,其中,根据针对页面的触控行为,确定所述触控行为的位置信息和所述页面信息,包括:
根据针对页面的触控行为,确定途经轨迹;其中,所述途经轨迹包括多个坐标点;
根据所述多个坐标点,得到位置信息;
根据所述页面的页面标识和所述触控行为所触发的控件的控件标识,得到页面信息。
3.根据权利要求2所述的方法,其中,根据所述多个坐标点,得到位置信息,包括:
根据所述页面的可滑动方向,确定目标方向;其中,所述目标方向与所述可滑动方向不同;
根据所述多个坐标点在所述目标方向上的第一坐标,得到位置信息。
4.根据权利要求3所述的方法,其中,根据所述位置信息和所述页面信息,得到行为信息序列,包括:
根据所述多个第一坐标、所述页面标识以及所述控件标识,得到行为信息序列。
5.根据权利要求4所述的方法,其中,根据所述行为信息序列,确定所述触控行为的特征标识,包括:
根据所述行为信息序列中的所述多个第一坐标、所述页面标识和所述控件标识,得到组合特征;
根据预设哈希函数和所述组合特征,确定所述触控行为的哈希值,以得到所述触控行为的特征标识。
6.根据权利要求5所述的方法,其中,根据所述行为信息序列中的所述多个第一坐标、所述页面标识和所述控件标识,得到组合特征,包括:
对所述行为信息序列中的所述多个第一坐标取近似值,得到多个第二坐标;
将所述多个第二坐标、所述页面标识和所述控件标识三者拼接,得到组合特征。
7.根据权利要求6所述的方法,其中,对所述行为信息序列中的所述多个第一坐标取近似值,得到多个第二坐标,包括:
针对所述行为信息序列中的所述多个第一坐标,根据预设约束值和舍入函数,得到所述多个第一坐标的近似值;
根据所述多个第一坐标的近似值,得到多个第二坐标。
8.根据权利要求7所述的方法,其中,所述预设约束值根据所述页面中的至少一个交互控件的尺寸确定。
9.一种行为数据的分析装置,包括:
信息确定模块,用于根据针对页面的触控行为,确定所述触控行为的位置信息和所述页面信息;
序列确定模块,用于根据所述位置信息和所述页面信息,得到行为信息序列;
标识确定模块,用于根据所述行为信息序列,确定所述触控行为的特征标识;以及
行为分析模块,用于根据多个触控行为的特征标识,确定所述多个触控行为的重复程度。
10.根据权利要求9所述的装置,其中,所述信息确定模块包括:
轨迹确定子模块,用于根据针对页面的触控行为,确定途经轨迹;其中,所述途经轨迹包括多个坐标点;
位置确定子模块,用于根据所述多个坐标点,得到位置信息;
标识确定子模块,用于根据所述页面的页面标识和所述触控行为所触发的控件的控件标识,得到页面信息。
11.根据权利要求10所述的装置,其中,所述位置确定子模块用于:
根据所述页面的可滑动方向,确定目标方向;其中,所述目标方向与所述可滑动方向不同;
根据所述多个坐标点在所述目标方向上的第一坐标,得到位置信息。
12.根据权利要求11所述的装置,其中,所述序列确定模块用于:
根据所述多个第一坐标、所述页面标识以及所述控件标识,得到行为信息序列。
13.根据权利要求12所述的装置,其中,所述标识确定模块,包括:
拼接子模块,用于根据所述行为信息序列中的所述多个第一坐标、所述页面标识和所述控件标识,得到组合特征;
计算子模块,用于根据预设哈希函数和所述组合特征,确定所述触控行为的哈希值,以得到所述触控行为的特征标识。
14.根据权利要求13所述的装置,其中,所述拼接子模块用于:
对所述行为信息序列中的所述多个第一坐标取近似值,得到多个第二坐标;
将所述多个第二坐标、所述页面标识和所述控件标识三者拼接,得到组合特征。
15.根据权利要求14所述的装置,其中,所述拼接子模块用于:
针对所述行为信息序列中的所述多个第一坐标,根据预设约束值和舍入函数,得到所述多个第一坐标的近似值;
根据所述多个第一坐标的近似值,得到多个第二坐标。
16.根据权利要求15所述的装置,其中,所述预设约束值根据所述页面中的至少一个交互控件的尺寸确定。
17.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-8中任一项所述的方法。
19.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311139516.XA CN117234399A (zh) | 2023-09-05 | 2023-09-05 | 行为数据的分析方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311139516.XA CN117234399A (zh) | 2023-09-05 | 2023-09-05 | 行为数据的分析方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117234399A true CN117234399A (zh) | 2023-12-15 |
Family
ID=89087171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311139516.XA Pending CN117234399A (zh) | 2023-09-05 | 2023-09-05 | 行为数据的分析方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117234399A (zh) |
-
2023
- 2023-09-05 CN CN202311139516.XA patent/CN117234399A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6500086B2 (ja) | 二次元コードの解析方法および装置、コンピュータ読み取り可能な記憶媒体、コンピュータプログラムおよび端末機器 | |
CN108804885B (zh) | 人机验证方法和装置、存储介质及处理器 | |
CN103873455B (zh) | 一种信息校验的方法及装置 | |
CN107390983B (zh) | 业务指令执行方法、客户端和存储介质 | |
JP2017510910A (ja) | 行動イベント計測システム及び関連する方法 | |
CN111859354B (zh) | 图片验证方法、装置、电子设备、存储介质和程序产品 | |
CN113496017B (zh) | 验证方法、装置、设备和存储介质 | |
CN111047332B (zh) | 模型训练和风险识别方法、装置及设备 | |
CN110022399B (zh) | 消息展示方法、装置、用户终端及可读存储介质 | |
US11989272B2 (en) | Human-machine verification method, device and storage medium | |
CN111131009A (zh) | 即时通信方法、设备及计算机可读存储介质 | |
CN114036501A (zh) | 一种app的检测方法、系统、装置、设备及存储介质 | |
CN111767982A (zh) | 用户转换预测模型的训练方法、装置、存储介质以及电子设备 | |
CN104024991B (zh) | 使用单个输入源支持不同的事件模型 | |
CN112416212B (zh) | 程序访问方法、装置、电子设备和可读存储介质 | |
CN112016077B (zh) | 一种基于滑动轨迹模拟的页面信息获取方法、装置和电子设备 | |
US10181023B2 (en) | Verification method, method to open a web page and method to open an electronic file | |
CN110276183B (zh) | 反向图灵验证方法及装置、存储介质、电子设备 | |
CN111859322A (zh) | 身份验证方法、装置和电子设备 | |
CN112003833A (zh) | 异常行为检测方法和装置 | |
CN117234399A (zh) | 行为数据的分析方法、装置、设备及存储介质 | |
CN114035729A (zh) | 电子投票方法及装置、终端设备 | |
CN109074552A (zh) | 基于知识图来增强联系卡 | |
CN113312554A (zh) | 用于评价推荐系统的方法及装置、电子设备和介质 | |
CN111625805A (zh) | 验证方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |