CN116383019A - 一种数据获取方法、装置及存储介质 - Google Patents
一种数据获取方法、装置及存储介质 Download PDFInfo
- Publication number
- CN116383019A CN116383019A CN202211654689.0A CN202211654689A CN116383019A CN 116383019 A CN116383019 A CN 116383019A CN 202211654689 A CN202211654689 A CN 202211654689A CN 116383019 A CN116383019 A CN 116383019A
- Authority
- CN
- China
- Prior art keywords
- data acquisition
- characteristic information
- target
- target page
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000009877 rendering Methods 0.000 claims description 62
- 230000006399 behavior Effects 0.000 claims description 55
- 238000012545 processing Methods 0.000 claims description 18
- 238000004891 communication Methods 0.000 abstract description 27
- 238000007429 general method Methods 0.000 abstract description 2
- 230000003993 interaction Effects 0.000 description 19
- 230000006870 function Effects 0.000 description 18
- 238000005516 engineering process Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3438—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种数据获取方法、装置及存储介质,涉及通信技术领域,用于解决通用方法中获取用户行为数据的准确率较低的问题。该方法包括:可以预先获取目标页面中的多个页面位置的特征信息,以及与多个页面位置一一对应的多个数据访问标识。然后,可以获取在目标页面中,与用户行为对应的初始位置的特征信息。当初始位置的特征信息与目标页面位置的特征信息的相似度大于或者等于预设的相似度阈值时,可以将目标页面位置对应的数据访问标识,确定为用户行为数据。其中,目标页面位置为多个页面位置中的任意一个位置。
Description
技术领域
本申请涉及通信技术领域,尤其涉及一种数据获取方法、装置及存储介质。
背景技术
随着互联网的迅速发展,互联网已经逐渐成为人们生活中不可或缺的一部分。在点击或者浏览网页的过程中,会产生用户行为数据,进而可以通过用户行为数据,分析用户画像。
目前,在网页(web)获取用户行为数据的方法通常包括埋点技术或者日志分析技术。其中,埋点技术需要预先正在每个网页加载采集脚本或者编码,然后发布到客户端下载,从而直接获得客户端的用户行为数据。日志分析技术是通过服务端获取用户的日志文件,然后分析日志文件,得到用户行为数据。
但是,埋点质量问题会导致漏埋点或者埋点错误的情况,需要重新加载或者编码,会影响用户体验,所以修复难度极大,会造成数据不准确、数据丢失的情况。而日志分析技术通过服务端获取的数据不全面、获取周期长。因此,如何准确地获取用户行为数据,是目前亟需解决的问题。
发明内容
本申请提供一种数据获取方法、装置及存储介质,用于解决通用方法中获取用户行为数据的准确率较低的问题。
为达到上述目的,本申请采用如下技术方案:
第一方面,提供一种数据获取方法,包括:可以预先获取目标页面中的多个页面位置的特征信息,以及与多个页面位置一一对应的多个数据访问标识。然后,可以获取在目标页面中,与用户行为对应的初始位置的特征信息。当初始位置的特征信息与目标页面位置的特征信息的相似度大于或者等于预设的相似度阈值时,可以将目标页面位置对应的数据访问标识,确定为用户行为数据。其中,目标页面位置为多个页面位置中的任意一个位置。
可选的,获取在目标页面中,与用户行为对应的初始位置的特征信息的方法,包括:周期性地获取用户操作对象的停留位置;响应于执行的点击操作,获取用户操作对象的点击位置;将目标用户位置的特征信息,确定为初始位置的特征信息;目标用户位置包括:停留位置,和/或,点击位置。
可选的,该数据获取方法,还包括:获取初始位置的特征信息与目标页面位置的特征信息的相似度;当相似度小于相似度阈值时,对初始位置的特征信息和目标页面位置的特征信息进行调整,直至满足预设条件;预设条件包括:调整后的相似度大于或者等于相似度阈值。
可选的,特征信息包括:在目标页面的渲染参数;预设条件还包括:目标渲染参数大于或者等于预设的渲染参数阈值;目标渲染参数包括:调整后的初始位置的渲染参数,以及调整后的目标页面位置的渲染参数;该数据获取方法,还包括:当目标渲染参数小于渲染参数阈值、且调整后的相似度小于相似度阈值时,发送提示消息;提示消息用于表示用户行为数据获取失败。
第二方面,提供一种数据获取装置,包括:获取单元和处理单元;获取单元,用于获取目标页面中的多个页面位置的特征信息,以及与多个页面位置一一对应的多个数据访问标识;获取单元,还用于获取在目标页面中,与用户行为对应的初始位置的特征信息;处理单元,用于当初始位置的特征信息与目标页面位置的特征信息的相似度大于或者等于预设的相似度阈值时,将目标页面位置对应的数据访问标识,确定为用户行为数据;目标页面位置为多个页面位置中的任意一个位置。
可选的,获取单元,具体用于:周期性地获取用户操作对象的停留位置;响应于执行的点击操作,获取用户操作对象的点击位置;将目标用户位置的特征信息,确定为初始位置的特征信息;目标用户位置包括:停留位置,和/或,点击位置。
可选的,处理单元,还用于:获取初始位置的特征信息与目标页面位置的特征信息的相似度;当相似度小于相似度阈值时,对初始位置的特征信息和目标页面位置的特征信息进行调整,直至满足预设条件;预设条件包括:调整后的相似度大于或者等于相似度阈值。
可选的,特征信息包括:在目标页面的渲染参数;预设条件还包括:目标渲染参数大于或者等于预设的渲染参数阈值;目标渲染参数包括:调整后的初始位置的渲染参数,以及调整后的目标页面位置的渲染参数;处理单元,还用于:当目标渲染参数小于渲染参数阈值、且调整后的相似度小于相似度阈值时,发送提示消息;提示消息用于表示用户行为数据获取失败。
第三方面,提供一种数据获取装置,包括存储器和处理器;存储器用于存储计算机执行指令,处理器与存储器通过总线连接;当数据获取装置运行时,处理器执行存储器存储的计算机执行指令,以使数据获取装置执行第一方面所述的数据获取方法。
该数据获取装置可以是网络设备,也可以是网络设备中的一部分装置,例如网络设备中的芯片系统。该芯片系统用于支持网络设备实现第一方面及其任意一种可能的实现方式中所涉及的功能,例如,获取、确定、发送上述数据获取方法中所涉及的数据和/或信息。该芯片系统包括芯片,也可以包括其他分立器件或电路结构。
第四方面,提供一种计算机可读存储介质,计算机可读存储介质包括计算机执行指令,当计算机执行指令在计算机上运行时,使得该计算机执行第一方面所述的数据获取方法。
第五方面,还提供一种计算机程序产品,该计算机程序产品包括计算机指令,当计算机指令在数据获取装置上运行时,使得数据获取装置执行如上述第一方面所述的数据获取方法。
需要说明的是,上述计算机指令可以全部或者部分存储在第一计算机可读存储介质上。其中,第一计算机可读存储介质可以与数据获取装置的处理器封装在一起的,也可以与数据获取装置的处理器单独封装,本申请对此不作限定。
本申请中第二方面、第三方面、第四方面以及第五方面的描述,可以参考第一方面的详细描述;并且,第二方面、第三方面、第四方面以及第五方面的有益效果,可以参考第一方面的有益效果分析,此处不再赘述。
在本申请中,上述数据获取装置的名字对设备或功能模块本身不构成限定,在实际实现中,这些设备或功能模块可以以其他名称出现。只要各个设备或功能模块的功能和本申请类似,属于本申请权利要求及其等同技术的范围之内。
本申请的这些方面或其他方面在以下的描述中会更加简明易懂。
本申请提供的技术方案至少带来以下有益效果:
基于上述任一方面,本申请提供了一种数据获取方法,可以预先获取目标页面中的多个页面位置的特征信息,以及与多个页面位置一一对应的多个数据访问标识。然后,可以获取在目标页面中,与用户行为对应的初始位置的特征信息。当初始位置的特征信息与目标页面位置的特征信息的相似度大于或者等于预设的相似度阈值时,可以将目标页面位置对应的数据访问标识,确定为用户行为数据。其中,目标页面位置为多个页面位置中的任意一个位置。由于本申请是通过特征信息匹配实时采集用户行为数据,数据更加直观,因此,本申请可以提高用户行为数据的准确率。同时,相较于通用技术,本申请的获取周期短,且不需要提前埋点,可以有效降低运行成本。
附图说明
图1为本申请实施例提供的一种数据获取系统的结构示意图;
图2为本申请实施例提供的一种数据获取设备的结构示意图;
图3为本申请实施例提供的一种数据获取装置的硬件结构示意图一;
图4为本申请实施例提供的一种数据获取装置的硬件结构示意图二;
图5为本申请实施例提供的一种数据获取方法的流程示意图一;
图6为本申请实施例提供的一种数据获取方法的流程示意图二;
图7为本申请实施例提供的一种数据获取方法的流程示意图三;
图8为本申请实施例提供的一种数据获取方法的流程示意图四;
图9为本申请实施例提供的一种数据获取方法的流程示意图五;
图10为本申请实施例提供的一种数据获取装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
为了便于清楚描述本申请实施例的技术方案,在本申请实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分,本领域技术人员可以理解“第一”、“第二”等字样并不是在对数量和执行次序进行限定。
如背景技术所示,埋点质量问题会导致漏埋点或者埋点错误的情况,需要重新加载或者编码,会影响用户体验,所以修复难度极大,会造成数据不准确、数据丢失的情况。而日志分析技术通过服务端获取的数据不全面、获取周期长。因此,如何准确地获取用户行为数据,是目前亟需解决的问题。
本申请实施例提供了一种数据获取方法,可以预先获取目标页面中的多个页面位置的特征信息,以及与多个页面位置一一对应的多个数据访问标识。然后,可以获取在目标页面中,与用户行为对应的初始位置的特征信息。当初始位置的特征信息与目标页面位置的特征信息的相似度大于或者等于预设的相似度阈值时,可以将目标页面位置对应的数据访问标识,确定为用户行为数据。其中,目标页面位置为多个页面位置中的任意一个位置。由于本申请是通过特征信息匹配实时采集用户行为数据,数据更加直观,因此,本申请可以提高用户行为数据的准确率。同时,相较于通用技术,本申请的获取周期短,且不需要提前埋点,可以有效降低运行成本。
该数据获取方法适用于数据获取系统。图1示出了一种数据获取系统的结构示意图。如图1所示,该数据获取系统包括:数据获取设备101、人机交互设备102。
数据获取设备101与人机交互设备102之间可以通过有线或无线的方式连接。
具体的,用户可以在人机交互设备102上执行操作,数据获取设备101可以根据上述操作,获取用户对应的用户行为数据。
一些实施例中,数据获取设备101和人机交互设备102可以是同一个终端设备上的两个功能模块,也可以是相互独立设置的两个实体设备。
容易理解的是,当数据获取设备101和人机交互设备102是同一个终端设备上的两个功能模块时,数据获取设备101与人机交互设备102之间的交互方式为终端设备内部模块之间的交互。这种情况下,二者之间的交互流程与“数据获取设备101和人机交互设备102是相互独立设置的两个实体设备的情况下,二者之间的交互流程”相同。
其中,终端设备可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如手机、平板电脑、掌上电脑、个人计算机(personal computer,PC)、可穿戴设备、智能电视等。
可选的,当数据获取设备101和人机交互设备102是相互独立设置的两个实体设备时,数据获取设备101可以是一个独立的服务器或者其他形态的物理设备。本申请对于数据获取设备101的具体实体形态不作限定。
当数据获取设备101为独立的物理设备时,该物理设备可以是服务器集群(由多个服务器组成)中的一个服务器,也可以是物理设备中的芯片,还可以是物理设备中的片上系统,还可以通过部署在物理机上的虚拟机实现,本申请实施例对此不作限定。
为了便于理解,本申请以“数据获取设备101和人机交互设备102是相互独立设置的两个实体设备”为例进行说明。
结合图1,如图2所示,数据获取设备101可以包括:页面信息获取模块201、用户行为跟踪模块202、信息匹配模块203。
其中,页面信息获取模块201用于获取页面中不同页面位置的特征信息。
用户行为跟踪模块202用于获取用户操作对象对应的位置的特征信息。
信息匹配模块203用于匹配页面位置与用户操作对象对应的位置,从而确定用户行为数据。
结合图1,数据获取系统中的数据获取设备101和人机交互设备102均包括图3或图4所示通信装置所包括的元件。下面以图3和图4所示的通信装置为例,介绍数据获取设备101和人机交互设备102的硬件结构。
如图3所示,为本申请实施例提供的通信装置的一种硬件结构示意图。该通信装置包括处理器21,存储器22、通信接口23、总线24。处理器21,存储器22以及通信接口23之间可以通过总线24连接。
处理器21是通信装置的控制中心,可以是一个处理器,也可以是多个处理元件的统称。例如,处理器21可以是一个通用中央处理单元(central processing unit,CPU),也可以是其他通用处理器等。其中,通用处理器可以是微处理器或者是任何常规的处理器等。
作为一种实施例,处理器21可以包括一个或多个CPU,例如图3中所示的CPU 0和CPU 1。
存储器22可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
一种可能的实现方式中,存储器22可以独立于处理器21存在,存储器22可以通过总线24与处理器21相连接,用于存储指令或者程序代码。处理器21调用并执行存储器22中存储的指令或程序代码时,能够实现本发明下述实施例提供的数据获取方法。
另一种可能的实现方式中,存储器22也可以和处理器21集成在一起。
通信接口23,用于通信装置与其他设备通过通信网络连接,所述通信网络可以是以太网,无线接入网,无线局域网(wireless local area networks,WLAN)等。通信接口23可以包括用于接收数据的接收单元,以及用于发送数据的发送单元。
总线24,可以是工业标准体系结构(industry standard architecture,ISA)总线、外部设备互连(peripheral component interconnect,PCI)总线或扩展工业标准体系结构(extended industry standard architecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
图4示出了本发明实施例中通信装置的另一种硬件结构。如图4所示,通信装置可以包括处理器31以及通信接口32。处理器31与通信接口32耦合。
处理器31的功能可以参考上述处理器21的描述。此外,处理器31还具备存储功能,可以起上述存储器22的功能。
通信接口32用于为处理器31提供数据。该通信接口32可以是通信装置的内部接口,也可以是通信装置对外的接口(相当于通信接口23)。
需要指出的是,图3(或图4)中示出的结构并不构成对通信装置的限定,除图3(或图4)所示部件之外,该通信装置可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合附图对本申请实施例提供的数据获取方法进行详细介绍。如图5所示,该数据获取方法包括:
S501、数据获取设备获取目标页面中的多个页面位置的特征信息,以及与多个页面位置一一对应的多个数据访问标识。
可选的,特征信息可以包括:每个页面位置的位置信息、渲染参数、和对应的渲染图像等。其中渲染参数可以为分辨率、色彩亮度(red-green-blue,RGB)、像素等。
可选的,数据访问标识可以是表征数据访问路径(route)、存储位置的标识信息。
具体的,服务商可以发布或者更新目标页面,数据获取设备可以获取目标页面中的多个页面位置的特征信息,以及与多个页面位置一一对应的多个数据访问标识。
示例性的,数据获取设备可以获取到目标页面中的每个页面位置的特征信息(x,y,RGB)和渲染图像,其中,(x,y)为每个页面位置的像素点坐标。数据获取设备还可以获取到每个页面位置对应的数据访问标识,并存储为“图像-路径(pic-route)”。
在一种可以实现的方式中,数据获取设备可以周期性的获取每个页面中,多个页面位置的特征信息,以及与多个页面位置一一对应的多个数据访问标识。
在另一种可以实现的方式中,当人机交互设备请求访问目标页面时,可以向数据获取设备发送告知消息。数据获取设备可以响应于上述告知消息,获取目标页面中多个页面位置的特征信息,以及与多个页面位置一一对应的多个数据访问标识。
S502、数据获取设备获取在目标页面中,与用户行为对应的初始位置的特征信息。
在一种可以实现的方式中,数据获取设备可以周期性地获取用户操作对象(如鼠标)的停留位置,以及所述用户操作对象的点击位置,确定为与用户行为对应的初始位置,并获取对应的特征信息。
在一种可以实现的方式中,数据获取设备获取初始位置的特征信息的方法可以包括:人机交互设备调用特征提取组件,提取初始位置的特征信息,并向数据获取设备发送。相应的,数据获取设备可以接收到初始位置的特征信息。
示例性的,人机交互设备可以每5秒钟记录一次用户鼠标的停留位置的(x,y,RGB)和渲染图像,以及每次用户鼠标的点击行为发生时记录点击位置的(x,y,RGB)和渲染图像。其中,渲染图像包括以停留位置或者点击位置为中心的n×n的像素方框区域截图,并标识为“捕获-随机码-路径(capture-XXX-route)”,然后向数据获取设备发送以上特征信息。“XXX”可以为包括时间戳的随机码。
S503、当初始位置的特征信息与目标页面位置的特征信息的相似度大于或者等于预设的相似度阈值时,数据获取设备将目标页面位置对应的数据访问标识,确定为用户行为数据。
其中,目标页面位置为多个页面位置中的任意一个位置。
具体的,数据获取设备可以将获取到的初始位置的特征信息与预先获取的页面位置的特征信息进行匹配。当匹配成功时,表示用户行为对应该页面位置,此时可以将该页面位置对应的数据访问标识,确定为用户行为数据。
其中,数据获取设备匹配初始位置的特征信息与预先获取的页面位置的特征信息的方法可以包括:数据获取设备根据预设的相似度算法,获取初始位置的特征信息与页面位置的特征信息的相似度,然后,当相似度大于或者等于预设的相似度阈值时,认为匹配成功。
可选的,相似度可以包括:图像相似度、坐标相似度等。
上述实施例提供的技术方案至少带来以下有益效果:由S501-S503可知,数据获取设备可以预先获取目标页面中的多个页面位置的特征信息,以及与多个页面位置一一对应的多个数据访问标识。然后,数据获取设备可以获取在目标页面中,与用户行为对应的初始位置的特征信息。当初始位置的特征信息与目标页面位置的特征信息的相似度大于或者等于预设的相似度阈值时,数据获取设备可以将目标页面位置对应的数据访问标识,确定为用户行为数据。其中,目标页面位置为多个页面位置中的任意一个位置。由于本申请是通过特征信息匹配实时采集用户行为数据,数据更加直观,因此,本申请可以提高用户行为数据的准确率。同时,相较于通用技术,本申请的获取周期短,且不需要提前埋点,可以有效降低运行成本。
在一种可选的实施例中,结合图5,如图6所示,S502中,数据获取设备获取在目标页面中,与用户行为对应的初始位置的特征信息的方法包括:
S601、数据获取设备周期性地获取用户操作对象的停留位置。
可选的,用户操作对象可以为鼠标、触控笔等设备,还可以是用于触发的身体部位,如手指。
S602、数据获取设备响应于执行的点击操作,获取用户操作对象的点击位置。
S603、数据获取设备将目标用户位置的特征信息,确定为初始位置的特征信息。
其中,目标用户位置包括:停留位置,和/或,点击位置。
上述实施例提供的技术方案至少带来以下有益效果:由S601-S603可知,数据获取设备可以周期性地获取用户操作对象的停留位置,还可以响应于执行的点击操作,获取用户操作对象的点击位置。然后,数据获取设备可以将停留位置,和/或,点击位置的特征信息,确定为初始位置的特征信息。本申请提供了一种获取初始位置的特征信息的方法,以实现实时获取用户行为,可以有效降低获取周期。
在一种可选的实施例中,如图7所示,该数据获取方法,还包括:
S701、数据获取设备获取初始位置的特征信息与目标页面位置的特征信息的相似度。
在一种可以实现的方式中,数据获取设备可以根据预设的相似度算法,确定初始位置的渲染图像与页面位置的渲染图像的图像相似度。
S702、当相似度小于相似度阈值时,数据获取设备对初始位置的特征信息和目标页面位置的特征信息进行调整,直至满足预设条件。
其中,预设条件可以包括:调整后的相似度大于或者等于相似度阈值。
具体的,当相似度小于相似度阈值时,表示初始位置的特征信息与目标页面位置的特征信息匹配失败,由于特征信息的获取方式可能存在误差,因此,数据获取设备可以对初始位置的特征信息和目标页面位置的特征信息进行调整,例如,对渲染图像进行灰度化处理,降低分辨率,然后重新进行匹配。
可选的,当特征信息包括渲染参数时,预设条件还包括:目标渲染参数大于或者等于预设的渲染参数阈值。其中,目标渲染参数包括:调整后的初始位置的渲染参数,以及调整后的目标页面位置的渲染参数。
上述实施例提供的技术方案至少带来以下有益效果:由S701-S702可知,数据获取设备可以获取初始位置的特征信息与目标页面位置的特征信息的相似度。当相似度小于相似度阈值时,数据获取设备可以对初始位置的特征信息和目标页面位置的特征信息进行调整,直至满足预设条件。本申请提供一种匹配特征信息的方法,可以灵活调整特征信息,提高信息利用率,有效减少信息浪费。
在一种可选的实施例中,在预设条件还包括:目标渲染参数大于或者等于预设的渲染参数阈值的情况下,结合图7,如图8所示,该数据获取方法,还包括:
S801、当目标渲染参数小于渲染参数阈值、且调整后的相似度小于相似度阈值时,数据获取设备发送提示消息。
其中,提示消息用于表示用户行为数据获取失败。
具体的,当目标渲染参数小于渲染参数阈值、且调整后的相似度小于相似度阈值时,表示对特征信息的调整已经低于预设的下限,仍不能匹配成功,此时,数据获取设备发送提示消息,提示后台服务端,用户行为数据获取失败(匹配失败)。
在一种可选的实施例中,后台服务端接收到提示消息之后,可以指示对匹配失败的初始位置进行人工标注用户行为数据。
上述实施例提供的技术方案至少带来以下有益效果:由S801可知,当目标渲染参数小于渲染参数阈值、且调整后的相似度小于相似度阈值时,数据获取设备可以发送提示消息,表示用户行为数据获取失败,便于后续服务端对匹配失败的情况进行分析管理,以及对数据获取方法进行改进。
下面结合图9对本申请实施例提供的数据获取方法进行说明,该数据获取方法包括:
S901、数据获取设备获取目标页面中的多个页面位置的特征信息,以及与多个页面位置一一对应的多个数据访问标识。
S902、数据获取设备获取在目标页面中,与用户行为对应的初始位置的特征信息。
S903、数据获取设备对初始位置的特征信息与目标页面位置的特征信息进行匹配。
S904、数据获取设备确定目标渲染参数是否小于渲染参数阈值。
当目标渲染参数大于或者等于渲染参数阈值时,执行S905。
当目标渲染参数小于渲染参数阈值时,执行S907。
S905、数据获取设备确定初始位置的特征信息与目标页面位置的特征信息的相似度是否大于或者等于相似度阈值。
当相似度大于或者等于相似度阈值时,执行S906。
当相似度小于相似度阈值时,执行S908。
S906、数据获取设备将目标页面位置对应的数据访问标识,确定为用户行为数据。
S907、数据获取设备发送用于表示用户行为数据获取失败的提示消息。
S908、数据获取设备对初始位置的特征信息和目标页面位置的特征信息进行调整。
然后,重复执行S903。
上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对数据获取装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。可选的,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
如图10所示,为本申请实施例提供的一种数据获取装置的结构示意图。该数据获取装置可以用于执行图5至图9所示的数据获取的方法。图10所示数据获取装置包括:获取单元1001和处理单元1002。
获取单元1001,用于获取目标页面中的多个页面位置的特征信息,以及与多个页面位置一一对应的多个数据访问标识。
获取单元1001,还用于获取在目标页面中,与用户行为对应的初始位置的特征信息。
处理单元1002,用于当初始位置的特征信息与目标页面位置的特征信息的相似度大于或者等于预设的相似度阈值时,将目标页面位置对应的数据访问标识,确定为用户行为数据;目标页面位置为多个页面位置中的任意一个位置。
可选的,获取单元1001,具体用于:周期性地获取用户操作对象的停留位置;响应于执行的点击操作,获取用户操作对象的点击位置;将目标用户位置的特征信息,确定为初始位置的特征信息;目标用户位置包括:停留位置,和/或,点击位置。
可选的,处理单元1002,还用于:获取初始位置的特征信息与目标页面位置的特征信息的相似度;当相似度小于相似度阈值时,对初始位置的特征信息和目标页面位置的特征信息进行调整,直至满足预设条件;预设条件包括:调整后的相似度大于或者等于相似度阈值。
可选的,特征信息包括:在目标页面的渲染参数;预设条件还包括:目标渲染参数大于或者等于预设的渲染参数阈值;目标渲染参数包括:调整后的初始位置的渲染参数,以及调整后的目标页面位置的渲染参数;处理单元1002,还用于:当目标渲染参数小于渲染参数阈值、且调整后的相似度小于相似度阈值时,发送提示消息;提示消息用于表示用户行为数据获取失败。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质包括计算机执行指令,当计算机执行指令在计算机上运行时,使得计算机执行如上述实施例提供的数据获取方法。
本申请实施例还提供一种计算机程序,该计算机程序可直接加载到存储器中,并含有软件代码,该计算机程序经由计算机载入并执行后能够实现上述实施例提供的数据获取方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机可读存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对通常技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种数据获取方法,其特征在于,包括:
获取目标页面中的多个页面位置的特征信息,以及与所述多个页面位置一一对应的多个数据访问标识;
获取在所述目标页面中,与用户行为对应的初始位置的特征信息;
当所述初始位置的特征信息与目标页面位置的特征信息的相似度大于或者等于预设的相似度阈值时,将所述目标页面位置对应的数据访问标识,确定为用户行为数据;所述目标页面位置为所述多个页面位置中的任意一个位置。
2.根据权利要求1所述的方法,其特征在于,所述获取在所述目标页面中,与用户行为对应的初始位置的特征信息,包括:
周期性地获取用户操作对象的停留位置;
响应于执行的点击操作,获取所述用户操作对象的点击位置;
将目标用户位置的特征信息,确定为所述初始位置的特征信息;所述目标用户位置包括:所述停留位置,和/或,所述点击位置。
3.根据权利要求1所述的方法,其特征在于,还包括:
获取所述初始位置的特征信息与所述目标页面位置的特征信息的相似度;
当所述相似度小于所述相似度阈值时,对所述初始位置的特征信息和所述目标页面位置的特征信息进行调整,直至满足预设条件;所述预设条件包括:调整后的相似度大于或者等于所述相似度阈值。
4.根据权利要求3所述的方法,其特征在于,所述特征信息包括:在所述目标页面的渲染参数;所述预设条件还包括:目标渲染参数大于或者等于预设的渲染参数阈值;所述目标渲染参数包括:调整后的初始位置的渲染参数,以及调整后的目标页面位置的渲染参数;所述方法还包括:
当所述目标渲染参数小于所述渲染参数阈值、且所述调整后的相似度小于所述相似度阈值时,发送提示消息;所述提示消息用于表示所述用户行为数据获取失败。
5.一种数据获取装置,其特征在于,包括:获取单元和处理单元;
所述获取单元,用于获取目标页面中的多个页面位置的特征信息,以及与所述多个页面位置一一对应的多个数据访问标识;
所述获取单元,还用于获取在所述目标页面中,与用户行为对应的初始位置的特征信息;
所述处理单元,用于当所述初始位置的特征信息与目标页面位置的特征信息的相似度大于或者等于预设的相似度阈值时,将所述目标页面位置对应的数据访问标识,确定为用户行为数据;所述目标页面位置为所述多个页面位置中的任意一个位置。
6.根据权利要求5所述的数据获取装置,其特征在于,所述获取单元,具体用于:
周期性地获取用户操作对象的停留位置;
响应于执行的点击操作,获取所述用户操作对象的点击位置;
将目标用户位置的特征信息,确定为所述初始位置的特征信息;所述目标用户位置包括:所述停留位置,和/或,所述点击位置。
7.根据权利要求5所述的数据获取装置,其特征在于,所述处理单元,还用于:
获取所述初始位置的特征信息与所述目标页面位置的特征信息的相似度;
当所述相似度小于所述相似度阈值时,对所述初始位置的特征信息和所述目标页面位置的特征信息进行调整,直至满足预设条件;所述预设条件包括:调整后的相似度大于或者等于所述相似度阈值。
8.根据权利要求7所述的数据获取装置,其特征在于,所述特征信息包括:在所述目标页面的渲染参数;所述预设条件还包括:目标渲染参数大于或者等于预设的渲染参数阈值;所述目标渲染参数包括:调整后的初始位置的渲染参数,以及调整后的目标页面位置的渲染参数;所述处理单元,还用于:
当所述目标渲染参数小于所述渲染参数阈值、且所述调整后的相似度小于所述相似度阈值时,发送提示消息;所述提示消息用于表示所述用户行为数据获取失败。
9.一种数据获取装置,其特征在于,包括存储器和处理器;所述存储器用于存储计算机执行指令,所述处理器与所述存储器通过总线连接;当所述数据获取装置运行时,所述处理器执行所述存储器存储的所述计算机执行指令,以使所述数据获取装置执行如权利要求1-4任一项所述的数据获取方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括计算机执行指令,当所述计算机执行指令在计算机上运行时,使得所述计算机执行如权利要求1-4任一项所述的数据获取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211654689.0A CN116383019A (zh) | 2022-12-22 | 2022-12-22 | 一种数据获取方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211654689.0A CN116383019A (zh) | 2022-12-22 | 2022-12-22 | 一种数据获取方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116383019A true CN116383019A (zh) | 2023-07-04 |
Family
ID=86971892
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211654689.0A Pending CN116383019A (zh) | 2022-12-22 | 2022-12-22 | 一种数据获取方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116383019A (zh) |
-
2022
- 2022-12-22 CN CN202211654689.0A patent/CN116383019A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110852332B (zh) | 训练样本的生成方法、装置、存储介质及电子设备 | |
CN110555171B (zh) | 一种信息处理方法、装置、存储介质及系统 | |
CN112019820B (zh) | 界面生成方法和装置 | |
CN110009004B (zh) | 图像数据处理方法、计算机设备和存储介质 | |
US20160224554A1 (en) | Search methods, servers, and systems | |
CN113313804B (zh) | 一种图像渲染方法、装置、电子设备和存储介质 | |
CN109542278B (zh) | 触摸数据的处理方法、装置及触摸设备 | |
CN105677678B (zh) | 网页的首屏位置确定、网页信息显示方法和系统 | |
CN112749074B (zh) | 一种测试用例推荐方法以及装置 | |
CN114175748B (zh) | 通信频率调节方法、装置、电子设备及存储介质 | |
CN108921530B (zh) | 信息判断方法、装置、存储介质及终端 | |
CN111813700B (zh) | 监控数据展示方法和装置 | |
WO2020124454A1 (zh) | 字体切换方法及相关产品 | |
EP3499399A1 (en) | Electronic apparatus and information reading control method | |
CN109951549B (zh) | 网络页面的访问方法、装置及计算机可读存储介质 | |
CN108304104B (zh) | 一种数据获取方法及其设备、存储介质、终端 | |
CN116383019A (zh) | 一种数据获取方法、装置及存储介质 | |
CN113469923B (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
WO2015035899A1 (en) | Search methods and terminals | |
CN107968799B (zh) | 一种信息获取方法、终端设备及系统 | |
CN111899042B (zh) | 恶意曝光广告行为的检测方法、装置、存储介质及终端 | |
US11474618B2 (en) | Communication link based on activity on a keyboard | |
CN114417201A (zh) | 消息处理方法、装置、计算机设备及存储介质 | |
CN113485855A (zh) | 一种内存共享方法、装置、电子设备及可读存储介质 | |
CN113780291A (zh) | 一种图像处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |