CN106294406A - 一种用于处理应用访问数据的方法与设备 - Google Patents

一种用于处理应用访问数据的方法与设备 Download PDF

Info

Publication number
CN106294406A
CN106294406A CN201510266206.3A CN201510266206A CN106294406A CN 106294406 A CN106294406 A CN 106294406A CN 201510266206 A CN201510266206 A CN 201510266206A CN 106294406 A CN106294406 A CN 106294406A
Authority
CN
China
Prior art keywords
application
data
information
visitor
event description
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510266206.3A
Other languages
English (en)
Other versions
CN106294406B (zh
Inventor
贾宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510266206.3A priority Critical patent/CN106294406B/zh
Priority to PCT/CN2016/082161 priority patent/WO2016188334A1/zh
Publication of CN106294406A publication Critical patent/CN106294406A/zh
Application granted granted Critical
Publication of CN106294406B publication Critical patent/CN106294406B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/972Access to data in other repository systems, e.g. legacy data or dynamic Web page generation

Abstract

本申请的目的是提供一种在网络设备端用于处理应用访问数据的方法;获取关于对应用户设备中目标应用的应用访问数据;基于对应的事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息。与现有技术相比,本申请的网络设备通过基于对应的事件描述信息,对所获取的用户设备中目标应用的应用访问数据进行处理,以确定所述目标应用的应用访问事件的事件特征信息,在此,基于所述自定义的事件描述信息,可以有针对性地对获取符合事件描述的应用访问数据,并对其进行统计分析,从而为后续的信息处理和应用提供有利的数据基础。

Description

一种用于处理应用访问数据的方法与设备
技术领域
本申请涉及计算机领域,尤其涉及一种用于处理应用访问数据的技术。
背景技术
在互联网场景下,很多时候希望基于一定的目的对目标用户进行准确的类别划分,例如,基于各种维度,对网站的访问者进行相应的划分,所述维度可以包括用户偏好、用户身份等各种信息,进而,可以基于划分结果进行后续的相应处理和分析应用,如为目标用户提供有区别的服务等。例如,基于用户浏览网页行为对应的信息来识别网站的真实用户和虚假用户。但是现有的用户识别方案主要是依赖于用户浏览器信息,如基于用户浏览器的cookie信息等对用户进行分类,而对于移动应用对应的用户识别,如移动应用的真假用户的识别,由于没有可依赖的用户浏览器行为,所以并没有相应的有效识别方法。
发明内容
本申请的目的是提供一种用于处理应用访问数据的方法与设备。
根据本申请的一个方面,提供了一种在网络设备端用于处理应用访问数据的方法,其中,所述方法包括:
获取关于对应用户设备中目标应用的应用访问数据;
基于对应的事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息。
根据本申请的另一方面,还提供了一种在用户设备端用于处理应用访问数据的方法,其中,所述方法包括:
获取对应网络设备提供的关于用户设备上的目标应用的事件描述信息;
基于所述事件描述信息设置关于所述目标应用的应用访问数据的采集触发条件;
基于所述采集触发条件采集所述应用访问数据;
将所述应用访问数据发送至所述网络设备。
根据本申请的再一方面,还提供了一种用于处理应用访问数据的网络设备,其中,所述网络设备包括:
第一装置,用于获取关于对应用户设备中目标应用的应用访问数据;
第二装置,用于基于对应的事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息。
根据本申请的又一方面,还提供了一种用于处理应用访问数据的用户设备,其中,所述用户设备包括:
第九装置,用于获取对应网络设备提供的关于用户设备上的目标应用的事件描述信息;
第十装置,用于基于所述事件描述信息设置关于所述目标应用的应用访问数据的采集触发条件;
第十一装置,用于基于所述采集触发条件采集所述应用访问数据;
第十二装置,用于将所述应用访问数据发送至所述网络设备。
根据本申请的另一方面,还提供了一种用于处理应用访问数据的系统,其中,所述系统包括:根据本申请的再一方面提供的一种用于处理应用访问数据的网络设备,以及据本申请的再一方面提供的一种用于处理应用访问数据的用户设备。
与现有技术相比,本申请的网络设备通过基于对应的事件描述信息,对所获取的用户设备中目标应用的应用访问数据进行处理,以确定所述目标应用的应用访问事件的事件特征信息,在此,基于所述自定义的事件描述信息,可以有针对性地对获取符合事件描述的应用访问数据,并对其进行统计分析,从而为后续的信息处理和应用提供有利的数据基础。进一步,基于所获取的应用访问事件的事件特征信息,结合相应的算法,可以灵活地实现各类具体应用场景下的信息分类识别。进一步,基于应用访问者的识别结果,并结合预置的访问者可信度指标,可以确定访问者的可信度信息,从而能够更实际地反映应用内用户的真实可信信息,从而更好的维护、改进和完善目标应用的应用效果。进一步,本申请基于所述事件特征信息生成对应的图示信息,从而借助图示信息,能够对所述事件特征信息进行更形象直观地描述。进一步,在本申请中,所述用户设备基于所述事件描述信息,预先在目标应用中设置应用访问数据的采集触发条件,从而可以通过有针对性的埋点,有效地获取应用访问数据,进而为后续的数据统计分析提供有利的数据基础。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本申请一个方面的一种用于处理应用访问数据的网络设备的设备示意图;
图2示出根据本申请一个优选实施例的一种于处理应用访问数据的网络设备的设备示意图;
图3示出根据本申请一个优选实施例的一种用于处理应用访问数据的网络设备和用户设备的系统示意图;
图4示出根据本申请另一个优选实施例的一种用户处理应用访问数据的网络设备的设备示意图;
图5示出根据本申请再一个方面的一种在网络设备端用于处理应用访问数据的方法示意图;
图6示出根据本申请一个优选实施例的一种在网络设备端用于处理应用访问数据的方法示意图;
图7示出根据本申请一个优选实施例的一种用于处理应用访问数据的方法示意图;
图8示出根据本申请另一个优选实施例的一种在网络设备端用于处理应用访问数据的方法示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
图1示出根据本申请一个方面的一种用于处理应用访问数据的网络设备1的设备示意图。其中,所述网络设备1包括第一装置101和第二装置102。
其中,第一装置101获取关于对应用户设备中目标应用的应用访问数据;第二装置102基于对应的事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息。
具体地,所述网络设备1的第一装置101获取关于对应用户设备中目标应用的应用访问数据。在此,所述用户设备包括但不限于各种类型的PC、移动电话、平板电脑、以及其他各种可以装载对应目标应用的终端设备。所述目标应用包括但不限于与各种终端设备相对应的应用类型。在此,所述目标应用与所述用户设备相对应,以所述终端设备是移动终端,如移动电话、平板电脑等为例,所述目标应用可以是基于苹果iOS系统的ipa,pxl,deb等格式的应用,也可以是基于安卓系统的apk格式的应用,还可以是基于微软windowsphone系统的xap格式的应用,等等。在此,所述应用访问数据包括基于用户在所述终端设备的所述目标应用中进行的访问操作所确定的访问相关信息。例如,所述访问操作包括用户点击进入应用的某一页面、用户点击应用的某一控件等,基于所述访问操作,所述访问数据包括用户访问应用的页面信息、用户在该页面停留的时间、用户点击应用中相应控件的次数、用户在一定时间内访问所述应用消耗的流量信息,等等。在此,所述网络设备1获取的访问数据的具体种类可以基于实际需要进行设置。例如,可以不加选择的将用户对应用的全部访问操作对应的访问相关信息都纳入进所述网络设备1获取的应用访问数据中;又如,还可以基于不同目标应用的特点有针对性的设置对应的应用访问数据的种类和内容;再如,还可以基于应用访问数据处理后的实际应用场景有针对性地确定所述应用访问数据的种类和内容。
在此,所述应用访问数据的获取可以是周期性获取,或是根据实际应用场景设定其他的获取条件。此外,所述应用访问数据可以直接从所述目标应用对应的用户设备中获取。例如,可以通过读取目标应用对应的应用访问日志来获取所述应用访问数据。此外,所述应用访问数据还可以从与所述目标应用所述在用户设备相对应的第三方设备中获取所述应用访问数据,所述第三方设备包括能够获取、存储所述应用访问数据的设备,如所述用户设备对应的同步设备、或是存储设备等。
接着,第二装置102基于对应的事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息。
具体地,所述网络设备1获取的所述应用访问数据包括基于用户在所述终端设备的所述目标应用中进行的访问操作所确定的访问相关信息。在此,基于用户对应用的访问操作定义了相应的应用访问事件,例如,用户点击登录键登录应用,则可以定义相应的应用访问事件为登录。在此,一个访问操作可能对应一个或多个应用访问事件,例如,用户点击进入一个页面,可以同时对应登录页面信息和登录页面次数两个应用访问事件。应用访问事件的定义可以基于实际应用的运行特征、或是基于对该目标应用的应用访问数据处理后的实际应用场景的需要进行设置。在此,所述事件描述信息与所述应用访问事件对应,所述事件描述信息包含对所述应用访问事件的具体描述,在此,优选地,所述事件描述信息可以包括所述应用访问事件的事件名称,对应用访问事件的内容描述信息,应用访问事件对应的处理信息,等等。例如,所述应用访问事件的事件名称可以为任意能够唯一确定该事件的字符串;又如,所述应用访问事件的描述内容可以为任意字符串,其目的是帮助分辨事件的具体内容;再如,所述应用访问事件的处理信息可以包括运算信息,目的是对所述应用访问事件进行特征量化,如,可以是事件内容的数量运算、求和运算、求平均值运算等等。以所述用户点击登录键登录应用这一操作为例,可以定义所述应用访问事件的时间名称为A1,所述应用访问事件的描述内容为登录;所述应用访问事件的处理信息为设置算子count,在此,所述算子count即对应于登录次数计算。
其中,所述目标应用对应的事件描述信息可以由所述网络设备1从任意可能的服务器设备中获取,在此,优选地,所述目标应用对应的事件描述信息还可以由应用开发者根据实际需要直接在所述网络设备1中设置,进一步,可以针对每一个目标应用分别设置对应的若干个应用访问事件,并设置对应的事件描述信息。在此,不同目标应用,或是不同种类的目标应用可以对应不同、或是相同的应用访问事件、或是事件描述信息的设置。
在此,所述网络设备1的第二装置102基于所述事件描述信息对所述应用访问数据进行处理可以包括将所获得的应用访问数据与相应的事件描述信息进行匹配,若是匹配成功,则基于事件描述信息中预先设置的应用访问事件对应的计算或是统计分析方式确定相应的事件特征信息。可以基于所述应用访问数据的不同形式内容,对所述应用访问数据做不同的处理。例如,当所述应用访问数据为来自所述目标应用所在用户设备的应用访问日志时,假设读取了一行日志,则可以先基于预设的分隔符对该行日志对应的字符串进行分解,获得相应字符子串,再基于所述字符子串,与该目标应用对应的所述事件描述信息进行匹配。如果所述匹配成功,则基于所述事件描述信息中对应的具体描述信息,如所述应用访问事件的运算信息,对所述应用访问数据进行相应计算或统计,从而确定所获得的该应用访问数据对应的目标应用的应用访问事件的事件特征信息,并进一步,对所述事件特征信息进行特定的归类统计,如,设置以用户设备为主键的数据库,并将所述事件特征信息存入该数据库,进一步,基于后续所述时间特征信息的确定更新所述数据库信息。如果所述匹配不成功,则所述应用访问数据对应的可能是未定义的应用访问事件,则忽略不做处理。
在此,本申请的网络设备1通过基于对应的事件描述信息,对所获取的用户设备中目标应用的应用访问数据进行处理,以确定所述目标应用的应用访问事件的事件特征信息。事件特征信息可以反映一个用户设备中目标应用在相应访问操作中的相关情况,对一个目标应用一个事件特征信息分析、或是若干个事件特征信息的综合分析,可以为后续的信息处理和应用提供有利的数据基础。例如,若是不同设备上的同一应用、或是同类应用的相同应用访问事件具有可比性,则可以通过同一应用、或同类应用访问事件对应的事件特征信息的差异或是相似程度的分析,进而对事件特征信息对应的应用访问事件进行相应的区分、识别。
优选地,所述网络设备1的第二装置包括第一单元(未示出)和第二单元(未示出),其中,所述第一单元基于所述事件描述信息对所述应用访问数据进行日志分析,以获得关于所述目标应用的一个或多个应用访问事件;第二单元对所述一个或多个应用访问事件进行统计处理以获得对应的事件特征信息。
具体地,所述第一单元基于所述事件描述信息对所述应用访问数据进行日志分析,以获得关于所述目标应用的一个或多个应用访问事件。在此,本申请中,所述网络设备1获取的应用访问数据可以有多种形式内容,不同形式的应用访问数据会对应不同的数据处理。在此,优选地,基于所述目标应用所对应的用户设备设置的日志统计服务,获取所述应用访问数据对应的应用访问日志,进而基于对所述应用访问日志进行日志分析来确定所述目标应用对应的应用访问事件。应用访问日志本身对应的是非结果化的文本文件,但其中包含着可以结构化出来的信息。所述日志分析包括:首先对所述应用访问日志进行逐行分解,然后基于该分解的结果,并结合所述事件描述信息,确定所述目标应用对应的应用访问事件。具体地,不同格式的应用访问日志需要对应于不同的日志解析规则,基于已有或是自定义的日志解析规则对所述应用访问日志进行相应解析。例如,逐行读取获得的应用访问日志,优选地,每一行日志对应于一个应用访问事件,若是有多个访问操作信息,可以以多条日志的形式分别记录。进而,按照预先定义好的分隔符对所述应用访问日志进行字符串分解,分解后的各个字符子串可能分别对应于相应的的应用访问事件,也可能若干个字符子串的内容共同对应于一个应用访问事件,再将该应用访问事件与所述目标应用对应的事件描述信息中定义的应用访问事件进行对照,从而记录下该应用访问日志中需要留用的应用访问事件。所述字符子串对应的应用访问事件与所述目标应用对应的事件描述信息中定义的应用访问事件进行对照,可以是基于相同或相似的事件描述信息而进行,在此,优选地,所述网络设备1获取的应用访问日志与应用访问事件对应的事件描述信息中定义的应用访问事件,基于自定义的事件名称进行匹配,例如,某应用访问事件的事件名称对应于唯一的字符串B1。所述应用访问日志中事件名称等相关信息可以是在用户设备采集应用访问数据之前就设置在预定格式中的。例如,所述用户设备基于从所述网络设备1获取的所述目标应用的事件描述信息进行采集埋点,进而,在采集应用访问数据时,对应的应用访问日志信息中每一个应用访问事件都对应记录一个唯一的事件名称。从而,基于所述事件名称信息,可以确定所述应用访问数据中有哪些目标应用对应设置的应用访问事件。
接着,所述第二单元对所述一个或多个应用访问事件进行统计处理以获得对应的事件特征信息。
具体地,当基于所述目标应用的应用访问数据确定了若干个应用访问事件后,基于该应用访问事件对应的事件描述信息,可以对所述应用访问事件进行计算、统计处理。具体统计处理方法取决于所述事件描述信息的设置。所述事件特征信息,即对应于基于所述事件描述信息对所述应用访问事件进行处理的结果,优选地,所述事件特征信息还可以包括对若干个同一应用访问事件的处理结果的统计结果。例如,若是所述事件描述信息包括对所述应用访问事件进行定性判断,则基于所述定性判断的信息,确定该应用访问事件的性质,进而以此作为该应用访问事件的事件特征信息。又如,若是所述事件描述信息包括对所述应用访问事件进行定量分析,如,对所述应用访问事件的内容进行不限于数量运算、求和运算、求平均值运算等类别的运算,则基于相应的运算信息对所述应用访问事件进行特征量化,从而将各个应用访问事件的量化结果确定为事件特征信息。
更优选地,所述事件描述信息包括对应事件的运算符信息,其中,其中,所述第二单元基于所述应用访问事件所对应的所述运算符信息,对所述一个或多个应用访问事件进行统计处理以获得对应的事件特征信息。
具体地,所述运算符信息包括不限于数量运算、求和运算、求平均值运算等类别的运算,如,分别对应于算子count、sum、avg等。例如,假设目标应用存在于设备a1上,基于该设备a1上目标应用的事件描述信息,确定对应一个应用访问事件C1,内容描述为访问页面x,对应的运算符信息为count,则基于该事件描述信息,对获取的应用访问日志进行解析后,得到的该对应事件的事件特征信息可能是:应用访问事件C1:n,在此,n可以为一定事件内用户访问页面x的次数。在此,对于量化的所述事件特征信息,不同应用访问事件可以对应不同的量化单位。此外,具体应用中,还可以在事件描述信息中自定义所述事件特征信息时间维度,例如默认按天统计,可以在应用访问日志中包含日志时间,并在所述日志解析过程中加入特定的代码逻辑来定义时间,以满足实际需要。
优选地,所述网络设备1还包括第三装置(未示出),所述第三装置用于基于所述事件特征信息生成对应的图示信息,并显示所述图示信息。
具体地,在此,所述图示信息包括但不限于直方图、饼图等各种类型的图形描述信息。以所述直方图为例,在通用算法领域,直方图可以用作为对各类特征集合进行形象的描述。在此,可以直接将对应于所述事件特征信息的直方图输入到目标识别分类器中,进行后续的划分识别。在此,所定义的应用访问事件可以不局限于具体形态,任意形式定义的应用访问事件都可以很直观、并且很方便的通过所述图示信息显示出来。此外,基于所述图示信息、例如所述直方图的图形结构,对事件特征信息之间的差异性也可以进行更加直观形象的对比分析。例如,在后续通过所述机器聚类算法来对应用访问数据对应的访问者进行识别过程中,可以基于所述一定的聚类准则,例如,基于一定的距离算法,如确定所述访问者之间的欧式距离,通过所述算法运行后,会自动将多类用户按照既定的距离进行分类,此时,若是所述访问者对应的事件特征信息有相应的直方图信息,则可以直接基于所述访问者之间的直方图距离来对所述访问者进行分类。
图2示出根据本申请一个优选实施例的一种于处理应用访问数据的网络设备1的设备示意图。其中,所述网络设备1包括第七装置201、第八装置202、第一装置203和第二装置204。
其中,第七装置201获取目标应用对应的事件描述信息;第八装置202将所述事件描述信息提供至安装所述目标应用的对应用户设备;其中,所述第一装置203获取所述用户设备返回的关于所述目标应用的应用访问数据;其中,所述第二装置204基于所述事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息。
具体地,在此,所述第七装置201获取目标应用对应的事件描述信息。每一个目标应用对应于一个或多个应用访问事件的事件描述信息,所述事件描述信息包含对对应所述应用访问事件的具体描述。优选地,不同设备的同一目标应用对应于相同的一组应用访问事件的事件描述信息;不同设备或是同一设备上的相似应用也可以对应于相同一组或不同组的应用访问事件的事件描述信息。在此,优选地,所述事件描述信息可以直接由应用开发者根据各个不同应用的实际需要直接在所述网络设备1中设置。此外,进一步,所述事件描述信息还可以从其他可能的第三方设备或是数据库中获取,例如,基于用户对各种类型应用可能的访问操作,定义相应的应用访问事件,并设置对应的事件描述信息,并将该全部的应用访问时间和对应的事件描述信息预先存储在一个第三方设备中,基于不同的网络设备1各自对应的用户设备的目标应用的类型,不同的网络设备1可以直接在所述第三方设备中寻找与所述目标应用匹配的事件描述信息,若是有相匹配的事件描述信息则直接读取使用,若是没有可匹配的事件描述信息,则再进行相应事件描述信息的自定义。对于各个网络设备1自定义的事件描述信息,可以在定义后同步到所述第三方设备中,从而实现第三方设备中相应事件描述信息的实时更新、扩充。
接着,第八装置202将所述事件描述信息提供至安装所述目标应用的对应用户设备。
在本申请中,所述网络设备1获取的所述目标应用的应用访问数据可以是不加选择的将用户对应用的全部访问操作对应的访问相关信息都纳入进所述网络设备1获取的应用访问数据中;又如,还可以基于不同目标应用的特点有针对性的设置对应的应用访问数据的种类;再如,还可以基于应用访问数据处理后的实际应用场景有针对性地确定所述应用访问数据的种类。在此,优选地,在安装所述目标应用的对应用户设备中预先进行设置,从而直接获取需要实际需要进行后续处理的应用访问数据。在此,即可以通过将所述网络设备1获取的事件描述信息提供至所述目标应用对应的用户设备这一操作,从而使得,所述用户设备可以基于所述事件描述信息进行相应的有针对性的应用访问数据的采集。例如,若是目标应用只需要采集登陆、访问页面时长、点击控件次数这几个应用访问事件对应的应用访问数据,则所述用户设备基于获取的上述各个应用访问事件的事件描述信息即可以针对性的采集相应的应用访问数据,而对于该事件描述信息中没有定义的其他应用访问事件,在后续操作中,所述用户设备则不会在将其返回给网络设备1。在此,所述用户设备可以基于所述事件描述信息直接设置所述目标应用的应用访问数据的采集触发条件,从而采集到所述网络设备1需要的应用访问数据;所述用户设备还可以先不加选择的采集全部访问操作对应的访问相关信息,再基于所述访问相关信息进行筛选,从而确定所述网络设备1需要获取的应用访问数据。
接着,所述第一装置203获取所述用户设备返回的关于所述目标应用的应用访问数据。在此,优选地,基于所述网络设备1提供至所述目标应用对应的用户设备的事件描述信息,所述用户设备将确定相对应的应用访问数据。进而所述第一装置203从所述用户设备获取确定的该应用访问数据。接着,再次基于所述目标应用对应的事件描述信息,所述网络设备1的第二装置204对从所述用户设备返回的所述目标应用的应用访问数据,进行相应的处理,进而确定对应应用访问事件的事件特征信息。在此,所述第一装置203获取的目标应用的应用访问数据可以是直接由所述用户设备返回的,也可能由存储了所述应用访问数据的三方设备,如所述用户设备对应的同步设备、或是存储设备等发送来的。
在此,本申请通过将所述目标应用对应的事件描述信息预先提供至所述目标应用对应的用户设备,从而对从用户设备获取的应用访问数据进行了针对性筛选,使得所述网络设备1获取的应用访问数据即为后续数据处理需要的目标数据,相比与将用户对应用的全部访问操作对应的访问相关信息都纳入进所述网络设备1获取的应用访问数据,此优选操作,能够使得应用访问数据获取或采集的工作量大大简化,并提高了所述网络设备1在后续数据处理中的准确性和效率。
图3示出根据本申请一个优选实施例的一种用于处理应用访问数据的网络设备和用户设备的系统示意图。
其中,所述网络设备1包括第七装置301、第八装置302、第一装置303和第二装置304;所述用户设备2包括第九装置309、第十装置310、第十一装置311和第十二装置312。
具体地,第七装置301获取目标应用对应的事件描述信息;第八装置302将所述事件描述信息提供至安装所述目标应用的对应用户设备;其中,所述第一装置303获取所述用户设备返回的关于所述目标应用的应用访问数据;其中,所述第二装置304基于所述事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息。所述第九装置309获取对应网络设备提供的关于用户设备上的目标应用的事件描述信息;第十装置310基于所述事件描述信息设置关于所述目标应用的应用访问数据的采集触发条件;第十一装置311基于所述采集触发条件采集所述应用访问数据;第十二装置312将所述应用访问数据发送至所述网络设备。在此,图3中所述第七装置301、第八装置302、第一装置303和第二装置304与图2中所述第七装置201、第八装置202、第一装置203和第二装置204对应相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
具体地,所述用户设备2的第九装置309获取对应网络设备1提供的关于用户设备2上的目标应用的事件描述信息。所述事件描述信息与所述应用访问事件对应,所述事件描述信息包含对所述应用访问事件的具体描述,在此,优选地,所述事件描述信息可以包括所述应用访问事件的事件名称,对应用访问事件的内容描述信息,应用访问事件对应的运算信息,等等。在此,优选地,所述目标应用的事件描述信息可以直接从对应的网络设备1中获取,或者,在实际应用中,也可以从其他任意可能的服务器设备中获取。
接着,所述用户设备2的第十装置310基于所述事件描述信息设置关于所述目标应用的应用访问数据的采集触发条件。在此,优选地,通过采集用户访问操作对应的应用访问日志来获取目标应用的应用访问数据,所述采集触发条件可以基于事件描述信息确定,例如,设置当出现某应用访问事件对应的用户访问操作时,即确定为触发条件满足。进而通过日志埋点的方式预先在所述用户设备2对应的目标应用中进行设置。例如,可以将需要采集的应用访问事件的事件名称、内容描述信息借助log(日志)代码的形式进行手动埋点、或是在业务逻辑复杂时,进行自动化埋点。当用户实施了相应的访问操作,则确定满足所述采集触发条件。
接着,所述第十一装置311基于所述采集触发条件采集所述应用访问数据。在此,优选地,以拉取所述应用访问日志的形式采集所述应用访问数据。可以是基于所述采集触发条件,直接设置与所述事件描述信息对应的专门的应用访问日志;也可以基于所述采集触发条件,从包含了全部应用访问日志的日志文件中读取与所述事件描述信息匹配的相应部分的应用访问日志。
接着,所述第十二装置312将所述应用访问数据发送至所述网络设备。在此,优选地,发送至所述网络设备1中的所述应用访问数据是基于所述用户设备2中目标应用的事件描述信息设置的采集触发条件筛选过的用户的访问操作的相关信息。基于所述用户设备2返回的该应用访问数据,所述网络设备1将基于所述事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息。
在本申请中,本系统的网络设备1通过基于对应的事件描述信息,对所获取的用户设备中目标应用的应用访问数据进行处理,以确定所述目标应用的应用访问事件的事件特征信息,在此,基于所述自定义的事件描述信息,可以有针对性地对获取符合事件描述的应用访问数据,并对其进行统计分析,从而为后续的信息处理和应用提供有利的数据基础。与所述网络设备1相配合,所述用户设备2基于所述事件描述信息,预先在目标应用中设置应用访问数据的采集触发条件,从而可以通过有针对性的埋点,有效地获取应用访问数据,使得所述网络设备1获取的应用访问数据即为后续数据处理需要的目标数据,相比与将用户对应用的全部访问操作对应的访问相关信息都纳入进所述网络设备1获取的应用访问数据,此优选实施例,能够使得应用访问数据获取或采集的工作量大大简化,并提高了所述网络设备1在后续数据处理中的准确性和效率。
图4示出根据本申请另一个优选实施例的一种用户处理应用访问数据的网络设备1的设备示意图。其中所述网络设备1包括第一装置401、第二装置402和第四装置403。
其中,所述第一装置401获取关于对应用户设备中目标应用的应用访问数据;第二装置402基于对应的事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息;所述第四装置403基于所述事件特征信息识别所述应用访问数据对应的访问者。在此,图4中所述第一装置401和第二装置402与图1中所述第一装置101和第二装置102对应相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
具体地,所述第四装置403基于所述事件特征信息识别所述应用访问数据对应的访问者。在此,可以基于所述网络设备1确定的事件特征信息,对所述各个目标应用对应的用户基于各种维度进行划分。在此,所述一个用户设备中目标应用对应的事件特征信息,可以直接地反映该事件特征信息对应的访问者的行为特征。若是不同设备上的同一应用、或是同类应用的相同应用访问事件具有可比性,则可以通过同一应用、或同类应用访问事件对应的事件特征信息的差异或是相似程度的分析,进而对事件特征信息对应的应用访问事件进行相应的区分、识别。在此,以应用场景为识别所述目标应用的访问者是虚假用户、还是真实用户为例,例如,所述目标应用的虚假用户可能通过虚假刷机或是模拟器等方式完成用户激活,则可能存在很多统计特征上的问题,如,在特定维度上,虚假用户的事件特征信息的相似性概率极高,如,相比于真实用户,虚假用户每次访问设备的平均时长极短,大部分平均不足1秒,则基于该访问设备的平均时长对应的事件特征信息,可以对所述虚假用户进行一定程度上的识别,若是,在一段时间内,或是多段时间内,目标访问者对于目标应用的访问设备的平均时长这一事件特征信息基本不足1秒,若设置仅以此事件特征信息为所述真假访问者识别的标准,则可以推定该访问者为虚假用户。进一步,基于实际应用场景的需要,可以综合考虑多种事件特征信息作为划分识别的条件。在此,同一应用的不同的访问者可以是分别在不同设备上登录目标应用的不同用户,也可以是在同一设备上登录目标应用的不同用户。
在此,本领域技术人员应能理解所述以应用场景为识别所述目标应用的访问者是虚假用户、还是真实用户为例仅为举例,其他现有的或今后可能出现的其他可能应用场景,例如基于其他维度,如不限于访问者购买力、兴趣爱好等其他维度的访问者分类场景,如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在此,本申请基于所获取的应用访问事件的事件特征信息,结合相应的算法,可以灵活地实现各类具体应用场景下的信息分类识别。
优选地,所述第四装置403基于所述事件特征信息,通过分类算法对应用访问数据对应的访问者进行识别。
具体地,所述分类算法包括机器学习分类算法,即基于所述事件特征信息,借助机器学习训练,对应用访问数据对应的访问者进行分类识别。在此,所述机器学习分类算法包括基于所述事件特征信息进行相应的模型创建,进而基于创建的模型完成对所述访问者的划分识别。
在机器训练并建立所述模型的过程中,若是对于所述访问者的划分已有预期,例如,希望将在特定应用访问事件上表现较差的访问者判断为虚假概率高的用户,则可以优选所述机器学习分类算法来对应用访问数据对应的访问者进行识别,此时,可以通过自定义相应规则来进行数据标注训练,从而产生可以作为访问者识别标准的模型。所述机器学习分类算法可以包括但不限于逻辑回归算法、随机森林算法等算法。以逻辑回归算法为例,对所述访问者的识别过程如下:假设在训练完成后产生一个模型M,其中,M的输出结果标注为两类U和V,在汇总了一个目标应用对应的用户设备一天的应用访问日志后,所述网络设备1基于对所述应用访问日志对应的应用访问数据进行处理,确定得到所述目标应用访问者的应用访问事件的事件特征信息F,将所述事件特征信息F输入到所述模型M中,基于所述模型M可以得出所述事件特征信息F属于U或是V的结论。此外,还可以计算所述事件特征信息F隶属于上述各个分类的相应概率,从而,基于生产的隶属概率P的大小来判断所述事件特征信息F属于U或是V。在此,所述模型对应的分类不限于所述两类,而是可以基于实际的应用场景的需要任意增减、变换相应分类,例如,可以以离散的或是连续的值对应不同的识别划分,如基于隶属概率的数值进行连续划分对于各类别划分结果等。
此外,在通过机器学习处理对应访问数据对应的访问者进行识别之前,优选地,对所述事件特征信息进行归一化处理,所述归一化处理包括分别在不同维度内部进行归一化处理,即同一类应用访问事件之间才具有可比性,对于同一类应用访问事件对应的时间特征信息进行归一化处理。
更优选地,所述第四装置基于所述事件特征信息,通过聚类算法对应用访问数据对应的访问者进行识别。
具体地,所述聚类算法包括机器学习聚类算法,即基于所述事件特征信息,借助机器学习训练,对应用访问数据对应的访问者进行聚类识别。在此,所述机器学习聚类算法包括基于所述事件特征信息进行相应的模型创建,进而基于创建的模型完成对所述访问者的划分识别。
在此,若是对于所述访问者的划分没有预先定义,则还可以优选所述机器聚类算法来对应用访问数据对应的访问者进行识别,此时,不需要自定义规则和进行标准训练,而是只要基于所述一定的聚类准则,例如基于一定的距离算法,如确定所述访问者之间的欧式距离,通过所述算法运行后,会自动将多类用户按照既定的距离进行分类。例如,假设在训练完成后产生一个模型N,其中,定义N的聚类数为2,如设定聚类K和J,同时对应着着所述类K和J的中心NK和NJ,所述中心NK和NJ的数据形态可以理解为体现了聚类类别的标准性特征,进而在汇总了一个目标应用对应的用户设备一天的应用访问日志后,所述网络设备1基于对所述应用访问日志对应的应用访问数据进行处理,确定得到所述目标应用访问者的应用访问事件的事件特征信息E,将所述事件特征信息E输入到所述模型N中,基于所述模型N可以分别计算出事件特征信息E到两类数据中心NK和NJ的距离,对应为距离值LK和LJ,进而基于所述E对应的距离值LK和LJ的区别来判断所述相应访问者的划分,例如,距离值LK相比于LJ更小,即所述事件特征信息与类K表现出的特征更接近,则说明所述事件特征信息对应的访问者隶属于K类的概率更大,反之则隶属于J类更大。在此,所述模型对应的聚类数不限于所述两类,而是可以基于实际的应用场景的需要任意增减、变换相应的聚类。
此外,在通过聚类算法对应访问数据对应的访问者进行识别之前,优选地,对所述事件特征信息进行归一化处理,所述归一化处理包括分别在不同维度内部进行归一化处理,即同一类应用访问事件之间才具有可比性,对于同一类应用访问事件对应的时间特征信息进行归一化处理。
优选地,所述网络设备1还包括第五装置(未示出),所述第五装置基于预置的访问者可信度指标,并结合所述访问者对应的识别结果,确定所述访问者的可信度信息。
具体地,基于所述机器学习处理能够确定的实际上是所述访问者类别划分的可能性。例如,在通过所述机器学习分类算法来对应用访问数据对应的访问者进行识别中,可以基于所述事件特征信息对应的隶属概率大小来判断所述事件特征信息的归属。又如,在在通过所述机器学习聚类分类算法来对应用访问数据对应的访问者进行识别中,可以基于所述事件特征信息与各个聚类中心的距离值区别来判断所述事件特征信息的归属。在此,对于上述事件特征信息对应的隶属概率、或是所述事件特征信息与各个聚类中心的距离值区别,都是可以基于实际需要自定义的。当设置不同时,会直接对所述事件特征信息的类别归属产生影响,例如,同一个事件特征信息,在隶属概率设置为P1时,该事件特征信息对应的应用访问事件的访问者可能判定为真实用户,但是若是隶属概率设置为P2,则有可能将该同一个访问者判定为虚假用户。在此,当选择适合的机器学习算法,并建立了相应的模型后,可以基于实际需要预先设置访问者可信度指标,以基于所述机器学习分类算法来对应用访问数据对应的访问者进行识别为例,所述可信度指标可以包括基于隶属概率的分级指标,例如,设置隶属于真实用户对应的隶属概率P,其中0≤P≤1,可以设置当80%≤P≤100%时,判定为真实用户;设置当0≤P<50%时,判定为虚假用户;设置当50%≤P<80%时,可以暂定为疑似虚假用户,等待进一步检验。进而,结合所述访问者对应的识别结果,例如,某个访问者G对应的隶属概率P为90%,则认定该问者的可信度信息为真实用户。又如,若是P为60%,则认定该问者的可信度信息为疑似虚假用户,可以进行进一步的分析判断,如基于其他类型的应用访问事件对应的事件特征信息的分析再次判断。
在此,本领域技术人员应能理解所述可信度指标可以包括基于隶属概率的分级指标仅为举例,其他现有的或今后可能出现的其他形式的可信度指标如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在此,本领域技术人员应能理解所述可信度信息的具体内容仅为举例,其他现有的或今后可能出现的其他形式的可信度信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在此,本申请基于应用访问者的识别结果,并结合预置的访问者可信度指标,可以确定访问者的可信度信息,从而能够更实际地反映应用内用户的真实可信信息,从而更好的维护、改进和完善目标应用的应用效果。
优选地,所述网络设备1还包括第六装置(未示出),所述第六装置基于所述访问者的可信度信息,对所述目标应用进行访问控制。
具体地,在实际应用中,基于认定的所述访问者的可信度信息,可以对所述用户设备上的目标应用进行相应的访问控制,例如,对于认定不是真实用户的访问者,可以采取发送警告,发送身份验证信息,限制访问权限、封锁用户账号等多种形式的访问控制。在此,优选地,所述访问控制还可以基于不同的可信度信息而有所不同,例如,对于确定为虚假用户的访问账号,可以直接封锁账号;而对于确定为疑似虚假用户的访问者,可以通过发送身份验证信息,限制部分访问权限等方式对所述访问者进行有限限制,并基于进一步的识别,或结合所述访问者的补救措施,再次对所述目标应用进行限制消除,或是加深访问控制等后续操作。
在实际应用中,所述应用的访问者是真实用户还是虚假用户,对于应用服务范围的评估、服务推广、广告赞助的获得等方面都有直接的影响,所以对于识别出的虚假用户,要进行相应的访问控制和处理,从而更好的维护、改进和完善目标应用的应用效果。
图5示出根据本申请再一个方面的一种在网络设备端用于处理应用访问数据的方法示意图;
其中,在步骤S501中,所述网络设备1获取关于对应用户设备中目标应用的应用访问数据;在步骤S502中,所述网络设备1基于对应的事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息。
具体地,在步骤S501中,所述网络设备1获取关于对应用户设备中目标应用的应用访问数据。在此,所述用户设备包括但不限于各种类型的PC、移动电话、平板电脑、以及其他各种可以装载对应目标应用的终端设备。所述目标应用包括但不限于与各种终端设备相对应的应用类型。在此,所述目标应用与所述用户设备相对应,以所述终端设备是移动终端,如移动电话、平板电脑等为例,所述目标应用可以是基于苹果iOS系统的ipa,pxl,deb等格式的应用,也可以是基于安卓系统的apk格式的应用,还可以是基于微软windowsphone系统的xap格式的应用,等等。在此,所述应用访问数据包括基于用户在所述终端设备的所述目标应用中进行的访问操作所确定的访问相关信息。例如,所述访问操作包括用户点击进入应用的某一页面、用户点击应用的某一控件等,基于所述访问操作,所述访问数据包括用户访问应用的页面信息、用户在该页面停留的时间、用户点击应用中相应控件的次数、用户在一定时间内访问所述应用消耗的流量信息,等等。在此,所述网络设备1获取的访问数据的具体种类可以基于实际需要进行设置。例如,可以不加选择的将用户对应用的全部访问操作对应的访问相关信息都纳入进所述网络设备1获取的应用访问数据中;又如,还可以基于不同目标应用的特点有针对性的设置对应的应用访问数据的种类和内容;再如,还可以基于应用访问数据处理后的实际应用场景有针对性地确定所述应用访问数据的种类和内容。
在此,所述应用访问数据的获取可以是周期性获取,或是根据实际应用场景设定其他的获取条件。此外,所述应用访问数据可以直接从所述目标应用对应的用户设备中获取。例如,可以通过读取目标应用对应的应用访问日志来获取所述应用访问数据。此外,所述应用访问数据还可以从与所述目标应用所述在用户设备相对应的第三方设备中获取所述应用访问数据,所述第三方设备包括能够获取、存储所述应用访问数据的设备,如所述用户设备对应的同步设备、或是存储设备等。
接着,在步骤S502中,所述网络设备1基于对应的事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息。
具体地,所述网络设备1获取的所述应用访问数据包括基于用户在所述终端设备的所述目标应用中进行的访问操作所确定的访问相关信息。在此,基于用户对应用的访问操作定义了相应的应用访问事件,例如,用户点击登录键登录应用,则可以定义相应的应用访问事件为登录。在此,一个访问操作可能对应一个或多个应用访问事件,例如,用户点击进入一个页面,可以同时对应登录页面信息和登录页面次数两个应用访问事件。应用访问事件的定义可以基于实际应用的运行特征、或是基于对该目标应用的应用访问数据处理后的实际应用场景的需要进行设置。在此,所述事件描述信息与所述应用访问事件对应,所述事件描述信息包含对所述应用访问事件的具体描述,在此,优选地,所述事件描述信息可以包括所述应用访问事件的事件名称,对应用访问事件的内容描述信息,应用访问事件对应的处理信息,等等。例如,所述应用访问事件的事件名称可以为任意能够唯一确定该事件的字符串;又如,所述应用访问事件的描述内容可以为任意字符串,其目的是帮助分辨事件的具体内容;再如,所述应用访问事件的处理信息可以包括运算信息,目的是对所述应用访问事件进行特征量化,如,可以是事件内容的数量运算、求和运算、求平均值运算等等。以所述用户点击登录键登录应用这一操作为例,可以定义所述应用访问事件的时间名称为A1,所述应用访问事件的描述内容为登录;所述应用访问事件的处理信息为设置算子count,在此,所述算子count即对应于登录次数计算。
其中,所述目标应用对应的事件描述信息可以由所述网络设备1从任意可能的服务器设备中获取,在此,优选地,所述目标应用对应的事件描述信息还可以由应用开发者根据实际需要直接在所述网络设备1中设置,进一步,可以针对每一个目标应用分别设置对应的若干个应用访问事件,并设置对应的事件描述信息。在此,不同目标应用,或是不同种类的目标应用可以对应不同、或是相同的应用访问事件、或是事件描述信息的设置。
在此,所述网络设备1基于所述事件描述信息对所述应用访问数据进行处理可以包括将所获得的应用访问数据与相应的事件描述信息进行匹配,若是匹配成功,则基于事件描述信息中预先设置的应用访问事件对应的计算或是统计分析方式确定相应的事件特征信息。可以基于所述应用访问数据的不同形式内容,对所述应用访问数据做不同的处理。例如,当所述应用访问数据为来自所述目标应用所在用户设备的应用访问日志时,假设读取了一行日志,则可以先基于预设的分隔符对该行日志对应的字符串进行分解,获得相应字符子串,再基于所述字符子串,与该目标应用对应的所述事件描述信息进行匹配。如果所述匹配成功,则基于所述事件描述信息中对应的具体描述信息,如所述应用访问事件的运算信息,对所述应用访问数据进行相应计算或统计,从而确定所获得的该应用访问数据对应的目标应用的应用访问事件的事件特征信息,并进一步,对所述事件特征信息进行特定的归类统计,如,设置以用户设备为主键的数据库,并将所述事件特征信息存入该数据库,进一步,基于后续所述时间特征信息的确定更新所述数据库信息。如果所述匹配不成功,则所述应用访问数据对应的可能是未定义的应用访问事件,则忽略不做处理。
在此,本申请的网络设备1通过基于对应的事件描述信息,对所获取的用户设备中目标应用的应用访问数据进行处理,以确定所述目标应用的应用访问事件的事件特征信息。事件特征信息可以反映一个用户设备中目标应用在相应访问操作中的相关情况,对一个目标应用一个事件特征信息分析、或是若干个事件特征信息的综合分析,可以为后续的信息处理和应用提供有利的数据基础。例如,若是不同设备上的同一应用、或是同类应用的相同应用访问事件具有可比性,则可以通过同一应用、或同类应用访问事件对应的事件特征信息的差异或是相似程度的分析,进而对事件特征信息对应的应用访问事件进行相应的区分、识别。
优选地,所述步骤S502包括子步骤S5021(未示出)和子步骤S5022(未示出),其中,在子步骤S5021中,所述网络设备1基于所述事件描述信息对所述应用访问数据进行日志分析,以获得关于所述目标应用的一个或多个应用访问事件;在子步骤S5022中,所述网络设备1对所述一个或多个应用访问事件进行统计处理以获得对应的事件特征信息。
具体地,在子步骤S5021中,所述网络设备1基于所述事件描述信息对所述应用访问数据进行日志分析,以获得关于所述目标应用的一个或多个应用访问事件。在此,本申请中,所述网络设备1获取的应用访问数据可以有多种形式内容,不同形式的应用访问数据会对应不同的数据处理。在此,优选地,基于所述目标应用所对应的用户设备设置的日志统计服务,获取所述应用访问数据对应的应用访问日志,进而基于对所述应用访问日志进行日志分析来确定所述目标应用对应的应用访问事件。应用访问日志本身对应的是非结果化的文本文件,但其中包含着可以结构化出来的信息。所述日志分析包括:首先对所述应用访问日志进行逐行分解,然后基于该分解的结果,并结合所述事件描述信息,确定所述目标应用对应的应用访问事件。具体地,不同格式的应用访问日志需要对应于不同的日志解析规则,基于已有或是自定义的日志解析规则对所述应用访问日志进行相应解析。例如,逐行读取获得的应用访问日志,优选地,每一行日志对应于一个应用访问事件,若是有多个访问操作信息,可以以多条日志的形式分别记录。进而,按照预先定义好的分隔符对所述应用访问日志进行字符串分解,分解后的各个字符子串可能分别对应于相应的的应用访问事件,也可能若干个字符子串的内容共同对应于一个应用访问事件,再将该应用访问事件与所述目标应用对应的事件描述信息中定义的应用访问事件进行对照,从而记录下该应用访问日志中需要留用的应用访问事件。所述字符子串对应的应用访问事件与所述目标应用对应的事件描述信息中定义的应用访问事件进行对照,可以是基于相同或相似的事件描述信息而进行,在此,优选地,所述网络设备1获取的应用访问日志与应用访问事件对应的事件描述信息中定义的应用访问事件,基于自定义的事件名称进行匹配,例如,某应用访问事件的事件名称对应于唯一的字符串B1。所述应用访问日志中事件名称等相关信息可以是在用户设备采集应用访问数据之前就设置在预定格式中的。例如,所述用户设备基于从所述网络设备1获取的所述目标应用的事件描述信息进行采集埋点,进而,在采集应用访问数据时,对应的应用访问日志信息中每一个应用访问事件都对应记录一个唯一的事件名称。从而,基于所述事件名称信息,可以确定所述应用访问数据中有哪些目标应用对应设置的应用访问事件。
接着,在子步骤S5022中,所述网络设备1对所述一个或多个应用访问事件进行统计处理以获得对应的事件特征信息。
具体地,当基于所述目标应用的应用访问数据确定了若干个应用访问事件后,基于该应用访问事件对应的事件描述信息,可以对所述应用访问事件进行计算、统计处理。具体统计处理方法取决于所述事件描述信息的设置。所述事件特征信息,即对应于基于所述事件描述信息对所述应用访问事件进行处理的结果,优选地,所述事件特征信息还可以包括对若干个同一应用访问事件的处理结果的统计结果。例如,若是所述事件描述信息包括对所述应用访问事件进行定性判断,则基于所述定性判断的信息,确定该应用访问事件的性质,进而以此作为该应用访问事件的事件特征信息。又如,若是所述事件描述信息包括对所述应用访问事件进行定量分析,如,对所述应用访问事件的内容进行不限于数量运算、求和运算、求平均值运算等类别的运算,则基于相应的运算信息对所述应用访问事件进行特征量化,从而将各个应用访问事件的量化结果确定为事件特征信息。
更优选地,在所述方法中,所述事件描述信息包括对应事件的运算符信息,其中,其中,所述第二单元基于所述应用访问事件所对应的所述运算符信息,对所述一个或多个应用访问事件进行统计处理以获得对应的事件特征信息。
具体地,所述运算符信息包括不限于数量运算、求和运算、求平均值运算等类别的运算,如,分别对应于算子count、sum、avg等。例如,假设目标应用存在于设备a1上,基于该设备a1上目标应用的事件描述信息,确定对应一个应用访问事件C1,内容描述为访问页面x,对应的运算符信息为count,则基于该事件描述信息,对获取的应用访问日志进行解析后,得到的该对应事件的事件特征信息可能是:应用访问事件C1:n,在此,n可以为一定事件内用户访问页面x的次数。在此,对于量化的所述事件特征信息,不同应用访问事件可以对应不同的量化单位。此外,具体应用中,还可以在事件描述信息中自定义所述事件特征信息时间维度,例如默认按天统计,可以在应用访问日志中包含日志时间,并在所述日志解析过程中加入特定的代码逻辑来定义时间,以满足实际需要。
优选地,所述在网络设备端用于处理应用访问数据的方法还包括步骤S503(未示出),在所述步骤S503中,所述网络设备1基于所述事件特征信息生成对应的图示信息,并显示所述图示信息。
具体地,在此,所述图示信息包括但不限于直方图、饼图等各种类型的图形描述信息。以所述直方图为例,在通用算法领域,直方图可以用作为对各类特征集合进行形象的描述。在此,可以直接将对应于所述事件特征信息的直方图输入到目标识别分类器中,进行后续的划分识别。在此,所定义的应用访问事件可以不局限于具体形态,任意形式定义的应用访问事件都可以很直观、并且很方便的通过所述图示信息显示出来。此外,基于所述图示信息、例如所述直方图的图形结构,对事件特征信息之间的差异性也可以进行更加直观形象的对比分析。例如,在通过所述机器聚类算法来对应用访问数据对应的访问者进行识别过程中,可以基于所述一定的聚类准则,例如,基于一定的距离算法,如确定所述访问者之间的欧式距离,通过所述算法运行后,会自动将多类用户按照既定的距离进行分类,此时,若是所述访问者对应的事件特征信息有相应的直方图信息,则可以直接基于所述访问者之间的直方图距离来对所述访问者进行分类。
图6示出根据本申请一个优选实施例的一种在网络设备端用于处理应用访问数据的方法示意图。
其中,在步骤S601中,所述网络设备1获取目标应用对应的事件描述信息;在步骤S602中,所述网络设备1将所述事件描述信息提供至安装所述目标应用的对应用户设备;其中,在步骤S603中,所述网络设备1获取所述用户设备返回的关于所述目标应用的应用访问数据;其中,在步骤S604中,所述网络设备1基于所述事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息。
具体地,在此,在步骤S601中,所述网络设备1获取目标应用对应的事件描述信息。每一个目标应用对应于一个或多个应用访问事件的事件描述信息,所述事件描述信息包含对对应所述应用访问事件的具体描述。优选地,不同设备的同一目标应用对应于相同的一组应用访问事件的事件描述信息;不同设备或是同一设备上的相似应用也可以对应于相同一组或不同组的应用访问事件的事件描述信息。在此,优选地,所述事件描述信息可以直接由应用开发者根据各个不同应用的实际需要直接在所述网络设备1中设置。此外,进一步,所述事件描述信息还可以从其他可能的第三方设备或是数据库中获取,例如,基于用户对各种类型应用可能的访问操作,定义相应的应用访问事件,并设置对应的事件描述信息,并将该全部的应用访问时间和对应的事件描述信息预先存储在一个第三方设备中,基于不同的网络设备1各自对应的用户设备的目标应用的类型,不同的网络设备1可以直接在所述第三方设备中寻找与所述目标应用匹配的事件描述信息,若是有相匹配的事件描述信息则直接读取使用,若是没有可匹配的事件描述信息,则再进行相应事件描述信息的自定义。对于各个网络设备1自定义的事件描述信息,可以在定义后同步到所述第三方设备中,从而实现第三方设备中相应事件描述信息的实时更新、扩充。
接着,在步骤S602中,所述网络设备1将所述事件描述信息提供至安装所述目标应用的对应用户设备。
在本申请中,所述网络设备1获取的所述目标应用的应用访问数据可以是不加选择的将用户对应用的全部访问操作对应的访问相关信息都纳入进所述网络设备1获取的应用访问数据中;又如,还可以基于不同目标应用的特点有针对性的设置对应的应用访问数据的种类;再如,还可以基于应用访问数据处理后的实际应用场景有针对性地确定所述应用访问数据的种类。在此,优选地,在安装所述目标应用的对应用户设备中预先进行设置,从而直接获取需要实际需要进行后续处理的应用访问数据。在此,即可以通过将所述网络设备1获取的事件描述信息提供至所述目标应用对应的用户设备这一操作,从而使得,所述用户设备可以基于所述事件描述信息进行相应的有针对性的应用访问数据的采集。例如,若是目标应用只需要采集登陆、访问页面时长、点击控件次数这几个应用访问事件对应的应用访问数据,则所述用户设备基于获取的上述各个应用访问事件的事件描述信息即可以针对性的采集相应的应用访问数据,而对于该事件描述信息中没有定义的其他应用访问事件,在后续操作中,所述用户设备则不会在将其返回给网络设备1。在此,所述用户设备可以基于所述事件描述信息直接设置所述目标应用的应用访问数据的采集触发条件,从而采集到所述网络设备1需要的应用访问数据;所述用户设备还可以先不加选择的采集全部访问操作对应的访问相关信息,再基于所述访问相关信息进行筛选,从而确定所述网络设备1需要获取的应用访问数据。
接着,在步骤S603中,所述网络设备1获取所述用户设备返回的关于所述目标应用的应用访问数据。在此,优选地,基于所述网络设备1提供至所述目标应用对应的用户设备的事件描述信息,所述用户设备将确定相对应的应用访问数据。进而,所述网络设备1从所述用户设备获取确定的该应用访问数据。接着,在步骤S604中,再次基于所述目标应用对应的事件描述信息,所述网络设备1对从所述用户设备返回的所述目标应用的应用访问数据,进行相应的处理,进而确定对应应用访问事件的事件特征信息。在此,所述网络设备1获取的目标应用的应用访问数据可以是直接由所述用户设备返回的,也可能由存储了所述应用访问数据的三方设备,如所述用户设备对应的同步设备、或是存储设备等发送来的。
在此,本申请通过将所述目标应用对应的事件描述信息预先提供至所述目标应用对应的用户设备,从而对从用户设备获取的应用访问数据进行了针对性筛选,使得所述网络设备1获取的应用访问数据即为后续数据处理需要的目标数据,相比与将用户对应用的全部访问操作对应的访问相关信息都纳入进所述网络设备1获取的应用访问数据,此优选操作,能够使得应用访问数据获取或采集的工作量大大简化,并提高了所述网络设备1在后续数据处理中的准确性和效率。
图7示出根据本申请一个优选实施例的一种用于处理应用访问数据的方法示意图。
其中,在步骤S701中,所述网络设备1获取目标应用对应的事件描述信息;在步骤S703中,所述网络设备1将所述事件描述信息提供至安装所述目标应用的对应用户设备;在步骤S702中,所述用户设备2基于所述事件描述信息设置关于所述目标应用的应用访问数据的采集触发条件;在步骤S704中,所述用户设备2基于所述采集触发条件采集所述应用访问数据;在步骤S705中,所述网络设备1获取所述用户设备返回的关于所述目标应用的应用访问数据;在步骤S707中,所述网络设备1基于所述事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息。在此,图7中所述步骤S701、步骤S703、步骤S705、步骤S707与图6中所述步骤S601、步骤S602、步骤S603、步骤S604分别对应相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
具体地,在步骤S702中,所述用户设备2基于所述事件描述信息设置关于所述目标应用的应用访问数据的采集触发条件。所述事件描述信息与所述应用访问事件对应,所述事件描述信息包含对所述应用访问事件的具体描述,在此,优选地,所述事件描述信息可以包括所述应用访问事件的事件名称,对应用访问事件的内容描述信息,应用访问事件对应的运算信息,等等。在此,优选地,所述目标应用的事件描述信息可以直接从对应的网络设备1中获取。此外,在实际应用中,也可以从其他任意可能的服务器设备中获取。在此,优选地,通过采集用户访问操作对应的应用访问日志来获取目标应用的应用访问数据,所述采集触发条件可以基于事件描述信息确定,例如,设置当出现某应用访问事件对应的用户访问操作时,即确定为触发条件满足。进而通过日志埋点的方式预先在所述用户设备2对应的目标应用中进行设置。例如,可以将需要采集的应用访问事件的事件名称、内容描述信息借助log(日志)代码的形式进行手动埋点、或是在业务逻辑复杂时,进行自动化埋点。当用户实施了相应的访问操作,则确定满足所述采集触发条件。
接着,在步骤S704中,所述用户设备2基于所述采集触发条件采集所述应用访问数据。在此,优选地,以拉取所述应用访问日志的形式采集所述应用访问数据。可以是基于所述采集触发条件,直接设置与所述事件描述信息对应的专门的应用访问日志;也可以基于所述采集触发条件,从包含了全部应用访问日志的日志文件中读取与所述事件描述信息匹配的相应部分的应用访问日志。
在本申请中,本系统的网络设备1通过基于对应的事件描述信息,对所获取的用户设备中目标应用的应用访问数据进行处理,以确定所述目标应用的应用访问事件的事件特征信息,在此,基于所述自定义的事件描述信息,可以有针对性地对获取符合事件描述的应用访问数据,并对其进行统计分析,从而为后续的信息处理和应用提供有利的数据基础。与所述网络设备1相配合,所述用户设备2基于所述事件描述信息,预先在目标应用中设置应用访问数据的采集触发条件,从而可以通过有针对性的埋点,有效地获取应用访问数据,使得所述网络设备1获取的应用访问数据即为后续数据处理需要的目标数据,相比与将用户对应用的全部访问操作对应的访问相关信息都纳入进所述网络设备1获取的应用访问数据,此优选实施例,能够使得应用访问数据获取或采集的工作量大大简化,并提高了所述网络设备1在后续数据处理中的准确性和效率。
图8示出根据本申请另一个优选实施例的一种在网络设备端用于处理应用访问数据的方法示意图。
其中,在步骤S801中,所述网络设备1获取关于对应用户设备中目标应用的应用访问数据;在步骤S802中,所述网络设备1基于对应的事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息;在步骤S803中,所述网络设备1基于所述事件特征信息识别所述应用访问数据对应的访问者。在此,图8中所述步骤S801和步骤S802与图5中所述步骤S501和步骤S502对应相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
具体地,在步骤S803中,所述网络设备1基于所述事件特征信息识别所述应用访问数据对应的访问者。在此,可以基于所述网络设备1确定的事件特征信息,对所述各个目标应用对应的用户基于各种维度进行划分。在此,所述一个用户设备中目标应用对应的事件特征信息,可以直接地反映该事件特征信息对应的访问者的行为特征。若是不同设备上的同一应用、或是同类应用的相同应用访问事件具有可比性,则可以通过同一应用、或同类应用访问事件对应的事件特征信息的差异或是相似程度的分析,进而对事件特征信息对应的应用访问事件进行相应的区分、识别。在此,以应用场景为识别所述目标应用的访问者是虚假用户、还是真实用户为例,例如,所述目标应用的虚假用户可能通过虚假刷机或是模拟器等方式完成用户激活,则可能存在很多统计特征上的问题,如,在特定维度上,虚假用户的事件特征信息的相似性概率极高,如,相比于真实用户,虚假用户每次访问设备的平均时长极短,大部分平均不足1秒,则基于该访问设备的平均时长对应的事件特征信息,可以对所述虚假用户进行一定程度上的识别,若是,在一段时间内,或是多段时间内,目标访问者对于目标应用的访问设备的平均时长这一事件特征信息基本不足1秒,若设置仅以此事件特征信息为所述真假访问者识别的标准,则可以推定该访问者为虚假用户。进一步,基于实际应用场景的需要,可以综合考虑多种事件特征信息作为划分识别的条件。在此,同一应用的不同的访问者可以是分别在不同设备上登录目标应用的不同用户,也可以是在同一设备上登录目标应用的不同用户。
在此,本领域技术人员应能理解所述以应用场景为识别所述目标应用的访问者是虚假用户、还是真实用户为例仅为举例,其他现有的或今后可能出现的其他可能应用场景,例如基于其他维度,如不限于访问者购买力、兴趣爱好等其他维度的访问者分类场景,如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在此,本申请基于所获取的应用访问事件的事件特征信息,结合相应的算法,可以灵活地实现各类具体应用场景下的信息分类识别。
优选地,在步骤S803中,所述网络设备1基于所述事件特征信息,通过分类算法对应用访问数据对应的访问者进行识别。
具体地,所述分类算法包括机器学习分类算法,即基于所述事件特征信息,借助机器学习训练,对应用访问数据对应的访问者进行分类识别。在此,所述机器学习分类算法包括基于所述事件特征信息进行相应的模型创建,进而基于创建的模型完成对所述访问者的划分识别。
在机器训练并建立所述模型的过程中,若是对于所述访问者的划分已有预期,例如,希望将在特定应用访问事件上表现较差的访问者判断为虚假概率高的用户,则可以优选所述机器学习分类算法来对应用访问数据对应的访问者进行识别,此时,可以通过自定义相应规则来进行数据标注训练,从而产生可以作为访问者识别标准的模型。所述机器学习分类算法可以包括但不限于逻辑回归算法、随机森林算法等算法。以逻辑回归算法为例,对所述访问者的识别过程如下:假设在训练完成后产生一个模型M,其中,M的输出结果标注为两类U和V,在汇总了一个目标应用对应的用户设备一天的应用访问日志后,所述网络设备1基于对所述应用访问日志对应的应用访问数据进行处理,确定得到所述目标应用访问者的应用访问事件的事件特征信息F,将所述事件特征信息F输入到所述模型M中,基于所述模型M可以得出所述事件特征信息F属于U或是V的结论。此外,还可以计算所述事件特征信息F隶属于上述各个分类的相应概率,从而,基于生产的隶属概率P的大小来判断所述事件特征信息F属于U或是V。在此,所述模型对应的分类不限于所述两类,而是可以基于实际的应用场景的需要任意增减、变换相应分类,例如,可以以离散的或是连续的值对应不同的识别划分,如基于隶属概率的数值进行连续划分对于各类别划分结果等。
此外,在通过机器学习处理对应访问数据对应的访问者进行识别之前,优选地,对所述事件特征信息进行归一化处理,所述归一化处理包括分别在不同维度内部进行归一化处理,即同一类应用访问事件之间才具有可比性,对于同一类应用访问事件对应的时间特征信息进行归一化处理。
更优选地,在步骤S803中,所述网络设备1基于所述事件特征信息,通过聚类算法对应用访问数据对应的访问者进行识别。
具体地,所述聚类算法包括机器学习聚类算法,即基于所述事件特征信息,借助机器学习训练,对应用访问数据对应的访问者进行聚类识别。在此,所述机器学习聚类算法包括基于所述事件特征信息进行相应的模型创建,进而基于创建的模型完成对所述访问者的划分识别。
在此,若是对于所述访问者的划分没有预先定义,则还可以优选所述机器聚类算法来对应用访问数据对应的访问者进行识别,此时,不需要自定义规则和进行标准训练,而是只要基于所述一定的聚类准则,例如基于一定的距离算法,如确定所述访问者之间的欧式距离,通过所述算法运行后,会自动将多类用户按照既定的距离进行分类。例如,假设在训练完成后产生一个模型N,其中,定义N的聚类数为2,如设定聚类K和J,同时对应着着所述类K和J的中心NK和NJ,所述中心NK和NJ的数据形态可以理解为体现了聚类类别的标准性特征,进而在汇总了一个目标应用对应的用户设备一天的应用访问日志后,所述网络设备1基于对所述应用访问日志对应的应用访问数据进行处理,确定得到所述目标应用访问者的应用访问事件的事件特征信息E,将所述事件特征信息E输入到所述模型N中,基于所述模型N可以分别计算出事件特征信息E到两类数据中心NK和NJ的距离,对应为距离值LK和LJ,进而基于所述E对应的距离值LK和LJ的区别来判断所述相应访问者的划分,例如,距离值LK相比于LJ更小,即所述事件特征信息与类K表现出的特征更接近,则说明所述事件特征信息对应的访问者隶属于K类的概率更大,反之则隶属于J类更大。在此,所述模型对应的聚类数不限于所述两类,而是可以基于实际的应用场景的需要任意增减、变换相应的聚类。
此外,在通过聚类算法对应访问数据对应的访问者进行识别之前,优选地,对所述事件特征信息进行归一化处理,所述归一化处理包括分别在不同维度内部进行归一化处理,即同一类应用访问事件之间才具有可比性,对于同一类应用访问事件对应的时间特征信息进行归一化处理。
优选地,所述在网络设备端用于处理应用访问数据的方法还包括步骤S804(未示出),在步骤S804中,所述网络设备1基于预置的访问者可信度指标,并结合所述访问者对应的识别结果,确定所述访问者的可信度信息。
具体地,基于所述机器学习处理能够确定的实际上是所述访问者类别划分的可能性。例如,在通过所述机器学习分类算法来对应用访问数据对应的访问者进行识别中,可以基于所述事件特征信息对应的隶属概率大小来判断所述事件特征信息的归属。又如,在在通过所述机器学习聚类分类算法来对应用访问数据对应的访问者进行识别中,可以基于所述事件特征信息与各个聚类中心的距离值区别来判断所述事件特征信息的归属。在此,对于上述事件特征信息对应的隶属概率、或是所述事件特征信息与各个聚类中心的距离值区别,都是可以基于实际需要自定义的。当设置不同时,会直接对所述事件特征信息的类别归属产生影响,例如,同一个事件特征信息,在隶属概率设置为P1时,该事件特征信息对应的应用访问事件的访问者可能判定为真实用户,但是若是隶属概率设置为P2,则有可能将该同一个访问者判定为虚假用户。在此,当选择适合的机器学习算法,并建立了相应的模型后,可以基于实际需要预先设置访问者可信度指标,以基于所述机器学习分类算法来对应用访问数据对应的访问者进行识别为例,所述可信度指标可以包括基于隶属概率的分级指标,例如,设置隶属于真实用户对应的隶属概率P,其中0≤P≤1,可以设置当80%≤P≤100%时,判定为真实用户;设置当0≤P<50%时,判定为虚假用户;设置当50%≤P<80%时,可以暂定为疑似虚假用户,等待进一步检验。进而,结合所述访问者对应的识别结果,例如,某个访问者G对应的隶属概率P为90%,则认定该问者的可信度信息为真实用户。又如,若是P为60%,则认定该问者的可信度信息为疑似虚假用户,可以进行进一步的分析判断,如基于其他类型的应用访问事件对应的事件特征信息的分析再次判断。
在此,本领域技术人员应能理解所述可信度指标可以包括基于隶属概率的分级指标仅为举例,其他现有的或今后可能出现的其他形式的可信度指标如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在此,本领域技术人员应能理解所述可信度信息的具体内容仅为举例,其他现有的或今后可能出现的其他形式的可信度信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在此,本申请基于应用访问者的识别结果,并结合预置的访问者可信度指标,可以确定访问者的可信度信息,从而能够更实际地反映应用内用户的真实可信信息,从而更好的维护、改进和完善目标应用的应用效果。
优选地,所述在网络设备端用于处理应用访问数据的方法还包括步骤S805(未示出),在步骤S805中,所述网络设备1基于所述访问者的可信度信息,对所述目标应用进行访问控制。
具体地,在实际应用中,基于认定的所述访问者的可信度信息,可以对所述用户设备上的目标应用进行相应的访问控制,例如,对于认定不是真实用户的访问者,可以采取发送警告,发送身份验证信息,限制访问权限、封锁用户账号等多种形式的访问控制。在此,优选地,所述访问控制还可以基于不同的可信度信息而有所不同,例如,对于确定为虚假用户的访问账号,可以直接封锁账号;而对于确定为疑似虚假用户的访问者,可以通过发送身份验证信息,限制部分访问权限等方式对所述访问者进行有限限制,并基于进一步的识别,或结合所述访问者的补救措施,再次对所述目标应用进行限制消除,或是加深访问控制等后续操作。
在实际应用中,所述应用的访问者是真实用户还是虚假用户,对于应用服务范围的评估、服务推广、广告赞助的获得等方面都有直接的影响,所以对于识别出的虚假用户,要进行相应的访问控制和处理,从而更好的维护、改进和完善目标应用的应用效果。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (23)

1.一种在网络设备端用于处理应用访问数据的方法,其中,所述方法包括:
获取关于对应用户设备中目标应用的应用访问数据;
基于对应的事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息。
2.根据权利要求1所述的方法,其中,该方法还包括:
基于所述事件特征信息生成对应的图示信息,并显示所述图示信息。
3.根据权利要求1或2所述的方法,其中,该方法还包括:
基于所述事件特征信息识别所述应用访问数据对应的访问者。
4.根据权利要求3所述的方法,其中,所述基于所述事件特征信息识别所述应用访问数据对应的访问者包括:
基于所述事件特征信息,通过分类算法对应用访问数据对应的访问者进行识别。
5.根据权利要求3所述的方法,其中,所述基于所述事件特征信息识别所述应用访问数据对应的访问者包括:
基于所述事件特征信息,通过聚类算法对应用访问数据对应的访问者进行识别。
6.根据权利要求3至5中任一项所述的方法,其中,所述方法还包括:
基于预置的访问者可信度指标,并结合所述访问者对应的识别结果,确定所述访问者的可信度信息。
7.根据权利要求6所述的方法,其中,所述方法还包括:
基于所述访问者的可信度信息,对所述目标应用进行访问控制。
8.根据权利要求1至7中任一项所述的方法,其中,该方法还包括:
获取目标应用对应的事件描述信息;
将所述事件描述信息提供至安装所述目标应用的对应用户设备;
其中,所述获取关于对应用户设备中目标应用的应用访问数据包括:
获取所述用户设备返回的关于所述目标应用的应用访问数据;
其中,所述基于对应的事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息包括:
基于所述事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息。
9.根据权利要求1至8中任一项所述的方法,其中,所述基于对应的事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息包括:
基于所述事件描述信息对所述应用访问数据进行日志分析,以获得关于所述目标应用的一个或多个应用访问事件;
对所述一个或多个应用访问事件进行统计处理以获得对应的事件特征信息。
10.根据权利要求9所述的方法,其中,所述事件描述信息包括对应事件的运算符信息;
其中,所述对所述一个或多个应用访问事件进行统计处理以获得对应的事件特征信息包括:
基于所述应用访问事件所对应的所述运算符信息,对所述一个或多个应用访问事件进行统计处理以获得对应的事件特征信息。
11.一种在用户设备端用于处理应用访问数据的方法,其中,所述方法包括:
获取对应网络设备提供的关于用户设备上的目标应用的事件描述信息;
基于所述事件描述信息设置关于所述目标应用的应用访问数据的采集触发条件;
基于所述采集触发条件采集所述应用访问数据;
将所述应用访问数据发送至所述网络设备。
12.一种用于处理应用访问数据的网络设备,其中,所述网络设备包括:
第一装置,用于获取关于对应用户设备中目标应用的应用访问数据;
第二装置,用于基于对应的事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息。
13.根据权利要求12所述的网络设备,其中,所述网络设备还包括:
第三装置,用于基于所述事件特征信息生成对应的图示信息,并显示所述图示信息。
14.根据权利要求12或13所述的网络设备,其中,所述网络设备还包括:
第四装置,用于基于所述事件特征信息识别所述应用访问数据对应的访问者。
15.根据权利要求14所述的网络设备,其中,所述第四装置用于:
基于所述事件特征信息,通过分类算法对应用访问数据对应的访问者进行识别。
16.根据权利要求14所述的网络设备,其中,所述第四装置用于:
基于所述事件特征信息,通过聚类算法对应用访问数据对应的访问者进行识别。
17.根据权利要求14至16中任一项所述的网络设备,其中所述网络设备还包括:
第五装置,用于基于预置的访问者可信度指标,并结合所述访问者对应的识别结果,确定所述访问者的可信度信息。
18.根据权利要求17所述的网络设备,其中,所述网络设备还包括:
第六装置,用于基于所述访问者的可信度信息,对所述目标应用进行访问控制。
19.根据权利要求12至18中任一项所述的网络设备,其中,所述网络设备还包括:
第七装置,用于获取目标应用对应的事件描述信息;
第八装置,用于将所述事件描述信息提供至安装所述目标应用的对应用户设备;
其中,所述第一装置用于:
获取所述用户设备返回的关于所述目标应用的应用访问数据;
其中,所述第二装置用于:
基于所述事件描述信息对所述应用访问数据进行处理,以确定关于所述目标应用的应用访问事件的事件特征信息。
20.根据权利要求12至19中任一项所述的网络设备,其中,所述第二装置包括:
第一单元,用于基于所述事件描述信息对所述应用访问数据进行日志分析,以获得关于所述目标应用的一个或多个应用访问事件;
第二单元,用于对所述一个或多个应用访问事件进行统计处理以获得对应的事件特征信息。
21.根据权利要求20所述的网络设备,其中,所述事件描述信息包括对应事件的运算符信息;
其中,所述第二单元用于:
基于所述应用访问事件所对应的所述运算符信息,对所述一个或多个应用访问事件进行统计处理以获得对应的事件特征信息。
22.一种用于处理应用访问数据的用户设备,其中,所述用户设备包括:
第九装置,用于获取对应网络设备提供的关于用户设备上的目标应用的事件描述信息;
第十装置,用于基于所述事件描述信息设置关于所述目标应用的应用访问数据的采集触发条件;
第十一装置,用于基于所述采集触发条件采集所述应用访问数据;
第十二装置,用于将所述应用访问数据发送至所述网络设备。
23.一种用于处理应用访问数据的系统,其中,所述系统包括如权利要求12至21中任一项所述的网络设备,以及如权利要求22所述的用户设备。
CN201510266206.3A 2015-05-22 2015-05-22 一种用于处理应用访问数据的方法与设备 Active CN106294406B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510266206.3A CN106294406B (zh) 2015-05-22 2015-05-22 一种用于处理应用访问数据的方法与设备
PCT/CN2016/082161 WO2016188334A1 (zh) 2015-05-22 2016-05-16 一种用于处理应用访问数据的方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510266206.3A CN106294406B (zh) 2015-05-22 2015-05-22 一种用于处理应用访问数据的方法与设备

Publications (2)

Publication Number Publication Date
CN106294406A true CN106294406A (zh) 2017-01-04
CN106294406B CN106294406B (zh) 2020-04-17

Family

ID=57393746

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510266206.3A Active CN106294406B (zh) 2015-05-22 2015-05-22 一种用于处理应用访问数据的方法与设备

Country Status (2)

Country Link
CN (1) CN106294406B (zh)
WO (1) WO2016188334A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111435377A (zh) * 2019-01-11 2020-07-21 腾讯科技(深圳)有限公司 应用推荐方法、装置、电子设备以及存储介质
CN113328976A (zh) * 2020-02-28 2021-08-31 华为技术有限公司 一种安全威胁事件识别方法、装置及设备

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109684583A (zh) * 2018-11-12 2019-04-26 深圳壹账通智能科技有限公司 页面用户行为的分析方法、装置、终端及可读存储介质
CN109800123A (zh) * 2018-12-14 2019-05-24 深圳壹账通智能科技有限公司 自动化电量测试方法、装置、计算机设备及存储介质
CN111241453B (zh) * 2020-01-20 2023-09-08 平安科技(深圳)有限公司 页面访问时长采集方法、装置、介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101339531A (zh) * 2008-08-12 2009-01-07 杭州华三通信技术有限公司 一种处理日志文件的方法及装置
CN103605738A (zh) * 2013-11-19 2014-02-26 北京国双科技有限公司 网页访问数据统计方法及装置
CN103778244A (zh) * 2014-02-11 2014-05-07 五八同城信息技术有限公司 一种基于用户行为日志的自动化报表分析方法
CN104065657A (zh) * 2014-06-26 2014-09-24 北京思特奇信息技术股份有限公司 一种基于ip访问的动态控制用户行为的方法及系统
CN104158838A (zh) * 2014-07-07 2014-11-19 深信服网络科技(深圳)有限公司 信息推送的方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103023687A (zh) * 2012-05-31 2013-04-03 珠海市君天电子科技有限公司 一种关联于访问请求的统计方法及装置
US9348936B2 (en) * 2012-07-25 2016-05-24 Oracle International Corporation Heuristic caching to personalize applications
CN103944722B (zh) * 2014-04-17 2017-05-10 华北科技学院 一种互联网环境下用户可信行为的识别方法
CN104036037A (zh) * 2014-06-30 2014-09-10 小米科技有限责任公司 处理垃圾用户的方法及装置
CN104318138B (zh) * 2014-09-30 2018-05-08 杭州同盾科技有限公司 一种验证用户身份的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101339531A (zh) * 2008-08-12 2009-01-07 杭州华三通信技术有限公司 一种处理日志文件的方法及装置
CN103605738A (zh) * 2013-11-19 2014-02-26 北京国双科技有限公司 网页访问数据统计方法及装置
CN103778244A (zh) * 2014-02-11 2014-05-07 五八同城信息技术有限公司 一种基于用户行为日志的自动化报表分析方法
CN104065657A (zh) * 2014-06-26 2014-09-24 北京思特奇信息技术股份有限公司 一种基于ip访问的动态控制用户行为的方法及系统
CN104158838A (zh) * 2014-07-07 2014-11-19 深信服网络科技(深圳)有限公司 信息推送的方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111435377A (zh) * 2019-01-11 2020-07-21 腾讯科技(深圳)有限公司 应用推荐方法、装置、电子设备以及存储介质
CN111435377B (zh) * 2019-01-11 2023-09-22 腾讯科技(深圳)有限公司 应用推荐方法、装置、电子设备以及存储介质
CN113328976A (zh) * 2020-02-28 2021-08-31 华为技术有限公司 一种安全威胁事件识别方法、装置及设备
CN113328976B (zh) * 2020-02-28 2022-11-22 华为技术有限公司 一种安全威胁事件识别方法、装置及设备

Also Published As

Publication number Publication date
CN106294406B (zh) 2020-04-17
WO2016188334A1 (zh) 2016-12-01

Similar Documents

Publication Publication Date Title
CN107330731B (zh) 一种识别广告位点击异常的方法和装置
CN110598016A (zh) 一种多媒体信息推荐的方法、装置、设备和介质
CN105023165A (zh) 社交网络平台中投放任务的控制方法、装置及系统
CN112749749B (zh) 基于分类决策树模型的分类方法、装置及电子设备
CN108460627A (zh) 营销活动方案推送方法、装置、计算机设备及存储介质
CN106294406A (zh) 一种用于处理应用访问数据的方法与设备
CN110598070A (zh) 应用类型识别方法及装置、服务器及存储介质
CN111275492A (zh) 用户画像生成方法、装置、存储介质及设备
CN111401447A (zh) 一种基于人工智能的流量作弊识别方法、装置、电子设备
CN102315955A (zh) 一种为垃圾信息设置障碍的控制方法以及相应的控制装置
CN115659008A (zh) 大数据信息反馈的信息推送系统、方法、电子设备及介质
CN108153764A (zh) 一种舆情处理方法及装置
CN104731937A (zh) 用户行为数据的处理方法及装置
CN113869931A (zh) 广告投放策略确定方法、装置、计算机设备和存储介质
CN113569162A (zh) 数据处理方法、装置、设备及存储介质
CN112685618A (zh) 用户特征识别方法、装置、计算设备及计算机存储介质
CN112347457A (zh) 异常账户检测方法、装置、计算机设备和存储介质
Chen et al. Bandit strategies in social search: the case of the DARPA red balloon challenge
Shao et al. Simulating online social response: a stimulus/response perspective
CN112818235A (zh) 基于关联特征的违规用户识别方法、装置和计算机设备
CN112487175A (zh) 参展人流控制方法、装置、服务器及计算机可读存储介质
CN111062449A (zh) 预测模型的训练方法、兴趣度预测方法、装置和存储介质
CN112131607B (zh) 资源数据处理方法、装置、计算机设备和存储介质
CN113569557B (zh) 信息的质量识别方法、装置、设备、存储介质及程序产品
CN111598159B (zh) 机器学习模型的训练方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant