CN109426826A - 用户行为分析方法和装置 - Google Patents
用户行为分析方法和装置 Download PDFInfo
- Publication number
- CN109426826A CN109426826A CN201710720822.0A CN201710720822A CN109426826A CN 109426826 A CN109426826 A CN 109426826A CN 201710720822 A CN201710720822 A CN 201710720822A CN 109426826 A CN109426826 A CN 109426826A
- Authority
- CN
- China
- Prior art keywords
- user
- terminal
- special
- end message
- purpose terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W8/00—Network data management
- H04W8/18—Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
- H04W8/20—Transfer of user or subscriber data
- H04W8/205—Transfer to or from user equipment or user record carrier
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提出一种用户行为分析方法和装置,涉及数据分析技术领域。本发明的一种用户行为分析方法包括:根据用户账号的行为信息确定用户的专用终端;获取采用专用终端执行的操作信息;通过分析采用专用终端执行的操作信息确定专用终端的归属用户的行为信息。通过这样的方法,能够先确定用户的终端,再依据在该终端上产生的操作行为进行用户行为分析,能够避免多用户行为混杂难以分辨的情况,提高用户个体行为分析的准确性。
Description
技术领域
本申请涉及数据分析技术领域,特别是一种用户行为分析方法和装置。
背景技术
网络中的数据流量含有丰富的用户上网行为记录,合理利用该数据,可以挖掘出大量的用户标签、刻画用户行为。现如今有一些从日志数据、客户端采集数据中提取用户数据进行用户追踪,重现用户网络行为路径的方法。与该类基于账号行为数据分析方法不同的是,宽带网络数据中不存在用户唯一标识,仅仅是定位用户就存在困难。而一个家庭宽带下,上网用户可能有多个,不同用户的行为混杂在一起无法分辨,使得针对用户个体的分析困难重重。
发明内容
本申请的一个目的在于提高用户行为分析的准确性。
根据本申请的一个方面,提出一种用户行为分析方法,包括:根据用户账号的行为信息确定用户的专用终端;获取采用专用终端执行的操作信息;通过分析采用专用终端执行的操作信息确定专用终端的归属用户的行为信息。
可选地,根据用户账号的行为信息确定用户的专用终端包括:提取用户账号多次的登录信息;从登录信息中提取登录所使用终端的终端信息,终端信息包括设备信号、设备操作系统和/或浏览器信息;提取采用所使用的终端执行的操作信息;根据终端信息和/或操作信息,通过统计分类确定用户账号归属的专用终端的终端信息。
可选地,通过统计分类确定用户账号归属的专用终端的终端信息包括:将从移动网络数据中获取的第一类终端的终端信息和/或操作信息作为正例样本数据;将其他终端的终端信息和/或操作信息作为反例样本数据;利用正例样本数据和反例样本数据训练二元分类预测模型并测试,确定用户的专用终端。
可选地,第一类终端为将用户手机号码作为用户账号通过移动网络数据获取的终端信息所属的终端。
可选地,还包括:以预定第一频率更新专用终端的终端信息。
可选地,还包括:以预定第二频率更新用户的专用终端。
可选地,还包括:若根据不同的用户账号确定的用户的专用终端相同,则确定不同的用户账号归属于相同用户;根据归属于相同用户的用户账号的行为信息分析用户的行为信息。
通过这样的方法,能够先确定用户的终端,再依据在该终端上产生的操作行为进行用户行为分析,能够避免多用户行为混杂难以分辨的情况,提高用户个体行为分析的准确性。
根据本申请的另一个方面,提出一种用户行为分析装置,包括:专用终端确定单元,用于根据用户账号的行为信息确定用户的专用终端;操作信息获取单元,用于获取采用专用终端执行的操作信息;行为分析单元,用于通过分析采用专用终端执行的操作信息确定专用终端的归属用户的行为信息。
可选地,专用终端确定单元包括:登录信息提取子单元,用于提取用户账号多次的登录信息;终端信息提取子单元,用于从登录信息中提取登录所使用终端的终端信息,终端信息包括设备信号、设备操作系统和/或浏览器信息;终端操作提取子单元,用于提取采用所使用的终端执行的操作信息;终端确定子单元,用于根据终端信息和/或操作信息,通过统计分类确定用户账号归属的专用终端的终端信息。
可选地,终端确定子单元用于:将从移动网络数据中获取的第一类终端的终端信息和/或操作信息作为正例样本数据;将其他终端的终端信息和/或操作信息作为反例样本数据;利用正例样本数据和反例样本数据训练二元分类预测模型并测试,确定用户的专用终端。
可选地,第一类终端为将用户手机号码作为用户账号通过移动网络数据获取的终端信息所属的终端。
可选地,专用终端确定单元还包括:终端信息更新子单元,用于以预定第一频率更新专用终端的终端信息。
可选地,专用终端确定单元还包括:终端更新子单元,用于以预定第二频率更新用户的专用终端。
可选地,还包括:账号归属确定单元,用于当根据不同的用户账号确定的用户的专用终端相同时,确定不同的用户账号归属于相同用户;行为分析单元,还用于根据归属于相同用户的用户账号的行为信息分析用户的行为信息。
根据本申请的又一个方面,提出一种用户行为分析装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器的指令执行上文中提出的任意一种用户行为分析方法。
这样的装置能够先确定用户的终端,再依据在该终端上产生的操作行为进行用户行为分析,能够避免多用户行为混杂难以分辨的情况,提高用户个体行为分析的准确性。
另外,根据本申请的一个方面,提出一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现上文中提出的任意一种用户行为分析方法的步骤。
这样的计算机可读存储介质通过执行其上的指令,能够先确定用户的终端,再依据在该终端上产生的操作行为进行用户行为分析,能够避免多用户行为混杂难以分辨的情况,提高用户个体行为分析的准确性。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请的用户行为分析方法的一个实施例的流程图。
图2为本申请的用户行为分析方法中确定用户的专用终端的一个实施例的流程图。
图3为本申请的用户行为分析装置的一个实施例的示意图。
图4为本申请的用户行为分析装置中专用终端确定单元的一个实施例的示意图。
图5为本申请的用户行为分析装置中专用终端确定单元的另一个实施例的示意图。
图6为本申请的用户行为分析装置的另一个实施例的示意图。
图7为本申请的用户行为分析装置的又一个实施例的示意图。
具体实施方式
下面通过附图和实施例,对本申请的技术方案做进一步的详细描述。
本申请的用户行为分析方法的一个实施例的流程图如图1所示。
在步骤101中,根据用户账号的行为信息确定用户的专用终端。在一个实施例中,可以提取用户账号的登录信息,确定用户账号在哪个终端上登录,进而通过概率统计、高斯分布或其他算法确定用户账号最经常登录的终端,从而确定用户的专用终端。
在一个实施例中,可以对终端的操作信息进行统计,确定终端上最常登录的账号。若该终端的一种应用上只登录过一个账号,则该终端为该账号所属用户的专用终端。
在一个实施例中,同一个用户可以有多个专用终端,同一个终端的多个账号可能归属于同一个用户。
在步骤102中,获取采用专用终端执行的操作信息。在一个实施例中,操作信息可以包括购物操作信息、视频浏览记录、搜索记录、网站浏览记录等。在一个实施例中,可以结合终端标识与终端状态,从宽带网络行为中搜索用户行为足迹。
在步骤103中,通过分析采用专用终端执行的操作信息确定专用终端的归属用户的行为信息。在一个实施例中,若同一个用户拥有多个专用终端,则根据多个专用终端提取的操作信息综合分析获取用户的行为信息。
通过这样的方法,能够先确定用户的终端,再依据在该终端上产生的操作行为进行用户行为分析,能够避免多用户行为混杂难以分辨的情况,提高用户个体行为分析的准确性。
在一个实施例中,可以根据该行为信息为用户推荐合适的内容,推送给用户的专用终端,以免推送给其他用户造成用户信息泄露和打扰他人。
在一个实施例中,用户可能偶然使用他人的终端登录自己的账户,或者有可能多个家庭成员共同使用同一个终端,此时需要对获取的用户登录信息进行鉴别,分析筛选出用户的专用终端。
在一个实施例中,可以根据网络DPI数据分析用户的专用终端。如,从网络数据中的URL(Uniform Resource Locator,统一资源定位符)、本地数据cookie等中抽取用户个人网络账号,认为是一个用户个体。从获得账号的数据包中提取终端信息,可以包括终端型号,OS(Operating System,操作系统),浏览器版本UA(User Agent,用户代理)等,并记录行为时间。形成用户账号与终端的候选关系,终端通过终端信息的组合来区分,并记录该终端行动的活跃期限。终端信息标识可以为3元组:<终端信息,行为开始时间,行为结束时间>。基于提取的终端信息标识进行统计分析,如按照行为发生的次数、时长和/或概率,以及可以从行为丰富度角度分析,能够确定用户的专用终端。
通过这样的方法,能够基于用户账号的操作信息确定用户终端,数据分析逻辑清晰,便于实现。
在另一个实施例中,还可以基于在终端上的操作信息确定用户的专用终端。如,提取单个终端的网络数据中指定规则的目的地址信息,连续的相同行为可合并;从获得行为的数据包中提取终端信息,并记录行为发生时间;形成终端的操作信息,终端操作信息可以用<终端信息,行为标识,行为时间>来标识。基于上述操作信息进行统计分析,如按照行为发生的次数、概率和/或时长等,能够确定终端的归属用户,从而建立用户与终端的对应关系。
通过这样的方法,能够基于终端的操作信息进行分析归纳,确定用户专用终端,数据分析逻辑清晰,便于实现。
本申请的用户行为分析方法中确定用户的专用终端的一个实施例的流程图如图2所示。
在步骤201中,提取用户账号多次的登录信息。
在步骤202中,从登录信息中提取登录所使用终端的终端信息,终端信息包括设备信号、设备操作系统和/或浏览器信息。在一个实施例中,可以建立用户账户-终端信息表,存储用户账户登录的终端的信息。
在步骤203中,提取采用所使用的终端执行的操作信息。在一个实施例中,可以建立终端-操作信息表,存储终端所执行的操作,一方面可以供进行专用终端确认使用,另一方面也可以作为进行用户行为分析的资源。
在步骤204中,根据终端信息和操作信息,通过统计分类确定用户账号归属的专用终端的终端信息。
在一个实施例中,可以将从移动网络数据中获取的第一类终端的终端信息和操作信息作为正例样本数据;将其他终端的终端信息和操作信息作为反例样本数据。第一类终端可以为具有与用户有确切的对应关系的用户账号信息的操作行为所采用的终端,如用户的手机号码与用户具有确切的对应关系,因此根据用户采用手机登录移动网络数据后所执行的登录操作所得到的终端信息为第一类终端的终端信息,采用该终端所进行的操作所产生的信息为第一类终端的操作信息。该信息为可靠的信息,作为正例数据样本。
相对应的,其他终端信息和操作信息的可靠性较低,特别是采用宽带互联网络获取的信息,由于电脑设备的私密性较差,因此可以作为第二类终端的终端信息和操作信息。
利用正例样本数据和反例样本数据训练二元分类预测模型并测试,确定用户的专用终端。如,可以将部分正例样本数据和反例样本数据作为训练样本集训练预测模型,其他数据作为测试样本集,对训练好的模型进行测试,确定用户的专用终端。
通过这样的方法,能够同时采用用户账户-终端信息和终端-操作信息进行专用终端的确定,提高了专用终端确定的准确度,从而提高了用户行为分析的准确度。
在一个实施例中,由于终端经常会升级、更新软件、刷机等操作,因此终端信息会有变化。可以以预定第一频率检测终端的终端信息并及时进行更新。在一个实施例中,预定第一频率可以为一周。在一个实施例中,可以每周从新的网络DPI数据中抽取终端操作信息,检测专用终端是否活动,若查询不到,检测该专用终端是否有升级的迹象,具体包括匹配终端型号和OS,UA,并判断OA或UA的版本是否升级,确定旧版本与新版本在时间上有顺序性,无冲突。若有升级迹象,则记录新的终端信息,还可以更新旧的终端信息的有效期限信息。
通过这样的方法,能够及时更新终端信息,保证信息的实时性,从而确保能够跟踪到专用终端,防止由于终端信息变化导致的操作信息获取不正确,或者终端版本信息变化导致的操作信息无法解析等。
在一个实施例中,由于用户可能会更换终端,因此还需要以预定第二频率更新用户的专用终端。第二频率可以是一个月。在一个实施例中,可以每月从新的网络DPI数据中抽取新的用户账号登录所采用终端的终端信息,将该终端信息与已有的信息进行匹配,若匹配不成功,则经过如上文提到的专用终端确定过程之后,将终端添加为新的专用终端。
通过这样的方法,能够及时更新用户的专用终端,提高用户操作信息获取的全面性,从而进一步提高用户行为分析的准确性。
在一个实施例中,由于平台不同,同一个用户可能拥有不同的账号。可以在根据不同的用户账号确定的用户的专用终端相同时,确定该不同的用户账号归属于相同用户,进而根据归属于相同用户的用户账号的行为信息分析用户的行为信息。
通过这样的方法,能够将多个平台的用户账号相联系,提高用户行为分析的丰富性。
本申请的用户行为分析装置的一个实施例的示意图如图3所示。专用终端确定单元301能够根据用户账号的行为信息确定用户的专用终端。在一个实施例中,可以提取用户账号的登录信息,确定用户账号在哪个终端上登录,进而通过概率统计、高斯分布或其他算法确定用户账号最经常登录的终端,从而确定用户的专用终端。操作信息获取单元302能够获取采用专用终端执行的操作信息。在一个实施例中,操作信息可以包括购物操作信息、视频浏览记录、搜索记录、网站浏览记录等。行为分析单元303能够通过分析采用专用终端执行的操作信息确定专用终端的归属用户的行为信息。在一个实施例中,若同一个用户拥有多个专用终端,则根据多个专用终端提取的操作信息综合分析获取用户的行为信息。在一个实施例中,可以利用专用终端的标识及其有效时间,从宽带网络报文中抽取指定用户行为;对于指定用户账户,利用其专用设备作为标识,可针对特定时段、特定主机,在提取到的操作信息中追踪、分析用户行为,准确提炼出用户一系列行为顺序。
这样的装置能够先确定用户的终端,再依据在该终端上产生的操作行为进行用户行为分析,能够避免多用户行为混杂难以分辨的情况,提高用户个体行为分析的准确性。
本申请的用户行为分析装置中专用终端确定单元的一个实施例的示意图如图4所示。登录信息提取子单元401能够提取用户账号多次的登录信息。终端信息提取子单元402能够从登录信息中提取登录所使用终端的终端信息,终端信息包括设备信号、设备操作系统和/或浏览器信息。终端操作提取子单元403能够提取采用所使用的终端执行的操作信息。终端确定子单元404能够根据终端信息和操作信息,通过统计分类确定用户账号归属的专用终端的终端信息。
这样的装置能够采用用户账户-终端信息和终端-操作信息进行专用终端的确定,提高了专用终端确定的准确度,从而提高了用户行为分析的准确度。
在一个实施例中,终端确定子单元404可以将从移动网络数据中获取的第一类终端的终端信息和操作信息作为正例样本数据;将其他终端的终端信息和操作信息作为反例样本数据;第一类终端可以为具有与用户有确切的对应关系的用户账号信息的操作行为所采用的终端,如用户的手机号码与用户具有确切的对应关系,因此根据用户采用手机登录移动网络数据后所执行的登录操作所得到的终端信息为第一类终端的终端信息,采用该终端所进行的操作为第一类终端的操作信息。该信息为可靠的信息,作为正例数据样本。
相对应的,其他终端信息和操作信息的可靠性较低,特别是采用宽带互联网络获取的信息,由于电脑设备的私密性较差,因此可以作为第二类终端的终端信息和操作信息。
终端确定子单元404利用正例样本数据和反例样本数据训练二元分类预测模型并测试,确定用户的专用终端。如,可以将部分正例样本数据和反例样本数据作为训练样本集训练预测模型,其他数据作为测试样本集,对训练好的模型进行测试,确定用户的专用终端。
这样的装置能够采用样本分类训练并测试的方式确定用户专用终端,更加准确可靠。
本申请的用户行为分析装置中专用终端确定单元的另一个实施例的示意图如图5所示。登录信息提取子单元501、终端信息提取子单元502、终端操作提取子单元503和终端确定子单元504的结构和功能与图4的实施例相似。
专用终端确定单元还可以包括终端信息更新子单元505,能够以预定第一频率检测终端的终端信息并及时进行更新。在一个实施例中,预定第一频率可以为一周。在一个实施例中,可以每周从新的网络DPI数据中抽取新的终端操作信息,检测指定专用终端是否活动,若查询不到,检测该专用终端是否有升级的迹象,具体包括匹配终端型号和OS,UA,并判断OA或UA的版本是否升级,确定旧版本与新版本在时间上有顺序性,无冲突。若有升级迹象,则记录新的终端信息,还可以更新旧的终端信息的有效期限信息。
这样的装置能够及时更新终端信息,保证信息的实时性,从而确保能够跟踪到专用终端,防止由于终端信息变化导致的操作信息获取不正确,或者终端版本信息变化导致的操作信息无法解析等。
专用终端确定单元还可以包括终端更新子单元506,能够以预定第二频率更新用户的专用终端。第二频率可以是一个月。在一个实施例中,可以每月从新的网络DPI数据中抽取新的用户账号登录所采用终端的终端信息,将该终端信息与已有的信息进行匹配,若匹配不成功,则经过如上文提到的专用终端确定过程之后,将终端添加为新的专用终端。
这样的装置能够及时更新用户的专用终端,提高用户操作信息获取的全面性,从而进一步提高用户行为分析的准确性。
在一个实施例中,由于平台不同,同一个用户可能拥有不同的账号。用户行为分析装置还可以包括账号归属确定单元,能够在根据不同的用户账号确定的用户的专用终端相同时,确定该不同的用户账号归属于相同用户,行为分析单元能够根据归属于相同用户的用户账号的行为信息分析用户的行为信息。
这样的装置能够将多个平台的用户账号相联系,提高用户行为分析的丰富性。
本申请的用户行为分析装置的另一个实施例的结构示意图如图6所示。用户行为分析包括存储器610和处理器620。其中:存储器610可以是磁盘、闪存或其它任何非易失性存储介质。存储器用于存储下文中用户行为分析方法的对应实施例中的指令。处理器620耦接至存储器610,可以作为一个或多个集成电路来实施,例如微处理器或微控制器。该处理器620用于执行存储器中存储的指令,能够实现提高用户行为分析的准确性。
在一个实施例中,还可以如图7所示,用户行为分析装置700包括存储器710和处理器720。处理器720通过BUS总线730耦合至存储器710。该用户行为分析装置700还可以通过存储接口740连接至外部存储装置750以便调用外部数据,还可以通过网络接口760连接至网络或者另外一台计算机系统(未标出)。此处不再进行详细介绍。
在该实施例中,通过存储器存储数据指令,再通过处理器处理上述指令,能够实现提高用户行为分析的准确性。
在另一个实施例中,一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现用户行为分析方法对应实施例中的方法的步骤。本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
至此,已经详细描述了本申请。为了避免遮蔽本申请的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
可能以许多方式来实现本申请的方法以及装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本申请的方法以及装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本申请的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本申请实施为记录在记录介质中的程序,这些程序包括用于实现根据本申请的方法的机器可读指令。因而,本申请还覆盖存储用于执行根据本申请的方法的程序的记录介质。
最后应当说明的是:以上实施例仅用以说明本申请的技术方案而非对其限制;尽管参照较佳实施例对本申请进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本申请的具体实施方式进行修改或者对部分技术特征进行等同替换;而不脱离本申请技术方案的精神,其均应涵盖在本申请请求保护的技术方案范围当中。
Claims (16)
1.一种用户行为分析方法,其特征在于,包括:
根据用户账号的行为信息确定用户的专用终端;
获取采用所述专用终端执行的操作信息;
通过分析采用所述专用终端执行的操作信息确定所述专用终端的归属用户的行为信息。
2.根据权利要求1所述的方法,其特征在于,所述根据用户账号的行为信息确定用户的专用终端包括:
提取用户账号多次的登录信息;
从所述登录信息中提取登录所使用终端的终端信息,所述终端信息包括设备信号、设备操作系统和/或浏览器信息;
提取采用所述所使用的终端执行的操作信息;
根据所述终端信息和/或所述操作信息,通过统计分类确定所述用户账号归属的专用终端的终端信息。
3.根据权利要求2所述的方法,其特征在于,所述通过统计分类确定所述用户账号归属的专用终端的终端信息包括:
将从移动网络数据中获取的第一类终端的终端信息和/或操作信息作为正例样本数据;
将其他终端的终端信息和/或操作信息作为反例样本数据;
利用所述正例样本数据和所述反例样本数据训练二元分类预测模型并测试,确定用户的专用终端。
4.根据权利要求3所述的方法,其特征在于,所述第一类终端为将用户手机号码作为所述用户账号通过移动网络数据获取的终端信息所属的终端。
5.根据权利要求2所述的方法,其特征在于,还包括:以预定第一频率更新所述专用终端的终端信息。
6.根据权利要求1所述的方法,其特征在于,还包括:以预定第二频率更新用户的所述专用终端。
7.根据权利要求1所述的方法,其特征在于,还包括:
若根据不同的用户账号确定的用户的所述专用终端相同,则确定所述不同的用户账号归属于相同用户;
根据归属于相同用户的所述用户账号的行为信息分析所述用户的行为信息。
8.一种用户行为分析装置,其特征在于,包括:
专用终端确定单元,用于确定根据用户账号的行为信息确定用户的专用终端;
操作信息获取单元,用于获取采用所述专用终端执行的操作信息;
行为分析单元,用于通过分析采用所述专用终端执行的操作信息确定所述专用终端的归属用户的行为信息。
9.根据权利要求8所述的装置,其特征在于,所述专用终端确定单元包括:
登录信息提取子单元,用于提取用户账号多次的登录信息;
终端信息提取子单元,用于从所述登录信息中提取登录所使用终端的终端信息,所述终端信息包括设备信号、设备操作系统和/或浏览器信息;
终端操作提取子单元,用于提取采用所述所使用的终端执行的操作信息;
终端确定子单元,用于根据所述终端信息和/或所述操作信息,通过统计分类确定所述用户账号归属的专用终端的终端信息。
10.根据权利要求9所述的装置,其特征在于,所述终端确定子单元用于:
将从移动网络数据中获取的第一类终端的终端信息和/或操作信息作为正例样本数据;
将其他终端的终端信息和/或操作信息作为反例样本数据;
利用所述正例样本数据和所述反例样本数据训练二元分类预测模型并测试,确定用户的专用终端。
11.根据权利要求10所述的装置,其特征在于,所述第一类终端为将用户手机号码作为所述用户账号通过移动网络数据获取的终端信息所属的终端。
12.根据权利要求9所述的装置,其特征在于,所述专用终端确定单元还包括:
终端信息更新子单元,用于以预定第一频率更新所述专用终端的终端信息。
13.根据权利要求8所述的装置,其特征在于,所述专用终端确定单元还包括:
终端更新子单元,用于以预定第二频率更新用户的所述专用终端。
14.根据权利要求8所述的装置,其特征在于,还包括:账号归属确定单元,用于当根据不同的用户账号确定的用户的所述专用终端相同时,确定所述不同的用户账号归属于相同用户;
所述行为分析单元,还用于根据归属于相同用户的所述用户账号的行为信息分析所述用户的行为信息。
15.一种用户行为分析装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器的指令执行如权利要求1至7任一项所述的方法。
16.一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现权利要求1至7任意一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710720822.0A CN109426826B (zh) | 2017-08-22 | 2017-08-22 | 用户行为分析方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710720822.0A CN109426826B (zh) | 2017-08-22 | 2017-08-22 | 用户行为分析方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109426826A true CN109426826A (zh) | 2019-03-05 |
CN109426826B CN109426826B (zh) | 2020-12-29 |
Family
ID=65499142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710720822.0A Active CN109426826B (zh) | 2017-08-22 | 2017-08-22 | 用户行为分析方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109426826B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112257776A (zh) * | 2020-10-21 | 2021-01-22 | 中国联合网络通信集团有限公司 | 终端推荐方法、系统、计算机设备及存储介质 |
CN113542239A (zh) * | 2021-06-29 | 2021-10-22 | 武汉思普崚技术有限公司 | 一种基于Web监听的认证方法、系统、装置及存储介质 |
WO2021233199A1 (zh) * | 2020-05-19 | 2021-11-25 | 华为技术有限公司 | 搜索推荐模型的训练方法、搜索结果排序的方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012168862A (ja) * | 2011-02-16 | 2012-09-06 | Nomura Research Institute Ltd | 行動情報記録装置 |
US20130275048A1 (en) * | 2010-12-20 | 2013-10-17 | University-Indusrty Cooperation Group of Kyung-Hee University et al | Method of operating user information-providing server based on users moving pattern and emotion information |
CN103455789A (zh) * | 2012-06-01 | 2013-12-18 | 索尼公司 | 信息处理设备,信息处理方法和程序 |
CN104011731A (zh) * | 2011-10-18 | 2014-08-27 | 迈克菲公司 | 用户行为风险评估 |
CN106202117A (zh) * | 2015-05-07 | 2016-12-07 | 深圳市腾讯计算机系统有限公司 | 数据处理方法、装置和服务器 |
-
2017
- 2017-08-22 CN CN201710720822.0A patent/CN109426826B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130275048A1 (en) * | 2010-12-20 | 2013-10-17 | University-Indusrty Cooperation Group of Kyung-Hee University et al | Method of operating user information-providing server based on users moving pattern and emotion information |
JP2012168862A (ja) * | 2011-02-16 | 2012-09-06 | Nomura Research Institute Ltd | 行動情報記録装置 |
CN104011731A (zh) * | 2011-10-18 | 2014-08-27 | 迈克菲公司 | 用户行为风险评估 |
CN103455789A (zh) * | 2012-06-01 | 2013-12-18 | 索尼公司 | 信息处理设备,信息处理方法和程序 |
CN106202117A (zh) * | 2015-05-07 | 2016-12-07 | 深圳市腾讯计算机系统有限公司 | 数据处理方法、装置和服务器 |
Non-Patent Citations (1)
Title |
---|
陈晓天: "基于用户行为分析的移动互联网流量经营研究", 《技术交流》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021233199A1 (zh) * | 2020-05-19 | 2021-11-25 | 华为技术有限公司 | 搜索推荐模型的训练方法、搜索结果排序的方法及装置 |
CN112257776A (zh) * | 2020-10-21 | 2021-01-22 | 中国联合网络通信集团有限公司 | 终端推荐方法、系统、计算机设备及存储介质 |
CN112257776B (zh) * | 2020-10-21 | 2023-07-04 | 中国联合网络通信集团有限公司 | 终端推荐方法、系统、计算机设备及存储介质 |
CN113542239A (zh) * | 2021-06-29 | 2021-10-22 | 武汉思普崚技术有限公司 | 一种基于Web监听的认证方法、系统、装置及存储介质 |
CN113542239B (zh) * | 2021-06-29 | 2022-11-01 | 武汉思普崚技术有限公司 | 一种基于Web监听的认证方法、系统、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109426826B (zh) | 2020-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107800591B (zh) | 一种统一日志数据的分析方法 | |
US8938395B2 (en) | Cursor path vector analysis for detecting click fraud | |
CN109241343B (zh) | 一种刷量用户识别系统、方法及装置 | |
CN106095866B (zh) | 应用程序推荐方法、程序启动速度的优化方法和装置 | |
CN108763274B (zh) | 访问请求的识别方法、装置、电子设备及存储介质 | |
CN110175236A (zh) | 用于文本分类的训练样本生成方法、装置和计算机设备 | |
CN109426826A (zh) | 用户行为分析方法和装置 | |
CN106202101B (zh) | 广告识别方法及装置 | |
US8935175B2 (en) | Cursor path vector analysis for detecting click fraud | |
CN107578263A (zh) | 一种广告异常访问的检测方法、装置和电子设备 | |
Villanes et al. | What are software engineers asking about android testing on stack overflow? | |
CN107846426A (zh) | 页面访问中用户轨迹的跟踪方法和装置 | |
US20090024461A1 (en) | Cursor path vector analysis for detecting click fraud | |
US9684582B2 (en) | Automatically analyzing operation sequences | |
CN103365967A (zh) | 一种基于爬虫的自动化差异检测方法及装置 | |
CN110647321A (zh) | 回放操作流程的方法、装置、设备及存储介质 | |
CN105989149A (zh) | 一种用户设备指纹的提取和识别方法及系统 | |
US10241957B2 (en) | Workload patterns for realistic load recreation in performance testing | |
US9336316B2 (en) | Image URL-based junk detection | |
CN110866205A (zh) | 用于存储信息的方法和装置 | |
CN105740361B (zh) | 全量数据完整度的检测方法及装置 | |
CN111368824A (zh) | 一种仪表识别方法、移动设备及存储介质 | |
CN104580109B (zh) | 生成点选验证码的方法及装置 | |
CN106484746B (zh) | 网站转化事件的分析方法及装置 | |
CN102866885A (zh) | 网页中点击位置的确定方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |