CN110659269B - 用户访问数据处理方法、装置、计算机设备及存储介质 - Google Patents

用户访问数据处理方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN110659269B
CN110659269B CN201910754752.XA CN201910754752A CN110659269B CN 110659269 B CN110659269 B CN 110659269B CN 201910754752 A CN201910754752 A CN 201910754752A CN 110659269 B CN110659269 B CN 110659269B
Authority
CN
China
Prior art keywords
access
user
preset
data
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910754752.XA
Other languages
English (en)
Other versions
CN110659269A (zh
Inventor
龙遗璟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Property and Casualty Insurance Company of China Ltd
Original Assignee
Ping An Property and Casualty Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Property and Casualty Insurance Company of China Ltd filed Critical Ping An Property and Casualty Insurance Company of China Ltd
Priority to CN201910754752.XA priority Critical patent/CN110659269B/zh
Publication of CN110659269A publication Critical patent/CN110659269A/zh
Application granted granted Critical
Publication of CN110659269B publication Critical patent/CN110659269B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种用户访问数据处理方法、装置、计算机设备及存储介质,所述方法包括:在数据库中获取用户通过用户账户在预设时长之内访问应用程序的访问日期的数量,以及的访问数据;对用户的所有访问数据进行预处理;根据预处理之后的访问数据确定用户的主流访问路径和访问偏好;根据预处理之后的访问数据,以及预设的群体划分规则确定用户所属的活跃群体;根据预设群体中的所有用户的主流访问路径和访问偏好确定预设群体的用户维护措施。本发明通过对用户的用户数据进行分析,划分用户所属的活跃群体,及提炼不同群体的有效特征,实现对各群体用户进行针对性维护,达到降低运营成本,减少客户流失的效果。

Description

用户访问数据处理方法、装置、计算机设备及存储介质
技术领域
本发明涉及数据处理领域,尤其涉及一种用户访问数据处理方法、装置、计算机设备及存储介质。
背景技术
随着互联网的飞速发展,人们对于终端上的应用程序的使用越来越多,对于开发应用程序的商家来说,使用该应用程序的用户才是产生效益的根本,因此让越来越多的用户使用该应用程序才是该应用程序继续存在和盈利的基本途径;但由于同类应用程序的飞速发展,使得每个应用程序在运营过程中都存在不同程度的用户流失,因此,维护用户使得用户流失率减少是使得应用程序可以持续运营的一个重要因素;对于一个应用程序来说,用户在该应用程序上从开始注册到用户流失,通常会经历注册-活跃-留存-沉默-流失5个不同的阶段;而对于用户维护来说,获取一个新用户的成本是维护一个老用户成本的1.5倍;因此,当前急需要一种可以根据用户访问行为采取针对性维护措施以减少客户流失的方法。
发明内容
本发明提供一种用户访问数据处理方法、装置、计算机设备及存储介质,本发明可以通过对所述用户账户的注册时长达到预设时长的用户数据进行分析,划分所述用户所属的活跃群体,及提炼不同群体的有效特征,实现对各群体用户进行针对性维护,达到降低运营成本,减少客户流失的效果。
一种用户访问数据处理方法,包括:
在用户已注册应用程序的用户账户,且所述用户账户的注册时长达到预设时长时,自数据库中获取所述用户通过所述用户账户在所述预设时长之内访问所应用程序的访问日期的数量,以及每一所述访问日期中每一次访问所述应用程序的访问数据;
对所述用户的所有所述访问数据进行预处理;
根据预处理之后的所述访问数据确定所述用户的主流访问路径和访问偏好;
根据预处理之后的所述访问数据、所述用户在所述预设时长之内访问所应用程序的访问日期的数量,以及预设的群体划分规则确定所述用户所属的活跃群体;
获取所述活跃群体中预设群体中的所有所述用户的所述主流访问路径和所述访问偏好,根据所述预设群体中的所有所述用户的所述主流访问路径和所述访问偏好确定所述预设群体的用户维护措施。
一种用户访问数据处理装置,包括:
获取模块,用于在用户已注册应用程序的用户账户,且所述用户账户的注册时长达到预设时长时,自数据库中获取所述用户通过所述用户账户在所述预设时长之内访问所应用程序的访问日期的数量,以及每一所述访问日期中每一次访问所述应用程序的访问数据;
预处理模块,用于对所述用户的所有所述访问数据进行预处理;
第一确定模块,用于根据预处理之后的所述访问数据确定所述用户的主流访问路径和访问偏好;
第二确定模块,用于根据预处理之后的所述访问数据、所述用户在所述预设时长之内访问所应用程序的访问日期的数量,以及预设的群体划分规则确定所述用户所属的活跃群体;
第三确定模块,用于获取所述活跃群体中预设群体中的所有所述用户的所述主流访问路径和所述访问偏好,根据所述预设群体中的所有所述用户的所述主流访问路径和所述访问偏好确定所述预设群体的用户维护措施。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述用户访问数据处理方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述用户访问数据处理方法的步骤。
上述用户访问数据处理方法、装置、计算机设备及存储介质,首先在数据库中获取所述用户通过所述用户账户在所述预设时长之内访问所应用程序的访问日期的数量,以及每一所述访问日期中每一次访问所述应用程序的访问数据;对所述用户的所有所述访问数据进行预处理;根据预处理之后的所述访问数据确定所述用户的主流访问路径和访问偏好;根据预处理之后的所述访问数据、所述用户在所述预设时长之内访问所应用程序的访问日期的数量,以及预设的群体划分规则确定所述用户所属的活跃群体;根据所述预设群体中的所有所述用户的所述主流访问路径和所述访问偏好确定所述预设群体的用户维护措施。本发明通过对所述用户账户的注册时长达到预设时长的用户数据进行分析,划分所述用户所属的活跃群体,及提炼不同群体的有效特征,实现对各群体用户进行针对性维护,达到降低运营成本,减少客户流失的效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中用户访问数据处理方法的应用环境示意图;
图2是本发明一实施例中用户访问数据处理方法的流程图;
图3是本发明一实施例中用户访问数据处理方法的步骤S20的流程图;
图4是本发明一实施例中用户访问数据处理方法的步骤S30的流程图;
图5是本发明另一实施例中用户访问数据处理方法的步骤S30的流程图;
图6是本发明一实施例中用户访问数据处理方法的步骤S40的流程图;
图7是本发明一实施例中用户访问数据处理方法的步骤S50中的流程图;
图8是本发明另一实施例中用户访问数据处理方法的步骤S50中的流程图;
图9是本发明一实施例中用户访问数据处理装置的原理框图;
图10是本发明一实施例中计算机设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的用户访问数据处理方法,可应用在如图1的应用环境中,其中,客户端(计算机设备)通过网络与服务器进行通信。其中,客户端(计算机设备)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、摄像头和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种用户访问数据处理方法,以该方法应用在图1中的服务器为例进行说明,包括以下步骤S10-S50:
S10,在用户已注册应用程序的用户账户,且所述用户账户的注册时长达到预设时长时,自数据库中获取所述用户通过所述用户账户在所述预设时长之内访问所应用程序的访问日期的数量,以及每一所述访问日期中每一次访问所述应用程序的访问数据;
其中,所述预设时长之内,只要用户通过所述用户登录了所述应用程序,则将该预设时长之内访问所应用程序的访问日期的数量增加一天;在本实施例中,每一所述访问日期中的访问次数也并不相同,每一次访问所述应用程序,均对应于一项访问数据。每一项所述访问数据均包括但不限定于该次访问所述应用程序的访问来源(用户是通过某种推送途径访问所述应用程序,或是主动登录进行访问)、访问模块(每一次访问数据中包含的用户在本次访问中访问的模块)、访问开始时间(所述用户在访问开始时间通过所述用户账户登录所述应用程序)、访问结束时间(所述用户在访问结束时间退出所述用户账户的登录)、数据唯一标识(每一项所述访问数据对应的具有唯一性的编码)等;可理解地,所述预设时长是指根据需求设定的一个时长,比如三个月,此时,需要获得访问数据将会是用户注册所述用户账户之后三个月之内的访问数据。
在本实施例中,在访问所述应用程序之前,应当首先在所述应用程序上注册一个用户账户,仅有通过该用户账户进行登录之后,才可以视为通过所述用户账户对该应用程序进行访问,且获取与本次访问对应的访问数据,也即,在本实施例中,将一个用户定义为与该用户账户对应的账户主体。在本实施例中,一次访问所述应用程序的访问数据,是指所述用户在访问开始时间通过所述用户账户登录所述应用程序之后,且在所述访问结束时间退出所述用户账户的登录之前,两者之间产生的访问数据。
在另一些实施例中,也可以将一个用户定义为一个终端设备(通过识别该终端设备的设备编码确认是否为该终端设备),此时,获取的所述访问数据无需是该用户通过用户账户进行登录之后才能获取,而是只要该终端设备访问一次该应用程序(未登录作为游客访问,或者通过不同的用户账户登录均可视为访问一次),即可获取该次访问的访问数据;但在该实施例中,获取的所述访问数据中的在未登录的游客状态下通过该终端设备访问所述应用程序的访问数据,将会在步骤S20的预处理过程中被清除。
S20,对所述用户的所有所述访问数据进行预处理;
在该步骤中,所述预处理过程是指:首先根据预先设定的清洗规则清洗所述访问数据,所述清洗规则包括将所述删除所述访问数据中总访问时长低于预设的数据清洗时长(根据需求设定,比如5秒)的访问数据删除,也可以包括将步骤S10中说明的在未登录的游客状态下通过该终端设备访问所述应用程序的访问数据删除等。在完成对所述访问数据的清洗之后,按照预设排序规则(比如访问开始时间的先后顺序)对被清洗之后的所述用户的各所述访问数据进行排序。
在一实施例中,每一项所述访问数据均包括该次访问所述应用程序的访问开始时间、访问结束时间、数据唯一标识;如图3所示,所述步骤S20中,所述对所述用户的所有所述访问数据进行预处理,包括:
S201,根据每一项所述访问数据中的所述访问开始时间和所述访问结束时间获取该项所述访问数据对应的总访问时长;可理解地,所述总访问时长等于所述访问结束时间与所述访问开始时间之间的差值。
S202,自所述用户的所有所述访问数据中,将所述总访问时长小于预设的数据清洗时长的所述访问数据删除;
也即,未删除的所有所述访问数据即为进行预处理之后的所述访问数据,进行与处理之后,可以将小于所述数据清洗时长(比如5秒,此时并不认为用户在5秒的登录过程中有任何的实质的使用所述应用程序的行为,更可能是误操作)的访问数据删除,以提升后续数据分析结果的精准性。
S203,自未删除的所有所述访问数据中,获取所述访问开始时间属于所述预设时长之内的同一所述访问日期的所述访问数据,按照所述访问开始时间的先后对属于所述访问日期的所述访问数据进行排序,并将排序后的所有属于所述访问日期的所述访问数据的所述数据唯一标识插入与所述访问日期关联的访问队列之后,将所述访问队列与所述用户账户关联存储至所述数据库。
并且,由于在后续的分析过程中,需要使用的仅为进行预处理之后的访问数据,因此可以将进行预处理之后的所有所述访问数据按照每一天(也即同一访问日期)进行划分后,按照访问开始时间的先后进行排序(以在步骤S30中进一步确定其访问路径),再根据各所述访问数据的数据唯一标识生成访问队列(每一个访问队列对应一个访问日期,且所述访问队列在插入排序后的所有属于所述访问日期的所述访问数据的数据唯一标识之前,不包含其他访问数据),再将该访问队列与所述用户的用户账户关联存储至数据库。在后续过程中,若需要使用预处理之后的该访问日期对应的某一项所述访问数据(也即访问队列中的访问数据),只需要在数据库中首先根据所述访问日期确定访问队列,再根据所述数据唯一标识自确定的该访问队列中进行调取即可。
S30,根据预处理之后的所述访问数据确定所述用户的主流访问路径和访问偏好;
在该实施例中,需要根据上述预处理之后的访问数据确定用户在每一次访问过程中的主流访问路径和访问偏好,进而分析该用户的访问行为,以在该用户出现流失危机时,可以及时采取对应的用户维护措施。
在一实施例中,每一项所述访问数据还包括该次访问所述应用程序的访问模块、针对每一所述访问模块进行访问的初始时间;如图4所示,此时,所述步骤S203之后,所述根据预处理之后的所述访问数据确定所述用户的主流访问路径和访问偏好,包括:
S301,自所述数据库中获取所述访问队列中每一项所述访问数据中的所述访问模块,以及针对各所述访问模块进行访问的所述初始时间和终止时间;
S302,将获取的一项所述访问数据中的所述访问模块按照各所述访问模块进行访问的所述初始时间进行排序,确定该项所述访问数据中所述用户的访问路径;
S303,自各项所述访问数据对应的访问路径中提取重复概率最高或重复概率超过预设重复阈值的路径段,并将所述路径段记录为主流访问路径。
在该实施例中,可根据访问模块和对所述访问模块进行访问的初始时间确定每一项访问数据对应的访问路径,此后,可以在步骤S303中对所述访问路径进行分段,比如,可以将所述访问路径根据需求分为N个、N-1个…3个、2个模块为一个路径段,N与该访问路径中的所有访问模块的模块访问数量相等,并将按照同一个分段规则(比如分段为4个访问模块一段)之后的所有路径段进行对比,将各路径段按照重复概率由高至低进行排序,将该序列中序列在前的预设数量(比如三个或者一个)的路径段记录为主流访问路径;亦可以将该序列中重复概率超过预设重复阈值(根据需求设定)的所述路径段作为主流访问路径。
在一实施例中,每一项所述访问数据还包括该次访问所述应用程序的访问来源、针对每一所述访问模块进行访问的终止时间;如图5所示,所述步骤S301之后还包括:
S304,根据获取的所述访问队列中的所有所述访问模块以及针对各所述访问模块进行访问的所述初始时间和所述终止时间,确定每一所述访问模块的模块访问次数、模块访问时长和模块访问数量;也即,根据所述用户在预设时长之内每一天的所有访问数据,确定用户访问的访问模块的模块访问数量,以及针对每一访问模块的模块访问次数和模块访问时长。
S305,根据所述模块访问次数、模块访问时长、模块访问数量以及每一次访问所述应用程序的访问来源,确定所述用户在所述访问队列对应的所述访问日期和/或所述预设时长中的访问偏好。
也即,所述访问偏好可以根据所述模块访问次数、模块访问时长、模块访问数量和每一次访问所述应用程序的访问来源进一步确定,比如,可以判定所述模块访问次数越多、所述模块访问时长越长,说明对该访问模块更为偏好。
可理解地,模块访问数量的多少,可以用于确定用户是否仅偏好其中的少数几个模块对应的应用程序所能实现的功能,上述确定过程可以通过所述模块访问数量和各所述模块访问的次数进行比对来进行确定,比如,用户仅访问了4个访问模块,且每个访问模块的模块访问次数都超过了6次,则说明这几个用户进行访问的访问模块可能代表了用户喜好的功能,且该用户可能对其他功能没有需求;同理,模块访问数量的多少,也可以用于确定该用户是否愿意尝试数量甚多的不同访问模块,上述确定过程可以通过所述模块访问数量和各所述模块访问的次数进行比对来进行确定,比如用户访问了所有的访问模块或访问的所述访问模块的数量超过预设数量(比如20个),且对于其中每个访问模块或其中超过一个预设比例阈值(比如60%)的访问模块的模块访问次数的差值相差在一定范围内,说明用户爱好广泛,喜好探索,且对该应用程序的很多访问模块均有兴趣。
所述访问来源则说明了用户对于所述应用程序处于被动活跃状态(被某些推送途径吸引而访问所述应用程序的访问来源较多),或是该用户对于所述应用程序处于主动活跃状态(主动登录进行访问的访问来源的较多)。
S40,根据预处理之后的所述访问数据、所述用户在所述预设时长之内访问所应用程序的访问日期的数量,以及预设的群体划分规则确定所述用户所属的活跃群体;
也即,在该步骤中需要首先确定该用户所属的活跃群体,以针对该活跃群体类型做出不同的用户维护措施。
在一实施例中,所述步骤S203之后,如图6所示,所述步骤S40包括:
S401,获取预处理之后的每一所述访问队列中的所述数据唯一标识的个数,并将所述访问队列中所述数据唯一标识的个数,记录为所述用户账户在所述访问队列对应的所述访问日期中访问所述应用程序的次数;
也即,在本实施例中,可以不直接获取所述用户通过所述用户账户在所述预设时长之内每一天访问应用程序的次数(也即所述用户账户在所述预设时长之内每一天的登录次数,可理解地,亦可以直接获取其登录次数,并将登录次数记录为每一天中的访问应用程序的次数),而是可以根据获取的所述用户账户在所述预设时长之内每一天对应的访问队列中的所述数据唯一标识的数量(亦可以为该访问队列中访问数据的所述访问开始时间的数量或所述访问结束时间的数量)等去间接获取所述用户通过所述用户账户在所述预设时长之内每一天访问所应用程序的次数。
S402,自预设的划分规则表中,查询与所述访问日期的数量或/和所述访问日期中访问所述应用程序的次数匹配的所述群体划分规则,并自所述划分规则表中获取与匹配的所述群体划分规则关联的群体类型之后,将获取的所述群体类型记录为与所述用户对应的活跃群体。
在本实施例中,所述划分规则表中记录了多条群体划分规则,每一条群体划分规则关联一种群体类型。在一实施例中,所述群体划分规则和群体类型的对应关系包括:
群体划分规则为:预设时长3个月内的访问日期的数量为1天,且所述访问日期中访问所述应用程序的次数为1次,该群体划分规则对应的群体类型为一次会话用户。
群体划分规则为:预设时长3个月内的访问日期的数量为1天,且所述访问日期中访问所述应用程序的次数大于1次,该群体划分规则对应的群体类型为一日活跃用户。
群体划分规则为:预设时长3个月内的访问日期的数量为3天,该群体划分规则对应的群体类型为低频用户。
群体划分规则为:预设时长3个月内的访问日期的数量为大于10天,该群体划分规则对应的群体类型为高频用户。
群体划分规则为:预设时长3个月中的最近连续60天内均不存在访问日期,该群体划分规则对应的群体类型为沉默用户。
S50,获取所述活跃群体中预设群体中的所有所述用户的所述主流访问路径和所述访问偏好,根据所述预设群体中的所有所述用户的所述主流访问路径和所述访问偏好确定所述预设群体的用户维护措施。
在该步骤中,在确定不同用户所属的活跃群体之后,每一个活跃群体中均存在有一定数量的用户,因此,可以提炼一个活跃群体中所有用户的共性特征,进而分析该活跃群体中的用户的访问行为,从而针对该活跃群体的访问行为作出不同的用户维护措施。可理解地,上述共性特征可以自各所述用户的主流访问路径和所述访问偏好中进行提取。
在一实施例中,可以根据所述预设群体中的所有所述用户的所述主流访问路径确定所述预设群体的用户的共性主流访问路径;此时,如图7所示,所述根据所述预设群体中的所有所述用户的所述主流访问路径和所述访问偏好确定所述预设群体的用户维护措施,包括:
S501,获取所述预设群体中的各所述用户的所有主流访问路径的类型,同时获取所述预设群体中所有所述用户的所有所述主流访问路径的第一总数量;其中,每一个所述用户的每一项所述主流访问路径均计入所述第一总数量中。
S502,确定每一类型的所述主流访问路径对应的所述用户的第一数量,将所述第一数量记录为该类型的主流访问路径的重合数量;也即,所述第一数量是指具有统一类型的主流访问路径的用户数量。
S503,通过以下数学模型计算每一类型主流访问路径的第一重合率:
A=Sa/So
其中:
A为一种类型的所述主流访问路径的所述第一重合率;
Sa为该类型的所述主流访问路径的重合数量;
So为所有所述用户的所有所述主流访问路径的第一总数量;
S504,将各类型的所述主流访问路径按照所述第一重合率由高至低的顺序插入预设的路径队列中。其中,一个预设群体对应于一个新建的路径队列。
S505,判断所述路径队列中排序最先的所述主流访问路径的类型对应的所述第一重合率是否超过第一预设重合率阈值(比如50%);也即,所述路径队列中排序最先的所述主流访问路径对应的所述第一重合率是指所述路径队列中重合率最高的。
S506,在超过所述第一预设重合率阈值时,将该类型的所述主流访问路径记录为所述预设群体的共性访问路径。也即,在本实施例中,由于该主流访问路径的第一重合率超过了第一预设重合率阈值,说明该第一重合率对应的主流访问路径代表了最大部分的用户的主流访问路径,可以将该类型的主流访问路径作为该预设群体的共性访问路径。
S507,在并未超过所述第一预设重合率阈值时,将所述路径队列中的排序在先的第一预设数量(比如路径队列中重合率顺序排名在前三)的各所述主流访问路径的类型,作为所述预设群体的所述共性访问路径。
同理,也可以根据对于主流访问路径的方式来确定该预设群体中用户的共性偏好,也即,可以根据所述预设群体中的所有所述用户的所述访问偏好确定所述预设群体的用户的共性访问偏好;此时,在一实施例中,如图8所示,所述根据所述预设群体中的所有所述用户的所述主流访问路径和所述访问偏好确定所述预设群体的用户维护措施,包括:
S508,获取所述预设群体中的各所述用户的所有访问偏好的类型,同时获取所有所述用户的所有所述访问偏好的第二总数量;其中,每一个所述用户的每一项所述访问偏好均计入所述第二总数量中。
S509,确定每一类型的所述访问偏好对应的所述用户的第二数量,将每一类型的所述访问偏好对应的所述用户的第二数量记录为该类型的访问偏好的重合数量;也即,所述第二数量是指具有统一类型的访问偏好的用户数量。
S510,通过以下数学模型计算每一类型访问偏好的第二重合率:
C=Sc/Sr
其中:
C为一种类型的所述类型访问偏好的第二重合率;
Sc为该类型的访问偏好的重合数量;
Sr为所有所述用户的所有所述访问偏好的第二总数量;
S511,将各类型的所述访问偏好按照所述第二重合率由高至低的顺序插入预设的偏好队列中。其中,一个预设群体对应于一个新建的偏好队列。
S512,判断所述偏好队列中排序最先的所述访问偏好的类型对应的所述第二重合率是否超过第二预设重合率阈值(比如45%);也即,所述偏好队列中排序最先的所述访问偏好对应的所述第二重合率是指所述偏好队列中重合率最高的。
S513,在超过所述第二预设重合率阈值时,将该类型的访问偏好作为所述预设群体的共性访问偏好;比如,在上述其中一类型的所述访问偏好的第二重合率是该预设群体中的最高重合率且该最高重合率超过第二预设重合率阈值(比如45%)时,由于该访问偏好的类型对应的所述第二重合率超过第二预设重合率阈值,说明该第二重合率对应的访问偏好代表了最大部分的用户的访问偏好,此时可将该访问偏好记录为该预设群体的共性访问偏好。
S514,在并未超过所述第二预设重合率阈值时,将所述偏好队列中的排序在先的第二预设数量(比如偏好队列中重合率顺序排名在前四)的各所述访问偏好的类型,作为所述预设群体的共性访问偏好。
可理解地,在本实施例中,仅对所述活跃群体中的部分预设群体(可以根据需求进行设定)进行分析,比如,将活跃群体中群体类型为沉默用户的活跃群体作为所述预设群体。
由上述可知,在该步骤中,可以首先根据所述预设群体中的所有所述用户的所述主流访问路径和所述访问偏好确定的一个活跃群体(预设群体)共性访问路径和共性偏好;作为优选,数据库中预存有一个路径-维护对照表;该路径-维护对照表中记录了每一个共性访问路径与其对应的用户维护措施之间的关联关系;同时,还存在一个喜好-维护对照表,该喜好-维护对照表中,记录了每一类用户的共性偏好与用户维护措施之间的关联关系;因此,在确定共性访问路径和共性偏好之后,在一实施例中,所述根据所述预设群体中的所有所述用户的所述主流访问路径和所述访问偏好确定所述预设群体的用户维护措施,包括:
A.根据所述共性访问路径在预设的路径-维护对照表中确定与所述共性访问路径对应的第一用户维护措施;其中,所述路径-维护对照表中记录了每一个所述共性访问路径与其对应的用户维护措施之间的关联关系;
B.根据所述共性偏好在喜好-维护对照表确定与所述共性偏好对应的第二用户维护措施;
C.对所述第一用户维护措施和所述第二用户维护措施进行去重处理之后,将去重之后的所述第一用户维护措施和所述第二用户维护措施记录为所述预设群体的用户维护措施。比如,所述预设群体的用户维护措施包括:根据用户的偏好,推送相关资讯;提供用户感兴趣的服务优惠券,唤醒用户活跃等。
可理解地,在确定预设群体的用户维护措施之后,可以向所述应用程序预设的维护人员发送对该活跃群体(群体类型为沉默用户)的维护预警以及确定的所述用户维护措施,进而根据该用户维护措施避免用户流失。
本发明可以通过对所述用户账户的注册时长达到预设时长的用户数据进行分析,划分所述用户所属的活跃群体,及提炼不同群体的有效特征,实现对各群体用户进行针对性维护,达到降低运营成本,减少客户流失的效果。
在一实施例中,提供一种用户访问数据处理装置,该用户访问数据处理装置与上述实施例中用户访问数据处理方法一一对应。如图9所示,该用户访问数据处理装置包括获取模块11、预处理模块12、第一确定模块13、第二确定模块14和第三确定模块15。各功能模块详细说明如下:
获取模块11,用于在用户已注册应用程序的用户账户,且所述用户账户的注册时长达到预设时长时,自数据库中获取所述用户通过所述用户账户在所述预设时长之内访问所应用程序的访问日期的数量,以及每一所述访问日期中每一次访问所述应用程序的访问数据;
预处理模块12,用于对所述用户的所有所述访问数据进行预处理;
第一确定模块13,用于根据预处理之后的所述访问数据确定所述用户的主流访问路径和访问偏好;
第二确定模块14,用于根据预处理之后的所述访问数据、所述用户在所述预设时长之内访问所应用程序的访问日期的数量,以及预设的群体划分规则确定所述用户所属的活跃群体;
第三确定模块15,用于获取所述活跃群体中预设群体中的所有所述用户的所述主流访问路径和所述访问偏好,根据所述预设群体中的所有所述用户的所述主流访问路径和所述访问偏好确定所述预设群体的用户维护措施。
关于用户访问数据处理装置的具体限定可以参见上文中对于用户访问数据处理方法的限定,在此不再赘述。上述用户访问数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种用户访问数据处理方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储器在存储在存储器上并可在处理器上运行的计算机可读指令。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机程序被处理器执行时以实现一种用户访问数据处理方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
在用户已注册应用程序的用户账户,且所述用户账户的注册时长达到预设时长时,自数据库中获取所述用户通过所述用户账户在所述预设时长之内访问所应用程序的访问日期的数量,以及每一所述访问日期中每一次访问所述应用程序的访问数据;
对所述用户的所有所述访问数据进行预处理;
根据预处理之后的所述访问数据确定所述用户的主流访问路径和访问偏好;
根据预处理之后的所述访问数据、所述用户在所述预设时长之内访问所应用程序的访问日期的数量,以及预设的群体划分规则确定所述用户所属的活跃群体;
获取所述活跃群体中预设群体中的所有所述用户的所述主流访问路径和所述访问偏好,根据所述预设群体中的所有所述用户的所述主流访问路径和所述访问偏好确定所述预设群体的用户维护措施。在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
在用户已注册应用程序的用户账户,且所述用户账户的注册时长达到预设时长时,自数据库中获取所述用户通过所述用户账户在所述预设时长之内访问所应用程序的访问日期的数量,以及每一所述访问日期中每一次访问所述应用程序的访问数据;
对所述用户的所有所述访问数据进行预处理;
根据预处理之后的所述访问数据确定所述用户的主流访问路径和访问偏好;
根据预处理之后的所述访问数据、所述用户在所述预设时长之内访问所应用程序的访问日期的数量,以及预设的群体划分规则确定所述用户所属的活跃群体;
获取所述活跃群体中预设群体中的所有所述用户的所述主流访问路径和所述访问偏好,根据所述预设群体中的所有所述用户的所述主流访问路径和所述访问偏好确定所述预设群体的用户维护措施。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (9)

1.一种用户访问数据处理方法,其特征在于,包括:
在用户已注册应用程序的用户账户,且所述用户账户的注册时长达到预设时长时,自数据库中获取所述用户通过所述用户账户在所述预设时长之内访问所应用程序的访问日期的数量,以及每一所述访问日期中每一次访问所述应用程序的访问数据;
对所述用户的所有所述访问数据进行预处理;
根据预处理之后的所述访问数据确定所述用户的主流访问路径和访问偏好;
根据预处理之后的所述访问数据、所述用户在所述预设时长之内访问所应用程序的访问日期的数量,以及预设的群体划分规则确定所述用户所属的活跃群体;
获取所述活跃群体中预设群体中的所有所述用户的所述主流访问路径和所述访问偏好,根据所述预设群体中的所有所述用户的所述主流访问路径和所述访问偏好确定所述预设群体的用户维护措施;所述访问路径为按照访问开始时间的先后进行排序;
每一项所述访问数据均包括该次访问所述应用程序的访问开始时间、访问结束时间、数据唯一标识;
所述对所述用户的所有所述访问数据进行预处理,包括:
根据每一项所述访问数据中的所述访问开始时间和所述访问结束时间获取该项所述访问数据对应的总访问时长;
自所述用户的所有所述访问数据中,将所述总访问时长小于预设的数据清洗时长的所述访问数据删除;所述删除为并不认为用户在登录过程中有任何的实质的使用所述应用程序或误操作的行为的访问数据删除;
自未删除的所有所述访问数据中,获取所述访问开始时间属于所述预设时长之内的同一所述访问日期的所述访问数据,按照所述访问开始时间的先后对属于所述访问日期的所述访问数据进行排序,并将排序后的所有属于所述访问日期的所述访问数据的所述数据唯一标识插入与所述访问日期关联的访问队列之后,将所述访问队列与所述用户账户关联存储至所述数据库。
2.如权利要求1所述的用户访问数据处理方法,其特征在于,每一项所述访问数据还包括该次访问所述应用程序的访问模块、针对每一所述访问模块进行访问的初始时间;
所述根据预处理之后的所述访问数据确定所述用户的主流访问路径和访问偏好,包括:
自所述数据库中获取所述访问队列中每一项所述访问数据中的所述访问模块,以及针对各所述访问模块进行访问的所述初始时间;
将获取的一项所述访问数据中的所述访问模块按照各所述访问模块进行访问的所述初始时间进行排序,确定该项所述访问数据中所述用户的访问路径;
自各项所述访问数据对应的访问路径中提取重复概率最高或重复概率超过预设重复阈值的路径段,并将所述路径段记录为主流访问路径。
3.如权利要求2所述的用户访问数据处理方法,其特征在于,每一项所述访问数据还包括该次访问所述应用程序的访问来源、针对每一所述访问模块进行访问的终止时间;
所述获取所述访问队列中每一项所述访问数据中的所述访问模块,以及针对各所述访问模块进行访问的所述初始时间和终止时间之后,包括:
根据获取的所述访问队列中的所有所述访问模块以及针对各所述访问模块进行访问的所述初始时间和所述终止时间,确定每一所述访问模块的模块访问次数、模块访问时长和模块访问数量;
根据所述模块访问次数、模块访问时长、模块访问数量以及每一次访问所述应用程序的访问来源,确定所述用户在所述访问队列对应的所述访问日期和/或所述预设时长中的访问偏好。
4.如权利要求1所述的用户访问数据处理方法,其特征在于,所述根据预处理之后的所述访问数据、所述用户在所述预设时长之内访问所应用程序的访问日期的数量,以及预设的群体划分规则确定所述用户所属的活跃群体,包括:
获取预处理之后的每一所述访问队列中的所述数据唯一标识的个数,并将所述访问队列中所述数据唯一标识的个数,记录为所述用户账户在所述访问队列对应的所述访问日期中访问所述应用程序的次数;
自预设的划分规则表中,查询与所述访问日期的数量或/和所述访问日期中访问所述应用程序的次数匹配的所述群体划分规则,并自所述划分规则表中获取与匹配的所述群体划分规则关联的群体类型之后,将获取的所述群体类型记录为与所述用户对应的活跃群体。
5.如权利要求1所述的用户访问数据处理方法,其特征在于,所述根据所述预设群体中的所有所述用户的所述主流访问路径和所述访问偏好确定所述预设群体的用户维护措施,包括:
获取所述预设群体中的各所述用户的所有主流访问路径的类型,同时获取所述预设群体中所有所述用户的所有所述主流访问路径的第一总数量;
确定每一类型的所述主流访问路径对应的所述用户的第一数量,将所述第一数量记录为该类型的主流访问路径的重合数量;
通过以下数学模型计算每一类型主流访问路径的第一重合率:
A=Sa/So
其中:
A为一种类型的所述主流访问路径的所述第一重合率;
Sa为该类型的所述主流访问路径的重合数量;
So为所有所述用户的所有所述主流访问路径的第一总数量;
将各类型的所述主流访问路径按照所述第一重合率由高至低的顺序插入预设的路径队列中;
判断所述路径队列中排序最先的所述主流访问路径的类型对应的所述第一重合率是否超过第一预设重合率阈值;
在超过所述第一预设重合率阈值时,将该类型的所述主流访问路径记录为所述预设群体的共性访问路径;
在并未超过所述第一预设重合率阈值时,将所述路径队列中的排序在先的第一预设数量的各所述主流访问路径的类型,作为所述预设群体的所述共性访问路径。
6.如权利要求1所述的用户访问数据处理方法,其特征在于,所述根据所述预设群体中的所有所述用户的所述主流访问路径和所述访问偏好确定所述预设群体的用户维护措施,包括:
获取所述预设群体中的各所述用户的所有访问偏好的类型,同时获取所有所述用户的所有所述访问偏好的第二总数量;
确定每一类型的所述访问偏好对应的所述用户的第二数量,将每一类型的所述访问偏好对应的所述用户的第二数量记录为该类型的访问偏好的重合数量;
通过以下数学模型计算每一类型访问偏好的第二重合率:
C=Sc/Sr
其中:
C为一种类型的所述类型访问偏好的第二重合率;
Sc为该类型的访问偏好的重合数量;
Sr为所有所述用户的所有所述访问偏好的第二总数量;
将各类型的所述访问偏好按照所述第二重合率由高至低的顺序插入预设的偏好队列中;
判断所述偏好队列中排序最先的所述访问偏好的类型对应的所述第二重合率是否超过第二预设重合率阈值;
在超过所述第二预设重合率阈值时,将该类型的访问偏好作为所述预设群体的共性访问偏好;
在并未超过所述第二预设重合率阈值时,将所述偏好队列中的排序在先的第二预设数量的各所述访问偏好的类型,作为所述预设群体的共性访问偏好。
7.一种用户访问数据处理装置,其特征在于,包括:
获取模块,用于在用户已注册应用程序的用户账户,且所述用户账户的注册时长达到预设时长时,自数据库中获取所述用户通过所述用户账户在所述预设时长之内访问所应用程序的访问日期的数量,以及每一所述访问日期中每一次访问所述应用程序的访问数据;
预处理模块,用于对所述用户的所有所述访问数据进行预处理;
第一确定模块,用于根据预处理之后的所述访问数据确定所述用户的主流访问路径和访问偏好;
第二确定模块,用于根据预处理之后的所述访问数据、所述用户在所述预设时长之内访问所应用程序的访问日期的数量,以及预设的群体划分规则确定所述用户所属的活跃群体;
第三确定模块,用于获取所述活跃群体中预设群体中的所有所述用户的所述主流访问路径和所述访问偏好,根据所述预设群体中的所有所述用户的所述主流访问路径和所述访问偏好确定所述预设群体的用户维护措施;所述访问路径为按照访问开始时间的先后进行排序;
每一项所述访问数据均包括该次访问所述应用程序的访问开始时间、访问结束时间、数据唯一标识;
所述预处理模块还用于:
根据每一项所述访问数据中的所述访问开始时间和所述访问结束时间获取该项所述访问数据对应的总访问时长;
自所述用户的所有所述访问数据中,将所述总访问时长小于预设的数据清洗时长的所述访问数据删除;所述删除为并不认为用户在登录过程中有任何的实质的使用所述应用程序或误操作的行为的访问数据删除;
自未删除的所有所述访问数据中,获取所述访问开始时间属于所述预设时长之内的同一所述访问日期的所述访问数据,按照所述访问开始时间的先后对属于所述访问日期的所述访问数据进行排序,并将排序后的所有属于所述访问日期的所述访问数据的所述数据唯一标识插入与所述访问日期关联的访问队列之后,将所述访问队列与所述用户账户关联存储至所述数据库。
8.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述用户访问数据处理方法的步骤。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述用户访问数据处理方法的步骤。
CN201910754752.XA 2019-08-15 2019-08-15 用户访问数据处理方法、装置、计算机设备及存储介质 Active CN110659269B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910754752.XA CN110659269B (zh) 2019-08-15 2019-08-15 用户访问数据处理方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910754752.XA CN110659269B (zh) 2019-08-15 2019-08-15 用户访问数据处理方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN110659269A CN110659269A (zh) 2020-01-07
CN110659269B true CN110659269B (zh) 2024-04-02

Family

ID=69037491

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910754752.XA Active CN110659269B (zh) 2019-08-15 2019-08-15 用户访问数据处理方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN110659269B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111274291B (zh) * 2020-01-20 2024-04-05 中国平安人寿保险股份有限公司 用户访问数据的查询方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243103A (zh) * 2015-09-19 2016-01-13 杭州电子科技大学 一种基于内容的推送时间确定方法
CN106022800A (zh) * 2016-05-16 2016-10-12 北京百分点信息科技有限公司 一种用户特征数据的处理方法和装置
CN108427700A (zh) * 2017-09-30 2018-08-21 平安科技(深圳)有限公司 电子装置、用户分群的方法及计算机可读存储介质
CN108874909A (zh) * 2018-05-28 2018-11-23 深圳壹账通智能科技有限公司 用户访问路径获取方法、服务器及计算机存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243103A (zh) * 2015-09-19 2016-01-13 杭州电子科技大学 一种基于内容的推送时间确定方法
CN106022800A (zh) * 2016-05-16 2016-10-12 北京百分点信息科技有限公司 一种用户特征数据的处理方法和装置
CN108427700A (zh) * 2017-09-30 2018-08-21 平安科技(深圳)有限公司 电子装置、用户分群的方法及计算机可读存储介质
CN108874909A (zh) * 2018-05-28 2018-11-23 深圳壹账通智能科技有限公司 用户访问路径获取方法、服务器及计算机存储介质

Also Published As

Publication number Publication date
CN110659269A (zh) 2020-01-07

Similar Documents

Publication Publication Date Title
WO2020140678A1 (zh) 异常申请检测方法、装置、计算机设备和存储介质
WO2018223719A1 (zh) 用户投保行为预测的方法、装置、计算设备及介质
CN108566618B (zh) 获取用户驻留规律的方法、装置、设备及存储介质
US9621726B2 (en) Computer-implemented system and method for detecting events for use in an automated call center environment
JP5551704B2 (ja) オンライン・マーケティング効率の評価
US20170063913A1 (en) Method, apparatus and system for detecting fraudulant software promotion
US20210209624A1 (en) Online platform for predicting consumer interest level
CN110674144A (zh) 用户画像生成方法、装置、计算机设备和存储介质
WO2019062078A1 (zh) 智能客服方法、电子装置及计算机可读存储介质
WO2019061664A1 (zh) 电子装置、基于用户上网数据的产品推荐方法及存储介质
US20140359009A1 (en) Prioritized content retrieval from social network servers
CN112416778A (zh) 测试用例推荐方法、装置和电子设备
CN112784168B (zh) 信息推送模型训练方法以及装置、信息推送方法以及装置
CN107844595A (zh) 一种求职网站职位智能推荐方法
CN112053176A (zh) 一种信息投放数据的分析方法、装置、设备及存储介质
CN110659269B (zh) 用户访问数据处理方法、装置、计算机设备及存储介质
CN113139826A (zh) 广告位的分配权限确定方法、装置、计算机设备
US11093957B2 (en) Techniques to quantify effectiveness of site-wide actions
CN113343024A (zh) 对象推荐方法、装置、电子设备及存储介质
US20160350774A1 (en) Segments of contacts
CN115879819A (zh) 企业信用评估方法及装置
CN110148011B (zh) 基于大数据的活跃量下降分析方法、装置、设备及介质
CN112818235A (zh) 基于关联特征的违规用户识别方法、装置和计算机设备
US8880546B1 (en) System, method, and computer program for refining a set of keywords utilizing historical activity thresholds
CN110753260B (zh) 广告数据监测方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant