CN110895588A - 一种数据处理方法及设备 - Google Patents

一种数据处理方法及设备 Download PDF

Info

Publication number
CN110895588A
CN110895588A CN201811067802.9A CN201811067802A CN110895588A CN 110895588 A CN110895588 A CN 110895588A CN 201811067802 A CN201811067802 A CN 201811067802A CN 110895588 A CN110895588 A CN 110895588A
Authority
CN
China
Prior art keywords
user
users
track
determining
residence time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811067802.9A
Other languages
English (en)
Other versions
CN110895588B (zh
Inventor
李雯雯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Communications Ltd Research Institute filed Critical China Mobile Communications Group Co Ltd
Priority to CN201811067802.9A priority Critical patent/CN110895588B/zh
Publication of CN110895588A publication Critical patent/CN110895588A/zh
Application granted granted Critical
Publication of CN110895588B publication Critical patent/CN110895588B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/52Network services specially adapted for the location of the user terminal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services

Abstract

本发明实施例提供一种数据处理方法及设备,该方法包括:在待分类用户集合中确定活动轨迹有规律的一个或多个用户;根据与一个或多个用户相关的业务信息,从一个或多个用户中确定一个或多个目标用户,以及一个或多个目标用户的业务偏好;根据一个或多个目标用户的业务偏好,确定推荐内容。本发明实施例中,通过在待分类用户集合中确定活动轨迹有规律的一个或多个用户,根据与该一个或多个用户相关的业务信息,确定出一个或多个目标用户,根据目标用户的业务偏好确定推荐内容,从而实现对用户进行更加精准的画像、分类和推荐。

Description

一种数据处理方法及设备
技术领域
本发明实施例涉及通信技术领域,特别涉及一种数据处理方法及设备。
背景技术
目前有一种边缘缓存的方案,参见图1,该边缘缓存的系统架构为:在边缘节点部署边缘分布式缓存(Edge Distributed Cache,EDC),多个EDC向上汇聚至部署在中心节点的个性化边缘缓存集群(Personalized Edge Caching Cluster,PECC),PECC向上与深度报文检测(Deep Packet Inspection,DPI)设备联通。
在该边缘缓存的方案中,根据用户移动的时间特征、空间特征、业务使用模式以及基站小区簇分布等对用户进行聚类,细分为具有{时间、地点、用户}&{时间、地点、业务}特征的群体,参见图2,图中示出了一种用户在不同维度聚类的结果。根据该聚类结果分别从移动轨迹{时间、地点、用户}角度、内容{时间、地点、业务}角度制定时空两维缓存优先级模板、分发调度策略等面向聚类用户的边缘缓存方案。
上述方案是针对理想现网数据而言的,用户均满足以下特征:
(1)在小区中驻留时间和出现次数具有一定的时空规律性;
(2)对业务大小类的使用模式具有一定规律性;
(3)业务小类和内容偏好可分为多个不同类别;
(4)业务流量、请求数、使用时长等排名靠前。
然而,从移动运行网DPI设备获取的用户数据,也可称为XDR(X Data Recording)详单并不一定满足上述期望。运行商的DPI数据与其他互联网的大数据不同,该DPI数据既包括用户面数据,也包括信令面数据。同时,用户面数据更多用于通信网络和移动业务的分析研究,并不能直接用于用户画像。以某移动运营商省级大数据平台汇总类XDR数据为例,该数据包括9个字段,如表1所示:
Figure BDA0001798748500000021
表1
参见图3,从小区中随机挑选出100个用户,绘制这100个用户应用大小类与地点时间的三维散点图关系。
由图3可知,每个用户的{时间、地点、业务}三维信息相互交织、重叠在一起,不同用户之间的三维信息又二次交叠。因此,基于现网DPI数据得到的图3与基于互联网数据得到的图2有较大差异,选取的样本个体、数量及时间长短,都会影响用户聚类效果,进而影响移动场景下的个性化边缘缓存方案的实施效果。
基于上述理由,目前亟需一种能够细化用户分类,从而准确为用户推荐符合用户偏好的内容的方案。
发明内容
本发明实施例提供一种数据处理方法及设备,解决现有处理方案无法准确为用户推荐符合用户偏好的内容的问题。
依据本发明实施例的第一方面,提供一种数据处理方法,所述方法包括:在待分类用户集合中确定活动轨迹有规律的一个或多个用户;根据与所述一个或多个用户相关的业务信息,从所述一个或多个用户中确定一个或多个目标用户,以及所述一个或多个目标用户的业务偏好;根据所述一个或多个目标用户的业务偏好,确定推荐内容。
可选地,所述在待分类用户集合中确定活动轨迹有规律的一个或多个用户,包括:获取所述待分类用户集合中每个用户在特定时间段内的活动轨迹和驻留时间;根据所述每个用户在特定时间段内的活动轨迹和驻留时间,确定所述每个用户的轨迹类型;根据所述每个用户的轨迹类型,在待分类用户集合中确定活动轨迹有规律的一个或多个用户。
可选地,所述根据所述每个用户在特定时间段内的活动轨迹和驻留时间,确定所述每个用户的轨迹类型,包括:当用户的活动轨迹出现在一个或多个连续预设时间间隔,途径小区的数量大于等于第一预设值,且在所述途径小区的驻留时间小于等于第二预设值时,确定所述用户的轨迹类型为移动轨迹,其中所述一个或多个连续预设时间间隔在第一特定时间段上;当用户的活动轨迹出现在一个或多个预设时间间隔,途径小区为一个小区或者为两个相邻的小区时,确定所述用户的轨迹类型为固定轨迹,其中,所述一个或多个预设时间间隔在第二特定时间段上;相应地,所述根据所述每个用户的轨迹类型,在待分类用户集合中确定活动轨迹有规律的一个或多个用户,包括:将所述轨迹类型为移动轨迹的用户确定为活动轨迹有规律的第一类用户,以及将所述轨迹类型为固定轨迹的用户确定为活动轨迹有规律的第二类用户。
可选地,当所述驻留时间以所述预设时间间隔连续分布时,所述驻留时间为多个连续分布的所述预设时间间隔相加;当所述驻留时间不连续分布时,所述驻留时间为所述预设时间间隔。
可选地,所述根据与所述一个或多个用户相关的业务信息,从所述一个或多个用户中确定一个或多个目标用户,以及所述一个或多个目标用户的业务偏好,包括:根据所述第一类用户和/或所述第二类用户的业务流量和业务使用频度,从所述第一类用户和/或所述第二类用户中确定一个或多个目标用户;根据所述一个或多个目标用户的业务请求信息,确定所述一个或多个目标用户的业务偏好。
依据本发明实施例的第二方面提供一种第一网络设备,包括:第一收发机和第一处理器,其中,所述第一处理器,用于在待分类用户集合中确定活动轨迹有规律的一个或多个用户;所述第一处理器,还用于根据与所述一个或多个用户相关的业务信息,从所述一个或多个用户中确定一个或多个目标用户,以及所述一个或多个目标用户的业务偏好;所述第一处理器,还用于根据所述一个或多个目标用户的业务偏好,确定推荐内容。
可选地,所述第一收发机,用于获取所述待分类用户集合中每个用户在特定时间段内的活动轨迹和驻留时间;所述第一处理器,还用于根据所述每个用户在特定时间段内的活动轨迹和驻留时间,确定所述每个用户的轨迹类型;所述第一处理器,还用于根据所述每个用户的轨迹类型,在待分类用户集合中确定活动轨迹有规律的一个或多个用户。
所述第一处理器,还用于当用户的活动轨迹出现在一个或多个连续预设时间间隔,途径小区的数量大于等于第一预设值,且在所述途径小区的驻留时间小于等于第二预设值时,确定所述用户的轨迹类型为移动轨迹,其中所述一个或多个连续预设时间间隔在第一特定时间段上;所述第一处理器,还用于当用户的活动轨迹出现在一个或多个预设时间间隔,途径小区为一个小区或者为两个相邻的小区时,确定所述用户的轨迹类型为固定轨迹,其中,所述一个或多个预设时间间隔在第二特定时间段上;所述第一处理器,还用于将所述轨迹类型为移动轨迹的用户确定为活动轨迹有规律的第一类用户,以及将所述轨迹类型为固定轨迹的用户确定为活动轨迹有规律的第二类用户。
可选地,当所述驻留时间以所述预设时间间隔连续分布时,所述驻留时间为多个连续分布的所述预设时间间隔相加;当所述驻留时间不连续分布时,所述驻留时间为所述预设时间间隔。
可选地,所述第一处理器,还用于根据所述第一类用户和/或所述第二类用户的业务流量和业务使用频度,从所述第一类用户和/或所述第二类用户中确定一个或多个目标用户;所述第一处理器,还用于根据所述一个或多个目标用户的业务请求信息,确定所述一个或多个目标用户的业务偏好。
依据本发明实施例的第三方面提供一种轨迹分类方法,所述方法包括:获取所述待分类用户集合中每个用户在特定时间段内的活动轨迹和驻留时间;根据所述每个用户在特定时间段内的活动轨迹和驻留时间,确定所述每个用户的轨迹类型;根据所述每个用户的轨迹类型,在待分类用户集合中确定活动轨迹有规律的一个或多个用户。
可选地,所述根据所述每个用户在特定时间段内的活动轨迹和驻留时间,确定所述每个用户的轨迹类型,包括:当用户的活动轨迹出现在一个或多个连续预设时间间隔,途径小区的数量大于等于第一预设值,且在所述途径小区的驻留时间小于等于第二预设值时,确定所述用户的轨迹类型为移动轨迹,其中所述一个或多个连续预设时间间隔在第一特定时间段上;当用户的活动轨迹出现在一个或多个预设时间间隔,途径小区为一个小区或者为两个相邻的小区时,确定所述用户的轨迹类型为固定轨迹,其中,所述一个或多个预设时间间隔在第二特定时间段上。
可选地,当所述驻留时间以所述预设时间间隔连续分布时,所述驻留时间为多个连续分布的所述预设时间间隔相加;当所述驻留时间不连续分布时,所述驻留时间为所述预设时间间隔。
依据本发明实施例的第四方面,提供一种第二网络设备,包括:第二收发机和第二处理器,其中,所述第二收发机,用于获取所述待分类用户集合中每个用户在特定时间段内的活动轨迹和驻留时间;所述第二处理器,用于根据所述每个用户在特定时间段内的活动轨迹和驻留时间,确定所述每个用户的轨迹类型;所述第二处理器,还用于根据所述每个用户的轨迹类型,在待分类用户集合中确定活动轨迹有规律的一个或多个用户。
可选地,所述第二处理器,还用于当用户的活动轨迹出现在一个或多个连续预设时间间隔,途径小区的数量大于等于第一预设值,且在所述途径小区的驻留时间小于等于第二预设值时,确定所述用户的轨迹类型为移动轨迹,其中所述一个或多个连续预设时间间隔在第一特定时间段上;所述第二处理器,还用于当用户的活动轨迹出现在一个或多个预设时间间隔,途径小区为一个小区或者为两个相邻的小区时,确定所述用户的轨迹类型为固定轨迹,其中,所述一个或多个预设时间间隔在第二特定时间段上。
可选地,当所述驻留时间以所述预设时间间隔连续分布时,所述驻留时间为多个连续分布的所述预设时间间隔相加;当所述驻留时间不连续分布时,所述驻留时间为所述预设时间间隔。
依据本发明实施例的第五方面提供一种网络设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面所述的数据处理方法的步骤,或者,如第三方面所述的轨迹分类方法的步骤。
依据本发明实施例的第五方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的数据处理方法的步骤,或者,如第三方面所述的轨迹分类方法的步骤。
本发明实施例中,通过在待分类用户集合中确定活动轨迹有规律的一个或多个用户,根据与该一个或多个用户相关的业务信息,确定出一个或多个目标用户,根据目标用户的业务偏好确定推荐内容,从而实现对用户进行更加精准的画像、分类和推荐。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一种现有的边缘缓存系统架构示意图;
图2为一种用户数据聚类结果的模型示意图;
图3为另一种用户数据聚类结果的模型示意图;
图4为本发明实施例提供的一种数据处理方法的流程示意图;
图5为图4中步骤401的流程示意图;
图6为本发明实施例提供的一种特定时间段的划分示意图;
图7为一种本发明实施例提供的用户分类的示意图;
图8为本发明实施例提供的一种第一网络设备;
图9为本发明实施例提供的一种第二网络设备;
图10为本发明实施例提供的一种网络设备。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图4,本发明实施例提供了一种数据处理方法,该方法的具体步骤如下:
步骤401:在待分类用户集合中确定活动轨迹有规律的一个或多个用户;
在本发明实施例中,待分类用户集合可以是根据来自深度报文检测(Deep PacketInspection,DPI)设备的用户数据得到的集合。
参见图5,确定活动轨迹有规律的用户的步骤如下:
步骤4011:获取待分类用户集合中每个用户在特定时间段内的活动轨迹和驻留时间;
在本发明实施例中,特定时间段是指按照预设时间粒度划分出的多个时间段,按照时间维度从大的预设时间粒度可划分为一周7天,隐含工作日和周末的不同模式;从小的预设时间粒度可划分为每天的不同时刻,以地铁小区为例,包括高峰时间段、非高峰时间段和非运营时间段。需要说明的是,高峰时间段、非高峰时间段均是针对工作日来说的,非运营时间段不区分工作日和周末。参见图6,图中示出一种针对地铁小区的特定时间段的划分方式;
其中,高峰时间段:6点至9点、17点至20点;
非高峰时间段:10点至16点、21点至22点;
非运营时间段:23点至次日5点。
上述活动轨迹包括用户在特定时间段内出现的时间,以及途径小区的信息和数量,上述驻留时间指的是用户在途径小区中的停留时长,结合活动轨迹和驻留时间两方面确定用户的轨迹类型。
步骤4012:根据每个用户在特定时间段内的活动轨迹和驻留时间,确定每个用户的轨迹类型;
在本发明实施例中,从时间、空间两维度进行分析,对用户进行轨迹分类。
具体地,包括以下至少一项:
(1)当用户的活动轨迹出现在一个或多个连续预设时间间隔,途径小区的数量大于等于第一预设值,且在途径小区的驻留时间小于等于第二预设值时,确定用户的轨迹类型为移动轨迹,其中一个或多个连续预设时间间隔在第一特定时间段上;
应当理解的是,当用户在多个预设时间间隔出现时,该多个预设时间间隔需要连续,表示该用户的活动是一个连续的状态。当用户恰好在预设时间间隔边界的时间点进入一新的小区,则在计算途径小区的数量时,需要对该新的小区进行计数,然后再判断途径小区的数量是否大于等于预设值。
上述第一预设值和第二预设值可以根据实际情况进行调整,例如:该第一预设值为3,当途径小区的数量大于等于3时,表示该用户在途径的小区数量比较多,该用户的活动具有规律性;可选地,上述途径小区可以通过演进通用陆地无线接入网络的小区标识(E-UTRAN Cell Identifier,ECI)确定。途径小区的驻留时间小于等于第二预设值,表示用户保持移动状态,例如:途径小区驻留时间为0。
上述第一特定时间段为根据实际应用场景设置的时间段,以图6中的时间段划分方式为例,第一特定时间段为运营时间段,即高峰时间段和非高峰时间段。针对地铁小区,移动轨迹对应于移动类的用户,例如上班族。
(2)当用户的活动轨迹出现在一个或多个预设时间间隔,途径小区为一个小区或者为两个相邻的小区时,确定用户的轨迹类型为固定轨迹,其中,一个或多个预设时间间隔在第二特定时间段上;
途径小区为一个小区或者为两个相邻的小区,表示用户的活动保持在一个或两个小区之间。由于相邻的小区,对应小区的ECI通常也相邻,所以也可以通过ECI判断途径小区是否为相邻的小区。
上述第二特定时间段为根据实际应用场景设置的时间段,以图6中的时间段划分方式为例,第二特定时间段为非运营时间段。针对地铁小区,固定轨迹对应于固定类的用户,例如常驻居民。
(3)除上述移动轨迹和固定轨迹的轨迹类型外,剩余轨迹的轨迹类型可统一归为其他轨迹。移动轨迹和固定轨迹相比于其他轨迹,规律性更强,便于后续确定业务内容的准确性。
需要说明的是,用户的活动轨迹还有一类特殊情况:用户仅在一个预设时间间隔出现过一次,且与前后均没有关联,即该用户的用户数据仅出现一次;或者,用户在一个预设时间间隔内,途径小区的数量小于预设值,且途径小区的驻留时间为0。
上述途径小区的数量低于预设值,表示该用户的小区数量比较少(例如少于3个),用户只是偶然出现,并不具有规律性。将这类用户的轨迹类型确定为单点轨迹,由于其对数据处理没有帮助,所以当确定轨迹类型为单点轨迹时,删除该单点轨迹。
上述驻留时间的确定,包括:当驻留时间以预设时间间隔连续分布时,则驻留时间为多个连续分布的预设时间间隔相加;当驻留时间不连续分布时,则驻留时间为预设时间间隔。
具体地,如表2所示,设预设时间间隔为15分钟,如果驻留时间(如data_hour,data_minute)是以15分钟连续分布,将所有时长直接相加;如果驻留时间(data_hour,data_minute)不连续分布,同一个时段的data_hour+data_minute记为15分钟,与驻留时间为0的情况区分;
Figure BDA0001798748500000091
表2
可以理解的是,驻留时间为0表示用户始终维持移动状态,没有在小区中进行停留。
步骤4013:根据每个用户的轨迹类型,在待分类用户集合中确定活动轨迹有规律的一个或多个用户;
在本发明实施例中,将轨迹类型为移动轨迹的用户确定为第一类用户,表示该用户为移动类用户,例如上班族;将轨迹类型为固定轨迹的用户确定为第二类用户,表示该用户为固定类用户,例如常驻居民。
可选地,从空间维度,通过用户途径的小区的覆盖范围(例如地铁室分、地铁+地下商场、地铁+地下商场+地上宏覆盖等场景)、不同小区的生活含义(例如住宅区、办公区、商业区等)以及不同用户的行为模式(例如乘坐、停留、驻留地铁等),进一步细分用户在空间维度上的数据差异,从而辅助确定活动轨迹的用户。
步骤402:根据与一个或多个用户相关的业务信息,从一个或多个用户中确定一个或多个目标用户,以及一个或多个目标用户的业务偏好;
在本发明实施例中,通过如图5所示流程确定出第一类用户和第二类用户,这两类用户具有如下的特征:
(1)在小区中的驻留时间和出现次数具有一定的时空规律性;
其中,时空规律性指的是该目标用户在特定时间段内出现在相同或相近的地点,例如:上班族在早晚高峰时间段移动路径基本保持不变。
(2)业务使用模式具有一定业务使用规律;
其中,业务使用规律是指该目标用户每次出现时使用的业务类型相同或相近,例如:用户使用的业务多数为视频业务。
(3)使用的业务类别可分为多个类别;
其中,业务类型是指该目标用户所使用的业务内容可以划分为多个类别,例如:用户使用视频业务,视频业务的内容可以分为财经、科技、教育等。
(4)业务流量、请求数、使用时长等业务相关参数排名靠前。
其中,相关参数排名靠前是指该目标用户对某一业务的投入高于其它业务,例如:用户使用的业务可能包括视频、聊天、文字编辑等多种业务,其中以视频业务的使用量高于其它业务。
需要说明的是,上述时空规律性或业务使用规律的判断依据可根据实际情况确定或调整,本发明实施例对该判断依据的具体内容不做具体限定。
根据与这些用户相关的业务信息,分析确定用户的业务偏好,从而确定推荐内容。为了进一步提高推荐内容的准确性,从第一类用户和第二类用户中筛选出目标用户。
参见图7,目标用户可能是第一类用户,也可能是第二类用户,目标用户在时空上的移动轨迹和驻留模式满足一定的规律性。
筛选出目标用户的步骤包括:根据第一类用户和/或第二类用户的业务流量和业务使用频度,从第一类用户和/或第二类用户中确定一个或多个目标用户。
在本发明实施例中,当第一类用户和/或第二类用户的业务流量和业务使用频度满足预设条件时,将该第一类用户和/或第二类用户中确定为目标用户。
以视频业务为例,从业务大类维度,确定用户在视频业务的投入情况,其中,业务流量包括:用户在视频业务的数据量、业务请求数、使用时长等,对应的预设条件为:用户在视频业务的数据量、业务请求数、使用时长等均高于其它类别的业务;业务使用频度包括:用户使用视频业务的频率,例如:一周使用视频业务的频率为4天,对应的预设条件为:用户在视频业务的投入呈现相似的规律,例如:一周使用视频业务的频率超过3天、每次使用的模式(数据量、业务请求数、使用时长等)类似。
通过上述方式筛选出目标用户后,需要确定与目标用户对应的业务偏好。该业务偏好可以根据用户主动访问的拉(PULL)操作统计得到。例如:视频业务为例,从业务小类维度,针对筛选出来的目标用户,分析每个目标用户对视频业务的投入(数据量、xdr条数、使用时长等),根据对视频APP的投入,判定每个目标用户分别是哪种视频APP的重度爱好者,从而确定该目标用户的偏好。
步骤403:根据一个或多个目标用户的业务偏好,确定推荐内容;
可选地,从机器学习模式识别角度,将每个用户一天的数据作为一次交易样本,所使用的每个视频APP作为该用户“购买”的“商品”,建立类似交易数据的“购物篮”,采用关联规则挖掘视频VIP用户所偏好的视频APP之间的潜在联系,可考虑在边缘缓存方案中进行捆绑推荐,增加用户对关联视频APP的使用率。
推荐系统也属于机器学习中的模式识别,针对每个视频VIP用户,基于该用户在视频业务小类的投入(数据量、xdr条数、使用时长等),对视频APP进行排序,模拟用户0~5分制打分或星号建立类似“user-item”的评分矩阵,采用推荐算法给出Top-N APP推荐或未知APP的预测评分值,并在边缘缓存方案中通过主动推(PUSH)方式对每个用户开展定向视频APP推荐。
本发明实施例中,通过在待分类用户集合中确定活动轨迹有规律的一个或多个用户,根据与该一个或多个用户相关的业务信息,确定出一个或多个目标用户,根据目标用户的业务偏好确定推荐内容,从而实现对用户进行更加精准的画像、分类和推荐。
参见图8,本发明实施例提供了一种第一网络设备800,所述第一网络设备800包括:第一收发机801和第一处理器802;
其中,所述第一处理器802,用于在待分类用户集合中确定活动轨迹有规律的一个或多个用户;
所述第一处理器802,还用于根据与所述一个或多个用户相关的业务信息,从所述一个或多个用户中确定一个或多个目标用户,以及所述一个或多个目标用户的业务偏好;
所述第一处理器802,还用于根据所述一个或多个目标用户的业务偏好,确定推荐内容。
可选地,所述第一收发机801,用于获取所述待分类用户集合中每个用户在特定时间段内的活动轨迹和驻留时间;
所述第一处理器802,还用于根据所述每个用户在特定时间段内的活动轨迹和驻留时间,确定所述每个用户的轨迹类型;
所述第一处理器802,还用于根据所述每个用户的轨迹类型,在待分类用户集合中确定活动轨迹有规律的一个或多个用户。
可选地,所述第一处理器802,还用于当用户的活动轨迹出现在一个或多个连续预设时间间隔,途径小区的数量大于等于第一预设值,且在所述途径小区的驻留时间小于等于第二预设值时,确定所述用户的轨迹类型为移动轨迹,其中所述一个或多个连续预设时间间隔在第一特定时间段上;
所述第一处理器802,还用于当用户的活动轨迹出现在一个或多个预设时间间隔,途径小区为一个小区或者为两个相邻的小区时,确定所述用户的轨迹类型为固定轨迹,其中,所述一个或多个预设时间间隔在第二特定时间段上;
所述第一处理器802,还用于将所述轨迹类型为移动轨迹的用户确定为活动轨迹有规律的第一类用户,以及将所述轨迹类型为固定轨迹的用户确定为活动轨迹有规律的第一类用户。
可选地,当所述驻留时间以所述预设时间间隔连续分布时,所述驻留时间为多个连续分布的所述预设时间间隔相加;
当所述驻留时间不连续分布时,所述驻留时间为所述预设时间间隔。
可选地,所述第一处理器802,还用于根据所述第一类用户和/或所述第二类用户的业务流量和业务使用频度,从所述第一类用户和/或所述第二类用户中确定一个或多个目标用户;
所述第一处理器802,还用于根据所述一个或多个目标用户的业务请求信息,确定所述一个或多个目标用户的业务偏好。
本发明实施例中,网络设备获取用户数据,并根据该用户数据确定用户类型,当用户类型为预设用户类型时筛选出目标用户,确定与该目标用户对应的业务内容,从而实现对用户进行更加精准的画像、分类和推荐,提供个性化边缘缓存服务。
参见图9,本发明实施例提供一种第二网络设备900,所述第二网络设备900包括:第二收发机901和第二处理器902;
其中,所述第二收发机901,用于获取所述待分类用户集合中每个用户在特定时间段内的活动轨迹和驻留时间;
所述第二处理器902,用于根据所述每个用户在特定时间段内的活动轨迹和驻留时间,确定所述每个用户的轨迹类型。
可选地,所述第二处理器902,还用于当用户的活动轨迹出现在一个或多个连续预设时间间隔,途径小区的数量大于等于第一预设值,且在所述途径小区的驻留时间小于等于第二预设值时,确定所述用户的轨迹类型为移动轨迹,其中所述一个或多个连续预设时间间隔在第一特定时间段上;
所述第二处理器902,还用于当用户的活动轨迹出现在一个或多个预设时间间隔,途径小区为一个小区或者为两个相邻的小区时,确定所述用户的轨迹类型为固定轨迹,其中,所述一个或多个预设时间间隔在第二特定时间段上。
可选地,当所述驻留时间以所述预设时间间隔连续分布时,所述驻留时间为多个连续分布的所述预设时间间隔相加;
当所述驻留时间不连续分布时,所述驻留时间为所述预设时间间隔。
参见图10,本发明实施例提供一种网络设备1000,包括:处理器1001、收发机1002、存储器1003和总线接口。
其中,处理器1001可以负责管理总线架构和通常的处理。存储器1003可以存储处理器1001在执行操作时所使用的数据。
本发明实施例中,网络设备1000还可以包括:存储在存储器1003上并可在处理器1001上运行的计算机程序,该计算机程序被处理器1001执行时实现本发明实施例提供的方法的步骤。
在图10中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器1001代表的一个或多个处理器和存储器1003代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本发明实施例不再对其进行进一步描述。总线接口提供接口。收发机1002可以是多个元件,即包括发送机和接收机,提供用于在传输介质上与各种其他装置通信的单元。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述网络接入的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (18)

1.一种数据处理方法,其特征在于,所述方法包括:
在待分类用户集合中确定活动轨迹有规律的一个或多个用户;
根据与所述一个或多个用户相关的业务信息,从所述一个或多个用户中确定一个或多个目标用户,以及所述一个或多个目标用户的业务偏好;
根据所述一个或多个目标用户的业务偏好,确定推荐内容。
2.根据权利要求1所述的方法,其特征在于,所述在待分类用户集合中确定活动轨迹有规律的一个或多个用户,包括:
获取所述待分类用户集合中每个用户在特定时间段内的活动轨迹和驻留时间;
根据所述每个用户在特定时间段内的活动轨迹和驻留时间,确定所述每个用户的轨迹类型;
根据所述每个用户的轨迹类型,在待分类用户集合中确定活动轨迹有规律的一个或多个用户。
3.根据权利要求2所述的方法,其特征在于,所述根据所述每个用户在特定时间段内的活动轨迹和驻留时间,确定所述每个用户的轨迹类型,包括:
当用户的活动轨迹出现在一个或多个连续预设时间间隔,途径小区的数量大于等于第一预设值,且在所述途径小区的驻留时间小于等于第二预设值时,确定所述用户的轨迹类型为移动轨迹,其中所述一个或多个连续预设时间间隔在第一特定时间段上;
当用户的活动轨迹出现在一个或多个预设时间间隔,途径小区为一个小区或者为两个相邻的小区时,确定所述用户的轨迹类型为固定轨迹,其中,所述一个或多个预设时间间隔在第二特定时间段上;
相应地,所述根据所述每个用户的轨迹类型,在待分类用户集合中确定活动轨迹有规律的一个或多个用户,包括:
将所述轨迹类型为移动轨迹的用户确定为活动轨迹有规律的第一类用户,以及将所述轨迹类型为固定轨迹的用户确定为活动轨迹有规律的第二类用户。
4.根据权利要求3所述的方法,其特征在于,
当所述驻留时间以所述预设时间间隔连续分布时,所述驻留时间为多个连续分布的所述预设时间间隔相加;
当所述驻留时间不连续分布时,所述驻留时间为所述预设时间间隔。
5.根据权利要求3所述的方法,其特征在于,所述根据与所述一个或多个用户相关的业务信息,从所述一个或多个用户中确定一个或多个目标用户,以及所述一个或多个目标用户的业务偏好,包括:
根据所述第一类用户和/或所述第二类用户的业务流量和业务使用频度,从所述第一类用户和/或所述第二类用户中确定一个或多个目标用户;
根据所述一个或多个目标用户的业务请求信息,确定所述一个或多个目标用户的业务偏好。
6.一种第一网络设备,其特征在于,包括:第一收发机和第一处理器,其中,
所述第一处理器,用于在待分类用户集合中确定活动轨迹有规律的一个或多个用户;
所述第一处理器,还用于根据与所述一个或多个用户相关的业务信息,从所述一个或多个用户中确定一个或多个目标用户,以及所述一个或多个目标用户的业务偏好;
所述第一处理器,还用于根据所述一个或多个目标用户的业务偏好,确定推荐内容。
7.根据权利要求6所述的第一网络设备,其特征在于,
所述第一收发机,用于获取所述待分类用户集合中每个用户在特定时间段内的活动轨迹和驻留时间;
所述第一处理器,还用于根据所述每个用户在特定时间段内的活动轨迹和驻留时间,确定所述每个用户的轨迹类型;
所述第一处理器,还用于根据所述每个用户的轨迹类型,在待分类用户集合中确定活动轨迹有规律的一个或多个用户。
8.根据权利要求7所述的第一网络设备,其特征在于,
所述第一处理器,还用于当用户的活动轨迹出现在一个或多个连续预设时间间隔,途径小区的数量大于等于第一预设值,且在所述途径小区的驻留时间小于等于第二预设值时,确定所述用户的轨迹类型为移动轨迹,其中所述一个或多个连续预设时间间隔在第一特定时间段上;
所述第一处理器,还用于当用户的活动轨迹出现在一个或多个预设时间间隔,途径小区为一个小区或者为两个相邻的小区时,确定所述用户的轨迹类型为固定轨迹,其中,所述一个或多个预设时间间隔在第二特定时间段上;
所述第一处理器,还用于将所述轨迹类型为移动轨迹的用户确定为活动轨迹有规律的第一类用户,以及将所述轨迹类型为固定轨迹的用户确定为活动轨迹有规律的第二类用户。
9.根据权利要求8所述的第一网络设备,其特征在于,
当所述驻留时间以所述预设时间间隔连续分布时,所述驻留时间为多个连续分布的所述预设时间间隔相加;
当所述驻留时间不连续分布时,所述驻留时间为所述预设时间间隔。
10.根据权利要求8所述的第一网络设备,其特征在于,
所述第一处理器,还用于根据所述第一类用户和/或所述第二类用户的业务流量和业务使用频度,从所述第一类用户和/或所述第二类用户中确定一个或多个目标用户;
所述第一处理器,还用于根据所述一个或多个目标用户的业务请求信息,确定所述一个或多个目标用户的业务偏好。
11.一种轨迹分类方法,其特征在于,所述方法包括:
获取所述待分类用户集合中每个用户在特定时间段内的活动轨迹和驻留时间;
根据所述每个用户在特定时间段内的活动轨迹和驻留时间,确定所述每个用户的轨迹类型。
12.根据权利要求11所述的方法,其特征在于,所述根据所述每个用户在特定时间段内的活动轨迹和驻留时间,确定所述每个用户的轨迹类型,包括:
当用户的活动轨迹出现在一个或多个连续预设时间间隔,途径小区的数量大于等于第一预设值,且在所述途径小区的驻留时间小于等于第二预设值时,确定所述用户的轨迹类型为移动轨迹,其中所述一个或多个连续预设时间间隔在第一特定时间段上;
当用户的活动轨迹出现在一个或多个预设时间间隔,途径小区为一个小区或者为两个相邻的小区时,确定所述用户的轨迹类型为固定轨迹,其中,所述一个或多个预设时间间隔在第二特定时间段上。
13.根据权利要求12所述的方法,其特征在于,
当所述驻留时间以所述预设时间间隔连续分布时,所述驻留时间为多个连续分布的所述预设时间间隔相加;
当所述驻留时间不连续分布时,所述驻留时间为所述预设时间间隔。
14.一种第二网络设备,其特征在于,包括:第二收发机和第二处理器,其中,
所述第二收发机,用于获取所述待分类用户集合中每个用户在特定时间段内的活动轨迹和驻留时间;
所述第二处理器,用于根据所述每个用户在特定时间段内的活动轨迹和驻留时间,确定所述每个用户的轨迹类型。
15.根据权利要求14所述的第二网络设备,其特征在于,
所述第二处理器,还用于当用户的活动轨迹出现在一个或多个连续预设时间间隔,途径小区的数量大于等于第一预设值,且在所述途径小区的驻留时间小于等于第二预设值时,确定所述用户的轨迹类型为移动轨迹,其中所述一个或多个连续预设时间间隔在第一特定时间段上;
所述第二处理器,还用于当用户的活动轨迹出现在一个或多个预设时间间隔,途径小区为一个小区或者为两个相邻的小区时,确定所述用户的轨迹类型为固定轨迹,其中,所述一个或多个预设时间间隔在第二特定时间段上。
16.根据权利要求15所述的第二网络设备,其特征在于,
当所述驻留时间以所述预设时间间隔连续分布时,所述驻留时间为多个连续分布的所述预设时间间隔相加;
当所述驻留时间不连续分布时,所述驻留时间为所述预设时间间隔。
17.一种网络设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的数据处理方法的步骤,或者,如权利要求11至13中任一项所述的轨迹分类方法的步骤。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的数据处理方法的步骤,或者,如权利要求11至13中任一项所述的轨迹分类方法的步骤。
CN201811067802.9A 2018-09-13 2018-09-13 一种数据处理方法及设备 Active CN110895588B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811067802.9A CN110895588B (zh) 2018-09-13 2018-09-13 一种数据处理方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811067802.9A CN110895588B (zh) 2018-09-13 2018-09-13 一种数据处理方法及设备

Publications (2)

Publication Number Publication Date
CN110895588A true CN110895588A (zh) 2020-03-20
CN110895588B CN110895588B (zh) 2022-07-22

Family

ID=69785220

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811067802.9A Active CN110895588B (zh) 2018-09-13 2018-09-13 一种数据处理方法及设备

Country Status (1)

Country Link
CN (1) CN110895588B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115438824A (zh) * 2021-06-03 2022-12-06 中国移动通信集团四川有限公司 地铁站入站耗时的预测方法及计算机可读存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090106040A1 (en) * 2007-10-23 2009-04-23 New Jersey Institute Of Technology System And Method For Synchronous Recommendations of Social Interaction Spaces to Individuals
CN101420653A (zh) * 2008-12-08 2009-04-29 中国移动通信集团浙江有限公司 一种衡量用户数据业务活跃度和偏好的系统及其方法
EP2259225A1 (en) * 2009-06-01 2010-12-08 Alcatel Lucent Automatic 3D object recommendation device in a personal physical environment
CN102594870A (zh) * 2011-05-31 2012-07-18 北京亿赞普网络技术有限公司 一种云计算平台、云计算系统及其业务信息发布方法
CN103607691A (zh) * 2013-11-26 2014-02-26 中国联合网络通信集团有限公司 一种流量套餐推荐方法及装置
CN105389332A (zh) * 2015-10-13 2016-03-09 广西师范学院 一种地理社交网络下的用户相似性计算方法
CN105847310A (zh) * 2015-01-13 2016-08-10 中国移动通信集团江苏有限公司 一种确定位置的方法及装置
CN105975479A (zh) * 2016-04-20 2016-09-28 重庆重邮汇测通信技术有限公司 一种基于标签库的电信用户兴趣度分析方法及系统
CN107027134A (zh) * 2016-02-01 2017-08-08 上海无线通信研究中心 一种用户自定义的无线通信网络方法及系统
CN107798557A (zh) * 2017-09-30 2018-03-13 平安科技(深圳)有限公司 电子装置、基于lbs数据的服务场所推荐方法及存储介质
CN107818491A (zh) * 2017-09-30 2018-03-20 平安科技(深圳)有限公司 电子装置、基于用户上网数据的产品推荐方法及存储介质
CN108282860A (zh) * 2017-01-05 2018-07-13 中国移动通信集团山西有限公司 数据处理方法及装置
CN108289279A (zh) * 2018-01-30 2018-07-17 浙江省公众信息产业有限公司 定位信息的处理方法、装置和计算机可读存储介质
CN108463271A (zh) * 2015-08-28 2018-08-28 伊虎智动有限责任公司 用于运动技能分析以及技能增强和提示的系统和方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090106040A1 (en) * 2007-10-23 2009-04-23 New Jersey Institute Of Technology System And Method For Synchronous Recommendations of Social Interaction Spaces to Individuals
CN101420653A (zh) * 2008-12-08 2009-04-29 中国移动通信集团浙江有限公司 一种衡量用户数据业务活跃度和偏好的系统及其方法
EP2259225A1 (en) * 2009-06-01 2010-12-08 Alcatel Lucent Automatic 3D object recommendation device in a personal physical environment
CN102594870A (zh) * 2011-05-31 2012-07-18 北京亿赞普网络技术有限公司 一种云计算平台、云计算系统及其业务信息发布方法
CN103607691A (zh) * 2013-11-26 2014-02-26 中国联合网络通信集团有限公司 一种流量套餐推荐方法及装置
CN105847310A (zh) * 2015-01-13 2016-08-10 中国移动通信集团江苏有限公司 一种确定位置的方法及装置
CN108463271A (zh) * 2015-08-28 2018-08-28 伊虎智动有限责任公司 用于运动技能分析以及技能增强和提示的系统和方法
CN105389332A (zh) * 2015-10-13 2016-03-09 广西师范学院 一种地理社交网络下的用户相似性计算方法
CN107027134A (zh) * 2016-02-01 2017-08-08 上海无线通信研究中心 一种用户自定义的无线通信网络方法及系统
CN105975479A (zh) * 2016-04-20 2016-09-28 重庆重邮汇测通信技术有限公司 一种基于标签库的电信用户兴趣度分析方法及系统
CN108282860A (zh) * 2017-01-05 2018-07-13 中国移动通信集团山西有限公司 数据处理方法及装置
CN107798557A (zh) * 2017-09-30 2018-03-13 平安科技(深圳)有限公司 电子装置、基于lbs数据的服务场所推荐方法及存储介质
CN107818491A (zh) * 2017-09-30 2018-03-20 平安科技(深圳)有限公司 电子装置、基于用户上网数据的产品推荐方法及存储介质
CN108289279A (zh) * 2018-01-30 2018-07-17 浙江省公众信息产业有限公司 定位信息的处理方法、装置和计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
翟婧: "移动网络数据分析方法及应用综述", 《电信技术》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115438824A (zh) * 2021-06-03 2022-12-06 中国移动通信集团四川有限公司 地铁站入站耗时的预测方法及计算机可读存储介质
CN115438824B (zh) * 2021-06-03 2023-09-22 中国移动通信集团四川有限公司 地铁站入站耗时的预测方法及计算机可读存储介质

Also Published As

Publication number Publication date
CN110895588B (zh) 2022-07-22

Similar Documents

Publication Publication Date Title
Li et al. Contact-aware data replication in roadside unit aided vehicular delay tolerant networks
JP5134091B2 (ja) 移動環境においてキャッシュ逸失状態マッチインジケータを使用して、ターゲット・コンテンツ・メッセージのユーザ適合性を判定するための方法およびシステム
CN104750760B (zh) 一种推荐应用软件的实现方法及装置
CN104077915A (zh) 乘车趋势预测装置及其方法
CN109272360B (zh) 一种广告智能推荐方法、系统及装置
US20140045476A1 (en) Techniques for Improving Cache Effectiveness of Caches with Low User Population
CN109768869A (zh) 一种业务预测方法、系统和计算机存储介质
Goyal et al. Dynamic user preference based network selection for vertical handoff in heterogeneous wireless networks
Malandra et al. A case study for M2M traffic characterization in a smart city environment
US20210337400A1 (en) Identification and prioritization of optimum capacity solutions in a telecommunications network
US20150289231A1 (en) Method and apparatus for scheduling delivery of content according to quality of service parameters
CN105408894A (zh) 一种用户身份类别确定方法以及装置
CN110895588B (zh) 一种数据处理方法及设备
Hindia et al. A novel scheduling algorithm based on game theory and multicriteria decision making in LTE network
CN107846614B (zh) 一种视频流量调度方法、装置及电子设备
CN103634470A (zh) 一种基于终端移动数据接入网Qos的人机交互预测方法
US20130179223A1 (en) Method and arrangement for segmentation of telecommunication customers
Meuser et al. Relevance-aware information dissemination in vehicular networks
JP6105660B2 (ja) 広告配信管理装置および広告配信管理方法
US9965777B2 (en) Advertisement distribution management apparatus and advertisement distribution management method
CN107800650A (zh) 一种调整运营管道资源占用的方法及装置
Cui et al. Risk and decision analysis of dynamic spectrum access
Cardell-Oliver et al. Profiling urban activity hubs using transit smart card data
CN114007186A (zh) 定位方法及相关产品
Pan et al. Fl-asb: a fuzzy logic based adaptive-period single-hop broadcast protocol

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant