CN102567425A - 一种数据的处理方法和设备 - Google Patents
一种数据的处理方法和设备 Download PDFInfo
- Publication number
- CN102567425A CN102567425A CN2010106228102A CN201010622810A CN102567425A CN 102567425 A CN102567425 A CN 102567425A CN 2010106228102 A CN2010106228102 A CN 2010106228102A CN 201010622810 A CN201010622810 A CN 201010622810A CN 102567425 A CN102567425 A CN 102567425A
- Authority
- CN
- China
- Prior art keywords
- preference
- user
- gprs
- stability bandwidth
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000009826 distribution Methods 0.000 claims description 10
- 238000003672 processing method Methods 0.000 claims description 9
- 230000003542 behavioural effect Effects 0.000 claims description 7
- 238000004891 communication Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 abstract description 44
- 230000000875 corresponding effect Effects 0.000 description 34
- 230000006399 behavior Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 11
- 238000010206 sensitivity analysis Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000009412 basement excavation Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 238000012113 quantitative test Methods 0.000 description 2
- 241001074085 Scophthalmus aquosus Species 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000012098 association analyses Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000010921 in-depth analysis Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种数据的处理方法和设备,该方法包括:获取偏好数据和GPRS波动率;根据所述偏好数据和GPRS波动率确定偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系;根据所述偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系确定用户具有的偏好。本发明实施例中,可以综合分析大量数据得到更全面的分析结果,提高结果的准确度;而且采用全自动的分析方式,有效避免了预先设定阈值的操作。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种数据的处理方法和设备。
背景技术
当前移动运营商对用户偏好的分析可采用用户交互式方式和用户业务使用行为统计方式。其中,用户交互式方式是通过与用户的互动提取用户的偏好数据,该方式获得的用户偏好数据较为准确。用户业务使用行为统计方式通过对用户订购和使用各种业务的行为进行统计分析,对数据业务的订购信息、WAP网址的访问情况、使用情况(使用时长、使用频率)及产生的流量等信息进行统计分析得出用户的偏好。例如,用户订购手机新闻相关业务或利用手机浏览新闻类网页时,则认为用户具有新闻类偏好;用户浏览某些体育类网站次数较多时,则用户可能对体育信息具有偏好;用户订购交通信息类的相关数据业务,并在此类业务上产生相应的GPRS(General Packet RadioService,通用分组无线服务)流量时,则用户可能会对与汽车相关的信息具有偏好。因此,该方式可通过对历史数据进行统计总结出用户偏好,并对大规模用户进行分析。
在实现本发明的过程中,发明人发现现有技术中至少存在以下问题:
用户交互式方式需要由移动运营商给出供用户选择的偏好范围,能够分析的用户偏好有限,如果用户真实偏好不在运营商所提供的偏好范围内,该方式会失效,从而不能全面掌握用户的偏好情况。
用户业务使用行为统计方式在统计过程中需要设定相应的阈值,如果阈值设定过低,会导致分析出用户具有大量偏好,而其中部分偏好是错误的;如果阈值设定过高,会导致丢失用户的一些偏好,分析结果不完全;目前为止并没有好的方法来设定阈值,仅凭借业务人员的经验进行人为设定,不能保证阈值设定适当,无法自动化的使用;而且由于用户之间存在不同,每次重新使用或应用背景环境发生变化时,需要人为重新设定。
发明内容
本发明实施例提供一种数据的处理方法和设备,以根据偏好数据确定用户偏好。
为了达到上述目的,本发明实施例提供一种数据的处理方法,包括:
获取偏好数据和GPRS波动率;
根据所述偏好数据和GPRS波动率确定偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系;
根据所述偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系确定用户具有的偏好。
本发明实施例提供一种数据的处理设备,包括:
获取模块,用于获取偏好数据和GPRS波动率;
第一确定模块,用于根据所述偏好数据和GPRS波动率确定偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系;
第二确定模块,用于根据所述偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系确定用户具有的偏好。
与现有技术相比,本发明至少具有以下优点:
可以综合分析大量数据得到更全面的分析结果,提高结果的准确度;而且采用全自动的分析方式,有效避免了预先设定阈值的操作。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种数据的处理方法流程示意图;
图2是本发明实施例一中用户特征网络示意图;
图3是本发明实施例一中用户偏好自动分析系统示意图;
图4是本发明实施例二提供的一种数据的处理设备结构示意图。
具体实施方式
现有技术中,用户交互式方式不能全面掌握用户的偏好情况。用户业务使用行为统计方式的问题包括:(1)不能保证阈值设定适当。(2)仅能定性分析用户是否具有某种偏好,无法很好的定量对用户的这些偏好的强弱程度进行分析。其中,如果用户对某种业务使用较多,则说明用户的相应偏好比较强烈。例如,用户浏览体育类的网页多于新闻类的网页,则说明用户的体育类偏好强于新闻类;用户使用移动导航业务所产生的GPRS流量多于手机阅读所产生的GPRS流量,则说明用户对于导航类偏好要强于阅读类偏好。但由于业务涉及模式的不同和业务内容的不同,该分析方式是不合理的。例如,某些体育类内容的路径较长,用户需要多浏览很多网页才能看到想看的内容,这种情况下不能说明用户的体育类偏好强于新闻类偏好;导航类业务由于要下载地图,所产生的GPRS流量高于下载书籍所产生的GPRS流量,因此也不能说明用户对导航类的偏好强于阅读类的偏好;因此,现有技术衡量偏好强弱的方式是不合理的。
(3)对用户偏好的分析是基于用户业务使用行为的,且对于用户偏好的分析是每项偏好独立分析的,从而导致只能对业务使用比较活跃、已经明显表现出业务使用偏好的用户进行分析;而对业务量较少、用户尚未明显表示出来的潜在偏好则无能为力;同时并没有将所有的用户偏好联合起来分析。
(4)仅仅分析用户具有哪项偏好,而没有分析这些偏好之间的联系。例如,分析得出用户具有导航类业务的偏好就停止了,但使用导航类的用户可能会对与汽车相关的业务同样具有偏好;使用导航的用户往往年纪较轻,可能对电影、音乐、游戏类的业务也有相应的偏好;因此现有技术对用户偏好的挖掘是不完全的。
实际应用中,移动运营商通常根据用户的偏好来对用户进行业务推荐,但由于现有用户偏好分析方法的缺陷,移动运营商通常只能向用户进行单一的业务推荐,而没有好的方法进行业务的组合推荐。
针对上述问题,本发明实施例提供一种数据的处理方法和设备,以用户的历史行为数据为基础进行分析,利用网络模型(例如,机器学习方法论中的贝叶斯网络(Bayesian Network)模型)建立用户特征网络,进一步基于用户特征网络进行用户偏好分析。
具体的,本发明实施例中,提出一种基于用户特征网络的用户偏好分析方法,可以有效的避免人为设定阈值的过程,使偏好分析能够自动化的进行,使偏好分析能够有机的纳入用户偏好自动分析系统中;而且利用特征网络的敏感度分析技术,可衡量用户偏好强弱;而基于用户特征网络,可分析用户偏好之间的关联性,挖掘出用户的潜在的偏好。
进一步的,在完成偏好分析之后,利用偏好分析的结果构建用户偏好自动分析系统,该系统主要包含用户的各类偏好信息以及用户对各类偏好的喜好程度,并以用户标签的形式保存在系统中。该系统可自动采集用户的历史数据,进行用户偏好分析,利用分析的结果对用户进行标签信息化;对外提供用户偏好搜索功能,提供基于偏好的用户名单搜索等。
下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本发明实施例一提供一种数据的处理方法,通过对用户的历史行为数据进行分析,并基于用户的行为数据以及利用网络模型建立用户特征网络,进一步利用用户特征网络进行用户偏好的深入分析。如图1所示,该数据的处理方法包括以下步骤:
步骤101,获取偏好数据和GPRS波动率。实际应用中,可首先执行数据准备过程,该数据准备过程需要进行数据收集和变量设计,从而可获取偏好数据和GPRS波动率。
(a)在数据收集过程中,收集的内容包括但不限于以下变量的一种或几种:用户基本属性(如用户年龄、性别、收入等)、用户通话行为数据(如用户的MOU、APPU、日均通话时长等)、用户订购关系数据、SP梦网信息数据、用户访问WAP的数据、用户的GPRS流量类数据(如用户使用每项业务所产生的GPRS流量)等。其中,上述数据可按照预设周期(如日频率、周频率、时频率等)进行收集,并可对上述数据进行离散化处理。
(b)在变量设计过程中,相关的变量包括但不限于:所收集数据的变量(如用户基本属性等);根据分析需要构建的标识型偏好类变量、GPRS波动率等。
其中,偏好类变量可为游戏类偏好、新闻类偏好、体育类偏好等,因此,对于收集的数据,可针对各偏好类变量确定为相应的偏好数据。上述偏好类变量可根据现有的业务进行总结,并可总结出多个偏好类变量,对于每一个偏好类变量,如果用户预设周期(如当天使用等)内使用了该类偏好相关的业务或访问了该类偏好相关的网站时,则将该偏好变量值置为1,反之则置为0,从而可得到一组代表用户偏好的二值变量。
另外,GPRS波动率(利用GPRS流量构建的网络核心变量)为基于预设周期的GPRS波动率(如基于当天流量的GPRS流量日波动率、基于当周流量的GPRS流量周波动率等),该GPRS波动率的获取方式包括:根据当前周期的GPRS流量和前一周期的GPRS流量获取该GPRS波动率。本发明实施例中以天为例进行说明,则GPRS波动率的定义如公式(1)所示:
其中,GPRStoday表示用户预设周期(如当天)的GPRS流量,GPRSpreday表示用户在前一天(前一周期)的GPRS流量,而变量Rate_GPRS为用户当天GPRS波动率,反映了用户GPRS流量相对于前一天的变化情况。
实际应用中,用户的某类偏好会导致用户对相关业务的使用,而对业务的使用将产生GPRS流量,本发明实施例中,利用GPRS流量来衡量用户的偏好;而且由于不同业务所产生的GPRS流量大小与业务的特性具有很大联系,因此本发明实施例中采用比率的形式,利用每个预设周期内GPRS的变化率来反映用户基于偏好所产生的业务行为,该变量GPRS波动率是实值的连续变量,可采用如下方式对其进行离散化:如果变量值大于0,将1作为其离散值,如果变量值小于0,将-1作为其离散值,如果变量值等于0,将0作为其离散值。
步骤102,根据偏好数据和GPRS波动率确定偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系。
实际应用中,可通过构建用户特征网络的方式确定偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系。其中,当数据准备完成之后,则可以利用获取到的相关数据构建用户特征网络。
本发明实施例中,可采用MDL(特征网络)函数(如公式2所示)评价网络得分,并利用爬山算法进行搜索,选择得分最低的网络结构作为最优的网络结构,并将最优的网络结构定义为用户特征网络。实际应用中,还可以采用其他算法定义用户特征网络,在此不再赘述。
在公式(2)中,N表示样本量,H(Xi|Pa(Xi))表示信息熵、Entropy表示熵值、Xi表示偏好数据、Pa(Xi)表示其他变量。
在用户特征网络的学习过程中,为了获知各变量与GPRS波动率的关系,可预先规定学习原则,将变量GPRS波动率作为网络的核心变量,要求所有学习到的变量均指向该变量GPRS波动率,而不能由该变量GPRS波动率指向其他变量。
基于上述用户特征网络的特点,从业务角度来看,相应的用户特征网络可以为图2所示的贝叶斯网络(以网络模型为贝叶斯网络为例进行说明),该贝叶斯网络是概率论与图论的结合体,外在表现形式为有向无环图,由节点和连接各个节点的有向边构成;网络节点表示领域变量,有向边表示变量之间的相互影响(或是因果)关系。例如,如果存在一条有向边由节点A指向节点B,则表示节点A对节点B有直接的影响关系(或是因果关系)。在贝叶斯网络中的每个节点上,均附着条件概率表,该表中的概率值表示当该节点取某个值时,其直接影响的节点取相应值的概率大小。
步骤103,根据偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系确定用户具有的偏好。
在用户特征网络构建完成之后,根据贝叶斯网络的含义,可直观的得出相关变量之间的相互影响关系。具体的,在确定偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系时,可根据贝叶斯网络确定偏好之间具有指向关系或者不具有指向关系;确定偏好与GPRS波动率之间具有指向关系或者不具有指向关系。
本步骤中,当偏好与GPRS波动率之间具有指向关系时,则确定用户具有该偏好;例如,在图2所示的用户特征网络中,游戏类偏好、体育类偏好与GPRS波动率之间具有指向关系,即游戏类偏好、体育类偏好会直接影响GPRS波动率,因此可确定用户具有相应的游戏类偏好、体育类偏好。
实际应用中,用户虽然具有某方面的偏好,但会由于对移动运营商相关业务不熟悉,导致并不具有相关业务的使用行为,因此用户具有一定的潜在偏好,本发明实施例中,可进行潜在用户偏好挖掘。
本步骤中,当某偏好(如偏好1)与GPRS波动率之间不具有指向关系时,如果和偏好1具有指向关系的其他偏好(如偏好2)与GPRS波动率之间具有指向关系,则可确定偏好1为用户的潜在偏好。
具体的,在图2所示的用户特征网络中,新闻类偏好与GPRS波动率之间不具有指向关系,新闻类偏好并不对用户的GPRS变化产生影响,则可说明新闻类偏好不是用户明确显示出的偏好,但用户已明确显示出的财经类偏好指向了新闻类偏好,则说明新闻类偏好可能是用户的一种潜在偏好。
综上所述,通过上述方式确定用户偏好,可有效的避免繁琐的阈值设定过程,具有较好的理论基础,能够自动的对数据进行学习,得出用户的偏好。同时使用户各种偏好与各种基本属性数据、通话行为数据等数据的关系一目了然,更有助于业务使用人员对偏好形成的理解和分析。
本发明实施例中,进行潜在用户偏好挖掘的过程中,首先从构建的用户特征网络上直接读出具有联系的用户偏好,之后利用敏感度分析技术,分析具有联系的偏好之间的敏感度,如果偏好之间的敏感关系的置信程度超过预设数值(如50%),则认为这些偏好是用户的潜在偏好。例如,在图2中,如果财经类偏好和新闻类偏好之间的敏感度的置信程度超过了50%,则说明这两类偏好之间具有很强的敏感性,用户具有财经类偏好,同时也具有新闻类偏好,确定新闻类偏好为用户的潜在偏好。
步骤104,分析用户具有偏好的强弱程度。其中,利用用户特征网络,可直接得到用户的偏好,而结果是一个定性的结果,需进一步的进行定量分析,对用户具有的各种偏好的强弱程度进行分析。
实际应用中,用户较为强烈的偏好对GPRS波动率产生的影响相应较大,较弱的偏好对GPRS波动率的影响较弱,因此用户较强烈的偏好和较弱的偏好发生同样的变化时,较强的偏好对GPRS波动率产生的影响将大于较弱的偏好。本发明实施例中,基于上述特点,可将用户每个偏好对GPRS波动率的影响进行量化,并以此为依据评价用户偏好的强弱程度。
具体的,利用贝叶斯网络敏感度分析技术,可分析GPRS波动率针对每一种用户偏好的敏感度,并通过敏感度分析可得到用户的每种偏好发生预设幅度的变化时(通常为1%),确定GPRS波动率发生变化的概率(即GPRS波动率将发生多大幅度的变化),得到GPRS波动率的概率分布;并根据GPRS波动率的概率分布计算GPRS波动率的置信程度(置信程度通常用概率表示)以及根据GPRS波动率的置信程度确定偏好的强弱。
其中,敏感度分析共分为两个步骤:(1)利用贝叶斯公式分析当用户偏好发生变化时,GPRS波动率发生变化的概率,得到GPRS波动率新的概率分布,如公式(3)所示;(2)对GPRS波动率的新概率分布进行导数运算,得到GPRS波动率的变化范围和置信区间,如公式(4)所示。
需要注意的是,能够导致GPRS波动率以较高的置信率发生较大幅度变化的用户偏好为比较强的用户偏好,用户对这种偏好比较敏感;反之,则是较弱的偏好,用户对于这类偏好的敏感度相对较差。
步骤105,根据用户具有的偏好确定业务组合,并以业务组合的形式向用户推荐相应业务。其中,可根据用户具有的偏好、用户具有的潜在偏好、用户具有偏好的强弱程度确定业务组合,并以业务组合的形式向用户推荐相应业务。
本发明实施例中,为了向用户推荐相应业务,可先构建用户偏好自动分析系统。其中,上述过程所构建的基于特征网络的用户偏好分析模型有用户具有偏好、对每种偏好的强弱程度、具有潜在偏好等输出,因此该模型可用来辅助构建用户偏好自动分析系统。
用户偏好自动分析系统可自动采集用户的相关历史数据,并自动运行该模型进行用户的偏好分析,将模型的输出以用户标签的形式存储于用户偏好自动分析系统中。用户偏好自动分析系统对外提供用户偏好搜索功能,提供基于偏好的用户名单搜索。例如,业务人员数据新闻类偏好,用户偏好自动分析系统可自动搜索具有该类偏好的用户;业务人员可根据用户名单向用户做相应的业务推荐;同时根据搜索得到的用户量,对该类偏好所涉及的业务进行相应的调整。如图3所示,为用户偏好自动分析系统的示意图。
具体的,该用户偏好自动分析系统将算法输出的结果仿照OLAP的形式组织成偏好立方体,用户可以对该立方体进行切片、切面、上钻以及下钻等操作,对用户偏好进行多角度的探查。通过对立方体的操作,可以对特定时间、特定地点的用户偏好情况有一个总体的把握。同时基于用户偏好立方体,可实现对用户偏好以多种图表的形式进行展现,可令使用者直观的获取用户偏好的相关信息。
基于上述用户偏好自动分析系统的直观显示信息,可得到用户偏好之间的相互关联关系,并可选取用户具有相互关联的用户偏好,在选取过程中尽量携带用户的潜在偏好,从而可利用用户偏好立方体分析这些偏好作为组合时用户的数量以及其他方面的相关情况,并根据分析的结果,定制业务的组合,以这种业务组合的形式向用户推荐。需要注意的是,该组合业务的形式比单一的业务推荐具有更大的吸引力,更广阔的市场空间和更好的利润来源,且这种业务组合的定制可为业务套餐的定制提供基础的指导性服务。
综上所述,本发明实施例中,至少具有以下优点:
(1)采用先进的机器学习模型进行分析,可以综合分析大量数据。与现有技术中采用的调研方式和统计分析方式相比,现有技术对数据分析的能力有限,通常仅针对用户的业务行为相关数据进行分析;而本发明实施例中,采用分析能力更强的机器学习模型进行分析,能够将用户基本属性数据、用户通话行为数据等数据与用户数据业务使用行为相关数据进行综合分析,得到更全面的分析结果,而且能够对海量的数据进行分析,可以利用更长时间的历史数据进行分析,提高结果的准确度。通过采用有向无环图的形式对分析结果进行描述,对于用户偏好、用户基本属性、用户业务行为之间存在的复杂关系一目了然,更有利于业务部门营销活动的开展。
(2)避免人工干预,采用全自动的分析方式。现有技术中偏好分析技术需要大量的人为参与,在提高分析成本的同时,也限制了分析的准确度。本发明实施例中,有效避免了预先设定阈值等人为操作,提高了分析的准确度,实现了从数据采集到模型分析的全自动分析过程。并且可以建立全自动的用户偏好分析系统,为营销活动提供有利支撑。
(3)用户偏好的定量分析方式。通过一种新的衡量用户偏好强弱的方法,利用贝叶斯网络的敏感度分析技术,对用户的每种偏好对用户GPRS流量的变化情况的影响进行了量化,并利用这种量化值作为用户偏好强弱的依据;该方式有效回避了不同业务之间的差异,用一种无量纲的方式统一衡量用户偏好的重要程度。
(4)潜在用户偏好挖掘。通过直接读取用户特征网络图,可以得到各种用户偏好之间的相互关联关系,并进一步利用敏感度分析手段量化分析这些偏好之间关联关系的强弱;并根据量化分析的结果,找出与用户明显偏好具有较强关联关系的偏好,确定这些偏好是用户潜在的偏好。该分析方式不需要用户在潜在偏好的相关业务上体现出明显的使用行为,可有效的挖掘用户的潜在偏好。
(5)多种用户偏好的关联分析。通过采用网络分析的模式来分析用户偏好,可有效的分析多种用户偏好之间的相互关联关系;而且通过偏好立方体的模式对多种用户偏好进行了联合展现,可以从多个角度对多种用户偏好进行探查,对设置优质的业务组合提供了有力的指南。
实施例二
基于与上述方法同样的发明构思,本发明实施例中还提供了一种数据的处理设备,如图4所示,该设备包括:
获取模块11,用于获取偏好数据和GPRS波动率;
第一确定模块12,用于根据所述偏好数据和GPRS波动率确定偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系;
第二确定模块13,用于根据所述偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系确定用户具有的偏好。
所述获取模块11,具体用于根据当前周期的GPRS流量和前一周期的GPRS流量获取所述GPRS波动率。
所述第一确定模块12,具体用于根据所述偏好数据和GPRS波动率确定偏好之间具有指向关系或者不具有指向关系;确定偏好与GPRS波动率之间具有指向关系或者不具有指向关系。
所述第二确定模块13,具体用于当第一偏好与GPRS波动率之间具有指向关系时,确定用户具有所述第一偏好;
当第二偏好与GPRS波动率之间不具有指向关系时,如果和所述第二偏好具有指向关系的第三偏好与GPRS波动率之间具有指向关系,确定所述第二偏好为用户的潜在偏好。
该设备还包括:
第三确定模块14,用于当偏好发生预设幅度的变化时,确定GPRS波动率发生变化的概率,得到GPRS波动率的概率分布;
根据所述GPRS波动率的概率分布计算GPRS波动率的置信程度;并根据所述GPRS波动率的置信程度确定所述偏好的强弱。
该设备还包括:
推荐模块15,用于根据用户具有的偏好确定业务组合,并以业务组合的形式向用户推荐相应业务。
所述推荐模块15,具体用于根据用户具有的偏好、用户具有的潜在偏好、用户具有偏好的强弱程度之一或任意组合确定业务组合,并以业务组合的形式向用户推荐相应业务。
本发明实施例中,所述偏好数据包括但不限于以下之一或任意组合:用户基本属性、用户通话行为数据、用户订购关系数据、SP梦网信息数据、用户访问WAP的数据、用户的GPRS流量类数据。
其中,本发明装置的各个模块可以集成于一体,也可以分离部署。上述模块可以合并为一个模块,也可以进一步拆分成多个子模块。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
本领域技术人员可以理解附图只是一个优选实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。
Claims (16)
1.一种数据的处理方法,其特征在于,包括:
获取偏好数据和GPRS波动率;
根据所述偏好数据和GPRS波动率确定偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系;
根据所述偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系确定用户具有的偏好。
2.如权利要求1所述的方法,其特征在于,获取GPRS波动率具体包括:
根据当前周期的GPRS流量和前一周期的GPRS流量获取所述GPRS波动率。
3.如权利要求1所述的方法,其特征在于,根据所述偏好数据和GPRS波动率确定偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系,包括:
根据所述偏好数据和GPRS波动率确定偏好之间具有指向关系或者不具有指向关系;确定偏好与GPRS波动率之间具有指向关系或者不具有指向关系。
4.如权利要求3所述的方法,其特征在于,根据所述偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系确定用户具有的偏好,包括:
当第一偏好与GPRS波动率之间具有指向关系时,确定用户具有所述第一偏好;
当第二偏好与GPRS波动率之间不具有指向关系时,如果和所述第二偏好具有指向关系的第三偏好与GPRS波动率之间具有指向关系,确定所述第二偏好为用户的潜在偏好。
5.如权利要求1所述的方法,其特征在于,根据所述偏好数据和GPRS波动率确定偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系,之后还包括:
当偏好发生预设幅度的变化时,确定GPRS波动率发生变化的概率,得到GPRS波动率的概率分布;
根据所述GPRS波动率的概率分布计算GPRS波动率的置信程度;并根据所述GPRS波动率的置信程度确定所述偏好的强弱。
6.如权利要求1所述的方法,其特征在于,根据所述偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系确定用户具有的偏好,之后还包括:
根据用户具有的偏好确定业务组合,并以业务组合的形式向用户推荐相应业务。
7.如权利要求6所述的方法,其特征在于,所述根据用户具有的偏好确定业务组合,并以业务组合的形式向用户推荐相应业务,包括:
根据用户具有的偏好、用户具有的潜在偏好、用户具有偏好的强弱程度之一或任意组合确定业务组合,并以业务组合的形式向用户推荐相应业务。
8.如权利要求1-7任一项所述的方法,其特征在于,所述偏好数据包括以下之一或任意组合:
用户基本属性、用户通话行为数据、用户订购关系数据、SP梦网信息数据、用户访问WAP的数据、用户的GPRS流量类数据。
9.一种数据的处理设备,其特征在于,包括:
获取模块,用于获取偏好数据和GPRS波动率;
第一确定模块,用于根据所述偏好数据和GPRS波动率确定偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系;
第二确定模块,用于根据所述偏好之间的对应关系以及偏好与GPRS波动率之间的对应关系确定用户具有的偏好。
10.如权利要求9所述的设备,其特征在于,
所述获取模块,具体用于根据当前周期的GPRS流量和前一周期的GPRS流量获取所述GPRS波动率。
11.如权利要求9所述的设备,其特征在于,
所述第一确定模块,具体用于根据所述偏好数据和GPRS波动率确定偏好之间具有指向关系或者不具有指向关系;确定偏好与GPRS波动率之间具有指向关系或者不具有指向关系。
12.如权利要求11所述的设备,其特征在于,
所述第二确定模块,具体用于当第一偏好与GPRS波动率之间具有指向关系时,确定用户具有所述第一偏好;
当第二偏好与GPRS波动率之间不具有指向关系时,如果和所述第二偏好具有指向关系的第三偏好与GPRS波动率之间具有指向关系,确定所述第二偏好为用户的潜在偏好。
13.如权利要求9所述的设备,其特征在于,还包括:
第三确定模块,用于当偏好发生预设幅度的变化时,确定GPRS波动率发生变化的概率,得到GPRS波动率的概率分布;
根据所述GPRS波动率的概率分布计算GPRS波动率的置信程度;并根据所述GPRS波动率的置信程度确定所述偏好的强弱。
14.如权利要求9所述的设备,其特征在于,还包括:
推荐模块,用于根据用户具有的偏好确定业务组合,并以业务组合的形式向用户推荐相应业务。
15.如权利要求14所述的设备,其特征在于,
所述推荐模块,具体用于根据用户具有的偏好、用户具有的潜在偏好、用户具有偏好的强弱程度之一或任意组合确定业务组合,并以业务组合的形式向用户推荐相应业务。
16.如权利要求9-15任一项所述的设备,其特征在于,所述偏好数据包括以下之一或任意组合:
用户基本属性、用户通话行为数据、用户订购关系数据、SP梦网信息数据、用户访问WAP的数据、用户的GPRS流量类数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010622810.2A CN102567425B (zh) | 2010-12-29 | 2010-12-29 | 一种数据的处理方法和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010622810.2A CN102567425B (zh) | 2010-12-29 | 2010-12-29 | 一种数据的处理方法和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102567425A true CN102567425A (zh) | 2012-07-11 |
CN102567425B CN102567425B (zh) | 2014-11-05 |
Family
ID=46412854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010622810.2A Expired - Fee Related CN102567425B (zh) | 2010-12-29 | 2010-12-29 | 一种数据的处理方法和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102567425B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105554722A (zh) * | 2015-12-10 | 2016-05-04 | 中国联合网络通信集团有限公司 | 套餐推荐的方法及装置 |
CN106790570A (zh) * | 2016-12-27 | 2017-05-31 | 山东开创云软件有限公司 | 一种消费者行为分析管理系统及其分析方法 |
CN108399524A (zh) * | 2018-03-20 | 2018-08-14 | 惠龙易通国际物流股份有限公司 | 信息处理方法及系统 |
CN105101475B (zh) * | 2014-05-12 | 2018-09-25 | 中国移动通信集团湖南有限公司 | 一种识别无线局域网wlan潜在用户的方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050216460A1 (en) * | 1999-09-22 | 2005-09-29 | Lg Electronics Inc. | User preference information structure having multiple hierarchical structure and method for providing multimedia information using the same |
CN101136873A (zh) * | 2006-08-31 | 2008-03-05 | 腾讯科技(深圳)有限公司 | 一种即时通信平台上向用户发送广告的方法和系统 |
-
2010
- 2010-12-29 CN CN201010622810.2A patent/CN102567425B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050216460A1 (en) * | 1999-09-22 | 2005-09-29 | Lg Electronics Inc. | User preference information structure having multiple hierarchical structure and method for providing multimedia information using the same |
CN101136873A (zh) * | 2006-08-31 | 2008-03-05 | 腾讯科技(深圳)有限公司 | 一种即时通信平台上向用户发送广告的方法和系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105101475B (zh) * | 2014-05-12 | 2018-09-25 | 中国移动通信集团湖南有限公司 | 一种识别无线局域网wlan潜在用户的方法及装置 |
CN105554722A (zh) * | 2015-12-10 | 2016-05-04 | 中国联合网络通信集团有限公司 | 套餐推荐的方法及装置 |
CN106790570A (zh) * | 2016-12-27 | 2017-05-31 | 山东开创云软件有限公司 | 一种消费者行为分析管理系统及其分析方法 |
CN108399524A (zh) * | 2018-03-20 | 2018-08-14 | 惠龙易通国际物流股份有限公司 | 信息处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN102567425B (zh) | 2014-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wiedmann | Carbon footprint and input–output analysis–an introduction | |
US8346782B2 (en) | Method and system of information matching in electronic commerce website | |
US8599203B2 (en) | Systems and methods for presenting visualizations of media access patterns | |
TW201939404A (zh) | 資訊推薦的方法、裝置及設備 | |
CN110765247B (zh) | 一种用于问答机器人的输入提示方法及装置 | |
CN110019616B (zh) | 一种poi现势状态获取方法及其设备、存储介质、服务器 | |
US9613367B2 (en) | Assessment of users feedback data to evaluate a software object | |
CN103455522A (zh) | 应用程序扩展工具推荐方法及系统 | |
CN110162359B (zh) | 新手引导信息的推送方法、装置及系统 | |
CN107341187A (zh) | 搜索处理方法、装置、设备和计算机存储介质 | |
CN111191133B (zh) | 业务搜索处理方法、装置及设备 | |
CN102402594A (zh) | 一种富媒体个性化推荐方法 | |
CN103729362A (zh) | 导航内容的确定方法和装置 | |
CN102567425B (zh) | 一种数据的处理方法和设备 | |
US11715121B2 (en) | Computer system and method for electronic survey programming | |
KR20200133976A (ko) | 콘텐츠 큐레이션 방법 및 장치 | |
CN105989167B (zh) | 基于新闻客户端的数据采集方法及装置 | |
CN113449077A (zh) | 新闻热度计算方法、设备及存储介质 | |
Dann | Twitter data acquisition and analysis: Methodology and best practice | |
CN112667869A (zh) | 数据处理方法、设备、系统及存储介质 | |
Hwang | Would satisfaction with smart speakers transfer into loyalty towards the smart speaker provider? | |
CN114860737B (zh) | 教研数据的处理方法、装置、设备及介质 | |
CN116433320A (zh) | 一种用户行为分析方法和装置 | |
Martini et al. | WEBSITE AS AN COMMUNICATION TOOL AND BRANDING STRATEGY IN TELECOMMUNICATION COMPANIES:- | |
CN114880094A (zh) | 一种基于可穿戴设备的应用推荐方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20141105 |
|
CF01 | Termination of patent right due to non-payment of annual fee |