CN103186586B - 数据业务的推送方法和系统 - Google Patents

数据业务的推送方法和系统 Download PDF

Info

Publication number
CN103186586B
CN103186586B CN201110452013.9A CN201110452013A CN103186586B CN 103186586 B CN103186586 B CN 103186586B CN 201110452013 A CN201110452013 A CN 201110452013A CN 103186586 B CN103186586 B CN 103186586B
Authority
CN
China
Prior art keywords
user
preference
data
preference data
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110452013.9A
Other languages
English (en)
Other versions
CN103186586A (zh
Inventor
史达
袁向阳
孙少陵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201110452013.9A priority Critical patent/CN103186586B/zh
Publication of CN103186586A publication Critical patent/CN103186586A/zh
Application granted granted Critical
Publication of CN103186586B publication Critical patent/CN103186586B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本申请提供了一种数据业务的推送方法和系统。该方法包括:根据用户基本信息确定用户的初始业务内容偏好数据;根据用户的初始业务内容偏好数据为用户设定讨论主题,并邀请用户加入讨论;根据用户的讨论记录与初始业务内容偏好数据的相关性,对用户的初始业务内容偏好数据进行修正;以及将与修正的业务内容偏好数据相应的数据业务推送至用户。本申请的推送方法考虑了用户的讨论,从而提高了推送的成功率。

Description

数据业务的推送方法和系统
技术领域
本申请涉及数据业务的推送方法和系统。
背景技术
数据业务的推送可以分为两种方式。一种方式为直接推送方式,该方式通过短信、外呼等手段直接向用户推送各种数据业务。如果用户偏好所推送的数据业务,则会接受该数据业务,否则将会拒绝。可以理解,这种推送方式由于未根据用户的情况来执行推送,推送量大,但推送成功率低。
另一种方式是根据用户的基本信息确定用户所偏好的数据业务。但是由于仅根据用户的基本信息所确定的用户的偏好与用户实际的偏好的数据业务往往并不一致,因此这种推送方式的成功率也并不高。
发明内容
本申请的目的是提供一种至少能够部分改善上述现有技术中的缺陷的一种数据业务的推送方法和系统,提高推送的成功率。
根据本申请的一方面,提供了一种数据业务的推送方法,包括:
根据用户基本信息确定用户的初始业务内容偏好数据;
根据用户的初始业务内容偏好数据为用户设定讨论主题,并邀请用户加入讨论;
根据用户的讨论记录与初始业务内容偏好数据的相关性,对用户的初始业务内容偏好数据进行修正;以及
将与修正的业务内容偏好数据相应的数据业务推送至用户。
根据本申请的另一方面,提供了一种数据业务的推送系统,包括:
确定模块,根据用户基本信息确定用户的初始业务内容偏好数据;
处理模块,根据用户的初始业务内容偏好数据为用户设定讨论主题,邀请用户加入讨论,根据用户的讨论记录与初始业务内容偏好数据的相关性,对用户的初始业务内容偏好数据进行修正;以及
推送模块,将与修正的业务内容偏好数据相应的数据业务推送至用户。
本申请考虑了了用户的讨论,从而提高了数据业务推送的成功率。
附图说明
图1示出了根据本申请实施方式的数据业务的推送方法的流程图。
图2示出了根据本申请实施方式的建立和训练用户偏好网络模型的方法。
图3示出了根据本申请实施方式的示例性分析网络。
图4示出了根据本申请实施方式的数据业务的推送系统。
图5示出了根据本申请实施方式的阈值设定模块。
具体实施方式
为了更好地理解本申请,参考附图将对本申请的各个方面做出更详细的说明。可以理解,所述附图和详细说明只是对本申请优选实施方案的描述,而非以任何方式限制本申请的范围。
图1示出了根据本申请的实施方式的数据业务的推送方法的流程图。
如图1所示,数据业务的推送方法1000可包括以下步骤。
步骤100,根据用户的基本信息确定用户的初始业务内容偏好数据。业务内容偏好数据是关于用户是否具有某一种或多种业务偏好的数据。例如,用户的初始业务内容偏好数据为具有游戏类偏好。根据一种实施方式,用户的初始业务内容偏好数据可以根据用户的基本数据来确定。用户的基本信息可包括用户的基础信息(如年龄、性别、收入等)、业务行为数据(如通话数据、数据业务订购数据、数据业务使用数据等)、用户互联网数据以及其他的相关数据(如用户的信令数据、好友信息等)。根据一种实施方式,用户的基本数据可以从网元及相关的业务系统、支撑系统获得。可以通过对用户的基本数据进行统计分析、以及分类、聚类等数据挖掘方法来确定用户在业务内容上的偏好。
步骤200,根据用户的初始业务内容偏好数据为用户设定讨论主题,并邀请用户加入讨论。例如,可以通过服务器为共同具有游戏类偏好的用户确定关于游戏的讨论主题,并邀请具有游戏类偏好的用户加入讨论。在示例性实施方式中,可以通过例如139说客平台选择共同具有游戏类偏好的用户并建立相应的用户群或交往圈,并邀请用户加入讨论。
步骤300,根据用户的讨论记录与初始业务内容偏好数据之间的相关性,对用户的初始业务内容偏好数据进行修正。在具体的实施方式中,可以根据用户的讨论记录提取并统计用户的偏好关键词,并根据所提取和统计的偏好关键词与初始业务内容偏好数据之间的相关性来修正业务偏好数据。例如,如果分析得出用户多次提及的第一偏好并未包含在步骤100中确定的初始业务内容偏好数据中,则可确定用户的讨论记录与第一偏好的相关性高,从而相应地将第一偏好增加至该用户的初始业务内容偏好数据中;如果分析得出用户在用户群中并未提及包含在步骤100中确定的初始业务内容偏好数据中的第二偏好,则可确定用户的讨论记录与第二偏好的相关性低,相应地将第二偏好从该用户的初始业务内容偏好数据中删除。
步骤400,将与修正后的业务内容偏好数据相应的数据业务推送至用户。例如,当修正后的业务内容偏好数据为“运动”时,则可以将相关的数据业务“运动资讯”推送至客户。
根据一种实施方式,为实现根据用户的讨论记录与初始业务内容偏好数据之间的相关性,从而对用户的初始业务内容偏好数据进行修正的方法,可以为用户设定偏好数据修正阈值,并将所提取和统计的偏好关键词的次数与所设定偏好数据修正阈值进行比较,并根据比较的结果来修正业务偏好数据。统计用户在讨论记录中出现的偏好关键词出现的次数,将偏好关键词出现的次数与偏好数据修正阈值进行比较以修正初始业务内容偏好数据。偏好关键词是指与能够表示用户具有相关业务内容偏好的词语。例如,如偏好关键词出现的次数低于偏好数据修正阈值,则说明用户的讨论记录与初始业务内容偏好数据之间的相关性小,则从初始业务内容偏好数据中删除与该偏好关键词相应的偏好数据;否则,则保留或者增加与该偏好关键词相应的偏好数据。
根据一种实施方式,偏好数据修正阈值可以是预先设定的。例如系统可以根据用户的信息以及对推送成功率的要求,预先设定偏好数据修正阈值。
根据另一种实施方式,可以建立用户偏好网络模型,并根据建立的网络模型确定用户的偏好数据修正阈值。可以根据所确定的用户的偏好数据修正阈值,对当前用户的业务内容偏好数据进行修正,并将与修正后的业务内容偏好数据相应的数据业务推送至用户。随后,可以根据数据业务推送的成功与否的结果来进一步训练已建立的用户偏好网络模型。可以理解,这种经过训练的网络模型能够全面的反应用户的情况,从而提高所确定的用户的偏好数据修正阈值的可靠度,并进一步提高推送的成功率。
图2示出了根据本申请实施方式的建立和训练用户偏好网络模型的方法。
在步骤301中,确定已知用户的信息及推送情况。表1表示了已知用户1,2...,n的情况,其中,偏好1,偏好2...,偏好n表示1,2...n种根据修正后的业务内容偏好数据而向用户推送的数据业务。参数“1”表示推送成功,也就是指:用户接受了与修正后的业务内容偏好数据相应的数据业务,即推送的数据业务是用户真实偏好的数据业务,从而该数据业务推送成功。
偏好1 偏好2 偏好3 偏好4 。。。 偏好n
用户1 1 1 0 1 。。。 0
用户2 1 0 0 1 。。。 1
。。。 。。。 。。。 。。。 。。。 。。。 。。。
用户n 0 1 0 1 。。。 1
表1
在步骤302中,根据所确定的用户的信息及推送情况,建立并训练用户偏好网络模型。例如,可以根据已有的用户的情况,建立如图3所示的示例性分析网络。其中,网络中的节点可以包括用户基本信息、业务内容偏好、偏好阈值等。网络中的节点之间的边,以及箭头的指向表示节点之间的影响关系。例如,用户信息1指向偏好1,表示用户信息1影响偏好1,并是偏好1的父节点。
对于分析网络,可以根据已有的用户的基本数据、业务内容偏好及推送成功情况等确定网络的特征结构。例如,可以通过最小描述长度(MDL)训练算法来确定网络的特征结构。
最小描述长度(MDL)训练算法的公式如下
其中Xi表示节点,Pa(Xi)表示Xi节点的父节点集合,N表示用户数据的条数;H和Entropy表示先农定理中定义的信息熵,可以依据先农公式直接计算。
在具体的实施例中,假设预定的分析网络模型中具有A、B两个节点,A表示讨论记录中与饮食相关词语出现的次数,B表示讨论记录中与服装相关词语出现的次数。则由A、B两个节点可以构成的网络结构有三种,即:A与B互相独立、A指向B和B指向A。假定,例如,根据提取用户的讨论记录,确定了A=3、B=5,将A、B的值代入公式1,由于公式1与具体的网络结构有关,因此针对上述三种不同的网络结构,可以分别计算出三种结构各自的公式1的数值F1、F2和F3。从这三个数据中选取值最大的数据,例如F2,则将F2所对应的网络结构确定为计算分析网络。当节点数据较多的时候,训练过程与上述一致,可以理解,需要选择的网络结构会相应增多。
在步骤303中,根据建立和训练的用户偏好网络模型,确定用户的偏好数据修正阈值。例如,可以将用户讨论与业务内容偏好的相关的词语的次数代入阈值计算分析网络,计算用户的偏好为偏好i的概率P(偏好i),及其条件概率P(偏好i阈值|偏好i)。条件概率P(偏好i阈值|偏好i)表示在给定偏好i的情况下,偏好i阈值取得某数值的概率。例如,当假设用户的偏好概率满足狄利克雷概率密度分布的情况下,根据狄利克雷概率密度公式,可以直接计算的每个节点i的条件概率P(偏好i阈值|偏好i)。
根据所得到的条件概率值,计算偏好数据修正阈值的范围。
其中,τ(偏好i阈值|偏好i)为偏好i的偏好数据修正阈值范围。
通过上述方法确定的偏好数据修正阈值范围代表了偏好数据修正阈值的合理范围,也就是偏好数据修正阈值可以取为该范围内的任意数值。例如,可以根据客户的要求,所需推送精度,将偏好i的数据修正阈值设定为τ(偏好i阈值|偏好i)的上限、下限、均值等。
在步骤304中,可以通过将用户讨论记录中出现的偏好关键词的次数与确定的偏好数据修正阈值进行比较,修正用户的初始业务内容偏好数据。从而可以将与修正后的业务内容偏好数据相应的数据业务推送至用户。
在步骤305中,可以进一步将当前用户的推送结果反馈至步骤302中,从而进一步对用户偏好网络模型进行训练,提高网络模型的准确度,从而能够准确设定偏好数据修正阈值,以进一步准确确定用户实际需要的数据业务,提高推送的成功率。
根据本申请的另一个方面,提供了一种数据业务的推送系统。如图4所示,该推送系统1包括确定模块10,处理模块20,以及推送模块30。
确定模块10能够根据用户的基本信息确定用户的初始业务内容偏好数据。根据一种实施方式,确定模块10可以进一步包括信息获取模块11和信息分析模块12。信息获取模块11可以从例如网元和外部系统获取用户的基本数据。在具体的实施例中,用户的基本数据可以包括用户基础数据、用户业务行为数据、用户互联网数据及其他类的数据。信息分析模块12,可以通过对用户的基本信息进行统计分析、以及分类、聚类等数据挖掘方法来确定用户在数据业务内容上的初始偏好。
处理模块20能够根据用户的初始业务内容偏好数据为用户设定讨论主题,并邀请用户加入讨论,并根据用户的讨论记录与初始业务内容偏好数据之间的相关性,对用户的初始业务内容偏好数据进行修正。
根据一种实施方式,处理模块20可以包括讨论平台21和管理模块22。
讨论平台21可以根据初始业务内容偏好数据对用户进行分类,并为具有共同偏好数据的用户设定讨论主题,并邀请这些具有共同偏好数据的用户加入相应的讨论主题。在示例性实施方式中,可以通过例如139说客平台选择共同具有游戏类偏好的用户并建立相应的用户群或交往圈,并邀请用户加入讨论。
管理模块22可以根据用户的讨论记录与初始业务内容偏好数据之间的相关性,对用户的初始业务内容偏好数据进行修正。管理模块22可以进一步包括统计模块2210,根据用户的讨论记录提取并统计用户的偏好关键词。阈值设定模块2220,设定偏好数据修正阈值。修正模块2230,将所提取和统计的偏好关键词的次数与所设定偏好数据修正阈值进行比较,并根据比较的结果来修正业务偏好数据。从而可以将与修正后的业务内容偏好数据相应的数据业务推送至用户。例如,可以统计用户在讨论记录中出现的偏好关键词出现的次数,将偏好关键词出现的次数与偏好数据修正阈值进行比较以修正初始业务内容偏好数据。例如,如偏好关键词出现的次数低于偏好数据修正阈值,则从初始业务内容偏好数据中删除与该偏好关键词相应的偏好数据;否则,则保留或者增加与该偏好关键词相应的偏好数据。
推送模块30将与修正后的业务内容偏好数据相应的数据业务推送至用户。
根据一种实施方式,偏好数据修正阈值可以是预先设定的。例如,阈值设定模块2220可以根据用户的基本信息以及对推送成功率的要求,预先设定偏好数据修正阈值。
根据另一种实施方式,阈值设定模块2220可以建立用户偏好网络模型,并根据建立的网络模型确定用户的偏好数据修正阈值。如图5所示,阈值设定模块2220可以进一步包括模型建立模块2221,阈值确定模块2222。
模型建立模块2221确定已知用户的信息及推送情况,并根据所确定的用户的信息及推送情况,建立并训练用户偏好网络模型。阈值确定模块2222,根据建立的用户偏好网络模型,确定用户的偏好数据修正阈值。其中,具体的模块的建立和训练可以例如采用前述用户偏好网络模型的建立和训练方法来实现。
根据一种实施方式,修正模块2220还可以进一步包括反馈模块2223,能够将当前用户的推送结果反馈至模型建立模块2221,从而进一步对用户偏好网络模型进行训练,提高网络模型的准确度。
虽然本申请利用上述描述和实施例进行了具体说明,但本申请并不受此限制。本申请的保护范围由所附权利要求书中的权利要求限定,任何对权利要求中技术特征进行的等同替换,都应属于本申请所限定的范围。

Claims (10)

1.一种数据业务的推送方法,包括:
根据用户基本信息确定用户的初始业务内容偏好数据;
根据用户的初始业务内容偏好数据为用户设定讨论主题,并邀请用户加入讨论;
根据用户的讨论记录提取并统计用户的偏好关键词;
设定偏好数据修正阈值;
将所提取和统计的偏好关键词的次数与所设定的偏好数据修正阈值进行比较,并根据比较的结果来修正业务偏好数据;以及
将与修正的业务内容偏好数据相应的数据业务推送至用户。
2.如权利要求1所述的方法,其中,所述设定偏好数据修正阈值的步骤包括:
确定已知用户的信息及推送结果,并根据所确定的用户的信息及推送情况,建立并训练用户偏好网络模型;以及
根据建立和训练的用户偏好网络模型,确定用户的偏好数据修正阈值。
3.如权利要求1所述的方法,其中,所述设定偏好数据修正阈值的步骤进一步包括:
反馈当前用户的推送结果,并根据所反馈的当前用户的推送结果进一步训练用户偏好网络模型。
4.如权利要求1所述的方法,其中,所述用户基本信息包括用户的基础信息,业务行为数据,和用户互联网数据。
5.如权利要求1所述的方法,其中,所述根据用户的初始业务内容偏好数据为用户设定讨论主题,并邀请用户加入讨论的步骤包括:根据初始业务内容偏好数据对用户进行偏好分类,根据偏好分类结果为用户设定讨论主题,并邀请用户加入相应的讨论主题。
6.一种数据业务的推送系统,包括:
确定模块,根据用户基本信息确定用户的初始业务内容偏好数据;
处理模块,根据用户的初始业务内容偏好数据为用户设定讨论主题,邀请用户加入讨论,根据用户的讨论记录与初始业务内容偏好数据的相关性,对用户的初始业务内容偏好数据进行修正;以及
推送模块,将与修正的业务内容偏好数据相应的数据业务推送至用户;
其中,所述处理模块包括:
统计模块,根据用户的讨论记录提取并统计用户的偏好关键词;
阈值设定模块,设定偏好数据修正阈值;
修正模块,将所提取和统计的偏好关键词的次数与所设定偏好数据修正阈值进行比较,并根据比较的结果来修正业务偏好数据。
7.如权利要求6所述的系统,其中,所述确定模块包括:
信息获取模块,获取用户基础数据、用户业务行为数据、以及用户互联网数据;以及
信息分析模块,通过获取的用户基础数据、用户业务行为数据、以及用户互联网数据来确定用户的初始业务内容偏好数据。
8.如权利要求6所述的系统,其中,所述处理模块还包括:
讨论平台,根据初始业务内容偏好数据对用户进行偏好分类,根据偏好分类结果为用户设定讨论主题,并邀请用户加入相应的讨论主题。
9.如权利要求6所述的系统,其中,所述阈值设定模块包括:
模型建立模块,确定已知用户的信息及推送结果,并根据所确定的用户的信息及推送情况,建立并训练用户偏好网络模型;以及
阈值确定模块,根据建立和训练的用户偏好网络模型,确定用户的偏好数据修正阈值。
10.如权利要求9所述的系统,其中,所述阈值设定模块进一步包括:
反馈模块,反馈当前用户的推送结果,并根据所反馈的当前用户的推送结果进一步训练用户偏好网络模型。
CN201110452013.9A 2011-12-30 数据业务的推送方法和系统 Active CN103186586B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110452013.9A CN103186586B (zh) 2011-12-30 数据业务的推送方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110452013.9A CN103186586B (zh) 2011-12-30 数据业务的推送方法和系统

Publications (2)

Publication Number Publication Date
CN103186586A CN103186586A (zh) 2013-07-03
CN103186586B true CN103186586B (zh) 2016-12-14

Family

ID=

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079824A (zh) * 2006-06-15 2007-11-28 腾讯科技(深圳)有限公司 一种用户兴趣偏好向量生成系统和方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079824A (zh) * 2006-06-15 2007-11-28 腾讯科技(深圳)有限公司 一种用户兴趣偏好向量生成系统和方法

Similar Documents

Publication Publication Date Title
CN103678613B (zh) 一种计算影响力数据的方法与装置
CN105404686B (zh) 一种基于地理特征层次分词的新闻事件地名地址匹配方法
CN106529714A (zh) 一种用户流失的预测方法及系统
CN105183909B (zh) 基于高斯混合模型的社交网络用户兴趣预测方法
CN104657372A (zh) 页面操作数据处理方法及装置
CN106096066A (zh) 基于随机近邻嵌入的文本聚类方法
CN106204083B (zh) 一种目标用户分类方法、装置及系统
CN106021305A (zh) 一种模式与偏好感知的poi推荐方法及系统
CN103116611A (zh) 社交网络意见领袖识别方法
CN106778876A (zh) 基于移动用户轨迹相似性的用户分类方法和系统
CN107330020B (zh) 一种基于结构和属性相似度的用户实体解析方法
CN109446171B (zh) 一种数据处理方法和装置
CN104077412B (zh) 一种基于多Markov链的微博用户兴趣预测方法
CN103812872A (zh) 一种基于混合狄利克雷过程的网络水军行为检测方法及系统
CN105590240A (zh) 一种品牌广告效果优化的离散计算方法
WO2020135642A1 (zh) 一种基于生成对抗网络的模型训练方法及设备
CN105956093A (zh) 一种基于多视图锚点图哈希技术的个性化推荐方法
CN105608604A (zh) 一种品牌广告效果优化的连续计算方法
CN103430175A (zh) 用于对视频进行比较的方法和装置
CN109389138A (zh) 一种用户画像方法及装置
CN105512301A (zh) 基于社交内容的用户分组方法
CN107133268B (zh) 一种用于Web服务推荐的协同过滤方法
CN107633257B (zh) 数据质量评估方法及装置、计算机可读存储介质、终端
JP2013134752A (ja) トピックモデル学習方法、装置、及びプログラム
CN112837078B (zh) 一种基于集群的用户异常行为检测方法

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant