CN104820709B - 一种移动用户数据处理、推送方法及相应的系统 - Google Patents
一种移动用户数据处理、推送方法及相应的系统 Download PDFInfo
- Publication number
- CN104820709B CN104820709B CN201510253126.4A CN201510253126A CN104820709B CN 104820709 B CN104820709 B CN 104820709B CN 201510253126 A CN201510253126 A CN 201510253126A CN 104820709 B CN104820709 B CN 104820709B
- Authority
- CN
- China
- Prior art keywords
- mobile subscriber
- user
- characteristic information
- weight
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000004321 preservation Methods 0.000 claims abstract description 15
- 238000003672 processing method Methods 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 abstract description 13
- 230000003542 behavioural effect Effects 0.000 abstract description 2
- 239000013589 supplement Substances 0.000 abstract description 2
- 230000006399 behavior Effects 0.000 description 31
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 241000721047 Danaus plexippus Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mobile Radio Communication Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种移动用户数据处理、推送方法及相应的系统,所述方法包括:根据移动用户的通信记录,确定所述移动用户的密切联系人;对所述移动用户及其密切联系人中的每一用户,根据该用户的移动用户上网记录,确定该用户对应的特征信息集;根据所述每一用户对应的特征信息集,确定所述移动用户及其密切联系人共同关注的特征信息并保存。本发明还提供了实现上述方法的系统。本发明将移动用户的通信记录和上网记录相结合,将对单个移动用户行为的分析扩展到对移动用户及其紧密联系人的行为分析,是对现有移动用户数据处理和推送方式的有效补充。
Description
技术领域
本发明涉及通信领域,尤其涉及一种移动用户数据处理、推送方法及相应的系统。
背景技术
现有技术中,用户通过移动终端访问网络非常普遍。为了给用户提供更好的网络服务,目前往往会根据用户近期访问的网址信息,刻画该用户近期的网址,向该用户提供一些与该网址相关的信息。
由于用户访问的网址信息多种多样,很难准确地分析出用户的上网行为,从而在后续基于该上网行为对该用户进行信息推送时,存在针对性不强,不准确的问题。
为了更准确地分析移动用户的行为模式,进而有效的推送,现有技术提供了很多解决方案。
中国专利CN102609471B公开了一种用于精准分析互联网用户网络行为的方法和模块,其分析和处理的数据全部来自于用户本身、用户在其所处网络环境中针对不同内容采取的具体行为,以及其在现有网络环境中可以采取的所有行为和动作,因而能够真正完全地得出每一个用户本身的最准确的行为模式。而且,这种分析方法的实时性是可以自我更新的:它随着网站内容的不断更新而自我更新。
中国专利CN102622445B公开了一种基于用户兴趣感知的网页推送方法及系统。包括:1)综合网页文本客观长度以及用户带有主观感情色彩的浏览行为如浏览时长、是否保存标签、是否拷贝、是否曾经访问对用户兴趣进行评判,在用户阅读过程中如果浏览时长与文本长度比值大于一定阈值则认为用户对正在浏览的网页兴趣高,判定用户兴趣度为高,或者比值小于一定阈值但是用户在浏览过程中进行拷贝、保存标签等操作也判定用户兴趣度为高;如果用户浏览时长与文本长度比值小于一定阈值而又无任何特殊操作则判定用户兴趣度为低;2)对于用户兴趣度为高的情况,对于用户正在浏览的网页,首先找到文本密度最大的标签,再判断该标签的同类标签是否达到一定数目来定位和提取网页的正文,进一步对网页的Title、Description、Keywords标签中的词汇在提取的正文中统计词频形成表征网页特征的向量送到后台搜索引擎,通过计算页面向量内积,推送相关性最高的页面。
中国专利CN101847160B公开了一种移动终端个性化页面推送方法和模块,所述方法包括用户行为统计分析过程和页面推送过程,所述页面推送过程包括:步骤21:用户点击页面,移动终端连接至远程服务器;步骤22:获取用户访问的头信息,分析出其中带有的标签;步骤23:获取与所述标签关联度最高的一个或者多个关联标签;步骤24:根据上述标签和关联标签中的关键字,在资源服务器中寻找对应的资源,搜索出用户需求的目标内容和个性化推送内容组成最终的页面反馈给用户。该专利通过记录和分析用户过去的访问记录来分析用户的行为和偏好,并根据用户的偏好来推送网页页面。
但是,上述专利方案仅基于移动用户上网行为本身进行统计分析,没有对移动用户数据进行充分利用。
发明内容
有鉴于此,本发明提供了一种移动用户数据处理方法,包括:
根据移动用户的通信记录,确定所述移动用户的密切联系人;
对所述移动用户及其密切联系人中的每一用户,根据该用户的移动用户上网记录,确定该用户对应的特征信息集;
根据所述每一用户对应的特征信息集,确定所述移动用户及其密切联系人共同关注的特征信息并保存。
可选地,
所述根据移动用户的通信记录,确定所述移动用户的密切联系人,包括:
根据所述移动用户在设定时间段内的通信记录,确定所述移动用户在所述设定时间段内的联系人;
根据所述通信记录,对每一联系人,统计所述移动用户与该联系人的通信次数和/或通信时长进行加权计算,得到一权值;
将权值高于设定第一阈值的N个联系人中权值最高的N’个联系人作为所述移动用户的密切联系人,其中,N’=min{N,N”},N”为设定的密切联系人上限值,N”=1,或者N”为大于1的正整数。
可选地,
根据该用户的移动用户上网记录,确定该用户对应的特征信息集,包括:
采集设定时间段内该用户的移动用户上网记录;
对所述移动用户上网记录中的每一网址,获取该网址对应的网页内容并分析,确定其中包含的关键词,并计算每一关键词对于该网页内容的第一权重;
对获取的每一关键词,根据其在所在网页中的第一权重以及其所在网页在获取的所有网页中的比例,计算代表该关键词被关注度的第二权重;
将获取的所有关键词及其第二权重作为该用户对应的特征信息集。
可选地,
根据所述每一用户对应的特征信息集,确定所述移动用户及其密切联系人共同关注的特征信息并保存,包括:
从所述每一用户对应的特征信息集中,分别选出第二权重大于设定第二阈值的关键词,作为所述每一用户关注的特征信息集;
确定所述每一用户关注的特征信息集的交集,对该交集中的关键词,按照以下方式之一处理:
将该交集中属于设定的团体行为类别的关键词作为所述共同关注的特征信息;
对该交集中的每一关键词,根据该关键词对应于所述每一用户的第二权重加权计算,得到第三权重,将第三权重最高,或第三权重最高且高于设定第三阈值的M个关键词作为所述共同关注的特征信息,M为正整数。
有鉴于此,本发明还提供了一种数据处理及推送方法,包括:
采用如上所述的移动用户数据处理方法确定移动用户及其密切联系人共同关注的特征信息并保存;
根据所述共同关注的特征信息在资源服务器中查找对应的资源,将找到的资源的信息作为个性化推送内容,推送给所述移动用户及其密切联系人。
有鉴于此,本发明还提供了一种移动用户数据处理系统,包括:
通信记录采集模块,用于采集设定时间段内移动用户的通信记录;
第一数据处理模块,用于根据所述移动用户的通信记录,确定所述移动用户的密切联系人;
上网记录采集模块,用于采集设定时间段内所述移动用户及其密切联系人的移动用户上网记录;
第二数据处理模块,用于对所述移动用户及其密切联系人中的每一用户,根据该用户的移动用户上网记录,确定该用户对应的特征信息集;
第三数据处理模块,用于根据所述每一用户对应的特征信息集,确定所述移动用户及其密切联系人共同关注的特征信息并保存。
可选地,
所述第一数据处理模块根据移动用户的通信记录,确定所述移动用户的密切联系人,包括:
根据所述移动用户在设定时间段内的通信记录,确定所述移动用户在所述设定时间段内的联系人;
根据所述通信记录,对每一联系人,统计所述移动用户与该联系人的通信次数和/或通信时长进行加权计算,得到一权值;
将权值高于设定第一阈值的N个联系人中权值最高的N’个联系人作为所述移动用户的密切联系人,其中,N’=min{N,N”},N”为设定的密切联系人上限值,N”=1,或者N”为大于1的正整数。
可选地,
所述第二数据处理模块根据该用户的移动用户上网记录,确定该用户对应的特征信息集,包括:
对该用户的移动用户上网记录中的每一网址,获取该网址对应的网页内容并分析,确定其中包含的关键词,并计算每一关键词对于该网页内容的第一权重;
对获取的每一关键词,根据其在所在网页中的第一权重以及其所在网页在获取的所有网页中的比例,计算代表该关键词被关注度的第二权重;
将获取的所有关键词及其第二权重作为该用户对应的特征信息集。
可选地,
所述第三数据处理模块根据所述每一用户对应的特征信息集,确定所述移动用户及其密切联系人共同关注的特征信息并保存,包括:
从所述每一用户对应的特征信息集中,分别选出第二权重大于设定第二阈值的关键词,作为所述每一用户关注的特征信息集;
确定所述每一用户关注的特征信息集的交集,对该交集中的关键词,按照以下方式之一处理:
将该交集中属于设定的团体行为类别的关键词作为所述共同关注的特征信息;
对该交集中的每一关键词,根据该关键词对应于所述每一用户的第二权重加权计算,得到第三权重,将第三权重最高,或第三权重最高且高于设定第三阈值的M个关键词作为所述共同关注的特征信息,M为正整数。
有鉴于此,本发明还提供了一种数据处理及推送系统,包括:
如上所述的移动用户数据处理系统,用于根据移动用户的通信记录和移动用户上网记录,确定所述移动用户及其密切联系人共同关注的特征信息并保存;
信息推送系统,用于根据所述共同关注的特征信息在资源服务器中查找对应的资源,将找到的资源的信息作为个性化推送内容,推送给所述移动用户及其密切联系人。
上述方案将移动用户的通信记录和上网记录相结合,将对单个移动用户行为的分析扩展到对移动用户及其紧密联系人的行为分析,找到移动用户及其紧密联系人共同关注的特征信息,从而可以准确刻画移动用户所在团体如一个家庭的行为模式,进而针对该团体进行相关信息的推送,是对现有移动用户数据处理和推送方式的有效补充。
附图说明
图1为本发明实施例一移动用户数据处理方法的流程图;
图2为本发明实施例一移动用户数据处理系统的模块图;
图3是本发明实施例二移动用户数据处理及推送方法的流程图;
图4是本发明实施例二移动用户数据处理及推送系统的模块图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,下文中将结合附图对本申请的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
实施例一
本发明的发明人经研究发现,在现实生活中,除了存在用户的个人行为外,还大量存在着团体行为,最为常见的是,用户所在家庭的行为,例如,购房、买车等,这些行为不仅仅是与用户个人相关,而是与用户所在家庭息息相关。而在行为模式上,个人的行为模式与团体的行为模式并不一定相同,例如,家庭中可能只有爸爸经常上网查找购房信息,而妈妈可能查找得并不多,但因为这是一个家庭行为,妈妈实际上仍非常关注或者有关注的需求。如果仅从个人上网记录,并不能够得到准确的信息,进而进行有效的推送。
为此,本实施例提供了一种移动用户数据处理方法,将移动用户的通信记录和上网记录相结合,将对单个移动用户行为的分析扩展到对移动用户及其紧密联系人的行为分析,从而找到移动用户及其紧密联系人共同关注的特征信息。
本实施例以对一个移动用户的数据处理为例进行说明,如图1所示,该移动用户数据处理方法包括:
步骤110,根据移动用户的通信记录,确定所述移动用户的密切联系人;
本步骤可以包括以下步骤:
步骤一,根据所述移动用户在设定时间段内的通信记录,确定所述移动用户在所述设定时间段内的联系人;
通信记录可以是通话记录、短消息记录等方式,移动用户及其联系人均可以用其使用的手机号码来标识。设定时间段如可设定为最近一年、最近一个月或最近一周等。
步骤二,根据所述通信记录,对每一联系人,统计所述移动用户与该联系人的通信次数和/或通信时长进行加权计算,得到一权值;
对于通信次数和通信时长可以分别设定一个加权系数,该加权系数可以根据需要进行调整。对于不同通信方式,如通话、短信,可以赋予相同或不同的加权系数,如通话的加权系数更高。对于同一通信方式下的呼入或呼出,也可以赋予相同或不同的加权系数。
步骤三,将权值高于设定第一阈值的N个联系人中权值最高的N’个联系人作为所述移动用户的密切联系人。
其中,N’=min{N,N”},min{N,N”}表示取N和N”中的较小值,也即N≥N”时,min{N,N”}=N”;N<N”时,min{N,N”}=N。N”为设定的密切联系人上限值,N”=1,或者N”为大于1的正整数。、当N”取1时,主要是针对家庭行为来找出相应的密切联系人。但本发明针对的团体也可以是工作团队等,N”可以有不同设置。
步骤120,对所述移动用户及其密切联系人中的每一用户,根据该用户的移动用户上网记录,确定该用户对应的特征信息集;
本步骤可以包括以下步骤:
步骤一,采集设定时间段内该用户的移动用户上网记录;
移动用户上网记录的采集如可以是:在各省分的GGSN分光并将采集到的数据进行协议分析,分析出移动用户上网记录url,mobile,ip,等信息,将这些数据发送到数据中心集中存储,再通过入库软件将这些数据集中入到Hbase数据库中,将移动用户的上网记录按照mobile号进行导出。但本发明不局限于此。
步骤二,对所述移动用户上网记录中的每一网址,获取该网址对应的网页内容并分析,确定其中包含的关键词,并计算每一关键词对于该网页内容的第一权重;
本步骤中,可以用“爬虫”分析每个url对应的网页内容,得到其对应的网页内容字符串content,再对content进行分词,提取出网页中的关键词。但本发明不局限于此,也可以使用任何网页文本分类算法提取关键词。
关键词对于该网页内容的第一权重可以使用TF-IDF算法计算。TF-IDF(termfrequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术,用于评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。
这里提取出的关键词可以是网页中直接存在的词,也可以是对网页中存在的词进行聚类后得到的关键词,如,将别克、君威、桑塔纳等聚类为汽车,将都市芳园、二手房、样板房等归类为房产。
步骤三,对获取的每一关键词,根据其在所在网页中的第一权重以及其所在网页在获取的所有网页中的比例,计算代表该关键词被关注度的第二权重;
例如,如果获取的所有网页的数目为100,而某一关键词在5个网页中出现,在各网页中的第一权重分别为0.14,0.3,0.21,0.32,0.08,则代表该关键词被关注度的第二权重可以按下式计算:(0.14+0.3+0.21+0.32+0.08)×5/100=0.0525。
步骤四,将获取的所有关键词及其第二权重作为该用户对应的特征信息集。
本步骤中,在该用户对应的特征信息集可以将获取的所有关键词按照第二权重从大到小的顺序排序,并记录各关键词的第二权重信息。
步骤130,根据所述每一用户对应的特征信息集,确定所述移动用户及其密切联系人共同关注的特征信息并保存。
本步骤可以包括以下步骤:
步骤一,从所述每一用户对应的特征信息集中,分别选出第二权重大于设定第二阈值的关键词,作为所述每一用户关注的特征信息集;
步骤二,确定所述每一用户关注的特征信息集的交集,对该交集中的关键词,按照以下方式之一处理:
方式一,将该交集中属于设定的团体行为类别的关键词作为所述共同关注的特征信息;
方式二,对该交集中的每一关键词,根据该关键词对应于所述每一用户的第二权重加权计算,得到第三权重,将第三权重最高,或第三权重最高且高于设定第三阈值的M个关键词作为所述共同关注的特征信息;
其中,M为正整数。
上述方式一中,特别将团体行为所特定的一些关键词,如注的房产、汽车、教育、育儿等,作为家庭这一团体的行为类别的关键词。
上述方式二中,加权计算如可以是加权平均,加权累加等,由于同时考虑了该关键词对应于团体中每一用户的第二权重,因而可以避免该关键词对于单个用户的第二权重较小而不被视为该用户关注的关键词,作为一个团体的成员,对团体行为模式的分析也有助于深入挖掘单个用户的关注点及其实际存在的需求。
相应地,本实施例还提供了一种移动用户数据处理系统,如图2所示,包括:
通信记录采集模块10,用于采集设定时间段内移动用户的通信记录;
第一数据处理模块20,用于根据所述移动用户的通信记录,确定所述移动用户的密切联系人;
上网记录采集模块30,用于采集设定时间段内所述移动用户及其密切联系人的移动用户上网记录;这里,上网记录采集模块30并不需要事先知道移动用户的密切联系人,如果没有采集到密切联系人的上网记录,则将所述密切联系人的上网记录视为空。
第二数据处理模块40,用于对所述移动用户及其密切联系人中的每一用户,根据该用户的移动用户上网记录,确定该用户对应的特征信息集;
第三数据处理模块50,用于根据所述每一用户对应的特征信息集,确定所述移动用户及其密切联系人共同关注的特征信息并保存。
上述模块在实体上,可以包括一个或多个执行相应功能的装置/设备。
可选地,
所述第一数据处理模块20根据移动用户的通信记录,确定所述移动用户的密切联系人,包括:
根据所述移动用户在设定时间段内的通信记录,确定所述移动用户在所述设定时间段内的联系人;
根据所述通信记录,对每一联系人,统计所述移动用户与该联系人的通信次数和/或通信时长进行加权计算,得到一权值;
将权值高于设定第一阈值的N个联系人中权值最高的N’个联系人作为所述移动用户的密切联系人,其中,N’=min{N,N”},N”为设定的密切联系人上限值,N”=1,或者N”为大于1的正整数。
可选地,
所述第二数据处理模块40根据该用户的移动用户上网记录,确定该用户对应的特征信息集,包括:
对该用户的移动用户上网记录中的每一网址,获取该网址对应的网页内容并分析,确定其中包含的关键词,并计算每一关键词对于该网页内容的第一权重;
对获取的每一关键词,根据其在所在网页中的第一权重以及其所在网页在获取的所有网页中的比例,计算代表该关键词被关注度的第二权重;
将获取的所有关键词及其第二权重作为该用户对应的特征信息集。
可选地,
所述第三数据处理模块50根据所述每一用户对应的特征信息集,确定所述移动用户及其密切联系人共同关注的特征信息并保存,包括:
从所述每一用户对应的特征信息集中,分别选出第二权重大于设定第二阈值的关键词,作为所述每一用户关注的特征信息集;
确定所述每一用户关注的特征信息集的交集,对该交集中的关键词,按照以下方式之一处理:
将该交集中属于设定的团体行为类别的关键词作为所述共同关注的特征信息;
对该交集中的每一关键词,根据该关键词对应于所述每一用户的第二权重加权计算,得到第三权重,将第三权重最高,或第三权重最高且高于设定第三阈值的M个关键词作为所述共同关注的特征信息,M为正整数。
实施例二
本实施例的数据处理及推送方法如图3所示,包括:
步骤210,采用实施例一步骤110至130所述的移动用户数据处理,确定移动用户及其密切联系人共同关注的特征信息并保存;
步骤220,根据所述共同关注的特征信息在资源服务器中查找对应的资源,将找到的资源的信息作为个性化推送内容,推送给所述移动用户及其密切联系人。
相应地,如图4所示,本实施例的数据处理及推送系统包括:
移动用户数据处理系统80,采用实施例一中的移动用户数据处理系统,用于根据移动用户的通信记录和移动用户上网记录,确定所述移动用户及其密切联系人共同关注的特征信息并保存;
信息推送系统90,用于根据所述共同关注的特征信息在资源服务器中查找对应的资源,将找到的资源的信息作为个性化推送内容,推送给所述移动用户及其密切联系人。
上述信息的推送可以是个性化页面的推送,此时,可以在所述移动用户或密切联系人访问网站时,将找到的资源的信息和其访问的网页内容一起反馈给用户;也可以是将找到的资源的信息通过短信、彩信等方式推送给用户。等等。举例来说,如果共同关注的关键词为“二手房”,可以向所述移动用户及其密切联系人推送房产信息或相关的售房信息的软件;如果关键词为“小时工”,可以向所述移动用户及其密切联系人推送提供室内清洁工作的单位的联系方式或者提供相应的网址链接等。
上述实施例中的各模块/功能模块/功能单元可以采用通用的计算模块来实现,它们可以集中在单个的计算模块上,也可以分布在多个计算模块所组成的网络上。
上述实施例中的各模块/功能模块/功能单元以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。上述提到的计算机可读取存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求所述的保护范围为准。
Claims (6)
1.一种移动用户数据处理方法,包括:
根据移动用户的通信记录,确定所述移动用户的密切联系人;
对所述移动用户及其密切联系人中的每一用户,根据该用户的移动用户上网记录,确定该用户对应的特征信息集;
根据所述每一用户对应的特征信息集,确定所述移动用户及其密切联系人共同关注的特征信息并保存;
其中,根据该用户的移动用户上网记录,确定该用户对应的特征信息集,包括:
采集设定时间段内该用户的移动用户上网记录;
对所述移动用户上网记录中的每一网址,获取该网址对应的网页内容并分析,确定其中包含的关键词,并计算每一关键词对于该网页内容的第一权重;
对获取的每一关键词,根据其在所在网页中的第一权重以及其所在网页在获取的所有网页中的比例,计算代表该关键词被关注度的第二权重;
将获取的所有关键词及其第二权重作为该用户对应的特征信息集;
其中,根据所述每一用户对应的特征信息集,确定所述移动用户及其密切联系人共同关注的特征信息并保存,包括:
从所述每一用户对应的特征信息集中,分别选出第二权重大于设定第二阈值的关键词,作为所述每一用户关注的特征信息集;
确定所述每一用户关注的特征信息集的交集,对该交集中的关键词,按照以下方式之一处理:
将该交集中属于设定的团体行为类别的关键词作为所述共同关注的特征信息;
对该交集中的每一关键词,根据该关键词对应于所述每一用户的第二权重加权计算,得到第三权重,将第三权重最高,或第三权重最高且高于设定第三阈值的M个关键词作为所述共同关注的特征信息,M为正整数。
2.如权利要求1所述的方法,其特征在于:
所述根据移动用户的通信记录,确定所述移动用户的密切联系人,包括:
根据所述移动用户在设定时间段内的通信记录,确定所述移动用户在所述设定时间段内的联系人;
根据所述通信记录,对每一联系人,统计所述移动用户与该联系人的通信次数和/或通信时长进行加权计算,得到一权值;
将权值高于设定第一阈值的N个联系人中权值最高的N’个联系人作为所述移动用户的密切联系人,其中,N’=min{N,N”},N”为设定的密切联系人上限值,N”=1,或者N”为大于1的正整数。
3.一种数据处理及推送方法,包括:
采用如权利要求1或2所述的方法,确定移动用户及其密切联系人共同关注的特征信息并保存;
根据所述共同关注的特征信息在资源服务器中查找对应的资源,将找到的资源的信息作为个性化推送内容,推送给所述移动用户及其密切联系人。
4.一种移动用户数据处理系统,其特征在于,包括:
通信记录采集模块,用于采集设定时间段内移动用户的通信记录;
第一数据处理模块,用于根据所述移动用户的通信记录,确定所述移动用户的密切联系人;
上网记录采集模块,用于采集设定时间段内所述移动用户及其密切联系人的移动用户上网记录;
第二数据处理模块,用于对所述移动用户及其密切联系人中的每一用户,根据该用户的移动用户上网记录,确定该用户对应的特征信息集;
第三数据处理模块,用于根据所述每一用户对应的特征信息集,确定所述移动用户及其密切联系人共同关注的特征信息并保存;
其中,所述第二数据处理模块根据该用户的移动用户上网记录,确定该用户对应的特征信息集,包括:
对该用户的移动用户上网记录中的每一网址,获取该网址对应的网页内容并分析,确定其中包含的关键词,并计算每一关键词对于该网页内容的第一权重;
对获取的每一关键词,根据其在所在网页中的第一权重以及其所在网页在获取的所有网页中的比例,计算代表该关键词被关注度的第二权重;
将获取的所有关键词及其第二权重作为该用户对应的特征信息集;
其中,所述第三数据处理模块根据所述每一用户对应的特征信息集,确定所述移动用户及其密切联系人共同关注的特征信息并保存,包括:
从所述每一用户对应的特征信息集中,分别选出第二权重大于设定第二阈值的关键词,作为所述每一用户关注的特征信息集;
确定所述每一用户关注的特征信息集的交集,对该交集中的关键词,按照以下方式之一处理:
将该交集中属于设定的团体行为类别的关键词作为所述共同关注的特征信息;
对该交集中的每一关键词,根据该关键词对应于所述每一用户的第二权重加权计算,得到第三权重,将第三权重最高,或第三权重最高且高于设定第三阈值的M个关键词作为所述共同关注的特征信息,M为正整数。
5.如权利要求4所述的系统,其特征在于:
所述第一数据处理模块根据移动用户的通信记录,确定所述移动用户的密切联系人,包括:
根据所述移动用户在设定时间段内的通信记录,确定所述移动用户在所述设定时间段内的联系人;
根据所述通信记录,对每一联系人,统计所述移动用户与该联系人的通信次数和/或通信时长进行加权计算,得到一权值;
将权值高于设定第一阈值的N个联系人中权值最高的N’个联系人作为所述移动用户的密切联系人,其中,N’=min{N,N”},N”为设定的密切联系人上限值,N”=1,或者N”为大于1的正整数。
6.一种数据处理及推送系统,包括:
如权利要求4或5所述的移动用户数据处理系统,用于根据移动用户的通信记录和移动用户上网记录,确定所述移动用户及其密切联系人共同关注的特征信息并保存;
信息推送系统,用于根据所述共同关注的特征信息在资源服务器中查找对应的资源,将找到的资源的信息作为个性化推送内容,推送给所述移动用户及其密切联系人。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510253126.4A CN104820709B (zh) | 2015-05-18 | 2015-05-18 | 一种移动用户数据处理、推送方法及相应的系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510253126.4A CN104820709B (zh) | 2015-05-18 | 2015-05-18 | 一种移动用户数据处理、推送方法及相应的系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104820709A CN104820709A (zh) | 2015-08-05 |
CN104820709B true CN104820709B (zh) | 2018-12-11 |
Family
ID=53731004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510253126.4A Active CN104820709B (zh) | 2015-05-18 | 2015-05-18 | 一种移动用户数据处理、推送方法及相应的系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104820709B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105323322B (zh) * | 2015-11-17 | 2018-11-30 | 中国联合网络通信集团有限公司 | 一种信息推送方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103198418A (zh) * | 2013-03-15 | 2013-07-10 | 北京亿赞普网络技术有限公司 | 一种应用推荐方法和系统 |
CN103593413A (zh) * | 2013-10-27 | 2014-02-19 | 西安电子科技大学 | 基于Agent的元搜索引擎个性化方法 |
CN103605791A (zh) * | 2013-12-04 | 2014-02-26 | 深圳中兴网信科技有限公司 | 信息推送系统和信息推送方法 |
CN104580448A (zh) * | 2014-12-29 | 2015-04-29 | 北京奇虎科技有限公司 | 信息推送方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110197166A1 (en) * | 2010-02-05 | 2011-08-11 | Fuji Xerox Co., Ltd. | Method for recommending enterprise documents and directories based on access logs |
-
2015
- 2015-05-18 CN CN201510253126.4A patent/CN104820709B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103198418A (zh) * | 2013-03-15 | 2013-07-10 | 北京亿赞普网络技术有限公司 | 一种应用推荐方法和系统 |
CN103593413A (zh) * | 2013-10-27 | 2014-02-19 | 西安电子科技大学 | 基于Agent的元搜索引擎个性化方法 |
CN103605791A (zh) * | 2013-12-04 | 2014-02-26 | 深圳中兴网信科技有限公司 | 信息推送系统和信息推送方法 |
CN104580448A (zh) * | 2014-12-29 | 2015-04-29 | 北京奇虎科技有限公司 | 信息推送方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN104820709A (zh) | 2015-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bennett et al. | Inferring and using location metadata to personalize web search | |
TWI636416B (zh) | 內容個人化之多相排序方法和系統 | |
CN106503014B (zh) | 一种实时信息的推荐方法、装置和系统 | |
US9706008B2 (en) | Method and system for efficient matching of user profiles with audience segments | |
CN101641697B (zh) | 对网页的相关搜索查询及其应用 | |
US20090070346A1 (en) | Systems and methods for clustering information | |
CN102289459A (zh) | 自动地生成训练数据 | |
Kurashima et al. | Blog map of experiences: Extracting and geographically mapping visitor experiences from urban blogs | |
US20100100443A1 (en) | User classification apparatus, advertisement distribution apparatus, user classification method, advertisement distribution method, and program used thereby | |
CN108334610A (zh) | 一种新闻文本分类方法、装置及服务器 | |
CN104978332B (zh) | 用户生成内容标签数据生成方法、装置及相关方法和装置 | |
CN108874812B (zh) | 一种数据处理方法及服务器、计算机存储介质 | |
CN103713894B (zh) | 一种用于确定用户的访问需求信息的方法与设备 | |
CN106776860A (zh) | 一种搜索摘要生成方法及装置 | |
US20130173568A1 (en) | Method or system for identifying website link suggestions | |
CN104077415A (zh) | 搜索方法及装置 | |
CN103399855B (zh) | 基于多数据源的行为意图确定方法及装置 | |
CN112270579B (zh) | 一种基于大数据的智能广告系统 | |
CN106570020A (zh) | 用于提供推荐信息的方法和装置 | |
CN106354867A (zh) | 多媒体资源的推荐方法及装置 | |
CN104899306A (zh) | 信息处理方法、信息显示方法及装置 | |
CN105930507A (zh) | 一种获得用户的Web浏览兴趣的方法及装置 | |
CN103559315A (zh) | 资讯筛选推送方法及装置 | |
CN104503988A (zh) | 搜索方法及装置 | |
CN103262079B (zh) | 检索装置及检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |