CN102769818A - 一种移动互联网中的信息推送方法及装置 - Google Patents

一种移动互联网中的信息推送方法及装置 Download PDF

Info

Publication number
CN102769818A
CN102769818A CN2012102671228A CN201210267122A CN102769818A CN 102769818 A CN102769818 A CN 102769818A CN 2012102671228 A CN2012102671228 A CN 2012102671228A CN 201210267122 A CN201210267122 A CN 201210267122A CN 102769818 A CN102769818 A CN 102769818A
Authority
CN
China
Prior art keywords
webpage
group
mobile subscriber
big type
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012102671228A
Other languages
English (en)
Inventor
顾瑜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING HUICHUANG XINYING TECHNOLOGY CO LTD
Original Assignee
BEIJING HUICHUANG XINYING TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING HUICHUANG XINYING TECHNOLOGY CO LTD filed Critical BEIJING HUICHUANG XINYING TECHNOLOGY CO LTD
Priority to CN2012102671228A priority Critical patent/CN102769818A/zh
Publication of CN102769818A publication Critical patent/CN102769818A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种移动互联网中的信息推送方法及装置,该方法中根据移动用户在设定时间长度内的浏览习惯,确定移动用户当前浏览网页所归属每个大类和小类的概率,并根据移动互联网中每个网页归属大类和小类的概率,确定移动用户的浏览习惯与移动互联网中每个网页包含内容的相似度,根据相似度确定向每个移动用户推送的网页信息。由于在本发明中根据每个移动用户的浏览习惯,确定向每个移动用户推送的信息,因此满足了移动用户端的个性化需求,并且由于该方法依据移动用户的个性化需求进行网页信息的推送,从而可以提高网站的点击率和浏览量,并对所针对的用户群提高其互联网体验和上网活跃度,进而提升运营商无线互联网的效率。

Description

一种移动互联网中的信息推送方法及装置
技术领域
本发明涉及移动互联网技术领域,尤其涉及一种移动互联网中的信息推送方法及装置。 
背景技术
随着网络技术的不断发展,移动网络逐渐与固网并驾齐驱渗入生活的各方各面。用户在获取移动互联网中的信息时,可以在用户具有明确的需求时,通过各种搜索引擎输入所需的信息,获取网络中的相应信息,或者网站也可以向用户推送相对有针对性的信息。 
现有技术中主要是门户网站首页、站点导航页等实现对用户的信息推送,并且在向用户推送信息时可以基于“将资讯按既有框架细分”或“按热度排列”等方法推荐。其中“将资讯按既有框架细分”需要较多的用户主动性方能完成信息的推送。而现有的大量针对移动互联网的用户,对通过移动终端上网并不习惯,也不熟悉,因此该向用户推荐信息的方法并不容易实现。“按热度排列”的推送方法是最直接的向用户推送信息的方法,但是该方法基于所有的用户推送的信息都是相同的,从而使得该方法推送的信息过于粗糙,无法满足用户的个性化需求。 
发明内容
有鉴于此,本发明实施例提供一种移动互联网中的信息推送方法及装置,用以解决现有技术移动互联网中进行信息推送时,信息推送过于粗糙,无法满足用户的个性化需求的问题。 
本发明提供一种移动互联网中的信息推送方法,所述方法包括: 
针对每个移动用户,获取该移动用户在设定时间长度内访问网页的信息; 
根据保存的移动互联网中每个网页及其归属的大类及小类的对应关系,确定每个移动用户访问的每个网页归属的大类及小类; 
针对每个移动用户在设定时间长度内访问的每个网页归属的大类和小类,浏览的归属该大类或小类的网页的数量及浏览的网页的总数量,确定该移动用户当前访问的每个大类和小类网页的概率; 
根据确定的每个移动用户当前访问的每个大类和小类网页的概率,及每个网页归属的大类和小类的概率,确定向每个移动用户推送的网页。 
较佳地,所述获取该移动用户在设定时间长度内访问网页的信息包括: 
根据每个移动用户的话单信息,确定每个移动用户设定时间长度内访问网页的信息; 
或者,根据运营商保存的访问信息,确定每个移动用户设定时间长度内访问网页的信息; 
或者,根据网站或者网站联盟保存的信息,确定每个移动用户在设定时间长度内访问网页的信息; 
或者,也可以根据在每个移动终端中植入的插件,确定每个移动用户在设定时间长度内访问网页的信息。 
较佳地,保存所述移动互联网中每个网页及其归属的大类及小类的对应关系包括: 
提取每个网页内容中的特征词和/或关键字,根据每个特征词和/或关键字所归属的大类,确定每个网页归属的大类,并根据每个特征词和/或关键字归属的小类,确定每个网页归属的小类,并保存该网页与其归属的大类和小类的对应关系;或者, 
根据每个网页的统一资源定位符URL包含的特征字段,确定每个网页归属的大类和小类,并保存该网页与其归属的大类和小类的对应关系。 
较佳地,所述确定该移动用户当前访问的每个大类和小类网页的概率包括: 
根据 确定该移动用户当前访问的每个大类或小类网页的概率P(cj|d),其中 
Figure BDA00001948386600032
Figure BDA00001948386600033
P ( d | c j ) = Π t ∈ d P ( t | c j ) ,
Figure BDA00001948386600035
其中λ为正数,|V|表示所有网页中不同特征的数目,cj表示第j个大类或小类,n(cj,t)表示特征字段或关键字t在大类或小类cj中出现的次数,n(cj)为大类或小类cj中全部特征词或关键字出现的次数之和。 
较佳地,确定所述每个网页归属的大类和小类的概率包括: 
根据 确定每个大类或小类网页的概率P(cj|d),其中 P ( d ) = Σ j = 1 n P ( d | c j ) P ( c j ) ,
Figure BDA00001948386600038
P ( d | c j ) = Π t ∈ d P ( t | c j ) , P ( t | c j ) = n ( c j , t ) + λ n ( c j ) + λ | V | , 其中λ为正数,|V|表示所有网页中不同特征的数目,cj表示第j个大类或小类,n(cj,t)表示特征词或关键字t在大类或小类cj中出现的次数,n(cj)为大类或小类cj中全部特征词或关键字出现的次数之和。 
较佳地,所述方法还包括: 
根据P(cj|d)=P1(cj|d)+P0(cj|d)*α,对每个移动用户当前访问每个大类或小类网页的概率进行更新,P(cj|d)每个移动用户当前访问每个大类或小类网页的概率,P1(cj︱d)为确定的该移动用户在该设定时间长度内访问的每个大类和小类cj网页的概率,P0(cj|d)为保存的当前时刻之前该移动用户的访问每个大类和小类cj网页的概率,α为小于1的正数。 
较佳地,所述确定向每个移动用户推送的网页,包括: 
根据 
Figure DEST_PATH_GDA00002058566200041
确定向每个移动用户推送的网页,其中d为每个网页向量,u为该移动用户当前访问每个大类或小类的概率。 
本发明提供一种移动互联网中信息推送装置,所述装置包括: 
获取模块,用于针对每个移动用户,获取该移动用户在设定时间长度内访问网页的信息; 
网页确定模块,用于根据保存的移动互联网中每个网页及其归属的大类及小类的对应关系,确定每个移动用户访问的每个网页归属的大类及小类; 
概率确定模块,用于针对每个移动用户在设定时间长度内访问的每个网页归属的大类和小类,浏览的归属该大类或小类的网页的数量及浏览的网页的总数量,确定该移动用户当前访问的每个大类和小类网页的概率; 
推送模块,用于根据确定的每个移动用户当前访问的每个大类和小类网页的概率,及每个网页归属的大类和小类的概率,确定向每个移动用户推送的网页。 
较佳地,所述获取模块,具体用于根据每个移动用户的话单信息,确定每个移动用户设定时间长度内访问网页的信息;或者,根据运营商保存的访问信息,确定每个移动用户设定时间长度内访问网页的信息;或者,根据网站或者网站联盟保存的信息,确定每个移动用户在设定时间长度内访问网页 的信息;或者,也可以根据在每个移动终端中植入的插件,确定每个移动用户在设定时间长度内访问网页的信息。 
较佳地,所述网页确定模块,具体用于提取每个网页内容中的特征词和/或关键字,根据每个特征词和/或关键字所归属的大类,确定每个网页归属的大类,并根据每个特征词和/或关键字归属的小类,确定每个网页归属的小类,并保存该网页与其归属的大类和小类的对应关系;或者,根据每个网页的统一资源定位符URL包含的特征字段,确定每个网页归属的大类和小类,并保存该网页与其归属的大类和小类的对应关系。 
较佳地,所述概率确定模块,具体用于根据 
Figure BDA00001948386600051
确定该移动用户当前访问的每个大类或小类网页的概率P(cj︱d),其中  P ( d ) = Σ j = 1 n P ( d | c j ) P ( c j ) , P ( d | c j ) = Π t ∈ d P ( t | c j ) , P ( t | c j ) = n ( c j , t ) + λ n ( c j ) + λ | V | , 其中λ为正数,|V|表示所有网页中不同特征的数目,cj表示第j个大类或小类,n(cj,t)表示特征词或关键字t在大类或小类cj中出现的次数,n(cj)为大类或小类cj中全部特征词或关键字出现的次数之和。 
较佳地,所述概率确定模块,具体用于根据 
Figure BDA00001948386600056
确定每个大类或小类网页的概率P(cj︱d),其中 
Figure BDA00001948386600057
Figure BDA00001948386600058
P ( d | c j ) = Π t ∈ d P ( t | c j ) , 其中λ为正数,|V|表示所有网页中不同特征的数目,cj表示第j个大类或小类,n(cj,t)表示特征词或关键字t在大类或小类cj中出现的次数,n(cj)为大类或小类cj中全部特征词或关键字出现的次数之和。 
较佳地,所述概率确定模块,还用于根据P(cj︱d)=P1(cj︱d)+P0(cj︱d)*α,对每个移动用户当前访问每个大类或小类网页的概率进行更新,P(cj︱d)每个移动用户当前访问每个大类或小类网页的概率,P1(cj︱d)为确定的该移动用户在该设定时间长度内访问的每个大类和小类cj网页的概率,P0(cj︱d)为保存的当前时刻之前该移动用户的访问每个大类和小类cj网页的概率,α为小于1的正数。 
较佳地,所述推送模块,具体用于根据 
Figure DEST_PATH_GDA00002058566200062
确定向每个移动用户推送的网页,其中d为每个网页向量,u为该移动用户当前访问每个大类或小类的概率。 
本发明提供了一种移动互联网中的信息推送方法及装置,该方法中根据移动用户在设定时间长度内的浏览习惯,确定移动用户当前浏览网页所归属每个大类和小类的概率,并根据移动互联网中每个网页归属大类和小类的概率,确定移动用户的浏览习惯与移动互联网中每个网页包含内容的相似度,根据相似度确定向每个移动用户推送的网页信息。由于在本发明中根据每个移动用户的浏览习惯,确定向每个移动用户推送的信息,因此满足了移动用户端的个性化需求,并且由于该方法依据移动用户的个性化需求进行网页信息的推送,从而可以提高网站的点击率和浏览量,并对所针对的用户群提高其互联网体验和上 网活跃度,进而提升运营商无线互联网的效率。 
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中: 
图1为本发明提供的移动互联网中的信息推送过程; 
图2为本发明提供的一种移动互联网中信息推送装置的结构示意图。 
具体实施方式
本发明实施例为了有效的提高移动互联网在针对每个移动终端进行信息推送时,满足移动用户的个性化需求,提高推送资讯的回复率,并进而提高网站的点击率,提高用户活跃度和基础网络的使用率,提供了一种移动互联网中的信息提送的方法及装置。 
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。 
图1为本发明提供的移动互联网中的信息推送过程,该过程包括以下步骤: 
S101:针对每个移动用户,获取该移动用户在设定时间长度内访问网页的信息。 
其中该设定的时间长度可以为一天、一周或一个月。移动用户可以是访问移动互联网的任一用户。而获取的网页的信息包括获取网页的统一资源定位符(URL)信息,另外,在获取每个移动用户访问网页的信息时,还可以获取移动用户的移动终端的型号信息,以便在进行信息推送时提高推送信息的成功率和点击率,向每个移动用户推送其移动终端支持的信息。 
而在获取每个移动用户在设定时间长度内访问网页的信息时,可以采用多 种方法,例如利用话单信息、或从运营商处获取、或者从每个网站获取等等多种方法。 
S102:根据保存的移动互联网中每个网页及其归属的大类及小类的对应关系,确定每个移动用户访问的每个网页归属的大类及小类。 
在本发明中,首先根据移动互联网中每个网页包含的信息,将网页中的内容分为多个大类,每个大类下又包括含多个小类,大类例如可以为体育、音乐、视频、财经等等,而在体育这个大类下又可能包含绯闻、篮球、黑哨、足球等等小类,并且同一网页可能归属于不同的小类,例如一个网页中包含的内容可能归属于体育这个大类下的篮球、黑哨两个小类。 
当确定了整个移动互联网中网页中的内容分为多个大类和小类这些框架后,随后搜集移动互联网中的每个网页,根据每个网页归属的内容确定每个网页归属的大类和小类,并且保存每个网页的URL与该网页对应的大类和小类的对应关系。 
当获取了每个移动用户在设定的时间长度内访问网页的信息后,可以根据获取的每个网页的信息,以及保存的每个网页的URL与该网页归属的大类或小类的对应关系,确定移动用户访问的每个网页归属的大类和小类。 
S103:针对每个移动用户在设定时间长度内访问的每个网页归属的大类或小类,浏览的归属该大类或小类的网页的数量及浏览的网页的总数量,确定该移动用户当前访问的每个大类和小类网页的概率。 
在本发明中根据在该设定时间长度内每个移动用户浏览的每个大类和小类下的网页的数量,确定每个移动用户当前访问的每个大类或小类网页的概率。 
同样,在本发明中也可以根据移动互联网中同一域名或URL特征值下,每个大类占所有网页的数量,及包含每个小类的网页占其所在大类下所有网页的数量,确定归属于每个大类和小类的网页的概率。 
S104:根据确定的每个移动用户当前访问的每个大类和小类网页的概率, 及每个网页归属的大类和小类的概率,确定向每个移动用户推送的网页。 
具体的在进行信息推送时,推送的是每个网页的URL,在进行网页的推送时,根据每个移动用户的浏览习惯,向每个移动用户与其浏览习惯相似的网页。 
在本发明中针对每个移动用户进行信息推荐时,依据移动用户的浏览习惯及浏览兴趣,向每个移动用户推送其感兴趣的内容,从而可以提高网站的点击率和浏览率。在本发明中,在向每个移动用户推送相应的信息之前,首先需要确定移动互联网中每个网页归属的类型,在本发明中可以确定移动互联网中网页的类型框架,在框架中将网页划分为多个大类,每个大类下包括多个级联的小类,其中包含的大类例如可以为体育、音乐、财经、小说、论坛、博客等等多个大类,体育大类下又包括篮球、足球、网球等等小类。当确定了网页的框架后,需要确定移动互联网中每个网页归属的大类以及小类,并保存每个网页的URL信息及对应的归属的大类和小类的对应关系。 
本发明中在确定移动互联网中每个网页归属的大类和小类时,具体根据每个网页的内容确定。根据网页的内容确定移动互联网中每个网页归属的大类和小类的方法包括:提取每个网页内容中的特征词和/或关键字,根据每个特征词和/或关键字所归属的大类,确定该网页归属的大类,并具体根据每个特征词和/或关键字归属的小类,再具体的确定每个网页归属的小类;或者在确定每个网页归属的大类及小类时,也可以根据每个网页的统一资源定位符(URL)包含的特征字段,确定每个网页归属的大类和小类,例如网页的URL中包含sport,则认为该网页归属于体育类,或者该网页的URL中包含blog,则认为该网页归属于博客类等;或者在确定每个网页归属的大类及小类时,可以通过人工识别的方式,识别每个网页的具体内容,从而确定每个网页归属的大类和小类,或者也可以根据移动用户是否存在针对每个网页的下载数据,从而确定每个网页归属的大类和小类。当确定了每个网页归属的大类和小类后,建立每个网页的URL信息以及确定出的该网页归属的大类和小类信息的对应关系。 
在本发明中由于网页在不断的更新,因此装置需要按照设定的时间间隔, 搜集网页的信息,并确定搜集的每个网页归属的大类和小类,从而对保存的网页的URL信息以及确定出的网页归属的大类和小类的信息的对应关系进行更新。在对该对应关系进行更新时,为了减小装置的工作量,提高更新的效率,可以只搜集并建立网站中新增网页及其对应大类和小类的对应关系。 
当确定了移动互联网中每个网页归属的大类和小类后,需要获取每个移动用户访问的网页,从而确定移动用户的访问习惯。在获取每个而移动用户访问的网页时,可以包括:根据每个移动用户的话单信息,获取每个移动用户设定时间长度内访问网页的信息,或者,根据运营商保存的访问信息,获取每个移动用户设定时间长度内访问网页的信息,或者,根据网站或者网站联盟保存的信息,确定每个移动用户在设定时间长度内访问网页的信息;或者,也可以根据在每个移动终端中植入的插件,确定每个移动用户在设定时间长度内访问网页的信息。这里主要是获取每个移动用户访问网页的URL信息。 
本发明中在获取每个网页的URL信息时,有些网页可能为新增网页,但装置可能还没有搜集该新增网页的信息,但此时移动用户已经开始浏览该新增网页了,由于装置没有保存该新增网页及该网页对应大类和小类的对应关系,因此装置无法确定移动用户浏览的网页归属的大类和小类。此时当装置无法确定移动用户浏览网页归属的大类和小类时,装置认为该网页为新增网页,提取该网页内容中特征词和/或关键字,或者根据该网页的URL包含的特征字段,确定该网页归属的大类和小类,并保存确定的该网页及其对应的大类和小类的对应关系,并重新根据确定的该对应关系,确定移动用户浏览的该网页归属的大类和小类。 
另外,在本发明中,在获取每个移动用户在设定的时间长度内访问网页的信息时,还可以获取每个移动用户的移动终端的型号信息,例如可以单纯的获取每个移动终端是智能机,还是普通机,或者也可以具体的获取每个移动终端的具体型号信息。因为移动用户的移动终端的型号不同,其支持能力不同,因此可以向移动用户推送的信息也是不同的。 
确定了每个移动用户访问网页归属的大类和小类后,根据每个网页归属的大类和小类,确定移动用户访问每个页面的概率。 
具体的确定移动用户访问每个页面的概率包括:根据领域大类的集合C={c1,c2,...,cn},其中C为大类的集合,cj表示第j个大类,而每个网页d表示一个条件概率的矢量,d={p(c1︱d),p(c2︱d),...,p(cn︱d)},则网页d对大类cj的概率为P(cj︱d), 
P ( c j | d ) = P ( d | c j ) P ( c j ) P ( d )
在本发明中P(d)表示为 
Figure BDA00001948386600112
而P(cj)用以下公式估计: 
Figure BDA00001948386600113
另外,在本方案中假设每个网页的所有大类或小类的特征都独立出现,则P(d|cj)可以表示为网页中所有大类和小类的条件概率的乘积: 
P ( d | c j ) = Π t ∈ d P ( t | c j )
在本发明中假设n(cj,t)表示特征词或关键字t在大类cj中出现的次数,n(cj)为大类cj中全部特征词或关键字出现的次数之和,|V|表示所有网页中不同特征的数目,根据Lidstone连续定律对一个正数λ,较佳地,λ=0.5, 
P ( t | c j ) = n ( c j , t ) + λ n ( c j ) + λ | V | .
针对每个小类确定移动用户浏览的每个小类网页的概率,与上述过程相同,只是在确定时针对每个大类分别确定每个小类网页的概率,即在确定时C 为针对每个大类下包含的所有小类的集合,cj表示该大类下的第j个小类,在确定P(cj)时,采用归属于该小类的网页的数量,以及归属于该大类下的全部网页的数量确定,n(cj,t)表示特征词或关键字t在小类cj中出现的次数,n(cj)为该大类下小类cj中全部特征词或关键字出现的次数之和,|V|表示所有网页中该大类不同特征的数目。 
因此在本发明中针对每个移动用户,获取了该移动用户在设定的时间长度内访问网页的信息,并确定了访问的每个网页归属的大类和小类后,根据移动用户在设定时间长度内浏览的全部网页的数量,以及浏览的归属于某一大类和小类的网页的数量,确定移动用户浏览的归属于每个大类和小类的网页的概率。 
下表为采用上述方法确定的几个移动用户浏览的归属于每个大类和小类的网页的概率: 
Figure BDA00001948386600131
另外,本发明在构建装置中每个网页归属的大类或小类时,也同样可以依据上述方法确定每个大类和小类下网页的概率。根据 
Figure BDA00001948386600132
确定每个大类或小类网页的概率P(cj︱d),其中 
Figure BDA00001948386600133
Figure BDA00001948386600134
P ( d | c j ) = Π t ∈ d P ( t | c j ) ,
Figure BDA00001948386600136
其中λ为正数,|V|表示所有网页中不同特征的数目,cj表示第j个大类或小类,n(cj,t)表示特征词或关键字t在大类或小类cj中出现的次数,n(cj)为大类或小类cj中全部特征词或关键字出现的次数之和。 
在本发明中当确定了每个移动用户在设定时间长度内访问的每个大类和小类网页的概率后,可以直接将该概率作为当前该移动用户的访问习惯,或者也可以参考之前确定的该移动用户的访问习惯,确定当前该移动用户的访问习惯。具体的在确定每个移动用户当前访问每个大类或小类cj网页的概率P(cj︱d)时,可以采用P(cj︱d)=P1(cj︱d)+P0(cj︱d)*α,其中P1(cj︱d)为确定的该移动用户在该设定时间长度内访问的每个大类和小类cj网页的概率,P0(cj︱d)为保存的当前时刻之前该移动用户的访问每个大类和小类cj网页的概率,α为小于1的正数。 
当确定了每个移动用户当前访问每个大类或小类网页的概率后,并且同样确定了每个大类或小类网页的概率后,可以根据每个网页包含的内容与该移动用户当前访问每个大类或小类网页的概率,确定向该移动用户推送的网页。可以根据 
Figure DEST_PATH_GDA00002058566200136
确定向每个移动用户推送的网页,其中d为每 个网页向量,u为该移动用户当前访问每个大类或小类的概率。 
图2为本发明提供的一种移动互联网中信息推送装置的结构示意图,所述装置包括: 
获取模块21,用于针对每个移动用户,获取该移动用户在设定时间长度内访问网页的信息; 
网页确定模块22,用于根据保存的移动互联网中每个网页及其归属的大类及小类的对应关系,确定每个移动用户访问的每个网页归属的大类及小类; 
概率确定模块23,用于针对每个移动用户在设定时间长度内访问的每个网页归属的大类或小类,浏览的归属该大类或小类的网页的数量及浏览的网页的总数量,确定该移动用户当前访问的每个大类或小类网页的概率; 
推送模块24,用于根据确定的每个移动用户当前访问的每个大类和小类网页的概率,及每个网页归属的大类和小类的概率,确定向每个移动用户推送的 网页。 
所述获取模块21,具体用于根据每个移动用户的话单信息,确定每个移动用户设定时间长度内访问网页的信息;或者,根据运营商保存的访问信息,确定每个移动用户设定时间长度内访问网页的信息;或者,根据网站或者网站联盟保存的信息,确定每个移动用户在设定时间长度内访问网页的信息;或者,也可以根据在每个移动终端中植入的插件,确定每个移动用户在设定时间长度内访问网页的信息。 
所述网页确定模块22,具体用于提取每个网页内容中的特征词和/或关键字,根据每个特征词和/或关键字所归属的大类,确定每个网页归属的大类,并根据每个特征词和/或关键字归属的小类,确定每个网页归属的小类,并保存该网页与其归属的大类小类的对应关系;或者,根据每个网页的统一资源定位符URL包含的特征字段,确定每个网页规定的大类和小类,并保存该网页与其归属的大类小类的对应关系。 
所述概率确定模块23,具体用于根据 
Figure BDA00001948386600151
确定该移动用户当前访问的每个大类或小类网页的概率P(cj︱d),其中  P ( d ) = Σ j = 1 n P ( d | c j ) P ( c j ) , P ( d | c j ) = Π t ∈ d P ( t | c j ) , P ( t | c j ) = n ( c j , t ) + λ n ( c j ) + λ | V | , 其中λ为正数,|V|表示所有网页中不同特征的数目,cj表示第j个大类或小类,n(cj,t)表示特征词或关键字t在大类或小类cj中出现的次数,n(cj)为大类或小类cj中全部特征词或关键字出现的次数之和。 
所述概率确定模块23,具体用于根据 
Figure BDA00001948386600161
确定每个大类或小类网页的概率P(cj︱d),其中 
Figure BDA00001948386600162
Figure BDA00001948386600163
P ( d | c j ) = Π t ∈ d P ( t | c j ) , 其中λ为正数,|V|表示所有网页中不同特征的数目,cj表示第j个大类或小类,n(cj,t)表示特征词或关键字t在大类或小类cj中出现的次数,n(cj)为大类或小类cj中全部特征词或关键字出现的次数之和。 
所述概率确定模块23,还用于根据P(cj︱d)=P1(cj︱d)+P0(cj︱d)*α,对每个移动用户当前访问每个大类或小类网页的概率进行更新,P(cj︱d)每个移动用户当前访问每个大类或小类网页的概率,P1(cj︱d)为确定的该移动用户在该设定时间长度内访问的每个大类和小类cj网页的概率,P0(cj︱d)为保存的当前时刻之前该移动用户的访问每个大类和小类cj网页的概率,α为小于1的正数 
所述推送模块24,具体用于根据 
Figure DEST_PATH_GDA00002058566200161
确定向每个移动用户推送的网页,其中d为每个网页向量,u为该移动用户当前访问每个大类或小类的概率。 
本发明提供了一种移动互联网中的信息推送方法及装置,该方法中根据移动用户在设定时间长度内的浏览习惯,确定移动用户当前浏览网页所归属每个大类和小类的概率,并根据移动互联网中每个网页归属大类和小类的概率,确 定移动用户的浏览习惯与移动互联网中每个网页包含内容的相似度,根据相似度确定向每个移动用户推送的网页信息。由于在本发明中根据每个移动用户的浏览习惯,确定向每个移动用户推送的信息,因此满足了移动用户端的个性化需求,并且由于该方法依据移动用户的个性化需求进行网页信息的推送,从而可以提高网站的点击率和浏览量,并对所针对的用户群提高其互联网体验和上网活跃度,进而提升运营商无线互联网的效率。 
本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(illustrative logical block),单元,和步骤可以通过电子硬件、电脑软件,或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability),上述的各种说明性部件(illustrative components),单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本发明实施例保护的范围。 
本发明实施例中所描述的各种说明性的逻辑块,或单元都可以通过通用处理器,数字信号处理器,专用集成电路(ASIC),现场可编程门阵列(FPGA)或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。 
本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可 以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中,ASIC可以设置于用户终端中。可选地,处理器和存储媒介也可以设置于用户终端中的不同的部件中。 
在一个或多个示例性的设计中,本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现,这些功能可以存储与电脑可读的媒介上,或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如,这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置,或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外,任何连接都可以被适当地定义为电脑可读媒介,例如,如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电脑、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘,磁盘通常以磁性复制数据,而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。 
上述说明示出并描述了本发明的一个优选实施例,但如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。 

Claims (10)

1.一种移动互联网中的信息推送方法,其特征在于,所述方法包括:
针对每个移动用户,获取该移动用户在设定时间长度内访问网页的信息;
根据保存的移动互联网中每个网页及其归属的大类及小类的对应关系,确定每个移动用户访问的每个网页归属的大类及小类;
针对每个移动用户在设定时间长度内访问的每个网页归属的大类和小类,浏览的归属该大类或小类的网页的数量及浏览的网页的总数量,确定该移动用户当前访问的每个大类和小类网页的概率;
根据确定的每个移动用户当前访问的每个大类和小类网页的概率,及每个网页归属的大类和小类的概率,确定向每个移动用户推送的网页。
2.如权利要求1所述的方法,其特征在于,所述获取该移动用户在设定时间长度内访问网页的信息包括:
根据每个移动用户的话单信息,确定每个移动用户设定时间长度内访问网页的信息;
或者,根据运营商保存的访问信息,确定每个移动用户设定时间长度内访问网页的信息;
或者,根据网站或者网站联盟保存的信息,确定每个移动用户在设定时间长度内访问网页的信息;
或者,也可以根据在每个移动终端中植入的插件,确定每个移动用户在设定时间长度内访问网页的信息;
保存所述移动互联网中每个网页及其归属的大类及小类的对应关系包括:
提取每个网页内容中的特征词和/或关键字,根据每个特征词和/或关键字所归属的大类,确定每个网页归属的大类,并根据每个特征词和/或关键字归属的小类,确定每个网页归属的小类,并保存该网页与其归属的大类和小类 的对应关系;或者,
根据每个网页的统一资源定位符URL包含的特征字段,确定每个网页归属的大类和小类,并保存该网页与其归属的大类和小类的对应关系。
3.如权利要求1所述的方法,其特征在于,所述确定该移动用户当前访问的每个大类和小类网页的概率包括:
根据 确定该移动用户当前访问的每个大类或小类网页的概率P(cj|d),其中 
Figure FDA00001948386500022
Figure FDA00001948386500024
Figure FDA00001948386500025
其中λ为正数,|V|表示所有网页中不同特征的数目,cj表示第j个大类或小类,n(cj,t)表示特征字段或关键字t在大类或小类cj中出现的次数,n(cj)为大类或小类cj中全部特征词或关键字出现的次数之和;
确定所述每个网页归属的大类和小类的概率包括:
根据 
Figure FDA00001948386500026
确定每个大类或小类网页的概率P(cj|d),其中
Figure FDA00001948386500027
Figure FDA00001948386500028
Figure FDA000019483865000210
其中λ为正数,|V|表示所有网页中不同特征的数目,cj表示第j个大类或小类,n(cj,t)表示特征词或关 键字t在大类或小类cj中出现的次数,n(cj)为大类或小类cj中全部特征词或关键字出现的次数之和。
4.如权利要求3所述的方法,其特征在于,所述方法还包括:
根据P(cj︱d)=P1(cj︱d)+P0(cj︱d)*α,对每个移动用户当前访问每个大类或小类网页的概率进行更新,P(cj︱d)每个移动用户当前访问每个大类或小类网页的概率,P1(cj︱d)为确定的该移动用户在该设定时间长度内访问的每个大类和小类cj网页的概率,P0(cj︱d)为保存的当前时刻之前该移动用户的访问每个大类和小类cj网页的概率,α为小于1的正数。
5.如权利要求3所述的方法,其特征在于,所述确定向每个移动用户推送的网页,包括:
根据 
Figure RE-FDA00002058566100031
确定向每个移动用户推送的网页,其中d为每个网页向量,u为该移动用户当前访问每个大类或小类的概率。
6.一种移动互联网中信息推送装置,其特征在于,所述装置包括:
获取模块,用于针对每个移动用户,获取该移动用户在设定时间长度内访问网页的信息;
网页确定模块,用于根据保存的移动互联网中每个网页及其归属的大类及小类的对应关系,确定每个移动用户访问的每个网页归属的大类及小类;
概率确定模块,用于针对每个移动用户在设定时间长度内访问的每个网页归属的大类和小类,浏览的归属该大类或小类的网页的数量及浏览的网页的总数量,确定该移动用户当前访问的每个大类和小类网页的概率;
推送模块,用于根据确定的每个移动用户当前访问的每个大类和小类网页的概率,及每个网页归属的大类和小类的概率,确定向每个移动用户推送的网页。 
7.如权利要求6所述的装置,其特征在于,所述获取模块,具体用于根据每个移动用户的话单信息,确定每个移动用户设定时间长度内访问网页的信息;或者,根据运营商保存的访问信息,确定每个移动用户设定时间长度内访问网页的信息;或者,根据网站或者网站联盟保存的信息,确定每个移动用户在设定时间长度内访问网页的信息;或者,也可以根据在每个移动终端中植入的插件,确定每个移动用户在设定时间长度内访问网页的信息;
所述网页确定模块,具体用于提取每个网页内容中的特征词和/或关键字,根据每个特征词和/或关键字所归属的大类,确定每个网页归属的大类,并根据每个特征词和/或关键字归属的小类,确定每个网页归属的小类,并保存该网页与其归属的大类和小类的对应关系;或者,根据每个网页的统一资源定位符URL包含的特征字段,确定每个网页归属的大类和小类,并保存该网页与其归属的大类和小类的对应关系。
8.如权利要求6所述的装置,其特征在于,所述概率确定模块,具体用于根据 
Figure FDA00001948386500041
确定该移动用户当前访问的每个大类或小类网页的概率P(cj︱d),其中
Figure FDA00001948386500043
Figure FDA00001948386500044
Figure FDA00001948386500045
其中λ为正数,|V|表示所有网页中不同特征的数目,cj表示第j个大类或小类,n(cj,t)表示特征词或关键字t在大类或小类cj中出现的次数,n(cj)为大类或小类cj中全部特征词或关键字出现的次数之和; 
所述概率确定模块,具体用于根据 
Figure FDA00001948386500051
确定每个大类或小类网页的概率P(cj|d),其中 
Figure FDA00001948386500052
Figure FDA00001948386500053
Figure FDA00001948386500055
其中λ为正数,|V|表示所有网页中不同特征的数目,cj表示第j个大类或小类,n(cj,t)表示特征词或关键字t在大类或小类cj中出现的次数,n(cj)为大类或小类cj中全部特征词或关键字出现的次数之和。
9.如权利要求8所述的装置,其特征在于,所述概率确定模块,还用于根据P(cj︱d)=P1(cj︱d)+P0(cj︱d)*α,对每个移动用户当前访问每个大类或小类网页的概率进行更新,P(cj︱d)每个移动用户当前访问每个大类或小类网页的概率,P1(cj︱d)为确定的该移动用户在该设定时间长度内访问的每个大类和小类cj网页的概率,P0(cj︱d)为保存的当前时刻之前该移动用户的访问每个大类和小类cj网页的概率,α为小于1的正数。
10.如权利要求8所述的装置,其特征在于,所述推送模块,具体用于根据 
Figure RE-FDA00002058566100056
确定向每个移动用户推送的网页,其中d为每个网页向量,u为该移动用户当前访问每个大类或小类的概率。 
CN2012102671228A 2012-07-30 2012-07-30 一种移动互联网中的信息推送方法及装置 Pending CN102769818A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012102671228A CN102769818A (zh) 2012-07-30 2012-07-30 一种移动互联网中的信息推送方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012102671228A CN102769818A (zh) 2012-07-30 2012-07-30 一种移动互联网中的信息推送方法及装置

Publications (1)

Publication Number Publication Date
CN102769818A true CN102769818A (zh) 2012-11-07

Family

ID=47097045

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012102671228A Pending CN102769818A (zh) 2012-07-30 2012-07-30 一种移动互联网中的信息推送方法及装置

Country Status (1)

Country Link
CN (1) CN102769818A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013189405A2 (zh) * 2013-04-27 2013-12-27 中兴通讯股份有限公司 控制浏览器运行的方法和装置
CN104052714A (zh) * 2013-03-12 2014-09-17 腾讯科技(深圳)有限公司 多媒体信息的推送方法及服务器
WO2014161452A1 (en) * 2013-04-02 2014-10-09 Tencent Technology (Shenzhen) Company Limited System and method for pushing and distributing promotion content
CN104572942A (zh) * 2014-12-30 2015-04-29 小米科技有限责任公司 推送消息显示方法及装置
CN105593836A (zh) * 2013-03-14 2016-05-18 谷歌公司 基于用户动作向计算设备提供可操作内容
CN106326253A (zh) * 2015-06-25 2017-01-11 北京搜狗科技发展有限公司 一种特征词提取方法及装置
WO2019029472A1 (zh) * 2017-08-07 2019-02-14 腾讯科技(深圳)有限公司 一种信息处理方法、装置及存储介质
CN110348466A (zh) * 2018-04-08 2019-10-18 北京京东尚科信息技术有限公司 身份识别的方法和装置

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104052714B (zh) * 2013-03-12 2019-02-26 腾讯科技(深圳)有限公司 多媒体信息的推送方法及服务器
CN104052714A (zh) * 2013-03-12 2014-09-17 腾讯科技(深圳)有限公司 多媒体信息的推送方法及服务器
WO2014139372A1 (en) * 2013-03-12 2014-09-18 Tencent Technology (Shenzhen) Company Limited System and method for selecting and rendering content
CN105593836A (zh) * 2013-03-14 2016-05-18 谷歌公司 基于用户动作向计算设备提供可操作内容
CN105593836B (zh) * 2013-03-14 2017-06-09 谷歌公司 基于用户动作向计算设备提供可操作内容
WO2014161452A1 (en) * 2013-04-02 2014-10-09 Tencent Technology (Shenzhen) Company Limited System and method for pushing and distributing promotion content
US9436768B2 (en) 2013-04-02 2016-09-06 Tencent Technology (Shenzhen) Company Limited System and method for pushing and distributing promotion content
CN104123301A (zh) * 2013-04-27 2014-10-29 中兴通讯股份有限公司 控制浏览器运行的方法和装置
WO2013189405A2 (zh) * 2013-04-27 2013-12-27 中兴通讯股份有限公司 控制浏览器运行的方法和装置
CN104123301B (zh) * 2013-04-27 2018-06-01 中兴通讯股份有限公司 控制浏览器运行的方法和装置
WO2013189405A3 (zh) * 2013-04-27 2014-03-13 中兴通讯股份有限公司 控制浏览器运行的方法和装置
CN104572942A (zh) * 2014-12-30 2015-04-29 小米科技有限责任公司 推送消息显示方法及装置
CN106326253A (zh) * 2015-06-25 2017-01-11 北京搜狗科技发展有限公司 一种特征词提取方法及装置
CN106326253B (zh) * 2015-06-25 2020-11-10 北京搜狗科技发展有限公司 一种特征词提取方法及装置
WO2019029472A1 (zh) * 2017-08-07 2019-02-14 腾讯科技(深圳)有限公司 一种信息处理方法、装置及存储介质
CN109388446A (zh) * 2017-08-07 2019-02-26 腾讯科技(北京)有限公司 一种信息处理方法、装置及存储介质
US10819668B2 (en) 2017-08-07 2020-10-27 Tencent Technology (Shenzhen) Company Limited Replacing graphical user interface based on configuration for displaying media on mobile device
US10951561B2 (en) 2017-08-07 2021-03-16 Tencent Technology (Shenzhen) Company Limited Media information recommendation method, device, and storage medium
CN109388446B (zh) * 2017-08-07 2021-07-09 腾讯科技(北京)有限公司 一种信息处理方法、装置及存储介质
CN110348466A (zh) * 2018-04-08 2019-10-18 北京京东尚科信息技术有限公司 身份识别的方法和装置

Similar Documents

Publication Publication Date Title
CN102769818A (zh) 一种移动互联网中的信息推送方法及装置
US10572565B2 (en) User behavior models based on source domain
JP6848085B2 (ja) ページ表示プログラム、装置、サーバー及び記憶媒体
CN101739427B (zh) 一种爬虫抓取的方法及其装置
TW466423B (en) Method and apparatus for providing reduced cost online service and adaptive targeting of advertisements
CN103248960B (zh) 基于电视终端的用户桌面实现方法及系统
US8849829B2 (en) Trending search magazines
CN104850546B (zh) 移动媒介信息的展示方法和系统
CN102932207B (zh) 监测网站访问信息的方法及服务器
CN104239298B (zh) 文本信息推荐方法、服务器、浏览器及系统
CN102831114B (zh) 实现互联网用户访问情况统计分析的方法及装置
CN103428076A (zh) 向多类型终端或应用发送信息的方法和装置
CN102497452B (zh) 一种基于嵌入式终端的在线流媒体服务方法
CN102737037A (zh) 一种网页预读取的方法、装置及一种浏览器
CN102831199A (zh) 建立兴趣模型的方法及装置
CN104462594A (zh) 一种提供用户个性化资源消息推送的方法和装置
WO2013177372A2 (en) Methods and systems for identifying new computers and providing matching services
CN102708174A (zh) 一种浏览器中的富媒体信息的展示方法和装置
CN102930059A (zh) 一种聚焦爬虫的设计方法
WO2014187159A1 (en) A method and an apparatus for performing offline access to web pages
CN103744856A (zh) 联动性扩展搜索方法及装置、系统
CN104504096B (zh) 一种跨网页的信息传输方法和网页浏览装置
CN102932206A (zh) 监测网站访问信息的方法和系统
CN103235800A (zh) 一种搜索结果的预览方法及系统
CN106528851A (zh) 一种智能推荐方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121107