CN103530339A - 移动应用信息推送方法和装置 - Google Patents

移动应用信息推送方法和装置 Download PDF

Info

Publication number
CN103530339A
CN103530339A CN201310463741.9A CN201310463741A CN103530339A CN 103530339 A CN103530339 A CN 103530339A CN 201310463741 A CN201310463741 A CN 201310463741A CN 103530339 A CN103530339 A CN 103530339A
Authority
CN
China
Prior art keywords
web page
mobile application
descriptor
similarity
mobile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310463741.9A
Other languages
English (en)
Inventor
刘峰
刘亦梁
罗威
王维煜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201310463741.9A priority Critical patent/CN103530339A/zh
Publication of CN103530339A publication Critical patent/CN103530339A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本发明公开了一种移动应用信息推送方法和装置,其中,所述移动应用信息推送方法包括:获取客户端浏览的网页,解析所述网页,得到网页内容,计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息,根据选取的所述移动应用描述信息向所述客户端推送相应的移动应用信息。本发明实现了根据客户端浏览的网页,捕捉到客户端当前的兴趣点,从而触发客户端下载移动应用的潜在需求,提高了客户端对推送的移动应用的使用率。

Description

移动应用信息推送方法和装置
技术领域
本发明涉及计算机技术,尤其涉及一种移动应用信息推送方法和装置。
背景技术
随着计算机技术的不断发展,现有的移动应用的数量以百万计,但很多移动应用一直沉睡在移动应用商店中无人问津,使得这些移动应用无法被需要它的用户接触到并下载。因此,移动应用的分发机制一直是一个业界普遍关注的重要问题。
现有技术中,相比于移动应用搜索和各种应用排行榜,一般采用主动推送的方式更容易使不活跃的移动应用接触到用户,吸引用户去下载和使用,满足用户的潜在需求。该主动推送的过程为:根据用户属性给用户推荐一个或几个字符条,让用户去选择,然后根据用户选择的字符条,推荐给用户与这些文字描述相关联的移动应用;或者根据移动应用的类别,用户在移动应用商店中查看或下载移动应用的信息,以及用户使用移动应用的时长信息,来计算移动应用之间的相似度和与用户的推荐度。
但是,当根据用户属性进行推送时,用户需要主动选择某一字符条,然后再展现相关联的移动应用,使得这种推送方式较为繁琐,还有,字符条中的信息量有限,依据它推荐出来的移动应用不一定满足用户的需求或兴趣点;当根据移动应用的类别进行推送时,该推送方法依赖于用户查看、下载、使用移动应用的信息,当无法得到这些信息的时候,则无法采用该推送方法,使得该推送方法的局限性很大,而且,该推送方法的依据是用户的历史行为,而不能捕捉用户当前的兴趣点。
发明内容
有鉴于此,本发明实施例的目的在于提出一种移动应用信息推送方法和装置,以更加准确、便捷地获取客户端下载移动应用的潜在需求,提高了客户端对推送的移动应用的使用率。
第一方面,本发明实施例提供了一种移动应用信息推送方法,所述方法包括:
获取客户端浏览的网页;
解析所述网页,得到网页内容;
计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息;
根据选取的所述移动应用描述信息向所述客户端推送相应的移动应用信息。
第二方面,本发明实施例提供了一种移动应用信息推送装置,所述装置包括:
获取模块,用于获取客户端浏览的网页;
解析模块,用于解析所述网页,得到网页内容;
处理模块,用于计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息;
推送模块,用于根据选取的所述移动应用描述信息向所述客户端推送相应的移动应用信息。
本发明实施例获取客户端浏览的网页,解析所述网页,得到网页内容,计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息,根据选取的所述移动应用描述信息向所述客户端推送相应的移动应用信息,以使所述客户端下载所述移动应用信息,实现了根据客户端浏览的网页,向客户端推送与网页相对应的移动应用,从而触发客户端下载移动应用的潜在需求,提高了客户端对推送的移动应用的使用率。
附图说明
图1是本发明第一实施例的移动应用信息推送方法的流程图;
图2是本发明第二实施例的移动应用信息推送方法的流程图;
图3是本发明第三实施例的移动应用信息推送方法的流程图;
图4是本发明第四实施例的移动应用信息推送方法的流程图;
图5是本发明第五实施例的移动应用信息推送装置的示意图;
图6是本发明第六实施例的移动应用信息推送装置中处理模块的示意图;
图7是本发明第七实施例的移动应用信息推送装置中处理模块的示意图;
图8是本发明第八实施例的移动应用信息推送装置中处理模块的示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
本发明实施例提供的移动应用信息推送方法,通过获取客户端浏览的网页,解析所述网页,得到网页内容,计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息,根据选取的所述移动应用描述信息向所述客户端推送相应的移动应用信息,以使所述客户端下载所述移动应用信息,实现了根据客户端浏览的网页,捕捉到客户端当前的兴趣点,从而触发客户端下载移动应用的潜在需求,提高了客户端对推送的移动应用的使用率。
图1是本发明第一实施例的移动应用信息推送方法的流程图。如图1所示,所述方法包括:
步骤110、获取客户端浏览的网页。
具体地,获取客户端浏览的网页的方式有很多,可以从浏览器获得客户端当前浏览的网页,也可以从网页所属的服务器获得客户端当前浏览的网页。比如,当用户使用百度浏览器访问网页时,通过百度浏览器获得用户正在浏览的网页;或者,通过与各个网站合作,并在网站上嵌入调用移动应用推荐应用程序编程接口(Application Programming Interface,API)的代码,从而获得用户正在浏览的网页。
步骤120、解析客户端浏览的网页,得到该网页的网页内容。
具体地,首先,对客户端浏览的超文本标记语言(Hypertext MarkupLanguage,HTML)网页进行解析,生成对应的HTML DOM树,其中,DOM是文档对象化模型(Document Object Model)的简称,DOM树是指通过DOM将HTML页面进行解析,并生成的HTMLtree树状结构和对应访问方法。
然后,遍历HTML DOM树,并从HTML DOM树中提取所需要的文字信息即网页内容,比如,标题、正文等。其中,网页上不同区域的文字可以采用不同的权重,比如,网页正文文本的权重为1、网页标题文本的权重为10,该权重代表了网页不同区域文本的重要性。
步骤130、计算网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据计算出的相似度选取与网页内容对应的移动应用描述信息。
具体地,移动应用数据库中包括各个移动应用信息,以及各个移动应用信息对应的移动应用描述信息,其中,将网页内容与移动应用数据库中各个移动应用描述信息进行相似度计算,目的是找到与网页内容相似度高的移动应用信息,使得这些移动应用信息更能出激发出用户下载移动应用的潜在需求。
步骤140、根据选取的移动应用描述信息向客户端推送相应的移动应用信息。其中,推送的移动应用信息至少包括移动应用的链接和描述,还可包括移动应用的图标或封面,其中,在计算机上链接可以是二维码。
具体地,向客户端推送相应的移动应用信息,是以客户端当前浏览的网页为依据,使得这些移动应用信息更能出激发出用户下载移动应用的潜在需求。
在本实施例的一个优选实施方式中,步骤110之前还包括:建立所述移动应用数据库,所述移动应用数据库包括各个移动应用的移动应用描述信息、所述移动应用描述信息中的移动应用关键词和移动应用关键词权重、以及所述移动应用描述信息中的移动应用主题和移动应用主题概率。
其中,建立移动应用数据库的过程具体如下:
(1)获取各个移动应用的移动应用描述信息,比如,在移动商店中的介绍信息中获取移动应用描述信息,或者通过静态解析技术从移动应用程序中提取的描述信息。
(2)提取各个移动应用的移动应用描述信息的移动应用关键词,计算所述关键词的权重,并根据所述移动应用关键词权重获得所述移动应用描述信息的权重向量信息。比如,对移动应用的描述信息进行移动应用关键词提取时,保留与该移动应用密切相关的词语,并根据词频-逆向文件频率(TermFequency–Inverse Document Frequency,TF-IDF)方法对每个关键词赋予权重,并删除权重较小的关键词。其中,TF-IDF是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。
若对第m个移动应用描述信息中每一个关键词给予一个编号,则第m个移动应用描述信息可以表示成一个权重向量app文字m,如公式(1)所示。
app文字m=(b1,b2,...,bi,...,bn)            公式(1)
其中,bi表示第i个移动应用关键词的权重,n表示移动应用关键词的总数量。
另外,还可以对提取出的各个移动应用的移动应用描述信息的关键词建立移动应用关键词索引,该索引可以是倒排索引,也可以正排索引。其中,建立索引的目的是用于提高网页内容与移动应用描述信息的匹配效率。
(3)提取各个移动应用的移动应用描述信息的移动应用主题,计算所述移动应用主题的概率,并根据所有移动应用主题概率获得所述移动应用描述信息的概率分布向量。
具体地,采用主题模型计算移动应用主题的概率,比如,采用概率潜语义分析(probabilitistic Latent Semantic Analysis,pLSA)获取移动应用的描述信息的主题概率分布。其中,主题概率分布可以对一段文字的宏观描述,从而有效地避免无关词语偶然命中所带来的推送错误。pLSA是基于双模式和共现的数据分析方法延伸的经典的统计学方法。
若对第m个移动应用描述信息中每一个移动应用主题给予一个编号,则第m个移动应用描述信息还可以表示成一个概率向量app主题m,如公式(2)所示。
app主题m=(tb1,tb2,...,tbi,...,tbn)          公式(2)
其中,tbi表示第i个移动应用主题出现的概率,n表示网页主题的总数量。
上述(2)和(3)可以以任意顺序执行,也可以只执行(2)和(3)中的任意一个。
另外,上述(2)还可以对提取出的移动应用关键词建立移动应用关键词索引,该索引可以是倒排索引,也可以正排索引。其中,建立索引的目的是用于提高网页内容与移动应用描述信息的匹配效率。
图2是本发明第二实施例的移动应用信息推送方法的流程图。如图2所示,所述方法包括:
步骤210和步骤220、与步骤110和步骤120相同,在这里不再赘述。
步骤230、提取网页内容的网页关键词。
具体地,提取网页内容的网页关键词是将网页内容中反映段落语义的描述性词语提取出来的过程。因为,网页内容有很多文字,但并不是所有文字都是有用的,比如,一些常用的词语“可以”、“已经”等出现频率非常高,但不反映文字段落的内容语义,所以只提取所需的关键词。
步骤240、计算网页关键词的权重。
具体地,根据TF-IDF计算提取出来的每个网页关键词的权重。
若对每一个网页关键词给予一个编号,则该网页内容可以表示成一个权重向量page文字,如公式(3)所示。
page文字=(a1,a2,...,ai,...,an)         公式(3)
其中,ai表示第i个网页关键词的权重,n表示网页关键词的总数量。
步骤250、根据网页关键词的权重和移动应用数据库中各个移动应用描述信息的移动应用关键词权重,计算所述网页内容与移动应用数据库中各个移动应用描述信息的文字相似度。
具体地,根据公式(1)和公式(3)计算网页内容与第m个移动应用描述信息的文字相似度的过程如公式(4)所示。
Figure BDA0000392350600000081
                          公式(4)
其中,ai表示第i个网页关键词的权重,bi表示第i个移动应用关键词的权重,sim文字m{page文字,app文字m}为网页内容与第m个移动应用描述信息的文字相似度,sim文字m{page文字,app文字m}可以简写为sim文字m
另外,sim文字m为网页内容的权重向量page文字和第m个移动应用描述信息的权重向量app文字m的余弦值,该值越大,则表示网页内容与第m个移动应用描述信息越相似。
步骤260、根据计算出的文字相似度选取与网页内容对应的移动应用描述信息。
具体地,根据文字相似度选取与网页内容对应的移动应用描述信息的方法有很多,比如:将所有文字相似度(sim文字1、sim文字2、...、sim文字n),进行从大到小的排序后,选取前n个相似度对应的移动应用描述信息,所述选取的前n个的移动应用描述信息为与网页内容对应的移动应用描述信息;或者进行从小到大的排序后,选取后n个相似度对应的移动应用描述信息,所述选取的后n个的移动应用描述信息为与网页内容对应的移动应用描述信息。
另外,还可以将所有文字相似度(sim文字1、sim文字2、...、sim文字n),与预设的文字相似度(sim文字0)进行比较,将大于预设的文字相似度(sim文字0)的移动应用描述信息作为网页内容对应的移动应用描述信息。
步骤270、根据选取的移动应用描述信息向客户端推送相应的移动应用信息,以使所述客户端下载所述移动应用信息。比如,选取的移动应用描述信息为第m个移动应用描述信息,即第m个移动应用描述信息与网页内容的相似度最高,则将第m个移动应用描述信息相对应的移动应用信息推送至客户端。
在本实施例的一个优选实施方式中,所述移动应用数据库还包括移动应用关键词索引,步骤250具体包括:
在所述应用关键词索引中查询所述网页关键词,获取所述查询到的网页关键词对应的移动应用描述信息,以及根据所述查询到的网页关键词对应的移动应用描述信息的移动应用关键词权重与所述网页关键词的权重,计算所述查询到的网页关键词对应的移动应用描述信息与所述网页内容的文字相似度。
具体地,对移动应用数据库中的移动应用关键词建立索引的目的是:限制网页内容和哪些移动应用描述信息去计算文字相似度,去掉那些查询不到网页关键词对应的移动应用描述信息,从而减少计算文字相似度的次数,更好的提升计算效率。
图3是本发明第三实施例的移动应用信息推送方法的流程图。如图3所示,所述方法包括:
步骤310和步骤320、与步骤110和步骤120相同,在这里不再赘述。
步骤330、提取网页内容的网页主题。
步骤340、计算网页主题的概率。
具体地,若对网页内容中的每一个网页主题给予一个编号,则该网页内容可以表示成一个概率向量page主题,如公式(5)所示。
page主题=(ta1,ta2,...,tai,...,tan)            公式(5)
其中,tai表示第i个网页主题出现的概率,n表示网页主题的总数量。
步骤350、根据网页主题的概率和所述移动应用数据库中各个移动应用描述信息的移动应用主题概率,计算所述网页内容与移动应用数据库中各个移动应用描述信息的主题相似度。
具体地,计算所述网页内容与移动应用数据库中各个移动应用描述信息的主题相似度有两种方法:
第一、根据公式(2)和公式(5)计算网页内容与第m个移动应用描述信息的文字相似度的过程如公式(6)所示。
Figure BDA0000392350600000101
                          公式(6)
其中,tai表示第i个网页主题出现的概率,tbi表示第i个移动应用主题出现的概率,sim主题m{page主题,app主题m}为网页内容与第m个移动应用描述信息的文字相似度,sim主题m{page主题,app主题m}可以简写为sim主题m
另外,sim主题m为网页内容的概率向量page主题和第m个移动应用描述信息的概率向量app主题m的余弦值,该值越大,则表示网页内容与第m个移动应用描述信息越相似。
第二、根据公式(2)和公式(5)计算网页内容与第m个移动应用描述信息的文字相似度的过程如公式(7)所示。
Figure BDA0000392350600000102
                          公式(7)
其中,由于网页内容的概率向量page主题和第m个移动应用描述信息的概率向量app主题m都是概率分布,所以可以采用KL距离进行计算网页内容与第m个移动应用描述信息的文字相似度。KL距离,是Kullback-Leibler差异(Kullback-Leibler Divergence)的简称,也叫做相对熵(Relative Entropy),它衡量的是相同事件空间里的两个概率分布的差异情况。
步骤360、根据计算出的主题相似度选取与网页内容对应的移动应用描述信息。
具体地,根据主题相似度选取与网页内容对应的移动应用描述信息的方法有很多,比如:将所有主题相似度(sim主题1、sim主题2、...、sim主题n),进行从大到小的排序后,选取前n个相似度对应的移动应用描述信息,所述选取的前n个的移动应用描述信息为与网页内容对应的移动应用描述信息;或者进行从小到大的排序后,选取后n个相似度对应的移动应用描述信息,所述选取的后n个的移动应用描述信息为与网页内容对应的移动应用描述信息。
另外,还可以将所有主题相似度(sim主题1、sim主题2、...、sim主题n),与预设的主题相似度(sim主题0)进行比较,将大于预设的主题相似度(sim主题0)的移动应用描述信息作为网页内容对应的移动应用描述信息。
步骤370、根据选取的移动应用描述信息向所述客户端推送相应的移动应用信息,以使所述客户端下载所述移动应用信息。
图4是本发明第四实施例的移动应用信息推送方法的流程图。如图4所示,所述方法包括:
步骤410和步骤420、与步骤110和步骤120相同,在这里不再赘述。
步骤430、提取网页内容的网页关键词和网页主题。该步骤430包括步骤230和步骤330中的内容,在这里不再赘述。
步骤440、计算网页关键词的权重和网页主题的概率。该步骤440包括步骤240和步骤340中的内容,在这里不再赘述。
步骤450、根据网页关键词的权重和移动应用数据库中各个移动应用描述信息的移动应用关键词权重,计算网页内容与移动应用数据库中各个移动应用描述信息的文字相似度;以及,根据网页主题的概率和移动应用数据库中各个移动应用描述信息的移动应用主题概率,计算网页内容与移动应用数据库中各个移动应用描述信息的主题相似度。该步骤450包括步骤250和步骤350中的内容,在这里不再赘述。
步骤460、确定文字相似度的权重和主题相似度的权重。
具体地,根据实际需要来确定文字相似度的权重α和主题相似度的权重β。比如,根据文字相似度和主题相似度的侧重程度不同来确定文字相似度的权重和主题相似度的权重,若只侧重于文字相似度,则α为1,β为0;若只侧重于主题相似度,则α为0,β为1;若对文字相似度和主题相似度的侧重程度相同,则α为0.5,β为0.5;其他情况不再一一列举。
步骤470、根据文字相似度和主题相似度、以及所述文字相似度的权重和所述主题相似度的权重,计算所述网页内容与各个移动应用描述信息的相似度。
具体地,计算网页内容与第m个移动应用描述信息的相似度的过程如公式(8)所示。
Figure BDA0000392350600000121
                          公式(8)
其中,sim文字m{page文字,app文字m}为网页内容与第m个移动应用描述信息的文字相似度,sim主题m{page主题,app主题m}为网页内容与第m个移动应用描述信息的主题相似度,α为文字相似度的权重,β为主题相似度的权重,simm{sim文字,sim主题}为网页内容与第m个移动应用描述信息的相似度,simm{sim文字,sim主题}可以简写为simm
步骤480、根据计算出的所述网页内容与各个移动应用描述信息的相似度选取与所述网页内容对应的移动应用描述信息。
具体地,根据相似度选取与网页内容对应的移动应用描述信息的方法有很多,比如:将所有相似度(sim1、sim2、...、simn),进行从大到小的排序后,选取前n个相似度对应的移动应用描述信息,所述选取的前n个的移动应用描述信息为与网页内容对应的移动应用描述信息;或者进行从小到大的排序后,选取后n个相似度对应的移动应用描述信息,所述选取的后n个的移动应用描述信息为与网页内容对应的移动应用描述信息。
另外,还可以将所有相似度(sim1、sim2、...、simn),与预设的相似度(sim0)进行比较,将大于预设的题相似度(sim0)的移动应用描述信息作为网页内容对应的移动应用描述信息。
步骤480、根据选取的移动应用描述信息向客户端推送相应的移动应用信息,以使所述客户端下载所述移动应用信息。
在本实施例的一个优选实施方式中,所述移动应用数据库还包括移动应用关键词索引,步骤450中所述根据所述网页关键词的权重和所述移动应用数据库中各个移动应用描述信息的移动应用关键词权重,计算所述网页内容与移动应用数据库中各个移动应用描述信息的文字相似度,包括:
在所述移动应用关键词索引中查询所述网页关键词,获取所述查询到的网页关键词对应的移动应用描述信息,以及根据所述查询到的网页关键词对应的移动应用描述信息的应用关键词权重与所述网页关键词的权重,计算所述查询到的网页关键词对应的移动应用描述信息与所述网页内容的文字相似度。
因此,本发明实施例一至四提供的移动应用信息推送方法,通过获取客户端浏览的网页,解析所述网页,得到网页内容,计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息,根据选取的所述移动应用描述信息向所述客户端推送相应的移动应用信息,以使所述客户端下载所述移动应用信息,实现了根据客户端浏览的网页,捕捉到客户端当前的兴趣点,从而触发客户端下载移动应用的潜在需求,提高了客户端对推送的移动应用的使用率。
图5是本发明第五实施例的移动应用信息推送装置的示意图。该装置用于执行本发明第一实施例至第四实施例的移动应用信息推送方法。如图5所示,所述移动应用信息推送装置50包括:获取模块51、解析模块52、处理模块53和推送模块54。
获取模块51用于获取客户端浏览的网页。
解析模块52用于解析所述网页,得到网页内容。
处理模块53用于计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息。
推送模块54用于根据选取的所述移动应用描述信息向所述客户端推送相应的移动应用信息,以使所述客户端下载所述移动应用信息。
在一个实施例中,本发明提供的移动应用信息推送装置还包括:建立模块55。
建立模块55用于建立所述移动应用数据库,所述移动应用数据库包括各个移动应用的移动应用描述信息、所述移动应用描述信息中的移动应用关键词和移动应用关键词权重、以及所述移动应用描述信息中的移动应用主题和移动应用主题概率。
另一个实施例中,处理模块53包括:第一提取单元5301、第一计算单元5302和第一选取单元5303,如图6所示。
第一提取单元5301用于提取所述网页内容的网页关键词。
第一计算单元5302用于计算所述网页关键词的权重,根据所述网页关键词的权重和所述移动应用数据库中各个移动应用描述信息的移动应用关键词权重,计算所述网页内容与移动应用数据库中各个移动应用描述信息的文字相似度。
第一选取单元5303用于根据计算出的所述文字相似度选取与所述网页内容对应的移动应用描述信息。
其中,所述移动应用数据库还包括移动应用关键词索引,第一计算单元5302还具体用于在所述移动应用关键词索引中查询所述网页关键词,获取所述查询到的网页关键词对应的移动应用描述信息,以及根据所述查询到的网页关键词对应的移动应用描述信息的移动应用关键词权重与所述网页关键词的权重,计算所述查询到的网页关键词对应的移动应用描述信息与所述网页内容的文字相似度。
再一个实施例中,处理模块53包括:第二提取单元5304、第二计算单元5305和第二选取单元5306,如图7所示。
第二提取单元5304用于提取网页内容的网页主题。
第二计算单元5305用于计算所述网页主题的概率;根据所述网页主题的概率和所述移动应用数据库中各个移动应用描述信息的移动应用主题概率,计算所述网页内容与移动应用数据库中各个移动应用描述信息的主题相似度。
第二选取单元5306用于根据计算出的所述主题相似度选取与所述网页内容对应的移动应用描述信息。
再一个实施例中,处理模块53包括:第三提取单元5307、第三计算单元5308、确定单元5309、第四计算单元5310和第三选取单元5311,如图8所示。
第三提取单元5307用于提取所述网页内容的网页关键词和网页内容的网页主题;
第三计算单元5308用于计算所述网页主题的概率;根据所述网页关键词的权重和所述移动应用数据库中各个移动应用描述信息的移动应用关键词权重,计算所述网页内容与移动应用数据库中各个移动应用描述信息的文字相似度;以及,根据所述网页主题的概率和所述移动应用数据库中各个移动应用描述信息的移动应用主题概率,计算所述网页内容与移动应用数据库中各个移动应用描述信息的主题相似度。
确定单元5309用于确定所述文字相似度的权重和所述主题相似度的权重。
第四计算单元5310用于根据所述文字相似度和主题相似度、以及所述文字相似度的权重和所述主题相似度的权重,计算所述网页内容与各个移动应用描述信息的相似度。
第三选取单元5311用于根据计算出的所述网页内容与各个移动应用描述信息的相似度选取与所述网页内容对应的移动应用描述信息。
其中,所述移动应用数据库还包括移动应用关键词索引,第三计算单元5308还具体用于在所述移动应用关键词索引中查询所述网页关键词,获取所述查询到的网页关键词对应的移动应用描述信息,以及根据所述查询到的网页关键词对应的移动应用描述信息的移动应用关键词权重与所述网页关键词的权重,计算所述查询到的网页关键词对应的移动应用描述信息与所述网页内容的文字相似度。
再一个实施例中,所述处理模块53还用于将所述计算出的相似度进行从大到小的排序后,选取前n个相似度对应的移动应用描述信息,所述选取的前n个移动应用描述信息为与所述网页内容对应的移动应用描述信息;或者,将所述计算出的相似度进行从小到大的排序后,选取后n个相似度对应的移动应用描述信息,所述选取的后n个移动应用描述信息为与所述网页内容对应的移动应用描述信息。
因此,本发明实施例提供的移动应用信息推送装置,通过获取客户端浏览的网页,解析所述网页,得到网页内容,计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息,根据选取的所述移动应用描述信息向所述客户端推送相应的移动应用信息,以使所述客户端下载所述移动应用信息,实现了根据客户端浏览的网页,捕捉到客户端当前的兴趣点,从而触发客户端下载移动应用的潜在需求,提高了客户端对推送的移动应用的使用率。
显然,本领域技术人员应该明白,上述的本发明的各模块或各步骤可以通过如上所述的通信终端实施。可选地,本发明实施例可以用计算机装置可执行的程序来实现,从而可以将它们存储在存储装置中由处理器来执行,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等;或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和的结合。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (15)

1.一种移动应用信息推送方法,其特征在于,所述方法包括:
获取客户端浏览的网页;
解析所述网页,得到网页内容;
计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息;
根据选取的所述移动应用描述信息向所述客户端推送相应的移动应用信息。
2.根据权利要求1所述的移动应用信息推送方法,其特征在于,所述获取客户端浏览的网页之前,还包括:
建立所述移动应用数据库,所述移动应用数据库包括各个移动应用的移动应用描述信息、所述移动应用描述信息中的移动应用关键词和移动应用关键词权重、以及所述移动应用描述信息中的移动应用主题和移动应用主题概率。
3.根据权利要求2所述的移动应用信息推送方法,其特征在于,所述计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息,包括:
提取所述网页内容的网页关键词;
计算所述网页关键词的权重;
根据所述网页关键词的权重和所述移动应用数据库中各个移动应用描述信息的移动应用关键词权重,计算所述网页内容与移动应用数据库中各个移动应用描述信息的文字相似度;
根据计算出的所述文字相似度选取与所述网页内容对应的移动应用描述信息。
4.根据权利要求2所述的移动应用信息推送方法,其特征在于,所述计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息,包括:
提取网页内容的网页主题;
计算所述网页主题的概率;
根据所述网页主题的概率和所述移动应用数据库中各个移动应用描述信息的移动应用主题概率,计算所述网页内容与移动应用数据库中各个移动应用描述信息的主题相似度;
根据计算出的所述主题相似度选取与所述网页内容对应的移动应用描述信息。
5.根据权利要求2所述的移动应用信息推送方法,其特征在于,所述计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息,包括:
提取所述网页内容的网页关键词和网页主题;
计算所述网页关键词的权重和所述网页主题的概率;
根据所述网页关键词的权重和所述移动应用数据库中各个移动应用描述信息的移动应用关键词权重,计算所述网页内容与移动应用数据库中各个移动应用描述信息的文字相似度;以及,根据所述网页主题的概率和所述移动应用数据库中各个移动应用描述信息的移动应用主题概率,计算所述网页内容与移动应用数据库中各个移动应用描述信息的主题相似度;
确定所述文字相似度的权重和所述主题相似度的权重;
根据所述文字相似度和主题相似度、以及所述文字相似度的权重和所述主题相似度的权重,计算所述网页内容与各个移动应用描述信息的相似度;
根据计算出的所述网页内容与各个移动应用描述信息的相似度选取与所述网页内容对应的移动应用描述信息。
6.根据权利要求3或5所述的移动应用信息推送方法,其特征在于,所述移动应用数据库还包括移动应用关键词索引,所述根据所述网页关键词的权重和所述移动应用数据库中各个移动应用描述信息的移动应用关键词权重,计算所述网页内容与移动应用数据库中各个移动应用描述信息的文字相似度,包括:
在所述移动应用关键词索引中查询所述网页关键词,获取所述查询到的网页关键词对应的移动应用描述信息,以及根据所述查询到的网页关键词对应的移动应用描述信息的移动应用关键词权重与所述网页关键词的权重,计算所述查询到的网页关键词对应的移动应用描述信息与所述网页内容的文字相似度。
7.根据权利要求1所述的移动应用信息推送方法,其特征在于,所述根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息,包括:
将所述计算出的相似度进行从大到小的排序后,选取前n个相似度对应的移动应用描述信息,所述选取的前n个移动应用描述信息为与所述网页内容对应的移动应用描述信息;或者,将所述计算出的相似度进行从小到大的排序后,选取后n个相似度对应的移动应用描述信息,所述选取的后n个移动应用描述信息为与所述网页内容对应的移动应用描述信息。
8.一种移动应用信息推送装置,其特征在于,所述装置包括:
获取模块,用于获取客户端浏览的网页;
解析模块,用于解析所述网页,得到网页内容;
处理模块,用于计算所述网页内容与移动应用数据库中各个移动应用描述信息的相似度,并根据所述计算出的相似度选取与所述网页内容对应的移动应用描述信息;
推送模块,用于根据选取的所述移动应用描述信息向所述客户端推送相应的移动应用信息。
9.根据权利要求8所述的移动应用信息推送装置,其特征在于,所述装置还包括:
建立模块,用于建立所述移动应用数据库,所述移动应用数据库包括各个移动应用的移动应用描述信息、所述移动应用描述信息中的移动应用关键词和移动应用关键词权重、以及所述移动应用描述信息中的移动应用主题和移动应用主题概率。
10.根据权利要求9所述的移动应用信息推送装置,其特征在于,所述处理模块包括:
第一提取单元,用于提取所述网页内容的网页关键词;
第一计算单元,用于计算所述网页关键词的权重,根据所述网页关键词的权重和所述移动应用数据库中各个移动应用描述信息的移动应用关键词权重,计算所述网页内容与所述移动应用数据库中各个移动应用描述信息的文字相似度;
第一选取单元,用于根据计算出的所述文字相似度选取与所述网页内容对应的移动应用描述信息。
11.根据权利要求10所述的移动应用信息推送装置,其特征在于,所述移动应用数据库还包括移动应用关键词索引,所述第一计算单元还用于在所述应用关键词索引中查询所述网页关键词,获取所述查询到的网页关键词对应的移动应用描述信息,以及根据所述查询到的网页关键词对应的移动应用描述信息的移动应用关键词权重与所述网页关键词的权重,计算所述查询到的网页关键词对应的移动应用描述信息与所述网页内容的文字相似度。
12.根据权利要求9所述的移动应用信息推送装置,其特征在于,所述处理模块包括:
第二提取单元,用于提取网页内容的网页主题;
第二计算单元,用于计算所述网页主题的概率;根据所述网页主题的概率和所述移动应用数据库中各个移动应用描述信息的移动应用主题概率,计算所述网页内容与所述移动应用数据库中各个移动应用描述信息的主题相似度;
第二选取单元,用于根据计算出的所述主题相似度选取与所述网页内容对应的移动应用描述信息。
13.根据权利要求9所述的移动应用信息推送装置,其特征在于,所述处理模块包括:
第三提取单元,用于提取所述网页内容的网页关键词和网页内容的网页主题;
第三计算单元,用于计算所述网页主题的概率;根据所述网页关键词的权重和所述移动应用数据库中各个移动应用描述信息的移动应用关键词权重,计算所述网页内容与移动应用数据库中各个移动应用描述信息的文字相似度;以及,根据所述网页主题的概率和所述移动应用数据库中各个移动应用描述信息的移动应用主题概率,计算所述网页内容与移动应用数据库中各个移动应用描述信息的主题相似度;
确定单元,用于确定所述文字相似度的权重和所述主题相似度的权重;
第四计算单元,用于根据所述文字相似度和主题相似度、以及所述文字相似度的权重和所述主题相似度的权重,计算所述网页内容与各个移动应用描述信息的相似度;
第三选取单元,用于根据计算出的所述网页内容与各个移动应用描述信息的相似度选取与所述网页内容对应的移动应用描述信息。
14.根据权利要求13所述的移动应用信息推送装置,其特征在于,所述移动应用数据库还包括移动应用关键词索引,所述第三计算单元还用于在所述移动应用关键词索引中查询所述网页关键词,获取所述查询到的网页关键词对应的移动应用描述信息,以及根据所述查询到的网页关键词对应的移动应用描述信息的应用关键词权重与所述网页关键词的权重,计算所述查询到的网页关键词对应的移动应用描述信息与所述网页内容的文字相似度。
15.根据权利要求8所述的移动应用信息推送装置,其特征在于,所述处理模块具体用于将所述计算出的相似度进行从大到小的排序后,选取前n个相似度对应的移动应用描述信息,所述选取的前n个移动应用描述信息为与所述网页内容对应的移动应用描述信息;或者,将所述计算出的相似度进行从小到大的排序后,选取后n个相似度对应的移动应用描述信息,所述选取的后n个移动应用描述信息为与所述网页内容对应的移动应用描述信息。
CN201310463741.9A 2013-10-08 2013-10-08 移动应用信息推送方法和装置 Pending CN103530339A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310463741.9A CN103530339A (zh) 2013-10-08 2013-10-08 移动应用信息推送方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310463741.9A CN103530339A (zh) 2013-10-08 2013-10-08 移动应用信息推送方法和装置

Publications (1)

Publication Number Publication Date
CN103530339A true CN103530339A (zh) 2014-01-22

Family

ID=49932348

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310463741.9A Pending CN103530339A (zh) 2013-10-08 2013-10-08 移动应用信息推送方法和装置

Country Status (1)

Country Link
CN (1) CN103530339A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886039A (zh) * 2014-03-10 2014-06-25 百度在线网络技术(北京)有限公司 应用检索的优化方法和装置
CN104361062A (zh) * 2014-11-03 2015-02-18 百度在线网络技术(北京)有限公司 一种关联信息的推荐方法及装置
CN105677695A (zh) * 2015-09-28 2016-06-15 杭州圆橙科技有限公司 一种基于内容的计算移动应用相似性的方法
CN106055591A (zh) * 2016-05-23 2016-10-26 北京金山安全软件有限公司 一种天气推送方法及装置
WO2017000402A1 (zh) * 2015-06-30 2017-01-05 百度在线网络技术(北京)有限公司 网页生成方法和装置
CN106503224A (zh) * 2016-11-04 2017-03-15 维沃移动通信有限公司 一种根据关键词推荐应用的方法及装置
CN106682964A (zh) * 2016-12-29 2017-05-17 努比亚技术有限公司 一种确定应用标签的方法和装置
CN106909688A (zh) * 2017-03-07 2017-06-30 广州优视网络科技有限公司 一种基于输入搜索词来推荐搜索词的方法和装置
CN106940705A (zh) * 2016-12-20 2017-07-11 上海掌门科技有限公司 一种用于构建用户画像的方法与设备
CN107608980A (zh) * 2016-07-11 2018-01-19 中国电信股份有限公司 基于dpi大数据分析的信息推送方法和系统
CN107844495A (zh) * 2016-09-19 2018-03-27 北京搜狗科技发展有限公司 一种应用程序推荐方法、装置及电子设备
CN107977382A (zh) * 2016-10-25 2018-05-01 北京京东尚科信息技术有限公司 用于推送信息的方法和装置
CN108369585A (zh) * 2015-11-30 2018-08-03 三星电子株式会社 用于提供翻译服务的方法及其电子装置
CN112052330A (zh) * 2019-06-05 2020-12-08 上海游昆信息技术有限公司 一种应用程序关键词的分配方法及装置
CN112418294A (zh) * 2020-11-18 2021-02-26 青岛海尔科技有限公司 确定帐号类别的方法、装置、存储介质及电子装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090265423A1 (en) * 2008-04-16 2009-10-22 Aricent Inc. Method and system of mobile application implementation on network server
CN101866341A (zh) * 2009-04-17 2010-10-20 华为技术有限公司 一种信息推送方法、装置及系统
CN103020845A (zh) * 2012-12-14 2013-04-03 百度在线网络技术(北京)有限公司 一种移动应用的推送方法及系统
CN103246725A (zh) * 2013-05-06 2013-08-14 上海河广信息科技有限公司 一种基于无线网络的数据业务推送系统和方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090265423A1 (en) * 2008-04-16 2009-10-22 Aricent Inc. Method and system of mobile application implementation on network server
CN101866341A (zh) * 2009-04-17 2010-10-20 华为技术有限公司 一种信息推送方法、装置及系统
CN103020845A (zh) * 2012-12-14 2013-04-03 百度在线网络技术(北京)有限公司 一种移动应用的推送方法及系统
CN103246725A (zh) * 2013-05-06 2013-08-14 上海河广信息科技有限公司 一种基于无线网络的数据业务推送系统和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张长学 等: "手机云端管家平台的设计与实现", 《移动通信》 *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886039A (zh) * 2014-03-10 2014-06-25 百度在线网络技术(北京)有限公司 应用检索的优化方法和装置
CN103886039B (zh) * 2014-03-10 2018-01-19 百度在线网络技术(北京)有限公司 应用检索的优化方法和装置
CN104361062B (zh) * 2014-11-03 2017-10-31 百度在线网络技术(北京)有限公司 一种关联信息的推荐方法及装置
CN104361062A (zh) * 2014-11-03 2015-02-18 百度在线网络技术(北京)有限公司 一种关联信息的推荐方法及装置
WO2017000402A1 (zh) * 2015-06-30 2017-01-05 百度在线网络技术(北京)有限公司 网页生成方法和装置
CN105677695B (zh) * 2015-09-28 2019-03-08 杭州圆橙科技有限公司 一种基于内容的计算移动应用相似性的方法
CN105677695A (zh) * 2015-09-28 2016-06-15 杭州圆橙科技有限公司 一种基于内容的计算移动应用相似性的方法
CN108369585A (zh) * 2015-11-30 2018-08-03 三星电子株式会社 用于提供翻译服务的方法及其电子装置
CN106055591A (zh) * 2016-05-23 2016-10-26 北京金山安全软件有限公司 一种天气推送方法及装置
CN106055591B (zh) * 2016-05-23 2020-03-17 珠海豹趣科技有限公司 一种天气推送方法及装置
CN107608980A (zh) * 2016-07-11 2018-01-19 中国电信股份有限公司 基于dpi大数据分析的信息推送方法和系统
CN107844495A (zh) * 2016-09-19 2018-03-27 北京搜狗科技发展有限公司 一种应用程序推荐方法、装置及电子设备
CN107977382A (zh) * 2016-10-25 2018-05-01 北京京东尚科信息技术有限公司 用于推送信息的方法和装置
CN107977382B (zh) * 2016-10-25 2022-02-01 北京京东尚科信息技术有限公司 用于推送信息的方法和装置
CN106503224A (zh) * 2016-11-04 2017-03-15 维沃移动通信有限公司 一种根据关键词推荐应用的方法及装置
CN106940705B (zh) * 2016-12-20 2021-01-22 上海掌门科技有限公司 一种用于构建用户画像的方法与设备
CN106940705A (zh) * 2016-12-20 2017-07-11 上海掌门科技有限公司 一种用于构建用户画像的方法与设备
CN106682964A (zh) * 2016-12-29 2017-05-17 努比亚技术有限公司 一种确定应用标签的方法和装置
CN106909688A (zh) * 2017-03-07 2017-06-30 广州优视网络科技有限公司 一种基于输入搜索词来推荐搜索词的方法和装置
CN106909688B (zh) * 2017-03-07 2020-10-16 阿里巴巴(中国)有限公司 一种基于输入搜索词来推荐搜索词的方法和装置
CN112052330A (zh) * 2019-06-05 2020-12-08 上海游昆信息技术有限公司 一种应用程序关键词的分配方法及装置
CN112052330B (zh) * 2019-06-05 2021-11-26 上海游昆信息技术有限公司 一种应用程序关键词的分配方法及装置
CN112418294A (zh) * 2020-11-18 2021-02-26 青岛海尔科技有限公司 确定帐号类别的方法、装置、存储介质及电子装置

Similar Documents

Publication Publication Date Title
CN103530339A (zh) 移动应用信息推送方法和装置
US9448999B2 (en) Method and device to detect similar documents
US8751466B1 (en) Customizable answer engine implemented by user-defined plug-ins
US8903800B2 (en) System and method for indexing food providers and use of the index in search engines
CN107463591B (zh) 响应于搜索查询对待与内容匹配的图像动态排序的方法和系统
US20170177729A1 (en) Search engine and link-based ranking algorithm for the semantic web
CN102708174B (zh) 一种浏览器中的富媒体信息的展示方法和装置
US8631097B1 (en) Methods and systems for finding a mobile and non-mobile page pair
JP2017157192A (ja) キーワードに基づいて画像とコンテンツアイテムをマッチングする方法
US11127063B2 (en) Product and content association
CN103838756A (zh) 一种确定推送信息的方法及装置
CN102486784B (zh) 信息请求方法和信息提供方法
CN107463592B (zh) 用于将内容项目与图像匹配的方法、设备和数据处理系统
JP5269938B2 (ja) 急上昇ワード関連付け装置及び方法
CN107491465A (zh) 用于搜索内容的方法和装置以及数据处理系统
CN102591965A (zh) 一种黑链检测的方法及装置
EP2933734A1 (en) Method and system for the structural analysis of websites
JP2017157193A (ja) 画像とコンテンツのメタデータに基づいてコンテンツとマッチングする画像を選択する方法
TWI417751B (zh) Information providing device, information providing method, information application program, and information recording medium
CN104090923A (zh) 一种浏览器中的富媒体信息的展示方法和装置
CN104050183A (zh) 浏览器输入框的内容匹配结果提示方法及装置
TWI399657B (zh) A provider, a method of providing information, a program, and an information recording medium
US20120284224A1 (en) Build of website knowledge tables
CN104063506A (zh) 重复网页识别方法和装置
CN104965926B (zh) 网页提供方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140122