CN103020208A - 一种与移动终端相适应的搜索方法及装置 - Google Patents

一种与移动终端相适应的搜索方法及装置 Download PDF

Info

Publication number
CN103020208A
CN103020208A CN201210520964XA CN201210520964A CN103020208A CN 103020208 A CN103020208 A CN 103020208A CN 201210520964X A CN201210520964X A CN 201210520964XA CN 201210520964 A CN201210520964 A CN 201210520964A CN 103020208 A CN103020208 A CN 103020208A
Authority
CN
China
Prior art keywords
web page
page
wap
user
wap page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210520964XA
Other languages
English (en)
Other versions
CN103020208B (zh
Inventor
程刚
魏少俊
张燕静
蒲鹏
罗高景
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201210520964.XA priority Critical patent/CN103020208B/zh
Publication of CN103020208A publication Critical patent/CN103020208A/zh
Application granted granted Critical
Publication of CN103020208B publication Critical patent/CN103020208B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种与移动终端相适应的搜索方法及装置,其中所述搜索方法包括:预先建立web页面与wap页面之间的映射关系;获取用户搜索请求;获取与所述请求中的关键词匹配的检索结果项,并根据所述请求确定所述用户的终端是否为移动终端,如果是,则将所述检索结果项中与所述映射关系中的记录匹配的web页面项转换为wap页面项;将转换后的检索结果项返回给用户。通过上述方式,本发明能够使搜索引擎自适应移动终端用户的搜索需要。

Description

一种与移动终端相适应的搜索方法及装置
【技术领域】
本发明涉及搜索技术,特别涉及一种与移动终端相适应的搜索方法及装置。
【背景技术】
随着移动互联网的发展,有越来越多的用户通过手机等移动终端上网。为了适应这种无线通讯的趋势,很多网站对外除了提供web页面资源,也提供wap(Wireless Application Protocol)页面资源,其中web页面是较适用于在电脑等终端上展示的页面,wap页面是较适用于在手机等移动终端上展示的页面。
搜索引擎是用户从互联网中获取资料的有力工具。但是现有的搜索引擎,通常只对互联网中的web页面资源进行索引,这样,当用户输入关键词时,搜索引擎只能向用户返回与所输关键词匹配的web页面资源。如果用户是使用移动终端上网的,这时想要阅读搜索引擎返回的web页面资源就会比较困难,因为打开一个web页面占用的网络资源和终端的计算资源都比wap页面要大很多,这说明现有搜索技术存在不能自适应移动终端用户的搜索需要的缺陷。
【发明内容】
本发明所要解决的技术问题是提供一种与移动终端相适应的搜索方法及装置,以解决现有搜索技术中存在的不能自适应移动终端用户的搜索需要的缺陷。
本发明为解决技术问题而采用的技术方案是提供一种与移动终端相适应的搜索方法,包括:预先建立web页面与wap页面之间的映射关系;获取用户搜索请求;获取与所述请求中的关键词匹配的检索结果项,并根据所述请求确定所述用户的终端是否为移动终端,如果是,则将所述检索结果项中与所述映射关系中的记录匹配的web页面项转换为wap页面项;将转换后的检索结果项返回给用户。
根据本发明之一优选实施例,建立web页面与wap页面之间的映射关系的步骤包括:提取网络中的web页面的元信息,所述元信息中记录了所述web页面对应的wap页面;判断所述对应的wap页面与所述web页面的内容是否匹配,如果是,则建立所述web页面与所述对应的wap页面之间的映射关系。
根据本发明之一优选实施例,判断所述对应的wap页面与所述web页面的内容是否匹配的步骤包括:提取所述对应的wap页面的文本特征向量以及所述web页面的文本特征向量;计算所述对应的wap页面的文本特征向量与所述web页面的文本特征向量之间的余弦相似度,并在所述余弦相似度大于设定值时,确定所述对应的wap页面与所述web页面匹配的内容匹配。
根据本发明之一优选实施例,影响所述wap页面的文本特征向量的因素包括所述wap页面中词语的词频和逆文档频率,以及,影响所述web页面的文本特征向量的因素包括所述web页面中词语的词频和逆文档频率。
根据本发明之一优选实施例,根据所述请求确定所述用户的终端是否为移动终端的步骤包括:确定所述请求中是否存在地理位置标识信息,如果是,则确定所述用户的终端为移动终端。
本发明还提供了一种与移动终端相适应的搜索装置,包括:预处理单元,用于建立web页面与wap页面之间的映射关系;接收单元,用于获取用户搜索请求;检索单元,用于获取与所述请求中的关键词匹配的检索结果项;转换单元,用于根据所述请求确定所述用户的终端是否为移动终端,如果是,则将所述检索结果项中与所述映射关系中的记录匹配的web页面项转换为wap页面项;发送单元,用于将转换后的检索结果项返回给用户。
根据本发明之一优选实施例,所述预处理单元包括:元信息提取单元,用于提取网络中的web页面的元信息,所述元信息中记录了所述web页面对应的wap页面;判断单元,用于判断所述对应的wap页面与所述web页面的内容是否匹配,如果是,则触发保存单元执行;保存单元,用于建立所述web页面与所述对应的wap页面之间的映射关系。
根据本发明之一优选实施例,所述判断单元包括:特征提取单元,用于提取所述对应的wap页面的文本特征向量以及所述web页面的文本特征向量;计算单元,用于计算所述对应的wap页面的文本特征向量与所述web页面的文本特征向量之间的余弦相似度,并在所述余弦相似度大于设定值时,确定所述对应的wap页面与所述web页面的内容匹配。
根据本发明之一优选实施例,影响所述wap页面的文本特征向量的因素包括所述wap页面中词语的词频和逆文档频率,以及,影响所述web页面的文本特征向量的因素包括所述web页面中词语的词频和逆文档频率。
根据本发明之一优选实施例,所述转换单元根据所述请求确定所述用户的终端是否为移动终端的方式包括:确定所述请求中是否存在地理位置标识信息,如果是,则确定所述用户的终端为移动终端。
由以上技术方案可以看出,本发明通过预先建立web页面与wap页面之间的映射关系,可以在接收到用户的请求并根据该请求判断出用户使用的终端为移动终端后,根据预先得到的映射关系中的记录,将检索结果项中的web页面项转换为wap页面项返回给用户,从而使用户能够得到与移动终端相适应的检索结果。本发明不需要对现有搜索的排序算法和索引方法进行改动,就能很好地实现搜索引擎自适应移动终端用户的搜索需要的目的。
【附图说明】
图1为本发明中与移动终端相适应的搜索方法的实施例的流程示意图;
图2a为本发明中用户使用电脑进行搜索时得到检索结果项的示意图;
图2b为本发明中用户使用手机进行搜索时得到检索结果项的示意图;
图3为本发明中与移动终端相适应的搜索装置的实施例的结构示意框图;
图4为本发明中预处理单元201的实施例的结构示意框图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
请参考图1,图1为本发明中的与移动终端相适应的搜索方法的实施例的流程示意图。如图1所示,该实施例包括:
步骤S101:预先建立web页面与wap页面之间的映射关系。
步骤S102:获取用户搜索请求。
步骤S103:获取与所述请求中的关键词匹配的检索结果项,并根据所述请求确定用户的终端是否为移动终端,如果是,则将检索结果项中与步骤S101获取到的映射关系中的记录匹配的web页面项转换为wap页面项。
步骤S104:将转换后的检索结果项返回给用户。
下面对上述方法进行具体说明。
本实施例中,步骤S101可在线下执行,步骤S102至S104可在线上执行。
其中,步骤S101具体包括:
步骤S1011:提取网络中的web页面的元信息,该元信息中记录了所述web页面对应的wap页面。
步骤S1012:判断所述对应的wap页面与所述web页面的内容是否匹配,如果是,则建立所述web页面与所述对应的wap页面之间的映射关系。
请参考下面的HTML代码片段,假设该代码片段是地址为“www.sina.com.cn”的web页面中的片段:
Figure BDA00002536035200041
Figure BDA00002536035200051
在上述HTML的头部信息(即位于<head></head>标签对中的信息)中,包含在<meta/>标签内的信息就是元信息。元信息中的“content”属性中嵌入的“url”属性值“3g.sina.com.cn”,就是与web页面“www.sina.com.cn”对应的wap页面的地址。
步骤S1011中,搜索引擎的爬虫蜘蛛在对网络中的web页面进行抓取时,可以通过如前面示意的web页面中的元信息,找到对应的wap页面地址,这样就得到了若干对应的页面地址对。例如上面的“www.sina.com.cn”和“3g.sina.com.cn”就构成了一个web页面和wap页面的地址对。
步骤S1012中,可针对每个抓取到的地址对,验证这个地址对对应的两个页面,即一个web页面和一个wap页面的内容是否匹配,如果是,则可以将这两个地址对保留到数据表中,建立这两个地址对之间的关联关系,这样,在这个web页面和这个wap页面之间就形成了映射关系。例如数据表中保存的映射关系如下表所示:
Web页面地址 Wap页面地址
www.sina.com.cn 3g.sina.com.cn
www.baidu.com wap.baidu.com
www.163.com wap.163.com
…… ……
下面对步骤S1012中判断web页面与对应的wap页面的内容是否匹配的步骤进行介绍。
具体地,判断web页面与对应的wap页面的内容是否匹配的步骤包括:
步骤1012a:提取web页面的文本特征向量以及对应的wap页面的文本特征向量。
Web页面与对应的wap页面中包含大量的文本内容,在步骤S1012a中,首先对web页面和对应的wap页面进行预处理,将这两个页面的文本进行分词,并将其中的停用词过滤掉,这里可以通过现有的停用词表对这两个页面的文本中的停用词进行过滤。
对这两个文本进行预处理后,分别统计这两个文本中每个词的词频(即每个词在该文本中出现的次数)作为这个词的权重。
例如上述地址为“www.sina.com.cn”的web页面中,词频排名前三位的词分别是“新闻”(30)、“分类”(20)、“门户”(15),其中括号内的数字表示该词的权重,地址为“3g.sina.com.cn”的wap页面中,词频排名前三名的词分别是“新闻”(25)、“门户”(18)、“手机”(10)。
进一步,还需要使用每个词的逆文档频率对这个词的权重进行调整,词的逆文档频率越高表示这个词作为特征词的效果越好,也就是说,如果一个词语的逆文档频率高,则对这个词语的权重进行加权,如果一个词语的逆文档频率低,则对这个词语的权重进行降权。一个词语的逆文档频率可以采用现有技术中的方法统计得到。
在得到web页面的各个词语的权重和wap页面的各个词语的权重后,可以将这两个页面中的若干个权重最高的词提取出来构成这两个页面的文本特征向量。
例如web页面的文本特征向量为(20,14,10)(分别代表的词语是“新闻”、“财经”、“娱乐”),wap页面的文本特征向量为(15,13,8)(分别代表的词语是“新闻”、“财经”、“体育”)。
步骤S1012b:计算web页面的文本特征向量与对应的wap页面的文本特征向量之间的余弦相似度,并在余弦相似度大于设定值时,确定web页面与对应的wap页面匹配。
为了计算两个向量之间的余弦相似度,上面的例子中,web页面的文本特征向量[20,14,10]应该变为[20,14,10,0](分别代表“新闻”、“财经”、“娱乐”和“体育”),wap页面的文本特征向量[15,13,8]应该变为[15,13,0,8](分别代表“新闻”、“财经”、“娱乐”和体育”),然后采用余弦距离的计算公式计算这两个向量之间的余弦相似度如下:
sim = 20 * 15 + 14 * 13 + 10 * 0 + 0 * 8 20 2 + 15 2 + 14 2 + 0 2 * 15 2 + 13 2 + 0 2 + 8 2 = 0.83
假设设定值为0.8,由于余弦相似度大于设定值,则可以确定“www.sina.com.cn”的web页面与“3g.sina.com.cn”的wap页面内容匹配。因此,步骤S1012中就可以将这两个地址放入到数据表中,从而建立“www.sina.com.cn”的web页面与“3g.sina.com.cn”的wap页面之间的映射关系。
以上对本实施例中步骤S101的线下实现过程进行了详细说明,通过上述说明可以看出,步骤S101可以对互联网上的web页面进行分析,并建立起大量的web页面和wap页面之间的映射关系。
这样,在线上时,步骤S102中,首先获取用户的搜索请求,该搜索请求中包含用户用于搜索时使用的关键词,此外,还包含其他一些信息,例如,用户的终端是移动终端时,请求中还可包含地理位置标识信息。这种地理位置标识信息,是用户使用移动终端中的搜索应用时,该搜索应用调用终端的GPS接口,或者通过移动通信网络获取得到的。这样,在步骤S103中,接收到用户的搜索请求后,搜索引擎首先可以根据现有的索引库查找到与用户请求中的关键词匹配的检索结果项,并且,可通过确定用户请求中是否存在地理位置标识信息来确定用户的终端是否是移动终端,如果用户的终端是移动终端,则查找步骤S101得到的映射关系中的记录,以确定前面得到的与关键词匹配的检索结果项中是否存在与映射关系中的记录匹配的web页面项,如果有,则根据该映射关系,将匹配的web页面项转换为wap页面项。
例如用户使用的终端为移动终端,且搜索使用的关键词是“肖申克的救赎豆瓣电影”,搜索引擎根据现有的索引库查找到匹配的检索结果项包括“http://movie.douban.com/subject/1292052/”,这个结果项是web页面的地址,而在映射关系中正好存在一条记录如下:
Figure BDA00002536035200072
Figure BDA00002536035200081
则步骤S103中会把检索结果项中的“http://movie.douban.com/subject/1292052/”这个web页面项转换为“http://m.douban.com/movie/subject/1292052/”这个wap页面项,并在步骤S 104中,将转换后的各个检索结果项返回给用户。其中,这些检索结果项中在映射关系中无法找到匹配项的,就按照原样返回给用户即可。
请参考图2a和图2b,其中图2a为本发明中用户使用电脑进行搜索时得到的检索结果项的示意图,而图2b为本发明中用户使用手机进行搜索时得到的检索结果项的示意图。可以看出,采用本实施例的方法,对现有搜索引擎的实现不需要有大的改动,既不需要修改搜索引擎的排序算法,也不需要搜索引擎重新建立索引,即可实现搜索引擎自动适应移动终端的目的。
请参考图3,图3为本发明中与移动终端相适应的搜索装置的实施例的结构示意框图。如图3所示,该实施例包括:预处理单元201、接收单元202、检索单元203、转换单元204及发送单元205。
其中,预处理单元201,用于建立web页面与wap页面之间的映射关系。预处理单元201将在线下执行。
请参考图4,图4为本发明中预处理单元201的实施例的结构示意框图。
如图4所示,预处理单元201包括:元信息提取单元2011、判断单元2012及保存单元2013。
其中元信息提取单元2011,用于提取网络中的web页面中的元信息,所述元信息记录了所述web页面对应的wap页面。
请参考下面的HTML代码片段,假设该代码片段是地址为“www.sina.com.cn”的web页面中的片段:
Figure BDA00002536035200082
在上述HTML的头部信息(即位于<head></head>标签对中的信息)中,包含在<meta/>标签内的信息就是元信息。元信息中的“content”属性中嵌入的“url”属性值“3g.sina.com.cn”,就是与web页面“www.sina.com.cn”对应的wap页面的地址。
元信息提取单元2011,在对网络中的web页面进行抓取时,可以通过如前面示意的web页面中的元信息,找到对应的wap页面地址,这样就得到了若干对应的页面地址对。例如上面的“www.sina.com.cn”和“3g.sina.com.cn”就构成了一个web页面和wap页面的地址对。
判断单元2012,用于判断所述对应的wap页面与所述web页面的内容是否匹配,如果是,则触发保存单元2013执行。保存单元2013,用于建立所述web页面与所述对应的wap页面之间的映射关系。
判断单元2012可针对每个抓取到的地址对,验证这个地址对对应的两个页面,即一个web页面和一个wap页面的内容是否匹配,如果是,则可以将这两个地址对保留到数据表中,建立这两个地址对之间的关联关系,这样,在这个web页面和这个wap页面之间就形成了映射关系。例如数据表中保存的映射关系如下表所示:
Web页面地址 Wap页面地址
www.sina.com.cn 3g.sina.com.cn
www.baidu.com wap.baidu.com
www.163.com wap.163.com
…… ……
具体地,判断单元2012包括特征提取单元2012a和计算单元2012b。其中特征提取单元2012a,用于提取所述对应的wap页面的文本特征向量以及所述web页面的文本特征向量。计算单元2012b,用于计算所述对应的wap页面的文本特征向量与所述web页面的文本特征向量之间的余弦相似度,并在所述余弦相似度大于设定值时,确定所述对应的wap页面与所述web页面的内容匹配。
Web页面与对应的wap页面中包含大量的文本内容,特征提取单元2012a首先对web页面和对应的wap页面进行预处理,将这两个页面的文本进行分词,并将其中的停用词过滤掉,这里可以通过现有的停用词表对这两个页面的文本中的停用词进行过滤。
对这两个文本进行预处理后,特征提取单元2012a分别统计这两个文本中每个词的词频(即每个词在该文本中出现的次数)作为这个词的权重。
例如上述地址为“www.sina.com.cn”的web页面中,词频排名前三位的词分别是“新闻”(30)、“分类”(20)、“门户”(15),其中括号内的数字表示该词的权重,地址为“3g.sina.com.cn”的wap页面中,词频排名前三名的词分别是“新闻”(25)、“门户”(18)、“手机”(10)。
进一步,特征提取单元2012a还需要使用每个词的逆文档频率对这个词的权重进行调整,词的逆文档频率越高表示这个词作为特征词的效果越好,也就是说,如果一个词语的逆文档频率高,则对这个词语的权重进行加权,如果一个词语的逆文档频率低,则对这个词语的权重进行降权。一个词语的逆文档频率可以采用现有技术中的方法统计得到。
在得到web页面的各个词语的权重和wap页面的各个词语的权重后,特征提取单元2012a可以将这两个页面中的若干个权重最高的词提取出来构成这两个页面的文本特征向量。
例如web页面的文本特征向量为[20,14,10](分别代表的词语是“新闻”、“财经”、“娱乐”),wap页面的文本特征向量为[15,13,8](分别代表的词语是“新闻”、“财经”、“体育”)。
计算单元2012b为了计算两个向量之间的余弦相似度,将web页面的文本特征向量[20,14,10]变为[20,14,10,0](分别代表“新闻”、“财经”、“娱乐”和“体育”),wap页面的文本特征向量[15,13,8]变为[15,13,0,8](分别代表“新闻”、“财经”、“娱乐”和体育”),然后采用余弦距离的计算公式计算这两个向量之间的余弦相似度如下:
sim = 20 * 15 + 14 * 13 + 10 * 0 + 0 * 8 20 2 + 15 2 + 14 2 + 0 2 * 15 2 + 13 2 + 0 2 + 8 2 = 0.83
假设设定值为0.8,由于余弦相似度大于设定值,则计算单元2012b可以确定“www.sina.com.cn”的web页面与“3g.sina.com.cn”的wap页面内容匹配。因此,保存单元2013就可以将这两个地址放入到数据表中,从而建立“www.sina.com.cn”的web页面与“3g.sina.com.cn”的wap页面之间的映射关系。
以上对预处理单元201的具体实现进行了介绍。
请继续参考图3。接收单元202、检索单元203、转换单元204及发送单元205均在线上执行。
接收单元202,用于获取用户搜索请求。该搜索请求中包含用户用于搜索时使用的关键词,此外,还包含其他一些信息,例如,用户的终端是移动终端时,请求中还可包含地理位置标识信息。
检索单元203,用于获取与用户搜索请求中的关键词匹配的检索结果项。这通过在现有的索引库查找到与用户请求中的关键词匹配的检索结果项即可实现。
转换单元204,用于根据用户搜索请求确定用户的终端是否为移动终端,如果是,则将检索结果项中与预处理单元201得到的映射关系中的记录匹配的web页面项转换为wap页面项。发送单元205,用于将转换后的检索结果项返回给用户。其中,转换单元204通过确定用户请求中是否存在地理位置标识信息来确定用户的终端是否是移动终端。
例如用户使用的终端为移动终端,且搜索使用的关键词是“肖申克的救赎豆瓣电影”,检索单元203根据现有的索引库查找到匹配的检索结果项包括“http://movie.douban.com/subject/1292052/”,这个结果项是web页面的地址,而在映射关系中正好存在一条记录如下:
则转换单元204会把检索结果项中的“http://movie.douban.com/subject/1292052/”这个web页面项转换为“http://m.douban.com/movie/subject/1292052/”这个wap页面项,并由发送单元205将转换后的各个检索结果项返回给用户。其中,这些检索结果项中在映射关系中无法找到匹配项的,就按照原样返回给用户即可。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (10)

1.一种与移动终端相适应的搜索方法,包括:
预先建立web页面与wap页面之间的映射关系;
获取用户搜索请求;
获取与所述请求中的关键词匹配的检索结果项,并根据所述请求确定所述用户的终端是否为移动终端,如果是,则将所述检索结果项中与所述映射关系中的记录匹配的web页面项转换为wap页面项;
将转换后的检索结果项返回给用户。
2.根据权利要求1所述的方法,其特征在于,建立web页面与wap页面之间的映射关系的步骤包括:
提取网络中的web页面的元信息,所述元信息中记录了所述web页面对应的wap页面;
判断所述对应的wap页面与所述web页面的内容是否匹配,如果是,则建立所述web页面与所述对应的wap页面之间的映射关系。
3.根据权利要求2所述的方法,其特征在于,判断所述对应的wap页面与所述web页面的内容是否匹配的步骤包括:
提取所述对应的wap页面的文本特征向量以及所述web页面的文本特征向量;
计算所述对应的wap页面的文本特征向量与所述web页面的文本特征向量之间的余弦相似度,并在所述余弦相似度大于设定值时,确定所述对应的wap页面与所述web页面匹配的内容匹配。
4.根据权利要求3所述的方法,其特征在于,影响所述wap页面的文本特征向量的因素包括所述wap页面中词语的词频和逆文档频率,以及,影响所述web页面的文本特征向量的因素包括所述web页面中词语的词频和逆文档频率。
5.根据权利要求1所述的方法,其特征在于,根据所述请求确定所述用户的终端是否为移动终端的步骤包括:
确定所述请求中是否存在地理位置标识信息,如果是,则确定所述用户的终端为移动终端。
6.一种与移动终端相适应的搜索装置,包括:
预处理单元,用于建立web页面与wap页面之间的映射关系;
接收单元,用于获取用户搜索请求;
检索单元,用于获取与所述请求中的关键词匹配的检索结果项;
转换单元,用于根据所述请求确定所述用户的终端是否为移动终端,如果是,则将所述检索结果项中与所述映射关系中的记录匹配的web页面项转换为wap页面项;
发送单元,用于将转换后的检索结果项返回给用户。
7.根据权利要求6所述的装置,其特征在于,所述预处理单元包括:
元信息提取单元,用于提取网络中的web页面的元信息,所述元信息中记录了所述web页面对应的wap页面;
判断单元,用于判断所述对应的wap页面与所述web页面的内容是否匹配,如果是,则触发保存单元执行;
保存单元,用于建立所述web页面与所述对应的wap页面之间的映射关系。
8.根据权利要求7所述的装置,其特征在于,所述判断单元包括:
特征提取单元,用于提取所述对应的wap页面的文本特征向量以及所述web页面的文本特征向量;
计算单元,用于计算所述对应的wap页面的文本特征向量与所述web页面的文本特征向量之间的余弦相似度,并在所述余弦相似度大于设定值时,确定所述对应的wap页面与所述web页面的内容匹配。
9.根据权利要求8所述的装置,其特征在于,影响所述wap页面的文本特征向量的因素包括所述wap页面中词语的词频和逆文档频率,以及,影响所述web页面的文本特征向量的因素包括所述web页面中词语的词频和逆文档频率。
10.根据权利要求6所述的装置,其特征在于,所述转换单元根据所述请求确定所述用户的终端是否为移动终端的方式包括:
确定所述请求中是否存在地理位置标识信息,如果是,则确定所述用户的终端为移动终端。
CN201210520964.XA 2012-12-06 2012-12-06 一种与移动终端相适应的搜索方法及装置 Active CN103020208B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210520964.XA CN103020208B (zh) 2012-12-06 2012-12-06 一种与移动终端相适应的搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210520964.XA CN103020208B (zh) 2012-12-06 2012-12-06 一种与移动终端相适应的搜索方法及装置

Publications (2)

Publication Number Publication Date
CN103020208A true CN103020208A (zh) 2013-04-03
CN103020208B CN103020208B (zh) 2019-04-26

Family

ID=47968812

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210520964.XA Active CN103020208B (zh) 2012-12-06 2012-12-06 一种与移动终端相适应的搜索方法及装置

Country Status (1)

Country Link
CN (1) CN103020208B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324695A (zh) * 2013-06-05 2013-09-25 百度在线网络技术(北京)有限公司 一种wap网页索引库的建立方法与装置
CN103488922A (zh) * 2013-08-27 2014-01-01 百度在线网络技术(北京)有限公司 一种用于提供验证码的方法与设备
CN104239432A (zh) * 2014-08-27 2014-12-24 百度在线网络技术(北京)有限公司 一种识别响应式页面的方法与装置
WO2015196906A1 (zh) * 2014-06-24 2015-12-30 北京奇虎科技有限公司 一种基于搜索获取疾病咨询信息的方法和装置
CN107169131A (zh) * 2017-06-08 2017-09-15 广州优视网络科技有限公司 一种视频搜索方法、装置及服务器
CN110968598A (zh) * 2018-09-29 2020-04-07 北京京东尚科信息技术有限公司 数据请求管理方法、系统及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1901476A (zh) * 2006-07-12 2007-01-24 中国移动通信集团公司 网络日志信息处理设备及处理方法
CN101437039A (zh) * 2007-11-15 2009-05-20 华为技术有限公司 一种移动搜索的方法、系统和设备
US20090198653A1 (en) * 2008-02-04 2009-08-06 Ryan Christianson System And Method For Device Profiling Using Cascaded Databases
CN101996184A (zh) * 2009-08-13 2011-03-30 上海杉达学院 建立供移动终端访问的移动网站的方法
US20120023229A1 (en) * 2008-04-11 2012-01-26 Morris Lee Methods and apparatus for nonintrusive monitoring of web browser usage
CN102456020A (zh) * 2010-10-22 2012-05-16 腾讯科技(深圳)有限公司 一种用于移动终端的搜索方法及搜索装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1901476A (zh) * 2006-07-12 2007-01-24 中国移动通信集团公司 网络日志信息处理设备及处理方法
CN101437039A (zh) * 2007-11-15 2009-05-20 华为技术有限公司 一种移动搜索的方法、系统和设备
US20090198653A1 (en) * 2008-02-04 2009-08-06 Ryan Christianson System And Method For Device Profiling Using Cascaded Databases
US20120023229A1 (en) * 2008-04-11 2012-01-26 Morris Lee Methods and apparatus for nonintrusive monitoring of web browser usage
CN101996184A (zh) * 2009-08-13 2011-03-30 上海杉达学院 建立供移动终端访问的移动网站的方法
CN102456020A (zh) * 2010-10-22 2012-05-16 腾讯科技(深圳)有限公司 一种用于移动终端的搜索方法及搜索装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324695A (zh) * 2013-06-05 2013-09-25 百度在线网络技术(北京)有限公司 一种wap网页索引库的建立方法与装置
CN103324695B (zh) * 2013-06-05 2016-06-08 百度在线网络技术(北京)有限公司 一种wap网页索引库的建立方法与装置
CN103488922A (zh) * 2013-08-27 2014-01-01 百度在线网络技术(北京)有限公司 一种用于提供验证码的方法与设备
CN103488922B (zh) * 2013-08-27 2017-06-23 百度在线网络技术(北京)有限公司 一种用于提供验证码的方法与设备
WO2015196906A1 (zh) * 2014-06-24 2015-12-30 北京奇虎科技有限公司 一种基于搜索获取疾病咨询信息的方法和装置
CN104239432A (zh) * 2014-08-27 2014-12-24 百度在线网络技术(北京)有限公司 一种识别响应式页面的方法与装置
CN107169131A (zh) * 2017-06-08 2017-09-15 广州优视网络科技有限公司 一种视频搜索方法、装置及服务器
CN110968598A (zh) * 2018-09-29 2020-04-07 北京京东尚科信息技术有限公司 数据请求管理方法、系统及装置

Also Published As

Publication number Publication date
CN103020208B (zh) 2019-04-26

Similar Documents

Publication Publication Date Title
CN109783651B (zh) 提取实体相关信息的方法、装置、电子设备和存储介质
JP6161679B2 (ja) 検索エンジン及びその実現方法
CN106202394B (zh) 文本资讯的推荐方法及系统
US9448999B2 (en) Method and device to detect similar documents
CN103020208A (zh) 一种与移动终端相适应的搜索方法及装置
CN103744856B (zh) 联动性扩展搜索方法及装置、系统
CN101788988B (zh) 信息抓取方法
US20140298445A1 (en) Method and Apparatus for Filtering URL
CN105677787B (zh) 信息搜索装置及信息搜索方法
CN103617266A (zh) 个性化扩展搜索方法及装置、系统
CN103246746A (zh) 一种信息搜索方法、装置和系统
CN103838732A (zh) 一种生活服务领域垂直搜索引擎
CN103186574A (zh) 一种搜索结果的生成方法和装置
CN103455524A (zh) 展现和获取词条信息的方法和装置
CN106663100B (zh) 多域查询补全
US20160306887A1 (en) Methods, apparatuses and systems for linked and personalized extended search
WO2013063940A1 (zh) 历史记录的整理方法和装置
KR20130059738A (ko) 컨텐츠 분석에 따른 어플리케이션 추천 시스템 및 방법
WO2014067471A1 (zh) 一种用于在移动终端上提供搜索结果的方法和设备
CN106779946A (zh) 一种电影推荐方法及装置
CN104503988A (zh) 搜索方法及装置
CN101959178A (zh) 一种用于识别无线终端的终端属性的方法与设备
WO2012062107A1 (zh) 基于手机用户上网行为的数据处理方法及装置
CN103257975A (zh) 一种搜索方法、装置及系统
CN106202312A (zh) 一种用于移动互联网的兴趣点搜索方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant