CN105740255A - 网络搜索方法及装置 - Google Patents

网络搜索方法及装置 Download PDF

Info

Publication number
CN105740255A
CN105740255A CN201410749383.2A CN201410749383A CN105740255A CN 105740255 A CN105740255 A CN 105740255A CN 201410749383 A CN201410749383 A CN 201410749383A CN 105740255 A CN105740255 A CN 105740255A
Authority
CN
China
Prior art keywords
search
retrieval string
query
search results
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410749383.2A
Other languages
English (en)
Other versions
CN105740255B (zh
Inventor
卓居超
黄泽谦
李明致
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tencent Computer Systems Co Ltd
Original Assignee
Shenzhen Tencent Computer Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tencent Computer Systems Co Ltd filed Critical Shenzhen Tencent Computer Systems Co Ltd
Priority to CN201410749383.2A priority Critical patent/CN105740255B/zh
Publication of CN105740255A publication Critical patent/CN105740255A/zh
Application granted granted Critical
Publication of CN105740255B publication Critical patent/CN105740255B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种网络搜索方法,包括:接收网络搜索请求,所述搜索请求中包括检索串;查找预先计算的类型库,获得类型库中与所述检索串匹配的检索串类型;根据所述检索串进行搜索,获得与所述检索串匹配的搜索结果及搜索结果的搜索参数;根据所述检索串类型对应的搜索参数权重,对搜索结果的搜索参数进行加权计算,获得搜索结果的排序值,并根据搜索结果的排序值对搜索结果进行排序。本发明还公开一种网络搜索装置。本发明相对于现有技术,提高了网络搜索的效率。

Description

网络搜索方法及装置
技术领域
本发明涉及网络技术领域,尤其涉及网络搜索方法及装置。
背景技术
随着互联网的快速发展,人们可以快速地浏览互联网上的信息。尤其是搜索引擎的发展,只要人们在搜索引擎的搜索框中输入检索串后,搜索引擎就可以根据检索词搜索互联网上与检索词匹配的页面,供用户访问,极大地方便了用户的信息获取。
用户在使用搜索功能时,输入的检索串需要精确寻找具体的某个信息或者模糊偏向寻找具有某种属性的信息,例如“好玩的游戏”。为了更好地满足用户的搜索需求,现有技术中都是通过运营人员人工建立关键词表用于模糊类型查询判断,当用户输入的检索串在运营人员建立的关键词表中,则返回预先设定与该关键词匹配的信息。如此不但无法保证关键词表中关键词覆盖全面,而且返回的搜索结果依赖预先设定的信息,在网络信息频繁更新时无法及时响应。
综上,现有技术中的网络搜索方法无法满足用户的搜索需求,搜索效率不高。
发明内容
本发明实施例的主要目的在于提供一种网络搜索方法和装置,旨在解决现有技术中网络搜索的搜索效率无法满足用户的搜索需求,搜索效率不高的技术问题。
为实现上述目的,本发明实施例提供了一种网络搜索方法,包括:
接收网络搜索请求,所述搜索请求中包括检索串;
查找预先计算的类型库,获得类型库中与所述检索串匹配的检索串类型;
根据所述检索串进行搜索,获得与所述检索串匹配的搜索结果及搜索结果的搜索参数;
根据所述检索串类型对应的搜索参数权重,对搜索结果的搜索参数进行加权计算,获得搜索结果的排序值,并根据搜索结果的排序值对搜索结果进行排序。
此外,为实现上述目的,本发明实施例还提供了一种网络搜索装置,包括:
请求接收模块,用于接收网络搜索请求,所述搜索请求中包括检索串;
类型确定模块,用于查找预先计算的类型库,获得类型库中与所述检索串匹配的检索串类型;
搜索模块,用于根据所述检索串进行搜索,获得与所述检索串匹配的搜索结果及搜索结果的搜索参数;
排序模块,用于根据所述检索串类型对应的搜索参数权重,对搜索结果的搜索参数进行加权计算,获得搜索结果的排序值,并根据搜索结果的排序值对搜索结果进行排序。
本发明实施例通过对检索串的类型确定,并根据检索串类型对应的权重计算检索串的排序值,并根据该排序值对检索串的搜索结果进行排序,从而使得用户可以快速找到符合要求的搜索结果,提高网络搜索的效率。
附图说明
图1为本发明网络搜索中终端与服务器的交互示意图;
图2为本发明网络搜索的搜索服务器的硬件架构示意图;
图3为本发明网络搜索装置的功能模块示意图;
图4为本发明网络搜索方法中终端发起搜索请求时,服务器的网络搜索装置根据搜索请求返回搜索结果的流程示意图;
图5为本发明网络搜索方法中以检索串“天天跑酷”及“休闲游戏”为例进行搜索的搜索结果意图;
图6为本发明网络搜索方法的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
以下结合说明书附图及具体实施例进一步说明本发明的技术方案。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明的核心思想是:预先对用户的搜索点击数据进行统计,获得用户进行搜索点击的搜索词的类型,生成类型库。在接收到用户输入的搜索词时,将用户输入的搜索词与类型库中的搜索词进行匹配,确定该搜索词的类型。同时,根据搜索词,搜索与该搜索词匹配的信息及该信息的参数。然后,根据搜索词的类型,获取搜索词的类型对应的权重值,并根据该权重值对所搜索到的信息的参数进行加权计算,获得该信息的排序值。最后,根据所述排序值,将所搜索到的信息返回至用户端进行显示。
如图1所示,终端100与服务器200进行网络通讯,其中终端100可包括PC、手机、ipad、平板电脑、掌上电脑等等。该终端100具有网络通讯功能,例如无线通讯或有线通讯,以便终端100访问服务器200。该终端100上还安装有各种应用程序,该应用程序提供了供用户交互的交互界面,也提供了利用网络通讯功能与服务器200进行通讯的功能。以浏览器客户端的网络搜索为例,该浏览器将提供用户交互界面,用户在该交互界面上输入需要检索的词,浏览器客户端则将用户输入的检索词发送至服务器200,以使服务器200搜索与该检索词匹配的网络信息,并按一定的顺序排序后,返回搜索结果。浏览器客户端接收到该搜索结果后,在交互界面上显示,以供用户浏览。
为了使得服务器200提供的搜索结果更符合用户的需求,本发明将预先建立一类型库,该类型库中包括搜索词及搜索词的类型。根据该搜索词的类型,可以识别用户所输入的检索词的类型,然后根据检索词类型,动态调整各搜索结果的排序,使用户能快速找到想要的应用之余,还能看到更多自己可能感兴趣的应用,提高网络搜索的效率。
如图2所示,示出了本发明服务器的硬件结构。该服务器200可包括:处理器201、存储器202、通讯模块203以及通信总线205。其中通信总线205用于该电子设备中各组成部件之间的通信。通讯模块203用于实现服务器200与外部设备进行互相通讯,例如根据用户的网络搜索请求,搜索网络信息等等。该通讯模块203可包括RS232模块、射频模块、WIFI模块等等。存储器202可以包括一个或一个以上计算机可读存储介质,而且其不但包括内部存储器,还包括外部存储器。该存储器202中存储有操作系统、类型库及网络搜索装置等等。处理器201调用存储器202中的网络搜索装置及其他组件,以实现根据用户的搜索请求,返回更符合用户需求的搜索结果,提高搜索效率。
可以理解的是,上述类型库可以存储服务器200中并由网络搜索装置中的类型库计算模块预先计算,当然还可以独立存在,例如数据库服务器。而且该类型库的建立可以离线完成。该类型库的具体建立过程如下:
(1)获取用户搜索点击数据。用户每次在搜索引擎界面中的点击数据都将会自动存储至搜索引擎的后台数据库中,形成用户点击日志。本实施例中,将周期性地获取该用户点击日志,例如一个月一次。然后,获取用户点击日志中用户所点击的检索词。
(2)统计用户所点击的检索词在周期时间内的搜索信息。针对所获取用户搜索点击数据中用户点击的所有检索词,统计其在该周期内的被搜索次数、被下载次数、被访问次数、每个搜索结果的下载次数及访问次数,然后根据该统计的各参数,计算该检索词对应的搜索结果的下载比例或访问比例。具体如下:
P [ query ] [ app ] = C [ query ] [ app ] Σ app 1 app n C [ query ] [ app ]
其中,P[query][app]为检索词query对应的应用app的下载比例,C[query][app]为检索词query对应的应用app的下载次数,为检索词query对应的所有应用app的下载次数之和。
V [ query ] [ inf ] = N [ query ] [ inf ] Σ app 1 app n N [ query ] [ inf ]
其中,P[query][app]为检索词query对应的搜索页面inf的访问比例,C[query][app]为检索词query对应的搜索页面inf的访问次数,为检索词query对应的所有搜索页面inf的访问次数之和。
(3)根据检索词对应的搜索结果的下载比例或访问比例,计算检索词的分散程度。具体根据如下公式计算:
Entropy query = - Σ opp _ 1 opp _ n p [ query ] [ app ] * log ( 2 , P [ query ] [ app ] )
其中,该Entropyquery为该检索词以应用app的下载比例所计算的分散程度。
Entropy query = - Σ inf _ 1 inf _ n V [ query ] [ inf ] * log ( 2 , V [ query ] [ inf ] )
其中,该Entropyquery为该检索词以检索页面info的下载比例所计算的分散程度。
上述Entropyquery越大,检索词query的点击分散程度越高,该检索词query为模糊型;上述Entropyquery越小,检索词query的点击分散程度越低,该检索词query为精准型。本实施例中,将预设一阈值,当所计算的分散程度大于该预设阈值时,该检索串的类型为模糊型;当所计算的分散程度小于或等于该预设阈值时,该检索串的类型为精准型。
基于上述建立的类型库,本发明提供了一种网络搜索装置。如图3所示,该网络搜索装置包括:
请求接收模块110,用于接收用户发出的搜索请求,所述搜索请求中包括检索串;
类型确定模块120,用于查找类型库,获得类型库中与所述检索串匹配的检索串类型;
搜索模块130,用于根据所述检索串进行搜索,获得与所述检索串匹配的搜索结果及搜索结果的搜索参数;
排序模块140,用于根据所述检索串类型对应的搜索参数权重,对搜索结果的搜索参数进行加权计算,获得搜索结果的排序值,并根据搜索结果的排序值对搜索结果进行排序。
如图4所示,用户打开搜索引擎页面。然后,用户在页面的搜索框中输入相应的检索词,并触发“搜索”控件。此时终端将侦测到搜索引擎页面的搜索操作,并获取该搜索引擎页面的搜索框中的检索串,生成携带有该检索串的网络搜索请求。终端将该生成的网络搜索请求发送至搜索服务器。搜索服务器访问类型库,查找类型库中是否存在与该检索词匹配的检索词,存在则获取该检索词对应的类型,不存在则可根据具体情况而设置该检索词的类型为精准型或者模糊型。同时,该搜索模块将根据检索串进行网络搜索,获得与该检索串匹配的搜索结果及搜索结果的搜索参数。该搜索参数可包括文本相关度、下载次数、访问次数等等。本实施例中,将预先设置检索串类型对应的搜索权重值。例如,精准型检索串更偏重文本相关度,模糊型检索串可适当轻文本相关度而更偏重下载量及下载比例。即计算检索串的排序值时,精准型检索串对应的文本相关度的权重较高,模糊型检索串对应的下载量及下载比例的权重较高。
本发明实施例通过对检索串的类型确定,并根据检索串类型对应的权重计算检索串的排序值,并根据该排序值对检索串的搜索结果进行排序,从而使得用户可以快速找到符合要求的搜索结果,提高网络搜索的效率。
以搜索应用为例,用户所发出的检索串分别为“天天酷跑”以及“休闲游戏”,搜索服务器接收到该用户发出的搜索请求后,查找类型库后可知检索串“天天酷跑”的类型为精准类型,检索串“休闲游戏”的类型为模糊类型。然后搜索服务器根据检索串类型对应的权重对搜索结果中的各搜索参数进行加权计算后,根据计算结果对搜索结果进行排序,其中排序的结果如图5所示。
对应地,本发明还提供了一种网络搜索方法。如图6所示,网络搜索方法包括以下步骤:
步骤S110、接收用户发出的网络搜索请求,所述搜索请求中包括检索串;
如图4所示,用户打开搜索引擎页面。然后,用户在页面的搜索框中输入相应的检索词,并触发“搜索”控件。此时终端将侦测到搜索引擎页面的搜索操作,并获取该搜索引擎页面的搜索框中的检索串,生成携带有该检索串的网络搜索请求。终端将该生成的网络搜索请求发送至搜索服务器。
步骤S120、查找类型库,获得类型库中与所述检索串匹配的检索串类型;
搜索服务器访问类型库,查找类型库中是否存在与该检索词匹配的检索词,存在则获取该检索词对应的类型,不存在则可根据具体情况而设置该检索词的类型为精准型或者模糊型。
步骤S130、根据所述检索串进行搜索,获得与所述检索串匹配的搜索结果及搜索结果的搜索参数;
该搜索模块将根据检索串进行网络搜索,获得与该检索串匹配的搜索结果及搜索结果的搜索参数。该搜索参数可包括文本相关度、下载次数、访问次数等等。
步骤S140、根据所述检索串类型对应的搜索参数权重值,对搜索结果的搜索参数进行加权计算,获得搜索结果的排序值,并根据搜索结果的排序值对搜索结果进行排序。
本实施例中,将预先设置检索串类型对应的搜索权重值。例如,精准型检索串更偏重文本相关度,模糊型检索串可适当轻文本相关度而更偏重下载量及下载比例。即计算检索串的排序值时,精准型检索串对应的文本相关度的权重较高,模糊型检索串对应的下载量及下载比例的权重较高。
本发明实施例通过对检索串的类型确定,并根据检索串类型对应的权重计算检索串的排序值,并根据该排序值对检索串的搜索结果进行排序,从而使得用户可以快速找到符合要求的搜索结果,提高网络搜索的效率。
以上所述仅为本发明的优选实施例,并非因此限制其专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种网络搜索方法,其特征在于,所述网络搜索方法包括以下步骤:
接收网络搜索请求,所述搜索请求中包括检索串;
查找预先计算的类型库,获得类型库中与所述检索串匹配的检索串类型;
根据所述检索串进行搜索,获得与所述检索串匹配的搜索结果及搜索结果的搜索参数;
根据所述检索串类型对应的搜索参数权重,对搜索结果的搜索参数进行加权计算,获得搜索结果的排序值,并根据搜索结果的排序值对搜索结果进行排序。
2.如权利要求1所述的网络搜索方法,其特征在于,所述类型库的计算方法包括以下步骤:
获取预设周期内所记录的搜索点击数据,并统计所述搜索点击数据中的所有检索串;
统计每个检索串在周期内的搜索信息,并根据所述搜索信息计算检索串对应的搜索结果的下载比例或访问比例;
根据所述下载比例或访问比例,计算检索串的分散程度,以确定所述检索串的类型。
3.如权利要求2所述的网络搜索方法,其特征在于,所述搜索信息包括根据检索串所搜索的每个搜索结果的下载次数或访问次数,然后根据每个搜索结果的下载次数或访问次数,计算检索串对应的搜索结果的下载比例或访问比例。
4.如权利要求3所述的网络搜索方法,其特征在于,按照如下公式计算检索词的分散程度:
Entropy query = - Σ app _ 1 app _ n p [ query ] [ app ] * log ( 2 , P [ query ] [ app ] )
Entropy query = - Σ inf _ 1 inf _ n V [ query ] [ inf ] * log ( 2 , V [ query ] [ inf ] )
其中,P[query][app]为检索串query对应的应用app的下载比例,V[query][inf]为检索串query对应的搜索页面inf的访问比例。
5.如权利要求2所述的网络搜索方法,其特征在于,所述检索串类型包括模糊型及精准型,当检索串的分散程度大于预设阈值时,该检索串类型为模糊型,当检索串的分散程度小于或等于预设阈值时,该检索串类型为精准型。
6.一种网络搜索装置,其特征在于,所述网络搜索装置包括:
请求接收模块,用于接收网络搜索请求,所述搜索请求中包括检索串;
类型确定模块,用于查找预先计算的类型库,获得类型库中与所述检索串匹配的检索串类型;
搜索模块,用于根据所述检索串进行搜索,获得与所述检索串匹配的搜索结果及搜索结果的搜索参数;
排序模块,用于根据所述检索串类型对应的搜索参数权重,对搜索结果的搜索参数进行加权计算,获得搜索结果的排序值,并根据搜索结果的排序值对搜索结果进行排序。
7.如权利要求6所述的网络搜索装置,其特征在于,所述网络搜索装置还包括:类型库计算模块,其中所述类型库计算模块包括:
搜索点击数据获取单元,用于获取预设周期内所记录的搜索点击数据,并统计所述搜索点击数据中的所有检索串;
搜索信息统计单元,用于统计每个检索串在周期内的搜索信息,并根据所述搜索信息计算检索串对应的搜索结果的下载比例或访问比例;
分散程度计算单元,用于根据所述下载比例或访问比例,计算检索串的分散程度。
8.如权利要求7所述的网络搜索装置,其特征在于,所述搜索信息包括根据检索串所搜索的每个搜索结果的下载次数或访问次数,然后根据每个搜索结果的下载次数或访问次数,计算检索串对应的搜索结果的下载比例或访问比例。
9.如权利要求8所述的网络搜索装置,其特征在于,分散程度计算单元用于:按照如下公式计算检索词的分散程度:
Entropy query = - Σ app _ 1 app _ n p [ query ] [ app ] * log ( 2 , P [ query ] [ app ] )
Entropy query = - Σ inf _ 1 inf _ n V [ query ] [ inf ] * log ( 2 , V [ query ] [ inf ] )
其中,P[query][app]为检索串query对应的应用app的下载比例,V[query][inf]为检索串query对应的搜索页面inf的访问比例。
10.如权利要求7所述的网络搜索装置,其特征在于,所述检索串类型包括模糊型及精准型,当检索串的分散程度大于预设阈值时,该检索串类型为模糊型,当检索串的分散程度小于或等于预设阈值时,该检索串类型为精准型。
CN201410749383.2A 2014-12-09 2014-12-09 网络搜索方法及装置 Active CN105740255B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410749383.2A CN105740255B (zh) 2014-12-09 2014-12-09 网络搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410749383.2A CN105740255B (zh) 2014-12-09 2014-12-09 网络搜索方法及装置

Publications (2)

Publication Number Publication Date
CN105740255A true CN105740255A (zh) 2016-07-06
CN105740255B CN105740255B (zh) 2019-07-05

Family

ID=56239569

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410749383.2A Active CN105740255B (zh) 2014-12-09 2014-12-09 网络搜索方法及装置

Country Status (1)

Country Link
CN (1) CN105740255B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304457A (zh) * 2017-12-22 2018-07-20 努比亚技术有限公司 一种应用标注方法、服务器及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101887437A (zh) * 2009-05-12 2010-11-17 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
CN102364467A (zh) * 2011-09-29 2012-02-29 北京亿赞普网络技术有限公司 一种网络搜索方法和系统
CN103593373A (zh) * 2012-08-16 2014-02-19 北京百度网讯科技有限公司 一种用于搜索结果排序的方法与设备
CN103631793A (zh) * 2012-08-22 2014-03-12 百度在线网络技术(北京)有限公司 一种用于对搜索结果进行排序的方法、装置与设备
WO2014089776A1 (en) * 2012-12-12 2014-06-19 Google Inc. Ranking search results based on entity metrics

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101887437A (zh) * 2009-05-12 2010-11-17 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
CN102364467A (zh) * 2011-09-29 2012-02-29 北京亿赞普网络技术有限公司 一种网络搜索方法和系统
CN103593373A (zh) * 2012-08-16 2014-02-19 北京百度网讯科技有限公司 一种用于搜索结果排序的方法与设备
CN103631793A (zh) * 2012-08-22 2014-03-12 百度在线网络技术(北京)有限公司 一种用于对搜索结果进行排序的方法、装置与设备
WO2014089776A1 (en) * 2012-12-12 2014-06-19 Google Inc. Ranking search results based on entity metrics

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304457A (zh) * 2017-12-22 2018-07-20 努比亚技术有限公司 一种应用标注方法、服务器及计算机可读存储介质

Also Published As

Publication number Publication date
CN105740255B (zh) 2019-07-05

Similar Documents

Publication Publication Date Title
CN107609152B (zh) 用于扩展查询式的方法和装置
CN105426528B (zh) 一种商品数据的检索排序方法及系统
US8880512B2 (en) Method, apparatus and system, for rewriting search queries
CN108256067B (zh) 计算房源相似度的方法、装置、设备及存储介质
US10402479B2 (en) Method, server, browser, and system for recommending text information
CN102932206B (zh) 监测网站访问信息的方法和系统
CN104008109A (zh) 基于用户兴趣的Web信息推送服务系统
CN102750334A (zh) 一种基于dm的农业信息精准推送的方法
CN104899315A (zh) 推送用户信息的方法和装置
CN105677780A (zh) 可拓展的用户意图挖掘方法及其系统
CN103324645A (zh) 一种网页推荐方法和装置
CN103455524A (zh) 展现和获取词条信息的方法和装置
CN105721944A (zh) 智能电视的新闻资讯推荐方法
CN102663088A (zh) 一种用于提供搜索结果的方法与设备
CN102855261A (zh) 一种用于确定视频权威值的方法与设备
CN102364467A (zh) 一种网络搜索方法和系统
CN103812906B (zh) 一种网址推荐方法、装置和通信系统
CN105871585A (zh) 终端关联方法及装置
CN101957825A (zh) 基于网页中图像、视频内容的图像搜索方法
CN104281619A (zh) 搜索结果排序系统及方法
CN103365932A (zh) 一种网页搜索方法和装置
CN104063555B (zh) 面向遥感信息智能分发的用户模型建模方法
CN106021423B (zh) 基于群组划分的元搜索引擎个性化结果推荐方法
CN102207943A (zh) 基于标识信息匹配的搜索方法及搜索装置
CN112925878B (zh) 数据处理方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant