CN105159953B - 基于关键词的搜索方法及搜索平台 - Google Patents

基于关键词的搜索方法及搜索平台 Download PDF

Info

Publication number
CN105159953B
CN105159953B CN201510502635.6A CN201510502635A CN105159953B CN 105159953 B CN105159953 B CN 105159953B CN 201510502635 A CN201510502635 A CN 201510502635A CN 105159953 B CN105159953 B CN 105159953B
Authority
CN
China
Prior art keywords
webpage
user
terminal
sequencing
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510502635.6A
Other languages
English (en)
Other versions
CN105159953A (zh
Inventor
靳锐敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN201510502635.6A priority Critical patent/CN105159953B/zh
Publication of CN105159953A publication Critical patent/CN105159953A/zh
Application granted granted Critical
Publication of CN105159953B publication Critical patent/CN105159953B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种基于关键词的搜索方法及搜索平台,包括:接收终端检测到用户进行搜索操作时发送的包括所述用户输入的关键词的第一数据;接收终端发送的自检测到所述用户进行搜索操作的时刻起,被访问的预设数量的网页或者预设时长内被访问的网页的网页信息和访问时长;根据各网页的第二数据,获得访问的第一先后顺序,并根据所述第一先后顺序为各网页分配权重;按照所述第一先后顺序,对所述各网页进行排序,并针对排序后的每个网页,根据公式计算所述网页的匹配值;若接收到终端检测到所述用户基于所述关键词进行搜索操作时发送的搜索请求,则向终端返回匹配值最高的网页的网页信息。通过本发明的方案,能够实现快捷、精准地进行搜索,且实时性好。

Description

基于关键词的搜索方法及搜索平台
技术领域
本发明涉及通信领域,尤其涉及一种基于关键词的搜索方法及搜索平台。
背景技术
搜索是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供搜索服务,将与用户输入的关键词相关的信息展示给用户。
现有的基于关键词的搜索方案中,用户需要搜索时,首先需要通过终端的交互界面输入关键词,终端将关键词发送至搜索平台,搜索平台根据关键词获得与关键词匹配的搜索结果,并将搜索结果返回给终端,终端将其进一步推送给用户。
但是,现有方案中的搜索结果通常是搜索平台通过进行词条匹配获得的,例如,将包含有关键词的网页信息作为搜索结果推送给用户。而单凭词条匹配获得的搜索结果往往不是用户真正需要的信息,导致现有的搜索方案不准确。
发明内容
本发明提供一种基于关键词的搜索方法及搜索平台,用于解决现有的搜索方案不准确的问题。
本发明的第一个方面是提供一种基于关键词的搜索方法,包括:接收终端发送的第一数据,所述第一数据是所述终端检测到用户进行搜索操作时发送的,所述第一数据包括所述用户输入的关键词;接收所述终端发送的各网页的第二数据,所述各网页为自所述终端检测到所述用户进行搜索操作的时刻起,所述用户访问的预设数量的网页或者预设时长内所述用户访问的网页,所述网页的第二数据包括网页的网页信息和用户访问所述网页的访问时长;根据所述各网页的第二数据,获得所述用户访问所述各网页的第一先后顺序,并根据所述第一先后顺序为所述各网页分配权重,越先被访问的网页的权重越高;按照所述第一先后顺序,对所述各网页进行排序,并针对排序后的每个网页,根据第一公式计算所述网页的匹配值,所述第一公式为:
其中,Result为所述网页的匹配值,n为所述网页的排序名次,qn为所述网页的权重,α和β均为预设的调整因子,Tn为所述网页的访问时长;若接收到终端发送的第一搜索请求,则向所述终端返回所述用户对应的第一匹配网页的网页信息,所述第一搜索请求是所述终端检测到所述用户基于所述关键词进行搜索操作时发送的,所述第一匹配网页为所述各网页中匹配值最高的网页。
本发明的另一个方面是提供一种搜索平台,包括:接收模块,用于接收终端发送的第一数据,所述第一数据是所述终端检测到用户进行搜索操作时发送的,所述第一数据包括所述用户输入的关键词;所述接收模块,还用于接收所述终端发送的各网页的第二数据,所述各网页为自所述终端检测到所述用户进行搜索操作的时刻起,所述用户访问的预设数量的网页或者预设时长内所述用户访问的网页,所述网页的第二数据包括网页的网页信息和用户访问所述网页的访问时长;分配模块,用于根据所述各网页的第二数据,获得所述用户访问所述各网页的第一先后顺序,并根据所述第一先后顺序为所述各网页分配权重,越先被访问的网页的权重越高;处理模块,用于按照所述第一先后顺序,对所述各网页进行排序,并针对排序后的每个网页,根据第一公式计算所述网页的匹配值,所述第一公式为:
其中,Result为所述网页的匹配值,n为所述网页的排序名次,qn为所述网页的权重,α和β均为预设的调整因子,Tn为所述网页的访问时长;发送模块,用于若接收到终端发送的第一搜索请求,则向所述终端返回所述用户对应的第一匹配网页的网页信息,所述第一搜索请求是所述终端检测到所述用户基于所述关键词进行搜索操作时发送的,所述第一匹配网页为所述各网页中匹配值最高的网页。
本发明提供的基于关键词的搜索方法及搜索平台,终端在检测到用户进行搜索操作时,则将用户在此后一定时长内访问网页的相关数据发送给搜索平台,搜索平台根据终端上传的数据,计算用户在此期间访问的各网页的匹配值,并从中选取获得能够真实反映用户搜索需要的匹配网页,在后续用户再次基于相同的关键词进行搜索时,可以直接将该匹配网页推送给用户,实现结合用户的搜索需求向用户推送相应的匹配网页,从而实现快捷、精准地进行搜索。并且,基于本发明提供的方案,当用户基于关键词进行搜索时,则结合用户的真实需要,实时向用户推送相应的匹配网页,无需用户自己判断选择,搜索效率高,实时性好。
附图说明
图1为本发明实施例一提供的一种基于关键词的搜索方法的流程示意图;
图2A为本发明实施例一提供的另一种基于关键词的搜索方法的流程示意图;
图2B为本发明实施例一提供的又一种基于关键词的搜索方法的流程示意图;
图3为本发明实施例二提供的一种基于关键词的搜索方法的流程示意图;
图4为本发明实施例三提供的一种搜索平台的结构示意图;
图5为本发明实施例四提供的一种搜索平台的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
图1为本发明实施例一提供的一种基于关键词的搜索方法的流程示意图,如图1所示,所述方法包括:
101、接收终端发送的第一数据,所述第一数据是所述终端检测到用户进行搜索操作时发送的,所述第一数据包括所述用户输入的关键词。
其中,所述终端为能够接入网络的任意设备,例如,网管、机顶盒、手机、平板电脑、个人电脑等。具体的,本实施例的执行主体可以为搜索平台,该搜索平台可以实现对终端上传的上网数据进行汇总、统计与分析。
实际应用场景下,用户需要进行搜索时,会先通过终端的交互界面输入用于搜索的关键词,相应的,终端检测到用户进行搜索操作时,则获取用户输入的关键词,并发送给搜索平台,以执行后续方案。
具体的,101具体可以通过多种方式实现,例如,终端可以实时监测用户访问的网页的统一资源定位符(Uniform Resource Locator,简称URL),若用户访问的网页的URL为预先统计的搜索网站的URL之一,则可判定该用户正在进行搜索操作。
102、接收所述终端发送的各网页的第二数据,所述各网页为自所述终端检测到所述用户进行搜索操作的时刻起,所述用户访问的预设数量的网页或者预设时长内所述用户访问的网页,所述网页的第二数据包括网页的网页信息和用户访问所述网页的访问时长。
具体的,102的实现方式可以有多种,举例来说,所述终端可以为支持DPI的终端,或者可以预先在终端中安装DPI插件或客户端。
实际应用场景下,终端将用户输入的关键词发送给搜索平台之后,自当前时刻起的预设时长内,将用户访问的各网页的相关数据发送给搜索平台。或者,终端将用户输入的关键词发送给搜索平台之后,自当前时刻起将用户访问的预设数量的各网页的相关数据发送给搜索平台。进一步的,终端可以以DPI数据或DPI数据包的形式上传第二数据至搜索平台,以执行后续方案。
103、根据所述各网页的第二数据,获得所述用户访问所述各网页的第一先后顺序,并根据所述第一先后顺序为所述各网页分配权重,越先被访问的网页的权重越高。
可以理解,用户最先访问的网页应该是用户最感兴趣的网页,即更能反映出用户真实需要的信息,故对于越先被访问的网页,则为其分配越高的权重。
实际应用场景下,搜索平台接收到终端上传的第二数据后,根据第二数据分析出用户访问各网页的先后顺序,并根据该先后顺序为各网页分配相应的权重,以执行后续方案。具体的,越先被访问的网页,为其分配越高的权重。
可选的,为了获得用户访问各网页的先后顺序,作为一种可实施方式,如图2A所示,图2A为本发明实施例一提供的另一种基于关键词的搜索方法的流程示意图,在图1所示的基础上,102具体可以包括:
201、接收所述终端按照所述各网页被访问的先后顺序依次发送的所述各网页的第二数据;相应的,103中所述根据所述各网页的第二数据,获得所述用户访问所述各网页的第一先后顺序,具体可以包括:
202、根据接收到所述各网页的第二数据的第二先后顺序,分析获得所述第一先后顺序,所述第一先后顺序与所述第二先后顺序一致。
再可选的,为了获得用户访问各网页的先后顺序,作为另一种可实施方式,如图2B所示,图2B为本发明实施例一提供的又一种基于关键词的搜索方法的流程示意图,在图1所示的基础上,所述网页的第二数据还包括所述用户访问所述网页的访问时刻;相应的,103具体可以包括:
203、根据所述各网页的访问时刻,分析获得所述第一先后顺序。
通过上述两种实施方式,搜索平台可根据第二数据获得用户访问各网页的先后顺序,进而根据该先后顺序为各网页分配相应的权重。
104、按照所述第一先后顺序,对所述各网页进行排序,并针对排序后的每个网页,根据第一公式计算所述网页的匹配值。
具体的,所述第一公式为:
其中,Result为所述网页的匹配值,n为所述网页的排序名次,qn为所述网页的权重,α和β均为预设的调整因子,Tn为所述网页的访问时长。
举例来说,按照先后顺序为各网页进行排序,进而确定各网页的排序名次,例如,排在第一位的网页即用户最早访问的网页,其排序名次n为1,权重为q1,访问时长为T1;排在第二位的网页,其排序名次n为2,……,排在第n位的网页即用户最后访问的网页。实际应用场景下,为各网页分配权重后,针对每个网页,利用上述公式,计算获得各网页的匹配值,以执行后续方案。
可以理解,上述公式结合考虑了用户访问网页的先后顺序和具体用户访问各网页的访问时长,即用户在该网页上停留的时长,这些因素都能够反映出用户的真实需要,相应的,计算出的匹配值可以表征用户的真实需要度,即匹配值越高的网页越是用户真实需要的信息。
105、若接收到终端发送的第一搜索请求,则向所述终端返回所述用户对应的第一匹配网页的网页信息。
其中,所述第一搜索请求是所述终端检测到所述用户基于所述关键词进行搜索操作时发送的,所述第一匹配网页为所述各网页中匹配值最高的网页。
实际应用场景下,在计算出各网页的匹配值后,将匹配值最高的网页作为用户在基于所述关键词进行搜索时最需要获取的信息,故搜索平台接收到用户基于相同的关键词进行搜索的请求时,可以将最能够反映用户真实需要的网页,即匹配值最高的网页,的网页信息推送给用户。
本实施例提供的基于关键词的搜索方法中,终端在检测到用户进行搜索操作时,则将用户在此后一定时长内访问网页的相关数据发送给搜索平台,搜索平台根据终端上传的数据,计算用户在此期间访问的各网页的匹配值,并从中选取获得能够真实反映用户搜索需要的匹配网页,在后续用户再次基于相同的关键词进行搜索时,可以直接将该匹配网页推送给用户,实现结合用户的搜索需求向用户推送相应的匹配网页,从而实现快捷、精准地进行搜索。并且,当用户基于关键词进行搜索时,则结合用户的真实需要,实时向用户推送相应的匹配网页,无需用户自己判断选择,搜索效率高,实时性好。
图3为本发明实施例二提供的一种基于关键词的搜索方法的流程示意图,如图3所示,在实施例一的基础上,所述方法还包括:
301、统计获得网页集合,所述网页集合包括各用户对应的第一匹配网页;
302、从所述网页集合中选取第二匹配网页;
303、若接收到终端发送的第二搜索请求,则向所述终端返回所述第二匹配网页,所述第二搜索请求是所述终端检测到任一用户基于所述关键词进行搜索操作时发送的。
具体的,基于实施例一的方案,可以针对不同的用户需求,基于用户输入的关键词,向用户推送相应的网页信息。可以理解,即便关键词相同,但是对于不同用户来说,与其对应的第一匹配网页可能不同。但当用户的数量较多时,为每个用户建立相应的第一匹配网页可能需要占用相当多的存储资源和处理资源。
优选的,在本实施例中,统计获得各用户对应的第一匹配网页,并从中选取基于所述关键词搜索的,且能够反映普遍用户真实需要的第二匹配网页,当任一用户基于相同的关键词进行搜索时,可以直接将第二匹配网页推送给用户。
可选的,302可以通过多种实施方式实现。
例如,可以基于网页集合中每个网页的出现次数确定第二匹配网页,具体的,出现次数越多,表明越多的用户关注该网页,也即更能反映普遍用户的真实需要。相应的,302具体可以包括:
将所述网页集合中出现次数最高的网页,作为所述第二匹配网页。
再例如,还可以将网页集合中的各网页,进行加权计算,然后按照加权计算后的计算结果,获得所述第二匹配网页。具体的,计算结果越高的网页越能反映普遍用户的需求。相应的,302具体可以包括:
根据预设的加权值,对所述网页集合中的各网页的匹配值进行加权计算,将计算结果值最高的网页作为所述第二匹配网页。
本实施例提供的基于关键词的搜索方法,在获得各用户对应的匹配网页后,从中选取能够反映普遍用户真实需要的网页,从而在后续任一用户基于相同的关键词进行搜索时,可以直接将该网页推送给用户,在快捷、精准得向用户推送其真实需要的信息的同时,有效节约存储和处理资源。
图4为本发明实施例三提供的一种搜索平台的结构示意图,如图4所示,所述搜索平台包括:
接收模块41,用于接收终端发送的第一数据,所述第一数据是所述终端检测到用户进行搜索操作时发送的,所述第一数据包括所述用户输入的关键词;
接收模块41,还用于接收所述终端发送的各网页的第二数据,所述各网页为自所述终端检测到所述用户进行搜索操作的时刻起,所述用户访问的预设数量的网页或者预设时长内所述用户访问的网页,所述网页的第二数据包括网页的网页信息和用户访问所述网页的访问时长;
分配模块42,用于根据所述各网页的第二数据,获得所述用户访问所述各网页的第一先后顺序,并根据所述第一先后顺序为所述各网页分配权重,越先被访问的网页的权重越高;
处理模块43,用于按照所述第一先后顺序,对所述各网页进行排序,并针对排序后的每个网页,根据第一公式计算所述网页的匹配值,所述第一公式为:
其中,Result为所述网页的匹配值,n为所述网页的排序名次,qn为所述网页的权重,α和β均为预设的调整因子,Tn为所述网页的访问时长;
发送模块44,用于若接收到终端发送的第一搜索请求,则向所述终端返回所述用户对应的第一匹配网页的网页信息,所述第一搜索请求是所述终端检测到所述用户基于所述关键词进行搜索操作时发送的,所述第一匹配网页为所述各网页中匹配值最高的网页。
其中,所述终端为能够接入网络的任意设备,例如,网管、机顶盒、手机、平板电脑、个人电脑等。具体的,本实施例的执行主体可以为搜索平台,该搜索平台可以实现对终端上传的上网数据进行汇总、统计与分析。
实际应用场景下,用户需要进行搜索时,会先通过终端的交互界面输入用于搜索的关键词,相应的,终端检测到用户进行搜索操作时,则获取用户输入的关键词,并发送给搜索平台,之后,终端自当前时刻起的预设时长内,将用户访问的各网页的相关数据发送给搜索平台,或者,终端将用户输入的关键词发送给搜索平台之后,自当前时刻起将用户访问的预设数量的各网页的相关数据发送给搜索平台,搜索平台接收到第二数据后,分析出用户访问各网页的先后顺序,并根据该先后顺序为各网页分配相应的权重,并针对每个网页,利用第一公式计算获得各网页的匹配值,将匹配值最高的网页作为用户在基于所述关键词进行搜索时最需要获取的信息,即所述用户对应的第一匹配网页,相应的,后续搜索平台接收到该用户基于相同的关键词进行搜索的请求时,可以将第一匹配网页的信息推送给用户。
进一步的,终端可以以DPI数据或DPI数据包的形式上传第二数据至搜索平台。相应的,终端可以为支持DPI的终端,或者可以预先在终端中安装DPI插件或客户端。
具体的,终端检测用户是否进行搜索操作具体可以通过多种方式实现,例如,终端可以实时监测用户访问的网页的统一资源定位符(Uniform Resource Locator,简称URL),若用户访问的网页的URL为预先统计的搜索网站的URL之一,则可判定该用户正在进行搜索操作。
可以理解,用户最先访问的网页应该是用户最感兴趣的网页,即更能反映出用户真实需要的信息,故对于越先被访问的网页,则为其分配越高的权重。
可选的,为了获得用户访问各网页的先后顺序,作为一种可实施方式,接收模块41,具体用于接收所述终端按照所述各网页被访问的先后顺序依次发送的所述各网页的第二数据;分配模块42,具体用于根据接收模块41接收到所述各网页的第二数据的第二先后顺序,获得所述第一先后顺序,并根据所述第一先后顺序为所述各网页分配权重,所述第一先后顺序与所述第二先后顺序一致。
再可选的,为了获得用户访问各网页的先后顺序,作为另一种可实施方式,所述网页的第二数据还包括所述用户访问所述网页的访问时刻;相应的,分配模块42,具体用于根据所述各网页的访问时刻,分析获得所述第一先后顺序,并根据所述第一先后顺序为所述各网页分配权重。
通过上述两种实施方式,搜索平台可根据第二数据获得用户访问各网页的先后顺序,进而根据该先后顺序为各网页分配相应的权重。
可以理解,第一公式结合考虑了用户访问网页的先后顺序和具体用户访问各网页的访问时长,即用户在该网页上停留的时长,这些因素都能够反映出用户的真实需要,相应的,计算出的匹配值可以表征用户的真实需要度,即匹配值越高的网页越是用户真实需要的信息。
本实施例提供的搜索平台,接收终端在检测到用户进行搜索操作时,发送的用户在此后一定时长内访问网页的相关数据,根据终端上传的数据,计算用户在此期间访问的各网页的匹配值,并从中选取获得能够真实反映用户搜索需要的匹配网页,在后续用户再次基于相同的关键词进行搜索时,可以直接将该匹配网页推送给用户,实现结合用户的搜索需求向用户推送相应的匹配网页,从而实现快捷、精准地进行搜索。并且,当用户基于关键词进行搜索时,则结合用户的真实需要,实时向用户推送相应的匹配网页,无需用户自己判断选择,搜索效率高,实时性好。
图5为本发明实施例四提供的一种搜索平台的结构示意图,如图5所示,在实施例三的基础上,所述搜索平台还包括:
统计模块51,用于统计获得网页集合,所述网页集合包括各用户对应的第一匹配网页;
选取模块52,用于从所述网页集合中选取第二匹配网页;
发送模块44,还用于若接收到终端发送的第二搜索请求,则向所述终端返回所述第二匹配网页,所述第二搜索请求是所述终端检测到任一用户基于所述关键词进行搜索操作时发送的。
具体的,基于实施例一的方案,可以针对不同的用户需求,基于用户输入的关键词,向用户推送相应的网页信息。可以理解,即便关键词相同,但是对于不同用户来说,与其对应的第一匹配网页可能不同。但当用户的数量较多时,为每个用户建立相应的第一匹配网页可能需要占用相当多的存储资源和处理资源。
优选的,在本实施例中,统计获得各用户对应的第一匹配网页,并从中选取基于所述关键词搜索的,且能够反映普遍用户真实需要的第二匹配网页,当任一用户基于相同的关键词进行搜索时,可以直接将第二匹配网页推送给用户。
可选的,从所述网页集合中选取第二匹配网页可以通过多种实施方式实现。例如,可以基于网页集合中每个网页的出现次数确定第二匹配网页,具体的,出现次数越多,表明越多的用户关注该网页,也即更能反映普遍用户的真实需要。相应的,选取模块52,具体用于将所述网页集合中出现次数最高的网页,作为所述第二匹配网页。
再例如,还可以将网页集合中的各网页,进行加权计算,然后按照加权计算后的计算结果,获得所述第二匹配网页。具体的,计算结果越高的网页越能反映普遍用户的需求。相应的,选取模块52,具体用于根据预设的加权值,对所述网页集合中的各网页的匹配值进行加权计算,将计算结果值最高的网页作为所述第二匹配网页。
本实施例提供的搜索平台,在获得各用户对应的匹配网页后,从中选取能够反映普遍用户真实需要的网页,从而在后续任一用户基于相同的关键词进行搜索时,可以直接将该网页推送给用户,在快捷、精准得向用户推送其真实需要的信息的同时,有效节约存储和处理资源。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的搜索平台的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (6)

1.一种基于关键词的搜索方法,其特征在于,包括:
接收终端发送的第一数据,所述第一数据是所述终端检测到用户进行搜索操作时发送的,所述第一数据包括所述用户输入的关键词;
接收所述终端发送的各网页的第二数据,所述各网页为自所述终端检测到所述用户进行搜索操作的时刻起,所述用户访问的预设数量的网页或者预设时长内所述用户访问的网页,所述网页的第二数据包括网页的网页信息和用户访问所述网页的访问时长;
根据所述各网页的第二数据,获得所述用户访问所述各网页的第一先后顺序,并根据所述第一先后顺序为所述各网页分配权重,越先被访问的网页的权重越高;
按照所述第一先后顺序,对所述各网页进行排序,并针对排序后的每个网页,根据第一公式计算所述网页的匹配值,所述第一公式为:
其中,Result为所述网页的匹配值,n为所述网页的排序名次,qn为所述网页的权重,α和β均为预设的调整因子,Tn为所述网页的访问时长;
若接收到终端发送的第一搜索请求,则向所述终端返回所述用户对应的第一匹配网页的网页信息,所述第一搜索请求是所述终端检测到所述用户基于所述关键词进行搜索操作时发送的,所述第一匹配网页为所述各网页中匹配值最高的网页;
其中,所述方法还包括:
统计获得网页集合,所述网页集合包括各用户对应的第一匹配网页;
从所述网页集合中选取第二匹配网页;
若接收到终端发送的第二搜索请求,则向所述终端返回所述第二匹配网页,所述第二搜索请求是所述终端检测到任一用户基于所述关键词进行搜索操作时发送的;
所述从所述网页集合中选取第二匹配网页,包括:
将所述网页集合中出现次数最高的网页,作为所述第二匹配网页;或者,
根据预设的加权值,对所述网页集合中的各网页的匹配值进行加权计算,将计算结果值最高的网页作为所述第二匹配网页。
2.根据权利要求1所述的方法,其特征在于,所述接收所述终端发送的各网页的第二数据,包括:
接收所述终端按照所述各网页被访问的先后顺序依次发送的所述各网页的第二数据;
所述根据所述各网页的第二数据,获得所述用户访问所述各网页的第一先后顺序,包括:
根据接收到所述各网页的第二数据的第二先后顺序,获得所述第一先后顺序,所述第一先后顺序与所述第二先后顺序一致。
3.根据权利要求1所述的方法,其特征在于,所述网页的第二数据还包括所述用户访问所述网页的访问时刻;
所述根据所述各网页的第二数据,获得所述用户访问所述各网页的第一先后顺序,包括:
根据所述各网页的访问时刻,分析获得所述第一先后顺序。
4.一种搜索平台,其特征在于,包括:
接收模块,用于接收终端发送的第一数据,所述第一数据是所述终端检测到用户进行搜索操作时发送的,所述第一数据包括所述用户输入的关键词;
所述接收模块,还用于接收所述终端发送的各网页的第二数据,所述各网页为自所述终端检测到所述用户进行搜索操作的时刻起,所述用户访问的预设数量的网页或者预设时长内所述用户访问的网页,所述网页的第二数据包括网页的网页信息和用户访问所述网页的访问时长;
分配模块,用于根据所述各网页的第二数据,获得所述用户访问所述各网页的第一先后顺序,并根据所述第一先后顺序为所述各网页分配权重,越先被访问的网页的权重越高;
处理模块,用于按照所述第一先后顺序,对所述各网页进行排序,并针对排序后的每个网页,根据第一公式计算所述网页的匹配值,所述第一公式为:
其中,Result为所述网页的匹配值,n为所述网页的排序名次,qn为所述网页的权重,α和β均为预设的调整因子,Tn为所述网页的访问时长;
发送模块,用于若接收到终端发送的第一搜索请求,则向所述终端返回所述用户对应的第一匹配网页的网页信息,所述第一搜索请求是所述终端检测到所述用户基于所述关键词进行搜索操作时发送的,所述第一匹配网页为所述各网页中匹配值最高的网页;
其中,所述搜索平台还包括:
统计模块,用于统计获得网页集合,所述网页集合包括各用户对应的第一匹配网页;
选取模块,用于从所述网页集合中选取第二匹配网页;
所述发送模块,还用于若接收到终端发送的第二搜索请求,则向所述终端返回所述第二匹配网页,所述第二搜索请求是所述终端检测到任一用户基于所述关键词进行搜索操作时发送的;
所述选取模块,具体用于将所述网页集合中出现次数最高的网页,作为所述第二匹配网页;或者,根据预设的加权值,对所述网页集合中的各网页的匹配值进行加权计算,将计算结果值最高的网页作为所述第二匹配网页。
5.根据权利要求4所述的搜索平台,其特征在于,
所述接收模块,具体用于接收所述终端按照所述各网页被访问的先后顺序依次发送的所述各网页的第二数据;
所述分配模块,具体用于根据所述接收模块接收到所述各网页的第二数据的第二先后顺序,获得所述第一先后顺序,并根据所述第一先后顺序为所述各网页分配权重,所述第一先后顺序与所述第二先后顺序一致。
6.根据权利要求4所述的搜索平台,其特征在于,所述网页的第二数据还包括所述用户访问所述网页的访问时刻;
所述分配模块,具体用于根据所述各网页的访问时刻,分析获得所述第一先后顺序,并根据所述第一先后顺序为所述各网页分配权重。
CN201510502635.6A 2015-08-14 2015-08-14 基于关键词的搜索方法及搜索平台 Active CN105159953B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510502635.6A CN105159953B (zh) 2015-08-14 2015-08-14 基于关键词的搜索方法及搜索平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510502635.6A CN105159953B (zh) 2015-08-14 2015-08-14 基于关键词的搜索方法及搜索平台

Publications (2)

Publication Number Publication Date
CN105159953A CN105159953A (zh) 2015-12-16
CN105159953B true CN105159953B (zh) 2018-09-14

Family

ID=54800809

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510502635.6A Active CN105159953B (zh) 2015-08-14 2015-08-14 基于关键词的搜索方法及搜索平台

Country Status (1)

Country Link
CN (1) CN105159953B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008084930A1 (en) * 2007-01-12 2008-07-17 Nhn Corporation Method for offering result of search and system for executing the method
CN101739427A (zh) * 2008-11-10 2010-06-16 中国移动通信集团公司 一种爬虫抓取的方法及其装置
CN102902755A (zh) * 2012-09-21 2013-01-30 北京百度网讯科技有限公司 一种对检索结果项的排序进行调整的方法及装置
CN103412958A (zh) * 2013-08-30 2013-11-27 广州市动景计算机科技有限公司 一种搜索结果显示方法和装置
CN103412881A (zh) * 2013-07-17 2013-11-27 北京奇虎科技有限公司 提供搜索结果的方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008084930A1 (en) * 2007-01-12 2008-07-17 Nhn Corporation Method for offering result of search and system for executing the method
CN101739427A (zh) * 2008-11-10 2010-06-16 中国移动通信集团公司 一种爬虫抓取的方法及其装置
CN102902755A (zh) * 2012-09-21 2013-01-30 北京百度网讯科技有限公司 一种对检索结果项的排序进行调整的方法及装置
CN103412881A (zh) * 2013-07-17 2013-11-27 北京奇虎科技有限公司 提供搜索结果的方法及系统
CN103412958A (zh) * 2013-08-30 2013-11-27 广州市动景计算机科技有限公司 一种搜索结果显示方法和装置

Also Published As

Publication number Publication date
CN105159953A (zh) 2015-12-16

Similar Documents

Publication Publication Date Title
US8060497B1 (en) Framework for evaluating web search scoring functions
Kanoulas et al. Evaluating multi-query sessions
CN111159564A (zh) 信息推荐方法、装置、存储介质及计算机设备
JP2021533450A (ja) 機械学習のためのハイパーパラメータの識別および適用
US9552435B2 (en) Method and system for incremental collection of forum replies
US10699297B2 (en) Method, system and software product for optimizing the delivery of content to a candidate
CN104615627B (zh) 一种基于微博平台的事件舆情信息提取方法及系统
CN102819591A (zh) 一种基于内容的网页分类方法及系统
CN105183873A (zh) 恶意点击行为检测方法及装置
CN104050197B (zh) 一种信息检索系统评测方法和装置
CN102222078A (zh) 实时信息推送方法及设备
US10057155B2 (en) Method and apparatus for determining automatic scanning action
CN107766234A (zh) 一种基于移动设备的网页健康度的测评方法、装置及系统
CN102868936A (zh) 存储视频日志的方法和系统
Lee et al. An automatic topic ranking approach for event detection on microblogging messages
EP1921550A1 (fr) Procédé d'analyse et de traitement des requêtes appliquées à un moteur de recherche
JP2006053616A (ja) サーバ装置、webサイト推奨方法およびプログラム
CN107025261A (zh) 主题网络语料库
CN109684546A (zh) 推荐方法、装置、存储介质及终端
CN107094306A (zh) 终端性能评估方法及装置
CN105159953B (zh) 基于关键词的搜索方法及搜索平台
CN102833594B (zh) 一种网络协议电视iptv节目搜索方法、装置及系统
CN110533454B (zh) 一种识别业务对象群体的方法及系统
CN105117468B (zh) 一种网络数据处理方法和装置
CN104579850A (zh) 移动互联网环境下Web服务的服务质量QoS预测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant