CN105117479B - 用户搜索行为信息的采集方法、处理方法及电子设备 - Google Patents

用户搜索行为信息的采集方法、处理方法及电子设备 Download PDF

Info

Publication number
CN105117479B
CN105117479B CN201510580562.2A CN201510580562A CN105117479B CN 105117479 B CN105117479 B CN 105117479B CN 201510580562 A CN201510580562 A CN 201510580562A CN 105117479 B CN105117479 B CN 105117479B
Authority
CN
China
Prior art keywords
search
user
corresponding relation
search result
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510580562.2A
Other languages
English (en)
Other versions
CN105117479A (zh
Inventor
刘宇翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Internet Security Software Co Ltd
Original Assignee
Beijing Kingsoft Internet Security Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Internet Security Software Co Ltd filed Critical Beijing Kingsoft Internet Security Software Co Ltd
Priority to CN201510580562.2A priority Critical patent/CN105117479B/zh
Publication of CN105117479A publication Critical patent/CN105117479A/zh
Application granted granted Critical
Publication of CN105117479B publication Critical patent/CN105117479B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明的实施例公开一种对用户搜索行为信息的采集方法、采集装置、处理方法、处理装置及电子设备,为便于实现更加灵活的搜索方式以及便于提高搜索效率而发明。用户搜索行为信息的采集方法,包括:接收搜索框中输入的第一搜索词,向用户展示第一搜索结果,并记录所述第一搜索结果中的结果项是否被进行了点击;将所述搜索框清空之后,接收所述搜索框中输入的第二搜索词,向用户展示第二搜索结果,并接收对所述第二搜索结果中的结果项的点击;根据所述记录,若所述第一搜索结果中的结果项没有被点击,则建立所述第一搜索词与所述第二搜索结果中被点击的结果项的对应关系。本发明适用于对应用程序商店中的应用程序进行搜索等场合。

Description

用户搜索行为信息的采集方法、处理方法及电子设备
技术领域
本发明涉及搜索技术领域,尤其涉及一种对用户搜索行为信息的采集方法、采集装置、处理方法、处理装置及电子设备。
背景技术
终端设备如手机的用户,通常会从应用程序商店中搜索并下载安装自己喜欢的应用程序(英文缩写:App;英文全称:Application)。现有的搜索技术,都是以全文本匹配来进行的。每个App有且只有一个确定的名称,当用户想搜索一款App时,只能通过搜索它的全文名称才能搜索到它,无法通过搜索它的其它名称如别名来搜索到它。
例如,“Facebook”这一款App,很多用户习惯称“Facebook”为“fb”。然而,当这些用户搜索“fb”时,并不能搜索到“Facebook”。用户只能通过搜索“Facebook”才能搜索到它。
现有的这种以全文本匹配来进行的搜索方式,需要用户输入全文本名称才能搜索到目标,使得搜索方式固化单一、且搜索效率较低。
发明内容
有鉴于此,本发明实施例提供一种对用户搜索行为信息的采集方法、采集装置、处理方法、处理装置及电子设备,能够便于实现更加灵活的搜索方式以及便于提高搜索效率。
一方面,本发明实施例提供一种用户搜索行为信息的采集方法,包括:接收搜索框中输入的第一搜索词;根据所述第一搜索词,向用户展示第一搜索结果,并记录所述第一搜索结果中的结果项是否被进行了点击;接收对所述搜索框中的所述第一搜索词进行清空的指令,并根据该指令将所述搜索框清空;接收所述搜索框中输入的第二搜索词;根据所述第二搜索词,向用户展示第二搜索结果,并接收对所述第二搜索结果中的结果项的点击;根据所述记录,若所述第一搜索结果中的结果项没有被点击,则建立所述第一搜索词与所述第二搜索结果中被点击的结果项的对应关系。
可选地,根据所述用户搜索行为信息的采集方法实施例,所述搜索框为移动终端设备应用程序商店中的应用程序搜索框;所述第一搜索词为用户在搜索框中输入的目标应用程序的非全文本匹配名称。
另一方面,本发明实施例还提供一种用户搜索行为信息的采集装置,包括:搜索框,用于接收用户输入的搜索词;展示及记录模块,用于根据所述搜索词,向用户展示与所述搜索词相对应的搜索结果,并记录所述用户对所述搜索结果中任一结果项是否进行了点击;清空模块,用于接收用户对所述搜索框中的内容进行清空的指令,并根据该指令将所述搜索框中的内容清空;判断模块,用于判断在如下过程中,用户对第一搜索结果中任一结果项是否进行了点击:根据用户在搜索框中输入的第一搜索词展示第一搜索结果,对所述搜索框中的内容清空后,接收所述搜索框中输入的第二搜索词并展示第二搜索结果,接收用户对所述第二搜索结果中一个结果项的点击;关系构建模块,用于根据所述判断模块的判断,若所述用户对所述第一搜索结果中任一结果项没有进行点击,则建立所述第一搜索词与所述用户在所述第二搜索结果中所点击的结果项的对应关系;上报模块,用于将所述关系构建模块构建的所述对应关系上报给服务器。
可选地,根据所述的用户搜索行为信息的采集装置实施例,所述搜索框为移动终端设备应用程序商店中的应用程序搜索框;所述第一搜索词为用户在搜索框中输入的目标应用程序的非全文本匹配名称。
再一方面,本发明实施例还提供一种电子设备,其包括前述用户搜索行为信息的采集装置任一实施例所述的用户搜索行为信息的采集装置。
与现有技术相比,本发明用户搜索行为信息的采集方法、采集装置及电子设备实施例,通过建立所述第一搜索词与所述用户在所述第二搜索结果中所点击的结果项的对应关系,可根据用户的搜索行为,建立搜索词同与搜索词非全文本匹配的搜索结果项之间的对应关系,这样,即使用户输入的搜索词是与搜索目标非全文本匹配的搜索词,也可以根据建立的搜索词同与搜索词非全文本匹配的搜索结果项之间的对应关系,将搜索目标展示给用户,从而能够便于实现更加灵活的搜索方式以及便于提高搜索效率。
再一方面,本发明实施例提供一种用户搜索行为信息的处理方法,包括:接收两个以上客户端上报的搜索词与搜索结果项之间的对应关系;其中,所述搜索结果项为与所述搜索词非全文本匹配的搜索结果项;对从各个客户端接收到的所述对应关系进行噪音处理,得到有效对应关系;将所述有效对应关系进行保存。
可选地,根据所述的用户搜索行为信息的处理方法实施例,所述对从各个客户端接收到的所述对应关系进行噪音处理,得到有效对应关系,包括:以所述搜索词为基准,在含有所述搜索词的所有对应关系中,若与所述搜索词相对应的搜索结果项Xi满足如下公式,则确定所述搜索词与Xi之间的对应关系为第一有效对应关系:
Figure BDA0000801037980000031
其中,Xi、Xj分别代表与所述搜索词相对应的搜索结果项;i=1,2…m;m和n均为自然数;β代表阈值。
可选地,根据所述的用户搜索行为信息的处理方法实施例,所述对从各个客户端接收到的所述对应关系进行噪音处理,得到有效对应关系,还包括:以一搜索结果项Xi为基准,将含有所述搜索结果项Xi的所有对应关系,按照与所述搜索结果项Xi相对应的搜索词的数量从大到小进行排列,取排序在前的预定个数的对应关系;取所述排序在前的预定个数的对应关系与所述第一有效对应关系之间的交集,得到第二有效对应关系。
可选地,根据所述的用户搜索行为信息的处理方法实施例,所述的用户搜索行为信息的处理方法,还包括:接收客户端发送的搜索词;根据接收到的所述搜索词,在保存的所述有效对应关系中进行匹配查询;将经过所述匹配查询得到的与所述搜索词相对应的搜索结果项,发送给客户端。
可选地,根据所述的用户搜索行为信息的处理方法实施例,所述的用户搜索行为信息的处理方法,还包括:接收两个以上客户端上报的、用户对与所述搜索词相对应的搜索结果项是否点击的记录;根据客户端上报的所述记录,统计用户对所述搜索结果项的点击率;判断用户对所述搜索结果项的点击率是否低于预定阈值,若低于预定阈值,则进行报警和/或将所述搜索词与相对应的搜索结果项之间的对应关系从所述有效对应关系中自动删除。
可选地,根据所述的用户搜索行为信息的处理方法实施例,所述接收两个以上客户端上报的搜索词与搜索结果项之间的对应关系,为接收两个以上客户端根据前述用户搜索行为信息的采集方法任一实施例所述的方法、建立的所述第一搜索词与所述用户在所述第二搜索结果中所点击的结果项的对应关系。
再一方面,本发明实施例提供一种用户搜索行为信息的处理装置,包括:第一接收模块,用于接收两个以上客户端上报的搜索词与搜索结果项之间的对应关系;其中,所述搜索结果项为与所述搜索词非全文本匹配的搜索结果项;噪音处理模块,用于对从各个客户端接收到的所述对应关系进行噪音处理,得到有效对应关系;存储模块,用于将所述有效对应关系进行保存。
可选地,根据所述的用户搜索行为信息的处理装置,所述噪音处理模块,包括:第一处理子模块,用于以所述搜索词为基准,在含有所述搜索词的所有对应关系中,若与所述搜索词相对应的搜索结果项Xi满足如下公式,则确定所述搜索词与Xi之间的对应关系为第一有效对应关系:
Figure BDA0000801037980000041
其中,Xi、Xj分别代表与所述搜索词相对应的搜索结果项;i=1,2…m;m和n均为自然数;β代表阈值。
可选地,根据所述的用户搜索行为信息的处理装置实施例,所述噪音处理模块,还包括:第二处理子模块,用于以一搜索结果项Xi为基准,将含有所述搜索结果项Xi的所有对应关系,按照与所述搜索结果项Xi相对应的搜索词的数量从大到小进行排列,取排序在前的预定个数的对应关系;取所述排序在前的预定个数的对应关系与所述第一有效对应关系之间的交集,得到第二有效对应关系。
可选地,根据所述的用户搜索行为信息的处理装置实施例,所述的服务器,还包括:第二接收模块,用于接收客户端发送的搜索词;查询模块,用于根据接收到的所述搜索词,在保存的所述有效对应关系中进行匹配查询;发送模块,用于将经过所述匹配查询得到的与所述搜索词相对应的搜索结果项,发送给客户端。
可选地,根据所述的用户搜索行为信息的处理装置实施例,所述的服务器,还包括:第三接收模块,用于接收两个以上客户端上报的、用户对与所述搜索词相对应的搜索结果项是否点击的记录;统计模块,用于根据客户端上报的所述记录,统计用户对所述搜索结果项的点击率;判断模块,用于判断用户对所述搜索结果项的点击率是否低于预定阈值,若低于预定阈值,则进行报警和/或将所述搜索词与相对应的搜索结果项之间的对应关系从所述有效对应关系中自动删除。
与现有技术相比,本发明用户搜索行为信息的处理方法及处理装置实施例,通过接收两个以上客户端上报的搜索词与搜索结果项之间的对应关系,对所述对应关系进行噪音处理,得到搜索词同与所述搜索词非全文本匹配的搜索结果项之间的有效对应关系,这样,即使用户输入的搜索词是与搜索目标非全文本匹配的搜索词,也可以根据建立的搜索词同与搜索词非全文本匹配的搜索结果项之间的有效对应关系,将搜索目标展示给用户,从而能够便于实现更加灵活的搜索方式以及便于提高搜索效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明用户搜索行为信息的采集方法一实施例的流程示意图;
图2为本发明用户搜索行为信息的采集方法另一实施例的流程示意图;
图3为本实施例中输入第一搜索词fb后的搜索结果项展示示意图;
图4为本发明实施例中输入第二搜索词facebook后的搜索结果项展示示意图;
图5为本发明用户搜索行为信息的采集装置实施例的结构示意图;
图6为本发明用户搜索行为信息的处理方法一实施例的流程示意图;
图7为本发明用户搜索行为信息的处理装置一实施例的结构示意图;
图8为本发明用户搜索行为信息的处理装置另一实施例的结构示意图;
图9为本发明用户搜索行为信息的处理装置再一实施例的结构示意图。
具体实施方式
下面结合附图对本发明实施例用户搜索行为信息的采集方法、采集装置、处理方法、处理装置及电子设备进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1为本发明用户搜索行为信息的采集方法一实施例的流程示意图。参看图1,本发明用户搜索行为信息的采集方法一实施例,包括步骤:
S11、接收搜索框中输入的第一搜索词;
所述搜索框可以是移动终端如手机上的应用程序商店的搜索框,用户在该搜索框中输入搜索词,可以对需要下载安装的应用程序进行搜索。
本发明不限于此,所述搜索框也可以是网上商城如淘宝商城、eBay商城等中用来对售卖的商品进行搜索的搜索框,用户在该搜索框中输入搜索词,可以对需要查看或购买的商品进行搜索。
S12、根据所述第一搜索词,向用户展示第一搜索结果,并记录所述第一搜索结果中的结果项是否被进行了点击;
S13、接收对所述搜索框中的所述第一搜索词进行清空的指令,并根据该指令将所述搜索框清空;
S14、接收所述搜索框中输入的第二搜索词;
S15、根据所述第二搜索词,向用户展示第二搜索结果,并接收对所述第二搜索结果中的结果项的点击;
S16、根据所述记录,若所述第一搜索结果中的结果项没有被点击,则建立所述第一搜索词与所述第二搜索结果中被点击的结果项的对应关系。
本发明用户搜索行为信息的采集方法实施例,通过建立所述第一搜索词与所述用户在所述第二搜索结果中所点击的结果项的对应关系,可根据用户的搜索行为,建立搜索词同与搜索词非全文本匹配的搜索结果项之间的对应关系,这样,即使用户输入的搜索词是与搜索目标非全文本匹配的搜索词,也可以根据建立的搜索词同与搜索词非全文本匹配的搜索结果项之间的对应关系,将搜索目标展示给用户,从而能够便于实现更加灵活的搜索方式以及便于提高搜索效率。
图2为本发明用户搜索行为信息的采集方法一实施例的流程示意图。参看图2,本发明用户搜索行为信息的采集方法一实施例,包括步骤:
S21、接收用户在移动终端设备应用程序商店中的应用程序搜索框中输入的第一搜索词fb;
S22、根据所述第一搜索词fb,向用户展示第一搜索结果,并记录所述用户对所述第一搜索结果中任一结果项是否进行了点击;
图3为本实施例中输入第一搜索词fb后的搜索结果项展示示意图。参看图3,所展示的第一搜索结果包括有“fb”,“fbi”,“fbise”等搜索结果项;
本步骤中,所述用户对所述第一搜索结果中任一搜索结果项没有进行点击;
S23、接收用户对所述搜索框中的所述第一搜索词进行清空的指令,并根据该指令将所述搜索框清空;
S24、接收用户在所述搜索框中输入的第二搜索词facebook;
S25、根据所述第二搜索词facebook,向用户展示第二搜索结果,并接收用户对所述第二搜索结果中一个结果项的点击;
图4为本发明实施例中输入第二搜索词facebook后的搜索结果项展示示意图。参看图4,所展示的第二搜索结果包括有“facebook”,“facebook login”,“facebookdownload”,“脸书”等搜索结果项;
本步骤中,接收用户对所述第二搜索结果中的搜索结果项“facebook”的点击;
S26、根据所述记录,所述用户对所述第一搜索结果中任一结果项没有进行点击,建立所述第一搜索词fb与所述用户在所述第二搜索结果中所点击的搜索结果项“facebook”的对应关系“fb->facebook”,并将所述对应关系“fb->facebook”发送给服务器。
本实施例中,所述搜索结果项“facebook”为其中一个与第一搜索词fb非全文本匹配的搜索结果项。
相应地,所述第一搜索词fb可称为搜索结果项“facebook”的非全文本匹配名称;或者,所述第一搜索词fb可称为搜索结果项“facebook”的别名。
图5为本发明用户搜索行为信息的采集装置实施例的结构示意图。参看图9,本发明用户搜索行为信息的采集装置实施例,包括:搜索框51,用于接收用户输入的搜索词;展示及记录模块52,用于根据所述搜索词,向用户展示与所述搜索词相对应的搜索结果,并记录所述用户对所述搜索结果中任一结果项是否进行了点击;清空模块53,用于接收用户对所述搜索框中的内容进行清空的指令,并根据该指令将所述搜索框中的内容清空;判断模块54,用于判断在如下过程中,用户对第一搜索结果中任一结果项是否进行了点击:根据用户在搜索框中输入的第一搜索词展示第一搜索结果,对所述搜索框中的内容清空后,接收所述搜索框中输入的第二搜索词并展示第二搜索结果,接收用户对所述第二搜索结果中一个结果项的点击;关系构建模块55,用于根据所述判断模块的判断,若所述用户对所述第一搜索结果中任一结果项没有进行点击,则建立所述第一搜索词与所述用户在所述第二搜索结果中所点击的结果项的对应关系;上报模块56,用于将所述关系构建模块构建的所述对应关系上报给服务器。
本实施例中,各功能模块之间的工作过程,可参看本发明用户搜索行为信息的采集方法任一实施例的过程。
在一可选实施例中,所述搜索框为移动终端设备应用程序商店中的应用程序搜索框;
所述第一搜索词为用户在搜索框中输入的目标应用程序的非全文本匹配名称。
本发明用户搜索行为信息的采集装置实施例,通过建立所述第一搜索词与所述用户在所述第二搜索结果中所点击的结果项的对应关系,可根据用户的搜索行为,建立搜索词同与搜索词非全文本匹配的搜索结果项之间的对应关系,这样,即使用户输入的搜索词是与搜索目标非全文本匹配的搜索词,也可以根据建立的搜索词同与搜索词非全文本匹配的搜索结果项之间的对应关系,将搜索目标展示给用户,从而能够便于实现更加灵活的搜索方式以及便于提高搜索效率。
本发明实施例还提供一种电子设备,该电子设备包括前述用户搜索行为信息的采集装置任一实施例所述的用户搜索行为信息的采集装置。
本发明实施例的电子设备可以是手机,平板电脑等便携式电子设备。
本发明电子设备实施例,通过建立所述第一搜索词与所述用户在所述第二搜索结果中所点击的结果项的对应关系,可根据用户的搜索行为,建立搜索词同与搜索词非全文本匹配的搜索结果项之间的对应关系,这样,即使用户输入的搜索词是与搜索目标非全文本匹配的搜索词,也可以根据建立的搜索词同与搜索词非全文本匹配的搜索结果项之间的对应关系,将搜索目标展示给用户,从而能够便于实现更加灵活的搜索方式以及便于提高搜索效率。
图6为本发明用户搜索行为信息的处理方法一实施例的流程示意图。参看图6,本发明用户搜索行为信息的处理方法一实施例,包括步骤:
S61、接收两个以上客户端上报的搜索词与搜索结果项之间的对应关系;其中,所述搜索结果项为与所述搜索词非全文本匹配的搜索结果项;
S62、对从各个客户端接收到的所述对应关系进行噪音处理,得到有效对应关系;
S63、将所述有效对应关系进行保存。
本发明用户搜索行为信息的处理方法实施例,通过接收两个以上客户端上报的搜索词与搜索结果项之间的对应关系,对所述对应关系进行噪音处理,得到搜索词同与所述搜索词非全文本匹配的搜索结果项之间的有效对应关系,这样,即使用户输入的搜索词是与搜索目标非全文本匹配的搜索词,也可以根据建立的搜索词同与搜索词非全文本匹配的搜索结果项之间的有效对应关系,将搜索目标展示给用户,从而能够便于实现更加灵活的搜索方式以及便于提高搜索效率。
在前述用户搜索行为信息的处理方法实施例中,可选地,所述对从各个客户端接收到的所述对应关系进行噪音处理,得到有效对应关系(S62),包括:
以所述搜索词为基准,在含有所述搜索词的所有对应关系中,若与所述搜索词相对应的搜索结果项Xi满足如下公式,则确定所述搜索词与Xi之间的对应关系为第一有效对应关系:
Figure BDA0000801037980000111
其中,Xi、Xj分别代表与所述搜索词相对应的搜索结果项;
i=1,2…m;m和n均为自然数;
β代表阈值,比如为50%、70%或80%等。
得到所述第一有效对应关系后,将所述第一有效对应关系进行保存。
为了进一步所述对应关系的有效性,在前述用户搜索行为信息的处理方法实施例中,进一步地,所述对从各个客户端接收到的所述对应关系进行噪音处理,得到有效对应关系(S62),还可包括:
以一搜索结果项Xi为基准,将含有所述搜索结果项Xi的所有对应关系,按照与所述搜索结果项Xi相对应的搜索词的数量从大到小进行排列,取排序在前的预定个数的对应关系;
取所述排序在前的预定个数的对应关系与所述第一有效对应关系之间的交集,得到第二有效对应关系。
得到所述第二有效对应关系后,将所述第二有效对应关系进行保存。
在前述用户搜索行为信息的处理方法任一实施例中,所述用户搜索行为信息的处理方法,还可包括:接收客户端发送的搜索词;根据接收到的所述搜索词,在保存的所述有效对应关系中进行匹配查询;将经过所述匹配查询得到的与所述搜索词相对应的搜索结果项,发送给客户端。
为了提高所述有效对应关系的准确性,可采用如下方法对所述有效对应关系进行自动校准,即在前述用户搜索行为信息的处理方法实施例中,进一步地,所述用户搜索行为信息的处理方法,还可包括:接收两个以上客户端上报的、用户对与所述搜索词相对应的搜索结果项是否点击的记录;根据客户端上报的所述记录,统计用户对所述搜索结果项的点击率;判断用户对所述搜索结果项的点击率是否低于预定阈值,若低于预定阈值,比如低于30%,则进行报警和/或将所述搜索词与相对应的搜索结果项之间的对应关系从所述有效对应关系中自动删除。
在前述用户搜索行为信息的处理方法实施例中,所述接收两个以上客户端上报的搜索词与搜索结果项之间的对应关系,可为接收两个以上客户端根据前述用户搜索行为信息的采集方法实施例建立的所述第一搜索词与所述用户在所述第二搜索结果中所点击的结果项的对应关系。
图7为本发明用户搜索行为信息的处理装置实施例的结构示意图。参看图7,本发明用户搜索行为信息的处理装置实施例,包括:第一接收模块71,用于接收两个以上客户端上报的搜索词与搜索结果项之间的对应关系;其中,所述搜索结果项为与所述搜索词非全文本匹配的搜索结果项;噪音处理模块72,用于对从各个客户端接收到的所述对应关系进行噪音处理,得到有效对应关系;存储模块73,用于将所述有效对应关系进行保存。
本发明用户搜索行为信息的处理装置实施例,通过接收两个以上客户端上报的搜索词与搜索结果项之间的对应关系,对所述对应关系进行噪音处理,得到搜索词同与所述搜索词非全文本匹配的搜索结果项之间的有效对应关系,这样,即使用户输入的搜索词是与搜索目标非全文本匹配的搜索词,也可以根据建立的搜索词同与搜索词非全文本匹配的搜索结果项之间的有效对应关系,将搜索目标展示给用户,从而能够便于实现更加灵活的搜索方式以及便于提高搜索效率。
在前述用户搜索行为信息的处理装置实施例中,可选地,所述噪音处理模块72,包括:第一处理子模块,用于以所述搜索词为基准,在含有所述搜索词的所有对应关系中,若与所述搜索词相对应的搜索结果项Xi满足如下公式,则确定所述搜索词与Xi之间的对应关系为第一有效对应关系:
Figure BDA0000801037980000121
其中,Xi、Xj分别代表与所述搜索词相对应的搜索结果项;i=1,2…m;m和n均为自然数;β代表阈值,比如为50%、70%或80%等。
为了进一步所述对应关系的有效性,在前述用户搜索行为信息的处理装置实施例中,可选地,所述噪音处理模块72,还可进一步包括:第二处理子模块,用于以一搜索结果项Xi为基准,将含有所述搜索结果项Xi的所有对应关系,按照与所述搜索结果项Xi相对应的搜索词的数量从大到小进行排列,取排序在前的预定个数的对应关系;取所述排序在前的预定个数的对应关系与所述第一有效对应关系之间的交集,得到第二有效对应关系。
图8为本发明用户搜索行为信息的处理装置另一实施例的结构示意图。参看图8,在前述用户搜索行为信息的处理装置任一实施例的基础上,所述的用户搜索行为信息的处理装置,还可进一步包括:第二接收模块74,用于接收客户端发送的搜索词;查询模块75,用于根据接收到的所述搜索词,在保存的所述有效对应关系中进行匹配查询;发送模块76,用于将经过所述匹配查询得到的与所述搜索词相对应的搜索结果项,发送给客户端。
参看图9,在前述用户搜索行为信息的处理装置任一实施例的基础上,所述的用户搜索行为信息的处理装置,还可进一步包括:第三接收模块77,用于接收两个以上客户端上报的、用户对与所述搜索词相对应的搜索结果项是否点击的记录;统计模块78,用于根据客户端上报的所述记录,统计用户对所述搜索结果项的点击率;判断模块79,用于判断用户对所述搜索结果项的点击率是否低于预定阈值,若低于预定阈值,则进行报警和/或将所述搜索词与相对应的搜索结果项之间的对应关系从所述有效对应关系中自动删除。
本发明用户搜索行为信息的处理装置实施例中,各功能模块之间的工作过程,可参看本发明用户搜索行为信息的处理方法实施例的过程。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (16)

1.一种用户搜索行为信息的采集方法,其特征在于,包括:
接收搜索框中输入的第一搜索词;所述第一搜索词是与搜索目标非全文本匹配的搜索词;
根据所述第一搜索词,向用户展示第一搜索结果,并记录所述第一搜索结果中的结果项是否被进行了点击;
接收对所述搜索框中的所述第一搜索词进行清空的指令,并根据该指令将所述搜索框清空;
接收所述搜索框中输入的第二搜索词;
根据所述第二搜索词,向用户展示第二搜索结果,并接收对所述第二搜索结果中的结果项的点击;
根据所述记录,若所述第一搜索结果中的结果项没有被进行点击,则建立所述第一搜索词与所述第二搜索结果中被点击的结果项的对应关系。
2.根据权利要求1所述的采集方法,其特征在于,
所述搜索框为移动终端设备应用程序商店中的应用程序搜索框;
所述第一搜索词为用户在搜索框中输入的目标应用程序的非全文本匹配名称。
3.一种用户搜索行为信息的采集装置,其特征在于,包括:
搜索框,用于接收用户输入的搜索词;所述搜索词是与搜索目标非全文本匹配的搜索词;
展示及记录模块,用于根据所述搜索词,向用户展示与所述搜索词相对应的搜索结果,并记录所述用户对所述搜索结果中任一结果项是否进行了点击;
清空模块,用于接收用户对所述搜索框中的内容进行清空的指令,并根据该指令将所述搜索框中的内容清空;
判断模块,用于判断在如下过程中,用户对第一搜索结果中任一结果项是否进行了点击:根据用户在搜索框中输入的第一搜索词展示第一搜索结果,对所述搜索框中的内容清空后,接收所述搜索框中输入的第二搜索词并展示第二搜索结果,接收用户对所述第二搜索结果中一个结果项的点击;
关系构建模块,用于根据所述判断模块的判断,若所述用户对所述第一搜索结果中任一结果项没有进行点击,则建立所述第一搜索词与所述用户在所述第二搜索结果中所点击的结果项的对应关系;
上报模块,用于将所述关系构建模块构建的所述对应关系上报给服务器。
4.根据权利要求3所述的采集装置,其特征在于,
所述搜索框为移动终端设备应用程序商店中的应用程序搜索框;
所述第一搜索词为用户在搜索框中输入的目标应用程序的非全文本匹配名称。
5.一种用户搜索行为信息的处理方法,其特征在于,包括:
接收两个以上客户端上报的搜索词与搜索结果项之间的对应关系;其中,所述搜索结果项为与所述搜索词非全文本匹配的搜索结果项;客户端上报的搜索词与搜索结果项之间的对应关系,为客户端建立的第一搜索词与用户在第二搜索结果中所点击的结果项的对应关系;
对从各个客户端接收到的所述对应关系进行噪音处理,得到搜索词同与所述搜索词非全文本匹配的搜索结果项之间的有效对应关系;
将所述有效对应关系进行保存;
其中,建立第一搜索词与用户在第二搜索结果中所点击的结果项的对应关系包括:根据所述第一搜索词,向用户展示第一搜索结果,并记录所述第一搜索结果中的结果项是否被进行了点击;接收对搜索框中的所述第一搜索词进行清空的指令,并根据该指令将所述搜索框清空;接收所述搜索框中输入的第二搜索词;根据所述第二搜索词,向用户展示第二搜索结果,并接收对所述第二搜索结果中的结果项的点击;根据所述记录,若所述第一搜索结果中的结果项没有被进行点击,则建立所述第一搜索词与所述第二搜索结果中被点击的结果项的对应关系。
6.根据权利要求5所述的处理方法,其特征在于,所述对从各个客户端接收到的所述对应关系进行噪音处理,得到有效对应关系,包括:
以所述搜索词为基准,在含有所述搜索词的所有对应关系中,若与所述搜索词相对应的搜索结果项Xi满足如下公式,则确定所述搜索词与Xi之间的对应关系为第一有效对应关系:
Figure FDA0002535844400000031
其中,Xi、Xj分别代表与所述搜索词相对应的搜索结果项;
i=1,2...m;m和n均为自然数;
β代表阈值。
7.根据权利要求6所述的处理方法,其特征在于,所述对从各个客户端接收到的所述对应关系进行噪音处理,得到有效对应关系,还包括:
以一搜索结果项Xi为基准,将含有所述搜索结果项Xi的所有对应关系,按照与所述搜索结果项Xi相对应的搜索词的数量从大到小进行排列,取排序在前的预定个数的对应关系;
取所述排序在前的预定个数的对应关系与所述第一有效对应关系之间的交集,得到第二有效对应关系。
8.根据权利要求5-7任一项所述的处理方法,其特征在于,还包括:
接收客户端发送的搜索词;
根据接收到的所述搜索词,在保存的所述有效对应关系中进行匹配查询;
将经过所述匹配查询得到的与所述搜索词相对应的搜索结果项,发送给客户端。
9.根据权利要求8所述的处理方法,其特征在于,还包括:
接收两个以上客户端上报的、用户对与所述搜索词相对应的搜索结果项是否点击的记录;
根据客户端上报的所述记录,统计用户对所述搜索结果项的点击率;
判断用户对所述搜索结果项的点击率是否低于预定阈值,若低于预定阈值,则进行报警和/或将所述搜索词与相对应的搜索结果项之间的对应关系从所述有效对应关系中自动删除。
10.根据权利要求5所述的处理方法,其特征在于,所述接收两个以上客户端上报的搜索词与搜索结果项之间的对应关系,为接收两个以上客户端根据权利要求1或2所述的方法建立的所述第一搜索词与所述用户在所述第二搜索结果中所点击的结果项的对应关系。
11.一种用户搜索行为信息的处理装置,其特征在于,包括:
第一接收模块,用于接收两个以上客户端上报的搜索词与搜索结果项之间的对应关系;其中,所述搜索结果项为与所述搜索词非全文本匹配的搜索结果项;客户端上报的搜索词与搜索结果项之间的对应关系,为客户端建立的第一搜索词与用户在第二搜索结果中所点击的结果项的对应关系;
噪音处理模块,用于对从各个客户端接收到的所述对应关系进行噪音处理,得到搜索词同与所述搜索词非全文本匹配的搜索结果项之间的有效对应关系;
存储模块,用于将所述有效对应关系进行保存;
其中,建立第一搜索词与用户在第二搜索结果中所点击的结果项的对应关系包括:根据所述第一搜索词,向用户展示第一搜索结果,并记录所述第一搜索结果中的结果项是否被进行了点击;接收对搜索框中的所述第一搜索词进行清空的指令,并根据该指令将所述搜索框清空;接收所述搜索框中输入的第二搜索词;根据所述第二搜索词,向用户展示第二搜索结果,并接收对所述第二搜索结果中的结果项的点击;根据所述记录,若所述第一搜索结果中的结果项没有被进行点击,则建立所述第一搜索词与所述第二搜索结果中被点击的结果项的对应关系。
12.根据权利要求11所述的处理装置,其特征在于,所述噪音处理模块,包括:
第一处理子模块,用于以所述搜索词为基准,在含有所述搜索词的所有对应关系中,若与所述搜索词相对应的搜索结果项Xi满足如下公式,则确定所述搜索词与Xi之间的对应关系为第一有效对应关系:
Figure FDA0002535844400000051
其中,Xi、Xj分别代表与所述搜索词相对应的搜索结果项;
i=1,2...m;m和n均为自然数;
β代表阈值。
13.根据权利要求12所述的处理装置,其特征在于,所述噪音处理模块,还包括:
第二处理子模块,用于以一搜索结果项Xi为基准,将含有所述搜索结果项Xi的所有对应关系,按照与所述搜索结果项Xi相对应的搜索词的数量从大到小进行排列,取排序在前的预定个数的对应关系;取所述排序在前的预定个数的对应关系与所述第一有效对应关系之间的交集,得到第二有效对应关系。
14.根据权利要求11-13任一项所述的处理装置,其特征在于,还包括:
第二接收模块,用于接收客户端发送的搜索词;
查询模块,用于根据接收到的所述搜索词,在保存的所述有效对应关系中进行匹配查询;
发送模块,用于将经过所述匹配查询得到的与所述搜索词相对应的搜索结果项,发送给客户端。
15.根据权利要求14所述的处理装置,其特征在于,还包括:
第三接收模块,用于接收两个以上客户端上报的、用户对与所述搜索词相对应的搜索结果项是否点击的记录;
统计模块,用于根据客户端上报的所述记录,统计用户对所述搜索结果项的点击率;
判断模块,用于判断用户对所述搜索结果项的点击率是否低于预定阈值,若低于预定阈值,则进行报警和/或将所述搜索词与相对应的搜索结果项之间的对应关系从所述有效对应关系中自动删除。
16.一种电子设备,其特征在于,包括前述权利要求3或4所述的用户搜索行为信息的采集装置。
CN201510580562.2A 2015-09-11 2015-09-11 用户搜索行为信息的采集方法、处理方法及电子设备 Active CN105117479B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510580562.2A CN105117479B (zh) 2015-09-11 2015-09-11 用户搜索行为信息的采集方法、处理方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510580562.2A CN105117479B (zh) 2015-09-11 2015-09-11 用户搜索行为信息的采集方法、处理方法及电子设备

Publications (2)

Publication Number Publication Date
CN105117479A CN105117479A (zh) 2015-12-02
CN105117479B true CN105117479B (zh) 2020-08-25

Family

ID=54665468

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510580562.2A Active CN105117479B (zh) 2015-09-11 2015-09-11 用户搜索行为信息的采集方法、处理方法及电子设备

Country Status (1)

Country Link
CN (1) CN105117479B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106919588A (zh) * 2015-12-24 2017-07-04 北京奇虎科技有限公司 一种应用程序搜索系统及方法
CN106407457A (zh) * 2016-09-30 2017-02-15 北京奇虎科技有限公司 一种推荐搜索词的方法、搜索方法和装置
CN107463619A (zh) * 2017-07-04 2017-12-12 广州神马移动信息科技有限公司 搜索方法、搜索设备以及终端设备
CN109962983B (zh) * 2019-03-29 2021-11-23 北京搜狗科技发展有限公司 一种点击率统计方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101655846A (zh) * 2008-08-21 2010-02-24 联想移动通信科技有限公司 中文输入法标点关联方法及装置
CN102341765A (zh) * 2008-12-31 2012-02-01 Tivo有限公司 用于自适应搜索的方法和技术

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8195660B2 (en) * 2007-06-29 2012-06-05 Intel Corporation Method and apparatus to reorder search results in view of identified information of interest
US8244701B2 (en) * 2010-02-12 2012-08-14 Microsoft Corporation Using behavior data to quickly improve search ranking
CN102456018B (zh) * 2010-10-18 2016-03-02 腾讯科技(深圳)有限公司 一种交互搜索方法及装置
CN102915314B (zh) * 2011-08-05 2018-07-31 深圳市世纪光速信息技术有限公司 一种纠错对自动生成方法及系统
CN102495840A (zh) * 2011-11-11 2012-06-13 合一网络技术(北京)有限公司 一种用于视频网站的搜索引擎
CN102930022B (zh) * 2012-10-31 2015-11-25 中国运载火箭技术研究院 面向用户的信息搜索引擎系统及方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101655846A (zh) * 2008-08-21 2010-02-24 联想移动通信科技有限公司 中文输入法标点关联方法及装置
CN102341765A (zh) * 2008-12-31 2012-02-01 Tivo有限公司 用于自适应搜索的方法和技术

Also Published As

Publication number Publication date
CN105117479A (zh) 2015-12-02

Similar Documents

Publication Publication Date Title
CN107679211B (zh) 用于推送信息的方法和装置
US20180196815A1 (en) Personalization of news articles based on news sources
CN110096655B (zh) 搜索结果的排序方法、装置、设备及存储介质
US10216848B2 (en) Method and system for recommending cloud websites based on terminal access statistics
CN103714119B (zh) 一种浏览器数据的处理方法和装置
CN105117479B (zh) 用户搜索行为信息的采集方法、处理方法及电子设备
US9384266B1 (en) Predictive generation of search suggestions
US10540365B2 (en) Federated search
US11061893B2 (en) Multi-domain query completion
JP6177030B2 (ja) Poi情報提供システム、poi情報提供装置、poi情報提供方法、及びプログラム
US11200244B2 (en) Keyword reporting for mobile applications
CN109522480A (zh) 一种信息推荐方法、装置、电子设备及存储介质
US8788477B1 (en) Identifying addresses and titles of authoritative web pages by analyzing search queries in query logs
WO2015081848A1 (zh) 社交化扩展搜索方法及相应的装置、系统
CN102541853A (zh) 一种利用浏览器地址栏获取应用信息的方法和装置
JP2010009315A (ja) 推薦店舗提示システム
CN105718578A (zh) 短链接生成方法及装置
CN107748772B (zh) 一种商标识别方法及装置
CN105354318A (zh) 一种文件查找方法及装置
CN105205647A (zh) 一种邮件管理的方法和装置
US20100161507A1 (en) Gps rating system
CN103365932A (zh) 一种网页搜索方法和装置
CN103793495A (zh) 应用信息检索方法及系统和应用信息获取方法及系统
US9760641B1 (en) Site quality score
US20130232139A1 (en) Electronic device and method for generating recommendation content

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant