CN109871478A - 网络搜索方法及装置 - Google Patents

网络搜索方法及装置 Download PDF

Info

Publication number
CN109871478A
CN109871478A CN201811579970.6A CN201811579970A CN109871478A CN 109871478 A CN109871478 A CN 109871478A CN 201811579970 A CN201811579970 A CN 201811579970A CN 109871478 A CN109871478 A CN 109871478A
Authority
CN
China
Prior art keywords
user
search
request
pseudo
search result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811579970.6A
Other languages
English (en)
Inventor
周俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811579970.6A priority Critical patent/CN109871478A/zh
Publication of CN109871478A publication Critical patent/CN109871478A/zh
Pending legal-status Critical Current

Links

Abstract

本公开提供一种用于网络搜索的方法,包括:基于用户搜索请求,生成至少一个伪搜索请求;将用户搜索请求和至少一个伪搜索请求发送给搜索引擎;以及将从搜索引擎接收的针对用户搜索请求的搜索结果提供给用户以供用户浏览,其中,针对用户搜索请求的搜索结果是基于用户搜索请求和第一用户数据获得的,第一用户数据包括针对用户历史搜索请求的搜索结果的用户响应数据以及针对历史伪搜索请求的搜索结果的伪用户响应数据,以及伪用户响应数据是通过对至少一个伪搜索请求的搜索结果执行响应操作而生成的。利用该方法,可以使得搜索引擎难以通过所捕获的搜索请求及对应的用户响应数据来推测出用户的真实身份,从而最大程度地保护用户隐私。

Description

网络搜索方法及装置
技术领域
本公开涉及网络搜索领域,具体地,涉及一种用于保护用户隐私的网络搜索方法及装置。
背景技术
搜索引擎能够提供便捷的网络信息检索服务。当用户想要在网络上获取信息时,用户可以通过终端设备上的浏览器来向搜索引擎发送搜索请求,搜索引擎基于该搜索请求获取搜索结果,然后返回给终端设备以提供给用户浏览。
发明内容
鉴于上述,本公开提供了一种用于保护用户隐私的网络搜索方法及装置。该网络搜索方法及装置通过在终端设备处将一些伪搜索请求混入用户真实搜索请求中发送给搜索引擎,并且在终端设备处生成针对用户真实搜索请求所对应的搜索结果的用户响应数据以及针对伪搜索请求的搜索结果的伪用户响应数据作为该用户的用户响应数据提供给搜索引擎,从而使得搜索引擎很难通过其所捕获的搜索请求及对应的用户响应数据来推测出用户的真实身份,从而最大程度上保护用户隐私。
根据本公开的一个方面,提供了一种用于网络搜索的方法,包括:基于用户搜索请求,生成至少一个伪搜索请求;将所述用户搜索请求和所生成的至少一个伪搜索请求发送给搜索引擎;从所述搜索引擎接收针对所述用户搜索请求的搜索结果以及针对所述至少一个伪搜索请求的搜索结果;以及将所述针对用户搜索请求的搜索结果提供给用户以供用户浏览。
可选地,在上述方面的一个示例中,所述方法还包括:响应于对所述针对所述用户搜索请求的搜索结果执行响应操作而生成用户响应数据;和/或响应于对所述针对所述至少一个伪搜索请求的搜索结果执行响应操作而生成伪用户响应数据。
可选地,在上述方面的一个示例中,所述用户响应数据包括针对用户搜索请求所对应的搜索结果的点击行为数据和/或浏览行为数据,以及所述伪用户响应数据包括针对至少一个伪搜索请求所对应的搜索结果的点击行为数据和/或浏览行为数据。
可选地,在上述方面的一个示例中,生成至少一个伪搜索请求可以包括:随机地生成所述至少一个伪搜索请求。
可选地,在上述方面的一个示例中,生成至少一个伪搜索请求可以包括:使用搜索请求生成模型来生成与所述用户搜索请求的相似度满足预定要求的至少一个伪搜索请求。
可选地,在上述方面的一个示例中,所述针对用户搜索请求的搜索结果是在所述搜索引擎处至少部分地基于第一用户数据排序后的搜索结果,所述第一用户数据包括以下中的至少一个:用户历史搜索请求、历史伪搜索请求、针对用户历史搜索请求的搜索结果的用户响应数据以及针对历史伪搜索请求的搜索结果的伪用户响应数据。
可选地,在上述方面的一个示例中,在将所述针对用户搜索请求的搜索结果提供给用户以供用户浏览之前,所述方法还包括:至少部分地基于第二用户数据来对所述针对用户搜索请求的搜索结果进行重排序,其中,所述第二用户数据至少包括用户历史搜索请求和针对对应的搜索结果的用户响应数据。
可选地,在上述方面的一个示例中,所述重新排序是使用机器学习模型来实现的。
可选地,在上述方面的一个示例中,所述针对用户搜索请求的搜索结果是在所述搜索引擎处至少部分地基于所述用户搜索请求和第一用户数据获得的,所述针对至少一个伪搜索请求的搜索结果是在所述搜索引擎处至少部分地基于对应的伪搜索请求和第一用户数据获得的,所述第一用户数据至少包括针对用户历史搜索请求的搜索结果的用户响应数据以及针对历史伪搜索请求的搜索结果的伪用户响应数据,以及所述伪用户响应数据是通过对所述针对所述至少一个伪搜索请求的搜索结果执行响应操作而生成的。
根据本公开的另一方面,提供一种用于网络搜索的装置,包括:伪搜索请求生成单元,被配置为基于用户搜索请求,生成至少一个伪搜索请求;搜索请求发送单元,被配置为将所述用户搜索请求和所生成的至少一个伪搜索请求发送给搜索引擎;搜索结果接收单元,被配置为从所述搜索引擎接收针对用户搜索请求的搜索结果以及针对所述至少一个伪搜索请求的搜索结果;搜索结果提供单元,被配置为将所述针对用户搜索请求的搜索结果提供给用户以供用户浏览。
可选地,在上述方面的一个示例中,所述装置还包括:用户响应数据生成单元,被配置为响应于对所述针对所述用户搜索请求的搜索结果执行响应操作而生成用户响应数据;和/或伪用户响应数据生成单元,被配置为响应于对所述针对所述至少一个伪搜索请求的搜索结果执行响应操作而生成伪用户响应数据。
可选地,在上述方面的一个示例中,所述用户响应数据包括针对用户搜索请求所对应的搜索结果的点击行为数据和/或浏览行为数据,以及所述伪用户响应数据包括针对至少一个伪搜索请求所对应的搜索结果的点击行为数据和/或浏览行为数据。
可选地,在上述方面的一个示例中,所述伪搜索请求生成单元被配置为:随机地生成所述至少一个伪搜索请求。
可选地,在上述方面的一个示例中,所述伪搜索请求生成单元被配置为:使用搜索请求生成模型生成与所述用户搜索请求的相似度满足预定要求的至少一个伪搜索请求。
可选地,在上述方面的一个示例中,所述针对用户搜索请求的搜索结果是在所述搜索引擎处至少部分地基于第一用户数据排序后的搜索结果,所述第一用户数据包括以下中的至少一个:用户历史搜索请求、历史伪搜索请求、针对用户历史搜索请求的搜索结果的用户响应数据以及针对历史伪搜索请求的搜索结果的伪用户响应数据。
可选地,在上述方面的一个示例中,所述装置还可以包括:重排序单元,被配置为在将所述针对用户搜索请求的搜索结果提供给用户以供用户浏览之前,至少部分地基于第二用户数据来对所述针对用户搜索请求的搜索结果进行重排序,其中,所述第二用户数据至少包括用户历史搜索请求和针对对应的搜索结果的用户响应数据。
根据本公开的另一方面,提供一种网络搜索系统,包括:终端设备,包括如上所述的用于网络搜索的装置;以及搜索引擎。
根据本公开的另一方面,提供一种计算设备,包括:至少一个处理器,以及与所述至少一个处理器耦合的存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的用于网络搜索的方法。
根据本公开的另一方面,提供一种非暂时性机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如上所述的用于网络搜索的方法。
利用本公开的网络搜索方法及装置,通过在终端设备处将一些伪搜索请求混入用户真实搜索请求中发送给搜索引擎,并且在终端设备处生成针对用户真实搜索请求所对应的搜索结果的用户响应数据以及针对伪搜索请求的搜索结果的伪用户响应数据作为该用户的用户响应数据提供给搜索引擎,从而使得搜索引擎很难通过其所捕获的搜索请求及对应的用户响应数据来推测出用户的真实身份,从而最大程度上保护用户隐私。
利用本公开的网络搜索方法及装置,通过随机地生成所述至少一个伪搜索请求,可以降低所生成的伪搜索请求与用户搜索请求之间的关联性,从而进一步混淆搜索引擎对用户个人隐私信息的捕获。
利用本公开的用网络搜索方法及装置,通过使用搜索请求生成模型来生成与所述用户搜索请求的相似度满足预定要求的至少一个伪搜索请求,可以使得所生成的伪搜索请求与用户搜索请求非常相似,从而避免搜索引擎通过各种鉴别手段排除伪搜索请求来能够推测出用户的真实身份。
利用本公开的网络搜索方法及装置,通过在将针对用户搜索请求的搜索结果提供给用户以供用户浏览之前,基于针对用户历史搜索请求的搜索结果的用户响应数据来对针对用户搜索请求的搜索结果进行重排序,从而能够消除由于搜索引擎是基于所捕获的针对用户搜索请求所对应的搜索结果的用户响应数据以及针对至少一个伪搜索请求所对应的搜索结果的伪用户响应数据来对搜索引擎所获取的针对用户搜索请求的搜索结果进行排序而导致的搜索结果排序不佳的影响。
附图说明
通过参照下面的附图,可以实现对于本公开内容的本质和优点的进一步理解。在附图中,类似组件或特征可以具有相同的附图标记。附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开的实施例,但并不构成对本公开的实施例的限制。在附图中:
图1是根据本公开的一个实施例的用于保护用户隐私的网络搜索方法的流程图;
图2是根据本公开的另一实施例的用于保护用户隐私的网络搜索方法的流程图;
图3是根据本公开的一个实施例的用于保护用户隐私的网络搜索系统的方框图;
图4是根据本公开的一个实施例的用于保护用户隐私的网络搜索装置的方框图;
图5是根据本公开的另一实施例的用于保护用户隐私的网络搜索装置的结构框图;
图6是根据本公开实施例的用于实现保护用户隐私的网络搜索的计算设备的框图。
具体实施方式
现有的搜索引擎(例如,谷歌、必应以及百度等搜索引擎)通常能够提供个性化搜索服务,它们跟踪、分析和利用所获取的用户个人信息和搜索行为来揣摩用户意图,然后基于该用户意图获取个性化搜索结果,从而为用户提供用户更关注的搜索结果。虽然搜索引擎中的个性化搜索服务能够为用户提供更符合用户意图的搜索结果,但是它也带来了很多用户隐私泄露和用户隐私跟踪等方面的问题。随着人们对互联网上的个人隐私问题越发关注,在网络搜索中如何保护个人隐私成为亟待解决的问题。
本公开提供了一种用于保护用户隐私的网络搜索方法及装置。该网络搜索方法及装置通过在终端设备处将一些伪搜索请求混入用户真实搜索请求中发送给搜索引擎,并且在终端设备处生成针对用户真实搜索请求所对应的搜索结果的用户响应数据以及针对伪搜索请求的搜索结果的伪用户响应数据作为该用户的用户响应数据提供给搜索引擎,从而使得搜索引擎很难通过其所捕获的搜索请求及对应的用户响应数据来推测出用户的真实身份,从而最大程度上保护用户隐私。
以下将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本公开内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。另外,相对一些示例所描述的特征在其它例子中也可以进行组合。
如本文中使用的,术语“包括”及其变型表示开放的术语,含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义,无论是明确的还是隐含的。除非上下文中明确地指明,否则一个术语的定义在整个说明书中是一致的。
现在结合附图来描述本公开的实施例的用于保护用户隐私的网络搜索方法及系统。
图1是根据本公开的一个实施例的用于保护用户隐私的网络搜索方法的流程图。
如图1所示,在块110,在终端设备处,接收用户搜索请求。在一个实施例中,当用户想要进行网络搜索时,在终端设备中打开搜索引擎客户端,比如,百度、谷歌等搜索引擎客户端,并在搜索引擎客户端中输入用户搜索请求。用户搜索请求的输入过程可以采用多种输入方式来实现,比如在搜索引擎客户端的搜索输入栏中输入用户搜索请求(即,文本输入方式),也可以采用语音输入的方式来输入用户搜索请求。
在接收到用户搜索请求后,在块120,在终端设备处,生成至少一个伪搜索请求。例如,在终端设备处,使用专门的伪搜索请求生成模块/装置来生成至少一个伪搜索请求。本公开所使用的术语“伪搜索请求”指的是终端设备处为了在搜索引擎处混淆针对用户搜索请求的用户身份识别而生成的假冒用户身份的搜索请求。相对于搜索引擎而言,伪搜索请求与用户搜索请求具有相同的用户ID、终端设备ID或者其他唯一标识符,从而使得当搜索引擎接收到用户搜索请求和伪搜索请求时,将用户搜索请求和伪搜索请求以及针对对应的搜索结果的响应行为(即,响应数据)视为相同用户行为数据,并将针对用户搜索请求和伪搜索请求的搜索结果的响应行为使用来获取对应的搜索结果以及对搜索结果进行排序。
在本公开的一个实施例中,生成至少一个伪搜索请求可以包括:随机地生成至少一个伪搜索请求。例如,随机地生成至少一个伪搜索请求可以包括:从查询关键词数据库中随机选择至少一个查询关键词来生成伪搜索请求。在一个实施例中,查询关键词数据库可以包括通过对用户历史搜索请求进行提取操作而获得的查询关键词。在另一实施例中,随机地生成至少一个伪搜索请求可以包括:使用语料库中的各种词语通过特定方式排列组合(包括随机排列或组合)而生成至少一个伪搜索请求。
在本公开的另一实施例中,生成至少一个伪搜索请求可以包括:使用搜索请求生成模型来生成与用户搜索请求的相似度满足预定要求的至少一个伪搜索请求。这里,相似度满足预定要求可以是相似度大于预定阈值。在本公开中,所述搜索请求生成模块例如可以是本领域中的任何适合的语句生成模型。如何使用搜索请求生成模型来生成与用户搜索请求的相似度满足预定要求的至少一个伪搜索请求,可以采用本领域中的任何适合的方式来生成。
需要指出的是,使用搜索请求生成模型来生成与用户搜索请求的相似度满足预定要求的至少一个伪搜索请求,使得所生成的伪搜索请求与用户的真实搜索请求非常相似,从而可以避免搜索引擎通过各种鉴别手段排除伪搜索请求而推测出用户的真实身份。例如,用户搜索请求是“杭州天气怎么样”,那么所生成的伪搜索请求可以是“深圳天气怎么样”、“北京天气怎么样”等等。当搜索引擎利用这些历史搜索请求来推测用户身份时就会被大量假信息干扰而无法做出正确推断,从而使得用户的个人隐私得以保护。
在块130,终端设备将所接收的用户搜索请求和所生成的至少一个伪搜索请求发送给搜索引擎。在搜索引擎接收到用户搜索请求和至少一个伪搜索请求后,在块140,搜索引擎至少部分地基于用户搜索请求和第一用户数据获取针对该用户搜索请求的搜索结果,并且至少部分地基于至少一个伪搜索请求中的各个伪搜索请求以及第一用户数据来获取对应的搜索结果。
在本公开的实施例中,第一用户数据是搜索引擎所捕获的与用户搜索相关的用户搜索行为数据。第一用户数据至少包括针对用户历史搜索请求的搜索结果的用户响应数据以及针对历史伪搜索请求的搜索结果的伪用户响应数据。在本公开中,用户响应数据包括针对用户搜索请求所对应的搜索结果的点击行为数据和/或浏览行为数据,以及伪用户响应数据包括针对至少一个伪搜索请求所对应的搜索结果的点击行为数据和/或浏览行为数据。在本公开的其它示例中,第一用户数据还可以包括其它用户数据,比如用于描述用户身份特性的用户画像数据等。用户画像数据例如可以包括用户账户信息、职业信息、设备使用习惯等个人信息。此外,在本公开的另一示例中,针对用户搜索请求的搜索结果可以是在搜索引擎处至少部分地基于第一用户数据进行排序后的搜索结果。针对至少一个伪搜索请求的搜索结果也可以是在搜索引擎处至少部分地基于第一用户数据进行排序后的搜索结果。
然后,在块150,搜索引擎将所获取的针对用户搜索请求的搜索结果以及针对至少一个伪搜索请求的搜索结果返回给终端设备。
在接收到针对用户搜索请求的搜索结果以及针对至少一个伪搜索请求的搜索结果后,在块160,终端设备将针对用户搜索请求的搜索结果提供给用户以供用户浏览。例如,用户可以在终端设备上安装的浏览器中查看搜索结果页面,搜索页面中包含针对用户搜索请求的搜索结果。在一个实施例中,搜索结果根据其先后顺序显示在搜索结果页面的不同位置。在一个实施例中,搜索结果页面可以分页,采用多个搜索结果页来呈现搜索结果,例如,首先显示第一页的搜索结果,在第一页中显示按照搜索结果顺序前若干条的搜索结果。在其他实施例中,可以采用任何适合的搜索结果展示方式来向用户提供针对用户搜索请求的搜索结果。需要说明的是,伪搜索请求的搜索结果通常不提供给用户浏览,以防止对用户进行干扰。
在一个实施例中,响应于对针对用户搜索请求的搜索结果执行响应操作而生成用户响应数据。具体地,用户获得搜索结果会进行点击和/或浏览行为等响应行为,这些响应行为会形成用户响应数据被搜索引擎收集。换言之,当用户在终端设备处点击和/或浏览搜索结果时,形成用户响应数据。
此外,在块170中,在终端设备处,对至少一个伪搜索请求所对应的搜索结果执行响应操作以生成针对至少一个伪搜索请求所对应的搜索结果的伪用户响应数据。也即,响应于对针对至少一个伪搜索请求的搜索结果执行响应操作而生成伪用户响应数据。所述伪用户响应数据至少包括针对至少一个伪搜索请求所对应的搜索结果的点击行为数据和/或浏览行为数据。例如,在一个实施例中,当在终端设备处接收到针对至少一个伪搜索请求的搜索结果后,可以采用机器模拟的方式来模拟用户点击行为或用户浏览行为。比如,模拟用户点击某个搜索结果并在进入该搜索结果后浏览其中的内容。在一个实施例中,可以在至少一个伪搜索请求的搜索结果列表中,随机选择搜索结果来模拟用户进行点击或浏览动作。与真实的用户响应数据同样地,这些伪用户响应数据也会被搜索引擎收集。
在一个实施例中,针对用户搜索请求的搜索结果是在搜索引擎处至少部分地基于第一用户数据排序后的搜索结果,第一用户数据包括以下中的至少一个:用户历史搜索请求、历史伪搜索请求、针对用户历史搜索请求的搜索结果的用户响应数据以及针对历史伪搜索请求的搜索结果的伪用户响应数据。
搜索引擎对用户搜索行为的捕获和记录是造成个人隐私泄漏的重要原因。即使搜索引擎无法直接获得个人隐私信息,也可以通过用户搜索行为利用人工智能的各种方法来推测用户的身份等特征,从而使得用户的隐私难以得到切实保护。利用本公开的网络搜索方法,由于搜索引擎会将所接收到的伪搜索请求及其对应的搜索行为(即,针对对应搜索结果的伪用户响应数据)也当作用户真实搜索请求和用户搜索行为,从而搜索引擎会基于用户搜索请求及对应的用户搜索行为和伪搜索请求及对应的搜索行为来推测用户身份,由此使得搜索引擎难以准确地推测到用户的真实身份,从而最大程度地保护用户隐私。
需要说明的是,上述各流程不是所有的步骤和单元都是必须的,可以根据实际的需要忽略某些步骤或单元或者对某些步骤或单元进行拆分。各步骤的执行顺序不是固定的,可以根据需要进行确定。例如,在一个实施例中,步骤160和步骤170的顺序可以互换。在另外的实施例中,步骤130或步骤150可以拆分为多个发送步骤或多个返回搜索结果的步骤。
图2是根据本公开的另一实施例的用于保护用户隐私的网络搜索方法的流程图。
如图2所示,在块210,在终端设备处,接收用户搜索请求。块210的操作可以参考上面参照图1描述的块110的操作。
在接收到用户搜索请求后,在块220,在终端设备处,生成至少一个伪搜索请求。块220的操作可以参考上面参照图1描述的块120的操作。
在块230,终端设备将所接收的用户搜索请求和所生成的至少一个伪搜索请求发送给搜索引擎。块230的操作可以参考上面参照图1描述的块130的操作。
在搜索引擎接收到用户搜索请求和至少一个伪搜索请求后,在块240,搜索引擎至少部分地基于用户搜索请求和第一用户数据获取针对该用户搜索请求的搜索结果,并且至少部分地基于至少一个伪搜索请求中的各个伪搜索请求以及第一用户数据来获取对应的搜索结果。然后,在块250,搜索引擎将所获取的针对用户搜索请求的搜索结果以及针对至少一个伪搜索请求的搜索结果返回给终端设备。块240的操作可以参考上面参照图1描述的块140的操作。块250的操作可以参考上面参照图1描述的块150的操作。
在接收到针对用户搜索请求的搜索结果以及针对至少一个伪搜索请求的搜索结果后,在块260,至少部分地基于第二用户数据来对针对用户搜索请求的搜索结果进行重排序。在本公开的一个示例中,第二用户数据至少包括用户历史搜索请求和针对对应的搜索结果的用户响应数据。用户响应数据包括针对搜索结果的点击行为数据和/或浏览行为数据。在另一示例中,第二用户数据还可以包括用户画像数据,比如,用户账户信息、职业信息、设备使用习惯等个人信息。在一个实施例中,所保存的第二用户数据可以使用加密方式进行加密,例如进行哈希处理,并且仅能够在用户的终端设备本地访问和使用,所以不会产生个人隐私泄露的风险。
在一个实施例中,所述重排序过程可以是使用机器学习模型(下文中称为重排序模型)来实现的,例如,使用深度学习模型来实现。在本公开中,重排序模型是使用搜索引擎所返回的搜索结果以及第二用户数据作为训练数据来训练的。如何进行重排序模型训练以及使用训练后的重排序模型来对搜索引擎所返回的搜索结果进行重排序,可以采用本领域中任何适合的方式来实现。
然后,在块270,终端设备将经过重排序后的搜索结果提供给用户以供用户浏览。此外,在块280中,在终端设备处,对至少一个伪搜索请求所对应的搜索结果执行响应操作以生成针对至少一个伪搜索请求所对应的搜索结果的伪用户响应数据。块280的操作可以参考上面参照图1描述的块170的操作。
需要指出的是,由于在搜索引擎处执行搜索结果获取时,搜索引擎会将所捕获的伪搜索请求以及对应的用户响应行为使用来对搜索引擎所返回的搜索结果进行排序,从而使得搜索引擎所返回的搜索结果的排序可能不是用户期望的排序结果。利用本实施例的网络搜索方法,通过在将针对用户搜索请求的搜索结果提供给用户以供用户浏览之前,至少部分地基于用户的真实响应行为数据(即,第二用户数据)来对针对用户搜索请求的搜索结果进行重排序,可以使得提供给用户的搜索结果的排序更加符合用户意图,由此改进搜索效果。此外,由于重排序是在终端设备处执行的,从而能够在获得较好的搜索效果的同时最大程度地保护用户个人隐私。
如上参照图1和图2对根据本公开的网络搜索方法进行描述。这里要说明的是,图1和图2示出的仅仅是根据本公开的网络搜索方法的一个实施例,在本公开的其它实施例中,还可以对图1和图2中示出的网络搜索方法进行修改。例如,在本公开的另一实施例中,所述网络搜索方法可以不包括图1中的块110的操作或者图2中的块210的操作。或者,所述网络搜索方法可以不可以包括图1中的块170的操作或者图2中的块280的操作。
图3是根据本公开的一个实施例的用于保护用户隐私的网络搜索系统1的方框图。如图3所示,网络搜索系统1包括终端设备10和搜索引擎20。
终端设备10具有用于网络搜索的装置400(下文中称为网络搜索装置400)。当终端设备10获取到用户搜索请求后,网络搜索请求装置400基于该用户搜索请求生成至少一个伪搜索请求,并将该用户搜索请求和所生成的至少一个伪搜索请求发送给搜索引擎20。
搜索引擎20被配置为至少部分地基于用户搜索请求和第一用户数据获取针对该用户搜索请求的搜索结果,并且至少部分地基于至少一个伪搜索请求中的各个伪搜索请求以及第一用户数据来获取对应的搜索结果。此外,搜索引擎20还被配置为将所获取的针对该用户搜索请求的搜索结果以及针对至少一个伪搜索请求的搜索结果发送给终端设备10。这里,第一用户数据是搜索引擎所捕获的与用户搜索相关的用户搜索行为数据。第一用户数据至少包括针对用户历史搜索请求的搜索结果的用户响应数据以及针对历史伪搜索请求的搜索结果的伪用户响应数据。在本公开中,用户响应数据包括针对用户搜索请求所对应的搜索结果的点击行为数据和/或浏览行为数据,以及伪用户响应数据包括针对至少一个伪搜索请求所对应的搜索结果的点击行为数据和/或浏览行为数据。在本公开的其它示例中,第一用户数据还可以包括其它用户数据,比如用于描述用户身份特性的用户画像数据等。用户画像数据例如可以包括用户账户信息、职业信息、设备使用习惯等个人信息。此外,在本公开的另一示例中,针对用户搜索请求的搜索结果可以是在搜索引擎处至少部分地基于第一用户数据进行排序后的搜索结果。针对至少一个伪搜索请求的搜索结果也可以是在搜索引擎处至少部分地基于第一用户数据进行排序后的搜索结果。
在从搜索引擎20接收到针对该用户搜索请求的搜索结果以及针对至少一个伪搜索请求的搜索结果后,终端设备10中的网络搜索装置400将针对该用户搜索请求的搜索结果提供给用户来进行浏览。此外,终端设备10中的网络搜索装置400还可以被配置为对针对至少一个伪搜索请求的搜索结果执行响应操作,以生成针对至少一个伪搜索请求所对应的搜索结果的伪用户响应数据。
图4是根据本公开的一个实施例的用于保护用户隐私的网络搜索装置400的方框图。如图4所示,网络搜索装置400包括伪搜索请求生成单元410、搜索请求发送单元420、搜索结果接收单元430、搜索结果提供单元440和伪用户响应数据生成单元450。
伪搜索请求生成单元410被配置为基于用户搜索请求,生成至少一个伪搜索请求。伪搜索请求生成单元410的操作可以参考上面参照图1描述的块120的操作。
搜索请求发送单元420被配置为将所述用户搜索请求和所生成的至少一个伪搜索请求发送给搜索引擎。搜索请求发送单元420的操作可以参考上面参照图1描述的块130的操作。
搜索结果接收单元430被配置为从搜索引擎接收针对用户搜索请求的搜索结果以及针对至少一个伪搜索请求的搜索结果。搜索结果接收单元430的操作可以参考上面参照图1描述的块150的操作。这里,针对用户搜索请求的搜索结果是在搜索引擎处至少部分地基于用户搜索请求和第一用户数据来获得的。针对至少一个伪搜索请求的搜索结果是在搜索引擎处至少部分地基于对应的伪搜索请求和第一用户数据来获得的。此外,第一用户数据至少包括针对用户历史搜索请求的搜索结果的用户响应数据以及针对历史伪搜索请求的搜索结果的伪用户响应数据。
搜索结果提供单元440被配置为将针对用户搜索请求的搜索结果提供给用户以供用户浏览。搜索结果提供单元440的操作可以参考上面参照图1描述的块160的操作。
伪用户响应数据生成单元450被配置为对响应于对所述针对所述至少一个伪搜索请求的搜索结果执行响应操作而生成伪用户响应数据。伪用户响应数据生成单元450的操作可以参考上面参照图1描述的块170的操作。
在另外的实施例中,网络搜索装置400还可以包括用户响应数据生成单元。用户响应数据生成单元被配置为响应于对所述针对所述用户搜索请求的搜索结果执行响应操作而生成用户响应数据。
图5是根据本公开的另一实施例的用于保护用户隐私的网络搜索装置500的结构框图。如图5所示,网络搜索装置500包括伪搜索请求生成单元510、搜索请求发送单元520、搜索结果接收单元530、搜索结果重排序单元540、搜索结果提供单元550和伪用户响应数据生成单元560。
伪搜索请求生成单元510被配置为基于用户搜索请求,生成至少一个伪搜索请求。伪搜索请求生成单元510的操作可以参考上面参照图2描述的块220的操作。
搜索请求发送单元520被配置为将用户搜索请求和所生成的至少一个伪搜索请求发送给搜索引擎。搜索请求发送单元520的操作可以参考上面参照图2描述的块230的操作。
搜索结果接收单元530被配置为从搜索引擎接收针对用户搜索请求的搜索结果以及针对至少一个伪搜索请求的搜索结果。搜索结果接收单元530的操作可以参考上面参照图2描述的块250的操作。
搜索结果重排序单元540被配置为至少部分地基于第二用户数据来对针对用户搜索请求的搜索结果进行重排序。这里,第二用户数据至少包括用户历史搜索请求和针对对应的搜索结果的用户响应数据。搜索结果重排序单元540的操作可以参考上面参照图2描述的块260的操作。
搜索结果提供单元550被配置为将针对用户搜索请求的搜索结果提供给用户以供用户浏览。搜索结果提供单元550的操作可以参考上面参照图2描述的块270的操作。
伪用户响应数据生成单元560被配置为对针对至少一个伪搜索请求的搜索结果执行响应操作,以生成针对至少一个伪搜索请求的搜索结果的响应数据。伪用户响应数据生成单元560的操作可以参考上面参照图2描述的块280的操作。
在另外的实施例中,网络搜索装置500还可以包括用户响应数据生成单元。用户响应数据生成单元被配置为响应于对所述针对所述用户搜索请求的搜索结果执行响应操作而生成用户响应数据。
在本公开的实施例中,所述针对用户搜索请求的搜索结果是在所述搜索引擎处至少部分地基于第一用户数据排序后的搜索结果,所述第一用户数据包括以下中的至少一个:用户历史搜索请求、历史伪搜索请求、针对用户历史搜索请求的搜索结果的用户响应数据以及针对历史伪搜索请求的搜索结果的伪用户响应数据。
如上参照图1到图5,对根据本公开的网络搜索方法及网络搜索装置的实施例进行了描述。上面的网络搜索装置可以采用硬件实现,也可以采用软件或者硬件和软件的组合来实现。
图6示出了根据本公开的实施例的用于网络搜索的计算设备600的硬件结构图。如图6所示,计算设备600可以包括至少一个处理器610、存储器620、内存630和通信接口640,并且至少一个处理器610、存储器620、内存630和通信接口640经由总线660连接在一起。至少一个处理器610执行在存储器620中存储或编码的至少一个计算机可读指令(即,上述以软件形式实现的元素)。
在一个实施例中,在存储器620中存储计算机可执行指令,其当执行时使得至少一个处理器610:基于用户搜索请求,生成至少一个伪搜索请求;将所述用户搜索请求和所生成的至少一个伪搜索请求发送给搜索引擎;从所述搜索引擎接收针对所述用户搜索请求的搜索结果以及针对所述至少一个伪搜索请求的搜索结果;以及将所述针对用户搜索请求的搜索结果提供给用户以供用户浏览,其中,所述针对用户搜索请求的搜索结果是在所述搜索引擎处至少部分地基于所述用户搜索请求和第一用户数据获得的,所述针对至少一个伪搜索请求的搜索结果是在所述搜索引擎处至少部分地基于对应的伪搜索请求和第一用户数据获得的,所述第一用户数据至少包括针对用户历史搜索请求的搜索结果的用户响应数据以及针对历史伪搜索请求的搜索结果的伪用户响应数据,以及所述伪用户响应数据是通过对所述针对所述至少一个伪搜索请求的搜索结果执行响应操作而生成的。
应该理解,在存储器620中存储的计算机可执行指令当执行时使得至少一个处理器610进行本公开的各个实施例中以上结合图1-5描述的各种操作和功能。
在本公开中,计算设备600可以包括但不限于:个人计算机、服务器计算机、工作站、桌面型计算机、膝上型计算机、笔记本计算机、移动计算设备、智能电话、平板计算机、蜂窝电话、个人数字助理(PDA)、手持装置、消息收发设备、可佩戴计算设备、消费电子设备等等。
根据一个实施例,提供了一种比如非暂时性机器可读介质的程序产品。非暂时性机器可读介质可以具有指令(即,上述以软件形式实现的元素),该指令当被机器执行时,使得机器执行本公开的各个实施例中以上结合图1-5描述的各种操作和功能。具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。
根据一个实施例,提供了一种比如非暂时性机器可读介质的程序产品。非暂时性机器可读介质可以具有指令(即,上述以软件形式实现的元素),该指令当被机器执行时,使得机器执行本公开的各个实施例中以上结合图1-5描述的各种操作和功能。具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。
在这种情况下,从可读介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此机器可读代码和存储机器可读代码的可读存储介质构成了本发明的一部分。
可读存储介质的实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD-RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上或云上下载程序代码。
本领域技术人员应当理解,上面公开的各个实施例可以在不偏离发明实质的情况下做出各种变形和修改。因此,本发明的保护范围应当由所附的权利要求书来限定。
需要说明的是,上述各流程和各系统结构图中不是所有的步骤和单元都是必须的,可以根据实际的需要忽略某些步骤或单元。各步骤的执行顺序不是固定的,可以根据需要进行确定。上述各实施例中描述的装置结构可以是物理结构,也可以是逻辑结构,即,有些单元可能由同一物理实体实现,或者,有些单元可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
以上各实施例中,硬件单元或模块可以通过机械方式或电气方式实现。例如,一个硬件单元、模块或处理器可以包括永久性专用的电路或逻辑(如专门的处理器,FPGA或ASIC)来完成相应操作。硬件单元或处理器还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器),可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或临时设置的电路)可以基于成本和时间上的考虑来确定。
上面结合附图阐述的具体实施方式描述了示例性实施例,但并不表示可以实现的或者落入权利要求书的保护范围的所有实施例。在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”,并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的,具体实施方式包括具体细节。然而,可以在没有这些具体细节的情况下实施这些技术。在一些实例中,为了避免对所描述的实施例的概念造成难以理解,公知的结构和装置以框图形式示出。
本公开内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本公开内容。对于本领域普通技术人员来说,对本公开内容进行的各种修改是显而易见的,并且,也可以在不脱离本公开内容的保护范围的情况下,将本文所定义的一般性原理应用于其它变型。因此,本公开内容并不限于本文所描述的示例和设计,而是与符合本文公开的原理和新颖性特征的最广范围相一致。

Claims (18)

1.一种用于网络搜索的方法,包括:
基于用户搜索请求,生成至少一个伪搜索请求;
将所述用户搜索请求和所生成的至少一个伪搜索请求发送给搜索引擎;
从所述搜索引擎接收针对所述用户搜索请求的搜索结果以及针对所述至少一个伪搜索请求的搜索结果;以及
将所述针对所述用户搜索请求的搜索结果提供给用户以供用户浏览。
2.如权利要求1所述的方法,还包括:
响应于对所述针对所述用户搜索请求的搜索结果执行响应操作而生成用户响应数据;和/或
响应于对所述针对所述至少一个伪搜索请求的搜索结果执行响应操作而生成伪用户响应数据。
3.如权利要求2所述的方法,其中,所述用户响应数据包括针对用户搜索请求所对应的搜索结果的点击行为数据和/或浏览行为数据,以及所述伪用户响应数据包括针对至少一个伪搜索请求所对应的搜索结果的点击行为数据和/或浏览行为数据。
4.如权利要求1到3中任一项所述的方法,其中,生成至少一个伪搜索请求包括:
随机地生成所述至少一个伪搜索请求。
5.如权利要求1到3中任一项所述的方法,其中,生成至少一个伪搜索请求包括:
使用搜索请求生成模型来生成与所述用户搜索请求的相似度满足预定要求的至少一个伪搜索请求。
6.如权利要求1到3中任一项所述的方法,其中,所述针对用户搜索请求的搜索结果是在所述搜索引擎处至少部分地基于第一用户数据排序后的搜索结果,所述第一用户数据包括以下中的至少一个:用户历史搜索请求、历史伪搜索请求、针对用户历史搜索请求的搜索结果的用户响应数据以及针对历史伪搜索请求的搜索结果的伪用户响应数据。
7.根据权利要求6所述的方法,在将所述针对用户搜索请求的搜索结果提供给用户以供用户浏览之前,所述方法还包括:
至少部分地基于第二用户数据来对所述针对用户搜索请求的搜索结果进行重排序,
其中,所述第二用户数据至少包括用户历史搜索请求和针对对应的搜索结果的用户响应数据。
8.根据权利要求7所述的方法,其中,所述重新排序是使用机器学习模型来实现的。
9.一种用于网络搜索的装置,包括:
伪搜索请求生成单元,被配置为基于用户搜索请求,生成至少一个伪搜索请求;
搜索请求发送单元,被配置为将所述用户搜索请求和所生成的至少一个伪搜索请求发送给搜索引擎;
搜索结果接收单元,被配置为从所述搜索引擎接收针对所述用户搜索请求的搜索结果以及针对所述至少一个伪搜索请求的搜索结果;以及
搜索结果提供单元,被配置为将所述针对所述用户搜索请求的搜索结果提供给用户以供用户浏览。
10.如权利要求9所述的装置,还包括:
用户响应数据生成单元,被配置为响应于对所述针对所述用户搜索请求的搜索结果执行响应操作而生成用户响应数据;和/或
伪用户响应数据生成单元,被配置为响应于对所述针对所述至少一个伪搜索请求的搜索结果执行响应操作而生成伪用户响应数据。
11.如权利要求10所述的装置,其中,所述用户响应数据包括针对用户搜索请求所对应的搜索结果的点击行为数据和/或浏览行为数据,以及所述伪用户响应数据包括针对至少一个伪搜索请求所对应的搜索结果的点击行为数据和/或浏览行为数据。
12.如权利要求9到11中任一所述的装置,其中,所述伪搜索请求生成单元被配置为:
随机地生成所述至少一个伪搜索请求。
13.如权利要求9到11中任一所述的装置,其中,所述伪搜索请求生成单元被配置为:
使用搜索请求生成模型生成与所述用户搜索请求的相似度满足预定要求的至少一个伪搜索请求。
14.如权利要求9到11中任一所述的装置,其中,所述针对用户搜索请求的搜索结果是在所述搜索引擎处至少部分地基于第一用户数据排序后的搜索结果,所述第一用户数据包括以下中的至少一个:用户历史搜索请求、历史伪搜索请求、针对用户历史搜索请求的搜索结果的用户响应数据以及针对历史伪搜索请求的搜索结果的伪用户响应数据。
15.根据权利要求14所述的装置,还包括:
重排序单元,被配置为在将所述针对用户搜索请求的搜索结果提供给用户以供用户浏览之前,至少部分地基于第二用户数据来对所述针对用户搜索请求的搜索结果进行重排序,
其中,所述第二用户数据至少包括用户历史搜索请求和针对对应的搜索结果的用户响应数据。
16.一种网络搜索系统,包括:
终端设备,包括如权利要求9到15中任一所述的装置;以及
搜索引擎。
17.一种计算设备,包括:
至少一个处理器,以及
与所述至少一个处理器耦合的存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如权利要求1到8中任一所述的方法。
18.一种非暂时性机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如权利要求1到8中任一所述的方法。
CN201811579970.6A 2018-12-24 2018-12-24 网络搜索方法及装置 Pending CN109871478A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811579970.6A CN109871478A (zh) 2018-12-24 2018-12-24 网络搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811579970.6A CN109871478A (zh) 2018-12-24 2018-12-24 网络搜索方法及装置

Publications (1)

Publication Number Publication Date
CN109871478A true CN109871478A (zh) 2019-06-11

Family

ID=66917232

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811579970.6A Pending CN109871478A (zh) 2018-12-24 2018-12-24 网络搜索方法及装置

Country Status (1)

Country Link
CN (1) CN109871478A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112214680A (zh) * 2020-10-21 2021-01-12 广州三星通信技术研究有限公司 模糊用户画像的方法及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104184742A (zh) * 2014-09-09 2014-12-03 西安电子科技大学 基于位置服务隐私保护的个性化双重隐身方法
CN104507048A (zh) * 2014-12-24 2015-04-08 福建师范大学 一种基于l-查询的位置隐私保护方法
CN107223253A (zh) * 2016-09-05 2017-09-29 华为技术有限公司 用于发送搜索请求的方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104184742A (zh) * 2014-09-09 2014-12-03 西安电子科技大学 基于位置服务隐私保护的个性化双重隐身方法
CN104507048A (zh) * 2014-12-24 2015-04-08 福建师范大学 一种基于l-查询的位置隐私保护方法
CN107223253A (zh) * 2016-09-05 2017-09-29 华为技术有限公司 用于发送搜索请求的方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112214680A (zh) * 2020-10-21 2021-01-12 广州三星通信技术研究有限公司 模糊用户画像的方法及设备

Similar Documents

Publication Publication Date Title
Zamani et al. Situational context for ranking in personal search
US10409874B2 (en) Search based on combining user relationship datauser relationship data
US9449271B2 (en) Classifying resources using a deep network
JP6487201B2 (ja) 推奨ページを生成するための方法及び装置
US8694493B2 (en) Computer-implemented search using result matching
US20180048595A1 (en) Email Personalization
EP2336905A1 (en) A searching method and system
EP1862916A1 (en) Indexing Documents for Information Retrieval based on additional feedback fields
JP2019507417A (ja) 多変数検索のためのユーザインターフェース
CN106933991A (zh) 一种面向智能终端的深度分析与用户画像系统及方法
CN109446302A (zh) 基于机器学习的问答数据处理方法、装置和计算机设备
US20180004844A1 (en) Method and system for presenting content summary of search results
US20140095308A1 (en) Advertisement distribution apparatus and advertisement distribution method
US9524320B2 (en) Collection and storage of a personalized, searchable, unstructured corpora
CN107885873A (zh) 用于输出信息的方法和装置
KR20150041592A (ko) 피호출자의 전자 디바이스에서 연락처 정보를 업데이트하는 방법 및 전자 디바이스
CN104090923A (zh) 一种浏览器中的富媒体信息的展示方法和装置
CN107977678A (zh) 用于输出信息的方法和装置
CN110737811A (zh) 应用分类方法、装置以及相关设备
CN107430609B (zh) 针对企业环境的浏览器新标签页的生成
CN109871478A (zh) 网络搜索方法及装置
CN110162712A (zh) 事件获取方法、装置、设备及存储介质
US11947618B2 (en) Identifying and storing relevant user content in a collection accessible to user in website subscribed to service
US20130282759A1 (en) Method and system for processing search queries
CN113961810A (zh) 新闻推送方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20201013

Address after: English genus

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: English genus

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20201013

Address after: English genus

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.