CN106777217A - 一种搜索词推荐方法及装置 - Google Patents

一种搜索词推荐方法及装置 Download PDF

Info

Publication number
CN106777217A
CN106777217A CN201611213479.2A CN201611213479A CN106777217A CN 106777217 A CN106777217 A CN 106777217A CN 201611213479 A CN201611213479 A CN 201611213479A CN 106777217 A CN106777217 A CN 106777217A
Authority
CN
China
Prior art keywords
word
search word
search
sensitive
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611213479.2A
Other languages
English (en)
Other versions
CN106777217B (zh
Inventor
彭睿棋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201611213479.2A priority Critical patent/CN106777217B/zh
Publication of CN106777217A publication Critical patent/CN106777217A/zh
Priority to PCT/CN2017/112215 priority patent/WO2018113468A1/zh
Application granted granted Critical
Publication of CN106777217B publication Critical patent/CN106777217B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种搜索词推荐方法及装置,涉及计算机技术领域,用于提高搜索词推荐的准确性,从而提高推荐搜索词的导出量。所述方法包括:获取用户预设行为对应的第一搜索词,从所述预设行为对应的第一搜索词中筛选出敏感搜索词,当接收到服务器发送的推荐搜索词时,根据所述敏感搜索词对所述推荐搜索词进行过滤,并展示过滤后的推荐搜索词。本发明主要用于搜索词的推荐。

Description

一种搜索词推荐方法及装置
技术领域
本发明涉及计算机技术领域,特别是涉及一种搜索词推荐方法及装置。
背景技术
当用户打开浏览器进入导航首页,并通过搜索引擎进行搜索时,为了方便用户的搜索,往往会在搜索框的下方设置个性化服务区域,例如,在搜索框下方插入用户经常输入的搜索词,来推荐用户选择输入,减少用户的输入成本。针对这一个性化服务区域,如果所推荐的搜索词不符合用户的体验,如推荐的关键词涉及到用户的隐私或敏感信息等,用户可以选择设置关闭个性化服务且不再展示推荐的关键词,从而使得导航首页的关闭率较高,导致该网站的搜索量的降低。
目前,对于上述用户设置关闭个性化服务区域的解决方法主要根据搜索引擎固定的词表进行过滤,将包含有固定规则的所有所搜词均不予展示,从而实现搜索词的推荐。
上述搜索词的推荐方法虽然能够过滤掉搜索词中部分敏感词,使得敏感词不在个性化服务器区域展示。然而,绝大多数敏感词都是没有共性,无法通过固定的词表规则进行过滤,使得展示推荐的搜索词不够准确,如果增加过多的过滤规则,还会导致大量正常的搜索词被过滤掉,无法保证推荐搜索词的覆盖率,降低了推荐搜索词的导出量。
发明内容
有鉴于此,本发明实施例提供一种搜索词推荐方法及装置,能够提高搜索词推荐的准确性,从而提高推荐搜索词的导出量。
为达到上述目的,本发明主要提供如下技术方案:
一方面,本发明实施例提供了一种搜索词推荐方法,该方法包括:
获取用户预设行为对应的第一搜索词;
从所述预设行为对应的第一搜索词中筛选出敏感搜索词;
当接收到服务器发送的推荐搜索词时,根据所述敏感搜索词对所述推荐搜索词进行过滤,并展示过滤后的推荐搜索词。
另一方面,本发明实施例还提供了一种搜索词推荐装置,该装置包括:
获取单元,用于获取用户预设行为对应的第一搜索词;
筛选单元,用于从所述预设行为对应的第一搜索词中筛选出敏感搜索词;
过滤单元,用于当接收到服务器发送的推荐搜索词时,根据所述敏感搜索词对所述推荐搜索词进行过滤,并展示过滤后的推荐搜索词。
本发明实施例提供的一种搜索词推荐方法及装置,首先获取用户预设行为对应的第一搜索词,这里的第一搜索词结合了用户在使用搜索引擎进行搜索的行为数据,挖掘到可能打扰用户的搜索词,然后从预设行为对应的第一搜索词中筛选出敏感搜索词,进一步将第一搜索词中可能涉及敏感信息的搜索词筛选出来作为敏感搜索词,当接收到服务器发送的推荐搜索词时,根据敏感搜索词对推荐搜索词进行过滤,并展示过滤后的推荐搜索词。与现有技术通过搜索引擎固定的词表进行过滤,从而进行推荐搜索词的方法相比,本发明实施例合理利用了用户预设行为对应的第一搜索词,将用户不希望被推荐的搜索词进行过滤,从而提高展示推荐搜索词的准确率,通过采用根据敏感搜索词对推荐搜索词进行过滤的方式,不会使得大量正常搜索词被滤掉,进而保证推荐搜索词的导出量从第一搜索词中筛选出来的敏感搜索词。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种搜索词推荐方法流程图;
图2示出了本发明实施例提供的一种搜索词的展示框图;
图3示出了本发明实施例提供的另一种搜索词推荐方法流程图;
图4示出了本发明实施例提供的一种搜索词推荐装置结构示意图;
图5示出了本发明实施例提供的另一种搜索词推荐装置结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供一种搜索词推荐方法,如图1所示,所述方法包括:
101、获取用户预设行为对应的第一搜索词。
由于用户在利用搜索引擎进行搜索时,为了方便用户的搜索,在搜索框的下方会出现若干个推荐搜索词,该推荐搜索搜词的形式可以为方便用户查询的搜索词列表、用户访问过得网站、通过协同过滤等一系列推荐模型筛选出的词表等,具体推荐搜索词的展示如图2所示。
其中,用户预设行为对应的第一搜索词通常为用户对不期望的推荐搜索词进行人为操作的搜索词,例如,可以为用户设置关闭个性化服务并且设置不再展示的推荐搜索词,还可以为用户设置删除的推荐搜索词,本发明实施例对预设行为对应的第一搜索词不进行限定,该预设行为对应的第一搜索词通常可以以搜索词对应的关闭率的形式体现,关闭率为该搜索词对应的关闭用户数与展示用户数的比值。
需要说明的是,这里的第一搜索词往往是用户不期望在搜索框下面展示的搜索词,通常情况下,该第一搜索词可以为一些涉及敏感信息、家庭隐私或者一些用户不喜欢看到的热门搜索词,例如对于图2中标注方框的词汇可能涉及一些用户不期望被别人看到的敏感词汇,如屁股、内裤等,一般用户会将这些搜索词删除或者设置关闭搜索推荐词的展示,然而这种行为数据可能会导致某些具有良好推荐效果的搜索词与敏感词汇同时被删除或者关闭,会降低良好推荐效果的搜索词的导出量,使得推荐的效果不理想。
对于本发明实施例,通过获取用户预设行为对应的第一搜索词,能够了解用户对推荐搜索词的喜好,对于用户所不希望展示的搜索关键词进一步进行过滤,从而提升用户的搜索体验。
102、从所述预设行为对应的第一搜索词中筛选出敏感搜索词。
由于预设行为对应的第一搜索词中可能包括有多个重复的搜索词,并且重复数量越高的搜索词说明用户越不期望在搜索框下面展示,重复数量越低的搜索词可能说明用户可能由于错误操作导致的关闭,当然对于搜索数量越高的搜索词即为用户不期望出现的搜索词。
对于本发明实施例可以将重复数量高于预设阈值的预设行为对应的第一搜索词作为敏感搜索词,例如设置预设阈值为50,对于预设行为对应的第一搜索词中包含有“性感”和“屁股”等搜索词,对于搜索词“性感”的重复数量为20,对于“屁股”的重复数量为70,因此,对于搜索词“性感”并非敏感搜索词,对于搜索词“屁股”则列为敏感搜索词。
为了进一步保证敏感搜索词的准确性,本发明实施例还可以结合大量用户点击推荐搜索词进入页面的行为数据来判断该敏感关键词是否为用户所不期望展示的,例如对于搜索词“屁股”,虽然通过重复数量设置的预置将其划分为敏感搜索词,当用户点击该搜索词进入页面的行为数据量较高时,需要对该搜索词是否为敏感搜索词进一步进行判断。
对于本发明实施例,通过从预设行为对应的第一搜索词中筛选出敏感搜索词,来进一步确认用户所不期望推荐的搜索词,对于用户不期望推荐的搜索词进行过滤,减少推荐搜索词对用户的打扰。
103、当接收到服务器发送的推荐搜索词时,根据所述敏感搜索词对所述推荐搜索词进行过滤,并展示过滤后的推荐搜索词。
其中,服务器发送的推荐搜索词为通常为基于用户搜索的行为数据所计算出的搜索词,例如用户浏览网页、用户通过搜索框点击的搜索词等,或者采用推荐算法得到的推荐搜索词。
对于本发明实施例,根据敏感搜索词对推荐搜索词进行过滤,并展示过滤后的推荐搜索词可以包括但不限制于下述实现方式,通过将敏感搜索词与推荐搜索词进行比对,将所推荐搜索词中包含有敏感搜索词的部分进行过滤,从而保留过滤后的推荐搜索词,并将过滤后的推荐搜索词展示至搜索框的下方。
现有技术中搜索引擎通常根据固定的词表对推荐搜索词进行过滤,将过滤后的推荐搜索词展示在搜索框的下发,然而,通过固定的词表对推荐搜索词进行过滤的方式通常会将部分敏感搜索词过滤掉,对于某些用户可能会点击搜索的搜索词可能也被过滤掉,使得推荐搜索词效果不理想,
本发明实施例提供的一种搜索词推荐方法,首先获取用户预设行为对应的第一搜索词,这里的第一搜索词结合了用户在使用搜索引擎进行搜索的行为数据,挖掘到可能打扰用户的搜索词,然后从预设行为对应的第一搜索词中筛选出敏感搜索词,进一步将第一搜索词中可能涉及敏感信息的搜索词筛选出来作为敏感搜索词,当接收到服务器发送的推荐搜索词时,根据敏感搜索词对推荐搜索词进行过滤,并展示过滤后的推荐搜索词。与现有技术通过搜索引擎固定的词表进行过滤,从而进行推荐搜索词的方法相比,本发明实施例合理利用了用户预设行为对应的第一搜索词,将用户不希望被推荐的搜索词进行过滤,从而提高展示推荐搜索词的准确率,通过采用根据敏感搜索词对推荐搜索词进行过滤的方式,不会使得大量正常搜索词被滤掉,进而保证推荐搜索词的导出量从第一搜索词中筛选出来的敏感搜索词。
为了保证敏感搜索词的准确性,进一步地,本发明实施例提供另一种搜索词推荐方法,如图3所示,所述方法包括:
201、根据用户搜索的历史行为数据,得到用户搜索常用词。
其中,用户搜索的历史行为数据可以包括用户通过搜索行为产生的搜索词、对应的页面网址、对应的时间信息等,这里用户搜索的历史行为数据可以记录在用户行为日志中,根据用户搜索的历史行为数据能够了解用户历史搜索数据,从而对用户历史搜索数据进行分析,将用户搜索行为频繁的搜索词作为用户搜索常用词。
示例性的,如果通过分析用户搜索的历史行为数据发现用户对地理比较偏爱,则将历史行为数据中与地理相关联的搜索词作为用户搜索常用词,如果通过分析用户搜索的历史行为数据发现用户搜索各种生活知识比较频繁,则将历史行为数据中关于生活知识的搜索词作为用户搜索常用词。
对于本发明实施例中用户搜索常用词是基于用户经常访问的网站,通过协同过滤等一些列推荐模型筛选出来的,并且作为推荐搜索词展示在搜索框下方的搜索词,能够从一定程度上方便用户的搜索操作。
202、根据用户对所述用户搜索常用词的历史行为数据,获取用户预设行为对应的第一搜索词。
由于用户搜索常用词可以通过设置不进行展示,对于不进行展示的用户搜索常用词为用户不期望被展示的,进一步获取用户对用户常用搜索词的历史行为数据,如对用户常用搜索词设置为不展示的操作,对用户常用搜索词设置删除的操作,或者对用户常用搜索词设置隐藏的操作,根据用户对搜索词的历史行为数据,进一步获取用户预设行为对应的第一搜索词,这里的预设行为通常是用户对用户常用搜索词不喜欢的行为,本发明实施例对预设行为的表现形式不进行限定。
例如,用户在通过搜索引擎进行搜索时设置关闭所有用户常用搜索词,则说明用户对展示的常用搜索词不是很满意,或者用户通过搜索引擎进行搜索时设置删除某个常用搜索词,则说明用户对展示的个别常用搜索词不是很满意。
203、记录所述预设行为对应的第一搜索词的重复率。
由于预设行为对应的第一搜索词种可能包含多个相同的搜索词,对于相同的搜索词则说明用户在进行搜索的过程中对该搜索词的偏好较差,可以推断为用户不期望展示的搜索词,如果重复率越高,则说明用户对该搜索词的偏好越差,进一步记录第一搜索词中的每个搜索词的重复率。
204、将所述预设行为对应的第一搜索词中重复率高于预设阈值的第二搜索词作为敏感搜索词。
对于本发明实施例,根据记录第一搜索词中每个搜索词的重复率,进一步对第一搜索词中的搜索词进行过滤,过滤掉用户可能由于错误操作而被划分到第一搜索词中的搜索词,对于重复率高于预设预置的第二数据,则为用户在搜索过程中不点击,甚至不期望展示的搜索词,需要说明的是,本发明实施例对预设阈值不进行限定,可根据实际需求进行设置。
205、将所述第二搜索词与热门搜索词进行对比,将对比重合的第二搜索词作为敏感搜索词。
为了提高获取敏感搜索词的准确性,由于用户预设行为的第一搜索数据中可能包含了近期比较热门搜索词,如大多数用户近期都搜索了的热播剧:锦绣未央、鬼吹灯等,进一步将第二搜索词与热门搜索词进行对比,从而将比对重合的第二搜索词作为敏感搜索词。
本发明实施例通过将第二搜索词与热门搜索词进行对比,将对比重合的第二搜索词作为敏感搜索词,合理的利用了用户预设行为的热门搜索词,进一步判断用户对搜索词的偏好程度,从而避免了推荐敏感搜索词对用户的影响,使得用户通过推荐搜索词能获取满意的搜索结果。
206、当接收到服务器发送的推荐搜索词时,根据所述敏感搜索词对所述推荐搜索词进行过滤,并展示过滤后的推荐搜索词。
对于本发明实施例,根据敏感搜索词对推荐搜索词进行过滤,并展示过滤后的推荐搜索词,具体可以通过判断推荐搜索词中是否包含敏感搜索词,如推荐搜索词为性感美腿,而敏感搜索词中包括性感,则判断推荐搜索词中包含敏感搜索词,进一步则将推荐搜索词中的敏感搜索词进行过滤,展示过滤后的推荐搜索词,如过滤后的推荐搜索词为美腿,若判断推荐搜索词中不包含敏感搜索词,则不进行过滤,并且展示推荐搜索词。
207、根据所述敏感搜索词的重复率计算所述敏感搜索词的敏感度。
由于不同敏感搜索词的重复率与用于对该敏感搜索词的偏好程度不同,根据敏感搜索词的重复率能够计算该敏感搜索词的敏感度,该敏感度可作为考核敏感搜索词的依据,对于敏感程度较低的敏感搜索词,随着用户搜索量的增加,当敏感搜索词的数量增多时,可能考虑将其排除敏感搜索词,作为普通过得搜索词。
208、将所述敏感搜索词按照敏感度进行排序,根据排序后的敏感搜索词建立敏感词库。
这里的敏感词库中记载的敏感搜索词绝大多数为用户不期望看到的搜索词,针对用户常搜词中用户关闭搜索词的交集,记录每个用户常搜词的敏感度,从而根据敏感度排名建立敏感词库,例如对于敏感词库中敏感搜索词的敏感度排名从高到底排列如下表1所示,
表1
搜索词
丝袜美腿
快刀切小内裤
打屁股
从表1中可以看出搜索词“丝袜美腿”的敏感度最高,说明用户对该搜索词关闭率相对较高,搜索词“大屁股”的敏感度最低,说明用户对该搜索词的关闭率相对较低。
本发明实施例对于无法通过任何固定词表挖掘的搜索词,通过建立敏感词库进一步对推荐搜索词进行过滤,当推荐搜索词中包含敏感词库中的敏感搜索词,则直接将包含有敏感搜索词的部分直接过滤,方便对搜索推荐词的处理。
209、按照预置时间间隔更新所述敏感词库中的敏感搜索词。
对于本发明实施例,按照预置时间间隔更新敏感词库中的敏感搜索词具体可以包括但不局限于下述实现方式,根据敏感词库中敏感搜索词的敏感度更新敏感词库,具体可以通过将敏感词库中敏感度较高的敏感搜索词保留敏感词库,通过将敏感词库中敏感度较低的敏感搜索词从敏感词库中删除。
另外,对于用户常搜词中用户关闭的搜索词可能包含近期热门搜索词的情况,还可以结合热门搜索词来增加敏感词库中的敏感搜索词,例如对最近某条热门微博或者某个热门电影,可以通过大量用户近期的搜索情况来确认是否将该热门搜索词添加到敏感词库中。
对于本发明实施例,具体的应用场景可以如下所示,但不局限于此,包括:首先获根据用户历史搜索词的数量筛选出排名靠前的搜索词,将排名靠前的搜索词通过推荐模型过滤掉一些非法的敏感词汇后,保留若干搜索词作为用户常搜词,以便在搜索引擎的搜索框下方进行展示,为了确认用户常搜词是否符合用户的期望,进一步根据对常搜词关闭操作的历史行为数据,获取关闭操作对应的第一搜索词,该第一搜索词通常为用户不期望展示的搜索词,然后为了继续从第一搜索词中进行筛选,记录关闭操作对应的第一搜索词的重复率,对于重复率高于30%的第二搜索词作为敏感搜索词,为了提高敏感搜索词的准确性,由于用户关闭操作中可能有大量的热门搜索,还可以结合当前热门搜索将热门搜索中的搜索词添加到敏感搜索词中,这里的敏感搜索词根据重复率值可以有排名,还可以根据敏感搜索词建立词库或者词表,以方便查看,当然还可以根据敏感搜索词的敏感度对敏感词库或者词表中的敏感搜索词进行更新,将敏感词库中敏感度较低的敏感搜索词删除,保留敏感度较高的敏感搜索词,同时将热门搜索中关闭率较高的搜索词添加到敏感词库,最后根据敏感搜索词对用户常搜词进行对比,将常搜词中包含的敏感搜索词进行过滤,从而当用户在点开360搜索引擎进行搜索时,将过滤后的常搜词展示在搜索框的下方。
本发明实施例的另一种搜索词推荐方法,能够合理利用用户在搜索过程中关闭或者删除的搜索词,从而挖掘可能打扰到用户或者涉及个人隐私、敏感信息的搜索词,进一步对敏感搜索词进行过滤,从而将过滤后的搜索词作为推荐搜索词展示给用户,能够提高用户对搜索词的点击率,让用户搜索到满意的结果。
为了实现上述方法实施例,本实施例提供一种与上述方法实施例对应的装置实施例,如图4所示,其示出了一种搜索词推荐装置,该装置可以包括:
获取单元31,可以用于获取用户预设行为对应的第一搜索词,该获取单元31为一种搜索词推荐装置中用于获取用户预设行为对应的第一搜索词的主要功能模块,其中,该预设行为对应的第一搜索词通常可以以搜索词对应的关闭率的形式体现,这里的第一搜索词可以为一些涉及敏感信息、家庭隐私或者一些用户不喜欢看到的热门搜索词;
筛选单元32,可以用于从所述预设行为对应的第一搜索词中筛选出敏感搜索词,该筛选单元32为一种搜索词推荐装置中用于筛选敏感搜索词的主要功能模块,可以将重复数量高于预设阈值的预设行为对应的第一搜索词作为敏感搜索词,还可以进一步结合大量用户点击推荐搜索词进入页面的行为数据对应的搜索词作为敏感搜索词;
过滤单元33,可以用于当接收到服务器发送的推荐搜索词时,根据所述敏感搜索词对所述推荐搜索词进行过滤,并展示过滤后的推荐搜索词,该过滤单元33为一种搜索词推荐装置中用于过滤推荐搜索词的主要功能模块,具体可以通过将敏感搜索词与推荐搜索词进行比对,将所推荐搜索词中包含有敏感搜索词的部分进行过滤,从而保留过滤后的推荐搜索词。
本发明实施例提供的一种搜索词推荐装置,首先获取用户预设行为对应的第一搜索词,这里的第一搜索词结合了用户在使用搜索引擎进行搜索的行为数据,挖掘到可能打扰用户的搜索词,然后从预设行为对应的第一搜索词中筛选出敏感搜索词,进一步将第一搜索词中可能涉及敏感信息的搜索词筛选出来作为敏感搜索词,当接收到服务器发送的推荐搜索词时,根据敏感搜索词对推荐搜索词进行过滤,并展示过滤后的推荐搜索词。与现有技术通过搜索引擎固定的词表进行过滤,从而进行推荐搜索词的方法相比,本发明实施例合理利用了用户预设行为对应的第一搜索词,将用户不希望被推荐的搜索词进行过滤,从而提高展示推荐搜索词的准确率,通过采用根据敏感搜索词对推荐搜索词进行过滤的方式,不会使得大量正常搜索词被滤掉,进而保证推荐搜索词的导出量从第一搜索词中筛选出来的敏感搜索词。
进一步地,如图5所示,本发明实施例提供了另一种搜索词推荐装置,所述装置还包括:
比对单元34,可以用于将所述第二搜索词与热门搜索词进行对比,将对比重合的第二搜索词作为敏感搜索词,该对比单元34为一种搜索词推荐装置中用于根据对比第二搜索词与热门搜索词中重合的搜索词作为敏感搜索词的主要功能模块,合理的利用了用户预设行为的热门搜索词,进一步判断用户对搜索词的偏好程度;
计算单元35,可以用于根据所述敏感搜索词的重复率计算所述敏感搜索词的敏感度,该计算单元35为一种搜索词推荐装置中用于计算敏感搜索词敏感度的主要功能模块;
建立单元36,可以用于将所述敏感搜索词按照敏感度进行排序,根据排序后的敏感搜索词建立敏感词库,该建立单元36为一种搜索词推荐装置中用于建立敏感词库的主要功能模块,具体将筛选后的敏感搜索词放置于敏感词库或中,从而方便后续查找;
更新单元37,可以用于按照预置时间间隔更新所述敏感词库中的敏感搜索词,该更新单元37为一种搜索词推荐装置中用于更新敏感词库的主要功能模块,具体可以根据敏感词库中敏感搜索词的敏感度更新敏感词库,,还可以结合热门搜索词来增加敏感词库中的敏感搜索词。
进一步地,所述获取单元31包括:
第一获取模块311,可以用于根据用户搜索的历史行为数据,得到用户搜索常用词;
第二获取模块312,可以用于根据用户对所述用户搜索常用词的历史行为数据,获取用户预设行为对应的第一搜索词。
进一步地,所述筛选单元32包括:
记录模块321,可以用于记录所述预设行为对应的第一搜索词的重复率;
筛选模块322,可以用于将所述预设行为对应的第一搜索词中重复率高于预设阈值的第二搜索次作为为敏感搜索词。
进一步地,所述过滤单元33包括:
判断模块331,可以用于判断所述推荐搜索词中是否包含所述敏感搜索词;
第一展示模块332,可以用于若所述推荐搜索词中包含所述敏感搜索词,则将所述推荐搜索词中的敏感搜索词进行过滤,展示过滤后的推荐搜索词;
第二展示模块333,可以用于若所述推荐搜索词中不包含所述敏感搜索词,展示所述搜索关键词。
进一步地,所述更新单元37,具体可以用于按照预置时间间隔将所述敏感词库中敏感度排名靠后的敏感搜索词进行删除。
本发明实施例的另一种搜索词推荐装置,能够合理利用用户在搜索过程中关闭或者删除的搜索词,从而挖掘可能打扰到用户或者涉及个人隐私、敏感信息的搜索词,进一步对敏感搜索词进行过滤,从而将过滤后的搜索词作为推荐搜索词展示给用户,能够提高用户对搜索词的点击率,让用户搜索到满意的结果。
本发明公开了A1、一种搜索词推荐方法,包括:
获取用户预设行为对应的第一搜索词;
从所述预设行为对应的第一搜索词中筛选出敏感搜索词;
当接收到服务器发送的推荐搜索词时,根据所述敏感搜索词对所述推荐搜索词进行过滤,并展示过滤后的推荐搜索词。
A2、如A1所述的方法,所述获取用户预设行为对应的第一搜索词包括:
根据用户搜索的历史行为数据,得到用户搜索常用词;
根据用户对所述用户搜索常用词的历史行为数据,获取用户预设行为对应的第一搜索词。
A3、如A1所述的方法,所述从所述预设行为对应的第一搜索词中筛选出敏感搜索词包括:
记录所述预设行为对应的第一搜索词的重复率;
将所述预设行为对应的第一搜索词中重复率高于预设阈值的第二搜索词作为敏感搜索词。
A4、如A3所述的方法,所述方法还包括:
将所述第二搜索词与热门搜索词进行对比,将对比重合的第二搜索词作为敏感搜索词。
A5、如A1所述的方法,所述根据所述敏感搜索词对所述推荐搜索词进行过滤,并展示过滤后的推荐搜索词包括:
判断所述推荐搜索词中是否包含所述敏感搜索词;
若是,则将所述推荐搜索词中的敏感搜索词进行过滤,展示过滤后的推荐搜索词;
否则,展示所述推荐搜索词。
A6、如A1所述的方法,在所述从所述预设行为对应的第一搜索词中筛选出敏感搜索词之后,所述方法还包括:
根据所述敏感搜索词的重复率计算所述敏感搜索词的敏感度。
A7、如A1-A6中任一项所述的方法,所述方法还包括:
将所述敏感搜索词按照敏感度进行排序,根据排序后的敏感搜索词建立敏感词库;
按照预置时间间隔更新所述敏感词库中的敏感搜索词。
A8、如A7所述的方法,所述按照预置时间间隔更新所述敏感词库中的敏感搜索词包括:
按照预置时间间隔将所述敏感词库中敏感度排名靠后的敏感搜索词进行删除。
B9、一种搜索词推荐装置,包括:
获取单元,用于获取用户预设行为对应的第一搜索词;
筛选单元,用于从所述预设行为对应的第一搜索词中筛选出敏感搜索词;
过滤单元,用于当接收到服务器发送的推荐搜索词时,根据所述敏感搜索词对所述推荐搜索词进行过滤,并展示过滤后的推荐搜索词。
B10、如B9所述的装置,所述获取单元包括:
第一获取模块,用于根据用户搜索的历史行为数据,得到用户搜索常用词;
第二获取模块,用于根据用户对所述用户搜索常用词的历史行为数据,获取用户预设行为对应的第一搜索词。
B11、如B9所述的装置,所述筛选单元包括:
记录模块,用于记录所述预设行为对应的第一搜索词的重复率;
筛选模块,用于将所述预设行为对应的第一搜索词中重复率高于预设阈值的第二搜索词作为敏感搜索词。
B12、如B11所述的装置,所述装置还包括:
比对单元,用于将所述第二搜索词与热门搜索词进行对比,将对比重合的第二搜索词作为敏感搜索词。
B13、如B9所述的装置,所述过滤单元包括:
判断模块,用于判断所述推荐搜索词中是否包含所述敏感搜索词;
第一展示模块,用于若所述推荐搜索词中包含所述敏感搜索词,则将所述推荐搜索词中的敏感搜索词进行过滤,展示过滤后的推荐搜索词;
第二展示模块,用于若所述推荐搜索词中不包含所述敏感搜索词,展示所述推荐搜索词。
B14、如B9所述的装置,所述装置还包括:
计算单元,用于根据所述敏感搜索词的重复率计算所述敏感搜索词的敏感度。
B15、如B9-B14中任一项所述的装置,所述装置还包括:
建立单元,用于将所述敏感搜索词按照敏感度进行排序,根据排序后的敏感搜索词建立敏感词库;
更新单元,用于按照预置时间间隔更新所述敏感词库中的敏感搜索词。
B16、如B15所述的装置,
所述更新单元,具体用于按照预置时间间隔将所述敏感词库中敏感度排名靠后的敏感搜索词进行删除。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
可以理解的是,上述方法及装置中的相关特征可以相互参考。另外,上述实施例中的“第一”、“第二”等是用于区分各实施例,而并不代表各实施例的优劣。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一种数据存储的方法及装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种搜索词推荐方法,其特征在于,包括:
获取用户预设行为对应的第一搜索词;
从所述预设行为对应的第一搜索词中筛选出敏感搜索词;
当接收到服务器发送的推荐搜索词时,根据所述敏感搜索词对所述推荐搜索词进行过滤,并展示过滤后的推荐搜索词。
2.根据权利要求1所述的方法,其特征在于,所述获取用户预设行为对应的第一搜索词包括:
根据用户搜索的历史行为数据,得到用户搜索常用词;
根据用户对所述用户搜索常用词的历史行为数据,获取用户预设行为对应的第一搜索词。
3.根据权利要求1所述的方法,其特征在于,所述从所述预设行为对应的第一搜索词中筛选出敏感搜索词包括:
记录所述预设行为对应的第一搜索词的重复率;
将所述预设行为对应的第一搜索词中重复率高于预设阈值的第二搜索词作为敏感搜索词。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
将所述第二搜索词与热门搜索词进行对比,将对比重合的第二搜索词作为敏感搜索词。
5.根据权利要求1所述的方法,其特征在于,所述根据所述敏感搜索词对所述推荐搜索词进行过滤,并展示过滤后的推荐搜索词包括:
判断所述推荐搜索词中是否包含所述敏感搜索词;
若是,则将所述推荐搜索词中的敏感搜索词进行过滤,展示过滤后的推荐搜索词;
否则,展示所述推荐搜索词。
6.根据权利要求1所述的方法,其特征在于,在所述从所述预设行为对应的第一搜索词中筛选出敏感搜索词之后,所述方法还包括:
根据所述敏感搜索词的重复率计算所述敏感搜索词的敏感度。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述方法还包括:
将所述敏感搜索词按照敏感度进行排序,根据排序后的敏感搜索词建立敏感词库;
按照预置时间间隔更新所述敏感词库中的敏感搜索词。
8.根据权利要求7所述的方法,其特征在于,所述按照预置时间间隔更新所述敏感词库中的敏感搜索词包括:
按照预置时间间隔将所述敏感词库中敏感度排名靠后的敏感搜索词进行删除。
9.一种搜索词推荐装置,其特征在于,包括:
获取单元,用于获取用户预设行为对应的第一搜索词;
筛选单元,用于从所述预设行为对应的第一搜索词中筛选出敏感搜索词;
过滤单元,用于当接收到服务器发送的推荐搜索词时,根据所述敏感搜索词对所述推荐搜索词进行过滤,并展示过滤后的推荐搜索词。
10.根据权利要求9所述的装置,其特征在于,所述获取单元包括:
第一获取模块,用于根据用户搜索的历史行为数据,得到用户搜索常用词;
第二获取模块,用于根据用户对所述用户搜索常用词的历史行为数据,获取用户预设行为对应的第一搜索词。
CN201611213479.2A 2016-12-23 2016-12-23 一种搜索词推荐方法及装置 Active CN106777217B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201611213479.2A CN106777217B (zh) 2016-12-23 2016-12-23 一种搜索词推荐方法及装置
PCT/CN2017/112215 WO2018113468A1 (zh) 2016-12-23 2017-11-22 搜索词推荐方法、装置、程序及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611213479.2A CN106777217B (zh) 2016-12-23 2016-12-23 一种搜索词推荐方法及装置

Publications (2)

Publication Number Publication Date
CN106777217A true CN106777217A (zh) 2017-05-31
CN106777217B CN106777217B (zh) 2020-10-30

Family

ID=58920876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611213479.2A Active CN106777217B (zh) 2016-12-23 2016-12-23 一种搜索词推荐方法及装置

Country Status (2)

Country Link
CN (1) CN106777217B (zh)
WO (1) WO2018113468A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220306A (zh) * 2017-05-10 2017-09-29 百度在线网络技术(北京)有限公司 一种搜索方法和装置
CN108197243A (zh) * 2017-12-29 2018-06-22 北京奇虎科技有限公司 一种基于用户身份的输入联想推荐方法及装置
WO2018113468A1 (zh) * 2016-12-23 2018-06-28 北京奇虎科技有限公司 搜索词推荐方法、装置、程序及介质
CN109189990A (zh) * 2018-07-25 2019-01-11 北京奇艺世纪科技有限公司 一种搜索词的生成方法、装置及电子设备
CN111723280A (zh) * 2019-03-20 2020-09-29 北京字节跳动网络技术有限公司 信息的处理方法、装置、存储介质及电子设备
CN113761170A (zh) * 2020-09-15 2021-12-07 北京沃东天骏信息技术有限公司 更新语料库的方法和装置
WO2024139834A1 (zh) * 2022-12-29 2024-07-04 北京字跳网络技术有限公司 一种搜索词确定方法、装置、计算机设备及存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109858344A (zh) * 2018-12-24 2019-06-07 深圳市珍爱捷云信息技术有限公司 婚恋对象推荐方法、装置、计算机设备及存储介质
CN111080339B (zh) * 2019-11-18 2024-01-30 口口相传(北京)网络技术有限公司 基于场景的类目偏好数据生成方法及装置
CN111611491A (zh) * 2020-05-25 2020-09-01 深圳前海微众银行股份有限公司 搜索词推荐方法、装置、设备及可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140379745A1 (en) * 2010-12-31 2014-12-25 Alibaba Group Holding Limited Recommendation of search keywords based on indication of user intention
CN104572889A (zh) * 2014-12-24 2015-04-29 深圳市腾讯计算机系统有限公司 一种搜索词推荐方法、装置和系统
CN104933081A (zh) * 2014-03-21 2015-09-23 阿里巴巴集团控股有限公司 一种搜索建议提供方法及装置
CN105069168A (zh) * 2015-08-28 2015-11-18 百度在线网络技术(北京)有限公司 搜索词推荐方法和装置
CN105956149A (zh) * 2016-05-12 2016-09-21 北京奇艺世纪科技有限公司 默认搜索词的推荐方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294814A (zh) * 2013-06-07 2013-09-11 百度在线网络技术(北京)有限公司 搜索结果推荐方法、系统和搜索引擎
CN106777217B (zh) * 2016-12-23 2020-10-30 北京奇虎科技有限公司 一种搜索词推荐方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140379745A1 (en) * 2010-12-31 2014-12-25 Alibaba Group Holding Limited Recommendation of search keywords based on indication of user intention
CN104933081A (zh) * 2014-03-21 2015-09-23 阿里巴巴集团控股有限公司 一种搜索建议提供方法及装置
CN104572889A (zh) * 2014-12-24 2015-04-29 深圳市腾讯计算机系统有限公司 一种搜索词推荐方法、装置和系统
CN105069168A (zh) * 2015-08-28 2015-11-18 百度在线网络技术(北京)有限公司 搜索词推荐方法和装置
CN105956149A (zh) * 2016-05-12 2016-09-21 北京奇艺世纪科技有限公司 默认搜索词的推荐方法和装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018113468A1 (zh) * 2016-12-23 2018-06-28 北京奇虎科技有限公司 搜索词推荐方法、装置、程序及介质
CN107220306A (zh) * 2017-05-10 2017-09-29 百度在线网络技术(北京)有限公司 一种搜索方法和装置
CN107220306B (zh) * 2017-05-10 2021-09-28 百度在线网络技术(北京)有限公司 一种搜索方法和装置
CN108197243A (zh) * 2017-12-29 2018-06-22 北京奇虎科技有限公司 一种基于用户身份的输入联想推荐方法及装置
CN109189990A (zh) * 2018-07-25 2019-01-11 北京奇艺世纪科技有限公司 一种搜索词的生成方法、装置及电子设备
CN111723280A (zh) * 2019-03-20 2020-09-29 北京字节跳动网络技术有限公司 信息的处理方法、装置、存储介质及电子设备
CN111723280B (zh) * 2019-03-20 2023-06-16 北京字节跳动网络技术有限公司 信息的处理方法、装置、存储介质及电子设备
CN113761170A (zh) * 2020-09-15 2021-12-07 北京沃东天骏信息技术有限公司 更新语料库的方法和装置
WO2024139834A1 (zh) * 2022-12-29 2024-07-04 北京字跳网络技术有限公司 一种搜索词确定方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN106777217B (zh) 2020-10-30
WO2018113468A1 (zh) 2018-06-28

Similar Documents

Publication Publication Date Title
CN106777217A (zh) 一种搜索词推荐方法及装置
KR101130505B1 (ko) 검색 결과 관련성의 자동화된 최적화를 위한 시스템 및방법
US9147000B2 (en) Method and system for recommending websites
US7487144B2 (en) Inline search results from user-created search verticals
US8494897B1 (en) Inferring profiles of network users and the resources they access
CN102930057B (zh) 搜索实现方法和装置
CN103870461B (zh) 主题推荐方法、装置和服务器
CN102930058B (zh) 一种在浏览器的地址栏中实现搜索的方法和装置
US10229160B2 (en) Search results based on a search history
US20120233173A1 (en) Determining preferred categories based on user access attribute values
CN103412881B (zh) 提供搜索结果的方法及系统
CN103366002B (zh) 个性化垂直搜索方法及装置
CN106682925A (zh) 广告内容的推荐方法及装置
WO2013025874A2 (en) Page reporting
CN103530414B (zh) 网页关键词的拓词方法和装置
CN108197244A (zh) 一种搜索推荐词的推送方法和装置
US20130191376A1 (en) Identifying related entities
CN106599299A (zh) 一种网站关键词的确定方法及装置
US11017426B1 (en) Content performance analytics
CN106452808A (zh) 一种数据处理方法和装置
CN106844365A (zh) 一种应用分发平台的应用信息推送方法和装置
CN103020214B (zh) 访问网站历史记录信息处理方法和设备
US10885550B1 (en) Goods/service recommendation with data security
CN106168962A (zh) 基于自然搜索结果提供精确观点的搜索方法及装置
CN106909579A (zh) 浏览器展示方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant