CN110990696B - 搜索意图推荐的方法及装置 - Google Patents
搜索意图推荐的方法及装置 Download PDFInfo
- Publication number
- CN110990696B CN110990696B CN201911164664.0A CN201911164664A CN110990696B CN 110990696 B CN110990696 B CN 110990696B CN 201911164664 A CN201911164664 A CN 201911164664A CN 110990696 B CN110990696 B CN 110990696B
- Authority
- CN
- China
- Prior art keywords
- search
- recommending
- word
- text
- search intention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种搜索意图推荐的方法及装置,涉及互联网技术领域,能够解决现有技术中用户进行网络搜索时,存在搜索操作繁琐,无法快速找到所需搜索结果的问题。本发明实施例的方法主要包括:获取正在被浏览的文本;将根据所述文本内容确定的目标词作为搜索意图推荐词,所述目标词包括以下至少一项:根据预设规则选取的所述文本中的关键词、与所述文本的内容相关的关键词和所述关键词的扩展词;向用户推荐所述搜索意图推荐词。本发明实施例主要适用于基于搜索引擎进行信息搜索的场景中。
Description
技术领域
本发明实施例涉及互联网技术领域,特别是涉及一种搜索意图推荐的方法及装置。
背景技术
随着互联网的不断发展,网络上信息的数据量不断加大。用户经常在互联网的海量信息中搜索需要的信息,搜索引擎渐渐成为必不可少的工具。目前,搜索引擎一般是根据用户输入的搜索词进行检索,以获取与搜索词相关的搜索结果,并将该搜索结果提供给用户进行查看。但是,当用户对某些内容进行搜索时,由于网络上存在的信息量过大,用户往往需要进行多次选择操作后才可以得到其真正需要的信息。因此,如何减少用户搜索成本,快速为用户找到想要的搜索结果,是亟待解决的。
发明内容
有鉴于此,本发明实施例提供的搜索意图推荐的方法及装置,其目的在于解决现有技术中用户进行网络搜索时,存在搜索操作繁琐,无法快速找到所需搜索结果的问题。
为了解决上述问题,本发明实施例主要提供如下技术方案:
第一方面,本发明实施例提供了一种搜索意图推荐的方法,所述方法包括:
获取正在被浏览的文本;
将根据所述文本内容确定的目标词作为搜索意图推荐词,所述目标词包括以下至少一项:根据预设规则选取的所述文本中的关键词、与所述文本的内容相关的关键词和所述关键词的扩展词;
向用户推荐所述搜索意图推荐词。
可选的,所述向用户推荐所述搜索意图推荐词包括:
在接收到基于所述文本所属页面进行触控的触控指令后,在所述文本所属页面的特定区域弹出包含至少一个搜索意图推荐词的推荐框。
可选的,当所述搜索意图推荐词包括根据预设规则选取的所述文本中的关键词时,所述向用户推荐所述搜索意图推荐词包括:
将根据预设规则选取的所述文本中的关键词与其他词语进行区别显示,并为根据预设规则选取的所述文本中的关键词添加链接。
可选的,当所述搜索意图推荐词还包括所述关键词的扩展词时,所述向用户推荐所述搜索意图推荐词还包括:
接收针对区别显示的关键词的点击操作;
在被点击关键词的周围预设范围内弹出包含至少一个所述被点击关键词的扩展词的推荐框,且为所述推荐框中的扩展词添加链接。
可选的,当所述搜索意图推荐词还包括所述关键词的扩展词时,所述向用户推荐所述搜索意图推荐词包括:
在接收到针对文本的选中操作时,在被选中文本周围预设范围内弹出包含至少一个被选中文本中关键词的扩展词的推荐框,且为所述推荐框中的扩展词添加链接。
可选的,根据预设规则选取的所述文本中的关键词包括:从所述文本中选取的不同用户搜索到所述文本时所用的搜索词。
可选的,当所述搜索意图推荐词包括根据预设规则选取的所述文本中的关键词时,在向用户推荐所述搜索意图推荐词之前,所述方法还包括:
确定所述搜索意图推荐词在所述文本中的语境含义;
判断所述语境含义是否具有搜索意图性;
所述向用户推荐所述搜索意图推荐词包括:
若具有搜索意图性,则向所述用户推荐具有搜索意图性的搜索意图推荐词。
可选的,所述确定所述搜索意图推荐词在所述文本中的语境含义包括:
获取所述搜索意图推荐词的非语境特征向量,所述非语境特征向量是搜索意图推荐词的字面含义所对应的特征向量;
将所述非语境特征向量和所述搜索意图推荐词所在的文本输入到预设语境向量识别模型中,得到所述搜索意图推荐词的语境特征向量;
根据所述语境特征向量,确定所述搜索意图推荐词的语境含义。
可选的,在将所述非语境特征向量和所述搜索意图推荐词所在的文本输入到预设语境向量识别模型中,得到所述搜索意图推荐词的语境特征向量之前,所述方法还包括:
从搜索引擎中获取搜索日志;
从所述搜索日志中获取搜索词和基于搜索词选中的网页;
在所述网页中标记出选中所述网页的搜索词;
根据所述搜索词的非语境特征向量和标记后的网页对神经网络模型进行语境训练,获得能够确定搜索词的语境特征向量的语境向量识别模型。
可选的,判断所述语境含义是否具有搜索意图性包括:
确定将所述搜索意图推荐词作为所述语境含义被搜索的频率与所述搜索意图推荐词的所有含义被搜索的频率之比;
若频率之比大于预设频率比例阈值,确定所述语境含义具有搜索意图性。
第二方面,本发明实施例还提供一种搜索意图推荐的装置,所述装置包括:
获取单元,用于获取正在被浏览的文本;
确定单元,用于将根据所述文本内容确定的目标词作为搜索意图推荐词,所述目标词包括以下至少一项:根据预设规则选取的所述文本中的关键词、与所述文本的内容相关的关键词和所述关键词的扩展词;
推荐单元,用于向用户推荐所述搜索意图推荐词。
可选的,所述推荐单元包括:
第一推荐模块,用于在接收到基于所述文本所属页面进行触控的触控指令后,在所述文本所属页面的特定区域弹出包含至少一个搜索意图推荐词的推荐框。
可选的,所述推荐单元包括:
第二推荐模块,用于当所述搜索意图推荐词包括根据预设规则选取的所述文本中的关键词时,将根据预设规则选取的所述文本中的关键词与其他词语进行区别显示,且为根据预设规则选取的所述文本中的关键词添加链接。
可选的,所述推荐单元还包括:
第三推荐模块,用于当所述搜索意图推荐词还包括所述关键词的扩展词时,接收针对区别显示的关键词的点击操作;在被点击关键词的周围预设范围内弹出包含至少一个所述被点击关键词的扩展词的推荐框,且为所述推荐框中的扩展词添加链接。
可选的,所述推荐单元还包括:
第四推荐模块,用于当所述搜索意图推荐词还包括所述关键词的扩展词时,在接收到针对文本的选中操作时,在被选中文本周围预设范围内弹出包含至少一个被选中文本中关键词的扩展词的推荐框,且为所述推荐框中的扩展词添加链接。
可选的,根据预设规则选取的所述文本中的关键词包括:从所述文本中选取的不同用户搜索到所述文本时所用的搜索词。
可选的,所述确定单元,还用于当所述搜索意图推荐词包括根据预设规则选取的所述文本中的关键词时,在向用户推荐所述搜索意图推荐词之前,确定所述搜索意图推荐词在所述文本中的语境含义;
所述装置还包括:
判断单元,用于判断所述语境含义是否具有搜索意图性;
所述推荐单元,还用于当所述判断单元的判断结果为具有搜索意图性时,向所述用户推荐具有搜索意图性的搜索意图推荐词。
可选的,所述确定单元包括:
获取模块,用于获取所述搜索意图推荐词的非语境特征向量,所述非语境特征向量是搜索意图推荐词的字面含义所对应的特征向量;
输入模块,用于将所述非语境特征向量和所述查找到的搜索意图推荐词所在的文本输入到预设语境向量识别模型中,得到所述搜索意图推荐词的语境特征向量;
语义确定模块,用于根据所述语境特征向量,确定所述搜索意图推荐词的语境含义。
可选的,所述获取模块,还用于在将所述非语境特征向量和所述搜索意图推荐词所在的文本输入到预设语境向量识别模型中,得到所述搜索意图推荐词的语境特征向量之前,从搜索引擎中获取搜索日志;从所述搜索日志中获取搜索词和基于搜索词选中的网页;
所述确定单元还包括:
选中模块,用于在所述网页中标记出选中所述网页的搜索词;
训练模块,用于根据所述搜索词的非语境特征向量和标记后的网页对神经网络模型进行语境训练,获得能够确定搜索词的语境特征向量的语境向量识别模型。
可选的,所述判断单元包括:
频率比确定模块,用于确定将所述搜索意图推荐词作为所述语境含义被搜索的频率与所述搜索意图推荐词的所有含义被搜索的频率之比;
搜索意图性确定模块,用于若频率之比大于预设频率比例阈值,则确定所述语境含义具有搜索意图性。
第三方面,本发明实施例还提供一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行第一方面所述的搜索意图推荐的方法。
第四方面,本发明实施例还提供一种电子设备,所述电子设备包括存储介质;及一个或者多个处理器,所述存储介质与所述处理器耦合,所述处理器被配置为执行所述存储介质中存储的程序指令;所述程序指令运行时执行第一方面所述的搜索意图推荐的方法。
借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:
本发明实施例提供的搜索意图推荐的方法及装置,能够先获取正在被浏览的文本,然后从该文本中查找目标词(包括根据预设规则选取的所述文本中的关键词、与所述文本的内容相关的关键词和所述关键词的扩展词)作为搜索意图推荐词,最后向用户推荐该搜索意图推荐词。由此可知,由于向用户推荐的搜索意图推荐词是与文本具有直接或间接关联关系的关键词,当前用户也正在浏览该文本,所以对于与该文本相关的搜索词,当前用户是感兴趣的,故将这些搜索词推荐给用户,用户可以很快搜索到所需的文本,从而与直接在搜索首页中想搜索词进行多次搜索相比,可以大大提高搜索效率。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明实施例的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种搜索意图推荐的方法的流程图;
图2示出了本发明实施例提供的一种搜索意图推荐示例图;
图3示出了本发明实施例提供的另一种搜索意图推荐示例图;
图4示出了本发明实施例提供的又一种搜索意图推荐示例图;
图5示出了本发明实施例提供的再一种搜索意图推荐示例图;
图6示出了本发明实施例提供的另一种搜索意图推荐的方法的流程图;
图7示出了本发明实施例提供的一种搜索意图推荐的装置的组成框图;
图8示出了本发明实施例提供的另一种搜索意图推荐的装置的组成框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种搜索意图推荐的方法,所述方法可以应用于客户端,也可以应用于服务器,如图1所示,所述方法包括:
101、获取正在被浏览的文本。
当用户通过浏览器或者其他应用APP浏览网页时,相应的浏览器或其他APP可以监控用户行为,当用户点击某个链接打开相应文本进行浏览时,可以获取该文本内容。
当本发明实施例应用于客户端时,客户端获取到正在被浏览的文本时,可以根据该文本内容确定搜索意图推荐词;当本发明实施例应用于服务器时,客户端可以将文本的相关信息发送给服务器,由服务器根据文本内容确定搜索意图推荐词,其中,文本的相关信息包括文本所属网页的网址、文本标题等。
需要补充的是,本发明实施例中所说的文本可以是任意聊天界面的文本,也可以是新闻界面的文本,也可以是用户语音转文字的文本,本发明实施例对文本的具体场景不作限定。
102、将根据所述文本内容确定的目标词作为搜索意图推荐词。
其中,所述目标词包括以下至少一项:根据预设规则选取的所述文本中的关键词、与所述文本的内容相关的关键词和所述关键词的扩展词。
根据预设规则选取的所述文本中的关键词包括:从所述文本中选取的不同用户搜索到所述文本时所用的搜索词、从文本中选取的被热搜的词语、从文本中选取的技术用语等。与所述文本的内容相关的关键词可以包括不同用户搜索到所述文本时所用的搜索词,且在搜索词不在所述文本当中,也可以包括与文本类别相同的其他文本的名称、与文本中关键人/物相关的其他新闻的名称等。所述关键词的扩展词包括根据预设规则选取的所述文本中的关键词的扩展词、与所述文本的内容相关的关键词的扩展词,且扩展词具体可以为关键词的近义词、反义词、关联词等。
不同用户搜索到某文本时所用的搜索词可以根据全网用户的历史搜索记录而得。其中,历史搜索记录可以包括历史用户行为,即包括用户的每一步操作,如启动浏览器->在搜索框中输入“搜索词1”->点击搜索->点击搜索结果中的链接1->打开文本1。历史搜索记录可以是搜索日志,也可以是其他格式的记录。
在具体实施过程中,可以预先对全网用户的历史搜索记录进行统计,统计出每篇文本所对应的搜索词,即统计出搜索到某文本所用的所有搜索词,并将文本标识(例如文本标题、网址等)与搜索词之间的对应关系进行保存。在执行步骤102时,可以先获取步骤101中正在浏览的文本的标识,然后将在预先存储的对应关系中查找该文本标识,并在该文本中查找该文本标识对应的搜索词,将该文本中查找到的搜索词作为搜索意图推荐词。
103、向用户推荐所述搜索意图推荐词。
当本发明实施例应用于客户端时,客户端可以直接向用户推荐搜索意图推荐词;当本发明实施例应用于服务器时,服务器可以将搜索意图推荐词和推荐方式发送给客户端,由客户端向用户推荐搜索意图推荐词。
本发明实施例提供的搜索意图推荐的方法,能够先获取正在被浏览的文本,然后从该文本中查找目标词(包括根据预设规则选取的所述文本中的关键词、与所述文本的内容相关的关键词和所述关键词的扩展词)作为搜索意图推荐词,最后向用户推荐该搜索意图推荐词。由此可知,由于向用户推荐的搜索意图推荐词是与文本具有直接或间接关联关系的关键词,当前用户也正在浏览该文本,所以对于与该文本相关的搜索词,当前用户是感兴趣的,故将这些搜索词推荐给用户,用户可以很快搜索到所需的文本,从而与直接在搜索首页中想搜索词进行多次搜索相比,可以大大提高搜索效率。
可选的,向用户推荐所述搜索意图推荐词的具体实现方式包括但不限于以下几种:
第一种:在接收到基于所述文本所属页面进行触控的触控指令后,在所述文本所属页面的特定区域弹出包含至少一个搜索意图推荐词的推荐框。
具体的,用户可以通过预设触控方式触控文本所属页面上的任意位置触发弹出推荐框,也可以触控特定位置触发弹出推荐框。其中,特定位置包括但不限于标题附近、任意空白位置、预先设置的推荐按钮。预设触控方式包括但不限于单指长按预设时长、双指长按预设时长、多指同时单击等。此外,特定区域包括但不限于文本头部区域、文本尾部区域、文本空白区域等,被触控周围区域。
示例性的,如图2所示,当用户浏览某篇文本时,可以通过单指长按页面中任意位置,弹出推荐卡片,并且通过点击推荐框中的词语可以链接到相应的页面。本实施例不对推荐卡片中的内容和排版进行限定。
第二种:当所述搜索意图推荐词包括根据预设规则选取的所述文本中的关键词时,可以将根据预设规则选取的所述文本中的关键词与其他词语进行区别显示,并为根据预设规则选取的所述文本中的关键词添加链接。可以解决用户进行相关词语的查询带来切换浏览器查询的繁琐。
其中,区别显示的方法包括但不限于加粗加斜显示、高亮显示、特殊颜色显示、增加下划线显示、闪烁显示等。
示例性的,如图3所示,当用户浏览某文本时,可以通过加粗的方式区别显示搜索意图推荐词,当用户点击某个加粗关键词时,可以链接到相应页面。
第三种:当所述搜索意图推荐词还包括所述关键词的扩展词时,在第二种区别显示的基础上,可以接收针对区别显示的关键词的点击操作;在被点击关键词的周围预设范围内弹出包含至少一个所述被点击关键词的扩展词的推荐框,且为所述推荐框中的扩展词添加链接。
也就是说,对于文本中的原词用户可能不敢兴趣,而原词的扩展词却是用户感兴趣的,为了提高用户搜索扩展词的速率,可以在当用户点击区别显示的关键词时,向用户推荐扩展词,供用户直接在当前页面中搜索扩展词。
示例性的,如图4所示,当用户点击图3中的“物联网”时,可以弹出“物联网”的扩展词若干,并且用户点击某一扩展词后,可以直接链接到相应页面。
第四种:当所述搜索意图推荐词还包括所述关键词的扩展词时,可以在接收到针对文本的选中操作时,在被选中文本周围预设范围内弹出包含至少一个被选中文本中关键词的扩展词的推荐框,且为所述推荐框中的扩展词添加链接。
其中,文本选中操作包括但不限于长按相应位置、长按并滑动需要选中的文本。
示例性的,如图5所示,当用户选中“物联网”时,可以弹出“物联网”的扩展词若干,并且用户点击某一扩展词后,可以直接链接到相应页面。
进一步的,作为对上述方法的实现,当根据预设规则选取的所述文本中的关键词包括从所述文本中选取的不同用户搜索到所述文本时所用的搜索词时,本发明实施例另一实施例还提供了一种搜索意图推荐的方法,如图6所示,所述方法还包括:
201、获取正在被浏览的文本。
202、将根据所述文本内容确定的目标词作为搜索意图推荐词。
由于在实际应用中,对于某些搜索词的某些含义,可能只有少数用户进行搜索,而大多数用户不会以该含义使用该搜索词进行搜索,所以将这些搜索词推荐给用户,用户可能还是搜索不到想要的信息。例如,“后天”一词的一般含义就是指时间,用户都知道这一含义,若以该含义进行搜索,没有实际意义。为了避免向用户推荐实用性较差的搜索意图推荐词,可以采用如下方案(即步骤203-205):
203、确定所述搜索意图推荐词在所述文本中的语境含义。
具体的,可以先获取所述查找到的搜索意图推荐词的非语境特征向量,所述非语境特征向量是搜索意图推荐词的字面含义所对应的特征向量;将所述非语境特征向量和所述查找到的搜索意图推荐词所在的文本输入到预设语境向量识别模型中,得到所述查找到的搜索意图推荐词的语境特征向量;根据所述语境特征向量,确定所述查找到的搜索意图推荐词的语境含义。
其中,预设语境向量识别模型的训练过程包括:从搜索引擎中获取搜索日志;从所述搜索日志中获取搜索词和基于搜索词选中的网页;在所述网页中标记出选中所述网页的搜索词;根据所述搜索词的非语境特征向量和标记后的网页对神经网络模型进行语境训练,获得能够确定搜索词的语境特征向量的语境向量识别模型。
语境向量识别模型可以是基于浅度学习的神经网络模型,也可以是基于深度学习的神经网络模型。
204、判断所述语境含义是否具有搜索意图性。
具体的,确定将所述搜索意图推荐词作为所述语境含义被搜索的频率与所述搜索意图推荐词的所有含义被搜索的频率之比;若频率之比大于预设频率比例阈值,则确定所述语境含义具有搜索意图性;若频率之比小于或等于预设频率比例阈值,则确定所述语境含义具有搜索意图性。
其中,在计算频率之比时,可以基于最近时间段内被搜索的频率进行计算,也可以基于最开始被搜索到目前为止整个时间段内被搜索的频率进行计算。
205、若具有搜索意图性,则向所述用户推荐具有搜索意图性的搜索意图推荐词。
若所述搜索意图推荐词具有搜索意图性,则用户选择该搜索意图推荐词进行搜索的可能性相对较大,基于该搜索意图推荐词搜索到需要信息的可能性也相对较大,所以可以向所述用户推荐具有搜索意图性的搜索意图推荐词。而若所述搜索意图推荐词没有搜索意图性,则用户选择该搜索意图推荐词进行搜索的可能性相对较小,基于该搜索意图推荐词搜索到需要信息的可能性也相对较小,所以无需向所述用户推荐具有搜索意图性的搜索意图推荐词。
向所述用户推荐具有搜索意图性的搜索意图推荐词的具体实施方式包括但不限于区别显示所述搜索意图推荐词,并为所述搜索意图推荐词添加链接。
本发明实施例提供的搜索意图推荐的方法,能够从当前用户正在浏览的文本中查找目标词(即不同用户搜索到所述文本时所用的搜索词)作为搜索意图推荐词,并选取具有搜索意图性的搜索意图推荐词推荐给用户,从而不仅可以将与文本相关的搜索词作为搜索意图推荐词,还可以避免向用户推荐没有搜索意图性的搜索词,从而使得推荐给用户的搜索词既是用户感兴趣的,又不会没有搜索意义,进而可以大大提高搜索效率。
进一步的,依据上述方法实施例,本发明实施例还提供一种搜索意图推荐的装置,如图7所示,所述装置包括:
获取单元31,用于获取正在被浏览的文本;
确定单元32,用于将根据所述文本内容确定的目标词作为搜索意图推荐词,所述目标词包括以下至少一项:根据预设规则选取的所述文本中的关键词、与所述文本的内容相关的关键词和所述关键词的扩展词;;
推荐单元33,用于向用户推荐所述搜索意图推荐词。
可选的,如图8所示,所述推荐单元33包括:
第一推荐模块331,用于在接收到基于所述文本所属页面进行触控的触控指令后,在所述文本所属页面的特定区域弹出包含至少一个搜索意图推荐词的推荐框。
可选的,如图8所示,所述推荐单元33包括:
第二推荐模块332,用于当所述搜索意图推荐词包括根据预设规则选取的所述文本中的关键词时,将根据预设规则选取的所述文本中的关键词与其他词语进行区别显示,且为根据预设规则选取的所述文本中的关键词添加链接。
可选的,如图8所示,所述推荐单元33还包括:
第三推荐模块333,用于当所述搜索意图推荐词还包括所述关键词的扩展词时,接收针对区别显示的关键词的点击操作;在被点击关键词的周围预设范围内弹出包含至少一个所述被点击关键词的扩展词的推荐框,且为所述推荐框中的扩展词添加链接。
可选的,如图8所示,所述推荐单元33还包括:
第四推荐模块334,用于当所述搜索意图推荐词还包括所述关键词的扩展词时,在接收到针对文本的选中操作时,在被选中文本周围预设范围内弹出包含至少一个被选中文本中关键词的扩展词的推荐框,且为所述推荐框中的扩展词添加链接。
可选的,根据预设规则选取的所述文本中的关键词包括:从所述文本中选取的不同用户搜索到所述文本时所用的搜索词。
可选的,如图8所示,所述确定单元32,还用于当所述搜索意图推荐词包括根据预设规则选取的所述文本中的关键词时,在向用户推荐所述搜索意图推荐词之前,确定所述搜索意图推荐词在所述文本中的语境含义;
所述装置还包括:判断单元34,用于判断所述语境含义是否具有搜索意图性;
所述推荐单元33,还用于当所述判断单元34的判断结果为具有搜索意图性时,向所述用户推荐具有搜索意图性的搜索意图推荐词。
可选的,如图8所示,所述确定单元32包括:
获取模块321,用于获取所述搜索意图推荐词的非语境特征向量,所述非语境特征向量是搜索意图推荐词的字面含义所对应的特征向量;
输入模块322,用于将所述非语境特征向量和所述查找到的搜索意图推荐词所在的文本输入到预设语境向量识别模型中,得到所述搜索意图推荐词的语境特征向量;
语义确定模块323,用于根据所述语境特征向量,确定所述搜索意图推荐词的语境含义。
可选的,所述获取模块321,还用于在将所述非语境特征向量和所述搜索意图推荐词所在的文本输入到预设语境向量识别模型中,得到所述搜索意图推荐词的语境特征向量之前,从搜索引擎中获取搜索日志;从所述搜索日志中获取搜索词和基于搜索词选中的网页;
如图8所示,所述确定单元32还包括:
选中模块324,用于在所述网页中标记出选中所述网页的搜索词;
训练模块325,用于根据所述搜索词的非语境特征向量和标记后的网页对神经网络模型进行语境训练,获得能够确定搜索词的语境特征向量的语境向量识别模型。
可选的,所述判断单元35包括:
频率比确定模块351,用于确定将所述搜索意图推荐词作为所述语境含义被搜索的频率与所述搜索意图推荐词的所有含义被搜索的频率之比;
搜索意图性确定模块352,用于若频率之比大于预设频率比例阈值,则确定所述语境含义具有搜索意图性。
可选的,所述推荐单元33,用于区别显示所述搜索意图推荐词,并为所述搜索意图推荐词添加链接。
本发明实施例提供的搜索意图推荐的装置,能够先获取正在被浏览的文本,然后从该文本中查找目标词(包括根据预设规则选取的所述文本中的关键词、与所述文本的内容相关的关键词和所述关键词的扩展词)作为搜索意图推荐词,最后向用户推荐该搜索意图推荐词。由此可知,由于向用户推荐的搜索意图推荐词是与文本具有直接或间接关联关系的关键词,当前用户也正在浏览该文本,所以对于与该文本相关的搜索词,当前用户是感兴趣的,故将这些搜索词推荐给用户,用户可以很快搜索到所需的文本,从而与直接在搜索首页中想搜索词进行多次搜索相比,可以大大提高搜索效率。
第三方面,本发明实施例还提供一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行第一方面所述的搜索意图推荐的方法。
本发明实施例提供的存储介质中存储的程序在被执行时所采用的方法,能够先获取正在被浏览的文本,然后从该文本中查找目标词(包括根据预设规则选取的所述文本中的关键词、与所述文本的内容相关的关键词和所述关键词的扩展词)作为搜索意图推荐词,最后向用户推荐该搜索意图推荐词。由此可知,由于向用户推荐的搜索意图推荐词是与文本具有直接或间接关联关系的关键词,当前用户也正在浏览该文本,所以对于与该文本相关的搜索词,当前用户是感兴趣的或者是大家正在搜索的,故将这些搜索词推荐给用户,用户可以很快搜索到所需的文本,从而与直接在搜索首页中想搜索词进行多次搜索相比,可以大大提高搜索效率。
第四方面,本发明实施例还提供一种电子设备,所述电子设备包括存储介质;及一个或者多个处理器,所述存储介质与所述处理器耦合,所述处理器被配置为执行所述存储介质中存储的程序指令;所述程序指令运行时执行第一方面所述的搜索意图推荐的方法。
本发明实施例提供的电子设备,能够先获取正在被浏览的文本,然后从该文本中查找目标词(包括根据预设规则选取的所述文本中的关键词、与所述文本的内容相关的关键词和所述关键词的扩展词)作为搜索意图推荐词,最后向用户推荐该搜索意图推荐词。由此可知,由于向用户推荐的搜索意图推荐词是与文本具有直接或间接关联关系的关键词,当前用户也正在浏览该文本,所以对于与该文本相关的搜索词,当前用户是感兴趣的,故将这些搜索词推荐给用户,用户可以很快搜索到所需的文本,从而与直接在搜索首页中想搜索词进行多次搜索相比,可以大大提高搜索效率。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (18)
1.一种搜索意图推荐的方法,其特征在于,所述方法包括:
获取正在被浏览的文本;
将根据所述文本内容确定的目标词作为搜索意图推荐词,所述目标词包括:根据预设规则选取的所述文本中的关键词;
确定所述搜索意图推荐词在所述文本中的语境含义;
判断所述语境含义是否具有搜索意图性;
若具有搜索意图性,则向用户推荐具有搜索意图性的搜索意图推荐词;
其中,所述确定所述搜索意图推荐词在所述文本中的语境含义包括:
获取所述搜索意图推荐词的非语境特征向量,所述非语境特征向量是搜索意图推荐词的字面含义所对应的特征向量;
将所述非语境特征向量和所述搜索意图推荐词所在的文本输入到预设语境向量识别模型中,得到所述搜索意图推荐词的语境特征向量;
根据所述语境特征向量,确定所述搜索意图推荐词的语境含义。
2.根据权利要求1所述的方法,其特征在于,所述向用户推荐具有搜索意图性的搜索意图推荐词包括:
在接收到基于所述文本所属页面进行触控的触控指令后,在所述文本所属页面的特定区域弹出包含至少一个搜索意图推荐词的推荐框。
3.根据权利要求1所述的方法,其特征在于,所述向用户推荐具有搜索意图性的搜索意图推荐词包括:
将根据预设规则选取的所述文本中的关键词与其他词语进行区别显示,并为根据预设规则选取的所述文本中的关键词添加链接。
4.根据权利要求3所述的方法,其特征在于,当所述搜索意图推荐词还包括关键词的扩展词时,所述向用户推荐具有搜索意图性的搜索意图推荐词还包括:
接收针对区别显示的关键词的点击操作;
在被点击关键词的周围预设范围内弹出包含至少一个所述被点击关键词的扩展词的推荐框,且为所述推荐框中的扩展词添加链接。
5.根据权利要求1所述的方法,其特征在于,当所述搜索意图推荐词还包括关键词的扩展词时,所述向用户推荐具有搜索意图性的搜索意图推荐词包括:
在接收到针对文本的选中操作时,在被选中文本周围预设范围内弹出包含至少一个被选中文本中关键词的扩展词的推荐框,且为所述推荐框中的扩展词添加链接。
6.根据权利要求1-5中任一项所述的方法,其特征在于,根据预设规则选取的所述文本中的关键词包括:从所述文本中选取的不同用户搜索到所述文本时所用的搜索词。
7.根据权利要求1所述的方法,其特征在于,在将所述非语境特征向量和所述搜索意图推荐词所在的文本输入到预设语境向量识别模型中,得到所述搜索意图推荐词的语境特征向量之前,所述方法还包括:
从搜索引擎中获取搜索日志;
从所述搜索日志中获取搜索词和基于搜索词选中的网页;
在所述网页中标记出选中所述网页的搜索词;
根据所述搜索词的非语境特征向量和标记后的网页对神经网络模型进行语境训练,获得能够确定搜索词的语境特征向量的语境向量识别模型。
8.根据权利要求1所述的方法,其特征在于,判断所述语境含义是否具有搜索意图性包括:
确定将所述搜索意图推荐词作为所述语境含义被搜索的频率与所述搜索意图推荐词的所有含义被搜索的频率之比;
若频率之比大于预设频率比例阈值,确定所述语境含义具有搜索意图性。
9.一种搜索意图推荐的装置,其特征在于,所述装置包括:
获取单元,用于获取正在被浏览的文本;
确定单元,用于将根据所述文本内容确定的目标词作为搜索意图推荐词,所述目标词包括:根据预设规则选取的所述文本中的关键词;确定所述搜索意图推荐词在所述文本中的语境含义;
判断单元,用于判断所述语境含义是否具有搜索意图性;
推荐单元,用于若具有搜索意图性,则向用户推荐具有搜索意图性的搜索意图推荐词;
其中,所述确定单元包括:
获取模块,用于获取所述搜索意图推荐词的非语境特征向量,所述非语境特征向量是搜索意图推荐词的字面含义所对应的特征向量;
输入模块,用于将所述非语境特征向量和所述搜索意图推荐词所在的文本输入到预设语境向量识别模型中,得到所述搜索意图推荐词的语境特征向量;
语义确定模块,用于根据所述语境特征向量,确定所述搜索意图推荐词的语境含义。
10.根据权利要求9所述的装置,其特征在于,所述推荐单元包括:
第一推荐模块,用于在接收到基于所述文本所属页面进行触控的触控指令后,在所述文本所属页面的特定区域弹出包含至少一个搜索意图推荐词的推荐框。
11.根据权利要求9所述的装置,其特征在于,所述推荐单元包括:
第二推荐模块,用于将根据预设规则选取的所述文本中的关键词与其他词语进行区别显示,且为根据预设规则选取的所述文本中的关键词添加链接。
12.根据权利要求11所述的装置,其特征在于,所述推荐单元还包括:
第三推荐模块,用于当所述搜索意图推荐词还包括关键词的扩展词时,接收针对区别显示的关键词的点击操作;在被点击关键词的周围预设范围内弹出包含至少一个所述被点击关键词的扩展词的推荐框,且为所述推荐框中的扩展词添加链接。
13.根据权利要求9所述的装置,其特征在于,所述推荐单元还包括:
第四推荐模块,用于当所述搜索意图推荐词还包括关键词的扩展词时,在接收到针对文本的选中操作时,在被选中文本周围预设范围内弹出包含至少一个被选中文本中关键词的扩展词的推荐框,且为所述推荐框中的扩展词添加链接。
14.根据权利要求9-13中任一项所述的装置,其特征在于,根据预设规则选取的所述文本中的关键词包括:从所述文本中选取的不同用户搜索到所述文本时所用的搜索词。
15.根据权利要求9所述的装置,其特征在于,所述获取模块,还用于在将所述非语境特征向量和所述搜索意图推荐词所在的文本输入到预设语境向量识别模型中,得到所述搜索意图推荐词的语境特征向量之前,从搜索引擎中获取搜索日志;从所述搜索日志中获取搜索词和基于搜索词选中的网页;
所述确定单元还包括:
选中模块,用于在所述网页中标记出选中所述网页的搜索词;
训练模块,用于根据所述搜索词的非语境特征向量和标记后的网页对神经网络模型进行语境训练,获得能够确定搜索词的语境特征向量的语境向量识别模型。
16.根据权利要求9所述的装置,其特征在于,所述判断单元包括:
频率比确定模块,用于确定将所述搜索意图推荐词作为所述语境含义被搜索的频率与所述搜索意图推荐词的所有含义被搜索的频率之比;
搜索意图性确定模块,用于若频率之比大于预设频率比例阈值,则确定所述语境含义具有搜索意图性。
17.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至8中任一项所述的搜索意图推荐的方法。
18.一种电子设备,其特征在于,所述电子设备包括存储介质;及一个或者多个处理器,所述存储介质与所述处理器耦合,所述处理器被配置为执行所述存储介质中存储的程序指令;所述程序指令运行时执行权利要求1至8中任一项所述的搜索意图推荐的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911164664.0A CN110990696B (zh) | 2019-11-25 | 2019-11-25 | 搜索意图推荐的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911164664.0A CN110990696B (zh) | 2019-11-25 | 2019-11-25 | 搜索意图推荐的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110990696A CN110990696A (zh) | 2020-04-10 |
CN110990696B true CN110990696B (zh) | 2023-04-14 |
Family
ID=70086326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911164664.0A Active CN110990696B (zh) | 2019-11-25 | 2019-11-25 | 搜索意图推荐的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110990696B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111611492A (zh) * | 2020-05-26 | 2020-09-01 | 北京字节跳动网络技术有限公司 | 一种触发搜索的方法、装置、电子设备及存储介质 |
CN111737572B (zh) * | 2020-06-17 | 2024-01-30 | 北京字节跳动网络技术有限公司 | 搜索语句生成方法、装置和电子设备 |
CN113204578A (zh) * | 2021-04-29 | 2021-08-03 | 北京金山数字娱乐科技有限公司 | 内容关联方法、系统、装置、电子设备及存储介质 |
CN113099267B (zh) * | 2021-06-04 | 2021-11-12 | 武汉卓尔数字传媒科技有限公司 | 视频生成方法、装置、电子设备及存储介质 |
CN113515709A (zh) * | 2021-07-09 | 2021-10-19 | 北京字节跳动网络技术有限公司 | 一种搜索信息展示方法、装置、计算机设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103064945A (zh) * | 2012-12-26 | 2013-04-24 | 吉林大学 | 基于本体的情境搜索方法 |
CN103577595A (zh) * | 2013-11-15 | 2014-02-12 | 北京奇虎科技有限公司 | 基于当前浏览页面的关键词推送方法及装置 |
CN105095440A (zh) * | 2015-07-23 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 一种搜索推荐方法及装置 |
CN108197244A (zh) * | 2017-12-29 | 2018-06-22 | 北京奇虎科技有限公司 | 一种搜索推荐词的推送方法和装置 |
CN108763579A (zh) * | 2018-06-08 | 2018-11-06 | Oppo(重庆)智能科技有限公司 | 搜索内容推荐方法、装置、终端设备及存储介质 |
CN109543102A (zh) * | 2018-11-12 | 2019-03-29 | 百度在线网络技术(北京)有限公司 | 基于视频播放的信息推荐方法、装置及存储介质 |
WO2019141043A1 (zh) * | 2018-01-16 | 2019-07-25 | 中兴通讯股份有限公司 | 提取浏览器搜索引擎的方法、设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679211B (zh) * | 2017-10-17 | 2021-12-28 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
-
2019
- 2019-11-25 CN CN201911164664.0A patent/CN110990696B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103064945A (zh) * | 2012-12-26 | 2013-04-24 | 吉林大学 | 基于本体的情境搜索方法 |
CN103577595A (zh) * | 2013-11-15 | 2014-02-12 | 北京奇虎科技有限公司 | 基于当前浏览页面的关键词推送方法及装置 |
CN105095440A (zh) * | 2015-07-23 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 一种搜索推荐方法及装置 |
CN108197244A (zh) * | 2017-12-29 | 2018-06-22 | 北京奇虎科技有限公司 | 一种搜索推荐词的推送方法和装置 |
WO2019141043A1 (zh) * | 2018-01-16 | 2019-07-25 | 中兴通讯股份有限公司 | 提取浏览器搜索引擎的方法、设备及存储介质 |
CN108763579A (zh) * | 2018-06-08 | 2018-11-06 | Oppo(重庆)智能科技有限公司 | 搜索内容推荐方法、装置、终端设备及存储介质 |
CN109543102A (zh) * | 2018-11-12 | 2019-03-29 | 百度在线网络技术(北京)有限公司 | 基于视频播放的信息推荐方法、装置及存储介质 |
Non-Patent Citations (1)
Title |
---|
关键词查询的推荐技术研究;范举;《中国博士学位论文全文数据库 信息科技辑》;20130715;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110990696A (zh) | 2020-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110990696B (zh) | 搜索意图推荐的方法及装置 | |
JP6291001B2 (ja) | 検索方法、検索装置及び検索エンジンシステム | |
US10140368B2 (en) | Method and apparatus for generating a recommendation page | |
CN101241512B (zh) | 一种重新定义查询词的搜索方法及装置 | |
KR101016683B1 (ko) | 검색 결과를 제공하기 위한 시스템 및 방법 | |
US9195754B2 (en) | Expansion of search result information | |
CN102722498B (zh) | 搜索引擎及其实现方法 | |
US20090144240A1 (en) | Method and systems for using community bookmark data to supplement internet search results | |
US20110307432A1 (en) | Relevance for name segment searches | |
US20090089293A1 (en) | Selfish data browsing | |
US8850301B1 (en) | Linking to relevant content from an ereader | |
US20110213772A1 (en) | Blending Mobile Search Results | |
CN102722501B (zh) | 搜索引擎及其实现方法 | |
EP2825981A1 (en) | Publishing product information | |
CN102722499B (zh) | 搜索引擎及其实现方法 | |
US9280522B2 (en) | Highlighting of document elements | |
CN111061954B (zh) | 搜索结果排序方法、装置及存储介质 | |
JP2015525929A (ja) | 検索品質を改善するための重みベースのステミング | |
US20180060427A1 (en) | Navigating a Taxonomy Using Search Queries | |
CN113039539A (zh) | 使用ai模型推荐来扩展搜索引擎能力 | |
US20170228378A1 (en) | Extracting topics from customer review search queries | |
CN110969022A (zh) | 语义确定方法及相关设备 | |
CN108763369B (zh) | 一种视频搜索方法和装置 | |
WO2018013400A1 (en) | Contextual based image search results | |
US20100082594A1 (en) | Building a topic based webpage based on algorithmic and community interactions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200728 Address after: 518000 Nanshan District science and technology zone, Guangdong, Zhejiang Province, science and technology in the Tencent Building on the 1st floor of the 35 layer Applicant after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd. Address before: 100029, Beijing, Chaoyang District new East Street, building No. 2, -3 to 25, 101, 8, 804 rooms Applicant before: Tricorn (Beijing) Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |