CN106484698A - 一种搜索关键词的推送方法和装置 - Google Patents

一种搜索关键词的推送方法和装置 Download PDF

Info

Publication number
CN106484698A
CN106484698A CN201510527367.3A CN201510527367A CN106484698A CN 106484698 A CN106484698 A CN 106484698A CN 201510527367 A CN201510527367 A CN 201510527367A CN 106484698 A CN106484698 A CN 106484698A
Authority
CN
China
Prior art keywords
search keyword
search
dependency
target account
participle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510527367.3A
Other languages
English (en)
Inventor
郭亚宁
张涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201510527367.3A priority Critical patent/CN106484698A/zh
Publication of CN106484698A publication Critical patent/CN106484698A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

本发明实施例提供了一种搜索关键词的推送方法和装置,该方法包括:查找与目标账号的第一业务对象匹配的第一搜索关键词;提取所述目标账号的第一业务对象的业务特征信息;计算所述第一搜索关键词与所述业务特征信息的第一相关性;将所述第一相关性超过预设的第一相关性阈值的第一搜索关键词推送至所述目标账号。本发明实施例通过挖掘目标账号的主营业务的进行相关性计算,大大提高了推送的第一搜索关键词的准确率,合适的搜索关键词可以带来理想的搜索效果,避免了反复绑定关键词的操作,避免了客户端和平台服务器多次响应绑定操作,大大减少了时间耗费,而且,大大降低了客户端和平台服务器的资源消耗。

Description

一种搜索关键词的推送方法和装置
技术领域
本发明涉及计算机处理的技术领域,特别是涉及一种搜索关键词的推送方法和一种搜索关键词的推送装置。
背景技术
随着网络科技的快速发展,各种网络平台集成众多产品信息,便于用户进行选择。
为了让更多的前端用户获取自己的产品信息,通常有两条途径,一条是通过自然搜索的方式,二是通过竞争推广的方式。
第一种方式竞争比较激烈,优化周期较长,因此,很多网站会因此选择更加快捷的第二种方式。
竞争推广方式又称为关键词推广,即网站需要预先选择关键词,将产品信息绑定到该关键词下,若用户搜索到该关键词,则平台通过一系列的优化、排序等操作后推送绑定该关键词的产品信息,由此可见,关键词的选择对于产品信息的推送效果有很大的影响。
关键词的数量是巨大的,应用门槛较高,因此,业界通常采用产品信息与关键词之间的触发与点击关系,推送关键词。
但是,这种方式对产品信息的展示的准确性具有较强的依赖性,因为产品信息的展示中不可避免的会出现一些关联度较差的产品信息,并且存在产品信息误点击的行为,而这种的误差会在上述方式中放大,因此推送一些明显不合适的关键词。
不合适的关键词,容易造成不理想的搜索效果,大多数情况下,后端用户反复绑定关键词,导致客户端和平台服务器多次响应绑定操作,时间耗费大,而且,大大增加了客户端和平台服务器的资源消耗。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种搜索关键词的推送方法和相应的一种搜索关键词的推送装置。
依据本发明的一个方面,提供了一种搜索关键词的推送方法,包括:
查找与目标账号的第一业务对象匹配的第一搜索关键词;
提取所述目标账号的第一业务对象的业务特征信息;
计算所述第一搜索关键词与所述业务特征信息的第一相关性;
将所述第一相关性超过预设的第一相关性阈值的第一搜索关键词推送至所述目标账号。
可选地,所述查找与目标账号的第一业务对象匹配的第一搜索关键词的步骤包括:
查找基于在先记录的第二搜索关键词触发了展示操作及点击操作的第二业务对象;
查找触发了所述第二业务对象的展示操作及点击操作的第三搜索关键词;
查找基于所述第三搜索关键词触发了展示操作及点击操作的第三业务对象;
计算所述第二搜索关键词与所述第三业务对象的第二相关性;
当所述第二相关性超过预设的第二相关性阈值时,确定所述第二搜索关键与所述第三业务对象匹配。
可选地,所述提取所述目标账号的第一业务对象的业务特征信息的步骤包括:
对所述第一业务对象绑定的第三搜索关键词进行分词处理,获得第一搜索分词;
对所述第一搜索分词配置权重。
可选地,所述提取所述目标账号的第一业务对象的业务特征信息的步骤还包括:
对所述第一搜索分词进行过滤处理。
可选地,所述权重包括以下的至少一种:
不包括近义词的词项频率,包括近义词的词项频率,不包括近义词的、词项频率-逆文档频率,包括近义词的、词项频率-逆文档频率。
可选地,所述计算所述第一搜索关键词与所述业务特征信息的第一相关性的步骤包括:
对所述第一搜索关键词进行分词处理,获得第二搜索分词;
采用第一目标分词、第二目标分词与所述业务特征信息计算第一相关性;
其中,所述第一目标分词为所述目标账号已绑定的第二搜索分词,用于提高第一相关性;
所述第二目标分词为所述目标账号未绑定的第二搜索分词,用于降低第一相关性。
可选地,所述计算所述第一搜索关键词与所述业务特征信息的第一相关性的步骤还包括:
对所述第二搜索分词进行预处理;
其中,所述预处理包括以下的至少一种:
去重处理、近义词替换处理、合并处理。
可选地,在所述将所述第一相关性超过预设的第一相关性阈值的第一搜索关键词推送至所述目标账号的步骤之前,所述方法还包括:
按照预设的业务规则对所述第一搜索关键词的第一相关性进行调整。
可选地,所述业务规则包括地域规则;所述按照预设的业务规则对所述第一搜索关键词的第一相关性进行调整的步骤包括:
分别提取所述第一搜索关键词关联的第一地域词、所述第一业务对象绑定的第三搜索关键词关联的第二地域词;
确定关联第二地域词的第三搜索关键词的比例;
当所述第一地域词与所述第二地域词之间的关系符合预设的不匹配条件时,按照所述比例、所述不匹配条件对所述第一相关性进行降级处理。
可选地,所述第一地域词包括以下至少一种:
所述第一搜索关键词包含的地域词,所述第一搜索关键词包含的实体词所映射的地域词,所述第一搜索关键词包含、符合起点至终点模式中的终点地域词;
所述第二地域词包括以下至少一种:
所述第三搜索关键词包含的地域词,所述第三搜索关键词包含的实体词所映射的地域词,所述第三搜索关键词包含、符合起点至终点模式中的终点地域词。
可选地,所述业务规则包括价值规则;所述按照预设的业务规则对所述第一搜索关键词的第一相关性进行调整的步骤包括:
基于所述第一搜索关键词对应的历史行为信息对所述第一搜索关键词计算价值系数;
当所述价值系数小于预设的第一系数阈值时,按照所述价值系数对所述第一相关性进行降级处理。
可选地,所述业务规则包括行业规则;所述按照预设的业务规则对所述第一搜索关键词的第一相关性进行调整的步骤包括:
分别识别所述第一搜索关键词所属的第一行业、所述目标账号所属的第二行业;
计算所述第一行业与所述第二行业之间的第三相关性;
当所述第三相关性小于预设的第三相关性阈值时,按照所述第三相关性对所述第一相关性进行降级处理。
可选地,在所述将所述第一相关性超过预设的第一相关性阈值的第一搜索关键词推送至所述目标账号的步骤之前,所述方法还包括:
当所述第一相关性超过预设的第一相关性阈值的第一搜索关键词的数量少于预设的数量阈值时,获取其他账号绑定的第一搜索关键词,返回执行计算所述第一搜索关键词与所述业务特征信息的第一相关性的步骤。
可选地,所述第一搜索关键词的价值系数大于预设的第二系数阈值,和/或,所述目标账号所属的第二行业与所述其他账号所属的第三行业之间的第四相关性、大于预设的第四相关性阈值。
根据本发明的另一方面,提供了一种搜索关键词的推送装置,包括:
第一搜索关键词查找模块,适于查找与目标账号的第一业务对象匹配的第一搜索关键词;
业务特征信息提取模块,适于提取所述目标账号的第一业务对象的业务特征信息;
相关性计算模块,适于计算所述第一搜索关键词与所述业务特征信息的第一相关性;
第一搜索关键词推送模块,适于将所述第一相关性超过预设的第一相关性阈值的第一搜索关键词推送至所述目标账号。
可选地,所述第一搜索关键词查找模块还适于:
查找基于在先记录的第二搜索关键词触发了展示操作及点击操作的第二业务对象;
查找触发了所述第二业务对象的展示操作及点击操作的第三搜索关键词;
查找基于所述第三搜索关键词触发了展示操作及点击操作的第三业务对象;
计算所述第二搜索关键词与所述第三业务对象的第二相关性;
当所述第二相关性超过预设的第二相关性阈值时,确定所述第二搜索关键与所述第三业务对象匹配。
可选地,所述业务特征信息提取模块还适于:
对所述第一业务对象绑定的第三搜索关键词进行分词处理,获得第一搜索分词;
对所述第一搜索分词配置权重。
可选地,所述业务特征信息提取模块还适于:
对所述第一搜索分词进行过滤处理。
可选地,所述权重包括以下的至少一种:
不包括近义词的词项频率,包括近义词的词项频率,不包括近义词的、词项频率-逆文档频率,包括近义词的、词项频率-逆文档频率。
可选地,所述相关性计算模块还适于:
对所述第一搜索关键词进行分词处理,获得第二搜索分词;
采用第一目标分词、第二目标分词与所述业务特征信息计算第一相关性;
其中,所述第一目标分词为所述目标账号已绑定的第二搜索分词,用于提高第一相关性;
所述第二目标分词为所述目标账号未绑定的第二搜索分词,用于降低第一相关性。
可选地,所述相关性计算模块还适于:
对所述第二搜索分词进行预处理;
其中,所述预处理包括以下的至少一种:
去重处理、近义词替换处理、合并处理。
可选地,还包括:
第一相关性进行调整模块,适于按照预设的业务规则对所述第一搜索关键词的第一相关性进行调整。
可选地,所述业务规则包括地域规则;所第一相关性进行调整模块还适于:
分别提取所述第一搜索关键词关联的第一地域词、所述第一业务对象绑定的第三搜索关键词关联的第二地域词;
确定关联第二地域词的第三搜索关键词的比例;
当所述第一地域词与所述第二地域词之间的关系符合预设的不匹配条件时,按照所述比例、所述不匹配条件对所述第一相关性进行降级处理。
可选地,所述第一地域词包括以下至少一种:
所述第一搜索关键词包含的地域词,所述第一搜索关键词包含的实体词所映射的地域词,所述第一搜索关键词包含、符合起点至终点模式中的终点地域词;
所述第二地域词包括以下至少一种:
所述第三搜索关键词包含的地域词,所述第三搜索关键词包含的实体词所映射的地域词,所述第三搜索关键词包含、符合起点至终点模式中的终点地域词。
可选地,所述业务规则包括价值规则;所第一相关性进行调整模块还适于:
基于所述第一搜索关键词对应的历史行为信息对所述第一搜索关键词计算价值系数;
当所述价值系数小于预设的第一系数阈值时,按照所述价值系数对所述第一相关性进行降级处理。
可选地,所述业务规则包括行业规则;所第一相关性进行调整模块还适于:
分别识别所述第一搜索关键词所属的第一行业、所述目标账号所属的第二行业;
计算所述第一行业与所述第二行业之间的第三相关性;
当所述第三相关性小于预设的第三相关性阈值时,按照所述第三相关性对所述第一相关性进行降级处理。
可选地,还包括:
第一搜索关键词获取模块,适于在所述第一相关性超过预设的第一相关性阈值的第一搜索关键词的数量少于预设的数量阈值时,获取其他账号绑定的第一搜索关键词,返回调用相关性计算模块。
可选地,所述第一搜索关键词的价值系数大于预设的第二系数阈值,和/或,所述目标账号所属的第二行业与所述其他账号所属的第三行业之间的第四相关性、大于预设的第四相关性阈值。
本发明实施例按照目标账号的第一业务对象的业务特征信息,计算与第一搜索关键词的第一相关性,以推送相应的第一搜索关键词至目标账号,通过挖掘目标账号的主营业务的进行相关性计算,大大提高了推送的第一搜索关键词的准确率,合适的搜索关键词可以带来理想的搜索效果,避免了反复绑定关键词的操作,避免了客户端和平台服务器多次响应绑定操作,大大减少了时间耗费,而且,大大降低了客户端和平台服务器的资源消耗。
本发明实施例采用二部图的结果作为候选集,大大降低了处理的数据量,能够更快地更新字典,使得推荐的第一搜索关键词更加符合目标账号近期的绑定行为,进一步提高了推送的第一搜索关键词的准确率。
本发明实施例通过业务规则调整第一相关性,对第一搜索关键词进行过滤,降低了不合适的第一搜索关键词的推送几率,进一步提高了推送的第一搜索关键词的准确率。
本发明实施例增加了其他账号绑定的第一搜索关键词进行相关性的计算,提高了第一搜索关键词的覆盖率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的一种搜索关键词的推送方法实施例1的步骤流程图;
图2示出了根据本发明一个实施例的一种搜索关键词的推送方法实施例2的步骤流程图;以及
图3示出了根据本发明一个实施例的一种搜索关键词的推送装置实施例的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参照图1,示出了根据本发明一个实施例的一种搜索关键词的推送方法实施例1的步骤流程图,具体可以包括如下步骤:
步骤101,查找与目标账号的第一业务对象匹配的第一搜索关键词;
需要说明的是,本发明实施例可以应用于网络平台,即独立的服务器或服务器集群,如分布式系统,其存储了海量的不同领域的业务对象。
在不同的业务领域中可以具有不同的业务对象,即体现该领域特性的数据。
例如,在通信领域中,业务对象可以为通信数据;在新闻媒体领域中,业务对象可以为新闻数据;在搜索领域中,业务对象可以为网页;在电子商务(Electronic Commerce,EC)领域中,业务对象可以为广告数据,等等。
在不同的业务领域中,虽然业务对象承载领域特性而有所不同,但其本质都是数据,例如,文本数据、图像数据、音频数据、视频数据等等,相对地,对业务对象的处理,本质都是对数据的处理。
为使本领域技术人员更好地理解本发明实施例,在本发明实施例中,将广告数据作为业务对象的一种示例进行说明。
在网络平台中,每个用户(包括自然人和企业)均可以配置至少一个账号,以管理其业务对象。
在竞争推广的方式中,一般需要对业务对象绑定搜索关键词。
网络平台为了方便用户绑定搜索关键词,往往会通过各种方式推荐搜索关键词。
例如,对于电子商务领域的广告数据,该绑定的搜索关键词可以为广告主为该广告数据购买的搜索关键词。
在本发明的一种可选实施例中,步骤101可以包括如下子步骤:
子步骤S11,查找基于在先记录的第二搜索关键词触发了展示操作及点击操作的第二业务对象;
子步骤S12,查找触发了所述第二业务对象的展示操作及点击操作的第三搜索关键词;
子步骤S13,查找基于所述第三搜索关键词触发了展示操作及点击操作的第三业务对象;
子步骤S14,计算所述第二搜索关键词与所述第三业务对象的第二相关性;
子步骤S15,当所述第二相关性超过预设的第二相关性阈值时,确定所述第二搜索关键与所述第三业务对象匹配。
在本发明实施例中,可以通过二部图的方式选择匹配的业务对象,,即根据搜索关键词触发业务对象的行为来计算该搜索关键词与该业务对象的相关性,进而得到该搜索关键词与相应账号的相关性。
以广告数据为例,广告主的账号之下具有一个或多个广告数据,广告数据绑定搜索关键词,若客户端提交该搜索关键词进行搜索,则提取相应的广告数据。
再通过一系列的优化、排序等操作后展示广告数据。
例如,通过RankScore=BidPrice×QS×eCTR、RankScore=eCTRα×BidPrice计算排序分,展示排序分最高的N个广告数据,N为正整数。
其中,RankScore为排序分,BidPrice为广告数据的竞价,eCTR为预估点击率(基于模型估算得到的业务对象的点击率,estimated CTR)、QS为质量参数(衡量搜索关键词与业务对象的匹配度)。
若展示的广告数据被点击,则按照其竞价BidPrice对广告主进行扣费。
而实际扣除的费用一般小于或等于该竞价BidPrice,如基于广义第二价格扣费GSP(General Second Price)进行计价,广告数据的实际的扣费一般小于其竞价,防止了广告主频繁调价带来的价格波动。
在二部图的方式中,对于客户端在先提交的第二搜索关键词qurey,统计由第二搜索关键词qurey触发展示并点击的第二业务对象ad。
对每个第二业务对象ad,统计触发第二业务对象ad的展示并点击的第三搜索关键词qurey’。
对每个第三搜索关键词qurey’,统计第三搜索关键词qurey’触发展示并点击的第三业务对象ad’。
对每个第三业务对象ad’,以触发概率等方式对路径(qurey-ad-qurey’-ad’)中的每条边配置权重,将权重相加,即可以得到第二搜索关键词qurey与第三业务对象ad’的第二相关性。
若该第二相关性超过预设的第二相关性阈值,则可以认为第二搜索关键与第三业务对象匹配。
对于目标账号而言,若第三业务对象为其所有,即为第一业务对象,则可以向其推荐第二搜索关键词,即为第一搜索关键词。
需要说明的是,第二搜索关键与第三业务对象匹配关系可以在离线进行计算,并写入字典中,在线时可以直接通过读字典查找第一业务对象匹配的第一搜索关键词。
当然,网络平台也可以在线计算第一业务对象匹配的第一搜索关键词,本发明实施例对此不加以限制。
本发明实施例采用二部图的结果作为候选集,大大降低了处理的数据量,能够更快地更新字典,使得推荐的第一搜索关键词更加符合目标账号近期的绑定行为,进一步提高了推送的第一搜索关键词的准确率。
步骤102,提取所述目标账号的第一业务对象的业务特征信息;
业务特征信息,可以为体现第一业务对象在业务领域中特性的信息。
例如,在电子商务领域中,业务特征信息可以为广告主的主营业务。
在本发明的一种可选实施例中,步骤102可以包括如下子步骤:
子步骤S21,对所述第一业务对象绑定的第三搜索关键词进行分词处理,获得第一搜索分词;
在实际应用中,可以通过以下的一种或多种方式进行分词处理:
1、基于字符串匹配的分词处理:按照一定的策略将待分析的汉字串与一个预置的机器词典中的词条进行匹配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。
2、基于特征扫描或标志切分的分词处理:优先在待分析字符串中识别和切分出一些带有明显特征的词,以这些词作为断点,可将原字符串分为较小的串再来进机械分词;或者将分词和词类标注结合起来,利用丰富的词类信息对分词决策提供帮助,并且在标注过程中又反过来对分词结果进行检验、调整。
3、基于理解的分词处理:在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象。
4、基于统计的分词处理:对语料中相邻共现的各个字的组合的频度进行统计,计算它们的互现信息,以及计算两个汉字X、Y的相邻共现概率。互现信息可以体现汉字之间结合关系的紧密程度,当紧密程度高于某一个阈值时,便可认为此字组可能构成了一个词。
子步骤S22,对所述第一搜索分词进行过滤处理;
对第一搜索分词进行过滤处理,可以过滤无意义的词。
在实际应用中,可以将第一搜索分词在预置的停用词库中匹配,过滤匹配成功的第一搜索分词。
停用词库中可以存储出现频率很高,但实际意义又不大的词,主要指副词、虚词、语气词等,如“是”、“而是”等。
子步骤S23,对所述第一搜索分词配置权重;
在具体实现中,对第一搜索分词配置权重的方式有多种,以TF(TermFrequency,表示一个term与某个文档的相关性)-IDF(Inverse DocumentFrequency,表示一个term表示某个文档的主题的权重大小)算法为例,权重可以包括以下的至少一种:
不包括近义词的词项频率tf,包括近义词的词项频率tf_synonym,不包括近义词的、词项频率-逆文档频率tf-idf,包括近义词的、词项频率-逆文档频率tf-idf_synonym;
其中,tf和idf分别表示词项频率和逆文档频率,*_synonym表示考虑近义词后的词项频率和逆文档频率。
例如,某个目标帐号绑定了包含“酒店”和“宾馆”这两个term(第一搜索关键词),其中“酒店”的数量2次,“宾馆”3次,若“酒店”和“宾馆”视为近义词,则“酒店”和“宾馆”的tf分别为2和3,tf_synonym则同为5,tf-idf考虑近义词的方法同tf。
当然,上述TF-IDF算法配置权重的方式只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他配置权重的方式,如动态权重,本发明实施例对此不加以限制。另外,除了上述配置权重的方式外,本领域技术人员还可以根据实际需要采用其它配置权重的方式,本发明实施例对此也不加以限制。
本发明实施例通过对目标账号绑定的第三搜索关键词进行分词,并对分词后得到的词项(term,即第一搜索分词)进行过滤(即提取地域特征)并配置权重。
词项与权重的集合就构成了该目标账号的签名,词项反映目标账号的主营业务,而权重表示该目标账号对当前词项所反映业务的兴趣度。
步骤103,计算所述第一搜索关键词与所述业务特征信息的第一相关性;
在具体实现中,可以通过目标账号所属的用户对线上的第一搜索关键词的接受行为计算其与新的第一搜索关键词的相关性。
在本发明的一种可选实施例中,步骤103可以包括如下子步骤:
子步骤S31,对所述第一搜索关键词进行分词处理,获得第二搜索分词;
在本发明实施例中,对w(第一搜索关键词)进行分词,可以得到term(第二搜索分词)的集合。
子步骤S32,对所述第二搜索分词进行预处理;
其中,所述预处理可以包括以下的至少一种:
去重处理、近义词替换处理、合并处理。
在本发明实施例中,对term(第二搜索分词)集合进行去重、近义词替换与合并等预处理,可以得到新的term(第二搜索分词)集合。
子步骤S33,采用第一目标分词、第二目标分词与所述业务特征信息计算第一相关性;
其中,所述第一目标分词为所述目标账号已绑定的第二搜索分词,用于提高第一相关性;
所述第二目标分词为所述目标账号未绑定的第二搜索分词,用于降低第一相关性。
对新的term(第二搜索分词)集合中的term进行分类:
第一类为目标账号已绑定的term(第二搜索分词),对第一相关性计算起正向作用;
第二类为目标账号未绑定的term(第二搜索分词),对第一相关性计算起负向作用。
在一个可选示例中,term(第二搜索分词)加权模型可以分为两个部分,分别对应两类term,计算公式如下:
其中,t表示对w进行分词并预处理后得到的term集合中的term,purchase(u)表示目标账号已绑定的term集合,tf_idf_synonym(u,t)表示目标账号已绑定的term t的tf_idf_synonym特征值,max_tf_idf_synonym(u)表示目标账号已绑定的term中tf_idf_synonym的最大值,max_tf_idf_synonym(t)表示term t被所有账号绑定的tf_idf_synonym的最大值,max_tf_idf_synonym表示所有账号所有term的tf_idf_synonym的最大值。
当然,上述第一相关性的计算方式只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他计算方式,如以采用SVM模型或FM模型进行回归分析,在回归分析的过程中,业务特征信息选择的过程也有多种方法,如目标账号与第一搜索关键词之间的相关度信息、目标账号与第一搜索关键词之间主题的相似程度等,本发明实施例对此不加以限制。另外,除了上述计算方式外,本领域技术人员还可以根据实际需要采用其它计算方式,本发明实施例对此也不加以限制。
步骤104,将所述第一相关性超过预设的第一相关性阈值的第一搜索关键词推送至所述目标账号。
若第一相关性超过预设的第一相关性阈值,则可以表示第一搜索关键词与目标账号的业务特征信息匹配,可以推送至目标账号,如推送至目标账号登录的客户端、发送邮件等等。
对于电子商务领域的广告数据而言,本发明实施例提高了广告主获得的搜索关键词与该广告主的相关度,这会使广告主更有欲望购买搜索关键词,并且改良了广告平台在广告主心中的印象,长远上看会提高广告主与广告平台的粘性。
参照图2,示出了根据本发明一个实施例的一种搜索关键词的推送方法实施例2的步骤流程图,具体可以包括如下步骤:
步骤201,查找与目标账号的第一业务对象匹配的第一搜索关键词;
步骤202,提取所述目标账号的第一业务对象的业务特征信息;
步骤203,计算所述第一搜索关键词与所述业务特征信息的第一相关性;
步骤204,按照预设的业务规则对所述第一搜索关键词的第一相关性进行调整;
应用本发明实施例,可以针对不同的业务特性,设置不同的业务规则,对第一搜索关键词进行筛选。
在本发明的一种可选实施例中,该业务规则可以包括地域规则,则在本发明实施例中,步骤204可以包括如下子步骤:
子步骤S41,分别提取所述第一搜索关键词关联的第一地域词、所述第一业务对象绑定的第三搜索关键词关联的第二地域词;
在具体实现中,第一地域词可以包括以下至少一种:
1、第一搜索关键词包含的地域词,如“北京”、“上海”等;
2、第一搜索关键词包含的实体词所映射的地域词,即学校名、医院名、旅游景点等实体词可以映射为该实体所在的地域,如实体词“北医三院”,虽然不包含地域词,但是可以映射得到地域词“北京”;
3、第一搜索关键词包含、符合起点至终点(start-end)模式中的终点地域词;
即第一搜索关键词的地域词中包含两个地域词,并且符合一定的模式,如“北京到上海飞机”,包含两个地域词“北京”和“上海”,符合模式“地域词到地域词”,则表示第一搜索关键词符合start-end模式。
对第一搜索关键词中包含的所有地域词,去除start-end模式关键词中的start地域词(即模式的第一个地域词)后,获得end地域词(终点地域词,即模式的第二个地域词)作为第一搜索关键词实际关联的地域词。
此外,第二地域词可以包括以下至少一种:
1、第三搜索关键词包含的地域词;
2、第三搜索关键词包含的实体词所映射的地域词;
例如,账号u1绑定了第三搜索关键词“济南宾馆”,其包含地域词“济南”,账号u2绑定了第三搜索关键词“趵突泉旅游”,其包含实体词“趵突泉”,而“趵突泉”所在地域为济南,则可以认为账号u1和账号u2都绑定了地域词“济南”。
3、第三搜索关键词包含、符合起点至终点模式中的终点地域词。
例如,账号u1绑定了两个第三搜索关键词:“北京到上海旅游”和“济南宾馆”,则账号u1实际关注的地域视为上海和济南,而去除北京。
子步骤S42,确定关联第二地域词的第三搜索关键词的比例;
子步骤S43,当所述第一地域词与所述第二地域词之间的关系符合预设的不匹配条件时,按照所述比例、所述不匹配条件对所述第一相关性进行降级处理;
若第一地域词与第二地域词之间的关系符合预设的不匹配条件,则可以表示两者不匹配,可以对第一相关性进行降级处理,否则,保持第一相关性不变。
在实际应用中,降级处理可以为对第一相关性配置衰减权重,其中,0≤衰减权重<1。
将目标行号绑定的第三搜索关键词中,包含地域词的第三搜索关键词所占的比例,记为ratio。
推荐的第一搜索关键词中包含的地域词和目标账号绑定的第三搜索关键词中包含地域词之间的关系和相关性调整规则示例如下:
a、第三搜索关键词与第一搜索关键词包含相同地域;第三搜索关键词与第一搜索关键词包含相同市级地域;第三搜索关键词包含市级地域,第一搜索关键词包含该市以下地域:
第一相关性不变。
在本示例中,第三搜索关键词与第一搜索关键词匹配,相关性不变;
b、第三搜索关键词包含省级地域,第一搜索关键词包含该省以下地域(不匹配条件):
若ratio≥0.4,第一相关性*0.6
若ratio<0.4,第一相关性*(-log(0.4+ratio/3))
在本示例中,第三搜索关键词与第一搜索关键词不匹配,衰减权重为0.6或-log(0.4+ratio/3);
c、第三搜索关键词包含市级别地域,第一搜索关键词包含该市所属的省级地域(不匹配条件):
若ratio≥0.4,第一相关性*0.4
若ratio<0.4,第一相关性*(-log(0.45+ratio/2))
在本示例中,第三搜索关键词与第一搜索关键词不匹配,衰减权重为0.4或-log(0.45+ratio/2);
d、第三搜索关键词包含市级别地域,第一搜索关键词包含同省中的不同市级地域(不匹配条件):
若ratio≥0.4,第一相关性*0.2
若ratio<0.4,第一相关性*(-log(0.7+ratio/4))
在本示例中,第三搜索关键词与第一搜索关键词不匹配,衰减权重为0.4或-log(0.7+ratio/4);
e、第三搜索关键词与第一搜索关键词包含不同的省级地域(不匹配条件):
若ratio≥0.4,第一相关性*0
若ratio<0.4,第一相关性*(-log(0.9+ratio/4))
在本示例中,第三搜索关键词与第一搜索关键词不匹配,衰减权重为0或-log(0.9+ratio/4)。
当然,上述权重配置方式只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他权重配置方式,本发明实施例对此不加以限制。另外,除了上述权重配置方式外,本领域技术人员还可以根据实际需要采用其它权重配置方式,本发明实施例对此也不加以限制。
在本发明的另一种可选实施例中,业务规则可以包括价值规则,则在本发明实施例中,步骤204可以包括如下子步骤:
子步骤S51,基于所述第一搜索关键词对应的历史行为信息对所述第一搜索关键词计算价值系数;
在不同的业务领域中,具有不同的价值计算规则,以电子商务领域的广告数据为例,诸如展示操作、点击操作、购买操作、消耗值(即扣费)等历史行为信息可以提高第一搜索关键词的价值系数。
子步骤S52,当所述价值系数小于预设的第一系数阈值时,按照所述价值系数对所述第一相关性进行降级处理。
若价值系数小于预设的第一系数阈值,表示该价值系数较低,则可以对第一相关性进行降级处理,否则,保持第一相关性不变。
在实际应用中,降级处理可以为对第一相关性配置衰减权重,其中,0≤衰减权重<1。
其中,价值系数越低,衰减权重越低;价值系数越高,衰减权重越高。
在本发明的另一种可选实施例中,业务规则可以包括行业规则,则在本发明实施例中,步骤204可以包括如下子步骤:
子步骤S61,分别识别所述第一搜索关键词所属的第一行业、所述目标账号所属的第二行业;
在实际应用中,可以通过分类模型对第一搜索关键词进行行业的分类,通过目标账号绑定的第三搜索关键词进行行业的分类。
子步骤S62,计算所述第一行业与所述第二行业之间的第三相关性;
子步骤S63,当所述第三相关性小于预设的第三相关性阈值时,按照所述第三相关性对所述第一相关性进行降级处理。
若第三相关性小于预设的第三相关性阈值,表示两者的相关性较差,则可以对第一相关性进行降级处理,否则,保持第一相关性不变。
在实际应用中,降级处理可以为对第一相关性配置衰减权重,其中,0≤衰减权重<1。
其中,第三相关性越低,衰减权重越低;第三相关性越高,衰减权重越高。
当然,上述业务规则只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他业务规则,本发明实施例对此不加以限制。另外,除了上述业务规则外,本领域技术人员还可以根据实际需要采用其它业务规则,本发明实施例对此也不加以限制。
本发明实施例通过业务规则调整第一相关性,对第一搜索关键词进行过滤,降低了不合适的第一搜索关键词的推送几率,进一步提高了推送的第一搜索关键词的准确率。
步骤205,当所述第一相关性超过预设的第一相关性阈值的第一搜索关键词的数量少于预设的数量阈值时,获取其他账号绑定的第一搜索关键词,返回执行步骤203;
在本发明实施例中,可以对目标账号得到的第一搜索关键词的数量设定一个数量阈值,若推荐的第一搜索关键词低于该数量阈值,则可以补充第一搜索关键词,即将其他账号绑定的第一搜索关键词,如广告主的购买的搜索关键词,作为给该目标账号进行推荐的备选集合,再次计算相关性进行推荐。
进一步而言,由于其他账号绑定的第一搜索关键词的数量众多,因此,可以对其他账号绑定的第一搜索关键词进行筛选。
在一个可选示例中,筛选的规则示例如下:
第一搜索关键词的价值系数大于预设的第二系数阈值;
1、若第一搜索关键词的价值系数大于预设的第二系数阈值,表示该价值系数较低,则可以选择该第一搜索关键词。
需要说明的是,第一系数阈值与第二系数阈值可以为相同的系数阈值,也可以为不同的系数阈值,本发明实施例对此不加以限制。
和/或,
2、目标账号所属的第二行业与其他账号所属的第三行业之间的第四相关性、大于预设的第四相关性阈值。
在实际应用中,可以通过其他账号绑定的第一搜索关键词进行行业的分类。
若第四相关性大于预设的第四相关性阈值,表示两者的相关性较好,则可以选择该第一搜索关键词。
需要说明的是,第一相关性阈值、第二相关性阈值、第三相关性阈值与第四相关性阈值可以为相同的相关性阈值,也可以为不同的相关性阈值,本发明实施例对此不加以限制。
本发明实施例增加了其他账号绑定的第一搜索关键词进行相关性的计算,提高了第一搜索关键词的覆盖率。
对于电子商务领域的广告数据,这将使更多广告主使用广告平台,增加了搜索关键词购买几率。
步骤206,将所述第一相关性超过预设的第一相关性阈值的第一搜索关键词推送至所述目标账号。
对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图3,示出了根据本发明一个实施例的一种搜索关键词的推送装置实施例的结构框图,具体可以包括如下模块:
第一搜索关键词查找模块301,适于查找与目标账号的第一业务对象匹配的第一搜索关键词;
业务特征信息提取模块302,适于提取所述目标账号的第一业务对象的业务特征信息;
相关性计算模块303,适于计算所述第一搜索关键词与所述业务特征信息的第一相关性;
第一搜索关键词推送模块304,适于将所述第一相关性超过预设的第一相关性阈值的第一搜索关键词推送至所述目标账号。
在本发明的一种可选实施例中,所述第一搜索关键词查找模块301还可以适于:
查找基于在先记录的第二搜索关键词触发了展示操作及点击操作的第二业务对象;
查找触发了所述第二业务对象的展示操作及点击操作的第三搜索关键词;
查找基于所述第三搜索关键词触发了展示操作及点击操作的第三业务对象;
计算所述第二搜索关键词与所述第三业务对象的第二相关性;
当所述第二相关性超过预设的第二相关性阈值时,确定所述第二搜索关键与所述第三业务对象匹配。
在本发明的一种可选实施例中,所述业务特征信息提取模块302还可以适于:
对所述第一业务对象绑定的第三搜索关键词进行分词处理,获得第一搜索分词;
对所述第一搜索分词配置权重。
在本发明的一种可选实施例中,所述业务特征信息提取模块302还可以适于:
对所述第一搜索分词进行过滤处理。
在具体实现中,所述权重可以包括以下的至少一种:
不包括近义词的词项频率,包括近义词的词项频率,不包括近义词的、词项频率-逆文档频率,包括近义词的、词项频率-逆文档频率。
在本发明的一种可选实施例中,所述相关性计算模块303还可以适于:
对所述第一搜索关键词进行分词处理,获得第二搜索分词;
采用第一目标分词、第二目标分词与所述业务特征信息计算第一相关性;
其中,所述第一目标分词为所述目标账号已绑定的第二搜索分词,用于提高第一相关性;
所述第二目标分词为所述目标账号未绑定的第二搜索分词,用于降低第一相关性。
在本发明的一种可选实施例中,所述相关性计算模块303还可以适于:
对所述第二搜索分词进行预处理;
其中,所述预处理包括以下的至少一种:
去重处理、近义词替换处理、合并处理。
在本发明的一种可选实施例中,该装置还可以包括如下模块:
第一相关性进行调整模块,适于按照预设的业务规则对所述第一搜索关键词的第一相关性进行调整。
在本发明的一种可选实施例中,所述业务规则可以包括地域规则;所第一相关性进行调整模块还可以适于:
分别提取所述第一搜索关键词关联的第一地域词、所述第一业务对象绑定的第三搜索关键词关联的第二地域词;
确定关联第二地域词的第三搜索关键词的比例;
当所述第一地域词与所述第二地域词之间的关系符合预设的不匹配条件时,按照所述比例、所述不匹配条件对所述第一相关性进行降级处理。
在实际应用中,所述第一地域词可以包括以下至少一种:
所述第一搜索关键词包含的地域词,所述第一搜索关键词包含的实体词所映射的地域词,所述第一搜索关键词包含、符合起点至终点模式中的终点地域词;
所述第二地域词可以包括以下至少一种:
所述第三搜索关键词包含的地域词,所述第三搜索关键词包含的实体词所映射的地域词,所述第三搜索关键词包含、符合起点至终点模式中的终点地域词。
在本发明的一种可选实施例中,所述业务规则可以包括价值规则;所第一相关性进行调整模块还可以适于:
基于所述第一搜索关键词对应的历史行为信息对所述第一搜索关键词计算价值系数;
当所述价值系数小于预设的第一系数阈值时,按照所述价值系数对所述第一相关性进行降级处理。
在本发明的一种可选实施例中,所述业务规则可以包括行业规则;所第一相关性进行调整模块还可以适于:
分别识别所述第一搜索关键词所属的第一行业、所述目标账号所属的第二行业;
计算所述第一行业与所述第二行业之间的第三相关性;
当所述第三相关性小于预设的第三相关性阈值时,按照所述第三相关性对所述第一相关性进行降级处理。
在本发明的一种可选实施例中,该装置还可以包括如下模块:
第一搜索关键词获取模块,适于在所述第一相关性超过预设的第一相关性阈值的第一搜索关键词的数量少于预设的数量阈值时,获取其他账号绑定的第一搜索关键词,返回调用相关性计算模块303。
在实际应用中,所述第一搜索关键词的价值系数大于预设的第二系数阈值,和/或,所述目标账号所属的第二行业与所述其他账号所属的第三行业之间的第四相关性、大于预设的第四相关性阈值。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的搜索关键词的推送设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明实施例公开了A1、一种搜索关键词的推送方法,包括:查找与目标账号的第一业务对象匹配的第一搜索关键词;提取所述目标账号的第一业务对象的业务特征信息;计算所述第一搜索关键词与所述业务特征信息的第一相关性;将所述第一相关性超过预设的第一相关性阈值的第一搜索关键词推送至所述目标账号。A2、如A1所述的方法,所述查找与目标账号的第一业务对象匹配的第一搜索关键词的步骤包括:查找基于在先记录的第二搜索关键词触发了展示操作及点击操作的第二业务对象;查找触发了所述第二业务对象的展示操作及点击操作的第三搜索关键词;查找基于所述第三搜索关键词触发了展示操作及点击操作的第三业务对象;计算所述第二搜索关键词与所述第三业务对象的第二相关性;当所述第二相关性超过预设的第二相关性阈值时,确定所述第二搜索关键与所述第三业务对象匹配。A3、如A1所述的方法,所述提取所述目标账号的第一业务对象的业务特征信息的步骤包括:对所述第一业务对象绑定的第三搜索关键词进行分词处理,获得第一搜索分词;对所述第一搜索分词配置权重。A4、如A3所述的方法,所述提取所述目标账号的第一业务对象的业务特征信息的步骤还包括:对所述第一搜索分词进行过滤处理。A5、如A3所述的方法,所述权重包括以下的至少一种:不包括近义词的词项频率,包括近义词的词项频率,不包括近义词的、词项频率-逆文档频率,包括近义词的、词项频率-逆文档频率。A6、如A1或A2或A3或A4或A5所述的方法,所述计算所述第一搜索关键词与所述业务特征信息的第一相关性的步骤包括:对所述第一搜索关键词进行分词处理,获得第二搜索分词;采用第一目标分词、第二目标分词与所述业务特征信息计算第一相关性;其中,所述第一目标分词为所述目标账号已绑定的第二搜索分词,用于提高第一相关性;所述第二目标分词为所述目标账号未绑定的第二搜索分词,用于降低第一相关性。A7、如A6所述的方法,所述计算所述第一搜索关键词与所述业务特征信息的第一相关性的步骤还包括:对所述第二搜索分词进行预处理;其中,所述预处理包括以下的至少一种:去重处理、近义词替换处理、合并处理。A8、如A1或A2或A3或A4或A5或A7所述的方法,在所述将所述第一相关性超过预设的第一相关性阈值的第一搜索关键词推送至所述目标账号的步骤之前,所述方法还包括:按照预设的业务规则对所述第一搜索关键词的第一相关性进行调整。A9、如A8所述的方法,所述业务规则包括地域规则;所述按照预设的业务规则对所述第一搜索关键词的第一相关性进行调整的步骤包括:分别提取所述第一搜索关键词关联的第一地域词、所述第一业务对象绑定的第三搜索关键词关联的第二地域词;确定关联第二地域词的第三搜索关键词的比例;当所述第一地域词与所述第二地域词之间的关系符合预设的不匹配条件时,按照所述比例、所述不匹配条件对所述第一相关性进行降级处理。A10、如A9所述的方法,所述第一地域词包括以下至少一种:所述第一搜索关键词包含的地域词,所述第一搜索关键词包含的实体词所映射的地域词,所述第一搜索关键词包含、符合起点至终点模式中的终点地域词;所述第二地域词包括以下至少一种:所述第三搜索关键词包含的地域词,所述第三搜索关键词包含的实体词所映射的地域词,所述第三搜索关键词包含、符合起点至终点模式中的终点地域词。A11、如A8所述的方法,所述业务规则包括价值规则;所述按照预设的业务规则对所述第一搜索关键词的第一相关性进行调整的步骤包括:基于所述第一搜索关键词对应的历史行为信息对所述第一搜索关键词计算价值系数;当所述价值系数小于预设的第一系数阈值时,按照所述价值系数对所述第一相关性进行降级处理。A12、如A8所述的方法,所述业务规则包括行业规则;所述按照预设的业务规则对所述第一搜索关键词的第一相关性进行调整的步骤包括:分别识别所述第一搜索关键词所属的第一行业、所述目标账号所属的第二行业;计算所述第一行业与所述第二行业之间的第三相关性;当所述第三相关性小于预设的第三相关性阈值时,按照所述第三相关性对所述第一相关性进行降级处理。A13、如A1或A2或A3或A4或A5或A7或A9或A10或A11或A12所述的方法,在所述将所述第一相关性超过预设的第一相关性阈值的第一搜索关键词推送至所述目标账号的步骤之前,所述方法还包括:当所述第一相关性超过预设的第一相关性阈值的第一搜索关键词的数量少于预设的数量阈值时,获取其他账号绑定的第一搜索关键词,返回执行计算所述第一搜索关键词与所述业务特征信息的第一相关性的步骤。A14、如A13所述的方法,所述第一搜索关键词的价值系数大于预设的第二系数阈值,和/或,所述目标账号所属的第二行业与所述其他账号所属的第三行业之间的第四相关性、大于预设的第四相关性阈值。
本发明实施例还公开了B15、一种搜索关键词的推送装置,包括:第一搜索关键词查找模块,适于查找与目标账号的第一业务对象匹配的第一搜索关键词;业务特征信息提取模块,适于提取所述目标账号的第一业务对象的业务特征信息;相关性计算模块,适于计算所述第一搜索关键词与所述业务特征信息的第一相关性;第一搜索关键词推送模块,适于将所述第一相关性超过预设的第一相关性阈值的第一搜索关键词推送至所述目标账号。B16、如B15所述的装置,所述第一搜索关键词查找模块还适于:查找基于在先记录的第二搜索关键词触发了展示操作及点击操作的第二业务对象;查找触发了所述第二业务对象的展示操作及点击操作的第三搜索关键词;查找基于所述第三搜索关键词触发了展示操作及点击操作的第三业务对象;计算所述第二搜索关键词与所述第三业务对象的第二相关性;当所述第二相关性超过预设的第二相关性阈值时,确定所述第二搜索关键与所述第三业务对象匹配。B17、如B15所述的装置,所述业务特征信息提取模块还适于:对所述第一业务对象绑定的第三搜索关键词进行分词处理,获得第一搜索分词;对所述第一搜索分词配置权重。B18、如B17所述的装置,所述业务特征信息提取模块还适于:对所述第一搜索分词进行过滤处理。B19、如B17所述的装置,所述权重包括以下的至少一种:不包括近义词的词项频率,包括近义词的词项频率,不包括近义词的、词项频率-逆文档频率,包括近义词的、词项频率-逆文档频率。B20、如B15或B16或B17或B18或B19所述的装置,所述相关性计算模块还适于:对所述第一搜索关键词进行分词处理,获得第二搜索分词;采用第一目标分词、第二目标分词与所述业务特征信息计算第一相关性;其中,所述第一目标分词为所述目标账号已绑定的第二搜索分词,用于提高第一相关性;所述第二目标分词为所述目标账号未绑定的第二搜索分词,用于降低第一相关性。B21、如B20所述的装置,所述相关性计算模块还适于:对所述第二搜索分词进行预处理;其中,所述预处理包括以下的至少一种:去重处理、近义词替换处理、合并处理。B22、如B15或B16或B17或B18或B19或B21所述的装置,还包括:第一相关性进行调整模块,适于按照预设的业务规则对所述第一搜索关键词的第一相关性进行调整。B23、如B22所述的装置,所述业务规则包括地域规则;所第一相关性进行调整模块还适于:分别提取所述第一搜索关键词关联的第一地域词、所述第一业务对象绑定的第三搜索关键词关联的第二地域词;确定关联第二地域词的第三搜索关键词的比例;当所述第一地域词与所述第二地域词之间的关系符合预设的不匹配条件时,按照所述比例、所述不匹配条件对所述第一相关性进行降级处理。B24、如B23所述的装置,所述第一地域词包括以下至少一种:所述第一搜索关键词包含的地域词,所述第一搜索关键词包含的实体词所映射的地域词,所述第一搜索关键词包含、符合起点至终点模式中的终点地域词;所述第二地域词包括以下至少一种:所述第三搜索关键词包含的地域词,所述第三搜索关键词包含的实体词所映射的地域词,所述第三搜索关键词包含、符合起点至终点模式中的终点地域词。B25、如B22所述的装置,所述业务规则包括价值规则;所第一相关性进行调整模块还适于:基于所述第一搜索关键词对应的历史行为信息对所述第一搜索关键词计算价值系数;当所述价值系数小于预设的第一系数阈值时,按照所述价值系数对所述第一相关性进行降级处理。B26、如B22所述的装置,所述业务规则包括行业规则;所第一相关性进行调整模块还适于:分别识别所述第一搜索关键词所属的第一行业、所述目标账号所属的第二行业;计算所述第一行业与所述第二行业之间的第三相关性;当所述第三相关性小于预设的第三相关性阈值时,按照所述第三相关性对所述第一相关性进行降级处理。B27、如B15或B16或B17或B18或B19或B21或B23或B24或B25或B26所述的装置,还包括:第一搜索关键词获取模块,适于在所述第一相关性超过预设的第一相关性阈值的第一搜索关键词的数量少于预设的数量阈值时,获取其他账号绑定的第一搜索关键词,返回调用相关性计算模块。B28、如B27所述的装置,所述第一搜索关键词的价值系数大于预设的第二系数阈值,和/或,所述目标账号所属的第二行业与所述其他账号所属的第三行业之间的第四相关性、大于预设的第四相关性阈值。

Claims (10)

1.一种搜索关键词的推送方法,包括:
查找与目标账号的第一业务对象匹配的第一搜索关键词;
提取所述目标账号的第一业务对象的业务特征信息;
计算所述第一搜索关键词与所述业务特征信息的第一相关性;
将所述第一相关性超过预设的第一相关性阈值的第一搜索关键词推送至所述目标账号。
2.如权利要求1所述的方法,其特征在于,所述查找与目标账号的第一业务对象匹配的第一搜索关键词的步骤包括:
查找基于在先记录的第二搜索关键词触发了展示操作及点击操作的第二业务对象;
查找触发了所述第二业务对象的展示操作及点击操作的第三搜索关键词;
查找基于所述第三搜索关键词触发了展示操作及点击操作的第三业务对象;
计算所述第二搜索关键词与所述第三业务对象的第二相关性;
当所述第二相关性超过预设的第二相关性阈值时,确定所述第二搜索关键与所述第三业务对象匹配。
3.如权利要求1所述的方法,其特征在于,所述提取所述目标账号的第一业务对象的业务特征信息的步骤包括:
对所述第一业务对象绑定的第三搜索关键词进行分词处理,获得第一搜索分词;
对所述第一搜索分词配置权重。
4.如权利要求3所述的方法,其特征在于,所述提取所述目标账号的第一业务对象的业务特征信息的步骤还包括:
对所述第一搜索分词进行过滤处理。
5.如权利要求3所述的方法,其特征在于,所述权重包括以下的至少一种:
不包括近义词的词项频率,包括近义词的词项频率,不包括近义词的、词项频率-逆文档频率,包括近义词的、词项频率-逆文档频率。
6.如权利要求1或2或3或4或5所述的方法,其特征在于,所述计算所述第一搜索关键词与所述业务特征信息的第一相关性的步骤包括:
对所述第一搜索关键词进行分词处理,获得第二搜索分词;
采用第一目标分词、第二目标分词与所述业务特征信息计算第一相关性;
其中,所述第一目标分词为所述目标账号已绑定的第二搜索分词,用于提高第一相关性;
所述第二目标分词为所述目标账号未绑定的第二搜索分词,用于降低第一相关性。
7.如权利要求6所述的方法,其特征在于,所述计算所述第一搜索关键词与所述业务特征信息的第一相关性的步骤还包括:
对所述第二搜索分词进行预处理;
其中,所述预处理包括以下的至少一种:
去重处理、近义词替换处理、合并处理。
8.如权利要求1或2或3或4或5或7所述的方法,其特征在于,在所述将所述第一相关性超过预设的第一相关性阈值的第一搜索关键词推送至所述目标账号的步骤之前,所述方法还包括:
按照预设的业务规则对所述第一搜索关键词的第一相关性进行调整。
9.如权利要求8所述的方法,其特征在于,所述业务规则包括地域规则;所述按照预设的业务规则对所述第一搜索关键词的第一相关性进行调整的步骤包括:
分别提取所述第一搜索关键词关联的第一地域词、所述第一业务对象绑定的第三搜索关键词关联的第二地域词;
确定关联第二地域词的第三搜索关键词的比例;
当所述第一地域词与所述第二地域词之间的关系符合预设的不匹配条件时,按照所述比例、所述不匹配条件对所述第一相关性进行降级处理。
10.一种搜索关键词的推送装置,包括:
第一搜索关键词查找模块,适于查找与目标账号的第一业务对象匹配的第一搜索关键词;
业务特征信息提取模块,适于提取所述目标账号的第一业务对象的业务特征信息;
相关性计算模块,适于计算所述第一搜索关键词与所述业务特征信息的第一相关性;
第一搜索关键词推送模块,适于将所述第一相关性超过预设的第一相关性阈值的第一搜索关键词推送至所述目标账号。
CN201510527367.3A 2015-08-25 2015-08-25 一种搜索关键词的推送方法和装置 Pending CN106484698A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510527367.3A CN106484698A (zh) 2015-08-25 2015-08-25 一种搜索关键词的推送方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510527367.3A CN106484698A (zh) 2015-08-25 2015-08-25 一种搜索关键词的推送方法和装置

Publications (1)

Publication Number Publication Date
CN106484698A true CN106484698A (zh) 2017-03-08

Family

ID=58234194

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510527367.3A Pending CN106484698A (zh) 2015-08-25 2015-08-25 一种搜索关键词的推送方法和装置

Country Status (1)

Country Link
CN (1) CN106484698A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107463600A (zh) * 2017-06-12 2017-12-12 百度在线网络技术(北京)有限公司 广告投放关键词推荐方法及装置、广告投放方法及装置
CN109189814A (zh) * 2018-08-28 2019-01-11 南京榕树自动化系统有限公司 一种基于一次设备告警信息特征的预案主动推送方法
CN109740046A (zh) * 2018-11-22 2019-05-10 北京网聘咨询有限公司 基于互联网招聘的空中双选会平台
CN109933805A (zh) * 2019-03-26 2019-06-25 深圳Tcl数字技术有限公司 文本解析方法、系统及计算机可读存储介质
CN110020151A (zh) * 2017-12-01 2019-07-16 北京搜狗科技发展有限公司 一种数据处理方法、装置、电子设备以及存储介质
CN110490712A (zh) * 2019-08-21 2019-11-22 浙江中国轻纺城网络有限公司 一种商品类目搜索方法、系统及存储介质
CN113515709A (zh) * 2021-07-09 2021-10-19 北京字节跳动网络技术有限公司 一种搜索信息展示方法、装置、计算机设备及存储介质
CN115329760A (zh) * 2022-10-17 2022-11-11 南京中教畅享互联网科技有限公司 一种推广关键词模拟筛选方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101650731A (zh) * 2009-08-31 2010-02-17 浙江大学 基于用户反馈的赞助搜索广告的建议关键词生成方法
KR20100092145A (ko) * 2009-02-12 2010-08-20 엔에이치엔(주) 연관도 사전을 이용한 검색 모델링 시스템 및 방법
CN102360358A (zh) * 2011-09-28 2012-02-22 百度在线网络技术(北京)有限公司 关键词推荐方法及系统
CN103136224A (zh) * 2011-11-24 2013-06-05 百度时代网络技术(北京)有限公司 一种关键词的推荐方法和装置
CN103377232A (zh) * 2012-04-25 2013-10-30 阿里巴巴集团控股有限公司 标题关键词推荐方法及系统
CN103425687A (zh) * 2012-05-21 2013-12-04 阿里巴巴集团控股有限公司 一种基于关键词的检索方法和系统
CN104123285A (zh) * 2013-04-24 2014-10-29 阿里巴巴集团控股有限公司 搜索结果的导航方法及装置
CN104731837A (zh) * 2013-12-22 2015-06-24 祁勇 一种基于辅助关键词的广告投放方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100092145A (ko) * 2009-02-12 2010-08-20 엔에이치엔(주) 연관도 사전을 이용한 검색 모델링 시스템 및 방법
CN101650731A (zh) * 2009-08-31 2010-02-17 浙江大学 基于用户反馈的赞助搜索广告的建议关键词生成方法
CN102360358A (zh) * 2011-09-28 2012-02-22 百度在线网络技术(北京)有限公司 关键词推荐方法及系统
CN103136224A (zh) * 2011-11-24 2013-06-05 百度时代网络技术(北京)有限公司 一种关键词的推荐方法和装置
CN103377232A (zh) * 2012-04-25 2013-10-30 阿里巴巴集团控股有限公司 标题关键词推荐方法及系统
CN103425687A (zh) * 2012-05-21 2013-12-04 阿里巴巴集团控股有限公司 一种基于关键词的检索方法和系统
CN104123285A (zh) * 2013-04-24 2014-10-29 阿里巴巴集团控股有限公司 搜索结果的导航方法及装置
CN104731837A (zh) * 2013-12-22 2015-06-24 祁勇 一种基于辅助关键词的广告投放方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107463600A (zh) * 2017-06-12 2017-12-12 百度在线网络技术(北京)有限公司 广告投放关键词推荐方法及装置、广告投放方法及装置
CN110020151A (zh) * 2017-12-01 2019-07-16 北京搜狗科技发展有限公司 一种数据处理方法、装置、电子设备以及存储介质
CN109189814A (zh) * 2018-08-28 2019-01-11 南京榕树自动化系统有限公司 一种基于一次设备告警信息特征的预案主动推送方法
CN109740046A (zh) * 2018-11-22 2019-05-10 北京网聘咨询有限公司 基于互联网招聘的空中双选会平台
CN109933805A (zh) * 2019-03-26 2019-06-25 深圳Tcl数字技术有限公司 文本解析方法、系统及计算机可读存储介质
CN110490712A (zh) * 2019-08-21 2019-11-22 浙江中国轻纺城网络有限公司 一种商品类目搜索方法、系统及存储介质
CN113515709A (zh) * 2021-07-09 2021-10-19 北京字节跳动网络技术有限公司 一种搜索信息展示方法、装置、计算机设备及存储介质
CN115329760A (zh) * 2022-10-17 2022-11-11 南京中教畅享互联网科技有限公司 一种推广关键词模拟筛选方法及系统

Similar Documents

Publication Publication Date Title
CN106484698A (zh) 一种搜索关键词的推送方法和装置
CN102279851B (zh) 一种智能导航方法、装置和系统
CN104636402B (zh) 一种业务对象的分类、搜索、推送方法和系统
US9934293B2 (en) Generating search results
CN105765573B (zh) 网站通信量优化方面的改进
CN105243129A (zh) 商品属性特征词聚类方法
CN108319376B (zh) 一种优化商业词推广的输入联想推荐方法及装置
CN104239571A (zh) 一种进行应用推荐的方法和装置
CN107241914B (zh) 用于搜索查询重写的系统和方法
CN105164710A (zh) 实体投标
CN103309886A (zh) 一种基于交易平台的结构化信息搜索方法和装置
CN103793388A (zh) 搜索结果的排序方法和装置
CN110263248A (zh) 一种信息推送方法、装置、存储介质和服务器
CN113570413B (zh) 广告关键词的生成方法、装置、存储介质及电子设备
CN106909663A (zh) 基于标签用户品牌偏好行为预测方法及其装置
CN106445963A (zh) App平台的广告索引关键词自动生成方法和装置
CN112507153B (zh) 用于图像检索的方法、计算设备和计算机存储介质
CN110134845A (zh) 项目舆情监控方法、装置、计算机设备及存储介质
CN103984705A (zh) 一种搜索结果的展示方法、装置和系统
US20070143255A1 (en) Method and system for delivering internet content to mobile devices
CN107491465A (zh) 用于搜索内容的方法和装置以及数据处理系统
CN106919588A (zh) 一种应用程序搜索系统及方法
CN105931082A (zh) 一种商品类目关键词提取方法和装置
CN110826321A (zh) 合同文件风险校验方法、装置、计算机设备以及存储介质
CN113343095A (zh) 一种模型训练以及信息推荐方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170308