CN103729359A - 一种推荐搜索词的方法及系统 - Google Patents
一种推荐搜索词的方法及系统 Download PDFInfo
- Publication number
- CN103729359A CN103729359A CN201210385554.9A CN201210385554A CN103729359A CN 103729359 A CN103729359 A CN 103729359A CN 201210385554 A CN201210385554 A CN 201210385554A CN 103729359 A CN103729359 A CN 103729359A
- Authority
- CN
- China
- Prior art keywords
- search word
- estimate
- evaluation
- word
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
- G06Q30/0625—Directed, with specific intent or strategy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/319—Inverted lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3322—Query formulation using system suggestions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
- G06F16/3326—Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0603—Catalogue ordering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0613—Third-party assisted
Abstract
本申请提供了一种推荐搜索词的方法及系统;其中所述推荐搜索词的方法包括:对发布方所发布信息的标题信息进行抽取,得到一个或多个主题词,及用于限定所述主题词的一个或多个描述词;将所述主题词与一个或多个描述词的组合作为搜索词;由搜索词的词频乘以该搜索词的逆向文档频率分别得到各搜索词的第一评价值;分别计算各搜索词在指定类目中的逆向类目频率,作为各搜索词的第二评价值;分别将各搜索词的各评价值加权相加,得到各搜索词的发布方推荐度评价值;根据所述发布方推荐度评价值从所述搜索词中选择推荐词。本申请能够提高发布方和查找方之间的信息匹配度。
Description
技术领域
本发明涉及网络领域,尤其涉及一种推荐搜索词的方法及系统。
背景技术
随着电子商务网站的发展,越来越多的商品交易和买卖由线下搬到了线上,这里主要有三种角色,买家,买家和平台;平台为卖家提供信息发布和展示,为买家提供信息查询,获取自己需要的商品。常见的电子商务平台一般通过提供搜索服务给买家来找到其所需要的商品,一般是提供一个搜索引擎作为买家信息获取的工具,比如用户通过搜索“手机”,来查看在该电子商务平台上有哪些商品,哪些商家,从中找到满足自己需求的商品,完成交易,所以平台能够为买家和卖家、或类似关系的信息发布方和查找方建立信息沟通的桥梁。
但是,由于买卖家信息不匹配或者知识领域的不对称,有时会出现卖家表述自己信息的方式不符合买家搜索习惯,导致用户无法搜索到自己所需要的产品,有些产品不能够准确合理的展现给需要的用户,对卖家也是一种损失,损失一个目标客户。而试图通过让买家学习和了解卖家对商品的描述方式是不合理的,反之亦然。另外卖家作为生产或者代理服务提供方,在卖家推出新品或者新的服务的时候,往往买家还没有相关的经验或知识,所以导致这部分产品未能够合理有效的推送给买家,造成双方的沟通和衔接成本,造成双方损失。
为解决这样的问题,搜索引擎一般会通过扩展用户的查询词或者推荐来最大限度的降低由于买卖家信息不匹配带来的未满足问题;所以查询词扩展技术是一种解决买卖家信息不匹配很有效的一种手段,但是目前采用的手段都还是站在买家角度解决的,通过搜集网站平台买家的大量搜索日志行为,并以这些搜索日中用户曾经搜索过的查询词作为数据集合,通过聚类等一些方法扩展用户搜索词,这些词是购买类似产品的其他用户曾经使用过的搜索,这样的话可以在一定程度上解决部分买家搜索词片面的问题,提高信息匹配度,提高用户体验。
对于这样的方案存在的问题是,虽然考虑了一定规模的买家行为,可以部分的解决某一部分用户片面的搜索方式,但是这样方案存在的最大问题是片面性,信息扩展的丰富度和满足度不够,仅利用买家信息,也就是本网站特定客户群的搜索习惯用词,很难发觉新的搜索用词出现,不能够最大程度上解决信息不匹配问题;由于网站一般是通过用户搜索词的统计,再通过聚类关联等手段形成扩展词推荐列表,但是对于新出现的商品或者突然热门的商品就很难给出好的推荐结果;而且没法真正的解决买卖家信息不匹配问题,在专业知识不对称的情况下,卖家的描述方法有时和买家是不匹配的,这样导致部分卖家的信息和商品无法在搜索中很好的展现,影响网站买家用户及卖家用户体验和收益。其它发布方/查找方的情况也类似。
发明内容
本申请要解决的技术问题是如何提高发布方和查找方之间的信息匹配度。
为了解决上述问题,本申请提供了一种推荐搜索词的方法,包括:
对发布方所发布信息的标题信息进行抽取,得到一个或多个主题词,及用于限定所述主题词的一个或多个描述词;
将所述主题词与一个或多个描述词的组合作为搜索词;
由搜索词的词频乘以该搜索词的逆向文档频率分别得到各搜索词的第一评价值;分别计算各搜索词在指定类目中的逆向类目频率,作为各搜索词的第二评价值;分别将各搜索词的各评价值加权相加,得到各搜索词的发布方推荐度评价值;
根据所述发布方推荐度评价值从所述搜索词中选择推荐词。
进一步地,所述推荐搜索词的方法还包括:
根据用户的输入词得到多个与该输入词相关的搜索词;
对所述多个相关的搜索词根据所述发布方推荐度评价值进行排序或过滤。
进一步地,所述分别将各搜索词的各评价值加权相加的步骤前还包括:
使用搜索词中第一个词在所有发布信息中的出现概率,乘以在所有发布信息中该搜索词中第二个词出现时第一个词也出现的概率,分别得到各搜索词的第三评价值。
进一步地,所述分别将各搜索词的各评价值加权相加的步骤前还包括:
分别计算各搜索词在一个时间段内数量或频率的变化度,得到各搜索词的第四评价值;用所述时间段内搜索词数量/频率的最大值和最小值之差,除以该时间段的长度,得到该搜索词在该时间段内数量/频率的变化度。
进一步地,所述分别将各搜索词的各评价值加权相加的步骤前还包括:
根据主题词所代表商品的品质,得到包含该主题词的搜索词的第五评价值,品质好的第五评价值高。
进一步地,所述分别将各搜索词的各评价值加权相加的步骤前还包括:
将主题词是新品的搜索词的第六评价值设置的高于主题词不是新品的搜索词。
进一步地,所述推荐搜索词的方法还包括:
获取查找方所使用的搜索词;对于所获取的各搜索词,将查找方使用该搜索词的次数、使用该搜索词时所得到的结果数、及查找方点击所得到的结果的次数,加权相加得到各搜索词的查找方推荐度评价值;
根据所述发布方推荐度评价值从所述搜索词中选择推荐词的步骤包括:
对各搜索词的查找方推荐度评价值和发送方推荐度评价值进行归一化处理后相加,得到总的推荐度评价值;
按照总的推荐度评价值从大到小的顺序对搜索词排序,选择排序在前的预定数量的搜索词作为推荐词;或将总的推荐度评价值大于或等于一预定阈值的搜索词作为推荐词。
本申请还提供了一种推荐搜索词的系统,包括:
抽取模块,用于对发布方所发布信息的标题信息进行抽取,得到一个或多个主题词,及用于限定所述主题词的一个或多个描述词;
搜索词构造模块,将所述主题词与一个或多个描述词的组合作为搜索词;
评价值计算模块,用于由搜索词的词频乘以该搜索词的逆向文档频率分别得到各搜索词的第一评价值;分别计算各搜索词在指定类目中的逆向类目频率,作为各搜索词的第二评价值;分别将各搜索词的各评价值加权相加,得到各搜索词的发布方推荐度评价值;
输出模块,用于根据所述发布方推荐度评价值从所述搜索词中选择推荐词。
进一步地,所述输出模块还用于根据用户的输入词得到多个与该输入词相关的搜索词,并对所述多个相关的搜索词根据所述发布方推荐度评价值进行排序或过滤。
进一步地,所述评价值计算模块还用于在分别将各搜索词的各评价值加权相加前,使用搜索词中第一个词在所有发布信息中的出现概率,乘以在所有发布信息中该搜索词中第二个词出现时第一个词也出现的概率,分别得到各搜索词的第三评价值。
进一步地,所述评价值计算模块还用于在分别将各搜索词的各评价值加权相加前,分别计算各搜索词在一个时间段内数量或频率的变化度,得到各搜索词的第四评价值;用所述时间段内搜索词数量/频率的最大值和最小值之差,除以该时间段的长度,得到该搜索词在该时间段内数量/频率的变化度。
进一步地,所述评价值计算模块还用于在分别将各搜索词的各评价值加权相加前,根据主题词所代表商品的品质,得到包含该主题词的搜索词的第五评价值,品质好的第五评价值高。
进一步地,所述评价值计算模块还用于在分别将各搜索词的各评价值加权相加前,设置搜索词的第六评价值,将主题词是新品的搜索词的第六评价值设置的高于主题词不是新品的搜索词。
进一步地,所述推荐搜索词的系统还包括:
搜索信息搜集模块,用于获取查找方所使用的搜索词;对于所获取的各搜索词,将查找方使用该搜索词的次数、使用该搜索词时所得到的结果数、及查找方点击所得到的结果的次数,加权相加得到各搜索词的查找方推荐度评价值;
所述输出模块根据所述发布方推荐度评价值从所述搜索词中选择推荐词是指:
所述输出模块对各搜索词的查找方推荐度评价值和发送方推荐度评价值进行归一化处理后相加,得到总的推荐度评价值;按照总的推荐度评价值从大到小的顺序对搜索词排序,选择排序在前的预定数量的搜索词作为推荐词;或将总的推荐度评价值大于或等于一预定阈值的搜索词作为推荐词。
本申请的至少一个实施例能够通过分析信息的发布方发布的信息,进行主题词挖掘和抽取,分析主题词对应的描述信息,然后通过技术手段构造各种可能出现的搜索词,这些词可能是查找方从来没有搜索过的词,但这些词却是发布方发布较多的,或者是描述了该主题词最重要的属性。将这些构造的搜索词扩充到常用query集合中,作为网站搜索推荐词,提高查找方搜索精准度,可以让查找方找到最符合自己需求的信息,提高查找方搜索信息的速度,提升用户体验,还可以提高发布方信息的合理曝光机会,提高信息发布方和查找方之间的信息到达率,实现网站的信息平台价值,达到三方共赢。本申请的又一个实施例能充分利用发布方发布信息的时效性,对于新品或者新的服务等进行加权,取得优先推荐,抓住市场热度,及时有效的将发布方的产品或者服务等推荐给查找方。
附图说明
图1为实施例一中推荐搜索词的方法的流程示意图;
图2为实施例一中推荐搜索词的方法的过程说明示意图;
图3为实施例一中的例子的过程说明示意图;
图4为实施例一中例子的处理流程示意图;
图5为实施例二中推荐搜索词的装置的结构示意图。
具体实施方式
下面将结合附图及实施例对本申请的技术方案进行更详细的说明。
需要说明的是,如果不冲突,本申请实施例以及实施例中的各个特征可以相互结合,均在本申请的保护范围之内。另外,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
实施例一,一种推荐搜索词的方法,如图1所示,包括步骤S101-S104。
S101,对发布方所发布信息的标题信息进行抽取,得到一个或多个主题词,及用于限定所述主题词的一个或多个描述词。
所述主题词为标题信息的主体,代表标题信息的关键内容,比如可以为产品词、代表具体事物的名词等。
所述描述词是用于限定、描述、修饰主题词的词汇,可包括属性词和修饰词等;属性词用于对主题词本身所具备的属性进行描述,比如材质、品牌等;修饰词用于对主题词进行修饰,可以是对主题词外在评价的描述,比如“好用”、“受欢迎”,也可以是形容商品某些特性的形容词,如“坚固”、“性感”、“时尚”等。
抽取主题词和描述词的步骤可根据现有技术中的相关内容完成。比如抽取主题词时,建立一个主题词库或集合,对于标题信息,遍历该主题词库,如果标题信息中有和主题词库或集合中的词相匹配的词,则将该匹配词作为主题词提取出来;描述词的抽取方式与主题词的抽取方式类似。
S102,将主题词与一个或多个描述词的组合作为搜索词,也就是将各描述词或描述词的各种排列组合形式分别与主题词结合形成搜索词。
比如一个主题词为“电脑”,描述词包括“高性能”、“最新款”,如果只和一个描述词组合,则会得到下列搜索词:“高性能电脑”、“最新款电脑”,如果和多个描述词组合,则会得到搜索词:“高性能最新款电脑”、“最新款高性能电脑”。在有些实施例中,还可以将各主题词本身也作为搜索词,比如上例中的“电脑”也可作为搜索词。
对于描述词A和主题词B,其结合形成搜索词C的示例如下:
“AB”或“A B”,比如“最新款电脑”或“最新款电脑”;
“A的B”,比如“最新款的电脑”;
“B A”或“BA”,比如“电脑最新款”或“电脑最新款”。
描述词A和主题词B的组合形成的各形式可以视为同一个搜索词,比如“最新款电脑”和“电脑最新款”都是“最新款”和“电脑”的组合所得到的搜索词。
当搜索词中有多个描述词时,比如描述词A1和描述词A2,则描述词A1、描述词A2和主题词B的组合形式也可以参照上例。可以理解的是,描述词A1、描述词A2和主题词B的组合的不同组合形式,也可以视为是不同的搜索词;比如“高性能最新款电脑”、“最新款高性能电脑”可以视为两个不同的搜索词。
当将搜索词作为推荐词时,上述任一形式都可以,比如对于搜索词“四核电脑”,当作为推荐词展示给查找方时,“四核电脑”、“电脑四核”等形式都是可能出现的。
S103,分别计算步骤S102中所得到的各搜索词的评价值;所述评价值包括第一评价值及第二评价值;由搜索词的词频TF乘以该搜索词逆向文档频率IDF分别得到各搜索词的第一评价值;分别计算各搜索词在指定类目中的逆向类目频率ICF,得到各搜索词的第二评价值;所述指定类目(class)是预先根据主题词的主题类别划分得到的,比如机械、服装等;各评价值的计算顺序不限;分别将各搜索词的各评价值加权相加,得到各搜索词的发布方推荐度评价值。
所述搜索词的词频(term frequency,TF)可以是在网站或平台中所有的发布信息(包括标题信息和正文)里,该搜索词出现的次数。所述搜索词的词频也可以理解为搜索词中包含的主题词下的描述词出现的次数,也就是,搜索词中包含的描述词在网站或平台中所有的发布信息中用于描述该搜索词中的主题词而出现的次数。
对于多个描述词的情况,比如描述词A1、描述词A2和主题词B结合形成的搜索词而言,当出现了“A1A2B”时,则认为搜索词A1B、A2B、A1A2B各出现过一次。
所述搜索词的逆向文档频率(inverse document frequency,IDF)是一个词语普遍重要性的度量。搜索词的IDF,可以由网站或平台中发布信息的总数除以包含该搜索词的发布信息的数目,再将得到的商取对数得到。“包含该搜索词的发布信息”可以理解为该发布信息中包含该搜索词的主题词及描述词,该描述词用于描述该主题词。
所述逆向类目频率(inverse class frequency,ICF)是类目维度评价一个词语重要性的度量,其中一搜索词的类目频率(class frequency,CF)指的是该搜索词在特定的类目中出现的次数。搜索词在指定类目中的ICF,可以由该指定类目下发布信息的总数除以包含该搜索词的发布信息数,再将得到的商取对数得到。如果在统计包含该搜索词的发布信息数时,一个发布信息中该搜索词出现过两次,则包含该搜索词的发布信息数应加2,以此类推。“该搜索词在特定的类目中出现”可以理解为该搜索词的主题词及描述词出现于该特定的类目,该描述词用于描述该主题词。
S104,根据所述发布方推荐度评价值从各搜索词中选择推荐词。
进一步地可以按照发布方推荐度评价值从大到小的顺序对搜索词排序,选择排序在前的预定数量的搜索词作为推荐词。
也可以根据发布方推荐度评价值与预设阈值的比较而滤除搜索词,将发布方推荐度评价值大于或等于一预定阈值的搜索词作为推荐词。
当查找方通过在搜索栏直接键入或在给定项中选择等方式输入待查找的部分内容时,根据查找方输入内容可以获得多个与该输入词相关的搜索词。所述相关的搜索词可为包含有和查找方输入内容相关的主题词的搜索词。在多个相关搜索词中选择出推荐词,以下拉菜单等方式展现给查找方;比如当查找方输入内容就是一个主题词时,可以从包含该主题词的搜索词中按上文方式选择出推荐词。可以理解的,选择推荐词的方式可以包括对所述多个相关的搜索词根据所述发布方推荐度评价值进行排序或过滤,将排序或过滤的结果作为推荐词推送给查找方。
再比如当查找方输入内容为一个类目的名称(例如服装)时,可以从所有包含该类目下主题词(例如连衣裙、裤子、外套、衬衫等)的搜索词中,按上文方式选择出推荐词;再比如当查找方输入内容为一个产品的名称(例如移动终端)时,可以从所有包含作为该产品的主题词(例如手机、平板、笔记本电脑、POS机等的搜索词中,按上文方式选择出推荐词。
如图2所示,本实施例的推荐搜索词的方法是从发布信息21中通过抽取步骤22得到主题词23和描述词24,然后将其组合为搜索词25,再计算搜索词的发布方推荐度评价值26,根据发布方推荐度评价值对搜索词进行排序或过滤以得到推荐词27。
在有些实施例中,所述方法还可以包括:
对于各搜索词,根据查找方使用该搜索词的次数(即页面浏览量)、使用该搜索词时所得到的结果数和/或查找方点击所得到的结果的次数,得到各搜索词的查找方推荐度评价值;比如将查找方使用该搜索词的次数、使用该搜索词时所得到的结果数和/或查找方点击所得到的结果的次数加权相加从而得到各搜索词的查找方推荐度评价值。
查找方使用该搜索词的次数(即页面浏览量)、使用该搜索词时所得到的结果数和/或查找方点击所得到的结果的次数可以从用户的历史搜索记录中获得。
获取查找方推荐度评价值和发布方推荐度评价值的先后顺序不限。
步骤S102中所得到的搜索词中部分搜索词可能会在查找方进行信息检索时实际使用,也即存在于用户历史搜索记录中;部分搜索词也可能在发布信息中使用,但没有查找方使用该搜索词的历史搜索记录,此时,就不需要获取搜索词的查找方推荐度评价值。
根据所述发布方推荐度评价值从所述搜索词中选择推荐词的步骤具体可以包括:
对各搜索词的查找方推荐度评价值和发送方推荐度评价值进行归一化处理后相加,得到总的推荐度评价值;
按照总的推荐度评价值从大到小的顺序对搜索词排序,选择排序在前的预定数量的搜索词作为推荐词;或将总的推荐度评价值大于或等于一预定阈值的搜索词作为推荐词。
归一化是为了使仅查找方/发布信息使用的搜索词的查找方/发送方评价值之间具有可比性。
查找方推荐度评价值和发布方推荐度评价值计算的先后顺序不限,且可以只根据发布方推荐度评价值从大到小排序得到推荐词信息。
在有些实施例中,通过分析查找方的历史搜索和点击行为,从查找方维度得到推荐度评价值,同时利用发布方填写的描述信息,得到发布方维度的推荐度评价值,将二者按照上文所述进行归一化处理后相加排序,就可以将二者融合进行选择判断,作为最终输出的推荐词信息,这样的话可以根据不同的搜索词给出最合适的推荐词信息,提升查找方搜索效率,提高用户体验,提高发布方信息的合理曝光度。
在有些实施例中,所述评价值还可以包括第三评价值;所述分别将各搜索词的各评价值加权相加的步骤前还可以包括:使用二元的语言模型分别计算各搜索词的流畅度分数,得到各搜索词的第三评价值。
在有些实施例中,所述语言模型(NGRAM)是一种用于计算句子或短语在网站或平台中所有发布信息里出现概率的算法,通过计算句子/短语中第一个词的出现概率以及后续各词出现时前面的词共同出现的概率,来估算一串词汇组成的短语、或一个句子的整体出现概率,可以用于评价所构造的搜索词是否符合惯常的说法,比如“钢铁连衣裙”是一个基本不可能出现的短语,那么该短语的出现概率会非常低,由此可知该短语不合常规。可以但不限于使用二元的语言模型来计算第三评价值,即,使用搜索词中第一个词在所有发布信息中的出现概率,乘以在所有发布信息中该搜索词中第二个词出现时第一个词也出现的概率,分别得到各搜索词的第三评价值。在使用二元的语言模型计算第三评价值时,如果搜索词中包括一个描述词和一个主题词,则第一个词为描述词,第二个词为主题词;如果搜索词中包括两个或两个以上的描述词,则按照描述词排列的顺序,将排列在前的两个描述词分别作为计算第三评价词时该搜索词中的第一个词和第二个词;比如上文例子中的“高性能最新款电脑”这个搜索词里,第一个词是“高性能”,第二个词是“最新款”,而“最新款高性能电脑”这个搜索词里,第二个词是“最新款”,第二个词是“高性能”。
在有些实施例中,所述评价值还可以包括第四评价值;所述分别将各搜索词的各评价值加权相加的步骤前还可以包括:可分别计算各搜索词在一个时间段内数量或频率的变化度,得到各搜索词的第四评价值;一个搜索词在一个时间段内数量/频率的变化度是用所述时间段内该搜索词在网站或平台中所有发布信息里出现的数量/频率的最大值和最小值之差,除以该时间段的长度得到。对于该搜索词出现的数量/频率,可以实时监控或周期性获取。
在有些实施例中,所述评价值还可以包括第五评价值;所述分别将各搜索词的各评价值加权相加的步骤前还可以包括:根据主题词所代表商品的品质,得到包含该主题词的搜索词的第五评价值,品质好的第五评价值高;这样可以让品质好的商品的发布方推荐度评价值提高。
在有些实施例中,所述评价值还可以包括第六评价值;所述分别将各搜索词的各评价值加权相加的步骤前还可以包括:将主题词是新品的搜索词的第六评价值设置的高于主题词不是新品的搜索词;这样可以让新品的发布方推荐度评价值提高。
计算各评价值的先后顺序不限,且可以并行。
在计算发布方推荐度评价值时,可以进一步地将第一评价值、第二评价值与新增加的第三评价值、第四评价值、第五评价值或第六评价值选择性的加权相加以得到所述发布方推荐度评价值。还可以根据需求增加其它评价值,并将第一评价值、第二评价值与其它评价值加权相加,来得到发布方推荐度评价值。
下面以买家作为查找方,卖家作为发布方,商品名作为主题词的一个备选方案来具体说明,该例子得到推荐词信息的过程如图3所示,获取卖家发布信息31和买家搜索信息32,进行发布信息分析的步骤34得到卖家分析结果,进行搜索日志分析的步骤33得到买家分析结果,然后进行合并买家、卖家的分析结果的步骤35,得到给买家的推荐词信息36。
推荐词信息的生成过程具体如图4所示,包括以下五个步骤S401~S405。
S401,分析网站用户(买家)搜索日志,所述搜索日志包括是用户使用的关键词、搜索的pv(page view,页面浏览量),点击情况以及结果数等特征信息,将用户搜索所使用的关键词作为从信息查找方角度得到的搜索词,通过这些特征信息可以给每个搜索词进行算分。该步骤可根据现有技术中的相关内容完成。
S402,通过第一步得到的各搜索词的分数可以得到一个买家维度的查找方推荐度评价值,相当于是利用的了买家群体搜索的结果,来进行推荐。
S403,分析卖家发布的信息,卖家在网站发布信息的时候一般会详细的描述自己商品的特点,特别是对某些专业性较强的商品,卖家作为该商品比较专业的人士,描述上可能是专业,但是买家由于知识面等的不对称,可能在查找相关商品时不能够这么专业的描述,从而找不到合适的商品,所以通过算法会详细的分析卖家填写的描述信息,详细步骤如下:
首先会对卖家发布信息的标题信息进行抽取和分析,获得该条信息的主题词(在本例子中,即商品词),以及相关其他用于描述商品性质、情况的描述词,通过分析网站的全部卖家发布的信息可以获得所有商品词,以及其对应的描述词。
将各商品词对应的各描述词、及其各种排列组合形式分别与商品词连接成短语,包括各商品词本身,作为各商品词对应的搜索词,这是从信息发布方角度得到的搜索词;
然后通过TF乘以IDF来计算所得到的各搜索词的重要性,以此作为第一评价值,记为score1;另外还会通过类目信息来进行评价,通过分析商品词对应的类目信息,以类目为key,分析类目下搜索词的重要性,评价方式就是ICF,得到第二评价值,记为score2。同时为了保证组词的流畅度,引入语言模型来进行流畅度判断,比如对于有n(正整数)个词的短语/句子,语言模型计算公式为:
P(S)=P(word1)P(word2|word1)P(word3|word1word2)......P[wordn|word1word2......word(n-1)]
其中,P(word1)是短语/句子中的第一个词的出现概率,P(word2|word1)是短语/句子中的第二个词出现时第一个词也出现的概率,以此类推;考虑到计算量,可以但不限于使用二元语言模型进行打分评价,以此得到搜素对象的流畅度分数P(S),作为第三评价值,记为score3;
S404,通过上面的分析,可以得到根据发布方发布的信息得到的卖家维度的发布方推荐度评价值。最终发布方推荐度评价值Score为:
Score=w1*Score1+w2*Score2+w3*Score3。
还可以在分析卖家信息的时候根据信息热度以及时间因子,对推荐词进行一定的加权,对最近一段时间供应量增加明显,且优质的产品进行加权,具体是:计算各搜索词在一个时间段内数量或频率的变化度,得到各搜索词的第四评价值Score4;用所述时间段内搜索词出现数量/频率的最大值和最小值之差,除以该时间段的长度,得到该搜索词在该时间段内数量/频率的变化度。此时,最终发布方推荐度评价值Score为:
Score=w1×Score1+w2×Score2+w3×Score3+w4×Score4。
其中,w1、w2、w3和w4为加权的权值,可根据经验值或实际需要设置和修改,以调整不同评价值在最后发布方推荐度评价值中的比重。
另外,还可提高以品质好的商品、或新品作为主题词的搜索词的发布方推荐度评价值。
S405,最后将通过上述步骤得到的发布方推荐度评价值和查找方推荐度评价值分别进行融合,将发布方推荐度评价值和查找方推荐度评价值进行归一化处理后相加作为最终的推荐度评价值,将推荐度评价值大于或等于一推荐阈值的搜索词作为推荐词、或是根据推荐度评价值从大到小排序,将排序在前的预定数量的搜索词作为推荐词,从而得到最终的推荐词。
上述实施例及备选方案可以但不限于应用在网站推荐、搜索引擎等服务中,比如搜索榜单、电子商务网站的搜索栏等;由于是从发布方的角度出发,从网站或平台中各发布信息获取搜索词,并根据搜索词在网站或平台全部发布信息中出现的频率(包括TF、ICF、IDF),确定各搜索词在发布信息中哪些使用较多,以此进行推荐。
由于不是单纯从信息查找方角度来进行推荐,所以可以在信息查找方习惯使用的搜索词之外,推荐出更符合发布方习惯的搜索词;特别是对于一些较为专业的搜索词、或对于一些新产品,信息查找方可能并没有足够的知识去确定、或是没有意识到可以使用什么样词语进行搜索,如果只从查找方角度考虑,是不会推荐查找方不使用的搜索词的;而从发布方角度出发时,则可以将一些更为专业、或新产品的词语作为搜索词推荐给查找方,这样能扩展查找方的搜索词数量,并且使搜索词更贴合发布信息,方便查找方在专业知识不足的情况下查找到所需要的信息,也能使查找方可以获知新产品,更加全面,并能让发布方和查找方的用词尽可能匹配。
比如用户希望在一电商网站购买雨伞,但并不知道有种新品“超大雨伞”,所以在搜索时并不会用到“超大雨伞”搜索词;当大批商家在一段时间内纷纷推出“超大雨伞”,由于此时间里含有“超大雨伞”的发布信息较多,因此“超大雨伞”的发布方推荐度评价值将会较高,这个搜索词“超大雨伞”即使没有用户曾经搜索过,也会被推荐给用户,从而使用户知晓该新产品。
由于信息发布方会不断发布更新的信息,并可能删除过去的信息,因此发布信息的情况是不断改变的,由此也会导致发布方推荐度评价值发生改变,进而影响最后选择出的推荐词;周期性执行上述实施例及备选方案中的方法,就可以不断更新推荐词,使其符合最新的信息趋势。
实施例二,一种推荐搜索词的系统,如图5所示,包括:
抽取模块51,用于对发布方所发布信息的标题信息进行抽取,得到一个或多个主题词,及用于限定所述主题词的一个或多个描述词;
搜索词构造模块52,将主题词与一个或多个描述词的组合作为搜索词;
评价值计算模块53,用于分别计算搜索词构造模块52所得到的各搜索词的评价值;所述评价值包括第一评价值、第二评价值;由搜索词的词频乘以该搜索词的逆向文档频率分别得到各搜索词的第一评价值;分别计算各搜索词在指定类目中的逆向类目频率,作为各搜索词的第二评价值;分别将各搜索词的各评价值加权相加,得到各搜索词的发布方推荐度评价值;
输出模块54,用于根据所述发布方推荐度评价值对所述搜索词排序,将排序后的搜索词作为推荐词信息。
在有些实施例中,所述系统还可以包括:
搜索信息搜集模块,用于获取查找方所使用的搜索词;对于所获取的各搜索词,将查找方使用该搜索词的次数、使用该搜索词时所得到的结果数、及查找方点击所得到的结果的次数,加权相加得到各搜索词的查找方推荐度评价值;
所述输出模块54根据所述发布方推荐度评价值从所述搜索词中选择推荐词具体可以是指:
所述输出模块54对各搜索词的查找方推荐度评价值和发送方推荐度评价值进行归一化处理后相加,得到总的推荐度评价值;按照总的推荐度评价值从大到小的顺序对搜索词排序,选择排序在前的预定数量的搜索词作为推荐词;或将总的推荐度评价值大于或等于一预定阈值的搜索词作为推荐词。
所述输出模块54计算查找方推荐度评价值和发布方推荐度评价值的先后顺序不限,且可以只根据发布方推荐度评价值排序得到推荐词信息。
在有些实施例中,所述评价值还可以包括第三评价值;所述评价值计算模块53还可用于在分别将各搜索词的各评价值加权相加前,使用二元语言模型分别计算各搜索词的分数,即:使用搜索词中第一个词在所有发布信息中的出现概率,乘以在所有发布信息中该搜索词中第二个词出现时第一个词也出现的概率,分别得到各搜索词的第三评价值。
在有些实施例中,所述评价值还可以包括第四评价值;所述评价值计算模块53还可用于在分别将各搜索词的各评价值加权相加前,分别计算各搜索词在一个时间段内数量/频率的变化度,得到各搜索词的第四评价值;用所述时间段内搜索词在网站或平台中所有发布信息里出现数量/频率的最大值和最小值之差,除以该时间段的长度,得到该搜索词在该时间段内数量/频率的变化度。
在有些实施例中,所述评价值还可以包括第五评价值,所述评价值计算模块54还可用于在分别将各搜索词的各评价值加权相加前,根据主题词所代表商品的品质,得到包含该主题词的搜索词的第五评价值,品质好的第五评价值高。
在有些实施例中,所述评价值还可以包括第六评价值,所述评价值计算模块55还可用于在分别将各搜索词的各评价值加权相加前,设置搜索词的第六评价值,将主题词是新品的搜索词的第六评价值设置的高于主题词不是新品的搜索词。
计算各评价值的先后顺序不限,且可以并行。
在计算发布方推荐度评价值时,可以进一步地将第一评价值、第二评价值与新增加的第三评价值、第四评价值、第五评价值或第六评价值选择性的加权相加以得到所述发布方推荐度评价值。还可以根据需求增加其它评价值,并将第一评价值、第二评价值与其它评价值加权相加,来得到发布方推荐度评价值。
上述实施例中的系统可定期更新推荐词,以符合最新的信息趋势。
其它实现细节可参考实施例一。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本申请不限制于任何特定形式的硬件和软件的结合。
当然,本申请还可有其他多种实施例,在不背离本申请精神及其实质的情况下,熟悉本领域的技术人员当可根据本申请作出各种相应的改变和变形,但这些相应的改变和变形都应属于本申请的权利要求的保护范围。
Claims (14)
1.一种推荐搜索词的方法,包括:
对发布方所发布信息的标题信息进行抽取,得到一个或多个主题词,及用于限定所述主题词的一个或多个描述词;
将所述主题词与一个或多个描述词的组合作为搜索词;
由搜索词的词频乘以该搜索词的逆向文档频率分别得到各搜索词的第一评价值;分别计算各搜索词在指定类目中的逆向类目频率,作为各搜索词的第二评价值;分别将各搜索词的各评价值加权相加,得到各搜索词的发布方推荐度评价值;
根据所述发布方推荐度评价值从所述搜索词中选择推荐词。
2.如权利要求1所述的方法,其特征在于,所述推荐搜索词的方法还包括:
根据用户的输入词得到多个与该输入词相关的搜索词;
对所述多个相关的搜索词根据所述发布方推荐度评价值进行排序或过滤。
3.如权利要求1所述的方法,其特征在于,所述分别将各搜索词的各评价值加权相加的步骤前还包括:
使用搜索词中第一个词在所有发布信息中的出现概率,乘以在所有发布信息中该搜索词中第二个词出现时第一个词也出现的概率,分别得到各搜索词的第三评价值。
4.如权利要求1所述的方法,其特征在于,所述分别将各搜索词的各评价值加权相加的步骤前还包括:
分别计算各搜索词在一个时间段内数量或频率的变化度,得到各搜索词的第四评价值;用所述时间段内搜索词数量/频率的最大值和最小值之差,除以该时间段的长度,得到该搜索词在该时间段内数量/频率的变化度。
5.如权利要求1所述的方法,其特征在于,所述分别将各搜索词的各评价值加权相加的步骤前还包括:
根据主题词所代表商品的品质,得到包含该主题词的搜索词的第五评价值,品质好的第五评价值高。
6.如权利要求1所述的方法,其特征在于,所述分别将各搜索词的各评价值加权相加的步骤前还包括:
将主题词是新品的搜索词的第六评价值设置的高于主题词不是新品的搜索词。
7.如权利要求1到6中任一项所述的方法,其特征在于,所述推荐搜索词的方法还包括:
获取查找方所使用的搜索词;对于所获取的各搜索词,将查找方使用该搜索词的次数、使用该搜索词时所得到的结果数、及查找方点击所得到的结果的次数,加权相加得到各搜索词的查找方推荐度评价值;
根据所述发布方推荐度评价值从所述搜索词中选择推荐词的步骤包括:
对各搜索词的查找方推荐度评价值和发送方推荐度评价值进行归一化处理后相加,得到总的推荐度评价值;
按照总的推荐度评价值从大到小的顺序对搜索词排序,选择排序在前的预定数量的搜索词作为推荐词;或将总的推荐度评价值大于或等于一预定阈值的搜索词作为推荐词。
8.一种推荐搜索词的系统,其特征在于,包括:
抽取模块,用于对发布方所发布信息的标题信息进行抽取,得到一个或多个主题词,及用于限定所述主题词的一个或多个描述词;
搜索词构造模块,将所述主题词与一个或多个描述词的组合作为搜索词;
评价值计算模块,用于由搜索词的词频乘以该搜索词的逆向文档频率分别得到各搜索词的第一评价值;分别计算各搜索词在指定类目中的逆向类目频率,作为各搜索词的第二评价值;分别将各搜索词的各评价值加权相加,得到各搜索词的发布方推荐度评价值;
输出模块,用于根据所述发布方推荐度评价值从所述搜索词中选择推荐词。
9.如权利要求8所述的系统,其特征在于:
所述输出模块还用于根据用户的输入词得到多个与该输入词相关的搜索词,并对所述多个相关的搜索词根据所述发布方推荐度评价值进行排序或过滤。
10.如权利要求8所述的系统,其特征在于:
所述评价值计算模块还用于在分别将各搜索词的各评价值加权相加前,使用搜索词中第一个词在所有发布信息中的出现概率,乘以在所有发布信息中该搜索词中第二个词出现时第一个词也出现的概率,分别得到各搜索词的第三评价值。
11.如权利要求8所述的系统,其特征在于:
所述评价值计算模块还用于在分别将各搜索词的各评价值加权相加前,分别计算各搜索词在一个时间段内数量或频率的变化度,得到各搜索词的第四评价值;用所述时间段内搜索词数量/频率的最大值和最小值之差,除以该时间段的长度,得到该搜索词在该时间段内数量/频率的变化度。
12.如权利要求8所述的系统,其特征在于:
所述评价值计算模块还用于在分别将各搜索词的各评价值加权相加前,根据主题词所代表商品的品质,得到包含该主题词的搜索词的第五评价值,品质好的第五评价值高。
13.如权利要求8所述的系统,其特征在于:
所述评价值计算模块还用于在分别将各搜索词的各评价值加权相加前,设置搜索词的第六评价值,将主题词是新品的搜索词的第六评价值设置的高于主题词不是新品的搜索词。
14.如权利要求8到13中任一项所述的系统,其特征在于,所述推荐搜索词的系统还包括:
搜索信息搜集模块,用于获取查找方所使用的搜索词;对于所获取的各搜索词,将查找方使用该搜索词的次数、使用该搜索词时所得到的结果数、及查找方点击所得到的结果的次数,加权相加得到各搜索词的查找方推荐度评价值;
所述输出模块根据所述发布方推荐度评价值从所述搜索词中选择推荐词是指:
所述输出模块对各搜索词的查找方推荐度评价值和发送方推荐度评价值进行归一化处理后相加,得到总的推荐度评价值;按照总的推荐度评价值从大到小的顺序对搜索词排序,选择排序在前的预定数量的搜索词作为推荐词;或将总的推荐度评价值大于或等于一预定阈值的搜索词作为推荐词。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210385554.9A CN103729359B (zh) | 2012-10-12 | 2012-10-12 | 一种推荐搜索词的方法及系统 |
TW102109495A TWI609278B (zh) | 2012-10-12 | 2013-03-18 | Method and system for recommending search words |
US14/043,762 US9489688B2 (en) | 2012-10-12 | 2013-10-01 | Method and system for recommending search phrases |
PCT/US2013/063129 WO2014058679A1 (en) | 2012-10-12 | 2013-10-02 | Method and system for search query recommendation |
EP13779990.4A EP2907052A1 (en) | 2012-10-12 | 2013-10-02 | Method and system for search query recommendation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210385554.9A CN103729359B (zh) | 2012-10-12 | 2012-10-12 | 一种推荐搜索词的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103729359A true CN103729359A (zh) | 2014-04-16 |
CN103729359B CN103729359B (zh) | 2017-03-01 |
Family
ID=50453437
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210385554.9A Active CN103729359B (zh) | 2012-10-12 | 2012-10-12 | 一种推荐搜索词的方法及系统 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9489688B2 (zh) |
EP (1) | EP2907052A1 (zh) |
CN (1) | CN103729359B (zh) |
TW (1) | TWI609278B (zh) |
WO (1) | WO2014058679A1 (zh) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598507A (zh) * | 2014-08-14 | 2015-05-06 | 腾讯科技(北京)有限公司 | 信息搜索方法及装置 |
CN105069086A (zh) * | 2015-07-31 | 2015-11-18 | 焦点科技股份有限公司 | 一种优化电子商务商品搜索的方法及系统 |
CN105138690A (zh) * | 2015-09-18 | 2015-12-09 | 北京博雅立方科技有限公司 | 确定关键词的方法和装置 |
CN105488136A (zh) * | 2015-11-25 | 2016-04-13 | 北京京东尚科信息技术有限公司 | 选购热点标签的挖掘方法 |
CN105512199A (zh) * | 2015-11-27 | 2016-04-20 | 广州神马移动信息科技有限公司 | 搜索方法、搜索装置以及搜索服务器 |
CN105893397A (zh) * | 2015-06-30 | 2016-08-24 | 北京爱奇艺科技有限公司 | 一种视频推荐方法及装置 |
CN105956148A (zh) * | 2016-05-12 | 2016-09-21 | 北京奇艺世纪科技有限公司 | 资源信息的推荐方法和装置 |
CN106649795A (zh) * | 2016-12-28 | 2017-05-10 | 北京奇虎科技有限公司 | 一种关键词数据的输出方法及装置 |
CN106846103A (zh) * | 2017-01-11 | 2017-06-13 | 美的集团股份有限公司 | 家电设备的购买推荐方法和装置 |
CN107169821A (zh) * | 2017-05-02 | 2017-09-15 | 杭州泰指尚科技有限公司 | 大数据查询推荐方法及其系统 |
CN107632989A (zh) * | 2016-07-19 | 2018-01-26 | 阿里巴巴集团控股有限公司 | 一种商品对象选取、模型确定及使用热度确定方法与装置 |
CN108205545A (zh) * | 2016-12-16 | 2018-06-26 | 百度在线网络技术(北京)有限公司 | 一种为用户提供推荐信息的方法与设备 |
CN108614843A (zh) * | 2016-12-13 | 2018-10-02 | 北京国双科技有限公司 | 网站内容的评估方法及装置 |
CN109117475A (zh) * | 2018-07-02 | 2019-01-01 | 武汉斗鱼网络科技有限公司 | 一种文本改写的方法以及相关设备 |
CN109657129A (zh) * | 2018-12-26 | 2019-04-19 | 北京百度网讯科技有限公司 | 用于获取信息的方法及装置 |
CN109801103A (zh) * | 2019-01-14 | 2019-05-24 | 海南英赛德信息系统有限公司 | 信息投放方法及装置、存储介质及电子设备 |
CN110264276A (zh) * | 2019-06-25 | 2019-09-20 | 广州视源电子科技股份有限公司 | 确定推送用户群的方法、装置、设备及存储介质 |
CN110598108A (zh) * | 2019-09-12 | 2019-12-20 | 珠海随变科技有限公司 | 一种搜索词推荐方法、装置、设备及存储介质 |
CN111639255A (zh) * | 2019-03-01 | 2020-09-08 | 北京字节跳动网络技术有限公司 | 搜索关键词的推荐方法、装置、存储介质及电子设备 |
CN113221004A (zh) * | 2021-05-21 | 2021-08-06 | 珠海金山网络游戏科技有限公司 | 一种关键词展示方法及装置 |
CN113505281A (zh) * | 2021-06-15 | 2021-10-15 | 北京三快在线科技有限公司 | 搜索建议词生成方法、装置、电子设备及可读存储介质 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160224524A1 (en) * | 2015-02-03 | 2016-08-04 | Nuance Communications, Inc. | User generated short phrases for auto-filling, automatically collected during normal text use |
CN106326320A (zh) * | 2015-07-09 | 2017-01-11 | 阿里巴巴集团控股有限公司 | 一种个性化引导的实现方法及装置 |
US10613825B2 (en) * | 2015-11-30 | 2020-04-07 | Logmein, Inc. | Providing electronic text recommendations to a user based on what is discussed during a meeting |
CN105898425A (zh) * | 2015-12-14 | 2016-08-24 | 乐视网信息技术(北京)股份有限公司 | 视频推荐方法、系统及服务器 |
CN107798012B (zh) * | 2016-09-05 | 2021-12-14 | 腾讯科技(深圳)有限公司 | 阅读资源评论推送方法和系统 |
CN107346336B (zh) * | 2017-06-29 | 2021-06-08 | 北京百度网讯科技有限公司 | 基于人工智能的信息处理方法和装置 |
CN111597297A (zh) * | 2019-02-21 | 2020-08-28 | 北京京东尚科信息技术有限公司 | 物品召回方法、系统、电子设备及可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100076979A1 (en) * | 2008-09-05 | 2010-03-25 | Xuejun Wang | Performing search query dimensional analysis on heterogeneous structured data based on relative density |
CN101820592A (zh) * | 2009-02-27 | 2010-09-01 | 华为技术有限公司 | 移动搜索方法及装置 |
CN102012915A (zh) * | 2010-11-22 | 2011-04-13 | 百度在线网络技术(北京)有限公司 | 一种文档共享平台的关键词推荐方法及系统 |
CN102682001A (zh) * | 2011-03-09 | 2012-09-19 | 阿里巴巴集团控股有限公司 | 一种确定推荐词的方法及设备 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6704727B1 (en) | 2000-01-31 | 2004-03-09 | Overture Services, Inc. | Method and system for generating a set of search terms |
US7003511B1 (en) | 2002-08-02 | 2006-02-21 | Infotame Corporation | Mining and characterization of data |
US20050125240A9 (en) | 2002-10-21 | 2005-06-09 | Speiser Leonard R. | Product recommendation in a network-based commerce system |
US7716219B2 (en) | 2004-07-08 | 2010-05-11 | Yahoo ! Inc. | Database search system and method of determining a value of a keyword in a search |
US7406465B2 (en) | 2004-12-14 | 2008-07-29 | Yahoo! Inc. | System and methods for ranking the relative value of terms in a multi-term search query using deletion prediction |
US7685084B2 (en) * | 2007-02-09 | 2010-03-23 | Yahoo! Inc. | Term expansion using associative matching of labeled term pairs |
US20090171929A1 (en) | 2007-12-26 | 2009-07-02 | Microsoft Corporation | Toward optimized query suggeston: user interfaces and algorithms |
US8001140B2 (en) * | 2008-02-22 | 2011-08-16 | Tigerlogic Corporation | Systems and methods of refining a search query based on user-specified search keywords |
CN107092615B (zh) | 2009-08-04 | 2020-04-10 | 谷歌有限责任公司 | 来自文档的查询建议 |
US8688690B2 (en) * | 2010-04-15 | 2014-04-01 | Palo Alto Research Center Incorporated | Method for calculating semantic similarities between messages and conversations based on enhanced entity extraction |
-
2012
- 2012-10-12 CN CN201210385554.9A patent/CN103729359B/zh active Active
-
2013
- 2013-03-18 TW TW102109495A patent/TWI609278B/zh active
- 2013-10-01 US US14/043,762 patent/US9489688B2/en active Active
- 2013-10-02 WO PCT/US2013/063129 patent/WO2014058679A1/en active Application Filing
- 2013-10-02 EP EP13779990.4A patent/EP2907052A1/en not_active Withdrawn
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100076979A1 (en) * | 2008-09-05 | 2010-03-25 | Xuejun Wang | Performing search query dimensional analysis on heterogeneous structured data based on relative density |
CN101820592A (zh) * | 2009-02-27 | 2010-09-01 | 华为技术有限公司 | 移动搜索方法及装置 |
CN102012915A (zh) * | 2010-11-22 | 2011-04-13 | 百度在线网络技术(北京)有限公司 | 一种文档共享平台的关键词推荐方法及系统 |
CN102682001A (zh) * | 2011-03-09 | 2012-09-19 | 阿里巴巴集团控股有限公司 | 一种确定推荐词的方法及设备 |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598507B (zh) * | 2014-08-14 | 2018-03-30 | 腾讯科技(北京)有限公司 | 信息搜索方法及装置 |
CN104598507A (zh) * | 2014-08-14 | 2015-05-06 | 腾讯科技(北京)有限公司 | 信息搜索方法及装置 |
CN105893397A (zh) * | 2015-06-30 | 2016-08-24 | 北京爱奇艺科技有限公司 | 一种视频推荐方法及装置 |
CN105893397B (zh) * | 2015-06-30 | 2019-03-15 | 北京爱奇艺科技有限公司 | 一种视频推荐方法及装置 |
CN105069086A (zh) * | 2015-07-31 | 2015-11-18 | 焦点科技股份有限公司 | 一种优化电子商务商品搜索的方法及系统 |
CN105138690A (zh) * | 2015-09-18 | 2015-12-09 | 北京博雅立方科技有限公司 | 确定关键词的方法和装置 |
CN105138690B (zh) * | 2015-09-18 | 2018-11-06 | 北京博雅立方科技有限公司 | 确定关键词的方法和装置 |
CN105488136A (zh) * | 2015-11-25 | 2016-04-13 | 北京京东尚科信息技术有限公司 | 选购热点标签的挖掘方法 |
CN105488136B (zh) * | 2015-11-25 | 2019-03-26 | 北京京东尚科信息技术有限公司 | 选购热点标签的挖掘方法 |
CN105512199A (zh) * | 2015-11-27 | 2016-04-20 | 广州神马移动信息科技有限公司 | 搜索方法、搜索装置以及搜索服务器 |
CN105512199B (zh) * | 2015-11-27 | 2020-04-14 | 广州神马移动信息科技有限公司 | 搜索方法、搜索装置以及搜索服务器 |
CN105956148A (zh) * | 2016-05-12 | 2016-09-21 | 北京奇艺世纪科技有限公司 | 资源信息的推荐方法和装置 |
CN107632989A (zh) * | 2016-07-19 | 2018-01-26 | 阿里巴巴集团控股有限公司 | 一种商品对象选取、模型确定及使用热度确定方法与装置 |
CN107632989B (zh) * | 2016-07-19 | 2021-04-13 | 阿里巴巴集团控股有限公司 | 一种商品对象选取、模型确定及使用热度确定方法与装置 |
CN108614843A (zh) * | 2016-12-13 | 2018-10-02 | 北京国双科技有限公司 | 网站内容的评估方法及装置 |
CN108614843B (zh) * | 2016-12-13 | 2021-01-22 | 北京国双科技有限公司 | 网站内容的评估方法及装置 |
CN108205545B (zh) * | 2016-12-16 | 2022-06-10 | 百度在线网络技术(北京)有限公司 | 一种为用户提供推荐信息的方法与设备 |
CN108205545A (zh) * | 2016-12-16 | 2018-06-26 | 百度在线网络技术(北京)有限公司 | 一种为用户提供推荐信息的方法与设备 |
CN106649795A (zh) * | 2016-12-28 | 2017-05-10 | 北京奇虎科技有限公司 | 一种关键词数据的输出方法及装置 |
CN106846103A (zh) * | 2017-01-11 | 2017-06-13 | 美的集团股份有限公司 | 家电设备的购买推荐方法和装置 |
CN107169821B (zh) * | 2017-05-02 | 2020-12-15 | 杭州泰一指尚科技有限公司 | 大数据查询推荐方法及其系统 |
CN107169821A (zh) * | 2017-05-02 | 2017-09-15 | 杭州泰指尚科技有限公司 | 大数据查询推荐方法及其系统 |
CN109117475A (zh) * | 2018-07-02 | 2019-01-01 | 武汉斗鱼网络科技有限公司 | 一种文本改写的方法以及相关设备 |
CN109117475B (zh) * | 2018-07-02 | 2022-08-16 | 武汉斗鱼网络科技有限公司 | 一种文本改写的方法以及相关设备 |
CN109657129A (zh) * | 2018-12-26 | 2019-04-19 | 北京百度网讯科技有限公司 | 用于获取信息的方法及装置 |
CN109657129B (zh) * | 2018-12-26 | 2023-04-18 | 北京百度网讯科技有限公司 | 用于获取信息的方法及装置 |
CN109801103A (zh) * | 2019-01-14 | 2019-05-24 | 海南英赛德信息系统有限公司 | 信息投放方法及装置、存储介质及电子设备 |
CN111639255A (zh) * | 2019-03-01 | 2020-09-08 | 北京字节跳动网络技术有限公司 | 搜索关键词的推荐方法、装置、存储介质及电子设备 |
CN111639255B (zh) * | 2019-03-01 | 2023-12-29 | 北京字节跳动网络技术有限公司 | 搜索关键词的推荐方法、装置、存储介质及电子设备 |
CN110264276A (zh) * | 2019-06-25 | 2019-09-20 | 广州视源电子科技股份有限公司 | 确定推送用户群的方法、装置、设备及存储介质 |
CN110598108A (zh) * | 2019-09-12 | 2019-12-20 | 珠海随变科技有限公司 | 一种搜索词推荐方法、装置、设备及存储介质 |
CN113221004A (zh) * | 2021-05-21 | 2021-08-06 | 珠海金山网络游戏科技有限公司 | 一种关键词展示方法及装置 |
CN113505281A (zh) * | 2021-06-15 | 2021-10-15 | 北京三快在线科技有限公司 | 搜索建议词生成方法、装置、电子设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
TW201415261A (zh) | 2014-04-16 |
TWI609278B (zh) | 2017-12-21 |
US20140108200A1 (en) | 2014-04-17 |
CN103729359B (zh) | 2017-03-01 |
US9489688B2 (en) | 2016-11-08 |
WO2014058679A1 (en) | 2014-04-17 |
EP2907052A1 (en) | 2015-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103729359A (zh) | 一种推荐搜索词的方法及系统 | |
CN103377190B (zh) | 一种基于交易平台的供应商信息搜索方法和装置 | |
US9201880B2 (en) | Processing a content item with regard to an event and a location | |
US9934293B2 (en) | Generating search results | |
US9117006B2 (en) | Recommending keywords | |
CN108885624B (zh) | 信息推荐系统及方法 | |
CN104111941B (zh) | 信息展示的方法及设备 | |
CN105574216A (zh) | 基于概率模型和用户行为分析的个性化推荐方法、系统 | |
CN104978314B (zh) | 媒体内容推荐方法及装置 | |
CN103309886A (zh) | 一种基于交易平台的结构化信息搜索方法和装置 | |
CN102063433A (zh) | 相关项推荐方法和装置 | |
CN103606097A (zh) | 一种基于可信度评价的产品信息推荐方法及系统 | |
CN102509233A (zh) | 一种基于用户网上动作信息的推荐方法 | |
CN105426514A (zh) | 个性化的移动应用app推荐方法 | |
JP2013531289A (ja) | 検索におけるモデル情報群の使用 | |
CN106062743A (zh) | 用于关键字建议的系统和方法 | |
CN103699603A (zh) | 一种基于用户行为的信息推荐方法和系统 | |
CN103927309A (zh) | 一种对业务对象标注信息标签的方法及装置 | |
CN103123624A (zh) | 确定中心词的方法及装置、搜索方法及装置 | |
CN109325146A (zh) | 一种视频推荐方法、装置、存储介质和服务器 | |
CN103294677A (zh) | 电子商务搜索引擎的搜索方法和电子商务搜索引擎 | |
CN110134845A (zh) | 项目舆情监控方法、装置、计算机设备及存储介质 | |
CN103729365A (zh) | 一种搜索方法和系统 | |
CN105468649A (zh) | 一种待展示对象匹配的判断方法及其装置 | |
CN103106234A (zh) | 一种网页内容搜索方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1194499 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1194499 Country of ref document: HK |