CN101286150A - 生成更新参数的方法和装置、展示相关关键词的方法和装置 - Google Patents

生成更新参数的方法和装置、展示相关关键词的方法和装置 Download PDF

Info

Publication number
CN101286150A
CN101286150A CNA2007100958487A CN200710095848A CN101286150A CN 101286150 A CN101286150 A CN 101286150A CN A2007100958487 A CNA2007100958487 A CN A2007100958487A CN 200710095848 A CN200710095848 A CN 200710095848A CN 101286150 A CN101286150 A CN 101286150A
Authority
CN
China
Prior art keywords
eigenwert
key
primary keyword
associative key
associative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007100958487A
Other languages
English (en)
Other versions
CN101286150B (zh
Inventor
潘磊
姚元湖
杨震
张恬及
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN2007100958487A priority Critical patent/CN101286150B/zh
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to EP07801005A priority patent/EP2136302A4/en
Priority to PCT/CN2007/070573 priority patent/WO2008122181A1/zh
Priority to US12/594,930 priority patent/US8676811B2/en
Priority to JP2010502405A priority patent/JP5238800B2/ja
Publication of CN101286150A publication Critical patent/CN101286150A/zh
Priority to HK09100034A priority patent/HK1120897A1/xx
Application granted granted Critical
Publication of CN101286150B publication Critical patent/CN101286150B/zh
Priority to JP2013076189A priority patent/JP6066077B2/ja
Priority to US14/160,364 priority patent/US8874588B2/en
Priority to US14/496,256 priority patent/US9135370B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种生成更新参数的方法,包括:获取预置时间段内用户使用的搜索关键词;对所述搜索关键词进行统计,获得主关键词、相关关键词、所述主关键词与相关关键词同时被搜索的次数以及所述主关键词单独被搜索的次数;根据所述主关键词单独被搜索的次数计算第一特征值;根据所述第一特征值和所述主关键词与相关关键词同时被搜索的次数计算第二特征值,所述第二特征值为确定该相关关键词展现方式的更新参数。本发明实施例有利于使关键词符合用户,使用户具有较好的操作体验,并且有效提高了系统的计算性能及计算效率;对于服务提供商来说,无特殊保密算法,实现简单,开发成本低。

Description

生成更新参数的方法和装置、展示相关关键词的方法和装置
技术领域
本发明涉及数据处理领域,特别是涉及一种生成更新参数的方法、一种生成更新参数的装置、一种展示相关关键词的方法和一种展示相关关键词的装置。
背景技术
随着因特网及其它数据网和系统中使用的文本和多媒体内容的迅速增加,用户越来越多地依靠基于关键词的搜索工具去搜索需要的信息。一般地,用户将所需要查找的信息文件的关键词输入搜索工具或引擎,由搜索工具或引擎在已有索引数据库中进行搜索并返回搜索结果,通常,现有的搜索工具或引擎还会在当前页面或搜索结果页面中展示与用户所输入的关键词(即主关键词)相关的一个或多个相关关键词。
众所周知,大多数用户在网上寻找信息都是从搜索引擎开始,通常都是通过输入关键词来寻找想要的信息,随着社会节奏的加快,文化冲突和融合的不断进行,导致许多固定关键词的已经远远不能涵盖现代社会中各种用户的需求,尤其随着信息迅速膨胀,上述问题越来越突出。由于固定的关键词内容固定,形成的时间较早,更新很慢,不符合互联网使用的活跃性,例如,对于主关键词“衣服”,现有技术获得的相关关键词通常为“运动服”、“羽绒服”等,而随着季节的变化,用户实际需要的相关关键词可能为“春装”、“夏装”、“T恤”等,显然,现有技术的关键词与用户的使用趋势不符。
所以,现阶段需要本领域技术人员迫切解决的一个技术问题就是:提供一种使关键词符合用户使用趋势的方法,从而用户的搜索。
发明内容
本发明所要解决的技术问题是提供一种生成更新参数方法和装置,用以使关键词的使用更符合用户的使用趋势。
相应的,本发明另一个目的是提供一种展示相关关键词方法和装置,用以保证用户可以简单、全面的获得相关关键词
为了解决上述问题,本发明实施例公开了一种生成更新参数方法,包括:
获取预置时间段内用户使用的搜索关键词;
对所述搜索关键词进行统计,获得主关键词、相关关键词、所述主关键词与相关关键词同时被搜索的次数以及所述主关键词单独被搜索的次数;
根据所述主关键词单独被搜索的次数计算第一特征值;
根据所述第一特征值和所述主关键词与相关关键词同时被搜索的次数计算第二特征值,所述第二特征值为确定该相关关键词展现方式的更新参数。
优选的是,所述的方法,还包括:
记录所述主关键词、相关关键词和第二特征值,形成关键词信息表。
优选的是,所述搜索关键词的统计步骤和特征值的计算步骤为多线程并行运算。
优选的是,所述的方法,还包括:
去除符合过滤规则的搜索关键词。
优选的是,通过以下步骤计算第二特征值:
根据所述主关键词与相关关键词同时被搜索的次数计算相关度;
获取缓存中的第一特征值,并根据所述第一特征值和相关度计算第二特征值。
优选的是,所述的方法,还包括:
在所述关键词信息表中记录相应的第一特征值。
优选的是,所述搜索关键词包括搜索用户使用的搜索关键词和发布用户使用的发布关键词。
本发明实施例还公开了一种生成更新参数的装置,包括:
获取单元:用于获取预置时间段内用户使用的搜索关键词;
统计单元:用于对所述搜索关键词进行统计,获得主关键词、相关关键词、所述主关键词与相关关键词同时被搜索的次数以及所述主关键词单独被搜索的次数;
第一计算单元:用于根据所述主关键词单独被搜索的次数计算第一特征值;
第二计算单元:用于根据所述第一特征值和所述主关键词与相关关键词同时被搜索的次数计算第二特征值,所述第二特征值为确定该相关关键词展现方式的更新参数。
优选的是,所述的装置,还包括:
记录单元:用于记录所述主关键词、相关关键词和第二特征值,形成关键词信息表。
优选的是,所述统计单元、第一计算单元和第二计算单元用于处理多线程并行运算。
优选的是,所述的装置,还包括:
过滤单元:用于去除符合过滤规则的搜索关键词。
优选的是,所述第二计算单元包括:
相关度计算子单元:用于根据所述主关键词与相关关键词同时被搜索的次数计算相关度;
获取计算子单元:用于获取缓存中的第一特征值,并根据所述第一特征值和相关度计算第二特征值。
优选的是,所述的装置,还包括:
添加单元:用于在所述关键词信息表中记录相应的第一特征值。
优选的是,所述搜索关键词包括搜索用户使用的搜索关键词和发布用户使用的发布关键词。
本发明实施例还公开了一种展示相关关键词的方法,包括:
根据用户输入的主关键词发出提取对应的相关关键词的请求;
根据所述请求获取第二特征值大于或等于一定阈值的相关关键词,所述第二特征值为根据第一特征值和所述主关键词与相关关键词同时被搜索的次数计算而得到,所述第一特征值为根据所述主关键词单独被搜索的次数计算而得到;所述主关键词与相关关键词同时被搜索的次数以及主关键词单独被搜索的次数通过对搜索关键词统计而得到;
展示所述相关关键词。
优选的是,所述的方法,还包括:
展示第二特征值小于一定阈值的相关关键词。
优选的是,所述获取为在关键词信息表中获取,所述关键词信息表包括主关键词、相关关键词和第二特征值。
本发明实施例还公开了一种展示相关关键词的装置,包括:
接口单元:用于根据用户输入的主关键词发出提取对应的相关关键词的请求;
相关关键词获取单元:用于根据所述请求获取第二特征值大于或等于一定阈值的相关关键词,所述第二特征值为根据第一特征值和所述主关键词与相关关键词同时被搜索的次数计算而得到,所述第一特征值为根据所述主关键词单独被搜索的次数计算而得到;所述主关键词与相关关键词同时被搜索的次数以及主关键词单独被搜索的次数通过对搜索关键词统计而得到;
第一展示单元:用于展示所述相关关键词。
优选的是,所述的装置,还包括:
第二展示单元:用于展示第二特征值小于一定阈值的相关关键词。
与现有技术相比,本发明实施例具有以下优点:
首先,本发明实施例基于预置时间段内用户使用的搜索关键词进行统计、计算,有利于保证关键词的时效性,并且通过以第二特征值作为确定该相关关键词展现方式的参数,从而使符合当前使用趋势的相关关键词优先提供给用户,从而使用户具有较好的操作体验;
其次,本发明通过建立关键词信息表,在更新时,只需要相应地更新表内数据即可,从而提高了系统处理效率;
再者,本发明的搜索关键词的统计步骤和特征值的计算步骤为多线程并行运算,从而有效提高了系统的计算性能及计算效率;
此外,本发明通过在缓存中保存第一特征值,更进一步提高了系统的计算性能及效率;本发明还通过记录所述第一特征值,并在展示主关键词时将所述第一特征值提供给用户作为参考;
最后,本发明实施例对于服务提供商来说,无特殊保密算法,实现简单,开发成本低。
附图说明
图1是本发明的一种生成更新参数的方法实施例的流程图;
图2是本发明的一种生成更新参数的装置实施例的结构图;
图3是本发明的一种展示相关关键词的方法实施例的流程图;
图4是本发明的一种展示相关关键词的装置实施例的结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明实施例的核心构思之一在于,通过更新主关键词与对应相关关键词的关联系数,并以此控制相应相关关键词的输出,使相关关键词更符合用户的搜索需求。
参考图1,示出了本发明的一种生成更新参数的方法实施例的流程图,具体包括以下步骤:
步骤101、获取预置时间段内用户使用的搜索关键词;
所述预置时间段可以由本领域技术人员根据需要进行预置,例如,对于购物网站,为了使相应的商品关键词符合用户的使用趋势,所述时间段可以预置为一个月,所述搜索关键词可以来自数据库、脚本程序、本地程序、用户输入历史记录、客户端、服务器或其它设备的存储单元等,本发明对此不作限制。
步骤102、对所述搜索关键词进行统计,获得主关键词、相关关键词、所述主关键词与相关关键词同时被搜索的次数以及所述主关键词单独被搜索的次数;
由于现有技术中的关键词内容固定,形成的时间较早,更新很慢,不符合互联网使用的活跃性,与用户使用要求不符。因此通过统计主关键词和相关关键词可以保证用户获得符合其使用趋势的相应关键词。在实际中,所述获得主关键词、相关关键词、所述主关键词与相关关键词同时被搜索的次数以及所述主关键词单独被搜索的次数的方法可以为现有技术中的任一种方法,例如,将所述搜索关键词作为主关键词,然后将与所述主关键词同时被搜索的关键词作为相关关键词,然后分别统计所述主关键词与相关关键词同时被搜索的次数以及所述主关键词单独被搜索的次数。
以下一种基于Apriori算法的统计方法为例,详细说明统计的过程,所述Apriori算法的基本过程为:(1)对事务数据库进行扫描,找出支持度不小于最小支持度的所有项目,即频繁项集L1;(2)对频繁项集L1中的项进行连接;(3)对事务数据库扫描:对频繁项目集L1中的集合进行过滤,找出L1中支持度不小于最小支持度的L2;(4)对频繁项集L2进行连接;(5)对事务数据库扫描:对频繁项目集L2中的集合进行过滤,找出L2中支持度不小于最小支持度的L3;以此类推。
如下表所示:
表1、获得的搜索关键词为:
    1     啤酒,口香糖,餐巾纸
    2     啤酒,花生,口香糖
    3     啤酒,牛奶
    4     牛奶,白糖
    5     花生,奶糖
表2、获得主关键词及其被单独搜索的次数为;
    主关键词     次数
    啤酒     3
    花生     2
    口香糖     2
    餐巾纸     1
    牛奶     2
    白糖     1
表3、进一步统计与主关键词同时被搜索的相关关键词,及其同时被搜索的次数:
    主关键词和相关关键词     同时被搜索的次数
    啤酒,花生     1
    啤酒,口香糖     2
    啤酒,餐巾纸     1
    啤酒,牛奶     1
    啤酒,白糖     0
    花生,口香糖     1
    花生,餐巾纸     0
    花生,牛奶     0
    花生,白糖     0
    口香糖,餐巾纸     1
    口香糖,牛奶     0
    口香糖,白糖     0
    餐巾纸,牛奶     0
    餐巾纸,白糖     0
    牛奶,白糖     1
按照上述规则统计完毕,即可获得相应的主关键词、相关关键词、所述主关键词与相关关键词同时被搜索的次数以及所述主关键词单独被搜索的次数。
当然,上述方法仅仅用于举例,本领域技术人员根据经验或者需要采用其它挖掘关联规则的方法或其它方法都是可行的,本发明对此不需要进行限定。
优选的是,本实施例还可以包括步骤:去除符合过滤规则的搜索关键词。所述过滤规则可以由本领域技术人员根据经验或者需要进行预置,假设对于上例中设置过滤规则为去除所述主关键词与相关关键词同时被搜索的次数小于2的项目,则得到符合条件的项目如表4所示。
表4:
  主关键词和相关关键词     同时被搜索的次数
  啤酒,口香糖     2
所述过滤规则还可以设置为去除搜索关键词为非法关键词或搜索关键词中包括非法字符或非法字词的搜索关键词等,本发明对此不作限制。
步骤103、根据所述主关键词单独被搜索的次数计算第一特征值;
为了使关键词的使用趋势更加符合用户的搜索需求,所述第一特征值可以理解为表示关键词的流行度的值,在这种情况下,所述第一特征值可以通过将所述主关键词单独被搜索的次数与预置的流行度基数对比获得,例如,一种计算所述第一特征值的公式为:
第一特征值=主关键词被单独搜索的次数/预置的流行度基数
例如,参考表5:
主关键词 相关关键词   主、相关关键词同时被搜索的次数   主关键词单独被搜索的次数
  bike   e bike,city bike,bicycle   2,1,1   2
  e bike   bike,city bike,bicycle   1,1,1   2
  city bike   bike,e bike   1,1   1
假设对于上表,预置的流行度基数为20,对于关键词bike的第一特征值则为2/20=0.1,而对于关键词e bike的第一特征值则为1/20=0.05。优选的是,所述流行度基数为所述主关键词被单独搜索的次数的中间值,例如,10%的主关键词被单独搜索的次数是10次,80%的主关键词被单独搜索的次数是20次,10%的主关键词被单独搜索的次数是50次,则取20为流行度基数,本领域技术人员根据经验或需要预置即可,本发明对此不作限制。
当然,所述第一特征值以及计算第一特征值的方法还可以由本领域技术人员根据需要或经验进行设置,上述方法仅用于举例,本发明对此不作限制。
步骤104、根据所述第一特征值和所述主关键词与相关关键词同时被搜索的次数计算第二特征值,所述第二特征值为确定该相关关键词展现方式的更新参数。
基于前述本发明实施例的核心构思之一,在实际中,需要获得相应的主关键词和相关关键词的关联系数。在本实施例中,则通过根据所述第一特征值和所述主关键词与相关关键词同时被搜索的次数进行计算,得到的第二特征值即可作为一种关联系数的表现形式。为了使所述第二特征值可以充分体现关键词的使用趋势,在本实施例中优选的是,通过以下子步骤计算第二特征值:
子步骤A1、根据所述主关键词与相关关键词同时被搜索的次数计算相关度;
子步骤A2、获取缓存中的第一特征值,并根据所述第一特征值和相关度计算第二特征值。
也就是说,首先根据所述主关键词与相关关键词同时被搜索的次数计算相关度,例如,一种计算相关度的公式为:
相关度=主关键词与相关关键词同时被搜索的次数/预置相关度基数
根据表5中的数据,假设预置的相关度基数为10,则主关键词bike和相关关键词e bike的相关度为搜索相关中间表中bike与e bike同时出现次数2/10=0.2。优选的是,所述相关度基数为所述主关键词与相关关键词同时被搜索的次数的中间值,本领域技术人员根据经验或需要预置即可,本发明对此不作限制。
为了提高计算的效率,在本实施例中可以将所述第一特征值保存在缓存中,当计算第二特征值时,则直接从缓存中获取相应的第一特征值,并根据所述第一特征值与相关度计算相应的第二特征值。显然,从缓存中获取数据要比从数据库或其它设备中获取数据要快得多,因此,本发明的优选实施例可以使本发明具有更优良的计算性能。此外,所述在缓存中保存的方法可以以哈希表的形式保存,也可以以文件形式保存,还可以以其它方式保存,为了进一步方便第一特征值的获取,还可以通过对所述主关键词设置升序排序等优化操作,当然,本发明对所述优化的方法不需要进行限定。
为了获得更准确的符合用户需求的第二特征值,更为优选的是,还可以分别对所述第一特征值和相关度进行加权,并将加权后的结果作为第二特征值。基于前例,假设获得关键词e bike的第一特征值为0.05,该第一特征值的权重为0.4,主关键词bike和相关关键词e bike的相关度为0.2,该相关度的权重为0.6,则得到主关键词bike和相关关键词e bike的第二特征值为:0.05*0.4+0.2*0.6=0.14。
所述权重可以由本领域技术人员根据经验或需要进行预置,并且也可以根据用户的需要任意更改,本发明对此不作限制。为了保证计算结果的一致性,更为优选的是,所述多个权重值的和为1。
当然,本领域技术人员采用其它计算第二特征值的方法也是可行的,本发明对此不需要进行限定。
所述第二特征值为确定该相关关键词展现方式的更新参数,例如,将所述第二特征值大于或等于一定阈值的相关关键词优先展现或固定展现,将所述第二特征值小于一定阈值的相关关键词轮循展现或不展现,所述根据第二特征值展现相关关键词的方式可以由本领域技术人员根据需要或经验任意设置,本发明对此不作限制。
优选的是,所述搜索关键词的统计步骤和特征值的计算步骤为多线程并行运算。
公知的是,多线程是这样一种机制:它允许在程序中并发执行多个指令流,每个指令流都称为一个线程,彼此间互相独立。多个线程的执行是并发的,也就是在逻辑上“同时”,也就是说,多线程运算就是同时存在N个执行体,按几条不同的执行线索共同运算的情况。显然,在本发明实施例中,统计搜索关键词的线程、计算特征值(包括第一特征值和第二特征值)的线程并行运算,循环处理相应的关键词,从而有效提高了本发明实施例的计算性能和计算效率。
优选的是,本发明实施例还可以包括步骤:记录所述主关键词、相关关键词和第二特征值。所述记录包括在表格中记录、在文件中记录或以其它任一种方式进行记录。更为优选的是,通过记录所述主关键词、相关关键词和第二特征值,形成关键词信息表,在下一次更新时,则只需要清除所述关键词信息表中的数据,按照本发明实施例所述的方法重新填写相关数据即可。所述更新可以为定期更新,例如,每个月发起一次更新,也可以为由本领域技术人员进行任意更新,本发明对此不作限制。
为了提供更直观的展示效果,使用户在搜索时可以获得直接的搜索提示,优选的是,本发明还可以包括步骤:在所述关键词信息表中记录相应的第一特征值。从而有效提高了搜索工具的智能性。
在实际中,一种可能的情况是,需要对不同类别的用户,提供不同的关键词。例如,对于购物网站而言,用户通常包括买方用户和卖方用户,在这种情况下,所述搜索关键词可以包括搜索用户使用的搜索关键词和发布用户使用的发布关键词。
为使本领域技术人员更好地理解本发明,以下对所述搜索关键词包括搜索用户使用的搜索关键词(第一搜索关键词)和发布用户使用的发布关键词(第二搜索关键词)的情况举例,以详细说明本发明的优选实施例。
步骤A、获取预置时间段的第一脚本程序中的第一搜索关键词,这些第一搜索关键词的来源是用户在打开浏览器到关闭浏览器的范围内,搜索时用到的关键词。例如,用户一次打开浏览器的过程中,在搜索框中搜索多次,输入了多个关键词,那么这些关键词就是本例所获取的第一搜索关键词。通过统计所述第一搜索关键词得到第一主关键词、第一相关关键词、所述第一主关键词与第一相关关键词同时被搜索的次数以及所述第一主关键词单独被搜索的次数如下表所示:
  第一主关键词 第一相关关键词   第一主、相关关键词同时被搜索的次数   第一主关键词单独被搜索的次数
  bike   e bike,city bike,bicycle   2,1,1   2
  e bike   bike,city bike,bicycle   1,1,1   2
  city bike   bike,e bike   1,1   1
步骤B、获取预置时间段的第二脚本程序中的第二搜索关键词,这些第二搜索关键词的来源是用户在发布产品时输入的关键词,因为通常可以发布三个或以上的关键词,则获取这些关键词。通过所述第二搜索关键词得到第二主关键词、第二相关关键词、所述第一主关键词与第一相关关键词同时被搜索的次数以及所述第二主关键词单独被搜索的次数如下表所示:
  第二主关键词 第二相关关键词   第二主、相关关键词同时被搜索的次数   第二主关键词单独被搜索的次数
  bike   e bike,city bike,bicycle   1,2,1   2
  e bike   bike,city bike   1,1   2
  city bike   bike,e bike,bicycle   2,1,1   1
步骤C、计算第一特征值:
预置流行度基数为20,则第一主关键词中bike的流行度为2/20=0.1,第一相关关键词中e bike的流行度为1/20=0.05;第二主关键词及相关关键词的第一特征值同上。
步骤D:计算相关度:
预置相关度基数为10,则主关键词bike和相关关键词e bike的第一相关度为2/10=0.2;第二相关度为1/10=0.1;按照经验分别取权重为:第一特征值权重0.2、第一相关度权重0.3、第二相关度权重0.5,则主关键词bike和相关关键词e bike的第二特征值为0.2*0.05+0.3*0.2+0.5*0.1=0.12。
在上述计算中,因为第一关键词与第二关键词的第一特征值相同,为提高计算效率,仅取一个第一特征值参与计算,显然,取两个第一特征值参与计算,并分别赋予不同权重,还是可以获得相同的计算结果。
步骤D、记录所述主关键词、相关关键词和第二特征值,形成关键词信息表为:
  主关键词   相关关键词   相关关键词分值
  bike   e bike,city bike,...   0.12,...
  ......
参照图2,示出了本发明的一种生成更新参数的装置实施例的结构框图,包括以下单元:
获取单元201:用于获取预置时间段内用户使用的搜索关键词;
统计单元202:用于对所述搜索关键词进行统计,获得主关键词、相关关键词、所述主关键词与相关关键词同时被搜索的次数以及所述主关键词单独被搜索的次数;
第一计算单元203:用于根据所述主关键词单独被搜索的次数计算第一特征值;
第二计算单元204:用于根据所述第一特征值和所述主关键词与相关关键词同时被搜索的次数计算第二特征值,所述第二特征值为确定该相关关键词展现方式的更新参数。
优选的是,所述的装置还可以包括记录单元:用于记录所述主关键词、相关关键词和第二特征值,形成关键词信息表。
优选的是,所述统计单元、第一计算单元和第二计算单元用于处理多线程并行运算。
优选的是,所述的装置还可以包括过滤单元:用于去除符合过滤规则的搜索关键词。
优选的是,所述第二计算单元包括:
相关度计算子单元:用于根据所述主关键词与相关关键词同时被搜索的次数计算相关度;
获取计算子单元:用于获取缓存中的第一特征值,并根据所述第一特征值和相关度计算第二特征值。
优选的是,所述的装置还可以包括添加单元:用于在所述关键词信息表中记录相应的第一特征值。
优选的是,所述搜索关键词包括搜索用户使用的搜索关键词和发布用户使用的发布关键词。
由于图2所示的生成更新参数的装置实施例可以对应适用于前述的生成更新参数的方法实施例中,所以描述较为简略,未详尽之处可以参见本说明书前面相应部分的描述。
参考图3,示出了本发明的一种添加相关关键词的方法,包括以下步骤:
步骤301、根据用户输入的主关键词发出提取对应的相关关键词的请求;
步骤302、根据所述请求获取第二特征值大于或等于一定阈值的相关关键词,所述第二特征值为根据第一特征值和所述主关键词与相关关键词同时被搜索的次数计算而得到,所述第一特征值为根据所述主关键词单独被搜索的次数计算而得到;所述主关键词与相关关键词同时被搜索的次数以及主关键词单独被搜索的次数通过对搜索关键词统计而得到;
步骤303、展示所述相关关键词。
用户在使用搜索工具或搜索引擎时,利用输入设备,比如键盘、手写板等在搜索栏或工具栏输入主关键词后,通过点击确定、按回车键或TAB键或其它触发方式即可触发本地程序或搜索页面的脚本程序发出对与所述主关键词对应的相关关键词的提取请求。
在实际中,所述第二特征值即可以理解为一种关联系数的表现形式。为了使所述第二特征值可以充分体现关键词的使用趋势,在本实施例中优选的是,可以首先根据所述主关键词与相关关键词同时被搜索的次数计算相关度,例如,一种计算相关度的公式为:
相关度=主关键词与相关关键词同时被搜索的次数/预置相关度基数
优选的是,所述相关度基数为所述主关键词与相关关键词同时被搜索的次数的中间值,本领域技术人员根据经验或需要预置即可,本发明对此不作限制。
根据所述第一特征值和相关度进行计算得到的结果即可作为第二特征值。
作为另一实施例,还可以分别对所述第一特征值和相关度进行加权,并将加权后的结果作为第二特征值。并且所述权重可以由本领域技术人员根据经验或需要进行预置,并且也可以根据用户的需要任意更改,本发明对此不作限制。为了保证计算结果的一致性,更为优选的是,所述多个权重值的和为1。
当然,本领域技术人员采用其它计算第二特征值的方法也是可行的,本发明对此不需要进行限定。
在实际中,所述第二特征值大于或等于一定阈值的相关关键词可以理解为在每次针对该主关键词展示相关关键词时固定展示的相关关键词,由于这些相关关键词具有大于或等于一定阈值的第二特征值,即表明其具有与主关键词较好的关联性,在这种情况下,可以使用户在每次相关关键词展示时,都可以较高的推荐项,更贴近用户的使用习惯,更符合用户的使用趋势,从而使用户获得更好的操作体验。例如,对于主关键词bike,所述第二特征值大于或等于一定阈值(如0.2)的相关关键词为:eclectric bike,mountain bike,e bike,e bicycle,suspension bike,scooter,motorcycle,electric scooter,gas scooter,vechicle,那么,对于固定搜索相关关键词的搜索工具而言,这10个相关关键词会固定出现在每次针对主关键词bike搜索的相关页面中;对于轮循展示的搜索工具而言,这10个相关关键词会固定存在于每个相关关键词分组表中,当用户针对bike发出对应的相关关键词提取请求时,不论所述请求的次数对应哪个相关关键词分组表,上述10个相关关键词都会出现在相关关键词分组表中提供给用户展示。
优选的是,对于第二特征值小于一定阈值的相关关键词可以按照任意规则进行展示,也可以不展示,例如,对于GOOGLE等仅展示固定个数相关关键词的搜索工具而言,可以选择仅展示固定个数的第二特征值大于或等于一定阈值的相关关键词,而不展示第二特征值小于一定阈值的相关关键词;对于一些可以实现相关关键词轮循展示或全部展示的搜索工具而言,则可以按照任意规则展示所有的相关关键词,本发明对此不作限制。
参考图4,示出了本发明的一种添加相关关键词的装置实施例的结构框图,包括以下单元:
接口单元401:用于根据用户输入的主关键词发出提取对应的相关关键词的请求;
相关关键词获取单元402:用于根据所述请求获取第二特征值大于或等于一定阈值的相关关键词,所述第二特征值为根据第一特征值和所述主关键词与相关关键词同时被搜索的次数计算而得到,所述第一特征值为根据所述主关键词单独被搜索的次数计算而得到;所述主关键词与相关关键词同时被搜索的次数以及主关键词单独被搜索的次数通过对搜索关键词统计而得到;
第一展示单元403:用于展示所述相关关键词。
优选的是,本实施例所述的装置还可以包括第二展示单元:用于展示第二特征值小于一定阈值的相关关键词
由于图4所述的展示相关关键词的装置实施例可以对应于图3所示的展示相关关键词方法实施例中,所以描述较为简略,未详尽之处可以参见本说明书前面相应部分的描述。
以上对本发明所提供的生成更新参数的方法及装置、展示相关关键词的方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (19)

1、一种生成更新参数的方法,其特征在于,包括:
获取预置时间段内用户使用的搜索关键词;
对所述搜索关键词进行统计,获得主关键词、相关关键词、所述主关键词与相关关键词同时被搜索的次数以及所述主关键词单独被搜索的次数;
根据所述主关键词单独被搜索的次数计算第一特征值;
根据所述第一特征值和所述主关键词与相关关键词同时被搜索的次数计算第二特征值,所述第二特征值为确定该相关关键词展现方式的更新参数。
2、如权利要求1所述的方法,其特征在于,还包括:
记录所述主关键词、相关关键词和第二特征值,形成关键词信息表。
3、如权利要求1所述的方法,其特征在于,所述搜索关键词的统计步骤和特征值的计算步骤为多线程并行运算。
4、如权利要求1、2或3所述的方法,其特征在于,还包括:
去除符合过滤规则的搜索关键词。
5、如权利要求1所述的方法,其特征在于,通过以下步骤计算第二特征值:
根据所述主关键词与相关关键词同时被搜索的次数计算相关度;
获取缓存中的第一特征值,并根据所述第一特征值和相关度计算第二特征值。
6、如权利要求2所述的方法,其特征在于,还包括:
在所述关键词信息表中记录相应的第一特征值。
7、如权利要求1、2、3、5或6所述的方法,其特征在于,所述搜索关键词包括搜索用户使用的搜索关键词和发布用户使用的发布关键词。
8、一种生成更新参数的装置,其特征在于,包括:
获取单元:用于获取预置时间段内用户使用的搜索关键词;
统计单元:用于对所述搜索关键词进行统计,获得主关键词、相关关键词、所述主关键词与相关关键词同时被搜索的次数以及所述主关键词单独被搜索的次数;
第一计算单元:用于根据所述主关键词单独被搜索的次数计算第一特征值;
第二计算单元:用于根据所述第一特征值和所述主关键词与相关关键词同时被搜索的次数计算第二特征值,所述第二特征值为确定该相关关键词展现方式的更新参数。
9、如权利要求8所述的装置,其特征在于,还包括:
记录单元:用于记录所述主关键词、相关关键词和第二特征值,形成关键词信息表。
10、如权利要求8所述的装置,其特征在于,所述统计单元、第一计算单元和第二计算单元用于处理多线程并行运算。
11、如权利要求8、9或10所述的装置,其特征在于,还包括:
过滤单元:用于去除符合过滤规则的搜索关键词。
12、如权利要求8所述的装置,其特征在于,所述第二计算单元包括:
相关度计算子单元:用于根据所述主关键词与相关关键词同时被搜索的次数计算相关度;
获取计算子单元:用于获取缓存中的第一特征值,并根据所述第一特征值和相关度计算第二特征值。
13、如权利要求9所述的装置,其特征在于,还包括:
添加单元:用于在所述关键词信息表中记录相应的第一特征值。
14、如权利要求8、9、10、12或13所述的装置,其特征在于,所述搜索关键词包括搜索用户使用的搜索关键词和发布用户使用的发布关键词。
15、一种展示相关关键词的方法,其特征在于,包括:
根据用户输入的主关键词发出提取对应的相关关键词的请求;
根据所述请求获取第二特征值大于或等于一定阈值的相关关键词,所述第二特征值为根据第一特征值和所述主关键词与相关关键词同时被搜索的次数计算而得到,所述第一特征值为根据所述主关键词单独被搜索的次数计算而得到;所述主关键词与相关关键词同时被搜索的次数以及主关键词单独被搜索的次数通过对搜索关键词统计而得到;
展示所述相关关键词。
16、如权利要求15所述的方法,其特征在于,还包括:
展示第二特征值小于一定阈值的相关关键词。
17、如权利要求15所述的方法,其特征在于,所述获取为在关键词信息表中获取,所述关键词信息表包括主关键词、相关关键词和第二特征值。
18、一种展示相关关键词的装置,其特征在于,包括:
接口单元:用于根据用户输入的主关键词发出提取对应的相关关键词的请求;
相关关键词获取单元:用于根据所述请求获取第二特征值大于或等于一定阈值的相关关键词,所述第二特征值为根据第一特征值和所述主关键词与相关关键词同时被搜索的次数计算而得到,所述第一特征值为根据所述主关键词单独被搜索的次数计算而得到;所述主关键词与相关关键词同时被搜索的次数以及主关键词单独被搜索的次数通过对搜索关键词统计而得到;
第一展示单元:用于展示所述相关关键词。
19、如权利要求18所述的装置,其特征在于,还包括:
第二展示单元:用于展示第二特征值小于一定阈值的相关关键词。
CN2007100958487A 2007-04-10 2007-04-10 生成更新参数的方法和装置、展示相关关键词的方法和装置 Expired - Fee Related CN101286150B (zh)

Priority Applications (9)

Application Number Priority Date Filing Date Title
CN2007100958487A CN101286150B (zh) 2007-04-10 2007-04-10 生成更新参数的方法和装置、展示相关关键词的方法和装置
PCT/CN2007/070573 WO2008122181A1 (en) 2007-04-10 2007-08-28 Method and device for generating updating parameter, and method and device for showing related keyword
US12/594,930 US8676811B2 (en) 2007-04-10 2007-08-28 Method and apparatus of generating update parameters and displaying correlated keywords
JP2010502405A JP5238800B2 (ja) 2007-04-10 2007-08-28 更新パラメータを生成および相関するキーワードを表示するための方法および装置
EP07801005A EP2136302A4 (en) 2007-04-10 2007-08-28 METHOD AND DEVICE FOR UPDATING PARAMETERS, AND METHOD AND DEVICE FOR DISPLAYING A KEYWORD THEREOF
HK09100034A HK1120897A1 (en) 2007-04-10 2009-01-02 Method and device for generating updating parameter, and method and device for showing related keyword
JP2013076189A JP6066077B2 (ja) 2007-04-10 2013-04-01 更新パラメータを生成および相関するキーワードを表示するための方法および装置
US14/160,364 US8874588B2 (en) 2007-04-10 2014-01-21 Method and apparatus of generating update parameters and displaying correlated keywords
US14/496,256 US9135370B2 (en) 2007-04-10 2014-09-25 Method and apparatus of generating update parameters and displaying correlated keywords

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007100958487A CN101286150B (zh) 2007-04-10 2007-04-10 生成更新参数的方法和装置、展示相关关键词的方法和装置

Publications (2)

Publication Number Publication Date
CN101286150A true CN101286150A (zh) 2008-10-15
CN101286150B CN101286150B (zh) 2010-09-15

Family

ID=39830463

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007100958487A Expired - Fee Related CN101286150B (zh) 2007-04-10 2007-04-10 生成更新参数的方法和装置、展示相关关键词的方法和装置

Country Status (6)

Country Link
US (3) US8676811B2 (zh)
EP (1) EP2136302A4 (zh)
JP (2) JP5238800B2 (zh)
CN (1) CN101286150B (zh)
HK (1) HK1120897A1 (zh)
WO (1) WO2008122181A1 (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102033886B (zh) * 2009-09-25 2012-07-04 香港纺织及成衣研发中心 一种织物检索方法及系统
CN103455487A (zh) * 2012-05-29 2013-12-18 腾讯科技(深圳)有限公司 一种搜索词的提取方法及装置
WO2015081792A1 (zh) * 2013-12-03 2015-06-11 北京奇虎科技有限公司 联动性和个性化扩展搜索方法及装置、系统
CN105354185A (zh) * 2015-10-30 2016-02-24 上海智臻智能网络科技股份有限公司 用于问答系统挖掘关联问句的方法及装置
CN106030580A (zh) * 2014-02-28 2016-10-12 富士胶片株式会社 商品搜索装置、商品搜索系统、服务器系统及商品搜索方法
WO2017063420A1 (zh) * 2015-10-12 2017-04-20 百度在线网络技术(北京)有限公司 用于确定用户需求的方法与装置
CN106970952A (zh) * 2017-03-09 2017-07-21 浙江中诚工程管理科技有限公司 报表生成方法及系统
CN107291707A (zh) * 2016-03-30 2017-10-24 阿里巴巴集团控股有限公司 确定词组关联度的方法、品牌竞争度的方法及其装置
CN107330672A (zh) * 2017-07-03 2017-11-07 北京拉勾科技有限公司 一种基于相似度的信息处理方法、装置及计算设备
CN110489652A (zh) * 2019-08-23 2019-11-22 重庆邮电大学 基于用户行为检测的新闻推荐方法、系统及计算机设备
CN111324804A (zh) * 2020-02-21 2020-06-23 北京字节跳动网络技术有限公司 搜索关键词推荐模型生成方法、关键词推荐方法与装置
CN112835919A (zh) * 2021-02-24 2021-05-25 武汉联影医疗科技有限公司 医学数据库更新方法、装置、计算机设备和存储介质
CN113221004A (zh) * 2021-05-21 2021-08-06 珠海金山网络游戏科技有限公司 一种关键词展示方法及装置

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286150B (zh) 2007-04-10 2010-09-15 阿里巴巴集团控股有限公司 生成更新参数的方法和装置、展示相关关键词的方法和装置
US9262482B2 (en) * 2010-04-19 2016-02-16 Facebook, Inc. Generating default search queries on online social networks
CN102654862B (zh) * 2011-03-01 2016-02-17 腾讯科技(深圳)有限公司 信息相关性分析方法和装置
TW201322022A (zh) * 2011-11-24 2013-06-01 Alibaba Group Holding Ltd 分散式資料流處理方法及其系統
JP5847867B2 (ja) * 2014-03-14 2016-01-27 ヤフー株式会社 広告主向け参考情報提供装置
US9754037B2 (en) 2014-08-27 2017-09-05 Facebook, Inc. Blending by query classification on online social networks
US9703859B2 (en) * 2014-08-27 2017-07-11 Facebook, Inc. Keyword search queries on online social networks
US9990441B2 (en) * 2014-12-05 2018-06-05 Facebook, Inc. Suggested keywords for searching content on online social networks
CN105302894A (zh) * 2015-10-21 2016-02-03 中国石油大学(华东) 一种基于并行关联规则的舆情热点跟踪方法与跟踪装置
EP3679488A4 (en) * 2017-09-08 2021-05-19 Open Text SA ULC SYSTEM AND METHOD FOR RECOMMENDING TERMS, INCLUDING RECOMMENDING SEARCH TERMS IN A SEARCH SYSTEM
CN111191119B (zh) * 2019-12-16 2023-12-12 绍兴市上虞区理工高等研究院 一种基于神经网络的科技成果自学习方法及装置
US11016980B1 (en) * 2020-11-20 2021-05-25 Coupang Corp. Systems and method for generating search terms

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06314296A (ja) * 1993-03-02 1994-11-08 Fujitsu Ltd 情報検索システム
JPH0756948A (ja) * 1993-08-09 1995-03-03 Fuji Xerox Co Ltd 情報検索装置
JPH09319767A (ja) 1996-05-29 1997-12-12 Oki Electric Ind Co Ltd 類義語辞書登録方法
US6421675B1 (en) * 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
US6006225A (en) * 1998-06-15 1999-12-21 Amazon.Com Refining search queries by the suggestion of correlated terms from prior searches
US6144958A (en) 1998-07-15 2000-11-07 Amazon.Com, Inc. System and method for correcting spelling errors in search queries
US6523028B1 (en) * 1998-12-03 2003-02-18 Lockhead Martin Corporation Method and system for universal querying of distributed databases
JP2002007450A (ja) * 2000-06-16 2002-01-11 Matsushita Electric Works Ltd 検索支援システム
JP3563682B2 (ja) 2000-09-12 2004-09-08 日本電信電話株式会社 次検索候補単語提示方法および装置と次検索候補単語提示プログラムを記録した記録媒体
AU2003212463A1 (en) * 2002-03-01 2003-09-16 Paul Jeffrey Krupin A method and system for creating improved search queries
JP2003323433A (ja) * 2002-05-07 2003-11-14 Hitachi Ltd 情報端末およびサーバ
US7853557B2 (en) * 2002-06-14 2010-12-14 Siebel Systems, Inc. Method and computer for responding to a query according to the language used
US7240049B2 (en) * 2003-11-12 2007-07-03 Yahoo! Inc. Systems and methods for search query processing using trend analysis
CN1922605A (zh) * 2003-12-26 2007-02-28 松下电器产业株式会社 辞典制作装置以及辞典制作方法
US8572233B2 (en) * 2004-07-15 2013-10-29 Hewlett-Packard Development Company, L.P. Method and system for site path evaluation using web session clustering
US7440947B2 (en) 2004-11-12 2008-10-21 Fuji Xerox Co., Ltd. System and method for identifying query-relevant keywords in documents with latent semantic analysis
US7406465B2 (en) 2004-12-14 2008-07-29 Yahoo! Inc. System and methods for ranking the relative value of terms in a multi-term search query using deletion prediction
US8185523B2 (en) * 2005-03-18 2012-05-22 Search Engine Technologies, Llc Search engine that applies feedback from users to improve search results
US8135728B2 (en) 2005-03-24 2012-03-13 Microsoft Corporation Web document keyword and phrase extraction
JP4774806B2 (ja) * 2005-05-25 2011-09-14 セイコーエプソン株式会社 ファイル検索装置、印刷装置、ファイル検索方法及びそのプログラム
US7739708B2 (en) 2005-07-29 2010-06-15 Yahoo! Inc. System and method for revenue based advertisement placement
US7558787B2 (en) * 2006-07-05 2009-07-07 Yahoo! Inc. Automatic relevance and variety checking for web and vertical search engines
US7779003B2 (en) 2006-07-17 2010-08-17 Siemens Medical Solutions Usa, Inc. Computerized search system for medication and other items
US7937403B2 (en) * 2006-10-30 2011-05-03 Yahoo! Inc. Time-based analysis of related keyword searching
CA2674294C (en) 2006-12-29 2017-03-07 Thomson Reuters Global Resources Information-retrieval systems, methods, and software with concept-based searching and ranking
US8285745B2 (en) 2007-03-01 2012-10-09 Microsoft Corporation User query mining for advertising matching
CN101286150B (zh) 2007-04-10 2010-09-15 阿里巴巴集团控股有限公司 生成更新参数的方法和装置、展示相关关键词的方法和装置
CN101477542B (zh) * 2009-01-22 2013-02-13 阿里巴巴集团控股有限公司 一种抽样分析方法、系统和设备

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102033886B (zh) * 2009-09-25 2012-07-04 香港纺织及成衣研发中心 一种织物检索方法及系统
CN103455487B (zh) * 2012-05-29 2018-07-06 腾讯科技(深圳)有限公司 一种搜索词的提取方法及装置
CN103455487A (zh) * 2012-05-29 2013-12-18 腾讯科技(深圳)有限公司 一种搜索词的提取方法及装置
WO2015081792A1 (zh) * 2013-12-03 2015-06-11 北京奇虎科技有限公司 联动性和个性化扩展搜索方法及装置、系统
CN106030580A (zh) * 2014-02-28 2016-10-12 富士胶片株式会社 商品搜索装置、商品搜索系统、服务器系统及商品搜索方法
WO2017063420A1 (zh) * 2015-10-12 2017-04-20 百度在线网络技术(北京)有限公司 用于确定用户需求的方法与装置
CN105354185A (zh) * 2015-10-30 2016-02-24 上海智臻智能网络科技股份有限公司 用于问答系统挖掘关联问句的方法及装置
CN107291707A (zh) * 2016-03-30 2017-10-24 阿里巴巴集团控股有限公司 确定词组关联度的方法、品牌竞争度的方法及其装置
CN106970952A (zh) * 2017-03-09 2017-07-21 浙江中诚工程管理科技有限公司 报表生成方法及系统
CN107330672A (zh) * 2017-07-03 2017-11-07 北京拉勾科技有限公司 一种基于相似度的信息处理方法、装置及计算设备
CN107330672B (zh) * 2017-07-03 2021-02-26 北京拉勾科技有限公司 一种基于相似度的信息处理方法、装置及计算设备
CN110489652A (zh) * 2019-08-23 2019-11-22 重庆邮电大学 基于用户行为检测的新闻推荐方法、系统及计算机设备
CN111324804A (zh) * 2020-02-21 2020-06-23 北京字节跳动网络技术有限公司 搜索关键词推荐模型生成方法、关键词推荐方法与装置
CN111324804B (zh) * 2020-02-21 2023-09-22 抖音视界有限公司 搜索关键词推荐模型生成方法、关键词推荐方法与装置
CN112835919A (zh) * 2021-02-24 2021-05-25 武汉联影医疗科技有限公司 医学数据库更新方法、装置、计算机设备和存储介质
CN113221004A (zh) * 2021-05-21 2021-08-06 珠海金山网络游戏科技有限公司 一种关键词展示方法及装置

Also Published As

Publication number Publication date
US8874588B2 (en) 2014-10-28
JP6066077B2 (ja) 2017-01-25
WO2008122181A1 (en) 2008-10-16
US9135370B2 (en) 2015-09-15
JP2010524099A (ja) 2010-07-15
HK1120897A1 (en) 2009-04-09
US8676811B2 (en) 2014-03-18
US20140136551A1 (en) 2014-05-15
JP2013152744A (ja) 2013-08-08
CN101286150B (zh) 2010-09-15
EP2136302A1 (en) 2009-12-23
US20100121860A1 (en) 2010-05-13
US20150106391A1 (en) 2015-04-16
EP2136302A4 (en) 2010-11-24
JP5238800B2 (ja) 2013-07-17

Similar Documents

Publication Publication Date Title
CN101286150B (zh) 生成更新参数的方法和装置、展示相关关键词的方法和装置
CN111177569B (zh) 基于人工智能的推荐处理方法、装置及设备
TWI508011B (zh) Category information providing method and device
CN103258000B (zh) 对网页中高频关键词进行聚类的方法及装置
CN107463591B (zh) 响应于搜索查询对待与内容匹配的图像动态排序的方法和系统
CN111708740A (zh) 基于云平台的海量搜索查询日志计算分析系统
JP2015191655A (ja) 推奨ページを生成するための方法及び装置
CN106202294B (zh) 基于关键词和主题模型融合的相关新闻计算方法及装置
JP2017157192A (ja) キーワードに基づいて画像とコンテンツアイテムをマッチングする方法
TW201214167A (en) Matching text sets
CN104866471B (zh) 一种基于局部敏感哈希策略的实例匹配方法
CN111414122B (zh) 一种智能文本处理方法、装置、电子设备及存储介质
KR20080028574A (ko) 통합 검색 서비스 시스템 및 방법
US20150215271A1 (en) Generating suggested domain names by locking slds, tokens and tlds
JP6165955B1 (ja) 検索クエリに応答してホワイトリストとブラックリストを使用し画像とコンテンツをマッチングする方法及びシステム
US20200134511A1 (en) Systems and methods for identifying documents with topic vectors
CN110321437B (zh) 一种语料数据处理方法、装置、电子设备及介质
CN102930038A (zh) 一种检索结果相似条目的合并方法及其系统
CN103123624A (zh) 确定中心词的方法及装置、搜索方法及装置
CN105095209A (zh) 文档聚类方法及装置、网络设备
CN113886708A (zh) 基于用户信息的产品推荐方法、装置、设备及存储介质
CN110442616B (zh) 一种针对大数据量的页面访问路径分析方法与系统
CN111142728A (zh) 车载环境智能文本处理方法、装置、电子设备及存储介质
CN107622125B (zh) 一种信息爬取方法和装置、电子设备
CN105808761A (zh) 一种基于大数据Solr网页排序优化方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1120897

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1120897

Country of ref document: HK

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100915

CF01 Termination of patent right due to non-payment of annual fee