CN102456058A - 类目信息提供方法及装置 - Google Patents

类目信息提供方法及装置 Download PDF

Info

Publication number
CN102456058A
CN102456058A CN2010105302315A CN201010530231A CN102456058A CN 102456058 A CN102456058 A CN 102456058A CN 2010105302315 A CN2010105302315 A CN 2010105302315A CN 201010530231 A CN201010530231 A CN 201010530231A CN 102456058 A CN102456058 A CN 102456058A
Authority
CN
China
Prior art keywords
unit
classification information
key word
searching key
current keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010105302315A
Other languages
English (en)
Other versions
CN102456058B (zh
Inventor
钱建平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201010530231.5A priority Critical patent/CN102456058B/zh
Priority to TW100104746A priority patent/TWI508011B/zh
Priority to US13/317,789 priority patent/US8583685B2/en
Priority to PCT/US2011/001831 priority patent/WO2012060866A1/en
Priority to EP11838348.8A priority patent/EP2635960A4/en
Priority to JP2013537652A priority patent/JP5449628B2/ja
Publication of CN102456058A publication Critical patent/CN102456058A/zh
Priority to HK12107082.0A priority patent/HK1166527A1/zh
Priority to US14/037,247 priority patent/US9087108B2/en
Application granted granted Critical
Publication of CN102456058B publication Critical patent/CN102456058B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种类目信息提供方法及装置,包括步骤:获得规定时间段内输入的各搜索关键词和各搜索关键词对应的类目信息;将获得的每个搜索关键词划分为各搜索关键词单元;将针对每个搜索关键词划分出的各搜索关键词单元组合为各阶搜索关键词单元组;分别确定组合出的各搜索关键词单元组对应的类目信息;根据确定出的类目信息,建立各阶搜索关键词表,每阶搜索关键词表中包含各该阶搜索关键词单元组与类目信息的对应关系;根据输入的当前关键词,在建立的各阶搜索关键词表中,确定选择出的当前关键词单元所对应的类目信息,并返回确定出的类目信息。采用本申请技术方案,解决了现有技术中存在的无法为用户提供长尾关键词的类目信息的问题。

Description

类目信息提供方法及装置
技术领域
本申请涉及信息处理技术领域,尤其涉及一种类目信息提供方法及装置。
背景技术
电子商务网站为用户提供了能够在网上实现交易的商品的商品信息,用户利用电子商务网站的资金结算系统来购买商品,电子商务网站通过物流配送系统将用户购买的商品配送给用户,这极大提高了用户购物的便利性。
用户通过输入搜索关键词以检索电子商务网站上相关商品,电子商务网站根据用户输入的关键词输出相关商品页面链接,并为其推荐合理的类目,以便于用户在选择的类目所包含的商品中顺利找到自己需要的商品,这避免了用户盲目和繁琐的搜索过程。
现有技术中,为用户提供类目信息可以通过实时查询的方式实现,如图1所示,其具体处理过程如下:
步骤11,接收用户输入的关键词,例如用户输入的关键词为“纯色帽子”;
步骤12,在所有商品的商品标识中,查找包含该关键词的商品标识;假设一共查找到包含“纯色帽子”的商品标识有508个;
步骤13,确定查找到的各商品标识分别对应的类目信息,若查找到的508个商品标识分别对应的类目信息为“帽子”或“女装”,则确定出的类目信息为“帽子”和“女装”;
步骤14,针对确定出的每个类目信息,在查找到的商品标识中,确定与该类目信息对应的商品标识的个数;假设查找到的508个商品标识中,有192个商品标识对应的类目信息均为“帽子”,有316个商品标识对应的类目信息均为“女装”,因此,针对类目信息“帽子”确定出的个数为192个,针对类目信息“女装”确定出的个数为316个;
步骤15,将确定出的每个类目信息和针对该类目信息确定出的个数对应提供给该用户;例如将“帽子(192)”和“女装(316)”提供给该用户。
但是,在上述方法中,电子商务网站需要根据用户输入的关键词实时地进行商品标识检索和类目信息的确定,这将耗费较多的处理资源,并且处理效率比较低。
针对上述问题,现有技术提出了查询词表的方式,如图2所示,其具体处理过程如下:
步骤21,当用户点击搜索结果列表中的商品链接时,将用户输入的当前关键词和该商品的类目信息进行对应存储;
步骤22,对存储的关键词和类目信息进行简单汇总,确定出规定时间段内搜索次数大于规定阈值的关键词;例如,确定出一周内搜索次数大于30次的关键词;
步骤23,由确定出的各关键词和类目信息的对应关系组成查询词表,其中每个关键词和至少一个类目信息对应;
步骤24,后续用户输入关键词搜索商品时,根据用户输入的关键词,在存储的查询词表中查找与用户输入的关键词对应的类目信息;
步骤25,将查找到的类目信息提供给用户。
由上可见,基于查询词表的方式为用户提供类目信息时,查询词表中只存储了用户搜索频率较高的关键词和类目信息的对应关系,现有技术中,用户搜索频率较低的关键词称为低频搜索关键词,也可以称为长尾关键词,由于查询词表中并没有存储长尾关键词以及对应的类目信息,因此当用户输入的关键词为长尾关键词时,难以为用户提供对应的类目信息。
发明内容
本申请实施例提供一种类目信息提供方法及装置,用以解决现有技术中存在的无法为用户提供长尾关键词的类目信息的问题。
本申请实施例技术方案如下:
一种类目信息提供方法,该方法包括步骤:获得规定时间段内输入的各搜索关键词和各搜索关键词对应的类目信息;将获得的每个搜索关键词,划分为各搜索关键词单元;分别将针对每个搜索关键词划分出的各搜索关键词单元,组合为各阶搜索关键词单元组;根据获得的各搜索关键词对应的类目信息,分别确定组合出的各搜索关键词单元组对应的类目信息;根据确定出的类目信息,建立各阶搜索关键词表,每阶搜索关键词表中包含各该阶搜索关键词单元组与类目信息的对应关系;根据输入的当前关键词,在建立的各阶搜索关键词表中,确定选择出的当前关键词单元所对应的类目信息,并返回确定出的类目信息。
一种类目信息提供装置,包括:搜索关键词获得单元,用于获得规定时间段内输入的各搜索关键词和各搜索关键词对应的类目信息;搜索关键词划分单元,用于将搜索关键词获得单元获得的每个搜索关键词,划分为各搜索关键词单元;搜索关键词单元组合单元,用于分别将搜索关键词划分单元针对每个搜索关键词划分出的各搜索关键词单元,组合为各阶搜索关键词单元组;第一类目信息确定单元,用于根据搜索关键词获得单元获得的各搜索关键词对应的类目信息,分别确定搜索关键词单元组合单元组合出的各搜索关键词单元组对应的类目信息;搜索关键词表建立单元,用于根据第一类目信息确定单元确定出的类目信息,建立各阶搜索关键词表,每阶搜索关键词表中包含各该阶搜索关键词单元组与类目信息的对应关系;第二类目信息确定单元,用于根据输入的当前关键词,在搜索关键词表建立单元建立的各阶搜索关键词表中,确定选择出的当前关键词单元所对应的类目信息;第一类目信息返回单元,用于返回第二类目信息确定单元确定出的类目信息。
本申请实施例技术方案中,将规定时间段内输入的每个搜索关键词划分为各搜索关键词单元,分别将针对每个搜索关键词划分出的各搜索关键词单元,组合为各阶搜索关键词单元组,确定组合出的各搜索关键词单元组对应的类目信息,根据确定出的类目信息,建立各阶搜索关键词表,根据输入的当前关键词,在建立的各阶搜索关键词表中,确定选择出的当前关键词单元所对应的类目信息,并返回确定出的类目信息,由上可见,本申请实施例技术方案预先建立了包含各阶搜索关键词表,后续可以直接根据建立的搜索关键词表查询当前关键词对应的类目信息,解决了现有技术无法为用户提供长尾关键词的类目信息的问题,有效地提高了为用户提供类目信息的全面性和灵活性。
附图说明
图1为现有技术中通过实时查询的方式为用户提供类目信息的方法流程示意图;
图2为现有技术中通过查询词表的方式为用户提供类目信息的方法流程示意图;
图3为本申请实施例一中类目信息提供方法流程示意图;
图4为本申请实施例二中类目信息提供方法具体实现流程示意图;
图5为本申请实施例三中类目信息提供装置结构示意图;
图6为本申请实施例三中类目信息提供装置结构示意图。
具体实施方式
下面结合各个附图对本申请实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细地阐述。
实施例一
本申请实施例一提供了一种类目信息提供方法,如图3所示,其具体处理过程如下:
步骤31,获得规定时间段内输入的各搜索关键词和各搜索关键词对应的类目信息;
用户通过网页浏览器输入搜索关键词后,网页浏览器会为用户提供一个搜索结果列表,该搜索结果列表中包含根据用户输入的搜索关键词搜索到的各个商品的链接,若用户点击了搜索结果列表中的一个链接,则网页浏览器将该用户的此次点击行为记录在点击日志中并发送给日志服务器,每个点击日志中包含用户输入的搜索关键词、用户点击的商品对应的类目信息以及用户标识,由于用户相当于电子商务网站的访客,因此用户标识也为访客标识,点击日志的格式可以但不限于为下述:
  搜索关键词   点击的商品对应的类目信息   访客标识
  纯色长袖衬衫   时尚男装   001
其中,搜索关键词也可以对应两个以上的类目信息,此时点击日志的格式可以但不限于为下述:
Figure BDA0000030553440000051
定时从日志服务器获得点击日志,该定时的周期可以但不限于设置为一天、一周或一个月等,因此就能够定时的获得对应周期内的各搜索关键词和各搜索关键词对应的类目信息。
此外,还可以使用上传日志来代替点击日志,上传日志中包含卖家上传的商品标识、该商品的类目信息以及该商家的标识,其中卖家上传的商品标识可以被视为点击日志中的搜索关键词,该商家的标识可以被视为点击日志中的访客标识。
步骤32,将获得的每个搜索关键词,划分为各搜索关键词单元;
获得点击日志后,对获得的每个点击日志进行分析,首先将各点击日志中的搜索关键词进行归一化处理。例如去除不必要的词、去除多余空格、大小写字母的转换、全角半角的转换、简体繁体的转换、去除标点符号、数字格式的转换等,完成归一化处理后,将每个搜索关键词划分为各搜索关键词单元。其中划分的方式可以但不限于基于统计的分词算法,使用语料库来划分搜索关键词单元,将搜索关键词与语料库中的各个分词进行匹配,将匹配出的各个分词确认为划分后的各搜索关键词单元,例如,对获得的搜索关键词“纯色长袖衬衫”进行划分后,得到的各搜索关键词单元分别为“纯色”、“长袖”和“衬衫”。
本申请实施例一提出,在将每个搜索关键词划分为各个搜索关键词单元后,可以对划分的各搜索关键词单元进行排序,得到排序后的搜索关键词。其中可以但不限于按照拼音、笔划等排序进行排序。排序的目的是减少最后形成的搜索关键词表的规模以及建立搜索关键词表的处理步骤。例如,针对搜索关键词“长袖纯色衬衫”和“长袖衬衫纯色”进行搜索关键词单元划分后的结果均为:“长袖”、“纯色”和“衬衫”,排序后的搜索关键词均为“长袖^衬衫^纯色”,后续只要针对排序后的搜索关键词“长袖^衬衫^纯色”进行处理即可。当然,针对每个搜索关键词划分出的各个搜索关键词单元不进行排序处理的技术方案也在本申请的保护范围内。
步骤33,分别将针对每个搜索关键词划分出的各搜索关键词单元,组合为各阶搜索关键词单元组;
本申请实施例一提出,可以预先设置一个规定数目N,其中N≥1,建立1阶至N阶搜索关键词表,对每个搜索关键词进行关键词单元划分时,假设划分出的搜索关键词单元的数目为P,若P>N,此时可以组合出1阶至N阶搜索关键词单元组,若P≤N,此时只能组合出1阶至P阶搜索关键词单元组。每阶搜索关键词单元组中包含的搜索关键词单元的数目与阶数相同。
下面分别介绍如何组合1阶、2阶、3阶搜索关键词单元组。
当组合1阶搜索关键词单元组时,在排序后的每个搜索关键词中,直接将每个搜索关键词单元作为组合后的一个1阶搜索关键词单元组。例如针对“长袖纯色衬衫”和“长袖衬衫纯色”划分出的搜索关键词单元均是“长袖”、“衬衫”和“纯色”,也就是说对应的排序后的搜索关键词均为“长袖^衬衫^纯色”,则1阶搜索关键词单元组分别为“长袖”、“衬衫”和“纯色”;
当组合2阶搜索关键词单元组时,在排序后的每个搜索关键词中,将每两个搜索关键词单元组成一个2阶搜索关键词单元组,例如针对“长袖纯色衬衫”和“长袖衬衫纯色”划分出的关键词单元均是“长袖”、“衬衫”和“纯色”,也就是说对应的排序后的关键词均为“长袖^衬衫^纯色”,将这三个搜索关键词单元两两组合,得到三个2阶搜索关键词单元组,
当组合3阶搜索关键词单元组时,在排序后的每个搜索关键词中,将每三个搜索关键词单元组成一个3阶搜索关键词单元组,例如针对“长袖纯色时尚衬衫”和“长袖衬衫纯色时尚”划分出的搜索关键词单元均是“长袖”、“衬衫”、“时尚”和“纯色”,也就是说对应的排序后的搜索关键词均为“长袖^衬衫^纯色^时尚”,在这四个搜索关键词单元中,可以组合出四个3阶搜索关键词单元组。
当组合3阶以上的搜索关键词单元组时,组合的方式和上述方式一致,这里不再赘述。
本申请实施例一还提出,在组合出各阶搜索关键词单元组后,还可以进一步对每个搜索关键词单元组中的各搜索关键词单元按照拼音或笔画顺序进行排序,得到排序后的搜索关键词单元组,例如将排序后的搜索关键词“长袖^衬衫^纯色”中的各搜索关键词组合为三个2阶搜索关键词单元组,进行排序后的搜索关键词单元组分别为“长袖^衬衫”、“长袖^纯色”和“衬衫^纯色”,排序的目的是减少最后形成的搜索关键词表的规模以及建立搜索关键词表的处理步骤。例如,2阶搜索关键词单元组“长袖^衬衫”和“衬衫^长袖”进行排序后的2阶搜索关键词单元组均为“长袖^衬衫”,后续只要针对排序后的搜索关键词单元组“长袖^衬衫”进行处理即可。当然,针对组合出的每个搜索关键词单元组中的各搜索关键词单元不进行排序处理的技术方案也在本申请的保护范围内。
步骤34,根据获得的各搜索关键词对应的类目信息,分别确定组合出的各搜索关键词单元组对应的类目信息;
当确定搜索关键词单元组对应的类目信息时,可以将该搜索关键词单元组中的各搜索关键词单元所属的搜索关键词对应的类目信息,确定为该搜索关键词单元组对应的类目信息。例如2阶搜索关键词单元组“长袖^衬衫”所属的搜索关键词为“长袖纯色衬衫”、“长袖衬衫纯色”和“女士长袖衬衫”,其中“长袖纯色衬衫”和“长袖衬衫纯色”对应的类目信息均为“时尚男装”和“时尚女装”,“女士长袖衬衫”对应的类目信息为“时尚女装”,如下表所示:
Figure BDA0000030553440000081
因此2阶搜索关键词单元组“长袖^衬衫”对应的类目信息为“时尚男装”和“时尚女装”。
步骤35,根据确定出的类目信息,建立各阶搜索关键词表,每阶搜索关键词表中包含各该阶搜索关键词单元组与类目信息的对应关系;
若预先设置的规定数目为N,则建立1阶至N阶搜索关键词表。
步骤36,分别确定划分出的各搜索关键词单元的重要度;
本申请实施例一提出,预先确定每个搜索关键词单元的重要度,建立重要度表,后续将获得的当前关键词划分为各当前关键词单元后,直接在建立的重要度表中确定各当前关键词单元的重要度,其中每个搜索关键词单元的重要度可以但不限于通过下述过程确定:
步骤A,根据获得的各搜索关键词对应的类目信息,分别确定划分出的各搜索关键词单元对应的类目信息。其中,每个搜索关键词单元所属的各搜索关键词分别对应的类目信息即为该搜索关键词单元对应的类目信息。例如,假设搜索关键词单元“纯色”所属的搜索关键词有两个,分别为“纯色帽子”和“纯色长袖衬衫”,而搜索关键词“纯色帽子”对应的类目信息为“时尚女装”和“帽子”,搜索关键词“纯色长袖衬衫”对应的类目信息为“时尚女装”和“时尚男装”,则搜索关键词单元“纯色”的类目信息为“时尚女装”、“帽子”和“时尚男装”,如下表所示:
Figure BDA0000030553440000091
步骤B、根据各点击日志中的访客标识,分别确定各搜索关键词单元在对应的类目信息中的独立访客(UV,Unique Visitor)的数量。其中,UV的数量指的是页面展现按照访客标识去重后的次数。每个搜索关键词单元所属的各搜索关键词在各类目信息下的UV的数量的和,即为该搜索关键词单元在该类目信息下的UV的数量。例如,假设“纯色帽子”在“时尚女装”这一类目信息中的UV数量为205个,在“帽子”这一类目信息中的UV的数量为300个,“纯色长袖衬衫”在“时尚女装”这一类目信息中的UV数量为459个,在“时尚男装”这一类目信息中的UV的数量为902个,则搜索关键词单元“纯色”在“时尚女装”这一类目信息中的UV的数量为205+459=664个,在“帽子”这一类目信息中的UV的数量为300个,在“时尚男装”这一类目信息中的UV的数量为902个。如下表所示:
Figure BDA0000030553440000092
本申请实施例一中,还可以按照预设规则,将针对每个搜索关键词划分出的各个搜索关键词单元进行排序,得到各个排序后的搜索关键词对应的类目信息以及在对应的类目信息中的UV的数量,然后再确定各个搜索关键词单元在各类目信息中的UV的数量。
步骤C,根据确定出的UV的数量,确定每个搜索关键词单元在各类目信息中的类目信息熵;
可以但不限于通过如下方式确定各搜索关键词单元在各类目信息中的类目信息熵:
Figure BDA0000030553440000102
其中,Hi为搜索关键词单元i的类目信息熵;K为存在搜索关键词单元i的UV的类目信息的数量;Pij为搜索关键词单元i在第j个类目信息中的UV数量;Pi为搜索关键词单元i在所有类目信息中的UV数量,也就是在各个类目信息中的UV数量的和。
步骤D,根据确定出的类目信息熵,确定每个搜索关键词单元的重要度;
本申请实施例一中,重要度可以但不限于通过类目信息熵的倒数确定,即搜索关键词单元i的类目信息熵为Hi,重要度为Zi,则此时
Figure BDA0000030553440000103
当然重要度和类目信息熵之间的关系不局限于倒数关系,只要满足类目信息熵值与重要度呈负相关即可。
步骤37,根据确定出的重要度,建立包含各搜索关键词单元与重要度的对应关系的重要度表;
在确定出各搜索关键词单元的重要度后,可以将各搜索关键词单元与确定出的重要度存储在重要度表中。
本申请实施例一中,除了根据类目信息熵来确定搜索关键词单元的重要度外,还可以采用词频-逆向文件频率(TF-IDF,Term Frequency-Inverse DocumentFrequency)的方法确定搜索关键词单元的重要度,具体为:
首先,计算搜索关键词单元的词频。即根据获得的点击日志,确定出每个类目信息所对应的搜索关键词;将每个搜索关键词划分为各搜索关键词单元;确定每个搜索关键词单元在所有搜索关键词单元中的词频;
其次,计算每个搜索关键词单元的文件频率;
再次,计算搜索关键词单元的TF-IDF权重值,针对每个搜索关键词单元,将计算出的词频除以文件频率,得到该搜索关键词单元的TF-IDF权重值;
最后,针对每个搜索关键词单元,根据计算出的TF-IDF权重值,确定该搜索关键词单元的重要度,其中TF-IDF权重值与重要度呈正相关,即TF-IDF权重值越大,则重要度越大,TF-IDF权重值越小,则重要度越小。
步骤38,获得输入的当前关键词后,将获得的当前关键词划分为各当前关键词单元;
用户在需要搜索商品信息时,通过网页浏览器输入搜索的当前关键词,对该当前关键词进行归一化处理,完成归一化处理后,首先在存储各关键词和类目信息的对应关系的查询词表中,查找获得的当前关键词对应的类目信息,若能够查找到,则确认该当前关键词不为长尾关键词,此时直接将查找到的类目信息提供给该用户,若没有查找到,则确认该当前关键词为长尾关键词。
在确认获得的当前关键词为长尾关键词后,将该当前关键词划分为多个当前关键词单元。其中划分的方式可以但不限于基于统计的分词算法。
步骤39,在建立的重要度表中,确定划分出的各当前关键词单元的重要度;
步骤310,在划分出的各关键词单元中,选择出满足预设条件的重要度对应的关键词单元;
该预设条件可以为重要度不小于规定阈值的当前关键词单元,也就是说选择出重要度不小于规定阈值的各当前关键词单元;该预设条件还可以为按照重要度由高到低的顺序进行排序后的前规定数目个当前关键词单元;也就是说选择重要度最高的前规定数目个当前关键词单元,例如选择重要度最高的前3个当前关键词单元。
步骤311,在建立的各阶搜索关键词表中,确定选择出的当前关键词单元所对应的类目信息;
可以但不限于按照下述方式确定选择出的当前关键词单元所对应的类目信息:
若选择出的当前关键词单元的数量为S,当S不大于N时,则按照预设规则,将选择出的S个当前关键词单元进行排序后组成S阶当前关键词单元组,在S阶搜索关键词表中,查找该S阶当前关键词单元组对应的类目信息,若未查找到,则在S个关键词单元中,选择出(S-1)个当前关键词单元,并将(S-1)置为S,重复执行上述逐个减少当前关键词单元的步骤,直至查找到对应的类目信息;
当S大于N时,则首先需要在S个当前关键词单元中选择重要度最大的N个当前关键词单元,然后将选择出的N个当前关键词单元进行排序后组成N阶当前关键词单元组,在N阶搜索关键词表中,查找该N阶当前关键词单元组对应的类目信息,若未查找到,则在N个关键词单元中,选择出(N-1)个当前关键词单元,并将(N-1)置为N,重复执行上述步骤,直至查找到对应的类目信息。
若选择的当前关键词单元的数量为3,即S=3,且N=3,则首先按照拼音或笔画顺序将选择出的3个当前关键词单元进行排序,组成3阶当前关键词单元组,然后在3阶搜索关键词表中查找该3阶当前关键词单元组对应的类目信息,若查找到,则返回给网页浏览器,由网页浏览器提供给用户;若未查找到,则在3个当前关键词单元中选择出重要度最高的两个当前关键词单元,将选择出的两个当前关键词单元按照拼音或笔画顺序排序后组成2阶当前关键词单元组,然后在2阶搜索关键词表中查找该2阶当前关键词单元组对应的类目信息,若查找到,则返回给网页浏览器,由网页浏览器提供给用户;若未查找到,则在这两个当前关键词单元中选择出重要度最高的一个当前关键词单元,该选择出的当前关键词单元可以看作一个1阶当前关键词单元组,然后在1阶搜索关键词表中查找该1阶当前关键词单元组对应的类目信息,将查找到的类目信息返回给网页浏览器,由网页浏览器提供给用户,由于1阶搜索关键词表涵盖了所有出现过的关键词单元,因此在1阶搜索关键词表中总能查找到对应的类目信息。
步骤312,返回确定出的类目信息。
本申请实施例一中,针对非长尾关键词和类目信息的对应关系的查询词表,也可以预先将该查询词表中的各非长尾关键词先进行分词,划分为各关键词单元,然后将针对每个非长尾关键词划分出的各关键词单元按照拼音或笔画顺序进行排序,得到排序后的非长尾关键词,然后将排序后的非长尾关键词和类目信息的对应关系存储在查询词表中,后续在获得输入的当前关键词后,可以先将获得的当前关键词划分为各当前关键词单元,然后按照拼音或笔画顺序进行排序,得到排序后的当前关键词,在查询词表中查询该排序后的当前关键词对应的类目信息,若查找不到,则确认获得的当前关键词为长尾关键词,然后再选择重要度满足预设条件的当前关键词单元,确定对应的类目信息并提供给用户。当然,在获得用户输入的当前关键词后,可以直接按照本申请实施例一提出的方法提供类目信息,而不需要在查询词表中进行查询,也就是说,可以不执行确定接收到的是否为长尾关键词还是非长尾关键词的步骤。
由上述处理过程可知,本申请实施例技术方案中,将规定时间段内输入的每个搜索关键词划分为各搜索关键词单元,分别将针对每个搜索关键词划分出的各搜索关键词单元,组合为各阶搜索关键词单元组,确定组合出的各搜索关键词单元组对应的类目信息,根据确定出的类目信息,建立各阶搜索关键词表,根据输入的当前关键词,在建立的各阶搜索关键词表中,确定选择出的当前关键词单元所对应的类目信息,并返回确定出的类目信息,由上可见,本申请实施例技术方案预先建立了包含各阶搜索关键词表,后续可以直接根据建立的搜索关键词表查询当前关键词对应的类目信息,解决了现有技术无法为用户提供长尾关键词的类目信息的问题,有效地提高了为用户提供类目信息的全面性和灵活性。
下面给出更为具体的实施方式。
实施例二
如图4所示,为本申请实施例二中,返回类目信息的具体实现方法流程图,其具体处理过程如下:
步骤41,获得用户输入的当前关键词;
步骤42,对获得的当前关键词进行归一化处理后,划分为各个当前关键词单元;
步骤43,按照拼音或笔画顺序,将划分出的各当前关键词单元进行排序,得到排序后的当前关键词;
步骤44,在存储的查询词表中查找排序后的当前关键词对应的类目信息,若查找不到,则转至45,若查找到,则转至步骤415;
步骤45,在重要度表中查找划分出的各当前关键词单元的重要度;
步骤46,按照重要度由高到低的顺序将各个当前关键词单元进行排序,选择前3个当前关键词单元;
步骤47,将选择的3个当前关键词单元按照拼音或笔画顺序进行排序后组成3阶当前关键词单元组;
步骤48,在3阶搜索关键词表中,查找该3阶当前关键词单元组对应的类目信息,若查找不到,则转至步骤49,若查找到,则转至步骤415;
步骤49,按照重要度由高到低的顺序将3个当前关键词单元进行排序,选择前两个当前关键词单元;
步骤410,将选择的两个当前关键词单元按照拼音或笔画顺序进行排序后组成2阶当前关键词单元组;
步骤411,在2阶搜索关键词表中,查找该2阶当前关键词单元组对应的类目信息,若查找不到,则转至步骤412,若查找到,则转至步骤415;
步骤412,按照重要度由高到低的顺序将这两个当前关键词单元进行排序,选择第一个当前关键词单元;
步骤413,选择出的当前关键词单元组成一个1阶当前关键词单元组;
步骤414,在1阶搜索关键词表中,查找该1阶当前关键词单元组对应的类目信息;
步骤415,将查找到的类目信息返回给用户。
实施例三
相应的,本申请实施例三提供一种类目信息提供装置,其结构如图5所示,包括搜索关键词获得单元51、搜索关键词划分单元52、搜索关键词单元组合单元53、第一类目信息确定单元54、搜索关键词表建立单元55、第二类目信息确定单元56和第一类目信息返回单元57,其中:
搜索关键词获得单元51,用于获得规定时间段内输入的各搜索关键词和各搜索关键词对应的类目信息;
搜索关键词划分单元52,用于将搜索关键词获得单元51获得的每个搜索关键词,划分为各搜索关键词单元;
搜索关键词单元组合单元53,用于分别将搜索关键词划分单元52针对每个搜索关键词划分出的各搜索关键词单元,组合为各阶搜索关键词单元组;
第一类目信息确定单元54,用于根据搜索关键词获得单元51获得的各搜索关键词对应的类目信息,分别确定搜索关键词单元组合单元53组合出的各搜索关键词单元组对应的类目信息;
搜索关键词表建立单元55,用于根据第一类目信息确定单元54确定出的类目信息,建立各阶搜索关键词表,每阶搜索关键词表中包含各该阶搜索关键词单元组与类目信息的对应关系;
第二类目信息确定单元56,用于根据输入的当前关键词,在搜索关键词表建立单元55建立的各阶搜索关键词表中,确定选择出的当前关键词单元所对应的类目信息;
第一类目信息返回单元57,用于返回第二类目信息确定单元56确定出的类目信息。
较佳地,所述类目信息提供装置还包括重要度确定单元和重要度表建立单元,其中:
重要度确定单元,用于在搜索关键词表建立单元55建立各阶搜索关键词表后,分别确定划分出的各搜索关键词单元的重要度;
重要度表建立单元,用于根据重要度确定单元确定出的重要度,建立包含各搜索关键词单元与重要度的对应关系的重要度表;
第二类目信息确定单元56具体包括当前关键词获得子单元、当前关键词划分子单元、第一重要度确定子单元、当前关键词单元选择子单元和第一类目信息确定子单元,其中:
当前关键词获得子单元,用于获得输入的当前关键词;
当前关键词划分子单元,用于将当前关键词获得子单元获得的当前关键词划分为各当前关键词单元;
第一重要度确定子单元,用于在重要度表建立单元建立的重要度表中,确定当前关键词划分子单元划分出的各当前关键词单元的重要度;
当前关键词单元选择子单元,用于在当前关键词划分子单元划分出的各当前关键词单元中,选择出满足预设条件的重要度对应的当前关键词单元;
第一类目信息确定子单元,用于在搜索关键词表建立单元55建立的各阶搜索关键词表中,确定当前关键词单元选择子单元选择出的当前关键词单元所对应的类目信息。
更佳地,第一类目信息确定单元54具体包括第二类目信息确定子单元和第三类目信息确定子单元,其中:
第二类目信息确定子单元,用于针对搜索关键词单元组合单元53组合出的每个搜索关键词单元组的各搜索关键词单元,根据搜索关键词获得单元51获得的各搜索关键词对应的类目信息,确定包含该搜索关键词单元的搜索关键词对应的类目信息;
第三类目信息确定子单元,用于将第二类目信息确定子单元确定出的、各搜索关键词对应的类目信息,确定为该搜索关键词单元组对应的类目信息。
较佳地,重要度确定单元具体包括独立访客数量确定子单元、类目信息熵确定子单元和第二重要度确定子单元,其中:
独立访客数量确定子单元,用于确定每个搜索关键词单元在各类目信息中的UV的数量;
类目信息熵确定子单元,用于根据独立访客数量确定子单元确定出的UV的数量,确定每个搜索关键词单元在各类目信息中的类目信息熵;
第二重要度确定子单元,用于根据类目信息熵确定子单元确定出的类目信息熵,确定每个搜索关键词单元的重要度。
较佳地,所述类目信息提供装置还包括搜索关键词单元排序单元、类目信息查找单元和第二类目信息返回单元,其中:
搜索关键词单元排序单元,用于在搜索关键词表建立单元55建立的各阶搜索关键词表中,确定选择出的当前关键词单元所对应的类目信息之前,按照预设规则,将针对每个搜索关键词划分出的各搜索关键词单元进行排序,得到排序后的搜索关键词单元;
类目信息查找单元,用于针对搜索关键词单元排序单元得到的每个排序后的搜索关键词单元,在存储有非长尾关键词和类目信息对应关系的查询词表中,查找该排序后的搜索关键词单元对应的类目信息;
第二类目信息返回单元,用于在类目信息查找单元查找到时,返回查找到的类目信息;
第二类目信息确定单元56在类目信息查找单元未查找到时,执行在建立的各阶搜索关键词表中确定选择出的当前关键词单元所对应的类目信息的步骤。
本申请实施例三中,还可以将类目信息提供装置分为两个大的装置,分别为线下分析装置61和线上确定装置62,如图6所示,网页浏览器获得用户输入的搜索关键词后,形成点击日志后发送给日志服务器,线下分析装置61定时从日志服务器获得点击日志,然后建立各阶搜索关键词表和重要度表,然后将建立的各阶搜索关键词表和重要度表发送给线上确定装置62,网页浏览器获得用户输入的当前关键词后,发送给线上确定装置62,线上确定装置62根据各阶搜索关键词表和重要度表确定该当前关键词对应的类目信息,然后发送给网页浏览器,以返回给用户。
其中线下分析装置61包含搜索关键词获得单元51、搜索关键词划分单元52、搜索关键词单元组合单元53、第一类目信息确定单元54和搜索关键词表建立单元55,线上确定装置62包含第二类目信息确定单元56和第一类目信息返回单元57。
此外,线下分析装置61还进一步包括重要度确定单元和重要度表建立单元,线上确定装置62还进一步包括搜索关键词单元排序单元、类目信息查找单元和第二类目信息返回单元。
本领域的技术人员应明白,本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (14)

1.一种类目信息提供方法,其特征在于,包括:
获得规定时间段内输入的各搜索关键词和各搜索关键词对应的类目信息;
将获得的每个搜索关键词,划分为各搜索关键词单元;
分别将针对每个搜索关键词划分出的各搜索关键词单元,组合为各阶搜索关键词单元组;
根据获得的各搜索关键词对应的类目信息,分别确定组合出的各搜索关键词单元组对应的类目信息;
根据确定出的类目信息,建立各阶搜索关键词表,每阶搜索关键词表中包含各该阶搜索关键词单元组与类目信息的对应关系;
根据输入的当前关键词,在建立的各阶搜索关键词表中,确定选择出的当前关键词单元所对应的类目信息,并返回确定出的类目信息。
2.根据权利要求1所述的类目信息提供方法,其特征在于,在建立各阶搜索关键词表后还包括:
分别确定划分出的各搜索关键词单元的重要度;
根据确定出的重要度,建立包含各搜索关键词单元与重要度的对应关系的重要度表;
所述根据输入的当前关键词,在建立的各阶搜索关键词表中,确定选择出的当前关键词单元所对应的类目信息,并返回确定出的类目信息,包括:
获得输入的当前关键词后,将获得的当前关键词划分为各当前关键词单元;
在建立的重要度表中,确定划分出的各当前关键词单元的重要度;
在划分出的各当前关键词单元中,选择出满足预设条件的重要度对应的当前关键词单元;
在建立的各阶搜索关键词表中,确定选择出的当前关键词单元所对应的类目信息;
返回确定出的类目信息。
3.如权利要求1或2所述的类目信息提供方法,其特征在于,根据获得的各搜索关键词对应的类目信息,分别确定组合出的各搜索关键词单元组对应的类目信息,具体包括:
针对组合出的每个搜索关键词单元组的各搜索关键词单元,根据获得的各搜索关键词对应的类目信息,确定包含该搜索关键词单元的搜索关键词对应的类目信息;
将确定出的、各搜索关键词对应的类目信息,确定为该搜索关键词单元组对应的类目信息。
4.如权利要求2所述的类目信息提供方法,其特征在于,确定划分出的各搜索关键词单元的重要度,具体包括:
确定每个搜索关键词单元在各类目信息中的独立访客UV的数量;
根据确定出的UV的数量,确定每个搜索关键词单元在各类目信息中的类目信息熵;
根据确定出的类目信息熵,确定每个搜索关键词单元的重要度。
5.如权利要求4所述的类目信息提供方法,其特征在于,通过如下方式确定每个搜索关键词单元在各类目信息中的类目信息熵:
H i = Σ j = 1 K ( - P ij P i log 2 P ij P i )
其中,Hi为搜索关键词单元i的类目信息熵;
K为存在搜索关键词单元i的UV的类目信息的数量;
Pij为搜索关键词单元i在第j个类目信息中的UV数量;
Pi为搜索关键词单元i在所有类目信息中的UV数量。
6.如权利要求4所述的类目信息提供方法,其特征在于,确定每个搜索关键词单元在各类目信息中的UV的数量,具体包括:
获得规定时间段内输入的搜索关键词对应的访客标识;
根据获得的各搜索关键词对应的类目信息,分别确定划分出的各搜索关键词单元对应的类目信息;
根据获得的访客标识,分别确定各搜索关键词单元在对应的类目信息中的UV的数量。
7.如权利要求2所述的类目信息提供方法,其特征在于,若选择出的当前关键词单元的数量为S,S≥1,建立的搜索关键词表为1阶至N阶搜索关键词表,N≥1:
当S≤N时,在建立的各阶搜索关键词表中确定选择出的当前关键词单元所对应的类目信息,具体包括:
步骤A1,按照预设规则,将选择出的S个当前关键词单元进行排序后组成S阶当前关键词单元组;
步骤A2,在各S阶搜索关键词表中,查找该S阶当前关键词单元组对应的类目信息;
步骤A3,若未查找到,则在S个当前关键词单元中,选择出(S-1)个当前关键词单元,并将(S-1)置为S;
重复执行步骤A1至步骤A3,直至查找到对应的类目信息;
当S>N时,在建立的各阶搜索关键词表中确定选择出的当前关键词单元所对应的类目信息,具体包括:
步骤B1,在选择出的S个当前关键词单元中,选择重要度最大的N个当前关键词单元;
步骤B2,按照预设规则,将选择出的N个当前关键词单元进行排序后组成N阶当前关键词单元组;
步骤B3,在各N阶搜索关键词表中,查找该N阶当前关键词单元组对应的类目信息;
步骤B4,若未查找到,则在选择的N个当前关键词单元中,选择出(N-1)个当前关键词单元,并将(N-1)置为N;
重复执行步骤B2至步骤B4,直至查找到对应的类目信息。
8.如权利要求1所述的类目信息提供方法,其特征在于,在建立的各阶搜索关键词表中,确定选择出的当前关键词单元所对应的类目信息之前,还包括:
按照预设规则,将针对每个搜索关键词划分出的各搜索关键词单元进行排序,得到排序后的搜索关键词单元;
针对得到的每个排序后的搜索关键词单元,在存储有非长尾关键词和类目信息对应关系的查询词表中,查找该排序后的搜索关键词单元对应的类目信息;
若查找到,则返回查找到的类目信息;
若未查找到,则执行在建立的各阶搜索关键词表中确定选择出的当前关键词单元所对应的类目信息的步骤。
9.如权利要求2所述的类目信息提供方法,其特征在于,所述预设条件为:
重要度不小于规定阈值的当前关键词单元;或
按照重要度由高到低的顺序进行排序后的前规定数目个当前关键词单元。
10.一种类目信息提供装置,其特征在于,包括:
搜索关键词获得单元,用于获得规定时间段内输入的各搜索关键词和各搜索关键词对应的类目信息;
搜索关键词划分单元,用于将搜索关键词获得单元获得的每个搜索关键词,划分为各搜索关键词单元;
搜索关键词单元组合单元,用于分别将搜索关键词划分单元针对每个搜索关键词划分出的各搜索关键词单元,组合为各阶搜索关键词单元组;
第一类目信息确定单元,用于根据搜索关键词获得单元获得的各搜索关键词对应的类目信息,分别确定搜索关键词单元组合单元组合出的各搜索关键词单元组对应的类目信息;
搜索关键词表建立单元,用于根据第一类目信息确定单元确定出的类目信息,建立各阶搜索关键词表,每阶搜索关键词表中包含各该阶搜索关键词单元组与类目信息的对应关系;
第二类目信息确定单元,用于根据输入的当前关键词,在搜索关键词表建立单元建立的各阶搜索关键词表中,确定选择出的当前关键词单元所对应的类目信息;
第一类目信息返回单元,用于返回第二类目信息确定单元确定出的类目信息。
11.如权利要求10所述的类目信息提供装置,其特征在于,还包括:
重要度确定单元,用于在搜索关键词表建立单元建立各阶搜索关键词表后,分别确定划分出的各搜索关键词单元的重要度;
重要度表建立单元,用于根据重要度确定单元确定出的重要度,建立包含各搜索关键词单元与重要度的对应关系的重要度表;
第二类目信息确定单元具体包括:
当前关键词获得子单元,用于获得输入的当前关键词;
当前关键词划分子单元,用于将当前关键词获得子单元获得的当前关键词划分为各当前关键词单元;
第一重要度确定子单元,用于在重要度表建立单元建立的重要度表中,确定当前关键词划分子单元划分出的各当前关键词单元的重要度;
当前关键词单元选择子单元,用于在当前关键词划分子单元划分出的各当前关键词单元中,选择出满足预设条件的重要度对应的当前关键词单元;
第一类目信息确定子单元,用于在搜索关键词表建立单元建立的各阶搜索关键词表中,确定当前关键词单元选择子单元选择出的当前关键词单元所对应的类目信息。
12.如权利要求10或11所述的类目信息提供装置,其特征在于,第一类目信息确定单元具体包括:
第二类目信息确定子单元,用于针对搜索关键词单元组合单元组合出的每个搜索关键词单元组的各搜索关键词单元,根据搜索关键词获得单元获得的各搜索关键词对应的类目信息,确定包含该搜索关键词单元的搜索关键词对应的类目信息;
第三类目信息确定子单元,用于将第二类目信息确定子单元确定出的、各搜索关键词对应的类目信息,确定为该搜索关键词单元组对应的类目信息。
13.如权利要求11所述的类目信息提供装置,其特征在于,重要度确定单元具体包括:
独立访客数量确定子单元,用于确定每个搜索关键词单元在各类目信息中的独立访客UV的数量;
类目信息熵确定子单元,用于根据独立访客数量确定子单元确定出的UV的数量,确定每个搜索关键词单元在各类目信息中的类目信息熵;
第二重要度确定子单元,用于根据类目信息熵确定子单元确定出的类目信息熵,确定每个搜索关键词单元的重要度。
14.如权利要求10所述的类目信息提供装置,其特征在于,还包括:
搜索关键词单元排序单元,用于在搜索关键词表建立单元建立的各阶搜索关键词表中,确定选择出的当前关键词单元所对应的类目信息之前,按照预设规则,将针对每个搜索关键词划分出的各搜索关键词单元进行排序,得到排序后的搜索关键词单元;
类目信息查找单元,用于针对搜索关键词单元排序单元得到的每个排序后的搜索关键词单元,在存储有非长尾关键词和类目信息对应关系的查询词表中,查找该排序后的搜索关键词单元对应的类目信息;
第二类目信息返回单元,用于在类目信息查找单元查找到时,返回查找到的类目信息;
第二类目信息确定单元在类目信息查找单元未查找到时,执行在建立的各阶搜索关键词表中确定选择出的当前关键词单元所对应的类目信息的步骤。
CN201010530231.5A 2010-11-02 2010-11-02 类目信息提供方法及装置 Active CN102456058B (zh)

Priority Applications (8)

Application Number Priority Date Filing Date Title
CN201010530231.5A CN102456058B (zh) 2010-11-02 2010-11-02 类目信息提供方法及装置
TW100104746A TWI508011B (zh) 2010-11-02 2011-02-14 Category information providing method and device
US13/317,789 US8583685B2 (en) 2010-11-02 2011-10-27 Determination of category information using multiple stages
EP11838348.8A EP2635960A4 (en) 2010-11-02 2011-10-28 DETERMINATION OF CATEGORY INFORMATION IN SEVERAL STAGES
PCT/US2011/001831 WO2012060866A1 (en) 2010-11-02 2011-10-28 Determination of category information using multiple stages
JP2013537652A JP5449628B2 (ja) 2010-11-02 2011-10-28 マルチステージを使用したカテゴリ情報の決定
HK12107082.0A HK1166527A1 (zh) 2010-11-02 2012-07-19 類目信息提供方法及裝置
US14/037,247 US9087108B2 (en) 2010-11-02 2013-09-25 Determination of category information using multiple stages

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010530231.5A CN102456058B (zh) 2010-11-02 2010-11-02 类目信息提供方法及装置

Publications (2)

Publication Number Publication Date
CN102456058A true CN102456058A (zh) 2012-05-16
CN102456058B CN102456058B (zh) 2014-03-19

Family

ID=45997813

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010530231.5A Active CN102456058B (zh) 2010-11-02 2010-11-02 类目信息提供方法及装置

Country Status (7)

Country Link
US (2) US8583685B2 (zh)
EP (1) EP2635960A4 (zh)
JP (1) JP5449628B2 (zh)
CN (1) CN102456058B (zh)
HK (1) HK1166527A1 (zh)
TW (1) TWI508011B (zh)
WO (1) WO2012060866A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102841946A (zh) * 2012-08-24 2012-12-26 北京国政通科技有限公司 商品数据检索排序及商品推荐方法和系统
CN103902545A (zh) * 2012-12-25 2014-07-02 北京京东尚科信息技术有限公司 一种类目路径识别方法及系统
WO2015007147A1 (en) * 2013-07-18 2015-01-22 Tencent Technology (Shenzhen) Company Limited Method and system for subscribing long tail information
WO2016062197A1 (zh) * 2014-10-20 2016-04-28 阿里巴巴集团控股有限公司 一种类目目录确定方法及装置、自动分类方法及装置
CN106815228A (zh) * 2015-11-27 2017-06-09 北京国双科技有限公司 搜索关键词的类名选取方法和装置
CN106874492A (zh) * 2017-02-23 2017-06-20 北京京东尚科信息技术有限公司 搜索方法和装置
CN110413645A (zh) * 2019-06-19 2019-11-05 平安普惠企业管理有限公司 数据搜索方法、装置、终端及计算机可读存储介质
CN111127060A (zh) * 2018-10-31 2020-05-08 百度在线网络技术(北京)有限公司 确定业务的推广用户的方法和装置
CN112650914A (zh) * 2020-12-30 2021-04-13 深圳市世强元件网络有限公司 一种长尾关键词识别方法、关键词搜索方法及计算机设备

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9201969B2 (en) * 2013-01-31 2015-12-01 Lexisnexis, A Division Of Reed Elsevier Inc. Systems and methods for identifying documents based on citation history
US9609050B2 (en) 2013-01-31 2017-03-28 Facebook, Inc. Multi-level data staging for low latency data access
CN103336806B (zh) * 2013-06-24 2016-08-10 北京工业大学 一种基于词出现间距的内在与外在模式熵差的关键词排序方法
CN103825952B (zh) * 2014-03-04 2017-07-04 百度在线网络技术(北京)有限公司 细胞词库推送方法和服务器
CN104268233B (zh) * 2014-09-26 2018-07-13 北京国双科技有限公司 组合关键词的生成方法及装置
CN105262812A (zh) * 2015-10-16 2016-01-20 浪潮(北京)电子信息产业有限公司 一种基于云计算平台的日志数据处理方法、装置及系统
CN105808641A (zh) * 2016-02-24 2016-07-27 百度在线网络技术(北京)有限公司 线下资源的挖掘方法和装置
CN105893592B (zh) * 2016-04-12 2019-06-21 Oppo广东移动通信有限公司 一种搜索方法和装置
WO2018070026A1 (ja) * 2016-10-13 2018-04-19 楽天株式会社 商品情報表示システム、商品情報表示方法、及びプログラム
US10466963B2 (en) 2017-05-18 2019-11-05 Aiqudo, Inc. Connecting multiple mobile devices to a smart home assistant account
US10963495B2 (en) * 2017-12-29 2021-03-30 Aiqudo, Inc. Automated discourse phrase discovery for generating an improved language model of a digital assistant
US10963499B2 (en) 2017-12-29 2021-03-30 Aiqudo, Inc. Generating command-specific language model discourses for digital assistant interpretation
US10929613B2 (en) 2017-12-29 2021-02-23 Aiqudo, Inc. Automated document cluster merging for topic-based digital assistant interpretation

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1512402A (zh) * 2002-12-31 2004-07-14 程松林 一种语音检索方法及采用该方法的音像信息检索系统
US20050222987A1 (en) * 2004-04-02 2005-10-06 Vadon Eric R Automated detection of associations between search criteria and item categories based on collective analysis of user activity data
US20090125505A1 (en) * 2007-11-13 2009-05-14 Kosmix Corporation Information retrieval using category as a consideration
CN101593200A (zh) * 2009-06-19 2009-12-02 淮海工学院 基于关键词频度分析的中文网页分类方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3648051B2 (ja) 1998-02-02 2005-05-18 富士通株式会社 関連情報検索装置及びプログラム記録媒体
JP2000222431A (ja) * 1999-02-03 2000-08-11 Mitsubishi Electric Corp 文書分類装置
US6826568B2 (en) 2001-12-20 2004-11-30 Microsoft Corporation Methods and system for model matching
US20040260677A1 (en) 2003-06-17 2004-12-23 Radhika Malpani Search query categorization for business listings search
KR100452086B1 (ko) 2003-12-22 2004-10-13 엔에이치엔(주) 카테고리 별 키워드의 입력 순위를 제공하기 위한 검색서비스 시스템 및 그 방법
KR100520428B1 (ko) 2005-01-13 2005-10-11 엔에이치엔(주) 사용자 인증에 따라 다양한 종류의 키워드를 연동하여관리하는 방법 및 그 시스템
US7792858B2 (en) * 2005-12-21 2010-09-07 Ebay Inc. Computer-implemented method and system for combining keywords into logical clusters that share similar behavior with respect to a considered dimension
KR100785352B1 (ko) 2006-04-21 2007-12-18 엔에이치엔(주) 검색결과리스트 생성 방법 및 검색결과리스트 생성 시스템
US7996393B1 (en) * 2006-09-29 2011-08-09 Google Inc. Keywords associated with document categories
WO2008056578A1 (fr) 2006-11-08 2008-05-15 Cirius Technologies, Inc. Procédé de fourniture d'informations de publicité, système de fourniture d'informations de publicité et programme de fourniture d'informations de publicité
US8131722B2 (en) * 2006-11-20 2012-03-06 Ebay Inc. Search clustering
US8620910B2 (en) 2008-02-27 2013-12-31 Nec Corporation Search system, search method, and program
US8244752B2 (en) * 2008-04-21 2012-08-14 Microsoft Corporation Classifying search query traffic
US9361365B2 (en) * 2008-05-01 2016-06-07 Primal Fusion Inc. Methods and apparatus for searching of content using semantic synthesis
JP4922240B2 (ja) * 2008-06-04 2012-04-25 ヤフー株式会社 Web検索において選択的に擬似フィードバック処理を適用する検索処理装置、方法及びプログラム
US20100257171A1 (en) 2009-04-03 2010-10-07 Yahoo! Inc. Techniques for categorizing search queries
US20100306198A1 (en) 2009-06-02 2010-12-02 Cbs Interactive, Inc. System and method for determining categories associated with searches of electronic catalogs and displaying category information with search results

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1512402A (zh) * 2002-12-31 2004-07-14 程松林 一种语音检索方法及采用该方法的音像信息检索系统
US20050222987A1 (en) * 2004-04-02 2005-10-06 Vadon Eric R Automated detection of associations between search criteria and item categories based on collective analysis of user activity data
US20090125505A1 (en) * 2007-11-13 2009-05-14 Kosmix Corporation Information retrieval using category as a consideration
CN101593200A (zh) * 2009-06-19 2009-12-02 淮海工学院 基于关键词频度分析的中文网页分类方法

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102841946B (zh) * 2012-08-24 2016-05-25 北京国政通科技有限公司 商品数据检索排序及商品推荐方法和系统
CN102841946A (zh) * 2012-08-24 2012-12-26 北京国政通科技有限公司 商品数据检索排序及商品推荐方法和系统
CN103902545B (zh) * 2012-12-25 2018-10-16 北京京东尚科信息技术有限公司 一种类目路径识别方法及系统
CN103902545A (zh) * 2012-12-25 2014-07-02 北京京东尚科信息技术有限公司 一种类目路径识别方法及系统
WO2015007147A1 (en) * 2013-07-18 2015-01-22 Tencent Technology (Shenzhen) Company Limited Method and system for subscribing long tail information
US10212106B2 (en) 2013-07-18 2019-02-19 Tencent Technology (Shenzhen) Company Limited Method and system for subscribing long tail information
CN105589853A (zh) * 2014-10-20 2016-05-18 阿里巴巴集团控股有限公司 一种类目目录确定方法及装置、自动分类方法及装置
WO2016062197A1 (zh) * 2014-10-20 2016-04-28 阿里巴巴集团控股有限公司 一种类目目录确定方法及装置、自动分类方法及装置
KR20170071495A (ko) * 2014-10-20 2017-06-23 알리바바 그룹 홀딩 리미티드 카테고리 디렉토리를 결정하기 위한 방법 및 디바이스와, 자동 분류 방법 및 디바이스
CN105589853B (zh) * 2014-10-20 2017-09-15 阿里巴巴集团控股有限公司 一种类目目录确定方法及装置、自动分类方法及装置
US10803091B2 (en) 2014-10-20 2020-10-13 Alibaba Group Holding Limited Method and device for determining a category directory, and an automatic classification method and device
KR102066330B1 (ko) 2014-10-20 2020-01-14 알리바바 그룹 홀딩 리미티드 카테고리 디렉토리를 결정하기 위한 방법 및 디바이스와, 자동 분류 방법 및 디바이스
CN106815228B (zh) * 2015-11-27 2020-03-03 北京国双科技有限公司 搜索关键词的类名选取方法和装置
CN106815228A (zh) * 2015-11-27 2017-06-09 北京国双科技有限公司 搜索关键词的类名选取方法和装置
CN106874492A (zh) * 2017-02-23 2017-06-20 北京京东尚科信息技术有限公司 搜索方法和装置
CN106874492B (zh) * 2017-02-23 2021-01-26 北京京东尚科信息技术有限公司 搜索方法和装置
CN111127060A (zh) * 2018-10-31 2020-05-08 百度在线网络技术(北京)有限公司 确定业务的推广用户的方法和装置
CN111127060B (zh) * 2018-10-31 2023-08-08 百度在线网络技术(北京)有限公司 确定业务的推广用户的方法和装置
CN110413645A (zh) * 2019-06-19 2019-11-05 平安普惠企业管理有限公司 数据搜索方法、装置、终端及计算机可读存储介质
CN112650914A (zh) * 2020-12-30 2021-04-13 深圳市世强元件网络有限公司 一种长尾关键词识别方法、关键词搜索方法及计算机设备

Also Published As

Publication number Publication date
EP2635960A4 (en) 2014-09-10
US20140074831A1 (en) 2014-03-13
US9087108B2 (en) 2015-07-21
TW201220233A (en) 2012-05-16
WO2012060866A1 (en) 2012-05-10
TWI508011B (zh) 2015-11-11
US8583685B2 (en) 2013-11-12
JP5449628B2 (ja) 2014-03-19
HK1166527A1 (zh) 2012-11-02
JP2013545189A (ja) 2013-12-19
EP2635960A1 (en) 2013-09-11
CN102456058B (zh) 2014-03-19
US20120109946A1 (en) 2012-05-03

Similar Documents

Publication Publication Date Title
CN102456058B (zh) 类目信息提供方法及装置
CN102760138B (zh) 用户网络行为的分类方法和装置及对应的搜索方法和装置
CN103729359B (zh) 一种推荐搜索词的方法及系统
CN103577432B (zh) 一种商品信息搜索方法和系统
CN102426610B (zh) 微博搜索排名方法及微博搜索引擎
CN103870505A (zh) 一种查询词推荐方法和查询词推荐系统
CN106251174A (zh) 信息推荐方法及装置
CN102063432A (zh) 一种检索方法和系统
CN103425687A (zh) 一种基于关键词的检索方法和系统
CN103377190A (zh) 一种基于交易平台的供应商信息搜索方法和装置
CN102760124A (zh) 一种推荐数据的推送方法及系统
CN101853308A (zh) 一种个性化元搜索的方法及其应用终端
CN102053983A (zh) 一种垂直搜索的查询方法、系统和装置
CN103679462A (zh) 一种评论数据处理方法和装置、一种搜索方法和系统
CN105426514A (zh) 个性化的移动应用app推荐方法
CN103186574A (zh) 一种搜索结果的生成方法和装置
CN103838756A (zh) 一种确定推送信息的方法及装置
CN102591880A (zh) 信息提供方法及装置
CN105095311B (zh) 推广信息的处理方法、装置及系统
CN102385585A (zh) 网页数据库的建立方法、网页搜索方法以及相关装置
CN102841904A (zh) 一种搜索方法及设备
CN103150663A (zh) 一种网络投放数据投放的方法和装置
CN104077407A (zh) 一种智能数据搜索系统及方法
CN102890683A (zh) 信息提供方法及装置
CN102521321A (zh) 基于检索词歧义性和用户偏好的视频搜索方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1166527

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1166527

Country of ref document: HK