CN104077366B - 一种在网络设备中用于确定特征信息的方法和装置 - Google Patents

一种在网络设备中用于确定特征信息的方法和装置 Download PDF

Info

Publication number
CN104077366B
CN104077366B CN201410266017.1A CN201410266017A CN104077366B CN 104077366 B CN104077366 B CN 104077366B CN 201410266017 A CN201410266017 A CN 201410266017A CN 104077366 B CN104077366 B CN 104077366B
Authority
CN
China
Prior art keywords
keyword
information
internet
characteristic information
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410266017.1A
Other languages
English (en)
Other versions
CN104077366A (zh
Inventor
侯丽斌
白海
刘丰煦
李雪洁
曹语馨
祝佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201410266017.1A priority Critical patent/CN104077366B/zh
Publication of CN104077366A publication Critical patent/CN104077366A/zh
Application granted granted Critical
Publication of CN104077366B publication Critical patent/CN104077366B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种在网络设备中用于确定特征信息的方法,其中,该方法包括以下步骤:a.根据关键词集合中的关键词所来源自的互联网资源信息,确定一个对象基于互联网的特征信息,其中,所述关键词集合中的每个关键词均包含用于描述所述对象的词汇,且所述关键词集合中的至少部分关键词中的每个与所述特征信息中的至少部分相对应。根据本发明的方案,可以可通过统计互联网上累积的互联网资源信息,来确定关键词集合所对应的对象的特征信息,且可将所述特征信息表现为数值形式,从而将对象的特征进行量化,以便于用户更直观的了解对象的特征,且便于对象的管理者或经营者根据所表现出的数值来进行市场规划或作出经营决策。

Description

一种在网络设备中用于确定特征信息的方法和装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种在网络设备中用于确定特征信息的方法和装置。
背景技术
现有技术中,往往采用诸如人群抽样、问卷调研、定量统计的方式,来量化一个对象(如量化一个品牌)。然而,这种方式不仅会花费大量的时间和人力成本,而且受限于调研人群,其量化结果也会发生较大偏差。
发明内容
本发明的目的是提供一种在网络设备中用于确定特征信息的方法和装置。
根据本发明的一个方面,提供一种在网络设备中用于确定特征信息的方法,其中,该方法包括以下步骤:
a.根据关键词集合中的关键词所来源自的互联网资源信息,确定一个对象基于互联网的特征信息,其中,所述关键词集合中的每个关键词均包含用于描述所述对象的词汇,且所述关键词集合中的至少部分关键词中的每个与所述特征信息中的至少部分相对应。
根据本发明的另一个方面,还提供了一种在网络设备中用于确定特征信息的装置,其中,该装置包括以下装置:
用于根据关键词集合中的关键词所来源自的互联网资源信息,确定一个对象基于互联网的特征信息的装置,其中,所述关键词集合中的每个关键词均包含用于描述所述对象的词汇,且所述关键词集合中的至少部分关键词中的每个与所述特征信息中的至少部分相对应。
与现有技术相比,本发明具有以下优点:1)可通过统计一个对象的关键词集合中的关键词在互联网上累积的互联网资源信息,来量化对象并获得其特征信息;并且,所述特征信息可表现为等级或数值形式,以便于用户更直观的了解对象的特征,从而便于对象的管理者或经营者根据所表现出的数值来进行市场规划或作出经营决策;2)可以根据用户的查询序列向用户提供查询序列中的关键词对应的特征信息,且网络设备可以采用多种形式向用户设备提供所述特征信息,以使用户设备能够对对象的特征信息有更直观的认识,且用户可参考网络设备提供的其他相关的关键词的特征信息来进行比对,以对查询序列中的关键词所对应的对象有更准确的定位。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明的一个实施例的在网络设备中用于确定特征信息的方法的流程示意图;
图2为本发明的另一个实施例的在网络设备中用于确定特征信息的方法的流程示意图;
图3为本发明的一个实施例的在网络设备中用于确定特征信息的装置的结构示意图;
图4为本发明的另一个实施例的在网络设备中用于确定特征信息的装置的结构示意图;
图5为一个示例的网络设备向用户设备提供的、对象基于互联网的特征信息的示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1为本发明一个实施例的在网络设备中用于确定特征信息的方法的流程示意图。
其中,本实施例的方法主要通过网络设备来实现;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机;所述网络设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
需要说明的是,所述网络设备和网络仅为举例,其他现有的或今后可能出现的网络设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
根据本实施例的方法包括步骤S1。
在步骤S1中,网络设备根据关键词集合中的关键词所来源自的互联网资源信息,确定一个对象基于互联网的特征信息。
其中,所述对象包括任何可作为目标的事物。优选地,所述对象为一个品牌,如电子产品品牌“苹果”。且优选地,所述对象可具有多个子对象,关键词集合的至少部分关键词的全部或部分中的每个用于描述所述对象的一个子对象。例如,对象“苹果”可具有以下子对象:苹果4、苹果手机4s、苹果手机5、苹果手机5s,对象“苹果”所对应的关键词集合为{苹果,Apple Inc,iPhone,iPhone4,iPhone4s,iPhone5,iPhone5s},则该关键词集合中的至少部分关键词包括“苹果”、“iPhone4”、“iPhone4s”、“iPhone5”和“iPhone5s”,则关键词iPhone4用于描述子对象“苹果手机4”,关键词iPhone4s用于描述子对象“苹果手机4s”,关键词iPhone5用于描述子对象“苹果手机5”,关键词iPhone5s用于描述子对象“苹果手机5s”。
其中,关键词集合中的每个关键词均包含用于描述所述对象的词汇;例如,对象“苹果”的关键词集合{苹果,Apple Inc,iPhone,iPhone4,iPhone4s,iPhone5,iPhone5s}中的每个关键词均包含用于描述对象“苹果”的词汇。并且,所述关键词集合中的至少部分关键词中的每个与所述特征信息中的至少部分相对应;例如,对象“苹果”的关键词集合为{苹果,Apple Inc,iPhone,iPhone4,iPhone4s,iPhone5,iPhone5s},关键词“苹果”与所有特征信息相对应,关键词iPhone与特征信息中和苹果公司的iPhone手机(包括iPhone4、iPhone4s、iPhone5、iPhone5s等)相关的部分相对应,关键词iPhone4与特征信息中和苹果公司的iPhone4手机相关的部分相对应。需要说明的是,关键词集合中可能存在两个具有相同或相似意义的关键词,且该两个关键词所对应的部分特征信息相同;例如,若关键词集合中可存在iPhone5s与苹果手机5s,且两者对应同一部分特征信息。
具体地,网络设备可直接根据关键词集合中所有关键词所来源自的互联网资源信息,直接确定关键词集合所对应的对象基于互联网的特征信息;或者,网络设备根据关键词集合中的每个关键词所来源自的互联网资源信息,确定关键词集合的至少部分关键词中的每个基于互联网的特征信息,从而确定关键词集合所对应的对象基于互联网的特征信息。需要说明的是,网络设备可仅根据一个关键词所来源自的互联网特征信息,来确定该关键词对应的特征信息;或者,网络设备也可根据关键词集合中所有的关键词所来源自的特征信息,或关键词集合中与该关键词关联的其他关键词以及该关键词自身所来源自的互联网资源信息,来确定该关键词对应的特征信息。
其中,关键词所来源自的互联网资源信息可以为包含所述关键词的互联网资源的任何信息。优选地,所述互联网资源信息包括但不限于:
1)包含关键词的互联网资源的来源信息。如互联网资源的地址信息、发布互联网资源的网站的地址信息和类型、互联网资源在该网站中所属的频道、在网站上发布该互联网资源的用户信息等。
2)包含关键词的互联网资源的数量和权重信息。
其中,所述权重信息用于指示所述互联网资源的重要程度。
优选地,可根据所述互联网资源的来源信息来确定该互联网资源的权重信息;例如,来源自网络新闻、品牌官网等网站类型的互联网资源的权重高于来源自社区中的互联网资源的权重;知名人物所发布的互联网资源的权重高于匿名人物所发布的互联网资源的权重等。
3)用户对包含关键词的互联网资源的访问信息。
其中,所述访问信息包括任何与用户对包含关键词的互联网资源的访问行为相关的信息。优选地,所述访问信息包括但不限于:
-访问包含关键词的互联网资源的用户的数量;
-包含关键词的互联网资源被访问/搜索的次数;
-包含关键词的互联网资源被访问/搜索的频率;
-包含关键词的互联网资源被访问后转发的次数;
-包含关键词的互联网资源在同类别关键词中被搜索的次序。
其中,所述同类别关键词是指与关键词属于同一类别的、用于表征其他对象的关键词。例如,关键词“Apple”属于电子产品类别,其用于表征品牌“苹果”;关键词“Samsung”同样属于电子产品类别,其用于表征品牌“三星”。
4)包含关键词的互联网资源的内容信息。优选地,包含关键词的互联网资源的内容信息可为互联网上包含所述关键词的用户生成内容UGC(User Generated Content)。
所述用户生成内容包括任何用户原创的、通过互联网平台进行展示的内容。优选地,所述用户生成内容包括但不限于社区发帖、视频分享、博客、播客等。
5)用户访问包含所述关键词的互联网资源的途径信息。
所述途径信息用于指示用户访问包含所述关键词的互联网资源所使用的用户设备和/或客户端;优选地,所述用户设备包括但不限于PC、平板电脑、智能手机、穿戴式设备等;所述客户端包括但不限于各种类型的浏览器和网站专用客户端等。
需要说明的是,上述互联网资源信息仅为举例,其他现有的或今后可能出现的互联网资源信息如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
其中,所述基于互联网的特征信息包括任何基于互联网数据获得的、用于表征一个对象的特征的信息。优选地,基于互联网的特征信息中的每一项可表现为数值形式、文字形式、或者数值形式与文字形式的结合。更为优选地,对于一个对象,可根据该对象的多项特征信息,获得用于表征该对象的一个综合数值。优选地,所述基于互联网的特征信息包括但不限于:
1)该对象在互联网上的评价信息。
其中,所述评价信息用于指示用户对所述对象的评价程度。优选地,所述评价信息可表现为等级、排名等形式;更优选地,所述评价信息可表现为一个数值。
其中,网络设备可根据互联网上所有与用户对所述对象的评价相关的信息,来确定该对象在互联网上的评价信息;例如,网络设备统计互联网中各网站上用户发布的、与所述对象相关的评价,确定用户对该对象的评价程度为高等。
优选地,网络设备可根据前述互联网资源信息中的第2)项、第3)项和第4)项来获得所述评价信息。
2)该对象在互联网中的分布信息。
其中,所述分布信息用于指示一个对象在互联网中的分布情况。优选地,所述分布信息包括但不限于该对象所分布至的网站、该对象所分布至的网站的网站类型、该对象在该等网站中所分布至的类别/频道等。例如,一个对象主要分布在销售类网站,如淘宝、京东等,的电子产品类别中。
优选地,可根据前述互联网资源信息中的第1)项来获得所述分布信息。
3)互联网中与该对象有关的用户行为信息。
其中,所述用户行为信息包括任何用户在互联网上的、与该对象相关的行为信息。优选地,所述用户行为信息包括但不限于:
-用户的操作行为信息。如用户对该对象进行的搜索、浏览、点击、转发等操作行为。
-用户的访问行为信息,如用户访问对象的途径信息、用户访问对象的频率、用户访问对象的次序等。
优选地,可根据前述互联网资源信息中的第3)项和第5)项来获得所述用户行为信息。
需要说明的是,上述基于互联网的特征信息仅为举例,其他现有的或今后可能出现的基于互联网的特征信息如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
作为一种优选方案,所述互联网资源信息包含所述用户生成内容,所述步骤S1包括以下步骤:网络设备对所述用户生成内容进行自然语言分析,确定用户对对象的好评度,作为基于互联网的特征信息或该特征信息的一部分。
网络设备可对互联网上包含关键词的所有用户生成内容分别进行自然语言分析,来确定每项用户生成内容所对应的好评度,进而确定用户对该关键词所对应的对象的好评度,作为基于互联网的特征信息或该特征信息的一部分。
例如,网络设备对互联网上包含关键词“iPhone4”的所有用户生成内容进行自然语言分析,来确定用户对“iPhone4”的好感度,并将该好感度作为基于互联网的特征信息。
优选地,所述好评度可表现为数值的形式,网络设备可根据每项用户生成内容的好评度,将该用户生成内容划分至相应的等级,并根据被划分至该等级的所有用户生成内容,来生成该等级所对应的短语标签;更优选地,网络设备统计在每个等级中所包括的用户生成内容的数量。
例如,好评度最高数值为100,网络设备根据好评度划分三个等级:等级一的好评度为86-100;等级二的好评度为60-85;等级三的好评度为60以下。网络设备将所有好评度为在86-100之间的用户生成内容划分至等级一,且根据等级一中所包括的所有用户生成内容,确定该等用户生成内容中出现频率最高的词汇为“性价比高”,则网络设备将“性价比高”作为等级一所对应的短语标签。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据关键词集合中的关键词所来源自的互联网资源信息,确定一个对象基于互联网的特征信息的实现方式,均应包含在本发明的范围内。
需要说明的是,网络设备确定一个子对象基于互联网的特征信息的方式,与网络设备确定一个对象基于互联网的特征信息的方式,可以是类似的。网络设备可从对象的关键词集合中确定子对象的关键词集合,该子对象的关键词集合中的每个关键词包含用于描述子对象的词汇,并根据子对象的关键词集合中的关键词所来源自的互联网资源信息,确定该子对象基于互联网的特征信息。并且,确定子对象的特征信息的过程,可能为确定对象的特征信息的过程中的一部分。
需要说明的是,一个对象的关键词集合可由人工确定,也可由网络设备或其他设备生成;当关键词集合由网络设备或其他设备生成时,由于关键词的多义性,一个关键词集合中可能存在类别不同的关键词。例如,关键词“苹果”所对应的关键词集合中,可能同时存在与电子产品“苹果”相关的关键词,以及与水果“苹果”相关的关键词;当关键词“苹果”属于电子产品类别时,可通过多义性消除算法来过滤关键词集合中与水果“苹果”相关的关键词。
具体地,网络设备获取包含用于描述对象的词汇的多个关键词,并根据所述多个关键词中每个关键词的类别信息以及所述对象的类别信息,去除所述多个关键词中与所述对象所属类别不同的关键词,并将剩余的关键词作为所述关键词集合。
例如,网络设备获取多个关键词“苹果,Apple Inc,iPhone,iPhone4,iPhone4s,iPhone5,iPhone5s,苹果树,苹果生长周期”,该多个关键词中的每个均包含用于描述对象“苹果”的词汇。接着,网络设备将该多个关键词中所对应的类别与对象“苹果”所对应的类别“电子类”不同的关键词“苹果树,苹果生长周期”去除,并将剩余的关键词作为关键词集合{苹果,Apple Inc,iPhone,iPhone4,iPhone4s,iPhone5,iPhone5s}。
根据本实施例的方案,可通过统计一个对象的关键词集合中的关键词在互联网上累积的互联网资源信息,来量化对象并获得其特征信息;并且,所述特征信息可表现为等级或数值形式,以便于用户更直观的了解对象的特征,从而便于对象的管理者或经营者根据所表现出的数值来进行市场规划或作出经营决策。
图2为本发明的另一个实施例的在网络设备中用于确定特征信息的方法的流程示意图。根据本实施例的方法主要通过网络设备来实现。其中,对参照图1所示实施例中所述的网络设备所作的任何说明,均以引用的方式包含于本实施例中。
根据本实施例的方法包括步骤S2、步骤S3和步骤S4。
在步骤S2中,网络设备接收来自用户设备的查询序列。
其中,所述用户设备包括但不限于PC、平板电脑、智能手机、穿戴式设备等。
需要说明的是,所述用户设备仅为举例,其他现有的或今后可能出现的用户设备如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
其中,用户设备的查询序列可来源于多种方式,例如用户在用户设备中输入的查询序列,如,用户在用户设备的搜索引擎中输入“苹果4”;又例如,用户通过分类索引选择查询序列,如,用户在淘宝网站上通过产品的分类索引,选择电子产品的手机品牌的中“苹果”。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何接收来自用户设备的查询序列的实现方式,均应包含在本发明的范围内。
在步骤S3中,网络设备获取与查询序列中的关键词对应的特征信息。
具体地,网络设备获取与查询序列中的关键词对应的特征信息的实现方式包括但不限于:
1)网络设备直接获取与查询序列中的关键词对应的特征信息。
例如,网络设备在多个关键词集合中进行查询,确定查询序列包含的关键词所属的关键词集合,并从该关键词集合所对应的对象基于互联网的特征信息中获取与所述查询序列中的关键词对应的特征信息。
2)当根据查询序列以及用户设备的历史访问记录,判断用户设备需要查询所述对象基于互联网的特征信息时,网络设备从所述对象基于互联网的特征信息中获取与所述查询序列中的关键词对应的特征信息。其中,所述历史访问记录包括任何与用户设备的访问历史相关的记录信息。
其中,网络设备可根据查询序列自身的语义,以及,根据历史访问记录所指示的用户访问倾向,来判断用户设备是否需要查询对象基于互联网的特征信息。
例如,当网络设备判断查询序列中包含用于描述对象的词汇或查询序列的语义能够表现出需要查询对象的特征信息的倾向,且历史访问记录指示用户具有访问市场分析、数据指标搜索等内容的倾向时,网络设备可判断用户设备需要查询对象基于互联网的特征信息。
需要说明的是,步骤S1可在步骤S3之前执行,则在步骤S3中,网络设备直接获取步骤S1中已确定的特征信息即可。或者,步骤S1包含在步骤S3中,也即,网络设备在执行步骤S3时,实时执行步骤S1来获得与所述查询序列中的关键词对应的特征信息。
需要说明的是,若查询序列包含的关键词为用于描述关键词集合所对应的对象的词汇,则步骤S3中网络设备所获取的特征信息为步骤S1中所确定的特征信息中的全部;若查询序列包含的关键词用于描述关键词集合所对应的对象所具有的一个子对象,则步骤S3中网络设备所获取的特征信息,为步骤S1中所确定的特征信息中,与用于描述该子对象的关键词对应的特征信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取与查询序列中的关键词对应的特征信息的实现方式,均应包含在本发明的范围内。
在步骤S4中,网络设备将所获得的特征信息提供给用户设备。
其中,网络设备可采用多种方式将所获得的特征信息提供给用户设备,例如,文字形式、数字形式、图表形式、或上述形式的结合等。
优选地,网络设备将其获得的特征信息提供给用户设备的同时,还可将与查询序列中的关键词属于同一类别的关键词的特征信息提供给用户设备,或者将与查询序列中的关键词所对应的对象相同但所描述的子对象不同的关键词的特征信息提供给用户设备。更优选地,当网络设备向用户设备提供多个关键词的特征信息时,可通过排名的方式在用户设备端进行显示。
更优选地,网络设备可将在一定时间段内关键词的特征信息的变化情况提供给用户设备。
例如,网络设备将关键词“苹果”的特征信息提供给用户设备的同时,将与“苹果”同属于电子产品类别的关键词“三星”、“联想”、“小米”等的特征信息也提供给用户设备;又例如,网络设备将关键词“苹果4”的特征信息提供给用户设备的同时,将与“苹果4”所对应的对象相同但所描述的子对象不同的关键词“苹果4s”、“苹果5”、“苹果5s”的特征信息提供给用户设备。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将所获得的特征信息提供给用户设备的实现方式,均应包含在本发明的范围内。
根据本实施例的方法,可以根据用户的查询序列向用户提供查询序列中的关键词对应的特征信息,且网络设备可以采用多种形式向用户设备提供所述特征信息,以使用户设备能够对对象的特征信息有更直观的认识,且用户可参考网络设备提供的其他相关的关键词的特征信息来进行比对,以对查询序列中的关键词所对应的对象有更准确的定位。
图3为本发明一个方面的在网络设备中用于确定特征信息的装置的结构示意图。根据本实施例的用于确定特征信息的装置(以下简称“特征确定装置”)包括用于根据关键词集合中的关键词所来源自的互联网资源信息,确定一个对象基于互联网的特征信息的装置(以下简称“确定装置1”)。
其中,所述对象包括任何可作为目标的事物。优选地,所述对象为一个品牌,如电子产品品牌“苹果”。且优选地,所述对象可具有多个子对象,关键词集合的至少部分关键词的全部或部分中的每个用于描述所述对象的一个子对象。例如,对象“苹果”可具有以下子对象:苹果4、苹果手机4s、苹果手机5、苹果手机5s,对象“苹果”所对应的关键词集合为{苹果,Apple Inc,iPhone,iPhone4,iPhone4s,iPhone5,iPhone5s},则该关键词集合中的至少部分关键词包括“苹果”、“iPhone4”、“iPhone4s”、“iPhone5”和“iPhone5s”,则关键词iPhone4用于描述子对象“苹果手机4”,关键词iPhone4s用于描述子对象“苹果手机4s”,关键词iPhone5用于描述子对象“苹果手机5”,关键词iPhone5s用于描述子对象“苹果手机5s”。
其中,关键词集合中的每个关键词均包含用于描述所述对象的词汇;例如,对象“苹果”的关键词集合{苹果,Apple Inc,iPhone,iPhone4,iPhone4s,iPhone5,iPhone5s}中的每个关键词均包含用于描述对象“苹果”的词汇。并且,所述关键词集合中的至少部分关键词中的每个与所述特征信息中的至少部分相对应;例如,对象“苹果”的关键词集合为{苹果,Apple Inc,iPhone,iPhone4,iPhone4s,iPhone5,iPhone5s},关键词“苹果”与所有特征信息相对应,关键词iPhone与特征信息中和苹果公司的iPhone手机(包括iPhone4、iPhone4s、iPhone5、iPhone5s等)相关的部分相对应,关键词iPhone4与特征信息中和苹果公司的iPhone4手机相关的部分相对应。需要说明的是,关键词集合中可能存在两个具有相同或相似意义的关键词,且该两个关键词所对应的部分特征信息相同;例如,若关键词集合中可存在iPhone5s与苹果手机5s,且两者对应同一部分特征信息。
具体地,确定装置1可直接根据关键词集合中所有关键词所来源自的互联网资源信息,直接确定关键词集合所对应的对象基于互联网的特征信息;或者,确定装置1根据关键词集合中的每个关键词所来源自的互联网资源信息,确定关键词集合的至少部分关键词中的每个基于互联网的特征信息,从而确定关键词集合所对应的对象基于互联网的特征信息。需要说明的是,确定装置1可仅根据一个关键词所来源自的互联网特征信息,来确定该关键词对应的特征信息;或者,确定装置1也可根据关键词集合中所有的关键词所来源自的特征信息,或关键词集合中与该关键词关联的其他关键词以及该关键词自身所来源自的互联网资源信息,来确定该关键词对应的特征信息。
其中,关键词所来源自的互联网资源信息可以为包含所述关键词的互联网资源的任何信息。优选地,所述互联网资源信息包括但不限于:
1)包含关键词的互联网资源的来源信息。如互联网资源的地址信息、发布互联网资源的网站的地址信息和类型、互联网资源在该网站中所属的频道、在网站上发布该互联网资源的用户信息等。
2)包含关键词的互联网资源的数量和权重信息。
其中,所述权重信息用于指示所述互联网资源的重要程度。
优选地,可根据所述互联网资源的来源信息来确定该互联网资源的权重信息;例如,来源自网络新闻、品牌官网等网站类型的互联网资源的权重高于来源自社区中的互联网资源的权重;知名人物所发布的互联网资源的权重高于匿名人物所发布的互联网资源的权重等。
3)用户对包含关键词的互联网资源的访问信息。
其中,所述访问信息包括任何与用户对包含关键词的互联网资源的访问行为相关的信息。优选地,所述访问信息包括但不限于:
-访问包含关键词的互联网资源的用户的数量;
-包含关键词的互联网资源被访问/搜索的次数;
-包含关键词的互联网资源被访问/搜索的频率;
-包含关键词的互联网资源被访问后转发的次数;
-包含关键词的互联网资源在同类别关键词中被搜索的次序。
其中,所述同类别关键词是指与关键词属于同一类别的、用于表征其他对象的关键词。例如,关键词“Apple”属于电子产品类别,其用于表征品牌“苹果”;关键词“Samsung”同样属于电子产品类别,其用于表征品牌“三星”。
4)包含关键词的互联网资源的内容信息。优选地,包含关键词的互联网资源的内容信息可为互联网上包含所述关键词的用户生成内容UGC。
所述用户生成内容包括任何用户原创的、通过互联网平台进行展示的内容。优选地,所述用户生成内容包括但不限于社区发帖、视频分享、博客、播客等。
5)用户访问包含所述关键词的互联网资源的途径信息。
所述途径信息用于指示用户访问包含所述关键词的互联网资源所使用的用户设备和/或客户端;优选地,所述用户设备包括但不限于PC、平板电脑、智能手机、穿戴式设备等;所述客户端包括但不限于各种类型的浏览器和网站专用客户端等。
需要说明的是,上述互联网资源信息仅为举例,其他现有的或今后可能出现的互联网资源信息如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
其中,所述基于互联网的特征信息包括任何基于互联网数据获得的、用于表征一个对象的特征的信息。优选地,基于互联网的特征信息中的每一项可表现为数值形式、文字形式、或者数值形式与文字形式的结合。更为优选地,对于一个对象,可根据该对象的多项特征信息,获得用于表征该对象的一个综合数值。优选地,所述基于互联网的特征信息包括但不限于:
1)该对象在互联网上的评价信息。
其中,所述评价信息用于指示用户对所述对象的评价程度。优选地,所述评价信息可表现为等级、排名等形式;更优选地,所述评价信息可表现为一个数值。
其中,网络设备可根据互联网上所有与用户对所述对象的评价相关的信息,来确定该对象在互联网上的评价信息;例如,网络设备统计互联网中各网站上用户发布的、与所述对象相关的评价,确定用户对该对象的评价程度为高等。
优选地,网络设备可根据前述互联网资源信息中的第2)项、第3)项和第4)项来获得所述评价信息。
2)该对象在互联网中的分布信息。
其中,所述分布信息用于指示一个对象在互联网中的分布情况。优选地,所述分布信息包括但不限于该对象所分布至的网站、该对象所分布至的网站的网站类型、该对象在该等网站中所分布至的类别/频道等。例如,一个对象主要分布在销售类网站,如淘宝、京东等,的电子产品类别中。
优选地,可根据前述互联网资源信息中的第1)项来获得所述分布信息。
3)互联网中与该对象有关的用户行为信息。
其中,所述用户行为信息包括任何用户在互联网上的、与该对象相关的行为信息。优选地,所述用户行为信息包括但不限于:
-用户的操作行为信息。如用户对该对象进行的搜索、浏览、点击、转发等操作行为。
-用户的访问行为信息,如用户访问对象的途径信息、用户访问对象的频率、用户访问对象的次序等。
优选地,可根据前述互联网资源信息中的第3)项和第5)项来获得所述用户行为信息。
需要说明的是,上述基于互联网的特征信息仅为举例,其他现有的或今后可能出现的基于互联网的特征信息如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
作为一种优选方案,所述互联网资源信息包含所述用户生成内容,所述确定装置1包括用于对所述用户生成内容进行自然语言分析,确定用户对对象的好评度,作为基于互联网的特征信息或该特征信息的一部分的装置(以下简称“子确定装置”(图未示))。
子确定装置可对互联网上包含关键词的所有用户生成内容分别进行自然语言分析,来确定每项用户生成内容所对应的好评度,进而确定用户对该关键词所对应的对象的好评度,作为基于互联网的特征信息或该特征信息的一部分。
例如,子确定装置对互联网上包含关键词“iPhone4”的所有用户生成内容进行自然语言分析,来确定用户对“iPhone4”的好感度,并将该好感度作为基于互联网的特征信息。
优选地,所述好评度可表现为数值的形式,子确定装置可根据每项用户生成内容的好评度,将该用户生成内容划分至相应的等级,并根据被划分至该等级的所有用户生成内容,来生成该等级所对应的短语标签;更优选地,子确定装置统计在每个等级中所包括的用户生成内容的数量。
例如,好评度最高数值为100,子确定装置根据好评度划分三个等级:等级一的好评度为86-100;等级二的好评度为60-85;等级三的好评度为60以下。子确定装置将所有好评度为在86-100之间的用户生成内容划分至等级一,且根据等级一中所包括的所有用户生成内容,确定该等用户生成内容中出现频率最高的词汇为“性价比高”,则子确定装置将“性价比高”作为等级一所对应的短语标签。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据关键词集合中的关键词所来源自的互联网资源信息,确定一个对象基于互联网的特征信息的实现方式,均应包含在本发明的范围内。
需要说明的是,确定装置1确定一个子对象基于互联网的特征信息的方式,与确定装置1确定一个对象基于互联网的特征信息的方式,可以是类似的。确定装置1可从对象的关键词集合中确定子对象的关键词集合,该子对象的关键词集合中的每个关键词包含用于描述子对象的词汇,并根据子对象的关键词集合中的关键词所来源自的互联网资源信息,确定该子对象基于互联网的特征信息。并且,确定子对象的特征信息的过程,可能为确定对象的特征信息的过程中的一部分。
需要说明的是,一个对象的关键词集合可由人工确定,也可由网络设备或其他设备生成;当关键词集合由网络设备或其他设备生成时,由于关键词的多义性,一个关键词集合中可能存在类别不同的关键词。例如,关键词“苹果”所对应的关键词集合中,可能同时存在与电子产品“苹果”相关的关键词,以及与水果“苹果”相关的关键词;当关键词“苹果”属于电子产品类别时,可通过多义性消除算法来过滤关键词集合中与水果“苹果”相关的关键词。
优选地,特征确定装置还包括在确定装置1之前执行操作的第二获取装置(图未示),以及去除装置(图未示)。第二获取装置用于获取包含用于描述对象的词汇的多个关键词,去除装置用于根据所述多个关键词中每个关键词的类别信息以及所述对象的类别信息,去除所述多个关键词中与所述对象所属类别不同的关键词,并将剩余的关键词作为所述关键词集合。
例如,第二获取装置获取多个关键词“苹果,Apple Inc,iPhone,iPhone4,iPhone4s,iPhone5,iPhone5s,苹果树,苹果生长周期”,该多个关键词中的每个均包含用于描述对象“苹果”的词汇。接着,去除装置将该多个关键词中所对应的类别与对象“苹果”所对应的类别“电子类”不同的关键词“苹果树,苹果生长周期”去除,并将剩余的关键词作为关键词集合{苹果,Apple Inc,iPhone,iPhone4,iPhone4s,iPhone5,iPhone5s}。
根据本实施例的方案,可通过统计一个对象的关键词集合中的关键词在互联网上累积的互联网资源信息,来量化对象并获得其特征信息;并且,所述特征信息可表现为等级或数值形式,以便于用户更直观的了解对象的特征,从而便于对象的管理者或经营者根据所表现出的数值来进行市场规划或作出经营决策。
图4为本发明的另一个实施例的在网络设备中用于确定特征信息的装置的结构示意图。根据本实施例的特征确定装置包括用于接收来自用户设备的查询序列的装置(以下简称“接收装置2”)、用于获取与查询序列中的关键词对应特征信息的装置(以下简称“第一获取装置3”)和用于将所获得的特征信息提供给用户设备的装置(以下简称“提供装置4”)。
接收装置2接收来自用户设备的查询序列。
其中,所述用户设备包括但不限于PC、平板电脑、智能手机、穿戴式设备等。
需要说明的是,所述用户设备仅为举例,其他现有的或今后可能出现的用户设备如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
其中,用户设备的查询序列可来源于多种方式,例如用户在用户设备中输入的查询序列,如,用户在用户设备的搜索引擎中输入“苹果4”;又例如,用户通过分类索引选择查询序列,如,用户在淘宝网站上通过产品的分类索引,选择电子产品的手机品牌的中“苹果”。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何接收来自用户设备的查询序列的实现方式,均应包含在本发明的范围内。
第一获取装置3获取与查询序列中的关键词对应的特征信息。
具体地,第一获取装置3获取与查询序列中的关键词对应的特征信息的实现方式包括但不限于:
1)第一获取装置3直接获取与查询序列中的关键词对应的特征信息。
例如,第一获取装置3在多个关键词集合中进行查询,确定查询序列包含的关键词所属的关键词集合,并从该关键词集合所对应的对象基于互联网的特征信息中获取与所述查询序列中的关键词对应的特征信息。
2)第一获取装置3包括子获取装置(图未示),当根据查询序列以及用户设备的历史访问记录,判断用户设备需要查询所述对象基于互联网的特征信息时,子获取装置从所述对象基于互联网的特征信息中获取与所述查询序列中的关键词对应的特征信息。其中,所述历史访问记录包括任何与用户设备的访问历史相关的记录信息。
其中,子获取装置可根据查询序列自身的语义,以及,根据历史访问记录所指示的用户访问倾向,来判断用户设备是否需要查询对象基于互联网的特征信息。
例如,当子获取装置判断查询序列中包含用于描述对象的词汇或查询序列的语义能够表现出需要查询对象的特征信息的倾向,且历史访问记录指示用户具有访问市场分析、数据指标搜索等内容的倾向时,子获取装置可判断用户设备需要查询对象基于互联网的特征信息。
需要说明的是,确定装置1可在第一获取装置3之前执行操作,则第一获取装置3直接获取确定装置1已确定的特征信息即可。或者,在第一获取装置3执行操作的过程触发确定装置1执行操作,也即,第一获取装置3在执行操作时,实时触发确定装置1来获得与所述查询序列中的关键词对应的特征信息。
需要说明的是,若查询序列包含的关键词为用于描述关键词集合所对应的对象的词汇,则第一获取装置3所获取的特征信息为确定装置1中所确定的特征信息中的全部;若查询序列包含的关键词用于描述关键词集合所对应的对象所具有的一个子对象,则第一获取装置3所获取的特征信息,为确定装置1中所确定的特征信息中,与用于描述该子对象的关键词对应的特征信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取与查询序列中的关键词对应的特征信息的实现方式,均应包含在本发明的范围内。
提供装置4将所获得的特征信息提供给用户设备。
其中,提供装置4可采用多种方式将所获得的特征信息提供给用户设备,例如,文字形式、数字形式、图表形式、或上述形式的结合等。
优选地,提供装置4将其获得的特征信息提供给用户设备的同时,还可将与查询序列中的关键词属于同一类别的关键词的特征信息提供给用户设备,或者将与查询序列中的关键词所对应的对象相同但所描述的子对象不同的关键词的特征信息提供给用户设备。更优选地,当提供装置4向用户设备提供多个关键词的特征信息时,可通过排名的方式在用户设备端进行显示。
更优选地,提供装置4可将在一定时间段内关键词的特征信息的变化情况提供给用户设备。
例如,提供装置4将关键词“苹果”的特征信息提供给用户设备的同时,将与“苹果”同属于电子产品类别的关键词“三星”、“联想”、“小米”等的特征信息也提供给用户设备;又例如,提供装置4将关键词“苹果4”的特征信息提供给用户设备的同时,将与“苹果4”所对应的对象相同但所描述的子对象不同的关键词“苹果4s”、“苹果5”、“苹果5s”的特征信息提供给用户设备。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将所获得的特征信息提供给用户设备的实现方式,均应包含在本发明的范围内。
根据本实施例的方案,可以根据用户的查询序列向用户提供查询序列中的关键词对应的特征信息,且网络设备可以采用多种形式向用户设备提供所述特征信息,以使用户设备能够对对象的特征信息有更直观的认识,且用户可参考网络设备提供的其他相关的关键词的特征信息来进行比对,以对查询序列中的关键词所对应的对象有更准确的定位。
图5为一个示例的网络设备向用户设备提供的、对象(汽车企业品牌“宝马”)基于互联网的特征信息的示意图,该图示出了对象“宝马”基于互联网的多个特征信息,并示出了对象“宝马”以及与“宝马”属于同一类别的其他对象“奔驰”和“奥迪”的品牌数字资产在一定时间段内的变化趋势。
其中,品牌数字资产用于指示品牌作为一个对象时,该品牌的所有基于互联网的特征信息的综合量化结果。其中,所述品牌数字资产包括两个维度:信息库存量和连接活跃度;该两个维度用于指示该品牌的部分基于互联网的特征信息的量化结果。
其中,所述信息库存量用于指示互联网上与品牌相关的正面信息量的大小;优选地,可基于品牌的以下特征信息来确定所述信息库存量:
1)数字内容量。
所述数字内容量用于指示互联网上与品牌相关的信息的内容量。优选地,可基于前述互联网资源信息的第2)项来确定所述数字内容量。
2)好感度。
所述好感度用于指示互联网上与品牌相关的所有信息中正面信息所占的比例。优选地,可基于前述互联网资源信息的第2)项、第3)项和第4)项来获得所述好感度;更优选地,可用前述好评度来表示所述好感度。
其中,所述连接活跃度用于指示消费者访问互联网上与品牌相关的信息的强度。优选地,可基于品牌的以下特征信息来确定所述连接活跃度:
1)关注度。
所述关注度用于指示用户对品牌的关注程度,如用户访问与品牌相关的内容的次数、频率等。优选地,可根据前述互联网资源信息中的第3)项来确定所述关注度。
2)参与度。
所述参与度用于指示用户平均的、访问与品牌相关的内容的强度,如互网联上品牌的人均搜索次数。优选地,可根据前述互联网资源信息中的第3)项来确定所述参与度。
3)联想度。
所述联想度用于指示用户访问与品牌相关的信息的质量;优选地,所述联想度可用于指示品牌的第一提及率(也即品牌的代表性程度),用户在访问同类型品牌时,越先访问的品牌的联想度越高。优选地,可根据前述互联网资源信息中的第3)项来确定所述参与度。
作为一种优选方案,网络设备将其获得的对象基于互联网的特征信息提供给用户设备时,还可向用户设备提供对象的通用特征信息。
其中,所述通用特征信息包括对象的任何基于非互联网的特征信息,例如,通用特征信息包括任何基于传媒、报纸、电视、人群抽样、问卷调研等途径获取的、对象基于非互联网的特征信息。
优选地,网络设备向用户设备提供对象基于互联网的特征信息以及通用特征信息时,还可向用户设备提供与对象属于同一类别的其他对象基于互联网的特征信息以及通用特征信息。例如,网络设备向用户设备提供汽车企业品牌“宝马”基于互联网的特征信息以及通用特征信息时,也向用户设备提供汽车企业品牌“奔驰”和“奥迪”基于互联网的特征信息以及通用特征信息。
根据本实施例的方案,网络设备可将其获得的全部或部分基于互联网的特征信息进行进一步量化,并将量化结果提供给用户设备,以使用户设备能够从多种角度对对象有更详细、更准确的认知;并且,网络设备还向用户设备提供对象的通用特征信息,以使用户对该对象有更加客观的了解;此外,网络设备还可向用户设备提供同类别的其他对象基于互联网的特征信息以及基于非互联网的通用特征信息,以使用户作为消费者时,能够更全面的进行比较分析,来为其购买或者使用行为提供参考,且当用户作为对象的管理者或经营者时,可以更好地进行市场规划或作出经营决策。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,本发明的各个装置可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (20)

1.一种在网络设备中用于确定特征信息的方法,其中,该方法包括以下步骤:
a.根据关键词集合中的关键词所来源自的互联网资源信息,来量化一个对象,并确定所述对象基于互联网的特征信息,其中,所述关键词集合中的每个关键词均包含用于描述所述对象的词汇,且所述关键词集合中的至少部分关键词中的每个与所述特征信息中的至少部分相对应,所述互联网资源信息为包含所述关键词的互联网资源的相关信息。
2.根据权利要求1所述的方法,其中,该方法还包括以下步骤:
x接收来自用户设备的查询序列;
y获取与所述查询序列中的关键词对应的特征信息;
z将所获得的特征信息提供给所述用户设备。
3.根据权利要求2所述的方法,其中,所述步骤y包括以下步骤:
-当根据所述查询序列以及所述用户设备的历史访问记录,判断所述用户设备需要查询所述对象基于互联网的特征信息时,从所述对象基于互联网的特征信息中获取与所述查询序列中的关键词对应的特征信息。
4.根据权利要求1至3中任一项所述的方法,其中,该方法在所述步骤a之前还包括以下步骤:
-获取包含用于描述所述对象的词汇的多个关键词;
-根据所述多个关键词中每个关键词的类别信息以及所述对象的类别信息,去除所述多个关键词中与所述对象所属类别不同的关键词,并将剩余的关键词作为所述关键词集合。
5.根据权利要求1至3中任一项所述的方法,其中,所述基于互联网的特征信息包括以下至少一项:
-所述对象在互联网上的评价信息;
-所述对象在互联网中的分布信息;
-互联网中与所述对象有关的用户行为信息。
6.根据权利要求5所述的方法,其中,所述特征信息包括所述评价信息,所述互联网资源信息包括以下至少一项:
-包含所述关键词的互联网资源的数量和权重信息;
-用户对包含所述关键词的互联网资源的访问信息;
-在互联网上包含所述关键词的用户生成内容。
7.根据权利要求6所述的方法,其中,所述互联网资源包含所述用户生成内容,所述步骤a包括以下步骤:
-对所述用户生成内容进行自然语言分析,确定用户对所述对象的好评度,作为所述基于互联网的特征信息或该特征信息的一部分。
8.根据权利要求5所述的方法,其中,所述特征信息包括所述分布信息,所述互联网资源信息包括以下至少一项:
-包含所述关键词的互联网资源的来源信息。
9.根据权利要求5所述的方法,其中,所述特征信息包括所述用户行为信息,所述互联网资源信息包括以下至少一项:
-用户对包含所述关键词的互联网资源的访问信息;
-用户访问包含所述关键词的互联网资源的途径信息。
10.根据权利要求1至3中任一项所述的方法,其中,所述对象具有多个子对象,所述至少部分关键词的全部或部分中的每个用于描述所述对象的一个子对象。
11.一种在网络设备中用于确定特征信息的装置,其中,该装置包括以下装置:
用于根据关键词集合中的关键词所来源自的互联网资源信息,来量化一个对象,并确定所述对象基于互联网的特征信息的装置,其中,所述关键词集合中的每个关键词均包含用于描述所述对象的词汇,且所述关键词集合中的至少部分关键词中的每个与所述特征信息中的至少部分相对应,所述互联网资源信息为包含所述关键词的互联网资源的相关信息。
12.根据权利要求11所述的装置,其中,该装置还包括以下装置:
用于接收来自用户设备的查询序列的装置;
用于获取与所述查询序列中的关键词对应的特征信息的装置;
用于将所获得的特征信息提供给所述用户设备的装置。
13.根据权利要求12所述的装置,其中,所述用于获取与所述查询序列中的关键词对应的特征信息的装置包括以下装置:
用于当根据所述查询序列以及所述用户设备的历史访问记录,判断所述用户设备需要查询所述对象基于互联网的特征信息时,从所述对象基于互联网的特征信息中获取与所述查询序列中的关键词对应的特征信息的装置。
14.根据权利要求11至13中任一项所述的装置,其中,该装置还包括在根据所述互联网资源信息确定特征信息的装置之前执行操作的以下装置:
用于获取包含用于描述所述对象的词汇的多个关键词的装置;
用于根据所述多个关键词中每个关键词的类别信息以及所述对象的类别信息,去除所述多个关键词中与所述对象所属类别不同的关键词,并将剩余的关键词作为所述关键词集合的装置。
15.根据权利要求11至13中任一项所述的装置,其中,所述基于互联网的特征信息包括以下至少一项:
-所述对象在互联网上的评价信息;
-所述对象在互联网中的分布信息;
-互联网中与所述对象有关的用户行为信息。
16.根据权利要求15所述的装置,其中,所述特征信息包括所述评价信息,所述互联网资源信息包括以下至少一项:
-包含所述关键词的互联网资源的数量和权重信息;
-用户对包含所述关键词的互联网资源的访问信息;
-在互联网上包含所述关键词的用户生成内容。
17.根据权利要求16所述的装置,其中,所述互联网资源包含所述用户生成内容,根据所述互联网资源信息确定特征信息的装置包括以下装置:
用于对所述用户生成内容进行自然语言分析,确定用户对所述对象的好评度,作为所述基于互联网的特征信息或该特征信息的一部分的装置。
18.根据权利要求15所述的装置,其中,所述特征信息包括所述分布信息,所述互联网资源信息包括以下至少一项:
-包含所述关键词的互联网资源的来源信息。
19.根据权利要求15所述的装置,其中,所述特征信息包括所述用户行为信息,所述互联网资源信息包括以下至少一项:
-用户对包含所述关键词的互联网资源的访问信息;
-用户访问包含所述关键词的互联网资源的途径信息。
20.根据权利要求11至13中任一项所述的装置,其中,所述对象具有多个子对象,所述至少部分关键词的全部或部分中的每个用于描述所述对象的一个子对象。
CN201410266017.1A 2014-06-13 2014-06-13 一种在网络设备中用于确定特征信息的方法和装置 Active CN104077366B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410266017.1A CN104077366B (zh) 2014-06-13 2014-06-13 一种在网络设备中用于确定特征信息的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410266017.1A CN104077366B (zh) 2014-06-13 2014-06-13 一种在网络设备中用于确定特征信息的方法和装置

Publications (2)

Publication Number Publication Date
CN104077366A CN104077366A (zh) 2014-10-01
CN104077366B true CN104077366B (zh) 2018-03-23

Family

ID=51598620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410266017.1A Active CN104077366B (zh) 2014-06-13 2014-06-13 一种在网络设备中用于确定特征信息的方法和装置

Country Status (1)

Country Link
CN (1) CN104077366B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679030B (zh) * 2017-09-04 2021-08-13 北京京东尚科信息技术有限公司 基于用户操作行为数据提取同义词的方法和装置
CN112445892B (zh) * 2019-09-02 2023-09-29 百度在线网络技术(北京)有限公司 确定品牌提及率的方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102768659A (zh) * 2011-05-03 2012-11-07 阿里巴巴集团控股有限公司 重复账号自动识别方法和系统
CN103198098A (zh) * 2013-03-12 2013-07-10 亿赞普(北京)科技有限公司 一种网络信息投放方法和装置
CN103425677A (zh) * 2012-05-18 2013-12-04 阿里巴巴集团控股有限公司 关键词分类模型确定方法、关键词分类方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102486784B (zh) * 2010-12-06 2014-08-06 尹红伟 信息请求方法和信息提供方法
KR101308821B1 (ko) * 2011-08-30 2013-09-23 강릉원주대학교산학협력단 검색엔진용 키워드 추출 시스템 및 추출 방법
CN103309869B (zh) * 2012-03-09 2017-05-10 阿里巴巴集团控股有限公司 数据对象的展示关键词推荐方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102768659A (zh) * 2011-05-03 2012-11-07 阿里巴巴集团控股有限公司 重复账号自动识别方法和系统
CN103425677A (zh) * 2012-05-18 2013-12-04 阿里巴巴集团控股有限公司 关键词分类模型确定方法、关键词分类方法及装置
CN103198098A (zh) * 2013-03-12 2013-07-10 亿赞普(北京)科技有限公司 一种网络信息投放方法和装置

Also Published As

Publication number Publication date
CN104077366A (zh) 2014-10-01

Similar Documents

Publication Publication Date Title
CN107609152B (zh) 用于扩展查询式的方法和装置
US10180967B2 (en) Performing application searches
Xu et al. Interdisciplinary topics of information science: a study based on the terms interdisciplinarity index series
CN104077415B (zh) 搜索方法及装置
CN105723402A (zh) 用于确定社交数据网络中的影响者的系统和方法
CN103713894B (zh) 一种用于确定用户的访问需求信息的方法与设备
CN102663626A (zh) 基于区域特征的协同过滤推荐方法
Gao et al. SeCo-LDA: Mining service co-occurrence topics for recommendation
CN108073667A (zh) 产生用户浏览属性的方法、以及非暂存计算机可读介质
Harakawa et al. Ranking of importance measures of tweet communities: Application to keyword extraction from COVID-19 tweets in Japan
CN107066509A (zh) 信息提供方法、处理服务器及合并服务器
Cao et al. Web video topics discovery and structuralization with social network
CN108255963A (zh) 一种基于互联网的新闻信息检索的控制方法及装置
CN105404974A (zh) 一种数据资产化方法、装置及管理平台
CN104077366B (zh) 一种在网络设备中用于确定特征信息的方法和装置
Jiang et al. Exploring the users’ preference pattern of application services between different mobile phone brands
Al-Dhelaan et al. Graph summarization for hashtag recommendation
CN112214663A (zh) 获取舆情声量的方法、系统、装置、存储介质及移动终端
Zeng et al. Uncovering the essential links in online commercial networks
CN104050174B (zh) 一种个性化页面生成方法及装置
CN105095404A (zh) 网页信息的处理方法、网页信息的推荐方法及装置
CN105243132B (zh) 一种搜索记录控制方法及电子设备
Jung Discovering social bursts by using link analytics on large-scale social networks
CN111222918B (zh) 关键词挖掘方法、装置、电子设备及存储介质
US9348902B2 (en) Automated attribute disambiguation with human input

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C53 Correction of patent for invention or patent application
CB03 Change of inventor or designer information

Inventor after: Hou Libin

Inventor after: Bai Hai

Inventor after: Liu Fengxiu

Inventor after: Li Xuejie

Inventor after: Cao Yuxin

Inventor after: Zhu Jia

Inventor before: Hou Libin

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: HOU LIBIN TO: HOU LIBIN BAI HAI LIU FENGXU LI XUEJIE CAO YUXIN ZHU JIA

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant