CN103927615A - 将实体与类别相关联 - Google Patents

将实体与类别相关联 Download PDF

Info

Publication number
CN103927615A
CN103927615A CN201410119954.4A CN201410119954A CN103927615A CN 103927615 A CN103927615 A CN 103927615A CN 201410119954 A CN201410119954 A CN 201410119954A CN 103927615 A CN103927615 A CN 103927615A
Authority
CN
China
Prior art keywords
content
classification
classifications
computer
content supplier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410119954.4A
Other languages
English (en)
Other versions
CN103927615B (zh
Inventor
裴忠顺
伍庆
崔贤影
维维克·拉古纳坦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN103927615A publication Critical patent/CN103927615A/zh
Application granted granted Critical
Publication of CN103927615B publication Critical patent/CN103927615B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及将实体与类别相关联。除其它所公开的主题外,一种用于将实体与类别相关联的计算机实现的方法包括为多个类别中的至少子集中的每一个确定概率值,所述概率值表示识别的实体属于相应类别的可能性并且使用关于实体的信息来确定。该方法包括使用概率值和基于训练数据的用于多个类别的规则集来为实体识别多个类别中的一个。

Description

将实体与类别相关联
分案说明
本申请属于申请日为2009年9月14日并且申请号为No.200980145280.2的中国专利申请的分案申请。
相关申请
本申请要求于2009年2月26日提交的、题为ASSOCIATING ANENTITY WITH A CATEGORY(将实体与类别相关联)的美国申请序列号No.12/393,361,以及于2008年9月15日提交的美国临时专利申请序列号No.61/097,026的优先权,特此通过引用合并所述美国申请的全部内容。
技术领域
本文档涉及信息处理。
背景技术
广告主可以在多个不同平台中的任何平台上运行广告活动,所述多个不同平台包括因特网、电视、无线电广播以及广告牌。在广告活动中所使用的广告可以覆盖产品和服务的范围,并且可以定向特定受众或更一般地定向更大人群。例如,运行网站的发布者可以向广告主提供空间用于呈现广告。呈现在网站上的广告有时基于网站的内容来选择。
发明内容
本发明涉及将实体与类别相关联。
在第一方面中,一种用于将实体与类别相关联的计算机实现的方法包括为多个类别中的至少子集中的每一个确定概率值,所述概率值表示识别的实体属于相应类别的可能性并且使用关于实体的信息来确定。该方法包括为实体记录多个类别中的一个类别,类别使用概率值和用于多个类别的规则集来识别。
实施方式可以包括以下特征中的任何、全部特征或不包括以下特征。实体可以是被识别为加入在程序中的内容提供者,在所述程序中内容提供者提供待由至少一个发布者发布的内容,以及概率值可以使用与内容提供者相关联的至少一个关键词以及与内容提供者相关联的至少一个财务值来确定。确定概率值可以包括将至少一个关键词至少映射到多个类别的子集;用至少一个财务值对至少子集赋予权重,其中财务值已被分配给对应关键词;以及选择预定数量的类别作为子集。规则集可以基于训练数据。规则集可以包括决策树,其被配置用于通过处理包括在决策树中的多个决策中的至少部分来选择多个类别中的一个。该方法可以进一步包括使用训练数据来生成决策树,其中训练数据包括实体到多个类别中的一个或多个的映射。生成决策树可以进一步包括使用有关实体的财务数据对映射赋予权重。对映射赋予权重可以进一步包括基于与映射的至少子集相对应的财务数据来过采样(oversample)映射的所述子集。生成决策树可以包括选择用于决策树的结构;确定决策树的延伸区(extent),包括在选择多个类别中的一个之前待进行的多个决策中的决策数量;以及确定待在多个决策中使用的阈值。可以迭代生成决策树。内容提供者可以从事于广告,以及多个类别可以包括内容提供者待与之匹配的垂直元(vertical)。生成决策树可以进一步包括识别垂直元中的至少一个,对于其概率值的确定具有将垂直元不恰当地分配给内容提供者的倾向;以及选择阈值中的至少一个,使得降低所述倾向。该方法可以进一步包括基于已为实体识别的类别向用户呈现信息。信息可以指示与类别相关联的季节性。
在第二方面中,一种计算机系统包括第一分类器,其为多个类别中的至少子集中的每一个类别确定概率值,所述概率值表示识别的实体属于相应类别的可能性并且使用关于实体的信息来确定。该系统包括第二分类器,其使用概率值和用于多个类别的规则集来为实体识别多个类别中的一个类别。
实施方式可以包括以下特征中的任何、全部特征或不包括以下特征。规则集可以基于训练数据。第一分类器在确定概率值时可以考虑与实体有关的财务值。规则集可以包括决策树,其被配置用于通过处理包括在决策树中的多个决策中的至少部分来选择多个类别中的一个,以及该计算机系统可以进一步包括使用训练数据来生成决策树的规则组件,其中训练数据包括实体到多个类别中的一个或多个的映射。规则组件可以使用有关实体的财务数据对映射赋予权重,包括基于与映射的至少子集相对应的财务数据来过采样映射的所述子集。该系统可以进一步包括前端组件,其基于第二分类器已为实体识别了类别向用户呈现信息。
在第三方面中,一种用于将内容提供者与类别相关联的计算机实现的方法包括将内容提供者识别为加入在程序中,在所述程序中内容提供者提供待由至少一个发布者发布的内容。该方法进一步包括接收有关内容提供者的至少一个关键词和有关关键词的至少一个财务值。该方法进一步包括接收多个类别,其中内容提供者待与类别中的至少一个相关联。该方法进一步包括基于类别的名称将至少一个关键词映射到类别的子集。该方法进一步包括将类别的至少子集中的每一个与概率值相关联,所述概率值表示内容提供者应当与相应类别相关联的可能性,所述概率值使用财务值被赋予权重。该方法进一步包括接收所生成的有关多个类别的规则集,所述规则集被配置用于在识别类别中的一个时使用。该方法进一步包括使用规则集来处理有关内容提供者的数据,所述数据至少包括:(i)类别的至少子集中的每一个的概率值;(ii)有关内容提供者的财务数据;(iii)内容提供者与之相关联的地理区域。该方法进一步包括基于对数据的处理为内容提供者选择多个类别中的一个。该方法进一步包括将内容提供者与所选择的类别相关联。
实施方式可以提供以下优势中的任何、全部优势或不提供以下优势。可以提供分成类别的改进的分类。基于概率的分类可以被赋予收益权重,以及可以由先前使用训练数据来训练的基于规则的分类进行进一步特定化。可以增加分类的灵活性。
在附图和下面的描述中阐述了一个或多个实施例的细节。其它特征和优势从描述和附图、以及从权利要求将是显而易见的。
附图说明
图1示出了可以为实体识别类别的示例系统。
图2示出了可以为实体识别类别的另一个示例系统。
图3示出了可以基于已为实体识别的类别来呈现信息的示例用户界面。
图4示出了可以执行来为实体识别类别的示例方法。
图5是可以结合在本文档中描述的计算机实现的方法使用的计算系统的框图。
各附图中相同的参考标记指示相同的元素。
具体实施方式
图1示出了可以为实体识别类别的示例系统100。多个实体可以在系统100中操作,例如实体可以是以下形式的:诸如广告主的内容提供者和诸如网页或其它内容的所有者的内容发布者。在一些实施方式中,内容提供者可以操作一个或多个内容提供者系统102,以及内容发布者可以操作一个或多个内容发布者系统104。可以将任何种类的计算机设备、电子设备或系统包括在系统102和104中,诸如服务器计算机或个人计算机。系统100中的组件可以使用诸如本地计算机网络或因特网的任何种类的网络106来相互通信。
在一些实施方式中,系统100中的一个或多个实体可以参与事务,在所述事务中内容提供者提供待由至少一个发布者发布的内容。例如,诸如广告的内容可以通过网络106从内容提供者系统102分发用于以内容发布者系统104中的一个或多个的名义发布。在一些实施方式中,内容可以由诸如内容分发者系统108(例如,广告服务器)的第三方暂时或永久保持,并且可以从系统108分发用于发布。例如,当用户系统110向发布者系统104请求媒体内容(例如,网页)时,内容分发者系统108可以将相关联的内容(例如,广告)提供给用户系统110用于连同所请求的内容一起呈现。在下面将描述其中诸如系统100中的内容提供者和/或内容发布者的一个或多个实体可以使用类别目录来进行分类的示例。这样的分类对涉及分类实体的任何人,例如管理在实体间分发内容的个人,可以是有用的。
系统100可以包括一个或多个分类器。在一些实施方式中,系统100包括概率分类器112和基于规则的分类器114。这些和其它组件的名称在此被宽泛使用,而不是狭窄使用;例如,概率分类器112在其操作中可以使用一个或多个规则,以及基于规则的分类器114在分类过程中可以确定或使用一个或多个概率。分类器112和114可以以任何形式,诸如使用软件、硬件、固件或以上组合,来实现。
在一些实施方式中,可以使用分类器112和114,以使诸如操作系统102的内容提供者的所选择的实体与诸如来自垂直元目录116的垂直元的一个或多个类别相匹配。垂直元可以是指一个或多个业务分类,诸如有时在市场分析中使用来表示在共同领域中交易的企业和客户的归类词语(例如,消费电子垂直元或化妆品垂直元)。可以使用其它分类。
概率分类器112可以为诸如内容提供者的实体确定针对目录116中的垂直元中的至少一个的概率值。概率可以表示内容提供者属于对应垂直元的可能性。例如,概率分类器可以确定实体“Example Company,Inc.(示例公司)”应当被分类为属于“抵押”垂直元的概率。概率可以使用有关实体的信息来确定。在一些实施方式中,概率分类器112可以确定多个概率值,诸如与目录116中的垂直元的至少子集中的每一个相对应的值。
基于规则的分类器114可以为实体识别类别,诸如目录116中的垂直元中的一个。在一些实施方式中,基于规则的分类器114可以使用由概率分类器112确定的一个或多个概率和诸如决策树118的规则集。例如,决策树118可以包括多个决策,以及可以被配置用于通过处理决策中的至少部分来选择目录116中的多个垂直元中的一个。在一些实施方式中,系统100可以包括基于训练数据122来生成决策树118或其它规则的规则组件120。在一些实施方式中,训练数据122可以包括实体到类别中的相应类别—诸如目录116中的垂直元—的映射。
可以以多种方式中的任何方式生成诸如决策树118的规则集。在一些实施方式中,可以定义树模型,并且然后可以基于训练数据122来生成树。例如,可以选择树结构,诸如以定义树应当包括多级二元决策。作为另一个示例,可以定义树的延伸区(例如,决策树何时应当结束),诸如在选择多个类别中的一个之前待进行的多个决策中的决策数量。在一些实施方式中,树118中的一个或多个决策可以使用阈值。例如,可以将概率(例如,由概率分类器112确定的概率)与阈值进行比较。可以使用任何种类的迭代过程来生成决策树118的一个或多个方面。例如,树118的结构可以在初始迭代中选择,并且针对诸如训练数据122的代表性数据测试,以及这样的测试的结果可以用于在另一个迭代中生成树118的另一个结构。作为另一个示例,可以在初始迭代中确定阈值的第一集合,以及可以在一个或多个额外迭代中通过反馈过程对值中的至少一个进行精化。
基于规则的分类器114在系统100中可以用于一个或多个用途。在一些实施方式中,概率分类器112可能具有在一个或多个方面将实体错误分类的倾向。例如,分类器114可能频繁为实际上未参与娱乐业或仅仅参与较小程度的实体选择“娱乐”垂直元。在概率确定中这样的特性可以是概率分类器112如何被配置的人为结果,以及可以取决于多个因素,其可以使解决该问题困难或不现实。在一些实施方式中,可以将基于规则的分类器114与概率分类器112结合使用。例如,可以选择由基于规则的分类器114使用的规则集(例如,决策树118)中的阈值中的至少一个,以降低或消除所讨论的关于类别的倾向。
可以为给定实体,诸如为运行系统102的内容提供者,选择至少一个类别(例如,目录116中的垂直元中的一个)。这样的选择可以用于一个或多个用途,诸如用来向用户输出相关信息。在一些实施方式中,系统100可以包括可以使用一个或多个类别选择的前端组件124。例如,前端组件124可以呈现与所选择的类别有关的信息作为表征实体的方式。
图2示出了可以为实体识别类别的另一个示例系统200。在系统200中,可以识别关于实体的一个或多个信息部分,诸如与内容提供者相关联的关键词202。在一些实施方式中,作为参加内容分发程序的一部分,内容提供者可以自识别关键词。例如,广告主可以向内容分发者系统108(图1)登记对一个或多个关键词的出价,使得广告主的广告可以被考虑用于在与关键词有关的语境下发布。可以识别有关实体的财务信息204。例如,这可以包括收益数据,诸如有关广告主花费在特定关键词上的金额的信息。
系统200可以包括基础分类器206。在一些实施方式中,基础分类器可以被配置为使用诸如垂直元目录116(图1)的类别集来对诸如内容提供者或内容分发活动的实体进行分类。在一些实施方式中,基础分类器206可以将关键词202映射到部分或全部垂直元,并且选择预定数量的垂直元。例如,诸如通过选择具有最大权重的那些垂直元,垂直元中的三个可以被选择为最能代表实体。
基础分类器206可以将用于特定实体的多个关键词映射到相应垂直元。可以合并为关键词选择的相应垂直元(例如,可以求其相应概率的平均值)以形成实体的单一归类。在一些实施方式中,可以基于财务数据204,诸如基于花费在各个关键词上的金额,来对为实体选择的垂直元赋予权重。例如,在计算分类时,可以给予关于对内容提供者的或分发活动的花费的相对较大部分负责的关键词的垂直元相对较大的权重。在一些实施方式中,基础分类器206可以包括概率分类器112(图1)。在一些实施方式中,基础分类器206的输出可以包括一个或多个赋予权重的垂直元208,诸如与权重(例如在0和1之间的数字)相关联的至少一个分类器词语(例如,垂直元名称)。
系统200可以包括赋予花费权重规则组件210。在一些实施方式中,组件210可以提供用于定义若干类别之间,诸如在三个赋予收益权重的垂直元之间,的主类别的策略。例如,关于系统200中的其它组件,组件210可以作为离线程序运行,诸如以由Mathworks公司开发的MATLAB环境中的程序的形式。
赋予花费权重规则组件210可以被配置用于多维特征空间上的多类分类。在一些实施方式中,n维特征可以用于映射到任何m维。例如,垂直元目录116可以包括30个垂直元。作为另一个示例,可以识别额外特征,包括但不限于实体的季度花费、实体的总花费、用于实体的关键词的数量以及实体的促销国家。因此,34维特征空间(即,n=34)可以用于成为任何30维(即,m=30)的分类。在一些实施方式中,特征维中的一个或多个,诸如实体国家,可以是分类的。例如,可以给预定数量的最高位国家(例如,九个国家)每一个分配一个类,以及可以将剩余国家聚组在公有类中。在一些实施方式中,特征维中的一个或多个可以是离散或连续变量。例如,关键词计数可以是离散变量和/或总花费可以是连续变量。
在一些实施方式中,赋予花费权重规则组件210可以包括基于规则的分类器(图1)。例如,组件210可以使用部分或全部训练数据122来定义适当策略。在一些实施方式中,赋予花费权重规则组件210可以在新的或经修改的训练数据集变得可用时,诸如在人类分类者将一个或多个实体映射到了垂直元目录116时,被触发。
赋予花费权重规则组件210可以输出可以在为实体选择类别时使用的规则集212。在一些实施方式中,该规则集可以包括决策树。例如,组件210可以使决策树分裂并且生长以优化给定实体是特定类别的成员的已确定概率。作为另一个示例,训练数据122(图1)可以用于修剪决策树,诸如以避免过拟合。
在一些实施方式中,可以使用诸如“分类回归树”(CART)的特征。在这样的实施方式中,赋予花费权重规则组件210可以包括或基于CART分类器。例如,可以用定制的修剪程序(例如,停止规则)构建CART模型。作为另一个示例,可以使用十折交叉验证(10-foldcross validation)来计算CART模型的误差估计。
在一些实施方式中,规则集212包括一维规则的分类决策树,其用于将赋予收益权重的垂直元(例如,三个)集映射到用于实体的一个垂直元中。例如,这可以在系统200中提供更大归纳能力的益处,诸如以允许从基础分类器206修剪“坏的垂直元”和/或其它系统误差。
在生成规则集212时,可以考虑财务数据。在一些实施方式中,可以在构建CART模型时复制数据,诸如以使复制量与花费金额成比例。例如,可能过采样与相对较高的总花费和/或季度花费水平相对应的数据。作为另一个示例,可能对与相对较低的总花费和/或季度花费水平相对应的数据采样不足。在一些实施方式中,基于收益的额外训练数据点可能易于使最终输出(例如,对一个或多个类别的选择)偏向于较高花费实体(例如,内容提供者),并且提高有关这些实体的精确性。
下面在附录I中展现了规则集212—在此为决策树—的示例。
系统100可以包括主垂直元分类器214。在一些实施方式中,分类器可以将赋予收益权重的类别集(例如,赋予权重的垂直元208)静态地映射到用于实体的单个主垂直元中。例如,分类器214可以使用规则集212(诸如通过加载由组件210生成的CART分类树)来从基础分类器206选择赋予权重的类别中的一个。
图3示出了可以基于已为实体识别的类别来呈现信息的示例用户界面300。在一些实施方式中,前端组件124(图1)可以诸如向系统100中的动作者生成用户界面300。在一些实施方式中,用户界面300可以用于管理客户关系,诸如用于监视和/或跟踪诸如广告活动的内容分发程序中的参与者。用户界面300可以包括“名称”区域302,其中可以呈现一个或多个实体的标识符,诸如广告主和/或另一个内容提供者的名称。用户界面300可以包括“垂直元”区域304,其中可以指示为实体识别的类别,诸如来自目录116的垂直元。用户界面300可以包括呈现与分配给实体的类别有关的信息的一个或多个区域,诸如“季节性”区域306。例如,从事特定垂直元的公司(例如,税务筹划顾问或鲜花零售商)在其业务和/或其它活动中可能具有季节性发生波动。在一些实施方式中,可以向用户输出这样的季节性(例如,“该实体的业务在情人节附近可能达到最高峰”的信息)。在一些实施方式中,可以在没有明确指示所选择的垂直元的情况下输出相关信息(例如,季节性区域306)。用户界面300可以包括“搜索”控件308,通过其用户可以使用一个或多个标准来搜索实体,以及可以通过将信息填充在区域302-306中的一个或多个中来呈现这样的搜索的结果。用户界面300可以包括“联系”控件310,通过其用户可以发起与一个或多个实体的联系,诸如经由电子邮件或电话。例如,当看见了季节性区域306中的信息时,诸如销售代表的用户可以联系实体以确保其有关旺季的需求得到满足。
图4示出了可以执行来为实体识别类别的示例方法400。方法400可以由例如系统100和/或200中、执行存储在计算机可读介质中的指令的处理器来执行。在一些实施方式中,可以以另一种顺序执行步骤中的一个或多个;作为另一个示例,可以执行更多或更少步骤。步骤410包括为多个类别中的至少子集中的每一个确定概率值。概率值可以表示识别的实体属于相应类别的可能性并且可以使用关于实体的信息来确定。例如,概率分类器112和/或基础分类器可以为诸如内容提供者或内容发布者的特定实体生成赋予权重的垂直元208。子集可以包括一个或多个类别。
步骤420包括为实体记录多个类别中的一个,类别使用概率值和基于例如训练数据的用于多个类别的规则集来识别。例如,基于规则的分类器114和/或主垂直元分类器214可以从目录116选择一个垂直元来与特定实体相关联。
步骤430包括基于为实体对类别的识别来呈现信息。例如,前端组件124可以生成可以呈现季节性区域306的用户界面300。
图5是通用计算机系统500的示意图。根据一个实施方式,系统500可以用于结合先前描述的任何计算机实现的方法描述的操作。系统500包括处理器510、存储器520、存储设备530和输入/输出设备540。组件510、520、530和540中的每一个使用系统总线550互连。处理器510能够处理用于在系统500内执行的指令。在一个实施方式中,处理器510是单线程处理器。在另一个实施方式中,处理器510是多线程处理器。处理器510能够处理存储在存储器520中或存储设备530上的指令以在输入/输出设备540上显示用于用户界面的图形信息。
存储器520存储系统500内的信息。在一个实施方式中,存储器520是计算机可读介质。在一个实施方式中,存储器520是易失性存储器单元。在另一个实施方式中,存储器520是非易失性存储器单元。
存储设备530能够为系统500提供海量存储。在一个实施方式中,存储设备530是计算机可读介质。在各种不同的实施方式中,存储设备530可以是软盘设备、硬盘设备、光盘设备或带设备。
输入/输出设备540为系统500提供输入/输出操作。在一个实施方式中,输入/输出设备540包括键盘和/或指示设备。在另一个实施方式中,输入/输出设备540包括用于显示图形用户界面的显示单元。
可以在数字电子电路中,或者在计算机硬件、固件、软件或者在它们的组合中实现所描述的特征。可以在有形地包括在信息载体中—例如,在机器可读存储设备或传播信号中—的、用于可编程处理器执行的计算机程序产品中实现装置;以及可以由执行指令程序来执行所描述的实施方式的功能的可编程处理器通过操作输入数据并且生成输出来执行方法步骤。可以在包括至少一个可编程处理器的可编程系统上可执行的一个或多个计算机程序中有利地实现所描述的特征,所述至少一个可编程处理器被耦接以从数据存储系统、至少一个输入设备和至少一个输出设备接收数据和指令以及将数据和指令传送到数据存储系统、至少一个输入设备和至少一个输出设备。计算机程序是可以在计算机中直接或间接使用来执行某一动作或引起某一结果的指令集。计算机程序可以以任何形式的编程语言编写,所述编程语言包括编译或解释语言,并且其可以以任何形式部署,包括作为独立程序或作为模块、组件、子程序或适于在计算环境中使用的其它单元。
用于执行指令程序的适当处理器包括例如通用和专用微处理器两者,以及任何种类的计算机的唯一处理器或多个处理器中的一个。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的主要元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器。通常,计算机还包括用于存储数据文件的一个或多个海量存储设备,或可操作地耦接以与所述一个或多个海量存储设备通信;这样的设备包括磁盘,诸如内部硬盘和可移动盘;磁光盘;以及光盘。适于有形地包括计算机程序指令和数据的存储设备包括所有形式的非易失性存储器,包括例如:半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,诸如内部硬盘和可移动盘;磁光盘;以及CD-ROM和DVD-ROM盘。处理器和存储器可以由ASIC(专用集成电路)补充,或合并入ASIC。
为了提供与用户的交互,可以在具有下述的计算机上实现特征:用于向用户显示信息的显示设备,例如CRT(阴极射线管)或LCD(液晶显示)监视器,以及用户通过其可以向计算机提供输入的键盘和指示设备,例如鼠标或跟踪球。
可以在包括诸如数据服务器的后端组件、或者包括诸如应用服务器或因特网服务器的中间件组件、或者包括诸如具有图形用户界面或因特网浏览器的客户端计算机的前端组件、或者它们的任何组合的计算机系统中实现特征。系统的组件可以通过诸如通信网络的任何形式或介质的数字数据通信连接。通信网络的示例例如包括LAN、WAN以及形成因特网的计算机和网络。
计算机系统可以包括客户端和服务器。客户端和服务器通常彼此远离并且典型地通过诸如所描述的网络之一的网络交互。客户端和服务器的关系依靠在各个计算机上运行并且彼此具有客户端-服务器关系的计算机程序产生。
已经描述了多个实施例。然而,将理解的是,在不背离本公开的精神和范围的情况下,可以进行各种修改。因此,其它实施例在权利要求的范围内。
附录I
CART模型描述和输出
自变量
xl:国家(例如,根据国家代码)
x2:关键词计数
x3:总花费(USD)
x4:季度花费(USD)
x5~x34:从最小到最大排序的用于垂直元的收益权重(例如,分类器112或206的输出)
Id   x5  x6  x7  x8  x9  x10 x11 x12 x13 x14
垂直 2   3   4   5   7   8   11  12  13  14
Id   x15 x16 x17 x18 x19 x20 x21 x22 x23 x24
垂直 15  16  18  19  20  29  44  45  47  52
Id   x25 x26 x27 x28 x29 x30 x31 x32 x33 x34
垂直 66  67  71  174 285 299 397 439 533 570
CART输出
用于分类的决策树
1if x26<0.156561then node2else node3
2if x9<0.370092then node4else node5
3if x26<0.657022then node6else node7
4if x17<0.495845then node8else node9
5if x9<0.823663then node10else node11
6if x15<0.0685697then node12else node13
7if x21<0.0848807then node14else node15
8if x8<0.521697then node16else node17
9if x17<0.736217then node18else node19
10if x23<0.498586then node20else node21
11class=7
12if x20<0.257736then node22else node23
13if x20<0.0258419then node24else node25
14class=67
15if x2<7168.5then node26else node27
16if x24<0.354713then node28else node29
17if x8<0.716763then node30else node31
18if x2<80663then node32else node33
19if x17<0.925121then node34else node35
20if x18<0.213272then node36else node37
21class=47
22if x12<0.335248then node38else node39
23if x1in{1346}then node40else node41
24if x29<0.230442then node42else node43
25class=29
26class=44
27class=52
28if x11<0.331887then node44else node45
29class=52
30if x2<7057.5then node46else node47
31class=5
32if x7<0.0829784then node48else node49
33if x1=1then node50else node51
34if x2<77348then node52else node53
35class=18
36if x20<0.371657then node54else node55
37if x3<3.85033e+06then node56else node57
38if x19<0.330368then node58else node59
39class=12
40class=29
41class=67
42class=67
43class=285
44if x23<0.57222then node60else node61
45if x7<0.114347then node62else node63
46if x13<0.330393then node64else node65
47if x7<0.255785then node66else node67
48if x1in{1237810}then node68else node69
49class=4
50class=11
51class=285
52class=18
53class=20
54class=7
55class=29
56class=7
57class=19
58if x21<0.203319then node70else node71
59class=20
60if x3<4.08266e+07then node72else node73
61if x23<0.730036then node74else node75
62if x11<0.537014then node76else node77
63if x1in{12810}then node78else node79
64if x24<0.10869then node80else node81
65if x2<1310then node82else node83
66if x1in{1257}then node84else node85
67class=4
68class=18
69if x2<39894then node86else node87
70if x13<0.193039then node88else node89
71class=44
72if x22<0.442255then node90else node91
73class=5
74if x12<0.179846then node92else node93
75class=47
76if x27<0.189842then node94else node95
77class=11
78class=4
79class=11
80class=5
81if x1in{136810}then node96else node97
82class=13
83class=5
84if x32<0.117921then node98else node99
85class=5
86if x21<0.268462then node100else node101
87class=52
88if x17<0.209712then node102else node103
89class=13
90if x7<0.35475then node104else node105
91if x22<0.711517then node106else node107
92if x2<10.5then node108else node109
93class=12
94if x4<368742then node110else node111
95class=71
96class=5
97class=52
98class=19
99class=18
100class=18
101class=44
102if x23<0.262412then node112else node113
103class=18
104if xl8<0.513483then node114else node115
105class=4
106if x21<0.210351then node116else node117
107class=45
108class=18
109class=47
110if xl2<0.433287then node118else node119
111class=11
112if x7<0.569093then node120else node121
113class=47
114if x20<0.473106then node122else node123
115if x22<0.158422then node124else node125
116if x6<0.0777122then node126else node127
117if x21<0.470751then node128else node129
118if x3<1.47723e+06then node130else node131
119if x3<5.20398e+06then node132else node133
120if xl4<0.396659then node134else node135
121class=4
122if x12<0.470398then node136else node137
123if x17<0.306859then node138else node139
124if x18<0.824979then node140else node141
125class=19
126class=45
127if x3<1.93593e+06then node142else node143
128if x3<1.44848e+06then node144else node145
129class=45
130class=11
131class=8
132if x1in{14568}then node146else node147
133class=11
134if x11<0.09162then node148else node149
135class=14
136if x21<0.385516then node150else node151
137if xl2<0.821368then node152else node153
138class=29
139class=18
140if x4<104730then node154else node155
141if x27<0.019163then node156else node157
142class=2
143class=29
144if x4<2953.45then node158else node159
145class=44
146class=12
147ifx3<361231then node160else node161
148if x9<0.384375then node162else node163
149class=11
150if xl4<0.452462then node164else node165
151class=44
152if x7<0.159118then node166else node167
153class=12
154if x3<1.58799e+06then node168else node169
155class=19
156class=19
157class=13
158class=44
159class=45
160if x2<653then node170else node171
161class=11
162if x24<0.262085then node172else node173
163class=7
164if x13<0.32757then node174else node175
165if x30<0.28577then node176else node177
166if xl8<0.247799then node178else node179
167class=4
168if xl3<0.00967496then node180else node181
169class=18
170class=11
171class=12
172if x8<0.281417then node182else node183
173class=52
174if x30<0.258444then node184else node185
175if x13<0.779286then node186else node187
176class=14
177class=299
178if x11<0.0620939then node188else node189
179class=19
180if x19<0.123657then node190else node191
181class=13
182class=67
183class=5
184if x33<0.118834then node192else node193
185if x1in{1235678}then node194else node195
186if x33<0.326535then node196else node197
187class=13
188if xl7<0.114527then node198else node199
189if x12<0.640493then node200else node201
190class=19
191class=20
192if x10<0.508978then node202else node203
193if x33<0.544036then node204else node205
194if x13<0.0837794then node206else node207
195if x30<0.620821then node208else node209
196if x32<0.085737then node210else node211
197class=533
198class=12
199if x4<34722.4then node212else node213
200class=11
201class=12
202if x32<0.33374then node214else node215
203class=8
204if x8<0.00714825then node216else node217
205class=533
206if x15<0.248854then node218else node219
207if x3<709455then node220else node221
208class=2
209if x30<0.818431then node222else node223
210class=13
211class=439
212class=18
213class=12
214if x27<0.445613then node224else node225
215if x30<0.0232432then node226else node227
216class=533
217class=5
218class=299
219if x1in{123578}then node228else node229
220class=299
221class=13
222class=299
223class=2
224if xl9<0.0842646then node230else node231
225class=71
226class=439
227class=2
228class=299
229class=52
230if x15<0.792343then node232else node233
231if x3<1.43634e+06then node234else node235
232if x34<0.432739then node236else node237
233if x20<0.00676158then node238else node239
234if x4<142308then node240else node241
235if x3<2.28536e+06then node242else node243
236if x6<0.343384then node244else node245
237class=570
238if x26<2.31392e-13then node246else node247
239class=29
240class=20
241class=18
242if x4<177429then node248else node249
243class=7
244if x25<0.735451then node250else node251
245if x14<0.037943then node252else node253
246if x4<44870.6then node254else node255
247if x1in{134710}then node256else node257
248class=47
249if x1=1then node258else node259
250if x29<0.376623then node260else node261
251class=66
252if x6<0.904535then node262else node263
253if x2<782then node264else node265
254if x17<0.0111276then node266else node267
255class=15
256class=67
257class=15
258class=45
259class=18
260if x9<0.127178then node268else node269
261if x29<0.720004then node270else node271
262if x8<0.0786027then node272else node273
263if x4<224146then node274else node275
264class=3
265class=2
266class=15
267class=2
268if x20<0.107796then node276else node277
269if x3<2.68169e+06then node278else node279
270if x14<0.0382579then node280else node281
271class=285
272if x30<0.0283009then node282else node283
273if x24<0.0668307then node284else node285
274if x19<0.0325977then node286else node287
275class=2
276if x16<0.487338then node288else node289
277if x15<0.486436then node290else node291
278if x9<0.366797then node292else node293
279class=13
280if x11<0.0434011then node294else node295
281class=14
282if x3<1.79108e+06then node296else node297
283class=2
284if x1in{12457}then node298else node299
285class=52
286class=3
287class=52
288if x17<0.188053then node300else node301
289class=16
290if x23<0.249635then node302else node303
291class=29
292class=7
293class=45
294class=285
295class=11
296if x25<0.0849167then node304else node305
297if x6<0.816804then node306else node307
298class=5
299class=3
300if x3<5.75773e+06then node308else node309
301if x23<0.367225then node310else node311
302if x15<0.0297698then node312else node313
303if x1=4then node314else node315
304if x24<0.0109364then node316else node317
305class=66
306class=3
307class=2
308if x18<0.358197then node318else node319
309class=45
310if x14<0.30828then node320else node321
311if x1in{12410}then node322else node323
312class=4
313if x1in{123468}then node324else node325
314class=47
315class=15
316if x7<0.0529852then node326else node327
317class=52
318if x8<0.250055then node328else node329
319class=19
320if x34<0.299071then node330else node331
321class=14
322class=47
323class=14
324if x1in{18}then node332else node333
325class=533
326if x18<0.346103then node334else node335
327class=4
328if x12<0.00523925then node336else node337
329if x3<1.54296e+06then node338else node339
330class=18
331class=570
332class=29
333class=19
334if x34<0.24078then node340else node341
335class=19
336if x24<0.0618855then node342else node343
337if x7<0.269018then node344else node345
338if x1in{15610}then node346else node347
339class=18
340if x6<0.744853then node348else node349
341class=570
342if x25<0.725171then node350else node351
343class=52
344if x11<0.145951then node352else node353
345class=4
346class=5
347if x7<0.074593then node354else node355
348if x1in{12378910}then node356else node357
349class=3
350if x3<312875then node358else node359
351class=7
352if x4<40808.4then node360else node361
353class=11
354if x1in{2348}then node362else node363
355class=4
356if x3<602261then node364else node365
357class=16
358if x28<0.99751then node366else node367
359if x10<0.204898then node368else node369
360class=12
361class=15
362if x3<579398then node370else node371
363class=13
364if x1in{12389}then node372else node373
365class=533
366if x25<0.389004then node374else node375
367class=174
368class=15
369class=8
370if x2<95then node376else node377
371class=67
372if x3<56290.8then node378else node379
373class=2
374if x21<0.073466then node380else node381
375class=66
376class=12
377class=5
378class=3
379class=18
380if x15<0.329107then node382else node383
381class=44
382class=14
383class=15

Claims (20)

1.一种用于将实体与类别相关联的计算机实现的方法,所述方法包括:
使用一个或多个计算机处理器执行指令,所述指令使得所述一个或多个计算机处理器生成内容分发系统,所述内容分发系统被配置成:(i)从至少一个内容提供者接收一个或多个内容部分,(ii)至少部分地基于所述至少一个内容提供者属于多个类别中的哪一个来选择所述一个或多个内容部分中的至少一个用于发布,以及(iii)提供所选择的所述至少一个内容部分以代表所述至少一个内容提供者用于发布;
接收关于第一内容提供者的第一信息;
使用一个或多个计算机处理器,相对于所述第一内容提供者确定所述多个类别的至少子集中的每一个类别的概率值,每一个所述概率值表示所述第一内容提供者属于相应类别的可能性并且使用关于所述第一内容提供者的所述第一信息来确定;以及
使用一个或多个计算机处理器,识别所述多个类别的所述子集中的一个类别,并且将所识别的所述一个类别分配给所述内容分发系统中的所述第一内容提供者,所述一个类别使用所述概率值和用于所述多个类别的规则集来识别。
2.根据权利要求1所述的计算机实现的方法,其中所述概率值使用与所述第一内容提供者相关联的至少一个关键词以及与所述第一内容提供者相关联的至少一个财务值来确定。
3.根据权利要求2所述的计算机实现的方法,其中确定所述概率值包括:
将所述至少一个关键词至少映射到所述多个类别的所述子集;
用所述至少一个财务值对至少所述子集赋予权重,其中所述财务值已被分配给对应关键词;以及
选择预定数量的所述多个类别作为所述子集。
4.根据权利要求1所述的计算机实现的方法,其中所述规则集基于训练数据。
5.根据权利要求4所述的计算机实现的方法,其中所述规则集包括决策树,所述决策树被配置用于通过处理包括在所述决策树中的多个决策中的至少部分来选择所述多个类别中的一个。
6.根据权利要求5所述的计算机实现的方法,进一步包括:
使用所述训练数据来生成所述决策树,其中所述训练数据包括实体到所述多个类别中的一个或多个的映射。
7.根据权利要求6所述的计算机实现的方法,其中生成所述决策树进一步包括:
使用有关所述实体的财务数据对所述映射赋予权重。
8.根据权利要求7所述的计算机实现的方法,其中对所述映射赋予权重进一步包括:
基于与所述映射的至少子集相对应的所述财务数据来过采样所述映射的所述子集。
9.根据权利要求5所述的计算机实现的方法,其中生成所述决策树包括:
选择用于所述决策树的结构;
确定所述决策树的延伸区,包括在选择所述多个类别中的所述一个之前待进行的所述多个决策中的决策数量;以及
确定待在所述多个决策中使用的阈值。
10.根据权利要求8所述的计算机实现的方法,其中所述决策树被迭代生成。
11.根据权利要求6所述的计算机实现的方法,其中所述第一内容提供者从事于广告,以及其中所述多个类别包括所述第一内容提供者待与之匹配的垂直元。
12.根据权利要求10所述的计算机实现的方法,其中生成所述决策树进一步包括:
识别所述垂直元中的至少一个,对于所述至少一个垂直元所述概率值的所述确定具有将所述垂直元不恰当地分配给所述第一内容提供者的倾向;以及
选择所述阈值中的至少一个,使得降低所述倾向。
13.根据权利要求1所述的计算机实现的方法,进一步包括:
基于已为所述第一内容提供者识别的所述类别向用户呈现第二信息。
14.根据权利要求13所述的计算机实现的方法,其中所述第二信息指示与所述类别相关联的季节性。
15.一种计算机系统,包括:
一个或多个计算机处理器;以及
存储有指令的非易失性计算机可读存储介质,所述指令在被执行时使得所述一个或多个计算机处理器生成:
内容分发系统,所述内容分发系统被配置成:(i)从至少一个内容提供者接收一个或多个内容部分,(ii)至少部分地基于所述至少一个内容提供者属于多个类别中的哪一个来选择所述一个或多个内容部分中的至少一个用于发布,以及(iii)提供所选择的所述至少一个内容部分以代表所述至少一个内容提供者用于发布;
第一分类器,所述第一分类器相对于所述第一内容提供者确定所述多个类别的至少子集中的每一个类别的概率值,每一个所述概率值表示所述第一内容提供者属于相应类别的可能性并且使用所接收的关于所述第一内容提供者的第一信息来确定;以及
第二分类器,所述第二分类器使用所述概率值和用于所述多个类别的规则集来为所述内容分发系统中的所述第一内容提供者识别所述多个类别的所述子集中的一个类别;
其中所述计算机系统将所识别的类别分配给所述第一内容提供者。
16.根据权利要求15所述的计算机系统,其中所述规则集基于训练数据。
17.根据权利要求16所述的计算机系统,其中所述规则集包括决策树,所述决策树被配置用于通过处理包括在所述决策树中的多个决策中的至少部分来选择所述多个类别中的一个,所述计算机系统进一步包括:
规则组件,所述规则组件使用所述训练数据来生成所述决策树,其中所述训练数据包括实体到所述多个类别中的一个或多个的映射。
18.根据权利要求17所述的计算机系统,其中所述规则组件使用有关所述实体的财务数据对所述映射赋予权重,包括基于与所述映射的至少子集相对应的所述财务数据来过采样所述映射的所述子集。
19.根据权利要求15所述的计算机系统,进一步包括:
前端组件,所述前端组件基于所述第二分类器已为所述第一内容提供者识别了所述类别而向用户呈现信息。
20.一种用于将内容提供者与类别相关联的计算机实现的方法,所述方法包括:
使用一个或多个计算机处理器,将第一内容提供者识别为加入在程序中,在所述程序中所述第一内容提供者提供待由至少一个发布者发布的内容,其中内容分发系统被配置成:(i)从至少一个内容提供者接收一个或多个内容部分,(ii)至少部分地基于所述至少一个内容提供者属于多个类别中的哪一个来选择所述一个或多个内容部分中的至少一个用于发布,以及(iii)提供所选择的所述至少一个内容部分以代表所述至少一个内容提供者用于发布;
使用一个或多个计算机处理器,接收有关所述第一内容提供者的至少一个关键词和有关所述关键词的至少一个财务值;
使用一个或多个计算机处理器,接收多个类别,其中所述第一内容提供者待与所述类别中的至少一个相关联;
使用一个或多个计算机处理器,基于所述类别的名称将所述至少一个关键词映射到所述类别的子集;
使用一个或多个计算机处理器,将所述类别的至少所述子集中的每一个与概率值相关联,所述概率值表示所述第一内容提供者应当与相应类别相关联的可能性,所述概率值使用所述财务值被赋予权重;
使用一个或多个计算机处理器,接收所生成的有关所述多个类别的规则集,所述规则集被配置用于在识别所述类别中的一个时使用;
使用一个或多个计算机处理器,使用所述规则集来处理有关所述第一内容提供者的数据,所述数据至少包括:(i)所述类别的至少所述子集中的每一个的所述概率值;(ii)有关所述第一内容提供者的财务数据;(iii)所述第一内容提供者与之相关联的地理区域;
使用一个或多个计算机处理器,基于对所述数据的所述处理为所述第一内容提供者选择所述多个类别中的一个;以及
使用一个或多个计算机处理器,将所述第一内容提供者与所选择的类别相关联。
CN201410119954.4A 2008-09-15 2009-09-14 将实体与类别相关联 Active CN103927615B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US9702608P 2008-09-15 2008-09-15
US61/097,026 2008-09-15
US12/393,361 US20100070339A1 (en) 2008-09-15 2009-02-26 Associating an Entity with a Category
US12/393,361 2009-02-26
CN2009801452802A CN102216925A (zh) 2008-09-15 2009-09-14 将实体与类别相关联

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN2009801452802A Division CN102216925A (zh) 2008-09-15 2009-09-14 将实体与类别相关联

Publications (2)

Publication Number Publication Date
CN103927615A true CN103927615A (zh) 2014-07-16
CN103927615B CN103927615B (zh) 2017-09-19

Family

ID=42005803

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2009801452802A Pending CN102216925A (zh) 2008-09-15 2009-09-14 将实体与类别相关联
CN201410119954.4A Active CN103927615B (zh) 2008-09-15 2009-09-14 将实体与类别相关联

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2009801452802A Pending CN102216925A (zh) 2008-09-15 2009-09-14 将实体与类别相关联

Country Status (7)

Country Link
US (1) US20100070339A1 (zh)
EP (1) EP2347342A4 (zh)
JP (1) JP5492897B2 (zh)
CN (2) CN102216925A (zh)
AU (1) AU2009291539B2 (zh)
CA (1) CA2737057A1 (zh)
WO (1) WO2010030982A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108604250A (zh) * 2016-05-23 2018-09-28 谷歌有限责任公司 识别内容项的类别并按照类别组织内容项以呈现的方法、系统和介质
CN110188340A (zh) * 2019-04-09 2019-08-30 国金涌富资产管理有限公司 一种研报文本实体名词自动识别方法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8219638B2 (en) 2008-12-15 2012-07-10 Google Inc. Editing information configured for use in selecting content regarding at least one content provider
US8190473B2 (en) * 2009-03-10 2012-05-29 Google Inc. Category similarities
US8625897B2 (en) * 2010-05-28 2014-01-07 Microsoft Corporation Foreground and background image segmentation
US8290968B2 (en) 2010-06-28 2012-10-16 International Business Machines Corporation Hint services for feature/entity extraction and classification
CN102810104B (zh) 2011-06-03 2015-05-20 阿里巴巴集团控股有限公司 信息调整方法及装置
US9069880B2 (en) * 2012-03-16 2015-06-30 Microsoft Technology Licensing, Llc Prediction and isolation of patterns across datasets
US9201954B1 (en) * 2013-03-01 2015-12-01 Amazon Technologies, Inc. Machine-assisted publisher classification
EP2974434A4 (en) * 2013-03-15 2016-11-02 Factual Inc APPARATUS, SYSTEMS AND METHODS FOR ANALYZING MOVEMENTS OF TARGET ENTITIES
US9697474B2 (en) * 2013-12-04 2017-07-04 Google Inc. Classification system
JP6365032B2 (ja) * 2014-07-08 2018-08-01 富士通株式会社 データ分類方法、データ分類プログラム、及び、データ分類装置
CN107180022A (zh) * 2016-03-09 2017-09-19 阿里巴巴集团控股有限公司 对象分类方法及装置
US11250339B2 (en) 2016-06-22 2022-02-15 The Nielsen Company (Us), Llc Ensemble classification algorithms having subclass resolution
US11120027B2 (en) * 2017-09-06 2021-09-14 Rovi Guides, Inc. Systems and methods for identifying a category of a search term and providing search results subject to the identified category

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006107314A1 (en) * 2005-03-30 2006-10-12 Google, Inc. Adjusting an advertising cost, such as a per-ad impression cost, using a likelihood that the ad will be sensed or perceived by users
US20070061328A1 (en) * 2005-09-14 2007-03-15 Jorey Ramer Managing sponsored content for delivery to mobile communication facilities
CN101322148A (zh) * 2005-09-16 2008-12-10 谷歌公司 允许具有不同价值主张的广告主向其表达价值主张的易适应广告系统

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6460036B1 (en) * 1994-11-29 2002-10-01 Pinpoint Incorporated System and method for providing customized electronic newspapers and target advertisements
JP4194697B2 (ja) * 1998-10-22 2008-12-10 株式会社野村総合研究所 分類ルール探求式クラスター分析装置
US20030191816A1 (en) * 2000-01-11 2003-10-09 Spoovy, Llc System and method for creating and delivering customized multimedia communications
US7478089B2 (en) * 2003-10-29 2009-01-13 Kontera Technologies, Inc. System and method for real-time web page context analysis for the real-time insertion of textual markup objects and dynamic content
JP2002215177A (ja) * 2001-01-22 2002-07-31 Casio Comput Co Ltd 音楽配信システム、音楽配信方法、記録媒体、及びプログラム
US20030074252A1 (en) * 2001-10-12 2003-04-17 Avenue A, Inc. System and method for determining internet advertising strategy
US7676507B2 (en) * 2002-01-11 2010-03-09 Enrico Maim Methods and systems for searching and associating information resources such as web pages
US7376714B1 (en) * 2003-04-02 2008-05-20 Gerken David A System and method for selectively acquiring and targeting online advertising based on user IP address
US20040260701A1 (en) * 2003-05-27 2004-12-23 Juha Lehikoinen System and method for weblog and sharing in a peer-to-peer environment
US7783777B1 (en) * 2003-09-09 2010-08-24 Oracle America, Inc. Peer-to-peer content sharing/distribution networks
US20050086109A1 (en) * 2003-10-17 2005-04-21 Mcfadden Jeffrey A. Methods and apparatus for posting messages on documents delivered over a computer network
US7428529B2 (en) * 2004-04-15 2008-09-23 Microsoft Corporation Term suggestion for multi-sense query
US7260568B2 (en) * 2004-04-15 2007-08-21 Microsoft Corporation Verifying relevance between keywords and web site contents
RU2406129C2 (ru) * 2005-04-25 2010-12-10 Майкрософт Корпорейшн Ассоциирование информации с электронным документом
US7734631B2 (en) * 2005-04-25 2010-06-08 Microsoft Corporation Associating information with an electronic document
US9286388B2 (en) * 2005-08-04 2016-03-15 Time Warner Cable Enterprises Llc Method and apparatus for context-specific content delivery
CN1991879B (zh) * 2005-12-29 2011-08-03 腾讯科技(深圳)有限公司 一种垃圾邮件的过滤方法
WO2007082094A2 (en) * 2006-01-11 2007-07-19 Freecarmen.Com Electronic media download and distribution using real-time message matching and concatenation
KR100792698B1 (ko) * 2006-03-14 2008-01-08 엔에이치엔(주) 시드를 이용한 광고 매칭 방법 및 광고 매칭 시스템
US7606810B1 (en) * 2006-04-27 2009-10-20 Colin Jeavons Editorial related advertising content delivery system
US20080114755A1 (en) * 2006-11-15 2008-05-15 Collective Intellect, Inc. Identifying sources of media content having a high likelihood of producing on-topic content
US20080221983A1 (en) * 2007-03-06 2008-09-11 Siarhei Ausiannik Network information distribution system and a method of advertising and search for supply and demand of products/goods/services in any geographical location
US8635106B2 (en) * 2007-07-11 2014-01-21 Yahoo! Inc. System for targeting data to users on mobile devices
US8126863B2 (en) * 2007-10-25 2012-02-28 Apple Inc. Search control combining classification and text-based searching techniques

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006107314A1 (en) * 2005-03-30 2006-10-12 Google, Inc. Adjusting an advertising cost, such as a per-ad impression cost, using a likelihood that the ad will be sensed or perceived by users
US20070061328A1 (en) * 2005-09-14 2007-03-15 Jorey Ramer Managing sponsored content for delivery to mobile communication facilities
CN101322148A (zh) * 2005-09-16 2008-12-10 谷歌公司 允许具有不同价值主张的广告主向其表达价值主张的易适应广告系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108604250A (zh) * 2016-05-23 2018-09-28 谷歌有限责任公司 识别内容项的类别并按照类别组织内容项以呈现的方法、系统和介质
CN108604250B (zh) * 2016-05-23 2023-09-19 谷歌有限责任公司 识别内容项的类别并按照类别组织内容项以呈现的方法、系统和介质
CN110188340A (zh) * 2019-04-09 2019-08-30 国金涌富资产管理有限公司 一种研报文本实体名词自动识别方法

Also Published As

Publication number Publication date
EP2347342A2 (en) 2011-07-27
AU2009291539B2 (en) 2015-11-26
JP5492897B2 (ja) 2014-05-14
WO2010030982A2 (en) 2010-03-18
AU2009291539A1 (en) 2010-03-18
US20100070339A1 (en) 2010-03-18
WO2010030982A3 (en) 2010-06-10
CN103927615B (zh) 2017-09-19
JP2012503235A (ja) 2012-02-02
CN102216925A (zh) 2011-10-12
EP2347342A4 (en) 2013-11-20
CA2737057A1 (en) 2010-03-18

Similar Documents

Publication Publication Date Title
CN103927615A (zh) 将实体与类别相关联
Demetriou A spatially based artificial neural network mass valuation model for land consolidation
AU2018200942A1 (en) Simplified tax interview
US20020091875A1 (en) Information-processing apparatus, information-processing method and storage medium
CN107077687A (zh) 获得与消费者有关的数据、处理所述数据并提供以电子方式生成的消费者报价的输出
Viet Nguyen et al. Informal Credit, Usury, or Support? A Case Study for V ietnam
García Rodríguez et al. Bidders recommender for public procurement auctions using machine learning: data analysis, algorithm, and case study with tenders from Spain
US20200357063A1 (en) Systems and computer-implemented processes for model-based underwriting
US20200364743A1 (en) Predictive recommendation system using tiered feature data
CN109615504A (zh) 产品推荐方法、装置、电子设备和计算机可读存储介质
CN113742492A (zh) 保险方案生成方法、装置、电子设备及存储介质
Khalifah et al. FDI productivity spillovers and the technology gap in M alaysia's electrical and electronic industries
Shabankareh et al. A stacking-based data mining solution to customer churn prediction
CN115375177A (zh) 用户价值评估方法、装置、电子设备及存储介质
Wu et al. Research on segmenting e-commerce customer through an improved k-medoids clustering algorithm
US20140330620A1 (en) Computer-implemented system and method for benchmarking, accounting, analysis, and cost forecasting
Okeahalam Bank branch location: A count analysis
Farruh Consumer life cycle and profiling: A data mining perspective
Leventhal Predictive Analytics for Marketers: Using Data Mining for Business Advantage
Situm et al. INTERNATIONALITY OF VALUE CHAIN ACTIVITIES AND THE EXPORT ORIENTATION OF MICRO-AND SMALL FAMILY BUSINESSES IN WESTERN AUSTRIA.
CN113407827A (zh) 基于用户价值分类的信息推荐方法、装置、设备及介质
US20170061548A1 (en) Advice engine
US20150254682A1 (en) Harmonized system number analysis
Hadden A customer profiling methodology for churn prediction
Samizadeh et al. Retaining customers using clustering and association rules in insurance industry: A case study

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: American California

Patentee after: Google limited liability company

Address before: American California

Patentee before: Google Inc.

CP01 Change in the name or title of a patent holder