CN101196923A - 基于分类的广告系统和方法 - Google Patents

基于分类的广告系统和方法 Download PDF

Info

Publication number
CN101196923A
CN101196923A CNA2007103051132A CN200710305113A CN101196923A CN 101196923 A CN101196923 A CN 101196923A CN A2007103051132 A CNA2007103051132 A CN A2007103051132A CN 200710305113 A CN200710305113 A CN 200710305113A CN 101196923 A CN101196923 A CN 101196923A
Authority
CN
China
Prior art keywords
classification
speech
web page
weight
page files
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007103051132A
Other languages
English (en)
Inventor
黄骐铉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OPMS CO Ltd
Original Assignee
OPMS CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OPMS CO Ltd filed Critical OPMS CO Ltd
Publication of CN101196923A publication Critical patent/CN101196923A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)

Abstract

本发明提供了一种基于分类的广告系统和方法。分析模块从多个网页文件中提取包含主要关键词的一个或多个网页文件。关键词提取模块提取包含在所提取的网页文件中的一个或多个单词。权重计算模块基于包含相应分类的主要关键词的网页文件上的词的显现特性来计算关于相应分类的每一个所提取的词的权重。分类匹配模块将一个或多个词设置为关联关键词,并生成将关联关键词与其权重相关联的一个或多个分类集合。广告匹配模块使用包含在相应网页文件和分类集合中的词确定每一个相应网页文件的分类,并且使广告客户的广告和相应的网页文件相匹配。

Description

基于分类的广告系统和方法
技术领域
本发明通常涉及一种基于分类的广告系统和方法,并且,更具体地涉及一种用于将与广告客户的兴趣分类相对应的内容与广告相关联的基于分类的广告系统和方法。
背景技术
存在许多情况,在这些情况下,网站上提供的例如新闻项目、博客以及检索结果网页等文件上(以下称为“网页文件”)经常包含广告。网页文件中包含的广告通常相应于网页文件中包含的关键词,并且以此为基础来显示。
例如,如果广告客户注册词“包”(“bag”)并为相应的词支付费用(广告费用),则将广告客户的广告与包含词“包”的网页文件结合,并且将相应的广告显示给观看相应网页文件的因特网用户。
然而,在该方法中,由于将广告与具体的词相匹配,因此存在在许多情况下无法执行合适的广告匹配的问题。例如,在网页文件中包含词“手提包”但不包含词“包”的情况下,不将注册词“包”的广告客户的广告与相应的网页文件结合。
此外,在网页文件的内容中包含由广告客户注册的词但相应网页文件的全部内容并不合适的这种情况下,不将广告与之结合是更可取的。例如,如图1所示,在新闻故事“凶手弃尸于包中”50中包含词“bag”51的情况下,不将广告客户的广告(包的广告)52与该新闻故事相匹配并且不提供该广告是更可取的。然而,当简单地通过匹配词执行广告时,正如现有技术那样,经常发生这样的问题。
为了解决该问题,韩国未经审查的公开号为10-2005-0058172的专利申请揭示了一种使用专用关键词的在线广告系统和方法,以使广告不与包含该专用关键词的、具有负面含义的内容结合。在韩国未经审查的公开号为10-2005-0058172的专利申请中,通过阻止广告客户的广告与包含专用关键词的内容结合来解决上述问题。此外,在韩国未经审查的公开号为10-2005-0058172的专利申请中,将内容和广告客户的广告分类,并且只有当内容和广告的分类相互匹配时才允许广告与相应的内容相结合。
例如,新闻故事“凶手弃尸于包中”包含在分类“社会/文化/新闻”中,而广告客户的广告包含在分类“购物/时尚/包”中,从而阻止广告和与其无关的分类中的新闻故事相结合。
这里,分类由广告经纪人设置并且被分级地划分,广告客户选择分类中的一个分类。然而,即使网页文件包含在与广告客户选择的分类不同的分类中,在这些网页文件中也可能存在多个适合于与广告客户的广告匹配的网页文件。韩国未经审查的公开号为10-2005-0058172的专利申请有一个问题:由于一些网页文件包含在不同的分类中,因此会阻止广告和那些网页文件结合。
在下面的描述中,将由广告客户选择的分类是分类“购物/时尚/包”,并且网页文件包含在分类“社会/文化/新闻”中或者分类“社会/文化/电影”中的这种情况作为例子。如果网页文件的内容直接涉及到包,例如,新闻的内容涉及包的趋势或者在电影内容中包是重要的,则将广告客户的广告与网页文件结合是可取的。然而,韩国未经审查的公开号为10-2005-0058172的专利申请有一个问题:由于由广告客户选择的分类和网页文件的分类不同,所以会阻止广告和那些网页文件结合。
另外,在因特网上已经出现了很多新杜撰词。然而,根据常规方法,无法基于这些词汇将广告和网页文件结合。
发明内容
因此,紧记出现在现有技术中的上述问题而做出本发明,并且本发明的目的是提供一种基于分类的广告系统和方法,该方法和系统用于分析网站上提供的文件(或内容)、用于分析分类和与分类关联的关键词以及用于将包含相应关联关键词的文件与广告相匹配,从而使广告效应最大化。
本发明的另一目的是提供一种基于分类的广告系统和方法,该方法和系统用于从文件中另外发现新的关联关键词,以及将新发现的关联关键词与广告客户的广告相关联,新的关联关键词包括相应于特定分类的关联关键词。
本发明的又一个目的是提供一种基于分类的广告系统和方法,该方法和系统用于为单一的分类设置多个关键词,使得广告客户能够选择到一个分类,从而增加为广告客户展示广告的机会。
本发明的另一个目的是提供一种基于分类的广告系统和方法,该方法和系统用于使在线内容和与其有紧密关系的广告结合,并为用户提供该在线内容。
为了实现上述目标,本发明提供了基于分类的广告系统,包含分析模块,用于从多个网页文件中提取一个或多个网页文件,每个网页文件都包含代表每个分类的主要关键词;关键词提取模块,用于提取包含在所提取的网页文件中的一个或多个词;权重计算模块,用于基于包含相应分类主要关键词的每个网页文件上的词的显现特性来计算关于相应分类的每一个所提取的词的权重;分类匹配模块,用于将满足在每一个相应分类中的预定标准的一个或多个词设置为相应分类的关联关键词,并生成一个或多个将关联关键词与关联关键词的权重相关联的分类集合;以及,广告匹配模块,用于使用包含在网页文件和分类集合中的词来确定每一个网页文件的分类,并将对该分类注册的广告客户的广告和相应的网页文件匹配。
此外,还提供了基于分类的广告方法,包含从多个文件中提取一个或多个网页文件,所述网页文件包含代表每一个分类的主要关键词;提取包含在所提取的网页文件中的一个或多个词;基于包含相应分类主要关键词的网页文件上的词的显现特性来计算每一个所提取的词的权重;将满足在每一相应分类中的预定标准的一个或多个词设置为关联关键词,并生成一个或多个将关联关键词与关联关键词的权重相关联的分类集合;以及,使用包含在每个网页文件和分类集合中的词来确定每一个相应网页文件的分类,并且将对该分类注册的广告客户的广告和相应的网页文件匹配。
显现特性包含每一个文件显现词的平均显现频率,以及使用显现的词的文件的数量与文件的总数的比率而计算的显现集中度。另外,当计算显现集中度时,权重计算模块为从关于每一个分类具有较高权重的网站中提取的网页文件中所包含的词分配较高的权重。此外,当计算显现集中度时,权重计算模块基于词的位置为每一个词分配不同的权重。词的位置是标题部分、正文部分以及文件的背景材料部分中的任一个,并且位置的权重按照标题部分、正文部分以及背景材料部分的顺序减小。
满足预定标准的每一个关联关键词具有等于或大于在相应分类集合中的预定等级的权重。此外,更适宜地将基本上只在一个分类中发现的独特的词设置为关于相应分类的关联关键词,并且具有最高的权重。
在本发明中,周期性地或者每当增加新的网页文件时更新分类集合。
根据本发明,当提取特定分类的文件时,可以提取不包含主关键词但包含满足预定参考值的关联关键词的相应分类的文件。即,可以提取按照权重的预定顺序分级的每一个包含关联关键词的文件,并且可以提取包含了基本上只在一个分类中发现的独特的词的每一个文件。
附图说明
从下面联系附图的具体描述,将更加清楚地理解本发明的以上的和其它的目的、特征和其它的优点,其中:
图1是示出传统的关键词广告示例的示图;
图2是概念性地示出根据本发明的基于分类的方法的示图;
图3是示出根据本发明的实施例的基于分类的广告系统的框图;
图4是概念性地示出了在两个或更多分类和单个词匹配的情况下的基于分类的广告方法的示图;
图5是示出了计算包含在两个或更多分类中的单个词的权重方法的示图;以及
图6是示出根据在文件中的词的位置为词分配不同权重的示例的示图。
具体实施方式
现在参考附图,其中,在不同的附图中使用相同的参考标号代表相同或相似的组件。
图2示出根据本发明的分类和关联关键词之间的关系的图示。
在示出的分类中,分类“饮食”(“diet”)包含例如“好身材”和“沙漏形身材”等关联关键词,分类“车辆保险”包含例如“交通事故”、“汽车修理中心”和“拖拉”等关联关键词。分类集合是一个或多个关联关键词的集合,并且,代表包含在单一分类中的关联关键词的主要关键词通常与分类的名称相符。即,分类“饮食”的主要关键词是“饮食”,其与分类的名称相同。
基于这样的分类结构,广告客户参考多个分类和在每一个分类中的关联关键词来选择会和广告客户自己的广告相关联的分类。
在根据本发明的基于分类的广告方法中,使用至少基于包含在相应文件中的词的分类集合,将一个或多个网页文件分类成特定的分类,并且将与各自分类相关联的广告客户的广告与相应的文件结合。当因特网用户请求与广告结合的文件时,就将与相应文件结合的广告显示给用户。
此外,根据本发明,周期性地或非周期性地更新分类集合中的每一个分类集合。例如,每当新注册了或周期性地注册了网页文件,就会分析已有的或新的网页文件,从相应网页文件中提取关联关键词,并且在已有关联关键词的基础上搜索连同已有关联关键词一起显示的附加关联关键词,并将附加关联关键词添加到相应的分类集合。因此,使用具有这样的循环结构的分析方法,不断地收集根据因特网上使用的语言的趋势而新产生的关联关键词。
因此,由于多个词,包括在特定分类中开始新近使用的词,对应于由广告客户选择的分类中的关联关键词,因此广告的显示次数增加,从而增加了广告的影响力。此外,由于将相应分类中包含的所有关键词与相应的广告匹配,因此用户可以观看与由用户所选择的文件的内容具有高关联度的广告。
图3是概念性地示出根据本发明实施例的基于分类的广告系统的框图。
根据本发明的基于分类的广告系统100包含分析模块110、关键词提取模块120、权重计算模块130、分类匹配模块140、数据库150以及广告匹配模块160。
分析模块110使用各自分类的主要关键词执行对网页文件的分析。首先,分析模块110从多个网页文件中取出一个或多个网页文件,每一个网页文件都包含代表分类的主要关键词。例如,在对分类“饮食”执行分析的情况下,从预定的网站中取出网页文件,每一个网页文件都包含词“饮食”,即,代表相应分类的主要关键词。
在此期间,除了包含主要关键词的文件,还可能进一步提取不包含主要关键词但包含根据重要性或权重以预定的顺序分级的关联关键词的文件,或在相应分类中包含的关联关键词之中的独特的词的文件,将在后面对独特的词进行描述。
关于每一个分类,关键词提取模块120对由分析模块110提取到的网页文件应用词素分析方法,并且提取在每一个网页文件中包含的一个或多个词。关键词提取模块120提取的词被提供给权重计算模块130。
权重计算模块130根据文件中的每一个所提取词的显现频率、显现集中度以及显现相应词的文件的数量,对相应分类计算由关键词提取模块120提取的每一个词的权重。
权重计算模块130可以包含显现集中度计算模块131、网站权重计算模块132、信任权重计算模块133、位置权重计算模块134、第一权重计算模块135,以及第二权重计算模块136。
显现集中度计算模块131基于词的显现频率(显现的次数)和显现词的文件的数量,来计算每一个显现的词的权重。
对于单一的分类,当显现相应词的文件的数量小但词的显现频率高时,显现集中度增加。否则,显现集中度减少。这是因为,在词只在特定领域经常显现的情况下,虽然显现词的文件的数量小,但是在显现的文件中该词的频率增加。在显现词的文件的数量大并且在各自文件中的显现的词的频率高的情况下,可以将相应的词确定为普通词。例如,在分类“牙科服务”中,经常显现例如“医生”、“医院”以及“护士”等词,并且显现这些词的文件的数量大,因此可以将这种词确定为在医学领域广泛使用的普通词。相反,尽管显现例如“植入”和“龋齿”等词的文件的数量相对较小,但是这些词经常显现在“牙科服务”分类中。因此,例如“植入”和“龋齿”等词很可能是“牙科服务”分类的关联关键词。因此,这些词具有较大的权重。
如上所述,将在有限数量的文件中集中显现词的频率称为“显现集中度”。与显现程度成比例地分配较高的权重。可使用例如下面的方程式来计算权重,该权重的值与显现集中度的增加成比例地增加:
权重=Nlog(TF/(iDF+1)),
其中,“N”表示每个文件的平均显现频率,“TF”表示将要分析的文件的数量,“iDF”表示发现了给定词的文件的数量。
如果假定关于第一分类的由分析模块110分析的文件的数量是一千万,在总共一千万个已分析的文件中的一万个文件中,发现了词“沙漏形身材”,并且在每个文件中平均五次使用词“沙漏形身材”,则词“沙漏形身材”的权重可计算如下:
5log(10,000,000/(10,000+1))2.49
如果假定关于第一分类的由分析模块110分析的文件的数量是一千万,在所分析的总共一千万文件中的三百万个文件中,发现了词“重量”,并且在每个文件中平均十次使用词“重量”,则词“重量”的权重可计算如下:
10log(10,000,000/(3,000,000+1))2.30
如上所述,根据本发明的权重计算方法,不仅仅因为词在多个文件中具有高的显现频率而为该词分配高的权重。根据本发明,集中显现在有限数量的文件中的词具有在分类中的较高的权重。
网站权重计算模块132基于包含相应词的文件的来源(网站)来增加/减少每个词的权重。为了该目的,关于每个网站,位置权重计算模块132基于在特定分类中的网页文件的显现程度,计算在相应网站的网页文件之中关于特定分类的每个网站的权重。据此,对于每个词,位置权重计算模块132将包含了具有相应词的网页文件的网站的网站权重与相应的词合并。
可以通过增加/减少在特定网站中的显现的词的显现频率来合并网站权重。例如,在计算分类“饮食”中的每个词的权重的情况下,可以使用例如增大1.5倍的频率来计算网站权重大于关于分类“饮食”的预定阈值的网站A中显现的词的显现集中度。即,如果在网站A中说了词“好身材”100次,则通过将词“好身材”作为已经出现了150次来计算显现集中度。另外,可以根据词在主要网站中出现的次数来计算网站权重,并且可以将计算出的网站权重与显现集中度计算模块131计算出的权重相乘。
位置权重计算模块134基于在每个文件中所收集的词的位置为词分配不同的权重。词的位置可以是标题部分、正文部分、以及背景材料部分中的一个位置,在此情况下,位置权重计算模块134按照标题部分>正文部分>背景材料部分的顺序为词分配权重。这将参考图6进行描述。
图6是示出根据词在文件中占据的位置来分配不同的权重的示例的示图。在图6所示的文件中,在标题部分61中写着词“model‘KANG NA YOUNG’”(“模特‘KANG NA YOUNG’”),在正文和背景材料部分65中显示词“diet”62和64。如图所示,尽管主要关键词“diet”存在于文件中,但是该文件的主要目的是宣扬在标题部分61中所示的“model‘KANG NA YOUNG’”,并且饮食只是附加的信息。因此,在所收集的词的位置与标题部分相对应的情况下,位置权重计算模块134为该词分配最高的权重;在词的位置与正文部分相对应的情况下,为该词分配次高的权重;在词的位置与背景材料部分相对应的情况下,为该词分配最低的权重。可以在计算相应词的频率时反映这样的权重。即,在假设出现在标题部分的词显现了两次并且出现在正文部分的词显现了一次时,可以计算相应词的显现频率。此外,可以基于词在标题部分中出现的程度来计算该权重并且可以将该权重与显现集中度计算模块131计算出的权重相乘。
信任权重计算模块133基于网站的可靠性来改变由显现集中度计算模块131计算出的权重。网站的可靠性可通过检查相应的网站是否在预定的领域中(例如,“饮食”领域)在预定的时间段被持续地管理来确定。
在从两个或多个分类中发现并收集到单个词的情况下,第一权重计算模块135和第二权重计算模块136确定包含了所收集的词的分类。
将参考图4对此进行描述。图4是概念性地示出在将两个或更多分类与单个词匹配的情况下的分类匹配方法的示图。图4所示的词“SCALES”(“秤”)既可属于分类“饮食”(为了说明和理解的方便,以下称为“第一分类”)又可属于分类“运动装备”(为了说明和理解的方便,以下称为“第二分类”)。
如果词“SCALES”作为由关键词提取模块120关于分类“饮食”来提取的关键词而存在,并且词“SCALES”也存在于分类“运动装备”中,则权重计算模块130将分类“饮食”设置为第一分类并且将分类“运动装备”设置为第二分类。如图5所示,由第一权重计算模块135计算用于词“SCALES”的第一分类的权重,而且由第二权重计算模块136计算用于词“SCALES”的第二分类的权重,并且将计算的结果传送到分类匹配模块140。
可选择地,可以对于各自的分类计算出具有两个或多个分类的词的权重,并且可以相互比较计算出的权重。据此,选择具有较大权重的分类作为相应词的分类,并且将选择结果传送到分类匹配模块140。
可选择地,可以在多个分类集合中包含同样的词。这种情况下,相应词的权重可因分类而不同。例如,词“SCALES”的权重在分类“饮食”中可以是5.2,而在分类“运动装备”中可以是3.1。
分类匹配模块140生成关于每一个分类的分类集合,在该分类集合中,满足相应分类中的预定标准的词与它们的权重相关联。分类匹配模块140可以包括关联关键词确定模块141和分类集合生成模块142。
关联关键词确定模块141参考权重计算模块130根据每个分类而提供的词的权重,将权重等于或大于预定参考值的每个词,或等级等于或大于预定等级的权重的每个词,设置为相应分类的关联关键词。例如,可以采用多种方法,如将权重等于或大于3的每个词设置为相应分类的关联关键词的方法,将最高权重的20个词设置为相应分类的关联关键词的方法,以及将权重值大于2并且在最高权重20之内的词设置为相应分类的关联关键词的方法,等等。
分类集合生成模块142基于在相应分类中具有高权重的关联关键词生成分类集合,并将该分类集合储存在数据库150中。分类集合是将关联关键词和它们的权重相互关联的数据。在包含在分类“饮食”中的关联关键词是“好身材”、“沙漏形身材”以及“肥胖的”并且它们的权重分别是9、8、和7的情况下,该分类集合表示将词“好身材”和权重9结合,将词“沙漏形身材”和权重8结合,以及将词“肥胖的”和权重7结合的信息。
同时,在使用主要关键词发现的词是仅在相应分类中发现的独特的词的情况下,分类匹配模块140可为该独特的词分配最高的权重。在高度专业化的术语的情况下,该术语只在特殊的分类中出现,但是这些词汇的显现频率不高。因此,尽管相应的词可以表示特殊的分类,但是它们的显现频率不高。从而,由于这些词的权重低,所以不可以将这些词注册为相应分类的关联关键词。为了防止该情况,分类匹配模块140为独特的词分配最高的权重。例如,词“肺纤维化”不经常被使用。但是,在包含该词的网页文件属于分类“肺病”的情况下,即使根据计算权重的上述方法将词“肺纤维化”的权重设置为低的值,但是如果将词“肺纤维化”确定为独特的词,则将词“肺纤维化”设置为最高的权重。确定独特的词的方法之一是:在普通分类中该词的显现频率几乎是0,而在特殊分类中该词的显现频率相对较高的情况下,确定该词是独特的词。
存储在数据库150中的分类集合被提供给分析模块110,分析模块110使用和分类集合结合的关联关键词来搜索与发现与关联关键词相关的新词。即,再次提取包含了具有较高权重的关联关键词的网页文件,并且对相应文件重复上述过程,从而不断地发现新创造的或从过时的每个分类中派生的关联关键词。
广告匹配模块160连接到门户网站、搜索网站以及其它的网站,广告匹配模块160将广告和上述网站中提供的网页文件相结合或者将广告和新生成的文件相结合,并且将结合的文件提供给网站。为了该目的,对于每个网页文件,广告匹配模块160使用在相应网页文件和分类集合中包含的词来确定相应网页文件的分类,并且匹配设置了相应网页文件的确定分类的广告客户的广告。即,广告匹配模块160从存储在数据库150中的分类集合中读取包含在网页文件中的关于每一分类的词(关联关键词)的每一个权重,并且将每个关联关键词的显现的次数和权重值相乘,从而计算出在每个分类中的总权重值。此外,将包含最高权重的分类设置为相应网页文件的分类,并且将提交了关于相应分类的广告的广告客户的广告和相应网页文件结合。
如上所述,从多个网站中提取包含了满足关于每一分类的预定标准的主要关键词或关联关键词的一个或多个网页文件,从这些网页文件中提取多个词,并且计算相应分类中每个词的权重。将权重值满足预定标准的词以及独特的词选择作为相应分类中的关联关键词,来与主要关键词一起形成分类集合。在分类集合形成后,周期性地或间断性地重复形成关联关键词的过程,从而可以适当地处理在相应分类中新生成的术语。使用如上所述形成的分类集合以将广告和网页文件相匹配。因此,在每个分类中将包含在网页文件中的词的权重彼此相加,结果是将具有最高值的分类设置为相应网页文件的分类,使得将对该分类注册的广告客户的广告和网页文件结合,从而使最适当的广告和网页文件匹配。
根据本发明,可以在因特网上的网页文件上显示与相应网页文件的内容最相关的广告。此外,如果选择了一个分类,可以合适地处理出现了与该分类相关的新术语的情况。
尽管为了说明的目的,已经公开了本发明的优选实施例,但是,本领域的普通技术人员将理解,在不偏离所附权利要求公开的本发明的范围和精神的情况下,各种修改、增加和替换都是有可能的。

Claims (26)

1.一种基于分类的广告系统,包括:
分析模块,用于从多个网页文件中提取一个或多个网页文件,每个网页文件都包含代表每个分类的主要关键词;
关键词提取模块,用于提取包含在所提取的网页文件中的一个或多个词;
权重计算模块,用于基于包含相应分类主要关键词的网页文件上的词的显现特性来计算关于相应分类的每一个所提取的词的权重;
分类匹配模块,用于将满足在每一个相应分类中的预定标准的一个或多个词设置为相应分类的关联关键词,并生成一个或多个将关联关键词与关联关键词的权重相关联的分类集合;以及
广告匹配模块,用于使用包含在网页文件和分类集合中的词来确定每一个网页文件的分类,并将对该分类注册的广告客户的广告和相应的网页文件匹配。
2.根据权利要求1的基于分类的广告系统,其中,显现特性包括每一个文件显现词的平均显现频率,以及使用显现的词的文件的数量与文件的总数量的比率而计算的显现集中度。
3.根据权利要求2的基于分类的广告系统,其中,当计算显现集中度时,权重计算模块为从关于每一个分类具有较高权重的网站中提取的网页文件中所包含的词分配较高的权重。
4.根据权利要求2的基于分类的广告系统,其中,当计算显现集中度时,权重计算模块基于词的位置为每一个词分配不同的权重。
5.根据权利要求4的基于分类的广告系统,其中,词的位置是标题部分、正文部分以及文件的背景材料部分中的任一个,并且位置的权重按照标题部分、正文部分以及背景材料部分的顺序减小。
6.根据权利要求1的基于分类的广告系统,其中,分类匹配模块将每个权重等于或大于在相应分类中的预定参考值的词确定为该相应分类的关联关键词。
7.根据权利要求1的基于分类的广告系统,其中,分类匹配模块为基本上只在一个分类中发现的独特的词分配关于该分类的最高的权重。
8.根据权利要求1的基于分类的广告系统,其中,基于分类的广告系统周期性地更新分类集合。
9.根据权利要求1的基于分类的广告系统,其中,每当增加新的网站时,基于分类的广告系统更新分类集合。
10.根据权利要求1的基于分类的广告系统,其中,每当增加新的网页文件时,基于分类的广告系统更新所述分类集合。
11.根据权利要求1的基于分类的广告系统,其中,分析模块提取包含关联关键词的一个或多个网页文件,所述关联关键词包含在分类集合中并且满足预定标准。
12.根据权利要求11的基于分类的广告系统,其中,满足预定标准的关联关键词包括具有等级等于或高于在相应分类集合中的预定等级的权重的关联关键词。
13.根据权利要求11的基于分类的广告系统,其中,满足预定参考值的关联关键词包括基本上只在一个分类中发现的独特的词。
14.一种基于分类的广告方法,包括:
从多个文件中提取一个或多个网页文件,所述网页文件包括代表每一个分类的主要关键词;
提取包含在所提取的网页文件中的一个或多个词;
基于包括相应分类主要关键词的网页文件上的词的显现特性来计算每一个所提取的词的权重;
将满足在每一相应分类中的预定标准的一个或多个词设置为关联关键词,并生成一个或多个将关联关键词与关联关键词的权重相关联的分类集合;以及
使用包含在每个网页文件和分类集合中的词来确定每一个相应网页文件的分类,并且将对该分类注册的广告客户的广告和相应的网页文件匹配。
15.根据权利要求14的基于分类的广告方法,其中,显现特性包括每一个文件显现词的平均显现频率,以及使用显现的词的文件的数量与文件的总数的比率而计算的显现集中度。
16.根据权利要求15的基于分类的广告方法,通过为从关于每一个分类具有较高权重的网站提取的网页文件中所包含的词分配较高的权重来计算显现集中度。
17.根据权利要求15的基于分类的广告方法,其中,当计算显现集中度时,基于词的位置为每一个词分配不同的权重。
18.根据权利要求17的基于分类的广告方法,其中,词的位置是标题部分、正文部分以及文件的背景材料部分中的任一个,并且位置的权重按照标题部分、正文部分以及背景材料部分的顺序减小。
19.根据权利要求14的基于分类的广告方法,进一步包括将每个权重等于或大于在相应分类中的预定参考值的词确定为该相应分类的关联关键词。
20.根据权利要求14的基于分类的广告方法,进一步包括将基本上只在一个分类中发现的独特的词设置为相应分类的关联关键词,并且为该独特的词分配最高的权重。
21.根据权利要求14的基于分类的广告方法,进一步包括周期性地更新分类集合。
22.根据权利要求14的基于分类的广告方法,进一步包括每当增加新的网站时,更新分类集合。
23.根据权利要求14的基于分类的广告方法,进一步包括每当增加新的网页文件时,更新分类集合。
24.根据权利要求14的基于分类的广告方法,进一步包括提取包含关联关键词的一个或多个网页文件,所述关联关键词包含在分类集合中并且满足预定标准。
25.根据权利要求24的基于分类的广告方法,其中,满足预定标准的关联关键词包括具有等级等于或高于在相应的分类集合中的预定等级的权重的关联关键词。
26.根据权利要求24的基于分类的广告方法,其中,满足预定基准的关联关键词包括基本上只在一个分类中发现的独特的词。
CNA2007103051132A 2006-11-28 2007-11-27 基于分类的广告系统和方法 Pending CN101196923A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020060118141 2006-11-28
KR20060118141A KR100863990B1 (ko) 2006-11-28 2006-11-28 카테고리 광고 시스템 및 방법

Publications (1)

Publication Number Publication Date
CN101196923A true CN101196923A (zh) 2008-06-11

Family

ID=39468017

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007103051132A Pending CN101196923A (zh) 2006-11-28 2007-11-27 基于分类的广告系统和方法

Country Status (4)

Country Link
KR (1) KR100863990B1 (zh)
CN (1) CN101196923A (zh)
TW (1) TW200832268A (zh)
WO (1) WO2008066261A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102483830A (zh) * 2009-09-04 2012-05-30 雅虎公司 广告显示更新与用户再访率的同步
CN101593200B (zh) * 2009-06-19 2012-10-03 淮海工学院 基于关键词频度分析的中文网页分类方法
CN103023747A (zh) * 2011-09-26 2013-04-03 网秦无限(北京)科技有限公司 基于消息内容的信息推荐方法和系统
CN103425680A (zh) * 2012-05-18 2013-12-04 阿里巴巴集团控股有限公司 页面展示广告的选取方法和系统
CN103577423A (zh) * 2012-07-23 2014-02-12 阿里巴巴集团控股有限公司 关键词分类方法及系统
CN104750754A (zh) * 2013-12-31 2015-07-01 北龙中网(北京)科技有限责任公司 网站所属行业的分类方法和服务器
CN104951448A (zh) * 2014-03-26 2015-09-30 北京雪球信息科技有限公司 一种为用户推送订阅类别的消息的方法和服务器
CN109377278A (zh) * 2018-10-24 2019-02-22 深圳市万屏时代科技有限公司 一种基于短语评分的广告投放方法、系统以及计算机存储介质
CN109544271A (zh) * 2018-10-24 2019-03-29 深圳市万屏时代科技有限公司 一种交易管理系统
CN111429188A (zh) * 2020-04-09 2020-07-17 湘潭大学 一种网页广告投放方法

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101012169B1 (ko) * 2008-10-23 2011-02-07 엔에이치엔비즈니스플랫폼 주식회사 연관 광고 통합을 기반으로 한 광고 제공 방법 및 그 시스템
KR101178208B1 (ko) * 2009-10-08 2012-08-29 동국대학교 산학협력단 키워드 추출 장치 및 방법
EP2577590A1 (en) * 2010-06-04 2013-04-10 AD Dynamo International (Pty) Ltd. Online advertising system and a method of operating the same
KR101379935B1 (ko) * 2013-02-04 2014-04-01 (주)레드테이블 메시지 정보 추출 시스템 및 그 방법
KR101515416B1 (ko) * 2014-05-28 2015-04-30 김수현 검색결과의 차등적 표시방법 및 표시시스템
KR102243286B1 (ko) * 2014-09-18 2021-04-22 경북대학교 산학협력단 데이터베이스 구축 방법, 이를 수행하기 위한 기록매체
KR101712588B1 (ko) 2015-09-10 2017-03-06 주식회사 디케이아이테크놀로지 광고 카테고리 생성 장치 및 방법
KR101791418B1 (ko) * 2016-02-15 2017-10-31 금오공과대학교 산학협력단 키워드 기반 블로그 마케팅을 위한 연관 키워드의 경쟁력 산출방법 및 산출 시스템
CN105894334A (zh) * 2016-04-28 2016-08-24 武汉斗鱼网络科技有限公司 一种动态管理网站广告位的方法和系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100493688B1 (ko) * 2003-01-08 2005-06-03 주식회사 옵투스 키워드확장장치 및 방법과 키워드확장장치를 이용한검색시스템
KR100671284B1 (ko) * 2004-09-17 2007-01-18 주식회사 코난테크놀로지 내용 기반 분류를 이용한 웹사이트 광고 제공 방법 및 그시스템
KR100786795B1 (ko) * 2005-03-25 2007-12-18 주식회사 다음커뮤니케이션 인터넷 광고 서비스 시스템 및 방법
KR100751560B1 (ko) * 2005-09-12 2007-08-27 (주)루크테크놀러지 키워드 광고 분석 시스템

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101593200B (zh) * 2009-06-19 2012-10-03 淮海工学院 基于关键词频度分析的中文网页分类方法
CN102483830B (zh) * 2009-09-04 2015-08-19 雅虎公司 广告显示更新与用户再访率的同步
CN102483830A (zh) * 2009-09-04 2012-05-30 雅虎公司 广告显示更新与用户再访率的同步
CN103023747A (zh) * 2011-09-26 2013-04-03 网秦无限(北京)科技有限公司 基于消息内容的信息推荐方法和系统
WO2013044769A1 (zh) * 2011-09-26 2013-04-04 北京网秦天下科技有限公司 基于消息内容的信息推荐方法和系统
CN103425680A (zh) * 2012-05-18 2013-12-04 阿里巴巴集团控股有限公司 页面展示广告的选取方法和系统
CN103425680B (zh) * 2012-05-18 2018-02-02 阿里巴巴集团控股有限公司 页面展示广告的选取方法和系统
CN103577423B (zh) * 2012-07-23 2016-12-07 阿里巴巴集团控股有限公司 关键词分类方法及系统
CN103577423A (zh) * 2012-07-23 2014-02-12 阿里巴巴集团控股有限公司 关键词分类方法及系统
CN104750754A (zh) * 2013-12-31 2015-07-01 北龙中网(北京)科技有限责任公司 网站所属行业的分类方法和服务器
CN104951448A (zh) * 2014-03-26 2015-09-30 北京雪球信息科技有限公司 一种为用户推送订阅类别的消息的方法和服务器
CN104951448B (zh) * 2014-03-26 2019-04-12 雪球(北京)技术开发有限公司 一种为用户推送订阅类别的消息的方法和服务器
CN109377278A (zh) * 2018-10-24 2019-02-22 深圳市万屏时代科技有限公司 一种基于短语评分的广告投放方法、系统以及计算机存储介质
CN109544271A (zh) * 2018-10-24 2019-03-29 深圳市万屏时代科技有限公司 一种交易管理系统
CN111429188A (zh) * 2020-04-09 2020-07-17 湘潭大学 一种网页广告投放方法

Also Published As

Publication number Publication date
KR100863990B1 (ko) 2008-10-16
WO2008066261A1 (en) 2008-06-05
TW200832268A (en) 2008-08-01
KR20080048149A (ko) 2008-06-02

Similar Documents

Publication Publication Date Title
CN101196923A (zh) 基于分类的广告系统和方法
Janssens et al. Hybrid clustering for validation and improvement of subject-classification schemes
Huai et al. Which environmental features contribute to positive and negative perceptions of urban parks? A cross-cultural comparison using online reviews and Natural Language Processing methods
Hillard et al. Improving ad relevance in sponsored search
Hockings et al. A systematic review of the predictive ability of the Orebro Musculoskeletal Pain Questionnaire
Pechlaner et al. A ranking of international tourism and hospitality journals
US7395222B1 (en) Method and system for identifying expertise
Kovacs et al. Minimal clinically important change for pain intensity and disability in patients with nonspecific low back pain
Littlewood et al. Epidemiology of rotator cuff tendinopathy: a systematic review
Hadley et al. Financial pressure and competition: changes in hospital efficiency and cost-shifting behavior
Bolton et al. Growing unequal? Changes in the distribution of earnings across Canadian cities
US8321278B2 (en) Targeted advertisements based on user profiles and page profile
Clark et al. A sentiment analysis of breast cancer treatment experiences and healthcare perceptions across twitter
KR101274419B1 (ko) 사용자 그룹별로 키워드의 순위를 결정하는 시스템 및 방법
WO2001025947A1 (en) Method of dynamically recommending web sites and answering user queries based upon affinity groups
Schiller et al. Trends in leadership at orthopedic surgery adult reconstruction fellowships
Hopfe et al. Capturing patients’ needs in casemix: a systematic literature review on the value of adding functioning information in reimbursement systems
Law et al. The popularity of prestigious hospitality journals: a Google Scholar approach
WO2020101477A1 (en) System and method for dynamic entity sentiment analysis
Yan Topic-based PageRank: Toward a topic-level scientific evaluation
Chansirinukor et al. Comparison of the functional rating index and the 18-item Roland-Morris Disability Questionnaire: responsiveness and reliability
CN112597398B (zh) 药品推荐模型应用方法及系统
Mcinerney et al. Assessing Website quality in context: Retrieving information about genetically modified food on the Web.
Bar-Ilan et al. Informetric theories and methods for exploring the Internet: An analytical survey of recent research literature
Forsythe-Brown et al. Kinship support in Jamaican families in the USA and Jamaica

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080611