CN102426572A - 一种对业务词条进行分类的方法和设备 - Google Patents
一种对业务词条进行分类的方法和设备 Download PDFInfo
- Publication number
- CN102426572A CN102426572A CN2011101870198A CN201110187019A CN102426572A CN 102426572 A CN102426572 A CN 102426572A CN 2011101870198 A CN2011101870198 A CN 2011101870198A CN 201110187019 A CN201110187019 A CN 201110187019A CN 102426572 A CN102426572 A CN 102426572A
- Authority
- CN
- China
- Prior art keywords
- entry
- speech
- service
- class
- professional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种对业务词条进行分类的方法和设备,其中该方法包括以下步骤:归纳各种行业类别及所述行业下各种业务类别,建立层级结构的业务分类体系;针对各层级的行业类别或业务类别,制定分别与所述各层级的行业类别或业务类别对应的一个或者多个种子词;将业务词条逐层与所述种子词进行匹配,以确定所述业务词条所属的业务类别。本发明的优点是,业务分类体系和精细的业务词条分类,可以指导用户建立合理的搜索引擎营销账户结构,以及帮助用户从该业务分类体系下轻松地找到与其业务类型相关的所有高价值的业务词条作为关键词,从而有效地提升该用户搜索引擎营销账户的营销效果。
Description
技术领域
本发明涉及计算机和网络技术领域,尤其涉及一种对业务词条进行分类的方法和设备。
背景技术
随着网络的日益普及,搜索引擎营销成为商家对其产品/服务(下文中称为“业务”)进行推广的重要手段之一。其中,搜索引擎营销是指基于搜索引擎平台的网络营销,利用网民对搜索引擎的依赖和使用习惯,在网民检索信息的时候尽可能将商家的营销信息传递给目标人群。通常的做法是,商家通过在搜索引擎营销系统内建立一个推广账户,在该推广账户内设置与其业务相关的关键词;当网民通过搜索引擎搜索其关注的业务时,一旦网民输入的搜索词与商家在搜索引擎营销账户系统内设定的关键词匹配,则在搜索结果网页中显示与该关键词相对应的商家的推广信息。
请参考图1,图1为现有技术中搜索引擎营销账户的结构示意图。现有的搜索引擎营销账户通常是多层级结构,即,商家在搜索引擎营销系统内的推广账户下面包含多个“推广计划”,如图1所示,推广账户下的“推广计划1”、“推广计划2”...“推广计划N”;每个“推广计划”下面又包含多个“推广单元”,以推广计划2为例,如图1所示,其下包含“推广单元1”、“推广单元2”...“推广单元M”;而每个“推广单元”下面又包含多个“关键词”和“创意”,以推广单元1为例,如图1所示,其下包含“关键词1”、“关键词2”...“关键词n”以及“创意1”、“创意2”...“创意m”。其中,推广计划是推广账户中最高的层级设置,对应于商家的推广项目;推广单元是推广计划下的层级,对应于推广项目中的具体的业务;关键词和创意是推广单元下的层级,其中,关键词是商家所设置的一系列与自身业务相关的词,用于和网民输入的搜索词进行匹配,一旦匹配,则向网民展示和网民搜索词相匹配的关键词所对应的业务的推广信息,即创意;创意包括标题、描述以及商家业务的相关网站地址。在同一推广单元下,为了表现业务的不同卖点,往往会存在多个创意,而且在商家撰写创意的时候,通常会在创意内使用通配符,当网友输入的搜索词与商家推广单元下的关键词相匹配时,则触发该关键词替代创意中的通配符,然后将包括具体关键词的创意呈现给网民。
以一礼品店的推广账户为例说明,该商家的推广账户下存在“生日礼品”、“商务礼品”以及“结婚礼品”三个推广计划,其中,“生日礼品”下存在两个推广单元分别对“鲜花”和“蛋糕”进行推广,每个推广单元下又会设定相应的关键词和创意。比如,推广单元“鲜花”下的关键词可能包括“鲜花”、“玫瑰花”、“康乃馨”、“网上订玫瑰花”,创意中使用了{鲜花}作为通配符,其具体内容如下:
标题:{鲜花}同城速递
描述:鲜花表心意,送她{鲜花}吧!
网址:www.lipin.com/xianhua
当网民通过搜索引擎搜索“玫瑰花”时,该搜索词与关键词“玫瑰花”匹配成功后,则触发商家在推广单元内的关键词“玫瑰花”,并用该关键词“玫瑰花”替代创意中的通配符,然后在搜索结果页面中向网民展现该创意,其展现内容如下:
标题:玫瑰花同城速递
描述:鲜花表心意,送她玫瑰花吧!
网址:www.lipin.com/xianhua
网民看到该创意后,可以通过点击创意中的网址进入该商家关于鲜花的网页,具体查看其鲜花产品。
目前商家在使用搜索引擎营销账户系统时会遇到以下问题:
1)商家在搜索引擎营销账户系统中建立的推广账户结构不科学,导致在搜索结果页面中展现的推广信息不通顺,从而影响推广效果。仍以上述礼品店的推广单元为例,当网民通过搜索引擎搜索“网上订玫瑰花”时,该搜索词与推广单元“鲜花”下关键词“网上订玫瑰花”匹配成功后,则触发商家在推广单元内的关键词“网上订玫瑰花”,并用该关键词“网上订玫瑰花”替代创意中的通配符,然后在搜索结果中向网民展现该创意,其展现内容如下:
标题:网上玫瑰花同城速递
描述:鲜花表心意,送她网上订玫瑰花吧!
网址:www.lipin.com/xianhua
可以很明显地看出,该创意的描述部分不通顺,读起来比较拗口,并不能引发网民的兴趣,从而很可能导致网民不再进一步关注该商家的玫瑰花。由此可见,由于该商家在设计推广单元时,提交了不同意义、结构的关键词,导致其推广单元结构不合理,从而带来了创意不通顺的问题,使网民的体验不好,进而导致最终的推广效果不好。
2)商家虽然清楚其业务类型,但是在其具体创建关键词的时候,往往不是非常清楚应该提什么类型的关键词才适合,而且,即使商家为其业务创建了关键词,通常也难以保证其创建的关键词的效果。商家自己创建的关键词很可能不符合网民的检索习惯,比如,关键词过于专业,或者创建的关键词质量不高,不能充分体现商家自身业务的特点,从而导致商家的推广账户内往往会存在一些关键词的检索量很低,影响推广的效果。
3)面对种类繁多的业务,商家在建立搜索引擎营销账户时容易发生遗漏,从而导致搜索引擎营销账户无法全面覆盖其所有的业务范围。随着商家业务的多元化,商家需要进行推广的业务种类往往多达十几、几十种种,甚至是上百种,如果商家为其业务逐一建立推广单元并设定关键词,不但在建立的过程中需要花费较多时间,还容易发生一些业务的遗漏,无法达到预期的推广效果。
随着搜索引擎营销的发展,商家发现搜索引擎营销账户结构设计的合理性以及账户内关键词价值的高低,对其业务的推广效果起到了关键性的作用,所以,越来越多的需求显示,商家希望可以在一定指导下建立合理的账户结构,同时,在选择关键词的时候,商家希望只需要根据其自身的业务类型,就可以便捷地找到和该业务类型相关的所有高价值的关键词。
为了解决上述问题,亟需提供一种对业务词条进行分类的方法,通过筛选高价值的业务词条,并将这些业务词条根据其所属的行业及业务类型进行精细地分类,形成业务分类体系,商家(下文中称为“搜索引擎营销账户系统用户”)只需根据该业务分类体系中行业及业务的分类,就可以轻松为自己建立科学的推广账户结构,也只需按照其自身的业务类型就可以从该业务分类体系中快速挑选出所有高价值的业务词条作为关键词,从而有效地提升营销效果。
发明内容
本发明的目的是提供一种解决上述问题的对业务词条进行分类的方法和设备。
根据本发明的一个方面,提供了一种对业务词条进行分类的方法,该方法包括以下步骤:
归纳各种行业类别及所述行业下各种业务类别,建立层级结构的业务分类体系;
针对各层级的行业类别或业务类别,制定分别与所述各层级的行业类别或业务类别对应的一个或者多个种子词;
将业务词条逐层与所述种子词进行匹配,以确定所述业务词条所属的业务类别。
根据本发明的另一个方面,还提供了一种对业务词条进行分类的设备,包括:
体系建立装置,用于归纳各种行业类别及所述行业下各种业务类别,建立层级结构的业务分类体系;
种子词制定装置,用于针对各层级的行业类别或业务类别,制定分别与所述各层级的行业类别或业务类别对应的一个或者多个种子词;
词条匹配装置,用于将业务词条逐层与所述种子词进行匹配,以确定所述业务词条所属的业务类别。
与现有技术相比,本发明具有以下优点:业务分类体系和精细的业务词条分类,可以指导搜索引擎营销账户系统用户建立合理的搜索引擎营销账户结构,以及帮助该用户从该业务分类体系下轻松地找到与其业务类型相关的所有高价值的业务词条作为关键词,从而有效地提升该用户搜索引擎营销账户的营销效果。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为现有技术中搜索引擎营销账户的结构示意图;
图2为根据本发明一个实施例对业务词条进行分类的方法流程图;
图3为根据本发明一个实施例示出的业务分类体系结构示意图;
图4为根据本发明一个实施例对业务分类体系各层级的种子词制定的方法流程图;
图5为根据本发明一个实施例确定业务词条所属的业务类别的方法流程图;
图6为根据本发明另一个实施例对业务词条进行分类的方法流程图;以及
图7为根据本发明一个实施例对业务词条进行分类的设备示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
首先请参考图2,图2为根据本发明一个实施例对业务词条进行分类的方法流程图。如图所示,该方法包括以下步骤:
在步骤S201中,归纳各种行业类别及所述行业下各种业务类别,建立层级结构的业务分类体系;
具体地,通过分析搜索引擎营销账户系统用户设定的关键词、以及网民的搜索需求,并基于现有的行业分类标准(例如国民经济行业分类),对搜索引擎营销账户系统用户所属的行业类别和业务类别、以及网民的搜索需求所属的行业类别和业务类别进行归纳,其中行业类别可以划分为多个层级,行业类别下的业务类别也可以划分为多个层级,然后根据行业类别以及所述行业下的业务类别,相应建立起具有层级结构的业务分类体系,以覆盖互联网用户(所述互联网用户包括搜索引擎营销账户系统用户以及网民)可能涉及到行业类别以及业务类别。
在本实施例中,业务分类体系共分为5个层级,第一层级为一级行业、第二层级为二级行业、第三层级为一级业务、第四层级为二级业务以及第五层级为业务点。其中一级行业指行业大类、二级行业指行业的具体类目,一级业务指业务的大类,二级业务指具体的业务类型,业务点为业务的具体需求。请参考图3,并以一级行业“教育培训”为例对所述业务分类体系进行说明,一级行业“教育培训”下面包括“学前教育”、“初等教育”、“中等教育”、“高等教育”、“特殊教育”以及“职业教育”共6个二级行业,是对一级行业“教育培训”的进一步分类;其中,以二级行业“职业教育”为例,其下面又包括“安全员类”、“按摩类”、“保健师类”、“保育员类”、“会计类”、“律师类”、“报关员类”等多个一级业务;以一级业务“报关员类”为例,其下面又包括“报关员考试”、“报关员培训”、以及“报关员资格证“等二级业务;以二级业务“报关员培训”为例,其下面包括“报关员培训班”、“报关员培训网站”、“报关员培训网站课程”以及“报关员培训学校”4个具体的业务点。对于其他行业类别以及该行业下的业务类别都可以按照上述业务分类体系的层级结构进行分类,在此不再一一列举说明。
在建立起具有层级结构的业务分类体系后,搜索引擎营销账户系统用户可以根据其具体的业务、以及其业务所属的行业,在所述业务分体系中自上而下逐层找到相应的业务点。由于所述业务分类体系覆盖了互联网用户可能涉及到的行业类别以及业务类别,并且以现有的行业分类标准为基准,所以具有一定的科学性。那么搜索引擎营销账户系统用户可以直接以所述业务分类体系为标准,建立其推广账户,其中,所述业务分类体系的一级业务或二级业务可以对应至用户推广账户中的推广计划,而具体的业务点可以对应至推广单元,如此一来,搜索引擎营销账户系统用户便可以轻松地建立科学的推广账户结构。例如,一搜索引擎营销账户系统用户涉及“报关员培训”的相关业务,那么所述用户在建立其搜索引擎营销账户的时候,可以参考业务分类体系,通过“教育培训”→“职业教育”→“报关员类”→“报关员培训”这条路径,找到和自己相对应具体业务点,然后只需对照业务分类体系中的业务分类,即可建立推广计划“报关员培训”以及相关的推广单元,如“报关员培训班”、“报关员培训网站”等。
本领域技术人员应能理解上述具有5个层级结构的业务分类体系仅为举例,其他现有的或今后可能出现的具有层级结构的业务分类体系如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S202中,针对各层级的行业类别或业务类别,制定分别与所述各层级的行业类别或业务类别对应的一个或者多个种子词;
请参考图4,图4为根据本发明一个实施例对业务分类体系各层级的种子词制定的方法流程图。如图所示,在步骤S2021中,对各层级的所述行业类别或业务类别的样本词条进行第一切词;具体地,首先根据业务分类体系建立一个样本词库,所述样本词库中包括一定数量的样本词条,且所述样本词条已经被预先分配至各业务点下面;然后自上而下对业务分类体系中各层级中的行业类别或者业务类别所对应的样本集中的样本词条进行第一切词。本实施例中,仍以上述具有5个层级结构的业务分类体系为例说明,如果制定第二层级中二级行业“职业教育”的种子词,需要将“职业教育”下所包括的所有业务点下的所有样本词条作为一个样本集,从中获取二级行业“职业教育”的种子词;如果制定第五层级中某个具体业务点的种子词,则只需将该业务点下面的所有样本词条作为一个样本集。在对样本集中的样本词条进行第一切词前,可以先去除样本词条中例如代词、副词、助词、连词等非关键字/词,然后根据汉语的基本文法以及语言习惯对样本词条剩下的部分进行第一切词,以获取第一切词结果。以对业务词条“报关员的考试”为例进行第一切词,首先去掉助词“的”,然后将该业务词条分解为“报关员”和“考试”两个词条。上述切词的具体方法为本领域技术人员所公知的方法,在此不在赘述。
在步骤S2022中,对所述第一切词结果进行统计,获取所述第一切词结果中词频高于一阈值的高频词条;具体地,在对某一行业类型或某一业务类型的样本集进行第一切词、并获取第一切词结果后,对所述第一切词结果中词条出现的频率(即词频)进行统计,并将词频高于一预定阈值的词条作为高频词条挑选出来。
在步骤S2023中,对所述高频词条进行筛选,选择具有区分度的所述高频词条作为所述行业类别或业务类别的种子词;具体地,对基于统计挑选出来的所述高频词条进行筛选,选择具有区分度的高频词条,即,既可以表现出与其相对应的行业类别或业务类别的特性、又可以对与其相对应的行业类别或业务类别和其他行业类别或业务类别进行区分的高频词条,然后将所述具有区分度的高频词条作为与其相对应的行业类别或业务类别的种子词,当其他业务词条进行行业类别或业务类别分配时,可以将所述种子词作为标准,凡是具有和所述种子词相同或相近特征的业务词条,均可被分配至与所述种子词相对应的行业类别或业务类别。由于种子词具有一定的区分度,所以可以保证业务词条分配的准确性。对于某一行业类别或某一业务类别,至少存在一个种子词,通常情况下会存在多个种子词。对于某一行业类别或某一业务类别来说,种子词是对所述行业类别或所述业务类别的具体特征的反映;而在同一层级下,对于不同行业类别或不同业务类别来说,种子词是对不同行业类别或不同业务类别的特征差异的反映。所以,对于同一层级下不同行业类别或不同业务类别来说,各行业类别或各业务类别的种子词通常是互不相同的。本实施例中,仍以上述具有5个层级结构的业务分类体系为例说明,对于“报关员培训班”和“报关员培训网站”两个业务点来说,通过分析其下面的样本集,可以得到业务点“报关员培训班”样本集中的高频词条包括“报关员”、“培训班”、“辅导班”,业务点“报关员培训网站”样本集中的高频词条包括“报关员”、“网站”、“站点”、“网页”,为了体现这两个业务点的区分度,应该选择“培训”和“辅导”为业务点“报关员培训”的种子词,以及选择“网站”、“站点”和“网页”为业务点“报关员培训网站”的种子词,而高频词条“报关员”由于是两个业务点都具有的共同特性,所以不能作为这两个业务点的种子词。
在步骤S2024中,确定各层级所述种子词的权重值;具体地,在后续在同一层级内将业务词条与种子词进行匹配的步骤中,会出现业务词条包括多个种子词且所述种子词又分别隶属于不同行业类别或业务类别的情况,其中,同一业务词条恰好可以属于不同行业类别或业务类别的情况是存在的,但是大部分业务词条还是仅仅属于某一行业类别或业务类别,所以,仅靠通过判断所述业务词条包括哪些种子词是无法准确地将业务词条进行分类。在这种情况下,需要对种子词的权重值进行标注,以权重值的大小来进一步确定所述业务词条应该属于哪个种子词所对应的行业类别或业务类别。对种子词权重值标注的具体方法如下:在对同一层级内的行业类别或业务类别的种子词的权重值进行标注前,首先从所述层级内行业类别或业务类别的样本集中,选择出一定数量的样本词条,这些样本词条均包括两个或两个以上的种子词,且所述种子词分别隶属于不同的行业类别或业务类别;然后,以这些样本词条所属的行业类别或业务类别为依据,对这些样本词条所包括的多个种子词的权重值进行标注,其中,与这些样本词条所属的行业类别或业务类别相对应的种子词的权重值大于其他种子词的权重值。举例来说,当对同一层级的业务类别的种子词A和种子词B进行权重值标注的时候,选择一定数量的既包括种子词A又包括种子词B的样本词条,对所述样本词条所属的业务类别进行统计,发现大部分所述样本词条都属于种子词B所对应的业务类别,那么可以认为在后续对业务词条分类的步骤中,如果待分类的业务词条同时包括种子词A和种子词B,那么所述业务词条被分配至种子词B所对应的业务类别下的可能性较大,所以对种子词A和种子词B的权重值进行标注时,使种子词B的权重值大于种子A的权重值。对业务词条进行行业类别或业务类别分类的时候,以所述具有权重值的种子词作为与其相对应的行业类别或业务类别的标准,将可以保证业务词条分类的准确性。
在步骤S203中,将业务词条逐层与所述种子词进行匹配,以确定所述业务词条所属的业务类别。
请参考图5,图5为根据本发明一个实施例确定业务词条所属的业务类别的方法流程图。如图所示,在步骤S3011中,对所述业务词条进行第二切词,获取第二切词结果;具体地,首先将待分配的业务词条进行第二切词,其中,所述第二切词采用与上述第一切词相同的方法,将待分配的业务词条进行分解,并取得第二切词结果。
在步骤S3012中,将所述第二切词结果逐层与所述行业类别或业务类别的种子词进行比较,确定所述第二切词结果包含的权重值最高的种子词所对应的行业类别或业务类别;具体地,将第二切词结果中的词条自上而下地与各层级中行业类别或业务类别的种子词一一进行比较,确定所述第二切词结果中的词条所包含的种子词所对应的行业类别或业务类别。仍以上述具有5个层级结构的业务分类体系为例说明,当一业务词条经过第二切词并获取第二切词结果后,首先将所述第二切词结果中的词条与一级行业中各行业大类的种子词进行匹配,确定所述业务词条所属的一级行业;然后将所述第二切词结果中的词条与所述一级行业下的二级行业中的具体行业类目的种子词进行匹配,确定所述业务词条所属的二级行业;接着,依次确定所述业务词条所属的一级业务、二级业务以及业务点。
当所述第二切词结果中包含同一层级中属于不同行业类别或不同业务类别的种子词时,则将权限值最高的种子词所对应的行业类别或业务类别作为所述业务词条所属的行业类别或业务类别。
当所述第二切词结果中包含同一层级中属于不同行业类别或不同业务类别的种子词、且多个种子词的权重值相等,则可以随机将任一种子词所对应的行业类别或业务类别作为所述业务词条所属的行业类别或业务类别,或者将各种子词所对应的行业类别或业务类别均作为所述业务词条所属的行业类别或业务类别。
在步骤S3013中,将所述业务词条分配至其所属的业务类别;具体地,当最终确定了所述业务词条所属的具体业务点后,将所述业务词条分配至所述业务点下。同一个业务词条可能只存在于一个业务点下,也可能同时存在多个业务点下。
图6为根据本发明另一个实施例对业务词条进行分类的方法流程图。图6中所示的步骤S501、S502以及S504分别与前面参照图2所描述的步骤S101、S102以及S103的内容相同,为简明起见,在此不再赘述。如图6所示,在步骤S501中,归纳各种行业类别及所述行业下各种业务类别,建立层级结构的业务分类体系;
在步骤S502中,针对各层级的行业类别或业务类别,制定分别与所述各层级的行业类别或业务类别对应的一个或者多个种子词;
在步骤S503中,基于互联网选取具有高价值的词条作为所述业务词条;具体地,业务词条的来源通常有两个途径:搜索引擎营销系统用户所设定的关键词以及网民通过互联网搜索引擎输入的搜索词。为了保证业务分类体系下的业务词条都具有高价值,在收集所述关键词以及搜索词后,首先会根据一定的标准对所述关键词以及搜索词进行筛选,筛选的具体标准可以根据所述关键词以及搜索词的属性数据,其中关键词的属性数据包括消费、平均点击价格、点击量、日均浏览量、点击率、展现量、转化等可以体现推广效果的数据,搜索词的属性数据包括日均搜索量等可以体现网民关注度的数据。根据所述关键词以及搜索词的属性数据,可以筛选出推广效果好的、网民关注度高的词条作为业务分类体系下的业务词条,从而保证所述业务词条被搜索引擎营销账户系统用户作为关键词后具有良好的推广效果。例如,可以选择日均浏览量大于50次的关键词以及日均搜索量大于50次的搜索词作为业务词条。
在步骤S504中,将所述业务词条逐层与所述种子词进行匹配,以确定所述业务词条所属的业务类别;
在步骤S505中,对各所述业务类别下的业务词条进行结构分析,并将结构相同或结构相近的所述业务词条划分至同一单元下;具体地,在将所述业务词条分配至其所述的业务类别下之后,可以进一步对业务点下的业务词条的结构进行分析,其中,业务词条的结构主要存在以下几类:
对业务词条结构进行分析的目的在于,搜索引擎营销账户系统用户在挑选具有不同结构的业务词条作为其推广账户下的关键词后,可以有针对性地撰写带有通配符的创意。当网民输入的搜索词触发搜索引擎营销账户系统用户在推广账户内的关键词的时候,所述关键词将替代创意内的通配符,然后将包括具体关键词的创意展现给网民。创意的通顺与否,与创意中替代通配符的关键词的结构有关,例如,名词结构的关键词替代创意中的通配符后,所述创意很通顺,但是用疑问结构的关键词去替代所述创意中的通配符,就有可能会导致所述创意无法连贯。所以,搜索引擎营销账户系统用户选择同一单元下具有相同结构的业务词条作为关键词后,可以针对所述单元内的业务词条撰写创意,从而保证创意在展现时候的通顺连贯,如此一来,不但可以使推广账户结构更加科学,还可以使网民体验好。
可选地,当结构相近的业务词条适用于同一个创意的时候,也可以将所述业务词条划分至同一单元下。例如,名词结构的业务词条和偏正结构的词条在创意撰写时无差异,所以在对业务词条的结构进行分析后,可以将名词结构和偏正结构的两种业务词条划分至同一单元内。
在根据业务词条的结构将业务点下的业务词条划分至不同单元后,业务点及其下面的单元可以共同对应至用户推广账户内的推广单元,即,用户在建立其推广账户的时候,无需根据其业务自己建立相应的推广单元,而只需在业务分类体系中找到和其相对应的具体业务点,然后将所述业务点以及其下面的所有单元一同作为其推广单元,就可以快速完成推广单元的建立。
在步骤S506中,根据各所述业务类别下业务词条的属性数据,对所述业务词条进行排序;具体地,当根据词条结构将业务点下的业务词条划分至不同单元后,可以对业务词条以及与业务词条相对应的具体属性数据进行显示,同时还可以根据业务词条的属性数据对各单元内的业务词条进一步进行排序,例如,根据业务词条的日均浏览量降序排列,使搜索引擎营销账户系统用户在以单元为单位选择业务词条作为其账户关键词的时候,可以非常直观地看到单元内所有业务词条的推广效果,从而便于搜索引擎营销账户系统用户做出选择。
图7为根据本发明一个实施例对业务词条进行分类的设备示意图。如图所示,该设备包括体系建立装置61、种子词制定装置62、词条匹配装置63、结构分析装置64以及排序装置65。
其中,所述体系建立装置61,用于归纳各种行业类别及所述行业下各种业务类别,建立层级结构的业务分类体系;
具体地,所述体系建立装置61通过分析搜索引擎营销账户系统用户设定的关键词、以及网民的搜索需求,并基于现有的行业分类标准(例如国民经济行业分类),对搜索引擎营销账户系统用户所属的行业类别和业务类别、以及网民的搜索需求所属的行业类别和业务类别进行归纳,其中行业类别可以划分为多个层级,行业类别下的业务类别也可以划分为多个层级,然后所述体系建立装置61根据行业类别以及所述行业下的业务类别,相应建立起具有层级结构的业务分类体系,以覆盖互联网用户(所述互联网用户包括搜索引擎营销账户系统用户以及网民)可能涉及到行业类别以及业务类别。
在本实施例中,业务分类体系共分为5个层级,第一层级为一级行业、第二层级为二级行业、第三层级为一级业务、第四层级为二级业务以及第五层级为业务点。其中一级行业指行业大类、二级行业指行业的具体类目,一级业务指业务的大类,二级业务指具体的业务类型,业务点为业务的具体需求。下面以一级行业“教育培训”为例对所述业务分类体系进行说明,一级行业“教育培训”下面包括“学前教育”、“初等教育”、“中等教育”、“高等教育”、“特殊教育”以及“职业教育”共6个二级行业,是对一级行业“教育培训”的进一步分类;其中,以二级行业“职业教育”为例,其下面又包括“安全员类”、“按摩类”、“保健师类”、“保育员类”、“会计类”、“律师类”、“报关员类”等多个一级业务;以一级业务“报关员类”为例,其下面又包括“报关员考试”、“报关员培训”、以及“报关员资格证“等二级业务;以二级业务“报关员培训”为例,其下面包括“报关员培训班”、“报关员培训网站”、“报关员培训网站课程”以及“报关员培训学校”4个具体的业务点。对于其他行业类别以及该行业下的业务类别都可以按照上述业务分类体系的层级结构进行分类,在此不再一一列举说明。
所述体系建立装置61在建立起具有层级结构的业务分类体系后,搜索引擎营销账户系统用户可以根据其具体的业务、以及其业务所属的行业,在所述业务分体系中自上而下逐层找到相应的业务点。由于所述业务分类体系覆盖了互联网用户可能涉及到的行业类别以及业务类别,并且以现有的行业分类标准为基准,所以具有一定的科学性。那么搜索引擎营销账户系统用户可以直接以所述业务分类体系为标准,建立其推广账户,其中,所述业务分类体系的一级业务或二级业务可以对应至用户推广账户中的推广计划,而具体的业务点可以对应至推广单元,如此一来,搜索引擎营销账户系统用户便可以轻松地建立科学的推广账户结构。例如,一搜索引擎营销账户系统用户涉及“报关员培训”的相关业务,那么所述用户在建立其搜索引擎营销账户的时候,可以参考业务分类体系,通过“教育培训”→“职业教育”→“报关员类”→“报关员培训”这条路径,找到和自己相对应具体业务点,然后只需对照业务分类体系中的业务分类,即可建立推广计划“报关员培训”以及相关的推广单元,如“报关员培训班”、“报关员培训网站”等。
本领域技术人员应能理解上述具有5个层级结构的业务分类体系仅为举例,其他现有的或今后可能出现的具有层级结构的业务分类体系如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
所述种子词制定装置62,用于针对各层级的行业类别或业务类别,制定分别与所述各层级的行业类别或业务类别对应的一个或者多个种子词。所述种子词制定装置62包括第一切词单元621、词频统计单元622、种子词确定单元623、权重确定单元624;
其中,所述第一切词单元621,用于对各层级的所述行业类别或业务类别的样本词条进行第一切词;
具体地,所述第一切词单元621对业务分类体系的样本词库中的样本词条进行第一切词,其中,所述样本词库中包括一定数量的样本词条,且所述样本词条已经被预先分配至各业务点下面。所述第一切词单元621自上而下对业务分类体系中各层级中的行业类别或者业务类别所对应的样本集中的样本词条进行第一切词。本实施例中,仍以上述具有5个层级结构的业务分类体系为例说明,如果所述种子词制定装置62制定第二层级中二级行业“职业教育”的种子词,需要将“职业教育”下所包括的所有业务点下的所有样本词条作为一个样本集,从中获取二级行业“职业教育”的种子词;如果所述种子词制定装置62制定第五层级中某个具体业务点的种子词,则只需将该业务点下面的所有样本词条作为一个样本集。在对样本集中的样本词条进行第一切词前,所述第一切词单元621可以先去除样本词条中例如代词、副词、助词、连词等非关键字/词,然后根据汉语的基本文法以及语言习惯对样本词条剩下的部分进行第一切词,以获取第一切词结果。以对业务词条“报关员的考试”为例进行第一切词,所述第一切词单元621首先去掉助词“的”,然后将该业务词条分解为“报关员”和“考试”两个词条。上述切词的具体方法为本领域技术人员所公知的方法,在此不在赘述。
所述词频统计单元622,用于对所述第一切词结果进行统计,获取所述第一切词结果中词频高于一阈值的高频词条;
具体地,在所述第一切词单元621对某一行业类型或某一业务类型的样本集进行第一切词、并获取第一切词结果后,所述词频统计单元622对所述第一切词结果中词条出现的频率(即词频)进行统计,并将词频高于一预定阈值的词条作为高频词条挑选出来。
所述种子词确定单元623,用于对所述高频词条进行筛选,选择具有区分度的所述高频词条作为所述行业类别或业务类别的种子词;
具体地,对基于所述词频统计单元622统计挑选出来的所述高频词条进行筛选,种子词确定单元623选择具有区分度的高频词条,即,既可以表现出与其相对应的行业类别或业务类别的特性、又可以对与其相对应的行业类别或业务类别和其他行业类别或业务类别进行区分的高频词条,然后种子词确定单元623将所述具有区分度的高频词条作为与其相对应的行业类别或业务类别的种子词。当其他业务词条进行行业类别或业务类别分配时,可以将所述种子词作为标准,凡是具有和所述种子词相同或相近特征的业务词条,均可被分配至与所述种子词相对应的行业类别或业务类别。由于种子词具有一定的区分度,所以可以保证业务词条分配的准确性。对于某一行业类别或某一业务类别,至少存在一个种子词,通常情况下会存在多个种子词。对于某一行业类别或某一业务类别来说,种子词是对所述行业类别或所述业务类别的具体特征的反映;而在同一层级下,对于不同行业类别或不同业务类别来说,种子词是对不同行业类别或不同业务类别的特征差异的反映。所以,对于同一层级下不同行业类别或不同业务类别来说,各行业类别或各业务类别的种子词通常是互不相同的。本实施例中,仍以上述具有5个层级结构的业务分类体系为例说明,对于“报关员培训班”和“报关员培训网站”两个业务点来说,所述词频统计单元622通过分析其下面的样本集,可以得到业务点“报关员培训班”样本集中的高频词条包括“报关员”、“培训班”、“辅导班”,业务点“报关员培训网站”样本集中的高频词条包括“报关员”、“网站”、“站点”、“网页”,为了体现这两个业务点的区分度,所述种子词确定单元623选择“培训”和“辅导”为业务点“报关员培训”的种子词,以及选择“网站”、“站点”和“网页”为业务点“报关员培训网站”的种子词,而高频词条“报关员”由于是两个业务点都具有的共同特性,所以所述种子词确定单元623不会将“报关员”作为这两个业务点的种子词。
所述权重确定单元624,用于确定各层级所述种子词的权重值;
具体地,后续词条匹配装置63在同一层级内将业务词条与种子词进行匹配的过程中,会出现业务词条包括多个种子词且所述种子词又分别隶属于不同行业类别或业务类别的情况,其中,同一业务词条恰好可以属于不同行业类别或业务类别的情况是存在的,但是大部分业务词条还是仅仅属于某一行业类别或业务类别,所以,词条匹配装置63仅靠通过判断所述业务词条包括哪些种子词是无法准确地将业务词条进行分类。在这种情况下,需要权重确定单元624对种子词的权重值进行标注,以权重值的大小来进一步确定所述业务词条应该属于哪个种子词所对应的行业类别或业务类别。权重确定单元624对种子词权重值标注的具体方法如下:在对同一层级内的行业类别或业务类别的种子词的权重值进行标注前,权重确定单元624首先从所述层级内行业类别或业务类别的样本集中,选择出一定数量的样本词条,这些样本词条均包括两个或两个以上的种子词,且所述种子词分别隶属于不同的行业类别或业务类别;然后,权重确定单元624以这些样本词条所属的行业类别或业务类别为依据,对这些样本词条所包括的多个种子词的权重值进行标注,其中,与这些样本词条所属的行业类别或业务类别相对应的种子词的权重值大于其他种子词的权重值。举例来说,当权重确定单元624对同一层级的业务类别的种子词A和种子词B进行权重值标注的时候,选择一定数量的既包括种子词A又包括种子词B的样本词条,对所述样本词条所属的业务类别进行统计,发现大部分所述样本词条都属于种子词B所对应的业务类别,那么权重确定单元624认为在后续对业务词条分类的步骤中,如果待分类的业务词条同时包括种子词A和种子词B,那么所述业务词条被分配至种子词B所对应的业务类别下的可能性较大,所以权重确定单元624对种子词A和种子词B的权重值进行标注时,使种子词B的权重值大于种子A的权重值。对业务词条进行行业类别或业务类别分类的时候,以所述具有权重值的种子词作为与其相对应的行业类别或业务类别的标准,将可以保证业务词条分类的准确性。
所述词条匹配装置63,用于将业务词条逐层与所述种子词进行匹配,以确定所述业务词条所属的业务类别。所述词条匹配装置63包括业务词条选择单元631、第二切词单元632、类别确定单元633、分配单元634;
其中,所述业务词条选择单元631,用于基于互联网选取具有高价值的词条作为所述业务词条;
具体地,业务词条的来源通常有两个途径:搜索引擎营销系统用户所设定的关键词以及网民通过互联网搜索引擎输入的搜索词。为了保证业务分类体系下的业务词条都具有高价值,所述业务词条选择单元631在收集所述关键词以及搜索词后,首先会根据一定的标准对所述关键词以及搜索词进行筛选,筛选的具体标准可以根据所述关键词以及搜索词的属性数据,其中关键词的属性数据包括消费、平均点击价格、点击量、日均浏览量、点击率、展现量、转化等可以体现推广效果的数据,搜索词的属性数据包括日均搜索量等可以体现网民关注度的数据。根据所述关键词以及搜索词的属性数据,所述业务词条选择单元631可以筛选出推广效果好的、网民关注度高的词条作为业务分类体系下的业务词条,从而保证所述业务词条被搜索引擎营销账户系统用户作为关键词后具有良好的推广效果。例如,可以选择日均浏览量大于50次的关键词以及日均搜索量大于50次的搜索词作为业务词条。
所述第二切词单元632,用于将所述业务词条进行第二切词,获取第二切词结果;具体地,所述第二切词单元632首先将待分配的业务词条进行第二切词,其中,所述第二切词单元632采用与上述第一切词单元621相同的方法,将待分配的业务词条进行分解,并取得第二切词结果。
所述类别确定单元633,用于将所述第二切词结果逐层与所述行业类别或业务类别的种子词进行比较,确定所述第二切词结果包含的权重值最高的种子词所对应的行业类别或业务类别;
具体地,所述类别确定单元633将第二切词结果中的词条自上而下地与各层级中行业类别或业务类别的种子词一一进行比较,确定所述第二切词结果中的词条所包含的种子词所对应的行业类别或业务类别。仍以上述具有5个层级结构的业务分类体系为例说明,当一业务词条经过第二切词并获取第二切词结果后,所述类别确定单元633首先将所述第二切词结果中的词条与一级行业中各行业大类的种子词进行匹配,确定所述业务词条所属的一级行业;然后所述类别确定单元633将所述第二切词结果中的词条与所述一级行业下的二级行业中的具体行业类目的种子词进行匹配,确定所述业务词条所属的二级行业;接着,所述类别确定单元633依次确定所述业务词条所属的一级业务、二级业务以及业务点。
当所述第二切词结果中包含同一层级中属于不同行业类别或不同业务类别的种子词时,所述类别确定单元633则将权限值最高的种子词所对应的行业类别或业务类别作为所述业务词条所属的行业类别或业务类别。
当所述第二切词结果中包含同一层级中属于不同行业类别或不同业务类别的种子词、且多个种子词的权重值相等,所述类别确定单元633则可以随机将任一种子词所对应的行业类别或业务类别作为所述业务词条所属的行业类别或业务类别,或者将各种子词所对应的行业类别或业务类别均作为所述业务词条所属的行业类别或业务类别。
所述分配单元634,用于将所述业务词条分配至其所属的业务类别;具体地,当所述类别确定单元633最终确定了所述业务词条所属的具体业务点后,所述分配单元634将所述业务词条分配至所述业务点下。同一个业务词条可能只存在于一个业务点下,也可能同时存在多个业务点下。
所述结构分析装置64,用于对各所述业务类别下的业务词条进行结构分析,并将结构相同或结构相近的所述业务词条划分至同一单元下;
具体地,在所述词条匹配装置63将所述业务词条分配至其所述的业务类别下之后,所述结构分析装置64可以进一步对业务点下的业务词条的结构进行分析,其中,业务词条的结构主要存在以下几类:
所述结构分析装置64对业务词条结构进行分析的目的在于,搜索引擎营销账户系统用户在挑选具有不同结构的业务词条作为其推广账户下的关键词后,可以有针对性地撰写带有通配符的创意。当网民输入的搜索词触发搜索引擎营销账户系统用户在推广账户内的关键词的时候,所述关键词将替代创意内的通配符,然后将包括具体关键词的创意展现给网民。创意的通顺与否,与创意中替代通配符的关键词的结构有关,例如,名词结构的关键词替代创意中的通配符后,所述创意很通顺,但是用疑问结构的关键词去替代所述创意中的通配符,就有可能会导致所述创意无法连贯。所以,搜索引擎营销账户系统用户选择同一单元下具有相同结构的业务词条作为关键词后,可以针对所述单元内的业务词条撰写创意,从而保证创意在展现时候的通顺连贯,如此一来,不但可以使推广账户结构更加科学,还可以使网民体验好。
可选地,当结构相近的业务词条适用于同一个创意的时候,所述结构分析装置64也可以将所述业务词条划分至同一单元下。例如,名词结构的业务词条和偏正结构的词条在创意撰写时无差异,所以在对业务词条的结构进行分析后,所述结构分析装置64可以将名词结构和偏正结构的两种业务词条划分至同一单元内。
所述排序装置65,用于根据各所述业务类别下业务词条的属性数据,对所述业务词条进行排序;具体地,
所述排序装置65根据各所述业务类别下业务词条的属性数据,对所述业务词条进行排序;具体地,当所述结构分析装置64根据词条结构将业务点下的业务词条划分至不同单元后,所述排序装置65可以根据业务词条的属性数据对各单元内的业务词条进一步进行排序,例如,根据业务词条的日均浏览量降序排列,使搜索引擎营销账户系统用户在以单元为单位选择业务词条作为其账户关键词的时候,可以非常直观地看到单元内所有业务词条的推广效果,从而便于搜索引擎营销账户系统用户做出选择。
实施上述具体实施方式,有效地解决了现有技术中出现的问题,搜索引擎营销账户系统用户只需根据该业务分类体系就可以轻松为自己建立科学的推广账户结构,也只需按照其自身的业务类型就可以从该业务分类体系中快速挑选出所有高价值的业务词条作为关键词,从而有效地提升了该用户搜索引擎营销账户的营销效果。
本发明提供的对业务词条进行分类的方法可以使用可编程逻辑器件结合来实现,也可以实施为计算机程序软件,例如根据本发明的实施例可以是一种计算机程序产品,运行该程序产品使计算机执行用于所示范的方法。所述计算机程序产品包括计算机可读存储介质,该介质上包含计算机程序逻辑或代码部分,用于实现所述对业务词条进行分类的方法。所述计算机可读存储介质可以是被安装在计算机中的内置介质或者可从计算机主体拆卸的可移动介质(例如热拔插技术存储设)。所述内置介质包括但不限于可重写的非易失性存储器,例如RAM、ROM、快闪存储器和硬盘。所述可移动介质包括但不限于:光存储媒体(例如CD-ROM和DVD)、磁光存储媒体(例如MO)、磁存储媒体(例如盒带或移动硬盘)、具有内置的可重写的非易失性存储器的媒体(例如存储卡)和具有内置ROM的媒体(例如ROM盒)。
以上所揭露的仅为本发明的一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (12)
1.一种对业务词条进行分类的方法,该方法包括以下步骤:
归纳各种行业类别及所述行业下各种业务类别,建立层级结构的业务分类体系;
针对各层级的行业类别或业务类别,制定分别与所述各层级的行业类别或业务类别对应的一个或者多个种子词;
将业务词条逐层与所述种子词进行匹配,以确定所述业务词条所属的业务类别。
2.根据权利要求1所述的方法,其中,所述针对各层级的行业类别或业务类别,制定分别与所述行业类别或业务类别对应的一个或者多个种子词的步骤具体包括:
对各层级的所述行业类别或业务类别的样本词条进行第一切词,对第一切词结果进行统计,获取所述第一切词结果中词频高于一阈值的高频词条;
对所述高频词条进行筛选,选择具有区分度的所述高频词条作为所述行业类别或业务类别的种子词;
确定各层级所述种子词的权重值。
3.根据权利要求1所述的方法,其中,在所述将业务词条逐层与所述种子词进行匹配,以确定所述业务词条所属的业务类别的步骤之前还包括:
基于互联网选取具有高价值的词条作为所述业务词条。
4.根据权利要求1或2所述的方法,其中,所述将业务词条逐层与所述种子词进行匹配,以确定所述业务词条所属的业务类别的步骤具体包括:
对所述业务词条进行第二切词,获取第二切词结果;
将所述第二切词结果逐层与所述行业类别或业务类别的种子词进行比较,确定所述第二切词结果包含的权重值最高的种子词所对应的行业类别或业务类别,将所述业务词条分配至其所属的业务类别。
5.根据权利要求1所述的方法,其中,在所述将业务词条逐层与所述种子词进行匹配,以确定所述业务词条所属的业务类别的步骤之后还包括:
对各所述业务类别下的业务词条进行结构分析,并将结构相同或结构相近的所述业务词条划分至同一单元下。
6.根据权利要求1所述的方法,其中,在所述将业务词条逐层与所述种子词进行匹配,以确定所述业务词条所属的业务类别的步骤之后还包括:
根据各所述业务类别下业务词条的属性数据,对所述业务词条进行排序。
7.一种对业务词条进行分类的设备,包括:
体系建立装置,用于归纳各种行业类别及所述行业下各种业务类别,建立层级结构的业务分类体系;
种子词制定装置,用于针对各层级的行业类别或业务类别,制定分别与所述各层级的行业类别或业务类别对应的一个或者多个种子词;
词条匹配装置,用于将业务词条逐层与所述种子词进行匹配,以确定所述业务词条所属的业务类别。
8.根据权利要求7所述的设备,其中,所述种子词制定装置包括:
第一切词单元,用于对各层级的所述行业类别或业务类别的样本词条进行第一切词;
词频统计单元,用于对所述第一切词结果进行统计,获取所述第一切词结果中词频高于一阈值的高频词条;
种子词确定单元,用于对所述高频词条进行筛选,选择具有区分度的所述高频词条作为所述行业类别或业务类别的种子词;
权重确定单元,用于确定各层级所述种子词的权重值。
9.根据权利要求7所述的设备,其中,所述词条匹配装置包括:
第二切词单元,用于将所述业务词条进行第二切词,获取第二切词结果;
类别确定单元,用于将所述第二切词结果逐层与所述行业类别或业务类别的种子词进行比较,确定所述第二切词结果包含的权重值最高的种子词所对应的行业类别或业务类别;
分配单元,用于将所述业务词条分配至其所属的业务类别。
10.根据权利要求7或9所述的设备,其中,所述词条匹配装置还包括:
业务词条选择单元,用于基于互联网选取具有高价值的词条作为所述业务词条。
11.根据权利要求7所述的设备,其中,该设备还包括:
结构分析装置,用于对各所述业务类别下的业务词条进行结构分析,并将结构相同或结构相近的所述业务词条划分至同一单元下。
12.根据权利要求7所述的设备,其中,该设备还包括:
排序装置,用于根据各所述业务类别下业务词条的属性数据,对所述业务词条进行排序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011101870198A CN102426572A (zh) | 2011-07-05 | 2011-07-05 | 一种对业务词条进行分类的方法和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011101870198A CN102426572A (zh) | 2011-07-05 | 2011-07-05 | 一种对业务词条进行分类的方法和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102426572A true CN102426572A (zh) | 2012-04-25 |
Family
ID=45960558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011101870198A Pending CN102426572A (zh) | 2011-07-05 | 2011-07-05 | 一种对业务词条进行分类的方法和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102426572A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103425677A (zh) * | 2012-05-18 | 2013-12-04 | 阿里巴巴集团控股有限公司 | 关键词分类模型确定方法、关键词分类方法及装置 |
CN104077290A (zh) * | 2013-03-26 | 2014-10-01 | 腾讯科技(深圳)有限公司 | 一种生成推广账户的方法和装置 |
CN104504135A (zh) * | 2014-12-31 | 2015-04-08 | 北京国双科技有限公司 | 推广账户结构的生成方法和装置 |
CN105354265A (zh) * | 2015-10-23 | 2016-02-24 | 北京京东尚科信息技术有限公司 | 一种自动构建投放关键词关联结构的方法及装置 |
CN105989184A (zh) * | 2015-08-25 | 2016-10-05 | 中国银联股份有限公司 | 一种分类方法及装置 |
CN106326338A (zh) * | 2016-08-03 | 2017-01-11 | 北京百度网讯科技有限公司 | 基于搜索引擎的服务提供方法和装置 |
CN106650783A (zh) * | 2015-10-30 | 2017-05-10 | 李静涛 | 用于移动终端数据分类、生成、匹配的方法、装置及系统 |
CN106682217A (zh) * | 2016-12-31 | 2017-05-17 | 成都数联铭品科技有限公司 | 一种基于自动信息筛选学习的企业二级行业分类方法 |
CN107609097A (zh) * | 2017-09-11 | 2018-01-19 | 首都医科大学附属北京天坛医院 | 一种数据整合分类方法 |
CN108241629A (zh) * | 2016-12-23 | 2018-07-03 | 百度在线网络技术(北京)有限公司 | 关键词分组方法和装置 |
CN112182216A (zh) * | 2020-09-28 | 2021-01-05 | 时趣互动(北京)科技有限公司 | 营销热点趋势预测方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101101599A (zh) * | 2007-06-20 | 2008-01-09 | 精实万维软件(北京)有限公司 | 一种从网页中提取广告主信息的方法 |
CN101673305A (zh) * | 2009-09-29 | 2010-03-17 | 百度在线网络技术(北京)有限公司 | 行业分类方法、装置和服务器 |
-
2011
- 2011-07-05 CN CN2011101870198A patent/CN102426572A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101101599A (zh) * | 2007-06-20 | 2008-01-09 | 精实万维软件(北京)有限公司 | 一种从网页中提取广告主信息的方法 |
CN101673305A (zh) * | 2009-09-29 | 2010-03-17 | 百度在线网络技术(北京)有限公司 | 行业分类方法、装置和服务器 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103425677B (zh) * | 2012-05-18 | 2016-08-24 | 阿里巴巴集团控股有限公司 | 关键词分类模型确定方法、关键词分类方法及装置 |
CN103425677A (zh) * | 2012-05-18 | 2013-12-04 | 阿里巴巴集团控股有限公司 | 关键词分类模型确定方法、关键词分类方法及装置 |
CN104077290A (zh) * | 2013-03-26 | 2014-10-01 | 腾讯科技(深圳)有限公司 | 一种生成推广账户的方法和装置 |
CN104077290B (zh) * | 2013-03-26 | 2018-06-01 | 腾讯科技(深圳)有限公司 | 一种生成推广账户的方法和装置 |
CN104504135B (zh) * | 2014-12-31 | 2018-09-18 | 北京国双科技有限公司 | 推广账户结构的生成方法和装置 |
CN104504135A (zh) * | 2014-12-31 | 2015-04-08 | 北京国双科技有限公司 | 推广账户结构的生成方法和装置 |
CN105989184A (zh) * | 2015-08-25 | 2016-10-05 | 中国银联股份有限公司 | 一种分类方法及装置 |
CN105354265A (zh) * | 2015-10-23 | 2016-02-24 | 北京京东尚科信息技术有限公司 | 一种自动构建投放关键词关联结构的方法及装置 |
CN106650783A (zh) * | 2015-10-30 | 2017-05-10 | 李静涛 | 用于移动终端数据分类、生成、匹配的方法、装置及系统 |
CN106326338A (zh) * | 2016-08-03 | 2017-01-11 | 北京百度网讯科技有限公司 | 基于搜索引擎的服务提供方法和装置 |
CN106326338B (zh) * | 2016-08-03 | 2020-02-04 | 北京百度网讯科技有限公司 | 基于搜索引擎的服务提供方法和装置 |
CN108241629A (zh) * | 2016-12-23 | 2018-07-03 | 百度在线网络技术(北京)有限公司 | 关键词分组方法和装置 |
CN106682217A (zh) * | 2016-12-31 | 2017-05-17 | 成都数联铭品科技有限公司 | 一种基于自动信息筛选学习的企业二级行业分类方法 |
CN107609097A (zh) * | 2017-09-11 | 2018-01-19 | 首都医科大学附属北京天坛医院 | 一种数据整合分类方法 |
CN107609097B (zh) * | 2017-09-11 | 2021-02-09 | 首都医科大学附属北京天坛医院 | 一种数据整合分类方法 |
CN112182216A (zh) * | 2020-09-28 | 2021-01-05 | 时趣互动(北京)科技有限公司 | 营销热点趋势预测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102426572A (zh) | 一种对业务词条进行分类的方法和设备 | |
Kozlowski et al. | One hundred years of the Journal of Applied Psychology: Background, evolution, and scientific trends. | |
Vogel et al. | Journal rankings in management and business studies: What rules do we play by? | |
Sula et al. | Citations, contexts, and humanistic discourse: Toward automatic extraction and classification | |
US20100191773A1 (en) | System And Method For Providing Default Hierarchical Training For Social Indexing | |
Vakulenko et al. | Enriching iTunes App Store Categories via Topic Modeling. | |
Ryfe et al. | What is the meaning of a news link? | |
CN101404036A (zh) | PowerPoint电子演示文稿的关键词抽取方法 | |
Barbaresi et al. | For a fistful of blogs: Discovery and comparative benchmarking of republishable German content | |
Smeros et al. | Scilens: Evaluating the quality of scientific news articles using social media and scientific literature indicators | |
CN110688407B (zh) | 一种社会关系挖掘的方法 | |
KR101543680B1 (ko) | 인터넷을 활용한 개체 검색과 이를 위한 하이브리드 기반의 의견분석 시스템 및 그 방법 | |
Zhou et al. | Learning to suggest questions in social media | |
Kuh | Electronically Manufactured Law | |
CN106485525A (zh) | 信息处理方法及装置 | |
Zuccala et al. | Reviewing, indicating, and counting books for modern research evaluation systems | |
Cruz et al. | A bibliometric review of coach leadership studies | |
Gaillat et al. | The SSIX corpora: Three gold standard corpora for sentiment analysis in English, Spanish and German financial microblogs | |
Markland | Institutional repositories in the UK: What can the Google user find there? | |
Grobelnik et al. | Exploiting text mining in publishing and education | |
Kalbande et al. | Use of CD-Rom Databases: A Case Study | |
Santos et al. | Getting geographical answers from Wikipedia: the GikiP pilot at CLEF | |
Jagerman | Creating, maintaining and applying quality taxonomies | |
Hellman et al. | Characterizing user behaviors in open-source software user forums: an empirical study | |
Rath et al. | Identifying the reasons contributing to question deletion in educational Q&A |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20120425 |