CN107463600B - 广告投放关键词推荐方法及装置、广告投放方法及装置 - Google Patents

广告投放关键词推荐方法及装置、广告投放方法及装置 Download PDF

Info

Publication number
CN107463600B
CN107463600B CN201710439477.3A CN201710439477A CN107463600B CN 107463600 B CN107463600 B CN 107463600B CN 201710439477 A CN201710439477 A CN 201710439477A CN 107463600 B CN107463600 B CN 107463600B
Authority
CN
China
Prior art keywords
word
brand
words
attention
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710439477.3A
Other languages
English (en)
Other versions
CN107463600A (zh
Inventor
王经委
张杰伟
张霄
贺坚
程涛远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710439477.3A priority Critical patent/CN107463600B/zh
Publication of CN107463600A publication Critical patent/CN107463600A/zh
Priority to PCT/CN2017/116229 priority patent/WO2018227908A1/zh
Application granted granted Critical
Publication of CN107463600B publication Critical patent/CN107463600B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种广告投放关键词推荐方法及装置、广告投放方法及装置,该广告投放关键词推荐方法包括:获取品牌的品牌词;获取搜索信息,根据品牌词挖掘搜索信息中关注该品牌的关注词,并标注关注词的关注点;将品牌词和关注点对应的任一关注词的组合推荐为广告投放的关键词。本发明通过利用品牌词挖掘搜索信息中关注该品牌的关注词,并标注关注词的关注点,获取若干对该品牌具有高关注度的以关注点为单位的关注词集合,最终将品牌词和关注点对应的任一关注词的组合推荐为广告投放的关键词,在保障投放精准度的同时,通过关注点对应的同义或近义的关注词保障投放的覆盖面,从而实现了有效保障广告投放的效果。

Description

广告投放关键词推荐方法及装置、广告投放方法及装置
技术领域
本申请涉及广告投放技术领域,具体涉及一种广告投放关键词推荐方法及装置、广告投放方法及装置。
背景技术
搜索引擎营销(简称SEM)是一种非常有效的网络营销途径,可以推广各种商业信息,比如品牌广告。在搜索引擎营销中,客户购买关键词,如果网民搜索的内容中包含该关键词,就会触发该客户投放的品牌广告。
目前现有方案需要客户自定义关键词,或者采用系统推荐的关键词。前者的缺陷在于,自定义关键词仅凭经验或直觉自定义,由于不清楚网民对品牌的关注点,自定义关键词往往缺乏针对性;而后者的缺陷在于,系统通常只推荐客户已购买关键词的相关词,与品牌的关联性较差。因此,现有方案的缺陷会导致关键词的质量难以保障广告投放的效果,可能导致广告投放效果较差。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种通过识别网民对品牌的关注点保障广告投放效果的广告投放关键词推荐方法及装置,以及广告投放方法及装置。
第一方面,本发明提供一种广告投放关键词推荐方法,包括:
获取品牌的品牌词;
获取搜索信息,根据品牌词挖掘搜索信息中关注该品牌的关注词,并标注关注词的关注点;
将品牌词和关注点对应的任一关注词的组合推荐为广告投放的关键词。
第二方面,本发明推荐一种广告投放方法,包括:采用上述广告投放关键词推荐方法所推荐的品牌词和关注点对应的任一关注词的组合作为关键词,进行广告投放。
第三方面,本发明提供一种广告投放关键词推荐装置,包括品牌词获取单元、关注点挖掘单元和关键词推荐单元。
其中,品牌词获取单元配置用于获取品牌的品牌词;
关注点挖掘单元配置用于获取搜索信息,根据品牌词挖掘搜索信息中关注该品牌的关注词,并标注关注词的关注点;
关键词推荐单元配置用于将品牌词和关注点对应的任一关注词的组合推荐为广告投放的关键词。
第四方面,本发明推荐一种广告投放装置,包括上述广告投放关键词推荐装置,以及投放单元。
其中,投放单元配置用于采用所推荐的品牌词和关注点对应的任一关注词的组合作为关键词,进行广告投放。
第五方面,本发明还提供一种设备,包括一个或多个处理器和存储器,其中存储器包含可由该一个或多个处理器执行的指令以使得该一个或多个处理器执行根据本发明各实施例提供的广告投放关键词推荐方法或广告投放方法。
第六方面,本发明还提供一种存储有计算机程序的计算机可读存储介质,该计算机程序使计算机执行根据本发明各实施例提供的广告投放关键词推荐方法或广告投放方法。
本发明诸多实施例提供的广告投放关键词推荐方法及装置、广告投放方法及装置通过利用品牌词挖掘搜索信息中关注该品牌的关注词,并标注关注词的关注点,获取若干对该品牌具有高关注度的以关注点为单位的关注词集合,最终将品牌词和关注点对应的任一关注词的组合推荐为广告投放的关键词,在保障投放精准度的同时,通过关注点对应的同义或近义的关注词保障投放的覆盖面,从而实现了有效保障广告投放的效果;
本发明一些实施例提供的广告投放关键词推荐方法及装置、广告投放方法及装置进一步实现了自动精准识别公司名称中的品牌词,从而无需用户手动设置品牌词。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1为本发明一实施例提供的一种广告投放关键词推荐方法的流程图。
图2为图1所示方法的一种优选实施方式中步骤S30的流程图。
图3为图1所示方法的一种优选实施方式的流程图。
图4为图3所示方法的一种优选实施方式中步骤S11的流程图。
图5为图4所示方法的一种优选实施方式的流程图。
图6为图5所示方法的一种优选实施方式的流程图。
图7为本发明一实施例提供的一种广告投放方法的流程图。
图8为本发明一实施例提供的一种广告投放关键词推荐装置的结构示意图。
图9为图8所示装置的一种优选实施方式的结构示意图。
图10为图8所示装置的一种优选实施方式的结构示意图。
图11为图10所示装置的一种优选实施方式的结构示意图。
图12为图11所示装置的一种优选实施方式的结构示意图。
图13为本发明一实施例提供的一种广告投放装置的结构示意图。
图14为本发明一实施例提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1为本发明一实施例提供的一种广告投放关键词推荐方法的流程图。
如图1所示,在本实施例中,本发明提供的广告投放关键词推荐方法包括:
S10:获取品牌的品牌词;
S30:获取搜索信息,根据品牌词挖掘搜索信息中关注该品牌的关注词,并标注关注词的关注点;
S50:将品牌词和关注点对应的任一关注词的组合推荐为广告投放的关键词。
在步骤S10中,本实施例中具体通过以下两种方式获取品牌词:识别该品牌的公司名称中的品牌词,以及,获取用户设定的该品牌的品牌词。其中,品牌词具体指公司名称中组成字号的词,品牌词可能与品牌名称相同,或不相同但与品牌具有较强的关联性。
具体地,当公司名称包括品牌名称时,识别出的品牌词包括品牌名称,用户可以进一步自行补充设定当前品牌的别称、简称,以及企业所拥有的其它品牌的名称、别称、简称等无法通过识别公司名称获取的品牌词;
当公司名称不包括品牌名称时,识别出的品牌词仍具有与该品牌较强的关联性,能够认知品牌词的网民通常会知道品牌词与品牌之间的关联,用户可以进一步自行补充设定当前品牌的名称、别称、简称,以及企业所拥有的其它品牌的名称、别称、简称等无法通过识别公司名称获取的品牌词。
图2为图1所示方法的一种优选实施方式中步骤S30的流程图。如图2所示,在本实施例中,步骤S30包括:
S31:获取若干搜索信息,过滤不包括品牌词的搜索信息;
S33:对过滤后的搜索信息进行切词,去除品牌词后统计词频并排序以选取若干高频的关注词;
S35:标注各关注词的关注点。
具体地,在步骤S31中,通过搜索引擎的后台获取大量网民的搜索信息,利用步骤S10获得的品牌词过滤不相关的搜索信息,从而筛选出关注该品牌的搜索信息;
在步骤S33中,对步骤S31筛选出的各搜索信息分别进行切词,并去除品牌词、停用词等词语,得到若干关注词序列。其中,停用词具体指语气词等无法体现网民对品牌的关注点的词。统计若干关注词序列中每个词的词频并进行倒序排列,从而选取出若干词频最高的关注词;
在步骤S35中,标注步骤S33筛选出的各关注词的关注点,例如,“降价”、“促销”、“打折”等关注词的关注点为“价格”,“手感”、“舒适度”、“耐用”等关注词的关注点为“性能”,等等。具体可以通过机器学习的方法进行标注,或,显示以供人工标注等方式进行标注。
通过步骤S30的挖掘和标注,可以获得若干个关注点,每个关注点对应若干个同义、近义或关联度较高的词。
在更多实施例中,在步骤S30中还可以采用本领域常用的不同挖掘算法挖掘品牌词相关的关注词,可实现相同的技术效果。
在步骤S50中,推荐品牌词和关注点对应的任一关注词的组合,例如,推荐品牌词“盛达”和关注点“价格”对应的任一关注词的组合,则有:当采用该组推荐的关键词进行广告投放时,只要搜索信息包括品牌词“盛达”,以及“降价/促销/打折”等任一“价格”对应的关注词,即会触发广告的投放。
上述实施例通过利用品牌词挖掘搜索信息中关注该品牌的关注词,并标注关注词的关注点,获取若干对该品牌具有高关注度的以关注点为单位的关注词集合,最终将品牌词和关注点对应的任一关注词的组合推荐为广告投放的关键词,在保障投放精准度的同时,通过关注点对应的同义或近义的关注词保障投放的覆盖面,从而实现了有效保障广告投放的效果。
图3为图2所示方法的一种优选实施方式的流程图。如图3所示,步骤S10包括步骤S11和S12中的至少一项,即,在一些优选实施例中,可根据实际需求将步骤S10配置为通过上述两种方式中的任一种方式或两种方式获取品牌词。
图4为图3所示方法的一种优选实施方式中步骤S11的流程图。如图4所示,在一优选实施例中,步骤S11具体包括:
S115:对公司名称进行切词,获得分词序列;
S116:标注分词序列中的地名词和机构词;
S117:从前往后遍历分词序列,获得第一个地名词和第一个机构词之间的分词子序列;
S118:从后往前遍历分词子序列,获得词频小于第一阈值且与后一相邻词的紧密度小于第二阈值的分隔词;其中,紧密度根据两个相邻词的词频以及相邻词组频率确定;
S119:将分词子序列中,分隔词之前的词和分隔词标记为品牌词,分隔词之后的词标记为行业词。
具体地,在本实施例中,两个相邻词word1、word2的紧密度Aff(word1,word2)的计算方式为:
Figure BDA0001319534150000061
其中,Freq(word1)为word1的词频,Freq(word2)为word2的词频,Freqadj(word1,word2)为word1、word2的相邻词组频率,σ为平滑参数。上述词频和相邻词组频率通过统计获得,平滑参数根据经验进行设置和调节。在更多实施例中,还可将紧密度配置为其它不同的计算方式,只要两个词的紧密度和相邻词组频率呈正相关,即可实现相同的技术效果。
例如,对于公司名称“北京盛达防火设备有限公司”依次执行上述步骤S115-S119:
在步骤S115中,通过切词获得分词序列“北京-盛达-防火-设备-有限-公司”(并通过修正将“有限-公司”合并为“有限公司”);
在步骤S116中,标注分词序列中的地名词“北京”和机构词“有限公司”;
在步骤S117中,从前往后遍历分词序列,获得第一个地名词“北京”和第一个机构词“有限公司”之间的分词子序列“盛达-防火-设备”;
在步骤S118中,从后往前遍历分词子序列,“设备”的词频大于第一阈值,不符合条件;“防火”的词频小于第一阈值,但通过计算得到“防火”与“设备”的紧密度大于第二阈值,也不符合条件;“盛达”的词频小于第一阈值,且“盛达”与“防火”的紧密度小于第二阈值,因此判断“盛达”为分隔词;
在步骤S119中,将分词子序列“盛达-防火-设备”中分隔词“盛达”与其之前的词标记为品牌词,将“盛达”之后的“防火”与“设备”标记为行业词。
更进一步地,上述步骤还包括对于特殊类型的公司名称进行修正,例如:
在步骤S115的切词过程中,还包括对特殊类型的公司名称进行修正,例如,去除在公司名称中的“(中国)”,等;
在步骤S117的遍历过程中,若未获得地名词,则将第一个机构词之前的分词序列作为分词子序列;以及,其它针对不同特殊类型的公司名称所配置的修正手段。
上述实施例进一步实现了自动精准识别公司名称中的品牌词,从而无需用户手动设置品牌词。
图5为图4所示方法的一种优选实施方式的流程图。如图5所示,在一优选实施例中,步骤S11进一步还包括:
S111:获取若干公司名称并进行切词,获得若干分词序列;
S112:统计若干分词序列中每个词的词频,以及每对相邻词的相邻词组频率;
S113:计算出每对相邻词的紧密度。
具体地,步骤S111中,获取注册信息表中所有的公司名称,也可以进一步通过其它本领域常用的渠道获取更多的公司名称(并进行去重),分别对获取的每一公司名称进行切词以获得分词序列;
步骤S112中,通过统计获得每个词的词频和每对相邻词的相邻词组频率;
步骤S113中,根据上述式(1)计算出每对相邻词的紧密度。当步骤S11识别的公司名称在注册信息表中时,步骤S118只需调用步骤S113提前计算出的紧密度,而无需在判断时再作计算。在更多实施例中,同样可以根据所配置的不同计算方式计算紧密度。
图6为图5所示方法的一种优选实施方式的流程图。如图6所示,在一优选实施例中,步骤S11进一步还包括:
S114:将若干分词序列中各末尾词中的高频词标记为机构词。
具体地,在本实施例中,步骤S114中高频词的筛选方式为:高频词的词频不小于第三阈值,以及,各高频词的词频之和与各末尾词的词频之和的比例不小于第四阈值。在更多实施例中,还可采用机器训练、人工标记、获取现有的机构词库进行标记等不同手段标记机构词,可实现相同技术效果。
图7为本发明一实施例提供的一种广告投放方法的流程图。如图7所示,本实施例提供的一种广告投放方法,包括上述任一实施例提供的广告投放关键词推荐方法,以及:
S70:采用步骤S50推荐的品牌词和关注点对应的任一关注词的组合作为关键词,进行广告投放。
图8为本发明一实施例提供的一种广告投放关键词推荐装置的结构示意图。图8所示的装置可对应执行图1所示的方法。
如图8所示,在本实施例中,本发明提供一种广告投放关键词推荐装置10,包括品牌词获取单元11、关注点挖掘单元13和关键词推荐单元15。
其中,品牌词获取单元11配置用于获取品牌的品牌词;
关注点挖掘单元13配置用于获取搜索信息,根据品牌词挖掘搜索信息中关注该品牌的关注词,并标注关注词的关注点;
关键词推荐单元15配置用于将品牌词和关注点对应的任一关注词的组合推荐为广告投放的关键词。
具体推荐原理参见图1所示的方法,此处不再赘述。
图9为图8所示装置的一种优选实施方式的结构示意图。图9所示的装置可对应执行图2所示的方法。
如图9所示,在一优选实施例中,关注点挖掘单元13包括过滤子单元131、关注词挖掘子单元133和关注点标注子单元135。
其中,过滤子单元131配置用于获取若干搜索信息,过滤不包括所述品牌词的搜索信息;
关注词挖掘子单元133配置用于对过滤后的搜索信息进行切词,去除品牌词后统计词频并排序以选取若干高频的关注词;
关注点标注子单元135配置用于标注各关注词的关注点。
图10为图8所示装置的一种优选实施方式的结构示意图。图10所示的装置可对应执行图3所示的方法。
如图10所示,在一优选实施例中,品牌词获取单元11包括以下至少一项:
品牌词识别单元111,配置用于识别该品牌的公司名称中的品牌词;
品牌词设置单元113,配置用于获取用户设定的该品牌的品牌词。
图11为图10所示装置的一种优选实施方式的结构示意图。图11所示的装置可对应执行图4所示的方法。
如图11所示,在一优选实施例中,品牌词识别单元111包括预处理子单元1113、划分子单元1115和标记子单元1117。
其中,预处理子单元1113配置用于对公司名称进行切词,获得分词序列,标注分词序列中的地名词和机构词,以及,从前往后遍历分词序列,获得第一个地名词和第一个机构词之间的分词子序列(对应于图4所示方法的步骤S115-S117);
划分子单元1115配置用于从后往前遍历分词子序列,获得词频小于第一阈值且与后一相邻词的紧密度小于第二阈值的分隔词;其中,紧密度根据两个相邻词的词频以及相邻词组频率确定(对应于图4所示方法的步骤S118);
标记子单元1117配置用于将分词子序列中,分隔词之前的词和分隔词标记为品牌词,分隔词之后的词标记为行业词(对应于图4所示方法的步骤S119)。
图12为图11所示装置的一种优选实施方式的结构示意图。图12所示的装置可对应执行图5-6所示的方法。
如图12所示,在一优选实施例中,品牌词识别单元111进一步还包括数据支撑子单元1111。数据支撑子单元1111配置用于获取若干公司名称并进行切词,获得若干分词序列,统计若干分词序列中每个词的词频,以及每对相邻词的相邻词组频率,以及,计算出每对相邻词的紧密度。
在一优选实施例中,品牌词识别单元111还进一步配置用于将若干分词序列中各末尾词中的高频词标记为机构词。
图13为本发明一实施例提供的一种广告投放装置的结构示意图。图13所示的装置可对应执行图7所示的方法。
如图13所示,本发明还提供一种广告投放装置20,包括上述任一实施例所提供的广告投放关键词推荐装置10,以及投放单元21。
其中,投放单元21配置用于采用关键词推荐单元15所推荐的品牌词和关注点对应的任一关注词的组合作为关键词,进行广告投放。
图14为本发明一实施例提供的一种设备的结构示意图。
如图14所示,作为另一方面,本申请还提供了一种设备1400,包括一个或多个中央处理单元(CPU)1401,其可以根据存储在只读存储器(ROM)1402中的程序或者从存储部分1408加载到随机访问存储器(RAM)1403中的程序而执行各种适当的动作和处理。在RAM1403中,还存储有设备1400操作所需的各种程序和数据。CPU1401、ROM1402以及RAM1403通过总线1404彼此相连。输入/输出(I/O)接口1405也连接至总线1404。
以下部件连接至I/O接口1405:包括键盘、鼠标等的输入部分1406;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1407;包括硬盘等的存储部分1408;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1409。通信部分1409经由诸如因特网的网络执行通信处理。驱动器1410也根据需要连接至I/O接口1405。可拆卸介质1411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1410上,以便于从其上读出的计算机程序根据需要被安装入存储部分1408。
特别地,根据本公开的实施例,上述任一实施例描述的广告投放关键词推荐方法或广告投放方法可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行广告投放关键词推荐方法或广告投放方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1409从网络上被下载和安装,和/或从可拆卸介质1411被安装。
作为又一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例的装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,该程序被一个或者一个以上的处理器用来执行描述于本申请的广告投放关键词推荐方法或广告投放方法。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这根据所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以通过执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以通过专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,各所述单元可以是设置在计算机或移动智能设备中的软件程序,也可以是单独配置的硬件装置。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离本申请构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (16)

1.一种广告投放关键词推荐方法,其特征在于,包括:
获取品牌的品牌词;
获取搜索信息,根据所述品牌词挖掘所述搜索信息中关注所述品牌的关注词,并标注所述关注词的关注点;
将所述品牌词和所述关注点对应的任一关注词的组合推荐为广告投放的关键词;
所述获取品牌的品牌词包括以下至少一项:
识别所述品牌的公司名称中的品牌词;
获取用户设定的所述品牌的品牌词;
所述识别所述品牌的公司名称中的品牌词包括:
对公司名称进行切词,获得分词序列;
标注所述分词序列中的地名词和机构词;
从前往后遍历所述分词序列,获得第一个地名词和第一个机构词之间的分词子序列;
从后往前遍历所述分词子序列,获得词频小于第一阈值且与后一相邻词的紧密度小于第二阈值的分隔词;其中,所述紧密度根据两个相邻词的词频以及相邻词组频率确定;
将所述分词子序列中,所述分隔词之前的词和所述分隔词标记为品牌词,所述分隔词之后的词标记为行业词。
2.根据权利要求1所述的方法,其特征在于,两个相邻词word1、word2的紧密度Aff(word1,word2)的计算方式为:
Figure FDA0002605481410000011
其中,Freq(word1)为word1的词频,Freq(word2)为word2的词频,Freqadj(word1,word2)为word1、word2的相邻词组频率,σ为平滑参数。
3.根据权利要求2所述的方法,其特征在于,所述识别所述品牌的公司名称中的品牌词还包括:
获取若干公司名称并进行切词,获得若干分词序列;
统计所述若干分词序列中每个词的词频,以及每对相邻词的相邻词组频率;
计算出每对相邻词的紧密度。
4.根据权利要求3所述的方法,其特征在于,所述识别所述品牌的公司名称中的品牌词还包括:
将所述若干分词序列中各末尾词中的高频词标记为机构词。
5.根据权利要求4所述的方法,其特征在于,所述高频词的筛选方式为:高频词的词频不小于第三阈值,以及,各高频词的词频之和与各末尾词的词频之和的比例不小于第四阈值。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述获取搜索信息,根据所述品牌词挖掘所述搜索信息中关注所述品牌的关注词,并标注所述关注词的关注点包括:
获取若干搜索信息,过滤不包括所述品牌词的搜索信息;
对过滤后的搜索信息进行切词,去除品牌词后统计词频并排序以选取若干高频的关注词;
标注各所述关注词的关注点。
7.一种广告投放方法,其特征在于,采用如权利要求1-6任一项所述的广告投放关键词推荐方法所推荐的品牌词和关注点对应的任一关注词的组合作为关键词,进行广告投放。
8.一种广告投放关键词推荐装置,其特征在于,包括:
品牌词获取单元,配置用于获取品牌的品牌词;
关注点挖掘单元,配置用于获取搜索信息,根据所述品牌词挖掘所述搜索信息中关注所述品牌的关注词,并标注所述关注词的关注点;
关键词推荐单元,配置用于将所述品牌词和所述关注点对应的任一关注词的组合推荐为广告投放的关键词;
所述品牌词获取单元包括以下至少一项:
品牌词识别单元,配置用于识别所述品牌的公司名称中的品牌词;
品牌词设置单元,配置用于获取用户设定的所述品牌的品牌词;
所述品牌词识别单元包括:
预处理子单元,配置用于对公司名称进行切词,获得分词序列,标注所述分词序列中的地名词和机构词,以及,从前往后遍历所述分词序列,获得第一个地名词和第一个机构词之间的分词子序列;
划分子单元,配置用于从后往前遍历所述分词子序列,获得词频小于第一阈值且与后一相邻词的紧密度小于第二阈值的分隔词;其中,所述紧密度根据两个相邻词的词频以及相邻词组频率确定;
标记子单元,配置用于将所述分词子序列中,所述分隔词之前的词和所述分隔词标记为品牌词,所述分隔词之后的词标记为行业词。
9.根据权利要求8所述的装置,其特征在于,两个相邻词word1、word2的紧密度Aff(word1,word2)的计算方式为:
Figure FDA0002605481410000031
其中,Freq(word1)为word1的词频,Freq(word2)为word2的词频,Freqadj(word1,word2)为word1、word2的相邻词组频率,σ为平滑参数。
10.根据权利要求8所述的装置,其特征在于,所述品牌词识别单元还包括:
数据支撑子单元,配置用于获取若干公司名称并进行切词,获得若干分词序列,统计所述若干分词序列中每个词的词频,以及每对相邻词的相邻词组频率,以及,计算出每对相邻词的紧密度。
11.根据权利要求10所述的装置,其特征在于,所述数据支撑子单元进一步配置用于将所述若干分词序列中各末尾词中的高频词标记为机构词。
12.根据权利要求11所述的装置,其特征在于,所述高频词的筛选方式为:高频词的词频不小于第三阈值,以及,各高频词的词频之和与各末尾词的词频之和的比例不小于第四阈值。
13.根据权利要求8-12任一项所述的装置,其特征在于,所述关注点挖掘单元包括:
过滤子单元,配置用于获取若干搜索信息,过滤不包括所述品牌词的搜索信息;
关注词挖掘子单元,配置用于对过滤后的搜索信息进行切词,去除品牌词后统计词频并排序以选取若干高频的关注词;
关注点标注子单元,配置用于标注各所述关注词的关注点。
14.一种广告投放装置,其特征在于,包括如权利要求8-13任一项所述的广告投放关键词推荐装置,以及,
投放单元,配置用于采用所推荐的品牌词和关注点对应的任一关注词的组合作为关键词,进行广告投放。
15.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1-7中任一项所述的方法。
16.一种存储有计算机程序的计算机可读存储介质,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
CN201710439477.3A 2017-06-12 2017-06-12 广告投放关键词推荐方法及装置、广告投放方法及装置 Active CN107463600B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710439477.3A CN107463600B (zh) 2017-06-12 2017-06-12 广告投放关键词推荐方法及装置、广告投放方法及装置
PCT/CN2017/116229 WO2018227908A1 (zh) 2017-06-12 2017-12-14 广告投放关键词推荐方法及装置、广告投放方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710439477.3A CN107463600B (zh) 2017-06-12 2017-06-12 广告投放关键词推荐方法及装置、广告投放方法及装置

Publications (2)

Publication Number Publication Date
CN107463600A CN107463600A (zh) 2017-12-12
CN107463600B true CN107463600B (zh) 2020-12-29

Family

ID=60546362

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710439477.3A Active CN107463600B (zh) 2017-06-12 2017-06-12 广告投放关键词推荐方法及装置、广告投放方法及装置

Country Status (2)

Country Link
CN (1) CN107463600B (zh)
WO (1) WO2018227908A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107463600B (zh) * 2017-06-12 2020-12-29 百度在线网络技术(北京)有限公司 广告投放关键词推荐方法及装置、广告投放方法及装置
CN110889050A (zh) * 2018-09-07 2020-03-17 北京搜狗科技发展有限公司 一种泛品牌词的挖掘方法及装置
CN111080361A (zh) * 2019-12-16 2020-04-28 上海风秩科技有限公司 一种广告投放方法、装置、电子设备及可读存储介质
CN112446214B (zh) * 2020-12-09 2024-02-02 北京有竹居网络技术有限公司 广告关键词的生成方法、装置、设备及存储介质
CN113538062B (zh) * 2021-07-28 2024-05-07 福州果集信息科技有限公司 一种反推商品推广笔记所购买竞价词的方法
CN114610971A (zh) * 2022-03-11 2022-06-10 北京百度网讯科技有限公司 搜索关键词的生成方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092877A (zh) * 2011-11-04 2013-05-08 百度在线网络技术(北京)有限公司 一种关键词推荐方法和装置
CN104636334A (zh) * 2013-11-06 2015-05-20 阿里巴巴集团控股有限公司 一种关键词推荐方法和装置
CN106682925A (zh) * 2015-11-06 2017-05-17 北京奇虎科技有限公司 广告内容的推荐方法及装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102076115B (zh) * 2009-11-20 2015-10-14 上海亿动信息技术有限公司 一种在移动终端内发布广告信息的控制方法及装置
CN103377232B (zh) * 2012-04-25 2016-12-07 阿里巴巴集团控股有限公司 标题关键词推荐方法及系统
CN103914492B (zh) * 2013-01-09 2018-02-27 阿里巴巴集团控股有限公司 查询词融合方法、商品信息发布方法和搜索方法及系统
US20140289044A1 (en) * 2013-03-15 2014-09-25 Lexos Media Ip, Llc Method and system for delivering cursor-based contentbased on user inputs
CN104598439B (zh) * 2013-10-30 2021-03-05 阿里巴巴集团控股有限公司 信息对象的标题修正方法及装置和推送信息对象的方法
CN105049895B (zh) * 2015-07-06 2018-05-08 无锡天脉聚源传媒科技有限公司 一种广告投放策略的推荐方法及装置
CN106484698A (zh) * 2015-08-25 2017-03-08 北京奇虎科技有限公司 一种搜索关键词的推送方法和装置
CN106169140A (zh) * 2016-02-02 2016-11-30 华扬联众数字技术股份有限公司 广告投放方法和系统
CN107463600B (zh) * 2017-06-12 2020-12-29 百度在线网络技术(北京)有限公司 广告投放关键词推荐方法及装置、广告投放方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092877A (zh) * 2011-11-04 2013-05-08 百度在线网络技术(北京)有限公司 一种关键词推荐方法和装置
CN104636334A (zh) * 2013-11-06 2015-05-20 阿里巴巴集团控股有限公司 一种关键词推荐方法和装置
CN106682925A (zh) * 2015-11-06 2017-05-17 北京奇虎科技有限公司 广告内容的推荐方法及装置

Also Published As

Publication number Publication date
WO2018227908A1 (zh) 2018-12-20
CN107463600A (zh) 2017-12-12

Similar Documents

Publication Publication Date Title
CN107463600B (zh) 广告投放关键词推荐方法及装置、广告投放方法及装置
US20210035126A1 (en) Data processing method, system and computer device based on electronic payment behaviors
US8886661B2 (en) Information extraction system, information extraction method, information extraction program, and information service system
CN108491388B (zh) 数据集获取方法、分类方法、装置、设备及存储介质
CN103927309B (zh) 一种对业务对象标注信息标签的方法及装置
CN108376164B (zh) 一种潜力主播的展示方法及装置
CN105654201B (zh) 一种广告流量预测方法及装置
CN110263248A (zh) 一种信息推送方法、装置、存储介质和服务器
CN108984554B (zh) 用于确定关键词的方法和装置
CN108415961A (zh) 一种广告图片推荐方法及装置
CN104915359B (zh) 主题标签推荐方法及装置
CN112163072B (zh) 基于多数据源的数据处理方法以及装置
CN106897290B (zh) 一种建立关键词模型的方法及装置
CN111553137B (zh) 报告生成方法、装置、存储介质及计算机设备
CN111292167A (zh) 基于大数据的竞品分析方法、系统、存储介质及电子设备
CN106777190B (zh) 识别兴趣点的wifi名称的方法和装置
CN102521713B (zh) 数据处理装置和数据处理方法
CN106202050B (zh) 主题信息获取方法、装置和电子设备
KR20190022442A (ko) 광고 생성 방법, 컴퓨터 판독 가능한 저장매치 및 시스템
CN107688600B (zh) 知识点挖掘方法及装置
CN112287800A (zh) 一种无样本条件下的广告视频识别方法及系统
CN111062736A (zh) 模型训练、线索排序方法、装置及设备
US20190332859A1 (en) Method for identifying main picture in web page
CN106570003B (zh) 数据推送方法及装置
CN109241395B (zh) 一种基于关键词解析的试题网络排重检索办法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant