广告关键词提取方法和装置
技术领域
本发明涉及广告领域,尤其涉及一种广告关键词提取方法和装置。
背景技术
目前,在淘宝、京东等电商平台上为商品做广告时,需要从商品对应的广告页中提取关键词,对关键词进行竞价,当关键词被点击时,浏览者将被带到商品对应的广告页。
现有技术中,广告主主要通过文档频率方法、互信息方法等基于词频的统计方法,从商品对应的广告页中提取词频较高的词语作为关键词进行竞价。
然而,现有技术中,基于词频的统计方法所涉及的参数单一,导致关键词与广告页之间的匹配度不高,使得浏览者在点击关键词时难以被带到商品对应的广告页,从而降低了浏览者咨询或购买商品的可能性,降低了广告转化率。
发明内容
本发明提供一种广告关键词提取方法和装置,用于解决现有技术中关键词与广告页之间的匹配度不高,降低广告转化率的问题。
本发明的第一个方面是提供一种广告关键词提取方法,包括:
获取广告页中的特征关键词;
根据所述特征关键词在所述广告页中的位置,确定所述特征关键词的连接参数;
根据所述特征关键词的连接参数,计算所述特征关键词的评估值;
根据所述特征关键词的评估值确定所述广告页对应的关键词。
结合第一个方面,在第一个方面的第一种实施方式中,所述获取广告页中的特征关键词,包括:
获取所述广告页中的词语;
判断预设的竞价关键词库中是否包括所述词语;
若所述预设的竞价关键词库中包括所述词语,则将所述词语作为所述广告页的特征关键词。
结合第一个方面,在第一个方面的第二种实施方式中,所述特征关键词的连接参数包括:度、聚集系数和介数;
所述根据所述特征关键词在所述广告页中的位置,确定所述特征关键词的连接参数,包括:
根据所述特征关键词在所述广告页中的位置,确定特征关键词对,所述特征关键词对中的两个特征关键词位于同一语句中,且所述两个特征关键词之间的词间距满足预设的条件;
建立所述特征关键词对中的两个特征关键词之间的连接关系;
根据各个特征关键词之间的连接关系,计算第i个特征关键词的度、聚集系数以及介数,其中,i为正整数,所述度为第i个特征关键词与其他特征关键词之间的连接数量,所述聚集系数为所述第i个特征关键词所连接的各个特征关键词之间的连接密度,所述介数为通过所述第i个特征关键词的最短路径的数量,所述最短路径为任意两个特征关键词之间的最短路径。
结合第一个方面的第二种实施方式,在第一个方面的第三种实施方式中,所述第i个特征关键词的聚集系数的计算公式为:
其中,所述Di为第i个特征关键词的度,所述Qi为第i个特征关键词所连接的各个特征关键词之间的连接数量。
结合第一个方面的第二种实施方式和第三种实施方式,在第一个方面的第四种实施方式中,所述根据所述特征关键词的连接参数,计算所述特征关键词的评估值的计算公式为:
Vi=β1Di+β2Ci+β3Bi;
其中,Bi为第i个特征关键词的介数,β1,β2,β3为权重系数,β1+β2+β3=1。
结合第一个方面,在第一个方面的第五种实施方式中,所述根据所述特征关键词的评估值确定所述广告页对应的关键词,包括:
根据所述特征关键词的评估值对所述特征关键词进行排序;
将排序结果中评估值最大的多个特征关键词作为所述广告页对应的关键词。
本发明的第二个方面提供一种广告关键词提取装置,包括:
获取模块,用于获取广告页中的特征关键词;
确定模块,用于根据所述特征关键词在所述广告页中的位置,确定所述特征关键词的连接参数;
计算模块,用于根据所述特征关键词的连接参数,计算所述特征关键词的评估值;
所述确定模块,还用于根据所述特征关键词的评估值确定所述广告页对应的关键词。
结合第二个方面,在第二个方面的第一种实施方式中,所述获取模块具体用于,
获取所述广告页中的词语;
判断预设的竞价关键词库中是否包括所述词语;
若所述预设的竞价关键词库中包括所述词语,则将所述词语作为所述广告页的特征关键词。
结合第二个方面,在第二个方面的第二种实施方式中,所述特征关键词的连接参数包括:度、聚集系数和介数;
所述确定模块根据所述特征关键词在所述广告页中的位置,确定所述特征关键词的连接参数中,所述确定模块具体用于,
根据所述特征关键词在所述广告页中的位置,确定特征关键词对,所述特征关键词对中的两个特征关键词位于同一语句中,且所述两个特征关键词之间的词间距满足预设的条件;
建立所述特征关键词对中的两个特征关键词之间的连接关系;
根据各个特征关键词之间的连接关系,计算第i个特征关键词的度、聚集系数以及介数,其中,i为正整数,所述度为第i个特征关键词与其他特征关键词之间的连接数量,所述聚集系数为所述第i个特征关键词所连接的各个特征关键词之间的连接密度,所述介数为通过所述第i个特征关键词的最短路径的数量,所述最短路径为任意两个特征关键词之间的最短路径。
结合第二个方面的第二种实施方式,在第二个方面的第三种实施方式中,所述第i个特征关键词的聚集系数的计算公式为:
其中,所述Di为第i个特征关键词的度,所述Qi为第i个特征关键词所连接的各个特征关键词之间的连接数量。
本发明中,通过获取广告页中的特征关键词,根据特征关键词在广告页中的位置,确定特征关键词的连接参数,根据特征关键词的连接参数,计算特征关键词的评估值,根据特征关键词的评估值确定广告页对应的关键词,从而提高了关键词与广告页之间的匹配度,使得浏览者在点击关键词时能够被带到商品对应的广告页,提高浏览者咨询或购买商品的可能性,提高了广告转化率。
附图说明
图1为本发明提供的广告关键词提取方法一个实施例的流程图;
图2为本发明提供的广告关键词提取方法又一个实施例的流程图;
图3为复杂网络的示意图;
图4为本发明提供的广告关键词提取装置一个实施例的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明提供的广告关键词提取方法一个实施例的流程图,如图1所示,包括:
101、获取广告页中的特征关键词。
本发明提供的广告关键词提取方法的执行主体可以为广告关键词提取装置。广告关键词提取装置的表现形式具体为可以运行在服务器的软件程序。
具体地,获取广告页中的特征关键词的过程具体可以为:获取广告页中的词语;判断预设的竞价关键词库中是否包括所述词语;若预设的竞价关键词库中包括所述词语,则将所述词语作为广告页的特征关键词。其中,预设的竞价关键词库中包括广告主希望进行竞价的所有关键词。
102、根据特征关键词在广告页中的位置,确定特征关键词的连接参数。
其中,特征关键词在广告页中的位置包括:特征关键词所在的语句,以及特征关键词与所述语句中的其他特征关键词之间的词间距。两个特征关键词之间的词间距指的是两个特征关键词之间的距离,当两个特征关键词中间没有其他特征关键词时,定义两个特征关键词之间的词间距为1,当两个特征关键词中间有1个其他特征关键词时,定义两个特征关键词之间的词间距为2。
103、根据特征关键词的连接参数,计算特征关键词的评估值。
104、根据特征关键词的评估值确定广告页对应的关键词。
其中,广告关键词提取装置可以根据特征关键词的评估值对特征关键词进行排序,将排序结果中评估值最大的多个特征关键词作为广告页对应的关键词。
本实施例中,通过获取广告页中的特征关键词,根据特征关键词在广告页中的位置,确定特征关键词的连接参数,根据特征关键词的连接参数,计算特征关键词的评估值,根据特征关键词的评估值确定广告页对应的关键词,从而提高了关键词与广告页之间的匹配度,使得浏览者在点击关键词时能够被带到商品对应的广告页,提高浏览者咨询或购买商品的可能性,提高了广告转化率。
图2为本发明提供的广告关键词提取方法又一个实施例的流程图,如图2所示,在图1所示实施例的基础上,特征关键词的连接参数可以包括:度、聚集系数和介数。
对应的,步骤102具体可以包括:
1021、根据特征关键词在广告页中的位置,确定特征关键词对,特征关键词对中的两个特征关键词位于同一语句中,且两个特征关键词之间的词间距满足预设的条件。
其中,预设的条件可以为两个特征关键词之间的词间距为1或2。
1022、建立特征关键词对中的两个特征关键词之间的连接关系。
1023、根据各个特征关键词之间的连接关系,计算第i个特征关键词的度、聚集系数以及介数,其中,i为正整数,度为第i个特征关键词与其他特征关键词之间的连接数量,聚集系数为第i个特征关键词所连接的各个特征关键词之间的连接密度,介数为通过第i个特征关键词的最短路径的数量,最短路径为任意两个特征关键词之间的最短路径。
具体地,广告关键词提取装置可以根据各个特征关键词之间的连接关系,构架复杂网络,复杂网络的示意图如图3所示,图3中的每个节点代表一个特征关键词,两个特征关键词之间的有向边表示特征关键词对中两个特征关键词之间的连接关系,有向边的方向由特征关键词对在同一语句中的前后顺序决定,有向边由同一语句中靠前的特征关键词指向同一语句中靠后的特征关键词。有向边的权值为所述特征关键词对中两个关键词之间的连接数量。广告关键词提取装置可以通过复杂网络来计算第i个特征关键词的度、聚集系数以及介数。
进一步地,第i个特征关键词的聚集系数的计算公式为:
其中,Di为第i个特征关键词的度,Qi为第i个特征关键词所连接的各个特征关键词之间的连接数量。
在上述情况下,步骤103中,根据特征关键词的连接参数,计算特征关键词的评估值的计算公式为:
Vi=β1Di+β2Ci+β3Bi;
其中,Bi为第i个特征关键词的介数,β1,β2,β3为权重系数,β1+β2+β3=1。
本实施例中,通过获取广告页中的特征关键词,根据特征关键词在广告页中的位置,确定关键词对,建立特征关键词对中的两个特征关键词之间的连接关系,根据各个特征关键词之间的连接关系,计算每个特征关键词的度、聚集系数以及介数,将上述参数作为每个特征关键词的连接参数,根据每个特征关键词的连接参数,计算每个特征关键词的评估值,根据各个特征关键词的评估值确定广告页对应的关键词,从而提高了关键词与广告页之间的匹配度,使得浏览者在点击关键词时能够被带到商品对应的广告页,提高浏览者咨询或购买商品的可能性,提高了广告转化率。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
图4为本发明提供的广告关键词提取装置一个实施例的结构示意图,如图4所示,包括:
获取模块41,用于获取广告页中的特征关键词;
确定模块42,用于根据特征关键词在广告页中的位置,确定特征关键词的连接参数;
计算模块43,用于根据特征关键词的连接参数,计算特征关键词的评估值;
确定模块42,还用于根据特征关键词的评估值确定广告页对应的关键词。
其中,获取模块41具体用于,获取广告页中的词语;判断预设的竞价关键词库中是否包括词语;若预设的竞价关键词库中包括词语,则将词语作为广告页的特征关键词。
进一步地,特征关键词的连接参数包括:度、聚集系数和介数;
对应的,确定模块42根据特征关键词在广告页中的位置,确定特征关键词的连接参数中,确定模块42具体用于,
根据特征关键词在广告页中的位置,确定特征关键词对,特征关键词对中的两个特征关键词位于同一语句中,且两个特征关键词之间的词间距满足预设的条件;
建立特征关键词对中的两个特征关键词之间的连接关系;
根据各个特征关键词之间的连接关系,计算第i个特征关键词的度、聚集系数以及介数,其中,i为正整数,度为第i个特征关键词与其他特征关键词之间的连接数量,聚集系数为第i个特征关键词所连接的各个特征关键词之间的连接密度,介数为通过第i个特征关键词的最短路径的数量,最短路径为任意两个特征关键词之间的最短路径。
其中,第i个特征关键词的聚集系数的计算公式为:
Di为第i个特征关键词的度,Qi为第i个特征关键词所连接的各个特征关键词之间的连接数量。
更进一步地,计算模块43根据特征关键词的连接参数,计算特征关键词的评估值的计算公式为:
Vi=β1Di+β2Ci+β3Bi;
其中,Bi为第i个特征关键词的介数,β1,β2,β3为权重系数,β1+β2+β3=1。
另外,确定模块42根据特征关键词的评估值确定广告页对应的关键词中,确定模块42具体可以用于,根据特征关键词的评估值对特征关键词进行排序;将排序结果中评估值最大的多个特征关键词作为广告页对应的关键词。
本实施例中,通过获取广告页中的特征关键词,根据特征关键词在广告页中的位置,确定特征关键词的连接参数,根据特征关键词的连接参数,计算特征关键词的评估值,根据特征关键词的评估值确定广告页对应的关键词,从而提高了关键词与广告页之间的匹配度,使得浏览者在点击关键词时能够被带到商品对应的广告页,提高浏览者咨询或购买商品的可能性,提高了广告转化率。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。