发明内容
鉴于上述问题,本说明书的实施例提供了一种用于确定广告语句的方法及装置。本说明书一个实施例实现了利用语料库确定与用户标签匹配的描述短语,为用户标签提供了语言描述功能,并且基于描述短语和广告语句模板生成广告语句,可以得到与用户画像数据相匹配的个性化广告文案。
根据本说明书的实施例的一个方面,提供了一种用于确定广告语句的方法,包括:基于目标用户的用户画像数据,确定所述目标用户的用户标签;从语料库中查找出包含所述用户标签的至少一个标签语料语句;基于预定短语提取策略来从所述至少一个标签语料语句中提取出所述描述短语;根据所述描述短语和广告语句模板,生成针对所述用户标签的广告语句。
可选地,在上述方面的一个示例中,还包括:获取所述用户标签的至少一个扩展关键词,以及从语料库中查找出包括所述用户标签的至少一个标签语料语句包括:从语料库中查找出包括所述用户标签和/或所述至少一个扩展关键词的至少一个标签语料语句。
可选地,在上述方面的一个示例中,所述描述短语包括多个描述短语,所述方法还包括:根据所述多个描述短语的用户标签相关度和/或广告语句模板,对所述多个描述短语进行筛选处理,根据所述描述短语和广告语句模板,生成针对所述用户标签的广告语句包括:根据经过筛选处理后的描述短语和广告业务类型,生成针对所述用户标签的广告语句。
可选地,在上述方面的一个示例中,所述描述短语的标签相关度是基于与该描述短语所对应的标签语料语句匹配的用户标签和/或扩展关键词的数量来确定的。
可选地,在上述方面的一个示例中,还包括:获取广告语句的应用语境信息;以及根据所述多个描述短语的用户标签相关度和/或广告业务类型,对所述多个描述短语进行筛选处理包括:根据所述多个描述短语的用户标签相关度、广告业务类型和/或所述应用语境信息,对所述多个描述短语进行筛选处理。
可选地,在上述方面的一个示例中,所述预定短语提取策略包括:基于预定短语提取条件来从语料语句中提取出描述短语,所述预定短语提取条件包括以下中的至少一种:具有设定短语关键词的正则表达式、语句设定短语成分规则和语句摘要规则。
可选地,在上述方面的一个示例中,还包括:基于短语过滤规则来对描述短语进行过滤处理。
可选地,在上述方面的一个示例中,所述短语过滤规则包括:产品标识短语过滤规则,所述产品标识短语过滤规则被使用来对所述描述短语进行产品标识信息过滤;和/或短语IDF过滤规则,所述短语IDF过滤规则被使用来对所述描述短语进行IDF过滤,以使得过滤后的描述短语的IDF值不小于预设阈值。
可选地,在上述方面的一个示例中,所述广告语句模板是基于广告语句的广告业务类型确定的。
可选地,在上述方面的一个示例中,还包括:向所述目标用户推送所述广告语句。
根据本说明书的实施例的另一方面,还提供一种用于确定广告语句的方法,包括:基于目标用户的用户画像数据,确定所述目标用户的用户标签;基于标签-短语映射集来确定与所述用户标签匹配的描述短语,所述标签-短语映射集包括标签与描述短语之间的映射关系;根据所述描述短语和广告语句模板,生成针对所述用户标签的广告语句,其中,所述标签-短语映射集是通过将描述短语集提供给标签分类模型进行标签分类而确定出的,所述描述短语集是基于预定短语提取策略来从语料库中提取出的。
根据本说明书的实施例的另一方面,还提供一种用于确定广告语句的装置,包括:标签确定单元,基于目标用户的用户画像数据,确定所述目标用户的用户标签;标签语料语句查找单元,从语料库中查找出包含所述用户标签的至少一个标签语料语句;描述短语提取单元,基于预定短语提取策略来从所述至少一个标签语料语句中提取出所述描述短语;广告语句生成单元,根据所述描述短语和广告语句模板,生成针对所述用户标签的广告语句。
可选地,在上述方面的一个示例中,还包括:扩展关键词获取单元,获取所述用户标签的至少一个扩展关键词,以及所述标签语料语句查找单元从所述语料库中查找出包括所述用户标签和/或所述至少一个扩展关键词的至少一个标签语料语句。
可选地,在上述方面的一个示例中,所述描述短语包括多个描述短语,所述装置还包括:描述短语筛选单元,根据所述多个描述短语的用户标签相关度和/或广告业务类型,对所述多个描述短语进行筛选处理,以及所述广告语句生成单元根据经过筛选处理后的描述短语和广告语句模板,生成针对所述用户标签的广告语句。
可选地,在上述方面的一个示例中,还包括:应用语境信息获取单元,获取广告语句的应用语境信息;以及所述描述短语筛选单元根据所述多个描述短语的用户标签相关度、广告业务类型和/或所述应用语境信息,对所述多个描述短语进行筛选处理。
可选地,在上述方面的一个示例中,所述预定短语提取策略包括:基于预定短语提取条件来从语料语句中提取出描述短语,所述预定短语提取条件包括以下中的至少一种:具有设定短语关键词的正则表达式、语句设定短语成分规则和语句摘要规则。
可选地,在上述方面的一个示例中,还包括:短语过滤单元,基于短语过滤规则来对描述短语进行过滤处理。
可选地,在上述方面的一个示例中,还包括:广告语句推送单元,向所述目标用户推送所述广告语句。
根据本说明书的实施例的另一方面,还提供一种用于确定广告语句的装置,包括:标签确定单元,基于目标用户的用户画像数据,确定所述目标用户的用户标签;描述短语确定单元,基于标签-短语映射集来确定与所述用户标签匹配的描述短语,所述标签-短语映射集包括标签与描述短语之间的映射关系;广告语句生成单元,根据所述描述短语和广告语句模板,生成针对所述用户标签的广告语句,其中,所述标签-短语映射集是通过将描述短语集提供给标签分类模型进行标签分类而确定出的,所述描述短语集是基于预定短语提取策略来从语料库中提取出的。
根据本说明书的实施例的另一方面,还提供一种计算设备,包括:至少一个处理器;以及存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的用于确定广告语句的方法。
根据本说明书的实施例的另一方面,还提供一种机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如上所述的用于确定广告语句的方法。
具体实施方式
以下将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本说明书的实施例内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。另外,相对一些示例所描述的特征在其它例子中也可以进行组合。
如本文中使用的,术语“包括”及其变型表示开放的术语,含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义,无论是明确的还是隐含的。除非上下文中明确地指明,否则一个术语的定义在整个说明书中是一致的。
在本文中,术语“语料”一般表示经过加工(例如,分析和处理)的真实语言材料,其可以包括一个或多个语料语句。术语“语料库”表示将多个语料以一定方式存储在一起,并且语料库的类型可以是多样化的,例如文集语料库、新闻语料库等。术语“短语”又叫词组,一般表示由句法、语义和语用三个层面上能够搭配的语言单位组合起来的没有句调的语言单位。另外,短语的类型有很多种,例如主谓短语“葡萄很甜”、偏正短语“甜的很”,以及联合短语“又香又甜”等,在本文中对短语的类型可以不作限制,并可以随着使用需求的变化而进行调整。
此外,术语“语境”表示语言环境,例如在不同语境下,表达同一思想内容,要用不同的语句内容来表达,以提升语义表达效果。例如,当需要向用户表达在促销场景下的促销祝福语时,如果处于用户生日语境,则可以推荐使用祝福语“生日的你的专属优惠”,但是如果处于母亲节语境,则可以推荐使用祝福语“送给母亲的专属优惠”。术语“标签相关度”表示短语与相应标签之间的相关程度。
现在结合附图来描述本说明书的实施例的用于确定广告语句的方法及装置。
图1示出的是本说明书的实施例的用于确定广告语句的方法(下文中也被称为广告语句确定方法)的一示例的流程图。
如图1所示的流程100,在块110中,基于目标用户的用户画像数据,确定目标用户的用户标签。
应理解的是,针对不同的用户会存在不同的用户画像数据,用户画像数据是由多项特征信息所构成的,其通常用来对特征进行具体描述。例如,针对用户“小花”的用户画像数据为“女”-“50岁”-“家居用品”-“北京”-“舞扇”,其是由多个具体的特征信息所构成的。
这里,目标用户可以表示待开展广告活动的用户人群(例如某个地区或营销渠道的用户人群),然后得到关于目标用户的用户画像数据,并确定用户画像数据所对应的用户标签。例如,针对目标用户“小花”的用户标签为诸如“中年妇女”之类的标签。
接着,在块120中,基于语料库确定与用户标签匹配的描述短语。
这里,通过基于语料库的描述短语来匹配用户标签,可以为用户标签提供语言描述功能。另外,基于语料库,可以采用多种实施方式来确定针对用户标签的描述短语。示例性地,一方面,可以根据用户标签对语料库中的各个语料语句执行查找、提取等操作,从而确定出相应的描述短语,具体细节可以参照下文中如图2所描述的示例性操作。另一方面,还可以依据语料库来生成具有在标签与描述短语之间的映射关系的标签-短语映射集,进而通过使用该标签-短语映射集来确定对应于用户标签的描述短语,具体细节可以参照下文中如图3所描述的示例性操作。
接着,在块130中,根据描述短语和广告语句模板,生成针对用户标签的广告语句。这里,广告语句模板的样式在此应不限定,并且还可以是基于广告语句的广告业务类型确定的。示例性地,广告业务类型可以是多样化的,其包括广告商品类型(例如运动商品类型和家居用品类型)、广告场景类型和广告渠道类型等。
这样,结合广告业务类型来确定广告语句,使得广告语句能够与广告业务类型更加适配。示例性地,每一广告业务类型可以分别与不同的广告语句模板相对应,并且可以通过将描述短语填充至广告业务类型所对应的广告语句模板中,从而生成针对用户标签的广告语句。示例性地,如果与广告业务类型“促销”相对应的广告语句模板是“_____的专属优惠”,而用户标签所对应的描述短语是“职场精英”,则相应的广告语句为“职场精英的专属优惠”。
进一步地,可以向目标用户推送相对应的广告语句。示例性地,根据各个目标用户所对应的用户账号或客户端信息等,推送相应的广告语句。由此,实现在智能营销场景中“千人千面”的智能文案,并还可以增强用户对于文案的认同感和归属感。
图2示出了根据本说明书的实施例的用于从语料库中确定描述短语的方法的一个示例的流程图。
如图2所示,在块210中,从语料库中查找出包含用户标签的至少一个标签语料语句。
这里,在语料库中具有多个标签语料语句,可以通过文本匹配的方式来从语料库中查找出包含用户标签的至少一个标签语料语句。更优选地,获取用户标签的至少一个扩展关键词,例如,针对标签“家庭妇女”,可能会存在诸如“粮油”、“奶粉”和“滤芯”之类的扩展关键词。进而,可以从语料库中查找出包括用户标签和/或至少一个扩展关键词的至少一个标签语料语句,这样就显著提升了与标签相匹配的标签语料语句的数量。
接着,在块220中,基于预定短语提取策略来从至少一个标签语料语句中提取出描述短语。
这里,预定短语提取策略可以是多样化的,以从语料语句中提取出用户标签所对应的描述短语。并且,将从与用户标签相对应的标签语料语句中所提取的描述短语确定为用户标签所匹配的描述短语。
具体地,可以基于预定短语提取条件来从语料语句中提取出描述短语,以及预定短语提取条件包括以下中的至少一种:具有设定短语关键词的正则表达式、语句设定短语成分规则和语句摘要规则。
在本说明书的实施例的一个实施方式中,根据正则表达式来提取语料语句中的描述短语。示例性地,正则表达式为“(送给│献给│分享给)(.+)____的你”,相应地,所提取出来的描述短语为“精致的你”、“拼搏的你”、“高品位的你”等等。
在本说明书的实施例的另一实施方式中,根据语句设定短语成分规则来提取语料语句中的对应设定短语成分的描述短语。示例性地,当描述短语是对各个用户(即人物)进行描述时,相应的设定短语成分为语料语句中的主语成分。这里,可以采用模型抽取的方式来从语料语句中确定对应的描述短语,例如,可以采用LSTM(Long Short-Term Memory,长短期记忆网络)+CRF(Conditional Random Field,条件随机场)模型。示例性地,在利用LSTM+CRF识别语句中的短语成分时,针对语料语句“吃货宅在家里吃零食”,能够识别出“吃货”、“吃零食”等分别是独立片段,并且“吃货”是属于主语成分的描述短语(或人物描述性短语)。
在本说明书的实施例的另一实施方式中,根据语句摘要规则来确定语料语句所对应的的描述短语,其可以通过应用文本摘要生成模型来生成描述短语,例如可以采用指针网络(pointer network)。示例性地,可以利用指针网络(pointer network)来确定描述短语,其不仅能够从原文中抽取已有的词构成短语,还能够产生原语料语句中没有出现的词。举例来说,针对语料语句“昨天买的那条裙子令她爱不释手”能够生成相应的摘要短语“裙子控”,并以此作为描述短语。
进一步地,在通过上述实施方式确定出描述短语之后,还需要将描述短语进行二次处理,以提升在广告语句中所使用的描述短语的质量。示例性地,针对诸如“XX奶茶爱好者”和“XX明星的粉丝”之类的描述短语,其描述过于细致并也存在用户敏感问题,不宜直接在广告语句中使用,需要进行相应的优化处理操作。更优选地,可以基于短语过滤规则来对描述短语进行过滤筛选操作。
在本说明书的实施例中,可以基于短语过滤规则来对描述短语进行过滤处理。具体地,短语过滤规则可以包括产品标识短语过滤规则和/或短语IDF过滤规则。
在本说明书的实施例的一个示例中,通过产品标识短语过滤规则对描述短语进行产品标识信息过滤。示例性地,使用NER(Named Entity Recognition,命名实体识别)技术,过滤掉语意为产品标识信息的描述短语。由此,一方面,避免了因利用产品标识信息来描述用户标签时过于详细的情况,有助于提高短语的容错性,例如描述短语“XX奶茶爱好者”相比于描述短语“吃货”更容易出错。另一方面,基于产品标识的描述短语太过于细致(例如,涉及“XX奶茶”或“XX明星”),使得用户误认为系统过度采集个人信息或其个人信息遭到泄露。
可附加或可替换地,在本说明书的实施例的另一示例中,通过短语IDF(InverseDocument Frequency,逆文本频率指数)过滤规则来对描述短语进行IDF过滤,以使得过滤后的描述短语的IDF值不小于预设阈值。这里,短语IDF值可以是针对短语中的各个词的平均IDF值。具体地,可以将描述短语进行分词,以得到针对该描述短语的多个短语分词。然后,计算多个短语分词分别所对应的词IDF,并统计各个短语分词所分别对应的词IDF值。进而,根据短语中所有短语分词所对应的词IDF来计算平均IDF值,并将该平均IDF值作为描述短语的IDF值。进而,将短语的IDF值低于预设阈值的描述短语滤除掉。
需说明的是,IDF值是用来度量词语的普遍重要性的指标。并且,某一特定词语的IDF值可以由总文件数目除以包含该词语的文件的数目,再将所得到的商取以10为底的对数而得到。也就是说,如果词语的IDF越小,则说明这个词越普遍和通用。相应地,如果描述短语IDF过小,则说明这个描述短语过于普遍,不宜被应用在针对标签的个性化广告文案中,而需要进行滤除处理。
图3示出了根据本说明书的实施例的基于标签-短语映射集来确定用户标签的描述短语的方法的一示例的流程图。
在块310中,确定标签-短语映射集。这里,标签-短语映射集包括标签与描述短语之间的映射关系。
需说明的是,标签-短语映射集可以是预存储的,例如存储在数据库中,而在块310中的操作可以表示在数据库中的针对此映射集的调用操作。示例性地,标签-短语映射集是通过将描述短语集提供给标签分类模型进行标签分类而确定出的,以及该描述短语集是基于预定短语提取策略来从语料库中提取出的。针对标签-短语映射集的确定操作的更多细节,可以参照下文中参考图4所描述的操作。
接着,在块320中,基于标签-短语映射集来确定与用户标签相匹配的描述短语。
示例性地,可以通过查找的方式从标签-短语映射集中得到具有用户标签相匹配的映射关系,进而将所得到的映射关系中所涉及的描述短语确定为与用户标签相匹配的描述短语。
图4示出了根据本说明书的实施例的用于确定标签-短语映射集的方法的一示例的流程图。
如图4所示,在块410中,基于预定短语提取策略来从语料库中提取出描述短语集。关于预定短语提取策略,可参照上文中参考图2中的块220所描述的操作,并且可以利用相同或相似的预定短语提取策略来从语料库中的语料语句(而非图2的示例中针对标签的标签语料语句)中提取出相应的描述短语集。
接着,在块420中,基于标签分类模型来对描述短语集进行标签分类,以确定标签-短语映射集。
这里,标签-短语映射集是通过将描述短语集提供给标签分类模型进行标签分类而确定出的,使得每个描述短语都可以被归类至相应的标签,以及在标签-短语映射集中的各个标签可能会存在相对应的至少一个描述短语。
关于本实施例中的标签分类模型,其可以表示用来将短语与对应的标签进行分类的机器学习模型,例如可以采用CNN(Convolutional Neural Networks,卷积神经网络)。这里,标签分类模型可以是基于数据样本集进行训练的,数据样本集包括多个短语及相对应的标签,且数据样本集中的多个短语包括或涵盖了(一个或多个)语料库中对应预定短语提取条件的短语。
图5示出了根据本说明书的实施例的用于准备针对标签分类模型的数据样本集的方法的一示例的流程图。
如图5所示,在块510中,基于语料库确定标签集中各个标签的扩展关键词。
这里,可以是通过在(一个或多个)语料库中进行数据挖掘的方式来确定扩展关键词。示例性地,从语料库中筛选包含标签文本的语料语句,之后从这些语料语句中提取关键词以作为扩展关键词。示例性地,针对“家庭妇女”,当在语料库中查找到含“家庭妇女”的语料语句“家庭妇女XX在冲奶粉”时,则可以将关键词“奶粉”作为相应的扩展关键词。
接着,在块520中,基于标签集中的各个标签和相应的扩展关键词,从语料库中确定针对各个标签的标签语料语句。这里,基于针对扩展关键词的文本匹配操作来确定标签语料语句,扩展了针对标签的语料语句。示例性地,可以将包含“奶粉”的语料语句确定为针对“家庭妇女”的标签语料语句。
接着,在块530中,基于预定短语提取策略,从各个标签语料语句中提取出各个标签所对应的描述短语。关于预定短语提取策略,可参照图2中参考块220所描述的操作。
接着,在块540中,根据各个标签和所对应的描述短语准备数据样本集。进而,利用数据样本集来对标签分类模型进行训练,使得标签分类模型能够将所提供的描述短语与对应的标签进行分类。
图6示出了根据本说明书的实施例的广告语句确定方法的一示例的流程图。
在一些应用场景下,基于语料库(例如,利用如图2或图3的实施方式)所确定的与用户标签匹配的描述短语的数量可能是多个,此时需要从多个描述短语中来选择较适宜或最适宜的描述短语来生成广告语句。
如图6所示的流程600,在块610中,基于目标用户的用户画像数据,确定目标用户的用户标签。
接着,在块620中,基于语料库确定与用户标签匹配的描述短语。
示例性地,可以使用如图2或图3所示的实施方式来确定与用户标签相匹配的描述短语。
接着,在块630中,判断描述短语的数量是否为多个。
应理解的是,在标签-短语映射集中针对一个标签所对应的描述短语的数量可以是一个多个,以及在语料库中所得到的针对用户标签的标签语料语句的数量也可以是一个或多个。因此,与用户标签相匹配的描述短语的数量可能为一个或多个。
接着,在块641中,当所确定出的与用户标签匹配的描述短语包括多个描述短语时,获取针对广告语句的应用语境信息。
这里,不同的描述短语所适用的应用语境信息可能也存在差异,所以需要收集针对广告语句的应用语境信息。
接着,在块643中,根据多个描述短语的用户标签相关度、广告业务类型和/或应用语境信息对多个描述短语进行筛选处理。
接着,在块645中,根据经筛选的描述短语和广告语句模板,生成针对用户标签的广告语句。
另外,在块651中,当所确定出的与用户标签匹配的描述短语仅为一个时,根据该描述短语和广告语句模板,生成针对用户标签的广告语句。关于块645或块651的操作可以参照上文中参考图1中的块130的操作。
关于上述块643中的筛选处理操作,其可以是应用包括用户标签相关度、广告业务类型和应用语境信息这三个指标中任意一者或多者的组合来实现的。
在针对多个描述短语的筛选处理操作的第一实施方式中,可以根据多个描述短语的用户标签相关度来从多个描述短语中确定描述短语。具体地,描述短语的标签相关度是基于与该描述短语所对应的标签语料语句匹配的用户标签和/或扩展关键词的数量来确定的。换言之,当在标签语料语句中所包含的用户标签和/或扩展关键词的数量越多时,从该标签语料语句所提取出的描述短语针对用户标签的标签相关度也相应地越高,反之亦然。进而,按照标签相关度对用户标签所对应的各个描述短语进行排序,并可以筛选出对应具有最高标签相关度的描述短语。由此,保障了广告语句中的描述短语与用户标签之间的相关性,增强用户对广告文案的归属感。
在针对多个描述短语的筛选处理操作的第二实施方式中,由于不同的描述短语所适用的广告业务类型可能存在差异,故可以根据多个描述短语的广告业务类型来在用户标签所匹配的多个描述短语中筛选描述短语。示例性地,针对“家庭妇女”存在诸如“爱家的你”、“广场舞达人”等多个描述短语,此时“爱家的你”更加贴合于针对家居商品的广告业务类型,“广场舞达人”更加贴合于针对运动型商品的广告业务类型,等等。另外,各个描述短语所适用的广告业务类型可以是通过语义理解模块或预配置信息来确定的。由此,实现了针对同一标签在不同广告业务类型下的广告语句的多样化,优化了智能文案的功能。
在针对多个描述短语的筛选处理操作的第三实施方式中中,由于不同的描述短语所适用的应用语境信息可能也存在差异,故可以利用应用语境信息在用户标签所匹配的多个描述短语中筛选描述短语。这里,应用语境信息可以包括与时间或节日信息相关联的自然语境信息,其还可以包括上下文语境信息。示例性地,针对用户标签“家庭妇女”在“生日语境”下所对应的描述短语是包含词语“生日”的短语,而在其他语境信息(例如新年或朋友聚会语境)下更换相应的描述短语。另外,各个描述短语所适用的应用语境可以是通过语义理解模块或预配置信息来确定的。由此,针对同一用户标签在不同应用语境信息的情况下可以分别确定出不同的描述短语,增强了广告文案与应用语境信息之间的匹配度,可以提高用户对广告文案的认知度。
另外,可以将上述筛选处理操作的多个实施方式进行组合,从而在多个描述短语中筛选描述短语。示例性地,首先按照标签相关度对用户标签所对应的多个描述短语进行排序,然后基于广告业务类型和/或应用语境信息对上述排序结果进行调整,进而筛选出适宜选入广告语句中的描述短语。可替换地,首先按照广告业务类型和/或应用语境信息对用户标签所对应的多个描述短语进行排序,然后基于标签相关度对上述排序结果进行调整,进而筛选出适宜选入广告语句中的描述短语,等等。
应理解的是,图6所示的广告语句确定方法的流程仅用作示例,该方法中的部分块的操作可以是非必需的。示例性地,在确定广告语句的过程中,可以不进行如块641中针对应用语境信息的获取操作,并且可以依据广告业务类型和/或标签相关度来对用户标签的多个描述短语进行筛选处理。
在本说明书的实施例中,在确定用户标签会匹配于多个描述短语时,通过应用诸如广告业务类型、用户标签相关度和应用语境信息之类的多个指标来筛选描述短语,进而生成相应的广告语句。由此,使得所确定的广告文案具有较强的用户归属感,能够满足不同广告业务类型下的个性化广告文案的需求,并且还可以提高用户对广告文案的认知度。
图7示出了根据本说明书的实施例的广告语句确定装置的一示例的方框图。
如图7所示,广告语句确定装置700包括标签确定单元710、标签语料语句查找单元720、描述短语提取单元730、广告语句生成单元740、扩展关键词获取单元750、描述短语筛选单元760、应用语境信息获取单元770、短语过滤单元780和广告语句推送单元790。
标签确定单元710基于目标用户的用户画像数据,确定所述目标用户的用户标签。标签确定单元710的操作可以参照上面参考图1描述的块110的操作。
标签语料语句查找单元720从语料库中查找出包含所述用户标签的至少一个标签语料语句。标签语料语句查找单元720的操作可以参照上面参考图2描述的块210的操作。
描述短语提取单元730基于预定短语提取策略来从所述至少一个标签语料语句中提取出所述描述短语。描述短语提取单元730的操作可以参照上面参考图2描述的块220的操作。
广告语句生成单元740根据所述描述短语和广告语句模板,生成针对所述用户标签的广告语句。广告语句生成单元740的操作可以参照上面参考图1描述的块130的操作。
扩展关键词获取单元750获取所述用户标签的至少一个扩展关键词,以及标签语料语句查找单元720从所述语料库中查找出包括所述用户标签和/或所述至少一个扩展关键词的至少一个标签语料语句。
描述短语筛选单元760根据所述多个描述短语的用户标签相关度和/或广告业务类型,对所述多个描述短语进行筛选处理。此时,广告语句生成单元740根据经过筛选处理后的描述短语和广告业务类型,生成针对所述用户标签的广告语句。描述短语筛选单元760的操作可以参照上面参考图6描述的块643的操作。
应用语境信息获取单元770获取广告语句的应用语境信息。描述短语筛选单元760根据所述多个描述短语的用户标签相关度、广告业务类型和/或所述应用语境信息,对所述多个描述短语进行筛选处理。应用语境信息获取单元770的操作可以参照上面结合应用语境信息所描述的操作。
短语过滤单元780基于短语过滤规则来对描述短语进行过滤处理。
广告语句推送单元790向所述目标用户推送所述广告语句。
进一步地,所述预定短语提取策略包括:基于预定短语提取条件来从语料语句中提取出描述短语,所述预定短语提取条件包括以下中的至少一种:具有设定短语关键词的正则表达式、语句设定短语成分规则和语句摘要规则。预定短语提取策略可以参照上面方法实施例中的相关描述。
需说明的是,如上所描述的广告语句确定装置700中的部分单元在一些应用场景下是非必需的或可选的。具体地,在一些实施方式中,描述短语筛选单元760、应用语境信息获取单元770、短语过滤单元780和广告语句推送单元790中的一者或多者可以不被保留。但需说明的是,在广告语句确定装置700中不存在描述短语筛选单元760时,对应的应用语境信息获取单元770也应不被保留。
图8示出了根据本说明书的实施例的广告语句确定装置的一示例的方框图。
如图8所示,广告语句确定装置800包括标签确定单元810、描述短语确定单元820和广告语句生成单元830。
标签确定单元810基于目标用户的用户画像数据,确定所述目标用户的用户标签。标签确定单元810的操作可以参照上面参考图1描述的块110的操作。
描述短语确定单元820基于标签-短语映射集来确定与所述用户标签匹配的描述短语,所述标签-短语映射集包括标签与描述短语之间的映射关系。其中,所述标签-短语映射集是通过将描述短语集提供给标签分类模型进行标签分类而确定出的,所述描述短语集是基于预定短语提取策略来从语料库中提取出的。描述短语确定单元820的操作可以参照上面参考图3描述的块320的操作。
广告语句生成单元830根据所述描述短语和广告语句模板,生成针对所述用户标签的广告语句。广告语句生成单元830的操作可以参照上面参考图1描述的块130的操作。
如上参照图1到图8,对根据本说明书的实施例的用于确定广告语句的方法及装置的实施例进行了描述。在以上对方法实施例的描述中所提及的细节,同样适用于本说明书的装置的实施例。上面的用于确定广告语句的装置可以采用硬件实现,也可以采用软件或者硬件和软件的组合来实现。
图9示出了根据本说明书的实施例的用于确定广告语句的计算设备900的一示例的硬件结构图。如图9所示,计算设备900可以包括至少一个处理器910、存储器(例如非易失性存储器)920、内存930和通信接口940,并且至少一个处理器910、存储器920、内存930和通信接口940经由总线960连接在一起。至少一个处理器910执行在存储器中存储或编码的至少一个计算机可读指令(即,上述以软件形式实现的元素)。
在一个实施例中,在存储器中存储计算机可执行指令,其当执行时使得至少一个处理器910:基于目标用户的用户画像数据,确定所述目标用户的用户标签;从语料库中查找出包含所述用户标签的至少一个标签语料语句;基于预定短语提取策略来从所述至少一个标签语料语句中提取出所述描述短语;根据所述描述短语和广告语句模板,生成针对所述用户标签的广告语句。
应该理解,在存储器920中存储的计算机可执行指令当执行时使得至少一个处理器910进行本说明书的各个实施例中以上结合图1-8描述的各种操作和功能。
在本说明书中,计算设备900可以包括但不限于:个人计算机、服务器计算机、工作站、桌面型计算机、膝上型计算机、笔记本计算机、移动计算设备、智能电话、平板计算机、蜂窝电话、个人数字助理(PDA)、手持装置、消息收发设备、可佩戴计算设备、消费电子设备等等。
根据一个实施例,提供了一种比如机器可读介质的程序产品。机器可读介质可以具有指令(即,上述以软件形式实现的元素),该指令当被机器执行时,使得机器执行本说明书的各个实施例中以上结合图1-8描述的各种操作和功能。具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。
在这种情况下,从可读介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此机器可读代码和存储机器可读代码的可读存储介质构成了本发明的一部分。
可读存储介质的实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD-RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上或云上下载程序代码。
本领域技术人员应当理解,上面说明书的各个实施例可以在不偏离发明实质的情况下做出各种变形和修改。因此,本发明的保护范围应当由所附的权利要求书来限定。
需要说明的是,上述各流程和各系统结构图中不是所有的步骤和单元都是必须的,可以根据实际的需要忽略某些步骤或单元。各步骤的执行顺序不是固定的,可以根据需要进行确定。上述各实施例中描述的装置结构可以是物理结构,也可以是逻辑结构,即,有些单元可能由同一物理实体实现,或者,有些单元可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
以上各实施例中,硬件单元或模块可以通过机械方式或电气方式实现。例如,一个硬件单元、模块或处理器可以包括永久性专用的电路或逻辑(如专门的处理器,FPGA或ASIC)来完成相应操作。硬件单元或处理器还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器),可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。
上面结合附图阐述的具体实施方式描述了示例性实施例,但并不表示可以实现的或者落入权利要求书的保护范围的所有实施例。在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”,并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的,具体实施方式包括具体细节。然而,可以在没有这些具体细节的情况下实施这些技术。在一些实例中,为了避免对所描述的实施例的概念造成难以理解,公知的结构和装置以框图形式示出。
本公开内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本公开内容。对于本领域普通技术人员来说,对本公开内容进行的各种修改是显而易见的,并且,也可以在不脱离本公开内容的保护范围的情况下,将本文所定义的一般性原理应用于其它变型。因此,本公开内容并不限于本文所描述的示例和设计,而是与符合本文公开的原理和新颖性特征的最广范围相一致。