CN112149407A - 标题生成方法、训练方法、装置、电子设备和存储介质 - Google Patents

标题生成方法、训练方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN112149407A
CN112149407A CN202010986957.3A CN202010986957A CN112149407A CN 112149407 A CN112149407 A CN 112149407A CN 202010986957 A CN202010986957 A CN 202010986957A CN 112149407 A CN112149407 A CN 112149407A
Authority
CN
China
Prior art keywords
target
title
media
history
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010986957.3A
Other languages
English (en)
Inventor
王晶冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Youzhuju Network Technology Co Ltd
Original Assignee
Beijing Youzhuju Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Youzhuju Network Technology Co Ltd filed Critical Beijing Youzhuju Network Technology Co Ltd
Priority to CN202010986957.3A priority Critical patent/CN112149407A/zh
Publication of CN112149407A publication Critical patent/CN112149407A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请提供了一种标题生成方法、训练方法、装置、电子设备和存储介质,其中,该方法包括:响应媒体投放请求,获取与目标媒体投放用户的媒体投放计划相关的历史数据和媒体投放方向信息,以及设定的投放关键词;将所述历史数据、所述媒体投放方向信息和所述投放关键词输入到标题预测模型中,得到与所述媒体投放计划对应的至少一个候选标题;根据预设筛选规则,从所述至少一个候选标题中筛选出待投放标题,通过上述方法只需要用户设定媒体投放方向信息和关键词之后就可以得到待投放标题,因此有利于降低用户在投放媒体内容时的投放难度。

Description

标题生成方法、训练方法、装置、电子设备和存储介质
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种标题生成方法、训练方法、装置、电子设备和存储介质。
背景技术
在通过媒体内容投放平台投放媒体内容(如:广告和文章等)之前,需要先获得媒体内容,其中,媒体内容包括媒体内容标题和媒体内容正文,媒体内容投放平台在获得一个完整的媒体内容后,可以将该媒体内容投放给用户端,该媒体内容在用户端展示时,只展示媒体内容标题,用户可以根据媒体内容标题中的内容确定是否打开该媒体内容,以查看该媒体内容中的媒体内容正文。
在现有技术中,用户可以通过自己的用户端选择向其他用户端投放媒体内容,但是这种方式需要用户自己提供媒体内容标题,从而增加了用户在投放媒体内容时的投放难度。
发明内容
有鉴于此,本申请实施例提供了一种标题生成方法、训练方法、装置、电子设备和存储介质,以降低用户投放媒体内容时的投放难度。
第一方面,本申请实施例提供了一种标题生成方法,包括:
响应媒体投放请求,获取与目标媒体投放用户的媒体投放计划相关的历史数据和媒体投放方向信息,以及设定的投放关键词;
将所述历史数据、所述媒体投放方向信息和所述投放关键词输入到标题预测模型中,得到与所述媒体投放计划对应的至少一个候选标题;
根据预设筛选规则,从所述至少一个候选标题中筛选出待投放标题。
可选地,所述历史数据包括以下至少一种:
所述目标媒体投放用户登录媒体投放平台时使用的登录身份标识ID下的第一历史媒体投放数据、所述目标媒体投放用户在所述登录ID下选择的媒体投放计划ID下的第二历史媒体投放数据、所述目标媒体投放用户在所述媒体投放计划ID下选择的媒体投放子计划下的第三历史媒体投放数据、所述目标媒体投放用户在所述媒体投放子计划下选择的当前落地页文本下的第四历史媒体投放数据;
所述媒体投放方向信息包括以下至少一种:
所述当前落地页文本、为所述媒体投放计划ID设置的第一行业信息,以及为所述媒体投放子计划设定的第二行业信息和受众信息。
可选地,所述第一历史媒体投放数据包括:所述登录ID下第一预设数量的第一历史落地页文本、第一历史标题和第一历史投放关键词;
所述第二历史媒体投放数据包括:所述媒体投放计划ID下所述第一预设数量的第二历史落地页文本、第二历史标题和第二历史投放关键词;
所述第三历史媒体投放数据包括:所述媒体投放子计划下所述第一预设数量的第三历史落地页文本和第三历史标题;
所述第四历史媒体投放数据包括:所述当前落地页文本下所述第一预设数量的第四历史标题和第三历史投放关键词;
所述第一行业信息和所述第二行业信息均包括至少一个行业等级信息;
所述受众信息包括第一目标人群包标签。
可选地,所述将所述历史数据、所述媒体投放方向信息和所述投放关键词输入到标题预测模型中,得到与所述媒体投放计划对应的至少一个候选标题,包括:
将所述历史数据的特征向量、所述媒体投放方向信息的特征向量和所述投放关键词的特征向量进行拼接处理,得到拼接向量;
将所述拼接向量输入到所述标题预测模型中,利用所述标题预测模型得到目标字典中的多个字符在各预设位置上的概率,其中,所述预设位置为预设标题字数范围下最大字数的标题的各个字符位置;
根据所述概率,从所述目标字典中选择出本次输入对应的目标字符,以得到本次次输入下按照所述目标字符的选择顺序构成的所述候选标题。
可选地,所述根据所述概率,从所述目标字典中选择出本次输入对应的目标字符,以得到本次次输入下按照所述目标字符的选择顺序构成的所述候选标题,包括:
按照所述预设位置在所述候选标题中的先后顺序,从所述目标字典中依次确定所述目标字符,以得到本次输入下的所述候选标题;
其中,所述候选标题中的第一个字符位置上的目标字符依据概率采样从所述目标字典中确定;所述候选标题中位于所述第一个字符位置之后的目标字符依据概率采样和位于该目标字符之前的字符的语义从所述目标字典中确定,直至得到最后一个目标字符。
可选地,所述概率预测模型是通过使用训练样本和获取的目标标题进行训练得到的,其中,所述训练样本时通过对将所述目标标题作为待投放标题时对应的目标历史数据、目标媒体投放信息和目标投放关键词进行构建得到的。
可选地,所述概率预测模型的第一损失值的变化范围位于预设范围内,其中,第二损失值是将所述训练样本作为输入参数输入到所述概率预测模型中得到的输出语句与所述目标标题之间的损失值,当所述第二损失值不位于所述预设范围内时,将所述第二损失值作为输入参数输入到指定的反向转播算法中,使用携带有输入参数的反向传播算法对所述概率预测模型中的参数进行调整,直至得到所述第一损失值。
可选地,所述目标历史数据包括:将所述目标标题作为待投放标题的目标登录ID下的第五历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放计划ID下的第六历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放子计划下的第七历史媒体投放数据、所述目标标题能够跳转到的目标落地页文本、所述目标落地页文本下的第八历史媒体投放数据、为所述目标媒体投放计划ID设置的第三行业信息,以及为所述目标媒体投放子计划设定的第四行业信息和目标受众信息。
可选地,所述第五历史媒体投放数据包括:所述目标登录ID下第二预设数量的第四历史落地页文本、第五历史标题和第四历史投放关键词;
所述第六历史媒体投放数据包括:所述目标媒体投放计划ID下所述第二预设数量的第五历史落地页文本、第六历史标题和第五历史投放关键词;
所述第七历史媒体投放数据包括:所述目标媒体投放子计划下所述第二预设数量的第六历史落地页文本和第七历史标题;
所述第八历史媒体投放数据包括:所述目标落地页文本下所述第二预设数量的第八历史标题和第六历史投放关键词;
所述第三行业信息和所述第四行业信息均包括至少一个行业等级信息;
所述目标受众信息包括第二目标人群包标签。
第二方面,本申请实施例提供了一种用于标题生成的概率预测模型训练方法,包括:
获取目标标题,以及将所述目标标题作为待投放标题时对应的目标历史数据、目标媒体投放信息和目标投放关键词;
根据所述目标历史数据、所述目标媒体投放信息和所述目标投放关键词构建训练样本;
使用所述训练样本和所述目标标题对标题预测模型进行训练。
可选地,所述使用所述训练样本和所述目标标题对标题预测模型进行训练,包括:
将所述训练样本作为输入参数,输入到所述标题预测模型中,得到输出语句;
确定所述输出语句和所述目标标题之间的损失值;
将所述损失值作为输入参数,输入到指定的反向传播算法中;
使用携带有输入参数的反向传播算法对所述标题预测模型中的可学习参数进行调整,直至得到的所述输出语句和所述目标标题之间的损失值的变化范围位于预设范围内。
可选地,所述目标历史数据包括:将所述目标标题作为待投放标题的目标登录ID下的第五历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放计划ID下的第六历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放子计划下的第七历史媒体投放数据、所述目标标题能够跳转到的目标落地页文本、所述目标落地页文本下的第八历史媒体投放数据、为所述目标媒体投放计划ID设置的第三行业信息,以及为所述目标媒体投放子计划设定的第四行业信息和目标受众信息。
可选地,所述第五历史媒体投放数据包括:所述目标登录ID下第二预设数量的第四历史落地页文本、第五历史标题和第四历史投放关键词;
所述第六历史媒体投放数据包括:所述目标媒体投放计划ID下所述第二预设数量的第五历史落地页文本、第六历史标题和第五历史投放关键词;
所述第七历史媒体投放数据包括:所述目标媒体投放子计划下所述第二预设数量的第六历史落地页文本和第七历史标题;
所述第八历史媒体投放数据包括:所述目标落地页文本下所述第二预设数量的第八历史标题和第六历史投放关键词;
所述第三行业信息和所述第四行业信息均包括至少一个行业等级信息;
所述目标受众信息包括第二目标人群包标签。
第三方面,本申请实施例提供了一种标题生成装置,包括:
获取单元,用于响应媒体投放请求,获取与目标媒体投放用户的媒体投放计划相关的历史数据和媒体投放方向信息,以及设定的投放关键词;
确定单元,用于将所述历史数据、所述媒体投放方向信息和所述投放关键词输入到标题预测模型中,得到与所述媒体投放计划对应的至少一个候选标题;
筛选单元,用于根据预设筛选规则,从所述至少一个候选标题中筛选出待投放标题。
可选地,所述历史数据包括以下至少一种:
所述目标媒体投放用户登录媒体投放平台时使用的登录身份标识ID下的第一历史媒体投放数据、所述目标媒体投放用户在所述登录ID下选择的媒体投放计划ID下的第二历史媒体投放数据、所述目标媒体投放用户在所述媒体投放计划ID下选择的媒体投放子计划下的第三历史媒体投放数据、所述目标媒体投放用户在所述媒体投放子计划下选择的当前落地页文本下的第四历史媒体投放数据;
所述媒体投放方向信息包括以下至少一种:
所述当前落地页文本、为所述媒体投放计划ID设置的第一行业信息,以及为所述媒体投放子计划设定的第二行业信息和受众信息。
可选地,所述第一历史媒体投放数据包括:所述登录ID下第一预设数量的第一历史落地页文本、第一历史标题和第一历史投放关键词;
所述第二历史媒体投放数据包括:所述媒体投放计划ID下所述第一预设数量的第二历史落地页文本、第二历史标题和第二历史投放关键词;
所述第三历史媒体投放数据包括:所述媒体投放子计划下所述第一预设数量的第三历史落地页文本和第三历史标题;
所述第四历史媒体投放数据包括:所述当前落地页文本下所述第一预设数量的第四历史标题和第三历史投放关键词;
所述第一行业信息和所述第二行业信息均包括至少一个行业等级信息;
所述受众信息包括第一目标人群包标签。
可选地,所述确定单元用于将所述历史数据、所述媒体投放方向信息和所述投放关键词输入到标题预测模型中,得到与所述媒体投放计划对应的至少一个候选标题时,包括:
将所述历史数据的特征向量、所述媒体投放方向信息的特征向量和所述投放关键词的特征向量进行拼接处理,得到拼接向量;
将所述拼接向量输入到所述标题预测模型中,利用所述标题预测模型得到目标字典中的多个字符在各预设位置上的概率,其中,所述预设位置为预设标题字数范围下最大字数的标题的各个字符位置;
根据所述概率,从所述目标字典中选择出本次输入对应的目标字符,以得到本次次输入下按照所述目标字符的选择顺序构成的所述候选标题。
可选地,所述确定单元用于根据所述概率,从所述目标字典中选择出本次输入对应的目标字符,以得到本次次输入下按照所述目标字符的选择顺序构成的所述候选标题时,包括:
按照所述预设位置在所述候选标题中的先后顺序,从所述目标字典中依次确定所述目标字符,以得到本次输入下的所述候选标题;
其中,所述候选标题中的第一个字符位置上的目标字符依据概率采样从所述目标字典中确定;所述候选标题中位于所述第一个字符位置之后的目标字符依据概率采样和位于该目标字符之前的字符的语义从所述目标字典中确定,直至得到最后一个目标字符。
可选地,所述概率预测模型是通过使用训练样本和获取的目标标题进行训练得到的,其中,所述训练样本时通过对将所述目标标题作为待投放标题时对应的目标历史数据、目标媒体投放信息和目标投放关键词进行构建得到的。
可选地,所述概率预测模型的第一损失值的变化范围位于预设范围内,其中,第二损失值是将所述训练样本作为输入参数输入到所述概率预测模型中得到的输出语句与所述目标标题之间的损失值,当所述第二损失值不位于所述预设范围内时,将所述第二损失值作为输入参数输入到指定的反向转播算法中,使用携带有输入参数的反向传播算法对所述概率预测模型中的参数进行调整,直至得到所述第一损失值。
可选地,所述目标历史数据包括:将所述目标标题作为待投放标题的目标登录ID下的第五历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放计划ID下的第六历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放子计划下的第七历史媒体投放数据、所述目标标题能够跳转到的目标落地页文本、所述目标落地页文本下的第八历史媒体投放数据、为所述目标媒体投放计划ID设置的第三行业信息,以及为所述目标媒体投放子计划设定的第四行业信息和目标受众信息。
可选地,所述第五历史媒体投放数据包括:所述目标登录ID下第二预设数量的第四历史落地页文本、第五历史标题和第四历史投放关键词;
所述第六历史媒体投放数据包括:所述目标媒体投放计划ID下所述第二预设数量的第五历史落地页文本、第六历史标题和第五历史投放关键词;
所述第七历史媒体投放数据包括:所述目标媒体投放子计划下所述第二预设数量的第六历史落地页文本和第七历史标题;
所述第八历史媒体投放数据包括:所述目标落地页文本下所述第二预设数量的第八历史标题和第六历史投放关键词;
所述第三行业信息和所述第四行业信息均包括至少一个行业等级信息;
所述目标受众信息包括第二目标人群包标签。
第四方面,本申请实施例提供了一种用于标题生成的概率预测模型训练装置,包括:
获取单元,用于获取目标标题,以及将所述目标标题作为待投放标题时对应的目标历史数据、目标媒体投放信息和目标投放关键词;
构建单元,用于根据所述目标历史数据、所述目标媒体投放信息和所述目标投放关键词构建训练样本;
训练单元,用于使用所述训练样本和所述目标标题对标题预测模型进行训练。
可选地,所述训练单元用于使用所述训练样本和所述目标标题对标题预测模型进行训练时,包括:
将所述训练样本作为输入参数,输入到所述标题预测模型中,得到输出语句;
确定所述输出语句和所述目标标题之间的损失值;
将所述损失值作为输入参数,输入到指定的反向传播算法中;
使用携带有输入参数的反向传播算法对所述标题预测模型中的可学习参数进行调整,直至得到的所述输出语句和所述目标标题之间的损失值的变化范围位于预设范围内。
可选地,所述目标历史数据包括:将所述目标标题作为待投放标题的目标登录ID下的第五历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放计划ID下的第六历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放子计划下的第七历史媒体投放数据、所述目标标题能够跳转到的目标落地页文本、所述目标落地页文本下的第八历史媒体投放数据、为所述目标媒体投放计划ID设置的第三行业信息,以及为所述目标媒体投放子计划设定的第四行业信息和目标受众信息。
可选地,所述第五历史媒体投放数据包括:所述目标登录ID下第二预设数量的第四历史落地页文本、第五历史标题和第四历史投放关键词;
所述第六历史媒体投放数据包括:所述目标媒体投放计划ID下所述第二预设数量的第五历史落地页文本、第六历史标题和第五历史投放关键词;
所述第七历史媒体投放数据包括:所述目标媒体投放子计划下所述第二预设数量的第六历史落地页文本和第七历史标题;
所述第八历史媒体投放数据包括:所述目标落地页文本下所述第二预设数量的第八历史标题和第六历史投放关键词;
所述第三行业信息和所述第四行业信息均包括至少一个行业等级信息;
所述目标受众信息包括第二目标人群包标签。
第五方面,本公开实施例提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如第一方面或第二方面所述的方法的步骤。
第六方面,本公开实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如第一方面或第二方面所述的方法的步骤。
本申请的实施例提供的技术方案可以包括以下有益效果:
在本申请中,在响应用户的媒体投放请求后,获取目标媒体投放用户的媒体投放计划相关的历史数据和媒体投放方向信息,以及设定的投放关键词,通过媒体投放计划相关的媒体投放方向信息和设定的投放关键词,可以确定目标媒体投放用户进行本次媒体投放时需要的标题的方向,通过历史数据可以确定目标媒体投放用户在历史上进行媒体投放时投放的历史标题,因此将历史数据、媒体投放方向信息和投放关键词输入标题预测模型中后,可以基于与本次媒体投放时需要的标题的方向相似的历史标题确定出进行本次媒体投放时与媒体投放计划对应的至少一个候选标题,然后再从确定出的候选标题出筛选出待投放标题,在上述方法中,候选标题是基于与本次媒体投放时需要的标题的方向相似的历史标题确定出的,而历史标题是目标媒体投放用户历史上使用过的标题,因此得到的各待投放标题是符合目标媒体投放用户进行本次媒体投放需求的标题,且满足目标媒体投放用户的个人偏好,因此通过上述方法只需要用户设定媒体投放方向信息和关键词之后就可以得到待投放标题,因此有利于降低用户在投放媒体内容时的投放难度。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例一提供的一种标题生成方法的流程示意图;
图2为本申请实施例一提供的一种数据结构的层级示意图;
图3为本申请实施例一提供的另一种标题生成方法的流程示意图;
图4为本申请实施例二提供的一种用于标题生成的概率预测模型训练方法的流程示意图;
图5为本申请实施例二提供的另一种用于标题生成的概率预测模型训练方法的流程示意图;
图6为本申请实施例三提供的一种标题生成装置的结构示意图;
图7为本申请实施例四提供的一种用于标题生成的概率预测模型训练装置的结构示意图;
图8为本申请实施例五提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前,媒体内容投放平台可以安装在用户端上,用户可以通过用户端向其他用户端投放媒体内容,用户在投放媒体内容时,不仅需要提高媒体内容正文,还需要提供媒体内容标题。媒体内容在用户端展示时,只展示媒体内容标题,用户可以根据媒体内容标题中的内容确定是否打开该媒体内容,以查看该媒体内容中的媒体内容正文,因此媒体内容标题是媒体内容中比较关键的一环。当需要用户自己提供媒体内容标题时,对于投放媒体内容的用户而言,设计媒体内容标题是一个相对复杂的工作,从而增加了用户在投放媒体内容时的投放难度。
了解决上述问题,本申请提供了一种标题生成方法、装置、电子设备和存储介质,通过上述方法只需要用户设定媒体投放方向信息和关键词之后就可以得到待投放标题,因此有利于降低用户在投放媒体内容时的投放难度。
需要提前说明的是,本申请涉及到的媒体投放方向信息为用于表示本次媒体投放计划面向的用户,例如:可以包括目标媒体投放用户(即:投放媒体内容的用户)所属行业、受众用户(接收投放的媒体内容的用户)所属行业和/或本次投放面向的人群等,以及还可以包括本次媒体投放计划的落地页等内容,投放关键词可以是一个词语或者也可以是一个语句。
以下是对本申请实施例的详细说明。
实施例一
图1为本申请实施例一提供的一种标题生成方法的流程示意图,如图1所示,该方法包括以下步骤:
步骤101、响应媒体投放请求,获取与目标媒体投放用户的媒体投放计划相关的历史数据和媒体投放方向信息,以及设定的投放关键词。
步骤102、将所述历史数据、所述媒体投放方向信息和所述投放关键词输入到标题预测模型中,得到与所述媒体投放计划对应的至少一个候选标题。
步骤103、根据预设筛选规则,从所述至少一个候选标题中筛选出待投放标题。
具体的,目标媒体投放用户在确定本次媒体投放计划的媒体投放方向信息和设定的投放关键词后,可以触发媒体投放请求,用户端响应本次媒体投放请求后,获取本次媒体投放计划的媒体投放方向信息和设定的投放关键词,以及获取与本次媒体投放计划相关的历史数据,通过媒体投放计划的媒体投放方向信息和设定的投放关键词,可以确定目标媒体投放用户进行本次媒体投放时需要的标题的方向,通过历史数据可以确定目标媒体投放用户在历史上进行媒体投放时投放的历史标题,因此将历史数据、媒体投放方向信息和投放关键词输入标题预测模型中后,可以基于与本次媒体投放时需要的标题的方向相似的历史标题确定出进行本次媒体投放时与媒体投放计划对应的至少一个候选标题,然后再从确定出的候选标题出筛选出待投放标题,在上述方法中,候选标题是基于与本次媒体投放时需要的标题的方向相似的历史标题确定出的,而历史标题是目标媒体投放用户历史上使用过的标题,因此得到的各待投放标题是符合目标媒体投放用户进行本次媒体投放需求的标题,且满足目标媒体投放用户的个人偏好,因此通过上述方法只需要用户设定媒体投放方向信息和关键词之后就可以得到待投放标题,因此有利于降低用户在投放媒体内容时的投放难度。
需要说明的是,具体的筛选规则可以根据实际需要设定,如:将候选标题中历史上未被使用的标题筛选出来作为待投放标题,或者,将候选标题中字数在一定范围内的标题筛选出来作为待投放标题等,具体的筛选规则在此不做具体限定。
需要注意的是,本申请中涉及到的具体的标题预测模型可以根据实际需要进行设定,例如,可以是transformer模型,具体的标题预测模型在此不做具体限定。
需要再次注意的是,在得到待投放标题后,目标媒体投放用户可以将一个待投放标题作为媒体内容的媒体内容标题使用,在将一个媒体内容投放给受众用户之前,需要先对人群进行圈选,以确定受众用户,然后再将该媒体内容投放给圈选结果中包括的用户,举例说明,投放平台可以根据用户在该平台上的行为信息为该用户设置标签,然后根据为用户设置的标签,将该用户的UID(User Identification,用户身份标识)设置到对应的人群包中,从而可以得到多个人群包,然后投放平台根据媒体内容投放用户设定的媒体内容投放人群,确定出多个目标人群包,然后从多个目标人群包中圈选出符合要求的用户,以作为受众用户,例如:当平台根据用户在平台上的行为信息确定该用户的年龄为18岁、所在位置为北京,兴趣爱好为骑行时,将该用户的UID设置到18岁对应的人群包、北京对应的人群包和骑行对应的人群包中,当媒体内容投放用户在该平台投放目标媒体内容为自行车,目标媒体内容的投放人群为18岁爱好骑行的北京青年时,确定出来的人群包包括:18岁对应的人群包、北京对应的人群包和骑行对应的人群包,然后对上述三个人群包进行圈选,得到同时存在于上述三个人群包的用户,并将圈选出来的用户作为受众用户,或者是将整个平台下的用户都作为受众用户等,具体确定将要投放目标媒体内容的用户的方法在此不做具体限定。
在一个可行的实施方案中,所述历史数据包括以下至少一种:
所述目标媒体投放用户登录媒体投放平台时使用的登录身份标识ID下的第一历史媒体投放数据、所述目标媒体投放用户在所述登录ID下选择的媒体投放计划ID下的第二历史媒体投放数据、所述目标媒体投放用户在所述媒体投放计划ID下选择的媒体投放子计划下的第三历史媒体投放数据、所述目标媒体投放用户在所述媒体投放子计划下选择的当前落地页文本下的第四历史媒体投放数据。
具体的,用户在媒体投放平台建立登录ID(Identification,身份标识)后,可以通过该登录ID登录媒体投放平台,并且可以在该登录ID下创建多个媒体投放计划ID,并且每个媒体投放计划ID下可以创建多个媒体投放子计划,每个媒体投放子计划下可以设定多个落地页文本,落地页文本用于跳转到对应的媒体内容正文,落地页文本中包括媒体内容标题,即:受众用户在点击媒体内容标题后,可以通过落地页文本调整到媒体内容正文所在的页面,图2为本申请实施例一提供的一种数据结构的层级示意图,登录ID、媒体投放计划ID、媒体投放子计划和落地页的层级关系如图2所示。
举例说明,以目标媒体投放用户为服装商为例,在建立登录ID后,可以在该登录ID下建立上衣、裤子、内衣等多个媒体投放子计划,以上衣为例,可以在上衣中建立牛仔上衣、休闲上衣、正装上衣等多个媒体投放子计划下,以休闲上衣为例,可以在休闲上衣下建立为各款休闲上衣设定的落地页文本。
在用户通过登录ID登录媒体投放平台后,可以按照图2所示的层级逐层打开,并且在用户选择出当前使用的落地页文本后,可以触发媒体投放请求,此时需要获取上述的第一历史媒体投放数据、第二历史媒体投放数据、第三历史媒体投放数据和第四历史媒体投放数据,其中,第一历史媒体投放数据为登录ID整体上的历史媒体投放数据,第二历史媒体投放数据为某一媒体投放计划ID整体上的历史媒体投放数据,第三历史媒体投放数据为某一某媒体投放子计划整体上的历史媒体投放数据,第四历史媒体投放数据为某一落地页文本整体上的历史媒体投放数据,通过上述四种历史媒体投放数据不仅可以从全局上体现用户在历史上的标题需求和个人偏好,还可以从具体层面体现用户在历史上的标题需求和个人偏好。
在一个可行的实施方案中,所述媒体投放方向信息包括以下至少一种:
所述当前落地页文本、为所述媒体投放计划ID设置的第一行业信息,以及为所述媒体投放子计划设定的第二行业信息和受众信息。
具体的,各媒体投放计划ID都设置有对应的第一行业信息(即:媒体投放计划ID所属行业),并且各媒体投放子计划也都设置有对应的第二行业信息(即:媒体投放子计划所面向的行业),以及对应的受众信息,以媒体投放计划ID为上衣为例,为其设定的第一行业信息为服装类,以媒体投放子计划为休闲上衣为例,由于不同得休闲上衣有不同的受众行业和受众群体,因此需要为其设定对应的第二行业信息(即:受众行业)和受众信息,例如:第二行业信息可以为公关类行业、服务类行业等,受众信息可以包括:年龄、性别、所在平台,所在区域等等。
在获取到上述的历史数据和媒体投放方向信息后,可以通过媒体投放方向信息确定出历史上与该媒体投放方向信息相似的媒体投放方向信息的历史数据,以便根据该历史数据得到对应的候选标题,由于候选标题为用户历史上使用过的标题,因此确定出来的候选标题不仅满足媒体内容的需求,还满足用户的个人偏好。
在一个可行的实施方案中,所述第一历史媒体投放数据包括:所述登录ID下第一预设数量的第一历史落地页文本、第一历史标题和第一历史投放关键词;
所述第二历史媒体投放数据包括:所述媒体投放计划ID下所述第一预设数量的第二历史落地页文本、第二历史标题和第二历史投放关键词;
所述第三历史媒体投放数据包括:所述媒体投放子计划下所述第一预设数量的第三历史落地页文本和第三历史标题;
所述第四历史媒体投放数据包括:所述当前落地页文本下所述第一预设数量的第四历史标题和第三历史投放关键词;
所述第一行业信息和所述第二行业信息均包括至少一个行业等级信息;
所述受众信息包括第一目标人群包标签。
需要说明的是,在选择第一预设数量的相关数据时,可以选择距离本次投放最近的第一预设数量的相关数据,关于第一预设数量的具体数值可以根据实际需要进行设定,例如:可以是距离本次投放最近的3个数据或者是5个数据,具体的第一预设数量在此不做具体限定,第一行业信息和第二行业信息可以包括两级行业信息,如:媒体投放计划ID所属的一级行业和二级行业,受众用户所属的一级行业和二级行业,其中,一级行业和二级行业可以为国家标准设定的行业。
在一个可行的实施方案中,图3为本申请实施例一提供的另一种标题生成方法的流程示意图,如图3所示,在执行步骤102时,可以通过以下步骤实现:
步骤301、将所述历史数据的特征向量、所述媒体投放方向信息的特征向量和所述投放关键词的特征向量进行拼接处理,得到拼接向量。
步骤302、将所述拼接向量输入到所述标题预测模型中,利用所述标题预测模型得到目标字典中的多个字符在各预设位置上的概率,其中,所述预设位置为预设标题字数范围下最大字数的标题的各个字符位置。
步骤303、根据所述概率,从所述目标字典中选择出本次输入对应的目标字符,以得到本次次输入下按照所述目标字符的选择顺序构成的所述候选标题。
具体的,在进行拼接处理时,将所述第一历史落地页文本的总向量、所述第一历史标题的总向量、所述第一历史投放关键词的总向量、所述第二历史落地页文本的总向量、所述第二历史标题的总向量、所述第二历史投放关键词的总向量、所述第三历史落地页文本的总向量、所述第三历史标题的总向量、所述第四历史标题的总向量、所述第三历史投放关键词的总向量、所述当前落地页文本的向量、所述行业等级信息的向量、所述第一目标人群包标签的向量和所述设定的投放关键词的向量进行向量拼接处理,以第一历史落地页文本为例,在得到第一预设数量的第一历史落地页文本后,对这几个第一历史落地页文本的向量进行加法运算,得到第一历史落地页文本的总向量,其他数据的总向量可参考第一历史落地页文本的总向量的得到方式确定,在得到上述10个总向量,当第一行业信息和第二行业信息均包括对应的一级行业和二级行业,第一目标人群包标签包括地域、年龄、性别和平台时,也需要得到上述几种数据的向量,此时可以得到历史数据对应的10个向量,媒体投放方向信息对应的9个向量,然后对上述19个向量进行拼接处理,得到拼接向量。
在得到拼接向量后,将得到的拼接向量输入到标题预测模型(如:概率预测模型)中,然后利用标题预测模型得到目标字典中各个字符在最大字数的标题上的各预设位置上的概率,例如:当设定的目标标题的最大字数为15个时,在将拼接向量输入到标题预测模型后,可以得到目标字典中的各个字符在第一个字符位置上的概率,目标字典中的各个字符在第二个字符位置上的概率,直至得到目标字典中的各个字符在第15个字符位置上的概率,由于目标字典中不同字符在不同字符位置上与拼接向量的关联程度不同,因此对于同一个字符位置,得到的目标字典中的各个字符的概率是不同的,并且对于不同字符位置,目标字典中的同一字符的概率也是不同的,以目标字典中的“你”和“者”这两字符为例,当目标标题的最大字数为5时,对于第一个字符位置,“你”的概率可能是0.9,“者”的概率可能为0.8,对于第二字符位置,“你”的概率可能是0.7,“者”的概率可能为0.8,对于第三字符位置,“你”的概率可能是0.1,“者”的概率可能为0.3,对于第四字符位置,“你”的概率可能是0.5,“者”的概率可能为0.9,对于第五字符位置,“你”的概率可能是0.1,“者”的概率可能为0.8。
在得到目标字典中各个字符在最大字数的标题上的各预设位置上的概率后,根据上述得到的概率,从目标字典中选择出目标字符,然后按照目标字符在目标标题的字符位置上的位置生成目标标题,例如:目标标题的最大字数为15,确定出来的目标字符数量可能为10个,或者也可能为15个,并且,每个目标字符都对应一个字符位置,且目标字符是按照字符位置的先后顺序依次确定出来的,因此可以根据目标字符的选择顺序构成目标题目。
在一个可行的实施方案中,在执行步骤303时,按照所述预设位置在所述候选标题中的先后顺序,从所述目标字典中依次确定所述目标字符,以得到本次输入下的所述候选标题;其中,所述候选标题中的第一个字符位置上的目标字符依据概率采样从所述目标字典中确定;所述候选标题中位于所述第一个字符位置之后的目标字符依据概率采样和位于该目标字符之前的字符的语义从所述目标字典中确定,直至得到最后一个目标字符。
具体的,在确定出目标字典中的各个字符在各字符位置上的概率后,需要先从目标字典中确定第一个字符位置上的目标字符,在确定第一个字符位置上的目标字符时,可以直接通过概率采样的方式从目标字典中确定,在确定出第一个字符位置上的目标字符后,再从目标字典中确定第二个字符位置上的目标字符,在确定第二个字符位置上的目标字符时依据第一个字符位置上的目标字符的语义,通过概率采样的方式从目标字典中确定,使得第二个字符位置上的目标字符和第一个字符位置上的目标字符具有语义关系,从目标字典中确定第三个字符位置上的目标字符时,在确定第三个字符位置上的目标字符时依据前两个字符位置上的目标字符的语义,通过概率采样的方式从目标字典中确定,使得第三个字符位置上的目标字符和前两个字符位置上的目标字符具有语义关系,以此类推,直至得到最后一个目标字符。
需要说明的是,本申请实施例中设定了目标标题的最大字数,最后一个目标字符所在的字符位置位于最大字符位置之前,例如:最大字数为20时,根据语义,最后一个目标字符所在字符位置可能是第8个字符位置,或者也可能是第10个字符位置。
在一个可行的实施方案中,所述概率预测模型是通过使用训练样本和获取的目标标题进行训练得到的,其中,所述训练样本时通过对将所述目标标题作为待投放标题时对应的目标历史数据、目标媒体投放信息和目标投放关键词进行构建得到的。
具体的,关于上述涉及到的数据的相关说明可参考上述关于历史媒体投放数据至历史媒体投放数据的相关说明,在获取到上述数据后,可以利用上述得到的数据构建训练样本,例如:对上述的数据的向量进行向量拼接,将拼接结果作为一个训练样本,然后使用得到的训练样本和目标标题对标题训练模型进行训练。
需要说明的是,在对标题预测模型进行训练时,每个模型训练样本可以使用多次,关于具体的训练方式在此不做具体限定。
需要说明的是,目标标题为历史上使用过的某一目标标题,其中,目标标题也是通过图1所示的方法得到的,上述的其他数据为与该目标标题相对应的数据,当目标标题为多个时,可以得到多个训练样本。
可选地,所述概率预测模型的第一损失值的变化范围位于预设范围内,其中,第二损失值是将所述训练样本作为输入参数输入到所述概率预测模型中得到的输出语句与所述目标标题之间的损失值,当所述第二损失值不位于所述预设范围内时,将所述第二损失值作为输入参数输入到指定的反向转播算法中,使用携带有输入参数的反向传播算法对所述概率预测模型中的参数进行调整,直至得到所述第一损失值。
具体的,在将训练样本输入到标题预测模型后,标题预测模型对训练样本进行处理后可以得到输出语句,即:输出的标题,为了使输出的标题与目标标题比较接近,需要计算输出语句和目标标题之间的损失值,例如:计算输出语句对应的矩阵和目标标题对应的矩阵之间的损失值,然后将损失值作为输入参数通过反向传播算法对标题预测模型中的可学习参数进行调整,以上为一次训练过程,在经过多次训练后,可以对可学习参数进行多次调整,并且每次调整后都可以减小输出的语句与目标标题之间的损失值,直至损失值预设范围内,此时则完成了训练,使用训练完成的标题预测模型再次得到的输出语句能够与目标标题基本相同,或者能够表示基本相同的语义,从而在使用训练完成的标题预测模型生成候选标题时,可以使候选标题与预想的标题基本一致。
在一个可行的实施方案中,所述目标历史数据包括:将所述目标标题作为待投放标题的目标登录ID下的第五历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放计划ID下的第六历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放子计划下的第七历史媒体投放数据、所述目标标题能够跳转到的目标落地页文本、所述目标落地页文本下的第八历史媒体投放数据、为所述目标媒体投放计划ID设置的第三行业信息,以及为所述目标媒体投放子计划设定的第四行业信息和目标受众信息。
具体的,关于上述涉及到的第五历史媒体投放数据至第八历史媒体投放数据的相关说明可参考上述关于第一历史媒体投放数据至第四历史媒体投放数据的相关说明。
可选地,所述第五历史媒体投放数据包括:所述目标登录ID下第二预设数量的第四历史落地页文本、第五历史标题和第四历史投放关键词;
所述第六历史媒体投放数据包括:所述目标媒体投放计划ID下所述第二预设数量的第五历史落地页文本、第六历史标题和第五历史投放关键词;
所述第七历史媒体投放数据包括:所述目标媒体投放子计划下所述第二预设数量的第六历史落地页文本和第七历史标题;
所述第八历史媒体投放数据包括:所述目标落地页文本下所述第二预设数量的第八历史标题和第六历史投放关键词;
所述第三行业信息和所述第四行业信息均包括至少一个行业等级信息;
所述目标受众信息包括第二目标人群包标签。
关于上述数据可参考第一历史媒体投放数据至第四历史媒体投放数据的相关说明,在此不再详细说明。
实施例二
图4为本申请实施例二提供的一种用于标题生成的概率预测模型训练方法的流程示意图,如图4所示,该方法还包括:
步骤401、获取目标标题,以及将所述目标标题作为待投放标题时对应的目标历史数据、目标媒体投放信息和目标投放关键词。
步骤402、根据所述目标历史数据、所述目标媒体投放信息和所述目标投放关键词构建训练样本。
步骤403、使用所述训练样本和所述目标标题对所述标题预测模型进行训练。
具体的,关于图4中涉及到的相关原理可参考实施例一中的相关说明,在此不再详细赘述。
在一个可行的实施方案中,图5为本申请实施例二提供的另一种用于标题生成的概率预测模型训练方法的流程示意图,如图5所示,在执行步骤403时,可以通过以下步骤实现:
步骤501、将所述训练样本作为输入参数,输入到所述标题预测模型中,得到输出语句。
步骤502、确定所述输出语句和所述目标标题之间的损失值。
步骤503、将所述损失值作为输入参数,输入到指定的反向传播算法中。
步骤504、使用携带有输入参数的反向传播算法对所述标题预测模型中的可学习参数进行调整,直至得到的所述输出语句和所述目标标题之间的损失值的变化范围位于预设范围内。
关于图5中涉及到的相关原理可参考实施例一中的相关说明,在此不再详细赘述。
在一个可行的实施方案中,所述目标历史数据包括:将所述目标标题作为待投放标题的目标登录ID下的第五历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放计划ID下的第六历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放子计划下的第七历史媒体投放数据、所述目标标题能够跳转到的目标落地页文本、所述目标落地页文本下的第八历史媒体投放数据、为所述目标媒体投放计划ID设置的第三行业信息,以及为所述目标媒体投放子计划设定的第四行业信息和目标受众信息。
关于上述涉及到的内容详细解释可参考实施例一中的相关说明,在此不再详细赘述。
在一个可行的实施方案中,所述第五历史媒体投放数据包括:所述目标登录ID下第二预设数量的第四历史落地页文本、第五历史标题和第四历史投放关键词;
所述第六历史媒体投放数据包括:所述目标媒体投放计划ID下所述第二预设数量的第五历史落地页文本、第六历史标题和第五历史投放关键词;
所述第七历史媒体投放数据包括:所述目标媒体投放子计划下所述第二预设数量的第六历史落地页文本和第七历史标题;
所述第八历史媒体投放数据包括:所述目标落地页文本下所述第二预设数量的第八历史标题和第六历史投放关键词;
所述第三行业信息和所述第四行业信息均包括至少一个行业等级信息;
所述目标受众信息包括第二目标人群包标签。
关于上述涉及到的内容详细解释可参考实施例一中的相关说明,在此不再详细赘述。
实施例三
图6为本申请实施例三提供的一种标题生成装置的结构示意图,如图6所示,该装置包括:
获取单元61,用于响应媒体投放请求,获取与目标媒体投放用户的媒体投放计划相关的历史数据和媒体投放方向信息,以及设定的投放关键词;
确定单元62,用于将所述历史数据、所述媒体投放方向信息和所述投放关键词输入到标题预测模型中,得到与所述媒体投放计划对应的至少一个候选标题;
筛选单元63,用于根据预设筛选规则,从所述至少一个候选标题中筛选出待投放标题。
在一个可行的实施方案中,所述历史数据包括以下至少一种:
所述目标媒体投放用户登录媒体投放平台时使用的登录身份标识ID下的第一历史媒体投放数据、所述目标媒体投放用户在所述登录ID下选择的媒体投放计划ID下的第二历史媒体投放数据、所述目标媒体投放用户在所述媒体投放计划ID下选择的媒体投放子计划下的第三历史媒体投放数据、所述目标媒体投放用户在所述媒体投放子计划下选择的当前落地页文本下的第四历史媒体投放数据;
所述媒体投放方向信息包括以下至少一种:
所述当前落地页文本、为所述媒体投放计划ID设置的第一行业信息,以及为所述媒体投放子计划设定的第二行业信息和受众信息。
在一个可行的实施方案中,所述第一历史媒体投放数据包括:所述登录ID下第一预设数量的第一历史落地页文本、第一历史标题和第一历史投放关键词;
所述第二历史媒体投放数据包括:所述媒体投放计划ID下所述第一预设数量的第二历史落地页文本、第二历史标题和第二历史投放关键词;
所述第三历史媒体投放数据包括:所述媒体投放子计划下所述第一预设数量的第三历史落地页文本和第三历史标题;
所述第四历史媒体投放数据包括:所述当前落地页文本下所述第一预设数量的第四历史标题和第三历史投放关键词;
所述第一行业信息和所述第二行业信息均包括至少一个行业等级信息;
所述受众信息包括第一目标人群包标签。
在一个可行的实施方案中,所述确定单元62用于将所述历史数据、所述媒体投放方向信息和所述投放关键词输入到标题预测模型中,得到与所述媒体投放计划对应的至少一个候选标题时,包括:
将所述历史数据的特征向量、所述媒体投放方向信息的特征向量和所述投放关键词的特征向量进行拼接处理,得到拼接向量;
将所述拼接向量输入到所述标题预测模型中,利用所述标题预测模型得到目标字典中的多个字符在各预设位置上的概率,其中,所述预设位置为预设标题字数范围下最大字数的标题的各个字符位置;
根据所述概率,从所述目标字典中选择出本次输入对应的目标字符,以得到本次次输入下按照所述目标字符的选择顺序构成的所述候选标题。
在一个可行的实施方案中,所述确定单元62用于根据所述概率,从所述目标字典中选择出本次输入对应的目标字符,以得到本次次输入下按照所述目标字符的选择顺序构成的所述候选标题时,包括:
按照所述预设位置在所述候选标题中的先后顺序,从所述目标字典中依次确定所述目标字符,以得到本次输入下的所述候选标题;
其中,所述候选标题中的第一个字符位置上的目标字符依据概率采样从所述目标字典中确定;所述候选标题中位于所述第一个字符位置之后的目标字符依据概率采样和位于该目标字符之前的字符的语义从所述目标字典中确定,直至得到最后一个目标字符。
在一个可行的实施方案中,所述概率预测模型是通过使用训练样本和获取的目标标题进行训练得到的,其中,所述训练样本时通过对将所述目标标题作为待投放标题时对应的目标历史数据、目标媒体投放信息和目标投放关键词进行构建得到的。
可选地,所述概率预测模型的第一损失值的变化范围位于预设范围内,其中,第二损失值是将所述训练样本作为输入参数输入到所述概率预测模型中得到的输出语句与所述目标标题之间的损失值,当所述第二损失值不位于所述预设范围内时,将所述第二损失值作为输入参数输入到指定的反向转播算法中,使用携带有输入参数的反向传播算法对所述概率预测模型中的参数进行调整,直至得到所述第一损失值。
可选地,所述目标历史数据包括:将所述目标标题作为待投放标题的目标登录ID下的第五历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放计划ID下的第六历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放子计划下的第七历史媒体投放数据、所述目标标题能够跳转到的目标落地页文本、所述目标落地页文本下的第八历史媒体投放数据、为所述目标媒体投放计划ID设置的第三行业信息,以及为所述目标媒体投放子计划设定的第四行业信息和目标受众信息。
可选地,所述第五历史媒体投放数据包括:所述目标登录ID下第二预设数量的第四历史落地页文本、第五历史标题和第四历史投放关键词;
所述第六历史媒体投放数据包括:所述目标媒体投放计划ID下所述第二预设数量的第五历史落地页文本、第六历史标题和第五历史投放关键词;
所述第七历史媒体投放数据包括:所述目标媒体投放子计划下所述第二预设数量的第六历史落地页文本和第七历史标题;
所述第八历史媒体投放数据包括:所述目标落地页文本下所述第二预设数量的第八历史标题和第六历史投放关键词;
所述第三行业信息和所述第四行业信息均包括至少一个行业等级信息;
所述目标受众信息包括第二目标人群包标签。
关于实施例三的相关原理可参考实施例一的详细说明,在此不再详细赘述。
实施例四
图7为本申请实施例四提供的一种用于标题生成的概率预测模型训练装置的结构示意图,如图7所示,该装置包括:
获取单元71,用于获取目标标题,以及将所述目标标题作为待投放标题时对应的目标历史数据、目标媒体投放信息和目标投放关键词;
构建单元72,用于根据所述目标历史数据、所述目标媒体投放信息和所述目标投放关键词构建训练样本;
训练单元73,用于使用所述训练样本和所述目标标题对标题预测模型进行训练。
在一个可行的实施方案中,所述训练单元73用于使用所述训练样本和所述目标标题对标题预测模型进行训练时,包括:
将所述训练样本作为输入参数,输入到所述标题预测模型中,得到输出语句;
确定所述输出语句和所述目标标题之间的损失值;
将所述损失值作为输入参数,输入到指定的反向传播算法中;
使用携带有输入参数的反向传播算法对所述标题预测模型中的可学习参数进行调整,直至得到的所述输出语句和所述目标标题之间的损失值的变化范围位于预设范围内。
在一个可行的实施方案中,所述目标历史数据包括:将所述目标标题作为待投放标题的目标登录ID下的第五历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放计划ID下的第六历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放子计划下的第七历史媒体投放数据、所述目标标题能够跳转到的目标落地页文本、所述目标落地页文本下的第八历史媒体投放数据、为所述目标媒体投放计划ID设置的第三行业信息,以及为所述目标媒体投放子计划设定的第四行业信息和目标受众信息。
在一个可行的实施方案中,所述第五历史媒体投放数据包括:所述目标登录ID下第二预设数量的第四历史落地页文本、第五历史标题和第四历史投放关键词;
所述第六历史媒体投放数据包括:所述目标媒体投放计划ID下所述第二预设数量的第五历史落地页文本、第六历史标题和第五历史投放关键词;
所述第七历史媒体投放数据包括:所述目标媒体投放子计划下所述第二预设数量的第六历史落地页文本和第七历史标题;
所述第八历史媒体投放数据包括:所述目标落地页文本下所述第二预设数量的第八历史标题和第六历史投放关键词;
所述第三行业信息和所述第四行业信息均包括至少一个行业等级信息;
所述目标受众信息包括第二目标人群包标签。
关于实施例四的原理说明可参考实施例二的相关解释,在此不做具体限定。
实施例五
图8为本申请实施例五提供的一种电子设备的结构示意图,包括:处理器801、存储介质802和总线803,所述存储介质802存储有所述处理器801可执行的机器可读指令,当电子设备运行上述实施例一或实施例二的方法时,所述处理器801与所述存储介质802之间通过总线803通信,所述处理器801执行所述机器可读指令,以执行实施例一中或实施例二中任一所述的方法的步骤。
实施例六
本申请实施例六还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行实施例一中或实施例二中任一所述的方法的步骤。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (17)

1.一种标题生成方法,其特征在于,包括:
响应媒体投放请求,获取与目标媒体投放用户的媒体投放计划相关的历史数据和媒体投放方向信息,以及设定的投放关键词;
将所述历史数据、所述媒体投放方向信息和所述投放关键词输入到标题预测模型中,得到与所述媒体投放计划对应的至少一个候选标题;
根据预设筛选规则,从所述至少一个候选标题中筛选出待投放标题。
2.如权利要求1所述的方法,其特征在于,所述历史数据包括以下至少一种:
所述目标媒体投放用户登录媒体投放平台时使用的登录身份标识ID下的第一历史媒体投放数据、所述目标媒体投放用户在所述登录ID下选择的媒体投放计划ID下的第二历史媒体投放数据、所述目标媒体投放用户在所述媒体投放计划ID下选择的媒体投放子计划下的第三历史媒体投放数据、所述目标媒体投放用户在所述媒体投放子计划下选择的当前落地页文本下的第四历史媒体投放数据;
所述媒体投放方向信息包括以下至少一种:
所述当前落地页文本、为所述媒体投放计划ID设置的第一行业信息,以及为所述媒体投放子计划设定的第二行业信息和受众信息。
3.如权利要求2所述的方法,其特征在于,所述第一历史媒体投放数据包括:所述登录ID下第一预设数量的第一历史落地页文本、第一历史标题和第一历史投放关键词;
所述第二历史媒体投放数据包括:所述媒体投放计划ID下所述第一预设数量的第二历史落地页文本、第二历史标题和第二历史投放关键词;
所述第三历史媒体投放数据包括:所述媒体投放子计划下所述第一预设数量的第三历史落地页文本和第三历史标题;
所述第四历史媒体投放数据包括:所述当前落地页文本下所述第一预设数量的第四历史标题和第三历史投放关键词;
所述第一行业信息和所述第二行业信息均包括至少一个行业等级信息;
所述受众信息包括第一目标人群包标签。
4.如权利要求1所述的方法,其特征在于,所述将所述历史数据、所述媒体投放方向信息和所述投放关键词输入到标题预测模型中,得到与所述媒体投放计划对应的至少一个候选标题,包括:
将所述历史数据的特征向量、所述媒体投放方向信息的特征向量和所述投放关键词的特征向量进行拼接处理,得到拼接向量;
将所述拼接向量输入到所述标题预测模型中,利用所述标题预测模型得到目标字典中的多个字符在各预设位置上的概率,其中,所述预设位置为预设标题字数范围下最大字数的标题的各个字符位置;
根据所述概率,从所述目标字典中选择出本次输入对应的目标字符,以得到本次次输入下按照所述目标字符的选择顺序构成的所述候选标题。
5.如权利要求4所述的方法,其特征在于,所述根据所述概率,从所述目标字典中选择出本次输入对应的目标字符,以得到本次次输入下按照所述目标字符的选择顺序构成的所述候选标题,包括:
按照所述预设位置在所述候选标题中的先后顺序,从所述目标字典中依次确定所述目标字符,以得到本次输入下的所述候选标题;
其中,所述候选标题中的第一个字符位置上的目标字符依据概率采样从所述目标字典中确定;所述候选标题中位于所述第一个字符位置之后的目标字符依据概率采样和位于该目标字符之前的字符的语义从所述目标字典中确定,直至得到最后一个目标字符。
6.如权利要求1所述的方法,其特征在于,所述概率预测模型是通过使用训练样本和获取的目标标题进行训练得到的,其中,所述训练样本时通过对将所述目标标题作为待投放标题时对应的目标历史数据、目标媒体投放信息和目标投放关键词进行构建得到的。
7.如权利要求6所述的方法,其特征在于,所述概率预测模型的第一损失值的变化范围位于预设范围内,其中,第二损失值是将所述训练样本作为输入参数输入到所述概率预测模型中得到的输出语句与所述目标标题之间的损失值,当所述第二损失值不位于所述预设范围内时,将所述第二损失值作为输入参数输入到指定的反向转播算法中,使用携带有输入参数的反向传播算法对所述概率预测模型中的参数进行调整,直至得到所述第一损失值。
8.如权利要求6所述的方法,其特征在于,所述目标历史数据包括:将所述目标标题作为待投放标题的目标登录ID下的第五历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放计划ID下的第六历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放子计划下的第七历史媒体投放数据、所述目标标题能够跳转到的目标落地页文本、所述目标落地页文本下的第八历史媒体投放数据、为所述目标媒体投放计划ID设置的第三行业信息,以及为所述目标媒体投放子计划设定的第四行业信息和目标受众信息。
9.如权利要求8所述的方法,其特征在于,所述第五历史媒体投放数据包括:所述目标登录ID下第二预设数量的第四历史落地页文本、第五历史标题和第四历史投放关键词;
所述第六历史媒体投放数据包括:所述目标媒体投放计划ID下所述第二预设数量的第五历史落地页文本、第六历史标题和第五历史投放关键词;
所述第七历史媒体投放数据包括:所述目标媒体投放子计划下所述第二预设数量的第六历史落地页文本和第七历史标题;
所述第八历史媒体投放数据包括:所述目标落地页文本下所述第二预设数量的第八历史标题和第六历史投放关键词;
所述第三行业信息和所述第四行业信息均包括至少一个行业等级信息;
所述目标受众信息包括第二目标人群包标签。
10.一种用于标题生成的概率预测模型训练方法,其特征在于,包括:
获取目标标题,以及将所述目标标题作为待投放标题时对应的目标历史数据、目标媒体投放信息和目标投放关键词;
根据所述目标历史数据、所述目标媒体投放信息和所述目标投放关键词构建训练样本;
使用所述训练样本和所述目标标题对标题预测模型进行训练。
11.如权利要求10所述的方法,其特征在于,所述使用所述训练样本和所述目标标题对标题预测模型进行训练,包括:
将所述训练样本作为输入参数,输入到所述标题预测模型中,得到输出语句;
确定所述输出语句和所述目标标题之间的损失值;
将所述损失值作为输入参数,输入到指定的反向传播算法中;
使用携带有输入参数的反向传播算法对所述标题预测模型中的可学习参数进行调整,直至得到的所述输出语句和所述目标标题之间的损失值的变化范围位于预设范围内。
12.如权利要求10所述的方法,其特征在于,所述目标历史数据包括:将所述目标标题作为待投放标题的目标登录ID下的第五历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放计划ID下的第六历史媒体投放数据、将所述目标标题作为待投放标题的目标媒体投放子计划下的第七历史媒体投放数据、所述目标标题能够跳转到的目标落地页文本、所述目标落地页文本下的第八历史媒体投放数据、为所述目标媒体投放计划ID设置的第三行业信息,以及为所述目标媒体投放子计划设定的第四行业信息和目标受众信息。
13.如权利要求12所述的方法,其特征在于,所述第五历史媒体投放数据包括:所述目标登录ID下第二预设数量的第四历史落地页文本、第五历史标题和第四历史投放关键词;
所述第六历史媒体投放数据包括:所述目标媒体投放计划ID下所述第二预设数量的第五历史落地页文本、第六历史标题和第五历史投放关键词;
所述第七历史媒体投放数据包括:所述目标媒体投放子计划下所述第二预设数量的第六历史落地页文本和第七历史标题;
所述第八历史媒体投放数据包括:所述目标落地页文本下所述第二预设数量的第八历史标题和第六历史投放关键词;
所述第三行业信息和所述第四行业信息均包括至少一个行业等级信息;
所述目标受众信息包括第二目标人群包标签。
14.一种标题生成装置,其特征在于,包括:
获取单元,用于响应媒体投放请求,获取与目标媒体投放用户的媒体投放计划相关的历史数据和媒体投放方向信息,以及设定的投放关键词;
确定单元,用于将所述历史数据、所述媒体投放方向信息和所述投放关键词输入到标题预测模型中,得到与所述媒体投放计划对应的至少一个候选标题;
筛选单元,用于根据预设筛选规则,从所述至少一个候选标题中筛选出待投放标题。
15.一种用于标题生成的概率预测模型训练装置,其特征在于,包括:
获取单元,用于获取目标标题,以及将所述目标标题作为待投放标题时对应的目标历史数据、目标媒体投放信息和目标投放关键词;
构建单元,用于根据所述目标历史数据、所述目标媒体投放信息和所述目标投放关键词构建训练样本;
训练单元,用于使用所述训练样本和所述目标标题对标题预测模型进行训练。
16.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至9中或权利要求10至13中任一项所述的方法的步骤。
17.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至9中或权利要求10至13中任一项所述的方法的步骤。
CN202010986957.3A 2020-09-18 2020-09-18 标题生成方法、训练方法、装置、电子设备和存储介质 Pending CN112149407A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010986957.3A CN112149407A (zh) 2020-09-18 2020-09-18 标题生成方法、训练方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010986957.3A CN112149407A (zh) 2020-09-18 2020-09-18 标题生成方法、训练方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN112149407A true CN112149407A (zh) 2020-12-29

Family

ID=73893239

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010986957.3A Pending CN112149407A (zh) 2020-09-18 2020-09-18 标题生成方法、训练方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN112149407A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112989205A (zh) * 2021-04-14 2021-06-18 北京有竹居网络技术有限公司 媒体文案推荐方法、装置、介质及电子设备
CN113034188A (zh) * 2021-03-29 2021-06-25 北京百度网讯科技有限公司 一种多媒体内容投放方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9589237B1 (en) * 2015-11-17 2017-03-07 Spotify Ab Systems, methods and computer products for recommending media suitable for a designated activity
CN110134931A (zh) * 2019-05-14 2019-08-16 北京字节跳动网络技术有限公司 媒介标题生成方法、装置、电子设备及可读介质
CN110263147A (zh) * 2019-06-05 2019-09-20 阿里巴巴集团控股有限公司 推送信息的生成方法及装置
CN111310011A (zh) * 2020-01-20 2020-06-19 北京字节跳动网络技术有限公司 一种信息推送方法、装置、电子设备及存储介质
CN111626779A (zh) * 2020-05-26 2020-09-04 Oppo广东移动通信有限公司 一种媒体信息处理方法、装置和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9589237B1 (en) * 2015-11-17 2017-03-07 Spotify Ab Systems, methods and computer products for recommending media suitable for a designated activity
CN110134931A (zh) * 2019-05-14 2019-08-16 北京字节跳动网络技术有限公司 媒介标题生成方法、装置、电子设备及可读介质
CN110263147A (zh) * 2019-06-05 2019-09-20 阿里巴巴集团控股有限公司 推送信息的生成方法及装置
CN111310011A (zh) * 2020-01-20 2020-06-19 北京字节跳动网络技术有限公司 一种信息推送方法、装置、电子设备及存储介质
CN111626779A (zh) * 2020-05-26 2020-09-04 Oppo广东移动通信有限公司 一种媒体信息处理方法、装置和存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113034188A (zh) * 2021-03-29 2021-06-25 北京百度网讯科技有限公司 一种多媒体内容投放方法、装置及电子设备
CN113034188B (zh) * 2021-03-29 2023-07-28 北京百度网讯科技有限公司 一种多媒体内容投放方法、装置及电子设备
CN112989205A (zh) * 2021-04-14 2021-06-18 北京有竹居网络技术有限公司 媒体文案推荐方法、装置、介质及电子设备

Similar Documents

Publication Publication Date Title
US11157956B2 (en) Application recommendation method and server
CN109657054B (zh) 摘要生成方法、装置、服务器及存储介质
US8521818B2 (en) Methods and apparatus for recognizing and acting upon user intentions expressed in on-line conversations and similar environments
US8719353B2 (en) Systems and methods for visual messaging
US20130325992A1 (en) Methods and apparatus for determining outcomes of on-line conversations and similar discourses through analysis of expressions of sentiment during the conversations
CN111242748B (zh) 用于向用户推荐项目的方法、装置和存储介质
CN110197389A (zh) 一种用户识别方法及装置
CN115380260A (zh) 用于网络游戏的用户输入文本的语言检测
CN111597446B (zh) 基于人工智能的内容推送方法、装置、服务器和存储介质
CN111125360A (zh) 游戏领域的情感分析方法、装置及其模型训练方法、装置
CN112149407A (zh) 标题生成方法、训练方法、装置、电子设备和存储介质
CN110569502A (zh) 一种违禁广告语的识别方法、装置、计算机设备及存储介质
CN113934941A (zh) 一种基于多维度信息的用户推荐系统及方法
Cecillon et al. Abusive language detection in online conversations by combining content-and graph-based features
CN109284389A (zh) 一种文本数据的信息处理方法、装置
CN116823410B (zh) 数据处理方法、对象处理方法、推荐方法及计算设备
CN111859930A (zh) 一种标题生成方法、装置、电子设备和存储介质
KR101652433B1 (ko) Sns 문서에서 추출된 토픽을 기반으로 파악된 감정에 따른 개인화 광고 제공 방법
CN107688594A (zh) 基于社交信息的风险事件的识别系统及方法
CN111460177A (zh) 影视类表情搜索方法、装置、存储介质、计算机设备
CN111597469A (zh) 展示位置的确定方法、确定装置、电子设备及存储介质
CN112691379B (zh) 游戏资源文本审核方法及装置、存储介质、计算机设备
US20220277145A1 (en) Domain Context Ellipsis Recovery for Chatbot
CN112215005A (zh) 实体识别方法及装置
Povoda et al. Optimization methods in emotion recognition system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201229

RJ01 Rejection of invention patent application after publication