CN115700579A - 广告文本生成方法及其装置、设备、介质 - Google Patents

广告文本生成方法及其装置、设备、介质 Download PDF

Info

Publication number
CN115700579A
CN115700579A CN202211106157.3A CN202211106157A CN115700579A CN 115700579 A CN115700579 A CN 115700579A CN 202211106157 A CN202211106157 A CN 202211106157A CN 115700579 A CN115700579 A CN 115700579A
Authority
CN
China
Prior art keywords
text
commodity
sentence
advertisement
half sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211106157.3A
Other languages
English (en)
Inventor
葛莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huanju Shidai Information Technology Co Ltd
Original Assignee
Guangzhou Huanju Shidai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huanju Shidai Information Technology Co Ltd filed Critical Guangzhou Huanju Shidai Information Technology Co Ltd
Priority to CN202211106157.3A priority Critical patent/CN115700579A/zh
Publication of CN115700579A publication Critical patent/CN115700579A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及计算机技术领域中一种广告文本生成方法及其装置、设备、介质,所述方法包括:获取广告商品的商品标题,及从该广告商品所属的商品品类的卖点数据库中确定出与商品标题相匹配的多个卖点关键词;将商品标题分别与各个卖点关键词构造为第一句对,将各个第一句对输入预设的前半句生成模型以获得相应的前半句文本,构造前半句集合;将商品标题及前半句集合中的每个前本句文本相拼接后,分别与各个卖点关键词构造成第二句对,将各个第二句对输入至预设的后半句生成模型以获得相应的后半句文本,构造成后半句集合;将前半句集合中的前半句文本与后半句集合中的后半句文本相拼接。本申请能够生成精准描述商品卖点的广告文本。

Description

广告文本生成方法及其装置、设备、介质
技术领域
本申请涉及电商技术领域,尤其涉及一种广告文本生成方法及其相应的装置、计算机设备、计算机可读存储介质。
背景技术
电商场景中,广告投放是商品吸引潜在顾客、促进购买行为的重要方式,而广告投放时向用户展示的重要内容之一就是广告文本。在实践中,创作广告文本需要充分理解商品和目标市场,了解广告投放的文案规范,在此基础之上,能够提取商品的卖点信息,采用一定的表达技巧,撰写出投合市场和最大程度达成商业目的的文案,由此足见广告文本的创作需要花费人力和时间。除此之外,编写广告文本也需要较高的专业水准,而商家用户往往缺少相应的条件,也为广告文本的创作带来困难。
传统广告文本的生成技术通常输入待投放广告的商品自身信息,例如商品标题、商品详情等等,基于预先训练至收敛的编解码网络生成相应的广告文本,由于在此过程中缺乏引入相应的商品卖点作为生成依据,因而所生成的广告文本对相应的商品卖点的描述不够充分和精准,导致广告文本的质量差强人意,难以吸引到顾客、不足以引发产生购买行为。
鉴于传统技术的不足,本申请人做出相应的探索。
发明内容
本申请的首要目的在于解决上述问题至少之一而提供一种广告文本生成方法及其相应的装置、计算机设备、计算机可读存储介质。
为满足本申请的各个目的,本申请采用如下技术方案:
适应本申请的目的之一而提供的一种广告文本生成方法,包括如下步骤:
获取广告商品的商品标题,以及从该广告商品所属的商品品类的卖点数据库中确定出与商品标题相匹配的多个卖点关键词;
将所述商品标题分别与各个卖点关键词构造为第一句对,将各个第一句对输入预设的前半句生成模型以获得相应的前半句文本,构造成前半句集合;
将所述商品标题及所述前半句集合中的每个前半句文本相拼接后,分别与各个所述卖点关键词构造成第二句对,将各个第二句对输入至预设的后半句生成模型以获得相应的后半句文本,构造成后半句集合;
将所述前半句集合中的前半句文本与后半句集合中的后半句文本相拼接。
另一方面,适应本申请的目的之一而提供的一种广告文本生成装置,包括数据获取模块、前半句生成模块、后半句生成模块以及广告文本生成模块,其中,数据获取模块,用于获取广告商品的商品标题,以及从该广告商品所属的商品品类的卖点数据库中确定出与商品标题相匹配的多个卖点关键词;前半句生成模块,用于将所述商品标题分别与各个卖点关键词构造为第一句对,将各个第一句对输入预设的前半句生成模型以获得相应的前半句文本,构造成前半句集合;后半句生成模块,用于将所述商品标题及所述前半句集合中的每个前半句文本相拼接后,分别与各个所述卖点关键词构造成第二句对,将各个第二句对输入至预设的后半句生成模型以获得相应的后半句文本,构造成后半句集合;广告文本生成模块,用于将所述前半句集合中的前半句文本与后半句集合中的后半句文本相拼接。
又一方面,适应本申请的目的之一而提供的一种计算机设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本申请所述的广告文本生成方法的步骤。
又一方面,适应本申请的另一目的而提供的一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的广告文本生成方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
本申请的技术方案存在多方面优势,包括但不限于如下各方面:
本申请实现两段式生成方案,先是以广告商品的商品标题分别与其相匹配的多个卖点关键词构造多个第一句对,采用前半句生成模型生成相应的多个前半句文本,之后再以所述商品标题及卖点关键词分别与各个前半句文本构造成第二句对,采用后半句生成模型以获得相应的多个后半句文本,进而以各个前本句文本对应与根据其生成的后半句文本相拼接,获得完整的多个广告文本。一方面,在此两段式生成的过程中,皆引入了广告商品的卖点特征,使得生成的无论是前半句文本或者是后半句文本都可以与卖点特征维持较强的关联度,均能精准地描述广告商品的卖点,从而所得的完整广告文本的描述能够充分聚焦广告商品的卖点。另一方面,所述两段式生成方案实现智能化生成,后半句文本的生成依赖于前半句文本作为输入,两者依然保持语义上的连贯性,能够保证所得的广告文本的表达通顺,而且,能够基于与广告商品相关的多个卖点特征及商品标题生成多样化的前本句文本,据此再生成多样化的后半句文本,使得最后所得的广告文本足够丰富以提供充足的参考,有效辅助广告文本的创作。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请的广告文本生成方法的典型实施例的流程示意图;
图2为本申请的实施例中构造多个商品品类相对应的卖点数据库的流程示意图;
图3为本申请的实施例中制备前半句生成模型和后半句生成模型相对应的训练样本的流程示意图;
图4为本申请的实施例中获取历史广告商品相对应的商品标题及其历史广告文本,确定该历史广告文本中的首个卖点关键词的流程示意图;
图5为本申请的实施例中前半句生成模型的训练过程的示意图;
图6为本申请的实施例中后半句生成模型的训练过程的示意图;
图7为本申请的广告文本生成装置的原理框图;
图8为本申请所采用的一种计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PersonalCommunications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global PositioningSystem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本申请所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
需要指出的是,本申请所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本申请的网络部署方式的实施方式。
本申请的一个或数个技术特征,除非明文指定,既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问,也可直接部署并运行于客户端来实施访问。
本申请中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用,某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。
本申请所涉及的各种数据,除非明文指定,既可远程存储于服务器,也可存储于本地终端设备,只要其适于被本申请的技术方案所调用即可。
本领域技术人员对此应当知晓:本申请的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本申请所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
本申请即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本申请的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
本申请的一种广告文本生成方法,可被编程为计算机程序产品,部署于客户端或服务器中运行而实现,例如,本申请的示例性应用场景中,可以在电商平台的服务器中部署实现,藉此可以通过访问该计算机程序产品运行后开放的接口,通过图形用户界面与该计算机程序产品的进程进行人机交互而执行该方法。
请参阅图1,本申请的广告文本生成方法,在其典型实施例中,包括如下步骤:
步骤S1100、获取广告商品的商品标题,以及从该广告商品所属的商品品类的卖点数据库中确定出与商品标题相匹配的多个卖点关键词;
本申请应用场景中的电商平台,主要表现为跨境电商平台,其允许每个线上店铺运行与相对应的独立站点中,向公众用户开放服务。公众用户可以通过各种渠道访问该线上店铺的页面,该些渠道包括但不限于线上店铺的内建页面、社交媒体信息展示页面等,公众用户可以通过关于这些渠道的链接直达所述线上店铺的相应页面。
当线上店铺的用户需要生成投放广告的广告商品的广告文本时,一种实施例中,可以通过一个广告生成页面,在其中指定需要生成广告文本相对应的广告商品。通常所述广告商品可以是线上店铺的商品数据库中的一个商品,或者也可以是由用户提供具体的商品信息而实现自定义的商品。为了便于理解,假设与商品相关的商品信息均存储于商品数据库中,用户通过该广告生成页面指定广告商品即可。
当线上店铺的用户需要指定所述的广告商品时,通常可以通过该广告商品唯一特征标识码即商品ID来调用所述广告商品的商品信息。所述商品信息包括但不限于图片、文本等不同类型的数据。所述商品信息中的文本类型的数据包含但不限于商品标题、商品详情文本、商品属性数据中任意一项或任意多项,然而商品标题通常是对商品卖点的精炼描述,涵盖生成广告文本所需的商品卖点,因而,可以选用商品标题作为生成相应广告商品的广告文本的输入数据,有助于采用生成式方式生成广告文本时,从输入的商品标题中提取出商品卖点相关的深层语义特征,用于生成描述商品卖点的广告文本。据此,在线上店铺的用户指定广告商品后,便可根据该广告商品的唯一标识码,从而获取广告商品的商品标题。
进一步,为了后续生成的广告文本能够更加精准地描述商品卖点,还可确定出与所述广告商品的商品标题相匹配的卖点关键词,以所述商品标题及其相匹配的卖点关键词作为生成广告文本的输入数据,所述卖点关键词主要是描述商品的卖点相对应的词汇,起到描述商品的卖点信息的作用。
可以预先构建商品品类的卖点数据库,所述卖点数据库存储对应商品品类下的卖点关键词,所述卖点关键词可通过从对应的商品品类的商品在历史投放广告使用的广告文本和/或该商品的商品文本信息集中提取而得,示范性举例,所述卖点关键词可为变速、可调速、变速齿轮、拔链器等,所述商品文本信息集包含但不限于商品标题、商品详情文本、商品属性数据中任意一项或任意多项。所述商品品类的卖点数据库的构建,可由本领域技术人员按照此处揭示灵活变通实现。
电商平台的线上店铺,通过均有构建商品的品类体系,用于分门别类归纳线上店铺内的海量商品,即各个商品都有其对应的品类。所述品类体系可以是多层分类体系,即包含多个分类层级,每个分类层级包含多个具体品类。品类体系的构建,可由电商平台统一提供模板,由商家用户自行修订确定。
从所述广告商品所属的商品品类的卖点数据库中确定出与商品标题相匹配的多个卖点关键词,可基于语义相似进行所述匹配,采用深度学习模型提取所述卖点数据库中的各个卖点关键词相对应的深层语义特征,以及提取所述广告商品的商品标题的深层语义特征,获得所述各个卖点关键词对应的向量化表示及所述商品标题的向量化表示,计算商品标题的向量化表示与各个卖点关键词对应的向量化表示之间的向量距离作为语义相似度,可以理解,所述语义相似度表征商品标题与各个卖点关键词之间的语义表达上的相似程度,因此,便可以各个卖点关键词对应的语义相似度,从所述卖点数据库中确定出语义相似度超过预设阈值的多个卖点关键词,作为与所述商品标题相匹配的卖点关键词,所述预设阈值可由本领域技术人员按需设置。所述深度学习模型可为NLP(Natural LanguageProcessing)领域中适用于提取文本语义特征的基于深层语义学习的网络模型,具体采用开源框架Sentence Transformers,它提供了大量的预先训练至收敛的Transformer模型,譬如:Bert、RoBERTa、XLM-RoBERTa、MPNet。在计算所述的向量距离时,可以Faiss、ElasticSearch、Milvus等大规模向量检索引擎中的任意一种来实施,也可以采用诸如余弦相似度、点积、曼哈顿距离、欧氏距离等任意一种现成的算法来计算。
步骤S1200、将所述商品标题分别与各个卖点关键词构造为第一句对,将各个第一句对输入预设的前半句生成模型以获得相应的前半句文本,构造成前半句集合;
所述前半句生成模型采用Encoder-Decoder(编码器-解码器)结构,所述的编码器,适于对输入文本进行向量表示和多层语义空间的转化学习,可以从多种已知模型中选择,包括但不限于RNN、BiLSTM、BiGRU、RoBERTa、ALBert、ERNIE、BERT-WWM等。所述的解码器,适于利用当前时间步的上文的编码向量序列以及编码器最后一个隐藏层的状态信息,经过多层自注意力和交叉自注意力机制,学习调整当前时间步的隐藏层的状态信息。可以选择的自回归预训练模型包括但不限于:GPT2、XLNet、DistilGPT2等,还可以采用RNN、LSTM、GRU等经典模型。一个实施例中,可采用Transformer模型,同时提供编码器和解码器,用于作为所述前半句生成模型的选型。
可以理解,所述前半句生成模型可预先经过训练直至收敛后,能够习得以输入的文本生成相应的前半句文本的能力,使得能够在本步骤中投入使用。
将所述商品标题分别与各个卖点关键词进行拼接,构造出多个第一句对,将各个第一句对输入预先训练至收敛的前半句生成模型。
针对单个所述第一句对而言,由前半句生成模型的编码器对第一句对进行编码,提取出第一句对对应的深层语义特征,获得相应的第一编码向量序列,第一编码向量序列中的各个元素为第一句对中相应词元的向量化表示,所述词元可通过对第一句对进行分词而确定。
进一步,由前半句生成模型的解码器以所述第一编码向量序列为前缀信息进行自回归解码,经过预设的词表分类器,逐时间步地预测出每个前缀信息相对应的第一文本向量,再将根据该第一文本向量确定的词元更新所述前缀信息以继续预测下一时间步的第一文本向量,实现自回归解码,在所述自回归解码完成后,便可确定出各个时间步对应的词元,从而构造出前半句文本。
所述词表分类器能够将解码器解码得到的隐层向量映射到前半句生成模型所引用的参考词表,从而获得一个映射到所述参考词表中各个词元的概率分布作为文本向量。所述的词表分类器,可以采用Softmax函数来构造,其在解码器的最后一个隐藏层之后接入,预测当前时间步所对应的词元,计算出相应的隐层向量映射到整个参考词表中的各个词元的概率分布,作为一个文本向量。
基于上述可以理解,采用预先训练至收敛的前半句生成模型以各个第一句对为输入,便可获得各个第一句对对应的前半句文本,推荐的可从各个第一句对对应的前半句文本中,筛选出差异较大的多个前半句文本构造成前半句集合,实现在保证前半句文本的多样性不变的前提下,有效地精简前半句文本的数量,提升后续的运行效率,后续能够根据该前半句集合中多样化的前半句文本,生成多样化的后半句文本。
所述筛选具体而言,一种实施例中,可采用基于字符层面计算相似度的算法,包含但不限于:Levenshtein距离、Jaccard距离、BLEU、ROUGE系列(ROUGE-N、ROUGE-L、ROUGE-W、ROUGE-S),计算出各个所述第一句对对应的前半句文本之间的相似度,从而筛选出相似度低于预设阈值即差异较大的多个前半句文本。所述预设阈值可由本领域技术人员按需设置。
另一种实施例中,可采用所述深度学习模型基于语义层面,提取出各个所述第一句对对应的前半句文本的深层语义特征,获得相应的向量化表示,计算各个所述前半句文本对应的向量化表示之间的向量距离作为相似度,从而筛选出相似度低于预设阈值即差异较大的多个前半句文本。所述预设阈值可由本领域技术人员按需设置。
步骤S1300、将所述商品标题及所述前半句集合中的每个前半句文本相拼接后,分别与各个所述卖点关键词构造成第二句对,将各个第二句对输入至预设的后半句生成模型以获得相应的后半句文本,构造成后半句集合;
所述后半句生成模型同样采用Encoder-Decoder(编码器-解码器)结构,可直接采用未经训练的同一所述前半句生成模型,或者根据步骤S1200揭示选取相应的编码器和解码器,作为后半句生成模型,进而以相应的训练集预先对该后半句生成模型进行训练直至收敛后,习得以输入的文本生成相应的后半句文本的能力,使得能够在本步骤中投入使用。
将所述商品标题及所述前半句集合中的每个前半句文本相拼接后,分别再与各个所述卖点关键词进行拼接,构造出多个第二句对,将各个第二句对输入预先训练至收敛的后半句生成模型。
针对单个所述第二句对而言,由后半句生成模型的编码器对第二句对进行编码,提取出第二句对对应的深层语义特征,获得相应的第二编码向量序列,第二编码向量序列中的各个元素为第二句对中相应词元的向量化表示,所述词元可通过对第二句对进行分词而确定。
进一步,由后半句生成模型的解码器以所述第二编码向量序列为前缀信息进行自回归解码,经过预设的词表分类器,逐时间步地预测出每个前缀信息相对应的第二文本向量,再将根据该第二文本向量确定的词元更新所述前缀信息以继续预测下一时间步的第二文本向量,实现自回归解码,在所述自回归解码完成后,便可确定出各个时间步对应的词元,从而构造出后半句文本。
所述词表分类器能够将解码器解码得到的隐层向量映射到后半句生成模型所引用的参考词表,从而获得一个映射到所述参考词表中各个词元的概率分布作为文本向量。所述的词表分类器,可以采用Softmax函数来构造,其在解码器的最后一个隐藏层之后接入,预测当前时间步所对应的词元,计算出相应的隐层向量映射到整个参考词表中的各个词元的概率分布,作为一个文本向量。
基于上述可以理解,采用预先训练至收敛的后半句生成模型以各个第二句对为输入,便可获得各个第二句对对应的后半句文本,从而构造成后半句集合。
步骤S1400、将所述前半句集合中的前半句文本与后半句集合中的后半句文本相拼接。
将所述前半句集合中的各个前半句文本,分别与以其作为后半句生成模型的部分输入,相应生成的在后半句集合中的各个后半句文本相拼接,获得多个完整的广告文本。进一步,可参考步骤1200揭示,从所述多个完整的广告文本中筛选出差异较大的多个广告文本,推送给指定所述广告商品的线上店铺的用户,实现在保证广告文本的多样性不变的前提下,有效地精简广告文本的数量,便于用户择其所需的广告文本。
根据本申请的典型实施例可以知晓,本申请的技术方案存在多方面优势,包括但不限于如下各方面:
本申请实现两段式生成方案,先是以广告商品的商品标题分别与其相匹配的多个卖点关键词构造多个第一句对,采用前半句生成模型生成相应的多个前半句文本,之后再以所述商品标题及卖点关键词分别与各个前半句文本构造成第二句对,采用后半句生成模型以获得相应的多个后半句文本,进而以各个前本句文本对应与根据其生成的后半句文本相拼接,获得完整的多个广告文本。一方面,在此两段式生成的过程中,皆引入了广告商品的卖点特征,使得生成的无论是前半句文本或者是后半句文本都可以与卖点特征维持较强的关联度,均能精准地描述广告商品的卖点,从而所得的完整广告文本的描述能够充分聚焦广告商品的卖点。另一方面,所述两段式生成方案实现智能化生成,后半句文本的生成依赖于前半句文本作为输入,两者依然保持语义上的连贯性,能够保证所得的广告文本的表达通顺,而且,能够基于与广告商品相关的多个卖点特征及商品标题生成多样化的前本句文本,据此再生成多样化的后半句文本,使得最后所得的广告文本足够丰富以提供充足的参考,有效辅助广告文本的创作。
请参阅图2,进一步的实施例中,步骤S1100、获取广告商品的商品标题的步骤之前,还包括如下步骤:
步骤S1001、按商品品类获取多个历史广告商品相对应的历史广告文本,针对每个商品品类统计选取出所述历史广告文本中的携带相应的商品的卖点信息的基准关键词;
从电商平台的各个线上店铺自行构建商品的品类体系中,确定各个不同的商品品类,从电商平台提供的广告系统中,获取每个商品品类对应的多个历史广告商品,在其历史投放广告时使用的历史广告文本,从中根据相应的广告投放成效数据,筛选出满足广告投放成效较佳的预设条件的历史广告文本,进一步,针对每个商品品类相对应筛选出的多个历史广告文本,通过对大量的所述历史广告文本的统计,确定出描述历史广告商品的卖点信息相对应的卖点关键词。所述广告投放成效数据包含但不限于点击率、转化率、ROAS(广告支出回报率)中的任意一项或多项,本领域技术人员可根据所述广告投放成效数据中的任意一项或多项,相应预设满足广告投放成效较佳的所述预设条件,例如点击率和转化率超过85%、ROAS大于4、点击率和转化率超过85%及ROAS大于4等等。
一种实施中,针对每个商品品类,先对所筛选出的全量的所述历史广告文本进行分词,相应获得各个分词集。然后,对所有分词集中的每个分词进行词频统计,统计每个分词出现在全部分词集中的词频,通常,词频越高,表示相应的分词被用于描述商品的卖点信息的情况越多,其成为卖点关键词的机会也就越大。根据这样的原理,在确定每个分词相对应的词频后,可以根据预设阈值选取出其中的部分分词,作为卖点关键词,再以各个所述卖点关键词为基准即作为基准关键词,后续扩展找出更多的卖点关键词。
步骤S1002、根据所述基准关键词从相应商品品类相对应的商品文本信息集中提取出各个基准关键词语义相近似的扩展关键词,所述商品文本信息集包含相应商品品类下多个历史广告商品相对应的文本信息,所述文本信息包括商品标题、商品详情文本、商品属性数据中任意一项或任意多项;
基于词频统计从筛选出的多个历史广告文本中获得的卖点关键词数量相对较少,为了使得描述历史广告商品的卖点信息相对应的卖点关键词的数量足够丰富,可以基于从筛选出的多个历史广告文本中确定的各个卖点关键词为基准即作为基准关键词,在给定的一个商品文本信息集中寻找语义相近似的卖点关键词。
所述商品文本信息集,可以从电商平台的线上店铺的商品数据库中提取,对应文本信息的选型,可以是商品的商品标题、商品详情文本、商品属性数据、商品品类等任意一项或多项,使得商品文本信息集中包含足量的多个商品相对应的文本信息。
为了方便扩展词汇,商品文本信息集中的每个文本信息均可先行进行分词,然后再根据各个分词与每个所述基准关键词之间语义相似度,根据预设阈值确定与基准关键词语义相似的卖点关键词作为相应商品品类的扩展关键词,所述语义相似度具体实现可参考步骤S1100实施。示范性举例:所述基准关键词可以是:变速、时速、刹车、辅助系统、可折叠、续航里程、适用地形、电池、电机等等。与基准关键词语义相近似的扩展关键词,以“变速”为例,可以是:变速、可调速、变速齿轮、拔链器等。
步骤S1003、构造各个商品品类相对应的卖点数据库,其中存储相应商品品类下各个基准关键词相对应的卖点关键词集合,每个所述的卖点关键词集合包含其对应的基准关键词及根据该基准关键词获得的扩展关键词。
确定了多个扩展关键词之后,便可构造各个商品品类相对应的卖点数据库,其中存储相应的历史广告文本中提取出的各个基准关键词,及关联与相应基准关键词语义相近似的各个扩展关键词,构造出的各个卖点关键词集合,从而各个卖点关键词集合中的基准关键词起到指代作用,使得在后续匹配广告商品的商品标题时,便可首先与各个卖点关键词集合中的基准关键词进行匹配,确定相匹配的基准关键词后,再与该基准关键词关联的扩展关键词进行匹配,从而确定出与所述商品标题相匹配的各个卖点关键词,由于在此过程中,仅匹配与商品标题相匹配的基准关键词语义相近似的扩展关键词,能够有效提升匹配效率。
本实施例中,揭示了各个商品品类下的卖点数据库的构造过程中,先参考历史广告文本的词频统计结果确定出多个基础关键词,然后再参考商品文本信息集对各个基础关键词进行扩展,获得相应的扩展关键词,进而以每个基础关键词关联以其扩展的扩展关键词构建相应的卖点关键词集合,可以理解,整个技术实现无需引入人工因素,可自动化实施,实施成本较低,而成效较佳。
请参阅图3,进一步的实施例中,步骤S1100、获取广告商品的商品标题的步骤之前,还包括如下步骤:
步骤S1010、获取历史广告商品相对应的商品标题及其历史广告文本,根据所述历史广告商品的商品品类相对应的卖点数据库中的卖点关键词,确定历史广告文本中的首个卖点关键词;
获取足量的历史广告商品相对应的商品标题,以及相应的每个历史广告商品在其历史投放广告时使用的历史广告文本,进一步,根据每个历史广告商品所属的商品品类相对应的卖点数据库存储的卖点关键词,采用直接的文本匹配方式,确定每个历史广告商品的历史广告文本中的第一个匹配的卖点关键词作为首个卖点关键词。
步骤S1020、将所述历史广告文本分割为所述首个卖点关键词前面的前半句文本和所述首个卖点关键词后面的后半句文本;
在确定出所述各个历史广告文本相对应的首个卖点关键词后,一种实施例中,基于字符为单位对各个历史广告文本进行位置编码,获得各个历史广告文本相对应的首个卖点关键词对应的起始位置编码及末尾位置编码,从而便可根据该起始位置编码,为相应的历史广告文本分割出首个卖点关键词前面的前半句文本,根据该末尾位置编码,为相应历史广告文本分割出首个卖点关键词后面的后半句文本,所述位置编码示范性举例,一条历史广告文本为:“Swift and quick gear change,stable gear shifting,one key forprecise and easy shifting”,对应的首个卖点关键词为“gear change”,假使位置编码从0开始,那么对应该首个卖点关键词的起始位置编码为16,末尾位置编码为26。可见通过位置编码便可无需采用人工分割,有效实现自动化精准地分割历史广告文本对应的前半句文本和后半句文本。
步骤S1030、将所述历史广告文本的商品标题及其首个卖点关键词构成的第一样本句对作为输入,训练所述前半句生成模型生成所述前半句文本;
针对各个所述历史广告文本,将其商品标题拼接其首个卖点关键词构成第一样本句对作为单个第一训练样本,所述拼接可采用特殊字符例如[SEP],示范性举例,“商品标题[SEP]首个卖点关键词”,特殊字符[SEP]有助于前半句生成模型分辨特殊字符前面部分是商品自身信息,以及后面部分是卖点控制信息,可以理解,所述卖点控制信息能够引导所述模型生成前半句文本所需描述的卖点语义,从而以各个第一训练样本构造出训练集,用于训练所述前半句生成模型,使得前半句生成模型在训练至收敛后,习得以商品标题拼接相应的卖点关键词作为输入,生成相应的前半句文本的能力。具体训练过程由后续部分实施例进一步揭示,本步骤暂且按下不表。
步骤S1040、将所述历史广告文本的商品标题及其首个卖点关键词及所述前半句文本构成的第二样本句对作为输入,训练所述后半句生成模型生成所述后半句文本。
针对各个所述历史广告文本,将其商品标题拼接由训练至收敛的所述前半句生成模型生成的相应的前半句文本,再拼接其首个卖点关键词构成第二样本句对作为单个第二训练样本,所述拼接可采用特殊字符例如[SEP],示范性举例,“商品标题[SEP]前半句文本首个卖点关键词”,特殊字符[SEP]有助于后半句生成模型分辨特殊字符的前面部分是商品自身信息,以及后面部分是上文信息及卖点控制信息,可以理解,所述卖点控制信息能够引导所述模型生成后半句文本所需描述的卖点语义,从而以各个第二训练样本构造出训练集,用于训练所述后半句生成模型,使得后半句生成模型在训练至收敛后,习得以商品标题拼接相应的前半句文本再拼接相应的卖点关键词作为输入,生成相应的后半句文本的能力。具体训练过程由后续部分实施例进一步揭示,本步骤暂且按下不表。
本实施例中,揭示了前半句生成模型及后半句生成模型相对应的训练样本的构建,在此过程中,采用了位置编码方式,使得无需引入人工因素,可自动化实施,实施成本较低,而成效较佳。
请参阅图4,进一步的实施例中,步骤S1010、获取历史广告商品相对应的商品标题及其历史广告文本,根据所述历史广告商品的商品品类相对应的卖点数据库中的卖点关键词,确定历史广告文本中的首个卖点关键词的步骤中,包含如下步骤:
步骤S1011、按商品品类获取多个历史广告商品对应的历史广告文本及其广告投放成效数据;
从电商平台的各个线上店铺自行构建商品的品类体系中,确定各个不同的商品品类,从电商平台提供的广告系统中,获取每个商品品类对应的多个历史广告商品,在其历史投放广告时使用的历史广告文本,以及广告投放成效数据。
步骤S1012、筛选出满足预设条件的每个广告投放成效数据对应的历史广告文本作为目标广告文本,获取其对应的历史广告商品的商品标题及其所属的商品品类;
进一步,根据所述广告投放成效数据,筛选出满足广告投放成效较佳的预设条件的历史广告文本作为目标广告文本,进一步,获取其对应的历史广告商品的商品标题及其所属的商品品类。所述广告投放成效数据包含但不限于点击率、转化率、ROAS(广告支出回报率)中的任意一项或多项,本领域技术人员可根据所述广告投放成效数据中的任意一项或多项,相应预设满足广告投放成效较佳的所述预设条件,例如点击率和转化率超过85%、ROAS大于4、点击率和转化率超过85%及ROAS大于4等等。
步骤S1013、针对每个目标广告文本,从其历史广告商品所属的商品品类的卖点数据库中,确定与其相匹配的首个卖点关键词。
具体实现可参考步骤S1010,本步骤恕不赘述。
本实施例中,通过历史广告文本对应的广告投放成效数据,筛选出广告投放成效较佳的历史广告文本作为目标广告文本,可以理解,目标广告文本所描述的历史广告商品的卖点信息较为精准,而且备受实际市场认可,使得确定出的相匹配的卖点关键词实用价值更高,有助于一定程度上保障后续以所述目标广告文本及其卖点关键词,制备前半句生成模型及后半句生成模型相对应的训练样本对商品卖点的描述的精准性。
请参阅图5,进一步的实施例中,步骤S1030、将所述历史广告文本的商品标题及其首个卖点关键词构成的第一句对作为输入,训练所述前半句生成模型生成所述前半句文本,包括如下步骤:
步骤S1031、从预备的训练集中获取单个第一训练样本,所述第一训练样本包括单个预选的历史广告文本的所述第一样本句对;
所述训练集的预先制备的实现,可参考步骤S1030,本步骤恕不赘述。
步骤S1032、将所述第一训练样本输入所述前半句生成模型,逐时间步自回归预测出相应的前半句文本中的各个词元;
采用前半句生成模型以所述第一训练样本作为输入,对所述第一训练样本进行分词,获得分词文本序列,其中包含第一样本句对中的各个分词词元,可参考前半句生成模型所引用的参考词表,将所述分词文本序列中的各个分词词元转换为所述参考词表中对应词元的编码特征,将这些编码特征构造为相应的第一编码向量,输入至前半句生成模型的编码器进行推理,一种实施例中,还可以在所述第一样本句对的各个分词词元的编码特征的基础上,进一步结合各个分词词元的位置编码,以丰富编码向量的参考信息。
所述前半句生成模型的编码器,如前部分实施例所述,可采用双向特征表示编码模型实现,因而,适于参考所输入的第一编码向量的上下文信息进行深层语义信息的提取,获得第一编码向量序列,所述上下文信息包含第一样本句对中商品自身信息即商品标题的编码特征以及卖点控制信息即卖点关键词的编码特征,本领域技术人员应当知晓,在对上下文信息进行深层语义信息的提取时,部分深层语义信息的提取,能够参考所述卖点控制信息的编码特征,重点关注相应的卖点语义而将其提取出。
进一步,前半句生成模型的解码器,以所述第一编码向量序列所构成的前缀信息为初始输入,在多头注意力机制的基础上,进行序列化解码,逐个时间步地解码,将解码所得结果经过词表分类器进行分类映射,获得映射到所述参考词表中的各个词元的概率分布,构成文本向量,根据文本向量中的分类概率便可优选出当前时间步所对应的词元,将该词元在所述参考词表中的编码特征再追加到所述的前缀信息中,实现自回归,然后根据更新后的前缀信息继续下一时间步的解码,如此递进,直至遭遇结束符而完成所有文本向量的预测,也就完成前半句文本中的各个词元的预测,从而获得相应的前半句文本。所述优选通常是选取文本向量中概率最高的词元,当然本领域技术人员亦可采用其他的解码策略确定实现所述每个时间步的词元选取,例如Top_K算法、集束搜索算法、贪心搜索算法等。
步骤S1033、采用所述第一训练样本所包括的历史广告文本的前半句文本作为第一监督标签,确定所述前半句生成模型所预测的前半句文本的损失值,在所述损失值未达到预设阈值时对所述前半句生成模型实施权重更新,并继续调用其他训练样本实施迭代训练直到模型收敛。
一种实施例中,调用预设的交叉熵损失函数,此处可由本领域技术人员根据先验知识或实验经验灵活变通设置,根据所述第一训练样本所包括的历史广告文本的前半句文本作为第一监督标签,计算所述前半句文本的交叉熵损失值,当该损失值达到预设阈值时,表明前半句生成模型已被训练至收敛状态,从而可以终止模型训练;损失值未达到预设阈值时,表明模型未收敛,于是根据该损失值对模型实施梯度更新,通常通过反向传播修正模型各个环节的权重参数以使模型进一步逼近收敛,然后,继续调用所述训练集中的下一训练样本对该模型实施迭代训练,直至该模型被训练至收敛状态为止。
另一种实施例中,调用预设的交叉熵损失函数,此处可由本领域技术人员根据先验知识或实验经验灵活变通设置,根据所述第一训练样本所包括的历史广告文本的前半句文本的倒序版本作为第一监督标签,计算所述前半句文本的交叉熵损失值,当该损失值达到预设阈值时,表明前半句生成模型已被训练至收敛状态,从而可以终止模型训练;损失值未达到预设阈值时,表明模型未收敛,于是根据该损失值对模型实施梯度更新,通常通过反向传播修正模型各个环节的权重参数以使模型进一步逼近收敛,然后,继续调用所述训练集中的下一训练样本对该模型实施迭代训练,直至该模型被训练至收敛状态为止。可以理解,如此监督训练前半句生成模型至收敛,所生成的前半句文本是倒序版本的,因而,将生成的倒序版本的前半句文本转换为正序版本即可应用于后续。本实施例实现的以倒序版本的前半句文本作为第一监督标签,训练所述前半句生成模型,一定程度上能够使得模型生成的前半句文本更通顺和合理。
本实施例中,通过监督训练前半句生成模型至收敛,使得前半句生成模型习得以商品标题拼接相应的卖点关键词作为输入,便能生成精准描述相应的商品卖点的前半句文本的能力。
请参阅图6,进一步的实施例中,步骤S1040、将所述历史广告文本的商品标题及其首个卖点关键词及所述前半句文本构成的第二样本句对作为输入,训练所述后半句生成模型生成所述后半句文本,包括如下步骤:
步骤S1041、从预备的训练集中获取的单个第二训练样本,所述第二训练样本包括单个预选的历史广告文本的所述第二样本句对;
所述训练集的预先制备的实现,可参考步骤S1040,本步骤恕不赘述。
步骤S1042、将所述第二训练样本输入所述后半句生成模型,逐时间步自回归预测出相应的后半句文本中的各个词元;
采用后半句生成模型以所述第二训练样本作为输入,对所述第二训练样本进行分词,获得分词文本序列,其中包含第二样本句对中的各个分词词元,可参考后半句生成模型所引用的参考词表,将所述分词文本序列中的各个分词词元转换为所述参考词表中对应词元的编码特征,将这些编码特征构造为相应的第二编码向量,输入至后半句生成模型的编码器进行推理,一种实施例中,还可以在所述第二样本句对的各个分词词元的编码特征的基础上,进一步结合各个分词词元的位置编码,以丰富编码向量的参考信息。
所述后半句生成模型的编码器,如前部分实施例所述,可采用双向特征表示编码模型实现,因而,适于参考所输入的第二编码向量的上下文信息进行深层语义信息的提取,获得第二编码向量序列,所述上下文信息包含第二样本句对中商品自身信息即商品标题的编码特征、前本句文本的编码特征以及卖点控制信息即卖点关键词的编码特征,本领域技术人员应当知晓,在对上下文信息进行深层语义信息的提取时,部分深层语义信息的提取,能够参考所述卖点控制信息的编码特征,重点关注相应的卖点语义而将其提取出。
进一步,后半句生成模型的解码器,以所述第二编码向量序列所构成的前缀信息为初始输入,在多头注意力机制的基础上,进行序列化解码,逐个时间步地解码,将解码所得结果经过词表分类器进行分类映射,获得映射到所述参考词表中的各个词元的概率分布,构成文本向量,根据文本向量中的分类概率便可优选出当前时间步所对应的词元,将该词元在所述参考词表中的编码特征再追加到所述的前缀信息中,实现自回归,然后根据更新后的前缀信息继续下一时间步的解码,如此递进,直至遭遇结束符而完成所有文本向量的预测,也就完成后半句文本中的各个词元的预测,从而获得相应的后半句文本。所述优选通常是选取文本向量中概率最高的词元,当然本领域技术人员亦可采用其他的解码策略确定实现所述每个时间步的词元选取,例如Top_K算法、集束搜索算法、贪心搜索算法等。
步骤S1043、采用所述第二训练样本所包括的历史广告文本的后半句文本作为第二监督标签,确定所述后半句生成模型所预测的后半句文本的损失值,在所述损失值未达到预设阈值时对所述后半句生成模型实施权重更新,并继续调用其他训练样本实施迭代训练直到模型收敛。
一种实施例中,调用预设的交叉熵损失函数,此处可由本领域技术人员根据先验知识或实验经验灵活变通设置,根据所述第二训练样本所包括的历史广告文本的后半句文本作为第二监督标签,计算所述后半句文本的交叉熵损失值,当该损失值达到预设阈值时,表明后半句生成模型已被训练至收敛状态,从而可以终止模型训练;损失值未达到预设阈值时,表明模型未收敛,于是根据该损失值对模型实施梯度更新,通常通过反向传播修正模型各个环节的权重参数以使模型进一步逼近收敛,然后,继续调用所述训练集中的下一训练样本对该模型实施迭代训练,直至该模型被训练至收敛状态为止。
本实施例中,通过监督训练后半句生成模型至收敛,使得后半句生成模型习得以商品标题拼接前半句文本再拼接相应的卖点关键词作为输入,便能生成精准描述相应的商品卖点的后半句文本的能力。
请参阅图7,适应本申请的目的之一而提供的一种广告文本生成装置,是对本申请的广告文本生成方法的功能化体现,该装置,包括数据获取模块1100、前半句生成模块1200、后半句生成模块1300以及广告文本生成模块1400,其中,数据获取模块1100,用于获取广告商品的商品标题,以及从该广告商品所属的商品品类的卖点数据库中确定出与商品标题相匹配的多个卖点关键词;前半句生成模块1200,用于将所述商品标题分别与各个卖点关键词构造为第一句对,将各个第一句对输入预设的前半句生成模型以获得相应的前半句文本,构造成前半句集合;后半句生成模块1300,用于将所述商品标题及所述前半句集合中的每个前半句文本相拼接后,分别与各个所述卖点关键词构造成第二句对,将各个第二句对输入至预设的后半句生成模型以获得相应的后半句文本,构造成后半句集合;广告文本生成模块1400,用于将所述前半句集合中的前半句文本与后半句集合中的后半句文本相拼接。
进一步的实施例中,所述数据获取模块1100之前,还包括:基准关键词选取模块,用于按商品品类获取多个历史广告商品相对应的历史广告文本,针对每个商品品类统计选取出所述历史广告文本中的携带相应的商品的卖点信息的基准关键词;扩展关键词选取模块,用于根据所述基准关键词从相应商品品类相对应的商品文本信息集中提取出各个基准关键词语义相近似的扩展关键词,所述商品文本信息集包含相应商品品类下多个历史广告商品相对应的文本信息,所述文本信息包括商品标题、商品详情文本、商品属性数据中任意一项或任意多项;卖点数据库构造模块,用于构造各个商品品类相对应的卖点数据库,其中存储相应商品品类下各个基准关键词相对应的卖点关键词集合,每个所述的卖点关键词集合包含其对应的基准关键词及根据该基准关键词获得的扩展关键词。
进一步的实施例中,所述数据获取模块1100之前,还包括:卖点关键词确定模块,用于获取历史广告商品相对应的商品标题及其历史广告文本,根据所述历史广告商品的商品品类相对应的卖点数据库中的卖点关键词,确定历史广告文本中的首个卖点关键词;文本分割模块,用于将所述历史广告文本分割为所述首个卖点关键词前面的前半句文本和所述首个卖点关键词后面的后半句文本;前半句生成训练模块,用于将所述历史广告文本的商品标题及其首个卖点关键词构成的第一样本句对作为输入,训练所述前半句生成模型生成所述前半句文本;后半句生成训练模块,用于将所述历史广告文本的商品标题及其首个卖点关键词及所述前半句文本构成的第二样本句对作为输入,训练所述后半句生成模型生成所述后半句文本。
进一步的实施例中,所述文本获取模块,包括:商品信息获取子模块,用于按商品品类获取多个历史广告商品对应的历史广告文本及其广告投放成效数据;文本筛选子模块,用于筛选出满足预设条件的每个广告投放成效数据对应的历史广告文本作为目标广告文本,获取其对应的历史广告商品的商品标题及其所属的商品品类;卖点关键词确定子模块,用于针对每个目标广告文本,从其历史广告商品所属的商品品类的卖点数据库中,确定与其相匹配的首个卖点关键词。
进一步的实施例中,所述前半句生成训练模块,包括:第一训练样本获取子模块,用于从预备的训练集中获取单个第一训练样本,所述第一训练样本包括单个预选的历史广告文本的所述第一样本句对;第一自回归预测子模块,用于将所述第一训练样本输入所述前半句生成模型,逐时间步自回归预测出相应的前半句文本中的各个词元;第一迭代训练子模块,用于采用所述第一训练样本所包括的历史广告文本的前半句文本作为第一监督标签,确定所述前半句生成模型所预测的前半句文本的损失值,在所述损失值未达到预设阈值时对所述前半句生成模型实施权重更新,并继续调用其他训练样本实施迭代训练直到模型收敛。
进一步的实施例中,所述后半句生成训练模块,包括:第二训练样本获取子模块,用于从预备的训练集中获取的单个第二训练样本,所述第二训练样本包括单个预选的历史广告文本的所述第二样本句对;第二训练样本获取子模块,用于将所述第二训练样本输入所述后半句生成模型,逐时间步自回归预测出相应的后半句文本中的各个词元;第二迭代训练子模块,用于采用所述第二训练样本所包括的历史广告文本的后半句文本作为第二监督标签,确定所述后半句生成模型所预测的后半句文本的损失值,在所述损失值未达到预设阈值时对所述后半句生成模型实施权重更新,并继续调用其他训练样本实施迭代训练直到模型收敛。
进一步的实施例中,所述第一迭代训练子模块,包括:所述第一监督标签为所述第一训练样本所包括的历史广告文本的前半句文本的倒序版本。
为解决上述技术问题,本申请实施例还提供计算机设备。如图8所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中,该计算机设备的计算机可读存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种广告文本生成方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行本申请的广告文本生成方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图7中的各个模块及其子模块的具体功能,存储器存储有执行上述模块或子模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本申请的广告文本生成装置中执行所有模块/子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
本申请还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本申请任一实施例的广告文本生成方法的步骤。
本领域普通技术人员可以理解实现本申请上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等计算机可读存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
综上所述,本申请一方面,采用两段式生成方案,在两段式生成过程中,皆引入了广告商品的卖点特征,使得生成的无论是前半句文本或者是后半句文本都能精准地描述广告商品的卖点,从而所得的完整广告文本的描述能够充分聚焦广告商品的卖点。另一方面,所述两段式生成方案实现智能化生成,在此方案实行下,基于与广告商品相关的多个卖点特征,能够生成丰富的广告文本提供充足的参考,有效辅助广告文本的创作。
本技术领域技术人员可以理解,本申请中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本申请中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本申请中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种广告文本生成方法,其特征在于,包括如下步骤:
获取广告商品的商品标题,以及从该广告商品所属的商品品类的卖点数据库中确定出与商品标题相匹配的多个卖点关键词;
将所述商品标题分别与各个卖点关键词构造为第一句对,将各个第一句对输入预设的前半句生成模型以获得相应的前半句文本,构造成前半句集合;
将所述商品标题及所述前半句集合中的每个前半句文本相拼接后,分别与各个所述卖点关键词构造成第二句对,将各个第二句对输入至预设的后半句生成模型以获得相应的后半句文本,构造成后半句集合;
将所述前半句集合中的前半句文本与后半句集合中的后半句文本相拼接。
2.根据权利要求1所述的广告文本生成方法,其特征在于,获取广告商品的商品标题的步骤之前,还包括如下步骤:
按商品品类获取多个历史广告商品相对应的历史广告文本,针对每个商品品类统计选取出所述历史广告文本中的携带相应的商品的卖点信息的基准关键词;
根据所述基准关键词从相应商品品类相对应的商品文本信息集中提取出各个基准关键词语义相近似的扩展关键词,所述商品文本信息集包含相应商品品类下多个历史广告商品相对应的文本信息,所述文本信息包括商品标题、商品详情文本、商品属性数据中任意一项或任意多项;
构造各个商品品类相对应的卖点数据库,其中存储相应商品品类下各个基准关键词相对应的卖点关键词集合,每个所述的卖点关键词集合包含其对应的基准关键词及根据该基准关键词获得的扩展关键词。
3.根据权利要求1所述的广告文本生成方法,其特征在于,获取广告商品的商品标题的步骤之前,还包括如下步骤:
获取历史广告商品相对应的商品标题及其历史广告文本,根据所述历史广告商品的商品品类相对应的卖点数据库中的卖点关键词,确定历史广告文本中的首个卖点关键词;
将所述历史广告文本分割为所述首个卖点关键词前面的前半句文本和所述首个卖点关键词后面的后半句文本;
将所述历史广告文本的商品标题及其首个卖点关键词构成的第一样本句对作为输入,训练所述前半句生成模型生成所述前半句文本;
将所述历史广告文本的商品标题及其首个卖点关键词及所述前半句文本构成的第二样本句对作为输入,训练所述后半句生成模型生成所述后半句文本。
4.根据权利要求3所述的广告文本生成方法,其特征在于,获取历史广告商品相对应的商品标题及其历史广告文本,根据所述历史广告商品的商品品类相对应的卖点数据库中的卖点关键词,确定历史广告文本中的首个卖点关键词的步骤中,包含如下步骤:
按商品品类获取多个历史广告商品对应的历史广告文本及其广告投放成效数据;
筛选出满足预设条件的每个广告投放成效数据对应的历史广告文本作为目标广告文本,获取其对应的历史广告商品的商品标题及其所属的商品品类;
针对每个目标广告文本,从其历史广告商品所属的商品品类的卖点数据库中,确定与其相匹配的首个卖点关键词。
5.根据权利要求3所述的广告文本生成方法,其特征在于,将所述历史广告文本的商品标题及其首个卖点关键词构成的第一句对作为输入,训练所述前半句生成模型生成所述前半句文本,包括如下步骤:
从预备的训练集中获取单个第一训练样本,所述第一训练样本包括单个预选的历史广告文本的所述第一样本句对;
将所述第一训练样本输入所述前半句生成模型,逐时间步自回归预测出相应的前半句文本中的各个词元;
采用所述第一训练样本所包括的历史广告文本的前半句文本作为第一监督标签,确定所述前半句生成模型所预测的前半句文本的损失值,在所述损失值未达到预设阈值时对所述前半句生成模型实施权重更新,并继续调用其他训练样本实施迭代训练直到模型收敛。
6.根据权利要3所述的广告文本生成方法,其特征在于,将所述历史广告文本的商品标题及其首个卖点关键词及所述前半句文本构成的第二样本句对作为输入,训练所述后半句生成模型生成所述后半句文本,包括如下步骤:
从预备的训练集中获取的单个第二训练样本,所述第二训练样本包括单个预选的历史广告文本的所述第二样本句对;
将所述第二训练样本输入所述后半句生成模型,逐时间步自回归预测出相应的后半句文本中的各个词元;
采用所述第二训练样本所包括的历史广告文本的后半句文本作为第二监督标签,确定所述后半句生成模型所预测的后半句文本的损失值,在所述损失值未达到预设阈值时对所述后半句生成模型实施权重更新,并继续调用其他训练样本实施迭代训练直到模型收敛。
7.根据权利要求5所述的广告文本生成方法,其特征在于,采用所述第一训练样本所包括的历史广告文本的前半句文本作为第一监督标签,包括:所述第一监督标签为所述第一训练样本所包括的历史广告文本的前半句文本的倒序版本。
8.一种广告文本生成装置,其特征在于,包括:
数据获取模块,用于获取广告商品的商品标题,以及从该广告商品所属的商品品类的卖点数据库中确定出与商品标题相匹配的多个卖点关键词;
前半句生成模块,用于将所述商品标题分别与各个卖点关键词构造为第一句对,将各个第一句对输入预设的前半句生成模型以获得相应的前半句文本,构造成前半句集合;
后半句生成模块,用于将所述商品标题及所述前半句集合中的每个前半句文本相拼接后,分别与各个所述卖点关键词构造成第二句对,将各个第二句对输入至预设的后半句生成模型以获得相应的后半句文本,构造成后半句集合;
广告文本生成模块,用于将所述前半句集合中的前半句文本与后半句集合中的后半句文本相拼接。
9.一种计算机设备,包括中央处理器和存储器,其特征在于,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行如权利要求1至7中任意一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,其以计算机可读指令的形式存储有依据权利要求1至7中任意一项所述的方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行相应的方法所包括的步骤。
CN202211106157.3A 2022-09-09 2022-09-09 广告文本生成方法及其装置、设备、介质 Pending CN115700579A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211106157.3A CN115700579A (zh) 2022-09-09 2022-09-09 广告文本生成方法及其装置、设备、介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211106157.3A CN115700579A (zh) 2022-09-09 2022-09-09 广告文本生成方法及其装置、设备、介质

Publications (1)

Publication Number Publication Date
CN115700579A true CN115700579A (zh) 2023-02-07

Family

ID=85120625

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211106157.3A Pending CN115700579A (zh) 2022-09-09 2022-09-09 广告文本生成方法及其装置、设备、介质

Country Status (1)

Country Link
CN (1) CN115700579A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117611254A (zh) * 2024-01-23 2024-02-27 口碑(上海)信息技术有限公司 基于大语言模型的文案生成方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117611254A (zh) * 2024-01-23 2024-02-27 口碑(上海)信息技术有限公司 基于大语言模型的文案生成方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110717017B (zh) 一种处理语料的方法
CN111753060B (zh) 信息检索方法、装置、设备及计算机可读存储介质
CN109062893B (zh) 一种基于全文注意力机制的商品名称识别方法
CN111190997B (zh) 一种使用神经网络和机器学习排序算法的问答系统实现方法
CN112989212B (zh) 媒体内容推荐方法、装置和设备及计算机存储介质
CN113705299A (zh) 一种视频识别的方法、装置及存储介质
CN114065750A (zh) 商品信息匹配、发布方法及其装置、设备、介质、产品
CN111625715B (zh) 信息提取方法、装置、电子设备及存储介质
CN114186013A (zh) 实体识别模型热更新方法及其装置、设备、介质、产品
CN115563982A (zh) 广告文本优化方法及其装置、设备、介质、产品
CN116797280A (zh) 广告文案生成方法及其装置、设备、介质
CN115018549A (zh) 广告文案生成方法及其装置、设备、介质、产品
CN113792786A (zh) 商品对象自动分类方法及其装置、设备、介质、产品
CN116976920A (zh) 商品导购方法及其装置、设备、介质
CN116975615A (zh) 基于视频多模态信息的任务预测方法和装置
CN117556067B (zh) 数据检索方法、装置、计算机设备和存储介质
CN108268629A (zh) 基于关键词的图像描述方法和装置、设备、介质、程序
CN115700579A (zh) 广告文本生成方法及其装置、设备、介质
CN116955591A (zh) 用于内容推荐的推荐语生成方法、相关装置和介质
CN113806536B (zh) 文本分类方法及其装置、设备、介质、产品
CN115309905A (zh) 广告文本生成方法及其装置、设备、介质
CN116521843A (zh) 面向用户的智能客服方法及其装置、设备、介质
CN115293818A (zh) 广告投放选品方法及其装置、设备、介质
US20230153522A1 (en) Image captioning
CN114328820A (zh) 信息搜索方法以及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination