WO2024022066A1

WO2024022066A1 - 文案生成方法、装置及存储介质

Info

Publication number: WO2024022066A1
Application number: PCT/CN2023/105876
Authority: WO
Inventors: 邹炎炎; 王泽铭; 马勉; 丁卓冶; 龙波
Original assignee: 北京沃东天骏信息技术有限公司; 北京京东世纪贸易有限公司
Priority date: 2022-07-29
Filing date: 2023-07-05
Publication date: 2024-02-01
Also published as: CN117521660A

Abstract

本申请提供了一种文案生成方法、装置及存储介质，方法包括：接收客户端发送的搜索信息，响应搜索信息获取对应的物品标题信息、物品特征信息和物品详情信息；利用第一预设潜变量模型对计算的第一语义表示向量进行处理，得到第一目标向量；利用第二预设潜变量模型对计算的目标隐向量、第一目标向量和通过物品详情信息计算的第二语义表示向量进行处理，得到第二目标向量；结合第二目标向量与第一语义表示向量，通过预设对话系统模型确定出目标文案，以发送给客户端。

Description

文案生成方法、装置及存储介质

相关申请的交叉引用

本申请基于申请号为202210905016.1、申请日为2022年07月29日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本申请涉及数据处理技术领域，尤其涉及一种文案生成方法、装置及存储介质。

背景技术

物品描述文案在电商系统中有着重要的作用，与仅仅推荐物品标题相比，精心撰写的物品描述文案可以更好地提升用户体验，避免用户阅读繁重冗长的物品详细信息。当前技术所用的文案生成技术主要是从外源数据库中手动地提取相关信息，缺少从包含全部物品信息的物品详情介绍中提取对文案有用知识，该方案不仅效率低，而且生成的文案也不能准确反映真实的物品特性。

发明内容

本申请实施例提供的一种文案生成方法、装置及存储介质。

本申请的技术方案是这样实现的：

本申请实施例提供了一种文案生成方法，包括：

接收客户端发送的搜索信息，响应所述搜索信息获取对应的物品标题信息、物品特征信息和物品详情信息；所述物品详情信息是通过对多种相关信息进行处理得到的多个物品信息片段的集合；

利用第一预设潜变量模型对计算的第一语义表示向量进行处理，得到第一目标向量；所述第一预设潜变量模型是通过样本物品相关信息对第一对先验分布和后验分布训练得到的；所述第一语义表示向量是通过所述物品标题信息和所述物品特征信息计算的；

利用第二预设潜变量模型对计算的目标隐向量、所述第一目标向量和通过所述物品详情信息计算的第二语义表示向量进行处理，得到第二目标向量；所述第二预设潜变量模型是通过所述第一预设潜变量模型每次训练得到的第一向量，结合所述样本物品相关信息对第二对先验分布和后验分布训练得到的；所述目标隐向量是通过所述第一目标向量结合所述物品详情信息计算的；

结合所述第二目标向量与所述第一语义表示向量，通过预设对话系统模型确定出目标文案，发送给所述客户端。

本申请实施例还提供了一种文案生成装置，包括：

接收响应模块，被配置为接收客户端发送的搜索信息，响应所述搜索信息获取对应的物品标题信息、物品特征信息和物品详情信息；所述物品详情信息是通过对多种相关信息进行处理得到的多个物品信息片段的集合；

处理模块，被配置为利用第一预设潜变量模型对计算的第一语义表示向量进行处理，得到第一目标向量；所述第一预设潜变量模型是通过样本物品相关信息对第一对先验分布和后验分布训练得到的；所述第一语义表示向量是通过所述物品标题信息和所述物品特征信息计算的；

所述处理模块，被配置为利用第二预设潜变量模型对计算的目标隐向量、所述第一目标向量和通过所述物品详情信息计算的第二语义表示向量进行处理，得到第二目标向量；所述第二预设潜变量模型是通过所述第一预设潜变量模型每次训练得到的第一向量，结合所述样本物品相关信息对第二对先验分布和后验分布训练得到的；所述目标隐向量是通过所述第一目标向量结合所述物品详情信息计算的；

文案确定模块，被配置为结合所述第二目标向量与所述第一语义表示向量，通过预设对话系统模型确定出目标文案，发送给所述客户端。

本申请实施例还提供了一种文案生成装置，包括存储器和处理器，存储器存储有可在处理器上运行的计算机程序，处理器执行程序时实现上述方法中的步骤。

本申请实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述方法中的步骤。

附图说明

图1为本申请实施例提供的文案生成方法的一个可选的流程示意图；

图2为本申请实施例提供的文案生成方法的一个可选的效果示意图；

图3为本申请实施例提供的文案生成方法的一个可选的流程示意图；

图4为本申请实施例提供的文案生成方法的一个可选的流程示意图；

图5为本申请实施例提供的文案生成方法的一个可选的流程示意图；

图6为本申请实施例提供的文案生成方法的一个可选的流程示意图；

图7为本申请实施例提供的文案生成方法的一个可选的流程示意图；

图8为本申请实施例提供的文案生成方法的一个可选的流程示意图；

图9为本申请实施例提供的文案生成装置的结构示意图；

图10为本申请实施例提供的文案生成装置的一种硬件实体示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面结合附图和实施例对本申请的技术方案进一步详细阐述，所描述的实施例不应视为对本申请的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

如果申请文件中出现“第一/第二”的类似描述则增加以下的说明，在以下的描述中，所涉及的术语“第一\第二\第三”仅仅是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

传统的电商推荐系统将物品以列表的形式推荐给消费者。物品描述文案在电商系统中有着重要的作用，与仅仅推荐物品标题相比，精心撰写的物品描述文案可以更好地提升用户的购物体验，避免用户阅读繁重冗长的物品详细信息。物品文案自动生成技术就是给定物品的基础信息，如物品标题、物品特征和物品详情介绍等，自动生成物品描述文案的技术。

现有物品文案自动生成技术主要依赖于物品标题信息和物品特征信息，通过将其输入到端到端的生成模型中，得到最终的物品描述文案。本方法受限于深度学习模型信息输入，现有技术主要是将物品标题信息和物品特征信息等精简的信息输入到深度学习模型中，这样生成的文案都是通用的缺少具体产品的具体特征，对用户而言无法获得具体的独特的产品特性，推荐效果差。

另一种方案所用的知识增强技术主要是从外源数据库中人工提取相关信息，缺少从包含全部物品信息的物品详情介绍中提取对模型生成文案有用知识，人工提取知识需要耗费大量的人力且并不是与具体物品完全相关的，外源知识库也并不能针对任意物品都提取出相关信息，比如相对新颖的物品或非常冷门的物品。所以相关技术中，生成方案不仅效率低，而且生成的文案也不能准确反映真实的物品特性。

本申请实施例提供了一种文案生成方法，请参阅图1，为本申请实施例提供的文案生成方法的一个可选的流程示意图，将结合图1示出的步骤进行说明。

S101、接收客户端发送的搜索信息，响应搜索信息获取对应的物品标题信息、物品特征信息和物品详情信息；物品详情信息是通过对多种相关信息进行处理得到的多个物品信息片段的集合。

本申请实施例中，服务器接收客户端发送的搜索信息，响应搜索信息获取对应的物品标题信息、物品特征信息和物品详情信息。其中，物品详情信息是通过对多种相关信息进行处理得到的多个物品信息片段的集合。

本申请实施例中，服务器接收客户端发送的物品信息关键词，响应该物品信息关键词在本地数据库中检索得到与该物品信息关键词对应的物品标题信息、物品特征信息和多种相关信息。服务器再对多种相关信息进行除噪过滤分类处理得到物品详情信息。

本申请实施例中，服务器接收到客户端发送的物品编码信息，响应该物品编码信息在本地数据库中检索得到与该物品信息关键词对应的物品标题信息、物品特征信息和多种相关信息。服务器再对多种相关信息进行除噪过滤分类处理得到物品详情信息。

本申请实施例中，多种相关信息可以包括：存储的文本形式的物品广告信息、数字形式的物品型号信息、文字描述的物品具体使用方法和物品评价信息。服务器可以使用启发式算法对多种相关信息进行噪音过滤。服务器可以使用停用词等启发式规则将噪音过滤处理后的多种相关信息分为关键词片段。服务器通过预设语义模型得到每个关键词片段的关键词片段向量，进而得到多个关键词片段向量。服务器对多个关键词片段向量进行聚类，得到多个簇。服务器将每个簇内的关键词片段向量对应的关键词片段组合得到一个物品信息片段。进而得到了包括多个物品信息片段的物品详情信息。

示例性的，结合图2，服务器接收的搜索信息可以为高清网络机顶盒。服务器通过高清网络机顶盒在本地检索到物品标题信息“高清网络机顶盒”，物品特征信息“电脑、办公网络盒子、盒子、高清、机顶盒和无线”。多种相关信息可以包括：“手机投屏，小屏变大屏在手机上轻轻一点，即可将图片、视频投到电视上视野更宽阔，观影更震撼。语音控制，聪明又听话支持视频点播、频道切换、音量调节等，在手机上发出语音指令，它就能听懂你的话。”“我想看动作片，明天北京天气怎么样，扫地机器人去扫地。”“该盒子含开关机等形式的广告，开机时的广告视频不能删除、更改，且第三方内容的广告视频无法控制。”服务器可以对多种相关信息通过过滤分类处理得到物品详情描述信息。

S102、利用第一预设潜变量模型对计算的第一语义表示向量进行处理，得到第一目标向量；第一预设潜变量模型是通过样本物品相关信息对第一对先验分布和后验分布训练得到的；第一语义表示向量是通过物品标题信息和物品特征信息计算的。

本申请实施例中，服务器利用第一预设潜变量模型对计算的第一语义表示向量进行处理，得到第一目标向量。其中，第一预设潜变量模型是通过样本物品标题信息、样本物品特征信息、样本物品详情信息和样本物品描述文案信息对第一对先验分布和后验分布训练得到的。第一语义表示向量是通过物品标题信息和物品特征信息计算的。样本物品相关信息包括：样本物品标题信息、样本物品特征信息、样本物品详情信息和样本物品描述文案信息。

本申请实施例中，服务器可以利用第一预设潜变量模型对计算的第一语义表示向量进行处理，通过在第一预设潜变量模型中的先验分布对应的高斯向量中确定出第一目标向量。

本申请实施例中，服务器可以将物品标题信息和物品特征信息组合，得到物品基础信息。服务器将物品基础信息输入深度学习模型编码器得到第一中间语义表示向量。服务器对第一中间语义表示向量进行平均池化处理，得到第一语义表示向量。

本申请实施例中，服务器利用样本物品标题信息、样本物品特征信息、相似样本信息片段(相似样本信息片段是多个物品信息片段中与样本物品描述文案信息相似度最大的一个片段)和样本物品描述文案信息计算出多个第一相关向量，通过多个第一相关向量确定出第一后验分布的第一后验参数。通过第一后验参数确定出第一向量，以对第一后验分布和第一先验分布进行迭代训练，直至达到训练条件时停止，得到包括了训练好的第一后验分布、第一先验分布的第一预设潜变量模型。

S103、利用第二预设潜变量模型对计算的目标隐向量、第一目标向量和通过物品详情信息计算的第二语义表示向量进行处理，得到第二目标向量；第二预设潜变量模型是通过第一预设潜变量模型每次训练得到的第一向量，结合样本物品相关信息对第二对先验分布和后验分布训练得到的；目标隐向量是通过第一目标向量结合物品详情信息计算的。

本申请实施例中，服务器利用第二预设潜变量模型对计算的目标隐向量、第一目标向量和通过物品详情信息计算的第二语义表示向量进行处理，得到第二目标向量，其中，第二预设潜变量模型是通过第一预设潜变量模型每次训练得到的第一向量，结合样本物品相关信息中的样本物品详情信息对第二对先验分布和后验分布训练得到的；目标隐向量是通过第一目标向量结合物品详情信息计算的。

本申请实施例中，服务器利用第二预设潜变量模型对目标隐向量、第一目标向量和第二语义表示向量进行处理，通过在第二预设潜变量模型中的先验分布对应的分类向量中确定出第二目标向量。

本申请实施例中，服务器在每次进行第一预设潜变量模型训练之后都会得到一个第一向量，服务器结合第一向量和样本物品详情信息对第二对先验分布和后验分布训练得到的第二预设潜变量模型。

S104、结合第二目标向量与第一语义表示向量，通过预设对话系统模型确定出目标文案，发送给客户端。

本申请实施例中，服务器结合第二目标向量与第一语义表示向量，通过预设对话系统模型确定出目标文案，发送给客户端。

本申请实施例中，服务器利用第二目标向量与第一语义表示向量计算得到目标表示识向量。服务器将目标表示识向量通过预设感知神经网络模型处理，得到目标序号；通过目标序号在多个物品信息片段中确定出对应的目标物品信息片段；将目标物品信息片段通过深度学习模型编码器的最后一层处理得到目标物品片段向量。服务器将目标物品片段向量、第一目标向量和第一中间语义表示向量输入预设对话系统模型得到目标文案。其中，预设感知神经网络模型是在第一预设潜变量模型和第二预设潜变量模型训练过程中得到的。

示例性的，结合图2，服务器最终得到的目标文案可以为“高清网络机顶盒，支持语音控制。这款电视盒子支持语音操控，可通过语音实现视频点播、频道切换、音量调节等功能，声控功能助力优质影音体验。”

本申请实施例中，接收客户端发送的搜索信息，响应搜索信息获取对应的物品标题信息、物品特征信息和物品详情信息；物品详情信息是通过对多种相关信息进行处理得到的多个物品信息片段的集合；利用第一预设潜变量模型对计算的第一语义表示向量进行处理，得到第一目标向量；第一预设潜变量模型是通过样本物品相关信息对第一对先验分布和后验分布训练得到的；第一语义表示向量是通过物品标题信息和物品特征信息计算的；利用第二预设潜变量模型对计算的目标隐向量、第一目标向量和通过物品相关信息计算的第二语义表示向量进行处理，得到第二目标向量；第二预设潜变量模型是通过第一预设潜变量模型每次训练得到的第一向量，结合样本物品详情信息对第二对先验分布和后验分布训练得到的；目标隐向量是通过第一目标向量结合物品详情信息计算的；结合第二目标向量与第一语义表示向量，通过预设对话系统模型确定出目标文案，发送给客户端。由于本方案中的物品详情信息是由多种相关信息组成的，而且本方案利用一对交互的预设潜变量模型分别学习两对先验与后验分布，可以自动地从繁重冗长的物品详情信息中选择有用的知识，进而形成目标文案，所以本方案可以提高生成文案的效率，而且也提高了文案对物品真实特性的反映准确度。

在一些实施例中，参见图3，图3为本申请实施例提供的文案生成方法的一个可选的流程示意图，图1示出的S102之前还可以包括S105至S110实现，将结合各步骤进行说明。

S105、获取样本物品标题信息、样本物品特征信息、样本物品详情信息和样本物品描述文案信息，并在样本物品详情信息中确定出，与样本物品描述文案信息相似度最大的相似样本信息片段。

本申请实施例中，服务器获取样本物品标题信息、样本物品特征信息、样本物品详情信息和样本物品描述文案信息，并在样本物品详情信息中确定出，与样本物品描述文案信息相似度最大的相似样本信息片段。

本申请实施例中，服务器可以在历史时间内接收到任意客户端发送的样本搜索信息，服务器响应该样本搜索信息获取得到样本物品标题信息、样本物品特征信息、样本物品详情信息和样本物品描述文案信息。其中，样本物品详情信息包括：多个样本信息片段。服务器计算读个样本信息片段与样本物品描述文案信息之间的相似度，服务器确定出多个样本信息片段中与样本物品描述文案信息相似度最大的一个相似样本信息片段。

其中，样本物品描述文案信息是预先撰写完成的对应该样本搜索信息的文案信息。

S106、利用样本物品标题信息、样本物品特征信息、相似样本信息片段和样本物品描述文案信息计算出多个第一相关向量，通过多个第一相关向量确定出第一后验分布的第一后验参数。

本申请实施例中，服务器利用样本物品标题信息、样本物品特征信息、相似样本信息片段和样本物品描述文案信息计算出多个第一相关向量，通过多个第一相关向量确定出第一后验分布的第一后验参数。

本申请实施例中，服务器将样本物品标题信息和样本物品特征信息结合，计算第一样本语义表示向量。服务器通过相似样本信息片段，确定出基础语义表示向量和相似语义表示向量。服务器利用样本物品描述文案信息，确定出文案基础语义表示向量和文案语义表示向量。服务器通过基础语义表示向量和文案基础语义表示向量，确定出第一相关隐向量和第二相关隐向量。多个第一相关向量包括：第一样本语义表示向量、相似语义表示向量、文案相似语义表示向量、第一相关隐向量和第二相关隐向量。服务器将第一样本语义表示向量、相似语义表示向量、文案相似语义表示向量、第一相关隐向量和第二相关隐向量输入一层感知神经网络模型得到第一后验参数。

S107、通过第一后验参数确定出第一向量，以对第一后验分布和第一先验分布进行迭代训练，直至达到训练条件时停止，得到包括了训练好的第一后验分布、第一先验分布的第一预设潜变量模型。

本申请实施例中，服务器通过第一后验参数确定出第一向量，以对第一后验分布和第一先验分布进行迭代训练，直至达到训练条件时停止，得到包括了训练好的第一后验分布、第一先验分布的第一预设潜变量模型。

本申请实施例中，达到训练条件可以包括：第一后验分布和第一先验分布的拟合函数达到收敛。

本申请实施例中，服务器可以在第一后验参数确定的高斯分布向量中随机确定出第一向量。

S108、通过第一向量结合样本物品详情信息计算训练隐向量。

本申请实施例中，服务器通过第一向量结合样本物品详情信息计算训练隐向量。

本申请实施例中，服务器通过样本物品详情信息包括的多个样本信息片段，计算得到第一样本最终表示向量和第二样本最终表示向量。服务器将第一向量与第二样本最终表示向量，及预设参数相乘之后，通过激活函数处理得到中间计算训练隐向量。服务器将中间计算训练隐向量与第一样本最终表示向量相乘，得到训练隐向量。

S109、通过训练隐向量、第一向量和多个第二相关向量确定出第二后验分布的第二后验参数；多个第二相关向量是通过样本物品标题信息、样本物品特征信息和样本物品详情信息确定出的。

本申请实施例中，服务器通过训练隐向量、第一向量和多个第二相关向量确定出第二后验分布的第二后验参数。其中，多个第二相关向量是通过样本物品标题信息、样本物品特征信息和样本物品详情信息确定出的。

本申请实施例中，服务器将训练隐向量、第一向量和多个第二相关向量输入一层感知神经网络模型，得到第二后验参数。

S110、通过第二后验参数确定出第二向量，以对第二后验分布和第二先验分布进行迭代训练，直至达到训练条件时停止，得到包括了训练好的第二后验分布、第二先验分布的第二预设潜变量模型。

本申请实施例中，服务器通过第二后验参数确定出第二向量，以对第二后验分布和第二先验分布进行迭代训练，直至达到训练条件时停止，得到包括了训练好的第二后验分布、第二先验分布的第二预设潜变量模型。

本申请实施例中，服务器可以通过在第二后验参数确定出分类分布向量中确定出第二向量。

本申请实施例中，达到训练条件可以包括：第二后验分布和第二先验分布的拟合函数收敛。

本方案利用一对交互的预设潜变量模型分别学习两对先验与后验分布，自动地从繁重冗长的物品详情信息中选择有用的知识，进而形成目标文案，所以提高了文案对物品真实特性的反映准确度。

在一些实施例中，参见图4，图4为本申请实施例提供的文案生成方法的一个可选的流程示意图，图3示出的S105至S107还可以通过S111至S121实现，将结合各步骤进行说明。

S111、获取样本物品标题信息、样本物品特征信息、样本物品详情信息和样本物品描述文案信息，利用预设语义模型对多个样本信息片段进行处理，得到多个样本信息语义向量。

本申请实施例中，服务器获取样本物品标题信息、样本物品特征信息、样本物品详情信息和样本物品描述文案信息，利用预设语义模型对多个样本信息片段进行处理，得到多个样本信息语义向量。

本申请实施例中，样本物品详情信息包括：多个样本信息片段。服务器可以将多种样本相关信息预处理后样本物品详情，分为多个样本关键词片段。服务器利用停用词等启发式规则将预处理后样本物品详情划分为不同的片段并且仅保留长度在10到64个词的片段，得到一系列子片段KF。通过这种方法我们过滤掉了如使用说明、产品参数和人工信息等对于模型生成效果没用的片段。

示例性的，K_total为预处理后样本物品详情，K_fragi为第i个样本关键词片段。m是样本关键词片段个数。

本申请实施例中，服务器可以通过预设算法处理得到每一样本关键词片段的表示向量。

本申请实施例中，服务器使用Sentence-Bert[8]获得每一样本关键词片段K_fragi∈KF的表示向量E_fragi。服务器可以使用K-means[9]算法处理多个表示向量，将语义相似的聚类到同一组，这样得到了物品知识组KP。我们将同一蔟内(即语义表示相似的片段)的片段按照字母表的顺序连接在一起获得样本信息片段K_i，表示为KP，即样本物品详情信息。

示例性的，K_i为第i个样本信息片段，KP为多个样本信息片段。

本申请实施例中，服务器再通过预设语义模型对多个样本信息片段处理，得到多个样本信息语义向量。

其中，预设语义模型可以为Sentence-Bert模型。

S112、利用预设语义模型对样本物品描述文案信息进行处理，得到样本物品描述语义向量。

本申请实施例中，服务器利用预设语义模型对样本物品描述文案信息进行处理，得到样本物品描述语义向量。

本申请实施例中，服务器利用Sentence-Bert模型对样本物品描述文案信息进行处理，得到样本物品描述语义向量。

本申请实施例中，预设语义模型还可以为其他的语义模型，本申请实施例中不做限制。

S113、对每个样本信息语义向量与样本物品描述语义向量进行相似度计算，得到对应多个样本信息语义向量的多个相似度。

本申请实施例中，服务器对每个样本信息语义向量与样本物品描述语义向量进行相似度计算，得到对应多个样本信息语义向量的多个相似度。

本申请实施例中，服务器可以对每个样本信息语义向量与样本物品描述语义向量进行余弦相似度计算，得到对应多个样本信息语义向量的多个相似度。

S114、确定最大相似度对应的样本信息片段为相似样本信息片段。

本申请实施例中，服务器确定最大相似度对应的样本信息片段为相似样本信息片段。

本申请实施例中，服务器使用Sentence-Bert模型获得每个知识片段k_i∈KP和物品描述文案信息的语义向量，分别表示为R_ki和R_D。我们计算R_ki和R_D之间的余弦相似度COSR_ki,R_D并将相似度最大的片段作为伪标签标注的相似样本信息片段K_pse用于后续模型训练过程。示例性的，可以通过公式(1)计算K_pse。

S115、将样本物品标题信息和样本物品特征信息结合，计算第一样本语义表示向量。

本申请实施例中，服务器将样本物品标题信息和样本物品特征信息结合，计算第一样本语义表示向量。

本申请实施例中，服务器将样本标题信息和样本物品特征信息中的样本关键词集合，得到样本物品基础信息。服务器对样本物品基础信息通过编码器和池化处理得到第一样本语义表示向量。

示出的S115还可以通过S1151至S1153实现，将结合各步骤进行说明。

S1151、将样本物品标题信息和样本物品特征信息中的多个样本关键词组合，得到样本物品基础信息。

本申请实施例中，服务器将样本物品标题信息和样本物品特征信息中的多个样本关键词组合，得到样本物品基础信息。

S1152、将样本物品基础信息通过深度学习模型编码器处理得到第一样本中间语义表示向量。

本申请实施例中，服务器将样本物品基础信息通过深度学习模型编码器的最后一层处理得到第一样本中间语义表示向量。

S1153、对第一样本中间语义表示向量进行平均池化，得到第一样本语义表示向量。

本申请实施例中，服务器对第一样本中间语义表示向量进行平均池化，得到第一样本语义表示向量。

本申请实施例中，服务器训练数据构造模块采用原生的Transformer encoder网络结构。将样本物品标题信息T和样本物品特征信息A＝{a₁；a₂；.....；a_A}连接起来作为样本物品基础信息P。
P＝{T；a₁；a₂；.....；a_A}

其中，a₁代表样本物品特征信息中的第一个样本关键词，{T；a₁；a₂；.....；a_A}代表将序列连接，即将文本直接接在后面。服务器将样本物品基础信息P输入到深度学习模型编码器的第一层，得到第一样本中间语义表示向量EP是词向量(word embedding)WE与位置向量(position embedding)PE的和。示例性的，可以通过公式(2)计算EP。
E_P＝WE(P)+PE(P) (2)

服务器将第一样本中间语义表示向量通过多层Transformer Encoder并将最后一层网络的输出经过average pooling池化操作得到第一样本语义表示向量H_p。示例性的，可以通过公式(3)计算H_p。

S116、通过相似样本信息片段，确定出基础语义表示向量和相似语义表示向量。

本申请实施例中，服务器通过相似样本信息片段，确定出基础语义表示向量和相似语义表示向量。

本申请实施例中。服务器将样本信息片段输入到深度学习模型编码器的第一层，通过多层Transformer Encoder并将最后一层网络的输出基础语义表示向量。服务器对基础语义表示向量进行average pooling池化操作得到相似语义表示向量。

示出的S116还可以通过S1161至S1162实现，将结合各步骤进行说明。

S1161、将相似样本信息片段通过深度学习模型编码器处理得到基础语义表示向量。

本申请实施例中，服务器将将相似样本信息片段通过深度学习模型编码器的最后一层处理得到基础语义表示向量。

S1162、对基础语义表示向量进行平均池化，得到相似语义表示向量。

本申请实施例中，服务器对基础语义表示向量进行平均池化，得到相似语义表示向量。

S117、利用样本物品描述文案信息，确定出文案基础语义表示向量和文案语义表示向量。

本申请实施例中，服务器利用样本物品描述文案信息，确定出文案基础语义表示向量和文案语义表示向量。

本申请实施例中，服务器将样本物品描述文案信息输入到深度学习模型编码器的第一层，通过Transformer Encoder最后一层网络的输出获取文案基础语义表示向量服务器对进行average pooling池化操作得到文案语义表示向量H_D。

示出的S117还可以通过S1171至S1172实现，将结合各步骤进行说明。

S1171、将样本物品描述文案信息通过深度学习模型编码器处理得到文案基础语义表示向量。

本申请实施例中，服务器将样本物品描述文案信息通过深度学习模型编码器的最后一层处理得到文案基础语义表示向量。

本申请实施例中，服务器将样本物品描述文案信息通过深度学习模型编码器的第一层至最后一层处理得到文案基础语义表示向量。

S1172、对文案基础语义表示向量进行平均池化，得到文案语义表示向量。

本申请实施例中，服务器对文案基础语义表示向量进行平均池化，得到文案语义表示向量。

S118、通过基础语义表示向量和文案基础语义表示向量，确定出第一相关隐向量和第二相关隐向量。

本申请实施例中，服务器通过基础语义表示向量和文案基础语义表示向量，确定出第一相关隐向量和第二相关隐向量。

示出的S118还可以通过S1181至S1182实现，将结合各步骤进行说明。

S1181、通过基础语义表示向量和文案基础语义表示向量，结合第一对应参数计算出第一相关隐向量。

本申请实施例中，服务器通过基础语义表示向量和文案基础语义表示向量，结合第一对应参数计算出第一相关隐向量。

示出的S1181还可以通过S11811至S11813实现，将结合各步骤进行说明。

S11811、求基础语义表示向量与第一参数的第一乘积向量。

本申请实施例中，服务器求基础语义表示向量与第一参数的第一乘积向量。

本申请实施例中，服务器可以通过公式(4)计算得到第一乘积向量K_K。
K_K＝W_KE_K (4)

其中，W_K为第一参数，E_K基础语义表示向量。

S11812、求文案基础语义表示向量与第二参数的第二乘积向量。

本申请实施例中，服务器求文案基础语义表示向量与第二参数的第二乘积向量。

本申请实施例中，服务器可以通过公式(5)计算得到第二乘积向量Q_D。
Q_D＝W_QE_D (5)

其中，W_Q为第二参数，E_D文案基础语义表示向量。

S11813、将第一乘积向量，与第二乘积向量相乘再通过激活和平均池化处理，得到第一相关隐向量。

本申请实施例中，服务器将第一乘积向量，与第二乘积向量相乘再通过激活和平均池化处理，得到第一相关隐向量。

本申请实施例中，服务器可以通过公式(6)计算得到第一相关隐向量

S1182、通过基础语义表示向量和文案基础语义表示向量，结合第二对应参数计算出第二相关隐向量。

本申请实施例中，服务器通过基础语义表示向量和文案基础语义表示向量，结合第二对应参数计算出第二相关隐向量。

示出的S1182还可以通过S11821至S11823实现，将结合各步骤进行说明。

S11821、求基础语义表示向量与第三参数的第三乘积向量。

本申请实施例中，服务器求基础语义表示向量与第三参数的第三乘积向量。

本申请实施例中，服务器可以通过公式(7)计算得到第三乘积向量

其中，W_D为第三参数，E_D为基础语义表示向量。

S11822、求文案基础语义表示向量与第四参数的第四乘积向量。

本申请实施例中，服务器求文案基础语义表示向量与第四参数的第四乘积向量。

本申请实施例中，服务器可以通过公式(8)计算得到第三乘积向量

其中，W_k为第四参数，E_k文案基础语义表示向量。

S11823、将第三乘积向量，与第四乘积向量相乘再通过激活和平均池化处理，得到第二相关隐向量。

本申请实施例中，服务器将将第三乘积向量，与第四乘积向量相乘再通过激活和平均池化处理，得到第二相关隐向量。

本申请实施例中，服务器可以通过公式(9)计算得到第二相关隐向量

S119、将第一语义表示向量、相似语义表示向量、文案相似语义表示向量、第一相关隐向量和第二相关隐向量输入一层感知神经网络模型，得到第一后验数学期望。

本申请实施例中，服务器将第一语义表示向量、相似语义表示向量、文案相似语义表示向量、第一相关隐向量和第二相关隐向量输入一层感知神经网络模型，得到第一后验数学期望。

为建立知识选择与物品文案生成的联系设计了一对交互的变分自编码器，分别学习物品描述潜在变量和物品知识潜在变量。对于物品描述潜在变量学习模块，意在提升生成文案的多样性并指导知识选择的过程，本模块学习了关于物品信息的高斯分布。首先，为了增强文案和伪标签之间的关系，计算了他们之间的隐向量表示和

S120、对第一后验数学期望通过激活函数处理，得到第一后验方差。

本申请实施例中，服务器对第一后验数学期望通过激活函数处理，得到第一后验方差。

本申请实施例中，服务器可以将同HP、HK、HD连接起来作为Hdes输入一层感知神经网络模型(Multi-layerPerceptron，MLP)获得后验高斯分布的参数μ和σ。

S121、在通过第一后验参数确定出的高斯分布向量中随机确定出第一向量，以对第一后验分布和第一先验分布进行迭代训练，直至达到训练条件时停止，得到包括了训练好的第一后验分布、第一先验分布的第一预设潜变量模型。

本申请实施例中，服务器在通过第一后验参数确定出的高斯分布向量中随机确定出第一向量，以对第一后验分布和第一先验分布进行迭代训练，直至达到训练条件时停止，得到包括了训练好的第一后验分布、第一先验分布的第一预设潜变量模型。

本申请实施例中，服务器可以通过公式(10)计算得到参数μ和σ。

后验高斯分布可以描述为：

q_φ(z_d|D,A,T,K)＝N_φ(z_d|μ,σI)其中，z_d为第一向量。T为样本物品标题信息、A为样本物品特征信息、K为样本物品详情信息，D为样本物品描述文案信息。

对于先验高斯分布服务器仅输入HP，参数μ′和σ′的计算方法同后验分布相似。

本申请实施例中，服务器可以通过公式(11)计算得到参数μ′和σ′。

本申请实施例中，服务器在训练过程中从后验分布采样z_d，在推断过程中我们从先验分布中采样。

本申请实施例中，服务器训练过程中，由于高斯分布不可导，我们使用重参数技巧进行随机采样。为拟合先验与后验分布表示，我们引入KL散度。第一后验分布和第一先验分布的拟合函数可以为公式(12)。

本申请实施例中，服务器通过第一样本语义表示向量、相似语义表示向量、文案相似语义表示向量、所述第一相关隐向量和所述第二相关隐向量确定出参数μ′和σ′，再结合参数μ′和σ′确定出第一向量来进行第一预设潜变量模型和第二预设潜变量模型的训练，使得两个预设潜变量模型分别交互学习了两对先验与后验分布，自动地从繁重冗长的物品详情信息中选择有用的知识，进而形成目标文案，提高了文案对物品真实特性的反映准确度。

在一些实施例中，参见图5，图5为本申请实施例提供的文案生成方法的一个可选的流程示意图，图3示出的S108至S109还可以通过S122至S125实现，将结合各步骤进行说明。

S122、通过样本物品详情信息包括的多个样本信息片段，计算得到第一样本最终表示向量和第二样本最终表示向量。

本申请实施例中，服务器通过样本物品详情信息包括的多个样本信息片段，计算得到第一样本最终表示向量和第二样本最终表示向量。

示出的S122还可以通过S1221至S1222实现，将结合各步骤进行说明。

S1221、将多个样本信息片段分别通过深度学习模型编码器处理得到多个样本信息片段对应的多个第一中间样本最终表示向量，再对多个第一中间样本最终表示向量进行平均池化处理，得到第一样本最终表示向量。

本申请实施例中，服务器将多个样本信息片段分别通过深度学习模型编码器的最后一层处理得到多个样本信息片段对应的多个第一中间样本最终表示向量，再对多个第一中间样本最终表示向量进行平均池化处理，得到第一样本最终表示向量。

本申请实施例中，对于样本物品详情信息，在其预处理模块我们获得了物品知识组KP，为了区别同一组内的不同知识，在其基础向量中增加段落向量。

其中，为第一中间样本最终表示向量，WE(K_j)为对应的词向量，PE(K_j)为对应的位置向量，SE(K_j)为对应的段落向量。

本申请实施例中，服务器可以通过公式(13)计算第一样本最终表示向量H_KP。

其中，表示多个样本信息片段中第j个样本信息片段的第一中间样本最终表示向量。同样经过transformer encoder获得知识库的语义表示向量经过average pooling操作获得知识库的最终表示向量。

S1222、将多个样本信息片段组合后，通过深度学习模型编码器处理得到第二中间样本最终表示向量，再对多个第二中间样本最终表示向量进行平均池化处理，得到第二样本最终表示向量。

本申请实施例中，服务器将将多个样本信息片段组合后，通过深度学习模型编码器的最后一层处理得到第二中间样本最终表示向量，再对多个第二中间样本最终表示向量进行平均池化处理，得到第二样本最终表示向量。

S123、将第一向量与第二样本最终表示向量，及预设参数相乘之后，通过激活函数处理得到中间训练隐向量。

本申请实施例中，服务器将第一向量与第二样本最终表示向量，及预设参数相乘之后，通过激活函数处理得到中间训练隐向量。

S124、将中间计算训练隐向量与第一样本最终表示向量相乘，得到训练隐向量。

本申请实施例中，服务器将中间计算训练隐向量与第一样本最终表示向量相乘，得到训练隐向量。

本申请实施例中，服务器可以通过公式(14)计算得到训练隐向量

其中，W_d是预设参数，是第二样本最终表示向量，z_d是第一向量，H_KP是第一样本最终表示向量。

S125、将训练隐向量、第一向量、相似语义表示向量和第一样本最终表示向量输入一层感知神经网络模型，得到第二后验参数；多个第二相关向量是通过样本物品标题信息、样本物品特征信息和样本物品详情信息确定出的。

本申请实施例中，服务器将训练隐向量、第一向量、相似语义表示向量和第一样本最终表示向量输入一层感知神经网络模型，得到第二后验参数；多个第二相关向量是通过样本物品标题信息、样本物品特征信息和样本物品详情信息确定出的。

S126、在通过第二后验参数确定出的类别分布向量中确定出第二向量，以对第二后验分布和第二先验分布进行迭代训练，直至达到训练条件时停止，得到包括了训练好的第二后验分布、第二先验分布的第二预设潜变量模型。

本申请实施例中，服务器在通过第二后验参数确定出的类别分布向量中确定出第二向量，以对第二后验分布和第二先验分布进行迭代训练，直至达到训练条件时停止，得到包括了训练好的第二后验分布、第二先验分布的第二预设潜变量模型。

本申请实施例中，服务器在训练阶段将训练隐向量和第一向量z_d同第一样本最终表示向量H_KP和相似语义表示向量H_K一同输入MLP层计算第二后验参数π。服务器可以去掉H_K后输入另一个MLP层获得相应先验分布的参数π′。

示例性的，服务器可以通过公式(15)计算第二后验参数π。

其中，是训练隐向量，z_d是第一向量，H_KP是第一样本最终表示向量，H_K是相似语义表示向量。

示例性的，服务器可以通过公式(16)计算第二后验参数π′。

第二后验分部和第二先验分布可以被描述为：
q_φ(z_k|z_d,K,KP)＝Cat_φ(π)

对于训练过程和推断过程，z_k分别从第二后验分布与第二先验分布中采样。

服务器需要计算第二后验分布与第二先验分布之间的KL散度来拟合其距离，其拟合公式可以为公式(17)。

本申请实施例中，由于分布不可导我们使用重参数技巧进行采用，由于分布是离散的我们使用gumbel-softmax。

本申请实施例中，服务器通过训练第二对后验分布与先验分布，而且第二对后验分布与先验分布会通过神经网络训练计算过程中的反向传播间接地影响第二对后验分布与先验分布。使得两对后验分布与先验分布交互训练，进而能提取出准确的目标文案。

在一些实施例中，参见图6，图6为本申请实施例提供的文案生成方法的一个可选的流程示意图，图1示出的S101还可以通过S127至S133实现，将结合各步骤进行说明。

S127、获取多种相关信息，对多种相关信息进行除噪过滤处理后划分为多个关键词片段。

本申请实施例中，服务器获取多种相关信息，对多种相关信息进行除噪过滤处理后划分为多个关键词片段。

其中，每个关键词片段包括：多个关键词。

本申请实施例中，服务器可以采用启发式算法对多种相关信息进行噪音过滤，再利用停用词等启发式规则将其划分为多个关键词片段。

S128、利用预设语义模型对每个关键词片段进行处理，得到每个关键词片段对应的关键词片段向量，进而得到多个关键词片段向量。

本申请实施例中，服务器利用预设语义模型对每个关键词片段进行处理，得到每个关键词片段对应的关键词片段向量，进而得到多个关键词片段向量。

其中，预设语义模型可以为Sentence-Bert模型。

S129、通过聚类算法对多个关键词片段向量进行处理，得到多个簇。

本申请实施例中，服务器通过聚类算法对多个关键词片段向量进行处理，得到多个簇。

其中，聚类算法可以为k均值聚类算法(k-means clustering algorithm-9，k-means-9)。

S130、将每个簇中的关键词片段向量对应的关键词片段组合得到一个物品信息片段，进而得到多个物品信息片段，以形成物品详情信息。

本申请实施例中，服务器将将每个簇中的关键词片段向量对应的关键词片段组合得到一个物品信息片段，进而得到多个物品信息片段，以形成物品详情信息。

S131、将物品标题信息和物品特征信息中的关键词组合，得到物品基础信息。

本申请实施例中，服务器物品标题信息和物品特征信息中的关键词组合，得到物品基础信息。

本申请实施例中，服务器将物品标题信息和物品特征信息中的关键词按照顺序组合，得到物品基础信息。

S132、将物品基础信息通过深度学习模型编码器处理得到第一中间语义表示向量。

本申请实施例中，服务器将物品基础信息通过深度学习模型编码器的最后一层处理得到第一中间语义表示向量。

本申请实施例中，服务器将物品基础信息通过深度学习模型编码器第一层处理后，传输到下一层，直至最后一层处理得到第一中间语义表示向量。

S133、对第一中间语义表示向量进行平均池化，得到第一语义表示向量。

本申请实施例中，服务器对第一中间语义表示向量进行平均池化，得到第一语义表示向量。

本申请实施例中，服务器通过在多种相关信息中提取出物品详情信息，以计算第一语义表示向量，由于多种相关信息的来源广泛，进而服务器可以通过该方案扩大查找范围，以得到准确的目标文案。

在一些实施例中，参见图7，图7为本申请实施例提供的文案生成方法的一个可选的流程示意图，图1示出的S104还可以通过S134至S138实现，将结合各步骤进行说明。

S134、利用第二目标向量与第一语义表示向量计算得到目标表示识向量。

本申请实施例中，服务器利用第二目标向量与第一语义表示向量计算得到目标表示识向量。

示出的S134还可以通过S1341至S1343实现。

S1341、计算第二目标向量与第一语义表示向量之差的模长。

本申请实施例中，服务器计算第二目标向量与第一语义表示向量之差的模长。

S1342、计算第二目标向量与第一语义表示向量的乘积向量。

本申请实施例中，服务器计算第二目标向量与第一语义表示向量的乘积向量。

S13431、将第一语义表示向量、第二目标向量、模长和乘积向量按照顺序组成目标表示向量。

本申请实施例中，服务器将第一语义表示向量、第二目标向量、模长和乘积向量按照顺序组成目标表示向量。

服务器获得了从后验和先验采样的物品知识潜在变量后，进行物品知识选择过程。在物品知识选择模块中，使用启发式匹配算法计算知识选择的目标表示向量。

示例性的，服务器可以通过公式(18)计算目标表示向量H_sel。
H_sel＝[H_P,z_k,H_P-z_k,H_P*z_k](18)

其中，H_P为第一语义表示向量，z_k为第二目标向量。

S135、将目标表示识向量通过预设感知神经网络模型处理，得到目标序号。

本申请实施例中，服务器将目标表示识向量通过预设感知神经网络模型处理，得到目标序号。

本申请实施例中，服务器将目标表示识向量输入到MLP层预测目标知识的标签。预设感知神经网络模型的损失函数是：

本申请实施例中，预设感知神经网络模型是Transformer Encoder最后一层的神经网络模型。

S136、通过目标序号在多个物品信息片段中确定出对应的目标物品信息片段。

本申请实施例中，服务器通过目标序号在多个物品信息片段中确定出对应的目标物品信息片段。

本申请实施例中，由于物品详情信息中的每个物品信息片段都对应有序号。

S137、将目标物品信息片段通过深度学习模型编码器处理得到目标物品片段向量。

本申请实施例中，服务器将将目标物品信息片段通过深度学习模型编码器的最后一层处理得到目标物品片段向量。

S138、将目标物品片段向量、第一目标向量和第一中间语义表示向量输入预设对话系统模型得到目标文案。

本申请实施例中，服务器将目标物品片段向量、第一目标向量和第一中间语义表示向量输入预设对话系统模型得到目标文案。

本申请实施例中，服务器将第一中间语义表示向量，第一目标向量和目标物品片段向量，输入到带有copy mechanism的Transformer decoder层去生成物品文案。服务器将第一中间语义表示向量，第一目标向量，和目标物品片段向量相加在一起共同输入decoder。Copy mechanism用于从物品详情信息、物品标题信息和物品特征信息中复制文字，得到目标文案。本申请实施例中，服务器将第一中间语义表示向量，第一目标向量和目标物品片段向量，输入到带有copy mechanism的Transformer decoder层，直至生成预定个数词后停止，得到目标文案。

本申请实施例中，服务器将所述目标物品片段向量、所述第一目标向量和第一中间语义表示向量输入所述预设对话系统模型得到目标文案，由于目标物品片段向量对应的目标物品片段是通过第一预设潜变量模型和第二预设潜变量模型在物品详情信息中确定出来的，而且第一预设潜变量模型和第二预设潜变量模型在训练过程中得到的充分的交互，有利于确定出准确的目标文案。

在一些实施例中，参见图8，图8为本申请实施例提供的文案生成方法的一个可选的流程示意图，图1示出的S101至S104还可以通过S201至S207实现，将结合各步骤进行说明。

S201、物品详情信息预处理模块。

本申请实施例中，物品详情信息预处理模块用于对多种相关信息处理，得到物品详情信息。

S202、训练数据构造模块。

本申请实施例中，训练数据构造模块用于根据样本信息，计算训练数据。

S203、物品信息语义理解模块。

S204、物品描述隐变量学习模块。

本申请实施例中，物品描述隐变量学习模块用于对第一预设潜变量模型进行训练。

S205、物品知识隐变量学习模块。

本申请实施例中，物品知识隐变量学习模块用于对第二预设潜变量模型进行训练。

S206、物品知识选择模块。

本申请实施例中，物品知识选择模块用于在物品详情信息中确定出目标物品信息片段

S207、物品描述生成模块。

本申请实施例中，物品描述生成模块用于利用目标物品片段向量、第一目标向量和第一中间语义表示向量输入预设对话系统模型得到目标文案。

参见图9，图9为本申请实施例提供的文案生成装置的结构示意图。

本申请实施例还提供了一种文案生成装置800，包括：接收响应模块803、处理模块804和文案确定模块805。

接收响应模块803，被配置为接收客户端发送的搜索信息，响应所述搜索信息获取对应的物品标题信息、物品特征信息和物品详情信息；所述物品详情信息是通过对多种相关信息进行处理得到的多个物品信息片段的集合；

处理模块804，被配置为利用第一预设潜变量模型对计算的第一语义表示向量进行处理，得到第一目标向量；所述第一预设潜变量模型是通过样本物品相关信息对第一对先验分布和后验分布训练得到的；所述第一语义表示向量是通过所述物品标题信息和所述物品特征信息计算的；

所述处理模块805，还被配置为利用第二预设潜变量模型对计算的目标隐向量、所述第一目标向量和通过所述物品详情信息计算的第二语义表示向量进行处理，得到第二目标向量；所述第二预设潜变量模型是通过所述第一预设潜变量模型每次训练得到的第一向量，结合所述样本物品相关信息对第二对先验分布和后验分布训练得到的；所述目标隐向量是通过所述第一目标向量结合所述物品详情信息计算的；

本申请实施例中，文案生成装置800被配置为获取所述样本物品标题信息、所述样本物品特征信息、所述样本物品详情信息和所述样本物品描述文案信息，并在所述样本物品详情信息中确定出，与所述样本物品描述文案信息相似度最大的相似样本信息片段；利用所述样本物品标题信息、所述样本物品特征信息、所述相似样本信息片段和所述样本物品描述文案信息计算出多个第一相关向量，通过所述多个第一相关向量确定出第一后验分布的第一后验参数；通过所述第一后验参数确定出所述第一向量，以对所述第一后验分布和第一先验分布进行迭代训练，直至达到训练条件时停止，得到包括了训练好的所述第一后验分布、所述第一先验分布的所述第一预设潜变量模型；通过所述第一向量结合所述样本物品详情信息计算训练隐向量；通过所述训练隐向量、所述第一向量和多个第二相关向量确定出第二后验分布的第二后验参数；所述多个第二相关向量是通过所述样本物品标题信息、所述样本物品特征信息和所述样本物品详情信息确定出的；通过所述第二后验参数确定出第二向量，以对所述第二后验分布和第二先验分布进行迭代训练，直至达到训练条件时停止，得到包括了训练好的所述第二后验分布、所述第二先验分布的所述第二预设潜变量模型。

本申请实施例中，所述样本物品详情信息包括：多个样本信息片段；文案生成装置800被配置为利用预设语义模型对所述多个样本信息片段进行处理，得到多个样本信息语义向量；利用所述预设语义模型对所述样本物品描述文案信息进行处理，得到样本物品描述语义向量；对每个样本信息语义向量与所述样本物品描述语义向量进行相似度计算，得到对应所述多个样本信息语义向量的多个相似度；确定最大相似度对应的样本信息片段为所述相似样本信息片段。

本申请实施例中，文案生成装置800被配置为将所述样本物品标题信息和所述样本物品特征信息结合，计算第一样本语义表示向量；通过所述相似样本信息片段，确定出基础语义表示向量和相似语义表示向量；利用所述样本物品描述文案信息，确定出文案基础语义表示向量和文案语义表示向量；通过所述基础语义表示向量和所述文案基础语义表示向量，确定出第一相关隐向量和第二相关隐向量；所述多个第一相关向量包括：所述第一样本语义表示向量、相似语义表示向量、所述文案相似语义表示向量、所述第一相关隐向量和所述第二相关隐向量。

本申请实施例中，文案生成装置800被配置为将所述样本物品标题信息和所述样本物品特征信息中的多个样本关键词组合，得到样本物品基础信息；将所述样本物品基础信息通过深度学习模型编码器处理得到第一样本中间语义表示向量；对所述第一样本中间语义表示向量进行平均池化，得到所述第一样本语义表示向量。

本申请实施例中，文案生成装置800被配置为将所述相似样本信息片段通过深度学习模型编码器处理得到所述基础语义表示向量；对所述基础语义表示向量进行平均池化，得到所述相似语义表示向量。

本申请实施例中，文案生成装置800被配置为将所述样本物品描述文案信息通过深度学习模型编码器处理得到所述文案基础语义表示向量；对所述文案基础语义表示向量进行平均池化，得到所述文案语义表示向量。

本申请实施例中，文案生成装置800被配置为通过所述基础语义表示向量和所述文案基础语义表示向量，结合第一对应参数计算出所述第一相关隐向量；通过所述基础语义表示向量和所述文案基础语义表示向量，结合第二对应参数计算出所述第二相关隐向量。

本申请实施例中，文案生成装置800被配置为求所述基础语义表示向量与第一参数的第一乘积向量；求所述文案基础语义表示向量与第二参数的第二乘积向量；将所述第一乘积向量，与所述第二乘积向量相乘再通过激活和平均池化处理，得到所述第一相关隐向量。

本申请实施例中，文案生成装置800被配置为求所述基础语义表示向量与第三参数的第三乘积向量；求所述文案基础语义表示向量与第四参数的第四乘积向量；将所述第三乘积向量，与所述第四乘积向量相乘再通过激活和平均池化处理，得到所述第二相关隐向量。

本申请实施例中，文案生成装置800被配置为将所述第一语义表示向量、相似语义表示向量、所述文案相似语义表示向量、所述第一相关隐向量和所述第二相关隐向量输入一层感知神经网络模型，得到第一后验数学期望；

对所述第一后验数学期望通过激活函数处理，得到第一后验方差。

本申请实施例中，文案生成装置800被配置为在通过所述第一后验参数确定出的高斯分布向量中随机确定出所述第一向量。

本申请实施例中，文案生成装置800被配置为通过所述样本物品详情信息包括的所述多个样本信息片段，计算得到第一样本最终表示向量和第二样本最终表示向量；

将所述第一向量与所述第二样本最终表示向量，及预设参数相乘之后，通过激活函数处理得到中间训练隐向量；

将所述中间计算训练隐向量与所述第一样本最终表示向量相乘，得到所述训练隐向量。

本申请实施例中，文案生成装置800被配置为将所述多个样本信息片段分别通过深度学习模型编码器处理得到所述多个样本信息片段对应的多个第一中间样本最终表示向量，再对所述多个第一中间样本最终表示向量进行平均池化处理，得到所述第一样本最终表示向量；将所述多个样本信息片段组合后，通过深度学习模型编码器处理得到第二中间样本最终表示向量，再对所述多个第二中间样本最终表示向量进行平均池化处理，得到所述第二样本最终表示向量。

本申请实施例中，所述多个第二相关向量包括：相似语义表示向量和所述第一样本最终表示向量。，文案生成装置800被配置为将所述训练隐向量、所述第一向量、所述相似语义表示向量和所述第一样本最终表示向量输入一层感知神经网络模型，得到所述第二后验参数。

本申请实施例中，文案生成装置800被配置为在通过所述第二后验参数确定出的类别分布向量中确定出所述第二向量。

本申请实施例中，文案生成装置800中的接收响应模块803被配置为获取所述多种相关信息，对所述多种相关信息进行除噪过滤处理后划分为多个关键词片段；其中，每个关键词片段包括：多个关键词；利用预设语义模型对每个关键词片段进行处理，得到所述每个关键词片段对应的关键词片段向量，进而得到多个关键词片段向量；通过聚类算法对所述多个关键词片段向量进行处理，得到多个簇。将每个簇中的关键词片段向量对应的关键词片段组合得到一个物品信息片段，进而得到多个物品信息片段，以形成所述物品详情信息。

本申请实施例中，文案生成装置800中的处理模块804被配置为将所述物品标题信息和所述物品特征信息中的关键词组合，得到物品基础信息；将所述物品基础信息通过深度学习模型编码器处理得到第一中间语义表示向量；对所述第一中间语义表示向量进行平均池化，得到所述第一语义表示向量。

本申请实施例中，文案生成装置800中的文案确定模块805被配置为利用所述第二目标向量与所述第一语义表示向量计算得到目标表示识向量；将所述目标表示识向量通过预设感知神经网络模型处理，得到目标序号；通过所述目标序号在所述多个物品信息片段中确定出对应的目标物品信息片段；将目标物品信息片段通过深度学习模型编码器处理得到目标物品片段向量；将所述目标物品片段向量、所述第一目标向量和第一中间语义表示向量输入所述预设对话系统模型得到所述目标文案。

本申请实施例中，文案生成装置800中的文案确定模块805被配置为计算所述第二目标向量与所述第一语义表示向量之差的模长；计算所述第二目标向量与所述第一语义表示向量的乘积向量；将所述第一语义表示向量、所述第二目标向量、所述模长和所述乘积向量按照顺序组成所述目标表示向量。

本申请实施例中，通过接收响应模块803接收客户端发送的搜索信息，响应搜索信息获取对应的物品标题信息、物品特征信息和物品详情信息；物品详情信息是通过对多种相关信息进行处理得到的多个物品信息片段的集合；通过处理模块804利用第一预设潜变量模型对计算的第一语义表示向量进行处理，得到第一目标向量；第一预设潜变量模型是通过样本物品相关信息对第一对先验分布和后验分布训练得到的；第一语义表示向量是通过物品标题信息和物品特征信息计算的；通过处理模块804利用第二预设潜变量模型对计算的目标隐向量、第一目标向量和通过物品相关信息计算的第二语义表示向量进行处理，得到第二目标向量；第二预设潜变量模型是通过第一预设潜变量模型每次训练得到的第一向量，结合样本物品详情信息对第二对先验分布和后验分布训练得到的；目标隐向量是通过第一目标向量结合物品详情信息计算的；通过目标文案确定模块805结合第二目标向量与第一语义表示向量，通过预设对话系统模型确定出目标文案，发送给客户端。由于本方案中的物品详情信息是由多种相关信息组成的，而且本方案利用一对交互的预设潜变量模型分别学习两对先验与后验分布，自动地从繁重冗长的物品详情信息中选择有用的知识，进而形成目标文案，所以本方案可以提高生成文案的效率，而且也提高了文案对物品真实特性的反映准确度。

需要说明的是，本申请实施例中，如果以软件功能模块的形式实现上述的文案生成方法，并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台文案生成装置(可以是个人计算机等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样，本申请实施例不限制于任何特定的硬件和软件结合。

对应地，本申请实施例提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述方法中的步骤。

对应地，本申请实施例提供一种文案生成装置，包括存储器802和处理器801，所述存储器802存储有可在处理器801上运行的计算机程序，所述处理器801执行所述程序时实现上述方法中的步骤。

这里需要指出的是：以上存储介质和装置实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本申请存储介质和装置实施例中未披露的技术细节，请参照本申请方法实施例的描述而理解。

需要说明的是，图10为本申请实施例提供的文案生成装置的一种硬件实体示意图，如图10所示，该文案生成装置800的硬件实体包括：处理器801和存储器802，其中；

处理器801通常控制文案生成装置800的总体操作。

存储器802配置为存储由处理器801可执行的指令和应用，还可以缓存待处理器801以及文案生成装置800中各模块待处理或已经处理的数据(例如，图像数据、音频数据、语音通信数据和视频通信数据)，可以通过闪存(FLASH)或随机访问存储器(Random Access Memory，RAM)实现。

应理解，说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此，在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本申请各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储装置、只读存储器(Read Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机装置(可以是个人计算机、服务器、或者网络装置等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储装置、ROM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种文案生成方法，包括：

接收客户端发送的搜索信息，响应所述搜索信息获取对应的物品标题信息、物品特征信息和物品详情信息；所述物品详情信息是通过对多种相关信息进行处理得到的多个物品信息片段的集合；

利用第一预设潜变量模型对计算的第一语义表示向量进行处理，得到第一目标向量；所述第一预设潜变量模型是通过样本物品相关信息对第一对先验分布和后验分布训练得到的；所述第一语义表示向量是通过所述物品标题信息和所述物品特征信息计算的；

利用第二预设潜变量模型对计算的目标隐向量、所述第一目标向量和通过所述物品详情信息计算的第二语义表示向量进行处理，得到第二目标向量；所述第二预设潜变量模型是通过所述第一预设潜变量模型每次训练得到的第一向量，结合所述样本物品相关信息对第二对先验分布和后验分布训练得到的；所述目标隐向量是通过所述第一目标向量结合所述物品详情信息计算的；

结合所述第二目标向量与所述第一语义表示向量，通过预设对话系统模型确定出目标文案，发送给所述客户端。
根据权利要求1所述的文案生成方法，其中，所述利用第一预设潜变量模型对计算的第一语义表示向量进行处理，得到第一目标向量之前，所述方法还包括：

获取样本物品标题信息、样本物品特征信息、样本物品详情信息和样本物品描述文案信息，并在所述样本物品详情信息中确定出，与所述样本物品描述文案信息相似度最大的相似样本信息片段；所述样本物品相关信息包括：样本物品标题信息、样本物品特征信息、样本物品详情信息和样本物品描述文案信息；

利用所述样本物品标题信息、所述样本物品特征信息、所述相似样本信息片段和所述样本物品描述文案信息计算出多个第一相关向量，通过所述多个第一相关向量确定出第一后验分布的第一后验参数；

通过所述第一后验参数确定出所述第一向量，以对所述第一后验分布和第一先验分布进行迭代训练，直至达到训练条件时停止，得到包括了训练好的所述第一后验分布、所述第一先验分布的所述第一预设潜变量模型；

通过所述第一向量结合所述样本物品详情信息计算训练隐向量；

通过所述训练隐向量、所述第一向量和多个第二相关向量确定出第二后验分布的第二后验参数；所述多个第二相关向量是通过所述样本物品标题信息、所述样本物品特征信息和所述样本物品详情信息确定出的；

通过所述第二后验参数确定出第二向量，以对所述第二后验分布和第二先验分布进行迭代训练，直至达到训练条件时停止，得到包括了训练好的所述第二后验分布、所述第二先验分布的所述第二预设潜变量模型。
根据权利要求2所述的文案生成方法，其中，所述样本物品详情信息包括：多个样本信息片段；

所述在所述样本物品详情信息中确定出，与所述样本物品描述文案信息相似度最大的相似样本信息片段，包括：

利用预设语义模型对所述多个样本信息片段进行处理，得到多个样本信息语义向量；

利用所述预设语义模型对所述样本物品描述文案信息进行处理，得到样本物品描述语义向量；

对每个样本信息语义向量与所述样本物品描述语义向量进行相似度计算，得到对应所述多个样本信息语义向量的多个相似度；

确定最大相似度对应的样本信息片段为所述相似样本信息片段。
根据权利要求3所述的文案生成方法，其中，所述利用所述样本物品标题信息、所述样本物品特征信息、所述相似样本信息片段和所述样本物品描述文案信息计算出多个第一相关向量，包括：

将所述样本物品标题信息和所述样本物品特征信息结合，计算第一样本语义表示向量；

通过所述相似样本信息片段，确定出基础语义表示向量和相似语义表示向量；

利用所述样本物品描述文案信息，确定出文案基础语义表示向量和文案语义表示向量；

通过所述基础语义表示向量和所述文案基础语义表示向量，确定出第一相关隐向量和第二相关隐向量；所述多个第一相关向量包括：所述第一样本语义表示向量、相似语义表示向量、所述文案相似语义表示向量、所述第一相关隐向量和所述第二相关隐向量。
根据权利要求4所述的文案生成方法，其中，所述将所述样本物品标题信息和所述样本物品特征信息结合，计算第一样本语义表示向量，包括：

将所述样本物品标题信息和所述样本物品特征信息中的多个样本关键词组合，得到样本物品基础信息；

将所述样本物品基础信息通过深度学习模型编码器处理得到第一样本中间语义表示向量；

对所述第一样本中间语义表示向量进行平均池化，得到所述第一样本语义表示向量。
根据权利要求4所述的文案生成方法，其中，所述通过所述相似样本信息片段，确定出基础语义表示向量和相似语义表示向量，包括：

将所述相似样本信息片段通过深度学习模型编码器处理得到所述基础语义表示向量；

对所述基础语义表示向量进行平均池化，得到所述相似语义表示向量。
根据权利要求4所述的文案生成方法，其中，所述利用所述样本物品描述文案信息，确定出文案基础语义表示向量和文案语义表示向量，包括：

将所述样本物品描述文案信息通过深度学习模型编码器处理得到所述文案基础语义表示向量；

对所述文案基础语义表示向量进行平均池化，得到所述文案语义表示向量。
根据权利要求4所述的文案生成方法，其中，所述通过所述基础语义表示向量和所述文案基础语义表示向量，确定出第一相关隐向量和第二相关隐向量，包括：

通过所述基础语义表示向量和所述文案基础语义表示向量，结合第一对应参数计算出所述第一相关隐向量；

通过所述基础语义表示向量和所述文案基础语义表示向量，结合第二对应参数计算出所述第二相关隐向量。
根据权利要求4所述的文案生成方法，其中，所述通过所述多个第一相关向量确定出第一后验分布的第一后验参数，包括：

将所述第一语义表示向量、相似语义表示向量、所述文案相似语义表示向量、所述第一相关隐向量和所述第二相关隐向量输入一层感知神经网络模型，得到第一后验数学期望；

对所述第一后验数学期望通过激活函数处理，得到第一后验方差。
根据权利要求2所述的文案生成方法，其中，所述通过所述第一后验参数确定出所述第一向量，包括：

在通过所述第一后验参数确定出的高斯分布向量中随机确定出所述第一向量。
根据权利要求3所述的文案生成方法，其中，所述通过所述第一向量结合所述样本物品详情信息计算训练隐向量，包括：

通过所述样本物品详情信息包括的所述多个样本信息片段，计算得到第一样本最终表示向量和第二样本最终表示向量；

将所述第一向量与所述第二样本最终表示向量，及预设参数相乘之后，通过激活函数处理得到中间训练隐向量；

将所述中间计算训练隐向量与所述第一样本最终表示向量相乘，得到所述训练隐向量。
根据权利要求11所述的文案生成方法，其中，所述多个第二相关向量包括：相似语义表示向量和所述第一样本最终表示向量；所述通过所述训练隐向量、所述第一向量和多个第二相关向量确定出第二后验分布的第二后验参数，包括：

将所述训练隐向量、所述第一向量、所述相似语义表示向量和所述第一样本最终表示向量输入一层感知神经网络模型，得到所述第二后验参数。
根据权利要求2所述的文案生成方法，其中，所述通过所述第二后验参数确定出第二向量，包括：

在通过所述第二后验参数确定出的类别分布向量中确定出所述第二向量。
根据权利要求1所述的文案生成方法，其中，所述接收客户端发送的搜索信息，响应所述搜索信息获取对应的物品标题信息、物品特征信息和物品详情信息之前，所述方法还包括：

获取所述多种相关信息，对所述多种相关信息进行除噪过滤处理后划分为多个关键词片段；其中，每个关键词片段包括：多个关键词；

利用预设语义模型对每个关键词片段进行处理，得到所述每个关键词片段对应的关键词片段向量，进而得到多个关键词片段向量；

通过聚类算法对所述多个关键词片段向量进行处理，得到多个簇；

将每个簇中的关键词片段向量对应的关键词片段组合得到一个物品信息片段，进而得到多个物品信息片段，以形成所述物品详情信息。
根据权利要求1所述的文案生成方法，其中，所述接收客户端发送的搜索信息，响应所述搜索信息获取对应的物品标题信息、物品特征信息和物品详情信息之后，所述利用第一预设潜变量模型对计算的第一语义表示向量进行处理，得到第一目标向量之前，所述方法还包括：

将所述物品标题信息和所述物品特征信息中的关键词组合，得到物品基础信息；

将所述物品基础信息通过深度学习模型编码器处理得到第一中间语义表示向量；

对所述第一中间语义表示向量进行平均池化，得到所述第一语义表示向量。
根据权利要求15所述的文案生成方法，其中，所述结合所述第二目标向量与所述第一语义表示向量，通过预设对话系统模型确定出目标文案，包括：

利用所述第二目标向量与所述第一语义表示向量计算得到目标表示识向量；

将所述目标表示识向量通过预设感知神经网络模型处理，得到目标序号；

通过所述目标序号在所述多个物品信息片段中确定出对应的目标物品信息片段；

将目标物品信息片段通过深度学习模型编码器处理得到目标物品片段向量；

将所述目标物品片段向量、所述第一目标向量和所述第一中间语义表示向量输入所述预设对话系统模型得到所述目标文案。
根据权利要求16所述的文案生成方法，其中，所述利用所述第二目标向量与所述第一语义表示向量计算得到目标表示识向量，包括：

计算所述第二目标向量与所述第一语义表示向量之差的模长；

计算所述第二目标向量与所述第一语义表示向量的乘积向量；

将所述第一语义表示向量、所述第二目标向量、所述模长和所述乘积向量按照顺序组成所述目标表示向量。
一种文案生成装置，包括：

接收响应模块，被配置为接收客户端发送的搜索信息，响应所述搜索信息获取对应的物品标题信息、物品特征信息和物品详情信息；所述物品详情信息是通过对多种相关信息进行处理得到的多个物品信息片段的集合；

处理模块，被配置为利用第一预设潜变量模型对计算的第一语义表示向量进行处理，得到第一目标向量；所述第一预设潜变量模型是通过样本物品相关信息对第一对先验分布和后验分布训练得到的；所述第一语义表示向量是通过所述物品标题信息和所述物品特征信息计算的；

所述处理模块，被配置为利用第二预设潜变量模型对计算的目标隐向量、所述第一目标向量和通过所述物品详情信息计算的第二语义表示向量进行处理，得到第二目标向量；所述第二预设潜变量模型是通过所述第一预设潜变量模型每次训练得到的第一向量，结合所述样本物品相关信息对第二对先验分布和后验分布训练得到的；所述目标隐向量是通过所述第一目标向量结合所述物品详情信息计算的；

文案确定模块，被配置为结合所述第二目标向量与所述第一语义表示向量，通过预设对话系统模型确定出目标文案，发送给所述客户端。
一种文案生成装置，包括存储器和处理器，所述存储器存储有可在处理器上运行的计算机程序，所述处理器执行所述程序时实现权利要求1至17任一项所述方法中的步骤。
一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现权利要求1至17任一项所述方法中的步骤。