CN114997131A - 文案生成方法、模型训练方法及装置、设备、存储介质 - Google Patents

文案生成方法、模型训练方法及装置、设备、存储介质 Download PDF

Info

Publication number
CN114997131A
CN114997131A CN202210554571.4A CN202210554571A CN114997131A CN 114997131 A CN114997131 A CN 114997131A CN 202210554571 A CN202210554571 A CN 202210554571A CN 114997131 A CN114997131 A CN 114997131A
Authority
CN
China
Prior art keywords
information
sample
file
model
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210554571.4A
Other languages
English (en)
Inventor
郭晓洁
吴凌飞
李恺健
陈佳佳
何臻
刁世亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202210554571.4A priority Critical patent/CN114997131A/zh
Publication of CN114997131A publication Critical patent/CN114997131A/zh
Priority to PCT/CN2023/094252 priority patent/WO2023221934A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本申请实施例公开了文案生成方法、模型训练方法及装置、设备、存储介质,包括:获取目标对象对应的对象信息和对应的文案类型信息;将对象信息和文案类型信息输入文案生成模型,得到文案信息;利用对象信息对文案信息进行校正,得到目标文案。

Description

文案生成方法、模型训练方法及装置、设备、存储介质
技术领域
本申请涉及信息处理技术领域,尤其涉及文案生成方法、模型训练方法及装置、设备、存储介质。
背景技术
随着互联网技术的发展,网购逐渐受到用户们的青睐,利用导购文案可以帮助用户迅速找到心仪的商品,提高购物效率。
现有技术中,是人工设置文案模板,将获取到的对象信息和文案模板的模板内容进行拼接,从而得到对应的文案,但由于对象信息和模板内容在拼接过程中会存在内容方面的错误,从而降低了文案的准确性。
发明内容
为解决上述技术问题,本申请实施例期望提供文案生成方法、模型训练方法及装置、设备、存储介质,能够提高文案的准确性。
本申请的技术方案是这样实现的:
本申请实施例提供一种文案生成方法,所述文案生成方法包括:
获取目标对象对应的对象信息和对应的文案类型信息;
将所述对象信息和所述文案类型信息输入文案生成模型,得到文案信息;
利用所述对象信息对所述文案信息进行校正,得到目标文案。
在上述方案中,所述利用所述对象信息对所述文案信息进行校正,得到目标文案,包括:
获取配置的信息提取模板;
利用所述信息提取模板从所述文案信息中提取第一信息;利用所述信息提取模板从所述对象信息中提取第二信息;
在第一信息与第二信息不同的情况下,利用所述第二信息修改所述第一信息,得到所述目标文案。
在上述方案中,所述利用所述对象信息对所述文案信息进行校正,得到目标文案,包括:
在所述文案信息中,删除与所述对象信息无关的信息,得到所述目标文案。
在上述方案中,所述利用所述对象信息对所述文案信息进行校正,得到目标文案,包括:
在所述文案信息与所述文案类型信息不匹配的情况下,删除所述文案信息,并根据文案生成模型利用所述对象信息和所述文案类型信息确定新文案信息;基于所述新文案信息确定所述目标文件;
在所述文案信息与所述文案类型信息匹配的情况下,将所述文案信息作为所述目标文案。
在上述方案中,所述将所述对象信息和所述文案类型信息输入文案生成模型,得到文案信息,包括:
利用所述文案生成模型中的编码器按照所述文案类型信息对所述对象信息进行编码,得到多个编码信息;
利用所述文案生成模型中的解码器对所述多个编码信息进行解码,得到多个解码信息;
利用所述文案生成模型中的前馈网络层分别确定所述多个解码信息的多个概率;
从所述多个概率中确定概率值最大的目标概率;并将所述目标概率对应的目标解码信息作为所述文案信息。
本申请实施例还提供了一种模型训练方法,所述模型训练方法包括:
获取样本对象信息和与所述样本对象信息对应的样本文案;
确定所述样本文案对应的样本类型信息;
利用所述样本对象信息、所述样本类型信息和所述样本文案训练初始样本文案生成模型,得到文案生成模型。
在上述方案中,所述利用所述样本对象信息、所述样本类型信息和所述样本文案训练初始样本文案生成模型,得到文案生成模型,包括:
将所述样本对象信息和所述样本类型信息输入所述初始样本文案生成模型,得到输出文案;
根据所述输出文案和所述样本文案确定所述初始样本文案生成模型的模型损失;
在所述模型损失大于或者等于预设损失值的情况下,更新所述初始样本文案生成模型的初始模型参数,得到更新文案模型;并利用所述样本对象信息、所述样本类型信息和所述样本文案继续训练所述更新文案模型,得到第一文案生成模型;
在所述第一文案生成模型的模型损失小于或者等于所述预设损失值的情况下,将所述第一文案生成模型作为所述文案生成模型。
在上述方案中,所述将所述样本对象信息和所述样本类型信息输入所述初始样本文案生成模型,得到输出文案,包括:
利用所述初始样本文案生成模型中的编码器按照所述样本类型信息对所述样本对象信息进行编码,得到多个样本编码信息;
利用所述初始样本文案生成模型中的解码器对所述多个样本编码信息进行解码,得到多个样本解码信息;
利用所述初始样本文案生成模型中的前馈网络层分别确定所述多个样本解码信息的多个样本概率;
从所述多个样本概率中确定样本概率值最大的目标样本概率,并将目标样本概率对应的目标样本解码信息作为输出文案。
本申请实施例提供了一种文案生成装置,所述装置包括:
第一获取单元,用于获取目标对象对应的对象信息和对应的文案类型信息;
第一输入单元,用于将所述对象信息和所述文案类型信息输入文案生成模型,得到文案信息;
校正单元,用于利用所述对象信息对所述文案信息进行校正,得到目标文案。
在上述方案中,所述装置还包括提取单元和修改单元;
所述第一获取单元,用于获取配置的信息提取模板;
所述提取单元,用于利用所述信息提取模板从所述文案信息中提取第一信息;利用所述信息提取模板从所述对象信息中提取第二信息;
所述修改单元,用于在第一信息与第二信息不同的情况下,利用所述第二信息修改所述第一信息,得到所述目标文案。
在上述方案中,所述装置还包括删除单元;
所述删除单元,用于在所述文案信息中,删除与所述对象信息无关的信息,得到所述目标文案。
在上述方案中,所述装置还包括第一确定单元;
所述删除单元,用于在所述文案信息与所述文案类型信息不匹配的情况下,删除所述文案信息;
所述第一确定单元,用于根据文案生成模型利用所述对象信息和所述文案类型信息确定新文案信息;基于所述新文案信息确定所述目标文件;在所述文案信息与所述文案类型信息匹配的情况下,将所述文案信息作为所述目标文案。
在上述方案中,所述装置还包括第一编码单元和第一解码单元;
所述第一编码单元,用于利用所述文案生成模型中的编码器按照所述文案类型信息对所述对象信息进行编码,得到多个编码信息;
所述第一解码单元,用于利用所述文案生成模型中的解码器对所述多个编码信息进行解码,得到多个解码信息;
第一确定单元,用于利用所述文案生成模型中的前馈网络层分别确定所述多个解码信息的多个概率;从所述多个概率中确定概率值最大的目标概率;并将所述目标概率对应的目标解码信息作为所述文案信息。
本申请实施例提供了一种模型训练装置,所述装置包括:
第二获取单元,用于获取样本对象信息和与所述样本对象信息对应的样本文案;
第二确定单元,用于确定所述样本文案对应的样本类型信息;
训练单元,用于利用所述样本对象信息、所述样本类型信息和所述样本文案训练初始样本文案生成模型,得到文案生成模型。
本申请实施例提供了一种电子设备,所述电子设备包括:
存储器、处理器和通信总线,所述存储器通过所述通信总线与所述处理器进行通信,所述存储器存储所述处理器可执行的指令,通过所述处理器执行上述所述的文案生成方法或执行上述所述的模型训练方法。
本申请实施例提供了一种存储介质,其上存储有计算机程序,应用于电子设备,其特征在于,该计算机程序被处理器执行时实现上述所述的文案生成方法或实现上述所述的模型训练方法。
本申请实施例提供了文案生成方法、模型训练方法及装置、设备、存储介质,文案生成方法包括:获取目标对象对应的对象信息和对应的文案类型信息;将对象信息和文案类型信息输入文案生成模型,得到文案信息;利用对象信息对文案信息进行校正,得到目标文案。采用上述方法实现方案,文本生成装置在获取到目标对象的对象信息和文案类型信息的情况下,利用文案生成模型根据对象信息生成与文案类型信息匹配的文案信息,再利用对象信息对文案信息的内容进行校正,得到目标文案,使得目标文案的内容与对象信息的内容一致,提高了目标文案的准确性。
附图说明
图1为本申请实施例提供的一种文案生成方法流程图;
图2为本申请实施例提供的一种示例性的文案生成模型示意图;
图3为本申请实施例提供的一种示例性的文案生成示意图一;
图4为本申请实施例提供的一种示例性的文案生成示意图二;
图5为本申请实施例提供的一种模型训练方法流程图;
图6为本申请实施例提供的一种示例性的模型训练示意图;
图7为本申请实施例提供的一种文案生成装置的组成结构示意图;
图8为本申请实施例提供的一种电子设备的组成结构示意图;
图9为本申请实施例提供的一种模型训练装置的组成结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供了一种文案生成方法,一种文案生成方法应用于文案生成装置,图1为本申请实施例提供的一种文案生成方法流程图,如图1所示,文案生成方法可以包括:
S101、获取目标对象对应的对象信息和对应的文案类型信息。
本申请实施例提供的一种文案生成方法适用于生成目标对象和文案类型信息匹配的目标文案的场景下。
在本申请实施例中,文案生成装置可以以各种形式来实施。例如,本申请中描述的文案生成装置可以包括诸如手机、照相机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、便捷式媒体播放器(Portable Media Player,PMP)、导航装置、可穿戴设备、智能手环、计步器等装置,以及诸如数字TV、台式计算机、服务器等装置。
在本申请实施例中,目标对象可以为商品、快递等,具体的可以根据实际情况进行确定,本申请实施例对此不作限定。具体的若目标对象为商品,则商品包括衣服、电器、家具等,具体的可以根据实际情况进行确定,本申请实施例对此不作限定。
在本申请实施例中,若目标对象为商品,则对象信息可以包括商品标题、商品的属性信息和商品的描述信息等,具体的对象信息可以根据实际情况进行确定,本申请实施例对此不作限定。
在本申请实施例中,文案类型信息可以为目标文案的关注点,包括商品的外观设计、商品的性能、商品拍照摄影方面的关注点、商品充电电池指标等关注点。文案类型信息还可以为其他关注点方面的信息,具体的可以根据实际情况进行确定,本申请实施例对此不作限定。
在本申请实施例中,文本生成装置可以从数据库中获取目标对象的对象信息;文本生成装置也可以从其他的装置处获取目标对象的对象信息;文本生成装置还可以根据输入信息获取到目标对象的对象信息;具体的文本生成装置获取到目标对象的对象信息的方式可以根据实际情况进行确定,本申请实施例对此不作限定。
在本申请实施例中,文本生成装置可以定时获取取目标对象的对象信息,文本生成装置也可以在接收到指令的情况下获取目标对象的对象信息,文本生成装置也可以在其他的情况下获取目标对象的对象信息;具体的文本生成装置获取取目标对象的对象信息的时机可以根据实际情况进行确定,本申请实施例对此不作限定。
示例性的,文本生成装置在接收到客户端传输的文本生成指令的情况下,文本生成装置可以从文本生成指令中获取到文案类型信息和目标对象标识,然后文本生成装置从数据库中获取该目标对象标识对应的对象信息。
在本申请实施例中,基础数据集(对象信息)包括:选定实验品类(以手机为例),获取该类目下的商品信息,包含商品标题、商品扩展属性、商品简介。
S102、将对象信息和文案类型信息输入文案生成模型,得到文案信息。
在本申请实施例中,文本生成装置获取目标对象对应的对象信息和对应的文案类型信息之后,文本生成装置就可以将对象信息和文案类型信息输入文案生成模型,得到文案信息。
在本申请实施例中,文本生成模型可以为文本生成装置中配置的模型;文本生成模型可以为文本生成装置从其他设备处获取到的模型;文本生成模型还可以为文本生成装置以其他的方式获取到的模型;具体的文本生成装置获取到文本生成模型的方式可以根据实际情况进行确定,本申请实施例对此不作限定。
在本申请实施例中,文本生成装置将对象信息和文案类型信息输入文案生成模型,得到文案信息的过程,包括:文本生成装置利用文案生成模型中的编码器按照文案类型信息对对象信息进行编码,得到多个编码信息;文本生成装置利用文案生成模型中的解码器对多个编码信息进行解码,得到多个解码信息;文本生成装置利用文案生成模型中的前馈网络层分别确定多个解码信息的多个概率;文本生成装置从多个概率中确定概率值最大的目标概率;并将目标概率对应的目标解码信息作为文案信息。
需要说明的是,编码器的数量为多个;对应的解码器的数量也为多个;编码器的数量和解码器的数量一一对应。
示例性的,如图2所示,文案生成模型由多个(N个)编码器和多个(N个)解码器、前馈网络、softmax预测层组成,每一个解码器包括注意力机制、加和归一化、前馈网络等;每一个编码器包括注意力机制、加和归一化、前馈网络等,其中注意力机制用于处理关注点(文案类型信息)代码。N个编码器和N个解码器都是基于深度神经网络transformer得到的,并结合了“关注点(文案类型信息)”作为控制信号来确定其中的注意力分数。首先,商品的文字信息(样本对象信息包括:“这”、“款”)作为输入通过词嵌入的方式表示为表征向量X={x1,…,xn}。xn代表一个字的表征向量。然后将表征向量输入编码器(编码器是基于神经网络构造的,每一层的输出输出都是特征向量)。首先经过自注意力机制,该自注意力机制是由“关注点”控制的,设关注点编码的表征向量为a,则注意力机制以及加和归一化如公式(1)所示:
Figure BDA0003651868250000081
根据公式(1)得到输出信息时利用公式(2)确定出目标输出:
FFN(Z)=max(0,ZW1+b1)W2+b2 (2)
其中,Q,K,W1,W2,b1,b2,都是需要模型训练而学到的模型参数。解码器中的模块操作与编码器一样,唯一不同的是在基于关注点的编码解码注意力机制中,将编码器得到表征和当前自表征链接到一起,作为输入进行公式(1)的操作。解码器最后一层是一个分类器(softmax预测层),这个分类器将从多个概率(FFN(Z))中确定概率值最大的目标概率;并将目标概率对应的目标解码信息作为组成文案信息中的目标词。
S103、利用对象信息对文案信息进行校正,得到目标文案。
在本申请实施例中,文本生成装置将对象信息和文案类型信息输入文案生成模型,得到文案信息之后,文本生成装置就可以利用对象信息对文案信息进行校正,得到目标文案。
在本申请实施例中,文本生成装置利用对象信息对文案信息进行校正,得到目标文案的过程,包括:文本生成装置获取配置的信息提取模板;文本生成装置利用信息提取模板从文案信息中提取第一信息;利用信息提取模板从对象信息中提取第二信息;文本生成装置在第一信息与第二信息不同的情况下,利用第二信息修改第一信息,得到目标文案。
在本申请实施例中,信息提取模板可以为文本生成装置中配置的模板。示例性的,信息提取模板可以为“【数字】万像素”;信息提取模板也可以为“【数字】刷新率“;信息提取模板还可以为“【名称】处理器”;具体的信息提取模板可以根据实际情况进行确定,本申请实施例对此不作限定。
需要说明的是,第一信息可以为数字信息;第一信息也可以为字符信息;第一信息还可以为其他的信息;具体的第一信息可以根据实际情况进行确定,本申请实施例对此不作限定。
需要说明的是,第二信息可以为数字信息;第二信息也可以为字符信息;第二信息还可以为其他的信息;具体的第二信息可以根据实际情况进行确定,本申请实施例对此不作限定。
在本申请实施例中,第一信息和第二信息的属性相同,示例性的,第一信息为手机的像素信息,则第二信息也为手机的像素信息;第一信息为设备的处理器信息,则第二信息也可以设备的处理器信息。
在本申请实施例中,文本生成装置利用对象信息对文案信息进行校正,得到目标文案的过程,包括:文本生成装置在文案信息中,删除与对象信息无关的信息,得到目标文案。
在本申请实施例中,对于不属于模版(信息提取模板)中的信息,且生成的文案信息有,而对象信息里没有的信息,即为无关信息,则文本生成装置将该无关信息删除过滤掉,从而得到目标文案。
在本申请实施例中,文本生成装置利用对象信息对文案信息进行校正,得到目标文案的过程,包括:文本生成装置在文案信息与文案类型信息不匹配的情况下,删除文案信息,并根据文案生成模型利用对象信息和文案类型信息确定新文案信息;基于新文案信息确定目标文件;文本生成装置在文案信息与文案类型信息匹配的情况下,将文案信息作为目标文案。
在本申请实施例中,生成的文案信息应该是与关注点(文案类型信息)匹配的信息,在文本生成装置确定出文案信息与文案类型信息不匹配的情况下,文本生成装置就删除文案信息。
需要说明的是,文本生成装置可以利用判别器来确定文案信息与文案类型信息是否匹配,文本生成装置也可以利用其他的方式来确定文案信息与文案类型信息是否匹配;具体的文本生成装置确定文案信息与文案类型信息是否匹配的方式可以根据实际情况进行确定,本申请实施例对此不作限定。
示例性的,如图3所示:在训练得到文案生成模型的情况下,文本生成装置就可以获取目标对象对应的对象信息(如属性,品牌,特征等)和对应的文案类型信息(如对手机来说,外观,性能,续航等);然后文本生成装置就可以将对象信息和文案类型信息输入文案生成模型,得到文案信息;最后文本生成装置就利用对象信息对文案信息进行校正,得到目标文案。
在本申请实施例中,一种示例性的文本生成方法的整体流程框架如图4所示:包括模型训练和模型应用这两个阶段,在模型训练阶段:文本生成装置先从数据库中获取样本对象信息和与样本对象信息对应的样本文案;并确定样本文案对应的样本类型信息;利用样本对象信息、样本类型信息和样本文案训练初始样本文案生成模型,得到文案生成模型;在模型应用阶段,文本生成装置先获取对象信息和文案类型信息;然后文本生成装置将对象信息和文案类型信息输入文案生成模型,利用文案生成模型对对象信息和文案类型信息进行处理,得到文案信息,最后文本生成装置利用对象信息对文案信息进行校正,得到目标文案。
示例性的,如针对一款新型号的手机,示例1,关注点(文案类型信息)为“拍摄”和“外观”,则得到的目标文案为:“这款手机采用星河银的配色设计,在光影流转中尽显时尚美感。后置4000万超感光徕卡三摄,支持30倍数字变焦”;示例2,关注点(文案类型信息)为“性能”和“解锁”,则得到的目标文案可以为:“搭载高性能芯片,性能强劲,运行流畅。支持屏内指纹技术,识别精准,日常操作更加得心应手”。
可以理解的是,文本生成装置在获取到目标对象的对象信息和文案类型信息的情况下,利用文案生成模型根据对象信息生成与文案类型信息匹配的文案信息,再利用对象信息对文案信息的内容进行校正,得到目标文案,使得目标文案的内容与对象信息的内容一致,提高了目标文案的准确性。
本申请实施例提供了一种模型训练方法,一种模型训练方法应用于文案生成装置,图5为本申请实施例提供的一种模型训练方法流程图,如图5所示,模型训练方法可以包括:
S201、获取样本对象信息和与样本对象信息对应的样本文案。
本申请实施例提供的一种模型训练方法适用于生成文案生成模型的场景下。
在本申请实施例中,样本对象信息可以包括商品标题、商品的属性信息和商品的描述信息等,具体的样本对象信息可以根据实际情况进行确定,本申请实施例对此不作限定。
在本申请实施例中,样本文案可以为人工撰写的文案;样本文案也可以为以其他方式生成的文案;具体的样本文案可以根据实际情况进行确定,本申请实施例对此不作限定。
需要说明的是,样本文案存储于样本文案数据库;模型训练装置可以在样本文案数据库中获取到样本文案。其中样本文案数据库可以为其他设备的数据库;样本文案数据库也可以为模型训练装置中的数据库;具体的可以根据实际情况进行确定,本申请实施例对此不作限定。
S202、确定样本文案对应的样本类型信息。
在本申请实施例中,模型训练装置获取样本对象信息和与样本对象信息对应的样本文案之后,模型训练装置就可以确定样本文案对应的样本类型信息。
在本申请实施例中,模型训练装置在得到样本文案的情况下,模型训练装置就可以展示样本文案和样本对象信息,以供人工标注该样本文案对应的样本类型信息,从而确定出样本文案对应的样本类型信息。模型训练装置也可以以其他的方式确定出样本文案对应的样本类型信息;具体的模型训练装置样本文案对应的样本类型信息的方式可以根据实际情况进行确定,本申请实施例对此不作限定。
S203、利用样本对象信息、样本类型信息和样本文案训练初始样本文案生成模型,得到文案生成模型。
在本申请实施例中,模型训练装置确定样本文案对应的样本类型信息之后,模型训练装置就可以利用样本对象信息、样本类型信息和样本文案训练初始样本文案生成模型,得到文案生成模型。
在本申请实施例中,模型训练装置利用样本对象信息、样本类型信息和样本文案训练初始样本文案生成模型,得到文案生成模型的过程,包括:模型训练装置将样本对象信息和样本类型信息输入初始样本文案生成模型,得到输出文案;模型训练装置根据输出文案和样本文案确定初始样本文案生成模型的模型损失;模型训练装置在模型损失大于或者等于预设损失值的情况下,更新初始样本文案生成模型的初始模型参数,得到更新文案模型;并利用样本对象信息、样本类型信息和样本文案继续训练更新文案模型,得到第一文案生成模型;模型训练装置在第一文案生成模型的模型损失小于或者等于预设损失值的情况下,将第一文案生成模型作为文案生成模型。
在本申请实施例中,预设损失值可以为模型训练装置中配置的损失值;预设损失值也可以为其他装置传输至模型训练装置中的损失值;具体的模型训练装置得到预设损失值的方式可以根据实际情况进行确定,本申请实施例对此不作限定。
在本申请实施例中,在模型损失小于预设损失值的情况下,则模型训练装置就直接将初始样本文案生成模型作为文案生成模型。
在本申请实施例中,模型训练装置将样本对象信息和样本类型信息输入初始样本文案生成模型,得到输出文案的过程,包括:模型训练装置利用初始样本文案生成模型中的编码器按照样本类型信息对样本对象信息进行编码,得到多个样本编码信息;模型训练装置利用初始样本文案生成模型中的解码器对多个样本编码信息进行解码,得到多个样本解码信息;模型训练装置利用初始样本文案生成模型中的前馈网络层分别确定多个样本解码信息的多个样本概率;模型训练装置从多个样本概率中确定样本概率值最大的目标样本概率,并将目标样本概率对应的目标样本解码信息作为输出文案。
在本申请实施例中,在文案生成模型的训练与准备阶段,包含三个部分:获取样本对象信息和与样本对象信息对应的样本文案,确定样本文案对应的样本类型信息以及模型训练。
具体的,为了给模型训练提供训练数据,需要先获取样本对象信息和样本文案。样本对象信息(基础数据集)包括:确定实验品类(以手机为例),然后获取该类目下的样本商品信息,如样本商品标题、样本商品扩展属性、样本商品简介。样本文案(文案数据集)为获取该样本商品已有的文案素材,文案素材来源可以分为两个方面,一方面来源于雇佣达人所编写的导购素材,另一方面利用半自动化的方法从商品详情的图片中根据总结的模版提取可以作为导购文案素材的内容。
在本申请实施例中,可以先根据样本商品的具体特征,先对样本商品信息中的高频词进行提取,然后将排名靠前的高频词作为关注点(样本类型信息)。如:手机品类的关注点包括:外观设计,性能,拍照摄影,充电电池等。然后根据确定的关注点(样本类型信息)对得到样本文案进行标注,从而确定出样本文案对应的样本类型信息。之后,模型训练装置就可以基于利用样本对象信息、样本类型信息和样本文案训练初始样本文案生成模型,得到文案生成模型。
在本申请实施例中,模型训练装置在模型训练阶段,会随机初始化模型(初始样本文案生成模型)的模型参数,然后根据该模型参数样本对象信息、样本类型信息和样本文案训练模型,从而得到了优化的生成模型及其参数,即得到文案生成模型。
示例性的,如图6所示:文案生成装置从商品信息数据和导购素材数据中获取训练数据,得到样本对象信息和样本文案;然后文案生成装置就确定样本文案对应的样本类型信息;最后模型训练装置执行模型训练的过程,即模型训练装置利用样本对象信息、样本类型信息和样本文案训练初始样本文案生成模型,得到文案生成模型。
可以理解的是,模型训练装置通过利用样本对象信息、样本类型信息和样本文案训练初始样本文案生成模型,得到文案生成模型,而样本文案为不同类型的文案信息,使得训练得到的文案生成模型为学习到不同类型的样本文案的模型,模型训练装置在接收到目标对象对应的对象信息和对应的文案类型信息、且文案类型信息的类型较多的情况下,模型训练装置可以利用文案生成模型生成多种文案类型的文案信息,提高了模型训练装置利用文案生成模型生成文案信息时的多样性。
基于与上述文案生成方法的同一发明构思,本申请实施例提供了一种文案生成装置1,对应于一种文案生成方法;图7为本申请实施例提供的一种文案生成装置的组成结构示意图一,该文案生成装置1可以包括:
第一获取单元11,用于获取目标对象对应的对象信息和对应的文案类型信息;
第一输入单元12,用于将所述对象信息和所述文案类型信息输入文案生成模型,得到文案信息;
校正单元13,用于利用所述对象信息对所述文案信息进行校正,得到目标文案。
在本申请的一些实施例中,所述装置还包括提取单元和修改单元;
所述第一获取单元11,用于获取配置的信息提取模板;
所述提取单元,用于利用所述信息提取模板从所述文案信息中提取第一信息;利用所述信息提取模板从所述对象信息中提取第二信息;
所述修改单元,用于在第一信息与第二信息不同的情况下,利用所述第二信息修改所述第一信息,得到所述目标文案。
在本申请的一些实施例中,所述装置还包括删除单元;
所述删除单元,用于在所述文案信息中,删除与所述对象信息无关的信息,得到所述目标文案。
在本申请的一些实施例中,所述装置还包括确定单元;
删除单元,用于在所述文案信息与所述文案类型信息不匹配的情况下,删除所述文案信息,
所述第一确定单元,用于根据文案生成模型利用所述对象信息和所述文案类型信息确定新文案信息;基于所述新文案信息确定所述目标文件;在所述文案信息与所述文案类型信息匹配的情况下,将所述文案信息作为所述目标文案。
在本申请的一些实施例中,所述装置还包括第一编码单元和第一解码单元;
所述第一编码单元,用于利用所述文案生成模型中的编码器按照所述文案类型信息对所述对象信息进行编码,得到多个编码信息;
所述第一解码单元,用于利用所述文案生成模型中的解码器对所述多个编码信息进行解码,得到多个解码信息;
第一确定单元,用于利用所述文案生成模型中的前馈网络层分别确定所述多个解码信息的多个概率;从所述多个概率中确定概率值最大的目标概率;并将所述目标概率对应的目标解码信息作为所述文案信息。
需要说明的是,在实际应用中,上述第一获取单元11、第一输入单元12和校正单元13可由电子设备2上的处理器21实现,具体为CPU(Central Processing Unit,中央处理器)、MPU(Microprocessor Unit,微处理器)、DSP(Digital Signal Processing,数字信号处理器)或现场可编程门阵列(FPGA,Field Programmable Gate Array)等实现;上述数据存储可由电子设备2上的存储器22实现。
本申请实施例还提供了一种电子设备2,如图8所示,所述电子设备2包括:处理器21、存储器22和通信总线23,所述存储器22通过所述通信总线23与所述处理器21进行通信,所述存储器22存储所述处理器21可执行的指令,通过所述处理器21执行如上述所述的文案生成方法。
在实际应用中,上述存储器22可以是易失性存储器(volatile memory),例如随机存取存储器(Random-Access Memory,RAM);或者非易失性存储器(non-volatile memory),例如只读存储器(Read-Only Memory,ROM),快闪存储器(flash memory),硬盘(Hard DiskDrive,HDD)或固态硬盘(Solid-State Drive,SSD);或者上述种类的存储器的组合,并向处理器21提供指令和数据。
本申请实施例提供了一种计算机可读存储介质,其上有计算机程序,所述程序被处理器21执行时实现如上述所述的文案生成方法。
可以理解的是,文本生成装置在获取到目标对象的对象信息和文案类型信息的情况下,利用文案生成模型根据对象信息生成与文案类型信息匹配的文案信息,再利用对象信息对文案信息的内容进行校正,得到目标文案,使得目标文案的内容与对象信息的内容一致,提高了目标文案的准确性。
基于与上述文案生成方法的同一发明构思,本申请实施例提供了一种模型训练装置3,对应于一种模型训练方法;图9为本申请实施例提供的一种模型训练装置的组成结构示意图一,该模型训练装置3可以包括:
第二获取单元31,用于获取样本对象信息和与所述样本对象信息对应的样本文案;
第二确定单元32,用于确定所述样本文案对应的样本类型信息;
训练单元33,用于利用所述样本对象信息、所述样本类型信息和所述样本文案训练初始样本文案生成模型,得到文案生成模型。
在本申请的一些实施例中,所述装置还包括第二输入单元和更新单元;
所述第二输入单元,用于将所述样本对象信息和所述样本类型信息输入所述初始样本文案生成模型,得到输出文案;
第二确定单元32,用于根据所述输出文案和所述样本文案确定所述初始样本文案生成模型的模型损失;
所述更新单元,用于在所述模型损失大于或者等于预设损失值的情况下,更新所述初始样本文案生成模型的初始模型参数,得到更新文案模型;
所述训练单元33,用于利用所述样本对象信息、所述样本类型信息和所述样本文案继续训练所述更新文案模型,得到第一文案生成模型;在所述第一文案生成模型的模型损失小于或者等于所述预设损失值的情况下,将所述第一文案生成模型作为所述文案生成模型。
在本申请的一些实施例中,所述装置还包括第二编码单元、第二解码单元;
所述第二编码单元,用于利用所述初始样本文案生成模型中的编码器按照所述样本类型信息对所述样本对象信息进行编码,得到多个样本编码信息;
所述第二解码单元,用于利用所述初始样本文案生成模型中的解码器对所述多个样本编码信息进行解码,得到多个样本解码信息;
第二确定单元32,用于利用所述初始样本文案生成模型中的前馈网络层分别确定所述多个样本解码信息的多个样本概率;从所述多个样本概率中确定样本概率值最大的目标样本概率,并将目标样本概率对应的目标样本解码信息作为输出文案。
需要说明的是,在实际应用中,上述第二获取单元31、第二确定单元32和训练单元33可由电子设备2上的处理器21实现,具体为CPU(Central Processing Unit,中央处理器)、MPU(Microprocessor Unit,微处理器)、DSP(Digital Signal Processing,数字信号处理器)或现场可编程门阵列(FPGA,Field Programmable Gate Array)等实现;上述数据存储可由电子设备2上的存储器22实现。
本申请实施例还提供了一种电子设备2,如图8所示,所述电子设备2包括:处理器21、存储器22和通信总线23,所述存储器22通过所述通信总线23与所述处理器21进行通信,所述存储器22存储所述处理器21可执行的指令,通过所述处理器21执行如上述所述的模型训练方法。
在实际应用中,上述存储器22可以是易失性存储器(volatile memory),例如随机存取存储器(Random-Access Memory,RAM);或者非易失性存储器(non-volatile memory),例如只读存储器(Read-Only Memory,ROM),快闪存储器(flash memory),硬盘(Hard DiskDrive,HDD)或固态硬盘(Solid-State Drive,SSD);或者上述种类的存储器的组合,并向处理器21提供指令和数据。
本申请实施例提供了一种计算机可读存储介质,其上有计算机程序,所述程序被处理器21执行时实现如上述所述的模型训练方法。
可以理解的是,模型训练装置通过利用样本对象信息、样本类型信息和样本文案训练初始样本文案生成模型,得到文案生成模型,而样本文案为不同类型的文案信息,使得训练得到的文案生成模型为学习到不同类型的样本文案的模型,模型训练装置在接收到目标对象对应的对象信息和对应的文案类型信息、且文案类型信息的类型较多的情况下,模型训练装置可以利用文案生成模型生成多种文案类型的文案信息,提高了模型训练装置利用文案生成模型生成文案信息时的多样性。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。

Claims (16)

1.一种文案生成方法,其特征在于,所述方法包括:
获取目标对象对应的对象信息和对应的文案类型信息;
将所述对象信息和所述文案类型信息输入文案生成模型,得到文案信息;
利用所述对象信息对所述文案信息进行校正,得到目标文案。
2.根据权利要求1所述的方法,其特征在于,所述利用所述对象信息对所述文案信息进行校正,得到目标文案,包括:
获取配置的信息提取模板;
利用所述信息提取模板从所述文案信息中提取第一信息;利用所述信息提取模板从所述对象信息中提取第二信息;
在第一信息与第二信息不同的情况下,利用所述第二信息修改所述第一信息,得到所述目标文案。
3.根据权利要求1所述的方法,其特征在于,所述利用所述对象信息对所述文案信息进行校正,得到目标文案,包括:
在所述文案信息中,删除与所述对象信息无关的信息,得到所述目标文案。
4.根据权利要求1所述的方法,其特征在于,所述利用所述对象信息对所述文案信息进行校正,得到目标文案,包括:
在所述文案信息与所述文案类型信息不匹配的情况下,删除所述文案信息,并根据文案生成模型利用所述对象信息和所述文案类型信息确定新文案信息;基于所述新文案信息确定所述目标文件;
在所述文案信息与所述文案类型信息匹配的情况下,将所述文案信息作为所述目标文案。
5.根据权利要求1所述的方法,其特征在于,所述将所述对象信息和所述文案类型信息输入文案生成模型,得到文案信息,包括:
利用所述文案生成模型中的编码器按照所述文案类型信息对所述对象信息进行编码,得到多个编码信息;
利用所述文案生成模型中的解码器对所述多个编码信息进行解码,得到多个解码信息;
利用所述文案生成模型中的前馈网络层分别确定所述多个解码信息的多个概率;
从所述多个概率中确定概率值最大的目标概率;并将所述目标概率对应的目标解码信息作为所述文案信息。
6.一种模型训练方法,其特征在于,所述方法包括:
获取样本对象信息和与所述样本对象信息对应的样本文案;
确定所述样本文案对应的样本类型信息;
利用所述样本对象信息、所述样本类型信息和所述样本文案训练初始样本文案生成模型,得到文案生成模型。
7.根据权利要求6所述的方法,其特征在于,所述利用所述样本对象信息、所述样本类型信息和所述样本文案训练初始样本文案生成模型,得到文案生成模型,包括:
将所述样本对象信息和所述样本类型信息输入所述初始样本文案生成模型,得到输出文案;
根据所述输出文案和所述样本文案确定所述初始样本文案生成模型的模型损失;
在所述模型损失大于或者等于预设损失值的情况下,更新所述初始样本文案生成模型的初始模型参数,得到更新文案模型;并利用所述样本对象信息、所述样本类型信息和所述样本文案继续训练所述更新文案模型,得到第一文案生成模型;
在所述第一文案生成模型的模型损失小于或者等于所述预设损失值的情况下,将所述第一文案生成模型作为所述文案生成模型。
8.根据权利要求7所述的方法,其特征在于,所述将所述样本对象信息和所述样本类型信息输入所述初始样本文案生成模型,得到输出文案,包括:
利用所述初始样本文案生成模型中的编码器按照所述样本类型信息对所述样本对象信息进行编码,得到多个样本编码信息;
利用所述初始样本文案生成模型中的解码器对所述多个样本编码信息进行解码,得到多个样本解码信息;
利用所述初始样本文案生成模型中的前馈网络层分别确定所述多个样本解码信息的多个样本概率;
从所述多个样本概率中确定样本概率值最大的目标样本概率,并将目标样本概率对应的目标样本解码信息作为输出文案。
9.一种文案生成装置,其特征在于,所述装置包括:
第一获取单元,用于获取目标对象对应的对象信息和对应的文案类型信息;
第一输入单元,用于将所述对象信息和所述文案类型信息输入文案生成模型,得到文案信息;
校正单元,用于利用所述对象信息对所述文案信息进行校正,得到目标文案。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括提取单元和修改单元;
所述第一获取单元,用于获取配置的信息提取模板;
所述提取单元,用于利用所述信息提取模板从所述文案信息中提取第一信息;利用所述信息提取模板从所述对象信息中提取第二信息;
所述修改单元,用于在第一信息与第二信息不同的情况下,利用所述第二信息修改所述第一信息,得到所述目标文案。
11.根据权利要求9所述的装置,其特征在于,所述装置还包括删除单元;
所述删除单元,用于在所述文案信息中,删除与所述对象信息无关的信息,得到所述目标文案。
12.根据权利要求9所述的装置,其特征在于,所述装置还包括第一确定单元;
删除单元,用于在所述文案信息与所述文案类型信息不匹配的情况下,删除所述文案信息;
所述第一确定单元,用于根据文案生成模型利用所述对象信息和所述文案类型信息确定新文案信息;基于所述新文案信息确定所述目标文件;在所述文案信息与所述文案类型信息匹配的情况下,将所述文案信息作为所述目标文案。
13.根据权利要求9所述的装置,其特征在于,所述装置还包括第一编码单元和第一解码单元;
所述第一编码单元,用于利用所述文案生成模型中的编码器按照所述文案类型信息对所述对象信息进行编码,得到多个编码信息;
所述第一解码单元,用于利用所述文案生成模型中的解码器对所述多个编码信息进行解码,得到多个解码信息;
第一确定单元,用于利用所述文案生成模型中的前馈网络层分别确定所述多个解码信息的多个概率;从所述多个概率中确定概率值最大的目标概率;并将所述目标概率对应的目标解码信息作为所述文案信息。
14.一种模型训练装置,其特征在于,所述装置包括:
第二获取单元,用于获取样本对象信息和与所述样本对象信息对应的样本文案;
第二确定单元,用于确定所述样本文案对应的样本类型信息;
训练单元,用于利用所述样本对象信息、所述样本类型信息和所述样本文案训练初始样本文案生成模型,得到文案生成模型。
15.一种电子设备,其特征在于,所述电子设备包括:
存储器、处理器和通信总线,所述存储器通过所述通信总线与所述处理器进行通信,所述存储器存储所述处理器可执行的指令,通过所述处理器执行如权利要求1至5任一项所述的文案生成方法或6~8任一项所述的模型训练方法。
16.一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至5任一项所述的文案生成方法或6~8任一项所述的模型训练方法。
CN202210554571.4A 2022-05-19 2022-05-19 文案生成方法、模型训练方法及装置、设备、存储介质 Pending CN114997131A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210554571.4A CN114997131A (zh) 2022-05-19 2022-05-19 文案生成方法、模型训练方法及装置、设备、存储介质
PCT/CN2023/094252 WO2023221934A1 (zh) 2022-05-19 2023-05-15 文案生成方法、模型训练方法及装置、设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210554571.4A CN114997131A (zh) 2022-05-19 2022-05-19 文案生成方法、模型训练方法及装置、设备、存储介质

Publications (1)

Publication Number Publication Date
CN114997131A true CN114997131A (zh) 2022-09-02

Family

ID=83026953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210554571.4A Pending CN114997131A (zh) 2022-05-19 2022-05-19 文案生成方法、模型训练方法及装置、设备、存储介质

Country Status (2)

Country Link
CN (1) CN114997131A (zh)
WO (1) WO2023221934A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023221934A1 (zh) * 2022-05-19 2023-11-23 北京沃东天骏信息技术有限公司 文案生成方法、模型训练方法及装置、设备、存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117312533B (zh) * 2023-11-27 2024-02-27 乐刷科技有限公司 基于人工智能模型的文案生成方法、装置、设备及介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109522531B (zh) * 2017-09-18 2023-04-07 腾讯科技(北京)有限公司 文案生成方法和装置、存储介质及电子装置
CN110196972B (zh) * 2019-04-24 2022-11-01 北京奇艺世纪科技有限公司 文案生成方法、装置及计算机可读存储介质
CN110427617B (zh) * 2019-07-22 2020-09-08 阿里巴巴集团控股有限公司 推送信息的生成方法及装置
CN110765753B (zh) * 2019-12-27 2023-07-14 广东博智林机器人有限公司 文案生成方法、系统、计算机设备和存储介质
CN113076393A (zh) * 2020-01-03 2021-07-06 北京沃东天骏信息技术有限公司 文案生成方法及装置、计算机存储介质、电子设备
CN112434493A (zh) * 2020-11-04 2021-03-02 北京沃东天骏信息技术有限公司 一种文案生成方法、装置、电子设备和存储介质
CN114118041A (zh) * 2021-11-01 2022-03-01 深圳前海微众银行股份有限公司 一种文本生成方法及装置、存储介质
CN114997131A (zh) * 2022-05-19 2022-09-02 北京沃东天骏信息技术有限公司 文案生成方法、模型训练方法及装置、设备、存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023221934A1 (zh) * 2022-05-19 2023-11-23 北京沃东天骏信息技术有限公司 文案生成方法、模型训练方法及装置、设备、存储介质

Also Published As

Publication number Publication date
WO2023221934A1 (zh) 2023-11-23

Similar Documents

Publication Publication Date Title
US12014259B2 (en) Generating natural language descriptions of images
CN114997131A (zh) 文案生成方法、模型训练方法及装置、设备、存储介质
CN112740709A (zh) 用于视频分析的门控模型
CN112528637B (zh) 文本处理模型训练方法、装置、计算机设备和存储介质
CN114972929B (zh) 一种医学多模态模型的预训练方法及装置
CN112270184B (zh) 自然语言处理方法、装置及存储介质
CN112804558B (zh) 视频拆分方法、装置及设备
JP2023529380A (ja) ユーザの好みを反映した機械学習ベースの画像圧縮設定
CN116392812A (zh) 动作生成方法及虚拟人物动画生成方法
CN106407381A (zh) 一种基于人工智能的推送信息的方法和装置
CN112734104A (zh) 一种融合双生成器双判别器的生成对抗网络和自编码器的跨域推荐方法
CN116206314A (zh) 模型训练方法、公式识别方法、装置、介质及设备
CN111767697A (zh) 文本处理方法、装置、计算机设备以及存储介质
CN114358023B (zh) 智能问答召回方法、装置、计算机设备及存储介质
CN115408558A (zh) 基于多尺度多示例相似度学习的长视频检索方法及装置
CN109635303B (zh) 特定领域意义改变词的识别方法
CN113704509B (zh) 多媒体推荐方法、装置、电子设备及存储介质
EP4171045A1 (en) Production method and device for multimedia works, and computer-readable storage medium
CN114613450A (zh) 药物分子的性质预测方法、装置、存储介质及计算机设备
CN112800339B (zh) 信息流搜索方法、装置及设备
CN113763232B (zh) 图像处理方法、装置、设备及计算机可读存储介质
CN111898338A (zh) 文本生成方法、装置和电子设备
CN113095435B (zh) 视频描述生成方法、装置、设备及计算机可读存储介质
CN113889130A (zh) 一种语音转换方法、装置、设备及介质
CN112966150A (zh) 一种视频内容抽取的方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination