CN110196972B - 文案生成方法、装置及计算机可读存储介质 - Google Patents

文案生成方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN110196972B
CN110196972B CN201910335631.1A CN201910335631A CN110196972B CN 110196972 B CN110196972 B CN 110196972B CN 201910335631 A CN201910335631 A CN 201910335631A CN 110196972 B CN110196972 B CN 110196972B
Authority
CN
China
Prior art keywords
information
target
file
auxiliary
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910335631.1A
Other languages
English (en)
Other versions
CN110196972A (zh
Inventor
邓桂林
刘旭升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201910335631.1A priority Critical patent/CN110196972B/zh
Publication of CN110196972A publication Critical patent/CN110196972A/zh
Application granted granted Critical
Publication of CN110196972B publication Critical patent/CN110196972B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种文案生成方法、装置及计算机可读存储介质,属于计算机技术领域。该方法可以基于目标图像,获取目标产品的类别信息,获取目标产品的至少一个辅助信息,将每个辅助信息分别与类别信息组合,得到至少一个目标信息,对于每个目标信息,将目标信息及至少一个目标信息中的其他目标信息对应的文案输入目标文案生成模型,并利用目标文案生成模型,生成目标信息对应的文案,进而得到目标产品的目标文案,通过将目标信息以及其他目标信息对应的文案结合,使得最后生成的该目标信息对应的文案与其他目标信息对应的文案具有更高的相关性,进而使两者的衔接更加自然流畅,提高最终得到的目标文案的文案质量及效果。

Description

文案生成方法、装置及计算机可读存储介质
技术领域
本发明属于计算机技术领域,特别是涉及一种文案生成方法、装置及计算机可读存储介质。
背景技术
为了提高对产品的推广效果,更有效的吸引到用户对产品的关注,商家往往需要基于产品的相关信息,为产品创作相应的文案,其中,该文案可以为针对商品的广告语,介绍语,等等。
现有技术中,通常是将目标产品的相关信息分别输入文案生成模型中,其中,相关信息可以是用于表示该目标产品具体是什么产品的类别词,以及表示该目标产品的具体细节的属性词,接着,会利用该文案生成模型生成每个相关信息对应的文案,最后,所有相关信息对应的文案即为目标产品的文案。但是,每个相关信息之间的关联性可能会较低,这样,将所有相关信息对应的文案总和作为目标产品的文案时,可能会出现目标产品的文案中,每个句子之间的衔接较为生硬,进而使得目标产品的文案的可读性较差,文案的整体效果较差。
发明内容
有鉴于此,本发明提供一种文案生成方法、装置及计算机可读存储介质,在一定程度上解决了文案生成效果较差的问题。
依据本发明的第一方面,提供了一种文案生成方法,该方法可以包括:
基于目标图像,获取目标产品的类别信息;
获取所述目标产品的至少一个辅助信息;所述辅助信息包括所述目标产品的属性信息以及所述类别信息相匹配的预设文案中的至少一种;
将每个辅助信息分别与所述类别信息组合,得到至少一个目标信息;
对于每个目标信息,将所述目标信息及所述至少一个目标信息中的其他目标信息对应的文案输入目标文案生成模型,并利用所述目标文案生成模型,生成所述目标信息对应的文案,得到所述目标产品的目标文案。
可选的,所述获取所述目标产品的至少一个辅助信息,包括:
获取所述目标产品的至少一个属性信息,以作为所述目标产品的至少一个辅助信息;或者,
获取指定文案数据库中与所述类别信息相匹配的预设类别信息对应的N条预设文案,以作为所述目标信息的至少一个辅助信息;所述N为不小于1的整数;或者,
获取所述目标产品的至少一个属性信息;根据所述指定文案数据库中与所述类别信息相匹配的预设类别信息对应的预设文案,获取所述类别信息对应的M个辅助文案;所述M不大于所述目标产品的属性信息的个数;选取M个属性信息,并将所述M个属性信息与所述M个辅助文案一一组合;将组合后的辅助文案以及除所述M个属性信息之外的属性信息,作为所述辅助信息;
所述指定文案数据库中存储有至少一个预设类别信息,以及每个预设类别信息对应的至少一个预设文案。
可选的,所述指定文案数据库中还存储有每个预设文案的语言风格;
所述根据所述指定文案数据库中与所述类别信息相匹配的预设类别信息对应的预设文案,获取所述类别信息对应的M个辅助文案,包括:
获取所述指定文案数据库中与所述类别信息相匹配的预设类别信息对应的预设文案,得到多个候选辅助文案;
基于所述多个候选辅助文案中对应的语言风格与指定语言风格相匹配的目标候选辅助文案,获取所述类别信息对应的M个辅助文案。
可选的,所述指定文案数据库中还存储有每个预设类别信息与其所属的至少一级父类的对应关系;
所述获取所述指定文案数据库中与所述类别信息相匹配的预设类别信息对应的预设文案,得到多个候选辅助文案,包括:
确定所述目标信息所属的父类,得到目标父类;
从所述指定文案数据库中与所述目标父类相匹配的父类对应的预设类别信息中,查找与所述类别信息匹配的预设类别信息;
获取所述与所述类别信息匹配的预设类别信息对应的预设文案,得到多个候选辅助文案。
可选的,所述指定文案数据库中还存储有每个预设文案的选取优先级,所述选取优先级是根据所述预设文案与其对应的预设类别信息的关联度设定的,所述选取优先级与所述关联度呈正相关;
所述基于所述多个候选辅助文案中对应的语言风格与指定语言风格相匹配的目标候选辅助文案,获取所述类别信息对应的M个辅助文案,包括:
将所述目标候选辅助文案按照选取优先级从高至低的顺序排列,并从选取优先级最高的一端选取M个目标候选辅助文案,以作为所述类别信息对应的M个辅助文案。
可选的,所述对于每个目标信息,将所述目标信息及所述至少一个目标信息中的其他目标信息对应的文案输入目标文案生成模型,并利用所述目标文案生成模型,生成所述目标信息对应的文案之前,所述方法还包括:
将预训练的备选文案生成模型中语言风格与所述指定语言风格相匹配的备选文案生成模型作为所述目标文案生成模型;
其中,不同的备选文案生成模型是基于与所述备选文案生成模型的语言风格相匹配的训练语料训练得到的。
可选的,所述对于每个目标信息,将所述目标信息及所述至少一个目标信息中的其他目标信息对应的文案输入目标文案生成模型,并利用所述目标文案生成模型,生成所述目标信息对应的文案,包括:
将输入优先级最高的目标信息输入所述目标文案生成模型,并利用所述目标文案生成模型,生成所述优先级最高的目标信息对应的文案;
对于除所述输入优先级最高的目标信息之外的每个目标信息,将所述目标信息及输入优先级高于所述目标信息的前一个目标信息对应的文案,输入所述目标文案生成模型;
利用所述目标文案生成模型,生成所述目标信息对应的文案。
可选的,所述利用所述目标文案生成模型,生成所述目标信息对应的文案之后,所述方法还包括:
对于每个目标信息对应的文案,检测所述文案是否通顺,以及所述文案是否完整;
若所述文案不通顺和/或所述文案不完整,从所述指定文案数据库中获取所述类别信息对应的替换文案;利用所述替换文案替换所述目标信息对应的文案。
依据本发明的第二方面,提供了一种文案生成装置,该装置可以包括:
第一获取模块,用于基于目标图像,获取目标产品的类别信息;
第二获取模块,用于获取所述目标产品的至少一个辅助信息;所述辅助信息包括所述目标产品的属性信息以及所述类别信息相匹配的预设文案中的至少一种;
组合模块,用于将每个辅助信息分别与所述类别信息组合,得到至少一个目标信息;
生成模块,用于对于每个目标信息,将所述目标信息及所述至少一个目标信息中的其他目标信息对应的文案输入目标文案生成模型,并利用所述目标文案生成模型,生成所述目标信息对应的文案,得到所述目标产品的目标文案。
可选的,所述第二获取模块,具体用于:
获取所述目标产品的至少一个属性信息,以作为所述目标产品的至少一个辅助信息;或者,
获取指定文案数据库中与所述类别信息相匹配的预设类别信息对应的N条预设文案,以作为所述目标信息的至少一个辅助信息;所述N为不小于1的整数;或者,
获取所述目标产品的至少一个属性信息;根据所述指定文案数据库中与所述类别信息相匹配的预设类别信息对应的预设文案,获取所述类别信息对应的M个辅助文案;所述M不大于所述目标产品的属性信息的个数;选取M个属性信息,并将所述M个属性信息与所述M个辅助文案一一组合;将组合后的辅助文案以及除所述M个属性信息之外的属性信息,作为所述辅助信息;
所述指定文案数据库中存储有至少一个预设类别信息,以及每个预设类别信息对应的至少一个预设文案。
可选的,所述指定文案数据库中还存储有每个预设文案的语言风格;
所述第二获取模块,还具体用于:
获取所述指定文案数据库中与所述类别信息相匹配的预设类别信息对应的预设文案,得到多个候选辅助文案;
基于所述多个候选辅助文案中对应的语言风格与指定语言风格相匹配的目标候选辅助文案,获取所述类别信息对应的M个辅助文案。
可选的,所述指定文案数据库中还存储有每个预设类别信息与其所属的至少一级父类的对应关系;
所述第二获取模块,还具体用于:
确定所述目标信息所属的父类,得到目标父类;
从所述指定文案数据库中与所述目标父类相匹配的父类对应的预设类别信息中,查找与所述类别信息匹配的预设类别信息;
获取所述与所述类别信息匹配的预设类别信息对应的预设文案,得到多个候选辅助文案。
可选的,所述指定文案数据库中还存储有每个预设文案的选取优先级,所述选取优先级是根据所述预设文案与其对应的预设类别信息的关联度设定的,所述选取优先级与所述关联度呈正相关;
所述第二获取模块,还具体用于:
将所述目标候选辅助文案按照选取优先级从高至低的顺序排列,并从选取优先级最高的一端选取M个目标候选辅助文案,以作为所述类别信息对应的M个辅助文案。
可选的,所述装置还包括:
确定模块,用于将预训练的备选文案生成模型中语言风格与所述指定语言风格相匹配的备选文案生成模型作为所述目标文案生成模型;
其中,不同的备选文案生成模型是基于与所述备选文案生成模型的语言风格相匹配的训练语料训练得到的。
可选的,所述生成模块,具体用于:
将输入优先级最高的目标信息输入所述目标文案生成模型,并利用所述目标文案生成模型,生成所述优先级最高的目标信息对应的文案;
对于除所述输入优先级最高的目标信息之外的每个目标信息,将所述目标信息及输入优先级高于所述目标信息的前一个目标信息对应的文案,输入所述目标文案生成模型;
利用所述目标文案生成模型,生成所述目标信息对应的文案。
可选的,所述装置还包括:
检测模块,用于对于每个目标信息对应的文案,检测所述文案是否通顺,以及所述文案是否完整;
第三获取模块,用于若所述文案不通顺和/或所述文案不完整,从所述指定文案数据库中获取所述类别信息对应的替换文案;
替换模块,用于利用所述替换文案替换所述目标信息对应的文案。
第三方面,本发明实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的文案生成方法的步骤。
针对在先技术,本发明具备如下优点:
终端可以基于目标图像,获取目标产品的类别信息,然后获取目标产品的至少一个辅助信息,该辅助信息可以包括目标产品的属性信息以及类别信息相匹配的预设文案中的至少一种,接着,可以将每个辅助信息分别与类别信息组合,得到至少一个目标信息,最后,对于每个目标信息,可以将目标信息及至少一个目标信息中的其他目标信息对应的文案输入目标文案生成模型,并利用目标文案生成模型,生成目标信息对应的文案,进而得到目标产品的目标文案,相较于现有技术中,直接基于每个相关信息生成每个相关信息对应的文案,以作为目标产品的文案的方式,本发明实施例中,通过将目标信息以及至少一个目标信息中的其他目标信息对应的文案结合,使得最后生成的该目标信息对应的文案与其他目标信息对应的文案具有更高的相关性,进而使两者的衔接更加自然流畅,提高最终得到的目标文案的文案质量及效果。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例提供的一种文案生成方法的步骤流程图;
图2-1是本发明实施例提供的另一种文案生成方法的步骤流程图;
图2-2是本发明实施例提供的一种文案生成方法的应用示意图;
图3是本发明实施例提供的一种文案生成装置的框图;
图4是本发明实施例提供的另一种文案生成装置的框图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
图1是本发明实施例提供的一种文案生成方法的步骤流程图,应用于终端,如图1所示,该方法可以包括:
步骤101、基于目标图像,获取目标产品的类别信息。
本发明实施例中,该目标产品可以是需要生成文案的产品,该类别信息可以是表示该目标产品具体是什么产品的信息,该类别信息可以是类别词,其中,不同的目标产品的,其对应的类别信息不同,示例的,在该目标产品为产品“电视盒子”时,该类别信息可以为类别词“电视盒子”,在该目标产品为产品“电视机”时,该类别信息可以为类别词“电视机”。
进一步地,该目标图像可以是记录有该目标产品的图像,终端可以以该目标图像作为处理对象,利用预训练的图像分类模型,获取该图形中记录的目标产品的类别词,其中,该图像分类模型可以是基于CNN卷积神经网络构建的。当然,需要说明的是,在本发明的另一可选实施例中,该类别信息也可以是用户输入的,例如,用户可以向终端输入类别词“电视机”,以控制终端基于后续步骤生成有关“电视机”的文案,相应地,终端可以通过接收用户输入的类别信息,实现获取目标产品的类别信息的操作。
步骤102、获取所述目标产品的至少一个辅助信息;所述辅助信息包括所述目标产品的属性信息以及所述类别信息相匹配的预设文案中的至少一种。
本发明实施例中,该辅助信息可以是与目标产品具有关联性的信息,具体的,该辅助信息可以是目标产品的属性信息,其中,该属性信息可以是表示该目标产品的具体细节的信息,该属性信息可以是属性词,进一步地,该辅助信息可以是与目标产品的类别信息相匹配的预设文案,例如,该辅助信息可以是用于描述“电视机”的预设文案,其中,该预设文案可以是开发人员预先搜集到的,当然,该辅助信息也可以是目标产品的属性信息与预设文案的结合,本发明实施例对此不作限定。进一步地,在获取辅助信息时,终端可以是从记录该目标产品的图像中获取属性信息,从预存储在预设文案中获取与目标产品的类别信息相匹配的预设文案。
步骤103、将每个辅助信息分别与所述类别信息组合,得到至少一个目标信息。
本发明实施例中,终端可以通过将辅助信息分别与类别信息拼接,实现将两者组合,示例的,假设有3个辅助信息:辅助信息1、辅助信息2以及辅助信息3,那么终端将辅助信息1与类别信息拼接、将辅助信息2与类别信息拼接以及将辅助信息3与类别信息拼接,得到3个目标信息。本发明实施例中,通过将每个辅助信息分别与类别信息组合,可以为后续步骤中基于目标信息生成对应的文案提供更加丰富的信息,进而提高生成的文案的效果。
步骤104、对于每个目标信息,将所述目标信息及所述至少一个目标信息中的其他目标信息对应的文案输入目标文案生成模型,并利用所述目标文案生成模型,生成所述目标信息对应的文案,得到所述目标产品的目标文案。
本发明实施例中,该目标文案生成模型可以是以样本产品的样本目标信息,以及该样本产品对应的样本文案预先训练得到的,进一步地,在生成每个目标信息对应的文案时,可以将该目标信息以及其他目标信息对应的文案输入至目标文案生成模型,以此作为依据生成该目标信息对应的文案,其中,其他目标信息对应的文案可以是:在输入该目标信息之前,先输入至目标文案生成模型,利用该目标文案生成模型生成的文案,当然,该其他目标信息对应的文案也可以是以人工的方式基于该其他目标信息,生成的文案,本发明实施例对此不作限定。进一步地,通过结合其他目标信息对应的文案,使得最后生成的该目标信息对应的文案与其他目标信息对应的文案具有更高的相关性,进而使两者的衔接更加自然流畅,提高最终得到的目标文案的文案质量及效果。
综上所述,本发明实施例提供的文案生成方法,终端可以基于目标图像,获取目标产品的类别信息,然后获取目标产品的至少一个辅助信息,其中,该辅助信息可以包括目标产品的属性信息以及类别信息相匹配的预设文案中的至少一种,接着,可以将每个辅助信息分别与类别信息组合,得到至少一个目标信息,最后,对于每个目标信息,可以将目标信息及至少一个目标信息中的其他目标信息对应的文案输入目标文案生成模型,并利用目标文案生成模型,生成目标信息对应的文案,进而得到目标产品的目标文案,相较于现有技术中,直接基于每个相关信息生成每个相关信息对应的文案,以作为目标产品的文案的方式,本发明实施例中,通过将目标信息以及其他目标信息对应的文案结合,使得最后生成的该目标信息对应的文案与其他目标信息对应的文案具有更高的相关性,进而使两者的衔接更加自然流畅,提高最终得到的目标文案的文案质量及效果。
图2-1是本发明实施例提供的另一种文案生成方法的步骤流程图,应用于终端,如图2-1所示,该方法可以包括:
步骤201、基于目标图像,获取目标产品的类别信息。
具体的,本步骤的实现方式可以参照上述步骤101,本发明实施例在此不做赘述。
步骤202、获取所述目标产品的至少一个辅助信息。所述辅助信息包括所述目标产品的属性信息以及所述类别信息相匹配的预设文案中的至少一种。
本步骤中,该辅助信息可以为目标产品的至少一个属性信息,相应地,可以通过下述实现方式一中的子步骤(1)实现本步骤:
子步骤(1):获取所述目标产品的至少一个属性信息,以作为所述目标产品的至少一个辅助信息。
本步骤中,该属性信息可以是用户输入的,例如,用户可以向终端输入“电视机”的属性信息:颜色、形状、尺寸等信息,相应地,终端可以通过接收用户输入的属性信息,实现获取目标产品的属性信息的操作。该属性信息也可以是终端以记录该目标产品的图像作为处理对象,利用预训练的图像理解模型,获取该图形中记录的目标产品的属性词,得到属性信息,示例的,假设类别信息可以为“衬衫”,获取到的属性信息可以为“系带、喇叭袖、蝴蝶结、白色”。其中,该图像理解模型可以是基于循环卷积神经网络构建的。当然,也可以是从记录该目标产品的其他多媒体中获取的,该多媒体可以为语音、文本或者视频,等等。示例的,终端可以可以利用文字识别OCR模型,识别图像中的文字,将识别到的文字作为属性信息。进一步地,终端可以以记录该目标产品的语音作为处理对象,利用语音转换ASR技术,将语音转换为文字,然后从该文字中提取关键词,得到属性信息。
进一步地,该辅助信息也可以为目标产品的属性信息与辅助文案的结合,相应地,可以通过下述实现方式二中的子步骤(1)~子步骤(4)实现获取辅助信息:
子步骤(1):获取所述目标产品的至少一个属性信息。
具体的,本步骤的实现方式可以参照上述实现方式一中的子步骤(1),本发明实施例在此不做赘述。
子步骤(2):根据所述指定文案数据库中与所述类别信息相匹配的预设类别信息对应的预设文案,获取所述类别信息对应的M个辅助文案。
本步骤中,预设类别信息可以是预先选取的表示不同产品的类别词,M不大于目标产品的属性信息的个数,M可以是用户预先定义的,例如,M可以为3。该指定文案数据库中还可以存储有每个预设文案的语言风格,具体的,在预先建立指定文案数据库时,可以从网络中爬取文案数据,然后对爬取到的文案数据进行数据清洗,去掉其中无关和杂乱的文本,接着,通过为每条文案标注上该文案的语言风格,示例的,该语言风格可以包括“功能描述型”、“功效表达型”或“”暖心逗趣型”,等等,最后,可以将标注后的每条文案作为预设文案存入指定文案数据库中。
相应地,子步骤(2)可以通下述子步骤(2.1)~子步骤(2.2)实现:
子步骤(2.1):获取所述指定文案数据库中与所述类别信息相匹配的预设类别信息对应的预设文案,得到多个候选辅助文案。
本步骤中,该指定文案数据库中还存储有每个预设类别信息与其所属的至少一级父类的对应关系,预设类别信息所属的父类可以是该预设类别信息所表示的产品所属的种类,示例的,以指定文案数据库中包括每个预设类别信息的两级父类为例,指定文案数据库中部分预设类别信息与其所属的至少一级父类的对应关系可以如下表1所示:
Figure BDA0002039040920000111
Figure BDA0002039040920000121
表1
从上表1可以看出,在预设类别信息表示产品“针织衫”时,该预设类别信息的二级父类可以为“上装”,一级父类可以为“服饰”。
相应地,终端可以先确定所述目标信息所属的父类,得到目标父类。具体的,终端可以从网络中实时查找目标产品所属的父类,也可以是接收用户输入的目标信息所属的父类,本发明实施例对此不作限定。
接着,终端可以从所述指定文案数据库中与所述目标父类相匹配的父类对应的预设类别信息中,查找与所述类别信息匹配的预设类别信息。示例的,假设目标父类为“服饰-上装”,那么终端可以从指定文案数据库中与“服饰-上装”对应的预设类别信息中,查找与类别信息匹配的预设类别信息。最后,可以获取所述与所述类别信息匹配的预设类别信息对应的预设文案,得到多个候选辅助文案。本发明实施例中,通过预先为指定文案数据库中的预设类别信息按照所属的父类建立对应关系,这样,在获取辅助文案时,可以先确定与目标信息所属的父类相匹配的父类对应的预设类别信息,然后从这些对应的预设类别信息中查找与所述类别信息匹配的预设类别信息,最后获取该预设类别信息对应的预设文案作为辅助文案。相较于直接从预设类别信息中一一匹配来查找的方式,本发明实施例中,通过目标父类先进行匹配,可以缩小查找与类别信息匹配的预设类别信息的范围,进而提高查找效率。
子步骤(2.2):基于所述多个候选辅助文案中对应的语言风格与指定语言风格相匹配的目标候选辅助文案,获取所述类别信息对应的M个辅助文案。
本步骤中,该指定语言风格可以是希望最终生成的文案所具备的语言风格,本发明实施例中,从语言风格相匹配的候选辅助文案获取辅助文案,可以保证最后得到的辅助文案与想要的语言风格相匹配,进而使得后续步骤中,基于该辅助文案生成的文案的语言风格,更加符合预期风格。
进一步地,指定文案数据库中还可以存储有每个预设文案的选取优先级,该选取优先级可以是根据预设文案与其对应的预设类别信息的关联度设定的,该选取优先级可以与关联度呈正相关。示例的,假设存在三级选取优先级,在设定选取优先级时,可以在该预设文案与预设类别信息存在多个交集时,例如,可以在预设文案中包含了该预设类别信息所表示的产品名称以及属性信息时,认为该预设文案与预设类别信息的关联度最大,相应地,可以为该预设文案设定最高的选取优先级:选取优先级III;进一步地,可以在该预设文案与预设类别信息存在单个交集时,例如,预设文案中仅包含了该预设类别信息所表示的产品名称,认为该预设文案与预设类别信息的关联度次大,相应地,可以为该预设文案设定次高的选取优先级:选取优先级II;进一步地,可以在该预设文案与预设类别信息不存在交集时,认为该预设文案与预设类别信息的关联度最小,相应地,可以为该预设文案设定最小的选取优先级:选取优先级I。
相应地,终端可以将目标候选辅助文案按照选取优先级从高至低的顺序排列,并从选取优先级最高的一端选取M个目标候选辅助文案,以作为类别信息对应的M个辅助文案。本发明实施例中,通过预先设置选取优先级,并将语言风格相匹配的备选辅助文案中选取优先级最高的候选辅助文案确定为查找信息对应的辅助文案,可以使得最终获取到的辅助文案与类别信息,即,目标产品具有更高的关联性,进而可以提高后续过程中,利用该辅助文案生成的文案的质量。
子步骤(3):选取M个属性信息,并将所述M个属性信息与所述M个辅助文案一一组合。
本步骤中,对于每个辅助文案,如果辅助文案中包含属性信息,则可以选取包含的属性信息作为这M个属性信息中的一个属性信息,并将该属性信息与该辅助文案一一组合,如果辅助文案中不包含属性信息,则可以随机选取一个属性信息作为这M个属性信息中的一个属性信息,并进行组合。这样可以使得辅助文案与组合的属性信息的关联性更高,进而提高最终得到的辅助信息的质量。
子步骤(4):将组合后的辅助文案以及除所述M个属性信息之外的属性信息,作为所述辅助信息。
示例的,假设有P个属性信息,那么可以将组合后的辅助文案以及剩余的P-M个属性信息,确定为辅助信息。
进一步地,该辅助信息也可以为与类别信息相匹配的预设文案,相应地,可以通过下述实现方式三中的子步骤(1)实现获取辅助信息:
子步骤(1):获取指定文案数据库中与所述类别信息相匹配的预设类别信息对应的N条预设文案,以作为所述目标信息的至少一个辅助信息。
本步骤中,N可以是用户指定的,示例的,N可以为3,该指定文案数据库中存储有至少一个预设类别信息,以及每个预设类别信息对应的至少一个预设文案,其中,每个预设类别信息表示一种产品,相应地,终端可以利用该类别信息与指定文案数据库中的各个预设类别信息一一进行匹配,如果两者相同,则可以认为两者相匹配,进而可以提取该相匹配的预设类别信息对应的N条预设文案,得到辅助信息。当然,也可以参考上述实现方式二中子步骤(2)的获取方式,基于指定语言风格,先获取与类别信息相匹配的预设类别信息对应的预设文案,作为候选文案,然后,选择N个对应的语言风格与指定语言风格相匹配候选文案。本发明实施例在此不做赘述。示例的,假设N为5,得到的5条预设文案可以为:“干净流畅的线条感”、“设计简约”、“柔软细腻”、“透气亲肤面料”以及“经典圆领设计”。
步骤203、将每个辅助信息分别与所述类别信息组合,得到至少一个目标信息。
具体的,本步骤的实现方式可以参照上述步骤103,本发明实施例在此不做赘述。
步骤204、将预训练的备选文案生成模型中语言风格与所述指定语言风格相匹配的备选文案生成模型作为所述目标文案生成模型。
本步骤中,不同的备选文案生成模型可以是基于与该备选文案生成模型的语言风格相匹配的训练语料训练得到的,不同的备选文案生成模型的语言风格不同。示例的,可以预先收集不同语言风格的训练预料,可以利用语言风格为“功能描述型”的训练语料,训练语言风格为“功能描述型”的备选文案生成模型,利用语言风格为“功效表达型”的训练语料,训练语言风格为“功效表达型”的备选文案生成模型,利用语言风格为“暖心逗趣型”的训练语料,训练语言风格为“暖心逗趣型”的备选文案生成模型,等等,这样,通过使用同一类语言风格的训练语料训练一个备选文案生成模型,使得每个备选文案生成模型都具有自己的语言风格,相应的,利用每个备选文案生成模型进行文案生成时,都能生成语言风格与该备选文案生成模型的语言风格相同的文案。
具体的,在训练备选文案生成模型时,可以采用序列到序列的文本生成模型作为初始模型,也可以采用循环神经网络作为初始模型,其中,如果采用序列到序列的文本生成模型作为初始模型,在训练时可以以词为单位进行训练,如果采用循环神经网络作为初始模型,在训练时可以以字为单位进行训练,进一步地,也可以采用基于文本序列的生成对抗模型(text-GAN)作为初始模型,本发明实施例对此不作限定。
进一步地,训练语料可以包括多条样本目标信息及其对应的真实文案,在训练时,对于每条样本目标信息,可以结合该样本目标信息及其他样本目标信息对应的预测文案作为输入,具体的,可以将该样本目标信息及其他样本目标信息对应的预测文案作为输入,利用该初始模型生成该样本目标信息对应的预测文案,示例的,以训练时采用样本辅助文案作为辅助信息,即,样本目标信息是样本类别信息与样本辅助文案的结合为例,假设前一轮输入了样本目标信息“拖鞋、以简约的配色”,得到的预测文案为“舒适的大底”,那么本轮可以将样本目标信息“拖鞋、潮流的造型、舒适的大底”作为输入,这样,通过在训练过程中结合在先的样本目标信息对应的预测文案,使得最后训练得到的备选文案生成模型在生成文案时,能够结合在先的其他目标信息对应的文案的信息,进而使得每个目标信息对应的文案之间,衔接更加自然。
接着,可以计算该预测文案与真实文案之间的偏差程度,如果该偏差程度不在预设范围内,则基于该偏差程度调整初始模型中的参数,接着,再利用调整之后的初始模型继续进行训练,直到该偏差程度落入预设范围内为止。
进一步地,终端可以选取语言风格与指定语言风格相匹配的备选文案生成模型作为目标文案生成模型,示例的,假设指定语言风格为“暖心逗趣型”,那么可以将语言风格为“暖心逗趣型”的备选文案生成模型作为目标文案生成模型。本发明实施例中,通过预先采用不同语言风格的训练语料,训练能够生成不同语言风格的备选文案生成模型,通过选用语言风格与指定语言风格相匹配的备选文案生成模型作为目标文案生成模型,可以使得利用该目标文案生成模型最终生成的文案的语言风格与想要的语言风格,即,指定语言风格相匹配,进而可以提高文案的效果。
步骤205、对于每个目标信息,将所述目标信息及所述至少一个目标信息中的其他目标信息对应的文案输入目标文案生成模型,并利用所述目标文案生成模型,生成所述目标信息对应的文案。
本步骤中,可以通过下述子步骤(1)~子步骤(3)实现生成目标信息对应的文案:
子步骤(1):将输入优先级最高的目标信息输入所述目标文案生成模型,并利用所述目标文案生成模型,生成所述优先级最高的目标信息对应的文案。
本步骤中,该输入优先级可以是用户预先定义好的,也可以是终端为每个目标信息随机设定的,本发明实施例对此不作限定,示例的,假设包括3目标信息:目标信息1、目标信息2、目标信息3,其中,目标信息3的输入大于目标信息1的输入优先级,目标信息1的输入大于目标信息2的输入优先级,那么,终端可以先将目标信息1输入目标文案生成模型,利用该目标文案生成模型,生成该优先级最高的目标信息对应的文案。
具体的,在生成该优先级最高的目标信息对应的文案时,可以将该优先级最高的目标信息及任一其他目标信息对应的预设初始文案作为输入,其中,该任一其他目标信息对应的预设初始文案,可以是预先基于该其他目标信息,为该其他目标信息设置的文案。进一步地,目标文案生成模型可以利用输入层先对输入进行分词,并计算分词之后得到的每个词语的词向量,然后结合模型中隐含层的各个参数以及每个词语的词向量,计算下一词语的词向量,最后利用输出层输出该下一词语向量对应的词语,接着,结合每个词语的词向量以及计算得到的下一词语的词向量,继续计算下一词语的词向量,如此循环,直至计算出的下一词语的词向量为0时,将输出的每个词语构成的文本作为该优先级最高的目标信息对应的文案。
子步骤(2):对于除所述输入优先级最高的目标信息之外的每个目标信息,将所述目标信息及输入优先级高于所述目标信息的前一个目标信息对应的文案,输入所述目标文案生成模型。
本发明实施例中,在生成该目标信息对应的文案时,可以结合在先生成的目标信息的对应的文案,例如,最先生成了目标信息3对应的文案,接着生成目标信息1对应的文案时,可以将目标信息1及目标信息3对应的文案作为输入,示例的,假设目标信息是类别信息与属性信息的组合,利用目标信息“衬衫、系带”生成的文案为“领口系带增加复古甜美味道”,在生成下一目标信息“衬衫、喇叭袖”对应的文案时,可以将“衬衫、喇叭袖、领口系带增加复古甜美味道”作为输入。本发明实施例中,通过结合在先生成的目标信息对应的文案,一定程度上可以使得生成的该目标信息对应的文案与在先生成的目标信息的对应的文案,衔接更加自然流畅,同时,仅结合在先的前一个目标信息对应的文案,可以在实现衔接更加自然流畅的同时,最大程度的减少输入的信息量,进而减少目标文案生成模型所需处理的信息量,提高目标文案生成模型的处理效率。
子步骤(3):利用所述目标文案生成模型,生成所述目标信息对应的文案。
具体的,本步骤的实现方式可以参照上述子步骤(1),本发明实施例在此不做赘述。
步骤206、对于每个目标信息对应的文案,检测所述文案是否通顺,以及所述文案是否完整。
具体的,终端可以基于词性的统计模型来检测文案是否通顺,具体的,可以确定该目标信息对应的文案的词性构成,其中,该词性构成表示该文案中每个词语的词性,示例的,该词性构成可以为:名词+动词+名词,接着,若预存储的高频词性构成中存在与该词性构成相匹配的高频词性构成,则可以确定该目标信息对应的文案通顺且完整,反之,若预存储的高频词性构成中不存在与该词性构成相匹配的高频词性构成,则可以确定该目标信息对应的文案不通顺且不完整。
当然,也可以基于其他方式来检测文案是否存在错误,采用n-gram语言模型来检测,具体的,可以先统计预设语料库中的样本句子中连续词语出现的概率,得到多个连续词语的出现概率,其中,连续词语可以由n个词语组成,n可以为2、3、4、......。接着,可以从多个连续词语的出现概率中查找该目标信息对应的文案中每两个相邻词语构成的连续词语的概率,接着,基于该目标信息对应的文案对应的每个连续词语的概率,计算该文案对应的概率,若该文案对应的概率大于预设阈值,则可以确定该目标信息对应的文案通顺且完整,反之,若该文案对应的概率不大于预设阈值,则可以确定该目标信息对应的文案不通顺且不完整。
进一步地,终端也可以采用神经语言模型进行检测,神经语言模型是利用RNN(例LSTM)深度学习网络,学习一句话中每个词的上下文语境的相关性得到的,该神经语言模型可以判断该文案的通顺度以及完整度,进而确定该目标信息是否通顺,以及是否完整。
步骤207、若所述文案不通顺和/或所述文案不完整,从所述指定文案数据库中获取所述类别信息对应的替换文案。
本步骤中,该替换文案可以是专业人员预先搜集到的针对该类别信息所表示的产品能够通用的句子,即,“百搭句”,示例的,假设类别信息所表示的产品为“针织衫”,那么该替换文案可以为“柔软百搭”。相应地,本发明实施例中,可以预先为指定文案数据库中的每个类别信息存储至少一个对应的替换文案。
步骤208、利用所述替换文案替换所述目标信息对应的文案,得到所述目标产品的目标文案。
示例的,假设目标信息对应的文案为:“怎么穿是好看衬衣”,由于该对应的文案存在错误,因此,可以利用类别信息对应的替换文案“柔软百搭”替换该文案,本发明实施例中,通过对语句存在错误的文案进行替换,可以使得最终得到的目标产品的目标文案语句不存在错误,进而提高目标文案的可读性。
进一步地,以目标产品的类别信息、辅助信息为N条辅助文案以及指定语言风格是用户输入的为例,图2-2是本发明实施例提供的一种文案生成方法的应用示意图,如图2-2所示,终端可以从网上爬取文案,经过清洗标注之后,得到文案数据库,基于建立的商品名称库以及该文案数据库,构建出指定文案数据库,接着,可以基于用户输入的目标产品的类别信息、辅助文案数量N以及指定语言风格,从指定文案数据库获取辅助文案,接着,将类别信息以及辅助文案作为输入,利用目标文案生成模型生成文案,其中,该目标文案生成模型可以是利用文案数据库中的数据构造的训练预料训练得到的,接着,可以检测文案中是否存在错误,并在存在错误时,进行替换,最后,输出文案。
综上所述,本发明实施例提供的文案生成方法,终端可以基于目标图像,获取目标产品的类别信息,然后获取目标产品的至少一个辅助信息,该辅助信息可以包括目标产品的属性信息以及类别信息相匹配的预设文案中的至少一种,接着,可以将每个辅助信息分别与类别信息组合,得到至少一个目标信息,接着,获取预训练的备选文案生成模型中语言风格与指定语言风格相匹配的备选文案生成模型作为目标文案生成模型,这样,可以使得利用该目标文案生成模型最终生成的文案的语言风格与想要的语言风格,即,指定语言风格相匹配,进而可以提高文案的效果,最后,对于每个目标信息,可以将目标信息及至少一个目标信息中的其他目标信息对应的文案输入目标文案生成模型,并利用目标文案生成模型,生成目标信息对应的文案,并会对存在错误的文案进行替换,进而得到目标产品的目标文案,这样,通过将目标信息以及其他目标信息对应的文案结合,一定程度上可以使得最后生成的该目标信息对应的文案与其他目标信息对应的文案具有更高的相关性,进而使两者的衔接更加自然流畅,提高最终得到的目标文案的文案质量及效果,同时,通过替换掉存在错误的文案,可以保证最后得到的目标文案语句通顺完整,进而提高目标文案的质量。
图3是本发明实施例提供的一种文案生成装置的框图,如图3所示,该装置30可以包括:
第一获取模块301,用于基于目标图像,获取目标产品的类别信息;
第二获取模块302,用于获取所述目标产品的至少一个辅助信息;所述辅助信息包括所述目标产品的属性信息以及所述类别信息相匹配的预设文案中的至少一种;
组合模块303,用于将每个辅助信息分别与所述类别信息组合,得到至少一个目标信息;
生成模块304,用于对于每个目标信息,将所述目标信息及所述至少一个目标信息中的其他目标信息对应的文案输入目标文案生成模型,并利用所述目标文案生成模型,生成所述目标信息对应的文案,得到所述目标产品的目标文案。
综上所述,本发明实施例提供的文案生成装置,可以基于目标图像,获取目标产品的类别信息,然后获取目标产品的至少一个辅助信息,该辅助信息可以包括目标产品的属性信息以及类别信息相匹配的预设文案中的至少一种接着,可以将每个辅助信息分别与类别信息组合,得到至少一个目标信息,最后,对于每个目标信息,可以将目标信息及至少一个目标信息中的其他目标信息对应的文案输入目标文案生成模型,并利用目标文案生成模型,生成目标信息对应的文案,进而得到目标产品的目标文案,相较于现有技术中,直接基于每个相关信息生成每个相关信息对应的文案,以作为目标产品的文案的方式,本发明实施例中,通过将目标信息以及其他目标信息对应的文案结合,使得最后生成的该目标信息对应的文案与其他目标信息对应的文案具有更高的相关性,进而使两者的衔接更加自然流畅,提高最终得到的目标文案的文案质量及效果。
图4是本发明实施例提供的另一种文案生成装置的框图,如图4所示,该装置40可以包括:
第一获取模块401,用于基于目标图像,获取目标产品的类别信息;
第二获取模块402,用于获取所述目标产品的至少一个辅助信息;所述辅助信息包括所述目标产品的属性信息以及所述类别信息相匹配的预设文案中的至少一种;
组合模块403,用于将每个辅助信息分别与所述类别信息组合,得到至少一个目标信息;
生成模块404,用于对于每个目标信息,将所述目标信息及所述至少一个目标信息中的其他目标信息对应的文案输入目标文案生成模型,并利用所述目标文案生成模型,生成所述目标信息对应的文案,得到所述目标产品的目标文案。
可选的,所述第二获取模块402,具体用于:
获取所述目标产品的至少一个属性信息,以作为所述目标产品的至少一个辅助信息;或者,
获取指定文案数据库中与所述类别信息相匹配的预设类别信息对应的N条预设文案,以作为所述目标信息的至少一个辅助信息;所述N为不小于1的整数;或者,
获取所述目标产品的至少一个属性信息;根据所述指定文案数据库中与所述类别信息相匹配的预设类别信息对应的预设文案,获取所述类别信息对应的M个辅助文案;所述M不大于所述目标产品的属性信息的个数;选取M个属性信息,并将所述M个属性信息与所述M个辅助文案一一组合;将组合后的辅助文案以及除所述M个属性信息之外的属性信息,作为所述辅助信息;
所述指定文案数据库中存储有至少一个预设类别信息,以及每个预设类别信息对应的至少一个预设文案。
可选的,所述指定文案数据库中还存储有每个预设文案的语言风格;
所述第二获取模块402,还具体用于:
获取所述指定文案数据库中与所述类别信息相匹配的预设类别信息对应的预设文案,得到多个候选辅助文案;
基于所述多个候选辅助文案中对应的语言风格与指定语言风格相匹配的目标候选辅助文案,获取所述类别信息对应的M个辅助文案。
可选的,所述指定文案数据库中还存储有每个预设类别信息与其所属的至少一级父类的对应关系;
所述第二获取模块402,还具体用于:
确定所述目标信息所属的父类,得到目标父类;
从所述指定文案数据库中与所述目标父类相匹配的父类对应的预设类别信息中,查找与所述类别信息匹配的预设类别信息;
获取所述与所述类别信息匹配的预设类别信息对应的预设文案,得到多个候选辅助文案。
可选的,所述指定文案数据库中还存储有每个预设文案的选取优先级,所述选取优先级是根据所述预设文案与其对应的预设类别信息的关联度设定的,所述选取优先级与所述关联度呈正相关;
所述第二获取模块402,还具体用于:
将所述目标候选辅助文案按照选取优先级从高至低的顺序排列,并从选取优先级最高的一端选取M个目标候选辅助文案,以作为得所述类别信息对应的M个辅助文案。
可选的,所述装置40还包括:
确定模块405,用于将预训练的备选文案生成模型中语言风格与所述指定语言风格相匹配的备选文案生成模型作为所述目标文案生成模型;
其中,不同的备选文案生成模型是基于与所述备选文案生成模型的语言风格相匹配的训练语料训练得到的。
可选的,所述生成模块404,具体用于:
将输入优先级最高的目标信息输入所述目标文案生成模型,并利用所述目标文案生成模型,生成所述优先级最高的目标信息对应的文案;
对于除所述输入优先级最高的目标信息之外的每个目标信息,将所述目标信息及输入优先级高于所述目标信息的前1个目标信息对应的文案,输入所述目标文案生成模型;
利用所述目标文案生成模型,生成所述目标信息对应的文案。
可选的,所述装置40还包括:
检测模块406,用于对于每个目标信息对应的文案,检测所述文案是否存在错误;
第三获取模块407,用于若所述文案存在错误,则从所述指定文案数据库中获取所述类别信息对应的替换文案;
替换模块408,用于利用所述替换文案替换所述目标信息对应的文案。
综上所述,本发明实施例提供的文案生成装置,可以基于目标图像,获取目标产品的类别信息,然后获取目标产品的至少一个辅助信息,该辅助信息可以包括目标产品的属性信息以及类别信息相匹配的预设文案中的至少一种,接着,可以将每个辅助信息分别与类别信息组合,得到至少一个目标信息,接着,获取预训练的备选文案生成模型中语言风格与指定语言风格相匹配的备选文案生成模型作为目标文案生成模型,这样,可以使得利用该目标文案生成模型最终生成的文案的语言风格与想要的语言风格,即,指定语言风格相匹配,进而可以提高文案的效果,最后,对于每个目标信息,可以将目标信息及至少一个目标信息中的其他目标信息对应的文案输入目标文案生成模型,并利用目标文案生成模型,生成目标信息对应的文案,并会对存在错误的文案进行替换,进而得到目标产品的目标文案,这样,通过将目标信息以及其他目标信息对应的文案结合,使得最后生成的该目标信息对应的文案与其他目标信息对应的文案具有更高的相关性,进而使两者的衔接更加自然流畅,提高最终得到的目标文案的文案质量及效果,同时,通过替换掉存在错误的文案,可以保证最后得到的目标文案语句通顺完整,进而提高目标文案的质量。
对于上述装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例还提供一种终端,包括处理器,存储器,存储在存储器上并可在所述处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述文案生成方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述文案生成方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域技术人员易于想到的是:上述各个实施例的任意组合应用都是可行的,故上述各个实施例之间的任意组合都是本发明的实施方案,但是由于篇幅限制,本说明书在此就不一一详述了。
在此提供的文案生成方法不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造具有本发明方案的系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的文案生成方法中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (17)

1.一种文案生成方法,其特征在于,所述方法包括:
基于目标图像,获取目标产品的类别信息;
获取所述目标产品的至少一个辅助信息;所述辅助信息包括所述目标产品的属性信息以及所述类别信息相匹配的预设文案中的至少一种;
将每个辅助信息分别与所述类别信息组合,得到至少一个目标信息;
对于每个目标信息,将所述目标信息及所述至少一个目标信息中的其他目标信息对应的文案输入目标文案生成模型,并利用所述目标文案生成模型,生成所述目标信息对应的文案,得到所述目标产品的目标文案。
2.根据权利要求1所述的方法,其特征在于,所述获取所述目标产品的至少一个辅助信息,包括:
获取所述目标产品的至少一个属性信息,以作为所述目标产品的至少一个辅助信息;或者,
获取指定文案数据库中与所述类别信息相匹配的预设类别信息对应的N条预设文案,以作为所述目标信息的至少一个辅助信息;所述N为不小于1的整数;或者,
获取所述目标产品的至少一个属性信息;根据所述指定文案数据库中与所述类别信息相匹配的预设类别信息对应的预设文案,获取所述类别信息对应的M个辅助文案;所述M不大于所述目标产品的属性信息的个数;选取M个属性信息,并将所述M个属性信息与所述M个辅助文案一一组合;将组合后的辅助文案以及除所述M个属性信息之外的属性信息,作为所述辅助信息;所述指定文案数据库中存储有至少一个预设类别信息,以及每个预设类别信息对应的至少一个预设文案。
3.根据权利要求2所述的方法,其特征在于,所述指定文案数据库中还存储有每个预设文案的语言风格;
所述根据所述指定文案数据库中与所述类别信息相匹配的预设类别信息对应的预设文案,获取所述类别信息对应的M个辅助文案,包括:
获取所述指定文案数据库中与所述类别信息相匹配的预设类别信息对应的预设文案,得到多个候选辅助文案;
基于所述多个候选辅助文案中对应的语言风格与指定语言风格相匹配的目标候选辅助文案,获取所述类别信息对应的M个辅助文案。
4.根据权利要求3所述的方法,其特征在于,所述指定文案数据库中还存储有每个预设类别信息与其所属的至少一级父类的对应关系;
所述获取所述指定文案数据库中与所述类别信息相匹配的预设类别信息对应的预设文案,得到多个候选辅助文案,包括:
确定所述目标信息所属的父类,得到目标父类;
从所述指定文案数据库中与所述目标父类相匹配的父类对应的预设类别信息中,查找与所述类别信息匹配的预设类别信息;
获取所述与所述类别信息匹配的预设类别信息对应的预设文案,得到多个候选辅助文案。
5.根据权利要求3或4所述的方法,其特征在于,所述指定文案数据库中还存储有每个预设文案的选取优先级,所述选取优先级是根据所述预设文案与其对应的预设类别信息的关联度设定的,所述选取优先级与所述关联度呈正相关;
所述基于所述多个候选辅助文案中对应的语言风格与指定语言风格相匹配的目标候选辅助文案,获取所述类别信息对应的M个辅助文案,包括
将所述目标候选辅助文案按照选取优先级从高至低的顺序排列,并从选取优先级最高的一端选取M个目标候选辅助文案,以作为所述类别信息对应的M个辅助文案。
6.根据权利要求1所述的方法,其特征在于,所述对于每个目标信息,将所述目标信息及所述至少一个目标信息中的其他目标信息对应的文案输入目标文案生成模型,并利用所述目标文案生成模型,生成所述目标信息对应的文案之前,所述方法还包括:
将预训练的备选文案生成模型中语言风格与指定语言风格相匹配的备选文案生成模型作为所述目标文案生成模型;
其中,不同的备选文案生成模型是基于与所述备选文案生成模型的语言风格相匹配的训练语料训练得到的。
7.根据权利要求1或6所述的方法,其特征在于,所述对于每个目标信息,将所述目标信息及所述至少一个目标信息中的其他目标信息对应的文案输入目标文案生成模型,并利用所述目标文案生成模型,生成所述目标信息对应的文案,包括:
将输入优先级最高的目标信息输入所述目标文案生成模型,并利用所述目标文案生成模型,生成所述优先级最高的目标信息对应的文案;
对于除所述输入优先级最高的目标信息之外的每个目标信息,将所述目标信息及输入优先级高于所述目标信息的前一个目标信息对应的文案,输入所述目标文案生成模型;
利用所述目标文案生成模型,生成所述目标信息对应的文案。
8.根据权利要求1所述的方法,其特征在于,所述利用所述目标文案生成模型,生成所述目标信息对应的文案之后,所述方法还包括:
对于每个目标信息对应的文案,检测所述文案是否通顺,以及所述文案是否完整;
若所述文案不通顺和/或所述文案不完整,从指定文案数据库中获取所述类别信息对应的替换文案;
利用所述替换文案替换所述目标信息对应的文案。
9.一种文案生成装置,其特征在于,所述装置包括:
第一获取模块,用于基于目标图像,获取目标产品的类别信息;
第二获取模块,用于获取所述目标产品的至少一个辅助信息;所述辅助信息包括所述目标产品的属性信息以及所述类别信息相匹配的预设文案中的至少一种;
组合模块,用于将每个辅助信息分别与所述类别信息组合,得到至少一个目标信息;
生成模块,用于对于每个目标信息,将所述目标信息及所述至少一个目标信息中的其他目标信息对应的文案输入目标文案生成模型,并利用所述目标文案生成模型,生成所述目标信息对应的文案,得到所述目标产品的目标文案。
10.根据权利要求9所述的装置,其特征在于,所述第二获取模块,具体用于:
获取所述目标产品的至少一个属性信息,以作为所述目标产品的至少一个辅助信息;或者,
获取指定文案数据库中与所述类别信息相匹配的预设类别信息对应的N条预设文案,以作为所述目标信息的至少一个辅助信息;所述N为不小于1的整数;或者,
获取所述目标产品的至少一个属性信息;根据所述指定文案数据库中与所述类别信息相匹配的预设类别信息对应的预设文案,获取所述类别信息对应的M个辅助文案;所述M不大于所述目标产品的属性信息的个数;选取M个属性信息,并将所述M个属性信息与所述M个辅助文案一一组合;将组合后的辅助文案以及除所述M个属性信息之外的属性信息,作为所述辅助信息;
所述指定文案数据库中存储有至少一个预设类别信息,以及每个预设类别信息对应的至少一个预设文案。
11.根据权利要求10所述的装置,其特征在于,所述指定文案数据库中还存储有每个预设文案的语言风格;
所述第二获取模块,还具体用于:
获取所述指定文案数据库中与所述类别信息相匹配的预设类别信息对应的预设文案,得到多个候选辅助文案;
基于所述多个候选辅助文案中对应的语言风格与指定语言风格相匹配的目标候选辅助文案,获取所述类别信息对应的M个辅助文案。
12.根据权利要求11所述的装置,其特征在于,所述指定文案数据库中还存储有每个预设类别信息与其所属的至少一级父类的对应关系;
所述第二获取模块,还具体用于:
确定所述目标信息所属的父类,得到目标父类;
从所述指定文案数据库中与所述目标父类相匹配的父类对应的预设类别信息中,查找与所述类别信息匹配的预设类别信息;
获取所述与所述类别信息匹配的预设类别信息对应的预设文案,得到多个候选辅助文案。
13.根据权利要求11或12所述的装置,其特征在于,所述指定文案数据库中还存储有每个预设文案的选取优先级,所述选取优先级是根据所述预设文案与其对应的预设类别信息的关联度设定的,所述选取优先级与所述关联度呈正相关;
所述第二获取模块,还具体用于:
将所述目标候选辅助文案按照选取优先级从高至低的顺序排列,并从选取优先级最高的一端选取M个目标候选辅助文案,以作为所述类别信息对应的M个辅助文案。
14.根据权利要求9所述的装置,其特征在于,所述装置还包括:
确定模块,用于将预训练的备选文案生成模型中语言风格与指定语言风格相匹配的备选文案生成模型作为所述目标文案生成模型;
其中,不同的备选文案生成模型是基于与所述备选文案生成模型的语言风格相匹配的训练语料训练得到的。
15.根据权利要求9或14所述的装置,其特征在于,所述生成模块,具体用于:
将输入优先级最高的目标信息输入所述目标文案生成模型,并利用所述目标文案生成模型,生成所述优先级最高的目标信息对应的文案;
对于除所述输入优先级最高的目标信息之外的每个目标信息,将所述目标信息及输入优先级高于所述目标信息的前一个目标信息对应的文案,输入所述目标文案生成模型;
利用所述目标文案生成模型,生成所述目标信息对应的文案。
16.根据权利要求9所述的装置,其特征在于,所述装置还包括:
检测模块,用于对于每个目标信息对应的文案,检测所述文案是否通顺,以及所述文案是否完整;
第三获取模块,用于若所述文案不通顺和/或所述文案不完整,从指定文案数据库中获取所述类别信息对应的替换文案;
替换模块,用于利用所述替换文案替换所述目标信息对应的文案。
17.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一所述的文案生成方法。
CN201910335631.1A 2019-04-24 2019-04-24 文案生成方法、装置及计算机可读存储介质 Active CN110196972B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910335631.1A CN110196972B (zh) 2019-04-24 2019-04-24 文案生成方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910335631.1A CN110196972B (zh) 2019-04-24 2019-04-24 文案生成方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110196972A CN110196972A (zh) 2019-09-03
CN110196972B true CN110196972B (zh) 2022-11-01

Family

ID=67752040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910335631.1A Active CN110196972B (zh) 2019-04-24 2019-04-24 文案生成方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110196972B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111143546A (zh) * 2019-11-15 2020-05-12 北京星选科技有限公司 一种获得推荐语的方法、装置及电子设备
CN112862558B (zh) * 2019-11-28 2024-03-01 阿里巴巴集团控股有限公司 产品详情页面的生成方法和系统、数据处理方法
CN110969681B (zh) * 2019-11-29 2023-08-29 山东浪潮科学研究院有限公司 一种基于gan网络的手写体书法文字生成方法
CN111309951A (zh) * 2020-01-23 2020-06-19 北京达佳互联信息技术有限公司 广告语获取方法及其装置、存储介质
CN113450433B (zh) * 2020-03-26 2024-08-16 阿里巴巴集团控股有限公司 图片生成方法、装置、计算机设备和介质
CN113780516A (zh) * 2021-01-21 2021-12-10 北京沃东天骏信息技术有限公司 物品文案生成网络训练方法、物品文案生成方法、装置
CN113626676A (zh) * 2021-08-10 2021-11-09 北京沃东天骏信息技术有限公司 属性信息的生成方法和系统,及计算机存储介质
CN114997131A (zh) * 2022-05-19 2022-09-02 北京沃东天骏信息技术有限公司 文案生成方法、模型训练方法及装置、设备、存储介质
CN115496820A (zh) * 2022-08-31 2022-12-20 阿里巴巴(中国)有限公司 图像文案的生成方法、设备及计算机存储介质
CN117312533B (zh) * 2023-11-27 2024-02-27 乐刷科技有限公司 基于人工智能模型的文案生成方法、装置、设备及介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002329137A (ja) * 2001-04-26 2002-11-15 Naoki Sakuma 携帯電話端末広告作成配信及び市場情報収集システム
US7209923B1 (en) * 2006-01-23 2007-04-24 Cooper Richard G Organizing structured and unstructured database columns using corpus analysis and context modeling to extract knowledge from linguistic phrases in the database
JP2007219694A (ja) * 2006-02-15 2007-08-30 Dainippon Printing Co Ltd 商品紹介情報編集装置
CN108694210A (zh) * 2017-04-11 2018-10-23 阿里巴巴集团控股有限公司 模板生成方法及装置
CN108932335A (zh) * 2018-07-10 2018-12-04 北京京东尚科信息技术有限公司 一种生成文案的方法和装置
CN108959271A (zh) * 2018-08-10 2018-12-07 广州太平洋电脑信息咨询有限公司 描述文本生成方法、装置、计算机设备和可读存储介质
CN109033266A (zh) * 2018-07-09 2018-12-18 北京三快在线科技有限公司 信息投放方法、装置、电子设备及计算机可读介质
CN109522531A (zh) * 2017-09-18 2019-03-26 腾讯科技(北京)有限公司 文案生成方法和装置、存储介质及电子装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10614285B2 (en) * 2015-03-18 2020-04-07 Proscia Inc. Computing technologies for image operations

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002329137A (ja) * 2001-04-26 2002-11-15 Naoki Sakuma 携帯電話端末広告作成配信及び市場情報収集システム
US7209923B1 (en) * 2006-01-23 2007-04-24 Cooper Richard G Organizing structured and unstructured database columns using corpus analysis and context modeling to extract knowledge from linguistic phrases in the database
JP2007219694A (ja) * 2006-02-15 2007-08-30 Dainippon Printing Co Ltd 商品紹介情報編集装置
CN108694210A (zh) * 2017-04-11 2018-10-23 阿里巴巴集团控股有限公司 模板生成方法及装置
CN109522531A (zh) * 2017-09-18 2019-03-26 腾讯科技(北京)有限公司 文案生成方法和装置、存储介质及电子装置
CN109033266A (zh) * 2018-07-09 2018-12-18 北京三快在线科技有限公司 信息投放方法、装置、电子设备及计算机可读介质
CN108932335A (zh) * 2018-07-10 2018-12-04 北京京东尚科信息技术有限公司 一种生成文案的方法和装置
CN108959271A (zh) * 2018-08-10 2018-12-07 广州太平洋电脑信息咨询有限公司 描述文本生成方法、装置、计算机设备和可读存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Detection and Prevention of Copywriting Multimedia Contents in Youtube Using Multi-Keyword Ranking Algorithm;R. Raju等;《2018 International Conference on Computation of Power, Energy, Information and Communication (ICCPEIC)》;20181108;全文 *
广告营销中的语言应用;卞晓丹;《哈尔滨师范大学社会科学学报》;20141215(第06期);全文 *
移动互联时代广告文案课程教学目标的构建与实现;丁洁;《传媒》;20170223(第04期);全文 *
面向网络新闻的应急案例缺失信息补充方法;王宁等;《系统工程》;20170628(第06期);全文 *

Also Published As

Publication number Publication date
CN110196972A (zh) 2019-09-03

Similar Documents

Publication Publication Date Title
CN110196972B (zh) 文案生成方法、装置及计算机可读存储介质
CN111415740B (zh) 问诊信息的处理方法、装置、存储介质及计算机设备
CN110674410B (zh) 用户画像构建、内容推荐方法、装置及设备
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
US9594747B2 (en) Generation of a semantic model from textual listings
CN106328147B (zh) 语音识别方法和装置
RU2678716C1 (ru) Использование автоэнкодеров для обучения классификаторов текстов на естественном языке
US20180336193A1 (en) Artificial Intelligence Based Method and Apparatus for Generating Article
CN110325986B (zh) 文章处理方法、装置、服务器及存储介质
US9898464B2 (en) Information extraction supporting apparatus and method
CN101819583A (zh) 针对自动化本体生成领域语料库和字典
CN110263122B (zh) 一种关键词获取方法、装置及计算机可读存储介质
KR20200087977A (ko) 멀티모달 문서 요약 시스템 및 방법
CN107491434A (zh) 基于语义相关性的文本摘要自动生成方法及装置
JP2008203933A (ja) カテゴリ作成方法および装置、文書分類方法および装置
CN109615009B (zh) 一种学习内容推荐方法及电子设备
CN107665221A (zh) 关键词的分类方法和装置
CN115114919A (zh) 呈现提示信息的方法和装置以及存储介质
Liao et al. Knowledge-aware multimodal fashion chatbot
CN112883729B (zh) 文本创作的词汇推荐方法、装置及服务器
US20240256597A1 (en) Machine learning selection of images
JP2010198278A (ja) 評判情報分類装置、評判情報分類方法及びプログラム
CN116702770A (zh) 长文本的生成方法、装置、终端及存储介质
CN110750712A (zh) 基于数据驱动的软件安全需求推荐方法
Mollá et al. Query-focused extractive summarisation for finding ideal answers to biomedical and COVID-19 questions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant