CN111814488B - 一种诗词生成方法、装置、电子设备及可读存储介质 - Google Patents
一种诗词生成方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN111814488B CN111814488B CN202010712561.XA CN202010712561A CN111814488B CN 111814488 B CN111814488 B CN 111814488B CN 202010712561 A CN202010712561 A CN 202010712561A CN 111814488 B CN111814488 B CN 111814488B
- Authority
- CN
- China
- Prior art keywords
- poetry
- expression element
- target
- morphemes
- generating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000012549 training Methods 0.000 claims description 32
- 238000013136 deep learning model Methods 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000003796 beauty Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本申请提供了一种诗词生成方法、装置、电子设备及可读存储介质,其中,该方法包括:首先获取用于生成目标诗词的图像中的表达元素;针对每个待确定内容的语素,从参考诗词集的文字中选择该语素所使用的文字;该语素所使用的文字是根据表达元素、已确定的其他语素的内容以及参考诗词集中的文字与表达元素的关联度选择的;将每个语素所使用的文字进行组合,以生成目标诗词。本申请生成的目标诗词中不仅仅包含表征表达元素语义的文字,还包含从参考诗词集中选择的与表达元素相关联的文字,这样生成的目标诗词可以能够更加准确地表达图像的含义。
Description
技术领域
本申请涉及计算机技术领域,尤其是涉及一种诗词生成方法、装置、电子设备及可读存储介质。
背景技术
随着近年来科学技术的发展,人工智能的发展取得了重大突破,人工智能的发展推动了看图写诗技术的发展。借助于看图写诗的技术,计算机能够越来越像人一样,对图片进行识别和分类,进行自然语言处理。
现有的看图写诗方法主要是先在语义层面获取到图片中的事物,然后根据图片中包含的事物确定关键词,最后基于关键词进行扩展生成诗词。
而上述看图写诗的方法容易生成主要包含关键词的诗词,导致生成的诗词不能涵盖图片中更多的内容,无法准确表达图片的含义。
发明内容
有鉴于此,本申请的目的在于提供一种诗词生成方法、装置、电子设备及可读存储介质,使得生成的诗词能够准确表达图片的含义。
第一方面,本申请实施例提供了一种诗词生成方法,包括:
获取用于生成目标诗词的图像中的表达元素;
针对每个待确定内容的语素,从参考诗词集的文字中选择该语素所使用的文字;该语素所使用的文字是根据所述表达元素、已确定的其他语素的内容以及所述参考诗词集中的文字与所述表达元素的关联度选择的;
将每个语素所使用的文字进行组合,以生成目标诗词。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,步骤针对每个待确定内容的语素,从所述参考诗词集的文字中选择该语素所使用的文字,包括:
针对每个待确定内容的语素,根据所述表达元素、已确定的其他语素的内容以及参考诗词集中的文字与所述表达元素的关联度,确定所述参考诗词集中每个文字的使用概率;
针对每个待确定内容的语素,根据所述参考诗词集中每个文字的使用概率,选择该语素所使用的文字。
结合第一方面,本申请实施例提供了第一方面的第二种可能的实施方式,其中,将获取的用于生成目标诗词的图像输入至预先训练好的深度学习模型中,输出得到目标诗词。
结合第一方面的第二种可能的实施方式,本申请实施例提供了第一方面的第三种可能的实施方式,其中,所述深度学习模型是通过以下步骤进行训练的:
获取样本图像以及所述样本图像中的表达元素;
针对每个表达元素,根据该表达元素的语义和候选诗词中包含的文字的语义,确定包含该表达元素的语义的诗词集;
针对每个表达元素,生成训练样本;所述训练样本中均包含样本图像和包含该样本图像中表达元素语义的诗词集;
将所述训练样本输入至未训练完成的深度学习模型中,以对所述深度学习模型进行训练。
结合第一方面的第三种可能的实施方式,本申请实施例提供了第一方面的第四种可能的实施方式,其中,步骤针对每个表达元素,根据该表达元素的语义和候选诗词中包含的文字的语义,确定包含该表达元素的语义的诗词集,包括:
针对每个表达元素,计算候选诗词中包含的候选关键词与该表达元素的语义相似度;
针对每个表达元素,将候选诗词中包含的候选关键词与该表达元素的语义相似度大于第一预设值的候选关键词确定为表征该表达元素语义的目标关键词;
针对每个表达元素,根据表征该表达元素语义的目标关键词所在的候选诗词形成包含该表达元素的语义的诗词集。
结合第一方面的第四种可能的实施方式,本申请实施例提供了第一方面的第五种可能的实施方式,其中,在步骤针对每个表达元素,计算候选诗词中包含的候选关键词与该表达元素的语义相似度之前,包括:
确定候选诗词中包含的每个关键词的出现频率;
将出现频率大于第二预设值的关键词确定为候选关键词。
结合第一方面,本申请实施例提供了第一方面的第六种可能的实施方式,其中,所述生成的目标诗词为以下体裁中的任意一种:古体诗、近体诗、词和曲。
第二方面,本申请实施例还提供一种诗词生成装置,包括:
第一获取模块,用于获取用于生成目标诗词的图像中的表达元素;
第一选择模块,用于针对每个待确定内容的语素,从参考诗词集的文字中选择该语素所使用的文字;该语素所使用的文字是根据所述表达元素、已确定的其他语素的内容以及所述参考诗词集中的文字与所述表达元素的关联度选择的;
组合模块,用于将每个语素所使用的文字进行组合,以生成目标诗词。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面中任一种可能的实施方式中的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面中任一种可能的实施方式中的步骤。
本申请实施例提供的一种诗词生成方法,首先获取用于生成目标诗词的图像中的表达元素;针对每个待确定内容的语素,从参考诗词集的文字中选择该语素所使用的文字;该语素所使用的文字是根据表达元素、已确定的其他语素的内容以及参考诗词集中的文字与表达元素的关联度选择的;将每个语素所使用的文字进行组合,以生成目标诗词。本申请实施例选择的每个语素所使用的文字,是从参考诗词集中选择的,生成的目标诗词中不仅仅包含表征表达元素语义的文字,还包含从参考诗词集中选择的与表达元素相关联的文字,这样生成的目标诗词能够更加准确地表达图像的含义。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的第一种诗词生成方法的流程图;
图2示出了本申请实施例所提供的针对同一游戏界面图像,生成的目标诗词的示意图;
图3示出了本申请实施例所提供的训练样本示意图;
图4示出了本申请实施例所提供的一种诗词生成装置的结构示意图;
图5示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
图像描述是当前研究的热门领域,大致流程是给出一张图片,系统输出符合图像语义的文本描述。看图写诗属于图像描述(Image Caption)的范畴。在根据图片生成诗词时,我们希望:第一,生成的诗词符合图像传达的视觉信息;第二,生成的诗词需要尽可能多的包含图片中的内容;第三,生成的诗词必须符合诗词的韵律和格式要求,即能生成指定体裁的诗词;第四,生成的诗词具有多样性,即给定同一张图片,系统可以生成多首不同的诗词。
现有的看图写诗方法主要是利用基于CNN(Convolutional Neural Networks,即卷积神经网络)直接从图像抽取出关键词,然后基于关键词进行扩展生成诗词。这种看图写诗的方法会迫使模型生成包含关键词的诗词,而忽略关键词外的内容,导致生成的诗词不能涵盖图片中更多的内容,无法准确表达图片的含义。
基于此,本申请实施例提供了一种诗词生成方法、装置、电子设备及可读存储介质,下面通过实施例进行描述。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种诗词生成方法进行详细介绍。如图1所示的一种诗词生成方法的流程图中,包括以下步骤:
S101:获取用于生成目标诗词的图像中的表达元素;
S102:针对每个待确定内容的语素,从参考诗词集的文字中选择该语素所使用的文字;该语素所使用的文字是根据表达元素、根据已确定的其他语素的内容以及参考诗词集中的文字与表达元素的关联度选择的;
S103:将每个语素所使用的文字进行组合,以生成目标诗词。
步骤S101中,用于生成目标诗词的图像可以是网页中的图像、照相机拍摄的图像或者网络游戏中的界面图像,这里主要针对的是网络游戏中的界面图像。
在某些网络游戏中,玩家进入新的场景或者新的游戏等级或者赢得某场比赛时,作为新的体验或者奖励,一些网络游戏允许玩家可以针对选定的用于生成目标诗词的游戏界面图像,通过进行生成诗词的操作(例如玩家点击一键上传图片的按钮),生成与该游戏界面图像相对应的目标诗词,以提高网络游戏与玩家的互动性,提升玩家的游戏体验。
这里,游戏界面图像可以通过游戏及游戏发布平台获取的大量游戏界面图片、游戏视频(游戏视频可以通过切帧处理生成游戏界面图片);或者是获取的用户(可以包括游戏玩家、游戏开发人员等)上传的游戏界面的截图。
一般获取的用于生成目标诗词的游戏界面图像是风景图像,游戏界面图像中主要包含人物或者景物等。
表达元素用于表征用于生成目标诗词的图像的特征,具体地,图像的特征指的是图像中包含的内容,这些内容都是跟视觉元素相关的内容,例如人、物体等。
步骤S102中,语素指的是用于生成目标诗词的最小的语言单位,可以是字或词,在本申请实施例中,目标诗词可以是基于字生成的。
参考诗词集中包含图像中的表达元素的语义。在执行步骤S102之前,针对图像中的每个表达元素,可以利用预先训练好的深度学习模型根据该表达元素确定出包含该表达元素的语义的参考诗词集,深度学习模型的训练过程在下文中将会详细描述。
针对每个待确定内容的语素,该语素所使用的文字是从参考诗词集中选择出来的文字。
在确定每个待确定内容的语素所使用的文字时,可以根据表达元素、已确定的其他语素的内容,以及参考诗词集中的文字与图像中的表达元素的关联度进行确定。
一般情况下,在生成目标诗词时,可以按照现代写字顺序(从左往右)确定每个待确定内容的语素。因此已确定的其他语素指的是待确定内容的语素的前序语素。其中前序语序可以是与待确定内容的语素相邻的前序语素,也可以是与待确定内容的语素间隔预设距离的前序语素,还可以是待确定内容的语素的所有前序语素。
考虑到当待确定内容的语素为目标诗词中的第一个语素时,不存在与该语素的前序语素,因此在选择待确定内容的语素所使用的文字时可以分为以下两种情况:
第一种情况,当待确定内容的语素为目标诗词中的第一个语素时,可以根据表达元素、参考诗词集中的每个文字与表达元素的关联度进行选择。
第二种情况,当待确定内容的语素不是目标诗词中的第一个语素时,可以根据表达元素、该语素的前序语素的内容以及参考诗词集中的文字与表达元素的关联度进行选择。
在具体实施过程中,在选择每个待确定内容的语素所使用的文字时可以根据文字的使用概率进行选择,具体地,上述步骤S102可以按照以下步骤执行:
S1021:针对每个待确定内容的语素,根据表达元素、已确定的其他语素的内容以及参考诗词集中的文字与表达元素的关联度,确定参考诗词集中每个文字的使用概率;
S1022:针对每个待确定内容的语素,根据参考诗词集中每个文字的使用概率,选择该语素所使用的文字。
在步骤S1021中,当参考词集中的文字与表达元素的关联度越高时,那么该文字的使用概率越大,也就是该文字与表达元素的相关性越高。
在步骤S1022中,确定出参考诗词集中每个文字的使用概率之后,可以通过以下至少三种方法来选择待确定内容的语素所使用的文字:
第一种选择待确定内容的语素所使用的文字的方法为采样方法,即确定出参考诗词集中每个文字的使用概率后,选择使用概率达到预设概率值的文字作为语素所使用的文字。
第二种选择待确定内容的语素所使用的文字的方法为贪心方法,即确定出参考诗词集中每个文字的使用概率后,选择使用概率最大的文字作为语素所使用的字。
第三种选择待确定内容的语素所使用的文字的方法为将采样方法和贪心方法结合的方法,即确定出参考诗词集中每个文字的使用概率后,先采用采样方法选择语素所使用的文字,再采用贪心方法选择语素所使用的文字;或者是先采用贪心方法选择语素所使用的文字;再采用采样方法选择语素所使用的文字。
使用第一种选择待确定内容的语素所使用的文字的方法时,由于选择的是使用概率达到预设概率值的文字,因此一般情况下可能会选择出多个文字,然后再从多个文字中随机选择一个文字作为语素所使用的文字,这样可以增加语素所使用的文字的多样性,继而可以增加生成的目标诗词的多样性。
但是由于选择的文字可能不是使用概率最大的文字,因此语素所使用的文字与图像中的表达元素的相关性可能不强,也就是生成的目标诗词与图像中的表达元素的相关性可能不强。
使用第二种选择语素所使用的文字的方法选择语素所使用的文字时,由于选择的文字都是使用概率最大的,也就是选择的文字与表达元素的相关性较高,生成的目标诗词与图像中的表达元素的相关性较高。
但是由于选择的文字都是使用概率最大的,因此,选择的文字的个数一般很少(通常情况下仅有一个),这样生成的目标诗词就容易缺乏多样性。
因此,在具体实施过程中,可以使用第三种选择语素所使用的文字的方法选择语素所使用的文字,也就是将采样方法和贪心方法这两种方法进行结合来选择语素所使用的文字。
比如,先通过采样方法选择目标诗词中前半部分的语素所使用的文字,再通过贪心方法选择目标诗词中后半部分的语素所使用的文字,这样生成的目标诗词既具有多样性,又跟图像中的表达元素具有较高的相关性。
如图2所示的针对同一游戏界面图像,生成的目标诗词的示意图中,“B”表示三次采用贪心方法选择语素所使用的文字后,生成的古诗,“T”表示三次采用采样方法选择语素所使用的文字后,生成的古诗,“H”表示三次均先采用采样方法,再采用贪心方法混合的方式选择语素所使用的文字后,生成的古诗。
从图2中可以看出,三次采用贪心方法选择语素所使用的文字后,生成了相同的一首古诗;三次采用采样方法选择语素所使用的文字后,生成了三首均不相同的古诗,但是生成的古诗中出现了“欹枕”、“栏杆”、“岳阳楼阁”这样的词,而图片中并没有这样的景物,显然采用采样方法生成的古诗与图片的相关性并不是很强;三次均先采用采样方法,再采用贪心方法选择语素所使用的文字后,也是生成三首均不相同的古诗,但是生成的古诗都比较贴切地描绘出了图片中的内容,也没有出现图片以外的内容,因此,采用混合的方式生成的古诗与图片具有较强的相关性。
在一种可能的实施方式中,针对确定语素所使用的文字的两种情况,当待确定内容的语素为目标诗词中的第一个语素时,可以选择使用概率最大的文字作为语素所使用的文字;当待确定内容的语素不是目标诗词中的第一个语素时,可以根据上述选择语素所使用的文字的三种方法中的任意一种选择语素所使用的文字。
在具体实施过程中,参考诗词集中每个文字的使用概率可以通过语言模型计算得到。
在具体实施中,还可以结合目标诗词的指定体裁,确定每个待确定内容的语素所使用的文字。具体地,可以在获取用于生成目标诗词的图像之后,获取目标诗词的体裁指示符。目标诗词的体裁指示符可以是用户输入的,也可以是系统默认的。
步骤S103中,将每个语素所使用的文字按照现代写字顺序进行组合,可以生成目标诗词。
生成的目标诗词可以为以下体裁中的任意一种:古体诗、近体诗、词和曲。具体地,古体诗可以包括古诗、楚辞、乐府诗。近体诗可以包括律诗和绝句,例如:五言绝句、七言绝句、五言律诗、七言律诗等。生成的目标诗词不仅仅限于上述体裁。
目标诗词的体裁可以是在获取到的用于生成目标诗词的图像之后获取的。目标诗词的体裁可以是用户输入的,也可以是系统默认的。
在具体实施中,在获取用于生成目标诗词的图像中的表达元素之前,可以先获取用于生成目标诗词的图像,然后将获取的用于生成目标诗词的图像输入至预先训练好的深度学习模型中,输出得到目标诗词。
将获取的用于生成目标诗词的图像输入至预先训练好的深度学习模型之后,预先训练完成的深度学习模型对图像中的表达元素进行解码,得到图像中的表达元素,再针对目标诗词中每个待确定内容的语素,根据表达元素、已确定的其他语素的内容以及参考诗词集中的文字与表达元素的关联度,从参考诗词集中的文字中选择该语素所使用的文字,使得生成的目标诗词中不仅仅包含表征表达元素语义的文字,还包含从参考诗词集中选择的与表达元素相关联的文字,这样生成的目标诗词能够更加准确地表达图像的含义。
在利用深度学习模型生成目标诗词之前,还需要对未训练完成的深度学习模型进行训练,得到训练完成的深度学习模型。深度学习模型的训练过程可以包括以下步骤:
S201:获取样本图像以及样本图像中的表达元素;
S202:针对每个表达元素,根据该表达元素的语义和候选诗词中包含的文字的语义,确定包含该表达元素的语义的诗词集;
S203:针对每个表达元素,生成训练样本;训练样本中均包含样本图像和包含该样本图像中表达元素语义的诗词集;
S204:将训练样本输入至未训练完成的深度学习模型中,以对深度学习模型进行训练。
步骤S201中,可以利用开源的多标签图像分类数据集获取样本图像。多标签图像分类数据集中每张图像都是已确定好标签的图像。
在具体实施中,可以基于迁移学习技术,利用多标签图像分类数据集对图像分类器进行训练,使得训练好的图像分类器可以根据图像的标签进行分类。同一类别的图像包含相同的标签。在生成目标诗词的时候,可以将这个训练好的图片分类器作为预先训练完成的深度学习模型的编码器。
这里,获取的每张样本图像的标签是根据样本图像中包含的肉眼能直观看到的内容确定的,也就是标签可以表征样本图像中包含的内容,因此通过标签可以确定每张样本图像中包含的内容。
在具体实施中,样本图像的标签是英文形式的,这里可以利用翻译系统将英文标签翻译为中文。
通常,每张样本图像可以对应至少一个标签。
由于表达元素指的是图像中包含的跟视觉元素相关的内容,那么根据每张样本图像的标签就可以确定出每张样本图像中的表达元素。当样本图像对应多个标签时,那么该样本图像中的表达元素也为多个。
步骤S202中,可以预先收集大量体裁不同的诗词作为候选诗词。
针对每张样本图像中每个表达元素,通过分析该表达元素的语义以及每首候选诗词中包含的文字的语义,将包含的文字的语义与表达元素的语义符合预设要求的候选诗词确定为包含该表达元素的语义的诗词集。
针对每个表达元素,确定出的诗词集中可以包含至少一首包含该表达元素的语义的候选诗词。
考虑到自然语言中存在相同的字在不同场合或者领域使用时其词性是不同的,因此在确定包含某表达元素的语义的诗词集时,具体还可结合表达元素与候选诗词中包含的文字对应的词性进行选择。
由于表达元素是图像中包含的跟视觉元素相关的内容,因此表达元素对应的词性通常为名词,那么针对每个表达元素,可以将词性为名词,且包含的文字的语义与表达元素的语义符合预设要求的候选诗词作为包含该表达元素的语义的诗词集。
步骤S203中,针对每个表达元素,生成的训练样本中,样本图像均包含该表达元素,且诗词集中的候选诗词均包含该表达元素的语义。也就是通过该表达元素,使得样本图像与诗词集中的候选诗词形成了一种映射关系。
由于一张样本图像中可能包含多个表达元素,因此一张样本图像可能对应多首诗词,最后生成的训练样本即包括一张样本图像与对应的包含多首诗词的诗词集。如图3所示的训练样本示意图中,一种样本图像对应了4四首古诗。
步骤S204中,将样本图像作为输入,诗词集中的候选诗词作为输出,对未训练完成的深度学习模型进行训练。
通过上述S201-S204的步骤,可以实现对未训练完成的深度学习模型进行训练的过程,使得训练完成的深度学习模型可以根据训练样本,学习到应该对应哪个表达元素,根据确定出的表达元素输出倾向包含该表达元素语义的诗词。
由于训练样本中包含体裁不同的候选诗词,深度学习模型在训练过程中,还可以学习到输出何种体裁的诗词。具体地,在训练过程中,输入加入了体裁指示符的候选诗词,例如,五言古诗:“松室开孤定,褰帏纳夜凉。婵娟依翠竹,无语过东墙。”,深度学习模型可以学习到体裁指示符与文本格式之间的关系。
在一种可行的实施方式中,针对每个表达元素,确定包含该表达元素的语义的诗词集时,可以根据该表达元素的语义和候选诗词中包含的文字的语义的相似度选择,具体地,上述步骤S202可以按照以下步骤执行:
S2021:针对每个表达元素,计算候选诗词中包含的候选关键词与该表达元素的语义相似度;
S2022:针对每个表达元素,将候选诗词中包含的候选关键词与该表达元素的语义相似度大于第一预设值的候选关键词确定为表征该表达元素语义的目标关键词;
S2023:针对每个表达元素,根据表征该表达元素语义的目标关键词所在的候选诗词形成包含该表达元素的语义的诗词集。
步骤S2021中,候选诗词中包含的候选关键词是从关键词集中筛选出的,候选关键词的筛选过程是在步骤S2021之前执行的,具体包括以下步骤:
S301:确定候选诗词中包含的每个关键词的出现频率;
S302:将出现频率大于第二预设值的关键词确定为候选关键词。
步骤S301中,在筛选候选关键词之前可以将《诗学含英》(《诗学含英》是清代刘文蔚根据《增广诗韵全璧》一书所附〈诗学含英〉创作的一本书籍,供使用者根据意向词的类别检索)中的意向词作为关键词。
根据上述关键词,统计候选诗词中包含的每个关键词的出现概率。
步骤S302中,考虑到出现概率高的关键词说明该关键词被使用得更广泛,那么包含该关键词的候选诗词更多,能形成更多的训练样本。
因此,这里将出现频率大于第二预设值的关键词确定为候选关键词,也就是将出现频率较高的关键词确定为候选关键词,其中第二预设值是人为设定的。
这里,确定出的候选关键词为视觉元素相关的关键词,例如“落日”、“银烛”,过滤了抽象的关键词、例如“天才”、“人材”。
在具体实施中,可以将表达元素的语义和候选诗词中包含的候选关键词可以用词向量的形式表示,通过词向量计算表达元素与候选诗词中包含的候选关键词的语义相似度,筛选得到表达元素与候选关键词之间的映射关系,例如:表达元素“山河”对应候选关键词“山川”、“江山”;表达元素“美人”对应候选关键词“佳人”、“窈窕”、“红颜”、“蛾眉”、“玉女”。
步骤S2022中,针对每个表达元素,如果该表达元素的语义与候选诗词中包含的候选关键词的语义相似度越高,说明该表达元素与候选诗词中包含的候选关键词的语义越相近,候选诗词中包含的候选关键词能表示该表达元素的准确性越高。
这里,针对每个表达元素,将候选诗词中包含的候选关键词与该表达元素的语义相似度大于第一预设值的候选关键词确定为表征该表达元素语义的目标关键词,也就是将候选诗词中包含的候选关键词与该表达元素的语义相似度高的候选关键词确定为表征该表达元素语义的目标关键词,其中第一预设值也是人为设定的。
步骤S2023中,目标关键词可以表征表达元素的语义,那么目标关键词所在的候选诗词即可形成包含该表达元素的语义的诗词集。
通过上述S2021-S2023的步骤,可以确定出包含每个表达元素的语义的诗词集,而且确定出的诗词集中包含的目标关键词能更准确地表达每个表达元素的含义。
基于相同的技术构思,本申请实施例还提供一种诗词生成装置、电子设备、以及计算机可读存储介质等,具体可参见以下实施例。
图4是示出本申请的一些实施例的诗词生成装置的框图,该诗词生成装置实现的功能对应上述在终端设备上执行诗词生成方法的步骤。该装置可以理解为一个包括处理器的服务器的组件,该组件能够实现上述诗词生成方法,如图4所示,该诗词生成装置可以包括:
第一获取模块401,用于获取用于生成目标诗词的图像中的表达元素;
第一选择模块402,用于针对每个待确定内容的语素,从参考诗词集的文字中选择该语素所使用的文字;该语素所使用的文字是根据所述表达元素、根据已确定的其他语素的内容以及所述参考诗词集中的文字与所述表达元素的关联度选择的;
组合模块403,用于将每个语素所使用的文字进行组合,以生成目标诗词。
在一种可行的实施方式中,第一选择模块402,包括:
第一确定模块,用于针对每个待确定内容的语素,根据所述表达元素、已确定的其他语素的内容以及参考诗词集中的文字与所述表达元素的关联度,确定所述参考诗词集中每个文字的使用概率;
第二选择模块,用于针对每个待确定内容的语素,根据所述参考诗词集中每个文字的使用概率,选择该语素所使用的文字。
在一种可行的实施方式中,还包括:
第二获取模块,获取用于生成目标诗词的图像;
输入模块,用于将获取的用于生成目标诗词的图像输入至预先训练好的深度学习模型中,输出得到目标诗词。
在一种可行的实施方式中,还包括:
第三获取模块,用于获取样本图像以及所述样本图像中的表达元素;
第二确定模块,用于针对每个表达元素,根据该表达元素的语义和候选诗词中包含的文字的语义,确定包含该表达元素的语义的诗词集;
生成模块,用于针对每个表达元素,生成训练样本;所述训练样本中均包含样本图像和包含该样本图像中表达元素语义的诗词集;
输入子模块,用于将所述训练样本输入至未训练完成的深度学习模型中,以对所述深度学习模型进行训练。
在一种可行的实施方式中,第二确定模块包括:
计算模块,用于针对每个表达元素,计算候选诗词中包含的候选关键词与该表达元素的语义相似度;
第三确定模块,用于针对每个表达元素,将候选诗词中包含的候选关键词与该表达元素的语义相似度大于第一预设值的候选关键词确定为表征该表达元素语义的目标关键词;
形成模块,用于针对每个表达元素,根据表征该表达元素语义的目标关键词所在的候选诗词形成包含该表达元素的语义的诗词集。
在一种可行的实施方式中,计算模块包括:
第四确定模块,用于确定候选诗词中包含的每个关键词的出现频率;
第五确定模块,用于将出现频率大于第二预设值的关键词确定为候选关键词。
在一种可行的实施方式中,所述生成的目标诗词为以下体裁中的任意一种:古体诗、近体诗、词和曲。
本申请实施例公开了一种电子设备,如图5所示,包括:处理器501、存储器502和总线503,所述存储器502存储有所述处理器501可执行的机器可读指令,当电子设备运行时,所述处理器501与所述存储器502之间通过总线503通信。
所述机器可读指令被所述处理器501执行时执行前面方法实施例中所述的任一方法,具体实现可参见方法实施例,在此不再赘述。
本申请实施例所提供的进行诗词生成方法的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (9)
1.一种诗词生成方法,其特征在于,包括:
获取用于生成目标诗词的图像中的表达元素;
针对每个待确定内容的语素,从参考诗词集的文字中选择该语素所使用的文字;该语素所使用的文字是根据所述表达元素、已确定的其他语素的内容以及所述参考诗词集中的文字与所述表达元素的关联度选择的;
将每个语素所使用的文字进行组合,以生成目标诗词;
在获取用于生成目标诗词的图像中的表达元素之前,还包括:
获取用于生成目标诗词的图像;
所述方法包括:将获取的用于生成目标诗词的图像输入至预先训练好的深度学习模型中,输出得到目标诗词;
所述深度学习模型是通过以下步骤进行训练的:
获取样本图像以及所述样本图像中的表达元素;
针对每个表达元素,根据该表达元素的语义和候选诗词中包含的文字的语义,确定包含该表达元素的语义的诗词集;
针对每个表达元素,生成训练样本;所述训练样本中均包含样本图像和包含该样本图像中表达元素语义的诗词集;
将所述训练样本输入至未训练完成的深度学习模型中,以对所述深度学习模型进行训练。
2.根据权利要求1所述的诗词生成方法,其特征在于,步骤针对每个待确定内容的语素,从参考诗词集的文字中选择该语素所使用的文字,包括:
针对每个待确定内容的语素,根据所述表达元素、已确定的其他语素的内容以及参考诗词集中的文字与所述表达元素的关联度,确定所述参考诗词集中每个文字的使用概率;
针对每个待确定内容的语素,根据所述参考诗词集中每个文字的使用概率,选择该语素所使用的文字。
3.根据权利要求1所述的诗词生成方法,其特征在于,步骤针对每个表达元素,根据该表达元素的语义和候选诗词中包含的文字的语义,确定包含该表达元素的语义的诗词集,包括:
针对每个表达元素,计算候选诗词中包含的候选关键词与该表达元素的语义相似度;
针对每个表达元素,将候选诗词中包含的候选关键词与该表达元素的语义相似度大于第一预设值的候选关键词确定为表征该表达元素语义的目标关键词;
针对每个表达元素,根据表征该表达元素语义的目标关键词所在的候选诗词形成包含该表达元素的语义的诗词集。
4.根据权利要求3所述的诗词生成方法,其特征在于,在步骤针对每个表达元素,计算候选诗词中包含的候选关键词与该表达元素的语义相似度之前,包括:
确定候选诗词中包含的每个关键词的出现频率;
将出现频率大于第二预设值的关键词确定为候选关键词。
5.根据权利要求1所述的诗词生成方法,其特征在于,所述生成的目标诗词为以下体裁中的任意一种:古体诗、近体诗、词和曲。
6.一种诗词生成装置,其特征在于,包括:
第一获取模块,用于获取用于生成目标诗词的图像中的表达元素获取用于生成目标诗词的游戏界面图像;
第一选择模块,用于针对每个待确定内容的语素,从参考诗词集的文字中选择该语素所使用的文字;该语素所使用的文字是根据所述表达元素、已确定的其他语素的内容以及所述参考诗词集中的文字与所述表达元素的关联度选择的;
组合模块,用于将每个语素所使用的文字进行组合,以生成目标诗词;
第二获取模块,用于在获取用于生成目标诗词的图像中的表达元素之前,获取用于生成目标诗词的图像;
输入模块,用于将获取的用于生成目标诗词的图像输入至预先训练好的深度学习模型中,输出得到目标诗词;
第三获取模块,用于获取样本图像以及所述样本图像中的表达元素;
第二确定模块,用于针对每个表达元素,根据该表达元素的语义和候选诗词中包含的文字的语义,确定包含该表达元素的语义的诗词集;
生成模块,用于针对每个表达元素,生成训练样本;所述训练样本中均包含样本图像和包含该样本图像中表达元素语义的诗词集;
输入子模块,用于将所述训练样本输入至未训练完成的深度学习模型中,以对所述深度学习模型进行训练。
7.根据权利要求6所述的诗词生成装置,其特征在于,所述第一选择模块,包括:
第一确定模块,用于针对每个待确定内容的语素,根据所述表达元素、已确定的其他语素的内容以及参考诗词集中的文字与所述表达元素的关联度,确定所述参考诗词集中每个文字的使用概率;
第二选择模块,用于针对每个待确定内容的语素,根据所述参考诗词集中每个文字的使用概率,选择该语素所使用的文字。
8.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至5任一所述的一种诗词生成方法的步骤。
9.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至5任一所述的一种诗词生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010712561.XA CN111814488B (zh) | 2020-07-22 | 2020-07-22 | 一种诗词生成方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010712561.XA CN111814488B (zh) | 2020-07-22 | 2020-07-22 | 一种诗词生成方法、装置、电子设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111814488A CN111814488A (zh) | 2020-10-23 |
CN111814488B true CN111814488B (zh) | 2024-06-07 |
Family
ID=72862083
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010712561.XA Active CN111814488B (zh) | 2020-07-22 | 2020-07-22 | 一种诗词生成方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111814488B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113794915B (zh) * | 2021-09-13 | 2023-05-05 | 海信电子科技(武汉)有限公司 | 服务器、显示设备、诗词歌赋生成方法及媒资播放方法 |
CN118505857B (zh) * | 2024-07-16 | 2024-09-20 | 江西日辰教育科技有限公司 | 辅助记忆图像的生成方法及系统、设备及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103226547A (zh) * | 2013-04-28 | 2013-07-31 | 百度在线网络技术(北京)有限公司 | 为图片产生诗句的方法和装置 |
CN104951554A (zh) * | 2015-06-29 | 2015-09-30 | 浙江大学 | 为风景照配上符合其意境的诗句的方法 |
CN106227714A (zh) * | 2016-07-14 | 2016-12-14 | 北京百度网讯科技有限公司 | 一种基于人工智能的获取生成诗词的关键词的方法和装置 |
CN107480132A (zh) * | 2017-07-25 | 2017-12-15 | 浙江工业大学 | 一种基于图像内容的古诗词生成方法 |
CN109086270A (zh) * | 2018-07-24 | 2018-12-25 | 重庆大学 | 基于古诗词语料向量化的自动作诗系统及其方法 |
CN109784165A (zh) * | 2018-12-12 | 2019-05-21 | 平安科技(深圳)有限公司 | 诗词内容的生成方法、装置、终端及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9213687B2 (en) * | 2009-03-23 | 2015-12-15 | Lawrence Au | Compassion, variety and cohesion for methods of text analytics, writing, search, user interfaces |
-
2020
- 2020-07-22 CN CN202010712561.XA patent/CN111814488B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103226547A (zh) * | 2013-04-28 | 2013-07-31 | 百度在线网络技术(北京)有限公司 | 为图片产生诗句的方法和装置 |
CN104951554A (zh) * | 2015-06-29 | 2015-09-30 | 浙江大学 | 为风景照配上符合其意境的诗句的方法 |
CN106227714A (zh) * | 2016-07-14 | 2016-12-14 | 北京百度网讯科技有限公司 | 一种基于人工智能的获取生成诗词的关键词的方法和装置 |
CN107480132A (zh) * | 2017-07-25 | 2017-12-15 | 浙江工业大学 | 一种基于图像内容的古诗词生成方法 |
CN109086270A (zh) * | 2018-07-24 | 2018-12-25 | 重庆大学 | 基于古诗词语料向量化的自动作诗系统及其方法 |
CN109784165A (zh) * | 2018-12-12 | 2019-05-21 | 平安科技(深圳)有限公司 | 诗词内容的生成方法、装置、终端及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111814488A (zh) | 2020-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110020437B (zh) | 一种视频和弹幕相结合的情感分析及可视化方法 | |
CN110750959B (zh) | 文本信息处理的方法、模型训练的方法以及相关装置 | |
CN110717017B (zh) | 一种处理语料的方法 | |
CN108986186B (zh) | 文字转化视频的方法和系统 | |
CN112270196B (zh) | 实体关系的识别方法、装置及电子设备 | |
CN112533051B (zh) | 弹幕信息显示方法、装置、计算机设备和存储介质 | |
WO2019100319A1 (en) | Providing a response in a session | |
CN109271542A (zh) | 封面确定方法、装置、设备及可读存储介质 | |
Henning et al. | Estimating the information gap between textual and visual representations | |
CN113094552A (zh) | 视频模板的搜索方法、装置、服务器及可读存储介质 | |
Liu et al. | Sentiment recognition for short annotated GIFs using visual-textual fusion | |
CN104823183A (zh) | 基于特征的候选选择 | |
CN112733654B (zh) | 一种视频拆条的方法和装置 | |
CN111814488B (zh) | 一种诗词生成方法、装置、电子设备及可读存储介质 | |
Gygli et al. | Analyzing and predicting GIF interestingness | |
CN110895656A (zh) | 一种文本相似度计算方法、装置、电子设备及存储介质 | |
Lv et al. | Understanding the users and videos by mining a novel danmu dataset | |
CN112163560A (zh) | 一种视频信息处理方法、装置、电子设备及存储介质 | |
JP6486165B2 (ja) | 候補キーワード評価装置及び候補キーワード評価プログラム | |
Sharif et al. | Vision to language: Methods, metrics and datasets | |
CN117093739A (zh) | 图像生成以及图文对齐方法、装置、终端设备及存储介质 | |
CN113407775B (zh) | 视频搜索方法、装置及电子设备 | |
CN108733672B (zh) | 实现网络信息质量评估的方法和系统 | |
CN109062905A (zh) | 一种弹幕文本价值评价方法、装置、设备及介质 | |
CN113573128A (zh) | 一种音频处理方法、装置、终端以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |