CN111797611B - 对联生成模型、对联生成方法、装置、计算机设备及介质 - Google Patents

对联生成模型、对联生成方法、装置、计算机设备及介质 Download PDF

Info

Publication number
CN111797611B
CN111797611B CN202010724577.2A CN202010724577A CN111797611B CN 111797611 B CN111797611 B CN 111797611B CN 202010724577 A CN202010724577 A CN 202010724577A CN 111797611 B CN111797611 B CN 111797611B
Authority
CN
China
Prior art keywords
couplet
antithetical
target
antithetical couplet
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010724577.2A
Other languages
English (en)
Other versions
CN111797611A (zh
Inventor
黄海龙
高维国
刘广
陆凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202010724577.2A priority Critical patent/CN111797611B/zh
Publication of CN111797611A publication Critical patent/CN111797611A/zh
Application granted granted Critical
Publication of CN111797611B publication Critical patent/CN111797611B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明属于人工智能领域,尤其涉及一种对联生成模型、对联生成方法、装置、计算机设备及介质。所述方法包括:获取包含对联数据以及与对联数据关联的编码信息的训练数据;基于预设韵律结构对训练数据进行分词,生成多个具有词结构的关键词;生成与各关键词一一对应的系统关键词,并基于关键词组合特征对关键词和系统关键词进行组合,生成多组关键词组合;将每一组关键词组合转换成一组组合序列样本,将所有的组合序列样本输入至seq2seq模型后,依据编码信息对seq2seq模型进行训练,得到基于seq2seq模型的对联生成模型。本发明还涉及区块链技术,所述关键词组合存储于区块链中。本发明能提高对仗性对联的对仗性以及提高用户的满意度。

Description

对联生成模型、对联生成方法、装置、计算机设备及介质
技术领域
本发明涉及人工智能的智能决策领域,尤其涉及一种对联生成模型、对联生成方法、装置、计算机设备及介质。
背景技术
对联是中国传统文化之一,对联具有对仗工整、平仄协调的特点,是一字一音的中华语言独特的艺术形式,是中国传统文化的瑰宝。在传统节日、庆典开业等场景对联也是人们表达祝福的常用手段,可见,对联应用很广。但是创作一副对仗工整并表达合适文本情感的对联对于没有文学功底的普通人来说并不是一件简单的事。
目前传统的对联数据处理方法都是要求用户在机器中输入上联,然后让机器生成出与上联对仗工整的下联,这种对联数据处理方法源于古时“猜灯谜,对对子”的传统,该对联数据处理方法虽然降低了用户创作整幅对联的难度,但是对于没有文学功底的普通人来说,创作对联的上联依然是件具有难度的事情。同时对联需讲究对仗性和文本情感,但各个用户文学水平并不一致,如果用户输入的上联中的词句未使用合适的对仗词,机器所生成的下联则将不符合语法规则,也即,所生成的下联也将不能体现出对仗性和文本情感,因此目前传统的对联数据处理方法很难创作出令用户满意的对联。因此本领域技术人员亟需寻找一种新的技术方案来解决上述提到的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种对联生成模型、对联生成方法、装置、计算机设备及介质,用于提高对仗性对联的整体对仗性、体现出对联具有的文本情感以及提高用户的满意度。
一种对联生成模型生成方法,包括:
获取包含对联数据以及与所述对联数据关联的编码信息的训练数据;所述编码信息根据所述对联数据的预设词数量进行编码之后生成;
基于预设韵律结构对所述训练数据进行分词,生成多个具有词结构的关键词;
生成与各所述关键词一一对应的系统关键词,并基于关键词组合特征对所述关键词和所述系统关键词进行组合,生成位置结构各不相同的且包含文本情感的多组关键词组合;
将每一组所述关键词组合转换成一组组合序列样本,将所有的所述组合序列样本输入至seq2seq模型后,依据所述编码信息对所述seq2seq模型进行训练,得到基于所述seq2seq模型的对联生成模型;所述对联生成模型用于在用户输入对联关键词之后,生成包含所述对联关键词且与所述对联关键词的词语情感吻合的对仗性对联。
一种对联生成方法,包括:
获取用户输入至对联生成模型中的对联关键词和对联字数需求,获取所述对联生成模型根据所述对联关键词生成的与所述对联字数需求对应的目标上联;
在确认所述目标上联无误之后,将验证完成的所述目标上联输入至所述对联生成模型,获取所述对联生成模型根据所述目标上联生成的与所述对联字数需求对应的目标下联;
在确认所述目标下联无误之后,获取所述对联生成模型将所述目标上联和所述目标下联组合后输出的对仗性对联,并将所述对仗性对联以预设展示方式展示在当前显示界面;所述对联关键词位于所述对仗性对联的任意位置。
一种对联生成模型生成装置,包括:
第一获取模块,用于获取包含对联数据以及与所述对联数据关联的编码信息的训练数据;所述编码信息根据所述对联数据的预设词数量进行编码之后生成;
第一生成模块,用于基于预设韵律结构对所述训练数据进行分词,生成多个具有词结构的关键词;
第二生成模块,用于生成与各所述关键词一一对应的系统关键词,并基于关键词组合特征对所述关键词和所述系统关键词进行组合,生成位置结构各不相同的且包含文本情感的多组关键词组合;
训练模块,用于将每一组所述关键词组合转换成一组组合序列样本,将所有的所述组合序列样本输入至seq2seq模型后,依据所述编码信息对所述seq2seq模型进行训练,得到基于所述seq2seq模型的对联生成模型;所述对联生成模型用于在用户输入对联关键词之后,生成包含所述对联关键词且与所述对联关键词的词语情感吻合的对仗性对联。
一种对联生成装置,其特征在于,包括:
第二获取模块,用于获取用户输入至对联生成模型中的对联关键词和对联字数需求,获取所述对联生成模型根据所述对联关键词生成的与所述对联字数需求对应的目标上联;对联生成模型
第三获取模块,用于在确认所述目标上联无误之后,将验证完成的所述目标上联输入至所述对联生成模型,获取所述对联生成模型根据所述目标上联生成的与所述对联字数需求对应的目标下联;
展示模块,用于在确认所述目标下联无误之后,获取所述对联生成模型将所述目标上联和所述目标下联组合后输出的对仗性对联,并将所述对仗性对联以预设展示方式展示在当前显示界面;所述对联关键词位于所述对仗性对联的任意位置。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述对联生成模型生成方法,或所述对联生成方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述对联生成模型生成方法,或所述对联生成方法。
上述对联生成模型、对联生成方法、装置、计算机设备及介质,用户只需输入对联关键词至已训练成功且基于seq2seq模型的对联生成模型就可生成与对联关键词的词语情感吻合的对仗性对联,改变之前用户需输入整条上联的方式,如此,一方面可提高对仗性对联的整体对仗性,通过词语情感体现出整体对联的文本情感,另一方面也可提高用户的满意度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中对联生成模型生成方法的一应用环境示意图;
图2是本发明一实施例中对联生成模型生成方法的一流程图;
图3是本发明一实施例中对联生成模型生成装置的结构示意图;
图4是本发明一实施例中对联生成方法的一流程图;
图5是本发明一实施例中对联生成装置的结构示意图;
图6是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的对联生成模型生成方法,可应用在如图1的应用环境中,其中,客户端通过网络与服务器进行通信。其中,客户端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种对联生成模型生成方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
S10,获取包含对联数据以及与所述对联数据关联的编码信息的训练数据;所述编码信息根据所述对联数据的预设词数量进行编码之后生成;
可理解地,对联数据可包括四字、五字、六字、七字、八字、九字和十一字(预设词数量)的上下对联;编码信息是关于对联数据的预设词数量的向量信息,具体通过编码器将对联数据所对应的序列压缩成预设长度的向量。本实施例对对联数据的预设词数量进行编码是为了限制后续模型中输出的上联和下联的词数量,进而确定输出的上联和输出的下联之间的字数对应关系(上下对联的词数量为一致)。
S20,基于预设韵律结构对所述训练数据进行分词,生成多个具有词结构的关键词;
可理解地,预设韵律结构是指诗词中的平仄结构和押韵结构,其中,平仄结构是指究平声和仄声协调的文字搭配结构,押韵结构是指同韵的文字搭配结构,因此通过该预设韵律结构可对训练数据进行分词,如七字上联:丹枫/江冷/人初去/,七字下联:绿柳/堤新/燕复来/,其中,以划线作为分隔符,可得到各个关键词,每个关键词都具备词结构的属性,比如丹枫和绿柳为一种名词的词结构,江冷和堤新为一种名词+形容词的词结构,人初去和燕复来为一种名词+动词的词结构。本实施例基于预设韵律结构对训练数据进行分词,可大大提高分词的速率和准确率,有利于后续过程能准确地将关键词和系统关键词组合至一起,保证模型输出对联的可读性和顺畅性。
S30,生成与各所述关键词一一对应的系统关键词,并基于关键词组合特征对所述关键词和所述系统关键词进行组合,生成位置结构各不相同的且包含文本情感的多组关键词组合;
可理解地,系统关键词可从预设词典中获取,可根据关键词的词结构所需对应的目标词结构(构造成完整对联所需的各个词结构,如关键词为丹枫时,江冷、人初去、绿柳、堤新和燕复来都可为系统关键词)从预设词典调取出与目标词结构对应的系统关键词以生成上述与各关键词一一对应的系统关键词;关键词组合特征可包含情感组合特征(组合的关键词与系统关键词之间应包含同样情感)、位置组合特征(组合的关键词与系统关键词之间可在一个对联上的多个位置上,如句首、句中和句末等)和对仗性组合特征(由关键词与系统关键词组合的上下对联之间的对仗性)。本实施例以关键词和系统关键词组成多组关键词组合,其中,该关键词组合的数量是以指数型增长,进而可增强模型的训练过程,提高模型学习人类写作对联模式的能力。
S40,将每一组所述关键词组合转换成一组组合序列样本,将所有的所述组合序列样本输入至seq2seq模型后,依据所述编码信息对所述seq2seq模型进行训练,得到基于所述seq2seq模型的对联生成模型;所述对联生成模型用于在用户输入对联关键词之后,生成包含所述对联关键词且与所述对联关键词的词语情感吻合的对仗性对联。
可理解地,seq2seq模型可以是一种输入序列和输出出序不等长的结构,也属于encoder-decoder结构的一种,本实施例最后训练成功的对联生成模型输入为用户的关键词,但输出的却是与关键词对应的目标上联,其中,关键词与目标上联并不等长,而将目标上联输入对联生成模型后,才能生成与目标上联对应长度的目标下联;在具体的训练过程中,输入的组合序列样本会被编码成统一的语义特征向量C,其中语义特征向量C包含了组合序列样本中所有的信息,在encoder-decoder中配合Attention机制在每个时间上可输入不同的语义特征向量C,每一个语义特征向量C在Attention机制中会自动去选取与输出y最适合的上下文信息,具体可通过aij(权重向量)衡量encoder中第j阶段的hj(是隐含状态,它与上一时刻的隐含状态及当前输入语义特征向量C有关)和解码时第i阶段的相关性,最终decoder中第i阶段的输入的上下文信息ci就来自于所有hj对aij的加权和,可通过加权和的值确定出每一个语义特征向量C所对应的输出y,其中,每一个输出y都使用了Softmax进行概率转化处理,而得到关于每一个输出y的相对概率,其中,每一个输出y的相对概率构成了概率分布,当概率分布中的相对概率之和达到最大后不再变化,确定该对联生成模型训练完成。
本实施例训练出的基于seq2seq模型的对联生成模型只需输入对联关键词就可生成与对联关键词的词语情感吻合的对仗性对联,改变之前用户需输入整条上联的方式,如此,一方面可提高对仗性对联的整体对仗性,通过词语情感体现出整体对联的文本情感,另一方面也可提高用户的满意度。
进一步地,所述关键词组合存储于区块链中,所述基于关键词组合特征对所述关键词和所述系统关键词进行组合,生成位置结构各不相同的且包含文本情感的多组关键词组合,包括:
调用预设的文本情感识别模型识别并获取所述关键词中包含的第一文本情感;
获取所述系统关键词中包含的第二文本情感;
基于情感组合特征和位置组合特征将包含第一文本情感的所述关键词以及包含第二文本情感的所述系统关键词进行组合,生成位置结构各不相同的且包含文本情感的多组所述关键词组合。
可理解地,本实施例中基于预先训练成功的文本情感识别模型提前识别出关键词中的第一文本情感,以通过第一文本情感去匹配出第二文本情感,进而可根据第二文本情感确定出与关键词对应的系统关键词,比如丹枫对应的第一文本情感为冷清,江冷对应的第二文本情感也应该为冷清;上述过程还需基于位置组合特征来组合关键词以及系统关键词以形成关键词组合,具体可通过预设关键词与系统关键词之间所对应的词结构来决定,比如关键词为丹枫(名词的词结构),系统关键词为江冷(名词的词结构),在此是名词的词结构对应名词的词结构,因此丹枫+江冷可为一组关键词组合,江冷+丹枫也可为一组关键词组合。
另外需要强调的是,为进一步保证上述关键词组合的私密和安全性,上述关键词组合还可以存储于一区块链的节点中。其中,本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。区块链提供的去中心化的完全分布式DNS服务通过网络中各个节点之间的点对点数据传输服务就能实现域名的查询和解析,可用于确保某个重要的基础设施的操作系统和固件没有被篡改,可以监控软件的状态和完整性,发现不良的篡改,并确保所传输的数据没用经过篡改,将关键词组合存储在区块链中,能够确保关键词组合的私密和安全性。
进一步地,所述依据所述编码信息对所述seq2seq模型进行训练,包括:
通过所述seq2seq模型中的decoder对所述编码信息进行解码,得到解码信息,依据所述解码信息对所述seq2seq模型进行训练。
可理解地,本实施例主要是将编码信息转换成解码信息,以便于seq2seq模型识别到该解码信息而去确定seq2seq模型输出的上下对联的字数对应关系。
终上所述,本发明训练出的基于seq2seq模型的对联生成模型只需输入对联关键词就可生成与对联关键词的词语情感吻合的对仗性对联,改变之前用户需输入整条上联的方式,如此,一方面可提高对仗性对联的整体对仗性,通过词语情感体现出整体对联的文本情感,另一方面也可提高用户的满意度。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种对联生成模型生成装置,该对联生成模型生成装置与上述实施例中对联生成模型生成方法一一对应。如图3所示,该对联生成模型生成装置包括第一获取模块11、第一生成模块12、第二生成模块13和训练模块14。各功能模块详细说明如下:
第一获取模块11,用于获取包含对联数据以及与所述对联数据关联的编码信息的训练数据;所述编码信息根据所述对联数据的预设词数量进行编码之后生成;
第一生成模块12,用于基于预设韵律结构对所述训练数据进行分词,生成多个具有词结构的关键词;
第二生成模块13,用于生成与各所述关键词一一对应的系统关键词,并基于关键词组合特征对所述关键词和所述系统关键词进行组合,生成位置结构各不相同的且包含文本情感的多组关键词组合;
训练模块14,用于将每一组所述关键词组合转换成一组组合序列样本,将所有的所述组合序列样本输入至seq2seq模型后,依据所述编码信息对所述seq2seq模型进行训练,得到基于所述seq2seq模型的对联生成模型;所述对联生成模型用于在用户输入对联关键词之后,生成包含所述对联关键词且与所述对联关键词的词语情感吻合的对仗性对联。
进一步地,所述第二生成模块包括:
第一获取子模块,用于调用预设的文本情感识别模型识别并获取所述关键词中包含的第一文本情感;
第二获取子模块,用于获取所述系统关键词中包含的第二文本情感;
生成子模块,用于基于情感组合特征和位置组合特征将包含第一文本情感的所述关键词以及包含第二文本情感的所述系统关键词进行组合,生成位置结构各不相同的且包含文本情感的多组所述关键词组合。
进一步地,所述训练模块包括:
训练子模块,用于通过所述seq2seq模型中的decoder对所述编码信息进行解码,得到解码信息,依据所述解码信息对所述seq2seq模型进行训练。
关于对联生成模型生成装置的具体限定可以参见上文中对于对联生成模型生成方法的限定,在此不再赘述。上述对联生成模型生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本发明还提供一种对联生成方法,可应用在如图1的应用环境中,其中,客户端通过网络与服务器进行通信。其中,客户端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图4所示,提供一种对联生成方法,以该方法应用在图1中的服务端为例进行说明,包括如下步骤:
S50,获取用户输入至对联生成模型中的对联关键词和对联字数需求,获取所述对联生成模型根据所述对联关键词生成的与所述对联字数需求对应的目标上联;
S60,在确认所述目标上联无误之后,将验证完成的所述目标上联输入至所述对联生成模型,获取所述对联生成模型根据所述目标上联生成的与所述对联字数需求对应的目标下联;
S70,在确认所述目标下联无误之后,获取所述对联生成模型将所述目标上联和所述目标下联组合后输出的对仗性对联,并将所述对仗性对联以预设展示方式展示在当前显示界面;所述对联关键词位于所述对仗性对联的任意位置。
可理解地,本实施例为对联生成模型的使用过程,本实施例可不限制用户输入对联关键词的数量,本实施输出的每一个目标上联和目标下联都分别存在一个选取概率。确认目标上联和目标下联是否有误和无误可通过以下方式实现:通过本实施例中的字符长度检测方法可实现对目标上联和目标下联的字数进行验证,具体包括获取用户输入至对联生成模型中的对联关键词所对应的对联字数需求,因此可通过字符长度检测方法确定出目标上联和目标下联所在的字符长度,以得到目标上联和目标下联的字数,最后可将目标上联和目标下联的字数与对联字数需求进行比较,其中,在目标上联和/或目标下联的字数与对联字数需求一致时,确认目标上联和/或目标下联无误,同理反之亦然;同时通过本实施例中的符号识别模型可实现对目标上联和目标下联是否存在空格符进行验证,同上述方法可确认目标上联和目标下联是否有误和无误;同时通过本实施例中的文字识别模可实现对目标上联和目标下联是否存在重复的文字进行验证,同上述方法可确认目标上联和目标下联是否有误和无误。通过本实施例可通过用户输入的对联关键词而生成完整的对仗性对联。
进一步地,所述获取所述对联生成模型根据所述对联关键词生成的与所述对联字数需求对应的目标上联,还包括:
获取所述对联生成模型根据所述对联关键词生成的所述目标上联以及所述目标上联的第一选取概率,并获取所述第一选取概率大于或等于第一预设选取概率的所述目标上联。
可理解地,本实施例中的第一预设选取概率可根据需求而自行设置;且本实施例对联生成模型输出的是关于目标的上联以及目标上联的第一选取概率,因此可对第一选取概率和第一预设选取概率进行比较。
进一步地,所述获取所述对联生成模型根据所述目标上联生成的与所述对联字数需求对应的目标下联,还包括:
获取所述对联生成模型根据所述目标上联生成的所述目标下联以及所述目标下联的第二选取概率,并获取所述第二选取概率大于或等于第二预设选取概率的所述目标下联。
可理解地,本实施例中的第二预设选取概率可根据需求而自行设置;且本实施例对联生成模型输出的是关于目标的下联以及目标下联的第二选取概率,因此可对第二选取概率和第二预设选取概率进行比较。
进一步地,所述获取所述对联生成模型将所述目标上联和所述目标下联组合后输出的对仗性对联之前,还包括:
通过预设的文字识别模型确定所述目标上联和/或所述目标下联出现文字重复时,标注所述目标上联和/或所述目标下联出现文字重复的位置,并将包含文字重复以及文字重复的位置的信息发送至预设数据接收方以令所述预设数据接收方再次确认所述目标上联和/或所述目标下联是否无误。
可理解地,本实施例可通过集成在所述对联生成模型中的预设的文字识别模型确定所述目标上联和/或所述目标下联出现文字重复是相当于在确认所述目标上联和/或目标下联有误时;本实施例在基于预设的文字识别模型确定出目标上联和/或目标下联出现文字重复时,由预设数据接收方再次确认该目标上联和/或目标下联是否存在无误。
综上所述,上述提供了一种对联生成方法,用户只需输入对联关键词至已训练成功且基于seq2seq模型的对联生成模型就可生成与对联关键词的词语情感吻合的对仗性对联,改变之前用户需输入整条上联的方式,如此,一方面可提高对仗性对联的整体对仗性,通过词语情感体现出整体对联的文本情感,另一方面也可提高用户的满意度。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种对联生成装置,该对联生成装置与上述实施例中对联生成方法一一对应。如图5所示,该对联生成装置包括第二获取模块15、第三获取模块16和展示模块17。各功能模块详细说明如下:
第二获取模块15,用于获取用户输入至对联生成模型中的对联关键词和对联字数需求,获取所述对联生成模型根据所述对联关键词生成的与所述对联字数需求对应的目标上联;
第三获取模块16,用于在确认所述目标上联无误之后,将验证完成的所述目标上联输入至所述对联生成模型,获取所述对联生成模型根据所述目标上联生成的与所述对联字数需求对应的目标下联;
展示模块17,用于在确认所述目标下联无误之后,获取所述对联生成模型将所述目标上联和所述目标下联组合后输出的对仗性对联,并将所述对仗性对联以预设展示方式展示在当前显示界面;所述对联关键词位于所述对仗性对联的任意位置。
进一步地,所述对联生成装置还包括:
第四获取模块,用于获取所述对联生成模型根据所述对联关键词生成的所述目标上联以及所述目标上联的第一选取概率,并获取所述第一选取概率大于或等于第一预设选取概率的所述目标上联。
进一步地,所述对联生成装置还包括:
第五获取模块,用于获取所述对联生成模型根据所述目标上联生成的所述目标下联以及所述目标下联的第二选取概率,并获取所述第二选取概率大于或等于第二预设选取概率的所述目标下联。
进一步地,所述对联生成装置还包括:
发送模块,用于通过预设的文字识别模型确定所述目标上联和/或所述目标下联出现文字重复时,标注所述目标上联和/或所述目标下联出现文字重复的位置,并将包含文字重复以及文字重复的位置的信息发送至预设数据接收方以令所述预设数据接收方再次确认所述目标上联和/或所述目标下联是否无误。
关于对联生成装置的具体限定可以参见上文中对于对联生成方法的限定,在此不再赘述。上述对联生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储对联生成模型生成方法和对联生成方法中涉及到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种对联生成模型生成方法,或者该计算机程序被处理器执行时以实现一种对联生成方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中对联生成模型生成方法的步骤,或者处理器执行计算机程序时实现上述实施例中对联生成方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中对联生成模型生成方法的步骤,或者计算机程序被处理器执行时实现上述实施例中对联生成方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (8)

1.一种对联生成模型生成方法,其特征在于,包括:
获取包含对联数据以及与所述对联数据关联的编码信息的训练数据;所述编码信息根据所述对联数据的预设词数量进行编码之后生成;
基于预设韵律结构对所述训练数据进行分词,生成多个具有词结构的关键词;
生成与各所述关键词一一对应的系统关键词,并基于关键词组合特征对所述关键词和所述系统关键词进行组合,生成位置结构各不相同的且包含文本情感的多组关键词组合;
所述基于关键词组合特征对所述关键词和所述系统关键词进行组合,生成位置结构各不相同的且包含文本情感的多组关键词组合,包括:
调用预设的文本情感识别模型识别并获取所述关键词中包含的第一文本情感;
获取所述系统关键词中包含的第二文本情感;
基于情感组合特征和位置组合特征将包含第一文本情感的所述关键词以及包含第二文本情感的所述系统关键词进行组合,生成位置结构各不相同的且包含文本情感的多组所述关键词组合;
将每一组所述关键词组合转换成一组组合序列样本,将所有的所述组合序列样本输入至seq2seq模型后,依据所述编码信息对所述seq2seq模型进行训练,得到基于所述seq2seq模型的对联生成模型;所述对联生成模型用于在用户输入对联关键词之后,生成包含所述对联关键词且与所述对联关键词的词语情感吻合的对仗性对联;
所述依据所述编码信息对所述seq2seq模型进行训练,包括:
通过所述seq2seq模型中的decoder对所述编码信息进行解码,得到解码信息,依据所述解码信息对所述seq2seq模型进行训练。
2.一种对联生成方法,其特征在于,包括:
获取用户输入至对联生成模型中的对联关键词和对联字数需求,获取所述对联生成模型根据所述对联关键词生成的与所述对联字数需求对应的目标上联;
在确认所述目标上联无误之后,将验证完成的所述目标上联输入至所述对联生成模型,获取所述对联生成模型根据所述目标上联生成的与所述对联字数需求对应的目标下联;
在确认所述目标下联无误之后,获取所述对联生成模型将所述目标上联和所述目标下联组合后输出的对仗性对联,并将所述对仗性对联以预设展示方式展示在当前显示界面;所述对联关键词位于所述对仗性对联的任意位置;其中,所述对联生成模型采用权利要求1所述的对联生成模型生成方法得到的。
3.根据权利要求2所述的对联生成方法,其特征在于,所述获取所述对联生成模型根据所述对联关键词生成的目标上联,还包括:
获取所述对联生成模型根据所述对联关键词生成的所述目标上联以及所述目标上联的第一选取概率,并获取所述第一选取概率大于或等于第一预设选取概率的所述目标上联。
4.根据权利要求2所述的对联生成方法,其特征在于,所述获取所述对联生成模型根据所述目标上联生成的与所述对联字数需求对应的目标下联,还包括:
获取所述对联生成模型根据所述目标上联生成的所述目标下联以及所述目标下联的第二选取概率,并获取所述第二选取概率大于或等于第二预设选取概率的所述目标下联。
5.一种对联生成模型生成装置,其特征在于,包括:
第一获取模块,用于获取包含对联数据以及与所述对联数据关联的编码信息的训练数据;所述编码信息根据所述对联数据的预设词数量进行编码之后生成;
第一生成模块,用于基于预设韵律结构对所述训练数据进行分词,生成多个具有词结构的关键词;
第二生成模块,用于生成与各所述关键词一一对应的系统关键词,并基于关键词组合特征对所述关键词和所述系统关键词进行组合,生成位置结构各不相同的且包含文本情感的多组关键词组合;
所述第二生成模块,还用于:
调用预设的文本情感识别模型识别并获取所述关键词中包含的第一文本情感;
获取所述系统关键词中包含的第二文本情感;
基于情感组合特征和位置组合特征将包含第一文本情感的所述关键词以及包含第二文本情感的所述系统关键词进行组合,生成位置结构各不相同的且包含文本情感的多组所述关键词组合;
训练模块,用于将每一组所述关键词组合转换成一组组合序列样本,将所有的所述组合序列样本输入至seq2seq模型后,依据所述编码信息对所述seq2seq模型进行训练,得到基于所述seq2seq模型的对联生成模型;所述对联生成模型用于在用户输入对联关键词之后,生成包含所述对联关键词且与所述对联关键词的词语情感吻合的对仗性对联;
所述训练模块,还用于:
通过所述seq2seq模型中的decoder对所述编码信息进行解码,得到解码信息,依据所述解码信息对所述seq2seq模型进行训练。
6.一种对联生成装置,其特征在于,包括:
第二获取模块,用于获取用户输入至对联生成模型中的对联关键词和对联字数需求,获取所述对联生成模型根据所述对联关键词生成的与所述对联字数需求对应的目标上联;
第三获取模块,用于在确认所述目标上联无误之后,将验证完成的所述目标上联输入至所述对联生成模型,获取所述对联生成模型根据所述目标上联生成的与所述对联字数需求对应的目标下联;
展示模块,用于在确认所述目标下联无误之后,获取所述对联生成模型将所述目标上联和所述目标下联组合后输出的对仗性对联,并将所述对仗性对联以预设展示方式展示在当前显示界面;所述对联关键词位于所述对仗性对联的任意位置;其中,所述对联生成模型采用权利要求1所述的对联生成模型生成方法得到的。
7.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1所述的对联生成模型生成方法,或所述处理器执行所述计算机程序时实现如权利要求2至4中任一项对联生成方法。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1所述的对联生成模型生成方法,或所述处理器执行所述计算机程序时实现如权利要求2至4中任一项对联生成方法。
CN202010724577.2A 2020-07-24 2020-07-24 对联生成模型、对联生成方法、装置、计算机设备及介质 Active CN111797611B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010724577.2A CN111797611B (zh) 2020-07-24 2020-07-24 对联生成模型、对联生成方法、装置、计算机设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010724577.2A CN111797611B (zh) 2020-07-24 2020-07-24 对联生成模型、对联生成方法、装置、计算机设备及介质

Publications (2)

Publication Number Publication Date
CN111797611A CN111797611A (zh) 2020-10-20
CN111797611B true CN111797611B (zh) 2023-07-25

Family

ID=72827784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010724577.2A Active CN111797611B (zh) 2020-07-24 2020-07-24 对联生成模型、对联生成方法、装置、计算机设备及介质

Country Status (1)

Country Link
CN (1) CN111797611B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113051877B (zh) * 2021-03-11 2023-06-16 杨虡 一种文本内容生成方法、装置、电子设备及存储介质
CN112883709B (zh) * 2021-04-18 2023-07-14 沈阳雅译网络技术有限公司 一种利用自然语言处理技术自动生成对联的方法
CN114417893A (zh) * 2021-12-08 2022-04-29 成都理工大学 一种语言对联信息处理系统、方法及构建方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9830315B1 (en) * 2016-07-13 2017-11-28 Xerox Corporation Sequence-based structured prediction for semantic parsing
CN108228571A (zh) * 2018-02-01 2018-06-29 北京百度网讯科技有限公司 对联的生成方法、装置、存储介质及终端设备
CN108874789A (zh) * 2018-06-22 2018-11-23 腾讯科技(深圳)有限公司 语句的生成方法、装置、存储介质和电子装置
CN110837546A (zh) * 2019-09-24 2020-02-25 平安科技(深圳)有限公司 基于人工智能的藏头对联生成方法、装置、设备及介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10990754B2 (en) * 2018-10-31 2021-04-27 Microsoft Technology Licensing, Llc Writing personalized electronic messages using template-based and machine-learning approaches

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9830315B1 (en) * 2016-07-13 2017-11-28 Xerox Corporation Sequence-based structured prediction for semantic parsing
CN108228571A (zh) * 2018-02-01 2018-06-29 北京百度网讯科技有限公司 对联的生成方法、装置、存储介质及终端设备
CN108874789A (zh) * 2018-06-22 2018-11-23 腾讯科技(深圳)有限公司 语句的生成方法、装置、存储介质和电子装置
CN110837546A (zh) * 2019-09-24 2020-02-25 平安科技(深圳)有限公司 基于人工智能的藏头对联生成方法、装置、设备及介质

Also Published As

Publication number Publication date
CN111797611A (zh) 2020-10-20

Similar Documents

Publication Publication Date Title
CN111814466B (zh) 基于机器阅读理解的信息抽取方法、及其相关设备
US11386271B2 (en) Mathematical processing method, apparatus and device for text problem, and storage medium
CN111797611B (zh) 对联生成模型、对联生成方法、装置、计算机设备及介质
CN111581229B (zh) Sql语句的生成方法、装置、计算机设备及存储介质
CN111639163A (zh) 问题生成模型的训练方法、问题生成方法及其相关设备
CN112633003B (zh) 一种地址识别方法、装置、计算机设备及存储介质
CN112307168A (zh) 基于人工智能的问诊会话处理方法、装置和计算机设备
WO2021127817A1 (zh) 一种多语言文本合成语音方法、装置、设备及存储介质
CN111695338A (zh) 基于人工智能的面试内容精炼方法、装置、设备及介质
CN112085091B (zh) 基于人工智能的短文本匹配方法、装置、设备及存储介质
CN111914825B (zh) 文字识别方法、装置及电子设备
CN113887229A (zh) 地址信息的识别方法、装置、计算机设备及存储介质
CN115759119B (zh) 一种金融文本情感分析方法、系统、介质和设备
CN113886550A (zh) 基于注意力机制的问答匹配方法、装置、设备及存储介质
CN113657105A (zh) 基于词汇增强的医学实体抽取方法、装置、设备及介质
CN111444905B (zh) 基于人工智能的图像识别方法和相关装置
CN110516125B (zh) 识别异常字符串的方法、装置、设备及可读存储介质
CN108920560B (zh) 生成方法、训练方法、装置、计算机可读介质及电子设备
CN114372140A (zh) 分层会议摘要生成模型训练方法、生成方法及装置
CN116913278B (zh) 语音处理方法、装置、设备和存储介质
CN116469111B (zh) 一种文字生成模型训练方法及目标文字生成方法
CN112837673A (zh) 基于人工智能的语音合成方法、装置、计算机设备和介质
CN113434652B (zh) 智能问答方法、智能问答装置、设备及存储介质
CN113420869B (zh) 基于全方向注意力的翻译方法及其相关设备
CN113591493B (zh) 翻译模型的训练方法及翻译模型的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant