CN108959271B - 描述文本生成方法、装置、计算机设备和可读存储介质 - Google Patents

描述文本生成方法、装置、计算机设备和可读存储介质 Download PDF

Info

Publication number
CN108959271B
CN108959271B CN201810907686.0A CN201810907686A CN108959271B CN 108959271 B CN108959271 B CN 108959271B CN 201810907686 A CN201810907686 A CN 201810907686A CN 108959271 B CN108959271 B CN 108959271B
Authority
CN
China
Prior art keywords
target
text
words
description text
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810907686.0A
Other languages
English (en)
Other versions
CN108959271A (zh
Inventor
郑洁纯
郭丽娟
麦文军
钟雪艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Pacific Computer Information Consulting Co ltd
Original Assignee
Guangzhou Pacific Computer Information Consulting Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Pacific Computer Information Consulting Co ltd filed Critical Guangzhou Pacific Computer Information Consulting Co ltd
Priority to CN201810907686.0A priority Critical patent/CN108959271B/zh
Publication of CN108959271A publication Critical patent/CN108959271A/zh
Application granted granted Critical
Publication of CN108959271B publication Critical patent/CN108959271B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种描述文本生成方法,所述方法包括:获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词语获取初始描述文本;结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得目标描述文本。本发明方案能够自动生成与真人撰写相似的文本描述,显著提高描述文本生成效率。

Description

描述文本生成方法、装置、计算机设备和可读存储介质
技术领域
本发明涉及计算机技术领域,特别是涉及一种描述文本生成方法、装置、计算机设备和可读存储介质。
背景技术
市场很多行业需要大量的行情文章、促销信息、导购文章、新产品上市等文本描述,例如汽车行业,据统计,汽车经销商1天发布促销行情文章超5000篇,行业经销商、生产厂商、内容编辑者迫切希望能将数据量进一步扩大。
目前文本描述仍然采用人工撰写的方式,存在耗时长、成本高且效率低的问题。
发明内容
本发明的目的在于提供一种描述文本生成方法、装置计算机设备和可读存储介质,能够自动生成与真人撰写相似的文本描述,显著提高描述文本生成效率。
本发明的目的通过如下技术方案实现:
一种描述文本生成方法,所述方法包括:
获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;
结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词语获取初始描述文本;
结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得目标描述文本。
在其中一个实施例中,所述目标关键词信息包括目标关键词以及与所述目标关键词对应的目标文本分值;
所述预设文本数据库中储存有多个属性词、与每一属性词对应的多个文本分值,以及与每一属性词对应的每一文本分值分别对应的多个样本描述文本,且每一样本描述文本的起始词语和结束词语分别设置有起始和结束标记;
所述预设参数数据库包括错误参数信息、每一所述属性词对应的标准参数以及与每一标准参数对应的多个待修正参数。
在其中一个实施例中,所述获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语包括:
查询所述预设文本数据库中与所述目标关键词相同的属性词,获取与所查询到的属性词对应的多个文本分值;
查询所获取到的多个文本分值中与所述目标文本分值相同的文本分值,获取与所述文本分值对应的多个样本描述文本;
提取所获取到的多个样本描述文本中带有起始标记的多个起始词语,随机抽取一个起始词语作为所述起始目标词语。
在其中一个实施例中,所述结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词获取初始描述文本包括:
结合当前已获取的目标词语和所述预设语言学习模型获取与当前已获取的目标词语连接的当前目标词语;
当所述当前目标词语带有所述结束标记时,将已获取到的全部目标词语按照获取顺序依次连接形成所述初始描述文本;
当所述当前目标词语没有所述结束标记时,将所述当前目标词语作为新的上一目标词语,返回所述结合当前已获取的目标词语和所述预设语言学习模型获取与当前已获取的目标词语连接的当前目标词语的步骤。
在其中一个实施例中,所述结合所述目标关键词信息和预设参数信息,对所述初始描述文本进行修正获得目标描述文本包括:
将所述错误参数信息和所述初始描述文本进行匹配,当所述初始描述文本中包括与所述错误参数信息相同的目标词语时,删除所述初始描述文本并返回所述根据所述目标关键词信息从预设文本数据库中获取起始目标词语;
当所述初始描述文本中不包括与所述错误参数信息相同的目标词语时,将所述初始描述文本和所述多个待修正参数进行匹配;
当所述初始描述文本包括与所述待修正参数相同的目标词语时,将与所述待修正参数相同的目标词语替换为对应的标准参数获得所述目标描述文本。
一种描述文本生成方法,所述方法包括:
获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;
结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词获取初始描述文本;
结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得预处理目标描述文本;
结合预设近义词库和所述预处理目标描述文本,获取目标描述文本。
在其中一个实施例中,所述预设近义词库中存储有多组近义词组;
所述结合预设近义词库和所述预处理目标描述文本,获取目标描述文本包括:
查询所述预设近义词库中与组成所述预处理目标描述文本的目标词语相同的词语;
将查询到的词语随机替换为所述预设近义词库中同一组的其他词语获得所述目标描述文本。
一种描述文本生成装置,所述装置包括:
起始词语获取模块,用于获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;
初始文本获取模块,用于结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词获取初始描述文本;
目标文本获取模块,用于结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得目标描述文本。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如下步骤:
获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;
结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词语获取初始描述文本;
结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得目标描述文本。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;
结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词语获取初始描述文本;
结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得目标描述文本。
根据上述本发明的方案,其通过获取目标关键词信息,根据目标关键词信息从预设文本数据库中获取起始目标词语,然后结合预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词语获取初始描述文本,利用预设文本数据库和预设语言学习模型能够自动生成初始描述文本,然后结合目标关键词信息和预设参数数据库,对初始描述文本进行修正,能够修正生成的初始描述文本中的错误,从而获得目标描述文本,能有效提高描述文本生成的效率,并且能够避免文本描述错误。
附图说明
图1为一个实施例中描述文本生成方法的应用环境图;
图2为一个实施例中描述文本生成方法的流程示意图;
图3为一个实施例中描述文本生成方法的流程示意图;
图4为另一个实施例中描述文本生成方法的流程示意图;
图5为另一个实施例中描述文本生成方法的流程示意图;
图6为一个实施例中描述文本生成装置的结构框图;
图7为一个实施例中描述文本生成装置的结构框图;
图8为另一个实施例中描述文本生成装置的结构框图;
图9为另一个实施例中描述文本生成装置的结构框图;
图10为一个实施例中计算机设备的内部结构图;
图11为另一个实施例中计算机设备的内部结构图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
本申请提供的描述文本生成方法,可以应用于如图1所示的应用环境中。其中,服务器获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;服务器结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词语获取初始描述文本;服务器结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得目标描述文本。其中,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本领域技术人员可以理解,本申请提供的描述文本生成方法,不仅可以应用于图1所示的应用环境中,还可以应用但不限于各种计算机或服务器中。
在一个实施例中,如图2所示,提供了一种描述文本生成方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S101,获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;
具体的,目标关键词信息包括目标关键词以及与所述目标关键词对应的目标文本分值;所述预设文本数据库中储存有多个属性词、与每一属性词对应的多个文本分值,以及与每一属性词对应的每一文本分值分别对应的多个样本描述文本,且每一样本描述文本的起始词语和结束词语分别设置有起始和结束标记;
步骤S102,结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词语获取初始描述文本;
具体的,预设语言模型可以采用LSTM模型(long-short term memory,长短期记忆模型),或者RNN模型(Recurrent Neural Network,神经循环网络),且预设语言模型是通过预设文本数据库训练获得。
步骤S103,结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得目标描述文本。
具体的,所述预设参数数据库包括错误参数信息、每一所述属性词对应的标准参数以及与每一标准参数对应的多个待修正参数。
上述描述文本生成方法中,通过获取目标关键词信息,根据目标关键词信息从预设文本数据库中获取起始目标词语,然后结合预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词语获取初始描述文本,利用预设文本数据库和预设语言学习模型能够自动生成初始描述文本,然后结合目标关键词信息和预设参数数据库,对初始描述文本进行修正,能够修正生成的初始描述文本中的错误,从而获取目标描述文本,能有效提高描述文本生成的效率,并且能够避免文本描述错误。
在其中一个实施例中,如图3所示,所述获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语包括:
步骤S1011,查询所述预设文本数据库中与所述目标关键词相同的属性词,获取与所查询到的属性词对应的多个文本分值;
例如,属性词为“动力”,对应“动力”这个属性词的文本分值可以是“5分”、“4分”和“3分”等;
步骤S1012,查询所获取到的多个文本分值中与所述目标文本分值相同的文本分值,获取与所述文本分值对应的多个样本描述文本;
例如,获取与“动力”和“5分”对应的多个样本描述文本;
步骤S1013,提取所获取到的多个样本描述文本中带有起始标记的多个起始词语,随机抽取一个起始词语作为所述起始目标词语。
在其中一个实施例中,如图3所示,所述结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词获取初始描述文本包括:
步骤S1021,结合当前已获取的目标词语和所述预设语言学习模型获取与当前已获取的目标词语连接的当前目标词语;
具体的,由于预设语言模型是根据预设文本数据库训练获得的LSTM模型或者RNN模型,因此,只需要输入一个起始词,就可以自动获得起始词后面连续的词;
步骤S1022,当所述当前目标词语带有所述结束标记时,将已获取到的全部目标词语按照获取顺序依次连接形成所述初始描述文本;
步骤S1023,当所述当前目标词语没有所述结束标记时,将所述当前目标词语作为新的上一目标词语,返回所述结合当前已获取的目标词语和所述预设语言学习模型获取与当前已获取的目标词语连接的当前目标词语的步骤。
具体的,首先结合起始目标词语和预设语言模型获取连接于起始目标词语后面的目标词语,判断连接于起始目标词语后面的目标词语是否带有结束标记,如果带有结束标记,那么将起始目标词语和连接于起始目标词语后面的目标词语连接形成初始描述文本;如果连接于起始目标词语后面的目标词语没有结束标记,那么结合起始目标词语、连接于起始目标词语后面的目标词语以及预设语言模型继续获取连接于起始目标词语后面的目标词语后面的目标词语,重复判断和获取过程,只要获得到的词语不是结束词语,LSTM模型或者RNN模型就会自动继续获取,直至获取到结束词语。
在其中一个实施例中,如图3所示,所述结合所述目标关键词信息和预设参数信息,对所述初始描述文本进行修正获得目标描述文本包括:
步骤S1031,将所述错误参数信息和所述初始描述文本进行匹配,当所述初始描述文本中包括与所述错误参数信息相同的目标词语时,删除所述初始描述文本并返回所述根据所述目标关键词信息从预设文本数据库中获取起始目标词语;
具体的,所述预设参数数据库包括错误参数信息、每一所述属性词对应的标准参数以及与每一标准参数对应的多个待修正参数。
例如,当对“自动挡车”进行评价时,如果出现了“一档”、“手动挡”等等,就说明描述有误,因此,需要设置一个错误参数信息,排除掉描述范围之外的错误描述,能够提高描述文本的质量。
步骤S1032,当所述初始描述文本中不包括与所述错误参数信息相同的目标词语时,将所述初始描述文本和所述多个待修正参数进行匹配;
步骤S1033,当所述初始描述文本包括与所述待修正参数相同的目标词语时,将与所述待修正参数相同的目标词语替换为对应的标准参数获得所述目标描述文本。
具体的,当排除掉错误信息之后,还可能有一些参数需要进行修正,例如,当描述A型号车的时候,描述文本中出现了“B型号车不错”等字样,这时候就需要把“B型号”替换成“A型号”,以进一步提高描述文本的质量,使生成的描述文本更加接近人撰写的语言。
在其中一个实施例中,如图4所示,提供了一种描述文本生成方法,所述方法包括:
步骤S101,获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;
步骤S102,结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词获取初始描述文本;
步骤S103,结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得预处理目标描述文本;
步骤S104,结合预设近义词库和所述预处理目标描述文本,获取目标描述文本。
具体的,所述预设近义词库中存储有多组近义词组;为了避免生成的描述文本类似,可以将预处理目标描述文本中词语用近义词随机替换。
在其中一个实施例中,如图5所示,所述结合预设近义词库和所述预处理目标描述文本,获取目标描述文本包括:
步骤S1041,查询所述预设近义词库中与组成所述预处理目标描述文本的目标词语相同的词语;
步骤S1042,将查询到的词语随机替换为所述预设近义词库中同一组的其他词语获得所述目标描述文本。
在其中一个实施例汇中,如图6所示,提供了一种描述文本生成装置,所述装置包括:
起始词语获取模块101,用于获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;
初始文本获取模块102,用于结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词获取初始描述文本;
目标文本获取模块103,用于结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得目标描述文本。
在其中一个实施例中,所述目标关键词信息包括目标关键词以及与所述目标关键词对应的目标文本分值;
所述预设文本数据库中储存有多个属性词、与每一属性词对应的多个文本分值,以及与每一属性词对应的每一文本分值分别对应的多个样本描述文本,且每一样本描述文本的起始词语和结束词语分别设置有起始和结束标记;
所述预设参数数据库包括错误参数信息、每一所述属性词对应的标准参数以及与每一标准参数对应的多个待修正参数。
在其中一个实施例中,如图7所示,所述起始词语获取模块101包括:
第一查询单元1011,用于查询所述预设文本数据库中与所述目标关键词相同的属性词,获取与所查询到的属性词对应的多个文本分值;
第二查询单元1012,用于查询所获取到的多个文本分值中与所述目标文本分值相同的文本分值,获取与所述文本分值对应的多个样本描述文本;
第一获取单元1013,用于提取所获取到的多个样本描述文本中带有起始标记的多个起始词语,随机抽取一个起始词语作为所述起始目标词语。
在其中一个实施例中,如图7所示,所述初始文本获取模块102包括:
第二获取单元1021,用于结合当前已获取的目标词语和所述预设语言学习模型获取与当前已获取的目标词语连接的当前目标词语;
第三获取单元1022,用于当所述当前目标词语带有所述结束标记时,将已获取到的全部目标词语按照获取顺序依次连接形成所述初始描述文本;
第四获取单元1023,用于当所述当前目标词语没有所述结束标记时,将所述当前目标词语作为新的上一目标词语,返回所述结合当前已获取的目标词语和所述预设语言学习模型获取与当前已获取的目标词语连接的当前目标词语的步骤。
在其中一个实施例中,如图7所示,所述目标文本获取模块103包括:
第一匹配单元1031,用于将所述错误参数信息和所述初始描述文本进行匹配,当所述初始描述文本中包括与所述错误参数信息相同的目标词语时,删除所述初始描述文本并返回所述根据所述目标关键词信息从预设文本数据库中获取起始目标词语;
第二匹配单元1032,用于当所述初始描述文本中不包括与所述错误参数信息相同的目标词语时,将所述初始描述文本和所述多个待修正参数进行匹配;
修正单元1033,用于当所述初始描述文本包括与所述待修正参数相同的目标词语时,将与所述待修正参数相同的目标词语替换为对应的标准参数获得所述目标描述文本。
在其中一个实施例中,如图8所示,提供了一种描述文本生成装置,所述装置包括:
起始词语获取模块101,用于获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;
初始文本获取模块102,用于结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词获取初始描述文本;
预处理文本获取模块103,用于结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得预处理目标描述文本;
目标文本获取模块104,用于结合预设近义词库和所述预处理目标描述文本,获取目标描述文本。
在其中一个实施例中,所述预设近义词库中存储有多组近义词组,如图9所示,所述目标文本获取模块104包括:
第一查询单元1041,查询所述预设近义词库中与组成所述预处理目标描述文本的目标词语相同的词语;
替换单元1042,将查询到的词语随机替换为所述预设近义词库中同一组的其他词语获得所述目标描述文本。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过装置总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作装置、计算机程序和数据库。该内存储器为非易失性存储介质中的操作装置和计算机程序的运行提供环境。该计算机设备的数据库用于存储描述文本生成涉及的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种描述文本生成方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种描述文本生成方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图10-11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词语获取初始描述文本;结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得目标描述文本。
在其中一个实施例中,处理器执行计算机程序时所述目标关键词信息包括目标关键词以及与所述目标关键词对应的目标文本分值;所述预设文本数据库中储存有多个属性词、与每一属性词对应的多个文本分值,以及与每一属性词对应的每一文本分值分别对应的多个样本描述文本,且每一样本描述文本的起始词语和结束词语分别设置有起始和结束标记;所述预设参数数据库包括错误参数信息、每一所述属性词对应的标准参数以及与每一标准参数对应的多个待修正参数。
在其中一个实施例中,处理器执行计算机程序时所述获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语包括:查询所述预设文本数据库中与所述目标关键词相同的属性词,获取与所查询到的属性词对应的多个文本分值;查询所获取到的多个文本分值中与所述目标文本分值相同的文本分值,获取与所述文本分值对应的多个样本描述文本;提取所获取到的多个样本描述文本中带有起始标记的多个起始词语,随机抽取一个起始词语作为所述起始目标词语。
在其中一个实施例中,处理器执行计算机程序时所述结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词获取初始描述文本包括:结合当前已获取的目标词语和所述预设语言学习模型获取与当前已获取的目标词语连接的当前目标词语;当所述当前目标词语带有所述结束标记时,将已获取到的全部目标词语按照获取顺序依次连接形成所述初始描述文本;当所述当前目标词语没有所述结束标记时,将所述当前目标词语作为新的上一目标词语,返回所述结合当前已获取的目标词语和所述预设语言学习模型获取与当前已获取的目标词语连接的当前目标词语的步骤。
在其中一个实施例中,处理器执行计算机程序时所述结合所述目标关键词信息和预设参数信息,对所述初始描述文本进行修正获得目标描述文本包括:将所述错误参数信息和所述初始描述文本进行匹配,当所述初始描述文本中包括与所述错误参数信息相同的目标词语时,删除所述初始描述文本并返回所述根据所述目标关键词信息从预设文本数据库中获取起始目标词语;当所述初始描述文本中不包括与所述错误参数信息相同的目标词语时,将所述初始描述文本和所述多个待修正参数进行匹配;当所述初始描述文本包括与所述待修正参数相同的目标词语时,将与所述待修正参数相同的目标词语替换为对应的标准参数获得所述目标描述文本。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词获取初始描述文本;结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得预处理目标描述文本;结合预设近义词库和所述预处理目标描述文本,获取目标描述文本。
在其中一个实施例中,处理器执行计算机程序时所述预设近义词库中存储有多组近义词组;所述结合预设近义词库和所述预处理目标描述文本,获取目标描述文本包括:查询所述预设近义词库中与组成所述预处理目标描述文本的目标词语相同的词语;将查询到的词语随机替换为所述预设近义词库中同一组的其他词语获得所述目标描述文本。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词语获取初始描述文本;结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得目标描述文本。
在其中一个实施例中,计算机程序被处理器执行时所述目标关键词信息包括目标关键词以及与所述目标关键词对应的目标文本分值;所述预设文本数据库中储存有多个属性词、与每一属性词对应的多个文本分值,以及与每一属性词对应的每一文本分值分别对应的多个样本描述文本,且每一样本描述文本的起始词语和结束词语分别设置有起始和结束标记;所述预设参数数据库包括错误参数信息、每一所述属性词对应的标准参数以及与每一标准参数对应的多个待修正参数。
在其中一个实施例中,计算机程序被处理器执行时所述获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语包括:查询所述预设文本数据库中与所述目标关键词相同的属性词,获取与所查询到的属性词对应的多个文本分值;查询所获取到的多个文本分值中与所述目标文本分值相同的文本分值,获取与所述文本分值对应的多个样本描述文本;提取所获取到的多个样本描述文本中带有起始标记的多个起始词语,随机抽取一个起始词语作为所述起始目标词语。
在其中一个实施例中,计算机程序被处理器执行时所述结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词获取初始描述文本包括:结合当前已获取的目标词语和所述预设语言学习模型获取与当前已获取的目标词语连接的当前目标词语;当所述当前目标词语带有所述结束标记时,将已获取到的全部目标词语按照获取顺序依次连接形成所述初始描述文本;当所述当前目标词语没有所述结束标记时,将所述当前目标词语作为新的上一目标词语,返回所述结合当前已获取的目标词语和所述预设语言学习模型获取与当前已获取的目标词语连接的当前目标词语的步骤。
在其中一个实施例中,计算机程序被处理器执行时所述结合所述目标关键词信息和预设参数信息,对所述初始描述文本进行修正获得目标描述文本包括:将所述错误参数信息和所述初始描述文本进行匹配,当所述初始描述文本中包括与所述错误参数信息相同的目标词语时,删除所述初始描述文本并返回所述根据所述目标关键词信息从预设文本数据库中获取起始目标词语;当所述初始描述文本中不包括与所述错误参数信息相同的目标词语时,将所述初始描述文本和所述多个待修正参数进行匹配;当所述初始描述文本包括与所述待修正参数相同的目标词语时,将与所述待修正参数相同的目标词语替换为对应的标准参数获得所述目标描述文本。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词获取初始描述文本;结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得预处理目标描述文本;结合预设近义词库和所述预处理目标描述文本,获取目标描述文本。
在其中一个实施例中,计算机程序被处理器执行时所述预设近义词库中存储有多组近义词组;所述结合预设近义词库和所述预处理目标描述文本,获取目标描述文本包括:查询所述预设近义词库中与组成所述预处理目标描述文本的目标词语相同的词语;将查询到的词语随机替换为所述预设近义词库中同一组的其他词语获得所述目标描述文本。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种描述文本生成方法,其特征在于,所述方法包括:
获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;
结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词语获取初始描述文本;
结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得目标描述文本;
所述目标关键词信息包括目标关键词以及与所述目标关键词对应的目标文本分值;
所述预设文本数据库中储存有多个属性词、与每一属性词对应的多个文本分值,以及与每一属性词对应的每一文本分值分别对应的多个样本描述文本,且每一样本描述文本的起始词语和结束词语分别设置有起始和结束标记;
所述预设参数数据库包括错误参数信息、每一所述属性词对应的标准参数以及与每一标准参数对应的多个待修正参数。
2.根据权利要求1所述的描述文本生成方法,其特征在于,所述获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语包括:
查询所述预设文本数据库中与所述目标关键词相同的属性词,获取与所查询到的属性词对应的多个文本分值;
查询所获取到的多个文本分值中与所述目标文本分值相同的文本分值,获取与所述文本分值对应的多个样本描述文本;
提取所获取到的多个样本描述文本中带有起始标记的多个起始词语,随机抽取一个起始词语作为所述起始目标词语。
3.根据权利要求1所述的描述文本生成方法,其特征在于,所述结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词获取初始描述文本包括:
结合当前已获取的目标词语和所述预设语言学习模型获取与当前已获取的目标词语连接的当前目标词语;
当所述当前目标词语带有所述结束标记时,将已获取到的全部目标词语按照获取顺序依次连接形成所述初始描述文本;
当所述当前目标词语没有所述结束标记时,将所述当前目标词语作为新的上一目标词语,返回所述结合当前已获取的目标词语和所述预设语言学习模型获取与当前已获取的目标词语连接的当前目标词语的步骤。
4.根据权利要求1所述的描述文本生成方法,其特征在于,所述结合所述目标关键词信息和预设参数信息,对所述初始描述文本进行修正获得目标描述文本包括:
将所述错误参数信息和所述初始描述文本进行匹配,当所述初始描述文本中包括与所述错误参数信息相同的目标词语时,删除所述初始描述文本并返回所述根据所述目标关键词信息从预设文本数据库中获取起始目标词语;
当所述初始描述文本中不包括与所述错误参数信息相同的目标词语时,将所述初始描述文本和所述多个待修正参数进行匹配;
当所述初始描述文本包括与所述待修正参数相同的目标词语时,将与所述待修正参数相同的目标词语替换为对应的标准参数获得所述目标描述文本。
5.一种描述文本生成方法,其特征在于,所述方法包括:
获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;
结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词获取初始描述文本;
结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得预处理目标描述文本;
结合预设近义词库和所述预处理目标描述文本,获取目标描述文本;
所述目标关键词信息包括目标关键词以及与所述目标关键词对应的目标文本分值;
所述预设文本数据库中储存有多个属性词、与每一属性词对应的多个文本分值,以及与每一属性词对应的每一文本分值分别对应的多个样本描述文本,且每一样本描述文本的起始词语和结束词语分别设置有起始和结束标记;
所述预设参数数据库包括错误参数信息、每一所述属性词对应的标准参数以及与每一标准参数对应的多个待修正参数。
6.根据权利要求5所述的描述文本生成方法,其特征在于,所述预设近义词库中存储有多组近义词组;
所述结合预设近义词库和所述预处理目标描述文本,获取目标描述文本包括:
查询所述预设近义词库中与组成所述预处理目标描述文本的目标词语相同的词语;
将查询到的词语随机替换为所述预设近义词库中同一组的其他词语获得所述目标描述文本。
7.一种描述文本生成装置,其特征在于,所述装置包括:
起始词语获取模块,用于获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;
初始文本获取模块,用于结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词获取初始描述文本;
目标文本获取模块,用于结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得目标描述文本;
所述目标关键词信息包括目标关键词以及与所述目标关键词对应的目标文本分值;
所述预设文本数据库中储存有多个属性词、与每一属性词对应的多个文本分值,以及与每一属性词对应的每一文本分值分别对应的多个样本描述文本,且每一样本描述文本的起始词语和结束词语分别设置有起始和结束标记;
所述预设参数数据库包括错误参数信息、每一所述属性词对应的标准参数以及与每一标准参数对应的多个待修正参数。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN201810907686.0A 2018-08-10 2018-08-10 描述文本生成方法、装置、计算机设备和可读存储介质 Active CN108959271B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810907686.0A CN108959271B (zh) 2018-08-10 2018-08-10 描述文本生成方法、装置、计算机设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810907686.0A CN108959271B (zh) 2018-08-10 2018-08-10 描述文本生成方法、装置、计算机设备和可读存储介质

Publications (2)

Publication Number Publication Date
CN108959271A CN108959271A (zh) 2018-12-07
CN108959271B true CN108959271B (zh) 2020-06-16

Family

ID=64468812

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810907686.0A Active CN108959271B (zh) 2018-08-10 2018-08-10 描述文本生成方法、装置、计算机设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN108959271B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022271357A1 (en) * 2021-06-23 2022-12-29 Microsoft Technology Licensing, Llc Interactive content generation

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109766537A (zh) * 2019-01-16 2019-05-17 北京未名复众科技有限公司 留学文书撰写方法、装置及电子设备
CN109829164B (zh) * 2019-02-01 2020-05-22 北京字节跳动网络技术有限公司 用于生成文本的方法和装置
CN109919721A (zh) * 2019-02-27 2019-06-21 上海宝尊电子商务有限公司 一种实时自动生成商品描述文本的方法
CN110196972B (zh) * 2019-04-24 2022-11-01 北京奇艺世纪科技有限公司 文案生成方法、装置及计算机可读存储介质
CN110209783B (zh) * 2019-04-26 2024-03-15 平安科技(深圳)有限公司 聊天应答方法及系统、电子装置及可读存储介质
CN110245221B (zh) * 2019-05-13 2023-05-23 华为技术有限公司 训练对话状态跟踪分类器的方法和计算机设备
CN110276081B (zh) * 2019-06-06 2023-04-25 百度在线网络技术(北京)有限公司 文本生成方法、装置及存储介质
CN111783468B (zh) * 2020-06-28 2023-08-15 百度在线网络技术(北京)有限公司 文本处理方法、装置、设备和介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105955964A (zh) * 2016-06-13 2016-09-21 北京百度网讯科技有限公司 一种自动生成诗歌的方法和装置
CN106650943A (zh) * 2016-10-28 2017-05-10 北京百度网讯科技有限公司 基于人工智能的辅助写作方法和装置
CN108021547A (zh) * 2016-11-04 2018-05-11 株式会社理光 一种自然语言的生成方法、自然语言生成装置及电子设备
CN108363697A (zh) * 2018-03-08 2018-08-03 腾讯科技(深圳)有限公司 文本信息生成方法、装置、存储介质及设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4085156B2 (ja) * 2002-03-18 2008-05-14 独立行政法人情報通信研究機構 テキスト生成方法及びテキスト生成装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105955964A (zh) * 2016-06-13 2016-09-21 北京百度网讯科技有限公司 一种自动生成诗歌的方法和装置
CN106650943A (zh) * 2016-10-28 2017-05-10 北京百度网讯科技有限公司 基于人工智能的辅助写作方法和装置
CN108021547A (zh) * 2016-11-04 2018-05-11 株式会社理光 一种自然语言的生成方法、自然语言生成装置及电子设备
CN108363697A (zh) * 2018-03-08 2018-08-03 腾讯科技(深圳)有限公司 文本信息生成方法、装置、存储介质及设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022271357A1 (en) * 2021-06-23 2022-12-29 Microsoft Technology Licensing, Llc Interactive content generation

Also Published As

Publication number Publication date
CN108959271A (zh) 2018-12-07

Similar Documents

Publication Publication Date Title
CN108959271B (zh) 描述文本生成方法、装置、计算机设备和可读存储介质
CN109446302B (zh) 基于机器学习的问答数据处理方法、装置和计算机设备
CN110457431B (zh) 基于知识图谱的问答方法、装置、计算机设备和存储介质
CN108932294B (zh) 基于索引的简历数据处理方法、装置、设备及存储介质
CN109815333B (zh) 信息获取方法、装置、计算机设备和存储介质
CN109829629B (zh) 风险分析报告的生成方法、装置、计算机设备和存储介质
CN110674319A (zh) 标签确定方法、装置、计算机设备及存储介质
CN108874928A (zh) 简历数据信息解析处理方法、装置、设备及存储介质
KR20190085098A (ko) 키워드 추출 방법, 컴퓨터 장치, 및 저장 매체
CN112651238A (zh) 训练语料扩充方法及装置、意图识别模型训练方法及装置
CN113536735B (zh) 一种基于关键词的文本标记方法、系统和存储介质
US9514113B1 (en) Methods for automatic footnote generation
CN112651236B (zh) 提取文本信息的方法、装置、计算机设备和存储介质
CN110955608B (zh) 测试数据处理方法、装置、计算机设备和存储介质
CN113743415A (zh) 一种图像文本识别纠错的方法、系统、电子装置和介质
CN112685475A (zh) 报表查询方法、装置、计算机设备及存储介质
CN113177411A (zh) 命名实体识别模型的训练方法和命名实体识别的方法
CN111191028A (zh) 样本标注方法、装置、计算机设备和存储介质
CN110555165B (zh) 信息识别方法、装置、计算机设备和存储介质
CN109063155B (zh) 语言模型参数确定方法、装置和计算机设备
US20230394236A1 (en) Extracting content from freeform text samples into custom fields in a software application
CN111078564B (zh) 一种ui测试用例管理方法、装置、计算机设备以及计算机可读存储介质
CN110990539B (zh) 稿件内部查重方法、装置及电子设备
CN111400340A (zh) 一种自然语言处理方法、装置、计算机设备和存储介质
CN110569401A (zh) 阅卷方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant