CN116796709A - 一种文本生成方法、装置、计算机设备及存储介质 - Google Patents

一种文本生成方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN116796709A
CN116796709A CN202310799487.3A CN202310799487A CN116796709A CN 116796709 A CN116796709 A CN 116796709A CN 202310799487 A CN202310799487 A CN 202310799487A CN 116796709 A CN116796709 A CN 116796709A
Authority
CN
China
Prior art keywords
text
semantic
candidate
vector
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310799487.3A
Other languages
English (en)
Inventor
朱威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202310799487.3A priority Critical patent/CN116796709A/zh
Publication of CN116796709A publication Critical patent/CN116796709A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Machine Translation (AREA)

Abstract

本申请实施例属于智能决策及数字医疗技术领域,涉及文本生成方法、装置、计算机设备及存储介质,该方法包括:将待处理文本输入至生成式语言模型进行预测操作,得到候选文本集;分别对候选文本集中的各个候选文本进行语义相关性计算操作,得到候选语义相关性数据;根据候选语义相关性数据的大小对候选文本进行筛选操作,得到预设数量目标候选文本;根据目标候选文本对待处理文本进行重复更新操作,得到更新后的待处理文本;根据预测操作、语义相关性计算操作以及筛选操作对更新后的待处理文本进行重复更新操作,直至候选文本为结束符号为止,得到目标文本。本申请会显著提升生成语言模型在智能诊疗、远程会诊等场景的表现。

Description

一种文本生成方法、装置、计算机设备及存储介质
技术领域
本申请涉及人工智能的智能决策技术领域及数字医疗领域,尤其涉及一种文本生成方法、装置、计算机设备及存储介质
背景技术
随着生成式模型的普及,各项医疗等不同行业文本相关的业务都广泛使用生成式语言模型,上述生成式语言模型可应用于智能诊疗、远程会诊等等。
虽然生成模型,特别是适合于生产环境的轻量级生成模型,但是,申请人发现这些方法在实用中经常会出现的一个问题是生成格式不符合要求,导致生成结果不好处理。比如对下面的句子进行实体抽取“因此了解嵌合型患儿体细胞中正常核型细胞与21-三体核型细胞的比例,可以根据其具体情况指导患儿的家庭及社会对其进行教育。”,下面句子中的实体应该是[{"entity":"体细胞中","type":"身体部位"},{"entity":"正常核型细胞","type":"身体部位"},{"entity":"21-三体核型细胞","type":"身体部位"}]。传统的生成方法一般会导致格式出错:[{"entity":"体细胞中","type":"身体部位"},{"entity:正常核型细胞","type":"身体部位"},{"entity":"21-三体核型细胞","type":"身体部位"}。这样这一串输出就无法直接用json解析,使得其无法直接使用,由此可见,传统的生成模型存在无法兼容于医疗文本处理场景的问题。
发明内容
本申请实施例的目的在于提出一种文本生成方法、装置、计算机设备及存储介质,以解决传统的生成模型存在无法兼容于医疗文本处理场景的问题。
为了解决上述技术问题,本申请实施例提供一种文本生成方法,采用了如下所述的技术方案:
接收用户终端发送的待处理文本;
将所述待处理文本输入至生成式语言模型进行预测操作,得到候选文本集;
分别对所述候选文本集中的各个候选文本进行语义相关性计算操作,得到候选语义相关性数据;
根据所述候选语义相关性数据的大小对所述候选文本进行筛选操作,得到预设数量目标候选文本;
根据所述目标候选文本对所述待处理文本进行重复更新操作,得到更新后的待处理文本;
根据所述预测操作、所述语义相关性计算操作以及所述筛选操作对所述更新后的待处理文本进行重复更新操作,直至候选文本为结束符号为止,得到目标文本。
进一步的,所述分别对所述候选文本集中的各个候选文本进行语义相关性计算操作,得到候选语义相关性数据的步骤,具体包括下述步骤:
根据语义相关计算公式计算所述候选文本与所述待处理文本的所述候选语义相关性数据,其中,所述候选语义相关性数据表示为:
其中,Wr表示随机初始化;hl+1,表示所述候选文本的向量表征。
进一步的,在所述根据所述预测操作、所述语义相关性计算操作以及所述筛选操作对所述更新后的待处理文本进行重复更新操作,直至候选文本为结束符号为止,得到目标文本的步骤之后,还包括下述步骤:
读取本地数据库,在所述本地数据库中获取样本文本,并确定所述样本文本中包含的每个分词,基于待训练的语义分析模型确定所述每个分词对应的词向量;
在所述本地数据库中获取语义属性,根据所述待训练的语义分析模型中包含所述语义属性对应的注意力矩阵,以及所述每个分词对应的词向量,确定所述样本文本涉及所述语义属性的第一特征表示向量;
根据所述待训练的语义分析模型中包含的用于表示不同语义属性之间的相关性的自注意力矩阵,以及所述第一特征表示向量,确定所述样本文本涉及所述语义属性的第二特征表示向量;
根据所述待训练的语义分析模型以及所述第二特征表示向量,确定所述待训练的语义训练模型输出的分类结果,所述分类结果包括所述样本文本所属的语义属性以及所述样本文本所属的语义属性对应的情感极性;
根据所述分类结果和所述样本文本预设的标注,对所述语义分析模型中的模型参数进行调整,得到训练好的语义分析模型;
将所述目标文本输入至所述训练好的语义分析模型进行语义分析操作,得到目标文本语义。
进一步的,所述基于待训练的语义分析模型确定所述每个分词对应的词向量的步骤,具体包括:
将所述每个分词输入至所述语义分析模型的语义表征层,得到所述语义表征层输出的所述每个分词分别对应的双向语义表示向量,作为所述每个分词对应的词向量。
进一步的,所述在所述本地数据库中获取语义属性,根据所述待训练的语义分析模型中包含所述语义属性对应的注意力矩阵,以及所述每个分词对应的词向量,确定所述样本文本涉及所述语义属性的第一特征表示向量的步骤,具体包括:
将所述每个分词对应的词向量输入至所述语义分析模型中的属性表征层;
通过所述属性表征层中包含的所述语义属性对应的注意力矩阵,对所述每个分词对应的词向量进行注意力加权,得到加权词向量;
基于所述加权词向量确定所述样本文本涉及所述语义属性的所述第一特征表示向量。
进一步的,所述根据所述待训练的语义分析模型中包含的用于表示不同语义属性之间的相关性的自注意力矩阵,以及所述第一特征表示向量,确定所述样本文本涉及所述语义属性的第二特征表示向量的步骤,具体包括:
将所述第一特征表示向量输入至所述语义分析模型中的属性相关性表示层;
通过所述属性相关性表示层中包含的用于表示不同语义属性之间的相关性的自注意力矩阵,对所述样本文本涉及每个语义属性的第一特征表示向量进行自注意力加权,得到加权特征表示向量;
基于所述加权特征表示向量确定所述样本文本涉及每个语义属性的第二特征表示向量。
为了解决上述技术问题,本申请实施例还提供一种文本生成装置,采用了如下所述的技术方案:
文本获取模块,用于接收用户终端发送的待处理文本;
预测模块,用于将所述待处理文本输入至生成式语言模型进行预测操作,得到候选文本集;
相关性计算模块,用于分别对所述候选文本集中的各个候选文本进行语义相关性计算操作,得到候选语义相关性数据;
筛选模块,用于根据所述候选语义相关性数据的大小对所述候选文本进行筛选操作,得到预设数量目标候选文本;
重复更新模块,用于根据所述目标候选文本对所述待处理文本进行重复更新操作,得到更新后的待处理文本;
目标文本获取模块,用于根据所述预测操作、所述语义相关性计算操作以及所述筛选操作对所述更新后的待处理文本进行重复更新操作,直至候选文本为结束符号为止,得到目标文本。
进一步的,所述相关性计算模块包括:
相关性计算子模块,用于根据语义相关计算公式计算所述候选文本与所述待处理文本的所述候选语义相关性数据,其中,所述候选语义相关性数据表示为:
其中,Wr表示随机初始化;hl+1,k表示所述候选文本的向量表征。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如上所述的文本生成方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上所述的文本生成方法的步骤。
本申请提供了一种文本生成方法,包括:接收用户终端发送的待处理文本;将所述待处理文本输入至生成式语言模型进行预测操作,得到候选文本集;分别对所述候选文本集中的各个候选文本进行语义相关性计算操作,得到候选语义相关性数据;根据所述候选语义相关性数据的大小对所述候选文本进行筛选操作,得到预设数量目标候选文本;根据所述目标候选文本对所述待处理文本进行重复更新操作,得到更新后的待处理文本;根据所述预测操作、所述语义相关性计算操作以及所述筛选操作对所述更新后的待处理文本进行重复更新操作,直至候选文本为结束符号为止,得到目标文本。与现有技术相比,本申请在应用于智能诊疗、远程会诊等场景时,可以帮助模型选择更加合理的下一个token,而不是重复或者是无效的新token,这样将会显著提升生成语言模型在智能诊疗、远程会诊等场景的表现。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性系统架构图;
图2是本申请实施例一提供的文本生成方法的实现流程图;
图3是本申请实施例二提供的文本生成装置的结构示意图;
图4是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的文本生成方法一般由服务器/终端设备执行,相应地,文本生成装置一般设置于服务器/终端设备中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的文本生成方法的一个实施例的流程图。所述的文本生成方法,包括:步骤S201、步骤S202、步骤S203、步骤S204、步骤S205以及步骤S206。
在步骤S201中,接收用户终端发送的待处理文本。
在步骤S202中,将待处理文本输入至生成式语言模型进行预测操作,得到候选文本集。
在本申请实施例中,
在步骤S203中,分别对候选文本集中的各个候选文本进行语义相关性计算操作,得到候选语义相关性数据。
在步骤S204中,根据候选语义相关性数据的大小对候选文本进行筛选操作,得到预设数量目标候选文本。
在步骤S205中,根据目标候选文本对待处理文本进行重复更新操作,得到更新后的待处理文本。
在步骤S206中,根据预测操作、语义相关性计算操作以及筛选操作对更新后的待处理文本进行重复更新操作,直至候选文本为结束符号为止,得到目标文本。
在本申请实施例中,用户终端指的是用于执行本申请提供的预防证件滥用的图像处理方法的终端设备,该用户终端可以是诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字TV、台式计算机等等的固定终端,应当理解,此处对用户终端的举例仅为方便理解,不用于限定本申请。
在本申请实施例中,传统的语言模型接收到一段句子(query)后,开始进行生成。这个query记为q=[a1,a2,…,al],可能是需要补全的提示内容,或者是用户的一个问句。第一个生成步,语言模型依据q=[a1,a2,…,al],对query进行编码,然后通过采用al的向量表征hl,对al+1的结果结果进行建模:
P(al+1=k|a1,a2,…,al)=Softmax(hlWV)[k], (1)
其中,hl的维度记为d,词汇表记为V,WV的形状为d*|V|.即上面的式子会得到一个|V|的概率分布,代表al+1等于词汇表中某个token的概率。
这样我们得到两个得分(即得到概率值)最高的token al+1,图上分别为记为A和C(注意这里不是真的字母A,C,而是这两个符号代表了不同的字/词)。第二步,我们分别假设al+1等于A或者C,进行al+2的生成。这里al+1=A和al+1=C分别都可以选择最高分的tokens作为候选。通过不断重复上面的结果,直到生成一个句子结束符号(“</s>”),得到生成的完整句子。
在本申请实施例中,对模型在每一步预测下一个token计算的概率分布进行调整。假设上面式子(1)已经给出了前kc得分的tokens,这些都是al+1的候选token,kc可以等于8,16,32或者其他整数。我们假设al+1分别等于这些tokens,比如al+1=k,与q=[a1,a2,…,al]合并,得到新的序列[a1,a2,…,al,k],然后得到al+1=k的向量表征,记为hl+1,k。我们采用下面式子计算hl+1,k与之前的tokens的表征hl,hl-1,…,h1的语义相关性:
其中,Wr是随机初始化,然后通过训练过程学习得到的。hl+1,k与之前的tokens计算语义相关性总分,而总分数最高的hl+1,k对应的前两个token k将被选择为al+1的候选。选择kc大于beam size是因为通过相关性计算,可能排名会改变。
在本申请实施例中,添加了Wr参数矩阵可以计算hl+1,k的语义相关性而不是相似度,这样可以帮助模型选择更加合理的下一个token,而不是重复或者是无效的新token。
在实际应用中,医疗场景下一个需求量很大的应用就是回答用户的医学问题:比如:妊娠糖尿病是一过性的吗?常规的解码方式可能会生成如下效果:妊娠糖尿病(Gestational Diabetes Mellitus,GDM)通常是指中枢性、循环性、血尿,不仅以上述症状为患者的基本症状,还以糖尿病病史为首,因此,中枢性糖尿病患者往往被称为糖尿病的。而目前,糖尿病症状尚未明确。生成过程中,前后文语义不对应,而且最后结尾没有自然地结尾,无法很好的回答问题。通过我们的方法,回答会更加流畅,且呈现为一个整体的回答:“妊娠糖尿病(Gestational Diabetes Mellitus,GDM)通常是指在妊娠期间出现的高血糖状况。虽然妊娠糖尿病在许多情况下会在分娩后自行消失,但它并不是一过性的疾病。”。
在本申请实施例中,提供了一种文本生成方法,包括:接收用户终端发送的待处理文本;将待处理文本输入至生成式语言模型进行预测操作,得到候选文本集;分别对候选文本集中的各个候选文本进行语义相关性计算操作,得到候选语义相关性数据;根据候选语义相关性数据的大小对候选文本进行筛选操作,得到预设数量目标候选文本;根据目标候选文本对待处理文本进行重复更新操作,得到更新后的待处理文本;根据预测操作、语义相关性计算操作以及筛选操作对更新后的待处理文本进行重复更新操作,直至候选文本为结束符号为止,得到目标文本。与现有技术相比,本申请在应用于智能诊疗、远程会诊等场景时,可以帮助模型选择更加合理的下一个token,而不是重复或者是无效的新token,这样将会显著提升生成语言模型在智能诊疗、远程会诊等场景的表现。
继续参阅图3,示出了图2中步骤S**的一种具体实施方式的流程图,为了便于说明,仅示出与本申请相关的部分。
在本实施例的一些可选的实现方式中,步骤S203具体包括:
根据语义相关计算公式计算候选文本与待处理文本的候选语义相关性数据,其中,候选语义相关性数据表示为:
其中,Wr表示随机初始化;hl+1,k表示候选文本的向量表征。
在本实施例的一些可选的实现方式中,Wr可以通过训练过程学习得到的,具体的,生成模型的训练一般是通过teacher forcing,针对公式(1)进行交叉熵的计算。为了计算Wr,我们对每一个batch中每个序列的最后一个tokens进行上述预测,并在优化目标中加上要求kc个tokens与序列之前的tokens的向量表征的语义相关性最大化。
在本实施例的一些可选的实现方式中,在步骤S206之后,还包括以下步骤:
读取本地数据库,在所述本地数据库中获取样本文本,并确定所述样本文本中包含的每个分词,基于待训练的语义分析模型确定所述每个分词对应的词向量;
在所述本地数据库中获取语义属性,根据所述待训练的语义分析模型中包含所述语义属性对应的注意力矩阵,以及所述每个分词对应的词向量,确定所述样本文本涉及所述语义属性的第一特征表示向量;
根据所述待训练的语义分析模型中包含的用于表示不同语义属性之间的相关性的自注意力矩阵,以及所述第一特征表示向量,确定所述样本文本涉及所述语义属性的第二特征表示向量;
根据所述待训练的语义分析模型以及所述第二特征表示向量,确定所述待训练的语义训练模型输出的分类结果,所述分类结果包括所述样本文本所属的语义属性以及所述样本文本所属的语义属性对应的情感极性;
根据所述分类结果和所述样本文本预设的标注,对所述语义分析模型中的模型参数进行调整,得到训练好的语义分析模型;
将所述目标文本输入至所述训练好的语义分析模型进行语义分析操作,得到目标文本语义。
在本申请实施例中,可以先从上述本地数据库中获取多个文本,确定由获取的多个文本所构成的训练集,则,针对训练集中的每个文本,可将该文本作为样本文本。
在本申请实施例中,确定该样本文本中包含的分词时,可先对该样本文本进行分词处理,以得到该样本文本中包含的每个分词。在对样本文本进行分词处理时,可采用任何分词方法,当然,也可将该样本文本中的每个字符都作为一个分词进行处理,应当理解,此处对分词处理的举例仅为方便理解,不用于限定本申请。
在本申请实施例中,语义分析模型可至少包括四层,分别是:语义表征层、属性表征层、属性相关性表示层、分类层。
在本申请实施例中,语义表征层中至少包括用于输出双向语义表示向量的子模型,如BERT(Bidirectional Encoder Representations from Transformers)模型等。可将每个分词输入语义分析模型中的语义表征层,得到语义表征层输出的每个分词分别对应的双向语义表示向量,作为每个分词对应的词向量。应当理解,用于输出双向语义表示向量的模型除了上述的BERT模型以外,还包括其他模型,此处对用于输出双向语义表示向量的模型的举例仅为方便理解,不用于限定本申请。
在本申请实施例中,可将每个分词对应的词向量输入语义分析模型中的属性表征层,通过属性表征层中包含的该语义属性对应的注意力矩阵,对每个分词对应的词向量进行注意力加权,根据注意力加权后的每个分词对应的词向量,确定样本文本涉及该语义属性的第一特征表示向量。
在本申请实施例中,可将样本文本涉及每个语义属性的第一特征表示向量输入语音分析模型中的属性相关性表示层,通过属性相关性表示层中包含的上述自注意力矩阵,对样本文本涉及每个语义属性的第一特征表示向量进行自注意力加权,根据自注意力加权后的各第一特征表示向量,确定样本文本涉及每个语义属性的第二特征表示向量。
在本申请实施例中,分类层至少包括隐层、全连接层和softmax层。
在本申请实施例中,可将样本文本涉及每个语义属性的第二特征表示向量依次输入分类层中的隐层、全连接层和softmax层,根据每个第二特征表示向量以及分类层的隐层、全连接层和softmax层中包含的与每个语义属性对应的分类参数,对样本文本进行分类,得到分类层输出的分类结果。
在本申请实施例中,的分类结果至少包括样本文本所属的语义属性以及样本文本在其所属的语义属性上对应的情感极性。
在本申请实施例中,该情感极性可以采用数值进行量化,例如,数值越接近于1,则表示情感极性越倾向于正面,数值越接近于-1,则表示情感极性越倾向于负面,数值接近于0,则表示情感极性倾向于中性。
在本申请实施例中,需要调整的模型参数至少包括上述的分类参数,还可包括上述的注意力矩阵和自注意力矩阵。可采用传统的训练方法对语义分析模型中的模型参数进行调整。即,直接根据分类结果和针对样本文本预设的标注,确定分类结果对应的损失(以下将其称之为第一损失),并以该第一损失最小化为训练目标对语义分析模型中的模型参数进行调整,以完成对语义分析模型的训练。
在本申请实施例中,由于上述语义分析模型中已经加入了用于表示不同语义属性之间相关性的自注意力矩阵,因此,采用上述传统的训练方法训练得到的语义分析模型可更加准确的对待分析文本的语义进行分析。
在本申请实施例中,由于文本生成模型生成的目标文本存在歧义、赘余的文本,因此需要对该目标文本进行语义识别,从而获取该目标文本的真实语义信息。
在本实施例的一些可选的实现方式中,所述基于待训练的语义分析模型确定所述每个分词对应的词向量的步骤,具体包括下述步骤:
将所述每个分词输入至所述语义分析模型的语义表征层,得到所述语义表征层输出的所述每个分词分别对应的双向语义表示向量,作为所述每个分词对应的词向量。
在本申请实施例中,语义表征层至少包括用于输出双向语义表示向量的子模型,该子模型包括BERT模型。
在本实施例的一些可选的实现方式中,所述在所述本地数据库中获取语义属性,根据所述待训练的语义分析模型中包含所述语义属性对应的注意力矩阵,以及所述每个分词对应的词向量,确定所述样本文本涉及所述语义属性的第一特征表示向量的步骤,具体包括:
将所述每个分词对应的词向量输入至所述语义分析模型中的属性表征层;
通过所述属性表征层中包含的所述语义属性对应的注意力矩阵,对所述每个分词对应的词向量进行注意力加权,得到加权词向量;
基于所述加权词向量确定所述样本文本涉及所述语义属性的所述第一特征表示向量。
在本申请实施例中,在本申请实施例中,属性表征层中至少包含每个语义属性各自对应的注意力矩阵。
在本申请实施例中,可将每个分词对应的词向量输入语义分析模型中的属性表征层,通过属性表征层中包含的该语义属性对应的注意力矩阵,对每个分词对应的词向量进行注意力加权,根据注意力加权后的每个分词对应的词向量,确定样本文本涉及该语义属性的第一特征表示向量。
在本申请实施例中,上述的第一特征表示向量可以表征该样本文本涉及该语义属性的概率以及在该语义属性上的情感极性。
在本实施例的一些可选的实现方式中,所述根据所述待训练的语义分析模型中包含的用于表示不同语义属性之间的相关性的自注意力矩阵,以及所述第一特征表示向量,确定所述样本文本涉及所述语义属性的第二特征表示向量的步骤,具体包括:
将所述第一特征表示向量输入至所述语义分析模型中的属性相关性表示层;
通过所述属性相关性表示层中包含的用于表示不同语义属性之间的相关性的自注意力矩阵,对所述样本文本涉及每个语义属性的第一特征表示向量进行自注意力加权,得到加权特征表示向量;
基于所述加权特征表示向量确定所述样本文本涉及每个语义属性的第二特征表示向量。
在本申请实施例中,语义分析模型中的属性相关性表示层中至少包含自注意力矩阵,该自注意力矩阵用于表示不同语义属性之间的相关性,该自注意力矩阵的形式可以为:矩阵中的元素Rij表示第i个语义属性与第j个语义属性的相关性,相关性越强,Rij的值越大,反之越小。
在本申请实施例中,第二特征表示向量同样可以表征该样本文本涉及每个语义属性的概率以及在该语义属性上的情感极性,但与第一特征表示向量不同的是,第一特征表示向量是采用各自独立的每个语义属性对应的注意力矩阵对词向量加权得到的,因此,其表征的样本文本涉及每个语义属性的概率以及在该语义属性上的情感极性并未考虑不同语义属性之间的相关性。而第二特征表示向量是采用用于表示不同语义属性之间相关性的自注意力矩阵对第一特征表示向量加权得到的,相当于由自注意力矩阵引入了不同语义属性之间相关性的因素,因此,其表征的样本文本涉及每个语义属性的概率以及在该语义属性上的情感极性考虑了不同语义属性之间的相关性。
需要强调的是,为进一步保证上述目标文本的私密和安全性,上述目标文本还可以存储于一区块链的节点中。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,该计算机可读指令可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
实施例二
进一步参考图3,作为对上述图2所示方法的实现,本申请提供了一种文本生成装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图3所示,本实施例的文本生成装置200包括:文本获取模块210、预测模块220、相关性计算模块230、筛选模块240、重复更新模块250以及目标文本获取模块260,其中:
文本获取模块210,用于接收用户终端发送的待处理文本;
预测模块220,用于将待处理文本输入至生成式语言模型进行预测操作,得到候选文本集;
相关性计算模块230,用于分别对候选文本集中的各个候选文本进行语义相关性计算操作,得到候选语义相关性数据;
筛选模块240,用于根据候选语义相关性数据的大小对候选文本进行筛选操作,得到预设数量目标候选文本;
重复更新模块250,用于根据目标候选文本对待处理文本进行重复更新操作,得到更新后的待处理文本;
目标文本获取模块260,用于根据预测操作、语义相关性计算操作以及筛选操作对更新后的待处理文本进行重复更新操作,直至候选文本为结束符号为止,得到目标文本。
在本申请实施例中,用户终端指的是用于执行本申请提供的预防证件滥用的图像处理方法的终端设备,该用户终端可以是诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字TV、台式计算机等等的固定终端,应当理解,此处对用户终端的举例仅为方便理解,不用于限定本申请。
在本申请实施例中,传统的语言模型接收到一段句子(query)后,开始进行生成。这个query记为q=[a1,a2,…,al],可能是需要补全的提示内容,或者是用户的一个问句。第一个生成步,语言模型依据q=[a1,a2,…,al],对query进行编码,然后通过采用al的向量表征hl,对al+1的结果结果进行建模:
P(al+1=k|a1,a2,…,al)=Softmax(hlWV)[k], (1)
其中,hl的维度记为d,词汇表记为V,WV的形状为d*|V|.即上面的式子会得到一个|V|的概率分布,代表al+1等于词汇表中某个token的概率。
这样我们得到两个得分(即得到概率值)最高的token al+1,图上分别为记为A和C(注意这里不是真的字母A,C,而是这两个符号代表了不同的字/词)。第二步,我们分别假设al+1等于A或者C,进行al+2的生成。这里al+1=A和al+1=C分别都可以选择最高分的tokens作为候选。通过不断重复上面的结果,直到生成一个句子结束符号(“</s>”),得到生成的完整句子。
在本申请实施例中,对模型在每一步预测下一个token计算的概率分布进行调整。假设上面式子(1)已经给出了前kc得分的tokens,这些都是al+1的候选token,kc可以等于8,16,32或者其他整数。我们假设al+1分别等于这些tokens,比如al+1=k,与q=[a1,a2,…,al]合并,得到新的序列[a1,a2,…,al,k],然后得到al+1=k的向量表征,记为hl+1,k。我们采用下面式子计算hl+1,k与之前的tokens的表征hl,hl-1,…,h1的语义相关性:
其中,Wr是随机初始化,然后通过训练过程学习得到的。hl+1,k与之前的tokens计算语义相关性总分,而总分数最高的hl+1,k对应的前两个token k将被选择为al+1的候选。选择kc大于beam size是因为通过相关性计算,可能排名会改变。
在本申请实施例中,添加了Wr参数矩阵可以计算hl+1,k的语义相关性而不是相似度,这样可以帮助模型选择更加合理的下一个token,而不是重复或者是无效的新token。
在实际应用中,医疗场景下一个需求量很大的应用就是回答用户的医学问题:比如:妊娠糖尿病是一过性的吗?常规的解码方式可能会生成如下效果:妊娠糖尿病(Gestational Diabetes Mellitus,GDM)通常是指中枢性、循环性、血尿,不仅以上述症状为患者的基本症状,还以糖尿病病史为首,因此,中枢性糖尿病患者往往被称为糖尿病的。而目前,糖尿病症状尚未明确。生成过程中,前后文语义不对应,而且最后结尾没有自然地结尾,无法很好的回答问题。通过我们的方法,回答会更加流畅,且呈现为一个整体的回答:“妊娠糖尿病(Gestational Diabetes Mellitus,GDM)通常是指在妊娠期间出现的高血糖状况。虽然妊娠糖尿病在许多情况下会在分娩后自行消失,但它并不是一过性的疾病。”。
在本实施例中,提供了一种文本生成装置200,包括:文本获取模块210,用于接收用户终端发送的待处理文本;预测模块220,用于将待处理文本输入至生成式语言模型进行预测操作,得到候选文本集;相关性计算模块230,用于分别对候选文本集中的各个候选文本进行语义相关性计算操作,得到候选语义相关性数据;筛选模块240,用于根据候选语义相关性数据的大小对候选文本进行筛选操作,得到预设数量目标候选文本;重复更新模块250,用于根据目标候选文本对待处理文本进行重复更新操作,得到更新后的待处理文本;目标文本获取模块260。与现有技术相比,本申请在应用于智能诊疗、远程会诊等场景时,可以帮助模型选择更加合理的下一个token,而不是重复或者是无效的新token,这样将会显著提升生成语言模型在智能诊疗、远程会诊等场景的表现。
在本实施例的一些可选的实现方式中,上述相关性计算模块230包括:相关性计算子模块,其中:
相关性计算子模块,用于根据语义相关计算公式计算候选文本与待处理文本的候选语义相关性数据,其中,候选语义相关性数据表示为:
其中,Wr表示随机初始化;hl+1,k表示候选文本的向量表征。
在本实施例的一些可选的实现方式中,Wr可以通过训练过程学习得到的,具体的,生成模型的训练一般是通过teacher forcing,针对公式(1)进行交叉熵的计算。为了计算Wr,我们对每一个batch中每个序列的最后一个tokens进行上述预测,并在优化目标中加上要求kc个tokens与序列之前的tokens的向量表征的语义相关性最大化。
在本实施例的一些可选的实现方式中,上述文本生成装置200还包括:词向量确定模块、第一特征表示向量确定模块、第二特征表示向量确定模块、分类结果确定模块、模型获取模块、语义分析模块,其中:
词向量确定模块,用于读取本地数据库,在所述本地数据库中获取样本文本,并确定所述样本文本中包含的每个分词,基于待训练的语义分析模型确定所述每个分词对应的词向量;
第一特征表示向量确定模块,用于在所述本地数据库中获取语义属性,根据所述待训练的语义分析模型中包含所述语义属性对应的注意力矩阵,以及所述每个分词对应的词向量,确定所述样本文本涉及所述语义属性的第一特征表示向量;
第二特征表示向量确定模块,用于根据所述待训练的语义分析模型中包含的用于表示不同语义属性之间的相关性的自注意力矩阵,以及所述第一特征表示向量,确定所述样本文本涉及所述语义属性的第二特征表示向量;
分类结果确定模块,用于根据所述待训练的语义分析模型以及所述第二特征表示向量,确定所述待训练的语义训练模型输出的分类结果,所述分类结果包括所述样本文本所属的语义属性以及所述样本文本所属的语义属性对应的情感极性;
模型获取模块,用于根据所述分类结果和所述样本文本预设的标注,对所述语义分析模型中的模型参数进行调整,得到训练好的语义分析模型;
语义分析模块,用于将所述目标文本输入至所述训练好的语义分析模型进行语义分析操作,得到目标文本语义。
在本实施例的一些可选的实现方式中,上述词向量确定模块具体包括:词向量确定子模块。其中:
词向量确定子模块,用于将每个分词输入至语义分析模型的语义表征层,得到语义表征层输出的每个分词分别对应的双向语义表示向量,作为每个分词对应的词向量。
在本实施例的一些可选的实现方式中,上述第一特征表示向量确定模块具体包括:属性表征子模块、注意力加权子模块以及第一特征表示向量确定子模块。其中:
属性表征子模块,用于将每个分词对应的词向量输入至语义分析模型中的属性表征层;
注意力加权子模块,用于通过属性表征层中包含的语义属性对应的注意力矩阵,对每个分词对应的词向量进行注意力加权,得到加权词向量;
第一特征表示向量确定子模块,用于基于加权词向量确定样本文本涉及语义属性的第一特征表示向量。
在本实施例的一些可选的实现方式中,上述第二特征表示向量确定模块具体包括:属性相关性表示子模块、自注意力加权子模块以及第二特征表示向量确定子模块。其中:
属性相关性表示子模块,用于将第一特征表示向量输入至语义分析模型中的属性相关性表示层;
自注意力加权子模块,用于通过属性相关性表示层中包含的用于表示不同语义属性之间的相关性的自注意力矩阵,对样本文本涉及每个语义属性的第一特征表示向量进行自注意力加权,得到加权特征表示向量;
第二特征表示向量确定子模块,用于基于加权特征表示向量确定样本文本涉及每个语义属性的第二特征表示向量。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图4,图4为本实施例计算机设备基本结构框图。
所述计算机设备6包括通过系统总线相互通信连接存储器61、处理器62、网络接口63。需要指出的是,图中仅示出了具有组件61-63的计算机设备6,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable GateArray,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器61至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器61可以是所述计算机设备6的内部存储单元,例如该计算机设备6的硬盘或内存。在另一些实施例中,所述存储器61也可以是所述计算机设备6的外部存储设备,例如该计算机设备6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。当然,所述存储器61还可以既包括所述计算机设备6的内部存储单元也包括其外部存储设备。本实施例中,所述存储器61通常用于存储安装于所述计算机设备6的操作系统和各类应用软件,例如文本生成方法的计算机可读指令等。此外,所述存储器61还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器62在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器62通常用于控制所述计算机设备6的总体操作。本实施例中,所述处理器62用于运行所述存储器61中存储的计算机可读指令或者处理数据,例如运行所述文本生成方法的计算机可读指令。
所述网络接口63可包括无线网络接口或有线网络接口,该网络接口63通常用于在所述计算机设备6与其他电子设备之间建立通信连接。
本申请提供的计算机设备,在应用于智能诊疗、远程会诊等场景时,可以帮助模型选择更加合理的下一个token,而不是重复或者是无效的新token,这样将会显著提升生成语言模型在智能诊疗、远程会诊等场景的表现。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至少一个处理器执行,以使所述至少一个处理器执行如上述的文本生成方法的步骤。
本申请提供的计算机可读存储介质,在应用于智能诊疗、远程会诊等场景时,可以帮助模型选择更加合理的下一个token,而不是重复或者是无效的新token,这样将会显著提升生成语言模型在智能诊疗、远程会诊等场景的表现。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

Claims (10)

1.一种文本生成方法,其特征在于,包括下述步骤:
接收用户终端发送的待处理文本;
将所述待处理文本输入至生成式语言模型进行预测操作,得到候选文本集;
分别对所述候选文本集中的各个候选文本进行语义相关性计算操作,得到候选语义相关性数据;
根据所述候选语义相关性数据的大小对所述候选文本进行筛选操作,得到预设数量目标候选文本;
根据所述目标候选文本对所述待处理文本进行重复更新操作,得到更新后的待处理文本;
根据所述预测操作、所述语义相关性计算操作以及所述筛选操作对所述更新后的待处理文本进行重复更新操作,直至候选文本为结束符号为止,得到目标文本。
2.根据权利要求1所述的文本生成方法,其特征在于,所述分别对所述候选文本集中的各个候选文本进行语义相关性计算操作,得到候选语义相关性数据的步骤,具体包括下述步骤:
根据语义相关计算公式计算所述候选文本与所述待处理文本的所述候选语义相关性数据,其中,所述候选语义相关性数据表示为:
其中,Wr表示随机初始化;hl+1,表示所述候选文本的向量表征。
3.根据权利要求1所述的文本生成方法,其特征在于,在所述根据所述预测操作、所述语义相关性计算操作以及所述筛选操作对所述更新后的待处理文本进行重复更新操作,直至候选文本为结束符号为止,得到目标文本的步骤之后,还包括下述步骤:
读取本地数据库,在所述本地数据库中获取样本文本,并确定所述样本文本中包含的每个分词,基于待训练的语义分析模型确定所述每个分词对应的词向量;
在所述本地数据库中获取语义属性,根据所述待训练的语义分析模型中包含所述语义属性对应的注意力矩阵,以及所述每个分词对应的词向量,确定所述样本文本涉及所述语义属性的第一特征表示向量;
根据所述待训练的语义分析模型中包含的用于表示不同语义属性之间的相关性的自注意力矩阵,以及所述第一特征表示向量,确定所述样本文本涉及所述语义属性的第二特征表示向量;
根据所述待训练的语义分析模型以及所述第二特征表示向量,确定所述待训练的语义训练模型输出的分类结果,所述分类结果包括所述样本文本所属的语义属性以及所述样本文本所属的语义属性对应的情感极性;
根据所述分类结果和所述样本文本预设的标注,对所述语义分析模型中的模型参数进行调整,得到训练好的语义分析模型;
将所述目标文本输入至所述训练好的语义分析模型进行语义分析操作,得到目标文本语义。
4.根据权利要求3所述的文本生成方法,其特征在于,所述基于待训练的语义分析模型确定所述每个分词对应的词向量的步骤,具体包括:
将所述每个分词输入至所述语义分析模型的语义表征层,得到所述语义表征层输出的所述每个分词分别对应的双向语义表示向量,作为所述每个分词对应的词向量。
5.根据权利要求3所述的文本生成方法,其特征在于,所述在所述本地数据库中获取语义属性,根据所述待训练的语义分析模型中包含所述语义属性对应的注意力矩阵,以及所述每个分词对应的词向量,确定所述样本文本涉及所述语义属性的第一特征表示向量的步骤,具体包括:
将所述每个分词对应的词向量输入至所述语义分析模型中的属性表征层;
通过所述属性表征层中包含的所述语义属性对应的注意力矩阵,对所述每个分词对应的词向量进行注意力加权,得到加权词向量;
基于所述加权词向量确定所述样本文本涉及所述语义属性的所述第一特征表示向量。
6.根据权利要求3所述的文本生成方法,其特征在于,所述根据所述待训练的语义分析模型中包含的用于表示不同语义属性之间的相关性的自注意力矩阵,以及所述第一特征表示向量,确定所述样本文本涉及所述语义属性的第二特征表示向量的步骤,具体包括:
将所述第一特征表示向量输入至所述语义分析模型中的属性相关性表示层;
通过所述属性相关性表示层中包含的用于表示不同语义属性之间的相关性的自注意力矩阵,对所述样本文本涉及每个语义属性的第一特征表示向量进行自注意力加权,得到加权特征表示向量;
基于所述加权特征表示向量确定所述样本文本涉及每个语义属性的第二特征表示向量。
7.一种文本生成装置,其特征在于,包括:
文本获取模块,用于接收用户终端发送的待处理文本;
预测模块,用于将所述待处理文本输入至生成式语言模型进行预测操作,得到候选文本集;
相关性计算模块,用于分别对所述候选文本集中的各个候选文本进行语义相关性计算操作,得到候选语义相关性数据;
筛选模块,用于根据所述候选语义相关性数据的大小对所述候选文本进行筛选操作,得到预设数量目标候选文本;
重复更新模块,用于根据所述目标候选文本对所述待处理文本进行重复更新操作,得到更新后的待处理文本;
目标文本获取模块,用于根据所述预测操作、所述语义相关性计算操作以及所述筛选操作对所述更新后的待处理文本进行重复更新操作,直至候选文本为结束符号为止,得到目标文本。
8.根据权利要求7所述的文本生成装置,其特征在于,所述相关性计算模块包括:
相关性计算子模块,用于根据语义相关计算公式计算所述候选文本与所述待处理文本的所述候选语义相关性数据,其中,所述候选语义相关性数据表示为:
其中,Wr表示随机初始化;hl+1,表示所述候选文本的向量表征。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至6中任一项所述的文本生成方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至6中任一项所述的文本生成方法的步骤。
CN202310799487.3A 2023-06-30 2023-06-30 一种文本生成方法、装置、计算机设备及存储介质 Pending CN116796709A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310799487.3A CN116796709A (zh) 2023-06-30 2023-06-30 一种文本生成方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310799487.3A CN116796709A (zh) 2023-06-30 2023-06-30 一种文本生成方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN116796709A true CN116796709A (zh) 2023-09-22

Family

ID=88041505

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310799487.3A Pending CN116796709A (zh) 2023-06-30 2023-06-30 一种文本生成方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN116796709A (zh)

Similar Documents

Publication Publication Date Title
CN111444340B (zh) 文本分类方法、装置、设备及存储介质
CN112131366B (zh) 训练文本分类模型及文本分类的方法、装置及存储介质
CN112069302B (zh) 会话意图识别模型的训练方法、会话意图识别方法及装置
CN113420807A (zh) 基于多任务学习与注意力机制的多模态融合情感识别系统、方法及实验评价方法
CN112231569B (zh) 新闻推荐方法、装置、计算机设备及存储介质
CN112287069B (zh) 基于语音语义的信息检索方法、装置及计算机设备
WO2021218028A1 (zh) 基于人工智能的面试内容精炼方法、装置、设备及介质
CN113239169A (zh) 基于人工智能的回答生成方法、装置、设备及存储介质
CN111985243B (zh) 情感模型的训练方法、情感分析方法、装置及存储介质
CN113707299A (zh) 基于问诊会话的辅助诊断方法、装置及计算机设备
CN113657105A (zh) 基于词汇增强的医学实体抽取方法、装置、设备及介质
CN113505601A (zh) 一种正负样本对构造方法、装置、计算机设备及存储介质
CN115114407B (zh) 意图识别方法、装置、计算机设备及存储介质
CN114358023B (zh) 智能问答召回方法、装置、计算机设备及存储介质
CN115438149A (zh) 一种端到端模型训练方法、装置、计算机设备及存储介质
CN116796857A (zh) 一种llm模型训练方法、装置、设备及其存储介质
CN115757731A (zh) 对话问句改写方法、装置、计算机设备及存储介质
CN116932731B (zh) 面向5g消息的多模态知识问答方法及系统
CN112199954B (zh) 基于语音语义的疾病实体匹配方法、装置及计算机设备
CN114282528A (zh) 一种关键词提取方法、装置、设备及存储介质
CN116701593A (zh) 基于GraphQL的中文问答模型训练方法及其相关设备
CN116975221A (zh) 文本阅读理解方法、装置、设备及存储介质
CN116881446A (zh) 一种语义分类方法、装置、设备及其存储介质
CN116796709A (zh) 一种文本生成方法、装置、计算机设备及存储介质
CN113515935A (zh) 一种标题生成方法、装置、终端及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination