CN115862794A - 病历文本生成方法、装置、计算机设备及存储介质 - Google Patents
病历文本生成方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN115862794A CN115862794A CN202111120031.7A CN202111120031A CN115862794A CN 115862794 A CN115862794 A CN 115862794A CN 202111120031 A CN202111120031 A CN 202111120031A CN 115862794 A CN115862794 A CN 115862794A
- Authority
- CN
- China
- Prior art keywords
- text
- medical record
- sample
- character
- dialogue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请实施例公开了一种病历文本生成方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取多个第一样本数据,第一样本数据包括样本对话文本和样本对话文本对应的样本病历文本,多个第一样本数据中,存在多种格式的样本对话文本;基于多个第一样本数据,训练病历生成模型;调用病历生成模型,根据采集到的第一对话文本,生成第一对话文本对应的病历文本。由于病历生成模型能够学习到如何根据各种格式的对话文本生成对应的病历文本,提高了病历生成模型的通用性,因此能够调用病历生成模型根据任一格式的对话文本生成对应的病历文本,从而提高了自动生成病历文本的通用性。
Description
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种病历文本生成方法、装置、计算机设备及存储介质。
背景技术
问诊是指医生通过与患者进行沟通,了解患者病情的过程。通常医生在问诊之后,可以将患者的病情整理成病历文本,以便于后续根据病历文本随时查阅患者的病情。
相关技术中,将问诊过程中产生的对话文本进行结构化处理,得到固定格式的医疗数据,调用病历生成模型对该医疗数据进行处理,得到固定格式的病历文本。但是,由于对话文本的类型繁多,会存在一些难以结构化处理的对话文本,导致无法调用上述病历生成模型进行处理,因此该病历文本生成方法的通用性较差。
发明内容
本申请实施例提供了一种病历文本生成方法、装置、计算机设备及存储介质,能够提高病历文本生成方法的通用性。所述技术方案如下:
一方面,提供了一种病历文本生成方法,所述方法包括:
获取多个第一样本数据,所述第一样本数据包括样本对话文本和所述样本对话文本对应的样本病历文本,其中多个所述第一样本数据中,存在多种格式的样本对话文本;
基于多个所述第一样本数据,训练病历生成模型,所述病历生成模型用于根据所述多种格式中任一格式的对话文本生成对应的病历文本;
调用所述病历生成模型,根据采集到的第一对话文本,生成所述第一对话文本对应的病历文本。
另一方面,提供了一种病历文本生成装置,所述装置包括:
数据获取模块,用于获取多个第一样本数据,所述第一样本数据包括样本对话文本和所述样本对话文本对应的样本病历文本,其中多个所述第一样本数据中,存在多种格式的样本对话文本;
模型训练模块,用于基于多个所述第一样本数据,训练病历生成模型,所述病历生成模型用于根据所述多种格式中任一格式的对话文本生成对应的病历文本;
病历生成模块,用于调用所述病历生成模型,根据采集到的第一对话文本,生成所述第一对话文本对应的病历文本。
可选地,所述模型训练模块,包括:
样本信息确定单元,用于基于候选字符集合和所述样本病历文本,确定所述样本病历文本对应的样本特征信息,所述候选字符集合包括多个候选字符,所述样本特征信息表示每个所述候选字符属于所述样本病历文本的可能性;
预测信息确定单元,用于调用所述病历生成模型,对所述样本对话文本进行处理,得到预测特征信息,所述预测特征信息表示每个所述候选字符属于所述样本对话文本对应的预测病历文本的可能性;
模型训练单元,用于基于所述样本特征信息和所述预测特征信息,训练所述病历生成模型。
可选地,所述病历生成模型包括特征提取网络、编码网络和解码网络,所述预测信息确定单元,用于:
调用所述特征提取网络,对所述样本对话文本进行特征提取,得到所述样本对话文本中的每个对话语句对应的预测文本特征;
调用所述编码网络,对得到的多个预测文本特征进行融合编码,得到预测融合特征;
调用所述解码网络,基于所述预测融合特征进行解码,得到所述预测特征信息。
可选地,所述预测特征信息包括所述预测病历文本中的多个位置对应的预测子信息,所述预测子信息包括每个所述候选字符对应的预测特征值,所述预测特征值表示所述候选字符属于所述预测病历文本中对应位置上的字符的可能性;
所述预测信息确定单元,用于:
调用所述解码网络,对所述预测融合特征进行解码,得到第一预测子信息,将所述第一预测子信息中最大的预测特征值对应的候选字符确定为第一预测字符;
继续调用所述解码网络,根据已经得到的预测字符,对所述预测融合特征进行解码,得到第二预测子信息,将所述第二预测子信息中最大的预测特征值对应的候选字符确定为第二预测字符,直至得到的预测字符为第一标志字符,所述第一标志字符用于表示病历文本的结尾。
可选地,所述样本特征信息包括所述样本病历文本中的多个位置对应的样本子信息,所述样本子信息表示每个所述候选字符属于所述样本病历文本中对应位置上的字符的可能性,所述预测特征信息包括所述预测病历文本中的多个位置对应的预测子信息,所述预测子信息表示每个所述候选字符属于所述预测病历文本中对应位置上的字符的可能性;
所述模型训练单元,用于:
基于每个所述位置对应的所述预测子信息与所述样本子信息之间的差异,确定每个所述位置对应的损失分量;
基于多个所述损失分量,确定损失值,所述损失值与多个所述损失分量正相关;
基于所述损失值,训练所述病历生成模型。
可选地,所述病历生成模块,包括:
字符确定单元,用于调用所述病历生成模型,对所述第一对话文本进行识别,得到特征信息,根据所述特征信息,在候选字符集合中的多个候选字符中确定属于所述病历文本的多个目标字符,所述特征信息表示每个所述候选字符属于所述第一对话文本对应的病历文本的可能性;
字符拼接单元,用于将每个所述目标字符进行拼接,得到所述病历文本。
可选地,所述病历生成模型包括特征提取网络、编码网络和解码网络,所述字符确定单元,用于:
调用所述特征提取网络,对所述第一对话文本进行特征提取,得到所述第一对话文本中的每个对话语句对应的文本特征;
调用所述编码网络,对得到的多个文本特征进行融合编码,得到融合特征;
调用所述解码网络,基于所述融合特征进行解码,得到所述特征信息,根据所述特征信息,在多个所述候选字符中确定属于所述病历文本的多个所述目标字符。
可选地,所述特征信息包括所述病历文本中的多个位置对应的子信息,所述子信息包括每个所述候选字符对应的特征值,所述特征值表示所述候选字符属于所述病历文本中对应位置上的字符的可能性;
所述字符确定单元,用于:
调用所述解码网络,对所述融合特征进行解码,得到第一子信息,将所述第一子信息中最大的特征值对应的候选字符确定为第一目标字符;
继续调用所述解码网络,根据已经得到的目标字符,对所述融合特征进行解码,得到第二子信息,将所述第二子信息中最大的特征值对应的候选字符确定为第二目标字符,直至得到的目标字符为第一标志字符,所述第一标志字符用于表示病历文本的结尾。
可选地,所述特征信息包括所述病历文本中的多个位置对应的子信息,所述子信息包括每个所述候选字符对应的特征值,所述特征值表示所述候选字符属于所述病历文本中对应位置上的字符的可能性;
所述字符确定单元,用于:
调用所述解码网络,分别根据不同的字符,对所述融合特征进行解码,得到多个所述特征信息,对于每个所述特征信息,将所述特征信息中的每个子信息中最大的特征值对应的候选字符确定为目标字符,将得到的多个目标字符确定为所述特征信息对应的目标字符集合;
确定每个所述目标字符集合对应的联合特征值,所述联合特征值与所述目标字符集合中的多个目标字符对应的特征值正相关;
在多个所述目标字符集合中,选取联合特征值最大的所述目标字符集合中的多个目标字符。
可选地,所述字符确定单元,用于:
所述特征信息的数量为目标数量,调用所述解码网络,对所述融合特征进行解码,得到第一子信息,将所述第一子信息中最大的目标数量个特征值对应的候选字符分别确定为第一目标字符;
对于每个所述第一目标字符,继续调用所述解码网络,根据所述第一目标字符,对所述融合特征进行解码,得到第二子信息,将所述第二子信息中最大的特征值对应的候选字符确定为第二目标字符,将所述第二目标字符添加至所述第一目标字符所在的目标字符集合,直至得到的目标字符为第一标志字符,将所述第一标志字符添加至所述第一目标字符所在的目标字符集合,其中,所述第一标志字符用于表示病历文本的结尾,每个所述第一目标字符位于不同的目标字符集合中。
可选地,所述第一对话文本中包括第二标志字符,所述第二标志字符用于表示对话语句的结尾,所述字符确定单元,用于:
调用所述特征提取网络,识别所述第一对话文本中的第二标志字符,将第一个所述第二标志字符之前的字符确定为一个所述对话语句,将每两个所述第二标志字符之间的字符确定为一个所述对话语句;
调用所述特征提取网络,分别对每个所述对话语句进行特征提取,得到每个所述对话语句对应的所述文本特征。
可选地,所述装置还包括文本处理模块,用于对采集到的第二对话文本进行以下至少一项处理,得到所述第一对话文本:
删除所述第二对话文本中与其他字符重复的字符;
删除所述第二对话文本中属于语气词的字符;
删除所述第二对话文本中的敏感字符。
可选地,所述装置还包括:
界面显示模块,用于显示问诊对话界面,获取在所述问诊对话界面中输入的多个对话语句;
文本确定模块,用于将获取到的多个对话语句构成所述第一对话文本。
可选地,所述数据获取模块,包括:
数据获取单元,用于获取多个第二样本数据,所述第二样本数据包括所述样本对话文本和所述样本对话文本对应的样本病历数据,所述样本病历数据包括至少两个标题以及每个标题对应的正文,其中多个所述第二样本数据中,存在多种格式的样本对话文本;
文本组合单元,用于对于每个所述第二样本数据,按照所述样本病历数据中的至少两个标题,将所述样本病历数据拆分成至少两个样本病历文本,每个所述样本病历文本包括一个标题对应的正文,将所述样本对话文本与至少两个所述样本病历文本分别组合,得到至少两个所述第一样本数据。
可选地,所述模型训练模块,用于分别基于与同一个标题对应的多个所述第一样本数据,训练一个所述病历生成模型,得到至少两个所述病历生成模型。
可选地,所述病历生成模块,包括:
正文确定单元,用于分别调用至少两个所述病历生成模型,根据所述第一对话文本,生成每个标题对应的正文;
正文组合单元,用于将生成的至少两个正文与至少两个标题进行组合,得到所述第一对话文本对应的病历文本。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现如上述方面所述的病历文本生成方法所执行的操作。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行以实现如上述方面所述的病历文本生成方法所执行的操作。
另一方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序由处理器加载并执行,以实现如上述方面所述的病历文本生成方法中所执行的操作。
本申请实施例提供的方法、装置、计算机设备及存储介质,采用多种格式的样本对话文本以及对应的病历文本对病历生成模型进行训练,使得病历生成模型能够学习到如何根据各种格式的对话文本生成对应的病历文本,提高了病历生成模型的通用性,因此能够调用病历生成模型根据任一格式的对话文本生成对应的病历文本,从而提高了自动生成病历文本的通用性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种实施环境的示意图;
图2是本申请实施例提供的一种病历文本生成方法的流程图;
图3是本申请实施例提供的一种病历文本生成方法的流程图;
图4是本申请实施例提供的一种融合编码方法的示意图;
图5是本申请实施例提供的一种解码方法的示意图;
图6是本申请实施例提供的一种病历文本生成方法的流程图;
图7是本申请实施例提供的一种目标字符生成方法的流程图;
图8是本申请实施例提供的一种生成特征信息的示意图;
图9是本申请实施例提供的一种病历文本的示意图;
图10是本申请实施例提供的一种病历文本生成方法的流程图;
图11是本申请实施例提供的一种病历文本生成方法的示意图;
图12是本申请实施例提供的一种病历文本生成装置的结构示意图;
图13是本申请实施例提供的另一种病历文本生成装置的结构示意图;
图14是本申请实施例提供的一种终端的结构示意图;
图15是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种概念,但除非特别说明,这些概念不受这些术语限制。这些术语仅用于将一个概念与另一个概念区分。举例来说,在不脱离本申请的范围的情况下,可以将第一样本数据称为第二样本数据,且类似地,可将第二样本数据称为第一样本数据。
其中,至少一个是指一个或者一个以上,例如,至少一个样本数据可以是一个样本数据、两个样本数据、三个样本数据等任一大于等于一的整数个样本数据。多个是指两个或者两个以上,例如,多个样本数据可以是两个样本数据、三个样本数据等任一大于等于二的整数个样本数据。每个是指至少一个中的每一个,例如,每个样本数据是指多个样本数据中的每一个样本数据,若多个样本数据为3个样本数据,则每个样本数据是指3个样本数据中的每一个样本数据。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
自然语言处理(Nature Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
以下将基于人工智能技术以及自然语言处理技术,对本申请实施例提供的病历文本生成方法进行说明。
本申请实施例提供的病历文本生成方法,能够用于计算机设备中。可选地,该计算机设备为终端或服务器。可选地,该服务器是独立的物理服务器,或者,是多个物理服务器构成的服务器集群或者分布式系统,或者,是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器。可选地,该终端是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能终端等,但并不局限于此。
在一种可能实现方式中,本申请实施例所涉及的计算机程序可被部署在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备能够组成区块链系统。
在一种可能实现方式中,本申请实施例中用于训练病历生成模型的计算机设备是区块链系统中的节点,该节点能够将训练的病历生成模型存储在区块链中,之后该节点或者该区块链中的其他设备对应的节点可调用该病历生成模型根据对话文本生成对应的病历文本。
图1是本申请实施例提供的一种实施环境的示意图,参见图1,该实施环境包括:终端101和服务器102。终端101和服务器102之间通过无线或有线网络连接。可选地,服务器102用于采用本申请实施例提供的方法,训练病历生成模型,该病历生成模型用于根据对话文本生成对应的病历文本。服务器102将训练好的病历生成模型发送给终端101,终端101即可调用该病历生成模型,根据任一对话文本生成对应的病历文本。
在一种可能实现方式中,终端101中运行有该服务器提供的应用客户端,服务器102将训练好的病历生成模型存储于该应用客户端中,该应用客户端具有病历生成功能。终端101基于该应用客户端,调用病历生成模型,根据任一对话文本生成对应的病历文本。
需要说明的是,图1中仅以服务器102训练病历生成模型并发送给终端101为例进行说明,在另一实施例中,还可以由终端101直接训练病历生成模型。
图2是本申请实施例提供的一种病历文本生成方法的流程图。本申请实施例的执行主体为计算机设备,参见图2,该方法包括:
201、计算机设备获取多个第一样本数据。
第一样本数据包括样本对话文本和样本对话文本对应的样本病历文本。样本对话文本是指在问诊过程中所产生的对话文本,该样本对话文本包括多个对话语句,例如样本对话文本包括医生的问题语句和患者的回答语句等。该样本对话文本对应的样本病历文本是指对样本对话文本进行提炼所得到的、能够反映样本对话文本的内容的文本,例如该样本病历文本为能够反映患者的病情的文本。
其中,每个第一样本数据包括一个样本对话文本和该样本对话文本对应的样本病历文本。该多个第一样本数据中,存在多种格式的样本对话文本,样本对话文本的格式可以由样本对话文本的内容所属的维度表示,例如样本对话文本的内容包括患者的年龄、性别、病史、治疗经过、当前症状等多种维度的内容。
202、计算机设备基于多个第一样本数据,训练病历生成模型。
计算机设备基于该多个第一样本数据中的样本对话文本和样本病历文本,对病历生成模型进行多次迭代训练,得到训练后的病历生成模型。其中,在每个迭代训练过程中,计算机设备基于该多个第一样本数据中的至少一个第一样本数据,训练该病历生成模型。
由于本申请实施例采用了多种格式的样本对话文本以及对应的病历文本对病历生成模型进行训练,使得病历生成模型能够学习到如何根据各种格式的对话文本生成对应的病历文本,因此训练后的病历生成模型用于根据多种格式中任一格式的对话文本生成对应的病历文本,从而提高了病历生成模型的通用性。
203、计算机设备调用病历生成模型,根据采集到的第一对话文本,生成第一对话文本对应的病历文本。
计算机设备采集任一格式的第一对话文本,由于该病历生成模型具有通用性,因此计算机设备调用病历生成模型,根据该第一对话文本,生成该第一对话文本对应的病历文本。
其中,该病历文本用于反映第一对话文本的内容,例如病历文本包括主诉、现病史、既往史、个人史、家族史和过敏史等内容,后续通过查阅该病历文本,能够确定患者的情况。
本申请实施例提供的方法,采用多种格式的样本对话文本以及对应的病历文本对病历生成模型进行训练,使得病历生成模型能够学习到如何根据各种格式的对话文本生成对应的病历文本,提高了病历生成模型的通用性,因此能够调用病历生成模型根据任一格式的对话文本生成对应的病历文本,从而提高了自动生成病历文本的通用性。
图3是本申请实施例提供的一种病历文本生成方法的流程图。本申请实施例的执行主体为计算机设备,参见图3,该方法包括:
301、计算机设备获取多个第一样本数据。
第一样本数据包括样本对话文本和样本对话文本对应的样本病历文本,其中多个第一样本数据中,存在多种格式的样本对话文本。
该样本对话文本包括多个对话语句,例如样本对话文本包括医生的问题语句和患者的回答语句等。该样本对话文本对应的样本病历文本是指对样本对话文本进行提炼所得到的、能够反映样本对话文本的内容的文本。
在一种可能实现方式中,计算机设备获取历史对话文本以及历史对话文本对应的历史病历文本,其中该历史病历文本是该历史对话文本对应的真实文本,例如该历史病历文本是由医护人员根据历史对话文本所创建的病历文本。计算机设备将该历史对话文本确定为样本对话文本,将该历史病历文本确定为样本病历文本,将样本对话文本和该样本病历文本确定为一个第一样本数据。
需要说明的是,该多个第一样本数据用于训练病历生成模型,计算机设备基于该多个第一样本数据中的样本对话文本和样本病历文本,对病历生成模型进行多次迭代训练,得到训练后的病历生成模型。其中,在每个迭代训练过程中,计算机设备基于该多个第一样本数据中的至少一个第一样本数据,训练该病历生成模型。下述步骤302-306,仅以在一次迭代训练过程中,基于一个第一样本数据进行训练为例来说明。
302、计算机设备基于候选字符集合和样本病历文本,确定样本病历文本对应的样本特征信息。
在一次迭代训练过程中,计算机设备在多个第一样本数据中,获取一个第一样本数据,并获取候选字符集合。计算机设备基于候选字符集合以及该第一样本数据中的样本病历文本,确定该样本病历文本对应的样本特征信息。其中,候选字符集合包括多个候选字符,样本特征信息表示每个候选字符属于样本病历文本的可能性。
在一种可能实现方式中,对于候选字符集合中的每个候选字符,计算机设备确定该候选字符是否属于该样本病历文本中的字符,如果该候选字符属于该样本病历文本中的字符,将第一特征值确定为该候选字符对应的特征值,如果该候选字符不属于该样本病历文本中的字符,将第二特征值确定为该候选字符对应的特征值,计算机设备将每个候选字符对应的特征值,确定为该样本特征信息。例如,该第一特征值为1,该第二特征值为0。
在另一种可能实现方式中,样本特征信息包括样本病历文本中的多个位置对应的样本子信息,样本子信息表示每个候选字符属于样本病历文本中对应位置上的字符的可能性。
例如,对于样本病历文本中的每个位置,计算机设备确定每个候选字符是否属于该位置上的字符,如果候选字符属于该位置上的字符,将第一特征值确定为该候选字符对应的特征值,如果该候选字符不属于该位置上的字符,将第二特征值确定为该候选字符对应的特征值,计算机设备将每个候选字符对应的特征值,确定为该位置对应的样本子信息,从而得到每个位置对应的样本子信息。计算机设备将多个位置对应的样本子信息,确定为该样本病历文本对应的样本特征信息。
303、计算机设备调用病历生成模型中的特征提取网络,对样本对话文本进行特征提取,得到样本对话文本中的每个对话语句对应的预测文本特征。
本申请实施例中,病历生成模型包括特征提取网络,该特征提取网络用于对对话文本进行特征提取。计算机设备获取第一样本数据中的样本对话文本,该样本对话文本中包括多个对话语句,调用该特征提取网络,对该样本对话文本进行特征提取,得到该样本对话文本中的每个对话语句对应的预测文本特征,从而得到多个预测文本特征。其中,对话语句对应的预测文本特征用于表示该对话语句的语义。
在一种可能实现方式中,样本对话文本中包括第二标志字符,第二标志字符用于表示对话语句的结尾。计算机设备调用特征提取网络,识别样本对话文本中的第二标志字符,将第一个第二标志字符之前的字符确定为一个对话语句,将每两个第二标志字符之间的字符确定为一个对话语句。计算机设备调用特征提取网络,分别对每个对话语句进行特征提取,得到每个对话语句对应的预测文本特征。
计算机设备调用特征提取网络,识别样本对话文本中的第二标志字符,将第一个第二标志字符之前的字符确定为一个对话语句,将第一个第二标志字符与第二个第二标志字符之间的字符确定为一个对话语句,将第二个标志字符与第三个标志字符之间的字符确定为一个对话语句,以此类推,从而识别出样本对话文本中的每个对话语句。可选地,该第二标志字符为预先设置的字符,例如该第二标志字符为“[SEP]”。
可选地,该样本对话文本还包括第三标志字符,该第三标志字符用于表示样本对话文本的开头。则计算机设备将该第三标志字符与第三标志字符之后的第一个第二标志字符之间的字符确定为一个对话语句。可选地,该第三标志字符为预先设置的字符,例如该第三标志字符为“[CLS]”。例如,该样本对话文本为“[CLS]对话语句1[SEP]对话语句2[SEP]对话语句3[SEP]对话语句4[SEP]”。
可选地,该样本对话文本还包括第四标志字符,该第四标志字符用于表示对话语句的开头。则计算机设备将每个第四标志字符与该第四标志字符之后的第一个第二标志字符之间的字符确定为一个对话语句。可选地,该第四标志字符为预先设置的字符,例如该第四标志字符为“[CLS]”。
在一种可能实现方式中,特征提取网络包括特征提取层和特征编码层,计算机设备调用特征提取层,分别对样本对话文本中的每个对话语句进行特征提取,得到每个对话语句对应的独热编码特征,对每个对话语句对应的独热编码特征进行特征编码,得到每个对话语句对应的预测文本特征。其中,独热编码特征又称为1位有效编码特征,是指利用N位状态寄存器来对N个状态进行编码,每个状态对应有独立的寄存器位,并且每个独热编码特征中仅有1位寄存器位有效。本申请实施例中的独热编码特征用于表示对话语句的语义。可选地,该特征编码层为预训练好的特征编码层,用于对独热编码特征进行向量化和特征化处理,得到文本特征,例如该特征编码层是通过重建经过旋转、删除、替换等操作的文本得到的。
304、计算机设备调用病历生成模型中的编码网络,对得到的多个预测文本特征进行融合编码,得到预测融合特征。
本申请实施例中,病历生成模型还包括编码网络,该编码网络用于对多个文本特征进行融合编码。计算机设备得到多个预测文本特征,调用该编码网络,对该多个预测文本特征进行融合编码,得到预测融合编码,该预测融合编码用于表示样本对话文本的语义。
在一种可能实现方式中,计算机设备调用编码网络对该多个预测文本特征进行融合编码的过程,可由下述公式表示:
h=ENC(x1,x2,…,xi);
其中,x1表示样本对话文本中的第一个对话语句对应的预测文本特征,x2表示样本对话文本中的第二个对话语句对应的预测文本特征,以此类推,该样本对话文本中包括i个对话语句,xi表示样本对话文本中的第i个对话语句,i为大于2的正整数。ENC表示编码网络,h表示预测融合特征。
图4是本申请实施例提供的一种融合编码方法的示意图,如图4所示,样本对话文本401中包括医生与患者之间的对话语句,计算机设备调用特征提取网络中的特征提取层,对样本对话文本401进行特征提取,得到每个对话语句对应的独热编码特征402,计算机设备调用特征提取网络中的特征编码层,对每个对话语句对应的独热编码特征402进行特征编码,得到每个对话语句对应的预测文本特征403,计算机设备调用编码网络404对多个预测文本特征403进行融合编码,得到样本对话文本401对应的融合特征405。
305、计算机设备调用病历生成模型中的解码网络,基于预测融合特征进行解码,得到预测特征信息。
本申请实施例中,病历生成模型还包括解码网络,该解码网络用于对预测融合特征进行解码。计算机设备得到样本对话文本对应的预测融合特征后,调用该解码网络,基于该预测融合特征进行解码,得到该样本对话文本对应的预测特征信息。其中,该预测特征信息是用于生成预测病历文本的信息,该预测特征信息表示候选字符集合中的每个候选字符属于样本对话文本对应的预测病历文本的可能性。
由于预测特征信息表示候选字符属于预测病历文本的可能性,因此根据预测特征信息能够确定预测病历文本中包括哪些字符,可以理解为,样本对话文本对应得到预测病历文本是由预测特征信息来确定的。
在一种可能实现方式中,预测特征信息包括预测病历文本中的多个位置对应的预测子信息,预测子信息包括每个候选字符对应的预测特征值,预测特征值表示候选字符属于预测病历文本中对应位置上的字符的可能性。
则计算机设备调用解码网络,基于预测融合特征进行解码,得到预测特征信息,包括:调用解码网络,对预测融合特征进行解码,得到第一预测子信息,将第一预测子信息中最大的预测特征值对应的候选字符确定为第一预测字符;继续调用解码网络,根据已经得到的预测字符,对预测融合特征进行解码,得到第二预测子信息,将第二预测子信息中最大的预测特征值对应的候选字符确定为第二预测字符,直至得到的预测字符为第一标志字符,第一标志字符用于表示病历文本的结尾。
计算机设备调用解码网络,对预测融合特征进行解码,得到第一预测子信息,该第一预测子信息是预测病历文本中的第一个位置对应的预测子信息,该第一预测子信息包括每个候选字符对应的预测特征值,候选字符对应的预测特征值表示该候选字符属于该第一个位置上的字符的可能性。因此,计算机设备在该第一预测子信息中确定最大的预测特征值,该最大的预测特征值对应的候选字符属于该第一个位置上的字符的可能性最大,因此计算机设备将该最大的预测特征值对应的候选字符确定为预测病历文本中的第一预测字符,也即是该预测病历文本中的第一个位置上的预测字符。
计算机设备确定第一预测字符后,继续调用解码网络,根据已经得到的预测字符,也即是根据该第一预测字符,对预测融合特征进行解码,得到第二预测子信息,该第二预测子信息是预测病历文本中的第二个位置对应的预测子信息,该第二预测子信息包括每个候选字符对应的预测特征值,候选字符对应的预测特征值表示该候选字符属于该第二个位置上的字符的可能性。因此,计算机设备在该第二预测子信息中确定最大的预测特征值,该最大的预测特征值对应的候选字符属于该第二个位置上的字符的可能性最大,因此计算机设备将该最大的预测特征值对应的候选字符确定为预测病历文本中的第二预测字符,也即是该预测病历文本中的第二个位置上的预测字符。
计算机设备确定第二预测字符后,继续调用解码网络,根据已经得到的预测字符,也即是根据该第一预测字符和第二预测字符,对预测融合特征进行解码,得到第三预测子信息,与上述步骤同理,计算机设备将该第三预测子信息中最大的预测特征值对应的候选字符确定为预测病历文本中的第三预测字符,也即是该预测病历文本中的第三个位置上的预测字符。
以此类推,计算机设备每次都根据已经得到的预测字符,对预测融合特征进行解码,得到下一个预测字符,直至得到的预测字符为第一标志字符,该第一标志字符用于表示病历文本的结尾,因此如果预测字符为第一标志字符,说明已经得到了病历文本中的每个字符,则计算机设备无需再继续对预测融合特征进行解码。
可选地,计算机设备获取已经得到的至少一个预测字符,对该至少一个预测字符进行特征提取,得到字符特征,该字符特征表示该至少一个预测字符的语义。计算机设备调用解码网络,对融合特征和字符特征进行解码,得到下一个预测子信息。
可选地,每个预测子信息中的预测特征值分别为候选字符对应的预测概率,计算机设备生成预测字符的过程,可由以下公式表示:
ykmax=argmaxp(ykx|y<k,h);
其中,ykmax表示第k个位置对应的预测字符,ykx表示第k个位置对应的第x个候选字符,y<k表示第k个位置之前的多个位置对应的预测字符,h表示预测融合特征。p(ykx|y<k,h)表示根据y<k对h进行解码所得到的第x个候选字符对应的预测概率。argmaxp(ykx|y<k,h)表示最大预测概率对应的候选字符。其中,k为正整数且不大于预测病历文本中的字符的数量,x为正整数且不大于候选字符集合中的候选字符的数量。
也即是,计算机设备根据第k个位置之前的多个位置对应的预测字符,以及预测融合特征,来指导生成第k个位置对应的预测字符,从而通过自回归的方式,生成预测病历文本中的多个预测字符。
图5是本申请实施例提供的一种解码方法的示意图,如图5所示,计算机设备将预测融合特征501和前k-1个预测字符502输入至解码网络503,由解码网络503根据前k-1个预测字符502,对预测融合特征501进行解码,得到第k个预测子信息,将该预测子信息中最大的预测特征值对应的候选字符确定为第k个预测字符504。其中,k为大于2的正整数,且k不大于预测病历文本中的多个预测字符的数量。
需要说明的是,上述步骤303-305仅以病历生成模型包括特征提取网络、编码网络和解码网络为例进行说明,实现调用病历生成模型,对样本对话文本进行处理,得到预测特征信息。
306、计算机设备基于样本特征信息和预测特征信息,训练病历生成模型。
由于样本特征信息表示每个候选字符属于样本病历文本的可能性,预测特征信息表示每个候选字符属于样本对话文本对应的预测病历文本的可能性,则预测特征信息与样本特征信息之间的差异越小,基于该病历生成模型所得到的预测病历文本与样本病历文本之间的差异也就越小,也即是该病历生成模型的准确度越高,因此可以基于预测特征信息与样本特征信息之间的差异,来训练病历生成模型,训练过程简单方便,降低了训练病历生成模型的难度。
由于本申请实施例采用了多种格式的样本对话文本以及对应的病历文本对病历生成模型进行训练,使得病历生成模型能够学习到如何根据各种格式的对话文本生成对应的病历文本,因此训练后的病历生成模型用于根据多种格式中任一格式的对话文本生成对应的病历文本,从而提高了病历生成模型的通用性。
在一种可能实现方式中,样本特征信息包括样本病历文本中的多个位置对应的样本子信息,样本子信息表示每个候选字符属于样本病历文本中对应位置上的字符的可能性,预测特征信息包括预测病历文本中的多个位置对应的预测子信息,预测子信息表示每个候选字符属于预测病历文本中对应位置上的字符的可能性。
则计算机设备基于样本特征信息和预测特征信息,训练病历生成模型,包括:基于每个位置对应的预测子信息与样本子信息之间的差异,确定每个位置对应的损失分量;基于多个损失分量,确定损失值,损失值与多个损失分量正相关;基于损失值,训练病历生成模型。
其中,预测子信息与样本子信息之间的差异越大,对应的损失分量越大,预测子信息与样本子信息之间的差异越小,对应的损失分量越小。损失值与多个损失分量正相关,也即是损失分量越大,该损失值越大,损失分量越小,该损失值也越小,例如该损失值为多个损失分量之和。
也即是,每个位置对应的预测子信息与样本子信息之间的差异越大,该损失值越大,病历生成模型的准确度越低。每个位置对应的预测子信息与样本子信息之间的差异越小,该损失值越小,病历生成模型的准确度越高。因此,计算机设备基于损失值,训练病历生成模型,以使损失值趋于收敛,从而提高特征编码模型的准确度。
在一种可能实现方式中,病历生成模型中的编码网络和解码网络是Transformer网络(一种基于机器翻译的编解码网络),该Transformer网络是一种以自注意力机制为核心的编码网络-解码网络。编码网络通过自注意力机制和前馈神经网络,帮助编码网络不仅仅只关注当前字符,还关注当前字符之前的其他字符,从而获取到文本中的上下文语义。解码网络包含自注意力机制、前馈神经网络和注意力层,帮助当解码网络获取到当前需要关注的特征。
可选地,该Transformer网络为BART网络(Bidirectional EncoderRepresentations from Transformers,变分双向编解码网络),BART网络是一种采用序列到序列构建的降噪自编解码网络,来学习到从序列到序列的信息。
本申请实施例将样本病历文本作为学习的信息,与样本对话文本输入至病历生成模型中进行深度学习,通过不同格式的样本对话文本对应的样本病历文本,去自动分析和学习病历文本的多样性,并且自动适配不同的疾病,从而使得病历文本的生成过程更加灵活,打破局限性,并提高病历生成模型的通用性。
因此,本申请实施例提供的病历生成模型,不局限于人为构建的知识图谱或者设定的特定格式,直接通过学习样本对话文本和样本病历文本之间的对应关系,来学习病历文本的样式,从而提高了生成病历文本的灵活性。
需要说明的是,上述步骤302-306仅以在一次迭代训练过程中,基于一个第一样本数据进行训练为例来说明。计算机设备基于不同的第一样本数据,循环执行上述步骤302-306,从而实现基于多个第一样本数据,训练病历生成模型。
307、计算机设备调用病历生成模型,根据采集到的第一对话文本,生成第一对话文本对应的病历文本。
计算机设备采集任一格式对应的第一对话文本,由于该病历生成模型具有通用性,因此计算机设备调用病历生成模型,根据该第一对话文本,生成该第一对话文本对应的病历文本。其中,生成病历文本的过程详见下述图6的实施例,在此暂不做详细说明。
在相关技术中,由医护人员根据患者的问诊情况,人工撰写对应的病历文本。而本申请实施例提供了一种调用病历生成模型自动生成病历文本的方法,能够有效减轻手动撰写的负担,节省了人力和时间,提高了生成病历文本的效率。
本申请实施例提供的方法,采用多种格式的样本对话文本以及对应的病历文本对病历生成模型进行训练,使得病历生成模型能够学习到如何根据各种格式的对话文本生成对应的病历文本,提高了病历生成模型的通用性,因此能够调用病历生成模型根据任一格式的对话文本生成对应的病历文本,从而提高了自动生成病历文本的通用性。
并且,由于样本特征信息表示每个候选字符属于样本病历文本的可能性,预测特征信息表示每个候选字符属于样本对话文本对应的预测病历文本的可能性,则预测特征信息与样本特征信息之间的差异越小,基于该病历生成模型所得到的预测病历文本与样本病历文本之间的差异也就越小,也即是该病历生成模型的准确度越高,因此可以基于预测特征信息与样本特征信息之间的差异,来训练病历生成模型,训练过程简单方便,降低了训练病历生成模型的难度。
并且,本申请实施例提供了一种调用病历生成模型自动生成病历文本的方法,能够有效减轻手动撰写的负担,节省了人力和时间,提高了生成病历文本的效率。
图6是本申请实施例提供的一种病历文本生成方法的流程图。本申请实施例的执行主体为计算机设备,参见图6,该方法包括:
601、计算机设备获取第一对话文本。
计算机设备获取第一对话文本,该第一对话文本包括多个对话语句,例如第一对话文本包括医生的问题语句和患者的回答语句等。
在一种可能实现方式中,计算机设备对采集到的第二对话文本进行以下至少一项处理,得到第一对话文本:删除第二对话文本中与其他字符重复的字符;删除第二对话文本中属于语气词的字符;删除第二对话文本中的敏感字符。也即是,计算机设备采集第二对话文本,对该第二对话文本进行预处理,得到该第一对话文本。
其中,计算机设备对第二对话文本进行识别,确定该第二对话文本中与其他字符重复的字符,将与其他字符重复的字符删除,以降低对话文本的冗余度。
或者,计算机设备对第二对话文本进行识别,确定该第二对话文本中属于语气词的字符,由于语气词不包含有效信息,因此计算机设备将属于语气词的字符删除,以降低对话文本的冗余度。
或者,计算机设备获取敏感字符集合,敏感字符集合中包括多个字符,计算机设备根据该敏感字符集合,对第二对话文本进行识别,如果第二对话文本中的某个字符与敏感字符集合中的字符相同,则计算机设备将该字符确定为敏感字符,或者将于该字符关联的字符确定为敏感字符,并将敏感字符删除,例如,该敏感字符包括患者的姓名或者联系方式等。
在一种可能实现方式中,计算机设备显示问诊对话界面,获取在问诊对话界面中输入的多个对话语句,将获取到的多个对话语句构成第一对话文本。
以计算机设备为第一用户的设备为例来说明,计算机设备显示问诊对话界面,该问诊对话界面是第一用户与第二用户之间的交互界面,例如第一用户为医生,第二用户为患者。第一用户和第二用户分别在该问诊对话界面中输入对话文本,来进行交互,则计算机设备获取在该问诊对话界面中输入的多个对话语句,将获取到的多个对话语句构成第一对话文本。
可选地,计算机设备在检测到问诊对话界面输入了对话语句的情况下,获取输入的对话语句,从而按照对话语句的输入顺序,依次获取每个对话语句,并按照多个对话语句的获取顺序,将该多个对话语句进行拼接,得到该第一对话文本。
可选地,计算机设备每获取到一个对话语句,在该对话语句的结尾添加一个第二标志字符,该第二标志字符用于表示对话语句的结尾,后续将添加了第二标志字符的多个对话语句进行拼接,得到该第一对话文本,以便于后续计算机设备根据第一对话文本中的第二标志字符,确定第一对话文本中的每个对话语句。
602、计算机设备调用病历生成模型中的特征提取网络,对第一对话文本进行特征提取,得到第一对话文本中的每个对话语句对应的文本特征。
在一种可能实现方式中,第一对话文本中包括第二标志字符,第二标志字符用于表示对话语句的结尾。计算机设备调用特征提取网络,识别第一对话文本中的第二标志字符,将第一个第二标志字符之前的字符确定为一个对话语句,将每两个第二标志字符之间的字符确定为一个对话语句;调用特征提取网络,分别对每个对话语句进行特征提取,得到每个对话语句对应的文本特征。
其中,该步骤602中获取第一对话文本中的每个对话语句对应的文本特征的过程,与上述步骤303中获取样本对话文本中的每个对话语句对应的预测文本特征的过程同理,在此不再赘述。
603、计算机设备调用病历生成模型中的编码网络,对得到的多个文本特征进行融合编码,得到融合特征。
其中,该步骤603中获取融合特征的过程,与上述步骤304中获取预测融合特征的过程同理,在此不再赘述。
604、计算机设备调用病历生成模型中的解码网络,基于融合特征进行解码,得到特征信息,根据特征信息,在候选字符集合中的多个候选字符中确定属于病历文本的多个目标字符。
其中,特征信息表示每个候选字符属于第一对话文本对应的病历文本的可能性。
在一种可能实现方式中,特征信息包括病历文本中的多个位置对应的子信息,子信息包括每个候选字符对应的特征值,特征值表示候选字符属于病历文本中对应位置上的字符的可能性。
则计算机设备调用解码网络,基于融合特征进行解码,得到特征信息,根据特征信息,在候选字符集合中的多个候选字符中确定属于病历文本的多个目标字符,包括:调用解码网络,对融合特征进行解码,得到第一子信息,将第一子信息中最大的特征值对应的候选字符确定为第一目标字符;继续调用解码网络,根据已经得到的目标字符,对融合特征进行解码,得到第二子信息,将第二子信息中最大的特征值对应的候选字符确定为第二目标字符,直至得到的目标字符为第一标志字符,第一标志字符用于表示病历文本的结尾。
在另一种可能实现方式中,特征信息包括病历文本中的多个位置对应的子信息,子信息包括每个候选字符对应的特征值,特征值表示候选字符属于病历文本中对应位置上的字符的可能性。
计算机设备调用解码网络,基于融合特征进行解码,得到特征信息,根据特征信息,在候选字符集合中的多个候选字符中确定属于病历文本的多个目标字符,包括:调用解码网络,分别根据不同的字符,对融合特征进行解码,得到多个特征信息,对于每个特征信息,将特征信息中的每个子信息中最大的特征值对应的候选字符确定为目标字符,将得到的多个目标字符确定为特征信息对应的目标字符集合;确定每个目标字符集合对应的联合特征值,联合特征值与目标字符集合中的多个目标字符对应的特征值正相关;在多个目标字符集合中,选取联合特征值最大的目标字符集合中的多个目标字符。
该多个特征信息分别用于确定病历文本,该多个特征信息不同,因此每个特征信息所确定的病历文本也不同,本申请实施例中生成多个特征信息的目的,是从多个特征信息中,确定一个更加准确的特征信息,从而根据该特征信息来确定更加准确的病历文本,以提高生成的病历文本的准确度。
其中,由于子信息中最大的特征值对应的候选字符,属于病历文本的可能性最大,因此计算机设备将子信息中最大的特征值对应的候选字符确定为目标字符,计算机设备将根据一个特征信息确定的多个目标字符,确定为该特征信息对应的目标字符集合。
其中,目标字符集合中的多个目标字符对应的特征值越大,该目标字符集合对应的联合特征值越大,目标字符集合中的多个目标字符对应的特征值越小,该目标字符集合对应的联合特征值也越小。例如计算机设备将多个目标字符对应的特征值相乘,得到目标字符集合对应的联合特征值。由于目标字符对应的特征值越大,该目标字符属于病历文本中的字符的可能性越大,因此目标字符集合对应的联合特征值越大,该目标字符集合中的目标字符属于病历文本中的字符的可能性,因此根据该目标字符集合中的多个目标字符所确定的病历文本的准确性也越大。因此,计算机设备在多个目标字符集合中,选取联合特征值最大的目标字符集合中的多个目标字符。
可选地,特征信息的数量为目标数量,则计算机设备调用解码网络,分别根据不同的字符,对融合特征进行解码,得到多个特征信息,包括:调用解码网络,对融合特征进行解码,得到第一子信息,将第一子信息中最大的目标数量个特征值对应的候选字符分别确定为第一目标字符;对于每个第一目标字符,继续调用解码网络,根据第一目标字符,对融合特征进行解码,得到第二子信息,将第二子信息中最大的特征值对应的候选字符确定为第二目标字符,将第二目标字符添加至第一目标字符所在的目标字符集合,直至得到的目标字符为第一标志字符,将第一标志字符添加至第一目标字符所在的目标字符集合,其中,第一标志字符用于表示病历文本的结尾,每个第一目标字符位于不同的目标字符集合中。
计算机设备调用解码网络,对融合特征进行解码,得到病历文本中的第一个位置对应的第一子信息,该第一子信息包括每个候选字符对应的特征值,候选字符对应的特征值表示该候选字符属于该第一个位置上的字符的可能性。因此,计算机设备在该第一子信息中确定最大的目标数量个特征值,该目标数量个特征值对应的候选字符属于该第一个位置上的字符的可能性较大,因此计算机设备将该目标数量个特征值对应的候选字符确定为病历文本中的第一目标字符,也即是该病历文本中的第一个位置上的字符。
对于每个第一目标字符,计算机设备继续根据第一目标字符和融合特征,确定病历文本的第二个位置上对应的一个第二子信息,根据第二子信息确定一个第二目标字符,计算机设备将该第一目标字符和第二目标字符确定为一个目标字符集合中的字符,并将第一子信息和该第二子信息确定为一个特征信息中的子信息。计算机设备继续采用上述方式,根据第一目标字符、该第二目标字符和融合特征,确定病历文本的第三个位置上对应的一个第三子信息,根据第三子信息确定一个第三目标字符,继续将该第三目标字符添加至该目标字符集合,并将该第三子信息添加至该特征信息,以此类推,直至将第一标志字符添加至该目标字符集合。计算机设备继续调用解码网络,根据第一目标字符,对融合特征进行解码,得到第二子信息,将第二子信息中最大的特征值对应的候选字符确定为第二目标字符,将第二目标字符添加至第一目标字符所在的目标字符集合,直至得到的目标字符为第一标志字符,将第一标志字符添加至第一目标字符所在的目标字符集合。
对于每个第一目标字符,计算机设备均执行上述步骤,从而得到多个特征信息,以及每个特征信息对应的目标字符集合。
其中,上述获取多个目标字符集合的方法,可以理解为在每一次根据解码结果选择目标字符时,均会构建一个解码树,然后根据解码树选择一个准确度最高的目标字符集合。图7是本申请实施例提供的一种目标字符生成方法的示意图,如图7所示,候选字符集合中包括候选字符A、候选字符B、候选字符C、候选字符D和候选字符E。计算机设备根据第一个位置对应的子信息中的特征值,将最大的前两个特征值对应的候选字符A和候选字符D确定为目标字符,从而得到第一个位置对应的目标字符A和目标字符D。
对于目标字符A,计算机设备根据目标字符A和融合特征,确定第二个位置对应的子信息,将该子信息中最大的特征值对应的候选字符B确定为目标字符,从而得到第二个位置对应的目标字符B,计算机设备根据目标字符A、目标字符B和融合特征,确定第三个位置对应的子信息,将该子信息中最大的特征值对应的候选字符D确定为目标字符,从而得到第三个位置对应的目标字符D,计算机设备将这三个位置对应的目标字符A、目标字符B和目标字符D确定为一个目标字符集合。
对于目标字符D,计算机设备根据目标字符D和融合特征,确定第二个位置对应的子信息,将该子信息中最大的特征值对应的候选字符E确定为目标字符,从而得到第二个位置对应的目标字符E,计算机设备根据目标字符D、目标字符E和融合特征,确定第三个位置对应的子信息,将该子信息中最大的特征值对应的候选字符C确定为目标字符,从而得到第三个位置对应的目标字符C,计算机设备将这三个位置对应的目标字符D、目标字符E和目标字符C确定为另一个目标字符集合。
图8是本申请实施例提供的一种生成特征信息的示意图,如图8所示,第一对话文本801中包括医生与患者之间的对话语句,计算机设备调用特征提取网络中的特征提取层,对第一对话文本801进行特征编码,得到每个对话语句对应的独热编码特征802,计算机设备调用特征提取网络中的特征编码层,对每个对话语句对应的独热编码特征802进行特征编码,得到每个对话语句对应的文本特征803,计算机设备调用编码网络804对多个文本特征803进行融合编码,得到第一对话文本801对应的融合特征805。其中,获取融合特征805的过程属于特征提取阶段。计算机设备将融合特征805和前k-1个目标字符802输入至解码网络807,由解码网络807根据前k-1个目标字符806,对融合特征805进行解码,得到第k个目标子信息,将该目标子信息中最大的特征值对应的候选字符确定为第k个目标字符808。其中,获取目标字符808的过程属于特征提取阶段。
需要说明的是,上述步骤602-604仅以病历生成模型包括特征提取网络、编码网络和解码网络为例进行说明,实现调用病历生成模型,对第一对话文本进行识别,得到特征信息,根据特征信息,在多个候选字符中确定属于病历文本的多个目标字符。
605、计算机设备将每个目标字符进行拼接,得到病历文本。
计算机设备得到多个目标字符后,将每个目标字符进行拼接,得到第一对话文本对应的病历文本。可选地,计算机设备按照目标字符的生成顺序,将该多个目标字符进行拼接,得到该病历文本。
相关技术中,医护人员根据医生与患者之间的问诊对话,手动撰写病历文本,人工负担较大,生成病历文本的效率较低。本申请实施例通过病历生成模型,根据医生与患者之间的对话文本,自动生成对应的病历文本,有效提高了生成病历文本的效率。例如,在线上问诊应用中,首先由患者输入病人自述,然后医生根据病人自述与病人进行关于病情的问诊,问诊内容包括现病史、既往史、用药、检查等信息,问诊结束后,计算机设备采集在线上问诊应用中输入的对话语句,构成对话文本,将对话文本输入至病历生成模型,生成对应的病历文本,并将病历文本显示于该线上问诊应用中。
为了验证病历生成模型的有效性,可以将病历生成模型所生成的病历文本与人工撰写的病历文本进行对比。图9是本申请实施例提供的一种病历文本的示意图,如图9所示,计算机设备调用病历生成模型,根据医生与患者的对话文本901,生成病历文本902,医护人员根据该对话文本901,手动撰写病历文本903,从图9中可以看出,病历生成模型生成的病历文本902与人工撰写的病历文本903相差不大,该病历生成模型的准确度较高。
在上述图3和图6提供的病历文本生成方法的基础上,计算机设备还可以训练多个病历生成模型,每个病历生成模型用于生成病历文本中不同标题对应的正文,具体过程参见下述实施例。
图10是本申请实施例提供的另一种病历文本生成方法的流程图。本申请实施例的执行主体为计算机设备,参见图10,该方法包括:
1001、计算机设备获取多个第二样本数据。
第二样本数据包括样本对话文本和样本对话文本对应的样本病历数据,该样本对话文本包括多个对话语句,例如样本对话文本包括医生的问题语句和患者的回答语句等。其中多个第二样本数据中,存在多种格式的样本对话文本。该样本对话文本对应的样本病历数据是指对样本对话文本进行提炼,所得到的能够反映样本对话文本的内容的文本,例如该样本病历数据为能够反映患者的病情的文本。该样本病历数据包括至少两个标题以及每个标题对应的正文。
例如,该样本病历数据中的标题包括主诉、现病史、既往史、个人史、家族史和过敏史等,每个标题对应的正文是指样本病历数据中属于该标题对应的文本。
1002、对于每个第二样本数据,计算机设备按照样本病历数据中的至少两个标题,将样本病历数据拆分成至少两个样本病历文本,将样本对话文本与至少两个样本病历文本分别组合,得到至少两个第一样本数据。
对于每个第二样本数据,计算机设备获取该第二样本数据中的样本病历数据,按照该样本病历数据中的至少两个标题,将样本病历数据拆分成至少两个样本病历文本,每个样本病历文本包括一个标题对应的正文。也即是,对于每个标题,计算机设备将该标题对应的正文确定为一个样本病历文本,例如样本病历文本中仅包括与主诉有关的内容,或者仅包括与病情描述有关的内容等。
则对于一个第二样本数据中的样本对话文本,该样本对话文本对应有至少两个样本病历文本,计算机设备将样本对话文本与至少两个样本病历文本分别组合,得到至少两个第一样本数据。也即是对于至少两个样本病历文本中的每个样本病历文本,计算机设备将该样本病历文本与该样本对话文本进行组合,得到一个第一样本数据。
例如,样本对话文本的样本病历数据按照标题被拆分长样本病历文本1和样本病历文本2,则该样本对话文本对应有样本病历文本1和样本病历文本2,计算机设备将样本对话文本和样本病历文本1进行组合,得到一个第一样本数据,计算机设备将样本对话文本和样本病历文本2进行组合,得到另一个第一样本数据。
1003、计算机设备分别基于与同一个标题对应的多个第一样本数据,训练一个病历生成模型,得到至少两个病历生成模型。
其中,标题对应的第一样本数据,是指该第一样本数据中的样本病历文本包括该标题对应的正文。由于存在不同的样本病历数据包括的标题相同,因此存在与同一个标题对应的多个第一样本数据。
则对于每个标题,计算机设备确定与该标题对应的多个第一样本数据,并基于该多个第一样本数据,训练一个病历生成模型,该病历生成模型用于根据该多种格式中任一格式的对话文本,生成与该标题对应的正文,从而得到每个标题对应的病历生成模型,该病历生成模型具有通用性。
其中,基于多个第一样本数据,训练病历生成模型的过程,与上述图3的实施例中训练病历生成模型的过程同理,在此不再赘述。
1004、计算机设备分别调用至少两个病历生成模型,根据第一对话文本,生成每个标题对应的正文。
计算机设备采集任一格式的第一对话文本,由于训练好的至少两个病历生成模型具有通用性,因此计算机设备分别调用至少两个病历生成模型,根据第一对话文本,生成每个标题对应的正文。
对于每个标题对应的病历生成模型,计算机设备调用该病历生成模型,根据第一对话文本,生成该标题对应的正文,从而得到每个标题对应的正文。
其中,调用病历生成模型来生成标题对应的正文过程,与上述图6的实施例中调用病历生成模型直接生成病历文本的过程同理,在此不再赘述。
1005、计算机设备将生成的至少两个正文与至少两个标题进行组合,得到第一对话文本对应的病历文本。
计算机设备生成至少两个正文后,将该至少两个正文与至少两个标题进行组合,得到第一对话文本对应的病历文本。
其中,每个正文与一个标题对应,计算机设备将每个正文与对应的标题进行组合,得到病历子文本,计算机设备将至少两个病历子文本进行组合,得到该病历文本。
例如,计算机设备获取第二样本数据A和第二样本数据B,第二样本数据A包括样本对话文本A1和样本病历数据A2,样本病历数据A2包括标题“主诉”对应的正文和标题“病史”对应的正文,计算机设备按照标题对样本病历数据A1进行拆分,得到样本病历文本a1和样本病历文本a2,样本病历文本a1包括标题“主诉”对应的正文,样本病历文本a2包括标题“病史”对应的正文。计算机设备将样本对话文本A1与样本病历文本a1进行组合,得到第一样本数据A3,将样本对话文本A1与样本病历文本a2进行组合,得到第一样本数据A4。
第二样本数据B包括样本对话文本B1和样本病历数据B2,样本病历数据B2包括标题“主诉”对应的正文和标题“病史”对应的正文,计算机设备按照标题对样本病历数据B2进行拆分,得到样本病历文本b1和样本病历文本b2,样本病历文本b1包括标题“主诉”对应的正文,样本病历文本b2包括标题“病史”对应的正文。计算机设备将样本对话文本B1与样本病历文本b1进行组合,得到第一样本数据B3,将样本对话文本B1与样本病历文本b2进行组合,得到第一样本数据B4。
其中,第一样本数据A3和第一样本数据B3均是标题“主诉”对应的样本数据,计算机设备基于第一样本数据A3和第一样本数据B3,训练病历生成模型C1,该病历生成模型C1用于生成标题“主诉”对应的正文。第一样本数据A4和第一样本数据B4均是标题“病史”对应的样本数据,计算机设备基于第一样本数据A4和第一样本数据B4,训练病历生成模型C2,该病历生成模型C2用于生成标题“病史”对应的正文。
则后续计算机设备调用病历生成模型C1,根据第一对话文本,生成标题“主诉”对应的正文D1,调用病历生成模型C2,根据第一对话文本,生成标题“病史”对应的正文D2。计算机设备将该标题“主诉”、正文D1、标题“病史”和正文D2进行组合,得到该第一对话文本对应的病历文本。
本申请实施例提供的方法,采用多种格式的样本对话文本以及对应的病历文本对病历生成模型进行训练,使得病历生成模型能够学习到如何根据各种格式的对话文本生成对应的病历文本,提高了病历生成模型的通用性,因此能够调用病历生成模型根据任一格式的对话文本生成对应的病历文本,从而提高了自动生成病历文本的通用性。
并且,以样本病历数据中的标题为维度,将样本病历数据拆分成不同的样本病历文本,从而分别训练出用于生成不同标题对应的正文的病历生成模型,使得病历文本生成过程的维度更细,有利于提高生成病历文本的准确性以及灵活性。
上述实施例可应用于需要生成病历文本的任意场景中。例如,在线上问诊的场景中,采用上述实施例提供的方法,生成问诊过程对应的病历文本。图11是本申请实施例提供的一种病历文本生成方法的流程图,参见图11,该方法包括:
1101、计算机设备显示问诊对话界面,该问诊对话界面为第一用户和第二用户之间的交互界面,例如该第一用户为医生,该第二用户为患者。
1102、计算机设备在问诊对话界面中,显示第一用户和第二用户在该问诊对话界面中输入的对话语句。
1103、计算机设备响应于病历生成操作,获取在该问诊对话界面中输入的多个对话语句,将该多个对话语句确定为对话文本。
1104、计算机设备调用病历生成文本,根据该对话文本,生成该对话文本对应的病历文本。
1105、计算机设备显示病历文本。
上述实施例仅以在线上问诊的场景中生成病历文本为例进行说明,除此之外,计算机设备还可以将该病历生成方法应用于其他场景中,例如在线下问诊场景中,可以由医护人员整理医生与患者之间的对话文本,将该对话文本上传至计算机设备,由计算机设备调用病历生成模型根据该对话文本,生成线上的病历文本,从而提高生成病历文本的效率。
图12是本申请实施例提供的一种病历文本生成装置的结构示意图。参见图12,该装置包括:
数据获取模块1201,用于获取多个第一样本数据,第一样本数据包括样本对话文本和样本对话文本对应的样本病历文本,其中多个第一样本数据中,存在多种格式的样本对话文本;
模型训练模块1202,用于基于多个第一样本数据,训练病历生成模型,病历生成模型用于根据多种格式中任一格式的对话文本生成对应的病历文本;
病历生成模块1203,用于调用病历生成模型,根据采集到的第一对话文本,生成第一对话文本对应的病历文本。
本申请实施例提供的病历文本生成装置,采用多种格式的样本对话文本以及对应的病历文本对病历生成模型进行训练,使得病历生成模型能够学习到如何根据各种格式的对话文本生成对应的病历文本,提高了病历生成模型的通用性,因此能够调用病历生成模型根据任一格式的对话文本生成对应的病历文本,从而提高了自动生成病历文本的通用性。
可选地,参见图13,模型训练模块1202,包括:
样本信息确定单元1212,用于基于候选字符集合和样本病历文本,确定样本病历文本对应的样本特征信息,候选字符集合包括多个候选字符,样本特征信息表示每个候选字符属于样本病历文本的可能性;
预测信息确定单元1222,用于调用病历生成模型,对样本对话文本进行处理,得到预测特征信息,预测特征信息表示每个候选字符属于样本对话文本对应的预测病历文本的可能性;
模型训练单元1232,用于基于样本特征信息和预测特征信息,训练病历生成模型。
可选地,参见图13,病历生成模型包括特征提取网络、编码网络和解码网络,预测信息确定单元1222,用于:
调用特征提取网络,对样本对话文本进行特征提取,得到样本对话文本中的每个对话语句对应的预测文本特征;
调用编码网络,对得到的多个预测文本特征进行融合编码,得到预测融合特征;
调用解码网络,基于预测融合特征进行解码,得到预测特征信息。
可选地,参见图13,预测特征信息包括预测病历文本中的多个位置对应的预测子信息,预测子信息包括每个候选字符对应的预测特征值,预测特征值表示候选字符属于预测病历文本中对应位置上的字符的可能性;
预测信息确定单元1222,用于:
调用解码网络,对预测融合特征进行解码,得到第一预测子信息,将第一预测子信息中最大的预测特征值对应的候选字符确定为第一预测字符;
继续调用解码网络,根据已经得到的预测字符,对预测融合特征进行解码,得到第二预测子信息,将第二预测子信息中最大的预测特征值对应的候选字符确定为第二预测字符,直至得到的预测字符为第一标志字符,第一标志字符用于表示病历文本的结尾。
可选地,参见图13,样本特征信息包括样本病历文本中的多个位置对应的样本子信息,样本子信息表示每个候选字符属于样本病历文本中对应位置上的字符的可能性,预测特征信息包括预测病历文本中的多个位置对应的预测子信息,预测子信息表示每个候选字符属于预测病历文本中对应位置上的字符的可能性;
模型训练单元1232,用于:
基于每个位置对应的预测子信息与样本子信息之间的差异,确定每个位置对应的损失分量;
基于多个损失分量,确定损失值,损失值与多个损失分量正相关;
基于损失值,训练病历生成模型。
可选地,参见图13,病历生成模块1203,包括:
字符确定单元1213,用于调用病历生成模型,对第一对话文本进行识别,得到特征信息,根据特征信息,在候选字符集合中的多个候选字符中确定属于病历文本的多个目标字符,特征信息表示每个候选字符属于第一对话文本对应的病历文本的可能性;
字符拼接单元1223,用于将每个目标字符进行拼接,得到病历文本。
可选地,参见图13,病历生成模型包括特征提取网络、编码网络和解码网络,字符确定单元1213,用于:
调用特征提取网络,对第一对话文本进行特征提取,得到第一对话文本中的每个对话语句对应的文本特征;
调用编码网络,对得到的多个文本特征进行融合编码,得到融合特征;
调用解码网络,基于融合特征进行解码,得到特征信息,根据特征信息,在多个候选字符中确定属于病历文本的多个目标字符。
可选地,参见图13,特征信息包括病历文本中的多个位置对应的子信息,子信息包括每个候选字符对应的特征值,特征值表示候选字符属于病历文本中对应位置上的字符的可能性;
字符确定单元1213,用于:
调用解码网络,对融合特征进行解码,得到第一子信息,将第一子信息中最大的特征值对应的候选字符确定为第一目标字符;
继续调用解码网络,根据已经得到的目标字符,对融合特征进行解码,得到第二子信息,将第二子信息中最大的特征值对应的候选字符确定为第二目标字符,直至得到的目标字符为第一标志字符,第一标志字符用于表示病历文本的结尾。
可选地,参见图13,特征信息包括病历文本中的多个位置对应的子信息,子信息包括每个候选字符对应的特征值,特征值表示候选字符属于病历文本中对应位置上的字符的可能性;
字符确定单元1213,用于:
调用解码网络,分别根据不同的字符,对融合特征进行解码,得到多个特征信息,对于每个特征信息,将特征信息中的每个子信息中最大的特征值对应的候选字符确定为目标字符,将得到的多个目标字符确定为特征信息对应的目标字符集合;
确定每个目标字符集合对应的联合特征值,联合特征值与目标字符集合中的多个目标字符对应的特征值正相关;
在多个目标字符集合中,选取联合特征值最大的目标字符集合中的多个目标字符。
可选地,参见图13,字符确定单元1213,用于:
特征信息的数量为目标数量,调用解码网络,对融合特征进行解码,得到第一子信息,将第一子信息中最大的目标数量个特征值对应的候选字符分别确定为第一目标字符;
对于每个第一目标字符,继续调用解码网络,根据第一目标字符,对融合特征进行解码,得到第二子信息,将第二子信息中最大的特征值对应的候选字符确定为第二目标字符,将第二目标字符添加至第一目标字符所在的目标字符集合,直至得到的目标字符为第一标志字符,将第一标志字符添加至第一目标字符所在的目标字符集合,其中,第一标志字符用于表示病历文本的结尾,每个第一目标字符位于不同的目标字符集合中。
可选地,参见图13,第一对话文本中包括第二标志字符,第二标志字符用于表示对话语句的结尾,字符确定单元1213,用于:
调用特征提取网络,识别第一对话文本中的第二标志字符,将第一个第二标志字符之前的字符确定为一个对话语句,将每两个第二标志字符之间的字符确定为一个对话语句;
调用特征提取网络,分别对每个对话语句进行特征提取,得到每个对话语句对应的文本特征。
可选地,参见图13,装置还包括文本处理模块1204,用于对采集到的第二对话文本进行以下至少一项处理,得到第一对话文本:
删除第二对话文本中与其他字符重复的字符;
删除第二对话文本中属于语气词的字符;
删除第二对话文本中的敏感字符。
可选地,参见图13,装置还包括:
界面显示模块1205,用于显示问诊对话界面,获取在问诊对话界面中输入的多个对话语句;
文本确定模块1206,用于将获取到的多个对话语句构成第一对话文本。
可选地,参见图13,数据获取模块1201,包括:
数据获取单元1211,用于获取多个第二样本数据,第二样本数据包括样本对话文本和样本对话文本对应的样本病历数据,样本病历数据包括至少两个标题以及每个标题对应的正文,其中多个第二样本数据中,存在多种格式的样本对话文本;
文本组合单元1221,用于对于每个第二样本数据,按照样本病历数据中的至少两个标题,将样本病历数据拆分成至少两个样本病历文本,每个样本病历文本包括一个标题对应的正文,将样本对话文本与至少两个样本病历文本分别组合,得到至少两个第一样本数据。
可选地,参见图13,模型训练模块1202,用于分别基于与同一个标题对应的多个第一样本数据,训练一个病历生成模型,得到至少两个病历生成模型。
可选地,参见图13,病历生成模块1203,包括:
正文确定单元1233,用于分别调用至少两个病历生成模型,根据第一对话文本,生成每个标题对应的正文;
正文组合单元1243,用于将生成的至少两个正文与至少两个标题进行组合,得到第一对话文本对应的病历文本。
需要说明的是:上述实施例提供的病历文本生成装置在生成病历文本时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的病历文本生成装置与病历文本生成方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本申请实施例还提供了一种计算机设备,该计算机设备包括处理器和存储器,存储器中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行,以实现上述实施例的病历文本生成方法中所执行的操作。
可选地,该计算机设备提供为终端。图14示出了本申请一个示例性实施例提供的终端1400的结构示意图。
终端1400包括有:处理器1401和存储器1402。
处理器1401可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1401可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1401也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1401可以集成有GPU(Graphics Processing Unit,图像处理的交互器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1401还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1402可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1402还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1402中的非暂态的计算机可读存储介质用于存储至少一条计算机程序,该至少一条计算机程序用于被处理器1401所具有以实现本申请中方法实施例提供的病历文本生成方法。
在一些实施例中,终端1400还可选包括有:外围设备接口1403和至少一个外围设备。处理器1401、存储器1402和外围设备接口1403之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1403相连。可选地,外围设备包括:射频电路1404和显示屏1405中的至少一种。
外围设备接口1403可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器1401和存储器1402。在一些实施例中,处理器1401、存储器1402和外围设备接口1403被集成在同一芯片或电路板上;在一些其他实施例中,处理器1401、存储器1402和外围设备接口1403中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1404用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1404通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1404将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1404包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1404可以通过至少一种无线通信协议来与其它设备进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1404还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏1405用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1405是触摸显示屏时,显示屏1405还具有采集在显示屏1405的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1401进行处理。此时,显示屏1405还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1405可以为一个,设置在终端1400的前面板;在另一些实施例中,显示屏1405可以为至少两个,分别设置在终端1400的不同表面或呈折叠设计;在另一些实施例中,显示屏1405可以是柔性显示屏,设置在终端1400的弯曲表面上或折叠面上。甚至,显示屏1405还可以设置成非矩形的不规则图形,也即异形屏。显示屏1405可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-EmittingDiode,有机发光二极管)等材质制备。
本领域技术人员可以理解,图14中示出的结构并不构成对终端1400的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
可选地,该计算机设备提供为服务器。图15是本申请实施例提供的一种服务器的结构示意图,该服务器1500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central Processing Units,CPU)1501和一个或一个以上的存储器1502,其中,所述存储器1502中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器1501加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行,以实现上述实施例的病历文本生成方法中所执行的操作。
本申请实施例还提供了一种计算机程序产品,计算机程序产品包括计算机程序,计算机程序由处理器加载并执行,以实现如上述方面所述的病历文本生成方法所执行的操作。在一些实施例中,本申请实施例所涉及的计算机程序可被部署在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链系统。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请实施例的可选实施例,并不用以限制本申请实施例,凡在本申请实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (20)
1.一种病历文本生成方法,其特征在于,所述方法包括:
获取多个第一样本数据,所述第一样本数据包括样本对话文本和所述样本对话文本对应的样本病历文本,其中多个所述第一样本数据中,存在多种格式的样本对话文本;
基于多个所述第一样本数据,训练病历生成模型,所述病历生成模型用于根据所述多种格式中任一格式的对话文本生成对应的病历文本;
调用所述病历生成模型,根据采集到的第一对话文本,生成所述第一对话文本对应的病历文本。
2.根据权利要求1所述的方法,其特征在于,所述基于多个所述第一样本数据,训练病历生成模型,包括:
基于候选字符集合和所述样本病历文本,确定所述样本病历文本对应的样本特征信息,所述候选字符集合包括多个候选字符,所述样本特征信息表示每个所述候选字符属于所述样本病历文本的可能性;
调用所述病历生成模型,对所述样本对话文本进行处理,得到预测特征信息,所述预测特征信息表示每个所述候选字符属于所述样本对话文本对应的预测病历文本的可能性;
基于所述样本特征信息和所述预测特征信息,训练所述病历生成模型。
3.根据权利要求2所述的方法,其特征在于,所述病历生成模型包括特征提取网络、编码网络和解码网络,所述调用所述病历生成模型,对所述样本对话文本进行处理,得到预测特征信息,包括:
调用所述特征提取网络,对所述样本对话文本进行特征提取,得到所述样本对话文本中的每个对话语句对应的预测文本特征;
调用所述编码网络,对得到的多个预测文本特征进行融合编码,得到预测融合特征;
调用所述解码网络,基于所述预测融合特征进行解码,得到所述预测特征信息。
4.根据权利要求3所述的方法,其特征在于,所述预测特征信息包括所述预测病历文本中的多个位置对应的预测子信息,所述预测子信息包括每个所述候选字符对应的预测特征值,所述预测特征值表示所述候选字符属于所述预测病历文本中对应位置上的字符的可能性;
所述调用所述解码网络,基于所述预测融合特征进行解码,得到所述预测特征信息,包括:
调用所述解码网络,对所述预测融合特征进行解码,得到第一预测子信息,将所述第一预测子信息中最大的预测特征值对应的候选字符确定为第一预测字符;
继续调用所述解码网络,根据已经得到的预测字符,对所述预测融合特征进行解码,得到第二预测子信息,将所述第二预测子信息中最大的预测特征值对应的候选字符确定为第二预测字符,直至得到的预测字符为第一标志字符,所述第一标志字符用于表示病历文本的结尾。
5.根据权利要求2所述的方法,其特征在于,所述样本特征信息包括所述样本病历文本中的多个位置对应的样本子信息,所述样本子信息表示每个所述候选字符属于所述样本病历文本中对应位置上的字符的可能性,所述预测特征信息包括所述预测病历文本中的多个位置对应的预测子信息,所述预测子信息表示每个所述候选字符属于所述预测病历文本中对应位置上的字符的可能性;
所述基于所述样本特征信息和所述预测特征信息,训练所述病历生成模型,包括:
基于每个所述位置对应的所述预测子信息与所述样本子信息之间的差异,确定每个所述位置对应的损失分量;
基于多个所述损失分量,确定损失值,所述损失值与多个所述损失分量正相关;
基于所述损失值,训练所述病历生成模型。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述调用所述病历生成模型,根据采集到的第一对话文本,生成所述第一对话文本对应的病历文本,包括:
调用所述病历生成模型,对所述第一对话文本进行识别,得到特征信息,根据所述特征信息,在候选字符集合中的多个候选字符中确定属于所述病历文本的多个目标字符,所述特征信息表示每个所述候选字符属于所述第一对话文本对应的病历文本的可能性;
将每个所述目标字符进行拼接,得到所述病历文本。
7.根据权利要求6所述的方法,其特征在于,所述病历生成模型包括特征提取网络、编码网络和解码网络,所述调用所述病历生成模型,对所述第一对话文本进行识别,得到特征信息,根据所述特征信息,在候选字符集合中的多个候选字符中确定属于所述病历文本的多个目标字符,包括:
调用所述特征提取网络,对所述第一对话文本进行特征提取,得到所述第一对话文本中的每个对话语句对应的文本特征;
调用所述编码网络,对得到的多个文本特征进行融合编码,得到融合特征;
调用所述解码网络,基于所述融合特征进行解码,得到所述特征信息,根据所述特征信息,在多个所述候选字符中确定属于所述病历文本的多个所述目标字符。
8.根据权利要求7所述的方法,其特征在于,所述特征信息包括所述病历文本中的多个位置对应的子信息,所述子信息包括每个所述候选字符对应的特征值,所述特征值表示所述候选字符属于所述病历文本中对应位置上的字符的可能性;
所述调用所述解码网络,基于所述融合特征进行解码,得到所述特征信息,根据所述特征信息,在多个所述候选字符中确定属于所述病历文本的多个所述目标字符,包括:
调用所述解码网络,对所述融合特征进行解码,得到第一子信息,将所述第一子信息中最大的特征值对应的候选字符确定为第一目标字符;
继续调用所述解码网络,根据已经得到的目标字符,对所述融合特征进行解码,得到第二子信息,将所述第二子信息中最大的特征值对应的候选字符确定为第二目标字符,直至得到的目标字符为第一标志字符,所述第一标志字符用于表示病历文本的结尾。
9.根据权利要求7所述的方法,其特征在于,所述特征信息包括所述病历文本中的多个位置对应的子信息,所述子信息包括每个所述候选字符对应的特征值,所述特征值表示所述候选字符属于所述病历文本中对应位置上的字符的可能性;
所述调用所述解码网络,基于所述融合特征进行解码,得到所述特征信息,根据所述特征信息,在多个所述候选字符中确定属于所述病历文本的多个所述目标字符,包括:
调用所述解码网络,分别根据不同的字符,对所述融合特征进行解码,得到多个所述特征信息,对于每个所述特征信息,将所述特征信息中的每个子信息中最大的特征值对应的候选字符确定为目标字符,将得到的多个目标字符确定为所述特征信息对应的目标字符集合;
确定每个所述目标字符集合对应的联合特征值,所述联合特征值与所述目标字符集合中的多个目标字符对应的特征值正相关;
在多个所述目标字符集合中,选取联合特征值最大的所述目标字符集合中的多个目标字符。
10.根据权利要求9所述的方法,其特征在于,所述调用所述解码网络,分别根据不同的字符,对所述融合特征进行解码,得到多个所述特征信息,对于每个所述特征信息,将所述特征信息中的每个子信息中最大的特征值对应的候选字符确定为目标字符,将得到的多个目标字符确定为所述特征信息对应的目标字符集合,包括:
所述特征信息的数量为目标数量,调用所述解码网络,对所述融合特征进行解码,得到第一子信息,将所述第一子信息中最大的目标数量个特征值对应的候选字符分别确定为第一目标字符;
对于每个所述第一目标字符,继续调用所述解码网络,根据所述第一目标字符,对所述融合特征进行解码,得到第二子信息,将所述第二子信息中最大的特征值对应的候选字符确定为第二目标字符,将所述第二目标字符添加至所述第一目标字符所在的目标字符集合,直至得到的目标字符为第一标志字符,将所述第一标志字符添加至所述第一目标字符所在的目标字符集合,其中,所述第一标志字符用于表示病历文本的结尾,每个所述第一目标字符位于不同的目标字符集合中。
11.根据权利要求7所述的方法,其特征在于,所述第一对话文本中包括第二标志字符,所述第二标志字符用于表示对话语句的结尾,所述调用所述特征提取网络,对所述第一对话文本进行特征提取,得到所述第一对话文本中的每个对话语句对应的文本特征,包括:
调用所述特征提取网络,识别所述第一对话文本中的第二标志字符,将第一个所述第二标志字符之前的字符确定为一个所述对话语句,将每两个所述第二标志字符之间的字符确定为一个所述对话语句;
调用所述特征提取网络,分别对每个所述对话语句进行特征提取,得到每个所述对话语句对应的所述文本特征。
12.根据权利要求1-5任一项所述的方法,其特征在于,所述调用所述病历生成模型,根据采集到的第一对话文本,生成所述第一对话文本对应的病历文本之前,对采集到的第二对话文本进行以下至少一项处理,得到所述第一对话文本:
删除所述第二对话文本中与其他字符重复的字符;
删除所述第二对话文本中属于语气词的字符;
删除所述第二对话文本中的敏感字符。
13.根据权利要求1-5任一项所述的方法,其特征在于,所述调用所述病历生成模型,根据采集到的第一对话文本,生成所述第一对话文本对应的病历文本之前,所述方法还包括:
显示问诊对话界面,获取在所述问诊对话界面中输入的多个对话语句;
将获取到的多个对话语句构成所述第一对话文本。
14.根据权利要求1-5任一项所述的方法,其特征在于,所述获取多个第一样本数据,包括:
获取多个第二样本数据,所述第二样本数据包括所述样本对话文本和所述样本对话文本对应的样本病历数据,所述样本病历数据包括至少两个标题以及每个标题对应的正文,其中多个所述第二样本数据中,存在多种格式的样本对话文本;
对于每个所述第二样本数据,按照所述样本病历数据中的至少两个标题,将所述样本病历数据拆分成至少两个样本病历文本,每个所述样本病历文本包括一个标题对应的正文,将所述样本对话文本与至少两个所述样本病历文本分别组合,得到至少两个所述第一样本数据。
15.根据权利要求14所述的方法,其特征在于,所述基于多个所述第一样本数据,训练病历生成模型,包括:
分别基于与同一个标题对应的多个所述第一样本数据,训练一个所述病历生成模型,得到至少两个所述病历生成模型。
16.根据权利要求15所述的方法,其特征在于,所述调用所述病历生成模型,根据采集到的第一对话文本,生成所述第一对话文本对应的病历文本,包括:
分别调用至少两个所述病历生成模型,根据所述第一对话文本,生成每个标题对应的正文;
将生成的至少两个正文与至少两个标题进行组合,得到所述第一对话文本对应的病历文本。
17.一种病历文本生成装置,其特征在于,所述装置包括:
数据获取模块,用于获取多个第一样本数据,所述第一样本数据包括样本对话文本和所述样本对话文本对应的样本病历文本,其中多个所述第一样本数据中,存在多种格式的样本对话文本;
模型训练模块,用于基于多个所述第一样本数据,训练病历生成模型,所述病历生成模型用于根据所述多种格式中任一格式的对话文本生成对应的病历文本;
病历生成模块,用于调用所述病历生成模型,根据采集到的第一对话文本,生成所述第一对话文本对应的病历文本。
18.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以实现如权利要求1至16任一项所述的病历文本生成方法所执行的操作。
19.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以实现如权利要求1至16任一项所述的病历文本生成方法所执行的操作。
20.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序由处理器加载并执行,以实现如权利要求1至16任一项所述的病历文本生成方法所执行的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111120031.7A CN115862794A (zh) | 2021-09-24 | 2021-09-24 | 病历文本生成方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111120031.7A CN115862794A (zh) | 2021-09-24 | 2021-09-24 | 病历文本生成方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115862794A true CN115862794A (zh) | 2023-03-28 |
Family
ID=85652429
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111120031.7A Pending CN115862794A (zh) | 2021-09-24 | 2021-09-24 | 病历文本生成方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115862794A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117423423A (zh) * | 2023-12-18 | 2024-01-19 | 四川互慧软件有限公司 | 一种基于卷积神经网络的健康档案整合方法、设备及介质 |
-
2021
- 2021-09-24 CN CN202111120031.7A patent/CN115862794A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117423423A (zh) * | 2023-12-18 | 2024-01-19 | 四川互慧软件有限公司 | 一种基于卷积神经网络的健康档案整合方法、设备及介质 |
CN117423423B (zh) * | 2023-12-18 | 2024-02-13 | 四川互慧软件有限公司 | 一种基于卷积神经网络的健康档案整合方法、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7100087B2 (ja) | 情報を出力する方法および装置 | |
CN112131366B (zh) | 训练文本分类模型及文本分类的方法、装置及存储介质 | |
CN111985240B (zh) | 命名实体识别模型的训练方法、命名实体识别方法及装置 | |
Kandpal et al. | Contextual Chatbot for healthcare purposes (using deep learning) | |
EP4287117A1 (en) | Image segmentation method and apparatus, computer device and storage medium | |
CN112287069B (zh) | 基于语音语义的信息检索方法、装置及计算机设备 | |
CN114972823A (zh) | 数据处理方法、装置、设备及计算机介质 | |
WO2022253061A1 (zh) | 一种语音处理方法及相关设备 | |
CN111598168B (zh) | 图像分类方法、装置、计算机设备及介质 | |
US11036996B2 (en) | Method and apparatus for determining (raw) video materials for news | |
CN113779225B (zh) | 实体链接模型的训练方法、实体链接方法及装置 | |
JP2022006173A (ja) | 知識事前訓練モデルの訓練方法、装置及び電子機器 | |
US20240078385A1 (en) | Method and apparatus for generating text | |
CN114648032B (zh) | 语义理解模型的训练方法、装置和计算机设备 | |
CN113392197A (zh) | 问答推理方法、装置、存储介质及电子设备 | |
CN115862794A (zh) | 病历文本生成方法、装置、计算机设备及存储介质 | |
CN112131364B (zh) | 问答方法、装置、电子设备和存储介质 | |
CN113822084A (zh) | 语句翻译方法、装置、计算机设备及存储介质 | |
CN117273019A (zh) | 对话模型的训练方法、对话生成方法、装置和设备 | |
CN112148836A (zh) | 多模态信息处理方法、装置、设备及存储介质 | |
CN115357710B (zh) | 表格描述文本生成模型的训练方法、装置及电子设备 | |
CN115050371A (zh) | 语音识别方法、装置、计算机设备和存储介质 | |
US20220358851A1 (en) | Generating question answer pairs | |
CN114238587A (zh) | 阅读理解方法、装置、存储介质及计算机设备 | |
CN114281933A (zh) | 文本处理方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40089560 Country of ref document: HK |