基于病历的辅助决策方法、装置、电子设备和存储介质
技术领域
本发明涉及智能医疗技术领域,尤其涉及一种基于病历的辅助决策方法、装置、电子设备和存储介质。
背景技术
随着人工智能技术的快速发展,基于病历的人工智能辅助决策方法应运而生,通过挖掘病历中的有用信息,为医生推荐相似病历,或者提供可能的诊断结果以辅助医生进行诊断,为患者提供参考。
当前,基于病历的辅助决策方法,大多是根据输入的病历文本学习病历字面上的文本信息,进而进行辅助决策。而实际上,病历的构成十分复杂,单凭字面上的文本信息并不能够满足深层次、细粒度的信息挖掘需求,由此得到的辅助决策结果并不可靠。
发明内容
本发明实施例提供一种基于病历的辅助决策方法、装置、电子设备和存储介质,用以解决现有的基于病历的辅助决策方法无法进行深层次、细粒度的信息挖掘,导致辅助决策结果可靠性低的问题。
第一方面,本发明实施例提供一种基于病历的辅助决策方法,包括:
确定病历文本,以及所述病历文本的关键信息和/或潜在信息;
将所述病历文本,以及所述病历文本的关键信息和/或潜在信息输入至语义提取模型,得到所述语义提取模型输出的病历语义表示;
基于所述病历语义表示进行辅助决策;
其中,所述语义提取模型是基于样本病历语义表示和匹配病历语义表示的相似度训练得到的;
所述样本病历语义表示和所述匹配病历语义表示是所述语义提取模型基于样本病历文本、所述样本病历文本的匹配病历文本、所述样本病历文本的样本关键信息和/或样本潜在信息,以及所述匹配病历文本的匹配关键信息和/或匹配潜在信息确定的。
优选地,所述确定病历文本,以及所述病历文本的关键信息和潜在信息,具体包括:
确定所述病历文本;
将所述病历文本输入至命名实体识别模型,得到所述命名实体识别模型输出的所述关键信息;其中,所述命名实体识别模型是基于样本病历文本以及样本关键信息训练得到的;
推导所述病历文本和/或所述关键信息,得到所述潜在信息。
优选地,所述推导所述病历文本和/或所述关键信息,得到所述潜在信息,具体包括:
基于所述病历文本,确定个人相关信息和/或既往信息;
和/或,基于所述关键信息,确定所述关键信息对应的关联信息。
优选地,所述样本病历语义表示和所述匹配病历语义表示的确定方法,包括:
将所述样本病历文本、所述样本关键信息、所述样本潜在信息,以及所述匹配病历文本、所述匹配关键信息和所述匹配潜在信息输入至所述语义提取模型的初始语义表示层,得到所述初始语义表示层输出的样本初始文本特征、样本初始关键特征、样本初始潜在特征,以及匹配初始文本特征、匹配初始关键特征、匹配初始潜在特征;
将所述样本初始文本特征、样本初始关键特征、样本初始潜在特征,以及匹配初始文本特征、匹配初始关键特征、匹配初始潜在特征输入至所述语义提取模型的共同语义表示层,得到所述共同语义表示层输出的所述样本病历语义表示和所述匹配病历语义表示。
优选地,所述将所述样本初始文本特征、样本初始关键特征、样本初始潜在特征,以及匹配初始文本特征、匹配初始关键特征、匹配初始潜在特征输入至所述语义提取模型的共同语义表示层,得到所述共同语义表示层输出的所述样本病历语义表示和所述匹配病历语义表示,具体包括:
对样本拼接特征和匹配拼接特征进行注意力交互,得到样本注意力特征和匹配注意力特征;其中,所述样本拼接特征是拼接所述样本初始文本特征和所述样本初始关键特征得到的,所述匹配拼接特征是拼接所述匹配初始文本特征和所述匹配初始关键特征得到的;
基于所述样本注意力特征和所述样本初始潜在特征,确定所述样本病历语义表示;
基于所述匹配注意力特征和所述匹配初始潜在特征,确定所述匹配病历语义表示。
优选地,所述将所述病历文本,以及所述病历文本的关键信息和/或潜在信息输入至语义提取模型,得到所述语义提取模型输出的病历语义表示,具体包括:
将所述病历文本,以及所述病历文本的关键信息和潜在信息分别输入至所述语义提取模型的初始语义表示层,得到所述初始语义表示层输出的初始文本特征、初始关键特征以及初始潜在特征;
将所述初始文本特征、所述初始关键特征以及所述初始潜在特征输入至所述语义提取模型的共同语义表示层,得到所述共同语义表示层输出的病历语义表示。
优选地,所述基于所述病历语义表示进行辅助决策,具体包括:
基于所述病历语义表示,选取所述病历文本的相似病历文本;
基于所述相似病历文本的诊断结果,进行辅助决策。
第二方面,本发明实施例提供一种基于病历的辅助决策装置,包括:
信息确定单元,用于确定病历文本,以及所述病历文本的关键信息和/或潜在信息;
语义提取单元,用于将所述病历文本,以及所述病历文本的关键信息和/或潜在信息输入至语义提取模型,得到所述语义提取模型输出的病历语义表示;
辅助决策单元,用于基于所述病历语义表示进行辅助决策;
其中,所述语义提取模型是基于样本病历语义表示和匹配病历语义表示的相似度训练得到的;
所述样本病历语义表示和所述匹配病历语义表示是所述语义提取模型基于样本病历文本、所述样本病历文本的匹配病历文本、所述样本病历文本的样本关键信息和/或样本潜在信息,以及所述匹配病历文本的匹配关键信息和/或匹配潜在信息确定的。
第三方面,本发明实施例提供一种电子设备,包括处理器、通信接口、存储器和总线,其中,处理器,通信接口,存储器通过总线完成相互间的通信,处理器可以调用存储器中的逻辑命令,以执行如第一方面所提供的方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
本发明实施例提供的一种基于病历的辅助决策方法、装置、电子设备和存储介质,病历文本的关键信息和/或潜在信息的确定,满足了细粒度、深层次的信息挖掘需求;将病历文本及其关键信息和/或潜在信息应用于语义提取,从而得到更加全面更加精细化地反映病历文本的病历语义表示,有效提高了基于病历的辅助决策的准确性和可靠性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于病历的辅助决策方法的流程示意图;
图2为本发明实施例提供的病历文本的关键信息和潜在信息的确定方法的流程示意图;
图3为本发明实施例提供的样本病历语义表示和所述匹配病历语义表示的确定方法的流程示意图;
图4为本发明实施例提供的共同语义表示层的运行方法流程示意图;
图5为本发明实施例提供的语义提取模型的结构示意图;
图6为本发明实施例提供的语义提取模型的运行流程示意图;
图7为本发明实施例提供的基于病历的辅助决策装置的结构示意图;
图8为本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
病历中通常包含有大量信息,例如结构化的疾病史、医学辅助检查、用药情况等,以及非结构化的主诉、现病史、病程中的加重缓解因素、结果等。挖掘病历中的有用信息,可以为医生推荐相似病历,或者提供可能的诊断结果以辅助医生进行诊断,为患者提供参考。
当前,通常通过学习病历浅层语义理解来进行语义相似度度量,进而进行诊断推荐。但实际上,病历的构成十分复杂,其所表示的信息并非只是字面上简单的文本信息,还存在一些需要重点关注的信息或者隐含的信息,上述信息很大程度上影响着对患者病情的判断,但是在当前的辅助决策中极易被忽略,导致了辅助决策结果的可靠性和准确性欠佳。
对此,本发明实施例提供了一种基于病历的辅助决策方法。图1为本发明实施例提供的基于病历的辅助决策方法的流程示意图,如图1所示,该方法包括:
步骤110,确定病历文本,以及病历文本的关键信息和/或潜在信息。
具体地,在医疗诊断过程中,医生通常会记录患者病例,病例文本是患者病例所对应的文本。此处患者病例可以是电子病例,也可以是纸质病例,可以通过对纸质病例进行光学字符识别OCR得到病例文本。
关键信息包括病历文本中包含的若干个关键信息实体,可以预先设定若干个关键信息的实体类型,通过命名体识别方法从病历文本中提取上述实体类型的关键信息实体,以便于满足细粒度的信息挖掘需求。
潜在信息是指通过病历文本中所包含信息推导得到的相关联信息,病历文本中所包含的信息反映出来的相关联信息,例如不同症状对应于不同疾病的概率,患者的生活环境可能引发的疾病、患者所属人群对应于不同疾病的概率等。潜在信息本身不包含在病历文本之中,但是对于患者的诊断决策起着极为重要的作用。
步骤120,将病历文本,以及病历文本的关键信息和/或潜在信息输入至语义提取模型,得到语义提取模型输出的病历语义表示。其中,语义提取模型是基于样本病历语义表示和匹配病历语义表示的相似度训练得到的;样本病历语义表示和匹配病历语义表示是语义提取模型基于样本病历文本、样本病历文本的匹配病历文本、样本病历文本的样本关键信息和/或样本潜在信息,以及匹配病历文本的匹配关键信息和/或匹配潜在信息确定的。
具体地,若基于步骤110得到病历文本及其关键信息,则将病历文本及其关键信息输入至语义提取模型;若基于步骤110得到病历文本及其潜在信息,则将病历文本及其潜在信息输入至语义提取模型;若基于步骤110得到病历文本及其关键信息和潜在信息,则将病历文本及其关键信息和潜在信息输入至语义提取模型。
语义提取模型用于基于输入的病历文本,以及病历文本的关键信息和/或潜在信息,对病历文本进行语义提取,得到病历文本所对应的病历语义表示。此处,病历语义表示中不仅包含有病历文本本身的文本语义,还包含有病历文本中关键信息所对应的语义和/或病历文本的潜在信息所对应的语义。相比通常仅学习病历浅层语义表示,本发明实施例提供的语义提取模型,实现了深层次、细粒度的信息挖掘,基于语义提取模型输出的病历语义表示,能够更加全面更加精细化地反映病历文本的语义信息。
在执行步骤120之前,还可以预先训练得到语义提取模型,具体可以通过如下方式训练得到语义提取模型:
首先,收集大量样本病历文本,以及样本病历文本相对应的匹配病历文本。此处,匹配病历文本可以是与样本病历文本所对应的诊断结果一致的病历文本,即正匹配病历文本,也可以是与样本所对应的诊断结果不同的病历文本,即负匹配病历文本。通常对于任一样本病历文本,存在该样本病历文本的正匹配病历文本和负匹配病历文本,也可以仅存在该样本病历文本的正匹配病历文本或负匹配病历文本,本发明实施例对此不作具体限定。
其次,确定样本病历文本的样本关键信息和/或样本潜在信息,以及匹配病历文本的匹配关键信息和/或匹配潜在信息。
随即,将样本病历文本及其样本关键信息和/或样本潜在信息,以及匹配病历文本的匹配关键信息和/或匹配潜在信息输入至初始模型中,由初始模型基于样本病历文本及其样本关键信息和/或样本潜在信息,以及匹配病历文本的匹配关键信息和/或匹配潜在信息对样本病历文本和匹配病历文本进行语义提取,并输出样本病历文本的样本病历语义表示,以及匹配病历文本的匹配病历语义表示。
在得到样本病历文本的样本病历语义表示,以及匹配病历文本的匹配病历语义表示后,可以基于两者的相似度训练初始模型,从而得到语义提取模型。此处,初始模型的训练目标是最大化样本病历文本的样本病历语义表示与正匹配病历文本的匹配病历语义表示的相似度,最小化样本病历文本的样本病历语义表示与负匹配病历文本的匹配病历语义表示的相似度,从而使得诊断结果一致的病历文本的病历语义表示越来越相似,诊断结果不同的病历文本的病历语义表示越来越不同。
步骤130,基于病历语义表示进行辅助决策。
具体地,在得到病历语义表示后,可以将病历语义表示应用于相似病历匹配,从而得到与病历文本相似的病历文本及其对应的诊断结果,也可以将病历语义表示输入至预先训练得到的分类器中,从而得到该病历文本对应于各种疾病的概率,以辅助医生进行诊断决策。
本发明实施例提供的方法,病历文本的关键信息和/或潜在信息的确定,满足了细粒度、深层次的信息挖掘需求;将病历文本及其关键信息和/或潜在信息应用于语义提取,从而得到更加全面更加精细化地反映病历文本的病历语义表示,有效提高了基于病历的辅助决策的准确性和可靠性。
基于上述实施例,图2为本发明实施例提供的病历文本的关键信息和潜在信息的确定方法的流程示意图,如图2所示,步骤110具体包括:
步骤111,确定病历文本。
步骤112,将病历文本输入至命名实体识别模型,得到命名实体识别模型输出的关键信息;其中,命名实体识别模型是基于样本病历文本以及样本关键信息训练得到的。
此处,命名实体识别模型用于从输入的病历文本中抽取预先设定的关键信息的实体类型所对应关键信息实体。例如,关键信息的实体类型为“症状”、“体温”、“原发病史”,从病历文本中提取得到的关键信息包括对应于“症状”的关键信息实体“咳嗽”、“咽红”、“咽痛”、“咳痰”,对应于“体温”的关键信息实体“38.5℃”,对应于“原发病史”的关键信息实体“糖尿病”。
在执行步骤112之前,还可以预先训练得到命名实体识别模型,具体可以通过如下方式训练得到语命名实体识别模型:首先,收集大量样本病历文本,基于预先设定的关键信息的实体类型,人工对样本病历文本中存在的关键信息实体及其实体类型进行标注,得到样本关键信息。随即,基于样本病历文本以及样本关键信息训练初始模型,从而得到命名实体识别模型。
步骤113,推导病历文本和/或关键信息,得到潜在信息。
具体地,潜在信息可以是直接通过病历文本所包含的信息推导得到的,也可以是根据从病历文本中提取的关键信息推导得到的,还可以是结合病历文本中包含的信息以及关键信息推导得到的,本发明实施例对此不作具体限定。
本发明实施例提供的方法,通过命名实体识别模型确定病历文本中的关键信息,并在此基础上推导得到潜在信息,从而实现了针对于病历文本的细粒度、深层次的信息挖掘,有助于提高后续病历语义表示的准确性。
基于上述任一实施例,步骤111具体包括:确定病历文本,对病历文本进行文本标记;文本标记包括否定信息标记和/或数值范围标记。
其中,否定信息标记用于对病历文本中表示否定意图的信息增加否定标记,以使得后续语义提取模型在基于否定信息标记后的病历文本进行语义提取时,能够准确提取病历文本中表示否定意图的信息。
例如,病历文本“既往史:否认肝炎、结核病史,否认高血压,糖尿病史5年,无药物过敏史”,其中“肝炎”、“结核病史”、“高血压”、“药物过敏史”均为表示否定意图的信息,通过否定信息标记得到该段病历文本为“既往史:否认肝炎@否定、结核病史@否定,否认高血压@否定,糖尿病史5年,无药物过敏史@否定”,其中“@否定”即为否定标记。
数值范围标记用于对病历文本中出现的数值类信息进行数值规整,并标记规整后的数据所属的范围,从而使得后续语义提取模型在基于数值范围标记后的病历文本进行语义提取时,能够充分挖掘数据范围所对应的信息。
例如,病历文本“检查检验:体温36.1摄氏度,呼吸78次/分,高压130mmHg,低压80mHg”,分别对体温、呼吸、高低压进行数值范围标记,得到标记后的该段病历文本为“体温36.5摄氏度体温正常,呼吸80次/分呼吸正常,高压120mmHg,低压80mHg血压正常”。
基于上述任一实施例,步骤113具体包括:基于病历文本,确定个人相关信息和/或既往信息;和/或,基于关键信息,确定关键信息对应的关联信息。
具体地,个人相关信息即通过病历文本中的患者的个人信息推导得到的相关信息,此处患者的个人信息可以是患者的年龄、性别、职业、住址等,由此推导得到的个人相关信息可以是对应性别和年龄段的常见疾病,对应职业的常见疾病,对应住址所在环境可能会导致的疾病等。例如,基于病历文本确定患者的职业为教师,则可以将教师的对应于各种疾病的患病概率作为个人相关信息,其中常见疾病慢性咽喉炎、下肢静脉曲张等的患病概率较高。
既往信息即通过病历文本中患者的既往史推导得到的信息,可以包括患者的既往史所对应的症状、既往史所对应检查项目等。
关键信息对应的关联信息即通过从病历文本中提取得到的关键信息推导得到的相关联的信息。关联信息可以是关键信息中每一关键信息实体在各种疾病中出现的频次,或者每一关键信息实体在各种疾病中的权重等可用于表征每一关键信息实体在各种疾病中的重要性的参数。
基于上述任一实施例,语义提取模型包括初始语义表示层和共同语义表示层;对应地,图3为本发明实施例提供的样本病历语义表示和所述匹配病历语义表示的确定方法的流程示意图,如图3所示,基于语义提取模型确定样本病历语义表示和所述匹配病历语义表示的方法包括:
步骤310,将样本病历文本、样本关键信息、样本潜在信息,以及匹配病历文本、匹配关键信息和匹配潜在信息输入至语义提取模型的初始语义表示层,得到初始语义表示层输出的样本初始文本特征、样本初始关键特征、样本初始潜在特征,以及匹配初始文本特征、匹配初始关键特征、匹配初始潜在特征。
具体地,初始语义表示层用于对输入的文本进行编码,并输出对应的初始语义表示。初始语义表示层可以是编码-解码结构的transformer模型,也可以是长短期记忆网络LSTM或者循环神经网络RNN等。
进一步地,将样本病历文本输入至初始语义表示层,可以得到样本病历文本的初始语义表示,即样本初始文本特征;将样本关键信息输入至初始语义表示层,可以得到样本关键信息的初始语义表示,即样本初始关键特征;将样本潜在信息输入至初始语义表示层,可以得到样本潜在信息的初始语义表示,即样本初始潜在特征。
同样地,将匹配病历文本输入至初始语义表示层,可以得到匹配病历文本的初始语义表示,即匹配初始文本特征;将匹配关键信息输入至初始语义表示层,可以得到匹配关键信息的初始语义表示,即匹配初始关键特征;将匹配潜在信息输入至初始语义表示层,可以得到匹配潜在信息的初始语义表示,即匹配初始潜在特征。
步骤320,将样本初始文本特征、样本初始关键特征、样本初始潜在特征,以及匹配初始文本特征、匹配初始关键特征、匹配初始潜在特征输入至语义提取模型的共同语义表示层,得到共同语义表示层输出的样本病历语义表示和匹配病历语义表示。
具体地,共同语义表示层用于结合输入的样本病历文本和匹配病历文本所对应的各种初始语义表示,得到样本病历语义表示和匹配病历语义表示。此处,样本病历语义表示包含有样本病历文本、样本关键信息、样本潜在信息以及样本病历文本与匹配病历文本之间的关联信息,匹配病历语义表示包含有匹配病历文本、匹配关键信息、匹配潜在信息以及样本病历文本与匹配病历文本之间的关联信息,样本病历语义表示和匹配病历语义表示能够充分反映样本病历文本和匹配病历文本中包含的各种信息。
基于上述任一实施例,图4为本发明实施例提供的共同语义表示层的运行方法流程示意图,如图4所示,步骤320具体包括:
步骤321,对样本拼接特征和匹配拼接特征进行注意力交互,得到样本注意力特征和匹配注意力特征;其中,样本拼接特征是拼接样本初始文本特征和样本初始关键特征得到的,匹配拼接特征是拼接匹配初始文本特征和匹配初始关键特征得到的。
具体地,拼接样本初始文本特征和样本初始关键特征,即可得到样本拼接特征;同样地,拼接匹配初始文本特征和匹配初始关键特征,即可得到匹配拼接特征。在确定样本拼接特征和匹配拼接特征后,可以对样本拼接特征和匹配拼接特征进行注意力交互,得到样本注意力特征和匹配注意力特征。其中,样本注意力特征用于表征样本拼接特征,以及样本拼接特征与匹配拼接特征之间的相关性,匹配注意力特征用于表征匹配拼接特征,以及匹配拼接特征与样本拼接特征之间的相关性。
步骤322,基于样本注意力特征和样本初始潜在特征,确定样本病历语义表示;基于匹配注意力特征和匹配初始潜在特征,确定匹配病历语义表示。
具体地,基于样本注意力特征和样本初始潜在特征得到的样本病历语义表示,不仅包含有样本病历文本、样本关键信息、样本潜在信息所对应的信息,还包含有样本病历文本与匹配病历文本之间的关联信息;同样地,基于匹配注意力特征和匹配初始潜在特征得到的匹配病历语义表示,不仅包含有匹配病历文本、匹配关键信息、匹配潜在信息所对应的信息,还包含有匹配病历文本与样本病历文本之间的关联信息。
本发明实施例提供的方法,通过注意力机制得到样本病历文本与匹配病历文本之间的关联信息,从而在病历语义表示中体现不同病历之间的关联性,进一步提高病历语义表示的准确性和可靠性。
基于上述任一实施例,图5为本发明实施例提供的语义提取模型的结构示意图,如图5所示,语义提取模型包括初始语义表示层和共同语义表示层两部分。
其中,初始语义表示层用于对输入的文本进行编码,并输出对应的初始语义表示。
此处,输入至初始语义表示层的样本病历文本和匹配病历文本均可通过主诉、现病史、既往史、检查检验等x1个字段表示,每个字段需预先设定字段最大长度。假设预先设定主诉字段的最大长度为zs_max_length,每个字的维度为hsize,则主诉字段对应于大小为(zs_max_length,hsize)的二维矩阵。样本病历文本和匹配病历文本均可表示为(x1,field_max_length,hsize)的矩阵,其中field_max_length为预先设定的每个字段的最大长度。
输入至初始语义表示层的样本关键信息和匹配关键信息均可通过预先设定的关键信息的实体类型转换为x2个字段表示,此处x2即实体类型数量。假设每一实体类型的关键信息的最大长度为key_max_length,则样本关键信息和匹配关键信息均可表示为(x2,key_max_length,hsize)的矩阵。
输入至初始语义表示层的样本潜在信息和匹配潜在信息均可通过预先设定的潜在信息类型转换为x3个字段表示,此处x3即潜在信息类型数量。假设每一潜在信息类型的潜在信息的最大长度为deep_max_length,则样本潜在信息和匹配潜在信息均可表示为(x3,deep_max_length,hsize)的矩阵。
在得到初始意义表示层分别输出的样本初始文本特征、样本初始关键特征、样本初始潜在特征,以及匹配初始文本特征、匹配初始关键特征、匹配初始潜在特征之后,将上述各个初始语义表示输入至共同语义表示层。
共同语义表示层中,样本病历的样本初始文本特征、样本初始关键特征拼接得到样本拼接特征,匹配病历的匹配初始文本特征、匹配初始关键特征拼接得到匹配拼接特征,样本拼接特征和匹配拼接特征均包含x1+x2个字段,将样本拼接特征和匹配拼接特征进行注意力交互,即可得到(x1+x2,x1+x2)大小的注意力矩阵,分别按行、列求和,即可得到样本注意力特征和匹配注意力特征。随即将样本注意力特征与样本初始潜在特征求和,再经过max-pooling,得到样本病历语义表示输出;将匹配注意力特征与匹配初始潜在特征求和,再经过max-pooling,得到匹配病历语义表示输出。
在得到语义提取模型输出的样本病历语义表示和匹配病历语义表示后,可以利用样本病历语义表示和匹配病历语义表示之间的相似度进行模型训练,从而使得诊断结果一致的病历文本的病历语义表示越来越相似,诊断结果不同的病历文本的病历语义表示越来越不同。此处,损失函数可以表示为如下公式:
e(x,y+,y-;ω)=max(0,1-cos(x,y+)+cos(x,y-))
其中,ω为模型参数,x、y+和y-分别为样本病历语义表示、与样本病历的诊断结果一致的正匹配病历语义表示、与样本病历的诊断结果不同的负匹配病历语义表示。cos(x,y+)、cos(x,y-)分别表示样本病历语义表示和正负匹配病历语义表示的相似度,相似度的取值在0到1之间,模型训练的目的在于1-cos(x,y+)+cos(x,y-)的取值尽量接近于0,即cos(x,y+)尽量接近于1,cos(x,y-)尽量接近于0。可以通过Adam方法来优化上述损失函数,从而对语义提取模型进行训练。
此外,在训练过程中,可以采用数据交叉的训练方式,在不同的训练轮次epoch中,使用标注质量较差的样本病历作为弱监督语料,与标注质量较佳的样本病历作为原训练语料进行交替训练,直到模型收敛。上述训练方式可以使语义提取模型能够学习到不同类型的语料信息,具备更好的泛化能力。
基于上述任一实施例,图6为本发明实施例提供的语义提取模型的运行流程示意图,如图6所示,步骤120具体包括:
步骤121,将病历文本,以及病历文本的关键信息和潜在信息分别输入至语义提取模型的初始语义表示层,得到初始语义表示层输出的初始文本特征、初始关键特征以及初始潜在特征。
步骤122,将初始文本特征、初始关键特征以及初始潜在特征输入至语义提取模型的共同语义表示层,得到共同语义表示层输出的病历语义表示。
具体地,初始语义表示层用于分别对输入的病历文本,以及病历文本的关键信息和潜在信息进行编码,并输出病历文本、关键信息和潜在信息分别对应的初始语义表示,即初始文本特征、初始关键特征以及初始潜在特征。
共同语义表示层用于对输入的始文本特征、初始关键特征以及初始潜在特征进行特征融合,得到包含有病历文本、关键信息、潜在信息的病历语义表示。
基于上述任一实施例,步骤130具体包括:基于病历语义表示,选取病历文本的相似病历文本;基于相似病历文本的诊断结果,进行辅助决策。
具体地,可以预先存储大量用于相似病历匹配的待匹配病历文本,并获取每一待匹配病历文本的病历语义表示。计算步骤120得到的病历语义表示,与每一待匹配语义文本的病历语义表示之间的相似度,从而从待匹配病历文本中选取相似度最高的病历文本,作为相似病历文本,并确定相似病历文本的诊断结果,以辅助医生进行诊断决策。
基于上述任一实施例,图7为本发明实施例提供的基于病历的辅助决策装置的结构示意图,如图7所示,该装置包括信息确定单元710、语义提取单元720和辅助决策单元730;
其中,信息确定单元710用于确定病历文本,以及所述病历文本的关键信息和/或潜在信息;
语义提取单元720用于将所述病历文本,以及所述病历文本的关键信息和/或潜在信息输入至语义提取模型,得到所述语义提取模型输出的病历语义表示;
辅助决策单元730用于基于所述病历语义表示进行辅助决策;
其中,所述语义提取模型是基于样本病历语义表示和匹配病历语义表示的相似度训练得到的;
所述样本病历语义表示和所述匹配病历语义表示是所述语义提取模型基于样本病历文本、所述样本病历文本的匹配病历文本、所述样本病历文本的样本关键信息和/或样本潜在信息,以及所述匹配病历文本的匹配关键信息和/或匹配潜在信息确定的。
本发明实施例提供的装置,病历文本的关键信息和/或潜在信息的确定,满足了细粒度、深层次的信息挖掘需求;将病历文本及其关键信息和/或潜在信息应用于语义提取,从而得到更加全面更加精细化地反映病历文本的病历语义表示,有效提高了基于病历的辅助决策的准确性和可靠性。
基于上述任一实施例,信息确定单元710包括:
文本确定子单元,用于确定所述病历文本;
关键信息确定子单元,用于将所述病历文本输入至命名实体识别模型,得到所述命名实体识别模型输出的所述关键信息;其中,所述命名实体识别模型是基于样本病历文本以及样本关键信息训练得到的;
潜在信息确定子单元,用于推导所述病历文本和/或所述关键信息,得到所述潜在信息。
基于上述任一实施例,潜在信息确定子单元具体用于:
基于所述病历文本,确定个人相关信息和/或既往信息;
和/或,基于所述关键信息,确定所述关键信息对应的关联信息。
基于上述任一实施例,该装置还包括:
初始特征训练单元,用于将所述样本病历文本、所述样本关键信息、所述样本潜在信息,以及所述匹配病历文本、所述匹配关键信息和所述匹配潜在信息输入至所述语义提取模型的初始语义表示层,得到所述初始语义表示层输出的样本初始文本特征、样本初始关键特征、样本初始潜在特征,以及匹配初始文本特征、匹配初始关键特征、匹配初始潜在特征;
共同特征训练单元,用于将所述样本初始文本特征、样本初始关键特征、样本初始潜在特征,以及匹配初始文本特征、匹配初始关键特征、匹配初始潜在特征输入至所述语义提取模型的共同语义表示层,得到所述共同语义表示层输出的所述样本病历语义表示和所述匹配病历语义表示。
基于上述任一实施例,共同特征训练单元具体用于:
对样本拼接特征和匹配拼接特征进行注意力交互,得到样本注意力特征和匹配注意力特征;其中,所述样本拼接特征是拼接所述样本初始文本特征和所述样本初始关键特征得到的,所述匹配拼接特征是拼接所述匹配初始文本特征和所述匹配初始关键特征得到的;
基于所述样本注意力特征和所述样本初始潜在特征,确定所述样本病历语义表示;
基于所述匹配注意力特征和所述匹配初始潜在特征,确定所述匹配病历语义表示。
基于上述任一实施例,语义提取单元720具体用于:
将所述病历文本,以及所述病历文本的关键信息和潜在信息分别输入至所述语义提取模型的初始语义表示层,得到所述初始语义表示层输出的初始文本特征、初始关键特征以及初始潜在特征;
将所述初始文本特征、所述初始关键特征以及所述初始潜在特征输入至所述语义提取模型的共同语义表示层,得到所述共同语义表示层输出的病历语义表示。
基于上述任一实施例,辅助决策单元730具体用于:
基于所述病历语义表示,选取所述病历文本的相似病历文本;
基于所述相似病历文本的诊断结果,进行辅助决策。
图8为本发明实施例提供的电子设备的结构示意图,如图8所示,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑命令,以执行如下方法:确定病历文本,以及所述病历文本的关键信息和/或潜在信息;将所述病历文本,以及所述病历文本的关键信息和/或潜在信息输入至语义提取模型,得到所述语义提取模型输出的病历语义表示;基于所述病历语义表示进行辅助决策;其中,所述语义提取模型是基于样本病历语义表示和匹配病历语义表示的相似度训练得到的;所述样本病历语义表示和所述匹配病历语义表示是所述语义提取模型基于样本病历文本、所述样本病历文本的匹配病历文本、所述样本病历文本的样本关键信息和/或样本潜在信息,以及所述匹配病历文本的匹配关键信息和/或匹配潜在信息确定的。
此外,上述的存储器830中的逻辑命令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干命令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的方法,例如包括:确定病历文本,以及所述病历文本的关键信息和/或潜在信息;将所述病历文本,以及所述病历文本的关键信息和/或潜在信息输入至语义提取模型,得到所述语义提取模型输出的病历语义表示;基于所述病历语义表示进行辅助决策;其中,所述语义提取模型是基于样本病历语义表示和匹配病历语义表示的相似度训练得到的;所述样本病历语义表示和所述匹配病历语义表示是所述语义提取模型基于样本病历文本、所述样本病历文本的匹配病历文本、所述样本病历文本的样本关键信息和/或样本潜在信息,以及所述匹配病历文本的匹配关键信息和/或匹配潜在信息确定的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干命令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。