CN110490251B - 基于人工智能的预测分类模型获取方法及装置、存储介质 - Google Patents
基于人工智能的预测分类模型获取方法及装置、存储介质 Download PDFInfo
- Publication number
- CN110490251B CN110490251B CN201910759287.9A CN201910759287A CN110490251B CN 110490251 B CN110490251 B CN 110490251B CN 201910759287 A CN201910759287 A CN 201910759287A CN 110490251 B CN110490251 B CN 110490251B
- Authority
- CN
- China
- Prior art keywords
- disease
- training
- medical record
- preset
- record data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供了一种基于人工智能的预测分类模型获取方法及装置、计算机可读存储介质,该方法包括:从历史病历数据中获取训练样本,训练样本表征历史患者的病历数据与其确诊病症的对应关系;训练样本中的正负样本的配置比例为预设的配置比例;获取与训练样本对应的病症的训练疾病相关文本信息;预设疾病相关文本信息表征多种疾病相关的症状描述性语言和对应的病症人群信息;调用设置的训练模型处理训练样本和训练疾病相关文本信息,得到训练结果;基于训练结果和训练样本,调整训练模型直至收敛,得到预测分类模型,预测分类模型表征病历数据与疾病分类的对应关系。
Description
分案说明
本申请基于申请号为201910177259.6、申请日为2019年03月08日、发明名称为一种医疗文本信息处理方法及装置、存储介质的中国专利申请提出,在该中国专利申请记载的范围内提出分案,该中国专利申请的全部内容在此引入本申请作为参考。
技术领域
本发明涉及人工智能领域中的数据处理技术,尤其涉及一种基于人工智能的预测分类模型获取方法及装置、存储介质。
背景技术
近年来,人工智能(AI,Artificial Intelligence)在各个领域中的应用越来越多,成为了各个领域进行决策和预测的一种重要手段。例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
目前,采用知识图谱结合机器学习中的神经网络模型等实现医疗领域中的事件决策或预测。具体的,对疾病类的知识图谱进行特征学习得到实体向量和关系向量等低维向量,然后将这些低维向量引入神经网络模型,实现某一事件决策模型,基于模型和当前数据,完成事件决策。或者,将疾病类的知识图谱特征学习和算法的目标函数结合,使用端到端的方法进行算法模型的联合学习,将最终算法模型中的监督信号及时反馈到知识图谱特征的学习中,不断的调整,最终实现某一事件决策模型,完成事件决策。
然而,算法模型只跟人力物力进行标注的知识图谱有关,对知识图谱进行的处理比较单一。
发明内容
本发明实施例提供一种基于人工智能的预测分类模型获取方法及装置、存储介质,能够提高数据处理的多样性。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种基于人工智能的预测分类模型获取方法,包括:
从历史病历数据中获取训练样本,所述训练样本表征历史患者的病历数据与其确诊病症的对应关系;所述训练样本中的正负样本的配置比例为预设的配置比例;
获取与所述训练样本对应的病症的训练疾病相关文本信息;所述预设疾病相关文本信息表征多种疾病相关的症状描述性语言和对应的病症人群信息;
调用设置的训练模型处理所述训练样本和训练疾病相关文本信息,得到训练结果;
基于所述训练结果和所述训练样本,调整所述训练模型直至收敛,得到所述预测分类模型,所述预测分类模型表征病历数据与疾病分类的对应关系。
本发明实施例提供一种基于人工智能的预测分类模型获取装置,包括:
获取单元,用于从历史病历数据中获取训练样本,所述训练样本表征历史患者的病历数据与其确诊病症的对应关系;所述训练样本中的正负样本的配置比例为预设的配置比例;及获取与所述训练样本对应的病症的训练疾病相关文本信息;所述预设疾病相关文本信息表征多种疾病相关的症状描述性语言和对应的病症人群信息;及调用设置的训练模型处理所述训练样本和训练疾病相关文本信息,得到训练结果;以及基于所述训练结果和所述训练样本,调整所述训练模型直至收敛,得到所述预测分类模型,所述预测分类模型表征病历数据与疾病分类的对应关系。
本发明实施例还提供一种基于人工智能的预测分类模型获取装置,包括:
存储器,用于存储可执行数据处理指令;
处理器,用于执行所述存储器中存储的可执行数据处理指令时,实现本发明实施例提供的基于人工智能的预测分类模型获取方法。
本发明实施例提供一种计算机可读存储介质,存储有可执行数据处理指令,用于引起处理器执行时,实现本发明实施例提供的基于人工智能的预测分类模型获取方法。
本发明实施例具有以下有益效果:
由于基于人工智能的预测分类模型获取装置采用了简单易获取的文本信息的知识,结合患者的历史病历数据,实现了预测分类模型的训练获取过程,使得采用预测分类模型进行预测时,可以结合注意力机制组成综合的融合性特征,采用融合性特征实现疾病分类,从而提高数据处理的多样性。
附图说明
图1是本发明实施例提供的基于人工智能的预测分类模型获取系统架构的一个可选的结构示意图;
图2是本发明实施例提供的基于人工智能的预测分类模型获取装置的一个可选的结构示意图一;
图3是本发明实施例提供的基于人工智能的预测分类模型获取装置的一个可选的结构示意图二;
图4是本发明实施例提供的基于人工智能的预测分类模型获取方法的一个可选的流程示意图一;
图5是本发明实施例提供的示例性的LSTM记忆单元的结构图;
图6是本发明实施例提供的示例性的疾病分类流程图;
图7是本发明实施例提供的基于人工智能的预测分类模型获取方法的一个可选的流程示意图二;
图8是本发明实施例提供的示例性的特征融合过程示意图;
图9是本发明实施例提供的基于人工智能的预测分类模型获取方法的一个可选的流程示意图三。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施例作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明实施例保护的范围。
除非另有定义,本发明实施例所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本发明实施例中所使用的术语只是为了描述本发明实施例的目的,不是旨在限制本发明实施例。
对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。
1)、特征提取:将原始特征转换为一组具有明显物理意义(Gabor、几何特征[角点、不变量]、纹理[LBP HOG]等)或者统计意义或核的特征。在本发明实施例中的特征提取是指对音频数据中提取重要音频信息的特征向量。
2)、长短期记忆单元模型(LSTM,Long Short Term Memory)是一种时间递归神经网络,能选择性地记忆历史信息(历史积累特性)。在RNN模型基础上对其作进一步改进,采用LSTM单元替换RNN网络中的隐含层节点,就则形成LSTM。
3)、卷积神经网络(CNN,Convolutional Neural Networks)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deeplearning)的代表算法之一。
4)、机器学习(ML,Machine Learning):依托概率论,统计学,神经传播等理论,使计算机能够模拟人类的学习行为,以获取新的知识或者技能,重新组织已有知识结构使之不断改善自身的性能。
5)、模型训练:将人工选择的样本输入给机器学习系统,通过不断调整模型参数,使最终模型对样本识别的准确率达到最优。
6)、人工智能:是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
需要说明的是,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
下面说明实现本发明实施例涉及人工智能的预测分类模型的获取装置的示例性应用,本发明实施例提供的基于人工智能的预测分类模型获取装置可以实施为智能手机、平板电脑、笔记本电脑等各种类型的用户终端,也可以实施为台服务器,这里的服务器为运行音频数据处理功能或语音识别功能应用的后台服务器。下面,将说明基于人工智能的预测分类模型获取装置实施为服务器时涵盖服务器的示例性应用。
参见图1,图1是本发明实施例提供的数据处理系统100的一个可选的架构示意图,为实现支撑一个示例性应用,终端400(示例性示出了终端400-1和终端400-2)通过网络200连接服务器300,网络200可以是广域网或者局域网,又或者是二者的组合,使用无线链路实现数据传输。
服务器300,用于获取预设疾病相关文本信息和当前病历数据;预设疾病相关文本信息表征多种疾病相关的症状描述性语言和对应的病症人群信息;
利用预测分类模型,对预设疾病相关文本信息和当前病历数据分别进行特征编码,得到疾病文本特征和病历数据特征;预测分类模型是根据预设疾病相关文本信息和历史病历数据经过模型训练后得到的,通过预设疾病相关文本信息表征病历数据与疾病分类的对应关系;将疾病文本特征和病历数据特征经过注意力机制进行特征融合,以及分类处理后,得到分类结果。
终端400,用于在图形界面410(示例性示出了图形界面410-1和图形界面410-2)显示输入当前病历数据的界面,以及展示服务器推送的分类结果的。
本发明实施例提供的基于人工智能的预测分类模型获取装置可以实施为硬件或者软硬件结合的方式,下面说明本发明实施例提供的基于人工智能的预测分类模型获取装置的各种示例性实施,下面以基于人工智能的预测分类模型获取装置为服务器进行说明。
参见图2,图2是本发明实施例提供的服务器300一个可选的结构示意图,服务器300可以是移动电话、计算机、数字广播终端、信息收发设备、游戏控制台、平板设备、医疗设备、健身设备、个人数字助理等终端对应的后台服务器,最佳的为安装有医疗客户端的终端对应的后台服务器,根据服务器300的结构,可以预见装置实施为终端时的示例性结构,因此这里所描述的结构不应视为限制,例如可以省略下文所描述的部分组件,或者,增设下文所未记载的组件以适应某些应用的特殊需求。
图2所示的服务器300包括:至少一个处理器310、存储器340、至少一个网络接口320和用户接口330。服务器300中的各个组件通过总线系统350耦合在一起。可理解,总线系统350用于实现这些组件之间的连接通信。总线系统350除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统350。
用户接口330可以包括显示器、键盘、鼠标、轨迹球、点击轮、按键、按钮、触感板或者触摸屏等。
存储器340可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、闪存(Flash Memory)等。易失性存储器可以是随机存取存储器(RAM,Random Access Memory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static RandomAccess Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random AccessMemory)。本发明实施例描述的存储器340旨在包括这些和任意其它适合类型的存储器。
本发明实施例中的存储器340能够存储数据以支持服务器300的操作。这些数据的示例包括:用于在服务器300上操作的任何计算机程序,如操作系统341和应用程序342。其中,操作系统341包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序342可以包含各种应用程序,例如可执行数据处理指令。
作为本发明实施例提供的基于人工智能的预测分类模型获取方法采用软硬件结合实施的示例,本发明实施例所提供的基于人工智能的预测分类模型获取方法可以直接体现为由处理器310执行的软件模块组合,软件模块可以位于存储介质中,存储介质位于存储器340,处理器310读取存储器340中软件模块包括的可执行指令,结合必要的硬件(例如,包括处理器310以及连接到总线350的其他组件)完成本发明实施例提供的基于人工智能的预测分类模型获取方法。即:
本发明实施例提供了一种基于人工智能的预测分类模型获取装置,包括:
存储器342,用于存储可执行数据处理指令;
处理器310,用于执行所述存储器中存储的可执行数据处理指令时,实现本发明实施例提供的基于人工智能的预测分类模型获取方法。
作为示例,处理器310可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
下面说明软件模块的示例性结构,在一些实施例中,如图3所示,基于人工智能的预测分类模型获取装置1中的软件模块可以包括:
获取单元10,用于获取预设疾病相关文本信息和当前病历数据;所述预设疾病相关文本信息表征多种疾病相关的症状描述性语言和对应的病症人群信息;
编码单元11,用于利用预测分类模型,对所述预设疾病相关文本信息和所述当前病历数据分别进行特征编码,得到疾病文本特征和病历数据特征;所述预测分类模型是根据所述预设疾病相关文本信息和历史病历数据经过模型训练后得到的,通过预设疾病相关文本信息表征病历数据与疾病分类的对应关系;
融合分类单元12,用于将所述疾病文本特征和所述病历数据特征经过注意力机制进行特征融合,以及分类处理后,得到分类结果。
在本发明的一些实施例中,所述预设疾病相关文本信息包括:多种疾病症状描述文字信息和对应的易患人群信息;
所述当前病历数据包括:病史数据、体征检查数据、检验数据或患者信息中的至少一种。
在本发明的一些实施例中,所述编码单元11,具体用于在所述预测分类模型中的编码层中,分别采用长短期记忆网络LSTM算法对所述当前病历数据中的文字信息部分和所述预设疾病相关文本信息进行特征编码,得到所述疾病文本特征和病历文字数据特征;及采用卷积神经网络CNN对所述当前病历数据中的数值信息部分进行特征编码,得到病历数值数据特征;以及将所述病历文字数据特征和所述病历数值数据特征中的至少一种作为所述病历数据特征。
在本发明的一些实施例中,所述疾病文本特征包括至少两种疾病对应的至少两个疾病文本子特征;
所述融合分类单元12,具体用于对所述至少两个疾病文本子特征和所述病历数据特征进行相似度计算,得到至少两个疾病相似度特征;及对所述至少两个疾病相似度特征进行归一化处理,得到与所述至少两个疾病相似度特征一一对应的至少两个权重系数;及采用注意力机制算法,对所述至少两个疾病文本子特征、所述至少两个权重系数和所述病历数据特征进行特征融合,得到至少两种疾病对应的融合特征;以及基于所述融合特征进行分类处理,得到所述分类结果。
在本发明的一些实施例中,所述获取单元10,还用于获取所述预测分类模型;
在本发明的一些实施例中,所述获取单元10,具体用于按照预设的配置比例,从历史病历数据中获取训练样本,所述训练样本表征历史患者的病历数据与其确诊病症的对应关系;及获取与所述训练样本对应的病症的训练疾病相关文本信息;及调用设置的训练模型处理所述训练样本和训练疾病相关文本信息,得到训练结果;以及基于所述训练结果和所述训练样本,调整所述训练模型直至收敛,得到所述预测分类模型。
在本发明的一些实施例中,所述获取单元10,还具体用于根据所述训练结果、所述训练样本和预设损失函数确定误差值;当所述误差值在预设阈值范围内时,确定所述训练模型收敛;当所述误差值未在预设阈值范围内时,调整所述训练模型中的模型参数,直至所述误差值达到所述预设阈值范围为止,确定所述训练模型收敛;将收敛的训练模型作为所述预测分类模型。
在实际应用中,所述获取单元10、所述编码单元11、所述融合分类单元12可以由处理器310实现,本发明实施例不作限制。
作为本发明实施例提供的基于人工智能的预测分类模型获取方法采用硬件实施的示例,本发明实施例所提供的基于人工智能的预测分类模型获取方法可以直接采用硬件译码处理器形式的处理器310来执行完成,例如,被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,ProgrammableLogic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或其他电子元件执行实现本发明实施例提供的基于人工智能的预测分类模型获取方法。
下面将结合前述的实现本发明实施例的基于人工智能的预测分类模型获取装置的示例性应用和实施,说明实现本发明实施例的基于人工智能的预测分类模型获取方法。
参见图4,图4是本发明实施例提供的基于人工智能的预测分类模型获取方法的一个可选的流程示意图,将结合图4示出的步骤进行说明。本发明实施例提供的基于人工智能的预测分类模型获取方法,包括:
S101、获取预设疾病相关文本信息和当前病历数据;预设疾病相关文本信息表征多种疾病相关的症状描述性语言和对应的病症人群信息。
S102、利用预测分类模型,对预设疾病相关文本信息和当前病历数据分别进行特征编码,得到疾病文本特征和病历数据特征;预测分类模型是根据预设疾病相关文本信息和历史病历数据经过模型训练后得到的,通过预设疾病相关文本信息表征病历数据与疾病分类的对应关系。
S103、将疾病文本特征和病历数据特征经过注意力机制进行特征融合,以及分类处理后,得到分类结果。
本发明实施例中,基于人工智能的预测分类模型获取方法可以应用在疾病诊断领域,以患者的病历数据为依据,结合外部知识,通过机器学习预测出疾病的类型或者病种。
需要说明的是,这里的外部知识指预设疾病相关文本信息。
在本发明实施例中,基于人工智能的预测分类模型获取方法的实现可以在疾病分类客户端上,该疾病分类客户端可以安装在基于人工智能的预测分类模型获取装置中。
在S101中,基于人工智能的预测分类模型获取装置通过网络获取预设疾病相关文本信息,通过用户的输入获取当前病历数据;其中,预设疾病相关文本信息表征多种疾病相关的症状描述性语言和对应的病症人群信息。
在本发明实施例中,预设疾病相关文本信息包括:多种疾病症状描述文字信息和对应的易患人群信息。
需要说明的是,在本发明实施例中,预设疾病相关文本信息可以为互联网中的词条库或其他学术知识库等已经公认和公开的病症相关描述中可以找到的与某一种疾病的病症描述或患病人群描述相关的文字信息。或者还可以为更为风度的医疗先验知识,本发明实施例不作限制。
示例性的,词库学科中对于糖尿病的描述文字:“糖尿病是一组以高血糖为特征的代谢性疾病。高血糖则是由于胰岛素分泌缺陷或其生物作用受损,或两者兼有引起。糖尿病时长期存在的高血糖,导致各种组织,特别是眼、肾、心脏、血管、神经的慢性损害、功能障碍。糖尿病的诊断,空腹血糖大于或等于7.0毫摩尔/升,和/或餐后两小时血糖大于或等于11.1毫摩尔/升即可确诊”就可以作为预设疾病相关文本信息。
需要说明的是,在本发明实施例中,预设疾病相关文本信息可以是多种疾病对应的文字描述信息,也就是说,外部知识是多种疾病相关的文字描述库。这样的预设疾病相关文本信息具有确定性且容易获得。
在本发明实施例中,患者的当前病历数据可以由医生或医护人员或者患者等在疾病分类应用中输入而得到,而患者的当前病历数据为在医院的看诊过程中填写记录、检查等得到的数据。
在本发明实施中,当前病历数据包括:病史数据、体征检查数据、检验数据或患者信息中的至少一种。也即是说,当前病历数据是由病史数据、体征检查数据、检验数据或患者信息的任何组合形成的数据,本发明实施例不作限制。
其中,病史数据包括:现病史数据(记录的病人的症状信息)以及既往病史数据(病人之前的疾病对诊断有一定的帮助作用)等记录患者病症的信息。体征检查数据表征针对患者的生理特征或生理器官等的体征检查得到的数据,例如,体温、心率和体重等,本发明实施例不作限制。检验数据(若有,通常可通过一些检查检验数据的结果,对病人的疾病进行确定性的判断)是指通过患者器件、组织或者体液(血液或尿液等)等生物体部分进行检验,化验后得到的数值型检查数据,例如,血常规、尿常规、碳十二等,本发明实施例不作限制。患者指患病的对象,上述病史数据、体征检查数据、检验数据等都是该患者对应的数据,患者信息包括其年龄和性别等用户身份信息(部分疾病与人群特征具有一定的关联),本发明实施例不作限制。
需要说明的是,病历数据都是包括病史数据、体征检查数据、检验数据或患者信息中的至少一种的,只不过本发明实施例中的当前病历数据的对象是当前待预测的患者对应的病历数据。
进一步地,在本发明实施例中,预设疾病相关文本信息由于是通过网络或者互联网网站(例如医疗百科网站等)等方式获取的,可能多个网站或知识库中都有相应的文字描述,因此,可以采用不同网站进行相互校验,从而保证预设疾病相关文本信息中描述的准确性和可信度。
在S102和S103中,基于人工智能的预测分类模型获取装置在获取了预设疾病相关文本信息和当前病历数据,且还可以获取事先设置好的预测分类模型,这样,基于人工智能的预测分类模型获取装置可以将预设疾病相关文本信息作为先验知识结合当前病历数据输入至预测分类模型中进行分类,得到分类结果。
需要说明的是,在本发明实施例中,预测分类模型可以用于进行疾病预测方向、疾病诊断、以及其他需要估计和预测的方向,本发明实施例不作限制其应用的领域。
示例性的,预测分类模型用于进行疾病预测时,基于人工智能的预测分类模型获取装置可以获取预设疾病相关文本信息,当前病历数据和事先设置好的预测分类模型,这样,基于人工智能的预测分类模型获取装置可以将预设疾病相关文本信息作为先验知识结合当前病历数据输入至预测分类模型中进行患者的疾病预测,从而得到疾病预测结果,实现患者的疾病预测。
在本发明实施例中,预测分类模型可以包括输入层、编码层、知识融合层和全连接层(输出层)。预测分类模型的获取装置将预设疾病相关文本信息和当前病历数据通过输入层输入预测分类模型,然后通过编码层对预设疾病相关文本信息和当前病历数据分别进行特征提取,即编码,然后将各自的特征通过知识融合层,形成融合特征(即融合入特征向量),融合特征再通过全连接层进行分类处理,最终得到分类结果,该分类结果是对上述患者对应的分类结果。
也就是说,基于人工智能的预测分类模型获取装置可以利用预测分类模型,对预设疾病相关文本信息和当前病历数据分别进行特征编码,得到疾病文本特征和病历数据特征;再将疾病文本特征和病历数据特征经过注意力机制进行特征融合,以及分类处理后,得到分类结果。
在本发明实施例中,当前病历数据是可以由多种数据组成的,这样当前病历数据可以采用结构化的数据存储方式进行数据的存储,也便于后续的数据解析。因此,输入层可以对输入的数据进行结构化解析后,再传输到编码层进行特征提取或者编码。在编码层,基于人工智能的预测分类模型获取装置针对文字型信息和数值型信息可以通过不同的编码方式实现编码。其中,采用LSTM算法对文字型信息进行编码或者特征提取,采用CNN对数值型信息进行编码或特征提取。详细的S102的实现如下:
在预测分类模型中的编码层中,分别采用LSTM算法对当前病历数据中的文字信息部分和预设疾病相关文本信息进行特征编码,得到疾病文本特征和病历文字数据特征;采用CNN对当前病历数据中的数值信息部分进行特征编码,得到病历数值数据特征;将病历文字数据特征和病历数值数据特征中的至少一种作为病历数据特征。
需要说明的是,由于当前病历数据的组成的多样性,可能包含文字信息部分(例如病史数据、体征检查数据等)和数值信息部分(例如检验数据),因此,病历数据特征可能由病历文字数据特征和病历数值数据特征中的至少一种组成,可根据实际应用中的数据确定,本发明实施例不作限制。
在本发明实施例中,基于人工智能的预测分类模型获取装置使用LSTM对当前病历数据中的文字信息部分和预设疾病相关文本信息进行特征编码的最后一个时刻的向量分别表示疾病文本特征(即疾病文本特征向量)和病历文字数据特征(即病历文字数据特征向量)。
可以理解的是,对于文本数据(即文字信息部分),使用LSTM对病历数据、外部知识等文本进行编码,相对于RNN算法,LSTM通过增加输入门限,遗忘门限和输出门限,使得自循环的权重是变化的,从而避免了梯度消失或者梯度膨胀的问题。同时,允许在不同时刻改变连接间的权重系数,使得网络可以选择性的记忆较长文本片段中的有用信息。因此,本发明使用LSTM的最后一个时刻的向量作为表示该文本的特征向量。
而检查检验数据不同与病历数据中的文字信息部分,通常为数值型数据,因此,在预测分类模型中,使用CNN的方法对其数值型数据进行特征提取,CNN的布局更接近于实际的生物神经网络,权值共享降低了模型的复杂性。本发明实施例中的基于人工智能的预测分类模型获取装置将检查检验数据通过CNN进行特征向量的抽取,即编码,得到了病历数值数据特征,进而将病历文字数据特征和病历数值数据特征中的至少一种作为病历数据特征,然后基于人工智能的预测分类模型获取装置针对疾病文本特征和病历数据特征进行注意力机制进行特征融合,以及分类处理,得到分类结果。
下面来介绍下LSTM的相关内容。
在本发明实施例中,LSTM是一种时间递归神经网络,能选择性地记忆历史信息(历史积累特性)。在RNN模型基础上对其作进一步改进,采用LSTM单元替换RNN网络中的隐含层节点,就则形成LSTM。
LSTM单元的记忆单元(Memory Cell,Cell)(即核心门)状态受到3个门控制,即输入门(inputgate)、遗忘门(forgetgate)和输出门(outputgate)。
其中,输入门将当前数据选择性地输入到记忆单元;遗忘门调控历史信息对当前记忆单元状态值的影响;输出门用于选择性输出记忆单元状态值。3个门和独立记忆单元的设计,使LSTM单元具有保存、读取、重置及更新长距离历史信息作用。示例性的,如图5所示为一个LSTM记忆单元Cell的结构。
首先,t时刻输入特征xt和t-1时刻隐藏层变量ht-1,在权重转移矩阵W和U,以及偏置向量b的共同作用下,生成t时刻的状态量it、ft和ot,见公式(1)至公式(3)。进一步在t-1时刻核心门状态量ct-1的辅助下,生成t时刻核心门状态量ct,见公式(4)。最终,在t时刻核心门状态量ct与输出门状态量ot的作用下,生成t时刻隐藏层变量ht,进而影响t+1时刻LSTM神经元的内部变化,见公式(5)。
it=σ(Wixt+Uiht-1+bi) (1)
ft=σ(Wfxt+Ufht-1+bf) (2)
ot=σ(Woxt+Uoht-1+bo) (3)
ct=ft*ct-1+it*φ(Wcxt+Ucht-1+bc) (4)
ht=ot*φ(ct) (5)
it、ft、ot和ct分别表示t时刻的输入门状态值、遗忘门状态值、输出门状态值和核心门状态值。在本发明实施例中,对于每一个逻辑门,Wi、Wf、Wo和Wc分别表示输入门、遗忘门、输出门和核心门所对应的权重转移矩阵;Ui、Uf、Uo和Uc分别代表输入门、遗忘门、输出门和核心门所对应的t-1时刻隐藏层变量ht-1对应的权重转移矩阵,bi、bf、bo和bc则代表输入门、遗忘门、输出门和核心门所对应偏置向量。
示例性的,由于LSTM具有历史记忆(可以理解为历史积累特性),在对待文字型数据进行编码的时候,会受到历史检测数据的影响而输出的特征,而历史记忆是有限的,因此,不能无限制的存在下去,并且,在历史记忆存在的时间长度中,最后时刻的特征是比较准确的,因此,本发明实施例采用的都是最后时刻的特征作为文字性数据的最终特征的。
在本发明的一些实施例中,由于患者信息比较简单和形式固定,因此,可以将性别以数字编码的形式编码,然后直接将患者信息作为特征或特征向量,用于进行后面的特征融合。
在本发明的一些实施例中,针对存在病历数值数据特征的情况,基于人工智能的预测分类模型获取装置在进行特征融合时,可以只将病历文字数据特征与疾病文本特征采用注意力机制进行融合后,再与病历数值数据特征进行拼接融合。其中,病历文字数据特征中的患者信息的特征也可以不参与注意力机制的融合,而是直接作为一个患者信息特征进行最后的拼接融合。当然,也可以将全部的特征都进行注意力机制的融合,因此,本发明实施例提供的特征融合的数据组合的方式很多,本发明实施例不作限制。
需要说明的是,具体的特征融合的过程将在后续实施例中进行详细的描述。
示例性的,如图6所示,基于人工智能的预测分类模型获取装置将现病史数据、既往病史数据和体征检查数据、检验数据、患者信息(年龄和性别)和外部知识(预设疾病相关文本信息)通过输入层传输至编码层,通过输入层将现病史数据、既往病史数据和体征检查数据传输到编码层的第一LSTM,采用LSTM进行编码后,分别与将外部知识通过输入层传输至编码层的第二LSTM,采用LSTM进行编码后的特征进行注意力机制的特征融合,得到融合子特征后,再与患者信息以及经过输入层到达编码层的CNN编码完的检验数据进行拼接融合,最终得到了融合特征,将融合特征传输至全连接层进行分类处理后,输出了分类结果。
需要说明的是,预测分类模型是根据预设疾病相关文本信息和历史病历数据经过模型训练后得到的,通过预设疾病相关文本信息表征病历数据与疾病分类的对应关系。详细的训练过程将在后续实施例中进行说明。
可以理解的是,基于人工智能的预测分类模型获取装置采用预设疾病相关文本信息这种文字描述疾病症状等的表述作为外部知识,结合患者的当前病历数据,在预设疾病预设模型的处理下,就可以进行疾病的预测了。由于基于人工智能的预测分类模型获取装置采用了简单易获取的文本信息的知识,结合患者的当前病历数据,依据注意力机制组成综合的融合性特征,采用融合性特征实现疾病分类时,基于融合性特征的易用性和多维度实现准确的情况,提高了数据处理的准确性,从而提高事件决策的分类结果(例如,疾病预测)的准确度。
在本发明的一些实施例中,疾病文本特征包括至少两种疾病对应的至少两个疾病文本子特征。参见图7,图7是本发明实施例提供的基于人工智能的预测分类模型获取方法的一个可选的流程示意图,图7示出的S103可以通过S1031至S1034实现。如下:
S1031、对至少两个疾病文本子特征和病历数据特征进行相似度计算,得到至少两个疾病相似度特征。
S1032、对至少两个疾病相似度特征进行归一化处理,得到与至少两个疾病相似度特征一一对应的至少两个权重系数。
S1033、采用注意力机制算法,对至少两个疾病文本子特征、至少两个权重系数和病历数据特征进行特征融合,得到至少两种疾病对应的融合特征。
S1034、基于融合特征进行分类处理,得到分类结果。
在本发明实施例中,由于疾病的种类是很多的,基于人工智能的预测分类模型获取装置获取的预设疾病相关文本信息中的包含的疾病种类也会很多,因此,疾病文本特征包含的疾病种类同样会很多,即疾病文本特征可以包括至少两种疾病对应的至少两个疾病文本子特征;每种疾病就可以对应一个疾病文本子特征。
在本发明的一些实施例中,可以将至少两个疾病文本子特征按照疾病进行排序,得到具有疾病顺序的至少两个疾病文本子特征,本发明实施例不作限制。
在本发明实施例中,基于人工智能的预测分类模型获取装置可以采用对至少两个疾病文本子特征分别与病历数据特征进行相似度计算,这样就可以得到至少两个疾病相似度特征;再对至少两个疾病相似度特征分别进行归一化处理,得到与至少两个疾病相似度特征一一对应的至少两个权重系数,每个疾病相似度特征对应一个权重系数;再采用注意力机制算法,对至少两个疾病文本子特征、至少两个权重系数和病历数据特征进行特征融合,得到至少两种疾病对应的融合特征;最后基于融合特征进行分类处理,得到分类结果。
在本发明实施例中,基于人工智能的预测分类模型获取装置可以采用对至少两个疾病文本子特征分别与病历数据特征进行相似度计算的过程可以采用相似度模型来实现,本发明实施例不限制相似度模型。
示例性的,相似度计算可以采用cosine相似性计算相似度,相似度模型为公式(6),如下:
其中,pi表示至少两个疾病文本子特征中的第i个疾病文本子特征,n表示疾病数目,D表示病历数据特征,similarty(D,pi)表示至少两个疾病相似度特征中的第i个疾病相似度特征。
在本发明实施例中,基于人工智能的预测分类模型获取装置对至少两个疾病相似度特征进行归一化处理,得到与至少两个疾病相似度特征一一对应的至少两个权重系数的过程可以采用归一化模型实现,体现出相似度特征中的重要程度的模型均可。
示例性的,采用类似与softmax的计算方法进行相似度的归一化计算,突出重要元素的权重,归一化模型可以为公式(7),如下:
其中,αi表示至少两个权重系数中第i个疾病相似度特征对应的权重系数,similarty(D,pj)表示至少两个疾病相似度特征中的第j个疾病相似度特征。
在本发明实施例中,基于人工智能的预测分类模型获取装置对至少两个疾病相似度特征进行归一化处理,得到与至少两个疾病相似度特征一一对应的至少两个权重系数的过程可以采用归一化模型实现,体现出相似度特征中的重要程度的模型均可。
示例性的,在本发明实施例中的基于人工智能的预测分类模型获取装置采用注意力机制算法,对至少两个疾病文本子特征、至少两个权重系数和病历数据特征进行特征融合,得到至少两种疾病对应的融合特征的过程是拼接的过程,其中,注意力机制算法可以采用公式(8)实现,如下:
其中,Attention(D,P)表示融合子特征或融合子特征向量,concat表示向量拼接方法。
需要说明的是,病历数据特征D也可以有多种,因此,Attention(D,P)每种病历数据与外部知识融合后的子特征,将最终所有的特征全部拼接融合后的最终特征才是融合特征。
需要说明的是,本发明实施例不限制向量拼接的方式。
在本发明实施例中,基于人工智能的预测分类模型获取装置最后基于融合特征在全连接层采用分类算法进行分类处理,得到分类结果。
在本发明实施例中,全连接层可以通过常见的机器学习的分类方法实现,例如,支持向量机、逻辑回归、决策树、GBDT或神经网络等,本发明实施例不作限制。
示例性的,如图8所示,采用现病史数据和疾病文本特征说明一个融合子特征的获取过程。预设疾病相关文本信息(例如:dis 1、dis 2、dis 3,……,dis n)经过LSTM编码后,取LSTM最后时刻的向量作为疾病文本特征,这里假设疾病文本特征中包含n个疾病文本子特征:p 1、p 2、p 3,……,p n。现病史数据经过LSTM编码后,取LSTM最后时刻的向量作为一个病历文字数据特征,attention(注意力机制算法)拼接或融合后,得到融合子特征,将所有的融合子特征、患者信息特征以及病历数值数据特征进行拼接后,得到融合特征,输入至全连接层进行分类处理,得到分类结果。
可以理解的是,在本发明实施例中,在知识融合层,将编码后的外部知识(疾病文本特征)和病历本身知识(病历数据特征)通过基于知识的注意力机制相融合,灵活的捕捉全局和局部的联系,同时相对于LSTM、CNN等网络结构,注意力机制具有复杂度小,参数少的特点。本方案的发明是在疾病诊断模型引入了外部知识,模拟了医生完整学习的方法,外部知识作为先验知识也为模型诊断提供了更为可靠的医学依据。同时,本发明实施例使用的医疗外部知识并不是需要耗费较大人力物力的知识图谱,而是更为容易获得的医疗文本数据,增加了该方法的可扩展性,同时在病历方面也进行相应结构化的解析,形成多模态的数据输入,使得诊断模型学习的知识更为丰富,更有利于辅助诊断模型在各个医院的推广,也更能辅助医生在疾病诊断上做出更好的判断,以及选择不同的编码方式,可以尝试将编码方式进行融合,降低模型复杂度。
在本发明的一些实施例中,基于人工智能的预测分类模型获取装置中事先构建或者设置有预测分类模型,以便在对患者进行疾病分类的时候,可以直接使用。因此,基于人工智能的预测分类模型获取装置在进行疾病分类之前,会先获取预测分类模型。本发明实施例提供的一种基于人工智能的预测分类模型获取方法中,如图9所示,针对获取预测分类模型的过程可以通过S104至S107实现。如下:
S104、按照预设的配置比例,从历史病历数据中获取训练样本,训练样本表征历史患者的病历数据与其确诊病症的对应关系。
S105、获取与训练样本对应的病症的训练疾病相关文本信息。
S106、调用设置的训练模型处理训练样本和训练疾病相关文本信息,得到训练结果。
S107、基于训练结果和训练样本,调整训练模型直至收敛,得到预测分类模型。
在本发明实施例中,训练样本会存在正样本和负样本,训练样本中包含历史病历数据和真实疾病这样一对数据。
在实际操作的过程中,疾病训练结果为优和疾病训练结果为差会存在一定的比例,这个比例即为配置比例,在形成预测分类模型时,基于人工智能的预测分类模型获取装置对训练样本的配置(正负样本的数据比例)也需要按照该配置比例进行设置。其中,正样本为历史病历数据与确诊的真实正确疾病的对应关系,负样本为历史病历数据与确诊的真实错误疾病的对应关系。
基于人工智能的预测分类模型获取装置在进行预测分类模型时,还需要获取与训练样本对应的病症的训练疾病相关文本信息,这里的训练疾病相关文本信息可以与预设疾病相关文本信息一致,也可以不一致,但是一致时最佳。
本发明实施例中的基于人工智能的预测分类模型获取装置将训练样本中的病历数据和训练疾病相关文本信息作为预先设置的训练模型的输入,其中,训练模型中的模型参数初始时为默认值,得到表征疾病结果的训练结果,基于训练结果和训练样本中的真实疾病的对比,调整训练模型直至收敛,从而得到预测分类模型。
可以理解的是,本发明实施例中的正样本和负样本涉及的允许范围越完整,后续的分类结果是越准确的。
本发明实施例中,不管采用何种训练模型,在开始训练之时,该训练模型的录入包括上述训练样本中的历史病历数据和训练疾病相关文本信息,经过多次试验如果训练样本中的历史病历数据或训练疾病相关文本信息不对训练结果产生有利影响或者错误的时候,就降低模型参数中训练样本中的历史病历数据或训练疾病相关文本信息的权重,如果上述数据对训练结果产生有利影响时候,就提高该数据的权重,如果一个参数的权重降低为0,那么在训练模型中该数据将不起任何作用了。经过本发明实施例的最终试验,上述的训练样本中的历史病历数据和训练疾病相关文本信息最终对训练结果能够产生积极影响的是长期数据即最终模型收敛时候的数据。预测分类模型的形成过程大致包括:将正样本或负样本,与训练疾病相关文本信息输入训练模型(即调用训练模型),从训练模型获得训练结果;通过调整模型参数,持续监测训练结果直至满足预设条件时,表征模型收敛,则将此时的训练模型作为预测分类模型。
在本发明的一些实施例中,本发明实施例中的预设条件可以为训练结果的准确率达到预设阈值,该预设阈值可以为99%,具体的预设阈值的确定可设置,本发明实施例不作限制,但是,预设阈值设置的越高,达到该预设阈值或预设条件的训练结果训练出来的预测分类模型就越精确。
在本发明的一些实施例中,预设条件还可以为预设损失函数。这时,基于人工智能的预测分类模型获取装置可以根据训练结果、训练样本和预设损失函数确定误差值;当误差值在预设阈值范围内时,确定训练模型收敛;当误差值未在预设阈值范围内时,调整训练模型中的模型参数,直至误差值达到预设阈值范围为止,确定训练模型收敛;将收敛的训练模型作为预测分类模型。
在本发明实施例中,训练模型中也包含输入层、编码层、知识融合层和全连接层。
基于人工智能的预测分类模型获取装置通过输入层将历史病历数据和训练疾病相关文本信息传输至编码层,进行对文字型数据的LSTM编码,以及对数值型数据的CNN编码之后,得到训练疾病文本特征和历史病历数据特征,将训练疾病文本特征和历史病历数据特征在知识融合层拼接后,得到训练融合特征,采用训练融合特征传输至全连接层,对全连接层的模型参数进行调整,直至训练模型收敛,得到预测分类模型。
可以理解的是,训练融合特征或融合特征向量既包含了历史病历数据中不同维度的输入信息,同时在其中也融入了外部知识的信息。训练融合特征向量进入到全连接层,得到最后的训练结果,同时本发明实施例使用分类算法常用的预设损失函数,得到了三个数据分类误差,回传梯度,更新权值,直至训练模型收敛,得到预测分类模型。
示例性的,预设损失函数可以为交叉熵损失函数,即公式(9),如下:
其中,L标识误差值,y表示训练样本中的真实疾病,k表示疾病种类,i表示第i个训练样本,pi,k表示第i个样本预测为第k种疾病的概率。
从以上流程可以看出,1)本发明实施例引入了训练样本中的病历数据和训练疾病相关文本信息的不同维度的与疾病相关的数据来对训练模型进行训练,根据训练结果确定最终核实的分类结果,如此提升了疾病该预测的准确性。2)本发明实施例采用的预测分类模型的一个显著特点是模型可以自我进化,根据训练样本中的病历数据和训练疾病相关文本信息的变换自动进行权值(即模型参数)的调整,避免基于规则的人工频繁介入调整模型参数。
可以理解的是,在本发明实施例中,相比现有的使用各种复杂的病历数据,本发明引入外部知识与病历数据结合作为主要数据源,疾病分类过程和模型构造过程都简单易行,不需要使用各种复杂的编码、聚类、筛选手段对特征进行复杂的构造和处理,大大降低了数据处理的工作量,使得预测分类模型简单可用。
本发明实施例提供一种存储有可执行数据处理指令的存储介质,其中存储有可执行数据处理指令,当可执行数据处理指令被处理器执行时,将引起处理器执行本发明实施例提供的基于人工智能的预测分类模型获取方法,例如,如图4、7和9示出的基于人工智能的预测分类模型获取方法。
在本发明的一些实施例中,存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在本发明的一些实施例中,可执行数据处理指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行数据处理指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,HyperText Markup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行数据处理指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
以上所述,仅为本发明的实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本发明的保护范围之内。
Claims (10)
1.一种基于人工智能的预测分类模型获取方法,其特征在于,包括:
从历史病历数据中获取训练样本,所述训练样本表征历史患者的病历数据与其确诊病症的对应关系;所述训练样本中的正负样本的配置比例为预设的配置比例;
获取与所述训练样本对应的病症的预设疾病相关文本信息;所述预设疾病相关文本信息表征多种疾病相关的症状描述性语言和对应的病症人群信息;所述预设疾病相关文本信息是对不同网站所记载的文字描述进行互相校验之后得到的;
调用设置的训练模型处理所述训练样本和预设疾病相关文本信息,得到训练结果;
基于所述训练结果和所述训练样本,调整所述训练模型直至收敛,得到所述预测分类模型,所述预测分类模型表征病历数据与疾病分类的对应关系;
利用所述预测分类模型,对所述预设疾病相关文本信息和当前病历数据分别进行特征编码,得到疾病文本特征和病历数据特征;所述疾病文本特征包括至少两种疾病对应的至少两个疾病文本子特征;
对所述至少两个疾病文本子特征和所述病历数据特征进行相似度计算,得到至少两个疾病相似度特征;
对所述至少两个疾病相似度特征进行归一化处理,得到与所述至少两个疾病相似度特征一一对应的至少两个权重系数;
采用注意力机制算法,对所述至少两个疾病文本子特征、所述至少两个权重系数和所述病历数据特征进行特征融合,得到至少两种疾病对应的融合特征;
基于所述融合特征进行分类处理,得到分类结果。
2.根据权利要求1所述的方法,其特征在于,所述基于所述训练结果和所述训练样本,调整所述训练模型直至收敛,得到所述预测分类模型,包括:
根据所述训练结果、所述训练样本和预设损失函数确定误差值;
当所述误差值在预设阈值范围内时,确定所述训练模型收敛;
当所述误差值未在预设阈值范围内时,调整所述训练模型中的模型参数,直至所述误差值达到所述预设阈值范围为止,确定所述训练模型收敛;
将收敛的训练模型作为所述预测分类模型。
3.根据权利要求1或2所述的方法,其特征在于,所述训练模型中包含输入层、编码层、知识融合层和全连接层;所述调用设置的训练模型处理所述训练样本和预设疾病相关文本信息,得到训练结果,包括:
通过所述输入层将所述训练样本和所述预设疾病相关文本信息传输至编码层,进行对文字型数据的长短期记忆网络LSTM编码,以及对数值型数据的卷积神经网络CNN编码,得到预设疾病文本特征和历史病历数据特征;
将所述预设疾病文本特征和所述历史病历数据特征在知识融合层拼接后,得到训练融合特征;
采用训练融合特征传输至所述全连接层,得到最后的训练结果。
4.根据权利要求1所述的方法,其特征在于,
所述预设疾病相关文本信息包括:多种疾病症状描述文字信息和对应的易患人群信息;
所述历史病历数据包括:历史病史数据、历史体征检查数据、历史检验数据或历史患者信息中的至少一种。
5.一种基于人工智能的预测分类模型获取装置,其特征在于,包括:
获取单元,用于从历史病历数据中获取训练样本,所述训练样本表征历史患者的病历数据与其确诊病症的对应关系;所述训练样本中的正负样本的配置比例为预设的配置比例;及获取与所述训练样本对应的病症的预设疾病相关文本信息;所述预设疾病相关文本信息表征多种疾病相关的症状描述性语言和对应的病症人群信息;所述预设疾病相关文本信息是对不同网站所记载的文字描述进行互相校验之后得到的;及调用设置的训练模型处理所述训练样本和预设疾病相关文本信息,得到训练结果;以及基于所述训练结果和所述训练样本,调整所述训练模型直至收敛,得到所述预测分类模型,所述预测分类模型表征病历数据与疾病分类的对应关系;
编码单元,用于利用所述预测分类模型,对所述预设疾病相关文本信息和当前病历数据分别进行特征编码,得到疾病文本特征和病历数据特征;所述疾病文本特征包括至少两种疾病对应的至少两个疾病文本子特征;
融合分类单元,用于对所述至少两个疾病文本子特征和所述病历数据特征进行相似度计算,得到至少两个疾病相似度特征;对所述至少两个疾病相似度特征进行归一化处理,得到与所述至少两个疾病相似度特征一一对应的至少两个权重系数;采用注意力机制算法,对所述至少两个疾病文本子特征、所述至少两个权重系数和所述病历数据特征进行特征融合,得到至少两种疾病对应的融合特征;基于所述融合特征进行分类处理,得到分类结果。
6.根据权利要求5所述的装置,其特征在于,
所述获取单元,还用于根据所述训练结果、所述训练样本和预设损失函数确定误差值;当所述误差值在预设阈值范围内时,确定所述训练模型收敛;当所述误差值未在预设阈值范围内时,调整所述训练模型中的模型参数,直至所述误差值达到所述预设阈值范围为止,确定所述训练模型收敛;将收敛的训练模型作为所述预测分类模型。
7.根据权利要求5或6所述的装置,其特征在于,所述训练模型中包含输入层、编码层、知识融合层和全连接层;
所述获取单元,还用于通过所述输入层将所述训练样本和所述预设疾病相关文本信息传输至编码层,进行对文字型数据的长短期记忆网络LSTM编码,以及对数值型数据的卷积神经网络CNN编码,得到预设疾病文本特征和历史病历数据特征;将所述预设疾病文本特征和所述历史病历数据特征在知识融合层拼接后,得到训练融合特征;采用训练融合特征传输至所述全连接层,得到最后的训练结果。
8.根据权利要求5所述的装置,其特征在于,
所述预设疾病相关文本信息包括:多种疾病症状描述文字信息和对应的易患人群信息;
所述历史病历数据包括:历史病史数据、历史体征检查数据、历史检验数据或历史患者信息中的至少一种。
9.一种基于人工智能的预测分类模型获取装置,其特征在于,包括:
存储器,用于存储可执行数据处理指令;
处理器,用于执行所述存储器中存储的可执行数据处理指令时,实现权利要求1至4任一项所述的基于人工智能的预测分类模型获取方法。
10.一种计算机可读存储介质,其特征在于,存储有可执行数据处理指令,用于引起处理器执行时,实现权利要求1至4任一项所述的基于人工智能的预测分类模型获取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910759287.9A CN110490251B (zh) | 2019-03-08 | 2019-03-08 | 基于人工智能的预测分类模型获取方法及装置、存储介质 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910759287.9A CN110490251B (zh) | 2019-03-08 | 2019-03-08 | 基于人工智能的预测分类模型获取方法及装置、存储介质 |
CN201910177259.6A CN109978022B (zh) | 2019-03-08 | 2019-03-08 | 一种医疗文本信息处理方法及装置、存储介质 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910177259.6A Division CN109978022B (zh) | 2019-03-08 | 2019-03-08 | 一种医疗文本信息处理方法及装置、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110490251A CN110490251A (zh) | 2019-11-22 |
CN110490251B true CN110490251B (zh) | 2022-07-01 |
Family
ID=67078183
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910177259.6A Active CN109978022B (zh) | 2019-03-08 | 2019-03-08 | 一种医疗文本信息处理方法及装置、存储介质 |
CN201910759287.9A Active CN110490251B (zh) | 2019-03-08 | 2019-03-08 | 基于人工智能的预测分类模型获取方法及装置、存储介质 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910177259.6A Active CN109978022B (zh) | 2019-03-08 | 2019-03-08 | 一种医疗文本信息处理方法及装置、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN109978022B (zh) |
Families Citing this family (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110428891A (zh) * | 2019-07-31 | 2019-11-08 | 腾讯科技(深圳)有限公司 | 一种就诊意图的处理方法、装置及设备 |
CN110569372B (zh) * | 2019-09-20 | 2022-08-30 | 四川大学 | 一种心脏病大数据知识图谱系统的构建方法 |
CN110706772B (zh) * | 2019-10-11 | 2023-05-09 | 北京百度网讯科技有限公司 | 一种排序方法及装置、电子设备、存储介质 |
CN110895561B (zh) * | 2019-11-13 | 2022-04-01 | 中国科学院自动化研究所 | 基于多模态知识感知的医疗问答检索方法、系统、装置 |
CN111008957A (zh) * | 2019-11-19 | 2020-04-14 | 北京推想科技有限公司 | 医疗信息处理方法和装置 |
CN110930038A (zh) * | 2019-11-28 | 2020-03-27 | 中国建设银行股份有限公司 | 一种贷款需求识别方法、装置、终端及存储介质 |
CN110993103B (zh) * | 2019-11-28 | 2023-06-02 | 阳光人寿保险股份有限公司 | 疾病风险预测模型的建立方法和疾病保险产品的推荐方法 |
CN112882909A (zh) * | 2019-11-29 | 2021-06-01 | 北京博瑞华通科技有限公司 | 燃料电池系统故障预测方法、装置 |
CN113012774B (zh) * | 2019-12-18 | 2024-08-30 | 医渡云(北京)技术有限公司 | 病案自动编码方法、装置、电子设备及存储介质 |
CN111126601A (zh) * | 2019-12-24 | 2020-05-08 | 上海商汤智能科技有限公司 | 信息处理方法及装置、电子设备和存储介质 |
CN111243697A (zh) * | 2020-01-08 | 2020-06-05 | 来康科技有限责任公司 | 一种基于神经网络对目标对象数据进行判断的方法及系统 |
CN112786129A (zh) * | 2020-03-19 | 2021-05-11 | 中国医学科学院北京协和医院 | 病例数据的分析方法、装置、电子设备及存储介质 |
CN113591886B (zh) * | 2020-04-30 | 2023-11-07 | 北京百度网讯科技有限公司 | 用于信息分类的方法、装置、设备及计算机可读存储介质 |
CN111613339B (zh) * | 2020-05-15 | 2021-07-09 | 山东大学 | 一种基于深度学习的相似病历查找方法与系统 |
CN111681726B (zh) * | 2020-05-29 | 2023-11-03 | 北京百度网讯科技有限公司 | 电子病历数据的处理方法、装置、设备和介质 |
CN111681756A (zh) * | 2020-05-29 | 2020-09-18 | 吾征智能技术(北京)有限公司 | 基于痰液性状认知的疾病征兆预测系统 |
CN111785385A (zh) * | 2020-06-29 | 2020-10-16 | 微医云(杭州)控股有限公司 | 疾病分类方法、装置、设备和存储介质 |
CN111767707B (zh) * | 2020-06-30 | 2023-10-31 | 平安科技(深圳)有限公司 | 雷同病例检测方法、装置、设备及存储介质 |
CN111915218A (zh) * | 2020-08-14 | 2020-11-10 | 中国工商银行股份有限公司 | 基于lstm-cnn的财务造假识别方法及系统 |
CN111899837A (zh) * | 2020-08-17 | 2020-11-06 | 江苏达实久信数字医疗科技有限公司 | 一种基于数字化手术室的手术报告协同方法及系统 |
CN112035361B (zh) * | 2020-08-31 | 2024-05-14 | 康键信息技术(深圳)有限公司 | 医疗诊断模型的测试方法、装置、计算机设备和存储介质 |
CN111986804A (zh) * | 2020-08-31 | 2020-11-24 | 平安医疗健康管理股份有限公司 | 基于体温数据进行模型训练的方法、装置和计算机设备 |
CN112016295B (zh) * | 2020-09-04 | 2024-02-23 | 平安科技(深圳)有限公司 | 症状数据处理方法、装置、计算机设备及存储介质 |
CN112328801B (zh) * | 2020-09-28 | 2022-06-14 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 事件知识图谱预测群体性事件的方法 |
CN112258339A (zh) * | 2020-09-29 | 2021-01-22 | 广东电力通信科技有限公司 | 一种基于电网系统技术的数据处理储备方法及系统 |
CN112199954B (zh) * | 2020-10-10 | 2023-11-10 | 平安科技(深圳)有限公司 | 基于语音语义的疾病实体匹配方法、装置及计算机设备 |
CN112164454A (zh) * | 2020-10-10 | 2021-01-01 | 联仁健康医疗大数据科技股份有限公司 | 一种分诊预测的方法、装置及电子设备 |
CN112444493B (zh) * | 2020-10-13 | 2024-01-09 | 中科巨匠人工智能技术(广州)有限公司 | 一种基于人工智能的光学探测系统及装置 |
CN112349409A (zh) * | 2020-10-22 | 2021-02-09 | 魏忠钰 | 一种疾病类型预测方法、装置、设备及系统 |
CN112201350A (zh) * | 2020-11-11 | 2021-01-08 | 北京嘉和海森健康科技有限公司 | 一种智能分诊方法、装置及电子设备 |
CN112509691B (zh) * | 2020-11-30 | 2024-04-19 | 北京百度网讯科技有限公司 | 鉴别诊断的提示方法、装置、电子设备及存储介质 |
CN112631139B (zh) * | 2020-12-14 | 2022-04-22 | 山东大学 | 智能家居指令合理性实时检测系统及方法 |
CN112786192A (zh) * | 2021-01-18 | 2021-05-11 | 吾征智能技术(北京)有限公司 | 一种手足口病智能认知系统、设备、存储介质 |
CN112836012B (zh) * | 2021-01-25 | 2023-05-12 | 中山大学 | 一种基于排序学习的相似患者检索方法 |
CN112784801A (zh) * | 2021-02-03 | 2021-05-11 | 紫东信息科技(苏州)有限公司 | 基于文本和图片的双模态胃部疾病分类方法及装置 |
CN112786198B (zh) * | 2021-02-08 | 2024-05-31 | 科大讯飞股份有限公司 | 诊疗信息推荐模型构建方法、诊疗信息推荐方法及装置 |
CN113051373B (zh) * | 2021-04-19 | 2024-02-13 | 讯飞医疗科技股份有限公司 | 文本分析方法、装置、电子设备和存储介质 |
CN113191134B (zh) * | 2021-05-31 | 2023-02-03 | 平安科技(深圳)有限公司 | 基于注意力机制的文档质量验证方法、装置、设备及介质 |
CN113345577B (zh) * | 2021-06-18 | 2022-12-20 | 北京百度网讯科技有限公司 | 诊疗辅助信息的生成方法、模型训练方法、装置、设备以及存储介质 |
CN113284576B (zh) * | 2021-06-30 | 2022-08-05 | 南通市妇幼保健院 | 一种急诊病人体征数据的智能收集方法及系统 |
CN113679348B (zh) * | 2021-08-26 | 2024-02-06 | 深圳平安智慧医健科技有限公司 | 血糖预测方法、血糖预测装置、设备及存储介质 |
CN113808663A (zh) * | 2021-09-01 | 2021-12-17 | 基诺莱(重庆)生物技术有限公司 | 基于人工智能的基因变异位点的匹配方法、系统及设备 |
CN113628709B (zh) * | 2021-10-09 | 2022-02-11 | 腾讯科技(深圳)有限公司 | 相似对象确定方法、装置、设备及存储介质 |
CN116010593B (zh) * | 2021-10-20 | 2024-09-06 | 腾讯科技(深圳)有限公司 | 疾病情感信息的确定方法、装置、计算机设备和存储介质 |
CN114141358A (zh) * | 2021-11-29 | 2022-03-04 | 平安医疗健康管理股份有限公司 | 基于知识图谱的疾病诊断装置、计算机设备及存储介质 |
CN114388135B (zh) * | 2022-01-19 | 2022-07-26 | 韩昕倬 | 一种孕妇指标数据分析方法、装置、设备及可读存储介质 |
CN114822737A (zh) * | 2022-03-31 | 2022-07-29 | 浙江大学 | 一种基于电子病历的李氏人工肝术前诊疗系统及使用方法 |
CN116098595B (zh) * | 2023-01-16 | 2023-09-05 | 广东海纳医疗科技有限公司 | 一种心源性及脑源性猝死监测预防系统和方法 |
CN115831356B (zh) * | 2023-02-20 | 2024-02-27 | 中国海洋大学 | 一种基于人工智能算法的辅助预测诊断方法 |
CN116452851A (zh) * | 2023-03-17 | 2023-07-18 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 病症分类模型的训练方法、装置、终端及可读存储介质 |
CN116798625A (zh) * | 2023-06-26 | 2023-09-22 | 清华大学 | 卒中风险筛查装置、电子设备和存储介质 |
CN117594227B (zh) * | 2024-01-18 | 2024-04-30 | 微脉技术有限公司 | 基于穿戴设备的健康状态监控方法、装置、介质及设备 |
CN117893528B (zh) * | 2024-03-13 | 2024-05-17 | 云南迪安医学检验所有限公司 | 一种心脑血管疾病分类模型的构建方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106897568A (zh) * | 2017-02-28 | 2017-06-27 | 北京大数医达科技有限公司 | 病历结构化的处理方法和装置 |
CN108182262A (zh) * | 2018-01-04 | 2018-06-19 | 华侨大学 | 基于深度学习和知识图谱的智能问答系统构建方法和系统 |
CN108595708A (zh) * | 2018-05-10 | 2018-09-28 | 北京航空航天大学 | 一种基于知识图谱的异常信息文本分类方法 |
CN109378064A (zh) * | 2018-10-29 | 2019-02-22 | 南京医基云医疗数据研究院有限公司 | 医疗数据处理方法、装置电子设备及计算机可读介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106909778B (zh) * | 2017-02-09 | 2019-08-27 | 北京市计算中心 | 一种基于深度学习的多模态医学影像识别方法及装置 |
CN108461110B (zh) * | 2017-02-21 | 2021-07-23 | 阿里巴巴集团控股有限公司 | 医疗信息处理方法、装置及设备 |
US10762169B2 (en) * | 2017-06-16 | 2020-09-01 | Accenture Global Solutions Limited | System and method for determining side-effects associated with a substance |
CN107785075A (zh) * | 2017-11-01 | 2018-03-09 | 杭州依图医疗技术有限公司 | 基于文本病历的小儿发热疾病深度学习辅助诊断系统 |
CN108415977B (zh) * | 2018-02-09 | 2022-02-15 | 华南理工大学 | 一个基于深度神经网络及强化学习的生成式机器阅读理解方法 |
CN108804591A (zh) * | 2018-05-28 | 2018-11-13 | 杭州依图医疗技术有限公司 | 一种病历文本的文本分类方法及装置 |
CN108920634A (zh) * | 2018-06-30 | 2018-11-30 | 天津大学 | 基于知识图谱的皮肤病特征分析系统 |
CN109273062A (zh) * | 2018-08-09 | 2019-01-25 | 北京爱医声科技有限公司 | Icd智能辅助编码系统 |
-
2019
- 2019-03-08 CN CN201910177259.6A patent/CN109978022B/zh active Active
- 2019-03-08 CN CN201910759287.9A patent/CN110490251B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106897568A (zh) * | 2017-02-28 | 2017-06-27 | 北京大数医达科技有限公司 | 病历结构化的处理方法和装置 |
CN108182262A (zh) * | 2018-01-04 | 2018-06-19 | 华侨大学 | 基于深度学习和知识图谱的智能问答系统构建方法和系统 |
CN108595708A (zh) * | 2018-05-10 | 2018-09-28 | 北京航空航天大学 | 一种基于知识图谱的异常信息文本分类方法 |
CN109378064A (zh) * | 2018-10-29 | 2019-02-22 | 南京医基云医疗数据研究院有限公司 | 医疗数据处理方法、装置电子设备及计算机可读介质 |
Non-Patent Citations (2)
Title |
---|
Early Diagnosis and Prediction of Sepsis Shock by Combining Static and Dynamic Information Using Convolutional-LSTM;Chen Lin et.sl;《2018 IEEE International Conference on Healthcare Informatics (ICHI)》;IEEE;20180726;第219-228页 * |
临床医疗文本中实体时序化问题研究;刘增健;《中国优秀博硕士学位论文全文数据库(博士)信息科技辑》;20190115;第I138-224页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109978022A (zh) | 2019-07-05 |
CN109978022B (zh) | 2022-07-29 |
CN110490251A (zh) | 2019-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110490251B (zh) | 基于人工智能的预测分类模型获取方法及装置、存储介质 | |
Shim et al. | Joint active feature acquisition and classification with variable-size set encoding | |
CN112183747B (zh) | 神经网络训练的方法、神经网络的压缩方法以及相关设备 | |
CN111666477B (zh) | 一种数据处理方法、装置、智能设备及介质 | |
CN112149414B (zh) | 文本相似度确定方法、装置、设备及存储介质 | |
US10984024B2 (en) | Automatic processing of ambiguously labeled data | |
KR102494360B1 (ko) | 기저귀 대변 이미지를 활용한 아기 건강 진단 솔루션 제공 방법, 장치 및 시스템 | |
Liu et al. | Augmented LSTM framework to construct medical self-diagnosis android | |
CN113609233B (zh) | 一种实体对象编码方法、装置、电子设备和存储介质 | |
CN111914562A (zh) | 电子信息分析方法、装置、设备及可读存储介质 | |
Mukherjee et al. | Natural language processing-based quantification of the mental state of psychiatric patients | |
CN115579141A (zh) | 一种可解释疾病风险预测模型构建方法以及疾病风险预测装置 | |
CN116994695A (zh) | 报告生成模型的训练方法、装置、设备及存储介质 | |
Jia et al. | DKDR: An approach of knowledge graph and deep reinforcement learning for disease diagnosis | |
Cheng et al. | Combining knowledge extension with convolution neural network for diabetes prediction | |
Siddik et al. | Psyche conversa-a deep learning based chatbot framework to detect mental health state | |
Abney | Inductive general grammar | |
Hou | Principal Component Analysis and Prediction of Students’ Physical Health Standard Test Results Based on Recurrent Convolution Neural Network | |
Kuang et al. | LSTM based classification model and its application for doctor-patient relationship evaluation | |
KR102548241B1 (ko) | 멀티모달 인공신경망을 활용한 강화학습을 통한 정신건강 상태 분류 장치 및 방법 | |
CN116682551B (zh) | 疾病预测方法、疾病预测模型训练方法和装置 | |
Yan et al. | EIRAD: An Evidence-based Dialogue System with Highly Interpretable Reasoning Path for Automatic Diagnosis | |
Smitha et al. | VOICE RECOGNITION BASED MEDI ASSISTANT | |
Patil et al. | Mental Health Chatbot System by Using Machine Learning | |
Al-Muhanna et al. | An Attention-Based Hybrid Optimized Residual Memory Network (AHRML) Method for Autism Spectrum Disorder (ASD) Detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |