CN116013534A - 一种基于医学指南和数据的临床辅助决策方法及系统 - Google Patents
一种基于医学指南和数据的临床辅助决策方法及系统 Download PDFInfo
- Publication number
- CN116013534A CN116013534A CN202211235674.0A CN202211235674A CN116013534A CN 116013534 A CN116013534 A CN 116013534A CN 202211235674 A CN202211235674 A CN 202211235674A CN 116013534 A CN116013534 A CN 116013534A
- Authority
- CN
- China
- Prior art keywords
- disease
- entity
- symptom
- data
- clinical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供了一种基于医学指南和数据的临床辅助决策方法及系统,包括客户端和服务器,所述系统执行以下步骤:S1:所述系统基于医院电子病历系统的病历数据库构建医疗知识图谱;S2:客户端响应用户输入的患者相关信息并将所述患者相关信息传输至服务器端;S3:服务器根据所述患者相关信息基于TF‑IDF症状权重计算算法匹配知识图谱生成决策辅助信息;S4:服务器将所生成的决策辅助信息返回客户端提供给用户。本发明能有效提升诊疗服务的智能化、规范化、标准化;降低诊疗风险,提升诊疗效率,可以有效解决医疗资源紧张、医生人力和能力不足的问题,推动医生院外随访和家庭医生签约服务有序、高效的实施。
Description
技术领域
本发明涉及涉及医疗系统技术领域,具体为一种基于医学指南和数据的临床辅助决策方法及系统。
背景技术
随着我国对公立医院高质量发展的逐步推进,公立医院发展方式从规模扩张转向提质增效,运行模式从粗放管理向精细化管理过渡,需通过持续改进医疗质量管理体系,提高医疗服务同质化水平,提升省域内诊疗能力,不断强化信息化的支撑作用,推进电子病历、智慧服务、智慧管理“三位一体”的智慧医院建设和医院信息标准化建设。当前信息技术的应用集中在医疗物资管理,医药费用结算和电子病历录入系统中,以提高经济和管理效率为目标;然而在临床诊断、用药决策和患者治疗过程中依然是依靠医护人员的经验来完成诊疗,误诊风险大,诊疗效率低。
临床决策支持系统(CDSS)是一种将计算机科学与AI技术和医疗领域知识相结合的软件工具,利用数据分析以及算法模型对医疗信息进行处理,形成结构化的医学知识,再结合web开发技术,通过简单直观的人机交互页面来为医护人员提供决策支持功能,经验证能够为医疗救治效率带来显著的提高,能够大大缓解国内医患供需关系失衡的问题。运用药物治疗监测软件,如计算机逻辑判断健康评价系统(HELP)、药房报告为主的药物相互作用监测和评价系统(MEDIPHOR)、药物相互作用药房自动审查系统(PADIS)、药物治疗审查系统(DTSS)等监测和指导临床用药成为保证并提高合理用药水平的有效途径之一。这些软件的功能主要是监测药物相互作用、审查药物的使用剂量、检查是否会有药品不良事件发生等。由于其可提供药物治疗相关信息并具备分析功能,为临床医护人员提供用药的辅助决策信息。上述系统统称为临床用药辅助决策系统。
临床用药辅助决策系统原理是通过构建大量完整和标准化药物利用的数据库和药学信息,利用计算机具有信息管理、快速检索、辅助决策的特点,协助医师、药师及时、准确的掌握有关信息,及其对病情的诊断、用药方案的确定。不同软件在表现形式、数据库的引用和功能方面有较大差异,但主要围绕提供在线的用药信息咨询、辅助临床医师正确开具用药医嘱、进行对患者的用药教育及通过用药剂量监测、药物相互作用的判断来预防或筛查潜在的药品不良反应事件进行合理用药的研究等。
例如专利申请CN2021103934126公开了一种基于大数据的临床辅助决策系统及方法,包括如下步骤:S1:首先医生在对患者进行治疗时,打开终端,打开终端后通过其触控屏输入患者身份信息,若其为第一次住院,医生需要对其所有东西输入,然后对其治疗,若不是第一次,则直接输入身份信息从临床数据库得出其信息进行治疗;S2:在治疗过程中,若医生遇到相应的治疗不清楚处,首先调取其专病数据库查找到与其相同的病历,然后观看其症状与治疗方法即可;S3:若在治疗中,遇到自己及专病数据库都解决不了的病历,则可以启动无线模块同过互联网搜索查找解决;S4:若在治疗过程中,遇到互联网与解决不了的病历,则直接通过无线模块连接对应的专家,通过华为5G数据连接在线治疗,通过摄像头可观看病人的情况,治疗完成后,记录其详细治疗,并录入数据库,以便下次治疗或其他医生遇到相同困难时及时观看治疗。
但是现有的技术方案基于大数据的临床辅助决策系统并没有整合医院临床数据库,在决策过程中不了解患者的历史诊疗信息,忽视患者的既往病史和治疗史而仅对患者当前症状进行辅助决策,无法准确的对患者给出诊断建议和治疗方案建议,在临床治疗过程中诊断准确率不高。例如,当临床数据库的患者诊疗信息中显示患者对某一药物过敏或有家族过敏史时,现有临床辅助决策系统并未进行判别并禁止对该患者使用该药物,则极易引发医疗事故。
发明内容
鉴于以上所述的现有技术的缺点,本发明的目的在于提供一种基于医学指南和数据的临床辅助决策方法及系统。该临床辅助决策系统应用于临床辅助诊断、用药决策和患者治疗过程,通过临床数据分析生成诊断和治疗决策的辅助信息,从而提高诊疗效率,避免用药错误,降低诊疗风险。
为实现上述目的,本发明提供如下技术方案:
一种基于临床数据和知识的临床辅助决策系统,包括客户端和服务器,所述系统执行以下步骤:
S1:所述系统基于医院电子病历系统的病历数据库构建医疗知识图谱;
S2:客户端响应用户输入的患者相关信息并将所述患者相关信息传输至服务器端;
S3:服务器根据所述患者相关信息基于TF-IDF症状权重计算算法匹配知识图谱生成决策辅助信息;
S4:服务器将所生成的决策辅助信息返回客户端提供给用户。
优选地,在步骤S1中,选择关系型数据库MySQL存储病历信息,选择图数据库Neo4j存储构建的医疗知识图谱,其中步骤S1构建医疗知识图谱的步骤包括:
S1.1模式层构建:根据医院电子病历系统的病历数据库的信息定义医学实体类,进一步定义实体的数据属性,并定义实体的对象属性,从而形成医学知识图谱的初步框架;
S1.2数据采集:从医院EHR系统导出电子病历数据,所述数据包括结构化数据和非结构化文本数据,其中非结构化文本数据通过自然语言处理算法来完成上述实体的识别工作,通过pandas数据分析库对结构化数据进行数据清洗,对电子病历数据进行数据清洗后,后续使用该数据集中的非结构化数据来训练模型,并通过算法模型进行实体关系抽取,用于构建医学知识图谱;
S1.3命名实体识别算法:采用BiLSTM-CRF模型执行命名实体识别任务,首先将医疗文本数据输入embedding层转换为词向量作为BiLSTM层的输入,BiLSTM层通过计算获取每个单词的标签得分矩阵进行标签预测,CRF层根据实际需要来设置一系列约束,对最终输出的预测标签进行优化;
S1.4知识加工及存储:从导出的非结构化文本数据进行实体抽取生成实体表,同时生成实体关系表,将实体表导入知识图谱的节点,并将实体关系表导入作为知识图谱中连接各节点的边。
进一步,定义的医学实体包括患者、疾病、科室、临床症状、辅助检查、治疗方式、手术、药物、护理方式,定义的实体数据属性包括:
更进一步,对象属性通过实体之间的语义关系来定义,其中定义的医学实体之间的语义关系包括:
实体1 | 语义关系 | 实体2 |
患者 | 患有(PHD) | 疾病 |
疾病 | 引起(DCD) | 疾病 |
疾病 | 属于(DBD) | 科室 |
疾病 | 接受(DRC) | 辅助检查 |
疾病 | 表现出(DSS) | 临床症状 |
疾病 | 需要(DNT) | 治疗方法 |
疾病 | 服用(DTM) | 药物 |
疾病 | 接受(DRO) | 手术 |
疾病 | 采取(DAN) | 护理方法 |
临床症状 | 表明(SID) | 疾病 |
临床症状 | 需要(SNT) | 治疗方法 |
科室 | 包含(DCS) | 临床症状 |
。
在以上医疗知识图谱的构建中,步骤S1.4知识加工及存储的步骤包括:
S1.4.1实体表抽取:从清洗完成的电子病历数据中导出需要的非结构化文本数据,之后利用训练好的BiLSTM-CRF算法模型进行实体抽取,将实体按照类别输出为CSV表;
S1.4.2实体对齐:多类实体指代同一种医疗知识的情况,需要将这些具有相同意义的实体替换成标准实体,生成融合实体表;
S1.4.3实体关系表抽取:对于抽取得到的实体,直接按照定义好的实体关系为每一条病历生成实体关系三元组,最终获取如下实体关系表
S1.4.4Neo4j导入:通过Neo4j自带的Cypher语句将实体表导入作为知识图谱中的节点,将实体关系表导入作为知识图谱中连接各节点的边。
在本发明的基于临床数据和知识的临床辅助决策系统中,在步骤S3中,服务器根据所述患者相关信息基于TF-IDF症状权重计算算法匹配知识图谱生成决策辅助信息的步骤包括:
S3.1、使用TF-IDF的症状权重计算疾病-症状权重,存储到知识图谱相应的关系边上;
S3.2、用户输入患者所述症状后形成一个症状列表S={s1,s2,...,sm},系统将根据症状列表S从知识图谱中读取就诊科室所有可能的疾病取并集后形成一个待匹配疾病列表D={d1,d2,...,dn};
S3.3、从待匹配疾病列表依次取出疾病dj,并从知识图谱中获取该疾病和患者症状的权重,计算疾病dj和用户输入的患者主诉症状之间的匹配度Mdj,s;
S3.4、依据匹配的疾病从知识图谱中读取该疾病的诊疗信息;
S3.5、如果当前参与计算的疾病不是待匹配疾病列表中最后一个疾病,则令j=j+1从疾病列表读取下一个疾病,并重新进入S3.3;如果当前计算的疾病是待匹配疾病列表中最后一个疾病,则计算完成后进入S3.6;
S3.6、将疾病与诊疗信息按匹配度降序排列后作为临床辅助决策结果返回用户界面,同时显示输入的症状对于每个疾病的权重值。
进一步,在步骤S3.1中,TF-IDF的症状权重计算算法对于症状的IDF-TF值的计算方法是将TF值和IDF值相乘,TF值代表的是记录到的症状频次在某一疾病总的症状频次中的占比,TF值的计算公式如下式(1)所示:
其中i为某一种症状,Count为该症状在该类疾病所有病历中出现的频次之和,Dn为该类疾病病历中所有症状出现的频次之和;
症状的IDF值代表的是该科室中的疾病总数和出现了该症状的疾病数量的比值,IDF值的计算公式如下式(2)所示:
其中N为该科室疾病种类个数,i(Si,Dn)表示该疾病的症状列表中是否包含当前症状,如果包含当前症状就取1,不包含就取0,
症状Si之于疾病Dn的权重wSi,Dn,由TF值和IDF值的乘积计算得出,如下式(3)所示:
更优选地,上式(2)中进一步取一个平滑常数a=0.1,得到式(4):
则症状Si之于疾病Dn的权重wSi,Dn,由下式(5)得出:
更进一步,所述步骤S3.3中计算匹配度的过程包括以下步骤:
假设输入的症状集合为S={s1,s2,...,sm},从知识图谱中获取症状集合可能表明待排查的疾病集合D={d1,d2,...,dn},再从该集合中依次取出待排查疾病,并且定义Md,s为待排查疾病d和用户输入症状的匹配度取值,则对于该待排查疾病dj和用户输入症状匹配度的计算如下式(6)所示:
其中Si(i=[1,2,...,m])为输入的症状,在计算疾病dj和输入症状的匹配度时,会首先读取该疾病的症状生成一个疾病的症状列表,如果输入的症状Si存在于疾病症状列表,那么Si取1,否则Si取0,wdj,si是上一小节存入知识图谱中的疾病-症状权重值。
与现有技术相比,本发明的有益效果是:本发明通过结合患者病历信息和识数据库进行检索匹配,分析并调取病症项,从而获取有比较列表的基于临床数据和知识的临床辅助决策信息。本发明能有效提升诊疗服务智能化、规范化、标准化;降低诊疗风险(通过疾病预测系统,能够实现整体提升诊断准确率,并能极大程度的降低误诊风险),提升诊疗效率(AI在正确的场景及时、准确的给到医生诊断建议和治疗方案建议,能够提升诊疗的效率,极大地方便了医生日常诊断与鉴别),可以有效解决医疗资源紧张、医生人力和能力不足的问题,推动医生院外随访和家庭医生签约服务有序、高效的实施。
附图说明
图1是医疗知识图谱的构建流程示意图;
图2是根据本发明方法构建的医学知识图谱框架的示意图;
图3是本发明方法中实体对齐的流程图;
图4是根据本发明方法在本发明系统中搜索的一个实例;
图5是根据本发明方法生成决策辅助信息的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“上”、“下”、“内”、“外”“前端”、“后端”、“两端”、“一端”、“另一端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
现有临床辅助决策通常通过数据挖掘、模型建立等方法来为医生和其他医务工作者提供医疗辅助决策,然而,由于目前医院门诊中存在大量与疾病诊断相关的数据,并且病历中的症状特征信息大多淹没在医生的描述性无格式文本中,所以常常导致现有临床决策辅助无法对患者症状进行准确提取,从而降低了临床决策辅助的准确性。
本发明通过结合患者病历信息和识数据库进行检索匹配,分析并调取病症项,从而获取有比较列表的基于临床数据和知识的临床辅助决策信息。本发明能有效提升诊疗服务智能化、规范化、标准化;降低诊疗风险(通过疾病预测系统,能够实现整体提升诊断准确率,并能极大程度的降低误诊风险),提升诊疗效率(AI在正确的场景及时、准确的给到医生诊断建议和治疗方案建议,能够提升诊疗的效率,极大地方便了医生日常诊断与鉴别),可以有效解决医疗资源紧张、医生人力和能力不足的问题,推动医生院外随访和家庭医生签约服务有序、高效的实施。
本发明提供了一种基于临床数据和知识的临床辅助决策系统,所述系统包括服务器端和客户端,其执行以下步骤:
步骤1:系统基于医院电子病历系统的病历数据库构建医疗知识图谱;
步骤2:客户端响应用户输入的患者个人基本信息、患者体征及临床症状等信息;
步骤3:将所述患者个人基本信息、患者体征及临床症状等信息传输至服务器端;
步骤4:服务器将患者信息基于TF-IDF症状权重计算算法匹配知识图谱生成临床决策辅助信息;
步骤5:服务器将上述决策辅助信息返回客户端;
步骤6:终端用户根据自身的判断选择全部、部分使用或不使用其最佳辅助决策信息完成最后的诊疗。
在步骤1中,关系型数据库选择MySQL存储病人病历信息;图数据库选择Neo4j存储构建的医疗知识图谱,医疗知识图谱是对各类医疗领域实体以及实体之间的关系描述,主要作为系统中医疗人员所使用功能的底层数据支撑。
具体地,所述步骤1中,医疗知识图谱的构建流程如图1所示,下面对医疗知识图谱的构建流程步骤进行详细说明。
步骤1.1模式层构建:知识图谱的模式层构建包括定义医学实体类、定义实体的数据属性以及定义实体的对象属性三部分;
1、医学实体:在一个实例中,医学实体包括“患者”、“疾病”、“科室”、“临床症状”、“辅助检查”、“治疗方式”、“手术”、“药物”、“护理方式”共计9种实体;
2、实体数据属性:实体数据属性具体情况如下表1所示:
表1医学实体数据属性
3、对象属性:在一个实例中,本发明定义了总共12条医学实体之间的语义关系,具体情况如下表2所示:
表2语义关系汇总
实体1 | 语义关系 | 实体2 |
患者 | 患有(PHD) | 疾病 |
疾病 | 引起(DCD) | 疾病 |
疾病 | 属于(DBD) | 科室 |
疾病 | 接受(DRC) | 辅助检查 |
疾病 | 表现出(DSS) | 临床症状 |
疾病 | 需要(DNT) | 治疗方法 |
疾病 | 服用(DTM) | 药物 |
疾病 | 接受(DRO) | 手术 |
疾病 | 采取(DAN) | 护理方法 |
临床症状 | 表明(SID) | 疾病 |
临床症状 | 需要(SNT) | 治疗方法 |
科室 | 包含(DCS) | 临床症状 |
。
在完成医学实体定义、数据属性和对象属性的添加等工作之后,初步形成了医学知识图谱框架,后续数据采集、命名实体识别等知识图谱构建工作都会根据这个框架来完成,最终形成的知识图谱框架效果如图2所示。
步骤1.2数据采集:本发明实施例所使用的数据为某医院EHR系统导出的电子病历数据,包括结构化数据和非结构化文本数据,其中非结构化文本数据通过自然语言处理算法来完成上述实体的识别工作。结构化数据的数据清洗工作,通过pandas数据分析库来进行,pandas提供了丰富的库函数,根据需求制定各项数据清洗规则,调用库函数来完成数据清洗工作。对电子病历数据进行数据清洗后,后续将使用该数据集中的非结构化数据来训练模型,并通过算法模型进行实体关系抽取,用于构建医学知识图谱。
步骤1.3命名实体识别算法:命名实体识别(NER)任务是自然语言处理(NLP)的基础,本质上是对标注的实体进行分类的分类任务。本发明NER任务使用的算法模型是BiLSTM-CRF模型,模型整体分为三层,首先将医疗文本数据输入embedding层转换为词向量作为BiLSTM层的输入;BiLSTM层通过计算获取每个单词的标签得分矩阵,进行标签预测;CRF层可以根据实际需要来设置一系列约束,对最终输出的预测标签进行优化。
步骤1.4知识加工及存储:
步骤1.4.1实体表抽取:实体抽取工作通过调用训练好的BiLSTM-CRF算法模型来完成,从清洗完成的电子病历数据中导出需要的非结构化文本数据,之后利用算法模型进行实体抽取。由于每一份电子病历中都可能多次出现相同的实体,为避免数据冗余,需要对一份病历中抽取出的实体进行去重,之后将实体按照类别输出为CSV表。
步骤1.4.2实体对齐:存在多类实体指代同一种医疗知识的情况,需要将这些具有相同意义的实体替换成标准实体,其本质也是对实体去重的一个过程。本发明通过构建词典的方式来完成该项任务,实体对齐的流程如图3所示。
词典构建主要是针对“疾病”和“症状”这两类实体进行。首先利用爬虫技术从临床医学知识库、万方诊疗知识库等医疗网站获得“疾病”和“症状”相关数据,构建两个词典,词典包括实体的别称、缩写名称以及英文名称,作为该实体的扩展实体名,每个扩展实体名都有一个对应的标准实体名称。之后将算法抽取出来的“疾病”和“症状”的原始实体表进行去重,再依次查询去重之后的实体是否存在与词典之中,如果在词典中查询到了扩展实体名,那么将该实体替换成扩展实体对应的标准实体名称再存入表中,如果在词典中未能查询到扩展实体名,那么将该原始实体存入表中,最终完成实体融合,形成融合实体表。
步骤1.4.3实体关系表抽取:对于某一个病例抽取得到的实体,都是该患者在治疗过程中实际的诊疗知识,因此可以认为各实体之间本身是相关联的,在生成实体关系三元组时,可以直接按照定义好的实体关系为每一条病历生成实体关系三元组,最终获取到“疾病引起疾病”、“疾病属于科室”、“疾病接受辅助检查”、“疾病表现出临床症状”、“疾病需要治疗方式”、“疾病服用药物”、“疾病接受手术”、“疾病采取护理方式”、“临床症状表明疾病”、“临床症状需要治疗方式”、“科室包括临床症状”等12个实体-关系表。
步骤1.4.4Neo4j导入:通过Neo4j自带的Cypher语句将实体表导入作为知识图谱中的节点,将实体关系表导入作为知识图谱中连接各节点的边。在实际应用中,医护人员可根据实际需要进行搜索,以查询“肺癌”这一疾病的实例为例,查询的效果如图4所示。
在上述步骤2中,系统获取病人的体征、临床症状等信息,并初步分析得出患者所患疾病,将可能存在的疾病降序排列形成一个疾病列表推送给医生,能够为医生缩小疾病范围,提供诊疗思路,能够极大地提高门诊的效率。
在上述步骤5中,“手术”、“药物”、“治疗方式”、“辅助检查”等实体主要是用于后续临床路径创建时使用,通过为Neo4j创建倒排索引来为用户提供迅速的诊疗辅助功能。
在上述步骤4中,服务器结合医疗知识图谱进行判断,通过倒排索引生成决策辅助信息。这种临床决策辅助信息的生成方法包括的步骤如下具体说明。
S1)使用TF-IDF的症状权重计算疾病-症状权重,存储到知识图谱相应的关系边上;
S2)用户输入患者所述症状后形成一个症状列表S={s1,s2,...,sm},系统将根据症状列表S从知识图谱中读取就诊科室所有可能的疾病取并集后形成一个待匹配疾病列表D={d1,d2,...,dn};
S3)从待匹配疾病列表依次取出疾病dj,并从知识图谱中获取该疾病和患者症状的权重,计算疾病dj和用户输入的患者主诉症状之间的匹配度Mdj,s;
S4)依据匹配的疾病从知识图谱中读取该疾病的诊疗信息;
S5)如果当前参与计算的疾病不是待匹配疾病列表中最后一个疾病,则令j=j+1从疾病列表读取下一个疾病,并重新进入S3;如果当前计算的疾病是待匹配疾病列表中最后一个疾病,则计算完成后进入S6;
S6)将疾病与诊疗信息按匹配度降序排列后作为临床辅助决策结果返回用户界面,同时显示输入的症状对于每个疾病的权重值。
在步骤S1)中,TF-IDF的症状权重计算算法对于症状的IDF-TF值的计算方法是将TF值和IDF值相乘,TF值代表的是记录到的症状频次在某一疾病总的症状频次中的占比,症状的TF值能够很好地反应患有某疾病患者表现出症状的概率,TF值的计算公式如式(1)所示:
其中Count为该症状在该类疾病所有病历中出现的频次之和,Dn为该类疾病病历中所有症状出现的频次之和。
症状的IDF值代表的是该科室中的疾病总数和出现了该症状的疾病数量的比值,IDF值能够很好地反应症状在科室所有疾病中存在的普遍性,IDF值的计算公式如式(2)所示:
其中N为该科室疾病种类个数,i(Si,Dn)表示该疾病的症状列表中是否包含当前症状,如果包含当前症状就取1,不包含就取0。
症状Si之于疾病Dn的权重wSi,Dn,由TF值和IDF值的乘积计算得出,如公式(3)所示:
考虑到如果当前症状在该科室的每一个疾病的症状列表中都有出现这一特殊情况,那么就有IDF=log1=0,将使得后续计算出来的TF-IDF值都为0,因此取一个平滑常数a=0.1来避免上述情况,因此则有式(4):
则症状Si之于疾病Dn的权重wSi,Dn的计算由公式(5)得出:
后续的疾病诊断功能需要使用症状权重来实现,因此将算法计算得到的疾病-症状权重值存储到知识图谱相应的关系边上,在进行疾病诊断时调用。
步骤S3)中计算疾病匹配度算法如下所述:
在实现过程中,假设输入的症状集合为S={s1,s2,...,sm},从知识图谱中获取症状集合可能表明待排查的疾病集合D={d1,d2,...,dn},再从该集合中依次取出待排查疾病,并且定义Md,s为待排查疾病d和用户输入症状的匹配度取值,则对于该待排查疾病dj和用户输入症状匹配度的计算公式如式(6):
公式(6)中Si(i=[1,2,...,m])为输入的症状,在计算疾病dj和输入症状的匹配度时,会首先读取该疾病的症状生成一个疾病的症状列表,如果输入的症状Si存在于疾病症状列表,那么Si取1,否则Si取0,wdj,si是上一小节存入知识图谱中的疾病-症状权重值,
在一个实施例中,一个完整的决策辅助信息的生成流程如图5所示。
下面以一个具体实施例来对本发明的基于临床数据和知识的临床辅助决策系统的使用进行更详细的说明。
例如在一个例示性的临床辅助决策系统中,用户在客户端输入患者症状为S={腹泻,淋巴结肿大,气短};系统检索知识图谱获取待匹配疾病列表为D={乙状结肠癌,慢性肠胃炎,直肠结缔息肉,肝转移瘤},计算疾病匹配度,结果如下表3所示:
表3疾病匹配度
检索知识图谱获取疾病辅助诊疗方法,结果如表4所示:
表4疾病辅助诊疗方法
疾病名称 | 匹配度 | 辅助诊疗方法 |
乙状结肠癌 | 0.154 | 术前化疗、术前放疗、手术切除 |
慢性肠胃炎 | 0.109 | 诺氟沙星、苯乙派喧、中药治疗 |
直肠结缔息肉 | 0.069 | 口服、电灼切除、微创疗法、开腹手术 |
肝转移瘤 | 0.057 | 射频消融术、联合动脉化疗灌注栓塞 |
;
将疾病匹配度信息与辅助诊疗方法返回客户端;用户选择是否使用或部分使用辅助诊疗结果。
本发明的方案通过临床数据分析生成诊断和治疗决策的辅助信息,有效地提高了诊疗效率,避免用药错误,降低诊疗风险。具体来说,本发明的工作具有以下重要的意义。
1、构建了医疗领域知识图谱。以医院EHR数据作为原始数据,通过pandas数据分析库进行了初步的数据清洗工作。之后对领域知识图谱进行模式层构建,定义了9种实体和12种实体关系,由于原始数据中并未包含所有需要的实体和关系数据,无法直接用于构建知识图谱,因此标注了电子病历文本作为数据集来训练BiLSTM-CRF算法模型,抽取出了构建知识图谱需要的领域知识,再利用Neo4j自带的导入功能,构建了一个医学知识图谱。
2、针对疾病诊断问题,研究了基于知识图谱的疾病诊断算法。算法模拟了医务人员在实际业务中根据患者症状主诉得出病情结论的思考流程,首先借助存储于知识图谱中科室的症状和疾病之间的频次计算出了症状和疾病之间的权重,接着利用计算出的权重设计了一个疾病诊断算法,能够根据输入的患者主诉得出一个按照匹配度降序排列的疾病列表和辅助诊疗方法,为患者门诊提供较有意义的指导和建议。
本发明未详述之处,均为本领域技术人员的公知技术。
最后所要说明的是:以上具体实施方式仅用以说明本发明的技术方案而非限制,尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改和等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (9)
1.一种基于临床数据和知识的临床辅助决策系统,包括客户端和服务器,其特征在于,所述系统执行以下步骤:
S1:所述系统基于医院电子病历系统的病历数据库构建医疗知识图谱;
S2:客户端响应用户输入的患者相关信息并将所述患者相关信息传输至服务器端;
S3:服务器根据所述患者相关信息基于TF-IDF症状权重计算算法匹配知识图谱生成决策辅助信息;
S4:服务器将所生成的决策辅助信息返回客户端提供给用户。
2.如权利要求1所述的基于临床数据和知识的临床辅助决策系统,其特征在于,在步骤S1中,选择关系型数据库MySQL存储病历信息,选择图数据库Neo4j存储构建的医疗知识图谱,其中步骤S1构建医疗知识图谱的步骤包括:
S1.1模式层构建:根据医院电子病历系统的病历数据库的信息定义医学实体类,进一步定义实体的数据属性,并定义实体的对象属性,从而形成医学知识图谱的初步框架;
S1.2数据采集:从医院EHR系统导出电子病历数据,所述数据包括结构化数据和非结构化文本数据,其中非结构化文本数据通过自然语言处理算法来完成上述实体的识别工作,通过pandas数据分析库对结构化数据进行数据清洗,对电子病历数据进行数据清洗后,后续使用该数据集中的非结构化数据来训练模型,并通过算法模型进行实体关系抽取,用于构建医学知识图谱;
S1.3命名实体识别算法:采用BiLSTM-CRF模型执行命名实体识别任务,首先将医疗文本数据输入embedding层转换为词向量作为BiLSTM层的输入,BiLSTM层通过计算获取每个单词的标签得分矩阵进行标签预测;CRF层根据实际需要来设置一系列约束,对最终输出的预测标签进行优化;
S1.4知识加工及存储:从导出的非结构化文本数据进行实体抽取生成实体表,同时生成实体关系表,将实体表导入知识图谱的节点,并将实体关系表导入作为知识图谱中连接各节点的边。
4.如权利要求3所述的基于临床数据和知识的临床辅助决策系统,其特征在于,对象属性通过实体之间的语义关系来定义,其中定义的医学实体之间的语义关系包括:
。
5.如权利要求2所述的基于临床数据和知识的临床辅助决策系统,其特征在于,S1.4知识加工及存储的步骤包括:
S1.4.1实体表抽取:从清洗完成的电子病历数据中导出需要的非结构化文本数据,之后利用训练好的BiLSTM-CRF算法模型进行实体抽取,将实体按照类别输出为CSV表;
S1.4.2实体对齐:多类实体指代同一种医疗知识的情况,需要将这些具有相同意义的实体替换成标准实体,生成融合实体表;
S1.4.3实体关系表抽取:对于抽取得到的实体,直接按照定义好的实体关系为每一条病历生成实体关系三元组,最终获取如下实体关系表
;
S1.4.4Neo4j导入:通过Neo4j自带的Cypher语句将实体表导入作为知识图谱中的节点,将实体关系表导入作为知识图谱中连接各节点的边。
6.如权利要求1所述的基于临床数据和知识的临床辅助决策系统,其特征在于,在步骤S3中,服务器根据所述患者相关信息基于TF-IDF症状权重计算算法匹配知识图谱生成决策辅助信息的步骤包括:
S3.1、使用TF-IDF的症状权重计算疾病-症状权重,存储到知识图谱相应的关系边上;
S3.2、用户输入患者所述症状后形成一个症状列表S={s1,s2,...,sm},系统将根据症状列表S从知识图谱中读取就诊科室所有可能的疾病取并集后形成一个待匹配疾病列表D={d1,d2,...,dn};
S3.3、从待匹配疾病列表依次取出疾病dj,并从知识图谱中获取该疾病和患者症状的权重,计算疾病dj和用户输入的患者主诉症状之间的匹配度Mdj,s;
S3.4、依据匹配的疾病从知识图谱中读取该疾病的诊疗信息;
S3.5、如果当前参与计算的疾病不是待匹配疾病列表中最后一个疾病,则令j=j+1从疾病列表读取下一个疾病,并重新进入S3.3;如果当前计算的疾病是待匹配疾病列表中最后一个疾病,则计算完成后进入S3.6;
S3.6、将疾病与诊疗信息按匹配度降序排列后作为临床辅助决策结果返回用户界面,同时显示输入的症状对于每个疾病的权重值。
7.如权利要求6所述的基于临床数据和知识的临床辅助决策系统,其特征在于,在步骤S3.1中,TF-IDF的症状权重计算算法对于症状的IDF-TF值的计算方法是将TF值和IDF值相乘,TF值代表的是记录到的症状频次在某一疾病总的症状频次中的占比,TF值的计算公式如下式(1)所示:
其中i为某一种症状,Count为该症状在该类疾病所有病历中出现的频次之和,Dn为该类疾病病历中所有症状出现的频次之和;
症状的IDF值代表的是该科室中的疾病总数和出现了该症状的疾病数量的比值,IDF值的计算公式如下式(2)所示:
其中N为该科室疾病种类个数,i(Si,Dn)表示该疾病的症状列表中是否包含当前症状,如果包含当前症状就取1,不包含就取0,
症状Si之于疾病Dn的权重wSi,Dn,由TF值和IDF值的乘积计算得出,如下式(3)所示:
9.如权利要求7或8所述的基于临床数据和知识的临床辅助决策系统,其特征在于,所述步骤S3.3中计算匹配度的过程包括以下步骤:
假设输入的症状集合为S={s1,s2,...,sm},从知识图谱中获取症状集合可能表明待排查的疾病集合D={d1,d2,...,dn},再从该集合中依次取出待排查疾病,并且定义Md,s为待排查疾病d和用户输入症状的匹配度取值,则对于该待排查疾病dj和用户输入症状匹配度的计算如下式(6)所示:
其中Si(i=[1,2,...,m])为输入的症状,在计算疾病dj和输入症状的匹配度时,会首先读取该疾病的症状生成一个疾病的症状列表,如果输入的症状Si存在于疾病症状列表,那么Si取1,否则Si取0,wdj,si是上一小节存入知识图谱中的疾病-症状权重值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211235674.0A CN116013534A (zh) | 2022-10-10 | 2022-10-10 | 一种基于医学指南和数据的临床辅助决策方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211235674.0A CN116013534A (zh) | 2022-10-10 | 2022-10-10 | 一种基于医学指南和数据的临床辅助决策方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116013534A true CN116013534A (zh) | 2023-04-25 |
Family
ID=86036233
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211235674.0A Pending CN116013534A (zh) | 2022-10-10 | 2022-10-10 | 一种基于医学指南和数据的临床辅助决策方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116013534A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116543910A (zh) * | 2023-07-05 | 2023-08-04 | 山东大学 | 降低上呼吸道感染临床不确定性的抗生素辅助决策系统 |
CN116779190A (zh) * | 2023-06-25 | 2023-09-19 | 急尼优医药科技(上海)有限公司 | 一种基于物联网的医疗平台用户随访管理系统及方法 |
CN117393155A (zh) * | 2023-12-12 | 2024-01-12 | 智业软件股份有限公司 | 一种基于患者生命体征的智能临床护理决策方法和系统 |
CN117423470A (zh) * | 2023-10-30 | 2024-01-19 | 盐城市第三人民医院 | 一种慢性病临床决策支持系统及构建方法 |
CN117438079A (zh) * | 2023-12-19 | 2024-01-23 | 北京万方医学信息科技有限公司 | 循证知识抽提及辅助临床决策的方法及介质 |
CN117690600A (zh) * | 2024-02-01 | 2024-03-12 | 北方健康医疗大数据科技有限公司 | 基于知识图谱的传染病预测方法、系统、终端及存储介质 |
-
2022
- 2022-10-10 CN CN202211235674.0A patent/CN116013534A/zh active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116779190A (zh) * | 2023-06-25 | 2023-09-19 | 急尼优医药科技(上海)有限公司 | 一种基于物联网的医疗平台用户随访管理系统及方法 |
CN116779190B (zh) * | 2023-06-25 | 2024-02-13 | 急尼优医药科技(上海)有限公司 | 一种基于物联网的医疗平台用户随访管理系统及方法 |
CN116543910A (zh) * | 2023-07-05 | 2023-08-04 | 山东大学 | 降低上呼吸道感染临床不确定性的抗生素辅助决策系统 |
CN116543910B (zh) * | 2023-07-05 | 2023-11-03 | 山东大学 | 降低上呼吸道感染临床不确定性的抗生素辅助决策系统 |
CN117423470A (zh) * | 2023-10-30 | 2024-01-19 | 盐城市第三人民医院 | 一种慢性病临床决策支持系统及构建方法 |
CN117423470B (zh) * | 2023-10-30 | 2024-04-23 | 盐城市第三人民医院 | 一种慢性病临床决策支持系统及构建方法 |
CN117393155A (zh) * | 2023-12-12 | 2024-01-12 | 智业软件股份有限公司 | 一种基于患者生命体征的智能临床护理决策方法和系统 |
CN117393155B (zh) * | 2023-12-12 | 2024-03-26 | 智业软件股份有限公司 | 一种基于患者生命体征的智能临床护理决策方法和系统 |
CN117438079A (zh) * | 2023-12-19 | 2024-01-23 | 北京万方医学信息科技有限公司 | 循证知识抽提及辅助临床决策的方法及介质 |
CN117438079B (zh) * | 2023-12-19 | 2024-03-12 | 北京万方医学信息科技有限公司 | 循证知识抽提及辅助临床决策的方法及介质 |
CN117690600A (zh) * | 2024-02-01 | 2024-03-12 | 北方健康医疗大数据科技有限公司 | 基于知识图谱的传染病预测方法、系统、终端及存储介质 |
CN117690600B (zh) * | 2024-02-01 | 2024-04-30 | 北方健康医疗大数据科技有限公司 | 基于知识图谱的传染病预测方法、系统、终端及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020147758A1 (zh) | 药品的推荐方法、装置、介质和电子设备 | |
Shi et al. | Semantic health knowledge graph: semantic integration of heterogeneous medical knowledge and services | |
CN116013534A (zh) | 一种基于医学指南和数据的临床辅助决策方法及系统 | |
WO2022041729A1 (zh) | 用药推荐方法、装置、设备及存储介质 | |
Tu et al. | A practical method for transforming free-text eligibility criteria into computable criteria | |
US8670997B2 (en) | Quality metric extraction and editing for medical data | |
CN110459320B (zh) | 一种基于知识图谱的辅助诊疗系统 | |
US20020035486A1 (en) | Computerized clinical questionnaire with dynamically presented questions | |
US11915828B2 (en) | System and method of using machine learning for extraction of symptoms from electronic health records | |
JP2018503902A (ja) | 診断妥当性基準を採用することによって病態を特定するための診断検査の最適なシーケンスを決定することに適合した医用鑑別診断装置 | |
Mendonça et al. | Accessing heterogeneous sources of evidence to answer clinical questions | |
CN107578797A (zh) | 一种基于云计算的健康诊疗方案推荐的方法及其系统 | |
Zhou et al. | Mapping partners master drug dictionary to RxNorm using an NLP-based approach | |
An | Construction and application of Chinese breast cancer knowledge graph based on multi-source heterogeneous data | |
CN113641784A (zh) | 医教研一体化的医疗知识推荐方法和系统 | |
Hu et al. | The recommender system for a cloud-based electronic medical record system for regional clinics and health centers in China | |
Berlanga et al. | Medical data integration and the semantic annotation of medical protocols | |
Kumar et al. | NATURAL LANGUAGE PROCESSING: HEALTHCARE ACHIEVING BENEFITS VIA NLP | |
US11940986B1 (en) | Determining repair status information using unstructured textual repair data in response to natural language queries | |
CN117012374B (zh) | 一种融合事件图谱和深度强化学习的医疗随访系统及方法 | |
US11869674B2 (en) | Translation of medical evidence into computational evidence and applications thereof | |
Cui | Ontology-guided health information extraction, organization, and exploration | |
Zheng | Computational Approaches to Assisting Patients' Medical Comprehension from Electronic Health Records | |
Doppalapudi | Relevant information extraction and lexical simplification of unstructured clinical notes | |
Wijayakusuma et al. | WHO ICD-10 BASED ONLINE DISEASE DIAGNOSIS FOR GENERATING DIGITAL MEDICAL RECORD APPLICATION DEVELOPMENT |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |