CN114783580A - 一种医疗数据质量评估方法及系统 - Google Patents

一种医疗数据质量评估方法及系统 Download PDF

Info

Publication number
CN114783580A
CN114783580A CN202210695053.4A CN202210695053A CN114783580A CN 114783580 A CN114783580 A CN 114783580A CN 202210695053 A CN202210695053 A CN 202210695053A CN 114783580 A CN114783580 A CN 114783580A
Authority
CN
China
Prior art keywords
medical
user
diagnosis
information
institution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210695053.4A
Other languages
English (en)
Other versions
CN114783580B (zh
Inventor
周校平
陈竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Boke Guotai Information Technology Co ltd
Original Assignee
Wuhan Boke Guotai Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Boke Guotai Information Technology Co ltd filed Critical Wuhan Boke Guotai Information Technology Co ltd
Priority to CN202210695053.4A priority Critical patent/CN114783580B/zh
Publication of CN114783580A publication Critical patent/CN114783580A/zh
Application granted granted Critical
Publication of CN114783580B publication Critical patent/CN114783580B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本说明书实施例提供一种医疗数据质量评估方法及系统,该方法包括:基于医疗机构上传在医疗服务平台的医疗信息,获取用户的就诊数据,其中,就诊数据包括用户基本信息、诊疗信息中的至少一种;获取上传医疗信息的医疗机构的机构信息,其中,机构信息包括医疗机构的诊疗项目的类别信息;结合机构信息及就诊数据,获取医疗机构的可信度评分;响应于接收到用户发出的评分查询指令,将可信度评分展示给用户。

Description

一种医疗数据质量评估方法及系统
技术领域
本说明书涉及数据质量管理技术领域,特别涉及一种医疗数据质量评估方法及系统。
背景技术
随着医疗信息技术的广泛应用,在医疗服务、健康保健和卫生管理等方面产生了海量数据。一方面,大量的医疗数据为用户提供了更为丰富全面的医疗信息,另一方面,由于数据量繁杂、数据质量参差不齐,用户难以获取到准确可靠的医疗信息和医疗资源。因此,如何让用户从海量医疗数据和众多医疗机构中准确选取就诊机构,提高就诊的及时性和有效性,是亟待解决的问题。
因此,希望提供一种医疗数据质量评估方法及系统,方便用户快速、准确的选择就诊机构,及时就诊。
发明内容
本说明书实施例之一提供一种医疗数据质量评估方法,所述方法包括:基于医疗机构上传在医疗服务平台的医疗信息,获取用户的就诊数据;所述就诊数据包括用户基本信息、诊疗信息中的至少一种;获取上传所述医疗信息的所述医疗机构的机构信息,所述机构信息包括所述医疗机构的诊疗项目的类别信息;结合所述机构信息及所述就诊数据,获取所述医疗机构的可信度评分; 响应于接收到所述用户发出的评分查询指令,将所述可信度评分展示给所述用户。
本说明书实施例之一提供一种医疗数据质量评估系统,所述系统包括:就诊数据获取模块,用于基于医疗机构上传在医疗服务平台的医疗信息,获取用户的就诊数据;所述就诊数据包括用户基本信息、诊疗信息中的至少一种;机构信息获取模块,用于获取上传所述医疗信息的所述医疗机构的机构信息,所述机构信息包括所述医疗机构的诊疗项目的类别信息;评分获取模块,用于结合所述机构信息及所述就诊数据,获取所述医疗机构的可信度评分;展示模块,用于响应于接收到所述用户发出的评分查询指令,将所述可信度评分展示给所述用户。
附图说明
本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本说明书一些实施例所示的医疗数据质量评估方法的应用场景示意图;
图2是根据本说明书一些实施例所示的医疗数据质量评估系统的模块示意图;
图3是根据本说明书一些实施例所示的医疗数据质量评估方法的示例性流程图;
图4是根据本说明书一些实施例所示的获取医疗机构的可信度评分的示例性示意图;
图5是根据本说明书一些实施例所示的基于医疗知识图谱确定各个用户的病情诊断可信度的示例性流程图。
具体实施方式
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
应当理解,本文使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
图1是根据本说明书一些实施例所示的医疗数据质量评估系统的应用场景示意图。如图1所示,医疗数据质量评估系统的应用场景100可以包括处理器110、网络120、存储器130、终端140、医疗机构150、医疗服务平台160。
医疗数据质量评估系统可以通过实施本说明书中披露的方法和/或过程来确定医疗机构的可信度评分。例如,当用户有需要就诊时,可以查询有意愿就诊的多个医院的可信度评分,并基于可信度评分进行选择进行就诊的医院。
处理器110可以处理与医疗数据质量评估系统相关的数据和/或信息。在一些实施例中,处理器110从医疗服务平台160、存储器130和/或终端140以访问信息和/或数据。例如,处理器110可以从医疗服务平台160和/或从存储器130获取用户的就诊数据等。再例如,处理器110可以从医疗机构150和/或医疗服务平台160获取医疗机构的机构信息等。在一些实施例中,处理器110可以处理获取的信息和/或数据。例如,处理器110可以结合获取的机构信息及就诊数据获取医疗机构的可信度评分。在一些实施例中,处理器110可以包括一个或以上处理引擎(例如,单芯片处理引擎或多芯片处理引擎)。仅作为示例,处理器110可以包括中央处理单元(CPU)。处理器110可以处理从其他设备或系统组成部分中获得的数据、信息和/或处理结果,并基于这些数据、信息和/或处理结果执行程序指令,以执行本说明书中描述的一个或以上功能。
在一些实施例中,处理器110可以单独设置,也可以与医疗服务平台160集成设置。
网络120可以包括提供能够促进医疗数据质量评估系统的应用场景100中各个组件的信息和/或数据交换的任何合适的网络。医疗数据质量评估系统的应用场景100中的一个或多个组件(例如,处理器110、存储器130、终端140、医疗机构150、医疗服务平台160)之间可以通过网络120交换信息和/或数据。例如,网络120可以将从医疗服务平台160获取的医疗机构的可信度评分发送给终端140。
在一些实施例中,网络120可以是有线网络或无线网络中的任意一种或多种。在一些实施例中,网络120可以包括一个或以上网络接入点。例如,网络120可以包括有线或无线网络接入点。在一些实施例中,网络可以是点对点的、共享的、中心式的等各种拓扑结构或者多种拓扑结构的组合。
存储器130可以用于存储数据、指令和/或任何其他信息。在一些实施例中,存储器130可以存储从应用场景100中其他组件(例如,处理器110、医疗服务平台160等)中获得的数据和/或信息。例如,存储器130可以存储用户的就诊数据、医疗机构150的机构信息、用户的评分查询指令以及医疗知识图谱等。在一些实施例中,存储器130可以设置在处理器110中。在一些实施例中,存储器130可包括大容量存储器、可移除存储器等或其任意组合。
终端140可以指用户所使用的一个或多个终端设备或软件。在一些实施例中,终端140可以包括具有显示器的移动设备、平板计算机、笔记本电脑等或其任意组合。在一些实施例中,用户可以通过终端140发出评分查询指令。在一些实施例中,终端140可以接受处理器110获取的医疗机构的可信度评分,并通过显示器展示给用户。
医疗机构150可以是用户可以享受医疗服务的机构。用户可以指患者。在一些实施例中,医疗机构150可以通过网络将医疗信息上传至医疗服务平台160,也可以上传医疗机构150的机构信息。
医疗服务平台160可以是与医疗数据质量评估系统通讯连接的用于进行数据存储和处理的云计算平台。在一些实施例中,处理器110可以结合医疗服务平台160的就诊数据以及机构信息获取医疗机构150的可信度评分。
应当注意基于医疗数据质量评估系统的应用场景100仅仅是为了说明的目的而提供,并不意图限制本说明书的范围。对于本领域的普通技术人员来说,可以根据本说明书的描述,做出多种修改或变化。例如,应用场景还可以包括数据库。又例如,应用场景100可以在其他设备上实现以实现类似或不同的功能。然而,变化和修改不会背离本说明书的范围。
图2是根据本说明书一些实施例所示的医疗数据质量评估系统的模块示意图。
如图2所示,医疗数据质量评估系统200可以包括就诊数据获取模块210、机构信息获取模块220、评分获取模块230和展示模块240。
就诊数据获取模块210可以用于基于医疗机构上传在医疗服务平台的医疗信息,获取用户的就诊数据,其中,就诊数据包括用户基本信息、诊疗信息中的至少一种。
机构信息获取模块220可以用于获取上传医疗信息的医疗机构的机构信息,其中,机构信息包括医疗机构的诊疗项目的类别信息。
在一些实施例中,就诊数据获取模块210可以基于医疗知识图谱获取就诊数据。在一些实施例中,机构信息获取模块220可以基于医疗知识图谱获取机构信息。
在一些实施例中,医疗知识图谱包括若干节点及边,其中,医疗知识图谱的节点包括医疗机构节点、诊疗项目节点、用户节点,节点特征包括节点对应的属性信息;医疗知识图谱的边包括第一类边、第二类边、第三类边中的至少一种。在一些实施例中,医疗知识图谱的第一类边用于连接医疗机构节点及医疗机构节点对应的诊疗项目节点,第二类边用于连接诊疗项目节点及诊疗项目节点对应的用户节点,第三类边用于连接具有相互影响关系的诊疗项目节点。在一些实施例中,第一类边的边特征可以包括项目类型特征,第二类边的边特征可以包括医疗数据特征,第三类边的边特征可以包括影响程度。
评分获取模块230可以用于结合机构信息及就诊数据,获取医疗机构的可信度评分。
在一些实施例中,评分获取模块230可以用于基于医疗知识图谱确定各个用户节点对应的用户的病情诊断可信度,基于用户的病情诊断可信度确定医疗机构的可信度评分。
在一些实施例中,医疗机构的可信度评分可以包括医疗机构包含的诊疗项目的可信度评分及医疗机构的总的可信度评分。在一些实施例中,可以基于医疗机构包含的诊疗项目的可信度评分或用户的病情诊断可信度确定医疗机构总的可信度评分。在一些实施例中,可以基于用户的病情诊断可信度确定医疗机构包含的诊疗项目的可信度评分。
在一些实施例中,评分获取模块230可以用于基于各个用户节点对应的医疗数据特征中包含的时间信息对医疗知识图谱进行划分,得到用户在若干时间点对应的医疗知识子图。在一些实施例中,评分获取模块230可以用于获取目标时间,获取目标用户在目标时间对应的医疗知识子图作为目标子图。在一些实施例中,评分获取模块可以用于基于目标子图预测目标用户在第一时间点的预测病情。在一些实施例中,评分获取模块230可以用于基于预测病情与目标用户在第一时间点的实际病情的比对结果确定目标用户的病情诊断可信度。
展示模块240可以用于响应于接收到用户发出的评分查询指令,将可信度评分展示给用户。
图3是根据本说明书一些实施例所示的医疗数据质量评估方法的实例性流程图。
步骤310,基于医疗机构上传在医疗服务平台的医疗信息,获取用户的就诊数据;就诊数据包括用户基本信息、诊疗信息中的至少一种。
医疗机构可以指从事疾病诊断、治疗活动的卫生机构。例如,医院、卫生院、保健院、急救中心、学校医务室、药店、牙科诊所、中医诊所、体检中心等。
医疗服务平台可以是用于接收、传输和/或记录医疗信息的云平台或外部数据库。在一些实施例中,医疗服务平台可以和医疗机构通过网络相连接,医疗机构可以将医疗信息上传至医疗服务平台,用户可以连接医疗服务平台来查看医疗信息。
医疗信息可以指与用户在医疗机构接受诊疗服务有关的信息。
就诊数据可以指反映用户在该项目就诊的情况的数据,在一些实施例中,就诊数据包括用户基本信息、诊疗信息中的至少一种。
用户基本信息是指与用户自然属性相关的信息,例如,用户的身份信息、性别、年龄等。
诊疗信息可以指与用户就诊有关的信息。诊疗信息可以包括就诊医院、就诊时间、就诊内容、就诊结果等。就诊内容可以包括和医生之间对话内容、接收的检查项目等。就诊结果可以包括用户的病症及其严重程度、对应的处理方法、医生开具的药方等。
在一些实施例中,就诊数据获取模块可以通过对医疗信息进行提取,获取所需要的用户的就诊数据。
步骤320,获取上传医疗信息的医疗机构的机构信息,机构信息包括医疗机构的诊疗项目的类别信息。
机构信息可以指与医疗机构有关的信息。例如,机构信息可以指医疗机构的建立时间、规模、等级、类型等,以及开设的诊疗项目、诊疗项目的医生以及资质等。
诊疗项目可以指用户可以在医疗机构进行治疗的项目。在一些实施例中,诊疗项目可以与医疗机构设置的科室对应。例如,诊疗项目可以包括骨科、妇产科、呼吸内科、消化内科、神经内科、心血管内科等。
诊疗项目的类别信息可以指用户就诊时诊疗项目对应的病症信息。在一些实施例中,一个诊疗项目可以与至少一个类别信息对应。例如,当诊疗项目为呼吸内科时,其对应的类别信息可以包括呼吸危重症、肺部感染、慢阻肺、哮喘、肺癌、肺间质病、肺栓塞、肺血管病、介入呼吸病学等。
在一些实施例中,机构信息获取模块可以通过连接医疗机构的网站获取医疗机构的信息。
步骤330,结合机构信息及就诊数据,获取医疗机构的可信度评分。
医疗机构的可信度评分可以指对医疗机构的诊疗能力的可信度的评分。
在一些实施例中,可以基于与历史机构信息和历史就诊数据的对比,确定与机构信息及就诊数据相似的历史数据对应的医疗机构的可信度评分作为本次医疗机构的可信度评分。
在一些实施例中,可以利用训练好的机器学习模型来确定医疗机构的可信度评分,例如,将机构信息及就诊数据输入训练好的机器学习模型中,输出医疗机构的可信度评分。
在一些实施例中,可以基于医疗知识图谱确定各个用户节点对应的用户的病情诊断可信度,基于用户的病情诊断可信度确定医疗机构的可信度评分。关于医疗机构的可信度评分的详细内容可以参见本说明书其他部分的描述,例如,图4。
步骤340,响应于接收到用户发出的评分查询指令,将可信度评分展示给用户。
在一些实施例中,用户可以通过终端输入评分查询指令,终端通过网络将评分查询指令发送给处理器,处理器将对应的包括可信度评分的数据包通过网络发送给终端,终端获取包括可信度评分的数据包并进行解析,得到可信度评分,并通过人机交互方式,通过终端的显示器将可信度评分展示给用户。
基于本说明书一些实施例提供的医疗数据质量评估方法,可以为用户(例如患者)在就诊前提供医疗机构的可信度评分,为用户提供了可靠方便的参考信息,用户可以基于该医疗机构的可信度评分选择适合自己的医疗机构进行就诊。
图4是根据本说明书一些实施例所示的获取医疗机构的可信度评分的示意图。
步骤410,基于医疗知识图谱确定各个用户节点对应的用户的病情诊断可信度。
医疗知识图谱可以指基于医疗机构以及用户的医疗信息构建的语义网络图谱。
在一些实施例中,就诊数据、机构信息可以基于医疗知识图谱获取。医疗知识图谱包括若干节点及边。
医疗知识图谱的节点可以包括医疗机构节点、诊疗项目节点、用户节点。节点特征包括节点对应的属性信息。其中,每一个医疗机构节点对应一个医疗机构,医疗结构对应的属性信息可以指医疗机构资质特征,例如,可以包括医疗机构的规模、等级、类型及专业度等。在一些实施例中,可以将医疗机构的可信度评分作为专业度信息,关于如何确定医疗机构的可信度评分的说明参见本说明书其他部分的内容。
每一个诊疗项目节点对应于医疗机构的一个诊疗项目。一个医疗机构可以对应至少一个诊疗项目,在一些实施例中,诊疗项目对应的属性信息可以包括诊疗项目和其类别信息。例如,诊疗项目对应的属性信息可以包括该诊疗项目属于骨科、妇产科、呼吸内科、消化内科、神经内科、心血管内科中哪一科,或该诊疗项目属于其所属科别下的哪项病症等。再例如,当诊疗项目为呼吸内科时,诊疗项目对应的属性信息可以包括其属于呼吸危重症、肺部感染、慢阻肺、哮喘、肺癌、肺间质病、肺栓塞、肺血管病、介入呼吸病学中哪项病症。
每一个用户节点对应于一个患者。用户节点对应的属性信息可以指用户基本信息,可以包括用户的身份信息、性别、年龄等。
医疗知识图谱的边包括第一类边、第二类边、第三类边中的至少一种,第一类边用于连接医疗机构节点及医疗机构节点对应的诊疗项目节点,第二类边用于连接诊疗项目节点及诊疗项目节点对应的用户节点;第三类边用于连接具有相互影响关系的诊疗项目节点;第二类边的边特征包括医疗数据特征,第一类边的边特征包括项目类型特征,第三类边的边特征包括影响程度。
第一类边可以用于表示医疗结构中设立的诊疗项目。基于第一类边特征可以确定医疗机构中的诊疗项目。如图4所示,医疗机构1和诊疗项目A之间的实线箭头表示第一类边。
第二类边可以用于反映用户参与诊疗项目的情况。如图4所示,用户甲和诊疗项目A之间的点画线箭头表示第二类边,表示用户甲参与过诊疗项目A。
在一些实施例中,第二类边的边特征可以包括医疗数据特征,该医疗数据特征可以是诊疗信息。医疗数据特征包括就诊时间、就诊内容、就诊结果等。在一些实施例中,第二类边的边特征可以用向量或者其他形式表示。
在一些实施例中,用户节点和诊疗项目节点之间存在一条第二类边,第二类边的边特征可能包括至少一个就诊时间。例如,当用户在就诊时间1和就诊时间2分别在骨科进行就诊,第二类边的边特征可以为(a1,a2,b,c),其中,a1表示就诊时间1,a2表示就诊时间2,b表示就诊内容,c表示就诊结果。
在一些实施例中,医疗数据特征中包括时间属性,一条边仅具有一个时间属性。不同的时间属性对应不同的就诊时间,对应不同的第二类边。例如,2022年1月3日及5月6日用户丁均前往医疗机构1就诊并接收诊疗项目C的检查,则用户丁与诊疗项目C之间可以具有两条第二类边,且每条边对应一个时间属性,如分别为2022年1月3日及2022年5月6日。
第三类边可以用于表示诊疗项目节点之间的相关性及影响程度。如图4所示,项目A和项目B之间的虚线箭头表示第三类边。基于第三类边特征可以得到两个诊疗项目之间的相关性及影响程度。例如,糖尿病存在多种并发症,如糖尿病肾病,那么说明糖尿病对肾病的影响程度较大,糖尿病对应的诊疗项目为分泌科,则在肾病科和分泌科这两个诊疗项目节点之间可以存在第三类边。
病情可以指与用户患病有关的情况。病情可以包括用户患病的种类、患病的阶段等。例如,用户的病情可以包括艾滋病、艾滋病的急性感染期等。在一些实施例中,病情可以用向量、数据集或其他方式表示,向量的元素可以表示用户患病类、患病的阶段。例如,病情可以用(a,b)表示,a表述对应艾滋病,b表示艾滋病三期。
病情诊断可以指医生对用户病情的诊断。病情诊断可以包括对病情的诊断结论、对应的用药等。
病情诊断可信度可以指对病情诊断结果的可信程度。病情诊断可信度可以用分数或者其他方式表示。例如,病情诊断可信度为80分表示医生对该病情的诊断的可信度高。
在一些实施例中,可以基于所述医疗知识图谱确定各个所述用户节点对应的用户的病情诊断可信度。
例如,可以基于各个用户节点对应的所述医疗数据特征中包含的时间信息对医疗知识图谱进行划分,得到用户在若干时间点对应的医疗知识子图;获取目标时间,获取目标用户在目标时间对应的医疗知识子图作为目标子图;基于目标子图预测目标用户在第一时间点的预测病情;基于预测病情与目标用户在第一时间点的实际病情的比对结果确定目标用户的病情诊断可信度。关于目标用户的病情诊断可信度的详细内容可以参见本说明书其他部分的描述,例如,图5。
步骤420,基于用户的病情诊断可信度确定医疗机构的可信度评分。
在一些实施例中,可以预先收集若干历史用户的病情诊断可信度及其对应的医疗机构的可信度评分,并将用户的病情诊断可信度与医疗机构的可信度评分的对应关系表预设在处理器中,基于用户的病情诊断可信度通过对应关系表确定对应的医疗机构的可信度评分。在一些实施例中,也可以基于训练好的机器学习模型对用户的病情诊断可信度的处理,确定医疗机构的可信度评分。
在一些实施例中,医疗机构的可信度评分包括医疗机构包含的诊疗项目的可信度评分及医疗机构的总的可信度评分。医疗机构包含的诊疗项目的可信度评分基于用户的病情诊断可信度确定;医疗机构的总的可信度评分基于医疗机构包含的诊疗项目的可信度评分确定或基于用户的病情诊断可信度确定。
医疗机构包含的诊疗项目的可信度评分可以指医疗机构所包含的每一个诊疗项目的可信度评分。
在一些实施例中,可以基于每一个用户针对同一个诊疗项目的病情诊断可信度来确定针对每一个诊疗项目的可信度评分。如图4所示,可以基于用户甲确定一个对项目F的病情诊断可信度评分、基于用户乙确定一个对项目B的病情诊断可信度确定项目F的可信度评分。可以将多个用户对应的同一个诊疗项目病情诊断可信度评分的平均值或加权求和值作为医疗机构该项目的病情诊断可信度评分。
关于每一个用户的每一个诊疗项目的病情诊断可信度评分的详细内容可以参见本说明书其他部分的描述,例如,图5。
在确定医疗机构包含的每个诊疗项目的病情诊断可信度评分后,即可基于各个诊疗项目的病情诊断可信度评分确定医疗机构可信度评分,例如,可以将各个诊疗项目的病情诊断可信度评分的均值作为医疗机构可信度评分。又如,可以将各个诊疗项目的病情诊断可信度评分的加权求和值作为医疗机构可信度评分。权重可以与用户当前想要参加的诊疗项目相关,例如,与用户当前想要参加的诊疗项目越相近的诊疗项目的权重值越大。
基于用户的病情诊断可信度进而确定医疗机构的可信度评分,可以结合用户实际的诊疗数据对医疗机构的可信度评分进行确定,增加了可信度评分的置信度,可以为患者在选择医疗机构时提供真实有效的依据。
通过基于用户的病情诊断可信度确定诊疗项目的可信度评分,可以使用户确定出该医疗机构的优势项目,即可以确定该医疗机构的专业度;基于医疗机构的总的可信度评分或基于所述用户的病情诊断可信度确定医疗机构的总的可信度评分,可以使用户确定该医疗机构的总体水平。通过医疗机构的优势项目和总体诊疗水平,用户可以选择出适合自身病情的医疗机构。
图5是根据本说明书一些实施例所示的确定目标用户的病情诊断可信度的实例性流程图。
步骤510,基于各个用户节点对应的医疗数据特征中包含的时间信息对医疗知识图谱进行划分,得到用户在若干时间点对应的医疗知识子图。
医疗知识子图可以指从医疗知识图谱中筛选的某一用户节点在某一时间点在医疗机构的诊疗项目就诊所构成的图。
在一些实施例中,医疗知识子图可以基于医疗知识图谱获取。在一些实施例中,医疗知识子图可以包括子节点和子边。医疗知识子图中的子节点和子边数量可以和医疗知识图谱中的节点数量和边数量相同,或少于医疗知识图谱中的节点数量和边数量。例如,医疗知识图谱中,基于用户甲在时间点1在医疗机构1中的就诊信息可以获得医疗知识子图1,医疗知识子图1包括的节点至少有医疗机构1、用户甲,及用户甲在时间点1在医疗机构1参加的诊疗项目节点A,医疗知识子图1中包括的边至少有连接医疗机构1与诊疗项目A的第一类边、连接用户甲与诊疗项目A的第二类边。
一些实施例中,每一个医疗知识子图与用户、与其具有第二类边的诊疗项目、第二类边的边特征中的就诊时间一一对应。例如,用户甲在时间点1在诊疗项目A就诊可以对应于医疗知识子图1,用户甲在时间点2在诊疗项目A就诊可以对应于医疗知识子图2。
在一些实施例中,医疗知识子图中可以包括用户在目标时间点参加的诊疗项目节点及与该参加的诊疗项目节点具有关联的至少一个诊疗项目节点。例如,时间点可以设为2022年5月26日,用户甲在该时间点内去医疗机构A的分泌科就诊,那么医疗知识子图中用户节点为用户甲,诊疗项目节点为分泌科(如对应为图4的项目A节点)和与分泌科具备第三类边的诊疗项目(例如肾科,如对应为图4的项目B节点等),医疗机构节点为与分泌科具有第一类边的医疗机构节点,包括医疗机构1,第二类边是分泌科(项目A节点)和用户甲的连线,其属性可以是医疗数据特征,包括就诊时间2022年5月26日。
在一些实施例中,在医疗知识子图中与目标用户具有第二类边的诊疗项目可以作为目标诊疗项目。在医疗知识子图中与目标诊疗项目具有第三类边的诊疗项目可以作为候选诊疗项目。
在一些实施例中,医疗知识子图可以包括从医疗知识图谱中筛选的包括同一用户同一时间点就诊的医疗机构的诊疗项目节点、与该诊疗项目节点具有第一类边的医疗机构节点以及与该诊疗项目节点具有第三类边的诊疗项目。如图4所示,针对于用户丙在时间点t的一个医疗知识子图中的节点可以包括用户丙、项目B、项目A、项目C、项目F、项目D、医疗机构1,其中用户丙和项目B具有第二类边,项目B与医疗机构1具有第一类边,项目A、项目C、项目F、项目D与项目B具有第三类边。
步骤520,获取目标时间,获取目标用户在目标时间对应的医疗知识子图作为目标子图。
目标用户可以指用于确定病情诊断可信度的患者。
目标时间可以指确定病情诊断可信度的历史时间。在一些实施例中,目标用户可以在目标时间内关于同一病症就诊。例如,目标时间可以是2017年5月27日-28日,用户在2017年5月27日就诊。
在一些实施例中,目标时间可以是时间点和时间段。例如,目标时间为2010年1月至6月,基于目标时间可以获取目标用户的2010年1月至6月中所有的医疗知识子图。
目标子图可以指在目标时间获取的医疗知识子图。在一些实施例中,目标子图可以包括同一用户针对同一诊疗项目在目标时间获取的医疗知识子图。
在一些实施例中,可以基于目标时间及目标用户,在前述获得的用户在若干时间点对应的医疗知识子图中,筛选目标用户的医疗知识子图中,第二类边的时间属性对应为目标时间的医疗知识子图作为目标子图。
步骤530,基于目标子图预测目标用户在第一时间点的预测病情。
第一时间点可以是晚于目标时间的历史时间。例如,目标时间为2021年5月,第一时间点可以为2021年8月。
预测病情就是基于目标子图中第二类边得到的医疗数据特征对目标用户在目标时间后(如第一时间点)的病情发展情况的预测结果。在一些实施例中,预测病情可以包括是否康复、病情的严重程度等。例如,基于2021年1月1日用户甲的目标子图A中第二类边包含的医疗数据特征得到,医生诊断的用户甲病情为普通重度感冒,并开具了相应的药,则预测病情可以是对2021年1月10日用户甲的病情预测为康复或者轻度感冒的结果。再例如,基于在2021年1月1日用户乙的目标子图B中第二类边包含的医疗数据特征得到,医生诊断的病情用户乙病情为肺癌三期,可以预测在2022年1月1日用户乙病情为肺癌四期。
在一些实施例中,可以基于目标子图通过病情预测模型得到用户在第一时间点的预测病情。
在一些实施例中,病情预测模型可以用来确定用户在第一时间点的预测病情。病情预测模型的输入可以是目标子图,输出可以是用户在第一时间点的预测病情。在一些实施例中,病情预测模型可以是机器学习模型,例如,可以是GNN等图神经网络模型。
在一些实施例中,病情预测模型的参数可以通过训练获取。在一些实施例中,病情预测模型可以通过多个带有标签的训练样本得到。例如,可以将多个带有标签的训练样本输入初始病情预测模型中,通过标签和初始病情预测模型的预测结果构建损失函数,基于损失函数的迭代更新初始病情预测模型的参数,当初始病情预测模型的损失函数满足预设条件时模型训练完成,其中,预设条件可以是损失函数收敛、迭代的次数达到阈值等。
在一些实施例中,训练样本可以包括基于历史数据构建的医疗知识图谱,通过同一用户针对同一个诊疗项目的就诊时间过滤,获取同一个用户针对同一个诊疗项目的多个医疗知识子图,标签可以是每个医疗知识子图对应的用户在后续预设时间点时的实际病情。在一些实施例中,训练样本可以基于历史数据获取。
在一些实施例中,基于病情预测模型还可以实现基于对多个目标用户对应的多个目标子图的处理,同时确定多个目标用户的预测病情。
步骤540,基于预测病情与目标用户在第一时间点的实际病情的比对结果确定目标用户的病情诊断可信度。
在一些实施例中,可以通过连接医疗服务平台获取目标用户在第一时间点的实际病情。实际病情可以用向量或者数据集表示。在一些实施例中,可以对病的种类预设数据库,数据库中病的种类与字母一一对应。例如,实际病情可以用向量(a,3)表示,其中a可以肺癌,3可以表示晚期。
在一些实施例中,比对结果可以用第一时间点的预测病情和实际病情的相似度来表示。在一些实施例中,可以基于数学方法或算法确定预测病情和实际病情的相似度。例如,若预测病情和实际病情分别为(x1,x2,x3)和(y1,y2,y3)两个数据集,可以基于(x1,x2,x3)和(y1,y2,y3)中的x1与y1、x2与y2、x3与y3,确定对应的差值,在对各个差值进行归一化,将差值映射到0~1,分别得到z1、z2、z3,再将差值归一化计算后获得的z1、z2、z3求平均值z,该平均值z则为相似度。相似度越大,则说明目标用户的病情诊断可信度越高。
在一些实施例中,可以通过预测病情和实际病情表示的向量之间的向量距离来确定第一时间点的预测病情和实际病情的相似度,其中,向量距离可以基于余弦距离等表示。向量距离越大,预测病情和实际病情的相似度越低,则说明目标用户的病情诊断可信度越低。
在一些实施例中,为了提升获得的目标用户的病情诊断可信度的准确性,可以获取多个时间点的目标子图,并得到多个预测病情,进而将多个预测病情与对应的实际病情进行比较,以得到多个病情诊断可信度,并综合确定最终的病情诊断可信度。
例如,目标时间可以包括多个历史时间点,则可以基于目标时间获得多个目标子图。
在一些实施例中,目标时间为时间段时,同一目标用户针对同一病症的就诊时间可能是连续或不连续的。例如,目标时间为5月1日-5月7日,目标用户甲在2020年5月1日、2020年5月3日针对心脏病就诊,目标子图可以包括2020年5月1日、2020年5月3日目标用户甲针对心脏病的医疗知识子图。又如,目标时间为5月1日-5月9日,目标用户在目标时间内就心脏病连续就诊。
在一些实施例中,为了减少数据量以及后期的计算量,对于目标时间内连续的医疗数据,可以在目标时间内按照一定的时间间隔来获取目标子图。例如,每隔m天选取一个医疗知识子图。其中,时间间隔可以人为设定。例如,目标时间为5月1日-5月9日,目标用户在目标时间内就心脏病连续就诊,时间间隔预设为3天,目标子图可以包括2020年5月1日、2020年5月4日、2020年5月7日目标用户甲针对心脏病的医疗知识子图。
在一些实施例中,可以根据用户的病情发展速度来确定目标时间对应的时间段内的时间间隔。仅作为示例的,时间间隔的选取可以和病情发展速度成反比。例如,发展速度较慢的病情,时间间隔相对大。
在一些实施例中,获取多个目标子图时,可以基于目标子图对原医疗知识图谱的覆盖率及多个目标子图间的重合率综合确定各个目标子图中需要包含的节点及边,尽量使得多个目标子图对原医疗知识图谱的覆盖率大,且多个目标子图间的重合率低。
覆盖率可以指目标子图的数据覆盖原医疗知识图谱数据的比例,可以理解为目标子图中节点及边等占医疗知识图谱的比例。在获取多个目标子图时,第一个获取的目标子图可以仅考虑其相对于原医疗知识图谱的覆盖率,但是由于目标子图内的节点需要与该子图对应的时间点发生的诊疗项目(即目标诊疗项目)有直接关联,因此,需要在考虑覆盖率的同时,尽可能的减少子图中不必要的节点,如与目标用户节点没有边直接连接或与目标诊疗项目间没有边直接连接的节点。在一些实施例中,覆盖率最大的目标子图可以作为第一子图。
在一些实施例中,考虑到需要协调各个目标子图间的重合率,在医疗知识子图中可以基于第三类边的边特征去除对目标诊疗项目影响程度不大的候选诊疗项目,进而确定目标子图。例如,目标子图中包括用户丙、项目B、项目C、医疗机构1,其中,用户丙和项目B具有第二类边,项目C与项目B具有第三类边,项目B和项目C与医疗机构1具有第一类边,由于项目C对项目B的影响程度不大,将目标子图中的项目C去除得到第一子图。
在一些实施例中,诊疗项目之间的相互影响程度可以基于诊疗项目节点间的相关性以及候选诊疗项目节点相对于目标诊疗项目节点的评分来确定。例如,可以将候选诊疗项目节点与目标诊疗项目节点之间的相关性作为权重值,将该权重值与候选诊疗项目节点的评分的乘积作为候选诊疗项目节点对目标诊疗项目节点的影响程度值。
候选诊疗项目节点的评分可以为目标用户在该候选诊疗项目节点下对应的病情的严重程度的评分。例如,候选诊疗项目对应的病情信息为骨癌,早期骨癌为50分,晚期骨癌为90分。
候选诊疗项目节点与目标诊疗项目节点之间的相关性是指二者对应的病情信息之间的关联性。例如,获取用户关于心脏病的目标子图时,目标诊疗项目对应的类别信息为心脏病,需考虑其他诊疗项目节点数据对心脏病的关联性,例如高血压、高血脂等,因为病人在患心脏病可能是由高血压、高血脂等引起的并发症。在一些实施例中,候选诊疗项目节点与目标诊疗项目节点之间的相关性可以基于连接二者的边的属性获取,例如,在第三类边的属性中可以增加相关性值这一属性,对于不同的诊疗项目节点之间的相关性值可以基于历史经验预先设定。
在一些实施例中,候选诊疗项目节点对目标诊疗项目节点的影响程度值可以为前述候选诊疗项目节点的评分Q及候选诊疗项目节点与目标诊疗项目节点之间的相关性L的乘积,例如,若用P表示候选诊疗项目节点对目标诊疗项目节点的影响程度值,则P=Q*L。
在一些实施例中,可以设置影响程度阈值,当候选诊疗项目节点对应的影响程度阈值大于影响程度阈值时,则候选诊疗项目节点可以保留在目标子图内,否则,应去除。影响程度阈值可以人工设定。
在一些实施例中,还可以通过图传播算法来计算候选诊疗项目对目标诊疗项目的影响程度值。
在一些实施例中,为了降低各个目标子图之间的重合率,获取目标子图的方式还可以包括:随机取若干个时间点对应的医疗知识子图,从医疗知识子图中选取覆盖率最大或时间最早的医疗知识子图作为第一目标子图,然后依次从其余医疗知识子图中选取与已选目标子图重合率较低的一个或以上的医疗知识子图作为新选的目标子图。
重合率可以指任意两个子图重合的比例。在一些实施例中可以计算节点或边的数据与已选目标子图对应节点或边的数据的相似度,并将相似度作为重合率。例如,可以将医疗知识子图(包括待选医疗知识子图和已选目标子图)的节点属性及边属性用向量表示,进而得到每个医疗知识子图对应的一个向量,通过计算待选医疗知识子图与已选目标子图之间的向量距离来确定待选医疗知识子图与已选目标子图的相似度,进而确定重合率。
在一些实施例中,可以预先设置重合率阈值,将重合率低于该阈值的待选医疗知识子图作为新选的目标子图。
仅作为示例的,可以预先设定医疗知识子图所对应的向量中的每个元素对应的节点特征及边特征,以及每个元素值对应的特征值,例如,医疗知识子图对应的向量中,第一个元素可以用于表示用户代号,第二个元素可以用于表示就诊时间代号,第三个元素用于表示该就诊时间参与的诊疗项目代号,第四个元素用于表示与第三个元素有第三类边的其他诊疗项目,则基于每个向量的前三个元素即可确定该向量对应的医疗知识子图。
在一些实施例中,向量距离可以包括曼哈顿距离、欧式距离、切比雪夫距离、余弦距离、马氏距离等。可以根据不同的距离类型所对应的公式,代入数值进行数学计算。在一些实施例中,向量距离与相似度负相关,即距离越大,相似度越小,重合率越小。
基于多个目标时间对应的目标子图确定多个预测病情,并通过多个预测病情和同一时间点的实际病情进行比对得到多个病情诊断可信度,在一定程度上增加了比对的数据,提高了病情诊断可信度的置信度,进一步增加了医疗机构的可信度评分的置信度。
通过选取对原医疗知识图谱的覆盖率大,且和已有目标子图重合率小的目标子图,可以避免数据重复率过高而带来的计算储存的问题。
在一些实施例中,目标时间包括多个历史时间点,基于目标时间获得多个目标子图,得到多个预测病情,以及基于多个预测病情得到多个病情诊断可信度,基于多个可信度的加权求和得到该用户最终的病情诊断可信度。
在一些实施例中,目标时间点可以包括多个时间点,基于多个目标时间点可以获取多个对应不同目标时间的同一目标用户同一诊疗项目的目标子图,并通过病情预测模型得到同一目标用户在多个时间点的多个预测病情,通过多个时间点的预测病情与多个时间点的实际病情的比对结果确定同一目标用户的多个时间点对应的多个病情诊断可信度。基于多个病情诊断可信度的加权求和得到该用户最终的病情诊断可信度。
对多个时间点的病情诊断可信度可以设置不同的权重。例如,基于距离第一时间点最远的目标时间对应的预测病情的权重最高。例如,目标时间1为2021年1月1日,目标时间2为2021年2月1日,第一时间点为2021年8月1日,2021年1月1日用户甲的病情诊断可信度为60分,权重为0.7,2021年8月1日用户甲的病情诊断可信度为80分,权重为0.3,则目标用户甲的病情诊断可信度为60*0.7+80*0.3=66分。
在一些实施例中,可以在目标时间和当前时间之间确定多个第一时间点,并通过病情预测模型得到同一目标用户的多个第一时间点的预测病情,通过多个第一时间点的预测病情与多个时间点的实际病情的比对结果确定同一目标用户的多个第一时间点对应的病情诊断可信度,对多个第一时间点的病情诊断可信度设置不同的权重。例如,距离目标时间较远的第一时间点的预测病情的权重较高,通过对同一目标用户的多个第一时间点对应的病情诊断可信度进行加权求和得到同一目标用户病情诊断可信度。例如,目标时间为2021年1月1日,第一时间点分别为2021年5月1日、2021年8月1日,2021年5月1日用户甲的病情诊断可信度为60分,权重为0.4,2021年8月1日用户甲的病情诊断可信度为80分,权重为0.6,则目标用户甲的病情诊断可信度为60*0.4+80*0.6=72分。
在一些实施例中,对于得到的每个医疗机构的可信度评分还可以设置可信度评分的置信度,医疗机构的可信度评分的置信度可以与计算该医疗机构的可信度评分时所有涉及的目标子图对应的覆盖率正相关,以及与所有涉及的目标子图对应的重合率负相关。
医疗机构的可信度评分的置信度可以指得到的医疗机构的可信度评分的可信程度。当目标用户的病情诊断可信度所依据的目标子图的覆盖率越高,重合率越低,则基于目标子图得到的目标用户的病情诊断可信度越高,进而依据目标用户的病情诊断可信度得到的医疗机构的可信度评分的置信度越高。
在一些实施例中,可以对目标子图的不同覆盖率预设不同的置信度的评分,对目标子图的不同重合率预设不同的置信度的评分,例如,覆盖率60%-70%对应的置信度的评分为60分,重合率20%-30%对应的置信度的评分为70分。
进而据此得到覆盖率和重合率分别对应的一个基于目标子图得到的目标用户的病情诊断可信度的置信度的评分,并对覆盖率和重合率预设不同的权重(如覆盖率和重合率对应的权重分都是0.5),加权后可以得到目标用户的病情诊断可信度的置信度,再基于各个目标用户的病情诊断可信度的置信度的均值或加权求和值确定医疗机构的可信度评分的置信度,具体方式可以参考基于用户的病情诊断可信度确定所述医疗机构的可信度评分的方式,如步骤420的相应内容。
通过对得到的医疗机构的可信度评分的置信度进行确定,依据该置信度可以判断医疗机构可信度评分的可靠性,可以为用户选择诊疗机构提供更可靠的依据。
基于在历史时间医疗机构对用户的就诊数据通过机器学习模型可以准确的确定出用户的病情发展情况。通过将同一时间点预测病情和实际病情相比较确定医疗机构对病情的诊断可信度,将实际病情作为对病情诊断的可信度的检测标准,可以得到比较可靠的诊断可信度。
需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,除非权利要求中明确说明,本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有±20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。
最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。

Claims (6)

1.一种医疗数据质量评估方法,其特征在于,所述方法包括:
基于医疗机构上传在医疗服务平台的医疗信息,获取用户的就诊数据;所述就诊数据包括用户基本信息、诊疗信息中的至少一种;
获取上传所述医疗信息的所述医疗机构的机构信息,所述机构信息包括所述医疗机构的诊疗项目的类别信息;
结合所述机构信息及所述就诊数据,获取所述医疗机构的可信度评分;
响应于接收到所述用户发出的评分查询指令,将所述可信度评分展示给所述用户;
所述就诊数据、所述机构信息基于医疗知识图谱获取;所述医疗知识图谱包括若干节点及边;
所述医疗知识图谱的节点包括医疗机构节点、诊疗项目节点、用户节点;节点特征包括节点对应的属性信息;
医疗知识图谱的边包括第一类边、第二类边、第三类边中的至少一种,所述第一类边用于连接所述医疗机构节点及所述医疗机构节点对应的所述诊疗项目节点,所述第二类边用于连接所述诊疗项目节点及所述诊疗项目节点对应的所述用户节点;所述第三类边用于连接具有相互影响关系的所述诊疗项目节点;所述第二类边的边特征包括医疗数据特征,所述第一类边的边特征包括项目类型特征,所述第三类边的边特征包括影响程度;
所述获取所述医疗机构的可信度评分包括:
基于所述医疗知识图谱确定各个所述用户节点对应的用户的病情诊断可信度;
基于所述用户的病情诊断可信度确定所述医疗机构的可信度评分。
2.根据权利要求1所述的方法,其特征在于,所述基于所述医疗知识图谱确定所述用户的病情诊断可信度包括:
基于各个所述用户节点对应的所述医疗数据特征中包含的时间信息对所述医疗知识图谱进行划分,得到所述用户在若干时间点对应的医疗知识子图;
获取目标时间,获取目标用户在所述目标时间对应的所述医疗知识子图作为目标子图;
基于所述目标子图预测所述目标用户在第一时间点的预测病情;
基于所述预测病情与所述目标用户在所述第一时间点的实际病情的比对结果确定所述目标用户的病情诊断可信度。
3.根据权利要求1所述的方法,其特征在于,所述医疗机构的可信度评分包括:所述医疗机构包含的所述诊疗项目的可信度评分及所述医疗机构的总的可信度评分;
所述医疗机构包含的所述诊疗项目的可信度评分基于所述用户的病情诊断可信度确定;
所述医疗机构的总的可信度评分基于所述医疗机构包含的所述诊疗项目的可信度评分确定或基于所述用户的病情诊断可信度确定。
4.一种医疗数据质量评估系统,其特征在于,所述系统包括:
就诊数据获取模块,用于基于医疗机构上传在医疗服务平台的医疗信息,获取用户的就诊数据;所述就诊数据包括用户基本信息、诊疗信息中的至少一种;
机构信息获取模块,用于获取上传所述医疗信息的所述医疗机构的机构信息,所述机构信息包括所述医疗机构的诊疗项目的类别信息;
评分获取模块,用于结合所述机构信息及所述就诊数据,获取所述医疗机构的可信度评分;
展示模块,用于响应于接收到所述用户发出的评分查询指令,将所述可信度评分展示给所述用户所述就诊数据、所述机构信息基于医疗知识图谱获取;所述医疗知识图谱包括若干节点及边;
所述医疗知识图谱的节点包括医疗机构节点、诊疗项目节点、用户节点;节点特征包括节点对应的属性信息;
医疗知识图谱的边包括第一类边、第二类边、第三类边中的至少一种,所述第一类边用于连接所述医疗机构节点及所述医疗机构节点对应的所述诊疗项目节点,所述第二类边用于连接所述诊疗项目节点及所述诊疗项目节点对应的所述用户节点;所述第三类边用于连接具有相互影响关系的所述诊疗项目节点;所述第二类边的边特征包括医疗数据特征,所述第一类边的边特征包括项目类型特征,所述第三类边的边特征包括影响程度所述评分获取模块进一步用于:
基于所述医疗知识图谱确定各个所述用户节点对应的用户的病情诊断可信度;
基于所述用户的病情诊断可信度确定所述医疗机构的可信度评分。
5.根据权利要求4所述的系统,其特征在于,所述评分获取模块进一步用于:
基于各个所述用户节点对应的所述医疗数据特征中包含的时间信息对所述医疗知识图谱进行划分,得到所述用户在若干时间点对应的医疗知识子图;
获取目标时间,获取目标用户在所述目标时间对应的所述医疗知识子图作为目标子图;
基于所述目标子图预测所述目标用户在第一时间点的预测病情;
基于所述预测病情与所述目标用户在所述第一时间点的实际病情的比对结果确定所述目标用户的病情诊断可信度。
6.根据权利要求4所述的系统,其特征在于,所述医疗机构的可信度评分包括:所述医疗机构包含的所述诊疗项目的可信度评分及所述医疗机构的总的可信度评分;
所述医疗机构包含的所述诊疗项目的可信度评分基于所述用户的病情诊断可信度确定;
所述医疗机构的总的可信度评分基于所述医疗机构包含的所述诊疗项目的可信度评分确定或基于所述用户的病情诊断可信度确定。
CN202210695053.4A 2022-06-20 2022-06-20 一种医疗数据质量评估方法及系统 Active CN114783580B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210695053.4A CN114783580B (zh) 2022-06-20 2022-06-20 一种医疗数据质量评估方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210695053.4A CN114783580B (zh) 2022-06-20 2022-06-20 一种医疗数据质量评估方法及系统

Publications (2)

Publication Number Publication Date
CN114783580A true CN114783580A (zh) 2022-07-22
CN114783580B CN114783580B (zh) 2022-09-13

Family

ID=82421704

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210695053.4A Active CN114783580B (zh) 2022-06-20 2022-06-20 一种医疗数据质量评估方法及系统

Country Status (1)

Country Link
CN (1) CN114783580B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115618947A (zh) * 2022-12-05 2023-01-17 中国人民解放军总医院 医疗知识图谱质量评估系统、装置、设备、介质及产品
CN116153483A (zh) * 2023-01-03 2023-05-23 武汉博科国泰信息技术有限公司 一种基于机器学习的医疗数据分析处理方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165422A (ja) * 2006-12-27 2008-07-17 Hitachi Software Eng Co Ltd 医療機関情報提供システム
CN107766583A (zh) * 2017-11-22 2018-03-06 中山大学 基于子图划分的知识图谱降维表达方法
CN109817296A (zh) * 2017-11-20 2019-05-28 深圳市前海安测信息技术有限公司 区域医疗信息共享查询系统及方法
CN110459320A (zh) * 2019-08-20 2019-11-15 山东众阳健康科技集团有限公司 一种基于知识图谱的辅助诊疗系统
CN111382320A (zh) * 2020-03-18 2020-07-07 军事科学院系统工程研究院系统总体研究所 一种面向知识图谱的大规模数据增量处理方法
CN111785368A (zh) * 2020-06-30 2020-10-16 平安科技(深圳)有限公司 基于医疗知识图谱的分诊方法、装置、设备及存储介质
CN111897967A (zh) * 2020-07-06 2020-11-06 北京大学 一种基于知识图谱和社交媒体的医疗问诊推荐方法
CN112151188A (zh) * 2020-10-19 2020-12-29 科技谷(厦门)信息技术有限公司 一种基于医疗知识图谱的智能疾病预测系统
KR102268514B1 (ko) * 2020-06-30 2021-06-24 서울대학교병원 중재 또는 협진 서비스를 제공하는 방법 및 이를 수행하는 시스템
WO2021189971A1 (zh) * 2020-10-26 2021-09-30 平安科技(深圳)有限公司 基于知识图谱表征学习的医疗方案推荐系统及方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165422A (ja) * 2006-12-27 2008-07-17 Hitachi Software Eng Co Ltd 医療機関情報提供システム
CN109817296A (zh) * 2017-11-20 2019-05-28 深圳市前海安测信息技术有限公司 区域医疗信息共享查询系统及方法
CN107766583A (zh) * 2017-11-22 2018-03-06 中山大学 基于子图划分的知识图谱降维表达方法
CN110459320A (zh) * 2019-08-20 2019-11-15 山东众阳健康科技集团有限公司 一种基于知识图谱的辅助诊疗系统
CN111382320A (zh) * 2020-03-18 2020-07-07 军事科学院系统工程研究院系统总体研究所 一种面向知识图谱的大规模数据增量处理方法
CN111785368A (zh) * 2020-06-30 2020-10-16 平安科技(深圳)有限公司 基于医疗知识图谱的分诊方法、装置、设备及存储介质
KR102268514B1 (ko) * 2020-06-30 2021-06-24 서울대학교병원 중재 또는 협진 서비스를 제공하는 방법 및 이를 수행하는 시스템
CN111897967A (zh) * 2020-07-06 2020-11-06 北京大学 一种基于知识图谱和社交媒体的医疗问诊推荐方法
CN112151188A (zh) * 2020-10-19 2020-12-29 科技谷(厦门)信息技术有限公司 一种基于医疗知识图谱的智能疾病预测系统
WO2021189971A1 (zh) * 2020-10-26 2021-09-30 平安科技(深圳)有限公司 基于知识图谱表征学习的医疗方案推荐系统及方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115618947A (zh) * 2022-12-05 2023-01-17 中国人民解放军总医院 医疗知识图谱质量评估系统、装置、设备、介质及产品
CN116153483A (zh) * 2023-01-03 2023-05-23 武汉博科国泰信息技术有限公司 一种基于机器学习的医疗数据分析处理方法及系统
CN116153483B (zh) * 2023-01-03 2023-11-07 武汉博科国泰信息技术有限公司 一种基于机器学习的医疗数据分析处理方法及系统

Also Published As

Publication number Publication date
CN114783580B (zh) 2022-09-13

Similar Documents

Publication Publication Date Title
US11600390B2 (en) Machine learning clinical decision support system for risk categorization
US11790297B2 (en) Model-assisted annotating system and methods for use therewith
Liu et al. How to read articles that use machine learning: users’ guides to the medical literature
WO2020181805A1 (zh) 糖尿病的预测方法及装置、存储介质、计算机设备
Dey et al. Big data analytics for intelligent healthcare management
CN114783580B (zh) 一种医疗数据质量评估方法及系统
Baker et al. Continuous and automatic mortality risk prediction using vital signs in the intensive care unit: a hybrid neural network approach
RU2698007C1 (ru) Автоматическая система поддержки медицинских решений при сочетанной патологии
Al-Mualemi et al. A deep learning-based sepsis estimation scheme
Fan et al. Detecting glaucoma in the ocular hypertension study using deep learning
Kashyap et al. Management and monitoring patterns and future scope
KR102342770B1 (ko) 질병 예측치의 분포를 이용한 건강관리 상담 시스템
Dankwa‐Mullan et al. Applications of big data science and analytic techniques for health disparities research
Sampath et al. Ensemble Nonlinear Machine Learning Model for Chronic Kidney Diseases Prediction
US20150339602A1 (en) System and method for modeling health care costs
Sridhar et al. Artificial intelligence in medicine: diabetes as a model
Pfutzenreuter et al. Machine Learning in Healthcare Management for Medical Insurance Cost Prediction
Koul et al. Enhancing the detection of airway disease by applying deep learning and explainable artificial intelligence
US20240071623A1 (en) Patient health platform
US20240161035A1 (en) Multi-model medical scan analysis system and methods for use therewith
US20230395204A1 (en) Survey and suggestion system
US20230409926A1 (en) Index for risk of non-adherence in geographic region with patient-level projection
Wang Tackling Bias, Privacy, and Scarcity Challenges in Health Data Analytics
Saraswat et al. Opportunities and Challenges for Developing Machine Learning Models with EHR Data
Rubio et al. Crowdsourced human-based computational approach for tagging peripheral blood smear sample images from Sickle Cell Disease patients using non-expert users

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant