CN107610770B - 用于自动化诊断的问题生成系统和方法 - Google Patents

用于自动化诊断的问题生成系统和方法 Download PDF

Info

Publication number
CN107610770B
CN107610770B CN201710183072.8A CN201710183072A CN107610770B CN 107610770 B CN107610770 B CN 107610770B CN 201710183072 A CN201710183072 A CN 201710183072A CN 107610770 B CN107610770 B CN 107610770B
Authority
CN
China
Prior art keywords
symptom
candidate
symptoms
diseases
observed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710183072.8A
Other languages
English (en)
Other versions
CN107610770A (zh
Inventor
钟迩桁
刘朝春
谢于晟
杜楠
费洪亮
甄毅
曹昱
王俊晴
周达文
范伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu USA LLC
Original Assignee
Baidu USA LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu USA LLC filed Critical Baidu USA LLC
Publication of CN107610770A publication Critical patent/CN107610770A/zh
Application granted granted Critical
Publication of CN107610770B publication Critical patent/CN107610770B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明涉及用于自动化诊断的问题生成系统和方法。在实施例中,通过查询知识图来生成与观察到的症状相关联的可能的疾病。在实施例中,还识别与可能的疾病相关联的候选症状并且将其与观察到的症状组合以获得组合的症状集合。在实施例中,确定候选症状集合的可辨性分数并且选择具有最高可辨性分数的候选症状。在实施例中,可以针对与观察到的症状的冲突来检查这些选择的候选症状,并且如果存在冲突,则从进一步的考虑中移除这些选择的候选症状。在实施例中,可以基于剩余的选择的候选症状来生成一个或多个问题,以帮助收集关于患者的信息。在实施例中,可以利用更新的观察到的症状来重复过程。

Description

用于自动化诊断的问题生成系统和方法
技术领域
本发明一般涉及基于观察到的患者症状来增加诊断的自动化,并且具体地涉及用于问题生成以获得更相关的医疗信息的系统和方法。
背景技术
自动化诊断可以通过降低医生的工作负荷来帮助医院收纳更多的患者并且帮助患者找到合适的医生/科室。理想地,自动化诊断系统将收集来自患者的症状信息并且提供对疾病的自动化诊断和/或治疗方案。
然而,患者有时提及有限的或不完整的信息或症状,这不足以进行准确诊断。因此,需要可以引导患者回答和/或提供更相关的问题以得到更好的自动化诊断的系统和方法。
发明内容
本发明在第一方面提供一种用于自动化诊断的问题生成的计算机实现的方法,所述方法包括:接收至少一个观察到的关于患者的症状作为输入;通过查询包括症状-疾病关联的知识图来生成与所述至少一个观察到的症状相关联的至少一种可能的疾病;使用所述知识图来识别与所述至少一种可能的疾病相关联的多个候选症状;确定每个候选症状的可辨性分数;基于所述可辨性分数在所述多个候选症状中选择候选症状子集;以及生成针对所选择的候选症状子集的问题以从所述患者收集关于所选择的候选症状子集的信息。
本发明在第二方面提供一种用于辅助疾病诊断的系统,所述系统包括:
一个或多个处理器;可由所述一个或多个处理器访问的知识图;包括一个或多个指令序列的暂时性计算机可读介质,所述指令序列在由所述一个或多个处理器中的至少一个处理器执行时,使得执行以下步骤:使用患者的观察到的症状集合和将症状和疾病相关联的知识图来识别与可能的疾病集合有关的候选症状集合,所述可能的疾病集合与所述患者的所述观察到的症状集合有关;
将每个候选症状与所述观察到的症状集合组合以得到多个症状集合,其中每个症状集合与一个候选症状相对应;
使用每个症状集合来查询所述知识图以得到针对每个候选症状的可能的疾病集合和不可能的疾病集合;使用所述可能的疾病集合和所述不可能的疾病集合来确定所述每个候选症状的可辨性分数;以及从所述候选症状集合中选择具有高于阈值的可辨性分数的候选症状子集。
本发明在第三方面提供一种用于自动化诊断的问题生成的系统,包括:输入接口,用于从患者接收关于至少一个观察到的症状的数据;输出接口,用于向所述患者发送问题;以及耦合到所述输入接口和所述输出接口的一个或多个处理器;所述一个或多个处理器中的至少一个处理器可访问的知识图;包括一个或多个指令序列的暂时性计算机可读介质或介质,所述指令序列在由所述一个或多个处理器中的至少一个处理器执行时,使得执行以下步骤:从患者接收至少一个观察到的症状;通过查询包括症状—疾病关联的知识图来生成与所述至少一个观察到的症状相关联的至少一种可能的疾病;识别与所述至少一种可能的疾病相关联的多个候选症状;确定每个候选症状的可辨性分数;基于所述可辨性分数在所述多个候选症状中选择候选症状子集;以及生成针对所选择的候选症状子集的问题以从所述患者收集关于所选择的候选症状子集的信息。
附图说明
将参考本发明的实施例,其示例会在附图中说明。这些附图旨在说明而非限制。虽然本发明总体上在这些实施例的上下文中描述,但是应当理解的是,其非旨在将本发明的范围限制为这些特定实施例。附图中的项目不是按比例的。
图1示出根据本发明实施例的用于自动化诊断的整体框架;
图2示出根据本发明实施例的示例性知识图;
图3示出根据本发明实施例的基于收集的症状的自动化诊断的示例性流程图;
图4示出根据本发明实施例的基于观察到的症状来生成候选症状的示例性流程图;
图5示出根据本发明实施例的选择辨别性的候选症状的示例性流程图;
图6示出根据本发明实施例的候选症状过滤和维度信息验证的示例性流程图;以及
图7示出根据本发明的实施例的计算设备/信息处置系统的简化框图。
具体实施方式
在下文描述中,出于解释的目的,阐述了具体细节以便提供对本发明的理解。但是,本领域的技术人员将明白,在没有这些具体细节的情况下,也可以实施本发明。此外,本领域技术人员将认识到的是,下文描述的本发明的实施例可以以诸如过程、装置、系统、设备或方法的多种方式实现在有形计算机可读介质上。
图中示出的组件或模块是本发明的示例性实施例的说明并且意在避免模糊本发明。还应当理解的是,遍及本说明,组件可以被描述为单独的功能单元,其可以包括子单元,但是本领域技术人员还将认识到的是,各个组件或其部分可以被划分成单独的组件或者可以被集成在一起,包括被集成在单个系统或组件内。应当注意的是,本文说明的功能或操作可以被实现为组件/模块。组件可以用软件、硬件或其组合实现。
此外,附图内的组件或系统之间的连接非旨在受限于直接连接。此外,这些组件之间的数据可以被修改、重新格式化或以其它方式被中间组件改变。此外,可以使用额外的或更少的连接。应当注意的是,术语“耦合”、“连接”或“通信地耦合”应当被理解为包括直接连接、通过一个或多个中间设备的间接连接以及无线连接。
在说明书中对“一个实施例”、“优选实施例”“一实施例”或“实施例”的引用意指结合实施例描述的特定特征、结构、特性或功能被包括在本发明的至少一个实施例中并且可以在一个以上的实施例中。此外,上述短语在说明书各处的出现不必都指代相同的一个实施例或多个实施例。
某些术语在说明书各处的使用是为了说明而不应当被解释为进行限制。服务、功能或资源不受限于单个服务、功能或资源;这些术语的使用可以指代有关服务、功能或资源(其可以被分布或聚集)的分组。
术语“包括”、“包含”、“由...组成”、“由...构成”应当被理解为是开放性术语并且其后面的任何列表是示例,非意指受限于所列出的项目。本文使用的任何标题仅是出于组织目的并且不应当用于限制本说明书或权利要求书的范围。本专利文件中提及的每个引用的全部内容通过引用的方式并入本文。
此外,本领域技术人员将认识到:(1)可以选择地执行某些步骤;(2) 步骤可以不受限于本文阐述的特定次序;(3)可以以不同的次序来执行某些步骤;以及(4)可以并行地完成某些步骤。
图1示出根据本发明实施例的用于帮助自动化诊断的整体框架100。在实施例中,问题生成系统140经由输入接口120从用户110(诸如患者或医疗工作者)接收信息112。问题生成系统140可以包括用于信息处理和自动化诊断的知识图150。在实施例中,知识图150可以是耦合到问题生成系统 140的单独组件或问题生成系统140的集成部分。问题生成系统140还可以经由输出接口130向患者发送问题114,以获得用于更准确诊断的更相关的信息。
信息112可以是患者观察到的一个或多个症状,诸如高烧、咳嗽、疼痛等。在实施例中,信息112可以包括具有一个或多个相关维度信息(诸如强度、频率、持续时间等)的维度症状。症状维度是指对症状进行描述的一个或多个方面,诸如多频繁、多严重、多长时间、在什么样的状况下、在哪观察到的症状等。该信息可以用于辅助自动化诊断,这可以包括找到症状/维度以将潜在疾病与其它疾病区分开,以用于排除不相关疾病,和/ 或生成与观察到的症状或来自或关于患者的其它描述密切相关的症状候选等。问题生成系统140可以是现场系统或通过通信手段(诸如电话、互联网等)与患者进行通信的远程系统。通信可以是有线或无线通信。
图2示出根据本发明实施例的示例性知识图。在实施例中,知识图200 是对技术领域知识编码的图,其中图中的节点(例如,节点210)是实体,诸如症状、维度、人口统计和疾病,图中的边缘(例如,边缘220)表示两个实体之间的关系。在实施例中,知识图可以耦合到外部资源,诸如各种医疗数据库或网站,进行知识更新以使得知识图可以与当前的医疗调查结果一致。在发明人为Yaliang Li、Nan Du、Yusheng Xie和Wei Fan的、于2013年7月11日递交的名称为“YSTEMS AND METHODS FOR DATA AND INFORMATION SOURCE RELIABILITYESTIMATION”的共同未决和共同拥有的美国专利申请No.15/207,434中可找到获得症状—疾病关联性(其可以形成一个或多个知识图)的系统和方法的示例,为了全部目的,将上述专利文档通过引用全部并入本文。
图3示出了根据本发明实施例的基于收集的症状进行自动化诊断的示例性流程图。还参照图1,在步骤305中,从患者收集一个或多个观察到的症状的集合(So)并且经由输入接口输入。观察到的症状可以是维度症状或非维度症状。在步骤310中,生成与观察到的症状的集合相关联的一个或多个可能疾病的集合,其将疾病和症状关联。可以通过查询知识图来实现生成处理。
在步骤315中,使用知识图来识别与可能的疾病的集合相关联的候选症状集合(SC)。在实施例中,候选症状可以是未观察到的症状或未向自动化诊断系统报告的症状。在实施例中,候选症状还可以是与观察到的症状或来自患者的其它描述密切相关的症状。
在步骤320中,来自候选症状集合的每个候选症状与观察到的症状集合组合以得到多个组合的症状集合。例如,如果候选症状集合
Figure BDA0001254088960000051
则创建三个组合集合S1、S2和S3,其中,
Figure BDA0001254088960000052
Figure BDA0001254088960000053
以及
Figure BDA0001254088960000054
在步骤325中,在实施例中,使用来自知识图的接口,使用所述多个组合的症状集合来识别可能的(即,排名最高的)疾病和不可能的疾病(即,排名低于阈值排名的疾病)。在实施例中,所更新的可能疾病和不可能疾病中的每一个与一个组合的症状集合相对应。
在步骤330中,计算每个候选症状的可辨性(或可辨性分数)并且使用可辨性来从步骤315中识别的候选症状中确定选择的候选症状(Sn)。在实施例中,可辨性分数基于选择在区分疾病时的具有最大可辨性的症状。稍后将论述关于可辨性计算的更多细节。基于可辨性来选择最高候选症状。
在步骤335中,针对与观察到的症状的冲突来检查所选择的候选症状,并且将有冲突的任何选择的候选症状从进一步的考虑中移除。例如,如果症状仅涉及男性但是患者是女性,则该选择的候选症状具有冲突并且被忽略。在步骤340中,针对可应用的维度信息来检查没有冲突的所选择的候选症状,并且生成问题以收集关于没有冲突的所选择的候选症状的信息和可应用的维度信息。可以根据一个或多个问题模板来生成问题。
最后,在实施例中,在步骤345中,在从所生成的问题中收集信息之后对观察到的症状进行更新,并且可以重复以上步骤,直到诊断出疾病或者患者报告不再有观察到的症状为止。
图4示出了根据本发明实施例的基于观察到的症状来生成候选症状的示例性流程图。在步骤405中,从患者接收一个或多个观察到的症状 (
Figure BDA0001254088960000061
其中
Figure BDA0001254088960000062
表示第i个观察到的症状)。在实施例中,在步骤410 处,使用知识图来识别链接到一个或多个观察到的症状的可能疾病。在实施例中,可以使用图接口算法(诸如马尔科夫链蒙特卡洛(MCMC)或吉布斯采样等)来识别最可能的疾病。在实施例中,最可能的疾病是那些具有高于阈值值概率的疾病或其可以是前X个疾病。在步骤415中,在实施例中,使用知识图来识别与可能的疾病相关联的M(大于1的整数)个候选症状(SC)。每个候选症状可以与一个或多个可能的疾病相关联。类似地,每个可能的疾病可以与一个或多个候选症状相关联。
在步骤420中,基于可能的疾病来计算所识别的候选症状的概率。在实施例中,给定了观察到的症状,候选症状的概率的计算可以由如下给出:
Figure BDA0001254088960000063
其中,SO是观察到的症状,SC是未观察到的或候选症状。
在步骤425中,在实施例中,基于所计算的概率来对所识别的候选症状进行排序。在步骤430中,在实施例中,在所有识别的候选症状中选择前K个候选症状作为相关的候选症状。在实施例中,K是小于M的正整数。
图5示出根据本发明实施例的从候选症状中选择辨别性的症状的示例性流程图。在步骤505中,接收多个(K个)候选症状(SC)。在实施例中,候选症状可以是在图4中示出的过程期间预先选择的相关的候选症状。在步骤510中,在实施例中,每个候选症状与观察到的症状组合以得到多个症状集合,其中每个症状集合与候选症状相对应。在步骤515中,症状集合用于通过查询知识图来得到可能的疾病和不可能的疾病。因此,每个候选症状与一个或多个可能的疾病相对应。在实施例中,可以使用图接口算法(诸如马尔科夫链蒙特卡洛(MCMC)或吉布斯采样等)来识别可能的疾病。在实施例中,可能的疾病Dp是那些具有高于阈值值概率的疾病或是前X 个疾病,其余的疾病(即,不可能的疾病)被标示为Dn
在实施例中,当症状集合用于得到可能的疾病时,一个症状集合内的每个症状在确定可能的疾病时被给予相同的权重。在实施例中,一个症状集合内的每个症状在确定可能的疾病时也可以被给予不同的权重。例如,那些威胁生命的症状或者允许存在的症状比不严重或间歇性症状在确定可能的疾病时可以被给予更多的权重。
在步骤520中,使用相应的可能的疾病来计算每个候选症状的可辨性 (或可辨度)分数。在实施例中,可辨性分数是来自可能的疾病的最可能的疾病和不可能的疾病之间的最大概率差。在实施例中,计算由如下给出:
Figure BDA0001254088960000071
其中,So是观察到的症状集合,Sn是候选症状,Dp表示针对So和Sn的组合集合的可能的疾病(例如,前K种疾病),Dn表示针对So和Sn的组合集合的不可能的疾病(例如,非前K种疾病)。在实施例中,公式(2)还可以是基于可能疾病相对于不可能疾病的配对而在全部候选症状的最大值。即,针对候选症状中的每个候选症状,公式(2)识别哪个候选症状在可能的疾病Dpi与不可能的疾病Dnj之间进行区分是最优的。
在步骤525中,基于所计算的可辨性分数来对候选症状进行排序,以及在K个候选症状中选择前N个候选症状作为选择的候选症状。
图6示出了根据本发明实施例的候选症状过滤和维度信息验证的示例性流程图。在步骤605中,接收与观察到的患者症状相关的选择的候选症状集合。可以使用图5中所公开的处理来获得所选择的候选症状。在步骤 610中,在实施例中,针对与观察到的症状的冲突来检查所选择的候选症状中的每个候选症状,并且将那些具有冲突的任何选择的候选症状从进一步的考虑中移除。在实施例中,冲突被称为候选症状和观察到的症状之间的矛盾。例如,可以丢弃与患者情况不一致的与人口统计相关的症状。在步骤615中,在实施例中,检查没有冲突的所选择的候选症状是否存在相关维度信息。维度信息是对症状进行描述的一个或多个方面,诸如强度、频率、持续时间、严重性等。在实施例中,可以从知识图或从其它预设数据中获得维度方面。
在实施例中,在步骤620中,基于没有冲突的所选择的候选症状来生成问题。在实施例中,如果症状具有相关的维度信息,则也可以生成与该维度信息相关的问题。可以将问题呈现给患者以收集回答。
在实施例中,在步骤615中,使用所生成的问题的回答来更新观察到的症状,所生成的问题可以用于通过重复该过程来生成额外的问题和/或用于诊断疾病。例如,在实施例中,可以重复该过程直到没有从患者报告进一步的候选症状或者疾病被诊断为具有高于置信水平的阈值。置信水平可以是固定值或基于正在诊断的疾病的动态值。
在实施例中,本专利文档的各方面可以涉及或实现在信息处置系统/计算系统上。为了本发明的目的,计算系统可以包括可操作用于计算、运算、确定、分类、处理、发送、接受、取回、产生、路由、切换、存储、显示、通信、表明、检测、记录、重新产生、处置或利用任意形式的信息、智能或用于商业、科学、控制或其它目的的数据的任何工具或工具的聚集。例如,计算系统可以是个人计算机(例如,膝上型计算机)、平板计算机、平板手机、个人数字助理(PDA)、智能电话、智能手表、智能包、服务器(例如,刀片服务器或机架服务器)、网络存储设备、或任何其它适当的设备并且大小、形状、性能、功能和价格可以变化。计算系统可以包括随机存取存储器(RAM)、一个或多个处理资源(诸如中央处理单元(CPU))或硬件或软件控制逻辑、ROM、和/或其它类型的存储器。计算系统的额外组件可以包括一个或多个磁盘驱动、用于与外部设备进行通信的一个或多个网络端口以及各种输入输出(I/O)设备,诸如键盘、鼠标、触摸屏和/或视频显示器。计算系统还可以包括可操作用于在各个硬件组件之间发送通信一个或多个总线。
图7示出根据本发明的实施例的计算系统700的框图。将理解的是,针对系统700示出的功能可操作用于支持计算系统的各个实施例—尽管应当理解,计算系统可以以不同的方式被配置并且包括不同的组件。如图7 所示,系统700包括提供计算资源和控制计算机的一个或多个中央处理单元(CPU)701。CPU 701可以利用微处理器等来实现,并且还可以包括一个或多个图形处理单元(GPU)717和/或用于数学计算的浮点型协处理器。系统700还可以包括系统存储器702,其可以是以随机存取存储器(RAM)、只读存储器(ROM)或两者的形式。
还可以提供多个控制器和外围设备,如图7所示。输入控制器703表示到各个输入设备704 的接口,诸如键盘、鼠标或手写笔。还可以有扫描仪控制器705,其与扫描仪706进行通信。系统700还可以包括用于与一个或多个存储设备708进行接口的存储控制器707,存储设备708中的每一个可以包括用于记录用于操作系统、工具和应用程序的指令的程序的存储介质,诸如磁带或磁盘、或光学介质,这可以包括实现本发明的各个方面的程序的实施例。存储设备708还可以用于存储处理的数据或要根据本发明进行处理的数据。系统700还可以包括用于提供到显示设备711的接口的显示控制器709,显示设备711可以是阴极射线管(CRT)、薄膜晶体管(TFT) 显示器或其它类型的显示器。计算系统700还可以包括用于与打印机713 进行通信的打印机控制器712。通信控制器714可以与一个或多个通信设备 715接口,这使系统700能够通过包括互联网、以太网云、基于以太网的光纤信道(FCoE)/数据中心桥(DCB)云、局域网(LAN)、广域网(WAN)、存储域网(SAN)的多种网络中的任何网络或者包括红外信号的任何适当的电磁载波信号连接到远程设备。
在所示出的系统中,所有主要组件可以连接到总线716,其可以表示一个以上的物理总线。然而,各个系统组件可以在或不在彼此的物理接近域中。例如,可以将输入数据和/或输出数据从一个物理位置远程地发送到另一个物理位置。另外,可以通过网络从远程位置(例如,服务器)接入实现本发明的各个方面的程序。这样的数据和/或程序可以通过多种机器可读介质中的任何一种来传送,机器可读介质包括但不限于:磁介质,诸如硬盘、软盘和磁带;光介质,诸如CD-ROM和全息设备;磁光介质;和专门配置为存储或存储并执行程序代码的硬件设备,诸如专用集成电路(ASIC)、可编程逻辑设备(PLD)、闪存设备、以及ROM和RAM设备。
可以将本发明的实施例编码在具有一个或多个非暂时性计算机可读介质上,其具有针对一个或多个处理器或处理单元的指令,以使得步骤被执行。应当注意的是,一个或多个非暂时性计算机可读介质应当包括易失性和非易失性存储器。应当注意的是,替代的实现方式是可能的,包括硬件实现方式或软件/硬件实现方式。硬件实现的功能可以使用ASIC、可编程阵列、数字信号处理电路等来实现。因此,任何权利要求中的“单元”术语旨在覆盖软件和硬件实现方式两者。类似地,如本文所使用的,术语“计算机可读介质或介质”包括具有体现在其上的指令的程序的软件和/或硬件、或其组合。记住这些替代的实现方式,要理解的是,附图和所附说明提供本领域技术人员编写程序代码(即,软件)和/或制造电路(即,硬件) 所要求的功能信息以执行所要求的处理。
应当注意的是,本发明的实施例还可以涉及具有非暂时性、有形计算机可读介质的计算机产品,非暂时性、有形计算机可读介质上具有用于执行各种计算机实现的操作的计算机代码。介质和计算机代码可以是出于本发明的目的专门设计和构建的那些介质和计算机代码,或者它们可以是对于相关领域技术人员已知或可用的类型。有形计算机可读介质的示例包括但不限于:磁介质,诸如硬盘、软盘和磁带;光介质,诸如CD-ROM和全息设备;磁光介质;和专门配置为存储或存储并执行程序代码的硬件设备,诸如专用集成电路(ASIC)、可编程逻辑设备(PLD)、闪存设备、以及ROM 和RAM设备。计算机代码的示例包括机器代码,诸如由编译器产生的,以及由计算机使用解释器执行的包含较高级代码的文件。本发明的实施例可以全部或部分地作为可以在处理设备所执行的程序模块中的机器可执行指令来实现。程序模块的示例包括库、程序、例程、对象、组件和数据结构。在分布式计算环境中,程序模块可以物理地位于本地、远程或两者的设置中。
本领域技术人员将认识到,计算系统或编程语言对于本发明的实施并非关键。本领域技术人员将认识到,上文描述的多个元素可以被物理地和/ 或功能地分离成子模块或组合在一起。
本科领技术人员将认识到,先前示例和实施例是示例性的并且不限制本发明的范围。期望的是,在阅读本说明书和研究附图之后对于本领域技术人员显而易见的所有排列、增强、等同、组合和其改进都被包括在本发明的精神和范围内。
应当注意的是,可以以不同的方式排列下文权利要求的元素,包括具有多个从属、配置和组合。例如,在实施例中,各个权利要求的主题可以与其它权利要求组合。

Claims (18)

1.一种用于自动化诊断的问题生成的计算机实现的方法,所述方法包括:
接收至少一个观察到的关于患者的症状作为输入;
通过查询包括症状-疾病关联的知识图来生成与所述至少一个观察到的症状相关联的至少一种可能的疾病;
使用所述知识图来识别与所述至少一种可能的疾病相关联的多个候选症状;
确定每个候选症状的可辨性分数,其中,所述可辨性分数是来自考虑所述候选症状与所述观察到的症状的组合而确定的最可能的疾病和不可能的疾病之间的最大概率差;
基于所述可辨性分数在所述多个候选症状中选择候选症状子集;以及
生成针对所选择的候选症状子集的问题以从所述患者收集关于所选择的候选症状子集的信息。
2.根据权利要求1所述的计算机实现的方法,其中,确定每个候选症状的可辨性分数的步骤包括:
将每个候选症状与所述至少一个观察到的症状组合以得到至少一个症状集合;
查询所述知识图以识别针对每个症状集合的可能的疾病集合和不可能的疾病集合;以及
基于与所述症状集合相对应的所述可能的疾病集合和所述不可能的疾病集合来确定所述每个候选症状的可辨性分数。
3.根据权利要求2所述的计算机实现的方法,其中,所述可能的疾病和所述不可能的疾病从与所述候选症状相关联的可能疾病的可能的疾病集合和不可能的疾病集合中选择。
4.根据权利要求1所述的计算机实现的方法,其中,在生成针对所选择的候选症状子集的问题之前,针对与至少一个观察到的症状的冲突来检查所选择的候选症状子集中的候选症状。
5.根据权利要求4所述的计算机实现的方法,其中,将任何具有冲突的候选症状从所选择的子集中移除。
6.根据权利要求4所述的计算机实现的方法,其中,针对维度信息进一步检查没有冲突的所选择的候选症状。
7.根据权利要求6所述的计算机实现的方法,其中,所述维度信息包括对所选择的候选症状进行描述的一个或多个方面。
8.根据权利要求1所述的计算机实现的方法,还包括:在收集关于所选择的候选症状子集的信息之后,更新所述观察到的症状。
9.一种用于辅助疾病诊断的系统,所述系统包括:
一个或多个处理器;
可由所述一个或多个处理器访问的知识图;
存储一个或多个指令序列的暂时性计算机可读介质,所述指令序列在由所述一个或多个处理器中的至少一个处理器执行时,使得执行以下步骤:
使用患者的观察到的症状集合和将症状和疾病相关联的知识图来识别与可能的疾病集合有关的候选症状集合,所述可能的疾病集合与所述患者的所述观察到的症状集合有关;
将每个候选症状与所述观察到的症状集合组合以得到多个症状集合,其中每个症状集合与一个候选症状相对应;
使用每个症状集合来查询所述知识图以得到针对每个候选症状的可能的疾病集合和不可能的疾病集合;
使用所述可能的疾病集合和所述不可能的疾病集合来确定所述每个候选症状的可辨性分数,其中,所述候选症状的可辨性分数表示在来自症状集合的可能的疾病集合的疾病的推测概率与来自症状集合的不可能的疾病集合的疾病的推测概率之间的最大差值;以及
从所述候选症状集合中选择具有高于阈值的可辨性分数的候选症状子集。
10.根据权利要求9所述的系统,其中,在生成针对所选择的候选症状子集的问题之前,针对与至少一个观察到的症状的冲突来检查来自所述候选症状子集的候选症状。
11.根据权利要求10所述的系统,其中,针对维度信息进一步检查没有冲突的候选症状子集。
12.根据权利要求11所述的系统,其中,所述维度信息包括与所述候选症状有关的一个或多个方面。
13.根据权利要求12所述的系统,还包括:
生成与没有冲突的候选症状子集有关的一个或多个问题,用于在收集额外信息时帮助诊断所述患者。
14.一种用于自动化诊断的问题生成的系统,其特征在于,包括:
输入接口,用于从患者接收关于至少一个观察到的症状的数据;
输出接口,用于向所述患者发送问题;以及
耦合到所述输入接口和所述输出接口的一个或多个处理器;
所述一个或多个处理器中的至少一个处理器可访问的知识图;
存储一个或多个指令序列的暂时性计算机可读介质或介质,所述指令序列在由所述一个或多个处理器中的至少一个处理器执行时,使得执行以下步骤:
从患者接收至少一个观察到的症状;
通过查询包括症状—疾病关联的知识图来生成与所述至少一个观察到的症状相关联的至少一种可能的疾病;
识别与所述至少一种可能的疾病相关联的多个候选症状;
确定每个候选症状的可辨性分数,其中,所述可辨性分数是来自考虑所述候选症状与所述观察到的症状的组合而确定的最可能的疾病和不可能的疾病之间的最大概率差;
基于所述可辨性分数在所述多个候选症状中选择候选症状子集;以及
生成针对所选择的候选症状子集的问题以从所述患者收集关于所选择的候选症状子集的信息。
15.根据权利要求14所述的系统,其中,确定每个候选症状的可辨性分数的步骤包括:
将每个候选症状与所述至少一个观察到的症状组合以得到至少一个症状集合;
查询所述知识图以识别针对每个症状集合的可能的疾病集合和不可能的疾病集合;以及
基于与所述症状集合相对应的所述可能的疾病集合和所述不可能的疾病集合来确定每个候选症状的可辨性分数。
16.根据权利要求14所述的系统,其中,生成针对所选择的候选症状子集的问题以从所述患者收集关于所选择的候选症状子集的信息的步骤包括:基于模板问题自动化地生成问题。
17.根据权利要求14所述的系统,其中,识别与所述至少一种可能的疾病相关联的多个候选症状的步骤包括:使用所述知识图上的图推断。
18.根据权利要求17所述的系统,其中,所述图推断包括:使用马尔科夫链蒙特卡洛采样或吉布斯采样中的至少一者。
CN201710183072.8A 2016-07-11 2017-03-24 用于自动化诊断的问题生成系统和方法 Active CN107610770B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/207,445 2016-07-11
US15/207,445 US11194860B2 (en) 2016-07-11 2016-07-11 Question generation systems and methods for automating diagnosis

Publications (2)

Publication Number Publication Date
CN107610770A CN107610770A (zh) 2018-01-19
CN107610770B true CN107610770B (zh) 2021-08-27

Family

ID=60910465

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710183072.8A Active CN107610770B (zh) 2016-07-11 2017-03-24 用于自动化诊断的问题生成系统和方法

Country Status (2)

Country Link
US (1) US11194860B2 (zh)
CN (1) CN107610770B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018071845A1 (en) * 2016-10-13 2018-04-19 Krishnamurti Tamar Priya A structured medical data classification system for monitoring and remediating treatment risks
CN108389608A (zh) * 2018-02-08 2018-08-10 康美药业股份有限公司 药品推荐方法、电子设备和存储介质
CN108231153A (zh) * 2018-02-08 2018-06-29 康美药业股份有限公司 一种药品推荐方法、电子设备和存储介质
US11651858B2 (en) * 2018-08-07 2023-05-16 International Business Machines Corporation Providing medical treatment using optimized symptom-centric decision trees based on disease-centric knowledge graphs
CN109065139A (zh) * 2018-09-10 2018-12-21 平安科技(深圳)有限公司 医疗随访方法、装置、计算机设备和存储介质
CN109559788A (zh) * 2018-11-21 2019-04-02 上海依智医疗技术有限公司 一种病史采集方法及装置
US11195620B2 (en) 2019-01-04 2021-12-07 International Business Machines Corporation Progress evaluation of a diagnosis process
CN109918475B (zh) * 2019-01-24 2021-01-19 西安交通大学 一种基于医疗知识图谱的可视查询方法及查询系统
CN113423344A (zh) * 2019-02-15 2021-09-21 富士胶片株式会社 超声波诊断装置及超声波诊断装置的控制方法
CN109949940B (zh) * 2019-03-11 2022-11-29 金力 一种基于糖尿病数据库的大数据挖掘系统
CN112837813A (zh) * 2019-11-25 2021-05-25 北京搜狗科技发展有限公司 自动问诊方法及装置
CN111370127B (zh) * 2020-01-14 2022-06-10 之江实验室 一种基于知识图谱的跨科室慢性肾病早期诊断决策支持系统
CN111462909B (zh) * 2020-03-30 2024-04-05 讯飞医疗科技股份有限公司 疾病演化跟踪和病情提示方法、装置及电子设备
CN111354469B (zh) * 2020-03-31 2023-07-25 浙江禾连网络科技有限公司 一种用户健康状况综合评测方法与系统
CN112052680B (zh) * 2020-10-14 2023-01-10 腾讯科技(深圳)有限公司 问题生成方法、装置、设备及存储介质
US20220208373A1 (en) * 2020-12-31 2022-06-30 International Business Machines Corporation Inquiry recommendation for medical diagnosis
CN113409936B (zh) * 2021-06-16 2022-08-05 北京欧应信息技术有限公司 用于辅助疾病推理的系统及存储介质
CN113434626B (zh) 2021-08-27 2021-12-07 之江实验室 一种多中心医学诊断知识图谱表示学习方法及系统
CN115375923B (zh) * 2022-10-27 2023-03-24 江西省亿发姆科技发展有限公司 一种农作物诊断方法、装置、慧诊仪以及可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105190634A (zh) * 2013-03-07 2015-12-23 梅德索有限公司 用于计算用作医疗决策支持的医疗建议的分数的方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6356898B2 (en) 1998-08-31 2002-03-12 International Business Machines Corporation Method and system for summarizing topics of documents browsed by a user
EP1266338A2 (en) 2000-02-14 2002-12-18 First Opinion Corporation Automated diagnostic system and method
US7149756B1 (en) * 2000-05-08 2006-12-12 Medoctor, Inc. System and method for determining the probable existence of disease
US20030037034A1 (en) 2001-08-16 2003-02-20 Tim Daniels System and method for lubricants supply chain management
JP2006503351A (ja) 2002-09-20 2006-01-26 ボード オブ リージェンツ ユニバーシティ オブ テキサス システム 情報の発見と関係分析のためのコンピュータプログラム製品、システム及び方法
EP1671200A4 (en) 2003-04-24 2007-10-17 Secureinfo Corp AUTOMATIC ELECTRONIC SOFTWARE DISTRIBUTION AND ADMINISTRATIVE PROCEDURES AND SYSTEM
US7610313B2 (en) 2003-07-25 2009-10-27 Attenex Corporation System and method for performing efficient document scoring and clustering
US8396876B2 (en) 2010-11-30 2013-03-12 Yahoo! Inc. Identifying reliable and authoritative sources of multimedia content
CN102184314A (zh) * 2011-04-02 2011-09-14 中国医学科学院医学信息研究所 面向偏差性症状描述的自动辅助诊断方法
US8965818B2 (en) * 2012-05-16 2015-02-24 Siemens Aktiengesellschaft Method and system for supporting a clinical diagnosis
US9002769B2 (en) 2012-07-03 2015-04-07 Siemens Aktiengesellschaft Method and system for supporting a clinical diagnosis
US9390174B2 (en) 2012-08-08 2016-07-12 Google Inc. Search result ranking and presentation
US9058220B2 (en) * 2012-12-26 2015-06-16 Palo Alto Research Center Incorporated Generation-based update caching for robust scalable distributed Gibbs sampling
US9489460B2 (en) 2013-06-26 2016-11-08 Michael Wexler System and method for generating expert curated results
US9189742B2 (en) * 2013-11-20 2015-11-17 Justin London Adaptive virtual intelligent agent
US10474949B2 (en) * 2014-08-19 2019-11-12 Qualcomm Incorporated Knowledge-graph biased classification for data
US9898382B2 (en) 2015-02-27 2018-02-20 Vmware, Inc. Hyperlink-induced topic search algorithm lock analysis
CN105069505A (zh) * 2015-08-14 2015-11-18 北京农信互联科技有限公司 一种猪病知识库自动训练学习方法及猪病辅助诊断装置
US10409952B2 (en) * 2015-10-12 2019-09-10 National Taiwan University Knowledge-based personal intelligent health consulting system
CN105653859A (zh) * 2015-12-31 2016-06-08 遵义医学院 一种基于医疗大数据的疾病自动辅助诊断系统及方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105190634A (zh) * 2013-03-07 2015-12-23 梅德索有限公司 用于计算用作医疗决策支持的医疗建议的分数的方法

Also Published As

Publication number Publication date
US20180011979A1 (en) 2018-01-11
CN107610770A (zh) 2018-01-19
US11194860B2 (en) 2021-12-07

Similar Documents

Publication Publication Date Title
CN107610770B (zh) 用于自动化诊断的问题生成系统和方法
US11282196B2 (en) Automated patient complexity classification for artificial intelligence tools
AU2020260078B2 (en) Computer-implemented machine learning for detection and statistical analysis of errors by healthcare providers
He et al. Benchmarking deep learning models and automated model design for COVID-19 detection with chest CT scans
CN113015977A (zh) 使用自然语言处理的对疾病和病症的基于深度学习的诊断和转诊
Chatterjee et al. Exploration of interpretability techniques for deep covid-19 classification using chest x-ray images
CN112131322B (zh) 时间序列分类方法及装置
Engle et al. Performance of Qure. ai automatic classifiers against a large annotated database of patients with diverse forms of tuberculosis
Habchi et al. Ai in thyroid cancer diagnosis: Techniques, trends, and future directions
US20140297316A1 (en) Method And Apparatus For Adaptive Prefetching Of Medical Data
Sim et al. Diagnostic performance of a deep learning model deployed at a national COVID-19 screening facility for detection of pneumonia on frontal chest radiographs
US20200335224A1 (en) Method and system for evaluating compliance of standard clinical guidelines in medical treatments
US20140244293A1 (en) Method and system for propagating labels to patient encounter data
Yasrebi-de Kom et al. Electronic health record-based prediction models for in-hospital adverse drug event diagnosis or prognosis: a systematic review
Mohn et al. Machine learning model for chest radiographs: Using local data to enhance performance
MZ et al. COVID-19 Deep Learning Prediction Model Using Publicly Available Radiologist-Adjudicated Chest X-Ray Images as Training Data: Preliminary Findings.
US10521436B2 (en) Systems and methods for data and information source reliability estimation
Alshraideh et al. Enhancing Heart Attack Prediction with Machine Learning: A Study at Jordan University Hospital
CN111079420B (zh) 文本识别方法、装置、计算机可读介质及电子设备
Thai-Nghe et al. Intelligent Systems and Data Science: First International Conference, ISDS 2023, Can Tho, Vietnam, November 11–12, 2023, Proceedings, Part I
US11636933B2 (en) Summarization of clinical documents with end points thereof
Naresh Patel et al. Disease categorization with clinical data using optimized bat algorithm and fuzzy value
US20240169526A1 (en) Systems and methods for accessing and analyzing radiology imaging studies in real-time as they are being reviewed by a practitioner
Chen Machine learning based predictive model of early mortality in stage iii and iv prostate cancer
US20240177856A1 (en) Clinical decision support systems employing reverse phenotyping

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant