CN105190628B - 确定临床医生的预订项目的意图的方法和设备 - Google Patents

确定临床医生的预订项目的意图的方法和设备 Download PDF

Info

Publication number
CN105190628B
CN105190628B CN201480011386.4A CN201480011386A CN105190628B CN 105190628 B CN105190628 B CN 105190628B CN 201480011386 A CN201480011386 A CN 201480011386A CN 105190628 B CN105190628 B CN 105190628B
Authority
CN
China
Prior art keywords
fact
narration
text
patient
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201480011386.4A
Other languages
English (en)
Other versions
CN105190628A (zh
Inventor
I·H·哈博世
D·扎卡尼尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuance Communications Inc
Original Assignee
Nuance Communications Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US13/782,048 external-priority patent/US10032127B2/en
Application filed by Nuance Communications Inc filed Critical Nuance Communications Inc
Publication of CN105190628A publication Critical patent/CN105190628A/zh
Application granted granted Critical
Publication of CN105190628B publication Critical patent/CN105190628B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/20ICT specially adapted for the handling or processing of medical references relating to practices or guidelines

Abstract

确定临床医生预订某个项目的意图的技术包括利用自然语言理解引擎,处理临床医生讲述的对患者的诊疗的形式自由的叙述,以从形式自由的叙述中,提取与一个或多个可预订项目的一个或多个记载对应的一个或多个临床事实。所述处理包括对于对应于可预订项目的记载的所述一个或多个临床事实中的每个临床事实,区分该临床事实是指示预订相应的可预订项目的意图,还是不指示预订相应的可预订项目的意图,和只向被确定指示预订相应的可预订项目的意图的任何临床事实,赋予意图预订属性。对于与提取的临床事实之中的被赋予意图预订属性的临床事实对应的可预订项目,生成至少一个定单。

Description

确定临床医生的预订项目的意图的方法和设备
技术领域
这里说明的技术一般直接涉及医疗文档编制,更具体地涉及在医疗环境中的患者记录的创建和使用。
背景技术
医疗文档编制是保健行业中的重要处理。多数保健机构保留其各个患者的纵向病历(例如,随着时间的过去,跨越多次病情观察或治疗),记录患者的病史,与保健机构内的临床医师的就诊,接受的治疗,和/或未来的治疗方案。这样的文档编制便利跨越随着时间的过去与各个临床医生的多次就诊,保持对患者的护理的连续性。另外,当总体考虑保健机构的大量患者的病历时,其中包含的信息可用于关于治疗功效和最佳实践,培训临床医生,用于机构内的内部审计,用于质量保证,等等。
历史上,以物理纸质文件夹(通常称为“病历表”或“图表”)的形式,保存各个患者的病历。各个患者的病历表会包括一叠纸质报告,比如就诊表、历史记录和免疫记录、实验结果和临床医生的诊疗记录。在诊疗患者,比如门诊、查房或外科手术之后,进行诊疗的临床医生会提供将包括在患者的病历表中的和诊疗有关的叙述性诊疗记录。这种诊疗记录可包括例如患者就诊原因的描述,任何生命特征的记载,检测结果和/或在就诊期间收集的其它临床数据,临床医生根据就诊确定的一种或多种诊断,和未来的治疗方案的描述。通常,临床医生会把诊疗记录口述到音频记录设备,或者可以接入这种记录设备的电话机中,以节省临床医生书写诊疗记录所用的时间。稍后,医疗转录人员会收听音频记录,将其转录成文本文档,所述文本文档会在一张纸上被插入患者的病历表,供以后参考。
目前,许多保健机构正在或者已经从纸质文档编制转变到电子病历系统,其中患者的纵向医疗信息以电子的形式被保存在数据储存库中。除了用电子存储方法代替纸质记录保管所带来的很大的物理空间节省外,电子病历的使用还向临床医生和其他保健人员带来有益的时间节省和其它可能。例如,当更新患者的电子病历,以反映当前患者就诊时,临床医生只需要记录从就诊获得的新信息,不需要花费时间输入无变化的信息,比如患者的年龄、性别、病史等。通过适当的用户界面和网络连接,电子病历还可被本地和远程的多个不同人员共享、访问和更新,消除了从拥挤的文件室取回和递送纸质文件的需要。
发明内容
一个实施例目的在于一种方法,所述方法包括:利用由一个或多个处理器实现的自然语言理解引擎,处理临床医生讲述的对患者的诊疗的形式自由的叙述,以从形式自由的叙述中,提取与可预订项目的记载对应的至少一个临床事实,其中所述处理包括区分所述至少一个临床事实是指示预订所述可预订项目的意图,还是不指示预订所述可预订项目的意图;和响应确定所述至少一个临床事实指示预订所述可预订项目的意图,生成对所述可预订项目的定单。
另一个实施例目的在于一种设备,所述设备包括至少一个处理器,和保存处理器可执行指令的至少一个处理器可读存储介质,当被所述至少一个处理器执行时,所述指令使所述至少一个处理器进行一种方法,所述方法包括:利用自然语言理解引擎,处理临床医生讲述的对患者的诊疗的形式自由的叙述,以从形式自由的叙述中,提取与可预订项目的记载对应的至少一个临床事实,其中所述处理包括区分所述至少一个临床事实是指示预订所述可预订项目的意图,还是不指示预订所述可预订项目的意图;和响应确定所述至少一个临床事实指示预订所述可预订项目的意图,生成对所述可预订项目的定单。
另一个实施例目的在于用计算机可执行指令编码的至少一个计算机可读存储介质,当被执行时,所述指令进行一种方法,所述方法包括:利用自然语言理解引擎,处理临床医生讲述的对患者的诊疗的形式自由的叙述,以从形式自由的叙述中,提取与可预订项目的记载对应的至少一个临床事实,其中所述处理包括区分所述至少一个临床事实是指示预订所述可预订项目的意图,还是不指示预订所述可预订项目的意图;和响应确定所述至少一个临床事实指示预订所述可预订项目的意图,生成对所述可预订项目的定单。
另一个实施例目的在于一种方法,所述方法包括:接收作为临床医生提供的患者诊疗的叙述的表示的原始文本;利用至少一个处理器,重新格式化所述原始文本,从而产生格式化文本;从格式化文本中提取一个或多个临床事实,其中所述一个或多个临床事实中的第一事实提取自格式化文本的第一部分,其中格式化文本的第一部分是原始文本的第一部分的格式化版本;和保持第一事实与原始文本的第一部分之间的关联。
另一个实施例目的在于一种设备,所述设备包括至少一个处理器,和保存处理器可执行指令的存储器,当被所述至少一个处理器执行时,所述指令进行一种方法,所述方法包括:接收作为临床医生提供的患者诊疗的叙述的表示的原始文本;重新格式化所述原始文本,从而产生格式化文本;从格式化文本中提取一个或多个临床事实,其中所述一个或多个临床事实中的第一事实提取自格式化文本的第一部分,其中格式化文本的第一部分是原始文本的第一部分的格式化版本;和保持第一事实与原始文本的第一部分之间的关联。
另一个实施例目的在于用多条计算机可执行指令编码的至少一个计算机可读存储介质,当被执行时,所述指令进行一种方法,所述方法包括:接收作为临床医生提供的患者诊疗的叙述的表示的原始文本;重新格式所述原始文本,从而产生格式化文本;从格式化文本中提取一个或多个临床事实,其中所述一个或多个临床事实中的第一事实提取自格式化文本的第一部分,其中格式化文本的第一部分是原始文本的第一部分的格式化版本;和保持第一事实与原始文本的第一部分之间的关联。
另一个实施例目的在于一种方法,所述方法包括:利用至少一个处理器,从临床医生提供的患者诊疗的形式自由的叙述中,提取多个临床事实,其中所述多个临床事实包含第一事实和第二事实,其中第一事实提取自形式自由的叙述的第一部分,其中第二事实提取自形式自由的叙述的第二部分;和向用户提供指示第一事实与形式自由的叙述的第一部分之间的第一关联的第一指示符,和不同于第一指示符的指示第二事实与形式自由的叙述的第二部分之间的第二关联的第二指示符。
另一个实施例目的在于一种设备,所述设备包括至少一个处理器,和保存处理器可执行指令的存储器,当被所述至少一个处理器执行时,所述指令进行一种方法,所述方法包括:从临床医生提供的患者诊疗的形式自由的叙述中,提取多个临床事实,其中所述多个临床事实包含第一事实和第二事实,其中第一事实提取自形式自由的叙述的第一部分,其中第二事实提取自形式自由的叙述的第二部分;和向用户提供指示第一事实与形式自由的叙述的第一部分之间的第一关联的第一指示符,和不同于第一指示符的指示第二事实与形式自由的叙述的第二部分之间的第二关联的第二指示符。
另一个实施例目的在于用多条计算机可执行指令编码的至少一个计算机可读存储介质,当被执行时,所述指令进行一种方法,所述方法包括:从临床医生提供的患者诊疗的形式自由的叙述中,提取多个临床事实,其中所述多个临床事实包含第一事实和第二事实,其中第一事实提取自形式自由的叙述的第一部分,其中第二事实提取自形式自由的叙述的第二部分;和向用户提供指示第一事实与形式自由的叙述的第一部分之间的第一关联的第一指示符,和不同于第一指示符的指示第二事实与形式自由的叙述的第二部分之间的第二关联的第二指示符。
另一个实施例目的在于一种方法,所述方法包括:从临床医生对患者的诊疗,收集一组一个或多个临床事实;利用至少一个处理器,从所述一组事实确定可能可从患者诊疗查明向所述一组事实提供额外特异性的额外事实;和向用户提醒可能可从患者诊疗查明所述额外事实。
另一个实施例目的在于一种设备,所述设备包括至少一个处理器,和保存处理器可执行指令的存储器,当被所述至少一个处理器执行时,所述指令进行一种方法,所述方法包括:从临床医生对患者的诊疗,收集一组一个或多个临床事实;从所述一组事实确定可能可从患者诊疗查明向所述一组事实提供额外特异性的额外事实;和向用户提醒可能可从患者诊疗查明所述额外事实。
另一个实施例目的在于用多条计算机可执行指令编码的至少一个计算机可读存储介质,当被执行时的,所述指令执行一种方法,所述方法包括:从临床医生对患者的诊疗,收集一组一个或多个临床事实;从所述一组事实确定可能可从患者诊疗查明向所述一组事实提供额外特异性的额外事实;和向用户提醒可能可从患者诊疗查明所述额外事实。
另一个实施例目的在于一种方法,所述方法包括:从临床医生对患者的诊疗,收集一组一个或多个临床事实;利用至少一个处理器,确定可能可从患者诊疗查明未包含在所述一组事实中的不详诊断;和向用户提醒可能可从患者诊疗查明所述不详诊断。
另一个实施例目的在于一种设备,所述设备包括至少一个处理器,和保存处理器可执行指令的存储器,当被所述至少一个处理器执行时,所述指令进行一种方法,所述方法包括:从临床医生对患者的诊疗,收集一组一个或多个临床事实;确定可能可从患者诊疗查明未包含在所述一组事实中的不详诊断;和向用户提醒可能可从患者诊疗查明所述不详诊断。
另一个实施例目的在于用多条计算机可执行指令编码的至少一个计算机可读存储介质,当被执行时,所述指令进行一种方法,所述方法包括:从临床医生对患者的诊疗,收集一组一个或多个临床事实;确定可能可从患者诊疗查明未包含在所述一组事实中的不详诊断;和向用户提醒可能可从患者诊疗查明所述不详诊断。
另一个实施例目的在于一种方法,所述方法包括:根据临床医生提供的患者诊疗的形式自由的叙述,确定可能可从患者诊疗查明一个或多个临床事实;向用户提供对应于所述一个或多个临床事实的一个或多个选项;从用户接收所述一个或多个选项中的第一选项的选择,所述第一选项对应于所述一个或多个临床事实中的第一事实;和利用至少一个处理器,更新形式自由的叙述的文本表示,以把第一事实识别成已从患者诊疗被查明。
另一个实施例目的在于一种设备,所述设备包括至少一个处理器,和保存处理器可执行指令的存储器,当被所述至少一个处理器执行时,所述指令进行一种方法,所述方法包括:根据临床医生提供的患者诊疗的形式自由的叙述,确定可能可从患者诊疗查明一个或多个临床事实;向用户提供对应于所述一个或多个临床事实的一个或多个选项;从用户接收所述一个或多个选项中的第一选项的选择,所述第一选项对应于所述一个或多个临床事实中的第一事实;和更新形式自由的叙述的文本表示,以把第一事实识别成已从患者诊疗被查明。
另一个实施例目的在于用多条计算机可执行指令编码的至少一个计算机可读存储介质,当被执行时,所述指令进行一种方法,所述方法包括:根据临床医生提供的患者诊疗的形式自由的叙述,确定可能可从患者诊疗查明一个或多个临床事实;向用户提供对应于所述一个或多个临床事实的一个或多个选项;从用户接收所述一个或多个选项中的第一选项的选择,所述第一选项对应于所述一个或多个临床事实中的第一事实;和更新形式自由的叙述的文本表示,以把第一事实识别成已从患者诊疗被查明。
附图说明
附图不是按比例绘制的。附图中,在各个图中图解所示的各个相同或几乎相同的组件用相同的附图标记表示。为清楚起见,未在各个图中标记每个组件。附图中:
图1是按照本发明的一些实施例的系统的例证工作环境的方框图;
图2是图解说明按照本发明的一些实施例的医疗事实复查系统的例证图形用户界面的屏幕截图;
图3A和3B是图解说明按照本发明的一些实施例的用户界面中的医疗事实的例证显示的屏幕截图;
图4是图解说明按照本发明的一些实施例的文本和医疗事实之间的关联的例证显示的屏幕截图;
图5是图解说明按照本发明的一些实施例的用于输入临床事实的例证界面的屏幕截图;
图6是图解说明按照本发明的一些实施例的提取对应于可预订项目的一个或多个医疗事实,确定预订意图,并生成可预订项目的定单的例证方法的流程图;
图7是按照本发明的一些实施例的处理形式自由的叙述,从形式自由的叙述生成定单,并把所述定单提供给履行系统的例证系统的方框图;
图8是图解说明按照本发明的一些实施例的用户可以批准或取消的生成定单的例证显示的屏幕截图;
图9是图解说明按照本发明的一些实施例的格式化文本,以便提取临床事实的例证方法的流程图;
图10是图解说明按照本发明的一些实施例的使提取的临床事实与文本关联的例证方法的流程图;
图11是图解说明按照本发明的一些实施例的分析特异性的例证方法的流程图;
图12是图解说明按照本发明的一些实施例的识别不详诊断的例证方法的流程图;
图13是图解说明按照本发明的一些实施例的更新文本的例证方法的流程图;
图14是可实现本发明的各个方面的例证计算机系统的方框图。
具体实施方式
电子健康记录(EHR)是通常由特定保健机构保存的电子病历,包含记录随着时间的过去,特定患者从该机构获得的护理的数据。一般,以结构化数据表示,比如具有结构化字段的数据库的形式,保存EHR。保存在这种EHR中的每项信息一般被表示成占据EHR数据库的字段的离散(例如,分离)数据项。例如,名为John Doe的55岁男性患者可具有“John Doe”被保存在patient_name字段中,“55”被保存在patient_age字段中,而“男性”被保存在patient_gender字段中的EHR数据库记录。在对于每个字段,只允许有限的一组有效输入的意义上,这种EHR中的数据项或字段是结构化的。例如,patient_name字段要求字母串作为输入,可具有最大长度限制;patient_age字段要求一串3个数字,第一个数字可以是“0”或“1”;patient_gender字段只允许两个输入“男性”和“女性”之一;patient_birth_date字段要求“MM/DD/YYYY”格式的输入;等等。
就其使用的词汇来说,一般的EHR也是结构化的,因为医学术语被规范化成保存EHR的机构利用的一组标准术语。所述一组标准术语可以特定于所述机构,或者可以是更广泛使用的标准。例如,口述或书写形式自由的诊疗记录的临床医生可对目前患有心脏供血中断的患者的状况,使用许多不同术语中的任意术语,包括“心脏病发作”、“急性心肌梗死”、“急性MI”和“AMI”。为了便利EHR数据在机构中的各个部门和用户之间的互用性,和/或允许跨患者记录地识别相同的状况,以便进行数据分析,典型的EHR只利用一个标准化术语来表示每个单独的医学概念。例如,“急性心肌梗死”可能是对于在临床诊疗时发生的心脏病发作的每种情况,保存在EHR中的标准术语。一些EHR可用对应于编码标准,比如国际疾病分类(ICD)标准的数据格式,表示医学术语。例如,在EHR中,“急性心肌梗死”可被表示成“ICD-9410”,其中410是按照第九版ICD标准的“急性心肌梗死”的码号。
为了使临床医生和其它保健人员可以按EHR的离散结构化数据格式,把医疗文件编制数据直接输入EHR中,许多EHR是通过广泛利用点击输入方法的用户界面访问的。尽管一些数据项,比如患者的姓名需要(结构化)文本或数字形式的输入,不过,通过利用鼠标或其它指示输入设备(例如,触摸屏),从下拉菜单和/或多组复选框和/或单选按钮等中的预设选项进行选择,可简单地输入许多数据项。
然而,发明人认识到虽然一些临床医生欣赏通过点击界面,直接把结构化数据输入EHR的能力,不过许多临床医生更喜欢在形式自由的诊疗记录中,他们能说什么和他们能够使用什么术语方面不受约束,许多临床医生不愿意花时间记住所有方框和按钮在什么地方,和这些方框和按钮在EHR用户界面都意味什么。另外,许多临床医生更喜欢利用通过口述诊疗记录能够获得的时间节省,因为语音通常是比通过表格的打字或点按更快的数据通信形式。
从而,这里说明的一些实施例涉及利用使临床医生能够借助临床医生的形式自由的叙述性诊疗记录,提供输入和观察结论的技术,增强结构化电子病历的创建和使用的技术。一些实施例涉及自动从临床医生的形式自由的患者诊疗的叙述中,提取离散的医疗事实(例如,临床事实),比如可作为离散的结构化数据项被保存在电子病历中的医疗事实。按照这种方式,可以提供形式自由的输入,但是可以保持电子形式的医疗文档编制数据的存储、维护和访问的优点。例如,作为一批离散的结构化数据项的患者的医疗文档编制数据的存储可带来能够查询感兴趣的单个数据项,和能够自动并且高效地把患者的数据项的任意子集汇集到新的报告、定单、发货单等中的益处。
可利用任何适当的技术,以任何适当的方式进行从形式自由的叙述中的医疗事实(例如,临床事实)的自动提取,在这方面,本发明不受限制。在一些实施例中,在进行自动事实提取之前,可对形式自由的叙述进行预处理,以确定形式自由的叙述表述的词语的顺序。也可利用任何适当的技术,以任何适当的方式进行这种预处理,在这方面,本发明不受限制。例如,在一些实施例中,临床医生可直接以文本形式,提供形式自由的叙述(例如,利用键盘或者其它文本输入设备),文本的形式自由的叙述可被自动解析,以确定其词语的顺序。在其它实施例中,临床医生可口述地以音频形式提供形式自由的叙述,临床医生的口述的音频记录可被接收和/或保存。在进行事实提取之前或期间,可用任何适当的方式处理音频输入,在这方面,本发明不受限制。在一些实施例中,可以处理音频输入,从而形成文本表示,可对文本表示进行事实提取。可按照任何适当的方式,进行产生文本表示的这种处理。例如,在一些实施例中,音频记录可由转录人员转录,而在其它实施例中,可对音频记录进行自动语音识别(ASR),以获得借助临床医生的口述提供的形式自由的叙述的文本表示。可以使用任何适当的自动语音识别技术,在这方面,本发明不受限制。在其它实施例中,可能不需要临床医生的音频口述的语音-文本转换,因为可以利用不涉及处理音频,从而产生文本表示的技术来确定说的是什么。在一个例子中,例如,通过比较音频记录和保存的波形模板,以确定词语的顺序,可直接从音频记录确定所讲的词语的顺序。在其它例子中,临床医生的语音可不被识别成词语,而是可按照另一种方式,比如一系列或一批抽象概念来识别。应意识到可按照任何适当的形式,包括除文本表示外的形式,把在临床医生的形式自由的叙述中表示的词语和/或概念表示和/或保存为数据,在这方面,本发明不受限制。
在一些实施例中,通过利用应用自然语言理解技术的事实提取组件,可从形式自由的叙述(音频或文本形式),或者形式自由的叙述的预处理数据表示中,自动提取一个或多个医疗事实(例如,临床事实)。在一些实施例中,要提取的医疗事实可由临床医生在记录患者诊疗时常用的一组事实类别(这里也称为“事实种类”或“实体种类”)定义。在一些实施例中,可利用各种已知保健标准任意之一,定义适当的一组事实类别。例如,在一些实施例中,要提取的医疗事实可包括美国政府例如按照42C.F.R.§495发布的有意义使用标准要求记录的事实,42C.F.R.§495陈述了规定对于医疗患者,要记录的各项医疗信息的“目标”。有意义使用标准目前要求的这种事实包括社会历史事实,过敏事实,诊断检测结果事实,药物治疗事实,问题事实,处置事实,和生命特征事实。不过,这些事实仅仅是例证性的,本发明并不局限于任意一组特殊的事实类别。一些实施例可不使用上面列举的事实类别中的一个或多个事实类别,而一些实施例可以利用任何其它适当的事实类别。医疗事实的适当类别的其它非限制性例子包括表现,失调,身体部位,医疗设备,诸如可观察到的表现和可测量的表现之类的细分类别,等等。可以任何适当的形式,实现事实提取组件,在这方面,本发明不受限制。下面详细说明事实提取组件的例证实现。
发明人认识并且意识到从临床医生提供的患者诊疗的形式自由的叙述,直接自动提取医疗事实(例如,临床事实)可产生对保健机构中的医疗文档编制所涉及的各种处理作出众多改进的机会。一些这样的改进有助于使临床医生能够有效地检查涉及在与医疗事实复查系统的单次交互会话中,直接从形式自由的叙述中获得更新的患者记录,计费信息,订购信息,护理质量保证,决策支持等中的任意一个或者它们的组合的过程。
在一些实施例中,通过重新格式化文本叙述,以便利临床事实的自动提取,可以改进从临床医生的形式自由的患者诊疗叙述的文本表示(例如,从文本叙述)中的临床事实的自动提取。例如,在一些实施例中,进行自动事实提取的事实提取组件可利用一定程度上依赖于文本叙述中的句子边界的精确放置的语言知识。从而,在一些实施例中,通过增加、消除和/或校正文本叙述中的句子边界,以遵守事实提取组件预期的语言结构,可以增强事实提取。下面说明可实现句子边界预处理的方式的例子。在另一个例子中,通过使文本叙述中的章节标题规范化,以遵守为其进行临床文档编制的保健机构使用的标准章节标题,可以增强自动事实提取。
在一些实施例中,在各个提取的临床事实和从中提取该事实的那部分形式自由的叙述之间,可以保持关联。例如,如果从形式自由的叙述中提取对应于“急性心肌梗死”的事实,因为该形式自由的叙述包括术语“心脏病发作”,那么在提取的事实和形式自由的叙述中的词语“心脏病发作”之间,可以保持关联。在一些实施例中,在临床医生或另一个用户借助事实复查系统的用户界面,复查提取的临床事实的时候,系统可向用户(可以是临床医生本人,或者不同的人)提供不同的提取事实和形式自由的叙述中的从中提取所述事实的各个部分之间的不同关联的一个或多个指示符。这种指示符可以是视觉指示符,音频指示符,或者任何其它适当种类的指示符,在这方面,本发明不受限制。在一些实施例中,这样的关联指示符可增强临床医生或其它用户参考形式自由的叙述的产生提取事实的各个具体部分,针对准确性复查提取的事实的能力。在一些实施例中,如果在事实提取之前,形式自由的叙述的文本表示已被重新格式化,那么在提取的事实和原始文本叙述之间,可仍然保持关联,以使用户可以把提取的事实和临床医生最初提供的叙述相联系。尽管一些实施例对于每个提取的事实,都提供关联信息,不过应意识到本发明的涉及提供关联信息的方面并不局限于此,可以为提取的事实之一或任意子集,提供关联信息。
在一些实施例中,自动提取的临床事实也可被自动复查,如果认为患者诊疗的临床文档编制有改进的可能,那么向临床医生或其他用户提供自动提醒。这种提醒可以是视觉提醒,音频提醒,或者任何其它适当种类的提醒,在这方面,本发明不受限制。在一些实施例中,可在完成患者诊疗之后的某个时候,向临床医生或其他用户提供所述提醒,并且可向临床医生或其他用户给予提供从患者诊疗查明的,但是最初未在形式自由的叙述中具体说明的额外信息的机会。在其它实施例中,可在患者诊疗仍在进行中的时候,向临床医生提供所述提醒,从而可向临床医生提供开始与患者的进一步交互,从而查明额外的信息,以包含在临床文献(或文献,下同)中的机会。
在一些实施例中,可用一组确定性规则,对事实复查系统编程,以触发提醒。例如,一组确定性规则可规定某些提取的事实,提取的事实的某些组合,提取的事实和形式自由的叙述中的术语的某些组合,和/或从当前患者诊疗中提取的事实与从患者的在先病历中提取的事实的某些组合自动触发给用户的提醒。在其它实施例中,事实复查系统可被编程成进行概率分析,或者应用统计模型,以判定在形式自由的叙述中具体说明的信息是否将触发给用户的提醒。不过应意识到,按照这里说明的实施例的事实复查系统不限于任何特定的编程技术,可以使用任何适当的这种技术。另外,应意识到在不涉及从形式自由的叙述中,自动提取临床事实的实施例中,也可提供自动提醒。例如,这种提醒可由作为离散的结构化数据项接收的临床事实,比如给诸如EHR之类电子病历的直接输入触发。从而应意识到可根据用任何适当方式收集的临床事实的分析,提供提醒,在这方面,本发明不受限制。
在一些实施例中,当从患者诊疗中收集一组一个或多个临床事实,并且确定存在增大该组事实的特异性的可能时,可提供提醒。在一些实施例中,可确定可能可从患者诊疗中,查明另外的事实,并且所述另外的事实会增加已从患者诊疗中收集的一组临床事实的特异性。在一个例子中,这种另外的事实可以是初始事实之一的更具体形式,通过用其更具体形式替换该初始事实,可以增大所述一组事实的特异性,只要确实能够从患者诊疗中查明所述具体形式。例如,初始事实可描述状况,而更具体的形式可把相同的状况描述成“急性”或“慢性”。在另一个例子中,当组合地出现时,两个或者更多的初始事实可能意味额外的事实,记录该额外的事实可增大患者诊疗的记录的特异性。在一些实施例中,提醒可向用户询问是否应实际从患者诊疗中查明额外的事实,可允许用户通过记录所述额外的事实,增大事实的特异性。
在一些实施例中,当从患者诊疗中收集一组一个或多个临床事实,并且确定可能可从患者诊疗中查明未在所述一组事实中指定的诊断结果时,可以提供提醒。在一个例子中,这种不详诊断可以是包含在所述一组事实中的诊断结果的已知合并症。在另一个例子中,不详诊断可以是包含在所述一组事实中的处置或诊断的已知并发症。在另一个例子中,不详诊断可以是包含在所述一组事实中的诊断结果实际上是包含在所述一组事实中的处置或其它诊断的并发症,或者包含在出自当前诊疗之前的患者病史的事实中的处置或其它诊断的并发症的事实的识别。类似地,不详诊断可以是包含在出自患者的以前病史的事实中的诊断是在当前患者诊疗中查明的诊断的并发症的事实的识别。在一些实施例中,当从收集自患者诊疗的一组初始事实中,确定这种不详诊断的可能性或似然性时,提醒可向用户(例如,临床医生或另一个用户)询问是否应从患者诊疗中查明所述不详诊断。
在一些实施例中,当从患者诊疗中收集一组一个或多个临床事实,并且确定所述一组事实中的两个或者更多事实以某种方式彼此冲突,或者确定所述一组事实中的一个或更多事实与患者病史中的一个或更多事实冲突时,可以提供提醒。在一些实施例中,事实复查系统可被编程成根据具有不合要求的相互作用的事实的一组已知组合,自动生成这种提醒。例如,当所述一组事实指出除了某种其它药物(药B)外,患者还开有与药B不良地相互作用的某种药物(药A),以致不应同时开这两种药物时,可以产生提醒。在一些实施例中,可在从当前患者诊疗中收集的一组事实中,指定药A和药B两者的开药,而在其它实施例中,可在从当前患者诊疗中收集的事实中,指定药A的开药,而在包含在机构的患者病史记录中的事实中,指定药B的开药。从而,在一些实施例中,事实复查系统可访问从当前患者诊疗中收集的事实,和出自患者的病史记录的事实,以确定是否应产生提醒。在一些实施例中,冲突提醒可由其中的至少一个事实不对应于药物的事实的组合触发。例如,对于与药物和过敏症的组合,药物和诊断的组合,药物和患者的年龄或性别的组合,药物和在患者的病史中指示的情况的组合,医疗诊断程序和任意上述特性的组合,或者计划的治疗和源于当前患者诊疗或者源于患者病史的已知对其来说,计划的治疗是禁忌的另一个临床事实的任何其它组合相关的禁忌,可以提供提醒。
在一些实施例中,当从患者诊疗中收集一组一个或更多临床事实,并且确定存在加入患者诊疗的临床文档编制中,以便检查质量的可能时,可以提供提醒。在一些实施例中,可用一组确定性规则对事实复查系统编程,以根据一组标准的护理质量指标,响应某些事实或者事实的某些组合,产生自动提醒。这种护理质量标准可以是特定保健机构专有的,或者可以是非机构特有的标准,比如医师质量报告倡议组织(PQRI)的标准,或者国际医疗卫生机构认证联合委员会(JCAHO)的标准。可以使用任何适当的护理质量标准,本发明并不局限于任何特殊的护理质量标准。在一些实施例中,当收集的事实或者事实的组合与按照护理质量标准,在临床医生方面的某种推荐操作相联系时,可以提供提醒,以询问用户是否进行推荐的操作。
在一些实施例中,可以提供通过学习临床医生或其他用户随着时间的过去,与系统的相互作用,自适应地过滤事实复查系统产生的自动提醒的机制。例如,如果确定特定用户一贯忽略特定种类的提醒,那么当未来的事实触发相似的提醒时,系统可停止发送所述相似的提醒。在一些实施例中,自适应学习可特定于每个单独用户,可帮助避免提醒疲劳,提醒疲劳涉及在反复被用户认为不相关的提醒烦扰方面的挫折。在一些实施例中,所述自适应学习可涉及关于当用户忽略提醒时往往会存在的事实的模式的数据的收集,系统可滤出与事实的这些模式匹配的未来提醒。在一些实施例中,可根据机构层面的规则或统计使用模式,进行自适应提醒过滤,以致不提供对事实复查系统在其中运行的特定保健机构来说,认为无关的提醒。
在一些实施例中,除临床医生外的人类用户可复查从患者诊疗收集的一组临床事实,可人工(例如,非自动,而是涉及人为操作)使未被事实复查系统自动发送的一个或多个提醒被发送给临床医生。所述人类用户可手动地按照任何适当方式,使提醒被发送,在这方面,本发明不受限制。在一个例子中,人类用户可向事实复查系统提供指令输入,以使事实复查系统产生由人类用户指定的提醒。在其它例子中,人类用户可使用除事实复查系统外的不同方法和/或系统向临床医生发送提醒。在一些实施例中,这种不同的方法不必是基于机器的,在这方面,本发明不受限制。在一些实施例中,人类用户可以访问在保健机构之内和/之外的患者的既往病史,例如,呈与患者在该机构和/或别处的护理相关的电子病历和/或既往临床文档的形式。在一些实施例中,除了源于当前患者诊疗的临床事实之外,人类用户还可参考所述既往病史,以判定是否人工使提醒被发送给临床医生。在一些实施例中,如果事实和患者的病史指示其中自动事实复查系统应产生自动提醒的状况,但是该系统未能准确识别出所述状况,那么人类用户可确定发送与上述各种自动提醒任意之一类似的提醒。在一些实施例中,如果临床医生选择忽略事实复查系统自动产生的提醒,但是忽略这种提醒违反了机构的政策,那么人类复查员可确定人工向临床医生发送进一步提醒。从而,在一些实施例中,在机构环境中,自动事实复查系统可以与涉及人类用户的人工复查处理共存,人工复查处理可提供后备和/或附加功能,以补充自动事实复查处理。
在一些实施例中,当从形式自由的叙述中提取医疗事实时,事实提取组件可能会遇到其中在可能提取自形式自由的叙述的相同部分的多个事实之间,需要消除模棱两可情况的情形。在一个例子中,形式自由的叙述中的术语可能与事实提取组件使用的形式本体(下面说明)中的两个不同概念关联,并且可能这两个概念不可能共存于形式自由的叙述中。在另一个例子中,事实提取组件可应用统计模型(其例子在下面说明)识别待从文本的某个部分提取的事实,统计模型可针对待提取的单个事实,提出多个备选假设。在一些实施例中,统计模型可用于根据每个备选假设准确地表示从中提取所述事实的那部分文本的预定语义含意的估计似然的概率、置信度或者任何其它适当的量度,对备选假设打分。在这种情况下,在一些实施例中,事实复查系统可提供接收用户输入,以在事实提取组件试探地提取的多个事实之间,消除模棱两可情况的界面。这种用户界面可以是任何适当的形式,在这方面,本发明不受限制。在一个非限制性例子中,事实复查系统可向用户提供一定数目的估计似然得分较高的备选假设。在一些实施例中,提供的各个选项可对应于多个不确定事实之一,用户可选择选项之一,以指定应从形式自由的叙述中实际提取哪个事实。
在一些情况下,当用户选择通过事实复查系统提供的结构化选择呈现的事实时,事实提取组件提取的一组事实可被相应更新,不过,从中提取事实的原始形式自由的叙述可保持不变。在一些实施例中,在其它情况下,临床医生的形式自由的叙述的文本表示可被自动更新(例如,变更),以明确把用户选择的事实识别成已从患者诊疗中查明。例如,如果形式自由的叙述最初包括与事实提取组件的本体论中的两个不同概念关联的术语,那么事实复查系统可向用户提供只关联到所述概念之一的不同术语,和只关联到所述概念中的另一个概念的不同术语之间的结构化选择。在一些实施例中,当用户选择提供的结构化选择中的不同术语之一时,文本叙述可被自动更新,以用选择的术语替换原始术语。在另一个例子中,如果统计事实提取模型的应用产生对于待提取自形式自由的叙述中的某个部分的事实的多个备选假设,那么事实复查系统可向用户提供备选假设(例如,得分最高的N个备选假设)中的至少两个假设之间的选择。在一些情况下,在一些实施例中,文本叙述可被自动更新,以更好地反映用户选择的备选假设。例如,如果原始文本叙述包括术语“哮喘”,那么事实提取组件可能提供“慢性阻塞性哮喘”和“不详哮喘”的备选事实假设。如果用户随后选择“慢性阻塞性哮喘”假设(表示更具体的哮喘事实),那么文本叙述随后自动被更新,以用“慢性阻塞性哮喘”替换最初的“哮喘”。在一些实施例中,可响应对应于可能可从患者诊疗中查明的医疗事实,由事实复查系统提供的选项的任意种类的用户选择,进行文本叙述的这种更新。一些例子包括排除模棱两可情况选项,对应于增大特异性的额外事实的选项,和对应于不详诊断的选项,如上所述。在一些实施例中,代替替换叙述中的文本,可以产生与选择的事实对应的新文本,并简单地在一个或多个适当位置,增加到叙述中。在一些实施例中,可通过识别文本叙述中的一个或多个章节标题,并把文本插入最接近对应于所选事实的一个或多个章节中,自动确定插入识别所选事实的文本的位置。
在一些实施例中,事实复查系统可允许临床医生或其他用户以离散的结构化数据项的形式,直接增加临床事实,并指示与临床医生的形式自由的患者诊疗叙述之中的应已从中提取所述增加事实的部分的关联。例如,用户可以离散的结构化数据元素的形式,指定临床事实,选择形式自由的叙述中的一个或一组词语(所述一组词语不必邻近),并指出指定的事实是从形式自由的叙述的该部分(即,所述词语或一组词语)中查明的。在一些实施例中,当增加这样的事实时,对于该用户(或者对于提供形式自由的叙述的临床医生),事实提取组件可被更新,以使从形式自由的叙述中选择的词语与对应于增加的事实的形式本体中的一个或更多概念关联,或者重新训练统计事实提取模型,以使选择的词语与增加的事实相联系。在一些实施例中,可进一步用升级的事实提取组件重新处理形式自由的叙述,以提取可根据更新的术语确定的任何更多的额外事实。在一个例子中,如果用户选择形式自由的叙述的患者病史部分中的词语,并增加说明患者具有特定情况的历史的事实,那么重新处理形式自由的叙述的更新的事实提取组件可能识别家族病史部分中的相同词语,并提取患者具有相同情况的家族病史的额外事实。在一些实施例中,这种自动重新处理可节省临床医生或其他用户否则为了确定形式自由的叙述中,对应于相同术语的多个事实而需要的时间和工作量。在一些实施例中,当用户编辑或删除最初自动提取自形式自由的叙述中的事实时,当事实被关联到出现在形式自由的叙述的多个部分中的术语时,可以进行类似的重新处理。
在一些实施例中,如上所述,事实复查系统允许用户增加、删除和/或修改(总体称为“变更”)从临床医生提供的形式自由的患者诊疗叙述中提取的医疗事实,导致一组提取的事实的变更。例如,在一些实施例中,通过指定形式自由的叙述的一部分,并指定应提取自叙述的该部分的特定事实,用户可向一组提取的事实中增加事实。在一些实施例中,通过打字、讲话或以其它方式输入待增加的特定事实,或者通过从菜单选项中选择事实和/或事实的组成部分,用户可以直接指定增加的事实。另一方面或者另外,如上所述,在一些实施例中,系统可向用户提供关于待从形式自由的叙述的一部分提取的事实的多个备选假设之间的选择,用户可选择提供的假设之一,以把该事实增加到一组提取的事实中。在另一个例子中,通过选择提取的事实,并输入应替换该事实的不同事实,或者通过选择提取的事实的组成部分,并输入对所述组成部分的变更,等等,用户可修改已自动从形式自由的叙述中提取的事实。在另一个例子中,通过选择提取的事实,并选择“删除”选项,或以其它方式指出不应从形式自由的叙述的对应部分中,提取该事实,用户可删除提取的事实。不过应意识到上面所述仅仅是例子,可允许用户用任何适当的方式,增加、删除和/或修改一组提取的医疗事实中的一个或多个事实,在这方面,本发明不受限制。
当用户输入对已自动从形式自由的叙述中提取的一组一个或多个事实的变更(例如,增加、删除或修改)时,这里把这种变更称为对一组提取的事实的“修正”。在一些实施例中,用户可用任何适当的方式,输入对一组提取的医疗事实的修正,事实复查系统随后可在整个形式自由的叙述中,应用用户的修正。按照这种方式,在一些实施例中,用户能够修正事实提取组件对叙述文本的一个部分的处理,随后可对文本的其它部分自动应用类似的修正,用户不必对于文档中的文本的每个类似部分,直接指定相同种类的修正。对于非限制性例子,考虑下面的例证叙述文本:
主诉症状:上肢的癫痫肌阵挛性抽搐。
既往病史:发育迟缓和涉及上肢的肌阵挛发作史。
评估:涉及上肢的肌阵挛抽搐。
假定自动事实提取组件未能从文本部分“上肢的癫痫肌阵挛性抽搐”中,提取临床医生的预定含意(预定的医疗事实)。文本部分“涉及上肢的肌阵挛发作”和“涉及上肢的肌阵挛抽搐”传达相似的语义含意,从而自动事实提取组件也不太可能从这些文本部分,成功地提取预定的医疗事实。在一些实施例中,用户可通过选择文本部分“癫痫肌阵挛性抽搐”,并增加对应于ICD-9代码345.1的对应医疗事实“肌阵挛性癫痫发作”,修正事实提取。在一些实施例中,当分析用户对从文本的第一部分的事实提取的修正时,事实复查系统可学习关联,并可自动对叙述文本的剩余部分应用类似的校正。例如,事实复查系统可把其它文本部分“肌阵挛发作”和“肌阵挛抽搐”识别成类似于第一文本部分“癫痫肌阵挛性抽搐”,从而也可自动从另外两个文本部分提取对应于ICD-9代码345.1的事实“肌阵挛性癫痫发作”。在这个例子中,在一些实施例中,系统从文本的其它部分中,提取相似的事实(例如,不一定和用户增加的事实相同的事实),因为其它文本部分可能具有和第一文本部分相似,但不一定相同的预定语义含意。例如,在上述叙述中,两个文本部分“癫痫肌阵挛性抽搐”和“肌阵挛发作”指示具有规范化形式“肌阵挛性癫痫发作”的医疗问题,不过第二部分出现在“既往病史”部分中,而第一部分出现在“主诉症状”部分中。从而,在一些实施例中,系统可自动从第二部分提取类似的医疗事实,不这,提取自第二部分的事实可指示该问题是既往病史问题,而不是当前问题。
从而,在一些实施例中,用户可识别应与叙述文本的第一部分关联的事实,系统随后可自动从叙述文本的一个或多个其它部分,提取一个或多个相似事实。用户可按照任何适当方式,识别应与第一文本部分关联的事实。例如,如上所述,在一些情况下,用户可选择叙述文本的某个部分,可直接指定应从文本的该部分提取的事实。在其它情况下,文本提取组件可向用户提供与待提取自叙述文本的所述部分的事实的备选假设对应的多个选项,用户可通过选择提供的备选假设之一,识别应与该文本部分关联的事实。在其它情况下,用户可选择已从叙述文本的某个部分提取的事实,并可指定应对提取的事实作出的修改,从而识别应与该文本部分关联的正确事实。不过应意识到,上述仅仅是例子,用户可用任何适当方式,识别应与叙述文本的某个部分关联的事实,在这方面,本发明不受限制。
在其它例子中,用户可删除提取自叙述文本的第一部分的事实,系统随后可自动删除从叙述文本的一个或多个其它部分提取的相同事实(或者相似事实)的一个或多个其它实例。不过应进一步意识到,如上所述的增加、删除和修改事实仅仅是例子,用户可被允许用任何适当方式,修正一组提取的医疗事实,在这方面,本发明不受限制。在一些实施例中,用户对提取自叙述文本的第一部分的一个或多个事实作出的任何适当种类的修正随后可被自动应用于叙述文本的一个或多个其它部分。此外,在一些实施例中,另一方面或者另外,用户对提取自第一叙述文本的一组事实作出的任何适当种类的修正可被自动应用于事实提取组件未来处理的其它叙述文本。在一些实施例中,事实提取组件使用的一个或多个事实提取模型可被重新训练,以致可按处理随后文本的方式,反映应用于第一文本的修正。在其中发生用户修正的整个文本中,应用用户修正的例证技术,以及在其它文本的处理中反映所述修正的例证技术在下面说明。
在一些情况下,对对应于当前患者诊疗的一组事实作出的一个或多个这种变更可能造成所述一组事实和原始形式自由的叙述的语义内容之间的一个或多个不一致。例如,临床医生最初在形式自由的叙述中,说明特定的诊断结果,事实提取组件可提取对应于该诊断结果的临床事实。如果临床医生稍后改变其意见,从而可能会用不同的诊断结果替换初始诊断结果,那么在一些实施例中,他可具有简单地直接编辑提取的事实,而不是编辑形式自由的叙述本身的数据表示的选择权。这种情形会造成形式自由的叙述和对应的一组临床事实之间的不一致,因为事实现在指定新的诊断结果,而形式自由的叙述仍然指定初始的诊断结果。在这种情形下,在一些实施例中,事实复查系统可就所述不一致提醒临床医生或其他用户,和/或可向用户提供几种选项任意之一,以解决所述不一致。一种选项是忽略所述不一致,允许所述不一致存留在临床文档编制中。再一种选项是允许用户编辑形式自由的叙述的数据表示,以与当前的一组临床事实一致。又一种选项是允许系统通过增加、删除或替换形式自由的叙述的一个或多个部分,自动更新形式自由的叙述的数据表示。另一种选项是简单地向形式自由的叙述附加注释,指示并且视需要解释所述不一致。
在一些实施例中,如上所述,医疗事实复查系统可向临床医生提供各种工具,以复查和/或编辑对应于当前患者诊疗的事实,接收根据这些事实产生的提醒,复查和/或编辑临床医生提供的形式自由的患者诊疗叙述,和/或复查在事实提取组件提取的医疗事实和形式自由的叙述的从中提取所述医疗的各个部分之间保持的关联。可用任何适当形式,提供这样的工具,包括视觉形式,音频形式,组合形式,或者提供这里说明的功能的任何其它形式,在这方面,本发明不受限制。当以视觉形式提供所述工具时,可通过图形用户界面(GUI),访问其功能。在一些实施例中,可按照允许人类用户高效地处理显示的信息的方式,组织GUI。例如,在一些实施例中,文本叙述、事实和提醒可被显示在用户界面内的始终如一的位置,并按种类和/或优先级组织。可以利用不同的颜色、文本风格和/或图形风格把用户的注意力引导到高优先级提醒,和/或使显示中的相关项目之间的关联易于识别。在一些实施例中,可按照在抬头显示器(HUD)的研发中使用的原理,确定这种视觉显示的组织和/或布局。
在一些实施例中,作用于从患者诊疗中查明的一组临床事实的事实复查系统可提供用于提升超出患者诊疗的结论的临床医生和/或其他人员的工作流的效率。例如,在一些实施例中,事实复查系统可以面接一个或多个计算机化医嘱输入(CPOE)系统,以根据在对应于当前患者诊疗的一组事实中指定的项目(例如,药物名称、剂量、手术名称、日期等),自动预订对于处方药、实验检测、放射筛查、外科手术和/或其它医疗手术和/或其它计划的治疗操作项目。在一些实施例中,可根据这些项目提取自形式自由的叙述的“方案”部分,识别这些项目。在一些实施例中,事实复查系统可面接一个或多个调度系统,以安排医疗手术和/或在机构之内或之外的未来门诊的预约。在一些实施例中,事实复查系统可把一个或多个事实格式化成标准或专有消息接发格式,以便利与任意这样的系统面接。在一些实施例中,可根据一组临床事实,自动生成或初步填写计费报告、患者出院指示和/或其它文档。在具有上述功能中的任意功能的一些实施例中,在采取任意上述动作之前,事实复查系统可向用户提供提醒,和/或提示用户或临床医生同意。
在一些实施例中,事实复查系统可提供基于从当前患者诊疗收集的一组临床事实的基于证据的临床决策支持工具。在一些实施例中,事实复查系统可以访问既往患者报告的一个或多个数据集,和/或可提供关于与当前患者诊疗相关的各种条件、治疗结果等的信息的医学文献资料的一个或多个档案。在一些实施例中,可获得的文献资料已由事实提取组件处理,并利用和用于从形式自由的叙述中,提取临床事实的相同术语系统编制索引。从而,在一些实施例中,可以高效地匹配对应于当前患者诊疗的事实和相关的可用文献资料,这些文献资料或其子集可被取回,以便显示或以其它方式提供给临床医生,从而帮助他确定当前患者的治疗方案。在一些实施例中,可根据既往患者结果的数据集和/或医学文献中的数据,训练统计模型,以致通过把统计模型应用于对应于当前患者诊疗的一批事实,和/或应用于患者的病史,系统可以起码超越参考文献的介绍,实际地预测最佳的治疗路线。在一些实施例中,可把治疗建议连同到支持所述建议的文献中的参考,或者其它可用数据的链接一起提供给临床医生。在一些实施例中,大量的病历和/或文献资料的临床语言理解(CLU)索引也可用于便利临床研究学习,因为可用的自然语言文献资料可被有效地映射到对应于研究问题的ad hoc查询。利用CLU技术,可从作为结果的概念上相关的文献资料的语料库中,提取治疗结果和/或其它所需信息或事实,以帮助合成研究问题的答案。
尽管上面说明了关于临床文档编制处理的许多发明特征,不过应意识到本发明的实施例可包括这些特征任意之一,两个或更多特征的任意组合,或者所有的特征,本发明不限于任何特定数目的上述特征,或者上述特征的任意组合。可用多种方式任意之一,实现这里说明的本发明的各个方面,本发明不限于任何特定的实现技术。下面说明具体实现技术的例子;不过应意识到,提供这些例子仅仅是为了举例说明,其它实现也是可能的。
这里说明的技术的一种例证应用供增强医疗文档编制处理的系统之用。图1中图解说明了这种系统的例证工作环境。所述例证工作环境包括医疗文档编制系统100,它可用任何适当形式实现,在这方面,本发明不受限制。例如,系统100可被实现成单个独立的机器,或者可用按照任何适当的方式,分担处理任务的多个分布式机器实现。系统100可被实现成一个或多个计算机;下面说明适当计算机的例子。在一些实施例中,系统100可包括存储处理器可执行指令的一个或多个有形的非临时性计算机可读存储设备,和执行处理器可执行指令,以实现这里说明的功能的一个或多个处理器。存储设备可被实现成用处理器可执行指令编码的计算机可读存储介质;适当的计算机可读存储介质的例子在下面讨论。
如上所述,例证系统100包括ASR引擎102,事实提取组件104,和事实复查组件106。系统100的这些处理组件都可用软件、硬件或者软件和硬件的组合来实现。用软件实现的组件可包括可由系统100的一个或多个处理器执行,以实现这里说明的功能的多组处理器可执行指令。ASR引擎102、事实提取组件104和事实复查组件106都可被实现成系统100的独立组件,或者这些组件的任意组合可被结合成单个组件或者一组分布式组件。另外,ASR引擎102、事实提取组件104和事实复查组件106中的任何一个可被实现成一组多个软件和/或硬件组件。应理解图1中描述的任何这样的组件并不限于任何特殊软件和/或硬件实现和/或结构。
如图1中图解所示,向临床医生120呈现用户界面110,临床医生120可以是医师、医师的助手、护士、或者临床环境中,参与患者122的评估和/或治疗的任何其他人员。在临床医生诊疗患者122的过程中,或者在之后的某个时刻,临床医生120可能想要记录该患者诊疗。这种患者诊疗可包括在临床评估和/或治疗环境中,临床医生120和患者122之间的任何交互,包括(但不限于)门诊,查房期间的交互,门诊或住院手术(外科或非外科),后续评估,实验或放射检测等。临床医生120可用于记录患者诊疗的一种方法是以离散的结构化数据项的形式,把可从患者诊疗中查明的医疗事实输入用户界面110中。在一些实施例中,一旦被输入,所述一组医疗事实就可经任何适当的通信介质(例如,可包括有线和/或无线连接的本地和/或网络连接)被传送给系统100。具体地,在一些实施例中,所述一组医疗事实可在系统100,被事实复查组件106接收,事实复查组件106的例证功能在下面说明。
临床医生120可用于记录患者诊疗的另一种方法是提供形式自由的患者诊疗叙述。在一些实施例中,在就所述叙述的结构和内容来说,临床医生120不受约束,并且临床医生120可以自由提供他喜欢的词语、句子、段落、章节等的任意次序的意义上,所述叙述是形式自由的。在一些实施例中,对形式自由的叙述的长度没有限制,或者长度只受所述叙述被输入其中的用户界面,或者将作用于所述叙述的后续处理组件的处理能力限制。在其它实施例中,形式自由的叙述在长度方面受限(例如,限于特定数目的字符)。
临床医生120可用各种方式任意之一,提供患者诊疗的形式自由的叙述。一种方式是把文本形式的形式自由的叙述人工输入用户界面110中,例如利用键盘。在这方面,在一些实施例中,系统100和/或与系统100通信的客户端设备的一个或多个处理器可被编程成向临床医生120呈现包括文本编辑器/字处理器的用户界面。这种文本编辑器/字处理器可用任何适当的方式实现,在这方面,本发明不受限制。
提供患者诊疗的形式自由的叙述的另一种方式是口头讲述患者诊疗的口述。可按照任何适当方式,提供这种口述,在这方面,本发明不受限制。如图1中图解所示,临床医生120提供形式自由的叙述的口述记录的一个方式可以是对着麦克风112讲述所述口述,麦克风112向用户界面110提供输入(例如,经直接有线连接,直接无线连接,或者经通过中间设备的连接)。口述的音频记录随后可按任何适当的数据格式被保存,并被传送给系统100和/或医疗转录人员130。临床医生130提供口述的另一种方式是对着电话机118讲话,音频信号可从电话机118被传送,从而在系统100,在医疗转录人员130的地点,或者在任何其它适当的位置被记录。另一方面,可在中间设施,按任何适当的数据格式记录音频信号,随后音频数据可被中继给系统100和/或医疗转录人员130。
在一些实施例中,医疗转录人员130可接收临床医生120提供的口述的音频记录,可把音频记录转录成形式自由的叙述的文本表示(例如,转录成文本叙述)。医疗转录人员130可以是收听音频口述,并把讲述的内容写入或键入文本文档中的任何人。在一些实施例中,医疗转录人员130可在医疗转录领域受到专门训练,并且精通医学术语。在一些实施例中,医疗转录人员130可精确地转录她在音频口述中听到的内容,而在其它实施例中,医疗转录人员130可向文本转录增加格式编排,以遵守通常接受的医疗文献标准。当医疗转录人员130完成形式自由的叙述到文本表示的转录时,在一些实施例中,作为结果的文本叙述可被传送到系统100,或者任何其它适当的位置(例如,传送到系统100可访问的存储位置)。具体地,在一些实施例中,系统100内的事实提取组件104可从医疗转录人员130接收文本叙述。下面说明事实提取组件104的例证功能。
在一些其它实施例中,利用自动语音识别(ASR)引擎102,可在系统100或者任何其它适当的地点,接收口述的音频记录。在一些实施例中,ASR引擎102随后可处理音频记录,以确定说的是什么。如上所述,这种处理可涉及任何适当的语音识别技术,在这一方面,本发明不受限制。在一些实施例中,音频记录可被自动转换成文本表示,而在其它实施例中,可用不同于文本的数据格式,表示直接从音频记录中识别出的词语,或者可以识别抽象概念,而不是词语。下面关于作为形式自由的叙述的文本表示的文本叙述,说明进一步处理的例子;不过应意识到,可对如上所述的形式自由的叙述的其它表示,进行类似的处理。当产生文本表示时,在一些实施例中,人类(例如,转录人员)可针对准确性复查所述文本表示,而在其它实施例中,ASR引擎102的输出可被视为准确,而不存在人类复查。如上所述,一些实施例并不局限于转录音频数据的任何特定方法;口述的音频记录可由人类转录人员人工转录,由ASR自动转录,或者通过人类编辑ASR产生的转录草稿,半自动地转录。ASR引擎102和/或转录人员130产生的转录可按照任何适当的形式,被编码或者以其它方式表示成数据,在这方面,本发明不受限制。
在一些实施例中,在确定在临床医生120提供的形式自由的叙述中所讲的词语的次序时,ASR引擎102可利用医学术语词典(它可以是另一本更通用的语音识别词典的一部分,或者除了另一本更通用的语音识别词典之外)。不过,本发明并不限于对于ASR,使用词典或者任何特殊种类的词典。当被使用时,在一些实施例中,医学词典可被链接到事实提取组件104利用的知识表示模型,比如临床语言理解本体论,以致ASR引擎102可产生包含呈事实提取组件104可理解形式的术语的文本叙述。在一些实施例中,更通用的语音识别词典也可在ASR引擎102和事实提取组件104之间被共享。不过,在其它实施例中,ASR引擎102可不具有开发成与事实提取组件104共用的任何词典。在一些实施例中,ASR引擎102使用的词典可被链接到不同种类的医学知识表示模型,比如不是为语言理解而设计或用于语言理解的医学知识表示模型。可意识到,ASR引擎102和/或事实提取组件104使用的任何词典可用任何适当的方式,被实现和/或表示成数据,在这方面,本发明不受限制。
在一些实施例中,在被事实提取组件104接收之前,可用一种或多种方式,重新格式化文本叙述,所述文本叙述不论是由ASR引擎102产生的(并且视情况由人类核实或者未由人类核实),由医疗转录人员130产生的,通过用户界面110,以文本形式直接输入的,还是用任何其它方式产生的。这种重新格式化可由ASR引擎102进行,由事实提取组件104的组件进行,由ASR引擎102和事实提取组件104的组合进行,或者由任何其它适当的软件和/或硬件组件进行。在一些实施例中,可按照已知使事实提取更容易的方式进行重新格式化,可为了使事实提取组件104更容易从文本叙述中,提取临床事实而进行重新格式化。例如,在一些实施例中,如果文本叙述中的句子边界准确,那么可以改善进行事实提取的处理。从而,在一些实施例中,在事实提取之前,文本叙述可被重新格式化,以增加、删除或修正文本叙述内的一个或多个句子边界。在一些实施例中,这可涉及变更文本叙述内的至少一个位置的标点符号。在另一个例子中,如果文本叙述被组织成带标题的章节,那么可以改善事实提取,从而重新格式化可包括确定文本叙述中的一个或多个章节边界,和增加、删除或修正一个或多个对应的章节标题。在一些实施例中,重新格式化可包括按照对应于患者诊疗的保健机构的标准(所述标准可以是关于临床文献中的章节标题的机构特有标准,或者更通用标准),使一个或多个章节标题(所述章节标题可能已存在于原始文本叙述中,和/或作为重新格式化的一部分而被增加或修正)规范化。在一些实施例中,可提示用户(比如临床医生120,医疗转录人员130或另一个用户)审定重新格式化的文本。
可以采用用于实现重新格式化(上面说明了其例子)的任何适当技术,在这方面,本发明不受限制。在2005年12月30日提交的美国专利申请No.11/322,971,“TranslatingLiteral Speech to Formatted Text”中,说明了适合于进行文本叙述的重新格式化的一种例证技术,该专利申请通过引用整体包含于此。在一些实施例中,可用于进行文本叙述的重新格式化的另一种例证技术涉及利用词语N-gram统计模型预测文本叙述中的句子和/或章节边界。可根据具有正确标点符号和/或章节标题的文档(例如,过去的病历)(例如,由医疗转录人员提供)的语料库,训练这种统计模型。
在一些实施例中,通过对于文本叙述中的各个词语,计算特定标点符号应跟在该词语之后的概率,统计模型可以增加标点符号(例如,句号、惊叹号、问号等),以向文本叙述增加一个或多个句子边界。在计算词语后面应有标点符号的概率时,统计模型可考虑文本叙述中,结束于该词语的N词语序列,并确定在统计模型用训练数据中,该N词语序列后面是所述标点符号的频次。随后利用对于文本叙述中,或者文本叙述的某个部分中的所有词语计算的概率,构成网格,随后可以确定通过网格的就组合概率来说最佳的路径。当标点符号位于通过网格的最佳路径中时,在产生格式化文本时,这些标点符号可在这些位置被加入文本叙述中。在一些实施例中,另一种统计模型可按照类似的方式,增加对应于章节边界的章节标题。例如,在一些实施例中,关于章节标题的统计模型可对于各个词语,计算该词语后面应是章节边界的概率。在一些实施例中,在计算概率时,和在当前词语之前的词语相比,关于章节标题的统计模型可以考虑更多在当前词语之后的词语。在一些实施例中,可以训练一个或多个单独的统计模型,以删除不正确的句子和/或章节边界。在一些实施例中,可通过观察在编辑时,临床医生120或另一个用户往往会从中删除标点符号和/或章节边界的词语序列(最初包括所述标点符号和/或章节边界),通过来自临床医生120或另一个用户的反馈,训练这些模型。
在一些实施例中,事实提取组件104接收原始文本叙述或重新格式化的文本叙述,事实提取组件104可进行处理,以从文本叙述中提取一个或多个医疗事实(例如,临床事实)。文本叙述可以接收自ASR引擎102,接收自医疗转录人员130,经用户界面110,直接接收自临床医生120,或者按照任何其它适当的方式被接收。可以使用从文本叙述中提取文本的任何适当技术,在这方面,本发明不受限制。例证的医疗事实提取技术在下面说明。
在一些实施例中,可以利用各种技术,比如在美国专利No.7,493,253,“Conceptual World Representation Natural Language Understanding System andMethod”中说明的技术,实现事实提取组件,美国专利No.7,493,253通过引用整体包含于此。这种事实提取组件可以利用链接到临床术语的词典的形式本体论。形式本体论可被实现成关系数据库,或者用任何其它适当的形式实现,可以表示与医学领域相关的语义概念,以及与用自然语言表示所述语义概念的方式相关的语言概念。
在一些实施例中,事实提取组件使用的形式本体论中的概念可被链接到医学术语和/或代码的词典,以致各个医学术语和各个代码被链接到形式本体论中的至少一个概念。在一些实施例中,词典可包括其中应用所述事实提取组件的机构使用的标准医学术语和/或代码。例如,机构维护的EHR使用的标准医学术语和/或代码可包含在链接到事实提取组件的形式本体论的词典中。在一些实施例中,词典还可包括所述机构内的各个临床医生使用的,和/或当在形式自由的叙述中描述医疗问题时,临床医生通常使用的另外的医学术语。这些另外的医学术语可以和其对应的标准医学术语一起被链接到形式本体论内的适当的共有概念。例如,标准术语“急性心肌梗死”以及其它对应术语,比如“心脏病发作”、“急性MI”和“AMI”都可被链接到形式本体论中的相同抽象概念-表示向心脏的供血中断的概念。在一些实施例中,多个医学术语到相同抽象概念的这种链接可减轻临床医生确保只有保健机构推荐的标准医学术语才出现在形式自由的叙述中的负担。例如,在一些实施例中,临床医生在他的形式自由的叙述中,可随意使用缩写“AMI”或者口语“心脏病发作”,不过,共有的概念链接可允许事实提取组件自动提取对应于“急性心肌梗死”的事实。
在一些实施例中,事实提取组件使用的形式本体论也可表示所代表的概念之间的各种关系。两个概念之间的一种关系可以是父子关系,其中子概念是父概念的更具体形式。更正式地,在父子关系中,子概念继承父概念的所有必要性质,而子概念可具有不被父概念共有的必要性质。例如,“心力衰竭”是父概念,而“充血性心力衰竭”是“心力衰竭”的子概念。在一些实施例中,在形式本体论中,也可表示用于处理医疗文档编制的任何其它种类的关系。例如,一种关系可以是症状关系。在症状关系的一个例子中,链接到术语“胸痛”的概念可具有与连接到术语“心脏病发作”的概念的“是其症状”的关系。其它种类的关系可包括并发症关系,合并症关系,相互作用关系(例如,药物之间),和许多其它关系。在这种形式本体论中,可以包括任意数目和种类的概念关系。在这方面,本发明不受限制。
在一些实施例中,从临床医生的形式自由的叙述中自动提取医疗事实可涉及解析形式自由的叙述,以识别在事实提取组件的词典中表示的医学术语。随后可以识别形式本体论中,链接到出现在形式自由的叙述中的医学术语的概念,可以追踪形式本体论中的概念关系,以识别更多的有关概念。通过这些关系,以及在形式本体论中表示的语言知识,可以提取一个或多个医疗事实。例如,如果形式自由的叙述包括医学术语“高血压”,并且语言环境涉及患者的既往,那么事实提取组件可自动提取指示该患者有高血压史的事实。另一方面,如果形式自由的叙述在关于患者母亲的句子中,包括医学术语“高血压”,那么事实提取组件可自动提取指示该患者具有高血压的家族史的事实。在一些实施例中,形式本体论中的概念之间的关系也可允许事实提取组件自动提取包含未明确包括在形式自由的叙述中的医学术语的事实。例如,医学术语“脑膜炎”也可被描述成大脑中的炎症。如果形式自由的叙述包括彼此邻近的术语“炎症”和“大脑”,那么链接到术语“炎症”、“大脑”和“脑膜炎”的概念之间在形式本体论中的关系可允许事实提取组件自动提取对应于“脑膜炎”的事实,尽管在形式自由的叙述中,未记载术语“脑膜炎”。
应意识到以上说明只是作为例子提供的,可以使用用于从形式自由的叙述中,提取一组一个或多个临床事实的任何适当技术,本发明并不局限于任何特殊的事实提取技术。例如,应意识到事实提取组件104并不局限于本体论的使用,也可以使用其它形式的知识表示模型,包括统计模型和/或基于规则的模型。知识表示模型也可按任何适当的格式,被表示成数据,可被保存在任何适当的位置,比如事实提取组件104可访问的系统100的存储介质中,在这方面,本发明不受限制。另外,可以按照任何适当的方式,构成事实提取组件104使用的知识表示模型,比如本体论,在这方面,本发明不受限制。
例如,在一些实施例中,知识表示模型可由可以访问关于医疗事实、诊断、问题、潜在并发症、合并症、适当的观测和/或临床表现、和/或任何其它有关信息的专家知识的一个或多个开发人员人工构成。在其它实施例中,例如通过记录患者诊疗的既往医疗报告,医学文献和/或其它医学文档的统计分析,可以自动生成知识表示模型。从而,在一些实施例中,事实提取组件104可以访问医学文献和/或其它文档,比如过去的患者诊疗报告的数据集170。在一些实施例中,可用标签标记(例如,由人标记)过去的报告和/或其它文本文献资料,所述标签指示文本中的特定陈述与所述文本涉及的患者诊疗或医学主题的相关性的性质。随后可以训练统计知识表示模型,以根据与聚合的一组多个被标记文献资料内的相似文本对应的特定标记的普遍性,形成关联。例如,如果在比例足够大的记录起搏器植入术的临床手术报告中,“气胸”被标记为“并发症”,那么统计知识表示模型可以产生并保存“气胸是起搏器植入术的并发症”的概念关系。在一些实施例中,自动产生和硬编码(例如,由开发人员)的概念和/或关系都可包含在事实提取组件104使用的知识表示模型中。
如上所述,应意识到本发明并不限于构成知识表示模型的任何特殊技术。适当技术的例子包括在以下文献中公开的那些技术:
Gómez-Pérez,A.,and Manzano-Macho,D.(2005).An overview of methods andtools for ontology learning from texts.Knowledge Engineering Review 19,p.187-212.
Cimiano,P.,and Staab,S.(2005).Learning concept hierarchies from textwith a guided hierarchical clustering algorithm.In C.Biemann and G.Paas(eds.),Proceedings of the ICML 2005 Workshop on Learning and ExtendingLexical Ontologies with Machine Learning Methods,Bonn,Germany.
Fan,J.,Ferrucci,D.,Gondek,D.,and Kalyanpur,A.(2010).PRISMATIC:Inducing Knowledge from a Lange Scale Lexicalized Relation Resource.NAACLWorkshop on Formal isms and Methodology for Learning by Reading.
Welty,C.,Fan,J.,Gondek,D.and Schlaikjer,A.(2010).Large scale relationdetection.NAACL Workshop on Formalisms and Methodology for Learning byReading.
上述公布都通过引用整体包含于此。
另一方面或者另外,在一些实施例中,事实提取组件可利用一个或多个统计模型从自然语言输入中,提取语义实体。通常,统计模型可被描述成为根据在先前的训练输入中观察到的概率模式,分析新的输入而设计和/或训练的功能组件。在这个意义上,统计模型不同于“基于规则的”模型,“基于规则的”模型一般应用硬编码的确定性规则把具有特定特性的输入映射到特定输出。相反,统计模型可通过考虑具有相同特定特性(或者相似特性)的训练输入多久一次地(或者概率多少地)与统计模型的训练数据中的特定输出相联系,确定对具有特定特性的输入来说的特定输出。为了供给使统计模型可以推断过去的例子中,特定输入特性与特定输出关联的趋势的概率数据,一般根据具有大量例证输入的大型训练语料库,训练(或“建立”)统计模型。一般,例证输入标记有它们应与之关联的已知输出,通常由具有该领域的专业知识的标记人员标记。从输入中识别提取感兴趣的特性(称为“特征”),统计模型根据具有这些特征的训练输入多久一次地与这些输出关联,学习不同特征与不同输出关联的概率。当从新的输入(例如,未被人类标记有已知输出的输入)提取出相同特征时,统计模型随后可利用学得的关于提取特征的概率(从训练数据中获得)来确定对于所述新的输入,哪个输出最可能是正确的。下面进一步说明利用一个或多个统计模型的事实提取组件的例证实现。
在一些实施例中,事实提取组件104可利用基于实体检测和/或跟踪技术,比如在Florian,R.,Hassan,H.,Ittycheriah,A.,Jing,H.,Kambhatla,N.,Luo,X.,Nicolov,N.,and Roukos,S.(2004).A Statistical Model for Multilingual Entity Detection andTracking.Proceedings of the Human Language Technologies Conference 2004(HLT-NAACL’04)中公开的那些技术的统计事实提取模型。该公布通过引用整体包含于此。
例如,在一些实施例中,用于产生医疗报告的感兴趣的事实种类的列表可由例如事实提取组件104的开发人员定义。这样的事实种类(这里也称为“实体种类”)例如可包括问题、失调(失调是一种问题),诊断结果(诊断结果可以是对于特定患者,临床医生已识别为问题的失调),表现(表现是不必是失调的一种问题),药物,身体部位,社会历史事实,过敏症,诊断检测结果,生命特征,处置,处置步骤,观察,设备,和/或任何其它适当的医疗事实种类。应意识到,可以利用事实种类的任何适当列表,所述列表可包括或不包括上面列举的任意事实种类,在这方面,本发明不受限制。在一些实施例中,可用出自列表中的适当事实种类,标记(例如,由人类标记)一组样本患者诊疗报告中的文本的范围。随后可根据标记的样本报告的语料库来训练统计模型,以利用实体检测和/或跟踪技术,检测和/跟踪作为语义实体的这种事实种类,实体检测和/或跟踪技术的例子在下面说明。
例如,在一些实施例中,可以人工标记临床医生产生的大量过去的形式自由的叙述,从而形成用于统计实体检测模型的训练数据的语料库。如上所述,在一些实施例中,可以定义(例如,由领域管理人员)适当实体的列表,以包括将从未来的临床医生叙述中提取的医疗事实种类。一个或多个标记人员(例如,具有关于医学信息和典型的临床医生叙述内容的专业知识的人)随后可人工用训练文本的各个部分对应于的特殊的定义实体,标记训练文本的各个部分。例如,假定训练文本“患者说有急性窦炎”,标记人员可用实体标签“问题”标记文本部分“急性窦炎”。在另一个例子中,假定训练文本“他患有窦炎,窦炎似乎是慢性的”,标记人员可用指示“窦炎”和“慢性”两个词一起对应于“问题”实体的单个标签,标记文本“窦炎”和“慢性”。根据这些例子,显然标记成对应于单个概念实体的文本部分不必由毗邻的词语组成,相反可具有分散在文本内的词语,之间存在非实体词语。
在一些实施例中,随后可以处理标记的训练数据的语料库,以建立训练的统计模型,从而检测标记在训练数据中的实体的记载。每次相同的概念实体出现在文本中时,该出现被称为所述实体的记载。例如,考虑文本“患者患有窦炎。他的窦炎似乎是慢性的”。在这个例子中,实体检测模型可被训练,以把词语“窦炎”在文本中的每次出现识别为相同的“问题”实体的单独记载。
在一些实施例中,根据标记的训练数据训练统计实体检测模型的处理涉及分析各个训练文本,和概率地使其特性与对应的实体标签相联系的许多步骤。在一些实施例中,各个训练文本(例如,形式自由的临床医生叙述)可被令牌化,以将其分解成各种水平的句法子结构。例如,在一些实施例中,可以实现令牌解析器模块,以把文本的范围指定为表示结构/句法单元,比如文献章节、段落、句子、从句、短语、单个令牌、词语、诸如词缀之类的子词语单元,等等。在一些实施例中,单个令牌通常可以是单个词语,不过一些令牌可包括在字典中,被定义为令牌的一连串的不止一个词语。例如,术语“心肌梗死”可被定义为令牌,尽管它是一连串的不止一个词语。在一些实施例中,令牌的身份(即,词语或词语本身的次序)可用作令牌的特征。在一些实施例中,令牌在文本中的特定句法单元(例如其章节、段落、句子等)内的放置也可用作令牌的特征。
在一些实施例中,可以分析训练文本内的单个令牌(例如,在周围句子的上下文中),以确定其词性(例如,名词、动词、形容词、副词、前置词等),令牌的词性可用作该令牌的另外特征。在一些实施例中,可用其词性标记各个令牌,而在其它实施例中,不是每个令牌都用词性标记。在一些实施例中,统计模型的开发人员可以预先定义相关词性的列表,具有列举为相关的词性的任何令牌可用该词性标记。在一些实施例中,可以实现解析器模块,以确定文本中的句子的句法结构,和把句子结构内的位置指定为各个令牌的特征。例如,在一些实施例中,令牌是名词短语或动词短语的一部分的事实可以用作该令牌的特征。可以使用任意种类的解析器,解析器的非限制性例子包括自底向上解析器和/或依存解析器,在这方面,本发明不受限制。
在一些实施例中,章节隶属关系可用作令牌的特征。在一些实施例中,可以实现章节规范化模块,以使叙述文本的各个部分与它应属于的适当章节相联系。在一些实施例中,可对于所有文本,定义一组标准化的章节种类(例如,由其章节标题识别),或者对于许多不同种类的文本(例如,对应于不同种类的文献)中的每种文本,可以定义一组不同的规范化的章节标题。例如,在一些实施例中,对于定义的一组医疗文献种类中的每种医疗文献,可以定义一组不同的规范化章节标题。医疗文献种类的非限制性例子包括咨询报告,历史&体检报告,出院小结和急诊室报告,不过也存在许多其它例子。在医学领域,各种种类的医疗文献通常被称为“工作类型”。在一些情况下,可以依据适当的系统标准,机构标准或者更广泛适用的标准,比如有意义使用标准(上面说明的)或者由Regenstrief研究院维护的观测指标标识符命名与编码系统(LOINC)标准,建立关于各种医疗文献的一组标准章节。例如,按照有意义使用标准,历史&体检报告的一组预期章节标题可包括关于“就诊原因”章节、“现病史”章节、“用药史”章节、“过敏、不良反应和禁忌症”章节、“系统复查”章节、“社会历史”章节、“体检表现”章节、“评估和方案”章节、和/或任何其它适当章节的标题。不过,可以使用任意一组适当的章节,在这方面,本发明不受限制。
章节规范化模块可利用任何适当的技术使文本的各个部分与规范化的文献章节相联系,在这方面,本发明不受限制。在一些实施例中,章节规范化模块可利用表格(例如,作为数据保存在存储介质中)把通常出现在医疗文献中的文本短语映射到它们应属于的章节。在另一个例子中,可以训练统计模型,以根据文本的一部分的语义内容,周围文本部分的语义内容,和/或一组规范化章节的预期语义内容,确定文本的所述一部分的最有可能的章节。在一些实施例中,一旦识别了文本的一部分的规范化章节,在该章节中的隶属关系就可用作文本的该部分中的一个或多个令牌的特征。
在一些实施例中,可以提取,即识别其它种类的特征,并使之与训练文本中的令牌相联系。例如,在一些实施例中,N-gram特征可把文本中的前(N-1)个词语和/或令牌识别成当前令牌的特征。在另一个例子中,词缀(例如,诸如–ectomy、-oma、-itis之类的后缀)可被用作令牌的特征。在另一个例子中,可以访问一个或多个预定的词典和/或本体论,令牌在这些词典任意之一中的隶属关系可以用作该令牌的特征。例如,可以访问外科手术的预定词典,和/或身体部位的词典,和/或已知疾病的词典,等等。不过应意识到,所有上述特征种类都仅仅是例子,统计实体检测模型的开发人员可以指定任意适当数目和/或种类的感兴趣特征,在这方面,本发明不受限制。
在一些实施例中,具有其人工标记的事实种类实体标签的训练文本的语料库,以及对于文本中的令牌提取的特征的集合可被输入统计实体检测模型,以便训练。如上所述,适当特征的例子包括在文献结构内的位置,句法结构,词性,解析器特征,N-gram特性,词缀(例如,前缀和/或后缀),在词典(有时称为“地名词典(gazetteer)”和/或本体论中的隶属关系,周围令牌上下文(例如,在当前令牌左侧和/或右侧的一定数目的令牌),拼写特征(例如,大写,字母对数字,等等),分配给文本中的在先令牌的实体标签,等等。作为一个非限制性例子,考虑训练句子“患者说有急性窦炎”,对该句子来说,词语序列“急性窦炎”被人工标记为“问题”实体。在一种例证实现中,对于令牌“窦炎”提取的特征可包括该词语是“窦炎”的令牌身份特征,说明该令牌出现在句子的结尾(例如,后面是句号)的句法特征,“名词”的词性特征,该令牌是名词短语(“急性窦炎”)的一部分的解析器特征,前两个词是“急性的”的3词特征,“-itis”的词缀特征,该令牌是炎症种类的预定词典的词条的词典特征。不过应意识到特征的上述列举仅仅是例证性的,可以使用任何适当的特征。本发明并不局限于上面列举的特征,包括一些、全部或无一上述特征的实现,以及包括上面未列举的特征的实现都是可能的。
在一些实施例中,如果以提取的特征和整个训练语料库的人工实体标签作为输入,那么统计实体检测模型可被训练成利用和应用于训练语料库的相同特征提取技术,用自动实体标签,概率地标记新的文本(例如,未包含在训练语料库中的文本)。换句话说,通过处理输入特征,和训练语料库的人工实体标签,统计模型可学习特征和实体标签之间的概率关系。当稍后被提供无人工实体标签的输入文本时,统计模型于是可应用相同的特征提取技术,从输入文本中提取特征,并可应用学习的概率关系,以自动确定对输入文本中的词语序列来说,最可能的实体标签。可以利用任何适当的统计建模技术来学习这样的概率关系,在这方面,本发明不受限制。已知的适当统计建模技术的非限制性例子包括诸如最大熵建模,支持向量机和条件随机场之类的机器学习技术。
在一些实施例中,训练统计实体检测模型可涉及对于每个提取的特征,学习具有该特征的令牌与各个实体种类相联系的概率。例如,对于后缀特征“-itis”,训练的统计实体检测模型可保存具有该特征的令牌应被标记成是“问题”实体的一部分的概率p1,具有该特征的令牌应被标记成是“药物”实体的一部分的概率p2,等等。在一些实施例中,通过确定用训练语料库中的各个不同实体标签,人工标记具有“-itis”特征的令牌的频次,可学习这种概率。在一些实施例中,概率可被归一化,以致对于每个特征,与各个可能的实体(事实种类)相联系的概率之和为1。不过,本发明并不局限于这种归一化。在一些实施例中,各个特征也可具有不与任意事实种类相联系的概率p0,以致对于给定特征,非实体概率p0加上与各个可能的事实种类相联系的概率之和为1。在其它实施例中,对于各个事实种类,可以训练单独的分类器,分类器可以并行运行。例如,“-itis”特征可具有是“问题”实体的一部分的概率p1,和不是“问题”实体的一部分的概率(1-p1),是“药物”实体的一部分的概率p2,和不是“药物”实体的一部分的概率(1-p2),等等。在一些实施例中,训练独立的分类器可允许一些词语序列具有同时被用不止一种事实种类标记的非零概率;例如,“肾衰竭”可被标记成表示身体部位和问题。在一些实施例中,可以训练分类器,以识别实体标签的子部分。例如,特征“-itis”可具有其令牌在“问题”实体标签的开始的概率pB,其令牌在“问题”实体标签之内(而不是在标签的开始)的概率pI,和其令牌在“问题”实体标签之外(即,其令牌不是“问题”实体的一部分)的概率pO
在一些实施例中,可进一步训练统计实体检测模型,以加权令牌的各个特征,从而确定它应与特定实体标签相联系的总概率。例如,如果令牌“窦炎”具有n个提取的特征f1…fn,所述n个提取的特征f1…fn具有与“问题”实体标签相联系的相应概率p1…pn,那么统计模型可被训练成对特征概率应用相应权重w1…wn,随后按照任何适当的方式,组合加权的特征概率,以确定“窦炎”应是“问题”实体的一部分的总概率。可以使用用于确定这种权重的任何适当技术,包括已知的建模技术,比如最大熵建模,支持向量机,条件随机场和/或其它技术,在这方面,本发明不受限制。
在一些实施例中,当未标记的文本被输入训练的统计实体检测模型中时,模型可处理文本,以提取特征,并确定各个令牌的与各个实体(例如,事实种类)标签相联系的概率。在一些实施例中,可对于输入文本中的每个令牌,选择最可能的标签(包括非实体标签,如果这是最可能的话)。在其它实施例中,可通过更加上下文的分析,比如在短语层面或句子层面,而不是在令牌层面,选择标签。可以使用任何适当的技术,比如Viterbi技术,或者任何其它适当的技术,在这方面,本发明不受限制。在一些实施例中,可用句子中的所有令牌的对于有实体种类的关联概率,构成网格,可选择通过网格的最佳的(例如,组合概率最高的)路径,以确定句子中的哪些词语序列将被自动标记以哪些实体(例如,事实种类)标签。在一些实施例中,不仅可以识别最佳路径,而且可以识别具有次最高的关联概率的(N-1)-最佳备选路径。在一些实施例中,这会产生将与相同输入文本关联的事实种类标签的备选假设的N-最佳列表。
在一些实施例中,统计模型也可被训练,以使从新报告中提取的事实种类与待从这些报告中提取的特殊事实关联(例如,以确定由已被标记成实体记载的文本部分表示的特定概念)。例如,在一些实施例中,可以应用统计事实提取模型,以便不仅用“问题”实体(事实种类)标签,而且用指示由词语序列(例如,医疗事实“窦炎,急性”)指示的特定医疗事实(例如,概念)的标签自动标记“急性窦炎”。在这样的实施例中,例如,可以训练单一的统计模型,把具体特定事实检测为单个实体。例如,在一些实施例中,训练文本的语料库可由一个或多个注解人员用指示具体医疗事实的标签,而不是指示更一般的实体,比如事实种类或类别的标签人工标记。不过在其它实施例中,把事实种类检测为实体的处理可以和把检测的事实种类关联到特定事实的处理分离。例如,在一些实施例中,可以训练独立的统计模型(例如,实体检测模型)自动用事实种类标签标记文本的各个部分,可以识别另一个独立的统计模型(例如,关系模型)识别哪些标记的实体(事实种类)记载一起指示单一的具体医疗事实。在一些情况下,关系模型可通过把用相同实体种类标记的两个或更多的记载联系在一起,识别特定医疗事实。
例如,在文本“患者说有急性窦炎”中,在一些实施例中,实体检测模型可把令牌“急性”和“窦炎”标记成是“问题”实体的一部分。在一些实施例中,假定“急性”和“窦炎”已被标记成“问题”,关系模型随后可使这两个令牌一起与单一的医学事实“窦炎,急性”相联系。对于另一个例子,考虑文本“患者患有窦炎,窦炎似乎是慢性的”。在一些实施例中,可以应用实体检测模型,把令牌“窦炎”和“慢性”标记成“问题”实体记载。在一些实施例中,随后可以应用关系模型,确定这两个“问题”实体记载“窦炎”和“慢性”相关联(即使它们在文本中不毗邻),以表示单一的医学事实“窦炎,慢性”。对于另一个例子,考虑文本“她患有急性窦炎;慢性哮喘发作可能是一个要因”。在一些实施例中,实体检测模型可把各个令牌“急性”、“窦炎”、“慢性”和“哮喘”标记成属于“问题”实体记载。在一些实施例中,随后可以应用关系模型,以确定哪些记载涉及相同的医疗事实。例如,关系模型可确定令牌“急性”和“窦炎”涉及第一医疗事实(例如,“窦炎,急性”),而令牌“慢性”和“哮喘”涉及不同的医疗事实(例如,“哮喘,慢性”),即使与令牌“哮喘”相比,令牌“慢性”在句子中更靠近令牌“窦性”。
在一些实施例中,可以利用和上面说明的用于训练统计实体检测模型的方法类似的方法,统计地训练关系模型。例如,在一些实施例中,可人工用实体记载和/或实体记载内的令牌之间的各种关系,标记训练文本。例如,在训练文本“患者患有窦炎,窦炎似乎是慢性的”中,注解人员可把“问题”记载“慢性”标记成与“问题”记载“窦炎”有关系,因为这两个记载涉及相同的医疗事实。在一些实施例中,关系注解可仅仅指示某些记载彼此相关,而不具体说明任何特定种类的关系。在其它实施例中,关系注解还可指出实体记载之间的具体种类的关系。可以使用任何适当数目和/或种类的关系注解,在这方面,本发明不受限制。例如,在一些实施例中,一种关系注解可以是“分裂”关系标签。例如,令牌“窦炎”和“慢性”可被标记成具有分裂关系,因为“窦炎”和“慢性”一起构成实体,即使在文本中,它们不毗邻。这种情况下,“窦炎”和“慢性”一起指示一种具体的窦炎事实,即,慢性而非例如急性的窦炎。另一种例证的关系是“属性”关系。在一些实施例中,一个或多个系统开发人员可对应于对于事实种类指定的关联信息,为特定事实种类定义多组属性。例如,“药物”事实种类可具有属性“剂量”、“给药途径”、“频次”、“持续时间”等。在另一个例子中,“过敏性”事实种类具有属性“过敏原”、“过敏反应”、“严重性”等。不过应意识到,上述仅仅是例子,本发明并不局限于任何特殊事实种类的任何特殊属性。另外,其它各种事实关系是可能的,包括亲属关系、原因-问题关系,改善-问题关系,和许多其它关系。本发明并不局限于任何特殊关系种类的使用。
在一些实施例中,通过利用和上述那些技术类似的技术,标记的训练文本可以用作通过从文本中提取特征,并且概率地使提取的特征与人工供给的标签关联,训练统计关系模型的输入。可以使用任意适当的一组特征,在这方面,本发明不受限制。例如,在一些实施例中,统计关系模型使用的特征可包括实体(例如,事实种类)标签,词性,解析器特征,N-gram特征,令牌窗口大小(例如,存在于彼此相关的两个令牌之间的词语或令牌的数目的计数),和/或任何其它适当的特征。不过应意识到,上述特征仅仅是例证性的,实施例并不局限于特征的任何特殊列表。在一些实施例中,统计关系模型可以输出在输入文本中标记的实体记载如何彼此相关联的多个备选假设,以及对应概率的列表,而不是仅仅输出实体记载之间的关系的最佳(例如,最可能的)假设。在其它实施例中,关系模型可以是硬编码的和/或相反基于规则的,而用于用事实种类标记文本部分的实体检测模型可被统计训练。
在一些实施例中,也可训练关系模型或另一个统计模型,以从不同的句子和/或文献章节,跟踪相同实体的记载,并把它们联系在一起。在上面引用的Florian的公布中,记载了例证的实体跟踪技术。
在一些实施例中,可以应用进一步处理,以把从文本提取的特定事实规范化成将按其记录它们的标准形式和/或代码。例如,医疗人员通常具有解析相同医疗事实的许多不同方式,在一些实施例中,可以应用规范化/编码处理,以识别与按非标准方式陈述的各个提取医疗事实对应的标准形式和/或代码。所述标准形式和/或代码可以来源于任何适当的来源,在这方面,本发明不受限制。一些标准术语和/或代码可以来源于政府或职业标准,比如SNOMED(医学系统命名法)、UMLS(统一医学语言系统)、RxNorm、RadLex,等等。其它标准术语和/或代码可能更加本地地来源于比如特定地区或机构的标准实践。其它标准术语和/或代码可特定于包括应用的事实提取组件的文档编制系统。
例如,假定输入文本“他的窦经常发炎”。在一些实施例中,实体检测模型和关系模型一起(或者实现两种功能的单一模型)可把令牌“窦”、“经常”和“发炎”识别成表示医疗事实。在一些实施例中,随后可以应用规范化/编码处理,以把记录“经常发炎的窦”的标准形式识别成“窦炎,慢性”。另一方面或者另外,在一些实施例中,规范化/编码处理可识别用于记录识别出的事实的标准代码。例如,关于“窦炎,慢性”的ICD-9代码是ICD-9代码#473。可以使用任何适当的编码系统,在这方面,本发明不受限制。例证的标准代码包括ICD(国际疾病分类)代码,CPT(通用过程术语学)代码,E&M(评价与管理)代码,MedDRA(医学管理事务术语词典)代码,SNOMED代码,LOINC(观测指标标识符逻辑命名与编码系统)代码,RxNorm代码,NDC(国家药物药码)代码和RadLex代码。
在一些实施例中,规范化/编码处理可以是基于规则的(例如,利用解析特定医疗事实的可能方式的列表,和/或利用医学术语和/或其它语言单元的本体论把从输入文本提取的事实规范化成其标准形式)。例如,在一些实施例中,在文本中识别成对应于医疗事实的令牌可被匹配到本体论中的对应术语。在一些实施例中,可以产生最接近的匹配术语的列表,可按其与文本中的令牌的相似性,对最接近的匹配术语排序。可按照任何适当的方式,对相似性打分。例如,在一种适当的技术中,文本中的一个或多个令牌可被视为其组成要素,比如词语的向量,本体论中的各个术语也可被视为组成要素,比如词语的向量。随后通过比较对应的向量,例如通过计算向量之间的角度,或者相关的测量结果,比如角度的余弦,可以计算令牌之间的相似性分数。在一些实施例中,在本体论中链接到一个或多个排序较高的术语(例如,和文本中的识别的令牌最类似的术语)的一个或多个概念随后可被识别成待从文本的该部分中提取的医疗事实的假设。在一些实施例中可以使用的例证技术记载在Salton,Wong和Yang:“A vector space model for automatic indexing”(Communications of the ACM,November 1975)中。该公布通过引用整体包含于此。不过,这些仅仅是例子,在一些实施例中,可以利用把实体令牌规范化成标准术语的任何适当技术,在这方面,本发明不受限制。
在一些实施例中,对于与每个提取的事实对应的标准形式和/或代码,规范化/编码处理可以输出单个假设。例如,输出的单个假设可对应于在本体论中,链接到和从中提取所述事实的文本中的令牌最类似的术语的概念。不过,在其它实施例中,对于与各个提取的事实对应的标准形式和/或代码,规范化/编码处理可以输出多个备选假设,以及对应概率。从而应意识到,在一些实施例中,事实提取组件104可识别待从输入文本的某个部分提取的医疗事实的多个备选假设。可在事实提取的任意或所有各个处理级别,包括实体检测,实体联系,和/或规范化/编码阶段,收集这样的备选假设。在一些实施例中,可在各个级别任意之一,对备选假设的列表设定阈值,以致事实提取组件104输出的最终列表可表示关于待提取的特定医疗事实的N-最佳备选假设。
应意识到上面所述仅仅是例子,事实提取组件104可以用任何适当的方式和/或形式实现,在这方面,本发明不受限制。
如上所述,按照一个实施例,临床医生讲述的形式自由的患者诊疗叙述由事实提取组件处理,所述事实提取组件包括能够提取与可预订项目的记载对应的一个或多个临床事实,并且能够区分所述一个或多个临床事实是否指示预订所述可预订项目的意图的自然语言理解(NLU)引擎。响应确定所述一个或多个临床事实指示预订可预订项目的意图,可自动生成对于该项目的定单。本发明的涉及确定预订可预订项目的意图的方面可以利用这里说明的用于进行事实提取和/或理解形式自由的叙述的任意技术实现。不过,应意识到本发明的这方面并不局限于任何特殊的实现技术,可以利用任何适当的方式实现。
如上所述,通常情况下,在临床诊疗过程中,或者在之后的某个时刻,临床医生可借助形式自由的叙述,记录患者诊疗。这种叙述通常可包括许多可预订项目。这种可预订项目的例子包括临床设施(例如,医院)中的住院患者药物定单,门诊患者药物定单(例如,处方),对临床诊断程序(例如,MRI,CT扫描或者众多其它各种诊断程序任意之一)的定单,对实验室作业或其它检测的定单,安排后续预约和介绍其他临床医生(例如,其他医师或专家,理疗等),信息交流定单(例如,关于任意各种主题,比如戒烟或饮食咨询的指示、咨询、引导或培训的定单),等等。按照这里说明的一些实施例,临床诊疗的形式自由的叙述可利用NLU引擎处理,以提取与可预订项目的记载相关的一个或多个临床事实,所述处理可区分所述叙述是否指示预订可预订项目的意图,当确定预订所述可预订项目的意图时,可以生成对于可预订项目的定单。
应意识到利用常规系统,在患者诊疗的叙述中提及的定单的生成是人工过程。即,除了在由临床诊疗产生的叙述中,提及可预订项目之外,临床医生或另一个个人(例如,临床医生的助手)需要进行另外的明确动作,以产生对于在叙述中提及的可预订项目的任何定单。按照这里说明的一些实施例,临床诊疗的文档编制可自动驱动临床环境中的工作流,从而自动导致对于临床医生在记载临床诊疗的叙述中,表达期望预订的任何可预订项目的定单的生成。这带来效率和准确性益处,因为使定单生成过程自动化可确保在生成的定单中,准确地指定记载在叙述中的可预订项目的任何参数。
在一些实施例中,定单可被自动生成,但是在临床医生或其他经授权的个人复查生成的定单,并确认定单准确,或者正式同意把定单转给履行系统之前,定单不会被发送给履行系统。另外,如果临床诊疗的文档编制未充分指定可预订项目的所有参数,那么按照一些实施例,可以在生成的定单中突出任何缺少的参数,以在定单被发送给履行系统之前,便利临床医生充分指定可预订项目。应意识到对于这里说明的在定单被发送之前,要求授权的技术没有任何限制。于是,如果保健机构的程序允许,那么在一些实施例中,可利用适合于可预订项目的任何适当的定单履行系统,自动发送生成的定单,可预订项目的例子在下面说明。
如上所述,这里说明的技术可以和任何可预订项目一起使用。现在说明可预订项目和指定这些可预订项目的例证参数的一些例子。不过应意识到该列举是例证而非穷举的,这里说明的技术可以与任何可预订项目结合使用,并不限于和这里说明的可预订项目的例子一起使用,也不限于对于任意提及的例证性可预订项目说明的例证参数。
可预订项目的一个例子是药物,它可涉及住院患者或门诊患者。用于预定药物的参数的例子可包括药物的名称(例如,商业药物或药品名称或通用名称),剂量,给药途径,频次,持续时间和适应症(例如,规定指示应服用所述药物的症状、条件、疾病等)。
可预订项目的另一个例子是手术。手术的参数一般包括手术的种类的标识,以及手术的地点和日期。一般,手术的地点和日期不在临床医生的患者诊疗叙述中指定,可包含在安排所述手术的任务中。
可预订操作项目的另一个例子是实验室检测程序。实验室程序或检测的典型参数包括程序或测试的种类的标识,日期,频率(如果该项目要被重复的话),和任何特殊的指导。
可预订项目的另一个例子是信息交流定单,它可以是关于指示、咨询、引导、培训等的定单。参数可随信息交流定单的性质,和是将口头给予患者,还是借助一些参考材料(比如书面宣传品或者要提供给患者的其它材料)给予患者而变化。
可预订项目的另一个例子涉及与临床医生的后续就诊。后续就诊的参数一般包括识别就诊的种类的信息(例如,就诊是特别针对某事的特殊目的的就诊,一般检查等),日期和任何特殊的指示。如同手术一样,在临床医生的叙述中,可以指定或可不指定日期,另一方面,日期可以是安排后续就诊的任务的一部分。
可预订项目的一些非限制性例子,和可利用临床医生的形式自由的叙述表述它们的方式的非限制性例子包括:
a.药物:Tylenol 650mg,每隔6小时2片(根据需要);Caduet q h.s.,25mg的atenolol,每天两次;Compazine,每天2-3次(根据需要),适用于恶心;
b.放射检查:CT扫描胸部和颈部,用钴;
c.实验室检测:全血检查,RBC和WBC计数和尿检,12小时禁食;
d.活组织检查:针对肾脏肿块和周围的淋巴结的超声引导下活检术;和
e.复查:建议患者2周后复查其[疾病名称]。
按照这里说明的一些实施例,事实提取组件采用NLU引擎,NLU引擎具有判定在形式自由的叙述中提及的可预订项目是否是按指示临床医生预订所述可预订项目的意图的方式提及的,以致系统区分从形式自由的叙述中提取的至少一个临床事实是否指示预订所述可预订项目的意图的能力。在这方面,应意识到形式自由的叙述中,对于可预订的项目(例如,药物、临床手术、实验室程序或测试等)的各个提及可能未记载在预订该项目的意图的上下文中。作为一个例子,临床诊疗的文档编制可能记录患者已服用特定的药物,或者可能已经过特定的程序,以致对所述药物或程序的提及并不表明临床医生为该患者预订该项目的意图。尽管在一些实施例中,可为在临床诊疗的文档编制中提及的所有可预订项目,生成定单,而不判定临床医生是否打算预订该项目,而在其它实现中,进行这种判定,以使非预期的或者不想要的定单的生成降至最少。
可按照任何适当的方式,实现对应于可预订项目的记载,并且指示预订所述可预订项目的意图的至少一个临床事实的提取。按照一个实施例,可以使用上面说明的事实提取组件。按照一个实施例,与可预订项目相关的可由系统提取的事实包括指示从中提取该事实的叙述是否指示预订所述可预订项目的意图的属性。在一些实施例中,与可预订项目相关的属性可指定所述叙述是否包括预订所述可预订项目的当前意图,所述叙述是否不表明预订所述可预订项目的意图,但是该项目当前对患者来说有关,或者所述可预订项目在所述叙述中,是否是按不表明预订该项目的意图,而是按非当前方式(例如,作为历史提及,作为家庭历史提及等)提及该项目的方式提及的。就药物的例子来说,事实提取组件可提取带有标签的药物事实,所述标签指示所述叙述是否表明预订该药物的意图,药物是否是作为患者已在服用的某物提及的,或者患者的历史是否指示该患者以前服用过该药物,不过目前未服用。应意识到对除指示叙述是否表明预订可预订项目的意图的属性之外的其它各种属性的提及都仅仅是例证性的,这里说明的所有实施例并不限于和这样的附加属性一起使用。
事实提取组件可按照各种方式任意之一,判定叙述是否表明预订可预订项目的意图,这里说明的本发明并不限于任何特定的实现技术。如上所述,按照本发明的一个实施例,不必用任何固定或特定的方式,处理所述意图,本发明被设计成从能够采取任何形式的形式自由的叙述中,确定这样的意图。应意识到临床医生能够表达预订可预订项目的意图的方式众多,并且不同的表达一般可用于不同种类的可操作定单。临床医生可用于表达预订各种可预订项目的意图的表述的一些非限制性例子包括:
a.“我将提出对其[疾病名称],持续[持续时间],在睡前服用[药品名称][剂量和频次]…”
b.“开始[药品名称][剂量和频次]的疗程…”
c.“患者应去看医生[医生姓名],以复查其[疾病名称]”
d.“由于[复查原因],安排患者在本诊所复查”
e.“我将与医生[医生姓名]商量,以计划[手术名称]”
按照一些实施例,本发明的涉及生成定单的各个方面可实时处理临床医生的叙述文档编制。不过,应意识到在这方面,本发明不受限制,另一方面,可在任意的稍后时间,而不是实时地进行叙述的处理,以致定单不必在其中临床医生与所述叙述被输入的系统相互作用的会话期间被生成。
除了上面提供的例子之外,应进一步意识到在一些情况下,形式自由的患者诊疗叙述可包括构成所述叙述,并提供预订意图的指示的语言。例如,如果叙述包括指出临床医生现在正在准备“方案”的语言,或者其它类似语言,那么可以指示预订任何随后提及的可预订项目的意图。
如上所述,在一些实施例中,事实提取组件和包含在其中的NLU引擎可采用统计模型,所述统计模型可用于提取事实,包括事实和/或其指示预订可预订项目的意图的属性。统计模型可以采取任何适当的形式,并可按照任何适当的方式训练。作为一个非限制性例子,可以利用人工标记的具有在其中表达预订意图的上下文,和其中未表达预订意图的其它上下文中,提及可预订项目的例子的训练数据的语料库,训练模型。上面说明了可训练统计模型的各种方式的非限制性例子。
在其它实施例中,事实提取组件的NLU引擎可包括基于规则的自然语言处理系统。如上所述,在基于规则的系统中,语言学家和/或其他个人可创建能够指定什么词语或词语的组合表明预订可预订项目的意图,和/或什么词语或词语的组合不表明预订可预订项目的意图的多条规则。上面说明了基于规则的系统的例子,这些技术可被用于开发能够检测预订(或不预订)可预订项目的意图的NLU引擎。不过,应意识到这里说明的技术并不局限于开发基于规则的自然语言理解组件的任何特定技术。
上面说明了CLU系统可检测为表明预订许多不同种类的可预订项目的意图的语言的一些例子。应意识到可以编写一条或多条规则,以检测举例说明预订可预订项目的意图的语言的各个这些例子(和/或其它例子)。作为另一个例子,考虑叙述“我将使患者服用β受体阻滞剂,Propofol 2mg/天”。“我将使…服用”的提及是预订药物的意图的指示。可检测该意图的规则的例子是检测在药物的规定接近度(例如,5-10个词语)之内的前瞻性动词(例如,“将使…服用”)的规则,所述药物可以利用上面说明的事实提取技术识别。当然,这仅仅是例子。可以建立任何适当的规则,这里说明的本发明的各个方面并不局限于任何特殊种类的规则。
按照这里说明的一个实施例,使用混合方法,其中事实提取组件的NLU引擎采用统计模型和基于规则的组件来区分叙述是否指示预订可预订项目的意图。可按照任意各种方式,实现所述混合方法,本发明的采用混合方法的各个方面并不局限于任何特殊的实现技术。按照一个实施例,可对叙述的相同文本,并行地执行NLU引擎的统计模型和基于规则的组件,只有当这两个组件之间存在相互一致时,才触发预订可预订项目的意图的识别。
在备选实施例中,基于规则的组件可对叙述进行首过(first pass)处理,以把叙述分割成各个章节,并识别可能包括可预订项目的章节。例如,如上所述,一些叙述可包括可能包含可预订项目的“方案”或“定单”章节,而一些其它章节(例如,讨论病史的章节)可能不包含可预订项目。之后,可以利用统计模型处理被识别成可能包括可预订项目的章节中的文本。在一些实施例中,在运行统计模型之前,基于规则的组件可进一步作用于被识别成可能包括可预订项目的文本的各个章节,可把文本的这些章节分成句子,随后可对各个句子运行统计模型,以识别可预订项目,并判定是否表达预订任何可预订项目的意图。在另一个备选方案中,在对被识别成可能包括可预订项目的文本的各个章节中的各个句子运行统计模型之后,可再次应用基于规则的组件,以找出对于统计模型提取的事实,可以增加额外属性或者以其它方式提供上下文信息的上下文信息,其中基于规则的组件可以复查叙述中的在统计模型为提取事实而作用于的句子之外的其它文本。
按照本发明的另一个实施例,可以根据可预订项目的种类,确定是使用统计模型还是基于规则的组件。例如,非常结构化的一些事实(例如,日期)适合于规则,而利用自然语言表达它们的方式变化性相当大的各种事实(例如,手术)可能更适合于使用统计模型。
按照一些实施例,可以按照任意各种方式,结合统计模型使用说明的种类的本体论,上面说明了所述各种方式的例子。作为一个非限制性例子,本体论的使用可减少可用于训练统计模型的带注解数据的数量,因为本体论能够示范表达相同事实或概念的许多备选方式。从而,不必包括表示对于公共事实或概念的所有备选表达的带注解数据,因为模型可被训练成检测数目有限的这些备选表达(例如,一个),可把本体论和统计模型结合,以扩展其能力,从而识别未包括在带注解的训练数据中的备选表达。当然,这仅仅是本体论的一种使用,可按照任何适当的方式利用本体论。
在另一个实施例中,基于规则的组件的输出可被用作统计模型的特征。例如,当规则实施或以其它方式指示规则被满足时,这可以是由统计模型评估的特征。一些规则可能相当特殊,以致该规则的实施高概率地指示由此表达的确定(即,预订可预订项目的意图是否已被表达)会相当准确。
同样,上面提供的使基于规则的组件的使用与统计模型以及本体论结合的说明仅仅是例证性的,这里说明的技术不限于任何特殊的实现技术。这里说明的技术可以仅仅利用统计模型实现,仅仅利用基于规则的组件实现,或者利用任何组合实现,它们并不局限于任何特殊的实现技术。
应意识到对判定是否表达了预订可预订项目的意图的统计模型和/或基于规则的组件的提及可被视为是意图分类器。应意识到意图分类器考虑的特征并不限于上面讨论的各种种类的临床事实,可包括众多其它种类的特征,包括可以检查文献结构(例如,上面对“方案”的提及),句子结构,特殊词语,词语的时态,条件从句等的语言特征。如上所述,这些特征之一是有时态的。例如,既往病史中或者当前药物列表上的药物的记载不表达预订该药物的意图,但是在叙述的方案章节中的记载则会表达预订该药物的意图。类似地,在家族病史中的药物的记载,或者例如“以有具有类似诊断结果的患者对[药物]反应良好”不是预订该药物的意图的指示。另外,否定也可以是可在一些实施例中考虑的特征。例如,“我将不再使患者采用[药物]”不是预订所述药物的意图的指示。类似地,对于作为正在考虑,但还未决定的可能性的可预订项目的预订的避免正面答复或提及(“或许我们应给该患者开[药物]”)不是预订所述药物的意图的指示。
按照一些实施例,为生成可预订项目的定单而从叙述中提取的信息可包括可预订项目的定单中的各个字段的默认值和/或隐含值。例如,如果叙述提及“IV”(即,静脉注射),这意味药物应以液体形式用药,液体形式可以是药物的定单表格的字段,以致在这里说明的一些实施例中,液体形式可被包含在药物的定单中,因为它是隐含的。作为另一个例子,如果叙述指示药物应被立即用药,这意味该药物需要在接下来的15分钟内用药,这使得能够填写药物的定单表格中的开始时间字段。通过利用临床知识规则,或者用任何其它适当的方式,能够实现填写默认和/或隐含字段值的能力。
按照一些实施例,事实提取组件可以与接收可预订项目的定单的下注临床系统集成。例如,所述系统可包括临床定单输入系统,调度系统等。作为一个非限制性例子,可以使用行业标准电子接口与这样的下注临床系统连接。例如,可以按照HL7标准或按任何其它适当的方式,以电子消息的形式提供定单。行业标准电子接口的例子包括处方用ePrescribing或CPOE,预订手术用CPOE,和用于预订实验室检测的众多系统任意之一,定单管理调度系统,等等。
按照一些实施例,可以使用一个或多个编码系统,所述系统便利以适当的形式下定单。这种系统可用于使术语规范化,和/或提供预订系统可能需要的可预订项目的一个或多个代码。例如,具有名称“X”的药物在特定预订系统中,只有通过利用不同的名称或代码“Z”才可预订。编码系统可以利用一种或多种编码标准(例如,关于药物的RxNorm,关于实验室检测和诊断定单的LOINC,等等)。
按照一些实施例,生成可预订项目的定单的系统也可进行一些分析,以检测可能的错误和/或缺失信息并关于可能的错误和/或缺失信息提供提醒。这可用任何适当的方式进行,上面讨论了其例子。例如,当可预订项目是药物时,可以检查剂量,以判定它是否在最小值和最大值范围内,和/或检查其形式和给药途径的一致性。再例如,可以检查患者的最新的实验室检测结果,以确保药物适合于他们(例如,患者的胆固醇水平)。作为又一个例子,可以检查药物相互作用,以确保预订的药物与患者的当前药物清单上的药物相容。作为另一个例子,可以检查药物,以确保它与患者医史中的任何过敏症相容。可按照任何适当的方式进行这些判定,包括利用包括关于剂量的适宜性和相容性,药物的形式和给药途径,不同种类的药物之间的相容性,药物与特定过敏症的相容性等等的信息的一个或多个临床支持系统。
在一些实施例中,诸如临床医生120之类的用户可通过连同系统100提供的用户界面,监视、控制和/或以其它方式与事实复查处理互动。例如,在一些实施例中,用户界面140可由事实复查组件106提供,例如,通过包含在事实复查组件106中的编程指令的执行(例如,由系统100的一个或多个处理器执行)。这种用户界面的一种例证实现是图2中图解所示的图形用户界面(GUI)200。在一些实施例中,当用户是临床医生120时,可通过用户界面110,呈现GUI 200。在一些实施例中,用户可以是不同于临床医生的人;例如,通过用户界面140,可向诸如编码专业人员150之类的另一个人呈现GUI 200。不过应意识到,这里使用的“用户”指的是系统100的最终用户,与系统100的任何组件的软件和/或硬件开发人员相对。
用户界面并不局限于图形用户界面,可以使用从系统100向用户提供数据的其它方式。例如,在一些实施例中,可从系统100传输并向用户传送音频指示符。应意识到在事实提取、事实复查和/或其它相关处理方面,可以提供任何种类的用户界面,在这方面,本发明不受限制。尽管图1中图解所示的例证实施例涉及系统100处的数据处理,和系统100与用户界面110和/或140之间的数据通信,不过应意识到在其它实施例中,系统100的任意或所有处理组件可改为在用户界面110和/或用户界面140本地实现,本发明并不局限于本地和/或远程处理能力的任何特殊分配。
如图2中所示,GUI 200包括显示不同种类的数据的许多独立窗格。识别信息窗格210包括把患者222识别成名为John Doe的男性患者的基本信息。这种基本的患者识别信息可由临床医生120输入,或者由其他用户150输入,或者可以从患者122的电子病历自动填写,或者可从任何其它适当的来源获得。识别信息窗格210还显示正在工作于的报告的创建日期和文献种类。该信息也可从任何适当的来源获得,比如从保存的数据获得,或者人工输入。当这里提到临床医生120和/或其他用户150的数据输入时,应意识到可以使用任何适当形式的数据输入,包括借助鼠标、键盘、触摸屏、手写笔、声音、或者任何其它适当输入形式的输入,在这方面,本发明不受限制。
图2中所示的GUI 200包括文本窗格220,其中显示涉及临床医生120和患者122之间的相遇的文本叙述。在一些实施例中,文本窗格220可包括文本编辑器功能,以致临床医生120可在患者诊疗期间,或者在之后的某个时刻,直接把文本叙述输入文本窗格220中。如果使用ASR从临床医生120提供的口述产生文本叙述,那么在一些实施例中,在ASR引擎102产生文本时,可在临床医生120口述时实时地或者处理延迟较大地在文本窗格220中显示所述文本。在其它实施例中,文本叙述可作为存储数据,接收自另一个来源,比如接收自医疗转录人员130,从而可以完整的形式显示在文本窗格220中。在一些实施例中,如果临床医生120和/或其他用户150期望的话,那么随后可在文本窗格220内,编辑文本叙述。不过,文本编辑能力不是必需的,在一些实施例中,文本窗格220仅仅显示文本叙述,而不提供编辑文本叙述的能力。
例证的GUI 200还包括事实窗格230,其中一旦被提取自文本叙述和/或以另一种适当方式被输入,一个或多个医疗事实就可作为离散的结构化数据项被显示。当临床医生120和/或其他用户150即将指令事实提取组件104从文本叙述中,提取一个或多个医疗事实时,在一些实施例中,他或她可借助任何适当的选择输入方法,选择处理按钮240。不过,开始事实提取的用户指示并不局限于诸如处理按钮240之类的按钮,GUI 200可以提供作出这种指示的任何适当方式。在一些实施例中,不需要开始事实提取的用户指示,一旦必要数量的文本(例如,足够事实提取组件104识别可从中查明的一个或多个临床事实的文本)被输入和/或接收,事实提取组件104就可开始事实提取处理。在一些实施例中,用户可在文本叙述完成之前,选择处理按钮240,以进行事实提取。例如,临床医生120可口述、通过人工输入和/或以其它方式提供文本叙述的一部分,选择处理按钮240,从而使一个或多个事实从文本叙述的所述一部分中被提取,随后继续提供文本叙述的另外部分。在另一个例子中,临床医生120可提供全部或部分的文本叙述,选择处理按钮240,并复查作为结果的提取事实,在文本窗格220内编辑文本叙述,随后再次选择处理按钮240,以复查提取的事实可能如何变化。
在一些实施例中,借助GUI 200,可在事实窗格230中,向用户显示事实提取组件104从文本叙述中提取的一个或多个医疗事实。图3A和3B中提供了图解说明从例证的文本叙述中提取的医疗事实的例证显示的屏幕截图。图3A是事实窗格230被滚动到列举从例证文本叙述中提取的医疗事实的显示的顶部的屏幕截图,图3B是事实窗格230被滚动到列举提取的医疗事实的显示的底部的屏幕截图。在一些实施例中,如图3A和3B中所示,对应于患者诊疗的医疗事实可被显示在事实窗格230中,并被组织成许多独立类别的各种事实。例证的一组医疗事实类别包括问题类别、药物类别、过敏症类别、社会历史类别、处置类别和生命特征类别。不过,应意识到可以使用任何适当的事实类别,在这方面,本发明不受限制。另外,把事实组织成类别不是必需的,没有这些组织的显示也是可能的。如图3A和3B中所示,在一些实施例中,GUI 200可被配置成提供导航窗格300,导航窗格300具有存在于事实窗格230的显示中的各个事实类别的可选指示。在一些实施例中,当用户选择导航窗格300内的类别之一(例如,通过用鼠标、触控板、手写笔或其它输入设备点击该类别)时,可使事实窗格230滚动,以显示对应的事实类别。如图3A和3B中所示,当前文献种类的所有可用事实类别都被显示,即使特别的事实类别不包括提取或以其它方式输入的医疗事实。不过,这不是必需的;在一些实施例中,在事实窗格230中,只显示具有从患者诊疗中查明的事实的那些事实类别。
如图3A中所示,滚动到显示的顶部的事实窗格230显示问题事实类别310、药物事实类别320和过敏症事实类别330。在问题事实类别310内,已从例证的文本叙述中,提取了4个临床事实;在药物事实类别320中,或者在过敏症事实类别330中,未提取任何临床事实。在问题事实类别310内,事实321指示患者122目前表现出不详胸痛;胸痛是目前表现的状况由状态“当前”指示。事实314指示患者122目前表现出呼吸困难。事实316指示患者具有不详的原发性高血压的历史(状态“历史”)。事实318指示患者具有不详的肥胖症的历史。如图3A中图解所示,问题事实类别310中的各个临床事实具有名称字段和状态字段。在一些实施例中,临床事实的各个字段可以是该事实的表示成离散的结构化数据项的结构化组成。在这个例子中,名称字段可被结构化,以致只有问题的一组标准医学术语可用于填写该字段。例如,状态字段可被结构化,以致在该字段内,只可选择医学系统命名法(SNOMED)标准中的状态(例如,“当前”和“历史”),不过可以采用其它标准(或者不采用标准)。下面给出事实类别及其组成字段的例证列表。不过,应意识到该列表只是作为例子提供的,本发明并不限于关于事实、事实类别和/或事实组成的任何特殊组织系统。
事实类别和组成字段的例证列表
类别:问题。字段:名称,SNOMED状态,ICD代码。
类别:药物。字段:名称,状态,剂量形式,频次,量度(measure)、RxNorm代码,给药条件,疗程,给药途径。
类别:过敏症。字段:过敏原名称,种类,状态,SNOMED代码,过敏反应,过敏原RxNorm。
类别:社会历史-吸烟。字段:名称,物质,形式,状态,限定词,频次,持续时间,数量,单位类型,持续时间量度,发生(Occurrence),SNOMED代码,规范值,值。
类别:社会历史-饮酒。字段:名称,物质,形式,状态,限定词,频次,持续时间,数量,量词,单位类型,持续时间量度,发生,SNOMED代码,规范值,值。
类别:处置。字段:名称,日期,SNOMED码。
类别:生命特征。字段:名称,量度,单位,单位类型,日期/时间,SNOMED代码,规范值,值。
在一些实施例中,可以保持利用事实提取组件104提取的一个或多个医疗事实和从中提取它们的文本叙述的一个或多个部分之间的关联。如上所述,文本叙述的这样的一部分可由单个词语组成,或者可包括多个词语,所述多个词语可以在连续的词语序列中,或者可以彼此隔开一个或多个居间词语,句子边界,章节边界等。例如,指示患者122目前表现出不详胸痛的事实312由事实提取组件104提取自文本叙述中的词语“胸痛”。提取的事实312的“当前”状态由事实提取组件104根据词语“胸痛”出现在文本叙述的章节标题为“主诉症状”的章节中而确定。在一些实施例中,事实提取组件104和/或另一个处理组件可被编程,以保持(例如,通过保存适当的数据)提取的事实(例如,事实312)和对应的文本部分(例如,“胸痛”)之间的关联。
在一些实施例中,GUI 200可被配置成提供显示在事实窗格230中的一个或多个事实,和文本窗格220中的文本叙述的从中提取所述一个或多个事实的对应部分之间的关联的可视指示符。在图3A中描述的例子中,可视指示符是由置于文本窗格220中的文本叙述的适当部分之下的线条组成的图形指示符。指示符313指示事实312和文本叙述的“主诉症状”章节中的词语“胸痛”之间的关联;指示符315指示事实314和文本叙述的“主诉症状”章节中的词语“呼吸困难”之间的关联;指示符317指示事实316和文本叙述的“病史”章节中的词语“高血压”之间的关联;指示符319指示事实318和文本叙述的“病史”章节中的词语“肥胖”之间的关联。不过,这些仅仅是可提供可视指示符的一种方式的例子,可以提供其它种类的可视指示符。例如,可以提供不同或者另外种类的图形指示符,和/或可以用有区别的文本风格(例如,字段,字号,颜色,格式等),显示文本窗格220中的关联文本。本发明并不限于任何特殊种类的关联指示符。
在一些实施例中,当临床医生120提供的形式自由的叙述的文本表示已被重新格式化,并且已关于重新格式化的版本,进行了事实提取时,原始版本仍可被显示在文本窗格220中,并关于原始版本保持和/或显示关联。例如,在一些实施例中,各个提取的临床事实可由事实提取组件104提取自重新格式化的文本的对应部分,不过,重新格式化的文本的该部分具有所述部分为其格式化版本的原始文本的对应部分。于是,在原始文本的该部分和提取的事实之间,可以保持关联,尽管事实实际上提取自重新格式化的文本。在一些实施例中,提供提取的事实和原始文本之间的关联的指示符可允许临床医生120和/或其他用户150意识到提取的事实如何与在形式自由的叙述实际所讲的内容关联。不过,作为提取的事实和原始文本之间的关联的备选方案,或者除此之外,其它实施例可以保持提取的事实和重新格式化的文本之间的关联,在这方面,本发明不受限制。
如图3B中所示,滚动到显示的底部的事实窗格230显示社会历史事实类别340,处置事实类别350,和生命特征事实类别360。在社会历史事实类别340内,提取了两个临床事实;在处置事实类别350和生命特征事实类别360中,没有提取任何特征。在社会历史事实类别340内,事实342指示患者122目前每天抽一包烟。事实344指示患者122目前偶尔饮酒。指示符343指示事实342提取自文本叙述的“社会历史”章节中的词语“他每天抽一包烟”,指示符345指示事实344提取自文本叙述的“社会历史”章节中的词语“偶尔饮酒”。在一些实施例中,诸如指示符343和345之类的可视指示符可以具有不同的文本和/或图形风格,或者是与诸如指示符313、315、317和319之类的可视指示符不同的指示符种类,以指示它们对应于不同的事实类别。例如,在一些实施例中,可用和对应于问题事实类别310的指示符313、315、317和319不同的颜色,显示对应于社会历史事实类别340的指示符343和345。在一些实施例中,可用不同的文本和/或图形风格或指示符种类,显示不同的各个事实的关联,以使用户可以容易地意识到哪个事实对应于文本叙述的哪个部分。例如,在一些实施例中,可用和指示符345不同的颜色,显示指示符343,因为指示符343和指示符345对应于不同的事实,尽管两者对应于相同的事实类别。
在一些实施例中,GUI 200可被配置成允许用户选择事实窗格230中的医病事实之中的一个或多个医疗事实,并响应所述选择,提供从中提取这些事实的文本叙述的部分的指示。图4中图解说明一个例子。在这个例子中,用户在事实窗格230中,选择了事实312(“不详的胸痛”),作为响应,提供从中提取事实312的文本叙述的部分(“胸痛”)的可视指示符420。可按照任何适当的方式,进行这样的用户选择,在这方面,本发明不受限制。例子包括利用输入设备(例如,鼠标、键盘、触控板、手写笔等)点击或以其它方式选择事实312,把鼠标或其它输入机构悬停在事实312之上或附近,通过声音说出事实312的选择,和/或任何其它适当的选择方法。类似地,在一些实施例中,GUI 200可被配置成当用户在文本窗格220中,选择文本叙述的某个部分时,可视地指示事实窗格230中的对应事实。在一些实施例中,可视指示符可包括事实和其文本叙述的对应部分之间的线条或其它图形连接符。可按照任何适当的例子(上面给出了其例子),提供任何可视指示符,在这方面,本发明不受限制。另外,本发明不限于可视指示符,可以提供其它形式的指示符。例如,响应事实312的用户选择,在一些实施例中,可以提供文本部分“胸痛”的音频指示。在一些实施例中,可通过播放临床医生的口述的包含词语“胸痛”的那部分录音,提供音频指示。在其它实施例中,可通过播放利用自动语音合成生成的词语“胸痛”的音频版本,提供音频指示。可以使用任何适当形式的指示符,或提供指示符的技术。在这方面,本发明不受限制。
在一些实施例中,GUI 200可被配置成向用户提供对事实提取组件104提取自文本叙述,并显示在事实窗格230中的一组医疗事实,作出一个或多个变更的各种方式任意之一。例如,可允许用户通过选择出现在事实近旁的“X”选项,从事实窗格230中的一组事实中删除事实。在一些实施例中,可允许用户编辑事实窗格230内的事实。在一个例子中,通过选择事实312,并键入、说出或以其它方式提供该事实的不同名称,用户可编辑事实312的名称字段。如图3A和图4中所示,在一些实施例中,通过从可用的下拉菜单中,选择不同的状态,用户可编辑事实312的状态字段,不过,允许状态字段的编辑的其它技术也是可能的。在一些实施例中,另一方面或另外,可允许用户通过与文本窗格220中的文本叙述交互作用,编辑事实。例如,用户可增加、删除或变更文本叙述中的一个或多个词语,随后文本叙述可由事实提取组件104重新处理,以提取一组更新的医疗事实。在一些实施例中,可允许用户仅仅选择文本窗格220中的文本叙述的一部分(例如,通过突出所述一部分),和使事实提取组件104只从该部分重新提取事实,而不扰乱已从文本叙述的其它各个部分提取的事实。
在一些实施例中,GUI 200可被配置成提供以离散的结构化数据项的形式,增加一个或多个事实的各种方式任意之一。如图4中所示,在一些实施例中,GUI 200可被配置成为出现在事实窗格230中的每个事实类别,设置增加事实按钮;一个这样的增加事实按钮是增加事实按钮430。当用户选择增加事实按钮430时,在一些实施例中,GUI 200可通过显示如图5中所示的弹出窗口500,向用户提供输入足以填写该事实类别中的新事实的一个或多个字段的信息的方式。应意识到这仅仅是一个例子,本发明并不局限于弹出窗口,或者用于增加事实的任何其它特殊方法的使用。在这个例子中,弹出窗口500包括指示新事实将被增加到的事实类别(“问题”)的标题栏510。弹出窗口500还提供其中用户可输入定义待增加的新事实的信息的许多字段520。字段520可用任何适当的形式实现,包括作为文本输入框,下拉菜单,单选按钮和/或复选框,本发明不局限于接收定义事实的输入的任何特定方式。最后,弹出窗口500包括增加按钮530,用户可选择该按钮,以把新定义的事实增加到与患者诊疗对应的一组事实中,从而以离散的结构化数据项的形式输入事实。
另一方面或者另外地,在一些实施例中,GUI 200可被配置成允许用户通过选择文本窗格220中的文本叙述的一部分(不一定连续),并指出基于文本叙述的该部分,应增加新的事实,增加新的事实。这可用任何适当的方式进行。在一个例子中,用户可突出文本窗格220中的文本叙述的期望部分,并在期望部分上,点击鼠标右键(或者进行另一种适当的输入操作),这可使指定的文本被处理,从而任何相关的事实被提取。在其它实施例中,点击右键或其它输入操作会导致出现菜单。在一些实施例中,菜单可包括在可用事实类别任意之一下,增加新的事实的选项,用户可选择选项之一,以指示哪个事实类别将对应于该新的事实。在一些实施例中,随后可提供诸如弹出窗口500之类的输入屏幕,名称字段可用用户从文本叙述中选择的词语填写。用户随后可获得通过一个或多个其它可用字段,进一步定义事实,和如上所述,把该事实增加到患者诊疗的一组医疗事实之中的选项。
在一些实施例中,对应于当前患者诊疗的一组医疗事实(都提取自文本叙述,或者作为离散的结构化数据项,由用户提供)可被增加到患者122的现有电子病历(比如EHR)中,或者可用于生成患者122的新的电子病历。在一些实施例中,临床医生120和/或编码专业人员(或其他用户)150可在所述一组医疗事实被包含在任何病历中之前,最终认可该组医疗事实;不过,在这方面,本发明不受限制。在一些实施例中,当所述一组医疗事实中的事实和文本叙述的某个部分之间存在关联时,在所述事实被包含在电子病历中时,可保持所述关联。在一些实施例中,通过同时显示电子病历内的事实和文本叙述(或者至少从中提取所述事实的那部分文本叙述),并用上述任意方式提供关联的指示,可使所述关联可视。类似地,提取的事实可被包括在其它各种患者记录中,可保持并用任何适当的方式,指示患者记录中的事实和从中提取所述事实的文本叙述的各个部分之间的关联。
在一些实施例中,由事实提取组件104自动从文本叙述提取的,或者作为离散的结构化数据项,由用户直接输入的一个或多个医疗事实可被输入事实复查组件106中,以便自动复查。在一些实施例中,事实复查组件106可被编程,以识别改进患者诊疗的医疗文档编制的可能,如果识别出任何这种可能,向用户(例如,临床医生120或其他用户150)提供提醒。如上所述,可以使用任何适当形式的提醒,包括视觉和/或音频提醒,在这方面,本发明不受限制。在一些实施例中,复查收集的医疗事实,以确定改进医疗文档编制的可能,和因而发生的向用户的提醒和/或询问可由事实复查组件106或任何其它适当组件完全自动进行。这里使用的“自动”进行处理指的是在处理的输入和其对应输出之间,不需要人类参与,所有的中间操作都由机器进行。
如上所述,事实复查组件106可向用户提供的一种提醒是增大从患者诊疗查明的一组事实的特异性的潜在可能的提醒。这可用任何适当方式进行。在一些实施例中,可用一组确定性规则对事实复查组件编程,以确定何时存在这种潜在可能。例如,在一些实施例中,如果对应于事实之一的临床术语链接到事实提取组件104使用的形式本体中的概念,并且该概念是本体论中的一个或多个特定子概念的父概念,那么事实复查组件106可生成向用户询问是否能够从患者诊疗实际查明更特定的子概念之一的提醒。如果用户肯定地回答,那么在一些实施例中,事实复查组件106可用用户指示的更具体事实,替换更一般的事实。类似地,如果形式本体中的一个或多个概念链接到出现在一组事实中的临床术语,和如果对于可向所述一组事实增加特异性的事实,这些概念在本体论中与之有关系,那么可以生成提醒和/或查询。例如,如果通过本体关系,已知记录在一组事实中的一个或多个状况是具体诊断的症状,那么在一些实施例中,事实复查组件106可询问临床医生120或其他用户150是否可从患者诊疗中查明所述具体诊断,并增加到事实中。在一些实施例中,作为备选方案,或者除了一组确定性规则之外,还可使用统计模型识别其中存在增大一组事实的特异性的可能的情形。
在另一个例子中,从患者诊疗中收集(利用事实提取,从文本叙述收集,或者作为一个或多个离散的结构化数据项,利用直接输入收集)的一组事实中的一个或多个事实可对应于用于计费、订购、评估护理质量等的一个或多个标准代码。这种标准代码可以特定于保健机构,或者可以是多个机构共用的标准。这种标准编码系统的例子包括(但不限于)ICD代码,CPT(通用过程术语学)代码、E&M(评价与管理)代码,MedDRA(医学管理事务术语词典)代码,SNOMED代码,LOINC(观测指标标识符逻辑命名与编码系统)代码,RxNorm代码,NDC(国家药物药码)代码和RadLex代码。一些这样的标准编码系统是分级的,因为系统内的某些代码是系统内的其它代码的更具体形式。例如,在ICD-10编码系统中,代码I20代表“心绞痛”(由心肌的缺血与缺氧引起的胸痛)。ICD-10代码I20的更具体形式包括I20.0(“不稳定型心绞痛”),I20.1(“心绞痛,伴有确证的痉挛”),I20.8(“其它形式的心绞痛”)和I20.9(“心绞痛,未特指”)。在一些实施例中,如果从患者诊疗收集的一组事实之一包括通用代码,比如ICD-10I20,那么事实复查组件106可被编程,以自动向用户询问是否可从患者诊疗中查明对应的具体代码之一。在一些实施例中,事实复查组件106可向用户提供可用的具体代码之中的结构化选择,可允许用户挑选可用选项。
在另一个例子中,事实复查组件106可被编程,以便在一起出现在从患者诊疗中收集的一组事实中的两个或更多事实的组合暗示特定事实时,提醒用户。一个例子是包括肺炎的诊断,以及指示在痰培养中,发现假单胞菌的检测结果的一组事实。根据指示这两个事实结合可暗示由微生物的存在引起的更具体形式的肺炎的确定性规则,或者统计模型结果,事实复查组件106可向用户询问是否可从患者诊疗中查明所述更具体的诊断结果。
在一些实施例中,如果在患者的病史中,存在已提供附加特异性的信息,那么可取消否则会从当前患者诊疗中生成的提醒。为此,在一些实施例中,事实复查组件106可访问患者122的患者历史记录160的数据集,可在产生给用户的提醒前,关于这样的信息,查询患者历史记录160。例如,如果出自当前患者诊疗的一组事实指定疾病,但未指定它是“急性的”还是“慢性的”,但是患者历史记录160中的以前记录已说明所述疾病是“慢性的”,那么在一些实施例中,事实复查组件106可自动编辑当前患者诊疗的一组事实,以指定该疾病是“慢性的”,而不用提醒打扰用户。不过,在一些实施例中,即使事实复查组件106可自动获得这种特异性增强信息,仍可生成消息,以通知用户该信息将被自动增加,从而允许用户拒绝该变更(如果需要的话),或者请求用户认可所作的变更。
在一些实施例中,如果响应增大患者诊疗的一组临床事实的特异性的提醒的人是用户150,而不是临床医生122,那么可提示临床医生120最终认可患者诊疗的一组事实之前,认可其他用户150提供的任何附加信息。例如,在一些实施例中,用户150可以是被分配复查和把一组临床事实(它可包括计费代码)编辑成适合于并入电子病历、患者报告、定单表格或其它文献种类中的形式的任务的编码专业人员。在这种“后端”安排中,在一些实施例中,由编码专业人员150确定的一组临床事实随后被传送给临床医生120,以便最终认可所述一组事实。在一些其它实施例中,可不需要编码专业人员150。例如,在“前端”安排中,临床医生120可自己复查并且可能编辑一组临床事实,最后当他感到满意时,认可该组事实。在一些实施例中,这可在患者诊疗期间发生,或者在其它实施例中,在之后的某个时刻发生(例如,在临床医生120最终批准或在报告上签名之前)。在任何一种安排中,在一些实施例中,事实复查组件106或任何其它组件的提供与所述一组事实有关的提醒、决策支持、工作流工具等的处理可在临床医生最终认可一组事实之前进行。
在一些实施例中,当确定可能可从患者诊疗中,查明不详诊断时,事实复查组件106可以进行类似的处理,以提醒用户。如上所述,这种不详诊断的例子包括一个或多个已指定诊断的合并症,和作为一个或多个其它指定的诊断和/或手术的并发症的一个或多个已指定诊断的识别。例如,如果对于患者诊疗收集的一组事实指定肺炎的诊断,并且患者的血氧饱和度也较低,那么可以确定可能可从患者诊疗中查明呼吸衰竭(肺炎的合并症)。在这种情况下,事实复查组件106可产生给用户的提醒。在一些实施例中,当存在其它相关的疾病时,可根据最佳实践的知识,进行这种确定,同时确定性规则提供应研究的诊断的提醒,以便获得最佳护理质量。在其它实施例中,通过把收集的一组事实和/或源于患者的病史的事实输入根据过去的临床报告和/或医学文献训练的统计模型,可统计地进行这种确定。这样,可以统计地识别倾向于相关的诊断模式,根据过去观察到的关系将在当前患者诊疗中显露出来的似然性,可产生提醒。为此,在一些实施例中,事实复查组件106可访问医学文献/文档的数据集170(比如来自保健机构和/或来自其它来源的过去的医疗报告),从所述数据集170中,可以建立和更新统计模型。
在一些实施例中,如上所述,事实复查组件106可被编程,以便当它确定从患者诊疗中收集的一组事实中的两个或更多事实以某种方式相互冲突时,或者当它确定所述一组事实中的一个或更多事实与患者历史记录160中的一个或更多事实冲突时,生成提醒。在一些实施例中,事实复查组件106可被编程,以根据具有不良相互作用的事实的一组已知组合,自动生成这样的提醒。例如,当所述一组事实指出除了某种其它药物(药B)之外,已给患者122开有与药B不良地相互作用的某种药物(药A),以致不应同时开这两种药物时,可生成提醒。在一些实施例中,药A和药B两者的处方可能在从当前患者诊疗收集的一组事实中指定,而在其它实施例中,药A的处方可能在源于当前患者诊疗的事实中指定,而药B的处方可能在包含于患者历史记录160中的事实中指定。在一些实施例中,已知的一组不良相互作用可表现在事实复查组件106可本地访问的数据集中,而在其它实施例中,事实复查组件106可查询一个或多个外部数据集(比如由药店保持的那些数据集),以判定关于患者122的给定事实是否证明任何禁忌症。在一些实施例中,事实复查组件106或另一个适当的处理组件既可保持内部数据集,又可查询外部数据集,以便定期更新内部数据集。
在一些实施例中,冲突提醒可由其中至少一个事实不对应于药物的事实的组合触发。例如,对于与药物和过敏症的组合,药物和诊断的组合,药物和患者的年龄或性别的组合,药物和在患者的病史中指示的疾病的组合,医疗诊断程序和任意上述特性的组合,或者计划的治疗和源于当前患者诊疗或者源于患者病史的已知对其来说,计划的治疗是禁忌的另一个临床事实的任何其它组合相关的禁忌,事实复查组件106可以生成提醒。
在一些实施例中,如上所述,当确定存在加入患者诊疗的临床文档编制中,以便检查质量的可能时,事实复查组件106可生成提醒。在一些实施例中,可用一组确定性规则对事实复查组件106编程,以根据一组标准的护理质量指标,响应某些事实或者事实的某些组合,生成自动提醒。这种护理质量标准可以是特定保健机构专有的,或者可以是非机构特有的标准,比如PQRI标准或JCAHO标准。可以使用任何适当的护理质量标准,本发明并不局限于任何特定的护理质量标准。在一些实施例中,当收集的事实或者事实的组合与按照护理质量标准,在临床医生方面的某种推荐操作相联系时,可以提供提醒,以询问用户是否进行推荐的操作。例如,如果一组事实说明患者122是吸烟者,那么在一些实施例中,事实复查组件106可产生提醒临床医生120建议患者122戒烟,和把所述建议记录在患者记录中的提醒。在另一个例子中,如果一组事实说明患者122患有心脏病,那么在一些实施例中,事实复查组件106可提示临床医生120记录阿斯匹林的开药和/或给药有多快,以致可以记录遵守适用的护理质量标准的证据。在一些实施例中,事实复查组件106用于生成PQRI得分报告等,以作为支持赔偿的合规性报告发送给保险公司。
在一些实施例中,如上所述,当确定在可能提取自文本叙述的相同部分的多个事实之间,需要消除模棱两可情况时,事实复查组件106或另一个适当组件可生成给用户的提醒。例如,形式自由的叙述中的术语可能与事实提取组件104使用的形式本体中的两个不同概念关联,并且可能这两个概念不可能共存于该形式自由的叙述中。例如,如果文本叙述包含词语“cold”,那么在一些情况下,事实提取组件104可能难以判定临床医生120意图使该词语意味患者122摸起来太凉,意味患者122流鼻涕,还是意味患者122患有慢性阻塞性肺部疾病(COLD)。在其它例子中,如上所述,在一个或多个统计事实提取模型处理文本时,可识别待从文本的某个部分提取的事实的多个备选假设。在这种情况下,在一些实施例中,事实复查组件106可向用户提供结构化选择,以消除事实提取组件104试探地提取的多个事实之间的歧义。在一些实施例中,在结构化选择中提供的各个选项可对应于多个暂定事实之一,用户可选择选项之一,以指定实际上应从形式自由的叙述中,提取哪个事实。如上所述,如果挑选事实的用户是除临床医生120外的人,比如编码专业人员150,那么在一些实施例中,在最终认可患者诊疗的一组事实之前,可提示临床医生120认可该用户的选择。在其它实施例中,可提示用户形式自由地提供歧义消除信息,而不是以结构化选择的形式,本发明的涉及提示歧义消除信息的各个方面并不局限于任何特定的实现。
在各种情形下,如上所述,事实复查组件106可被编程,以产生包括与可能可从患者诊疗中查明的医疗事实对应的多个选项之间的结构化选择的提醒。这种结构化选择可包括可增大对于患者诊疗已收集的一组临床事实的特异性的事实之间的选择,由对于患者诊疗已收集的事实的一种或更多组合可能暗示的事实之间的选择,消除事实之间的歧义的选择,或者其中向用户提供一个或更多的结构化选项,用户可从中进行选择的任何其它选择。可用任何适当的方式,提供这种结构化选择,包括结构化选择中的选项的视觉和/或音频列举,在这方面,本发明不受限制。类似地,可用任何适当方式,包括手动输入和/或口述输入,接收用户对结构化选择中的选项的选择,在这方面,本发明不受限制。
在一些实施例中,响应用户选择选项之一,事实复查组件106可通过使用事实提取组件104,对文本叙述进行更新,以使文本叙述明确陈述对应于所选事实的信息。例如,在一些实施例中,在某种意义上,事实提取组件104可从选择的事实逆向工作,以产生在正向意义上,可能已从中提取该事实的自然语言文本。在一些实施例中,生成的文本随后可被增加到文本叙述中。当用户通过结构化选择选择的事实是对已从文本叙述中提取的事实的替换或歧义消除,那么在一些实施例中,生成的文本可被用于替换从中提取原始事实的那部分文本叙述。在一些实施例中,为了在无其它文本要被替换时,确定把生成的文本加入文本叙述中的什么地方,事实提取组件104可根据大概是如何从叙述中提取所选事实的,再次逆向工作。例如,在一些实施例中,事实提取组件104可识别文本叙述中对应于所选事实的章节标题,生成的文本可被添加到该章节中(例如,由于具有状态“历史”的所选事实大概提取自具有“历史”标题的章节,因此生成的对应文本可被添加到文本叙述中的这种章节中)。在其它实施例中,生成的文本可被简单地附加到文本叙述中的预定位置,比如在叙述的开始或结尾,而不管生成的文本的语义内容。
在一些实施例中,事实复查组件106可允许用户指定文本叙述中,生成的文本应被插入的位置,或者可允许用户修正最初自动确定的位置。在一些实施例中,事实提取组件104或另一个适当组件可被用于响应用户的在文本叙述中,插入生成文本的新位置的指示,更新生成的文本。例如,根据用户是选择在句首、句中还是句尾的位置,或者是它自己的句子的位置还是在另一个句子内的位置,可在大写、间距、标点符号等方面,调整生成的文本,以在句法上适合选择的位置。在另一个例子中,如果选择的事实指定某种疾病的家族史,那么根据用户选择在关于女性亲属,还是关于男性亲属的句子中的位置,可调整生成的文本中的一个或多个代词的性别。在其它情况下,如果从结构化选择中选择选项,和/或指定文本叙述中的位置的用户是除临床医生120之外的人,那么在一些实施例中,在最终认可一组临床事实之前,可提示临床医生120认可该用户的选择。
图6图解说明按照这里说明的一些实施例,处理形式自由的叙述的处理。首先在动作610,接收包括记录患者诊疗的形式自由的叙述的文本。
在动作620,通过利用由一个或多个处理器实现的NLU引擎,提取对应于可预订项目的一个或多个临床事实。在动作630,判定所述一个或多个临床事实是否指示预订所述可预订项目的意图。当确定所述一个或多个临床事实不指示预订所述可预订项目的意图时,处理终止。另一方面,当确定所述一个或多个临床事实指示预订所述可预订项目的意图时,处理进入动作640,在动作640,生成关于所述可预订项目的定单。
尽管图6的实施例在确定一个或多个临床事实不指示预订可预订项目的意图时终止,不过在其它实施例中,可以采取操作,以捕捉(例如,通过记录在病历中)提取的临床事实,例如,通过注释患者已在服用当前药物。
图7是按照这里说明的一些实施例的系统的方框图。它包括临床诊疗的形式自由的叙述的来源701。如上所述,所述来源可以采取多种形式任意之一,包括图1中所示种类的ASR引擎102,任意种类的保存先前产生的叙述的计算机存储介质,或者任何其它来源,这里说明的本发明的各个方面无论如何不受形式自由的临床叙述的来源限制。形式自由的临床叙述由可用上述任意方式(包括具有实现一个或多个NLU引擎的一个或多个处理器)实现的事实提取组件703操作,以从形式自由的叙述中提取一个或多个临床事实。当一个或多个提取的临床事实对应于可预订项目的记载时,事实提取组件可区分该临床事实是否指示预订所述可预订项目的意图。当确定在形式自由的叙述中,表达了预订所述可预订项目的意图时,事实提取组件与定单生成组件705通信,以生成所述可预订项目的定单。定单生成组件可耦接到用户界面707,用户界面707可采取任意形式,可以是专用于定单生成组件705的用户界面,或者可以与系统的其它方面共用(例如,该用户界面可以与图1中所示的用户界面140共用)。在一些实施例中,用户界面可向用户提供确认定单生成组件生成的任何定单的能力。一旦定单被最后定下来,它就可被发送给其例子在这里说明的众多定单履行系统709a-709x之一。
应意识到图7中图解所示的各种组件和系统可按照任何适当方式耦接,可以是位于相同的物理计算系统或者可用任何适当方式(包括利用任意种类的网络)耦接的分离的物理计算系统上的组件,所述网络的例子包括局域网和广域网。
图8是在向用户提供关于生成的定单的信息,和允许用户批准并提交所述定单时,用户界面707使用的屏幕截图的例子。应意识到在图8的例子中提供的信息仅仅是例证性的,提供给用户的信息可以采取任何适当的形式,并将随生成的定单的性质而变化。在图8的例子中,字段801提供患者的姓名,字段803提供患者的性别,字段805提供创建所述定单的日期。在字段807中,指定定单种类。在图8中所示的例子中,定单是药物的处方。在这种情况下,提供给用户的信息可包括与药物相关的任何期望信息。在图8中图解所示的例子中,该信息包括药物名称字段809,剂量字段811,给药途径字段813,和开给所述药物的疗程字段815。同样,这仅仅是例证性的,提供给用户的信息可以采用任何适当的形式。按照本发明的一个实施例,字段809-815可由用户编辑。按照这样的实施例,要求用户认证他/她的身份和凭证,以便被批准编辑定单中的信息。在备选实施例中,这些字段不可编辑,从而用户只具有批准或取消定单的能力。在这方面,如图8中所示,设置可选项目817,当被用户以任何适当方式选择时,所述可选项目817批准定单,并把定单发送给定单履行系统。相反,当用户选择项目819时,生成的定单被取消。应意识到可选择的项目817和819可以采取任何适当的形式,并且可用任何适当的方式选择,在这方面,这里说明的本发明不受限制。
根据上面所述,应意识到本发明的另一个实施例目的在于一种格式化文本,以便提取临床事实的方法900,如图9中图解所示。方法900可由事实复查系统的一个或多个组件,比如ASR引擎102和/或事实提取组件104进行,不过其它实现也是可能的,在这方面,方法900不受限制。方法900开始于动作910,在动作910,可接收原始的文本叙述(例如,临床医生提供的患者诊疗的叙述的文本表示)。在动作920,原始文本可被重新格式化,以产生格式化的文本叙述。在动作930,可从格式化的文本中,提取一个或多个临床事实。方法900结束于动作940,在动作940,可保持临床事实中的至少一个临床事实和原始文本的对应部分之间的关联。
根据上面所述,应意识到本发明的另一个实施例目的在于一种关联提取的临床事实和文本的方法1000,如图10中图解所示。方法1000可由事实复查系统的一个或多个组件,比如事实提取组件104和/或事实复查组件106进行,不过其它实现也是可能的,在这方面,方法1000不受限制。方法1000开始于动作1010,在动作1010,可从临床医生提供的患者诊疗的形式自由的叙述中,提取多个事实。在动作1020,可保持每个事实(或者事实中的至少两个事实)与从中提取所述事实的形式自由的叙述的对应部分之间的关联。方法1000结束于动作1030,在动作1030,对于每个事实,可提供不同的指示符,以指示该事实和其形式自由的叙述的对应部分之间的关联。
根据上面所述,应意识到本发明的另一个实施例目的在于一种分析临床文档编制中的特异性的方法1100,如图11中图解所示。方法1100可由事实复查系统的一个或多个组件,比如ASR引擎102、事实提取组件104和/或事实复查组件106进行,不过其它实现也是可能的,在这方面,方法1100不受限制。方法1100开始于动作1110,在动作1110,可从临床医生对患者的诊疗中,收集一组一个或多个临床事实。在动作1120,可从所述一组事实,确定可能可从患者诊疗中,查明另外的特异性。方法1100结束于动作1130,在动作1130,可提醒用户可能可从患者诊疗中,查明增加所述一组事实的特异性的额外事实。
根据上面所述,应意识到本发明的另一个实施例目的在于一种识别临床文档编制中的不详诊断的方法1200,如图12中图解所示。方法1200可由事实复查系统的一个或多个组件,比如ASR引擎102、事实提取组件104和/或事实复查组件106进行,不过其它实现也是可能的,在这方面,方法1200不受限制。方法1200开始于动作1210,在动作1210,可从临床医生对患者的诊疗中,收集一组一个或多个临床事实。在动作1220,可从所述一组事实,确定可能可从患者诊疗中,查明不详的诊断结果。方法1200结束于动作1230,在动作1230,可提醒用户可能可从患者诊疗中,查明不详的诊断结果。
根据上面所述,应意识到本发明的另一个实施例目的在于一种更新临床文档编制中的文本的方法1300,如图13中图解所示。方法1300可由事实复查系统的一个或多个组件,比如事实提取组件104和/或事实复查组件106进行,不过其它实现也是可能的,在这方面,方法1300不受限制。方法1300开始于动作1310,在动作1310,可向用户提供一个或多个选项,所述一个或多个选项对应于可能从患者诊疗中查明的一个或多个临床事实。在动作1320,接收选项之一的用户选择。方法1300结束于动作1330,在动作1330,文本叙述(例如,临床医生提供的患者诊疗的形式自由的叙述的文本表示)可被更新,以把对应于所选选项的事实识别成已从患者诊疗中查明。
按照这里说明的技术的医疗文档编制系统可采取任何适当的形式,在这方面,本发明不受限制。图14中表示了可结合本发明的一些实施例使用的计算机系统1400的例证实现。诸如计算机系统1400之类的一个或多个计算机系统可被用于实现任意上述功能。计算机系统1400可包括一个或多个处理器1410,和一个或多个有形的非临时性计算机可读存储介质(例如,易失性存储器1420,和可由任何适当的非易失性数据存储介质构成的一个或多个非易失性存储介质1430)。处理器1410可按照任何适当的方式,控制往来于易失性存储器1420和非易失性存储器1430的数据写入和数据读取,在这方面,本发明不受限制。为了实现这里说明的任意功能,处理器1410可执行保存在一个或多个计算机可读存储介质(例如,易失性存储器1420)中的一条或多条指令,所述一个或多个计算机可读存储介质可充当保存指令,以供处理器1410执行的有形的非临时性计算机可读存储介质。
本发明的上述实施例可用多种方式任意之一实现。例如,实施例可用硬件、软件或者它们的组合实现。当用软件实现时,可在任意适当的处理器或许多处理器(不论是设置在单个计算机中,还是分布在多个计算机间)上,执行软件代码。应意识到实现上述功能的任意组件或许多组件一般可被看作控制上述功能的一个或多个控制器。所述一个或多个控制器可用多种方式实现,比如用专用硬件实现,或者用利用微代码或软件编程,以实现上述功能的通用硬件(例如,一个或多个处理器)实现。
在这方面,应意识到本发明的实施例的一种实现包括用计算机程序(即,多条指令)编码的至少一个计算机可读存储介质(例如,有形的非临时性计算机可读介质,比如计算机存储器、软盘、光盘、磁带或其它有形的非临时性计算机可读介质),当在一个或多个处理器上执行时,所述计算机程序实现本发明的实施例的上述功能。计算机可读存储介质可以是可运输的,以致保存在其上的程序可被加载以任何计算机资源上,以实现这里讨论的本发明的各个方面。另外,应意识到对当被执行时,实现任意上述功能的计算机程序的引用并不限于运行于主计算机上的应用程序。相反,术语“计算机程序”这里被广义地用于引用能够用来对一个或多个处理器编程,以实现本发明的上述各个方面的任意种类的计算机代码(例如,软件或微代码)。
这里使用的措词和术语只是用于说明,不应被视为对本发明的限制。“包括”、“包含”、“具有”、“涉及”及其各种变形的使用意欲包括之后列举的各个项目,以及另外的项目。权利要求中的修饰权利要求要素的诸如“第一”、“第二”、“第三”之类的序数词的使用本身并不意味一个权利要求要素相对于另一个权利要求要素的任意优先性、领先或者次序,或者进行方法的各个动作的时间顺序。序数词仅仅用作区分具有某个名称的一个权利要求要素,和具有相同名称(如果没有使用序数词的话)的另一个权利要求要素,以相互区分权利要求要素的标记。
上面说明了本发明的几个实施例,对本领域的技术人员来说,易于想到各种修改和改进。这样的修改和改进在本发明的精神和范围内。从而,上面的说明仅仅是例子,并不是对本发明的限制。本发明仅仅由以下权利要求及其等同物限定。

Claims (20)

1.一种用于医疗文档编制的方法,包括:
利用由一个或多个处理器实现的自然语言理解引擎,处理临床医生讲述的对患者的诊疗的形式自由的叙述,在所述形式自由的叙述的章节内,利用所述自然语言理解引擎处理所述章节的文本,从所述章节的文本中提取与所述章节内的可预订项目的每个提及对应的一个或多个临床事实,其中所述处理包括:
对于所述章节内的可预订项目的每个提及,区分所述一个或多个临床事实是指示预订相应的可预订项目的意图,还是不指示预订相应的可预订项目的意图,和
只向被确定为指示预订相应的可预订项目的意图的任何临床事实赋予意图预订属性;和
生成与一个或多个提取的临床事实之中的被赋予意图预订属性的至少一个临床事实对应的至少一个可预订项目的至少一个定单。
2.按照权利要求1所述的方法,其中所述处理包括把一个或多个临床事实识别成对应于一个或多个可预订项目的一个或多个提及,所述一个或多个可预订项目选自包含以下项目的组:药物定单,手术定单,实验室定单,诊断性检测定单,预约定单,转诊定单,以及信息交流定单。
3.按照权利要求1所述的方法,还包括识别为产生所述至少一个可预订项目的至少一个定单所需的一组信息字段。
4.按照权利要求3所述的方法,还包括识别所述一组信息字段中的未从形式自由的叙述中提取的一个或多个缺失信息字段。
5.按照权利要求4所述的方法,还包括:
提示临床医生提供所述一个或多个缺失信息字段中的至少一个缺失信息字段;和/或
从患者的历史的文档推断所述一个或多个缺失信息字段中的至少一个缺失信息字段。
6.按照权利要求1所述的方法,还包括:
识别用于履行所生成的至少一个定单的目标计算机化系统;
使所生成的至少一个定单符合适合于履行所述至少一个定单的目标计算机化系统的标准;并且
把符合的至少一个定单传送给目标计算机化系统。
7.按照权利要求1所述的方法,还包括提醒临床医生注意所述至少一个可预订项目和提取自形式自由的叙述和/或提取自患者的历史的一个或多个其它事实之间的一个或多个冲突。
8.一种用于医疗文档编制的设备,包括:
至少一个处理器;和
保存处理器可执行指令的至少一个处理器可读存储介质,当被所述至少一个处理器执行时,所述指令使所述至少一个处理器执行一种方法,所述方法包括:
利用自然语言理解引擎,处理临床医生讲述的对患者的诊疗的形式自由的叙述,在所述形式自由的叙述的章节内,利用所述自然语言理解引擎处理所述章节的文本,从所述章节的文本中提取与所述章节内的可预订项目的每个提及对应的一个或多个临床事实,其中所述处理包括:
对于所述章节内的可预订项目的每个提及,区分所述一个或多个临床事实是指示预订相应的可预订项目的意图,还是不指示预订相应的可预订项目的意图,和
只向被确定为指示预订相应的可预订项目的意图的任何临床事实赋予意图预订属性;和
生成与一个或多个提取的临床事实之中的被赋予意图预订属性的至少一个临床事实对应的至少一个可预订项目的至少一个定单。
9.按照权利要求8所述的设备,其中所述处理包括把一个或多个临床事实识别成对应于一个或多个可预订项目的一个或多个提及,所述一个或多个可预订项目选自包含以下项目的组:药物定单,手术定单,实验室定单,诊断性检测定单,预约定单,转诊定单,以及信息交流定单。
10.按照权利要求8所述的设备,其中所述方法还包括:
识别为产生所述至少一个可预订项目的至少一个定单所需的一组信息字段;和
识别所述一组信息字段中的未从形式自由的叙述中提取的一个或多个缺失信息字段。
11.按照权利要求10所述的设备,其中所述方法还包括:
提示临床医生提供所述一个或多个缺失信息字段中的至少一个缺失信息字段;和/或
从患者的历史的文档推断所述一个或多个缺失信息字段中的至少一个缺失信息字段。
12.按照权利要求8所述的设备,其中所述方法还包括:
识别用于履行生成的至少一个定单的目标计算机化系统;
使生成的至少一个定单符合适合于履行所述至少一个定单的目标计算机化系统的标准;和
把符合的至少一个定单传送给目标计算机化系统。
13.按照权利要求8所述的设备,其中所述方法还包括提醒临床医生注意所述至少一个可预订项目和提取自形式自由的叙述和/或提取自患者的历史的一个或多个其它事实之间的一个或多个冲突。
14.用计算机可执行指令编码的至少一个计算机可读存储介质,当被执行时,所述指令执行一种用于医疗文档编制的方法,所述方法包括:
利用自然语言理解引擎,处理临床医生讲述的对患者的诊疗的形式自由的叙述,在所述形式自由的叙述的章节内,利用所述自然语言理解引擎处理所述章节的文本,从所述章节的文本中提取与所述章节内的可预订项目的每个提及对应的一个或多个临床事实,其中所述处理包括:
对于所述章节内的可预订项目的每个提及,区分所述一个或多个临床事实是指示预订相应的可预订项目的意图,还是不指示预订相应的可预订项目的意图,和
只向被确定为指示预订相应的可预订项目的意图的任何临床事实赋予意图预订属性;和
生成与一个或多个提取的临床事实之中的被赋予意图预订属性的至少一个临床事实对应的至少一个可预订项目的至少一个定单。
15.按照权利要求14所述的至少一个计算机可读存储介质,其中所述处理包括把一个或多个临床事实识别成对应于一个或多个可预订项目的一个或多个提及,所述一个或多个可预订项目选自包含以下项目的组:药物定单,手术定单,实验室定单,诊断性检测定单,预约定单,转诊定单,和信息交流定单。
16.按照权利要求14所述的至少一个计算机可读存储介质,其中所述方法还包括识别为产生所述至少一个可预订项目的至少一个定单所需的一组信息字段。
17.按照权利要求16所述的至少一个计算机可读存储介质,其中所述方法还包括识别所述一组信息字段中的未从形式自由的叙述中提取的一个或多个缺失信息字段。
18.按照权利要求17所述的至少一个计算机可读存储介质,其中所述方法还包括:
提示临床医生提供所述一个或多个缺失信息字段中的至少一个缺失信息字段;和/或
从患者的历史的文档推断所述一个或多个缺失信息字段中的至少一个缺失信息字段。
19.按照权利要求14所述的至少一个计算机可读存储介质,其中所述方法还包括:
识别用于履行生成的至少一个定单的目标计算机化系统;
使生成的至少一个定单符合适合于履行所述至少一个定单的目标计算机化系统的标准;以及
把符合的至少一个定单传送给目标计算机化系统。
20.按照权利要求14所述的至少一个计算机可读存储介质,其中所述方法还包括提醒临床医生注意所述至少一个可预订项目和提取自形式自由的叙述和/或提取自患者的历史的一个或多个其它事实之间的一个或多个冲突。
CN201480011386.4A 2013-03-01 2014-02-26 确定临床医生的预订项目的意图的方法和设备 Expired - Fee Related CN105190628B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/782,048 2013-03-01
US13/782,048 US10032127B2 (en) 2011-02-18 2013-03-01 Methods and apparatus for determining a clinician's intent to order an item
PCT/US2014/018486 WO2014134093A1 (en) 2013-03-01 2014-02-26 Methods and apparatus for determining a clinician's intent to order an item

Publications (2)

Publication Number Publication Date
CN105190628A CN105190628A (zh) 2015-12-23
CN105190628B true CN105190628B (zh) 2019-10-11

Family

ID=50277370

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480011386.4A Expired - Fee Related CN105190628B (zh) 2013-03-01 2014-02-26 确定临床医生的预订项目的意图的方法和设备

Country Status (3)

Country Link
EP (1) EP2946322A1 (zh)
CN (1) CN105190628B (zh)
WO (1) WO2014134093A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229609B (zh) * 2016-03-25 2021-08-13 佳能株式会社 用于分割文本的方法和设备
EP3446244A1 (en) * 2016-04-20 2019-02-27 Koninklijke Philips N.V. Auto-populating patient reports
CN110692102A (zh) * 2017-10-20 2020-01-14 谷歌有限责任公司 从医患对话中捕获详细结构用于在临床文献中使用
JP7095377B2 (ja) * 2018-04-17 2022-07-05 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
US10901688B2 (en) 2018-09-12 2021-01-26 International Business Machines Corporation Natural language command interface for application management
CN109284491B (zh) * 2018-10-23 2023-08-22 北京惠每云科技有限公司 医学文本识别方法、语句识别模型训练方法
CN109299467B (zh) * 2018-10-23 2023-08-08 北京惠每云科技有限公司 医学文本识别方法及装置、语句识别模型训练方法及装置
CN110069781B (zh) * 2019-04-24 2022-11-18 北京奇艺世纪科技有限公司 一种实体标签的识别方法及相关设备
CN111259112B (zh) * 2020-01-14 2023-07-04 北京百度网讯科技有限公司 医疗事实的验证方法和装置
US11755661B2 (en) 2020-03-31 2023-09-12 Roche Molecular Systems, Inc. Text entry assistance and conversion to structured medical data
CN113379398B (zh) * 2021-08-13 2021-12-28 北京明略软件系统有限公司 一种项目需求的生成方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7610192B1 (en) * 2006-03-22 2009-10-27 Patrick William Jamieson Process and system for high precision coding of free text documents against a standard lexicon

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6963839B1 (en) * 2000-11-03 2005-11-08 At&T Corp. System and method of controlling sound in a multi-media communication application
EP1442407A1 (en) * 2001-10-03 2004-08-04 Mdoffices.Com, Inc. Health care management method and system
US7257531B2 (en) * 2002-04-19 2007-08-14 Medcom Information Systems, Inc. Speech to text system using controlled vocabulary indices
US8606594B2 (en) * 2002-10-29 2013-12-10 Practice Velocity, LLC Method and system for automated medical records processing
US8265939B2 (en) * 2005-08-31 2012-09-11 Nuance Communications, Inc. Hierarchical methods and apparatus for extracting user intent from spoken utterances
US8498870B2 (en) * 2008-01-24 2013-07-30 Siemens Medical Solutions Usa, Inc. Medical ontology based data and voice command processing system
CA2661079A1 (en) * 2008-04-04 2009-10-04 Wairever Inc. System and method for optimizing development, implementation and management of orders
US9904768B2 (en) * 2011-02-18 2018-02-27 Nuance Communications, Inc. Methods and apparatus for presenting alternative hypotheses for medical facts
EP2691870A4 (en) * 2011-03-31 2015-05-20 Microsoft Technology Licensing Llc USER INTENTIONS ORIENTED ON TASKS

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7610192B1 (en) * 2006-03-22 2009-10-27 Patrick William Jamieson Process and system for high precision coding of free text documents against a standard lexicon

Also Published As

Publication number Publication date
WO2014134093A1 (en) 2014-09-04
CN105190628A (zh) 2015-12-23
EP2946322A1 (en) 2015-11-25

Similar Documents

Publication Publication Date Title
US20210398630A1 (en) Systems and methods for identifying errors and/or critical results in medical reports
US11742088B2 (en) Methods and apparatus for presenting alternative hypotheses for medical facts
US10956860B2 (en) Methods and apparatus for determining a clinician's intent to order an item
US11101024B2 (en) Medical coding system with CDI clarification request notification
CN105190628B (zh) 确定临床医生的预订项目的意图的方法和设备
US11152084B2 (en) Medical report coding with acronym/abbreviation disambiguation
US20200311343A1 (en) Methods and apparatus for extracting facts from a medical text
US9922385B2 (en) Methods and apparatus for applying user corrections to medical fact extraction
US9916420B2 (en) Physician and clinical documentation specialist workflow integration
US9679107B2 (en) Physician and clinical documentation specialist workflow integration
US11183300B2 (en) Methods and apparatus for providing guidance to medical professionals
US9971848B2 (en) Rich formatting of annotated clinical documentation, and related methods and apparatus
Hazlehurst et al. MediClass: A system for detecting and classifying encounter-based clinical events in any electronic medical record
US20140365239A1 (en) Methods and apparatus for facilitating guideline compliance
US20170323060A1 (en) User interfaces for medical documentation system utilizing automated natural language understanding
WO2014197669A1 (en) Methods and apparatus for providing guidance to medical professionals
EP3011489B1 (en) Physician and clinical documentation specialist workflow integration
EP2720164A2 (en) Methods and apparatus for applying user corrections to medical fact extraction
EP2720165A2 (en) Methods and apparatus for presenting alternative hypotheses for medical facts

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20191011

Termination date: 20210226