CN101198952A - 用于解析医疗数据的系统和方法 - Google Patents

用于解析医疗数据的系统和方法 Download PDF

Info

Publication number
CN101198952A
CN101198952A CNA2006800215454A CN200680021545A CN101198952A CN 101198952 A CN101198952 A CN 101198952A CN A2006800215454 A CNA2006800215454 A CN A2006800215454A CN 200680021545 A CN200680021545 A CN 200680021545A CN 101198952 A CN101198952 A CN 101198952A
Authority
CN
China
Prior art keywords
data
text string
sig
identifier
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800215454A
Other languages
English (en)
Inventor
弗雷德·E·马萨里
斯图尔特·洛佩兹
迈克尔·I·利伯曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
General Electric Co
Original Assignee
General Electric Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by General Electric Co filed Critical General Electric Co
Publication of CN101198952A publication Critical patent/CN101198952A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明的特定实施例提供用于处理医疗数据的系统和方法。所述方法包括步骤:识别医疗数据中的文本串;将所述文本串与来自库中的标准化标识符相关联;以及输出所述与文本串相关联的标准化标识符。在一个实施例中,可以打印和/或存储包括与所述文本串相关联的标准化标识符的报告和/或医嘱。在一个实施例中,可以对库进行修改,以容纳所述文本串。可以由例如用户和/或软件程序来检查文本串,以便将标准化标识符与文本串相关联。在一个实施例中,文本串可以被解构成多个子串。然后,标准化标识符与每个子串相关联。标准化标识符可以是例如数值。

Description

用于解析医疗数据的系统和方法
技术领域
本发明一般涉及解析医疗数据(medical data)。更具体地说,本发明涉及用于解析用药指导(medication instruction)的系统和方法。
背景技术
医院一般利用计算机系统来管理医院中的各个科室,并且通过多个计算机系统来收集关于每个病人的数据。例如,病人可能入院进行超声心动图(Transthoracic Echo,TTE)检查。医院信息系统(HIS)会获得与该病人有关的信息(例如,基本信息(demographics)和保险)并将其存储在病历(patientrecord)中。然后,该信息被传送到心血管科系统(一般称为心血管信息系统,或CVIS)。一般CVIS是一个公司的产品,而HIS是另一个公司的产品。结果,这两者之间的数据库可能存在差异。此外,信息系统可能捕获/保留和发送不同粒度等级的数据。一旦CVIS接收到病人信息,就可以为病人安排在超声波实验室(echo lab)中进行TTE检查的时间。接着,由超声波检查医师进行TTE检查。获得图像和测量数据并将它们发送到CVIS服务器。读取的医师(reading physician)(例如超声心动图医师(echocardiographer))坐在诊断工作台(review station)前,调出该病人的TTE研究(study)。然后,超声心动图医师开始检查所述图像和测量数据,并创建关于该研究的完整医学报告。当超声心动图医师完成该医学报告时,该报告被发送到CVIS服务器,在那里该报告被存储,并且通过病人身份识别(identification)数据与该病人相关联。所述完成的医学报告是可被发送到数据仓库以用于公共数据挖掘(mining)的一类报告的例子。诸如文件(documentation)和/或处方(prescription)的用药指导也可以通过电子方式生成并存储在数据仓库中。
今天,医疗设备制造商和药品公司在收集关于其产品实际利用的临床数据方面面临越来越大的挑战。随着病人医学报告变得计算机化,获得实际利用数据的能力变得越来越简单。另外,更容易对数据进行组合和分析(例如挖掘),以获得更大量的有用信息。
随着医疗技术变得越来越复杂,临床分析也可能变得更加复杂。不断增长的数据量被通过电子方式生成和存档。随着临床信息系统的出现,病人病史(patient’s histoty)也许可以通过点触按钮来获得。尽管信息的可访问性是有利的,但在临床环境中时间是稀缺资源。为了全面实现医疗技术进步的益处,非常希望对临床信息进行组织和标准化。
即使对临床信息或图像相关信息进行了组织,但当前的系统往往以开发者所确定的、无法被该领域中的一个或多个医疗从业者使用的格式来组织数据。此外,信息还有可能以不适于在其它上下文中进行数据检索和使用的格式来存储。因此,需要以更加容易理解和利用的方式来组织数据和指示(instructions)。
医师手写的处方包括诸如药物、剂型(formulation)(例如液体、片剂、胶囊)、剂量(例如多少剂(how many formulations))、用药途径(例如口服)、疗程、频率/间隔、和/或限定词(如根据需要或按说明书)的信息。电子病案(medical record)系统,例如Logician,可以标准化或处理诸如药物、形式和数量(例如布洛芬100mg片剂)的信息,但处方的其它内容却一般处于自由形式(例如自由形式的文本串)。如果已知一些信息,则可以确定其它处方信息(例如药片数量和给定疗程内每天服用多少片)。因此,非常希望有一种用于处理自由形式处方信息的系统。
药剂师和临床系统与医师协作,开出(ordering)处方并例如在电子病案中记载药物。第三方知识库(knowledge bases)具有病人可以购买的药物的完整列表,包括剂量、形式和用药途径。然而,仅仅知道剂量、形式和用药途径信息是不够的。知道应当多久用药一次以及应当用的药量也是很重要的。这些以及其它信息可以在开处方的医师输入的重要指示(significantinstruction)或“sigs”中找到。
目前,sig并没有被标准化,而是随着医师的不同而不同。然而一般诸如剂量、形式和用药途径的信息都是标准化的。因此,非常需要一种对于药品施用的干净、清楚且完备的指示。另外,还非常需要一种用于读取和解释sig的可靠的系统。提高sig解释的可靠性对于病人安全来说十分重要。可靠的读取和存储sig还可以提高病人护理的质量。减少sig翻译的错误还会为医疗保健供应商、药房和保险公司省钱。举例来说,sig解释的结构数据捕获会有助于数据挖掘和判决支持。
在电子病案或电子医疗报告中,希望信息是清楚的,但是许多医师可能不会使用要求他们在输入数据和指示时过于工整和结构化的系统。许多医师偏好自由形式的指示书写。因此,非常希望系统在自然语言和结构语言之间进行平衡。此外,希望允许缩写和医学行话(例如“1 po qd”=“每天口服一片”),以及常用指示的多个不同的变化。因此,非常希望有一种系统来将不同的命令、笔记和指示翻译成有限的、不连续的、定量的信息。
因此,存在对于用来处理用药指导的系统和方法的需要。
发明内容
本发明的特定实施例提供用于处理医疗数据的系统和方法。特定实施例例如提供一种用于处理用药医嘱中的重要指示的改进的方法。所述方法包括步骤:访问医疗数据;从该医疗数据中提取至少一个包含重要指示的文本串;以及解析所述文本串,以将至少一个标识符与所述文本串中的每一个相关联。所述方法还可以包括将所述文本串解构成用于每一个所述文本串的多个子串。在一个实施例中,所述解析的步骤包括将至少一个标识符与每个子串相关联。此外,例如用户和/或软件程序可以检查(review)所述文本串,以将所述标识符与每一个所述文本串相关联。在一个实施例中,所述标识符是例如数值。
特定实施例提供一种用于处理医疗数据的改进的方法。所述方法包括步骤:识别医疗数据中的文本串;将所述文本串与来自库中的标准化标识符相关联;以及输出所述与文本串相关联的标准化标识符。在一个实施例中,可以打印和/或包括所述与文本串相关联的标准化标识符的报告和/或医嘱。在一个实施例中,可以对所述库进行修改以容纳(accommodate)所述文本串。例如,如果文本串之前没有被见到过,则所述库可以被修改和/或替换,以将标识符与该文本串相关联。用户和/或软件程序可用来检查所述文本串,以便例如将标准化标识符与该文本串相关联。在一个实施例中,文本串可以被解构成多个子串。然后将标准化标识符与每个子串相关联。所述标准化标识符可以是例如数值。在一个实施例中,所述文本串包括重要的用药指导或“sigs”。
特定实施例提供一种用于处理用药指导的系统。所述系统包括:数据源,包括医疗数据;以及数据处理器,其从所述数据源接收数据,并根据词典处理该数据。所述数据处理器将该数据解构成段并解析所述段。所述医疗数据可以包括例如用药指导和/或观察值。在一个实施例中,所述数据处理器将所述数据解构成重要指示,并解析该用药方法。所述数据处理器例如将数字标识符与每一个所述段相关联。
特定实施包括一种计算机可读存储介质,其包括一组用于计算机的指令。所述一组指令包括提取例程,其从医疗指示中提取至少一个包含用药方法的字母数字串。所述一组指令还包括解析例程,其解析所述至少一个字母数字串,以将至少一个标识符与所述至少一个字母数字串中的每一个相关联。
附图说明
图1示出了根据本发明实施例的用于处理重要指示的方法的流程图。
图2示出了根据本发明实施例的用于观察值净化(scrubbing)的方法的流程图。
图3示出了根据本发明实施例使用的用于处理医疗数据和指示的数据处理系统。
当结合附图阅读时,以上概述以及下面对本发明实施例的具体描述将变得更好理解。出于举例说明本发明的目的,在附图中示出了特定实施例。但是应当理解,本发明不限于附图中示出的安排和手段。
具体实施方式
本发明的特定实施例处理例如用药医嘱(medication orders)中的用药方法或“sigs”。仅仅出于示例的目的,sigs的几个例子可以包括“1 tab po qd”(“每天口服一片”)、“10 units sc qAm and 5 units sc qHS”(“每天早上皮下注射10单位,每天就寝时间皮下注射5单位”)、“two pills 2am and 2pm(total80mg/da)”(“凌晨两点和下午两点两丸(总剂量为每天80mg)”)、“.5-1mgevery 4 to 6 hr pm”(“根据需要每4至6小时0.5mg至1mg”)、和/或“1 dailyexcept 1.5 tabs m-w-f”(“每周一、三、五每天1片半,其它时间每天1片”)。可以解析用药医嘱和其它文本或数据,从而将文本中包含的sigs和其它信息替换成标准化格式或数字格式。该格式使得指示或其它数据可以在例如多个源和/或用户之间传输、存储、操作和/或以其它方式处理。
在一个实施例中,可以从例如电子病案(EMR)、光学字符识别(OCR)、用药医嘱系统、数据库、计算机化医师医嘱条目(entry)(CPOE)和/或其它电子格式中获得sigs。在一个实施例中,自动化机制提取从电子病案系统,诸如Logician,或其它数据源接收的sigs,并将表示sigs的字符串(string)发送到词汇处理服务器,诸如术语服务器。在一个实施例中,发送的数据包括使用计数(usage count)。使用计数可用于例如确定处理哪个sigs。使用计数还可用于确定多个sigs之间的解析优先级。在一个实施例中,只有那些自从上一次传输到词汇处理服务器之后接收的字符串与对于上次传送和当前传送之间的时间段的使用计数一起发送。图1示出了根据本发明实施例的用于处理用药方法的方法100的流程图。
首先,在步骤110,开始在术语服务器或其它词汇服务器接收数据,并将数据放置在登台(staging)数据表中。自动处理确定每个新登台的表条目(table entry)以前是否见过(例如表中的数据是否已经存在于处理过的词汇表或其它数据结构中)。如果表条目以前被检查过,则将历史使用计数增加新接收的计数。如果表条目以前没有被处理过,则将新接收的sig写入新词汇表(例如“SIG”)并更新使用计数。在一个实施例中,向sig分配可在后续处理中使用的sig标识符(“sig_id”)。新词汇表中存在将所有新sigs的sig_id存储到sig解析表(例如“SIG TO PARSE”)中的插入触发器。sig解析表可以用作自动解析驱动机制。在一个实施例中,“SIG TO PARSE”包括sig、sig的相应代码、以及使用计数。在一个实施例中,“SIG TO PARSE”表包括sig_id或代码,而sig和使用计数可以通过参考其它表来获得。
接下来,在步骤120,将“SIG TO PARSE”表用作驱动器,从新词汇表中检索仍未解析过的sigs。解析的初始步骤为,尝试识别正在处理的sig中出现的任何重要的新词和/或短语,例如剂量/用药途径(dose/route)短语。剂量/用药途径短语由其后跟随有剂量/用药途径“标签”(tag)的数字组成。标签可以包括嵌入的空白(whitespace)和/或跟随有例如附加的空白-数字-剂量/用药途径标签组合。词或短语(words or phrases)可以是各种类型的,包括例如剂量/用药途径、用药途径、间隔、疗程、标准、适应症、和/或停用词(stopword)。例如sig“1 tab po qd”包括词“1 tab po”和“qd”。新的剂量/用药途径短语被写入sig词表(例如“SIG WORD OR PHRASE”),以用于TerminologySpecialist(术语专家)或其它系统的后续解释。
在一种实施方式中,如下识别短语。通过寻找第一个数字/有效sig量度单位(valid-sig-uom)组合来识别剂量/用药途径短语。有效sig量度单位,诸如“tab”、“mg/d”、和“p.o.”可以存储在表中(例如“SIG UOM”)。在一个实施例中,字符串中跟随在量度单位之后的字符之后,跟随有空白或其它分隔符。特定实施例尝试处理最终跟随有实际单位/度量单位数字的非单位/度量单位数字的出现。在一个实施例中,例如向初始剂量/用药途径短语分配词计数2。
在步骤130,一旦识别出第一个剂量/用药途径短语,就确定在所述第一个短语之后的任何附加的空白剂量/用药途径短语。例如,随后的剂量/用药途径短语可以连接到初始的短语,并且例如,对于每个短语,可以将词计数增加2。一旦在正在构造的剂量/用药途径短语之后遇到非空白剂量/用药途径字符,则剂量/用药途径解析完成。如果作为结果的剂量/用药途径短语在sig词表(sigword table)(“SIG WORD OR PHRASE”)中不存在,则将提取的短语存储到“SIG WORD OR PHRASE”中,词类型为例如“剂量/用药途径”。
然后在步骤140,一旦“SIG WORD OR PHRASE”已经潜在增加了在当前sig中找到的新的剂量/用药途径短语,则执行扫描以确定在当前正在解析的sig中出现了“SIG WORD OR PHRASE”中包含的“块”(chunk)(剂量/用药途径等)中的哪个“块”(词和/或短语)。例如,“1 tab po qd”包含两个块:作为剂量/用药途径词的“1 tab po”以及作为间隔词的“qd”。所述确定可以重复,以用于例如包括表示短语类型的预定义标签和与该标签相关联的数字数据(例如间隔、疗程和频率)两者的其它短语。在一个实施中,以从最长块开始的递减次序执行该搜索。由于每个块被识别为嵌在sig中,因此如果块没有与任何已经被识别为嵌在sig中、并且已经被写入sig解析工作表(例如“SIG PARSE”)中的块重叠,则将该块写到sig解析工作表中。
通过首先处理最长的块,并在较短块与较长块重叠时识别重叠,处理可以集中在最长且可能最有价值的块上。在一个实施例中,仅仅将不与较长块重叠的那些块写到sig解析工作表中。在步骤150,一旦识别在sig中出现哪些块的扫描完成并且结果被存储在工作表中,就从“SIG TO PARSE”中删除当前sig的相关行。在步骤160,一旦利用将解析的所有sigs的信息构建(populate)了工作表,就为了执行(for performance)而动态地分析该表。
接下来,在步骤170,识别sig中出现的块并将其存储在永久表(permanenttable)中以记住在sig中出现哪些词或短语(例如“SIG SIGWORD”)。工作表“SIG PARSE”是该处理的驱动器。对于与工作表中的至少一行相关联的每个sig,将sig_id/sigword_id组合存储在“SIG SIGWORD”中。从相关sig字符串的图像中去除块子串,以便一旦所有识别出的块都被捕获到“SIGSIGWORD”中,就可以确定是否还余留任何原始sig的剩余(residue)。所述剩余是指除空白和特殊字符之外的任何字符。如果仍余留有任何剩余,则将剩余字符串存储在剩余数据结构中,以用于以后的评价以及潜在的将块手动添加到“SIG WORD OR PHRASE”中。一旦为给定sig构造了“SIGSIGWORD”记录,就将相关行从工作表中删除。
在步骤180,一旦为感兴趣的sigs构造了“SIG SIGWORD”记录,就必须“ 重构”sig以确定该sig的总体含义。也就是,基于哪些块被识别为嵌在sig中,确定与sig相关联的“桶”(bucket)数据或添加了值的属性,并组合与这些单个词或短语相关联的添加了值的属性。在sig重构阶段,可以应用业务逻辑或重构规则以帮助保证由每个组成的词或短语贡献的添加了值的数据不会与其它组成的词或短语贡献的添加了值的数据冲突。“SIG SIGWORD”表可以是重构处理的驱动器。
在一个实施例中,重构规则可以包括例如以下内容。首先,对没有在结果sig表(例如“RECONSTRUCTED SIG”)中被表示的sig进行重构。对组成的sig词被标记为已经被分析过并且已经由Terminology Specialist或其它验证系统认可的(例如状态=1003)sigs进行重构。基于例如根据sig词数据结构中的词类型识别出的1)剂量/用药途径、2)用药途径、3)间隔、4)疗程、5)其它处方信息来执行重构。
在特定实施例中,可以根据sig或其它数据来设置软件和/或报告标记。如果在重构处理中已经识别出了例如低/高剂量、低/高间隔、或低/高疗程值,并且随后的sig词与例如冲突的低/高剂量、间隔或疗程和/或冲突的低/高剂量单位值相关联,则可以设置“complex_sig”标记并且不保留该sig的其它桶值。然后,该complex_sig值可以由例如技术人员和/或系统单独处理。在一个实施例中,如果通过类型为“用药途径”的sig词提供了用药途径信息,并且没有低剂量信息与该sig相关联(是指没有“剂量/用药途径”信息),则例如将低剂量值设置为1并将低剂量单位设置为“EA”。
在一个实施例中,如果与sig相关联的sig词包括“prn_flag”,则该标记意味着“根据需要”的指示。如果prn_flag=“Y”,则作为结果的该sig的prn_flag=“Y”。如果与sig相关联的任何sig词包括“as_directed_flag”=“Y”,则作为结果的该sig的as_directed_flag=“Y”。
如果识别出低间隔,但是既没有设置低剂量值也没有设置低剂量单位值,没有与sig相关联的sig词是“剂量/用药途径”类型,并且在解析后没有余留的剩余,则例如low_dose被设置为1,并且low_dose_unit被设置为“EA”。如果识别出高间隔,但是既没有设置高剂量值也没有设置高剂量单位值,没有与sig相关联的sig词是“剂量/用药途径”类型,并且在解析之后没有余留的剩余,则例如high_dose被设置为1,并且high_dose_unit被设置为“EA”。
其它标记可以包括例如一天中的时间标记(例如“am_flag”、“midday_flag”或“pm_flag”)、指示sig已经被解析的解析完成标记、指示将重新解析sig的全部或部分的重新解析标记、和/或指示sig解析状态的状态标记。也可以生成包括在sig解析过程中没有被处理的数据的sig剩余串。
然后,在步骤190,将作为结果的重构的行写到结果sig表中(例如“RECONSTRUCTED SIG”)。在一个实施例中,如果complex_sig标记被设置,则在正在写入的行中,complex_sig_flag被设置,并且可以针对该sig执行进一步的处理。在一个实施例中,重构的sig可以被写到数据库(诸如报告数据库)中,并且用来生成一个或多个报告,诸如用药指导报告、诊断/治疗报告、和/或临床试验报告。例如,可以生成关于每日用药剂量和/或应当的吃药频率的报告。
因此,特定实施例提供了用于解析例如处方、报告或其它文件中的sig的系统。整个sig可以被写入到表中,以便由术语专家或术语软件对其进行检查。或者,sig可以被分割成词和/或短语(块)。可以识别之前解析过的词和/或短语。之前没有解析过的重要词和/或短语可以被写入到表中,以由技术员和/或软件程序识别。然后,可以由技术员和/或软件为块分配值,诸如代码值。从未知sig块中去除之前解析过的块减少了人员和/或软件程序评价的量。
例如,系统定位指示用药剂量和用药途径的文本。系统检查该文本以确定该文本的全部或部分之前是否已经评价过并被分配了代码。如果该文本的至少一部分之前没有被评价过,则系统处理该文本,以将数字与剂量和用药途径信息、以及间隔信息和其它信息相关联。也就是,sig被分成块。人员和/或系统确定块的含义。然后,系统重构整个sig,在处理中应用业务逻辑,以判断该指示的总体含义。
因此,在特定实施例中,sig处理系统是自适应系统。也就是,系统见到的信息越多,则系统处理的信息就越少。此外,系统可以使用块的同义词,以便提供更灵活、更快速的处理系统。
在一个实施例中,与电子病案分离的创建数据库,诸如离线数据库。该数据库可用于例如研究和质量报告。sig处理可以例如实时或基本实时地执行,并且/或者可以在稍晚的时间执行。处理过的sig可以例如存储在电子病案中。然后,电子病案可以被发送到处方药房。处理过的sig可用于完善缺失的信息和/或确定例如处方重新填写信息。
在一个实施例中,可以向医生提供命令菜单以简化和标准化sig。通过使用标准的、公共引用的命令,系统可以例如仅仅必须处理在标准列表或词典中没有找到的命令。
在特定实施例中,信息可出于安全目的用于评估开处方的模式(prescribing pattem)。可以构造工具以使医师和制药公司了解到指南被遵守的程度。例如可以生成有关护理质量和/或安全的统计信息。此外,可以使用特定实施例来提供药理学结果报告。通过参考病人信息的数据库,可以评价治疗的有效性。解析过的数据可用来评价安全相关问题并减少由于例如特定剂量和药物而带来的副作用。
预期这样的分析也可以被用来组织和分析临床试验数据。在一个实施例中,当在临床试验中开具药物处方时,医师可以从预定的指导列表中进行选择。因此,可以在试验中引入更严格的控制,并可以减少变化。
在一个实施例中,可以收集来自处方的数据和其它临床试验数据,并将其用于促进临床试验。可以提取和聚集(aggregate)来自多个客户/病人的数据。受保护的信息可以被去除(即,去除病人身份标识或使病人匿名化)。可以定义病人群体信息以用于分析。然后可以查询包括病人试验数据的数据库。可以提取具有匿名身份标识标志的数据,并将其与临床试验的一些或所有身份标识信息重新关联。可以聚集来自多个源的数据,将其匿名化,并出售给制药公司。临床试验募集(recruitment)、数据处理和分析可以被集中到一个系统和/或地点。实验室数据、图像、笔记和其它信息可以被整合和处理。历史、基本信息、遗传信息和其它信息可以被跟踪和整合到例如电子病案中。因此,临床试验处理可以被流水线化。
在一个实施例中,医学报告或其它文件中的观察值也可以被处理。例如,医学报告表,诸如Logician医疗数据表,可以包括来自检查的医师或其它医学专业人员的一个或多个观察值。观察值(例如“obs”或“obsvalue”)域可以是例如自由格式域。在特定方案中,当obsvalue数据被加载到例如Star方案(Star schema)中的观察事实表中时,来自表数据的自由格式obsvalue域被转换成数值。观察项(terms)可以被“净化”或解析,并被加载到报告数据库中,以将数值与观察值相关联。
图2示出了根据本发明实施例的用于观察值净化的方法200的流程图。在一个实施例中,方法300涉及如下步骤。首先,在步骤210,识别将被净化的观察结果(observation)。该识别可以例如通过客户请求来启动,或者可以自动识别。然后,在步骤220,由具有临床背景的人员对来自观察结果保存表的数据进行高水平的分析,并确定例如测量的标准单位、测量的替换单位、以及可接受范围。或者,可以使用软件程序来分析来自观察结果保存表的数据。接下来,在步骤230,基于所提供的信息配置控制表。
然后,在步骤240,测试运行将原始串和净化后的串写到测试表中,以进行进一步的分析,并且确定“干净净化”百分比。观察值可能落到例如四个桶中。例如,结果“-1”指示系统不能净化该域,并且该值不包含数字信息。结果“-2”例如指示系统不能净化该域,并且发现具有无法识别的量度单位的数值。结果“-3”例如指示该域被净化,但是得到的数值在可接受范围之外。结果“值”例如指示该域被净化为数值,该数值按照为该观察结果定义的标准量度单位来表示。
接下来,在步骤250,根据需要提炼控制信息(范围、附加量度单位等),并且测试重新运行。在步骤260,一旦控制信息被充分定义,则将数据加载到观察事实表中。
图3示出了根据本发明实施例的用于处理医疗数据和所使用的指示的数据处理系统300。系统300包括数据源310、数据处理器320和输出330。数据源310、数据处理器320和输出330可以经由互连数据源310、数据处理器320和输出330中的一个或多个的有线或无线连接进行通信。数据源310、数据处理器320和/或输出330可以被实施为分离的单元和/或被以各种组合形式组合。例如,计算机可以装载(house)数据源310,数据处理器320和输出330。
数据源310包括诸如病案(电子的或具有OCR的纸张)、文本文件或其它医疗数据的数据。数据处理器320是从数据源310接收数据的软件和/或硬件处理单元。数据处理器320分析数据,并且可以将数据解构成段(segment)或“块”(chucks)。然后,数据处理器320根据例如词典和/或规则或标准集来解析、净化或以其它方式处理整体或部分数据。数据处理器320可以根据来自软件程序和/或来自用户的指令处理数据。例如,技术员可以将数据处理器320配置成解析数据中的sig。可替代地,或者附加地,技术员可以将数据处理器320配置成解析数据中的观察值。在一个实施例中,数据处理器320包括将与被解析的数据相关联的标识符或值的库。该库可以例如由用户和/或软件更新来更新。
在数据处理器320对来自数据源310的数据进行了处理之后,数据处理器320将处理后的数据发送到输出330。输出330可以包括例如打印机、存储器和/或其它传输或存储设备。输出330可以存储处理后的数据(例如存储在电子病案数据库中),和/或可以生成例如打印的输出(例如处方)。
因此,特定实施例提供了用于在临床信息系统中解析数据的系统和方法。特定实施例将数据转换成可由临床信息系统使用以进行例如报告、处理、和临床诊断/治疗的格式。词汇表可以被用于将文本串转换成概念。可以从数据中清除(cleanse)受保护的健康信息。词可以被映射到语义上一致的概念。可以使用概念而不是例如原始数据来去除垃圾数据。
特定实施例将sig翻译成有意义的数字或事实。字符串被解析和分解成多个部分(parts)。识别具有数字意义的字符串的组成部分。然后,将字符串的组成部分重组,以概括该sig。因此,用药指导和处方指示可以被解释。
特定实施例进行从自然语言到没有受保护信息的临床概念的翻译。特定实施例提供用于翻译的自动化系统。例如,该系统可以评价病人的主要病症,然后将该病症与医学概念进行匹配,以使处理和解释更加容易。
特定实施例净化医疗数据,以将自由格式的观察值域转换成数值。特定实施例定义观察项词汇表,以用于将观察值语言净化为用于报告的观察项。特定实施例比较原始字符串和净化后的字符串,以确保在将数据加载到观察事实表中之前,信息被充分定义。因此,自由形式的文本串可以被映射到特定值或一组特定值。对自由形式的文本值进行处理,以便从自由形式的字符串中提取更多定义的信息。
尽管已经参照特定实施例对本发明进行了描述,但是本领域技术人员将会理解,在不脱离本发明的范围的前提下,可以进行各种改变和等效替换。此外,可以对本发明的教导进行许多改变,以适应具体的情况或素材,这不会脱离本发明的范围。因此,本发明并非意图被限制于所公开的具体实施例,而是,本发明将包括落在所附权利要求书范围内的所有实施例。

Claims (20)

1.一种用于处理用药医嘱中的重要指示的改进的方法,所述方法包括:
访问医疗数据;
从该医疗数据中提取至少一个包含重要指示的文本串;以及
解析所述至少一个文本串,以将至少一个标识符与所述至少一个文本串中的每一个相关联。
2.如权利要求1所述的方法,还包括将所述至少一个文本串解构成用于所述至少一个文本串中的每一个的多个子串。
3.如权利要求2所述的方法,其中,所述解析的步骤还包括将标识符与每个子串相关联。
4.如权利要求1所述的方法,其中,所述解析的步骤还包括,检查所述至少一个文本串,以将所述至少一个标识符与所述至少一个文本串中的每一个相关联。
5.如权利要求4所述的方法,其中,用户和软件程序中的至少一个检查所述至少一个文本串,以将所述至少一个标识符与所述至少一个文本串中的每一个相关联。
6.如权利要求1所述的方法,其中,所述至少一个标识符包括数值。
7.一种用于处理医疗数据的改进的方法,所述方法包括:
识别医疗数据中的文本串;
将所述文本串与来自库中的标准化标识符相关联;以及
输出所述与文本串相关联的标准化标识符。
8.如权利要求7所述的方法,其中,所述输出的步骤包括打印包括所述与文本串相关联的标准化标识符的报告或医嘱中的至少一个。
9.如权利要求7所述的方法,其中,所述输出的步骤包括存储包括所述与文本串相关联的标准化标识符的报告或医嘱中的至少一个。
10.如权利要求7所述的方法,还包括对所述库进行修改以容纳所述文本串。
11.如权利要求7所述的方法,其中用户和软件程序中的至少一个检查所述文本串,以将标准化标识符与所述文本串相关联。
12.如权利要求7所述的方法,还包括将所述文本串解构成多个子串。
13.如权利要求12所述的方法,其中,所述关联的步骤还包括将标准化标识符与每个子串相关联。
14.如权利要求7所述的方法,其中,所述标准化标识符包括数值。
15.如权利要求7所述的方法,其中,所述文本串包括重要的用药指导。
16.一种用于处理用药指导的系统,所述系统包括:
数据源,包括医疗数据;以及
数据处理器,其从所述数据源接收数据,并根据词典处理该数据,其中,所述数据处理器将该数据解构成段并解析所述段。
17.如权利要求16所述的系统,其中,所述医疗数据包括用药指导。
18.如权利要求16所述的系统,其中,所述数据处理器将所述数据解构成重要指示,并解析该重要指示。
19.如权利要求16所述的系统,其中,所述数据处理器将数字标识符与每一个所述段相关联。
20.一种计算机可读存储介质,其包括一组用于计算机的指令,所述一组指令包括:
提取例程,其从医疗指示中提取至少一个包含重要指示的字母数字串;以及
解析例程,其解析所述至少一个字母数字串,以将至少一个标识符与所述至少一个字母数字串中的每一个相关联。
CNA2006800215454A 2005-04-15 2006-04-12 用于解析医疗数据的系统和方法 Pending CN101198952A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/107,695 2005-04-15
US11/107,695 US7657521B2 (en) 2005-04-15 2005-04-15 System and method for parsing medical data

Publications (1)

Publication Number Publication Date
CN101198952A true CN101198952A (zh) 2008-06-11

Family

ID=37024574

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800215454A Pending CN101198952A (zh) 2005-04-15 2006-04-12 用于解析医疗数据的系统和方法

Country Status (7)

Country Link
US (1) US7657521B2 (zh)
EP (1) EP1875382A2 (zh)
JP (1) JP2008537227A (zh)
KR (1) KR20070120152A (zh)
CN (1) CN101198952A (zh)
IL (1) IL186516A0 (zh)
WO (1) WO2006113298A2 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104011711A (zh) * 2011-12-27 2014-08-27 皇家飞利浦有限公司 文本分析系统
CN105868526A (zh) * 2016-02-24 2016-08-17 上海市儿童医院 基于鲁棒张量保持的儿童社区获得性肺炎数据处理系统及方法
CN108320781A (zh) * 2018-03-15 2018-07-24 安徽科大讯飞医疗信息技术有限公司 一种基于语音的医疗报告生成方法及装置
US20200381127A1 (en) * 2006-02-13 2020-12-03 David G. Silverman Method and system for assessing, quantifying, coding & communicating patient's health and perioperative risk
CN113348515A (zh) * 2018-11-26 2021-09-03 阿尔戈泰克系统有限公司 用于匹配放射报告中的医学概念的系统和方法

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7533089B2 (en) * 2006-06-27 2009-05-12 International Business Machines Corporation Hybrid approach for query recommendation in conversation systems
JP2010504129A (ja) * 2006-09-22 2010-02-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 肺結節の高度コンピュータ支援診断
US7844609B2 (en) 2007-03-16 2010-11-30 Expanse Networks, Inc. Attribute combination discovery
JP5154832B2 (ja) * 2007-04-27 2013-02-27 株式会社日立製作所 文書検索システム及び文書検索方法
US20090043752A1 (en) 2007-08-08 2009-02-12 Expanse Networks, Inc. Predicting Side Effect Attributes
US7979288B2 (en) * 2007-10-12 2011-07-12 Southwest Research Institute Automated interpretation of medical prescription text
US7953746B1 (en) 2007-12-07 2011-05-31 Google Inc. Contextual query revision
US9864838B2 (en) * 2008-02-20 2018-01-09 Medicomp Systems, Inc. Clinically intelligent parsing
US7917438B2 (en) * 2008-09-10 2011-03-29 Expanse Networks, Inc. System for secure mobile healthcare selection
US8200509B2 (en) 2008-09-10 2012-06-12 Expanse Networks, Inc. Masked data record access
US20100082371A1 (en) * 2008-10-01 2010-04-01 General Electric Company, A New York Corporation Patient Document Privacy And Disclosure Engine
US8554579B2 (en) 2008-10-13 2013-10-08 Fht, Inc. Management, reporting and benchmarking of medication preparation
US8108406B2 (en) 2008-12-30 2012-01-31 Expanse Networks, Inc. Pangenetic web user behavior prediction system
US8386519B2 (en) 2008-12-30 2013-02-26 Expanse Networks, Inc. Pangenetic web item recommendation system
US8255403B2 (en) 2008-12-30 2012-08-28 Expanse Networks, Inc. Pangenetic web satisfaction prediction system
EP3276526A1 (en) 2008-12-31 2018-01-31 23Andme, Inc. Finding relatives in a database
US8751495B2 (en) * 2009-09-29 2014-06-10 Siemens Medical Solutions Usa, Inc. Automated patient/document identification and categorization for medical data
WO2011143405A1 (en) * 2010-05-12 2011-11-17 The General Hospital Corporation System and method for queried patient abstract
US9767095B2 (en) * 2010-05-21 2017-09-19 Western Standard Publishing Company, Inc. Apparatus, system, and method for computer aided translation
WO2013010096A1 (en) * 2011-07-13 2013-01-17 Mastercard International, Inc. Merchant data cleansing in clearing record
WO2013112894A1 (en) * 2012-01-27 2013-08-01 The Regents Of The University Of California Methods and systems for managing patient data
US10380320B2 (en) * 2012-02-03 2019-08-13 Passport Health Communications, Inc. Data restructuring for consistent formatting
US8935155B2 (en) * 2012-09-14 2015-01-13 Siemens Aktiengesellschaft Method for processing medical reports
CA2889352C (en) 2012-10-26 2021-12-07 Baxter Corporation Englewood Improved work station for medical dose preparation system
EP3346444B1 (en) 2012-10-26 2020-09-23 Baxter Corporation Englewood Improved image acquisition for medical dose preparation system
US9324111B2 (en) 2012-12-07 2016-04-26 Passport Health Communications, Inc. 271 embedded alerts
GB2518192A (en) * 2013-09-13 2015-03-18 Vivago Oy An arrangement and a method for creating a synthesis from numerical data and textual information
US10311536B1 (en) * 2014-02-27 2019-06-04 Walgreen Co. System and method for automating pharmacy processing of electronic prescriptions
US10515138B2 (en) 2014-04-25 2019-12-24 Mayo Foundation For Medical Education And Research Enhancing reading accuracy, efficiency and retention
JP2015219726A (ja) * 2014-05-16 2015-12-07 シャープ株式会社 情報処理装置、情報処理システム、情報処理方法および情報処理プログラム
US11043291B2 (en) 2014-05-30 2021-06-22 International Business Machines Corporation Stream based named entity recognition
US11107574B2 (en) 2014-09-30 2021-08-31 Baxter Corporation Englewood Management of medication preparation with formulary management
WO2016058138A1 (en) * 2014-10-15 2016-04-21 Microsoft Technology Licensing, Llc Construction of lexicon for selected context
US20160117472A1 (en) * 2014-10-24 2016-04-28 Baxter Corporation Englewood Automated exchange of healthcare information for fulfillment of medication doses
SG11201704359VA (en) 2014-12-05 2017-06-29 Baxter Corp Englewood Dose preparation data analytics
SG10202107686XA (en) 2015-03-03 2021-08-30 Baxter Corp Englewood Pharmacy workflow management with integrated alerts
US20160292456A1 (en) * 2015-04-01 2016-10-06 Abbvie Inc. Systems and methods for generating longitudinal data profiles from multiple data sources
US10402435B2 (en) * 2015-06-30 2019-09-03 Microsoft Technology Licensing, Llc Utilizing semantic hierarchies to process free-form text
US10224026B2 (en) * 2016-03-15 2019-03-05 Sony Corporation Electronic device, system, method and computer program
US10679008B2 (en) * 2016-12-16 2020-06-09 Microsoft Technology Licensing, Llc Knowledge base for analysis of text
US10176889B2 (en) 2017-02-09 2019-01-08 International Business Machines Corporation Segmenting and interpreting a document, and relocating document fragments to corresponding sections
US10169325B2 (en) 2017-02-09 2019-01-01 International Business Machines Corporation Segmenting and interpreting a document, and relocating document fragments to corresponding sections
DK3655778T3 (da) * 2017-07-21 2023-07-31 Fundacio Hospital Univ Vall D Hebron Institut De Recerca Agrin som en markør for endometriecancer
US11055490B2 (en) 2019-01-22 2021-07-06 Optum, Inc. Predictive natural language processing using semantic feature extraction
US12009091B2 (en) * 2019-05-03 2024-06-11 Walmart Apollo, Llc Pharmacy SIG codes auto-populating system
US11495337B1 (en) 2019-12-12 2022-11-08 Allscripts Software, Llc Computing system for full textual search of a patient record
US12009109B2 (en) * 2019-12-18 2024-06-11 Optimdosing Llc Smart dosing for cancer therapy
WO2021152022A1 (en) * 2020-01-30 2021-08-05 Medicus Ai Gmbh System and method for processing measurement data
KR102386414B1 (ko) * 2020-11-10 2022-04-15 이희영 임상시험의 위반사항 보고 장치 및 방법
US20220261538A1 (en) * 2021-02-17 2022-08-18 Inteliquet, Inc. Skipping natural language processor
CN112800187B (zh) * 2021-04-14 2021-06-29 北京金山云网络技术有限公司 数据映射方法、医学文本数据映射方法、装置及电子设备

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4918604A (en) * 1988-10-03 1990-04-17 Medco Containment Services, Inc. Prescription drug depiction and labeling system
WO1995000914A1 (en) 1993-06-28 1995-01-05 Scott & White Memorial Hospital And Scott, Sherwood And Brindley Foundation Electronic medical record using text database
JP3445394B2 (ja) * 1993-12-17 2003-09-08 ゼロックス・コーポレーション 少なくとも二つのイメージセクションの比較方法
US5664109A (en) * 1995-06-07 1997-09-02 E-Systems, Inc. Method for extracting pre-defined data items from medical service records generated by health care providers
US6182029B1 (en) * 1996-10-28 2001-01-30 The Trustees Of Columbia University In The City Of New York System and method for language extraction and encoding utilizing the parsing of text data in accordance with domain parameters
US6082776A (en) * 1997-05-07 2000-07-04 Feinberg; Lawrence E. Storing personal medical information
US6137911A (en) * 1997-06-16 2000-10-24 The Dialog Corporation Plc Test classification system and method
US6292771B1 (en) * 1997-09-30 2001-09-18 Ihc Health Services, Inc. Probabilistic method for natural language processing and for encoding free-text data into a medical database by utilizing a Bayesian network to perform spell checking of words
US6128620A (en) * 1999-02-02 2000-10-03 Lemed Inc Medical database for litigation
US6633819B2 (en) * 1999-04-15 2003-10-14 The Trustees Of Columbia University In The City Of New York Gene discovery through comparisons of networks of structural and functional relationships among known genes and proteins
US6542902B2 (en) * 2000-03-24 2003-04-01 Bridge Medical, Inc. Method and apparatus for displaying medication information
US20020073138A1 (en) * 2000-12-08 2002-06-13 Gilbert Eric S. De-identification and linkage of data records
US20020082868A1 (en) * 2000-12-27 2002-06-27 Pories Walter J. Systems, methods and computer program products for creating and maintaining electronic medical records
US6889190B2 (en) * 2001-01-25 2005-05-03 Rodan Enterprises, Llc Hand held medical prescription transcriber and printer unit
WO2003040878A2 (en) * 2001-11-02 2003-05-15 Siemens Medical Solutions Usa, Inc. Patient data mining for clinical trials
US20030105638A1 (en) * 2001-11-27 2003-06-05 Taira Rick K. Method and system for creating computer-understandable structured medical data from natural language reports
US7257531B2 (en) * 2002-04-19 2007-08-14 Medcom Information Systems, Inc. Speech to text system using controlled vocabulary indices
US7606722B2 (en) * 2002-10-08 2009-10-20 Omnicare, Inc. Method for assimilating and using pharmacy data
US20040122787A1 (en) * 2002-12-18 2004-06-24 Avinash Gopal B. Enhanced computer-assisted medical data processing system and method
US20050234740A1 (en) * 2003-06-25 2005-10-20 Sriram Krishnan Business methods and systems for providing healthcare management and decision support services using structured clinical information extracted from healthcare provider data
US7478033B2 (en) * 2004-03-16 2009-01-13 Google Inc. Systems and methods for translating Chinese pinyin to Chinese characters
US7783476B2 (en) * 2004-05-05 2010-08-24 Microsoft Corporation Word extraction method and system for use in word-breaking using statistical information

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200381127A1 (en) * 2006-02-13 2020-12-03 David G. Silverman Method and system for assessing, quantifying, coding & communicating patient's health and perioperative risk
US11694812B2 (en) * 2006-02-13 2023-07-04 David G. Silverman Method and system for assessing, quantifying, coding and communicating patient's health and perioperative risk
CN104011711A (zh) * 2011-12-27 2014-08-27 皇家飞利浦有限公司 文本分析系统
CN105868526A (zh) * 2016-02-24 2016-08-17 上海市儿童医院 基于鲁棒张量保持的儿童社区获得性肺炎数据处理系统及方法
CN105868526B (zh) * 2016-02-24 2018-05-08 上海市儿童医院 基于鲁棒张量保持的儿童社区获得性肺炎数据处理系统及方法
CN108320781A (zh) * 2018-03-15 2018-07-24 安徽科大讯飞医疗信息技术有限公司 一种基于语音的医疗报告生成方法及装置
CN108320781B (zh) * 2018-03-15 2022-05-06 中国人民解放军总医院 一种基于语音的医疗报告生成方法及装置
CN113348515A (zh) * 2018-11-26 2021-09-03 阿尔戈泰克系统有限公司 用于匹配放射报告中的医学概念的系统和方法

Also Published As

Publication number Publication date
EP1875382A2 (en) 2008-01-09
KR20070120152A (ko) 2007-12-21
IL186516A0 (en) 2008-01-20
WO2006113298A3 (en) 2007-02-22
WO2006113298A2 (en) 2006-10-26
US20060235881A1 (en) 2006-10-19
US7657521B2 (en) 2010-02-02
JP2008537227A (ja) 2008-09-11

Similar Documents

Publication Publication Date Title
CN101198952A (zh) 用于解析医疗数据的系统和方法
CN111986770B (zh) 药方用药审核方法、装置、设备及存储介质
CN110827941B (zh) 电子病历信息校正方法及系统
Zhou et al. Using Medical Text Extraction, Reasoning and Mapping System (MTERMS) to process medication information in outpatient clinical notes
US9230061B2 (en) System and method for text extraction and contextual decision support
US20070143273A1 (en) Search engine with increased performance and specificity
EP3210140A1 (en) Identification of codable sections in medical documents
CN113345545B (zh) 临床数据的稽查方法、装置、电子设备及可读存储介质
Erraguntla et al. Inference of missing ICD 9 codes using text mining and nearest neighbor techniques
CN108170677B (zh) 一种医疗术语抽取方法及装置
JP4955197B2 (ja) レセプトファイル生成システム
JP2017134694A (ja) 属性付与制御プログラム、情報処理装置および属性付与制御方法
Banach et al. APERITIF–automatic patient recruiting for clinical trials based on HL7 FHIR
Deléger et al. Extracting medication information from French clinical texts
Nair et al. Automated clinical concept-value pair extraction from discharge summary of pituitary adenoma patients
Lacroix-Hugues et al. Creation of the first french database in primary care using the icpc2: Feasibility study
Zhang et al. Longitudinal analysis of new information types in clinical notes
CN115938608A (zh) 一种基于提示学习模型的临床决策预警的方法和系统
JP2017134693A (ja) 意味情報登録支援プログラム、情報処理装置および意味情報登録支援方法
John et al. Medication recommendation system based on clinical documents
Bhatia et al. Extracting information for generating a diabetes report card from free text in physicians notes
JP5499835B2 (ja) 医療介護インシデント情報管理プログラム、該装置及び該方法
Baldwin Evaluating healthcare quality using natural language processing
CN114155968A (zh) 一种建立映射关系的方法、手术操作的审核方法及设备
Shah-Mohammadi et al. Comparison of ACM and CLAMP for Entity Extraction in Clinical Notes

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080611