CN107408156A - 用于从临床文档进行语义搜索和提取相关概念的系统和方法 - Google Patents

用于从临床文档进行语义搜索和提取相关概念的系统和方法 Download PDF

Info

Publication number
CN107408156A
CN107408156A CN201680014595.3A CN201680014595A CN107408156A CN 107408156 A CN107408156 A CN 107408156A CN 201680014595 A CN201680014595 A CN 201680014595A CN 107408156 A CN107408156 A CN 107408156A
Authority
CN
China
Prior art keywords
concept
clinical
keyword
semantic
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680014595.3A
Other languages
English (en)
Other versions
CN107408156B (zh
Inventor
O·F·法里
朱娴淑
J·刘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN107408156A publication Critical patent/CN107408156A/zh
Application granted granted Critical
Publication of CN107408156B publication Critical patent/CN107408156B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/60ICT specially adapted for the handling or processing of medical references relating to pathologies

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

当基于其语义意义来执行针对相关的临床概念的语义搜索时,语义搜索引擎框架采用接收关键词搜索信息(14)的客户网络界面(12)(例如浏览器)和与语义分析引擎(18)通信的网络服务器(16)。自然语言处理(NLP)引擎(服务器)(22)接收并存储临床注释和信息(24),从临床注释提取临床概念并将其存储在NoSQL数据库(26)中。NLP引擎将非结构化自由文本注释转换为结构化的可操作数据。语义分析引擎分析用户输入的关键词,将其映射到UMLS概念,并且基于一个或多个关系知识源来识别相关的概念。网络服务器在NoSQL数据库中搜索相关的概念ID,并返回相关注释和概念的列表(28),以供用户显示和选择。

Description

用于从临床文档进行语义搜索和提取相关概念的系统和方法
技术领域
本发明具体应用于患者医疗保健数据系统和方法中。然而,应当理解,所描述的技术也可以应用于其他文档管理系统、其他数据管理技术等。
背景技术
随着越来越多的患者健康记录变为数字化,已经对临床概念提取做了大量工作,临床概念提取将临床记录映射到统一的医学术语,诸如UMLS、SNOMED-CT。这样的工作将非结构化自由文本临床记录转换成结构化的编码的格式,其更适合进一步的信息检索,包括搜索功能。当前的临床搜索引擎主要是基于简单的关键词匹配。
在过去的几十年中,学术界和工业界内的临床研究兴趣越来越集中于提取重要的患者细节,例如来自临床文档的发现和问题,从而朝向改进患者护理的质量。这些临床文档主要包括自由文本(叙述),其提供超过和高于结构化备选(诸如实验室数据和生命体征)的重要信息。然而,这些文档常常会在广泛的时段上突出显示患者的医疗保健使用,并且包含大量的信息,其可以超出阅读和使用文档的医疗保健提供者的认知能力。采用用于从临床文档提取信息的各种NLP技术的著名项目包括医学语言提取和编码系统(MEDLEE)和MetaMap,其已经被用于将临床和生物医学文本内的概念映射到统一医学语言系统(UMLS)。此外,共享的任务和挑战,例如整合生物学和床边(i2b2)挑战的信息学通过提供对针对临床领域的在其他情况下昂贵的注释语料库的访问来促进与临床概念提取相关的各种NLP任务。不管在针对旨在编制整个临床文档并检索特定的患者信息(例如检测急性呼吸道感染)的临床NLP的模块上的若干同行查看的文献,集中于将NLP技术应用于优化远程医疗相关的工作流程内的临床文档的使用的项目尚未严谨地被探索。远程医疗领域的相关工作提出了虚拟网络,其使用NLP来检索巴基斯坦医疗保健系统内的朝向对患者询问的临床决策支持的体征和症状。然而,该虚拟网络并不关注与临床医师(特别是护士和医师)对自由文本临床文档的消费有关的工作流优化。
常规工作流程优化方法涉及临床医师手动从电子健康记录(EHR)系统(例如EPIC,Cerner等)内的临床文档检索活动(未解决)的诊断。与手动检索活动诊断相关联的信息过载和认知负担常常使临床医师的工作流程复杂化,其中,产生的复杂性导致次优信息综合;来自对调查进行重新排序以评价先前可能己经记录的诊断的增加的医疗保健成本;以及由于尚未检索但是可用的患者数据的增加的临床护理中的错误风险。
不管过去几年中语义搜索技术(例如综合的基于领域的本体论、信息提取方法和推理引擎)的成熟,临床信息学行业尚未产生提供语义搜索功能以支持日常医疗保健任务和临床研究的公知的信息检索应用。已经使用具有临床领域的显著覆盖的知识资源(如统一医学语言系统(UMLS))来降低临床概念的复杂性并且基于语义类型来对这些概念进行归类。然而,仍然需要进行许多工作来有效地利用嵌入在这些知识源中的关系来促进上下文感知的患者信息的导航和面向研究的查看。
在放射学领域,称为Nuance PowerScribe的语音识别和听写软件提供了MontageTM插件,其实现患者信息的搜索驱动的分析以支持质量评价。然而,该插件不提供很多所需要的上下文感知的、语义相关的搜索结果,其在放射学领域之内和之外两者对于大量的自由文本患者报告的导航和面向研究的查看有用。
本申请提供了新的和改进的系统和方法,其有助于从电子临床文档自动提取活动诊断,从而克服了上述问题和其他问题。
发明内容
根据一个方面,一种便于基于关键词的语义意义来使用用户输入的关键词搜索相关的临床概念的系统,包括:客户网络(web)界面,其接收关键词搜索信息;以及语义分析引擎,其经由网络服务器接收所述关键词搜索信息并且经由MySQLTM数据库与自然语言处理(NLP)引擎进行通信。所述NLP引擎接收并存储临床注释和信息并且从所述临床注释提取临床概念,并将所述临床概念存储到NoSQL数据库中。所述语义分析引擎分析所述关键词搜索信息,将关键词映射到至少一个UMLS概念,基于一个或多个关系知识源来识别和检索一个或多个相关的概念。所述网络服务器在所述NoSQL数据库中搜索所述相关的概念,并且将相关注释和概念的列表返回到所述网络服务器,以用于经由所述客户网络界面显示给用户。
根据另一方面,一种从电子临床文档自动提取活动诊断的方法,包括:接收在患者护理期间生成的自由文本电子文档;识别具有活动诊断的文档部分;识别所识别的部分内的至少一个名词短语(NP)终端;并且根据每个NP终端生成双联词的集合。所述方法还包括:使用所述双联词来查询数据库;基于级联的字符来识别候选活动诊断;基于句法、语义和层级特征来选择与所述NP终端最相似的候选活动诊断;并且呈现从所述自由文本文档提取的活动诊断的列表。此外,所述方法还包括分析与在所述NP终端内识别的概念内的词语的分级树相比较的表示与每个候选活动诊断内的词语相关联的关系的分级树,以评价给定的活动诊断与NP终端概念之间的语义相关性。
根据另一方面,一种便于基于关键词的语义意义来呈现与用户输入的关键词有关的临床概念的图形用户界面,包括:关键词字段,用户经由所述关键词字段输入或选择一个或多个关键词;结果面板,其显示与一个或多个关键词在语义上有关的突出显示的标注的临床概念的列表;以及本体面板,其显示针对用户选定的临床概念的本体派生的树。所述图形用户界面还包括:一个或多个可展开和可折叠的报告部分,其在被展开时向用户提供针对与所述用户选定的临床概念相关联的完整临床报告的可选择链接。
在阅读和理解了下面的详细描述之后,本领域普通技术人员将认识到本创新的另外的优点。
附图说明
本专利或申请文件包含以颜色运行的至少一个绘图。具有彩色绘图的本专利或专利申请公开的副本将在要求并支付必要的费用后由专利局提供。
附图的目的仅在于图示各个方面,而不应解释为构成限制。
图1图示了根据本文中描述的一个或多个方面的、允许用户(例如,临床医师)基于其语义意义来搜索相关临床概念的语义搜索框架或系统。
图2是根据本文描述的一个或多个方面的语义分析引擎的图示。
图3示出了根据本文中所描述的一个或多个特征的关系发现算法流的范例。
图4示出了根据本文中描述的一个或多个特征的NoSQL数据库图解。
图5图示了根据本文中所描述的一个或多个特征的、用于从临床文档提取活动诊断的系统。
图6示出了根据本文中所描述的一个或多个特征的、从临床文档中提取活动诊断的过程流。
图7示出了根据本文所述的一个或多个特征的、例如被显示给临床医师的用于急性冠状动脉综合征的SNOMED CT树。
图8是示出输入文本框的用户界面的屏幕截图,其中,用户可以输入关键词。
图9是根据本文中所描述的各个方面的、基于网络的用户界面的屏幕截图,其示出突出显示语义地相关的临床概念的搜索结果。
图10是基于网络的用户界面的本体面板的屏幕截图,其示出用户选定的临床概念、颜色编码的图例,以及示出用户选择的概念的本体派生的树。
图11是基于网络的用户界面的屏幕截图,其示出了折叠的报告部分和展开的报告部分。
图12示出了基于网络的用户界面的屏幕截图,其中,显示了具有突出显示的临床概念的完整临床报告。
具体实施方式
所描述的系统和方法通过提供与简单关键词匹配相比较在语义意义上相关的搜索结果扩展传统搜索引擎的功能来克服上述问题。在临床领域中使用语义搜索系统有助于以更有信息和高效的方式提供患者护理。本文中描述的搜索框架中的语义分析引擎使得医师能够一眼就能发现不明显的相关诊断。通过在系统中使用NoSQL数据库(例如MongoDBTM),实现了大规模的基于群体的分析。所描述的系统和方法支持医疗保健提供者、管理人员和研究人员对患者信息的系统性综合,以允许对医疗保健使用和质量进行有效的基于个体患者的和群体的分析。
语义搜索系统有助于将用户输入的关键词自动校正为最合适的临床概念,同时基于特定的医学术语(例如,UMLS、SNOMED-CT、FMA等)有效地分析和识别与语义相关的概念。还提供了使用FMA(解剖本体的基础模型)的与SNOMED术语之间的自动映射。此外,所述系统是可缩放的:在一个实施例中,所述系统使用例如Django框架来构建,并且可以通过使用MongoDBTM来进行缩放。
从在患者护理期间生成的临床文档的有效信息综合取决于多任务医疗保健提供者执行的复杂认知过程。临床文档主要包括自由文本(叙述)条目,其提供超过和高于结构化备选(如实验室数据和生命体征)的重要信息。然而,这些文档通常会在广泛的时段上突出显示患者的医疗保健使用,并且包含大量的信息,其可以超出阅读和使用文档的医疗保健提供者的认知能力。例如,当使用飞利浦IntelliSpaceeCareManager(eCM)(用于在监测病危患者中使用的商业远程医疗平台)时,护士和医师需要在其查看从各种电子健康记录(EHR)系统(诸如EPIC、Cerner等)检索的患者临床文档之后记录活动(未解决)诊断。与手动检索活动诊断相关联的信息过载和认知负担往往使临床护理工作流程复杂化。这种工作流程复杂性继而可以导致不准确的信息综合,由于对调查进行重新排序以评价由临床医师在文档中未检测到的先前记录的诊断的增加的成本,以及最终在患者管理中的不小的错误。因此,所描述的系统和方法提供了一种应用,其使用自然语言处理(NLP)技术来自动从与eCM应用集成的临床文档提取活动诊断,从而优化整体临床护理工作流程并最小化危重患者护理期间的信息综合中的错误的可能性。以这种方式,临床医师被更好地装备以关于查看临床文档来识别活动诊断改进他们的工作流程效率,最小化针对检索和记录活动诊断中的错误的风险,并且改进对准确的诊断信息的访问以用于更好的患者护理。
所描述的语义搜索系统的实施方式旨在提供优于和高于简单的基于语法的字符串匹配搜索功能的输出的来自大量的领域特异的文档的更多的上下文相关的结果。在临床领域内对语义搜索系统的使用有助于针对患者护理所必要的上下文感知的患者信息的改进的综合。作为飞利浦本土临床语义搜索平台(ICON语义搜索殷勤)的前端,提供了一种以用户为中心的基于网络的界面,其用于支持对语义搜索结果进行高效的导航和基于研究的查看。所述用户界面支持医疗保健提供者、管理人员和研究人员对患者信息的系统性综合,以对医疗保健使用和质量进行有效的基于个体患者的和群体的分析。
鉴于提供语义搜索功能以支持日常医疗保健任务和临床研究的信息检索应用的目前的稀缺性,所描述的基于网络的界面工具允许临床医师用户有效和准确地检索与语义相关的概念,这可能得到以前未被发现的患者群体内展示的临床关联的证据。界面还便于容易地识别可以针对研究和临床试验通知患者样本选择的临床表现,并且有效地导航到包含与其搜索兴趣相关的上下文信息的自由文本报告内的部分和子部分。
图1图示了根据本文中描述的一个或多个方面的、允许用户(例如,临床医师)基于其语义意义来搜索相关临床概念的语义搜索框架或系统10。ICON语义搜索引擎框架包括客户网络接口12(例如,浏览器),网络接口12接收关键词搜索信息14,并且被耦合到提供与语义分析引擎18的连接和/或通信的网络服务器16。语义分析引擎与MySQLTM数据库20通信,MySQLTM数据库20继而与接收并存储临床注释和信息24的ICON自然语言处理(NLP)引擎(服务器)22进行通信。ICON NLP引擎22还与NoSQL数据库(MongoDBTM)26通信,NoSQL数据库26也与网络服务器16通信。
ICON NLP引擎22从临床注释24提取临床概念,并将它们存储到NoSQL数据库26中。由ICON NLP引擎提取的临床概念可以包括但不限于,诊断、发现、流程等。ICON引擎将非结构化自由文本注释转换为结构化可操作数据。结构化数据成为用于由语义分析引擎18进一步处理的分析的单位。
框架10的数据库部件包括两种类型的数据库:MySQLTM数据库20和NoSQL数据库26。MySQLTM数据库用作针对分析引擎和ICON引擎的知识源,以支持映射和关系提取。NoSQL数据库用于存储来自ICON引擎的输出,其是从临床记录提取的结构化信息。NoSQL数据库(MongoDBTM)被用作数据库引擎。NoSQL数据库解决了常规关系数据库的缺点,并且被广泛用于“大数据”和实时网络应用中。它们确保了系统的最优可扩缩性。
网络界面12提供了一种用户友好的类似搜索引擎的界面,其允许用户通过输入关键词14来搜索临床注释。具有突出显示的关键概念的相关注释被列为搜索结果。用户能够点击每个概念来查看不同本体内的概念的树结构。用户还能够点击和查看原始注释以进行进一步调查。
网络服务器16处理前端用户查询,例如关键词搜索,示出原始注释,示出针对概念的树结构等。
语义分析引擎18分析用户输入的关键词并将其映射到UMLS概念。然后,基于一个或多个关系知识源来识别和检索相关概念。搜索引擎10在NoSQL数据库26中搜索相关的概念ID,并返回相关注释和概念的列表28。因此,不是简单地匹配关键词,搜索引擎10实际分析关键词并理解关键词的潜在语义意义。搜索结果基于关键词的语义意义。
该系统还包括处理器30和存储器32,处理器30运行所描述的模块(例如,计算机可执行指令、例程、应用、程序等),存储器32存储用于由处理器运行的模块。将理解,处理器30运行用于执行本文中描述的各功能和/或方法的计算机可执行指令并且存储器32存储所述计算机可执行指令。存储器32可以是其上存储有控制程序的计算机可读介质,例如盘、硬盘驱动器等。计算机可读介质的常见形式包括例如软盘、柔性盘、硬盘、磁带或任何其他磁性存储介质、CD-ROM、DVD或任何其他光学介质、RAM、ROM、PROM、EPROM、FLASH-EPROM及其变型、其他存储器芯片或卡盘(cartridge)、或处理器30能够从其读取或运行的任何其他有形介质。在该上下文下,所描述的系统可以被实施于或实施为一个或多个通用计算机、(一个或多个)专用计算机、经编程的微处理器或微控制器和外围集成电路元件、ASIC或其他集成电路、数字信号处理器、诸如分立元件电路的硬连线电子器件或逻辑电路、诸如PLD、PLA、FPGA、图形处理单元(GPU)或PAL的可编程逻辑器件等。
图2是根据本文描述的一个或多个方面的语义分析引擎18的图示。根据一个实施例,用户发起关键词搜索查询。查询由网络服务器16(图1)接收并且被中继到分析引擎18。分析引擎分析关键词并将相关概念ID的集合返回给网络服务器16。由语义分析引擎执行的分析包括将关键词映射到临床概念并且识别相关概念的集合。一旦网络服务器接收到从分析引擎返回的概念ID,网络服务器使用ID来查询NoSQL数据库,并找到包括所识别的概念的相关临床注释。最终结果被显示在网络浏览器上。在一个实施例中,所述结果按时间顺序列出。
如图2中所示,用户输入的关键词52被馈送到分析引擎18中。拼写检查器模块54校正可能的拼写错误并且使用例如模糊字符串匹配算法将关键词映射到一个或多个临床概念ID 56。关系发现算法58用于针对用户想要搜索的概念来识别相关概念ID 60。拼写检查器和关系发现算法两者可以基于知识源(包括UMLS 62、FMA 64、SNOMED 66、68等)来构建。
拼写检查模块54被配置为当有一些拼写错误或词序变化时,根据词典将用户输入的关键词映射到最接近的匹配临床概念。支持拼写检查器的词典是通用英语(或任何其他语言)词典和医学词典两者的组合。医学词典包含来自UMLS、SNOMED、FMA、ICD10(国际疾病和相关健康问题统计分类,第10版)等的所有医学术语。
图3示出了根据本文中所描述的一个或多个特征的关系发现算法流58的范例。UMLS 62(统一医学语言系统)将主要术语集成到用于知识表示的单个框架中,并且包括概念库和语义网络。语义网络包括存在于概念之间的一组有用和重要的关系或语义关系102,例如,空关系、相关联、相关联的形态、相关联的流程、相关联的发现、发现位点、具有发现位点等。语义搜索的目的是找到映射到相关解剖结构的诊断、发现或流程。实现这一目标的一种方式是查询UMLS关系表,并且与上述关系相关联的概念是相关概念。如图3所示,找到相关概念的备选方式是将概念映射到FMA64并且通过查看区域和构成关系104来扩展FMA候选,然后将FMA 64映射回到SNOMED 66和68概念。针对SNOMED和FMA映射,从SNOMED关系表中针对SNOMED概念识别发现位点属性,然后从UMLS概念表针对FMA映射识别发现位点。
图4示出了根据本文中描述的一个或多个特征的NoSQL数据库图解。ICON引擎22(图1)的输出被存储在NoSQL数据库26(图1)(例如,MongoDBTM)中。信息被存储到三个不同的集合中,如图4所示:注释集合150、区段集合152和标注集合154。该结构被设计为便于快速搜索和检索。标注集合154包括多个标注156(例如,概念ID、标注类型等)以及修饰符信息158(例如,开始、结束、值等)和描述符信息160(例如,开始、结束、值等)。
图5图示了根据本文中所描述的一个或多个特征的、用于从临床文档提取活动诊断的系统200。系统200包括词汇和句法分析模块202和语义分析模块204。词汇和句法分析模块202包括段标注器模块205、标记器模块206、句子标注器模块208和名词短语标注器210。语义分析模块包括本体标注器212,概念歧义消除(disambiguator)模块214和否定检测器模块216。这些模块在诸如临床文档或注释220的输入218上一起动作,以经由多步骤标注过程从临床文档提取诊断。
文档部分标头识别由分段标注器模块205执行以识别倾向于具有与患者的诊断相关的信息的临床文档的特定部分。这些部分包括但不限于:问题列表、过去的医学史、现有疾病的历史等。针对这些部分的标头被识别,同时每部分下的段落/句子被索引以用于进一步分析。
名词短语标注器210执行名词短语(NP)识别,其中,临床文档内的句子利用对应的词性(POS)进行标记,并在语法上进行分析以识别NP。这些NP表示为最可能(即,高于预定的可能性阈值)诊断或临床发现的概念。
概念歧义消除模块214执行代码映射歧义消除,其中,临床文档内的诊断被映射到SNOMED CT(医学临床术语的系统化命名)内的相关术语,SNOMED CT是综合的和广泛使用的医疗保健术语。随后,候选术语基于其他中的某些启发式规则对候选术语进行歧义消除,以获得最佳结果。
否定检测器模块216执行否定检测,由此,基于句子级的上下文信息,确定诊断是否是否定的并且因此应该从活动诊断中排除。例如,在“没有肺炎的证据”这个短语中,“肺炎”是由陈述“没有证据”所否定的诊断。
如图5概述的,针对活动诊断提取算法的起始点是由分段标注器模块205上传和分析的自由文本临床文档(例如.xml.或.txt文档等)。针对分段标注器模块的知识源是例如SecTag术语数据库222,其是超过6000个临床文档部分标头的数据库。在相关部分标头下发现的句子是例如针对概率语法解析器(未示出)的输入,其分配POS标签并识别每个句子内的NP终端。“NP终端”指代不包含另一NP的NP;例如,如果概念中的每个词语不是独立的NP,则将“急性冠状动脉综合征”视为NP终端。
每个NP终端被用于生成查询SNOMED CT数据库的双联词。双联词通过级联在NP终端内发现的一对词语中的前3个字符来生成。例如,如果“急性冠状动脉综合症(acutecoronary syndrome)”是NP终端,则包括级联的字符“ACUCOR,ACUSYN和CORSYN”的双联词被用于查询SNOMED CT数据库以检索适当的候选术语。为了从候选SNOMED CT术语的集合中选择最合适的概念,应用以下规则。
层级相关性:描述表示诊断信息的特定层级中的活动诊断或概念的术语以特定顺序被选择。层级次序如下:障碍>>发现>>形态异常>>身体结构>>限定值。例如,当使用双联词“ACUSYN”来查询SNOMED CT数据库时,“急性冠状动脉综合征”(障碍)优于“急性胸廓切开术后疼痛综合征”(发现),尽管两个术语都出现在相同的候选集合中。
语义相似性:将表示与每个术语相关联的关系的SNOMED CT树(图7)与NP终端内的概念的进行比较,以评价它们的语义相关性。如果术语和NP终端概念在树的前五个水平处具有相同的节点(或者如果树小于五个水平深度则为所有水平),则认为它们语义相似。五个水平的阈值确保树中更深水平处的预期差异在评价语义相关性时不被强调。
使用编辑距离的字符串匹配:通过计算NP终端概念与对应的SNOMED CT术语之间的个体字符的差异,在代码映射期间考虑拼写错误和印刷错误。例如,“急性冠状综合征(acute coronry syndrome)”将在SNOMED CT中被正确地编码为“急性冠状动脉综合征(acute coronary syndrome)”。
当进行语义分析时,可以查询若干资源来协助分析。例如,一个或多个本体数据库224可以由本体标注器212查询以便于本体标注。此外,当解析概念之间的模糊性时,可以由概念歧义消除模块214查询医学首字母缩略词词典226和/或UMLS语义关系数据库228。将意识到,系统200还可以包括处理器和存储器(图5中未示出),例如处理器30和存储器32(图1),以执行本文所述的各种功能等。
图6求出了根据本文中所描述的一个或多个特征的、用于从临床文档提取活动诊断的过程流250。在252处,临床医师上传在患者护理期间生成的自由文本文档。在254处,选择具有活动诊断的文档部分。在256处,使用解析器和启发式规则的集合来识别部分内的NP终端。在258处,根据NP终端生成双联词,并且将其用于查询诸如SNOMED CT数据库的数据库260。在262处,基于根据NP终端生成的双联词来选择候选SNOMED CT术语。在264处,基于句法、语义和层级特征来选择最合适的SNOMED CT术语。在266处,验证NP终端的否定状态。在268处,从自由文本文档提取活动诊断的列表。
图7示出了根据本文所述的一个或多个特征的、例如被显示给临床医师的用于急性冠状动脉综合征的SNOMED CT树270。树270表示与每个术语相关联的关系与NP终端内的概念进行比较,以评价它们的语义相关性。
图8-12涉及图1的用户界面或浏览器12。
图8是示出输入文本框282的用户界面的屏幕截图,其中,用户可以输入关键词。随着用户键入,关键词建议284被呈现给用户进行选择。ICON语义搜索基于网络的框架被建立在Django网络应用框架上,所述框架被修改为与NoSQL数据库(例如,MongoDBTM)无缝交易,以识别和呈现由用户定义的关键词查询所驱动的语义相关的临床概念。用户在输入文本框中输入关键词。在输入(一个或多个)关键词时,表示从临床知识源导出的同义词和变型的若干相关选项被显示给用户以进行可能的选择。因此,用户可以从与输入到输入文本框中的前几个字符相关的下拉式建议中选择最合适的选项。
通过点击搜索按钮或从下拉式建议中选择选项,用户将关键词传送到ICON语义搜索引擎,以用于对表示临床报告数据库中所包含的语义相关的临床概念的上下文患者信息的分析和随后的检索。这些报告将已经由ICON语义搜索引擎预处理。在图8的范例中,用户打算键入关键词“神经鞘瘤”-人体中的外围神经的外覆盖物的良性肿瘤。当由关键词“schwa”的前几个字符的输入触发时,显示来自链接到基于网络的界面的ICON语义搜索引擎中的临床知识源的建议。
随后,在结果面板中显示部分和字部分,所述面板突出显示属于个人患者或患者群体的多个临床报告中的对应分段内识别的关键词(神经鞘瘤)和其他语义相关概念。
图9是根据本文中所描述的各个方面的、示出搜索结果的基于网络的用户界面的屏幕截图300,其突出显示语义相关的临床概念。该界面包括结果面板302,结果面板302显示在临床报告部分和子部分中的上下文,并且突出显示所述报告内的与(一个或多个)关键词语义相关的被标注的临床概念304。例如,概念“声觉神经瘤”(在连接耳朵到大脑的神经上发展的特定类型的神经鞘瘤)和垂体腺瘤(位于脑中的垂体的常见良性肿瘤)在不同的临床报告中的不同的部分内被突出显示。鉴于它们都是影响与脑相关的结构的良性肿瘤,三个概念(神经鞘瘤、声觉神经瘤和垂体腺瘤)都是语义相关的。因此,ICON语义搜索的基于网络的界面提供关于这些语义相关概念的存在的用户可操作的知识,从而潜在地通知用户进一步调查被施予以解决这些状况的临床管理的质量和最终结果。
图10是基于网络的用户界面,其示出用户选定的临床概念、颜色编码的图例354,以及示出用户选择的概念的本体派生的树的本体面板356的屏幕截图350。本体面板呈现与显示临床报告内的标注的概念有关的本体派生的语义树。除了语义关系之外,界面显示与所识别的临床概念相关联的修饰符以及语义相关的概念的否定状态。使用基于网络的界面颜色编码的图例354中提供的图例区分的修饰符和否定状态提供了进一步的上下文细节,其支持用户对与关键词搜索有关的报告中表示的临床情形的综合和理解。在点击突出显示的临床概念时,本体面板356显示与该概念有关的本体派生的树,从而提供关于定义突出显示的概念的父子关系的额外信息。
图11是基于网络的用户界面的屏幕截图400,其示出了折叠的报告部分402和展开的报告部分404。展开的报告部分404提供对完整的临床上下文的访问,以进一步查看在基于网络的界面中突出显示的语义关系,例如,经由在选定的临床报告中显示全文的超链接。界面的这一方面通过允许对包含语义相关的临床概念的部分和子部分的折叠/展开而增强了用户通过临床报告的导航。
图12示出了基于网络的用户界面的屏幕截图450,其中,显示了具有突出显示的临床概念454的完整临床报告452。基于网络的界面的该特征允许用户经由与从报告导出的上下文临床信息的对应的片段相邻的按钮来访问完整的临床报告文本。在点击该超链接按钮后,自由文本文档被显示在单独的窗口中,从而允许用户进一步查看并确认从跨各种临床报告捕获的语义相关的概念导出的他/她的假设。在图12的范例中,用户点击了具有在“临床信息”部分下输入的陈述“左侧的随访听觉神经瘤”的对应的完整临床报告。通过查看全文,用户可以查看和验证随访的发现是否揭示听觉神经瘤的改进或恶化。ICON语义搜索引擎的基于网络的界面因此提供了基于语义相关的临床概念的可操作的知识,其旨在经由在个体患者和群体水平上对临床报告的总和来通知医疗保健管理和质量的最佳评价。
已经参考若干实施例描述了本创新。在阅读和理解前述的详细描述后,本领域技术人员可以想到各种修改和变化。本创新旨在被解释为包括所有这样的修改和变化,只要它们落在权利要求或其等价方案的范围之内。

Claims (20)

1.一种便于使用用户输入的关键词来基于所述关键词的语义意义搜索相关的临床概念的系统(10),包括:
客户网络界面(12),其接收关键词搜索信息(14);
语义分析引擎(18),其经由网络服务器(16)接收所述关键词搜索信息并且经由MySQLTM数据库(20)与自然语言处理(NLP)引擎(22)进行通信;
其中,所述NLP引擎(22)接收并存储临床注释和信息(24)并且从所述临床注释(24)提取临床概念,并且将所述临床概念存储到NoSQL数据库(26)中;
其中,所述语义分析引擎(18)分析所述关键词搜索信息,将关键词映射到至少一个UMLS概念,基于一个或多个关系知识源来识别和检索一个或多个相关的概念;并且
其中,所述网络服务器(16)在所述NoSQL数据库(26)中搜索所述相关的概念,并且将相关注释和概念的列表(28)返回到所述网络服务器,以经由所述客户网络界面显示给用户。
2.根据权利要求1所述和系统,其中,所述网络服务器还被配置为经由所述客户网络界面将相关注释和概念的所述列表呈现为具有被突出显示以供用户选择的相关概念的临床注释的列表。
3.根据权利要求2所述和系统,其中,在接收到与对突出显示的概念的用户选择有关的输入时,所述网络服务器经由所述客户网络界面显示在一个或多个本体内的选定的概念的树结构。
4.根据权利要求3所述和系统,其中,所述网络服务器还被配置为经由所述客户网络界面呈现包括所述选定的概念的原始注释。
5.根据前述权利要求中的任一项所述的系统,其中,所述列表(28)以对包括所述相关概念的所述注释的创建的时间顺序布置。
6.根据前述权利要求中的任一项所述的系统,其中,所述语义分析引擎包括拼写检查器模块(54),所述拼写检查器模块检测并校正关键词信息中的拼写错误,并且将一个或多个关键词映射到一个或多个临床概念(56)。
7.根据权利要求6所述的系统,其中,拼写检查器模块通过运行模糊字符串匹配算法来将所述一个或多个关键词映射到所述一个或多个临床概念。
8.根据前述权利要求中的任一项所述的系统,还包括关系发现模块(48),所述关系发现模块被配置为识别与所述关键词信息中识别的所述概念有关的概念。
9.一种从电子临床文档自动提取活动诊断的方法,包括:
接收在患者护理期间生成的自由文本电子文档;
识别具有活动诊断的文档部分;
识别所识别的部分内的至少一个名词短语(NP)终端;
根据每个NP终端生成双联词的集合;
使用所述双联词来查询数据库(260);
基于级联的字符来识别候选活动诊断;
基于句法、语义和层级特征来选择与所述NP终端最相似的候选活动诊断;
呈现从所述自由文本文档提取的活动诊断的列表;并且
分析与在所述NP终端内识别的概念内的词语的分级树相比较的表示与每个候选活动诊断内的词语相关联的关系的分级树,以评价给定的活动诊断与NP终端概念之间的语义相关性。
10.根据权利要求9所述的方法,还包括使用概率解析器和启发式规则的集合来识别所识别的部分内的所述一个或多个NP终端。
11.根据权利要求9或10中的任一项所述的方法,其中,所述数据库(260)是SNOMED CT数据库。
12.根据权利要求9-11中的任一项所述的方法,还包括验证所述一个或多个NP终端的否定状态,使得如果所述状态由与所述一个或多个NP终端相关联的一个或多个词语否定,则将与所述一个或多个NP终端相关联的所述活动诊断从所述列表排除。
13.根据权利要求9-12中的任一项所述的方法,其中,通过将在给定的NP终端内发现的一对词语中的前3个字符进行级联来生成所述双联词。
14.根据权利要求9-13中的任一项所述的方法,其中,如果所述候选活动诊断和所述NP终端概念在所述树的前五个水平处具有相同的节点,或者在所述树小于五个水平深度时在全部水平处具有相同的节点,则所述候选活动诊断和所述NP终端概念是语义相似的。
15.根据权利要求9-14中的任一项所述的方法,其中,当选定的候选活动诊断在所述树中具有比其他候选活动诊断更多的公共节点时,所述选定的候选活动诊断和NP终端概念在语义上最相似。
16.一种便于基于关键词的语义意义来呈现与用户输入的关键词有关的临床概念的图形用户界面,包括:
关键词字段(282),用户经由所述关键词字段输入或选择一个或多个关键词(14);
结果面板(302),其显示与一个或多个关键词在语义上有关的突出显示的标注的临床概念(304)的列表;
本体面板(356),其显示针对用户选定的临床概念的本体派生的树;以及
一个或多个可展开和可折叠的报告部分(402、404),其在被展开时向用户提供针对与所述用户选定的临床概念相关联的完整临床报告的可选择链接。
17.根据权利要求16所述的图形用户界面,其中,在接收到与对突出显示的概念的用户选择有关的输入时,所述图形用户界面显示一个或多个本体内的所述选定的概念的本体派生的树。
18.根据权利要求16所述的图形用户界面,其中,所述图形用户界面还被配置为呈现包括所述选定的概念的多个原始报告。
19.根据权利要求18所述的图形用户界面,其中,所述多个原始报告以对所述报告的创建的时间顺序布置。
20.根据权利要求16所述的图形用户界面,还被配置为:
将所述一个或多个关键词发送到语义分析引擎(18),以用于将所述一个或多个关键词映射到至少一个UMLS概念并且识别一个或多个相关的概念;
从NoSQL数据库(26)接收由NLP引擎(22)从所述临床报告提取的相关的临床概念;并且
向所述用户显示所述相关的临床概念以供选择。
CN201680014595.3A 2015-03-09 2016-03-08 用于从临床文档进行语义搜索和提取相关概念的系统和方法 Active CN107408156B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562130141P 2015-03-09 2015-03-09
US62/130,141 2015-03-09
PCT/IB2016/051291 WO2016142846A1 (en) 2015-03-09 2016-03-08 Systems and methods for semantic search and extraction of related concepts from clinical documents

Publications (2)

Publication Number Publication Date
CN107408156A true CN107408156A (zh) 2017-11-28
CN107408156B CN107408156B (zh) 2022-09-20

Family

ID=55538305

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680014595.3A Active CN107408156B (zh) 2015-03-09 2016-03-08 用于从临床文档进行语义搜索和提取相关概念的系统和方法

Country Status (5)

Country Link
US (1) US11275905B2 (zh)
EP (1) EP3268879A1 (zh)
CN (1) CN107408156B (zh)
BR (1) BR112017019015A2 (zh)
WO (1) WO2016142846A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108831482A (zh) * 2018-08-24 2018-11-16 深圳市云采网络科技有限公司 一种基于语音识别搜索电子元器件的方法
CN110931084A (zh) * 2018-08-31 2020-03-27 国际商业机器公司 从非结构化文本提取和标准化突变基因用于认知搜索和分析
CN111813892A (zh) * 2019-04-11 2020-10-23 国际商业机器公司 自动生成自然语言处理盒的数据驱动方法
CN112703502A (zh) * 2018-09-18 2021-04-23 易享信息技术有限公司 使用非结构化输入更新异构数据存储
CN113348515A (zh) * 2018-11-26 2021-09-03 阿尔戈泰克系统有限公司 用于匹配放射报告中的医学概念的系统和方法
CN113688242A (zh) * 2021-08-31 2021-11-23 上海基绪康生物科技有限公司 一种通过网络搜索结果的文本分类来分类医学术语的方法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10755804B2 (en) * 2016-08-10 2020-08-25 Talix, Inc. Health information system for searching, analyzing and annotating patient data
US20200027534A1 (en) * 2016-10-17 2020-01-23 Koninklijke Philips N.V. Device, system, and method for updating problem lists
WO2018232290A1 (en) * 2017-06-16 2018-12-20 Elsevier, Inc. Systems and methods for automatically generating content summaries for topics
CN107591195B (zh) * 2017-09-07 2021-02-02 北京鑫丰南格科技股份有限公司 一种基于护理呼叫系统的医护辅助方法及装置
EP3765978A1 (en) * 2018-03-14 2021-01-20 Koninklijke Philips N.V. Identifying anatomical phrases
WO2019175404A1 (en) 2018-03-16 2019-09-19 Koninklijke Philips N.V. Method and system for generating medical image based on textual data in medical report
IL258689A (en) 2018-04-12 2018-05-31 Browarnik Abel A system and method for computerized semantic indexing and searching
US11450323B1 (en) * 2019-04-01 2022-09-20 Kaushal Shastri Semantic reporting system
US20200321087A1 (en) * 2019-04-03 2020-10-08 Moxe Health Corporation System and method for recursive medical health document retrieval and network expansion
CN110968650A (zh) * 2019-10-30 2020-04-07 清华大学 基于医生协助的医疗领域知识图谱构建方法
US11676702B2 (en) * 2019-12-16 2023-06-13 International Business Machines Corporation Method for automatic visual annotation of radiological images from patient clinical data
CN111382255B (zh) * 2020-03-17 2023-08-01 北京百度网讯科技有限公司 用于问答处理的方法、装置、设备和介质
CN112016305B (zh) * 2020-09-09 2023-03-28 平安科技(深圳)有限公司 文本纠错方法、装置、设备及存储介质
US20220091716A1 (en) * 2020-09-21 2022-03-24 Corel Corporation External content capture for visual mapping methods and systems
JP2023548962A (ja) * 2020-12-08 2023-11-21 アキーリアン システムズ リミテッド ライアビリティ カンパニー 改善された臨床医中心の臨床試験検証システムおよび方法
KR102571400B1 (ko) * 2022-09-15 2023-08-29 (주)메디아이플러스 임상시험 데이터 검색 장치 및 방법
CN117194677B (zh) * 2023-08-30 2024-04-26 武汉大学中南医院 一种临床实践指南本体的构建、扩展与评估方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059806A (zh) * 2007-06-06 2007-10-24 华东师范大学 一种基于语义的本地文档检索方法
CN101566988A (zh) * 2008-04-24 2009-10-28 华为技术有限公司 一种模糊语义搜索方法、系统及设备
CN103678642A (zh) * 2013-12-20 2014-03-26 公安部第三研究所 一种基于搜索引擎的概念语义相似度度量方法
WO2014130749A1 (en) * 2013-02-20 2014-08-28 Vitalware, Llc Ontological medical coding method, system and apparatus
US20140365210A1 (en) * 2012-08-18 2014-12-11 Health Fidelity, Inc. Systems and Methods for Processing Patient Information
CN104317867A (zh) * 2014-10-17 2015-01-28 上海交通大学 对搜索引擎返回的网页图片进行实体聚类的系统

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8612245B2 (en) * 2000-02-24 2013-12-17 Webmd Llc Personalized health history system with accommodation for consumer health terminology
US20070143273A1 (en) * 2005-12-08 2007-06-21 Knaus William A Search engine with increased performance and specificity
US20080208631A1 (en) * 2007-02-22 2008-08-28 General Electric Company Methods and systems for providing clinical documentation for a patient lifetime in a single interface
CA2716331A1 (en) * 2008-02-22 2009-08-27 Lead Horse Technologies, Inc. Automated ontology generation system and method
US8838628B2 (en) * 2009-04-24 2014-09-16 Bonnie Berger Leighton Intelligent search tool for answering clinical queries
US9665662B1 (en) * 2013-06-13 2017-05-30 DataRPM Corporation Methods and system for providing real-time business intelligence using natural language queries
US20150149461A1 (en) * 2013-11-24 2015-05-28 Interstack, Inc System and method for analyzing unstructured data on applications, devices or networks
WO2015127245A1 (en) * 2014-02-21 2015-08-27 President And Fellows Of Harvard College Methods and systems for identifying or selecting high value patients
US10311206B2 (en) * 2014-06-19 2019-06-04 International Business Machines Corporation Electronic medical record summary and presentation
US10275576B2 (en) * 2014-06-27 2019-04-30 Passport Health Communications, Inc Automatic medical coding system and method
US9690861B2 (en) * 2014-07-17 2017-06-27 International Business Machines Corporation Deep semantic search of electronic medical records
US10614196B2 (en) * 2014-08-14 2020-04-07 Accenture Global Services Limited System for automated analysis of clinical text for pharmacovigilance
KR102335784B1 (ko) * 2014-10-31 2021-12-06 아이리듬 테크놀로지스, 아이엔씨 무선 생리학적 모니터링 기기 및 시스템
US11080295B2 (en) * 2014-11-11 2021-08-03 Adobe Inc. Collecting, organizing, and searching knowledge about a dataset

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059806A (zh) * 2007-06-06 2007-10-24 华东师范大学 一种基于语义的本地文档检索方法
CN101566988A (zh) * 2008-04-24 2009-10-28 华为技术有限公司 一种模糊语义搜索方法、系统及设备
US20140365210A1 (en) * 2012-08-18 2014-12-11 Health Fidelity, Inc. Systems and Methods for Processing Patient Information
WO2014130749A1 (en) * 2013-02-20 2014-08-28 Vitalware, Llc Ontological medical coding method, system and apparatus
CN103678642A (zh) * 2013-12-20 2014-03-26 公安部第三研究所 一种基于搜索引擎的概念语义相似度度量方法
CN104317867A (zh) * 2014-10-17 2015-01-28 上海交通大学 对搜索引擎返回的网页图片进行实体聚类的系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108831482A (zh) * 2018-08-24 2018-11-16 深圳市云采网络科技有限公司 一种基于语音识别搜索电子元器件的方法
CN110931084A (zh) * 2018-08-31 2020-03-27 国际商业机器公司 从非结构化文本提取和标准化突变基因用于认知搜索和分析
CN110931084B (zh) * 2018-08-31 2024-04-16 国际商业机器公司 从非结构化文本提取和标准化突变基因用于认知搜索和分析
CN112703502A (zh) * 2018-09-18 2021-04-23 易享信息技术有限公司 使用非结构化输入更新异构数据存储
CN113348515A (zh) * 2018-11-26 2021-09-03 阿尔戈泰克系统有限公司 用于匹配放射报告中的医学概念的系统和方法
CN111813892A (zh) * 2019-04-11 2020-10-23 国际商业机器公司 自动生成自然语言处理盒的数据驱动方法
CN113688242A (zh) * 2021-08-31 2021-11-23 上海基绪康生物科技有限公司 一种通过网络搜索结果的文本分类来分类医学术语的方法

Also Published As

Publication number Publication date
BR112017019015A2 (pt) 2018-04-17
US20180068076A1 (en) 2018-03-08
WO2016142846A1 (en) 2016-09-15
US11275905B2 (en) 2022-03-15
EP3268879A1 (en) 2018-01-17
CN107408156B (zh) 2022-09-20

Similar Documents

Publication Publication Date Title
CN107408156A (zh) 用于从临床文档进行语义搜索和提取相关概念的系统和方法
CN111708874B (zh) 基于复杂意图智能识别的人机交互问答方法与系统
US8700589B2 (en) System for linking medical terms for a medical knowledge base
JP5154832B2 (ja) 文書検索システム及び文書検索方法
JP2017509946A (ja) コンテキスト依存医学データ入力システム
Oronoz et al. Automatic annotation of medical records in Spanish with disease, drug and substance names
US20200234801A1 (en) Methods and systems for healthcare clinical trials
US20140108460A1 (en) Data store organizing data using semantic classification
US20140108424A1 (en) Data store organizing data using semantic classification
US11630874B2 (en) Method and system for context-sensitive assessment of clinical findings
CN110750540A (zh) 构建医疗业务知识库的方法、获得医疗业务语义模型的方法及系统、介质
US9081847B2 (en) Data store organizing data using semantic classification
CN113257377B (zh) 确定目标用户的方法、装置、电子设备及存储介质
López-Úbeda et al. An integrated approach to biomedical term identification systems
Koshman et al. An unsupervised approach to structuring and analyzing repetitive semantic structures in free text of electronic medical records
Möller et al. A Generic Framework for Semantic Medical Image Retrieval.
CN112699669A (zh) 流性病学调查报告的自然语言处理、装置及存储介质
Khare et al. Exploiting semantic structure for mapping user-specified form terms to SNOMED CT concepts
Wang et al. Radiology text analysis system (RadText): architecture and evaluation
Wang et al. Enabling scientific reproducibility through FAIR data management: An ontology-driven deep learning approach in the NeuroBridge Project
Wu et al. Knowledge driven phenotyping
Zhang et al. Construction of MeSH-like obstetric knowledge graph
Mishra et al. Summarization of Unstructured Medical Data for Accurate Medical Prognosis—A Learning Approach
Feng et al. Extracting meaningful correlations among heterogeneous datasets for medical question answering with domain knowledge
Soualmia et al. Rewriting natural language queries using patterns

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant