CN111465990A - 用于医疗保健临床试验的方法和系统 - Google Patents

用于医疗保健临床试验的方法和系统 Download PDF

Info

Publication number
CN111465990A
CN111465990A CN201880079105.7A CN201880079105A CN111465990A CN 111465990 A CN111465990 A CN 111465990A CN 201880079105 A CN201880079105 A CN 201880079105A CN 111465990 A CN111465990 A CN 111465990A
Authority
CN
China
Prior art keywords
patient
clinical trial
suitability criteria
criteria
suitability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880079105.7A
Other languages
English (en)
Other versions
CN111465990B (zh
Inventor
毛勇
W-J·易
A·R·曼科维赫
吴庆鑫
K·沃良斯基
N·迪米特罗娃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of CN111465990A publication Critical patent/CN111465990A/zh
Application granted granted Critical
Publication of CN111465990B publication Critical patent/CN111465990B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

一种用于招募针对临床试验的患者的方法(100),包括:接收(110)包括关于一个或多个临床试验的信息的数据集,每个临床试验包括患者适合性准则;从所述临床试验中的每个提取(120)所述患者适合性准则;使用结构化临床试验标记语言将所述患者适合性准则转换(130)为标准化患者适合性准则;将所述患者适合性准则存储(140)在数据库(862)中,准则中的每个与一个或多个临床试验相关联;接收(150)关于患者的患者特异性数据值;使用患者特异性数据值查询(160)临床试验适合性准则数据库以识别由所述患者特异性数据值满足的适合性准则;识别(170)与由接收到的患者特异性数据值满足的一个或多个标准化患者适合性准则相关联的临床试验;并且提供(180)至少一个临床试验的识别的报告。

Description

用于医疗保健临床试验的方法和系统
相关申请的交叉引用
本申请要求享有两者题为“METHODS AND SYSTEMS FOR HEALTHCARE CLINICALTRIALS”的于2017年10月6日递交的美国临时专利申请序列US 62/568884和于2018年9月18日递交的US 62/732651的优先权,通过引用将其整体内容并入本文。
技术领域
本公开总体上涉及用于招募针对临床试验的患者的方法和系统。
背景技术
在特定医疗保健协议下实行的临床试验在许多疾病的处置中至关重要。遗憾的是,足够数目的适合患者的临床试验未在合理时间内加入。此外,存在识别临床试验并且将患者与那些临床试验匹配的显著障碍。除了其他之外,这能够针对晚期癌症患者特别重要,其中,存在识别匹配临床试验的紧急程度。
当前临床试验匹配方法和系统基于关键词匹配系统,其将查询字符串与在临床试验文档内找到或者从临床试验文档内提取的关键词匹配。然而,关键词不能够描述或者准确地识别临床试验患者匹配所需的特征和准则。实际上,由于关键词搜索的许多缺点,因此常规临床试验匹配系统不具有搜索并且识别临床试验的特异性和精确度。因此,关键词搜索不执行识别患者特异性临床试验所需的匹配,并且因此当前方案对于使用患者特异性数据自动地与临床试验文档相比较并且识别相关患者特异性数据和准则以向临床试验招募患者是不适当的。
发明内容
存在对使用用于临床试验信息的专业标记语言将患者与临床试验匹配的方法和系统的继续需要。本文中的各种实施例和实施方式涉及一种被配置为使用临床试验匹配系统招募针对临床试验的患者的方法和系统。所述系统接收包括关于临床试验的信息的数据集,每个临床试验包括患者适合性准则。所述系统提取所述患者适合性准则并且使用结构化临床试验标记语言将其转换为标准化患者适合性准则。各自与相应临床试验相关联的标准化患者适合性准则然后存储在可搜索临床试验适合性准则数据库中。为了将患者与临床试验匹配,所述系统接收关于患者的患者特异性数据值并且所述临床试验适合性准则数据库使用这些数据值来查询以识别由接收到的患者特异性数据值满足的一个或多个标准化患者适合性准则。适于所述患者的一个或多个临床试验基于由所述患者特异性数据值满足的该临床试验的标准化患者适合性准则来识别。所述系统然后提供适于所述患者的一个或多个所识别的临床试验的报告,其可以任选地基于所述患者满足多少适合性准则来排名。
各种实施例涉及用于解决用于向临床试验招募患者的临床试验数据记录和存储设备中的信息结构化问题的临床试验标记语言。除了其他方面,根据临床试验结构化的信息包括适合性准则。根据实施例,所述临床试验标记语言定义包含医学术语和/或统一医学语言特征以及表达逻辑的国际词汇表,以将非结构化临床试验文档翻译为可计算的格式。所述系统可以为临床试验患者匹配提供增加的速度和准确度,因此大大地有益于医学搜索、临床试验、患者,并且克服缺乏临床试验文档与驻留在医学记录中的患者临床数据之间的互操作性的额外问题。
所述系统和方法可以为临床试验提供患者的高效招募。描述了一种用于提供临床试验文档与驻留在医学记录中的患者临床数据之间的互操作性的方法。所述方法包括用于进行以下各项的步骤:提供来自临床试验的文本文档的数据集,所述文档包含模糊和不模糊的患者适合性准则;将所述文档存储在服务器上;利用患者适合性准则以自然语言将文档格式化;将格式化的患者适合性准则翻译为一系列结构化查询语言查询;输入患者特异性数据值;执行所述患者适合性准则的至少一个查询搜索;并且针对所述临床试验招募至少一个患者,使得至少一个患者特异性数据值匹配所述临床试验的患者适合性准则,以及显示匹配到所述临床试验的患者的列表。各种实施例提供了一种用于基于由所述系统和方法的用户选择的选定的搜索、结构化和匹配准则来提供相关患者特异性临床试验的列表的系统和方法。
通常,在一个方面中,提供了一种用于使用临床试验匹配系统将患者与临床试验匹配的方法。所述方法包括:(i)接收包括关于一个或多个临床试验的信息的数据集,所述信息包括针对所述一个或多个临床试验中的每个临床试验的一个或多个患者适合性准则;(ii)由所述系统的处理器从所述一个或多个临床试验中的每个临床试验提取所述一个或多个患者适合性准则;(iii)由所述处理器使用结构化临床试验标记语言将所提取的患者适合性准则中的每个患者适合性准则转换为标准化患者适合性准则;(iv)将所述标准化患者适合性准则存储在可搜索临床试验适合性准则数据库中,所述标准化患者适合性准则中的每个标准化患者适合性准则与所述一个或多个临床试验中的至少一个临床试验相关联;(v)接收关于患者的一个或多个患者特异性数据值;(vi)由所述处理器使用接收到的一个或多个患者特异性数据值来查询所述临床试验适合性准则数据库以识别由接收到的患者特异性数据值满足的一个或多个标准化患者适合性准则;(vii)识别所述一个或多个临床试验中的至少一个临床试验,所述至少一个临床试验与由接收到的患者特异性数据值满足的所述一个或多个标准化患者适合性准则相关联;并且(viii)提供对所述至少一个临床试验的所述识别的报告。
根据实施例,所述方法包括对两个或更多个识别的临床试验进行排名的步骤,其中,所述排名至少部分地基于由接收到的患者特异性数据值满足的多个标准化患者适合性准则,并且其中,所述报告包括关于所述两个或更多个识别的临床试验的所述排名的信息。
根据实施例,所述报告是经由所述系统的用户接口来提供的。
根据实施例,包括关于一个或多个临床试验的信息的数据集包括来自多个源的信息。
根据实施例,将所提取的患者适合性准则转换为标准化患者适合性准则的步骤包括机器学习算法。
根据实施例,将所提取的患者适合性准则转换为标准化患者适合性准则的步骤包括将复杂适合性准则分解为一个或多个简单适合性准则。根据实施例,所述一个或多个简单适合性准则由一个或多个布尔操作符联结。
根据实施例,所述一个或多个患者适合性准则包括纳入准则和排除准则。
根据实施例,所述一个或多个患者特异性数据值是从患者医学记录获得的。
根据一方面是一种用于将患者与临床试验匹配的系统。所述系统包括:临床试验适合性准则数据库,其包括关于多个临床试验的信息,所述多个临床试验中的每个临床试验包括一个或多个患者适合性准则;以及处理器,其被配置为:(i)从所述一个或多个临床试验中的每个临床试验提取所述一个或多个患者适合性准则;(ii)使用结构化临床试验标记语言将所提取的患者适合性准则中的每个患者适合性准则转换为标准化患者适合性准则;(iii)将所述标准化患者适合性准则存储在所述临床试验适合性准则数据库中,所述标准化患者适合性准则中的每个标准化患者适合性准则与所述一个或多个临床试验中的至少一个临床试验相关联;(iv)接收关于患者的一个或多个患者特异性数据值;(v)使用接收到的一个或多个患者特异性数据值来查询所述临床试验适合性准则数据库以识别由接收到的患者特异性数据值满足的一个或多个标准化患者适合性准则;(vi)识别所述一个或多个临床试验中的至少一个临床试验,所述至少一个临床试验与由接收到的患者特异性数据值满足的所述一个或多个标准化患者适合性准则相关联;并且(vii)生成对所述至少一个临床试验的所述识别的报告。
根据实施例,所述系统包括患者信息数据库,所述患者信息数据库包括一个或多个患者特异性数据值。
根据一方面是一种用于使用临床试验匹配系统招募针对临床试验的一个或多个患者的方法。所述方法包括:(i)接收包括关于一个或多个临床试验的信息的数据集,所述信息包括针对所述一个或多个临床试验中的每个临床试验的一个或多个患者适合性准则;(ii)由所述系统的处理器从所述一个或多个临床试验中的每个临床试验提取所述一个或多个患者适合性准则;(iii)由所述处理器使用结构化临床试验标记语言将所提取的患者适合性准则中的每个患者适合性准则转换为标准化患者适合性准则;(iv)接收关于患者的一个或多个患者特异性数据值,并且将所述患者特异性数据值存储在患者信息数据库中;(v)由所述处理器使用标准化的一个或多个患者适合性准则来查询所述患者信息数据库以识别对于临床试验而言适合的一个或多个患者;(vi)识别所述患者中的至少一个患者,所述至少一个患者与满足用于查询所述患者信息数据库的标准化患者适合性准则的患者特异性数据值相关联;并且(vii)提供对所述至少一个患者的所述识别的报告。
应该意识到,以下更详细讨论的前述概念和额外的概念的所有组合(假定这样的概念不相互不一致)被预期为本文公开的发明主题的部分。具体而言,出现在本公开的结束处的请求保护的主题的所有组合被预期为本文公开的发明主题的部分。还应该意识到,本文明确采用的也可以出现在通过引用并入的任何公开中的术语应该被赋予与本文公开的特定概念最一致的含义。
各种实施例的这些和其他方面将根据在下文中所描述的(一个或多个)实施例而显而易见并且参考在下文中所描述的(一个或多个)实施例得到阐述。
附图说明
在附图中,相似附图标记通常贯穿不用的视图指代相同部分。附图示出实施各种实施例的特征和方式并且将不被解释为限于落在随附的权利要求的范围内的其他可能实施例。而且,附图未按比例绘制,相反重点通常放置于说明各种实施例的原理。
图1是根据实施例的用于将(一个或多个)患者与(一个或多个)临床试验匹配的方法;
图2是根据实施例的临床试验招募和匹配方法的流程图;
图3是根据实施例的分析器管线的流程图;
图4是根据实施例的根据临床试验适合性准则进行标记的语义网络的范例;
图5是根据实施例的用于排名的方法的框图;
图6是根据实施例的GUI网络应用的实施例;
图7是根据实施例的临床试验招募和匹配方法的流程图;并且
图8是根据实施例的用于将(一个或多个)患者与(一个或多个)临床试验匹配的系统的示意性表示。
具体实施方式
本公开描述了被配置为将患者与适当的临床试验匹配的系统和方法的各种实施例。更一般地,申请人已经认识并意识到,提供更准确并更高效地识别患者适合的临床试验的系统将是有益的。系统接收关于临床试验的信息,每个临床试验包括一个或多个患者适合性准则。系统从临床试验提取患者适合性准则并且使用结构化临床试验标记语言将其转换为标准化患者适合性准则。各自与其被提取的相应临床试验相关联的标准化患者适合性准则然后存储在可搜索临床试验适合性准则数据库中。为了将患者与临床试验匹配,系统接收关于患者的患者特异性数据值并且临床试验适合性准则数据库使用这些数据值来查询以识别由接收到的患者特异性数据值满足的一个或多个标准化患者适合性准则。适于患者的一个或多个临床试验基于由患者特异性数据值满足的该临床试验的标准化患者适合性准则来识别。系统然后提供适于患者的一个或多个识别的临床试验的报告,其可以任选地基于患者满足多少适合性准则来排名。
在某些实施例中,患者、家庭、医师和医学研究员可以识别可以有益于特定患者的有希望的试验。通过将试验信息输入到跟随结构化临床试验标记语言模态和定义的公共存储库中,并且通过使用特别地被设计为将试验描述翻译为结构化临床试验标记语言的自然语言处理工具,临床试验匹配和招募的速度和准确度的性能可以显著改进,这大大地有益于医学研究和患者两者。
参考图1,在一个实施例中,是用于使用临床试验匹配系统识别患者适合的临床试验的方法100的流程图。结合附图所描述的方法仅被提供为范例,并且不应当理解为限制本公开的范围。临床试验匹配系统可以是在本文中所描述或者以其他方式预想的系统中的任一个。
在方法的步骤110处,一个或多个临床试验文档或其他临床试验源由临床试验匹配系统获得或者接收。这些临床试验文档或其他源可以是任何文本、文档、或其他记录或源,包括关于临床试验的文本或图像。根据优选实施例,临床试验信息包括数字或者数字化文档,并且可以从这样的临床信息的一个或多个不同源获得。例如,除了其他源,临床试验信息可以从以下各项获得或者接收:管理临床试验源、NIH源、NCBI源、临床试验注册表、机构审查委员会(IRB)文档、独立伦理委员会(IEC)文档、在线临床试验注册表、自服务临床试验注册表、国际临床试验源、私有源、医院、医学研究机构、EudraCT、ClinicalTrials.gov、Drugs@FDA FDA1572、YODA、PubMed、Sunshine Act Database、和WHO、和/或UMIN,以及许多其他可能源。这些仅是范例并且不旨在是详尽的。根据实施例,文档包括临床总结文档。根据实施例,除了许多其他可能格式之外,临床试验文档或者其他临床试验源包括健康水平七国际(HL7)格式。
根据实施例,临床试验文档可以通常跟随用于记录保持的FDA要求和针对包含在21CFR 312.62和812.140中的临床研究的记录保留,其覆盖研究药物和实验设备、案例历史和记录保留的部署。案例历史可以包含涉及试验研究的方面的信息,以及案例报告形式和支持数据。支持数据可以是源数据并且可以包含在源文档中。临床试验文档可以包括基于国际协调委员会E6 GCP定义合并指南的信息。源数据可以是试验的重建和评价所需的临床试验中的原始记录或临床发现、观察、或其他活动的原始记录和经核证的副本中的信息。源数据可以包含在源文档中,诸如原始记录和/或经核证的副本。源文档的范例包括原始文档、数据和记录(例如,医院记录、临床和办公室图、实验室笔记、备忘录、对象的日记、药房配药记录、来自自动化仪器的记录数据、处方、缩微胶片、照相底片、缩微胶卷、磁介质、X射线、药房记录、和临床试验中涉及的医务科记录)。在一些方面中,源数据可以是案例报告形式。
源可以由个体或者另一系统提供给临床试验匹配系统。额外地和/或备选地,源可以通过临床试验匹配系统检索。例如,临床试验匹配系统可以连续地或者周期性地访问任何数据库、网站、或任何其他资源,包括或者提供临床试验信息。仅作为一个范例,临床试验匹配系统可以自动访问上文列出或预想的源中的任一个。仅作为一个范例,来自例如clinicaltrials.gov以及其他源的输入临床试验的连续流可以定期维护,使得数据库可以利用新临床试验信息恒定更新。
接收或者获得的临床试验文档或其他临床试验源可以存储在本地或者远程数据库中以由临床试验匹配系统使用。例如,临床试验可以被存储为本地服务器上的xml文件。临床试验匹配系统可以包括存储临床试验信息的数据库,和/或可以与存储信息的数据库通信。这些数据库可以与临床试验匹配系统一起定位或者可以定位为远离临床试验匹配系统,诸如在云存储和/或其他远程存储设备中。
适合性准则可以是必须针对临床试验中的适合性由患者满足的任何准则。例如,患者适合性准则包括:纳入准则,其是患者必须满足以纳入的准则;以及排除准则,其是将排除患者纳入在临床试验中的准则。除了许多其他准则之外,适合性准则可以包括年龄、性别、疾病类型、疾病分期、先前治疗历史、其他医学状况、位置、表明、症状、体征、实验室测试结果、体征符号、体征阈值、时间约束、身体位置、诊断、评估、医学专业、设备、状况结果、状况或疾病分期、病变或肿瘤等级、治疗、外科手术、药物、剂量、作用机理、药物形式、同意、其他研究中的登记、人口统计、识字、口语、生活方式、和/或成瘾行为,以及许多其他可能适合性准则。
准则可以是简单或者复杂的。简单准则可以包括例如单个名词短语(绝经期)、其否定(无高血压)、或简单定量比较(年龄>=18岁)。复杂准则通常在内容、否定使用、布尔连接器、算术比较操作符、时间连接器、比较操作符、如果-那么结构、和/或以上所有的组合,以及其他可能性中变化。
在方法的步骤120处,临床试验匹配系统从每个临床试验提取患者适合性准则。适合性准则可以使用多个可能机制中的任一个来识别和/或提取。根据实施例,临床试验匹配系统包括语言分析器或者其他算法(诸如机器学习算法),其被配置为识别适合性准则并且提取或者以其他方式隔离或者表征用于由系统下游处理或分析的识别的适合性准则。根据另一实施例,用户识别和/或提取来自临床试验文档或源的适合性准则。
根据实施例,临床试验文档可以通过要么用户要么系统、通过消除模糊描述和/或来自描述的冗余或不必要的语言、和/或通过将适合性准则复合为独立适合性准则来为提取作准备。标准化或者规划化临床试验文档的格式可以促进从每个临床试验提取适合性准则。
参考图2,在一个实施例中,是用于查询临床试验准则数据库以识别患者适合的一个或多个临床试验的方法200的流程图。根据该实施例,系统接收关于临床试验的信息并且存储临床试验信息作为本地或远程服务器上的一个或多个XML文件。临床试验数据可以使用XML解析器210结构化和/或规范化。XML文档解析器可以被用于解析存储的临床试验文档并且提取有用信息,诸如临床试验设计、适合性准则和地理/位置细节。在某些实施例中,准则可以在几秒或几分钟内规范化。
根据实施例,现在结构化和/或规范化的解析数据可以由索引器220索引以为存储作准备。参考图3,在一个实施例中,是由索引器220使用的分析器过程300。针对临床试验文档的每个部分,字符串首先使用内置令牌化器和空格令牌化器首先小写并且令牌化。然后,常常在临床试验文档适合性准则部分中找到的任何基因术语可以穿过同义词滤波器,其中,返回正准表达式。由于同义词对于基因非常常见,因此将同义词并入到分析器工具中显著地增加临床试验的潜在匹配的数目。诸如姓氏、别名、曾用名、和曾用符号的基因同义词可以从公共数据库获得。类似地,针对病名的同义词滤波器可以并入以进一步改进当查询还涉及疾病诊断时试验匹配引擎的性能。
在一些实施例中,可以使用倒排索引,其可以允许针对全文搜索的快速的全文索引和查询。倒排索引可以包括在任何文档中出现的所有唯一词语的列表,并且是存储从内容(诸如词语或数字)到其在文档或一组文档中的位置的映射的索引数据结构。其与从文档映射到内容的前向索引对比来命名。例如:
‘哈喽’:doc1:1,doc3:10(docid:position)
‘世界’:doc1,doc2,doc3(docid)
针对每个词语,经由散列表或索引,发现词语出现的文档的列表。该机制可以允许比匹配每个文档中的每个术语更快搜索。
来自临床试验的索引、结构化、和/或规范化信息(包括一个或多个适合性准则)然后可以存储以用于下游分析,和/或可以立即分析,如本文更详细地描述的。
在方法的步骤130处,所提取的患者适合性准则使用结构化临床试验标记语言(CTML)转换为标准化患者适合性准则。启用一个或多个临床试验文档与各种患者特异性临床数据之间的互操作性的CTML可以由一个或多个自然语言处理(NLP)工具利用,使得临床试验匹配系统可以使用CTML将非结构化临床试验描述转换为标准化患者适合性准则。唯一CTML将来自临床试验信息的模糊和不模糊的患者适合性准则转换为标准化格式。通过从临床试验信息捕获模糊和不模糊的患者适合性准则,方法可以提供用于将患者匹配和招募到临床试验的意外地改进的速度和/或准确度。
根据实施例,自然语言处理工具可以被用于将试验信息和格式化患者适合性准则翻译为适于查询语言(SQL)查询的一系列结构化数据。NPL工具的范例包括但不限于斯坦福的核心NLP套件、自然语言工具包、Apache Lucene and Solr、Apache OpenNLP、GATE、和Apache UIMA,以及许多其他可能性。在一些方面中,自然语言可以包括机器学习。例如,临床试验文档可以针对各种特征来标记,诸如语音、人、机构、主题、或分类器的部分。标记文档可以被用于训练,并且学习集可以应用于新文档。除了其他因素,系统可以包括字符识别并且可以根据需要将文档的文本分段。
根据实施例,唯一CTML捕获统一医学语言系统(UMLS)的特征和术语、和/或来自临床试验信息的特征和术语之间的逻辑关系。逻辑关系可以使用布尔连接器、算术比较操作符、时间连接器、比较操作符、如果-那么结构、或前述的任何组合来捕获。在某些实施例中,由CTML捕获的概念和关系可以包含以下各项中的任何一项或多项:位置、性别、年龄、医学状况、表明、症状、体征、实验室测试结果、体征符号、体征阈值、时间约束、身体位置、诊断、评估、医学专业、设备、状况结果、状况或疾病分期、病变或肿瘤等级、治疗、手术、药物、剂量、作用机理、以及药物形式。
在某些实施例中,临床试验匹配系统将适合性准则分解为单个分量。自然语言处理可以将适合性准则分解为由布尔操作符联结的分量。在某些实施例中,自然语言处理可以标记语音的部分。由于临床试验设计的复杂性,试验描述可以包含针对多个臂的适合性准则。针对每个臂的适合性准则可以要么手动地要么通过使用NLP技术来分类。
在一些实施例中,可以提供针对单个臂或情形的一组适合性准则。患者队列可以基于纳入准则和排除准则的否定语义地定义。适合性准则基于语义复杂性综合地归类为简单或者复杂准则。简单准则通常包括单名词短语(绝经期)、其否定(无高血压)或简单定量比较(年龄>=18岁)。复杂准则通常在内容、否定使用、布尔连接器、算术比较操作符、时间连接器、比较操作符、如果-那么结构或所有以上的组合中变化。针对临床判断或者更多元数据支持的需要中的准则(例如尿分析:无临床显著异常),其被认为是部分指定的。出于实际的目的,用户可以明确地将那些翻译为要么单个要么复杂准则。通过这样的步骤,大多数适合性准则可以通过术语表达和比较语句来捕获。
在一些方面中,临床试验信息中的复杂准则的存在可以模糊患者适合要求。例如,复杂准则可以使用否定、或复杂操作语言操作符(诸如如果-那么结构)、或其组合,使得可以模糊一个或多个简单适合性准则。在另外的方面中,临床试验信息中的准则可以由复杂语言模糊,使得可以模糊一个或多个简单适合性准则。因此,临床试验匹配系统将复杂或者以其他方式模糊的适合性准则分解为单个分量。根据实施例,临床试验匹配系统可以将复杂或者以其他方式模糊的适合性准则分解为由布尔操作符联结的分量。
根据实施例,临床试验匹配系统可以使用CTML将简单准则转换为标准化准则,包括进行单个断言(例如由华法林引起的流血)的简单语句和形式‘名词短语+比较操作符+数量’的比较语句(例如年龄>=18岁)。在某些实施例中,方法可以使用术语系统,例如,统一医学语言系统(UMLS)。在一个范例中,简单准则和/或简单语句可以以XML格式标记如下:
Figure BDA0002526838580000111
Figure BDA0002526838580000121
根据实施例,临床试验匹配系统可以使用CTML将复杂准则转换为标准化和简单化准则。在一些实施例中,复杂准则可以变换为简单和比较语句。仅作为一个范例,复杂准则可以通过使隐含语义明确来分解。例如,诸如“25-45岁”的复杂准则可以变为(“年龄>=25岁”并且“年龄<=45岁”)。作为另一范例,复杂准则可以通过使连接明确来分解。例如,“肺癌,包括吸烟患者”可以变为(“肺癌”或(“肺癌”和“吸烟”))。作为另一范例,复杂准则可以通过明确地分离诊断、状况、和处置来分解。例如,“由braf抑制剂不佳控制的黑色素瘤”可以变为(“黑色素瘤”和“不佳控制的黑色素瘤”和“采取BRAF抑制剂”)。作为又一范例,复杂准则可以通过扩展不完整列表来分解。例如,“由赫赛汀(拉帕替尼,曲妥珠单抗)处置”可以变为(“由赫赛汀处置”或“由拉帕替尼处置”或“由曲妥珠单抗处置”)。
因此,系统可以包括或者包含用于将复杂准则分解为简单准则的一个或多个步骤。此后,针对每个简单和比较语句,各种实施例可以提供用于编码简单准则的步骤,其可以递归地重新使用。当所有简单准则已经被分析时,各种实施例可以提供用于将布尔连接词和、或、不、暗含、或语义/时间/如果-那么连接器以将个体分量拼贴回为复杂分量的步骤。例如,在图4中示出了一些语义/时间/如果-那么连接器,其包括,在一个实施例中,是临床试验匹配系统可以利用以分析并转换从临床试验信息获得的适合性准则的可能逻辑的描绘。语义/时间/如果-那么连接器的范例包括“是”、“发生_在”和“测量_由”。
在一些方面中,CTML可以解决当适合性准则进入计算机/处理器/GUI中时的各种特征。在一个范例中,CTML可以通过解决概念提取和修改器提取来提供编码过程。在另一范例中,CTML可以通过使用布尔连接词以及其他语义连接器和比较关系(诸如时间和算术连接器和比较关系)解决形式表达逻辑来提供编码过程。
在图1中表示的方法的实施例的步骤140处,标准化患者适合性准则被存储在可搜索临床试验适合性准则数据库中。每个存储的患者适合性准则与提取准则的(一个或多个)临床试验相关联。因此,当适合性准则使用查询来识别时,与该适合性准则相关联的临床试验也将被识别。标准化适合性准则和相关联的临床试验可以以或使用任何格式存储在临床试验适合性准则数据库中。在一个实施例中,适合性准则和相关联的临床试验以使能查询存储数据的格式来存储,优选地以快速并且高效的方式。
临床试验适合性准则数据库可以是由临床试验匹配系统使用的本地或者远程数据库。例如,临床试验匹配系统可以包括临床试验适合性准则数据库,和/或可以与包括数据结构的存储器通信。因此,临床试验适合性准则数据库可以与临床试验匹配系统一起定位或者定位为远离临床试验匹配系统,诸如在云存储和/或其他远程存储设备中。
在方法的步骤150处,临床试验匹配系统接收关于一个或多个患者的信息,诸如通过系统的用户接口或以其他方式提供、上载、或给定到系统。例如,临床试验匹配系统可以包括被配置为接收患者数据的用户接口,诸如由临床医师、患者、或其他提供者输入的数据。备选地或者额外地,临床试验匹配系统可以被配置为电子地接收患者数据,或者可以被配置为接收关于患者的文档并且分析该文档以提取或以其他方式识别患者数据。该信息可以被存储在数据库中,诸如患者特异性数据数据库。
包括一个或多个患者特异性数据值的患者信息提供可以或者将有用于确定或以其他方式评价临床试验中的适合性的信息。根据各种实施例,患者特异性数据的种类的范例包括:位置、性别、年龄、医学状况、表明、症状、体征、实验室测试结果、体征符号、体征阈值、时间约束、身体位置、诊断、评估、医学专业、设备、状况结果、状况或疾病分期、病变或肿瘤等级、治疗、手术、药物、剂量、作用机理、和/或药物形式,以及患者特异性数据值的许多其他可能类型或者范例。在一些方面中,用于将适合性准则转换为标准化格式的CTML可以被用于以与适合性准则和/临床试验信息相同的格式捕获和/或转换患者特异性信息,使得患者到临床试验的匹配和招募的速度和准确度意外地增加。
根据实施例,除了其他方面,患者特异性数据值可以包括年龄、性别、基因、氨基酸置换(基因组数据)、癌症分期、肿瘤等级、以及疾病诊断。更宽广地,基因组信息可以包括任何基因表达、基因融合、DNA甲基化、组蛋白药物、以及蛋白质表达代谢组学,以及其他信息。另外的患者信息包括:患者医学状况、表明、药物、治疗/外科手术、以及其他相关医学定量自信息。根据实施例,临床数据可以驻留在电子病历(EMR)系统中,以及其他源中。在某些实施例中,患者数据可以术语地并且逻辑地根据ISO标准来标准化和形式化,例如,HL7/FHIR参考信息模型。在额外的实施例中,VHR(虚拟健康记录)可以被用于向非均匀医学记录系统提供标准接口,其允许额外的翻译水平。结构化可以例如通过对临床IT数据的用户输入或者完全自动化解析、通过例如HL7经纪人引擎以及许多其他方法来完成。
在方法的步骤160处,临床试验匹配系统使用一个或多个患者特异性数据值来查询临床试验适合性准则数据库。临床试验匹配系统和临床试验适合性准则数据库被配置为识别由患者特异性数据值满足的存储的适合性准则。例如,系统被配置为如果患者特异性数据值匹配适合性准则,落在或没有落在由适合性准则指定的范围内,和/或任何其他匹配机制来识别如满足的适合性准则。系统可以被配置为如果患者特异性数据值是年龄=27岁,则当例如诸如“年龄>=25岁”的适合性准则满足时,将适合性准则识别和/或将适合性准则识别为满足的。系统可以被配置为当例如患者特异性数据值是年龄=21岁时,不识别适合性准则和/或不将适合性准则识别为满足的。将适合性准则识别为满足的可以任选地将与该适合性准则相关联的(一个或多个)临床试验识别为患者适合的可能临床试验。
根据实施例,查询搜索可以从翻译的临床试验信息获取数据和信息,以用于与患者特异性数据和/或患者适合性准则进行比较以确定匹配特征和准则。患者的适当性和针对临床试验的至少一个患者的招募可以涉及匹配临床试验的患者适合性准则的至少一个患者特异性数据值。在一些方面中,查询可以涉及多个因子,包括以上患者特异性数据或准则中的任一个。查询模块可以基于由用户通过用户接口所提供的查询因子建立与临床试验数据交互的查询。
在一些实施例中,布尔模型被用于识别匹配文档和准则,并且评分函数可以被确定为计算相关性。例如,查询可以通过匹配其他查询的布尔组合来匹配文档或者准则。布尔模型应用查询中表达的和、或和否条件以找到匹配的所有文档或准则。例如,以下是使必须查询、必须查询、和应当查询组合在一起的查询的范例:
Figure BDA0002526838580000151
该范例要求:(1)“肺”和“癌”必须出现在字段“目的”中和(2)“egfr”必须出现在字段“纳入准则”和(3)“怀孕”必须不出现在字段“排除准则”中。
根据实施例,满足以上逻辑语句的任何临床试验和/或患者数据将是匹配。“应当”匹配将不影响布尔查询结果,但是如果文档满足该准则,则其将具有更高的评分。该过程是快速的,因为其排除不能可能匹配查询的任何文档。
在方法的步骤170处,临床试验匹配系统基于查询来识别患者可以适合的一个或多个临床试验,临床试验与由查询中使用的(一个或多个)患者特异性数据值满足的一个或多个标准化患者适合性准则相关联。当例如患者特异性数据满足针对该临床试验的适合性准则中的一个或多个时,可以识别临床试验。根据实施例,如果特定数目的适合性准则由患者特异性数据满足或者匹配患者特异性数据,则可以仅识别临床试验。根据另一实施例,临床试验可以包括一个或多个强制最小适合性准则,其中每个必须由患者特异性数据满意、满足、或者匹配以便临床试验被识别。查询过程可以识别患者适合的一个临床试验、多个临床试验、或无临床试验。
根据实施例,临床试验匹配系统可以被配置为识别患者可以适合的临床试验,但是适合的最后确定可以由另一系统、由人类查看者、和/或由另一机构要求。例如,系统可以确定患者特异性数据值满足临床试验的一个或多个适合性准则,但是该临床试验可以包括患者特异性数据不可用或者提供的一个或多个适合性准则。系统可以被配置为将临床试验识别为可能性,并且可以任选地标记临床试验或者以其他方式指示额外查看或信息是必要的。许多其他选项和实施例是可能的。
在方法的任选步骤172处,临床试验匹配系统可以对由查询过程识别的两个或更多个临床试验进行排名,如本文所描述或以其他方式预想的。根据实施例,临床试验匹配系统可以被配置为至少部分地基于由接收到的患者特异性数据值满足的多个标准化患者适合性准则对所识别的临床试验进行排名。备选地或者额外地,临床试验匹配系统可以被配置为基于满足所识别的临床试验的一个或多个强制(或非强制)最小适合性准则的患者特异性数据值来对所识别的临床试验进行排名。
在某些实施例中,一旦满足布尔模型的评价的匹配临床试验和/或准则的列表被识别,即,临床试验满足搜索查询准则,临床试验可以通过相关性来排名。例如,图5示出了根据实施例的用于排名的方法500的框图。根据实施例,方法包括TF(针对文档d中的词t的词频)和IDF(针对词t的逆文档频率),针对不同字段的定制权重、疾病本体论、和针对用户与临床试验设施之间的距离的因子,当排名识别的临床试验时,可以考虑其中一个或多个。
在某些实施例中,排名可以通过利用Lucene实际评分函数以计算每个匹配文档的评分完成,其由以下内容给出:
Figure BDA0002526838580000161
其中,评分(q,d)是针对查询q的文档d的相关性评分;求和部分计算文档d的查询q中的每个词t的权重的总和;tf(t,d)是针对文档d中的词t的词频(TF);idf(t)是针对词t的逆文档频率(IDF);t.得到升压()是已经应用到查询的升压;并且基准(t,d)是与索引时间字段水平升压组合的字段长基准。这仅是一个范例,并且用于排名和评分的许多其他方法是可能的。
根据实施例,整个临床试验文档的相关性评分可以取决于在该文档中出现的每个查询词的权重。词频、逆文档频率、和字段长基准可以一起被用于计算特定文档中的单个词的权重。这些可以在索引时计算和存储。查询可以包括超过一个术语。各种实施例可以使用向量空间模型来组合多个术语的权重。
根据实施例,额外权重可以给定到字段。常常地,并非所有部分具有临床试验文档内的相等重要性。例如,简要标题可以比详细描述更重要或更不重要。部分/字段的权重可以针对在查询时的相关性来调谐。权重针对每个字段来分配并且在计算评分时,在具有权重2的字段中出现的词将得到比在具有权重1的字段中出现的相同词的评分的两倍,即,具有权重二的字段是具有权重一的字段的重要性的两倍。用于排名和评分的许多方法是可能的。
在方法的步骤180处,临床试验匹配系统可以提供患者可以适合的识别的一个或多个临床试验的报告。报告可以直接提供给患者、医师、临床医师、和/或授权为接收报告的任何其他方。备选地或者额外地,报告可以电子地被提供给另一系统、患者数据库、病历管理系统、和/或电子信息的任何其他接收者。
根据实施例,临床试验匹配系统可以包括用于接收和提供信息的图形用户接口和显示器(GUI)。例如,GUI可以被配置为允许用户输入准则、选择另外的信息、和查看相关临床试验和适合性准则的列表。用户可以向网络应用提供搜索查询并且迅速地可视化匹配试验和招募适合患者。参考图6,例如,地图可以被用于基于地理考虑(诸如与家庭或处置中心的接近度)向试验招募患者,以基于接近度来识别临床试验和/或基于接近度来对临床试验进行排名。
根据实施例,临床试验匹配系统可以创建所有识别的临床试验的表或列表。这可以在存储器或者数据库中创建、被显示在屏幕或其他用户接口上、或以其他方式来提供。报告或者列表还可以包括用于识别临床试验的适合性准则,以及关于临床试验文档内的适合性准则的位置的信息。报告可以是视觉显示器、印刷文本、电子邮件、可听报告、传输、和/或传达信息的任何其他方法。报告可以本地或者远程提供,并且因此系统或者用户接口可以包括或以其他方式连接到通信系统。例如,系统可以通过通信系统传递报告,诸如因特网或者其他网络。提供、记录、报告、或以其他方式使所识别的临床试验可用的许多其他方法是可能的。
根据另一实施例是一种用于使用临床试验匹配系统来识别多个患者中的哪些对于临床试验而言适合的方法。临床试验匹配系统可以是在本文中所描述或者以其他方式预想的系统中的任一个。用于识别多个患者中的哪些对于临床试验适合而言的方法的一个或多个步骤与结合图1和/或方法100所描述的步骤类似和/或相同。
根据另外的实施例,方法包括下载和维护(一个或多个)最更新日期临床试验数据库并且识别包含在其中的适合性准则。临床试验信息的数据集可以包含模糊和不模糊的患者适合性准则,其可以存储在服务器上。在另一步骤中,每个所识别的适合性准则分离地编码。针对多个患者的患者特异性数据值可以由系统输入和/或接收和存储。根据实施例,患者特异性数据值已经格式化为或者转换为标准化格式,诸如本文所描述或以其他方式预想的结构化临床试验标记语言。每个患者特异性数据值在存储器中与患者相关联,使得患者特异性数据值的识别类似地识别导出或者获得数据的相关联的患者。
为了识别针对目标临床试验的一个或多个患者,来自目标临床试验的适合性准则使用结构化临床试验标记语言提取和标准化,如本文所描述或以其他方式预想的。标准化适合性准则然后可以被用于使用本文所描述或以其他方式预想的方法中的任一个查询患者特异性数据数据库。例如,为了使用结构化患者数据回答在针对患者试验匹配和招募的一些适合性准则中提到的问题,每个准则还可以被翻译为SQL查询。SQL查询可以在关系数据库协议中被用于确定特定患者到特定临床试验的适当的招募和/或匹配。
系统可以识别满足或者满意用于查询数据库的标准化适合性准则的一个或多个患者。所识别的一个或多个患者可以在用于通信的报告、列表、或任何其他方法中提供。
参考图7,在一个实施例,是用于识别患者潜在适合的一个或多个临床试验和/或用于识别满足临床试验的一个或多个患者的方法700的示意性表示。第一步骤或者模块包括下载并且维护(一个或多个)最新的临床试验数据库。下载临床试验数据库可以在实行搜索之前完成。临床试验各自包括一个或多个适合性准则,其由自然语言处理引擎处理并且存储在结构化临床试验数据库(结构化试验DB)中。
关于患者的信息由系统接收,诸如从个人健康记录(PHR)和/或从电子健康记录(EHR)。信息由自然语言处理引擎处理并且存储在结构化患者特异性数据值数据库(结构化PHR DB)中。
结构化临床试验数据库可以使用患者特异性数据值查询以识别患者适合的一个或多个临床试验。类似地,结构化患者特异性数据值数据库可以使用适合性准则查询以识别对于临床试验而言适合的一个或多个患者。所识别的一个或多个临床试验可以被排名以提供适合临床试验的排名列表。类似地,所识别的一个或多个患者可以排名和/或以其他方式优化以提供对于临床试验而言适合的患者的优化人口。
参考图8,在一个实施例中,是用于识别匹配的(一个或多个)患者和(一个或多个)临床试验的临床试验匹配系统800的示意性表示。系统800可以是本文所描述或以其他方式预想的系统中的任一个,并且可以包括本文所描述或以其他方式预想的部件中的任一个。
根据实施例,系统800包括经由一个或多个系统总线812互连的处理器820、存储器830、用户接口840、通信接口850、和存储设备860中的一个或多个。在一些方面中,将理解,图8构成抽象并且系统800的部件的实际组织可以是不同的并且比所图示的更复杂的。
根据实施例,系统800包括能够运行存储在存储器830或存储设备860中的指令或以其他方式处理数据以例如执行方法的一个或多个步骤的处理器820。处理器820可以由一个或多个模块形成。处理器820可以采取任何适当的形式,包括但不限于微处理器、微控制器、多个微控制器、电路、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、单个处理器、或多个处理器。
存储器830可以采取任何适当的形式,包括非易失性存储器和/或RAM。存储器830可以包括各种存储器,诸如例如L1、L2或L3高速缓存或系统存储器。这样一来,存储器830可以包括静态随机存取存储器(SRAM)、动态RAM(DRAM)、闪存、只读存储器(ROM)或者其他类似存储器设备。除了其他事物,存储器可以存储操作系统。RAM由处理器用于数据的暂时存储。根据实施例,操作系统可以获得在由处理器运行时控制系统800的一个或多个部件的操作的代码。将显而易见的是,在处理器以硬件实施本文所描述的功能中的一个或多个的实施例中,可以省略描述为对应于其他实施例中的这样的功能的软件。
用户接口840可以包括用于使能与用户通信的一个或多个设备。用户接口可以是允许信息传达和/或接收的任何设备或系统,并且可以包括显示器、鼠标、和/或用于接收用户命令的键盘。在一些实施例中,用户接口840可以包括可以经由通信接口850呈现给远程终端的命令行接口或者图形用户接口。用户接口可以与系统的一个或多个其他部件一起定位,或者远离系统定位并且经由有线和/或无线通信网络进行通信。
通信接口850可以包括用于使能与其他硬件设备通信的一个或多个设备。例如,通信接口850可以包括被配置为根据以太网协议通信的网络接口卡(NIC)。此外,通信接口850可以实施用于根据TCP/IP协议通信的TCP/IP栈。针对通信接口850的各种备选或者额外的硬件或者配置将是显而易见的。
存储设备860可以包括一个或多个机器可读存储介质,诸如只读存储器(ROM)、随机存取存储器(RAM)、磁盘存储介质、光学存储介质、闪存设备或者类似存储介质。在各种实施例中,存储设备860可以存储用于由处理器820运行的指令或者处理器820可以操作的数据。例如,存储设备860可以存储用于控制系统800的各种操作的操作系统861。存储设备860还可以存储临床试验信息862和/或患者特异性信息863。
将显而易见的是,被描述为被存储在存储设备860中的各种信息可以额外地或者备选地被存储在存储器830中。在该方面中,存储器830还可以被认为是构成存储设备并且存储设备860可以被认为是存储器。各种其他布置将是显而易见的。此外,存储器830和存储设备860两者可以被认为是非瞬态机器可读介质。如本文所使用的,术语非瞬态将被理解为排除瞬态信号但是包括所有形式的存储设备,包括易失性存储器和非易失性存储器。
尽管临床试验匹配系统800被示出为包括每个所描述的部件之一,但是在各种实施例中,可以复制各种部件。例如,处理器820可以包括多个微处理器,所述多个微处理器被配置为独立地执行本文所描述的方法或者被配置为执行本文所描述的方法的步骤或子例程,使得多个处理器协作来实现本文所描述的功能。此外,在系统800的一个或多个部件被实施在云计算系统中的情况下,各种硬件部件可以属于单独的物理系统。例如,处理器820可以包括第一服务器中的第一处理器和第二服务器中的第二处理器。许多其他变型和配置是可能的。
根据实施例,临床试验匹配系统800的存储设备860可以存储一个或多个算法和/或指令来执行本文所描述或以其他方式预想的方法的一个或多个功能或者步骤。例如,除了其他指令之外,处理器820可以包括提取和转换指令864、查询指令865、和报告指令866。
根据实施例,提取和转换指令864引导系统从临床试验提取患者适合性准则,和/或从患者信息提取患者特异性数据。根据实施例,提取和转换指令是或者包括语言分析器或者其他算法,诸如机器学习算法,其被配置为识别适合性准则并且提取或者以其他方式隔离或者表征用于由系统下游处理或分析的所识别的适合性准则。根据实施例,系统接收关于临床试验的信息并且存储临床试验信息作为一个或多个XML文件,诸如在临床试验信息数据库862中。临床试验数据可以使用XML解析器结构化和/或规范化。XML文档解析器可以被用于解析所存储的临床试验文档并且提取有用的信息。
提取和转换指令864还引导系统使用结构化临床试验标记语言(CTML)将所提取的患者适合性准则和/或患者特异性数据转换为标准化格式。启用一个或多个临床试验文档与各种患者特异性临床数据之间的互操作性的CTML可以由一个或多个自然语言处理(NLP)工具利用,使得临床试验匹配系统可以使用CTML将非结构化临床试验描述转换为标准化患者适合性准则。根据实施例,自然语言处理工具可以被用于将试验信息和格式化患者适合性准则翻译为适于查询的一系列结构化数据。NPL工具的范例包括但不限于斯坦福的核心NLP套件、自然语言工具包、Apache Lucene and Solr、Apache OpenNLP、GATE、和ApacheUIMA,以及许多其他可能性。
根据实施例,一旦患者适合性准则和/或患者特异性数据使用结构化临床试验标记语言转换或者重新格式化为标准化格式,患者适合性准则和/或患者特异性数据被存储在数据库中,诸如临床试验信息数据库862和患者信息数据库863。
根据实施例,查询指令865引导系统查询患者适合性准则和/或患者特异性数据,诸如查询临床试验信息数据库862和/或患者信息数据库863。例如,查询指令865引导系统使用一个或多个患者特异性数据值查询临床试验信息数据库中的适合性准则。临床试验匹配系统和临床试验适合性准则数据库被配置为识别由患者特异性数据值满足的存储的适合性准则。类似地,查询指令865引导系统使用一个或多个临床试验适合性准则来查询患者信息数据库中的患者特异性数据。临床试验匹配系统和患者信息数据库被配置为识别存储的患者特异性数据和相应患者,其满足一个或多个临床试验适合性准则。
根据实施例,报告指令866引导系统生成、报告、和/或提供患者适合的一个或多个识别的临床试验。类似地,报告指令866引导系统生成、报告、和/或提供对临床试验而言适合的一个或多个患者。例如,系统可以创建所有所识别的临床试验和/或所识别的患者的表或列表。这可以在存储器或者数据库中创建、被显示在屏幕或其他用户接口上、或以其他方式提供。报告可以是视觉显示器、印刷文本、电子邮件、可听报告、传输、和/或传达信息的任何其他方法。报告可以本地或者远程提供,并且因此系统或者用户接口可以包括或以其他方式连接到通信系统。
如本文所定义和使用的所有定义应被理解为控制在字典定义、通过引用并入的文献中的定义和/或所定义的术语的普通含义上。
如本文中在说明书和权利要求书中所使用的词语“a(一)”和“an(一个)”应被理解为意指“至少一个”,除非明确相反指示。
如在本说明书和权利要求书中所使用的短语“和/或”应该被理解为是指如此联合的元素中的“任一个或两者”,即在一些情况下联合存在并且在其它情况下分离存在的元素。利用“和/或”列出的多个元素应该以相同的方式解释,即如此联合的元素中的“一个或多个”。除了由“和/或”子句特别识别的元素,其他元素可以任选地存在,不管与具体识别的那些元素相关还是不相关。
如在本说明书和权利要求书中所使用的,“或”应当被理解为具有与上面所定义的“和/或”相同的含义。例如,当在列表中分离项目时,“或”或“和/或”应被解释为包含性的,即包括多个元素或元素列表中的至少一个元素,但也包括多于一个元素,以及任选的其他未列出项目。仅清楚地指示为相反的术语,诸如“仅一个”或“确切地一个”,或者,当在权利要求中使用时,“由...组成”,将指包括多个元素或元素列表中的确切地一个元素。通常,如本文使用的术语“或”仅当前面有排他性术语(例如“任一个”,“...中的一个”,“...中的仅一个”,或者“...中的确切地一个”)时才应解释为指示排他性备选(即,“一个或另一个但是并非两者”)。
如本文中在说明书和权利要求书中所使用的,涉及一个或多个元素的列表的短语“至少一个”应该被理解为是指选自元素列表中的元素中的任何一个或多个的至少一个元素,但是不必包括元素列表内具体列出的每一个元素和每个元素中的至少一个,并且不排除元素列表中的元素的任何组合。该定义还允许除了在短语“至少一个”涉及的元素列表内具体识别的元素之外元素可以任选地存在,而不管与具体识别的那些元素相关还是不相关。
还应该理解,除非明确地相反指示,在本文所要求保护的包括多于一个步骤或动作的任何方法中,方法的步骤或动作的顺序不必限于叙述该方法的步骤或动作的顺序。
在权利要求书以及上面的说明书中,所有的过渡性短语,诸如“包括”、“包含”、“携带”、“具有”、“含有”、“涉及”、“保持”、“带有”等等应被理解为是开放式的,即意味着包括但不限于。只有过渡性短语“由...组成”和“实质上由...组成”应分别是封闭式或半封闭式过渡短语。
尽管在本文中已经描述并且图示了若干发明实施例,但是本领域的普通技术人员将容易预想到用于执行功能和/或获得结果和/或本文所描述的优点中的一个或多个的各种其他模块和/或结构,并且这样的变型和修改中的每个被认为是在本文所描述的发明实施例的范围内。更一般地,本领域的技术人员将容易意识到,在本文中所描述的所有参数、尺寸、材料和配置旨在是示例性的,并且实际参数、尺寸、材料和/或配置将取决于使用发明教导的一个或多个特定应用。本领域的技术人员将认识到或者能够使用不超过常规试验确定本文所描述的特定发明实施例的许多等价方案。因此,应理解,前述实施例仅通过范例呈现,并且在权利要求书和其等价方案的范围内,可以实践除特别地所描述和要求保护外的发明实施例。本公开的发明实施例涉及本文所描述的每个个体特征、系统、制品、材料、工具和/或方法。另外,如果这样的特征、系统、制品、材料、工具和/或方法不互相矛盾,则两个或更多个这样的特征、系统、制品、材料、工具和/或方法的任何组合被包括在本公开的发明范围内。

Claims (15)

1.一种用于使用临床试验匹配系统(800)将患者与临床试验进行匹配的计算机实施的方法(100),包括:
接收(110)包括关于一个或多个临床试验的信息的数据集,所述信息包括针对所述一个或多个临床试验中的每个临床试验的一个或多个患者适合性准则;
由所述系统的处理器(820)从所述一个或多个临床试验中的每个临床试验提取(120)所述一个或多个患者适合性准则;
由所述处理器使用结构化临床试验标记语言将所提取的患者适合性准则中的每个患者适合性准则转换(130)为标准化患者适合性准则;
将所述标准化患者适合性准则存储(140)在可搜索临床试验适合性准则数据库(862)中,所述标准化患者适合性准则中的每个标准化患者适合性准则与所述一个或多个临床试验中的至少一个临床试验相关联;
接收(150)关于患者的一个或多个患者特异性数据值;
由所述处理器使用接收到的一个或多个患者特异性数据值来查询(160)所述临床试验适合性准则数据库以识别由接收到的患者特异性数据值满足的一个或多个标准化患者适合性准则;
识别(170)所述一个或多个临床试验中的至少一个临床试验,所述至少一个临床试验与由接收到的患者特异性数据值满足的所述一个或多个标准化患者适合性准则相关联;并且
提供(180)对所述至少一个临床试验的所述识别的报告。
2.根据权利要求1所述的方法,还包括对两个或更多个识别的临床试验进行排名(172)的步骤,其中,所述排名至少部分地基于由接收到的患者特异性数据值满足的多个标准化患者适合性准则,并且其中,所述报告包括关于所述两个或更多个识别的临床试验的所述排名的信息。
3.根据权利要求1所述的方法,其中,所述报告是经由所述系统的用户接口(840)提供的。
4.根据权利要求1所述的方法,包括关于一个或多个临床试验的信息的所述数据集包括来自多个源的信息。
5.根据权利要求1所述的方法,其中,将所提取的患者适合性准则转换为标准化患者适合性准则的步骤包括机器学习算法。
6.根据权利要求1所述的方法,其中,将所提取的患者适合性准则转换为标准化患者适合性准则的步骤包括将复杂适合性准则分解为一个或多个简单适合性准则。
7.根据权利要求6所述的方法,其中,所述一个或多个简单适合性准则通过一个或多个布尔操作符来联结。
8.根据权利要求1所述的方法,其中,所述一个或多个患者适合性准则包括纳入准则和排除准则。
9.根据权利要求1所述的方法,其中,所述一个或多个患者特异性数据值是从患者医学记录获得的。
10.一种用于将患者与临床试验进行匹配的系统(800),包括:
临床试验适合性准则数据库(862),其包括关于多个临床试验的信息,所述多个临床试验中的每个临床试验包括一个或多个患者适合性准则;以及
处理器(820),其被配置为:(i)从所述一个或多个临床试验中的每个临床试验提取(120)所述一个或多个患者适合性准则;(ii)使用结构化临床试验标记语言将所提取的患者适合性准则中的每个患者适合性准则转换(130)为标准化患者适合性准则;(iii)将所述标准化患者适合性准则存储(140)在所述临床试验适合性准则数据库中,所述标准化患者适合性准则中的每个标准化患者适合性准则与所述一个或多个临床试验中的至少一个临床试验相关联;(iv)接收(150)关于患者的一个或多个患者特异性数据值;(v)使用接收到的一个或多个患者特异性数据值来查询(160)所述临床试验适合性准则数据库以识别由接收到的患者特异性数据值满足的一个或多个标准化患者适合性准则;(vi)识别(170)所述一个或多个临床试验中的至少一个临床试验,所述至少一个临床试验与由接收到的患者特异性数据值满足的所述一个或多个标准化患者适合性准则相关联;并且(vii)生成(180)对所述至少一个临床试验的所述识别的报告。
11.根据权利要求10所述的系统,其中,所述处理器还被配置为对两个或更多个识别的临床试验进行排名(172),其中,所述排名至少部分地基于由接收到的患者特异性数据值满足的多个标准化患者适合性准则,并且其中,所述报告包括关于所述两个或更多个识别的临床试验的所述排名的信息。
12.根据权利要求10所述的系统,其中,所述系统还包括用户接口(840),并且所述报告是经由所述用户接口提供的。
13.根据权利要求10所述的系统,其中,所述处理器被配置为将复杂适合性准则分解为一个或多个简单适合性准则。
14.根据权利要求10所述的系统,还包括患者信息数据库(863),所述患者信息数据库包括一个或多个患者特异性数据值。
15.一种用于使用临床试验匹配系统(800)将患者与临床试验进行匹配的计算机实施的方法(100),包括:
接收(110)包括关于一个或多个临床试验的信息的数据集,所述信息包括针对所述一个或多个临床试验中的每个临床试验的一个或多个患者适合性准则;
由所述系统的处理器(820)从所述一个或多个临床试验中的每个临床试验提取(120)所述一个或多个患者适合性准则;
由所述处理器使用结构化临床试验标记语言将所提取的患者适合性准则中的每个患者适合性准则转换(130)为标准化患者适合性准则;
接收(150)关于患者的一个或多个患者特异性数据值,并且将所述患者特异性数据值存储在患者信息数据库(863)中;
由所述处理器使用标准化的一个或多个患者适合性准则来查询(160)所述患者信息数据库以识别对于临床试验而言适合的一个或多个患者;
识别(170)所述患者中的至少一个患者,所述至少一个患者与满足用于查询所述患者信息数据库的标准化患者适合性准则的患者特异性数据值相关联;并且
提供(180)对所述至少一个患者的所述识别的报告。
CN201880079105.7A 2017-10-06 2018-10-05 用于医疗保健临床试验的方法和系统 Active CN111465990B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762568884P 2017-10-06 2017-10-06
US62/568,884 2017-10-06
US201862732651P 2018-09-18 2018-09-18
US62/732,651 2018-09-18
PCT/EP2018/077139 WO2019068870A1 (en) 2017-10-06 2018-10-05 METHODS AND SYSTEMS FOR CLINICAL HEALTH CARE TRIALS

Publications (2)

Publication Number Publication Date
CN111465990A true CN111465990A (zh) 2020-07-28
CN111465990B CN111465990B (zh) 2023-09-12

Family

ID=63833998

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880079105.7A Active CN111465990B (zh) 2017-10-06 2018-10-05 用于医疗保健临床试验的方法和系统

Country Status (4)

Country Link
US (1) US20200234801A1 (zh)
EP (1) EP3692541A1 (zh)
CN (1) CN111465990B (zh)
WO (1) WO2019068870A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112908436A (zh) * 2021-02-09 2021-06-04 北京药明津石医药科技有限公司 临床试验数据结构化方法、临床试验推荐方法和装置

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11694239B2 (en) 2010-09-01 2023-07-04 Apixio, Inc. Method of optimizing patient-related outcomes
US10395772B1 (en) 2018-10-17 2019-08-27 Tempus Labs Mobile supplementation, extraction, and analysis of health records
EP3891755A4 (en) * 2018-12-03 2022-09-07 Tempus Labs, Inc. SYSTEM FOR IDENTIFICATION, EXTRACTION AND PREDICTION OF CLINICAL CONCEPTS AND ASSOCIATED PROCESSES
US11605469B2 (en) * 2018-12-13 2023-03-14 International Business Machines Corporation Cognitive analysis of data using granular review of documents
US11145390B2 (en) * 2019-02-12 2021-10-12 International Business Machines Corporation Methods and systems for recommending filters to apply to clinical trial search results using machine learning techniques
JP2022533259A (ja) * 2019-05-23 2022-07-21 フラティロン ヘルス,インコーポレイテッド 患者試験マッチングのためのシステムおよび方法
KR102625820B1 (ko) * 2020-12-23 2024-01-15 서울대학교병원 임상시험 실시가능성 판단의 효율성을 제고하기 위한 주요 대상자 선정기준 선택 장치 및 방법
CN113139365A (zh) * 2021-04-06 2021-07-20 上海有临医药科技有限公司 临床试验受试者招募方法及设备
US20230207071A1 (en) * 2021-12-29 2023-06-29 Microsoft Technology Licensing, Llc Knowledge-grounded complete criteria generation
US20230215552A1 (en) * 2021-12-31 2023-07-06 Cerner Innovation, Inc. Early detection of patients for coordinated application of healthcare resources based on bundled payment

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101441686A (zh) * 2008-11-26 2009-05-27 复旦大学附属中山医院 基于自然语言编写的医疗文档的信息抽提及格式转换系统
CN102483815A (zh) * 2009-09-04 2012-05-30 皇家飞利浦电子股份有限公司 临床决策支持
US20130238359A1 (en) * 2012-03-07 2013-09-12 Jennifer L. Carter Bi-directional biomarker based clinical trial matcher
US20130332190A1 (en) * 2012-06-06 2013-12-12 Cerner Innovation, Inc. Providing indications of clinical-trial criteria modifications
CN105189779A (zh) * 2012-10-01 2015-12-23 适应生物技术公司 通过适应性免疫受体多样性和克隆性表征进行的免疫能力评估
WO2016203457A1 (en) * 2015-06-19 2016-12-22 Koninklijke Philips N.V. Efficient clinical trial matching
CN106415560A (zh) * 2014-06-25 2017-02-15 皇家飞利浦有限公司 辅助患者和临床医师使用共享并且以患者为中心的决策支持工具的系统和方法
CN106471506A (zh) * 2014-03-28 2017-03-01 赛特龙数字健康股份公司 用于临床试验参与者的浸入软件即服务式患者授权平台
US20170109502A1 (en) * 2015-10-19 2017-04-20 Intelligent Medical Objects, Inc. System and method for clinical trial candidate matching
CN106796620A (zh) * 2014-06-30 2017-05-31 凯杰雷德伍德城公司 用于解释和报告基于序列的基因测试的方法和系统
CN106815360A (zh) * 2017-01-22 2017-06-09 嘉兴太美医疗科技有限公司 临床研究受试者招募条件排查方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050182663A1 (en) * 2004-02-18 2005-08-18 Klaus Abraham-Fuchs Method of examining a plurality of sites for a clinical trial
GB201506824D0 (en) * 2015-04-22 2015-06-03 Trailreach Ltd TrailReach Multitrial
US20200020423A1 (en) * 2016-09-29 2020-01-16 Koninklijke Philips N.V. A method and system for matching subjects to clinical trials

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101441686A (zh) * 2008-11-26 2009-05-27 复旦大学附属中山医院 基于自然语言编写的医疗文档的信息抽提及格式转换系统
CN102483815A (zh) * 2009-09-04 2012-05-30 皇家飞利浦电子股份有限公司 临床决策支持
US20130238359A1 (en) * 2012-03-07 2013-09-12 Jennifer L. Carter Bi-directional biomarker based clinical trial matcher
US20130332190A1 (en) * 2012-06-06 2013-12-12 Cerner Innovation, Inc. Providing indications of clinical-trial criteria modifications
CN105189779A (zh) * 2012-10-01 2015-12-23 适应生物技术公司 通过适应性免疫受体多样性和克隆性表征进行的免疫能力评估
CN106471506A (zh) * 2014-03-28 2017-03-01 赛特龙数字健康股份公司 用于临床试验参与者的浸入软件即服务式患者授权平台
CN106415560A (zh) * 2014-06-25 2017-02-15 皇家飞利浦有限公司 辅助患者和临床医师使用共享并且以患者为中心的决策支持工具的系统和方法
CN106796620A (zh) * 2014-06-30 2017-05-31 凯杰雷德伍德城公司 用于解释和报告基于序列的基因测试的方法和系统
WO2016203457A1 (en) * 2015-06-19 2016-12-22 Koninklijke Philips N.V. Efficient clinical trial matching
US20170109502A1 (en) * 2015-10-19 2017-04-20 Intelligent Medical Objects, Inc. System and method for clinical trial candidate matching
CN106815360A (zh) * 2017-01-22 2017-06-09 嘉兴太美医疗科技有限公司 临床研究受试者招募条件排查方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112908436A (zh) * 2021-02-09 2021-06-04 北京药明津石医药科技有限公司 临床试验数据结构化方法、临床试验推荐方法和装置
CN112908436B (zh) * 2021-02-09 2022-03-11 上海药明津石医药科技有限公司 临床试验数据结构化方法、临床试验推荐方法和装置

Also Published As

Publication number Publication date
CN111465990B (zh) 2023-09-12
EP3692541A1 (en) 2020-08-12
US20200234801A1 (en) 2020-07-23
WO2019068870A1 (en) 2019-04-11

Similar Documents

Publication Publication Date Title
CN111465990B (zh) 用于医疗保健临床试验的方法和系统
US10957433B2 (en) Clinical concept identification, extraction, and prediction system and related methods
Wang et al. A comparison of word embeddings for the biomedical natural language processing
Kreimeyer et al. Natural language processing systems for capturing and standardizing unstructured clinical information: a systematic review
CN109299239B (zh) 一种基于es的电子病历检索方法
Garla et al. The Yale cTAKES extensions for document classification: architecture and application
US10755804B2 (en) Health information system for searching, analyzing and annotating patient data
US20190006027A1 (en) Automatic identification and extraction of medical conditions and evidences from electronic health records
CA2704637C (en) Systems and methods for interfacing with healthcare organization coding system
Zeng et al. Identifying breast cancer distant recurrences from electronic health records using machine learning
Oronoz et al. Automatic annotation of medical records in Spanish with disease, drug and substance names
JP2017509946A (ja) コンテキスト依存医学データ入力システム
EP2191399A1 (en) System and method for analyzing electronic data records
Gerstmair et al. Intelligent image retrieval based on radiology reports
JP2014228907A (ja) 情報構造化システム
US20200020423A1 (en) A method and system for matching subjects to clinical trials
Kim et al. A study of concept extraction across different types of clinical notes
Schmidt et al. A novel tool for the identification of correlations in medical data by faceted search
Mujjiga et al. Identifying semantics in clinical reports using neural machine translation
Baechle et al. Big data driven co-occurring evidence discovery in chronic obstructive pulmonary disease patients
US20240249843A1 (en) Precision medicine systems and methods
Korkontzelos et al. Text mining for efficient search and assisted creation of clinical trials
Kreuzthaler et al. Semantic retrieval and navigation in clinical document collections
Gurulingappa Mining the medical and patent literature to support healthcare and pharmacovigilance
Dudko et al. An information retrieval approach for text mining of medical records based on graph descriptor

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant