CN109791795A - 用于协同变异选择和治疗匹配报告的方法和装置 - Google Patents

用于协同变异选择和治疗匹配报告的方法和装置 Download PDF

Info

Publication number
CN109791795A
CN109791795A CN201780060734.0A CN201780060734A CN109791795A CN 109791795 A CN109791795 A CN 109791795A CN 201780060734 A CN201780060734 A CN 201780060734A CN 109791795 A CN109791795 A CN 109791795A
Authority
CN
China
Prior art keywords
work
service provider
genomic
clinical
distortion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780060734.0A
Other languages
English (en)
Inventor
N·迪米特罗娃
R·所罗门
K·帕娅尔
M·达尼斯曼-塔沙尔
M·本特祖尔
N·沙拉比
S·尤希姆
A·R·曼科维赫
V·阿格拉瓦尔
J·古
I·弗里德曼
K·沃良斯基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN109791795A publication Critical patent/CN109791795A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/50Compression of genetic data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

一种临床基因组数据处理设备,包括:至少一个微处理器(10);以及非瞬态存储介质(12),其存储用于实施设备的功能的指令。用户界面(26、28)接收对于执行基因组工作流的请求并且显示通过所述基因组工作流的所述执行而生成的输出。基因组工作流管理器管理异步消息传送队列(24)并且管理所述基因组工作流的执行。服务提供器(20)执行与所述基因组工作流相关联的工作。所述基因组工作流管理器通过经由异步消息传送队列交换的消息与服务提供器通信,以经由通过服务提供器执行的工作来管理所述基因组工作流的执行。服务提供器可以包括基因组处理服务提供器(201)、注释服务提供器(202)、畸变分优先级服务提供器(203)、报告服务提供器(204)、临床试验匹配服务提供器(205)等。

Description

用于协同变异选择和治疗匹配报告的方法和装置
本申请主张要求于2016年9月29日提交的美国临时申请No.62/401319的权益,在此通过引用将于2016年9月29日提交的美国临时申请No.62/401319整体并入本文。
技术领域
下文总体涉及临床测试领域、基因组测试领域、基因组数据处理架构领域以及相关领域。
背景技术
基因组学是用于医学诊断、处置选择以及其他临床任务的强大工具。在过去的15年中,自从首次发布人类基因组图谱以来,下一代测序的引入已经使得能够查询跨整个人类基因组的结构和功能变化。测序的成本随时间下降的速率远远超过通过摩尔定律预测的集成电路小型化的速率。最近的大的成就,诸如对跨不同种族的人类基因组变异进行绘制的1000个基因组,以及对跨40个组织类型的肿瘤生物学进行绘制的癌症基因组图谱,已经刺激了生物医学研究,这对癌症以及其他疾病的诊断和处置具有巨大的潜在影响。然而,在将基因组测序引入到临床实践中的常见用途以及有效地利用基因组测序数据以产生可动作的临床信息方面仍然存在挑战。
下文公开了新的并且经改进的系统和方法。
发明内容
在一个公开的方面中,一种临床基因组数据处理设备,包括:至少一个微处理器;以及存储指令的非瞬态存储介质。这些指令包括:由所述至少一个微处理器可读和可运行以实施用户界面的指令,所述用户界面被配置为接收对于执行基因组工作流的请求并且显示通过所述基因组工作流的执行而生成的输出;由所述至少一个微处理器可读和可运行以实施基因组工作流管理器的指令,所述基因组工作流管理器被配置为管理异步消息传送队列并且管理所述基因组工作流的执行;以及由所述至少一个微处理器可读和可运行以实施服务提供器的指令,所述服务提供器被配置为执行与所述基因组工作流相关联的工作。所述基因组工作流管理器被配置为通过经由所述异步消息传送队列交换的消息与所述服务提供器通信,以经由通过所述服务提供器执行的工作来管理所述基因组工作流的执行。
在另一公开的方面中,一种非瞬态存储介质存储由至少一个微处理器可读和可运行以执行临床基因组数据处理的指令。所述指令包括:由所述至少一个微处理器可读和可运行以实施用户界面的指令,所述用户界面被配置为接收对于执行基因组工作流的请求并且显示通过所述基因组工作流的所述执行而生成的输出;由所述至少一个微处理器可读和可运行以实施基因组工作流管理器的指令,所述基因组工作流管理器被配置为管理异步消息传送队列并且管理所述基因组工作流的执行;以及由所述至少一个微处理器可读和可运行以实施服务提供器的指令,所述服务提供器被配置为执行与所述基因组工作流相关联的工作。所述服务提供器包括:至少一个基因组处理服务提供器,其被配置为执行包括处理基因组数据以生成畸变的列表的工作;至少一个注释服务提供器,其被配置为执行包括处理畸变的列表以生成经注释的畸变的工作;至少一个畸变分优先级(prioritization)服务提供器,其被配置为执行包括处理经注释的畸变的列表以生成经注释的畸变分优先级列表的工作;以及至少一个报告服务提供器,其被配置为执行至少包括经由所述用户界面显示经注释的畸变的列表并且经由所述用户界面接收临床报告的报告工作。所述基因组工作流管理器被配置为通过经由所述异步消息传送队列交换的消息与所述服务提供器通信,以经由通过所述服务提供器执行的工作来管理所述基因组工作流的执行。
在另一公开的方面中,公开了一种临床基因组数据处理方法。经由基于网络的用户界面,接收对于执行基因组工作流的请求并且显示通过所述基因组工作流的所述执行而生成的输出。经由在包括微处理器的基于云的平台上实施的服务提供器,异步地执行与所述基因组工作流相关联的工作。经由在所述基于云的平台上实施的基因组工作流管理器,维护表示所述基因组工作流的状态机,并且通过经由异步消息传送队列交换的消息来执行与所述服务提供器的通信,以经由通过所述服务提供器异步地执行的工作来管理所述基因组工作流的执行。所述基因组工作流管理器还根据经由所述异步消息传送队列从所述服务提供器接收到的指示由所述服务提供器执行的工作的成功完成的消息来更新所述状态机的状态。
一个优点在于提供了临床基因组数据处理设备和方法,其更有效地与临床工作流集成。
另一优点在于提供了具有面向服务的架构(SOA)、优选基于云的临床基因组数据处理设备和方法,其采用能够被频繁地更新的服务提供器以实施最新的临床知识(例如,最新的畸变定义、最新的注释数据库、关于即将进行和正在进行的临床试验的当前信息、最新的治疗信息等)而无需离线进行所述临床基因组数据处理。
另一优点在于提供了具有SOA架构、优选基于云的临床基因组数据处理设备和方法,其采用服务提供器来执行与基因组工作流相关联的工作,并且还提供了基因组工作流管理器,所述基因组工作流管理器管理异步消息传送队列以与所述服务提供器通信,从而实现对各种工作流任务的异步并行处理。
另一优点在于提供了临床基因组数据处理设备和方法,其具有经改进的用户界面,用于向临床医师呈现最临床相关的基因组畸变。
另一优点在于提供了具有经改进的患者数据安全性的临床基因组数据处理设备和方法。
另一优点在于提供了具有经改进的用户界面的临床基因组数据处理设备和方法,其减少了在处理部件之间剪切和粘贴信息的需要。
另一优点在于提供了临床基因组数据处理设备和方法,其提供了对基因组数据的处理以生成具有经改进的计算效率的临床可动作信息。
给定实施例可以不提供前述优点或者提供前述优点中的一个、两个、更多个或全部优点,和/或可以提供其他优点,这对于本领域普通技术人员在阅读和理解本公开内容后将变得显而易见。
附图说明
本发明可以采取各种部件和部件布置以及各种步骤和步骤安排的形式。附图仅仅是出于例示说明优选实施例的目的,而不应当被解释为限制本发明。在呈现日志或服务调用数据的图中,通过使用叠加的编校框来编校特定识别信息。
图1示意性示出了例示性的基于云的临床基因组数据处理设备。
图2A和图2B示意性图示了由微服务支持的病理学家的工作流的总体框架。
图3示意性示出了注释服务提供器的例示性实施例。
图4示意性示出了畸变分优先级服务提供器的例示性实施例。
图5示意性示出了试验匹配服务提供器的例示性实施例。
图6-11示出了由报告服务提供器适当地产生并且经由临床基因组数据处理设备的用户界面显示的例示性显示。
图12示出了由试验匹配服务提供器适当地产生并且经由临床基因组数据处理设备的用户界面显示的例示性显示。
图13示出了由治疗匹配服务提供器适当地产生并且经由临床基因组数据处理设备的用户界面显示的例示性显示。
图14示意性示出了报告服务提供器的例示性实施例。
具体实施方式
在临床实践中利用基因组学的难点在于缺乏信息学来以支持临床专家(如肿瘤学家和病理学家)的临床工作流的流线化方式对该数据进行存储、管理、分析和情景化。挑战在于存在许多治疗选项和许多临床试验,并且很难一次测试一种基因。下一代测序(NGS)平台提供了以合理的成本以高吞吐量方式对基因组进行测序的机会。存在通常将基因组数据转换为有意义的生物信息的算法。这样的算法通常适合于生物信息学专家用户。临床专家花费数十年时间获得特定的专业知识,并且形成其解决问题和帮助患者的方案。在其思考方式中,其使用的信息学工具应当具有自然的流程,牢记要解决的问题以及完成其任务所需的相关信息。特定任务可能涉及登录到六个不同的IT系统、手动地剪切和粘贴,这可能降低正确信息的可见性并且增加出错的机会。
因此,将期望提供一种信息学平台,其包括以清晰的工作流支持方式来呈现信息的用户体验,同时利用来自各种源的临床知识进行注释和解释以满足临床专家的需求。各种实施例遵循这样的理念:技术应当致力于减少时间、提高生产率以及为患者带来巨大成果的机会。信息被深深嵌入在现代EMR、LIS和其他临床应用中不易获取的数据中。在一些实施例中,寻求来自其他更有经验的临床医师的专家意见是在对单个患者的决策制定的上下文内的可用选项。
根据各种实施例,目标是处理基因组学和临床数据,包括成像和病理学数据以及任何其他实时诊断输入,以提供精确的诊断。一些需要回答的临床问题包括以下内容:如何将肿瘤的基因型与潜在的治疗方法相匹配以获得最佳结果?如何阐明一组肿瘤样本中的以基因组学、转基因组学、蛋白质组学、表观基因组学和代谢组学水平为特征的癌症亚型?如何为经过大量成套测试并且仍然医学未知的患者提供新的假设和诊断?如何将患者微生物组数据与人的健康状况关联?
然而,将高吞吐量基因组数据转换成临床可动作的信息并不是一项简单的任务。首要挑战是能够以可靠并且安全的方式获取和存储极大量的基因组数据(单个患者全基因组高达1TB),同时满足长期存储的法律要求。第二挑战是能够以高质量控制的、可靠的、可再现和可扩展的方式异步地运行并行处理以各种编程语言编写的异构管线(pipeline)和相关工作(例如,序列比对、变异和突变调用、拷贝数变异检测)。第三挑战是动态地整合来自各种数据库的可能需要频繁更新的特定领域知识并且生成在后续运行期间可再现的临床可动作结果。第四挑战是实现跨临床专业的持续沟通,因为肿瘤学通常是一种协同努力。存在来自每个临床医师并且还有许多智能算法的输出两者的许多种不同的见解待传达和组合在一起。在本文中所公开的各种实施例促进了:对相关信息进行共享;传输在各种类型的临床证据之间的不一致;以及促成针对诊断过程和针对患者护理的治疗规划和监测阶段两者的问题解决。
在本文中所描述的各种实施例利用被部署在基于云的平台内的软件产品,所述软件产品在包括处理器(例如,微处理器、FPGA、ASIC等)、存储器(例如,L1/L2/L3高速缓存、系统存储器和存储设备)、网络接口(例如,以太网、WiFi等)等的各种硬件上运行。所述软件的目的是提供可读和可解释的基因组信息,其将提供针对肿瘤学中的治疗规划的建议,但是也可以被用于组成性基因组学以及其他领域。
在本文中所公开的各种实施例采用从下一代测序机器和其他基因组学仪器输出的数据以及来自各种临床信息技术(IT)系统的数据,并且执行诸如以下项的功能:(1)同时执行许多不同的过程以用于具有不同类型角色(例如,肿瘤学家、遗传学家、病理学家、生物信息学家、分子学专家)的许多用户的多个机构;(2)通过利用生物信息学算法自动执行针对基因板、整个外显子组和全基因组的特定分析管线以便检测DNA/RNA畸变,并且整合这样的信息以利用用户门户网站向临床专家(诸如肿瘤学家、病理学家和医学遗传学家)提供引导的工作流,以使得能够基于公共和/或策划的私有数据库以及符合条件的临床试验的描述和链接来查看候选畸变以及注释信息,以便于畸变选择(即,临床医师认为与疾病相关联的畸变)和临床报告生成,临床信息和/或治疗处置选项;(3)新基因组/转录组学/表观基因组学/蛋白质组学生物标志物的关联;(4)存储组合来自NGS的结果与患者人口统计学信息、诊断、生活方式和结果数据的原始数据和分析的数据两者;(5)存储在分析中产生的分析元数据和中间文件;(6)存储用于产生临床报告的最终用户动作;(7)社交网络,如在临床医师之间的通信特征,以分享更多案例相关的信息和第二选项;以及(8)汇总相关信息并且生成临床报告。
现在参考图1,示出了例示性临床基因组数据处理设备,其被实施为基于云的系统。所述基因组数据例如可以由基因测序器8来采集,基因测序器8优选采用下一代测序(NGS)以合理的成本以高吞吐量的方式对基因组进行测序。所述基于云的系统包括:至少一个微处理器,其通常被实施为经由互联网、有线和/或无线局域网等互连的一个或多个服务器计算机10;以及非瞬态存储介质12,其存储由至少一个微处理器10可读和可运行以执行各种任务的指令。例示性临床基因组数据处理设备包括如在图1中所示的架构,包括平台,即服务(PaaS)14和HealthSuite数字平台(HSDP,可从Koninklijke Philips N.V.获得;或者其他托管平台)16,其托管由主要基因组学应用消耗的微服务20。
应用层位于HSDP Cloud Foundry网络16(或类似的)的顶部,并且执行各种功能,诸如:提供到PaaS微服务20的连接18;实施特定于肿瘤学的新的微服务20,例如,临床报告微服务、注释微服务、治疗匹配微服务、临床试验微服务、变异分优先级微服务、变异过滤微服务、审计和记录、识别访问管理、管线管理微服务以及许多其他微服务;实施工作流管理器22,其接收对于执行基因组工作流的请求,将与所述基因组工作流相关联的工作排队(在例示性实施例中,使用RabbitMQ消息传送总线24,或者更一般地,由工作流管理器22管理的异步消息传送队列),并且协调由服务提供器20对这些工作的执行;并且提供后端网络服务器26,其执行复杂的计算以便管理用户事件并且对复杂的结果进行可视化。在例示性实施例中,网络服务器26以网络服务器26的形式呈现用户界面26、28,所述网络服务器具有HSDPCloud Foundry代理28,网络客户端30(诸如网络浏览器,例如,Google Chrome、MozillaFirefox、Microsoft Internet Explorer等,或者经由安全HTTPS协议进行通信的自定义网络客户端)经由所述网络服务器与例示性临床基因组数据处理设备通信。网络客户端30仅呈现输出并且接收来自用户的请求。
被存储在非瞬态存储介质12上的指令包括:由至少一个微处理器10可读和可运行以实施用户接口26、28的指令,所述用户接口被配置为接收对于执行基因组工作流的请求并且显示通过所述基因组工作流的所述执行而生成的输出;由至少一个微处理器10可读和可运行以实施基因组工作流管理器22的指令,所述基因组工作流管理器被配置为管理异步消息传送队列24并且管理所述基因组工作流的执行;以及由至少一个微处理器10可读和可运行以实施服务提供器20的指令,所述服务提供器被配置为执行与所述基因组工作流相关联的工作。基因组工作流管理器22被配置为通过经由异步消息传送队列24交换的消息与服务提供器20通信,以经由通过所述服务提供器执行的工作来管理所述基因组工作流的所述执行。
如在本领域中已知的,存储至少在微处理器10上可读和可运行的指令的非瞬态存储介质12通过非限制性示例可以包括:诸如L1/L2/L3高速缓存、系统存储器的存储器,以及诸如硬盘驱动器、RAID磁盘阵列的存储设备或者其他磁存储介质;固态驱动器(SSD)或者其他电子存储介质,光盘或者其他光学存储介质,其各种组合等。所述基于云的系统包括经由网络接口(例如,以太网、WiFi等)互连的至少一个微处理器(例如,服务器计算机)10,以及非瞬态存储介质12。网络客户端30通常被实施在台式计算机、笔记本计算机、诸如手机的移动设备、便携式计算机等上,其提供:显示器,所述显示器用于呈现通过所述基因组工作流的所述执行而生成的输出;以及一个或多个用户输入设备,诸如键盘、鼠标、触敏显示器、听写麦克风等,用户可经由所述一个或多个用户输入设备来发起对于执行基因组工作流的请求、输入或编辑临床报告以及以其他方式与临床基因组数据处理设备进行交互。
例示性服务提供器20是微服务。微服务被认为是用于构建分布式软件系统的面向服务的架构(SOA)的扩展。微服务是使用轻量级协议通过网络彼此通信的过程。使用微服务的好处是增强凝聚力并且减少软件的耦合。这促进了连续地添加或删除服务以及对所述系统进行重构的能力。在一些实施例中,所有微服务都是无状态的并且不共享任何内容。需要持久的任何数据必须被存储在有状态的后备服务中,通常是数据库,诸如基于云的存储装置32,例如,在例示性实施例中,是Amazon Simple Storage Service(S3,可从Amazon WebServices,Inc.获得)。微服务可以经由依赖性声明清单完全并且准确地声明所有依赖关系。此外,可以在执行期间使用依赖性隔离工具以确保没有隐式依赖性从周围系统“泄漏”。完整和显式依赖性规范被统一应用于生产和开发两者。所述临床基因组数据处理设备能够具有配置服务器(例如,Spring Batch)和Git存储库(或者相似类型的软件存储库),其将保存针对所有微服务的配置。所述配置服务器可以由cloud foundry(例如,例示性HSDPcloud foundry14)或者另一专有实例来提供。
参考图2A和图2B,图示了微服务20如何支持病理学家(或者以类似方式针对肿瘤学家)的工作流的总体框架。在图2A和图2B中,顶部流程示出了基因组工作流40的例示性执行,而底部流程表示由与基因组工作流40相关联的(即,在基因组工作流管理器22的管理下操作以执行的)微服务执行的工作序列42。图2A和图2B的例示性基因组工作流是例示性的,还可以设想到执行这些微服务的不同次序,例如,治疗匹配服务和临床试验服务可以以相反的次序使用。
在下文中,描述了各种例示性服务提供器20的范例。所述例示性微服务中的一些例示性微服务包括:至少一个基因组处理服务提供器201,其被配置为执行包括处理基因组数据以生成畸变的列表的工作(参见图1);至少一个注释服务提供器202,其被配置为执行包括处理畸变的列表以生成经注释的畸变的工作(参见图3);至少一个畸变分优先级服务提供器203,其被配置为执行包括处理经注释的畸变的列表以生成分优先级的经注释的畸变的列表的工作(参见图4);至少一个报告服务提供器204,其被配置为执行报告工作,所述报告工作至少包括经由用户界面26、28显示经注释的畸变的列表,并且经由用户界面26、28(参见附图)接收临床报告;以及至少一个试验匹配服务提供器205,其被配置为执行包括将经注释的畸变的列表与至少一个临床试验数据库进行比较以生成至少一个临床试验推荐的工作。除了或替代试验匹配服务提供器205,可以提供至少一个治疗匹配服务提供器(未示出),其被类似地配置成执行包括将经注释的畸变的列表与至少一个临床治疗数据库进行比较以生成至少一种临床治疗建议的工作。
返回参考图1,描述了基因组工作流管理器22的一些例示性实施例。工作流管理器22执行对在微服务20上运行(即,由微服务器20执行)的不同工作的所有调度。例示性工作流管理器22向其客户端(经由在图1中所示的网络服务器26)公开代表性状态转移应用程序接口(REST API),其允许客户端请求执行基因组工作流。
工作流管理器22使得所述工作流能够被解读为状态机。所述状态机中的每个步骤是要处理的工作任务项(例如,一段软件代码)。工作流管理器22管理工作流——其自身不执行任何任务,而是依赖于不同的工作提供器20来执行特定工作。当工作流请求到达时,其被存储在持久层中并且被处理。第一工作项经由队列24被发送至支持其的特定提供器20。一旦项目已经由提供器20成功地处理,其就经由队列机制24通知工作流管理器22。此时,工作流管理器22更新所述状态机的状态并且将请求中的第二工作发送至第二工作提供器20,以此类推,直到所有工作完成或者存在失败。此时,工作流管理器20通过(一项或多项)完成的工作执行的步骤的成功或失败来更新执行工作流的状态。例示性临床基因组数据处理设备考虑到工作流管理器22以及其提供器20两者都是微服务,并且在任何时间点,工作可以由不同的工作流管理器或者由提供器实例来处理。因此,工作流管理器22将使用微服务云基础设施服务。
继续参考图1,接下来描述基因组处理服务提供器201的一些合适的实施例。当新的输入数据在文件服务器上或者在临床基因组数据处理设备可访问以自动检测测序运行的结束的基因组测序器8的测序器驱动器上可用时,针对每次测试自动地触发用于基因组处理的微服务201。所命令的每次测试都与明确定义的临床管线相关联,所述临床管线是作为基因组学实验室验证过程的部分或者作为体外诊断(IVD)测试的部分而开发的。所有工具、针对所述管线的所有参数都是固定的,并且被一致地应用于所有样本。可以使用各种基因组学处理平台来执行基因组学处理,诸如,例如PAPAYA基因组学平台,其通过诸如对齐和变异调用以生成例如以变异调用格式(vcf格式)存储的畸变的列表的操作例如处理FASTQ格式的测序数据。在基因组处理服务提供器201的操作期间处理管线的过程之一是管线管理器201a(参见图2A)。管线管理器微服务201a运行管线并且监测其执行。所述管线在诸如基因组平台(例如,PAPAYA)的特定引擎上存储和执行。管线管理器201a经由REST API公开所有可用的管线和任务。管线的执行请求以及其完成的接收是经由异步消息传送队列24(其是图1的例示性设备中的RabbitMQ消息代理)来执行的。为了拉动正在进行的执行,管线管理器201a可以使用延迟队列,所述延迟队列将计时的消息发送到管线管理器201a以检查管线执行状态。这在典型的临床部署中是特别有利的,其中,每分钟可以接收到数千个这样的请求,并且其中,每个这样的请求对于患者护理可能是关键的。例示性管线管理器201a经由微服务云基础设施来实施。
现在参考图3,接下来描述了注释服务提供器202的一些合适的实施例。基因组学注释是解释基因组数据并且将基因组畸变位置转换为医生和研究人员可用信息的下一步骤。在临床基因组数据处理设备的各种实施例中,注释管理器服务提供器202接收来自工作流管理器22的请求以对一组基因组畸变执行注释。这是利用系统内的知识来触发的,即,特定注释类型在针对临床医师(肿瘤学家或病理学家)或生物学家/分子学专家的特定下一代测序测试类型(或者另一基因组学测试)内运行。注释管理器(即,服务提供器)202接收具有特定工作流/修订的标识(ID)的畸变的列表(例如,以vcf格式),并且然后,根据所请求的注释类型,注释管理器202运行注释引擎50。这些注释引擎50能够从公共可用源52引入知识,诸如UCSC基因组浏览器、ClinVar、ClinGen、dbNSFP、COSMIC、TRANSFAC、1000基因组项目、TCGA数据库、KEGG路径数据库等。利用这些源52中的每个源的注释可以作为单独的工作来执行。另外,每种类型的基因组测试(例如,体细胞突变测试)可以具有基因组注释源的单独组合,并且这任选地在系统级别是可配置的:将一种类型的测试(例如,TruSeq48)与特定的管线以及特定的一组注释源相关联。例如,如果存在48个基因板用于体细胞突变(癌症测试),则注释的类型将包括:UCSC、COSMIC、dbNSFP,而用于胚系突变测试(来自正常样本),则注释的类型将包括:UCSC、dbNSFP、KEGG路径和ClinVar。
一旦注释管理器202接收到注释匹配请求,其就可以执行以下步骤中的一个或多个步骤。(1)接收针对所请求的工作流过程的所有基因组畸变(SNV、CNV、融合)。(2)取回所有可用注释源以及其各自最新活动版本的列表(除非另有说明)。(3)针对每个注释源创建进度条目,以便利用该特定源来标记注释的进度。(4)将注释匹配请求发送至被称为vcfEtl的特定服务,所述服务负责取得vcf文件的条目并且将其转换为注释条目,每个注释源有一个注释条目,其中,每行表示另一基因组畸变。(5)向消息传送代理54发送确认(消息传送是异步的,通过分离发送和接收数据来解耦应用)。(6)在此之后,注释匹配请求由vcfEtl实例处理,并且在完成时其发送注释匹配响应以及注释结果的主体。(7)当接收到注释匹配响应时,注释管理器202更新针对所响应的源的进度条目。在该阶段,其检查该响应是否已经被收到以及由于错误而失败。然而,如果过去存在错误,则注释管理器202执行对注释结果的数据库清理并且另一次尝试处理所述响应。(8)针对该源的注释结果作为注释结果被存储在数据库中。(9)注明针对该源的进度的条目被更新为“完成”。(10)注释管理器202使用进度条目检查是否所有匹配源都成功返回。如果所述匹配资源尚未成功返回,则等待;并且如果一些失败,则返回“失败”到工作流管理器22。如果全部都成功,则将具有成功状态的完成工作返回至工作流管理器22。(11)此后,所述注释结果可用于基因组工作流的接下来的步骤,例如经由用户界面26、28显示结果或者用于提交这些结果以用于治疗和临床试验匹配。
一旦所有注释引擎50已经通知注释管理器202其完成,则注释管理器202创建注释条目,并且向工作流管理器22发送注释工作已经完成并且所有结果都可用于取回的通知。
因为生物学和临床知识是不断增长的领域,所以可以将新的注释数据库52引入到引擎50中以连续地更新所述临床基因组数据处理设备的注释能力。存在至少两种方式:1)用于注释引擎的数据库具有新版本,或者2)完全新的数据库可以被包含在新颖数据模式中。
现在参考图4,接下来描述畸变分优先级服务提供器203的一些合适的实施例。对于全外显子组或全基因组测序(WES或WGS),样本可以具有数百万个基因组变异。在没有注释以及随后对这样的变异的分优先级的情况下,研究人员和临床医师将宝贵的时间和资源浪费在不重要的变异上,而不是关注可能导致人类疾病的那些变异。当目标是将变异与临床试验相匹配时,重要的是要获知该变异是否存在于其他数据集中,或者是如此罕见以至于不太可能找到匹配的试验(因为针对这样的试验的招募成功将是有限的)。通过仅仅根据其相关联的存在性、功能性和疾病相关注释的内容来选择重要变异,能够显著降低临床试验匹配的复杂性。因此,所述临床基因组数据处理设备的一个目的是能够对变异进行分类和分优先级,使得临床医师能够容易地访问和过滤这些变异,以便分优先级以包含在临床报告中。在对变异进行注释之后,基于变异的分类存在变异分优先级过程(由畸变分优先级服务提供器203来执行)。所述分类基于变异对各蛋白质的功能的直接影响。相关性在于这些分优先级的变异是最有可能对患者的治疗计划的创建具有影响的变异。
在图4的例示性实施例中,所述变异分优先级基于注释类型的优先级并且如下地工作。变异利用多干种类型的信息来进行注释:质量信息;可动作性;疾病背景;变异的位置;以及频率信息。下文依次讨论这些问题。
质量信息作为基因组学处理管线201a的部分(参见图2A)。例如,所述信息可以包括“信号”的质量,例如碱基调用的质量,覆盖基因组畸变的读数的数量(例如,读取的总数),变异等位基因频率,其表示多少读数支持变异调用(例如,在给定位置处的读数的10%是“C”,其在参考基因组中是“A”并且给出支持变异调用为“C”的证据)。可以从分优先级过程中舍弃不符合质量标准的变异。
可动作性基于美国食品和药品管理局(FDA)批准的疗法的可用性或者针对特定基因或特定变异的试验匹配。
疾病背景被适当地定义如下。针对每种类型的癌症(在例示性的肿瘤学工作流中),存在与该类型的癌症非常相关的基因的优先级列表。例如:Jak2用于骨髓增生异常综合征,BRAF用于黑素瘤,EGFR用于肺癌和结肠癌。另外,该步骤还可以依赖于内部数据库,所述内部数据库是策划的,并且对内部策划基因有高度兴趣,对于正在执行测试的医院,这些数据应当优先级更高。
变异的位置能够被不同地定义:基因(外显子、内含子、位于3'UTR非翻译基因区域的5'非翻译基因区域(5'UTR)上的变异)和基因间。如果变异是外显子,则应当按上文给出的次序进行分优先级。针对外显子变异,能够考虑对蛋白质功能的影响:影响分类包括非同义(错义、无意义)、移码、插入、删除、复制、插入缺失、同义。另一因素可能是基于路径的分优先级中的Hub:如果基因在路径内具有许多连接,我们将这个基因分优先级为高于其他基因。
针对非同义畸变,考虑以下内容。功能预测:其指代针对变异的有害性的预测分数:良性、有害、耐受(或者对基因功能的高、中、低影响),如由SIFT、PolyPhen、FATHM、MUTATIONTASTER以及其他给出的。“D”可以被表示为基于这些数据库中的值的分数,其表示变异对该基因的功能具有有害影响。另一因素可能是蛋白质效应:功能的增益、或者功能的丧失(预测的或者证实的)以及没有效果。在各种实施例中,当有效时,注释为1;否则,注释为0。另一因素可能是对调节元素的影响,例如:转录因子结合位点、甲基化位点、长非编码RNA区域、微RNA区域。
频率信息可以基于特定数据库(例如,如TCGA的外部知识库或者内部知识库)中的变异的频率。所述频率信息也能够从其他外部知识库获得,或者从所谓的信标(https://beacon-network.org)获得,所述信标是用于共享基因组和临床数据的联合生态系统,作为全球基因组学和健康联盟的部分。
在图4的例示性变异分优先级中,在注释过程之后,针对这些注释数据库中的每一个注释数据库,针对每种类型的注释存在附加列,如果存在针对相应类型的注释的匹配,则为1,否则为0。该过程导致矩阵的创建。例如,Vi(读取覆盖率)意指返回矩阵中的Read_coverage列中的第i个变异的值。然后,如在图4中所示地应用分优先级和分类方案。在处理60中,针对每个变异Vi,i=1...N(其中,N是患者病例中的变异的数量),基于针对每个注释数据库的注释值的类型来计算SCOREi。在计算所有分数之后,在矢量SCORE中的操作62中对其进行收集,并且在操作64中,基于按降序对分数进行整理而来对变异进行排序。排序最高的变异将具有最高的分数。这种类型的排序特别适用于大型基因板、外显子组测序和全基因组测序。可以考虑类似的方案以用于对拷贝数量变异或融合、甲基化事件和其他基因组畸变进行注释。
畸变分优先级服务提供器203的各种实施例可以利用附加或备选信息来过滤变异和/或对变异进行排序以显示给临床医师。根据一些实施例,定义超集类别,并且基于这些超集的分数被指派给每种变型。这些分数被用于过滤每个变异并且对其进行排序。在一个例示性实施例中,类别可以按重要性次序包括以下项:数据集检测、功能、疾病、其他证据,其在下文中依次描述。
外部/内部数据集检测是关于处置和临床试验匹配的变异分优先级的更重要的方面之一,原因是如果其他患者中不存在变异,则不太可能设计专门针对该变异的临床试验。数据集检测是根据查询外部(诸如信标网络)和内部(诸如医院IT系统)变异数据集,并且在查询中提供的变异存在于别处时返回值“真”,否则返回“假”,而得到的注释。在一些实施例中,基于足够大(例如,数十万或数百万的数量级)的那些数据集来选取这些数据集以对结果有信心。对于“检测到”或“未检测到”,该类别分别返回值100或0。尤其对于临床试验匹配,该类别被重地加权。
功能类别可以包括指示变异的功能重要性的注释(其最初能够在数百的范围内)。在各种实施例中,仅考虑被识别为非同义的变异,并且仅对指示有害性/致病性的注释进行加权(诸如SIFT、Polyphen-2、Mutation Assessor、Condel、FATHMM、CHASM和transFIC癌症影响工具)。每个加权的注释的值可以是值1或0(或者针对具有数值的注释,在1与0之间的缩放值),这取决于结论是否是有害/致病的。该类别返回这些值的平均值。这些值仅可以被认为用于每个变异中存在的注释。
所述疾病类别认识到,人类疾病(诸如癌症)中的变异的存在对于识别针对该特定疾病的临床试验或疗法是重要的。在提供了患者的疾病指征以及与变异相关联的疾病(来自诸如ClinVar或者Jackson实验室的临床知识库的数据库的注释)的情况下,变异优先级能够按以下顺序来决定:患者疾病涉及的优先级,其他疾病涉及的优先级,以及人类疾病中涉及的未知的优先级(例如,分别为值1、0.5和0)。
其他证据是“全能(catch-all)”类别。在存在来自其他基因组模态(例如,转录组学)的样本的附加数据的情况下,能够获得关于变异的额外见解。一些功能预测工具(例如,Ensembl变异效应预测器)提供了与特定变异相关联的所有转录物。然而,并非所有这些转录物都被积极表达。如果正在积极表达与变异相匹配的转录物注释,则交叉引用转录组数据使系统能够为变异指派更高的优先级。
针对‘有害对非有害’的功能注释范例,在一些实施例中设置了保守表达阈值0。根据各种实施例,如果潜在有害的转录物不大于该阈值,则为该类别指派值0。否则,指派值1。
在对低置信度变异的质量过滤之后,计算针对所有类别的总和。变异按降序分类和排序。
畸变分优先级服务提供器203的各种实施例可以被实施为在单处理器或并行模式中处理一个或多个变异调用文件的独立软件(并且能够被修改以处理包含变异数据的任何数据结构以及上述变异特定和数据库相关的注释的任何数据结构)。畸变分优先级服务提供器203位于现场或云中,并且结果表示在取回丰富的批准的变体数据集的变量时的倒数第二步(其中,最终步骤是临床医师批准)。出于识别潜在的致病或可动作的变异的目的,存在人们能够分优先级的多个不同注释。
一种这样的情况如下:根据批准的实验室协议使用基因组测序器8对活组织检查进行测序(例如,整体外显子组测序);测序数据由变异调用管线201a来处理(参见图2A;这是检测基因组变异并且以诸如vcf的标准格式输出的过程);针对质量、深度和其他标准度量对变异进行过滤;然后,由至少一个注释服务提供器202给出变异的功能/临床注释。最高优先级的变异将自动地是在患者的原发病指示内或外具有匹配的FDA(或者在一些实施例中,非FDA)批准疗法的变异。存在相对少的这些变异,并且如果在样本中没有出现,则临床医师将面临识别剩余大量变异的相对重要性。在这种情况下,畸变分优先级服务提供器203进行干预,并且根据所提供的类别权重,通过如所描述的分优先级对其余变异进行排序。由于基于变异的临床试验匹配的成本和复杂性,临床医师可能仅想要选择最可能(即,最高排名)的匹配作为候选。
现在参考图5,接下来描述试验匹配服务提供器205的一些合适的实施例。临床试验匹配微服务205提供临床试验匹配工作,其能够作为基因组工作流的部分来执行。临床试验匹配微服务205接收来自异步消息传送队列24的新工作请求,并且在共享工作流管理器队列24上提供工作完成消息。一旦发起匹配工作,所述试验匹配服务提供器就从其他服务(例如,注释微服务202)收集构建查询所需的信息。然后,所述服务相对每个所选择的基因组畸变(例如,单核苷酸变异)对临床试验数据库70(例如,clinicaltrials.gov的下载版本,或者存在于医院或癌症中心内的临床试验的私人数据库)执行查询,池化和删除重复结果。结果与修订上下文一起被保存在实体DB 72中。所述服务还提供REST API,以基于测试版本ID来查询临床试验匹配。
参考图5描述了试验匹配服务提供器205的例示性实施例。将意识到,可以类似地构建治疗匹配服务提供器(或者多个提供器),其中,临床试验数据库70适当地由可以适于患者的临床治疗的数据库来替代。
在下文中,接下来描述报告服务提供器204的一些合适的实施例。
参考图6-图8,在登录之后,病理学家获得具有被指派给病理学家的病例列表80的工作列表。病例列表80示出了未决测试的状态(是否仍然在处理,发出第二意见、初始报告和最终报告),如患者名称、医学记录号(MRN)、诊断、优先级状态以及预定测试的日期的病例的高级细节。在选择病例之后,向病理学家呈现如在图7中所示的注释变异的列表82。针对每个变异,示出了一组特性:基因名称、畸变类型、变异等位基因频率、变异覆盖。能够显示畸变的列表的各种级别和部分。例如,在打开放大镜控件(未示出)时,还示出了来自不同注释源的所有其他信息。在图8中,示出了仅具有最高优先级畸变的分优先级列表84。如在图7和图8中能够看到的,提供了一组(例示性列)选择器86,病理学家可以经由该组选择器来选择(或者取消选择)用于包含在(或者不包含在)临床报告中的畸变。
参考图6-图11,当存在具有许多新颖变异的新的或困难的病例或者患者已经具有多个治疗线的病例时,报告基因组测试的主要病理学家能够选择请求来自在所述临床基因组数据处理设备上的注册用户的任何人的第二意见。对此,非瞬态存储介质12(参见图1)存储临床基因组数据处理设备的注册用户的列表,并且由一个或多个报告服务提供器204执行的报告工作包括经由用户界面26、28(例如,根据图7和/或图8)向第一注册用户(例如,主要病理学家)显示经注释的畸变的列表82、84(根据图7和/或图8)。由第一注册用户例如经由图形用户界面(GUI)对话框90(参见图9)发起对第二意见的请求,第一注册用户(例如,主要病理学家)经由该对话框90能够选择将被要求给出第二意见的第二注册用户。经由用户界面26、28将该请求发送给第二注册用户(其与第一注册用户不同)。经由用户界面26、28接收来自第二注册用户的第二意见,并且经由用户界面将其显示给第一注册用户。这是工作流中的任选步骤,而并非对所有情况都是强制性的。
继续参考图6-图11,一旦(主要或第一)病理学家选择“询问第2意见”下拉框90(参见图9),作为注册病理学家和肿瘤专家以及其中任一位的合格人员列表都能够被选择。与基因组畸变一起,能够在专用窗口(未示出)中键入注释,并且还可以在病例的上下文中将注释发送给第二意见提供者(即,第二注册用户)。在请求第二意见时,工作列表80(d)中的测试81的状态变为“请求的第2意见”,如在图6的工作列表80中出于例示性目的所示的。
接收第二意见请求的病理学家(即,第二注册用户)具有与请求病理学家相似的应用屏幕,如在图10中所示的。由主要报告病理学家做出的变异选择任选地可供查看(例如,类似于图7和/或8的经注释的畸变的列表82、84);备选地,如果希望第二意见是“看不见的”,以便不被主要病理学家的分析所偏向,则该信息可能对所述第二注册用户不可用。第二意见病理学家(即,第二注册用户)以与参考图7和图8针对第一病理学家所描述的类似方式提供对变异的选择。对此,向第二意见病理学家显示的所显示的注释的畸变的列表92包括一组(例示性的列)选择器96,其类似于被提供给主要病理学家的一组选择器86。还可以向第二病理学家提供消息传送接口以键入和发送注释以及所选择的变异。
在由临床医师确认了对第二意见畸变的选择之后,一个或多个报告服务提供器204自动地将这两个工作列表调节为在图11中所示的所选择的畸变的组合列表100。这看起来是在主要报告病理学家的工作列表中接收到的第二意见,并且任选地可以从第二意见临床医师的工作列表中消失(因为第二意见任务现在已完成)。
在从第二注册用户接收到第二意见之后,报告病理学家(即主要病理学家,即第一注册用户)能够再次从他的/她的工作列表80(参见图6)访问病例,并且然后,使用编辑按钮或者其他选择器来修改其自己的发现以发起报告编辑。在该阶段,这两个病理学家的选择都被显示在应用窗口中(如在图11所示的所选择的畸变的组合列表100)。以相同的方式,在主要病理学家需要时,所述系统能够帮助主要病理学家添加额外的第二意见(或者,例如,如果初始第二意见病理学家的注释推荐寻求来自特定第三注册用户的另外的第二意见),并且每个新的第二意见选择将显示为新列。在该列的顶部,临床医师的名字似乎将指定对相应临床医师的选择。
返回参考图5并且进一步参考图12,示出了用于显示由至少一个试验匹配服务提供器205产生的结果的例示性用户界面显示。在过滤和变异分优先级之后,临床基因组数据处理设备自动地调用API并且调用临床试验匹配微服务205。如已经参考图5所描述的,临床试验匹配微服务205使用自然语言处理来将变异与临床试验的数据库70相匹配。基于该特定患者的肿瘤内的基因组畸变,来关联个体患者相关的临床试验。图12示出了这样的相关临床试验的列表110的例示性范例。
现在参考图13,示出了用于显示由至少一个治疗匹配服务提供器产生的结果的例示性用户界面显示。与临床试验匹配并行(或者替代临床试验匹配),所述系统自动地调用API并且执行微服务以用于治疗匹配。该微服务与临床试验匹配微服务205类似地操作,但是与用于治疗匹配的可用临床治疗的数据库相匹配,并且可以使用具有手动地策划的基因和以公布的临床证据形式存在的关联的基因变异的本地或远程数据库。证据可能来自临床指南或者已发表的科学或临床期刊。在基因组畸变与治疗之间的关联可能是积极的,其中,具有特定突变的患者可能具有增加的相应,或者恰好相反。图13示出了这样的相关治疗匹配的列表120。
参考图14,描述了至少一个报告服务提供器204的例示性实施例。用于临床报告的自动报告微服务204可以由报告管理器实例130来实施。报告管理器204由REST API 132调用,并且转换已经选择的变异以及其相关联的治疗匹配(例如,基于公布的现有临床证据的临床表型)以及临床试验匹配。报告管理器204操作用于收集数据以用于插入到文档(即,临床报告)中。当填充模板时,例如,被存储在基于云的存储设备32上的模板存储设备134中(例如,在例示性实施例中,Amazon Simple Storage Service S3)并且由文件管理器微服务136来访问,如在图14中所示的,可以将数据的结构设计为匹配所述模板的结构。在开始时,报告管理器过程接收以下环境变量:(1)指向配置服务器138的配置服务器URI;(2)网络服务器端口号;以及(3)提供给服务发现140的端口号,所述端口号应当与网络服务器端口相同。接下来,报告管理器204引导并且访问配置服务器138以获得其配置,其将包括:(1)服务发现服务器140(例如,Eureka)位置;(2)服务名称;(3)Docmosis秘钥;(4)Docmosis转换器位置(静态IP);(5)服务描述;(6)云桶(cloud bucket);以及(7)云桶证书。在例示性示例中,使用Amazon Elastic Compute Cloud(Amazon EC2)转换器142来执行这些过程中的各种过程。报告管理器微服务204然后将其自身向Eureka服务器138注册为基因组报告管理器。这是用于创建最终报告的示例性实施例。有利地,所述报告过程在用户不必剪切-复制粘贴信息并且确保信息保真度的情况下执行。
已经参考优选实施例描述了本发明。在阅读和理解前面的详细描述时,他人可能想到修改和变更。本发明旨在被解释为包括所有这些修改和变化,只要其落入所附权利要求或者其等同物的范围之内。

Claims (22)

1.一种临床基因组数据处理设备,包括:
至少一个微处理器(10);以及
非瞬态存储介质(12),其存储:
由所述至少一个微处理器可读和可运行以实施用户界面(26、28)的指令,所述用户界面被配置为接收对于执行基因组工作流的请求并且显示通过所述基因组工作流的所述执行而生成的输出;
由所述至少一个微处理器可读和可运行以实施基因组工作流管理器(22)的指令,所述基因组工作流管理器被配置为管理异步消息传送队列(24)并且管理所述基因组工作流的所述执行;以及
由所述至少一个微处理器可读和可运行以实施服务提供器(20)的指令,所述服务提供器被配置为执行与所述基因组工作流相关联的工作;
其中,所述基因组工作流管理器被配置为通过经由所述异步消息传送队列交换的消息与所述服务提供器通信,以经由通过所述服务提供器执行的工作来管理所述基因组工作流的所述执行。
2.根据权利要求1所述的临床基因组数据处理设备,其中,所述服务提供器(20)包括:
至少一个基因组处理服务提供器(201),其被配置为执行包括处理基因组数据以生成畸变的列表的工作;
至少一个注释服务提供器(202),其被配置为执行包括处理畸变的列表以生成经注释的畸变的工作;
至少一个畸变分优先级服务提供器(203),其被配置为执行包括处理经注释的畸变的列表以生成分优先级的经注释的畸变的列表的工作;以及
至少一个报告服务提供器(204),其被配置为执行至少包括经由所述用户界面(26、28)显示经注释的畸变的列表并且经由所述用户界面接收临床报告的报告工作。
3.根据权利要求2所述的临床基因组数据处理设备,其中:
所述非瞬态存储介质(12)还存储所述临床基因组数据处理设备的注册用户的列表;
所述报告工作包括经由所述用户界面(26、28)向第一注册用户显示所述经注释的畸变的列表并且经由所述用户界面接收来自所述第一注册用户的所述临床报告;并且
所述报告工作还包括经由所述用户界面向与所述第一注册用户不同的第二注册用户发送针对来自所述第一注册用户的第二意见的请求,并且经由所述用户界面向所述第二注册用户显示所述经注释的畸变的列表,并且经由所述用户界面接收来自所述第二注册用户的第二意见,并且经由所述用户界面向所述第一注册用户显示所述第二意见。
4.根据权利要求2-3中的任一项所述的临床基因组数据处理设备,其中,所述服务提供器(20)还包括以下中的至少一项:
至少一个试验匹配服务提供器(205),其被配置为执行包括将所述经注释的畸变的列表与至少一个临床试验数据库进行比较以生成至少一个临床试验推荐的工作;以及
至少一个治疗匹配服务提供器,其被配置为执行包括将所述经注释的畸变的列表与至少一个临床治疗数据库进行比较以生成至少一个临床治疗推荐的工作。
5.根据权利要求1-4中的任一项所述的临床基因组数据处理设备,其中,所述基因组工作流管理器(22)被配置为维护表示所述基因组工作流的状态机,并且被配置为根据经由所述异步消息传送队列(24)从所述服务提供器(20)接收到的指示由所述服务提供器执行的工作的成功完成的消息来更新所述状态机的状态。
6.根据权利要求5所述的临床基因组数据处理设备,其中,所述服务提供器(24)是无状态的,并且经由所述异步消息传送队列(24)从所述基因组工作流管理器(22)接收对于执行与所述基因组工作流相关联的所述工作所需的所有数据。
7.根据权利要求1-6中的任一项所述的临床基因组数据处理设备,其中,所述用户界面(26、28)包括基于网络的用户界面,所述基于网络的用户界面包括网络服务器(26),所述网络服务器被配置为执行计算以管理对于执行基因组工作流的所述请求的接收,并且生成通过所述基因组工作流的所述执行而生成的所述输出的可视化以供网络客户端(30)显示。
8.根据权利要求1-7中的任一项所述的临床基因组数据处理设备,其中,所述服务提供器是微服务(20)。
9.根据权利要求1-8中的任一项所述的临床基因组数据处理设备,还包括:
基因测序器(8);
其中,所述服务提供器(20)包括至少一个基因组处理服务提供器(201),所述至少一个基因组处理服务提供器被配置为执行包括处理由所述基因测序器执行的测序运行而输出的基因组数据以生成畸变的列表的工作。
10.根据权利要求1-9中的任一项所述的临床基因组数据处理设备,其中,所述至少一个微处理器(10)包括基于云的平台。
11.一种非瞬态存储介质(12),其存储由至少一个微处理器(10)可读和可运行以执行临床基因组数据处理的指令,所述指令包括:
由所述至少一个微处理器可读和可运行以实施用户界面(26、28)的指令,所述用户界面被配置为接收对于执行基因组工作流的请求并且显示通过所述基因组工作流的所述执行而生成的输出;
由所述至少一个微处理器可读和可运行以实施基因组工作流管理器(22)的指令,所述基因组工作流管理器被配置为管理异步消息传送队列(24)并且管理所述基因组工作流的所述执行;以及
由所述至少一个微处理器可读和可运行以实施服务提供器(20)的指令,所述服务提供器被配置为执行与所述基因组工作流相关联的工作,所述服务提供器包括:至少一个基因组处理服务提供器(201),其被配置为执行包括处理基因组数据以生成畸变的列表的工作;至少一个注释服务提供器(202),其被配置为执行包括处理畸变的列表以生成经注释的畸变的工作;至少一个畸变分优先级服务提供器(203),其被配置为执行包括处理经注释的畸变的列表以生成分优先级的经注释的畸变的列表的工作;以及至少一个报告服务提供器(204),其被配置为执行至少包括经由所述用户界面显示经注释的畸变的列表并且经由所述用户界面接收临床报告的报告工作;
其中,所述基因组工作流管理器被配置为通过经由所述异步消息传送队列交换的消息与所述服务提供器通信,以经由通过所述服务提供器执行的工作来管理所述基因组工作流的所述执行。
12.根据权利要求11所述的非瞬态存储介质(12),其中,所述报告工作包括经由所述用户界面(26、28)向第一注册用户显示所述经注释的畸变的列表,并且经由所述用户界面接收来自所述第一注册用户的所述临床报告,并且所述报告工作还包括:
经由所述用户界面向与所述第一注册用户不同的第二注册用户发送针对来自所述第一注册用户的第二意见的请求,并且经由所述用户界面向所述第二注册用户显示所述经注释的畸变的列表,并且经由所述用户界面接收来自所述第二注册用户的第二意见,并且经由所述用户界面向所述第一注册用户显示所述第二意见。
13.根据权利要求11-12中的任一项所述的非瞬态存储介质(12),其中,所述服务提供器(20)还包括以下中的至少一项:
至少一个试验匹配服务提供器(205),其被配置为执行包括将所述经注释的畸变的列表与至少一个临床试验数据库进行比较以生成至少一个临床试验推荐的工作;以及
至少一个治疗匹配服务提供器,其被配置为执行包括将所述经注释的畸变的列表与至少一个临床治疗数据库进行比较以生成至少一个临床治疗推荐的工作。
14.根据权利要求11-13中的任一项所述的非瞬态存储介质(12),其中,所述基因组工作流管理器(22)被配置为维护表示所述基因组工作流的状态机,并且被配置为根据经由所述异步消息传送队列(24)从所述服务提供器(20)接收到的指示由所述服务提供器执行的工作的成功完成的消息更来所述状态机的状态。
15.根据权利要求14所述的非瞬态存储介质(12),其中,所述服务提供器(20)是无状态的,并且经由所述异步消息传送队列(24)从所述基因组工作流管理器(22)接收对于执行与所述基因组工作流相关联的所述工作所需的所有数据。
16.根据权利要求11-15中的任一项所述的非瞬态存储介质(12),其中,所述用户界面(26、28)包括基于网络的用户界面,包括:
网络服务器(26),其被配置为执行计算以管理对于执行基因组工作流的所述请求的接收,并且生成通过所述基因组工作流的所述执行而生成的所述输出的可视化以供网络客户端(30)显示。
17.根据权利要求11-16中的任一项所述的临床基因组数据处理设备,其中,所述服务提供器是微服务(20)。
18.一种临床基因组数据处理方法,包括:
经由基于网络的用户界面(26、28),来接收对于执行基因组工作流的请求并且显示通过所述基因组工作流的所述执行而生成的输出;
经由在包括微处理器(10)的基于云的平台上实施的服务提供器(20),来异步地执行与所述基因组工作流相关联的工作;
经由在所述基于云的平台上实施的基因组工作流管理器(22),来维护表示所述基因组工作流的状态机,并且通过经由异步消息传送队列(24)交换的消息与所述服务提供器通信以经由通过所述服务提供器异步地执行的所述工作来管理所述基因组工作流的所述执行,并且根据经由所述异步消息传送队列从所述服务提供器接收到的指示由所述服务提供器执行的所述工作的成功完成的消息来更新所述状态机的状态。
19.根据权利要求18所述的临床基因组数据处理方法,其中,与所述基因组工作流相关联的工作的所述异步地执行包括:
经由至少一个基因组处理服务提供器(201),来执行包括处理基因组数据以生成畸变的列表的工作;
经由至少一个注释服务提供器(202),来执行包括处理畸变的列表以生成经注释的畸变的工作;
经由至少一个畸变分优先级服务提供器(203),来执行包括处理经注释的畸变的列表以生成分优先级的经注释的畸变的列表的工作;以及
经由至少一个报告服务提供器(204),来执行至少包括经由所述基于网络的用户界面(26、28)显示经注释的畸变的列表并且经由所述基于网络的用户界面接收临床报告的报告工作。
20.根据权利要求19所述的临床基因组数据处理方法,其中,所述报告工作包括经由所述基于网络的用户界面(26、28)向第一注册用户显示所述经注释的畸变的列表,并且经由所述基于网络的用户界面接收来自所述第一注册用户的所述临床报告,并且所述报告工作还包括:
经由所述基于网络的用户界面向与所述第一注册用户不同的第二注册用户发送针对来自所述第一注册用户的第二意见的请求,并且经由所述基于网络的用户界面向所述第二注册用户显示所述经注释的畸变的列表,并且经由所述基于网络的用户界面接收来自所述第二注册用户的第二意见,并且经由所述基于网络的用户界面向所述第一注册用户显示所述第二意见。
21.根据权利要求19-20中的任一项所述的临床基因组数据处理方法,其中,与所述基因组工作流相关联的工作的所述异步地执行还包括以下中的至少一项:
经由至少一个试验匹配服务提供器(205),来执行包括将所述经注释的畸变的列表与至少一个临床试验数据库进行比较以生成至少一个临床试验推荐的工作;以及
经由至少一个治疗匹配服务提供器,来执行包括将所述经注释的畸变的列表与至少一个临床治疗数据库进行比较以生成至少一个临床治疗推荐的工作。
22.根据权利要求18-21中的任一项所述的临床基因组数据处理方法,其中,所述服务提供器(20)是无状态的,并且经由所述异步消息传送队列(24)从所述基因组工作流管理器(22)接收对于执行与所述基因组工作流相关联的所述工作所需的所有数据。
CN201780060734.0A 2016-09-29 2017-09-29 用于协同变异选择和治疗匹配报告的方法和装置 Pending CN109791795A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662401319P 2016-09-29 2016-09-29
US62/401,319 2016-09-29
PCT/EP2017/074886 WO2018060485A1 (en) 2016-09-29 2017-09-29 A method and apparatus for collaborative variant selection and therapy matching reporting

Publications (1)

Publication Number Publication Date
CN109791795A true CN109791795A (zh) 2019-05-21

Family

ID=59974459

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780060734.0A Pending CN109791795A (zh) 2016-09-29 2017-09-29 用于协同变异选择和治疗匹配报告的方法和装置

Country Status (5)

Country Link
US (2) US20190362807A1 (zh)
EP (1) EP3520007A1 (zh)
JP (1) JP2019530098A (zh)
CN (1) CN109791795A (zh)
WO (2) WO2018060365A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112509637A (zh) * 2019-09-16 2021-03-16 西门子医疗有限公司 用于交换关于基因组变异的临床意义的信息的方法和设备

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180166170A1 (en) * 2016-12-12 2018-06-14 Konstantinos Theofilatos Generalized computational framework and system for integrative prediction of biomarkers
US11593188B2 (en) * 2020-06-29 2023-02-28 Vmware, Inc. Method and apparatus for providing asynchronicity to microservice application programming interfaces
CN113223612A (zh) * 2021-04-30 2021-08-06 阿里巴巴新加坡控股有限公司 基因组的特征提取方法、疾病预测方法、装置及设备
WO2022251587A1 (en) * 2021-05-28 2022-12-01 ObjectiveGI, Inc. System and method for identifying candidates for clinical trials

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007055244A1 (ja) * 2005-11-08 2007-05-18 National University Corporation Nagoya University 遺伝子変異検出用アレイ及び検出方法
WO2012098515A1 (en) * 2011-01-19 2012-07-26 Koninklijke Philips Electronics N.V. Method for processing genomic data
WO2013070634A1 (en) * 2011-11-07 2013-05-16 Ingenuity Systems, Inc. Methods and systems for identification of causal genomic variants
US20140149485A1 (en) * 2012-11-26 2014-05-29 Accenture Global Services Limited Method and system for managing user state for applications deployed on platform as a service (paas) clouds
US20160124742A1 (en) * 2014-10-30 2016-05-05 Equinix, Inc. Microservice-based application development framework
WO2016100638A1 (en) * 2014-12-17 2016-06-23 Foundation Medicine, Inc. Computer-implemented system and method for identifying similar patients

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2420717C (en) * 1999-08-27 2010-07-27 Iris Biotechnologies, Inc. Artificial intelligence system for genetic analysis
JP2005309836A (ja) * 2004-04-22 2005-11-04 Link Genomics Kk がん診断支援システム
US8140270B2 (en) * 2007-03-22 2012-03-20 National Center For Genome Resources Methods and systems for medical sequencing analysis
US9418203B2 (en) * 2013-03-15 2016-08-16 Cypher Genomics, Inc. Systems and methods for genomic variant annotation
EP3238111A1 (en) * 2014-12-24 2017-11-01 Oncompass GmbH System and method for adaptive medical decision support

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007055244A1 (ja) * 2005-11-08 2007-05-18 National University Corporation Nagoya University 遺伝子変異検出用アレイ及び検出方法
WO2012098515A1 (en) * 2011-01-19 2012-07-26 Koninklijke Philips Electronics N.V. Method for processing genomic data
WO2013070634A1 (en) * 2011-11-07 2013-05-16 Ingenuity Systems, Inc. Methods and systems for identification of causal genomic variants
US20140149485A1 (en) * 2012-11-26 2014-05-29 Accenture Global Services Limited Method and system for managing user state for applications deployed on platform as a service (paas) clouds
US20160124742A1 (en) * 2014-10-30 2016-05-05 Equinix, Inc. Microservice-based application development framework
WO2016100638A1 (en) * 2014-12-17 2016-06-23 Foundation Medicine, Inc. Computer-implemented system and method for identifying similar patients

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112509637A (zh) * 2019-09-16 2021-03-16 西门子医疗有限公司 用于交换关于基因组变异的临床意义的信息的方法和设备

Also Published As

Publication number Publication date
EP3520007A1 (en) 2019-08-07
WO2018060485A1 (en) 2018-04-05
JP2019530098A (ja) 2019-10-17
WO2018060365A1 (en) 2018-04-05
US20190362807A1 (en) 2019-11-28
US20200020421A1 (en) 2020-01-16

Similar Documents

Publication Publication Date Title
Quazi Artificial intelligence and machine learning in precision and genomic medicine
US11100933B2 (en) Collaborative artificial intelligence method and system
Hinkson et al. A comprehensive infrastructure for big data in cancer research: accelerating cancer research and precision medicine
Ono et al. RefEx, a reference gene expression dataset as a web tool for the functional analysis of genes
Buske et al. PhenomeCentral: a portal for phenotypic and genotypic matchmaking of patients with rare genetic diseases
CN109791795A (zh) 用于协同变异选择和治疗匹配报告的方法和装置
Denny et al. PheWAS: demonstrating the feasibility of a phenome-wide scan to discover gene–disease associations
Xiang et al. AutoPVS1: An automatic classification tool for PVS1 interpretation of null variants
Rockowitz et al. Children’s rare disease cohorts: an integrative research and clinical genomics initiative
US11309060B2 (en) System and method for real time clinical questions presentation and management
US20180341746A1 (en) System and method for detecting gene fusion
CN106796620A (zh) 用于解释和报告基于序列的基因测试的方法和系统
US20140100874A1 (en) Method for displaying linked family health history on a computing device
Riggs et al. T owards a U niversal C linical G enomics D atabase: The 2012 I nternational S tandards for C ytogenomic A rrays C onsortium M eeting
US20230110360A1 (en) Systems and methods for access management and clustering of genomic, phenotype, and diagnostic data
US20160070881A1 (en) System, method and graphical user interface for creating modular, patient transportable genomic analytic data
Lytras et al. Applying big data analytics in bioinformatics and medicine
Borchert et al. Knowledge bases and software support for variant interpretation in precision oncology
Driver et al. Genomics4RD: An integrated platform to share Canadian deep‐phenotype and multiomic data for international rare disease gene discovery
Faria et al. Varstation: a complete and efficient tool to support NGS data analysis
Reyes Román et al. Integration of clinical and genomic data to enhance precision medicine: a case of study applied to the retina-macula
Benet‐Pagès et al. Variant interpretation: UCSC genome browser recommended track sets
Joshi et al. Pharma-oncogenomics in the era of personal genomics: A quick Guide to online resources and tools
Shameer et al. POEAS: automated plant phenomic analysis using plant ontology
WO2020006306A1 (en) Systems and methods for clinical guidance of genetic testing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190521

WD01 Invention patent application deemed withdrawn after publication