CN113316720A - 使用机器学习确定患者的药物有效性排序 - Google Patents

使用机器学习确定患者的药物有效性排序 Download PDF

Info

Publication number
CN113316720A
CN113316720A CN201980089031.XA CN201980089031A CN113316720A CN 113316720 A CN113316720 A CN 113316720A CN 201980089031 A CN201980089031 A CN 201980089031A CN 113316720 A CN113316720 A CN 113316720A
Authority
CN
China
Prior art keywords
drug
drugs
gene
patient
variant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980089031.XA
Other languages
English (en)
Inventor
C·L·艾费特
徐佳
C·休特纳
王芳
V·米凯利纳
E·德汉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maredif Usa
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN113316720A publication Critical patent/CN113316720A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/60ICT specially adapted for the handling or processing of medical references relating to pathologies
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Bioethics (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Toxicology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Computing Systems (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

基于计算机的方法、系统和计算机可读媒质,用于智能地访问内容储存库中的不同类型的制药信息并在变体水平、基因水平和路径水平对药物进行排序。在一些情况下,靶向相同基因、基因变体或生物途径的药物可以基于体外、临床前、临床或临床后证据进行排序。为了确定多种药物的排序,分析关于药物施用的信息。对于多种药物,确定对应于该药物的属性,其中这些属性包括该药物靶向的变体或基因,以及包括该靶向的变体或基因的生物途径。根据基于确定的疗效、效力或毒性中的一种或多种的药物有效性评分对多种药物进行排序。

Description

使用机器学习确定患者的药物有效性排序
技术领域
本发明的实施例涉及药物有效性,并且更具体地涉及使用机器学习来分析药物信息以生成针对患者的药物有效性排序并且智能地搜索和提取与给药相关的内容。
背景技术
数据库和文章储存库通常包含大量不同类型的信息的文档。例如,用户可以在NCBI的
Figure BDA0003162165540000011
数据库中搜索不同类型的同期评论的科学和临床文档。许多药物可能潜在地可用于治疗患有由常见基因组改变如HER-2阳性乳腺癌驱动的疾病的患者。然而,这些单独药物中的每一种的疗效和效力通常在患者之间显著变化。
虽然存在多种可用的涵盖临床和实验信息的数据库,但这些数据库不足以涵盖与药物和生物制剂有关的专门信息。尽管一些系统适用于抗癌治疗,涵盖批准的和研究的药物,但这些系统不提供关于药物疗效、效力和与药物施用相关的其他方面的特定和专门的信息。
此外,通常仅在已经与期刊出版商实施了机构许可证协定或者已经提交了另一种支付形式来获取对全长文档的权限时才授予对
Figure BDA0003162165540000012
中的全长研究文档的访问。为了确保数据的准确性,用户必须能够评估文档的结果部分内的图形、图形、表格和文本。在一些情况下,内容储存库可在没有智能方式访问完整内容的情况下维护数百万个文档。
内容储存库不提供用于关于药物和生物制剂的疗效和其他特征的特定内容搜索的用户界面。因此,相关信息经常丢失,并且患者可能不与最佳药物或其组合匹配。
发明内容
根据本发明的实施例,提供了用于智能地访问内容储存库中的不同类型的药物信息并且在基因变体水平、基因水平和生物途径水平上对药物进行排序的方法、系统和计算机可读介质。在一些情况下,靶向相同基因/生物途径的药物可以基于临床前、临床或临床后证据(包括药物特征)进行排序。
针对多种药物分析所提取的关于药物特征的信息。对于每种药物,测定一种或多种药物特征,包括毒性、效力和/或疗效。药物与多种属性相关,包括药物靶向的变体或基因,和包含靶向的变体或基因的生物途径。根据基于药物特征的药物有效性分数对多种药物进行排序。这种方法依赖于临床证据来确定药物特性,以便为指定靶标提供药物的最佳或有效排序。
在一些方面,药物特征可以包括用于评估药物性能或有效性(包括疗效、毒性和效力)的任何参数。本技术允许识别出具有高效力和疗效和低毒性的药物并优先给予患者。药物特征不限于效力、疗效和毒性,因为任何合适的药物特征可用于识别和排序药物。
在另一个实施例中,所提取的信息包括临床前、临床和临床后信息,从这些信息中提取药物特征。因此,本技术利用来自临床文献的证据。该信息可以用于创建机器学习模块的训练数据集以预测其他药品的药品特性,对于这些其他药品,在文献中这样的特性可能是不可用的。
在其他方面,机器学习模块可以用从所提取的信息生成的训练数据集来训练。对于不在训练数据集中的药物,可以由训练的机器学习模块预测多个药物中的每个药物的一个或多个药物特性。可以针对患者特异性癌症的治疗对这些药物进行排序,其中每种药物靶向与患者癌症相关联的特定基因、基因变体或生物途径,并且其中该排序是基于根据药物有效性分数的预测的药物特征。因此,本技术提供关于特定患者的药物的排名信息。
在其他方面,对于多种药物,可以识别共同的结构特征和相应的药物特征,包括毒性。使用在识别共同结构特征和药物特性的信息上训练的机器学习模块,可以预测其他药物与毒性相关联或不相关联。同样地,具有高毒性风险的药物可以由机器学习模块分析以预测与毒性相关的化学结构。本技术预测毒性,并且这个结果可以用于识别具有低毒性风险和其他不希望的副作用的最佳药物。
在其他方面,该多种药物可以基于共同靶标被分类成组,并且这些药物可以在每个组内排名。因此,可以以有效方式识别特定靶标(和特定患者)的最佳药物。
在其他方面,药物属性包括指示患者的基因、基因变体或生物途径的患者特异性信息,并且进一步包括识别靶向该基因的多种药物,该患者的基因变体或生物途径。可以根据基于药物特征的药物有效性分值对所识别的药物进行排序。因此,药物可以根据药物有效性分数以患者特定的方式、基于属性和药物特征进行排序。
应理解的是,本概述不旨在标识本披露的实施例的关键或必要特征,也不旨在用于限制本披露的范围。通过以下描述,本公开的其他特征将变得容易理解。
附图说明
总体上,不同附图中的相似参考数字用于指定相似部件。
图1是根据本公开的实施例的用于药物排名系统的示例计算环境的框图。
图2是根据本披露的实施例的基于药物有效性分数对药物进行排名的方式的示例流程图。
图3是示出根据本公开的实施例的不同类型的组数据的示例的图示。
图4是示出根据本披露的实施例的对癌症具有特异性的不同生物途径的实例的图解。
图5是示出根据本披露的实施例的不同药物分布的实例的图示。
图6是示出了根据本披露的实施例的基于药物特征对药物进行排名的示例流程图的图示。
图7是示出了根据本披露的实施例的对药物进行排名的方式的高级流程图。
具体实施方式
个性化癌症药物涉及将来自患者的致癌突变与适当的靶向药物疗法匹配。药物(例如,药物、生物制剂等)可包括临床前、临床或临床后研究中的任何合适疗法。本文提供了用于根据基于特定患者的药物特性的药物有效性分数对药物进行排序的方法、系统和计算机可读介质。
可以访问并分析属于临床前、临床或经批准的药物的文献以确定药物、基因、基因变体与特定疾病(如一种类型的癌症)的生物途径之间的关系。可在文档管理门户内提供的用户界面使得用户能够查询关于特定类型的癌症的药物疗效或其他药物特性(例如,药物效力、药物毒性等)的数据库。
为了实现这一点,可以从临床信息中提取与药物给予相关的证据(例如,疗效、效力、毒性、继发效应(如脱靶效应)、IC50、ED50等)。一旦提取了相关信息,可通过机器学习系统在基因水平、基因变体水平或生物途径水平的疗效和其他特征(例如,毒性、效力等)方面分析药物及其相应特征,以确定特定致癌突变的最佳药物。药物可以针对特定类型疾病(如癌症)针对特定患者排序。
图1中展示了与本发明实施例一起使用的示例环境100。具体地,该环境包括一个或多个服务器系统10以及一个或多个客户端或终端用户系统20.服务器系统10和客户端系统20可以彼此远离并且通过网络35通信。网络可以由任何数量的任何合适的通信介质(例如,广域网(WAN)、局域网(LAN)、互联网、内联网等)来实现。可替代地,服务器系统10和客户端系统20可以是彼此本地的,并且经由任何适当的本地通信介质(例如,局域网(LAN)、硬线、无线链路、内联网等)进行通信。
客户端系统20使得用户能够访问来自服务器系统10的文档和信息(例如,临床文档、所提取的文献数据、所提取的组学数据、药物排名信息、患者特定信息、生物路径等)以用于分析和评论。服务器系统可以包括药物排名系统15以对药物进行排名以便为特定患者选择和区分药物的优先级。
数据库系统40可以存储用于分析的各种信息(例如,所提取的组学数据41、所提取的文献数据42、患者特定数据43、药物排序数据44等)。数据库系统可以由任何常规或其他数据库或存储单元实现,可以在服务器系统10和客户端系统20本地或远离服务器系统10和客户端系统20,并且可以经由任何适当的通信介质(例如,局域网(LAN)、广域网(WAN)、互联网、硬线、无线链路、内联网等)进行通信。客户端系统可以呈现图形用户界面(例如,GUI等)或其他界面(例如,命令行提示、菜单屏幕等)以从用户请求关于期望的文档和药物分析的信息,并且可以提供包括分析结果(例如,药物疗效、药物排序、药物毒性、药物效力、ED50、IC50、药物的生物靶标(例如,基因、基因变体、蛋白质、其他细胞靶标)、生物途径、次级效应如脱靶效应等)的报告。
服务器系统10和客户端系统20可以由优选地配备有显示器或监视器26的任何常规或其他计算机系统来实现,基座(例如,包括至少一个处理器16、22、一个或多个存储器17、23和/或内部或外部网络接口或通信设备18、24(例如,调制解调器、网卡等)),可选的输入设备(例如,键盘、鼠标或其他输入设备)和/或用户界面19,25.以及任何商业上可获得的和定制的软件(例如,服务器/通信软件、药物排序系统15、浏览器/接口软件等)。
可替代地,一个或多个客户端系统20可以分析文档以确定在作为独立单元操作时的药物排名。在独立操作模式中,客户端系统存储或访问所提取的组学数据41、所提取的文献数据42、患者特定数据43、和药物排序数据44以及药物排序系统15。图形用户界面(例如,GUI等)或其他用户界面(例如,命令行提示、菜单屏幕等)可以从对应用户请求关于药物排名的信息,并且可以提供包括分析结果和药物排序(例如,药物排序、药物疗效、药物毒性、药物效力、IC50、ED50、药物的生物靶标(基因、基因变体、蛋白质、其他细胞靶标)、生物途径、次级效应如脱靶效应等)的报告。
提取的组学数据41和提取的文献数据42可包括来自数据库和/或文献的提取的信息,其可指示患者中疾病的存在。例如,所提取的文献数据可包括与疾病相关的基因和基因变体,以及相应的表达蛋白、转录物或其他相关分子、生物途径、药物靶标、毒性、效力、疗效、继发效应、IC50、ED50等。假定文献可由机器读取器读取。在一些方面中,光学字符辨识可用以辨识文档中的文本,从而再现可读和可搜索的文本。另外,表格、图像、图像字幕或列表中的文本也可呈现为机器可读的。该处理确保文档(例如扫描的PDF)的图像被包括在分析中。
文献数据可以包括来自数据库、科学文献、以及临床和临床前文献、以及任何其他相关信息来源的数据,这些数据涉及处于临床试验中或已经被监管机构批准的特定药物的生物靶标。在一些情况下,该信息包括与途径的特定生物分子的药物相互作用(例如,药物结合生物分子、抑制生物途径、激活生物途径、脱靶效应(包括与次要靶物的相互作用)、副作用、与其他药物的禁忌症候等的证据)。这允许生物靶标与生物途径相关联,并且建立框架以研究药物疗效和特异性。
在一些方面,疾病可以包括一种类型的癌症,例如乳癌、肺癌、胰腺癌、卵巢癌、前列腺癌等。在一些方面,可以提供(例如,由主题专家)待由药品术语提取器提取的相关术语,其中搜索术语包括基因、基因同义词、基因变体、基因变体同义词、药品、药品同义词、疾病、疾病同义词或癌症类型以及癌症类型名称同义词。
所提取的组学(omics)数据41可以包括关于患者群体的与疾病相关的基因/基因变体、与疾病相关的RNA翻译水平、与疾病相关的蛋白质表达水平等的信息。在一些情况下,可以基于患者群体的共同特征将数据分组以形成群组。
患者特定数据43可以包括患者特异性的组学数据(不是来自患者群体的数据)连同特定患者的其他病史数据(例如,药物过敏症、年龄、医学病症、用于评估禁忌症的其他药物等)。
药物排序数据44可以包括针对特定疾病(如癌症类型)的药物列表的排名。在一些情况下,排名可反映患者群体,而不是特定患者的特定信息。在其他情况下,考虑到可以应用于特定患者的患者特异性致癌突变、药物过敏、来自其他药物的禁忌症等,排名可以被细化成对该患者是特异性的。
药物排序系统15可包括一个或多个模块或单元以执行本文描述的本发明的实施方式的各种功能。不同模块(例如,药品术语提取器71、组学提取器72、机器学习模块73、生物途径模块74、药物排名模块75等)可通过任何数量的软件和/或硬件模块或单元的任何组合来实现,并且可驻留在服务器和/或客户端系统的存储器17、23内以供处理器16、22执行。
药物术语提取器71以机器可读形式解析文献(例如,诸如科学或临床出版物,其包括信息(包括临床信息等)和/或数据库,以识别与用于生物途径的特定治疗靶标的特定药物相关的信息)。在一些情况下,药品术语提取器71可包括自然语言处理(NLP)模块76,其可被配置为识别基因/基因变体名称、蛋白质名称、药品名称、生物靶标、药品的特征(例如,疗效、效力、毒性、继发效应、IC50、ED50等)及其同义词。基于NLP的工具可以半自主地提取与基于基因改变、基因变体改变和基因途径改变的药物特征相关的证据。这些药物可根据它们在基因水平、基因变体水平和/或生物途径水平的特征进行排序。
在一些方面,药物术语提取器71依赖于来自临床前、临床和临床后研究(而不是仅体外研究)的数据,从而将药物限制为由监管机构批准的或以其他方式可从临床试验获得的那些。通常,药物的机制是已知的。
此外,基因名称同义词、基因变体名称同义词、药物名称同义词和癌症类型名称同义词可以由药物术语提取器71识别并且与通用名称相联系,以便包括在此分析中。
在一些情况下,该系统可以配备有由FDA或在临床试验中批准的药物名称(和同义词)的列表。例如,系统可以提供有与药物有关的商品名、通用名、结构名和/或参考ID(例如,来自药物的数据库)等,以便从文献中识别和提取相关信息。在一些方面,药物术语提取器71可提取任何合适的信息以确定癌症药物的特征,包括但不限于疗效、毒性、效力等、与临床试验成功有关的术语、与临床试验失败有关的术语、临床试验数目、临床试验阶段、药物副作用、药物相互作用、药物结构等。在一些情况下,与生物靶标有关的术语(例如,蛋白质、细胞表面靶标、细胞靶标、细胞内靶标、细胞外靶标等)也可以由药物术语提取器71提取,而在其他情况下,与生物靶标有关的信息可以由主题专家提供。
临床文档(例如,包括临床前、临床和临床后文档和数据库)可以被识别并且相关信息的提取被自动化。在一些情况下,所提取的信息可以由主题专家来管理(例如,对于特定类型的癌症)。可以使用任何合适的来源,包括实验/研究文章、药物发现文章、临床前文章、临床后文章等。
对于每种药物,可以提取各种不同类型的药物相关信息,包括但不限于药物名称(包括通用名称和同义词)、基因/蛋白质或药物的其他生物学靶标(主要靶标),药物的毒性、脱靶效应(药物结合的次级靶)、药物的结构,效力、ED50、IC50、不良事件、患者特异性信息、药物疗效等。脱靶效应可以指以与主要靶相比更低的亲和力结合至次要靶并且可以引起可能不利地影响药物的毒性谱的生物效应的药物。
在一些情况下,所提取的信息可以根据癌症类型被组织用于分析、根据年龄范围、根据性别、根据生物途径、根据基因/基因变体、或适合于生成与特定患者相比的数据的群组的任何其他类别。所提取的信息可被存储为结构化文本或非结构化文本或其组合。
组学提取器72可从各种数据库(例如,公共、私有等)访问包含来自基因组学、表观基因组学、转录组学、蛋白质组学、代谢组学等研究的数据的组数据。组学提取器72可包含被定制成提取每种类型的生物数据的一个或多个提取器。例如,基因组/表观基因组提取器可以提取并分析基因组/表观基因组数据,包括与癌症相关的基因、基因变体以及遗传改变和突变。转录组提取器可以提取并分析癌性生物样品中的RNA表达谱(例如,以分析显示与非癌对照过表达、低表达、或类似表达的RNA谱)。蛋白质组提取器可以提取并分析癌性生物样品中的蛋白质表达谱(例如,与非癌对照相比,过表达、低表达或约相同的蛋白质)。类似地,代谢组学提取器可以提取并分析癌性生物样品中的代谢数据。生物数据可以包括任何适合的形式,包括测序数据、杂交微阵列、转录微阵列、表达微阵列、代谢微阵列等。
可以对所提取的数据进行机器学习模块73训练以识别药物与生物靶标之间的新关系,以识别毒性原因,如脱靶效应,包括与基因/基因的相互作用变体蛋白/与毒性作用连接的蛋白变体等。机器学习模块73可以提供有包括关于已知药物的信息的训练数据,包括结构、毒性、生物靶标、效力、疗效和脱靶效应等。机器学习模块可以预测有待分析的药物的这些特征(例如,毒性、生物靶标、效力、疗效、和脱靶等)中的任一个。
机器学习模块73可以使用任何合适的机器学习技术,包括但不限于统计分类,监督学习、无监督学习、人工神经网络、深度学习神经网络、聚类分析、随机森林,维度减少、二进制分类、决策树等以预测不同特征,包括但不限于毒性,药物的生物学靶标、效力、疗效和脱靶。
生物途径模块74将来自药物术语提取器71和/或组学提取器72的信息映射到生物路径。例如,已知药物与第一靶标(初级靶标)相互作用,其中靶标可以是与组数据集相关的基因、基因变体、转录物、蛋白质、代谢物等。生物途径模块74可将第一目标映射到第一生物路径。
在一些情况下,生物途径模块74可以将副作用(脱靶)映射到生物路径。这可针对多种药物重复,从而允许将来自多种药物的继发效应映射到一个或多个生物途径。生物途径可以基于预先确定的基因组来确定。在一些情况下,生物途径可以与毒性相关联。通过主要或次要作用与这些途径相互作用的药物可以比不与这些途径相互作用的药物排名更低。因此,生物途径不仅可以确定适合于患者中特定突变的药物,而且生物途径也可以用于优先化不与毒性相关途径相互作用的药物。
药物排序模块75可接受来自生物途径模块74、药物术语提取器71、机器学习模块73和/或组学提取器72的输入以及患者特定数据43。适合于特定患者的一组药物可被提供给药物排序模块75,并且该模块可以基于导致更高排名(例如,良好疗效、高效力(例如,nM或pM范围)、无已知的次级靶标、低毒性等)的有效性的正因素对药物进行排名,或导致较低等级的有效性的负面因素(例如,有限效力、低效力、多重次要靶标、高毒性等)。靶向相关生物途径的药物可以基于患者特异性数据来鉴别,并且关于药物的特征的所提取的信息可以用于基于组学和其他数据(例如,肿瘤类型、肿瘤突变、临床数据、病史等)针对特定患者对药物进行排名。基于接收的信息,药物排序模块为特定患者排序药物集,其可存储在药物排序数据44中。
本技术提供了高粒度的再生药物相互作用、疗效、和其他特征,并且可以被定制以识别针对特定患者的最佳治疗。
图2是用于确定药物排名的示例操作的流程图。在操作210,从临床文献中提取药物信息。药物信息可以包括但不限于主要靶标、疗效、毒性、副作用、效力、ED50、IC50等。在操作220,药物任选地通过癌症类型、基因突变和/或可能的其他患者特异性因子分组。在操作230处,根据所提取的药物信息训练机器学习模型以预测针对缺少从文献中提取的特征的其他药物的效力、疗效、主要作用、生物靶标、毒性、次要作用(脱靶作用)等。在一些情况下,机器学习模块可预测癌症药物是否与患者随时间发展继发性疾病或癌症的风险相关联。在操作240,基于药物的生物目标信息(从提取的药物信息获得)被映射到生物途径。
在操作250处,获得患者特定的组学数据,例如,指示患者的癌症的类型和一种或多种类型的体信息,其可包括基因组序列(例如,包括与癌症相关的突变、与癌症相关的特定驱动基因的存在、基因、基因变体等),RNA表达水平(例如,包括与癌症相关的特定转录物)、蛋白质表达水平(例如,包括与癌症、过表达和/或表达不足等相关的一种或多种生物标志物)。在一些方面,组学数据可以由组学服务提供者(例如,进行基因组测序和/或提供微阵列分析或其他服务以评估基因翻译、蛋白质表达等的公司)分析和提供,可以向患者或医疗提供者提供关于报告结果的报告,并且可以识别与癌症相关的基因组突变、基因变体或特定蛋白质/转录物。
在操作260,患者特异性组学数据被映射到生物路径。例如,如果患者特异性数据显示生物途径的特定蛋白质或基因中的突变,则该系统将识别生物途径中存在的蛋白质或基因。一旦目标已知,药物排序系统可以确定哪些药物最适于给药。在一些情况下,药物可以被映射到生物路径(例如,以确定哪些药物作用于包含患者特异性突变的生物路径)。次级效应也可以映射到生物路径。在一些情况下,副作用(脱靶结合)可以与毒性或其他不希望的药物特征相关联。可以识别与毒性相关的生物途径,并且用于基于与这些识别的途径的相互作用识别可能具有毒性问题的其他药物。在操作270,机器学习模块在提取的信息上训练,并用于预测药物特性。在操作280,基于靶向与患者的组学信息和癌症类型相关的特定癌症通路的药物有效性分数对多种药物(或它们的组合)进行排序。药物有效性分数可以反映各种药物特征(例如,疗效、毒性、效力等)的加权组合。
图3示出了包括但不限于来自基因组学、表观基因组学、转录组学、蛋白质组学、代谢组学等研究的数据的组学数据。在一些方面,组学数据可以从公开可获得的数据库获得,这些数据库可以包括来自微阵列的出版物、序列、表达或转录水平分析、组学研究的其他结果等。组学数据可包括来自患者群体的数据,并且可被提取并存储在提取的组学数据41中。
对于这些类别中的每一个,可以分析数据以识别不同癌症相关靶标。例如,可以分析基因组/表观基因组数据以识别与癌症相关的基因和突变,以及涉及癌症发展和发病机理的分子的转录和表达水平。某些类型的癌症可以具有与生物途径相关的特异性转录或表达谱。该信息可映射到生物途径以指示致癌突变和其他致癌因子。
因此,组学提取器72可以识别与个体群体的特定类型的癌症相关的特定信息(例如,突变、转录谱、表达谱等)。该信息可被存储为提取的组学数据41。
当向系统提供患者特异性信息(例如,患者特定数据43)时,具有来自基于定位的群体的组学信息的癌症相关信息的生物途径可以用于识别针对特定生物靶标的潜在药物靶标和/或与特定患者相关联的途径。患者特异性数据43可包括基因组信息、转录组信息、蛋白质组信息、代谢信息等,或与特定患者有关的任何其他合适的药理学或实验信息。基于此方法,可以将特定生物靶标和/或途径识别为患者的潜在药物靶标。
图4示出了各种生物途径。在这个实例中,这些途径显示为根据包括细胞运动性、细胞生长、细胞活力、以及细胞分化和细胞淤积的类别来安排。这些节点代表该途径中具有特定生物/化学结构的不同实体(例如,蛋白质、化学分子等)。黑色箭头示出了生物路径的节点之间的互连性。在这个实例中,外圆表示细胞的轮廓,而内圆表示细胞核的轮廓。
多种生物途径可以按多种方式靶向,包括细胞外、在细胞膜上、在细胞质水平上在细胞内、以及在控制基因表达的细胞核内。
示例生物目标显示为空心圆,其对应于药物的不同潜在生物目标。靶标1(包含数字1的圆圈)对应于没有已知次级相互作用的药物靶标(例如,对于特定药物)。靶标2(包含数字2的圆圈)对应于另一个药物靶标。靶标3和4代表与毒性相关的其他药物的次要靶标。
在细胞生长类别中,靶标3、4沿着相同的生物途径存在,两者都反映次级靶标,并且与药物毒性相关联。在这种情况下,药物排序模块将考虑沿着此相同生物途径的任何靶标2与毒性相关联,并且因此可能不会将沿着此途径的药物优先于其他无毒途径中的药物。
此外,可以将靶向相同基因、相同基因变体、或相同生物途径的药物分组,并且可以确定每种药物相对于类别的相应疗效、毒性、副作用、效力、ED50、和IC50。在一些情况下,单一癌基因可以被具有不同特征的不同药物靶向。药物排序系统可以基于特定药物和/或患者特异性组学概况以患者特异性方式对药物排序。
图5示出了分析多种药物并且发现药物与其靶标之间的新模式和关系的实例。例如,第一药物(药物1谱)和第二药物(药物2谱)可结合相同的生物靶标(基因X或蛋白质Z)。第一药物的毒性是未知的,但是可以使用机器学习模块基于提取的信息来导出。
机器学习模块可用于确定药物特性。可以将训练数据提供给机器学习模块作为药物简档。一旦经过训练,机器学习系统可以预测具有未知毒性的药物1是否可能具有毒性副作用。在这种情况下,机器学习系统可以在多个将毒性与次级生物靶标联系起来的药物特征曲线上进行训练。根据这个信息,机器学习模块可以确定结合至次级生物靶标的药物1也可能具有毒性副作用。因此,在这个实例中,药物2可以被选择用于患者给予以治疗一种特定类型的癌症,因为第一药物是与毒性(一种不希望的副作用)相关的次级生物靶标相关联的。
作为另一个实例,可以针对毒性来评估多种药物的谱。具有高于阈值的毒性的药物可以被分组在一起,并且这些药物可以针对与该毒性相关的共同特征进行评估。例如,如果一组药物与毒性相关的基因或蛋白质相互作用(继发效应),则可以评估该组药物的共同结构特征(例如,特定侧链、杂环基等的存在),所述共同结构特征可以是所有药物共有的,并因此可能与毒性相关。在图5中,由于侧链A1的存在,药物3可以被标记为潜在地具有毒性,侧链A1是已知具有毒性的多种其他药物的共同特征。另外,可以针对毒性标记具有这些相同特征的新药物。可以选择与毒性无关的药物用于给予患者。
作为又另一个实例,可以评估一组基因的协同作用或缺乏协同作用。经由脱靶效应与第一组基因相互作用(例如,与A、R、Y基因相互作用->证明协同作用并且不具有毒性)的药物将被选择超过与第二组基因相互作用(例如,与A、D、Y基因相互作用->证明缺乏协同作用并且具有毒性)的另一种药物。
作为又另一个实例,可以评估对具有特定副作用的药物作出反应的患者以识别副作用的原因。例如,如果约百分之三的患者群体在服用特定药物时展现毒性作用,那么来自不良群体的患者特异性数据可以与对照群体(服用药物而没有副作用的那些)进行比较,以确定潜在负责关闭靶向效应(例如,不利群体中的遗传共性、病史中的共性等)的特征。例如,3%的患者可能在基因中具有突变,这可能导致不良作用,例如,来自药物结合(增加的亲和力)相应的突变蛋白。
因此,这些技术允许基于所提取的信息和机器学习针对单独药物生成曲线,并且可以使用排序模块75对药物进行评分和排序以确定针对具有特定类型癌症的给定患者的有效药物。
图6示出了用于对药物进行排序的流程图。最初,排名可限于强、中和低类别。一旦机器学习模块被训练,药物可以被数字排序,其中该排序基于针对给定生物目标的毒性、效力、ED50、IC50、临床疗效等中的任何一个或多个。为了排序,可以将提取的数据(例如,基因、基因变体、生物靶标等)映射到生物途径,这些生物途径也可以从文献中提取。
在操作710处,获得患者特异性数据,并且可以使用患者特异性数据来确定用于治疗患者的癌症的生物靶标。在操作720,系统15确定哪些药物靶向从患者特异性数据识别的基因/基因变体/生物途径。在操作730,将与药物有效性有关的差分加权概念应用于每个药物,并且可以计算药物有效性分数。取决于应用什么概念/权重,药物有效性分数可以表示药物的不同特性,包括但不限于疗效、毒性、效力、患者特异性因素(例如,身体信息、病史)等。疗效是药物的最大效果(不论剂量如何)。效力是产生特定效果所需的药物的量。毒性对应于导致不良作用(例如,呼吸困难、器官损伤等)的药物的量。
在一些情况下,靶向相同基因、基因变体和/或信号传导途径的药物可以分组在一起,并且各自使用与应用于每种药物的药物有效性相关的差异加权概念排序。计算药物有效性分值,其中药物有效性分值可以表示药物的不同特性,这取决于应用什么概念/权重。
在其他情况下,每种药物可以基于就在基因、基因变体和/或信号传导途径水平(不受相同靶标的限制)上的有效性(例如,使用与药物特征相关的差异加权概念,包括毒性、疗效、继发效应、效力等)而言的药物有效性分数进行排序。
在一些方面,药物排名可以将药物分配到层级,其中层级1具有基于肿瘤反应或IC50值的最高/最佳疗效;层2具有基于肿瘤响应或IC50值的中等/中等疗效;并且层3具有低/无疗效,基于肿瘤响应或IC50值。在一些情况下,靶向相同基因、相同基因变体、相同生物途径的药物可以按等级分组。
因此,药物可以根据等级(不限于相同的基因、变体或途径)进行排序。一旦分层排序完成,通过分组靶向相同基因/基因变体或生物途径的药物,每个分层可经历进一步的排序。
可以提供关于特定药物的另外类型的信息,如监管批准状态(在FDA和非美国国家)、与耐药性的已知关联、药物是否通过血脑屏障、以及药物的化学结构,这些也可以在分析和排序中考虑。
该信息可以被集成到用于案件管理的数据管理门户中。可以将靶向特定基因、基因突变或生物途径的药物呈现给医师或具有药物排名的其他医疗保健提供者,以驱动选择具有特定基因改变、基因突变或生物途径改变的患者的治疗选项。
图7示出了示例操作的流程图。在操作810,分析关于多个药品的药品特征的提取信息。在操作815,对于每个药物,确定一个或多个药物特性。药物特征可以包括毒性、效力和疗效。在操作820,每种药物与多种属性相关联,包括药物靶向的变体或基因,以及包括变体或基因的生物途径。在一些情况下,基因名称可以包括基因名称同义词和基因变体名称同义词,并且药物名称可以包括药物名称同义词。在操作825,使用基于选自由疗效、效力和/或毒性组成的组的一种或多种药物特性的药物有效性分数对多种药物进行排序。
可以基于以下标准中的一种或多种来组合药物,这些标准包括特定疾病、基因、基因同义词、基因变体、基因变体同义词药物、药物名称同义词、癌症类型以及癌症类型名称同义词。
本技术提供了优于现有方法的各种优点,包括生成多层系统以对影响同一目标的药物进行排名。第一层可以包括从文献和/或数据库提取基因、基因变体和/或信号传导途径。第二层按照在基因、基因变体和/或信号传导途径水平上的疗效或其他药物特征(例如,毒性、继发效应、效力等)对每种药物进行排序。第三层级组将靶向相同基因、基因变体和/或信号传导途径的药物一起排序。本技术还可以使用来自文献的临床前数据(提取的IC50值)和/或临床试验(效力)用于药物排序。可以提取癌症特异性信息,并且将其与用于个性化的基于基因组学的药物的机器学习结合使用。
将认识到,以上描述的并且在附图中展示的实施例仅表示实施根据给予(例如,疗效、毒性、患者特异性、效力、脱靶效应等)对药物进行排名的实施例的许多方式中的一些。
本发明实施例的环境可以包括任意数量的计算机或其他处理系统(例如,客户端或终端用户系统、服务器系统等)和以任何期望的方式布置的数据库或其他储存库,其中,本发明的实施例可以应用于任何期望类型的计算环境(例如,云计算、客户端-服务器、网络计算、大型机、独立系统等)。本发明的实施例所采用的计算机或其他处理系统可由任何数目的任何个人或其他类型的计算机或处理系统(例如,台式机、膝上型计算机、PDA、移动设备等)来实现,并且可以包括任何可商购的操作系统以及可商购和定制软件(例如,浏览器软件、通信软件、服务器软件、药物排名系统等)的任何组合。这些系统可包括任何类型的监视器和输入设备(例如,键盘、鼠标、语音识别等)以输入和/或查看信息。
应当理解的是,本发明的实施例的软件(例如,药物术语提取器71、组学提取器72、机器学习模块73、生物途径模块74、药物排序模块75等)可以用任何期望的计算机语言来实现,并且可以由计算机领域的普通技术人员基于说明书中所包含的功能描述和附图中所展示的流程图来开发。进一步,本文对执行不同功能的软件的任何引用通常指代在软件控制下执行那些功能的计算机系统或处理器。本发明的实施例的计算机系统可以可替代地由任何类型的硬件和/或其他处理电路来实现。
计算机或其他处理系统的不同功能可以任何方式分布在任何数量的软件和/或硬件模块或单元中,处理或计算机系统和/或电路,其中计算机或处理系统可以彼此本地或远程地布置并且经由任何合适的通信介质(例如,LAN、WAN、内联网、互联网、硬线、调制解调器连接、无线等)进行通信。例如,本发明实施例的功能可以任何方式分布在各种终端用户/客户端和服务器系统和/或任何其他中间处理设备中。上述和在流程图中示出的软件和/或算法可以以实现本文描述的功能的任何方式修改。此外,流程图或描述中的功能可以以实现所需操作的任何顺序执行。
本发明实施例的软件(例如,药品术语提取器71、组学提取器72、机器学习模块73、生物途径模块74、药品排名模块75等)可以在固定或便携式程序产品装置或设备的非瞬态计算机可用介质(例如,磁性或光学介质、磁光介质、软盘、CD-ROM、DVD、存储器设备等)上可用,以便与独立系统或通过网络或其他通信介质连接的系统一起使用。
通信网络可由任何数量的任何类型的通信网络(例如,LAN、WAN、互联网、内联网、VPN等)实现。本发明实施例的计算机或其他处理系统可包括任何常规或其他通信装置以经由网络任何常规或其他协议。计算机或其他处理系统可利用任何类型的连接(例如,有线、无线等)来访问网络。本地通信介质可以由任何合适的通信介质(例如,局域网(LAN)、硬线、无线链路、内联网等)来实现。
该系统可以采用任何数量的任何常规或其他数据库、数据存储或存储结构(例如,文件、数据库、数据结构、数据或其他储存库等)来存储信息(例如,所提取的组学数据41、所提取的文献数据42、患者特定数据43、药物排序数据44等)。该数据库系统可以由任何数量的任何常规或其他数据库、数据存储或存储结构(例如,文件、数据库、数据结构、数据或其他储存库等)实现以存储信息(例如,所提取的组学数据41、所提取的文献数据42、患者特定数据43、药物排序数据44等)。数据库系统可以被包括在服务器和/或客户端系统内或耦合到服务器和/或客户端系统。数据库系统和/或存储结构可以远离计算机或其他处理系统或在计算机或其他处理系统本地,并且可以存储任何期望的数据(例如,提取的组学数据41、提取的文献数据42、患者特定数据43、药物排序数据44等)。
本发明的实施例可以采用用于获得或提供信息(例如,所提取的组学数据41、所提取的文献数据42、患者特定数据43、药物排序数据44等)的任何数量的任何类型的用户界面(例如,图形用户界面(GUI)、命令行、提示等),其中该接口可以包括以任何方式安排的任何信息。界面可包括布置在任何位置处的任何数量的任何类型的输入或致动机构(例如,按钮、图标、字段、框、链接等)以输入/显示信息并经由任何合适的输入设备(例如,鼠标、键盘等)发起期望的动作。界面屏幕可包括用于以任何方式在屏幕之间导航的任何合适的致动器(例如,链接、选项卡等)。
该报告可以包括经排名的药物列表以及以任何方式安排的任何其他信息,并且可以基于规则或其他标准进行配置以向用户提供所希望的信息(例如,疗效、毒性、患者特异性等)。
本发明的实施例不限于上述特定任务或算法,而是可以用于其中基于在包括非结构化和/或结构化文档的整个语料库中分散的特性而需要药物排名的任何应用。
在此使用的术语仅用于描述具体实施例的目的并且不旨在限制本发明。如在此使用的,单数形式“一个”、“一种”和“该”旨在也包括复数形式,除非上下文另外清楚地指示。将进一步理解,术语“包括”(comprises)、“包含”(comprising)、“包含”(includes)、“包括”(including)、“具有”(has)、“具有”(have)、“具有”(having),“具有”(with)等,当在本说明书中使用时,指明所述特征的存在,整体、步骤、操作、元件和/或组件,但不排除一个或多个其他特征的存在或添加,整体、步骤、操作、元件、组件和/或其组。
以下权利要求书中的所有装置或步骤加上功能元件的相应结构、材料、动作和等效物旨在包括用于结合如具体要求保护的其他要求保护的元件来执行功能的任何结构、材料或动作。本发明的描述是出于说明和描述的目的而呈现的,但不旨在是穷尽性的或局限于所披露的形式的本发明。在不脱离本发明的范围和精神的情况下,许多修改和变化对本领域的普通技术人员将是显而易见的。选择和描述实施例以便最好地解释本发明的原理和实际应用,并且使得本领域普通技术人员能够针对具有适合于所考虑的特定用途的不同修改的不同实施例理解本发明。
已经出于说明的目的呈现了本发明的不同实施例的描述,但不旨在是穷尽性的或局限于所披露的实施例。在不背离所描述的实施例的范围和精神的情况下,许多修改和变化对本领域的普通技术人员而言将是显而易见的。选择在此使用的术语以最佳地解释实施例的原理、实际应用或在市场上找到的技术上的技术改进,或使得本领域普通技术人员能够理解在此披露的实施例。
本发明可以是任何可能的集成技术细节水平的系统、方法和/或计算机程序产品。所述计算机程序产品可包含上面具有计算机可读程序指令的计算机可读存储媒体(或媒体),所述计算机可读程序指令用于致使处理器执行本发明的方面。
计算机可读存储介质可以是可以保留和存储指令以供指令执行设备使用的有形设备。计算机可读存储媒质可以是例如但不限于电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或前述各项的任何合适的组合。计算机可读存储媒质的更具体例子的非穷举列表包括以下:便携式计算机盘,硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存),静态随机存取存储器(SRAM)、便携式紧凑盘只读存储器(CD-ROM),数字通用盘(DVD)、记忆棒、软盘、机械编码设备(诸如穿孔卡片)或具有记录在其上的指令的凹槽中的凸起结构),以及上述的任意合适的组合。如本文中所使用的计算机可读存储媒质不应被解释为瞬态信号本身,诸如无线电波或其他自由传播的电磁波、通过波导或其他传输媒质传播的电磁波(例如,通过光纤电缆的光脉冲)、或通过导线传输的电信号。
在此描述的计算机可读程序指令可以从计算机可读存储介质下载到相应的计算/处理设备或经由网络(例如,互联网、局域网、广域网和/或无线)下载到外部计算机或外部存储设备
网络可以包括铜传输电缆、光传输光纤、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配器卡或网络接口从网络接收计算机可读程序指令,并转发计算机可读程序指令以存储在相应计算/处理设备内的计算机可读存储媒质中。
用于执行本发明的操作的计算机可读程序指令可以是汇编指令,指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据,集成电路的配置数据,或以一种或多种编程语言的任何组合编写的源代码或目标代码,包括面向对象的Smalltalk、C++等编程语言,以及过程式编程语言,例如“C”编程语言或类似的编程语言。计算机可读程序指令可完全在用户的计算机上执行、部分在用户的计算机上执行、作为独立软件包执行、部分在用户的计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在后一种情形中,远程计算机可以通过任何类型的网络(包括局域网(LAN)或广域网(WAN))连接到用户的计算机,或者可以连接到外部计算机(例如,通过使用互联网服务提供商的互联网)。在一些实施例中,电子电路(包括例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA))可以通过利用计算机可读程序指令的状态信息来执行计算机可读程序指令以使电子电路个性化,以便执行本发明的方面。
本文中参考根据本发明的实施例的方法、设备(系统)和计算机程序产品的流程图说明和/或框图描述本发明的方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令来实现。这些计算机可读程序指令可以被提供给通用计算机的处理器,专用计算机或其他可编程数据处理装置,以产生机器,其通过计算机或其他可编程数据处理装置的处理器执行,创建用于实现在流程图和/或方框图的一个或多个方框中指定的功能/动作的装置。这些计算机可读程序指令还可存储在可指导计算机的计算机可读存储媒质中,可编程数据处理装置,和/或以特定方式起作用的其他设备,使得具有存储在其中的指令的计算机可读存储媒质包括制造的文档,该制造的文档包括实现在流程图和/或框图的一个或多个框中指定的功能/动作的各方面的指令。
计算机可读程序指令还可以加载到计算机、其他可编程数据处理装置上,或使得在计算机上执行一系列操作步骤的其他装置,其他可编程装置或其他设备,以产生计算机实现的过程,使得在计算机上执行的指令,其他可编程装置或其他设备实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图展示了根据本发明的各个实施例的系统、方法和计算机程序产品的可能实现方式的架构、功能和操作。对此,流程图或框图中的每个方框可以代表模块、段或指令的一部分,其包括用于实现规定的逻辑功能的一个或多个可执行指令。在一些替代实施例中,框中所标注的功能可以不以图中所标注的次序发生。例如,取决于所涉及的功能,连续示出的两个框实际上可以基本上同时执行,或者这些框有时可以以相反的顺序执行。还将注意的是,框图和/或流程图中的每个框、以及框图和/或流程图中的框的组合可以由基于专用硬件的系统来实现,所述基于专用硬件的系统执行指定的功能或动作或执行专用硬件与计算机指令的组合。

Claims (20)

1.一种确定药物特征的方法,包括:
分析提取的关于多种药物的给药信息;
对于每种药物,确定对应于所述药物的多个属性的一种或多种药物特征,其中所述属性包括所述药物靶向的变体或基因,以及包括所述变体或所述基因的生物途径;并且
根据基于所确定的药物特性的药物有效性分值对所述多种药物进行排序。
2.如权利要求1所述的方法,其中所述药物特性选自疗效、毒性和效力中的一种或多种。
3.如权利要求1所述的方法,其中所提取的信息包括临床前、临床和临床后信息,并且其中所提取的信息包括药物特征。
4.如权利要求3所述的方法,包括:
利用提取的信息训练机器学习模块;
基于所述经训练的机器学习模块预测所述多个药品中的每个药品的一个或多个药品特性;并且
对用于治疗患者特异性癌症的药物进行排序,其中每种药物靶向与患者癌症相关的特定基因、基因变体或生物途径,以及基于预测的药物特征。
5.如权利要求1所述的方法,包括:
对于多种药物,识别共同的结构特征和相应的药物特征;
识别哪些药物与毒性相关;并且
使用在识别所述共同结构特征和所述药物特性的信息上训练的机器学习模块来预测所述多种药物中与毒性相关联的其他药物。
6.如权利要求1所述的方法,其中,基于共同目标将所述多种药物分类成组,并且对每组内的所述药物进行排序。
7.如权利要求1所述的方法,其中这些属性包括指示患者的基因、基因变体或生物途径的患者特异性信息,并且进一步包括:
识别靶向患者的基因、基因变体或生物途径的多种药物;并且
基于所述药物有效性分值对所述患者的所识别的药物进行排序。
8.一种用于对内容储存库内的文档进行分类的计算机系统,其中所述系统包括至少一个处理器,所述处理器被配置为:
分析提取的关于多种药物的给药信息;
对于每种药物,确定对应于所述药物的多种属性的一种或多种药物特征,其中所述属性包括所述药物靶向的变体或基因,和包含所述变体或所述基因的生物途径;并且
根据基于所确定的药物特性的药物有效性分值对所述多种药物进行排序。
9.如权利要求8所述的系统,其中所述药物特性选自疗效、毒性和效力中的一种或多种。
10.如权利要求8所述的系统,其中,所述提取的信息包括临床前、临床和临床后信息,并且其中,所述提取的信息包括药物特征。
11.如权利要求10所述的系统,其中,所述处理器还被配置为:
利用所提取的信息来训练机器学习模块;
基于所述经训练的机器学习模块预测所述多个药品中的每个药品的一个或多个药品特性;并且
对用于治疗患者特异性癌症的药物进行排序,其中每种药物靶向与患者癌症相关的特定基因、基因变体或生物途径,以及基于预测的药物特征。
12.如权利要求8所述的系统,其中该处理器进一步经配置以:
对于多种药物,识别共同的结构特征和相应的药物特征;识别哪些药物与毒性相关;并且
使用在识别所述共同结构特征和所述药物特性的信息上训练的机器学习模块来预测所述多种药物中与毒性相关联的其他药物。
13.如权利要求8所述的系统,其中,基于共同目标将所述多种药物分类成组,并且其中,所述处理器进一步被配置为将每组内的所述药物排序。
14.如权利要求8所述的系统,其中所述属性包括指示患者的基因、基因变体或生物途径的患者特异性信息,并且其中所述处理器进一步配置成:
识别靶向患者的基因、基因变体或生物途径的多种药物;并且
基于所述药物有效性分数对所述患者的所识别的药物进行排序。
15.一种用于对内容储存库中的文档进行分类的计算机程序产品,所述计算机程序产品包括其中体现有程序指令的计算机可读存储媒质,所述程序指令可由计算机执行以使得所述计算机:
分析提取的关于多种药物的给药信息;
对于每种药物,确定对应于所述药物的多种属性的一种或多种药物特征,其中所述属性包括所述药物靶向的变体或基因,和包含所述变体或所述基因的生物途径;并且
根据基于所确定的药物特性的药物有效性分值对所述多种药物进行排序。
16.如权利要求15所述的计算机程序产品,其中所述药物特性选自疗效、毒性和效力中的一种或多种。
17.如权利要求15所述的计算机程序产品,其中该提取的信息包括临床前、临床和临床后信息,并且其中该提取的信息包括药物特性。
18.如权利要求15所述的计算机程序产品,其中,所述程序指令还可执行以用于:利用所提取的信息来训练机器学习模块;
基于所述经训练的机器学习模块预测所述多个药品中的每个药品的一个或多个药品特性;并且
对用于治疗患者特异性癌症的药物进行排序,其中每种药物靶向与患者癌症相关的特定基因、基因变体或生物途径,以及基于预测的药物特征。
19.如权利要求15所述的计算机程序产品,其中,所述程序指令还可执行以用于:针对多种药品,识别共同结构特征和相应的药品特性;
识别哪些药物与毒性相关;以及
使用在识别所述共同结构特征和所述药物特性的信息上训练的机器学习模块来预测所述多种药物中与毒性相关联的其他药物。
20.如权利要求15所述的计算机程序产品,其中这些属性包括指示患者的基因、基因变体或生物途径的患者特异性信息,并且其中这些程序指令进一步可执行用于:
识别靶向患者的基因、基因变体或生物途径的多种药物;以及
基于所述药物有效性分值对所述患者的所识别的药物进行排序。
CN201980089031.XA 2019-01-15 2019-12-06 使用机器学习确定患者的药物有效性排序 Pending CN113316720A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/248,084 US11721441B2 (en) 2019-01-15 2019-01-15 Determining drug effectiveness ranking for a patient using machine learning
US16/248,084 2019-01-15
PCT/IB2019/060507 WO2020148585A1 (en) 2019-01-15 2019-12-06 Determining drug effectiveness ranking for a patient using machine learning

Publications (1)

Publication Number Publication Date
CN113316720A true CN113316720A (zh) 2021-08-27

Family

ID=71517795

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980089031.XA Pending CN113316720A (zh) 2019-01-15 2019-12-06 使用机器学习确定患者的药物有效性排序

Country Status (4)

Country Link
US (1) US11721441B2 (zh)
JP (1) JP2022516409A (zh)
CN (1) CN113316720A (zh)
WO (1) WO2020148585A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113838583A (zh) * 2021-09-27 2021-12-24 中国人民解放军空军军医大学 一种基于机器学习的智能药品疗效评价方法及其应用

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019237015A1 (en) * 2018-06-08 2019-12-12 The Trustees Of Columbia University In The City Of New York Methods and systems for predicting success rates of clinical trials
US11074262B2 (en) 2018-11-30 2021-07-27 International Business Machines Corporation Automated document filtration and prioritization for document searching and access
US11061913B2 (en) 2018-11-30 2021-07-13 International Business Machines Corporation Automated document filtration and priority scoring for document searching and access
US10949607B2 (en) 2018-12-10 2021-03-16 International Business Machines Corporation Automated document filtration with normalized annotation for document searching and access
US11068490B2 (en) 2019-01-04 2021-07-20 International Business Machines Corporation Automated document filtration with machine learning of annotations for document searching and access
US10977292B2 (en) 2019-01-15 2021-04-13 International Business Machines Corporation Processing documents in content repositories to generate personalized treatment guidelines
CN110245217B (zh) * 2019-06-17 2022-07-22 京东方科技集团股份有限公司 一种药品推荐方法、装置及电子设备
US20220188654A1 (en) * 2020-12-16 2022-06-16 Ro5 Inc System and method for clinical trial analysis and predictions using machine learning and edge computing
US20220208305A1 (en) * 2020-12-24 2022-06-30 Tempus Labs, Inc. Artificial intelligence driven therapy curation and prioritization
CN112331262A (zh) * 2021-01-06 2021-02-05 北京百度网讯科技有限公司 亲和度预测方法及模型的训练方法、装置、设备及介质
CN113724806A (zh) * 2021-08-03 2021-11-30 邢传华 确定临床试验入组对象、适用药物的方法、设备和介质
US20230260600A1 (en) * 2022-02-16 2023-08-17 Stokely-Van Camp, Inc. High Efficacy Functional Ingredient Blends
US11908583B2 (en) * 2022-05-02 2024-02-20 Kpn Innovations, Llc. Apparatus and method for determining toxic load quantifiers

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040193019A1 (en) * 2003-03-24 2004-09-30 Nien Wei Methods for predicting an individual's clinical treatment outcome from sampling a group of patient's biological profiles
US20060036368A1 (en) * 2002-02-04 2006-02-16 Ingenuity Systems, Inc. Drug discovery methods
CN101068936A (zh) * 2004-11-22 2007-11-07 惠氏公司 用于实体瘤预后及治疗的方法和系统
WO2010024926A2 (en) * 2008-08-28 2010-03-04 Aureon Laboratories, Inc. Systems and methods for treating, diagnosing and predicting the occurrence of a medical condition
US20110230360A1 (en) * 2008-09-05 2011-09-22 Aueon ,Inc. a corporation Methods for stratifying and annotating cancer drug treament options
US20130166320A1 (en) * 2011-09-15 2013-06-27 Nextbio Patient-centric information management
CN104200069A (zh) * 2014-08-13 2014-12-10 周晋 一种基于症状分析和机器学习的用药推荐系统和方法
CN105144178A (zh) * 2013-01-29 2015-12-09 分子健康股份有限公司 用于临床决策支持的系统和方法
US20160132632A1 (en) * 2014-11-10 2016-05-12 Insilico Medicine, Inc. System, Method and Software for Improved Drug Efficacy and Safety in a Patient
CN105706097A (zh) * 2013-06-28 2016-06-22 南托米克斯有限责任公司 用于诊断检测的识别的途径分析
US20160224739A1 (en) * 2015-01-29 2016-08-04 Pathway Pharmaceuticals Ltd System, Method and Software for Predicting Clinical Outcome of a Drug Treatment of Breast Cancer in a Patient
CN106104540A (zh) * 2014-03-27 2016-11-09 宝洁公司 用于评估治疗对生物过程和途径的效果的方法
CN106708959A (zh) * 2016-11-30 2017-05-24 重庆大学 一种基于医学文献数据库的组合药物识别与排序方法
CN106815486A (zh) * 2017-01-22 2017-06-09 华中农业大学 一种个性化用药的系统药理学方法
US20170193157A1 (en) * 2015-12-30 2017-07-06 Microsoft Technology Licensing, Llc Testing of Medicinal Drugs and Drug Combinations
CN106971071A (zh) * 2017-03-27 2017-07-21 为朔医学数据科技(北京)有限公司 一种临床决策支持系统及方法
US20180060483A1 (en) * 2016-08-23 2018-03-01 Standigm Method for predicting therapeutic efficacy of combined drug by machine learning ensemble model
US20180190381A1 (en) * 2015-06-15 2018-07-05 Nantomics, Llc Systems And Methods For Patient-Specific Prediction Of Drug Responses From Cell Line Genomics
US20180261333A1 (en) * 2017-03-07 2018-09-13 Anivive Lifesciences, Inc. Drug discovery platform
CN109074428A (zh) * 2015-12-12 2018-12-21 塞弗欧米公司 计算机实现的针对群体的药物安全性评估

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010034023A1 (en) 1999-04-26 2001-10-25 Stanton Vincent P. Gene sequence variations with utility in determining the treatment of disease, in genes relating to drug processing
US7130848B2 (en) 2000-08-09 2006-10-31 Gary Martin Oosta Methods for document indexing and analysis
US20030040002A1 (en) 2001-08-08 2003-02-27 Ledley Fred David Method for providing current assessments of genetic risk
US7461006B2 (en) 2001-08-29 2008-12-02 Victor Gogolak Method and system for the analysis and association of patient-specific and population-based genomic data with drug safety adverse event data
US20040142325A1 (en) 2001-09-14 2004-07-22 Liat Mintz Methods and systems for annotating biomolecular sequences
US7225183B2 (en) 2002-01-28 2007-05-29 Ipxl, Inc. Ontology-based information management system and method
US7111000B2 (en) 2003-01-06 2006-09-19 Microsoft Corporation Retrieval of structured documents
US20050060305A1 (en) 2003-09-16 2005-03-17 Pfizer Inc. System and method for the computer-assisted identification of drugs and indications
US9495349B2 (en) 2005-11-17 2016-11-15 International Business Machines Corporation System and method for using text analytics to identify a set of related documents from a source document
US10796801B2 (en) 2006-02-13 2020-10-06 David G. Silverman Method and system for assessing, quantifying, coding and communiicating patient's health and perioperative risk
US20080027913A1 (en) 2006-07-25 2008-01-31 Yahoo! Inc. System and method of information retrieval engine evaluation using human judgment input
WO2008085857A2 (en) 2007-01-04 2008-07-17 Children's Hospital Medical Center Processing text with domain-specific spreading activation methods
US20090019032A1 (en) 2007-07-13 2009-01-15 Siemens Aktiengesellschaft Method and a system for semantic relation extraction
AU2009217184B2 (en) 2008-02-20 2015-03-19 Digital Medical Experts Inc. Expert system for determining patient treatment response
US9047283B1 (en) 2010-01-29 2015-06-02 Guangsheng Zhang Automated topic discovery in documents and content categorization
WO2012162405A1 (en) 2011-05-24 2012-11-29 Namesforlife, Llc Semiotic indexing of digital resources
EP2766838A2 (en) 2011-10-11 2014-08-20 Life Technologies Corporation Systems and methods for analysis and interpretation of nucleic acid sequence data
US20130096946A1 (en) 2011-10-13 2013-04-18 The Board of Trustees of the Leland Stanford, Junior, University Method and System for Ontology Based Analytics
US20130144584A1 (en) 2011-12-03 2013-06-06 Medeolinx, LLC Network modeling for drug toxicity prediction
US20140278130A1 (en) 2013-03-14 2014-09-18 William Michael Bowles Method of predicting toxicity for chemical compounds
US20140280086A1 (en) 2013-03-15 2014-09-18 Alcatel Lucent Method and apparatus for document representation enhancement via social information integration in information retrieval systems
US20160210426A1 (en) 2013-08-30 2016-07-21 3M Innovative Properties Company Method of classifying medical documents
US9058374B2 (en) 2013-09-26 2015-06-16 International Business Machines Corporation Concept driven automatic section identification
WO2015113062A1 (en) 2014-01-27 2015-07-30 Dna-Seq, Inc. Methods and systems for determination of an effective therapeutic regimen and drug discovery
EP3123170A4 (en) 2014-03-27 2018-08-08 The Scripps Research Institute Systems and methods for genomic annotation and distributed variant interpretation
US10658073B2 (en) 2014-08-15 2020-05-19 QIAGEN Redwood City, Inc. Methods and systems for interpretation and reporting of sequence-based genetic tests using pooled allele statistics
US9690861B2 (en) 2014-07-17 2017-06-27 International Business Machines Corporation Deep semantic search of electronic medical records
WO2016016879A1 (en) 2014-07-27 2016-02-04 Pathway Pharmaceuticals Ltd System, method and software for predicting drug efficacy in a patient
KR101776094B1 (ko) 2015-02-10 2017-09-07 가천대학교 산학협력단 네트워크 기반의 약제 효능 평가 장치 및 방법
CN105138862B (zh) 2015-07-31 2017-12-26 同济大学 一种协同抗癌症药物组合预测方法及药物组合物
WO2018057639A1 (en) 2016-09-20 2018-03-29 Nuance Communications, Inc. Method and system for sequencing medical billing codes
US10607736B2 (en) 2016-11-14 2020-03-31 International Business Machines Corporation Extending medical condition base cartridges based on SME knowledge extensions
US10699215B2 (en) 2016-11-16 2020-06-30 International Business Machines Corporation Self-training of question answering system using question profiles
US10949772B2 (en) 2017-01-24 2021-03-16 International Business Machines Corporation System for evaluating journal articles
JP7390711B2 (ja) 2017-05-12 2023-12-04 ザ・リージェンツ・オブ・ザ・ユニバーシティ・オブ・ミシガン 個体およびコホートの薬理学的表現型予測プラットフォーム
US20180373844A1 (en) 2017-06-23 2018-12-27 Nuance Communications, Inc. Computer assisted coding systems and methods
US20190034593A1 (en) 2017-07-25 2019-01-31 International Business Machines Corporation Variation in cost by physician
US11024424B2 (en) 2017-10-27 2021-06-01 Nuance Communications, Inc. Computer assisted coding systems and methods
CN108417271B (zh) 2018-01-11 2021-11-19 复旦大学 基于精神障碍亚型分类的精神抑制药物推荐方法与系统
WO2019243486A1 (en) 2018-06-22 2019-12-26 Koninklijke Philips N.V. A method and apparatus for genome spelling correction and acronym standardization
US11074262B2 (en) 2018-11-30 2021-07-27 International Business Machines Corporation Automated document filtration and prioritization for document searching and access
US11061913B2 (en) 2018-11-30 2021-07-13 International Business Machines Corporation Automated document filtration and priority scoring for document searching and access
US10949607B2 (en) 2018-12-10 2021-03-16 International Business Machines Corporation Automated document filtration with normalized annotation for document searching and access
US11068490B2 (en) 2019-01-04 2021-07-20 International Business Machines Corporation Automated document filtration with machine learning of annotations for document searching and access
US10977292B2 (en) 2019-01-15 2021-04-13 International Business Machines Corporation Processing documents in content repositories to generate personalized treatment guidelines

Patent Citations (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060036368A1 (en) * 2002-02-04 2006-02-16 Ingenuity Systems, Inc. Drug discovery methods
CN1764837A (zh) * 2003-03-24 2006-04-26 魏念之 从一群患者的生物学图谱中取样预测一个个体临床治疗结果的方法
US20040193019A1 (en) * 2003-03-24 2004-09-30 Nien Wei Methods for predicting an individual's clinical treatment outcome from sampling a group of patient's biological profiles
CN101068936A (zh) * 2004-11-22 2007-11-07 惠氏公司 用于实体瘤预后及治疗的方法和系统
WO2010024926A2 (en) * 2008-08-28 2010-03-04 Aureon Laboratories, Inc. Systems and methods for treating, diagnosing and predicting the occurrence of a medical condition
US20110230360A1 (en) * 2008-09-05 2011-09-22 Aueon ,Inc. a corporation Methods for stratifying and annotating cancer drug treament options
US20130166320A1 (en) * 2011-09-15 2013-06-27 Nextbio Patient-centric information management
CN105144178A (zh) * 2013-01-29 2015-12-09 分子健康股份有限公司 用于临床决策支持的系统和方法
CN105144179A (zh) * 2013-01-29 2015-12-09 分子健康股份有限公司 用于临床决策支持的系统和方法
CN105706097A (zh) * 2013-06-28 2016-06-22 南托米克斯有限责任公司 用于诊断检测的识别的途径分析
CN106104540A (zh) * 2014-03-27 2016-11-09 宝洁公司 用于评估治疗对生物过程和途径的效果的方法
CN104200069A (zh) * 2014-08-13 2014-12-10 周晋 一种基于症状分析和机器学习的用药推荐系统和方法
US20160132632A1 (en) * 2014-11-10 2016-05-12 Insilico Medicine, Inc. System, Method and Software for Improved Drug Efficacy and Safety in a Patient
US20160224739A1 (en) * 2015-01-29 2016-08-04 Pathway Pharmaceuticals Ltd System, Method and Software for Predicting Clinical Outcome of a Drug Treatment of Breast Cancer in a Patient
US20180190381A1 (en) * 2015-06-15 2018-07-05 Nantomics, Llc Systems And Methods For Patient-Specific Prediction Of Drug Responses From Cell Line Genomics
CN108292329A (zh) * 2015-06-15 2018-07-17 南托米克斯有限责任公司 用于从细胞系基因组学预测患者特异性药物响应的系统和方法
CN109074428A (zh) * 2015-12-12 2018-12-21 塞弗欧米公司 计算机实现的针对群体的药物安全性评估
US20170193157A1 (en) * 2015-12-30 2017-07-06 Microsoft Technology Licensing, Llc Testing of Medicinal Drugs and Drug Combinations
US20180060483A1 (en) * 2016-08-23 2018-03-01 Standigm Method for predicting therapeutic efficacy of combined drug by machine learning ensemble model
CN106708959A (zh) * 2016-11-30 2017-05-24 重庆大学 一种基于医学文献数据库的组合药物识别与排序方法
CN106815486A (zh) * 2017-01-22 2017-06-09 华中农业大学 一种个性化用药的系统药理学方法
US20180261333A1 (en) * 2017-03-07 2018-09-13 Anivive Lifesciences, Inc. Drug discovery platform
CN106971071A (zh) * 2017-03-27 2017-07-21 为朔医学数据科技(北京)有限公司 一种临床决策支持系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘伟;谢红卫;: "基于生物信息学方法发现潜在药物靶标", 生物化学与生物物理进展, no. 01 *
常炳国;李玉琴;冯智超;姚山虎;: "基于主成分机器学习算法的慢性肝病的智能预测新方法", 计算机科学, no. 2 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113838583A (zh) * 2021-09-27 2021-12-24 中国人民解放军空军军医大学 一种基于机器学习的智能药品疗效评价方法及其应用
CN113838583B (zh) * 2021-09-27 2023-10-24 中国人民解放军空军军医大学 一种基于机器学习的智能药品疗效评价方法及其应用

Also Published As

Publication number Publication date
US20200227176A1 (en) 2020-07-16
WO2020148585A1 (en) 2020-07-23
US11721441B2 (en) 2023-08-08
JP2022516409A (ja) 2022-02-28

Similar Documents

Publication Publication Date Title
US11721441B2 (en) Determining drug effectiveness ranking for a patient using machine learning
US11068490B2 (en) Automated document filtration with machine learning of annotations for document searching and access
US10977292B2 (en) Processing documents in content repositories to generate personalized treatment guidelines
US11769572B2 (en) Method and process for predicting and analyzing patient cohort response, progression, and survival
Shivade et al. A review of approaches to identifying patient phenotype cohorts using electronic health records
US11074262B2 (en) Automated document filtration and prioritization for document searching and access
Ye et al. Sparktext: Biomedical text mining on big data framework
US10949607B2 (en) Automated document filtration with normalized annotation for document searching and access
US11061913B2 (en) Automated document filtration and priority scoring for document searching and access
Morton et al. ROBOKOP: an abstraction layer and user interface for knowledge graphs to support question answering
US20190057182A1 (en) Biomarker-driven molecularly targeted combination therapies based on knowledge representation pathway analysis
Zeng et al. Identifying breast cancer distant recurrences from electronic health records using machine learning
Frey et al. EHR big data deep phenotyping
Jurca et al. Integrating text mining, data mining, and network analysis for identifying genetic breast cancer trends
CN110931084B (zh) 从非结构化文本提取和标准化突变基因用于认知搜索和分析
Perovic et al. IDPpi: Protein-protein interaction analyses of human intrinsically disordered proteins
Han et al. Deep learning approach for survival prediction for patients with synovial sarcoma
Juan-Blanco et al. IntSide: a web server for the chemical and biological examination of drug side effects
JP7412061B2 (ja) 最適な薬剤組み合わせを特定するための技術
Masoudi-Sobhanzadeh et al. A machine learning method based on the genetic and world competitive contests algorithms for selecting genes or features in biological applications
Waldron Data and statistical methods to analyze the human microbiome
Martins et al. Machine learning-enhanced T cell neoepitope discovery for immunotherapy design
Raies et al. DrugnomeAI is an ensemble machine-learning framework for predicting druggability of candidate drug targets
US20240087747A1 (en) Method and process for predicting and analyzing patient cohort response, progression, and survival
WO2022072346A1 (en) Automated individualized recommendations for medical treatment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230522

Address after: Michigan, USA

Applicant after: Maredif USA

Address before: New York grams of Armand

Applicant before: International Business Machines Corp.