CN115768904A - 多因素活性监测 - Google Patents

多因素活性监测 Download PDF

Info

Publication number
CN115768904A
CN115768904A CN202180045275.5A CN202180045275A CN115768904A CN 115768904 A CN115768904 A CN 115768904A CN 202180045275 A CN202180045275 A CN 202180045275A CN 115768904 A CN115768904 A CN 115768904A
Authority
CN
China
Prior art keywords
data
active sensor
disease
reporter
active
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180045275.5A
Other languages
English (en)
Inventor
詹姆斯·鲍恩
法伊察尔·陶蒂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Grimpus Biological Co ltd
Original Assignee
Grimpus Biological Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Grimpus Biological Co ltd filed Critical Grimpus Biological Co ltd
Publication of CN115768904A publication Critical patent/CN115768904A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4842Monitoring progression or stage of a disease
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4848Monitoring or testing the effects of treatment, e.g. of medication
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/63ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for local operation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/67ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/145Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue
    • A61B5/1468Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue using chemical or electrochemical methods, e.g. by polarographic means
    • A61B5/1473Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue using chemical or electrochemical methods, e.g. by polarographic means invasive, e.g. introduced into the body by a catheter
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/20Measuring for diagnostic purposes; Identification of persons for measuring urological functions restricted to the evaluation of the urinary system
    • A61B5/207Sensing devices adapted to collect urine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Surgery (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Signal Processing (AREA)
  • Physiology (AREA)
  • Psychiatry (AREA)
  • General Business, Economics & Management (AREA)
  • Fuzzy Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Optics & Photonics (AREA)

Abstract

将来自对指示各种疾病状态的酶敏感的活性传感器的数据与来自包括电子医疗记录的其他来源的数据和包括分子诊断测试的临床数据组合。可以分析汇集的数据以识别指示某些结局的模式,所述结局包括疾病的发展、疾病的进展或对患者的给定治疗的可能治疗功效。

Description

多因素活性监测
技术领域
本发明涉及包含非侵入性活性传感器(activity sensor)的多因素个性化药物。
背景技术
目前检测或诊断疾病如癌症的方法涉及如获得组织活检并在显微镜下检查细胞或测序DNA以检测疾病的遗传标志物的技术。早期检测是有利的,因为通过早期干预,一些治疗将具有更大的成功机会。例如,对于癌症,可以通过手术切除肿瘤,并且如果在癌症转移之前检测到癌症,则患者可以进入完全缓解。
不幸的是,现有的疾病检测的方法并不总是在疾病发作时检测到疾病。例如,虽然x射线乳腺图像代表了相对于人工检查的进步,因为x射线可以检测到物理检查不能检测到的肿瘤。然而,此类测试需要肿瘤已经发展到一定程度才能进行检测。液体活检代表了一种潜在的用于疾病检测的方法。在液体活检中,获取血液样本并筛选肿瘤DNA的小片段。不幸是,x射线乳腺图像、组织样本的显微镜检查和液体活检仅检测已经发展到一定程度的疾病,并且不总是如在医学上最有益的尽早检测疾病。
发明内容
本发明提供酶活性的非侵入性检测,以用作指示各种健康风险、诊断、预后以及治疗易感性和应答的合成生物标志物。如由工程化的传感器所报告的各种酶的差异表达可以与包括其他临床测定数据(例如,基因组信息、蛋白质组信息和表观遗传学信息)和来自电子医疗记录(EMR)的数据的额外信息源组合,以非侵入性地提供各种诊断和预后数据点。可以分析额外的数据点(包括合并症、DNA甲基化和端粒信息)以及相关的已知结局(outcome)信息,以便识别与各种结局相关的数据模式。可以识别指示癌症或其他疾病的存在或发展癌症或其他疾病的增加的风险的数据模式。模式可能与其他结局相关,如疾病进展和治疗敏感性以及应答(包括定位的免疫系统活性和免疫治疗应答)。
本发明的系统和方法特别适合于识别患者数据和结局之间的新的诊断和预后联系。因此,对所有血清蛋白酶敏感的工程化的传感器可以用于梳理差异表达与疾病之间的新联系。除了一般的酶表达信息(例如,血清蛋白酶)之外,如肿瘤定位的活性传感器的靶向活性传感器可以与对例如免疫学酶敏感的可切割的报告物一起使用,以检测免疫应答,包括诱导的免疫治疗应答。从一般酶信息、基因组、蛋白质组学、表观遗传学、EMR和其他来源获得的额外深度数据为识别指示疾病风险、疾病进展和预测的或实际的治疗应答的模式提供了新的机会。
在本发明的多因素系统和方法中预期的额外数据来源包括分子诊断信息和EMR数据。相关分子诊断数据可以包括患者DNA序列、DNA甲基化数据、RNA分析、通过基因表达谱分析的表观遗传学、蛋白质分析。EMR数据可以包括患者医疗史、保险索赔模式、家族史、人口统计信息或从患者的电子医疗记录中获得的任何其他信息。来自任何数据来源的信息都可以与活性传感器信息组合,以确定疾病风险、跟踪疾病进展或治疗功效,或基于相似患者的预测的结局开发个性化的治疗疗程。
在某些实施方案中,多重的活性传感器信息可以与分子诊断信息、EMR数据和已知结局组合以训练机器学习算法来识别患者特征与某些结局之间的相关性或模式(例如,疾病的发展、疾病的进展或对各种治疗的应答)。在训练此类算法之后,可以针对相似的模式分析患者数据,以便诊断疾病或识别最有可能成功的个性化治疗计划。
机器学习和人工智能系统提供了识别数据中的模式和相关性的益处,这些模式和相关性通常会逃过人类的检测。因此,当提供更多的数据用于分析时,可以识别更多和更紧密的相关性。在医学诊断、预后和治疗的背景下,患者数据与疾病风险、结局和治疗结果之间的新的相关性可以减少治疗时间,导致更早的诊断,并挽救生命。通过将经由靶向的或一般的活性传感器提供的大量信息与来自分子诊断测定的现有患者数据和EMR信息组合,本发明的系统和方法代表了相对于现有诊断技术的进步。
活性传感器充当合成生物标志物,所述生物标志物可以被编程以通过工程化活性传感器中的酶特异性切割位点来提供特异性靶组织中任何酶水平的非侵入性报告。例如,活性传感器可以是连接至作为可切割的分析物的四个或更多个多肽报告物的多臂聚乙二醇(PEG)骨架。可切割的接头对不同的酶是特异性的,所述酶的活性是待监测的病况的特征(例如,癌性组织中的某个阶段或进展或免疫应答)。当施用于患者时,活性传感器定位于靶组织,在靶组织中它们被酶切割以释放可检测的分析物。在患者样本(如尿液样本)中检测分析物。检测到的分析物用作组织中哪些酶是活性的报告,从而用作相关状况或活性的报告。
因为酶在感兴趣的生理状态(如疾病阶段或疾病进展程度)下差异表达,所以对样本的分析提供了对器官、身体隔室、体液或组织的生理状态(例如,疾病阶段或状况)的非侵入性测试。载体结构优选地包含多个分子亚基,并且可以是例如多臂聚乙二醇(PEG)聚合物、脂质纳米颗粒或树枝状大分子。可检测的分析物可以是例如被蛋白酶切割的多肽,所述蛋白酶在规定的生理状态下(例如,受疾病的影响)在组织或器官中差异表达。因为载体结构和可检测的分析物是生物相容性的分子结构,其定位于靶组织并被疾病相关酶切割以释放样本中可检测的分析物,所以本公开内容的组合物提供了用于检测和表征器官或组织的疾病状态或阶段的非侵入性方法。因为组合物提供了通过酶促活性作为可检测的分析物释放的底物,所以对样本中分析物的定量检测提供了对器官或组织中酶活性速率的测量。因此,本公开内容的方法和组合物提供了用于测量靶器官或组织中疾病或病况的进展阶段和进展速率两者的非侵入性技术。
此外,活性传感器可以包含分子结构,以影响传感器在体内的转运,或颗粒的酶促切割或其他代谢降解的定时。分子结构可以用作调节结构域、额外的分子亚基或接头,其通过身体作用以在受控的定时下将活性传感器定位到靶组织。例如,通过保护活性传感器免于过早切割和不加区别的水解,保护颗粒免于免疫检测和清除,或者通过将颗粒靶向特定的组织或细胞类型,调节结构域可以调节颗粒的命运。通过在核心载体聚合物中包含额外的分子结构,可以影响转运,例如,通过增加PEG骨架的大小以减缓体内颗粒的降解。
在某些实施方案中,本发明的活性传感器和数据分析方法可以应用于免疫肿瘤学(I-O)治疗以预测或观察患者的I-O药物应答。通过提供关于个体患者的更详细和相关的信息,可以在试验中的应答者和非应答者之间识别新的模式,并且经由活性传感器获得的信息可以与EMR数据和分子诊断信息组合,以用于在临床试验期间更好的患者分层,并且可以帮助识别将受益于特定治疗的患者亚群。因此,本发明的系统和方法可以支持先前基于对与应答性或不良影响相关的患者特征的有限理解可能会被丢弃的有用疗法的审核批准。
如本文所述,活性传感器可以包含对不同酶敏感的各种不同的可切割的报告物。此外,可以同时施用和分析许多不同的活性传感器。报告物分子可以是彼此可区分的,使得可以完成多种蛋白酶活性的多重分析,描绘比以前使用的天然生物标志物可能做到的更详细的靶环境情况。
在某些实施方案中,可以周期性地收集活性传感器数据以及分子诊断信息和如EMR信息的其他数据,以提供对各种数据点的变化的按时间顺序的跟踪。除了时间点信息外,还可以检查那些数据点的变化率,以提供速度信息。此类信息可用于提供健康指征,其甚至可应用于健康个体,并且提供了疾病进展和治疗应答的传统纵向监测以外的另一个数据点。
其他数据来源可以包括,例如,医疗记录、索赔数据和测试结果。医疗记录和索赔数据可以提供人口统计数据、地理数据、医疗史、遗传数据、实验室和实验室测试结果。分子诊断数据来源可以包括,例如,RNA表达信息或基因组分析/测序数据。
本发明中使用的机器学习系统可以是完全自主的,即,在注释或标记数据特征时不需要人工输入。替代地,只有原始数据和相关结局被提供给机器学习系统。然后,机器学习系统可以自由地识别从具有特定结局(例如,疾病诊断、对特定治疗的应答性或疾病进展)的患者获得的数据中常见的任何特征或一系列特征或特征关系,并且因此指示该结局。然后,所识别的一个或多个特征可以用于基于活性传感器、EMR、分子诊断和具有未知结局的新患者中的其他数据来预测患者结局。因此,可以在未知疾病状态的患者中提供更准确的诊断和预后。
机器学习分析的益处是识别特征或特征的模式,这些特征或特征的模式可以用于预测结局,而不需要理解疾病和所识别的特征之间的任何潜在关系。因此,可以研究所识别的相关性以更好地理解疾病机制。本发明的机器学习系统可以使用或包括例如神经网络、随机森林、回归分析、支持向量机(SVM)、聚类分析、决策树学习、关联规则学习或贝叶斯网络中的一个或多个。
在各种实施方案中,活性传感器载体结构可以包含多个分子亚基,并且可以是例如多臂聚乙二醇(PEG)聚合物、脂质纳米颗粒或树枝状大分子。可检测的分析物可以是例如被蛋白酶切割的多肽,所述蛋白酶在经历免疫应答或经历疾病进展的组织或器官中差异表达。因为载体结构和可检测的分析物是生物相容性的分子结构,其定位于靶组织并被疾病或免疫应答相关酶切割以释放样本中可检测的分析物,所以本公开内容的组合物提供了用于检测和表征器官或组织状态的非侵入性方法。因为组合物提供了通过酶促活性作为可检测分析物释放的底物,所以对样本中分析物的定量检测提供了对器官或组织中酶活性速率的测量。因此,本公开内容的方法和组合物提供了用于测量癌症的进展阶段和进展速率两者或对I-O疗法的应答的非侵入性技术。
活性传感器可以采取天然抗脱靶标降解的环肽形式。靶环境可以是特异性酶或一组酶在其中差异表达的肿瘤微环境。可以用对肿瘤中的酶(例如,在肿瘤中优先表达的独特酶)特异的切割位点对环肽进行工程化。以其环状形式存在的工程化的肽可以行进穿过血液和其他潜在的恶劣环境,受保护以免于被常见的非特异性蛋白酶降解,并且不以有意义的方式与脱靶标组织相互作用。只有当到达特异性靶组织内并暴露于所需的酶或酶的组合时,环肽才被切割以产生能够清除和样本观察的线性分子。出于本申请的目的,并且如考虑到其详细描述将是显而易见的,线性肽是任何非环状的肽。因此,例如,线性化的肽可以具有各种支链。
环肽可以用其他可切割的连接(linkage)进行工程化,如以环状酯肽(depsipeptide)形式存在的酯键,其中酯键的降解释放出准备与其靶环境反应的线性化的肽。在环肽中可以包含硫酯和其他可调键,以在血浆或其他环境中产生定时释放。参见Lin和Anseth,2013Biomaterials Science(第三版),第716-728页,其通过引用并入本文。
大环肽可能含有两个或更多个蛋白酶特异性切割序列,并且可能需要两个或更多个蛋白酶依赖性水解事件以释放报告物肽或生物活性化合物。在各种实施方案中,蛋白酶特异性序列可以不同。在其中需要切割多个位点以释放线性化的肽的情况下,不同的蛋白酶特异性序列可以增加释放的特异性,因为将需要存在至少两种不同的靶特异性酶。特异性和非特异性蛋白水解敏感性和速率可以通过操纵肽序列内容、长度和环化化学来调节。
活性传感器可以包含额外的分子结构,以影响肽在体内的转运,或颗粒的酶促切割或其他代谢降解的定时。分子结构可以用作调节结构域、额外的分子亚基或接头,其被身体作用以在受控的定时下将活性传感器定位于靶组织。例如,调节结构域可以将颗粒靶向特定组织或细胞类型。可以通过在载体聚合物中添加分子结构来影响转运,例如,通过增加PEG骨架的大小来减缓体内的降解。
在某些实施方案中,本发明提供了揭示与生理状态(如疾病)相关联的酶促活性的可调活性传感器。当将活性报告物施用于患者时,它通过身体被转运至特定细胞或特定组织。例如,在患有肺癌的患者中,可以通过例如使用优先被转运到肺组织或肿瘤组织的调节结构域来调节活性传感器以定位在癌性组织中。活性传感器可以包含对指示免疫应答或肿瘤进展或消退阶段的酶敏感的可切割的报告物分子。对患者样本(例如尿液)中的报告物水平的随后观察和/或跟踪然后将提供患者肺癌的进展和/或治疗应答的指征。
可以设计或调节传感器,使得其保持在循环中,例如,保持在血液或淋巴中,或保持在两者中。如果存在在特定疾病的条件下差异表达的酶,则这些酶切割报告物并释放可检测的分析物。环肽活性传感器可以用于抵抗循环中肽的非特异性降解,同时仍为通过靶蛋白酶的切割提供可及的底物。
分子结构可以作为调节结构域被包含在活性传感器中,以调节或修改活性传感器在对象体内的分布或停留时间。调节结构域可以链接到活性传感器的任何部分,并且可以以多种方式修改。可以根据到特定组织的体内转运路径或其在体循环或特定组织内的停留时间来修改活性传感器在体内的分布。此外,调节结构域可以促进组织特异性酶对报告物的有效切割或防止过早切割或水解。因为可检测的分析物是酶促活性的产物,并且可以以过量提供活性传感器,所以由分析物给出的信号被有效地放大,并且甚至可以检测到非常少量的活性酶的存在。
本发明的方面包括监测癌症进展的方法,所述方法包括向怀疑患有癌症的患者施用活性传感器,所述活性传感器包括通过可切割的接头与报告物分子连接的载体,所述可切割的接头含有指示肿瘤环境的特征的酶的切割位点。可以从患者收集样本(如尿液样本),并进行分析以检测报告物的存在或缺乏,其中报告物的存在指示特征。
所述特征可以是主动免疫应答,并且患者正在接受免疫肿瘤学治疗,其中所述报告物的存在指示所述免疫肿瘤学治疗的治疗效果。活性传感器可以包含可操作以将活性传感器定位在靶肿瘤中的调节结构域。所述特征可以是检查点抑制的免疫应答,并且其中报告物的存在指示对检查点抑制剂疗法的预测的治疗应答。所述方法可以包括在临床试验中基于样本中报告物的检测对患者分层。
在某些实施方案中,分析步骤可以包括定量样本中报告物的水平,并且所述方法可以包括周期性地重复施用、收集和分析步骤以制备按时间顺序排列的一系列报告物水平,从该系列中可以确定指示患者中癌症进展的特征的速度。
附图说明
图1图示了用于分析患者数据的方法的步骤。
图2显示了活性传感器。
图3显示了工程化的大环肽。
图4显示了计算分析平台的示意图。
具体实施方式
本发明提供了非侵入性地提供关于酶在患者组织中的差异表达的详细信息的活性传感器。该信息与其他来源的数据(如临床数据(如分子诊断测试)和来自电子医疗记录(EMR)的信息)组合,以提供大量患者特异性数据点。大量数据的组合允许识别新的诊断、预后和治疗指标,以便改善患者结局。在某些实施方案中,通过机器学习系统进行数据分析以识别各种数据点与患者结局(例如,治疗应答性和疾病的发展或进展)之间的相关性。活性传感器可以包含多种报告物分子,所述报告物分子在体液样本(如尿液)中是可检测的,但仅在被特异性酶或酶组切割时从体内释放。因此,样本中报告物的检测指示靶组织中酶的差异表达。在某些实施方案中,可以施用宽范围的活性传感器的混合物(cocktail)以报告所有血清蛋白酶的表达数据。除了一般的血清蛋白酶表达之外,通过将活性传感器靶向特定组织(例如肿瘤)并将其切割位点工程化为对在各种条件下差异表达的酶具有特异性,本发明的活性传感器可以提供对疾病进展和预测的或实际的治疗应答的洞察。
本发明的活性传感器和数据分析方法可以应用于治疗以预测或观察患者的药物应答。例如,从活性传感器、临床数据和EMR信息的组合中提供的信息的深度可以提供用于临床试验的患者分层的新因素。分层是通过除了给定的治疗以外的因素对对象和结果的划分。分层传统上是通过如性别、年龄或其他人口统计学细节的因素来完成的,但是添加经由活性传感器和其他临床测试获得的详细的患者信息可以提供用于分层的更实际和有意义的组。根据此类分组检查患者应答可以用于消除变量,以更好地解释结果,并将不良事件或治疗功效映射到致病患者特征。
活性传感器充当合成生物标志物,所述生物标志物可以被编程以通过工程化活性传感器中的酶特异性切割位点来提供特异性靶组织中任何酶水平的非侵入性报告。当施用于患者时,活性传感器使用例如靶特异性调节结构域定位于靶组织。一旦定位,它们就会被酶切割,以释放可检测的分析物。在患者样本(如尿液样本)中检测分析物。检测到的分析物用作组织中哪些酶是活性的报告,从而用作相关状况或活性的报告。定位允许活性传感器报告靶组织的状况,而不污染脱靶标信息。该能力可用于区分指示成功的I-O治疗的抗肿瘤免疫应答与例如可能响应于病毒感染发生的脱靶标免疫应答。
此外,因为活性传感器监测、许多基因组和RNA表达研究以及EMR数据分析不需要侵入性操作,所以频繁监测更可行,并且关于疾病进展和治疗应答的最新信息允许用于评估安全性和功效的更快的决策。例如,频繁的监测可以用于在对治疗的耐药性产生时快速识别对治疗的耐药性。例如,随着癌症的进展,它们继续突变,并且用于靶向免疫疗法的新抗原可能不再表达,导致治疗效果减弱。通过用活性传感器以及其他EMR和临床数据进行监测来快速识别此类变化的能力可以导致更快的疗法变化,可能在显著的癌症进展或复发之前。
酶特异性报告物可以在单个活性传感器上或在同时施用和分析的许多不同活性传感器中进行多重化。报告物分子可以对每种酶是特异性的,使得可以在多重分析中区分它们。在某些实施方案中,可以周期性地施用和测量充当合成生物标志物的活性传感器。可以检查酶水平随时间的变化以及其他临床或EMR数据的变化,以提供数据点的按时间顺序的映射。研究已经发现,生物标志物速度(生物标志物水平随时间变化的速率)可能是比任何单一阈值更好的疾病进展(或消退)指标。相同的原理可以应用于充当合成生物标志物的本发明的活性传感器。
活性传感器可以包含载体、与载体连接的至少一种报告物和至少一个调节结构域,当施用于对象时,所述调节结构域改变活性传感器在对象体内的分布或停留时间。活性传感器可以被设计成检测和报告体内的酶促活性,例如在免疫应答期间或在肿瘤进展或消退期间差异表达的酶。调节异常的蛋白酶在疾病如癌症的进展中具有重要的后果,因为它们可以改变细胞信号传导,帮助驱动癌细胞增殖、侵袭、血管生成、避免细胞凋亡和转移。
可以以多种方式经由调节结构域来调节活性传感器,以便于检测体内特定细胞或特定组织中的酶促活性。例如,可以调节活性传感器以促进活性传感器向特定组织的分布或改善活性传感器在对象或特定组织中的停留时间。调节结构域可以包含,例如,定位于快速复制细胞中以更好地靶向肿瘤组织的分子。
当施用于对象时,活性传感器被转运通过身体,并且可以从体循环扩散至特定组织,在特定组织中,报告物可以经由指示疾病存在或进展的酶被切割。可检测的分析物然后可以扩散回到循环中,在循环中它可以通过肾过滤并被排泄到尿液中,由此尿液样本中可检测的分析物的检测指示靶组织中的酶促活性。
当施用于对象时,载体可以是用于通过对象的身体转运报告物的任何合适的平台。载体可以是适合用作载体或平台的任何材料或尺寸。优选地,所述载体是生物相容性的、无毒的和无免疫原性的,并且不在施用所述载体的对象体内引发免疫应答。载体还可以用作靶向手段,以将活性传感器靶向组织、细胞或分子。在一些实施方案中,载体结构域是颗粒,如聚合物骨架。例如,载体可能通过循环导致被动靶向肿瘤或其他特定组织。其他类型的载体包含,例如,促进活性靶向组织、细胞或分子的化合物。载体的示例包括但不限于,纳米颗粒,如氧化铁或金纳米颗粒、适体、肽、蛋白质、核酸、多糖、聚合物、抗体或抗体片段和小分子。
载体可以包含各种材料,如铁、陶瓷、金属、天然聚合物材料如透明质酸,合成聚合物材料如聚癸二酸甘油酯,和非聚合物材料,或其组合。载体可以全部或部分包括聚合物或非聚合物材料,如氧化铝、碳酸钙、硫酸钙、磷硅酸钙、磷酸钠、铝酸钙和硅酸盐。聚合物包括但不限于:聚酰胺、聚碳酸酯、聚亚烷基、聚亚烷基二醇、聚环氧烷、纤维素醚、纤维素酯、硝基纤维素、丙烯酸和甲基丙烯酸酯的聚合物、甲基纤维素、乙基纤维素和羟丙基纤维素。不可生物降解的聚合物的示例包括乙烯乙酸乙烯酯、聚(甲基)丙烯酸、聚酰胺、共聚物及其混合物。
生物可降解的聚合物的示例包括合成聚合物如乳酸和乙醇酸的聚合物、聚酸酐、聚氨酯和天然聚合物如藻酸盐和其他多糖(包括葡聚糖和纤维素)、胶原、白蛋白和其他蛋白质、共聚物及其混合物。一般而言,这些可生物降解的聚合物通过酶促水解或体内暴露于水、通过表面或本体侵蚀而降解。这些可生物降解的聚合物可以单独使用,作为物理混合物(共混物),或作为共聚物使用。
在优选的实施方案中,载体包括可生物降解的聚合物,使得无论报告物是否从载体上切割,载体都将在体内降解。通过提供可生物降解的载体,体内剩余的完整活性传感器的累积和任何相关的免疫应答或意外影响可以被最小化。
其他生物相容性聚合物包括PEG、PVA和PVP,它们都是市售的。PVP是一种平均分子量在约10,000至700,000范围内的非离子型亲水性聚合物并且具有化学式(C6H9NO)[n]。PVP也被称为聚[1(2-氧代-1-吡咯烷基)乙烯]。PVP是无毒的、吸湿性强的,并且易溶于水或有机溶剂。
聚乙烯醇(PVA)是由聚乙酸乙烯酯通过用羟基取代乙酸酯基团而制备的聚合物,并且具有化学式(CH2CHOH)[n]。大多数聚乙烯醇可溶于水。
聚乙二醇(PEG),也被称为聚(氧乙烯)二醇,是环氧乙烷和水的缩聚物。PEG是指包含重复的乙二醇单元的化合物。PEG的结构可以被表示为H-(O-CH2-CH2)n-OH。PEG是一种亲水性化合物,其是生物学惰性的(即无免疫原性的)并且通常认为对施用于人类是安全的。
当PEG与颗粒连接时,它提供了有利的性质,如改善的溶解性、增加的循环寿命、稳定性、防止蛋白水解降解、减少的通过巨噬细胞的细胞摄取以及缺乏免疫原性和抗原性。PEG也是高度柔性的并且在没有空间位阻的情况下提供颗粒的生物共轭和表面处理。PEG可用于生物学活性的化合物(如肽、蛋白质、抗体片段、适体、酶和小分子)的化学修饰,以使化合物的分子性质适应特定的应用。此外,可以通过向PEG分子的末端化学添加各种官能团来官能化PEG分子,例如胺反应性PEG(BS(PEG)n)或巯基反应性PEG(BM(PEG)n)。
在某些实施方案中,载体是生物相容性骨架,如包含聚乙二醇(PEG)的骨架。在优选的实施方案中,载体是生物相容性骨架,其包含共价连接的聚乙二醇马来酰亚胺(PEG-MAL)的多个亚基,例如,8臂PEG-MAL骨架。可以选择含PEG的骨架,因为它是生物相容性的、廉价的、容易在商业上获得的,具有被网状内皮系统(RES)的最小摄取并且表现出许多有利的行为。例如,PEG骨架抑制多种细胞类型(如巨噬细胞)对颗粒的细胞摄取,这有助于颗粒在特定组织中的适当分布并且增加在组织中的停留时间。
8臂PEG-MAL是一类多臂PEG衍生物,在其八个臂的每个末端处都具有马来酰亚胺基团,其连接至六甘油核。马来酰亚胺基团经由迈克尔加成选择性地与游离硫醇、SH、巯基或巯基反应,以形成稳定的碳硫键。8臂PEG-MAL骨架的每个臂可以与肽缀合,例如经由马来酰亚胺-硫醇偶联或酰胺键。
PEG-MAL骨架可以具有各种尺寸,例如,10kDa骨架、20kDa骨架、40kDa骨架或大于40kDa的骨架。在磷酸盐缓冲盐水(PBS)中的PEG骨架的流体动力学直径可以通过本领域中已知的各种方法来确定,例如通过动态光散射来确定。使用此类技术,40kDa的PEG-MAL骨架的流体动力学直径被测量为约8nm。在优选的实施方案中,当活性传感器皮下施用时,提供40kDa的PEG-MAL骨架作为载体,因为活性传感器容易扩散到体循环中,但不容易被网状内皮系统清除。
PEG-MAL骨架的大小影响活性传感器在体内的分布和停留时间,因为即使没有蛋白水解切割,直径小于约5nm的颗粒也通过身体的肾过滤被有效清除。此外,直径大于约10nm的颗粒经常排入淋巴管中。在一个示例中,在40kDa的8臂PEG-MAL骨架被静脉内施用的情况下,该骨架未被肾清除到尿液中。
报告物可以是对酶促活性敏感的任何报告物,使得报告物的切割指示该酶促活性。报告物依赖于在特定疾病状态下具有活性的酶。例如,肿瘤与一组特异性酶有关。对于肿瘤,活性传感器可以设计有与由肿瘤或其他患病组织表达的酶的酶易感位点匹配的酶易感位点。可替代地,酶特异性位点可能与通常存在但在特定疾病状态下不存在的酶相关。在此示例中,疾病状态将与缺乏与酶相关的信号相关,或者与健康对象中的正常参考或先前测量相比信号水平降低相关。
在各种实施方案中,报告物包括天然存在的分子,如肽、核酸、小分子、挥发性有机化合物、元素质量标签或新抗原。在其他实施方案中,报告物包括非天然存在的分子,如D-氨基酸、合成元件或合成化合物。报告物可以是质量编码的报告物,例如,具有已知且可单独识别的质量的报告物,如具有已知质量或同位素的多肽。
酶可以是在活细胞中产生的加速或催化生物体的代谢过程的各种蛋白质中的任何一种。酶作用于底物。在由酶催化的反应发生之前,底物在称为活性位点的位置处与酶结合。通常,酶包括但不限于蛋白酶、糖苷酶、脂肪酶、肝素酶和磷酸酶。与对象的疾病相关的酶的示例包括但不限于MMP、MMP-2、MMP-7、MMP-9、激肽释放酶、组织蛋白酶、丝氨酸膜蛋白酶(seprase)、葡萄糖-6-磷酸脱氢酶(G6PD)、葡糖脑苷脂酶、丙酮酸激酶、组织纤溶酶原激活物(tPA)、崩解剂和金属蛋白酶(ADAM)、ADAM9、ADAM15和基质蛋白酶。检测到的酶促活性可以是任何类型的酶的活性,例如蛋白酶、激酶、酯酶、肽酶、酰胺酶、氧化还原酶、转移酶、水解酶、切割酶、异构酶或连接酶。
用于疾病相关酶的底物的示例包括但不限于白细胞介素1β、IGFBP-3、TGF-β、TNF、FASL、HB-EGF、FGFR1、核心蛋白聚糖、VEGF、EGF、IL2、IL6、PDGF、成纤维细胞生长因子(FGF)和MMP组织抑制剂(TIMP)。
本发明的系统和方法可以用于通过结合其他数据测量免疫学酶水平来监测癌症进展或预测或监测对免疫肿瘤学疗法的治疗应答。指示免疫应答的酶可以包括例如组织重塑酶。已知几种蛋白酶与炎症和程序性细胞死亡(例如,包括细胞凋亡、细胞焦亡和坏死性凋亡)有关。这些蛋白酶的定位水平相应地指示了免疫系统的活性。半胱天冬酶(半胱氨酸-天冬氨酸蛋白酶、半胱氨酸天冬氨酸酶或半胱氨酸依赖性天冬氨酸定向蛋白酶)是这样的蛋白酶家族,在其活性位点中包含半胱氨酸,其仅在天冬氨酸残基后亲核切割靶蛋白。半胱天冬酶-1、半胱天冬酶-4、半胱天冬酶-5和半胱天冬酶-11与炎症有关。丝氨酸蛋白酶也在细胞凋亡和炎症中起作用,因此它们的差异表达也指示免疫应答。免疫细胞表达丝氨酸蛋白酶,如颗粒酶、嗜中性粒细胞弹性蛋白酶、组织蛋白酶G、蛋白酶3、胃促胰酶和类胰蛋白酶。
在各种实施方案中,区分指示免疫应答的程序性细胞死亡和在肿瘤进展期间自然发现的坏死可能是有用的。与其中半胱天冬酶和丝氨酸蛋白酶是主要蛋白酶的程序性细胞死亡相反,钙蛋白酶和溶酶体蛋白酶(例如,组织蛋白酶B和D)是坏死中的关键蛋白酶。因此,由活性传感器报告物测量值指示的钙蛋白酶和组织蛋白酶水平可以提供关于坏死性细胞死亡的信息,以补充免疫肿瘤学信息。
本发明的活性传感器和方法可以应用于I-O治疗以观察患者的I-O药物应答。例如,可以在I-O治疗期间或之后施用具有对半胱天冬酶、丝氨酸蛋白酶、钙蛋白酶和组织蛋白酶敏感的切割位点的活性传感器,并且患者样本中的报告物水平可以用于监测治疗应答。患者样本中半胱天冬酶或丝氨酸蛋白酶的基线信号指示非应答性肿瘤。基线水平可以通过从患者群体中收集的数据或从经历治疗的患者中收集的治疗前数据通过实验确定。在治疗期间或之后半胱天冬酶和丝氨酸蛋白酶的信号相对于基线水平的增加可以指示期望的免疫肿瘤学应答。跟踪钙蛋白酶或组织蛋白酶信号的水平可以提供关于可能与肿瘤进展相关的非免疫学细胞死亡的额外信息。
调节结构域可以包含任何合适的材料,当将所述活性传感器施用于对象时,所述材料改变所述活性传感器在对象体内的分布或停留时间。例如,调节结构域可以包含PEG、PVA或PVP。在另一实施方案中,调节结构域可以包含多肽、肽、核酸、多糖、挥发性有机化合物、疏水链或小分子。
图1示出了用于分析患者数据的方法100的步骤。在步骤105,将活性传感器施用于患者。患者可能健康、被怀疑患有疾病、已知患有疾病、处于发展疾病的风险和/或正在经历治疗。活性传感器包含通过可切割的接头与载体连接的报告物(例如,如图2和3所示)。可切割的接头对其水平指示疾病状态的酶(例如,在扩展的肿瘤或消退的肿瘤中上调的酶,或指示活性或抑制的免疫应答的酶)敏感。如本文所讨论的,取决于活性传感器被工程化以报告的酶促活性和患者的疾病和治疗状态,从患者样本中的报告物水平获得的信息可以用于诊断和/或分期疾病、监测进展、预测对给定疗法的应答性、和监测治疗有效性。可以通过任何合适的方法施用活性传感器。在优选的实施方案中,活性传感器被静脉内递送或雾化并例如经由雾化器被递送至肺。在其他示例中,活性传感器可以经皮、皮内、动脉内、病变内、瘤内、颅内、关节内、瘤内、肌内、皮下、口服、局部、定位、吸入、注射、输注或通过本领域已知的其他方法或任何组合(参见,例如,Remington’s Pharmaceutical Sciences(1990),通过引用并入)施用于对象。
在步骤110,在施用活性传感器并在靶组织中定位活性传感器之后,在靶标酶的存在下,在接头的切割时选择性地释放报告物。定位可以通过使用包含优先集中在靶组织中的部分的调节结构域来实现。在释放报告物时,它可以在转运到血流和肾清除之后被身体清除到能够非侵入性收集的流体如尿液中。可以收集样本(如尿液样本)以用于分析,并且可以检测样本中报告物的存在和/或水平。
在各种实施方案中,可以施用对不同血清蛋白酶敏感的活性传感器的混合物,以便分析所有差异表达数据以用于获得结局相关的模式。血清蛋白酶的示例包括凝血酶、纤溶酶和哈格曼因子(Hageman factor)。
在步骤115,可以执行分子诊断测定或可以收集其他临床数据。此类数据可以包括血液测定、尿液分析、脂质检测(lipid panels)、DNA测序、免疫测定、RNA表达分析和本领域的普通技术人员已知的任何其他测试。
特别值得关注的是基因组数据,例如,其可以通过对样本进行测定以识别DNA中存在的变体来获得。各种遗传区域中某些单核苷酸多态性(SNP)或其他突变的存在或这些遗传区域的异常表达水平可能指示疾病风险、阶段、进展或对各种疗法产生应答的可能性。可以影响疾病的变异包括,例如,SNP、缺失、插入、倒位、重排、拷贝数变异(CNV)、染色体微缺失、遗传镶嵌、核型异常及其组合。检测此类变异和获得基因组数据的方法是本领域熟知的。
在某些实施方案中,可以进行全基因组测序,并且在本发明方法中使用的基因组数据可以包括患者的基因组序列。进行全基因组测序的方法是本领域已知的。
还可以获得或提供表观遗传学信息以用于分析,包括基因表达水平和DNA甲基化信息。DNA甲基化可以通过本领域已知的任何方法确定,包括质谱法、甲基化特异性PCR、硫酸氢盐测序、甲基化DNA免疫沉淀和ChIP-on-ChIP。
在步骤120,提供或获得临床数据。预期在本发明的方法中使用的临床数据可以包括医疗记录、临床试验数据、患者和疾病登记、行政数据、保险索赔数据、健康调查和存档的实验室结果。医疗记录可以包括在医疗机构的护理点创建和/或储存的电子临床数据。该材料有时被称为电子医疗记录(EMR),如本文所用,EMR包括管理和人口统计信息、诊断、治疗、处方药、实验室测试、生理监测数据、住院治疗、患者保险等。EMR的来源包括如医院或医疗系统的单独的组织。可以通过更大的协作来访问EMR,如NIH合作者分布式研究网络(NIHCollaborator Distributed Research Network),该网络为符合条件的研究人员提供对临床数据储库的中介或协作访问。此外,UW去识别临床数据储库(De-identified ClinicalData Repository,DCDR)和斯坦福临床信息学中心(Stanford Center for ClinicalInformatics)允许进行初始队列识别。
存在疾病注册机构,其提供某些慢性病况(如阿尔茨海默病、癌症、糖尿液病、心脏病和哮喘)的数据。此类注册机构可以用于提供对本发明的方法有用的信息。
可以使用行政数据,其包括向如AHRQ的政府机构报告的医院出院数据,或来自医疗保健成本与利用项目(Healthcare Cost&Utilization Project,H-CUP)的数据。在各种实施方案中,包括住院患者、门诊患者、药房和投保数据的保险索赔数据可以用于与活性传感器信息一起分析。政府(如Medicare)和/或商业医疗机构可以是用于获得保险索赔数据的来源。
另一个信息来源是健康调查,如国家健康统计中心(National Center forHealth Statistics)、医疗保险和医疗补助服务数据导航中心(Center for Medicare&Medicaid Services Data Navigator)、医疗保险当前受益人调查(Medicare CurrentBeneficiary Survey)、国家健康和营养检查调查(National Health&NutritionExamination Survey,NHANES)、医疗支出小组调查(Medical Expenditure Panel Survey,MEPS)或国家健康和老龄化趋势研究(National Health and Aging Trends Study,NHATS)。临床数据也可以从临床试验注册机构和数据库获得,如ClinicalTrials.gov、WTO国际临床试验注册平台(ICTRP)、欧盟临床试验数据库、ISRCTN注册机构(BioMed Central)或CenterWatch。
步骤125包括识别数据中(包括活性传感器数据、分子诊断数据和临床数据)的指示性模式,以诊断、分期、评估风险或确定患者的治疗建议。识别指示性模式可以在初始训练阶段中完成,所述初始训练阶段可以使用已知结局和计算装置上的机器学习系统或神经网络来识别数据模式与疾病之间的联系。在某些实施方案中,识别指示性模式可以包括将所识别的相关性应用于具有未知结局的测试数据,其中识别指示某一结局的先前识别的模式,以便预测测试患者的该结局。
图4提供了可以出现在计算机系统501内的计算机部件的示意图。系统501优选地包括至少一个服务器计算机系统511,其可操作以经由通信网络517与至少一个计算装置101a、101b通信。服务器511可以被提供有数据库385(例如,部分或全部在存储器307、存储设备527、两者或其他内),用于存储记录399,包括例如用于执行本文所述的方法的患者数据、结局或测定结果。任选地,存储设备527可以与系统501相关联。根据本发明的系统和方法的服务器511或计算装置101通常包括经由总线耦合到存储器307的至少一个处理器309和输入或输出装置305。
如本领域技术人员将认识到的,对于本发明的系统和方法是必要的或最适合的,本发明的系统和方法包括一个或多个服务器511和/或计算装置101,其可以包括经由总线彼此通信的处理器309(例如,中央处理单元(CPU)、图形处理单元(GPU)等)、计算机可读存储装置307(例如,主存储器、静态存储器等)或其组合中的一个或多个。
处理器309可以包括本领域已知的任何合适的处理器,如由Intel(Santa Clara,CA)以商标XEON E7出售的处理器,或者由AMD(Sunnyvale,CA)以商标OPTERON 6200出售的处理器。
存储器307优选地包括至少一个有形的、非暂时性的介质,该介质能够存储:一组或多组可执行的以使系统执行本文所述的功能的指令(例如,体现本文发现的任何方法或功能的软件);数据;或者两者。虽然在示例性的实施方案中,计算机可读存储装置可以是单个介质,但是术语“计算机可读存储装置”应当被理解为包括存储指令或数据的单个介质或多个介质(例如,集中式或分布式数据库,和/或相关联的高速缓存和服务器)。因此,术语“计算机可读存储装置”应当被理解为包括但不限于固态存储器(例如,用户识别模块(SIM)卡、安全数字卡(SD卡)、微型SD卡或固态驱动器(SSD))、光学和磁性介质、硬盘驱动器、磁盘驱动器和任何其他有形存储介质。
任何合适的服务都可以用于存储设备527,如例如亚马逊网络服务、服务器511的存储器307、云存储、另一服务器或其他计算机可读存储设备。云存储可以指数据存储方案,其中数据被存储在逻辑池中,并且物理存储可以跨越多个服务器和多个位置。存储设备527可以由托管公司拥有和管理。优选地,存储设备527用于根据需要存储记录399,以执行和支持本文所述的操作。
根据本发明的输入/输出装置305可以包括以下中的一个或多个:视频显示单元(例如,液晶显示器(LCD)或阴极射线管(CRT)监视器)、字母数字输入装置(例如,键盘)、光标控制装置(例如,鼠标或触控板)、磁盘驱动单元、信号产生装置(例如,扬声器)、触摸屏、按钮、加速度计、麦克风、蜂窝射频天线、网络接口装置,所述网络接口装置可以是例如网络接口卡(NIC)、Wi-Fi卡、或蜂窝调制解调器,或其任意组合。
本领域的技术人员将认识到,可以采用任何合适的开发环境或编程语言以允许本文所述的本发明的各种系统和方法的可操作性。例如,本文的系统和方法可以使用Objective-C、Swift、C、Perl、Python、C++、C#、Java、JavaScript、Visual Basic、Ruby onRails、Groovy和Grails或任何其他合适的工具来实现。对于计算装置101,可能优选使用本地xCode或Android Java。
本发明的机器学习系统可以被配置成接收活性传感器、分子诊断测定或临床数据以及已知结局,以无监督的方式识别数据中的特征,并且创建特征上的结局概率映射。机器学习系统可以进一步从测试对象接收上述数据中的任何一种,在数据中识别从训练步骤中学习到的预测特征,并在结局概率映射上定位预测特征,以提供包括对各种治疗的可能应答的预后或诊断。
几种合适类型的机器学习中的任何一种可以用于所公开的方法的一个或多个步骤。合适的机器学习类型可以包括决策树学习、关联规则学习、归纳逻辑编程、支持向量机(SVM)和贝叶斯网络。决策树学习的示例包括分类树、回归树、提升树、引导聚集树、随机森林和旋转森林。上述机器学习系统中的一个或多个可以用于完成本文所述的方法步骤中的任何一个或全部。例如,一个模型(如神经网络)可以用于完成自主识别特征并将这些特征与某些结局相关联的训练步骤。一旦这些特征被学习,它们可以通过相同或不同的模型或分类器(例如,随机森林、SVM、回归)应用于测试样本,以用于相关步骤。在某些实施方案中,可以使用一个或多个机器学习系统来识别特征并将其与结局相关联,然后可以使用不同的机器学习系统来提炼关联。因此,一些训练步骤可以使用未标记的数据进行无监督,而随后的训练步骤(例如,关联细化)可以使用有监督的训练技术,如使用由第一机器学习系统自主识别的特征的回归分析。
在决策树学习中,建立模型,该模型基于几个输入变量来预测目标变量的值。决策树通常可以分为两种类型。在分类树中,目标变量取有限的一组值或类,而在回归树中,目标变量可以取连续的值,如实数。在决策树中,决策是在一系列节点上按顺序做出的,这些节点对应于输入变量。随机森林包括多个决策树,以提高预测的准确性。参见Breiman,L.Random Forests,Machine Learning,45:5-32(2001),其通过引用并入本文。在随机森林中,自举聚集(bootstrap aggregating)或装袋(bagging)用于对通过作为给定的不同训练数据集的多棵树的预测进行平均。此外,在学习过程中的每个分割点选择一个随机的特征子集,这减少了由于作为响应变量的强预测器的单独特征的存在而可能导致的虚假相关性。随机森林还可以用于通过构建随机森林预测器来确定未标记的数据之间的相异度度量,所述随机森林预测器将观察到的数据与合成数据区分开来,同上文;Shi,T.,Horvath,S.(2006),Unsupervised Learning with Random Forest Predictors,Journal ofComputational and Graphical Statistics,15(1):118-138,其通过引用并入本文。因此,随机森林可以用于本发明的无监督机器学习方法。
SVM可用于分类和回归两者。当用于将新的数据分类为两个类别之一时,如患有疾病或未患有疾病,SVM在多维空间中创建超平面,其将数据点分成一个类别或另一个类别。尽管原始问题可以用仅需要有限维空间的术语来表达,但是在有限维空间中,类别之间的数据的线性分离可能是不可能的。因此,选择多维空间以允许构建提供数据点的清晰分离的超平面。参见Press,W.H.等人,第16.5节,Support Vector Machines.NumericalRecipes:The Art of Scientific Computing(第3版),NewYork:Cambridge University(2007),其通过引用并入本文。SVM也可以用于支持向量聚类,以执行适合于本文讨论的一些方法的无监督的机器学习。参见Ben-Hur,A.等人,(2001),Support Vector Clustering,Journal of Machine Learning Research,2:125-137。
回归分析是用于估计如特征和结局的变量之间的关系的统计过程。它包括用于建模和分析多个变量之间的关系的技术。具体来说,回归分析侧重于因变量的变化对单个自变量变化的响应。给定自变量,回归分析可以用于估计因变量的条件期望。因变量的变化可以用回归函数来表征,并由概率分布来描述。可以使用例如最小二乘法、贝叶斯方法、百分比回归、最小绝对偏差、非参数回归或距离度量学习来估计回归模型的参数。
关联规则学习是用于在大型数据库中发现变量之间的有趣关系的方法。参见Agrawal,R.等人,“Mining association rules between sets of items in largedatabases”,Proceedings of the 1993ACM SIGMOD international conference onManagement of data–SIGMOD'93,第207页(1993)doi:10.1145/170035.170072,ISBN0897915925,通过引用并入本文。用于执行关联规则学习的算法包括Apriori、Eclat、FP-growth以及AprioriDP.FIN、PrePost和PPV,其在Agrawal,R.等人,Fast algorithms formining association rules in large databases,在Bocca,Jorge B.;Jarke,Matthias;和Zaniolo,Carlo;编辑,Proceedings of the 20th International Conference on VeryLarge Data Bases(VLDB),Santiago,Chile,1994年9月,第487-499页(1994);Zaki,M.J.(2000),“Scalable algorithms for association mining”,IEEE Transactions onKnowledge and Data Engineering,12(3):372-390;Han(2000),“Mining FrequentPatterns Without Candidate Generation”,Proceedings of the 2000ACM SIGMODInternational Conference on Management of Data,SIGMOD'00:1-12.doi:10.1145/342009.335372;D.Bhalodiya,K.M.Patel和C.Patel.An Efficient way to FindFrequent Pattern with Dynamic Programming Approach[1].NIRMA UNIVERSITYINTERNATIONAL CONFERENCE ON ENGINEERING,NUiCONE-2013,28-30,2013年11月;Z.H.Deng和S.L.Lv,Fast mining frequent itemsets using Nodesets.[2].ExpertSystems with Applications,41(10):4505-4512,2014;Z.H.Deng,Z.Wang和J.Jiang,ANewAlgorithm for Fast Mining Frequent Itemsets Using N-Lists[3].SCIENCECHINAInformation Sciences,55(9):2008-2030,2012;以及Z.H.Deng和Z.Wang,ANew FastVertical Method for Mining Frequent Patterns[4].International Journal ofComputational Intelligence Systems,3(6):733-744,2010中详细描述;其每一个通过引用并入本文。
归纳逻辑编程依赖于逻辑编程以发展基于正面示例、负面示例和背景知识的假设。参见Luc De Raedt.A Perspective on Inductive Logic Programming.The Workshopon Current and Future Trends in Logic Programming,Shakertown,在Springer LNCS,1999中出版,CiteSeerX:10.1.1.56.1790;Muggleton,S.;De Raedt,L.(1994),“InductiveLogic Programming:Theory and methods”.The Journal of Logic Programming.19-20:629-679.doi:10.1016/0743-1066(94)90035-3;通过引用并入本文。
贝叶斯网络是概率图形模型,其经由有向无环图(DAG)表示一组随机变量及其条件依赖。DAG具有表示随机变量的节点,这些随机变量可以是可观察的量、潜在变量、未知参数或假设。边缘表示条件依赖;未连接的节点表示有条件地相互独立的变量。每个节点都与概率函数相关联,该函数将该节点的父变量的一组特定值作为输入,并给出(作为输出)由该节点所表示的变量的概率(或概率分布,如果适用的话)。参见Charniak,E.BayesianNetworks without Tears,AI Magazine,第50页,1991年冬。
图2显示了具有载体205、报告物207和调节结构域215的活性传感器200。如所示出的,载体205是生物相容性骨架,其包含共价连接的聚乙二醇马来酰亚胺(PEG-MAL)的多个亚基。载体205是分子量在约20kDa和80kDa之间的8臂PEG-MAL骨架。报告物207是包含对鉴定的蛋白酶敏感的区域的多肽。鉴定的蛋白酶切割报告物的活性表明疾病。报告物207包含与可检测的分析物210连接的可切割的底物221。当在可切割的底物221上发生被所鉴定的蛋白酶切割时,可检测的分析物210从活性传感器200释放,并且可以从组织中排出,从体内排泄并被检测。
在各种实施方案中,活性传感器可以包含在结构上耐受体内非特异性蛋白水解和降解的环肽。环肽可以包含蛋白酶特异性底物或pH敏感键,其允许否则非反应性的环肽响应于本文所讨论的酶的存在而释放反应性报告物分子。环肽可能需要在多个切割位点处进行切割,以提高特异性。多个位点可以对相同或不同的蛋白酶具有特异性。可以使用包括2、3、4或更多个环肽结构的多环肽,所述环肽结构具有线性化或释放功能性肽或其他分子期望的酶或环境条件的各种组合。环肽可以包括酯肽,其中一个或多个酯键的水解释放线性化的肽。此类实施方案可以用于调节如血浆的环境中肽释放的定时。
图3显示了具有蛋白酶特异性底物309和稳定的环化接头303的示例性环肽301。蛋白酶特异性底物309可以以任何顺序包括任何数量的氨基酸。例如,X1可以是甘氨酸。X2可以是丝氨酸。X3可以是天冬氨酸。X4可以是苯丙氨酸。X5可以是谷氨酸。X6可以是异亮氨酸。与环化接头303偶联的N-末端和C-末端包括环化残基305。可以对肽进行工程化,以解决如蛋白酶稳定性、切割位点周围的空间位阻、大环结构和肽链的刚性/柔性的问题。可以选择间隔子残基307的类型和数量,以通过改变环肽的各种功能位点之间的间隔来解决和改变许多这些性质。环化接头以及环化残基的定位和选择也可以影响上述考虑事项。调节结构域如PEG和/或报告物如FAM可以被包含在环肽中。
生物样本可以是来自对象的其中可以检测到报告物的任何样本。例如,样本可以是组织样本(如血液样本、硬组织样本、软组织样本等),尿液样本、唾液样本、粘液样本、粪便样本、精液样本或脑脊液样本。
报告物检测
从本发明的活性传感器释放的报告物分子可以通过能够直接或间接检测可检测的分析物中大量分子的存在的任何合适的检测方法来检测。例如,可以经由配体结合测定来检测报告物,该配体结合测定是涉及捕获配体与亲和药剂的结合的测试。在捕获之后,可以通过光密度、放射性发射或非辐射能量转移直接检测报告物。可替代地,可以用抗体缀合物、亲和柱、链霉亲和素-生物素缀合物、PCR分析、DNA微阵列或荧光分析间接检测报告物。
配体结合测定通常涉及检测步骤,如ELISA(包括荧光、比色、生物发光和化学发光ELISA)、纸测试条或侧向流动测定或基于珠的荧光测定。
在一个示例中,基于纸的ELISA测试可以用于检测尿液中释放的报告物。基于纸的ELISA可以廉价地产生,如通过回流从商业固体油墨打印机沉积的蜡以在单张纸上产生测试点的阵列。当固体油墨被加热到液态或半液态时,打印的蜡渗透到纸张中,产生疏水性屏障。疏水性屏障之间的空间然后可以用作单独的反应孔。可以通过干燥单独的反应孔上的检测抗体,在纸上构成测试点,然后进行封闭和洗涤步骤来进行ELISA测定。然后可以将从对象获取的尿液样本中的尿液加入到测试点中,然后可以将链霉亲和素碱性磷酸(ALP)缀合物加入到测试点中,作为检测抗体。结合的ALP然后可以暴露于颜色反应药剂,如BCIP/NBT(5-溴-4-氯-3’-吲哚多磷酸盐对甲苯胺盐/氯化硝基四氮唑蓝(nitro-bluetetrazolium chloride)),这导致紫色沉淀物,表明报告物的存在。
在另一示例中,挥发性有机化合物可以通过分析平台如气相色谱仪、呼吸分析仪、质谱仪,或者使用光学或声学传感器来检测。
气相色谱法可以用于检测可以蒸发而不分解的化合物(例如,挥发性有机化合物)。气相色谱仪包含流动相(或移动相)和固定相,流动相是载气,例如惰性气体如氦气或非反应性的气体如氮气,固定相是惰性固体载体上的液体或聚合物的微观层,位于一片玻璃或金属管(被称为柱)内。该柱被涂覆有固定相,并且被分析的气态化合物与柱的壁相互作用,导致它们在不同时间洗脱(即,在柱中具有不同的保留时间)。化合物可以通过它们的保留时间来区分。
改良的呼吸分析仪也可以用于检测挥发性有机化合物。在用于检测血液中酒精水平的传统呼吸分析仪中,对象向仪器中呼气,并且在对象的呼吸中存在的任何乙醇在阳极处被氧化成乙酸。在阴极处,大气中的氧气被还原。总体反应是乙醇氧化成乙酸和水,其产生可以被微控制器检测和量化的电流。利用其他反应的改良的呼吸分析仪可以用于检测各种挥发性有机化合物。
质谱法可以用于基于质量的差异来检测和区分报告物。在质谱法中,样本被电离,例如通过用电子轰击它被电离。样本可以是固体、液体或气体。通过电离样本,一些样本的分子被分解成带电的碎片。这些离子然后可以根据它们的质荷比被分离。这通常通过加速离子并使它们经受电场或磁场中来实现,其中具有相同质荷比的离子将经历相同量的偏转。当偏转时,离子可以被能够检测带电粒子的机构(例如电子倍增器)检测到。检测到的结果可以被显示为作为质荷比的函数的检测离子的相对丰度的光谱。然后,可以通过将已知质量(如整个分子的质量)与所鉴定的质量相关联,或者通过特征性碎裂模式,来鉴定样本中的分子。
当报告物包含核酸时,可以通过本领域中已知的各种测序方法(例如,传统的桑格测序方法)或通过下一代测序(NGS)来检测报告物。NGS通常是指非基于桑格的高通量核酸测序技术,其中许多(即,数千、数百万或数十亿)核酸链可以被并行测序。此类NGS测序的示例包括Illumina生产的平台(例如,HiSeq、MiSeq、NextSeq、MiniSeq和iSeq 100)、PacificBiosciences生产的平台(例如,Sequel和RSII)和ThermoFisher生产的Ion Torrent平台(例如,Ion S5、Ion Proton、Ion PGM和Ion Chef系统)。应当理解,任何合适的NGS测序平台可以用于NGS以检测如本文所述的可检测的分析物的核酸。
可以直接对生物样本进行分析,或者可以首先对可检测的分析物进行一定程度的纯化。例如,纯化步骤可以涉及将可检测分析物与生物样本中的其他组分分离。纯化可以包括如亲和色谱法的方法。在分析前,分离或纯化的可检测的分析物不需要100%纯的,或者甚至基本上纯的。
对可检测的分析物进行检测可以提供定性评估(例如,是否存在可检测的分析物)或定量评估(例如,存在的可检测的分析物的量),以指示酶的比较活性水平。可以通过任何手段来计算定量值,例如,通过确定样本中存在的每种级分的相对量百分比。用于进行这些类型的计算的方法是本领域已知的。
可检测的分析物可以被标记。例如,当分离的可检测的分析物经受PCR时,可以将标记直接添加到核酸中。例如,使用标记的引物或标记的核苷酸进行的PCR反应将产生标记的产物。标记的核苷酸,如荧光素标记的CTP是市售的。用于将标记附着至核酸的方法是本领域普通技术人员熟知的,并且除了PCR方法之外,还包括例如缺口翻译和末端标记。
适用于报告物的标记包括可通过标准方法(包括光谱方法、光化学方法、生物化学方法、电学方法、光学方法或化学方法)检测的任何类型的标记。标记可以是荧光标记。荧光标记是包含至少一个荧光团的化合物。市售的荧光标记包括,例如,荧光素亚磷酰胺、若丹明、聚甲基苯胺染料衍生物、磷光体、德克萨斯红、绿色荧光蛋白、CY3和CYS。
其他已知技术,如化学发光或比色法(酶促显色反应),也可以用于检测报告物。也可以使用猝灭剂组合物,其中“供体”荧光团通过作为酶的结合位点的短桥与“受体”发色团连接。供体荧光团的信号通过被认为涉及共振能量转移(RET)的过程(如荧光共振能量转移(FRET))被受体发色团猝灭。肽的切割导致发色团和荧光团的分离,淬灭剂的去除,以及从供体荧光团测量的后续信号的产生。FRET对的示例包括5-羧基荧光素(5-FAM)和CPQ2、FAM和DABCYL、Cy5和QSY21、Cy3和QSY7。
在各种实施方案中,活性传感器可以包含配体以帮助它靶向特定组织或器官。当施用于对象时,活性传感器根据其进入身体的方式通过各种途径在体内传输。例如,如果通过静脉内施用活性传感器,则该传感器将从注射部位进入体循环,并且可能被动地通过身体进行传输。
为了使活性传感器响应于特定细胞内的酶活性,在其在体内的停留时间期间的某个点,活性传感器必须进入酶的存在中并且有机会被酶切割和线性化以释放线性化的报告物或治疗分子。从靶向的角度来看,有利的是向活性传感器提供靶向其中可能存在此类感兴趣的酶的特定细胞或特定组织类型的手段。为了实现这一点,特定细胞或特定组织类型的受体的配体可以作为调节结构域提供并且与多肽连接。
细胞表面受体是结合细胞的外表面上的配体的膜锚定蛋白。在一个示例中,配体可以结合配体门控的离子通道,所述离子通道是响应于配体的结合而开放的离子通道。配体门控的离子通道横跨细胞的膜,并且在中间具有亲水性通道。响应于与通道的细胞外区域结合的配体,蛋白质的结构以使得某些颗粒或离子可以通过的方式变化。通过向活性传感器提供包含在细胞表面上存在的蛋白质的配体的调节结构域,活性传感器具有更大的机会到达并进入特定细胞以检测这些细胞内的酶促活性。
通过提供具有调节结构域的活性传感器,可以改变活性传感器的分布,因为配体可以经由配体与靶向的细胞上的细胞表面蛋白的结合将活性传感器靶向对象中的特定细胞或特定组织。调节结构域的配体可以选自小分子、肽、抗体、抗体的片段、核酸和适体。
一旦活性传感器到达特定组织,配体也可以促进活性传感器在特定组织类型中的积累。使活性传感器在特定组织中积累增加了活性传感器的停留时间,并且为活性传感器被组织中的蛋白酶酶促切割提供了更大的机会,如果存在此类蛋白酶的话。
当将活性传感器施用于对象时,它可能被免疫系统识别为外来物质并经受免疫清除,从而从未到达其中特异性酶促活性可以释放治疗化合物或报告物分子的特定细胞或特定组织。此外,免疫应答的产生可能会破坏免疫应答敏感的活性传感器的目的。为了抑制免疫检测,优选的使用生物相容性载体,使得其不引发免疫应答,例如,生物相容性载体可以包含聚乙二醇马来酰亚胺的一个或多个亚基。此外,可以改变聚乙二醇马来酰亚胺载体的分子量,以促进体内的转运并防止活性传感器被网状内皮系统清除。通过此类修改,可以改善活性传感器在体内或特定组织中的分布和停留时间。
在各种实施方案中,活性传感器可以被工程化以促进跨过细胞膜的扩散。如上所述,活性传感器的细胞摄取已经被很好地记录。参见Gang。还可以提供疏水链作为调节结构域以促进活性传感器跨过细胞膜的扩散,所述疏水链可以与活性传感器连接。
调节结构域可以包含任何合适的促进扩散的疏水链,例如脂肪酸链,包括中性的、饱和的、(聚/单)不饱和脂肪和油(甘油一酯、甘油二酯、甘油三酯)、磷脂、甾醇(类固醇醇)、动物甾醇(胆固醇)、蜡和脂溶性维生素(维生素A、维生素D、维生素E和维生素K)。
在一些实施方案中,调节结构域包含细胞穿透肽。细胞穿透肽(CPP)是促进本公开内容的活性传感器的细胞摄入/摄取的短肽。CPP优选地具有这样的氨基酸组成,其含有高相对丰度的带正电荷的氨基酸如赖氨酸或精氨酸,或具有含有极性/带电荷的氨基酸和非极性的疏水性氨基酸的交替模式的序列。参见Milletti,2012,Cell-penetratingpeptides:classes,origin,and current landscape,Drug Discov Today 17:850-860,通过引用并入。合适的CPP包括文献中已知的CPP,如Tat、R6、R8、R9、穿膜肽(Penetratin)、pVEc、RRL螺旋、Shuffle和Penetramax。参见Kristensen,2016,Cell-penetratingpeptides as tools to enhance non-injectable delivery of biopharmaceuticals,Tissue Barriers4(2):e1178369,通过引用并入。
在某些实施方案中,活性传感器可以包含生物相容性聚合物作为调节结构域以保护活性传感器免于免疫检测或抑制巨噬细胞对活性传感器的细胞摄取。
当外来物质被识别为抗原时,抗体应答可能会被免疫系统触发。通常,抗体然后会附着至外来物质,形成抗原-抗体复合物,其然后被巨噬细胞和其他吞噬细胞摄取,以将这些外来物质从体内清除。因此,当活性传感器进入体内时,其可以被识别为抗原并经受免疫清除,防止活性传感器到达特定组织以检测酶促活性。为了抑制活性传感器的免疫检测,例如,可以将PEG调节结构域与活性传感器连接。PEG充当屏蔽,抑制通过免疫系统将活性传感器识别为外来物质。通过抑制免疫检测,调节结构域改善了活性传感器在体内或特定组织中的停留时间。
通过结合具有互补形状、电荷和底物的亲水/疏水特性的口袋,酶对特异性底物具有高度特异性。因此,酶可以将非常相似的底物分子区分为化学选择性的(即,偏好化学反应的结局而不是替代反应)、区域选择性的(即,偏好化学键形成或断裂的一个方向而不是所有其他可能的方向)和立体特异性的(即,仅在立体异构体中的一个或子集上反应)。
空间效应是影响离子和分子的形状(即构象)和反应性的非键相互作用,其导致空间位阻。空间位阻是由于空间体积而导致的化学反应变慢,影响分子间反应。可以对分子的各种基团进行修饰,以控制基团间的空间位阻,例如控制选择性,如用于抑制不希望的副反应。通过向活性传感器提供调节结构域,如载体和切割位点之间的间隔子残基和/或任何生物缀合残基,可以使活性传感器的组分之间的空间位阻最小化,以增加切割位点对特异性蛋白酶的可及性。可替代地,可以如上所述使用空间位阻来防止接近切割位点,直到不稳定的环化接头(例如,环状酯肽的酯键)已经被降解。此类不稳定的环化接头可以是在限定的条件(例如,pH或存在某种分析物)下水解的其他已知的化学部分,可以选择这些条件以响应于靶标环境的特定特征。
在各种实施方案中,活性传感器可以包含除靶切割位点之外的D-氨基酸,以进一步防止非特异性蛋白酶活性。其他非天然氨基酸也可以被并入到肽中,包括合成的非天然氨基酸、取代的氨基酸或一种或多种D-氨基酸。
在一些实施方案中,调节结构域可以包含合成聚合物,如乳酸和乙醇酸的聚合物、聚酐、聚氨酯,以及天然聚合物如藻酸盐和其他多糖(包括葡聚糖和纤维素)、胶原、白蛋白和其他亲水性蛋白质、玉米醇溶蛋白(zein)和其他醇溶蛋白和疏水性蛋白质、共聚物及其混合物。
本领域技术人员将已知在本公开内容的活性传感器中包含哪些肽片段作为蛋白酶切割位点。可以使用在线工具或出版物来识别切割位点。例如,在Song,2012,PROSPER:Anintegrated feature-based tool for predicting protease substrate cleavagesites,PLoSOne 7(11):e50300(通过引用并入)中所述的在线数据库PROSPER中预测了切割位点。本文所讨论的组合物、结构、方法或活性传感器中的任何一种可以包含,例如,任何合适的切割位点,以及获得任何所需分子量的任何另外的任意多肽片段。为了防止脱靶标切割,切割位点外的一个或任何数量的氨基酸可以以任何量处于D和/或L形式的混合物中。
援引并入
在整个本公开内容中,对其他文件,如专利、专利申请、专利出版物、期刊、书籍、论文、网络内容进行了参考和引用。出于所有目的,所有此类文件据此通过引用以其整体并入本文。
等同物
除了在本文示出和描述的那些之外,本发明的各种修改及其许多另外的实施方案对于本领域技术人员来说,从本文件的全部内容(包括参考在本文中引用的科学和专利文献)将变得显而易见。本文中的主题含有重要的信息、例证和指导,这些信息、例证和指导可以适用于本发明在其各种实施方案及其等同物中的实践。

Claims (22)

1.一种为患者提供个性化治疗的方法,其包括:
向患者施用活性传感器混合物;
分析从施用所述活性传感器混合物获得的结果;
访问从至少一个其他来源获得的数据;以及
基于对来自活性传感器混合物施用的结果和从所述至少一个其他来源获得的所述数据的分析,确定用于所述患者的个性化治疗疗程。
2.根据权利要求1所述的方法,其中所述活性传感器混合物包括多个活性传感器,每个所述活性传感器包括:
载体,所述载体包括一个或多个分子亚基;和
多个可检测的报告物,每个所述报告物通过含有酶的切割位点的可切割接头与所述载体连接,其中所述活性传感器通过在被一种或多种酶切割时释放所述报告物来报告所述一种或多种酶的活性。
3.根据权利要求1所述的方法,其中所述确定步骤包括诊断疾病。
4.根据权利要求1所述的方法,其中所述确定步骤包括识别疾病进展中的阶段。
5.根据权利要求1所述的方法,其中所述确定步骤包括预测对治疗性治疗的应答。
6.根据权利要求1所述的方法,其中所述至少一个其他来源包括电子医疗记录(EMR)。
7.根据权利要求1所述的方法,其中所述至少一个其他来源包括分子诊断数据。
8.根据权利要求7所述的方法,其中所述分子诊断数据选自核酸序列信息、表观遗传学信息、DNA甲基化和RNA表达数据。
9.根据权利要求1所述的方法,其中所述至少一个其他来源包括合并症信息。
10.根据权利要求1所述的方法,其中所述确定步骤包括识别来自所述活性传感器混合物施用的结果和从所述至少一个其他来源获得的指示结局的数据中的模式。
11.根据权利要求10所述的方法,其中通过对具有已知结局的患者的数据进行机器学习分析来识别所述模式。
12.根据权利要求1所述的方法,其中所述确定步骤由计算机执行,所述计算机包括耦合到处理器的有形的非暂时性存储器。
13.一种用于识别患者数据中的诊断指标的方法,所述方法包括:
分析从向具有已知结局的多个患者施用活性传感器混合物获得的结果;
访问从至少一个其他来源获得的所述多个患者的数据;以及
将所述已知结局、所述结果和所述数据提供给机器学习系统;
通过机器学习分析,使用所述机器学习系统识别所述结果和指示所述已知结局中的一个或多个的数据中的模式。
14.根据权利要求13所述的方法,其中所述活性传感器混合物包括多个活性传感器,每个所述活性传感器包括:
载体,所述载体包括一个或多个分子亚基;和
多个可检测的报告物,每个所述报告物通过含有酶的切割位点的可切割接头与所述载体连接,其中所述活性传感器通过在被一种或多种酶切割时释放所述报告物来报告所述一种或多种酶的活性。
15.根据权利要求13所述的方法,其中所述已知结局包括疾病的发展。
16.根据权利要求13所述的方法,其中所述已知结局包括疾病的进展。
17.根据权利要求13所述的方法,其中所述已知结局包括对治疗性治疗的应答。
18.根据权利要求13所述的方法,其中所述至少一个其他来源包括电子医疗记录(EMR)。
19.根据权利要求13所述的方法,其中所述至少一个其他来源包括合并症信息。
20.根据权利要求13所述的方法,其中所述至少一个其他来源包括分子诊断数据。
21.根据权利要求20所述的方法,其中所述分子诊断数据选自核酸序列信息、表观遗传学信息、DNA甲基化和RNA表达数据。
22.根据权利要求13所述的方法,其中所述识别步骤由计算机执行,所述计算机包括耦合到处理器的有形的非暂时性存储器。
CN202180045275.5A 2020-04-24 2021-04-23 多因素活性监测 Pending CN115768904A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063015342P 2020-04-24 2020-04-24
US63/015,342 2020-04-24
PCT/US2021/028795 WO2021216969A1 (en) 2020-04-24 2021-04-23 Multi-factor activity monitoring

Publications (1)

Publication Number Publication Date
CN115768904A true CN115768904A (zh) 2023-03-07

Family

ID=78221035

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180045275.5A Pending CN115768904A (zh) 2020-04-24 2021-04-23 多因素活性监测

Country Status (6)

Country Link
US (1) US20210330218A1 (zh)
EP (1) EP4139471A1 (zh)
JP (1) JP2023523321A (zh)
CN (1) CN115768904A (zh)
CA (1) CA3181049A1 (zh)
WO (1) WO2021216969A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023076638A2 (en) * 2021-10-29 2023-05-04 Glympse Bio, Inc. Disease detection with combinatorial biomarkers

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015191562A1 (en) * 2014-06-09 2015-12-17 Revon Systems, Llc Systems and methods for health tracking and management
EP3158085B1 (en) * 2014-06-18 2020-12-02 Clear Gene, Inc. Methods for rapid analysis of biological markers
CA3109379A1 (en) * 2018-06-08 2019-12-12 Glympse Bio, Inc. Activity sensor design

Also Published As

Publication number Publication date
US20210330218A1 (en) 2021-10-28
EP4139471A1 (en) 2023-03-01
JP2023523321A (ja) 2023-06-02
CA3181049A1 (en) 2021-10-28
WO2021216969A1 (en) 2021-10-28

Similar Documents

Publication Publication Date Title
Chabon et al. Integrating genomic features for non-invasive early lung cancer detection
KR101857462B1 (ko) 췌장암 바이오마커 및 그것의 용도
KR101870123B1 (ko) 폐암 바이오마커 및 그것의 용도
US20100070191A1 (en) Lung Cancer Biomarkers and Uses Thereof
US20110312520A1 (en) Methods and compositions for diagnosing conditions
Su et al. Current insights into oral cancer diagnostics
WO2015069933A1 (en) Circulating cell-free dna for diagnosis of transplant rejection
JP2012502281A (ja) 肺癌バイオマーカーとその使用
US20220328129A1 (en) Multi-omic assessment
CN110662966A (zh) 用于检测结直肠癌和晚期腺瘤的蛋白质生物标志物小组
Gonzalez Bosquet et al. Creation and validation of models to predict response to primary treatment in serous ovarian cancer
Amini et al. Multiscale profiling of protease activity in cancer
Dong et al. Development of parallel reaction monitoring assays for the detection of aggressive prostate cancer using urinary glycoproteins
Chen et al. Cell-free DNA detection of tumor mutations in heterogeneous, localized prostate cancer via targeted, multiregion sequencing
Haan et al. Epigenomic blood-based early detection of pancreatic cancer employing cell-free DNA
US20210330218A1 (en) Multi-factor activity monitoring
WO2010148145A1 (en) Methods and kits for detecting ovarian cancer from blood
US20230223111A1 (en) Multi-omic assessment
Soleimany et al. Multiscale profiling of enzyme activity in cancer
EP2943794B1 (en) Biomarker panel for predicting recurrecne of prostate cancer
Cereceda et al. Advances in mass cytometry and its applicability to digital pathology in clinical-translational cancer research
GB2607436A (en) Multi-omic assessment
Kolbinger et al. Significance of distinct liquid biopsy compartments in evaluating somatic mutations for targeted therapy selection in cancer of unknown primary
US20210333283A1 (en) Cancer-related activity sensors
Cheng et al. Clinical risk factors of carbohydrate antigen-125, cytokeratin fragment 19, and neuron-specific enolase in liver metastases from elderly lung cancer patients

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination