CN116547722A - 剂量-反应图的图像分类 - Google Patents

剂量-反应图的图像分类 Download PDF

Info

Publication number
CN116547722A
CN116547722A CN202180076504.XA CN202180076504A CN116547722A CN 116547722 A CN116547722 A CN 116547722A CN 202180076504 A CN202180076504 A CN 202180076504A CN 116547722 A CN116547722 A CN 116547722A
Authority
CN
China
Prior art keywords
dose
image
response
computer
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180076504.XA
Other languages
English (en)
Inventor
M·比安西奥托
K·米
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanofi Aventis France
Original Assignee
Sanofi Aventis France
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanofi Aventis France filed Critical Sanofi Aventis France
Publication of CN116547722A publication Critical patent/CN116547722A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

一种对图像进行分类的计算机实现的方法,所述图像包括从剂量‑反应实验获得的剂量‑反应图。所述方法包括在曲线形状分类器模型处接收包括图像数据的输入,所述图像数据包括多个像素,其中,所述图像数据表示指示化合物的浓度与其活性之间的关系的剂量‑反应图的图像。所述曲线形状分类器模型包括神经网络模型,所述神经网络模型被配置用于将剂量‑反应图的图像分类为与曲线形状相关的多个剂量‑反应图类别。所述方法进一步包括使用所述神经网络模型生成由所接收的图像数据表示的图像的分类输出,所述生成包括使用所述神经网络模型的一个或多个层、根据与所述一个或多个层相关联的参数来处理所述图像数据。

Description

剂量-反应图的图像分类
技术领域
本说明书涉及一种对图像进行分类的计算机实现的方法,所述图像包括从多个剂量-反应实验获得的剂量-反应图。
背景技术
在药物发现项目的初期,潜在的药物靶标被鉴定出。药物靶标是体内的分子,其与特定的疾病过程有内在联系。取决于待治疗的疾病,靶标可以是蛋白质(例如受体蛋白、酶、离子通道或转运蛋白)或核酸(例如DNA)。研究人员假设,用药物改变靶标的活性会产生理想的治疗效果。
一旦已经鉴定出靶标,就鉴定或开发了测试系统,所述测试系统产生可检测的信号以评估化合物对药物靶标的影响。该测试系统被称为测定。一旦已经鉴定或开发了测定,研究人员就可以用它来鉴定具有所需活性的化合物。通常,将在多个浓度下对化合物进行测试,并且可以生成剂量-反应(DR)图。对DR图的分析使研究人员能够确定化合物是否具有活性,以及在什么浓度下具有活性。
在需要测试大量潜在化合物的情况下,经常使用高通量筛选(HTS)。这使用了机器人、数据处理/控制软件、液体处理装置和灵敏的检测器,并使研究人员能够快速进行数千甚至数百万次筛查测试。当在多个浓度下测试所有化合物以生成DR数据时,这被称为定量HTS(qHTS)。
然而,在HTS活动的剂量-反应(DR)步骤生成的大量数据需要研究人员仔细分析,以便在验证实验之前检测伪影并纠正错误的数据点。这一步骤需要专家对每个DR实验进行审查,可能很耗时并且容易出现人为错误或不一致。
发明内容
本说明书描述了一种对图像进行分类的计算机实现的方法,所述图像包括从剂量-反应实验获得的剂量-反应图。所述方法包括在曲线形状分类器模型处接收包括图像数据的输入,所述图像数据包括多个像素,其中,所述图像数据表示指示化合物的浓度与其活性之间的关系的剂量-反应图的图像。所述曲线形状分类器模型包括神经网络模型,所述神经网络模型被配置用于将剂量-反应图的图像分类为与曲线形状相关的多个剂量-反应图类别。特别地,每个剂量-反应图类别可以与对应的曲线形状相关联,所述曲线形状定义了所述类别的剂量-反应关系。
所述方法包括使用所述神经网络模型生成由所接收的图像数据表示的图像的分类输出,所述生成包括使用所述神经网络模型的一个或多个层、根据与所述一个或多个层相关联的参数来处理所述图像数据。所述神经网络模型可以包括卷积神经网络模型。
对剂量-反应图的图像(而不是原始的剂量-反应图数据)进行分类减少了分类器模型的不同输入之间或用于预测的输入与训练数据之间任何缺乏同质性的影响。因而,所要求保护的方法提供了一种灵活的分类器,所述分类器可以对具有例如不同数量的数据点(例如8、10或12个浓度)、缺失点和/或具有不同数量的复制的剂量-反应图图像进行分类。
分类输出可以包括概率向量,每个概率表示由接收到的图像数据表示的输入属于对应类别的可能性。可替代地或另外地,分类输出可以指示具有最高概率的类别。在一些例子中,分类输出可以指示两个(或更多个)最可能的类别。
在示例实施方式中,剂量-反应图最初可以被分类为第一或第二离散类别,其中,仅当所述剂量-反应图被分类在所述第一离散类别中时,使用所述曲线形状分类器模型来处理表示所述剂量-反应图的图像的图像数据。离散分类器可以用于将剂量-反应图分类为第一或第二离散类别。离散分类器可以包括二元分类器。第二离散类别可以是高离散类别,并且第一类别可以是针对不属于第二类别的其他剂量-反应图(例如,较低离散图)的类别。离散分类器可以基于相同浓度下的活性测量之间的差异将剂量-反应图分类为第一或第二离散类别(例如,较高或较低离散类别)。
剂量-反应图可以由离散分类器使用在所有浓度下复制之间的四分位距和/或其他四分位数值进行分类。这种方法的优点是,对于要考虑的数据点的数量没有限制,这意味着即使一些数据点缺失,或者如果离散分类器的输入之间(或者用于预测的输入与训练数据之间)的浓度数量不同,分类器也是有效的。这种益处与使用图像作为曲线形状分类器的输入是协同的并且有助于灵活的分类流水线,从而减少输入数据中任何不同质性的影响。
离散分类器可以包括经过训练的机器学习模型。在一个示例实现方式中,离散分类器包括多层感知器神经网络模型。
所述多个剂量-反应类别可以包括以下中的一个或多个(或全部):
针对在整个浓度范围上为高活性的“顶(Top)”类别;
针对其中上渐近线部分可见但下渐近线部分不可见的S形曲线的“无底(NoBottom)”类别;
针对包括下渐近线部分和上渐近线部分的良态S形曲线的“S形(Sigmoid)”类别;
针对其中下渐近线部分可见但上渐近线部分不可见、并且其达到50%活性阈值的S形曲线的“活性无顶(Active No Top)”类别,并且所述剂量-反应图在拐点之后的部分可见;
针对在所述剂量-反应图的浓度范围内的弱活性化合物的“无顶(No Top)”类别;
针对所述剂量-反应图的浓度范围内的非活性化合物的“非活性(Non Active)”类别;
针对在EC50处具有高斜率的S形曲线的高斜率类别;
针对在EC50处具有低斜率的S形曲线的低斜率类别;
针对其中在上渐近线处的A(c)与下渐近线处的A(c)之间的差小于70%的S形曲线的“部分的(partial)”类别;
其中活性关于浓度有交替的增加和降低的“波形(wave)”类别;以及
其中除了最高浓度或两个最高浓度之外没有显示任何活性的“最后上升(lastup)”类别。
所述多个剂量-反应类别可以包括:
钟形曲线类别,和/或
针对在较高浓度下抑制作用降低的S形曲线的毒性类别。
钟形曲线类别和毒性类别可以一起融合为单个类别用于推理,但在训练中保持分离,使得模型独立地学习与这些类别中的每一个相关联的稍微不同的视觉图案。专家们并不总是能够轻易地区分这两种类别。然而,在本说明书中描述的实施方案中,这些类别可以有利地通过曲线形状分类器模型来区分,因为它对像素数据形式的低级特征进行操作。
在另一个示例实现方式中,本说明书描述了一种产生曲线形状分类器模型的计算机实现的方法,所述曲线形状分类器模型用于对从剂量-反应实验获得的剂量-反应图进行分类。所述方法包括:在神经网络模型处接收多个训练图像,其中,每个训练图像是指示化合物的浓度与其活性之间的关系的剂量-反应图的图像;为每个训练图像生成输出,其中,为训练图像生成所述输出包括通过所述神经网络模型的一个或多个层、根据与所述一个或多个层相关联的参数来处理所述训练图像,以及基于目标函数来更新所述参数,所述目标函数包括为每个训练图像生成的输出与同所述训练图像相关联的相应标签数据之间的比较,所述标签数据指示所述训练图像属于与曲线形状相关的一个或多个剂量-反应图类别。所述神经网络模型可以包括卷积神经网络模型。
在另一示例实现方式中,本说明书描述了一种数据处理设备,所述数据处理设备包括被配置成执行本文所述的任何计算机实现的方法的一个或多个处理器。
在另一示例实现方式中,本说明书描述了一种包括指令的计算机可读存储介质,所述指令在由一个或多个处理器执行时使所述一个或多个处理器执行本文所述的任何计算机实现的方法。
如本文所使用的,术语“剂量-反应图”是指指示化合物浓度与其活性之间的剂量-反应关系的图。剂量-反应图可以例如包括相对于笛卡尔轴(例如水平(X)轴和竖直(Y)轴)绘制的数据点集。在各种实施方案中,剂量-反应图可以从高通量筛选过程中获得。然而,剂量-反应图可以替代地从其他来源获得,例如从其他筛选过程(诸如低通量筛选)获得。在本领域中,“剂量-反应图”可以替代地称为“剂量-反应曲线”,但理解的是,术语“剂量-反应曲线”并不一定意味着存在连续的曲线。
术语EC50是指化合物的半最大有效浓度,即导致50%最大反应的浓度。同时,术语IC50是指半最大抑制浓度,即导致50%抑制的浓度。将理解的是,剂量-反应图可以测量除抑制作用之外的活性,例如,剂量-反应图可以测量化合物作为生物分子或生物体的激动剂的能力。所要求保护的方法可用于对测量任何种类活性的剂量-反应图进行分类。因此,术语EC50将在这整个描述中使用,但可以理解为包括测量抑制作用的实施方案,并且可以使用术语IC50
本文中使用的术语A(c)可以理解为指在特定浓度(c)下观察到的活性(A)。类似地,术语I(c)可以理解为指在特定浓度(c)下观察到的抑制作用(I)。术语A(c)将在这整个描述中使用,但可以理解为包括测量抑制作用的实施方案,并且可以使用术语I(c)。
可以理解的是,术语“活性”可以理解为指生物活性或生物物理活性。例如,剂量-反应图可以指示化合物的浓度与其作为生物分子或生物体的激动剂、拮抗剂或别构调节剂的能力之间的关系。可替代地或另外地,剂量-反应图可以指示化合物的浓度与其结合生物分子或生物体的能力之间的关系。生物分子或生物体可以是或可以包括亲核性结构。生物分子或生物体可以选自氨基酸、肽、亲和体、蛋白质、糖蛋白、脂多糖、抗体或其片段、核酸、有机聚合物、病毒、细菌、寄生虫、细胞和细胞相关结构。蛋白质可以是或包括受体、酶、离子通道和/或转运蛋白。
可以理解的是,本文所述的计算机实现的方法可以用于帮助鉴定具有所需活性的化合物。这些化合物可以作为潜在的候选药物。可替代地,药物化学家可以制得基于或包括所鉴定的活性化合物的经改性的化合物。本发明扩展到任何药物,其中所述药物包括或基于已经在剂量-反应实验中测试过的化合物,并且使用本文所述的计算机实现的方法对所述实验的结果进行分类。本发明还扩展到任何药物,其中所述药物包括或基于已经在剂量-反应实验中测试过的化合物,并且使用本文所述的计算机实现的方法对所述实验的结果进行分类,以用于治疗。所述药物可以是已经在剂量-反应实验中测试过的化合物。
本文所述的计算机实现的方法可用于鉴定小分子和/或生物分子,诸如但不限于分子生物标记。本发明还扩展到已经在剂量-反应实验中测试过的小分子或生物分子,并且使用本文所述的计算机实现的方法对所述实验的结果进行分类。
附图说明
为了可以更容易地理解本发明,现参考附图仅通过例子的方式描述其实施方案,在附图中:
图1举例展示了一组剂量-反应图类别;
图2展示了根据示例实现方式的分类流水线;
图3展示了根据示例实施方案的神经网络形状分类器的架构;
图4展示了根据示例实施方案的神经网络离散分类器的架构;以及
图5是用于执行本文所述方法的系统/设备的示意图。
具体实施方式
概述
各种示例实现方式涉及用于基于作用于剂量-反应(DR)图的归一化图像的神经网络对DR图进行分类的系统。所述系统可以在几分钟内对多个类别中的数千条曲线进行注释,以帮助高通量筛选(HTS)研究人员进行分析。类别可能与活性或非活性化合物相关联,或与感兴趣的特征相关联,诸如复制之间存在噪声,高剂量下可能与毒性、聚集或溶解问题有关的较弱效果,或活性物质DR图拐点处可疑的弱斜率或强斜率。
介绍
高通量筛选(HTS)是制药行业用于寻找命中率的主要策略之一。最近,筛选技术变得更加复杂,导致了像定量HTS和使用更多反筛选或选择性测定来定量命中率的策略等方法。反过来,这些技术提高了生成的剂量-反应(DR)结果的数量。通过诸如噬菌体展示、酵母展示或荧光激活细胞分选(FACS)等选择技术询问蛋白质文库后,获得其他大的剂量-反应数据集。剂量-反应数据的质量取决于筛选条件、方案和总体测定稳健性,并且取决于化合物的性能。剂量-反应关系的基本自动分析依赖于拟合算法,所述算法在次优设置中可能不可靠,因为由于干扰效应或其他技术伪影而存在异常值。在实践中,需要人工审查剂量-反应数据并对其采取行动,以便做出关于项目中相应化合物的后续行动的决定。因而,视觉检查步骤是耗时的,当命中率较高时更是如此,并且该步骤的结果取决于曲线的质量、专家的经验和可用于分析的时间。在处理大量结果时,这种方法可能会延迟项目,并可能随着时间的推移导致分析缺乏一致性和稳健性。
当活性化合物在测定的浓度范围内具有EC50(导致50%最大反应的浓度,无论是抑制作用还是其他活性测量)时,其DR曲线的理想形状要么是全S形(其低渐近线和高渐近线都很清楚),要么是其一部分。理想的剂量-反应图可以是平坦的,要么是因为化合物在整个浓度范围内显示出最大活性,要么是因为根本没有活性。然而,DR实验可能受到扰动,导致曲线不属于这些理想形状的原因有很多。有些仅与化合物的性质(例如,高浓度下的胶体聚集或毒性问题)有关,其他也取决于细胞系或实验方案(例如,着色和荧光化合物干扰发光测定)。
DR图的标准后处理工作流程在于使用Hill方程将抑制百分比A(c)拟合为S形,并提取几个参数,诸如EC50及其置信区间、EC50处的斜率,顶部和底部渐近线处的A(c)。Hill方程本身对于本领域的技术人员是已知的,并且将不在这里进行描述。参考“Handbook ofDrug Screening”;Seethala,R.;Zhang,L.,Eds.;Drugs and the PharmaceuticalSciences;CRC Press:2009和Shockley,K.R.“Quantitative high-throughput screeningdata analysis:challenges and recent advances”,Drug Discovery Today 2015,20,296-300。
单独提取的参数不足以完全表征化合物的活性。因而,通常会对DR图进行视觉检查,这可能涉及掩蔽异常值以生成更好的拟合、确认或调整拟合的参数(顶部和底部渐近线、EC50、斜率)、发现无效实验以进行重新测试、注释显示缺陷或特异性的有效曲线、并用最终决策标签标记每条曲线:“活性”(A)、“非活性”(NA)或“无效”(NV)。专家的这个组织步骤面临着挑战:它很耗时,可能依赖于专家,甚至一位专家在不同时间注释临界案例时也可能面临一致性问题。
为了减轻这些困难,本说明书描述了一种用于根据DR图的视觉特性对其进行自动分类的计算机实现的方法。特别地,如下面更详细地描述的,分类可以是基于剂量-反应关系的视觉图案,所述视觉图案可以由剂量-反应曲线的形状来定义。所述系统包括卷积神经网络模型形式的神经网络图像分类器,其通过训练被配置成将接收到的DR图图像分类为多个DR图类别。
在下面描述的示例实现方式中,系统可以给出由专家定义的14个不同类别以及分类概率。该解决方案允许专家根据视觉相似性将相似的DR图分组到具有可解释标签的类别中,以便对其执行批量操作,并轻松鉴定预测不太好的曲线,以便进行深入审查。所述系统提高了检查步骤的速度以及最终决策的稳健性和一致性。
数据策略
图1展示了14个类别中的DR图的例子以及相关的类别标签。每个类别都有相关联的标签,并且这两个术语(“类别”和“标签”)将被同义地使用。
这14个类别包括13个类别(集合A、B和C),它们可以与明确定义的曲线形状相关联。
其中,六个类别形成第一组(集合A),具有不同的活性水平且没有缺陷(例如,没有缺陷或极端参数):
-“顶”代表在整个浓度范围内展现出完全信号抑制的极强效化合物,
-“无底”对应于具有S形抑制曲线的强效化合物,其中上部渐近线可见,但下部渐近线不可见,
-“S形”是指活性化合物的良性S形曲线,包括下部渐近线和上部渐近线,
-“活性无顶”代表包括低渐近线但没有高渐近线的并达到50%抑制阈值的DR图,其中拐点后的DR图部分是可见的,
-“无顶”是指测定浓度范围内的弱活性化合物,
-“非活性”DR图是针对在测定中无活性的化合物。
第二组的3个类别(集合B)对应于具有一些极端参数的S形DR图:
-“高斜率”代表全S形DR图,在EC50处具有高斜率(通常nHill>4),
-“低斜率”相反地描述了在EC50处具有低斜率的全S形DR图(通常nHill<0.5)。
当系统中发生协同效应时,可以观察到这些图案。
-“部分的”标签是针对全S形DR图,其中相对的最大抑制(上渐近线处的A(c)与下渐近线处的A(c)之间的差异)小于70%,这在细胞测定中经常观察到。
第三组(集合C)包括DR图,其示出了在实践中通常观察到的缺陷:
-在“钟形”DR图中,A(c)在最高浓度时降低,导致钟形曲线。这种图案可能是由荧光测定格式中的信号干扰问题或者是由化合物聚集问题引起的。
-“毒性”(“高浓度下的反向效应”)标签也是针对全S形抑制曲线,由于化合物的毒性,抑制作用在最高浓度下急剧降低,这在细胞测定中经常观察到。“毒性”标签和“钟形”标签可以在后处理中融合在一起,如下所讨论的。
-在“波形”DR图中,A(c)有交替的增加和降低。这可能是由于各种问题引起的,诸如信号读数中的干扰或化合物稀释系列中的问题。
-“最后上升”标签是针对其中除了最高化合物浓度或两个最高化合物浓度外,在滴定曲线中没有观察到抑制作用,从而导致无效曲线的DR图。
这些类别可与三个更高阶的系综相关联,即“明显活性”、“明显非活性”和“需要审查”,后一集合是针对所有具有特异性或缺陷的曲线。“顶”类别、“无底”类别、“S形”类别、“活性无顶”类别与“明显活性”系综相关联。“非活性”类别与“明显非活性”系综相关联。“无顶”类别、“高斜率”类别、“低斜率”类别、“部分的”类别、“钟形”类别、“毒性”类别、“波形”类别、“最后上升”类别和“离散”(见下文)类别与“需要审查”系综相关联。
人类专家可以直观地检查DR图,并基于定义剂量-反应关系趋势的曲线形状将其分配给13个类别(集合A、B和C)中的一个。例如,示例DR图110可以被分配到“S形”类别,因为定义剂量-反应关系的趋势的曲线是S形的。DR图120可以被分配到“波形”类别,因为所述曲线具有波形形状,其活性有交替的增加和降低。因而,从图1中可以直观地理解,13个类别(集合A、B和C)中的每一个都可与对应的曲线形状相关联,所述曲线形状定义了所述类别的剂量-反应关系。因此,这些类别在本文中可以称为“形状类别”。
注意,某些类别可能与相同或相似的曲线形状相关联。例如,“顶”和“非活性”具有相同的(水平)曲线,并且可以仅在每个浓度下的反应幅值上不同。“最后上升”和“无顶”也有一些相似之处,但可能不同之处在于“最后上升”的曲线比“无顶”上升得更陡。
如下面更详细地描述的,图像分类器模型可以通过在先前已经由专家分类的DR图的图像上训练分类器来学习基于曲线形状对DR图的图像进行分类。
图1还展示了“离散”类别(集合D),其中在复制之间观察到噪声。复制是在相同浓度值下进行的两次或多次测量。不像其他类别,“离散”类别与特定形状无关,但仍可以作为分类流水线的一部分单独处理,如现在将要描述的那样。
分类流水线
图2展示了示例分类流水线200,其包括离散分类器210和形状分类器220。离散分类器210充当初始滤波器,并且只有通过该滤波器的那些DR图被提交给形状分类器220。更具体地,离散分类器可以输出剂量-反应图属于“离散”类别的概率p(0与1之间的值)。如果概率大于0.5,则剂量-反应图被归类为“离散”类别。否则,生成剂量-反应图的归一化图像,并将其输入到形状分类器中,所述形状分类器按曲线形状对图像进行分类。如所示,以低于0.9的概率分类的剂量-反应图的图像可以被分配到特定的“低概率”类别。
形状分类器可以被配置成将DR图的图像分类为12个形状类别。这12个形状类别与图1中集合A、B和C中的13个形状类别相同,只是“钟形”和“毒性”融合在一起(即视为一个组合类别),因为已经发现,专家们并不总是能够区分这两种类别。
形状分类器220可以包括卷积神经网络(CNN),其将DR图的图像作为输入并且生成分类输出。卷积神经网络本身对于本领域的技术人员来说是已知的,并且这里将不再详细描述。参考LeCun,Y.;Bengio,Y.;Hinton,G.Deep learning.Nature 2015,521,436-444。
由CNN产生的分类输出可以包括12个形状类别中的每一个的概率,每个概率是DR图属于对应类别的可能性。可替代地或另外地,分类输出可以包括具有最高概率的类别的指示,除非该概率小于0.9,在这种情况下DR图被分类为“低概率”。
离散分类器210是二元分类器,因为它分类为两个可能的类别。它可以包括多层感知器(MLP)分类器,其将从DR图的原始数据中提取的统计特征作为输入,并输出DR图属于离散类别的概率。例如,为了使用离散分类器处理DR图,可以提取每个浓度下复制之间的A(c)的正差,并且可以针对该分布计算q1、q2和q3四分位数以及四分位距。这四个描述符可以使用MinMax缩放在0与1之间进行归一化,并且这四个归一化值可以用作分类器的输入。
形状分类器预处理
形状分类器可以在训练阶段或者在预测阶段接收图像,在训练阶段,训练图像被用来训练模型,在预测阶段,对训练过程中未看到的“新”DR图图像进行分类。在任一阶段中,可以通过生成灰度图像来从原始DR图数据生成输入图像,所述灰度图像描绘了DR图相对于笛卡尔(例如X-Y)轴的数据点集。所生成的图像可以被归一化,因为每个图像可以被生成为具有相同的尺寸(例如,150×150像素),并且X轴和Y轴在每个图像中处于相同的位置。此外,可以对生成的图像进行归一化,因为Y轴(活性)在每个图像中的相同位置用相同的刻度或值(例如,-50与150之间的值)进行标记。另一方面,可以从X轴(浓度)中省略刻度或值,并且不同的图像不需要涉及相同范围的浓度值,并且可以具有不同数量的数据点。为了在由图像定义的归一化“帧”上描绘数据,可以通过去除/过滤落在该“帧”之外的数据点来归一化原始数据。DR图图像的各种例子如图1所示。
将DR图转换为图像以供CNN处理,与训练集相比减少了不同DR图样本之间(例如,在推理中使用的DR图样本之间)任何缺乏同质性的影响。它提供了一种灵活的分类器,所述分类器可以处理具有例如不同数量的数据点(例如8、10或12个浓度)、缺失点和/或具有不同数量的复制的DR图(这导致针对一些浓度值的不同数量的Y值)。
训练数据
用于训练目的的DR图可以从现有的数据源获得或通过算法生成。DR图可以由专家手动标记为图1所示的14个类别之一。所得到的标签可以表示为向量,并存储为“地面真值(ground truth)”数据。
通过算法生成DR图可以包括使用Hill方程、使用每个类别标签的特定参数空间内的参数来生成合成剂量-反应数据。类别标签的参数空间可以例如包括拐点的位置、拐点处的斜率、以及顶部渐近线和底部渐近线的位置。可能会添加噪声和/或缺陷。
特别地,其类别属于“明显活性”和“明显非活性”系综的DR图可以基于Hill方程来构建。“钟形”和“波形”曲线可以分别通过组合2个或3个Hill函数来生成。“毒性”和“最后上升”可以通过在最高浓度的A(c)上添加适当的噪声来生成,使用分别来自“明显活性”和“明显非活性”类别的曲线。可以使用十个浓度,并且每个浓度可以使用对数噪声生成两个复制。为了在复制之间具有真实的噪声分布,可以使用(多个)实验HTS DR活动的结果基于复制之间的差异来确定统计数据。基于噪声分布与对数定律的拟合,可以提取相关联的参数,并且可以使用所得的参数化函数来对复制之间的噪声进行建模。可以在浓度上添加正常噪声,并且在整个浓度范围上在A(c)上添加均匀噪声。
可以使用上述预处理步骤从现有的或通过算法生成的DR图中获得用于训练形状分类器的训练图像。因而,每个训练图像可以包括150×150像素灰度像素图像,所述图像描绘了DR图相对于笛卡尔轴的数据点集。每个训练图像可以与训练图像的“地面真值”标签一起存储,所述标签指示专家(或一个以上专家)对由图像表示的DR图的分类决策。
形状分类器架构和训练
形状分类器的一个示例架构如图3所示。概括地,其包括:
-一个块,其包含六个使用3,3滤波器(32,32,64,64,128,128)的2D卷积层,具有Relu激活和l2正则化;
-四个尺寸为(2,2)的2D最大池化层;
-五个批归一化层;
-一个扁平层;
-一个由256个神经元组成的密集层,具有Relu激活和l2正则化;
-一个批归一化层;
-一个丢弃层,系数为0.5;
-一个最终密集层,在Softmax激活上具有13个输出类别。
本领域技术人员将理解,对图3所示架构的许多变化和修改是可能的。
注意,图3中的“?”是指神经网络一次处理的训练例子的数量,并指示可以使用任何合适的数量。
可以使用每个类别包括几千(例如5000)个DR图图像的训练集来训练形状分类器。训练图像可以从通过算法生成的DR图生成,所述DR图如上所述用“地面真值”分类标签手动标记。可以为以上讨论的13个形状类别中的每一个生成训练图像。
在训练过程中,在神经网络模型的输入层处接收训练图像(见图3)。每个训练图像是根据神经网络模型的参数通过神经网络模型中的后续层进行处理的,以生成属于图1的集合A、B和C中所示的13个形状类别中的每一个的概率。神经网络的参数(即神经元权重和偏差)可以通过优化目标函数来更新。目标函数包括损失,所述损失取决于针对每个训练图像生成的输出与同训练图像相关联的相应标签数据之间的比较。所述标签数据可以包括表示“地面真值”标签的向量,所述标签是在专家(或专家组)对训练图像进行视觉检查之后应用的。
所述损失可以测量针对每个训练图像的输出与“地面真值”标签数据之间的均方误差。目标函数可以另外地包括正则化项,例如目标函数可以是损失和正则化项的线性组合。其他加权损失可以作为目标函数的一部分包括在内。可以使用基于梯度的方法(诸如Adam优化器、随机梯度下降、小批量梯度下降或批量梯度下降)来优化目标函数。
在一个例子中,Adam优化器以1.0E-4的学习速率和3.0E-7的学习速率衰减来使用。训练是通过验证损失来衡量的,并且最多运行300个时期,在总验证损失上提前停止(patience=5,delta=0.001)。输入数据在训练集与验证集之间进行80/20划分。
训练过程产生经过训练的形状分类器模型。一旦经过训练,所述模型就可以用于对“新的”DR图图像进行分类。对于被测的DR图图像,所述经过训练的模型可以生成分类输出,所述分类输出包括针对12个形状类别中每一个的概率,这12个形状类别与图1的集合A、B和C中的13个形状类别相同,只是“钟形”和“毒性”(在训练中保持分离)融合在一起以用于推理(即视为一个组合类别)。可替代地或另外地,分类输出可以包括具有最高概率的类别的指示,或者两个(或更多个)最可能的类别的指示。
将卷积神经网络用于形状分类器有利于使分类器专注于总体曲线形状而不是细节。然而,在替代实现方式中,可以使用其他神经网络架构,诸如全连接神经网络。
离散分类器架构和训练
离散分类器的一个示例架构如图4所示。所述分类器包括多层感知器(MLP)分类器。其包括2个隐藏层,每个层有5个神经元和Relu激活。
本领域技术人员将理解,对该架构的许多变化和修改是可能的。
注意,图4中的“?”是指神经网络一次处理的训练例子的数量,并指示可以使用任何合适的数量。
可以使用每个类别包括几千(例如5000)个DR图的训练集来训练所述分类器。对于训练集的每个DR图,可以提取每个浓度下两个复制之间的正差,并且可以从该分布计算q1、q2、q3四分位数以及四分位距。这可以通过计算每个浓度下所有复制之间的正差并且通过在计算q1、q2和q3四分位数以及四分位距时使用所有这些差的分布,扩展到任意数量的剂量。
这四个描述符可以使用MinMax缩放在0与1之间进行归一化,并且这4个归一化值可以用作MLP分类器的输入。
这种方法的优点是,对于要考虑的数据点的数量没有限制,这意味着即使一些数据点缺失,或者如果离散分类器的输入之间(或者用于预测的输入与训练数据之间)的浓度数量不同,分类器也是有效的。这种益处与使用图像作为形状分类器的输入是协同的并且有助于灵活的分类流水线,从而减少输入数据中任何不同质性的影响。
根据分类器的参数通过分类器的层来处理输入,以生成分类输出。分类器的参数(即神经元权重和偏差)可以通过优化目标函数来更新。目标函数包括损失,所述损失取决于针对每个训练DR图生成的输出与同训练DR图相关联的相应标签数据之间的比较。所述标签数据可以包括表示“地面真值”标签的二进制值,所述标签是在专家对训练图像进行视觉检查(即,DR图是否被专家分类为“离散”类别)之后应用的。
所述损失可以测量针对每个训练图像的输出与“地面真值”标签数据之间的均方误差。目标函数可以另外地包括正则化项,例如目标函数可以是损失和正则化项的线性组合。其他加权损失可以作为目标函数的一部分包括在内。可以使用基于梯度的方法(例如随机梯度下降)来优化目标函数。可以在训练集与验证集之间使用80/20划分来执行训练。
已经发现将MLP架构用于离散分类器是有利的,然而也可以使用其他机器学习模型,例如随机森林法模型。
图5示出了用于执行本文所述方法的系统/设备的示意性例子。所示出的系统/设备是计算装置的例子。本领域技术人员将理解,可以可替代地使用其他类型的计算装置/系统(诸如分布式计算系统)来实施本文所述的方法。
设备(或系统)500包括一个或多个处理器502。所述一个或多个处理器控制系统/设备500的其他部件的操作。所述一个或多个处理器502可以例如包括通用处理器。所述一个或多个处理器502可以是单核装置或多核装置。所述一个或多个处理器502可以包括中央处理单元(CPU)或图形处理单元(GPU)。可替代地,所述一个或多个处理器502可以包括专用处理硬件,例如RISC处理器或具有嵌入式固件的可编程硬件。可以包括多个处理器。
系统/设备包括工作或易失性存储器504。所述一个或多个处理器可以访问易失性存储器504以处理数据并且可以控制数据在存储器中的存储。易失性存储器504可以包括任何类型的RAM,例如静态RAM(SRAM)、动态RAM(DRAM),或者所述易失性存储器可以包括闪速存储器,诸如SD卡。
系统/设备包括非易失性存储器506。非易失性存储器506以计算机可读指令的形式存储用于控制处理器502的操作的操作指令508的集合。非易失性存储器506可以是任何类型的存储器,诸如只读存储器(ROM)、闪速存储器或磁驱动存储器。
所述一个或多个处理器502被配置成执行操作指令508致使系统/设备执行本文所述的任何方法。操作指令508可以包括与系统/设备500的硬件部件有关的代码(即,驱动器)以及与系统/设备500的基本操作有关的代码。一般而言,所述一个或多个处理器502执行操作指令508中的一个或多个指令,所述一个或多个指令被永久地或半永久地存储在非易失性存储器506中,从而使用易失性存储器504来临时存储在所述操作指令508的执行期间生成的数据。
本文所述的方法的实施方式可以实现为在数字电子电路系统、集成电路系统、专门设计的ASIC(专用集成电路)、计算机硬件、固件、软件和/或其组合中。这些可以包括计算机程序产品(诸如,存储在例如磁盘、光盘、存储器、可编程逻辑装置上的软件),所述计算机程序产品包括计算机可读指令,所述计算机可读指令当由计算机(诸如关于图5所描述的)执行时致使所述计算机执行本文所述的方法中的一种或多种。
术语“药物”或“药剂”在本文中同义使用,并且描述了如下药物配制品,其含有一种或多种活性药物成分或其药学上可接受的盐或溶剂化物以及任选地药学上可接受的载剂。从最广义上来说,活性药物成分(“API”)是对人或动物具有生物学效应的化学结构。在药理学中,药物或药剂用于治疗、治愈、预防或诊断疾病,或用于以其他方式增强身体或精神健康。药物或药剂可以在有限的持续时间内使用,或者定期用于慢性障碍。
如下面所描述的,药物或药剂可以包括用于治疗一种或多种疾病的在各种类型的配制品中的至少一种API或其组合。API的例子可以包括小分子(具有500Da或更小的分子量);多肽、肽和蛋白质(例如,激素、生长因子、抗体、抗体片段和酶);碳水化合物和多糖;以及核酸、双链或单链DNA(包括裸露和cDNA)、RNA、反义核酸(如反义DNA和RNA)、小干扰RNA(siRNA)、核酶、基因和寡核苷酸。核酸可以掺入分子递送系统(诸如载体、质粒或脂质体)中。还设想了一种或多种药物的混合物。
可以将药物或药剂包含在适于与药物递送装置一起使用的初级包装或“药物容器”中。药物容器可以是例如药筒、注射筒、储器或其他坚固或柔性的器皿,其被配置成提供用于储存(例如,短期或长期储存)一种或多种药物的合适腔室。例如,在一些情况下,可以将腔室设计成将药物储存至少一天(例如,1天到至少30天)。在一些情况下,可以将腔室设计成将药物储存约1个月至约2年。储存可以发生在室温(例如,约20℃)或冷藏温度(例如,从约-4℃至约4℃)下。在一些情况下,药物容器可以是或可以包括双腔室药筒,其被配置成分开储存要施用的药学配制品的两种或更多种组分(例如,API和稀释剂、或两种不同的药物),每个腔室中储存一种。在此类情况下,双腔室药筒的两个腔室可以被配置成允许在分配到人体或动物体内之前和/或期间在两种或更多种组分之间混合。例如,可以将两个腔室配置成使得它们与彼此流体连通(例如,通过两个腔室之间的导管的方式),并且允许使用者在分配之前在需要时混合两种组分。可替代地或另外地,两个腔室可以被配置成允许在将组分分配到人体或动物体内时进行混合。
可以将如本文所述的药物递送装置中包含的药物或药剂用于治疗和/或预防许多不同类型的医学障碍。障碍的例子包括例如糖尿病或与糖尿病相关的并发症(如糖尿病视网膜病变)、血栓栓塞障碍(如深静脉或肺血栓栓塞)。障碍的另外例子是急性冠状动脉综合征(ACS)、心绞痛、心肌梗塞、癌症、黄斑变性、炎症、枯草热、动脉粥样硬化和/或类风湿性关节炎。API和药物的例子是如以下手册中所述的那些:诸如Rote Liste2014(例如但不限于,主要组(main group)12(抗糖尿病药物)或86(肿瘤药物))和Merck Index,第15版。
用于治疗和/或预防1型或2型糖尿病或与1型或2型糖尿病相关的并发症的API的例子包括胰岛素(例如人胰岛素、或人胰岛素类似物或衍生物);胰高血糖素样肽(GLP-1)、GLP-1类似物或GLP-1受体激动剂、或其类似物或衍生物;二肽基肽酶-4(DPP4)抑制剂、或其药学上可接受的盐或溶剂化物;或其任何混合物。如本文所用,术语“类似物”和“衍生物”是指具有如下分子结构的多肽,所述分子结构可以通过缺失和/或交换在天然存在的肽中存在的至少一个氨基酸残基和/或通过添加至少一个氨基酸残基而在形式上衍生自天然存在的肽的结构(例如人胰岛素的结构)。所添加和/或交换的氨基酸残基可以是可编码氨基酸残基或其他天然存在的残基或纯合成的氨基酸残基。胰岛素类似物也被称为“胰岛素受体配体”。特别地,术语“衍生物”是指具有如下分子结构的多肽,所述分子结构在形式上可以衍生自天然存在的肽的结构(例如,人胰岛素的结构),其中一个或多个有机取代基(例如,脂肪酸)与一个或多个氨基酸结合。任选地,天然存在的肽中存在的一个或多个氨基酸可能已被缺失和/或被其他氨基酸(包括不可编码的氨基酸)替代,或者氨基酸(包括不可编码的氨基酸)已被添加到天然存在的肽中。
胰岛素类似物的例子是Gly(A21)、Arg(B31)、Arg(B32)人胰岛素(甘精胰岛素);Lys(B3)、Glu(B29)人胰岛素(谷赖胰岛素);Lys(B28)、Pro(B29)人胰岛素(赖脯胰岛素);Asp(B28)人胰岛素(门冬胰岛素);人胰岛素,其中在位置B28处的脯氨酸被Asp、Lys、Leu、Val或Ala替代并且其中在位置B29处的Lys可以被Pro替代;Ala(B26)人胰岛素;Des(B28-B30)人胰岛素;Des(B27)人胰岛素和Des(B30)人胰岛素。
胰岛素衍生物的例子是例如B29-N-肉豆蔻酰-des(B30)人胰岛素,Lys(B29)(N-十四酰)-des(B30)人胰岛素(地特胰岛素,);B29-N-棕榈酰-des(B30)人胰岛素;B29-N-肉豆蔻酰人胰岛素;B29-N-棕榈酰人胰岛素;B28-N-肉豆蔻酰LysB28ProB29人胰岛素;B28-N-棕榈酰-LysB28ProB29人胰岛素;B30-N-肉豆蔻酰-ThrB29LysB30人胰岛素;B30-N-棕榈酰-ThrB29LysB30人胰岛素;B29-N-(N-棕榈酰-γ-谷氨酰)-des(B30)人胰岛素,B29-N-ω-羧基十五酰-γ-L-谷氨酰-des(B30)人胰岛素(德谷胰岛素(insulindegludec),/>);B29-N-(N-石胆酰-γ-谷氨酰)-des(B30)人胰岛素;B29-N-(ω-羧基十七酰)-des(B30)人胰岛素和B29-N-(ω-羧基十七酰)人胰岛素。
GLP-1、GLP-1类似物和GLP-1受体激动剂的例子是例如利西拉肽艾塞那肽(毒蜥外泌肽-4,/>由毒蜥(Gila monster)的唾液腺产生的39个氨基酸的肽)、利拉鲁肽/>索马鲁肽(Semaglutide)、他司鲁肽(Taspoglutide)、阿必鲁肽/>杜拉鲁肽(Dulaglutide)/>rExendin-4、CJC-1134-PC、PB-1023、TTP-054、兰格拉肽(Langlenatide)/HM-11260C(艾匹那肽(Efpeglenatide))、HM-15211、CM-3、GLP-1Eligen、ORMD-0901、NN-9423、NN-9709、NN-9924、NN-9926、NN-9927、Nodexen、Viador-GLP-1、CVX-096、ZYOG-1、ZYD-1、GSK-2374697、DA-3091、MAR-701、MAR709、ZP-2929、ZP-3022、ZP-DI-70、TT-401(Pegapamodtide)、BHM-034、MOD-6030、CAM-2036、DA-15864、ARI-2651、ARI-2255、替泽帕肽(LY3298176)、巴马度肽(SAR425899)、艾塞那肽-XTEN和胰高血糖素-Xten。
寡核苷酸的例子是,例如:米泊美生钠(mipomersen sodium)它是一种用于治疗家族性高胆固醇血症的降低胆固醇的反义治疗剂,或用于治疗奥尔波特综合征(Alport syndrom)的RG012。
DPP4抑制剂的例子是利拉利汀(Linagliptin)、维达列汀、西他列汀、地那列汀(Denagliptin)、沙格列汀、小檗碱。
激素的例子包括垂体激素或下丘脑激素或调节活性肽及其拮抗剂,诸如,促性腺激素(促滤泡素、促黄体素、绒毛膜促性腺激素、促生育素)、促生长激素(生长激素)、去氨加压素、特利加压素、戈那瑞林、曲普瑞林、亮丙瑞林、布舍瑞林、那法瑞林和戈舍瑞林。
多糖的例子包括葡糖胺聚糖(glucosaminoglycane)、透明质酸、肝素、低分子量肝素或超低分子量肝素或其衍生物、或硫酸化多糖(例如上述多糖的多硫酸化形式)、和/或其药学上可接受的盐。多硫酸化低分子量肝素的药学上可接受的盐的例子是依诺肝素钠。透明质酸衍生物的例子是Hylan G-F 20它是一种透明质酸钠。
如本文所使用的,术语“抗体”指的是免疫球蛋白分子或其抗原结合部分。免疫球蛋白分子的抗原结合部分的例子包括F(ab)和F(ab')2片段,其保留结合抗原的能力。抗体可以是多克隆抗体、单克隆抗体、重组抗体、嵌合抗体、去免疫或人源化抗体、完全人抗体、非人(例如鼠类)抗体或单链抗体。在一些实施方案中,抗体具有效应子功能,并且可以固定补体。在一些实施方案中,抗体具有降低的或没有结合Fc受体的能力。例如,抗体可以是同种型或亚型、抗体片段或突变体,其不支持与Fc受体的结合,例如,它具有诱变的或缺失的Fc受体结合区。术语抗体还包括基于四价双特异性串联免疫球蛋白(TBTI)的抗原结合分子和/或具有交叉结合区取向(CODV)的双可变区抗体样结合蛋白。
术语“片段”或“抗体片段”是指衍生自抗体多肽分子的多肽(例如,抗体重链和/或轻链多肽),其不包含全长抗体多肽,但仍包含能够结合抗原的全长抗体多肽的至少一部分。抗体片段可以包含全长抗体多肽的切割部分,尽管所述术语不限于此类切割片段。可用于本发明的抗体片段包括例如Fab片段、F(ab')2片段,scFv(单链Fv)片段、线性抗体、单特异性或多特异性抗体片段(如双特异性、三特异性、四特异性和多特异性抗体(例如,双链抗体、三链抗体、四链抗体))、单价或多价抗体片段(如二价、三价、四价和多价抗体)、微型抗体、螯合重组抗体、三抗体或双抗体、胞内抗体、纳米抗体,小模块化免疫药物(SMIP)、结合域免疫球蛋白融合蛋白、驼源化抗体和含有VHH的抗体。抗原结合抗体片段的另外的例子是本领域已知的。
术语“互补决定区”或“CDR”是指重链多肽和轻链多肽两者的可变区内的短多肽序列,其主要负责介导特异性抗原识别。术语“框架区”是指重链多肽和轻链多肽两者的可变区内不是CDR序列的氨基酸序列,并且主要负责维持CDR序列的正确定位以容许抗原结合。尽管框架区本身典型地不直接参与抗原结合,如本领域已知的,但是某些抗体的框架区内的某些残基可以直接参与抗原结合,或可以影响CDR中一个或多个氨基酸与抗原相互作用的能力。
抗体的例子是抗PCSK-9mAb(例如,阿利苏单抗)、抗IL-6mAb(例如,萨瑞鲁单抗)和抗IL-4mAb(例如,度匹鲁单抗)。
本文所述的任何API的药学上可接受的盐也设想用于在药物递送装置中的药物或药剂中使用。药学上可接受的盐是例如酸加成盐和碱式盐。
本领域技术人员将理解,在不脱离本发明的全部范围和精神的情况下,可以对本文所述的API、配制品、仪器、方法、系统和实施方案的各种组分进行修改(添加和/或去除),本发明涵盖此类变型及其任何和所有等同物。
示例药物递送装置可以涉及如在ISO 11608-1:2014(E)的章节5.2的表1中描述的基于针的注射系统。如在ISO 11608-1:2014(E)中所描述的,基于针的注射系统可以广泛地区分成多剂量容器系统和单剂量(具有部分或完全排放的)容器系统。容器可以是可更换容器或集成的不可更换容器。
如在ISO 11608-1:2014(E)中进一步描述的,多剂量容器系统可以涉及具有可更换容器的基于针的注射装置。在此类系统中,每个容器容纳多个剂量,所述剂量的大小可以是固定的或可变的(由用户预设)。另一种多剂量容器系统可以涉及具有集成的不可更换容器的基于针的注射装置。在此类系统中,每个容器容纳多个剂量,所述剂量的大小可以是固定的或可变的(由用户预设)。
如在ISO 11608-1:2014(E)中进一步描述的,单剂量容器系统可以涉及具有可更换容器的基于针的注射装置。在此类系统的一个例子中,每个容器容纳单个剂量,由此排出整个可递送体积(完全排放)。在另一例子中,每个容器容纳单个剂量,由此排出可递送体积的一部分(部分排放)。如还在ISO 11608-1:2014(E)中描述的,单剂量容器系统可以涉及具有集成的不可替换容器的基于针的注射装置。在此类系统的一个例子中,每个容器容纳单个剂量,由此排出整个可递送体积(完全排放)。在另一例子中,每个容器容纳单个剂量,由此排出可递送体积的一部分(部分排放)。
对本领域技术人员来说,本文所描述的实施方案的许多修改和变化将是明显的,这些修改和变化落入以下权利要求的定义内。

Claims (16)

1.一种对图像进行分类的计算机实现的方法,所述图像包括从剂量-反应实验获得的剂量-反应图,所述方法包括:
在曲线形状分类器模型处接收包括图像数据的输入,所述图像数据包括多个像素,其中,所述图像数据表示指示化合物的浓度与其活性之间的关系的剂量-反应图的图像,其中,所述曲线形状分类器模型包括神经网络模型,所述神经网络模型被配置用于将剂量-反应图的图像分类为与曲线形状相关的多个剂量-反应图类别,以及
使用所述神经网络模型生成由所接收的图像数据表示的图像的分类输出,所述生成包括使用所述神经网络模型的一个或多个层、根据与所述一个或多个层相关联的参数来处理所述图像数据。
2.根据权利要求1所述的计算机实现的方法,其中,所述曲线形状分类器神经网络模型包括卷积神经网络模型。
3.根据权利要求1或权利要求2所述的计算机实现的方法,其包括基于相同浓度下活性测量之间的差异将剂量-反应图分类为第一或第二离散类别,其中,仅当所述剂量-反应图被分类在所述第一离散类别中时,使用所述曲线形状分类器模型来处理表示所述剂量-反应图的图像的图像数据。
4.根据权利要求3所述的计算机实现的方法,其中,基于作为浓度函数的活性测量差异上的四分位数值,将所述剂量-反应图分类为第一或第二离散类别。
5.根据权利要求3或权利要求4所述的计算机实现的方法,其包括使用包括多层感知器神经网络模型的离散分类器将所述剂量-反应图分类为第一或第二离散类别。
6.根据前述权利要求中任一项所述的计算机实现的方法,其中,所述多个剂量-反应类别包括以下中的一个或多个:
针对在整个浓度范围上为高活性的类别;
针对其中上渐近线部分可见但下渐近线部分不可见的S形曲线的类别;
针对包括下渐近线部分和上渐近线部分的良态S形曲线的类别;
针对其中下渐近线部分可见但上渐近线部分不可见、并且其达到50%活性阈值的S形曲线的类别,其中,所述剂量-反应图在拐点之后的部分可见;
针对在所述剂量-反应图的浓度范围内的弱活性化合物的类别;
针对所述剂量-反应图的浓度范围内的非活性化合物的类别;
针对在EC50处具有高斜率的S形曲线的高斜率类别;
针对在EC50处具有低斜率的S形曲线的低斜率类别;
针对其中在上渐近线处的A(c)与下渐近线处的A(c)之间的差小于70%的S形曲线的类别;
其中活性关于浓度有交替的增加和降低的类别;
其中除了最高浓度或两个最高浓度之外没有显示任何活性的类别。
7.根据前述权利要求中任一项所述的计算机实现的方法,其进一步包括执行预处理,所述预处理包括接收表示所述剂量-反应图的数据点集的原始数据并基于所述原始数据生成所述剂量-反应图的图像。
8.根据权利要求7所述的计算机实现的方法,其包括:
接收表示多个剂量-反应图中的每一个的数据点集的原始数据;
为每个剂量-反应图生成对应的图像,其中,所述图像包括多个像素并且描绘了相对于笛卡尔轴的对应数据点集中的至少一些,其中,每个图像以相同的像素高度和像素宽度生成,其中,所述笛卡尔轴在每个图像中定位在相同的位置,以及
在所述曲线形状分类器模型处接收每个对应图像的图像数据。
9.根据权利要求8所述的计算机实现的方法,其中,每个图像都有相同尺度的竖直轴线。
10.一种产生曲线形状分类器模型的计算机实现的方法,所述曲线形状分类器模型用于对从剂量-反应实验获得的剂量-反应图进行分类,所述方法包括:
在神经网络模型处接收多个训练图像,其中,每个训练图像是指示化合物的浓度与其活性之间的关系的剂量-反应图的图像,
为每个训练图像生成输出,其中,为训练图像生成所述输出包括通过所述神经网络模型的一个或多个层、根据与所述一个或多个层相关联的参数来处理所述训练图像,以及
基于目标函数来更新所述参数,所述目标函数包括为每个训练图像生成的输出与同所述训练图像相关联的相应标签数据之间的比较,所述标签数据指示所述训练图像属于与曲线形状相关的一个或多个剂量-反应图类别。
11.根据权利要求10所述的计算机实现的方法,其中,每个训练图像描绘了相对于笛卡尔轴的对应数据点集,其中,每个训练图像具有相同的像素高度和像素宽度,其中,所述笛卡尔轴在每个图像中定位在相同的位置。
12.根据权利要求10或权利要求11所述的计算机实现的方法,其中,所述剂量-反应类别包括:
钟形曲线类别,以及
毒性类别。
13.一种数据处理设备,其包括被配置成执行根据前述权利要求中任一项所述的方法的一个或多个处理器。
14.一种包括指令的计算机可读存储介质,所述指令在由一个或多个处理器执行时使所述一个或多个处理器执行根据权利要求1至12中任一项所述的方法。
15.一种包含或基于化合物的药物,其中,所述化合物已在剂量-反应实验中进行了测试并且所述实验的结果是使用根据权利要求1至9中任一项所述的计算机实现的方法来进行分类的。
16.一种小分子或生物分子,如分子生物标记,其中,所述小分子或生物分子已经在剂量-反应实验中进行了测试并且所述实验的结果是使用根据权利要求1至9中任一项所述的计算机实现的方法来进行分类的。
CN202180076504.XA 2020-11-30 2021-11-29 剂量-反应图的图像分类 Pending CN116547722A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20315469.5 2020-11-30
EP20315469 2020-11-30
PCT/EP2021/083404 WO2022112568A1 (en) 2020-11-30 2021-11-29 Classifying images of dose-response graphs

Publications (1)

Publication Number Publication Date
CN116547722A true CN116547722A (zh) 2023-08-04

Family

ID=73857179

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180076504.XA Pending CN116547722A (zh) 2020-11-30 2021-11-29 剂量-反应图的图像分类

Country Status (5)

Country Link
US (1) US20240006055A1 (zh)
EP (1) EP4252248A1 (zh)
JP (1) JP2023552326A (zh)
CN (1) CN116547722A (zh)
WO (1) WO2022112568A1 (zh)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6339581B2 (ja) * 2012-11-02 2018-06-06 ステミナ バイオマーカー ディスカバリー, インコーポレイテッド ヒト幹様細胞およびメタボロミック比率を使用した医薬品のヒト発達毒性の予測

Also Published As

Publication number Publication date
EP4252248A1 (en) 2023-10-04
US20240006055A1 (en) 2024-01-04
JP2023552326A (ja) 2023-12-15
WO2022112568A1 (en) 2022-06-02

Similar Documents

Publication Publication Date Title
Sha et al. Multi-field-of-view deep learning model predicts nonsmall cell lung cancer programmed death-ligand 1 status from whole-slide hematoxylin and eosin images
Attardo et al. Impermanence of dendritic spines in live adult CA1 hippocampus
US20220093252A1 (en) Machine learning systems and methods to diagnose rare diseases
Weddell et al. Quantitative characterization of cellular membrane-receptor heterogeneity through statistical and computational modeling
Saggu et al. A random forest approach for counting silicone oil droplets and protein particles in antibody formulations using flow microscopy
EP3970150A1 (en) Deep proteome markers of human biological aging and methods of determining a biological aging clock
Amin et al. IGF-1R/mTOR targeted therapy for Ewing sarcoma: a meta-analysis of five IGF-1R-related trials matched to proteomic and radiologic predictive biomarkers
Smyczyńska et al. Pre-treatment growth and IGF-I deficiency as main predictors of response to growth hormone therapy in neural models
Liu et al. Blockade of platelet-derived growth factor signaling inhibits choroidal neovascularization and subretinal fibrosis in mice
US20240006055A1 (en) Classifying Images of Dose-Response Graphs
Longden et al. Deep neural networks identify signaling mechanisms of ErbB-family drug resistance from a continuous cell morphology space
Avram Revolutionizing cardiovascular risk prediction in patients with chronic kidney disease: machine learning and large-scale proteomic risk prediction model lead the way
US20230420084A1 (en) Scaffold Contrained Molecular Generation Using Memory Networks
Fuchs et al. Outcomes of multiple sclerosis patients admitted with COVID-19 in a large veteran cohort
CN115206422A (zh) 质谱谱图解析方法、装置及智能终端
McSkane et al. Association between height and clinical outcome in metastatic colorectal cancer patients enrolled onto a randomized phase 3 clinical trial: data from the FIRE-3 study
Maunz et al. Machine learning to predict response to ranibizumab in neovascular age-related macular degeneration
CN116615786A (zh) 机器学习系统及用于诊断罕见病的方法
Rayyad et al. Comparison of SVMR and PLSR for ATR-IR data treatment: Application to AQC of mAbs in clinical solutions
WO2023144122A1 (en) Neural network for identifying regions of interest in luminescent images
EP4252240A1 (en) Molecular design using local exploration
EP3773691A1 (en) Apparatus and method for identification of primary immune resistance in cancer patients
WO2024100094A1 (en) Method for performing image registration
Vagliano et al. MO360 machine learning models for predicting acute kidney injury: A systematic review
US20230259106A1 (en) Method for Monitoring a Production Process and Corresponding Technical Issues

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination