CN117457097A - 用于检测最优候选化合物的计算机装置及其方法 - Google Patents

用于检测最优候选化合物的计算机装置及其方法 Download PDF

Info

Publication number
CN117457097A
CN117457097A CN202311390212.0A CN202311390212A CN117457097A CN 117457097 A CN117457097 A CN 117457097A CN 202311390212 A CN202311390212 A CN 202311390212A CN 117457097 A CN117457097 A CN 117457097A
Authority
CN
China
Prior art keywords
class
compound
image data
cell
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311390212.0A
Other languages
English (en)
Inventor
E·I·芬特斯
G·B·阿维纳什
R·J·格雷夫斯
A·V·塔特
A·科德什
J·卡隆
S·达斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Molecular Devices LLC
Original Assignee
Molecular Devices LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Molecular Devices LLC filed Critical Molecular Devices LLC
Publication of CN117457097A publication Critical patent/CN117457097A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • G06T7/0014Biomedical image inspection using an image reference approach
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/763Non-hierarchical techniques, e.g. based on statistics of modelling distributions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/80Data visualisation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • G06F2218/16Classification; Matching by matching signal segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/24Indexing scheme for image data processing or generation, in general involving graphical user interfaces [GUIs]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30024Cell structures in vitro; Tissue sections in vitro

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Software Systems (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种用于计算机装置的方法,用于基于包括细胞系和一个或多个生物标志物的多个样本以及板图配置检测最优候选化合物,其中板图配置提供包括暴露于一个或多个生物标志物和形成至少一个浓度梯度的不同浓度的候选化合物的细胞系的样本的位置,候选化合物被包括在多个候选化合物中,方法包括:在多个连续时间点生成(310)多个候选化合物中每一个的每个浓度梯度的表型简档以形成多个化合物简档,其中生成表型简档包括以下步骤:获得(312)描绘在浓度梯度中包括的每个样本的图像数据,基于图像数据为样本的每个细胞生成(314)类标签和类,通过评估多个化合物简档上的比较判据来检测(320)最优候选化合物。此外,本发明还涉及对应的计算机装置、计算机程序和计算机程序产品。

Description

用于检测最优候选化合物的计算机装置及其方法
本申请是申请号为2017800739142、申请日为2017年10月2日、发明名称为“用于检测最优候选化合物的计算机装置及其方法”的专利申请的分案申请。
技术领域
本发明涉及一种用于检测最优候选化合物的计算机装置。此外,本发明还涉及对应的方法、计算机程序和计算机程序产品。
背景技术
在实验中测试和评估新化合物(例如,旨在用于医学用途的化合物)通常可涉及在生物学语境下研究细胞机制,以从多个候选化合物中检测和/或选择候选化合物。包括多个样本的实验(例如,根据板图配置在确定的位置上布置的孔板(well-plate))可以纯粹进行以发现或描述对生物表型的新见解。例如,在研究中的细胞的可观察特征或特点。解释从实验中获得的大的高维(密集)细胞计数数据集对于研究人员和科学家提出了一个问题,例如,通过生成统计实验见解和执行细胞群分类。具体而言,用于生物对象(诸如样本中的细胞)的自动分类的常规工具或系统的缺点在于,它们需要用户利用单变量和双变量可视化来确定类和/或细胞群区域之间的截止区域和/或决策区域。另外,确定细胞群之间的决策区域很少是线性明确的,当通过使用单次测量可视地分析实验的细胞计数数据集并且潜在地执行单个视场(FOV)的迭代分析时,群体粒度可能难以理解。进一步的人工细胞计数细胞测量调查研究是劳动密集的,并且难以选择哪些细胞计数细胞测量测量要用于分析中,并且哪些包含拆分群体的最佳能力,并且因此易受人为错误的影响。一些常规系统应用涉及视觉细胞标记和监督细胞分类的两阶段人工过程。这些系统的使用涉及用户通过点击细胞并经由人工文本录入注释它们来人工地将细胞对象作为相应细胞群体的示例来装箱。这样的缺点是这是一个相对缓慢且劳动密集的过程。由于通常通过观察描绘单个视场的图像数据来执行,其在剂量响应存在时很少表示整个细胞群,因此其缺点是减少了预测性建模可能性,并从而限制了可用的大且密集数据集中固有的潜力。常规系统中的一个趋势是尝试和规避特征提取和/或细胞计数特征,因为它们由人类理解约束,并且相反依赖于机器学习特征,例如,可以由计算机提取的测量和/或特征比细胞计数特征更省力。使用机器学习特征的缺点在于,用户很难或不可能理解或解释它们,并且因此它们不允许用户评估和排除输入和/或中间数据的可行性和/或偏差。
从而,需要提供一种减轻或解决了常规解决方案的缺点和问题的解决方案。
发明内容
本发明的实施例的目的是提供一种解决方案,其减轻或解决了常规解决方案的缺点和问题。通过独立权利要求的主题实现了上面的和另外的目的。本发明的另外的有利实现形式由从属权利要求定义。
根据本发明的第一方面,以计算机装置实现上面提及的和其他的目的,该计算机装置用于基于包括细胞系和一个或多个生物标志物的多个样本检测最优候选化合物。检测最优候选化合物进一步基于板图配置(plate map configuration)。板图配置提供包括暴露于一个或多个生物标志物和形成至少一个浓度梯度的不同浓度的一个或多个候选化合物的细胞系的样本的位置,候选化合物被包括在多个候选化合物中,计算机装置包括处理器和存储器,存储器包含可由处理器执行的指令,由此计算机装置可操作以:在多个连续时间点生成多个候选化合物中每一个的每个浓度梯度的表型简档(phenotypic profile)以形成多个化合物简档(compound profile)。该计算机装置进一步可操作以通过进一步获得描绘在浓度梯度中包括的每个样本的图像数据来进一步生成表型简档,并基于图像数据为样本的每个细胞生成类标签和类。计算机装置可进一步操作以通过评估多个化合物简档上的比较判据来检测最优候选化合物。
这方面的一个优点是,通过生成化合物简档并通过评估多个化合物简档上的比较判据来检测最优候选化合物,以有效的方式处理与板图配置相关的大、高维(密集)细胞计数数据集来改进统计实验见解,例如,为了检测最优候选化合物。另外的优点是,能通过最小到没有人类交互的情况下生成类标签和类和/或细胞群区域来减少所需的时间和劳动。
在根据第一方面的计算机装置的可能的第一实现形式中,计算机装置进一步包括输入装置和显示器,其中计算机装置进一步操作以:选择描绘针对每个类标签和/或类的样本的至少一个细胞的图像数据的示例性子集;在显示器上向用户显示图像数据的示例性子集和相应的类标签和/或类;从输入装置接收由用户指示的指示对至少一个类标签和/或类的操作的用户输入数据;以及基于用户输入数据对样本的细胞的类标签和/或类执行操作。在第一实现形式的一个实施例中,计算机装置可进一步操作以执行从添加类、删除类、拆分类或合并类中选择的一个的操作。
该实现形式的优点是,向用户提供可视化熟悉度和概念性理解,并允许迭代的用户校正,从而改进分类质量和/或可靠性。
在根据第一方面本身或第一方面的第一实现形式的计算机装置的可能的第二实现形式中,计算机装置可操作以进一步通过如下步骤检测最优候选化合物:获得一个或多个参考化合物简档;基于一个或多个参考化合物简档来计算针对多个化合物简档中每个化合物简档的多维差分值;通过评估多个化合物简档上的比较判据来检测最优候选化合物,其中基于多维差分值来评估比较判据。在该实现形式的一个实施例中,多维差分值优选地为N维,其中N大于或等于2。更优选地,多维差分值为N维,其中N大于3。
该实现形式的优点在于,通过评估包括化合物简档的高维(密集)数据集来改进可靠性和/或质量,改进候选化合物的检测质量。
在根据第一方面本身或第一方面的第一或第二实现形式的计算机装置的可能的第三实现形式中,计算机装置可操作以从多个视场获得描绘浓度梯度中包括的每个样本的图像数据,和/或图像数据描绘了以多个图像滤波器处理的浓度梯度中包括的每个样本。
该实现形式的优点在于,当使用多个视场和/或使用多个图像滤波器描绘细胞时,通过在生成针对样本的细胞的类标签和类时改进可靠性和/或质量来改进表型简档且从而化合物简档的质量。
在根据第一方面本身或第一方面的任何前述实现形式的计算机装置的可能的第四实现形式中,计算机装置可操作以:通过进一步基于图像数据生成针对每个细胞的细胞计数参数集以形成细胞计数参数集的第一集合,并基于参数相似性函数和第一集合生成表型分类模型来生成表型简档,该模型被配置为将细胞计数参数集映射到类和/或表型类,其中参数相似性函数被配置为将第一集合的细胞计数参数集彼此相关。在第四实现形式的一个实施例中,计算机装置可操作以:通过进一步基于参数相似性函数和第一集合生成表型分类模型来生成表型简档,该模型配置为将细胞计数参数集映射到类,其中参数相似性函数被配置为将第一集合的细胞计数参数集彼此相关。
这种实现形式的一个优点是,人为错误的脆弱性降低,因为例如使用高维或密集的细胞计数参数集进行分类,与依赖于由用户选择的单个细胞计数参数和/或细胞计数细胞测量的常规方法相反。该实现形式的另一个优点是,所生成的表型分类模型的类能在连续实验上重复使用,从而进一步改进了预测性建模可能性,并进一步减少了所需的时间和劳动。
在根据第一方面本身或第一方面的任何前述实现形式的计算机装置的可能的第五实现形式中,计算机装置可操作以:在显示器上显示表型简档和/或化合物简档。
该实现形式的优点在于,改进了用户理解,并且从而通过向用户可视化中间和最终结果来减少了对于检测所需的时间。
在根据第一方面本身或第一方面的任何前述实现形式的计算机装置的可能的第六实现形式中,候选化合物的浓度梯度包括多个单独的孔,其中每个孔包括暴露一个或多个生物标志物和不同浓度的候选化合物的细胞系的样本,并根据一个或多个孔板上的板图配置布置。
根据本发明的第二方面,以用于计算机装置的基于多个样本检测最优候选化合物的方法实现上面提及的和其他的目的。样本可包括细胞系和一个或多个生物标志物。检测最优候选化合物进一步基于板图配置。板图配置提供样本的位置,样本包括暴露于一个或多个生物标志物和形成至少一个浓度梯度的不同浓度的一个或多个候选化合物的细胞系。一个或多个候选化合物被包括在多个候选化合物中。方法包括:在多个连续时间点生成多个候选化合物中每一个的每个浓度梯度的表型简档以形成多个化合物简档,其中生成表型简档包括以下步骤:获得描绘在浓度梯度中包括的每个样本的图像数据;基于图像数据为样本的每个细胞生成类标签和类;通过评估多个化合物简档上的比较判据来检测最优候选化合物。
这方面的一个优点是,通过生成化合物简档并通过评估多个化合物简档上的比较判据来检测最优候选化合物,以有效的方式处理与板图配置相关的大、高维(密集)细胞计数数据集来改进统计实验见解,例如,为了检测最优候选化合物。另外的优点是,能通过在没有人类交互的情况下生成类标签和类和/或细胞群区域来减少所需的时间和劳动。
在根据第二方面的方法的可能的第一实现形式中,进一步包括如下步骤:选择描绘针对每个类标签和/或类的样本的至少一个细胞的图像数据的示例性子集;向用户显示图像数据的示例性子集和相应的类标签和/或类;接收来自用户的指示对至少一个类的操作的用户输入数据;基于用户输入数据对样本的至少一个细胞的类标签和/或类执行操作。在第一实现形式的一个实施例中,对至少一个类的操作是从添加类、删除类、拆分类或合并类中选择的。
该实现形式的优点是,向用户提供可视化熟悉度和概念性理解,并允许迭代的用户校正,从而改进分类质量和/或可靠性。
在根据第二方面本身或第二方面的第一实现形式的方法的可能的第二实现形式中,检测最优候选化合物的方法步骤进一步包括:获得一个或多个参考化合物简档;基于一个或多个参考化合物简档来计算针对多个化合物简档中每个化合物简档的多维差分值;通过评估多个化合物简档上的比较判据来检测最优候选化合物,其中基于多维差分值来评估比较判据。
在根据第二方面本身或第二方面的第一或第二实现形式的方法的可能的第三实现形式中,图像数据描绘了来自多个视场的浓度梯度中包括的每个样本,和/或图像数据描绘了以多个图像滤波器处理的浓度梯度中包括的每个样本。
该实现形式的优点在于,当使用多个视场和/或使用多个图像滤波器描绘细胞时,通过在生成用于样本的细胞的类标签和类时改进可靠性和/或质量来改进表型简档且从而化合物简档的质量。
在根据第二方面本身或第二方面的任何前述实现形式的方法的可能的第四实现形式中,生成表型简档进一步包括:基于图像数据生成针对每个细胞的细胞计数参数集以形成细胞计数参数集的第一集合,并基于参数相似性函数和第一集合生成表型分类模型,该模型被配置为将细胞计数参数集映射到类和/或表型类,其中参数相似性函数被配置为将第一集合的细胞计数参数集彼此相关。在第四实现形式的一个实施例中,生成表型简档进一步包括:基于参数相似性函数和第一集合生成表型分类模型,该模型配置为将细胞计数参数集映射到类,其中参数相似性函数被配置为将第一集合的细胞计数参数集彼此相关。
一个优点是,作为分类的人为错误的脆弱性降低,因为细胞计数参数集被用于进行分类,与依赖于由用户选择的单个细胞计数参数和/或细胞计数细胞测量的常规方法相反。该实现形式的另一个优点是,所生成的表型分类模型的类能在连续实验上重复使用,从而进一步改进了预测性建模可能性,并进一步减少了所需的时间和劳动。
根据本发明的第三方面,以包括计算机可执行指令的计算机程序实现上面提及的和其它的目的,当计算机可执行指令在计算机装置中包括的处理单元上执行时,计算机可执行指令用于使计算机装置执行如下方法步骤:在多个连续时间点生成多个候选化合物中每一个的每个浓度梯度的表型简档以形成多个化合物简档,其中生成表型简档包括以下步骤:获得描绘在浓度梯度中包括的每个样本的图像数据;基于图像数据为样本的每个细胞生成类标签和类;通过评估多个化合物简档上的比较判据来检测最优候选化合物。
在根据第三方面的计算机程序的可能的第一实现形式中,进一步使计算机装置执行如下方法步骤:选择描绘针对每个类标签和/或类的样本的至少一个细胞的图像数据的示例性子集;向用户显示图像数据的示例性子集和相应的类标签和/或类;接收来自用户的指示对至少一个类标签和/或类的操作的用户输入数据;以及基于用户输入数据对样本的细胞的类标签和/或类执行操作。
在根据第三方面本身或第三方面的第一实现形式的计算机程序的可能的第二实现形式中,进一步使计算机装置执行如下方法步骤:通过进一步执行获得一个或多个参考化合物简档的方法步骤来检测最优候选化合物;基于一个或多个参考化合物简档来计算针对多个化合物简档中每个化合物简档的多维差分值;通过评估多个化合物简档上的比较判据来检测最优候选化合物,其中基于多维差分值来评估比较判据。
根据本发明的第四方面,以包括计算机可读存储介质的计算机程序产品实现上面提及的和其他的目的,该计算机可读存储介质具有根据第三方面本身或第三方面的第一实现形式的计算机程序的任何可能实现形式的计算机程序。
第二至第四方面的优点与根据第一方面的对应方法相同。
从以下详细描述,本发明的实施例的另外应用和优点将显而易见。本发明的范围由权利要求书定义,该权利要求书通过引用结合到本部分中。通过考虑一个或多个实施例的以下详细描述,将向本领域技术人员提供对本发明实施例的更完整理解,以及其附加优点的实现。将参考将首先简要描述的所附的多张图。
附图说明
附图旨在阐明和解释本发明的不同实施例,在附图中:
图1示出了根据本发明的一个实施例的计算机装置的图解。
图2示出了包括根据本发明的一个实施例的计算机装置的候选化合物检测系统的图解。
图3示出了根据本发明的一个实施例的用于基于多个样本检测最优候选化合物的用于计算机装置的方法的流程图。
图4示出了根据本发明又一实施例的方法的流程图。
图5示出了根据本发明又一实施例的方法的流程图的细节。
图6示意性地示出了根据本发明的一个实施例的图像生成器可如何生成图像数据。
图7示出了根据本发明的一个实施例的如何显示表型简档的示例。
图8示出了根据本发明的一个实施例的显示图像数据的示例性子集和相应类的示例。
图9示出了在通过根据本发明的方法生成的与通过人工方法生成的表型简档之间的比较的示例。
图10示出了根据本发明的一个实施例的用于基于多个样本检测最优候选化合物的计算机装置的方法的流程图。
通过参考下面的具体实施方式,最好地理解本公开的实施例及其优点。应当认识到,相似的附图标记用于标识在附图的一个或多个中图示的相似元件。
具体实施方式
图1示出了根据本发明的一个实施例的计算机装置100的图解。在又一实施例中,计算机装置100采用细胞实验评估装置、服务器、固定计算装置、膝上型计算机、平板计算机、手持式计算机、腕戴式计算机、智能手表、PDA、智能手机、智能电视、电话、媒体播放器、游戏控制台、车载计算机系统或导航装置的形式。在实施例中,计算机装置100包括处理器和/或处理部件112,其包括和/或采用处理器/处理单元的形式,例如处理电路、中央处理单元、处理器模块或配置为彼此协作的多个处理器。例如在存储器中,处理器和/或处理部件可以被提供以专门设计的编程或程序代码部分,它们适于控制处理部件112执行本文描述的方法和/或方法的一个或多个实施例的步骤和功能。计算机装置100可以进一步包括至少一个存储器115或数据存储装置,其被配置为存储作为来自处理部件112的写入信号而接收的数据值或参数和/或编程或程序代码部分。至少一个存储器115或数据存储装置可以进一步被配置为检索作为读取信号的数据值和/或参数并将其发送到处理部件112。计算机装置100可以进一步包括通信接口116(例如,无线收发器和/或通信网络适配器),其被配置为向处理部件112发送作为信号的数据值或参数,或从处理部件112接收数据值或参数,或者向其他外部节点(诸如数据库或图像生成器)发送或从其他外部节点接收。在一个实施例中,通信接口116直接在节点之间或经由通信网络进行通信。在一个或多个实施例中,计算机装置100可以进一步包括输入装置117,其被配置为从用户接收输入或指示,并将指示用户输入或指示的用户输入信号发送到处理部件112。在一个或多个实施例中,计算机装置进一步包括显示器118,该显示器118被配置为从处理部件112接收指示渲染对象(诸如文本或图形用户输入对象)的显示信号,并将接收到的信号显示为对象,诸如文本或图形用户输入对象。在一个实施例中,显示器118与用户输入装置117集成在一起,并被配置为从处理部件112接收指示渲染对象(诸如文本或图形用户输入对象)的显示信号,并将接收到的信号显示为对象(诸如文本或图形用户输入对象),和/或被配置为从用户接收输入或指示,并将指示用户输入或指示的用户输入信号发送到处理部件112。在一个示例中,输入数据由用户指示并且指示对至少一个类标签和/或类的操作。在实施例中,处理部件112通信地耦联到存储器115和/或通信接口和/或输入装置和/或显示器和/或可选传感器(图中未示出)。在实施例中,通信接口116使用有线和/或无线通信技术进行通信。在实施例中,一个或多个存储器115可以包括硬RAM、盘驱动器、软盘驱动器、磁带驱动器、光盘驱动器、CD或DVD驱动器(R或RW)或其他可拆卸或固定媒体驱动器的选择。
在一个实施例中,提供了一种用于例如在实验中检测最优候选化合物的计算机装置100。在一个示例中,该实验被配置成在细胞内测量用荧光标签标记的一个或多个生物标志物,它们由计算机装置成像,并且预测它们以提供对在调查研究中的(一个或多个)生物过程的见解。检测最优候选化合物可以基于包括细胞系和一个或多个生物标志物的多个样本。在一个示例中,多个样本可包括哺乳动物起源的细胞系。在又另一个示例中,细胞系衍生自其他物种,或可包括从组织(例如人类组织)提取的细胞或适于进入微量滴定板中的任何其他内容物,为了描述的目的。
一个或多个生物标志物可以是由遗传修改的细胞系产生的荧光蛋白,诸如来自维多利亚发光水母的绿色荧光蛋白(GFP),或用于检测天然蛋白的荧光标记的抗体。在另一示例中,荧光细胞染色剂诸如“4',6-二脒基-2-苯基吲哚”(DAPI)用于细胞核或核酸,并且各种其他细胞渗透性荧光染色剂能用于标记其他细胞结构。
检测最优候选化合物可进一步基于板图配置230。板图配置230提供(例如布置在孔板上的)样本的位置,样本包括暴露于一个或多个生物标志物和形成至少一个浓度梯度660的不同浓度的一个或多个候选化合物的细胞系。在一个示例中,板图配置采用数据结构的形式(例如指示孔板身份以及行和列对),存储在存储器115和/或外部节点和/或内部或外部数据库中。在另一示例中,板图配置提供包括对于一个或多个生物标志物荧光标记的和/或暴露于一个或多个生物标志物和不同浓度的一个或多个候选治疗/化合物的细胞系的样本的位置,该候选化合物可以包括具有预测或未知效果的天然或合成起源的各种化合物,以及可以采用形成至少一个浓度梯度的形式排列的化合物。板图配置可以进一步指示候选化合物的孔板上的位置和候选化合物(例如溶剂中的溶质)的浓度。在另一示例中,板图配置指示多个孔板上的样本的位置。一个或多个候选化合物的样本可以根据板图配置230布置和/或在一个或多个孔板上具有位置。候选化合物可以被包括在多个候选化合物中,例如,为特定目的或效果测试的多个候选化合物。计算机装置100可进一步包括处理器115和存储器115。如上面进一步描述的,存储器115包含可由处理器112执行的指令。处理器112可以是处理电路、中央处理单元、处理器模块或被配置为彼此协作的多个处理器。计算机装置100可操作以在多个连续时间点生成多个候选化合物中的每个候选化合物的例如每个浓度梯度660的表型简档以形成多个化合物简档。在一个示例中,浓度梯度的表型简档可以包括针对浓度梯度中包括的每个样本的表型类和/或每个类的细胞计数,其中每个样本包括不同浓度的候选化合物。关于图9进一步描述表型简档。计算机装置100可以进一步操作以通过进一步执行如下步骤来生成表型简档:获得描绘在浓度梯度中包括的每个样本的图像数据;基于图像数据为浓度梯度中包括的每个样本和/或样本的每个细胞生成类标签和类;通过评估多个化合物简档上的比较判据来检测最优候选化合物。比较判据和/或多个判据可以是对本领域技术人员可用的损失函数和/或成本函数和/或最小化判据。在一个示例中,表型简档包括指示针对候选化合物的浓度梯度660的样本中的每个类的细胞计数(作为样本中细胞总数的绝对数量或百分比%)的数据。在又一示例中,浓度简档包括指示对于类的细胞计数和候选化合物的浓度梯度660的浓度的数据。在又一示例中,表型简档可包括多个浓度简档。在一个示例中,获得描绘在浓度梯度中包括的每个样本的图像数据包括:从存储器115检索和/或接收图像数据;从外部节点检索和/或接收图像数据;从内部和/或外部数据库检索和/或接收图像数据;或从图像生成器检索和/或接收图像数据。在一个示例中,生成类标签和类包括分割针对每个细胞的图像数据作为细胞对象和/或基于图像数据生成针对每个细胞的细胞计数参数集作为细胞对象。细胞对象可以被实现为数据结构。
在用例实施例中,本公开可以用于细胞的基线表型,其中调查研究了由于细胞的实验扰动引起的已知细胞表型中的可能改变。该实验可以纯粹进行以发现或描述对生物表型的新见解,即,在研究中的细胞的可观察特征或特点。实验扰动的类型能包含观察抑制或促进细胞中酶活性的影响,经常使用遗传修改技术、发现生物活性分子的大规模药物筛选活动和基于细胞的毒理学测试。这些研究的定义特性是存在已知的表型,并且目标是比较细胞系中处理的细胞样本与同一细胞系的未处理对照样本的表型简档。由于这些实验通常在多孔板中进行,因此需要将物理实验布局映射到观察到的结果,例如,作为板图配置。在此示例中,样本的表型剖析可能需要将单个细胞类型分类为不同的子类,诸如细胞周期状态。也存在开发用于组织的细胞模型的增加趋势,其中可能存在混合细胞类型,需要细胞类型特定的分类工具。本公开提供了一种半监督流水线,其旨在简化用户目标的工作流程,诸如具有更快且更准确的分类。本公开利用计算机装置及其方法,其非常适合于基于这样的数据特性生成类标签和/或类。在另一示例中,基于图像数据为样本的每个细胞生成类标签和类可以通过如下方式执行:使用无监督聚类和/或分类算法(诸如k均值)来导出整个N维逐个细胞的数据和/或细胞计数参数集内的固有类。在另一示例中,可以使用来自无监督聚类技术系列的任何聚类和/或分类算法,例如,Ward聚类(Ward Clustering)、层级聚类或自组织映射。
在本公开中,为样本的每个细胞生成类标签和类还可以涉及生成表型分类模型,例如,基于表达的模型。本公开还可以允许迭代用户校正,并且在默认最小到没有用户交互的情况下输送基于表达的模型。本公开具有多个优点,诸如从候选化合物到产品的更快时间、更准确的数据操纵、消除用户错误、消除对先前用户知识的需要、作为机器学习的一部分的持续增长和学习、创建表型简档库/储存库的能力、提供推断知识/资源以为客户创造负担得起的解决方案的能力并提供更高保真度工作流程。作为基于高维细胞计数数据对细胞进行分类的问题的复杂性的另一示例。图像导出的细胞计数数据自然是高维的并且体积、数量和/或存储空间大。对于图像数据的每个图像数据通道,例如,诸如颜色之类的波长带,获得的图像特征数量越来越多,这些图像特征能被提取。具有两个图像数据通道的简单实验将具有大约30测量。问题的复杂性很快就出现在“维度灾难”的领域中。适度的先导研究通常生成大约几太字节的数量级的数据集。基于在图像获取和/或捕获和/或生成期间使用的放大,存在包括在包括单个视场的图像数据中的大约300到500个细胞的对象和/或细胞对象。其中图像数据包括大约三个视场,描绘孔中的样本、最常见的微量滴定板上的96个孔和/或板图配置和/或孔板实验以及每屏幕上的数百个板图配置和/或孔板,细胞对象的总数能达到数百万。从而,减少对于检测候选化合物所需的时间和劳动要求的需要非常高。
在一个实施例中,提供计算机装置100,进一步包括输入装置117和显示器118,其中计算机装置100进一步操作以:选择描绘针对每个类标签和/或类的样本的至少一个细胞的图像数据的示例性子集;在显示器118上向用户显示图像数据的示例性子集和相应的类标签和/或类;从输入装置117接收由用户指示的指示对至少一个类标签和/或类的操作的用户输入数据;以及基于用户输入数据对样本的细胞的类标签和/或类执行操作。在第一实现形式的一个实施例中,计算机装置100进一步可操作以执行从添加类、删除类、拆分类或合并类中选择的一个的操作。在一个示例中,相同类的细胞(例如“死”)已被分类为第一和第二组和/或类。在显示器上查看图像数据的示例性子集的用户意识到他们实际上应该在同一类中,可以确定应该合并第一和第二组和/或类,并经由输入装置对此进行指示。然后,计算机装置100可以将第二组/类的类和/或类标签信息设置为与第一组/类等同,有效地将两类的细胞和/或细胞对象合并为单个类。在又一示例中,描绘至少一个细胞的图像数据的子集以2D缩略图的形式显示,并且相应的类标签和/或类被显示为包围一个或多个缩略图的矩形,进一步关于图8进行描述。
在一个实施例中,提供了计算机装置,其进一步可操作以在显示器118上显示表型简档和/或化合物简档。在一个示例中,表型简档被显示为线图,并且化合物简档被显示为箱形绘图。在另一示例中,表型简档和/或化合物简档在显示器上显示为线图绘图,其显示对于在化合物浓度和/或浓度梯度上并且在多个连续时间点上和/或随时间的每个相应类的细胞计数。表型简档和/或化合物简档可以被显示为线图、回归图或表面图。
在一个实施例中,提供了计算机装置,其当检测到最优候选化合物时进一步可操作以:获得一个或多个参考化合物简档,基于一个或多个参考化合物简档来计算多个化合物简档中每个化合物简档的多维差分值,通过评估多个化合物简档上的比较判据来检测最优候选化合物,其中基于多维差分值来评估比较判据。比较判据和/或多个判据可以是损失函数和/或成本函数和/或最小化判据。在一个示例中,比较判据是三维Z值和/或标准,其指示观察或数据与平均值不同的标准偏差的有符号数。在另一示例中,参考化合物简档指示90%“未死”、3%“死”和7%“其他”的细胞计数。化合物简档指示不同浓度上和随时间的相应细胞计数。多维差分值可以被计算为三维Z值和/或每个类的差分细胞计数的几何平均值。
在一个实施例中,提供了计算机装置,其中候选化合物的浓度梯度包括多个单独的孔620,其中每个孔620包括暴露一个或多个生物标志物和不同浓度的候选化合物的细胞系的样本,并根据孔板上的板图配置230进行布置。
图2示出了包括根据本发明的一个实施例的计算机装置100的候选化合物检测系统200的图解。系统200可以包括计算机装置100,如关于图1进一步描述的。该系统可以进一步包括数据库210,例如关系数据库、对象关系数据库、XML数据库、NoSQL数据库或NewSQL数据库。数据库210可以被配置为存储数据,诸如图像数据,并且直接或经由通信网络240发送到计算机装置100。通信网络可以是任何有线或无线通信网络。通信网络240可以选自局域网(LAN)、城域网(MAN)、全球移动网络系统(GSM)、增强型数据GSM环境(EDGE)、高速下行链路分组接入(HSDPA)、宽带码分多址(W-CDMA)、码分多址(CDMA)、时分多址(TDMA)、Wi-Fi、因特网协议语音(VoIP)、LTE高级、IEEE802.16m、无线MAN高级、演进型高速分组接入(HSPA+)、3GPP长期演进(LTE)、移动WiMAX(IEEE 802.16e)、超移动宽带(UMB)(以前的演进数据优化(EV-DO)Rev.C)、具有无缝切换的快速低时延接入正交频分复用(Flash-OFDM)、高容量空分多址/>和移动宽带无线接入(MBWA)(IEEE 802.20)系统、高性能无线电城域网(HIPERMAN)、波分多址(BDMA)、全球互通微波接入(Wi-MAX)和超声通信等,但不限于此。该系统可以进一步包括图像生成器220。图像生成器220可以被配置为生成图像数据,并且直接或经由通信网络240发送到计算机装置100。该系统可进一步包括一个或多个板图配置230和/或相应的孔板。图像生成器220可以被配置为生成描绘根据和/或在板图配置230和/或孔板上布置的一个或多个样本的图像数据。板图配置230和/或孔板可以表示和/或包括配置成接收样本的多个单独的孔或托(receptacle)。每个孔可以包括包括暴露于一个或多个生物标志物和浓度梯度的确定浓度的候选化合物的细胞系的样本,并且根据板图配置例如在孔板上进行布置。
包括在一个或多个板图配置230和/或孔板中的多个孔可以包括细胞系的样本,其暴露于一个或多个生物标志物(它们可以是相同的一个或多个生物标志物)以及不同浓度的候选化合物由此形成至少一个浓度梯度。在一个示例中,孔板和/或板图配置的第一列中布置的样本和/或孔中包括的细胞系的细胞被暴露于相同的一个或多个生物标志物和第一浓度梯度和/或不同浓度的第一候选化合物。另外,孔板和/或板图配置的第二列中布置的每个孔中包括的样本的细胞被暴露于相同的一个或多个生物标志物和第二浓度梯度和/或不同浓度的第二候选化合物。在另一示例中,不同浓度的候选化合物被分布在多列上。在另一示例中,多个候选化合物被分布在多个板图配置和/或孔板上。图像生成器220可以被配置为生成和/或捕获图像数据,其描绘每个浓度梯度,例如,描绘包含在包括不同浓度的候选化合物的每个孔中的每个样本。在一个示例中,图像生成器220选自如下组:可见光数字相机、红外数字相机或放射学系统诸如X射线、放射线照相术、超声、计算机断层扫描(CT)、包含正电子发射断层扫描(PET)的核医学、核磁共振成像(MRI)系统。在另一示例中,图像生成器220使用荧光显微术和/或传统的明场技术。图像数据可以被表示为像素、体素或向量数据。图像数据可以包括包含在每个孔中的样本的细胞的每个样本的多个视场,和/或图像数据可以包括多个版本的源图像,其描绘包含在以多个图像滤波器处理的浓度梯度中的每个样本。
在本发明的另一方面,提供了根据本公开的方法。
在一个实施例中,提供了一种方法,其包括:在多个连续时间点生成310多个候选化合物中每一个的每个浓度梯度660的表型简档以形成多个化合物简档;以及通过评估多个化合物简档上的比较判据来检测320最优候选化合物。
图3示出了根据本发明的一个实施例的用于基于多个样本检测最优候选化合物的计算机装置100的方法的流程图。样本可至少包括细胞系、一个或多个生物标志物。样本可以在板图配置230上和/或根据板图配置230和/或在孔板上布置。板图配置230可提供例如根据板图配置230布置的样本的位置,样本包括暴露于一个或多个生物标志物和形成至少一个浓度梯度660的不同浓度的一个或多个候选化合物的细胞系。候选化合物可以被包括在多个候选化合物中,例如实验的多个化合物部分中。在一个实施例中,方法包括:在多个连续时间点生成310多个候选化合物中每一个的每个浓度梯度660的表型简档以形成多个化合物简档,其中生成表型简档包括以下步骤:获得312描绘在浓度梯度中包括的每个样本的图像数据;基于图像数据为样本的每个细胞生成314类标签和类;以及通过评估多个化合物简档上的比较判据来检测320最优候选化合物。
图4示出了根据本发明的又一实施例的方法的流程图。方法进一步包括如下步骤:选择315描绘针对每个类标签和/或类的样本的至少一个细胞的图像数据的示例性子集;向用户显示316图像数据的示例性子集和相应的类标签和/或类;接收317来自用户的指示对至少一个类的操作的用户输入数据;基于用户输入数据对样本的细胞的类标签和/或类执行318操作。在第一实现形式的一个实施例中,对至少一个类的操作是从添加类、删除类、拆分类或合并类中选择的。在一个示例中,通过计算图像数据表示类有多好的置信度测量来选择图像数据的示例性子集,并选择示例性子集作为具有最高置信度测量的图像数据。
图5示出了根据本发明的又一实施例的方法的流程图的细节。在一个实施例中,检测320最优候选化合物的方法步骤进一步包括:获得322一个或多个参考化合物简档;基于一个或多个参考化合物简档来计算324多个化合物简档中每个化合物简档的多维差分值;通过评估多个化合物简档上的比较判据来检测320最优候选化合物,其中基于多维差分值来评估比较判据。
在一个实施例中,图像数据描绘了来自多个视场650的浓度梯度660中包括的每个样本,和/或图像数据描绘了用多个图像滤波器处理的浓度梯度660中包括的每个样本。
在一个实施例中,生成表型简档进一步包括基于图像数据生成针对每个细胞的细胞计数参数集,以形成细胞计数参数集的第一集合。在一个实施例中,生成表型简档进一步包括:基于参数相似性函数和第一集合生成表型分类模型,该模型配置为将细胞计数参数集映射到类,其中参数相似性函数被配置为将第一集合的细胞计数参数集与彼此相关。
在一个示例中,相似性函数是相关函数,更优选地是被配置为在两个或更多细胞计数参数集上操作的多维相关函数。在另一示例中,相似性函数选自机器学习技术,例如,自组织映射、自动编码器、Ward聚类、K均值聚类、t-SNE降维。
在一个实施例中,生成表型简档进一步包括:基于针对每个细胞的细胞计数参数集显示偏差测量和/或排除判据;接收用户输入数据;以及基于指示图像数据不是可行的或基本上偏离剩余图像数据集的用户输入数据排除描绘细胞的图像数据。在一个示例中,偏差测量和/或排除判据是距细胞计数参数集中包括的细胞计数参数的均值的标准偏差或距离测量。该实施例的优点在于它允许用户评估输入和/或中间数据的可行性和/或偏差。
在一个示例中,图像数据和/或荧光图像被转换和/或生成为与细胞计数测量和/或细胞计数参数集相关联的细胞对象。然后,用户人工搜索数据以构建由于诸如细胞系、化学化合物和不同浓度的可变改变而存在的实验和响应的基线理解。此外,存在这样的情况,其中包括视场的某些图像数据失焦或者具有在图像数据中存在的伪像(artifact),这影响图像处理特征提取和/或针对每个细胞的细胞计数参数集的生成。在为细胞生成类标签和类之前,重要的是消除实验的不可行和/或基本上偏离剩余数据集的方面。以这些考虑,发明人基于主成分分析的选择、使用方差阈值的特征选择、相关统计(例如,Pearson&Spearman)、控制参考归一化、对象特征向量简档、层级聚类和t分布随机邻域嵌入(t-SNE)开发了一组分析。
图6示意性地示出了图像数据可如何由图像生成器220生成。在一个实施例中,在板图配置230和/或孔板中包括多个孔620。一组多个孔620可以各包括细胞系的样本,其暴露于一个或多个生物标志物(它们可以是相同的一个或多个生物标志物)以及形成至少一个浓度梯度660的不同浓度的候选化合物。图像生成器220可以被配置为生成和/或捕获图像数据,其描绘一个或多个浓度梯度660中的每一个,例如,单独描绘包括形成至少一个浓度梯度660的不同浓度的候选化合物的每个孔中包括的样本的细胞的每个样本。在一个示例中,描绘孔620的图像数据可以包括捕获和/或描绘来自多个视场650的细胞的样本的多个表示和/或图像。在又一个示例中,描绘孔620的图像数据可以包括描绘细胞样本的一个或多个源表示和/或源图像以及通过由多个图像滤波器(诸如低通、高通、平均或彩色图像滤波器或技术人员可用的任何其他图像滤波器)处理而生成的多个处理过的表示和/或处理过的图像。在又一个示例中,描绘孔620的图像数据可以包括捕获和/或描绘表示不同波长的声音(诸如超声或电磁辐射,诸如无线电、微波、红外线、可见光、紫外线、X射线和伽马射线)的不同图像数据通道610中的细胞样本的多个表示和/或图像。
图7示出了根据本发明的一个实施例的如何显示表型简档的示例,例如作为饼图网格。在一个实施例中,表型简档被显示成叠加在板图配置230和/或孔板的布局上。在一个实施例中,显示板图配置230和/或孔板的每个孔的每个样本的表型简档710。在一个示例中,具有浓度A的化合物1的饼图网格被示出为饼图,其指示8个细胞被分类为“死”,12个细胞被分类为“未死”,并且6个细胞被分类为“其他”。在另一实施例中,表型简档710被布置在列720和行730中。在另一实施例中,浓度梯度沿着板图配置230和/或孔板的列720中的孔布置。
在一个示例中,表型简档被显示为可视化仪表板,作为跨越板布局的饼图网格。一个优点是用户将快速理解群体(polulation)如何跨越板图上布置的样本而变化。为了增加粒度,孔到孔(well-to-well)的比较可能证明为一个好的分析来源。因为跨越列的孔倾向于在不同浓度和/或药物剂量下变化,并且跨越行的孔倾向于在候选化合物和/或药物类型下变化。这些比较在后分类分析中绝对至关重要。发明人意识到生物学家会想要知道一类细胞是否在特定药物下存活或者它们在特定剂量下存活多少百分比。在另一示例中,用户可以查看表型简档并提供指示图像数据不可行和/或基本上偏离剩余数据集的用户输入数据,从而给用户提供以滤掉没有价值的特征的能力。在又一个示例中,如果用户正在分析某个群体,并且想要看看该群体相对于区域如何变化,则他们可能滤掉所有特征无区域(features sans area)以调查研究该特定倾向。
图8示出了根据本发明的一个实施例的显示图像数据的示例性子集和相应类的示例。在一个示例中,已经选择了描绘针对每个类的样本的至少一个细胞的图像数据的示例性子集,并且将其与相应的类标签和/或类810-840一起显示给用户。具体而言,已经选择了描绘针对第一类810的样本的三个细胞850的图像数据的示例性子集,并且将其与相应的类标签和/或类810一起显示给用户。然后,用户可以在至少一个类810-840上指示操作,并且根据本公开,计算机装置100将基于用户输入数据对细胞系的细胞的类标签和/或类执行操作。操作可以是从“添加类”、“删除类”、“拆分类”或“合并类”中选择的。在包含细胞周期扰动的又一示例中,单个良好表征的细胞系已经用不同浓度的两个不同候选化合物处理和/或暴露于不同浓度的两个不同候选化合物,它们通过干扰细胞分裂或诱导细胞死来扰动细胞周期进程。该研究需要通过细胞周期状态将细胞分类为已知的亚群(sub-population),并且还基于针对死细胞的荧光生物标志物的存在来定义细胞健康状态,例如,指示“死”、“未死”或“其他”。应用本公开的方法的结果将导致图像数据850的第一示例性子集与相应的第一类标签和/或类810“未死”一起显示。另外,图像数据860的示例性第二子集与相应的第二类标签和/或类820“死”一起显示。另外,图像数据870的示例性第三子集与相应的第三类标签和/或类830“未死”一起显示。另外,图像数据880的示例性第四子集与相应的第四类标签和/或类840“其它”一起显示。在用户意识到第一和第三类“未死”应被分类为同一类之后,用户可以选择结合/合并这两者,由此将第一和第三类标签和/或类中的所有细胞更新为指示第一类标签和/或类。
在一个用例中,以荧光蛋白和/或荧光团的形式的两个生物标志物能用于对细胞-DAPI染色以对细胞核或核酸或多个细胞核染色,并且Cy5能用于对死细胞染色。基于这些染色,当使用本发明为样本的每个细胞生成类标签和类和/或使用无监督聚类时,一种可能的聚类结果如下:
聚类/类1:DAPI:细胞核亮度,略圆的,Cy5:没有亮度指示活细胞;
聚类/类2-3:DAPI:昏暗的亮度,不规则形状的细胞核,Cy5:非常明亮指示死细胞;聚类4-5:DAPI:中等亮度,圆形椭圆形,Cy5:明亮指示死细胞;
聚类/类6:DAPI:非常明亮,均匀亮度的小细胞核,Cy5:没有亮度指示活细胞;
聚类/类7:DAPI:不均匀扩散的量度,不均匀标记,Cy5:光标记,嘈杂。
针对这些聚类中的每一个的示例性子集被呈现给用户,该用户可以选择按原样保持聚类1、6、7并且组合聚类2、3、4和5。尽管基于图像数据的示例性子集做出该决定,但是基于对整个数据集的决定来应用重组。
图9示出了在通过根据本发明的方法生成的与通过人工方法生成的表型简档之间的比较的示例。表型简档可以包括针对暴露于浓度梯度的每个浓度的每个样本分类为属于特定类的细胞的细胞计数的数据点。表型简档可包括用于多个类和/或多个浓度梯度的数据点。在顶部图910中,通过本发明的方法分类为第一类的细胞的数量在第一曲线914中示出,并且通过人工方法分类为第一类的细胞的数量在第二曲线912中示出。在底部图920中,通过本发明的方法分类为第二类的细胞的数量在第一曲线924中示出,并且通过人工方法分类为第二类的细胞的数量在第二曲线922中示出。曲线指示分类为一类的细胞的细胞计数对候选化合物的浓度。在该示例中,本发明的方法与人工方法的差异为7%,但实现的分类快了24倍。在参考图7的示例中,通过本公开的方法和计算机装置处理带有各具有浓度梯度[浓度A,浓度B,......,浓度H]的八个候选化合物[化合物1,化合物2,......,化合物8]的实验。在多个连续时间点的第一时间点T0,为每个候选化合物的每个浓度梯度生成表型简档,例如,作为:
化合物1,浓度A,8(类死),12(类未死)
化合物1,浓度B,4(类死),16(类未死)
化合物1,浓度H,2(类死),18(类未死)
图10示出了根据本发明的一个实施例的针对用于基于多个样本检测最优候选化合物的计算机装置100的方法的流程图。在一个实施例中,该方法包括对象采样1010和/或分割来自图像数据的细胞对象。在一个实施例中,该方法进一步包括为每个细胞对象生成相应的对应细胞计数参数。该方法可以进一步包括运行无监督聚类算法1030以基于图像数据生成固有分组1040和/或为每个细胞对象生成类标签和/或类和/或组。该方法可以进一步包括示例性采样和/或选择图像数据的示例性子集,其描绘针对每个类标签和/或类的样本的至少一个细胞对象和/或一个细胞。该方法可以进一步包括模型分组和/或从用户接收指示对至少一个类的操作的用户输入数据,并基于用户输入数据对样本的细胞的类标签和/或类执行操作,其中对至少一个类的操作是从添加类、删除类、拆分类或合并类中选择的。可选地,该方法可以进一步包括生成表型分类模型,例如,基于表达的模型基于表达的模型。
此外,根据本发明实施例的任何方法可以在计算机程序中实现,该计算机程序具有代码部件,该代码部件在由处理部件运行时使处理部件执行该方法的步骤。该计算机程序被包含在计算机程序产品的存储器和/或计算机可读介质中。计算机可读介质可以包括实质上任何存储器,诸如ROM(只读存储器)、PROM(可编程只读存储器)、EPROM(可擦除PROM)、闪存、EEPROM(电可擦除PROM)或硬盘驱动器。
此外,技术人员意识到,计算机装置100包括以用于执行本解决方案的例如功能、部件、单元、元件等的形式的必要通信能力。其他此类部件、单元、元件和功能的示例是:处理器、存储器、缓冲器、控制逻辑、编码器、解码器、速率匹配器、降速率匹配器、映射单元、乘法器、决策单元、选择单元、交换机、交织器、去交织器、调制器、解调器、输入、输出、天线、放大器、接收器单元、传送器单元、DSP、MSD、TCM编码器、TCM解码器、电源单元、馈电器、通信接口、通信协议等,它们一起适当地布置用于执行本解决方案。
特别是,该计算机装置100的处理器可以包括例如中央处理单元(CPU)、处理单元、处理电路、处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、微处理器或可以解释和执行指令的其他处理逻辑中的一个或多个示例。表述“处理器”从而可以表示包括多个处理电路的处理电路,诸如例如上面提到的处理电路中的任一个、一些或全部。处理电路可以进一步执行用于输入、输出和处理数据的数据处理功能,包括数据缓冲和装置控制功能,诸如呼叫处理控制、用户界面控制等。
最后,应该理解,本发明不限于上述实施例,而且同样涉及并结合所附独立权利要求的范围内的所有实施例。

Claims (15)

1.一种用于计算机装置的方法,用于基于包括细胞系和一个或多个生物标志物的多个样本以及板图配置检测最优候选化合物,其中所述板图配置提供包括暴露于一个或多个生物标志物和形成至少一个浓度梯度的不同浓度的候选化合物的细胞系的样本的位置,所述候选化合物被包括在多个候选化合物中,所述方法包括:
在多个连续时间点生成(310)所述多个候选化合物中每一个的每个浓度梯度的表型简档以形成多个化合物简档,其中生成表型简档包括以下步骤:获得(312)描绘在所述浓度梯度中包括的每个样本的图像数据;基于所述图像数据为所述样本的每个细胞生成(314)类标签和类;
通过评估所述多个化合物简档上的比较判据来检测(320)所述最优候选化合物。
2.根据权利要求1所述的方法,进一步包括如下步骤:
选择(315)描绘针对每个类标签和/或类的所述样本的至少一个细胞的图像数据的示例性子集;
向用户显示(316)图像数据的示例性子集和相应的类标签和/或类;
接收(317)来自所述用户的指示对至少一个类的操作的用户输入数据;
基于所述用户输入数据执行(318)对所述样本的细胞的类标签和/或类的操作。
3.根据权利要求2所述的方法,其中,对至少一个类的操作是从添加类、删除类、拆分类或合并类中选择的。
4.根据前述权利要求中任一项所述的方法,其中,检测(320)所述最优候选化合物的方法步骤进一步包括:
获得(322)一个或多个参考化合物简档;
基于所述一个或多个参考化合物简档计算(324)用于所述多个化合物简档中的每个化合物简档的多维差分值;
通过评估所述多个化合物简档上的比较判据来检测(320)所述最优候选化合物,其中基于所述多维差分值评估所述比较判据。
5.根据前述权利要求中任一项所述的方法,其中,所述图像数据描绘了来自多个视场的所述浓度梯度中包括的每个样本,和/或所述图像数据描绘了以多个图像滤波器处理的所述浓度梯度中包括的每个样本。
6.一种计算机装置(100),用于基于包括细胞系、一个或多个生物标志物的多个样本和板图配置检测最优候选化合物,其中所述板图配置提供包括暴露于一个或多个生物标志物和形成至少一个浓度梯度的不同浓度的候选化合物的细胞系的样本的位置,所述候选化合物被包括在多个候选化合物中,所述计算机装置包括:
处理器(112);以及
存储器(115),所述存储器(115)包含可由所述处理器执行的指令,由此所述计算机装置可操作以:
在多个连续时间点生成所述多个候选化合物中每一个的每个浓度梯度的表型简档以形成多个化合物简档,其中生成表型简档包括以下步骤:获得描绘在所述浓度梯度中包括的每个样本的图像数据;基于所述图像数据为所述样本的每个细胞生成类标签和类;
通过评估所述多个化合物简档上的比较判据来检测所述最优候选化合物。
7.根据前述权利要求中任一项所述的计算机装置(100),进一步包括输入装置(117)和显示器(118),其中所述计算机装置进一步可操作以:
选择描绘针对每个类标签和/或类的所述样本的至少一个细胞的图像数据的示例性子集;
在所述显示器(118)上向用户显示图像数据的示例性子集和相应的类标签和/或类;
从所述输入装置(117)接收由用户指示的指示对至少一个类的操作的用户输入数据;
基于所述用户输入数据对所述样本的细胞的类标签和/或类执行所述操作。
8.根据权利要求6或7中任一项所述的计算机装置(100),其中,所述计算机装置(100)进一步可操作以在所述显示器(118)上显示所述表型简档和/或化合物简档。
9.根据前述权利要求中任一项所述的计算机装置(100),其中,所述计算机装置当检测到所述最优候选化合物时进一步可操作以:
获得一个或多个参考化合物简档;
基于所述一个或多个参考化合物简档计算针对所述多个化合物简档中的每个化合物简档的多维差分值;
通过评估所述多个化合物简档上的比较判据来检测所述最优候选化合物,其中基于所述多维差分值评估所述比较判据。
10.根据前述权利要求中任一项所述的计算机装置(100),其中,候选化合物的所述浓度梯度包括多个单独的孔,其中每个孔包括暴露所述一个或多个生物标志物和不同浓度的所述候选化合物的所述细胞系的样本,并根据所述板图配置布置。
11.一种计算机程序,包括计算机可执行指令,用于当所述计算机可执行指令在包括在计算机装置(100)中的处理单元上执行时使所述计算机装置(100)执行以下方法步骤:
在多个连续时间点生成多个候选化合物中每一个的每个浓度梯度的表型简档以形成多个化合物简档,其中生成表型简档包括以下步骤:获得描绘在所述浓度梯度中包括的每个样本的图像数据;基于所述图像数据为所述样本的每个细胞生成类标签和类;
通过评估所述多个化合物简档上的比较判据来检测所述最优候选化合物。
12.根据前述权利要求中任一项所述的计算机程序,进一步使所述计算机装置(100)执行以下方法步骤:
选择描绘针对每个类标签和/或类的所述样本的至少一个细胞的图像数据的示例性子集;
向用户显示图像数据的示例性子集和相应的类标签和/或类;
接收来自所述用户的指示对至少一个类的操作的用户输入数据;
基于所述用户输入数据对所述样本的细胞的类标签和/或类执行所述操作。
13.根据权利要求12所述的计算机程序,其中,对至少一个类的操作是从添加类、删除类、拆分类或合并类中选择的。
14.根据前述权利要求中任一项所述的计算机程序,进一步使所述计算机装置(100)通过进一步执行以下方法步骤来执行检测所述最优候选化合物的方法步骤:
获得一个或多个参考化合物简档;
基于所述一个或多个参考化合物简档计算用于所述多个化合物简档中的每个化合物简档的多维差分值;
通过评估所述多个化合物简档上的比较判据来检测所述最优候选化合物,其中基于所述多维差分值评估所述比较判据。
15.一种计算机程序产品,包括计算机可读存储介质,所述计算机可读存储介质具有收录在本文中的根据权利要求11-14中任一项所述的计算机程序。
CN202311390212.0A 2016-09-30 2017-10-02 用于检测最优候选化合物的计算机装置及其方法 Pending CN117457097A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201662402272P 2016-09-30 2016-09-30
US62/402,272 2016-09-30
PCT/EP2017/075003 WO2018060523A2 (en) 2016-09-30 2017-10-02 Computer device for detecting an optimal candidate compound and methods thereof
CN201780073914.2A CN110140176B (zh) 2016-09-30 2017-10-02 用于检测最优候选化合物的计算机装置及其方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201780073914.2A Division CN110140176B (zh) 2016-09-30 2017-10-02 用于检测最优候选化合物的计算机装置及其方法

Publications (1)

Publication Number Publication Date
CN117457097A true CN117457097A (zh) 2024-01-26

Family

ID=60153264

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202311390212.0A Pending CN117457097A (zh) 2016-09-30 2017-10-02 用于检测最优候选化合物的计算机装置及其方法
CN201780073914.2A Active CN110140176B (zh) 2016-09-30 2017-10-02 用于检测最优候选化合物的计算机装置及其方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201780073914.2A Active CN110140176B (zh) 2016-09-30 2017-10-02 用于检测最优候选化合物的计算机装置及其方法

Country Status (5)

Country Link
US (2) US11636924B2 (zh)
EP (1) EP3520004A2 (zh)
JP (2) JP7130630B2 (zh)
CN (2) CN117457097A (zh)
WO (1) WO2018060523A2 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020081292A1 (en) 2018-10-17 2020-04-23 Becton, Dickinson And Company Adaptive sorting for particle analyzers
CN111291582B (zh) * 2020-03-04 2023-04-07 广西大学 一种基于水母群算法的rfid天线优化部署方法
CN114999582B (zh) * 2022-08-01 2022-10-04 乐比(广州)健康产业有限公司 一种驱蚊化合物含量检测方法

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6743576B1 (en) * 1999-05-14 2004-06-01 Cytokinetics, Inc. Database system for predictive cellular bioinformatics
US20080280771A1 (en) * 2000-02-08 2008-11-13 Regents Of The University Of Michigan Protein MicroarraySystem
WO2002066961A1 (en) * 2001-02-20 2002-08-29 Cytokinetics, Inc. Method and apparatus for automated cellular bioinformatics
EP1646926A2 (en) * 2003-07-18 2006-04-19 Cytokinetics, Inc. Characterizing biological stimuli by response curves
GB2434225A (en) 2006-01-13 2007-07-18 Cytokinetics Inc Random forest modelling of cellular phenotypes
US20090170091A1 (en) 2006-01-17 2009-07-02 Kenneth Giuliano Method For Predicting Biological Systems Responses
US8389688B2 (en) * 2006-03-06 2013-03-05 Aeres Biomedical, Ltd. Humanized anti-CD22 antibodies and their use in treatment of oncology, transplantation and autoimmune disease
US8323653B2 (en) * 2006-09-08 2012-12-04 Medimmune, Llc Humanized anti-CD19 antibodies and their use in treatment of oncology, transplantation and autoimmune disease
JP4801025B2 (ja) * 2007-09-07 2011-10-26 オリンパス株式会社 細胞画像解析装置及び細胞画像解析ソフトウェア
EP2335221B8 (en) 2008-09-16 2016-05-25 Novartis AG Reproducible quantification of biomarker expression
GB0909461D0 (en) 2009-06-02 2009-07-15 Ge Healthcare Uk Ltd Image analysis
JP6092206B2 (ja) * 2011-07-19 2017-03-08 オヴィジオ イメージング システムズ エン.ヴェー. 細胞試料内のがん性細胞を検出し、及び/又は分類する方法及びシステム
KR101808086B1 (ko) 2011-10-24 2017-12-14 삼성전자주식회사 무선 전력 전송을 이용한 사운드 시스템
CN104204807B (zh) 2012-01-20 2016-11-09 阿德莱德研究及创新控股有限公司 用于胃癌的生物标志物及其应用
JP5560351B1 (ja) 2013-01-11 2014-07-23 大日本スクリーン製造株式会社 理化学装置および画像処理方法
CN104975063B (zh) 2014-04-01 2020-04-03 埃提斯生物技术(上海)有限公司 抗肿瘤药物生物标志物的筛选方法及其应用
PL3207130T3 (pl) * 2014-10-14 2020-02-28 Halozyme, Inc. Kompozycje deaminazy adenozyny 2 (ada2), jej warianty i sposoby ich zastosowania
US10321336B2 (en) * 2016-03-16 2019-06-11 Futurewei Technologies, Inc. Systems and methods for robustly determining time series relationships in wireless networks
US9796505B1 (en) * 2016-04-01 2017-10-24 United Technologies Corporation Billet support fingers for palletization
US10360499B2 (en) * 2017-02-28 2019-07-23 Anixa Diagnostics Corporation Methods for using artificial neural network analysis on flow cytometry data for cancer diagnosis
WO2019073069A1 (en) * 2017-10-13 2019-04-18 Boehringer Ingelheim International Gmbh HUMAN ANTIBODIES AGAINST THOMSEN-NEW ANTIGEN (TN)
US20210147828A1 (en) * 2019-10-01 2021-05-20 The Broad Institute, Inc. Dna damage response signature guided rational design of crispr-based systems and therapies

Also Published As

Publication number Publication date
JP2019537102A (ja) 2019-12-19
WO2018060523A2 (en) 2018-04-05
WO2018060523A3 (en) 2018-06-14
CN110140176B (zh) 2023-11-14
US20210005287A1 (en) 2021-01-07
US20240013867A1 (en) 2024-01-11
EP3520004A2 (en) 2019-08-07
JP2022141771A (ja) 2022-09-29
US11636924B2 (en) 2023-04-25
CN110140176A (zh) 2019-08-16
JP7130630B2 (ja) 2022-09-05

Similar Documents

Publication Publication Date Title
US10733726B2 (en) Pathology case review, analysis and prediction
Bray et al. Workflow and metrics for image quality control in large-scale high-content screens
Shamir et al. Pattern recognition software and techniques for biological image analysis
US20240013867A1 (en) Computer device for detecting an optimal candidate compound and methods thereof
Bray et al. Quality control for high-throughput imaging experiments using machine learning in cellprofiler
US9488639B2 (en) Cell-based tissue analysis
JP6445127B2 (ja) 貨物の検査方法およびそのシステム
US10289802B2 (en) Spanning-tree progression analysis of density-normalized events (SPADE)
CN102687007B (zh) 利用分层标准化切割的高处理量生物标志物分割
US11861881B2 (en) Critical component detection using deep learning and attention
CN111656393A (zh) 组织学图像分析
US20230360208A1 (en) Training end-to-end weakly supervised networks at the specimen (supra-image) level
JP2022532615A (ja) マルチパラメータ細胞・細胞内撮像データから細胞表現型多様性を特徴付けるシステム及び方法
CN115769059B (zh) 用于数据分析的计算机实现的方法、计算机程序产品和系统
CN114981895A (zh) 自适应数据二次采样和计算
Chou et al. Fast and Accurate Cell Tracking: a real-time cell segmentation and tracking algorithm to instantly export quantifiable cellular characteristics from large scale image data
US20240029403A1 (en) Auto high content screening using artificial intelligence for drug compound development
US20240170165A1 (en) Systems and methods for the detection and classification of biological structures
Nguyen et al. $\textit {greylock} $: A Python Package for Measuring The Composition of Complex Datasets
CN114463745A (zh) 目标蛋白快速识别及定量方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination