CN115308145A - 用于光谱数据分析的方法和系统 - Google Patents

用于光谱数据分析的方法和系统 Download PDF

Info

Publication number
CN115308145A
CN115308145A CN202210885211.2A CN202210885211A CN115308145A CN 115308145 A CN115308145 A CN 115308145A CN 202210885211 A CN202210885211 A CN 202210885211A CN 115308145 A CN115308145 A CN 115308145A
Authority
CN
China
Prior art keywords
spectral
protein
distribution
proteins
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210885211.2A
Other languages
English (en)
Inventor
B·帕斯特拉纳-里奥斯
J·J·罗德里格斯-托罗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Protein Dynamic Solutions Ltd
Original Assignee
Protein Dynamic Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Protein Dynamic Solutions Ltd filed Critical Protein Dynamic Solutions Ltd
Publication of CN115308145A publication Critical patent/CN115308145A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/57Certifying or maintaining trusted computer platforms, e.g. secure boots or power-downs, version controls, system software checks, secure updates or assessing vulnerabilities
    • G06F21/572Secure firmware programming, e.g. of basic input output system [BIOS]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/01Arrangements or apparatus for facilitating the optical investigation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/255Details, e.g. use of specially adapted sources, lighting or optical systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N29/00Investigating or analysing materials by the use of ultrasonic, sonic or infrasonic waves; Visualisation of the interior of objects by transmitting ultrasonic or sonic waves through the object
    • G01N29/44Processing the detected response signal, e.g. electronic circuits specially adapted therefor
    • G01N29/46Processing the detected response signal, e.g. electronic circuits specially adapted therefor by spectral analysis, e.g. Fourier analysis or wavelet analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/10Analysis or design of chemical reactions, syntheses or processes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/01Arrangements or apparatus for facilitating the optical investigation
    • G01N2021/0106General arrangement of respective parts
    • G01N2021/0112Apparatus in one mechanical, optical or electronic block
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N2021/3595Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using FTIR
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/55Specular reflectivity
    • G01N21/552Attenuated total reflection

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Molecular Biology (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Computing Systems (AREA)
  • Physiology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

蛋白质、肽和/或类肽的特性可以经由二维相关光谱和/或二维共分布光谱来测定。可以获得关于所施加的扰动的所述蛋白质、肽和/或类肽的光谱数据。可以应用二维共分布分析来生成所述蛋白质、肽和/或类肽的异步共分布图,以定义溶液中的蛋白质群体。在二维异步图中,交叉峰可以鉴定为与在和所述蛋白质、肽和/或类肽的聚集相关的二维相关同步图中的自动峰相关联。所述二维异步交叉峰可用于确定关于所施加的扰动的光谱强度的分布式存在的顺序。例如,对于两个波数v1和v2,对应于所述两个波数的所述交叉峰的值可以表示v1处存在的光谱强度相对于v2处存在的光谱强度。

Description

用于光谱数据分析的方法和系统
本申请是申请日为2017年1月20日,申请号为201780017216.0,题目为“用于光谱数据分析的方法和系统”的专利申请的分案申请。
相关申请案
本专利申请要求2016年1月21日提交的美国临时专利申请No.62/281,630的权益,该临时专利申请的全部内容据此以引用的方式并入。
背景技术
蛋白质聚集现象在整个工业生物过程中是普遍存在的。蛋白质由于其复杂的物理化学特性,表达、分离和纯化是昂贵的。聚集被认为是蛋白质降解的主要模式,有时导致免疫原性、患者中的抗药抗体反应(ADA)和功效丧失。蛋白质聚集体的检测和测定是生物制药行业和其他科学研究领域的主要目标。蛋白质聚集体的形成在工业应用中是重要的,因为它们可能显著影响蛋白质治疗剂(即,生物制剂或生物仿制药)的生产,从而有效降低生产产率。
发明内容
例如,根据下文描述的各方面示出了主题技术。下文描述了主题技术的多个方面的各种实例。这些实例以示例提供,而不限制主题技术。
主题技术的多个方面提供了一种在不使用探针或添加剂的情况下,测定溶液或冻干状态的蛋白质、肽和/或类肽制剂中的聚集的方法。
根据主题技术的多个方面,使用已建立的方法对蛋白质样品进行光谱分析,并分析光谱数据以测定蛋白质样品的活力。所述方法和/或其部分可以是完全自动化的并且可以用于测定聚集的机制。
根据主题技术的多个方面,本文所述的方法可以应用于作为单种组分或与其他肽或脂质混合物的二元或三元混合物的膜蛋白、亲水蛋白质、肽和类肽。当在混合物中时,必须对一种组分进行同位素标记,以允许同时检测每种组分。
主题技术的多个方面使得可以实现样品制备的灵活性、其自动化的潜力以及数据分析,该数据分析已被证明可用于药物蛋白质制剂。
根据主题技术的多个方面,本文所述的方法可以应用于若干水性或脂质环境中的任何蛋白质、肽或类肽样品。本文所述的方法可以定性和/或定量用于测定蛋白质聚集。进行数据分析,通过该数据分析来确定蛋白质聚集的机制,并且可以测定蛋白质、肽或类肽的稳定性和/或活力。
根据主题技术的一个方面,该方法涉及用于分析这些蛋白质、肽或类肽的透射傅立叶变换红外(“FT-IR”)和/或衰减全反射(“ATR”)光谱、量子级联激光显微术(“QCL”)、二维相关光谱(“2DCOS”)和/或二维共分布光谱(“2DCDS”)。根据主题技术的多个方面,光谱数据可以使用任何合适的方法和设备(诸如FT-IR光谱仪、FT-IR显微镜、QCL光谱仪或QCL显微镜)获得。在主题技术的多个方面,优选的是,使用QCL显微镜获得光谱数据。
用于处理表示蛋白质、肽和/或类肽的特性的数据的方法、系统和指令可以包括:获得关于所施加的扰动的蛋白质、肽和/或类肽的光谱数据;应用二维共分布分析,以生成蛋白质、肽和/或类肽的异步共分布图;在异步共分布图中鉴定与蛋白质、肽和/或类肽的聚集相关的自动峰有关的交叉峰;以及使用交叉峰来确定关于所施加的扰动的光谱强度的分布式存在的顺序。
使用交叉峰可包括:对于两个波数v1和v2,确定对应于这两个波数的交叉峰是否具有正值;并且当交叉峰具有正值时,确定v1处存在的光谱强度分布在所施加的扰动的某间隔内,该间隔小于其中v2处存在的光谱强度所分布的间隔。使用交叉峰可包括:对于两个波数v1和v2,确定对应于这两个波数的交叉峰是否具有负值;并且当交叉峰具有负值时,确定v2处存在的光谱强度分布在所施加的扰动的某间隔内,该间隔小于其中v1处存在的光谱强度所分布的间隔。
操作可包括:应用二维相关性分析,以生成蛋白质、肽和/或类肽的同步图;在同步图中,鉴定与蛋白质、肽和/或类肽的聚集相关的同步峰;以及使用同步峰来确定关于所施加的扰动的光谱强度的分布图案的叠加程度。
操作还可包括:应用二维相关性分析,以生成蛋白质、肽和/或类肽的同步图和异步图;在同步图中,鉴定与蛋白质、肽和/或类肽的聚集相关的自动峰有关的正交叉峰;以及使用光谱数据的所鉴定峰强度来确定蛋白质、肽和/或类肽的聚集量。
蛋白质、肽和/或类肽的聚集量可以与关于所施加的扰动的光谱强度的分布式存在的顺序进行比较。可以识别所关注区域,以区分颗粒和溶液。可以测定颗粒的大小和数量,以确定颗粒的群体分布。可以分析光谱数据以验证信噪比、进行基线校正、测定水蒸气含量和/或测定光谱区域内的信号强度。可以根据样品的扰动生成协变或动态光谱数据。光谱数据中彼此同相的变化(包括峰强度)可以相关联,这些变化如在同步图中获得。可以确定光谱数据中发生变化的元素。可以确定光谱数据中的总体最大强度变化。可以确定光谱数据中的总体最小强度变化。可以确定谱带中潜在的光谱贡献的最小数量,进行曲线拟合分析,并确定样品的二级结构组成。包括峰强度的变化可以与在异步图中获得的彼此异相的光谱数据有关。
主题技术的另外特征和优点将在以下描述中示出,并且部分地将从该描述中显而易见,或者可以通过主题技术的实践而获悉。通过书面描述及权利要求以及附图中特别指出的结构,将认识和获得主题技术的优点。
应当理解,上文的一般性描述和下文的详细描述都是示例性和说明性的,并且旨在提供受权利要求保护的主题技术的进一步解释。
附图说明
附图被包括以提供对主题技术的进一步理解并且被并入并构成本说明的一部分,这些附图示出了主题技术的多个方面,并且与说明书一起,用于解释主题技术的原理。
图1A、图1B和图1C示出了根据主题技术的一些方面用于测定蛋白质聚集的正交生物分析技术的结果。图1A示出了尺寸排阻色谱(“SEC”)的结果。图1B示出了差示扫描量热法(“DSC”)的结果。图1C示出了动态光散射(“DLS”)的结果。
图2示出了指示根据主题技术的一些方面的方法的不同阶段的流程图。
图3示出了多阶段分析的结果。
图4示出了根据主题技术的一些方面的示例性计算系统的图示。
图5示出了指示根据主题技术的一些方面的示例性方法的操作的流程图。
图6示出了指示根据主题技术的一些方面的示例性方法的操作的流程图。
图7示出了多阶段分析的结果。
图8A示出了用于可开发性评估的ADC片段候选氨基酸序列的比较。ADC片段0(“ADC0”;SEQ ID NO:1)是在N-末端处包含另外7个氨基酸(APELLGG;SEQ ID NO:2)的全长片段。ADC片段1(“ADC1”;SEQ ID NO:3)在N-末端处截短,并且像顶部片段一样含有1个二硫桥。与ADC片段1相比时,ADC片段2(“ADC2”;SEQ ID NO:4)具有两个点突变(L5C/K97C),从而添加另外的二硫桥,以稳定ADC片段2。
图8B示出了理查德森(Richardson)带状模型,该模型主要包括β-折叠、β-转角和铰链,以及ADC片段内的2个短螺旋。该图示出了N-末端,C-末端,位置25、62和71处的3个Arg,位置27和61处的相邻Pro残基,以及二硫键Cys31和Cys91。这3个精氨酸残基用作ADC的内部探针。
图9A和图9B示出了聚集体的大小和身份(identity)。图9A示出了ADC0和ADC1的QCL红外光谱叠加。图9B示出了分别针对24℃和28℃的曲线图。ADC片段都进行了完全H→D交换。此外,在24℃下,酰胺I’谱带的最大值对应于聚集的ADC1,而在28℃下,最大值对应于溶于D2O溶液的ADC1。
图10示出了共分布分析的结果。聚集机制涉及蛋白质内的精氨酸残基和所选的反平行β-折叠和β-转角。所以,此分析提供了引起聚集的蛋白质区域。
图11A示出了QCL显微图,图11B示出了溶于15%蔗糖的ADC片段2的相关QCL光谱。这可用于验证赋形剂和蛋白质候选物二者的存在和数量。
图12A、图12B和图12C示出了在存在NaCl和不同量的蔗糖(图12A:15%蔗糖,图12B:30%蔗糖,图12C:60%蔗糖)赋形剂时在26℃和pH6.6下溶于HEPES的ADC2所获得的在1400–1800cm-1光谱区域内的QCL光谱结果。这些结果证实了定量分析可以进行的程度,从而提供原本难以获得的重要信息。蛋白质的稳定性和构象可以在所需的赋形剂条件下确认,同时还允许测定溶液中所关注的蛋白质及其赋形剂的浓度。此外,在这些条件下未观察到ADC2的聚集体种类。
图13示出了对在不同条件下使用QCL显微镜的43个实验进行的正态分布分析的结果。QbD实验设置使得在存在不同量的NaCl、蔗糖和不同比例的两种赋形剂(即,NaCl和蔗糖)的情况下,分析了代表ADC片段2的评估的324个光谱数据。
图14示出了DOE逐步模型拟合的结果,该结果包括使用第二最佳拟合模型(AIC模型)得到的ADC2 QCL显微光谱数据的预测简况。
图15示出了DOE逐步模型拟合的结果,该结果包括使用最佳拟合模型(BIC模型)得到的ADC2 QCL显微光谱数据的预测简况。结果表明,在接近室温条件下,18.5%蔗糖是ADC2的最佳赋形剂。
图16A和图16B示出了在存在HEPES和15%蔗糖的情况下,在26-28℃的温度范围内,ADC片段2的2D IR相关性分析图(图16A:同步,图16B:异步)。研究了1720–1500cm-1光谱区域中的酰胺I’和侧链谱带。据观察,在不存在聚集体种类的情况下,同步图(图16A)ADC2主要具有β-折叠和β-转角二级结构。
图17示出了在pH 6.6和26℃的温度下,在50mM HEPES、150mM NaCl、3mM KCl和15%蔗糖中,ADC片段2的事件的相继顺序,该顺序用于确认蔗糖在稳定蛋白质中的作用。
图18A和图18B示出了在HEPES和15%蔗糖赋形剂中在26-28℃的温度范围内ADC2的2D IR共分布分析图(图18A:同步,图18B:异步)。侧链以及π-螺旋和β-转角(铰链环)在低温下受到扰动。
图19示出了使用从2D IR相关性分析中产生的谱带归属进行的溶于D2O中的ADC片段2的代表性曲线拟合分析,通过该分析测得80.4+/-1.1%的蛋白质包含β-结构(另见表2和表3)。
图20A示出了重叠光谱,其示出了在24-60℃的温度范围内获得的1750-1400cm-1的MID IR光谱区域中,以50mg/mL溶于H2O的NIST mAb的酰胺I、II和III谱带。
图20B和图20C示出了图16A的样品的2D IR相关性分析图(图20B:同步,图20C:异步)。
图21A示出了重叠光谱,其示出了在24-60℃的温度范围内获得的1750-1500cm-1的MID IR光谱区域中,以50mg/mL溶于H2O的NIST mAb的酰胺I和II谱带。
图21B和图21C示出了图21A的样品的2D IR相关性分析图(图21B:同步,图21C:异步)。
图22示出了在24-60℃的温度范围内的热应力下以50mg/mL溶于H2O的NIST mAb的事件的相继顺序。
图23示出了在24-60℃的温度范围内的热应力下以50mg/mL溶于H2O的NIST mAb的异步2D IR共分布分析图。
图24A、图24B、图24C和图24D分别示出了图21A、图21B、图21C和图22的图表的再现,其中添加了与同步图2D IR相关性分析图的自动峰交叉的垂直虚线(图24B)。
图25A示出了重叠光谱,其示出了在24-60℃的温度范围内获得的1750-1500cm-1的MID IR光谱区域中,以40mg/mL溶于H2O的BSA的酰胺I和II谱带。
图25B和图25C示出了图25A的样品的2D IR相关性分析图(图25B:同步,图25C:异步)。
图26示出了在热应力(24-60℃)下以40mg/mL溶于H2O的BSA的事件的相继顺序。
图27示出了在24-60℃的温度范围内的热应力下和1750-1380cm-1的光谱区域内以40mg/mL溶于H2O的BSA的异步2D IR共分布分析图。
图28A示出了重叠光谱,其示出了在24-60℃的温度范围内获得的1750-1500cm-1的光谱区域中,溶于H2O的NIST mAb/BSA(1:2,摩尔比)混合物的酰胺I和II谱带。
图28B和图28C示出了图28A的样品的2D IR相关性分析图(图28B:同步,图28C:异步)。
图29A示出了重叠光谱,其示出了在24-60℃的温度范围内获得的1750-1500cm-1的光谱区域中,以600mg/mL溶于H2O的溶菌酶的酰胺I和II谱带。
图29B和图29C示出了图29A的样品的2D IR相关性分析图(图29B:同步,图29C:异步)。
图30示出了在热应力(24-60℃)下以600mg/mL溶于H2O的溶菌酶的事件的相继顺序。
图31示出了在24-60℃的温度范围内的热应力下和1750-1500cm-1的光谱区域内以600mg/mL溶于H2O的溶菌酶的异步2D IR共分布分析图。
图32示出了计算系统的示例性图示。
具体实施方式
在以下详细描述中,阐述了具体细节以提供对主题技术的理解。然而,对于本领域的普通技术人员将显而易见的是,主题技术可以在这些具体细节中的一些不存在的情况下实践。在其他情况下,熟知的结构和技术未详细示出,以免混淆主题技术。
蛋白质是由氨基酸组成的大型有机化合物,这些氨基酸排列成直链并通过相邻氨基酸残基的羧基与氨基基团之间的肽键连接在一起。大多数蛋白质折叠成独特的三维结构。蛋白质天然折叠成的形状称为其天然状态。虽然很多蛋白质仅仅通过其氨基酸的化学性质而不加辅助便可折叠,但是其他蛋白质需要在分子伴侣的协助下才能折叠成其天然状态。蛋白质的结构有四个不同的方面:
·一级结构:氨基酸序列。
·二级结构:通过氢键稳定的规则重复的局部结构。因为二级结构是局部的,所以不同二级结构的很多区域可以存在于相同的蛋白质分子中。
·三级结构:单个蛋白质分子的总体形状;二级结构彼此之间的空间关系。
·四级结构:由多于一个蛋白质分子的相互作用产生的形状或结构,在此语境中所述蛋白质分子通常称为蛋白质亚基,它们作为大型组装体或蛋白质复合物的一部分发挥作用。
蛋白质不是完全刚性的分子。除了这些层级的结构之外,蛋白质还可以在几种相关结构之间转换,同时发挥其生物学功能。在这些功能性重排的语境中,这些三级或四级结构通常称为“构象”,并且它们之间的转变称为构象变化。
蛋白质聚集的特征在于错误折叠的刚性蛋白质集聚,其被认为是整个工业生物过程中的普遍现象。聚集被认为是蛋白质降解的主要模式,通常导致蛋白质的免疫原性和生物活性丧失。蛋白质聚集在从异常疾病状态(诸如阿尔茨海默氏症和帕金森病)到蛋白质药物的生产、稳定性和递送的许多生物医学情形中至关重要。蛋白质聚集在自然界中可以是无定形或纤维状的,可以从两种不同的机制之一开始:A)自聚集,其中部分折叠的中间体是聚集的直接前体,和B)异聚集,其中一种蛋白质的聚集由另一种蛋白质介导。
蛋白质聚集体的形成在工业应用中是关键的,因为它可能高度影响基于蛋白质的药物或商业化酶的生产,从而大大降低生产产率。生物制剂和生物仿制药行业涉及包括蛋白质治疗剂在内的复杂药物的研究、开发和制造。研发效率低可能不合期望地低,这由于蛋白质治疗剂的高损耗率而增加药物开发成本。蛋白质治疗剂的开发成本受到后期失败的显著影响。降低研发成本的一种方法是在研发阶段的早期对蛋白质治疗剂候选物进行一系列评估。通过在研发阶段的早期在不同的制剂条件和应激物下对治疗性蛋白质进行表征,产生治疗性候选物的预测简况以评估蛋白质聚集的风险。这种方法已被定义为可开发性评估。该评估可以为决策提供重要信息,诸如选择用于进一步开发的蛋白质治疗剂候选物。当蛋白质聚集发生时,蛋白质治疗剂通常具有降低的功效并且可以引起免疫反应。在严重的情况下,这种免疫反应可能是致命的。
过去已经提出了几种方法来测定混合物中的聚集体。这些现有方法是针对特定蛋白质或肽而设计的和/或需要添加外源探针,因此不代表对一类生物分子具有普遍适用性的一般方法。已经使用了若干光谱技术,如借助于探针的紫外-可见光谱、也使用内部或外源探针的荧光光谱。类似地,已使用近紫外圆二色谱(“CD”),但仅限于检测其邻近范围的聚集体,并且核磁共振(“NMR”)可用于通过出现谱带增宽来检测蛋白质聚集。沉降分析也可用于鉴定寡聚化程度,只要所关注的蛋白质具有足够大的摩尔消光系数即可。诸如尺寸排阻的色谱技术也可以检测蛋白质聚集体的存在。但是这些技术可能需要使用外源探针、大量蛋白质,并且是耗时的,它们都不能确定聚集的机制。
蛋白质聚集的问题是复杂的,并且经常涉及几种难以辨别的不同化学和/或计算过程。聚集可以是应力诱导的并且涉及物理或化学变化,诸如搅拌、氧化、脱氨基和温度变化。即使pH、盐条件、蛋白质浓度或制剂条件的轻微变化也可以诱导蛋白质聚集。同样,聚集导致生产产率降低、蛋白质治疗剂的功效丧失以及与免疫原性风险相关的安全性问题。目前可用于评估聚集的技术不能解决该过程中涉及到的所有因素,诸如大小、同一性、聚集机制和程度以及蛋白质治疗剂在溶液中的稳定性。已经开发了几种解决聚集体或颗粒的大小的技术,但它们并不能确定身份。其他技术可以确定聚集体的大小和身份,但不能确定聚集程度。蛋白质中存在的氨基酸侧链是蛋白质稳定性的重要贡献因素。然而,在高通量过程中,使用常规台式仪器无法确定在侧链中观察到的弱化学相互作用与蛋白质的二级结构的稳定性之间的关系。
蛋白质治疗剂的稳定性对于药物开发也是关键的,并且不能通过简单地鉴定蛋白质的热转变温度来完全表征。需要更高层次的认识来理解和解决蛋白质治疗剂的稳定性。例如,以下认识将是有益的:1)所关注的蛋白质内的域的相对稳定性,2)氨基酸侧链如何帮助域的稳定,3)氨基酸侧链是否在聚集机制中涉及到,以及4)赋形剂是否可以稳定蛋白质治疗剂的特定域中的关键区域内(例如,氨基酸侧链中)的弱相互作用。要理解对于确定蛋白质聚集的机制具有重要意义的参数还存在一定差距。
当正交使用目前商业上可获得的技术时,可用技术的灵敏度差异是考虑的问题。通常,此类技术集中于测定蛋白质治疗剂的大小、纯度和稳定性,并且评价制剂中是否存在蛋白质聚集体或颗粒,以实现批次间一致性。
需要可用于更好地评估蛋白质治疗剂的可开发性,以及用于维持和确保产品完整性、功效和安全性所需的可比性评估的技术。这种过程需要被认可为足以确保满足美国食品药品监督管理局(Food and Drug Administration,“FDA”)药品审评中心(Center forDrug Evaluation,“CDER”)部门和其他相关监管主体规定的产品完整性、功效和安全性。
生物制药行业的蛋白质聚集问题的解决方案将使得:(1)研发成本降低,(2)生产产率提高,从而确保其供需,(3)降低撤销的风险,(4)提高FDA批准率,(5)缩短产品上市时间以及(6)继而增加其估值。另外,新蛋白质治疗剂的项目储备已准备好解决癌症和慢性疾病(诸如类风湿性关节炎、克罗恩病和神经退行性疾病等等)的治疗,从而改善患者的生活质量。
主题技术的多个方面提供了一种在单个实验中测定蛋白质治疗剂或其他化学品的大小、身份、聚集机制和程度以及稳定性的快速、准确且可再现的技术。主题技术的多个方面解决了不同蛋白质治疗剂候选物的可比性评估和蛋白质治疗剂候选物的可开发性评估。数据可用于蛋白质、聚合物、有机物质、无机物质的分类和化学表征,从而用于中试规模或制造规模的发现、研究和开发,或用于质量控制和保证目的。还用于蛋白质治疗剂的储存和递送期间的稳定性评估。
本文所述的计算方法和系统提供了优于现有蛋白质分析的显著改进。本文所述的计算方法和系统以有助于有效和有意义的分析的形式生成和存储数据,而不需要使用若干台设备。因此,本文所述的计算方法和系统可以提高用于候选药物评估的光谱数据分析的效率。
主题技术的多个方面包括使用二维相关光谱(“2DCOS”)和二维共分布光谱(“2DCDS”)来提供关于蛋白质治疗剂的聚集程度和机制的重要信息。本文所述的方法可以包括将侧链模式作为内部探针分析,从而提供确认蛋白质内的结构基序或域的稳定性的信息。本文所述的方法已显示可用于经由符合质量源于设计(“QBD”)的实验设计(“DOE”)方法来进行的高通量-可开发性和可比性评估(“HT-DCA”)。
根据一些实施方案,本文所述的系统和方法也可用于测定蛋白质-蛋白质相互作用(“PPI”)或蛋白质-大分子(蛋白质-脂质相互作用、蛋白质-DNA或蛋白质-RNA相互作用或蛋白质药物相互作用)。另外,本文所述的系统和方法可用于有机溶液、聚合物、凝胶、纳米结构或小液晶等的分析。
图1A示出了尺寸排阻色谱(“SEC”)的结果,图1B示出了差示扫描量热法(“DSC”)的结果,而图1C示出了动态光散射(“DLS”)的结果。这些技术可以引导测定大小、身份和聚集程度,但没有一种技术可明确聚集的机制。理解聚集的机制对于开发蛋白质药物至关重要,这将确保蛋白质药物按照预期以极低的免疫原性风险或无免疫原性风险发挥作用的潜力。
根据一些实施方案,例如如图2所示,来自生物过程的不同部分的样品可以是含水的或冻干的,这些样品通过傅立叶变换红外(ATR或透射)光谱(“FT-IR”)监测并使用2DCOS进行分析以搜索聚集体。可以采用其他类型的分析,诸如拉曼(Raman)光谱、量子级联激光吸收、同步加速源傅立叶变换红外显微术和/或它们的组合。如果发现聚集体,则可以开始可包括将结果与已建立的数据库进行比较的评估程序,因此可以修改或改变生物过程中使用的方案。FT-IR光谱在蛋白质聚集体的测定方面具有高度的灵活性和速度,只需要有限的操纵,无需使用外源探针。示例性方法可包括与2DCOS组合的FT-IR光谱,其允许测定聚集体的存在,测定聚集的机制,从而允许更正蛋白质的工艺制程,以再次产生有活力的蛋白质。另一种示例性方法可包括与2DCOS组合的量子级联激光显微术,其允许测定聚集体的存在,测定聚集的机制,从而允许更正蛋白质的工艺制程,以再次产生有活力的蛋白质。此外,还可以测定蛋白质的热转变并生成2DCOS图,以便与已确立的有活力的蛋白质进行比较,从而实现所需蛋白质产物的质量控制、稳定性和活力。此外,样品制备和数据分析的简易性允许该方法自动化。
FT-IR光谱对构象变化和聚集敏感。该技术允许对蛋白质、肽和类肽聚集的程度进行定性和定量分析。2DCOS的使用允许进一步分析和提供聚集过程相关的机理信息。该方法可包含一种或多种以下技术:透射FT-IR光谱、衰减全反射(“ATR”)FT-IR光谱、2DCOS分析和/或2DCDS分析。
在透射FT-IR显微术或QCL显微术中,样品制备可涉及使用溶于适当缓冲液中的纯蛋白质、肽或类肽。样品可以冻干并重悬于D2O中。蛋白质溶液可施加于载玻片与盖玻片之间,并密封以防止溶剂蒸发。载玻片可置于载玻片托架中。使用适当缓冲液(PBS或HEPES)的类似程序用作参考。与载玻片紧密接触定位的温度探头用于记录样品的温度。可以使用随时间推移而变化的温度梯度,并通过热电偶接口自动接收所获得的光谱数据。在光谱分析期间,可以测定酰胺I谱带的随温度而变化的半高全宽(FWHH),以建立转变温度。
衰减全反射(ATR)FT-IR光谱可用于氢/氘交换研究、滴定实验和重建膜蛋白的方向测定。在该方法中,蛋白质可以通过重复冻干并将样品重新溶解于D2O中来完全交换。完全交换的蛋白质样品和缓冲液可独立地作为薄膜涂布,其中缓冲液被视为参考。通常,将溶于D2O的蛋白质样品涂布在ATR晶体上,并允许使用干燥空气吹扫来干燥。后续光谱将代表蛋白质样品以及(如果存在的话)聚集形式的蛋白质。
根据一些实施方案,可以通过任何合适的方法,诸如一种或多种上述方法生成光谱数据。如果需要,待分析的分子可以与溶质(诸如水或D2O)一起以溶液的形式提供。溶液中待分析的分子的浓度具有的范围优选地相对于来自溶质(例如,水)或样品的其他组分的任何信号,提供来自分子的强烈信号(即,合适的信噪比),这可以促进本文所述的进一步分析。通常,将提供所需信噪比的蛋白质或肽分子的浓度与蛋白质或肽的大小相关和成比例。优选的浓度为分析提供足够的信噪比。例如,如本文进一步描述,样品可以促进所关注的分子的光谱分析,而不需要减去可归因于溶质(例如,水或D2O)或样品的其他组分的光谱。例如,对于约150kD的IgG或其他蛋白质,样品可含有浓度为约50mg/mL至约150mg/mL的蛋白质。蛋白质的量可在该范围内与所关注的蛋白质的大小成比例地变化,例如约67kD的BSA可以在浓度为约25mg/mL至约75mg/mL的溶液中分析。样品可提供于具有一定光程长的杯子中。对于D2O,光程长可以更长(例如,30-50μm,优选地约40μm),对于水,可以更短(例如,4-12μm)。
根据一些实施方案,光谱分析可以分阶段进行,例如如图3所示。图3所示的过程可包括作为如图2所示的“2DCOS/2DCDS分析”阶段的至少一部分而执行的阶段。
根据一些实施方案,蛋白质样品受到扰动(热、化学、压力或声学),从而引起振动光谱的动态波动。在阶段310中,可以收集和/或分析原始光谱数据。光谱数据可以以规则的温度间隔并以连续方式获取。根据一些实施方案,可以对数据进行基线校正。
根据一些实施方案,光谱数据可用于测定聚集形式的蛋白质、肽或类肽的存在。为此,从后续光谱减去第一光谱,以生成动态光谱。在阶段320中,可以通过从所有的后续光谱减去第一光谱(24℃)来生成协变(差异)光谱。因此,协变(差异)光谱含有正峰和负峰;也称为彼此同相和异相。
值得注意的是,本文所述的过程不需要从光谱数据中手动减去水或其他参考(例如,溶质)。这种手动扣减是蛋白质光谱分析中经常发生的高度主观的步骤。相反,本文所述的过程根据所关注的样品的扰动生成差异光谱数据集。然后可以将其输出用于进一步分析。通过从所有后续光谱减去具有叠加水谱带以及酰胺I谱带的第一光谱,可自动减去水的光谱贡献。
在阶段330中,可以应用2D IR相关技术来生成同步图(阶段340)和异步图(阶段350)。例如,可以对光谱数据进行快速傅立叶变换(“FFT”),以生成复合矩阵,通过互相关积(cross correlation product)从该复合矩阵获得强度矩阵,生成同步和异步图。用于生成这些图的技术将在本文更详细地讨论。
同步图表示在扰动期间发生的强度变化。在该图的对角线上是在整个光谱中改变的峰或谱带(称为自动峰)。在对角线外是交叉峰,其示出了自动峰之间的相关性,即所观察到的二级结构变化之间的关系。同步图可用于关联同相峰强度变化或位移。
在同步相关光谱中,对角线位置处的自动峰表示扰动引起的光谱信号的动态波动程度。交叉峰表示两个不同波数处的光谱信号的同时变化,表明强度变化的耦合或相关起源。如果交叉峰的符号为正,则对应的波数处的强度共同增加或减小。如果符号为负,则一个增加,而另一个减小。
异步图仅含有交叉峰,这些交叉峰用于测定事件的顺序,从而测定蛋白质的聚集机制。异步图可用于关联异相峰强度变化或位移。
在异步相关光谱中,对于信号波动的一些傅里叶频率分量,只有强度彼此异相变化时,才会产生交叉峰。如果波数v2处的强度变化在波数v1之前发生,则交叉峰的符号为正。如果波数v2处的强度变化在波数v1之后发生,则交叉峰的符号为负。如果转换为同步图的相同的异步交叉峰位置落入负值区域(Φ(v1,v2)<0),则上述符号规则反转。
2D IR相关性通过在两个维度上扩展峰来增强宽谱带(诸如酰胺I和II谱带)的潜在峰的光谱分辨率。这些图本质上是对称的,并且出于讨论目的,将参考顶部三角形进行分析。同步图(在340处示出)含有两种类型的峰:(a)自动峰,它们是对角线上的正峰;和(b)交叉峰,它们是可以为正或负的非对角线峰。异步图(在350处示出)排他性地包括与异相峰相关的交叉峰。因此,该图揭示了更大的光谱分辨率增强。以下规则可应用于确立分子事件的顺序:
I.如果异步交叉峰ν2为正,则ν2在ν1之前扰动(ν2→ν1)。
II.如果异步交叉峰ν2为负,则ν2在ν1之后扰动(ν2←ν1)。
III.如果同步交叉峰(非对角线峰,图3中未示出)为正值,则使用异步图(规则I和II)排他性地确立事件的顺序。
IV.如果同步图含有负交叉峰并且对应的异步交叉峰为正,则顺序相反。
V.如果同步图含有负交叉峰并且对应的异步交叉峰为负,则维持该顺序。
可以针对在ν2轴中观察到的每个峰确立事件的顺序。可以提供汇总每个事件的顺序的表格。在阶段360中,使用汇总每个事件的顺序的表格生成事件的相继顺序图。在每个步骤(事件)的顶部是交叉峰ν2的光谱信息,而在每个步骤的底部是该顺序的每个事件的对应峰归属或生物化学信息,其中它们随温度的变化而扰动。本文提供了多个实例。
二维相关光谱(“2DCOS”)分析可用于解析复杂谱带,诸如酰胺I谱带。2DCOS分析的实例如美国专利No.8,268,628所述,该专利据此以引用的方式并入本文。Isao Noda,“Two-dimensional co-distribution spectroscopy to determine the sequential order ofdistributed presence of species”,Journal of Molecular Structure,第1069卷,第51-54页吸引了技术人员的关注,该文献描述了适用于2DCOS分析的算法。
2DCOS的开发汇总如下。对于在外部扰动的影响下测定的系统,可获得光谱的离散采样集合A(vj,tk),该扰动引起观察光谱强度的变化。光谱变量vj(其中j=1,2,...,n)可以是例如波数、频率、散射角等,另一个变量tk(其中k=1,2,...,m)表示所施加的扰动(例如时间、温度和电势)的作用。只有在t1与tm之间的明确定义的观察间隔期间获得的顺序采样光谱数据集才会用于2DCOS分析。为简洁起见,此处使用波数和时间来指定两个变量,但是应该理解,使用其他物理变量也是有效的。
2D相关光谱中使用的动态光谱明确定义如下
Figure BDA0003765628760000111
其中
Figure BDA0003765628760000121
是系统的参考状态的光谱。在没有事先了解参考状态的情况下,参考光谱也可以设置为在t1与tm之间的观察间隔上的时间平均光谱。
Figure BDA0003765628760000122
通过对参考光谱的这种特定选择,动态光谱的在该观察间隔内的部分基本上等于平均中心光谱。同步和异步2D相关光谱Φ(v1,v2)和Ψ(v1,v2)由下式给出
Figure BDA0003765628760000123
Figure BDA0003765628760000124
术语Nij是下式给出的所谓的Hilbert-Noda变换矩阵的元素
Figure BDA0003765628760000125
同步光谱Φ(v1,v2)表示在两个不同波数v1和v2处观察到的沿扰动变量tk的光谱强度的协调或同时变化。如果在两个波数处测定的光谱强度主要在相同方向上变化(增加或减小),则同步相关强度的符号变为正。在另一个方面,如果一个增加,而另一个减小,则Φ(v1,v2)的符号变为负。
异步光谱Ψ(v1,v2)表示光谱强度的异相或顺序变化。如果Ψ(v1,v2)=0,则在两个波数v1和v2处的光谱强度的变化完全同步。如果Φ(v1,v2)和Ψ(v1,v2)的符号相同,则在v1处观察到的总体光谱强度变化主要发生在v2处观察到的之前。如果符号不同,则顺序相反。最后,如果Φ(v1,v2)=0,则不能测定强度变化的相继顺序。强调2D相关光谱仅给出光谱强度变化的相继顺序,而不是负责光谱信号的种类的分布式存在的顺序是重要的。
再次参见图3,在阶段370中,共分布相关图提供了溶液中蛋白质群体分布(80%阈值)的扰动区域。
二维共分布光谱(“2DCDS”)分析可用于分析溶液中的蛋白质分子群体以及这些蛋白质的不同群体如何表现。Isao Noda,“Two-dimensional co-distributionspectroscopy to determine the sequential order of distributed presence ofspecies”,Journal of Molecular Structure,第1069卷,第54-56页吸引了技术人员的关注,该文献描述了适用于2DCDS分析的算法。
对于一套m时间依赖性光谱A(vj,tk)(在t1≤tk≤tm的观察间隔期间按顺序获得)与时间平均光谱
Figure BDA0003765628760000126
(由等式(2)给出),特性(时间)指数定义如下
Figure BDA0003765628760000127
此处使用的动态光谱
Figure BDA0003765628760000128
与等式(1)所定义的相同。在波数vj处观察到的光谱强度的分布的对应特性时间由下式给出
Figure BDA0003765628760000131
再次,应当理解,此处使用的时间意指所施加的扰动的代表性变量的一般性描述,因此它可以被任何其他适当的物理变量(诸如温度、浓度和压力)替换,这些物理变量的选择因实验条件而异。特性时间
Figure BDA0003765628760000132
是光谱强度的分布密度A(vj,tk)沿着由t1与tm之间的观察间隔限定的时间轴的第一时刻(关于时间轴的原点,即t=0)。它对应于随时间变化而分布的观察光谱强度的重心位置。
给出在两个不同的波数
Figure BDA0003765628760000133
Figure BDA0003765628760000134
下测定的光谱强度的时间分布的特性时间v1和v2,同步和异步共分布光谱的定义如下
Figure BDA0003765628760000135
Figure BDA0003765628760000136
其中T(v1,v2)是下式给出的总联合方差
Figure BDA0003765628760000137
同步共分布强度Γ(v1,v2)是两个单独光谱强度沿时间轴的分布的共存或叠加的度量。相比之下,异步共分布强度Δ(v1,v2)是两个光谱信号的分布差异的度量。术语“共分布”表示两个单独分布的比较,这将该度量与基于两个变化的比较的“相关性”概念区分开。
通过组合等式6、7和9,异步共分布光谱的表达式由下式给出
Figure BDA0003765628760000138
如果遇到
Figure BDA0003765628760000139
Figure BDA00037656287600001310
的条件,则将Δ(v1,v2)的值设定为零,这表示在任一波数处缺少光谱强度信号。同步共分布光谱可从以下关系式获得
Figure BDA00037656287600001311
在异步共分布光谱中,并且对于具有正号的交叉峰,即Δ(v1,v2)=0,与v2相比,v1处光谱强度的存在主要分布于沿时间轴的较早阶段。在另一个方面,如果Δ(v1,v2)<0,则顺序相反。就Δ(v1,v2)≈0而言,在时间过程中,在两个波数处观察的光谱强度的平均分布是相似的。同步共分布峰的符号总是正的,这在一定程度上将同步光谱的信息内容限制在分布图案的叠加程度的明显定性度量之外。
2DCDS能够以加权方式提供所研究的蛋白质聚集机制或任何过程的元素。2DCDS可用于直接提供沿扰动(例如,时间、温度、浓度、压力等)变量轴的种类的分布式存在的顺序。该技术在直接鉴定中间体种类的存在中可用作增强2DCOS分析的补充工具。根据一些实施方案,在观察间隔期间按顺序获得扰动依赖性光谱。2D相关光谱(同步光谱和异步光谱)来源于光谱变化。同步共分布强度以沿扰动轴的两个单独光谱强度分布的共存或叠加来测定。异步共分布强度以两个光谱信号的分布差异来测定。对于具有正号的交叉峰,即Δ(v1,v2)>0,与v2相比,v1处光谱强度的存在主要分布于沿时间轴的较早阶段。在另一个方面,如果Δ(v1,v2)<0,则顺序相反。就Δ(v1,v2)≈0而言,在时间过程中,两个波数处观察的光谱强度的平均分布是相似的。
2DCOS分析之间的差异提供了由于扰动过程及其对样品的影响而引起的途径的均值平均描述,而2DCDS分析提供了扰动过程期间分子(蛋白质)群体中的加权元素。2DCOS和2DCDS的结果是由于扰动而引起的光谱数据变化的元素的直接和简化描述。
根据一些实施方案,例如如图4所示,用于进行数据分析的系统可包括至少被示出用于执行本文所述的方法的功能的部件。获取的数据可以提供给一个或多个计算单元(包括处理器)以进行分析。模块可以提供用于执行数据分析或管理数据分析。此类模块可包括相关性分析模块、可视模型生成器模块和/或人机交互模块。模块可以彼此通信。在一些实施方案中,模块可以以软件(例如,子例程和代码)实现。例如,模块可以存储于存储器和/或数据存储器中,并由处理器执行。在一些方面,一些或所有模块可以以硬件(例如,专用集成电路(ASIC)、现场可编程门阵列(FPGA)、可编程逻辑器件(PLD)、控制器、状态机、门控逻辑、分立硬件部件或任何其他合适的装置)、固件、软件和/或它们的组合实现。根据主题技术的各方面的这些模块的另外特征和功能在本公开中进一步描述。
根据一些实施方案,例如如图5所示,可执行用于验证和准备所获取的数据的方法。识别和验证数据的类型。根据验证,可以转换和/或存储或拒绝数据,并向用户显示错误。
根据一些实施方案,例如如图6所示,可执行用于分析所获取的数据的方法。验证数据的类型以获得相对于阈值的足够信噪比。根据验证,数据可以进行分析或在分析之前执行平滑过滤过程。
根据一些实施方案,例如如图6所示,可以在操作中分析数据,这些操作包括应用基线相关、定位峰、计算数据窗口、计算相关性、计算共分布和/或计算扰动相关性。
数据操纵可以包括自动识别所关注区域(ROI),以区分颗粒和溶液。可以测定颗粒的大小和数量以确定颗粒的群体分布。可执行数据操作以确保合规性,诸如S/N比测定、基线校正、测定水蒸气含量以及测定所研究光谱区域内所关注元素的信号强度。用于统计分析的数据输出可以使用尤其是实验设计方法来简化。所关注元素的强度和光谱位置可以以逗号分隔文件(*.csv)输出。可以根据所关注的样品的扰动生成协变或动态光谱数据集,其输出可用于进一步分析。例如,数据输出可以以有助于与其他生物分析结果合并以进行可比性评估的格式提供,并且来源于:扰动类型、赋形剂、蛋白质治疗剂、蛋白质浓度、温度、获取日期和/或生物分析技术。该方法将允许对在类似条件下进行的所有实验进行统计分析。更重要的是,DOE分析的结果将是独立的文档,可用于最终报告并允许做出决策。
根据一些实施方案,本文所述的方法和系统可以将相关性函数应用于协变或动态光谱数据,以生成两个图(同步和异步),该算法称为2D IR相关光谱。光谱数据中彼此同相的变化(例如,峰强度)可以相关联,这些变化如在同步图中获得。可以确定光谱数据中发生变化的元素。可以确定光谱数据中的总体最大强度变化。可以确定光谱数据中的总体最小强度变化。可以确定宽谱带(诸如蛋白质和肽的酰胺谱带)中潜在光谱贡献的最小数量,以用于曲线拟合分析,该分析允许测定二级结构组成。可以增强所研究的光谱区域的分辨率,特别是对于光谱中的宽谱带而言。
彼此异相的光谱数据变化(例如,峰强度)可以与异步图中获得的关联。异步图还含有在分子细节上描述蛋白质行为的事件的顺序。可以对图进行详细评估以确定事件的顺序。替代地或组合地,该过程可以自动化。联合方差函数可以应用于协变或动态光谱数据,以生成合并异步图,该图可以被直接解释以确定事件的顺序。该方法可以替代地用于验证对蛋白质的分子行为的描述的上述解释,该描述是一个复杂的描述。用于曲线拟合例程的另外信息即用于曲线拟合例程的数字位置和强度信息的输入也可以是自动化的过程,该过程得到蛋白质的二级结构组成以及所分析的样品中蛋白质聚集种类的程度。来自2D IR相关图的强度信息可用于氧化产物(诸如脱氨基化)的定量测定。例如,可以根据侧链检测脱氨基化。这种分析可用于候选药物选择或用在蛋白质设计阶段期间。机器学习方法可以作为需要关联和解决的属性的复杂性的长期解决方案来实现。
根据一些实施方案,例如如图7所示,所获取的数据的分析可以分阶段进行,以提供在统计上有效并给出关于蛋白质聚集研究的大量信息的综合解决方案。根据一些实施方案,图7所示的过程可以表示图3所示的过程的应用。示出了QCL红外显微术的结果(图7的左上图),其中对于H→D(氢→氘)交换的全长IgG(150KDa),低温5℃下(具有较大的最大值)和高温90℃下(具有较小的最大值)的初始和最终QCL光谱在1700–1500cm-1的光谱区域中示出。观察到酰胺I’(1700-1600cm-1,主要是由于肽键羰基拉伸模式)和侧链(表1中定义的1600-1500cm-1)谱带中的差异。
表1:溶于D2O的作为内部探针的氨基酸
Figure BDA0003765628760000161
通过从所有后续光谱减去低温下的初始光谱,揭示了由于温度增加而引起的光谱变化(从而揭示了蛋白质行为的变化),这些变化称为协变光谱数据,但通常也称为差异光谱。然后将互相关函数应用于这些光谱变化,以确定所观察的峰之间的关系。生成两个图,即同步和异步图,它们提供了由于蛋白质样品的扰动而观察到的所得峰之间的相关性。这些图提供了丰富的分子信息和描述蛋白质行为的分子事件的相继顺序。含有自动峰(对角线上的峰)的同步图(图7的左下图)示出具有聚集峰。该图表示蛋白质中的最大强度变化,并且观察到具有较小强度变化的两个另外的自动峰。这些峰之间的关系根据交叉峰(非对角线峰)的观察确定,所述交叉峰为正或负,并且提供在对角线上观察到的不同自动峰之间的关系(即,由于减去初始光谱而得到的强度变化)。就该假设而言,所观察的关系引起聚集事件,所述聚集事件涉及蛋白质的螺旋二级结构,所述螺旋二级结构还通过该螺旋基序中存在酪氨酸残基来验证,因此作为蛋白质聚集过程的内部探针。所以,酪氨酸峰定义了蛋白质的正在聚集的区域。2DCOS分析提供了之前通过其他正交技术(诸如SEC、DSC和DLS)无法获得的有价值的详细分子信息。从QCL获得的结果具有高度可再现性,并且已经使用统计学进行了严格测试。QCL红外光谱区域具有高度选择性和灵敏度,因此允许同时研究蛋白质构象变化以及20个氨基酸侧链振动模式中的6个(参见表1)。
实施例1
对三种抗体药物缀合物片段进行可开发性和可比性评估(图8A-B)。该分析涉及总共47个实验。使用QCL显微镜进行43个DOE条件的图像获取,其中16个涉及在pH 6.6和T=24-30℃下溶于HEPES缓冲溶液的3个ADC片段(称为ADC0、ADC1和ADC2)的比较。据测定,ADC2在所研究的条件下无聚集体,而ADC1具有一些聚集体种类,但当加热至28℃时,聚集体返回溶液(图9A-B)。此外,ADC0候选物存在有聚集体种类,但随着温度升高,存在的聚集体种类增加。这些聚集体种类被确定为ADC0。使用2DCDS分析也发现了ADC1的类似结果(图10)。
另外,无聚集体ADC2的光谱分析在存在不同赋形剂(蔗糖和NaCl)的情况下在接近室温即T=24-26℃下进行(图11A-B)。通过选择不同的所关注区域(ROI)来确定分析的可再现性的附加值在QCL图(图11A)中以方框示出,对该图进行脱机光谱分析(图11B)。示出了1420-1520cm-1处的蔗糖赋形剂。还示出了酰胺I’和侧链谱带(1520–1700cm-1),从而证实了该技术的高灵敏度和选择性。另外的证据如图12A-C所示。从分析的角度来说,直接检测赋形剂和蛋白质治疗剂二者的能力对于生物制药行业具有很高的价值,因为它允许验证每种制剂中赋形剂的存在。HT-DCA平台将提供统计分析所需的准确性和可再现性,以及样品中的成分的高价值分子信息。
对使用QCL显微镜(QCL)在不同条件下开展的43个实验进行了全因子设计的516光谱和正态分布分析。QbD实验设置使得在存在不同量的NaCl、蔗糖和不同比例的两种赋形剂(即,NaCl和蔗糖)的情况下,分析了代表ADC2的评估的324个光谱数据。根据标准偏差,样品大小被确定为n=8-12。使用ADC2进行可开发性和可比性评估,以下是在26℃和28℃下以15%、30%和60%蔗糖获得的结果的汇总。对于不同浓度(325、350和400mM)的NaCl和不同比例的蔗糖和NaCl赋形剂,也获得类似的结果。通常,所得的结果是收敛的,p值大于0.8(图13)。在进行分布分析之后,使用逐步全模型拟合进行DOE统计评估,得到AIC和BIC模型(图14、图15),这些模型得到相同的结果,即18.5%蔗糖是ADC2的最佳赋形剂。
HT-DCA平台的QCL光谱分析能力提供了蛋白质治疗剂的进一步分子分析和稳定性测定。这种类型的分析含有大量信息,从而允许进行蛋白质治疗剂候选物的最佳设计。进行两种类型的相关性分析:2DCOS分析和2DCDS分析,它们提供了关于溶液中蛋白质治疗剂的行为的信息。
将2D IR相关图的概念分析应用于蛋白质的红外光谱。酰胺I’和侧链谱带较宽并且包括很多潜在贡献,无论它们是否像肽键内的羰基拉伸或侧链振动模式那样是构象敏感的,所述振动模式可提供其相邻环境和弱相互作用的信息。为了提取该信息,通过从所有后续光谱减去参考光谱来生成协变光谱。例如,在蛋白质热变性研究(温度扰动)中,低温下的初始光谱将用于扣减。所生成的协变光谱包括由于温度升高引起的强度变化。然后将相关函数应用于数据集,该相关函数以2个单独图表的形式将协变光谱中观察到的强度变化与增加的分辨率关联。这些图能够解析高度叠加的谱带,从而确立最灵活的蛋白质区域,破译蛋白质中的聚集机制并确立蛋白质-靶标相互作用。2D IR相关图称为同步和异步图。这些图本质上是对称的,并且出于解释目的,将参考每个图的上半部分。同步图在对角线上具有正峰,称为自动峰。自动峰含有对整个光谱数据集观察到的总体强度变化。可以鉴定变化的幅度并用于确定蛋白质区域由于扰动而可能具有的柔性或易感性。这些峰的位置和数量用于测定酰胺I’和侧链谱带的潜在光谱贡献(参见表2)。
表2:溶于含15%蔗糖的HEPES缓冲溶液的ADC2的谱带归属汇总
Figure BDA0003765628760000181
同步图也具有非对角线峰,称为交叉峰。这些交叉峰确定自动峰的关系。在同步图中观察到的交叉峰是由于彼此同相的强度变化所致。可以考虑强度递增变化的2个峰,反之亦然,这两个自动峰将具有表示它们的相互关系的伴随交叉峰(图16A-B)。
异步图不在对角线上包括峰,但仍提供增强的光谱分辨率。所得的交叉峰是由于峰的强度在协变光谱中变得彼此异相,因此提供了详细信息。其中,分子事件的相继顺序是由于热扰动所致。异步图中的交叉峰为正或负,并且可以确定相继顺序。通常,如果两个图中交叉峰的符号均为正,则保持异步图中定义的顺序。所以,正交叉峰意味着ν1在ν2之前发生。当且仅当同步图中的相同交叉峰也为正时,该解释才被指定为真。然而,当两个图中交叉峰的符号不同时,则顺序相反。
将此应用于图16A-B的图,发现异步图中(1652,1632)处的交叉峰为正。1652cm-11)峰在1632cm-12)之前扰动。分子解释是π-螺旋在蛋白质内的反平行β-折叠之前扰动(表2)。类似地,β-转角(铰链环,1670.3cm-1)在反平行β-折叠之前扰动。此外,这些图用于确定蔗糖在溶液中如何稳定ADC2。侧链与蔗糖之间的氢键键合稳定了β-转角(铰链环),因此也稳定了β-折叠。更重要的是,所关注的蛋白质片段中发生的分子变化如图17所示。
虽然温度扰动限于接近室温,但分析仍允许测定侧链与其水性环境和赋形剂(蔗糖)之间的氢键键合相互作用。另外,这些相互作用稳定了ADC2的二级结构。
据发现,2DCDS分析可用于评估蛋白质溶液的动力学和某一温度范围内的构象动力学分布,在目前的情况下,对于溶于HEPES缓冲液的ADC2和在存在15%蔗糖的情况下,该温度范围较小,仅为26-28℃(图18A-B)。与2D IR相关相比,异步共分布图的解释是直接明了的。不需要比较图之间的交叉峰符号。对于正交叉峰,可以确定ν1在ν2之前发生。此外,对于负交叉峰,可以确定ν2在ν1之前发生。
未观察到该蛋白质的聚集。参考异步图(图18B),对于溶液中的该蛋白质,观察到β-转角(也称为铰链环)(1660cm-1)与带负电的天冬氨酸(1553cm-1)和谷氨酸(1543cm-1)残基之间的相互依赖性。此结果与它们在ADC2的β-转角基序内的位置相符。2DCOS分析和2DCDS分析允许在分子水平上完整描述ADC2,以及蔗糖对ADC2的稳定作用(图16A-18B)。总之,ADC2中的主要稳定特征是铰链环被精氨酸与附近的天冬氨酸残基之间观察到的盐桥相互作用稳定。通过定点诱变引入的第二二硫桥防止了盐桥相互作用的破坏。通过包含蔗糖作为赋形剂的制剂条件实现了进一步稳定。具体地讲,15%蔗糖还通过与这些相同残基的氢键键合作用来提供稳定作用。
表3:曲线拟合结果的汇总,说明了26℃下ADC片段2的二级结构组成。
Figure BDA0003765628760000191
图19示出了与表3所示的结果对应的图。
实施例2
根据本文所述的方法对样品进行研究分析,这些样品包括溶于H2O的美国国家标准和技术研究所参考物质8671(National Institute of Standards&TechnologyReference Material 8671,RM8671)(批号14HB-D-002),即人源化IgG1κ单克隆抗体(NISTmAb)。将样品加入CaF2载玻片的杯子,以使用QCL显微镜获取数据。所施加的扰动是在24-60℃范围内的温度,温度间隔为4℃。使用4×倍物镜在4cm-1获取QCL IR光谱数据,每0.5cm-1编码数据并校正基线。
NIST mAb标准品是IgG1κ蛋白。抗体的重链(SEQ ID NO:5)和轻链(SEQ ID NO:6)的氨基酸序列在下文提供。
RM 8671重链氨基酸
Figure BDA0003765628760000201
RM 8671轻链
Figure BDA0003765628760000202
样品的氨基酸侧链归属提供于表4和表5中。
表4:溶于H2O的NIST mAb的重链氨基酸侧链的归属
Figure BDA0003765628760000211
表5:溶于H2O的NIST mAb的轻链氨基酸侧链的归属
Figure BDA0003765628760000212
如图20A所示,在H2O中在24-60℃的温度范围内获取在1750-1400cm-1的MID IR光谱区域中50mg/mL的NIST mAb的QCL光谱。图20A示出了重叠光谱,显示了酰胺I、II和III谱带。根据光谱数据生成同步(图20B)和异步(图20C)2D IR相关性分析图。在酰胺I谱带中观察到叠加H2O吸光度,而在酰胺II和III谱带中则未观察到,表明实现了足够用于分析的蛋白质浓度。根据本公开的实施方案,所施用的方法消除了用户对H2O的主观操纵或参比扣减的需要。
如图21A所示,在H2O中在24-60℃的温度范围内获取在1750-1500cm-1的MID IR光谱区域中50mg/mL的NIST mAb的QCL光谱。图21A示出了重叠光谱,显示了酰胺II和III谱带。根据光谱数据生成同步(图21B)和异步(图21C)图。建立了酰胺I与II谱带之间的相关性。通过使用异步图实现增强的分辨率。
以50mg/mL溶于H2O的NIST mAb的峰归属提供于表6中。
表6:以50mg/mL溶于H2O的NIST mAb的峰归属汇总
Figure BDA0003765628760000221
注:聚集(Agg)
图22示出了在24-60℃的温度范围内的热应力下以50mg/mL溶于H2O的NIST mAb的事件的相继顺序。由于1692cm-1β-转角的扰动,1635.5cm-1被指定为反平行β-折叠,两种振动模式都是最稳定的。另外,根据该项工作,1618cm-1已被分配给在60℃下热诱导的蛋白质聚集。1652cm-1可被分配给α-螺旋。
以50mg/mL溶于H2O的NIST mAb的事件的相继顺序提供于表7中。
表7:以50mg/mL溶于H2O的NIST mAb的事件的相继顺序汇总
Figure BDA0003765628760000231
注:聚集(Agg)
β-折叠和β-转角表现为糊合模式,表明存在反平行β-折叠
图23示出了在24-60℃的温度范围内的热应力下以50mg/mL溶于H2O的NIST mAb的异步2D IR共分布分析图。NIST mAb(50mg/mL)内的热应力,温度范围为24-60℃,光谱区域为1760–1380cm-1。该图提供了溶液中蛋白质群体的最常见响应。所以,就50mg/mL的NISTmAb而言,其热应力与谷氨酸以及Arg可能通过盐桥相互作用而发生的扰动有关。谷氨酸与His残基氢键键合,这些残基位于α-螺旋和β-折叠内。
图24A-D示出了自动化分析的实例,其提供了(A)重叠原始光谱数据、2D IR相关:(B)同步和(C)异步图、以及(D)共分布异步图之内的关系。垂直虚线根据同步图内的自动峰(图24B所示的对角线上的正峰)绝对强度值在自动化分析期间提供。
实施例3
根据本文所述的方法对样品进行研究分析,该样品包括溶于H2O的牛血清白蛋白(“BSA”)。将样品加入CaF2载玻片的杯子,以使用QCL显微镜获取数据。所施加的扰动是在24-60℃范围内的温度,温度间隔为4℃。使用4×倍物镜在4cm-1获取QCL光谱数据,每0.5cm-1编码数据并校正基线。
以下是所分析的BSA的氨基酸序列。
DTHKSEIAHRFKDLGEEHFKGLVLIAFSQYLQQCPFDEHVKLVNELTEFAKTCVADESHAGCEKSLHTLFGDELCKVASLRETYGDMADCCEKQEPERNECFLSHKDDSPDLPKLKPDPNTLCDEFKADEKKFWGKYLYEIARRHPYFYAPELLYYANKYNGVFQECCQAEDKGACLLPKIETMREKVLTSSARQRLRCASIQKFGERALKAWSVARLSQKFPKAEFVEVTKLVTDLTKVHKECCHGDLLECADDRADLAKYICDNQDTISSKLKECCDKPLLEKSHCIAEVEKDAIPENLPPLTADFAEDKDVCKNYQEAKDAFLGSFLYEYSRRHPEYAVSVLLRLAKEYEATLEECCAKDDPHACYSTVFDKLKHLVDEPQNLIKQNCDQFEKLGEYGFQNALIVRYTRKVPQVSTPTLVEVSRSLGKVGTRCCTKPESERMPCTEDYLSLILNRLCVLHEKTPVSEKVTKCCTESLVNRRPCFSALTPDETYVPKAFDEKLFTFHADICTLPDTEKQIKKQTALVELLKHKPKATEEQLKTVMENFVAFVDKCCAADDKEACFAVEGPKLVVSTQTALA(SEQ ID NO:7)
样品的氨基酸侧链的归属提供于表8中。
表8:溶于H2O的BSA的氨基酸侧链的归属
Figure BDA0003765628760000241
如图25A所示,在H2O中在24-60℃的温度范围内获取在1750-1500cm-1的MID IR光谱区域中40mg/mL的BSA的QCL光谱。图25A示出了重叠光谱,显示了酰胺I和II谱带。根据光谱数据生成同步(图25B)和异步(图25C)2D IR相关性分析图。建立了酰胺I与II谱带之间的相关性。通过使用异步图实现增强的分辨率。另外,同步图内的最高强度的自动峰是由于该球状蛋白质的螺旋扰动所致。此外,未观察到聚集。
40mg/mL的BSA的峰归属提供于表9中。
表9:40mg/mL的BSA的峰归属汇总
Figure BDA0003765628760000251
图26示出了在24-60℃的温度范围内的热应力下40mg/mL的BSA的事件的相继顺序。40mg/mL的BSA的事件的相继顺序还提供于表10中。
表10:40mg/mL的BSA的事件的相继顺序汇总
Figure BDA0003765628760000252
位于螺旋区域(1653.9cm-1)内、涉及与赖氨酸(1530.0和1525.5cm-1)的盐桥相互作用的天冬氨酸(1567cm-1)和谷氨酸(1584cm-1)首先扰动;然后是β-折叠(1629.6cm-1),然后扰动反平行β-折叠(1629.6cm-1)β-转角(1698cm-1)内的酪氨酸(1518cm-1)和组氨酸(1606.5cm-1)。最后在高温下扰动涉及位于β-转角(1684.0cm-1)附近的精氨酸与谷氨酸(1560cm-1)和天冬氨酸(1576.4cm-1)的盐桥相互作用。
图27示出了在24-60℃的温度范围内的热应力下和1750-1380cm-1的光谱区域内以40mg/mL溶于H2O的BSA的异步2D IR共分布分析图。就40mg/mL的BSA而言,其热应力与β-转角和螺旋区域内的谷氨酸的扰动有关。
实施例4
根据本文所述的方法对样品进行研究分析,该样品包括溶于H2O的NIST mAb和BSA混合物。将样品加入CaF2载玻片的杯子,以使用QCL显微镜获取数据。所施加的扰动是在24-60℃范围内的温度,温度间隔为4℃。使用4×倍物镜在4cm-1获取QCL光谱数据,每0.5cm-1编码数据并校正基线。
如图28A所示,在H2O中在24-60℃的温度范围内获取在1750-1500cm-1的光谱区域中的NIST mAb/BSA(1:2,摩尔比)混合物的QCL光谱。图28A示出了重叠光谱,显示了酰胺I和II谱带。根据光谱数据生成同步(图28B)和异步(图28C)2D IR相关性分析图。总体而言,同步图等位线显示出对于NIST mAb以及BSA纯组分均可区分的特征。
NIST mAb/BSA的峰归属提供于表11中。
表11:NIST mAb/BSA的峰归属汇总
Figure BDA0003765628760000261
注:聚集(Agg)
实施例5
根据本文所述的方法对样品进行研究分析,该样品包括溶于H2O的溶菌酶。将定制的CaF2载玻片杯子用于溶于H2O的样品,其光程长为7μm。所施加的扰动是在24-60℃范围内的温度,温度间隔为4℃。使用4×倍物镜在4cm-1获取QCL IR光谱数据,每0.5cm-1编码数据并校正基线。
以下是所分析的溶菌酶的氨基酸序列。
KVFGRCELAAAMKRHGLDNYRGYSLGNWVCAAKFESNFNTQATNRNTDGSTDYGILQINSRWWCNDGRTPGSRNLCNIPCSALLSSDITASVNCAKKIVSDGNGMNAWVAWRNRCKGTDVQAWIRGCRL(SEQ ID NO:8)
样品的氨基酸侧链的归属提供于表12中。
表12:溶于H2O的溶菌酶的氨基酸侧链的归属
Figure BDA0003765628760000271
如图29A所示,在H2O中在24-60℃的温度范围内获取在1750-1500cm-1的光谱区域600mg/mL的溶菌酶的QCL光谱。图29A示出了重叠光谱,显示了酰胺I和II谱带。根据光谱数据生成同步(图29B)和异步(图29C)2D IR相关性分析图。由于热应力可以建立蛋白质的螺旋区域与β-转角之间的相关性。另外,谷氨酸、天冬氨酸与精氨酸、赖氨酸、组氨酸残基之间的弱相互作用对于溶菌酶的稳定性是至关重要的,如在同步和异步图中观察到的相关性所确立。未观察到该蛋白质的聚集。
600mg/mL的溶菌酶的峰归属提供于表13中。
表13:600mg/mL的溶菌酶的峰归属汇总
Figure BDA0003765628760000281
图30示出了在24-60℃的温度范围内的热应力下600mg/mL的溶菌酶的事件的相继顺序。40mg/mL的BSA的事件的相继顺序还提供于表14中。
表14:600mg/mL的溶菌酶的事件的相继顺序汇总
Figure BDA0003765628760000282
酪氨酸(1514.6cm-1)和赖氨酸(1526.9cm-1)首先扰动,然后是精氨酸(1628.7cm-1),然后是β-折叠(1637.2cm-1),然后是β-折叠内的谷氨酸(1536.8cm-1),然后是位于螺旋区域(1647.0cm-1)和β-转角(1698.0cm-1和1683.8cm-1)内的谷氨酸(1556cm-1),然后是谷氨酸(1547.8cm-1),铰链环(1660.5cm-1),然后是天冬氨酸(1566.1,1672.3cm-1)以及位于N-末端附近可能通过氢键键合相互作用与天冬氨酸相互作用的单个组氨酸(1596.6cm-1),最后是均被分配给(1666.6cm-1)的Arg、Asn、Gln。未观察到聚集。
图31示出了在24-60℃的温度范围内的热应力下和1750-1500cm-1的光谱区域内以600mg/mL溶于H2O的溶菌酶的异步2D IR共分布分析图。就溶菌酶(600mg/mL)而言,其热应力与位于铰链环内的酪氨酸以及位于β-转角和螺旋区域附近或之处的赖氨酸和谷氨酸的扰动有关。
图32是框图,其示出了示例性计算机系统,通过该计算机系统可实现计算装置(例如,图4的计算装置)。在某些实施方案中,计算机系统1900可以使用在专用服务器中,或集成到另一个实体,或分布在多个实体上的硬件或软件和硬件的组合实现。
计算机系统1900包括总线1908或其他用于传递信息的通信机构,以及与总线1908耦合以用于处理信息的处理器1902。举例来说,计算机系统1900可以使用一个或多个处理器1902来实现。处理器1902可以是通用微处理器、微控制器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、可编程逻辑器件(PLD)、控制器、状态机、门控逻辑、分立硬件部件和/或可执行计算或其他信息操纵的任何其他合适的实体。
除硬件之外,计算机系统1900还可包括创建所讨论的计算机程序的执行环境的代码,例如构成处理器固件、协议堆栈、数据库管理系统、操作系统或它们中的一者或多者的组合的代码,所述代码存储于所包括的存储器1904中,诸如随机存取存储器(RAM)、快闪存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除PROM(EPROM)、寄存器、硬盘、可移动磁盘、CD-ROM、DVD和/或任何其他合适的存储装置,所述存储器耦合至总线1908,用于存储信息和由处理器1902执行的指令。处理器1902和存储器1904可以由专用逻辑电路补充或并入专用逻辑电路。
指令可以存储于存储器1904中并且以一种或多种计算机程序产品实现,即在计算机可读介质上编码的,根据本领域的技术人员熟知的任何方法,由计算机系统1900执行,或控制计算机系统的操作的计算机程序指令的一个或多个模块,包括但不限于计算机语言,诸如面向数据语言(例如,SQL、dBase)、系统语言(例如,C、Objective-C、C++、汇编语言)、架构语言(例如,Java、.NET)和/或应用程序语言(例如,PHP、Ruby、Perl、Python)。指令也可以以计算机语言实现,诸如数组语言、面向方面语言、汇编语言、创作语言、命令行界面语言、编译语言、并发语言、大括号语言、数据流语言、数据结构语言、声明式语言、深奥语言、扩展语言、第四代语言、函数式语言、交互模式语言、解释语言、迭代语言、基于列表的语言、小语言、基于逻辑的语言、机器语言、宏语言、元编程语言、多范式语言、数值分析、非基于英语的语言、面向对象的基于类语言、面向对象的基于原型的语言、越位规则语言、过程语言、反射语言、基于规则的语言、脚本语言、基于堆栈的语言、同步语言、语法处理语言、可视语言、wirth语言和/或基于xml的语言。存储器1904也可以用于在处理器1902执行的指令执行期间存储临时变量或其他中间信息。
本文讨论的计算机程序不一定对应于文件系统中的文件。程序可以存储在文件的保持其他程序或数据的一部分(例如,存储于标记语言文档中的一个或多个脚本)中、专用于所讨论的程序的单个文件中、或多个协调文件中(例如,存储一个或多个模块、子程序、或代码的多个部分的文件)。可以将计算机程序部署为在一个计算机上或在多个计算机上执行,所述计算机位于一个站点或分布在多个站点并且通过通信网络互连。本说明书中描述的过程和逻辑流可以由一个或多个可编程处理器执行,所述可编程处理器执行一个或多个计算机程序,以通过对输入数据进行操作并生成输出来执行多种功能。
计算机系统1900还包括数据存储装置1906,诸如磁盘或光盘,该数据存储装置耦合至总线1908,以用于存储信息和指令。计算机系统1900可以经由输入/输出模块1910耦合至多个装置(例如,装置1914和1916)。输入/输出模块1910可以是任何输入/输出模块。示例性输入/输出模块1910包括数据端口(例如,USB端口)、音频端口和/或视频端口。在一些实施方案中,输入/输出模块1910包括通信模块。示例性通信模块包括网络接口卡,诸如以太网卡、调制解调器和路由器。在某些方面,输入/输出模块1910被配置为连接至多个装置,诸如输入装置1914和/或输出装置1916。示例性输入装置1914包括键盘和/或指向装置(例如,鼠标或轨迹球),用户可以通过所述键盘和/或指向装置向计算机系统1900提供输入。其他类型的输入装置1914也可用于提供与用户的交互,诸如触觉输入装置、视觉输入装置、音频输入装置和/或脑-机接口装置。例如,提供给用户的反馈可以是任何形式的感官反馈(例如,视觉反馈、听觉反馈和/或触觉反馈),并且来自用户的输入可以以任何形式接收,包括声学、语音、触觉和/或脑电波输入。示例性输出装置1916包括用于向用户显示信息的显示装置,诸如阴极射线管(CRT)或液晶显示(LCD)监视器。
根据某些实施方案,客户端装置和/或服务器可以使用响应于处理器1902的计算机系统1900实现,所述处理器执行包含在存储器1904中的一个或多个指令的一个或多个序列。此类指令可以从另一个机器可读介质(诸如数据存储装置1906)读入存储器1904。包含在存储器1904中的指令序列的执行使处理器1902执行本文所述的过程步骤。多处理布置方式中的一个或多个处理器也可以用于执行包含在存储器1904中的指令序列。在一些实施方案中,硬连线电路可用于代替软件指令或与软件指令组合,以实现本公开的各方面。因此,本公开的多个方面不限于硬件电路和软件的任何特定组合。
本说明书中描述的主题的各方面可以在包括后端部件(例如,数据服务器)、或包括中间件部件(例如,应用程序服务器)、或包括前端部件(例如,具有图形用户界面和/或Web浏览器的客户端计算机,用户可通过所述图形用户界面和/或Web浏览器与本说明书中描述的主题的实现方式进行交互)或一个或多个此类后端、中间件或前端部件的任何组合的计算系统中实现。系统1900的多个部件可以通过任何形式或介质的数字数据通信(例如,通信网络)互连。通信网络的实例包括局域网和广域网。
本文使用的术语“机器可读储存介质”或“计算机可读介质”是指参与向处理器1902提供指令以供执行的任一种或多种介质。这种介质可采用许多形式,包括但不限于非易失性介质、易失性介质和传输介质。非易失性介质包括例如光盘或磁盘,诸如数据存储装置1906。易失性介质包括动态存储器,诸如存储器1904。传输介质包括同轴电缆、铜线和光纤,包括构成总线1908的导线。常见形式的机器可读介质包括例如软盘、伸缩盘、硬盘、磁带、任何其他磁介质、CD-ROM、DVD、任何其他光学介质、打孔卡、纸带、任何其他具有孔图案的物理介质、RAM、PROM、EPROM、FLASH EPROM、任何其他存储器芯片或磁带盒或任何其他计算机可读取的介质。机器可读储存介质可以是机器可读存储装置、机器可读储存衬底、存储装置、产生机器可读传播信号的物质组合物或它们中的一者或多者的组合。
如本文所用,“处理器”可包括一个或多个处理器,并且“模块”可包括一个或多个模块。
在主题技术的一个方面,机器可读介质是用指令编码或存储有指令的计算机可读介质并且是计算元件,其定义指令与系统其余部分之间的结构和功能关系,从而允许实现指令的功能。指令可以是可执行的,例如通过系统或通过系统的处理器执行。指令可以是例如包括代码的计算机程序。机器可读介质可包括一种或多种介质。
如本文所用,词语“模块”是指以硬件或固件实现的逻辑,或指以编程语言例如C++编写的、可能具有入口和出口点的软件指令的集合。软件模块可以编译并链接到可执行程序,安装在动态链接库中,或可以以解释语言诸如BASIC编写。应当理解,软件模块可以从其他模块或从它们自身调用,和/或可以响应于检测到的事件或中断而被调用。软件指令可以嵌入固件中,诸如EPROM或EEPROM。还应当理解,硬件模块可以包括连接的逻辑单元,诸如门和触发器,和/或可以包括可编程单元,诸如可编程门阵列或处理器。本文所述的模块优选地以软件模块实现,但可以以硬件或固件表示。
预期多个模块可以集成到较少的模块中。一个模块也可以分成多个模块。所描述的模块可以以硬件、软件、固件或它们的任何组合实现。另外,所描述的模块可以驻留在通过有线或无线网络或因特网连接的不同位置。
通常,应当理解,处理器可包括例如计算机、程序逻辑或表示数据和指令的其他衬底配置,它们如本文所述进行操作。在其他实施方案中,处理器可包括控制器电路、处理器电路、处理器、通用单芯片或多芯片微处理器、数字信号处理器、嵌入式微处理器、微控制器等等。
此外,应当理解,在一个实施方案中,程序逻辑可以有利地以一个或多个部件实现。这些部件可以有利地被配置为在一个或多个处理器上执行。这些部件包括但不限于软件或硬件部件、模块(诸如软件模块)、面向对象的软件部件、类部件和任务部件、过程方法、功能、属性、程序、子例程、程序代码段、驱动器、固件、微代码、电路、数据、数据库、数据结构、表、数组和变量。
提供以上描述是为了使本领域的技术人员能够实践本文所述的各种配置。虽然已经参考多个附图和配置具体描述了主题技术,但是应当理解,这些仅出于说明目的,而不应被视为限制主题技术的范围。
可能有很多其他方式来实现主题技术。在不脱离主题技术的范围的情况下,本文所述的各种功能和要素可以与所示的那些不同地区分。对这些配置的各种修改对于本领域的技术人员将是显而易见的,并且本文定义的一般原理可应用于其他配置。因此,在不脱离主题技术的范围的情况下,本领域的普通技术人员可对主题技术进行许多改变和修改。
应当理解,所公开的过程中的步骤的特定顺序或层次是示例性方法的说明。根据设计偏好,可以理解,过程中的步骤的特定顺序或层次可以重新排列。一些步骤可以同时进行。所附方法权利要求以作为例子的顺序呈现多个步骤的要素,并且不意味着限于所呈现的特定顺序或层次。
如本文所用,在一系列项目之前的短语“至少一个”,以及分隔任何项目的术语“和”或“或”作为整体修饰列表,而不是该列表的每个成员(即,每个项目)。短语“至少一个”不需要选择所列的每种项目中的至少一个;相反,该短语所允许的含义包括:任一种项目中的至少一个,和/或项目的任何组合中的至少一个,和/或每种项目中的至少一个。举例来说,短语“A、B和C中的至少一个”或“A、B或C中的至少一个”各指仅A、仅B或仅C;A、B和C的任意组合;和/或A、B和C每一者中的至少一个。
本公开所用的术语诸如“顶部”、“底部”、“前”、“后”等等应理解为是指任意参照系,而不是指普通重力参照系。因此,顶部表面、底部表面、前表面和后表面可以在重力参照系中向上、向下、对角或水平延伸。
此外,至于在说明书或权利要求中使用术语“包括”、“具有”等,如同在权利要求中采用“包含”作为过渡词时所作的解释,这种术语旨在以类似于术语“包含”的方式为包容性的。
本文所用的词语“示例性”意指“用作实例、示例或说明”。本文描述为“示例性”的任何实施方案不必解释为比其他实施方案优选或有利。
除非特别说明,否则对单数元件的引用并不旨在意指“一个且仅一个”,而是“一个或多个”。男性代词(例如,他的)包括女性和中性(例如,她的和它的),反之亦然。术语“一些”是指一个或多个。加下划线和/或斜体的标题和副标题仅为了方便而使用,并非对主题技术做出限制,也并非与解释主题技术的描述产生关联。本领域的普通技术人员已知的或随后已知的整个本公开中描述的各种配置的要素的所有结构和功能等同物明确地以引用的方式并入本文并且旨在由主题技术涵盖。此外,本文的公开内容无意奉献给公众,无论该公开内容是否在上文的描述中明确地陈述。
虽然描述了主题技术的某些方面和实施方案,但是这些方面和实施方案仅以举例方式呈现,而无意限制主题技术的范围。实际上,本文所述的新方法和系统可以以多种其他形式实施,而不脱离其精神。所附权利要求及其等同物旨在涵盖落入主题技术的范围和精神内的此类形式或修改。
实施方案
1.一种用于处理表示蛋白质、肽和/或类肽的特性的数据的方法,所述方法包括:
获得关于所施加的扰动的所述蛋白质、肽和/或类肽的光谱数据;
应用二维共分布(2DCDS)分析,以生成所述蛋白质、肽和/或类肽的异步共分布图;
在所述异步共分布图中鉴定与所述蛋白质、肽和/或类肽的聚集相关的自动峰有关的交叉峰;以及
使用所述交叉峰确定关于所施加的扰动的光谱强度的分布式存在的顺序。
2.根据条款1所述的方法,其中使用所述交叉峰包括:
对于两个波数v1和v2,确定对应于所述两个波数的所述交叉峰是否具有正值;并且
当所述交叉峰具有正值时,确定v1处存在的光谱强度分布在所施加的扰动的一定间隔内,所述间隔小于其中v2处存在的光谱强度所分布的间隔。
3.根据条款1所述的方法,其中使用所述交叉峰包括:
对于两个波数v1和v2,确定对应于所述两个波数的所述交叉峰是否具有负值;并且
当所述交叉峰具有负值时,确定v2处存在的光谱强度分布在所施加的扰动的一定间隔内,所述间隔小于其中v1处存在的光谱强度所分布的间隔。
4.根据条款1所述的方法,其中所述光谱数据是FT-IR光谱数据。
5.根据条款1所述的方法,其中所述异步共分布图中的异步共分布强度被表示为两个光谱信号的分布差异。
6.根据条款1所述的方法,其中所施加的扰动是时间、温度、浓度或压力。
7.根据条款1所述的方法,还包括:
应用所述二维共分布(2DCDS)分析,以生成所述蛋白质、肽和/或类肽的同步共分布图;
在所述同步共分布图中鉴定与所述蛋白质、肽和/或类肽的聚集相关的同步共分布峰;以及
使用所述同步共分布峰确定关于所施加的扰动的光谱强度的分布图案的叠加程度。
8.根据条款1所述的方法,其中使用同步共分布峰包括:对于两个波数v1和v2,确定对应于所述两个波数的所述同步共分布峰是否在一定范围内。
9.根据条款1所述的方法,还包括:
应用二维相关(2DCOS)分析,以生成所述蛋白质、肽和/或类肽的同步相关图和异步相关图;
在所述同步相关图中,鉴定与所述蛋白质、肽和/或类肽的聚集相关的自动峰有关的正交叉峰;以及
使用所述光谱数据的所鉴定的峰强度来确定所述蛋白质、肽和/或类肽的聚集量。
10.根据条款9所述的方法,还包括将所述蛋白质、肽和/或类肽的聚集量与关于所施加的扰动的光谱强度的分布式存在的顺序进行比较。
11.根据条款1所述的方法,其中获得所述光谱数据包括对含有所述蛋白质、肽和/或类肽的样品执行QCL红外光谱分析。
12.根据条款1所述的方法,还包括识别所关注区域,以区分颗粒和溶液。
13.根据条款1所述的方法,还包括测定颗粒的大小和数量,以确定所述颗粒的群体分布。
14.根据条款1所述的方法,还包括分析所述光谱数据以验证信噪比、进行基线校正、测定水蒸气含量和/或测定光谱区域内的信号强度。
15.根据条款1所述的方法,还包括根据样品的扰动生成协变或动态光谱数据。
16.根据条款1所述的方法,还包括将所述光谱数据中的彼此同相的变化相关联,所述变化包括峰强度,如在所述同步图中获得的。
17.根据条款1所述的方法,还包括确定所述光谱数据中发生变化的元素。
18.根据条款1所述的方法,还包括确定所述光谱数据中的总体最大强度变化。
19.根据条款1所述的方法,还包括确定所述光谱数据中的总体最小强度变化。
20.根据条款1所述的方法,还包括确定谱带中潜在光谱贡献的最小数量,进行曲线拟合分析,以及测定样品的二级结构组成。
21.根据条款1所述的方法,还包括增强所述光谱数据的分辨率。
22.根据条款1所述的方法,还包括将所述光谱数据中的彼此异相的变化相关联,所述变化包括峰强度,如在所述异步图中获得的。
23.根据条款1至22中任一项所述的方法,还包括确定所述蛋白质、肽和/或类肽中氨基酸侧链的脱氨基化的存在和/或程度。
24.根据条款1至23中任一项所述的方法,还包括确定所述蛋白质、肽和/或类肽中域的稳定性。
25.一种用于处理表示蛋白质、肽和/或类肽的特性的数据的系统,所述系统包括:
数据获取模块,所述数据获取模块被配置为获得关于所施加的扰动的所述蛋白质、肽和/或类肽的光谱数据;以及
相关性分析模块,所述相关性分析模块被配置为:
应用二维共分布(2DCDS)分析,以生成所述蛋白质、肽和/或类肽的异步共分布图;
在所述异步共分布图中鉴定与所述蛋白质、肽和/或类肽的聚集相关的自动峰有关的交叉峰;以及
使用所述交叉峰确定关于所施加的扰动的光谱强度的分布式存在的顺序。
26.根据条款25所述的系统,还包括可视模型生成器,所述可视模型生成器用于生成一个或多个用于显示的图。
27.根据条款25所述的系统,还包括人机交互模块,所述人机交互模块包括人机接口。
28.根据条款25所述的系统,其中所述数据获取模块包括量子级联激光显微镜。
29.一种包括指令的非瞬时计算机可读介质,所述指令在被一个或多个计算机执行时,使得所述一个或多个计算机:
获得关于所施加的扰动的所述蛋白质、肽和/或类肽的光谱数据;
应用二维共分布(2DCDS)分析,以生成所述蛋白质、肽和/或类肽的异步共分布图;
在所述异步共分布图中鉴定与所述蛋白质、肽和/或类肽的聚集相关的自动峰有关的交叉峰;以及
使用所述交叉峰确定关于所施加的扰动的光谱强度的分布式存在的顺序。

Claims (29)

1.一种用于测定样品中蛋白质、肽和/或类肽的聚集程度的方法,所述方法包括:
向溶液中的蛋白质、肽和/或类肽施加受控的扰动;
使用拉曼光谱仪按顺序获得所述溶液中的蛋白质、肽和/或类肽的光谱图像,而不用外源探针或添加剂,按顺序获得的光谱图像捕获诱导的光谱强度随着所施加的扰动的改变;
在所获得的光谱图像的至少一个中鉴定和选择关于所施加的扰动的所关注的区域;
选择和分析多个按顺序获得的光谱图像中的所关注的区域的光谱数据,包括所述溶液中的蛋白质、肽和/或类肽中的氨基酸侧链的数据,其中分析所述光谱数据包括分析蛋白质、肽和/或类肽的侧链模式作为内部探针;
应用二维共分布分析以生成蛋白质、肽和/或类肽的异步共分布图;
在所述异步共分布图中鉴定与蛋白质、肽和/或类肽的聚集相关的至少一个交叉峰;和
使用所述至少一个交叉峰测定聚集的程度。
2.权利要求1的方法,进一步包括基于聚集的程度与关于所施加的扰动的光谱强度的分布式存在的顺序的比较测定所述聚集的机制,其中基于所述异步共分布图中的各交叉峰处的光谱强度的符号确定所述顺序。
3.权利要求2的方法,其中使用所述交叉峰包括:
对于两个波数v1和v2,确定对应于所述两个波数的所述交叉峰是否具有正值;并且
当所述交叉峰具有正值时,确定v1处存在的光谱强度分布在所施加的扰动的一定间隔内,所述间隔小于其中v2处存在的光谱强度所分布的间隔。
4.权利要求2或3的方法,其中使用所述交叉峰包括:
对于两个波数v1和v2,确定对应于所述两个波数的所述交叉峰是否具有负值;并且
当所述交叉峰具有负值时,确定v2处存在的光谱强度分布在所施加的扰动的一定间隔内,所述间隔小于其中v1处存在的光谱强度所分布的间隔。
5.权利要求1-3任一项的方法,其中所述蛋白质、肽和/或类肽在水溶液中。
6.权利要求1的方法,其中所施加的扰动是一温度范围的温度改变。
7.权利要求1的方法,其中所述异步共分布图中的异步共分布强度被表示为两个光谱信号的分布差异。
8.权利要求1的方法,其中所施加的扰动是时间、温度、浓度、电势、化学品、搅拌、氧化、声学扰动或压力。
9.权利要求1的方法,进一步包括:
应用所述二维共分布分析,以生成所述蛋白质、肽和/或类肽的同步共分布图;
在所述同步共分布图中鉴定与所述蛋白质、肽和/或类肽的聚集相关的同步共分布峰;以及
使用所述同步共分布峰确定关于所施加的扰动的光谱强度的分布图案的叠加程度。
10.权利要求1的方法,其中使用同步共分布峰包括:对于两个波数v1和v2,确定对应于所述两个波数的所述同步共分布峰是否在一定范围内。
11.权利要求1的方法,进一步包括:
应用二维相关分析,生成所述蛋白质、肽和/或类肽的同步相关图和异步相关图;
在所述同步相关图中,鉴定与所述蛋白质、肽和/或类肽的聚集相关的对角线上自动峰有关的正对角外交叉峰;以及
使用所述光谱数据的所鉴定的峰强度来确定所述蛋白质、肽和/或类肽的聚集量。
12.权利要求11的方法,进一步包括将所述蛋白质、肽和/或类肽的聚集量与关于所施加的扰动的光谱强度的分布式存在的顺序进行比较。
13.权利要求1的方法,进一步包括测定颗粒的大小和数量,以确定所述颗粒的群体分布。
14.权利要求1的方法,进一步包括分析所述光谱数据以验证信噪比、进行基线校正、测定水蒸气含量和/或测定光谱区域内的信号强度。
15.权利要求1的方法,进一步包括根据样品的扰动生成协变或动态光谱数据。
16.权利要求11的方法,进一步包括将所述光谱数据中的彼此同相的变化相关联,所述变化包括峰强度,如在所述同步相关图中获得的。
17.权利要求1的方法,进一步包括确定所述光谱数据中发生变化的元素。
18.权利要求1的方法,进一步包括确定所述光谱数据中的总体最大强度变化。
19.权利要求1的方法,进一步包括确定所述光谱数据中的总体最小强度变化。
20.权利要求1的方法,进一步包括确定谱带中潜在光谱贡献的最小数量,进行曲线拟合分析,以及测定样品的二级结构组成。
21.权利要求1的方法,进一步包括增强所述光谱数据的分辨率。
22.权利要求11的方法,进一步包括将所述光谱数据中的彼此异相的变化相关联,所述变化包括峰强度,如在所述异步相关图中获得的。
23.权利要求11或12的方法,进一步包括确定所述蛋白质、肽和/或类肽中氨基酸侧链的脱氨基化的存在和/或程度。
24.权利要求1-3任一项的方法,进一步包括确定所述蛋白质、肽和/或类肽中域的稳定性。
25.一种用于测定蛋白质、肽和/或类肽的聚集程度的系统,所述系统包含数据获取模块和一个或多个处理器,其配置为实施权利要求1-24任一项的方法。
26.权利要求25的系统,进一步包含可视模型生成器,所述可视模型生成器用于生成一个或多个用于显示的图。
27.权利要求25的系统,进一步包含人机交互模块,所述人机交互模块包含人机接口。
28.权利要求25的系统,其中所述数据获取模块包含拉曼光谱仪。
29.一种包括指令的非瞬时计算机可读介质,所述指令在被一个或多个计算机执行时,使得所述一个或多个计算机实施权利要求1-24任一项的方法。
CN202210885211.2A 2016-01-21 2017-01-20 用于光谱数据分析的方法和系统 Pending CN115308145A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201662281630P 2016-01-21 2016-01-21
US62/281,630 2016-01-21
PCT/US2017/014338 WO2017127679A1 (en) 2016-01-21 2017-01-20 Method and system for spectral data analysis
CN201780017216.0A CN108780473B (zh) 2016-01-21 2017-01-20 用于光谱数据分析的方法和系统

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201780017216.0A Division CN108780473B (zh) 2016-01-21 2017-01-20 用于光谱数据分析的方法和系统

Publications (1)

Publication Number Publication Date
CN115308145A true CN115308145A (zh) 2022-11-08

Family

ID=57985058

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202210885211.2A Pending CN115308145A (zh) 2016-01-21 2017-01-20 用于光谱数据分析的方法和系统
CN201780017216.0A Active CN108780473B (zh) 2016-01-21 2017-01-20 用于光谱数据分析的方法和系统

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201780017216.0A Active CN108780473B (zh) 2016-01-21 2017-01-20 用于光谱数据分析的方法和系统

Country Status (13)

Country Link
US (3) US10854313B2 (zh)
EP (1) EP3405898A1 (zh)
JP (3) JP7426193B2 (zh)
KR (1) KR20180118630A (zh)
CN (2) CN115308145A (zh)
AU (2) AU2017210338B2 (zh)
BR (1) BR112018014870A2 (zh)
CA (1) CA3011719A1 (zh)
HK (1) HK1263392A1 (zh)
IL (1) IL260574B1 (zh)
MX (1) MX2018008743A (zh)
RU (1) RU2764200C2 (zh)
WO (1) WO2017127679A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102592843B1 (ko) * 2017-06-12 2023-10-20 프로틴 다이나믹 솔루션즈 인크. 결정 및 결정화의 분석을 위한 방법 및 시스템
GB201809403D0 (en) 2018-06-07 2018-07-25 Univ Strathclyde Method
US20210391030A1 (en) * 2018-10-24 2021-12-16 Protein Dynamic Solutions, Inc. System and method for determining deamidation and immunogenicity of polypeptides
CN110364224B (zh) * 2018-12-29 2021-06-08 上海北昂医药科技股份有限公司 一种染色体分裂相定位排序方法
CN111178209B (zh) * 2019-12-20 2021-04-20 凯思轩达医疗科技无锡有限公司 核磁共振交互处理方法、装置及核磁共振交互系统
CN112730410A (zh) * 2020-12-25 2021-04-30 上海海洋大学 一种光谱法快速分辨海鲜的方法
CN114002179B (zh) * 2021-12-15 2023-07-28 山东大学 基于红外光谱表征乙醇保护蛋白质机制的方法及其应用
CN114170444B (zh) * 2022-02-10 2022-05-17 南通海扬食品有限公司 一种基于人工智能与高光谱成像的红枣品种鉴别方法
CN117132504B (zh) * 2023-10-20 2024-01-30 武汉怡特环保科技有限公司 基于单光子光谱计数技术成像去除干扰的方法
CN117629967B (zh) * 2024-01-26 2024-03-29 江苏省南京环境监测中心 基于光谱分析的土壤土层污染快速检测方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7858390B2 (en) * 2006-03-31 2010-12-28 Biodesix, Inc. Selection of colorectal cancer patients for treatment with drugs targeting EGFR pathway
US8268628B1 (en) * 2007-04-13 2012-09-18 University Of Puerto Rico Method for determination of protein, peptide or peptoid aggregation, stability, and viability and system using the same
WO2009075702A2 (en) * 2007-09-07 2009-06-18 Massachusetts Institute Of Technology Two-dimensional fourier transform spectrometer
US8017910B2 (en) * 2008-10-20 2011-09-13 Nalco Company Method for predicting hydrocarbon process stream stability using near infrared spectra
US20100286927A1 (en) * 2009-05-06 2010-11-11 Agilent Technologies, Inc. Data Dependent Acquisition System for Mass Spectrometry and Methods of Use
CN102869982B (zh) 2010-03-01 2014-04-30 奥林巴斯株式会社 光学分析装置、光学分析方法
WO2012005953A1 (en) * 2010-06-28 2012-01-12 The Regents Of The University Of California Adaptive set discrimination procedure
KR20120002129A (ko) 2010-06-30 2012-01-05 한미홀딩스 주식회사 면역글로불린 단편을 이용한 제7인자(Factor Ⅶa)약물 결합체
MX341795B (es) * 2010-11-05 2016-09-02 Hoffmann La Roche Impresion dactilar espectroscopica de materia prima.
EP2640844B1 (en) 2010-11-16 2021-03-24 1087 Systems, Inc. System for identifying and sorting living cells
US8697129B2 (en) * 2011-03-02 2014-04-15 Imra America, Inc. Stable colloidal gold nanoparticles with controllable surface modification and functionalization
JPWO2012165400A1 (ja) * 2011-06-03 2015-02-23 株式会社日立ハイテクノロジーズ 生体ポリマーの光学的解析装置及び方法
US9585558B2 (en) 2011-12-09 2017-03-07 Regents Of The University Of Minnesota Hyperspectral imaging for early detection of Alzheimer'S Disease
CN103968946B (zh) * 2014-05-19 2016-01-13 中国人民解放军第二军医大学 一种表面增强拉曼二维相关光谱的采集方法
US9702810B1 (en) 2014-09-22 2017-07-11 University Of Puerto Rico Dual cell holder system
CN104316491B (zh) * 2014-11-12 2017-01-18 天津农学院 基于同步‑异步二维近红外相关谱检测牛奶掺尿素的方法
CN205091263U (zh) * 2015-07-01 2016-03-16 上海睿钰生物科技有限公司 一种荧光显微成像装置
MX2018012850A (es) 2016-04-22 2019-11-28 Protein Dynamic Solutions Inc Dispositivos de arreglo de muestreo y sistema para análisis de espectro.

Also Published As

Publication number Publication date
JP2022153388A (ja) 2022-10-12
CN108780473B (zh) 2022-08-16
US10854313B2 (en) 2020-12-01
AU2017210338A1 (en) 2018-08-02
BR112018014870A2 (pt) 2018-12-11
US20200372969A1 (en) 2020-11-26
CN108780473A (zh) 2018-11-09
RU2018129642A3 (zh) 2020-05-26
RU2764200C2 (ru) 2022-01-14
US11626188B2 (en) 2023-04-11
CA3011719A1 (en) 2017-07-27
JP7426193B2 (ja) 2024-02-01
IL260574A (zh) 2018-09-20
EP3405898A1 (en) 2018-11-28
AU2021261873A1 (en) 2021-12-16
MX2018008743A (es) 2019-01-30
US20190057184A1 (en) 2019-02-21
RU2018129642A (ru) 2020-02-21
HK1263392A1 (zh) 2020-06-19
IL260574B1 (en) 2024-06-01
JP2019512096A (ja) 2019-05-09
AU2021261873B2 (en) 2023-11-23
AU2017210338B2 (en) 2021-08-05
JP2024037782A (ja) 2024-03-19
US20190272888A1 (en) 2019-09-05
WO2017127679A1 (en) 2017-07-27
KR20180118630A (ko) 2018-10-31
US10714209B2 (en) 2020-07-14

Similar Documents

Publication Publication Date Title
CN108780473B (zh) 用于光谱数据分析的方法和系统
Keiderling Structure of condensed phase peptides: insights from vibrational circular dichroism and Raman optical activity techniques
Feng et al. Refinement of Peptide Conformational Ensembles by 2D IR Spectroscopy: Application to Ala‒Ala‒Ala
US20240019360A1 (en) Method and system for analyst of crystals and crystallization
Polasky et al. An Algorithm for Building Multi-State Classifiers Based on Collision-Induced Unfolding Data
De Meutter et al. Protein structural denaturation evaluated by MCR-ALS of protein microarray FTIR spectra
US20210391030A1 (en) System and method for determining deamidation and immunogenicity of polypeptides

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination