CN114929887A - 单个多肽测序和重建的方法 - Google Patents

单个多肽测序和重建的方法 Download PDF

Info

Publication number
CN114929887A
CN114929887A CN202080090914.5A CN202080090914A CN114929887A CN 114929887 A CN114929887 A CN 114929887A CN 202080090914 A CN202080090914 A CN 202080090914A CN 114929887 A CN114929887 A CN 114929887A
Authority
CN
China
Prior art keywords
polypeptide
amino acid
molecules
polypeptides
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080090914.5A
Other languages
English (en)
Inventor
马修·戴尔
布莱恩·瑞德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quantum Si Inc
Original Assignee
Quantum Si Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quantum Si Inc filed Critical Quantum Si Inc
Publication of CN114929887A publication Critical patent/CN114929887A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6818Sequencing of polypeptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/34Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving hydrolase
    • C12Q1/37Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving hydrolase involving peptidase or proteinase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/543Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
    • G01N33/54366Apparatus specially adapted for solid-phase testing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6842Proteomic analysis of subsets of protein mixtures with reduced complexity, e.g. membrane proteins, phosphoproteins, organelle proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/205Aptamer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2570/00Omics, e.g. proteomics, glycomics or lipidomics; Methods of analysis focusing on the entire complement of classes of biological molecules or subsets thereof, i.e. focusing on proteomes, glycomes or lipidomes

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

单个多肽测序的方法。所述方法包括提供包含多肽群的富集样品;将富集样品分成两个或更多个子样品;使至少两个子样品各自与不同的修饰剂接触,其中所述修饰剂包括裂解剂,例如外肽酶,从而产生具有裂解模式组合的多肽片段;并对所述多肽片段进行并行测序,从而确定所述多肽片段的氨基酸序列。可以对片段进行比对以重建多肽序列。本文还提供了包含多个富集分子如抗体、适体或酶的试剂盒以及包含条形码和捕获探针的样品制备装置。

Description

单个多肽测序和重建的方法
相关申请
本申请根据35U.S.C.§119(e)要求2019年10月28日提交的美国临时申请序列号62/927,005和2019年11月27日提交的美国临时申请序列号62/940,968的申请日的权益,每件专利的全部内容均通过引用的方式并入本文。
背景技术
蛋白质组学已成为生物学系统研究中基因组学和转录组学的重要且必要的补充。细胞蛋白质组(或细胞群蛋白质组)的多样性超过了其基因组或转录组的多样性。参见例如Smith L.M.等人,Proteoform:a single term describing protein complexity,Nat.Methods.2013Mar;10(3):186-7;Smith L.M.&Kelleher N.L.,Proteoforms as thenext proteomics currency.Science.2018Mar 9;359(6380):1106-07。然而,分析蛋白质组多样性的方法——特别是评估全长、单个蛋白质亚型/蛋白质型(proteoform)的方法——迄今为止一直受到限制。
发明内容
本文提供了制备用于多肽测序的样品的方法,其可以利用多肽条形码来促进单个多肽的多重蛋白质组学分析。本文还提供了用于该方法的组合物、试剂盒和装置。
在一些方面,本公开涉及方法,其包括:(i)提供包含多肽群的富集样品;(ii)将富集样品分成两个或更多个子样品;(iii)使至少两个子样品各自与不同的修饰剂接触,其中修饰剂包括裂解剂,从而产生具有裂解模式组合的多肽片段;和(iv)对多肽片段进行并行测序,从而确定多肽片段的氨基酸序列。在一些实施方案中,所述方法进一步包括:(v)通过比对(iv)中确定的多肽片段的氨基酸序列来重建(i)中的多肽序列。在一些实施方案中,所述方法进一步包括:(vi)从(v)中重建的多肽序列中鉴定多肽变体或确认不存在多肽变体。
在一些实施方案中,(vi)中的多肽变体包含可变剪接位点、氨基酸插入、氨基酸缺失、氨基酸取代和/或氨基酸化学修饰。在一些实施方案中,氨基酸化学修饰是翻译后修饰。在一些实施方案中,所述化学修饰选自由乙酰化、ADP-核糖基化、半胱天冬酶裂解、瓜氨酸化、甲酰化、羟基化、甲基化、肉豆蔻酰化、N-连接糖基化、类泛素化(neddylation)、硝化、O-连接糖基化、氧化、棕榈酰化、磷酸化、异戊二烯化、S-亚硝基化、硫酸化、苏素化和泛素化组成的组。
在一些实施方案中,(i)包括:(a)提供细胞群;(b)裂解细胞群以产生包含在细胞群中表达的多肽的裂解样品;(c)从裂解样品中分离多肽子集,从而产生包含在细胞群中表达的多肽子集的富集样品。在一些实施方案中,(a)的细胞群:由单个细胞组成;包含多个同质细胞;或包含多个异质细胞。在一些实施方案中,(c)包括:i.使裂解样品与多个富集分子接触,其中多个富集分子中的至少富集分子的子集与裂解样品中的多肽子集结合,从而产生结合的多肽子集和未结合的多肽子集;和ii.分离所述结合的多肽子集或未结合的多肽子集。
在一些实施方案中:多个富集分子中的每个富集分子是抗体、适体或酶;或多个富集分子的子集中的富集分子包含抗体、适体或酶。
在一些实施方案中:多个富集分子中的每个富集分子与基质结合;或多个富集分子的子集中的富集分子与基质结合。在一些实施方案中,当包含多个多肽的裂解样品接触基质时,发生多个多肽与多个富集分子的接触。在一些实施方案中,所述基质选自由表面、珠粒、颗粒和凝胶组成的组,任选地其中:所述表面是固体表面;所述珠粒是磁珠;或所述颗粒是磁性颗粒。
在一些实施方案中:多个富集分子中的每个富集分子与两个或更多个包含不同氨基酸序列的多肽结合;或多个富集分子的子集中的富集分子与两个或更多个包含不同氨基酸序列的多肽结合。在一些实施方案中:多个富集分子中的每个富集分子与氨基酸翻译后修饰结合;或多个富集分子的子集中的富集分子与氨基酸翻译后修饰结合。在一些实施方案中,翻译后修饰选自由乙酰化、ADP-核糖基化、半胱天冬酶裂解、瓜氨酸化、甲酰化、羟基化、甲基化、肉豆蔻酰化、N-连接糖基化、类泛素化、硝化、O-连接糖基化、氧化、棕榈酰化、磷酸化、异戊二烯化、S-亚硝基化、硫酸化、苏素化和泛素化组成的组。在一些实施方案中,多个富集分子的第一子集中的富集分子与第一翻译后修饰结合,并且多个富集分子的第二子集中的富集分子与第二翻译后修饰结合。
在一些实施方案中,将(iii)中产生的多肽片段合并为单个样品,再进行(iv)中的测序。
在一些实施方案中,(iv)中的测序包括:(a)使多肽片段与一种或多种末端氨基酸识别分子接触;和(b)检测指示一种或多种末端氨基酸识别分子与在多肽被降解时暴露在多肽片段末端的连续氨基酸结合的一系列信号脉冲,从而对多肽片段进行测序。
在一些实施方案中,(iv)中的测序包括:(a)使多肽片段与包含一种或多种末端氨基酸识别分子和裂解试剂的组合物接触;和(b)在裂解试剂存在下检测指示一种或多种末端氨基酸识别分子与多肽片段末端结合的一系列信号脉冲,其中所述一系列信号脉冲指示因末端氨基酸被裂解试剂裂解而随时间暴露在末端的一系列氨基酸。
在一些实施方案中,(iv)中的测序包括:(a)鉴定多肽片段末端的第一个氨基酸;(b)去除第一个氨基酸以暴露多肽片段末端的第二个氨基酸;和(c)鉴定多肽片段末端的第二个氨基酸,其中(a)-(c)在单一反应混合物中进行。
在一些实施方案中,(iv)中的测序包括:(a)使多肽片段与结合多肽片段的一种或多种氨基酸识别分子接触;(b)在多肽降解条件下检测指示一种或多种氨基酸识别分子与多肽片段结合的一系列信号脉冲;和(c)基于一系列信号脉冲中的第一特征模式鉴定多肽片段中的第一类型氨基酸。
在一些实施方案中,(iv)中的测序包括:(a)在多肽降解过程中获得数据;(b)分析数据以确定对应于在降解过程中在多肽末端依次暴露的氨基酸的数据部分;和(c)输出代表所述多肽的氨基酸序列。
在一些实施方案中,(iv)中的测序包括:(a)使多肽片段与一种或多种标记的亲和试剂接触,所述亲和试剂选择性结合多肽片段末端的一种或多种类型的末端氨基酸;和(b)通过检测多肽片段与一种或多种标记的亲和试剂的相互作用来鉴定多肽片段末端的末端氨基酸。
在一些实施方案中,(iv)中的测序包括:(a)使多肽片段与一种或多种标记的亲和试剂接触,所述亲和试剂选择性结合多肽片段末端的一种或多种类型的末端氨基酸;(b)通过检测多肽片段与一种或多种标记的亲和试剂的相互作用来鉴定多肽末端的末端氨基酸;(c)去除末端氨基酸;和(d)在多肽片段末端重复(a)-(c)一次或多次以确定多肽片段的氨基酸序列。在一些实施方案中,所述方法进一步包括:在(a)之后和(b)之前,去除未选择性结合末端氨基酸的一种或多种标记的亲和试剂中的任意一种;和/或在(b)之后和(c)之前,去除选择性结合末端氨基酸的一种或多种标记的亲和试剂中的任意一种。在一些实施方案中,(c)包括通过使末端氨基酸与异硫氰酸酯接触来修饰末端氨基酸,和:使经修饰的末端氨基酸与特异性结合经修饰的末端氨基酸并将其去除的蛋白酶接触;或使经修饰的末端氨基酸经受足以去除经修饰的末端氨基酸的酸性或碱性条件。
在一些实施方案中,鉴定末端氨基酸包括:将末端氨基酸鉴定为与一种或多种标记的亲和试剂结合的一种或多种类型的末端氨基酸中的一种类型;或将末端氨基酸鉴定为与一种或多种标记的亲和试剂结合的一种或多种类型的末端氨基酸之外的类型。
在一些实施方案中,所述一种或多种标记的亲和试剂包含一种或多种标记的适体、一种或多种标记的肽酶、一种或多种标记的抗体、一种或多种标记的降解途径蛋白、一种或多种氨基转移酶、一种或多种tRNA合成酶或其组合。在一些实施方案中,所述一种或多种标记的肽酶已被修饰以使裂解活性失活;或其中所述一种或多种标记的肽酶保留用于去除(c)的裂解活性。
在一些实施方案中,所述方法包括:(i)提供包含多肽群的富集样品;(ii)将富集样品分成两个或多个子样品;(iii)使至少两个子样品各自与不同的修饰剂接触,其中每种修饰剂均包括裂解剂,从而产生具有裂解模式组合的多肽片段;和(iv)使多肽片段与包含多个条形码分子的独特条形码组分接触,从而产生包含条形码多肽的样品;(v)将包含条形码多肽的样品与一种或多种补充样品组合以产生多重样品;和(vi)对多重样品的多肽进行并行测序。
在一些实施方案中,(vi)包括:(a)检测多重样品的条形码多肽的条形码身份;和(b)确定(iii)的多肽片段的氨基酸序列;其中(a)在(b)之前、之后或与(b)同时发生。在一些实施方案中,条形码身份通过DNA测序、多肽测序、杂交、发光、结合动力学和/或固体基质上或固体基质内的物理位置来检测。在一些实施方案中,(vi)进一步包括:(c)根据检测到的条形码将氨基酸序列解析成组,其中每组中的氨基酸序列对应于具有相同来源的多肽。
在一些实施方案中,所述方法进一步包括:(vii)通过比对(vi)中确定的多肽片段的氨基酸序列来重建(i)中的多肽序列。
在一些实施方案中,所述方法进一步包括:(viii)鉴定多重样品中的多肽变体或确认其中不存在多肽变体。在一些实施方案中,(viii)中的多肽变体包含可变剪接位点、氨基酸插入、氨基酸缺失、氨基酸取代和/或氨基酸化学修饰。在一些实施方案中,氨基酸化学修饰是翻译后修饰。在一些实施方案中,化学修饰选自由乙酰化、ADP-核糖基化、半胱天冬酶裂解、瓜氨酸化、甲酰化、羟基化、甲基化、肉豆蔻酰化、N-连接糖基化、类泛素化、硝化、O-连接糖基化、氧化、棕榈酰化、磷酸化、异戊二烯化、S-亚硝基化、硫酸化、苏素化和泛素化组成的组。
在一些实施方案中,(i)包括:(a)提供细胞群;(b)裂解细胞群以产生包含所述细胞群中表达的多肽的裂解样品;(c)从裂解样品中分离所述多肽的子集,从而产生包含细胞群中表达的多肽的子集的富集样品。在一些实施方案中,(a)的细胞群:由单个细胞组成;包含多个同质细胞;或包含多个异质细胞。在一些实施方案中,(c)包括:i.使裂解样品与多个富集分子接触,其中多个富集分子中的至少富集分子的子集与裂解样品中的多肽子集结合,从而产生结合的多肽子集和未结合的多肽子集;ii.分离结合的多肽子集或未结合的多肽子集。
在一些实施方案中:多个富集分子中的每个富集分子是抗体、适体或酶;或多个富集分子的子集中的富集分子包含抗体、适体或酶。
在一些实施方案中:多个富集分子中的每个富集分子与基质结合;或多个富集分子的子集中的富集分子与基质结合。在一些实施方案中,当包含多个多肽的裂解样品接触基质时,发生多个多肽与多个富集分子的接触。在一些实施方案中,所述基质选自由表面、珠粒、颗粒和凝胶组成的组,任选地其中:所述表面是固体表面;所述珠粒是磁珠;或所述颗粒是磁性颗粒。
在一些实施方案中:多个富集分子中的每个富集分子与两个或更多个包含不同氨基酸序列的多肽结合;或多个富集分子的子集中的富集分子与两个或更多个包含不同氨基酸序列的多肽结合。在一些实施方案中:多个富集分子中的每个富集分子与氨基酸翻译后修饰结合;或多个富集分子的子集中的富集分子与氨基酸翻译后修饰结合。在一些实施方案中,翻译后修饰选自由乙酰化、ADP-核糖基化、半胱天冬酶裂解、瓜氨酸化、甲酰化、羟基化、甲基化、肉豆蔻酰化、N-连接糖基化、类泛素化、硝化、O-连接糖基化、氧化、棕榈酰化、磷酸化、异戊二烯化、S-亚硝基化、硫酸化、苏素化和泛素化组成的组。在一些实施方案中,多个富集分子的第一子集中的富集分子与第一翻译后修饰结合,并且多个富集分子的第二子集中的富集分子与第二翻译后修饰结合。
在一些实施方案中,(iv)的独特条形码组分包括包含多核酸部分的条形码分子。在一些实施方案中,多核酸部分的长度为8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个核苷酸。在一些实施方案中,所述多核酸部分包含适体的核苷酸序列。
在一些实施方案中,(iv)的独特条形码组分包括包含多肽部分的条形码分子。在一些实施方案中,多肽部分的长度为6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸。在一些实施方案中,多肽部分包含抗体或适体的氨基酸序列。
在一些实施方案中,(iv)的独特条形码组分包括包含荧光分子部分的条形码分子。在一些实施方案中,荧光分子部分包含芳族或杂芳族化合物,例如芘、蒽、萘、吖啶、芪(stilbene)、吲哚、苯并吲哚、恶唑、咔唑、噻唑、苯并噻唑、菲啶、吩恶嗪、卟啉、喹啉、乙锭(ethidium)、苯甲酰胺、花青、羰花青、水杨酸盐、邻氨基苯甲酸盐、香豆素、荧光素、罗丹明等。在一些实施方案中,所述荧光分子部分包含选自由以下组成的组的染料:氧杂蒽(xanthene)染料、萘染料、香豆素染料、吖啶染料、花青染料、苯并恶唑染料、芪染料、芘染料、酞菁(phthalocyanine)染料、藻胆蛋白染料、方酸染料和BODIPY染料。
在一些实施方案中,将(iii)中产生的多肽片段合并为单个样品,再使多肽与(iv)中的独特条形码组分接触。
在一些实施方案中,(v)中的至少一个补充样品通过包括以下的方法制备:(a)提供多肽群;和(b)将(a)中的多肽群与包含多个条形码分子的独特条形码组分接触,从而产生包含条形码多肽的子样品。
在一些实施方案中,(vi)中的测序包括:(a)使多重样品的多肽与一种或多种末端氨基酸识别分子接触;和(b)检测指示一种或多种末端氨基酸识别分子与在多肽被降解时暴露在单个多肽末端的连续氨基酸结合的一系列信号脉冲,从而对所述多肽进行测序。
在一些实施方案中,(vi)中的测序包括:(a)使多重样品的多肽与包含一种或多种末端氨基酸识别分子和裂解试剂的组合物接触;和(b)在裂解试剂存在下检测指示一种或多种末端氨基酸识别分子与多肽末端结合的一系列信号脉冲,其中所述一系列信号脉冲指示因末端氨基酸被裂解试剂裂解而随时间暴露在末端的一系列氨基酸。
在一些实施方案中,(vi)中的测序包括:(a)鉴定多重样品的多肽末端的第一个氨基酸;(b)去除第一个氨基酸以暴露多肽末端的第二个氨基酸,和(c)鉴定多肽末端的第二个氨基酸,其中(a)-(c)在单一反应混合物中进行。
在一些实施方案中,(vi)中的测序包括:(a)使多重样品的多肽与一种或多种与多肽结合的氨基酸识别分子接触;(b)在多肽降解条件下检测指示一种或多种氨基酸识别分子与多肽结合的一系列信号脉冲;和(c)基于一系列信号脉冲中的第一特征模式鉴定多肽中的第一类型的氨基酸。
在一些实施方案中,(vi)中的测序包括:(a)在多肽降解过程中获得数据;(b)分析数据以确定对应于在降解过程中在多肽末端依次暴露的氨基酸的数据部分;和(c)输出代表所述多肽的氨基酸序列。
在一些实施方案中,(vi)中的测序包括:(a)使多重样品的多肽与一种或多种标记的亲和试剂接触,所述亲和试剂选择性结合多肽末端的一种或多种类型的末端氨基酸;和(b)通过检测多肽与一种或多种标记的亲和试剂的相互作用来鉴定多肽末端的末端氨基酸。
在一些实施方案中,(vi)中的测序包括:(a)使多重样品中的多肽与一种或多种标记的亲和试剂接触,所述亲和试剂选择性结合多肽末端的一种或多种类型的末端氨基酸;(b)通过检测多肽片段与所述一种或多种标记的亲和试剂的相互作用来鉴定多肽末端的末端氨基酸;(c)去除末端氨基酸;和(d)在多肽末端重复(a)-(c)一次或多次以确定多肽的氨基酸序列。在一些实施方案中,所述方法进一步包括:在(a)之后和(b)之前,去除未选择性结合末端氨基酸的一种或多种标记的亲和试剂中的任意一种;和/或在(b)之后和(c)之前,去除选择性结合末端氨基酸的一种或多种标记的亲和试剂中的任意一种。在一些实施方案中,(c)包括通过使末端氨基酸与异硫氰酸酯接触来修饰末端氨基酸,和:使经修饰的末端氨基酸与特异性结合并去除经修饰的末端氨基酸的蛋白酶接触;或使经修饰的末端氨基酸经受足以去除经修饰的末端氨基酸的酸性或碱性条件。
在一些实施方案中,鉴定末端氨基酸包括:将末端氨基酸鉴定为与一种或多种标记的亲和试剂结合的一种或多种类型的末端氨基酸中的一种类型;或将末端氨基酸鉴定为与一种或多种标记的亲和试剂结合的一种或多种类型的末端氨基酸之外的类型。
在一些实施方案中,所述一种或多种标记的亲和试剂包括一种或多种标记的适体、一种或多种标记的肽酶、一种或多种标记的抗体、一种或多种标记的降解途径蛋白、一种或多种氨基转移酶、一种或多种tRNA合成酶或其组合。在一些实施方案中,所述一种或多种标记的肽酶已被修饰以使裂解活性失活;或其中所述一种或多种标记的肽酶保留用于去除(c)的裂解活性。
在一些方面,本公开涉及用于执行本文所述的方法的试剂盒。在一些实施方案中,试剂盒包含多个富集分子。在一些实施方案中,多个富集分子中的每个富集分子包含抗体、适体或酶。在一些实施方案中,多个富集分子的子集中的富集分子包含抗体、适体或酶。
在一些实施方案中,所述试剂盒进一步包含修饰剂。在一些实施方案中,修饰剂介导多肽片段化、多肽变性、翻译后修饰的添加和/或一种或多种官能团的封闭。
在一些实施方案中,所述试剂盒进一步包含标记的亲和试剂。在一些实施方案中,标记的亲和试剂包括一种或多种标记的适体、一种或多种标记的肽酶、一种或多种标记的抗体、一种或多种标记的降解途径蛋白、一种或多种氨基转移酶、一种或多种tRNA合成酶或其组合。
在一些实施方案中,所述试剂盒进一步包括包含多个条形码分子的条形码组分。在一些实施方案中,条形码组分进一步包含反应组分,所述反应组分包含一种或多种用于将条形码分子共价连接至多肽的试剂。在一些实施方案中,条形码组分包含一种或多种条形码分子,所述条形码分子包含多核酸部分、多肽部分和/或荧光分子部分。
在一些实施方案中,多核酸部分的长度为8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个核苷酸。在一些实施方案中,多核酸部分包含适体。
在一些实施方案中,多肽部分的长度为6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸。在一些实施方案中,多肽部分是抗体或适体。
在一些实施方案中,荧光分子部分包含芳族或杂芳族化合物,例如芘、蒽、萘、吖啶、芪、吲哚、苯并吲哚、恶唑、咔唑、噻唑、苯并噻唑、菲啶、吩恶嗪、卟啉、喹啉、乙锭、苯甲酰胺、花青、羰花青、水杨酸盐、邻氨基苯甲酸盐、香豆素、荧光素、罗丹明等。在一些实施方案中,荧光分子部分包含选自由以下组成的组的染料:氧杂蒽染料、萘染料、香豆素染料、吖啶染料、花青染料、苯并恶唑染料、芪染料、芘染料、酞菁染料、藻胆蛋白染料、方酸染料和BODIPY染料。
在一些实施方案中,所述试剂盒进一步包含固体支持物。在一些实施方案中,固体支持物包含固定的检测分子,所述检测分子包含对应于条形码组分的条形码分子的多核酸部分。在一些实施方案中,固体支持物包含固定的检测分子,所述检测分子包含对应于条形码组分的条形码分子的多肽部分。
在一些实施方案中,所述试剂盒包含允许物理分离不同来源的多肽群的固体支持物。
在一些方面,用于执行本文所述的方法的装置。在一些实施方案中,一种装置包含:至少一个硬件处理器;和至少一个存储处理器可执行指令的非暂时性计算机可读存储介质,所述处理器可执行指令在由所述至少一个硬件处理器执行时使所述至少一个硬件处理器执行所述方法。
在一些实施方案中,所述装置包含至少一个存储处理器可执行指令的非暂时性计算机可读存储介质,所述处理器可执行指令在由至少一个硬件处理器执行时使所述至少一个硬件处理器执行所述方法。
在一些实施方案中,所述装置包含:(i)样品制备模块,其被设置为与一个或多个盒(cartridge)接合(interface),每个盒包含:(a)一个或多个储存器或反应容器,其被设置为接收复杂样品;(b)一种或多种序列样品制备试剂,其中样品制备试剂包含多个条形码分子;和(c)基质,其包含一种或多种固定化的捕获探针;(ii)包含像素(pixel)阵列的测序模块,其中每个像素被设置为从样品制备模块接收测序样品,并且包含:(a)样品孔;和(b)至少一个光检测器。
在一些实施方案中,所述样品制备试剂进一步包含多个富集分子。在一些实施方案中,多个富集分子中的至少富集分子的子集共价连接至固定化的捕获探针。在一些实施方案中,至少富集分子的子集共价连接至能够被固定化的捕获探针结合的珠粒或颗粒。在一些实施方案中,多个富集分子中的每个富集分子包含抗体、适体或酶。在一些实施方案中,多个富集分子的子集中的富集分子包含抗体、适体或酶。
在一些实施方案中,所述样品制备试剂包括修饰剂。在一些实施方案中,修饰剂介导多肽片段化、多肽变性、翻译后修饰的添加和/或一种或多种官能团的封闭。
在一些实施方案中,所述测序模块进一步包含储存器或反应容器,所述储存器或反应容器被设置为将测序试剂递送到每个像素的样品孔中。
在一些实施方案中,所述测序试剂包括标记的亲和试剂。在一些实施方案中,标记的亲和试剂包含一种或多种标记的适体、一种或多种标记的肽酶、一种或多种标记的抗体、一种或多种标记的降解途径蛋白、一种或多种氨基转移酶、一种或多种tRNA合成酶或其组合。
附图说明
本领域技术人员将理解,本文所述的附图仅用于说明目的。应当理解,在一些情况下,本发明的各个方面可能被变大或放大以有助于理解本发明。在附图中,相似的参考符号在各个附图中通常指代相似的特征、功能上相似和/或结构上相似的元件。附图不一定按比例绘制,而是强调说明教导的原理。附图无意以任何方式限制本教导的范围。
本发明的特征和优点将在下面结合附图的详细描述中变得更加明显。
当参考附图描述实施方案时,可以使用方向参考(“上方”、“下方”、“顶部”、“底部”、“左侧”、“右侧”、“水平”、“垂直”等)。此类参考仅旨在帮助读者以正常方向查看附图。这些方向参考并非旨在描述具体装置的优选或独特方向。装置可以以其他方向体现。
如从详细描述中显而易见的,在整个申请中为了说明的目的而在附图中描绘和进一步描述的实例描述了非限制性实施方案,并且在一些情况下可以为了更清楚的说明的目的而简化某些过程或省略特征或步骤。
图1提供了单个多肽的条形码的示例性说明。单个多肽的分离可以以多种方式进行。与第一多肽接触的条形码池不同于与第二多肽接触的条形码池。
图2提供了多重样品制备和分析的示例性说明。各个多肽被片段化并标记条形码。然后汇集条形码片段,从而产生多重样品。然后对多重样品进行测序。
图3提供了多重样品分析的示例性说明。确定条形码多肽的氨基酸序列,并根据其来源(基于其各自条形码的身份)对所述序列进行解卷积和分组。
图4提供了描绘制备用于多肽测序的多重样品的示例性工作流程的图示。
图5提供了描绘制备用于多肽测序的多重样品的示例性工作流程的图示。
图6提供了描绘制备富集样品的示例性工作流程的图示。
图7提供了描绘制备富集样品的示例性工作流程的图示。
图8提供了描绘制备富集样品的示例性工作流程的图示。
图9提供了描绘用于制备富集样品和/或多重样品的示例性装置的图示。
具体实施方式
如本文所述,发明人已经认识到并理解不同的结合相互作用可以为多肽测序中的常规标记策略提供另外的或替代的方法。常规的多肽测序可以涉及用独特可识别的标记来标记每种类型的氨基酸。这个过程可能费力并且容易出错,因为有至少二十种不同类型的天然存在的氨基酸,以及其多种翻译后变体。在一些方面,本公开涉及使用氨基酸识别分子的技术的发现,所述氨基酸识别分子与不同类型的氨基酸有区别地结合以产生指示多肽的氨基酸序列的可检测特征。
在一些方面,本公开涉及可以仅使用单一反应混合物(例如,不需要通过反应容器的反复试剂循环)来实时监测多肽测序反应的发现。常规的多肽测序反应可以涉及将多肽暴露于不同的试剂混合物以在氨基酸检测和氨基酸裂解步骤之间循环。因此,在一些方面,本公开涉及下一代测序的进步,其允许通过氨基酸检测在整个进行中的降解反应中实时分析多肽。申请人已经认识到分析单个细胞的单个多肽的能力将提供对细胞过程和反应模式的洞察,从而导致改进的诊断和治疗策略。在一些方面,本公开涉及单个多肽测序的方法。
在一些实施方案中,所述方法包括:(i)提供包含多肽群的富集样品;(ii)将富集样品分成两个或更多个子样品;(iii)使至少两个子样品各自与不同的修饰剂接触,其中所述修饰剂包括裂解剂,从而产生具有裂解模式组合的多肽片段;和(iv)对多肽片段进行并行测序,从而确定多肽片段的氨基酸序列。在一些实施方案中,所述方法包括:(i)提供包含多肽群的富集样品;(ii)将富集样品分成两个或更多个子样品;(iii)使至少两个子样品各自与不同的修饰剂接触,其中每种修饰剂均包括裂解剂,从而产生具有裂解模式组合的多肽片段;和(iv)使多肽片段与包含多个条形码分子的独特条形码组分接触,从而产生包含条形码多肽的样品;(v)将包含条形码多肽的样品与一种或多种补充样品组合以产生多重样品;和(vi)对多重样品的多肽进行并行测序。
在一些实施方案中,(ii)包括将富集样品分成至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少25个或至少30个子样品。在一些实施方案中,(ii)包括将富集样品分成二、三、四、五、六、七、八、九、十、十一、十二、十三、十四、十五、十六、十七、十八、十九、二十或更多子样品。
在一些实施方案中,(iii)的修饰剂的裂解剂是酶,例如内肽酶(例如胰蛋白酶)。在一些实施方案中,(iii)的修饰剂的裂解剂是小化学品。用于化学和酶促片段化的合适试剂的实例是本领域已知的,并且包括但不限于胰蛋白酶、化学胰蛋白酶、Lys-C、Arg-C、Asp-N、Lys-N、BNPS-粪臭素(Skatole)、CNBr、半胱天冬酶、甲酸、谷氨酰内肽酶、羟胺、碘代苯甲酸、中性粒细胞弹性蛋白酶、胃蛋白酶、脯氨酸-内肽酶、蛋白酶K、葡萄球菌肽酶I、嗜热菌蛋白酶和凝血酶。当多肽与裂解剂接触时,它会以某种方式成为片段(产生特定的“裂解模式”)。因此,当将多肽样品分成子样品然后将其与不同的裂解剂接触时,会产生多肽片段的组合(或裂解模式的组合)。测序后,可以比对多肽片段的氨基酸序列以确定多肽在裂解(或片段化)之前的氨基酸序列。
在一些实施方案中,子样品各自与不同的裂解剂接触。
在一些实施方案中,通过使(ii)的子样品与(iii)中的不同修饰剂接触来产生至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少11种、至少12种、至少13种、至少14种、至少15种、至少16种、至少17种、至少18种、至少19种、至少20种、至少25种或至少30种独特的多肽裂解模式。在一些实施方案中,通过使(ii)的子样品与(iii)中的不同修饰剂接触来产生二、三、四、五、六、七、八、九、十、十一、十二、十三、十四、十五、十六、十七、十八、十九、二十或更多种独特的多肽裂解模式。
在一些实施方案中,所述方法进一步包括通过比对多肽片段的氨基酸序列来重建(i)中的多肽序列。在一些实施方案中,所述方法进一步包括从重建的多肽的序列中鉴定多肽变体或确认不存在多肽变体。在一些实施方案中,在测序之前将(iii)中产生的多肽片段合并为单个样品。
在一些实施方案中,所述方法包括:(i)提供包含至少两个子样品的多重样品,其中每个子样品均包含条形码多肽;和(ii)对多重样品中的条形码多肽进行并行测序。
在一些实施方案中,(i)包括:(a)提供多肽群;(b)使(a)的多肽群与包含多个条形码分子的独特条形码组分接触,从而产生包含条形码多肽的子样品;(c)将(b)中产生的样品与一个或多个补充子样品组合以产生多重样品。在一些实施方案中,(a)中的多肽群由单个多肽的多肽片段组成,并且(b)中产生的子样品包含条形码多肽片段。例如,在一些实施方案中,所述方法包括:提供单个多肽;使单个多肽与修饰剂接触,其中所述修饰剂包括裂解剂,从而产生一起包含单个多肽的多肽片段;使多肽片段与包含多个条形码分子的条形码组分接触,从而产生包含条形码多肽片段的样品,其中每个条形码多肽片段包含相同的条形码分子;将产生的样品与一个或多个补充样品组合,从而产生多重样品;和对多重样品中的条形码多肽片段进行并行测序。在其他实施方案中,(a)中的多肽群包含多个多肽。
在一些实施方案中,(ii)包括检测多重样品的条形码多肽的条形码身份。例如,在一些实施方案中,(ii)包括:(a)检测多重样品的条形码化多肽的条形码身份;和(b)确定多重样品的条形码多肽的至少部分氨基酸序列;其中(a)在(b)之前、之后或与(b)同时发生。在一些实施方案中,(ii)进一步包括:(c)根据检测到的条形码将氨基酸序列解析成组,其中每组中的氨基酸序列对应于具有相同来源的多肽。在一些实施方案中,所述方法进一步包括将氨基酸序列彼此比对(根据相似性区域)或与参考蛋白质组比对。在一些实施方案中,参考蛋白质组来自achaeal细胞、原核细胞或真核细胞。在一些实施方案中,参考蛋白质组来自细胞群,例如多细胞生物(例如,脊椎动物,例如人、小鼠、大鼠或非人类灵长类动物蛋白质组)。实际上,参考蛋白质组可以来自任何生命的结构域,或任何已知或预测的蛋白质序列的参考数据库,包括来自环境来源的序列,例如宏基因组和宏蛋白质组序列。
在一些实施方案中,所述方法包括:(iii)鉴定多重样品中的多肽变体或确认其中不存在多肽变体。
多肽变体可以包含可变剪接位点、氨基酸插入、氨基酸缺失、氨基酸取代和/或氨基酸化学修饰。氨基酸化学修饰可以是翻译后修饰,例如乙酰化、ADP-核糖基化、半胱天冬酶裂解、瓜氨酸化、甲酰化、羟基化、甲基化、肉豆蔻酰化、N-连接糖基化、类泛素化、硝化、O-连接糖基化、氧化、棕榈酰化、磷酸化、异戊二烯化、S-亚硝基化、硫酸化、苏素化、泛素化。
本文还提供了可用于分析单个多肽的组合物、试剂盒和装置。
I.制备复杂样品的方法
在一些方面,本公开涉及制备复杂样品(例如,复杂多肽样品)的方法。如本文所用,术语“复杂样品”是指包含多种分子(例如,多肽、多核酸、代谢物等)的样品,所述分子的至少两种是化学上独特的。在一些实施方案中,复杂样品包含多个多肽,其中所述多个多肽包含至少两个包含不同氨基酸序列的多肽。
通常,复杂样品来源于细胞群(例如,由细胞群产生)。在一些实施方案中,细胞群由单个细胞组成。在其他实施方案中,细胞群包含两个或更多个细胞。
例如,在一些实施方案中,细胞群包含至少5个、至少10个、至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少450个、至少500个、至少600个、至少700个、至少800个、至少900个、至少1×103个、至少1×104个、至少1×105个、至少1×106个、至少1×107个、至少1×108个、至少1×109个或至少1×1010个细胞。
在一些实施方案中,所述群包含1-5、1-10、1-20、1-30、1-50、1-60、1-70、1-80、1-90、1-100、1-150、1-200、1-250、1-300、1-350、1-400、1-450、1-500、1-600、1-700、1-800、1-900、1-1×103、1-1×104、1-1×105、1-1×106、1-1×107、1-1×108、1-1×109、1-1×1010、100-150、100-200、100-250、100-300、100-350、100-400、100-450、100-500、100-600、100-700、100-800、100-900、100-1×103、100-1×104、100-1×105、100-1×106、100-1×107、100-1×108、100-1×109、100-1×1010、1×103-1×104、1×103-1×105、1×103-1×106、1×103-1×107、1×103-1×108、1×103-1×109、1×103-1×1010、1×104-1×105、1×104-1×106、1×104-1×107、1×104-1×108、1×104-1×109、1×104-1×1010、1×105-1×106、1×105-1×107、1×105-1×108、1×105-1×109或1×105-1×1010个细胞。
细胞群可以包含原核细胞和/或真核细胞。细胞群可以包含多个同质细胞。替代地,细胞群可以包含多个异质细胞。
可以从受试者(例如,多细胞或共生生物)中分离细胞群。在一些实施方案中,所述受试者是小鼠、大鼠、兔、豚鼠、仓鼠、猪、羊、狗、灵长类动物、猫或人。
分离细胞群的方法是本领域技术人员已知的。例如,制备复杂样品的方法可以包括活检、解剖(例如显微解剖,例如激光捕获)、有限稀释、显微操作、免疫磁性细胞分离、荧光激活细胞分选、密度梯度离心、免疫密度细胞分离、微流体细胞分选、沉降、粘附或其组合。
在一些实施方案中,制备复杂样品的方法包括裂解细胞群,从而产生包含多种分子(例如,多肽、多核酸、代谢物等)的裂解样品。裂解细胞群的方法是本领域普通技术人员已知的。在一些实施方案中,使用任何一种已知的物理或化学方法裂解包含细胞的样品以从所述细胞释放靶分子。在一些实施方案中,可以使用电解法、酶促法、基于去污剂的方法和/或机械均化来裂解样品。在一些实施方案中,如果样品不包含细胞或组织(例如,包含纯化的多肽的样品),则可以省略裂解步骤。
替代地或另外地,制备复杂样品的方法可以包括亚细胞分级分离(即,分离一个或多个细胞区室,例如内体、突触体、细胞质、核质、染色质、线粒体、过氧化物酶体、溶酶体、黑色素体、外来体、高尔基体、内质网、中心体、伪足或其组合)。
来源于相同细胞群的分子在本文中被描述为具有相同的“来源”。
II.制备多重样品的方法
在一些方面,本公开涉及制备多重样品的方法。如本文所用,术语“多重样品”是指包含至少两个具有不同来源的子样品(例如,两个或更多个样品,每个样品由不同的细胞群或多个分子制备)的样品。
在一些实施方案中,多重样品包含至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少200个、至少300个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个或至少1000个子样品,所述子样品各自具有不同的来源。
在一些实施方案中,多重样品包含2-3、2-4、2-5、2-6、2-7、2-8、2-9、2-10、2-11、2-12、2-13、2-14、2-15、2-16、2-17、2-18、2-19、2-20、2-25、2-30、2-35、2-40、2-45、2-50、2-60、2-70、2-80、2-90、2-100、2-200、2-300、2-400、2-500、2-600、2-700、2-800、2-900、2-1000、5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-60、5-70、5-80、5-90、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、10-15、10-20、10-25、10-30、10-35、10-40、10-45、10-50、10-60、10-70、10-80、10-90、10-100、10-200、10-300、10-400、10-500、10-600、10-700、10-800、10-900、10-1000、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、20-200、20-300、20-400、20-500、20-600、20-700、20-800、20-900、20-1000、50-60、50-70、50-80、50-90、50-100、50-200、50-300、50-400、50-500、50-600、50-700、50-800、50-900、50-1000、100-200、100-300、100-400、100-500、100-600、100-700、100-800、100-900、100-1000、500-600、500-700、1500-800、500-900或500-1000个子样品,所述子样品各自具有不同的来源.
在一些实施方案中,多重样品包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个子样品,所述子样品各自具有不同的来源。
多重样品中的每个子样品可以包含多个分子。在一些实施方案中,多重样品中的一个或多个子样品包含:从细胞群(可以是单细胞)制备的复杂样品的分子(例如多肽)(参见“制备复杂样品的方法”);或富集样品的分子(例如多肽)(参见“制备富集样品的方法”)。在一些实施方案中,子样品的多个分子源来源于单个分子(例如,通过单个多肽的片段化)。
多重样品中的每个子样品可以包含单个分子(例如,单个多肽)。在一些实施方案中,多重样品中的一个或多个子样品包含单个分子(例如,单个多肽)。
通常,多重样品中每个子样品中的至少分子的子集可以与多重样品中其他子样品的分子区分开来。例如,在一些实施方案中,可以将多重样品中每个子样品中的至少多肽的子集与多重样品中其他子样品的多肽区分开来。以这种方式,可以鉴定多重样品中至少分子的子集的来源。
因此,在一些实施方案中,多重样品中的至少一个子样品包含条形码分子,每个条形码分子包含对子样品独特的条形码(即,独特条形码)。如果在多重样品中的任何其他子样品的分子上未发现条形码,则认为该条形码对子样品是独特的。
在一些实施方案中,多重样品中的两个或更多个子样品包含条形码分子。在一些实施方案中,多重样品中的每个子样品包含条形码分子。在一些实施方案中,多重样品中除了一个子样品之外的所有子样品都包含条形码分子。
在多重样品中,包含条形码分子的每个子样品的条形码分子(即,每个“标记子样品”)都包含独特条形码。在一些实施方案中,标记子样品中的每个条形码分子包含相同的条形码。在一些实施方案中,标的子样品中的条形码分子包含独特条形码的组合。例如,在一些实施方案中,标记子样品包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个条形码分子的独特组合。
在一些实施方案中,标记子样品包含条形码多肽和:条形码DNA分子、条形码RNA分子、条形码cDNA分子、条形码代谢物或其组合,其中:条形码多肽包含第一条形码(或第一条形码组合);条形码DNA分子包含第二条形码(或第二条形码组合);子样品中的条形码RNA分子包含第三条形码(或第三条形码组合);条形码cDNA分子包含第四条形码(或第四个条形码组合);条形码代谢物包含第五条形码(或第五条形码组合);或其组合。
在一些实施方案中,制备多重样品的方法包括:(i)使细胞群与条形码组分接触以产生包含条形码分子(例如条形码多肽)的样品(即第一标记子样品);和(ii)将(i)的样品与一种或多种补充样品(即一种或多种另外的子样品)组合以产生用于并行分子测序(例如多肽测序)的多重样品。
在一些实施方案中,制备多重样品的方法包括:(i)使多个分子与条形码组分接触以产生包含条形码分子(例如条形码多肽)的样品(即第一标记子样品);和(ii)将(i)的样品与一种或多种补充样品(即一种或多种另外的子样品)组合以产生用于并行分子测序(例如多肽测序)的多重样品。
在前两段中描述的一些实施方案中,步骤(ii)进一步包括将多重样品沉积在固体基质上或固体基质内。在一些实施方案中,固体基质包含多个固定化的(例如,共价连接的)检测分子,其中一种或多种检测分子与多重样品的条形码分子的条形码相互作用。在一些实施方案中,固体基质是芯片阵列。
在一些实施方案中,制备多重样品的方法包括:(i)提供至少两个分子群(例如,多肽);(ii)将(i)的至少两个分子群沉积在固体基质上或固体基质内,其中每个分子群与(i)中的其他分子群保持物理分离;从而制备用于并行多肽测序的多重样品。
A.多肽条形码化的方法
在一些方面,本公开涉及对样品的分子(例如,多肽、DNA、RNA、cDNA、代谢物等)进行条形码化的方法。在一些实施方案中,样品包含活细胞。在一些实施方案中,样品是从细胞群(其可以是单细胞)制备的复杂样品(参见“制备复杂样品的方法”)。在一些实施方案中,样品是富集样品(参见“制备富集样品的方法”)。在一些实施方案中,样品包含单个分子(例如,多肽)或来源于单个分子的片段(例如,多肽片段)。
在此特别相关的是,本公开涉及对多肽进行条形码化的方法。可以通过化学修饰和/或物理分离对多肽进行条形码化。
(i)化学修饰
可以通过化学修饰对多肽(或多个多肽)进行条形码化。多肽的化学修饰改变了多肽的化学组成,并且可以在多肽合成期间(体内或体外)或在多肽合成之后(即,翻译后)发生。多肽可以在其氨基酸序列内的任何位置进行修饰。先前已经描述了产生多肽缀合物(以得到条形码多肽)的方法,并且是本领域普通技术人员已知的。参见,例如,Corey等人,Science,1987;238:1401–1403;Kukolka等人,Org.Biomol.Chem.,2004;2:2203–2206;Debets等人,Chem.Commun.,2010;46:97–99;Takeda等人,Bioorg.Med.Chem.Lett.,2004;14:2407–2410;Yang等人,Bioconjug.Chem.,2015;26:1381–1395;Rosen等人,Nat.Chem.,2014;6:804–809;Cong等人,Bioconjug.Chem.,2012;23:248–263;Mattson,G.等人,Molecular Biology Reports,1993;17:167-183。
在一些实施方案中,多肽(或多个多肽)通过包括使细胞群与条形码组分接触以产生包含条形码多肽的样品的方法被条形码化。在这种情况下,可以在合成期间或在合成之后(即,翻译后)修饰多肽(或多个多肽)。
在一些实施方案中,多肽(或多个多肽)通过包括使多肽(或多个多肽)与条形码组分接触以产生包含条形码多肽的样品的方法被条形码化。在这种情况下,多肽(或多个多肽)将在合成之后(即,翻译后)被修饰。
条形码组分可以包括修饰剂。所述修饰剂可以包含具有不同裂解模式的内切蛋白酶。所述内切蛋白酶的实例是本领域普通技术人员已知的,并且包括但不限于胰蛋白酶、胰凝乳蛋白酶、弹性蛋白酶、嗜热菌蛋白酶、胃蛋白酶、谷氨酰内肽酶、脑啡肽酶、Lys-C、Arg-C、Asp-N、Lys-N、Glu-C、WaLP和MaLP。参见例如,Giansanti等人,Nat.Protoc.,2016年4月28日;11(5):993-1006。多肽修饰剂可以包含能够用翻译后修饰来修饰多肽的酶。翻译后修饰的实例是本领域技术人员已知的,并且包括但不限于乙酰化、腺苷酰化、ADP-核糖基化、烷基化(例如甲基化)、酰胺化、精氨酰化、生物素化、丁酰化、氨甲酰化、羰基化、羧基化、瓜氨酸化、脱酰胺、消除(eliminylation)、甲酰化、糖基化(例如,N-连接糖基化、O-连接糖基化)、glipyatyon、糖化、羟基化、碘化、ISG化、异戊二烯化、脂化、丙二酰化、肉豆蔻酰化、类泛素化、硝化、氧化、棕榈酰化聚乙二醇化、磷酸化、磷酸泛酰巯基乙炔化(phosphopantetheinylation)、聚乙二醇化(polyglcylation)、聚谷氨酰化(polyglutamylation)、异戊二烯化、丙酰化、pupylation、S-谷胱甘肽化、S-亚硝基化、S-亚磺酰化、S-亚磺酰化(S-sulfinylation)、S-磺酰化、琥珀酰化、硫酸化、SUMO化和泛素化。负责以这些方式修饰多肽的酶也是本领域技术人员已知的。
替代地或另外地,条形码组分可以包含多个条形码分子。在一些实施方案中,条形码组分由多个条形码分子组成。在一些实施方案中,条形码组分可以进一步包含一种或多种试剂(例如酶、化合物、小分子、缓冲液等)以促进条形码分子与多肽的共价连接。条形码分子可以在任何位置与多肽共价连接。在一些实施方案中,条形码分子在其末端(N末端或C末端)的10、9、8、7、6、5、4、3或2个氨基酸内的氨基酸位置处与多肽共价连接。在一些实施方案中,条形码分子在其N末端处与多肽共价连接。在一些实施方案中,条形码在其C末端处与多肽共价连接。
在一些实施方案中,条形码组分的每个条形码分子在化学上是相同的。在一些实施方案中,条形码组分包含两个或更多个化学上不同的条形码分子。例如,条形码组分可以包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个化学上不同的条形码分子。
条形码组分的条形码分子可以是非天然氨基酸(即非标准氨基酸)。非天然氨基酸的实例是本领域技术人员已知的,并且包括但不限于高烯丙基甘氨酸(Hag)、高炔丙基甘氨酸(Hpg)、叠氮基高丙氨酸(Aha)、叠氮基正亮氨酸(Anl)、叠氮基苯丙氨酸(Azf)、乙酰基苯丙氨酸(Acf)和炔丙基氧基苯丙氨酸(Pxf)。在其中条形码组分包含非天然氨基酸条形码分子的一些实施方案中,条形码组分进一步包含一种或多种非天然tRNA(或编码非天然tRNA的可表达形式的核酸)。非天然tRNA的实例是本领域技术人员已知的。
替代地或另外地,条形码组分的条形码分子可以包含多核酸部分、多肽部分、小分子部分、接头(例如,peg样接头)、树枝状大分子、支架或其组合。在一些实施方案中,条形码组分的条形码分子包含多核酸部分、多肽部分、小分子部分、接头(例如,peg样接头)、树枝状大分子、支架或其组合。
在一些实施方案中,条形码分子包含多核酸部分。在一些实施方案中,条形码分子包含两个或更多个多核酸部分。在其中条形码分子包含多个多核酸部分的实施方案中:每个多核酸部分可以是相同的;多核酸部分的子集可以是相同的;或者每个多核酸部分可以在化学上不同。
在一些实施方案中,所述多核酸部分的长度为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个核苷酸。
在一些实施方案中,所述多核酸部分的长度为至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少450个或至少500个核苷酸。
在一些实施方案中,所述多核酸部分的长度为5-10、5-15、5-20、5-25、5-30、5-40、5-50、5-60、5-70、5-80、5-90、5-100、5-150、5-200、5-250、5-300、5-350、5-400、5-450、5-500、10-15、10-20、10-25、10-30、10-40、10-50、10-60、10-70、10-80、10-90、10-100、10-150、10-200、10-250、10-300、10-350、10-400、10-450、10-500、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、20-150、20-200、20-250、20-300、20-350、20-400、20-450、20-500、50-75、50-100、50-150、50-200、50-250、50-500、50-350、50-400、50-450、50-500、100-200、100-250、100-500、100-350、100-400、100-450或100-500个核苷酸.
在一些实施方案中,所述多核酸部分是适体。
在一些实施方案中,条形码分子包含多肽部分。在一些实施方案中,条形码分子包含两个或更多个多肽部分。在其中条形码分子包含多个多肽部分的实施方案中:每个多肽部分可以是相同的;多肽部分的子集可以是相同的;或者每个多肽部分可以在化学上不同。
在一些实施方案中,所述多肽部分的长度为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸。在一些实施方案中,所述多肽部分的长度为至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少450个或至少500个氨基酸。在一些实施方案中,多肽部分的长度为5-10、5-15、5-20、5-25、5-30、5-40、5-50、5-60、5-70、5-80、5-90、5-100、5-150、5-200、5-250、5-300、5-350、5-400、5-450、5-500、10-15、10-20、10-25、10-30、10-40、10-50、10-60、10-70、10-80、10-90、10-100、10-150、10-200、10-250、10-300、10-350、10-400、10-450、10-500、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、20-150、20-200、20-250、20-300、20-350、20-400、20-450、20-500、50-75、50-100、50-150、50-200、50-250、50-500、50-350、50-400、50-450、50-500、100-200、100-250、100-500、100-350、100-400、100-450或100-500个氨基酸.
在一些实施方案中,所述多肽部分是适体。在一些实施方案中,多所述肽部分是抗体。在一些实施方案中,所述多肽部分是抗原。
在一些实施方案中,条形码分子包含小分子部分。在一些实施方案中,条形码分子包含两个或更多个小分子部分。在其中条形码分子包含多个小分子部分的实施方案中:每个小分子部分可以是相同的;小分子部分的子集可以是相同的;或者每个小分子部分可以在化学上不同。
在一些实施方案中,所述小分子部分包含生物素。
在一些实施方案中,所述小分子部分包含药物或发光分子(或荧光分子)。适用于本文所述的方法的药物和发光分子的实例是本领域技术人员已知的。如本文所用,发光分子是吸收一个或多个光子并且可以随后在一个或多个时段后发射一个或多个光子的分子。
在一些实施方案中,发光分子可以包含第一和第二生色团。在一些实施方案中,第一生色团的激发态能够通过能量转移到第二生色团而弛豫。在一些实施方案中,能量转移是福斯特共振能量转移(FRET)。这样的FRET对可用于提供发光标记,其具有使所述标记更容易从混合物中的多个发光标记中区分的性质。在其他实施方案中,FRET对包含第一发光标记的第一生色团和第二发光标记的第二生色团。在某些实施方案中,FRET对可以吸收第一光谱范围内的激发能量并发射第二光谱范围内的发光。
在一些实施方案中,发光分子是指荧光团或染料。通常,发光分子包含芳族或杂芳族化合物,并且可以是芘、蒽、萘、萘胺、吖啶、芪、吲哚、苯并吲哚、恶唑、咔唑、噻唑、苯并噻唑、苯并恶唑、菲啶、吩恶嗪、卟啉、喹啉、乙锭、苯甲酰胺、花青、羰花青、水杨酸盐、邻氨基苯甲酸盐、香豆素、荧光素、罗丹明、氧杂蒽或其他类似化合物。
在一些实施方案中,发光分子包含选自以下一种或多种的染料:5/6-羧基罗丹明6G、5-羧基罗丹明6G、6-羧基罗丹明6G、6-TAMRA、
Figure BDA0003717531990000251
STAR 440SXP、
Figure BDA0003717531990000261
STAR 470SXP、
Figure BDA0003717531990000262
STAR 488、
Figure BDA0003717531990000263
STAR 512、
Figure BDA0003717531990000264
STAR 520SXP、
Figure BDA0003717531990000265
STAR 580、
Figure BDA0003717531990000266
STAR 600、
Figure BDA0003717531990000267
STAR 635、
Figure BDA0003717531990000268
STAR635P、
Figure BDA0003717531990000269
STAR RED、Alexa
Figure BDA00037175319900002610
350、Alexa
Figure BDA00037175319900002611
405、Alexa
Figure BDA00037175319900002612
430、Alexa
Figure BDA00037175319900002613
480、Alexa
Figure BDA00037175319900002614
488、Alexa
Figure BDA00037175319900002615
514、Alexa
Figure BDA00037175319900002616
532、Alexa
Figure BDA00037175319900002617
546、Alexa
Figure BDA00037175319900002618
555、Alexa
Figure BDA00037175319900002619
568、Alexa
Figure BDA00037175319900002620
594、Alexa
Figure BDA00037175319900002621
610-X、Alexa
Figure BDA00037175319900002622
633、Alexa
Figure BDA00037175319900002623
647、Alexa
Figure BDA00037175319900002624
660、Alexa
Figure BDA00037175319900002625
680、Alexa
Figure BDA00037175319900002626
700、Alexa
Figure BDA00037175319900002627
750、Alexa
Figure BDA00037175319900002628
790、AMCA、ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO 532、ATTO 542、ATTO 550、ATTO 565、ATTO590、ATTO 610、ATTO 620、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO 665、ATTO 680、ATTO 700、ATTO 725、ATTO 740、ATTO Oxa12、ATTO Rho101、ATTO Rho11、ATTO Rho12、ATTORho13、ATTO Rho14、ATTO Rho3B、ATTO Rho6G、ATTO Thio12、BD HorizonTM V450、
Figure BDA00037175319900002629
493/501、
Figure BDA00037175319900002630
530/550、
Figure BDA00037175319900002631
558/568、
Figure BDA00037175319900002632
564/570、
Figure BDA00037175319900002633
576/589、
Figure BDA00037175319900002634
581/591、
Figure BDA00037175319900002635
630/650、
Figure BDA00037175319900002636
650/665、
Figure BDA00037175319900002637
FL、
Figure BDA00037175319900002638
FL-X、
Figure BDA00037175319900002639
R6G、
Figure BDA00037175319900002640
TMR、
Figure BDA00037175319900002641
TR、CAL
Figure BDA00037175319900002642
Gold 540、CAL
Figure BDA00037175319900002643
Green 510、CAL
Figure BDA00037175319900002644
Orange 560、CAL
Figure BDA00037175319900002645
Red 590、CAL
Figure BDA00037175319900002646
Red 610、CAL
Figure BDA00037175319900002647
Red 615、CAL
Figure BDA00037175319900002648
Red 635、
Figure BDA00037175319900002649
Blue、CFTM350、CFTM405M、CFTM405S、CFTM488A、CFTM514、CFTM532、CFTM543、CFTM546、CFTM555、CFTM568、CFTM594、CFTM620R、CFTM633、CFTM633-V1、CFTM640R、CFTM640R-V1、CFTM640R-V2、CFTM660C、CFTM660R、CFTM680、CFTM680R、CFTM680R-V1、CFTM750、CFTM770、CFTM790、ChromeoTM 642、Chromis 425N、Chromis 500N、Chromis 515N、Chromis 530N、Chromis 550A、Chromis550C、Chromis 550Z、Chromis 560N、Chromis 570N、Chromis 577N、Chromis 600N、Chromis630N、Chromis 645A、Chromis 645C、Chromis 645Z、Chromis 678A、Chromis 678C、Chromis678Z、Chromis 770A、Chromis 770C、Chromis 800A、Chromis 800C、Chromis 830A、Chromis830C、
Figure BDA0003717531990000271
3、
Figure BDA0003717531990000272
3.5、
Figure BDA0003717531990000273
3B、
Figure BDA0003717531990000274
5、
Figure BDA0003717531990000275
5.5、
Figure BDA0003717531990000276
7、
Figure BDA0003717531990000277
350、
Figure BDA0003717531990000278
405、
Figure BDA0003717531990000279
415-Co1、
Figure BDA00037175319900002710
425Q、
Figure BDA00037175319900002711
485-LS、
Figure BDA00037175319900002712
488、
Figure BDA00037175319900002713
504Q、
Figure BDA00037175319900002714
510-LS、
Figure BDA00037175319900002715
515-LS、
Figure BDA00037175319900002716
521-LS、
Figure BDA00037175319900002717
530-R2、
Figure BDA00037175319900002718
543Q、
Figure BDA00037175319900002719
550、
Figure BDA00037175319900002720
554-R0、
Figure BDA00037175319900002721
554-R1、
Figure BDA00037175319900002722
590-R2、
Figure BDA00037175319900002723
594、
Figure BDA00037175319900002724
610-B1、
Figure BDA00037175319900002725
615-B2、
Figure BDA00037175319900002726
633、
Figure BDA00037175319900002727
633-B1、
Figure BDA00037175319900002728
633-B2、
Figure BDA00037175319900002729
650、
Figure BDA00037175319900002730
655-B1、
Figure BDA00037175319900002731
655-B2、
Figure BDA00037175319900002732
655-B3、
Figure BDA00037175319900002733
655-B4、
Figure BDA00037175319900002734
662Q、
Figure BDA00037175319900002735
675-B1、
Figure BDA00037175319900002736
675-B2、
Figure BDA00037175319900002737
675-B3、
Figure BDA00037175319900002738
675-B4、
Figure BDA00037175319900002739
679-C5、
Figure BDA00037175319900002740
680、
Figure BDA00037175319900002741
683Q、
Figure BDA00037175319900002742
690-B1、
Figure BDA00037175319900002743
690-B2、
Figure BDA00037175319900002744
696Q、
Figure BDA00037175319900002745
700-B1、
Figure BDA00037175319900002746
700-B1、
Figure BDA00037175319900002747
730-B1、
Figure BDA00037175319900002748
730-B2、
Figure BDA00037175319900002749
730-B3、
Figure BDA00037175319900002750
730-B4、
Figure BDA00037175319900002751
747、
Figure BDA00037175319900002752
747-B 1、
Figure BDA00037175319900002753
747-B2、
Figure BDA00037175319900002754
747-B3、
Figure BDA00037175319900002755
747-B4、
Figure BDA00037175319900002756
755、
Figure BDA00037175319900002757
766Q、
Figure BDA00037175319900002758
775-B2、
Figure BDA00037175319900002759
775-B3、
Figure BDA00037175319900002760
775-B4、
Figure BDA00037175319900002761
780-B1、
Figure BDA00037175319900002762
780-B2、
Figure BDA00037175319900002763
780-B3、
Figure BDA00037175319900002764
800、
Figure BDA00037175319900002765
830-B2、Dyomics-350、Dyomics-350XL、Dyomics-360XL、Dyomics-370XL、Dyomics-375XL、Dyomics-380XL、Dyomics-390XL、Dyomics-405、Dyomics-415、Dyomics-430、Dyomics-431、Dyomics-478、Dyomics-480XL、Dyomics-481XL、Dyomics-485XL、Dyomics-490、Dyomics-495、Dyomics-505、Dyomics-510XL、Dyomics-511XL、Dyomics-520XL、Dyomics-521XL、Dyomics-530、Dyomics-547、Dyomics-547P1、Dyomics-548、Dyomics-549、Dyomics-549P1、Dyomics-550、Dyomics-554、Dyomics-555、Dyomics-556、Dyomics-560、Dyomics-590、Dyomics-591、Dyomics-594、Dyomics-601XL、Dyomics-605、Dyomics-610、Dyomics-615、Dyomics-630、Dyomics-631、Dyomics-632、Dyomics-633、Dyomics-634、Dyomics-635、Dyomics-636、Dyomics-647、Dyomics-647P1、Dyomics-648、Dyomics-648P1、Dyomics-649、Dyomics-649P1、Dyomics-650、Dyomics-651、Dyomics-652、Dyomics-654、Dyomics-675、Dyomics-676、Dyomics-677、Dyomics-678、Dyomics-679P1、Dyomics-680、Dyomics-681、Dyomics-682、Dyomics-700、Dyomics-701、Dyomics-703、Dyomics-704、Dyomics-730、Dyomics-731、Dyomics-732、Dyomics-734、Dyomics-749、Dyomics-749P1、Dyomics-750、Dyomics-751、Dyomics-752、Dyomics-754、Dyomics-776、Dyomics-777、Dyomics-778、Dyomics-780、Dyomics-781、Dyomics-782、Dyomics-800、Dyomics-831、
Figure BDA0003717531990000281
450、伊红、FITC、荧光素、HiLyteTM Fluor 405、HiLyteTM Fluor 488、HiLyteTM Fluor 532、HiLyteTM Fluor 555、HiLyteTM Fluor 594、HiLyteTM Fluor 647、HiLyteTM Fluor 680、HiLyteTM Fluor 750、
Figure BDA0003717531990000282
680LT、
Figure BDA0003717531990000283
750、
Figure BDA0003717531990000284
800CW、JOE、
Figure BDA0003717531990000285
640R、
Figure BDA0003717531990000286
Red 610、
Figure BDA0003717531990000287
Red 640、
Figure BDA0003717531990000288
Red 670、
Figure BDA0003717531990000289
Red 705、丽丝胺罗丹明B、Napthofluorescein、Oregon
Figure BDA00037175319900002810
488、Oregon
Figure BDA00037175319900002811
514、PacificBlueTM、Pacific GreenTM、Pacific OrangeTM、PET、PF350、PF405、PF415、PF488、PF505、PF532、PF546、PF555P、PF568、PF594、PF610、PF633P、PF647P、
Figure BDA00037175319900002812
570、
Figure BDA00037175319900002813
670、
Figure BDA00037175319900002814
705、罗丹明123、罗丹明6G、罗丹明B、罗丹明绿、罗丹明绿-X、罗丹明红、ROX、SetaTM 375、SetaTM 470、SetaTM 555、SetaTM 632、SetaTM 633、SetaTM 650、SetaTM 660、SetaTM 670、SetaTM 680、SetaTM700、SetaTM 750、SetaTM 780、SetaTM APC-780、SetaTM PerCP-680、SetaTM R-PE-670、SetaTM 646、SeTau 380、SeTau 425、SeTau 647、SeTau 405、Square635、Square 650、Square 660、Square 672、Square 680、磺酰罗丹明101、TAMRA、TET、Texas
Figure BDA00037175319900002815
TMR、TRITC、Yakima YellowTM
Figure BDA00037175319900002816
Zy3、Zy5、Zy5.5和Zy7。
(ii)物理分离
多肽(或多个多肽)可以通过物理分离进行条形码化。在一些实施方案中,多肽(或多个多肽)沉积在固体基质上或固体基质内,使得多肽(或多个多肽)与另外的多肽(或另外的多个多肽)保持物理上分离。
在一些实施方案中,所述固体基质是芯片阵列。
在一些实施方案中,所述芯片阵列包含多个区室(例如,孔)和/或注射端口。例如,在一些实施方案中,所述芯片阵列包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个区室。在一些实施方案中,所述芯片阵列包含1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-13、1-14、1-15、1-16、1-17、1-18、1-19、1-20、2-3、2-4、2-5、2-6、2-7、2-8、2-9、2-10、2-11、2-12、2-13、2-14、2-15、2-16、2-17、2-18、2-19、2-20、3-4、3-5、3-6、3-7、3-8、3-9、3-10、3-11、3-12、3-13、3-14、3-15、3-16、3-17、3-18、3-19、3-20、5-6、5-7、5-8、5-9、5-10、5-11、5-12、5-13、5-14、5-15、5-16、5-17、5-18、5-19、5-20、10-15或15-20个区室。在一些实施方案中,所述芯片阵列包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个注射端口。在一些实施方案中,所述芯片阵列包含1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-13、1-14、1-15、1-16、1-17、1-18、1-19、1-20、2-3、2-4、2-5、2-6、2-7、2-8、2-9、2-10、2-11、2-12、2-13、2-14、2-15、2-16、2-17、2-18、2-19、2-20、3-4、3-5、3-6、3-7、3-8、3-9、3-10、3-11、3-12、3-13、3-14、3-15、3-16、3-17、3-18、3-19、3-20、5-6、5-7、5-8、5-9、5-10、5-11、5-12、5-13、5-14、5-15、5-16、5-17、5-18、5-19、5-20、10-15或15-20个注射端口。
在一些实施方案中,所述芯片阵列包含多个物理上分离的点(或区域),这些点(或区域)包含固定化的(例如,共价连接的)检测分子,如本文所述。例如,在一些实施方案中,所述芯片阵列包含至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少25个,至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个、至少100个、至少150个、至少200个、至少250个、至少300个、至少400个、至少450个、至少500个、至少550个、至少600个、至少700个、至少800个、至少900个、至少1000个、至少5000个或至少10,000个物理上分离的点。在一些实施方案中,芯片阵列包含2-10、2-20、2-30、2-40、2-50、2-60、2-70、2-80、2-90、2-100、10-20、10-30、10-40、10-50、10-60、10-70、10-80、10-90、10-100、50-100、50-150、50-200、50-250、50-300、50-350、50-400、50-450、50-500、50-550、50-600、50-650、50-700、50-750、50-800、50-850、50-900、50-950、50-1000、500-1000、500-2000、500-3000、500-4000、500-5000、500-6000、500-7000、500-8000、500-9000或500-10,000个物理上分离的点。
B.确定多重样品中条形码分子的来源的方法
在一些方面,本公开涉及确定多重样品中条形码分子(例如,多肽、DNA、RNA、cDNA、代谢物)的来源的方法。条形码分子的来源(或多个条形码分子的来源)通过鉴定分子的条形码来确定。条形码身份可以通过测序(例如,多肽和/或多核酸测序)、发光、杂交、结合动力学、固体基质上或固体基质内的物理位置或其组合来检测。
在一些实施方案中,可以对多重样品的条形码多肽(或多个条形码多肽)进行测序(例如,并行测序)以确定多肽的氨基酸序列。在这样的实施方案中,条形码多肽的来源可以在多重样品的多肽测序之前、之后或与多重样品的多肽测序同时确定。在一些实施方案中,在多肽测序之前确定条形码多肽的来源。在一些实施方案中,在多肽测序之后确定条形码多肽的来源。在一些实施方案中,条形码多肽的来源与多肽的测序同时确定。在一些实施方案中,多重样品的条形码多肽的氨基酸序列根据它们的来源(如由它们的条形码身份确定)进行分组。
(i)多核酸测序方法学
在一些实施方案中,确定条形码分子的来源(或多个条形码分子的来源)的方法包括通过对分子的条形码进行测序来检测分子的条形码身份(或条形码分子的条形码身份)。因此,在一些方面,本公开涉及对多肽和/或多核酸(例如,脱氧核糖核酸或核糖核酸)进行测序的方法。下文讨论了对多肽进行测序的方法(参见“多肽测序方法学”)。本文还描述了多核酸测序方法学。
在一些实施方案中,多核酸测序方法包括以下步骤:(i)将靶体积中的复合物暴露于一种或多种标记的核苷酸,所述复合物包含样品中存在的靶多核酸或多种多核酸、至少一种引物和聚合酶;(ii)将一个或多个激发能量或一个或多个激发能量的一系列脉冲引导到靶体积附近;(iii)在顺序掺入包含至少一种引物之一的多核酸期间检测来自一种或多种标记的核苷酸的多个发射光子;和(iv)通过确定发射光子的一种或多种特征来鉴定掺入的核苷酸的序列。
在一些实施方案中,引物是测序引物。在一些实施方案中,测序引物可以与可以固定或不固定在固体支持物上的多核酸(例如,靶多核酸)退火。固体支持物可以包括,例如,用于多核酸测序的芯片或盒上的样品孔(例如,纳米孔(nanoaperture)、反应室)。在一些实施方案中,测序引物可以固定在固体支持物上并且多核酸(例如,靶核酸)的杂交进一步将核酸分子固定在固体支持物上。在一些实施方案中,聚合酶(例如,RNA聚合酶)被固定在固体支持物上,并且可溶性测序引物和多核酸与聚合酶接触。在一些实施方案中,在溶液中形成包含聚合酶、多核酸(例如,靶核酸)和引物的复合物,并且将复合物固定在固体支持物上(例如,通过聚合酶、引物和/或靶多核酸的固定化)。在一些实施方案中,没有任何组分被固定在固体支持物上。例如,在一些实施方案中,包含聚合酶、靶多核酸和测序引物的复合物原位形成,并且复合物不被固定在固体支持物上。
在一些实施方案中,根据本公开的方面,多个单分子测序反应并行进行(例如,在单个芯片或盒上)。例如,在一些实施方案中,多个单分子测序反应各自在单个芯片或盒上的单独样品孔(例如,纳米孔、反应室)中进行。
另外的多核酸测序方法是本领域技术人员已知的。
(ii)检测分子
在一些实施方案中,确定条形码分子的来源(或多个条形码分子的来源)的方法包括使用检测分子来间接检测分子的条形码身份(或条形码分子的条形码身份)。例如,在一些实施方案中,在包括以下步骤的方法中检测条形码身份:(i)使条形码分子(或多个条形码分子)与多个检测分子接触,其中多个检测分子中的一个或多个与条形码分子的条形码相互作用(或与条形码分子的一个或多个条形码相互作用);和(ii)检测条形码分子和检测分子之间的任何相互作用。条形码分子和检测分子之间的相互作用可以通过发光、杂交、结合动力学或物理位置来鉴定。
在一些实施方案中,多个检测分子中的每个检测分子在化学上是相同的。在一些实施方案中,多个检测器分子包含两个或更多个化学上不同的检测分子。
例如,在一些实施方案中,多个检测分子包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个化学上不同的检测分子。
在一些实施方案中,多个检测分子包含至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少200个、至少300个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个或至少1000个化学上不同的检测分子。
在一些实施方案中,多个检测分子包含2-3、2-4、2-5、2-6、2-7、2-8、2-9、2-10、2-11、2-12、2-13、2-14、2-15、2-16、2-17、2-18、2-19、2-20、2-25、2-30、2-35、2-40、2-45、2-50、2-60、2-70、2-80、2-90、2-100、2-200、2-300、2-400、2-500、2-600、2-700、2-800、2-900、2-1000、5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-60、5-70、5-80、5-90、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、10-15、10-20、10-25、10-30、10-35、10-40、10-45、10-50、10-60、10-70、10-80、10-90、10-100、10-200、10-300、10-400、10-500、10-600、10-700、10-800、10-900、10-1000、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、20-200、20-300、20-400、20-500、20-600、20-700、20-800、20-900、20-1000、50-60、50-70、50-80、50-90、50-100、50-200、50-300、50-400、50-500、50-600、50-700、50-800、50-900、50-1000、100-200、100-300、100-400、100-500、100-600、100-700、100-800、100-900、100-1000、500-600、500-700、1500-800、500-900或500-1000个化学上不同的检测分子。
检测分子可以包含多核酸部分、多肽部分、小分子部分或其组合。
在一些实施方案中,检测分子包含多核酸部分。在一些实施方案中,检测分子包含两个或更多个多核酸部分。在其中检测分子包含多个多核酸部分的实施方案中:每个多核酸部分可以是相同的;多核酸部分的子集可以是相同的;或者每个多核酸部分可以在化学上不同。
在一些实施方案中,所述多核酸部分的长度为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个核苷酸。
在一些实施方案中,所述多核酸部分的长度为至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少450个或至少500个核苷酸。
在一些实施方案中,所述多核酸部分的长度为5-10、5-15、5-20、5-25、5-30、5-40、5-50、5-60、5-70、5-80、5-90、5-100、5-150、5-200、5-250、5-300、5-350、5-400、5-450、5-500、10-15、10-20、10-25、10-30、10-40、10-50、10-60、10-70、10-80、10-90、10-100、10-150、10-200、10-250、10-300、10-350、10-400、10-450、10-500、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、20-150、20-200、20-250、20-300、20-350、20-400、20-450、20-500、50-75、50-100、50-150、50-200、50-250、50-500、50-350、50-400、50-450、50-500、100-200、100-250、100-500、100-350、100-400、100-450或100-500个核苷酸。
在一些实施方案中,所述多核酸部分是适体。
在一些实施方案中,检测分子包含多肽部分。在一些实施方案中,检测分子包含两个或更多个多肽部分。在其中检测分子包含多个多肽部分的实施方案中:每个多肽部分可以是相同的;多肽部分的子集可以是相同的;或者每个多肽部分可以在化学上不同。
在一些实施方案中,所述多肽部分的长度为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸。
在一些实施方案中,所述多肽部分的长度为至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少450个或至少500个氨基酸。
在一些实施方案中,所述多肽部分的长度为5-10、5-15、5-20、5-25、5-30、5-40、5-50、5-60、5-70、5-80、5-90、5-100、5-150、5-200、5-250、5-300、5-350、5-400、5-450、5-500、10-15、10-20、10-25、10-30、10-40、10-50、10-60、10-70、10-80、10-90、10-100、10-150、10-200、10-250、10-300、10-350、10-400、10-450、10-500、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、20-150、20-200、20-250、20-300、20-350、20-400、20-450、20-500、50-75、50-100、50-150、50-200、50-250、50-500、50-350、50-400、50-450、50-500、100-200、100-250、100-500、100-350、100-400、100-450或100-500个氨基酸。
在一些实施方案中,所述多肽部分是适体。在一些实施方案中,所述多肽部分是抗体。在一些实施方案中,所述多肽部分是抗原。在一些实施方案中,所述多肽部分是链霉亲和素。
在一些实施方案中,检测分子包含小分子部分,例如药物部分或发光分子部分(荧光分子部分的)。在一些实施方案中,检测分子包含两个或更多个小分子部分。在其中检测分子包含多个小分子部分的实施方案中:每个小分子部分可以是相同的;小分子部分的子集可以是相同的;或者每个小分子部分可以在化学上不同。
适用于本文所述的方法的药物和发光分子的实例是本领域技术人员已知的。如本文所用,发光分子是吸收一个或多个光子并且可以随后在一个或多个时段后发射一个或多个光子的分子。
在一些实施方案中,发光分子可以包含第一和第二生色团。在一些实施方案中,第一生色团的激发态能够通过能量转移到第二生色团而弛豫。在一些实施方案中,能量转移是福斯特共振能量转移(FRET)。这样的FRET对可用于提供具有使标记更容易从混合物中的多个发光标记中区分的性质的发光标记。在其他实施方案中,FRET对包含第一发光标记的第一生色团和第二发光标记的第二生色团。在某些实施方案中,FRET对可以吸收第一光谱范围内的激发能量并发射第二光谱范围内的发光。
在一些实施方案中,发光分子是指荧光团或染料。通常,发光分子包含芳族或杂芳族化合物,并且可以是芘、蒽、萘、萘胺、吖啶、芪、吲哚、苯并吲哚、恶唑、咔唑、噻唑、苯并噻唑、苯并恶唑、菲啶、吩恶嗪、卟啉、喹啉、乙锭、苯甲酰胺、花青、羰花青、水杨酸盐、邻氨基苯甲酸盐、香豆素、荧光素、罗丹明、氧杂蒽或其他类似化合物。
在一些实施方案中,发光分子包含选自以下一种或多种的染料:5/6-羧基罗丹明6G、5-羧基罗丹明6G、6-羧基罗丹明6G、6-TAMRA、
Figure BDA0003717531990000351
STAR 440SXP、
Figure BDA0003717531990000352
STAR 470SXP、
Figure BDA0003717531990000353
STAR 488、
Figure BDA0003717531990000354
STAR 512、
Figure BDA0003717531990000355
STAR 520SXP、
Figure BDA0003717531990000356
STAR 580、
Figure BDA0003717531990000357
STAR 600、
Figure BDA0003717531990000358
STAR 635、
Figure BDA0003717531990000361
STAR635P、
Figure BDA0003717531990000362
STAR RED、Alexa
Figure BDA0003717531990000363
350、Alexa
Figure BDA0003717531990000364
405、Alexa
Figure BDA0003717531990000365
430、Alexa
Figure BDA0003717531990000366
480、Alexa
Figure BDA0003717531990000367
488、Alexa
Figure BDA0003717531990000368
514、Alexa
Figure BDA0003717531990000369
532、Alexa
Figure BDA00037175319900003610
546、Alexa
Figure BDA00037175319900003611
555、Alexa
Figure BDA00037175319900003612
568、Alexa
Figure BDA00037175319900003613
594、Alexa
Figure BDA00037175319900003614
610-X、Alexa
Figure BDA00037175319900003615
633、Alexa
Figure BDA00037175319900003616
647、Alexa
Figure BDA00037175319900003617
660、Alexa
Figure BDA00037175319900003618
680、Alexa
Figure BDA00037175319900003619
700、Alexa
Figure BDA00037175319900003620
750、Alexa
Figure BDA00037175319900003621
790、AMCA、ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO 532、ATTO 542、ATTO 550、ATTO 565、ATTO590、ATTO 610、ATTO 620、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO 665、ATTO 680、ATTO 700、ATTO 725、ATTO 740、ATTO Oxa12、ATTO Rho101、ATTO Rho11、ATTO Rho12、ATTORho13、ATTO Rho14、ATTO Rho3B、ATTO Rho6G、ATTO Thio12、BD HorizonTM V450、
Figure BDA00037175319900003622
493/501、
Figure BDA00037175319900003623
530/550、
Figure BDA00037175319900003624
558/568、
Figure BDA00037175319900003625
564/570、
Figure BDA00037175319900003626
576/589、
Figure BDA00037175319900003627
581/591、
Figure BDA00037175319900003628
630/650、
Figure BDA00037175319900003629
650/665、
Figure BDA00037175319900003630
FL、
Figure BDA00037175319900003631
FL-X、
Figure BDA00037175319900003632
R6G、
Figure BDA00037175319900003633
TMR、
Figure BDA00037175319900003634
TR、CAL
Figure BDA00037175319900003635
Gold 540、CAL
Figure BDA00037175319900003636
Green 510、CAL
Figure BDA00037175319900003637
Orange 560、CAL
Figure BDA00037175319900003638
Red 590、CAL
Figure BDA00037175319900003639
Red 610、CAL
Figure BDA00037175319900003640
Red 615、CAL
Figure BDA00037175319900003641
Red 635、
Figure BDA00037175319900003642
Blue、CFTM350、CFTM405M、CFTM405S、CFTM488A、CFTM514、CFTM532、CFTM543、CFTM546、CFTM555、CFTM568、CFTM594、CFTM620R、CFTM633、CFTM633-V1、CFTM640R、CFTM640R-V1、CFTM640R-V2、CFTM660C、CFTM660R、CFTM680、CFTM680R、CFTM680R-V1、CFTM750、CFTM770、CFTM790、ChromeoTM 642、Chromis 425N、Chromis 500N、Chromis 515N、Chromis 530N、Chromis 550A、Chromis550C、Chromis 550Z、Chromis 560N、Chromis 570N、Chromis 577N、Chromis 600N、Chromis630N、Chromis 645A、Chromis 645C、Chromis 645Z、Chromis 678A、Chromis 678C、Chromis678Z、Chromis 770A、Chromis 770C、Chromis 800A、Chromis 800C、Chromis 830A、Chromis830C、
Figure BDA00037175319900003643
3、
Figure BDA00037175319900003644
3.5、
Figure BDA00037175319900003645
3B、
Figure BDA00037175319900003646
5、
Figure BDA00037175319900003647
5.5、
Figure BDA00037175319900003648
7、
Figure BDA00037175319900003649
350、
Figure BDA00037175319900003650
405、
Figure BDA00037175319900003651
415-Co1、
Figure BDA0003717531990000371
425Q、
Figure BDA0003717531990000372
485-LS、
Figure BDA0003717531990000373
488、
Figure BDA0003717531990000374
504Q、
Figure BDA0003717531990000375
510-LS、
Figure BDA0003717531990000376
515-LS、
Figure BDA0003717531990000377
521-LS、
Figure BDA0003717531990000378
530-R2、
Figure BDA0003717531990000379
543Q、
Figure BDA00037175319900003710
550、
Figure BDA00037175319900003711
554-R0、
Figure BDA00037175319900003712
554-R1、
Figure BDA00037175319900003713
590-R2、
Figure BDA00037175319900003714
594、
Figure BDA00037175319900003715
610-B1、
Figure BDA00037175319900003716
615-B2、
Figure BDA00037175319900003717
633、
Figure BDA00037175319900003718
633-B1、
Figure BDA00037175319900003719
633-B2、
Figure BDA00037175319900003720
650、
Figure BDA00037175319900003721
655-B1、
Figure BDA00037175319900003722
655-B2、
Figure BDA00037175319900003723
655-B3、
Figure BDA00037175319900003724
655-B4、
Figure BDA00037175319900003725
662Q、
Figure BDA00037175319900003726
675-B1、
Figure BDA00037175319900003727
675-B2、
Figure BDA00037175319900003728
675-B3、
Figure BDA00037175319900003729
675-B4、
Figure BDA00037175319900003730
679-C5、
Figure BDA00037175319900003731
680、
Figure BDA00037175319900003732
683Q、
Figure BDA00037175319900003733
690-B1、
Figure BDA00037175319900003734
690-B2、
Figure BDA00037175319900003735
696Q、
Figure BDA00037175319900003736
700-B1、
Figure BDA00037175319900003737
700-B1、
Figure BDA00037175319900003738
730-B1、
Figure BDA00037175319900003739
730-B2、
Figure BDA00037175319900003740
730-B3、
Figure BDA00037175319900003741
730-B4、
Figure BDA00037175319900003742
747、
Figure BDA00037175319900003743
747-B1、
Figure BDA00037175319900003744
747-B2、
Figure BDA00037175319900003745
747-B3、
Figure BDA00037175319900003746
747-B4、
Figure BDA00037175319900003747
755、
Figure BDA00037175319900003748
766Q、
Figure BDA00037175319900003749
775-B2、
Figure BDA00037175319900003750
775-B3、
Figure BDA00037175319900003751
775-B4、
Figure BDA00037175319900003752
780-B1、
Figure BDA00037175319900003753
780-B2、
Figure BDA00037175319900003754
780-B3、
Figure BDA00037175319900003755
800、
Figure BDA00037175319900003756
830-B2、Dyomics-350、Dyomics-350XL、Dyomics-360XL、Dyomics-370XL、Dyomics-375XL、Dyomics-380XL、Dyomics-390XL、Dyomics-405、Dyomics-415、Dyomics-430、Dyomics-431、Dyomics-478、Dyomics-480XL、Dyomics-481XL、Dyomics-485XL、Dyomics-490、Dyomics-495、Dyomics-505、Dyomics-510XL、Dyomics-511XL、Dyomics-520XL、Dyomics-521XL、Dyomics-530、Dyomics-547、Dyomics-547P1、Dyomics-548、Dyomics-549、Dyomics-549P1、Dyomics-550、Dyomics-554、Dyomics-555、Dyomics-556、Dyomics-560、Dyomics-590、Dyomics-591、Dyomics-594、Dyomics-601XL、Dyomics-605、Dyomics-610、Dyomics-615、Dyomics-630、Dyomics-631、Dyomics-632、Dyomics-633、Dyomics-634、Dyomics-635、Dyomics-636、Dyomics-647、Dyomics-647P1、Dyomics-648、Dyomics-648P1、Dyomics-649、Dyomics-649P1、Dyomics-650、Dyomics-651、Dyomics-652、Dyomics-654、Dyomics-675、Dyomics-676、Dyomics-677、Dyomics-678、Dyomics-679P1、Dyomics-680、Dyomics-681、Dyomics-682、Dyomics-700、Dyomics-701、Dyomics-703、Dyomics-704、Dyomics-730、Dyomics-731、Dyomics-732、Dyomics-734、Dyomics-749、Dyomics-749P1、Dyomics-750、Dyomics-751、Dyomics-752、Dyomics-754、Dyomics-776、Dyomics-777、Dyomics-778、Dyomics-780、Dyomics-781、Dyomics-782、Dyomics-800、Dyomics-831、
Figure BDA0003717531990000381
450、伊红、FITC、荧光素、HiLyteTM Fluor 405、HiLyteTM Fluor 488、HiLyteTM Fluor 532、HiLyteTM Fluor 555、HiLyteTM Fluor 594、HiLyteTM Fluor 647、HiLyteTM Fluor 680、HiLyteTM Fluor 750、
Figure BDA0003717531990000382
680LT、
Figure BDA0003717531990000383
750、
Figure BDA0003717531990000384
800CW、JOE、
Figure BDA0003717531990000385
640R、
Figure BDA0003717531990000386
Red 610、
Figure BDA0003717531990000387
Red 640、
Figure BDA0003717531990000388
Red 670、
Figure BDA0003717531990000389
Red 705、丽丝胺罗丹明B、Napthofluorescein、Oregon
Figure BDA00037175319900003810
488、Oregon
Figure BDA00037175319900003811
514、PacificBlueTM、Pacific GreenTM、Pacific OrangeTM、PET、PF350、PF405、PF415、PF488、PF505、PF532、PF546、PF555P、PF568、PF594、PF610、PF633P、PF647P、
Figure BDA00037175319900003812
570、
Figure BDA00037175319900003813
670、
Figure BDA00037175319900003814
705、罗丹明123、罗丹明6G、罗丹明B、罗丹明绿、罗丹明绿-X、罗丹明红、ROX、SetaTM 375、SetaTM 470、SetaTM 555、SetaTM 632、SetaTM 633、SetaTM 650、SetaTM 660、SetaTM 670、SetaTM 680、SetaTM 700、SetaTM 750、SetaTM 780、SetaTM APC-780、SetaTMPerCP-680、SetaTM R-PE-670、SetaTM 646、SeTau 380、SeTau 425、SeTau 647、SeTau 405、Square 635、Square 650、Square 660、Square 672、Square 680、磺酰罗丹明101、TAMRA、TET、Texas
Figure BDA00037175319900003815
TMR、TRITC、Yakima YellowTM
Figure BDA00037175319900003816
Zy3、Zy5、Zy5.5和Zy7。
在一些实施方案中,检测分子被固定在(例如,共价连接到)基质上。基质可以是表面(例如固体表面)、珠粒(例如磁珠)、颗粒(例如磁性颗粒)或凝胶。
(iii)发光
在一些实施方案中,确定条形码分子的来源(或多个条形码分子的来源)的方法包括通过发光来检测分子(或多个条形码分子)的条形码身份。条形码身份的检测可以是直接的或间接的(例如,通过检测检测分子的发光)。
在一些实施方案中,基于发光寿命、发光强度、亮度、吸收光谱、发射光谱、发光量子产率或其两种或更多种的组合来鉴定条形码身份。在一些实施方案中,可以基于不同的发光寿命、发光强度、亮度、吸收光谱、发射光谱、发光量子产率或其两种或更多种的组合来区分多个条形码身份。
在一些实施方案中,通过将发光分子暴露于一系列单独的光脉冲并评估从所述分子发射的每个光子的时序或其他特性来检测发光。在一些实施方案中,分子的发光寿命由从所述分子顺序发射的多个光子确定,并且发光寿命可用于鉴定所述分子。在一些实施方案中,分子的发光强度由从所述分子顺序发射的多个光子确定,并且发光强度可用于鉴定所述分子。在一些实施方案中,分子的发光寿命和发光强度由从所述分子顺序发射的多个光子确定,并且发光寿命和发光强度可用于鉴定所述分子。
在某些实施方案中,发光分子吸收一个光子并在一个时段后发射一个光子。在一些实施方案中,可以通过测量所述时段来确定或估计分子的发光寿命。在一些实施方案中,可以通过测量多个脉冲事件和发射事件的多个时段来确定或估计分子的发光寿命。在一些实施方案中,可以通过测量所述时段在多种类型的分子的发光寿命中区分分子的发光寿命。在一些实施方案中,可以通过测量多个脉冲事件和发射事件的多个时段在多种类型的分子的发光寿命中区分分子的发光寿命。在某些实施方案中,通过确定或估计标记的发光寿命来鉴定或区分在多种类型的标记中的分子。在某些实施方案中,通过在多种类型分子的多种发光寿命中区分分子的发光寿命,在多种类型的分子中鉴定或区分分子。
可以使用任何合适的方法来确定发光分子的发光寿命(例如,通过使用合适的技术测量寿命或通过确定发射的时间相关特性)。在一些实施方案中,确定分子的发光寿命包括确定相对于另一标记的寿命。在一些实施方案中,确定分子的发光寿命包括确定相对于参照的寿命。在一些实施方案中,确定分子的发光寿命包括测量寿命(例如,荧光寿命)。在一些实施方案中,确定分子的发光寿命包括确定一种或多种指示寿命的时间特性。在一些实施方案中,可以基于多个发射事件(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100或更多个发射事件)发生在相对于激发脉冲的一个或多个时间门控窗口中的分布来确定分子的发光寿命。例如,可以基于关于激发脉冲测量的光子到达时间的分布将分子的发光寿命与具有不同发光寿命的多个分子区分开。
应当理解,发光分子的发光寿命指示在标记达到激发态之后发射的光子的时序,并且可以通过指示光子的时序的信息来区分所述标记。一些实施方案可以包括通过测量与分子发射的光子相关的时间,基于所述标记的发光寿命将分子与多个分子区分开。时间分布可以提供发光寿命的指示,该指示可以从分布中确定。在一些实施方案中,可以基于时间分布将所述分子与多个分子区分开,例如通过将时间分布与对应于已知分子的参考分布进行比较。在一些实施方案中,发光寿命的值由时间分布确定。
如本文所用,在一些实施方案中,发光强度是指单位时间由发光分子发射的发射光子的数量,该发光分子通过递送脉冲激发能量而被激发。在一些实施方案中,发光强度是指单位时间检测到的发射光子的数量,这些发射光子由通过脉冲激发能量的递送而被激发的分子发射并且由特定传感器或传感器组检测。
如本文所用,在一些实施方案中,亮度是指报告单位发光分子的平均发射强度的参数。因此,在一些实施方案中,“发射强度”可用于一般指包含一种或多种分子的组合物的亮度。在一些实施方案中,分子的亮度等于其量子产率和消光系数的乘积。
如本文所用,在一些实施方案中,发光量子产率是指在给定波长处或在给定光谱范围内导致发射事件的激发事件的分数,并且通常小于1。在一些实施方案中,本文所述的发光标记的发光量子产率在0和约0.001之间、约0.001和约0.01之间、约0.01和约0.1之间、约0.1和约0.5之间、约0.5和0.9之间、或约0.9和1之间。在一些实施方案中,通过确定或估计发光量子产率来鉴定分子。
如本文所用,在一些实施方案中,激发能量是来自光源的光脉冲。在一些实施方案中,激发能量在可见光谱中。在一些实施方案中,激发能量在紫外光谱中。在一些实施方案中,激发能量在红外光谱中。在一些实施方案中,激发能量处于或接近发光标记的吸收最大值,从该发光标记中检测多个发射光子。在某些实施方案中,激发能量在约500nm和约700nm之间(例如,约500nm和约600nm之间、约600nm和约700n m之间、约500nm和约550nm之间、约550nm和约600nm之间、约600nm和约650n m之间、或约650nm和约700nm之间)。在某些实施方案中,激发能量可以是单色的或被限制在光谱范围内。在一些实施方案中,光谱范围具有约0.1nm和约1nm之间、约1nm和约2nm之间、或约2nm和约5nm之间的范围。在一些实施方案中,光谱范围具有约5nm和约10nm之间、约10nm和约50nm之间、或约50nm和约100nm之间的范围。
(iv)物理分离
在一些实施方案中,确定条形码分子的来源(或多个条形码分子的来源)的方法包括通过物理分离来检测分子(或多个条形码分子)的条形码身份。通过物理分离来检测条形码身份可以包括确定条形码分子在基质(例如,微阵列芯片)上的位置。
例如,基质可以包括多个检测分子(如本文所述),这些检测分子被组织在基质上的离散位置。在这种情况下,包含与基质上的检测分子杂交、结合或被其结合的条形码的条形码分子可以定位在检测分子的位置处。因此,在一些实施方案中,确定条形码分子的来源(或多个条形码分子的来源)的方法包括使多肽(或多个多肽)与包含多个检测分子的基质接触。
如上所述,在一些实施方案中,多肽(或多个多肽)通过将多肽(或多个多肽)沉积在固体基质上或固体基质内而被条形码化,使得多肽(或多个多肽)保持与另外的多肽(或另外的多个多肽)在物理上分离。在这样的实施方案中,确定条形码分子的来源(或多个条形码分子的来源)的方法包括检测条形码分子(或多个条形码分子)在固体基质上的位置。
C.示例性实施方案
在一些实施方案中,条形码分子包含通过DNA测序鉴定的多核酸部分。
在一些实施方案中,条形码分子包含多核酸部分,其通过使用包含多核酸部分的检测分子的杂交来鉴定。在一些实施方案中,检测分子还包含发光分子部分。在一些实施方案中,检测分子被固定在(例如,共价连接到)基质上。
在一些实施方案中,条形码分子包含多核酸部分,其通过使用包含多肽部分(例如,DNA结合蛋白、适体等)的检测分子的杂交来鉴定。在一些实施方案中,检测分子进一步包含发光分子部分。在一些实施方案中,检测分子被固定在(例如,共价连接到)基质上。
在一些实施方案中,条形码分子包含通过多肽测序鉴定的多肽部分(例如,短多肽标签)。
在一些实施方案中,条形码分子包含多肽部分(例如,DNA结合蛋白或其部分),其使用包含多核酸部分(例如,由DNA结合蛋白结合的多核酸序列,或其部分)的检测分子来鉴定。在一些实施方案中,检测分子进一步包含发光分子部分。在一些实施方案中,检测分子被固定在(例如,共价连接到)基质上。
在一些实施方案中,条形码分子包含多肽部分,其使用包含多核酸部分(例如,适体)的检测分子来鉴定。在一些实施方案中,检测分子进一步包含发光分子部分。在一些实施方案中,检测分子被固定在(例如,共价连接到)基质上。
在一些实施方案中,条形码分子包含在多肽被翻译之后对其进行的氨基酸修饰。
在一些实施方案中,条形码分子包含多肽部分(例如,抗体、抗原、适体等),其使用包含多肽部分(例如,抗原、抗体或底物等)的检测分子来鉴定。在一些实施方案中,检测分子进一步包含发光分子部分。在一些实施方案中,检测分子被固定在(例如,共价连接到)基质上。
在一些实施方案中,条形码组分包含具有不同切割谱的内切蛋白酶,其可以通过多肽测序来检测。
III.制备富集样品的方法
在一些实施方案中,在条形码化(例如,多肽条形码化)之前、同时或之后富集样品。因此,在一些方面,本公开涉及多肽富集的方法。如本文所用,术语“多肽富集”是指其中一种或多种目的多肽的丰度相对于一种或多种参考多肽(例如,复杂样品中的非目的多肽)的丰度增加的过程。如本文所用,术语“目的多肽”是指人们寻求富集的多肽。目的多肽可以包含特定的氨基酸序列。替代地或另外地,目的多肽可以包含特定的多肽修饰(例如,翻译后修饰)。这些方法有助于复杂样品的蛋白质组学分析,这些样品由许多不同的多肽组成,其中只有一些可能是感兴趣的。
在一些实施方案中,用于多肽富集的方法包括使用多个富集分子从多个多肽中选择多肽子集,从而产生包含多肽子集的富集样品。在一些实施方案中,所述方法包括使多个多肽与多个富集分子接触以产生包含多个多肽中的多肽子集的富集样品。
在一些实施方案中,用于多肽富集的方法包括:(a)使多个多肽与多个富集分子接触,其中多个富集分子中的至少富集分子的子集与多个多肽中的多肽子集结合,从而产生结合的多肽子集和未结合的多肽子集;和(b)分离结合的多肽子集以产生包含多个多肽中的多肽子集的富集样品。
在一些实施方案中,用于多肽富集的方法包括:(a)使多个多肽与多个富集分子接触,其中多个富集分子中的至少富集分子的子集与多个多肽中的多肽子集结合,从而产生结合的多肽子集和未结合的多肽子集;和(b)分离未结合的多肽子集以产生包含多个多肽中的多肽子集的富集样品。
在前述段落中描述的实施方案中,应理解富集分子与多肽的结合等同于多肽与富集分子的结合。因此,上述实施方案中的步骤(a)可以等效地描述为:(a)使多个多肽与多个富集分子接触,其中多个富集分子中的至少富集分子的子集被多个多肽中的多肽子集结合,从而产生结合的多肽子集和未结合的多肽子集。
还应理解,上述实施方案的步骤(a)和(b)可以使用另外的多个富集分子重复一次或多次以产生进一步富集的样品。例如,在一些实施方案中,所述方法包括:(a)使多个多肽与第一多个富集分子接触,其中第一多个富集分子中的至少富集分子的子集与多个多肽中的多肽的子集结合,从而产生第一结合的多肽子集和第一未结合的多肽子集;(b)分离(a)的第一结合的多肽子集或第一未结合的多肽子集;和(c)用一个或多个另外的多个富集分子反复重复步骤(a)和(b)以产生包含多个多肽中的多肽子集的富集样品。在一些实施方案中,使用第二、第三、第四、第五、第六、第七、第八、第九、第十或任何数量的另外的多个富集分子重复步骤(a)和(b)。
例如,在一些实施方案中,所述方法包括:(a)使多个多肽与第一多个富集分子接触,其中第一多个富集分子中的至少富集分子的子集与多个多肽中的多肽子集结合,从而产生第一结合的多肽子集和第一未结合的多肽子集;(b)分离(a)的第一结合的多肽子集或第一未结合的多肽子集;(c)使(b)的分离的多肽与第二多个富集分子接触,其中第二多个富集分子中的至少富集分子的子集与(b)中分离的多肽子集结合,从而产生第二结合的多肽子集和第二未结合的多肽子集;(d)分离(c)的第二结合的多肽子集或第二未结合的多肽子集以产生包含多个多肽中的多肽子集的富集样品。
替代地或另外地,富集方法可以包括色谱法(例如,尺寸排阻、离子交换等)、等电聚焦、膜过滤、分子筛过滤、浓缩、沉淀(例如,冷沉淀)、干燥、透析或其组合。
在一些实施方案中,所述方法包括使复杂样品与本文所述的试剂盒或装置接触。参见“用于样品制备的试剂盒”和“用于样品制备和样品测序的装置”。
在一些实施方案中,富集样品中的多肽是相同的(即,含有相同的氨基酸序列)。在一些实施方案中,富集样品包含至少两种独特的多肽(即,具有不同的氨基酸序列)。例如,在一些实施方案中,富集样品包含至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少11种、至少12种、至少13种、至少14种、至少15种、至少16种、至少17种、至少18种、至少19种、至少20种、至少25种、至少30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种或至少100种独特的多肽。在一些实施方案中,富集样品包含1-2、1-5、1-10、1-15、1-20、1-30、1-40、1-50、1-60、1-70、1-80、1-90、1-100、2-5、2-10、2-15、2-20、2-30、2-40、2-50、2-60、2-70、2-80、2-90、2-100、5-10、5-15、5-20、5-30、5-40、5-50、5-60、5-70、5-80、5-90、5-100、10-15、10-20、10-30、10-40、10-50、10-60、10-70、10-80、10-90、10-100、15-20、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、30-40、30-50、30-60、30-70、30-80、30-90、30-100、40-50、40-60、40-70、40-80、40-90、40-100、50-60、50-70、50-80、50-90或50-100种独特的多肽。
在一些实施方案中,富集样品包含具有至少50%、60%、70%、80%、90%、95%或99%序列同一性的多肽。在一些实施方案中,富集样品包含具有一种或多种多肽修饰(例如,翻译后修饰)的多肽。翻译后修饰的实例是本领域技术人员已知的,并且包括但不限于乙酰化、腺苷酰化、ADP-核糖基化、烷基化(例如甲基化)、酰胺化、精氨酰化、生物素化、丁酰化、氨甲酰化、羰基化、羧基化、瓜氨酸化、脱酰胺、消除、甲酰化、糖基化(例如,N-连接糖基化、O-连接糖基化)、glipyatyon、糖化、羟基化、碘化、ISG化、异戊二烯化、脂化、丙二酰化、肉豆蔻酰化、类泛素化、硝化、氧化、棕榈酰化聚乙二醇化、磷酸化、磷酸泛酰巯基乙炔化、聚乙二醇化、聚谷氨酰化、异戊二烯化、丙酰化、pupylation、S-谷胱甘肽化、S-亚硝基化、S-亚磺酰化、S-亚磺酰化、S-磺酰化、琥珀酰化、硫酸化、SUMO化和泛素化。
A.富集分子
如本文所用,术语“富集分子”是指表现出优先与(或被)一种或多种靶多肽结合的分子。富集分子可以通过与靶多肽的氨基酸序列的直接相互作用而与(或被)靶多肽结合。替代地或另外地,富集分子可以通过与靶多肽的修饰(例如,翻译后修饰)进行相互作用而与(或被)靶多肽结合。富集分子与(或被)靶多肽的结合可以通过静电相互作用、疏水相互作用、互补形状或其组合来介导。
在一些实施方案中,靶多肽是目的多肽。在其他实施方案中,靶多肽不是目的多肽。
优先与一种或多种靶多肽(或靶多肽变体)结合的示例性富集分子包括免疫球蛋白、anticalin、脂质运载蛋白(lipocalin)、DARPins、适体、酶、凝集素和肽相互作用结构域。
如本文所用,术语“免疫球蛋白”是指特征在于具有免疫球蛋白折叠并且起抗体作用并与一种或多种底物(例如,靶多肽)结合的多肽。因此,术语“免疫球蛋白”涵盖常规免疫球蛋白(即IgA、IgD、IgE、IgG和IgM)、单链可变片段(scFv)、抗原结合片段(Fab)、亲和体(affibody)和单域抗体(sdAb),例如纳米抗体、VHH和VNAR。
如本文所用,术语“适体”是指优先与一种或多种靶分子(例如,靶多肽)结合的多核酸(例如,DNA或RNA)或多肽。尽管在自然界中发现了一些实例,但适体通常通过反复几轮的体外选择来进行工程化。
如本文所用,术语“酶”是指在结合一种或多种底物(例如,靶多肽)时加速化学反应的大分子生物催化剂。通常,酶会在化学反应完成后释放其底物。因此,在其中富集分子包含酶的一些实施方案中,酶被催化失活以增加酶保持与底物结合的可能性。催化失活可以通过一种或多种酶促辅因子(即对于酶作为催化剂的活性所需的非蛋白质化合物或金属离子)的变异和/或消耗来进行。
如本文所用,术语“肽相互作用结构域”是指与一种或多种多肽(例如,靶多肽)相互作用的多肽(或多肽的一部分)。例如,肽相互作用结构域可以是支架蛋白、多蛋白复合物的多肽或其部分。
在一些实施方案中,富集分子包含免疫球蛋白、适体、酶和/或肽相互作用结构域。
优先被一种或多种靶多肽结合的示例性富集分子包括寡核苷酸(例如,双链DNA、单链DNA、双链RNA、单链RNA等)、寡糖(或多糖)、脂质、糖蛋白、受体配体、受体激动剂、受体拮抗剂、酶底物和酶辅因子。
在一些实施方案中,富集分子包含寡核苷酸(例如,双链DNA、单链DNA、双链RNA、单链RNA等)、寡糖、脂质、受体配体、受体激动剂、受体拮抗剂、酶底物和/或酶辅因子。
本文使用优先结合来表征富集分子以强调:(i)富集分子不需要表现出高特异性(即,仅与单个靶多肽结合(或被其结合)到可观的水平);(ii)富集分子可能表现出某种程度的脱靶结合(即,与脱靶分子结合(或被其结合)到可检测的水平);和(iii)富集分子不需要以100%的效率与靶多肽结合(即,即使在存在过量富集分子的情况下,也并非必然需要复杂样品中的所有靶多肽都被结合)。
在一些实施方案中,富集分子优先与单个靶多肽结合(或优先被其结合)。然而,在其他实施方案中,富集分子优先与两个或更多个靶多肽结合(或优先被其结合)。
在一些实施方案中,富集分子表现出优先与至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少25个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、或至少100个、至少200个、至少300个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个、至少1000个、至少2000个、至少3000个、至少4000个、至少5000个或至少10,000个靶多肽结合(或优先被其结合)。
在一些实施方案中,富集分子表现出优先与二、三、四、五、六、七、八、九、十、十一、十二、十三、十四或十五个靶多肽结合(或优先被其结合)。
在一些实施方案中,富集分子表现出优先与1-2、1-5、1-10、1-15、1-20、1-30、1-40、1-50、1-60、1-70、1-80、1-90、1-100、2-5、2-10、2-15、2-20、2-30、2-40、2-50、2-60、2-70、2-80、2-90、2-100、5-10、5-15、5-20、5-30、5-40、5-50、5-60、5-70、5-80、5-90、5-100、10-15、10-20、10-30、10-40、10-50、10-60、10-70、10-80、10-90、10-100、15-20、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、30-40、30-50、30-60、30-70、30-80、30-90、30-100、40-50、40-60、40-70、40-80、40-90、40-100、50-60、50-70、50-80、50-90、或50-100、100-200、100-300、100-400、100-500、100-600、100-700、100-800、100-900、100-1000、100-5000、100-10,000、500-600、500-700、500-800、500-900、500-1000、500-5000、500-10,000、1000-5000或1000-10,000个靶多肽结合(或优先被其结合)。
在一些实施方案中,富集分子表现出优先与多个相关靶多肽(例如,2、3、4、5、6、7、8、9、10、20、30、40、50或更多个相关多肽)结合(或优先被其结合),所述多肽具有至少50%、60%、70%、80%、90%、95%或99%的序列同源性。
在一些实施方案中,富集分子表现出优先与翻译后修饰结合(或优先被其结合),翻译后修饰例如乙酰化、腺苷酰化、ADP-核糖基化、烷基化(例如甲基化)、酰胺化、精氨酰化、生物素化、丁酰化、氨甲酰化、羰基化、羧基化、瓜氨酸化、脱酰胺、消除、甲酰化、糖基化(例如,N-连接糖基化、O-连接糖基化)、glipyatyon、糖化、羟基化、碘化、ISG化、异戊二烯化、脂化、丙二酰化、肉豆蔻酰化、类泛素化、硝化、氧化、棕榈酰化聚乙二醇化、磷酸化、磷酸泛酰巯基乙炔化、聚乙二醇化、聚谷氨酰化、异戊二烯化、丙酰化、pupylation、S-谷胱甘肽化、S-亚硝基化、S-亚磺酰化、S-亚磺酰化、S-磺酰化、琥珀酰化、硫酸化、SUMO化和泛素化。
富集分子可以被固定在(例如,共价连接到)基质(例如,如“用于样品制备和样品测序的装置”中描述的捕获探针)上。基质可以是表面(例如固体表面)、珠粒(例如磁珠)、颗粒(例如磁性颗粒)或凝胶。
(i)多个富集分子
通常,本文所述的富集方法利用多个富集分子。多个富集分子可以在化学上相同(即,多个具有一种富集分子“类型”)。替代地,多个富集分子可以包含不同富集分子的组合(即,具有两种或更多种富集分子“类型”)。
在一些实施方案中,多个富集分子包含单一富集分子类型。在其他实施方案中,多个富集分子包含两种或更多种、三种或更多种、四种或更多种、五种或更多种、六种或更多种、七种或更多种、八种或更多种、九种或更多种、十种或更多种、十一种或更多种、十二种或更多种、十三种或更多种、十四种或更多种、或十五种或更多种富集分子类型的组合。在一些实施方案中,多个富集分子包含至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少11种、至少12种、至少13种、至少14种、至少15种、至少16种、至少17种、至少18种、至少19种、至少20种、至少25种、至少30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种、或至少100种、至少200种、至少300种、至少400种、至少500种富集分子类型。
在一些实施方案中,多个富集分子包含两种、三种、四种、五种、六种、七种、八种、九种、十种、十一种、十二种、十三种、十四种或十五种富集分子类型的组合。
在一些实施方案中,多个富集分子包含1-2、1-5、1-10、1-15、1-20、1-30、1-40、1-50、1-60、1-70、1-80、1-90、1-100、2-5、2-10、2-15、2-20、2-30、2-40、2-50、2-60、2-70、2-80、2-90、2-100、5-10、5-15、5-20、5-30、5-40、5-50、5-60、5-70、5-80、5-90、5-100、10-15、10-20、10-30、10-40、10-50、10-60、10-70、10-80、10-90、10-100、15-20、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、30-40、30-50、30-60、30-70、30-80、30-90、30-100、40-50、40-60、40-70、40-80、40-90、40-100、50-60、50-70、50-80、50-90、或50-100、100-200、100-300、100-400或100-500种富集分子类型的组合。
在一些实施方案中,多个富集分子中的每个富集分子优先与单个靶多肽结合(或优先被其结合)。在其他实施方案中,多个富集分子中的一个或多个(例如,子集)富集分子表现出优先与两个或更多个靶多肽结合(或优先被其结合)。在其他实施方案中,多个富集分子中的每个富集分子表现出优先与两个或更多个靶多肽结合(或优先被其结合)。
在一些实施方案中,多个富集分子中的一种或多种(例如,子集)富集分子与翻译后多肽修饰结合。在其他实施方案中,多个富集分子中的每个富集分子表现出优先与两个或更多个翻译后多肽修饰结合。
在一些实施方案中,多个富集分子中的每个富集分子被结合到基质(例如,如“用于样品制备和样品测序的装置”中描述的捕获探针),例如表面(例如固体表面)、珠粒(例如磁珠)、颗粒(例如磁性颗粒,或凝胶)。在一些实施方案中,多个富集分子中的一个或多个(例如,子集)被结合到基质。因此,在一些实施方案中,当包含多个多肽的样品接触基质时,会发生多个多肽与多个富集分子的接触。
例如,在一些实施方案中,富集分子被固定在(例如,共价连接或交联到)凝胶上并且样品被拉过凝胶。在一些实施方案中,富集分子被固定在(例如,共价连接到)珠粒(例如,磁珠)上,然后被拉下。
(ii)多重富集分子
如上所述,在一些实施方案中,所述方法包括:(a)使多个多肽与第一多个富集分子接触,其中第一多个富集分子中的至少富集分子的子集与多个多肽中的多肽子集结合,从而产生第一结合的多肽子集和第一未结合的多肽子集;(b)分离(a)的第一结合的多肽子集或第一未结合的多肽子集;和(c)用一种或多种另外的多个富集分子反复重复步骤(a)和(b)以产生包含多个多肽中的多肽子集的富集样品。在一些实施方案中,使用第二、第三、第四、第五、第六、第七、第八、第九、第十或任何数量的另外的多个富集分子重复步骤(a)和(b)。
在一些实施方案中,多肽富集方法中使用的每个多个富集分子中是独特的(即,每个多个富集分子包含不同的多个富集分子)。在其他实施方案中,两个或更多个多个富集分子是相同的。在一些实施方案中,至少一个多个富集分子中靶向翻译后多肽修饰并且至少一个多个富集分子不靶向翻译后修饰。
例如,第一富集步骤(利用第一多个富集分子)可以富集特定的翻译后多肽修饰,并且第二富集步骤(利用第二多个富集分子)可以富集特定的多肽(和该多肽的变体)。替代地,第一富集步骤(利用第一多个富集分子)可以富集特定的多肽(和该多肽的变体),并且第二富集步骤(利用第二多个富集分子)可以富集特定的翻译后修饰。
B.多肽修饰
复杂样品的一个或多个多肽可以在上述多肽富集之前、同时和/或之后进行体外修饰。例如,在一些实施方案中,在进行多肽富集之前、同时和/或之后将复杂样品与修饰剂接触。其中,修饰剂可以介导多肽片段化、多肽变性、翻译后修饰的添加和/或一种或多种官能团的封闭。
在一些实施方案中,复杂样品的一个或多个多肽通过片段化进行修饰。在一些实施方案中,片段化包括酶促消化。在一些实施方案中,通过在消化条件下使多肽与内肽酶(例如胰蛋白酶)接触来进行消化。在一些实施方案中,片段化包括化学消化。用于化学和酶促消化的合适试剂的实例是本领域已知的,并且包括但不限于胰蛋白酶、化学胰蛋白酶、Lys-C、Arg-C、Asp-N、Lys-N、BNPS-粪臭素、CNBr、半胱天冬酶、甲酸、谷氨酰内肽酶、羟胺、碘代苯甲酸、中性粒细胞弹性蛋白酶、胃蛋白酶、脯氨酸-内肽酶、蛋白酶K、葡萄球菌肽酶I、嗜热菌蛋白酶和凝血酶。
在一些实施方案中,复杂样品的一个或多个多肽通过变性(例如,通过热和/或化学方式)进行修饰。
在一些实施方案中,复杂样品的一个或多个多肽通过体外翻译后修饰进行修饰,例如通过乙酰化、腺苷酰化、ADP-核糖基化、烷基化(例如甲基化)、酰胺化、精氨酰化、生物素化、丁酰化、氨甲酰化、羰基化、羧基化、瓜氨酸化、脱酰胺、消除、甲酰化、糖基化(例如,N-连接糖基化、O-连接糖基化)、glipyatyon、糖化、羟基化、碘化、ISG化、异戊二烯化、脂化、丙二酰化、肉豆蔻酰化、类泛素化、硝化、氧化、棕榈酰化聚乙二醇化、磷酸化、磷酸泛酰巯基乙炔化、聚乙二醇化、聚谷氨酰化、异戊二烯化、丙酰化、pupylation、S-谷胱甘肽化、S-亚硝基化、S-亚磺酰化、S-亚磺酰化、S-磺酰化、琥珀酰化、硫酸化、SUMO化或泛素化。
在一些实施方案中,复杂样品的一个或多个多肽通过封闭一种或多种官能团(例如,游离羧酸根基团和/或硫醇基团)进行修饰。
在一些实施方案中,封闭游离羧酸根基团是指对这些基团改变了相对于未经修饰的羧酸根的化学反应性的化学修饰。合适的羧酸根封闭方法是本领域已知的并且应该将侧链羧酸根基团修饰为在化学上不同于待官能化的多肽的羧基末端羧酸根基团。在一些实施方案中,封闭游离羧酸根基团包括多肽的游离羧酸根基团的酯化或酰胺化。在一些实施方案中,封闭游离羧酸根基团包括多肽的游离羧酸根基团的甲酯化,例如,通过使多肽与甲醇HCl反应。可用于封闭游离羧酸根基团的试剂和技术的另外实例包括但不限于4-磺基-2,3,5,6-四氟苯酚(STP)和/或碳二亚胺例如N-(3-二甲基氨基丙基)-N'-乙基碳二亚胺盐酸盐(EDAC)、脲试剂、重氮甲烷、用于Fischer酯化的醇和酸,使用N-羟基琥珀酰亚胺(NHS)形成NHS酯(可能作为后续酯或胺形成的中间体),或与羰基二咪唑(CDI)反应或形成混合酸酐,或任何其他修饰或封闭羧酸的方法,可能通过形成酯或酰胺。
在一些实施方案中,封闭游离硫醇基团是指对这些基团改变了相对于未经修饰的硫醇的化学反应性的化学修饰。在一些实施方案中,封闭游离硫醇基团包括对多肽的游离硫醇基团进行还原和烷基化。在一些实施方案中,通过使多肽与二硫苏糖醇(DTT)以及碘乙酰胺和碘乙酸中的一种或两种接触来进行还原和烷基化。可以使用的另外的和替代的半胱氨酸还原试剂的实例是众所周知的,并且包括但不限于2-巯基乙醇、三(2-羧乙基)膦盐酸盐(TCEP)、三丁基膦、二硫丁胺(DTBA)或任何能够还原硫醇基团的试剂。可以使用的另外的和替代的半胱氨酸封闭(例如,半胱氨酸烷基化)试剂的实例是众所周知的,并且包括但不限于丙烯酰胺、4-乙烯基吡啶、N-乙基马来酰亚胺(NEM)、N-ε-马来酰亚胺基己酸(EMC),或任何修饰半胱氨酸以防止二硫键形成的试剂。
在一些实施方案中,多肽的N末端氨基酸或C末端氨基酸被修饰。
在一些实施方案中,多肽的羧基末端在包括以下的方法中被修饰:(i)封闭多肽的游离羧酸根基团;(ii)使多肽变性(例如,通过热和/或化学方式);(iii)封闭多肽的游离硫醇基团;(iv)消化多肽以产生至少一个包含游离的C末端羧酸根基团的多肽片段;和(v)将功能部分缀合(例如,化学地)至游离的C末端羧酸根基团。在一些实施方案中,所述方法进一步包括,在(i)之后和(ii)之前,对包含多肽的样品进行透析。
在一些实施方案中,以包括以下的方法修饰多肽的羧基末端:(i)使多肽变性(例如,通过热和/或化学方式);(ii)封闭多肽的游离硫醇基团;(iii)消化多肽以产生至少一个包含游离的C末端羧酸根基团的多肽片段;(iv)封闭游离C末端羧酸根基团以产生至少一个包含封闭的C末端羧酸根基团的多肽片段;和(v)将功能部分缀合(例如,酶促地)至封闭的C末端羧酸根基团。在一些实施方案中,所述方法进一步包括,在(iv)之后和(v)之前,对包含多肽的样品进行透析。
在一些实施方案中,复杂样品在富集之前与修饰剂接触以介导多肽片段化、多肽变性、翻译后修饰的添加和/或一种或多种官能团的封闭。替代地或另外地,在一些实施方案中,复杂样品在富集的同时与修饰剂接触以介导多肽片段化、多肽变性、翻译后修饰的添加和/或一种或多种官能团的封闭。替代地或另外地,在一些实施方案中,复杂样品(或源自其的样品,包含一个或多个目的多肽)在富集之后与修饰剂接触以介导多肽片段化、多肽变性、翻译后修饰的添加和/或一种或多种官能团的封闭。
IV.多肽测序方法学
在一些实施方案中,对多重样品的分子(例如,多肽)进行测序。因此,在一些方面,本公开涉及多肽测序和鉴定的方法。对多肽分子进行测序的各种方法是本领域普通技术人员已知的,并且包括质谱法(例如,肽质量指纹图谱和串联质谱法)和Edman降解。另外,本文描述了先前未描述的对多肽进行测序的方法。
如本文所用,关于多肽的“测序”、“序列确定”、“确定序列”和类似术语包括确定多肽的部分氨基酸序列信息以及完整氨基酸序列信息。也就是说,该术语包括序列比较、指纹识别和关于靶分子的类似信息水平,以及靶分子在目的区域内的每个氨基酸的明确鉴定和排序。该术语包括鉴定多肽的单个氨基酸(或单个氨基酸的概率)。在一些实施方案中,鉴定了多肽的多于一个氨基酸(或多于一个氨基酸的概率)。因此,在一些实施方案中,如本文所用的术语“氨基酸序列”和“多肽序列”可以指多肽材料本身并且不限于在生物化学上表征特定多肽的特定序列信息(例如,表示氨基酸顺序的从一个末端到另一个末端的字母串)。
在一些实施方案中,确定多肽内特定位置处氨基酸的概率并在概率阵列中进行说明。例如,对于由两个氨基酸组成的多肽,术语“测序”、“序列确定”、“确定序列”等术语可能涉及确定位置1和/或位置2处的氨基的概率,例如[[0.80,0.12.0.05,0.01,0.01,0.01,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00],[0.00,0.10,0.90,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00]],其中阵列中的概率分别对应于A、R、N、D、C、Q、E、G、H、I、L、K、M、F、P、S、T、W、Y和V。本领域普通技术人员将理解,该实例(和示例性概率阵列)可以扩大到适应另外的氨基酸身份(例如,修饰的氨基酸)的分析,例如本文所述的那些。
在一些实施方案中,多肽分子的测序包括鉴定多肽分子中至少两个(例如,至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个或更多个)氨基酸(或氨基酸概率)。在一些实施方案中,所述至少两个氨基酸是连续的氨基酸。在一些实施方案中,所述至少两个氨基酸是非连续的氨基酸。
在一些实施方案中,多肽分子的测序包括鉴定多肽分子中所有氨基酸的少于100%(例如,少于99%、少于95%、少于90%、少于85%、少于80%、少于75%、少于70%、少于65%、少于60%、少于55%、少于50%、少于45%、少于40%、少于35%、少于30%、少于25%、少于20%、少于15%、少于10%、少于5%、少于1%或更少)。例如,在一些实施方案中,多肽分子的测序包括鉴定多肽分子中一种类型的氨基酸的少于100%(例如,鉴定多肽分子中的一种类型的所有氨基酸的一部分)。在一些实施方案中,多肽分子的测序包括鉴定多肽分子中每种类型的氨基酸的少于100%。
在一些实施方案中,多肽分子的测序包括鉴定多肽中至少1、至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少55、至少60、至少65、至少70、至少75、至少80、至少85、至少90、至少95、至少100或更多种类型的氨基酸。
在一些实施方案中,本申请提供了用于通过随时间鉴定存在于多肽末端的一系列氨基酸(例如,通过末端氨基酸的迭代检测和裂解)来对多肽进行测序的组合物和方法。在其他实施方案中,本申请提供了用于通过鉴定多肽的标记的氨基含量并与参考序列数据库进行比较来对多肽进行测序的组合物和方法。
在一些实施方案中,本申请提供了用于通过对多肽的多个片段进行测序来对多肽进行测序的组合物和方法。在一些实施方案中,对多肽进行测序包括组合多个多肽片段的序列信息以鉴定和/或确定多肽的序列。在一些实施方案中,组合序列信息可以由计算机硬件和软件来执行。参见“用于样品制备和样品测序的装置”。本文所述的方法可以允许对一组相关的多肽,例如生物体的整个蛋白质组进行测序。在一些实施方案中,根据本申请的方面,多个单分子测序反应并行进行(例如,在单个芯片上)。例如,在一些实施方案中,多个单分子测序反应各自在单个芯片或阵列上的单独样品孔中进行。
在一些实施方案中,本文提供的方法可用于对包含多肽的复杂混合物或富集混合物的样品中的单个多肽进行测序和鉴定。在一些实施方案中,本申请提供了独特鉴定多肽的复杂混合物或富集混合物中的单个多肽的方法。在一些实施方案中,通过确定多肽的部分氨基酸序列来检测混合样品中的单个多肽。在一些实施方案中,多肽的部分氨基酸序列在大约5到50个氨基酸的连续区段内。
不希望囿于任何特定理论的,认为大多数人类蛋白质可以参考蛋白质组数据库使用不完整的序列信息来鉴定。例如,人类蛋白质组的简单建模表明,大约98%的蛋白质可以通过仅检测6到40个氨基酸的区段中的四种类型的氨基酸来独特鉴定(参见例如Swaminathan等人,PLoS Comput Biol.2015,11(2):e1004080;和Yao等人,Phys.Biol.2015,12(5):055003)。因此,多肽的复杂混合物或富集混合物可以被降解(例如,化学降解、酶促降解)成大约6到40个氨基酸的短多肽片段,并且对该多肽文库的测序将揭示存在于原始复杂混合物或富集混合物中的每种多肽的身份和丰度。用于通过确定部分序列信息来选择性标记氨基酸和鉴定多肽的组合物和方法在2015年9月15日提交的标题为“SINGLE MOLECULE PEPTIDE SEQUENCING”的美国专利申请号15/510,962中进行了详细描述,其全文通过引用的方式并入本文。
实施方案能够以高准确度,例如以至少约50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%、99.99%、99.999%或99.9999%的准确度对单个多肽分子进行测序。在一些实施方案中,单分子测序中使用的靶分子是被固定在固体支持物表面(例如样品孔的底部表面或侧壁表面)上的多肽。根据本申请,样品孔还可以包含测序反应所需的任何其他试剂,例如一种或多种合适的缓冲液、辅因子、标记的亲和试剂和酶(例如有催化活性或无活性的外肽酶,其可以被发光标记或不被标记)。
在一些方面,根据本申请的测序可以涉及将多肽固定在基质(例如,固相支持物,例如芯片,例如本文所述的集成装置)的表面上。在一些实施方案中,可以将多肽固定在基质上的样品孔的表面上(例如,样品孔的底部表面上)。在一些实施方案中,多肽的N末端氨基酸是固定化的(例如,连接到表面)。在一些实施方案中,多肽的C末端氨基酸是固定化的(例如,连接到表面)。在一些实施方案中,一种或多种非末端氨基酸是固定化的(例如,连接到表面)。可以使用任何合适的共价或非共价键连接固定化的氨基酸,例如如本申请中所述。在一些实施方案中,多个多肽被连接到多个样品孔(例如,一个多肽连接到每个样品孔的表面,例如底部表面),例如在基质上的样品孔的阵列中。
在一些方面,根据本申请的测序可以使用允许单分子分析的系统进行。所述系统可以包括测序装置和被设置为与测序装置接合的仪器。参见“用于样品制备和样品测序的装置”。
A.标记的亲和试剂和使用方法
在一些实施方案中,本文提供的方法包括使多肽与选择性结合一种类型的末端氨基酸的标记的亲和试剂(本文也称为氨基酸识别分子,其可以包含或不包含标记)接触。如本文所用,在一些实施方案中,末端氨基酸可以指多肽的氨基末端氨基酸或多肽的羧基末端氨基酸。在一些实施方案中,标记的亲和试剂选择性结合一种类型的末端氨基酸而不是其他类型的末端氨基酸。在一些实施方案中,标记的亲和试剂选择性结合一种类型的末端氨基酸而不是相同类型的内部氨基酸。在其他实施方案中,标记的亲和试剂在多肽的任何位置选择性结合一种类型的氨基酸,例如,与末端氨基酸和内部氨基酸相同类型的氨基酸。
如本文所用,在一些实施方案中,一种类型的氨基酸是指二十种天然存在的氨基酸中的一种或其类型的子集。在一些实施方案中,一种类型的氨基酸是指二十种天然存在的氨基酸之一的经修饰的变体或其未经修饰的和/或经修饰的变体的子集。经修饰的氨基酸变体的实例包括但不限于经翻译后修饰(例如乙酰化、ADP-核糖基化、半胱天冬酶裂解、瓜氨酸化、甲酰化、N-连接糖基化、O-连接糖基化、羟基化、甲基化、肉豆蔻酰化、类泛素化、硝化、氧化、棕榈酰化、磷酸化、异戊二烯化、S-亚硝基化、硫酸化、苏素化和泛素化)的变体、经化学修饰的变体、非天然氨基酸和蛋白原氨基酸(例如硒代半胱氨酸和吡咯赖氨酸)。在一些实施方案中,氨基酸类型的子集包括多于一种且少于二十种氨基酸,其具有一种或多种相似的生化特性。例如,在一些实施方案中,一种类型的氨基酸是指选自以下的一种类型:具有带电荷侧链(例如,带正电荷和/或带负电荷的侧链)的氨基酸、具有极性侧链(例如,极性不带电荷的侧链)的氨基酸、具有非极性侧链(例如,非极性脂肪族和/或芳香族侧链)的氨基酸和具有疏水性侧链的氨基酸。
在一些实施方案中,本文提供的方法包括使多肽与选择性结合一种或多种类型的末端氨基酸的一种或多种标记的亲和试剂接触。作为说明性和非限制性实例,当在本申请的方法中使用四种标记的亲和试剂时,任何一种试剂选择性结合一种类型的末端氨基酸,所述末端氨基酸不同于其他三种氨基酸中的任何一种选择性结合的另一种类型的氨基酸(例如,第一试剂结合第一类型,第二试剂结合第二类型,第三试剂结合第三类型,第四试剂结合末端氨基酸的第四类型)。出于此讨论的目的,在本文所述的方法的上下文中的一种或多种标记的亲和试剂可以替代地称为一组标记的亲和试剂。
在一些实施方案中,一组标记的亲和试剂包括至少一种和多达六种标记的亲和试剂。例如,在一些实施方案中,一组标记的亲和试剂包括一种、两种、三种、四种、五种或六种标记的亲和试剂。在一些实施方案中,一组标记的亲和试剂包括十种或更少的标记的亲和试剂。在一些实施方案中,一组标记的亲和试剂包括八种或更少的标记的亲和试剂。在一些实施方案中,一组标记的亲和试剂包括六种或更少的标记的亲和试剂。在一些实施方案中,一组标记的亲和试剂包括四种或更少的标记的亲和试剂。在一些实施方案中,一组标记的亲和试剂包括三种或更少的标记的亲和试剂。在一些实施方案中,一组标记的亲和试剂包括两种或更少的标记的亲和试剂。在一些实施方案中,一组标记的亲和试剂包括四种标记的亲和试剂。在一些实施方案中,一组标记的亲和试剂包括至少两种和多达二十种(例如,至少两种和多达十种、至少两种和多达八种、至少四种和多达二十种、至少四种和多达到十种)标记的亲和试剂。在一些实施方案中,一组标记的亲和试剂包括超过二十种(例如,20至25、20至30)亲和试剂。然而,应当理解,可以根据本申请的方法使用任意数量的亲和试剂以适应所需用途。
根据本申请,在一些实施方案中,通过检测标记的亲和试剂(例如,包含发光标记的氨基酸识别分子)的发光来鉴定一种或多种类型的氨基酸。在一些实施方案中,标记的亲和试剂包括选择性结合一种类型的氨基酸的亲和试剂和具有与该亲和试剂相关的发光的发光标记。以这种方式,发光(例如,发光寿命、发光强度和本文别处描述的其他发光特性)可以与亲和试剂的选择性结合相关以鉴定多肽的氨基酸。在一些实施方案中,多种类型的标记的亲和试剂可用于根据本申请的方法中,其中每种类型包括具有可从多种中独特识别的发光的发光标记。合适的发光标记可以包括发光分子,例如荧光团染料,并且在本文别处进行了描述。
在一些实施方案中,通过检测标记的亲和试剂的一种或多种电特性来鉴定一种或多种类型的氨基酸。在一些实施方案中,标记的亲和试剂包括选择性结合一种类型的氨基酸的亲和试剂和与该亲和试剂相关的电导标记。以这种方式,一种或多种电特性(例如,电荷、电流振荡颜色(current oscillation color)和其他电特性)可以与亲和试剂的选择性结合相关以鉴定多肽的氨基酸。在一些实施方案中,多种类型的标记的亲和试剂可用于根据本申请的方法中,其中每种类型包含电导标记,其产生电信号的变化(例如,电导的变化,例如特征模式的电导率和电导率转变的幅度),其可从多个中独特地鉴定。在一些实施方案中,多种类型的标记的亲和试剂各自包含具有不同数量的带电荷基团(例如,不同数量的带负电荷和/或带正电荷的基团)的电导标记。因此,在一些实施方案中,电导标记是电荷标记。电荷标记的实例包括树枝状大分子、纳米颗粒、核酸和其他具有多个带电荷基团的聚合物。在一些实施方案中,电导标记可通过其净电荷(例如,净正电荷或净负电荷)、通过其电荷密度和/或通过其带电荷基团的数量来独特地鉴定。
在一些实施方案中,亲和试剂(例如,氨基酸识别分子)可以由本领域技术人员使用常规已知技术进行工程化。在一些实施方案中,期望的性质可以包括仅当一种类型的氨基酸位于多肽的末端(例如,N末端或C末端)时才以高亲和力选择性结合一种类型的氨基酸的能力。在其他实施方案中,期望的性质可以包括当一种类型的氨基酸位于多肽的末端(例如,N末端或C末端)时以及当其位于多肽的内部位置时以高亲和力选择性结合一种类型的氨基酸的能力。
如本文所用,在一些实施方案中,术语“选择性的”和“特异性的”(及其变形,例如,选择性地、特异性地、选择性、特异性)是指优先结合相互作用。例如,在一些实施方案中,选择性结合一种类型的氨基酸的标记的亲和试剂优先结合一种类型而不是另一种类型的氨基酸。选择性结合相互作用将区分一种类型的氨基酸(例如,一种类型的末端氨基酸)和其他类型的氨基酸(例如,其他类型的末端氨基酸),通常超过约10至100倍或更多(例如,超过约1,000或10,000倍)。因此,应当理解,选择性结合相互作用可以指相比于其他类型的氨基酸可以与一种类型的氨基酸独特地识别的任何结合相互作用。例如,在一些方面,本申请通过获得指示一种或多种氨基酸识别分子与多肽分子的关联的数据来提供多肽测序的方法。在一些实施方案中,所述数据包括对应于与多肽分子的氨基酸的一系列可逆氨基酸识别分子结合相互作用的一系列信号脉冲,并且所述数据可用于确定氨基酸的身份。因此,在一些实施方案中,“选择性”或“特异性”结合相互作用是指检测到的区分一种类型的氨基酸和其他类型的氨基酸的结合相互作用。在一些实施方案中,标记的亲和试剂(例如,氨基酸识别分子)以小于约10-6M(例如,小于约10-7M、小于约10-8M、小于约10-9M、小于约10-10M、小于约10-11M、小于约10-12M、至低至10-16M)的解离常数(KD)选择性结合一种类型的氨基酸,而不与其他类型的氨基酸显著结合。在一些实施方案中,标记的亲和试剂以小于约100nM、小于约50nM、小于约25nM、小于约10nM或小于约1nM的KD选择性结合一种类型的氨基酸(例如,一种类型的末端氨基酸)。在一些实施方案中,标记的亲和试剂以约50nM至约50μM(例如,约50nM至约500nM、约50nM至约5μM、约500nM至约50μM、约5μM至约50μM或约10μM至约50μM)的KD选择性结合一种类型的氨基酸。在一些实施方案中,氨基酸识别分子以约50nM的KD结合一种类型的氨基酸。
在一些实施方案中,标记的亲和试剂(例如,氨基酸识别分子)以小于约10-6M(例如,小于约10-7M、小于约10-8M、小于约10-9M、小于约10-10M、小于约10-11M、小于约10-12M、至低至10-16M)的KD结合两种或更多种类型的氨基酸。在一些实施方案中,氨基酸识别分子以小于约100nM、小于约50nM、小于约25nM、小于约10nM或小于约1nM的KD结合两种或更多种类型的氨基酸。在一些实施方案中,氨基酸识别分子以约50nM至约50μM(例如,约50nM至约500nM、约50nM至约5μM、约500nM至约50μM、约5μM至约50μM或约10μM至约50μM)的KD结合两种或更多种类型的氨基酸。在一些实施方案中,氨基酸识别分子以约50nM的KD结合两种或更多种类型的氨基酸。
在一些实施方案中,标记的亲和试剂(例如氨基酸识别分子)以至少0.1s-1的解离速率(koff)结合至少一种类型的氨基酸。在一些实施方案中,解离速率在约0.1s-1和约1,000s-1之间(例如,在约0.5s-1和约500s-1之间、在约0.1s-1和约100s-1之间、在约1s-1和约100s-1之间或在约0.5s-1和约50s-1之间)。在一些实施方案中,解离速率在约0.5s-1和约20s-1之间。在一些实施方案中,解离速率在约2s-1和约20s-1之间。在一些实施方案中,解离速率在约0.5s-1和约2s-1之间。
在一些实施方案中,KD或koff的值可以是已知的文献值,或者该值可以根据经验确定。例如,KD或koff的值可以在单分子测定或整体测定中测量。在一些实施方案中,koff的值可以基于在如本文别处所述的单分子测定中获得的信号脉冲信息根据经验确定。例如,koff的值可以近似为平均脉冲持续时间的倒数。在一些实施方案中,氨基酸识别分子结合两种或更多种类型的氨基酸,这两种或更多种类型中的每一种具有不同的KD或koff。在一些实施方案中,第一类型氨基酸的第一KD或koff与第二类型氨基酸的第二KD或koff相差至少10%(例如,至少25%、至少50%、至少100%或更多)。在一些实施方案中,KD或koff的第一和第二值相差约10-25%、25-50%、50-75%、75-100%或大于100%,例如相差约2倍、3倍、4倍、5倍或更多。
在一些实施方案中,标记的亲和试剂包含发光标记(例如,标记)和选择性结合多肽的一种或多种类型的末端氨基酸的亲和试剂(显示为点状)。在一些实施方案中,亲和试剂对末端位置或末端和内部位置处的一种类型的氨基酸或氨基酸类型的子集(例如,少于二十种常见类型的氨基酸)具有选择性。
如本文所述,亲和试剂(也称为“识别分子”)可以是能够选择性或特异性结合一个分子而不是另一个分子(例如,一种类型的氨基酸而不是另一种类型的氨基酸,如具有本文所指的“氨基酸识别分子”)的任何生物分子。亲和试剂(例如识别分子)包括例如蛋白质和核酸,其可以是合成的或重组的。在一些实施方案中,亲和试剂或识别分子可以是抗体或抗体的抗原结合部分,或酶促生物分子,例如肽酶、氨基转移酶、核酶、适体酶或tRNA合成酶,包括氨酰基-tRNA合成酶和描述于2016年9月2日提交的标题为“MOLECULES AND METHODSFOR ITERATIVE POLYPEPTIDE ANALYSIS AND PROCESSING”的美国专利申请号15/255,433中的相关分子。
在一些实施方案中,本申请的亲和试剂或识别分子是降解途径蛋白。适合用作识别分子的降解途径蛋白的实例包括但不限于N端规则途径蛋白,例如Arg/N端规则途径蛋白、Ac/N端规则途径蛋白和Pro/N端规则途径蛋白。在一些实施方案中,识别分子是选自Gid4蛋白、Ubr1 UBR盒蛋白和ClpS蛋白(例如,ClpS2)的N端规则途径蛋白。
肽酶,也称为蛋白酶,是催化肽键水解的酶。肽酶将多肽消化成较短的片段,通常可分为内肽酶和外肽酶,它们分别在内部和末端裂解多肽链。在一些实施方案中,标记的亲和试剂包含已被修饰以使外肽酶或内肽酶活性失活的肽酶。以这种方式,标记的亲和试剂选择性结合而不会裂解多肽中的氨基酸。在其他实施方案中,可以使用未经修饰以使外肽酶或内肽酶活性失活的肽酶。例如,在一些实施方案中,标记的亲和试剂包含标记的外肽酶。
根据本申请的某些实施方案,多肽测序方法可以包括在多肽末端的迭代检测和裂解。在一些实施方案中,标记的外肽酶可以用作执行氨基酸检测和裂解这两个步骤的单一试剂。如一般性描述的,在一些实施方案中,标记的外肽酶具有氨肽酶或羧肽酶活性,从而其分别选择性结合和裂解多肽的N末端或C末端氨基酸。应当理解,在某些实施方案中,标记的外肽酶可以由本领域技术人员催化失活,使得标记的外肽酶保留选择性结合特性以用作非裂解标记的亲和试剂,如本文所述。
外肽酶通常需要多肽底物在其氨基末端包含游离氨基或在其羧基末端包含游离羧基中的至少一个。在一些实施方案中,根据本申请的外肽酶水解多肽末端处或附近的键。在一些实施方案中,外肽酶水解距多肽末端不超过三个残基的键。例如,在一些实施方案中,由外肽酶催化的单个水解反应从多肽末端裂解单个氨基酸、二肽或三肽。
在一些实施方案中,根据本申请的外肽酶是氨肽酶或羧肽酶,其分别从氨基末端或羧基末端裂解单个氨基酸。在一些实施方案中,根据本申请的外肽酶是二肽基-肽酶或肽基-二肽酶,其分别从氨基末端或羧基末端裂解二肽。在其他实施方案中,根据本申请的外肽酶是三肽基-肽酶,其从氨基末端裂解三肽。每个类别或其亚类的肽酶分类和活性是众所周知的,并在文献中进行了描述(参见,例如,Gurupriya,V.S.&Roy,S.C.Proteases andProtease Inhibitors in Male Reproduction.Proteases in Physiology andPathology 195–216(2017);和Brix,K.&
Figure BDA0003717531990000641
W.Proteases:Structure andFunction.Chapter 1)。
可以基于测序反应的方向性对根据本申请的外肽酶进行选择或工程化。例如,在从多肽的氨基末端到羧基末端测序的实施方案中,外肽酶包含氨肽酶活性。相反,在从多肽的羧基末端到氨基末端测序的实施方案中,外肽酶包含羧肽酶活性。识别特定羧基末端氨基酸的羧肽酶的实例,其可用作标记的外肽酶或被灭活以用作本文所述的非裂解标记的亲和试剂,已在文献中进行了描述(参见,例如,Garcia-Guerrero,M.C.等人,(2018)PNAS 115(17))。
用作裂解试剂和/或亲和试剂(例如识别分子)的合适肽酶包括选择性结合一种或多种类型的氨基酸的氨肽酶。在一些实施方案中,氨肽酶识别分子被修饰以使氨肽酶活性失活。在一些实施方案中,氨肽酶裂解试剂是非特异性的,因此它从多肽的末端裂解大多数或所有类型的氨基酸。在一些实施方案中,与多肽末端的其他类型的氨基酸相比,氨肽酶裂解试剂在裂解多肽末端的一种或多种类型的氨基酸方面更有效。例如,根据本申请的氨肽酶特异性裂解丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、硒代半胱氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和/或缬氨酸。在一些实施方案中,氨肽酶是脯氨酸氨肽酶。在一些实施方案中,氨肽酶是脯氨酸亚氨基肽酶。在一些实施方案中,氨肽酶是谷氨酸/天冬氨酸特异性氨肽酶。在一些实施方案中,氨肽酶是甲硫氨酸特异性氨肽酶。在一些实施方案中,氨肽酶是表1中列出的氨肽酶。在一些实施方案中,氨肽酶裂解试剂裂解表1中列出的肽底物。
在一些实施方案中,氨肽酶是非特异性氨肽酶。在一些实施方案中,非特异性氨肽酶是锌金属蛋白酶。在一些实施方案中,非特异性氨肽酶是表2中列出的氨肽酶。在一些实施方案中,非特异性氨肽酶裂解表2中列出的肽底物。
因此,在一些实施方案中,本申请提供了具有选自表1或表2的氨基酸序列(或具有与选自表1或表2的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、80-90%、90-95%、95-99%或更高的氨基酸序列同一性的氨基酸序列)的氨肽酶(例如,氨肽酶识别分子、氨肽酶裂解试剂)。在一些实施方案中,氨肽酶与表1或表2中列出的氨肽酶具有25-50%、50-60%、60-70%、70-80%、80-90%、90-95%或95-99%或更高的氨基酸序列同一性。在一些实施方案中,氨肽酶是经修饰的氨肽酶,并且相对于表1或表2中列出的序列包括一个或多个氨基酸突变。
表1.氨肽酶的非限制性实例
Figure BDA0003717531990000651
Figure BDA0003717531990000661
表2.非特异性氨肽酶的非限制性实例
Figure BDA0003717531990000662
Figure BDA0003717531990000671
Figure BDA0003717531990000681
Figure BDA0003717531990000691
*裂解效率(从最高到最低):精氨酸>赖氨酸>疏水残基(包括丙氨酸、亮氨酸、甲硫氨酸和苯丙氨酸)>脯氨酸(参见,例如,Matthews Biochemistry 47,2008,5303-5311)。
**裂解效率(从最高到最低):亮氨酸>丙氨酸>精氨酸>苯丙氨酸>脯氨酸;在谷氨酸和天冬氨酸后不裂解。
出于比较两个或更多个氨基酸序列的目的,第一氨基酸序列和第二氨基酸序列之间的“序列同一性”(本文也称为“氨基酸同一性”)百分比可以通过[第一氨基酸序列中与第二氨基酸序列中相应位置的氨基酸残基相同的氨基酸残基的数量]除以[第一氨基酸序列中氨基酸残基的总数]并乘以[100]来计算,其中与第一氨基酸序列相比,第二氨基酸序列中氨基酸残基的每个缺失、插入、取代或添加被认为是单个氨基酸残基(位置)的差异。替代地,可以使用已知的计算机算法(例如,通过Smith和Waterman(1970)Adv.Appl.Math.2:482c的局部同源算法,通过Needleman和Wunsch,J.Mol.Biol.(1970)48:443的同源比对算法,通过Pearson和Lipman.Proc.Natl.Acad.Sci.USA(1998)85:2444的相似性搜索方法,或通过可作为Blast、Clustal Omega或其他序列比对算法的计算机化实现算法),例如使用标准设置,来计算两个氨基酸序列之间的序列同一性程度。通常,出于根据上文概述的计算方法确定两个氨基酸序列之间的“序列同一性”百分比的目的,将氨基酸残基数最多的氨基酸序列作为“第一”氨基酸序列,另一个氨基酸序列将作为“第二”氨基酸序列。
另外地或替代地,可以评估两个或更多个序列的序列之间的同一性。在两个或更多个核酸或氨基酸序列的上下文中,术语“同一的”或百分比“同一性”是指两个或更多个相同的序列或子序列。当在比较窗口或使用上述序列比较算法之一或通过人工比对和目视检查测量的指定区域上进行比较和比对时,如果两个序列在指定区域或整个序列上具有指定百分比的相同氨基酸残基或核苷酸(例如,至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%或99.9%同一的),则两个序列是“基本上同一的”。任选地,同一性存在于长度为至少约25、50、75或100个氨基酸的区域上,或存在于长度为100至150、150至200、100至200、或200或更多个氨基酸的区域上。
另外地或替代地,可以评估两个或更多个序列的序列之间的比对。在两个或更多个核酸或氨基酸序列的上下文中,术语“比对”或百分比“比对”是指两个或更多个相同的序列或子序列。当在比较窗口或使用上述序列比较算法之一或通过人工比对和目视检查测量的指定区域上进行比较和比对时,如果两个序列在指定区域或整个序列上具有指定百分比的相同氨基酸残基或核苷酸(例如,至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%或99.9%同一的),则两个序列是“基本上比对上的”。任选地,比对存在于长度为至少约25、50、75或100个氨基酸的区域上,或存在于长度为100至150、150至200、100至200、或200或更多个氨基酸的区域上。
除了多肽分子之外,核酸分子还具有多种有利的特性,可根据本申请用作亲和试剂(例如氨基酸识别分子)。
核酸适体是经过工程化以高亲和力和选择性结合所需靶标的核酸分子。因此,可以使用本领域已知的选择和/或富集技术对核酸适体进行工程化以选择性结合所需类型的氨基酸。因此,在一些实施方案中,亲和试剂包含核酸适体(例如,DNA适体、RNA适体)。在一些实施方案中,标记的亲和试剂是选择性结合一种类型的末端氨基酸的标记的适体。例如,在一些实施方案中,如本文所述,标记的适体在多肽末端选择性结合一种类型的氨基酸(例如,单一类型的氨基酸或氨基酸类型的子集)。尽管未显示,但应当理解,标记的适体可以被工程化以根据本申请的方法在多肽的任何位置(例如,在多肽的末端位置或末端和内部位置)选择性结合一种类型的氨基酸。
在一些实施方案中,标记的亲和试剂包含具有结合诱导的发光的标记。例如,在一些实施方案中,标记的适体包含供体标记和受体标记以及功能。在其他实施方案中,标记的适体包含淬灭部分并且功能类似于分子信标,其中标记的适体的发光在内部被淬灭为游离分子并恢复为选择性结合的分子(参见例如Hamaguchi等人,(2001)AnalyticalBiochemistry 294,126-131)。不希望囿于理论的,认为用于结合诱导的发光的这些和其他类型的机制可以有利地减少或消除背景发光以提高本文所述的方法的总体灵敏度和准确度。
除了鉴定多肽末端氨基酸的方法之外,本申请还提供了使用标记的亲和试剂对多肽进行测序的方法。在一些实施方案中,测序方法可以涉及使多肽末端经受末端氨基酸检测和末端氨基酸裂解的重复循环。例如,在一些实施方案中,本申请提供了一种确定多肽的氨基酸序列的方法,所述方法包括使多肽与本文所述的一种或多种标记的亲和试剂接触并使多肽经受Edman降解。
常规Edman降解涉及修饰和裂解多肽末端氨基酸的重复循环,其中鉴定每个连续裂解的氨基酸以确定多肽的氨基酸序列。作为常规Edman降解的说明性实例,多肽的N端氨基酸使用异硫氰酸苯酯(PITC)修饰以形成PITC衍生的N末端氨基酸。然后使用酸性条件、碱性条件和/或高温裂解PITC衍生的N末端氨基酸。还表明,裂解PITC衍生的N末端氨基酸的步骤可以使用来自原生动物克氏锥虫(Trypanosoma cruzi)的经修饰的半胱氨酸蛋白酶通过酶促完成,这涉及在中性或接近中性pH下相对温和的裂解条件。有用的酶的非限制性实例描述于2016年9月2日提交的标题为“MOLECULES AND METHODS FOR ITERATIVEPOLYPEPTIDE ANALYSIS AND PROCESSING”的美国专利申请号15/255,433中。
在一些实施方案中,通过Edman降解进行测序包括提供通过接头固定在固体支持物表面(例如,固定在样品孔的底部或侧壁表面)上的多肽。在一些实施方案中,如本文所述,多肽被固定在一个末端(例如氨基末端氨基酸或羧基末端氨基酸),使得另一末端是游离的,用于检测和裂解末端氨基酸。因此,在一些实施方案中,本文所述的在Edman降解方法中使用的试剂优先与多肽的非固定(例如,游离)末端处的末端氨基酸相互作用。以这种方式,多肽在检测和裂解的重复循环中保持固定。为此,在一些实施方案中,可以根据用于检测和裂解的所需条件组设计接头,例如,以限制多肽在化学裂解条件下从表面脱离。用于将多肽固定在表面的合适的接头组合物和技术在本文别处详细描述。
根据本申请,在一些实施方案中,通过Edman降解进行测序的方法包括步骤(i),使多肽与一种或多种选择性结合一种或多种类型的末端氨基酸的标记的亲和试剂接触。在一些实施方案中,标记的亲和试剂通过选择性结合末端氨基酸而与多肽相互作用。在一些实施方案中,步骤(i)进一步包括去除未选择性结合多肽的末端氨基酸(例如,游离末端氨基酸)的一种或多种标记的亲和试剂中的任一种。
在一些实施方案中,所述方法进一步包括通过检测标记的亲和试剂来鉴定多肽的末端氨基酸。在一些实施方案中,检测包括检测来自标记的亲和试剂的发光。如本文所述,在一些实施方案中,发光与标记的亲和试剂独特地关联,因此发光与标记的亲和试剂选择性结合的氨基酸类型相关。因此,在一些实施方案中,通过确定标记的亲和试剂的一种或多种发光特性来鉴定氨基酸的类型。
在一些实施方案中,通过Edman降解进行测序的方法包括步骤(ii),去除多肽的末端氨基酸。在一些实施方案中,步骤(ii)包括从多肽去除标记的亲和试剂(例如,一种或多种选择性结合末端氨基酸的标记的亲和试剂中的任一种)。在一些实施方案中,步骤(ii)包括通过使末端氨基酸与异硫氰酸酯(例如,PITC)接触以形成异硫氰酸酯修饰的末端氨基酸来修饰多肽的末端氨基酸(例如,游离末端氨基酸)。在一些实施方案中,异硫氰酸酯修饰的末端氨基酸比未经修饰的末端氨基酸更容易被裂解试剂(例如化学或酶促裂解试剂)去除。
在一些实施方案中,步骤(ii)包括通过使多肽与特异性结合和裂解异硫氰酸酯修饰的末端氨基酸的蛋白酶接触来去除末端氨基酸。在一些实施方案中,蛋白酶包括修饰的半胱氨酸蛋白酶。在一些实施方案中,蛋白酶包括修饰的半胱氨酸蛋白酶,例如来自克氏锥虫的半胱氨酸蛋白酶(参见例如,Borgo等人,(2015)Protein Science 24:571-579)。在其他实施方案中,步骤(ii)包括通过使多肽经受足以裂解异硫氰酸酯修饰的末端氨基酸的化学(例如酸性、碱性)条件来去除末端氨基酸。
在一些实施方案中,通过Edman降解进行测序的方法包括步骤(iii),在末端氨基酸裂解后洗涤多肽。在一些实施方案中,洗涤包括去除蛋白酶。在一些实施方案中,洗涤包括将多肽恢复至中性pH条件(例如,在通过酸性或碱性条件进行化学裂解之后)。在一些实施方案中,通过Edman降解进行测序的方法包括重复步骤(i)至(iii)多个循环。
在一些实施方案中,含有多肽的复杂混合物或富集混合物(例如,多肽混合物)的样品可以使用普通酶降解成约6至40个氨基酸的短多肽片段。在一些实施方案中,根据本申请的方法对该多肽文库进行测序将揭示存在于原始复杂混合物或富集混合物中的每种多肽的身份和丰度。如本文和文献中所述,大小范围为6至40个氨基酸的大多数多肽可以通过确定多肽链中仅四个氨基酸的数量和位置来独特地鉴定。
因此,在一些实施方案中,通过Edman降解进行测序的方法可以使用一组标记的适体进行,该组标记的适体包括四种DNA适体类型,每种类型识别不同的N末端氨基酸。每种适体类型可以用不同的发光标记进行标记,从而可以基于一种或多种发光特性来区分不同的适体类型。为了说明性目的,标记的适体的实例组包括:用第一发光标记(“染料1”)标记的半胱氨酸特异性适体;用第二发光标记(“染料2”)标记的赖氨酸特异性适体;用第三发光标记(“染料3”)标记的色氨酸特异性适体;以及用第四发光标记(“染料4”)标记的谷氨酸特异性适体。
在一些实施方案中,在步骤(i)之前,将来自多肽文库的单个多肽分子固定在固体支持物的表面,例如样品孔阵列的样品孔的底部或侧壁表面。在一些实施方案中,如本文别处所述,能够实现表面固定的部分(例如,生物素)或提高溶解度的部分(例如,寡核苷酸)可以化学或酶促连接至多肽的C末端。为了确定每个多肽的序列,在一些实施方案中,固定化的多肽经受N末端氨基酸检测和N末端氨基酸裂解的重复循环。在一些实施方案中,所述方法包括试剂添加和洗涤步骤,这些步骤通过使用自动化流体系统注入到检测表面上方的流通池中来进行。在一些实施方案中,步骤(i)至(iv)说明了使用标记的适体进行检测和裂解的一个循环。
在一些实施方案中,通过Edman降解进行测序的方法包括步骤(i),流入四种正交标记的DNA适体的混合物中并孵育以使适体与任何固定化的多肽(例如,固定在阵列的样品孔内的多肽)结合,所述在N末端包含四个正确氨基酸中的一个。在一些实施方案中,所述方法进一步包括洗涤固定化的多肽以去除未结合的适体。在一些实施方案中,所述方法进一步包括对固定化的多肽进行成像(“成像步骤(i)”)。在一些实施方案中,所获得的图像包含足够的信息来确定与适体结合的多肽的位置(例如,在样品孔阵列内的位置)以及四个适体中的哪一个在每个位置处被结合。在一些实施方案中,所述方法进一步包括使用合适的缓冲液来洗涤固定化的多肽以从固定化的多肽中去除适体。
在一些实施方案中,测序方法包括步骤(ii)在含有特异性修饰N末端胺基的反应性分子(例如,PITC,如图所示)的溶液中流动。在一些实施方案中,诸如PITC的异硫氰酸酯分子将N末端氨基酸修饰成底物,用于通过经修饰的蛋白酶例如来自克氏锥虫(Trypanosoma Cruzi)的半胱氨酸蛋白酶cruzain的裂解。
在一些实施方案中,测序方法包括步骤(iii),洗涤固定化的多肽,再流入合适的经修饰的蛋白酶,所述经修饰的蛋白酶识别并裂解来自固定化的多肽的修饰的N末端氨基酸。
在一些实施方案中,该方法包括在酶促裂解后洗涤固定化多肽的步骤(iv)。在一些实施方案中,步骤(i)至(iv)描绘了Edman降解的一个循环。因此,所示的步骤(i')是下一个反应循环的开始,该反应循环作为如上文对步骤(i)至(iv)所述进行的步骤(i')至(iv')进行。在一些实施方案中,步骤(i)至(iv)重复大约20-40个循环。
在一些实施方案中,标记的异硫氰酸酯(例如,染料标记的PITC)可用于监测样品上样。例如,在一些实施方案中,在对多肽样品进行测序方法之前,通过使用染料标记的PITC修饰末端,使多肽样品在末端与发光标记预缀合。以这种方式,可以通过在上述步骤(i)之前检测来自标记的发光来监测多肽样品向样品孔阵列中的上样。在一些实施方案中,发光用于确定阵列中样品孔的单个占据(例如,含有单个多肽分子的样品孔的一部分),这可以有利地增加对于给定样品可靠地获得的信息量。在进行步骤(i)之前,一旦通过发光确定了所需的样品上样状态,就可以如所描述的进行化学或酶促裂解。
在一些实施方案中,标记的异硫氰酸酯(例如,染料标记的PITC)可用于监测阵列中多肽样品的反应进程。例如,在一些实施方案中,步骤(ii)包括流入含有染料标记的PITC的溶液,所述PITC特异性地修饰和标记样品中多肽的N末端胺基。在一些实施方案中,可以在步骤(ii)期间或之后检测来自标记的发光以评估样品中多肽的N末端PITC修饰。因此,在一些实施方案中,发光用于确定是否或何时从步骤(ii)进行到步骤(iii)。在一些实施方案中,可以在步骤(iii)期间或之后检测来自标记的发光以评估样品中多肽的N末端氨基酸裂解——例如以确定是否或何时从步骤(iii)进行到步骤(iv)。
测序方法可以使用单独的试剂来检测和裂解多肽的末端氨基酸。尽管如此,在一些方面,本申请提供了一种测序方法,其中包含肽酶(例如选择性结合和裂解不同类型的末端氨基酸的标记的外肽酶)的单一试剂可用于检测和裂解多肽的末端氨基酸。
标记的外肽酶可以包括包含第一发光标记的赖氨酸特异性的外肽酶、包含第二发光标记的甘氨酸特异性的外肽酶、包含第三发光标记的天冬氨酸特异性的外肽酶和包含第四发光标记的亮氨酸特异性的外肽酶。根据本文所述的某些实施方案,每个标记的外肽酶仅在其相应氨基酸位于多肽的氨基末端或羧基末端时选择性结合和裂解该氨基酸。因此,随着通过这种方法的测序从肽的一个末端向另一个末端进行,标记的外肽酶被工程化或选择,使得该组的所有试剂将具有氨肽酶或羧肽酶活性。
在一些方面,本申请通过评估末端氨基酸与标记的氨基酸识别分子(例如,标记的亲和试剂)和标记的裂解试剂(例如,标记的非特异性外肽酶)的结合相互作用来提供实时多肽测序的方法。不希望囿于理论的,标记的亲和试剂根据由结合率或结合的“开”率(kon)和解离率或结合的“关”率(koff)定义的结合亲和性(KD)选择性结合。速率常数koff和kon分别是脉冲持续时间(例如,对应于可检测结合事件的时间)和脉冲间持续时间(例如,可检测结合事件之间的时间)的关键决定因素。在一些实施方案中,可以设计这些速率以实现给出最佳测序准确度的脉冲持续时间和脉冲频率(例如,信号脉冲的频率)。
测序反应混合物可以进一步包含标记的非特异性外肽酶,其包含不同于标记的亲和试剂的发光标记。在一些实施方案中,标记的非特异性外肽酶以低于标记的亲和试剂的浓度存在于混合物中。在一些实施方案中,标记的非特异性外肽酶显示出广泛的特异性,使得它裂解大多数或所有类型的末端氨基酸。
在一些实施方案中,末端氨基酸被标记的非特异性外肽酶裂解产生信号脉冲,并且这些事件以比标记的亲和试剂的结合脉冲更低的频率发生。以这种方式,可以在实时测序过程中对多肽的氨基酸进行计数和/或鉴定。在一些实施方案中,可以使用多种标记的亲和试剂,每种都具有可用于鉴定相应末端氨基酸的诊断脉冲模式(例如,特征模式)。例如,在一些实施方案中,不同的特征模式对应于多于一种标记的亲和试剂与不同类型的末端氨基酸的关联。如本文所述,应当理解,可以根据本申请使用与多于一种类型的氨基酸相关的单一亲和试剂。因此,在一些实施方案中,不同的特征模式对应于一种标记的亲和试剂与不同类型的末端氨基酸的关联。
如上详述,实时测序过程通常可以涉及末端氨基酸识别和末端氨基酸裂解的循环,其中识别和裂解的相对发生可以通过标记的亲和试剂和标记的非特异性外肽酶之间的浓度差来控制。在一些实施方案中,可以优化浓度差,使得在识别单个氨基酸期间检测到的信号脉冲的数量为鉴定提供所需的置信区间。例如,如果初始测序反应提供的信号数据在裂解事件之间的信号脉冲太少而无法确定具有所需置信区间的特征模式,则可以使用相对于亲和试剂降低浓度的非特异性外肽酶来重复测序反应。发明人已经认识到用于控制实时测序反应的其他技术,这些技术可以与所描述的浓度差方法结合使用,或替代地使用。
在一些实施方案中,测序反应涉及温度依赖性末端氨基酸识别和末端氨基酸裂解的循环。测序反应的每个循环可以在两个温度范围内进行:亲和试剂活性优于外肽酶活性(例如,以促进末端氨基酸识别)的第一温度范围(“T1”),以及外肽酶活性优于亲和试剂活性(例如,以促进末端氨基酸裂解)的第二温度范围(“T2”)。测序反应可以通过在第一温度范围T1(以启动氨基酸识别)和第二温度范围T2(以启动氨基酸裂解)之间交替反应混合物温度来进行。因此,温度依赖性测序过程的进展可通过温度控制,并在不同温度范围(例如,T1和T2之间)之间交替,这可以通过手动或自动过程进行。在一些实施方案中,与第二温度范围T2相比,第一温度范围T1内的亲和试剂活性(例如,对氨基酸的结合亲和性(KD))增加至少10倍、至少100倍、至少1,000倍、至少10,000倍、至少100,000倍或更多。在一些实施方案中,与第一温度范围Tl相比,第二温度范围T2内的外肽酶活性(例如,底物转化为裂解产物的速率)增加至少2倍、10倍、至少25倍、至少50倍、至少100倍、至少1,000倍或更多。
在一些实施方案中,第一温度范围T1低于第二温度范围T2。在一些实施方案中,第一温度范围T1在约15℃和约40℃之间(例如,在约25℃和约35℃之间、在约15℃和约30℃之间、在约20℃和约30℃之间)。在一些实施方案中,第二温度范围T2在约40℃和约100℃之间(例如,在约50℃和约90℃之间、在约60℃和约90℃之间、在约70℃和约90℃之间)。在一些实施方案中,第一温度范围T1在约20℃和约40℃之间(例如,约30℃),并且第二温度范围T2在约60℃和约100℃之间(例如,约80℃)。
在一些实施方案中,第一温度范围T1高于第二温度范围T2。在一些实施方案中,第一温度范围T1在约40℃和约100℃之间(例如,在约50℃和约90℃之间、在约60℃和约90℃之间、在约70℃和约90℃之间)。在一些实施方案中,第二温度范围T2在约15℃和约40℃之间(例如,在约25℃和约35℃之间、在约15℃和约30℃之间、在约20℃和约30℃之间)。在一些实施方案中,第一温度范围T1在约60℃和约100℃之间(例如,约80℃),并且第二温度范围T2在约20℃和约40℃之间(例如,约30℃)。
在一些实施方案中,本申请提供了使用发光激活试剂的发光依赖性测序过程。在一些实施方案中,发光依赖性测序过程涉及发光依赖性氨基酸识别和裂解的循环。测序反应的每个循环可以通过将测序反应混合物暴露于两种不同的发光条件来进行:亲和试剂活性优于外肽酶活性(例如,以促进氨基酸识别)的第一发光条件,以及外肽酶活性优于亲和试剂活性(例如,以促进氨基酸裂解)的第二发光条件。通过在将反应混合物暴露于第一发光条件(以启动氨基酸识别)和将反应混合物暴露于第二发光条件(以启动氨基酸裂解)之间交替来进行测序反应。作为实例而非限制,在一些实施方案中,两种不同的发光条件包括第一波长和第二波长。
在一些方面,本申请通过评估一种或多种标记的亲和试剂与末端和内部氨基酸的结合相互作用以及标记的非特异性外肽酶与末端氨基酸的结合相互作用提供了实时多肽测序的方法。在一些实施方案中,使用标记的亲和试剂,其在末端和内部位置与一种类型的氨基酸选择性结合和解离。选择性结合在信号输出中产生一系列脉冲。然而,在这种方法中,所述一系列脉冲以由整个多肽中氨基酸类型的数量决定的速率发生。因此,在一些实施方案中,对应于结合事件的脉冲频率将诊断当前存在于多肽中的同源氨基酸的数量。
标记的非特异性肽酶可以以比标记的亲和试剂相对较低的浓度存在,例如,以在裂解事件之间提供最佳时间窗。此外,在某些实施方案中,标记的非特异性肽酶的独特可识别发光标记将指示裂解事件何时发生。随着多肽经历迭代裂解,每当末端氨基酸被标记的非特异性肽酶裂解时,对应于标记的亲和试剂结合的脉冲频率将逐步下降。因此,在一些实施方案中,可以在这种方法中基于脉冲模式和/或基于在裂解事件之间检测到的模式内发生的脉冲频率来鉴定氨基酸并由此对多肽进行测序。
B.通过标记多肽的降解进行测序
在一些方面,本申请提供了通过鉴定对应于已知多肽序列的独特氨基酸组合来对多肽进行测序的方法。在一些实施方案中,所述方法包括检测标记多肽的选择性标记的氨基酸。在一些实施方案中,标记多肽包含经选择性修饰的氨基酸,使得不同的氨基酸类型包含不同的发光标记。如本文所用,除非另有说明,否则标记多肽是指包含一个或多个选择性标记的氨基酸侧链的多肽。选择性标记方法和与标记多肽的制备和分析有关的细节是本领域已知的(参见,例如,Swaminathan等人,PLoS Comput Biol.2015,11(2):e1004080)。
如本文所述,在一些方面,本申请提供了对多肽进行测序的方法,所述方法通过在多肽降解过程中获得数据,并分析数据以确定与在多肽降解过程中顺序暴露于多肽末端的氨基酸相对应的数据部分。在一些实施方案中,数据的部分包括一系列信号脉冲,指示一种或多种氨基酸识别分子与暴露在多肽末端的连续氨基酸(例如,在降解期间)的关联。在一些实施方案中,所述一系列信号脉冲对应于降解过程种在多肽末端的一系列可逆单分子结合相互作用。
在一些方面,本文所述的多肽测序技术产生的数据表明当多肽被裂解手段(例如,一种或多种裂解试剂)降解时,多肽如何与结合手段(例如,一种或多种氨基酸识别分子)相互作用。如上所讨论的,数据可以包括对应于在末端的裂解事件之间的多肽末端的关联事件的一系列特征模式。在一些实施方案中,本文所述的测序方法包括使单个多肽分子与结合手段和裂解手段接触,其中结合手段和裂解手段被设置为在裂解事件之前实现至少10个关联事件。在一些实施方案中,所述手段被设置为实现两个裂解事件之间的至少10个关联事件。
如本文所述,在一些实施方案中,多个单分子测序反应在样品孔阵列中并行进行。在一些实施方案中,阵列包含约10,000至约1,000,000个样品孔。在一些实施方式中,样品孔的体积可以在约10-21升和约10-15升之间。因为样品孔的体积小,单分子的检测事件可能是可能的,因为在任何给定时间,样品孔内可能只有大约一个多肽。统计上,一些样品孔可能不包含单分子测序反应,而一些样品孔可能包含不止一个单个多肽分子。然而,可观数量的样品孔可以各自包含单分子反应(例如,在一些实施方案中至少30%),从而可以对大量样品孔并行进行单分子分析。在一些实施方案中,结合手段和裂解手段被设置为在裂解事件之前在至少10%(例如,10-50%、超过50%、25-75%、至少80%或更多)的样品孔中实现至少10个关联事件,其中发生单分子反应。在一些实施方案中,结合手段和裂解手段被设置为在裂解事件之前对单分子反应中多肽的至少50%(例如,超过50%、50-75%、至少80%或更多)的氨基酸实现至少10个关联事件。
在一些实施方案中,标记多肽被固定并暴露于激发源。可以检测来自标记多肽的聚集发光,并且在一些实施方案中,随时间暴露于发光可由于发光标记降解(例如,由于光漂白引起的降解)而导致检测信号的损失。在一些实施方案中,标记多肽包含选择性标记的氨基酸的独特组合,其产生初始检测信号。发光标记随时间的降解导致光漂白的标记多肽的检测信号相应降低。在一些实施方案中,可以通过分析一种或多种发光特性(例如,通过发光寿命分析的信号去卷积)对信号进行去卷积。在一些实施方案中,标记多肽的选择性标记的氨基酸的独特组合已经在计算上被预先计算和在经验上被验证——例如,基于蛋白质组的已知多肽序列。在一些实施方案中,将检测到的氨基酸标记的组合与生物体蛋白质组的已知序列数据库进行比较,以鉴定数据库中对应于标记多肽的特定多肽。
在一些实施方案中,确定最佳样品浓度以进行在大规模并行分析中最大化采样的测序反应。在一些实施方案中,选择浓度使得阵列中所需分数(例如,30%)的样品孔在任何给定时间被占据。不希望囿于理论的,认为尽管多肽经一段时间被漂白,相同的孔仍可用于进一步分析。通过扩散,阵列中大约30%的样品孔可用于每3分钟进行一次分析。作为说明性实例,在百万个样品孔芯片中,每小时可以采样6,000,000个多肽,或在4小时阶段内采样24,000,000个多肽。
在一些方面,本申请提供了一种通过检测经受末端氨基酸修饰和裂解的重复循环的标记多肽的发光来对多肽进行测序的方法。在一些实施方案中,对于通过Edman降解进行测序的其他方法,所述方法通常如本文所述进行。
在一些实施方案中,所述方法包括(i)修饰标记多肽的末端氨基酸的步骤。如本文别处所述,在一些实施方案中,修饰包括使末端氨基酸与异硫氰酸酯(例如,PITC)接触以形成异硫氰酸酯修饰的末端氨基酸。在一些实施方案中,异硫氰酸酯修饰将末端氨基酸转化为更易于被裂解试剂(例如,如本文所述的化学或酶促裂解试剂)去除的形式。因此,在一些实施方案中,所述方法包括(ii)使用本文别处详述的用于Edman降解的化学或酶促方法去除经修饰的末端氨基酸的步骤。
在一些实施方案中,所述方法包括对多个循环重复步骤(i)至(ii),在此期间检测标记多肽的发光,并且可以检测对应于从末端去除标记氨基酸的裂解事件作为检测信号的减少。在一些实施方案中,步骤(ii)之后的信号没有变化鉴定了未知类型的氨基酸。因此,在一些实施方案中,部分序列信息可以通过评估在每个连续轮次中在步骤(ii)之后检测到的信号来确定,通过基于检测到的信号的变化通过确定的同一性指定氨基酸类型或基于检测到的信号没有变化将氨基酸类型鉴定为未知。
在一些方面,根据本申请对多肽进行测序的方法包括通过标记多肽的持续酶促裂解进行测序。在一些实施方案中,使用修饰的进行性外肽酶对标记多肽进行降解,所述修饰的进行性外肽酶从一个末端向另一个末端连续裂解末端氨基酸。外肽酶在本文别处详细描述。在一些实施方案中,标记多肽经受固定化的进行性外肽酶的降解。在一些实施方案中,固定化的标记多肽经受进行性外肽酶的降解。
在一些实施方案中,进行性外肽酶的持续合成速率是已知的,使得检测到的信号降低之间的时序可用于计算每个检测事件之间的未标记氨基酸的数量。例如,如果以每秒去除一个氨基酸的方式裂解40个氨基酸的多肽,则具有3个信号的标记多肽最初会显示所有3个信号,然后是2个信号,然后是1个信号,最后没有信号。以这种方式,可以确定标记氨基酸的顺序。因此,这些方法可用于确定部分序列信息,例如用于基于多肽片段测序的蛋白质组学分析。
在一些实施方案中,单分子多肽测序可以使用基于ATP的福斯特共振能量转移(FRET)方案(例如,使用一种或多种标记的辅因子)来实现。在一些实施方案中,可以使用固定化的ATP依赖性蛋白酶、供体标记的ATP和多肽底物的受体标记的氨基酸进行通过基于辅因子的FRET的测序。在一些实施方案中,可以用受体标记氨基酸,并且可以用供体标记一种或多种辅因子。
例如,在一些实施方案中,使提取的多肽变性,并且用荧光染料标记半胱氨酸和赖氨酸。在一些实施方案中,使用蛋白质转位酶(例如细菌ClpX)的工程化形式与单个底物多肽结合,将它们展开,并通过其纳米通道将它们转位。在一些实施方案中,转位酶用供体染料标记,并且当基质通过纳米通道时,在转位酶上的供体与基质上的两种或更多种不同的受体染料之间发生FRET。然后可以根据FRET信号确定标记的氨基酸的顺序。在一些实施方案中,可以使用表3中所示的一种或多种以下非限制性标记的ATP类似物。
表3.标记的ATP类似物的非限制性实例
Figure BDA0003717531990000831
Figure BDA0003717531990000841
Figure BDA0003717531990000851
Figure BDA0003717531990000861
C.测序样品的制备
可以在测序之前修饰多肽样品(例如,富集的多肽样品)。
在一些实施方案中,多肽的N末端氨基酸或C末端氨基酸被修饰。在一些实施方案中,用能够固定在表面(例如,用于多肽分析的芯片上的样品孔的表面)上的部分来修饰多肽的末端。在一些实施方案中,此类方法包括根据本申请修饰待分析的标记多肽的末端。在其他实施方案中,此类方法包括根据本申请使多肽底物修饰降解或易位的蛋白质或酶的末端。
在一些实施方案中,多肽的羧基末端在包括以下的方法中被修饰:(i)封闭多肽的游离羧酸根基团;(ii)使多肽变性(例如,通过热和/或化学手段);(iii)封闭多肽的游离硫醇基团;(iv)消化多肽以产生至少一个包含游离C末端羧酸根基团的多肽片段;和(v)将功能部分缀合(例如,化学地)到游离的C末端羧酸根基团上。在一些实施方案中,所述方法进一步包括,在(i)之后和(ii)之前,对包含多肽的样品进行透析。
在一些实施方案中,多肽的羧基末端以包括以下的方法被修饰:(i)使多肽变性(例如,通过热和/或化学手段);(ii)封闭多肽的游离硫醇基团;(iii)消化多肽以产生至少一个包含游离C末端羧酸根基团的多肽片段;(iv)封闭游离的C末端羧酸根基团以产生至少一个包含封闭的C末端羧酸根基团的多肽片段;和(v)将功能部分缀合(例如,酶促地)到封闭的C末端羧酸根基团上。在一些实施方案中,所述方法进一步包括,在(iv)之后和(v)之前,对包含多肽的样品进行透析。
在一些实施方案中,封闭游离羧酸根基团是指这些基团的化学修饰,其相对于未经修饰的羧酸根改变化学反应性。合适的羧酸根封闭方法是本领域已知的,并且应该将侧链羧酸根基团修饰为在化学上不同于待官能化的多肽的羧基末端羧酸根基团。在一些实施方案中,封闭游离羧酸根基团包括多肽的游离羧酸根基团的酯化或酰胺化。在一些实施方案中,封闭游离羧酸根基团包括多肽的游离羧酸根基团的甲酯化,例如,通过使多肽与甲醇HCl反应。可用于封闭游离羧酸根基团的试剂和技术的其他实例包括但不限于4-磺基-2,3,5,6-四氟苯酚(STP)和/或碳二亚胺例如N-(3-二甲基氨基丙基)-N'-乙基碳二亚胺盐酸盐(EDAC)、脲试剂、重氮甲烷、用于Fischer酯化的醇和酸,使用N-羟基琥珀酰亚胺(NHS)形成NHS酯(可能作为后续酯或胺形成的中间体),或与羰基二咪唑(CDI)反应或形成混合酸酐,或任何其他可能通过形成酯或酰胺来修饰或封闭羧酸的方法。
在一些实施方案中,封闭游离硫醇基团是指这些基团的化学修饰,其相对于未经修饰的硫醇改变化学反应性。在一些实施方案中,封闭游离硫醇基团包括对多肽的游离硫醇基团进行还原和烷基化。在一些实施方案中,通过使多肽与二硫苏糖醇(DTT)以及碘乙酰胺和碘乙酸中的一种或两种接触来进行还原和烷基化。可以使用的另外的和替代的半胱氨酸还原试剂的实例是众所周知的,并且包括但不限于2-巯基乙醇、三(2-羧乙基)膦盐酸盐(TCEP)、三丁基膦、二硫丁胺(DTBA)或任何能够还原硫醇基团的试剂。可以使用的另外的和替代的半胱氨酸封闭(例如,半胱氨酸烷基化)试剂的实例是众所周知的,并且包括但不限于丙烯酰胺、4-乙烯基吡啶、N-乙基马来酰亚胺(NEM)、N-ε-马来酰亚胺基己酸(EMC),或任何修饰半胱氨酸以防止二硫键形成的试剂。
在一些实施方案中,消化包括酶促消化。在一些实施方案中,通过在消化条件下使多肽与内肽酶(例如胰蛋白酶)接触来进行消化。在一些实施方案中,消化包括化学消化。用于化学和酶促消化的合适试剂的实例是本领域已知的,并且包括但不限于胰蛋白酶、化学胰蛋白酶、Lys-C、Arg-C、Asp-N、Lys-N、BNPS-粪臭素、CNBr、半胱天冬酶、甲酸、谷氨酰内肽酶、羟胺、碘代苯甲酸、中性粒细胞弹性蛋白酶、胃蛋白酶、脯氨酸-内肽酶、蛋白酶K、葡萄球菌肽酶I、嗜热菌蛋白酶和凝血酶。
在一些实施方案中,功能部分包含生物素分子。在一些实施方案中,功能部分包含反应性化学部分,例如炔基。在一些实施方案中,缀合功能部分包括如本领域已知的通过羧肽酶Y对羧基末端羧甲基酯基团进行生物素化。
在一些实施方案中,将增溶部分添加到多肽中。因此,在一些实施方案中,本文提供的方法和组合物可用于用增加其溶解度的部分修饰多肽的末端。在一些实施方案中,增溶部分可用于由片段化(例如,酶促片段化,例如使用胰蛋白酶)产生并且相对不溶的小多肽。例如,在一些实施方案中,多肽库中的短多肽可以通过将聚合物(例如,短寡核苷酸、糖或其他带电荷的聚合物)缀合至多肽来溶解。
D.发光标记
如本文所用,发光标记是吸收一个或多个光子并且可以随后在一个或多个时段后发射一个或多个光子的分子。在一些实施方案中,该术语可与“标记”或“发光分子”互换使用,这取决于上下文。根据本文所述的某些实施方案的发光标记可以指标记的亲和试剂的发光标记、标记的肽酶(例如标记的外肽酶、标记的非特异性外肽酶)的发光标记、标记的肽的发光标记、标记的辅因子的发光标记或本文所述的另一种标记的组合物。在一些实施方案中,根据本申请的发光标记是指包含一种或多种标记氨基酸的标记多肽的标记氨基酸。
在一些实施方案中,发光标记可以包含第一和第二生色团。在一些实施方案中,第一生色团的激发态能够通过能量转移到第二生色团而弛豫。在一些实施方案中,能量转移是福斯特共振能量转移(FRET)。这样的FRET对可用于提供具有使标记更容易从混合物中的多个发光标记中区分的性质的发光标记。在其他实施方案中,FRET对包含第一发光标记的第一生色团和第二发光标记的第二生色团。在某些实施方案中,FRET对可以吸收第一光谱范围内的激发能量并发射第二光谱范围内的发光。
在一些实施方案中,发光标记是指荧光团或染料。通常,发光标记包含芳族或杂芳族化合物,并且可以是芘、蒽、萘、萘胺、吖啶、芪、吲哚、苯并吲哚、恶唑、咔唑、噻唑、苯并噻唑、苯并恶唑、菲啶、吩恶嗪、卟啉、喹啉、乙锭、苯甲酰胺、花青、羰花青、水杨酸盐、邻氨基苯甲酸盐、香豆素、荧光素、罗丹明、氧杂蒽或其他类似化合物。
在一些实施方案中,发光标记包含选自以下中的一种或多种的染料:5/6-羧基罗丹明6G、5-羧基罗丹明6G、6-羧基罗丹明6G、6-TAMRA、
Figure BDA0003717531990000891
STAR 440SXP、
Figure BDA0003717531990000892
STAR 470SXP、
Figure BDA0003717531990000893
STAR 488、
Figure BDA0003717531990000894
STAR 512、
Figure BDA0003717531990000895
STAR520SXP、
Figure BDA0003717531990000896
STAR 580、
Figure BDA0003717531990000897
STAR 600、
Figure BDA0003717531990000898
STAR 635、
Figure BDA0003717531990000899
STAR 635P、
Figure BDA00037175319900008910
STAR RED、Alexa
Figure BDA00037175319900008911
350、Alexa
Figure BDA00037175319900008912
405、Alexa
Figure BDA00037175319900008913
430、Alexa
Figure BDA00037175319900008914
480、Alexa
Figure BDA00037175319900008915
488、Alexa
Figure BDA00037175319900008916
514、Alexa
Figure BDA00037175319900008917
532、Alexa
Figure BDA00037175319900008918
546、Alexa
Figure BDA00037175319900008919
555、Alexa
Figure BDA00037175319900008920
568、Alexa
Figure BDA00037175319900008921
594、Alexa
Figure BDA00037175319900008922
610-X、Alexa
Figure BDA00037175319900008923
633、Alexa
Figure BDA00037175319900008924
647、Alexa
Figure BDA00037175319900008925
660、Alexa
Figure BDA00037175319900008926
680、Alexa
Figure BDA00037175319900008927
700、Alexa
Figure BDA00037175319900008928
750、Alexa
Figure BDA00037175319900008929
790、AMCA、ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO 532、ATTO 542、ATTO 550、ATTO 565、ATTO590、ATTO 610、ATTO 620、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO 665、ATTO 680、ATTO 700、ATTO 725、ATTO 740、ATTO Oxa12、ATTO Rho101、ATTO Rho11、ATTO Rho12、ATTORho13、ATTO Rho14、ATTO Rho3B、ATTO Rho6G、ATTO Thio12、BD HorizonTM V450、
Figure BDA00037175319900008930
493/501、
Figure BDA00037175319900008931
530/550、
Figure BDA00037175319900008932
558/568、
Figure BDA00037175319900008933
564/570、
Figure BDA00037175319900008934
576/589、
Figure BDA00037175319900008935
581/591、
Figure BDA00037175319900008936
630/650、
Figure BDA00037175319900008937
650/665、
Figure BDA00037175319900008938
FL、
Figure BDA00037175319900008939
FL-X、
Figure BDA0003717531990000901
R6G、
Figure BDA0003717531990000902
TMR、
Figure BDA0003717531990000903
TR、CAL
Figure BDA0003717531990000904
Gold 540、CAL
Figure BDA0003717531990000905
Green 510、CAL
Figure BDA0003717531990000906
Orange 560、CAL
Figure BDA0003717531990000907
Red 590、CAL
Figure BDA0003717531990000908
Red 610、CAL
Figure BDA0003717531990000909
Red 615、CAL
Figure BDA00037175319900009010
Red 635、
Figure BDA00037175319900009011
Blue、CFTM350、CFTM405M、CFTM405S、CFTM488A、CFTM514、CFTM532、CFTM543、CFTM546、CFTM555、CFTM568、CFTM594、CFTM620R、CFTM633、CFTM633-V1、CFTM640R、CFTM640R-V1、CFTM640R-V2、CFTM660C、CFTM660R、CFTM680、CFTM680R、CFTM680R-V1、CFTM750、CFTM770、CFTM790、ChromeoTM 642、Chromis 425N、Chromis 500N、Chromis 515N、Chromis 530N、Chromis 550A、Chromis 550C、Chromis550Z、Chromis 560N、Chromis 570N、Chromis 577N、Chromis 600N、Chromis 630N、Chromis645A、Chromis 645C、Chromis 645Z、Chromis 678A、Chromis 678C、Chromis 678Z、Chromis770A、Chromis 770C、Chromis 800A、Chromis 800C、Chromis 830A、Chromis 830C、
Figure BDA00037175319900009012
3、
Figure BDA00037175319900009013
3.5、
Figure BDA00037175319900009014
3B、
Figure BDA00037175319900009015
5、
Figure BDA00037175319900009016
5.5、
Figure BDA00037175319900009017
7、
Figure BDA00037175319900009018
350、
Figure BDA00037175319900009019
405、
Figure BDA00037175319900009020
415-Co1、
Figure BDA00037175319900009021
425Q、
Figure BDA00037175319900009022
485-LS、
Figure BDA00037175319900009023
488、
Figure BDA00037175319900009024
504Q、
Figure BDA00037175319900009025
510-LS、
Figure BDA00037175319900009026
515-LS、
Figure BDA00037175319900009027
521-LS、
Figure BDA00037175319900009028
530-R2、
Figure BDA00037175319900009029
543Q、
Figure BDA00037175319900009030
550、
Figure BDA00037175319900009031
554-R0、
Figure BDA00037175319900009032
554-R1、
Figure BDA00037175319900009033
590-R2、
Figure BDA00037175319900009034
594、
Figure BDA00037175319900009035
610-B1、
Figure BDA00037175319900009036
615-B2、
Figure BDA00037175319900009037
633、
Figure BDA00037175319900009038
633-B1、
Figure BDA00037175319900009039
633-B2、
Figure BDA00037175319900009040
650、
Figure BDA00037175319900009041
655-B 1、
Figure BDA00037175319900009042
655-B2、
Figure BDA00037175319900009043
655-B3、
Figure BDA00037175319900009044
655-B4、
Figure BDA00037175319900009045
662Q、
Figure BDA00037175319900009046
675-B1、
Figure BDA00037175319900009047
675-B2、
Figure BDA00037175319900009048
675-B3、
Figure BDA00037175319900009049
675-B4、
Figure BDA00037175319900009050
679-C5、
Figure BDA00037175319900009051
680、
Figure BDA00037175319900009052
683Q、
Figure BDA00037175319900009053
690-B1、
Figure BDA00037175319900009054
690-B2、
Figure BDA00037175319900009055
696Q、
Figure BDA00037175319900009056
700-B1、
Figure BDA00037175319900009057
700-B1、
Figure BDA00037175319900009058
730-B1、
Figure BDA00037175319900009059
730-B2、
Figure BDA00037175319900009060
730-B3、
Figure BDA00037175319900009061
730-B4、
Figure BDA00037175319900009062
747、
Figure BDA00037175319900009063
747-B1、
Figure BDA00037175319900009064
747-B2、
Figure BDA00037175319900009065
747-B3、
Figure BDA00037175319900009066
747-B4、
Figure BDA00037175319900009067
755、
Figure BDA00037175319900009068
766Q、
Figure BDA00037175319900009069
775-B2、
Figure BDA00037175319900009070
775-B3、
Figure BDA00037175319900009071
775-B4、
Figure BDA00037175319900009072
780-B1、
Figure BDA00037175319900009073
780-B2、
Figure BDA00037175319900009074
780-B3、
Figure BDA00037175319900009075
800、
Figure BDA00037175319900009076
830-B2、Dyomics-350、Dyomics-350XL、Dyomics-360XL、Dyomics-370XL、Dyomics-375XL、Dyomics-380XL、Dyomics-390XL、Dyomics-405、Dyomics-415、Dyomics-430、Dyomics-431、Dyomics-478、Dyomics-480XL、Dyomics-481XL、Dyomics-485XL、Dyomics-490、Dyomics-495、Dyomics-505、Dyomics-510XL、Dyomics-511XL、Dyomics-520XL、Dyomics-521XL、Dyomics-530、Dyomics-547、Dyomics-547P1、Dyomics-548、Dyomics-549、Dyomics-549P1、Dyomics-550、Dyomics-554、Dyomics-555、Dyomics-556、Dyomics-560、Dyomics-590、Dyomics-591、Dyomics-594、Dyomics-601XL、Dyomics-605、Dyomics-610、Dyomics-615、Dyomics-630、Dyomics-631、Dyomics-632、Dyomics-633、Dyomics-634、Dyomics-635、Dyomics-636、Dyomics-647、Dyomics-647P1、Dyomics-648、Dyomics-648P1、Dyomics-649、Dyomics-649P1、Dyomics-650、Dyomics-651、Dyomics-652、Dyomics-654、Dyomics-675、Dyomics-676、Dyomics-677、Dyomics-678、Dyomics-679P1、Dyomics-680、Dyomics-681、Dyomics-682、Dyomics-700、Dyomics-701、Dyomics-703、Dyomics-704、Dyomics-730、Dyomics-731、Dyomics-732、Dyomics-734、Dyomics-749、Dyomics-749P1、Dyomics-750、Dyomics-751、Dyomics-752、Dyomics-754、Dyomics-776、Dyomics-777、Dyomics-778、Dyomics-780、Dyomics-781、Dyomics-782、Dyomics-800、Dyomics-831、
Figure BDA0003717531990000911
450、伊红、FITC、荧光素、HiLyteTM Fluor 405、HiLyteTM Fluor 488、HiLyteTM Fluor 532、HiLyteTM Fluor 555、HiLyteTM Fluor 594、HiLyteTM Fluor 647、HiLyteTM Fluor 680、HiLyteTM Fluor 750、
Figure BDA0003717531990000912
680LT、
Figure BDA0003717531990000913
750、
Figure BDA0003717531990000914
800CW、JOE、
Figure BDA0003717531990000915
640R、
Figure BDA0003717531990000916
Red 610、
Figure BDA0003717531990000917
Red 640、
Figure BDA0003717531990000918
Red 670、
Figure BDA0003717531990000919
Red 705、丽丝胺罗丹明B、Napthofluorescein、Oregon
Figure BDA00037175319900009110
488、Oregon
Figure BDA00037175319900009111
514、PacificBlueTM、Pacific GreenTM、Pacific OrangeTM、PET、PF350、PF405、PF415、PF488、PF505、PF532、PF546、PF555P、PF568、PF594、PF610、PF633P、PF647P、
Figure BDA00037175319900009112
570、
Figure BDA00037175319900009113
670、
Figure BDA00037175319900009114
705、罗丹明123、罗丹明6G、罗丹明B、罗丹明绿、罗丹明绿-X、罗丹明红、ROX、SetaTM 375、SetaTM 470、SetaTM 555、SetaTM 632、SetaTM 633、SetaTM 650、SetaTM 660、SetaTM 670、SetaTM 680、SetaTM 700、SetaTM 750、SetaTM 780、SetaTM APC-780、SetaTMPerCP-680、SetaTM R-PE-670、SetaTM 646、SeTau 380、SeTau 425、SeTau 647、SeTau 405、Square 635、Square 650、Square 660、Square 672、Square 680、磺酰罗丹明101、TAMRA、TET、Texas
Figure BDA0003717531990000921
TMR、TRITC、Yakima YellowTM
Figure BDA0003717531990000922
Zy3、Zy5、Zy5.5和Zy7。
E.发光
在一些方面,本申请涉及基于发光标记的一种或多种发光特性的多肽测序和/或鉴定。在一些实施方案中,基于发光寿命、发光强度、亮度、吸收光谱、发射光谱、发光量子产率或其两种或更多种的组合来鉴定发光标记。在一些实施方案中,多种类型的发光标记可以基于不同的发光寿命、发光强度、亮度、吸收光谱、发射光谱、发光量子产率或其中两种或更多种的组合而彼此区分。鉴定可以指指定与发光标记相关的一种类型的氨基酸(例如,单一类型或类型的子集)的确切身份和/或数量,并且还可以指指定多肽中氨基酸相对于其他类型的氨基酸的位置。
在一些实施方案中,通过将发光标记暴露于一系列单独的光脉冲并评估从标记发射的每个光子的时序或其他特性来检测发光。在一些实施方案中,从标记顺序发射的多个光子的信息被聚集和评估以鉴定标记并由此鉴定相关类型的氨基酸。在一些实施方案中,标记的发光寿命由从标记顺序发射的多个光子确定,并且发光寿命可用于鉴定标记。在一些实施方案中,标记的发光强度由从标记顺序发射的多个光子确定,并且发光强度可用于鉴定标记。在一些实施方案中,标记的发光寿命和发光强度由从标记顺序发射的多个光子确定,并且发光寿命和发光强度可用于鉴定标记。
在本申请的一些方面,将单个多肽分子暴露于多个单独的光脉冲,并检测和分析一系列发射光子。在一些实施方案中,所述一系列发射光子提供了关于存在的并且在实验期间在反应样品中不改变的单个多肽分子的信息。然而,在一些实施方案中,所述一系列发射光子提供关于在反应样品中在不同时间(例如,随着反应或过程进行)存在的一系列不同分子的信息。作为实例而非限制,此类信息可用于根据本申请对经受化学或酶促降解的多肽进行测序和/或鉴定。
在某些实施方案中,发光标记吸收一个光子并在一个时段后发射一个光子。在一些实施方案中,可以通过测量所述时段来确定或估计标记的发光寿命。在一些实施方案中,可以通过测量多个脉冲事件和发射事件的多个时段来确定或估计标记的发光寿命。在一些实施方案中,可以通过测量时段在多种类型的标记的发光寿命中区分标记的发光寿命。在一些实施方案中,可以通过测量多个脉冲事件和发射事件的多个时段在多种类型的标记的发光寿命中区分标记的发光寿命。在某些实施方案中,通过确定或估计标记的发光寿命在多种类型的标记中鉴定或区分标记。在某些实施方案中,通过在多种类型的标记的多种发光寿命中区分标记的发光寿命,在多种类型的标记中鉴定或区分标记。
可以使用任何合适的方法(例如,通过使用合适的技术测量寿命或通过确定发射的时间相关特性)来确定发光标记的发光寿命。在一些实施方案中,确定一个标记的发光寿命包括确定相对于另一标记的寿命。在一些实施方案中,确定标记的发光寿命包括确定相对于参照的寿命。在一些实施方案中,确定标记的发光寿命包括测量寿命(例如荧光寿命)。在一些实施方案中,确定标记的发光寿命包括确定一种或多种指示寿命的时间特性。在一些实施方案中,可以基于多个发射事件(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100或更多个发射事件)发生在相对于激发脉冲的一个或多个时间门控窗口的分布来确定标记的发光寿命。例如,可以基于关于激发脉冲测量的光子到达时间的分布将标记的发光寿命与具有不同发光寿命的多个标记区分开来。
应当理解,发光标记的发光寿命指示在标记达到激发态之后发射的光子的时序,并且可以通过指示光子的时序的信息来区分标记。一些实施方案可以包括基于标记的发光寿命通过测量与所述标记发射的光子相关联的时间来区分标记与多个标记。时间分布可以提供发光寿命的指示,该指示可以从分布中确定。在一些实施方案中,可以基于时间分布区分标记与多个标记,例如通过将时间分布与对应于已知标记的参照分布进行比较。在一些实施方案中,发光寿命的值由时间分布确定。
如本文所用,在一些实施方案中,发光强度是指每单位时间由发光标记发射的发射光子的数量,该发光标记通过递送脉冲激发能量而被激发。在一些实施方案中,发光强度是指每单位时间检测到的发射光子的数量,这些光子由通过脉冲激发能量的递送而被激发的标记发射并且由特定传感器或传感器组检测。
如本文所用,在一些实施方案中,亮度是指报告每个发光标记的平均发射强度的参数。因此,在一些实施方案中,“发射强度”可用于一般指包含一种或多种标记的组合物的亮度。在一些实施方案中,标记的亮度等于其量子产率和消光系数的乘积。
如本文所用,在一些实施方案中,发光量子产率是指在给定波长或在给定光谱范围内导致发射事件的激发事件的分数,并且通常小于1。在一些实施方案中,本文所述的发光标记的发光量子产率在0和约0.001之间、在约0.001和约0.01之间、在约0.01和约0.1之间、在约0.1和约0.5之间、在约0.5和0.9之间或在约0.9和1之间。在一些实施方案中,通过确定或估计发光量子产率来鉴定标记。
如本文所用,在一些实施方案中,激发能量是来自光源的光脉冲。在一些实施方案中,激发能量在可见光谱中。在一些实施方案中,激发能量在紫外光谱中。在一些实施方案中,激发能量在红外光谱中。在一些实施方案中,激发能量处于或接近发光标记的吸收最大值,从该发光标记中检测多个发射光子。在某些实施方案中,激发能量在约500nm和约700nm之间(例如,在约500nm和约600nm之间、在约600nm和约700nm之间、在约500nm和约550nm之间、在约550nm和约600nm之间、在约600nm和约650nm之间或在约650nm和约700nm之间)。在某些实施方案中,激发能量可以是单色的或限制在光谱范围内。在一些实施方案中,光谱范围具有约0.1nm至约1nm、约1nm至约2nm或约2nm至约5nm的范围。在一些实施方案中,光谱范围具有约5nm至约10nm、约10nm至约50nm或约50nm至约100nm的范围。
V.用于样品制备的试剂盒
在一些方面,本公开涉及用于制备用于测序的多肽样品(例如,多重样品)的试剂盒。试剂盒可能足以制备用于测序的一个或多个多肽样品(例如,多重样品)。在一些实施方案中,试剂盒足以制备单个多肽样品。在其他实施方案中,试剂盒足以制备至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90或至少100个多肽样品。
在一些实施方案中,试剂盒包含如本文所述的包含多个条形码分子的条形码组分。参见“制备多重样品的方法”。在一些实施方案中,试剂盒包含如本文所述的一种或多种检测分子。参见“制备多重样品的方法”。在一些实施方案中,试剂盒包含如本文所述的允许物理分离不同来源的多肽群的固体支持物。参见“制备多重样品的方法”。在一些实施方案中,试剂盒包含如本文所述的包含多个富集分子的富集组分。参见“多肽富集方法”。在一些实施方案中,试剂盒包含如本文所述的修饰剂。参见“多肽富集方法”。在一些实施方案中,试剂盒包含如本文所述的亲和试剂。参见“多肽测序方法学”。在一些实施方案中,试剂盒包含如本文所述的标记的肽酶。参见“多肽测序方法学”。
试剂盒可以对一种或多种生物体(例如,一种或多种单细胞和/或多细胞生物体)是特异性的。在一些实施方案中,试剂盒包含修饰一种或多种生物体的多肽、与其结合、被其结合等的组分(例如,条形码分子、检测分子、富集分子或其组合)。例如,在一些实施方案中,试剂盒包含修饰人类蛋白质组中的一种或多种已知多肽、与其结合、被其结合等的组分。
在一些实施方案中,试剂盒对一种或多种疾病或病况具有特异性。例如,试剂盒可以是肿瘤学试剂盒、心脏病学试剂盒、遗传疾病试剂盒或其组合。
肿瘤学试剂盒可以包含与ABL1、ABL2、ACSL3、ACVR2A、ADAMTS20、ADGRA2、ADGRB3、ADGRL3、AFF1、AFF3、AKAP9、AKT1、AKT2、AKT3、ALK、AMER1、APC、AR、ARID1A、ARID2、ARNT、ASXL1、ATF1、ATM、ATR、ATRX、AURKA、AURKB、AURKC、AXL、BAP1、BCL10、BCL11A、BCL11B、BCL2、BCL2L1、BCL2L2、BCL3、BCL6、BCL7A、BCL9、BCR、BIRC2、BIRC3、BIRC5、BLM、BLNK、BMPR1A、BRAF、BRCA1、BRCA2、BRD3、BRIP1、BTK、BUB1B、CACNA1D、CARD11、CASC5、CASP8、CBFA2T3、CBFB、CBL、CCND1、CCND2、CCNE1、CD79A、CD79B、CDC73、CDH1、CDH11、CDH2、CDH20、CDH5、CDK12、CDK4、CDK6、CDK8、CDKN2A、CDKN2B、CDKN2C、CEBPA、CHEK1、CHEK2、CIC、CKS1B、CMPK1、COL1A1、CRBN、CREB1、CREBBP、CRKL、CRLF2、CRTC1、CSF1R、CSMD3、CTNNA1、CTNNB1、CYLD、CYP2C19、CYP2D6、DAXX、DCC、DDB2、DDIT3、DDR2、DEK、DICER1、DNMT3A、DPYD、DST、EGFR、EML4、EP300、EP400、EPHA3、EPHA7、EPHB1、EPHB4、EPHB6、ERBB2、ERBB3、ERBB4、ERCC1、ERCC2、ERCC3、ERCC4、ERCC5、ERG、ESR1、ETS1、ETV1、ETV4、EXT1、EXT2、EZH2、FANCA、FANCC、FANCD2、FANCF、FANCG、FAS、FBXW7、FCGR2B、FGFR1、FGFR2、FGFR3、FGFR4、FH、FLCN、FLI1、FLT1、FLT3、FLT4、FN1、FOXA1、FOXL2、FOXO1、FOXO3、FOXP1、FOXP4、FZR1、G6PD、GATA1、GATA2、GATA3、GDNF、GNA11、GNAQ、GNAS、GPC3、GRM8、GUCY1A2、HCAR1、HEY1、HIF1A、HIST1H3B、HLF、HMGA1、HNF1A、HOOK3、HOXA13、HOXD11、HRAS、HSP90AA1、HSP90AB1、ICK、IDH1、IDH2、IGF1R、IGF2、IGF2R、IKBKB、IKBKE、IKZF1、IL2、IL21R、IL6ST、IL7R、ING4、IRF4、IRS2、ITGA10、ITGA9、ITGB2、ITGB3、JAK1、JAK2、JAK3、JUN、KAT6A、KAT6B、KDM5C、KDM6A、KDR、KEAP1、KIAA1549、KIT、KLF6、KMT2A、KMT2C、KMT2D、KRAS、LAMP1、LCK、LIFR、LPP、LRP1B、LTF、LTK、MAF、MAFB、MAGEA1、MAGI1、MALT1、MAML2、MAP2K1、MAP2K2、MAP2K4、MAP3K7、MAPK1、MAPK8、MARK1、MARK4、MBD1、MCL1、MDM2、MDM4、MEN1、MET、MITF、MLH1、MLLT10、MLLT4、MLLT6、MMP2、MN1、MPL、MRE11A、MSH2、MSH6、MTCP1、MTOR、MTR、MTRR、MUC1、MUTYH、MYB、MYC、MYCL、MYCN、MYD88、MYH11、MYH9、NBN、NCOA1、NCOA2、NCOA4、NF1、NF2、NFE2L2、NFKB1、NFKB2、NIN、NKX2-1、NLRP1、NOTCH1、NOTCH2、NOTCH4、NPM1、NR4A3、NRAS、NSD1、NTRK1、NTRK3、NUMA1、NUP214、NUP98、NUTM2A、NUTM2B、OMD、P2RY8、PAK3、PALB2、PARP1、PAX3、PAX5、PAX7、PAX8、PBRM1、PBX1、PDE4DIP、PDGFB、PDGFRA、PDGFRB、PER1、PGAP3、PHOX2B、PIK3C2B、PIK3CA、PIK3CB、PIK3CD、PIK3CG、PIK3R1、PIK3R2、PIM1、PKHD1、PLAG1、PLCG1、PLEKHG5、PML、PMS1、PMS2、POT1、POU5F1、PPARG、PPP2R1A、PRDM1、PRKAR1A、PRKDC、PSIP1、PTCH1、PTEN、PTGS2、PTPN11、PTPRD、PTPRT、RAD50、RAF1、RALGDS、RAP1GDS1、RARA、RB1、RECQL4、REL、RET、RHOH、RNASEL、RNF2、RNF213、ROS1、RPS6KA2、RRM1、RUNX1、RUNX1T1、SAMD9、SBDS、SDHA、SDHB、SDHC、SDHD、SET、SETBP1、SETD2、SF3B1、SGK1、SH2D1A、SH3GL1、SMAD2、SMAD4、SMARCA4、SMARCB1、SMO、SMUG1、SOCS1、SOX11、SOX2、SRC、SSX1、SSX2、SSX4、STAT5B、STK11、STK36、SUFU、SYK、SYNE1、TAF1、TAF1L、TAL1、TBL1XR1、TBX22、TCF12、TCF3、TCF7L1、TCF7L2、TCL1A、TERT、TET1、TET2、TFE3、TGFBR2、TGM7、THBS1、TIMP3、TLR4、TLX1、TMPRSS2、TNFAIP3、TNFRSF14、TNK2、TOP1、TP53、TPR、TRIM24、TRIM33、TRIP11、TRRAP、TSC1、TSC2、TSHR、TTL、UBR5、UGT1A1、USP9X、VHL、WAS、WHSC1、WRN、WT1、XPA、XPC、XPO1、XRCC2、ZNF384、ZNF521或其任意组合结合(或被其结合)的富集分子。
心脏病学试剂盒可以包含与ABCC9、ABCG5、ABCG8、ACTA1、ACTA2、ACTC1、ACTN2、AKAP9、ALMS1、ANK2、ANKRD1、APOA4、APOA5、APOB、APOC2、APOE、BAG3、BRAF、CACNA1C、CACNA2D1、CACNB2、CALM1、CALR3、CASQ2、CAV3、CBL、CBS、CETP、COL3A1、COL5A1、COL5A2、COX15、CREB3L3、CRELD1、CRYAB、CSRP3、CTF1、DES、DMD、DNAJC19、DOLK、DPP6、DSC2、DSG2、DSP、DTNA、EFEMP2、ELN、EMD、EYA4、FBN1、FBN2、FHL1、FHL2、FKRP、FKTN、FXN、GAA、GATAD1、GCKR、GJA5、GLA、GPD1L、GPIHBP1、HADHA、HCN4、HFE、HRAS、HSPB8、ILK、JAG1、JPH2、JUP、KCNA5、KCND3、KCNE1、KCNE2、KCNE3、KCNH2、KCNJ2、KCNJ5、KCNJ8、KCNQ1、KLF10、KRAS、LAMA2、LAMA4、LAMP2、LDB3、LDLR、LDLRAP1、LMF1、LMNA、LPL、LTBP2、MAP2K1、MAP2K2、MIB1、MURC、MYBPC3、MYH11、MYH6、MYH7、MYL2、MYL3、MYLK、MYLK2、MYO6、MYOZ2、MYPN、NEXN、NKX2-5、NODAL、NOTCH1、NPPA、NRAS、PCSK9、PDLIM3、PKP2、PLN、PRDM16、PRKAG2、PRKAR1A、PTPN11、RAF1、RANGRF、RBM20、RYR1、RYR2、SALL4、SCN1B、SCN2B、SCN3B、SCN4B、SCN5A、SCO2、SDHA、SEPN1、SGCB、SGCD、SGCG、SHOC2、SLC25A4、SLC2A10、SMAD3、SMAD4、SNTA1、SOS1、SREBF2、TAZ、TBX20、TBX3、TBX5、TCAP、TGFB2、TGFB3、TGFBR1、TGFBR2、TMEM43、TMPO、TNNC1、TNNI3、TNNT2、TPM1、TRDN、TRIM63、TRPM4、TTN、TTR、TXNRD2、VCL、ZBTB17、ZHX3和/或ZIC3结合(或被其结合)的富集分子。
遗传性疾病试剂盒可以包含与ABCA4、ABCC9、ABCD1、ACADVL、ACTA2、ACTC1、ACTN2、ADA、AIPL1、AIRE、AKAP9、ALPL、AMT、ANK2、APC、APP、APTX、ARL6、ARSA、ASL、ASPA、ATL1、ATM、ATP2A2、ATP7A、ATP7B、ATXN1、ATXN2、ATXN7、BAG3、BCKDHA、BCKDHB、BEST1、BMPR1A、BTD、BTK、CA4、CACNA1C、CACNB2、CALR3、CAPN3、CASQ2、CAV3、CCDC39、CCDC40、CDH23、CEP290、CERKL、CFTR、CHAT、CHD7、CHEK2、CHM、CHRNA1、CHRNB1、CHRND、CHRNE、CLCN1、CNGB1、COL11A1、COL11A2、COL1A1、COL1A2、COL2A1、COL3A1、COL4A1、COL4A5、COL5A1、COL5A2、COL7A1、COL9A1、CRB1、CRX、CTDP1、CTNS、CYP27A1、DBT、DCX、DES、DHCR7、DKC1、DLD、DMD、DNAH11、DNAH5、DNAH9、DNAI1、DNAI2、DNM2、DOK7、DSC2、DSG2、DSP、DYSF、ELN、EMD、ENG、EXT1、EYA1、EYS、F8、F9、FANCA、FANCC、FANCF、FANCG、FBN1、FBXO7、FGFR1、FGFR3、FMO3、FOXL2、FRG1、FRMD7、FSCN2、FXN、GAA、GALT、GATA4、GBA、GBE1、GCSH、GDF5、GJB2、GJB3、GJB6、GLA、GLDC、GNE、GNPTAB、GPC3、GPD1L、GPR143、GUCY2D、HBA2、HBB、HCN4、HEXA、HFE、HIBCH、HMBS、HR、IDS、IDUA、IKBKAP、IL2RG、IMPDH1、ITGB4、JAG1、JUP、KCNE1、KCNE2、KCNE3、KCNH2、KCNJ2、KCNQ1、KCNQ4、KIAA0196、KLHL7、KRAS、KRT14、KRT5、L1CAM、LAMB3、LAMP2、LDB3、LMNA、LRAT、LRRK2、MAPT、MC1R、MECP2、MED12、MEN1、MERTK、MFN2、MLH1、MMAA、MMAB、MMACHC、MPZ、MSH2、MTM1、MUT、MYBPC3、MYH11、MYH6、MYH7、MYL2、MYL3、MYLK、MYO7A、MYOZ2、NF1、NF2、NIPBL、NKX2-5、NME8、NPC1、NPC2、NR2E3、NRAS、NSD1、OCA2、OCRL、OTC、PABPN1、PAFAH1B1、PAH、PAX3、PAX6、PCDH15、PEX1、PEX10、PEX13、PEX14、PEX19、PEX26、PEX3、PEX5、PINK1、PKD1、PKD2、PKHD1、PKP2、PLEC、PLN、PLOD1、PMM2、PMP22、POLG、PPT1、PRCD、PRKAG2、PROM1、PRPF31、PRPF8、PRPH2、PSEN1、PSEN2、PTCH1、PTPN11、RAF1、RAG1、RAG2、RAI1、RAPSN、RB1、RDH12、RET、RHO、ROR2、RP9、RPE65、RPGR、RPGRIP1、RPL11、RPL35A、RPS10、RPS19、RPS24、RPS26、RPS6KA3、RPS7、RS1、RSPH4A、RSPH9、RYR1、RYR2、SALL4、SCN1B、SCN3B、SCN4B、SCN5A、SCN9A、SEMA4A、SERPINA1、SERPING1、SGCD、SH3BP2、SIX1、SIX5、SLC25A13、SLC25A4、SLC26A4、SMAD3、SMAD4、SNCA、SNRNP200、SNTA1、SOD1、SOS1、SOX9、SPATA7、SPG7、STARD3、TAF1、TAZ、TBX5、TCOF1、TGFBR1、TGFBR2、TMEM43、TNNC1、TNNI3、TNNT1、TNNT2、TNXB、TOPORS、TP53、TPM1、TSC1、TSC2、TTPA、TTR、TULP1、TWIST1、TYR、USH1C、USH2A、VCL、VHL、WAS、WRN、WT1或其任意组合结合(或被其结合)的富集分子。
在一些实施方案中,试剂盒中的至少一种组分以干燥或冻干形式提供。在其他实施方案中,试剂盒的至少一种组分以溶解的形式提供。
本文提供的试剂盒采用合适的包装。合适的包装包括但不限于小瓶、瓶子、罐子、软包装等。还考虑了与特定装置结合使用的包装。参见“用于样品制备和样品测序的装置”。试剂盒可以具有无菌入口(例如,容器可以是具有可被皮下注射针刺穿的塞子的静脉注射溶液袋或小瓶)。容器还可以具有无菌入口。
试剂盒任选地可以提供另外的部件,例如缓冲液和解释信息。在一些实施方案中,试剂盒进一步包含至少一种缓冲液。适用于本文所述的方法的缓冲液先前已描述。在一些实施方案中,试剂盒可以另外包含在本文所述的任何方法中使用的说明。
在一些实施方案中,本公开提供了包含上述试剂盒内容物的制品。
VI.用于样品制备和样品测序的装置
在一些方面,本公开涉及用于样品制备和/或样品测序的装置。在一些实施方案中,所述装置包括样品制备模块。在一些实施方案中,所述装置包括样品测序模块。在一些实施方案中,所述装置包括样品制备模块和样品测序模块。
A.用于样品制备的装置
通常提供在制备用于分析的样品的过程中使用的包括装置、盒(例如,包含通道(例如,微流体通道))和/或泵(例如,蠕动泵)的装置。根据本公开,可以使用装置来使来自生物样品的靶分子的富集、浓缩、操作和/或检测成为可能。在一些实施方案中,提供了用于自动处理样品以产生用于下一代测序和/或其他下游分析技术的材料的装置和相关方法。装置和相关方法可用于执行化学和/或生物反应,包括根据本文别处描述的样品制备或样品分析过程的核酸和/或多肽加工反应。
在一些实施方案中,设置样品制备装置以将靶分子或包含多个分子(例如,靶核酸或靶多肽)的样品递送或转移至测序模块或装置。在一些实施方案中,样品制备装置直接连接到(例如,物理连接到)或间接连接到测序装置。
在一些实施方案中,装置包括序列制备模块,其被设置为接收一个或多个盒。在一些实施方案中,盒包括一个或多个储存器或反应容器,其被设置为接收流体和/或包含在样品制备过程中使用的一种或多种试剂。在一些实施方案中,盒包含一个或多个通道(例如,微流体通道),其被设置为容纳和/或传输在样品制备过程中使用的流体(例如,包含一种或多种试剂的流体)。试剂包括缓冲液、酶促试剂、聚合物基质、条形码组分(例如,条形码分子)、检测分子、富集分子、捕获试剂、尺寸特异性选择试剂、序列特异性选择试剂和/或纯化试剂。在样品制备过程中使用的其他试剂在本文别处描述。
在一些实施方案中,盒包括一种或多种(例如,适合重构为液体形式的液体或冻干形式的)储存试剂。盒的存储试剂包括适合于执行所需过程的试剂和/或适合于处理所需样品类型的试剂。在一些实施方案中,盒是单次使用的盒(例如,一次性盒)或多次使用的盒(例如,可重复使用的盒)。在一些实施方案中,盒被设置为接收用户提供的样品。用户提供的样品可以在装置接收所述盒之前或之后被添加到所述盒中,例如,由用户手动或以自动化过程。
在一些实施方案中,所述装置可有助于在根据本公开的方法中制备多重样品。参见“制备多重样品的方法”。
在一些实施方案中,所述装置可有助于在根据本公开的方法中靶分子的富集。参见“多肽富集方法”。以这种方式,所述装置能够利用分子以高度多重的方式富集目的多肽。
在一些实施方案中,使用电泳方法富集样品中的靶分子。在一些实施方案中,使用亲和力SCODA富集样品中的靶分子。在一些实施方案中,使用反转场凝胶电泳(FIGE)富集样品中的靶分子。在一些实施方案中,使用脉冲场凝胶电泳(PFGE)富集样品中的靶分子。
在一些实施方案中,装置包含样品制备模块,所述样品制备模块包含在富集过程中使用的基质(例如,多孔介质、电泳聚合物凝胶),所述基质包含固定化的捕获探针,所述捕获探针与样品中存在的靶分子(直接或间接)结合。在一些实施方案中,在富集过程中使用的基质包含1、2、3、4、5或更多个独特的固定化的捕获探针,每个探针结合独特靶分子和/或以不同的结合亲和力结合相同的靶分子。
在一些实施方案中,固定化的捕获探针是与靶多肽或多肽片段结合的多肽捕获探针。例如,在一些实施方案中,固定化的捕获探针是如本文所述的富集分子。
在一些实施方案中,多肽捕获探针以10-9至10-8M、10-8至10-7M、10-7至10-6M、10-6至10-5M、10-5至10-4M、10-4至10-3M或10-3至10-2M的结合亲和力与靶多肽(或多肽片段)结合。在一些实施方案中,结合亲和力在皮摩尔至纳摩尔范围内(例如,在约10-12和约10-9M之间)。在一些实施方案中,结合亲和力在纳摩尔至微摩尔范围内(例如,在约10-9和约10-6M之间)。在一些实施方案中,结合亲和力在微摩尔至毫摩尔范围内(例如,在约10-6和约10-3M之间)。在一些实施方案中,结合亲和力在皮摩尔至微摩尔范围内(例如,在约10-12和约10-6M之间)。在一些实施方案中,结合亲和力在纳摩尔至毫摩尔范围内(例如,在约10-9和约10-3M之间)。
在一些实施方案中,固定化的捕获探针是与靶核酸杂交的寡核苷酸捕获探针。在一些实施方案中,寡核苷酸捕获探针与靶核酸至少50%、60%、70%、80%、90%、95%或100%互补。在一些实施方案中,单个寡核苷酸捕获探针可用于富集具有至少50%、60%、70%、80%、90%、95%或99%的序列同一性的多个相关靶核酸(例如,2、3、4、5、6、7、8、9、10、20、30、40、50或更多个相关靶核酸)。多种相关靶核酸的富集可以允许产生宏基因组文库。在一些实施方案中,寡核苷酸捕获探针可以实现相关靶核酸的差异富集。在一些实施方案中,寡核苷酸捕获探针可以实现靶核酸相对于与其修饰状态(例如甲基化状态、乙酰化状态)不同的相同序列核酸的富集。
在一些实施方案中,为了富集长度为0.5-2k碱基的核酸靶分子,寡核苷酸捕获探针可以使用5’Acrydite部分被共价固定在丙烯酰胺基质中。在一些实施方案中,为了富集更大的核酸靶分子(例如,长度>2k碱基),寡核苷酸捕获探针可以被固定在琼脂糖基质中。在一些实施方案中,寡核苷酸捕获探针可以使用硫醇-环氧化物化学(例如,通过将硫醇修饰的寡核苷酸共价连接到交联的琼脂糖珠粒)固定在琼脂糖基质中。连接到琼脂糖珠粒的寡核苷酸捕获探针可以在标准琼脂糖基质(例如,以相同的琼脂糖百分比)中结合和固化。
在一些实施方案中,多种捕获探针(例如,多种捕获探针类型的群体,例如,与诸如腺病毒、葡萄球菌、肺炎或结核病等传染原的确定性靶分子结合的群体)可以被固定在富集基质中。将样品应用于具有多个确定性捕获探针的富集基质可能会导致疾病或病况的诊断(例如,存在传染原)。
在一些实施方案中,在根据本公开的方法中,在去除非靶分子之后,装置可以有助于靶分子从富集基质中的释放。在一些实施方案中,可以通过增加富集基质的温度从富集基质中释放靶分子。调整基质的温度会进一步影响迁移速率,因为升高的温度会提供更高的捕获探针严格性,从而需要靶分子和捕获探针之间更大的结合亲和力。在一些实施方案中,在富集相关靶分子时,可以逐步提高基质温度,从而以逐步增加同源性来释放和分离靶分子。这可以允许对与初始参考靶分子的关系越来越远的靶多肽或靶核酸进行测序,从而能够发现新的蛋白质(例如,酶)或功能(例如,酶促功能或基因功能)。在一些实施方案中,当使用多个捕获探针(例如,多个确定性捕获探针)时,基质温度可以逐步或以梯度方式增加,允许不同靶分子的温度依赖性释放并导致产生一系列条形码释放带,其代表存在或不存在控制分子和目标分子。
根据本公开的装置通常包含机械和电子和/或光学部件,其可用于操作如本文所述的盒。在一些实施方案中,装置部件运行以在盒上或在盒的特定区域上实现和维持特定温度。在一些实施方案中,装置部件运行以向盒的电极施加特定时长的特定电压。在一些实施方案中,装置部件运行以将液体移入、移出盒的储存器和/或反应容器或移至盒的储存器和/或反应容器之间。在一些实施方案中,装置部件运行以将液体移动通过盒的通道,例如,移入、移出盒的储存器和/或反应容器或移至盒的储存器和/或反应容器之间。在一些实施方案中,装置部件通过与盒的弹性体、试剂特异性储存器或反应容器相互作用的蠕动泵送机构(例如,装置)移动液体。在一些实施方案中,装置部件通过蠕动泵送机构(例如,装置)移动液体,所述蠕动泵送机构被设置为与与盒的通道相关联的弹性体部件(例如,包括弹性体的表面层)相互作用以泵送流体通过通道。装置部件可以包括计算机资源,例如,用于驱动可以输入样品信息、可以选择特定过程以及可以报告运行结果的用户界面。
以下非限制性实例旨在说明本文所述的装置、方法和组合物的方面。根据本公开的样品制备装置的使用可以进行以下描述的步骤中的一个或多个。用户可以打开装置的盖子并插入支持所需过程的盒。然后,用户可以将可以与特定裂解溶液结合的样品添加到盒上的样品端口。然后,用户可以关闭装置盖子,通过装置上的触摸屏界面输入任何样品特定信息,选择任何过程特定参数(例如,所需大小选择的范围、靶分子捕获所需的同源度等),并启动样品制备过程运行。
运行后,用户可能会收到相关的运行数据(例如,运行成功完成的确认、运行特定指标等)以及过程特定信息(例如,生成的样本量、特定靶序列的存在或不存在等)。通过运行生成的数据可以进行后续的生物信息学分析,该分析可以是本地的或基于云的。根据进程,可以从盒中提取完成的样本以供后续使用(例如,基因组测序、qPCR定量、克隆等)。然后可以打开该装置,然后可以取出盒。
图9提供了描绘用于制备样品(例如,富集或多重样品)的示例性装置的图示。参见例如美国专利号8608929,其全部内容通过引用的方式并入本文。
B.测序装置
通常还提供包括在对包含多肽的样品(例如,多重样品)进行测序的过程中使用的装置、盒(例如,包含通道(例如,微流体通道))和/或泵(例如,蠕动泵)的装置。在一些方面,可以使用允许单分子分析和/或单分子测序并行的系统来进行根据本公开的核酸或多肽的测序。所述系统可以包括测序装置和被设置为与测序装置接口的仪器。
测序装置可以包括包含像素阵列的测序模块,其中各个像素包括样品孔和至少一个光检测器。测序装置的样品孔可以形成在测序装置的表面上或穿过测序装置的表面,并且被设置为接收放置在测序装置表面上的样品。在一些实施方案中,样品孔是可以被插入装置中的盒(例如,一次性或单次使用的盒)的部件。总的来说,样品孔可以被认为是样品孔的阵列。多个样品孔可以具有合适的尺寸和形状,使得样品孔的至少一部分接收单个靶分子或包含多个分子(例如,靶核酸或靶多肽)的样品。在一些实施方案中,样品孔内的分子数量可以分布在测序装置的样品孔中,使得一些样品孔包含一个分子(例如,靶核酸或靶多肽),而其他样品孔包含零个、两个或更多个分子。
在一些实施方案中,测序装置设置在从样品制备装置接收包含多个分子(例如,一种或多种目的多肽)的样品的位置。在一些实施方案中,测序装置直接连接(例如,物理连接到)或间接连接到样品制备装置。
测序装置可以包括像素阵列,其中各个像素包括样品孔和至少一个光检测器。测序装置的样品孔可以形成在测序装置的表面上或穿过测序装置的表面,并且被设置为接收放置在测序装置表面上的样品。总的来说,样品孔可以被认为是样品孔的阵列。多个样品孔可以具有合适的尺寸和形状,使得样品孔的至少一部分接收单个样品(例如,单个分子,例如多肽)。在一些实施方案中,样品孔内的样品数量可以分布在测序装置的样品孔中,使得一些样品孔包含一个样品,而其他样品孔包含零个、两个或更多个样品。
从一个或多个光源向测序装置提供激发光,所述光源可以在测序装置的外部或内部。测序装置的光学部件可以接收来自光源的激发光并将光引导到测序装置的样品孔阵列并照亮样品孔内的照明区域。在一些实施方案中,样品孔可以具有允许样品保持在样品孔表面附近的构造,这可以容易地将激发光递送到样品和检测来自样品的发射光。位于照明区域内的样品可以响应于被激发光照亮而发射光。例如,可以用荧光标志物标记样品,所述荧光标志物响应于通过激发光的照射实现激发态而发射光。由样品发射的发射光然后可以由对应于样品孔的像素内的一个或多个光检测器检测,其中样品被分析。根据一些实施方案,当在数量范围可以在大约10,000像素到1,000,000像素之间的样品孔阵列上执行时,可以并行分析多个样品。
测序装置可以包括用于接收激发光并将激发光引导到样品孔阵列之间的光学系统。光学系统可以包括一个或多个被设置为将激发光耦合到测序装置并将激发光引导到其他光学部件的光栅耦合器。光学系统可以包括将来自光栅耦合器的激发光引导到样品孔阵列的光学部件。这样的光学部件可以包括分光器、光学组合器和波导。在一些实施方案中,一个或多个分光器可以耦合来自光栅耦合器的激发光并将激发光递送到至少一个波导。根据一些实施方案,分光器可以具有允许激发光在所有波导上基本均匀地传递的构造,使得每个波导接收基本相似量的激发光。这样的实施方案可以通过提高测序装置的样品孔接收的激发光的均匀性来提高测序装置的性能。例如,用于将激发光耦合到样品孔和/或将发射光引导到光检测器以包括在测序装置中的合适部件的实例在2015年8月7日提交的标题为“INTEGRATED DEVICE FOR PROBING,DETECTING AND ANALYZING MOLECULES”的美国专利申请号14/821,688以及2014年11月17日提交的标题为“INTEGRATED DEVICE WITH EXTERNALLIGHT SOURCE FOR PROBING,DETECTING,AND ANALYZING MOLECULES”的美国专利申请号14/543,865中进行了描述,两者的全部内容均通过引用的方式并入本文。可以在测序装置中实施的合适的光栅耦合器和波导的实例在2017年12月15日提交的标题为“OPTICALCOUPLER AND WAVEGUIDE SYSTEM”的美国专利申请号15/844,403中进行了描述,其全部内容通过引用的方式并入本文。
另外的光激性结构可以定位在样品孔和光检测器之间,并且被设置为减少或防止激发光到达光检测器,否则这可能会导致检测发射光时的信号噪声。在一些实施方案中,可以充当测序装置的电路的金属层也可以充当空间滤光器。合适的光激性结构的实例可以包括光谱滤光器、偏振滤光器和空间滤光器,并且在2018年7月23日提交的标题为“OPTICALREJECTION PHOTONIC STRUCTURES”的美国专利申请号16/042,968中进行了描述,其全部内容通过引用的方式并入本文。
位于测序装置之外的部件可用于将激发源定位和对准到测序装置。这样的部件可以包括光学部件,包括透镜、镜子、棱镜、窗口、孔径、衰减器和/或光纤。仪器中可以包括另外的机械部件,以允许控制一个或多个对准部件。这样的机械部件可以包括致动器、步进电机和/或旋钮。合适的激发源和对准机构的实例在2016年5月20日提交的标题为“PULSEDLASER AND SYSTEM”的美国专利申请号15/161,088中进行了描述,其全部内容通过引用的方式并入本文。光束控制模块的另一个实例在2017年12月14日提交的标题为“COMPACTBEAM SHAPING AND STEERING ASSEMBLY”的美国专利申请号15/842,720中进行了描述,其通过引用的方式并入本文。合适的激发源的另外的实例在2015年8月7日提交的标题为“INTEGRATED DEVICE FOR PROBING,DETECTING AND ANALYZING MOLECULES”的美国专利申请号14/821,688中进行了描述,其全部内容通过引用的方式并入本文。
与测序装置的单个像素一起定位的光检测器可以被设置和定位以检测来自像素的相应样品孔的发射光。合适的光检测器的实例在2015年8月7日提交的标题为“INTEGRATED DEVICE FOR TEMPORAL BINNING OF RECEIVED PHOTONS”的美国专利申请号14/821,656中进行了描述,其全部内容通过引用的方式并入本文。在一些实施方案中,样品孔及其相应的光检测器可以沿着公共轴线对齐。以这种方式,光检测器可以与像素内的样本孔重叠。
检测到的发射光的特性可以提供用于鉴定与发射光相关的标志物的指示。这样的特性可以包括任何合适类型的特性,包括由光检测器检测到的光子的到达时间、由光检测器随时间累积的光子量和/或跨两个或更多个光检测器的光子分布。在一些实施方案中,光检测器可以具有允许检测与样品的发射光(例如,发光寿命)相关的一个或多个时序特性的构造。在激发光脉冲传播通过测序装置之后,光检测器可以检测光子到达时间的分布,并且到达时间的分布可以提供样品发射光的时序特性的指示(例如,发光寿命的代表)。在一些实施方案中,一个或多个光检测器提供由标志物发射的发射光的概率(例如,发光强度)的指示。在一些实施方案中,多个光检测器的尺寸和布置可被设置为捕获发射光的空间分布。来自一个或多个光检测器的输出信号然后可用于将标志物与多个标志物区分开来,其中多个标志物可用于鉴定样品内的样品。在一些实施方案中,样品可以被多种激发能量激发,并且样品响应于多种激发能量而发射的发射光和/或发射光的时序特性可以将标志物与多个标志物区分开来。
在操作中,样品孔内的样品的并行分析是通过使用激发光激发孔内的一些或所有样品并用光检测器检测来自样品发射的信号来进行的。来自样品的发射光可以由相应的光检测器检测并转换为至少一个电信号。电信号可以沿着测序装置的电路中的导线传输,所述导线可以连接到与测序装置接口的仪器。随后可以处理和/或分析电信号。电信号的处理或分析可以在位于仪器上或仪器外的合适的计算设备上进行。
所述仪器可以包括用于控制仪器和/或测序装置的操作的用户界面。用户界面可以被设置为允许用户将信息输入到仪器中,例如用于控制仪器功能的命令和/或设置。在一些实施方案中,用户界面可以包括用于语音命令的按钮、开关、拨号盘和麦克风。用户界面可以允许用户接收关于仪器和/或测序装置的性能的反馈,例如同轴度(properalignment)和/或通过来自测序装置上的光检测器读出信号获得的信息。在一些实施方案中,用户界面可以使用扬声器提供听觉反馈来提供反馈。在一些实施方案中,用户界面可以包括用于向用户提供视觉反馈的指示灯和/或显示屏。
在一些实施方案中,所述仪器可以包括被设置为与计算设备连接的计算机接口。计算机接口可以是USB接口、火线接口或任何其他合适的计算机接口。计算设备可以是任何通用计算机,例如膝上型计算机或台式计算机。在一些实施方案中,计算设备可以是经由合适的计算机接口在无线网络上可访问的服务器(例如,基于云的服务器)。计算机接口可以促进仪器和计算设备之间的信息通信。用于控制和/或配置仪器的输入信息可以被提供给计算设备并通过计算机接口传输给仪器。由仪器生成的输出信息可以通过计算机接口由计算设备接收。输出信息可以包括关于仪器性能、测序装置性能和/或从光检测器的读出信号产生的数据的反馈。
在一些实施方案中,所述仪器可以包括被设置为分析从测序装置的一个或多个光检测器接收的数据和/或将控制信号传输到激发源的处理装置。在一些实施方案中,处理装置可以包括通用处理器、专门适配的处理器(例如,中央处理单元(CPU),例如一个或多个微处理器或微控制器内核、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、定制集成电路、数字信号处理器(DSP)或其组合)。在一些实施方案中,来自一个或多个光检测器的数据的处理可以由仪器的处理装置和外部计算设备两者来执行。在其他实施方案中,可以省略外部计算设备,并且可以仅由测序装置的处理装置执行来自一个或多个光检测器的数据处理。
根据一些实施方案,被设置为基于发光发射特性来分析样品的仪器可以检测不同发光分子之间的发光寿命和/或强度的差异,和/或相同发光分子在不同环境中的寿命和/或强度之间的差异。发明人已经认识到并理解,发光发射寿命的差异可用于辨别不同发光分子的存在与否和/或辨别发光分子所经受的不同环境或条件。在一些情况下,根据寿命(例如,而不是发射波长)辨别发光分子可以简化系统的方面。作为实例,当基于寿命辨别发光分子时,波长区分光学器件(例如波长过滤器、每个波长的专用检测器、不同波长的专用脉冲光源和/或衍射光学器件)可以在数量上减少或被消除。在一些情况下,以单一特征波长操作的单一脉冲光源可用于激发在光谱的相同波长区域内发射但具有可测量的不同寿命的不同发光分子。使用单个脉冲光源而不是在不同波长下工作的多个光源来激发和辨别在相同波长范围内发射的不同发光分子的分析系统操作和维护的复杂度更低,更紧凑,并且可以以更低的成本制造。
尽管基于发光寿命分析的分析系统可能具有某些好处,但通过允许另外的检测技术可以增加由分析系统获得的信息量和/或检测精度。例如,系统的一些实施方案可以另外被设置成基于发光波长和/或发光强度来辨别样品的一种或多种特性。在一些实施方式中,发光强度可以另外地或替代地用于区分不同的发光标记。例如,一些发光标记可以以显著不同的强度发射或在它们的激发概率上有显著差异(例如,至少约35%的差异),即使它们的衰减率可能相似。通过将分箱信号参考测量的激发光,可以根据强度水平区分不同的发光标记。
根据一些实施方案,不同的发光寿命可以用被设置为在发光标记激发之后对发光发射事件进行时间分箱(time-bin)的光检测器来区分。时间分箱可以发生在光检测器的单个电荷累积周期期间。电荷累积周期是读出事件之间的间隔,在该期间光生载流子累积在时间分箱的光检测器的仓中。时间分箱的光检测器的实例在2015年8月7日提交的标题为“INTEGRATED DEVICE FOR TEMPORAL BINNING OF RECEIVED PHOTONS”的美国专利申请号14/821,656中进行了描述,其通过引用的方式并入本文。在一些实施方案中,时间分箱的光检测器可以在光子吸收/载流子产生区域中产生电荷载流子并且将电荷载流子直接转移到电荷载流子存储仓中的电荷载流子存储仓。在这样的实施方案中,时间分箱的光检测器可以不包括载流子行进/捕获区域。这样的时间分箱的光检测器可以被称为“直接分箱像素”。包括直接分箱像素的时间分箱的光检测器的实例在2017年12月22日提交的标题为“INTEGRATED PHOTODETECTOR WITH DIRECT BINNING PIXEL”的美国专利申请号15/852,571中进行了描述,其通过引用的方式并入本文。
在一些实施方案中,相同类型的不同数量的荧光团可以与样品中的不同试剂连接,从而可以基于发光强度来鉴定每种试剂。例如,两个荧光团可以连接到第一标记的亲和试剂,四个或更多个荧光团可以连接到第二标记的亲和试剂。由于不同数量的荧光团,可能存在与不同亲和试剂相关的不同激发和荧光团发射概率。例如,在信号累积间隔期间,第二标记的亲和试剂可能有更多的发射事件,因此仓的表观强度明显高于第一标记的亲和试剂。
发明人已经认识到并理解,基于荧光团衰减率和/或荧光团强度区分核苷酸或任何其他生物或化学样品可以简化光学激发和检测系统。例如,可以用单波长源(例如,产生一个特征波长而不是多个源的源或以多个不同特征波长操作的源)来执行光激发。此外,检测系统中可能不需要波长识别光学器件和滤光器。此外,每个样品孔可以使用单个光检测器来检测来自不同荧光团的发射。短语“特征波长”或“波长”用于指代有限辐射带宽内的中心或主要波长(例如,脉冲光源输出的20nm带宽内的中心或峰值波长)。在一些情况下,“特征波长”或“波长”可用于指代源辐射输出的总带宽内的峰值波长。
等同和范围
在权利要求书中,除非有相反的指示或从上下文中明显看出,否则诸如“一个/一种(a)”、“一个/一种(an)”和“该/所述(the)”之类的冠词可以表示一个或多于一个。除非有相反的指示或从上下文中明显看出,否则如果一个、多于一个或所有组成员存在于给定产品或方法中、在给定产品或方法中使用、或以其他方式与给定产品或方法相关,则认为在组的一个或多个成员之间包含“或”的权利要求或描述是令人满意的。本发明包括其中该组的一个成员恰好存在于给定产品或方法中、在给定产品或方法中使用、或以其他方式与给定产品或方法相关的实施方案。本发明包括其中多于一个或所有组成员存在于给定产品或方法中、在给定产品或方法中使用、或以其他方式与给定产品或方法相关的实施方案。
此外,本发明涵盖所有变化、组合和排列,其中将来自一个或多个所列权利要求的一个或多个限制、要素、条款和描述性术语引入另一权利要求。例如,可以修改从属于另一权利要求的任何权利要求,以包括在从属于相同基本权利要求的任何其他权利要求中发现的一个或多个限制。在要素作为列表,例如以马库什组格式呈现的情况下,要素的每个子组也被公开,并且可以从所述组中删除任何要素。应当理解,一般而言,在本发明或本发明的方面被称为包括特定要素和/或特征的情况下,本发明的某些实施方案或本发明的方面由或基本上由这样的要素和/或特征组成。为简单起见,这些实施方案并未在本文中具体阐述。
如本文在说明书和权利要求书中使用的短语“和/或”应理解为表示如此结合的要素中的“一个或两个”,即,在一些情况下要素结合存在而在其他情况下要素分离存在。用“和/或”列出的多个要素应该以相同的方式解释,即“一个或多个”这样结合的元素。除了由“和/或”子句具体标识的要素之外,可以任选地存在其他要素,无论与那些具体标识的要素相关或不相关。因此,作为非限制性实例,当与诸如“包含”之类的开放式语言结合使用时,对“A和/或B”的引用在一个实施方案中可以仅指A(任选地包括除B之外的要素);在另一个实施方案中,仅指B(任选地包括除A之外的要素);在又一个实施方案中,指A和B两者(任选地包括其他元素);等等。
如本文在说明书和权利要求书中使用的,“或”应理解为与如上定义的“和/或”具有相同的含义。例如,当分开列表中的项目时,“或”或“和/或”应被解释为是包含的,即包含至少一个,但也包含要素的数量或列表以及任选地其他未列出的项目中的多于一个。只有明确指出相反的术语,例如“仅一个”或“恰好一个”,或在权利要求中使用时,“由……组成”将指包含要素的数量或列表中的恰好一个要素。一般而言,当前面带有排他性术语,例如“任一”、“其中一个”、“只有一个”或“恰好一个”时,本文使用的术语“或”仅应解释为表示排他性的替代方案(即“一个或另一个但不是两者”)。当在权利要求中使用时,“基本上由……组成”应具有专利法领域所使用的一般含义。
如本文在说明书和权利要求书中使用的,短语“至少一个”在提及一个或多个要素的列表时,应理解为表示选自要素列表中的任何一个或多个要素的至少一个元素,但不一定包括要素列表中具体列出的每个要素中的至少一个,并且不排除要素列表中的任何要素组合。该定义还允许除了在短语“至少一个”所指的要素列表中具体标识的要素之外的元素可以任选地存在,无论是否与那些具体标识的要素相关或不相关。因此,作为非限制性实例,“A和B中的至少一个”(或等效地,“A或B中的至少一个”,或等效地“A和/或B中的至少一个”)可以,在一个实施方案中,指至少一个,任选地包括多于一个的A,不存在B(并且任选地包括除B之外的要素);在另一个实施方案中,指至少一个,任选地包括多于一个的B,不存在A(并且任选地包括除A之外的要素);在又一个实施方案中,指至少一个,任选地包括多于一个的A,和至少一个,任选地包括多于一个的B(并且任选地包括其它要素);等等。
还应该理解的是,除非有明确的相反指示,否则在本文要求保护的任何包括一个以上步骤或动作的方法中,该方法的步骤或动作的顺序不一定限于所记载的方法的步骤或动作的顺序。
在权利要求以及上述说明书中,所有过渡短语,例如“包含”、“包括”、“携带”、“具有”、“含有”、“涉及”、“持有”、“由……组成”,等应被理解为是开放式的,即意味着包括但不限于。如美国专利局专利审查程序手册第2111.03节所述,只有过渡短语“由……组成”和“基本上由……组成”应分别为封闭或半封闭式过渡短语。应当理解,在本文档中使用开放式过渡短语(例如,“包含”)描述的实施方案在替代实施方案中还被考虑为“由”开放式过渡短语描述的特征“组成”和“基本上由”开放式过渡短语描述的特征“组成”。例如,如果本申请描述了“包含A和B的组合物”,则该申请还考虑了替代实施方案“由A和B组成的组合物”和“基本上由A和B组成的组合物”。
在给出范围的地方,端点包括在内。此外,除非另有说明或从上下文和本领域普通技术人员的理解中以其他方式显而易见,否则表示为范围的值可以假定在本发明的不同实施方案中的所述范围内的任何特定值或子范围,以范围下限单位的十分之一,除非上下文另有明确规定。
本申请涉及各种已发布的专利、公开的专利申请、期刊文章和其他出版物,所有这些都通过引用的方式并入本文。如果任何并入的参考文献与本说明书之间存在冲突,则以本说明书为准。此外,落入现有技术的本发明的任何特定实施方案可以明确地排除在任何一项或多项权利要求之外。因为这样的实施方案被认为是本领域普通技术人员已知的,所以即使本文没有明确阐述排除,它们也可以被排除。出于任何原因,无论是否与现有技术的存在相关,本发明的任何特定实施方案都可以从任何权利要求中排除。
本领域技术人员将认识到或能够仅使用常规实验来确定本文描述的特定实施方案的许多等同物。本文描述的本实施方案的范围不旨在限于以上描述,而是如所附权利要求书中所述。本领域的普通技术人员将理解,在不背离本发明的精神或范围的情况下,可以对本说明书进行各种改变和修改,如所附权利要求书所定义的。
本文对变量的任何定义中记载的化学基团列表包括将该变量定义为任何单个基团或所列基团的组合。本文对变量的实施方案的记载包括作为任何单个实施方案或与任何其他实施方案或其部分组合的实施方案。本文对实施方案的记载包括作为任何单个实施方案或与任何其他实施方案或其部分组合的实施方案。
序列表
<110> 宽腾矽公司
<120> 单个多肽测序和重建方法
<130> R0708.70079WO00
<140> 尚未指定
<141> 与此同时
<150> US 62/940,968
<151> 2019-11-27
<150> US 62/927,005
<151> 2019-10-28
<160> 36
<170> PatentIn版本3.5
<210> 1
<211> 921
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 1
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Met Val Lys Gln Gly Val Phe Met Lys Thr Asp
20 25 30
Gln Ser Lys Val Lys Lys Leu Ser Asp Tyr Lys Ser Leu Asp Tyr Phe
35 40 45
Val Ile His Val Asp Leu Gln Ile Asp Leu Ser Lys Lys Pro Val Glu
50 55 60
Ser Lys Ala Arg Leu Thr Val Val Pro Asn Leu Asn Val Asp Ser His
65 70 75 80
Ser Asn Asp Leu Val Leu Asp Gly Glu Asn Met Thr Leu Val Ser Leu
85 90 95
Gln Met Asn Asp Asn Leu Leu Lys Glu Asn Glu Tyr Glu Leu Thr Lys
100 105 110
Asp Ser Leu Ile Ile Lys Asn Ile Pro Gln Asn Thr Pro Phe Thr Ile
115 120 125
Glu Met Thr Ser Leu Leu Gly Glu Asn Thr Asp Leu Phe Gly Leu Tyr
130 135 140
Glu Thr Glu Gly Val Ala Leu Val Lys Ala Glu Ser Glu Gly Leu Arg
145 150 155 160
Arg Val Phe Tyr Leu Pro Asp Arg Pro Asp Asn Leu Ala Thr Tyr Lys
165 170 175
Thr Thr Ile Ile Ala Asn Gln Glu Asp Tyr Pro Val Leu Leu Ser Asn
180 185 190
Gly Val Leu Ile Glu Lys Lys Glu Leu Pro Leu Gly Leu His Ser Val
195 200 205
Thr Trp Leu Asp Asp Val Pro Lys Pro Ser Tyr Leu Phe Ala Leu Val
210 215 220
Ala Gly Asn Leu Gln Arg Ser Val Thr Tyr Tyr Gln Thr Lys Ser Gly
225 230 235 240
Arg Glu Leu Pro Ile Glu Phe Tyr Val Pro Pro Ser Ala Thr Ser Lys
245 250 255
Cys Asp Phe Ala Lys Glu Val Leu Lys Glu Ala Met Ala Trp Asp Glu
260 265 270
Arg Thr Phe Asn Leu Glu Cys Ala Leu Arg Gln His Met Val Ala Gly
275 280 285
Val Asp Lys Tyr Ala Ser Gly Ala Ser Glu Pro Thr Gly Leu Asn Leu
290 295 300
Phe Asn Thr Glu Asn Leu Phe Ala Ser Pro Glu Thr Lys Thr Asp Leu
305 310 315 320
Gly Ile Leu Arg Val Leu Glu Val Val Ala His Glu Phe Phe His Tyr
325 330 335
Trp Ser Gly Asp Arg Val Thr Ile Arg Asp Trp Phe Asn Leu Pro Leu
340 345 350
Lys Glu Gly Leu Thr Thr Phe Arg Ala Ala Met Phe Arg Glu Glu Leu
355 360 365
Phe Gly Thr Asp Leu Ile Arg Leu Leu Asp Gly Lys Asn Leu Asp Glu
370 375 380
Arg Ala Pro Arg Gln Ser Ala Tyr Thr Ala Val Arg Ser Leu Tyr Thr
385 390 395 400
Ala Ala Ala Tyr Glu Lys Ser Ala Asp Ile Phe Arg Met Met Met Leu
405 410 415
Phe Ile Gly Lys Glu Pro Phe Ile Glu Ala Val Ala Lys Phe Phe Lys
420 425 430
Asp Asn Asp Gly Gly Ala Val Thr Leu Glu Asp Phe Ile Glu Ser Ile
435 440 445
Ser Asn Ser Ser Gly Lys Asp Leu Arg Ser Phe Leu Ser Trp Phe Thr
450 455 460
Glu Ser Gly Ile Pro Glu Leu Ile Val Thr Asp Glu Leu Asn Pro Asp
465 470 475 480
Thr Lys Gln Tyr Phe Leu Lys Ile Lys Thr Val Asn Gly Arg Asn Arg
485 490 495
Pro Ile Pro Ile Leu Met Gly Leu Leu Asp Ser Ser Gly Ala Glu Ile
500 505 510
Val Ala Asp Lys Leu Leu Ile Val Asp Gln Glu Glu Ile Glu Phe Gln
515 520 525
Phe Glu Asn Ile Gln Thr Arg Pro Ile Pro Ser Leu Leu Arg Ser Phe
530 535 540
Ser Ala Pro Val His Met Lys Tyr Glu Tyr Ser Tyr Gln Asp Leu Leu
545 550 555 560
Leu Leu Met Gln Phe Asp Thr Asn Leu Tyr Asn Arg Cys Glu Ala Ala
565 570 575
Lys Gln Leu Ile Ser Ala Leu Ile Asn Asp Phe Cys Ile Gly Lys Lys
580 585 590
Ile Glu Leu Ser Pro Gln Phe Phe Ala Val Tyr Lys Ala Leu Leu Ser
595 600 605
Asp Asn Ser Leu Asn Glu Trp Met Leu Ala Glu Leu Ile Thr Leu Pro
610 615 620
Ser Leu Glu Glu Leu Ile Glu Asn Gln Asp Lys Pro Asp Phe Glu Lys
625 630 635 640
Leu Asn Glu Gly Arg Gln Leu Ile Gln Asn Ala Leu Ala Asn Glu Leu
645 650 655
Lys Thr Asp Phe Tyr Asn Leu Leu Phe Arg Ile Gln Ile Ser Gly Asp
660 665 670
Asp Asp Lys Gln Lys Leu Lys Gly Phe Asp Leu Lys Gln Ala Gly Leu
675 680 685
Arg Arg Leu Lys Ser Val Cys Phe Ser Tyr Leu Leu Asn Val Asp Phe
690 695 700
Glu Lys Thr Lys Glu Lys Leu Ile Leu Gln Phe Glu Asp Ala Leu Gly
705 710 715 720
Lys Asn Met Thr Glu Thr Ala Leu Ala Leu Ser Met Leu Cys Glu Ile
725 730 735
Asn Cys Glu Glu Ala Asp Val Ala Leu Glu Asp Tyr Tyr His Tyr Trp
740 745 750
Lys Asn Asp Pro Gly Ala Val Asn Asn Trp Phe Ser Ile Gln Ala Leu
755 760 765
Ala His Ser Pro Asp Val Ile Glu Arg Val Lys Lys Leu Met Arg His
770 775 780
Gly Asp Phe Asp Leu Ser Asn Pro Asn Lys Val Tyr Ala Leu Leu Gly
785 790 795 800
Ser Phe Ile Lys Asn Pro Phe Gly Phe His Ser Val Thr Gly Glu Gly
805 810 815
Tyr Gln Leu Val Ala Asp Ala Ile Phe Asp Leu Asp Lys Ile Asn Pro
820 825 830
Thr Leu Ala Ala Asn Leu Thr Glu Lys Phe Thr Tyr Trp Asp Lys Tyr
835 840 845
Asp Val Asn Arg Gln Ala Met Met Ile Ser Thr Leu Lys Ile Ile Tyr
850 855 860
Ser Asn Ala Thr Ser Ser Asp Val Arg Thr Met Ala Lys Lys Gly Leu
865 870 875 880
Asp Lys Val Lys Glu Asp Leu Pro Leu Pro Ile His Leu Thr Phe His
885 890 895
Gly Gly Ser Thr Met Gln Asp Arg Thr Ala Gln Leu Ile Ala Asp Gly
900 905 910
Asn Lys Glu Asn Ala Tyr Gln Leu His
915 920
<210> 2
<211> 273
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 2
Met Ala His His His His His His Met Gly Thr Ala Ile Ser Ile Lys
1 5 10 15
Thr Pro Glu Asp Ile Glu Lys Met Arg Val Ala Gly Arg Leu Ala Ala
20 25 30
Glu Val Leu Glu Met Ile Glu Pro Tyr Val Lys Pro Gly Val Ser Thr
35 40 45
Gly Glu Leu Asp Arg Ile Cys Asn Asp Tyr Ile Val Asn Glu Gln His
50 55 60
Ala Val Ser Ala Cys Leu Gly Tyr His Gly Tyr Pro Lys Ser Val Cys
65 70 75 80
Ile Ser Ile Asn Glu Val Val Cys His Gly Ile Pro Asp Asp Ala Lys
85 90 95
Leu Leu Lys Asp Gly Asp Ile Val Asn Ile Asp Val Thr Val Ile Lys
100 105 110
Asp Gly Phe His Gly Asp Thr Ser Lys Met Phe Ile Val Gly Lys Pro
115 120 125
Thr Ile Met Gly Glu Arg Leu Cys Arg Ile Thr Gln Glu Ser Leu Tyr
130 135 140
Leu Ala Leu Arg Met Val Lys Pro Gly Ile Asn Leu Arg Glu Ile Gly
145 150 155 160
Ala Ala Ile Gln Lys Phe Val Glu Ala Glu Gly Phe Ser Val Val Arg
165 170 175
Glu Tyr Cys Gly His Gly Ile Gly Arg Gly Phe His Glu Glu Pro Gln
180 185 190
Val Leu His Tyr Asp Ser Arg Glu Thr Asn Val Val Leu Lys Pro Gly
195 200 205
Met Thr Phe Thr Ile Glu Pro Met Val Asn Ala Gly Lys Lys Glu Ile
210 215 220
Arg Thr Met Lys Asp Gly Trp Thr Val Lys Thr Lys Asp Arg Ser Leu
225 230 235 240
Ser Ala Gln Tyr Glu His Thr Ile Val Val Thr Asp Asn Gly Cys Glu
245 250 255
Ile Leu Thr Leu Arg Lys Asp Asp Thr Ile Pro Ala Ile Ile Ser His
260 265 270
Asp
<210> 3
<211> 330
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 3
Met Ala His His His His His His Met Gly Thr Leu Glu Ala Asn Thr
1 5 10 15
Asn Gly Pro Gly Ser Met Leu Ser Arg Met Pro Val Ser Ser Arg Thr
20 25 30
Val Pro Phe Gly Asp His Glu Thr Trp Val Gln Val Thr Thr Pro Glu
35 40 45
Asn Ala Gln Pro His Ala Leu Pro Leu Ile Val Leu His Gly Gly Pro
50 55 60
Gly Met Ala His Asn Tyr Val Ala Asn Ile Ala Ala Leu Ala Asp Glu
65 70 75 80
Thr Gly Arg Thr Val Ile His Tyr Asp Gln Val Gly Cys Gly Asn Ser
85 90 95
Thr His Leu Pro Asp Ala Pro Ala Asp Phe Trp Thr Pro Gln Leu Phe
100 105 110
Val Asp Glu Phe His Ala Val Cys Thr Ala Leu Gly Ile Glu Arg Tyr
115 120 125
His Val Leu Gly Gln Ser Trp Gly Gly Met Leu Gly Ala Glu Ile Ala
130 135 140
Val Arg Gln Pro Ser Gly Leu Val Ser Leu Ala Ile Cys Asn Ser Pro
145 150 155 160
Ala Ser Met Arg Leu Trp Ser Glu Ala Ala Gly Asp Leu Arg Ala Gln
165 170 175
Leu Pro Ala Glu Thr Arg Ala Ala Leu Asp Arg His Glu Ala Ala Gly
180 185 190
Thr Ile Thr His Pro Asp Tyr Leu Gln Ala Ala Ala Glu Phe Tyr Arg
195 200 205
Arg His Val Cys Arg Val Val Pro Thr Pro Gln Asp Phe Ala Asp Ser
210 215 220
Val Ala Gln Met Glu Ala Glu Pro Thr Val Tyr His Thr Met Asn Gly
225 230 235 240
Pro Asn Glu Phe His Val Val Gly Thr Leu Gly Asp Trp Ser Val Ile
245 250 255
Asp Arg Leu Pro Asp Val Thr Ala Pro Val Leu Val Ile Ala Gly Glu
260 265 270
His Asp Glu Ala Thr Pro Lys Thr Trp Gln Pro Phe Val Asp His Ile
275 280 285
Pro Asp Val Arg Ser His Val Phe Pro Gly Thr Ser His Cys Thr His
290 295 300
Leu Glu Lys Pro Glu Glu Phe Arg Ala Val Val Ala Gln Phe Leu His
305 310 315 320
Gln His Asp Leu Ala Ala Asp Ala Arg Val
325 330
<210> 4
<211> 452
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 4
Met Thr Gln Gln Glu Tyr Gln Asn Arg Arg Gln Ala Leu Leu Ala Lys
1 5 10 15
Met Ala Pro Gly Ser Ala Ala Ile Ile Phe Ala Ala Pro Glu Ala Thr
20 25 30
Arg Ser Ala Asp Ser Glu Tyr Pro Tyr Arg Gln Asn Ser Asp Phe Ser
35 40 45
Tyr Leu Thr Gly Phe Asn Glu Pro Glu Ala Val Leu Ile Leu Val Lys
50 55 60
Ser Asp Glu Thr His Asn His Ser Val Leu Phe Asn Arg Ile Arg Asp
65 70 75 80
Leu Thr Ala Glu Ile Trp Phe Gly Arg Arg Leu Gly Gln Glu Ala Ala
85 90 95
Pro Thr Lys Leu Ala Val Asp Arg Ala Leu Pro Phe Asp Glu Ile Asn
100 105 110
Glu Gln Leu Tyr Leu Leu Leu Asn Arg Leu Asp Val Ile Tyr His Ala
115 120 125
Gln Gly Gln Tyr Ala Tyr Ala Asp Asn Ile Val Phe Ala Ala Leu Glu
130 135 140
Lys Leu Arg His Gly Phe Arg Lys Asn Leu Arg Ala Pro Ala Thr Leu
145 150 155 160
Thr Asp Trp Arg Pro Trp Leu His Glu Met Arg Leu Phe Lys Ser Ala
165 170 175
Glu Glu Ile Ala Val Leu Arg Arg Ala Gly Glu Ile Ser Ala Leu Ala
180 185 190
His Thr Arg Ala Met Glu Lys Cys Arg Pro Gly Met Phe Glu Tyr Gln
195 200 205
Leu Glu Gly Glu Ile Leu His Glu Phe Thr Arg His Gly Ala Arg Tyr
210 215 220
Pro Ala Tyr Asn Thr Ile Val Gly Gly Gly Glu Asn Gly Cys Ile Leu
225 230 235 240
His Tyr Thr Glu Asn Glu Cys Glu Leu Arg Asp Gly Asp Leu Val Leu
245 250 255
Ile Asp Ala Gly Cys Glu Tyr Arg Gly Tyr Ala Gly Asp Ile Thr Arg
260 265 270
Thr Phe Pro Val Asn Gly Lys Phe Thr Pro Ala Gln Arg Ala Val Tyr
275 280 285
Asp Ile Val Leu Ala Ala Ile Asn Lys Ser Leu Thr Leu Phe Arg Pro
290 295 300
Gly Thr Ser Ile Arg Glu Val Thr Glu Glu Val Val Arg Ile Met Val
305 310 315 320
Val Gly Leu Val Glu Leu Gly Ile Leu Lys Gly Asp Ile Glu Gln Leu
325 330 335
Ile Ala Glu Gln Ala His Arg Pro Phe Phe Met His Gly Leu Ser His
340 345 350
Trp Leu Gly Met Asp Val His Asp Val Gly Asp Tyr Gly Ser Ser Asp
355 360 365
Arg Gly Arg Ile Leu Glu Pro Gly Met Val Leu Thr Val Glu Pro Gly
370 375 380
Leu Tyr Ile Ala Pro Asp Ala Asp Val Pro Pro Gln Tyr Arg Gly Ile
385 390 395 400
Gly Ile Arg Ile Glu Asp Asp Ile Val Ile Thr Ala Thr Gly Asn Glu
405 410 415
Asn Leu Thr Ala Ser Val Val Lys Asp Pro Asp Asp Ile Glu Ala Leu
420 425 430
Met Ala Leu Asn His Ala Gly Glu Asn Leu Tyr Phe Gln Glu His His
435 440 445
His His His His
450
<210> 5
<211> 303
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 5
Met Asp Thr Glu Lys Leu Met Lys Ala Gly Glu Ile Ala Lys Lys Val
1 5 10 15
Arg Glu Lys Ala Ile Lys Leu Ala Arg Pro Gly Met Leu Leu Leu Glu
20 25 30
Leu Ala Glu Ser Ile Glu Lys Met Ile Met Glu Leu Gly Gly Lys Pro
35 40 45
Ala Phe Pro Val Asn Leu Ser Ile Asn Glu Ile Ala Ala His Tyr Thr
50 55 60
Pro Tyr Lys Gly Asp Thr Thr Val Leu Lys Glu Gly Asp Tyr Leu Lys
65 70 75 80
Ile Asp Val Gly Val His Ile Asp Gly Phe Ile Ala Asp Thr Ala Val
85 90 95
Thr Val Arg Val Gly Met Glu Glu Asp Glu Leu Met Glu Ala Ala Lys
100 105 110
Glu Ala Leu Asn Ala Ala Ile Ser Val Ala Arg Ala Gly Val Glu Ile
115 120 125
Lys Glu Leu Gly Lys Ala Ile Glu Asn Glu Ile Arg Lys Arg Gly Phe
130 135 140
Lys Pro Ile Val Asn Leu Ser Gly His Lys Ile Glu Arg Tyr Lys Leu
145 150 155 160
His Ala Gly Ile Ser Ile Pro Asn Ile Tyr Arg Pro His Asp Asn Tyr
165 170 175
Val Leu Lys Glu Gly Asp Val Phe Ala Ile Glu Pro Phe Ala Thr Ile
180 185 190
Gly Ala Gly Gln Val Ile Glu Val Pro Pro Thr Leu Ile Tyr Met Tyr
195 200 205
Val Arg Asp Val Pro Val Arg Val Ala Gln Ala Arg Phe Leu Leu Ala
210 215 220
Lys Ile Lys Arg Glu Tyr Gly Thr Leu Pro Phe Ala Tyr Arg Trp Leu
225 230 235 240
Gln Asn Asp Met Pro Glu Gly Gln Leu Lys Leu Ala Leu Lys Thr Leu
245 250 255
Glu Lys Ala Gly Ala Ile Tyr Gly Tyr Pro Val Leu Lys Glu Ile Arg
260 265 270
Asn Gly Ile Val Ala Gln Phe Glu His Thr Ile Ile Val Glu Lys Asp
275 280 285
Ser Val Ile Val Thr Gln Asp Met Ile Asn Lys Ser Thr Leu Glu
290 295 300
<210> 6
<211> 428
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 6
His Met Ser Ser Pro Leu His Tyr Val Leu Asp Gly Ile His Cys Glu
1 5 10 15
Pro His Phe Phe Thr Val Pro Leu Asp His Gln Gln Pro Asp Asp Glu
20 25 30
Glu Thr Ile Thr Leu Phe Gly Arg Thr Leu Cys Arg Lys Asp Arg Leu
35 40 45
Asp Asp Glu Leu Pro Trp Leu Leu Tyr Leu Gln Gly Gly Pro Gly Phe
50 55 60
Gly Ala Pro Arg Pro Ser Ala Asn Gly Gly Trp Ile Lys Arg Ala Leu
65 70 75 80
Gln Glu Phe Arg Val Leu Leu Leu Asp Gln Arg Gly Thr Gly His Ser
85 90 95
Thr Pro Ile His Ala Glu Leu Leu Ala His Leu Asn Pro Arg Gln Gln
100 105 110
Ala Asp Tyr Leu Ser His Phe Arg Ala Asp Ser Ile Val Arg Asp Ala
115 120 125
Glu Leu Ile Arg Glu Gln Leu Ser Pro Asp His Pro Trp Ser Leu Leu
130 135 140
Gly Gln Ser Phe Gly Gly Phe Cys Ser Leu Thr Tyr Leu Ser Leu Phe
145 150 155 160
Pro Asp Ser Leu His Glu Val Tyr Leu Thr Gly Gly Val Ala Pro Ile
165 170 175
Gly Arg Ser Ala Asp Glu Val Tyr Arg Ala Thr Tyr Gln Arg Val Ala
180 185 190
Asp Lys Asn Arg Ala Phe Phe Ala Arg Phe Pro His Ala Gln Ala Ile
195 200 205
Ala Asn Arg Leu Ala Thr His Leu Gln Arg His Asp Val Arg Leu Pro
210 215 220
Asn Gly Gln Arg Leu Thr Val Glu Gln Leu Gln Gln Gln Gly Leu Asp
225 230 235 240
Leu Gly Ala Ser Gly Ala Phe Glu Glu Leu Tyr Tyr Leu Leu Glu Asp
245 250 255
Ala Phe Ile Gly Glu Lys Leu Asn Pro Ala Phe Leu Tyr Gln Val Gln
260 265 270
Ala Met Gln Pro Phe Asn Thr Asn Pro Val Phe Ala Ile Leu His Glu
275 280 285
Leu Ile Tyr Cys Glu Gly Ala Ala Ser His Trp Ala Ala Glu Arg Val
290 295 300
Arg Gly Glu Phe Pro Ala Leu Ala Trp Ala Gln Gly Lys Asp Phe Ala
305 310 315 320
Phe Thr Gly Glu Met Ile Phe Pro Trp Met Phe Glu Gln Phe Arg Glu
325 330 335
Leu Ile Pro Leu Lys Glu Ala Ala His Leu Leu Ala Glu Lys Ala Asp
340 345 350
Trp Gly Pro Leu Tyr Asp Pro Val Gln Leu Ala Arg Asn Lys Val Pro
355 360 365
Val Ala Cys Ala Val Tyr Ala Glu Asp Met Tyr Val Glu Phe Asp Tyr
370 375 380
Ser Arg Glu Thr Leu Lys Gly Leu Ser Asn Ser Arg Ala Trp Ile Thr
385 390 395 400
Asn Glu Tyr Glu His Asn Gly Leu Arg Val Asp Gly Glu Gln Ile Leu
405 410 415
Asp Arg Leu Ile Arg Leu Asn Arg Asp Cys Leu Glu
420 425
<210> 7
<211> 348
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 7
Met Lys Glu Arg Leu Glu Lys Leu Val Lys Phe Met Asp Glu Asn Ser
1 5 10 15
Ile Asp Arg Val Phe Ile Ala Lys Pro Val Asn Val Tyr Tyr Phe Ser
20 25 30
Gly Thr Ser Pro Leu Gly Gly Gly Tyr Ile Ile Val Asp Gly Asp Glu
35 40 45
Ala Thr Leu Tyr Val Pro Glu Leu Glu Tyr Glu Met Ala Lys Glu Glu
50 55 60
Ser Lys Leu Pro Val Val Lys Phe Lys Lys Phe Asp Glu Ile Tyr Glu
65 70 75 80
Ile Leu Lys Asn Thr Glu Thr Leu Gly Ile Glu Gly Thr Leu Ser Tyr
85 90 95
Ser Met Val Glu Asn Phe Lys Glu Lys Ser Asn Val Lys Glu Phe Lys
100 105 110
Lys Ile Asp Asp Val Ile Lys Asp Leu Arg Ile Ile Lys Thr Lys Glu
115 120 125
Glu Ile Glu Ile Ile Glu Lys Ala Cys Glu Ile Ala Asp Lys Ala Val
130 135 140
Met Ala Ala Ile Glu Glu Ile Thr Glu Gly Lys Arg Glu Arg Glu Val
145 150 155 160
Ala Ala Lys Val Glu Tyr Leu Met Lys Met Asn Gly Ala Glu Lys Pro
165 170 175
Ala Phe Asp Thr Ile Ile Ala Ser Gly His Arg Ser Ala Leu Pro His
180 185 190
Gly Val Ala Ser Asp Lys Arg Ile Glu Arg Gly Asp Leu Val Val Ile
195 200 205
Asp Leu Gly Ala Leu Tyr Asn His Tyr Asn Ser Asp Ile Thr Arg Thr
210 215 220
Ile Val Val Gly Ser Pro Asn Glu Lys Gln Arg Glu Ile Tyr Glu Ile
225 230 235 240
Val Leu Glu Ala Gln Lys Arg Ala Val Glu Ala Ala Lys Pro Gly Met
245 250 255
Thr Ala Lys Glu Leu Asp Ser Ile Ala Arg Glu Ile Ile Lys Glu Tyr
260 265 270
Gly Tyr Gly Asp Tyr Phe Ile His Ser Leu Gly His Gly Val Gly Leu
275 280 285
Glu Ile His Glu Trp Pro Arg Ile Ser Gln Tyr Asp Glu Thr Val Leu
290 295 300
Lys Glu Gly Met Val Ile Thr Ile Glu Pro Gly Ile Tyr Ile Pro Lys
305 310 315 320
Leu Gly Gly Val Arg Ile Glu Asp Thr Val Leu Ile Thr Glu Asn Gly
325 330 335
Ala Lys Arg Leu Thr Lys Thr Glu Arg Glu Leu Leu
340 345
<210> 8
<211> 298
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 8
Met Ile Pro Ile Thr Thr Pro Val Gly Asn Phe Lys Val Trp Thr Lys
1 5 10 15
Arg Phe Gly Thr Asn Pro Lys Ile Lys Val Leu Leu Leu His Gly Gly
20 25 30
Pro Ala Met Thr His Glu Tyr Met Glu Cys Phe Glu Thr Phe Phe Gln
35 40 45
Arg Glu Gly Phe Glu Phe Tyr Glu Tyr Asp Gln Leu Gly Ser Tyr Tyr
50 55 60
Ser Asp Gln Pro Thr Asp Glu Lys Leu Trp Asn Ile Asp Arg Phe Val
65 70 75 80
Asp Glu Val Glu Gln Val Arg Lys Ala Ile His Ala Asp Lys Glu Asn
85 90 95
Phe Tyr Val Leu Gly Asn Ser Trp Gly Gly Ile Leu Ala Met Glu Tyr
100 105 110
Ala Leu Lys Tyr Gln Gln Asn Leu Lys Gly Leu Ile Val Ala Asn Met
115 120 125
Met Ala Ser Ala Pro Glu Tyr Val Lys Tyr Ala Glu Val Leu Ser Lys
130 135 140
Gln Met Lys Pro Glu Val Leu Ala Glu Val Arg Ala Ile Glu Ala Lys
145 150 155 160
Lys Asp Tyr Ala Asn Pro Arg Tyr Thr Glu Leu Leu Phe Pro Asn Tyr
165 170 175
Tyr Ala Gln His Ile Cys Arg Leu Lys Glu Trp Pro Asp Ala Leu Asn
180 185 190
Arg Ser Leu Lys His Val Asn Ser Thr Val Tyr Thr Leu Met Gln Gly
195 200 205
Pro Ser Glu Leu Gly Met Ser Ser Asp Ala Arg Leu Ala Lys Trp Asp
210 215 220
Ile Lys Asn Arg Leu His Glu Ile Ala Thr Pro Thr Leu Met Ile Gly
225 230 235 240
Ala Arg Tyr Asp Thr Met Asp Pro Lys Ala Met Glu Glu Gln Ser Lys
245 250 255
Leu Val Gln Lys Gly Arg Tyr Leu Tyr Cys Pro Asn Gly Ser His Leu
260 265 270
Ala Met Trp Asp Asp Gln Lys Val Phe Met Asp Gly Val Ile Lys Phe
275 280 285
Ile Lys Asp Val Asp Thr Lys Ser Phe Asn
290 295
<210> 9
<211> 428
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 9
His Met Ser Ser Pro Leu His Tyr Val Leu Asp Gly Ile His Cys Glu
1 5 10 15
Pro His Phe Phe Thr Val Pro Leu Asp His Gln Gln Pro Asp Asp Glu
20 25 30
Glu Thr Ile Thr Leu Phe Gly Arg Thr Leu Cys Arg Lys Asp Arg Leu
35 40 45
Asp Asp Glu Leu Pro Trp Leu Leu Tyr Leu Gln Gly Gly Pro Gly Phe
50 55 60
Gly Ala Pro Arg Pro Ser Ala Asn Gly Gly Trp Ile Lys Arg Ala Leu
65 70 75 80
Gln Glu Phe Arg Val Leu Leu Leu Asp Gln Arg Gly Thr Gly His Ser
85 90 95
Thr Pro Ile His Ala Glu Leu Leu Ala His Leu Asn Pro Arg Gln Gln
100 105 110
Ala Asp Tyr Leu Ser His Phe Arg Ala Asp Ser Ile Val Arg Asp Ala
115 120 125
Glu Leu Ile Arg Glu Gln Leu Ser Pro Asp His Pro Trp Ser Leu Leu
130 135 140
Gly Gln Ser Phe Gly Gly Phe Cys Ser Leu Thr Tyr Leu Ser Leu Phe
145 150 155 160
Pro Asp Ser Leu His Glu Val Tyr Leu Thr Gly Gly Val Ala Pro Ile
165 170 175
Gly Arg Ser Ala Asp Glu Val Tyr Arg Ala Thr Tyr Gln Arg Val Ala
180 185 190
Asp Lys Asn Arg Ala Phe Phe Ala Arg Phe Pro His Ala Gln Ala Ile
195 200 205
Ala Asn Arg Leu Ala Thr His Leu Gln Arg His Asp Val Arg Leu Pro
210 215 220
Asn Gly Gln Arg Leu Thr Val Glu Gln Leu Gln Gln Gln Gly Leu Asp
225 230 235 240
Leu Gly Ala Ser Gly Ala Phe Glu Glu Leu Tyr Tyr Leu Leu Glu Asp
245 250 255
Ala Phe Ile Gly Glu Lys Leu Asn Pro Ala Phe Leu Tyr Gln Val Gln
260 265 270
Ala Met Gln Pro Phe Asn Thr Asn Pro Val Phe Ala Ile Leu His Glu
275 280 285
Leu Ile Tyr Cys Glu Gly Ala Ala Ser His Trp Ala Ala Glu Arg Val
290 295 300
Arg Gly Glu Phe Pro Ala Leu Ala Trp Ala Gln Gly Lys Asp Phe Ala
305 310 315 320
Phe Thr Gly Glu Met Ile Phe Pro Trp Met Phe Glu Gln Phe Arg Glu
325 330 335
Leu Ile Pro Leu Lys Glu Ala Ala His Leu Leu Ala Glu Lys Ala Asp
340 345 350
Trp Gly Pro Leu Tyr Asp Pro Val Gln Leu Ala Arg Asn Lys Val Pro
355 360 365
Val Ala Cys Ala Val Tyr Ala Glu Asp Met Tyr Val Glu Phe Asp Tyr
370 375 380
Ser Arg Glu Thr Leu Lys Gly Leu Ser Asn Ser Arg Ala Trp Ile Thr
385 390 395 400
Asn Glu Tyr Glu His Asn Gly Leu Arg Val Asp Gly Glu Gln Ile Leu
405 410 415
Asp Arg Leu Ile Arg Leu Asn Arg Asp Cys Leu Glu
420 425
<210> 10
<211> 310
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 10
Met Tyr Glu Ile Lys Gln Pro Phe His Ser Gly Tyr Leu Gln Val Ser
1 5 10 15
Glu Ile His Gln Ile Tyr Trp Glu Glu Ser Gly Asn Pro Asp Gly Val
20 25 30
Pro Val Ile Phe Leu His Gly Gly Pro Gly Ala Gly Ala Ser Pro Glu
35 40 45
Cys Arg Gly Phe Phe Asn Pro Asp Val Phe Arg Ile Val Ile Ile Asp
50 55 60
Gln Arg Gly Cys Gly Arg Ser His Pro Tyr Ala Cys Ala Glu Asp Asn
65 70 75 80
Thr Thr Trp Asp Leu Val Ala Asp Ile Glu Lys Val Arg Glu Met Leu
85 90 95
Gly Ile Gly Lys Trp Leu Val Phe Gly Gly Ser Trp Gly Ser Thr Leu
100 105 110
Ser Leu Ala Tyr Ala Gln Thr His Pro Glu Arg Val Lys Gly Leu Val
115 120 125
Leu Arg Gly Ile Phe Leu Cys Arg Pro Ser Glu Thr Ala Trp Leu Asn
130 135 140
Glu Ala Gly Gly Val Ser Arg Ile Tyr Pro Glu Gln Trp Gln Lys Phe
145 150 155 160
Val Ala Pro Ile Ala Glu Asn Arg Arg Asn Arg Leu Ile Glu Ala Tyr
165 170 175
His Gly Leu Leu Phe His Gln Asp Glu Glu Val Cys Leu Ser Ala Ala
180 185 190
Lys Ala Trp Ala Asp Trp Glu Ser Tyr Leu Ile Arg Phe Glu Pro Glu
195 200 205
Gly Val Asp Glu Asp Ala Tyr Ala Ser Leu Ala Ile Ala Arg Leu Glu
210 215 220
Asn His Tyr Phe Val Asn Gly Gly Trp Leu Gln Gly Asp Lys Ala Ile
225 230 235 240
Leu Asn Asn Ile Gly Lys Ile Arg His Ile Pro Thr Val Ile Val Gln
245 250 255
Gly Arg Tyr Asp Leu Cys Thr Pro Met Gln Ser Ala Trp Glu Leu Ser
260 265 270
Lys Ala Phe Pro Glu Ala Glu Leu Arg Val Val Gln Ala Gly His Cys
275 280 285
Ala Phe Asp Pro Pro Leu Ala Asp Ala Leu Val Gln Ala Val Glu Asp
290 295 300
Ile Leu Pro Arg Leu Leu
305 310
<210> 11
<211> 891
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 11
Met Gly Ser Ser His His His His His His Ser Ser Gly Glu Asn Leu
1 5 10 15
Tyr Phe Gln Gly His Met Thr Gln Gln Pro Gln Ala Lys Tyr Arg His
20 25 30
Asp Tyr Arg Ala Pro Asp Tyr Gln Ile Thr Asp Ile Asp Leu Thr Phe
35 40 45
Asp Leu Asp Ala Gln Lys Thr Val Val Thr Ala Val Ser Gln Ala Val
50 55 60
Arg His Gly Ala Ser Asp Ala Pro Leu Arg Leu Asn Gly Glu Asp Leu
65 70 75 80
Lys Leu Val Ser Val His Ile Asn Asp Glu Pro Trp Thr Ala Trp Lys
85 90 95
Glu Glu Glu Gly Ala Leu Val Ile Ser Asn Leu Pro Glu Arg Phe Thr
100 105 110
Leu Lys Ile Ile Asn Glu Ile Ser Pro Ala Ala Asn Thr Ala Leu Glu
115 120 125
Gly Leu Tyr Gln Ser Gly Asp Ala Leu Cys Thr Gln Cys Glu Ala Glu
130 135 140
Gly Phe Arg His Ile Thr Tyr Tyr Leu Asp Arg Pro Asp Val Leu Ala
145 150 155 160
Arg Phe Thr Thr Lys Ile Ile Ala Asp Lys Ile Lys Tyr Pro Phe Leu
165 170 175
Leu Ser Asn Gly Asn Arg Val Ala Gln Gly Glu Leu Glu Asn Gly Arg
180 185 190
His Trp Val Gln Trp Gln Asp Pro Phe Pro Lys Pro Cys Tyr Leu Phe
195 200 205
Ala Leu Val Ala Gly Asp Phe Asp Val Leu Arg Asp Thr Phe Thr Thr
210 215 220
Arg Ser Gly Arg Glu Val Ala Leu Glu Leu Tyr Val Asp Arg Gly Asn
225 230 235 240
Leu Asp Arg Ala Pro Trp Ala Met Thr Ser Leu Lys Asn Ser Met Lys
245 250 255
Trp Asp Glu Glu Arg Phe Gly Leu Glu Tyr Asp Leu Asp Ile Tyr Met
260 265 270
Ile Val Ala Val Asp Phe Phe Asn Met Gly Ala Met Glu Asn Lys Gly
275 280 285
Leu Asn Ile Phe Asn Ser Lys Tyr Val Leu Ala Arg Thr Asp Thr Ala
290 295 300
Thr Asp Lys Asp Tyr Leu Asp Ile Glu Arg Val Ile Gly His Glu Tyr
305 310 315 320
Phe His Asn Trp Thr Gly Asn Arg Val Thr Cys Arg Asp Trp Phe Gln
325 330 335
Leu Ser Leu Lys Glu Gly Leu Thr Val Phe Arg Asp Gln Glu Phe Ser
340 345 350
Ser Asp Leu Gly Ser Arg Ala Val Asn Arg Ile Asn Asn Val Arg Thr
355 360 365
Met Arg Gly Leu Gln Phe Ala Glu Asp Ala Ser Pro Met Ala His Pro
370 375 380
Ile Arg Pro Asp Met Val Ile Glu Met Asn Asn Phe Tyr Thr Leu Thr
385 390 395 400
Val Tyr Glu Lys Gly Ala Glu Val Ile Arg Met Ile His Thr Leu Leu
405 410 415
Gly Glu Glu Asn Phe Gln Lys Gly Met Gln Leu Tyr Phe Glu Arg His
420 425 430
Asp Gly Ser Ala Ala Thr Cys Asp Asp Phe Val Gln Ala Met Glu Asp
435 440 445
Ala Ser Asn Val Asp Leu Ser His Phe Arg Arg Trp Tyr Ser Gln Ser
450 455 460
Gly Thr Pro Ile Val Thr Val Lys Asp Asp Tyr Asn Pro Glu Thr Glu
465 470 475 480
Gln Tyr Thr Leu Thr Ile Ser Gln Arg Thr Pro Ala Thr Pro Asp Gln
485 490 495
Ala Glu Lys Gln Pro Leu His Ile Pro Phe Ala Ile Glu Leu Tyr Asp
500 505 510
Asn Glu Gly Lys Val Ile Pro Leu Gln Lys Gly Gly His Pro Val Asn
515 520 525
Ser Val Leu Asn Val Thr Gln Ala Glu Gln Thr Phe Val Phe Asp Asn
530 535 540
Val Tyr Phe Gln Pro Val Pro Ala Leu Leu Cys Glu Phe Ser Ala Pro
545 550 555 560
Val Lys Leu Glu Tyr Lys Trp Ser Asp Gln Gln Leu Thr Phe Leu Met
565 570 575
Arg His Ala Arg Asn Asp Phe Ser Arg Trp Asp Ala Ala Gln Ser Leu
580 585 590
Leu Ala Thr Tyr Ile Lys Leu Asn Val Ala Arg His Gln Gln Gly Gln
595 600 605
Pro Leu Ser Leu Pro Val His Val Ala Asp Ala Phe Arg Ala Val Leu
610 615 620
Leu Asp Glu Lys Ile Asp Pro Ala Leu Ala Ala Glu Ile Leu Thr Leu
625 630 635 640
Pro Ser Val Asn Glu Met Ala Glu Leu Phe Asp Ile Ile Asp Pro Ile
645 650 655
Ala Ile Ala Glu Val Arg Glu Ala Leu Thr Arg Thr Leu Ala Thr Glu
660 665 670
Leu Ala Asp Glu Leu Leu Ala Ile Tyr Asn Ala Asn Tyr Gln Ser Glu
675 680 685
Tyr Arg Val Glu His Glu Asp Ile Ala Lys Arg Thr Leu Arg Asn Ala
690 695 700
Cys Leu Arg Phe Leu Ala Phe Gly Glu Thr His Leu Ala Asp Val Leu
705 710 715 720
Val Ser Lys Gln Phe His Glu Ala Asn Asn Met Thr Asp Ala Leu Ala
725 730 735
Ala Leu Ser Ala Ala Val Ala Ala Gln Leu Pro Cys Arg Asp Ala Leu
740 745 750
Met Gln Glu Tyr Asp Asp Lys Trp His Gln Asn Gly Leu Val Met Asp
755 760 765
Lys Trp Phe Ile Leu Gln Ala Thr Ser Pro Ala Ala Asn Val Leu Glu
770 775 780
Thr Val Arg Gly Leu Leu Gln His Arg Ser Phe Thr Met Ser Asn Pro
785 790 795 800
Asn Arg Ile Arg Ser Leu Ile Gly Ala Phe Ala Gly Ser Asn Pro Ala
805 810 815
Ala Phe His Ala Glu Asp Gly Ser Gly Tyr Leu Phe Leu Val Glu Met
820 825 830
Leu Thr Asp Leu Asn Ser Arg Asn Pro Gln Val Ala Ser Arg Leu Ile
835 840 845
Glu Pro Leu Ile Arg Leu Lys Arg Tyr Asp Ala Lys Arg Gln Glu Lys
850 855 860
Met Arg Ala Ala Leu Glu Gln Leu Lys Gly Leu Glu Asn Leu Ser Gly
865 870 875 880
Asp Leu Tyr Glu Lys Ile Thr Lys Ala Leu Ala
885 890
<210> 12
<211> 889
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 12
Pro Lys Ile His Tyr Arg Lys Asp Tyr Lys Pro Ser Gly Phe Ile Ile
1 5 10 15
Asn Gln Val Thr Leu Asn Ile Asn Ile His Asp Gln Glu Thr Ile Val
20 25 30
Arg Ser Val Leu Asp Met Asp Ile Ser Lys His Asn Val Gly Glu Asp
35 40 45
Leu Val Phe Asp Gly Val Gly Leu Lys Ile Asn Glu Ile Ser Ile Asn
50 55 60
Asn Lys Lys Leu Val Glu Gly Glu Glu Tyr Thr Tyr Asp Asn Glu Phe
65 70 75 80
Leu Thr Ile Phe Ser Lys Phe Val Pro Lys Ser Lys Phe Ala Phe Ser
85 90 95
Ser Glu Val Ile Ile His Pro Glu Thr Asn Tyr Ala Leu Thr Gly Leu
100 105 110
Tyr Lys Ser Lys Asn Ile Ile Val Ser Gln Cys Glu Ala Thr Gly Phe
115 120 125
Arg Arg Ile Thr Phe Phe Ile Asp Arg Pro Asp Met Met Ala Lys Tyr
130 135 140
Asp Val Thr Val Thr Ala Asp Lys Glu Lys Tyr Pro Val Leu Leu Ser
145 150 155 160
Asn Gly Asp Lys Val Asn Glu Phe Glu Ile Pro Gly Gly Arg His Gly
165 170 175
Ala Arg Phe Asn Asp Pro Pro Leu Lys Pro Cys Tyr Leu Phe Ala Val
180 185 190
Val Ala Gly Asp Leu Lys His Leu Ser Ala Thr Tyr Ile Thr Lys Tyr
195 200 205
Thr Lys Lys Lys Val Glu Leu Tyr Val Phe Ser Glu Glu Lys Tyr Val
210 215 220
Ser Lys Leu Gln Trp Ala Leu Glu Cys Leu Lys Lys Ser Met Ala Phe
225 230 235 240
Asp Glu Asp Tyr Phe Gly Leu Glu Tyr Asp Leu Ser Arg Leu Asn Leu
245 250 255
Val Ala Val Ser Asp Phe Asn Val Gly Ala Met Glu Asn Lys Gly Leu
260 265 270
Asn Ile Phe Asn Ala Asn Ser Leu Leu Ala Ser Lys Lys Asn Ser Ile
275 280 285
Asp Phe Ser Tyr Ala Arg Ile Leu Thr Val Val Gly His Glu Tyr Phe
290 295 300
His Gln Tyr Thr Gly Asn Arg Val Thr Leu Arg Asp Trp Phe Gln Leu
305 310 315 320
Thr Leu Lys Glu Gly Leu Thr Val His Arg Glu Asn Leu Phe Ser Glu
325 330 335
Glu Met Thr Lys Thr Val Thr Thr Arg Leu Ser His Val Asp Leu Leu
340 345 350
Arg Ser Val Gln Phe Leu Glu Asp Ser Ser Pro Leu Ser His Pro Ile
355 360 365
Arg Pro Glu Ser Tyr Val Ser Met Glu Asn Phe Tyr Thr Thr Thr Val
370 375 380
Tyr Asp Lys Gly Ser Glu Val Met Arg Met Tyr Leu Thr Ile Leu Gly
385 390 395 400
Glu Glu Tyr Tyr Lys Lys Gly Phe Asp Ile Tyr Ile Lys Lys Asn Asp
405 410 415
Gly Asn Thr Ala Thr Cys Glu Asp Phe Asn Tyr Ala Met Glu Gln Ala
420 425 430
Tyr Lys Met Lys Lys Ala Asp Asn Ser Ala Asn Leu Asn Gln Tyr Leu
435 440 445
Leu Trp Phe Ser Gln Ser Gly Thr Pro His Val Ser Phe Lys Tyr Asn
450 455 460
Tyr Asp Ala Glu Lys Lys Gln Tyr Ser Ile His Val Asn Gln Tyr Thr
465 470 475 480
Lys Pro Asp Glu Asn Gln Lys Glu Lys Lys Pro Leu Phe Ile Pro Ile
485 490 495
Ser Val Gly Leu Ile Asn Pro Glu Asn Gly Lys Glu Met Ile Ser Gln
500 505 510
Thr Thr Leu Glu Leu Thr Lys Glu Ser Asp Thr Phe Val Phe Asn Asn
515 520 525
Ile Ala Val Lys Pro Ile Pro Ser Leu Phe Arg Gly Phe Ser Ala Pro
530 535 540
Val Tyr Ile Glu Asp Gln Leu Thr Asp Glu Glu Arg Ile Leu Leu Leu
545 550 555 560
Lys Tyr Asp Ser Asp Ala Phe Val Arg Tyr Asn Ser Cys Thr Asn Ile
565 570 575
Tyr Met Lys Gln Ile Leu Met Asn Tyr Asn Glu Phe Leu Lys Ala Lys
580 585 590
Asn Glu Lys Leu Glu Ser Phe Gln Leu Thr Pro Val Asn Ala Gln Phe
595 600 605
Ile Asp Ala Ile Lys Tyr Leu Leu Glu Asp Pro His Ala Asp Ala Gly
610 615 620
Phe Lys Ser Tyr Ile Val Ser Leu Pro Gln Asp Arg Tyr Ile Ile Asn
625 630 635 640
Phe Val Ser Asn Leu Asp Thr Asp Val Leu Ala Asp Thr Lys Glu Tyr
645 650 655
Ile Tyr Lys Gln Ile Gly Asp Lys Leu Asn Asp Val Tyr Tyr Lys Met
660 665 670
Phe Lys Ser Leu Glu Ala Lys Ala Asp Asp Leu Thr Tyr Phe Asn Asp
675 680 685
Glu Ser His Val Asp Phe Asp Gln Met Asn Met Arg Thr Leu Arg Asn
690 695 700
Thr Leu Leu Ser Leu Leu Ser Lys Ala Gln Tyr Pro Asn Ile Leu Asn
705 710 715 720
Glu Ile Ile Glu His Ser Lys Ser Pro Tyr Pro Ser Asn Trp Leu Thr
725 730 735
Ser Leu Ser Val Ser Ala Tyr Phe Asp Lys Tyr Phe Glu Leu Tyr Asp
740 745 750
Lys Thr Tyr Lys Leu Ser Lys Asp Asp Glu Leu Leu Leu Gln Glu Trp
755 760 765
Leu Lys Thr Val Ser Arg Ser Asp Arg Lys Asp Ile Tyr Glu Ile Leu
770 775 780
Lys Lys Leu Glu Asn Glu Val Leu Lys Asp Ser Lys Asn Pro Asn Asp
785 790 795 800
Ile Arg Ala Val Tyr Leu Pro Phe Thr Asn Asn Leu Arg Arg Phe His
805 810 815
Asp Ile Ser Gly Lys Gly Tyr Lys Leu Ile Ala Glu Val Ile Thr Lys
820 825 830
Thr Asp Lys Phe Asn Pro Met Val Ala Thr Gln Leu Cys Glu Pro Phe
835 840 845
Lys Leu Trp Asn Lys Leu Asp Thr Lys Arg Gln Glu Leu Met Leu Asn
850 855 860
Glu Met Asn Thr Met Leu Gln Glu Pro Gln Ile Ser Asn Asn Leu Lys
865 870 875 880
Glu Tyr Leu Leu Arg Leu Thr Asn Lys
885
<210> 13
<211> 932
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 13
Met Gly Ser Ser His His His His His His Ser Ser Gly Met Trp Leu
1 5 10 15
Ala Ala Ala Ala Pro Ser Leu Ala Arg Arg Leu Leu Phe Leu Gly Pro
20 25 30
Pro Pro Pro Pro Leu Leu Leu Leu Val Phe Ser Arg Ser Ser Arg Arg
35 40 45
Arg Leu His Ser Leu Gly Leu Ala Ala Met Pro Glu Lys Arg Pro Phe
50 55 60
Glu Arg Leu Pro Ala Asp Val Ser Pro Ile Asn Tyr Ser Leu Cys Leu
65 70 75 80
Lys Pro Asp Leu Leu Asp Phe Thr Phe Glu Gly Lys Leu Glu Ala Ala
85 90 95
Ala Gln Val Arg Gln Ala Thr Asn Gln Ile Val Met Asn Cys Ala Asp
100 105 110
Ile Asp Ile Ile Thr Ala Ser Tyr Ala Pro Glu Gly Asp Glu Glu Ile
115 120 125
His Ala Thr Gly Phe Asn Tyr Gln Asn Glu Asp Glu Lys Val Thr Leu
130 135 140
Ser Phe Pro Ser Thr Leu Gln Thr Gly Thr Gly Thr Leu Lys Ile Asp
145 150 155 160
Phe Val Gly Glu Leu Asn Asp Lys Met Lys Gly Phe Tyr Arg Ser Lys
165 170 175
Tyr Thr Thr Pro Ser Gly Glu Val Arg Tyr Ala Ala Val Thr Gln Phe
180 185 190
Glu Ala Thr Asp Ala Arg Arg Ala Phe Pro Cys Trp Asp Glu Pro Ala
195 200 205
Ile Lys Ala Thr Phe Asp Ile Ser Leu Val Val Pro Lys Asp Arg Val
210 215 220
Ala Leu Ser Asn Met Asn Val Ile Asp Arg Lys Pro Tyr Pro Asp Asp
225 230 235 240
Glu Asn Leu Val Glu Val Lys Phe Ala Arg Thr Pro Val Met Ser Thr
245 250 255
Tyr Leu Val Ala Phe Val Val Gly Glu Tyr Asp Phe Val Glu Thr Arg
260 265 270
Ser Lys Asp Gly Val Cys Val Arg Val Tyr Thr Pro Val Gly Lys Ala
275 280 285
Glu Gln Gly Lys Phe Ala Leu Glu Val Ala Ala Lys Thr Leu Pro Phe
290 295 300
Tyr Lys Asp Tyr Phe Asn Val Pro Tyr Pro Leu Pro Lys Ile Asp Leu
305 310 315 320
Ile Ala Ile Ala Asp Phe Ala Ala Gly Ala Met Glu Asn Trp Gly Leu
325 330 335
Val Thr Tyr Arg Glu Thr Ala Leu Leu Ile Asp Pro Lys Asn Ser Cys
340 345 350
Ser Ser Ser Arg Gln Trp Val Ala Leu Val Val Gly His Glu Leu Ala
355 360 365
His Gln Trp Phe Gly Asn Leu Val Thr Met Glu Trp Trp Thr His Leu
370 375 380
Trp Leu Asn Glu Gly Phe Ala Ser Trp Ile Glu Tyr Leu Cys Val Asp
385 390 395 400
His Cys Phe Pro Glu Tyr Asp Ile Trp Thr Gln Phe Val Ser Ala Asp
405 410 415
Tyr Thr Arg Ala Gln Glu Leu Asp Ala Leu Asp Asn Ser His Pro Ile
420 425 430
Glu Val Ser Val Gly His Pro Ser Glu Val Asp Glu Ile Phe Asp Ala
435 440 445
Ile Ser Tyr Ser Lys Gly Ala Ser Val Ile Arg Met Leu His Asp Tyr
450 455 460
Ile Gly Asp Lys Asp Phe Lys Lys Gly Met Asn Met Tyr Leu Thr Lys
465 470 475 480
Phe Gln Gln Lys Asn Ala Ala Thr Glu Asp Leu Trp Glu Ser Leu Glu
485 490 495
Asn Ala Ser Gly Lys Pro Ile Ala Ala Val Met Asn Thr Trp Thr Lys
500 505 510
Gln Met Gly Phe Pro Leu Ile Tyr Val Glu Ala Glu Gln Val Glu Asp
515 520 525
Asp Arg Leu Leu Arg Leu Ser Gln Lys Lys Phe Cys Ala Gly Gly Ser
530 535 540
Tyr Val Gly Glu Asp Cys Pro Gln Trp Met Val Pro Ile Thr Ile Ser
545 550 555 560
Thr Ser Glu Asp Pro Asn Gln Ala Lys Leu Lys Ile Leu Met Asp Lys
565 570 575
Pro Glu Met Asn Val Val Leu Lys Asn Val Lys Pro Asp Gln Trp Val
580 585 590
Lys Leu Asn Leu Gly Thr Val Gly Phe Tyr Arg Thr Gln Tyr Ser Ser
595 600 605
Ala Met Leu Glu Ser Leu Leu Pro Gly Ile Arg Asp Leu Ser Leu Pro
610 615 620
Pro Val Asp Arg Leu Gly Leu Gln Asn Asp Leu Phe Ser Leu Ala Arg
625 630 635 640
Ala Gly Ile Ile Ser Thr Val Glu Val Leu Lys Val Met Glu Ala Phe
645 650 655
Val Asn Glu Pro Asn Tyr Thr Val Trp Ser Asp Leu Ser Cys Asn Leu
660 665 670
Gly Ile Leu Ser Thr Leu Leu Ser His Thr Asp Phe Tyr Glu Glu Ile
675 680 685
Gln Glu Phe Val Lys Asp Val Phe Ser Pro Ile Gly Glu Arg Leu Gly
690 695 700
Trp Asp Pro Lys Pro Gly Glu Gly His Leu Asp Ala Leu Leu Arg Gly
705 710 715 720
Leu Val Leu Gly Lys Leu Gly Lys Ala Gly His Lys Ala Thr Leu Glu
725 730 735
Glu Ala Arg Arg Arg Phe Lys Asp His Val Glu Gly Lys Gln Ile Leu
740 745 750
Ser Ala Asp Leu Arg Ser Pro Val Tyr Leu Thr Val Leu Lys His Gly
755 760 765
Asp Gly Thr Thr Leu Asp Ile Met Leu Lys Leu His Lys Gln Ala Asp
770 775 780
Met Gln Glu Glu Lys Asn Arg Ile Glu Arg Val Leu Gly Ala Thr Leu
785 790 795 800
Leu Pro Asp Leu Ile Gln Lys Val Leu Thr Phe Ala Leu Ser Glu Glu
805 810 815
Val Arg Pro Gln Asp Thr Val Ser Val Ile Gly Gly Val Ala Gly Gly
820 825 830
Ser Lys His Gly Arg Lys Ala Ala Trp Lys Phe Ile Lys Asp Asn Trp
835 840 845
Glu Glu Leu Tyr Asn Arg Tyr Gln Gly Gly Phe Leu Ile Ser Arg Leu
850 855 860
Ile Lys Leu Ser Val Glu Gly Phe Ala Val Asp Lys Met Ala Gly Glu
865 870 875 880
Val Lys Ala Phe Phe Glu Ser His Pro Ala Pro Ser Ala Glu Arg Thr
885 890 895
Ile Gln Gln Cys Cys Glu Asn Ile Leu Leu Asn Ala Ala Trp Leu Lys
900 905 910
Arg Asp Ala Glu Ser Ile His Gln Tyr Leu Leu Gln Arg Lys Ala Ser
915 920 925
Pro Pro Thr Val
930
<210> 14
<211> 932
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 14
Met Gly Ser Ser His His His His His His Ser Ser Gly Met Trp Leu
1 5 10 15
Ala Ala Ala Ala Pro Ser Leu Ala Arg Arg Leu Leu Phe Leu Gly Pro
20 25 30
Pro Pro Pro Pro Leu Leu Leu Leu Val Phe Ser Arg Ser Ser Arg Arg
35 40 45
Arg Leu His Ser Leu Gly Leu Ala Ala Met Pro Glu Lys Arg Pro Phe
50 55 60
Glu Arg Leu Pro Ala Asp Val Ser Pro Ile Asn Tyr Ser Leu Cys Leu
65 70 75 80
Lys Pro Asp Leu Leu Asp Phe Thr Phe Glu Gly Lys Leu Glu Ala Ala
85 90 95
Ala Gln Val Arg Gln Ala Thr Asn Gln Ile Val Met Asn Cys Ala Asp
100 105 110
Ile Asp Ile Ile Thr Ala Ser Tyr Ala Pro Glu Gly Asp Glu Glu Ile
115 120 125
His Ala Thr Gly Phe Asn Tyr Gln Asn Glu Asp Glu Lys Val Thr Leu
130 135 140
Ser Phe Pro Ser Thr Leu Gln Thr Gly Thr Gly Thr Leu Lys Ile Asp
145 150 155 160
Phe Val Gly Glu Leu Asn Asp Lys Met Lys Gly Phe Tyr Arg Ser Lys
165 170 175
Tyr Thr Thr Pro Ser Gly Glu Val Arg Tyr Ala Ala Val Thr Gln Phe
180 185 190
Glu Ala Thr Asp Ala Arg Arg Ala Phe Pro Cys Trp Asp Glu Pro Ala
195 200 205
Ile Lys Ala Thr Phe Asp Ile Ser Leu Val Val Pro Lys Asp Arg Val
210 215 220
Ala Leu Ser Asn Met Asn Val Ile Asp Arg Lys Pro Tyr Pro Asp Asp
225 230 235 240
Glu Asn Leu Val Glu Val Lys Phe Ala Arg Thr Pro Val Met Ser Thr
245 250 255
Tyr Leu Val Ala Phe Val Val Gly Glu Tyr Asp Phe Val Glu Thr Arg
260 265 270
Ser Lys Asp Gly Val Cys Val Arg Val Tyr Thr Pro Val Gly Lys Ala
275 280 285
Glu Gln Gly Lys Phe Ala Leu Glu Val Ala Ala Lys Thr Leu Pro Phe
290 295 300
Tyr Lys Asp Tyr Phe Asn Val Pro Tyr Pro Leu Pro Lys Ile Asp Leu
305 310 315 320
Ile Ala Ile Ala Asp Phe Ala Ala Gly Ala Met Glu Asn Trp Gly Leu
325 330 335
Val Thr Tyr Arg Glu Thr Ala Leu Leu Ile Asp Pro Lys Asn Ser Cys
340 345 350
Ser Ser Ser Arg Gln Trp Val Ala Leu Val Val Gly His Val Leu Ala
355 360 365
His Gln Trp Phe Gly Asn Leu Val Thr Met Glu Trp Trp Thr His Leu
370 375 380
Trp Leu Asn Glu Gly Phe Ala Ser Trp Ile Glu Tyr Leu Cys Val Asp
385 390 395 400
His Cys Phe Pro Glu Tyr Asp Ile Trp Thr Gln Phe Val Ser Ala Asp
405 410 415
Tyr Thr Arg Ala Gln Glu Leu Asp Ala Leu Asp Asn Ser His Pro Ile
420 425 430
Glu Val Ser Val Gly His Pro Ser Glu Val Asp Glu Ile Phe Asp Ala
435 440 445
Ile Ser Tyr Ser Lys Gly Ala Ser Val Ile Arg Met Leu His Asp Tyr
450 455 460
Ile Gly Asp Lys Asp Phe Lys Lys Gly Met Asn Met Tyr Leu Thr Lys
465 470 475 480
Phe Gln Gln Lys Asn Ala Ala Thr Glu Asp Leu Trp Glu Ser Leu Glu
485 490 495
Asn Ala Ser Gly Lys Pro Ile Ala Ala Val Met Asn Thr Trp Thr Lys
500 505 510
Gln Met Gly Phe Pro Leu Ile Tyr Val Glu Ala Glu Gln Val Glu Asp
515 520 525
Asp Arg Leu Leu Arg Leu Ser Gln Lys Lys Phe Cys Ala Gly Gly Ser
530 535 540
Tyr Val Gly Glu Asp Cys Pro Gln Trp Met Val Pro Ile Thr Ile Ser
545 550 555 560
Thr Ser Glu Asp Pro Asn Gln Ala Lys Leu Lys Ile Leu Met Asp Lys
565 570 575
Pro Glu Met Asn Val Val Leu Lys Asn Val Lys Pro Asp Gln Trp Val
580 585 590
Lys Leu Asn Leu Gly Thr Val Gly Phe Tyr Arg Thr Gln Tyr Ser Ser
595 600 605
Ala Met Leu Glu Ser Leu Leu Pro Gly Ile Arg Asp Leu Ser Leu Pro
610 615 620
Pro Val Asp Arg Leu Gly Leu Gln Asn Asp Leu Phe Ser Leu Ala Arg
625 630 635 640
Ala Gly Ile Ile Ser Thr Val Glu Val Leu Lys Val Met Glu Ala Phe
645 650 655
Val Asn Glu Pro Asn Tyr Thr Val Trp Ser Asp Leu Ser Cys Asn Leu
660 665 670
Gly Ile Leu Ser Thr Leu Leu Ser His Thr Asp Phe Tyr Glu Glu Ile
675 680 685
Gln Glu Phe Val Lys Asp Val Phe Ser Pro Ile Gly Glu Arg Leu Gly
690 695 700
Trp Asp Pro Lys Pro Gly Glu Gly His Leu Asp Ala Leu Leu Arg Gly
705 710 715 720
Leu Val Leu Gly Lys Leu Gly Lys Ala Gly His Lys Ala Thr Leu Glu
725 730 735
Glu Ala Arg Arg Arg Phe Lys Asp His Val Glu Gly Lys Gln Ile Leu
740 745 750
Ser Ala Asp Leu Arg Ser Pro Val Tyr Leu Thr Val Leu Lys His Gly
755 760 765
Asp Gly Thr Thr Leu Asp Ile Met Leu Lys Leu His Lys Gln Ala Asp
770 775 780
Met Gln Glu Glu Lys Asn Arg Ile Glu Arg Val Leu Gly Ala Thr Leu
785 790 795 800
Leu Pro Asp Leu Ile Gln Lys Val Leu Thr Phe Ala Leu Ser Glu Glu
805 810 815
Val Arg Pro Gln Asp Thr Val Ser Val Ile Gly Gly Val Ala Gly Gly
820 825 830
Ser Lys His Gly Arg Lys Ala Ala Trp Lys Phe Ile Lys Asp Asn Trp
835 840 845
Glu Glu Leu Tyr Asn Arg Tyr Gln Gly Gly Phe Leu Ile Ser Arg Leu
850 855 860
Ile Lys Leu Ser Val Glu Gly Phe Ala Val Asp Lys Met Ala Gly Glu
865 870 875 880
Val Lys Ala Phe Phe Glu Ser His Pro Ala Pro Ser Ala Glu Arg Thr
885 890 895
Ile Gln Gln Cys Cys Glu Asn Ile Leu Leu Asn Ala Ala Trp Leu Lys
900 905 910
Arg Asp Ala Glu Ser Ile His Gln Tyr Leu Leu Gln Arg Lys Ala Ser
915 920 925
Pro Pro Thr Val
930
<210> 15
<211> 864
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 15
Met Ile Tyr Glu Phe Val Met Thr Asp Pro Lys Ile Lys Tyr Leu Lys
1 5 10 15
Asp Tyr Lys Pro Ser Asn Tyr Leu Ile Asp Glu Thr His Leu Ile Phe
20 25 30
Glu Leu Asp Glu Ser Lys Thr Arg Val Thr Ala Asn Leu Tyr Ile Val
35 40 45
Ala Asn Arg Glu Asn Arg Glu Asn Asn Thr Leu Val Leu Asp Gly Val
50 55 60
Glu Leu Lys Leu Leu Ser Ile Lys Leu Asn Asn Lys His Leu Ser Pro
65 70 75 80
Ala Glu Phe Ala Val Asn Glu Asn Gln Leu Ile Ile Asn Asn Val Pro
85 90 95
Glu Lys Phe Val Leu Gln Thr Val Val Glu Ile Asn Pro Ser Ala Asn
100 105 110
Thr Ser Leu Glu Gly Leu Tyr Lys Ser Gly Asp Val Phe Ser Thr Gln
115 120 125
Cys Glu Ala Thr Gly Phe Arg Lys Ile Thr Tyr Tyr Leu Asp Arg Pro
130 135 140
Asp Val Met Ala Ala Phe Thr Val Lys Ile Ile Ala Asp Lys Lys Lys
145 150 155 160
Tyr Pro Ile Ile Leu Ser Asn Gly Asp Lys Ile Asp Ser Gly Asp Ile
165 170 175
Ser Asp Asn Gln His Phe Ala Val Trp Lys Asp Pro Phe Lys Lys Pro
180 185 190
Cys Tyr Leu Phe Ala Leu Val Ala Gly Asp Leu Ala Ser Ile Lys Asp
195 200 205
Thr Tyr Ile Thr Lys Ser Gln Arg Lys Val Ser Leu Glu Ile Tyr Ala
210 215 220
Phe Lys Gln Asp Ile Asp Lys Cys His Tyr Ala Met Gln Ala Val Lys
225 230 235 240
Asp Ser Met Lys Trp Asp Glu Asp Arg Phe Gly Leu Glu Tyr Asp Leu
245 250 255
Asp Thr Phe Met Ile Val Ala Val Pro Asp Phe Asn Ala Gly Ala Met
260 265 270
Glu Asn Lys Gly Leu Asn Ile Phe Asn Thr Lys Tyr Ile Met Ala Ser
275 280 285
Asn Lys Thr Ala Thr Asp Lys Asp Phe Glu Leu Val Gln Ser Val Val
290 295 300
Gly His Glu Tyr Phe His Asn Trp Thr Gly Asp Arg Val Thr Cys Arg
305 310 315 320
Asp Trp Phe Gln Leu Ser Leu Lys Glu Gly Leu Thr Val Phe Arg Asp
325 330 335
Gln Glu Phe Thr Ser Asp Leu Asn Ser Arg Asp Val Lys Arg Ile Asp
340 345 350
Asp Val Arg Ile Ile Arg Ser Ala Gln Phe Ala Glu Asp Ala Ser Pro
355 360 365
Met Ser His Pro Ile Arg Pro Glu Ser Tyr Ile Glu Met Asn Asn Phe
370 375 380
Tyr Thr Val Thr Val Tyr Asn Lys Gly Ala Glu Ile Ile Arg Met Ile
385 390 395 400
His Thr Leu Leu Gly Glu Glu Gly Phe Gln Lys Gly Met Lys Leu Tyr
405 410 415
Phe Glu Arg His Asp Gly Gln Ala Val Thr Cys Asp Asp Phe Val Asn
420 425 430
Ala Met Ala Asp Ala Asn Asn Arg Asp Phe Ser Leu Phe Lys Arg Trp
435 440 445
Tyr Ala Gln Ser Gly Thr Pro Asn Ile Lys Val Ser Glu Asn Tyr Asp
450 455 460
Ala Ser Ser Gln Thr Tyr Ser Leu Thr Leu Glu Gln Thr Thr Leu Pro
465 470 475 480
Thr Ala Asp Gln Lys Glu Lys Gln Ala Leu His Ile Pro Val Lys Met
485 490 495
Gly Leu Ile Asn Pro Glu Gly Lys Asn Ile Ala Glu Gln Val Ile Glu
500 505 510
Leu Lys Glu Gln Lys Gln Thr Tyr Thr Phe Glu Asn Ile Ala Ala Lys
515 520 525
Pro Val Ala Ser Leu Phe Arg Asp Phe Ser Ala Pro Val Lys Val Glu
530 535 540
His Lys Arg Ser Glu Lys Asp Leu Leu His Ile Val Lys Tyr Asp Asn
545 550 555 560
Asn Ala Phe Asn Arg Trp Asp Ser Leu Gln Gln Ile Ala Thr Asn Ile
565 570 575
Ile Leu Asn Asn Ala Asp Leu Asn Asp Glu Phe Leu Asn Ala Phe Lys
580 585 590
Ser Ile Leu His Asp Lys Asp Leu Asp Lys Ala Leu Ile Ser Asn Ala
595 600 605
Leu Leu Ile Pro Ile Glu Ser Thr Ile Ala Glu Ala Met Arg Val Ile
610 615 620
Met Val Asp Asp Ile Val Leu Ser Arg Lys Asn Val Val Asn Gln Leu
625 630 635 640
Ala Asp Lys Leu Lys Asp Asp Trp Leu Ala Val Tyr Gln Gln Cys Asn
645 650 655
Asp Asn Lys Pro Tyr Ser Leu Ser Ala Glu Gln Ile Ala Lys Arg Lys
660 665 670
Leu Lys Gly Val Cys Leu Ser Tyr Leu Met Asn Ala Ser Asp Gln Lys
675 680 685
Val Gly Thr Asp Leu Ala Gln Gln Leu Phe Asp Asn Ala Asp Asn Met
690 695 700
Thr Asp Gln Gln Thr Ala Phe Thr Glu Leu Leu Lys Ser Asn Asp Lys
705 710 715 720
Gln Val Arg Asp Asn Ala Ile Asn Glu Phe Tyr Asn Arg Trp Arg His
725 730 735
Glu Asp Leu Val Val Asn Lys Trp Leu Leu Ser Gln Ala Gln Ile Ser
740 745 750
His Glu Ser Ala Leu Asp Ile Val Lys Gly Leu Val Asn His Pro Ala
755 760 765
Tyr Asn Pro Lys Asn Pro Asn Lys Val Tyr Ser Leu Ile Gly Gly Phe
770 775 780
Gly Ala Asn Phe Leu Gln Tyr His Cys Lys Asp Gly Leu Gly Tyr Ala
785 790 795 800
Phe Met Ala Asp Thr Val Leu Ala Leu Asp Lys Phe Asn His Gln Val
805 810 815
Ala Ala Arg Met Ala Arg Asn Leu Met Ser Trp Lys Arg Tyr Asp Ser
820 825 830
Asp Arg Gln Ala Met Met Lys Asn Ala Leu Glu Lys Ile Lys Ala Ser
835 840 845
Asn Pro Ser Lys Asn Val Phe Glu Ile Val Ser Lys Ser Leu Glu Ser
850 855 860
<210> 16
<211> 366
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 16
Met Gly Ser Ser His His His His His His Ser Ser Gly Met Glu Val
1 5 10 15
Arg Asn Met Val Asp Tyr Glu Leu Leu Lys Lys Val Val Glu Ala Pro
20 25 30
Gly Val Ser Gly Tyr Glu Phe Leu Gly Ile Arg Asp Val Val Ile Glu
35 40 45
Glu Ile Lys Asp Tyr Val Asp Glu Val Lys Val Asp Lys Leu Gly Asn
50 55 60
Val Ile Ala His Lys Lys Gly Glu Gly Pro Lys Val Met Ile Ala Ala
65 70 75 80
His Met Asp Gln Ile Gly Leu Met Val Thr His Ile Glu Lys Asn Gly
85 90 95
Phe Leu Arg Val Ala Pro Ile Gly Gly Val Asp Pro Lys Thr Leu Ile
100 105 110
Ala Gln Arg Phe Lys Val Trp Ile Asp Lys Gly Lys Phe Ile Tyr Gly
115 120 125
Val Gly Ala Ser Val Pro Pro His Ile Gln Lys Pro Glu Asp Arg Lys
130 135 140
Lys Ala Pro Asp Trp Asp Gln Ile Phe Ile Asp Ile Gly Ala Glu Ser
145 150 155 160
Lys Glu Glu Ala Glu Asp Met Gly Val Lys Ile Gly Thr Val Ile Thr
165 170 175
Trp Asp Gly Arg Leu Glu Arg Leu Gly Lys His Arg Phe Val Ser Ile
180 185 190
Ala Phe Asp Asp Arg Ile Ala Val Tyr Thr Ile Leu Glu Val Ala Lys
195 200 205
Gln Leu Lys Asp Ala Lys Ala Asp Val Tyr Phe Val Ala Thr Val Gln
210 215 220
Glu Glu Val Gly Leu Arg Gly Ala Arg Thr Ser Ala Phe Gly Ile Glu
225 230 235 240
Pro Asp Tyr Gly Phe Ala Ile Asp Val Thr Ile Ala Ala Asp Ile Pro
245 250 255
Gly Thr Pro Glu His Lys Gln Val Thr His Leu Gly Lys Gly Thr Ala
260 265 270
Ile Lys Ile Met Asp Arg Ser Val Ile Cys His Pro Thr Ile Val Arg
275 280 285
Trp Leu Glu Glu Leu Ala Lys Lys His Glu Ile Pro Tyr Gln Leu Glu
290 295 300
Ile Leu Leu Gly Gly Gly Thr Asp Ala Gly Ala Ile His Leu Thr Lys
305 310 315 320
Ala Gly Val Pro Thr Gly Ala Leu Ser Val Pro Ala Arg Tyr Ile His
325 330 335
Ser Asn Thr Glu Val Val Asp Glu Arg Asp Val Asp Ala Thr Val Glu
340 345 350
Leu Met Thr Lys Ala Leu Glu Asn Ile His Glu Leu Lys Ile
355 360 365
<210> 17
<211> 408
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 17
Met Asp Ala Phe Thr Glu Asn Leu Asn Lys Leu Ala Glu Leu Ala Ile
1 5 10 15
Arg Val Gly Leu Asn Leu Glu Glu Gly Gln Glu Ile Val Ala Thr Ala
20 25 30
Pro Ile Glu Ala Val Asp Phe Val Arg Leu Leu Ala Glu Lys Ala Tyr
35 40 45
Glu Asn Gly Ala Ser Leu Phe Thr Val Leu Tyr Gly Asp Asn Leu Ile
50 55 60
Ala Arg Lys Arg Leu Ala Leu Val Pro Glu Ala His Leu Asp Arg Ala
65 70 75 80
Pro Ala Trp Leu Tyr Glu Gly Met Ala Lys Ala Phe His Glu Gly Ala
85 90 95
Ala Arg Leu Ala Val Ser Gly Asn Asp Pro Lys Ala Leu Glu Gly Leu
100 105 110
Pro Pro Glu Arg Val Gly Arg Ala Gln Gln Ala Gln Ser Arg Ala Tyr
115 120 125
Arg Pro Thr Leu Ser Ala Ile Thr Glu Phe Val Thr Asn Trp Thr Ile
130 135 140
Val Pro Phe Ala His Pro Gly Trp Ala Lys Ala Val Phe Pro Gly Leu
145 150 155 160
Pro Glu Glu Glu Ala Val Gln Arg Leu Trp Gln Ala Ile Phe Gln Ala
165 170 175
Thr Arg Val Asp Gln Glu Asp Pro Val Ala Ala Trp Glu Ala His Asn
180 185 190
Arg Val Leu His Ala Lys Val Ala Phe Leu Asn Glu Lys Arg Phe His
195 200 205
Ala Leu His Phe Gln Gly Pro Gly Thr Asp Leu Thr Val Gly Leu Ala
210 215 220
Glu Gly His Leu Trp Gln Gly Gly Ala Thr Pro Thr Lys Lys Gly Arg
225 230 235 240
Leu Cys Asn Pro Asn Leu Pro Thr Glu Glu Val Phe Thr Ala Pro His
245 250 255
Arg Glu Arg Val Glu Gly Val Val Arg Ala Ser Arg Pro Leu Ala Leu
260 265 270
Ser Gly Gln Leu Val Glu Gly Leu Trp Ala Arg Phe Glu Gly Gly Val
275 280 285
Ala Val Glu Val Gly Ala Glu Lys Gly Glu Glu Val Leu Lys Lys Leu
290 295 300
Leu Asp Thr Asp Glu Gly Ala Arg Arg Leu Gly Glu Val Ala Leu Val
305 310 315 320
Pro Ala Asp Asn Pro Ile Ala Lys Thr Gly Leu Val Phe Phe Asp Thr
325 330 335
Leu Phe Asp Glu Asn Ala Ala Ser His Ile Ala Phe Gly Gln Ala Tyr
340 345 350
Ala Glu Asn Leu Glu Gly Arg Pro Ser Gly Glu Glu Phe Arg Arg Arg
355 360 365
Gly Gly Asn Glu Ser Met Val His Val Asp Trp Met Ile Gly Ser Glu
370 375 380
Glu Val Asp Val Asp Gly Leu Leu Glu Asp Gly Thr Arg Val Pro Leu
385 390 395 400
Met Arg Arg Gly Arg Trp Val Ile
405
<210> 18
<211> 362
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 18
Met Ala Lys Leu Asp Glu Thr Leu Thr Met Leu Lys Ala Leu Thr Asp
1 5 10 15
Ala Lys Gly Val Pro Gly Asn Glu Arg Glu Ala Arg Asp Val Met Lys
20 25 30
Thr Tyr Ile Ala Pro Tyr Ala Asp Glu Val Thr Thr Asp Gly Leu Gly
35 40 45
Ser Leu Ile Ala Lys Lys Glu Gly Lys Ser Gly Gly Pro Lys Val Met
50 55 60
Ile Ala Gly His Leu Asp Glu Val Gly Phe Met Val Thr Gln Ile Asp
65 70 75 80
Asp Lys Gly Phe Ile Arg Phe Gln Thr Leu Gly Gly Trp Trp Ser Gln
85 90 95
Val Met Leu Ala Gln Arg Val Thr Ile Val Thr Lys Lys Gly Asp Ile
100 105 110
Thr Gly Val Ile Gly Ser Lys Pro Pro His Ile Leu Pro Ser Glu Ala
115 120 125
Arg Lys Lys Pro Val Glu Ile Lys Asp Met Phe Ile Asp Ile Gly Ala
130 135 140
Thr Ser Arg Glu Glu Ala Met Glu Trp Gly Val Arg Pro Gly Asp Met
145 150 155 160
Ile Val Pro Tyr Phe Glu Phe Thr Val Leu Asn Asn Glu Lys Met Leu
165 170 175
Leu Ala Lys Ala Trp Asp Asn Arg Ile Gly Cys Ala Val Ala Ile Asp
180 185 190
Val Leu Lys Gln Leu Lys Gly Val Asp His Pro Asn Thr Val Tyr Gly
195 200 205
Val Gly Thr Val Gln Glu Glu Val Gly Leu Arg Gly Ala Arg Thr Ala
210 215 220
Ala Gln Phe Ile Gln Pro Asp Ile Ala Phe Ala Val Asp Val Gly Ile
225 230 235 240
Ala Gly Asp Thr Pro Gly Val Ser Glu Lys Glu Ala Met Gly Lys Leu
245 250 255
Gly Ala Gly Pro His Ile Val Leu Tyr Asp Ala Thr Met Val Ser His
260 265 270
Arg Gly Leu Arg Glu Phe Val Ile Glu Val Ala Glu Glu Leu Asn Ile
275 280 285
Pro His His Phe Asp Ala Met Pro Gly Val Gly Thr Asp Ala Gly Ala
290 295 300
Ile His Leu Thr Gly Ile Gly Val Pro Ser Leu Thr Ile Ala Ile Pro
305 310 315 320
Thr Arg Tyr Ile His Ser His Ala Ala Ile Leu His Arg Asp Asp Tyr
325 330 335
Glu Asn Thr Val Lys Leu Leu Val Glu Val Ile Lys Arg Leu Asp Ala
340 345 350
Asp Lys Val Lys Gln Leu Thr Phe Asp Glu
355 360
<210> 19
<211> 490
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 19
Met Glu Asp Lys Val Trp Ile Ser Met Gly Ala Asp Ala Val Gly Ser
1 5 10 15
Leu Asn Pro Ala Leu Ser Glu Ser Leu Leu Pro His Ser Phe Ala Ser
20 25 30
Gly Ser Gln Val Trp Ile Gly Glu Val Ala Ile Asp Glu Leu Ala Glu
35 40 45
Leu Ser His Thr Met His Glu Gln His Asn Arg Cys Gly Gly Tyr Met
50 55 60
Val His Thr Ser Ala Gln Gly Ala Met Ala Ala Leu Met Met Pro Glu
65 70 75 80
Ser Ile Ala Asn Phe Thr Ile Pro Ala Pro Ser Gln Gln Asp Leu Val
85 90 95
Asn Ala Trp Leu Pro Gln Val Ser Ala Asp Gln Ile Thr Asn Thr Ile
100 105 110
Arg Ala Leu Ser Ser Phe Asn Asn Arg Phe Tyr Thr Thr Thr Ser Gly
115 120 125
Ala Gln Ala Ser Asp Trp Leu Ala Asn Glu Trp Arg Ser Leu Ile Ser
130 135 140
Ser Leu Pro Gly Ser Arg Ile Glu Gln Ile Lys His Ser Gly Tyr Asn
145 150 155 160
Gln Lys Ser Val Val Leu Thr Ile Gln Gly Ser Glu Lys Pro Asp Glu
165 170 175
Trp Val Ile Val Gly Gly His Leu Asp Ser Thr Leu Gly Ser His Thr
180 185 190
Asn Glu Gln Ser Ile Ala Pro Gly Ala Asp Asp Asp Ala Ser Gly Ile
195 200 205
Ala Ser Leu Ser Glu Ile Ile Arg Val Leu Arg Asp Asn Asn Phe Arg
210 215 220
Pro Lys Arg Ser Val Ala Leu Met Ala Tyr Ala Ala Glu Glu Val Gly
225 230 235 240
Leu Arg Gly Ser Gln Asp Leu Ala Asn Gln Tyr Lys Ala Gln Gly Lys
245 250 255
Lys Val Val Ser Val Leu Gln Leu Asp Met Thr Asn Tyr Arg Gly Ser
260 265 270
Ala Glu Asp Ile Val Phe Ile Thr Asp Tyr Thr Asp Ser Asn Leu Thr
275 280 285
Gln Phe Leu Thr Thr Leu Ile Asp Glu Tyr Leu Pro Glu Leu Thr Tyr
290 295 300
Gly Tyr Asp Arg Cys Gly Tyr Ala Cys Ser Asp His Ala Ser Trp His
305 310 315 320
Lys Ala Gly Phe Ser Ala Ala Met Pro Phe Glu Ser Lys Phe Lys Asp
325 330 335
Tyr Asn Pro Lys Ile His Thr Ser Gln Asp Thr Leu Ala Asn Ser Asp
340 345 350
Pro Thr Gly Asn His Ala Val Lys Phe Thr Lys Leu Gly Leu Ala Tyr
355 360 365
Val Ile Glu Met Ala Asn Ala Gly Ser Ser Gln Val Pro Asp Asp Ser
370 375 380
Val Leu Gln Asp Gly Thr Ala Lys Ile Asn Leu Ser Gly Ala Arg Gly
385 390 395 400
Thr Gln Lys Arg Phe Thr Phe Glu Leu Ser Gln Ser Lys Pro Leu Thr
405 410 415
Ile Gln Thr Tyr Gly Gly Ser Gly Asp Val Asp Leu Tyr Val Lys Tyr
420 425 430
Gly Ser Ala Pro Ser Lys Ser Asn Trp Asp Cys Arg Pro Tyr Gln Asn
435 440 445
Gly Asn Arg Glu Thr Cys Ser Phe Asn Asn Ala Gln Pro Gly Ile Tyr
450 455 460
His Val Met Leu Asp Gly Tyr Thr Asn Tyr Asn Asp Val Ala Leu Lys
465 470 475 480
Ala Ser Thr Gln His His His His His His
485 490
<210> 20
<211> 494
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 20
Met Glu Asp Lys Val Trp Ile Ser Ile Gly Ser Asp Ala Ser Gln Thr
1 5 10 15
Val Lys Ser Val Met Gln Ser Asn Ala Arg Ser Leu Leu Pro Glu Ser
20 25 30
Leu Ala Ser Asn Gly Pro Val Trp Val Gly Gln Val Asp Tyr Ser Gln
35 40 45
Leu Ala Glu Leu Ser His His Met His Glu Asp His Gln Arg Cys Gly
50 55 60
Gly Tyr Met Val His Ser Ser Pro Glu Ser Ala Ile Ala Ala Ser Asn
65 70 75 80
Met Pro Gln Ser Leu Val Ala Phe Ser Ile Pro Glu Ile Ser Gln Gln
85 90 95
Asp Thr Val Asn Ala Trp Leu Pro Gln Val Asn Ser Gln Ala Ile Thr
100 105 110
Gly Thr Ile Thr Ser Leu Thr Ser Phe Ile Asn Arg Phe Tyr Thr Thr
115 120 125
Thr Ser Gly Ala Gln Ala Ser Asp Trp Leu Ala Asn Glu Trp Arg Ser
130 135 140
Leu Ser Ala Ser Leu Pro Asn Ala Ser Val Arg Gln Val Ser His Phe
145 150 155 160
Gly Tyr Asn Gln Lys Ser Val Val Leu Thr Ile Thr Gly Ser Glu Lys
165 170 175
Pro Asp Glu Trp Ile Val Leu Gly Gly His Leu Asp Ser Thr Ile Gly
180 185 190
Ser His Thr Asn Glu Gln Ser Val Ala Pro Gly Ala Asp Asp Asp Ala
195 200 205
Ser Gly Ile Ala Ser Val Thr Glu Ile Ile Arg Val Leu Ser Glu Asn
210 215 220
Asn Phe Gln Pro Lys Arg Ser Ile Ala Phe Met Ala Tyr Ala Ala Glu
225 230 235 240
Glu Val Gly Leu Arg Gly Ser Gln Asp Leu Ala Asn Gln Tyr Lys Ala
245 250 255
Glu Gly Lys Gln Val Ile Ser Ala Leu Gln Leu Asp Met Thr Asn Tyr
260 265 270
Lys Gly Ser Val Glu Asp Ile Val Phe Ile Thr Asp Tyr Thr Asp Ser
275 280 285
Asn Leu Thr Thr Phe Leu Ser Gln Leu Val Asp Glu Tyr Leu Pro Ser
290 295 300
Leu Thr Tyr Gly Phe Asp Thr Cys Gly Tyr Ala Cys Ser Asp His Ala
305 310 315 320
Ser Trp His Lys Ala Gly Phe Ser Ala Ala Met Pro Phe Glu Ala Lys
325 330 335
Phe Asn Asp Tyr Asn Pro Met Ile His Thr Pro Asn Asp Thr Leu Gln
340 345 350
Asn Ser Asp Pro Thr Ala Ser His Ala Val Lys Phe Thr Lys Leu Gly
355 360 365
Leu Ala Tyr Ala Ile Glu Met Ala Ser Thr Thr Gly Gly Thr Pro Pro
370 375 380
Pro Thr Gly Asn Val Leu Lys Asp Gly Val Pro Val Asn Gly Leu Ser
385 390 395 400
Gly Ala Thr Gly Ser Gln Val His Tyr Ser Phe Glu Leu Pro Ala Gln
405 410 415
Lys Asn Leu Gln Ile Ser Thr Ala Gly Gly Ser Gly Asp Val Asp Leu
420 425 430
Tyr Val Ser Phe Gly Ser Glu Ala Thr Lys Gln Asn Trp Asp Cys Arg
435 440 445
Pro Tyr Arg Asn Gly Asn Asn Glu Val Cys Thr Phe Ala Gly Ala Thr
450 455 460
Pro Gly Thr Tyr Ser Ile Met Leu Asp Gly Tyr Arg Gln Phe Ser Gly
465 470 475 480
Val Thr Leu Lys Ala Ser Thr Gln His His His His His His
485 490
<210> 21
<211> 877
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 21
Met Thr Gln Gln Pro Gln Ala Lys Tyr Arg His Asp Tyr Arg Ala Pro
1 5 10 15
Asp Tyr Thr Ile Thr Asp Ile Asp Leu Asp Phe Ala Leu Asp Ala Gln
20 25 30
Lys Thr Thr Val Thr Ala Val Ser Lys Val Lys Arg Gln Gly Thr Asp
35 40 45
Val Thr Pro Leu Ile Leu Asn Gly Glu Asp Leu Thr Leu Ile Ser Val
50 55 60
Ser Val Asp Gly Gln Ala Trp Pro His Tyr Arg Gln Gln Asp Asn Thr
65 70 75 80
Leu Val Ile Glu Gln Leu Pro Ala Asp Phe Thr Leu Thr Ile Val Asn
85 90 95
Asp Ile His Pro Ala Thr Asn Ser Ala Leu Glu Gly Leu Tyr Leu Ser
100 105 110
Gly Glu Ala Leu Cys Thr Gln Cys Glu Ala Glu Gly Phe Arg His Ile
115 120 125
Thr Tyr Tyr Leu Asp Arg Pro Asp Val Leu Ala Arg Phe Thr Thr Arg
130 135 140
Ile Val Ala Asp Lys Ser Arg Tyr Pro Tyr Leu Leu Ser Asn Gly Asn
145 150 155 160
Arg Val Gly Gln Gly Glu Leu Asp Asp Gly Arg His Trp Val Lys Trp
165 170 175
Glu Asp Pro Phe Pro Lys Pro Ser Tyr Leu Phe Ala Leu Val Ala Gly
180 185 190
Asp Phe Asp Val Leu Gln Asp Lys Phe Ile Thr Arg Ser Gly Arg Glu
195 200 205
Val Ala Leu Glu Ile Phe Val Asp Arg Gly Asn Leu Asp Arg Ala Asp
210 215 220
Trp Ala Met Thr Ser Leu Lys Asn Ser Met Lys Trp Asp Glu Thr Arg
225 230 235 240
Phe Gly Leu Glu Tyr Asp Leu Asp Ile Tyr Met Ile Val Ala Val Asp
245 250 255
Phe Phe Asn Met Gly Ala Met Glu Asn Lys Gly Leu Asn Val Phe Asn
260 265 270
Ser Lys Tyr Val Leu Ala Lys Ala Glu Thr Ala Thr Asp Lys Asp Tyr
275 280 285
Leu Asn Ile Glu Ala Val Ile Gly His Glu Tyr Phe His Asn Trp Thr
290 295 300
Gly Asn Arg Val Thr Cys Arg Asp Trp Phe Gln Leu Ser Leu Lys Glu
305 310 315 320
Gly Leu Thr Val Phe Arg Asp Gln Glu Phe Ser Ser Asp Leu Gly Ser
325 330 335
Arg Ser Val Asn Arg Ile Glu Asn Val Arg Val Met Arg Ala Ala Gln
340 345 350
Phe Ala Glu Asp Ala Ser Pro Met Ala His Ala Ile Arg Pro Asp Lys
355 360 365
Val Ile Glu Met Asn Asn Phe Tyr Thr Leu Thr Val Tyr Glu Lys Gly
370 375 380
Ser Glu Val Ile Arg Met Met His Thr Leu Leu Gly Glu Gln Gln Phe
385 390 395 400
Gln Ala Gly Met Arg Leu Tyr Phe Glu Arg His Asp Gly Ser Ala Ala
405 410 415
Thr Cys Asp Asp Phe Val Gln Ala Met Glu Asp Val Ser Asn Val Asp
420 425 430
Leu Ser Leu Phe Arg Arg Trp Tyr Ser Gln Ser Gly Thr Pro Leu Leu
435 440 445
Thr Val His Asp Asp Tyr Asp Val Glu Lys Gln Gln Tyr His Leu Phe
450 455 460
Val Ser Gln Lys Thr Leu Pro Thr Ala Asp Gln Pro Glu Lys Leu Pro
465 470 475 480
Leu His Ile Pro Leu Asp Ile Glu Leu Tyr Asp Ser Lys Gly Asn Val
485 490 495
Ile Pro Leu Gln His Asn Gly Leu Pro Val His His Val Leu Asn Val
500 505 510
Thr Glu Ala Glu Gln Thr Phe Thr Phe Asp Asn Val Ala Gln Lys Pro
515 520 525
Ile Pro Ser Leu Leu Arg Glu Phe Ser Ala Pro Val Lys Leu Asp Tyr
530 535 540
Pro Tyr Ser Asp Gln Gln Leu Thr Phe Leu Met Gln His Ala Arg Asn
545 550 555 560
Glu Phe Ser Arg Trp Asp Ala Ala Gln Ser Leu Leu Ala Thr Tyr Ile
565 570 575
Lys Leu Asn Val Ala Lys Tyr Gln Gln Gln Gln Pro Leu Ser Leu Pro
580 585 590
Ala His Val Ala Asp Ala Phe Arg Ala Ile Leu Leu Asp Glu His Leu
595 600 605
Asp Pro Ala Leu Ala Ala Gln Ile Leu Thr Leu Pro Ser Glu Asn Glu
610 615 620
Met Ala Glu Leu Phe Thr Thr Ile Asp Pro Gln Ala Ile Ser Thr Val
625 630 635 640
His Glu Ala Ile Thr Arg Cys Leu Ala Gln Glu Leu Ser Asp Glu Leu
645 650 655
Leu Ala Val Tyr Val Ala Asn Met Thr Pro Val Tyr Arg Ile Glu His
660 665 670
Gly Asp Ile Ala Lys Arg Ala Leu Arg Asn Thr Cys Leu Asn Tyr Leu
675 680 685
Ala Phe Gly Asp Glu Glu Phe Ala Asn Lys Leu Val Ser Leu Gln Tyr
690 695 700
His Gln Ala Asp Asn Met Thr Asp Ser Leu Ala Ala Leu Ala Ala Ala
705 710 715 720
Val Ala Ala Gln Leu Pro Cys Arg Asp Glu Leu Leu Ala Ala Phe Asp
725 730 735
Val Arg Trp Asn His Asp Gly Leu Val Met Asp Lys Trp Phe Ala Leu
740 745 750
Gln Ala Thr Ser Pro Ala Ala Asn Val Leu Val Gln Val Arg Thr Leu
755 760 765
Leu Lys His Pro Ala Phe Ser Leu Ser Asn Pro Asn Arg Thr Arg Ser
770 775 780
Leu Ile Gly Ser Phe Ala Ser Gly Asn Pro Ala Ala Phe His Ala Ala
785 790 795 800
Asp Gly Ser Gly Tyr Gln Phe Leu Val Glu Ile Leu Ser Asp Leu Asn
805 810 815
Thr Arg Asn Pro Gln Val Ala Ala Arg Leu Ile Glu Pro Leu Ile Arg
820 825 830
Leu Lys Arg Tyr Asp Ala Gly Arg Gln Ala Leu Met Arg Lys Ala Leu
835 840 845
Glu Gln Leu Lys Thr Leu Asp Asn Leu Ser Gly Asp Leu Tyr Glu Lys
850 855 860
Ile Thr Lys Ala Leu Ala Ala His His His His His His
865 870 875
<210> 22
<211> 489
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 22
Met Glu Glu Lys Val Trp Ile Ser Ile Gly Gly Asp Ala Thr Gln Thr
1 5 10 15
Ala Leu Arg Ser Gly Ala Gln Ser Leu Leu Pro Glu Asn Leu Ile Asn
20 25 30
Gln Thr Ser Val Trp Val Gly Gln Val Pro Val Ser Glu Leu Ala Thr
35 40 45
Leu Ser His Glu Met His Glu Asn His Gln Arg Cys Gly Gly Tyr Met
50 55 60
Val His Pro Ser Ala Gln Ser Ala Met Ser Val Ser Ala Met Pro Leu
65 70 75 80
Asn Leu Asn Ala Phe Ser Ala Pro Glu Ile Thr Gln Gln Thr Thr Val
85 90 95
Asn Ala Trp Leu Pro Ser Val Ser Ala Gln Gln Ile Thr Ser Thr Ile
100 105 110
Thr Thr Leu Thr Gln Phe Lys Asn Arg Phe Tyr Thr Thr Ser Thr Gly
115 120 125
Ala Gln Ala Ser Asn Trp Ile Ala Asp His Trp Arg Ser Leu Ser Ala
130 135 140
Ser Leu Pro Ala Ser Lys Val Glu Gln Ile Thr His Ser Gly Tyr Asn
145 150 155 160
Gln Lys Ser Val Met Leu Thr Ile Thr Gly Ser Glu Lys Pro Asp Glu
165 170 175
Trp Val Val Ile Gly Gly His Leu Asp Ser Thr Leu Gly Ser Arg Thr
180 185 190
Asn Glu Ser Ser Ile Ala Pro Gly Ala Asp Asp Asp Ala Ser Gly Ile
195 200 205
Ala Gly Val Thr Glu Ile Ile Arg Leu Leu Ser Glu Gln Asn Phe Arg
210 215 220
Pro Lys Arg Ser Ile Ala Phe Met Ala Tyr Ala Ala Glu Glu Val Gly
225 230 235 240
Leu Arg Gly Ser Gln Asp Leu Ala Asn Arg Phe Lys Ala Glu Gly Lys
245 250 255
Lys Val Met Ser Val Met Gln Leu Asp Met Thr Asn Tyr Gln Gly Ser
260 265 270
Arg Glu Asp Ile Val Phe Ile Thr Asp Tyr Thr Asp Ser Asn Phe Thr
275 280 285
Gln Tyr Leu Thr Gln Leu Leu Asp Glu Tyr Leu Pro Ser Leu Thr Tyr
290 295 300
Gly Phe Asp Thr Cys Gly Tyr Ala Cys Ser Asp His Ala Ser Trp His
305 310 315 320
Ala Val Gly Tyr Pro Ala Ala Met Pro Phe Glu Ser Lys Phe Asn Asp
325 330 335
Tyr Asn Pro Asn Ile His Ser Pro Gln Asp Thr Leu Gln Asn Ser Asp
340 345 350
Pro Thr Gly Phe His Ala Val Lys Phe Thr Lys Leu Gly Leu Ala Tyr
355 360 365
Val Val Glu Met Gly Asn Ala Ser Thr Pro Pro Thr Pro Ser Asn Gln
370 375 380
Leu Lys Asn Gly Val Pro Val Asn Gly Leu Ser Ala Ser Arg Asn Ser
385 390 395 400
Lys Thr Trp Tyr Gln Phe Glu Leu Gln Glu Ala Gly Asn Leu Ser Ile
405 410 415
Val Leu Ser Gly Gly Ser Gly Asp Ala Asp Leu Tyr Val Lys Tyr Gln
420 425 430
Thr Asp Ala Asp Leu Gln Gln Tyr Asp Cys Arg Pro Tyr Arg Ser Gly
435 440 445
Asn Asn Glu Thr Cys Gln Phe Ser Asn Ala Gln Pro Gly Arg Tyr Ser
450 455 460
Ile Leu Leu His Gly Tyr Asn Asn Tyr Ser Asn Ala Ser Leu Val Ala
465 470 475 480
Asn Ala Gln His His His His His His
485
<210> 23
<211> 488
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 23
Met Glu Asp Lys Lys Val Trp Ile Ser Ile Gly Ala Asp Ala Gln Gln
1 5 10 15
Thr Ala Leu Ser Ser Gly Ala Gln Pro Leu Leu Ala Gln Ser Val Ala
20 25 30
His Asn Gly Gln Ala Trp Ile Gly Glu Val Ser Glu Ser Glu Leu Ala
35 40 45
Ala Leu Ser His Glu Met His Glu Asn His His Arg Cys Gly Gly Tyr
50 55 60
Ile Val His Ser Ser Ala Gln Ser Ala Met Ala Ala Ser Asn Met Pro
65 70 75 80
Leu Ser Arg Ala Ser Phe Ile Ala Pro Ala Ile Ser Gln Gln Ala Leu
85 90 95
Val Thr Pro Trp Ile Ser Gln Ile Asp Ser Ala Leu Ile Val Asn Thr
100 105 110
Ile Asp Arg Leu Thr Asp Phe Pro Asn Arg Phe Tyr Thr Thr Thr Ser
115 120 125
Gly Ala Gln Ala Ser Asp Trp Ile Lys Gln Arg Trp Gln Ser Leu Ser
130 135 140
Ala Gly Leu Ala Gly Ala Ser Val Thr Gln Ile Ser His Ser Gly Tyr
145 150 155 160
Asn Gln Ala Ser Val Met Leu Thr Ile Glu Gly Ser Glu Ser Pro Asp
165 170 175
Glu Trp Val Val Val Gly Gly His Leu Asp Ser Thr Ile Gly Ser Arg
180 185 190
Thr Asn Glu Gln Ser Ile Ala Pro Gly Ala Asp Asp Asp Ala Ser Gly
195 200 205
Ile Ala Ala Val Thr Glu Val Ile Arg Val Leu Ala Gln Asn Asn Phe
210 215 220
Gln Pro Lys Arg Ser Ile Ala Phe Val Ala Tyr Ala Ala Glu Glu Val
225 230 235 240
Gly Leu Arg Gly Ser Gln Asp Val Ala Asn Gln Phe Lys Gln Ala Gly
245 250 255
Lys Asp Val Arg Gly Val Leu Gln Leu Asp Met Thr Asn Tyr Gln Gly
260 265 270
Ser Ala Glu Asp Ile Val Phe Ile Thr Asp Tyr Thr Asp Asn Gln Leu
275 280 285
Thr Gln Tyr Leu Thr Gln Leu Leu Asp Glu Tyr Leu Pro Thr Leu Asn
290 295 300
Tyr Gly Phe Asp Thr Cys Gly Tyr Ala Cys Ser Asp His Ala Ser Trp
305 310 315 320
His Gln Val Gly Tyr Pro Ala Ala Met Pro Phe Glu Ala Lys Phe Asn
325 330 335
Asp Tyr Asn Pro Asn Ile His Thr Pro Gln Asp Thr Leu Ala Asn Ser
340 345 350
Asp Ser Glu Gly Ala His Ala Ala Lys Phe Thr Lys Leu Gly Leu Ala
355 360 365
Tyr Thr Val Glu Leu Ala Asn Ala Asp Ser Ser Pro Asn Pro Gly Asn
370 375 380
Glu Leu Lys Leu Gly Glu Pro Ile Asn Gly Leu Ser Gly Ala Arg Gly
385 390 395 400
Asn Glu Lys Tyr Phe Asn Tyr Arg Leu Asp Gln Ser Gly Glu Leu Val
405 410 415
Ile Arg Thr Tyr Gly Gly Ser Gly Asp Val Asp Leu Tyr Val Lys Ala
420 425 430
Asn Gly Asp Val Ser Thr Gly Asn Trp Asp Cys Arg Pro Tyr Arg Ser
435 440 445
Gly Asn Asp Glu Val Cys Arg Phe Asp Asn Ala Thr Pro Gly Asn Tyr
450 455 460
Ala Val Met Leu Arg Gly Tyr Arg Thr Tyr Asp Asn Val Ser Leu Ile
465 470 475 480
Val Glu His His His His His His
485
<210> 24
<211> 308
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 24
Gly Met Pro Pro Ile Thr Gln Gln Ala Thr Val Thr Ala Trp Leu Pro
1 5 10 15
Gln Val Asp Ala Ser Gln Ile Thr Gly Thr Ile Ser Ser Leu Glu Ser
20 25 30
Phe Thr Asn Arg Phe Tyr Thr Thr Thr Ser Gly Ala Gln Ala Ser Asp
35 40 45
Trp Ile Ala Ser Glu Trp Gln Phe Leu Ser Ala Ser Leu Pro Asn Ala
50 55 60
Ser Val Lys Gln Val Ser His Ser Gly Tyr Asn Gln Lys Ser Val Val
65 70 75 80
Met Thr Ile Thr Gly Ser Glu Ala Pro Asp Glu Trp Ile Val Ile Gly
85 90 95
Gly His Leu Asp Ser Thr Ile Gly Ser His Thr Asn Glu Gln Ser Val
100 105 110
Ala Pro Gly Ala Asp Asp Asp Ala Ser Gly Ile Ala Ala Val Thr Glu
115 120 125
Val Ile Arg Val Leu Ser Glu Asn Asn Phe Gln Pro Lys Arg Ser Ile
130 135 140
Ala Phe Met Ala Tyr Ala Ala Glu Glu Val Gly Leu Arg Gly Ser Gln
145 150 155 160
Asp Leu Ala Asn Gln Tyr Lys Ser Glu Gly Lys Asn Val Val Ser Ala
165 170 175
Leu Gln Leu Asp Met Thr Asn Tyr Lys Gly Ser Ala Gln Asp Val Val
180 185 190
Phe Ile Thr Asp Tyr Thr Asp Ser Asn Phe Thr Gln Tyr Leu Thr Gln
195 200 205
Leu Met Asp Glu Tyr Leu Pro Ser Leu Thr Tyr Gly Phe Asp Thr Cys
210 215 220
Gly Tyr Ala Cys Ser Asp His Ala Ser Trp His Asn Ala Gly Tyr Pro
225 230 235 240
Ala Ala Met Pro Phe Glu Ser Lys Phe Asn Asp Tyr Asn Pro Arg Ile
245 250 255
His Thr Thr Gln Asp Thr Leu Ala Asn Ser Asp Pro Thr Gly Ser His
260 265 270
Ala Lys Lys Phe Thr Gln Leu Gly Leu Ala Tyr Ala Ile Glu Met Gly
275 280 285
Ser Ala Thr Gly Asp Thr Pro Thr Pro Gly Asn Gln Leu Glu His His
290 295 300
His His His His
305
<210> 25
<211> 354
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 25
Met Val Asp Trp Glu Leu Met Lys Lys Ile Ile Glu Ser Pro Gly Val
1 5 10 15
Ser Gly Tyr Glu His Leu Gly Ile Arg Asp Leu Val Val Asp Ile Leu
20 25 30
Lys Asp Val Ala Asp Glu Val Lys Ile Asp Lys Leu Gly Asn Val Ile
35 40 45
Ala His Phe Lys Gly Ser Ala Pro Lys Val Met Val Ala Ala His Met
50 55 60
Asp Lys Ile Gly Leu Met Val Asn His Ile Asp Lys Asp Gly Tyr Leu
65 70 75 80
Arg Val Val Pro Ile Gly Gly Val Leu Pro Glu Thr Leu Ile Ala Gln
85 90 95
Lys Ile Arg Phe Phe Thr Glu Lys Gly Glu Arg Tyr Gly Val Val Gly
100 105 110
Val Leu Pro Pro His Leu Arg Arg Glu Ala Lys Asp Gln Gly Gly Lys
115 120 125
Ile Asp Trp Asp Ser Ile Ile Val Asp Val Gly Ala Ser Ser Arg Glu
130 135 140
Glu Ala Glu Glu Met Gly Phe Arg Ile Gly Thr Ile Gly Glu Phe Ala
145 150 155 160
Pro Asn Phe Thr Arg Leu Ser Glu His Arg Phe Ala Thr Pro Tyr Leu
165 170 175
Asp Asp Arg Ile Cys Leu Tyr Ala Met Ile Glu Ala Ala Arg Gln Leu
180 185 190
Gly Glu His Glu Ala Asp Ile Tyr Ile Val Ala Ser Val Gln Glu Glu
195 200 205
Ile Gly Leu Arg Gly Ala Arg Val Ala Ser Phe Ala Ile Asp Pro Glu
210 215 220
Val Gly Ile Ala Met Asp Val Thr Phe Ala Lys Gln Pro Asn Asp Lys
225 230 235 240
Gly Lys Ile Val Pro Glu Leu Gly Lys Gly Pro Val Met Asp Val Gly
245 250 255
Pro Asn Ile Asn Pro Lys Leu Arg Gln Phe Ala Asp Glu Val Ala Lys
260 265 270
Lys Tyr Glu Ile Pro Leu Gln Val Glu Pro Ser Pro Arg Pro Thr Gly
275 280 285
Thr Asp Ala Asn Val Met Gln Ile Asn Arg Glu Gly Val Ala Thr Ala
290 295 300
Val Leu Ser Ile Pro Ile Arg Tyr Met His Ser Gln Val Glu Leu Ala
305 310 315 320
Asp Ala Arg Asp Val Asp Asn Thr Ile Lys Leu Ala Lys Ala Leu Leu
325 330 335
Glu Glu Leu Lys Pro Met Asp Phe Thr Pro Leu Glu His His His His
340 345 350
His His
<210> 26
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 26
Asp Tyr Arg Ala Gly Pro
1 5
<210> 27
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 27
Leu Phe Trp Val Met Cys
1 5
<210> 28
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 28
Arg Glu Pro Ile Leu Gln Asn
1 5
<210> 29
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 29
Ile Leu Ser Thr Glu Pro
1 5
<210> 30
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 30
Asp Ala Gly Met Cys Val
1 5
<210> 31
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 31
Ser Pro Ile Gln Arg Tyr Pro
1 5
<210> 32
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 32
Gln Trp Cys Val Arg Glu
1 5
<210> 33
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 33
Trp Val Asp Tyr Glu Arg
1 5
<210> 34
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 34
Gln Asp Trp Asn
1
<210> 35
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 35
Gln Trp Asn Tyr Glu Asp Arg Ile Leu
1 5
<210> 36
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 36
Gln Asp Trp Asn Tyr Asp Arg Ile Asp
1 5

Claims (107)

1.一种方法,所述方法包括:
(i)提供包含多肽群的富集样品;
(ii)将所述富集样品分成两个或更多个子样品;
(iii)使至少两个子样品各自与不同的修饰剂接触,其中所述修饰剂包括裂解剂,从而产生具有裂解模式组合的多肽片段;和
(iv)对所述多肽片段进行并行测序,从而确定所述多肽片段的氨基酸序列。
2.根据权利要求1所述的的方法,进一步包括:
(v)通过比对(iv)中确定的所述多肽片段的氨基酸序列来重建(i)中的多肽序列。
3.根据权利要求2所述的方法,进一步包括:
(vi)从(v)中重建的多肽序列中鉴定多肽变体或确认不存在多肽变体。
4.根据权利要求3所述的方法,其中(vi)中的多肽变体包含可变剪接位点、氨基酸插入、氨基酸缺失、氨基酸取代和/或氨基酸化学修饰。
5.根据权利要求4所述的方法,其中所述氨基酸化学修饰是翻译后修饰。
6.根据权利要求5所述的方法,其中所述化学修饰选自由乙酰化、ADP-核糖基化、半胱天冬酶裂解、瓜氨酸化、甲酰化、羟基化、甲基化、肉豆蔻酰化、N-连接糖基化、类泛素化、硝化、O-连接糖基化、氧化、棕榈酰化、磷酸化、异戊二烯化、S-亚硝基化、硫酸化、苏素化和泛素化组成的组。
7.根据权利要求1-6中任一项所述的方法,其中(i)包括:
(a)提供细胞群;
(b)裂解所述细胞群以产生包含在所述细胞群中表达的多肽的裂解样品;和
(c)从所述裂解样品中分离多肽子集,从而产生包含在所述细胞群中表达的多肽子集的富集样品。
8.根据权利要求7所述的方法,其中(a)的细胞群:
由单个细胞组成;
包含多个同质细胞;或
包含多个异质细胞。
9.根据权利要求7或8所述的方法,其中(c)包括:
i.使所述裂解样品与多个富集分子接触,其中所述多个富集分子中的至少富集分子的子集与所述裂解样品中的多肽子集结合,从而产生结合的多肽子集和未结合的多肽子集;和
ii.分离所述结合的多肽子集或所述未结合的多肽子集。
10.根据权利要求9所述的方法,其中:
所述多个富集分子中的每个富集分子是抗体、适体或酶;或
所述多个富集分子的子集中的富集分子包含抗体、适体或酶。
11.根据权利要求9或10所述的方法,其中:
所述多个富集分子中的每个富集分子均与基质结合;或
所述多个富集分子的子集中的富集分子与基质结合。
12.根据权利要求11所述的方法,其中当包含多个多肽的所述裂解样品接触所述基质时,发生所述多个多肽与所述多个富集分子的接触。
13.根据权利要求11或12所述的方法,其中所述基质选自由表面、珠粒、颗粒和凝胶组成的组,任选地其中:
所述表面是固体表面;
所述珠粒是磁珠;或
所述颗粒是磁性颗粒。
14.根据权利要求9-13中任一项所述的方法,其中:
所述多个富集分子中的每个富集分子与两个或更多个包含不同氨基酸序列的多肽结合;或
所述多个富集分子的子集中的富集分子与两个或更多个包含不同氨基酸序列的多肽结合。
15.根据权利要求9-14中任一项所述的方法,其中:
所述多个富集分子中的每个富集分子与氨基酸翻译后修饰结合;或
所述多个富集分子的子集中的富集分子与氨基酸翻译后修饰结合。
16.根据权利要求15所述的方法,其中所述翻译后修饰选自由乙酰化、ADP-核糖基化、半胱天冬酶裂解、瓜氨酸化、甲酰化、羟基化、甲基化、肉豆蔻酰化、N-连接糖基化、类泛素化、硝化、O-连接糖基化、氧化、棕榈酰化、磷酸化、异戊二烯化、S-亚硝基化、硫酸化、苏素化和泛素化组成的组。
17.根据权利要求15或16所述的方法,其中所述多个富集分子的第一子集中的富集分子与第一翻译后修饰结合,并且所述多个富集分子的第二子集中的富集分子与第二翻译后修饰结合。
18.根据权利要求1-17中任一项所述的方法,其中将(iii)中产生的所述多肽片段合并为单个样品后进行(iv)中的测序。
19.根据权利要求1-18中任一项所述的方法,其中(iv)中的测序包括:
(a)使多肽片段与一种或多种末端氨基酸识别分子接触;和
(b)检测指示一种或多种末端氨基酸识别分子与在多肽被降解时暴露在多肽片段末端的连续氨基酸结合的一系列信号脉冲,从而对所述多肽片段进行测序。
20.根据权利要求1-18中任一项所述的方法,其中(iv)中的测序包括:
(a)使多肽片段与包含一种或多种末端氨基酸识别分子和裂解试剂的组合物接触;和
(b)在所述裂解试剂存在下检测指示所述一种或多种末端氨基酸识别分子与多肽片段末端结合的一系列信号脉冲,其中所述一系列信号脉冲指示由于末端氨基酸被裂解试剂裂解而随时间暴露在末端的一系列氨基酸。
21.根据权利要求1-18中任一项所述的方法,其中(iv)中的测序包括:
(a)鉴定多肽片段末端的第一个氨基酸;
(b)去除所述第一个氨基酸以暴露多肽片段末端的第二个氨基酸;和
(c)鉴定多肽片段末端的所述第二个氨基酸,
其中(a)-(c)在单一反应混合物中进行。
22.根据权利要求1-18中任一项所述的方法,其中(iv)中的测序包括:
(a)使多肽片段与一种或多种与多肽片段结合的氨基酸识别分子接触;
(b)在多肽降解条件下检测指示所述一种或多种氨基酸识别分子与所述多肽片段结合的一系列信号脉冲;和
(c)基于所述一系列信号脉冲中的第一特征模式鉴定所述多肽片段中的第一类型氨基酸。
23.根据权利要求1-18中任一项所述的方法,其中(iv)中的测序包括:
(a)在多肽降解过程中获得数据;
(b)分析所述数据以确定对应于在降解过程中在多肽末端依次暴露的氨基酸的数据部分;和
(c)输出代表所述多肽的氨基酸序列。
24.根据权利要求1-18中任一项所述的方法,其中(iv)中的测序包括:
(a)使多肽片段与一种或多种标记的亲和试剂接触,所述亲和试剂在多肽片段末端选择性结合一种或多种类型的末端氨基酸;和
(b)通过检测所述多肽片段与所述一种或多种标记的亲和试剂的相互作用来鉴定多肽片段末端的末端氨基酸。
25.根据权利要求1-18中任一项所述的方法,其中(iv)中的测序包括:
(a)使多肽片段与一种或多种标记的亲和试剂接触,所述亲和试剂在多肽片段末端选择性结合一种或多种类型的末端氨基酸;
(b)通过检测所述多肽片段与所述一种或多种标记的亲和试剂的相互作用来鉴定多肽末端的末端氨基酸;
(c)去除所述末端氨基酸;和
(d)在多肽片段末端重复(a)-(c)一次或多次以确定所述多肽片段的氨基酸序列。
26.根据权利要求25所述的方法,其中所述方法进一步包括:
在(a)之后和(b)之前,去除未选择性结合所述末端氨基酸的一种或多种标记的亲和试剂中的任意一种;和/或
在(b)之后和(c)之前,去除选择性结合所述末端氨基酸的一种或多种标记的亲和试剂中的任意一种。
27.根据权利要求25或26所述的方法,其中(c)包括通过使所述末端氨基酸与异硫氰酸酯接触来修饰所述末端氨基酸,并且:
使经修饰的末端氨基酸与特异性结合并去除经修饰的末端氨基酸的蛋白酶接触;或
使经修饰的末端氨基酸经受足以去除经修饰的末端氨基酸的酸性或碱性条件。
28.根据权利要求25所述的方法,其中鉴定所述末端氨基酸包括:
将所述末端氨基酸鉴定为与一种或多种标记的亲和试剂结合的一种或多种类型的末端氨基酸中的一种类型;或
将所述末端氨基酸鉴定为与一种或多种标记的亲和试剂结合的一种或多种类型的末端氨基酸之外的类型。
29.根据权利要求25所述的方法,其中所述一种或多种标记的亲和试剂包括一种或多种标记的适体、一种或多种标记的肽酶、一种或多种标记的抗体、一种或多种标记的降解途径蛋白、一种或多种氨基转移酶、一种或多种tRNA合成酶或其组合。
30.根据权利要求29所述的方法,其中所述一种或多种标记的肽酶已被修饰以使裂解活性失活;或其中所述一种或多种标记的肽酶保留用于去除(c)的裂解活性。
31.一种方法,所述方法包括:
(i)提供包含多肽群的富集样品;
(ii)将所述富集样品分成两个或更多个子样品;
(iii)使至少两个子样品中各自与不同的修饰剂接触,其中每种修饰剂包括裂解剂,从而产生具有裂解模式组合的多肽片段;和
(iv)使所述多肽片段与包含多个条形码分子的独特条形码组分接触,从而产生包含条形码多肽的样品;
(v)将包含所述条形码多肽的样品与一种或多种补充样品组合以产生多重样品;和
(vi)对所述多重样品的多肽进行并行测序。
32.根据权利要求31所述的方法,其中(vi)包括:
(a)检测所述多重样品的条形码多肽的条形码身份;和
(b)确定(iii)的多肽片段的氨基酸序列;
其中(a)在(b)之前、之后或与之同时发生。
33.根据权利要求32所述的方法,其中所述条形码身份通过DNA测序、多肽测序、杂交、发光、结合动力学和/或固体基质上或固体基质内的物理位置来检测。
34.根据权利要求32或33所述的方法,其中(vi)进一步包括:
(c)根据检测到的条形码将所述氨基酸序列进行分组,其中每组中的氨基酸序列对应于具有相同来源的多肽。
35.根据权利要求34所述的方法,进一步包括:
(vii)通过比对(vi)中确定的多肽片段的氨基酸序列来重建(i)中的多肽序列。
36.根据权利要求35所述的方法,进一步包括:
(viii)鉴定所述多重样品中的多肽变体或确认其中不存在多肽变体。
37.根据权利要求36所述的方法,其中(viii)中的多肽变体包含可变剪接位点、氨基酸插入、氨基酸缺失、氨基酸取代和/或氨基酸化学修饰。
38.根据权利要求37所述的方法,其中所述氨基酸化学修饰是翻译后修饰。
39.根据权利要求38所述的方法,其中所述化学修饰选自由乙酰化、ADP-核糖基化、半胱天冬酶裂解、瓜氨酸化、甲酰化、羟基化、甲基化、肉豆蔻酰化、N-连接糖基化、类泛素化、硝化、O-连接糖基化、氧化、棕榈酰化、磷酸化、异戊二烯化、S-亚硝基化、硫酸化、苏素化和泛素化组成的组。
40.根据权利要求31-39中任一项所述的方法,其中(i)包括:
(a)提供细胞群;
(b)裂解所述细胞群以产生包含在所述细胞群中表达的多肽的裂解样品;和
(c)从所述裂解样品中分离多肽子集,从而产生包含在所述细胞群中表达的多肽子集的富集样品。
41.根据权利要求40所述的方法,其中(a)的细胞群:
由单个细胞组成;
包含多个同质细胞;或
包含多个异质细胞。
42.根据权利要求40或41所述的方法,其中(c)包括:
i.使所述裂解样品与多个富集分子接触,其中所述多个富集分子中的至少富集分子的子集与所述裂解样品中的多肽子集结合,从而产生结合的多肽子集和未结合的多肽子集;和
ii.分离所述结合的多肽子集或所述未结合的多肽子集。
43.根据权利要求42所述的方法,其中:
所述多个富集分子中的每个富集分子是抗体、适体或酶;或
所述多个富集分子的子集中的富集分子包含抗体、适体或酶。
44.根据权利要求42或43所述的方法,其中:
所述多个富集分子中的每个富集分子均与基质结合;或
所述多个富集分子的子集中的富集分子与基质结合。
45.根据权利要求44所述的方法,其中当包含多个多肽的裂解样品接触所述基质时,发生所述多个多肽与所述多个富集分子的接触。
46.根据权利要求44或45所述的方法,其中所述基质选自由由表面、珠粒、颗粒和凝胶组成的组,任选地其中:
所述表面是固体表面;
所述珠粒是磁珠;或
所述颗粒是磁性颗粒。
47.根据权利要求42-46中任一项所述的方法,其中:
所述多个富集分子中的每个富集分子与两个或更多个包含不同氨基酸序列的多肽结合;或
所述多个富集分子的子集中的富集分子与两个或更多个包含不同氨基酸序列的多肽结合。
48.根据权利要求42-47中任一项所述的方法,其中:
所述多个富集分子中的每个富集分子与氨基酸翻译后修饰结合;或
所述多个富集分子的子集中的富集分子与氨基酸翻译后修饰结合。
49.根据权利要求48所述的方法,其中所述翻译后修饰选自由乙酰化、ADP-核糖基化、半胱天冬酶裂解、瓜氨酸化、甲酰化、羟基化、甲基化、肉豆蔻酰化、N-连接糖基化、类泛素化、硝化、O-连接糖基化、氧化、棕榈酰化、磷酸化、异戊二烯化、S-亚硝基化、硫酸化、苏素化和泛素化组成的组。
50.根据权利要求48或49所述的方法,其中所述多个富集分子的第一子集中的富集分子与第一翻译后修饰结合,并且所述多个富集分子的第二子集中的富集分子与第二翻译后修饰结合。
51.根据权利要求31-50中任一项所述的方法,其中(iv)的所述独特条形码组分包括包含多核酸部分的条形码分子。
52.根据权利要求51所述的方法,其中所述多核酸部分的长度为8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个核苷酸。
53.根据权利要求51所述的方法,其中所述多核酸部分包含适体的核苷酸序列。
54.根据权利要求31-53中任一项所述的方法,其中(iv)的独特条形码组分包括包含多肽部分的条形码分子。
55.根据权利要求54所述的方法,其中所述多肽部分的长度为6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸。
56.根据权利要求54所述的方法,其中所述多肽部分包含抗体或适体的氨基酸序列。
57.根据权利要求31-56中任一项所述的方法,其中(iv)的独特条形码组分包括包含荧光分子部分的条形码分子。
58.根据权利要求57所述的方法,其中所述荧光分子部分包含芳族或杂芳族化合物,例如芘、蒽、萘、吖啶、芪、吲哚、苯并吲哚、恶唑、咔唑、噻唑、苯并噻唑、菲啶、吩恶嗪、卟啉、喹啉、乙锭、苯甲酰胺、花青、羰花青、水杨酸盐、邻氨基苯甲酸盐、香豆素、荧光素、罗丹明等。
59.根据权利要求57或58所述的方法,其中所述荧光分子部分包含选自由以下组成的组的染料:氧杂蒽染料、萘染料、香豆素染料、吖啶染料、花青染料、苯并恶唑染料、芪染料、芘染料、酞菁染料、藻胆蛋白染料、方酸染料和BODIPY染料。
60.根据权利要求31-59中任一项所述的方法,其中将(iii)中产生的所述多肽片段合并为单一样品,再将所述多肽与(iv)中的独特条形码组分接触。
61.根据权利要求31-60中任一项所述的方法,其中(v)中的至少一种补充样品通过包括以下的方法制备:
(a)提供多肽群;和
(b)使(a)中的所述多肽群与包含多个条形码分子的独特条形码组分接触,从而产生包含条形码多肽的子样品。
62.根据权利要求31-61中任一项所述的方法,其中(vi)中的测序包括:
(a)使所述多重样品的多肽与一种或多种末端氨基酸识别分子接触;和
(b)检测指示所述一种或多种末端氨基酸识别分子与在多肽被降解时暴露在单个多肽末端的连续氨基酸结合的一系列信号脉冲,从而对所述多肽进行测序。
63.根据权利要求31-61中任一项所述的方法,其中(vi)中的测序包括:
(a)使所述多重样品的多肽与包含一种或多种末端氨基酸识别分子和裂解试剂的组合物接触;和
(b)在所述裂解试剂存在下检测指示所述一种或多种末端氨基酸识别分子与多肽末端结合的一系列信号脉冲,其中所述一系列信号脉冲指示由于末端氨基酸被裂解试剂裂解而随时间暴露在末端的一系列氨基酸。
64.根据权利要求31-61中任一项所述的方法,其中(vi)中的测序包括:
(a)鉴定所述多重样品的多肽末端的第一个氨基酸;
(b)去除所述第一个氨基酸以暴露多肽末端的第二个氨基酸,和
(c)鉴定多肽末端的所述第二个氨基酸,
其中(a)-(c)在单一反应混合物中进行。
65.根据权利要求31-61中任一项所述的方法,其中(vi)中的测序包括:
(a)使所述多重样品的多肽与一种或多种与所述多肽结合的氨基酸识别分子接触;
(b)在多肽降解条件下检测指示所述一种或多种氨基酸识别分子与所述多肽结合的一系列信号脉冲;和
(c)基于所述一系列信号脉冲中的第一特征模式鉴定所述多肽中的第一类型氨基酸。
66.根据权利要求31-61中任一项所述的方法,其中(vi)中的测序包括:
(a)在多肽降解过程中获得数据;
(b)分析所述数据以确定对应于在降解过程中在多肽末端依次暴露的氨基酸的数据部分;和
(c)输出代表所述多肽的氨基酸序列。
67.根据权利要求31-61中任一项所述的方法,其中(vi)中的测序包括:
(a)使所述多重样品的多肽与一种或多种标记的亲和试剂接触,所述亲和试剂选择性结合多肽末端的一种或多种类型的末端氨基酸;和
(b)通过检测所述多肽与所述一种或多种标记的亲和试剂的相互作用来鉴定所述多肽末端的末端氨基酸。
68.根据权利要求31-61中任一项所述的方法,其中(vi)中的测序包括:
(a)使所述多重样品中的多肽与一种或多种标记的亲和试剂接触,所述亲和试剂选择性结合多肽末端的一种或多种类型的末端氨基酸;
(b)通过检测所述多肽片段与所述一种或多种标记的亲和试剂的相互作用来鉴定所述多肽末端的末端氨基酸;
(c)去除所述末端氨基酸;和
(d)在多肽末端重复(a)-(c)一次或多次以确定所述多肽的氨基酸序列。
69.根据权利要求68所述的方法,其中所述方法进一步包括:
在(a)之后和(b)之前,去除未选择性结合所述末端氨基酸的一种或多种标记的亲和试剂中的任意一种;和/或
在(b)之后和(c)之前,去除选择性结合所述末端氨基酸的一种或多种标记的亲和试剂中的任意一种。
70.根据权利要求68所述的方法,其中(c)包括通过使所述末端氨基酸与异硫氰酸酯接触来修饰所述末端氨基酸,并且:
使经修饰的末端氨基酸与特异性结合并去除经修饰的末端氨基酸的蛋白酶接触;或
使经修饰的末端氨基酸经受足以去除经修饰的末端氨基酸的酸性或碱性条件。
71.根据权利要求68所述的方法,其中鉴定所述末端氨基酸包括:
将所述末端氨基酸鉴定为与所述一种或多种标记的亲和试剂结合的一种或多种类型的末端氨基酸中的一种类型;或
将所述末端氨基酸鉴定为与所述一种或多种标记的亲和试剂结合的一种或多种类型的末端氨基酸之外的类型。
72.根据权利要求68所述的方法,其中所述一种或多种标记的亲和试剂包括一种或多种标记的适体、一种或多种标记的肽酶、一种或多种标记的抗体、一种或多种标记的降解途径蛋白、一种或多种氨基转移酶、一种或多种tRNA合成酶或其组合。
73.根据权利要求72所述的方法,其中所述一种或多种标记的肽酶已被修饰以使裂解活性失活;或其中所述一种或多种标记的肽酶保留用于去除(c)的裂解活性。
74.一种用于实施根据权利要求1-73中任一项所述的方法的试剂盒,其中所述试剂盒包含多个富集分子。
75.根据权利要求74所述的试剂盒,其中所述多个富集分子中的每个富集分子包含抗体、适体或酶。
76.根据权利要求74所述的试剂盒,其中所述多个富集分子的子集中的富集分子包含抗体、适体或酶。
77.根据权利要求74-76中任一项所述的试剂盒,进一步包含修饰剂。
78.根据权利要求77所述的试剂盒,其中所述修饰剂介导多肽片段化、多肽变性、翻译后修饰的添加和/或一种或多种官能团的封闭。
79.根据权利要求74-78中任一项所述的试剂盒,进一步包含标记的亲和试剂。
80.根据权利要求79所述的试剂盒,其中所述标记的亲和试剂包括一种或多种标记的适体、一种或多种标记的肽酶、一种或多种标记的抗体、一种或多种标记的降解途径蛋白、一种或多种氨基转移酶、一种或多种tRNA合成酶或其组合。
81.根据权利要求74-80中任一项所述的试剂盒,进一步包含条形码组分,所述条形码组分包含多个条形码分子。
82.根据权利要求81所述的试剂盒,其中所述条形码组分进一步包含反应组分,所述反应组分包含用于将条形码分子共价连接至多肽的一种或多种试剂。
83.根据权利要求81或82所述的试剂盒,其中所述条形码组分包含一种或多种条形码分子,所述条形码分子包含多核酸部分、多肽部分和/或荧光分子部分。
84.根据权利要求83所述的试剂盒,其中所述多核酸部分的长度为8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个核苷酸。
85.根据权利要求83所述的试剂盒,其中所述多核酸部分包含适体。
86.根据权利要求83所述的试剂盒,其中所述多肽部分的长度为6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸。
87.根据权利要求83所述的试剂盒,其中所述多肽部分是抗体或适体。
88.根据权利要求83所述的试剂盒,其中所述荧光分子部分包含芳族或杂芳族化合物,例如芘、蒽、萘、吖啶、芪、吲哚、苯并吲哚、恶唑、咔唑、噻唑、苯并噻唑、菲啶、吩恶嗪、卟啉、喹啉、乙锭、苯甲酰胺、花青、羰花青、水杨酸盐、邻氨基苯甲酸盐、香豆素、荧光素、罗丹明等。
89.根据权利要求83或88所述的试剂盒,其中所述荧光分子部分包含选自由以下组成的组的染料:氧杂蒽染料、萘染料、香豆素染料、吖啶染料、花青染料、苯并恶唑染料、芪染料、芘染料、酞菁染料、藻胆蛋白染料、方酸染料和BODIPY染料。
90.根据权利要求74-89中任一项所述的试剂盒,进一步包含固体支持物。
91.根据权利要求90所述的试剂盒,其中所述固体支持物包含固定的检测分子,所述检测分子包含对应于所述条形码组分的条形码分子的多核酸部分。
92.根据权利要求90或91所述的试剂盒,其中所述固体支持物包含固定的检测分子,所述检测分子包含对应于所述条形码组分的条形码分子的多肽部分。
93.一种用于实施根据权利要求1-73中任一项所述的方法的试剂盒,其中所述试剂盒包含允许物理分离不同来源的多肽群的固体支持物。
94.一种装置,所述装置包括:
至少一个硬件处理器;和
至少一个存储处理器可执行指令的非暂时性计算机可读存储介质,所述处理器可执行指令在被所述至少一个硬件处理器执行时使所述至少一个硬件处理器执行根据权利要求1-73中任一项所述的方法。
95.至少一个存储处理器可执行指令的非暂时性计算机可读存储介质,所述处理器可执行指令在由至少一个硬件处理器执行时使所述至少一个硬件处理器执行根据权利要求1-73中任一项所述的方法。
96.一种装置,所述装置包含被设置为与一个或多个盒接合的样品制备模块,每个盒包括:(a)一个或多个储存器或反应容器,其被设置为接收复杂样品;(b)一种或多种序列样品制备试剂,其中所述样品制备试剂包含多个条形码分子;和(c)基质,其包含一种或多种固定化的捕获探针。
97.根据权利要求96所述的装置,其中所述样品制备试剂进一步包含多个富集分子。
98.根据权利要求97所述的装置,其中所述多个富集分子中的至少富集分子的子集共价连接至固定化的捕获探针。
99.根据权利要求97或98所述的装置,其中至少富集分子的子集共价连接至能够被固定化的捕获探针结合的珠粒或颗粒。
100.根据权利要求97-99中任一项所述的装置,其中所述多个富集分子中的每个富集分子包含抗体、适体或酶。
101.根据权利要求97-99中任一项所述的装置,其中所述多个富集分子的子集中的富集分子包含抗体、适体或酶。
102.根据权利要求96-101中任一项所述的装置,其中所述样品制备试剂包括修饰剂。
103.根据权利要求102所述的装置,其中所述修饰剂介导多肽片段化、多肽变性、翻译后修饰的添加和/或一种或多种官能团的封闭。
104.根据权利要求96-103中任一项所述的装置,进一步包含测序模块,所述测序模块包含像素阵列,其中每个像素被设置为从所述样品制备模块接收测序样品并且包含:(a)样品孔;(b)至少一个光检测器。
105.根据权利要求104所述的装置,其中所述测序模块进一步包含储存器或反应容器,所述储存器或反应容器被设置为将测序试剂递送到每个像素的样品孔中。
106.根据权利要求105所述的装置,其中所述测序试剂包括标记的亲和试剂。
107.根据权利要求106所述的装置,其中所述标记的亲和试剂包含一种或多种标记的适体、一种或多种标记的肽酶、一种或多种标记的抗体、一种或多种标记的降解途径蛋白、一种或多种氨基转移酶、一种或多种tRNA合成酶或其组合。
CN202080090914.5A 2019-10-28 2020-10-28 单个多肽测序和重建的方法 Pending CN114929887A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962927005P 2019-10-28 2019-10-28
US62/927,005 2019-10-28
US201962940968P 2019-11-27 2019-11-27
US62/940,968 2019-11-27
PCT/US2020/057669 WO2021086918A1 (en) 2019-10-28 2020-10-28 Methods of single-polypeptide sequencing and reconstruction

Publications (1)

Publication Number Publication Date
CN114929887A true CN114929887A (zh) 2022-08-19

Family

ID=73476267

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080090914.5A Pending CN114929887A (zh) 2019-10-28 2020-10-28 单个多肽测序和重建的方法

Country Status (10)

Country Link
US (1) US20210148922A1 (zh)
EP (1) EP4051806A1 (zh)
JP (1) JP2023501932A (zh)
KR (1) KR20220108056A (zh)
CN (1) CN114929887A (zh)
AU (1) AU2020376814A1 (zh)
BR (1) BR112022007937A2 (zh)
CA (1) CA3159362A1 (zh)
MX (1) MX2022005094A (zh)
WO (1) WO2021086918A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201715684D0 (en) * 2017-09-28 2017-11-15 Univ Gent Means and methods for single molecule peptide sequencing
CA3117889A1 (en) 2018-11-15 2020-05-22 Quantum-Si Incorporated Methods and compositions for protein sequencing
WO2023038859A1 (en) * 2021-09-09 2023-03-16 Nautilus Biotechnology, Inc. Characterization and localization of protein modifications
US20230194539A1 (en) * 2021-12-22 2023-06-22 Trustees Of Boston University Bodipy-based dyes for digital spatial proteomics
WO2024086832A1 (en) * 2022-10-21 2024-04-25 Quantum-Si Incorporated Polypeptide cleaving reagents and uses thereof

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2496294A1 (en) 2005-02-07 2006-08-07 The University Of British Columbia Apparatus and methods for concentrating and separating particles such as molecules
DE602008000796D1 (de) * 2008-01-15 2010-04-22 Univ Utrecht Holding Bv Verfahren zur Bestimmung der Aminosäurensequenz von Peptiden
CA2745197A1 (en) * 2008-12-01 2010-06-10 Research Triangle Institute Concurrent identification of multitudes of polypeptides
WO2010065531A1 (en) * 2008-12-01 2010-06-10 Robi David Mitra Single molecule protein screening
US9435810B2 (en) * 2013-03-15 2016-09-06 Washington University Molecules and methods for iterative polypeptide analysis and processing
US10545153B2 (en) * 2014-09-15 2020-01-28 Board Of Regents, The University Of Texas System Single molecule peptide sequencing
WO2019089846A1 (en) * 2017-10-31 2019-05-09 Encodia, Inc. Methods and compositions for polypeptide analysis
CA3081441C (en) * 2017-10-31 2023-08-29 Encodia, Inc. Kits for analysis using nucleic acid encoding and/or label
CN112513269A (zh) * 2018-07-12 2021-03-16 德克萨斯大学系统董事会 通过寡核苷酸进行分子邻域检测
SG11202100740YA (en) * 2018-08-17 2021-02-25 Regeneron Pharma Methods for de novo protein sequencing

Also Published As

Publication number Publication date
EP4051806A1 (en) 2022-09-07
BR112022007937A2 (pt) 2022-08-30
MX2022005094A (es) 2022-08-15
WO2021086918A1 (en) 2021-05-06
CA3159362A1 (en) 2021-05-06
KR20220108056A (ko) 2022-08-02
JP2023501932A (ja) 2023-01-20
AU2020376814A1 (en) 2022-06-02
US20210148922A1 (en) 2021-05-20

Similar Documents

Publication Publication Date Title
US11959920B2 (en) Methods and compositions for protein sequencing
CN114929887A (zh) 单个多肽测序和重建的方法
CN114929897A (zh) 制备用于多肽测序的富集样品的方法
US20210364527A1 (en) Methods and compositions for protein sequencing
CN114929888A (zh) 制备用于多重多肽测序的样品的方法、试剂盒和装置
CN114981448A (zh) 单细胞蛋白质和核酸测序的方法
US12000835B2 (en) Methods and compositions for protein sequencing
US20230221330A1 (en) Labeled binding reagents and methods of use thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination