JP2022537448A - 病態特異的抗原を同定するためのイムノームワイド関連研究 - Google Patents
病態特異的抗原を同定するためのイムノームワイド関連研究 Download PDFInfo
- Publication number
- JP2022537448A JP2022537448A JP2021576239A JP2021576239A JP2022537448A JP 2022537448 A JP2022537448 A JP 2022537448A JP 2021576239 A JP2021576239 A JP 2021576239A JP 2021576239 A JP2021576239 A JP 2021576239A JP 2022537448 A JP2022537448 A JP 2022537448A
- Authority
- JP
- Japan
- Prior art keywords
- antigen
- cohort
- mer
- disease
- enrichment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108091007433 antigens Proteins 0.000 title claims abstract description 233
- 102000036639 antigens Human genes 0.000 title claims abstract description 233
- 239000000427 antigen Substances 0.000 title claims abstract description 230
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 184
- 201000010099 disease Diseases 0.000 title claims abstract description 174
- 238000000034 method Methods 0.000 claims abstract description 151
- 230000000890 antigenic effect Effects 0.000 claims abstract description 80
- 210000002966 serum Anatomy 0.000 claims abstract description 42
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 169
- 108090000623 proteins and genes Proteins 0.000 claims description 118
- 102000004169 proteins and genes Human genes 0.000 claims description 115
- 239000000523 sample Substances 0.000 claims description 101
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 73
- 206010028980 Neoplasm Diseases 0.000 claims description 24
- 238000003860 storage Methods 0.000 claims description 24
- 108010026552 Proteome Proteins 0.000 claims description 22
- 201000011510 cancer Diseases 0.000 claims description 21
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 16
- 239000003550 marker Substances 0.000 claims description 16
- 208000015181 infectious disease Diseases 0.000 claims description 14
- 238000012937 correction Methods 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 13
- 208000023275 Autoimmune disease Diseases 0.000 claims description 11
- 239000003814 drug Substances 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 8
- 208000035473 Communicable disease Diseases 0.000 claims description 7
- 229940124597 therapeutic agent Drugs 0.000 claims description 7
- 208000017667 Chronic Disease Diseases 0.000 claims description 6
- 208000012902 Nervous system disease Diseases 0.000 claims description 6
- 238000007619 statistical method Methods 0.000 claims description 6
- 229940021747 therapeutic vaccine Drugs 0.000 claims description 5
- 108091023037 Aptamer Proteins 0.000 claims description 4
- 239000012472 biological sample Substances 0.000 claims description 4
- 239000012474 protein marker Substances 0.000 claims description 4
- 239000000203 mixture Substances 0.000 abstract description 26
- 235000018102 proteins Nutrition 0.000 description 103
- 150000007523 nucleic acids Chemical class 0.000 description 56
- 150000001413 amino acids Chemical group 0.000 description 47
- 230000014509 gene expression Effects 0.000 description 33
- 239000013598 vector Substances 0.000 description 31
- 210000004027 cell Anatomy 0.000 description 26
- 108091028043 Nucleic acid sequence Proteins 0.000 description 23
- 238000007481 next generation sequencing Methods 0.000 description 22
- 108010067902 Peptide Library Proteins 0.000 description 21
- 238000011282 treatment Methods 0.000 description 18
- 230000000875 corresponding effect Effects 0.000 description 17
- 238000012163 sequencing technique Methods 0.000 description 17
- 102100025570 Cancer/testis antigen 1 Human genes 0.000 description 16
- 101000856237 Homo sapiens Cancer/testis antigen 1 Proteins 0.000 description 16
- 238000003556 assay Methods 0.000 description 16
- 238000002965 ELISA Methods 0.000 description 15
- 108020004707 nucleic acids Proteins 0.000 description 14
- 102000039446 nucleic acids Human genes 0.000 description 14
- 241000282414 Homo sapiens Species 0.000 description 12
- 239000011324 bead Substances 0.000 description 12
- 241000701074 Human alphaherpesvirus 2 Species 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 11
- 201000001441 melanoma Diseases 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 10
- 208000035475 disorder Diseases 0.000 description 10
- 238000003908 quality control method Methods 0.000 description 10
- 102100022742 Lupus La protein Human genes 0.000 description 9
- 239000000090 biomarker Substances 0.000 description 9
- 230000004044 response Effects 0.000 description 9
- 239000002773 nucleotide Substances 0.000 description 8
- 125000003729 nucleotide group Chemical group 0.000 description 8
- 108091093088 Amplicon Proteins 0.000 description 7
- 241000588724 Escherichia coli Species 0.000 description 7
- 238000002955 isolation Methods 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 101710126499 Envelope glycoprotein E Proteins 0.000 description 6
- UGJBHEZMOKVTIM-UHFFFAOYSA-N N-formylglycine Chemical compound OC(=O)CNC=O UGJBHEZMOKVTIM-UHFFFAOYSA-N 0.000 description 6
- 208000021386 Sjogren Syndrome Diseases 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 238000003491 array Methods 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 6
- 238000005119 centrifugation Methods 0.000 description 6
- 238000003018 immunoassay Methods 0.000 description 6
- 238000002156 mixing Methods 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 102000011682 Centromere Protein A Human genes 0.000 description 5
- 108010076303 Centromere Protein A Proteins 0.000 description 5
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 5
- 229960005091 chloramphenicol Drugs 0.000 description 5
- 239000000470 constituent Substances 0.000 description 5
- UQLDLKMNUJERMK-UHFFFAOYSA-L di(octadecanoyloxy)lead Chemical compound [Pb+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O UQLDLKMNUJERMK-UHFFFAOYSA-L 0.000 description 5
- 230000007170 pathology Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 238000002255 vaccination Methods 0.000 description 5
- 108020004414 DNA Proteins 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 208000030852 Parasitic disease Diseases 0.000 description 4
- 206010060862 Prostate cancer Diseases 0.000 description 4
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 4
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 4
- 238000002819 bacterial display Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 238000002826 magnetic-activated cell sorting Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 241001515965 unidentified phage Species 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 208000035143 Bacterial infection Diseases 0.000 description 3
- 101710126486 Envelope glycoprotein D Proteins 0.000 description 3
- 101000972485 Homo sapiens Lupus La protein Proteins 0.000 description 3
- 206010020751 Hypersensitivity Diseases 0.000 description 3
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 3
- NQTADLQHYWFPDB-UHFFFAOYSA-N N-Hydroxysuccinimide Chemical compound ON1C(=O)CCC1=O NQTADLQHYWFPDB-UHFFFAOYSA-N 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 208000036142 Viral infection Diseases 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 150000001299 aldehydes Chemical group 0.000 description 3
- 125000002355 alkine group Chemical group 0.000 description 3
- 230000007815 allergy Effects 0.000 description 3
- 150000001412 amines Chemical class 0.000 description 3
- 230000001363 autoimmune Effects 0.000 description 3
- 230000005784 autoimmunity Effects 0.000 description 3
- 208000022362 bacterial infectious disease Diseases 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 230000009257 reactivity Effects 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 150000003573 thiols Chemical class 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 230000009385 viral infection Effects 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 2
- 208000024172 Cardiovascular disease Diseases 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- 108010033276 Peptide Fragments Proteins 0.000 description 2
- 102000007079 Peptide Fragments Human genes 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 230000000172 allergic effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 2
- SRBFZHDQGSBBOR-KLVWXMOXSA-N beta-L-arabinopyranose Chemical compound O[C@H]1CO[C@H](O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-KLVWXMOXSA-N 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000002458 infectious effect Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000007885 magnetic separation Methods 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 230000001613 neoplastic effect Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000003071 parasitic effect Effects 0.000 description 2
- 239000013610 patient sample Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 238000000528 statistical test Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 230000004797 therapeutic response Effects 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 229960005486 vaccine Drugs 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- 208000023328 Basedow disease Diseases 0.000 description 1
- 241000589969 Borreliella burgdorferi Species 0.000 description 1
- 206010008874 Chronic Fatigue Syndrome Diseases 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 208000015943 Coeliac disease Diseases 0.000 description 1
- 241000761389 Copa Species 0.000 description 1
- 208000011231 Crohn disease Diseases 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 101710121417 Envelope glycoprotein Proteins 0.000 description 1
- 241001125671 Eretmochelys imbricata Species 0.000 description 1
- 206010016946 Food allergy Diseases 0.000 description 1
- 206010017533 Fungal infection Diseases 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108010068370 Glutens Proteins 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 208000015023 Graves' disease Diseases 0.000 description 1
- 241000590002 Helicobacter pylori Species 0.000 description 1
- 208000005176 Hepatitis C Diseases 0.000 description 1
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- 102100034349 Integrase Human genes 0.000 description 1
- 238000001276 Kolmogorov–Smirnov test Methods 0.000 description 1
- 208000016604 Lyme disease Diseases 0.000 description 1
- 208000031888 Mycoses Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 208000008267 Peanut Hypersensitivity Diseases 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000194022 Streptococcus sp. Species 0.000 description 1
- 241000244157 Taenia solium Species 0.000 description 1
- 241000244030 Toxocara canis Species 0.000 description 1
- 241000223997 Toxoplasma gondii Species 0.000 description 1
- 241000223109 Trypanosoma cruzi Species 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 241000907316 Zika virus Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 238000003314 affinity selection Methods 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 239000013566 allergen Substances 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 201000011529 cardiovascular cancer Diseases 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 201000003486 coccidioidomycosis Diseases 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012631 diagnostic technique Methods 0.000 description 1
- 230000009274 differential gene expression Effects 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 208000030172 endocrine system disease Diseases 0.000 description 1
- 238000010201 enrichment analysis Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 235000021312 gluten Nutrition 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 229940037467 helicobacter pylori Drugs 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 235000020256 human milk Nutrition 0.000 description 1
- 210000004251 human milk Anatomy 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 101150023497 mcrA gene Proteins 0.000 description 1
- 238000010907 mechanical stirring Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 208000029766 myalgic encephalomeyelitis/chronic fatigue syndrome Diseases 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000000926 neurological effect Effects 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- PXHVJJICTQNCMI-UHFFFAOYSA-N nickel Substances [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 1
- 231100000989 no adverse effect Toxicity 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 201000010853 peanut allergy Diseases 0.000 description 1
- 239000000863 peptide conjugate Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 230000003334 potential effect Effects 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- 101150098466 rpsL gene Proteins 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000007862 touchdown PCR Methods 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 239000012137 tryptone Substances 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
- 239000012130 whole-cell lysate Substances 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
- G16B35/20—Screening of libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/40—ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Epidemiology (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Genetics & Genomics (AREA)
- Library & Information Science (AREA)
- Medicinal Chemistry (AREA)
- Software Systems (AREA)
- Primary Health Care (AREA)
- Pharmacology & Pharmacy (AREA)
- Toxicology (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Biochemistry (AREA)
- Peptides Or Proteins (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本発明は、疾患または他の病態に特異的な抗原または抗原のエピトープ領域を同定するために使用され得る組成物及び方法を提供する。そのような方法は、抗原マーカーとして疾患または病態に関連して同定された抗原配列の好適性を予測するために病態コホート及び対照コホートのサンプルからの血清抗体に対するk-mer結合統計を組み込む。本明細書には、それを実施するためのシステムも開示される。【選択図】図4
Description
関連出願の相互参照
本出願は、2019年6月21日に出願された米国仮出願第62/864,909号の利益を主張するものであり、その内容はそれらの全体が参照によりそれぞれ組み込まれる。
本出願は、2019年6月21日に出願された米国仮出願第62/864,909号の利益を主張するものであり、その内容はそれらの全体が参照によりそれぞれ組み込まれる。
配列表
本出願は、ASCIIフォーマットで電子的に提出され、参照によりその全体が本明細書に組み込まれる配列表を含む。20XX年、XX月に作成された前記ASCIIコピーは、XXXXX_CRF_sequencelisting.txtと称され、サイズがXX,XXXバイトである。
本出願は、ASCIIフォーマットで電子的に提出され、参照によりその全体が本明細書に組み込まれる配列表を含む。20XX年、XX月に作成された前記ASCIIコピーは、XXXXX_CRF_sequencelisting.txtと称され、サイズがXX,XXXバイトである。
背景
ヒト試料に存在する抗体は、感染性疾患、細菌性疾患、ウイルス性疾患、アレルギー性疾患、寄生虫疾患、及び自己免疫疾患の大規模で広範な群のための主要な分析物及び疾患バイオマーカーとして機能する。そのため、全血、血清、血漿、唾液、尿、及び組織吸引物を含むがこれらに限定されない組織サンプルを使用してヒト疾患を診断するために何百もの異なる抗体検出試験(集合的に「イムノアッセイ」と称される)が開発されてきた。イムノアッセイは、グレーブス病、シェーグレン症候群、セリアック病、クローン病、関節リウマチを含むがこれらに限定されない自己免疫疾患の診断にとって依然として不可欠である。イムノアッセイはまた、ウイルス感染症(例えば、HIV、C型肝炎、HSV-1、ジカウイルス、エプスタインバーウイルスなど)、細菌感染症(例えば、ストレプトコッカスの種(Streptococcus sp.)、ヘリコバクター・ピロリ(Helicobacter pylori)、ボレリア・ブルグドルフェリ(Borrellia burdorferi)(ライム病)など)、真菌感染症(例えば、渓谷熱)、及び寄生虫感染症(例えば、クルーズトリパノソーマ(Trypanosoma cruzi)、トキソプラズマ・ゴンディ(Toxoplasma gondii)、有鉤条虫(Taenia solium)、犬回虫(Toxocara canis)など)を含む感染性疾患を診断するために広く使用されている。さらに、イムノアッセイはしばしば、アレルギー(例えば、ピーナッツアレルギー、母乳、花粉など)を同定し、モニターするために使用される。これらの分野を超えて、イムノアッセイは、神経変性疾患、心臓血管疾患、及びがんの診断にとっての有用性を実証してきた。
ヒト試料に存在する抗体は、感染性疾患、細菌性疾患、ウイルス性疾患、アレルギー性疾患、寄生虫疾患、及び自己免疫疾患の大規模で広範な群のための主要な分析物及び疾患バイオマーカーとして機能する。そのため、全血、血清、血漿、唾液、尿、及び組織吸引物を含むがこれらに限定されない組織サンプルを使用してヒト疾患を診断するために何百もの異なる抗体検出試験(集合的に「イムノアッセイ」と称される)が開発されてきた。イムノアッセイは、グレーブス病、シェーグレン症候群、セリアック病、クローン病、関節リウマチを含むがこれらに限定されない自己免疫疾患の診断にとって依然として不可欠である。イムノアッセイはまた、ウイルス感染症(例えば、HIV、C型肝炎、HSV-1、ジカウイルス、エプスタインバーウイルスなど)、細菌感染症(例えば、ストレプトコッカスの種(Streptococcus sp.)、ヘリコバクター・ピロリ(Helicobacter pylori)、ボレリア・ブルグドルフェリ(Borrellia burdorferi)(ライム病)など)、真菌感染症(例えば、渓谷熱)、及び寄生虫感染症(例えば、クルーズトリパノソーマ(Trypanosoma cruzi)、トキソプラズマ・ゴンディ(Toxoplasma gondii)、有鉤条虫(Taenia solium)、犬回虫(Toxocara canis)など)を含む感染性疾患を診断するために広く使用されている。さらに、イムノアッセイはしばしば、アレルギー(例えば、ピーナッツアレルギー、母乳、花粉など)を同定し、モニターするために使用される。これらの分野を超えて、イムノアッセイは、神経変性疾患、心臓血管疾患、及びがんの診断にとっての有用性を実証してきた。
診断イムノアッセイを開発するために使用されている現在の方法は、アッセイから得られ得る全体的感度及び特異性を制限し、よって、実用性も制限するが、その理由は、それらは、未関連抗体からの交差反応結合をもたらし得る外来抗原物質(すなわち、大型タンパク質、ペプチド、脂質、全細胞溶解物)を含むからである。よって、所与の表現型を有する個体における免疫反応によって最も特異的に認識されるそれらの抗原成分または成分のセットのみを同定及び提示し得る診断技術に対する満たされていないニーズが存在する。
より最近では、所与の病態について対象となる抗原及びエピトープを単離することを試みるタンパク質及びペプチドアレイなどの技術も開発されている。これらのアプローチは、1)抗原が、アレイ上に配置するために事前に知られている必要があり、2)ペプチドが長いほど、非特異的非標的抗体の結合に利用可能な表面が多くなるのでタンパク質またはペプチドは非特異的であり得るため、成功が限られている。このアッセイは、時間がかかり、扱いにくく、ハイスループット分析に適しておらず、ウェットラボアッセイから得られるデータはしばしば、対象となる特定の疾患または病態に制限される。
さらに、自己免疫及びがんの文脈では、シグナルが単一の共有抗原の複数のペプチドにわたって不均一に分散している場合、そのときは抗原にわたる「シグナル」は、所与のエピトープが対象のコホートにわたって共有されていない場合はノイズよりも有意に上昇しない。よって、疾患サンプルのセット対対照サンプルのセットにわたる「シグナル」に注目することを試みる方法は、特定のエピトープが共有されていない場合は、それを同定することができず、抗原もまた、所与のアレイについての抗原に存在するエピトープの不均一性により、共有抗原として潜在的に認識されない。
そのため、例えば、診断、処置療法の予測、または治療剤の同定のために使用され得る、個体の状態を決定するために任意の疾患または病態に対応する抗原配列の可能性のある全ての組み合わせの分析のために使用され得る血清サンプルに対する単一アッセイを実施するための方法が必要とされている。さらに、これらの方法は、抗原の同定において特定のエピトープの同定に制限されるべきではない。
概要
本明細書では、いくつかの実施形態によれば、病態のための抗原マーカーを同定する方法であって、方法は、病態コホート及び比較のための対照コホートを同定すること;前記病態に対応する抗原のセットを提供することであって、各抗原の配列は、部分配列にタイリングされている、提供すること;前記病態コホート及び前記対照コホートの両方についての前記部分配列の各々についての濃縮スコアスコアを提供すること;前記抗原のセットにおける各抗原について、前記抗原内の部分配列についての前記濃縮スコアから前記病態コホート及び前記対照コホートについての前記抗原の抗原スコアを決定すること、及び前記病態コホート及び前記対照コホートについての前記抗原スコアを比較して抗原外れ値スコアを決定すること;ならびに前記抗原外れ値スコアが閾値を超える場合、前記抗原を前記病態のための抗原マーカーとして同定することを含む、方法が提供される。
本明細書では、いくつかの実施形態によれば、病態のための抗原マーカーを同定する方法であって、方法は、病態コホート及び比較のための対照コホートを同定すること;前記病態に対応する抗原のセットを提供することであって、各抗原の配列は、部分配列にタイリングされている、提供すること;前記病態コホート及び前記対照コホートの両方についての前記部分配列の各々についての濃縮スコアスコアを提供すること;前記抗原のセットにおける各抗原について、前記抗原内の部分配列についての前記濃縮スコアから前記病態コホート及び前記対照コホートについての前記抗原の抗原スコアを決定すること、及び前記病態コホート及び前記対照コホートについての前記抗原スコアを比較して抗原外れ値スコアを決定すること;ならびに前記抗原外れ値スコアが閾値を超える場合、前記抗原を前記病態のための抗原マーカーとして同定することを含む、方法が提供される。
いくつかの実施形態では、濃縮スコアは、前記部分配列を含むモチーフについて決定されたモチーフ濃縮スコアから決定される。いくつかの実施形態では、濃縮スコアは、前記病態コホートと前記対照コホートとの間の血清サンプルからの抗体に対する部分配列の相対結合の同定から決定される。いくつかの実施形態では、方法は、前記病態コホートと前記対照コホートとの間の血清サンプルからの抗体に対する部分配列の相対結合を同定することによって前記濃縮スコアを決定することをさらに含む。
いくつかの実施形態では、抗原スコアは、前記コホートにおける前記抗原配列についての最高部分配列濃縮スコアから決定される。いくつかの実施形態では、抗原スコアは、前記コホートにおける前記抗原配列についての全ての部分配列濃縮スコアの合計から決定される。いくつかの実施形態では、抗原スコアは、前記コホートにおける前記抗原配列についてのn個の部分配列のウィンドウ内の部分配列濃縮スコアの最高平均値から決定される。いくつかの実施形態では、抗原スコアは、抗原配列にわたるn個の最大部分配列濃縮スコアの合計から決定される。
いくつかの実施形態では、前記病態コホート及び前記対照コホートについての前記抗原スコアを比較することは、前記抗原についての前記サンプルコホート及び前記対照コホートからの抗原スコア間の統計的差異を算出することを含む。いくつかの実施形態では、閾値は、前記抗原を抗原マーカーとして同定するのに十分な統計的差異を表す。いくつかの実施形態では、統計的差異は、Cohenのd効果量、マン・ホイットニーのUのp値、コルモゴロフ・スミルノフのp値、及び外れ値合計からなる群から選択される統計分析から決定される。いくつかの実施形態では、統計的差異は、多重仮説検定のための補正を含む。いくつかの実施形態では、補正は、ボンフェローニ補正または偽発見率である。いくつかの実施形態では、閾値は、前記抗原のセットから決定された抗原外れ値スコアのランキングから決定される。
いくつかの実施形態では、部分配列は、k-merである。いくつかの実施形態では、k-merは、5-mer、6-mer、7-mer、8-mer、9-mer、または10-merを含む。いくつかの実施形態では、部分配列は、少なくともk-nの規定のアミノ酸位置を有するk-mer配列を含み、kは、8、9または10であり、nは、2、3、4、5、または6である。
いくつかの実施形態では、抗原配列は、アミノ酸配列である。いくつかの実施形態では、抗原マーカーは、タンパク質、RNA、またはアプタマーを含む。
いくつかの実施形態では、病態コホートは、1人以上の患者からの1つ以上のサンプルを含み、前記患者は、感染症、自己免疫性障害、がん、神経障害、または慢性疾患と診断されており、または前記患者は、治療剤またはワクチンが投与されている。
いくつかの実施形態では、前記濃縮スコアを提供することは、複数の異なるペプチドを含むディスプレイシステムを複数の抗体を含む生物学的サンプルと接触させることであって、複数の抗体は、前記病態についての抗体を含むことが知られているか、または疑われており、接触させることは、試料抗体が前記複数の異なるペプチド上の同種エピトープに特異的に結合するのに十分な条件下で実施される、接触させること;複数の異なるペプチドと試料抗体との間の結合を測定すること;及び前記部分配列について測定された結合の量から前記配列についての濃縮スコアを同定することを含む。
いくつかの実施形態では、ペプチドは、ランダムに生成されている。いくつかの実施形態では、ペプチドは、8-mer~15-merペプチドである。いくつかの実施形態では、ペプチドは、12-merペプチドである。いくつかの実施形態では、ディスプレイシステムは、少なくとも10、少なくとも100、少なくとも1000、少なくとも104、少なくとも105、少なくとも106、少なくとも107、または少なくとも108種の異なるペプチドを含む。いくつかの実施形態では、前記ペプチドは、12-merペプチドであり、ランダムに生成されている。
いくつかの実施形態では、前記抗原スコア及び前記抗原外れ値スコアの決定は、コンピュータシステムのプロセッサによる実行のための非一時的コンピュータ可読記憶媒体に記憶されたコンピュータプログラム命令のセットとして実施される。いくつかの実施形態では、前記抗原外れ値スコアが閾値を超える場合、前記抗原を前記病態のための抗原マーカーとして同定することは、コンピュータシステムのプロセッサによる実行のための非一時的コンピュータ可読記憶媒体に記憶されたコンピュータプログラム命令のセットとして実施される。
また、本明細書では、いくつかの実施形態によれば、対照コホートと比較して病態コホートに特異的な抗原マーカー上の1つ以上の抗原エピトープを同定する方法であって、方法は、病態コホート及び比較のための対照コホートを同定すること;前記病態に対応する抗原を提供することであって、前記抗原の配列は、部分配列にタイリングされている、提供すること;前記病態コホート及び前記対照コホートの両方からのサンプルについての前記部分配列の各々についての濃縮スコアを提供すること;前記対照コホートからの前記サンプルと比較して前記病態コホートからの前記サンプルについての前記抗原の1つ以上の領域における濃縮スコア間の統計的差異を決定すること;及び前記統計的差異が閾値を超える場合、前記対照コホートと比較して前記病態コホートに特異的な抗原エピトープとして前記1つ以上の領域を同定することを含む、方法が提供される。
いくつかの実施形態では、濃縮スコアは、前記部分配列を含むモチーフについて決定されたモチーフ濃縮スコアから決定される。いくつかの実施形態では、濃縮スコアは、前記病態コホートと前記対照コホートとの間の血清サンプルからの抗体に対する部分配列の相対結合の同定から決定される。いくつかの実施形態では、方法は、前記病態コホートと前記対照コホートとの間の血清サンプルからの抗体に対する部分配列の相対結合を同定することによって前記濃縮スコアを決定することをさらに含む。
いくつかの実施形態では、前記病態コホート及び前記対照コホートについての前記濃縮スコアを比較することは、前記抗原についての前記サンプルコホート及び前記対照コホートからの濃縮スコア間の統計的差異を算出することを含む。いくつかの実施形態では、閾値は、前記1つ以上の領域を抗原エピトープとして同定するのに十分な統計的差異を表す。いくつかの実施形態では、統計的差異は、Cohenのd効果量、マン・ホイットニーのUのp値、コルモゴロフ・スミルノフのp値、及び外れ値合計からなる群から選択される統計分析から決定される。いくつかの実施形態では、統計的差異は、多重仮説検定のための補正を含む。いくつかの実施形態では、補正は、ボンフェローニ補正または偽発見率である。
いくつかの実施形態では、部分配列は、k-merである。いくつかの実施形態では、k-merは、5-mer、6-mer、7-mer、8-mer、9-mer、または10-merを含む。いくつかの実施形態では、部分配列は、少なくともk-nの規定のアミノ酸位置を有するk-mer配列を含み、kは、8、9または10であり、nは、2、3、4、5、または6である。
いくつかの実施形態では、抗原配列は、アミノ酸配列である。いくつかの実施形態では、抗原マーカーは、タンパク質、RNA、またはアプタマーを含む。
いくつかの実施形態では、病態コホートは、1人以上の患者からの1つ以上のサンプルを含み、前記患者は、感染症、自己免疫性障害、がん、神経障害、または慢性疾患と診断されており、または前記患者は、治療剤またはワクチンが投与されている。
いくつかの実施形態では、前記濃縮スコアを提供することは、複数の異なるペプチドを含むディスプレイシステムを複数の抗体を含む生物学的サンプルと接触させることであって、複数の抗体は、前記病態についての抗体を含むことが知られているか、または疑われており、接触させることは、試料抗体が前記複数の異なるペプチド上の同種エピトープに特異的に結合するのに十分な条件下で実施される、接触させること;複数の異なるペプチドと試料抗体との間の結合を測定すること;及び前記部分配列について測定された結合の量から前記配列についての濃縮スコアを同定することを含む。
いくつかの実施形態では、ペプチドは、ランダムに生成されている。いくつかの実施形態では、ペプチドは、8-mer~15-merペプチドである。いくつかの実施形態では、ペプチドは、12-merペプチドである。いくつかの実施形態では、ディスプレイシステムは、少なくとも10、少なくとも100、少なくとも1000、少なくとも104、少なくとも105、少なくとも106、少なくとも107、または少なくとも108種の異なるペプチドを含む。いくつかの実施形態では、ペプチドは、12-merペプチドであり、ランダムに生成されている。
いくつかの実施形態では、前記対照コホートからの前記サンプルと比較して前記病態コホートからの前記サンプルについての前記抗原の1つ以上の領域における濃縮スコア間の統計的差異を決定することは、コンピュータシステムのプロセッサによる実行のための非一時的コンピュータ可読記憶媒体に記憶されたコンピュータプログラム命令のセットとして実施される。いくつかの実施形態では、前記統計的差異が閾値を超える場合、前記対照コホートと比較して前記病態コホートに特異的な抗原エピトープとして前記1つ以上の領域を同定することは、コンピュータシステムのプロセッサによる実行のための非一時的コンピュータ可読記憶媒体に記憶されたコンピュータプログラム命令のセットとして実施される。
また、本明細書では、いくつかの実施形態によれば、病態のためのタンパク質マーカーを同定する方法であって、方法は、病態コホート及び比較のための対照コホートを同定すること;前記病態に対応するプロテオームからのタンパク質のセットを提供することであって、前記タンパク質は、k-mer配列にタイリングされている、提供すること;前記病態表現型を有する対象及び前記対照表現型を有する対象からの血清サンプルからの前記複数のk-mer配列についての濃縮スコアを提供することであって、前記濃縮スコアは、各血清サンプルにおける抗体に対する前記k-mer配列の結合のレベルを測定することから決定される、提供すること;前記タンパク質のセットにおける各タンパク質について、前記タンパク質内のk-mer配列についての前記濃縮スコアから前記病態コホート及び前記対照コホートについての前記タンパク質の抗原スコアを決定すること、及び前記病態コホート及び前記対照コホートについての前記抗原スコアを比較してタンパク質外れ値スコアを決定すること;ならびに前記タンパク質外れ値スコアが閾値を超える場合、前記タンパク質を前記病態のためのタンパク質マーカーとして同定することを含む、方法が提供される。
また、本明細書では、いくつかの実施形態によれば、非一時的コンピュータ可読記憶媒体及びプロセッサを含む、病態のための抗原マーカーを同定するためのシステムであって、前記記憶媒体は、前記病態に対応する抗原の部分配列についての濃縮スコアであって、前記濃縮スコアは、病態コホート及び対照コホートに特異的である、濃縮スコア;前記抗原の部分配列の前記濃縮スコアから前記病態コホート及び前記対照コホートに特異的な各抗原の抗原スコアを生成するための命令;ならびに前記病態コホート及び前記対照コホートに特異的な前記抗原についての前記抗原スコア間の統計的差異を比較することによって抗原外れ値スコアを生成するための命令を含む、システムが提供される。
いくつかの実施形態では、システムは、前記抗原外れ値スコアに基づいて前記病態のための抗原マーカーとして好適な抗原を同定するアウトプットを生成するための命令をさらに含む。いくつかの実施形態では、システムは、前記病態に対応する前記抗原の配列を受信するための命令をさらに含む。いくつかの実施形態では、システムは、前記病態に対応する前記抗原の配列を部分配列にタイリングするための命令をさらに含む。いくつかの実施形態では、システムは、前記部分配列についての濃縮スコアを受信するための命令をさらに含む。
また、本明細書では、いくつかの実施形態によれば、非一時的コンピュータ可読記憶媒体及びプロセッサを含む、病態コホートに特異的な抗原マーカー上の1つ以上の抗原エピトープを同定するためのシステムであって、前記記憶媒体は、前記抗原マーカーの部分配列についての濃縮スコアであって、前記濃縮スコアは、病態コホート及び対照コホートに特異的である、濃縮スコア;ならびに前記対照コホートからの前記サンプルと比較して前記病態コホートからの前記サンプルについての前記抗原の1つ以上の領域における濃縮スコア間の統計的差異を決定するための命令を含む、システムが提供される。
いくつかの実施形態では、システムは、前記統計的差異が閾値を超える場合、前記対照コホートと比較して前記病態コホートに特異的な抗原エピトープとして前記1つ以上の領域を同定するアウトプットを生成するための命令をさらに含む。いくつかの実施形態では、システムは、前記病態に対応する前記抗原の配列を受信するための命令をさらに含む。いくつかの実施形態では、システムは、前記病態に対応する前記抗原の配列を部分配列にタイリングするための命令をさらに含む。いくつかの実施形態では、システムは、前記部分配列についての濃縮スコアを受信するための命令をさらに含む。
前述及び他の目的、特徴、ならびに利点は、添付の図面に示されているとおり、本発明の特定の実施形態の以下の記載から明らかであり、同様の参照文字は、異なる図面全体で同じ部分を指す。図面は、必ずしも縮尺通りでなく、代わりに、本発明の種々の実施形態の原理を説明することに重点を置く。
詳細な説明
本発明の様々な実施形態の詳細が以下の説明に記載される。本発明の他の特徴、目的、及び利点は、説明及び図面から、ならびに特許請求の範囲から明らかになるであろう。
本発明の様々な実施形態の詳細が以下の説明に記載される。本発明の他の特徴、目的、及び利点は、説明及び図面から、ならびに特許請求の範囲から明らかになるであろう。
序論
所与の疾患状態では、免疫系は、異物または「非自己」と思われる抗原に対する抗体をする。感染症の場合、これらの抗原、及びこれらの抗原におけるエピトープは、集団を通して保存される傾向がある。方法は、感染性疾患の文脈で共有エピトープ/モチーフを以前から成功裏に同定しているが、がん及び自己免疫の両方におけるシグナルは、観察されたエピトープにおける不均一性に起因して検出するのが困難であり続けている。しかしながら、本明細書に記載されているように、疾患状態に対応する保存された抗原は、所与の抗原上の保存されたエピトープを必要としない。
所与の疾患状態では、免疫系は、異物または「非自己」と思われる抗原に対する抗体をする。感染症の場合、これらの抗原、及びこれらの抗原におけるエピトープは、集団を通して保存される傾向がある。方法は、感染性疾患の文脈で共有エピトープ/モチーフを以前から成功裏に同定しているが、がん及び自己免疫の両方におけるシグナルは、観察されたエピトープにおける不均一性に起因して検出するのが困難であり続けている。しかしながら、本明細書に記載されているように、疾患状態に対応する保存された抗原は、所与の抗原上の保存されたエピトープを必要としない。
我々は、NGS及び計算方法を使用して血清中のエピトープ情報を捕捉及び解読するために非常に大規模な(1010)ランダム細菌ディスプレイライブラリを使用するSERAアッセイを開発した。
本明細書では、SERAアッセイから得られたものに対応する情報及びSERAから発展したペプチドについての抗原性情報のデータベースをプロテオーム情報と組み合わせて使用して共有抗原を同定する方法及び組成物が提供される。この方法は、共有エピトープを提示しないシグナルを有するものを含む、最も有意な共有抗原を同定するために使用される。よって、本明細書では、いくつかの実施形態によれば、そのような共有抗原を同定し、さらに、共有抗原に対する反応性に対してエピトープレベルの分解能を提供する方法が提供される。
共有抗原シグナルを同定するために、全てのタンパク質を構成要素部分配列に分割し、部分配列のセットにわたって各サンプルについての抗原シグナルを算出する。次いで、疾患コホートと対照コホートとの間の各タンパク質についてのサンプルシグナルを比較し、コホート間で相違する抗原性を有するタンパク質を同定する。
サンプルが特定のエピトープ配列を共有しなければならないという制約を排除することによって、既存の計算的解決策によって検出されなかった抗原を同定する。これは、エピトープが個体固有であり得るが抗原は共有されるがん及び自己免疫の研究への適用において実質的利益を示した。単一のアドレスで疾患対対照における共有シグナルに注目するペプチドアレイは、それらのアドレスの共有が不十分である場合、ノイズよりも上昇しない希釈されたシグナルを有する。
方法は、非常にハイスループットで抗原及びエピトープレベルの分解能を同時に提供し、これは他のウェットラボ技術を使用して実現することはできない。
SERAを使用して各サンプルについてランダムライブラリからの抗原性シグナルを提供する場合、方法は、分析前にアッセイにおいて抗原または抗原のセットを含めることに依存しない。方法は、1つの抗原から多重プロテオームスケール(>20,000種のタンパク質)まで計算効率で処理することができる。このスケーラビリティにより、大規模コホートにおけるデータ及び統計的誘導発見が可能となる。大規模対照コホートからのデータは、調査結果の特異性を改善する。
一例として、前立腺癌及び黒色腫の組み合わされた分析において、対照と比較して最も相違する抗原性のタンパク質としてNY-ESO-1を同定し、各サンプルに寄与するエピトープが、タンパク質配列の近くであるが非同一の領域に存在することを発見した。次いで、抗原性があるものとして同定した領域が、合成ペプチドを使用してNY-ESO-1の抗原エピトープを同定した先行文献と一致することを確認した。
定義
請求項及び明細書で使用される用語は、特に明記しない限り、以下に記載するように定義する。
請求項及び明細書で使用される用語は、特に明記しない限り、以下に記載するように定義する。
具体的に述べられるか、別段文脈から明らかでない限り、本明細書で使用される場合、「約」という用語は、当該技術分野における通常の許容範囲内、例えば、平均の2標準偏差内にあるものと理解される。約は、述べられる値の10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%、0.1%、0.05%、または0.01%以内にあるものと理解され得る。本明細書で提供される数値は、時に、約という用語によって修飾されているとみなされる場合があり、それは、修飾によって包含される範囲が本発明の機能性及び特許請求の範囲の確定性に一致することが文脈により明らかにされる場合である。
用語「濃縮」は、本明細書で使用される場合、同等のサイズのランダムデータセット内で予測される数と比較した、エピトープレパートリー内のペプチド(タンパク質または抗原部分配列を含む)、パターン、またはモチーフの観察の数に相当する。この情報は、コホートからのサンプル血清におけるペプチド、パターン、またはモチーフの予測される相対抗原性の指標である、ペプチド、パターン、またはモチーフについての「濃縮スコア」を生成するために使用され得る。例えば、Xが任意のアミノ酸である仮想9-merペプチドライブラリにおいて、パターンQPXXPFX[ED](配列番号3)は、800,000((laa/20aa)4x(2aa/20aa)x2)のランダム配列(aa=アミノ酸)ごとに1回生じることが予測される。仮に4百万の配列が決定されたとしたら、そのときは五(5)回の事象(すなわち、800,000配列ごとに1回)を観察することが予測されるであろう。例として、パターンがエピトープレパートリーにおいて50の独自ペプチド配列(すなわち、50回の観察)で観察された場合、そのときはそのパターンは、ランダムに対して10倍「濃縮される」であろう。ペプチドディスプレイライブラリを使用した患者サンプルに特異的な濃縮スコアのそのような決定は、2016年11月14日に出願されたPCT公開番号WO/2017/083874「Methods and Compositions for Assessing Antibody Specificities」、(すなわち、「SERA技術」)(その全体が参照により本明細書に組み込まれる)に記載されている。
用語「抗原スコア」は、本明細書で使用される場合、1つ以上の病態コホート及び/または対照コホートなどのサンプルコホートにおけるタンパク質または抗原マーカーの予測される抗原性の指標を指す。本明細書に記載されるように、抗原スコアは、サンプルからの病態関連プロテオームのタンパク質におけるk-mer部分配列またはモチーフからの濃縮スコアを使用して決定される。
本明細書で使用される用語「抗原外れ値スコア」は、抗原が抗原マーカーとして有用であるかどうかを同定するためにサンプル及び/またはコホートの間の抗原またはタンパク質の抗原スコアの比較によって生成されるスコアを指す。そのようなコホートは、疾患のバイオマーカーまたは処置反応のバイオマーカー、例えば、処置の前もしくは後に、または処置の前または/後の疾患の所定の規定の段階で病態を有するかまたは有しないものに関連し得る。いくつかの実施形態では、抗原またはタンパク質がコホートの少なくとも1つについての抗原マーカーとして有用であるかどうかの同定は、抗原またはタンパク質についての抗原外れ値スコアが既定の閾値を超えるかどうかを同定することを含む。そのような閾値は、病態のための統計的に有意な抗原マーカーを同定するために設定され得、すなわち、病態コホート及び対照(すなわち、参照)コホートからのサンプル間で区別するために使用され得る。
用語「閾値」は、本明細書で使用される場合、生じるまたは関連すると考えられる所定の反応、現象、結果、または状態について超えなければならない大きさまたは強度を指す。例えば、閾値は、それを超える場合に抗原スコアが関連すると考えられる数値であり得る。関連性は状況に応じて異なる場合があり、例えば、良好な関連性、反応性の関連性、または統計的に有意な関連性を指し得る。
本明細書で使用される場合、用語「次世代シーケンシング」(NGS)などは、ハイスループット核酸シーケンシング(HTS)アプローチを指すために使用される。異なるシーケンシング技術に依存するNGSのためのプラットフォームは、多数のベンダー、例えば、Pacific Biosciences、Thermo FisherのIon Torren、454 Life Sciences、Illumina,Inc.(例えば、MiSeq、NextSeq、HiSeq)及びOxford Nanoporeから市販されている。NGS技術のレビューについては、例えば、van Dijk EL et al.Ten years of next-generation sequencing technology.Trends Genet.2014 Sep;30(9):418-26(全ての目的のためにその全体が参照により本明細書に組み込まれる)参照。
用語「表面ディスプレイ」は、本明細書で使用される場合、生細胞、ウイルス、またはバクテリオファージなどの生物学的粒子の外表面などのアレイ表面上での異種ペプチド及びタンパク質の提示を指す。
本明細書で使用される場合、「ペプチドのライブラリ」または「ペプチドライブラリ」は、スクリーニング目的のために典型的に使用されるペプチド断片の集合を指す。用語「ペプチド」、「ポリペプチド」、「アミノ酸配列」、「ペプチド配列」、及び「タンパク質」は、互いに連結された2つ以上のアミノ酸を指すために互換的に使用され、特定の長さを意味しない。アミノ酸及びペプチドは、天然に存在するか、または合成(例えば、非天然アミノ酸またはアミノ酸アナログ)であり得る。アミノ酸及びペプチドはまた、反応性基、例えば、アミノ酸もしくはペプチドを固体基材に結合させるための反応性基、アミノ酸もしくはペプチドを標識するための反応性基、または対象となる他の部位をアミノ酸もしくはペプチドに結合させるための反応性基を含むか、または含むようにさらに改変され得る。反応性基には、化学的反応性基、例えば、反応性チオール(例えば、マレイミド系反応性基)、反応性アミン(例えば、N-ヒドロキシスクシンイミド系反応性基)、「クリックケミストリー」基(例えば、反応性アルキン基)、及びホルミルグリシン(FGly)を保有するアルデヒドが含まれるがこれらに限定されない。
用語「疾患」は、生物の体に影響を及ぼす異常な状態を指す。用語「障害」は、機能的異常または傷害を指す。疾患または障害という用語は、別段記述されない限りまたは用語が使用される文脈を考慮して明らかでない限り、本明細書で互換的に使用される。疾患及び障害という用語はまた、集合的に「病態」と称され得る。
用語「表現型」は、本明細書で使用される場合、生物の観察可能な特徴または形質の複合体、例えば、その形態、発生、生化学的または生理的特性、フェノロジー、挙動、及び挙動の産物を含む。
2つ以上の核酸またはポリペプチド配列の文脈における「同一性」率という用語は、以下に記載の配列比較アルゴリズム(例えば、BLASTP及びBLASTNまたは当業者に利用可能な他のアルゴリズム)のうちの1つ以上を使用してまたは視覚検査によって測定した場合、最大一致について比較及びアライメントされた場合に、ヌクレオチドまたはアミノ酸残基の特定のパーセンテージが同じである2つ以上の配列または部分配列を指す。用途に応じて、「同一性」率は、比較されている配列の領域にわたって、例えば、機能性ドメインにわたって存在し得、または、代替的に、比較される2つの配列の全長にわたって存在し得る。
配列比較のため、典型的には、1つの配列が参照配列として機能し、これと試験配列を比較する。配列比較アルゴリズムを使用する場合、試験配列及び参照配列をコンピュータに入力し、必要に応じて部分配列座標を指定し、配列アルゴリズムプログラムパラメータを指定する。その後、配列比較アルゴリズムは、指定されたプログラムパラメータに基づいて、参照配列に対する試験配列(複数可)についての配列同一性率を算出する。
比較のための配列の最適なアライメントは、例えば、Smith & Waterman,Adv.Appl.Math.2:482(1981)の局所的同一性アルゴリズムによって、Needleman & Wunsch,J.Mol.Biol.48:443(1970)の同一性アライメントアルゴリズムによって、Pearson & Lipman,Proc.Nat’l.Acad.Sci.USA 85:2444(1988)の類似性方法の検索によって、これらのアルゴリズムのコンピュータ化実装によって(Wisconsin Genetics Software Package内のGAP、BESTFIT、FASTA、及びTFASTA、Genetics Computer Group,575 Science Dr.,Madison,Wis.)、または視覚的検査によって(一般に下記Ausubel et al.参照)行われ得る。
配列同一性及び配列類似性率を決定するのに好適なアルゴリズムの一例は、Altschul et al.,J.Mol.Biol.215:403-410(1990)に記載されているBLASTアルゴリズムである。BLAST分析を実施するためのソフトウェアは、National Center for Biotechnology Information(www.ncbi.nlm.nih.gov/)を通して公共に利用可能である。
用語「十分な量」は、所望の効果をもたらすのに十分な量を意味する。
用語「治療的有効量」は、疾患の症状を改善するのに有効な量である。いくつかの文脈では、治療的有効量は、予防が治療と考えられ得る場合は「予防的有効量」であり得、但し、そのような解釈は、いかなる理由でも請求項の有効性の決定に不利な影響を及ぼさない。
抗原発見
本発明は、疾患特異的なプロテオームベースの抗原性シグナルを同定するための方法及び組成物を提供する。同定された抗原は、疾患の潜在的マーカーまたは治療反応のマーカーとして使用され得る。同定された抗原はまた、潜在的な治療標的として使用され得る。
本発明は、疾患特異的なプロテオームベースの抗原性シグナルを同定するための方法及び組成物を提供する。同定された抗原は、疾患の潜在的マーカーまたは治療反応のマーカーとして使用され得る。同定された抗原はまた、潜在的な治療標的として使用され得る。
簡潔には、本明細書に記載されるように、疾患特異的抗原を同定する方法は、例えば、i)規定のk-merペプチドのセットに対する疾患状態及び比較対照状態からの血清の抗原反応を同定または決定すること、ii)この反応を、疾患血清及び対照血清に対する1つ以上のk-merを含む抗原の抗原性反応を予測するために使用すること、及びiii)疾患血清に対する抗原性反応対対照血清に対する抗原性反応との間の差異が閾値を超えるかどうかを決定して、抗原を、疾患特異的なプロテオームベースの抗原性シグナルを提供するのに有用なものとして同定することを含む。いくつかの実施形態では、疾患状態に対応するプロテオームが同定され、このプロテオームからのタンパク質配列は、疾患血清及び対照血清による各タンパク質に対する抗原性反応の同定のために構成要素k-mer配列に分割される。
いくつかの実施形態では、各タンパク質及びサンプル(例えば、疾患血清及び対照血清)について、最も強力な線状抗原(k-mer)が同定される。いくつかの実施形態では、全てのタンパク質について、疾患集団と対照集団(すなわち、疾患血清と対照血清)との間の抗原性シグナルが比較される。いくつかの実施形態では、最も強い抗原性シグナルを有するタンパク質が疾患コホートについて同定される。
本発明のいくつかの実施形態に従って、疾患状態対対照または非疾患状態からの血清を区別するために使用され得る抗原性抗原の発見及び同定を記載する工程が以下に提供される。
k-mer部分配列についての濃縮スコア
最初に、病態コホート及び対照コホートとして利用されるサンプルを同定する。各サンプルについて、タンパク質データベースにおける全てのk-merについてのk-merレベル統計値を同定または決定する。
最初に、病態コホート及び対照コホートとして利用されるサンプルを同定する。各サンプルについて、タンパク質データベースにおける全てのk-merについてのk-merレベル統計値を同定または決定する。
いくつかの実施形態では、本明細書に記載されるように、このデータは、2016年11月14日に出願されたPCT公開番号WO/2017/083874「Methods and Compositions for Assessing Antibody Specificities」、(すなわち、「SERA技術」)(その全体が参照により本明細書に組み込まれる)に記載されているように、ペプチドディスプレイライブラリを使用して患者サンプルから誘導される。いくつかの実施形態では、SERAは、細菌ディスプレイ技術を使用して、12merペプチドの多様なセットを血清抗体に提示する。血清抗体に結合するペプチドは、磁性ビーズを使用して分離され、次世代シーケンシングを使用してシーケンシングされる。各12merはkmer成分に分割され、これらのkmerの対数濃縮が算出され、濃縮は、ランダム12merペプチドにおけるkmer集団統計値に基づいて予測された頻度に基づく予測と比較した観察の数を示す。これは、サンプル特異的及びコホート特異的k-mer濃縮スコアを同定するために各コホートからの各サンプルについて実施される。
本明細書に記載の本方法論は、SERA技術を使用して誘導されたが、エピトープレベルデータを生成する任意の技術(例えば、ペプチドアレイ及び他のシーケンシングベースのアプローチ)に適用可能であろう。よって、抗原性ペプチド配列の決定は、上記の方法に限定されず、任意の他のペプチド駆動技術を使用して決定され得る。
病態に関連するk-mer配列の同定
対象となる疾患状態について、病態コホートに関連するプロテオームが得られる。そのようなプロテオーム(例えば、ヒトプロテオームまたは感染性因子プロテオーム)は、公共に利用可能な配列データベース(例えば、Uniprot)から得られ得る。簡潔性のため、これらのアミノ酸配列を「タンパク質」と称するが、このアプローチは、非タンパク質抗原性配列に適用される可能性がある。
対象となる疾患状態について、病態コホートに関連するプロテオームが得られる。そのようなプロテオーム(例えば、ヒトプロテオームまたは感染性因子プロテオーム)は、公共に利用可能な配列データベース(例えば、Uniprot)から得られ得る。簡潔性のため、これらのアミノ酸配列を「タンパク質」と称するが、このアプローチは、非タンパク質抗原性配列に適用される可能性がある。
各タンパク質は、k個のアミノ酸の連続配列をそれぞれ表す構成的k-merにタイリングされる。好ましい実施形態では、kは、5、6、または7のうちの1つまたは組み合わせである。例えば、タンパク質配列ABCDEFGは、タイリングされた5merのABCDE、BCDEF、CDEFGに分割されるであろう。
サンプル及び/またはコホートに特異的なタンパク質の各k-mer配列についての濃縮スコアは、サンプル及び/またはコホートにおけるタンパク質についての抗原スコアを同定するために使用される。まず、k-merレベル濃縮スコアが決定または同定される。この値は、特定のk-merについての観察の数についての予測と比較した、k-merに対するサンプルからの血清の結合に相当する。いくつかの実施形態では、k-merレベル濃縮値は、標準偏差の数の「比較」に基づいており、特定の濃縮値は、対照コホートの濃縮からのものであり、これらの対照は、比較コホートまたは第3のコホートのいずれかであり得る。本明細書に記載のk-mer濃縮スコアは、相対濃縮または標準偏差の数に基づいて決定されるが、生カウントまたは代替的正規化アプローチを含む各k-mer濃縮スコアについての異なる値も使用され得る。
いくつかの実施形態では、k-mer濃縮スコアは、特定の配列の代わりに、k-merモチーフについて決定される。抗原に存在するk-merに関連するk-mer配列のセットは、「モチーフ」を構成し得、そのモチーフにおいて、配列におけるいくつかの位置は、その位置において可能な複数のアミノ酸を有し得る。モチーフスコアは、構成要素k-mer濃縮スコアを統合し、k-mer濃縮スコアのために使用することもできる。
タンパク質についての抗原スコア
対象となる病態に関連するプロテオームにおけるタンパク質について抗原スコアが同定される。このスコアは、対象となる病態に関する(すなわち、コホート対照と比較した場合のサンプルコホートにおける)各タンパク質の抗原性の特異性に相当する。各タンパク質内の各k-mer部分配列についての各サンプル及び/またはコホートに特異的な濃縮スコアは、各サンプル及び/またはコホート(例えば、疾患及び対照)に特異的な各タンパク質についての抗原スコアを決定するために使用される。k-mer濃縮スコアから抗原スコアを決定するためのいくつかの方法が本明細書に開示される。
対象となる病態に関連するプロテオームにおけるタンパク質について抗原スコアが同定される。このスコアは、対象となる病態に関する(すなわち、コホート対照と比較した場合のサンプルコホートにおける)各タンパク質の抗原性の特異性に相当する。各タンパク質内の各k-mer部分配列についての各サンプル及び/またはコホートに特異的な濃縮スコアは、各サンプル及び/またはコホート(例えば、疾患及び対照)に特異的な各タンパク質についての抗原スコアを決定するために使用される。k-mer濃縮スコアから抗原スコアを決定するためのいくつかの方法が本明細書に開示される。
いくつかの実施形態では、k-mer濃縮スコアから抗原スコアを決定することは、図1に示されているようにサンプルの関連プロテオームにおけるタンパク質におけるk-mer配列(または他の非タンパク質抗原配列)をタイリングすることを含む。いくつかの実施形態では、このk-merレベル統計値は、数k-merのウィンドウ(例えば、5つのk-merのウィンドウ)にわたって平滑化(平均化)される。いくつかの実施形態では、複数のk-mer濃縮スコアが使用され(例えば、5mer及び6merを同時に使用する)、そのスコアは、k-mer濃縮スコアにわたる合計から決定される。
いくつかの実施形態では、タンパク質についての最大k-mer濃縮スコアは、そのタンパク質についての抗原スコアを決定するために使用される。図2及び3に示されているものは、図1に提供されるタンパク質についてのタイリングスコアからのk-mer抗原性シグナルについての位置及び最大スコアである。別の実施形態では、タンパク質にわたるn個の最大k-mer濃縮スコアの合計(nは、タイリングされたタンパク質配列に沿った1つ以上のk-mer濃縮スコアピークを含み得る)が使用される。別の実施形態では、タンパク質における全てのk-mer濃縮スコアの合計スコアが使用される。
病態特異的抗原を同定するための抗原外れ値スコア
上記で決定される各タンパク質についての抗原スコアは、コホート間で比較される。コホート間の各タンパク質についての抗原スコアの差異の統計的有意性が算出される。コホートの抗原スコア間の統計的差異は、コホートにおけるタンパク質の予測される抗原特異性の指標である抗原外れ値スコアを決定するために使用される。いくつかの実施形態では、病態コホート及び対照コホートの比較は、以下の統計的方法のうちの1つを用いて行われる:1.効果量(Cohenのd効果量として定義される)、2.マン・ホイットニーのUのp値、3.コルモゴロフ・スミルノフのp値、及び4.外れ値合計(https://www.ncbi.nlm.nih.gov/pubmed/16702229に記載されている)。マン・ホイットニーのU統計の場合、シグナルは、集団にわたるシフトに基づいて同定される(ノンパラメトリック、順位)。P値は、確立された分布に基づく。外れ値合計の場合、シグナルは、集団の意味のあるサブセットにおける「外れ値」として同定される。P値は、順列及び中心極限定理に基づく。当業者に知られている他の好適な統計的方法が使用され得る。いくつかの実施形態では、これらの統計的分析は、ボンフェローニ補正または偽発見率のようなアプローチを使用して多重仮説検定のために補正され得る。
上記で決定される各タンパク質についての抗原スコアは、コホート間で比較される。コホート間の各タンパク質についての抗原スコアの差異の統計的有意性が算出される。コホートの抗原スコア間の統計的差異は、コホートにおけるタンパク質の予測される抗原特異性の指標である抗原外れ値スコアを決定するために使用される。いくつかの実施形態では、病態コホート及び対照コホートの比較は、以下の統計的方法のうちの1つを用いて行われる:1.効果量(Cohenのd効果量として定義される)、2.マン・ホイットニーのUのp値、3.コルモゴロフ・スミルノフのp値、及び4.外れ値合計(https://www.ncbi.nlm.nih.gov/pubmed/16702229に記載されている)。マン・ホイットニーのU統計の場合、シグナルは、集団にわたるシフトに基づいて同定される(ノンパラメトリック、順位)。P値は、確立された分布に基づく。外れ値合計の場合、シグナルは、集団の意味のあるサブセットにおける「外れ値」として同定される。P値は、順列及び中心極限定理に基づく。当業者に知られている他の好適な統計的方法が使用され得る。いくつかの実施形態では、これらの統計的分析は、ボンフェローニ補正または偽発見率のようなアプローチを使用して多重仮説検定のために補正され得る。
抗原についての抗原外れ値スコアを決定するために抗原スコアを統計的に比較するために使用される本方法は上記で詳述されているが、病態コホート及び対照コホートを比較するために適用される可能性がある潜在的に無数に多くの代替的な統計的検定(すなわち、T検定、COPA外れ値、カイ二乗検定)が存在する。特に、所与のサンプルについて複数の場所で所与の抗原において有意なシグナルが現れる場合があり、総抗原性シグナルを改善するための方法が採用され得る。
各タンパク質または抗原は、コホート間の差異が閾値を超える場合、関連抗原として分類される。いくつかの実施形態では、病態コホート及び対照コホートを比較するために使用される統計に基づいてタンパク質のランキングを生成する。我々の方法によって生成されたサンプルランキングが図5に提供されている。
いくつかの実施形態では、病態に関連して同定されたタンパク質は、i)診断、例えば、ELISAまたはSERAパネルを開発するため、ii)モノクローナル抗体のための治療剤を同定するため、及びiii)ワクチン標的を同定するために使用される可能性がある。
エピトープ同定
各サンプルについて、タンパク質の配列に沿ってk-mer濃縮スコアについての最大値の高さ及び位置を標識する。よって、各タンパク質について、我々の方法は、抗原性領域についてエピトープ分解能を提供する。
各サンプルについて、タンパク質の配列に沿ってk-mer濃縮スコアについての最大値の高さ及び位置を標識する。よって、各タンパク質について、我々の方法は、抗原性領域についてエピトープ分解能を提供する。
例として、各サンプル及び各コホートについての図1~3からのタンパク質についての最大k-mer濃縮スコアは、図4に示されているように決定され、重畳される。疾患サンプルからの血清からの最大k-merスコアは赤色で示されている。対照サンプルについての血清からの最大k-mer濃縮スコアは、緑色で示されている。高いk-mer濃縮スコアのクラスターは、疾患血清のみのサンプルからおよそ20~25の位置を示した。そのため、この方法は、疾患特異的抗原の同定、及び同定された抗原上の疾患特異的エピトープの位置の同定の両方を提供する。
スコア決定の例
いくつかの実施形態では、本明細書に記載される病態に特異的な抗原の同定は、以下に記載されるように具体的に同定され得る。
いくつかの実施形態では、本明細書に記載される病態に特異的な抗原の同定は、以下に記載されるように具体的に同定され得る。
サンプルの病態(T)、対照(U)、及び(任意に)第3の対照(V)コホートを定義する。Serimmune Epitope Repertoire Analysisパイプラインによって生成された各サンプルについての12merアミノ酸配列から開始する。
濃縮スコア算出
各12merについて、それを構成要素k-mer(但し、k=5及びk=6)に分割する。各サンプル(S)における全てのk-merについて、濃縮を以下のように算出する:
式中、n(k-mer)は、特定のk-merを含有する独自の12merの数であり、eS(kmer)は、サンプルについてのk-merリードの予測数であり、以下のように定義される:
式中、NSは、Sについて生成された12merリードの数であり、Lseqは、アミノ酸リードの長さ(12)であり、kは、k-mer長さであり、piは、Sからの全ての12merにおけるk-merにおけるi番目のアミノ酸についてのアミノ酸割合である。
各12merについて、それを構成要素k-mer(但し、k=5及びk=6)に分割する。各サンプル(S)における全てのk-merについて、濃縮を以下のように算出する:
式中、n(k-mer)は、特定のk-merを含有する独自の12merの数であり、eS(kmer)は、サンプルについてのk-merリードの予測数であり、以下のように定義される:
式中、NSは、Sについて生成された12merリードの数であり、Lseqは、アミノ酸リードの長さ(12)であり、kは、k-mer長さであり、piは、Sからの全ての12merにおけるk-merにおけるi番目のアミノ酸についてのアミノ酸割合である。
全てのk-merについて、濃縮値を対照集団に対して正規化する。対照濃縮値を以下のように定義する:
式中、Wは、第3の対照コホート(V、定義される場合)であり、そうでなければ対照コホート(U)が使用される。
式中、Wは、第3の対照コホート(V、定義される場合)であり、そうでなければ対照コホート(U)が使用される。
抗原スコア算出。
各タンパク質p及びサンプルsについて、以下のように定義される抗原スコアP(s,p)を算出する:
式中、wは、平滑化ウィンドウの幅であり、len(p)は、タンパク質pの長さであり、k-mer(j,k,p)は、タンパク質pにおける位置Jでの長さkのk-merであり、GSは、ESまたはFSのいずれかである。
各タンパク質p及びサンプルsについて、以下のように定義される抗原スコアP(s,p)を算出する:
式中、wは、平滑化ウィンドウの幅であり、len(p)は、タンパク質pの長さであり、k-mer(j,k,p)は、タンパク質pにおける位置Jでの長さkのk-merであり、GSは、ESまたはFSのいずれかである。
マン・ホイットニーU及びコルモゴロフ・スミルノフのような伝統的な検定を含む、多様な統計的検定を使用してA(p)及びB(p)を比較する。効果量をヘッジのg統計値として算出する。
Tibshirani and Hastie,‘Outlier sums for differential gene expression analysis.’Biostatistics,2007で定義される統計値である、O(p)として定義する外れ値合計を算出する。A(p)及びB(p)におけるサンプルの1000回のランダム再配列を実施し、外れ値合計を算出して、タンパク質pについての外れ値合計の帰無分布であるO0(p)を算出する。
外れ値合計は、i.i.d.変数の合計であるため、中心極限定理を適用し、正規分布を使用してz_(O(p))についてのp値を算出することができる。
Aloc(p)及びBloc(p)を比較するコルモゴロフ・スミルノフ検定を実施して、エピトープの位置的保存を有するタンパク質を同定する。
サンプル
本明細書で使用される場合、「サンプル」は、試料結合分子(例えば、抗体)を含有することが知られているまたは含有することが疑われる任意の物質を指す。通常、サンプルは、液体である。サンプルは、液体として発生した物質であり得、または液体形態に処理される物質であり得る。サンプルは、供給源から直接的に単離された物質(すなわち、未処置)であり得、または方法において使用するためにさらに処理され(例えば、希釈され、濾過され、細胞枯渇され、粒子枯渇され、アッセイされ、保存され、または他の方法で事前処理され)得る。
本明細書で使用される場合、「サンプル」は、試料結合分子(例えば、抗体)を含有することが知られているまたは含有することが疑われる任意の物質を指す。通常、サンプルは、液体である。サンプルは、液体として発生した物質であり得、または液体形態に処理される物質であり得る。サンプルは、供給源から直接的に単離された物質(すなわち、未処置)であり得、または方法において使用するためにさらに処理され(例えば、希釈され、濾過され、細胞枯渇され、粒子枯渇され、アッセイされ、保存され、または他の方法で事前処理され)得る。
サンプルには、動物源に由来する血清、血液、唾液、尿、組織、組織ホモジネート、糞便、髄液、及びライセートが含まれるがこれらに限定されない。サンプルには、異なる源の物質の混合物が含まれ得る。サンプルは、対象となる結合分子を生成する、または生成することが疑われる任意の動物から単離された体液であり得る。動物は、疾患を有することが知られているまたは疑われる場合がある。動物はまた、疾患に関連する抗原またはエピトープと結合する結合分子を有することが知られているまたは疑われる場合がある。例示的な非限定的な例では、サンプルは、特定の疾患を有することが疑われ、その疾患と相関するエピトープに結合する抗体を生成することが疑われるヒトからの処理された血清であり得る。疾患には、細菌感染症、ウイルス感染症、寄生虫感染症、自己免疫性障害、がん、及びアレルギーが含まれるがこれらに限定されない。疾患はまた、疾患の特定の状態もしくは進行、または予測される処置有効性に対応する疾患の状態を指し得る。よって、疾患または病態を有するものとして同定された対象からのサンプルは、感染症、自己免疫性障害、がん、神経障害、または慢性疾患を有すると診断された患者からのサンプルを含み得る。いくつかの実施形態では、慢性疾患は、慢性疲労症候群である。サンプルはまた、治療剤またはワクチンが投与された患者に由来し得る。
同定された同じ疾患または表現型からのサンプルは、サンプルコホートにグループ化され得る。疾患または表現型について陰性であるサンプルは、対照コホートにグループ化され得る。密接に関連するコホート、例えば、ワクチン接種患者対感染患者もまた、本明細書に記載の方法を使用して比較され得る。
本明細書に記載されるように、本発明の組成物及び方法は、対象となるサンプルにおける表現型を特性化するために使用され得る。表現型は、主題の組成物及び方法を使用して特性化され得る対象となる任意の表現型であり得る。表現型が疾患または障害を含む非限定的な例を考慮されたい。そのような場合では、特性化は、疾患または障害についての診断、予後またはセラノーシス(theranosis)を提供することであり得る。例示的な実施形態では、対象からのサンプルは、本発明の組成物及び方法を使用して分析される。次いで、対象における疾患または障害の存在、段階、グレード、アウトカム、または起こり得る治療反応を予測または決定するために分析が使用され得る。分析はまた、そのような予測または決定をする際に補助するために使用され得る。
生物に存在する抗体のレパートリーは、その生物が遭遇した様々な抗原を示し得る。そのような抗原は、外部からの刺激、例えば、ウイルス粒子または微生物、例えば、細菌細胞または真菌に由来し得る。外部からの刺激はまた、花粉もしくはグルテンなどのアレルゲン、または毒素などの環境要因であり得る。生物はまた、内部抗原に特異的な抗体を生成し得る。例えば、自己免疫性障害は、宿主生物の抗原を認識する抗体の形成によって引き起こされる。様々ながん抗原に対する自己抗体が観察されている。要約すると、宿主生物は、多数の疾患、障害及び他の環境要因を示す多数の外部及び内部抗原に対する抗体を含み得る。よって、本発明の組成物及び方法は、限定されないが、環境曝露を決定すること及び/または様々な医学的病態についての診断、予後またはセラノーシスを提供することを含む、生物におけるあらゆる表現型を特性化するために使用され得る。これらの病態には、限定されないが、感染性、自己免疫性、寄生虫性、アレルギー性、新生物性、遺伝性、腫瘍性、神経性、心臓血管性、及び内分泌性疾患及び障害が含まれる。
K-mer濃縮スコアを決定するためのデジタル血清学
本明細書に記載されるように、対象となる各タンパク質からのk-merスコアは、各サンプル及び各コホートからの疾患または病態に対応するプロテオームからのタンパク質における各k-merについての濃縮スコアを同定することによって決定される。いくつかの実施形態では、デジタル血清学は、各サンプルの血清からk-merスコアを決定するために使用される。デジタル血清学は、ペプチドライブラリがヒト血清でスクリーニングされてヒト抗体レパートリーがマッピングされる他のバイオパニングアッセイと類似する次世代シーケンシング(NGS)ベースのアッセイである。そのアッセイは、4つの主要工程:1)血清をペプチドライブラリと共にインキュベーションすること及び各血清サンプルについての抗体レパートリーに特異的なペプチドを発現するライブラリメンバーの親和性選択;2)これらのペプチドをコードするプラスミドの精製;3)ペプチドをコードするプラスミドの領域のPCR増幅(アンプリコン)及びサンプル特異的プライマーでの各サンプルのバーコード化(サンプルをプールし、1回のNGS実行で一緒にシーケンシングすることが可能となる);及び4)NGSによるアンプリコンシーケンシング。アンプリコンがシーケンシングされると、データは、各サンプルからの血清中の抗体が結合するペプチドに基づいて同定されたk-mer配列の絶対数を同定及び決定するために使用され得る。次いでこれらの絶対数は、各k-merについてのスコア、例えば、濃縮スコアまたは比較スコアを決定するために使用され得る。
本明細書に記載されるように、対象となる各タンパク質からのk-merスコアは、各サンプル及び各コホートからの疾患または病態に対応するプロテオームからのタンパク質における各k-merについての濃縮スコアを同定することによって決定される。いくつかの実施形態では、デジタル血清学は、各サンプルの血清からk-merスコアを決定するために使用される。デジタル血清学は、ペプチドライブラリがヒト血清でスクリーニングされてヒト抗体レパートリーがマッピングされる他のバイオパニングアッセイと類似する次世代シーケンシング(NGS)ベースのアッセイである。そのアッセイは、4つの主要工程:1)血清をペプチドライブラリと共にインキュベーションすること及び各血清サンプルについての抗体レパートリーに特異的なペプチドを発現するライブラリメンバーの親和性選択;2)これらのペプチドをコードするプラスミドの精製;3)ペプチドをコードするプラスミドの領域のPCR増幅(アンプリコン)及びサンプル特異的プライマーでの各サンプルのバーコード化(サンプルをプールし、1回のNGS実行で一緒にシーケンシングすることが可能となる);及び4)NGSによるアンプリコンシーケンシング。アンプリコンがシーケンシングされると、データは、各サンプルからの血清中の抗体が結合するペプチドに基づいて同定されたk-mer配列の絶対数を同定及び決定するために使用され得る。次いでこれらの絶対数は、各k-merについてのスコア、例えば、濃縮スコアまたは比較スコアを決定するために使用され得る。
ペプチドライブラリ/ディスプレイライブラリ
本明細書で使用される場合、「ペプチドのライブラリ」または「ペプチドライブラリ」は、スクリーニング目的のために典型的に使用されるペプチド断片の集合を指す。用語「ペプチド」、「ポリペプチド」、「アミノ酸配列」、「ペプチド配列」、及び「タンパク質」は、互いに連結された2つ以上のアミノ酸を指すために互換的に使用され、特定の長さを意味しない。アミノ酸及びペプチドは、天然に存在するか、または合成(例えば、非天然アミノ酸またはアミノ酸アナログ)であり得る。アミノ酸及びペプチドはまた、反応性基、例えば、アミノ酸もしくはペプチドを固体基材に結合させるための反応性基、アミノ酸もしくはペプチドを標識するための反応性基、または対象となる他の部位をアミノ酸もしくはペプチドに結合させるための反応性基を含むか、または含むようにさらに改変され得る。反応性基には、化学的反応性基、例えば、反応性チオール(例えば、マレイミド系反応性基)、反応性アミン(例えば、N-ヒドロキシスクシンイミド系反応性基)、「クリックケミストリー」基(例えば、反応性アルキン基)、及びホルミルグリシン(FGly)を保有するアルデヒドが含まれるがこれらに限定されない。
本明細書で使用される場合、「ペプチドのライブラリ」または「ペプチドライブラリ」は、スクリーニング目的のために典型的に使用されるペプチド断片の集合を指す。用語「ペプチド」、「ポリペプチド」、「アミノ酸配列」、「ペプチド配列」、及び「タンパク質」は、互いに連結された2つ以上のアミノ酸を指すために互換的に使用され、特定の長さを意味しない。アミノ酸及びペプチドは、天然に存在するか、または合成(例えば、非天然アミノ酸またはアミノ酸アナログ)であり得る。アミノ酸及びペプチドはまた、反応性基、例えば、アミノ酸もしくはペプチドを固体基材に結合させるための反応性基、アミノ酸もしくはペプチドを標識するための反応性基、または対象となる他の部位をアミノ酸もしくはペプチドに結合させるための反応性基を含むか、または含むようにさらに改変され得る。反応性基には、化学的反応性基、例えば、反応性チオール(例えば、マレイミド系反応性基)、反応性アミン(例えば、N-ヒドロキシスクシンイミド系反応性基)、「クリックケミストリー」基(例えば、反応性アルキン基)、及びホルミルグリシン(FGly)を保有するアルデヒドが含まれるがこれらに限定されない。
通常、ペプチドライブラリは、多様な独自のペプチドを含有する。例えば、ライブラリの多様性(時にライブラリの「複雑性」と称される)は、104超、105超、106超、107超、108超、109超、1010超、または1011超の独自ペプチドであり得る。ライブラリは、アミノ酸配列に偏りのないランダムペプチドライブラリであり得る。ランダムな/偏りのないライブラリの特定の実施形態は、指定された長さ(複数可)の可能性のある全てのアミノ酸配列を表すために構築されたものである。
ペプチドライブラリはまた、アミノ酸配列がそれらの提示において偏りのある非ランダムライブラリであり得る。例えば、ライブラリは、特定の疾患(例えば、細菌感染症、ウイルス感染症、寄生虫感染症、自己免疫性障害、がん、アレルギーなど)に関連するエピトープまたは抗原、病態、種(例えば、哺乳動物、ヒト、細菌、ウイルスなど)、タンパク質、タンパク質の分類、タンパク質モチーフ(例えば、リン酸化モチーフ、結合モチーフ、タンパク質ドメインなど)、アミノ酸特性(例えば、疎水性、親水性、酸性、塩基性、または立体アミノ酸特性)、または合理的に設計されたアミノ酸配列の任意の他のサブセットなどの特定の特徴に特有のアミノ酸を表す、過剰に表す、主に表す、またはそれのみを表すように偏らせられ得る。ライブラリは、所定のアミノ酸配列またはモチーフを避けるように偏らせられ得る。
ペプチドライブラリはまた、非ランダム及びランダムペプチドライブラリの特徴を組み合わせ得る。例えば、アミノ酸配列内の1つ以上の選抜位置は、一定のアミノ酸であり得、配列内の他の位置は、完全ランダムでもよく、他の特性に基づいて偏っていてもよい。他の例では、アミノ酸配列内の1つ以上の選抜位置は、規定のアミノ酸のサブセットから選択され得る。当業者は、記載される様々な偏りが、標的スクリーンなどのペプチドライブラリの所望の目的を達成するために組み合わされ得ることを理解する。
典型的には、ライブラリにおけるペプチドはまた、全てが様々な長さの範囲に入り得る。例えば、ライブラリにおけるペプチドは、異なる長さであり得るが、全てが規定の長さの範囲内に入り得る。選択された範囲は、本発明に有用な任意の長さ、例えば、結合分子による認識が可能なエピトープ配列を提示するのに好適な任意の長さであり得る。ライブラリにおけるペプチドは、長さが少なくとも5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20アミノ酸であり得る。ライブラリにおけるペプチドはまた、長さが5~30、5~25、5~20、5~15、5~10、10~30、10~25、10~20、または10~15アミノ酸であり得る。ライブラリにおけるペプチドはまた、長さが7~14、8~14、9~14、10~14、11~14、12~14、7~13、8~13、9~13、10~13、11~13、12~13、7~12、8~12、9~12、10~12、11~12、7~11、8~11、9~11、またはアミノ酸であり得る。所望の場合、ライブラリにおけるペプチドはまた、長さが30超、40超、50超、75超、100超、200、または300超のアミノ酸であり得る。
ライブラリにおけるペプチドはまた、規定の長さであり得、すなわち、ライブラリにおけるペプチドの全てが同じ数のアミノ酸を有する。規定の範囲は、本発明に有用な任意の長さ、例えば、結合分子による認識が可能なエピトープ配列を提示するのに好適な任意の長さであり得る。規定の長さは、長さが5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20アミノ酸であり得る。
ペプチド発現ライブラリは、ペプチドライブラリを発現することが可能な核酸配列の集合を指す。核酸配列は、ペプチド多様性、ペプチドランダム化または偏り、及び/またはペプチド長さなどの上述したものを含む所望のライブラリ特性を達成するために構築され得る。対象となるペプチドの発現を可能にする任意の好適な核酸が使用され得る。通常、核酸は、ベクターである。本明細書で使用される場合、「ベクター」は、典型的には宿主生物、例えば、細菌細胞、哺乳動物細胞、またはバクテリオファージにおいて対象となる遺伝子の発現を誘導することが可能な核酸コンストラクトを指す。ベクターは典型的には、ペプチド発現のための所望の宿主によって認識される適切な転写及び翻訳制御ヌクレオチド配列、例えば、プロモーター配列を含有する。プロモーター配列は、構成的プロモーターであり得る。プロモーター配列は、コードされる配列の転写が分析物、化学物質、または他の分子の添加によって誘導される誘導性プロモーター、例えば、Tet-onシステムであり得る。誘導性プロモーターシステムの類型は、転写が積極的に抑制されており、かつ分析物、化学物質、または他の分子の添加、例えば、アラビノースオペロンプロモーター用のアラビノースの添加により抑制が解除されるシステムまたはTet-offシステムである。ベクターはまた、ベクター構築及び生成を容易化する要素、例えば、制限部位、ベクター複製を誘導する配列、薬物選択遺伝子または他の選択可能マーカー、ならびにクローニング及びライブラリ生成に有用な任意の他の要素を含み得る。典型的なベクターは、二本鎖DNAプラスミドであって、所望のペプチドをコードする核酸配列が、ペプチド発現を誘導することが可能な位置及び配向で標準的なクローニング技術を使用して挿入されているものであり得る。他のベクターには、in vitro転写及び翻訳に有用な核酸コンストラクト、線状核酸コンストラクト、及び一本鎖DNAまたはRNA核酸コンストラクトが含まれるがこれらに限定されない。
通常、候補ペプチドの各々についての特定の核酸配列のコピー数は、数のいくらかの変動が確率的に生じ得るが、おおよそ等しい数で存在する。典型的なペプチド発現ライブラリは、特定の核酸配列の複数のコピー(例えば、同じベクターの複数のコピー)を含有し得る。しかしながら、複数のサンプルがそれぞれペプチド発現ライブラリのメンバーを含有する例では、候補ペプチドの各々の絶対数は、サンプル間で等しくない場合がある。例えば、特定の核酸配列の0または1つのコピーが所与のサンプルに存在し得るが、1つ以上のコピーが別の所与のサンプルに存在し得る。特定の核酸配列のコピー数が、他の特定の核酸配列のコピー数と同一である必要はないが、おおよそ同じ数の配列が候補ペプチドの各々について存在することが通常は想定される。
ペプチド発現ライブラリには、細菌発現ライブラリ、酵母発現ライブラリ、バクテリオファージ発現ライブラリ、及び哺乳動物発現ライブラリが含まれるがこれらに限定されない。本発明に有用な特定のペプチドライブラリ及びペプチド発現ライブラリは、発行済み米国特許番号7,256,038、発行済み米国特許番号8,293,685、発行済み米国特許番号7,612,019、発行済み米国特許番号8,361,933、発行済み米国特許番号9,134,309、発行済み米国特許番号9,062,107、発行済み米国特許番号9,695,415、及び米国特許出願公開US2016/0032279(その全体が参照により本明細書にそれぞれ組み込まれる)においてより詳細に記載されている。
独自核酸配列
本明細書で使用される場合、「独自核酸配列」は、対照結合標的を発現する所与の対照ベクターに特異的な規定の独自核酸配列を指す。通常、ペプチド発現ライブラリ内の複数の対照ベクターは、同じ対照結合標的を発現し得るが、規定の対照ベクター(その複数のコピーを含む)は、同一の独自核酸配列を含有する。ペプチド発現ライブラリは、1つ、2つ、3つまたはそれ以上の特定の対照ベクター(例えば、各サブセットが同一の独自核酸配列を含有する1つ、2つ、3つまたはそれ以上の規定のサブセット)を含有し得る。
本明細書で使用される場合、「独自核酸配列」は、対照結合標的を発現する所与の対照ベクターに特異的な規定の独自核酸配列を指す。通常、ペプチド発現ライブラリ内の複数の対照ベクターは、同じ対照結合標的を発現し得るが、規定の対照ベクター(その複数のコピーを含む)は、同一の独自核酸配列を含有する。ペプチド発現ライブラリは、1つ、2つ、3つまたはそれ以上の特定の対照ベクター(例えば、各サブセットが同一の独自核酸配列を含有する1つ、2つ、3つまたはそれ以上の規定のサブセット)を含有し得る。
独自核酸配列は、長さが少なくとも4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドであり得る。ペプチド発現ライブラリが2つ以上の対照ベクターを含有する例では、各独自核酸配列は、同一の規定の長さ、例えば、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドの長さであり得る。ペプチド発現ライブラリが2つ以上の対照ベクターを含有する例では、独自核酸配列の各々は、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10~15、少なくとも15~20、または少なくとも20~30ヌクレオチド異なり得る。
独自核酸配列は、転写されないがNGSなどの下流プロセスのための増幅が可能となるように構築された領域に存在するように、対照ベクターの一部に存在し得る。独自核酸配列は、規定のペプチド配列の一部として発現する独自ペプチド配列をコードし得る。
独自ペプチド配列
独自核酸配列は、規定のペプチド配列の一部として発現する独自ペプチド配列をコードし得る。独自ペプチド配列は、長さが少なくとも5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20アミノ酸であり得る。ペプチド発現ライブラリが2つ以上の対照ベクターを含有する例では、各独自ペプチド配列は、同一の規定の長さ、例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20アミノ酸の長さであり得る。規定のペプチド配列及び独自ペプチド配列は、互いに直接隣接していてもよく、または追加のペプチド配列によって隔てられていてもよく、独自ペプチド配列のN末端またはC末端であり得る。
独自核酸配列は、規定のペプチド配列の一部として発現する独自ペプチド配列をコードし得る。独自ペプチド配列は、長さが少なくとも5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20アミノ酸であり得る。ペプチド発現ライブラリが2つ以上の対照ベクターを含有する例では、各独自ペプチド配列は、同一の規定の長さ、例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20アミノ酸の長さであり得る。規定のペプチド配列及び独自ペプチド配列は、互いに直接隣接していてもよく、または追加のペプチド配列によって隔てられていてもよく、独自ペプチド配列のN末端またはC末端であり得る。
規定のペプチド配列の組成は、発現する場合、制御することが重要であり得る。例えば、ペプチド発現ライブラリが2つ以上の対照ベクターを含有する例では、様々な規定のペプチド配列は、アーティファクトにつながり得る発現全体に対するアミノ酸組成の潜在的影響を制限するように構築され得る。非限定的な例示的な例では、規定のペプチドの各々はそれぞれ、全体として同じアミノ酸から構成されるが、アミノ酸の順序は、各々の規定のペプチドについて独自である。よって、特定のアミノ酸の存在に起因する任意の潜在的な発現の偏りが最小化される。他の例では、全体の組成における少なくとも1つのアミノ酸は異なるが、同じ分類のアミノ酸、例えば、疎水性、親水性などのアミノ酸と置換されている。
ライブラリアレイ
一連の実施形態では、組成物は、上述したペプチド発現ライブラリ組成物のうちの2つ以上から構成され得る。2つ以上のペプチド発現ライブラリ組成物はそれぞれ、別々の容器、例えば、マルチウェルプレートにおけるウェル、微小遠心チューブ、試験管、チューブ、及びPCRチューブに含有され得る。別々の容器の各々は、ペプチドのライブラリをコードする核酸配列の同じライブラリを含み得るが、各容器は、異なる対照ベクター(すなわち、独自核酸配列を有する対照ベクター)を含有する。別の例では、別々の容器の各々は、ペプチドのライブラリをコードする核酸配列の同じライブラリを含み得るが、各容器は、対照ベクターの異なる組み合わせを含有し、例えば、所与の容器は、別の容器と共通する対照ベクターのうちの1つ以上を共有し得るが、対照ベクターの正確な組み合わせは、その所与の容器に特有である。対照ベクターの組み合わせはまた、所与の容器が対照ベクターのいずれかを別の容器と共有しないようなものであり得る。
一連の実施形態では、組成物は、上述したペプチド発現ライブラリ組成物のうちの2つ以上から構成され得る。2つ以上のペプチド発現ライブラリ組成物はそれぞれ、別々の容器、例えば、マルチウェルプレートにおけるウェル、微小遠心チューブ、試験管、チューブ、及びPCRチューブに含有され得る。別々の容器の各々は、ペプチドのライブラリをコードする核酸配列の同じライブラリを含み得るが、各容器は、異なる対照ベクター(すなわち、独自核酸配列を有する対照ベクター)を含有する。別の例では、別々の容器の各々は、ペプチドのライブラリをコードする核酸配列の同じライブラリを含み得るが、各容器は、対照ベクターの異なる組み合わせを含有し、例えば、所与の容器は、別の容器と共通する対照ベクターのうちの1つ以上を共有し得るが、対照ベクターの正確な組み合わせは、その所与の容器に特有である。対照ベクターの組み合わせはまた、所与の容器が対照ベクターのいずれかを別の容器と共有しないようなものであり得る。
特定の実施形態では、容器は、マルチウェルプレート、例えば、96ウェルプレート内のウェルであり得、組成物は、ペプチド発現ライブラリ組成物の各々が、隣接ウェルにおけるものとは異なる少なくとも1つの対照ベクターを含有するように配置される。別の特定の実施形態では、容器は、マルチウェルプレート内のウェルであり得、ペプチド発現ライブラリ組成物の各々は、少なくとも2つのベクター対照を含有し、組成物は、各隣接ウェルが共通の対照ベクターを共有しないように配置される。
ペプチド発現ライブラリ組成物の集合は、2、3、4、5、6、7、8、9、10~15、16~24、24~48、48~96、または96~384種のペプチド発現ライブラリ組成物であり得る。ペプチド発現ライブラリ組成物の集合は、少なくとも10、少なくとも20、少なくとも50、少なくとも100、少なくとも200、少なくとも300、少なくとも500、少なくとも1000、または少なくとも2000種の発現ライブラリ組成物であり得る。
アレイ表面
本明細書で使用される場合、「アレイ表面」は、それらのそれぞれの結合分子による認識に好適な様式で結合標的を提示する(すなわち、示す)ように構成され得る任意の表面を指す。
本明細書で使用される場合、「アレイ表面」は、それらのそれぞれの結合分子による認識に好適な様式で結合標的を提示する(すなわち、示す)ように構成され得る任意の表面を指す。
アレイ表面は、生物学的表面(例えば、細胞の外側膜表面)であり得る。使用され得る生物学的実体には、哺乳動物細胞、酵母、細菌、ウイルス、及びバクテリオファージが含まれるがこれらに限定されない。ペプチドのライブラリ(例えば、候補ペプチド)のメンバー及び/または対照結合標的は、ペプチドのライブラリをコードする核酸配列のライブラリまたは対照結合標的をコードする核酸配列を、ペプチドの一部として発現し、かつ生物学的実体表面上での提示のためにペプチドを誘導することが可能となるように構成される細胞表面ディスプレイペプチドもコードするように構築するなどして、細胞の表面上に発現されるように修飾され得る。大腸菌(E.coli)細胞表面提示ライブラリの例示的な非限定的な例は、発行済み米国特許番号7,256,038、発行済み米国特許番号8,293,685、発行済み米国特許番号7,612,019、発行済み米国特許番号8,361,933、発行済み米国特許番号9,134,309、発行済み米国特許番号9,062,107、発行済み米国特許番号9,695,415、及び米国公開された出願US20160032279(それが教示する全てについて参照により本明細書にそれぞれ組み込まれる)においてより詳細に記載されている。
アレイ表面は、固体支持体を含み得る。固体支持体は、それらの表面に結合したタンパク質、核酸、またはその両方を有し得、本発明において使用するために適応され得る。タンパク質及び核酸を結合させる方法は、当業者に知られており、化学的反応性基、例えば、反応性チオール(例えば、マレイミド系反応性基)、反応性アミン(例えば、N-ヒドロキシスクシンイミド系反応性基)、「クリックケミストリー」基(例えば、反応性アルキン基)、ホルミルグリシン(FGly)を保有するアルデヒド及び他の類似改変(例えば、ビオチン-ストレプトアビジン対、ジスルフィド連結、ポリヒスチジン-ニッケル)の使用が含まれるがこれらに限定されない。
通常、使用されるアレイ表面は、ペプチドのライブラリ及び対照結合標的の両方について同じである。ペプチドのライブラリに使用されるアレイ表面は、所望の場合、対照結合標的とは異なり得る。
アッセイ方法
本明細書で使用される場合、「接触させること」は、試料結合分子及び対照結合分子をそれらのそれぞれの結合標的に近接させ、それに結合するのに十分な条件下に置く任意の方法を指す。異なる成分の接触は、任意の好適な順序で実施され得る。例えば、ペプチド発現ライブラリ組成物及び対照結合分子は、そのいずれかをサンプルと接触させる前に接触させられ得る。別の例では、サンプル及び対照結合分子は、そのいずれかをペプチド発現ライブラリ組成物と接触させる前に接触させられ得る。
本明細書で使用される場合、「接触させること」は、試料結合分子及び対照結合分子をそれらのそれぞれの結合標的に近接させ、それに結合するのに十分な条件下に置く任意の方法を指す。異なる成分の接触は、任意の好適な順序で実施され得る。例えば、ペプチド発現ライブラリ組成物及び対照結合分子は、そのいずれかをサンプルと接触させる前に接触させられ得る。別の例では、サンプル及び対照結合分子は、そのいずれかをペプチド発現ライブラリ組成物と接触させる前に接触させられ得る。
接触させることは、組成物の全てを一緒に混合することを含み得る。混合することは、容器、例えば、マルチウェルプレートにおけるウェル、微小遠心チューブ、試験管、チューブ、及びPCRチューブにおいて実施され得る。混合には、回転、インキュベーション、ピペッティング、反転、ボルテックス、振盪、または他の機械的撹拌要素が含まれ得る。
本明細書で使用される単離工程は、試料及び対照結合分子を回収するのに有用な任意の方法であり得る。単離は、捕捉体の使用を含み得る。単離方法には、磁気単離、ビーズ遠心分離、樹脂遠心分離、及びFACSが含まれるがこれらに限定されない。使用される場合、捕捉体の特性に基づいて特定の単離方法、例えば、磁性ビーズの磁気単離または蛍光ビーズのFACS単離が選択され得る。
本明細書で使用される決定工程は、通常、核酸をシーケンシング及び/または定量するための任意の方法、例えば、次世代シーケンシング(NGS)または定量的ポリメラーゼ連鎖反応(qPCR)を使用し得る。NGS技術の例には、超並列シーケンシング技術及びプラットフォーム、例えば、Illumina HiSeqまたはMiSeq、Thermo PGMまたはプロトン、Pac Bio RS IIまたはSequel、Qiagen’s Gene Reader、及びOxford Nanopore MinIONが含まれる。さらなる類似の現行の超並列シーケンシング技術もこれらの技術の将来の世代に加えて使用され得る。いくつかの実施形態では、決定工程は、1)生物学的実体からヌクレオチドを精製する工程;2)独自核酸配列及び任意に、単離された試料結合分子によって結合したペプチドをコードする核酸配列を増幅する工程;及び2)増幅したヌクレオチドをシーケンシングする工程を含む。シーケンシングされる核酸はまた、シーケンシングを容易化するためにさらに改変または処理され得る。例えば、核酸は、増幅工程中に増幅されるヌクレオチドの末端にサンプルに独自のサンプル同定核酸配列を加えるなどして、複数のサンプルを同時にマルチプレックスハイスループットシーケンシングするために改変され得る。
様々な核酸配列(例えば、ペプチドのライブラリをコードする配列、対照結合標的をコードする配列、独自核酸配列)は、決定工程(複数可)中に互いに区別され得る。様々な核酸配列を区別することは、核酸配列の部分を区別すること、例えば、ベクターにおける異なる配列を区別すること(例えば、結合標的をコードする核酸配列を独自核酸配列から区別すること)を含む。配列は、配列内の位置、隣接配列の同一性、配列の既知の同一性、またはそれらの組み合わせなどの特定の特徴に基づいて区別され得る。当該技術分野で知られているものなどの配列アライメントアルゴリズムは、異なる配列を同定、定量、及び区別するために使用され得る。
濃縮評価
ペプチド発現ライブラリにおける候補ペプチドをコードする単離された独自核酸配列の同一性及び量は、サンプルにおけるペプチド配列の濃縮を評価するために使用され得る。
ペプチド発現ライブラリにおける候補ペプチドをコードする単離された独自核酸配列の同一性及び量は、サンプルにおけるペプチド配列の濃縮を評価するために使用され得る。
評価は、コンピュータの使用を含み得る。通常、コンピュータは、結果、例えば、シーケンシング工程中に生成された配列などの核酸配列を決定する結果またはサンプルからの濃縮結果を提供する評価工程の結果を提供するためのコンピュータプログラムを実行するために適応される。通常、核酸配列を決定する工程及び濃縮を決定する工程は、そのような多数の計算を含み、特に通常検討される配列の数を考慮すると、それらは、合理的な時間量で完了させるためにコンピュータシステムによって行われる。それらは、実際上、ヒトの頭脳によってもペン及び紙単独でも行うことはできない。
コンピュータは、チップセットに接続された少なくとも1つのプロセッサを含み得る。また、チップセットには、メモリデバイス、メモリコントローラハブ、インプット/アウトプット(I/O)コントローラハブ、及び/またはグラフィックスアダプタが接続され得る。本発明の様々な実施形態は、コンピュータシステムのプロセッサによる実行のための非一時的コンピュータ可読記憶媒体に記憶されたコンピュータプログラム命令として実施され得る。命令は、実施形態(本明細書に記載の方法を含む)の機能を定義する。例示的なコンピュータ可読記憶媒体には、(i)情報が永続的に記憶される書き換え不可能な記憶媒体(例えば、CD-ROMドライブによって読み取り可能なCD-ROMディスク、フラッシュメモリ、ROMチップまたは任意のタイプのソリッドステート不揮発性半導体メモリなどのコンピュータ内の読み取り専用メモリデバイス)、及び(ii)変更可能な情報が記憶される書き換え可能な記憶媒体(例えば、ディスケットドライブもしくはハードディスクドライブ内のフロッピーディスクまたは任意のタイプのソリッドステートランダムアクセス半導体メモリなど)が含まれるがこれらに限定されない。
コンピュータは、コンピュータをプログラミングする(すなわち、コンピュータプログラム命令を提供する)ための、例えば、配列アライメントソフトウェアまたは品質管理評価ソフトウェアを提供するための手段を含み得る。コンピュータは、キーボード、マウス、タッチスクリーンインターフェースまたはそれらの組み合わせを含むがこれらに限定されない、配列などの情報を入力するための手段を含み得る。コンピュータは、情報及び画像を表示するための手段、例えば、グラフィックアダプタまたはディスプレイを含み得る。コンピュータは、他のコンピュータ(例えば、コンピュータネットワーク)に接続するための手段、例えば、ネットワークアダプタを含み得る。
本明細書における説明の一部は、情報に対するオペレーションのアルゴリズム及び記号的表現の観点から実施形態を記載している。これらのアルゴリズム的記載及び表現は、データ処理の分野の当業者によって一般的に使用されて、彼らの業績の実体が他の当業者へ効率的に伝達される。これらのオペレーションは、機能的、計算的、または論理的に説明されているが、コンピュータプログラム、等価電気回路などによって実施されることが理解される。記載されるオペレーション及びそれらの関連モジュールは、ソフトウェア、ファームウェア、ハードウェア、またはそれらの組み合わせで具現化され得る。
濃縮は、サンプルに存在する特異的な独自ペプチド配列の比またはパーセンテージであり得る。
一例では、決定工程、例えば、全ての独自核酸配列を同定及び定量するためのNGSは、独自核酸配列の総数に対して存在するサンプルに特異的な独自核酸配列(すなわち、所与のサンプルに割り当てられた配列(複数可))のパーセンテージを算出するために使用され得、その総数は、サンプルに特異的な独自核酸配列の数及びサンプルに特異的ではない独自核酸配列の数を含む(すなわち、サンプル割り当てにかかわらず全ての独自核酸配列の量)。確立された品質管理基準を下回るパーセンテージは、サンプル間のコンタミネーションなどの方法におけるエラーを示し、サンプルを無効化し得る。品質管理基準は、90~100%の間、92~100%の間、95~100%の間、96~100%、または98~100%の間であり得る。品質管理基準は、約90%、約92%、約95%、約96%、約97%、約98%、または約99%であり得る。品質管理基準は、少なくとも98%であり得る。
別の例では、決定工程、例えば、全ての独自核酸配列を同定及び定量するためのNGSは、核酸配列の総数に対するサンプルに特異的な独自核酸配列のパーセンテージを算出するために使用され得、その総数は、サンプルに特異的な独自核酸配列及び非特異的な独自核酸配列の数ならびにペプチドのライブラリにおけるペプチドをコードする核酸配列の数を含む。確立された品質管理基準を上回るまたは下回るパーセンテージは、方法におけるエラーを示し、サンプルを無効化し得る。品質管理基準は、0.01%~2.0%の間、0.05%~2.0%の間、または0.01%~1.0%の間であり得る。品質管理基準は、0.05%~1.0%であり得る。本明細書に記載されるコンピュータは、本明細書に記載の決定(例えば、シーケンシング)及び評価工程を実施するために使用され得る。
コンピュータ
本明細書に記載のアッセイ(例えば、k-mer濃縮スコア決定、プロテオームのタンパク質におけるk-mer同定、k-mer濃縮値を使用する各コホートからの各サンプルについての病態関連プロテオームにおける各タンパク質についての抗原スコアの決定、各タンパク質についての外れ値抗原スコアの決定、対象となる病態についての関連抗原の同定、抗原上の抗原性モチーフの同定、配列アライメント/クラスタリング、NGS適用など)の多くは典型的には、実際上、ヒトの頭脳によってもペン及び紙単独でも行うことはできないので、コンピュータの使用を必要とする。通常、コンピュータは、結果、例えば、シーケンシング工程中に生成された配列などの核酸配列を決定する結果またはアッセイが品質管理基準を満たすかどうかを提供する評価工程の結果を提供するためのコンピュータプログラムを実行するために適応される。通常、核酸配列を決定する工程及び評価工程の結果を決定する工程は、そのような多数の計算を含み、特に通常検討される配列の数を考慮すると、それらは、合理的な時間量で完了させるためにコンピュータシステムによって行われる。それらは、実際上、ヒトの頭脳によってもペン及び紙単独でも行うことはできない。コンピュータは、チップセットに接続された少なくとも1つのプロセッサを含み得る。また、チップセットには、メモリデバイス、メモリコントローラハブ、インプット/アウトプット(I/O)コントローラハブ、及び/またはグラフィックスアダプタが接続され得る。本発明の様々な実施形態は、コンピュータシステムのプロセッサによる実行のための非一時的コンピュータ可読記憶媒体に記憶されたコンピュータプログラム命令として実施され得る。命令は、実施形態(本明細書に記載の方法を含む)の機能を定義する。例示的なコンピュータ可読記憶媒体には、(i)情報が永続的に記憶される書き換え不可能な記憶媒体(例えば、CD-ROMドライブによって読み取り可能なCD-ROMディスク、フラッシュメモリ、ROMチップまたは任意のタイプのソリッドステート不揮発性半導体メモリなどのコンピュータ内の読み取り専用メモリデバイス)、及び(ii)変更可能な情報が記憶される書き換え可能な記憶媒体(例えば、ディスケットドライブもしくはハードディスクドライブ内のフロッピーディスクまたは任意のタイプのソリッドステートランダムアクセス半導体メモリなど)が含まれるがこれらに限定されない。
本明細書に記載のアッセイ(例えば、k-mer濃縮スコア決定、プロテオームのタンパク質におけるk-mer同定、k-mer濃縮値を使用する各コホートからの各サンプルについての病態関連プロテオームにおける各タンパク質についての抗原スコアの決定、各タンパク質についての外れ値抗原スコアの決定、対象となる病態についての関連抗原の同定、抗原上の抗原性モチーフの同定、配列アライメント/クラスタリング、NGS適用など)の多くは典型的には、実際上、ヒトの頭脳によってもペン及び紙単独でも行うことはできないので、コンピュータの使用を必要とする。通常、コンピュータは、結果、例えば、シーケンシング工程中に生成された配列などの核酸配列を決定する結果またはアッセイが品質管理基準を満たすかどうかを提供する評価工程の結果を提供するためのコンピュータプログラムを実行するために適応される。通常、核酸配列を決定する工程及び評価工程の結果を決定する工程は、そのような多数の計算を含み、特に通常検討される配列の数を考慮すると、それらは、合理的な時間量で完了させるためにコンピュータシステムによって行われる。それらは、実際上、ヒトの頭脳によってもペン及び紙単独でも行うことはできない。コンピュータは、チップセットに接続された少なくとも1つのプロセッサを含み得る。また、チップセットには、メモリデバイス、メモリコントローラハブ、インプット/アウトプット(I/O)コントローラハブ、及び/またはグラフィックスアダプタが接続され得る。本発明の様々な実施形態は、コンピュータシステムのプロセッサによる実行のための非一時的コンピュータ可読記憶媒体に記憶されたコンピュータプログラム命令として実施され得る。命令は、実施形態(本明細書に記載の方法を含む)の機能を定義する。例示的なコンピュータ可読記憶媒体には、(i)情報が永続的に記憶される書き換え不可能な記憶媒体(例えば、CD-ROMドライブによって読み取り可能なCD-ROMディスク、フラッシュメモリ、ROMチップまたは任意のタイプのソリッドステート不揮発性半導体メモリなどのコンピュータ内の読み取り専用メモリデバイス)、及び(ii)変更可能な情報が記憶される書き換え可能な記憶媒体(例えば、ディスケットドライブもしくはハードディスクドライブ内のフロッピーディスクまたは任意のタイプのソリッドステートランダムアクセス半導体メモリなど)が含まれるがこれらに限定されない。
コンピュータは、コンピュータをプログラミングする(すなわち、コンピュータプログラム命令を提供する)ための、例えば、配列アライメントソフトウェアまたは品質管理評価ソフトウェアを提供するための手段を含み得る。コンピュータは、キーボード、マウス、タッチスクリーンインターフェースまたはそれらの組み合わせを含むがこれらに限定されない、配列などの情報を入力するための手段を含み得る。コンピュータは、情報及び画像を表示するための手段、例えば、グラフィックアダプタまたはディスプレイを含み得る。コンピュータは、他のコンピュータ(例えば、コンピュータネットワーク)に接続するための手段、例えば、ネットワークアダプタを含み得る。本明細書における説明の一部は、情報に対するオペレーションのアルゴリズム及び記号的表現の観点から実施形態を記載している。これらのアルゴリズム的記載及び表現は、データ処理の分野の当業者によって一般的に使用されて、彼らの業績の実体が他の当業者へ効率的に伝達される。これらのオペレーションは、機能的、計算的、または論理的に説明されているが、コンピュータプログラム、等価電気回路などによって実施されることが理解される。記載されるオペレーション及びそれらの関連モジュールは、ソフトウェア、ファームウェア、ハードウェア、またはそれらの組み合わせで具現化され得る。
コンピュータは、本明細書に記載されるように、サンプル及び/またはコホート特異的抗原配列を同定する方法ならびにk-mer濃縮スコアを使用するエピトープ同定方法を実施するために使用され得る。いくつかの実施形態では、各血清サンプルからのk-merレベル統計値または抗原性ペプチド情報は、効率的なデータベース(すなわち、BigTable)に記憶される。
本明細書に記載の異なる方法は、相互に排他的ではない。
均等物及び範囲
当業者は、本明細書に記載の本発明による特定の実施形態と同等の多くのものを認識する、または、通常の実験のみを使用して、それらを確認することができるであろう。本発明の範囲は、上記説明に限定されることを意図するものではなく、添付の特許請求の範囲に記載される通りである。
当業者は、本明細書に記載の本発明による特定の実施形態と同等の多くのものを認識する、または、通常の実験のみを使用して、それらを確認することができるであろう。本発明の範囲は、上記説明に限定されることを意図するものではなく、添付の特許請求の範囲に記載される通りである。
特許請求の範囲では、「a」、「an」、及び「the」などの冠詞は、反対の指示がない限り、または別途文脈から明らかでない限り、1つまたは複数を意味し得る。群の1つ以上の要素の間に「または」を含む請求項または記載は、その反対が示されるか、または別途文脈から明白でない限り、1つ、2つ以上、または全ての群要素が、所与の製品または過程において存在するか、用いられるか、またはそうでなければ関連する場合に、満たされると考えられる。本発明は、群の正確な1つの要素が、所与の生成物またはプロセスにおいて存在するか、用いられるか、またはそうでなければ関連する実施形態を含む。本発明は、群のメンバーのうちの複数または全てが、所与の生成物またはプロセスに存在する、用いられるか、またはそうでなければ関連する実施形態を含む。
「含むこと(comprising)」という用語は、オープンであることが意図され、追加の要素またはステップを含むことを許容するが、必要とはしないことにも留意される。「含むこと(comprising)」という用語が本明細書で使用される場合、「からなること(consisting of)」という用語も包含及び開示される。
範囲が与えられる場合、端点が含まれる。さらに、別途指示のない限り、または別途文脈及び当業者の理解から明らかでない限り、範囲として表現される値は、文脈に別途明示のない限り、範囲の下限の単位の10分の1まで、本発明の異なる実施形態の記載範囲の任意の具体的な値または部分範囲を想定し得ると理解すべきである。
引用される全ての出典、例えば、本明細書で引用される参考文献、出版物、データベース、データベースエントリー、及び技術は、引用で明示的に記載されていない場合でも、参照により本出願に組み込まれる。引用された出典及び本出願の記述が矛盾する場合、本出願の記述が優先されるものとする。
セクション及び表の見出しは、限定することが意図されない。
以下は、本発明を実施するための特定の実施形態の例である。これらの実施例は、例証目的で提示されているにすぎず、決して本発明の範囲を限定することを意図するものではない。使用される数(例えば、量、温度など)に対する正確性を確保する努力がなされているが、いくつかの実験誤差及び偏差が当然ながら許容されるべきである。
本発明の実施は、別途指示のない限り、当業者の範囲内で、タンパク質化学、生化学、組み換えDNA手法、及び薬理学の従来の方法を用いるであろう。そのような手法は、文献で完全に説明される。例えば、T.E.Creighton,Proteins:Structures and Molecular Properties(W.H.Freeman and Company,1993);A.L.Lehninger,Biochemistry(Worth Publishers,Inc.,current addition);Sambrook,et al.,Molecular Cloning:A Laboratory Manual(2nd Edition,1989);Methods In Enzymology(S.Colowick and N.Kaplan eds.,Academic Press,Inc.);Remington’s Pharmaceutical Sciences,18th Edition(Easton,Pennsylvania:Mack Publishing Company,1990);Carey and Sundberg Advanced Organic Chemistry 3rd Ed. (Plenum Press)Vols A and B(1992)参照。
本発明に有用な方法、例えば、モチーフ決定及びモチーフ分析を含むデジタル血清学はまた、Pantazes,et al.及び国際PCT特許出願公開WO2017/083874A1(それらが教示する全てについて参照によりそれぞれが本明細書に組み込まれる)においてより詳細に記載されている。
実施例1:デジタル血清学アッセイ
細菌表面ディスプレイ抗体スクリーン
8×109の独立した形質変換体から構成される大規模高品質細菌ディスプレイランダム12-merペプチドライブラリを、終止コドンを排除し、アミノ酸使用頻度を正規化するためにトリヌクレオチドオリゴを使用して構築した。Rice,et al.(それが教示する全てについて参照により本明細書に組み込まれる)により詳細に記載されているように、12-merペプチドライブラリを、先行して報告された修飾タンパク質骨格(eCPX)のN末端を介してE.coli上に提示した。E.coli表面提示ペプチドライブラリにおいて有用なベクター、方法、及び他のツールは、発行済み米国特許番号7,256,038、発行済み米国特許番号8,293,685、発行済み米国特許番号7,612,019、発行済み米国特許番号8,361,933、発行済み米国特許番号9,134,309、発行済み米国特許番号9,062,107、発行済み米国特許番号9,695,415、及び米国公開された出願US20160032279(それらが教示する全てについて参照により本明細書にそれぞれ組み込まれる)においてより詳細に記載されている。
細菌表面ディスプレイ抗体スクリーン
8×109の独立した形質変換体から構成される大規模高品質細菌ディスプレイランダム12-merペプチドライブラリを、終止コドンを排除し、アミノ酸使用頻度を正規化するためにトリヌクレオチドオリゴを使用して構築した。Rice,et al.(それが教示する全てについて参照により本明細書に組み込まれる)により詳細に記載されているように、12-merペプチドライブラリを、先行して報告された修飾タンパク質骨格(eCPX)のN末端を介してE.coli上に提示した。E.coli表面提示ペプチドライブラリにおいて有用なベクター、方法、及び他のツールは、発行済み米国特許番号7,256,038、発行済み米国特許番号8,293,685、発行済み米国特許番号7,612,019、発行済み米国特許番号8,361,933、発行済み米国特許番号9,134,309、発行済み米国特許番号9,062,107、発行済み米国特許番号9,695,415、及び米国公開された出願US20160032279(それらが教示する全てについて参照により本明細書にそれぞれ組み込まれる)においてより詳細に記載されている。
ライブラリスクリーニングの前に血清サンプルからE.coli結合抗体を取り除くために、ライブラリ骨格を単独で発現する細胞の誘導培養物を希釈された血清と共にインキュベーションした(E.coli株MC1061[FaraΔ139D(ara-leu)7696 GalE15 GalK16Δ(lac)X74 rpsL(StrR)hsdR2(rK-mK+)mcrA mcrB1]を表面ディスプレイベクターpB33eCPXと共に使用した)。34μg/mLのクロラムフェニコール(CM)及び0.2%グルコースが補充されたLB(10gのトリプトン、5gの酵母抽出物、10g/LのNaCl)中で激しく撹拌しながら(250rpm)37℃で一晩増殖させたeCPX培養物を遠心分離によって収集し、フレッシュなLB+CM中に播種し、OD600=0.6まで増殖させ、0.02%wt/volのL(+)-アラビノースで37℃で1時間誘導した。誘導後、細胞を3,000相対遠心力(rcf)で5分間遠心分離し、冷PBST(PBS+0.1%Tween20)で1回洗浄し、1:25で希釈した血清を含有する750μLのPBSTに再懸濁した(枯渇サンプル当たり1×1010細胞)。サンプルをオービタルシェーカーで(20rpm)穏やかに混合しながら4℃で一晩インキュベーションした。インキュベーションした培養物を5,000rcfで5分間2回遠心分離することによってE.coliまたはeCPX骨格に結合した抗体を取り除き、各遠心分離後に血清上清を回収した。枯渇血清を、使用の間、最大で2週間4℃で保存した。
細菌ディスプレイペプチドライブラリを使用して、磁気活性化セルソーティング(MACS)により、個々の血清サンプル中の抗体に対するペプチド結合体をスクリーニングし、単離した。MACSスクリーンは磁気選択を用いて、抗体結合ペプチドについてライブラリを濃縮し、また、後のスクリーニング工程に好適なライブラリサイズを減少させた。1011細胞を含有するライブラリ(>10xの予測多様性)の凍結アリコートを解凍し、500mlLB+CMに播種した。250rpmで振盪しながら37℃でOD600=0.6まで増殖させた後、同じ増殖条件を使用して細胞を0.02%wt/volのL(+)-アラビノースで1時間誘導した。細胞(サンプル当たり5×1010)を遠心分離(10分間3,000rcf)によって収集し、750μLの冷PBSTに再懸濁した。血清とのインキュベーションの前に、細胞を洗浄したプロテインA/G磁性ビーズ(Pierce)と50細胞当たり1ビーズの比で45分間4℃で穏やかに混合しながらインキュベーションすることによってプロテインA/Gに結合するペプチドを取り除いた。5分間(2回)の磁気分離を用いて、結合していない細胞を回収した。上清から回収した細胞を遠心分離し、希釈した血清に再懸濁し(1:25)、穏やかに混合しながら4℃で45分間インキュベーションする。血清インキュベーション後、細胞を遠心分離によって洗浄し、750μLの冷PBST(x3)に再懸濁した。最後の再懸濁の後、洗浄したプロテインA/G磁性ビーズを50細胞当たり1ビーズの比で加えた。プロテインA/Gビーズと共に4℃で穏やかに撹拌しながら45分インキュベーションした後、2回目の磁気分離により、血清抗体に結合するペプチドを発現する細胞を単離した。上清(未結合細胞)を廃棄し、分離した細胞/ビーズを750μL冷PBSTで洗浄した。チューブが磁化されている間、5回の繰り返し洗浄を実施した。最後の洗浄後、ビーズを1mLのLBに再懸濁し、25mLのLB+CM+グルコースに播種して発現を抑制した。フラスコを250rpmで振盪しながら37℃で一晩培養した。
次世代シーケンシング
MACS濃縮後に一晩成長させた細胞を収集し、プラスミドminiprepキット(Qiagen)を使用してプラスミドを抽出した。ランダムペプチド領域を2工程のPCRを使用して増幅させた。最初のPCR工程のため、プライマーには、eCPX骨格のランダム領域(ペプチドライブラリ)に隣接するアニーリング領域を有するIlluminaシーケンシングプラットフォームに特異的なアダプタが含まれる。太字領域はeCPX骨格にアニーリングし、nnnnnは、NGSプロトコルがシーケンシングチップ上のシーケンシングリード、特にペプチドをコードするヌクレオチドの前の不変ベクター配列を有する配列を区別することを補助する5つのランダム縮重塩基である。
フォワードプライマー(配列番号1):
リバースプライマー(配列番号2):
MACS濃縮後に一晩成長させた細胞を収集し、プラスミドminiprepキット(Qiagen)を使用してプラスミドを抽出した。ランダムペプチド領域を2工程のPCRを使用して増幅させた。最初のPCR工程のため、プライマーには、eCPX骨格のランダム領域(ペプチドライブラリ)に隣接するアニーリング領域を有するIlluminaシーケンシングプラットフォームに特異的なアダプタが含まれる。太字領域はeCPX骨格にアニーリングし、nnnnnは、NGSプロトコルがシーケンシングチップ上のシーケンシングリード、特にペプチドをコードするヌクレオチドの前の不変ベクター配列を有する配列を区別することを補助する5つのランダム縮重塩基である。
フォワードプライマー(配列番号1):
リバースプライマー(配列番号2):
最初のPCRからの産物を、Agencourt Ampure XP(Beckman Coulter)クリーンアップビーズを使用して25ラウンドのPCR増幅(タッチダウンPCR)の後に精製した。得られた産物を、Illumina Nextera XTインデックス化プライマー(Illumina)を使用して第2ラウンドのPCRに供した。これらのプライマーは、スクリーニング及びアンプリコン調製のために使用されるサンプルまで配列を遡るためにアンプリコンの3’末端及び5’末端に独自の8塩基対のインデックスを提供する。アンプリコンをクリーンアップしてから8ラウンドのPCR増幅(70℃のアニーリング温度)を行った。最後のPCR産物(アンプリコン)のDNA濃度を、Qbit装置(Life Technologies)でDNA高感度試薬を使用して測定した。全てのサンプルを4nMに正規化し、シーケンシングライブラリに一緒にプールした。
プールされたサンプルを希釈し、NextSeq装置にロードした。75サイクル高出力フローセルをシングルリード(一方向)及び二重インデックス化(5’及び3’インデックスがシーケンシングされる)と共に使用した。シーケンシングが完了した後、サンプルをIllumina Nextera XTインデックスを用いて帰属サンプル同一性を使用して自動的に脱マルチプレックス化した。
NGS分析の後、サンプルを各12-merペプチド内の各k-merの濃縮について分析した。各12-merペプチドを、5アミノ酸(すなわち、5-merペプチド配列)及び6アミノ酸(すなわち、6-merペプチド配列)の構成的k-mer配列に分割した。例えば、12-merタンパク質配列ABCDEFGHIJKLは、以下の5aaのk-mer配列(すなわち、5-mer):ABCDE、BCDEF、CDEFG、DEFGH、EFGHI、FGHIJ、GHIJK、及びHIJKLに分割されるであろう。各k-merについての(全ての12-merにわたって)観察された例の数を予測された例の数で除算することによって濃縮スコアを算出した。具体的には、各k-merについてのZ-スコアを算出した(各Z-スコアは、濃縮値から全てのサンプルについての平均濃縮を減算したものを全てのサンプルの標準偏差で除算したものを示す)。これは、上記のセクション「濃縮スコア算出」に記載されているように実施した。
各サンプルにおける各タンパク質について、タンパク質における各k-merについてのk-mer濃縮スコアを使用して抗原スコアを算出した。以下に提供される例の場合、別段記述されない限り、各タンパク質についての最大k-mer濃縮スコアを使用して抗原スコアを決定した。これは、上記のセクション「抗原スコア算出」で記載されているように実施した。
サンプルコホート及び対照コホートからの各タンパク質についての抗原スコアを比較して、対象となる疾患または病態に特異的な高い抗原性を有する可能性が非常に高いタンパク質を同定した。これは、上記のセクション「コホート比較統計及び抗原外れ値スコア」で記載されているように実施した。
実施例2:タンパク質レベルIWASを使用するがん患者における疾患バイオマーカーの発見。
ここで、本明細書に記載の免疫ワイド関連方法を使用して疾患特異的なプロテオームベースの抗原性シグナルを同定する具体例を提供する。この例では、黒色腫を有する患者または黒色腫を有さない患者からの血清を入手し、実施例1に記載の方法を使用して比較して黒色腫に対応する抗原を同定した。
ここで、本明細書に記載の免疫ワイド関連方法を使用して疾患特異的なプロテオームベースの抗原性シグナルを同定する具体例を提供する。この例では、黒色腫を有する患者または黒色腫を有さない患者からの血清を入手し、実施例1に記載の方法を使用して比較して黒色腫に対応する抗原を同定した。
具体的には、黒色腫を有すると診断された患者からの204種の血清サンプルを疾患コホートのために提供した。がんを有することが知られていない患者からの6,382種の血清サンプルを対照コホートのために提供した。これらのサンプルを、12-merペプチドライブラリ細菌表面ディスプレイ抗体スクリーンを使用してアッセイし、濃縮された細胞を次世代シーケンシングを使用してシーケンシングした。5-mer及び6-merのk-merについての濃縮を各サンプルについて決定し、黒色腫患者に対応するプロテオームからのタンパク質配列と比較して抗原スコアを同定した。次いで各コホートについての抗原スコアを比較して、タンパク質が黒色腫に特異的な高い抗原性を有することを示すために閾値を超えた外れ値タンパク質を同定した。
この方法を使用して、十分に確立されたNY-ESO-1(がん/精巣)抗原を含む、黒色腫患者に特異的ないくつかの共有抗原を検出した。
前立腺癌についてこの方法を繰り返した。具体的には、148種の血清サンプルを疾患の異なる段階で70名の患者から採取した。6,439種の活性IgGサンプルを含む非がん対照コホートを比較のために使用して実施例1に記載されるように前立腺癌特異的抗原を同定した。我々の方法は、先行して検証された抗原NY-ESO-1を含む、いくつかの新たな候補抗原を同定した。
ELISA検証
本明細書で提供される方法と伝統的な酵素結合免疫吸着アッセイ(ELISA)との間の全体的一致を確認するために、ELISA及び我々の方法の両方を使用して、個々の黒色腫患者からの血清に対するNY-ESO-1タンパク質の抗原性を測定した。図6に示されているように、有意な数の黒色腫サンプルが、我々のアッセイによって及びELISAによって決定した場合、NY-ESO-1タンパク質に対する特異的な抗原性反応を示した。
本明細書で提供される方法と伝統的な酵素結合免疫吸着アッセイ(ELISA)との間の全体的一致を確認するために、ELISA及び我々の方法の両方を使用して、個々の黒色腫患者からの血清に対するNY-ESO-1タンパク質の抗原性を測定した。図6に示されているように、有意な数の黒色腫サンプルが、我々のアッセイによって及びELISAによって決定した場合、NY-ESO-1タンパク質に対する特異的な抗原性反応を示した。
実施例3:黒色腫患者からの血清におけるNY-ESO-1抗原の抗原性のエピトープレベルの分解能
疾患または病態に対応する抗原性タンパク質を同定することに加えて、エピトープレベルでの分解能を提供するための本明細書に記載の方法を使用し、がん特異的な抗原NY-ESO-1における確立された抗原エピトープを同定することもできる。
疾患または病態に対応する抗原性タンパク質を同定することに加えて、エピトープレベルでの分解能を提供するための本明細書に記載の方法を使用し、がん特異的な抗原NY-ESO-1における確立された抗原エピトープを同定することもできる。
具体的には、各コホートからの各サンプルからの最高濃縮スコアを有するNY-ESO-1内のk-merペプチドを本明細書に記載されているように同定した。これらのk-merペプチドについて平均からのSD及びNY-ESO-1内の位置を決定し(1サンプル当たり1つ)、図7にプロットした。図7に示されているように、がん患者は、NY-ESO-1における有意かつ特異的な抗原エピトープを示す。
このエピトープは、黒色腫及び前立腺癌を含む複数のがんにおける先行して同定されたB細胞エピトープに対応する(例えば、Zeng et al.,“Dominant B cell epitope from NY-ESO-1 recognized by sera from a wide spectrum of cancer patients:implications as a potential biomarker,” Int J Cancer.2005;114:268-273参照)。そのため、我々の方法は、対象となるコホートについての対象となる1つ以上の抗原性領域の高分解能マップを提供することによってi)対象となる病態に対応する新規抗原、及びii)対象となる1つ以上のエピトープの両方を同定することが可能となる。
実施例4:処置の過程にわたる疾患特異的抗原についてのエピトープ抗原性のモニタリング。
患者病態の同定は、疾患または障害の診断を超えて多くの病態及び表現型に拡張適用され得る。例えば、本明細書で提供される方法は、さらに患者をサブタイプ化するために使用され得る。
患者病態の同定は、疾患または障害の診断を超えて多くの病態及び表現型に拡張適用され得る。例えば、本明細書で提供される方法は、さらに患者をサブタイプ化するために使用され得る。
この例に示されているように、任意の所与のタンパク質について、抗原エピトープは、療法に対する反応を予測またはモニタリングするために免疫療法の前及び/または後に同定され得る。
図8に示されているように、NY-ESO-1についての抗原性のエピトープレベルの分解能を、治療前(「ベースライン」)及び治療後(「治療中」、処置からおよそ3ヶ月後)の両方で、i)治療に対して反応性である患者及びii)治療に対して反応性ではない患者の血清から決定した。処置前及び処置中の各コホートからのNY-ESO-1の高分解能エピトープマッピングにおける相違は、この方法が、治療に対して反応性である患者の予測及びモニタリングの両方を行うために使用され得ることを示している。
実施例5:タンパク質レベルIWASを使用するシェーグレン患者における自己免疫バイオマーカーの発見。
以下の例で記載され、示されているように、我々の方法は、自己免疫性病態/疾患に特異的な抗原を同定するために使用され得る。具体的には、シェーグレン症候群に特異的な抗原を同定した。
以下の例で記載され、示されているように、我々の方法は、自己免疫性病態/疾患に特異的な抗原を同定するために使用され得る。具体的には、シェーグレン症候群に特異的な抗原を同定した。
シェーグレン症候群と診断された患者からの146種のサンプルの疾患コホート、及び既知の自己免疫疾患を有さない患者からの7,150種のサンプルの対照コホートについて、実施例1に記載されているようにk-mer濃縮分析を実施した。
ヒトプロテオーム内のk-mer配列についての濃縮スコアを比較してヒトプロテオームにおけるタンパク質についての抗原スコアを決定してシェーグレン症候群に特異的な自己抗原を同定した(本明細書及び実施例1に記載されているように)。シェーグレン症候群に対応するものとして確立された自己抗原CENPA及びLa/SSBが同定され、これにより自己抗原の発見のための我々の方法をさらに検証した。結果が図9に示されている。
実施例6:シェーグレン患者におけるSSB抗原の抗原性のエピトープレベルの分解能。
実施例3に記載されているように、各コホートからの各サンプルについてのSSBについての最も濃縮されたk-merについての位置及びスコアを同定することによってSSB抗原の抗原性のエピトープレベルの分解能を決定した。図10に示されているように、k-merピーク(強いSSB反応)を有する個体は大抵、SSB+患者を含意する。これらの同じ腫瘍エピトープは、独立した研究において同定されている(例えば、Tzioufas et al.,“Fine specificity of autoantibodies to La/SSB:epitope mapping and characterization.” Clin Exp Immunol.1997 May;108(2):191-198参照)。
実施例3に記載されているように、各コホートからの各サンプルについてのSSBについての最も濃縮されたk-merについての位置及びスコアを同定することによってSSB抗原の抗原性のエピトープレベルの分解能を決定した。図10に示されているように、k-merピーク(強いSSB反応)を有する個体は大抵、SSB+患者を含意する。これらの同じ腫瘍エピトープは、独立した研究において同定されている(例えば、Tzioufas et al.,“Fine specificity of autoantibodies to La/SSB:epitope mapping and characterization.” Clin Exp Immunol.1997 May;108(2):191-198参照)。
そのため、シェーグレン自己抗原La/SSBにおける確立された抗原エピトープを同定することによって、障害特異的抗原の高分解能マッピングを含む我々の方法をさらに検証した。
ELISA検証
本明細書で提供される方法と伝統的な酵素結合免疫吸着アッセイ(ELISA)との間の全体的一致を確認するために、ELISA及び我々の方法の両方を使用して、シェーグレン患者からの血清に対するCENPAタンパク質の抗原性を測定した。図11に示されているように、シェーグレン患者からのかなりの数のサンプルが、我々のアッセイ及びELISAの両方によって決定した場合、CENPAに対する特異的抗原反応を示した。そのため、結果は、我々の方法とELISAとの間のCENPAサンプル特異的抗原性の全体的一致を示している。
本明細書で提供される方法と伝統的な酵素結合免疫吸着アッセイ(ELISA)との間の全体的一致を確認するために、ELISA及び我々の方法の両方を使用して、シェーグレン患者からの血清に対するCENPAタンパク質の抗原性を測定した。図11に示されているように、シェーグレン患者からのかなりの数のサンプルが、我々のアッセイ及びELISAの両方によって決定した場合、CENPAに対する特異的抗原反応を示した。そのため、結果は、我々の方法とELISAとの間のCENPAサンプル特異的抗原性の全体的一致を示している。
実施例7:タンパク質レベルIWASを使用するHSV2感染症のための疾患バイオマーカーの発見。
以下の例に示されているように、我々はまた、我々の方法を使用してワクチン接種と比較してHSV2感染症に特異的な疾患バイオマーカーを成功裏に同定した。
以下の例に示されているように、我々はまた、我々の方法を使用してワクチン接種と比較してHSV2感染症に特異的な疾患バイオマーカーを成功裏に同定した。
この例では、HSV2感染症に陽性の患者(HSV2+/HSV1-)からの102種の血清サンプルを、HSV2ワクチン接種から210日後の患者からの14種の血清サンプルと比較した。
図12は、HSV2ワクチン接種と比較して自然HSV2感染症に特異的な抗原のランキングを示している。自然感染症と比較した、ワクチンにおけるエンベロープ糖タンパク質D及びEに対する免疫反応の低下を我々の方法を使用して同定した。
エンベロープ糖タンパク質E
図13に示されているように、HSV2感染患者(「症例」)(すなわち、病態)及びHSV2ワクチン接種患者(「対照」)の血清からのエンベロープ糖タンパク質Eのk-merについての最大濃縮スコアを、実施例1に記載されている方法を使用して決定した。これらの最大濃縮スコアは、糖タンパク質についての抗原スコアを提供するために本明細書で使用される。
図13に示されているように、HSV2感染患者(「症例」)(すなわち、病態)及びHSV2ワクチン接種患者(「対照」)の血清からのエンベロープ糖タンパク質Eのk-merについての最大濃縮スコアを、実施例1に記載されている方法を使用して決定した。これらの最大濃縮スコアは、糖タンパク質についての抗原スコアを提供するために本明細書で使用される。
各サンプルからのエンベロープ糖タンパク質Eについての最も濃縮されたk-merは、各サンプルについてその位置及びの濃縮スコアによって図14で示されている。保存されたエピトープは同定されていない。よって、我々の方法は、同じコホートからのサンプルからのタンパク質上の同定されたエピトープ標的の広い多様性にもかかわらず、病態に特異的な抗原性タンパク質を同定することが可能である。
エンベロープ糖タンパク質D
エンベロープ糖タンパク質Eとは対照的に、我々の方法を使用したエンベロープ糖タンパク質D上の抗原エピトープの高分解能マッピングは、明確な保存エピトープ領域を示している(図15)。しかしながら、複数のエピトープが存在するので、本明細書で提供される我々のIWAS法はまた、好ましくは、そのような抗原の同定及び特性化に適している。
エンベロープ糖タンパク質Eとは対照的に、我々の方法を使用したエンベロープ糖タンパク質D上の抗原エピトープの高分解能マッピングは、明確な保存エピトープ領域を示している(図15)。しかしながら、複数のエピトープが存在するので、本明細書で提供される我々のIWAS法はまた、好ましくは、そのような抗原の同定及び特性化に適している。
上で示されたように、HSV2感染サンプルとワクチン接種サンプルとを成功裏に識別することができる。自然HSV2感染症対HSV2ワクチン接種に曝露された血清に特異的な抗原を高分解能で同定し、特性化することもできる。
これらの例は、多様な病態、疾患、及び表現型についてのコホート特異的なプロテオームベースの抗原性シグナルの成功裏の同定を示している。この同定は、コホートについて抗原当たり複数の抗原エピトープが存在する場合であっても、または抗原エピトープがコホートにわたって保存されていない場合であっても可能であり、自然感染対象対ワクチン接種対象を識別するのに十分な感度がある。
他の実施形態
使用されている単語は、限定するものではなく、むしろ説明のための単語であり、変更は、本発明のより広い態様における真の範囲及び趣旨から逸脱することなく、添付の特許請求の範囲内で行うことができることが理解される。
使用されている単語は、限定するものではなく、むしろ説明のための単語であり、変更は、本発明のより広い態様における真の範囲及び趣旨から逸脱することなく、添付の特許請求の範囲内で行うことができることが理解される。
本発明は、いくつかの記載された実施形態に関して、ある程度の長さ及びある程度の詳細をもって記載したが、これらは、かかる任意の詳細または実施形態または任意の特定の実施形態に限定すべきであることを意図するものではなく、先行技術を考慮してそのような特許請求の範囲の可能な限り広い解釈を提供し、したがって、本発明の意図された範囲を効果的に包含するように、添付の特許請求の範囲を参照して解釈されるべきである。
本明細書で言及される全ての刊行物、特許出願、特許、及び他の参考文献は、参照によってその全体が組み込まれる。矛盾する場合、定義を含み本明細書が優先される。加えて、セクションの見出し、材料、方法、及び実施例は例示にすぎず、限定することを意図するものではない。
Claims (62)
- 病態のための抗原マーカーを同定する方法であって、
病態コホート及び比較のための対照コホートを同定する工程、
前記病態に対応する抗原のセットを提供する工程であって、各抗原の配列は、部分配列にタイリングされている、前記提供する工程、
前記病態コホート及び前記対照コホートの両方についての前記部分配列の各々についての濃縮スコアを提供する工程、
前記抗原のセットにおける各抗原について、
前記抗原内の部分配列についての前記濃縮スコアから前記病態コホート及び前記対照コホートについての前記抗原の抗原スコアを決定する工程、及び
抗原外れ値スコアを決定するために、前記病態コホート及び前記対照コホートについての前記抗原スコアを比較する工程、ならびに
前記抗原外れ値スコアが閾値を超える場合、前記抗原を前記病態のための抗原マーカーとして同定する工程
を含む、前記方法。 - 前記濃縮スコアは、前記部分配列を含むモチーフについて決定されたモチーフ濃縮スコアから決定される、請求項1に記載の方法。
- 前記濃縮スコアは、前記病態コホートと前記対照コホートとの間の血清サンプルからの抗体に対する部分配列の相対結合の同定から決定される、請求項1に記載の方法。
- 前記病態コホートと前記対照コホートとの間の血清サンプルからの抗体に対する部分配列の相対結合を同定することによって前記濃縮スコアを決定する工程をさらに含む、請求項1に記載の方法。
- 前記抗原スコアは、前記コホートにおける前記抗原配列についての最高部分配列濃縮スコアから決定される、請求項1に記載の方法。
- 前記抗原スコアは、前記コホートにおける前記抗原配列についての全ての部分配列濃縮スコアの合計から決定される、請求項1に記載の方法。
- 前記抗原スコアは、前記コホートにおける前記抗原配列についてのn個の部分配列のウィンドウ内の部分配列濃縮スコアの最高平均値から決定される、請求項1に記載の方法。
- 前記抗原スコアは、前記抗原配列にわたるn個の最大部分配列濃縮スコアの合計から決定される、請求項1に記載の方法。
- 前記病態コホート及び前記対照コホートについての前記抗原スコアを比較する工程は、前記抗原についての前記サンプルコホート及び前記対照コホートからの抗原スコア間の統計的差異を算出することを含む、請求項1に記載の方法。
- 前記閾値は、前記抗原を抗原マーカーとして同定するのに十分な統計的差異を表す、請求項9に記載の方法。
- 前記統計的差異は、Cohenのd効果量、マン・ホイットニーのUのp値、コルモゴロフ・スミルノフのp値、及び外れ値合計からなる群から選択される統計分析から決定される、請求項9に記載の方法。
- 前記統計的差異は、多重仮説検定のための補正を含む、請求項9に記載の方法。
- 前記補正は、ボンフェローニ補正または偽発見率である、請求項12に記載の方法。
- 前記閾値は、前記抗原のセットから決定された抗原外れ値スコアのランキングから決定される、請求項1に記載の方法。
- 前記部分配列は、k-merである、請求項1に記載の方法。
- 前記k-merは、5-mer、6-mer、7-mer、8-mer、9-mer、または10-merを含む、請求項15に記載の方法。
- 前記部分配列は、少なくともk-nの規定のアミノ酸位置を有するk-mer配列を含み、kは、8、9または10であり、nは、2、3、4、5、または6である、請求項1に記載の方法。
- 前記抗原配列は、アミノ酸配列である、請求項1に記載の方法。
- 前記抗原マーカーは、タンパク質、RNA、またはアプタマーを含む、請求項1に記載の方法。
- 前記病態コホートは、1人以上の患者からの1つ以上のサンプルを含み、前記患者は、感染症、自己免疫性障害、がん、神経障害、または慢性疾患と診断されており、または前記患者は、治療剤またはワクチンが投与されている、請求項1に記載の方法。
- 前記濃縮スコアを提供する工程は、
複数の異なるペプチドを含むディスプレイシステムを、複数の抗体を含む生物学的サンプルと接触させることであって、前記複数の抗体は、前記病態についての抗体を含むことが知られているかまたは疑われており、前記接触させることは、試料抗体が前記複数の異なるペプチド上の同種エピトープに特異的に結合するのに十分な条件下で実施される、前記接触させること、
前記複数の異なるペプチドと前記試料抗体との間の結合を測定すること、及び
前記部分配列について測定された結合の量から前記部分配列についての濃縮スコアを同定すること
を含む、請求項1~20のいずれか1項に記載の方法。 - 前記ペプチドは、ランダムに生成されている、請求項21に記載の方法。
- 前記ペプチドは、8-mer~15-merペプチドである、請求項21に記載の方法。
- 前記ペプチドは、12-merペプチドである、請求項21に記載の方法。
- 前記ディスプレイシステムは、少なくとも10、少なくとも100、少なくとも1000、少なくとも104、少なくとも105、少なくとも106、少なくとも107、または少なくとも108種の異なるペプチドを含む、請求項21に記載の方法。
- 前記ペプチドは、12-merペプチドであり、ランダムに生成されている、請求項25に記載の方法。
- 前記抗原スコア及び前記抗原外れ値スコアの前記決定は、コンピュータシステムのプロセッサによる実行のための非一時的コンピュータ可読記憶媒体に記憶されたコンピュータプログラム命令のセットとして実施される、請求項1~26のいずれか1項に記載の方法。
- 前記抗原外れ値スコアが閾値を超える場合、前記抗原を前記病態のための抗原マーカーとして同定する工程は、コンピュータシステムのプロセッサによる実行のための非一時的コンピュータ可読記憶媒体に記憶されたコンピュータプログラム命令のセットとして実施される、請求項1~26のいずれか1項に記載の方法。
- 対照コホートと比較して病態コホートに特異的な抗原マーカー上の1つ以上の抗原エピトープを同定する方法であって、
病態コホート及び比較のための対照コホートを同定する工程、
前記病態に対応する抗原を提供する工程であって、前記抗原の配列は、部分配列にタイリングされている、前記提供する工程、
前記病態コホート及び前記対照コホートの両方からのサンプルについての前記部分配列の各々についての濃縮スコアを提供する工程、
前記対照コホートからの前記サンプルと比較して前記病態コホートからの前記サンプルについての前記抗原の1つ以上の領域における濃縮スコア間の統計的差異を決定する工程、及び
前記統計的差異が閾値を超える場合、前記対照コホートと比較して前記病態コホートに特異的な抗原エピトープとして前記1つ以上の領域を同定する工程
を含む、前記方法。 - 前記濃縮スコアは、前記部分配列を含むモチーフについて決定されたモチーフ濃縮スコアから決定される、請求項29に記載の方法。
- 前記濃縮スコアは、前記病態コホートと前記対照コホートとの間の血清サンプルからの抗体に対する部分配列の相対結合の同定から決定される、請求項29に記載の方法。
- 前記病態コホートと前記対照コホートとの間の血清サンプルからの抗体に対する部分配列の相対結合を同定することによって前記濃縮スコアを決定する工程をさらに含む、請求項29に記載の方法。
- 前記病態コホート及び前記対照コホートについての前記濃縮スコアを比較することは、前記抗原についての前記サンプルコホート及び前記対照コホートからの濃縮スコア間の統計的差異を算出することを含む、請求項29に記載の方法。
- 前記閾値は、前記1つ以上の領域を抗原エピトープとして同定するのに十分な統計的差異を表す、請求項33に記載の方法。
- 前記統計的差異は、Cohenのd効果量、マン・ホイットニーのUのp値、コルモゴロフ・スミルノフのp値、及び外れ値合計からなる群から選択される統計分析から決定される、請求項33に記載の方法。
- 前記統計的差異は、多重仮説検定のための補正を含む、請求項33に記載の方法。
- 前記補正は、ボンフェローニ補正または偽発見率である、請求項36に記載の方法。
- 前記部分配列は、k-merである、請求項29に記載の方法。
- 前記k-merは、5-mer、6-mer、7-mer、8-mer、9-mer、または10-merを含む、請求項38に記載の方法。
- 前記部分配列は、少なくともk-nの規定のアミノ酸位置を有するk-mer配列を含み、kは、8、9または10であり、nは、2、3、4、5、または6である、請求項29に記載の方法。
- 前記抗原配列は、アミノ酸配列である、請求項29に記載の方法。
- 前記抗原マーカーは、タンパク質、RNA、またはアプタマーを含む、請求項29に記載の方法。
- 前記病態コホートは、1人以上の患者からの1つ以上のサンプルを含み、前記患者は、感染症、自己免疫性障害、がん、神経障害、または慢性疾患と診断されており、または前記患者は、治療剤またはワクチンが投与されている、請求項29に記載の方法。
- 前記濃縮スコアを提供する工程は、
複数の異なるペプチドを含むディスプレイシステムを、複数の抗体を含む生物学的サンプルと接触させることであって、前記複数の抗体は、前記病態についての抗体を含むことが知られているかまたは疑われており、前記接触させることは、試料抗体が前記複数の異なるペプチド上の同種エピトープに特異的に結合するのに十分な条件下で実施される、前記接触させること、
前記複数の異なるペプチドと前記試料抗体との間の結合を測定すること、及び
前記部分配列について測定された結合の量から前記部分配列についての濃縮スコアを同定すること
を含む、請求項29~43のいずれか1項に記載の方法。 - 前記ペプチドは、ランダムに生成されている、請求項44に記載の方法。
- 前記ペプチドは、8-mer~15-merペプチドである、請求項44に記載の方法。
- 前記ペプチドは、12-merペプチドである、請求項44に記載の方法。
- 前記ディスプレイシステムは、少なくとも10、少なくとも100、少なくとも1000、少なくとも104、少なくとも105、少なくとも106、少なくとも107、または少なくとも108種の異なるペプチドを含む、請求項44に記載の方法。
- 前記ペプチドは、12-merペプチドであり、ランダムに生成されている、請求項49に記載の方法。
- 前記対照コホートからの前記サンプルと比較して前記病態コホートからの前記サンプルについての前記抗原の1つ以上の領域における濃縮スコア間の統計的差異を決定する工程は、コンピュータシステムのプロセッサによる実行のための非一時的コンピュータ可読記憶媒体に記憶されたコンピュータプログラム命令のセットとして実施される、請求項29~43のいずれか1項に記載の方法。
- 前記統計的差異が閾値を超える場合、前記対照コホートと比較して前記病態コホートに特異的な抗原エピトープとして前記1つ以上の領域を同定する工程は、コンピュータシステムのプロセッサによる実行のための非一時的コンピュータ可読記憶媒体に記憶されたコンピュータプログラム命令のセットとして実施される、請求項29~43のいずれか1項に記載の方法。
- 病態のためのタンパク質マーカーを同定する方法であって、
病態コホート及び比較のための対照コホートを同定する工程、
前記病態に対応するプロテオームからのタンパク質のセットを提供する工程であって、前記タンパク質は、k-mer配列にタイリングされている、前記提供する工程、
前記病態表現型を有する対象及び前記対照表現型を有する対象からの血清サンプルからの前記複数のk-mer配列についての濃縮スコアを提供する工程であって、前記濃縮スコアは、各血清サンプルにおける抗体に対する前記k-mer配列の結合のレベルを測定することから決定される、前記提供する工程、
前記タンパク質のセットにおける各タンパク質について、
前記タンパク質内のk-mer配列についての前記濃縮スコアから前記病態コホート及び前記対照コホートについての前記タンパク質の抗原スコアを決定する工程、及び
前記病態コホート及び前記対照コホートについての前記抗原スコアを比較してタンパク質外れ値スコアを決定する工程、ならびに
前記タンパク質外れ値スコアが閾値を超える場合、前記タンパク質を前記病態のためのタンパク質マーカーとして同定する工程
を含む、前記方法。 - 非一時的コンピュータ可読記憶媒体及びプロセッサを含む、病態のための抗原マーカーを同定するためのシステムであって、前記記憶媒体は、
前記病態に対応する抗原の部分配列についての濃縮スコアであって、病態コホート及び対照コホートに特異的である、前記濃縮スコア、
前記抗原の部分配列の前記濃縮スコアから前記病態コホート及び前記対照コホートに特異的な各抗原の抗原スコアを生成するための命令、ならびに
前記病態コホート及び前記対照コホートに特異的な前記抗原についての前記抗原スコア間の統計的差異を比較することによって抗原外れ値スコアを生成するための命令
を含む、前記システム。 - 前記抗原外れ値スコアに基づいて前記病態のための抗原マーカーとして好適な抗原を同定するアウトプットを生成するための命令をさらに含む、請求項53に記載のシステム。
- 前記病態に対応する前記抗原の配列を受信するための命令をさらに含む、請求項53に記載のシステム。
- 前記病態に対応する前記抗原の配列を部分配列にタイリングするための命令をさらに含む、請求項53に記載のシステム。
- 前記部分配列についての濃縮スコアを受信するための命令をさらに含む、請求項56に記載のシステム。
- 非一時的コンピュータ可読記憶媒体及びプロセッサを含む、病態コホートに特異的な抗原マーカー上の1つ以上の抗原エピトープを同定するためのシステムであって、
前記記憶媒体は、
前記抗原マーカーの部分配列についての濃縮スコアであって、病態コホート及び対照コホートに特異的である、前記濃縮スコア、及び
前記対照コホートからの前記サンプルと比較して前記病態コホートからの前記サンプルについての前記抗原の1つ以上の領域における濃縮スコア間の統計的差異を決定するための命令
を含む、前記システム。 - 前記統計的差異が閾値を超える場合、前記対照コホートと比較して前記病態コホートに特異的な抗原エピトープとして前記1つ以上の領域を同定するアウトプットを生成するための命令をさらに含む、請求項58に記載のシステム。
- 前記病態に対応する前記抗原の配列を受信するための命令をさらに含む、請求項58に記載のシステム。
- 前記病態に対応する前記抗原の配列を部分配列にタイリングするための命令をさらに含む、請求項58に記載のシステム。
- 前記部分配列についての濃縮スコアを受信するための命令をさらに含む、請求項58に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962864909P | 2019-06-21 | 2019-06-21 | |
US62/864,909 | 2019-06-21 | ||
PCT/US2020/038856 WO2020257740A2 (en) | 2019-06-21 | 2020-06-20 | Immunome wide association studies to identify condition-specific antigens |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022537448A true JP2022537448A (ja) | 2022-08-25 |
JPWO2020257740A5 JPWO2020257740A5 (ja) | 2023-06-27 |
Family
ID=74037099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021576239A Pending JP2022537448A (ja) | 2019-06-21 | 2020-06-20 | 病態特異的抗原を同定するためのイムノームワイド関連研究 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230024898A1 (ja) |
EP (1) | EP3987053A4 (ja) |
JP (1) | JP2022537448A (ja) |
WO (1) | WO2020257740A2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023060267A1 (en) * | 2021-10-07 | 2023-04-13 | Serimmune Inc. | Global protein-based immunome wide association studies |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3373950B1 (en) * | 2015-11-11 | 2024-05-01 | Serimmune Inc. | Methods and compositions for assessing antibody specificities |
WO2018089858A1 (en) * | 2016-11-11 | 2018-05-17 | Healthtell Inc. | Methods for identifying candidate biomarkers |
-
2020
- 2020-06-20 EP EP20825515.8A patent/EP3987053A4/en active Pending
- 2020-06-20 WO PCT/US2020/038856 patent/WO2020257740A2/en unknown
- 2020-06-20 JP JP2021576239A patent/JP2022537448A/ja active Pending
-
2021
- 2021-12-17 US US17/555,216 patent/US20230024898A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2020257740A3 (en) | 2021-02-18 |
EP3987053A2 (en) | 2022-04-27 |
WO2020257740A2 (en) | 2020-12-24 |
US20230024898A1 (en) | 2023-01-26 |
EP3987053A4 (en) | 2023-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xu et al. | COVID‐19 diagnostic testing: technology perspective | |
AU2018395430B2 (en) | Decoding approaches for protein identification | |
Shan et al. | A cancer/testis antigen microarray to screen autoantibody biomarkers of non-small cell lung cancer | |
Wan et al. | Targeted sequencing of genomic repeat regions detects circulating cell-free echinococcus DNA | |
WO2018149186A1 (zh) | 一种acpa阴性的ra诊断标志物及其应用 | |
US20190376969A1 (en) | Nasopharyngeal protein biomarkers of acute respiratory virus infection and methods of using same | |
US20230024898A1 (en) | Immunome wide association studies to identify condition-specific antigens | |
US20200057062A1 (en) | Diagnostic marker for predicting efficacy of ra drug and application thereof | |
US20230288421A1 (en) | Sars-cov-2 serum antibody profiling | |
CN104204223B (zh) | 用于睾丸癌的体外诊断或预后的方法 | |
US9672324B1 (en) | Peptide profiling and monitoring humoral immunity | |
US11079389B2 (en) | System and method for identification of a synthetic classifer | |
WO2023060267A1 (en) | Global protein-based immunome wide association studies | |
Paull et al. | Mapping antibody binding using multiplexed epitope substitution analysis | |
US20210230580A1 (en) | Quality control reagents and methods for serum antibody profiling | |
CN112011606B (zh) | 肠道菌群在重症肌无力中的应用 | |
CN107167612A (zh) | 与唐氏综合征相关的母血标志物及应用 | |
US11459605B2 (en) | Method for the diagnosis or prognosis, in vitro, of prostate cancer | |
US20140018245A1 (en) | Marker sequences for multiple sclerosis and use thereof | |
WO2022241256A1 (en) | Serum antibody profiling for leptospirosis | |
US20180321244A1 (en) | Method for Detection And Diagnosis of Oral Cancer in a sample | |
Mahle et al. | Omic approaches to infectious disease testing | |
Caggiano et al. | Tissue informative cell-free DNA methylation sites in amyotrophic lateral sclerosis | |
WO2021152586A1 (en) | Methods of analyzing microbiome, immunoglobulin profile and physiological state | |
JP2022512761A (ja) | 関節リウマチ自己抗体レパートリーのプロファイリング及びそのためのペプチド分類子 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220315 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230619 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230619 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20231204 |