JP7428825B2 - 受容体相互作用の分析のための方法およびシステム - Google Patents
受容体相互作用の分析のための方法およびシステム Download PDFInfo
- Publication number
- JP7428825B2 JP7428825B2 JP2022564343A JP2022564343A JP7428825B2 JP 7428825 B2 JP7428825 B2 JP 7428825B2 JP 2022564343 A JP2022564343 A JP 2022564343A JP 2022564343 A JP2022564343 A JP 2022564343A JP 7428825 B2 JP7428825 B2 JP 7428825B2
- Authority
- JP
- Japan
- Prior art keywords
- dextramer
- tcr
- data
- sequence data
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 259
- 238000004458 analytical method Methods 0.000 title description 12
- 230000010799 Receptor Interactions Effects 0.000 title 1
- 210000004027 cell Anatomy 0.000 claims description 451
- 108091008874 T cell receptors Proteins 0.000 claims description 444
- 230000027455 binding Effects 0.000 claims description 370
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 claims description 323
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 207
- 238000012549 training Methods 0.000 claims description 132
- 108090000623 proteins and genes Proteins 0.000 claims description 123
- 238000012163 sequencing technique Methods 0.000 claims description 71
- 238000012360 testing method Methods 0.000 claims description 66
- 239000000427 antigen Substances 0.000 claims description 62
- 108091007433 antigens Proteins 0.000 claims description 62
- 102000036639 antigens Human genes 0.000 claims description 62
- 230000014509 gene expression Effects 0.000 claims description 58
- 238000013527 convolutional neural network Methods 0.000 claims description 47
- 239000013642 negative control Substances 0.000 claims description 44
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 35
- 239000013598 vector Substances 0.000 claims description 28
- 108020005196 Mitochondrial DNA Proteins 0.000 claims description 21
- 238000001914 filtration Methods 0.000 claims description 21
- 101150008942 J gene Proteins 0.000 claims description 17
- 238000005259 measurement Methods 0.000 claims description 17
- 101150117115 V gene Proteins 0.000 claims description 16
- 238000013528 artificial neural network Methods 0.000 claims description 15
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 150000001413 amino acids Chemical class 0.000 claims description 11
- 230000001747 exhibiting effect Effects 0.000 claims 1
- 230000009258 tissue cross reactivity Effects 0.000 description 119
- 101100112922 Candida albicans CDR3 gene Proteins 0.000 description 61
- 238000010606 normalization Methods 0.000 description 54
- 108020003175 receptors Proteins 0.000 description 51
- 102000005962 receptors Human genes 0.000 description 51
- 238000010801 machine learning Methods 0.000 description 47
- 108090000765 processed proteins & peptides Proteins 0.000 description 42
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 34
- 239000011230 binding agent Substances 0.000 description 32
- 206010022000 influenza Diseases 0.000 description 32
- 238000009826 distribution Methods 0.000 description 30
- 210000004369 blood Anatomy 0.000 description 28
- 239000008280 blood Substances 0.000 description 28
- 206010028980 Neoplasm Diseases 0.000 description 25
- 230000003993 interaction Effects 0.000 description 20
- 238000011493 immune profiling Methods 0.000 description 18
- 102000004196 processed proteins & peptides Human genes 0.000 description 17
- 201000011510 cancer Diseases 0.000 description 15
- 230000008569 process Effects 0.000 description 15
- 238000010200 validation analysis Methods 0.000 description 15
- 238000003559 RNA-seq method Methods 0.000 description 14
- 239000000463 material Substances 0.000 description 14
- 230000009870 specific binding Effects 0.000 description 14
- 238000013145 classification model Methods 0.000 description 12
- 230000028993 immune response Effects 0.000 description 12
- 238000000159 protein binding assay Methods 0.000 description 12
- 241000282414 Homo sapiens Species 0.000 description 11
- 108700018351 Major Histocompatibility Complex Proteins 0.000 description 11
- 238000003860 storage Methods 0.000 description 11
- 238000010276 construction Methods 0.000 description 10
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 10
- 239000000203 mixture Substances 0.000 description 10
- 239000002773 nucleotide Substances 0.000 description 10
- 125000003729 nucleotide group Chemical group 0.000 description 10
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 10
- 230000020382 suppression by virus of host antigen processing and presentation of peptide antigen via MHC class I Effects 0.000 description 10
- 108020004414 DNA Proteins 0.000 description 9
- 238000003556 assay Methods 0.000 description 9
- 230000009467 reduction Effects 0.000 description 9
- 230000004913 activation Effects 0.000 description 8
- OFHCOWSQAMBJIW-AVJTYSNKSA-N alfacalcidol Chemical group C1(/[C@@H]2CC[C@@H]([C@]2(CCC1)C)[C@H](C)CCCC(C)C)=C\C=C1\C[C@@H](O)C[C@H](O)C1=C OFHCOWSQAMBJIW-AVJTYSNKSA-N 0.000 description 8
- 238000013459 approach Methods 0.000 description 8
- 230000001413 cellular effect Effects 0.000 description 8
- 239000012636 effector Substances 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 8
- 238000009169 immunotherapy Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 230000009257 reactivity Effects 0.000 description 8
- 238000002790 cross-validation Methods 0.000 description 7
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 108020004707 nucleic acids Proteins 0.000 description 7
- 102000039446 nucleic acids Human genes 0.000 description 7
- 150000007523 nucleic acids Chemical class 0.000 description 7
- 238000010186 staining Methods 0.000 description 7
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 6
- 101000578784 Homo sapiens Melanoma antigen recognized by T-cells 1 Proteins 0.000 description 6
- 102100028389 Melanoma antigen recognized by T-cells 1 Human genes 0.000 description 6
- 102000018697 Membrane Proteins Human genes 0.000 description 6
- 108010052285 Membrane Proteins Proteins 0.000 description 6
- 230000005867 T cell response Effects 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 102000054766 genetic haplotypes Human genes 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 244000052769 pathogen Species 0.000 description 6
- 102000004169 proteins and genes Human genes 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 230000003612 virological effect Effects 0.000 description 6
- 238000001276 Kolmogorov–Smirnov test Methods 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 229940104302 cytosine Drugs 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 108091033319 polynucleotide Proteins 0.000 description 5
- 102000040430 polynucleotide Human genes 0.000 description 5
- 239000002157 polynucleotide Substances 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 230000035945 sensitivity Effects 0.000 description 5
- 229960005486 vaccine Drugs 0.000 description 5
- BSDCIRGNJKZPFV-GWOFURMSSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-(2,5,6-trichlorobenzimidazol-1-yl)oxolane-3,4-diol Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=CC(Cl)=C(Cl)C=C2N=C1Cl BSDCIRGNJKZPFV-GWOFURMSSA-N 0.000 description 4
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 101001018097 Homo sapiens L-selectin Proteins 0.000 description 4
- 101000763322 Homo sapiens M1-specific T cell receptor beta chain Proteins 0.000 description 4
- 101000763321 Homo sapiens T cell receptor beta chain MC.7.G5 Proteins 0.000 description 4
- 102100033467 L-selectin Human genes 0.000 description 4
- 102100026964 M1-specific T cell receptor beta chain Human genes 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 230000000890 antigenic effect Effects 0.000 description 4
- 210000003719 b-lymphocyte Anatomy 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 210000003071 memory t lymphocyte Anatomy 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 238000004578 scanning tunneling potentiometry Methods 0.000 description 4
- 235000019832 sodium triphosphate Nutrition 0.000 description 4
- 238000002560 therapeutic procedure Methods 0.000 description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 3
- 108700028369 Alleles Proteins 0.000 description 3
- 108091008875 B cell receptors Proteins 0.000 description 3
- 102100036301 C-C chemokine receptor type 7 Human genes 0.000 description 3
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 3
- 101000716065 Homo sapiens C-C chemokine receptor type 7 Proteins 0.000 description 3
- 101000794371 Homo sapiens T cell receptor alpha variable 5 Proteins 0.000 description 3
- 101000939742 Homo sapiens T cell receptor beta variable 20-1 Proteins 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 102100030178 T cell receptor alpha variable 5 Human genes 0.000 description 3
- 102100029659 T cell receptor beta variable 20-1 Human genes 0.000 description 3
- 230000010261 cell growth Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 229910052804 chromium Inorganic materials 0.000 description 3
- 239000011651 chromium Substances 0.000 description 3
- 229910017052 cobalt Inorganic materials 0.000 description 3
- 239000010941 cobalt Substances 0.000 description 3
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000000684 flow cytometry Methods 0.000 description 3
- 239000010437 gem Substances 0.000 description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 3
- 238000011502 immune monitoring Methods 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 239000002777 nucleoside Substances 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- 241000271566 Aves Species 0.000 description 2
- 101150097493 D gene Proteins 0.000 description 2
- ZBNZXTGUTAYRHI-UHFFFAOYSA-N Dasatinib Chemical compound C=1C(N2CCN(CCO)CC2)=NC(C)=NC=1NC(S1)=NC=C1C(=O)NC1=C(C)C=CC=C1Cl ZBNZXTGUTAYRHI-UHFFFAOYSA-N 0.000 description 2
- 101100347633 Drosophila melanogaster Mhc gene Proteins 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 101000971533 Homo sapiens Killer cell lectin-like receptor subfamily G member 1 Proteins 0.000 description 2
- 101000608935 Homo sapiens Leukosialin Proteins 0.000 description 2
- 101000658380 Homo sapiens T cell receptor alpha variable 13-1 Proteins 0.000 description 2
- 101000658398 Homo sapiens T cell receptor beta variable 19 Proteins 0.000 description 2
- 101000658410 Homo sapiens T cell receptor beta variable 2 Proteins 0.000 description 2
- 102100021457 Killer cell lectin-like receptor subfamily G member 1 Human genes 0.000 description 2
- 239000002067 L01XE06 - Dasatinib Substances 0.000 description 2
- 102100039564 Leukosialin Human genes 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 108091008109 Pseudogenes Proteins 0.000 description 2
- 102000057361 Pseudogenes Human genes 0.000 description 2
- 108010034546 Serratia marcescens nuclease Proteins 0.000 description 2
- 102100034849 T cell receptor alpha variable 13-1 Human genes 0.000 description 2
- 102100034884 T cell receptor beta variable 19 Human genes 0.000 description 2
- 102100034891 T cell receptor beta variable 2 Human genes 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 238000000540 analysis of variance Methods 0.000 description 2
- 230000001363 autoimmune Effects 0.000 description 2
- 210000003050 axon Anatomy 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000002659 cell therapy Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000010224 classification analysis Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 230000001268 conjugating effect Effects 0.000 description 2
- 108091036078 conserved sequence Proteins 0.000 description 2
- 230000009260 cross reactivity Effects 0.000 description 2
- 229960002448 dasatinib Drugs 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000007850 degeneration Effects 0.000 description 2
- 239000005549 deoxyribonucleoside Substances 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 239000012645 endogenous antigen Substances 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 230000002163 immunogen Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 230000002438 mitochondrial effect Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 229940023041 peptide vaccine Drugs 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 238000012175 pyrosequencing Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000003014 reinforcing effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000002342 ribonucleoside Substances 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 238000002255 vaccination Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- POVNCJSPYFCWJR-USZUGGBUSA-N (4s)-4-[[(2s)-2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]-4-methylpentanoyl]amino]-5-[(2s)-2-[[2-[(2s)-2-[[(2s)-1-[[(2s,3r)-1-[[(1s)-1-carboxy-2-methylpropyl]amino]-3-hydroxy-1-oxobutan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]carbamoyl]pyrrolidin-1- Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O)C1=CC=C(O)C=C1 POVNCJSPYFCWJR-USZUGGBUSA-N 0.000 description 1
- VZSRBBMJRBPUNF-UHFFFAOYSA-N 2-(2,3-dihydro-1H-inden-2-ylamino)-N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]pyrimidine-5-carboxamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C(=O)NCCC(N1CC2=C(CC1)NN=N2)=O VZSRBBMJRBPUNF-UHFFFAOYSA-N 0.000 description 1
- SEBPXHSZHLFWRL-UHFFFAOYSA-N 3,4-dihydro-2,2,5,7,8-pentamethyl-2h-1-benzopyran-6-ol Chemical compound O1C(C)(C)CCC2=C1C(C)=C(C)C(O)=C2C SEBPXHSZHLFWRL-UHFFFAOYSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 102100025137 Early activation antigen CD69 Human genes 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 102100030385 Granzyme B Human genes 0.000 description 1
- 102100028972 HLA class I histocompatibility antigen, A alpha chain Human genes 0.000 description 1
- 108010075704 HLA-A Antigens Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000934374 Homo sapiens Early activation antigen CD69 Proteins 0.000 description 1
- 101001009603 Homo sapiens Granzyme B Proteins 0.000 description 1
- 101001057504 Homo sapiens Interferon-stimulated gene 20 kDa protein Proteins 0.000 description 1
- 101001055144 Homo sapiens Interleukin-2 receptor subunit alpha Proteins 0.000 description 1
- 101000634835 Homo sapiens M1-specific T cell receptor alpha chain Proteins 0.000 description 1
- 101000634836 Homo sapiens T cell receptor alpha chain MC.7.G5 Proteins 0.000 description 1
- 101000645329 Homo sapiens T cell receptor alpha joining 31 Proteins 0.000 description 1
- 101000795920 Homo sapiens T cell receptor alpha variable 12-1 Proteins 0.000 description 1
- 101000658376 Homo sapiens T cell receptor alpha variable 12-2 Proteins 0.000 description 1
- 101000658378 Homo sapiens T cell receptor alpha variable 13-2 Proteins 0.000 description 1
- 101000772110 Homo sapiens T cell receptor alpha variable 21 Proteins 0.000 description 1
- 101000772113 Homo sapiens T cell receptor alpha variable 27 Proteins 0.000 description 1
- 101000794422 Homo sapiens T cell receptor alpha variable 35 Proteins 0.000 description 1
- 101000794418 Homo sapiens T cell receptor alpha variable 41 Proteins 0.000 description 1
- 101000794374 Homo sapiens T cell receptor alpha variable 8-3 Proteins 0.000 description 1
- 101000645339 Homo sapiens T cell receptor beta joining 1-2 Proteins 0.000 description 1
- 101000645351 Homo sapiens T cell receptor beta joining 2-2 Proteins 0.000 description 1
- 101000844034 Homo sapiens T cell receptor beta variable 11-2 Proteins 0.000 description 1
- 101000939859 Homo sapiens T cell receptor beta variable 12-3 Proteins 0.000 description 1
- 101000939858 Homo sapiens T cell receptor beta variable 12-4 Proteins 0.000 description 1
- 101000658406 Homo sapiens T cell receptor beta variable 28 Proteins 0.000 description 1
- 101000606220 Homo sapiens T cell receptor beta variable 6-5 Proteins 0.000 description 1
- 101000606219 Homo sapiens T cell receptor beta variable 6-6 Proteins 0.000 description 1
- 102000037982 Immune checkpoint proteins Human genes 0.000 description 1
- 108091008036 Immune checkpoint proteins Proteins 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 102100026878 Interleukin-2 receptor subunit alpha Human genes 0.000 description 1
- 108010002586 Interleukin-7 Proteins 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- 229930182816 L-glutamine Natural products 0.000 description 1
- 102100029450 M1-specific T cell receptor alpha chain Human genes 0.000 description 1
- 102000043129 MHC class I family Human genes 0.000 description 1
- 108091054437 MHC class I family Proteins 0.000 description 1
- 102000043131 MHC class II family Human genes 0.000 description 1
- 108091054438 MHC class II family Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 238000012614 Monte-Carlo sampling Methods 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 102100026276 T cell receptor alpha joining 31 Human genes 0.000 description 1
- 102100031722 T cell receptor alpha variable 12-1 Human genes 0.000 description 1
- 102100034847 T cell receptor alpha variable 12-2 Human genes 0.000 description 1
- 102100034848 T cell receptor alpha variable 13-2 Human genes 0.000 description 1
- 102100029487 T cell receptor alpha variable 21 Human genes 0.000 description 1
- 102100029313 T cell receptor alpha variable 27 Human genes 0.000 description 1
- 102100030191 T cell receptor alpha variable 35 Human genes 0.000 description 1
- 102100030198 T cell receptor alpha variable 41 Human genes 0.000 description 1
- 102100030181 T cell receptor alpha variable 8-3 Human genes 0.000 description 1
- 102100026266 T cell receptor beta joining 1-2 Human genes 0.000 description 1
- 102100025769 T cell receptor beta joining 2-2 Human genes 0.000 description 1
- 102100032179 T cell receptor beta variable 11-2 Human genes 0.000 description 1
- 102100029696 T cell receptor beta variable 12-3 Human genes 0.000 description 1
- 102100029697 T cell receptor beta variable 12-4 Human genes 0.000 description 1
- 102100034880 T cell receptor beta variable 28 Human genes 0.000 description 1
- 102100039786 T cell receptor beta variable 6-5 Human genes 0.000 description 1
- 102100039785 T cell receptor beta variable 6-6 Human genes 0.000 description 1
- 101150014541 TRAJ42 gene Proteins 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 230000008275 binding mechanism Effects 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000011712 cell development Effects 0.000 description 1
- 230000007969 cellular immunity Effects 0.000 description 1
- 238000002648 combination therapy Methods 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 210000004443 dendritic cell Anatomy 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000012997 ficoll-paque Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000013332 literature search Methods 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000013442 quality metrics Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000009097 single-agent therapy Methods 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
- G16B5/20—Probabilistic models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Chemical & Material Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Public Health (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Physiology (AREA)
- Signal Processing (AREA)
- Organic Chemistry (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
Description
本出願は、2020年4月21日に出願された米国仮特許出願第63/013,480号、2020年10月12日に出願された米国仮特許出願第63/090,498号、および2020年11月9日に出願された米国仮特許出願第63/111,395号の優先権を主張するものである。これらの以前の出願の内容は、参照によりその全体が本明細書に組み込まれる。
当然のことながら、本開示の方法および組成物は、記載されている特定の方法論、プロトコルおよび試薬に限定されるものではない。理由はこれらが、変更される可能性があるからである。本明細書中に使用されている用語は、あくまで特定の実施形態を説明することを目的としたものであって、もっぱら添付の特許請求の範囲により限定される本発明の範囲を限定するものではないことも、理解すべきである。
一部の態様では、記載される方法およびシステムは、マルチオミクスハイスループット結合データを分析することによって、信頼できるTCR-pMHC結合を識別することができる。方法およびシステムは、本明細書では、ICON(統合COntext特異的正規化)と呼ばれてもよい。
マルチオミクスハイスループット結合データを取得する、受信する、および/または決定する方法が開示される。図1に示すように、システム100は、単一細胞免疫プロファイリングプラットフォーム102を含むことができる。単一細胞免疫プロファイリングプラットフォーム102を形成して、マルチオミクスハイスループット結合データ(例えば、配列データ104)を生成してもよい。一態様では、マルチオミクスハイスループット結合データは、単一の細胞配列データ、デキストラマー配列データ、および/または単一の細胞の受容体配列データのうちの一つまたは複数を含むことができる。単一の細胞の配列データは、例えば、RNA-seqデータを含むことができる。デキストラマー配列データは、例えば、CITE-seq(配列決定によるトランスクリプトームおよびエピトープの細胞指数)としても言及される、dCODE-デキストラマー-seqおよび/または細胞表面タンパク質発現配列決定を含むことができる。単一の細胞の受容体配列データは、例えば、対αβ鎖(またはγδ鎖)単一細胞のTCR-seqデータなどの、TCR-seqデータを含むことができる。
d=最大(P99.9、argmaxDs,u)
選別された細胞のそれぞれの試験デキストラマーについてのデキストラマーシグナル(UMI)は、推定されたバックグラウンドノイズ(d)の測定値を減じることによって補正されてもよい。
Ec=Es-d
は、pMHC特異的バインダーについてのカットオフとして経験的に決定されてもよい。
ここで図4を参照すると、予測モジュール110が記載される。予測モジュール110は、所定の受容体配列に対する結合親和性を予測するよう構成されている少なくとも一つのMLモジュール430である、トレーニングモジュール420による、一つまたは複数のトレーニングデータセット410の分析に基づき、トレーニングするための機械学習(「ML」)技術を使用するよう構成されてもよい。
一態様では、トレーニングされた予測モデル(例えば、機械学習分類指標)を使用して、一つまたは複数のペプチドに関して、TCR配列の結合状態を予測してもよい。TCR配列は、機械学習分類指標に提示されてもよい。機械学習分類指標は、TCR配列が、一つまたは複数の特定のペプチドに結合する可能性を予測してもよい。同様に、複数のTCR配列が、機械学習分類指標に提示されてもよい。機械学習分類指標は、複数のTCR配列におけるそれぞれのTCR配列について、それぞれのTCR配列が、一つまたは複数の特定のペプチドに結合する可能性を予測してもよい。一態様では、機械学習分類指標は、以下の例となる出力に示されるTCR-ペプチドマップを生成することができる。
E.キット
以下の実施例は、本方法およびシステムが、結腸直腸癌の検出に関連する本方法およびシステムを例証する。以下の実施例は、その限定を意図するものではない。
1.結果
i.マルチオミクスハイスループットTCR-pMHC結合データ。
10×Genomicsは、最近、拡張性の公開の利用可能なTCR-pMHC結合データセットを生成した。それらの初期の報告では、4人のHLAハプロタイプ健康ドナー(図19)由来の150,000個を超えるCD8+T細胞の結合特性を、T細胞αβ鎖対およびトランスクリプトームを同時に配列決定しながら(図2)、T細胞への抗原結合を直接検出するための単一細胞ベースの免疫プロファイリングプラットフォームを使用した44のpMHCデキストラマーにわたり評価した。デキストラマープールは、八つのHLA対立遺伝子にわたり、公知の共通のウイルスおよび癌反応生を有するエピトープからなる(図20)。
ICONを適用して、合計20,843個のCD8+T細胞を、3人のドナー由来の29個のpMHCに結合する1,514個の固有のT細胞クローンから識別した(図7A、図21および方法)。このハイスループットデータセットから識別した固有のTCR-pMHC相互作用の数は、VDJdbにおける対のαβTCRの全体と同等のサイズである。pMHC結合TCRのうち、総TCRの98.9%(固有のTCRの94.7%)は、七つのpMHC:B*08:01_RAKFKQLL_BZLF1_EBV、A*02:01_GILGFVFTL_Flu-MP_インフルエンザ、A*11:01_IVTDFSVIK_EBNA-3B_EBV、A*03:01_KLGGALQAK_IE-1_CMV、A*11:01_AVFDRKSDAK_EBNA-3B_EBV、A*02:01_GLCTLVAML_BMLF1_EBVおよびA*02:01_ELAGIGILTV_MART-1_癌に結合する(図7Bおよび図16および図17)。
この大きく多様なTCR-pMHC結合データセットでは、これらの結合現象を計算で検証または優先順位付けするためのより堅牢な機能的分類指標が望ましい。最近の研究により、畳み込みニューラルネットワーク(CNN)は、TCR配列から高次元の情報を学習することができ、したがって、TCR-pMHC結合を健全に予測し得ることが示された。CNNベースのフレームワークを、TCR-pMHC結合の検証および/または予測のため適合させた。簡単に言うと、対のαβ鎖CDR3アミノ酸配列ならびにそれぞれのTCRのVおよびJ遺伝子を一次元入力ベクターにコードした。具体的には、トレーニング可能な埋め込みを使用して、CDR3アミノ酸配列をコードし、VおよびJ遺伝子セグメントをベクターに形質転換した。CNN構造は、一つの畳み込み特性層および最終の分類層につながる三つの完全に連結した層を含んでもよい(図8Aおよび方法)。所与のpMHCについての結合および非結合TCRの不平衡な数を有することによって導入され得る潜在的なバイアスに対処するために、クラス加重費用関数をトレーニング(方法)に使用した。
次に、CNNベースの分類指標を、10×Genomics結合データから識別した上位七つのpMHC結合レパートリーに適用した(図7Bおよび図15)。七つのpMHCレパートリーを、平均(AUC)=0.89を用いて分類した(図9A)。これらのデータにおいて、精選したデータセットと同様に、CNNベースの分類指標は、距離ベースのモデルよりも優れている(図16)。これらの結合TCRをさらに計算で検証するために、精選したデータセットにおける結合TCRも有する、四つのpMHCレパートリー(A*02:01_ELAGIGILTV_MART-1、A*02:01_GILGFVFTL_Flu-MP、A*02:01_GLCTLVAML_BMLF1_EBV、およびA*11:01_AVFDRKSDAK_EBNA-3B_EBV)を使用した。CNNベースの分類指標を、四つの精選したレパートリーならびに院内の独立した抗原再曝露実験(方法)からさらなるA*02:01_ELAGIGILTV_MART-1結合レパートリーを予測するための10×Genomicsデータセットから識別した四つのレパートリーを使用してトレーニングした。図9Bは、トレーニングセットにおける高性能と同等の予測結果を示す。
抗原特異性とT細胞表現型の合わせた情報は、ワクチン接種などの免疫療法の臨床的成功に重要であると報告されている。10×Genomics免疫プロファイリングプラットフォームによって生成したマルチオミクスデータは、T細胞抗原特異性を様々なT細胞表現型と結び付けることを可能にする。このマルチオミクスデータセットからの遺伝子(単一の細胞RNA-seq)および表面タンパク質(CITE-seq)発現レベルを使用して、pMHC結合CD8+T細胞を亜集団に分けた(方法および図18)。次いで、識別した亜集団を、既に記載された32、CD8+T細胞サブタイプマーカー遺伝子:ナイーブ細胞(CD45RA+CD45RO-CD62LhiCD127hi)、中心メモリー細胞(Tcm、CD45RA-CD45RO+CD62L+)、Tエフェクターメモリー細胞(Tem、CD45RA-CD45RO+CD62L-)、末梢メモリー細胞(Tpm、CD62L+CD127hi)、高分化したエフェクター細胞(Temra、CD45RA+CD45RO-CD127loGZMBhi)および他のメモリー細胞(CD43loKLRG1hiCD127-)に従い注釈を付けた(図10Aおよび10B)。
信頼できるTCR-pMHC相互作用を識別できる方法(Icon)を、高度に多重化した10×Genomics TCR-pMHC結合データにおいてシグナル対バックグラウンド比を著しく増加させることによって開発した。適切な対照(陰性対照デキストラマーおよびデキストラマー選別していないT細胞試料)を有することは、TCR-pMHC結合現象を確実に識別するために不可欠であることが判明した要因であるバックグラウンドノイズを正確に推定するのに不可欠である。ICONを、多重化デキストラマーの単一プールからなる一つのデータセット上で開発したが、この方法を、より多くの多重化データセットが生成されるにつれて、より広範なpMHCデキストラマープールからpMHC-TCR結合データをクエリーするように一般化することができる。
i.10×Genomics単一の細胞免疫プロファイリングデータセット
本研究のため使用した10×Genomicsデータを、support.10xgenomics.com/single-cell-vdj/datasetsからダウンロードした。
それぞれのドナー由来のCD8+細胞を、以下の基準:細胞当たり検出したRNA特性数<=2500および>200遺伝子、ならびに総UMI(固有の分子識別子)カウントの40パーセント未満であるミトコンドリアパーセンテージにより下流分析のために選択した。
Seuart V3単一の細胞配列決定分析Rパッケージ33、34を、単一の細胞RのNA-seqデータに基づく分類分析のため使用した。TCR VJ遺伝子使用の有意な濃縮を、識別したpMHC結合T細胞において観察したため、TCR遺伝子を分類から取り除いた。そのため、細胞クラスターは、それらの共有したVJ遺伝子の使用によって支配されない。次いで、識別した結合T細胞のその他すべての遺伝子発現を、Seurat V3デフォルトパラメータを使用して正規化し、計量した。PCAを正規化し、形質転換しUMIカウントを、可変的に発現した遺伝子上で行った。上位10のPCを、細胞分類に使用した。分類可視化のため、UMAPを使用した(図17)。
10個の最も予測可能なTCR由来のαおよびβ鎖のCDR3アミノ酸配列を、COBALT(www.ncbi.nlm.nih.gov/tools/cobalt/cobalt.cgi)を使用して整列させた。整列させたCDR3アミノ酸配列を、デフォルトのパラメータを用いてWebLogo35に入力し、モチーフを生成した。
未加工ファイルを、VDJdb28(vdjdb.cdr3.net/)およびThe Pathology-associated TCR database36 (friedmanlab.weizmann.ac.il/McPAS-TCR/)からダウンロードした。データは、以下の基準:VDJdbについて、対のαまたはβ鎖CDR3アミノ酸配列を、それぞれの「complex.id」について必要であり、「供給源」と注釈を付けたTCRを、10x genomicsから除去し、データを「種」=「ヒト」についてフィルタリングした、に従って処理して、pMHC TCR結合を得た。McPAS-TCRについて、既知の「エピトープ.ID」を、完全なデータにおいて必要とし、「CDR3.アルファ.aa」および「CDR3.ベータ.aa」を有し、同様に、VDJdbについて、ヒトTCRをフィルタリングした。
統合COntext特異的正規化(ICON)方法を開発した。それは、10×Genomics免疫マッププラットフォームから生成したマルチオミクス単一の細胞の配列決定データを入力データとして取得し、信頼できる結合現象を識別するためにTCR-pMHC結合特異性データ正規化を行う。マルチオミクスデータセットは、単一の細胞のRNA-seq、対のαβ鎖単一の細胞TCR-seq、dCODE-デキストラマー-seqならびにCITE-seq(配列決定によるトランスクリプトームおよびエピトープの細胞指数)とも称される、細胞表面タンパク質発現配列決定を含む。ICONは、以下の主要なステップを含む(図6Aおよび図12)。
d=最大(P99.9、argmaxDs,u)
Ec=Es-d
HLA A*02:01個体由来の末梢血単核細胞(PBMC)を、Ficoll-Paque Plus勾配単離により単離した。PBMCを、T細胞培地(CellGenix樹状細胞培地、カタログ番号20801-0500+5%ヒト血清AB(Sigma、カタログ番号H3667))+1%ペニシリン/ストレプトマイシン/L-グルタミン(ThermoFisher、カタログ番号10378-016)、5ng/mlのT細胞補助サイトカインIL-7およびIL-15(CellGenix、それぞれ、カタログ番号1410-050および1413-050)、ならびに10U/mlのIL-2(Peprotech、カタログ番号200-0)、ならびに10ug/mlのA*02:01拘束性MART-1エピトープELAGIGILTV(Genscript)中、培養プレートに播種した。培養物に、1週間、2日毎に新鮮な培地およびサイトカインを与えた。培養の7日目に、細胞を蛍光標識したデキストラマーHLA-A*02:01 MART-1 ELAGIGILT(Immudex、カタログ番号WB2162-PE)で染色して、フローサイトメトリーにより抗原特異的CD8+T細胞拡大を評価した。抗原再曝露アッセイについては、7日間の拡大後、ペプチドをT細胞拡大培養物に加えた。再刺激の24時間後、細胞を集め、CD3(BD Biosciences、カタログ番号612750)、CD8(BD Biosciences、カタログ番号612889)、CD69(BD Biosciences、カタログ番号564364)、CCR7(Biolegend、カタログ番号353218)、CD45RO(Biolegend、カタログ番号304238)、CD137(Biolegend、カタログ番号309828)、およびCD25(Biolegend、カタログ番号356104)についての蛍光標識抗体を用いて染色した。Astrios細胞ソーター(Beckman Coulter)を利用して、フォワード散乱プロット、サイド散乱プロット、および蛍光チャネルでゲーティングする蛍光活性化細胞ソーティング(FACS)を設定し、破片および二重項を排除しながら、生細胞を選択した。さらに処理のため、100μmのノズルを使用して、単一のCD3+CD8+CD45RO+CD137+細胞を選別した。
10×Genomicsが、CD8+T細胞デキストラマー結合能の再評価に使用するため、凍結保存したドナー3およびドナー4のPBMCを親切に提供した。CD8+T細胞を、Miltenyi CD8+ T細胞陰性濃縮(Mitenyi)を使用して濃縮した。次いで、細胞を、ベンゾナーゼ(Millipore)およびダサチニブ(Axon)と45分間インキュベートし、その後、オリゴタグ付きデキストラマープール(Immudex、図21)を用いて室温で30分間染色した。次いで、細胞を、CD3(BD Biosciences、カタログ番号612750)、CD4(BD Biosciences、カタログ番号563919、CD8(BD Biosciences、カタログ番号612889)、CCR7(Biolegend、カタログ番号353218)、およびCD45RO(Biolegend、カタログ番号304238)についての蛍光標識ならびにCITE-seq 抗体を用いて、30分間、氷上で染色した。Astriosセルソーター(Beckman Coulter)を利用し、フォワード散乱プロット、サイド散乱プロット、および蛍光チャネルでの蛍光活性化細胞ソーティング(FACS)ゲーティングを設定し、破片および二重項を除外しながら、生細胞を選択した。100μmのノズルを使用して、さらなる処理のため、単一のCD3+CD8+デキストラマー+細胞を選別した(図11)。
重み付け二値分類指標を、ディープラーニングフレームワークに基づき適合し、それは、特定のニーズを満たすための調節を伴い、三つの主要なステップを含む。
TCR配列決定ファイルを、10×Genomicsの未加工のフォーマット化したファイルとして収集した。配列決定ファイルを、非生産性配列を除去した後にCDR3のアミノ酸配列を取るように解析した。異なるヌクレオチド配列を有するが、CDR3由来の同じ一致したアミノ酸配列、およびV、D、J遺伝子を有するクローンは、一つのTCR下で一緒に凝集させた。したがって、ここで使用したそれぞれのTCR記録は、CDR3、V、およびJ遺伝子の単一の対のαおよびβTCRアミノ酸配列を含む。α鎖のみのTCRB-CDR3アミノ酸配列を用いたモデル実行のため、β鎖遺伝子を入力から除去した。同様の除去を、β鎖のみのモデルについて行った。
それぞれのTCR-CDR3アミノ酸配列を、20個の可能性のあるアミノ酸を表す数字でコードした。IUPAC(国際純正および応用化学連合)アミノ酸に適合する配列のみを保持した。異なる長さのTCRについて、最大長40に0パディングを適用した。トレーニング可能な埋め込み層を使用して、アミノ酸配列から特性をさらに抽出した。VおよびJ遺伝子を、計算空間における遺伝子名の分類上および別々の表示を提供するよう、ワンホットコードした。コードされた配列および遺伝子名を、一つのTCR記録を表すよう一緒に結び付けた。このデータ変換プロセスを、すべてのネットワークのトレーニング前に適用した。
この方法を適合し、TCRをトレーニングするための一般的な従来のニューラルネットワーク構築を提供し、試料またはレパートリーレベルの予測に焦点を当てた。単一のTCR配列予測の最適化に焦点を当てた。これを達成するために、T細胞クローンサイズを入力データから除去した。さらに、単一の翻訳インバリアント層を配列に適用し、続いて、三つの完全に結び付けた畳み込み層を最終出力層に適用した。ネットワークを、Adam Optimizer(学習速度=0.001)を使用してトレーニングし、ソフト最大値対数と、ネットワークの別々の分類上の出力のワンホットコード化表示の間の交差エントロピー損失を最小にした。このアプローチを、生物学的に意義のある核心サイズ439を使用して、可能性のあるモチーフを捕捉することによって改変した。トレーニングデータにおける不均衡なクラス表現を考慮するために、以下の式を使用して、加重交差エントロピー損失関数を適用した。
wcは、それぞれのクラスについてのTCR配列の反転頻度を使用して計算した重みである。Cは、一つのクラスを表し、ncは、一つのクラスにおける総TCRであり、nは、TCRの総数であり、
は、それぞれのTCR配列についての予測クラスおよび実際のクラスを表す。
1.結果
i.ハイスループット結合データ由来のpMHC特異的結合TCRの識別
10×Genomicsは、最近、拡張性の公開の利用可能なTCR-pMHC結合データセットを生成した。それらの初期の報告では、4人のHLAハプロタイプ健康ドナー(表1、ドナー1~4)由来の150,000個を超えるCD8+T細胞の結合特性を、T細胞αβ鎖対およびトランスクリプトームを同時に配列決定しながら(図2)、T細胞への抗原結合を直接検出するための単一細胞ベースの免疫プロファイリングプラットフォーム免疫マップを使用した44のpMHCデキストラマーにわたり評価した。デキストラマープールは、八つのHLA対立遺伝子にわたり、公知の共通のウイルスおよび癌反応生を有するエピトープからなる(表2)。
識別した大規模で多様なTCR-pMHC結合現象と共に、これらの結合現象を迅速に検証するための堅牢な機能的分類指標が望まれる。最近の研究により、ニューラルネットワーク(CNN)は、TCR配列から高次元の情報を学習することができ、したがって、TCR-pMHC結合を健全に予測し得ることが示された。
次に、TCRAIを、ハイスループットデータから識別した九つの最も大量のpMHC結合レパートリーICONに適用した(図25E)。これら九つのpMHCレパートリーのTCRを、二項モードでTCRAIを有する平均AUC0.88で分類した。同様の予測性能も、TCRAI多項様式を使用して観察した(図34Aおよび図35、以下、TCRAI結果は、指定しない限り、予測性能由来のものである)。歴史的に、TCRβ鎖配列決定をしばしば使用して、α鎖と比較してより高い複合能に起因して、T細胞抗原結合特異性を推測する。TCR-pMHC相互作用の予測におけるTCRαおよびβ鎖の寄与を定量的に評価するために、α鎖またはβ鎖のいずれかを、対のαβ鎖の代わりに、TCRAIへの入力として使用した。対のαβ鎖を用いた性能は、αまたはβ鎖のみより良好であり、AUCの平均増加0.2を伴った(図34B)。従前の研究と一致し、これらの結果は、TCR-pMHC相互作用の正確な推論のためのαβ対形成の重要性をまとめて示す。β鎖の予測性能は、必ずしもα鎖より良好ではなく、これは、TCR-pMHC特異的認識におけるα鎖の重要性を示しており、以前はしばしば見過ごされていた。
所与のpMHCに結合するTCRの特性を調べるために、TCRAI分類指標モデルが、どのようにそのフィンガープリント空間内にTCRを配置するかを分析した(材料および方法)。分類指標モデル由来のTCRフィンガープリントにより、保存された遺伝子使用およびCDR3モチーフを有するTCRの特定の群を発見することが可能になる。これらの群は、異なる結合能力および異なる構造結合様式を示すことが多い。
抗原特異性とT細胞表現型の合わせた情報は、ワクチン接種などの免疫療法の臨床的成功に重要であると報告されている。免疫マッププラットフォームによって生成したマルチオミクスデータは、T細胞抗原特異性をT細胞表現型と結び付けることを可能にする。このマルチオミクスデータセットからの遺伝子(単一の細胞のRNA-seq)および表面タンパク質(CITE-seq、配列決定によるトランスクリプトームおよびエピトープの細胞指数)発現を使用して、pMHC結合CD8+T細胞を亜集団にグループ化した(図38Aならびに材料および方法)。次いで、識別した亜集団を、既に記載されたCD8+T細胞サブタイプマーカー遺伝子:ナイーブ細胞(CD45RA+CD62LhiCD127hi)、中心メモリー細胞(Tcm、CD45RA-CD62L+CD127+EOMEShighTBETlow)、Tエフェクターメモリー細胞(Tem、CD45RA-CD62LlowCD127+GZMB+)、末梢メモリー細胞(Tpm、CD62L+CD127hiGZMB+)、高分化したエフェクター細胞(Temra、CD45RA+CD127loGZMBhi)および他のメモリー細胞(CD43loKLRG1hiCD127-)に従い注釈を付けた(図38AおよびB)。
ハイスループットTCR-pMHC結合データは、TCR抗原認識の理解を促進するための魅力的な経路を提示する。しかしながら、このタイプのデータは、多くの場合、シグナル対高ノイズ比と関連付けられる。本明細書では、優れた感度および特異性を有する高度に多重化したTCR-pMHC結合データにおいて、シグナル対ノイズ比を有意に増加させることによって信頼できるTCR-pMHC相互作用を識別することができる、新規の方法ICONを含む起算ツールのフレームワークをここで提示する。ICONは、ノイズ補正したデキストラマーシグナルをパラメータフリーの様式で計算し、これにより、より広範なpMHCデキストラマープールからのpMHC-TCR結合データに容易に一般化できるようにし、CITE-seqなどの単一の細胞空間におけるタンパク質結合シグナルの正規化に潜在的に拡張可能である。
i.10×Genomics単一の細胞免疫プロファイリングデータセット
本研究のため使用した10×Genomicsデータを、support.10xgenomics.com/single-cell-vdj/datasetsからダウンロードした。
Seuart V3単一の細胞配列決定分析Rパッケージを、単一の細胞RのNA-seqデータに基づく分類分析のため使用した。TCR VJ遺伝子使用の有意な濃縮を、識別したpMHC結合T細胞において観察したため、TCR遺伝子を分類から取り除いた。そのため、細胞クラスターは、それらの共有したVJ遺伝子の使用によって支配されない。次いで、識別した結合T細胞のその他すべての遺伝子発現を、Seurat V3デフォルトパラメータを使用して正規化し、計量した。PCAを正規化し、形質転換しUMIカウントを、可変的に発現した遺伝子上で行った。上位10のPCを、細胞分類に使用した。分類可視化のため、UMAPを使用した。
未加工ファイルを、VDJdb(42)(vdjdb.cdr3.net/)およびThe Pathology-associated TCR database (friedmanlab.weizmann.ac.il/McPAS-TCR/)からダウンロードした。データを、以下の基準:VDJdbについて、対のαまたはβ鎖CDR3アミノ酸配列を、それぞれの「complex.id」について必要であり、「供給源」と注釈を付けたTCRを、10×Genomicsから除去し、「種」=「ヒト」についてフィルタリングした、に従って処理して、pMHC TCR結合を得た。McPAS-TCRについて、既知の「エピトープ.ID」を、完全なデータにおいて必要とし、「CDR3.アルファ.aa」および「CDR3.ベータ.aa」を有し、同様に、VDJdbについて、ヒトTCRをフィルタリングした。
信頼できるTCR-pMHC相互作用を識別するために、統合的COntext特異的正規化法であるICONを開発した。それは、単一の細胞のRNA-seq、対のαβ鎖の単一の細胞のTCR-seq、dCODE-デキストラマー-seqおよびCITE-seqとも称される、細胞表面タンパク質発現配列決定を含む、入力データとしての、10×Genomics免疫マップなどの、多重化多量体結合プラットフォームから生成したマルチオミクス単一の細胞配列決定データを取得する。ICONは、以下の主要なステップを含む(図25Aおよび図26)。
Sij=Eij(RCij)2RTkj
CD8+T細胞を、Miltenyi CD8+T細胞陰性濃縮(Mitenyi)を使用して、健康なドナーPBMCから濃縮した。次いで、細胞を、ベンゾナーゼ(Millipore)およびダサチニブ(Axon)と45分間インキュベートし、その後、オリゴタグ付きデキストラマープール(Immudex、表2を参照)を用いて室温で30分間染色した。次いで、細胞を、CD3(BD Biosciences、カタログ番号612750)、CD4(BD Biosciences、カタログ番号563919、CD8(BD Biosciences、カタログ番号612889)、CCR7(Biolegend、カタログ番号353218)、およびCD45RA(Biolegend、カタログ番号304238)についての蛍光標識ならびにCITE-seq 抗体を用いて、30分間、氷上で染色した。Astriosセルソーター(Beckman Coulter)を利用し、フォワード散乱プロット、サイド散乱プロット、および蛍光チャネルでの蛍光活性化細胞ソーティング(FACS)ゲーティングを設定し、破片および二重項を除外しながら、生細胞を選択した。100μmのノズルを使用して、さらなる処理のため、単一のCD3+CD8+デキストラマー+細胞を選別した。
TCRAIは、TCR分類指標の設計のための可撓性のフレームワークを提供するが、このワーク全体を通して具体的かつ一貫した構築を使用し、それを以下で詳細に記載する。その可撓性の構築とは別に、DeepTCR構築とのいくつかの重要な相違は、CDR3配列についての1D畳み込みおよびバッチ正規化の使用、ならびに遺伝子についての低次元の表示である。これらの変化は、モデル正規化の改善をもたらし、モデルに、より強い遺伝子関連を学習させる。
TCRAIモデルは、特定のpMHC(または多項の場合、多くのpMHCのうちの一つ)に結合するTCRについての予測と、そのpMHCに結合することができるかどうかという疑問の文脈内でTCRを記載する数字ベクトルの「フィンガープリント」の両方を生成する。モデルがどのように機能するかを理解し、異なる結合様式を有するTCRの群を識別するために、これらのフィンガープリントの分布を分析する。UMAPを使用して、フィンガープリントを二次元空間に縮小する。一方のデータセットでトレーニングしたモデルを使用し、別の目に見えないデータセットでフィンガープリントを推定するとき、UMAPプロジェクタは、トレーニングデータセット由来のTCRを用いて適合し、そのプロジェクタを使用して目に見えないセット由来のTCRを変換する。
DeepTCR法を、以下に記載する調節を用いて二進法分類指標を構築するよう適合した。
を評価することを含んでもよい。
を評価することを含んでもよい。
を評価することを含んでもよい。
pMHCワイズ正規化を行うことは、
を評価することを含んでもよい。
を評価することによる、ithT細胞についてのjthデキストラマーの結合に起因した、デキストラマーシグナルのフラクションを決定することを含んでもよい。
を評価することによって、jthデキストラマーに結合するクローンタイプkiに属するT細胞のフラクションを決定することを含んでもよい。
Claims (15)
- 単一の細胞配列データ、デキストラマー配列データ、および単一の細胞のT細胞受容体(TCR)配列データを含む単一の細胞配列決定データをコンピュータにより受信することと、
前記デキストラマー配列データから、前記単一の細胞配列データに基づき、遺伝子の数が遺伝子閾値範囲外の細胞又はミトコンドリア遺伝子発現のフラクションが遺伝子発現閾値を超える細胞と関連するデータを除去することによって、低品質の細胞と関連するデータをコンピュータによりフィルタリングすることと、
前記デキストラマー配列データに表されるそれぞれの細胞について、それぞれの細胞に関連するデキストラマーシグナルから、バックグラウンドノイズの測定値をコンピュータにより減算することと、
α鎖のみ、β鎖のみ、又は複数のα鎖又はβ鎖を有する細胞に関連するデータを除去することによって、前記デキストラマー配列データから、前記単一の細胞のTCRデータに基づき、α鎖またはβ鎖の存在または非存在によるデータをコンピュータによりフィルタリングすることと、
フィルタリングされたデキストラマー配列データに残っているデータを信頼できるTCR-pMHC結合現象と関連するとコンピュータにより識別することと、を含むコンピュータにより実行される方法。 - 前記デキストラマー配列データから、前記単一の細胞配列データに基づき、低品質の細胞と関連するデータをコンピュータによりフィルタリングすることが、
前記デキストラマー配列データに表されるそれぞれの細胞について、前記単一の細胞配列データに基づき、遺伝子の数をコンピュータにより決定することと、
前記デキストラマー配列データに表されるそれぞれの細胞について、前記単一の細胞配列データに基づき、ミトコンドリア遺伝子発現のフラクションをコンピュータにより決定することと
を含む請求項1に記載の方法。 - 前記デキストラマー配列データに基づき、選別された試験デキストラマー配列データおよび陰性対照デキストラマー配列データを含む選別されたデキストラマー配列データ、および選別されていない試験デキストラマー配列データを含む、選別されていないデキストラマー配列データをコンピュータにより決定することと、
前記デキストラマー配列データに表されるそれぞれの細胞について、前記陰性対照デキストラマー配列データに基づき、最大の陰性対照デキストラマーシグナルをコンピュータにより決定することと、
前記デキストラマー配列データに表されるそれぞれの細胞について、前記選別された試験デキストラマー配列データに基づき、最大の選別されたデキストラマーシグナルをコンピュータにより決定することと、
前記デキストラマー配列データに表されるそれぞれの細胞について、前記選別されていない試験デキストラマー配列データに基づき、最大の選別されていないデキストラマーシグナルをコンピュータにより決定することと、をさらに含む請求項1又は請求項2に記載の方法。 - 前記デキストラマー配列データに表されるそれぞれの細胞について、それぞれの細胞に関連するデキストラマーシグナルから、バックグラウンドノイズの前記測定値を、コンピュータにより減算することが、
前記最大の陰性対照デキストラマーシグナルに基づき、デキストラマー結合バックグラウンドノイズをコンピュータにより推定することと、
前記最大の選別されたデキストラマーシグナルおよび前記最大の選別されていないデキストラマーシグナルに基づき、デキストラマー選別ゲート効率をコンピュータにより推定することと、
前記デキストラマー結合バックグラウンドノイズおよび前記デキストラマー選別ゲート効率に基づき、バックグラウンドノイズの前記測定値をコンピュータにより決定することと
を含む請求項3に記載の方法。 - 前記デキストラマー配列データから、前記単一の細胞のTCRデータに基づき、前記α鎖または前記β鎖の前記存在または前記非存在によるデータをコンピュータによりフィルタリングすることが、
前記デキストラマー配列データに表されるそれぞれの細胞について、前記単一の細胞のTCR配列データに基づき、少なくとも一つのα鎖および少なくとも一つのβ鎖の存在または非存在をコンピュータにより決定すること
を含む請求項1から請求項4のいずれか一項に記載の方法。 - 前記デキストラマー配列データにおいて表される所定の細胞に結合するそれぞれのデキストラマーについて、前記細胞に結合する全てのデキストラマーの合計に対する前記細胞内のデキストラマーシグナルの比を、コンピュータにより前記細胞に対する前記デキストラマーの結合特異性の測定値として決定することと、
前記デキストラマー配列データに表されるそれぞれの細胞の所定のTCRクローンタイプに結合するそれぞれのデキストラマーについて、特定のデキストラマーに結合するクローン内のT細胞のフラクションを、コンピュータにより前記細胞が属する前記クローンタイプに対する前記デキストラマー結合特異性の測定値として決定することと、
前記デキストラマー配列データにおいて表される所定の細胞に結合するそれぞれのデキストラマーについて、前記細胞への前記デキストラマー結合特異性の前記測定値および前記細胞が属する前記クローンタイプへの前記デキストラマー結合特異性の前記測定値に基づき、前記細胞に結合するそれぞれのデキストラマーと関連する補正されたデキストラマーシグナルをコンピュータにより決定することと、をさらに含む請求項5に記載の方法。 - 予測モデルを、前記フィルタリングされたデキストラマー配列データに残っている前記データに基づき、コンピュータによりトレーニングすることをさらに含む方法であって、前記予測モデルを、前記フィルタリングされたデキストラマー配列データに残っている前記データに基づき、コンピュータによりトレーニングすることが、
前記フィルタリングされたデキストラマー配列データに残っている前記データに基づき、それぞれのTCR配列が結合親和性と関連する複数のTCR配列を含むトレーニングデータセットをコンピュータにより決定することと、
前記複数のTCR配列に基づき、前記予測モデルについての複数の特性をコンピュータにより決定することと、
前記トレーニングデータセットの第一の部分に基づき、前記複数の特性による前記予測モデルをコンピュータによりトレーニングすることと、
前記トレーニングデータセットの第二の部分に基づき、前記予測モデルをコンピュータにより試験することと、
前記試験に基づいて、前記予測モデルをコンピュータにより出力することと、を含む請求項1から請求項6のいずれか一項に記載の方法。 - 前記フィルタリングされたデキストラマー配列データに残っている前記データに基づき、それぞれのTCR配列が結合親和性と関連する複数のTCR配列を含む前記トレーニングデータセットをコンピュータにより決定することが、
前記複数のTCR配列のそれぞれのTCR配列について、対のαβ鎖CDR3アミノ酸配列、V遺伝子セグメント配列、およびJ遺伝子セグメント配列をコンピュータにより決定することと、
前記複数のTCR配列のそれぞれのTCR配列について、前記対のαβ鎖CDR3アミノ酸配列、前記V遺伝子セグメント配列、および前記J遺伝子セグメント配列をコンピュータにより1次元の入力ベクターにコードすることと、を含む請求項7に記載の方法。 - 前記複数のTCR配列のそれぞれのTCR配列について、前記対のαβ鎖CDR3アミノ酸配列をコードすることが、アミノ酸のそれぞれのアルファベット表示をコンピュータにより前記アミノ酸の数字表示に変換することを含む、請求項8に記載の方法。
- 前記複数のTCR配列のそれぞれのTCR配列について、前記V遺伝子セグメント配列および前記J遺伝子セグメント配列をコンピュータによりコードすることが、計算空間における遺伝子名の分類上かつ別々の表示を得るための一つのホットエンコーディングを含む、請求項8に記載の方法。
- 前記トレーニングデータセットの前記第一の部分に基づき、前記複数の特性による前記予測モデルをコンピュータによりトレーニングすることは、学習した埋め込みを介して、前記TCR配列のそれぞれの鎖のワンホットコード化されたVおよびJ遺伝子を埋め込むことによって、ニューラルネットワークをコンピュータによりトレーニングすること、およびこれらの埋め込みを、それぞれのCDR3についての畳み込みニューラルネットワークの出力と一緒に連結し、前記埋め込みCDR3を供給し、前記TCRを表す1D数字ベクトルを形成すること、続いて、最終の完全に結び付けた層を介してそれぞれの数字TCR配列を通過させることを含む、請求項10に記載の方法。
- 一次元入力ベクターをコンピュータにより一つ以上のクラスターにクラスター形成することが、KNNクラスター形成するアルゴリズムを前記一次元入力ベクターに適用することをさらに含み、前記一つ以上のクラスターが、結合強度を示す、請求項8から請求項11のいずれか一項に記載の方法。
- トレーニングされた予測モデルに、未知のTCR配列をコンピュータにより提示することと、
前記トレーニングされた予測モデルにより、結合親和性を予測することと、をさらに含む請求項7から請求項12のいずれか一項に記載の方法。 - 前記予測モデルに、対象TCR配列データをコンピュータにより提示することと、
前記予測モデルにより、前記対象TCR配列データに基づき、対象TCR結合パターンをコンピュータによって決定することと、
抗原位置および前記対象TCR結合パターンのリポジトリに基づき、TCR配列データと関連する対象が、一つ以上の位置に移動した可能性をコンピュータにより決定することと、をさらに含む請求項7から請求項12のいずれか一項に記載の方法。 - 信頼できるTCR-pMHC結合現象と関連する前記フィルタリングされたデキストラマー配列データに残っている前記データに基づき、対象についてのTCR結合パターンをコンピュータにより生成することと、
後続する時点において、前記対象について、第二の単一の細胞配列データ、第二のデキストラマー配列データ、および第二の単一の細胞のT細胞受容体(TCR)配列データをコンピュータにより受信することと、
前記対象についての前記第二の単一の細胞配列データ、第二のデキストラマー配列データ、および第二の単一の細胞のT細胞受容体(TCR)配列データに基づき、第二のTCR結合パターンをコンピュータにより決定することと、
前記対象についての前記TCR結合パターンと前記第二のTCR結合パターンの比較に基づき、前記対象をコンピュータにより識別することと、をさらに含む請求項1から請求項14のいずれか一項に記載の方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024009636A JP2024050692A (ja) | 2020-04-21 | 2024-01-25 | 受容体相互作用の分析のための方法およびシステム |
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063013480P | 2020-04-21 | 2020-04-21 | |
US63/013,480 | 2020-04-21 | ||
US202063090498P | 2020-10-12 | 2020-10-12 | |
US63/090,498 | 2020-10-12 | ||
US202063111395P | 2020-11-09 | 2020-11-09 | |
US63/111,395 | 2020-11-09 | ||
PCT/US2021/028500 WO2021216787A1 (en) | 2020-04-21 | 2021-04-21 | Methods and systems for analysis of receptor interaction |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024009636A Division JP2024050692A (ja) | 2020-04-21 | 2024-01-25 | 受容体相互作用の分析のための方法およびシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023524654A JP2023524654A (ja) | 2023-06-13 |
JP7428825B2 true JP7428825B2 (ja) | 2024-02-06 |
Family
ID=75870801
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022564343A Active JP7428825B2 (ja) | 2020-04-21 | 2021-04-21 | 受容体相互作用の分析のための方法およびシステム |
JP2024009636A Pending JP2024050692A (ja) | 2020-04-21 | 2024-01-25 | 受容体相互作用の分析のための方法およびシステム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024009636A Pending JP2024050692A (ja) | 2020-04-21 | 2024-01-25 | 受容体相互作用の分析のための方法およびシステム |
Country Status (10)
Country | Link |
---|---|
US (1) | US20210335447A1 (ja) |
EP (1) | EP4139922A1 (ja) |
JP (2) | JP7428825B2 (ja) |
KR (1) | KR20230004698A (ja) |
CN (1) | CN115917654A (ja) |
AU (1) | AU2021259460A1 (ja) |
CA (1) | CA3176401A1 (ja) |
IL (1) | IL297508A (ja) |
MX (1) | MX2022013328A (ja) |
WO (1) | WO2021216787A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023028595A1 (en) * | 2021-08-27 | 2023-03-02 | The Regents Of The University Of California | Prediction of t cell response to antigens |
WO2023114509A1 (en) * | 2021-12-16 | 2023-06-22 | 10X Genomics, Inc. | Systems and methods for improving immune receptor discovery |
AU2022421695A1 (en) * | 2021-12-21 | 2024-05-30 | Amgen Inc. | Dcaf4l2-specific t-cell receptors |
WO2023147474A1 (en) * | 2022-01-28 | 2023-08-03 | The Scripps Research Institute | Systems and methods for genetic imputation, feature extraction, and dimensionality reduction in genomic sequences |
WO2023183468A2 (en) * | 2022-03-25 | 2023-09-28 | Freenome Holdings, Inc. | Tcr/bcr profiling for cell-free nucleic acid detection of cancer |
KR102547966B1 (ko) * | 2022-07-28 | 2023-06-26 | 주식회사 네오젠티씨 | 인공지능 기술을 이용하여 pMHC와 TCR 간의 관계를 분석하기 위한 방법 및 장치 |
WO2024081740A1 (en) * | 2022-10-13 | 2024-04-18 | Somalogic Operating Co., Inc. | Systems and methods for validation of proteomic models |
KR102547977B1 (ko) * | 2022-10-14 | 2023-06-26 | 주식회사 네오젠티씨 | 인공지능 기술을 이용하여 pMHC에 대응되는 TCR 정보를 생성하기 위한 방법 및 장치 |
US20240185949A1 (en) * | 2022-12-06 | 2024-06-06 | 10X Genomics, Inc. | Systems and methods for v(d)j cell calling based on the presence of gene expression data |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019160261A (ja) | 2018-03-28 | 2019-09-19 | Kotaiバイオテクノロジーズ株式会社 | 免疫実体の効率的クラスタリング |
-
2021
- 2021-04-21 KR KR1020227040387A patent/KR20230004698A/ko active Search and Examination
- 2021-04-21 MX MX2022013328A patent/MX2022013328A/es unknown
- 2021-04-21 AU AU2021259460A patent/AU2021259460A1/en active Pending
- 2021-04-21 US US17/236,998 patent/US20210335447A1/en active Pending
- 2021-04-21 WO PCT/US2021/028500 patent/WO2021216787A1/en unknown
- 2021-04-21 CN CN202180044174.6A patent/CN115917654A/zh active Pending
- 2021-04-21 CA CA3176401A patent/CA3176401A1/en active Pending
- 2021-04-21 EP EP21724500.0A patent/EP4139922A1/en active Pending
- 2021-04-21 IL IL297508A patent/IL297508A/en unknown
- 2021-04-21 JP JP2022564343A patent/JP7428825B2/ja active Active
-
2024
- 2024-01-25 JP JP2024009636A patent/JP2024050692A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019160261A (ja) | 2018-03-28 | 2019-09-19 | Kotaiバイオテクノロジーズ株式会社 | 免疫実体の効率的クラスタリング |
Non-Patent Citations (2)
Title |
---|
John-William Sidhom, et al.,DeepTCR: a deep learning framework for understanding T-cell receptor sequence signatures within complex T-cell repertoires,[online],2019年12月23日,Pages 1-33,[検索日:2023年9月6日], <URL:https://doi.org/10.1101/464107> |
Venessa Isabell Jurtz, et al.,NetTCR: sequence-based prediction of TCR binding to peptide-MHC complexes using convolutional neural networks,[online],2018年10月03日,Pages 1-22,[検索日:2023年9月6日], <URL:https://doi.org/10.1101/433706> |
Also Published As
Publication number | Publication date |
---|---|
US20210335447A1 (en) | 2021-10-28 |
KR20230004698A (ko) | 2023-01-06 |
EP4139922A1 (en) | 2023-03-01 |
CN115917654A (zh) | 2023-04-04 |
CA3176401A1 (en) | 2021-10-28 |
WO2021216787A1 (en) | 2021-10-28 |
JP2024050692A (ja) | 2024-04-10 |
IL297508A (en) | 2022-12-01 |
WO2021216787A9 (en) | 2022-10-20 |
MX2022013328A (es) | 2023-05-03 |
JP2023524654A (ja) | 2023-06-13 |
AU2021259460A1 (en) | 2022-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7428825B2 (ja) | 受容体相互作用の分析のための方法およびシステム | |
Pai et al. | High-throughput and single-cell T cell receptor sequencing technologies | |
Emerson et al. | Immunosequencing identifies signatures of cytomegalovirus exposure history and HLA-mediated effects on the T cell repertoire | |
Bradley et al. | Using T cell receptor repertoires to understand the principles of adaptive immune recognition | |
JP7047115B2 (ja) | Mhcペプチド結合予測のためのgan-cnn | |
Fischer et al. | Predicting antigen specificity of single T cells based on TCR CDR 3 regions | |
Greiff et al. | Mining adaptive immune receptor repertoires for biological and clinical information using machine learning | |
Binder et al. | Big data in medical science—a biostatistical view: Part 21 of a series on evaluation of scientific publications | |
Meysman et al. | On the viability of unsupervised T-cell receptor sequence clustering for epitope preference | |
BR112019027179A2 (pt) | interpretação de variantes genéticas e genômicas por meio de uma estrutura de aprendizagem profunda de mutação computacional e experimental integrada | |
JP2021503922A (ja) | ターゲットシーケンシングのためのモデル | |
AU2019403273A1 (en) | Cancer tissue source of origin prediction with multi-tier analysis of small variants in cell-free dna samples | |
EP4399710A2 (en) | Systems and methods for the identification of target-specific t cells and their receptor sequences using machine learning | |
Camaglia et al. | Quantifying changes in the T cell receptor repertoire during thymic development | |
Sidhom et al. | DeepTCR: a deep learning framework for revealing structural concepts within TCR Repertoire | |
Dorigatti et al. | Predicting t cell receptor functionality against mutant epitopes | |
Camaglia et al. | Population based selection shapes the T cell receptor repertoire during thymic development | |
Afik et al. | Targeted reconstruction of T cell receptor sequence from single cell RNA-sequencing links CDR3 length to T cell differentiation state | |
Sevy | ErrorX: automated error correction for immune repertoire sequencing datasets | |
Meysman et al. | The workings and failings of clustering T-cell receptor beta-chain sequences without a known epitope preference | |
Warnat-Herresthal et al. | Artificial intelligence in blood transcriptomics | |
KR102547350B1 (ko) | 인간 백혈구 항원의 타입을 결정하기 위한 방법 및 장치 | |
KR102557986B1 (ko) | 인공지능 기술을 사용하여 염기 서열의 변이를 검출하기 위한 방법 및 장치 | |
Xue et al. | Disease associated human TCR characterization by deep-learning framework TCR-DeepInsight | |
Abondio et al. | Single Cell Multiomic Approaches to Disentangle T Cell Heterogeneity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221221 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230919 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231218 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240125 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7428825 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |