CN116888278A - 分析癌症基质中免疫浸润以预测临床转归的方法和组合物 - Google Patents
分析癌症基质中免疫浸润以预测临床转归的方法和组合物 Download PDFInfo
- Publication number
- CN116888278A CN116888278A CN202180090994.9A CN202180090994A CN116888278A CN 116888278 A CN116888278 A CN 116888278A CN 202180090994 A CN202180090994 A CN 202180090994A CN 116888278 A CN116888278 A CN 116888278A
- Authority
- CN
- China
- Prior art keywords
- analyte
- biological sample
- cells
- region
- cancerous
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 286
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 185
- 201000011510 cancer Diseases 0.000 title claims abstract description 110
- 230000008595 infiltration Effects 0.000 title claims abstract description 83
- 238000001764 infiltration Methods 0.000 title claims abstract description 83
- 239000000203 mixture Substances 0.000 title description 14
- 239000012491 analyte Substances 0.000 claims abstract description 560
- 239000012472 biological sample Substances 0.000 claims abstract description 449
- 210000002865 immune cell Anatomy 0.000 claims abstract description 285
- 239000011159 matrix material Substances 0.000 claims abstract description 119
- 238000010801 machine learning Methods 0.000 claims abstract description 115
- 239000000523 sample Substances 0.000 claims description 304
- 239000003795 chemical substances by application Substances 0.000 claims description 139
- 210000004027 cell Anatomy 0.000 claims description 117
- 210000001519 tissue Anatomy 0.000 claims description 92
- 108090000623 proteins and genes Proteins 0.000 claims description 78
- 230000000295 complement effect Effects 0.000 claims description 70
- 210000003171 tumor-infiltrating lymphocyte Anatomy 0.000 claims description 68
- 239000000758 substrate Substances 0.000 claims description 64
- -1 PIKCD Proteins 0.000 claims description 55
- 210000003719 b-lymphocyte Anatomy 0.000 claims description 50
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 claims description 46
- 101000716102 Homo sapiens T-cell surface glycoprotein CD4 Proteins 0.000 claims description 46
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 claims description 46
- 102100036011 T-cell surface glycoprotein CD4 Human genes 0.000 claims description 46
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 42
- 150000007523 nucleic acids Chemical class 0.000 claims description 41
- 238000012163 sequencing technique Methods 0.000 claims description 36
- 102000039446 nucleic acids Human genes 0.000 claims description 34
- 108020004707 nucleic acids Proteins 0.000 claims description 34
- 102000004169 proteins and genes Human genes 0.000 claims description 33
- 238000011282 treatment Methods 0.000 claims description 31
- 239000002243 precursor Substances 0.000 claims description 29
- 239000006227 byproduct Substances 0.000 claims description 26
- 239000007857 degradation product Substances 0.000 claims description 26
- 238000010186 staining Methods 0.000 claims description 25
- 101000946843 Homo sapiens T-cell surface glycoprotein CD8 alpha chain Proteins 0.000 claims description 23
- 102100034922 T-cell surface glycoprotein CD8 alpha chain Human genes 0.000 claims description 23
- 101000946863 Homo sapiens T-cell surface glycoprotein CD3 delta chain Proteins 0.000 claims description 21
- 102100035891 T-cell surface glycoprotein CD3 delta chain Human genes 0.000 claims description 21
- 210000001616 monocyte Anatomy 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 claims description 18
- 239000000427 antigen Substances 0.000 claims description 18
- 108091007433 antigens Proteins 0.000 claims description 18
- 102000036639 antigens Human genes 0.000 claims description 18
- 108700020463 BRCA1 Proteins 0.000 claims description 17
- 102000036365 BRCA1 Human genes 0.000 claims description 17
- 101150072950 BRCA1 gene Proteins 0.000 claims description 17
- 102000052609 BRCA2 Human genes 0.000 claims description 17
- 108700020462 BRCA2 Proteins 0.000 claims description 17
- 101150008921 Brca2 gene Proteins 0.000 claims description 17
- 102100039498 Cytotoxic T-lymphocyte protein 4 Human genes 0.000 claims description 17
- 210000000822 natural killer cell Anatomy 0.000 claims description 17
- 239000003550 marker Substances 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 16
- 238000011065 in-situ storage Methods 0.000 claims description 15
- WZUVPPKBWHMQCE-UHFFFAOYSA-N Haematoxylin Chemical compound C12=CC(O)=C(O)C=C2CC2(O)C1C1=CC=C(O)C(O)=C1OC2 WZUVPPKBWHMQCE-UHFFFAOYSA-N 0.000 claims description 14
- 101000840258 Homo sapiens Immunoglobulin J chain Proteins 0.000 claims description 14
- 102100029571 Immunoglobulin J chain Human genes 0.000 claims description 14
- 210000004180 plasmocyte Anatomy 0.000 claims description 14
- 102100033587 DNA topoisomerase 2-alpha Human genes 0.000 claims description 13
- 102100029095 Exportin-1 Human genes 0.000 claims description 13
- 101000917839 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor III-B Proteins 0.000 claims description 13
- 102100029185 Low affinity immunoglobulin gamma Fc region receptor III-B Human genes 0.000 claims description 13
- 101100485284 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CRM1 gene Proteins 0.000 claims description 13
- 108010046308 Type II DNA Topoisomerases Proteins 0.000 claims description 13
- 101150094313 XPO1 gene Proteins 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 13
- 108700002148 exportin 1 Proteins 0.000 claims description 13
- 238000003384 imaging method Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 13
- 102100027203 B-cell antigen receptor complex-associated protein beta chain Human genes 0.000 claims description 12
- 101000914491 Homo sapiens B-cell antigen receptor complex-associated protein beta chain Proteins 0.000 claims description 12
- 101000889276 Homo sapiens Cytotoxic T-lymphocyte protein 4 Proteins 0.000 claims description 12
- 101000840257 Homo sapiens Immunoglobulin kappa constant Proteins 0.000 claims description 12
- 102100029572 Immunoglobulin kappa constant Human genes 0.000 claims description 12
- 229940127089 cytotoxic agent Drugs 0.000 claims description 12
- 210000003289 regulatory T cell Anatomy 0.000 claims description 12
- 102100030386 Granzyme A Human genes 0.000 claims description 11
- 101001009599 Homo sapiens Granzyme A Proteins 0.000 claims description 11
- 101000961156 Homo sapiens Immunoglobulin heavy constant gamma 1 Proteins 0.000 claims description 11
- 101001128500 Homo sapiens Marginal zone B- and B1-cell-specific protein Proteins 0.000 claims description 11
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 claims description 11
- 101000945496 Homo sapiens Proliferation marker protein Ki-67 Proteins 0.000 claims description 11
- 102100039345 Immunoglobulin heavy constant gamma 1 Human genes 0.000 claims description 11
- 102000011782 Keratins Human genes 0.000 claims description 11
- 108010076876 Keratins Proteins 0.000 claims description 11
- 102100031826 Marginal zone B- and B1-cell-specific protein Human genes 0.000 claims description 11
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 claims description 11
- 102100034836 Proliferation marker protein Ki-67 Human genes 0.000 claims description 11
- 108020004999 messenger RNA Proteins 0.000 claims description 11
- 238000003860 storage Methods 0.000 claims description 11
- 102100021266 Alpha-(1,6)-fucosyltransferase Human genes 0.000 claims description 10
- 102100034157 DNA mismatch repair protein Msh2 Human genes 0.000 claims description 10
- 102100039121 Histone-lysine N-methyltransferase MECOM Human genes 0.000 claims description 10
- 101000819490 Homo sapiens Alpha-(1,6)-fucosyltransferase Proteins 0.000 claims description 10
- 101000917858 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor III-A Proteins 0.000 claims description 10
- 101100076418 Homo sapiens MECOM gene Proteins 0.000 claims description 10
- 101000739168 Homo sapiens Mammaglobin-B Proteins 0.000 claims description 10
- 101000610107 Homo sapiens Pre-B-cell leukemia transcription factor 1 Proteins 0.000 claims description 10
- 101000979599 Homo sapiens Protein NKG7 Proteins 0.000 claims description 10
- 101000652324 Homo sapiens Transcription factor SOX-17 Proteins 0.000 claims description 10
- 101000955999 Homo sapiens V-set domain-containing T-cell activation inhibitor 1 Proteins 0.000 claims description 10
- 108700024831 MDS1 and EVI1 Complex Locus Proteins 0.000 claims description 10
- 102100037267 Mammaglobin-B Human genes 0.000 claims description 10
- 102100040171 Pre-B-cell leukemia transcription factor 1 Human genes 0.000 claims description 10
- 102100023370 Protein NKG7 Human genes 0.000 claims description 10
- 102100030243 Transcription factor SOX-17 Human genes 0.000 claims description 10
- 102100038929 V-set domain-containing T-cell activation inhibitor 1 Human genes 0.000 claims description 10
- 210000004443 dendritic cell Anatomy 0.000 claims description 10
- 230000003287 optical effect Effects 0.000 claims description 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 9
- 102100027205 B-cell antigen receptor complex-associated protein alpha chain Human genes 0.000 claims description 9
- 108091007854 Cdh1/Fizzy-related Proteins 0.000 claims description 9
- 101000914489 Homo sapiens B-cell antigen receptor complex-associated protein alpha chain Proteins 0.000 claims description 9
- 101001134036 Homo sapiens DNA mismatch repair protein Msh2 Proteins 0.000 claims description 9
- 101000946860 Homo sapiens T-cell surface glycoprotein CD3 epsilon chain Proteins 0.000 claims description 9
- 102000017578 LAG3 Human genes 0.000 claims description 9
- 229910015837 MSH2 Inorganic materials 0.000 claims description 9
- 102100035794 T-cell surface glycoprotein CD3 epsilon chain Human genes 0.000 claims description 9
- 239000002246 antineoplastic agent Substances 0.000 claims description 9
- 102000017420 CD3 protein, epsilon/gamma/delta subunit Human genes 0.000 claims description 8
- 108050005493 CD3 protein, epsilon/gamma/delta subunit Proteins 0.000 claims description 8
- 102100036420 Calmodulin-like protein 6 Human genes 0.000 claims description 8
- 102100027634 Fibronectin type 3 and ankyrin repeat domains protein 1 Human genes 0.000 claims description 8
- 101000714372 Homo sapiens Calmodulin-like protein 6 Proteins 0.000 claims description 8
- 101000937169 Homo sapiens Fibronectin type 3 and ankyrin repeat domains protein 1 Proteins 0.000 claims description 8
- 101001055315 Homo sapiens Immunoglobulin heavy constant alpha 1 Proteins 0.000 claims description 8
- 101000599940 Homo sapiens Interferon gamma Proteins 0.000 claims description 8
- 101001019600 Homo sapiens Interleukin-17 receptor B Proteins 0.000 claims description 8
- 101001043809 Homo sapiens Interleukin-7 receptor subunit alpha Proteins 0.000 claims description 8
- 101000595746 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit delta isoform Proteins 0.000 claims description 8
- 102100026217 Immunoglobulin heavy constant alpha 1 Human genes 0.000 claims description 8
- 102100037850 Interferon gamma Human genes 0.000 claims description 8
- 102100035014 Interleukin-17 receptor B Human genes 0.000 claims description 8
- 102100021593 Interleukin-7 receptor subunit alpha Human genes 0.000 claims description 8
- 102100036056 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit delta isoform Human genes 0.000 claims description 8
- 239000012634 fragment Substances 0.000 claims description 8
- 210000002540 macrophage Anatomy 0.000 claims description 8
- 238000001356 surgical procedure Methods 0.000 claims description 8
- 108091023037 Aptamer Proteins 0.000 claims description 7
- 108010009992 CD163 antigen Proteins 0.000 claims description 7
- 108010067741 Fanconi Anemia Complementation Group N protein Proteins 0.000 claims description 7
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 claims description 7
- 102100038895 Myc proto-oncogene protein Human genes 0.000 claims description 7
- 102100023087 Protein S100-A4 Human genes 0.000 claims description 7
- 101710148333 Regulator of G-protein signaling 13 Proteins 0.000 claims description 7
- 102100021035 Regulator of G-protein signaling 18 Human genes 0.000 claims description 7
- 108010085149 S100 Calcium-Binding Protein A4 Proteins 0.000 claims description 7
- 102100025831 Scavenger receptor cysteine-rich type 1 protein M130 Human genes 0.000 claims description 7
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 claims description 7
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 claims description 7
- 210000004969 inflammatory cell Anatomy 0.000 claims description 7
- 230000037361 pathway Effects 0.000 claims description 7
- 238000004393 prognosis Methods 0.000 claims description 7
- 238000000638 solvent extraction Methods 0.000 claims description 7
- 102100024222 B-lymphocyte antigen CD19 Human genes 0.000 claims description 6
- 229940045513 CTLA4 antagonist Drugs 0.000 claims description 6
- 102100030385 Granzyme B Human genes 0.000 claims description 6
- 101000980825 Homo sapiens B-lymphocyte antigen CD19 Proteins 0.000 claims description 6
- 101001009603 Homo sapiens Granzyme B Proteins 0.000 claims description 6
- 101000971404 Homo sapiens Protein kinase C iota type Proteins 0.000 claims description 6
- 101000835093 Homo sapiens Transferrin receptor protein 1 Proteins 0.000 claims description 6
- 101000860430 Homo sapiens Versican core protein Proteins 0.000 claims description 6
- 101150030213 Lag3 gene Proteins 0.000 claims description 6
- 108010051742 Platelet-Derived Growth Factor beta Receptor Proteins 0.000 claims description 6
- 102100026547 Platelet-derived growth factor receptor beta Human genes 0.000 claims description 6
- 102100021557 Protein kinase C iota type Human genes 0.000 claims description 6
- 108010068097 Rad51 Recombinase Proteins 0.000 claims description 6
- 102000002490 Rad51 Recombinase Human genes 0.000 claims description 6
- 102100026144 Transferrin receptor protein 1 Human genes 0.000 claims description 6
- 102100028437 Versican core protein Human genes 0.000 claims description 6
- 239000004037 angiogenesis inhibitor Substances 0.000 claims description 6
- 210000002536 stromal cell Anatomy 0.000 claims description 6
- 239000000439 tumor marker Substances 0.000 claims description 6
- 102100026656 Actin, alpha skeletal muscle Human genes 0.000 claims description 5
- 108010021064 CTLA-4 Antigen Proteins 0.000 claims description 5
- 101000834207 Homo sapiens Actin, alpha skeletal muscle Proteins 0.000 claims description 5
- 101001055314 Homo sapiens Immunoglobulin heavy constant alpha 2 Proteins 0.000 claims description 5
- 101000840271 Homo sapiens Immunoglobulin lambda constant 2 Proteins 0.000 claims description 5
- 101001005360 Homo sapiens Immunoglobulin lambda variable 3-1 Proteins 0.000 claims description 5
- 101000840266 Homo sapiens Immunoglobulin lambda-like polypeptide 5 Proteins 0.000 claims description 5
- 101001137987 Homo sapiens Lymphocyte activation gene 3 protein Proteins 0.000 claims description 5
- 102100026216 Immunoglobulin heavy constant alpha 2 Human genes 0.000 claims description 5
- 102100029620 Immunoglobulin lambda constant 2 Human genes 0.000 claims description 5
- 102100025921 Immunoglobulin lambda variable 3-1 Human genes 0.000 claims description 5
- 102100029617 Immunoglobulin lambda-like polypeptide 5 Human genes 0.000 claims description 5
- 108010070047 Notch Receptors Proteins 0.000 claims description 5
- 102000005650 Notch Receptors Human genes 0.000 claims description 5
- 238000001574 biopsy Methods 0.000 claims description 5
- 210000002808 connective tissue Anatomy 0.000 claims description 5
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 claims description 5
- 239000003966 growth inhibitor Substances 0.000 claims description 5
- 102000005962 receptors Human genes 0.000 claims description 5
- 108020003175 receptors Proteins 0.000 claims description 5
- 230000001225 therapeutic effect Effects 0.000 claims description 5
- 101100339431 Arabidopsis thaliana HMGB2 gene Proteins 0.000 claims description 4
- 108700010013 HMGB1 Proteins 0.000 claims description 4
- 101150021904 HMGB1 gene Proteins 0.000 claims description 4
- 108010007712 Hepatitis A Virus Cellular Receptor 1 Proteins 0.000 claims description 4
- 102100034459 Hepatitis A virus cellular receptor 1 Human genes 0.000 claims description 4
- 102100037907 High mobility group protein B1 Human genes 0.000 claims description 4
- 102100022128 High mobility group protein B2 Human genes 0.000 claims description 4
- 101001045791 Homo sapiens High mobility group protein B2 Proteins 0.000 claims description 4
- 101000839687 Homo sapiens Immunoglobulin heavy variable 3-74 Proteins 0.000 claims description 4
- 101001057504 Homo sapiens Interferon-stimulated gene 20 kDa protein Proteins 0.000 claims description 4
- 101001055144 Homo sapiens Interleukin-2 receptor subunit alpha Proteins 0.000 claims description 4
- 101000866795 Homo sapiens Non-histone chromosomal protein HMG-14 Proteins 0.000 claims description 4
- 101000801234 Homo sapiens Tumor necrosis factor receptor superfamily member 18 Proteins 0.000 claims description 4
- 101000679851 Homo sapiens Tumor necrosis factor receptor superfamily member 4 Proteins 0.000 claims description 4
- 102100028305 Immunoglobulin heavy variable 3-74 Human genes 0.000 claims description 4
- 102000000588 Interleukin-2 Human genes 0.000 claims description 4
- 108010002350 Interleukin-2 Proteins 0.000 claims description 4
- 102000055120 MEF2 Transcription Factors Human genes 0.000 claims description 4
- 108010018650 MEF2 Transcription Factors Proteins 0.000 claims description 4
- 102100031353 Non-histone chromosomal protein HMG-14 Human genes 0.000 claims description 4
- 101150043341 Socs3 gene Proteins 0.000 claims description 4
- 102000058015 Suppressor of Cytokine Signaling 3 Human genes 0.000 claims description 4
- 108700027337 Suppressor of Cytokine Signaling 3 Proteins 0.000 claims description 4
- 108091008874 T cell receptors Proteins 0.000 claims description 4
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 claims description 4
- 102100033726 Tumor necrosis factor receptor superfamily member 17 Human genes 0.000 claims description 4
- 102100033728 Tumor necrosis factor receptor superfamily member 18 Human genes 0.000 claims description 4
- 102100022153 Tumor necrosis factor receptor superfamily member 4 Human genes 0.000 claims description 4
- 230000001640 apoptogenic effect Effects 0.000 claims description 4
- 210000004204 blood vessel Anatomy 0.000 claims description 4
- 239000003086 colorant Substances 0.000 claims description 4
- 239000002254 cytotoxic agent Substances 0.000 claims description 4
- 231100000599 cytotoxic agent Toxicity 0.000 claims description 4
- 239000002955 immunomodulating agent Substances 0.000 claims description 4
- 206010061289 metastatic neoplasm Diseases 0.000 claims description 4
- 230000002285 radioactive effect Effects 0.000 claims description 4
- 230000003439 radiotherapeutic effect Effects 0.000 claims description 4
- 150000003384 small molecules Chemical class 0.000 claims description 4
- 102100036506 11-beta-hydroxysteroid dehydrogenase 1 Human genes 0.000 claims description 3
- 108091008875 B cell receptors Proteins 0.000 claims description 3
- 102100022005 B-lymphocyte antigen CD20 Human genes 0.000 claims description 3
- 102100021992 CD209 antigen Human genes 0.000 claims description 3
- 102100025466 Carcinoembryonic antigen-related cell adhesion molecule 3 Human genes 0.000 claims description 3
- 102100026658 Cathepsin W Human genes 0.000 claims description 3
- 102000000844 Cell Surface Receptors Human genes 0.000 claims description 3
- 108010001857 Cell Surface Receptors Proteins 0.000 claims description 3
- 102100035298 Cytokine SCM-1 beta Human genes 0.000 claims description 3
- 108700022150 Designed Ankyrin Repeat Proteins Proteins 0.000 claims description 3
- 102100030751 Eomesodermin homolog Human genes 0.000 claims description 3
- 102100031511 Fc receptor-like protein 2 Human genes 0.000 claims description 3
- 102100039622 Granulocyte colony-stimulating factor receptor Human genes 0.000 claims description 3
- 102100021186 Granulysin Human genes 0.000 claims description 3
- 102100038393 Granzyme H Human genes 0.000 claims description 3
- 102100034405 Headcase protein homolog Human genes 0.000 claims description 3
- 102100038009 High affinity immunoglobulin epsilon receptor subunit beta Human genes 0.000 claims description 3
- 108010014095 Histidine decarboxylase Proteins 0.000 claims description 3
- 101000928753 Homo sapiens 11-beta-hydroxysteroid dehydrogenase 1 Proteins 0.000 claims description 3
- 101000897405 Homo sapiens B-lymphocyte antigen CD20 Proteins 0.000 claims description 3
- 101000897416 Homo sapiens CD209 antigen Proteins 0.000 claims description 3
- 101000914337 Homo sapiens Carcinoembryonic antigen-related cell adhesion molecule 3 Proteins 0.000 claims description 3
- 101000910988 Homo sapiens Cathepsin W Proteins 0.000 claims description 3
- 101000804771 Homo sapiens Cytokine SCM-1 beta Proteins 0.000 claims description 3
- 101001064167 Homo sapiens Eomesodermin homolog Proteins 0.000 claims description 3
- 101000892451 Homo sapiens Fc receptor-like B Proteins 0.000 claims description 3
- 101000846911 Homo sapiens Fc receptor-like protein 2 Proteins 0.000 claims description 3
- 101000746364 Homo sapiens Granulocyte colony-stimulating factor receptor Proteins 0.000 claims description 3
- 101001040751 Homo sapiens Granulysin Proteins 0.000 claims description 3
- 101001033000 Homo sapiens Granzyme H Proteins 0.000 claims description 3
- 101000878594 Homo sapiens High affinity immunoglobulin epsilon receptor subunit beta Proteins 0.000 claims description 3
- 101000878602 Homo sapiens Immunoglobulin alpha Fc receptor Proteins 0.000 claims description 3
- 101000945333 Homo sapiens Killer cell immunoglobulin-like receptor 2DL3 Proteins 0.000 claims description 3
- 101000945351 Homo sapiens Killer cell immunoglobulin-like receptor 3DL1 Proteins 0.000 claims description 3
- 101000804764 Homo sapiens Lymphotactin Proteins 0.000 claims description 3
- 101000934372 Homo sapiens Macrosialin Proteins 0.000 claims description 3
- 101000956317 Homo sapiens Membrane-spanning 4-domains subfamily A member 4A Proteins 0.000 claims description 3
- 101001109501 Homo sapiens NKG2-D type II integral membrane protein Proteins 0.000 claims description 3
- 101000589301 Homo sapiens Natural cytotoxicity triggering receptor 1 Proteins 0.000 claims description 3
- 101000884270 Homo sapiens Natural killer cell receptor 2B4 Proteins 0.000 claims description 3
- 101000971513 Homo sapiens Natural killer cells antigen CD94 Proteins 0.000 claims description 3
- 101000987581 Homo sapiens Perforin-1 Proteins 0.000 claims description 3
- 101001129365 Homo sapiens Prepronociceptin Proteins 0.000 claims description 3
- 101000937675 Homo sapiens Putative uncharacterized protein FAM30A Proteins 0.000 claims description 3
- 101000633778 Homo sapiens SLAM family member 5 Proteins 0.000 claims description 3
- 101000863900 Homo sapiens Sialic acid-binding Ig-like lectin 5 Proteins 0.000 claims description 3
- 101000934376 Homo sapiens T-cell differentiation antigen CD6 Proteins 0.000 claims description 3
- 101000837401 Homo sapiens T-cell leukemia/lymphoma protein 1A Proteins 0.000 claims description 3
- 101000738413 Homo sapiens T-cell surface glycoprotein CD3 gamma chain Proteins 0.000 claims description 3
- 101000825182 Homo sapiens Transcription factor Spi-B Proteins 0.000 claims description 3
- 101000795074 Homo sapiens Tryptase alpha/beta-1 Proteins 0.000 claims description 3
- 101000801255 Homo sapiens Tumor necrosis factor receptor superfamily member 17 Proteins 0.000 claims description 3
- 101000984551 Homo sapiens Tyrosine-protein kinase Blk Proteins 0.000 claims description 3
- 101000818522 Homo sapiens fMet-Leu-Phe receptor Proteins 0.000 claims description 3
- 102100038005 Immunoglobulin alpha Fc receptor Human genes 0.000 claims description 3
- 108010017411 Interleukin-21 Receptors Proteins 0.000 claims description 3
- 102100030699 Interleukin-21 receptor Human genes 0.000 claims description 3
- 230000004163 JAK-STAT signaling pathway Effects 0.000 claims description 3
- 102100033634 Killer cell immunoglobulin-like receptor 2DL3 Human genes 0.000 claims description 3
- 102100033627 Killer cell immunoglobulin-like receptor 3DL1 Human genes 0.000 claims description 3
- 102100035304 Lymphotactin Human genes 0.000 claims description 3
- 102100025136 Macrosialin Human genes 0.000 claims description 3
- 102100030612 Mast cell carboxypeptidase A Human genes 0.000 claims description 3
- 102100038556 Membrane-spanning 4-domains subfamily A member 4A Human genes 0.000 claims description 3
- 108091006676 Monovalent cation:proton antiporter-3 Proteins 0.000 claims description 3
- 102100022680 NKG2-D type II integral membrane protein Human genes 0.000 claims description 3
- 102100032870 Natural cytotoxicity triggering receptor 1 Human genes 0.000 claims description 3
- 102100038082 Natural killer cell receptor 2B4 Human genes 0.000 claims description 3
- 102100021462 Natural killer cells antigen CD94 Human genes 0.000 claims description 3
- 102100028467 Perforin-1 Human genes 0.000 claims description 3
- 102100031292 Prepronociceptin Human genes 0.000 claims description 3
- 102100023832 Prolyl endopeptidase FAP Human genes 0.000 claims description 3
- 102100027323 Putative uncharacterized protein FAM30A Human genes 0.000 claims description 3
- 102100033810 RAC-alpha serine/threonine-protein kinase Human genes 0.000 claims description 3
- 102100029216 SLAM family member 5 Human genes 0.000 claims description 3
- 102100029957 Sialic acid-binding Ig-like lectin 5 Human genes 0.000 claims description 3
- 102100025131 T-cell differentiation antigen CD6 Human genes 0.000 claims description 3
- 102100028676 T-cell leukemia/lymphoma protein 1A Human genes 0.000 claims description 3
- 102100037911 T-cell surface glycoprotein CD3 gamma chain Human genes 0.000 claims description 3
- 102100022281 Transcription factor Spi-B Human genes 0.000 claims description 3
- 102100029639 Tryptase alpha/beta-1 Human genes 0.000 claims description 3
- 102100027053 Tyrosine-protein kinase Blk Human genes 0.000 claims description 3
- 102100021145 fMet-Leu-Phe receptor Human genes 0.000 claims description 3
- 239000012520 frozen sample Substances 0.000 claims description 3
- 239000003446 ligand Substances 0.000 claims description 3
- 210000004698 lymphocyte Anatomy 0.000 claims description 3
- 239000000178 monomer Substances 0.000 claims description 3
- 210000000440 neutrophil Anatomy 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000000611 regression analysis Methods 0.000 claims description 3
- 230000002787 reinforcement Effects 0.000 claims description 3
- 238000002271 resection Methods 0.000 claims description 3
- 206010010356 Congenital anomaly Diseases 0.000 claims description 2
- 101001049181 Homo sapiens Killer cell lectin-like receptor subfamily B member 1 Proteins 0.000 claims description 2
- 101000795085 Homo sapiens Tryptase beta-2 Proteins 0.000 claims description 2
- 102100023678 Killer cell lectin-like receptor subfamily B member 1 Human genes 0.000 claims description 2
- 102100029637 Tryptase beta-2 Human genes 0.000 claims description 2
- 238000013527 convolutional neural network Methods 0.000 claims description 2
- 238000001839 endoscopy Methods 0.000 claims description 2
- 210000003714 granulocyte Anatomy 0.000 claims description 2
- 239000012188 paraffin wax Substances 0.000 claims description 2
- 101710088083 Glomulin Proteins 0.000 claims 2
- 102000038594 Cdh1/Fizzy-related Human genes 0.000 claims 1
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 claims 1
- 102000012804 EPCAM Human genes 0.000 claims 1
- 101150084967 EPCAM gene Proteins 0.000 claims 1
- 102000016627 Fanconi Anemia Complementation Group N protein Human genes 0.000 claims 1
- 101000713602 Homo sapiens T-box transcription factor TBX21 Proteins 0.000 claims 1
- 101000803403 Homo sapiens Vimentin Proteins 0.000 claims 1
- 102100026878 Interleukin-2 receptor subunit alpha Human genes 0.000 claims 1
- 102100036840 T-box transcription factor TBX21 Human genes 0.000 claims 1
- 101150057140 TACSTD1 gene Proteins 0.000 claims 1
- 101100395211 Trichoderma harzianum his3 gene Proteins 0.000 claims 1
- 102100035071 Vimentin Human genes 0.000 claims 1
- 230000008485 antagonism Effects 0.000 claims 1
- 238000002052 colonoscopy Methods 0.000 claims 1
- 230000014509 gene expression Effects 0.000 description 138
- 230000000875 corresponding effect Effects 0.000 description 34
- 230000000903 blocking effect Effects 0.000 description 27
- 108091034117 Oligonucleotide Proteins 0.000 description 24
- 238000003125 immunofluorescent labeling Methods 0.000 description 22
- 102000018651 Epithelial Cell Adhesion Molecule Human genes 0.000 description 21
- 108010066687 Epithelial Cell Adhesion Molecule Proteins 0.000 description 21
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 21
- 239000000090 biomarker Substances 0.000 description 19
- 238000012732 spatial analysis Methods 0.000 description 19
- 239000003153 chemical reaction reagent Substances 0.000 description 18
- 102000013127 Vimentin Human genes 0.000 description 17
- 108010065472 Vimentin Proteins 0.000 description 17
- 238000012360 testing method Methods 0.000 description 17
- 210000005048 vimentin Anatomy 0.000 description 17
- 206010061535 Ovarian neoplasm Diseases 0.000 description 13
- 238000010586 diagram Methods 0.000 description 13
- 238000009826 distribution Methods 0.000 description 13
- 125000003729 nucleotide group Chemical group 0.000 description 13
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 12
- 230000000670 limiting effect Effects 0.000 description 12
- 239000002773 nucleotide Substances 0.000 description 12
- 230000001105 regulatory effect Effects 0.000 description 12
- 210000004981 tumor-associated macrophage Anatomy 0.000 description 12
- 108700018351 Major Histocompatibility Complex Proteins 0.000 description 11
- 201000010099 disease Diseases 0.000 description 11
- 230000020382 suppression by virus of host antigen processing and presentation of peptide antigen via MHC class I Effects 0.000 description 11
- 208000035475 disorder Diseases 0.000 description 10
- 238000009396 hybridization Methods 0.000 description 10
- 239000000047 product Substances 0.000 description 10
- 206010033128 Ovarian cancer Diseases 0.000 description 9
- 102100025805 Cadherin-1 Human genes 0.000 description 8
- 125000005647 linker group Chemical group 0.000 description 8
- 108090000765 processed proteins & peptides Proteins 0.000 description 8
- 238000001959 radiotherapy Methods 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- 108010090804 Streptavidin Proteins 0.000 description 7
- 238000003776 cleavage reaction Methods 0.000 description 7
- 239000012530 fluid Substances 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 108020004414 DNA Proteins 0.000 description 6
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 6
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 6
- 102000048850 Neoplasm Genes Human genes 0.000 description 6
- 108700019961 Neoplasm Genes Proteins 0.000 description 6
- 102100040884 Partner and localizer of BRCA2 Human genes 0.000 description 6
- NKANXQFJJICGDU-QPLCGJKRSA-N Tamoxifen Chemical compound C=1C=CC=CC=1C(/CC)=C(C=1C=CC(OCCN(C)C)=CC=1)/C1=CC=CC=C1 NKANXQFJJICGDU-QPLCGJKRSA-N 0.000 description 6
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 6
- 238000002512 chemotherapy Methods 0.000 description 6
- 238000012744 immunostaining Methods 0.000 description 6
- 230000003834 intracellular effect Effects 0.000 description 6
- 230000008685 targeting Effects 0.000 description 6
- 102100027581 Forkhead box protein P3 Human genes 0.000 description 5
- 101000861452 Homo sapiens Forkhead box protein P3 Proteins 0.000 description 5
- 230000003828 downregulation Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 230000002018 overexpression Effects 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000000284 resting effect Effects 0.000 description 5
- 230000003827 upregulation Effects 0.000 description 5
- 229960005486 vaccine Drugs 0.000 description 5
- 230000003612 virological effect Effects 0.000 description 5
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 4
- 102100027207 CD27 antigen Human genes 0.000 description 4
- 101000914511 Homo sapiens CD27 antigen Proteins 0.000 description 4
- 101001134216 Homo sapiens Macrophage scavenger receptor types I and II Proteins 0.000 description 4
- 102100034184 Macrophage scavenger receptor types I and II Human genes 0.000 description 4
- 102100024834 T-cell immunoreceptor with Ig and ITIM domains Human genes 0.000 description 4
- 208000024770 Thyroid neoplasm Diseases 0.000 description 4
- 239000002771 cell marker Substances 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 239000003112 inhibitor Substances 0.000 description 4
- 150000002632 lipids Chemical class 0.000 description 4
- 230000004807 localization Effects 0.000 description 4
- 201000001441 melanoma Diseases 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000002560 therapeutic procedure Methods 0.000 description 4
- 201000002510 thyroid cancer Diseases 0.000 description 4
- 230000009452 underexpressoin Effects 0.000 description 4
- 206010005003 Bladder cancer Diseases 0.000 description 3
- 206010006187 Breast cancer Diseases 0.000 description 3
- 208000026310 Breast neoplasm Diseases 0.000 description 3
- 108091033409 CRISPR Proteins 0.000 description 3
- 206010009944 Colon cancer Diseases 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 102000001301 EGF receptor Human genes 0.000 description 3
- 108091092584 GDNA Proteins 0.000 description 3
- 101000831007 Homo sapiens T-cell immunoreceptor with Ig and ITIM domains Proteins 0.000 description 3
- 102100027268 Interferon-stimulated gene 20 kDa protein Human genes 0.000 description 3
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 3
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 3
- 102000007982 Phosphoproteins Human genes 0.000 description 3
- 108010089430 Phosphoproteins Proteins 0.000 description 3
- 108091036407 Polyadenylation Proteins 0.000 description 3
- 108091034057 RNA (poly(A)) Proteins 0.000 description 3
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 230000008045 co-localization Effects 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 239000007850 fluorescent dye Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 210000002443 helper t lymphocyte Anatomy 0.000 description 3
- 238000010166 immunofluorescence Methods 0.000 description 3
- 201000005202 lung cancer Diseases 0.000 description 3
- 208000020816 lung neoplasm Diseases 0.000 description 3
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000002207 metabolite Substances 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 201000002528 pancreatic cancer Diseases 0.000 description 3
- 208000008443 pancreatic carcinoma Diseases 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 230000005855 radiation Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 229960001603 tamoxifen Drugs 0.000 description 3
- 229940124597 therapeutic agent Drugs 0.000 description 3
- 239000000107 tumor biomarker Substances 0.000 description 3
- 201000005112 urinary bladder cancer Diseases 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 102100031585 ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 Human genes 0.000 description 2
- 208000036832 Adenocarcinoma of ovary Diseases 0.000 description 2
- 230000007730 Akt signaling Effects 0.000 description 2
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 2
- 238000010354 CRISPR gene editing Methods 0.000 description 2
- 102000000905 Cadherin Human genes 0.000 description 2
- 108050007957 Cadherin Proteins 0.000 description 2
- 102000053642 Catalytic RNA Human genes 0.000 description 2
- 108090000994 Catalytic RNA Proteins 0.000 description 2
- 101000764817 Chromohalobacter salexigens (strain ATCC BAA-138 / DSM 3043 / CIP 106854 / NCIMB 13768 / 1H11) Oxygen-dependent choline dehydrogenase 1 Proteins 0.000 description 2
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 2
- 101000800505 Drosophila melanogaster Muscle-specific homeobox protein tinman Proteins 0.000 description 2
- 108060006698 EGF receptor Proteins 0.000 description 2
- 206010014733 Endometrial cancer Diseases 0.000 description 2
- 206010014759 Endometrial neoplasm Diseases 0.000 description 2
- 102100031780 Endonuclease Human genes 0.000 description 2
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 2
- 102000003886 Glycoproteins Human genes 0.000 description 2
- 108090000288 Glycoproteins Proteins 0.000 description 2
- 102100034458 Hepatitis A virus cellular receptor 2 Human genes 0.000 description 2
- 101000777636 Homo sapiens ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 Proteins 0.000 description 2
- 101001068133 Homo sapiens Hepatitis A virus cellular receptor 2 Proteins 0.000 description 2
- 101000945490 Homo sapiens Killer cell immunoglobulin-like receptor 3DL2 Proteins 0.000 description 2
- 101000738335 Homo sapiens T-cell surface glycoprotein CD3 zeta chain Proteins 0.000 description 2
- 208000005726 Inflammatory Breast Neoplasms Diseases 0.000 description 2
- 206010021980 Inflammatory carcinoma of the breast Diseases 0.000 description 2
- 230000035986 JAK-STAT signaling Effects 0.000 description 2
- 208000008839 Kidney Neoplasms Diseases 0.000 description 2
- 102100034840 Killer cell immunoglobulin-like receptor 3DL2 Human genes 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 210000004322 M2 macrophage Anatomy 0.000 description 2
- 102100025354 Macrophage mannose receptor 1 Human genes 0.000 description 2
- 108010031099 Mannose Receptor Proteins 0.000 description 2
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 2
- 206010061328 Ovarian epithelial cancer Diseases 0.000 description 2
- 206010035226 Plasma cell myeloma Diseases 0.000 description 2
- 206010060862 Prostate cancer Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 206010038389 Renal cancer Diseases 0.000 description 2
- 102000002278 Ribosomal Proteins Human genes 0.000 description 2
- 108010000605 Ribosomal Proteins Proteins 0.000 description 2
- 206010039491 Sarcoma Diseases 0.000 description 2
- 102100037906 T-cell surface glycoprotein CD3 zeta chain Human genes 0.000 description 2
- 102000006467 TATA-Box Binding Protein Human genes 0.000 description 2
- 108010044281 TATA-Box Binding Protein Proteins 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 208000009956 adenocarcinoma Diseases 0.000 description 2
- 108091008108 affimer Proteins 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 239000005557 antagonist Substances 0.000 description 2
- 239000000074 antisense oligonucleotide Substances 0.000 description 2
- 238000012230 antisense oligonucleotides Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000005013 brain tissue Anatomy 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000033077 cellular process Effects 0.000 description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 210000003690 classically activated macrophage Anatomy 0.000 description 2
- 230000004186 co-expression Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000002074 deregulated effect Effects 0.000 description 2
- 238000002651 drug therapy Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 230000003325 follicular Effects 0.000 description 2
- 108091008053 gene clusters Proteins 0.000 description 2
- 208000005017 glioblastoma Diseases 0.000 description 2
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 2
- 210000003630 histaminocyte Anatomy 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 238000003364 immunohistochemistry Methods 0.000 description 2
- 238000009169 immunotherapy Methods 0.000 description 2
- 201000004653 inflammatory breast carcinoma Diseases 0.000 description 2
- 238000002721 intensity-modulated radiation therapy Methods 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 201000010982 kidney cancer Diseases 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 208000032839 leukemia Diseases 0.000 description 2
- 201000007270 liver cancer Diseases 0.000 description 2
- 208000014018 liver neoplasm Diseases 0.000 description 2
- 230000007762 localization of cell Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 210000001806 memory b lymphocyte Anatomy 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000002611 ovarian Effects 0.000 description 2
- 208000013371 ovarian adenocarcinoma Diseases 0.000 description 2
- 201000006588 ovary adenocarcinoma Diseases 0.000 description 2
- 230000008823 permeabilization Effects 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 229960004622 raloxifene Drugs 0.000 description 2
- GZUITABIAKMVPG-UHFFFAOYSA-N raloxifene Chemical compound C1=CC(O)=CC=C1C1=C(C(=O)C=2C=CC(OCCN3CCCCC3)=CC=2)C2=CC=C(O)C=C2S1 GZUITABIAKMVPG-UHFFFAOYSA-N 0.000 description 2
- 108091092562 ribozyme Proteins 0.000 description 2
- 229940095743 selective estrogen receptor modulator Drugs 0.000 description 2
- 239000000333 selective estrogen receptor modulator Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 206010041823 squamous cell carcinoma Diseases 0.000 description 2
- 208000017572 squamous cell neoplasm Diseases 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 210000001685 thyroid gland Anatomy 0.000 description 2
- 238000013526 transfer learning Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 230000035899 viability Effects 0.000 description 2
- KCEHUPIXDRDKQS-VKHMYHEASA-N (2s)-5-amino-2-hydrazinyl-5-oxopentanoic acid Chemical compound NN[C@H](C(O)=O)CCC(N)=O KCEHUPIXDRDKQS-VKHMYHEASA-N 0.000 description 1
- LKJPYSCBVHEWIU-KRWDZBQOSA-N (R)-bicalutamide Chemical compound C([C@@](O)(C)C(=O)NC=1C=C(C(C#N)=CC=1)C(F)(F)F)S(=O)(=O)C1=CC=C(F)C=C1 LKJPYSCBVHEWIU-KRWDZBQOSA-N 0.000 description 1
- WNXJIVFYUVYPPR-UHFFFAOYSA-N 1,3-dioxolane Chemical compound C1COCO1 WNXJIVFYUVYPPR-UHFFFAOYSA-N 0.000 description 1
- BGFTWECWAICPDG-UHFFFAOYSA-N 2-[bis(4-chlorophenyl)methyl]-4-n-[3-[bis(4-chlorophenyl)methyl]-4-(dimethylamino)phenyl]-1-n,1-n-dimethylbenzene-1,4-diamine Chemical compound C1=C(C(C=2C=CC(Cl)=CC=2)C=2C=CC(Cl)=CC=2)C(N(C)C)=CC=C1NC(C=1)=CC=C(N(C)C)C=1C(C=1C=CC(Cl)=CC=1)C1=CC=C(Cl)C=C1 BGFTWECWAICPDG-UHFFFAOYSA-N 0.000 description 1
- 102100036732 Actin, aortic smooth muscle Human genes 0.000 description 1
- 206010061424 Anal cancer Diseases 0.000 description 1
- 208000007860 Anus Neoplasms Diseases 0.000 description 1
- 101100067974 Arabidopsis thaliana POP2 gene Proteins 0.000 description 1
- 101100257121 Arabidopsis thaliana RAD5A gene Proteins 0.000 description 1
- 101100537798 Arabidopsis thaliana TPS11 gene Proteins 0.000 description 1
- BFYIZQONLCFLEV-DAELLWKTSA-N Aromasine Chemical compound O=C1C=C[C@]2(C)[C@H]3CC[C@](C)(C(CC4)=O)[C@@H]4[C@@H]3CC(=C)C2=C1 BFYIZQONLCFLEV-DAELLWKTSA-N 0.000 description 1
- 102000014654 Aromatase Human genes 0.000 description 1
- 108010078554 Aromatase Proteins 0.000 description 1
- 108010008014 B-Cell Maturation Antigen Proteins 0.000 description 1
- 208000005440 Basal Cell Neoplasms Diseases 0.000 description 1
- 206010004146 Basal cell carcinoma Diseases 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 206010006143 Brain stem glioma Diseases 0.000 description 1
- 101710117545 C protein Proteins 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 239000012275 CTLA-4 inhibitor Substances 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 1
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 208000005243 Chondrosarcoma Diseases 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 108091008102 DNA aptamers Proteins 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- ZQZFYGIXNQKOAV-OCEACIFDSA-N Droloxifene Chemical compound C=1C=CC=CC=1C(/CC)=C(C=1C=C(O)C=CC=1)\C1=CC=C(OCCN(C)C)C=C1 ZQZFYGIXNQKOAV-OCEACIFDSA-N 0.000 description 1
- 208000037162 Ductal Breast Carcinoma Diseases 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 102100024508 Ficolin-1 Human genes 0.000 description 1
- 206010017993 Gastrointestinal neoplasms Diseases 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000929319 Homo sapiens Actin, aortic smooth muscle Proteins 0.000 description 1
- 101100118549 Homo sapiens EGFR gene Proteins 0.000 description 1
- 101001052785 Homo sapiens Ficolin-1 Proteins 0.000 description 1
- 101000998146 Homo sapiens Interleukin-17A Proteins 0.000 description 1
- 101000975474 Homo sapiens Keratin, type I cytoskeletal 10 Proteins 0.000 description 1
- 101000614439 Homo sapiens Keratin, type I cytoskeletal 15 Proteins 0.000 description 1
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 1
- 101000634846 Homo sapiens T-cell receptor-associated transmembrane adapter 1 Proteins 0.000 description 1
- 101100369640 Homo sapiens TIGIT gene Proteins 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- 101150002416 Igf2 gene Proteins 0.000 description 1
- 102000037982 Immune checkpoint proteins Human genes 0.000 description 1
- 108091008036 Immune checkpoint proteins Proteins 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 102100033461 Interleukin-17A Human genes 0.000 description 1
- 102100023970 Keratin, type I cytoskeletal 10 Human genes 0.000 description 1
- 102100040443 Keratin, type I cytoskeletal 15 Human genes 0.000 description 1
- 239000005551 L01XE03 - Erlotinib Substances 0.000 description 1
- JLERVPBPJHKRBJ-UHFFFAOYSA-N LY 117018 Chemical compound C1=CC(O)=CC=C1C1=C(C(=O)C=2C=CC(OCCN3CCCC3)=CC=2)C2=CC=C(O)C=C2S1 JLERVPBPJHKRBJ-UHFFFAOYSA-N 0.000 description 1
- 108010000817 Leuprolide Proteins 0.000 description 1
- 201000011062 Li-Fraumeni syndrome Diseases 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 206010027406 Mesothelioma Diseases 0.000 description 1
- 208000003445 Mouth Neoplasms Diseases 0.000 description 1
- 208000034578 Multiple myelomas Diseases 0.000 description 1
- 101100176493 Mus musculus Gzmf gene Proteins 0.000 description 1
- 101100407308 Mus musculus Pdcd1lg2 gene Proteins 0.000 description 1
- 108700031745 MutS Homolog 2 Proteins 0.000 description 1
- 201000003793 Myelodysplastic syndrome Diseases 0.000 description 1
- 208000003019 Neurofibromatosis 1 Diseases 0.000 description 1
- 101100411639 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) mus-41 gene Proteins 0.000 description 1
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 1
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 239000012270 PD-1 inhibitor Substances 0.000 description 1
- 239000012668 PD-1-inhibitor Substances 0.000 description 1
- 239000012271 PD-L1 inhibitor Substances 0.000 description 1
- 239000012272 PD-L2 inhibitor Substances 0.000 description 1
- 108010067902 Peptide Library Proteins 0.000 description 1
- 208000009565 Pharyngeal Neoplasms Diseases 0.000 description 1
- 206010034811 Pharyngeal cancer Diseases 0.000 description 1
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 1
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 1
- 108700030875 Programmed Cell Death 1 Ligand 2 Proteins 0.000 description 1
- 102100024213 Programmed cell death 1 ligand 2 Human genes 0.000 description 1
- 101710089372 Programmed cell death protein 1 Proteins 0.000 description 1
- 102100040678 Programmed cell death protein 1 Human genes 0.000 description 1
- 102000002727 Protein Tyrosine Phosphatase Human genes 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 101150081777 RAD5 gene Proteins 0.000 description 1
- 108091008103 RNA aptamers Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 208000006265 Renal cell carcinoma Diseases 0.000 description 1
- 101100123851 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) HER1 gene Proteins 0.000 description 1
- 208000004337 Salivary Gland Neoplasms Diseases 0.000 description 1
- 206010061934 Salivary gland cancer Diseases 0.000 description 1
- 101100411620 Schizosaccharomyces pombe (strain 972 / ATCC 24843) rad15 gene Proteins 0.000 description 1
- 208000021712 Soft tissue sarcoma Diseases 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 102100029453 T-cell receptor-associated transmembrane adapter 1 Human genes 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- 102220567860 Thioredoxin domain-containing protein 11_D1A_mutation Human genes 0.000 description 1
- 208000000728 Thymus Neoplasms Diseases 0.000 description 1
- 239000000365 Topoisomerase I Inhibitor Substances 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- 108010005705 Ubiquitinated Proteins Proteins 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- 108091008605 VEGF receptors Proteins 0.000 description 1
- 102000009484 Vascular Endothelial Growth Factor Receptors Human genes 0.000 description 1
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 1
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 206010047741 Vulval cancer Diseases 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 210000000577 adipose tissue Anatomy 0.000 description 1
- 210000004100 adrenal gland Anatomy 0.000 description 1
- 201000005188 adrenal gland cancer Diseases 0.000 description 1
- 208000024447 adrenal gland neoplasm Diseases 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 229960002932 anastrozole Drugs 0.000 description 1
- YBBLVLTVTVSKRW-UHFFFAOYSA-N anastrozole Chemical compound N#CC(C)(C)C1=CC(C(C)(C#N)C)=CC(CN2N=CN=C2)=C1 YBBLVLTVTVSKRW-UHFFFAOYSA-N 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 230000002280 anti-androgenic effect Effects 0.000 description 1
- 230000001093 anti-cancer Effects 0.000 description 1
- 229940046836 anti-estrogen Drugs 0.000 description 1
- 230000001833 anti-estrogenic effect Effects 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- 239000000051 antiandrogen Substances 0.000 description 1
- 229940030495 antiandrogen sex hormone and modulator of the genital system Drugs 0.000 description 1
- 239000013059 antihormonal agent Substances 0.000 description 1
- 201000011165 anus cancer Diseases 0.000 description 1
- 208000021780 appendiceal neoplasm Diseases 0.000 description 1
- 239000003886 aromatase inhibitor Substances 0.000 description 1
- 229940046844 aromatase inhibitors Drugs 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 229960000997 bicalutamide Drugs 0.000 description 1
- 201000009036 biliary tract cancer Diseases 0.000 description 1
- 208000020790 biliary tract neoplasm Diseases 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 239000003124 biologic agent Substances 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 239000000091 biomarker candidate Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000005068 bladder tissue Anatomy 0.000 description 1
- 201000000053 blastoma Diseases 0.000 description 1
- 238000011243 body radiation therapy Methods 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 201000000220 brain stem cancer Diseases 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- GEHJBWKLJVFKPS-UHFFFAOYSA-N bromochloroacetic acid Chemical compound OC(=O)C(Cl)Br GEHJBWKLJVFKPS-UHFFFAOYSA-N 0.000 description 1
- 239000008364 bulk solution Substances 0.000 description 1
- 210000000234 capsid Anatomy 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 210000000845 cartilage Anatomy 0.000 description 1
- 229960000590 celecoxib Drugs 0.000 description 1
- RZEKVGVHFLEQIL-UHFFFAOYSA-N celecoxib Chemical compound C1=CC(C)=CC=C1C1=CC(C(F)(F)F)=NN1C1=CC=C(S(N)(=O)=O)C=C1 RZEKVGVHFLEQIL-UHFFFAOYSA-N 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 201000007455 central nervous system cancer Diseases 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 238000002573 colposcopy Methods 0.000 description 1
- 239000000306 component Substances 0.000 description 1
- 210000004087 cornea Anatomy 0.000 description 1
- 229940111134 coxibs Drugs 0.000 description 1
- 239000003255 cyclooxygenase 2 inhibitor Substances 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 208000028919 diffuse intrinsic pontine glioma Diseases 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 229950004203 droloxifene Drugs 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003596 drug target Substances 0.000 description 1
- 230000008482 dysregulation Effects 0.000 description 1
- 229940121647 egfr inhibitor Drugs 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 201000008184 embryoma Diseases 0.000 description 1
- 201000003908 endometrial adenocarcinoma Diseases 0.000 description 1
- 208000029382 endometrium adenocarcinoma Diseases 0.000 description 1
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 1
- 210000003979 eosinophil Anatomy 0.000 description 1
- 229960001433 erlotinib Drugs 0.000 description 1
- AAKJLRGGTJKAMG-UHFFFAOYSA-N erlotinib Chemical compound C=12C=C(OCCOC)C(OCCOC)=CC2=NC=NC=1NC1=CC=CC(C#C)=C1 AAKJLRGGTJKAMG-UHFFFAOYSA-N 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 229940011871 estrogen Drugs 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- 239000000328 estrogen antagonist Substances 0.000 description 1
- 229960000255 exemestane Drugs 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 108010072257 fibroblast activation protein alpha Proteins 0.000 description 1
- 229960002074 flutamide Drugs 0.000 description 1
- MKXKFYHWDHIYRV-UHFFFAOYSA-N flutamide Chemical compound CC(C)C(=O)NC1=CC=C([N+]([O-])=O)C(C(F)(F)F)=C1 MKXKFYHWDHIYRV-UHFFFAOYSA-N 0.000 description 1
- 229960004421 formestane Drugs 0.000 description 1
- OSVMTWJCGUFAOD-KZQROQTASA-N formestane Chemical compound O=C1CC[C@]2(C)[C@H]3CC[C@](C)(C(CC4)=O)[C@@H]4[C@@H]3CCC2=C1O OSVMTWJCGUFAOD-KZQROQTASA-N 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 210000004475 gamma-delta t lymphocyte Anatomy 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 230000004547 gene signature Effects 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 210000002288 golgi apparatus Anatomy 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 201000010536 head and neck cancer Diseases 0.000 description 1
- 208000014829 head and neck neoplasm Diseases 0.000 description 1
- 210000005003 heart tissue Anatomy 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 229960003685 imatinib mesylate Drugs 0.000 description 1
- YLMAHDNUQAMNNX-UHFFFAOYSA-N imatinib methanesulfonate Chemical compound CS(O)(=O)=O.C1CN(C)CCN1CC1=CC=C(C(=O)NC=2C=C(NC=3N=C(C=CN=3)C=3C=NC=CC=3)C(C)=CC=2)C=C1 YLMAHDNUQAMNNX-UHFFFAOYSA-N 0.000 description 1
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Substances C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000010185 immunofluorescence analysis Methods 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 229940047124 interferons Drugs 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 208000022013 kidney Wilms tumor Diseases 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 229960003881 letrozole Drugs 0.000 description 1
- HPJKCIUCZWXJDR-UHFFFAOYSA-N letrozole Chemical compound C1=CC(C#N)=CC=C1C(N1N=CN=C1)C1=CC=C(C#N)C=C1 HPJKCIUCZWXJDR-UHFFFAOYSA-N 0.000 description 1
- GFIJNRVAKGFPGQ-LIJARHBVSA-N leuprolide Chemical compound CCNC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H]1NC(=O)CC1)CC1=CC=C(O)C=C1 GFIJNRVAKGFPGQ-LIJARHBVSA-N 0.000 description 1
- 229960004338 leuprorelin Drugs 0.000 description 1
- 208000012987 lip and oral cavity carcinoma Diseases 0.000 description 1
- 210000005228 liver tissue Anatomy 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 210000003712 lysosome Anatomy 0.000 description 1
- 230000001868 lysosomic effect Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 229960004296 megestrol acetate Drugs 0.000 description 1
- RQZAXGRLVPAYTJ-GQFGMJRRSA-N megestrol acetate Chemical compound C1=C(C)C2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@@](C(C)=O)(OC(=O)C)[C@@]1(C)CC2 RQZAXGRLVPAYTJ-GQFGMJRRSA-N 0.000 description 1
- 210000004779 membrane envelope Anatomy 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 208000022499 mismatch repair cancer syndrome Diseases 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 238000013188 needle biopsy Methods 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 229960003301 nivolumab Drugs 0.000 description 1
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 201000008968 osteosarcoma Diseases 0.000 description 1
- 229940127084 other anti-cancer agent Drugs 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 210000004923 pancreatic tissue Anatomy 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 229940121655 pd-1 inhibitor Drugs 0.000 description 1
- 229940121656 pd-l1 inhibitor Drugs 0.000 description 1
- 229940121654 pd-l2 inhibitor Drugs 0.000 description 1
- 208000029255 peripheral nervous system cancer Diseases 0.000 description 1
- 239000008191 permeabilizing agent Substances 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 238000002331 protein detection Methods 0.000 description 1
- 238000002661 proton therapy Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 201000003233 renal Wilms' tumor Diseases 0.000 description 1
- 208000015347 renal cell adenocarcinoma Diseases 0.000 description 1
- 210000005084 renal tissue Anatomy 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 210000003079 salivary gland Anatomy 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 208000019694 serous adenocarcinoma Diseases 0.000 description 1
- 208000004548 serous cystadenocarcinoma Diseases 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 208000000649 small cell carcinoma Diseases 0.000 description 1
- 210000000813 small intestine Anatomy 0.000 description 1
- 201000002314 small intestine cancer Diseases 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 210000000278 spinal cord Anatomy 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000002717 stereotactic radiation Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000003319 supportive effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 230000004797 therapeutic response Effects 0.000 description 1
- 208000008732 thymoma Diseases 0.000 description 1
- 201000009377 thymus cancer Diseases 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 210000005092 tracheal tissue Anatomy 0.000 description 1
- 238000011222 transcriptome analysis Methods 0.000 description 1
- 210000003956 transport vesicle Anatomy 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 230000004614 tumor growth Effects 0.000 description 1
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 1
- 229940121358 tyrosine kinase inhibitor Drugs 0.000 description 1
- 239000005483 tyrosine kinase inhibitor Substances 0.000 description 1
- 206010046766 uterine cancer Diseases 0.000 description 1
- 210000003934 vacuole Anatomy 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 229960001771 vorozole Drugs 0.000 description 1
- XLMPPFTZALNBFS-INIZCTEOSA-N vorozole Chemical compound C1([C@@H](C2=CC=C3N=NN(C3=C2)C)N2N=CN=C2)=CC=C(Cl)C=C1 XLMPPFTZALNBFS-INIZCTEOSA-N 0.000 description 1
- 201000005102 vulva cancer Diseases 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本文提供了用于使用机器学习模块分析从对象获得的生物样品的癌症基质区域中的免疫细胞浸润的方法。例如,所述方法可以包括(a)识别生物样品中的癌性区域或与癌性区域相关的分析物;(b)识别生物样品中的基质区域或与所述基质区域相关的分析物;(c)识别生物样品中的一个或多个位置的一个或多个免疫细胞或与免疫细胞相关的分析物;和(d)使用(i)识别的生物样品中的癌性和基质区域或其相关分析物,以及(ii)识别的一个或多个免疫细胞或其相关的分析物来分析从对象获得的生物样品的癌症基质区域中的免疫细胞浸润。
Description
相关申请的交叉引用
本申请要求2020年11月18日提交的美国临时申请序列号63/115,502、2021年1月28日提交的美国临时申请序列号63/142,772和2021年9月10日提交的美国临时申请号63/242,721的权益,其全部内容通过引用并入本文。
发明背景
对象组织内的细胞由于不同细胞内不同的分析物水平(例如基因和/或蛋白质表达)而在细胞形态和/或功能上存在差异。细胞在组织内的特定位置(例如,细胞相对于相邻细胞的位置或细胞相对于组织微环境的位置)可以影响例如细胞的形态、分化、命运、活力、增殖、行为以及与组织中其他细胞的信号传导和串扰。
先前已经使用仅在完整组织或组织的部分的背景下提供少数分析物的数据,或提供单细胞的大量分析物数据,但未能提供关于单细胞在本体/亲本(parent)生物样品(例如,组织样品)中的位置的信息的技术来研究空间异质性。
理解细胞和遗传异质性的区域可能有助于开发在其他方面看起来相似的患者的个体治疗方法。同时,识别免疫浸润也很重要,免疫浸润在肿瘤的某些区域不准确地表达。肿瘤可以是异质性的(细胞或遗传),肿瘤样品中的不同区域表现出不同的基因表达。
癌症组织中的肿瘤浸润性免疫细胞(例如,肿瘤浸润性淋巴细胞(“TIL”))已被证明是多种癌症免疫-检查点治疗反应的标志物,并与患者的复发状态相关(参见,例如,Fares等,American Society ofClinical OncologyEducational Book,39,147-164(2019))。病理学家已经使用标准化的视觉方法来量化TIL用于治疗预测。然而,即使进行了标准化工作,TIL估计法的成功视觉识别和生物样品中其他免疫细胞的检测仍然是一个挑战。此外,缺乏准确性限制了评估更复杂特性(如免疫细胞分布模式)的能力。因此,仍然需要开发识别和表征生物样品中肿瘤浸润免疫细胞的方法。
发明概述
在一个方面,本发明具有分析生物样品(例如,从对象获得的样品)的癌症基质区域中免疫细胞浸润的方法,包括:(a)识别生物样品中的癌性区域或与癌性区域相关的分析物;(b)识别所述生物样品中的基质区域或与所述基质区域相关的分析物;(c)在所述生物样品中的一个或多个位置中识别一种或多种免疫细胞或与免疫细胞相关的分析物;和(d)使用(i)生物样品中已识别的癌症和基质区域或与其相关的分析物,以及(ii)已识别的一个或多个免疫细胞或与其相关的分析物来分析生物样品(例如,从对象获得的样品)的癌症基质区域中的免疫细胞浸润。
在一些实施方式中,识别癌性区域、识别基质区域和/或识别免疫细胞包括:(a)从生物样品生成数据集,其中该数据集包括以下中的一个或多个:(i)从生物样品中的多个空间位置捕获的多个分析物的分析物数据;(ii)图像数据,所述图像数据包括所述生物样品的多个空间位置的图像;以及(iii)将分析物数据链接到图像数据的登记数据;以及(b)使用所述数据集来识别所述生物样品中的所述癌性区域、所述基质区域和/或所述免疫细胞。
在一些实施方式中,(b)包括将数据集提供给经过训练的机器学习模块,其中所述经过训练的机器学习模块至少部分地经以下训练数据训练:包括来自一个或多个参考样品的参考分析物数据集的训练数据,其中一个或多个参考样品包括(1)一个或多个参考癌性区域,(2)一个或多个参考基质区域,和(3)一种或多种参考免疫细胞。
在一些实施方式中,免疫细胞的丰度通过经过训练的机器学习模块来确定。
在一些实施方式中,癌性区域包括良性肿瘤、转移前肿瘤、恶性肿瘤和一个或多个炎性细胞中的一种或多种。
在一些实施方式中,基质区域包括结缔组织、血管和炎性细胞中的一种或多种。
在一些实施方式中,该方法还包括使生物样品透化。
在一些实施方式中,与癌性区域相关联的分析物、与基质区域相关的分析物和/或与免疫细胞相关联的分析物是核酸。在一些实施方式中,核酸是RNA。在一些实施方式中,RNA是mRNA。
在一些实施方式中,通过以下步骤来检测与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物,所述步骤包括:使生物样品与包括多个捕获探针的基质接触,其中所述多个捕获探针中的捕获探针包括空间条形码和捕获域;将与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物杂交到所述捕获探针;以及确定(i)对应于与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物、和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
在一些实施方式中,确定步骤包括测序。
在一些实施方式中,与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物是蛋白质。在一些实施方式中,通过以下步骤来检测与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物,所述步骤包括:用多种分析物捕获剂附着生物样品,其中所述多种分析物捕获试剂中的分析物捕获剂包括:(i)特异性结合与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物的分析物结合部分;(ii)分析物结合部分条形码;和(iii)分析物捕获序列,其中所述分析物捕获序列特异性结合捕获域;使所述生物样品与基材接触,其中所述基材包括多个捕获探针,所述多个捕获探针中的捕获探针包括(i)捕获域和(ii)空间条形码;将与所述癌性区域相关的分析物、与所述基质区域相关的所述分析物和/或与免疫细胞相关的分析物杂交到所述捕获探针;以及确定(i)对应于与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物、和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
在一些实施方式中,确定步骤包括:测序(i)对应于与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,以及(ii)对应于空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物、和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
在一些实施方式中,分析物结合部分是抗体或其抗原结合片段、细胞表面受体结合分子、受体配体、小分子、T细胞受体衔接体、B细胞受体衔接体、前体、适体、单体、亲和体(affimer)或DARPin。
在一些实施方式中,使用原位测序检测与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物。
在一些实施方式中,使用抗体来检测与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物。
在一些实施方式中,该方法还包括使生物样品与一种或多种染色剂接触。在一些实施方式中,一种或多种染色剂包括苏木精和伊红。在一些实施方式中,一种或多种染色剂包括一种或更多种光学标记。在一些实施方式中,所述一个或多个光学标记选自:荧光标记、放射性标记、化学发光标记、量热标记或比色标记。
在一些实施方式中,该方法还包括使用生物样品的一个或多个染色剂来识别生物样品中的一个或者多个癌性区域。在一些实施方式中,该染色剂对癌症标志物是特异性的。在某些情况下,癌症标志物是广谱细胞角蛋白(Pan-CK或Pan-CK)。
在一些实施方式中,该方法还包括使用生物样品的一种或多种染色识别一个或多个癌性区域内的一个或多种基质区域。在一些实施方式中,所述染色剂对基质标记物是特异性的。在某些情况下,癌症标志物是CD45。在一些实施方式中,使用包括获得生物样品的图像的方法来生成图像数据。在一些实施方式中,该方法还包括将图像数据登记到空间位置。在一些实施方式中,该方法还包括基于图像数据识别(1)一个或多个癌性区域和/或(2)一个或多个基质区域。在一些实施方式中,该方法还包括基于图像数据识别一个或多个免疫细胞。
在一些实施方式中,该方法还包括通过经过训练的机器学习模块识别一个或多个癌性区域。在一些实施方式中,该方法还包括通过经过训练的机器学习模块识别一个或多个基质区域。在一些实施方式中,该方法还包括通过经过训练的机器学习模块识别一个或多个免疫细胞。
在一些实施方式中,对生物样品的癌症基质区域中的免疫细胞浸润的分析包括确定生物样品中癌症基质区域中免疫细胞的丰度。
在一些实施方式中,识别一个或多个癌症区域包括:(i)获取图像并将图像数据登记到空间位置,(ii)使用所确定序列的空间位置,或(iii)获取图像并且将图像数据登记到空间位置并使用所确定序列的空间位置;识别所述一个或多个基质区域包括:(i)获得图像并将所述图像数据登记到空间位置,(ii)使用所确定的序列的空间位置,或(iii)获得图像且将所述图象数据登记到空间位置,并使用所确定序列的空间位置;以及识别生物样品中一个或多个位置中的一个或更多个免疫细胞或其相关分析物包括:(i)获得图像并将图像数据登记到空间位置,(ii)使用所确定序列的空间位置,或(iii)获得图像且将图像数据登记到空间位置,以及使用所确定的序列的空间位置。
在一些实施方式中,癌症基质区域中免疫细胞的丰度被确定为癌症基质区域中属于免疫细胞的细胞的百分比或被免疫细胞占据的癌症基质区域的百分比。
在一些实施方式中,使用一个或多个癌性区域、一个或多个基质区域和一个或多个免疫细胞的所确定序列的空间位置来确定癌症基质区域中免疫细胞的丰度。
在一些实施方式中,使用所确定的序列的空间位置包括使用原位测序来确定序列。在一些实施方式中,使用划分和(i)获取图像并将图像数据登记到空间位置,(ii)使用所确定序列的空间位置,或(iii)获取图像并且将图像数据登记到空间位置来确定癌症基质区域中的免疫细胞的丰度,并使用所确定的序列的空间位置。
在一些实施方式中,所述确定包括:(a)与经每空间位置细胞数量归一化的已知管家相比,鉴定与免疫浸润细胞相关的基因的量;(b)鉴定一种或多种肿瘤浸润淋巴细胞(TIL)与一种或多种肿瘤浸润性B细胞(TIB)的比率;和/或(c)基于包括与免疫浸润细胞相关的分析物的空间位置的百分比来计算生物样品中肿瘤浸润免疫细胞的丰度。
在一些实施方式中,一个或多个免疫细胞的识别包括从图像数据中划分(segment)免疫细胞。
在一些实施方式中,进一步包括基于免疫浸润确定癌症预后。
在一些实施方式中,进一步包括基于免疫浸润评分对对象的癌症严重程度进行评分或确定。
在一些实施方式中,所述确定包括鉴定一种或多种肿瘤浸润淋巴细胞(TIL)与一种或多种肿瘤浸润B细胞(TIB)或者一种或多种肿瘤浸润型T细胞与一种或多种肿瘤浸润B细胞(TIB)的比率。
在一些实施方式中,进一步包括给与治疗性处理(例如,至对象),其中治疗性处理包括手术、化疗剂、生长抑制剂、细胞毒性剂、放射治疗用剂、抗血管生成剂、癌症免疫治疗剂、凋亡剂、抗微管蛋白剂或其组合。
在一些实施方式中,生物样品从活组织检查物(例如,来自对象)获得。在一些实施方式中,生物样品是从外科切除物(例如,来自对象)获得的。在一些实施方式中,在内窥镜检查或结肠镜检查期间(例如,从对象)收集生物样品。在一些实施方式中,生物样品是组织切片。在一些实施方式中,生物样品是载玻片上的组织切片。在一些实施方式中,生物样品是福尔马林固定的石蜡包埋(FFPE)样品、冷冻样品或新鲜样品。在一些实施方式中,生物样品是FFPE样品。
在一些实施方式中,免疫细胞选自B细胞、T细胞、NK细胞、单核细胞、巨噬细胞、中性粒细胞、粒细胞、先天淋巴细胞或树突状细胞,或其组合。
在一些实施方式中,与癌性区域相关的分析物选自来自AKT途径的分析物、来自JAK-STAT途径的分析物和来自Notch途径的分析物,或其组合。
在一些实施方式中,与癌性区域相关的分析物选自SCGB2A1、MKI67、BRCA1、BRCA2、PIKCD、CALML6、MYC、TP53、PALB2、RAD51和MSH2,或其组合。在一些情况下,与癌性区域相关的分析物选自SCGB2A1、MKI67、BRCA1、BRCA2、PIK3CD和CALML6,或其组合。在一些情况下,与癌性区域相关的分析物选自PRKCI、VTCN1、MECOM、TOP2A、SHDH、XPO1、TFRC、FUT8、SOX17、PBX1、EIF42和WT1,或其组合。在一些情况下,与癌性区域相关的分析物选自VTCN1、MECOM、TOP2A、XPO1、FUT8、SOX17、PBX1、EIF42和WT1,或其组合。在某些情况下,与癌性区域相关的分析物是TOP2A。在一些情况下,与癌性区域相关的分析物是XPO1。本段中公开的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。
在一些实施方式中,与基质区域相关的分析物选自VIM、EPCAM、FAP和CDH1。在一些实施方式中,与基质区域相关的分析物选自FAP、VCAN、ACTA2和PDGFRB。在一些实施方式中,与免疫细胞相关的分析物选自BLK、CD19、FCRL2、MS4A1、KIAA0125、TNFRSF17、TCL1A、SPIB、PNOC、PTRPC、PRF1、GZMA、GZMB、NKG7、GZMH、KLRK1、KLRB 1、KLRD1、CTSW、GNLY、CCL13、CD209、HSD11B1、LAG3、CD244、EOMES、PTGER4、CD68、CD84、CD163、MS4A4A、TPSB2、TPSAB1、CPA3、MS4A2、HDC、FPR1、SIGLEC5、CSF3R、FCAR、FCGR3B、CEACAM3、S100A12、KIR2DL3、KIR3DL1、,KIR3DL2、IL21R、XCL1、XCL2、NCR1、CD6、CD3D、CD3E、SH2D1A、TRAT1、CD3G、TBX21、FOXP3、CD8A、CD8B、CD79A、CD79B、CD4、IGHA1、igg2、JCHAIN、IGKC、CD27、CD38、CD16、IL17RB、FANK1、CTLA4、MSR1、MRC1、NKG7、FCN1、TIGIT/LAG3。本段中描述的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。
在一些实施方式中,所述一种或多种免疫细胞选自:(i)CD3+和CD4+T细胞;(ii)CD3+和CD8+T细胞;(iii)调节性T细胞,包括CD4、Foxp3、IL17RB、CTLA4、FANK1、HAVCR1、CD25、CTLA-4、GITR、LAG-3和CD127中的一种或多种;(iv)TH1细胞,其包括CD4、CD3D、S100A4、IL7R和IFNG中的一种或多种;(v)TH2细胞,包括CD4、IL7R、ICOS、CTLA4、TNFRSF4和TNFRS18中的一种或多种;(vi)TH17细胞,其包括CD4、CD3D、IL17A、GZMA和S100A4中的一种或多种;(vii)细胞毒性T细胞,其包括CD8、CD3D、S100A4、IFNG、GZMB、GZMA和IL2RB中的一种或多种;(viii)浆细胞,其包括:一种或多种JCHAIN、MZB1、IGHA1、IGHG1和IGKC;(ix)单核细胞,其包括CD14+CD16-;(x)单核细胞,其包括CD14-CD16+;和(xi)自然杀伤细胞,其包括NKG7。
在一些实施方式中,免疫浸润细胞是肿瘤浸润B细胞(TIB)。在一些实施方式中,TIB选自:(i)浆细胞,其包括MZB1、IGLL5、IGHA1、IGHG1、JCHAIN、IGKC、IGHA2、IGLC2、IGLV3-1和IGLV2-14中的一种或多种;(ii)Ig+B细胞,其包括IGHV3-74、SOCS3、JCHAIN和SPARC中的一种或多种;(iii)活化的B细胞,其包括CD79B、HMGB2、HMGB1、HMGN1和RGS13;(iv)B细胞,其包括MEF2B、RGS13和MS4A1中的一种或多种;和(v)B细胞,其包括CD79A和CD79B。在一些实施方式中,免疫浸润细胞是包括MZB1、IGLL5、IGHA1、IGHG1、JCHAIN、IGKC、IGHA2、IGLC2、IGLV3-1和IGLV2-14中的一种或多种的浆细胞。
在另一个方面,本公开的特征在于确定生物样品中免疫细胞浸润的方法,所述生物样品包括对象中的一个或多个癌性区域和一个或多个基质区域,所述方法包括:(a)根据从对象获得的生物样品生成数据集,其中所述数据集包括:(i)从所述生物样品的多个空间位置捕获的多个分析物的分析物数据,其中所述多个分析物中的分析物是与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物;(b)将所述数据集提供给经过训练的机器学习模块,其中所述经过训练的机器学习模块包括来自一个或多个参考样品的参考分析物数据集,其中所所述一个或多个参考样品包括(i)来自一个或多个癌性区域的癌性区域,(2)来自一个或多个基质区域的基质区域,和(3)来自一个或多个免疫细胞的免疫细胞;以及(c)通过经过训练的机器学习模块确定从对象获得的生物样品中的免疫细胞浸润。
在另一方面,本公开的特征在于确定包括一个或多个癌性区域和一个或多个基质区域的生物样品中的免疫细胞浸润的方法,包括:(a)从获自对象的生物样品生成数据集,其中所述数据集包括:(i)从所述生物样品的多个空间位置捕获的多个分析物的分析物数据,其中所述多个分析物中的分析物是与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物;(ii)图像数据,所述图像数据包括所述生物样品的所述多个空间位置的图像;以及(iii)将分析物数据链接到图像数据的登记数据;(b)将所述数据集提供给经过训练的机器学习模块,其中所述经过训练的机器学习模块包括来自一个或多个参考样品的参考分析物数据集,其中所述一个或多个参考样品包括(i)来自一个或多个癌性区域的癌性区域,(2)来自一个或多个基质区域的基质区域,和(3)来自一个或多个免疫细胞的免疫细胞;以及(c)通过经过训练的机器学习模块确定生物样品中的免疫细胞浸润。
在一些实施方式中,经过训练的机器学习模块是监督学习模块、半监督学习模块,无监督学习模块,回归分析模块,强化学习模块,自学习模块,特征学习模块,稀疏字典学习模块,异常检测模块,生成对抗性网络,卷积神经网络或关联规则模块中的至少一个。
在一些实施方式中,生成数据集包括:将生物样品(例如来自患有癌症的对象)与包括多个捕获探针的基质接触,其中生物样品包括(1)一个或多个癌性区域,(2)一个或多个基质区域,以及(3)一个或多个肿瘤浸润免疫细胞,并且其中所述多个捕获探针中的捕获探针包括空间条形码和捕获域;将来自所述生物样品的分析物附着到所述捕获探针;确定(i)对应于分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全体或部分,或其互补物,并使用(i)和(ii)的所确定的序列来识别生物样品中分析物的空间位置和丰度;以及基于与空间位置处的分析物相对应的所确定序列,将空间位置识别为簇的部分,并使用簇分析癌症患者的癌症基质中的免疫细胞浸润。
在一些实施方式中,使用选自非线性降维、t分布随机邻居嵌入(t-SNE)、全局t分布随机近邻嵌入(g-SNE)和均匀流形近似与投影(UMAP)的方法之一来识别一个或多个免疫细胞簇。
在一些实施方式中,生成数据集包括:用多种分析物捕获剂附着生物样品,其中所述多种分析物捕获剂中的分析物捕获剂包括:(i)特异性结合与癌性区域相关的分析物的分析物结合部分,和/或与免疫细胞相关的分析物;(ii)分析物结合部分条形码;和(iii)分析物捕获序列,其中所述分析物捕获序列特异性结合捕获域;使所述生物样品与基质接触,其中所述基质包括多个捕获探针,所述多个捕获探针中的捕获探针包括(i)所述捕获域和(ii)空间条形码;将与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物杂交到所述捕获探针;以及确定(i)对应于与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
在一些实施方式中,使用原位测序来生成分析物数据。
在另一个方面,本公开的特征在于试剂盒,其包括:(a)组织学染色剂;(b)基材,包括多个捕获探针,其中所述多个捕获探针中的捕获探针包括捕获域;以及(c)用于执行本文所述的任何方法的说明书。
在另一个方面,本公开的特征在于试剂盒,其包括:(a)特异性结合浸润免疫细胞上的抗原的抗体;(b)基材,包括多个捕获探针,其中所述多个捕获探针中的捕获探针包括捕获域;以及(f)用于执行本文所述的任何方法的说明书。
在另一个方面,本公开的特征在于试剂盒,其包括:(a)特异性结合浸润免疫细胞上的抗原的抗体;(b)特异性结合基质细胞上的抗原的第二抗体;(c)基材,包括多个捕获探针,其中所述多个捕获探针中的捕获探针包括捕获域;以及(d)用于执行本文所述的任何方法的说明书。
在另一个方面,本公开的特征在于计算机操作的方法,其中所述方法包括:(a)生成多个生物样品的数据集,其中对于所述多个生物样品中的每个生物样品,所述数据集包括:(i)在参考生物样品的多个空间位置捕获的多个分析物的分析物数据;(ii)参考生物样品的图像数据;以及(iii)根据参考生物样品的空间位置链接到分析物数据的成像数据的登记数据;其中所述参考生物样品包括(1)所述参考生物样品中的一个或多个癌性区域,(2)所述一个或多个癌性区域内的一个或多个基质区域,以及(3)多个肿瘤浸润淋巴细胞(TIL);(b)用所述数据集训练机器学习模块,从而生成经过训练的机器学习模块;以及(c)通过所述经过训练的机器学习模块确定生物样品中的免疫细胞浸润。
在另一个方面,本公开的特征在于系统,其中所述系统包括:(a)存储元件,所述存储元件可操作以存储多个生物样品的数据集,其中对于每个生物样品,所述数据集包括:在参考生物样品的多个空间位置捕获的多个分析物的分析物数据;生物样品的图像数据;以及根据参考生物样品的空间位置链接到分析物数据的成像数据的登记数据;其中所述生物样品包括(1)所述参考生物样品中的一个或多个癌性区域,(2)所述一个或多个癌性区域内的一个或者多个基质区域,以及(3)多个肿瘤浸润淋巴细胞(TIL);以及(b)处理器,其可操作用于通过机器学习模块处理数据集以训练机器学习模块,从而确定生物样品中的免疫细胞浸润。
本说明书中提及的所有可在互联网上获得的出版物、专利、专利申请和信息均通过引用并入本文,其程度与每个单独的出版物、专利、专利申请或信息项被明确且单独地指示通过引用并入的程度相同。如果通过引用并入的出版物、专利、专利申请和信息项目与说明书中包含的公开内容相矛盾,则说明书旨在取代和/或优先于任何此类矛盾的材料。
在根据范围来描述值的情况下,应当理解,该描述包括公开在这样的范围内的所有可能的子范围,以及落入这样的范围之内的特定数值,而不管是否明确地说明了特定数值或特定子范围。
“每/各种/个”一词在提及物品集合时,旨在识别集合中的单个物品,但不一定指集合中的每个物品,除非另有明确说明,或除非用法上下文另有明确说明。
单数形式“一个”、“一种”和“该”包括复数形式,除非上下文另有明确规定。例如,术语“一个细胞”包括一个或多个细胞,包括它们的混合物。此处使用的“A和/或B”包括以下所有备选方案:“A”、“B”、“A或B”以及“A和B”。
本文描述了本公开的特征的各种实施方式。然而,应当理解,仅通过示例的方式提供这样的实施例,并且在不脱离本公开的范围的情况下,本领域技术人员可以发生许多变化、改变和替换。还应当理解,本文所描述的特定实施方式的各种替代方案也在本公开的范围内。
附图说明
以下附图示出了本公开的特征和优点的某些实施方式。这些实施方式不旨在以任何方式限制所附权利要求的范围。附图中相同的参考符号指示相同的元件。
图1是示出条码化捕获探针的示例的示意图。
图2是示例性分析物捕获剂的示意图。
图3是描绘特征固定的捕获探针324和分析物捕获剂326之间的示例性相互作用的示意图。
图4A-4C是说明如何在基于阵列的系统中利用链霉亲和素细胞标签来产生空间条码化的细胞或细胞内容物的示意图。
图5是用于生物样品中的机器学习模式的示例性系统的框图。
图6是示出将图像数据登记至从捕获区域获得的分析物数据的框图。
图7是图5的系统的示例性过程的流程图。
图8显示卵巢腺癌的组织切片的免疫荧光染色,其显示(i)合并图像、(ii)广谱细胞角蛋白(Pan-CK)和(iii)CD45(上图)以及组织切片中(i)所有基因、(ii)MKi67和(iii)PTPRC的基因表达热图(下图)。
图9显示了Pan-CK抗体的免疫荧光染色(左图)和癌症标志物子集的基因表达热图(右图)。
图10A-10D显示了靶向组的基因表达热图和相关图。图10B-10D进一步提供了靶向组的相关图。
图11A显示了B细胞标志物CD19、CD79A和CD79B在八个不同簇中的每一个中的基因表达的小提琴图。
图11B显示了图11A中的B细胞标志物的基因表达热图(左图)和CD45和Pan-CK的基因表达热图(右图)和免疫荧光染色的重叠。
图11C显示了T细胞标志物CD3D、CD3E、CD4和CD8A在八个不同簇中的每个簇中的基因表达的小提琴图。
图11D显示了图11C中的T细胞标志物的基因表达热图。
图12A显示了T细胞标志物CD4、CD3E和CD3D的基因表达热图以及CD45和Pan-CK的免疫荧光染色的重叠。
图12B显示了T细胞标志物CD4和CD14的基因表达热图以及CD45和Pan-CK的免疫荧光染色的重叠。
图13显示了单核细胞标志物CD14的基因表达热图的重叠。
图14显示了CD4的基因表达热图(左上图)、样品中检测到的所有基因的基因表达热图(右上图)以及CD4的八个不同簇中的每个簇中的基因表达的小提琴图(Log2表达)(下图)。
图15显示了CD8A的基因表达热图(左上图)、样品中检测到的所有基因的基因表达热图(右上图)以及CD8的八个不同簇中的每个簇中的基因表达的小提琴图(下图)。
图16A显示血浆B细胞标志物CD79A、CD79B、CD38、CD27、MZB1、IGHA1、IGHG1、JCHAIN和IGKC的基因表达热图。
图16B显示了JCHAIN的基因表达热图。
图16C显示了CD45的免疫荧光染色。
图17A显示了单核细胞标志物CD14的基因表达热图。
图17B显示了单核细胞标志物CD16(FCGR3A)的基因表达热图。
图17C显示CD45、DAPI和Pan-CK的基因表达热图和免疫荧光染色的重叠。
图18显示了T调节(Treg)细胞标志物FOXP3、IL17RB、CTLA4、FANK1和CD4的基因表达热图(左图)和肿瘤相关巨噬细胞标志物CD163、MSR1和MRC1的基因表达热图(右图)。
图19显示了卵巢肿瘤样品中自然杀伤(NK)标志物NKG7的基因表达热图(左图),卵巢肿瘤样品中NKG 7的基因表达热图和CD45和Pan-CK的免疫荧光染色的重叠(中图),以及乳腺肿瘤IDC样品中自然杀伤(NK)标志物NKG7的基因表达热点图(右图)。
图20显示了CD4的基因表达热图和CD45的免疫荧光染色的重叠(左图),CD8A的基因表达热图和CD4的免疫荧光着色的重叠(中图),以及TIGIT/LAG3的基因表达热和CD45的荧光染色的重叠(右图)。
图21显示CD3E和CD4的基因表达热图(左图)以及CD4和CD14的基因表达热图(右图)。
图22A显示成纤维细胞活化蛋白α(FAP)在八个不同簇中的每一个中的基因表达的小提琴图。
图22B显示了FAP的基因表达热图。
图22C显示钙粘蛋白1(CDH1)在八个不同簇中的每一个中的基因表达的小提琴图。
图22D显示了CDH1的基因表达热图和CD45的免疫荧光染色的重叠。
图23A显示了波形蛋白(VIM)的八个不同簇中的每一个簇中的基因表达的小提琴图。
图23B显示了VIM的基因表达热图和CD45的免疫荧光染色的重叠。
图23C显示了上皮细胞粘附分子(EPCAM)在八个不同簇中的每一个中的基因表达的小提琴图。
图23D显示EPCAM的基因表达热图和CD45的免疫荧光染色的重叠。
图24A显示了卵巢癌症基因BRCA1、BRCA2、MYC、TP53、PALB2、RAD51和MSH2的八个不同簇中每个簇的基因表达小提琴图。
图24B显示了图24A中卵巢癌症基因的基因表达热图和CD45的免疫荧光染色的重叠。
图24C显示了mutS同源物2(MSH2)的八个不同簇中的每一个簇中的基因表达的小提琴图。
图24D显示了MSH2的基因表达热图和CD45的免疫荧光染色的重叠(左图)以及MSH2的遗传表达热图与Pan-CK的免疫荧光染色的重叠(右图)。
图25A显示BRCA1的八个不同簇中的每一个簇中的基因表达的小提琴图。
图25B显示BRCA1的基因表达热图和CD45的免疫荧光染色的重叠。
图25C显示BRCA2的八个不同簇中的每一个簇中的基因表达的小提琴图。
图25D显示BRCA2的基因表达热图和CD45的免疫荧光染色的重叠。
图26显示了PI3K-AKT信号传导成分、Jak-STAT信号传导成分和Notch信号传导成分的基因表达热图以及Pan-CK的免疫荧光染色。
图27显示了细胞核成分、磷蛋白、多态性成分和细胞过程的基因表达热图以及Pan-CK的免疫荧光染色。
图28A和28B显示了使用k均值无监督簇(图28A)和Pan-CK和CD45的免疫荧光染色(图28B)的具有斑点的重叠组织图。
图28C显示了肿瘤(与Pan-CK共定位)和基质簇(与CD45共定位)中大多数失调基因的热图。
图28D显示了提供Pan-CK和CD45与9个簇的共定位检测的组织图。
图28E显示了9个簇中最失调的基因的热图。
图29A显示了癌症标志物基因子集(SCGB2A1、MKI67、BRCA1、BRCA2、PIK3CD和CALML6)与肿瘤(Pan-CK表达)隔室的组织基因表达。
图29B显示了癌症标志物基因子集(SCGB2A1、MKI67、BRCA1、BRCA2、PIK3CD和CALML6)与肿瘤或基质隔室的表达的小提琴图。
图30A显示基质标志物基因(FAP、VCAN、ACTA2和PDGFRB)的子集与基质(表达CD45)隔室的组织基因表达。
图30B显示基质标志物基因(FAP、VCAN、ACTA2和PDGFRB)的子集与肿瘤或基质隔室的表达的小提琴图。
图31A显示了Pan-CK和CD45在组织样品中的表达。
图31B-31K显示了Pan-CK和CD45的组织共定位表达与T细胞CD3D、CD3E、CD4、CD8A和CD247(图31B)、CD4 T细胞(图31C)、CD8A T细胞(表31D)、Treg细胞(表31E)、B细胞(图31F)、血浆B细胞(图31G)、NK细胞(图31H)、CD14单核细胞(图31T)、CD16单核细胞(图31J)和TAM(图31K)的表达。
图32A显示了卵巢组织样品中Pan-CK、CD45和DAPI的免疫荧光染色。
图32B显示了图32A组织样品中癌症簇和基质隔室的组织基因表达。簇1主要与Pan-CK肿瘤切片重叠,而簇4主要与CD45基质组织切片重叠。在簇1中,PRKCI、VTCN1、MECOM、TOP2A、SHDH、XPO1、TFRC、FUT8、SOX17、PBX1、EIF42和WT1上调。
图32C显示了TOP2A在图32A的组织样品中的基因表达。
图32D显示了XPO1在图32A的组织样品中的基因表达。
具体实施方式
I.引言
本文所述的空间分析方法和组合物可以以高空间分辨率提供生物样品内各种分析物的大量分析物和/或表达数据,同时保留固有的空间背景。空间分析方法和组合物可以包括,例如,使用捕获探针,所述捕获探针包括空间条形码(例如,提供关于细胞或组织样品(例如,哺乳动物细胞或哺乳动物组织样品)内分析物的位置或定位的信息的核酸序列)和能够与由细胞产生和/或存在于细胞中的分析物(例如,蛋白质和/或核酸)结合的捕获域。空间分析方法和组合物还可以包括使用具有捕获域的捕获探针,该捕获域捕获用于间接检测分析物的中间试剂。例如,中间试剂可以包括与分析物相关的核酸序列(例如条形码)。因此,中间试剂的检测指示细胞或组织样品中的分析物。
空间分析方法和组合物的非限制性方面描述于美国专利号10774374、10724078、10480022、10059990、10041949、10002316、9879313、9783841、9727810、9593365、8951726、8604182、7709198、美国专利申请公开号2020/239946、2020/080136、2020/0277663、2020/024641、2019/330617、2019/2264268、2020/2256867、2020/2224244、2019/194709、2019/161796、2019/085383、2019/055594、2018/216611、2018/051322、2018/0245142、2017/241911、2017/089811、2017/067096、2017/029875、2017/0016053、2016/108458、2015/0008854、2013/171621、WO2018/091676、WO 2020/176788、Rodriques等,Science 363(6434):1463-1467,2019;Lee等,Nat.Protoc.10(3):442-458,2015;Trejo等,PLoS ONE14(2):e0212031,2019;Chen等,Science 348(6233):aaa6090,2015;Gao等,BMCBiol.15:50,2017;和Gupta等,Nature Biotechnol.36:1197-1202,2018;《《Visium空间基因表达试剂盒用户指南》(the Visium Spatial Gene Expression ReagentKits User Guide)(如,日期为2021年7月的C版本),这两个都可以在10xGenomics Support Documentation网站上获得,并且可以在本文中以任何组合使用。本文描述了空间分析方法和组合物的其他非限制性方面。
本公开中可以使用的一些通用术语可以在美国专利申请公开号2020/0277663和/或WO 2020/176788的第(I)(b)节中找到。通常,“条形码”是一种标记或标识符,用于传递或能够传递信息(例如,关于捕获探针、珠和/或样品中分析物的信息)。条形码可以是分析物的部分,也可以独立于分析物。条形码可以附着在分析物上。特定的条形码相对于其他条形码可以是唯一的。为了本公开的目的,“分析物”可以包括任何待分析的生物物质、结构、部分或组分。术语“靶标”可以类似地指感兴趣的分析物。
分析物可以大致分为两组:核酸分析物和非核酸分析物。非核酸分析物的实例包括但不限于脂质、碳水化合物、肽、蛋白质、糖蛋白(N-连接或O-连接)、脂蛋白、磷蛋白、蛋白质的特异性磷酸化或乙酰化变体、蛋白质的酰胺化变体、蛋白质的羟基化变体、蛋白质的甲基化变体、蛋白质的泛素化变体、蛋白质的硫酸化变体、病毒蛋白质(例如,病毒衣壳、病毒包膜、病毒外壳、病毒附件、病毒糖蛋白、病毒刺突等)、胞外和胞内蛋白质、抗体和抗原结合片段。在一些实施方式中,分析物可以定位于亚细胞位置,包括例如细胞器,例如线粒体、高尔基体、内质网、叶绿体、内吞小泡、外泌小泡、液泡、溶酶体等。在一些实施方式中,分析物可以是肽或蛋白质,包括但不限于抗体和酶。分析物的其他实例可在美国专利申请公开号2020/0277663和/或WO2020/176788的第(I)(c)节中找到。在一些实施方式中,可以间接检测分析物,例如通过检测中间试剂,例如连接探针(例如连接产物)或分析物捕获剂(例如寡核苷酸偶联抗体),例如本文所述的那些。
“生物样品”通常从对象身上获得,用于使用多种技术中的任何一种进行分析,包括但不限于活检、手术和激光捕获显微镜(LCM),并且通常包括来自对象的细胞和/或其他生物材料。在一些实施方式中,生物样品可以是组织切片。在一些实施方式中,生物样品可以是固定和/或染色的生物样品(例如,固定和/或染色的组织切片)。染色的非限制性实例包括组织学染色(例如苏木精和/或伊红)和免疫染色(例如荧光染色)。在一些实施方式中,可以对生物样品(例如,固定的和/或染色的生物样品)进行成像。生物样品也描述在美国专利申请公开号2020/0277663和/或WO 2020/176788的第(I)(d)节中。
在一些实施方式中,用一种或多种透化试剂使生物样品透化。例如,生物样品的透化可以促进分析物的捕获。示例性透化剂和条件描述于美国专利申请公开号2020/0277663和/或WO 2020/176788的第(I)(d)(ii)(13)节或示例性实施方式部分中。
基于阵列的空间分析方法涉及将一种或多种分析物从生物样品转移到基材上的特征阵列,其中每个特征与阵列上的唯一空间位置相关联。转移的分析物的后续分析包括确定分析物的特性(identity)和分析物在生物样品内的空间位置。分析物在生物样品内的空间位置是基于分析物在阵列上(例如,直接或间接)结合到的特征以及该特征在阵列内的相对空间位置来确定的。
“捕获探针”是指能够(直接或间接)捕获和/或标记生物样品中的分析物(例如,感兴趣的分析物)的任何分子。在一些实施方式中,捕获探针是核酸或多肽。在一些实施方式中,捕获探针包括条形码(例如,空间条形码和/或独特分子标识符(UMI))和捕获域)。在一些实施方式中,捕获探针可以包括切割结构域和/或功能结构域(例如引物结合位点,例如用于下一代测序(NGS))。
图1是示出如本文所述的示例性捕获探针的示意图。如图所示,捕获探针102任选地通过切割结构域103(例如二硫键)连接到特征101。捕获探针可以包括对后续处理有用的功能序列104。功能序列104可以包括测序仪特异性流动池附着序列的全部或部分(例如,P5或P7序列)、测序引物序列(例如,R1引物结合位点、R2引物结合位点)的全部或部分、或其组合。捕获探针还可以包括空间条形码105。捕获探针还可以包括独特分子标识符(UMI)序列106。虽然图1显示空间条形码105位于UMI序列106的上游(5’),但应理解,其中UMI序列106位于空间条形码105上游(5’)的捕获探针也适用于本文所述的任何方法。捕获探针还可以包括捕获域107,以便于捕获目标分析物。在一些实施方式中,捕获探针包括附加功能序列,该附加功能序列可以位于例如空间条形码105和UMI序列106之间、UMI序列104和捕获域107之间或捕获域107之后。捕获域可以具有与核酸分析物的序列互补的序列。捕获域可以具有与本文所述的连接探针互补的序列。捕获域可以具有与分析物捕获剂中存在的捕获柄序列互补的序列。捕获域可以具有与夹板寡核苷酸互补的序列。这种夹板寡核苷酸除了具有与捕获探针的捕获域互补的序列外,还可以具有核酸分析物的序列、与本文所述的连接探针的部分互补的序列和/或本文所述捕获柄序列。
功能序列通常可以选择为与多种不同测序系统中的任何一种兼容,例如离子洪流质子或PGM、Illumina测序仪器、PacBio、Oxford Nanopore等及其要求。在一些实施方式中,可以选择与非商业化测序系统兼容的功能序列。可以使用合适的功能序列的这种测序系统和技术的实例包括(但不限于)离子洪流质子或PGM测序、Illumina测序、PacBio SMRT测序和Oxford Nanopore测序。此外,在一些实施方式中,可以选择功能序列以与其他测序系统兼容,包括非商业化的测序系统。
在一些实施方式中,空间条形码105和功能序列104对于附着到给定特征的所有探针是共同的。在一些实施方式中,附着到给定特征的捕获探针的UMI序列106不同于附着到该给定特征的不同捕获探针的UMI序列。
在一些情况下,捕获探针是可切割捕获探针,其中切割的捕获探针可以进入非透化的细胞并与样品内的分析物结合。捕获探针包含切割结构域、细胞穿透肽、报告分子和二硫键(-S-S-)。
在一些情况下,本公开提供了多重化的空间条码化特征。例如,特征可以耦合到空间条码化捕获探针,其中特定特征的空间条码化探针可以具有相同的空间条形码,但具有不同的捕获域,其被设计为将特征的空间条码与超过一个的目标分析物相关联。例如,一个特征可以耦合到四种不同类型的空间条码化捕获探针,每种类型的空间条码化捕获探针都具有空间条形码。与该特征相关联的一种类型的捕获探针包括与聚(T)捕获域组合的空间条形码,其被设计为捕获mRNA目标分析物。与该特征相关联的第二种类型的捕获探针包括与用于gDNA分析的随机N-聚体捕获域组合的空间条形码。与所述特征相关联的第三种类型的捕获探针包括与与感兴趣的分析物捕获剂的捕获柄序列互补的捕获域组合的空间条形码。与该特征相关的第四种类型的捕获探针包括与捕获域组合的空间条形码,该捕获域可以特异性结合可以在CRISPR确定中起作用的核酸分子(例如CRISPR/Cas9)。本公开还可用于本文公开的其他分析物的同时分析,包括但不限于:(a)mRNA、谱系追踪构建体、细胞表面或胞内蛋白质和代谢物以及gDNA;(b)mRNA、可及染色质(例如ATAC-seq、DNase-seq和/或MNase-seq)细胞表面或胞内蛋白质和代谢产物,以及扰动剂(例如本文所述的CRISPRcrRNA/sgRNA、TALEN、锌指核酸酶和/或反义寡核苷酸);(c)mRNA、细胞表面或胞内蛋白质和/或代谢物、条码化标记剂(例如本文所述的MHC多聚体)和免疫细胞受体(例如T细胞受体)的V(D)J序列。在一些实施方式中,扰动剂可以是小分子、抗体、药物、适体、miRNA、物理环境(例如,温度变化)或任何其他已知的扰动剂。参见例如美国专利申请公开号2020/0277663和/或WO 2020/176788的第(II)(b)节(例如,子节(i)-(vi))。捕获探针的产生可以通过任何适当的方法实现,包括美国专利申请公开号2020/0277663和/或WO 2020/176788的第(II)(d)(II)节中描述的那些方法。
在一些实施方式中,可以使用任何适当的多重化技术(例如美国专利申请公开号2020/0277663和/或WO 2020/176788的第(IV)节中描述的那些)来检测来自生物样品的超过一种分析物类型(例如,核酸和蛋白质)(例如,同时地或顺序地)。
在一些实施方式中,可以使用一种或多种分析物捕获剂来进行一种或多种分析物(例如蛋白质分析物)的检测。如本文所用,“分析物捕获剂”是指与分析物(例如,生物样品中的分析物)和捕获探针(例如,附着到基材或特征的捕获探针)相互作用以识别分析物的试剂。在一些实施方式中,分析物捕获剂包括:(i)分析物结合部分(例如,结合分析物),例如,抗体或其抗原结合片段;(ii)分析物结合部分条形码;和(iii)捕获柄序列。如本文所用,术语“分析物结合部分条形码”是指与分析物结合部相关联或以其他方式识别分析物结合部分的条形码。如本文所用,术语“分析物捕获序列”或“捕获柄序列”是指被配置为与捕获探针的捕获域杂交、结合、偶联或以其他方式相互作用的区域或部分。在一些实施方式中,捕获柄序列与捕获探针的捕获域互补。在一些情况下,分析物结合部分条形码(或其部分)可能能够从分析物捕获剂移除(例如,切割)。
图2是示例性分析物捕获剂202的示意图,其包括分析物结合部分204和分析物结合部条形码结构域208。示例性分析物结合部分204是能够结合分析物206的分子,并且分析物捕获剂能够与空间条码化捕获探针相互作用。分析物结合部分可以以高亲和力和/或高特异性与分析物206结合。分析物捕获剂可以包括分析物结合部分条形码结构域208、核苷酸序列(例如寡核苷酸),其可以与捕获探针的捕获域的至少部分或全部杂交。分析物结合部分条形码结构域408可以包括本文所述的分析物结合部分条形码和捕获柄序列。分析物结合部分204可以包括多肽和/或适体。分析物结合部分204可以包括抗体或抗体片段(例如抗原结合片段)。
图3是描绘特征固定的捕获探针324和分析物捕获剂326之间的示例性相互作用的示意图。特征固定的捕获探针324可以包括空间条形码308以及功能序列306和UMI 310,如本文其他地方所述。捕获探针还可以包括能够结合到分析物捕获剂326的捕获域312。分析物捕获剂326可以包括功能序列318、分析物结合部分条形码516和能够结合到捕获探针324的捕获域312的捕获柄序列314。分析物捕获剂还可以包括接头320,该接头320允许捕获剂条形码结构域316耦合到分析物结合部分322。
图4A、4B和4C是说明如何在基于阵列的系统中利用链霉亲和素细胞标签来产生空间条码化的细胞或细胞内容物的示意图。例如,如图4A所示,肽结合的主要组织相容性复合物(MHC)可以与生物素(β2m)单独结合,并与链霉亲和素部分结合,使得链亲和蛋白部分包括多个pMHC部分。这些部分中的每一个都可以与TCR结合,使得链霉亲和素通过多重MCH/TCR结合相互作用与靶T细胞结合。多重相互作用协同作用,可以显著提高结合亲和力。这种改进的亲和力可以改进T细胞的标记,并且还降低标记物从T细胞表面解离的可能性。如图4B所示,捕获剂条形码结构域401可以用链霉亲和素402修饰并与生物素化MHC 403的多个分子接触,使得生物素化的MHC 403分子与链霉亲和素偶联的捕获剂条形码结构域401偶联。结果是条码化的MHC多聚体复合体405。如图4B所示,捕获剂条形码结构域序列401可以将MHC识别为其相关标记,并且还包括可选的功能序列,例如用于与其他寡核苷酸杂交的序列。如图4C所示,一个实例寡核苷酸是捕获探针406,其包含互补序列(例如,对应于C C C的rGrGrG)、条形码序列和其他功能序列,例如UMI、衔接子序列(例如包含测序引物序列(例如R1或部分R1(“pR1”),R2),流动池附着序列(例如P5或P7或其部分序列)等。在一些情况下,捕获探针406可以首先与特征(例如凝胶珠)相关联并从该特征释放。在其他实施方式中,捕获探针406可以与MHC寡核苷酸复合物405的捕获剂条形码结构域401杂交。杂交的寡核苷酸(间隔子CCC和间隔子rGrGrG)然后可以在引物延伸反应中延伸,从而产生包含与两个空间条形码序列(与捕获探针相关的空间条形码和与MHC寡核苷酸复合物相关的条形码)中的每一个相对应的序列的构建体。在一些情况下,这些对应序列中的一个或两个可以是捕获探针406或捕获剂条形码结构域401中的原始序列的互补物。在其他实施方式中,捕获探针和捕获剂条形码结构域连接在一起。所得构建体可以任选地进一步处理(例如,添加任何附加序列和/或用于清除)并进行测序。如本文其它地方所描述的,来源于捕获探针406的空间条形码序列的序列可以用于识别特征并且来源于捕获剂条形码结构域401上的空间条形码序列的序列可以用来识别结合在细胞表面上的特定肽MHC复合物404(例如当使用MHC肽库筛选免疫细胞或免疫细胞群时)。
分析物捕获剂的其他描述可以在WO2020/176788的第(II)(b)(ix)节和/或美国专利申请公开号2020/0277663的第(II)(b)(viii)节中找到。
存在至少两种将空间条形码与一个或多个相邻细胞相关联的方法,使得空间条形码将一个或多个细胞和/或一个或多个细胞的内容物识别为与特定空间位置相关联。一种方法是促使分析物或分析物替代物(例如,中间试剂)离开细胞并朝向空间条码化阵列(例如,包括空间条码化捕获探针)。另一种方法是从阵列切割空间条码化捕获探针,并促使空间条码化捕获探针朝向生物样品和/或至生物样品中或其上。
在一些情况下,捕获探针可以被配置为从模板(例如DNA或RNA模板,例如分析物或中间试剂(例如连接探针(例如连接产物或分析物捕获试剂,或其部分),或其衍生物(参见例如美国专利申请公开号2020/0277663和/或WO2020/176788的第(II)(b)(vii)节,关于延伸的捕获探针)引发、复制并随后产生任选地条码化的延伸产物。在一些情况下,捕获探针可以被配置为与模板(例如DNA或RNA模板,例如分析物或中间试剂,或其部分)形成连接的探针(例如连接产物),从而产生用作模板的替代物的连接产物。
如本文所用,“延伸的捕获探针”是指在捕获探针的末端(例如,3′或5′端)添加了额外核苷酸的捕获探针,从而延长了捕获探针的总长度。例如,“延伸的3′端”表示附加核苷酸被添加到捕获探针的最3′核苷酸以延伸捕获探针的长度,例如,通过用于延伸核酸分子的聚合反应,包括由聚合酶(例如,DNA聚合酶或逆转录酶)催化的模板化聚合。在一些实施方式中,延伸捕获探针包括向捕获探针的3’端添加核酸序列,该核酸序列与特异性结合到捕获探针的捕获域的分析物或中间试剂的核酸序列互补。在一些实施方式中,使用逆转录来延伸捕获探针。在一些实施方式中,使用一种或多种DNA聚合酶延伸捕获探针。延伸的捕获探针包括捕获探针的序列和捕获探针的空间条形码的序列。
在一些实施方式中,扩增延伸的捕获探针(例如,在本体溶液中或在阵列上)以产生足以进行下游分析的量,例如,通过DNA测序。在一些实施方式中,延伸的捕获探针(例如DNA分子)充当扩增反应(例如聚合酶链式反应)的模板。
在美国专利申请公开号2020/0277663和/或WO 2020/176788的第(II)(a)节中描述了空间分析方法的附加变体,包括在一些实施方式中的成像步骤。捕获的分析物(和/或中间试剂或其部分)的分析,例如,包括样品去除、捕获探针的延伸、测序(例如,切割的延伸的捕获探针和/或与延伸的捕获探针互补的cDNA分子)、阵列测序(例如使用例如原位杂交或原位连接方法)、时间分析、和/或近距离捕获,描述于美国专利申请公开号2020/0277663和/或WO2020/176788的第(II)(g)节。一些质量控制措施描述在美国专利申请公开号2020/0277663和/或WO 2020/176788的第(II)(h)节中。
空间信息可以提供具有生物学和/或医学重要性的信息。例如,本文所述的方法和组合物可以允许:鉴定疾病或病症的一种或多种生物标志物(例如,诊断、预后和/或用于确定治疗的疗效);鉴定用于治疗疾病或病症的候选药物靶标;将对象识别(例如诊断)为患有疾病或病症;鉴定对象的疾病或病症的阶段和/或预后;确定对象患疾病或病症的可能性增加;监测对象的疾病或病症的进展;对于对象的疾病或病症的治疗效果的确定;识别治疗对疾病或病症有效的患者亚群;改变对患有疾病或病症的对象的治疗;选择参与临床试验的对象;和/或选择对患有疾病或病症的对象的治疗。
空间信息可以提供具有生物学重要性的信息。例如,本文所述的方法和组合物可以允许:鉴定转录组和/或蛋白质组表达谱(例如,在健康和/或患病组织中);近距离识别多种分析物类型(例如最近邻分析);确定患病组织中上调和/或下调的基因和/或蛋白质;肿瘤微环境的表征;肿瘤免疫反应的表征;细胞类型的表征及其在组织中的共同定位;以及鉴定组织内的遗传变异(例如基于与特定疾病或病症生物标志物相关的基因和/或蛋白质表达谱)。
通常,对于基于空间阵列的方法,基材起到将捕获探针直接或间接附着到阵列特征的支持物的作用。“特征”是作为空间分析中使用的各种分子实体的支持物或储存库的实体。在一些实施方式中,阵列中的一些或全部特征被功能化以用于分析物捕获。在美国专利申请公开号2020/0277663和/或WO2020/176788的第(II)(c)节中描述了示例性基材。阵列的示例性特征和几何属性可以在美国专利申请公开号2020/0277663和/或WO 2020/176788的第(II)(d)(i)、(II)(d)(iii)和(II)(d)(iv)节中找到。
通常,当生物样品与包括捕获探针的基材(例如,具有嵌入、点样、印刷、制造在基材上的捕获探针的基材,或者具有包括捕获探针在内的特征(例如,珠、孔)的基材)接触时,可以捕获分析物和/或中间试剂(或其部分)。如本文所用,生物样品与基材的“接触”是指任何接触(例如,直接或间接),使得捕获探针可以与来自生物样品的分析物相互作用(例如,共价或非共价结合(例如,杂交))。捕获可以主动(例如使用电泳)或被动(例如使用扩散)实现。在美国专利申请公开号2020/0277663和/或WO 2020/176788的第(II)(e)节中进一步描述了分析物捕获。
在一些情况下,可以通过将具有条形码(例如,空间条形码)的分子(例如,肽、脂质或核酸分子)附着和/或引入生物样品(例如,生物样品中的细胞)来进行空间分析。在一些实施方式中,将具有多个条形码(例如,多个空间条形码)的多个分子(例如,多个核酸分子)引入生物样品(例如,引入生物样品中的多个细胞)以用于空间分析。在一些实施方式中,在将具有条形码的分子附着和/或引入生物样品之后,可以将生物样品物理分离(例如,解离)成单个细胞或细胞组用于分析。一些这样的空间分析方法在美国专利申请公开号2020/0277663和/或WO 2020/176788的第(III)节中进行了描述。
在某些情况下,可以通过检测与分析物杂交的多个寡核苷酸来进行空间分析。在某些情况下,例如,可以使用RNA模板化连接(RTL)进行空间分析。RTL的方法已经在前面进行了描述。参见,例如,Credle等,NucleicAcidsRes.2017年8月21;45(14):e128。通常,RTL包括两个寡核苷酸与分析物(例如RNA分子,如mRNA分子)上的相邻序列的杂交。在某些情况下,寡核苷酸是DNA分子。在一些情况下,寡核苷酸之一在3′端包括至少两个核糖核酸碱基,和/或另一种寡核苷酸包括5′端的磷酸化核苷酸。在一些情况下,两个寡核苷酸中的一个包括捕获域(例如,聚(A)序列、非均聚序列)。在与分析物杂交后,连接酶(例如,SplintR连接酶)将两个寡核苷酸连接在一起,产生连接的探针(例如,连接产物)。在某些情况下,这两个寡核苷酸与彼此不相邻的序列杂交。例如,两个寡核苷酸的杂交在杂交的寡核苷酸之间产生间隙。在某些情况下,聚合酶(例如DNA聚合酶)可以在连接之前延伸寡核苷酸之一。连接后,连接的探针(例如连接产物)从分析物中释放出来。在一些情况下,使用核酸内切酶(例如,RNA酶H)释放连接的探针(例如,连接产物)。释放的连接探针(例如,连接产物)然后可以被阵列上的捕获探针捕获(例如,代替分析物的直接捕获),任选地扩增和测序,从而确定分析物在生物样品中的位置和任选地丰度。
在空间信息的分析期间,获得与分析物相关联的空间条形码的序列信息,并且该序列信息可以用于提供关于生物样品中分析物的空间分布的信息。可以使用各种方法来获得空间信息。在一些实施方式中,特定捕获探针及其捕获的分析物与基材上的特征阵列中的特定位置相关联。例如,在阵列制造之前,特定的空间条形码可以与特定的阵列位置相关联,并且空间条形码的序列可以与特定阵列位置信息一起存储(例如,在数据库中),使得每个空间条形码唯一地映射到特定阵列位置。
或者,在制造过程中,特定的空间条形码可以沉积在特征阵列中的预定位置,使得在每个位置,仅存在一种类型的空间条形码,使得空间条形码与阵列的单个特征唯一关联。在必要的情况下,可以使用本文所述的任何方法对阵列进行解码,使得空间条形码与阵列特征位置唯一关联,并且可以如上所述存储该映射。
当在空间信息的分析过程中获得捕获探针和/或分析物的序列信息时,可以通过参考将每个空间条形码与阵列特征位置唯一关联的存储信息来确定捕获探针和/或分析物的位置。以这种方式,特定的捕获探针和捕获的分析物与特征阵列中的特定位置相关联。每个阵列特征位置表示相对于阵列的坐标参考点(例如,阵列位置、基准标志物)的位置。因此,每个特征位置在阵列的坐标空间中都有一个“地址”或位置。
在WO 2020/176788和/或美国专利申请公开号2020/0277663的示例性实施例部分中描述了一些示例性空间分析工作流程。例如,参见美国专利申请公开号2020/0277663和/或WO 2020/176788的以“在本文所述的工作流程的一些非限制性实例中,样品可以被浸没…”开头的示例性实施方式。另见,例如,《Visium空间基因表达试剂盒用户指南》(如,日期为2020年6月的C版本)和/或《Visium空间基因表达试剂盒用户指南》(如,日期为2020年7月的C版本)。
在一些实施方式中,可以使用专用硬件和/或软件来执行空间分析,例如美国专利申请公开号2020/0277663和/或WO 2020/176788的第(II)(e)(II)和/或(V)节中描述的任何系统,WO 2020/132320的用于成像的对照载玻片、使用对照载玻片和基材的方法、使用对照载玻片和基材用于成像的方法、和/或样品和阵列对准装置和方法、信息标记章节中所述的装置或方法中一种或多种的任一种。
用于进行空间分析的合适系统可以包括诸如用于容纳生物样品的腔室(例如,流动池或可密封的流体密封腔室)之类的部件。生物样品可以例如安装在生物样品支架中。一个或多个流体腔室可以经由流体导管连接到腔室和/或样品支架,并且流体可以经由流体泵、真空源或耦合到流体导管的其它装置输送到腔室和/或样品支架中,其产生压力梯度以驱动流体流动。一个或多个阀也可以连接到流体导管,以调节试剂从储存器到腔室和/或样品支架的流动。
该系统可以可选地包括控制单元,该控制单元包括一个或多个电子处理器、输入接口、输出接口(例如显示器)和存储单元(例如固态存储介质,例如但不限于磁性、光学或其他固态、永久性、可写和/或可重写存储介质)。控制单元可以可选地经由网络连接到一个或多个远程设备。控制单元(及其部件)通常可以执行本文所述的任何步骤和功能。在系统连接到远程设备的情况下,远程设备可以执行本文所述的任何步骤或特征。该系统可以可选地包括用于捕获图像的一个或多个检测器(例如CCD、CMOS)。该系统还可以可选地包括用于照射样品的一个或多个光源(例如,基于LED、基于二极管、激光器)、具有特征的基材、来自捕获在基材上的生物样品的分析物以及各种控制和校准介质。
系统可以可选地包括在一个或多个有形存储介质和硬件组件(例如专用集成电路)中编码和/或实现的软件指令。当由控制单元(尤其是电子处理器)或集成电路执行软件指令时,该软件指令可以使执行软件指令的控制单元、集成电路或其他组件执行本文所述的任何方法步骤或功能。
在一些情况下,本文所述的系统可以检测(例如,登记图像)阵列上的生物样品。在PCT申请号2020/061064和/或美国专利申请序列号16/951,854中描述了检测阵列上的生物样品的示例性方法。
在将分析物从生物样品转移到基材上的特征阵列之前,可以将生物样品与阵列对准。生物样品和包括捕获探针的特征阵列的对准可以促进空间分析,其可以用于检测生物样品中不同位置的分析物存在和/或水平的差异,例如,生成分析物存在或水平的三维图。产生分析物存在和/或水平的二维和/或三维图的示例性方法在PCT申请号2020/053655中描述,并且空间分析方法通常在WO2020/061108和/或美国专利申请序列号16/951,864中描述。
在一些情况下,可以使用一个或多个基准标志物将分析物存在和/或水平的图谱与生物样品的图像对准,例如,放置在成像系统的视场中的物体,其出现在产生的图像中,如WO 2020/132320、PCT申请号2020/061066、和/或美国专利申请序列号16/951,843的基材属性章节、用于成像的对照载玻片章节中所述。基准标志物可以用作参照点或测量标尺,用于对准(例如,对准样品和阵列,对准两个基材,确定样品或阵列在基材上相对于基准标志物的位置)和/或用于尺寸和/或距离的定量测量。
如本文所用,“免疫细胞浸润”是指免疫细胞在生物样品中一个或多个位置的存在、丰度和/或分布。例如,“免疫细胞浸润”可指肿瘤浸润免疫细胞(例如,肿瘤浸润淋巴细胞(TIL))在生物样品(如肿瘤组织样品)中的一个或多个位置的存在、丰度和/或分布。生物样品中的一个或多个位置可以是生物样品中癌性区域(例如肿瘤)。例如,免疫细胞浸润可以是指免疫细胞在生物样品中的癌性区域中,例如在肿瘤中的存在、丰度和/或分布。另外或替代地,生物样品中的一个或多个位置可以是围绕生物样品中癌性区域的区域(例如基质区域)。例如,免疫细胞浸润可以是指在癌性区域周围的区域中,例如在基质区域中,免疫细胞的存在、丰度和/或分布。生物样品中的一个或多个位置也可以是癌症基质区域。例如,免疫细胞浸润可能是指生物样品的癌症基质区域中免疫细胞的存在、丰度和/或分布。特别是,本发明的方法和组合物可用于分析生物样品中一个或多个位置(例如生物样品的癌症基质区域)浸润免疫细胞的存在、丰度和/或分布。例如,本发明的方法和组合物可用于分析生物样品中一个或多个位置(例如生物样品的癌症基质区域)肿瘤浸润免疫细胞(例如TIL)的存在、丰度和/或分布。
如本文所用,“免疫细胞”可指与免疫系统相关的一种或多种细胞。特别是,免疫细胞可以是“浸润免疫细胞”,例如一个或多个免疫细胞浸润(即存在于)生物样品中的一个或更多位置,例如生物样品的癌性区域、基质区域和/或癌症基质区域。免疫细胞或浸润免疫细胞可包括但不限于适应性免疫细胞(例如,T细胞或B细胞)和先天免疫细胞(如自然杀伤(NK)细胞、巨噬细胞(例如,肿瘤相关巨噬细胞(TAM))、单核细胞和树突状细胞(DC)。浸润细胞的非限制性实例如例如在Zhang等(Cellul.Mol.Immuno.,17:808-821(2020))中所述,其全文通过引用并入本文。在一些情况下,免疫细胞或浸润免疫细胞是NK细胞。NK细胞是先天性淋巴细胞,在宿主抵抗肿瘤生长的免疫反应中发挥作用。NK细胞可以包括Melaiu等,Front.Immunol.,10:1-18(2020)和Zhang等,Front.Immunol.11:1242(2020)中所述的属性,其全部内容通过引用并入本文。肿瘤浸润NK细胞的存在与多种人类实体瘤的良好预后有关。在一些实施方式中,NK细胞与NKG7分析物相关联。免疫细胞或浸润细胞的非限制性实例可包括幼稚B细胞、记忆B细胞、浆细胞(浆细胞的标志物包括但不限于CD79A、CD79B、CD38、CD27、MZB1、IGHA1、IGHG1、JCHAIN和IGKC)、CD8 T细胞、CD4幼稚T细胞、CD4记忆-静息T细胞、CD4记忆-活化T细胞、滤泡辅助T细胞、调节性T细胞(Treg)(Treg的标志物包括但不限于FOXP3、IL17RB、CTLA4、FANK1和CD4)、γ-ΔT细胞、静息NK细胞、活化NK细胞、单核细胞、M0巨噬细胞、M1巨噬细胞、M2巨噬细胞、组织相关巨噬细胞(TAM)(TAM的标志物包括但不限于CD163、MSR1和MRC1)、静息树突细胞、活化树突细胞、静息肥大细胞、活化肥大细胞、嗜酸性粒细胞、中性粒细胞及其任何组合。特别地,浸润免疫细胞可以是肿瘤浸润免疫细胞。肿瘤浸润免疫细胞可以是肿瘤浸润淋巴细胞(TIL),例如T细胞,和/或B细胞(TIB)(例如,本文所述的任何示例性B细胞,包括浆细胞)。TIL的非限制性实例如Guo等所述(J.Oncol.,doi:10.1155/2019/2592419(2019),其全部内容通过引用并入本文。在一些情况下,TIL选自:(i)CD3+和CD4+T细胞;(ii)CD3+和CD8+T细胞;(iii)调节性T细胞,其包含CD4、Foxp3、IL17RB、CTLA4、FANK1、HAVCR1、CD25、CTLA-4、GITR、LAG-3和CD127中的一种或多种;(iv)TH1细胞,其包含CD4、CD3D、S100A4、IL7R和IFNG中的一种或多种;(v)TH2细胞,其包含CD4、IL7R、ICOS、CTLA4、TNFRSF4和TNFRS18中的一种或多种;(vi)TH17细胞,其包含CD4、CD3D、IL17A、GZMA和S100A4中的一种或多种;和(vii)细胞毒性T细胞,其包含CD8、CD3D、S100A4、IFNG、GZMB、GZMA和IL2RB中的一种或多种。在一些情况下,肿瘤浸润B细胞(TIB)选自:(i)包含MZB1、IGLL5、IGHA1、IGHG1、JCHAIN、IGKC、IGHA2、IGLC2、IGLV3-1和IGLV2-14中的一种或多种的浆细胞;(ii)Ig+B细胞,其包含IGHV3-74、SOCS3、JCHAIN和SPARC中的一种或多种;(iii)活化的B细胞,其包含CD79B、HMGB2、HMGB1、HMGN1和RGS13;和(iv)包含MEF2B、RGS13和MS4A1中的一种或多种的B细胞。
如本文所用,生物样品的“癌性区域”可以指包括癌性组织的生物样品的一个或多个位置。生物样品的癌性区域可以是肿瘤中的一个或多个位置(例如,转移前肿瘤、转移瘤、恶性肿瘤等)。在生物样品之前已被确定为包括癌组织的某些情况下,生物样品的癌性区域可以代表癌症的某个阶段。例如,癌症样品可以包括对应于不同肺癌阶段的癌性区域,包括肿瘤大小T1、T2、T3或T4。生物样品中的癌性区域可以通过一个或多个标志物(例如,生物标志物)来识别,例如Pan-CK。与癌性区域相关的标志物的其他非限制性实例包括SCGB2A1、MKI67、BRCA1、BRCA2、PIKCD、CALML6、MYC、TP53、PALB2、RAD51和/或MSH2。
如本文所用,生物样品的“基质区域”可以指不是癌性区域的生物样品的一个或多个位置。例如,生物样品的“基质区域”可以指生物样品的癌性区域之外的一个或多个位置。另外或替代地,生物样品的基质区域可以是具有结构或结缔作用的组织或器官的部分。生物样品的基质区域可以包括结缔组织、血管和炎性细胞中的一种或多种。生物样品中的基质区域可以通过一种或多种标志物(例如生物标记物)如CD45来鉴定。
II.用无偏方法检测免疫细胞浸润
本公开基于使用无偏方法来确定生物样品中的免疫细胞浸润。在一些情况下,本文公开的空间方法与机器学习模块和基因簇相结合,以识别样品中包括肿瘤浸润免疫细胞的区域。
本公开的特征在于确定生物样品中免疫细胞浸润的方法,所述生物样品包括对象中的一个或多个癌性区域和一个或多个基质区域,其中所述方法包括:(a)识别癌性区域或与来自所述一个或多种癌性区域中的癌性区域相关的分析物和/或识别基质区域或与来自生物样品中的一个或多个基质区域的基质区域相关的分析物;(b)识别一个或多个免疫细胞或与癌性区域和/或基质区域中的免疫细胞相关的分析物;和(c)确定所述生物样品中所述一种或多种免疫细胞或与免疫细胞相关的分析物的丰度;从而确定生物样品中的免疫细胞浸润。在一些实施方式中,识别癌性区域、识别基质区域和/或识别免疫细胞包括:(a)从生物样品生成数据集,其中该数据集包括以下中的一个或多个:(i)从生物样品中的多个空间位置捕获的多个分析物的分析物数据;(ii)图像数据,所述图像数据包括所述生物样品的多个空间位置的图像;以及(iii)将分析物数据链接到图像数据的登记数据;以及(b)使用所述数据集来识别所述生物样品中的癌性区域、基质区域和/或免疫细胞。在一些实施方式中,识别癌性区域、识别基质区域和/或识别免疫细胞包括:(a)从生物样品生成数据集,其中该数据集包括:(i)从生物样品中的多个空间位置捕获的多个分析物的分析物数据;(ii)图像数据,所述图像数据包括所述生物样品的多个空间位置的图像;以及(iii)将分析物数据链接到图像数据的登记数据;以及(b)使用所述数据集来识别所述生物样品中的癌性区域、基质区域和/或免疫细胞。
本公开的特征在于确定生物样品中免疫细胞浸润的方法,所述生物样品包括对象中的一个或多个癌性区域和一个或多个基质区域,所述方法包括:(a)从获自对象的生物样品生成数据集,其中所述数据集包括:(i)从所述生物样品的多个空间位置捕获的多个分析物的分析物数据,其中所述多个分析物中的分析物是与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物;(ii)图像数据,所述图像数据包括所述生物样品的多个空间位置的图像;以及(iii)将分析物数据链接到图像数据的登记数据;(b)将所述数据集提供给经过训练的机器学习模块,其中所述经过训练的机器学习模块包括来自一个或多个参考样品的参考分析物数据集,其中所述一个或多个参考样品包括(i)来自一个或多个癌性区域的癌性区域,(2)来自一个或多个基质区域的基质区域,和(3)来自一个或多个免疫细胞的免疫细胞;以及(c)通过经过训练的机器学习模块确定生物样品中的免疫细胞浸润。
在一些情况下,癌性区域包括良性肿瘤、转移前肿瘤、恶性肿瘤和一个或多个炎性细胞中的一种或多种。在一些情况下,基质区域包括结缔组织、血管和炎性细胞中的一种或多种。基于本公开内容,癌性区域和基质区域的其他实例对于本领域技术人员将是显而易见的。
(a)使用机器学习模块确定生物样品中的免疫细胞浸润
本公开的特征在于使用机器学习模块确定生物样品中免疫细胞浸润的方法。在一个非限制性实例中,本公开的特征在于用于确定生物样品中免疫细胞浸润的方法,所述生物样品包括对象中的一个或多个癌性区域和一个或多个基质区域,所述方法包括:(a)从获自对象的生物样品生成数据集,其中所述数据集包括:(i)从所述生物样品的多个空间位置捕获的多个分析物的分析物数据,其中所述多个分析物中的分析物是与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物;(ii)图像数据,所述图像数据包括所述生物样品的多个空间位置的图像;以及(iii)将分析物数据链接到图像数据的登记数据;(b)将所述数据集提供给经过训练的机器学习模块,其中所述经过训练的机器学习模块包括来自一个或多个参考样品的参考分析物数据集,其中所述一个或多个参考样品包括(i)来自一个或多个癌性区域的癌性区域,(2)来自一个或多个基质区域的基质区域,和(3)来自一个或多个免疫细胞的免疫细胞;以及(c)通过经过训练的机器学习模块确定生物样品中的免疫细胞浸润。
在一些实施方式中,一种用于确定生物样品中免疫细胞浸润的方法使用机器学习模块,其中该方法包括:(a)生成多个生物样品的数据集,其中该数据集包括,对于多个生物样品中的每个生物样品(例如,包括一个或多个参考样品):(i)从生物样品中多个空间位置捕获的多个分析物的分析物数据;(ii)图像数据,所述图像数据包括所述生物样品的多个空间位置的图像;以及(iii)将分析物数据链接到图像数据的登记数据;其中所述参考生物样品包括(1)所述参考生物学样品中的一个或多个癌性区域,(2)所述一个或多个癌性区域内的一个或多个基质区域,以及(3)多个肿瘤浸润免疫细胞;(b)用所述数据集训练机器学习模块,从而生成经过训练的机器学习模块;以及(c)使用经过训练的机器学习模块来确定测试生物样品中的免疫细胞浸润。在一些实施方式中,向经过训练的机器学习模块提供来自生物样品的数据集,其包括(i)从生物样品中的多个空间位置捕获的多个分析物的分析物数据;(ii)图像数据,所述图像数据包括所述生物样品的多个空间位置的图像;以及(iii)将所述分析物数据与所述图像数据链接的登记数据,其中所述经过训练的机器学习模块至少部分地经以下训练数据训练:包括来自一个或多个参考样品的一个或多个参考分析物数据集的训练数据,其中所述一个或多个参考样品包括(1)一个或多个参考癌性区域,(2)一个或多个参考基质区域,和(3)一个或多个参考免疫细胞。
在一些实施方式中,一种用于确定生物样品中免疫细胞浸润的方法包括:(a)访问从对象获得的生物样品的数据集,其中该数据集包括(i)从生物样品的多个空间位置捕获的多个分析物的核酸序列数据;(ii)图像数据,所述图像数据包括所述生物样品的多个空间位置的图像;以及(iii)将所述核酸序列数据链接到所述图像数据的登记数据;(b)将所述生物样品的数据集提供给经过训练的机器学习模块;所述经过训练的机器学习模块至少部分经以下训练数据训练:包括来自一个或多个参考样品的核酸序列数据集的训练数据,所述一个或多个参考样品包括(1)一个或多个癌性区域、(2)一个或多个基质区域、和(3)一个或多个肿瘤浸润免疫细胞;(c)通过经过训练的机器学习模块,提供对对象癌症基质中免疫细胞浸润的分析。
在一些实施方式中,可以使用计算机实现的方法来训练机器学习模块,并使用机器学习模块来确定生物样品中的免疫细胞浸润。在这种情况下,计算机实现的方法包括:生成多个生物样品(例如,一个或多个参考样品)的数据集,其中,对于多个生物样品中的每个生物样品,该数据集包括:(i)在参考生物样品的多个空间位置捕获的多个分析物的分析物数据;(ii)参考生物样品的图像数据;以及(iii)根据参考生物样品的空间位置链接到分析物数据的成像数据的登记数据;其中所述参考生物样品包括(1)所述参考生物学样品中的一个或多个癌性区域,(2)所述一个或多个癌性区域内的一个或多个基质区域,以及(3)一个或多个免疫细胞;(b)用所述数据集训练机器学习模块,从而生成经过训练的机器学习模块;以及(c)通过所述经过训练的机器学习模块确定生物样品中的免疫细胞浸润。
在一些实施方式中,示例性系统包括如图5所示的示例性图中所描述的组件。图5示出了可操作用于识别生物样品中的感兴趣区域(例如,包括TIL的感兴趣区)的示例性系统500的框图。在该实施方式中,系统500是用计算系统501来实现的。例如,计算系统501可以包括一个或多个处理器、存储设备(例如,包括计算机存储器、固态驱动器、硬盘驱动器等的持久性和易失性存储设备)、网络接口、图形卡等。计算系统501可操作以实现机器学习模块502。在这方面,机器学习模块502可以被实现为与计算系统501一起配置的计算机硬件、软件和/或固件的组合。
在一些实施方式中,计算系统501可操作来处理多个数据元件530-1、530-2至530-N的数据集(其中参考“N”是大于“1”的整数,并且不必等于本文指定的任何其他“N”参考)。在一些实施方式中,每个数据元件530包括与生物样品的捕获和条码化分析物有关的数据。每个数据元件530还可以包括登记到条码化分析物的生物样品的图像数据。可以使用本文所述的任何技术来执行成像。
例如,可以用多个捕获探针在多个捕获区域询问生物样品,所述捕获区域例如是如本文所述的图1的捕获点(例如,空间条码化特征)101。如本文所述的捕获区域包括在基材上的特定位置处的捕获探针。从生物样品的上覆细胞释放的分析物(例如,mRNA)可以被基材上捕获区域内的捕获探针捕获。
在一些实施方式中,包括捕获探针的基材还包括基准标志物(例如,本文所述或本领域已知的任何基准标志物)。例如,可以利用基准标志物获得生物样品的图像。图像的基准标志物可以用于将生物样品的图像与条码化分析物在其已知位置处的数据对准。
在一些实施方式中,数据元件530中的每一个可以包括与生物样品有关的二维信息集。例如,图像可以包括二维像素数据集,其包括图像中每个像素的像素位置、强度、对比度、亮度、颜色(例如,色调)等。该像素数据可以链接到捕获探针询问生物样品的捕获区域的已知位置(例如,空间条码化特征)。捕获探针的数据提供了数据元件530的数据的第三维方面。
在一些实施方式中,示例数据元件如图6中所示和所述。在该实施方式中,数据元件630包括由像素634的二维阵列组成的生物样品(为了简单起见未示出)的图像631。此实施方式中的图像631仅出于说明的目的而显示为像素阵列,因为显示与阵列中的每个像素相关的数据可能会破坏对登记过程的理解。
在一些实施方式中,数据元件630还包括来自基材632(例如,MxN阵列)的数据,基材632包括捕获区域(例如,空间条码化特征)101,其中捕获探针用于询问生物样品(其中参考“M”和“N”是大于“1”的整数,并且不必等于本文中指定的任何其他“M”和“N”参考)。来自这些捕获区域(例如,空间条码化特征)101的数据(例如,从中获得的条码化分析物的数据)被链接到图像631,以将条码化分析物数据登记到图像631的像素634的数据。例如,生物样品的捕获区域101-M-1包括来自多个条码化分析物102的数据。该捕获区域(例如,空间条码化特征)101-M-1被链接(633)到生物样品的图像631中的对应位置101-M-1(图像),从而将条码化分析物的数据登记到图像631的像素数据。在一些实施方式中,在条码化分析物102链接到图像的像素位置的情况下,可以定位各种基因或蛋白质,使得可以可视化或以其他方式识别基因或蛋白质表达(例如,疾病组织、健康组织、疾病和健康组织的边界等)。在一些实施方式中,在条码化分析物102链接到图像的像素位置的情况下,可以定位各种分析物,使得可以可视化或以其他方式识别TIL特异性分析物或TIL特异性分析物特征。
在一些实施方式中,从多个样品获得数据元件630可以适用于机器学习(例如,人工智能处理)。机器学习通常考虑计算机系统(例如计算系统501)用于执行特定任务的算法和统计模型,而不使用明确的指令,而是依赖于模式和推理。例如,机器学习算法可以基于样品数据建立数学模型,称为“训练数据”,以便在没有明确编程执行任务的情况下进行预测或决策。因此,现在返回图5,当从相似的样品(例如,人类)获得多个生物样品时,可以生成来自每个生物样品的数据元件630,以提供可以用于训练计算系统501的机器学习模块502的数据集520。
在一些实施方式中,机器学习模块502可以检测肿瘤浸润免疫细胞和/或识别生物样品中包括肿瘤浸润免疫细胞的各种感兴趣区域。在一个实施方式中,机器学习模块502可以对数据集520进行操作,以学习每个数据元件530中的图案,从而确定在数据元件530-I中是否存在类似的图案。例如,数据集520可以包括从一种样品类型的患病组织的生物样品获得的数据元件530。例如,患病组织包括癌性区域,该癌性区域包括TIL。机器学习模块502可以用数据集520的每个数据元件530进行训练,以学习图像数据中的图案以及可能发生在这种患病组织中的基因或蛋白质表达。此后,机器学习模块502可以将所学习的图案与数据元件530-I中的任何图案进行比较,使得输出模块503可以确定产生数据元件530-I的生物样品是否具有患病组织(例如,在组织样品中存在TIL)。在一些实施方式中,机器学习模块502可以用于通过使用监督学习来检测生物样品内的图案。例如,计算系统501的操作者可以识别样品的图像中与基因表达中的图案相对应的图案。操作者然后可以使用这些识别的图案来训练机器学习模块502,使得机器学习模块502可以在输入到机器学习模块502的后续数据元件530中检测类似的图案。在另一示例中,计算系统501的操作者可以识别样品的图像中的图案,该图案对应于一个或多个染色剂(例如,本文所述的示例性染色剂中的任何一个)的图案。操作员然后可以使用这些识别的图案来训练机器学习模块502,使得机器学习模块502可以在输入到机器学习模块502的后续数据元件530中检测类似的图案。
在一些实施方式中,训练数据甚至可以是或至少包括模拟数据。例如,关于例如疾病组织、健康组织、疾病和健康组织的边界等的生物过程的物理和生物学可以用作生成数据的规则,该数据可以以看起来像实际数据的方式进行格式化(例如,将条形码数据登记到图像数据)。该模拟数据可以单独使用,也可以与实际数据结合使用来训练机器学习模块502。
在一些实施方式中,机器学习模块502包括多种机器学习算法中的一种或多种。机器学习模块502可以实现的机器学习算法的非限制性示例包括:监督学习算法、半监督学习算法、无监督学习算法、回归分析算法、强化学习算法、自学习算法、特征学习算法、稀疏字典学习算法、异常检测算法、生成对抗性网络算法、迁移学习算法和关联规则算法。在一些实施方式中,机器学习模块502并不旨在局限于特定的机器学习算法。在一些实施方式中,可以由机器学习模块实现的机器学习算法的非限制性示例如Svensson等,NatureMethods,15:343-346(2018);Edsgard等,Nature Methods,15:339-324(2018);Sun等,NatureMethods,17(2):193-200(2020);J.N.R.Jeffers,J.Royal Stat.Society,SeriesD,22(4)(1973),doi:10.2307/2986827;Hongfei等,Geographical Analysis,39(4):357-275(2007);Solomon Kullback,《信息论与统计学》(Information TheoryandStatistics),ISBN 0-8446-5625-9(威利出版社(Wiley)1978)中所述,其全部内容通过引用并入本文。
在包括迁移学习算法的一些实施方式中,在解决一个问题时获得的知识可以应用于不同但相关的问题。例如,可以使用初始类型的数据(例如,图像数据、条形码数据等)来训练机器学习模块502,以识别基因表达和图像图案之间的关系。图像数据和基因表达之间的关系可以用于训练机器学习模块502以识别条形码数据和图像数据之间的关系。在一些实施方式中,机器学习模块不旨在限于任何特定类型或数据源,因为来自各种源和类型的数据可以用于训练机器学习模块502。
在一些实施方式中,图像数据可以用于训练机器学习模块502来识别样品中的位置,该位置可以包括样品中材料量的变化。例如,成像样品的部分可以包括比图像的其他部分更高的强度,例如荧光、光或颜色强度。这可能表明在该位置存在更多的分析物(例如,DNA、RNA、蛋白质)。然后,这种关系可以用于训练机器学习模块502来识别其他图像中的DNA密度。在另一个例子中,成像样品的部分可以包括比图像的其他部分更高的强度,从而指示在该位置有更多的mRNA。然后,这种关系可以用于训练机器学习模块502来识别其他图像中的mRNA密度。在又一个例子中,成像样品的部分可以包括比图像的其他部分更高的强度,从而指示在该位置有更多的蛋白质。然后可以使用这种关系来训练机器学习模块502以识别其他图像中的蛋白质密度。
图5和图7示出了计算系统500的示例性过程700。在该实施方式中,过程700以在过程元件701中生成多个生物样品的数据集520开始。例如,如本文所述,可以从特定的样品类型获得多个生物样品。在一些实施方式中,在生物样品中的多个不同位置(例如,捕获区域(例如,空间条码化特征)),来自生物样品的分析物与捕获探针结合,分析物被处理(例如,捕获探针延伸和第二链合成),从而在处理元件702中产生条码化分析物(例如,包括分析物或其互补序列的序列,以及条形码或其互补的序列)。在处理元件703中对样品进行成像,以产生二维像素阵列,可以从中提取像素数据。在一些实施方式中,在处理元件704中,根据捕获区域(例如,空间条码化特征)将与条码化分析物有关的数据登记到图像样品。
在一些实施方式中,在数据集520在手的情况下,计算系统501用数据集520并在过程元件706中训练机器学习模块502。一旦经过训练,机器学习模块502就可以用于在过程元件707中识别第一生物样品(例如,产生数据元件530-I的生物样品)中的感兴趣区域。例如,可以用与样品的健康组织样品有关的数据元件530来训练机器学习模块502,以便将数据元件530-I与数据集520的数据元件530进行比较和对比。
在一些实施方式中,多个生物样品中的生物样品是先前已被识别为具有存在于生物样品中免疫细胞浸润的样品。在一些实施方式中,多个生物样品中的生物样品是先前未被识别为在生物样品中存在免疫细胞浸润的样品。
在一些实施方式中,为生物样品生成数据集。在一些实施方式中,数据集包括但不限于(i)在生物样品的多个空间位置(例如,空间条码化特征)捕获的多个分析物的分析物数据(例如,其中生物样品是测试生物样品或一个或多个参考生物样品);(ii)图像数据,所述图像数据包括所述生物样品的所述多个空间位置的图像;以及(iii)将分析物数据链接到图像数据的登记数据。在一些实施方式中,将数据集提供给经过训练的机器学习模块,其中所述经过训练的机器学习模块至少部分地经以下训练数据训练:包括来自一个或多个参考样品的参考分析物数据集的训练数据,和(3)一个或多个参考免疫细胞。在一些实施方式中,数据集用于训练机器学习模块。
如本文所用,“分析物数据”可指通过检测生物样品(例如,测试生物样品或一个或多个参考生物样品)中的一种或多种分析物而产生的数据,其中检测包括:将测试生物样品中的一个或多种分析物附着到捕获探针,其中捕获探针包括捕获域和空间条形码;以及确定(i)对应于分析物的序列的全部或部分,或其互补物,以及(ii)对应于空间条形码的序列的全部或部分,或其互补品,并且使用(i)和(ii)的所确定的序列来识别测试生物样品中分析物的丰度和/或空间位置。在一些实施方式中,分析物数据可以用于训练机器学习模块。
如本文所用,“图像数据”可以是指从获得生物样品的图像中生成的数据;以及将图像数据登记到空间位置。在一些实施方式中,图像数据包括在用一种或多种染色剂对生物样品进行染色之后获得图像。例如,一种或多种染色剂可以包括苏木精和伊红。在一些实施方式中,所述一种或多种染色剂包括一个或多个光学标记。光学标记的非限制性实例包括:荧光、放射性、化学发光、量热或比色标记。
在一些实施方式中,图像数据可以用于使用生物样品的一种或多种染色剂来识别生物样品中的一个或多个癌性区域。例如,图像数据可以包括获得用苏木精和伊红染色的生物样品的图像,其中该染色剂用于识别生物样品中的一个或多个癌性区域。
在一些实施方式中,图像数据可以用于使用生物样品的一种或多种染色剂来识别一个或多个癌性区域内的一个或多个基质区域。例如,图像数据可以包括获得用苏木精和伊红染色的生物样品的图像,其中该染色剂用于识别生物样品中一个或多个癌性区域中的一个或多个基质区域。
在一些实施方式中,图像数据被登记到分析物数据。如本文所用,“登记数据”是链接或编译本文所公开的数据集中的分析物数据和图像数据的数据。例如,根据图像数据和分析物数据的空间位置,将成像数据链接到分析物数据。在一些实施方式中,图像数据可以用于训练机器学习模块。
(b)在生物样品中生成分析物数据
本公开的特征在于用于确定生物样品中免疫细胞浸润的方法,所述生物样品包括对象中的一个或多个癌性区域和一个或多个基质区域,其中所述方法包括生成分析物数据。在一些实施方式中,分析物数据来自癌性区域或与来自一个或多个癌性区域的癌性区域相关的分析物;基质区域或与来自生物样品中的一个或多个基质区域的基质区域相关的分析物;和/或一个或多个免疫细胞或与癌性区域和/或基质区域中的免疫细胞相关的分析物。在该方法包括生成分析物数据的一些实施方式中,该方法包括确定一个或多个癌症区域或与癌性区域相关的分析物的丰度;一个或多个基质区域或与基质区域相关的分析物;以及一个或多个免疫细胞或与免疫细胞相关的分析物;从而确定生物样品中的免疫细胞浸润。
(i)当分析物是核酸时生成分析物数据
本公开的特征在于用于确定生物样品中免疫细胞浸润的方法,其中该方法包括在基材上捕获核酸(例如,mRNA和gDNA)以鉴定免疫细胞浸润。在一些实施方式中,与相关联的分析物在一些实施方式中,用于确定生物样品中免疫细胞浸润的方法包括生成生物样品的数据集,包括:将来自癌症对象的生物样品与包含多个捕获探针的基材接触,其中所述生物样品包括(1)一个或多个癌性区域,(2)一个或多个基质区域,和(3)一个或多个肿瘤浸润免疫细胞,并且其中所述多个捕获探针中的捕获探针包括空间条形码和捕获域;将来自所述生物样品的核酸分子附着到所述捕获探针;确定(i)对应于核酸分子的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其互补物,并使用(i)和(ii)的所确定的序列来鉴定核酸分子在生物样品中的空间位置和丰度;以及基于与空间位置处的分析物相对应的所确定序列,将空间位置识别为簇的部分,并使用簇来分析患癌对象的癌症基质中的免疫细胞浸润。
在一些实施方式中,其中用于确定生物样品中免疫细胞浸润的方法包括基材上核酸分子的捕获,该方法包括使生物样品与包括多个捕获探针的基材接触,其中所述多个捕获探针中的捕获探针包括空间条形码和捕获域;将与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物杂交到捕获探针;以及确定(i)对应于与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
在用于确定位置的方法包括捕获基材上的核酸分子的一些实施方式中,该方法的确定步骤包括对(i)对应于与癌性区域相关的核酸分子,与基质区域相关的核酸分子,和/或与免疫细胞相关的核酸分子的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其补充物,并使用(i)和(ii)的确定的序列鉴定生物样品中的与癌性区域相关的核酸分子,与基质区域相关的核酸分子,和/或与免疫细胞相关的核酸核酸分子,或其互补物的丰度和/或空间位置。在一些实施方式中,测序包括原位测序。
在一些实施方式中,用于确定生物样品中免疫细胞浸润的方法,其中所述方法包括基于所述空间位置处的分析物的量和所述生物样品中多个不同空间位置处分析物的量来鉴定核酸的子集;以及基于在生物样品中的多个不同空间位置处的分析物的量将(d)的分析物的子集分选成簇,其中一个或多个簇包括与肿瘤浸润淋巴细胞表型相关的分析物,以及使用簇来识别肿瘤浸润淋巴细胞在生物样品中的空间位置。
在一些实施方式中,用于确定生物样品中免疫细胞浸润的方法包括基于空间位置处的分析物的量来鉴定分析物;以及基于生物样品中给定空间位置处的分析物的量将空间位置分配到簇中。在一些实施方式中,簇包括空间位置,其中分析物与肿瘤浸润免疫细胞表型相关。在一些实施方式中,簇包括空间位置,其中分析物与癌症细胞表型相关。在一些实施方式中,簇包括空间位置,其中分析物与基质细胞表型相关。在一些实施方式中,基于一个或多个癌症分析物、一个或多个基质区域分析物和/或免疫细胞分析物的存在,将空间位置分组为簇。在一些实施方式中,簇用于识别生物样品中的免疫细胞浸润。
可以使用许多方法来帮助识别簇。这种方法的非限制性示例包括非线性降维方法,例如t分布随机邻域嵌入(t-SNE)、全局t分布随机近邻嵌入(g-SNE)和均匀流形逼近与投影(UMAP)。
可以识别任意数量的簇。在一些实施方式中,可以使用本文所述的方法来识别2至500个簇。例如,可以识别2至10、2至20、2至50、2至75、至100、2至150、2至200、2至300、2至400、400至500、300至500、200至500、100至500、75至500、50至500或25至200个簇。在一些实施方式中,可以识别25至75、50至100、50至150、75至150或100至200个簇。在一些实施方式中,识别2至200个簇。在一些实施方式中,识别2至10个簇。
在一些实施方式中,使用原位测序来检测一种或多种分析物。原位测序通常涉及将标记的核苷酸(例如荧光标记的单核苷酸或二核苷酸)掺入到连续的,模板依赖性方式或标记的引物(例如,标记的随机六聚体)与核酸模板的杂交,从而标记的引物识别(即核苷酸序列)掺入的核苷酸或可以确定或标记的标记的引物延伸产物,并因此确定相应模板核酸的核苷酸序列。原位测序的各方面描述于例如Mitra等,(2003)Anal.Biochem.320,55-65,和Lee等,(2014)Science,343(6177),1360-1363,其中每一个的全部内容通过引用纳入本文。
此外,用于进行原位测序的方法和系统的实例描述于PCT专利申请公开号WO2014/163886、WO2018/045181、WO2018/445186以及美国专利号10138509和10179932中,其中每一个的全部内容通过引用纳入本文。原位测序的示例性技术包括但不限于STARmap(例如在Wang等,(2018)Science,361(6499)5691中描述)、MERFISH(例如在2017/0220733和Moffitt,(2016)Methods in Enzymology,572,1-49中描述),SeqFISH(例如在U.S.10,457,980中描述),杂交链式反应扩增(在U.S.8,507,204中描述)和FISSEQ(例如在美国专利申请公开号2019/0032121中描述)。上述各参考文献的全部内容通过引用纳入本文。
(ii)当分析物是蛋白质时生成分析物数据
本公开的特征在于用于确定生物样品中免疫细胞浸润的方法,其中该方法包括使用包括分析物结合部分和分析物结合部条形码的分析物捕获剂来识别免疫细胞浸润。在一些实施方式中,用于确定生物样品中免疫细胞浸润的方法包括生成生物样品的数据集,包括:用多种分析物捕获剂附着生物样品,其中所述多种分析物捕获试剂中的分析物捕获剂包括:(i)特异性结合与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物的分析物结合部分;(ii)分析物结合部分条形码;和(iii)分析物捕获序列,其中所述分析物捕获序列特异性结合捕获域;使所述生物样品与基材接触,其中所述基材包括多个捕获探针,所述多个捕获探针中的捕获探针包括(i)所述捕获域和(ii)空间条形码;将与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物杂交到所述捕获探针;以及确定(i)对应于与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物、和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
在一些实施方式中,其中用于确定生物样品中免疫细胞浸润的方法包括使用分析物捕获剂,该方法包括:用多种分析物捕获试剂附着生物样品,其中所述多种分析物捕获剂中的分析物捕获剂包括:(i)特异性结合与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物的分析物结合部分;(ii)分析物结合部分条形码;和(iii)分析物捕获序列,其中所述分析物捕获序列特异性结合捕获域;使所述生物样品与基材接触,其中所述基材包括多个捕获探针,所述多个捕获探针中的捕获探针包括(i)捕获域和(ii)空间条形码;将与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物杂交到所述捕获探针;以及确定(i)对应于与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物、和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
在用于确定位置的方法包括使用分析物捕获剂的一些实施方式中,该方法的确定步骤包括测序(i)对应于与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其互补物,并使用(i)和(ii)的确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物、和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。在一些实施方式中,测序包括原位测序。
“分析物捕获剂”是指与目标分析物和捕获探针相互作用以识别分析物的分子。在一些实施方式中,分析物捕获剂包括标记(例如,荧光标记)。在一些实施方式中,分析物捕获剂可以包括分析物结合部分和捕获剂条形码结构域。分析物结合部分是能够与特定分析物结合的分子。在一些实施方式中,分析物结合部分包括抗体或抗体片段。在一些实施方式中,分析物结合部分包括多肽和/或适体。在一些实施方式中,分析物结合部分包括DNA适体。在一些实施方式中,分析物结合部分包括RNA适体。在一些实施方式中,分析物结合部分包括混合的天然或非天然存在的核苷酸(例如LNA、PNA)的适体。在一些实施方式中,分析物是蛋白质(例如,细胞表面上的蛋白质或胞内蛋白质)。在一些实施方式中,分析物结合部分是抗体或其抗原结合片段、细胞表面受体结合分子、受体配体、小分子、T细胞受体衔接体、B细胞受体衔接体、前体、适体、单体、结合物或DARPin。在一些实施方式中,该方法包括:使生物样品与荧光标记的抗体接触。
捕获剂条形码结构域可以包括分析物捕获序列,其可以与捕获探针的捕获域的至少部分或全部杂交。在一些实施方式中,分析物捕获序列包括聚(A)尾。在一些实施方式中,分析物捕获序列包括能够结合聚(T)结构域的序列。在一些实施方式中,分析物捕获序列的GC含量可以在1%-100%之间,例如,1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、35%、40%、45%、50%、60%、70%、80%等)。在一些实施方式中,分析物捕获序列的GC含量为至少30%。在一些实施方式中,可以向生物样品提供一组或多组分析物捕获剂,其中一组分析物捕集剂与另一组分析物捕获剂的不同之处在于分析物捕获序列。例如,分析物捕获序列A可以与分析物结合部分A相关联,分析物捕获序列B可以与分析物结合部分B相关联。在一些实施方式中,两组分析物捕获剂可以具有相同的分析物结合部分条形码序列。
在一些实施方式中,捕获域包括聚(T)尾。在一些实施方式中,捕获域包括能够结合聚(A)结构域的序列。在一些实施方式中,捕获域可以具有1%-100%之间的GC含量,例如,1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、35%、40%、45%、50%、60%、70%、80%等。在一些实施方式中,捕获域的GC含量为至少30%。
在一些实施方式中,捕获剂条形码结构域包括分析物结合部分条形码。分析物结合部分条形码是指与分析物结合部相关联或以其他方式识别分析物结合部分的条形码。在一些实施方式中,分析物结合部分条形码与分析物结合部的类型相关,使得一次可以向生物样品提供超过一组分析物捕获剂。例如,分析物结合部分条形码A可以与分析物结合部分A相关联,并且分析物结合部将条形码B与分析物连接部分B相关联。两组分析物捕获剂可以具有相同的分析物捕获序列(例如,聚(A))。在一些实施方式中,一个分析物结合部分条形码组与一个分析物捕获序列组相关联。在其他实施方式中,分析物结合部分条形码组不一定与分析物捕获序列组相关联。
在一些实施方式中,捕获剂条形码结构域包括任选的序列,例如但不限于PCR柄、测序启动位点、用于与另一核酸分子杂交的结构域及其组合。在一些实施方式中,PCR柄在所有捕获分析物条形码结构域上是相同的。在一些实施方式中,包括PCR柄用于PCR扩增。在一些实施方式中,分析物捕获剂包括一个或多个任选序列和一个或多个条形码序列(例如,一个或多个分析物结合部分条形码和/或一个或多个UMI)。在一些实施方式中,捕获探针捕获域和/或分析物捕获剂包括切割结构域。在一些实施方式中,可以通过经由捕获剂条形码结构域中的切割结构域将分析物结合部分从捕获剂条形码构造域切割来将捕获剂条形码域从分析物结合不分解离。本文描述了可用于空间蛋白质检测的分析物捕获剂的其他实施方式。
本文提供了用于在生物样品中对生物分析物(例如本文所述的任何分析物)进行空间分析的方法,该方法使用空间标记的分析物捕获剂。生物分析物可以被基材上不同空间位置的分析物捕获剂结合并被检测。结合的生物分析物然后可以与捕获探针的条形码在基材的不同空间位置处相关联。在一些实施方式中,这些方法可以包括从生物样品中的细胞的胞内区域、生物样品中细胞的细胞表面区域、生物样品中特定类型的细胞和生物样品的感兴趣区域中的一个或多个对生物分析物进行空间分析。
(a)阻断探针
在一些实施方式中,在将分析物捕获剂添加到生物样品之前,阻断捕获剂条形码域的分析物捕获序列。在一些实施方式中,在将分析物捕获剂添加到捕获探针阵列之前,阻断捕获剂条形码结构域的分析物捕获序列。在一些实施方式中,将阻断探针添加到阻断缓冲液或应用于IHC和/或IF方案中的其它溶液中。在一些实施方式中,阻断探针用于阻断或修饰捕获剂条形码结构域的游离3’端。在一些实施方式中,阻断探针用于阻断或修饰捕获剂条形码结构域的分析物捕获序列的游离3’端。在一些实施方式中,阻断探针可以与捕获剂条形码结构域的分析物捕获序列杂交,以掩蔽捕获剂条形码结构域的游离3’端。在一些实施方式中,阻断探针可以是发夹探针或部分双链探针。在一些实施方式中,捕获剂条形码结构域的分析物捕获序列的游离3′端可以通过化学修饰来阻断,例如,添加叠氮甲基作为化学可逆的封端部分,使得捕获探针不包括游离3′末端。在分析物捕获剂与基材接触之前,阻断或修饰捕获剂条形码结构域,特别是在捕获剂条形码结构域的游离3’端,防止分析物捕获序列与捕获探针捕获域结合(例如,防止分析物捕获序列聚(A)尾与聚(T)捕获域的结合)。
在一些实施方式中,阻断探针用于阻断或修饰捕获探针的游离3’端。在一些实施方式中,阻断探针用于阻断或修饰捕获探针捕获域的游离3’端。在一些实施方式中,在将分析物捕获剂添加到捕获探针阵列之前阻断分析物捕获序列。在一些实施方式中,将阻断探针添加到阻断缓冲液或应用于IHC和/或IF方案中的其它溶液中。在一些实施方式中,阻断探针可以与捕获域杂交以掩蔽捕获域的游离3’端。在一些实施方式中,阻断探针可以是发夹探针或部分双链探针。在一些实施方式中,捕获域的游离3’端可以通过化学修饰来阻断,例如,添加叠氮甲基作为化学可逆的封端部分,使得捕获探针不包括游离3’端。在分析物捕获剂与捕获探针阵列接触之前,阻断或修饰捕获域,特别是在捕获域的游离3’端,防止分析物捕获序列与捕获探针捕获域结合(例如,防止分析物捕获序列聚(A)尾与聚(T)捕获域相结合)。
在一些实施方式中,阻断探针可以被可逆地移除。例如,可以应用阻断探针来阻断捕获剂条形码结构域和/或捕获探针中的一个或两个的游离3′端。阻断分析物捕获剂和捕获探针阵列之间的相互作用可以减少IHC和/或IF应用中的非特异性背景染色。在分析物结合剂与目标分析物结合后,可以从捕获剂条形码结构域和/或捕获探针的3’端移除阻断探针,并且结合分析物的分析物结合剂可以迁移到捕获探针阵列并被捕获探针阵列结合。在一些实施方式中,去除包括使阻断探针从分析物结合部分条形码和/或捕获探针变性。在一些实施方式中,去除包括去除化学可逆的封端部分。在一些实施方式中,去除包括用RNA酶(例如,RNA酶H)消化阻断探针。
在一些实施方式中,阻断探针是寡聚(dT)阻断探针。在一些实施方式中,寡聚(dT)阻断探针可以具有15-30个核苷酸的长度。在一些实施方式中,寡聚(dT)阻断探针可以具有10-50个核苷酸,例如10-50、10-45、10-40、10-35、10-30、10-25、10-20、10-15、15-50、15-45、15-40、15-35、15-30、15-25、15-20、20-50、20-45、20-40、20-35、20-30、20-25、25-50、25-45、25-40、25-35、25-30、30-50、30-45、30-40、30-35、35-50、35-45、35-40、40-50、40-45或45-50个核苷酸的长度。在一些实施方式中,分析物捕获剂可以在不同的温度(例如,4℃和37℃)下被阻断。在一些实施方式中,当使用较短的阻断探针时,可以在较低的温度下更有效地阻断分析物捕获剂与捕获探针的结合。
(b)空间标记的捕获剂
“空间标记的分析物捕获剂”可以是与分析物(例如,样品中的分析物)和捕获探针相互作用以识别分析物的空间位置的分子。在一些实施方式中,空间标记的分析物捕获剂可以是具有延伸的捕获剂条形码结构域的分析物捕获剂,该延伸的捕获试剂条形码结构域包括与捕获探针的空间条形码互补的序列。在一些实施方式中,将分析物捕获剂同时引入分析物和捕获探针。在一些实施方式中,分析物捕获剂在不同时间被引入分析物和捕获探针。在一些实施方式中,在引入生物样品之前,空间标记的分析物捕获剂从捕获探针变性。在一些实施方式中,在空间标记的分析物捕获剂从捕获探针变性之前,空间标记的分析物捕获剂与生物样品内的生物分析物结合。在一些实施方式中,捕获探针在附着到空间标记的分析物捕获剂上时从基材上切割。在一些实施方式中,一旦捕获探针的捕获域与分析物结合部分条形码结合,分析物捕获序列就向3’尾延伸,以包括与捕获探针空间条形码的序列互补的序列(例如,产生空间标记的分析物捕获剂)。
例如,可以将分析物捕获剂引入生物样品,其中分析物结合部分与目标分析物结合,然后可以处理生物样品以从样品释放结合分析物的分析物捕获剂。结合分析物的分析物捕获剂然后可以迁移并结合到捕获探针捕获域,并且结合分析物的捕获试剂条形码结构域可以被延伸以在捕获试剂条形码结构域的末端产生空间条形码互补物。结合分析物的空间标记的分析物捕获剂可以从捕获探针变性,并使用本文所述的方法进行分析。
在另一个例子中,分析物捕获剂可以与捕获探针阵列上的捕获探针捕获域杂交,其中捕获剂条形码结构域被延伸为包括与捕获探针的空间条形码互补的序列。生物样品可以与分析物捕获剂修饰的捕获探针阵列接触。来自生物样品的分析物细胞可以从样品中释放,迁移到分析物捕获剂修饰的捕获探针阵列,并被分析物结合部分捕获。结合分析物的分析物捕获剂的捕获剂条形码结构域可以从捕获探针变性,并且生物样品可以根据本文所述的方法解离和空间处理。
在一些实施方式中,空间标记的分析物捕获剂可以通过亲脂性连接和共价连接的组合附着到细胞的表面。例如,空间标记的分析物捕获剂可以包括附着到脂质以将寡核苷酸靶向细胞膜的寡核苷酸,以及可以通过本文所述的任何数量的化学物质共价连接到细胞表面蛋白的胺基。在这些实施方式中,脂质可以增加寡核苷酸的表面浓度并且可以促进共价反应。
(c)在生物样品中生成图像数据
本公开的特征在于用于确定生物样品中免疫细胞浸润的方法,所述生物样品包括对象中的一个或多个癌性区域和一个或多个基质区域,其中所述方法包括生成图像数据。在一些实施方式中,图像数据来自一个或多个癌性区域的癌性区域或与所述癌性区域相关的分析物;来自生物样品中的一个或多个基质区域的基质区域或与所述基质区域相关的分析物;和/或所述癌性区域和/或基质区域中的一个或多个免疫细胞或与免疫细胞相关的分析物。在该方法包括生成图像数据的一些实施方式中,该方法包括确定一个或多个癌症区域或与癌性区域相关的分析物;一个或多个基质区域或与基质区域相关的分析物;以及一个或多个免疫细胞或与免疫细胞相关的分析物的丰度;从而确定生物样品中的免疫细胞浸润。
在一些实施方式中,使用包括获得生物样品的图像的方法来生成图像数据;以及将图像数据登记到空间位置。在一些实施方式中,该方法包括基于图像数据识别(1)一个或多个癌性区域;和/或(2)一个或多个基质区域。在一些实施方式中,该方法还包括基于图像数据识别一个或多个免疫细胞。在一些实施方式中,获得生物样品的图像;以及将图像数据登记到空间位置。在一些实施方式中,还包括通过经过训练的机器学习模块识别一个或多个癌性区域和一个或多个基质区域。在一些实施方式中,该方法还包括通过经过训练的机器学习模块识别一个或多个免疫细胞。
在一些实施方式中,确定生物样品中免疫细胞的丰度包括:识别一个或多个癌症区域,包括:获取图像并将图像数据登记到空间位置,使用所确定序列的空间位置,或获取图像并把图像数据登记至空间位置,并且使用所确定的序列的空间位置;识别所述一个或多个基质区域,包括:获得图像并将图像数据登记到空间位置,使用所确定的序列的空间位置,或者获得图像并将图像数据登记到空间位置,并且使用所述所确定序列的空间位置;以及识别一种或多种免疫细胞浸润物的丰度,包括:获得图像并将图像数据登记到空间位置,使用所确定序列的空间位置,或者获得图像将图像数据登记到空间位置,并使用所确定的序列的空间位置。
在一些实施方式中,确定免疫细胞浸润的方法包括确定生物样品中免疫细胞的丰度。在一些实施方式中,生物样品中免疫细胞的丰度包括生物样品中细胞的约5%、约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%或约50%。在一些实施方式中,生物样品中免疫细胞的丰度包括癌症区域中细胞的约5%、约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%或约50%。在一些实施方式中,生物样品中免疫细胞的丰度包括基质区域中细胞的约5%、约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%或约50%。
在一些情况下,癌性区域和/或基质区域的生物标志物可用于确定癌性区域和/或基质区域。在某些情况下,可以使用免疫组织化学或免疫荧光来检测这些感兴趣的区域。在某些情况下,Pan-CK可以用于检测癌性区域。在某些情况下,CD45可用于检测基质区域。生物标志物(例如,蛋白质)检测的任何方法都可以用于确定感兴趣的区域,包括但不限于免疫荧光(即,使用一级和任选的二级抗体来观察生物标志物)。在一些情况下,本文提供了分别检测Pan-CK或CD45与癌性标志物或基质生物标志物的表达重叠的方法。在一些情况下,与Pan-CK表达重叠的癌性标志物包括PRKCI、VTCN1、MECOM、TOP2A、SHDH、XPO1、TFRC、FUT8、SOX17、PBX1、EIF42和WT1。与免疫浸润细胞相关的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。在一些情况下,与Pan-CK表达重叠的癌性标志物包括VTCN1、MECOM、TOP2A、XPO1、FUT8、SOX17、PBX1、EIF42和WT1。与免疫浸润细胞相关的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。
在一些实施方式中,所述确定包括与经每空间位置细胞数量归一化的已知管家相比,鉴定与免疫浸润细胞相关的基因的量。在一些实施方式中,所述确定包括鉴定一种或多种肿瘤浸润淋巴细胞(TIL)与一种或多种肿瘤浸润B细胞(TIB)的比率。在一些实施方式中,所述确定包括基于包括与免疫浸润细胞相关的分析物的空间位置的百分比来计算生物样品中肿瘤浸润免疫细胞的丰度。
在一些实施方式中,一个或多个癌性区域的识别包括从图像数据中划分癌性区域。在一些实施方式中,一个或多个基质区域的识别包括从图像数据中划分基质区域。在一些实施方式中,一个或多个免疫细胞的识别包括从图像数据中划分免疫细胞。在一些实施方式中,使用划分和(i)获取图像并将图像数据登记到空间位置,(ii)使用所确定序列的空间位置,或(iii)获取图像并且将图像数据登记到空间位置,并使用所确定的序列的空间位置来确定癌症基质区域中的免疫细胞的丰度。
如本文所用,术语“划分”可以指将生物样品划分成多个区段(例如,但不限于,部分、分区、感兴趣区域和单个细胞)的过程。“分段”和“划分”可以互换使用。在一些实施方式中,划分包括确定一个或多个生物区段(例如,一个或多个癌性区域、一个或多个基质区域和一个或多个免疫细胞)的边界。在某些情况下,可以使用基因或蛋白质表达数据和/或使用经过训练的机器学习模块手动进行划分(例如,由病理学家进行视觉检查)。
(d)载玻片、生物样品和分析物
本公开的特征在于一种使用包括多个捕获探针的基材(例如,第一基材)来确定生物样品中免疫细胞浸润的方法,其中所述多个捕获探针中的捕获探针包括捕获域但不包括空间条形码。在一些实施方式中,捕获探针在5’端被固定到基材上。在一些实施方式中,多个捕获探针均匀地分布在基材的表面上。在一些实施方式中,多个捕获探针位于基材的表面上,但不根据图案分布在基材上。在一些实施方式中,基材(例如,第二基材)包括多个捕获探针,其中多个捕获探针中的捕获探针包括捕获域和空间条形码。
在一些实施方式中,捕获域包括与分析物或分析物衍生分子至少部分互补的序列。在一些实施方式中,捕获探针的捕获域包括聚(T)序列。在一些实施方式中,捕获域包括功能域。在一些实施方式中,所述功能结构域包括引物序列。在一些实施方式中,捕获探针包括切割结构域。在一些实施方式中,切割结构域包括可切割的接头,其选自可光切割接头、可UV切割接头,可酶切割接头或pH敏感的可切割接头。
在一些实施方式中,生物样品包括FFPE样品。在一些实施方式中,生物样品包括组织切片。在一些实施方式中,生物样品包括新鲜冷冻样品。在一些实施方式中,生物样品包括活细胞。
在一些实施方式中,生物样品包括脑组织、脊髓组织、皮肤组织、脂肪组织、肠组织、结肠组织、宫颈组织、阴道组织、肌肉组织、心脏组织、肝组织、胰腺组织、肾组织、脾脏组织、淋巴结组织、骨髓组织、软骨组织、视网膜组织、角膜组织、乳房组织、前列腺组织、膀胱组织、气管组织、肺组织、子宫组织、胃组织、甲状腺组织、胸腺组织或其组合。在一些实施方式中,生物样品从活检物中获得。活检样品的非限制性示例包括:核心针活检和细针抽吸。在一些实施方式中,生物样品是从外科切除术中获得的。在一些实施方式中,在内窥镜检查或阴道镜检查期间收集生物样品。在一些实施方式中,在内窥镜检查或结肠镜检查期间收集生物样品。在一些实施方式中,生物样品或包括脑脊液、全血、血浆和/或血清。
在一些实施方式中,生物样品(例如,参考生物样品或测试生物样品)是先前已被鉴定为包括癌性组织的样品。在生物样品先前已识别为包括癌性组织的一些实施方式中,生物样品代表癌症的特定阶段(例如,包括肿瘤大小T1、T2、T3或T4的肺癌阶段)。
本文提供的方法可应用于分析物或分析物衍生的分子,包括但不限于第二链cDNA分子(“第二链”)。在一些实施方式中,分析物或分析物衍生的分子包括RNA和/或DNA。在一些实施方式中,分析物是蛋白质。
本公开的特征在于用于确定生物样品中免疫细胞浸润的方法,其中所述方法包括确定与免疫浸润细胞相关的分析物的丰度和/或空间位置。与免疫浸润细胞相关的分析物的非限制性实例包括:BLK、CD19、FCRL2、MS4A1、KIAA0125、TNFRSF17、TCL1A、SPIB、PNOC、PTRPC、PRF1、GZMA、GZMB、NKG7、GZMH、KLRK1、KLRB1、KLRD1、CTSW、GNLY、CCL13、CD209、HSD11B1、LAG3、CD244、EOMES、PTGER4、CD68、CD84、CD163、MS4A4A、TPSB2、TPSAB1、CPA3、MS4A2、HDC、FPR1、SIGLEC5、CSF3R、FCAR、FCGR3B、CEACAM3、S100A12、KIR2DL3、KIR3DL1、KIR3DL2、IL21R、XCL1、XCL2、NCR1、CD6、CD3D、CD3E、SH2D1A、TRAT1、CD3G、TBX21、FOXP3、CD8A、CD8B、CD79A、CD79B、CD4、IGHA1、IGHG2、JCHAIN、IGKC、CD27、CD38、CD16、IL17RB、FANK1、CTLA4、MSR1、MRC1、NKG7、FCN1和TIGIT/LAG3。与免疫浸润细胞相关的分析物的非限制性实例还可以包括此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。在一些实施方式中,确定生物样品中免疫细胞浸润的方法包括识别与生物样品中的免疫浸润细胞相关的分析物的丰度和/或空间位置,包括确定管家分析物的丰富度和/或空间位置。可用于本文所述方法的管家分析物的非限制性实例如Eisenberg等,Trends in Genetics,29(10):569-574(2013)和Waxman等,BMC Genomics,8:243(2007)中所述,每种分析物的全部内容通过引用并入本文。在一些实施方式中,管家分析物可以包括但不限于甘油醛-3-磷酸脱氢酶(GAPDH)、TATA结合蛋白(TBP)和核糖体蛋白(RP)。在一些实施方式中,该方法包括鉴定生物样品中(例如,在一个或多个癌性区域中)与免疫浸润细胞相关的一种或多种分析物与管家分析物的比率。
本发明的特征在于确定免疫细胞是肿瘤浸润淋巴细胞(TIL)(例如T细胞)和/或B细胞(TIB)(例如,本文所述的任何示例性B细胞,包括浆细胞)的癌症患者的癌症基质中免疫细胞浸润的方法。TIL的非限制性实例如Guo等所述(J.Oncol.,doi:10.1155/2019/2592419(2019),其全部内容通过引用并入本文。
在一些实施方式中,TIL选自:(i)CD3+和CD4+T细胞;(ii)CD3+和CD8+T细胞;(iii)调节性T细胞,其包含CD4、Foxp3、IL17RB、CTLA4、FANK1、HAVCR1、CD25、CTLA-4、GITR、LAG-3和CD127中的一种或多种;(iv)TH1细胞,其包含CD4、CD3D、S100A4、IL7R和IFNG中的一种或多种;(v)TH2细胞,其包含CD4、IL7R、ICOS、CTLA4、TNFRSF4和TNFRS18中的一种或多种;(vi)TH17细胞,其包含CD4、CD3D、IL17A、GZMA和S100A4中的一种或多种;和(vii)细胞毒性T细胞,其包含CD8、CD3D、S100A4、IFNG、GZMB、GZMA和IL2RB中的一种或多种。
在一些实施方式中,肿瘤浸润B细胞(TIB)选自:(i)浆细胞,其包含MZB1、IGLL5、IGHA1、IGHG1、JCHAIN、IGKC、IGHA2、IGLC2、IGLV3-1和IGLV2-14中的一种或多种;(ii)Ig+B细胞,其包含IGHV3-74、SOCS3、JCHAIN和SPARC中的一种或多种;(iii)活化的B细胞,其包含CD79B、HMGB2、HMGB1、HMGN1和RGS13;和(iv)B细胞,其包含MEF2B、RGS13和MS4A1中的一种或多种。
本公开的特征在于鉴定浸润免疫细胞的丰度和/或空间位置的方法,其中浸润免疫细胞包括但不限于适应性免疫细胞(例如,T细胞或B细胞)和先天免疫细胞(如,自然杀伤(NK)细胞、巨噬细胞(例如,肿瘤相关巨噬细胞(TAM))、单核细胞和树突状细胞(DC))。浸润细胞的非限制性实例如Zhang等(Cellul.Mol.Immuno.,17:808-821(2020))中所述,其全文通过引用并入本文。
在一些实施方式中,免疫浸润细胞是NK细胞。NK细胞是先天性淋巴细胞,在宿主抵抗肿瘤生长的免疫反应中发挥作用。NK细胞可以包括Melaiu等,Front.Immunol.,10:1-18(2020)和Zhang等,Front.Immunol.11:1242(2020)中所述的属性,其全部内容通过引用并入本文。肿瘤浸润NK细胞的存在与多种人类实体瘤的良好预后有关。在一些实施方式中,NK细胞与NKG7分析物相关联。
在一些实施方式中,使用本文公开的方法鉴定的浸润性免疫细胞包括但不限于幼稚B细胞、记忆性B细胞、浆细胞(例如,浆细胞的标志物包括但不局限于CD79A、CD79B、CD38、CD27、MZB1、IGHA1、IGHG1、JCHAIN和IGKC)CD8 T细胞、CD4幼稚T细胞、CD4记忆-静息T细胞、CD4记忆-活化T细胞、滤泡辅助性T细胞、调节性T细胞(Treg)(例如,Treg的标志物包括但不限于FOXP3、IL17RB、CTLA4、FANK1和CD4)、γ-A T细胞、静息NK细胞、活化NK细胞、单核细胞、M0巨噬细胞、M1巨噬细胞、M2巨噬细胞、组织相关巨噬细胞(TAM)(例如,TAM的标志物包括但不限于CD163、MSR1和MRC1)、静息树突细胞、活化树突细胞、静息肥大细胞、活化肥大细胞、嗜酸性粒细胞、中性粒细胞及其任何组合。
在一些实施方式中,单核细胞标志物可以包括但不限于CD14、CD16和FCN1或其任何组合。在一些实施方式中,T细胞标志物包括但不限于CD3D、CD3E和CD4或其任何组合。在一些实施方式中,个体T细胞标志物包括但不限于CD4、CD8、TIGIT和LAG3。在一些实施方式中,B细胞标志物包括但不限于CD19、CD79A和CD79B或其任何组合。在一些实施方式中,癌症标志物可以包括但不限于BRCA1和BRCA2或其任何组合。
在一些实施方式中,该方法还包括鉴定生物样品中一种或多种TIL与一种或多种TIB的比率。本领域技术人员将理解覆盖TIB与TIL的反比的比率。TIL与TIB的比率可以包括生物样品内感兴趣区域的比率。在某些情况下,感兴趣区域可以包括生物样品。可以针对生物样品计算TIL与TIB的一个或多个比率。例如,两个或更多个感兴趣区域中的每个感兴趣区域都包括TIL与TIB的比率。在一些实施方式中,TIL与TIB的比率可以与预后结果相关。
在一些实施方式中,该方法还包括鉴定生物样品中一种或多种肿瘤浸润T细胞与一种或多种TIB的比率。本领域技术人员将理解覆盖TIB与肿瘤浸润T细胞的反比的比率。肿瘤浸润T细胞与TIB的比率可以包括生物样品内感兴趣区域的比率。在某些情况下,感兴趣区域可以包括生物样品。可以针对生物样品计算肿瘤浸润T细胞与TIB的一个或多个比率。例如,两个或更多个感兴趣区域中的每一个均包括肿瘤浸润T细胞与TIB的比率。在一些实施方式中,肿瘤浸润T细胞与TIB的比率可以与预后结果相关。
在一些实施方式中,该方法还包括鉴定生物样品中一个或多个TIL和/或一个或多个TIB与一个或多个基质区域和/或一个癌性区域的比率。本领域技术人员将理解覆盖基质区域和/或癌性区域与TIL和/或TIB的反比的比率。TIL和/或TIB与基质区域和/或癌性区域的比率可以包括生物样品内感兴趣区域的比率。在某些情况下,感兴趣区域可以包括生物样品。在一些情况下,可以为生物样品计算TIL和/或TIB与基质区域和/或癌性区域的一个或多个比率。例如,两个或更多个感兴趣区域中的每一个均包括TIL和/或TIB与基质区域和/或癌性区域的比率。在一些实施方式中,TIL和/或TIB与基质区域和/或癌性区域的比率可以与预后结果相关。
在一些实施方式中,用于确定免疫细胞浸润的方法包括识别与癌性区域相关的分析物的丰度和/或空间位置。与癌性区域相关的分析物的非限制性实例包括:SCGB2A1、MKI67、BRCA1、BRCA2、PIKCD、CALML6、MYC、TP53、PALB2、RAD51和/或MSH2。与免疫浸润细胞相关的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。与癌性区域相关的分析物的其他非限制性实例包括(除了本段中先前列出的标志物之外/与该段中先前列出的标志物组合)SCGB2A1、MKI67、BRCA1、BRCA2、PIK3CD和/或CALML6。与免疫浸润细胞相关的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。在一些情况下,与癌性区域相关的分析物的其他非限制性实例包括(除了本段中先前列出的标志物之外/与本段中先前列出的标志物结合)PRKCI、VTCN1、MECOM、TOP2A、SHDH、XPO1、TFRC、FUT8、SOX17、PBX1、EIF42和/或WT1。与免疫浸润细胞相关的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。在一些情况下,与癌性区域相关的分析物的其他非限制性实例包括(除了本段中先前列出的标志物之外/与本段中先前列出的标志物组合)VTCN1、MECOM、TOP2A、XPO1、FUT8、SOX17、PBX1、EIF42和WT1。与免疫浸润细胞相关的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。
此类分析物的其它非限制性实例描述于https://www.cancer.gov/about-cancer/diagnosis-staging/diagnosis/tumor-markers-list,其全部内容通过引用纳入本文。在一些实施方式中,与癌性区域相关的分析物选自包括来自AKT途径的分析物、来自JAK-STAT途径的分析物和来自Notch途径的分析物的组。
在一些实施方式中,用于确定免疫细胞浸润的方法包括识别与基质区域相关的分析物的丰度和/或空间位置。与基质区域相关的分析物的非限制性实例包括:VIM、EPCAM、FAP和CDH1。与免疫浸润细胞相关的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。与基质区域相关的分析物的其他非限制性实例包括:FAP、VCAN、ACTA2和PDGFRB。与免疫浸润细胞相关的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。
在一些实施方式中,该方法包括鉴定上皮细胞粘附分子(EPCAM;NCBI基因ID:4072)和波形蛋白(VIM;NCBI基因组ID:7431)的表达。在一些实施方式中,该方法包括与相同生物样品的其他区域中的相同基因的表达相比,鉴定EPCAM的上调(例如,过表达)和VIM的下调(例如,低表达)。在一些实施方式中,该方法包括与相同生物样品的其他区域中的相同基因的表达相比,鉴定VIM的上调(例如,过表达)和EPCAM的下调(例如,低表达)。在一些情况下,本文公开的任何一种或组合或癌性或基质生物标志物可以使用本文公开的空间方法在EPCAM或VIM表达的位置处确定。
在一些实施方式中,该方法包括鉴定上皮细胞粘附分子(EPCAM;NCBI基因ID:4072)和成纤维细胞活化蛋白(FAP;NCBI基因ID:2191)的表达。在一些实施方式中,该方法包括与相同生物样品的其他区域中的相同基因的表达相比,鉴定EPCAM的上调(例如,过表达)和FAP的下调(即,低表达)。在一些实施方式中,该方法包括与相同生物样品的其他区域中的相同基因的表达相比,鉴定FAP的上调(例如,过表达)和EPCAM的下调(例如,低表达)。在一些情况下,本文公开的任何一种或组合或癌性或基质生物标志物可以使用本文公开的空间方法在EPCAM或FAP表达的位置处确定。
在一些实施方式中,该方法包括鉴定VIM、CDH1和FAP的表达。在一些情况下,可以使用本文公开的空间方法在EPCAM、CDH1或VIM表达的位置处确定本文公开的任何一种或组合或癌性或基质生物标志物。
在一些实施方式中,该方法包括鉴定C型蛋白酪氨酸磷酸酶受体(CD45;NCBI基因ID 5788)的表达。在一些实施方式中,该方法包括CD45多肽的上调(例如,过表达)。在一些情况下,该方法包括CD45多肽的下调(例如,低表达)。在一些实施方式中,该方法包括鉴定人角蛋白(例如,使用广谱细胞角蛋白抗体或抗原结合片段)。在某些情况下,使用广谱细胞角蛋白抗体或抗原结合片段检测角蛋白可用于区分上皮性肿瘤和非上皮性肿瘤。可被识别的角蛋白的非限制性实例包括:I型或LMW细胞角蛋白、碱性(II型或HMW)细胞角蛋白(例如CK1、CK3、CK4、CK5、CK6、CK8、CK10、CK14、CK15、CK16和CK19)。CD45是一种泛白细胞标志物,存在于肿瘤切片的基质中,可作为肿瘤基质的标志物。在一些实施方式中,用于确定免疫细胞浸润的方法包括鉴定与肿瘤基质区域相关的分析物的丰度和/或空间位置。在一些实施方式中,分析物是CD45。
在一些实施方式中,该方法还包括使生物样品与一种或多种染色剂接触。在一些实施方式中,一种或多种染色剂包括组织学染色剂(例如,本文所述或本领域已知的任何组织学染色)。在一些实施方式中,一种或多种染色剂包括苏木精和伊红。在一些实施方式中,一种或多种染色剂包括一种或多种光学标记(例如,本文所述的任何光学标记)。在一些实施方式中,所述一种或多种光学标记选自:荧光标记、放射性标记、化学发光标记、量热标记或比色标记。
在一些实施方式中,该方法还包括使用生物样品的一种或多种染色剂来识别生物样品中的一个或者多个癌性区域。在一些实施方式中,该方法还包括使用生物样品的一种或多种染色剂识别一个或多个癌性区域内的一个或多个基质区域。
在一些实施方式中,该方法还包括基于生物样品中TIL的丰度和/或位置来确定对象中癌症的预后。
在一些实施方式中,该方法还包括基于生物样品中TIL的丰度和/或位置对对象的癌症严重程度进行评分或确定。
(e)治疗方法
在一些实施方式中,所述方法可以进一步包括为对象选择治疗。在一些实施方式中,所述方法可进一步包括对对象实施癌症治疗。在一些实施方式中,癌症的治疗可以是降低癌症进展速度的治疗。在一些实施方式中,癌症的治疗可以包括手术、放射治疗、化疗、靶向药物治疗和肿瘤治疗场(TTF)治疗。
在一些情况中,本文公开的方法包括使用一种或多种治疗剂治疗患有癌症的对象。治疗剂的实例包括但不限于,例如,化学治疗剂、生长抑制剂、细胞毒剂、放射治疗用剂、抗血管生成剂、癌症免疫治疗剂、凋亡剂、抗微管蛋白剂和治疗癌症的其他药剂(例如抗体),例如抗HER-2抗体、抗CD20抗体、表皮生长因子受体(EGFR)拮抗剂(例如酪氨酸激酶抑制剂)、HER1/EGFR抑制剂(例如埃洛替尼血小板衍生生长因子抑制剂(例如 (甲磺酸伊马替尼))、COX-2抑制剂(例如塞来昔布)、干扰素、CTLA-4抑制剂(例如抗CTLA抗体易普利木单抗/>)、PD-1抑制剂(例如,抗PD-1抗体,BMS-936558),PD-L1抑制剂(例如,抗PD-L1抗体,MPDL3280A)、PD-L2抑制剂(例如抗PD-L2抗体)、TIM3抑制剂(例如抗TIM3抗体)、细胞因子、与以下靶标中的一个或多个结合的拮抗剂(例如,中和抗体):ErbB2、ErbB3、ErbB4、PDGFRβ、BlyS、APRIL、BCMA、PD-1、PD-L1、PD-L2、CTLA-4、TIM3或VEGF受体、TRAIL-Apo2,以及其他生物活性和有机化学试剂等。在某些情况下,治疗或疗法包括手术、化疗剂、生长抑制剂、细胞毒剂、放射治疗用剂、抗血管生成剂、癌症免疫治疗剂、凋亡剂、抗微管蛋白剂或其组合。
在某些情况下,化疗剂被提供给患有癌症的患者作为治疗。非限制性示例性化疗剂包括用于调节或抑制激素对癌症的作用的抗激素剂,例如抗雌激素和选择性雌激素受体调节剂(SERM),包括例如他莫昔芬(包括他莫昔芬)、雷洛昔芬、屈洛昔芬、4-羟基三苯氧酯、三苯氧烯、雷洛昔芬、LY117018、奥那普利斯通和/>托雷米芬;抑制芳香化酶的芳香化酶抑制剂,芳香化酶调节肾上腺中雌激素的产生,例如,4(5)-咪唑、氨基谷丙酰胺、/>甲地孕酮乙酸酯、/>依西美坦、福美斯坦、法屈唑、/>伏罗唑、/>来曲唑和/>阿那曲唑;以及抗雄激素,如氟他胺、尼罗他胺、比卡鲁他胺、亮丙瑞林和戈瑟林;以及曲卡他滨(1,3-二氧戊环核苷胞嘧啶类似物);反义寡核苷酸,特别是那些抑制与异常细胞增殖有关的信号途径中的基因表达的反义寡核苷酸(例如PKCα、Ralf和H-Ras);核酶如VEGF表达抑制剂(例如/>核酶)和HER2表达抑制剂;疫苗,例如基因治疗疫苗,例如/>疫苗、/>疫苗和/>疫苗;rIL-2;/>拓扑异构酶1抑制剂;/>rmRH;以及上述任何一种的药学上可接受的盐、酸或衍生物。
在一些实施方式中,对肿瘤病灶局部给予放射治疗,以增强对象肿瘤的局部免疫原性(例如,辅助放射)和/或杀死肿瘤细胞(例如,消融放射)。在某些情况下,对对象进行全身放射治疗。在某些情况下,放射治疗是断层治疗、立体定向放射、调强放射治疗(IMRT)、低划分放射治疗、缺氧引导放射治疗和/或质子治疗。在某些情况下,辐射后给予第二种治疗(例如化疗、免疫疗法)。在一些情况下,辐射与第二种治疗(例如化疗、免疫疗法)的给药同时提供。
在一些情况下,上述治疗剂中的任何一种是在其他治疗模式之前、基本上同时或之后提供的,例如手术、化疗、放射治疗或生物制剂(如另一种治疗性抗体)的给药。在一些实施方式中,在选自手术、化疗和放射治疗或其组合的治疗后,癌症复发或进展。
在一些情况中,如本文所讨论的,为了治疗癌症,抗体与一种或多种其他抗癌剂(例如化疗剂、生长抑制剂、抗血管生成剂和/或抗肿瘤组合物)一起给与。化疗剂、生长抑制剂、抗血管生成剂、抗癌剂和抗癌组合物的非限制性示例。
在一些实施方式中,所述方法可进一步包括用癌症诊断更新对象的临床记录。在一些实施方式中,所述方法可以进一步包括将对象纳入临床试验。在一些实施方式中,所述方法可以进一步包括将诊断告知对象的家属。在一些实施方式中,所述方法可以进一步包括评估或推荐对象加入支持性护理计划或护理机构。在一些实施方式中,所述方法可以进一步包括更频繁地监测对象。
在一些实施方式中,所述方法可进一步包括监测所识别的对象的癌症症状的发展。在一些实施方式中,所述方法可进一步包括在所识别对象的临床记录中记录对象发生癌症的可能性增加。在一些实施方式中,所述方法还可以包括通知对象的家属对象发生癌症的可能性或敏感性增加。
在一些实施方式中,所述方法可进一步包括向对象给与治疗以降低进展速度或降低发生癌症的可能性。在一些实施方式中,癌症的治疗可以包括手术、放射治疗、化疗、手术、放射疗法、化疗、靶向药物治疗和肿瘤治疗场(TTF)治疗。在一些实施方式中,可测试对象是否存在已知与癌症风险相关的基因突变。
在一些实施方式中,所述方法可以进一步包括执行一个或多个测试以进一步确定对象患癌症的风险。进一步确定对象患癌症风险的更多测试的非限制性示例包括检测与癌症相关的基因突变(例如,与1型神经纤维瘤病、Turcot综合征或Li-Fraumeni综合征相关的突变),确定其他生物标志物(例如脑组织、脑脊液或血液或其成分中的生物标志物)的水平表明癌症发病风险增加,也表明癌症发病风险增加。
在一些实施方式中,所述方法可进一步包括更新对象的临床记录以指示发生癌症的风险增加。在一些实施方式中,所述方法可进一步包括将对象纳入临床试验(例如,用于早期治疗和/或预防癌症)。在一些实施方式中,所述方法可进一步包括告知对象的家属对象发生癌症的可能性。在一些实施方式中,所述方法可以进一步包括更频繁地监测对象。
在某些实施例中,根据本文所述方法治疗的癌症包括但不限于前列腺癌症、乳腺癌症、肺癌、结直肠癌、黑色素瘤、支气管癌症、膀胱癌症、脑或中枢神经系统癌症、周围神经系统癌症、子宫或子宫内膜癌症、口腔或咽部癌症、非霍奇金淋巴瘤、甲状腺癌症、肾癌症、胆道癌症、小肠或阑尾癌症、唾液腺癌症、甲状腺癌症、肾上腺癌症、鳞状细胞癌症、间皮瘤、骨癌、甲状腺/胸腺癌、胶质母细胞瘤、骨髓增生异常综合征、软组织肉瘤、DIPG、腺癌、骨肉瘤、软骨肉瘤、白血病或胰腺癌症。在一些实施方式中,根据本文所述方法治疗的癌症包括癌(例如腺癌)、淋巴瘤、母细胞瘤、黑色素瘤、肉瘤或白血病。在某些实施例中,根据本文所述方法治疗的癌症包括鳞状细胞癌症、小细胞癌症、非小细胞肺癌、胃肠道癌症、霍奇金淋巴瘤、非霍奇金淋巴瘤、胰腺癌症、胶质母细胞瘤、胶质瘤、宫颈癌症、卵巢癌症、肝脏癌症(例如,肝癌和肝细胞瘤)、膀胱癌症、乳腺癌症、炎性乳腺癌、梅克尔细胞癌、结肠癌、结直肠癌、胃癌、膀胱癌症、子宫内膜癌、骨髓瘤(如多发性骨髓瘤)、唾液腺、癌、肾癌(如肾细胞癌和威尔姆斯瘤)、基底细胞癌、黑色素瘤、前列腺癌症、外阴癌症、甲状腺癌症、睾丸癌症、食管癌症、浆液腺癌或各种类型的头颈部癌症。在某些实施例中,根据本文所述方法治疗的癌症包括结缔组织增生性黑色素瘤、炎性乳腺癌症、胸腺瘤、直肠癌、肛门癌症或可手术治疗或非手术治疗的脑干胶质瘤。
(f)试剂盒和系统
在一些实施方式中,本文还提供了包括一种或多种试剂的试剂盒,所述试剂用于检测如本文所述的与癌性区域和一个或多个基质区域相关的任何细胞和/或生物标志物中的一种或多种的水平。在一些实施方式中,本文还提供了包括一种或多种试剂的试剂盒,所述试剂用于检测如本文所述的与癌性区域和一个或多个基质区域相关的任何细胞和/或生物标志物中的一种或多种的水平。
在一些实施方式中,试剂可以包括一种或多种抗体(和/或抗原结合抗体片段)、标记的杂交探针和引物。例如,在一些实施方式中,抗体(和/或抗原结合抗体片段)可用于可视化组织样品的一个或多个特征(例如,通过使用免疫荧光或免疫组织化学)。在一些实施方式中,抗体(和/或抗原结合抗体片段)可以是分析物结合部分,例如作为分析物捕获剂的部分。例如,在一些实施方式中,试剂盒可以包括抗PMCH抗体,例如产品编号HPA046055(AtlasAntibodies),目录号PA5-25442、PA5-84521、PA5-83802(ThermoFisherScientific)或产品编号AV13054(MilliporeSigma)。其他有用的市售抗体对于本领域技术人员来说是显而易见的。
在一些实施方式中,标记的杂交探针可用于一种或多种生物标志物和/或候选生物标志物的原位测序。在一些实施方式中,引物可用于扩增(例如克隆扩增)捕获的寡核苷酸分析物。
在一些实施方式中,试剂盒可以进一步包括用于执行本文提供的任何方法或步骤的说明书。在一些实施方式中,试剂盒可以包括具有一个或多个捕获探针的基材,所述捕获探针包括空间条形码和与来自组织样品的生物分析物结合的捕获域,以及用于检测生物分析物的试剂,其中所述生物分析物是本公开的任何生物标志物。在一些实施方式中,试剂盒进一步包括但不限于一种或多种抗体(和/或抗原结合抗体片段)、标记的杂交探针、引物或其任何组合,用于观察组织样品的一个或多个特征。
本文还描述了包括一个或多个存储元件(例如,一个或多个存储设备)和一个或多个处理器的系统。存储元件可以存储多个生物样品的数据集。对于每个生物样品,数据集可以包括在参考生物样品的多个空间位置捕获的多个分析物的分析物数据。数据集可以进一步包括生物样品的图像数据。此外,数据集可以包括根据参考生物样品的空间位置链接到分析物数据的成像数据的登记数据。生物样品可以包括参考生物样品中的一个或多个癌性区域、一个或多个癌性区域内的一个或多个基质区域、和/或一个或多个肿瘤浸润淋巴细胞(TIL)。处理器可以通过机器学习模块处理数据集,以训练机器学习模块,从而确定生物样品中的免疫细胞浸润。
实施例
实施例1-生物样品中肿瘤浸润淋巴细胞的检测
本实施例提供了确定测试生物样品的癌症基质中免疫细胞浸润的示例性方法。在非限制性示例中,将测试生物样品与包括多个捕获探针的基材接触,其中所述多个捕获探针中的捕获探针包括空间条形码。生物样品被透化,并且使来自测试生物样品的分析物与捕获探针杂交。捕获探针被延伸,并且产生包括分析物序列或其互补物的第二链。
与分析物相对应的序列的全部或部分,或其互补物,以及(ii)与空间条形码相对应的测序的全部或部分,或其互补物,和(i)和(ii)的所确定序列用于识别测试生物样品中分析物的丰度和/或空间位置。
在包括多个生物样品的数据集上训练机器学习模块。机器学习模块在生物样品包括以下数据的数据上进行训练:(i)从生物样品中的多个空间位置捕获的多个分析物的分析物数据;(ii)图像数据,所述图像数据包括所述生物样品的多个空间位置的图像;以及(iii)将分析物数据链接到图像数据的登记数据。所述多个生物样品包括参考生物样品,其中参考生物样品包括:(1)参考生物样品中的一个或多个癌性区域,(2)一个或多个癌性区域中的零或一个或多个基质区域,和(3)零或一个或多个免疫浸润细胞。根据图7所示的过程,使用数据集对机器学习模块进行训练,从而产生经过训练的机器学习模块。经过训练的机器学习模块然后用于至少部分基于测试生物样品中分析物的丰度和/或位置来确定生物样品中的免疫细胞浸润。
实施例2-使用基因簇确定浸润免疫细胞
本实施例提供了确定测试生物样品的癌症基质中免疫细胞浸润的示例性方法。使用实施例1中所述的组织检测机器学习模块来识别生物样品内的癌性区域。癌性区域也可以由病理学家通过肉眼或通过确定癌症基因表达特征来识别(例如,使用本文所述或本领域已知的任何方法)。
接下来,使用组织检测机器学习模块、病理学家肉眼或通过确定基质基因表达特征(例如,使用本文所述或本领域已知的任何方法)来识别癌症区域内的基质区域。
测试生物样品与包括多个捕获探针的基材接触,其中所述多个捕获探针中的捕获探针包括空间条形码。生物样品被透化,并且来自测试生物样品的分析物与捕获探针杂交。捕获探针被延伸,并且产生包括分析物序列或其互补物的第二链。
确定与分析物相对应的序列的全部或部分,或其互补物,以及(ii)与空间条形码相对应的序列的全部或部分,或其互补物,并且所确定的序列鉴定与免疫浸润细胞相关的基因簇。基质癌症区域中浸润免疫细胞的丰度按生物样品面积的百分比(0-100%)计算。基质癌症区域中免疫浸润细胞的丰度能预测临床转归。
实施例3-确定卵巢腺癌中免疫细胞浸润物、癌症生物标志物和基质隔室生物标志物的位置
本实施例提供了一种示例性方法,用于使用免疫荧光和空间分析来确定患有癌症的患者的癌症基质中的免疫细胞浸润。生物样品是卵巢的子宫内膜腺癌。根据AJCC/UICC分期,肿瘤为T1N0M0(https://www.cancer.gov/about-cancer/diagnosis-staging/staging),AJCC/UICC阶段组I。卵巢组织切片用广谱细胞角蛋白(Pan-CK)抗体(Biolegend)和/或抗CD45的抗体(Biolegend)和DAPI染色(图8,上图;也见图28B)。Pan-CK用于识别组织切片中的肿瘤隔室,CD45用于识别肿瘤基质隔室。还使用10x Genomics Visium Spatial基因表达平台对组织切片进行基因表达分析(图8,下图)。将空间基因表达数据进行无监督k均值聚类为两个簇。簇1与Pan-CK免疫染色(肿瘤)隔室强相关,而簇2与CD45免疫染色(基质)隔室强相关。参见图28A和图28B。分析基因表达。图28C显示簇1(与Pan-CK免疫染色阳性的肿瘤隔室相关)(热图的顶行)和簇2(CD45免疫染色阳性基质隔室)(热图的底行)中差异表达基因的热图。表1-4列出了来自簇1和簇2的前20个上调和前20个下调的基因。
表1.簇1的前20个上调的基因
表2.簇2的前20个上调的基因
/>
表3.簇1的前20个下调的基因
/>
表4.簇2的前20个下调的基因
/>
将空间基因表达数据进一步进行无监督的基于图的聚类,分为九个簇。如图28D所示,簇1、4、6、7和9与表达Pan-CK的肿瘤隔室相关,簇2、3、5和8与表达CD45的基质隔室相关。图28E是显示每个簇中各种基因的相对基因失调的热图。表5和表6列出了每个簇的前20个上调基因和前20个下调基因(1-9)。
表5.每个簇(1-9)的前20个上调的基因
/>
/>
/>
/>
/>
/>
/>
/>
表6.每个簇(1-9)的前20个下调的基因
/>
/>
/>
/>
/>
/>
/>
如图9所示,Pan-CK染色(左图)与空间测序确定的癌症细胞标志物SCGB2A1、MKi67、BRCA1、BRCA2、PIK3CD和CALML6(右图)的表达相关。
如图10A-10D所示,评估了使用靶向组的基因表达谱的质量和深度。图10A显示了Visium全转录组基因表达文库的点簇。图10B(上图)显示了人免疫学组靶向文库的点簇。图10B的下图显示了本体全转录组分析(WTA)和免疫学靶向分析之间每个基因的log10UMI计数的皮尔逊相关性(R2=0.987)。图10C显示了人类基因特征组靶向文库的点簇。图10C的下图显示了本体全转录组分析(WTA)和基因特征靶向分析之间每个基因的log10UMI计数的皮尔逊相关性(R2=0.987)。图10D显示了人类胰腺癌组靶向库的点簇(7簇,左上;或6簇,右上)。图10D的下图显示了本体全转录组分析(WTA)和泛癌症靶向分析之间每个基因的log10UMI计数的皮尔逊相关性(R2=0.992)。
肿瘤浸润免疫细胞定位的确定
上述方法用于通过部分鉴定测试生物样品中肿瘤浸润T淋巴细胞和肿瘤浸润B细胞(TIB)的丰度和/或位置来确定生物样品中的免疫细胞浸润。使用B细胞标志物CD19、CD79A和/或CD79B的基因表达来检测TIB。使用基因表达T细胞标志物CD3D、CD3E、CD4和/或CD8A检测肿瘤浸润T淋巴细胞。在簇4中观察到B细胞标志物的表达(图11A),并定位于CD45+隔室内的特定区域(图11B),其中在簇4、5和6中观察到T细胞标志物表达(图11C),并存在于整个组织中(图11D)。覆盖有用Pan-CK和CD45染色的组织切片的其他T细胞标志物显示在整个卵巢肿瘤切片中存在T细胞(图12A-12B)。由于肿瘤浸润免疫细胞也可能包括肿瘤浸润单核细胞,单核细胞标志物CD14的空间位置用Pan-CK和CD45染色的组织切片覆盖(图13)。观察特异性T细胞标志物显示CD4的基因表达仅限于簇3(图14,下图)并且存在于整个样品中(图14,上图),并且CD8A的基因表达不富集于任何簇中(图15,下图),而是遍布整个样品(图15,上图)。
上述方法也用于确定生物样品中适应性免疫细胞的存在和/或丰度。血浆B细胞显示聚类在基质隔室的特定区域,表明生物样品中的B细胞对肿瘤有反应。图16A显示了浆细胞标志物的基因表达:CD79A、CD79B、CD38、CD27、MZB1、IGHA1、IGHG1、JCHAIN和IGKC(上图)。图16B显示了JCHAIN的基因表达热图(左下图),图16C显示了CD45在相同组织切片中的表达。使用CD14和CD16(FCGR3A)检测单核细胞(图17A-B),并用DAPI、Pan-CK和CD45的免疫染色覆盖(图17C)。使用FOXP3、IL17RB、CTLA4、FANK1和CD4在样品中鉴定T调节(Treg)细胞(图18,左图),并使用CD163、MSR1和MRC1鉴定肿瘤相关巨噬细胞(TAM)(图18,右图)。使用NKG7鉴定自然杀伤(NK)细胞(图19,左图),并与Pan-CK和CD45染色合并,如图19,中图所示。卵巢肿瘤样品中NK细胞的丰度为5%(计数177个NK条形码),相比之下,乳腺浸润性导管癌样品中为13%(图19,右图))。
肿瘤样品中存在的TIL的不同亚群通过CD4、CD8A和TIGIT/Lag3的存在来指示(图20)。将CD4、CD8A和TIGIT/Lag3基因表达热图与用CD45染色的组织切片合并以显示TIL类型和TIL位置的多样性(图20)。
免疫细胞表达与Pan-CK或CD45共定位。Pan-CK或CD45免疫染色显示于图31A中。如图31B-31K所示,本文的结果显示Pan-CK和CD45的共定位表达与以下的表达:一般T细胞标志物CD3D、CD3E、CD4、CD8A和CD247(图31B);辅助性T细胞标志物CD4(图31C);细胞毒性T细胞标志物CD8A(图31D);Treg细胞的标志物(图31E);B细胞的标志物(图31F);血浆B细胞的标志物(图31G);NK细胞的标志物(图31H)、CD14单核细胞的标志物(图31I);CD16单核细胞的标志物(图31J);和TAM的标志物(图31K)。图31B显示分散在整个Pan-CK和CD45隔室的T细胞,而图31F和31G显示定位于基质隔室的B细胞。这些图像证明了确定与样品中的基质和肿瘤隔室重叠的免疫细胞浸润的能力。
本文所述的方法还用于显示免疫细胞标志物的共表达可以用作免疫细胞共定位的替代物(图21)。
基质细胞定位的确定
利用成纤维细胞活化蛋白(FAP)和钙粘蛋白-1(CDH1)的空间基因表达,在卵巢癌症组织切片中确定基质细胞的丰度和/或位置。在簇4、5和8中观察到FAP表达(图22A),并显示出一些特异性定位(图22B)。CDH1在每个簇中都有表达,这可能是由于其在组织切片中的表达水平(图22C)。图22D显示了CDH1表达和CD45免疫染色的重叠。
此外,还评估了波形蛋白(VIM)和上皮细胞粘附分子(EPCAM)的空间基因表达,以确定基质细胞的丰度和/或空间位置。在每个簇中都观察到VIM表达,这可能是由于其在组织切片中的表达水平(图23A),并且在整个组织中定位。图23B显示了VIM表达和CD45免疫染色的重叠。在每个簇中都观察到EPCAM的表达,这可能是由于其在组织切片中的表达水平(图23C)。图23D显示EPCAM表达和CD45免疫染色的重叠。此外,图30A-30B显示了基质隔室中FAP、VCAN、ACTA2和PDGFRB的基质特异性表达。
簇的表达谱显示簇4中B细胞标志物,簇4-6中T细胞标志物以及每个簇(包括簇4-6)中基质标志物FAP、CDH1、VIM和EPCAM的丰度。这些结果表明卵巢癌症组织切片的基质隔室中的免疫细胞浸润。
癌症基因定位的确定
利用已知在卵巢癌症中表达的基因的空间基因表达,包括但不限于BRCA1、BRCA2、MYC、TP53、PALB2、RAD5,、MSH2、SCGB2A1、MKI67、PIK3CD和CALML6,确定癌细胞在卵巢癌症组织切片中的丰度和/或空间位置。图24A-24B显示BRCA1、BRCA2、MYC、TP53、PALB2、RAD51和MSH2的表达,图29A-29B显示SCGB2A1、MKI67、PIK3CD、BRCA1、BRCA2和CALML6的表达。如图24A-24B和图29A-29B所示,卵巢癌症基因在每个簇中都有表达,并且如预期的那样出现在整个组织中(另参见图9)。特别地,在除了簇4(图24C)之外的每个簇中都观察到MSH2表达,簇4是与B细胞相关的簇,并且如预期的那样定位在整个组织中,但与CD45染色反相关(图24D)。BRCA1不富集于任何簇中,并且用Pan-CK和CD45染色重叠显示主要在癌性区域中定位(图25A-25B,左图)。BRCA2在簇7中富集,并且用Pan-CK和CD45染色重叠显示主要在癌性区域中定位(图25C-25D,右图)。在一项评估与Pan-CK或CD45共同表达癌症基因的平行实验中(图32A),确定了一些簇。如图32B-32D所示,该图中的簇1主要与Pan-CK肿瘤切片重叠,而簇4主要与CD45基质组织切片重叠。将基因表达水平与所有其他簇中的表达进行比较。图32A-32D中的每个点包含大约5000个读数。在簇1中,PRKCI、VTCN1、MECOM、TOP2A(图32C)、SHDH、XPO1(图32D)、TFRC、FUT8、SOX17、PBX1、EIF42和WT1上调,表明这些生物标志物中的每一个都可以用作癌症生物标志物。(例如,卵巢癌症生物标志物)。
本文所述的方法还用于对一组泛癌标志物进行染色,包括与PI3K-AKT信号传导、Jak-STAT信号传导和NOTCH信号传导相关的分析物(图26)。与组织切片的Pan-CK染色的比较显示了癌性区域中每个途径的富集情况(图26)。还将与细胞核、磷蛋白、多态性和细胞过程相关的泛癌基因表达模式与Pan-CK染色进行了比较(图27),以表明该技术作为探索工具的实力。
其他实施方式
应当理解,虽然已经结合本发明的详细描述描述了本发明,但前述描述旨在说明而不是限制本发明的范围,本发明的范围由所附权利要求的范围限定。其他方面、优点和修改都在以下权利要求的范围内。
Claims (77)
1.一种分析生物样品的癌症基质区域中免疫细胞浸润的方法,所述方法包括:
(a)识别所述生物样品中的癌性区域或与所述癌性区域相关的分析物;
(b)识别所述生物样品中的基质区域或与所述基质区域相关的分析物;
(c)识别所述生物样品中的一个或多个位置中的一个或多个免疫细胞或与免疫细胞相关的分析物;和
(d)使用(i)识别的生物样品中的癌性区域和基质区域或与其相关的分析物,以及(ii)识别的一个或多个免疫细胞或与其相关的分析物来分析生物样品的癌症基质区域中的免疫细胞浸润。
2.如权利要求1所述的方法,其中所述识别癌性区域、所述识别基质区域和/或所述识别免疫细胞包括:
(a)从所述生物样品生成数据集,其中所述数据集包括以下的一个或多个:
(i)从生物样品中的多个空间位置捕获的多个分析物的分析物数据;
(ii)包括所述生物样品的多个空间位置的图像的图像数据;和
(iii)将所述分析物数据链接到所述图像数据的登记数据;和
(b)使用所述数据集来识别所述生物样品中的所述癌性区域、所述基质区域和/或所述免疫细胞。
3.如权利要求2所述的方法,其中(b)包括将所述数据集提供给经过训练的机器学习模块,其中所述经过训练的机器学习模块至少部分地经以下训练数据训练:包括来自一个或多个参考样品的参考分析物数据集的训练数据,其中所述一个或多个参考样品包括(1)一个或多个参考癌性区域,(2)一个或多个参考基质区域,和(3)一个或多个参考免疫细胞。
4.如权利要求3所述的方法,其中免疫细胞的丰度通过经过训练的机器学习模块确定。
5.如前述权利要求中任一项所述的方法,其中所述癌性区域包括良性肿瘤、转移前肿瘤、恶性肿瘤和一个或多个炎性细胞中的一种或多种。
6.如前述权利要求中任一项所述的方法,其中所述基质区域包括结缔组织、血管和炎性细胞中的一种或多种。
7.如前述权利要求中任一项所述的方法,进一步包括使所述生物样品透化。
8.如前述权利要求中任一项所述的方法,其中,与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物是核酸。
9.如权利要求8所述的方法,其中所述核酸为RNA。
10.如权利要求9所述的方法,其中所述RNA为mRNA。
11.如前述权利要求中任一项所述的方法,其中通过包括以下的步骤检测与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物:
使所述生物样品与包括多个捕获探针的基材接触,其中所述多个捕获探针中的捕获探针包括空间条形码和捕获域;
将与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物杂交到所述捕获探针;和
确定(i)对应于与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于所述空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
12.如权利要求11所述的方法,其中所述确定步骤包括测序。
13.如权利要求1-7中任一项所述的方法,其中,与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物是蛋白质。
14.如权利要求13所述的方法,其中通过包括以下的步骤来检测与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物:
用多种分析物捕获剂附着所述生物样品,其中所述多种分析物捕获剂中的分析物捕获剂包括:
(i)分析物结合部分,其特异性结合与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物;
(ii)分析物结合部分条形码;和
(iii)分析物捕获序列,其中所述分析物捕获序列特异性结合捕获域;
使所述生物样品与基材接触,其中所述基材包括多个捕获探针,所述多个捕获探针中的捕获探针包括(i)捕获域和(ii)空间条形码;
将与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物杂交到所述捕获探针;和
确定(i)对应于与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于所述空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物、和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
15.如权利要求14所述的方法,其中所述确定步骤包括:
测序(i)对应于与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物、和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
16.如权利要求14或15所述的方法,其中所述分析物结合部分是抗体或其抗原结合片段、细胞表面受体结合分子、受体配体、小分子、T细胞受体衔接体、B细胞受体衔接体、前体、适体、单体、亲和体或DARPin。
17.如前述权利要求中任一项所述的方法,其中使用原位测序来检测与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物。
18.如前述权利要求中任一项所述的方法,其中使用抗体检测与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物。
19.如前述权利要求中任一项所述的方法,进一步包括使所述生物样品与一种或多种染色剂接触。
20.如权利要求19所述的方法,其中所述一种或多种染色剂包括苏木精和伊红。
21.如权利要求19或20所述的方法,其中所述一种或多种染色剂包括一种或多种光学标记。
22.如权利要求21所述的方法,其中所述一种或多种光学标记选自:荧光标记、放射性标记、化学发光标记、量热标记或比色标记。
23.如权利要求19-22中任一项所述的方法,还包括使用癌症标志物特异性的一种或多种染色剂来识别生物样品中的一个或多个癌性区域。
24.如权利要求23所述的方法,其中所述癌症标志物是广谱细胞角蛋白(Pan-CK)。
25.如权利要求19-24中任一项所述的方法,还包括使用基质标志物特异性的一种或多种染色剂鉴定所述一个或多个癌性区域内的一个或多个基质区域。
26.如权利要求25所述的方法,其中所述基质标志物为CD45。
27.如权利要求2-26中任一项所述的方法,其中所述图像数据通过获得所述生物样品的图像而生成。
28.如权利要求27所述的方法,还包括将所述图像数据登记到空间位置。
29.如权利要求27或28所述的方法,还包括基于所述图像数据识别(1)所述一个或多个癌性区域和/或(2)所述一个或多个基质区域。
30.如权利要求27-29中任一项所述的方法,还包括基于所述图像数据识别所述一个或多个免疫细胞。
31.如权利要求2-30中任一项所述的方法,还包括通过所述经过训练的机器学习模块识别所述一个或多个癌性区域。
32.如权利要求2-31中任一项所述的方法,还包括通过经过训练的机器学习模块识别所述一个或多个基质区域。
33.如权利要求2-32中任一项所述的方法,还包括通过所述经过训练的机器学习模块识别所述一个或多个免疫细胞。
34.如前述权利要求中任一项所述的方法,其中对生物样品的癌症基质区域中的免疫细胞浸润的分析包括确定生物样品中癌症基质区域中免疫细胞的丰度。
35.如权利要求11-34中任一项所述的方法,其中
识别一个或多个癌症区域包括:
(i)获得图像并将图像数据登记到空间位置,
(ii)使用所确定的序列的空间位置,或者
(ii)获得图像并将图像数据登记到空间位置,并使用所确定的序列的空间位置;
识别所述一个或多个基质区域包括:
(i)获得图像并将图像数据登记到空间位置,
(ii)使用所确定的序列的空间位置,或者
(ii)获得图像并将图像数据登记到空间位置,并使用所确定的序列的空间位置;和
在生物样品中的一个或多个位置识别一个或多个免疫细胞或与其相关的分析物包括:
(i)获得图像并将图像数据登记到空间位置,
(ii)使用所确定的序列的空间位置,或者
(iii)获得图像并将图像数据登记到空间位置,并使用所确定的序列的空间位置。
36.如权利要求34所述的方法,其中癌症基质区域中免疫细胞的丰度被确定为癌症基质区域中属于免疫细胞的细胞的百分比或被免疫细胞占据的癌症基质区域的百分比。
37.如权利要求36所述的方法,其中使用一个或多个癌性区域、一个或多个基质区域和一个或多个免疫细胞的所确定序列的空间位置来确定癌症基质区域中免疫细胞的丰度。
38.如权利要求37所述的方法,其中使用所确定的序列的空间位置包括使用原位测序来确定所述序列。
39.如权利要求36所述的方法,其中癌症基质区域中免疫细胞的丰度使用划分及以下手段确定
(i)获得图像并将图像数据登记到空间位置,
(ii)使用所确定的序列的空间位置,或者
(iii)获得图像并将图像数据登记到空间位置,并使用所确定的序列的空间位置。
40.如前述权利要求中任一项所述的方法,其中所述确定包括:
(a)与经每空间位置细胞数量归一化的已知管家相比,鉴定与免疫浸润细胞相关的基因的量;
(b)鉴定一种或多种肿瘤浸润淋巴细胞(TIL)与一种或多种肿瘤浸润B细胞(TIB)的比率;和/或
(c)基于包括与免疫浸润细胞相关的分析物的空间位置的百分比来计算生物样品中肿瘤浸润免疫细胞的丰度。
41.如前述权利要求中任一项所述的方法,其中所述一个或多个免疫细胞的识别包括从所述图像数据中划分免疫细胞。
42.如前述权利要求中任一项所述的方法,还包括基于免疫浸润确定癌症预后。
43.如前述权利要求中任一项所述的方法,还包括基于免疫浸润评分对对象的癌症严重程度进行评分或确定。
44.如前述权利要求中任一项所述的方法,其中所述确定包括鉴定一种或多种肿瘤浸润淋巴细胞(TIL)与一种或多种肿瘤浸润B细胞(TIB)或一种或多种肿瘤浸润T细胞与一种或多种肿瘤浸润B细胞(TIB)的比率。
45.如前述权利要求中任一项所述的方法,还包括给予治疗性处理,其中治疗性处理包括手术、化疗剂、生长抑制剂、细胞毒剂、放射治疗用剂、抗血管生成剂、癌症免疫治疗剂、凋亡剂、抗微管蛋白剂或其组合。
46.如前述权利要求中任一项所述的方法,其中所述生物样品从对象的活检物中获得。
47.如前述权利要求中任一项所述的方法,其中所述生物样品从对象的手术切除物中获得。
48.如权利要求46或47所述的方法,其中所述生物样品在对象的内窥镜检查或结肠镜检查期间收集。
49.如前述权利要求中任一项所述的方法,其中所述生物样品是组织切片。
50.如前述权利要求中任一项所述的方法,其中所述生物样品是载玻片上的组织切片。
51.如前述权利要求中任一项所述的方法,其中所述生物样品是福尔马林固定的石蜡包埋(FFPE)样品、冷冻样品或新鲜样品。
52.如前述权利要求中任一项所述的方法,其中所述生物样品是FFPE样品。
53.如前述权利要求中任一项所述的方法,其中所述免疫细胞选自B细胞、T细胞、NK细胞、单核细胞、巨噬细胞、中性粒细胞、粒细胞、先天性淋巴细胞或树突状细胞或其组合。
54.如前述权利要求中任一项所述的方法,其中所述与癌性区域相关的分析物选自来自AKT途径的分析物、来自JAK-STAT途径的分析物和来自Notch途径的分析物或其组合。
55.如前述权利要求中任一项所述的方法,其中所述与癌性区域相关的分析物选自SCGB2A1、MKI67、BRCA1、BRCA2、PIKCD、CALML6、MYC、TP53、PALB2、RAD51和MSH2或其组合。
56.如前述权利要求中任一项所述的方法,其中所述与癌性区域相关的分析物选自SCGB2A1、MKI67、BRCA1、BRCA2、PIK3CD和CALML6或其组合。
57.如前述权利要求中任一项所述的方法,其中所述与癌性区域相关的分析物选自PRKCI、VTCN1、MECOM、TOP2A、SHDH、XPO1、TFRC、FUT8、SOX17、PBX1、EIF42、WT1、其副产物、前体和降解产物,及其任何组合。
58.如前述权利要求中任一项所述的方法,其中所述与癌性区域相关的分析物选自VTCN1、MECOM、TOP2A、XPO1、FUT8、SOX17、PBX1、EIF42、WT1、其副产物、前体和降解产物,及其任意组合。
59.如前述权利要求中任一项所述的方法,其中所述与癌性区域相关的分析物是TOP2A及其副产物、前体和降解产物。
60.如前述权利要求中任一项所述的方法,其中所述与癌性区域相关的分析物是XPO1及其副产物、前体和降解产物。
61.如前述权利要求中任一项所述的方法,其中所述与基质区域相关的分析物选自VIM、EPCAM、FAP和CDH1。
62.如前述权利要求中任一项所述的方法,其中所述与基质区域相关的分析物选自FAP、VCAN、ACTA2和PDGFRB。
63.如前述权利要求中任一项所述的方法,其中所述与免疫细胞相关的分析物选自BLK、CD19、FCRL2、MS4A1、KIAA0125、TNFRSF17、TCL1A、SPIB、PNOC、PTRPC、PRF1、GZMA、GZMB、NKG7、GZMH、KLRK1、KLRB1、KLRD1、CTSW、GNLY、CCL13、CD209、HSD11B1、LAG3、CD244、EOMES、PTGER4、CD68、CD84、CD163、MS4A4A、TPSB2、TPSAB1、CPA3、MS4A2、HDC、FPR1,SIGLEC5、CSF3R、FCAR、FCGR3B、CEACAM3、S100A12、KIR2DL3、KIR3DL1、kir3dd2、IL21R、XCL1、XCL2、NCR1、CD6、CD3D、CD3E、SH2D1A、TRAT1、CD3G、TBX21、FOXP3、CD8A、CD8B、CD79A、CD79B、CD4、IGHA1、IGHG2、JCHAIN、IGKC、CD27、CD38、CD16、IL17RB、FANK1、CTLA4、MSR1、MRC1、NKG7、FCN1、TIGIT/LAG3。
64.如前述权利要求中任一项所述的方法,其中所述一种或多种免疫细胞选自:
(i)CD3+和CD4+T细胞;
(ii)CD3+和CD8+T细胞;
(iii)调节性T细胞,其包含CD4、Foxp3、IL17RB、CTLA4、FANK1、HAVCR1、CD25、CTLA-4、GITR、LAG-3和CD127中的一种或多种;
(iv)TH1细胞,其包含CD4、CD3D、S100A4、IL7R和IFNG中的一种或多种;
(v)TH2细胞,其包含CD4、IL7R、ICOS、CTLA4、TNFRSF4和TNFRS18中的一种或多种;
(vi)TH17细胞,其包含CD4、CD3D、IL17A、GZMA和S100A4中的一种或多种;
(vii)细胞毒性T细胞,其包含CD8、CD3D、S100A4、IFNG、GZMB、GZMA和IL2RB中的一种或多种;
(viii)浆细胞,其包含一种或多种JCHAIN、MZB1、IGHA1、IGHG1和IGKC;
(ix)单核细胞,其包含CD14+CD16-;
(x)单核细胞,其包含CD14-CD16+;和
(xi)自然杀伤细胞,其包含NKG7。
65.如前述权利要求中任一项所述的方法,其中所述免疫浸润细胞是肿瘤浸润B细胞(TIB)。
66.如权利要求65所述的方法,其中所述TIB选自:
(i)浆细胞,其包含MZB1、IGLL5、IGHA1、IGHG1、JCHAIN、IGKC、IGHA2、IGLC2、IGLV3-1和IGLV2-14中的一种或多种;
(ii)Ig+B细胞,其包含IGHV3-74、SOCS3、JCHAIN和SPARC中的一种或多种;
(iii)活化的B细胞,其包含CD79B、HMGB2、HMGB1、HMGN1和RGS 13;
(iv)B细胞,其包含MEF2B、RGS13和MS4A1中的一种或多种;和
(v)B细胞,其包含CD79A和CD79B。
67.一种确定生物样品中免疫细胞浸润的方法,所述生物样品包括对象中的一个或多个癌性区域和一个或多个基质区域,所述方法包括:
(a)从获自对象的生物样品生成数据集,其中所述数据集包括:
(i)从所述生物样品的多个空间位置捕获的多个分析物的分析物数据,其中所述多个分析物中的分析物是与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物;
(b)将所述数据集提供给经过训练的机器学习模块,其中所述经过训练的机器学习模块包括来自一个或多个参考样品的参考分析物数据集,其中所述一个或多个参考样品包括(i)来自一个或多个癌性区域的癌性区域,(2)来自一个或多个基质区域的基质区域,以及(3)来自一个或多个免疫细胞的免疫细胞;和
(c)通过所述经过训练的机器学习模块确定从对象获得的生物样品中的免疫细胞浸润。
68.一种确定生物样品中免疫细胞浸润的方法,所述生物样品包括一个或多个癌性区域和一个或多个基质区域,所述方法包括:
(a)从获自对象的生物样品生成数据集,其中所述数据集包括:
(i)从所述生物样品的多个空间位置捕获的多个分析物的分析物数据,其中所述多个分析物中的分析物是与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物;
(ii)包括所述生物样品的所述多个空间位置的图像的图像数据;和
(iii)将所述分析物数据链接到所述图像数据的登记数据;
(b)将所述数据集提供给经过训练的机器学习模块,其中所述经过训练的机器学习模块包括来自一个或多个参考样品的参考分析物数据集,其中所述一个或多个参考样品包括(i)来自一个或多个癌性区域的癌性区域,(2)来自一个或多个基质区域的基质区域,以及(3)来自一个或多个免疫细胞的免疫细胞;和
(c)通过所述经过训练的机器学习模块确定所述生物样品中的免疫细胞浸润。
69.如权利要求67或68所述的方法,其中所述经过训练的机器学习模块是监督学习模块、半监督学习模块、无监督学习模块、回归分析模块、强化学习模块、自学习模块、特征学习模块、稀疏字典学习模块、异常检测模块、生成对抗性网络、卷积神经网络或关联规则模块中的至少一种。
70.如权利要求67-69中任一项所述的方法,其中生成所述数据集包括:
将带癌生物样品与包含多个捕获探针的基材接触,其中生物样品中包括(1)一个或多个癌性区域,(2)一个或多个基质区域,以及(3)一个和多个肿瘤浸润免疫细胞,其中多个捕获探针的捕获探针包括空间条形码和捕获域;
将来自所述生物样品的分析物附着到所述捕获探针;
确定(i)对应于分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全体或部分,或其互补物,并使用(i)和(ii)的所确定的序列来识别生物样品中分析物的空间位置和丰度;和
基于与空间位置处的分析物相对应的所确定序列,将空间位置识别为簇的部分,并使用所述簇分析患癌对象癌症基质中的免疫细胞浸润。
71.如权利要求70所述的方法,其中使用选自非线性降维、t-分布随机邻居嵌入(t-SNE)、全局t-分布随机近邻嵌入(g-SNE)和均匀流形近似与投影(UMAP)的方法之一来识别一个或多个免疫细胞簇。
72.如权利要求67-71中任一项所述的方法,其中生成所述数据集包括:
用多种分析物捕获剂附着所述生物样品,其中所述多种分析物捕获剂中的分析物捕获试剂包括:
(i)分析物结合部分,其特异性结合与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物;
(ii)分析物结合部分条形码;和
(iii)分析物捕获序列,其中所述分析物捕获序列特异性结合捕获域;
使所述生物样品与基材接触,其中所述基材包括多个捕获探针,所述多个捕获探针中的捕获探针包括(i)捕获域和(ii)空间条形码;
将与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物杂交到所述捕获探针;和
确定(i)对应于与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于所述空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物、和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
73.如权利要求66-71中任一项所述的方法,其中所述分析物数据使用原位测序生成。
74.一种试剂盒,其包含:
(a)特异性结合浸润免疫细胞上的抗原的抗体;
(b)基材,包括多个捕获探针,其中所述多个捕获探针中的捕获探针包括捕获域;和
(c)用于执行权利要求1-72中任一项所述的方法的说明书。
75.一种试剂盒,其包含:
(a)特异性结合浸润免疫细胞上的抗原的抗体;
(b)特异性结合基质细胞上的抗原的第二抗体;
(c)基材,包括多个捕获探针,其中所述多个捕获探针中的捕获探针包括捕获域;和
(d)用于执行权利要求1-72所述的方法的说明书。
76.一种计算机实现的方法,其包括:
(a)生成多个生物样品的数据集,其中对于所述多个生物样品中的每个生物样品,所述数据集包括:
(i)在参考生物样品的多个空间位置捕获的多个分析物的分析物数据;
(ii)参考生物样品的图像数据;和
(iii)根据参考生物样品的空间位置链接到分析物数据的成像数据的登记数据;
其中所述参考生物样品包括
(1)参考生物样品中的一个或多个癌性区域,
(2)在所述一个或多个癌性区域内的一个或多个基质区域,以及
(3)多个肿瘤浸润淋巴细胞(TIL);
(b)用所述数据集训练机器学习模块,从而生成经过训练的机器学习模块;和
(c)通过所述经过训练的机器学习模块确定生物样品中的免疫细胞浸润。
77.一种系统,其包括:
(a)存储元件,其可操作以存储多个生物样品的数据集,其中所述数据集包括:在参考生物样品的多个空间位置捕获的多个分析物的分析物数据;生物样品的图像数据;以及根据参考生物样品的空间位置链接到分析物数据的成像数据的登记数据;其中所述生物样品包括(1)所述参考生物样品中的一个或多个癌性区域,(2)所述一个或多个癌性区内的一个或多个基质区域,以及(3)所述多个肿瘤浸润淋巴细胞(TIL);和
(b)处理器,其可操作以通过机器学习模块处理所述数据集以训练所述机器学习模块以确定生物样品中的免疫细胞浸润。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/115,502 | 2020-11-18 | ||
US63/142,772 | 2021-01-28 | ||
US202163242721P | 2021-09-10 | 2021-09-10 | |
US63/242,721 | 2021-09-10 | ||
PCT/US2021/059959 WO2022109181A1 (en) | 2020-11-18 | 2021-11-18 | Methods and compositions for analyzing immune infiltration in cancer stroma to predict clinical outcome |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116888278A true CN116888278A (zh) | 2023-10-13 |
Family
ID=88264865
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180090994.9A Pending CN116888278A (zh) | 2020-11-18 | 2021-11-18 | 分析癌症基质中免疫浸润以预测临床转归的方法和组合物 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116888278A (zh) |
-
2021
- 2021-11-18 CN CN202180090994.9A patent/CN116888278A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230407404A1 (en) | Methods and compositions for analyzing immune infiltration in cancer stroma to predict clinical outcome | |
US20210222253A1 (en) | Identification of biomarkers of glioblastoma and methods of using the same | |
US20230272476A1 (en) | Nano46 genes and methods to predict breast cancer outcome | |
ES2457534T3 (es) | Perfiles de expresión génica para predecir desenlaces en cáncer de mama | |
CN101410532B (zh) | 用于检测癌症的尿基因表达比值 | |
US20220127676A1 (en) | Methods and compositions for prognostic and/or diagnostic subtyping of pancreatic cancer | |
JP2015530072A (ja) | ゲムシタビン療法による乳癌の治療方法 | |
KR20150132500A (ko) | 암 예후용 조성물 및 방법 | |
KR20150005726A (ko) | 직장결장암용 예후 예측 | |
Perez et al. | Improving patient care through molecular diagnostics | |
US20210388418A1 (en) | Method for Quantifying Molecular Activity in Cancer Cells of a Human Tumour | |
US20160115551A1 (en) | Methods to predict risk of recurrence in node-positive early breast cancer | |
Nagahata et al. | Expression profiling to predict postoperative prognosis for estrogen receptor‐negative breast cancers by analysis of 25,344 genes on a cDNA microarray | |
Dwivedi et al. | Application of single-cell omics in breast cancer | |
JP6837428B2 (ja) | 患者特有の変異の発癌性指数を決定する方法およびシステム | |
CN116888278A (zh) | 分析癌症基质中免疫浸润以预测临床转归的方法和组合物 | |
US20160160293A1 (en) | Breast cancer treatment with taxane therapy | |
EP2271775A1 (en) | Biomarker panel for prediction of recurrent colorectal cancer | |
Mehmood et al. | Transforming Diagnosis and Therapeutics Using Cancer Genomics | |
Zhou et al. | Single-cell multi-omics in the study of digestive system cancers | |
Young | A translational study in pancreatic neuroendocrine neoplasms | |
Jarzab et al. | Gene Expression Analysis by DNA Microarray in Papillary and Follicular Differentiated Thyroid Cancer | |
Byers | Molecular Profiling | |
Fumagalli et al. | Strategies to Incorporate Translational Research Science into Clinical Trials in Breast Cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |