JP2023518185A - 発現データのデコンボリューションのためのシステム及び方法 - Google Patents
発現データのデコンボリューションのためのシステム及び方法 Download PDFInfo
- Publication number
- JP2023518185A JP2023518185A JP2022554893A JP2022554893A JP2023518185A JP 2023518185 A JP2023518185 A JP 2023518185A JP 2022554893 A JP2022554893 A JP 2022554893A JP 2022554893 A JP2022554893 A JP 2022554893A JP 2023518185 A JP2023518185 A JP 2023518185A
- Authority
- JP
- Japan
- Prior art keywords
- expression data
- cell
- rna
- cell type
- rna expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 900
- 238000000034 method Methods 0.000 title claims abstract description 394
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 382
- 239000000203 mixture Substances 0.000 claims abstract description 324
- 239000012472 biological sample Substances 0.000 claims abstract description 168
- 238000012417 linear regression Methods 0.000 claims abstract description 101
- 238000012545 processing Methods 0.000 claims abstract description 57
- 210000004027 cell Anatomy 0.000 claims description 1186
- 206010028980 Neoplasm Diseases 0.000 claims description 221
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 149
- 238000012549 training Methods 0.000 claims description 131
- 201000011510 cancer Diseases 0.000 claims description 129
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 88
- 230000003211 malignant effect Effects 0.000 claims description 68
- 238000003860 storage Methods 0.000 claims description 59
- 230000008569 process Effects 0.000 claims description 40
- 210000003719 b-lymphocyte Anatomy 0.000 claims description 37
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 claims description 33
- 210000000822 natural killer cell Anatomy 0.000 claims description 26
- 210000002540 macrophage Anatomy 0.000 claims description 23
- 108091092328 cellular RNA Proteins 0.000 claims description 21
- 210000004698 lymphocyte Anatomy 0.000 claims description 21
- 210000002950 fibroblast Anatomy 0.000 claims description 20
- 210000002889 endothelial cell Anatomy 0.000 claims description 18
- 210000001616 monocyte Anatomy 0.000 claims description 18
- 210000000440 neutrophil Anatomy 0.000 claims description 17
- 238000007637 random forest analysis Methods 0.000 claims description 5
- 238000012952 Resampling Methods 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 238000012706 support-vector machine Methods 0.000 claims description 4
- 229920002477 rna polymer Polymers 0.000 description 429
- 239000000523 sample Substances 0.000 description 128
- 238000003559 RNA-seq method Methods 0.000 description 108
- 210000001519 tissue Anatomy 0.000 description 98
- 238000012163 sequencing technique Methods 0.000 description 59
- 238000004458 analytical method Methods 0.000 description 56
- 238000002474 experimental method Methods 0.000 description 50
- 239000008280 blood Substances 0.000 description 45
- 210000004369 blood Anatomy 0.000 description 45
- 230000001413 cellular effect Effects 0.000 description 42
- 101000716102 Homo sapiens T-cell surface glycoprotein CD4 Proteins 0.000 description 41
- 102100036011 T-cell surface glycoprotein CD4 Human genes 0.000 description 41
- 230000000875 corresponding effect Effects 0.000 description 36
- 108020004414 DNA Proteins 0.000 description 35
- 102000053602 DNA Human genes 0.000 description 35
- 230000006870 function Effects 0.000 description 35
- 238000004422 calculation algorithm Methods 0.000 description 27
- 238000013459 approach Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 23
- 238000010801 machine learning Methods 0.000 description 21
- 238000010606 normalization Methods 0.000 description 19
- 238000001574 biopsy Methods 0.000 description 17
- 230000033001 locomotion Effects 0.000 description 17
- 150000007523 nucleic acids Chemical class 0.000 description 17
- 102000039446 nucleic acids Human genes 0.000 description 16
- 108020004707 nucleic acids Proteins 0.000 description 16
- 238000009826 distribution Methods 0.000 description 15
- 241000282414 Homo sapiens Species 0.000 description 14
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 14
- 210000002865 immune cell Anatomy 0.000 description 13
- 238000002360 preparation method Methods 0.000 description 13
- 210000004881 tumor cell Anatomy 0.000 description 13
- 108091008109 Pseudogenes Proteins 0.000 description 12
- 102000057361 Pseudogenes Human genes 0.000 description 12
- 108091008874 T cell receptors Proteins 0.000 description 12
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 12
- 230000000670 limiting effect Effects 0.000 description 11
- 102100034922 T-cell surface glycoprotein CD8 alpha chain Human genes 0.000 description 10
- 210000002381 plasma Anatomy 0.000 description 10
- 238000007781 pre-processing Methods 0.000 description 10
- 238000007482 whole exome sequencing Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 9
- 238000010200 validation analysis Methods 0.000 description 9
- 238000012935 Averaging Methods 0.000 description 8
- 201000010099 disease Diseases 0.000 description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 239000003550 marker Substances 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 7
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 239000000470 constituent Substances 0.000 description 7
- 238000007796 conventional method Methods 0.000 description 7
- 201000005202 lung cancer Diseases 0.000 description 7
- 208000020816 lung neoplasm Diseases 0.000 description 7
- 238000003908 quality control method Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 238000007710 freezing Methods 0.000 description 6
- 230000008014 freezing Effects 0.000 description 6
- 201000010536 head and neck cancer Diseases 0.000 description 6
- 208000014829 head and neck neoplasm Diseases 0.000 description 6
- 210000003205 muscle Anatomy 0.000 description 6
- 102000004169 proteins and genes Human genes 0.000 description 6
- 210000003289 regulatory T cell Anatomy 0.000 description 6
- 230000006399 behavior Effects 0.000 description 5
- 210000001185 bone marrow Anatomy 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 230000006872 improvement Effects 0.000 description 5
- 201000001441 melanoma Diseases 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 230000003278 mimic effect Effects 0.000 description 5
- 238000007481 next generation sequencing Methods 0.000 description 5
- 238000012805 post-processing Methods 0.000 description 5
- 108091005560 ADGRG3 Proteins 0.000 description 4
- 102100026425 Adhesion G protein-coupled receptor E3 Human genes 0.000 description 4
- 102100040037 Adhesion G protein-coupled receptor G3 Human genes 0.000 description 4
- 201000009030 Carcinoma Diseases 0.000 description 4
- 101000718235 Homo sapiens Adhesion G protein-coupled receptor E3 Proteins 0.000 description 4
- 101000832784 Homo sapiens Arf-GAP with dual PH domain-containing protein 2 Proteins 0.000 description 4
- 108060003951 Immunoglobulin Proteins 0.000 description 4
- 206010025323 Lymphomas Diseases 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 206010035226 Plasma cell myeloma Diseases 0.000 description 4
- 206010039491 Sarcoma Diseases 0.000 description 4
- 210000001124 body fluid Anatomy 0.000 description 4
- 210000004556 brain Anatomy 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 102000018358 immunoglobulin Human genes 0.000 description 4
- 208000032839 leukemia Diseases 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 201000000050 myeloid neoplasm Diseases 0.000 description 4
- 108091027963 non-coding RNA Proteins 0.000 description 4
- 102000042567 non-coding RNA Human genes 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 239000003755 preservative agent Substances 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 108020004418 ribosomal RNA Proteins 0.000 description 4
- 238000012418 validation experiment Methods 0.000 description 4
- 238000012070 whole genome sequencing analysis Methods 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- 108091008875 B cell receptors Proteins 0.000 description 3
- 102100026008 Breakpoint cluster region protein Human genes 0.000 description 3
- 102100021703 C3a anaphylatoxin chemotactic receptor Human genes 0.000 description 3
- 101000896583 Homo sapiens C3a anaphylatoxin chemotactic receptor Proteins 0.000 description 3
- 101000740726 Homo sapiens Complement C1q subcomponent subunit A Proteins 0.000 description 3
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 3
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 3
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 3
- 230000001594 aberrant effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 238000003339 best practice Methods 0.000 description 3
- 210000000601 blood cell Anatomy 0.000 description 3
- 210000005013 brain tissue Anatomy 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 210000002808 connective tissue Anatomy 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 239000003431 cross linking reagent Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000834 fixative Substances 0.000 description 3
- 238000000684 flow cytometry Methods 0.000 description 3
- 210000002443 helper t lymphocyte Anatomy 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 210000004072 lung Anatomy 0.000 description 3
- 230000036210 malignancy Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 239000013610 patient sample Substances 0.000 description 3
- 230000002335 preservative effect Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000007480 sanger sequencing Methods 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- -1 B-5 Chemical compound 0.000 description 2
- 108091032955 Bacterial small RNA Proteins 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 102000017420 CD3 protein, epsilon/gamma/delta subunit Human genes 0.000 description 2
- 108050005493 CD3 protein, epsilon/gamma/delta subunit Proteins 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 208000006545 Chronic Obstructive Pulmonary Disease Diseases 0.000 description 2
- 206010009944 Colon cancer Diseases 0.000 description 2
- 102100037077 Complement C1q subcomponent subunit A Human genes 0.000 description 2
- 102100025849 Complement C1q subcomponent subunit C Human genes 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 238000012413 Fluorescence activated cell sorting analysis Methods 0.000 description 2
- WZUVPPKBWHMQCE-UHFFFAOYSA-N Haematoxylin Chemical compound C12=CC(O)=C(O)C=C2CC2(O)C1C1=CC=C(O)C(O)=C1OC2 WZUVPPKBWHMQCE-UHFFFAOYSA-N 0.000 description 2
- 101000933636 Homo sapiens Complement C1q subcomponent subunit C Proteins 0.000 description 2
- 101000946863 Homo sapiens T-cell surface glycoprotein CD3 delta chain Proteins 0.000 description 2
- 108700011259 MicroRNAs Proteins 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 241000208125 Nicotiana Species 0.000 description 2
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 241001237728 Precis Species 0.000 description 2
- 206010060862 Prostate cancer Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 102100035891 T-cell surface glycoprotein CD3 delta chain Human genes 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 238000009534 blood test Methods 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 2
- 210000000621 bronchi Anatomy 0.000 description 2
- 230000001680 brushing effect Effects 0.000 description 2
- 239000006285 cell suspension Substances 0.000 description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 2
- 238000011109 contamination Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000005138 cryopreservation Methods 0.000 description 2
- 238000004163 cytometry Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 210000000981 epithelium Anatomy 0.000 description 2
- 210000003238 esophagus Anatomy 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- PGHMRUGBZOYCAA-ADZNBVRBSA-N ionomycin Chemical compound O1[C@H](C[C@H](O)[C@H](C)[C@H](O)[C@H](C)/C=C/C[C@@H](C)C[C@@H](C)C(/O)=C/C(=O)[C@@H](C)C[C@@H](C)C[C@@H](CCC(O)=O)C)CC[C@@]1(C)[C@@H]1O[C@](C)([C@@H](C)O)CC1 PGHMRUGBZOYCAA-ADZNBVRBSA-N 0.000 description 2
- PGHMRUGBZOYCAA-UHFFFAOYSA-N ionomycin Natural products O1C(CC(O)C(C)C(O)C(C)C=CCC(C)CC(C)C(O)=CC(=O)C(C)CC(C)CC(CCC(O)=O)C)CCC1(C)C1OC(C)(C(C)O)CC1 PGHMRUGBZOYCAA-UHFFFAOYSA-N 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 230000002438 mitochondrial effect Effects 0.000 description 2
- 210000000214 mouth Anatomy 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000013188 needle biopsy Methods 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- 230000008506 pathogenesis Effects 0.000 description 2
- 230000000144 pharmacologic effect Effects 0.000 description 2
- PHEDXBVPIONUQT-RGYGYFBISA-N phorbol 13-acetate 12-myristate Chemical compound C([C@]1(O)C(=O)C(C)=C[C@H]1[C@@]1(O)[C@H](C)[C@H]2OC(=O)CCCCCCCCCCCCC)C(CO)=C[C@H]1[C@H]1[C@]2(OC(C)=O)C1(C)C PHEDXBVPIONUQT-RGYGYFBISA-N 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- 238000007790 scraping Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 210000004927 skin cell Anatomy 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 210000000952 spleen Anatomy 0.000 description 2
- 210000002784 stomach Anatomy 0.000 description 2
- 210000002536 stromal cell Anatomy 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 210000001541 thymus gland Anatomy 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 210000004981 tumor-associated macrophage Anatomy 0.000 description 2
- 210000003171 tumor-infiltrating lymphocyte Anatomy 0.000 description 2
- 108091008074 unitary pseudogenes Proteins 0.000 description 2
- 210000003932 urinary bladder Anatomy 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 238000012049 whole transcriptome sequencing Methods 0.000 description 2
- XOOUIPVCVHRTMJ-UHFFFAOYSA-L zinc stearate Chemical compound [Zn+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O XOOUIPVCVHRTMJ-UHFFFAOYSA-L 0.000 description 2
- 208000010507 Adenocarcinoma of Lung Diseases 0.000 description 1
- 208000003200 Adenoma Diseases 0.000 description 1
- 206010001233 Adenoma benign Diseases 0.000 description 1
- 102100034608 Angiopoietin-2 Human genes 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 102100029459 Apelin Human genes 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 208000035404 Autolysis Diseases 0.000 description 1
- 208000003950 B-cell lymphoma Diseases 0.000 description 1
- 102100024222 B-lymphocyte antigen CD19 Human genes 0.000 description 1
- 102100022005 B-lymphocyte antigen CD20 Human genes 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 102100032556 C-type lectin domain family 14 member A Human genes 0.000 description 1
- 102100038077 CD226 antigen Human genes 0.000 description 1
- 101150060950 CD3D gene Proteins 0.000 description 1
- 210000004366 CD4-positive T-lymphocyte Anatomy 0.000 description 1
- 102100036008 CD48 antigen Human genes 0.000 description 1
- 102100029761 Cadherin-5 Human genes 0.000 description 1
- 102100022789 Calcium/calmodulin-dependent protein kinase type IV Human genes 0.000 description 1
- 201000000274 Carcinosarcoma Diseases 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 206010057248 Cell death Diseases 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 206010008263 Cervical dysplasia Diseases 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 208000030808 Clear cell renal carcinoma Diseases 0.000 description 1
- 206010053567 Coagulopathies Diseases 0.000 description 1
- PHEDXBVPIONUQT-UHFFFAOYSA-N Cocarcinogen A1 Natural products CCCCCCCCCCCCCC(=O)OC1C(C)C2(O)C3C=C(C)C(=O)C3(O)CC(CO)=CC2C2C1(OC(C)=O)C2(C)C PHEDXBVPIONUQT-UHFFFAOYSA-N 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 102100035273 E3 ubiquitin-protein ligase CBL-B Human genes 0.000 description 1
- 102100037241 Endoglin Human genes 0.000 description 1
- 102100038566 Endomucin Human genes 0.000 description 1
- 102100038591 Endothelial cell-selective adhesion molecule Human genes 0.000 description 1
- 102100031759 Endothelial cell-specific chemotaxis regulator Human genes 0.000 description 1
- 102100021860 Endothelial cell-specific molecule 1 Human genes 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 1
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 1
- 102100031381 Fc receptor-like A Human genes 0.000 description 1
- 102100020715 Fms-related tyrosine kinase 3 ligand protein Human genes 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 208000034826 Genetic Predisposition to Disease Diseases 0.000 description 1
- 208000021309 Germ cell tumor Diseases 0.000 description 1
- SXRSQZLOMIGNAQ-UHFFFAOYSA-N Glutaraldehyde Chemical compound O=CCCCC=O SXRSQZLOMIGNAQ-UHFFFAOYSA-N 0.000 description 1
- 102100035960 Hedgehog-interacting protein Human genes 0.000 description 1
- 101710164669 Hedgehog-interacting protein Proteins 0.000 description 1
- 102100027385 Hematopoietic lineage cell-specific protein Human genes 0.000 description 1
- 101000924533 Homo sapiens Angiopoietin-2 Proteins 0.000 description 1
- 101000771523 Homo sapiens Apelin Proteins 0.000 description 1
- 101000980825 Homo sapiens B-lymphocyte antigen CD19 Proteins 0.000 description 1
- 101000897405 Homo sapiens B-lymphocyte antigen CD20 Proteins 0.000 description 1
- 101000942280 Homo sapiens C-type lectin domain family 14 member A Proteins 0.000 description 1
- 101000884298 Homo sapiens CD226 antigen Proteins 0.000 description 1
- 101000716130 Homo sapiens CD48 antigen Proteins 0.000 description 1
- 101000794587 Homo sapiens Cadherin-5 Proteins 0.000 description 1
- 101000974816 Homo sapiens Calcium/calmodulin-dependent protein kinase type IV Proteins 0.000 description 1
- 101000737265 Homo sapiens E3 ubiquitin-protein ligase CBL-B Proteins 0.000 description 1
- 101000881679 Homo sapiens Endoglin Proteins 0.000 description 1
- 101001030622 Homo sapiens Endomucin Proteins 0.000 description 1
- 101000882622 Homo sapiens Endothelial cell-selective adhesion molecule Proteins 0.000 description 1
- 101000866525 Homo sapiens Endothelial cell-specific chemotaxis regulator Proteins 0.000 description 1
- 101000897959 Homo sapiens Endothelial cell-specific molecule 1 Proteins 0.000 description 1
- 101000846860 Homo sapiens Fc receptor-like A Proteins 0.000 description 1
- 101000932480 Homo sapiens Fms-related tyrosine kinase 3 ligand Proteins 0.000 description 1
- 101001026271 Homo sapiens Genetic suppressor element 1 Proteins 0.000 description 1
- 101001009091 Homo sapiens Hematopoietic lineage cell-specific protein Proteins 0.000 description 1
- 101001049181 Homo sapiens Killer cell lectin-like receptor subfamily B member 1 Proteins 0.000 description 1
- 101001137987 Homo sapiens Lymphocyte activation gene 3 protein Proteins 0.000 description 1
- 101000764535 Homo sapiens Lymphotoxin-alpha Proteins 0.000 description 1
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 description 1
- 101001114673 Homo sapiens Multimerin-1 Proteins 0.000 description 1
- 101001114675 Homo sapiens Multimerin-2 Proteins 0.000 description 1
- 101000934338 Homo sapiens Myeloid cell surface antigen CD33 Proteins 0.000 description 1
- 101001128156 Homo sapiens Nanos homolog 3 Proteins 0.000 description 1
- 101001124309 Homo sapiens Nitric oxide synthase, endothelial Proteins 0.000 description 1
- 101001116302 Homo sapiens Platelet endothelial cell adhesion molecule Proteins 0.000 description 1
- 101000994669 Homo sapiens Potassium voltage-gated channel subfamily A member 3 Proteins 0.000 description 1
- 101000714164 Homo sapiens Protein TESPA1 Proteins 0.000 description 1
- 101000639063 Homo sapiens Protein UXT Proteins 0.000 description 1
- 101001130471 Homo sapiens Ras-interacting protein 1 Proteins 0.000 description 1
- 101000738772 Homo sapiens Receptor-type tyrosine-protein phosphatase beta Proteins 0.000 description 1
- 101000650590 Homo sapiens Roundabout homolog 4 Proteins 0.000 description 1
- 101000835928 Homo sapiens Signal-regulatory protein gamma Proteins 0.000 description 1
- 101000648042 Homo sapiens Signal-transducing adaptor protein 1 Proteins 0.000 description 1
- 101000688930 Homo sapiens Signaling threshold-regulating transmembrane adapter 1 Proteins 0.000 description 1
- 101000740162 Homo sapiens Sodium- and chloride-dependent transporter XTRP3 Proteins 0.000 description 1
- 101000689224 Homo sapiens Src-like-adapter 2 Proteins 0.000 description 1
- 101000662902 Homo sapiens T cell receptor beta constant 2 Proteins 0.000 description 1
- 101000798076 Homo sapiens T cell receptor delta constant Proteins 0.000 description 1
- 101000679306 Homo sapiens T cell receptor gamma constant 1 Proteins 0.000 description 1
- 101000679307 Homo sapiens T cell receptor gamma constant 2 Proteins 0.000 description 1
- 101000713602 Homo sapiens T-box transcription factor TBX21 Proteins 0.000 description 1
- 101000914496 Homo sapiens T-cell antigen CD7 Proteins 0.000 description 1
- 101000934376 Homo sapiens T-cell differentiation antigen CD6 Proteins 0.000 description 1
- 101000634846 Homo sapiens T-cell receptor-associated transmembrane adapter 1 Proteins 0.000 description 1
- 101000934346 Homo sapiens T-cell surface antigen CD2 Proteins 0.000 description 1
- 101000946860 Homo sapiens T-cell surface glycoprotein CD3 epsilon chain Proteins 0.000 description 1
- 101000738413 Homo sapiens T-cell surface glycoprotein CD3 gamma chain Proteins 0.000 description 1
- 101000934341 Homo sapiens T-cell surface glycoprotein CD5 Proteins 0.000 description 1
- 101000890836 Homo sapiens TRAF3-interacting JNK-activating modulator Proteins 0.000 description 1
- 101000653540 Homo sapiens Transcription factor 7 Proteins 0.000 description 1
- 101001050476 Homo sapiens Tyrosine-protein kinase ITK/TSK Proteins 0.000 description 1
- 101000753253 Homo sapiens Tyrosine-protein kinase receptor Tie-1 Proteins 0.000 description 1
- 101000671855 Homo sapiens Ubiquitin-associated and SH3 domain-containing protein A Proteins 0.000 description 1
- 101000851018 Homo sapiens Vascular endothelial growth factor receptor 1 Proteins 0.000 description 1
- 101000786318 Homo sapiens Zinc finger BED domain-containing protein 2 Proteins 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- 102100023678 Killer cell lectin-like receptor subfamily B member 1 Human genes 0.000 description 1
- 102000017578 LAG3 Human genes 0.000 description 1
- 206010024612 Lipoma Diseases 0.000 description 1
- 101001089108 Lotus tetragonolobus Anti-H(O) lectin Proteins 0.000 description 1
- 102100026238 Lymphotoxin-alpha Human genes 0.000 description 1
- 210000004322 M2 macrophage Anatomy 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 206010054949 Metaplasia Diseases 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 description 1
- 102100023354 Multimerin-1 Human genes 0.000 description 1
- 102100023346 Multimerin-2 Human genes 0.000 description 1
- 102100025243 Myeloid cell surface antigen CD33 Human genes 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 208000034176 Neoplasms, Germ Cell and Embryonal Diseases 0.000 description 1
- 102100028452 Nitric oxide synthase, endothelial Human genes 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 1
- CTQNGGLPUBDAKN-UHFFFAOYSA-N O-Xylene Chemical compound CC1=CC=CC=C1C CTQNGGLPUBDAKN-UHFFFAOYSA-N 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 108700005081 Overlapping Genes Proteins 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 208000005228 Pericardial Effusion Diseases 0.000 description 1
- 102100024616 Platelet endothelial cell adhesion molecule Human genes 0.000 description 1
- 102100034355 Potassium voltage-gated channel subfamily A member 3 Human genes 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 102100036493 Protein TESPA1 Human genes 0.000 description 1
- 102100031429 Ras-interacting protein 1 Human genes 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102100037424 Receptor-type tyrosine-protein phosphatase beta Human genes 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 108700005075 Regulator Genes Proteins 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 208000006265 Renal cell carcinoma Diseases 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 102100027701 Roundabout homolog 4 Human genes 0.000 description 1
- 101100512783 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MEH1 gene Proteins 0.000 description 1
- 102100025795 Signal-regulatory protein gamma Human genes 0.000 description 1
- 102100025263 Signal-transducing adaptor protein 1 Human genes 0.000 description 1
- 102100024453 Signaling threshold-regulating transmembrane adapter 1 Human genes 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 108091007415 Small Cajal body-specific RNA Proteins 0.000 description 1
- 238000012167 Small RNA sequencing Methods 0.000 description 1
- 102100024510 Src-like-adapter 2 Human genes 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 102100029452 T cell receptor alpha chain constant Human genes 0.000 description 1
- 102100037298 T cell receptor beta constant 2 Human genes 0.000 description 1
- 102100032272 T cell receptor delta constant Human genes 0.000 description 1
- 102100022590 T cell receptor gamma constant 1 Human genes 0.000 description 1
- 102100022571 T cell receptor gamma constant 2 Human genes 0.000 description 1
- 102100036840 T-box transcription factor TBX21 Human genes 0.000 description 1
- 102100027208 T-cell antigen CD7 Human genes 0.000 description 1
- 102100025131 T-cell differentiation antigen CD6 Human genes 0.000 description 1
- 102100029453 T-cell receptor-associated transmembrane adapter 1 Human genes 0.000 description 1
- 102100025237 T-cell surface antigen CD2 Human genes 0.000 description 1
- 102100035794 T-cell surface glycoprotein CD3 epsilon chain Human genes 0.000 description 1
- 102100037911 T-cell surface glycoprotein CD3 gamma chain Human genes 0.000 description 1
- 102100025244 T-cell surface glycoprotein CD5 Human genes 0.000 description 1
- 102100040128 TRAF3-interacting JNK-activating modulator Human genes 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 102100030627 Transcription factor 7 Human genes 0.000 description 1
- 102100023345 Tyrosine-protein kinase ITK/TSK Human genes 0.000 description 1
- 102100022007 Tyrosine-protein kinase receptor Tie-1 Human genes 0.000 description 1
- 102100040337 Ubiquitin-associated and SH3 domain-containing protein A Human genes 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- 108010053099 Vascular Endothelial Growth Factor Receptor-2 Proteins 0.000 description 1
- 102100033178 Vascular endothelial growth factor receptor 1 Human genes 0.000 description 1
- 102100033177 Vascular endothelial growth factor receptor 2 Human genes 0.000 description 1
- 108091034135 Vault RNA Proteins 0.000 description 1
- 238000001793 Wilcoxon signed-rank test Methods 0.000 description 1
- 102100025797 Zinc finger BED domain-containing protein 2 Human genes 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 201000008395 adenosquamous carcinoma Diseases 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 210000000436 anus Anatomy 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 210000003445 biliary tract Anatomy 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 201000000053 blastoma Diseases 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 231100000357 carcinogen Toxicity 0.000 description 1
- 239000003183 carcinogenic agent Substances 0.000 description 1
- 210000000845 cartilage Anatomy 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 210000003679 cervix uteri Anatomy 0.000 description 1
- 230000001055 chewing effect Effects 0.000 description 1
- 210000003690 classically activated macrophage Anatomy 0.000 description 1
- 206010073251 clear cell renal cell carcinoma Diseases 0.000 description 1
- 230000035602 clotting Effects 0.000 description 1
- 239000000701 coagulant Substances 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 208000030381 cutaneous melanoma Diseases 0.000 description 1
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 210000004443 dendritic cell Anatomy 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 210000004207 dermis Anatomy 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000009274 differential gene expression Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 201000008184 embryoma Diseases 0.000 description 1
- 238000001861 endoscopic biopsy Methods 0.000 description 1
- 238000002674 endoscopic surgery Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 206010016629 fibroma Diseases 0.000 description 1
- 239000008098 formaldehyde solution Substances 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 230000004545 gene duplication Effects 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 230000003394 haemopoietic effect Effects 0.000 description 1
- 210000005003 heart tissue Anatomy 0.000 description 1
- 201000011066 hemangioma Diseases 0.000 description 1
- 201000005787 hematologic cancer Diseases 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 101150073223 hisat gene Proteins 0.000 description 1
- 210000003026 hypopharynx Anatomy 0.000 description 1
- 238000013275 image-guided biopsy Methods 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 230000037451 immune surveillance Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 238000003364 immunohistochemistry Methods 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000011337 individualized treatment Methods 0.000 description 1
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 208000002741 leukoplakia Diseases 0.000 description 1
- 238000013173 literature analysis Methods 0.000 description 1
- 210000005228 liver tissue Anatomy 0.000 description 1
- 201000005249 lung adenocarcinoma Diseases 0.000 description 1
- 201000005243 lung squamous cell carcinoma Diseases 0.000 description 1
- 210000004324 lymphatic system Anatomy 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- QSHDDOUJBYECFT-UHFFFAOYSA-N mercury Chemical compound [Hg] QSHDDOUJBYECFT-UHFFFAOYSA-N 0.000 description 1
- 229910052753 mercury Inorganic materials 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000015689 metaplastic ossification Effects 0.000 description 1
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical compound O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 1
- 210000002200 mouth mucosa Anatomy 0.000 description 1
- 210000000066 myeloid cell Anatomy 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 210000003739 neck Anatomy 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 238000012316 non-parametric ANOVA Methods 0.000 description 1
- 210000004882 non-tumor cell Anatomy 0.000 description 1
- 201000011330 nonpapillary renal cell carcinoma Diseases 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 210000003300 oropharynx Anatomy 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 210000002741 palatine tonsil Anatomy 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 210000003899 penis Anatomy 0.000 description 1
- 230000010412 perfusion Effects 0.000 description 1
- 210000004912 pericardial fluid Anatomy 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- OXNIZHLAWKMVMX-UHFFFAOYSA-N picric acid Chemical compound OC1=C([N+]([O-])=O)C=C([N+]([O-])=O)C=C1[N+]([O-])=O OXNIZHLAWKMVMX-UHFFFAOYSA-N 0.000 description 1
- 210000004180 plasmocyte Anatomy 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 238000000734 protein sequencing Methods 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 238000007388 punch biopsy Methods 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 238000013442 quality metrics Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005057 refrigeration Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 210000003079 salivary gland Anatomy 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 210000004706 scrotum Anatomy 0.000 description 1
- 230000028043 self proteolysis Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 210000001625 seminal vesicle Anatomy 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 201000003708 skin melanoma Diseases 0.000 description 1
- 210000000813 small intestine Anatomy 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 210000002435 tendon Anatomy 0.000 description 1
- 208000001608 teratocarcinoma Diseases 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- 230000004797 therapeutic response Effects 0.000 description 1
- 210000002105 tongue Anatomy 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000005748 tumor development Effects 0.000 description 1
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 1
- 210000000626 ureter Anatomy 0.000 description 1
- 210000003708 urethra Anatomy 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 206010046766 uterine cancer Diseases 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- 210000001215 vagina Anatomy 0.000 description 1
- 201000010653 vesiculitis Diseases 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000004017 vitrification Methods 0.000 description 1
- 210000003905 vulva Anatomy 0.000 description 1
- 239000008096 xylene Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biotechnology (AREA)
- Genetics & Genomics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Public Health (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Bioethics (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- General Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
本出願は、2020年10月30日に出願された「SYSTEMS AND METHODS FOR DECONVOLUTION OF GENE EXPRESSION DATA」という名称の米国仮特許出願第63/108,262号、及び2020年3月12日に出願された「MACHINE LEARNING SYSTEMS AND METHODS FOR DECONVOLUTION OF GENE EXPRESSION DATA」という名称の米国仮特許出願第62/988,700号の米国特許法第119条(e)項に基づく利益を主張するものであり、これはそれぞれその全体が参照により本明細書に組み込まれる。
一部の実施形態では、本発明者らによって開発された細胞性デコンボリューション手法は、特定の細胞型について細胞構成比率を決定するために、ある特定の遺伝子発現データのみを使用する工程を伴い得る。例えば、一部の実施形態では、少なくとも図2A~図2Cに関するものを含めて本明細書に記載されるように、特定の細胞型に特異的及び/又は半特異的な遺伝子の発現データのみを使用することができる。一部の実施形態では、特定の細胞型(例えば、非悪性細胞型)に特異的及び/又は半特異的な遺伝子が固有に発現するように、悪性細胞(例えば、がん細胞株)において高発現される遺伝子(例えば、腫瘍細胞に特異的な)を除外することができる。一部の実施形態では、特定の細胞型に特異的及び/又は半特異的な遺伝子を選択する工程は、以下の手法のいずれか又はすべてを実施する工程を含み得る:文献分析、統計的Kruskal-Wallis検定(ノンパラメトリックANOVA類似)による倍数変化分析、Conover-Iman検定(多重比較のためのノンパラメトリックペアワイズ検定)、及び/又は図1C~図1DからのRNA-seqデータを使用する相関分析。
一部の実施形態によれば、RNA発現データの試料は、少なくとも図1C~図1Dに関するものを含めて本明細書に記載されるように得ることができる。例えば、選別された悪性細胞及び微小環境細胞の多数の試料を使用して、RNA発現データの人工的混合物を構築することができる。一部の実施形態では、試料の数は、Table 1(表1)に含まれる試料の数と同程度であってもよい。一部の実施形態では、試料の数は、少なくとも5,000個、少なくとも10,000個、少なくとも15,000個、少なくとも20,000個、少なくとも30,000個、少なくとも50,000個、少なくとも100,000個、又は任意の数の好適な試料であり得る。一部の実施形態では、オープンソースのデータセット、例えば、Gene Expression Omnibus(GEO)及びArrayExpressを使用することができる。一部の実施形態では、使用されるデータセットは、以下の基準を満たすように選択される: ヒト(homo sapiens)のみ、リード長が31bpを上回る標準RNA-seq(ポリA枯渇なし、標的化パネル等)。一部の実施形態では、人工的混合物を構築するために、分析される特定の疾患(例えば、特定の種類の腫瘍)に該当する細胞型のみを使用することができる。対照的に、少なくとも図1Eに関するものを含めて本明細書に記載されるように、遺伝子発現特異性の分析に、すべての細胞型についてのデータを代わりに使用することもできる。
一部の実施形態によれば、本明細書において上述されるように調製された試料を使用して、RNA発現データの種々の人工的混合物(例えば、シミュレートされた腫瘍組織を表す)を構築することができる。人工的混合物を、試料発現を使用してTPM(100万あたりの転写物)単位で生成し、試料全体についての遺伝子発現がその試料からの個々の細胞の発現の線形結合として形成されるようにすることができる。一部の実施形態では、本明細書で以下に記載されるように、様々な細胞型の試料からのRNA発現データを既定の比率で混合することができる。図6Aに示されているように、悪性細胞についてのシミュレートされたRNA発現データ(例えば、分岐610に示すように生成される)を、微小環境細胞についてのシミュレートされたRNA発現データ(例えば、分岐620に示すように生成される)と組み合わせることができる。
一部の実施形態では、各細胞型について複数の試料を任意の好適な様式で、平均化することができる(例えば、人工的ノイズを加える前に試料の品質を改善するために)。例えば、一部の実施形態では、平均化する工程は、2回ずつの群で行うことができ、例えば、400万個のリードの平均化された試料は、800万個のリードの情報を含み得る。一部の実施形態では、複数の試料にわたって平均化する工程は、シーケンシング中の技術的要因によって引き起こされる発現のノイズを減らし得る。
異なるデータセット及び細胞サブタイプでは、入手可能な細胞試料の数が大きく異なる可能性があるため、一部の実施形態では、試料の数をリバランシングすることができる。本明細書で以下に記載されるように、1つの例では、試料をデータセットごとにリバランシングして、次いで細胞のサブタイプごとにリバランシングすることができる。次いで、リバランシングされた数の試料から、numav個の試料を選択することができる。
一部の実施形態では、データセット内の選別された細胞の試料の数は、1から数百(例えば、少なくとも5個、少なくとも10個、少なくとも50個、又は少なくとも100個の試料)の範囲であってよい。典型的には、各データセットは、同じ方法で選別及びシーケンシングが行われた1つ又は2つの細胞型の試料を含んでよい。同じデータセット内の細胞試料は、選別のための特定のマーカーセット、又は細胞を採取した患者の特定の疾患等の特定の条件をも有してもよい。多数の試料を有するデータセットは、そのようなデータセットのモデルの過剰訓練を招くおそれがある。多数の試料を有するデータセットの重みを減らすために、すべてのデータセットの試料が、データセットごとにリバランシングするためにリサンプリングされる。
いくつかの細胞型については、この型の試料に加えて、より特定のサブタイプの試料が存在してもよい。入手可能なサブタイプ試料の数は、場合によっては、これらのサブタイプとの混合物の形成の際に指定された比率と一致しないことがある。このため、細胞型について混合物を作り出す場合に、そのサブタイプの試料をリバランシングすることができる。
Psubtype*msize/minP+1
に等しい数の試料を置き換えた上でリサンプリングを行う。
式中、Psubtypeは、所与のサブタイプの割合を反映する数であり(例えば、所与の型についてのすべてのサブタイプの中でのこのサブタイプの割合。これはこのサブタイプについての試料の数をこのタイプについての試料の総数で除算した値として表すことができる)、msizeは、所与の型のすべてのサブタイプの中での試料の最大数であり、minPは、すべてのサブタイプ間でのPsubtypeの最小数である。一部の実施形態によれば、リバランシングの操作は、入れ子になったすべてのサブタイプ(例えば、それ自体がサブタイプを有するサブタイプ)について再帰的に実施することができる。
一部の実施形態によれば、結果として得られた複数の異なる細胞型の試料を、シミュレートされた微小環境細胞RNA発現データを生成するために、互いにランダムな比で混合することができる。例えば、ランダムな割合の各細胞型を使用して、人工的混合物の第1のセットを生成することができ、
図6Aに示されているように、人工的混合物が生成された後に、RNA発現データに、ノイズ(例えば、技術的ノイズ、均一なノイズ、又は任意の好適な形式のノイズ)を加えることができる。例えば、以下に記載されるプロセスに従って、ノイズが生成され、RNA発現データに加えられる。
式中、μTiは、遺伝子の真の発現を表し、
式中、liは、有効遺伝子長であり、Tjは技術的反復物における平均TPMであり、Rはリードカウントであり、αは推定比例係数である。この式によると、カバレッジが低いほどばらつきが大きい。この式によると、発現量の少ない遺伝子ではポワソンノイズのレベルが高くなると考えられる。
図6Aに示されているように、本発明者らによって開発された手法に従って非線形回帰モデルを訓練する工程は、一部の実施形態では、モデルについてのパラメーターを推定及び/又はアップデートする工程を含み得る。本明細書に記載されるように、モデルについてのパラメーターには、モデルについて学習された重み以外に、本明細書でハイパーパラメーターと称されるいくつかのパラメーターが含まれ得る(例えば、少なくとも図4に関するものを含めて本明細書に記載されるように)。そのようなハイパーパラメーター及びそれらの値の例示的な一覧は、Table 9(表9)に示されている。
本明細書に記載される機械学習モデルは、数万個、数十万個、又は数百万個のパラメーターを含み得ることを理解すべきである。例えば、非線形回帰モデル304は、少なくとも図2~図6に関するものを含めて本明細書に記載されるように、少なくとも1万個のパラメーター、少なくとも10万個のパラメーター、又は少なくとも100万個のパラメーターを含み得る。そのため、非線形回帰モデル304のような機械学習モデルによるデータを処理する工程は、それらが訓練を受けた後であっても数百万回の計算を実施する必要があり、人がコンピュータなしに頭の中で行うことは現実的には不可能である。
本明細書の以下には、本発明者らによって開発された手法を使用して達成された種々の結果が、図7A~図7Gに関して記載される。本明細書に記載されるように、本発明者らによって開発された手法は、細胞性デコンボリューションのための従来の手法を実質的に上回る性能を有する。図中では、本発明者らによって開発された細胞性デコンボリューション手法を、「カサンドラ」と称することがある。
本発明者らによって開発された手法の一部の実施形態によれば、細胞性デコンボリューションの線形法を提供することができる。例示的な線形デコンボリューション手法が、図8及び図9A~図9Cに関して本明細書で以下に記載される。
方法、システム、又は他の特許請求される要素はいずれも、対象からの生体試料を使用するか、又はそれを分析するために使用することができる。一部の実施形態では、生体試料は、がんを有する対象、がんを有する疑いのある対象、又はがんを有するリスクのある対象から得られる。生体試料は、例えば、体液の生体試料(例えば、血液、尿若しくは脳脊髄液)、1つ若しくは複数の細胞(例えば、口腔粘膜検体採取若しくは気管ブラッシング等の擦過若しくはブラッシングによる)、組織片(頬組織、筋肉組織、肺組織、心臓組織、脳組織、若しくは皮膚組織)、若しくは臓器(脳、肺、肝臓、膀胱、腎臓、膵臓、腸、若しくは筋肉等)の一部若しくは全部を含む任意の種類の生体試料、又は他の種類の生体試料(例えば、糞若しくは毛髪)であってよい。
本開示の諸態様は、対象から得られた生体試料に関する。一部の実施形態では、対象は、哺乳類(例えば、ヒト、マウス、ネコ、イヌ、ウマ、ハムスター、ウシ、ブタ、又は他の家畜)である。一部の実施形態では、対象は、ヒトである。一部の実施形態では、対象は、成人(例えば、18歳以上)である。一部の実施形態では、対象は、子供(例えば、18歳未満)である。一部の実施形態では、ヒト対象は、少なくとも1つの形態のがんを有する、又は少なくとも1つの形態のがんを有すると診断されている人である。一部の実施形態では、対象が罹患しているがんは、癌腫、肉腫、骨髄腫、白血病、リンパ腫、又は癌腫、肉腫、骨髄腫、白血病、及びリンパ腫のうちの複数を含む混合型のがんである。癌腫とは、上皮性起源の悪性新生物又は身体の内膜又は外膜のがんを指す。肉腫は、骨、腱、軟骨、筋肉、及び脂肪等の支持組織及び結合組織に由来するがんを指す。骨髄腫は、骨髄の形質細胞に由来するがんである。白血病(「液状がん」又は「血液がん」)は、骨髄(血球産生の部位)のがんである。リンパ腫は、体液を浄化し、感染と闘う白血球、又はリンパ球を産生する血管、結節、臓器(特に脾臓、扁桃腺、胸腺)の網状組織であるリンパ系の腺又は結節で発生する。混合型のがんの非限定的な例は、腺扁平上皮がん、混合中胚葉性腫瘍、がん肉腫、及び奇形がんを含む。一部の実施形態では、対象は、腫瘍を有する。腫瘍は、良性又は悪性であり得る。一部の実施形態では、がんは、皮膚がん、肺がん、乳がん、前立腺がん、結腸がん、直腸がん、子宮頸がん、及び子宮がんのうちのいずれか1つである。一部の実施形態では、対象は、例えば、対象が1つ又は複数の遺伝的危険因子を有するか、又は1つ若しくは複数の発がん物質(例えば、タバコの煙、又は噛みタバコ)に曝露されたことがあるか、若しくは曝露されているという理由から、がんを発症するリスクがある。
複数の遺伝子の発現データ(例えば、発現レベルを示す)は、本明細書に記載される方法又は組成物のいずれにも使用することができる。調べ得る遺伝子の数は、対象の遺伝子の最大ですべてを含む数までであり得る。一部の実施形態では、対象のすべての遺伝子について発現レベルを調べることができる。非限定的な例として、4個若しくはそれ以上、5個若しくはそれ以上、6個若しくはそれ以上、7個若しくはそれ以上、8個若しくはそれ以上、9個若しくはそれ以上、10個若しくはそれ以上、11個若しくはそれ以上、12個若しくはそれ以上、13個若しくはそれ以上、14個若しくはそれ以上、15個若しくはそれ以上、16個若しくはそれ以上、17個若しくはそれ以上、18個若しくはそれ以上、19個若しくはそれ以上、20個若しくはそれ以上、21個若しくはそれ以上、22個若しくはそれ以上、23個若しくはそれ以上、24個若しくはそれ以上、25個若しくはそれ以上、26個若しくはそれ以上、27個若しくはそれ以上、28個若しくはそれ以上、29個若しくはそれ以上、30個若しくはそれ以上、35個若しくはそれ以上、40個若しくはそれ以上、50個若しくはそれ以上、60個若しくはそれ以上、70個若しくはそれ以上、80個若しくはそれ以上、90個若しくはそれ以上、100個若しくはそれ以上、125個若しくはそれ以上、150個若しくはそれ以上、175個若しくはそれ以上、200個若しくはそれ以上、225個若しくはそれ以上、250個若しくはそれ以上、275個若しくはそれ以上、又は300個若しくはそれ以上の遺伝子を、本明細書に記載されるいずれかの評価に使用することができる。非限定的な例の別のセットとして、発現データには、Table 2(表2)に列挙されている各細胞型について、Table 2(表2)におけるその細胞型についての遺伝子の群から選択される少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも35個、少なくとも50個、少なくとも75個、少なくとも100個の遺伝子の発現データを含めることができる。
一部の実施形態では、RNA発現データ(例えば、RNAシーケンシングから得られたデータ(本明細書ではRNA-seqデータとも称する))を処理する方法は、対象(例えば、がんを有する対象、又はがんと診断された対象)についてRNA発現データを得る工程を含む。一部の実施形態では、RNA発現データを得る工程は、生体試料を得て、本明細書に記載されるRNAシーケンシング方法のいずれかを使用してRNAシーケンシングを行うためにそれを処理する工程を含む。一部の実施形態では、RNA発現データは、RNA発現データを得るための実験を実施した実験室又は施設(例えば、RNA-seqを行った実験室又は施設)から得られる。一部の実施形態では、実験室又は施設は、医療検査室又は医療施設である。
一部の実施形態では、RNA発現データ(例えば、RNAシーケンシングから得られたデータ(本明細書ではRNA-seqデータとも称する))を処理する方法は、RNA発現データの中の遺伝子をヒトゲノムの既知の配列とアラインメントさせてアノテーションを行って、アノテーション付きのRNA発現データを得る工程を含む。
一部の実施形態では、RNA発現データ(例えば、RNAシーケンシングから得られたデータ(本明細書ではRNA-seqデータとも称する))を処理する方法は、アノテーション付きRNA発現データから非コード転写物を除去する工程を含む。RNA発現データのアラインメント及びアノテーションにより、コード性リード及び非コード性リードの識別が可能になる。一部の実施形態では、分析の労力をタンパク質(例えば、がんの病理に関与している可能性のあるもの)の発現に集中させるために、転写産物の非コード性リードを除去する。一部の実施形態では、データから非コード転写物のリードを除去する工程により、例えば、同じ又は類似した試料(例えば、同じ細胞又は細胞型の核酸)の反復試験におけるデータの分散が減少する。一部の実施形態では、除去される発現データの非限定的な例には、以下からなるリストから選択される1つ又は複数の遺伝子群に属する1つ又は複数の非コード転写物(例えば、10~50個、50~100個、100~1,000個、1,000~2,500個、2,500~5,000個又はそれ以上の非コード転写物)が含まれる: 偽遺伝子、多型偽遺伝子、プロセシング偽遺伝子、転写されたプロセシング偽遺伝子、ユニタリー偽遺伝子、非プロセシング偽遺伝子、転写されたユニタリー偽遺伝子、定常鎖免疫グロブリン(IG C)偽遺伝子、結合鎖免疫グロブリン(IG J)偽遺伝子、可変鎖免疫グロブリン(IG V)偽遺伝子、転写された非プロセシング偽遺伝子、翻訳された非プロセシング偽遺伝子、結合鎖T細胞受容体(TR J)偽遺伝子、可変鎖T細胞受容体(TR V)偽遺伝子、核内低分子RNA(snRNA)、核小体低分子RNA(snRNA)、マイクロRNA(miRNA)、リボザイム、リボソームRNA(rRNA)、ミトコンドリアtRNA(Mt tRNA)、ミトコンドリアrRNA(Mt rRNA)、カハール小体特異的低分子RNA(scaRNA)、残留イントロン、センスイントロンRNA、センス重複RNA、ナンセンス変異依存分解RNA、ノンストップ分解RNA、アンチセンスRNA、長介在性非コードRNA(lincRNA)、マクロ長非コードRNA(マクロlncRNA)、プロセシング転写産物、3'重複非コードRNA(3'重複ncrna)、小型RNA(sRNA)、その他のRNA(misc RNA)、ボールトRNA(vaultRNA)、及びTEC RNA。
一部の実施形態では、RNA発現データ(例えば、RNAシーケンシングから得られたデータ(本明細書ではRNA-seqデータとも称する))を処理する方法は、読み取られた転写物の長さあたりのRNA発現データを、(例えば、100万あたりキロベースあたりの転写物(TPM)形式に)正規化する工程を含む。一部の実施形態では、転写物の長さあたりで正規化されたRNA発現データについてまずアラインメント及びアノテーションを行う。データのTPMへの変換により、カウントではなく濃度の形式での発現の提示が可能になり、これにより、総リードカウント及びリードの長さが異なる試料の比較が可能になる。
本明細書に記載される技術の実施形態の任意のもの(例えば、図2、図4、及び図6の方法等)と共に使用し得るコンピュータシステム1000の実装例が、図10に示されている。コンピュータシステム1000は、1つ又は複数のプロセッサ1010と、非一時的なコンピュータ読取り可能な記憶媒体(例えば、メモリ1020及び1つ又は複数の不揮発性記憶媒体1030)を含む1つ又は複数の製造品とを含む。プロセッサ1010は、メモリ1020及び不揮発性記憶デバイス1030へのデータの書き込み及び読み出しを、任意の好適な様式で制御することができるが、これは、本明細書に記載される技術の態様はこの点について限定されないためである。本明細書に記載される機能のいずれかを実施するために、プロセッサ1010は、プロセッサ1010による実行のためのプロセッサ実行可能命令を格納する非一時的なコンピュータ読取り可能な記憶媒体(例えば、メモリ1020)として機能する1つ又は複数の非一時的なコンピュータ読取り可能な記憶媒体に格納された、1つ又は複数のプロセッサ実行可能命令を実行することができる。
RNA転写物正規化の確立及びシーケンシング技術的ノイズの分析
本明細書において記載されるような、RNA転写物正規化の例示的プロセスを確立するため、及びシーケンシング技術的ノイズを分析するために実験を行った。
複数の正常組織及びがん組織のRNA-seqからの微小環境のデコンボリューション
複数の正常組織及びがん組織からのRNA-seqデータを使用して本明細書において記載される技術に従って、細胞性デコンボリューションを実施する実験を行った。図では、本発明者らによって開発された細胞性デコンボリューション技術は、「カサンドラ(Kassandra)」と呼ばれる場合もある。具体的には、細胞型及び/又はサブタイプにとって特異的及び/又は半特異的な遺伝子を選択し、人工的混合物を生成し、複数の非線形回帰モデルを訓練して、複数の細胞型の複数の細胞構成比率を決定し、訓練された非線形回帰モデルを使用して、細胞構成比率を決定する技術、並びに本明細書において記載される他の前処理及び後処理手法。
血液のシングルセルRNA-seq及びバルクRNA-seqのデコンボリューション
血液データのシングルセルRNA-seqデータ及びバルクRNA-seqを使用して本明細書において記載される技術に従って、細胞性デコンボリューションを実施する実験を行った。図では、本発明者らによって開発された細胞性デコンボリューション技術は、「カサンドラ」と呼ばれる場合もある。具体的には、人工的混合物を生成し、細胞型及び/又はサブタイプにとって特異的及び/又は半特異的な遺伝子を選択し、複数の非線形回帰モデルを訓練して、複数の細胞型の複数の細胞構成比率を決定し、訓練された非線形回帰モデルを使用して、細胞構成比率を決定する技術、並びに本明細書において記載される他の前処理及び後処理手法。
種々のがん組織からの微小環境のデコンボリューション
黒色腫、頭頸部癌及び肺癌を含むいくつかの腫瘍組織に由来するscRNA-seqデータを使用して本明細書において記載される技術に従って、細胞性デコンボリューションを実施する実験を行った。図では、本発明者らによって開発された細胞性デコンボリューション技術は、「カサンドラ」と呼ばれる場合もある。具体的には、人工的混合物を生成し、細胞型及び/又はサブタイプにとって特異的及び/又は半特異的な遺伝子を選択し、複数の非線形回帰モデルを訓練して、複数の細胞型の複数の細胞構成比率を決定し、訓練された非線形回帰モデルを使用して、細胞構成比率を決定する技術、並びに本明細書において記載される他の前処理及び後処理手法。
102 生体試料
104 シーケンシングプラットフォーム
106 配列情報
108 コンピュータデバイス
110 細胞構成比率
122 細胞型A
124 配列情報
126 モデルA
128 細胞構成比率
132 細胞型B
134 配列情報
136 モデルB
138 細胞構成比率
140 t-SNEプロット
142 サブタイプA
144 配列情報
146 モデルC
148 細胞構成比率
150 t-SNEプロット
152 腫瘍細胞
156 モデルD
158 細胞構成比率
160 細胞型
162 サブタイプB
164 配列情報
170 遺伝子の発現
180 細胞集団
182 腫瘍細胞株
190 遺伝子
192 遺伝子
200 方法、プロセス
202 動作
204 動作
206 動作
212 動作
214 動作
216 動作
216a 動作
216b 動作
218 動作
220 動作、実装例、方法
232 動作
234 動作
236 動作
302 原発性腫瘍試料
304 非線形回帰モデル
306 RNA比率
308 細胞型A
310 細胞型B
312 細胞型C
314 発現データ
316 発現データ
318 発現データ
320 非線形回帰モデル
322 非線形回帰モデル
324 非線形回帰モデル
326 第1のサブモデル
328 第1のサブモデル
330 第1のサブモデル
332 第1の値
334 第1の値
336 第1の値
338 第2のサブモデル
340 第2のサブモデル
342 第2のサブモデル
344 第2の値
346 第2の値
348 第2の値
350 式
360 RNA比率
370 細胞構成比率
380 方法
382 第1の工程
384 第2の工程
386 第3の工程
400 方法
402 動作
404 動作
406 動作
408 動作
500 方法
502 動作
510 動作
520 動作
530 図式
540 図式
550 パラメーター
600 方法
602 動作
604 リバランシング
608 動作
610 分岐
612 動作
614 動作
620 分岐
630 分岐
640 分枝、サーバー
650 分岐
702 RNA発現データ
704 RNA発現データ
800 方法
802 動作
804 動作
806 動作
1000 コンピュータシステム
1010 プロセッサ
1020 メモリ
1030 不揮発性記憶媒体
1040 ネットワーク入出力(I/O)インターフェイス
1050 ユーザーI/Oインターフェイス
1100 環境
1110 ネットワーク
1120 データベース
1130 コンピュータデバイス
1140 サーバー
1150 医師
1160 データベース
1170 実験室
1180 対象
Claims (70)
- 少なくとも1つのコンピュータハードウェアプロセッサを使用して、
生体試料について発現データを得る工程であって、前記生体試料は対象から事前に得られており、前記発現データは第1の細胞型に関連する第1の遺伝子のセットに関連する第1の発現データを含む、工程と、
前記発現データと第1の非線形回帰モデルを含む1つ又は複数の非線形回帰モデルとを使用して前記第1の細胞型について第1の細胞構成比率を決定する工程であって、前記第1の細胞構成比率は前記生体試料における前記第1の細胞型の細胞の推定比率を示し、前記第1の細胞型について前記第1の細胞構成比率を決定する工程は、
前記第1の発現データを前記第1の非線形回帰モデルによって処理して、前記第1の細胞型について前記第1の細胞構成比率を決定する工程、及び
前記第1の細胞構成比率を出力する工程
を含む、工程と
を実施する工程
を含む方法。 - 前記対象は、がんを有する、がんを有する疑いがある、又はがんを有するリスクがある、請求項1に記載の方法。
- 前記発現データは、RNA発現データである、請求項1又は2に記載の方法。
- 前記第1の発現データを前記第1の非線形回帰モデルによって処理する工程は、
前記第1の非線形回帰モデルへの入力として前記第1の発現データを提供して、前記第1の細胞型からのRNAの推定比率を表す対応する出力を得る工程と、
前記第1の細胞型からのRNAの前記推定比率に基づいて、前記第1の細胞型について前記第1の細胞構成比率を決定する工程と
を含む、請求項3又は請求項1若しくは2のいずれか一項に記載の方法。 - 前記発現データは、前記第1の細胞型に関連する前記第1の遺伝子のセットに関連する第2の発現データを含み、
前記第1の非線形回帰モデルは、
前記第1の発現データを入力として使用して、前記第1の細胞型からのRNAの前記推定比率についての第1の値を生成するように構成された第1のサブモデルと、
第2の発現データと前記第1の細胞型からのRNAの前記推定比率についての前記第1の値とを入力として使用して、前記第1の細胞型からのRNAの前記推定比率についての第2の値を生成するように構成された第2のサブモデルと
を含む、請求項4又は請求項1から3のいずれか一項に記載の方法。 - 前記発現データは、前記第1の細胞型とは異なる第2の細胞型に関連する第2の遺伝子のセットに関連する第2の発現データを含み、
前記1つ又は複数の非線形回帰モデルは第2の非線形回帰モデルを含み、
前記方法は、少なくとも一部には、前記第2の細胞型について第2の細胞構成比率を決定するために前記第2の発現データを前記第2の非線形回帰モデルによって処理することによって、前記第2の細胞型について前記第2の細胞構成比率を決定する工程を更に含む、
請求項1又は請求項2から5のいずれか一項に記載の方法。 - 前記第1の細胞型は、B細胞、CD4+ T細胞、CD8+ T細胞、内皮細胞、線維芽細胞、リンパ球、マクロファージ、単球、NK細胞、好中球、及びT細胞からなる群から選択される、請求項1又は請求項2から6のいずれか一項に記載の方法。
- 前記第1の発現データは、Table 2(表2)における前記第1の細胞型についての遺伝子の群から選択される少なくとも10個の遺伝子についての発現データを含む、請求項1又は請求項2から7のいずれか一項に記載の方法。
- 前記発現データは、各々の複数の細胞型に関連する複数の遺伝子セットに関連する発現データを含み、前記複数の遺伝子セットは、前記第1の遺伝子セットと前記第1の細胞型を含む前記複数の細胞型とを含み、
前記1つ又は複数の非線形回帰モデルは複数の非線形回帰モデルを含み、
前記方法は、前記複数の遺伝子セットに関連する前記発現データを使用して前記複数の細胞型について複数の細胞構成比率を決定する工程を更に含み、前記複数の細胞構成比率は前記第1の細胞構成比率を含み、前記複数の細胞構成比率を決定する工程は、
前記複数の細胞型の各細胞型について、少なくとも一部には、前記細胞型について前記細胞構成比率を決定するために前記複数の非線形回帰モデルのうちの各々の非線形回帰モデルを使用して、前記細胞型に関連する遺伝子のセットに関連する発現データを処理することによって、前記細胞型について各々の細胞構成比率を決定する工程を含む、
請求項1又は請求項2から8のいずれか一項に記載の方法。 - 前記複数の遺伝子セットにおける遺伝子は、Table 2(表2)における遺伝子の群から選択される少なくとも25個の遺伝子を含み、前記複数の細胞構成比率を決定する工程は、前記少なくとも25個の遺伝子について発現データを処理する工程を含む、請求項9又は請求項1から8のいずれか一項に記載の方法。
- 前記複数の遺伝子セットにおける遺伝子は、Table 2(表2)における遺伝子の群から選択される少なくとも35個の遺伝子を含み、前記複数の細胞構成比率を決定する工程は、前記少なくとも35個の遺伝子について発現データを処理する工程を含む、請求項9又は請求項1から8又は請求項10のいずれか一項に記載の方法。
- 前記複数の遺伝子セットにおける遺伝子は、Table 2(表2)における遺伝子の群から選択される少なくとも50個の遺伝子を含み、前記複数の細胞構成比率を決定する工程は、前記少なくとも50個の遺伝子について発現データを処理する工程を含む、請求項9又は請求項1から8又は請求項10若しくは11のいずれか一項に記載の方法。
- 前記複数の遺伝子セットにおける遺伝子は、Table 2(表2)における遺伝子の群から選択される少なくとも75個の遺伝子を含み、前記複数の細胞構成比率を決定する工程は、前記少なくとも75個の遺伝子について発現データを処理する工程を含む、請求項9又は請求項1から8又は請求項10から12のいずれか一項に記載の方法。
- 前記複数の遺伝子セットにおける遺伝子は、Table 2(表2)における遺伝子の群から選択される少なくとも100個の遺伝子を含み、前記複数の細胞構成比率を決定する工程は、前記少なくとも100個の遺伝子について発現データを処理する工程を含む、請求項9又は請求項1から8又は請求項10から13のいずれか一項に記載の方法。
- 前記1つ又は複数の非線形回帰モデルは、1つ又は複数のランダムフォレスト回帰モデルを含む、請求項1又は請求項2から14のいずれか一項に記載の方法。
- 前記1つ又は複数の非線形回帰モデルは、1つ又は複数のニューラルネットワーク回帰モデルを含む、請求項1又は請求項2から15のいずれか一項に記載の方法。
- 前記1つ又は複数の非線形回帰モデルは、1つ又は複数のサポートベクターマシン回帰モデルを含む、請求項1又は請求項2から16のいずれか一項に記載の方法。
- 前記第1の非線形回帰モデルは、少なくとも一部には、
シミュレートされた発現データを得る工程と、
前記シミュレートされた発現データを使用して、前記第1の非線形回帰モデルを訓練する工程と
によって訓練されている、請求項1又は請求項2から17のいずれか一項に記載の方法。 - 前記シミュレートされた発現データを得る工程と、
前記シミュレートされた発現データを使用して、前記第1の非線形回帰モデルを訓練する工程と
を更に含む、請求項18又は請求項1から17のいずれか一項に記載の方法。 - 前記シミュレートされた発現データを得る工程は、前記シミュレートされた発現データを生成する工程を含み、前記シミュレートされた発現データを生成する工程は、
1つ又は複数の生体試料からRNA発現データのセットを得る工程であって、前記RNA発現データのセットは微小環境細胞発現データ及び悪性細胞発現データを含む、工程と、
前記微小環境細胞発現データを使用して、シミュレートされた微小環境細胞発現データを生成する工程と、
前記悪性細胞発現データを使用して、シミュレートされた悪性細胞発現データを生成する工程と、
前記シミュレートされた微小環境細胞発現データと前記シミュレートされた悪性細胞発現データとを組み合わせて、前記シミュレートされた発現データの少なくとも一部を作成する工程と
を含む、請求項18又は請求項1から17又は請求項19のいずれか一項に記載の方法。 - 前記第1の細胞型についての発現プロファイル及び前記第1の細胞型についての前記第1の細胞構成比率を使用して、悪性腫瘍発現プロファイルを決定する工程、
を更に含む、請求項1又は請求項2から20のいずれか一項に記載の方法。 - 前記第1の非線形回帰モデルは、
シミュレートされたRNA発現データを含む訓練データを得る工程であって、前記シミュレートされたRNA発現データは、前記第1の細胞型に関連する前記第1の遺伝子のセットについての第1のRNA発現データを含む、工程と、
前記第1の細胞型からのRNAの比率を推定するために前記第1の非線形回帰モデルを訓練する工程であって、前記訓練する工程は、
前記第1の非線形回帰モデル及び前記第1のRNA発現データを使用して、前記第1の細胞型からのRNAの推定比率を生成する工程、及び
前記第1の細胞型からのRNAの前記推定比率を使用して、前記第1の非線形回帰モデルのパラメーターをアップデートする工程
を含む、工程と
によって訓練されている、請求項1又は請求項2から21のいずれか一項に記載の方法。 - 少なくとも1つのハードウェアプロセッサと、
前記少なくとも1つのハードウェアプロセッサによって実行されると、前記少なくとも1つのハードウェアプロセッサに、
生体試料について発現データを得る工程であって、前記生体試料が対象から事前に得られており、前記発現データが第1の細胞型に関連する第1の遺伝子のセットに関連する第1の発現データを含む、工程と、
前記発現データと第1の非線形回帰モデルを含む1つ又は複数の非線形回帰モデルとを使用して、前記第1の細胞型について第1の細胞構成比率を決定する工程であって、前記第1の細胞構成比率は、前記生体試料における前記第1の細胞型の細胞の推定比率を示し、
前記第1の細胞型について前記第1の細胞構成比率を決定する工程は、
前記第1の発現データを前記第1の非線形回帰モデルによって処理して、前記第1の細胞型について前記第1の細胞構成比率を決定する工程、及び
前記第1の細胞構成比率を出力する工程
を含む、工程と
を実施させるプロセッサ実行可能命令を格納する少なくとも1つの非一時的なコンピュータ読取り可能な記憶媒体と
を含むシステム。 - 少なくとも1つのハードウェアプロセッサによって実行されると、前記少なくとも1つのハードウェアプロセッサに、
生体試料について発現データを得る工程であって、前記生体試料が対象から事前に得られており、前記発現データが第1の細胞型に関連する第1の遺伝子のセットに関連する第1の発現データを含む、工程と、
前記発現データと第1の非線形回帰モデルを含む1つ又は複数の非線形回帰モデルとを使用して、前記第1の細胞型について第1の細胞構成比率を決定する工程であって、前記第1の細胞構成比率は、前記生体試料における前記第1の細胞型の細胞の推定比率を示し、
前記第1の細胞型について前記第1の細胞構成比率を決定する工程は、
前記第1の発現データを前記第1の非線形回帰モデルによって処理して、前記第1の細胞型について前記第1の細胞構成比率を決定する工程、及び
前記第1の細胞構成比率を出力する工程
を含む、工程と
を実施させるプロセッサ実行可能命令を格納する少なくとも1つの非一時的なコンピュータ読取り可能な記憶媒体。 - 少なくとも1つのコンピュータハードウェアプロセッサを使用して、
生体試料についてRNA発現データを得る工程であって、前記生体試料は、がんを有する、がんを有する疑いがある、又はがんを有するリスクがある対象から事前に得られており、
前記RNA発現データは、第1の細胞型に関連する第1の遺伝子のセットに関連する第1のRNA発現データを含み、
前記第1のRNA発現データは、Table 2(表2)における前記第1の細胞型についての遺伝子の群から選択される少なくとも10個の遺伝子についての発現データを含み、
前記第1の細胞型は、B細胞、CD4+ T細胞、CD8+ T細胞、内皮細胞、線維芽細胞、リンパ球、マクロファージ、単球、NK細胞、好中球、及びT細胞からなる群から選択される、工程と、
前記第1のRNA発現データを使用して、前記第1の細胞型について第1の細胞構成比率を決定する工程であって、前記第1の細胞構成比率は、前記生体試料における前記第1の細胞型の細胞の推定比率を示し、前記第1の細胞型について前記第1の細胞構成比率を決定する工程は、
第1の非線形回帰モデルへの入力として前記第1のRNA発現データを提供して、前記第1の細胞型からのRNAの推定比率を表す対応する出力を得る工程、及び
前記第1の細胞型からのRNAの前記推定比率に基づいて、前記第1の細胞型について前記第1の細胞構成比率を決定する工程
を含む、工程と
を実行する工程を含む方法。 - 前記RNA発現データは、前記第1の細胞型に関連する前記第1の遺伝子のセットに関連する第2のRNA発現データを含み、
前記第1の非線形回帰モデルは、
前記第1のRNA発現データを入力として使用して、前記第1の細胞型からのRNAの前記推定比率についての第1の値を生成するように構成された第1のサブモデルと、
前記第2の発現データと前記第1の細胞型からのRNAの前記推定比率についての前記第1の値とを入力として使用して、前記第1の細胞型からのRNAの前記推定比率についての第2の値を生成するように構成された第2のサブモデルと
を含む、請求項25に記載の方法。 - 前記RNA発現データは、第2の細胞型に関連する第2の遺伝子のセットに関連する第2のRNA発現データを含み、
前記第2のRNA発現データは、Table 2(表2)における前記第2の細胞型についての遺伝子の群から選択される少なくとも10個の遺伝子についての発現データを含み、
前記第2の細胞型は、B細胞、CD4+ T細胞、CD8+ T細胞、内皮細胞、線維芽細胞、リンパ球、マクロファージ、単球、NK細胞、好中球、及びT細胞からなる群から選択され、並びに
前記第2の細胞型について第2の細胞構成比率を決定する工程は、
前記第2のRNA発現データを第2の非線形回帰モデルによって処理して、前記第2の細胞型について前記第2の細胞構成比率を決定する工程
を含む、請求項25又は請求項1から22又は請求項26のいずれか一項に記載の方法。 - 前記RNA発現データは、各々の複数の細胞型に関連する複数の遺伝子セットに関連するRNA発現データを含み、前記複数の遺伝子セットは、第1の遺伝子セットと前記第1の細胞型を含む前記複数の細胞型とを含み、
前記方法は、前記複数の遺伝子セットに関連する前記RNA発現データを使用して、前記複数の細胞型について複数の細胞構成比率を決定する工程を更に含み、前記複数の細胞構成比率は前記第1の細胞構成比率を含み、前記複数の細胞構成比率を決定する工程は、
前記複数の細胞型の各細胞型について、少なくとも一部には、前記細胞型について前記細胞構成比率を決定するために各々の非線形回帰モデルを使用して、前記細胞型に関連する遺伝子のセットに関連するRNA発現データを処理することによって、前記細胞型について各々の細胞構成比率を決定する工程
を含む、請求項25又は請求項1から22又は請求項26若しくは27のいずれか一項に記載の方法。 - 前記第1の非線形回帰モデルは、ランダムフォレスト回帰モデルを含む、請求項25又は請求項1から22又は請求項26から28のいずれか一項に記載の方法。
- 前記第1の非線形回帰モデルは、ニューラルネットワーク回帰モデルを含む、請求項25又は請求項1から22又は請求項26から29のいずれか一項に記載の方法。
- 前記第1の非線形回帰モデルは、サポートベクターマシン回帰モデルを含む、請求項25又は請求項1から22又は請求項26から30のいずれか一項に記載の方法。
- 前記第1の非線形回帰モデルは、少なくとも一部には、シミュレートされたRNA発現データを含む訓練データを生成する工程によって訓練されており、前記訓練データを生成する工程は、
1つ又は複数の生体試料からRNA発現データのセットを得る工程であって、前記RNA発現データのセットは、微小環境細胞RNA発現データ及び悪性細胞RNA発現データを含む、工程と、
前記微小環境細胞RNA発現データを使用して、シミュレートされた微小環境細胞RNA発現データを生成する工程と、
前記悪性細胞RNA発現データを使用して、シミュレートされた悪性細胞RNA発現データを生成する工程と、
前記シミュレートされた微小環境細胞RNA発現データと前記シミュレートされた悪性細胞RNA発現データとを組み合わせて、前記シミュレートされたRNA発現データの少なくとも一部を作成する工程と
を含む、請求項25又は請求項1から22又は請求項26から31のいずれか一項に記載の方法。 - 前記第1の細胞型についてのRNA発現プロファイル及び前記第1の細胞型についての前記第1の細胞構成比率を使用して、悪性腫瘍発現プロファイルを決定する工程、
を更に含む、請求項25又は請求項1から22又は請求項26から32のいずれか一項に記載の方法。 - 前記第1のRNA発現データは、Table 2(表2)における遺伝子の群から選択される少なくとも25個の遺伝子についての発現データを含む、請求項25又は請求項1から22又は請求項26から33のいずれか一項に記載の方法。
- 前記第1のRNA発現データは、Table 2(表2)における遺伝子の群から選択される少なくとも50個の遺伝子についての発現データを含む、請求項25又は請求項1から22又は請求項26から34のいずれか一項に記載の方法。
- 前記第1のRNA発現データは、Table 2(表2)における遺伝子の群から選択される少なくとも100個の遺伝子についての発現データを含む、請求項25又は請求項1から22又は請求項26から35のいずれか一項に記載の方法。
- 前記第1の非線形回帰モデルは、
シミュレートされたRNA発現データを含む訓練データを得る工程であって、前記シミュレートされたRNA発現データは、前記第1の細胞型に関連する前記第1の遺伝子のセットについての第2のRNA発現データを含む、工程と
前記第1の細胞型からのRNAの比率を推定するために前記第1の非線形回帰モデルを訓練する工程であって、前記訓練する工程は、
前記第1の非線形回帰モデル及び前記第2のRNA発現データを使用して、前記第1の細胞型からのRNAの推定比率を生成する工程、並びに
前記第1の細胞型からのRNAの前記推定比率を使用して、前記第1の非線形回帰モデルのパラメーターをアップデートする工程
を含む工程と
によって訓練されている、請求項25又は請求項1から22又は請求項26から36のいずれか一項に記載の方法。 - 少なくとも1つのハードウェアプロセッサと、
前記少なくとも1つのハードウェアプロセッサによって実行されると、前記少なくとも1つのハードウェアプロセッサに、
生体試料についてRNA発現データを得る工程であって、前記生体試料は、がんを有する、がんを有する疑いがある、又はがんを有するリスクがある対象から事前に得られており、
前記RNA発現データは、第1の細胞型に関連する第1の遺伝子のセットに関連する第1のRNA発現データを含み、
前記第1のRNA発現データは、Table 2(表2)における前記第1の細胞型についての遺伝子の群から選択される少なくとも10個の遺伝子についての発現データを含み、
前記第1の細胞型は、B細胞、CD4+ T細胞、CD8+ T細胞、内皮細胞、線維芽細胞、リンパ球、マクロファージ、単球、NK細胞、好中球、及びT細胞からなる群から選択される、工程と、
前記第1のRNA発現データを使用して、前記第1の細胞型について第1の細胞構成比率を決定する工程であって、前記第1の細胞構成比率は、前記生体試料における前記第1の細胞型の細胞の推定比率を示し、前記第1の細胞型について前記第1の細胞構成比率を決定する工程は、
第1の非線形回帰モデルへの入力として前記第1のRNA発現データを提供して、前記第1の細胞型からのRNAの推定比率を表す対応する出力を得る工程、及び
前記第1の細胞型からのRNAの前記推定比率に基づいて、前記第1の細胞型について前記第1の細胞構成比率を決定する工程
を含む、工程と
を実施させるプロセッサ実行可能命令を格納する少なくとも1つの非一時的なコンピュータ読取り可能な記憶媒体と
を含むシステム。 - 少なくとも1つのハードウェアプロセッサによって実行されると、前記少なくとも1つのハードウェアプロセッサに、
生体試料についてRNA発現データを得る工程であって、前記生体試料は、がんを有する、がんを有する疑いがある、又はがんを有するリスクがある対象から事前に得られており、
前記RNA発現データは、第1の細胞型に関連する第1の遺伝子のセットに関連する第1のRNA発現データを含み、
前記第1のRNA発現データは、Table 2(表2)における前記第1の細胞型についての遺伝子の群から選択される少なくとも10個の遺伝子についての発現データを含み、
前記第1の細胞型は、B細胞、CD4+ T細胞、CD8+ T細胞、内皮細胞、線維芽細胞、リンパ球、マクロファージ、単球、NK細胞、好中球、及びT細胞からなる群から選択される、工程と、
前記第1のRNA発現データを使用して、前記第1の細胞型について第1の細胞構成比率を決定する工程であって、前記第1の細胞構成比率は、前記生体試料における前記第1の細胞型の細胞の推定比率を示し、前記第1の細胞型について前記第1の細胞構成比率を決定する工程は、
第1の非線形回帰モデルへの入力として前記第1のRNA発現データを提供して、前記第1の細胞型からのRNAの推定比率を表す対応する出力を得る工程、及び
前記第1の細胞型からのRNAの前記推定比率に基づいて、前記第1の細胞型について前記第1の細胞構成比率を決定する工程
を含む、工程と
を実施させるプロセッサ実行可能命令を格納する少なくとも1つの非一時的なコンピュータ読取り可能な記憶媒体。 - 少なくとも1つのコンピュータハードウェアプロセッサを使用して、
シミュレートされたRNA発現データを含む訓練データを得る工程であって、前記シミュレートされたRNA発現データは、第1の細胞型に関連する第1の遺伝子についての第1のRNA発現データ及び前記第1の細胞型とは異なる第2の細胞型に関連する第2の遺伝子についての第2のRNA発現データを含む、工程と、
1つ又は複数の各々の細胞型からのRNAの比率を推定するために複数の非線形回帰モデルを訓練する工程であって、前記複数の非線形回帰モデルは、前記第1の細胞型からのRNAの比率を推定するための第1の非線形回帰モデル及び前記第2の細胞型からのRNAの比率を推定するための第2の非線形回帰モデルを含み、前記複数の非線形回帰モデルを訓練する工程は、前記第1の非線形回帰モデルを、少なくとも一部には、
前記第1の非線形回帰モデル及び前記第1のRNA発現データを使用して、前記第1の細胞型からのRNAの推定比率を生成する工程、及び
前記第1の細胞型からのRNAの前記推定比率を使用して、前記第1の非線形回帰モデルのパラメーターをアップデートする工程
によって訓練する工程を含む、工程と、
前記第1の非線形回帰モデル及び前記第2の非線形回帰モデルを含む前記訓練された複数の非線形回帰モデルを出力する工程と
を実行する工程を含む方法。 - 前記訓練データを得る工程は、
1つ又は複数の生体試料からRNA発現データのセットを得る工程であって、前記RNA発現データのセットは、微小環境細胞RNA発現データ及び悪性細胞RNA発現データを含む、工程と
前記微小環境細胞RNA発現データに基づいて、シミュレートされた微小環境細胞RNA発現データを得る工程と、
前記悪性細胞RNA発現データに基づいて、シミュレートされた悪性細胞RNA発現データを得る工程と、
前記シミュレートされた微小環境細胞RNA発現データと前記シミュレートされた悪性細胞RNA発現データとを組み合わせて、前記シミュレートされたRNA発現データの少なくとも一部を作成する工程と
によって、前記シミュレートされたRNA発現データの前記少なくとも一部を生成する工程を含む、請求項40又は請求項1から22又は請求項25から37のいずれか一項に記載の方法。 - 前記複数の非線形回帰モデルを訓練する前に、前記シミュレートされたRNA発現データにノイズを加える工程
を更に含む、請求項41又は請求項1から22又は請求項25から37又は請求項40のいずれか一項に記載の方法。 - ノイズは、ポワソンノイズ又はガウスノイズのうちの少なくとも1つを含む、請求項42又は請求項1から22又は請求項25から37又は請求項40若しくは41のいずれか一項に記載の方法。
- 前記シミュレートされた微小環境細胞RNA発現データを生成する工程は、
第1の微小環境細胞型について、前記微小環境細胞RNA発現データの第1の部分を使用して、第1のRNA発現プロファイルを生成する工程
を含む、請求項41又は請求項1から22又は請求項25から37又は請求項40又は請求項42若しくは43のいずれか一項に記載の方法。 - 前記微小環境細胞RNA発現データの前記第1の部分は、前記第1の微小環境細胞型の複数のサブタイプからのRNA発現データを含む、請求項44又は請求項1から22又は請求項25から37又は請求項40から43のいずれか一項に記載の方法。
- 前記第1のRNA発現プロファイルを生成する工程は、前記第1の微小環境細胞型の前記複数のサブタイプを使用して、前記微小環境細胞RNA発現データの前記第1の部分をリサンプリングする工程を含む、請求項45又は請求項1から22又は請求項25から37又は請求項40から44のいずれか一項に記載の方法。
- 前記微小環境細胞RNA発現データの前記第1の部分は、複数の試料からのRNA発現データを含む、請求項44又は請求項1から22又は請求項25から37又は請求項40から43又は請求項45若しくは46のいずれか一項に記載の方法。
- 前記第1のRNA発現プロファイルを生成する工程は、前記複数の試料に含まれるいくつかの試料を入力として取り入れて、前記微小環境細胞RNA発現データの第1の部分をリサンプリングする工程を含む、請求項47又は請求項1から22又は請求項25から37又は請求項40から46のいずれか一項に記載の方法。
- 前記シミュレートされた微小環境細胞RNA発現データを生成する工程は、
第2の微小環境細胞型について、前記微小環境細胞RNA発現データの第2の部分を使用して、第2のRNA発現プロファイルを生成する工程と、
前記第1のRNA発現プロファイルと前記第2のRNA発現プロファイルとを組み合わせて、前記シミュレートされた微小環境細胞RNA発現データの少なくともいくつかを生成する工程と
を更に含む、請求項44又は請求項1から22又は請求項25から37又は請求項40から43又は請求項45から48のいずれか一項に記載の方法。 - 前記第1のRNA発現プロファイルと前記第2のRNA発現プロファイルとを組み合わせて、前記シミュレートされた微小環境細胞RNA発現データの前記少なくともいくつかを生成する工程は、
前記第1のRNA発現プロファイルと前記第2のRNA発現プロファイルの加重和を決定する工程
を含む、請求項49又は請求項1から22又は請求項25から37又は請求項40から48のいずれか一項に記載の方法。 - 前記悪性細胞RNA発現データは、複数の悪性細胞試料からのRNA発現データを含む、請求項41又は請求項1から22又は請求項25から37又は請求項40又は請求項42から50のいずれか一項に記載の方法。
- 前記シミュレートされた悪性細胞RNA発現データを生成する工程は、前記複数の悪性細胞試料からの前記RNA発現データを組み合わせる工程を含む、請求項51又は請求項1から22又は請求項25から37又は請求項40から50のいずれか一項に記載の方法。
- 前記シミュレートされた悪性細胞RNA発現データを生成する工程は、前記シミュレートされた悪性細胞RNA発現データにノイズを加える工程を含む、請求項41又は請求項1から22又は請求項25から37又は請求項40又は請求項42から52のいずれか一項に記載の方法。
- 前記加重和の係数は、事前に訓練された非線形回帰モデルの出力を使用して決定される、請求項50又は請求項1から22又は請求項25から37又は請求項40から49又は請求項51から53のいずれか一項に記載の方法。
- 前記第1のRNA発現データは、Table 2(表2)における前記第1の細胞型についての遺伝子の群から選択される少なくとも10個の遺伝子についての発現データを含む、請求項40又は請求項1から22又は請求項25から37又は請求項41から54のいずれか一項に記載の方法。
- 前記第2のRNA発現データは、Table 2(表2)における前記第2の細胞型についての遺伝子の群から選択される少なくとも10個の遺伝子についての発現データを含む、請求項40又は請求項1から22又は請求項25から37又は請求項41から55のいずれか一項に記載の方法。
- 前記第1の細胞型及び前記第2の細胞型は、B細胞、CD4+ T細胞、CD8+ T細胞、内皮細胞、線維芽細胞、リンパ球、マクロファージ、単球、NK細胞、好中球、及びT細胞からなる群から選択される、請求項40又は請求項1から22又は請求項25から37又は請求項41から56のいずれか一項に記載の方法。
- 前記シミュレートされたRNA発現データは、前記第1の細胞型に関連する前記第1の遺伝子についての第2のRNA発現データを含む、請求項40又は請求項1から22又は請求項25から37又は請求項41から57のいずれか一項に記載の方法。
- 前記1つ又は複数の非線形回帰モデルの前記第1の非線形回帰モデルは、
前記第1のRNA発現データを入力として使用して、前記第1の細胞型からのRNAの前記推定比率についての第1の値を生成するように構成された第1のサブモデル、及び
前記第2のRNA発現データと前記第1の細胞型からのRNAの前記推定比率についての前記第1の値とを入力として使用して、前記第1の細胞型からのRNAの前記推定比率についての第2の値を生成するように構成された第2のサブモデル
を含む、請求項58又は請求項1から22又は請求項25から37又は請求項40から57のいずれか一項に記載の方法。 - 前記第2のサブモデルは、前記第1の細胞型以外の複数の細胞型のそれぞれからのRNAの推定比率を入力として使用して、前記第1の細胞型からのRNAの前記推定比率についての前記第2の値を生成するように更に構成されている、請求項59又は請求項1から22又は請求項25から37又は請求項40から58のいずれか一項に記載の方法。
- 少なくとも1つのコンピュータハードウェアプロセッサと、
前記少なくとも1つのコンピュータハードウェアプロセッサによって実行されると、前記少なくとも1つのコンピュータハードウェアプロセッサに、
シミュレートされたRNA発現データを含む訓練データを得る工程であって、前記シミュレートされたRNA発現データは、第1の細胞型に関連する第1の遺伝子についての第1のRNA発現データ及び前記第1の細胞型とは異なる第2の細胞型に関連する第2の遺伝子についての第2のRNA発現データを含む、工程と、
1つ又は複数の各々の細胞型からのRNAの比率を推定するために複数の非線形回帰モデルを訓練する工程であって、前記複数の非線形回帰モデルは、前記第1の細胞型からのRNAの比率を推定するための第1の非線形回帰モデル及び前記第2の細胞型からのRNAの比率を推定するための第2の非線形回帰モデルを含み、前記複数の非線形回帰モデルを訓練する工程は、少なくとも一部には、
前記第1の非線形回帰モデル及び前記第1のRNA発現データを使用して、前記第1の細胞型からのRNAの推定比率を生成する工程、並びに
前記第1の細胞型からのRNAの前記推定比率を使用して、前記第1の非線形回帰モデルのパラメーターをアップデートする工程
によって、前記第1の非線形回帰モデルを訓練する工程を含む、工程と、
前記第1の非線形回帰モデル及び前記第2の非線形回帰モデルを含む前記訓練された複数の非線形回帰モデルを出力する工程と
を実施させるプロセッサ実行可能命令を格納する少なくとも1つの非一時的なコンピュータ読取り可能な記憶媒体と
を含むシステム。 - 少なくとも1つのコンピュータハードウェアプロセッサによって実行されると、前記少なくとも1つのコンピュータハードウェアプロセッサに
シミュレートされたRNA発現データを含む訓練データを得る工程であって、前記シミュレートされたRNA発現データは、第1の細胞型に関連する第1の遺伝子についての第1のRNA発現データ及び前記第1の細胞型とは異なる第2の細胞型に関連する第2の遺伝子についての第2のRNA発現データを含む、工程と
1つ又は複数の各々の細胞型からのRNAの比率を推定するために複数の非線形回帰モデルを訓練する工程であって、前記複数の非線形回帰モデルは、前記第1の細胞型からのRNAの比率を推定するための第1の非線形回帰モデル及び前記第2の細胞型からのRNAの比率を推定するための第2の非線形回帰モデルを含み、前記複数の非線形回帰モデルを訓練する工程は、少なくとも一部には、
前記第1の非線形回帰モデル及び前記第1のRNA発現データを使用して、前記第1の細胞型からのRNAの推定比率を生成する工程、並びに
前記第1の細胞型からのRNAの前記推定比率を使用して、前記第1の非線形回帰モデルのパラメーターをアップデートする工程
によって、前記第1の非線形回帰モデルを訓練する工程を含む、工程と、
前記第1の非線形回帰モデル及び前記第2の非線形回帰モデルを含む前記訓練された複数の非線形回帰モデルを出力する工程と
を実行させる、プロセッサ実行可能命令を格納する少なくとも1つの非一時的なコンピュータ読取り可能な記憶媒体。 - 少なくとも1つのコンピュータハードウェアプロセッサを使用して、
生体試料について発現データを得る工程であって、前記生体試料は、がんを有する、がんを有する疑いがある、又はがんを有するリスクがある対象から事前に得られている、工程と、
対応する複数の細胞型について複数の発現プロファイルを得る工程であって、前記発現プロファイルのそれぞれは、前記複数の細胞型からの各々の細胞型に関連する1つ又は複数の遺伝子からの各々の発現データを含む、工程と、
少なくとも一部には、前記発現データと前記複数の発現プロファイルとの間の区分的に連続な誤差関数を最適化することによって、前記複数の細胞型についての複数の細胞構成比率を決定する工程と
を実施する工程を含む方法。 - 前記発現データはRNA発現データであり、前記複数の発現プロファイルはRNA発現プロファイルである、請求項63に記載の方法。
- 前記複数の細胞型について前記複数の細胞構成比率を決定する工程は、誤差値の加重和を決定する工程を含み、前記誤差値は区分的に連続な誤差関数を使用して決定される、請求項63に記載の方法。
- 前記複数の細胞型について前記複数の細胞構成比率を決定する工程は、誤差値の前記加重和を最小化する工程を含む、請求項65に記載の方法。
- 前記1つ又は複数の遺伝子は、Table 2(表2)における5000個未満の遺伝子であって少なくとも2個の遺伝子で構成される、請求項63に記載の方法。
- 前記対応する複数の細胞型についての前記複数の発現プロファイル及び前記複数の細胞構成比率を使用して、悪性腫瘍発現プロファイルを決定する工程、
を更に含む、請求項63又は請求項1から22又は請求項25から37又は請求項40から60又は請求項64から67のいずれか一項に記載の方法。 - 少なくとも1つのコンピュータハードウェアプロセッサと、
前記少なくとも1つのコンピュータハードウェアプロセッサによって実行されると、前記少なくとも1つのコンピュータハードウェアプロセッサに、
生体試料について発現データを得る工程であって、前記生体試料は、がんを有する、がんを有する疑いがある、又はがんを有するリスクがある対象から事前に得られている、工程と、
対応する複数の細胞型について複数の発現プロファイルを得る工程であって、前記発現プロファイルのそれぞれは、前記複数の細胞型からの各々の細胞型に関連する1つ又は複数の遺伝子からの各々の発現データを含む、工程と、
少なくとも一部には、前記発現データと前記複数の発現プロファイルとの間の区分的に連続な誤差関数を最適化することによって、前記複数の細胞型について複数の細胞構成比率を決定する工程と
を実施させるプロセッサ実行可能命令を格納する少なくとも1つのコンピュータ読取り可能な記憶媒体と
を含むシステム。 - 少なくとも1つのコンピュータハードウェアプロセッサによって実行されると、前記少なくとも1つのコンピュータハードウェアプロセッサに、
生体試料について発現データを得る工程であって、前記生体試料は、がんを有する、がんを有する疑いがある、又はがんを有するリスクがある対象から事前に得られている、工程と、
対応する複数の細胞型について複数の発現プロファイルを得る工程であって、前記発現プロファイルのそれぞれは、前記複数の細胞型からの各々の細胞型に関連する1つ又は複数の遺伝子からの各々の発現データを含む、工程と、
少なくとも一部には、前記発現データと前記複数の発現プロファイルとの間の区分的に連続な誤差関数を最適化することによって、前記複数の細胞型について複数の細胞構成比率を決定する工程と
を実施させるプロセッサ実行可能命令を格納する少なくとも1つのコンピュータ読取り可能な記憶媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202062988700P | 2020-03-12 | 2020-03-12 | |
US62/988,700 | 2020-03-12 | ||
US202063108262P | 2020-10-30 | 2020-10-30 | |
US63/108,262 | 2020-10-30 | ||
PCT/US2021/022155 WO2021183917A1 (en) | 2020-03-12 | 2021-03-12 | Systems and methods for deconvolution of expression data |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023518185A true JP2023518185A (ja) | 2023-04-28 |
JPWO2021183917A5 JPWO2021183917A5 (ja) | 2024-02-27 |
Family
ID=75396875
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022554893A Pending JP2023518185A (ja) | 2020-03-12 | 2021-03-12 | 発現データのデコンボリューションのためのシステム及び方法 |
Country Status (7)
Country | Link |
---|---|
US (3) | US11315658B2 (ja) |
EP (1) | EP4118657B1 (ja) |
JP (1) | JP2023518185A (ja) |
AU (1) | AU2021233926A1 (ja) |
CA (1) | CA3175126A1 (ja) |
IL (1) | IL296316A (ja) |
WO (1) | WO2021183917A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2021233926A1 (en) * | 2020-03-12 | 2022-09-29 | Bostongene Corporation | Systems and methods for deconvolution of expression data |
EP4330969A1 (en) | 2021-04-29 | 2024-03-06 | BostonGene Corporation | Machine learning techniques for estimating tumor cell expression in complex tumor tissue |
CA3220280A1 (en) | 2021-05-18 | 2022-11-24 | Bostongene Corporation | Techniques for single sample expression projection to an expression cohort sequenced with another protocol |
CN114038505A (zh) * | 2021-10-19 | 2022-02-11 | 清华大学 | 一种在线整合多来源单细胞数据的方法和系统 |
WO2023076574A1 (en) | 2021-10-29 | 2023-05-04 | Bostongene Corporation | Tumor microenvironment types in breast cancer |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107430588B (zh) | 2015-01-22 | 2021-12-31 | 斯坦福大学托管董事会 | 用于确定不同细胞亚群的比例的方法和系统 |
WO2019018684A1 (en) * | 2017-07-21 | 2019-01-24 | The Board Of Trustees Of The Leland Stanford Junior University | SYSTEMS AND METHODS FOR ANALYZING MIXED CELL POPULATIONS |
JP7421475B2 (ja) * | 2018-06-29 | 2024-01-24 | 株式会社Preferred Networks | 学習方法、混合率予測方法及び学習装置 |
US20200210852A1 (en) | 2018-12-31 | 2020-07-02 | Tempus Labs, Inc. | Transcriptome deconvolution of metastatic tissue samples |
AU2021233926A1 (en) * | 2020-03-12 | 2022-09-29 | Bostongene Corporation | Systems and methods for deconvolution of expression data |
-
2021
- 2021-03-12 AU AU2021233926A patent/AU2021233926A1/en active Pending
- 2021-03-12 EP EP21716903.6A patent/EP4118657B1/en active Active
- 2021-03-12 WO PCT/US2021/022155 patent/WO2021183917A1/en unknown
- 2021-03-12 CA CA3175126A patent/CA3175126A1/en active Pending
- 2021-03-12 US US17/200,492 patent/US11315658B2/en active Active
- 2021-03-12 JP JP2022554893A patent/JP2023518185A/ja active Pending
- 2021-03-12 IL IL296316A patent/IL296316A/en unknown
-
2022
- 2022-03-29 US US17/707,623 patent/US11587642B2/en active Active
- 2022-12-15 US US18/082,157 patent/US20230178178A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230178178A1 (en) | 2023-06-08 |
US11587642B2 (en) | 2023-02-21 |
WO2021183917A8 (en) | 2021-12-16 |
EP4118657A1 (en) | 2023-01-18 |
EP4118657B1 (en) | 2024-05-01 |
US20220230707A1 (en) | 2022-07-21 |
WO2021183917A9 (en) | 2021-11-04 |
CA3175126A1 (en) | 2021-09-16 |
US20210287759A1 (en) | 2021-09-16 |
IL296316A (en) | 2022-11-01 |
AU2021233926A1 (en) | 2022-09-29 |
US11315658B2 (en) | 2022-04-26 |
WO2021183917A1 (en) | 2021-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ren et al. | Reconstruction of cell spatial organization from single-cell RNA sequencing data based on ligand-receptor mediated self-assembly | |
US20200395097A1 (en) | Pan-cancer model to predict the pd-l1 status of a cancer cell sample using rna expression data and other patient data | |
JP2023518185A (ja) | 発現データのデコンボリューションのためのシステム及び方法 | |
US11367508B2 (en) | Systems and methods for detecting cellular pathway dysregulation in cancer specimens | |
JP7299169B2 (ja) | 体細胞突然変異のクローン性を決定するための方法及びシステム | |
CN112601826A (zh) | 通过全基因组整合进行循环肿瘤dna的超灵敏检测 | |
CN112602156A (zh) | 用于检测残留疾病的系统和方法 | |
Hsieh et al. | Effect of de novo transcriptome assembly on transcript quantification | |
Edmunds et al. | Phenoscape: identifying candidate genes for evolutionary phenotypes | |
JP7340021B2 (ja) | 予測腫瘍遺伝子変異量に基づいた腫瘍分類 | |
US20140040264A1 (en) | Method for estimation of information flow in biological networks | |
JP2022516152A (ja) | 転移性組織サンプルのトランスクリプトームデコンボリューション | |
Hernández-Lemus et al. | The many faces of gene regulation in cancer: a computational oncogenomics outlook | |
Li et al. | Extended application of genomic selection to screen multiomics data for prognostic signatures of prostate cancer | |
Abedini et al. | Spatially resolved human kidney multi-omics single cell atlas highlights the key role of the fibrotic microenvironment in kidney disease progression | |
US20210358571A1 (en) | Systems and methods for predicting pathogenic status of fusion candidates detected in next generation sequencing data | |
Wang et al. | PhyloVelo enhances transcriptomic velocity field mapping using monotonically expressed genes | |
US20220223227A1 (en) | Machine learning techniques for identifying malignant b- and t-cell populations | |
CN113159529A (zh) | 一种肠道息肉的风险评估模型及相关系统 | |
Paas-Oliveros et al. | Computational single cell oncology: state of the art | |
Deshpande et al. | RNA-seq data science: From raw data to effective interpretation | |
US20240076744A1 (en) | METHODS AND SYSTEMS FOR mRNA BOUNDARY ANALYSIS IN NEXT GENERATION SEQUENCING | |
Hu et al. | PhyloVelo enhances transcriptomic velocity field mapping using monotonically expressed genes | |
Chieruzzi | Identification of RAS co-occurrent mutations in colorectal cancer patients: workflow assessment and enhancement | |
Dimitrieva et al. | Biologically relevant integration of transcriptomics profiles from cancer cell lines, patient-derived xenografts and clinical tumors using deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20230622 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20230623 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240216 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240216 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20240216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240415 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240502 |