JP2019532410A - 個人の生物学的ステータスを予測するためのシステム、方法および遺伝子シグネチャ - Google Patents
個人の生物学的ステータスを予測するためのシステム、方法および遺伝子シグネチャ Download PDFInfo
- Publication number
- JP2019532410A JP2019532410A JP2019513943A JP2019513943A JP2019532410A JP 2019532410 A JP2019532410 A JP 2019532410A JP 2019513943 A JP2019513943 A JP 2019513943A JP 2019513943 A JP2019513943 A JP 2019513943A JP 2019532410 A JP2019532410 A JP 2019532410A
- Authority
- JP
- Japan
- Prior art keywords
- data set
- genes
- computer
- status
- gene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 150
- 230000002068 genetic effect Effects 0.000 title claims description 18
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 202
- -1 LINC00599 Proteins 0.000 claims abstract description 95
- 230000014509 gene expression Effects 0.000 claims abstract description 87
- 230000000391 smoking effect Effects 0.000 claims abstract description 84
- 101000693721 Homo sapiens SAM and SH3 domain-containing protein 1 Proteins 0.000 claims abstract description 61
- 102100025543 SAM and SH3 domain-containing protein 1 Human genes 0.000 claims abstract description 61
- 101000986826 Homo sapiens P2Y purinoceptor 6 Proteins 0.000 claims abstract description 60
- 102100028074 P2Y purinoceptor 6 Human genes 0.000 claims abstract description 60
- 101001098529 Homo sapiens Proteinase-activated receptor 1 Proteins 0.000 claims abstract description 54
- 102100037136 Proteinase-activated receptor 1 Human genes 0.000 claims abstract description 54
- 108010017222 Cyclin-Dependent Kinase Inhibitor p57 Proteins 0.000 claims abstract description 50
- 102000004480 Cyclin-Dependent Kinase Inhibitor p57 Human genes 0.000 claims abstract description 50
- 101000609957 Homo sapiens PTB-containing, cubilin and LRP1-interacting protein Proteins 0.000 claims abstract description 46
- 102100039157 PTB-containing, cubilin and LRP1-interacting protein Human genes 0.000 claims abstract description 46
- 102100026789 Aryl hydrocarbon receptor repressor Human genes 0.000 claims abstract description 45
- 102100023416 G-protein coupled receptor 15 Human genes 0.000 claims abstract description 45
- 101000690533 Homo sapiens Aryl hydrocarbon receptor repressor Proteins 0.000 claims abstract description 45
- 101000829794 Homo sapiens G-protein coupled receptor 15 Proteins 0.000 claims abstract description 45
- 102100032532 C-type lectin domain family 10 member A Human genes 0.000 claims abstract description 44
- 101000942296 Homo sapiens C-type lectin domain family 10 member A Proteins 0.000 claims abstract description 44
- 101000654676 Homo sapiens Semaphorin-6B Proteins 0.000 claims abstract description 43
- 102100032796 Semaphorin-6B Human genes 0.000 claims abstract description 43
- 102100037709 Desmocollin-3 Human genes 0.000 claims abstract description 40
- 101000968042 Homo sapiens Desmocollin-2 Proteins 0.000 claims abstract description 40
- 101000880960 Homo sapiens Desmocollin-3 Proteins 0.000 claims abstract description 40
- 101000669460 Homo sapiens Toll-like receptor 5 Proteins 0.000 claims abstract description 27
- 102100039357 Toll-like receptor 5 Human genes 0.000 claims abstract description 27
- 101000941865 Homo sapiens Leucine-rich repeat neuronal protein 3 Proteins 0.000 claims abstract 20
- 102100032657 Leucine-rich repeat neuronal protein 3 Human genes 0.000 claims abstract 20
- 230000004547 gene signature Effects 0.000 claims description 193
- 238000012360 testing method Methods 0.000 claims description 111
- 238000012549 training Methods 0.000 claims description 52
- 102100031725 Cortactin-binding protein 2 Human genes 0.000 claims description 42
- 101000941045 Homo sapiens Cortactin-binding protein 2 Proteins 0.000 claims description 42
- 238000004891 communication Methods 0.000 claims description 27
- 101001069617 Homo sapiens Probable G-protein coupled receptor 63 Proteins 0.000 claims description 26
- 102100033862 Probable G-protein coupled receptor 63 Human genes 0.000 claims description 26
- 230000008859 change Effects 0.000 claims description 25
- 101000709121 Homo sapiens Ral guanine nucleotide dissociation stimulator-like 1 Proteins 0.000 claims description 23
- 102100032665 Ral guanine nucleotide dissociation stimulator-like 1 Human genes 0.000 claims description 23
- 102100029378 Follistatin-related protein 1 Human genes 0.000 claims description 22
- 101001062535 Homo sapiens Follistatin-related protein 1 Proteins 0.000 claims description 22
- 102100025151 Adenylate kinase 8 Human genes 0.000 claims description 21
- 102100040739 Guanylate cyclase soluble subunit beta-1 Human genes 0.000 claims description 21
- 101001077073 Homo sapiens Adenylate kinase 8 Proteins 0.000 claims description 21
- 101001038731 Homo sapiens Guanylate cyclase soluble subunit beta-1 Proteins 0.000 claims description 21
- 101000931590 Homo sapiens Prostaglandin F2 receptor negative regulator Proteins 0.000 claims description 20
- 102100020864 Prostaglandin F2 receptor negative regulator Human genes 0.000 claims description 20
- 101000796015 Homo sapiens Protein turtle homolog B Proteins 0.000 claims description 19
- 102100031337 Protein turtle homolog B Human genes 0.000 claims description 19
- 230000000694 effects Effects 0.000 claims description 19
- 102100040754 Guanylate cyclase soluble subunit alpha-1 Human genes 0.000 claims description 18
- 101001038755 Homo sapiens Guanylate cyclase soluble subunit alpha-1 Proteins 0.000 claims description 18
- 101000743488 Homo sapiens V-set and immunoglobulin domain-containing protein 4 Proteins 0.000 claims description 18
- 102100033256 Mitochondrial amidoxime reducing component 2 Human genes 0.000 claims description 18
- 101150010475 Mtarc2 gene Proteins 0.000 claims description 18
- 102100038296 V-set and immunoglobulin domain-containing protein 4 Human genes 0.000 claims description 18
- 239000003153 chemical reaction reagent Substances 0.000 claims description 18
- 102100037390 Genetic suppressor element 1 Human genes 0.000 claims description 17
- 101001026271 Homo sapiens Genetic suppressor element 1 Proteins 0.000 claims description 17
- 101000710893 Homo sapiens Putative uncharacterized protein encoded by LINC02915 Proteins 0.000 claims description 17
- 102100033870 Putative uncharacterized protein encoded by LINC02915 Human genes 0.000 claims description 17
- 102100026293 Asialoglycoprotein receptor 2 Human genes 0.000 claims description 15
- 101000785948 Homo sapiens Asialoglycoprotein receptor 2 Proteins 0.000 claims description 15
- 102100032440 Beta-1,3-galactosyltransferase 2 Human genes 0.000 claims description 14
- 101000798387 Homo sapiens Beta-1,3-galactosyltransferase 2 Proteins 0.000 claims description 14
- 101000971533 Homo sapiens Killer cell lectin-like receptor subfamily G member 1 Proteins 0.000 claims description 13
- 101000582950 Homo sapiens Platelet factor 4 Proteins 0.000 claims description 13
- 102100021457 Killer cell lectin-like receptor subfamily G member 1 Human genes 0.000 claims description 13
- 102100030304 Platelet factor 4 Human genes 0.000 claims description 13
- 102100031654 Cytochrome c oxidase subunit 6B2 Human genes 0.000 claims description 12
- 102100031132 Glucose-6-phosphate isomerase Human genes 0.000 claims description 12
- 108010070600 Glucose-6-phosphate isomerase Proteins 0.000 claims description 12
- 101000922370 Homo sapiens Cytochrome c oxidase subunit 6B2 Proteins 0.000 claims description 12
- 101001018109 Homo sapiens Nucleotidyltransferase MB21D2 Proteins 0.000 claims description 12
- 101000713602 Homo sapiens T-box transcription factor TBX21 Proteins 0.000 claims description 12
- 101000893741 Homo sapiens Tissue alpha-L-fucosidase Proteins 0.000 claims description 12
- 102100033052 Nucleotidyltransferase MB21D2 Human genes 0.000 claims description 12
- 102100036840 T-box transcription factor TBX21 Human genes 0.000 claims description 12
- 102100040526 Tissue alpha-L-fucosidase Human genes 0.000 claims description 12
- 101001109700 Homo sapiens Nuclear receptor subfamily 4 group A member 1 Proteins 0.000 claims description 11
- 101000579300 Homo sapiens Prostaglandin F2-alpha receptor Proteins 0.000 claims description 11
- 101000933252 Homo sapiens Protein BEX3 Proteins 0.000 claims description 11
- 101000679406 Homo sapiens Tubulin polymerization-promoting protein family member 3 Proteins 0.000 claims description 11
- 101000909110 Homo sapiens Ultra-long-chain fatty acid omega-hydroxylase Proteins 0.000 claims description 11
- 102100022679 Nuclear receptor subfamily 4 group A member 1 Human genes 0.000 claims description 11
- 102100028248 Prostaglandin F2-alpha receptor Human genes 0.000 claims description 11
- 102100025955 Protein BEX3 Human genes 0.000 claims description 11
- 102100022567 Tubulin polymerization-promoting protein family member 3 Human genes 0.000 claims description 11
- 102100024915 Ultra-long-chain fatty acid omega-hydroxylase Human genes 0.000 claims description 11
- 235000019505 tobacco product Nutrition 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 9
- 102100031969 Alpha-N-acetylgalactosaminide alpha-2,6-sialyltransferase 1 Human genes 0.000 claims description 8
- 101000703728 Homo sapiens Alpha-N-acetylgalactosaminide alpha-2,6-sialyltransferase 1 Proteins 0.000 claims description 8
- 101001098232 Homo sapiens P2Y purinoceptor 1 Proteins 0.000 claims description 8
- 101000707218 Homo sapiens SH2 domain-containing protein 1B Proteins 0.000 claims description 8
- 101000645402 Homo sapiens Transmembrane protein 163 Proteins 0.000 claims description 8
- 102100037600 P2Y purinoceptor 1 Human genes 0.000 claims description 8
- 102100031778 SH2 domain-containing protein 1B Human genes 0.000 claims description 8
- 101000708607 Subterranean clover stunt virus (strain F) Para-Rep C6 Proteins 0.000 claims description 8
- 102100025764 Transmembrane protein 163 Human genes 0.000 claims description 8
- 102100027634 Fibronectin type 3 and ankyrin repeat domains protein 1 Human genes 0.000 claims description 6
- 101000937169 Homo sapiens Fibronectin type 3 and ankyrin repeat domains protein 1 Proteins 0.000 claims description 6
- 101000818706 Homo sapiens Zinc finger protein 618 Proteins 0.000 claims description 6
- 102100021103 Zinc finger protein 618 Human genes 0.000 claims description 6
- 101001106082 Homo sapiens Receptor expression-enhancing protein 6 Proteins 0.000 claims description 3
- 102100021075 Receptor expression-enhancing protein 6 Human genes 0.000 claims description 3
- 102100034323 Disintegrin and metalloproteinase domain-containing protein 2 Human genes 0.000 claims 1
- 101000780288 Homo sapiens Disintegrin and metalloproteinase domain-containing protein 2 Proteins 0.000 claims 1
- 101001056699 Homo sapiens Intersectin-2 Proteins 0.000 claims 1
- 102100025505 Intersectin-2 Human genes 0.000 claims 1
- 230000003796 beauty Effects 0.000 claims 1
- 239000000523 sample Substances 0.000 description 102
- 210000004369 blood Anatomy 0.000 description 59
- 239000008280 blood Substances 0.000 description 59
- 238000010200 validation analysis Methods 0.000 description 30
- 230000004044 response Effects 0.000 description 23
- 102000015981 Aryl hydrocarbon receptor repressor Human genes 0.000 description 20
- 108050004261 Aryl hydrocarbon receptor repressor Proteins 0.000 description 20
- 241000699666 Mus <mouse, genus> Species 0.000 description 20
- 238000013145 classification model Methods 0.000 description 19
- 238000004458 analytical method Methods 0.000 description 16
- 239000000047 product Substances 0.000 description 15
- 239000000779 smoke Substances 0.000 description 15
- 241000894007 species Species 0.000 description 15
- 238000009826 distribution Methods 0.000 description 13
- 230000015654 memory Effects 0.000 description 13
- 230000008569 process Effects 0.000 description 13
- 210000000601 blood cell Anatomy 0.000 description 9
- 238000010801 machine learning Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 230000035945 sensitivity Effects 0.000 description 9
- 231100000027 toxicology Toxicity 0.000 description 9
- 241000699670 Mus sp. Species 0.000 description 8
- 230000005586 smoking cessation Effects 0.000 description 8
- 238000013500 data storage Methods 0.000 description 7
- 241000282412 Homo Species 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000007477 logistic regression Methods 0.000 description 6
- 238000007637 random forest analysis Methods 0.000 description 6
- 241000208125 Nicotiana Species 0.000 description 5
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 5
- 238000003491 array Methods 0.000 description 5
- 235000019504 cigarettes Nutrition 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 241000283984 Rodentia Species 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000000205 computational method Methods 0.000 description 4
- 238000002790 cross-validation Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 238000012552 review Methods 0.000 description 4
- 238000001790 Welch's t-test Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000002493 microarray Methods 0.000 description 3
- 238000010239 partial least squares discriminant analysis Methods 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 238000012502 risk assessment Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 102000013918 Apolipoproteins E Human genes 0.000 description 2
- 108010025628 Apolipoproteins E Proteins 0.000 description 2
- 230000007067 DNA methylation Effects 0.000 description 2
- 239000000443 aerosol Substances 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000000575 pesticide Substances 0.000 description 2
- 231100000614 poison Toxicity 0.000 description 2
- 239000002574 poison Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- SNICXCGAKADSCV-JTQLQIEISA-N (-)-Nicotine Chemical compound CN1CCC[C@H]1C1=CC=CN=C1 SNICXCGAKADSCV-JTQLQIEISA-N 0.000 description 1
- 101150000874 11 gene Proteins 0.000 description 1
- 101150078635 18 gene Proteins 0.000 description 1
- 102100021580 Active regulator of SIRT1 Human genes 0.000 description 1
- 102100032249 Dystonin Human genes 0.000 description 1
- 102100033047 G-protein coupled receptor 3 Human genes 0.000 description 1
- 101001016186 Homo sapiens Dystonin Proteins 0.000 description 1
- 101000871088 Homo sapiens G-protein coupled receptor 3 Proteins 0.000 description 1
- 101000840258 Homo sapiens Immunoglobulin J chain Proteins 0.000 description 1
- 101000959664 Homo sapiens Interferon-induced protein 44-like Proteins 0.000 description 1
- 101000966782 Homo sapiens Lysophosphatidic acid receptor 1 Proteins 0.000 description 1
- 101001023712 Homo sapiens Nectin-3 Proteins 0.000 description 1
- 101000735213 Homo sapiens Palladin Proteins 0.000 description 1
- 101000874141 Homo sapiens Probable ATP-dependent RNA helicase DDX43 Proteins 0.000 description 1
- 101000801255 Homo sapiens Tumor necrosis factor receptor superfamily member 17 Proteins 0.000 description 1
- 101000964741 Homo sapiens Zinc finger protein 711 Proteins 0.000 description 1
- 102100029571 Immunoglobulin J chain Human genes 0.000 description 1
- 102100039953 Interferon-induced protein 44-like Human genes 0.000 description 1
- 108010006444 Leucine-Rich Repeat Proteins Proteins 0.000 description 1
- 102100022187 Leucine-rich repeat-containing protein 4C Human genes 0.000 description 1
- 101150018584 Lrrc4c gene Proteins 0.000 description 1
- 102100040607 Lysophosphatidic acid receptor 1 Human genes 0.000 description 1
- 101100055876 Mus musculus Apoe gene Proteins 0.000 description 1
- 102100035487 Nectin-3 Human genes 0.000 description 1
- 102100035031 Palladin Human genes 0.000 description 1
- 102100035724 Probable ATP-dependent RNA helicase DDX43 Human genes 0.000 description 1
- 108090001010 Protease-activated receptor 4 Proteins 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 101150026963 RPS19BP1 gene Proteins 0.000 description 1
- 101000832669 Rattus norvegicus Probable alcohol sulfotransferase Proteins 0.000 description 1
- 101100404661 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) NGL1 gene Proteins 0.000 description 1
- 102100033726 Tumor necrosis factor receptor superfamily member 17 Human genes 0.000 description 1
- 102100040724 Zinc finger protein 711 Human genes 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 239000000809 air pollutant Substances 0.000 description 1
- 231100001243 air pollutant Toxicity 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000010241 blood sampling Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 231100000727 exposure assessment Toxicity 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 238000010305 frozen robust multiarray analysis Methods 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000013090 high-throughput technology Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000002952 image-based readout Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 210000004901 leucine-rich repeat Anatomy 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000010208 microarray analysis Methods 0.000 description 1
- 230000005486 microgravity Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 229960002715 nicotine Drugs 0.000 description 1
- SNICXCGAKADSCV-UHFFFAOYSA-N nicotine Natural products CN1CCCC1C1=CC=CN=C1 SNICXCGAKADSCV-UHFFFAOYSA-N 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000007427 paired t-test Methods 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 208000009842 photoparoxysmal response 3 Diseases 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108010026311 purinoceptor P2Y6 Proteins 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- AYEKOFBPNLCAJY-UHFFFAOYSA-O thiamine pyrophosphate Chemical compound CC1=C(CCOP(O)(=O)OP(O)(O)=O)SC=[N+]1CC1=CN=C(C)N=C1N AYEKOFBPNLCAJY-UHFFFAOYSA-O 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 230000002110 toxicologic effect Effects 0.000 description 1
- 231100000041 toxicology testing Toxicity 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000011222 transcriptome analysis Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002676 xenobiotic agent Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- A—HUMAN NECESSITIES
- A24—TOBACCO; CIGARS; CIGARETTES; SIMULATED SMOKING DEVICES; SMOKERS' REQUISITES
- A24F—SMOKERS' REQUISITES; MATCH BOXES; SIMULATED SMOKING DEVICES
- A24F42/00—Simulated smoking devices other than electrically operated; Component parts thereof; Manufacture or testing thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/60—ICT specially adapted for the handling or processing of medical references relating to pathologies
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Primary Health Care (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
Description
本出願は、米国特許法119条の下、2016年9月14日に出願した米国仮特許出願第62/394,551号の利益を主張し、全体を参照することによって本明細書に援用する。本出願は、2014年12月11日に出願したPCT出願第PCT/EP2014/077473号、および2014年8月12日に出願したPCT出願第PCT/EP2014/067276号に関係し、各出願は、全体を参照することによって本明細書に援用される。
以下の発明を実施するための形態を考慮することにより明らかになるであろう。
Claims (65)
- 対象から取得したサンプルを評価するための、コンピュータ実装された方法であって、
少なくとも一つのハードウェアプロセッサを含むコンピュータシステムによって、前記サンプルと関連付けられるデータセットを受け取ることであって、前記データセットは、全ゲノムより少ない遺伝子のセットに対する定量的な発現データを含み、前記遺伝子のセットは、AHHR、CDKN1C、LRRN3、PID1、GPR15、SASH1、CLEC10A、LINC00599、P2RY6、DSC2、F2R、SEMA6BおよびTLR5を含む、受け取ることと、
前記少なくとも一つのハードウェアプロセッサによって、前記受け取ったデータセットの中の前記遺伝子のセットに対する前記定量的な発現データに基づいてスコアを生成することであって、前記スコアは、40個より少ない遺伝子に基づき、前記対象の予測される喫煙ステータスを示す、生成することと、を含む、コンピュータ実装された方法。 - 前記遺伝子のセットは更に、AK8、FSTL1、RGL1およびVSIG4を含む、請求項1に記載のコンピュータ実装された方法。
- 前記遺伝子のセットは更に、C15orf54、CTTNBP2、RANK1、GSE1、GUCY1A3、LOC200772、MARC2、MIR4697HGおよびPTGFRNを含む、請求項1〜2のいずれかに記載のコンピュータ実装された方法。
- 前記スコアは、前記データセットに適用される分類スキームの結果であり、前記分類スキームは、前記データセットの中の前記定量的な発現データに基づいて決定される、請求項1〜3のいずれかに記載のコンピュータ実装された方法。
- AHHR、CDKN1C、LRRN3、PID1、GPR15、SASH1、CLEC10A、LINC00599、P2RY6、DSC2、F2R、SEMA6BおよびTLR5の各々に対して、倍率変化値を演算することを更に含む、請求項1〜4のいずれかに記載のコンピュータ実装された方法。
- 各演算された倍率変化値のそれぞれが、少なくとも二つの独立した母集団データセットに対する所定の閾値を超えることを要する少なくとも一つの基準を、各倍率変化値が満たすと決定することを更に含む、請求項5に記載のコンピュータ実装された方法。
- 前記遺伝子のセットは、AHHR、CDKN1C、LRRN3、PID1、GPR15、SASH1、CLEC10A、LINC00599、P2RY6、DSC2、F2R、SEMA6BおよびTLR5から成る、請求項1に記載のコンピュータ実装された方法。
- 少なくとも一つのプロセッサを備えるコンピュータ化したシステムで実行されるとき、請求項1〜7のいずれかに記載の前記方法の一つ以上の工程を前記プロセッサに実施させる、コンピュータ可読指示を含む、コンピュータプログラム製品。
- 個人の喫煙者ステータスを予測するためのキットであって、
40個より少ない遺伝子を有する遺伝子シグネチャに、遺伝子の発現レベルを検出する、試薬のセットであって、前記遺伝子シグネチャは、試験サンプルの中にAHHR、CDKN1C、LRRN3、PID1、GPR15、SASH1、CLEC10A、LINC00599、P2RY6、DSC2、F2R、SEMA6BおよびTLR5を含む、試薬のセットと、
前記個人の喫煙者ステータスを予測する前記キットを使用するための説明書と、を備えるキット。 - 前記キットは、喫煙製品の代替品の個人に対する効果を評価するために使用される、請求項9に記載のキット。
- 前記喫煙製品の前記代替品は、加熱式たばこ製品である、請求項10に記載のキット。
- 前記代替品の前記個人に対する前記効果は、前記個人を非喫煙者として分類することである、請求項9〜11のいずれかに記載のキット。
- 前記遺伝子シグネチャは更に、AK8、FSTL1、RGL1およびVSIG4を含む、請求項9〜12のいずれかに記載のキット。
- 前記遺伝子シグネチャは更に、C15orf54、CTTNBP2、RANK1、GSE1、GUCY1A3、LOC200772、MARC2、MIR4697HGおよびPTGFRNを含む、請求項9〜13のいずれかに記載のキット。
- 対象から取得したサンプルを評価するための、コンピュータ実装された方法であって、
少なくとも一つのハードウェアプロセッサを含むコンピュータシステムによって、前記サンプルと関連付けられるデータセットを受け取ることであって、前記データセットは、全ゲノムより少ない遺伝子のセットに対する定量的な発現データを含み、前記遺伝子のセットは、LRRN3、AHHR、CDKN1C、PID1、SASH1、GPR15、LINC00599、P2RY6、CLEC10A、SEMA6B、F2R、CTTNBP2およびGPR63を含む、受け取ることと、
前記少なくとも一つのハードウェアプロセッサによって、前記受け取ったデータセットの中の前記遺伝子のセットに対する前記定量的な発現データに基づいてスコアを生成することであって、前記スコアは、40個より少ない遺伝子に基づき、前記対象の予測される喫煙ステータスを示す、生成することと、を含む、コンピュータ実装された方法。 - 前記スコアは、前記データセットに適用される分類スキームの結果であり、前記分類スキームは、前記データセットの中の前記定量的な発現データに基づいて決定される、請求項15に記載のコンピュータ実装された方法。
- LRRN3、AHHR、CDKN1C、PID1、SASH1、GPR15、LINC00599、P2RY6、CLEC10A、SEMA6B、F2R、CTTNBP2およびGPR63の各々に対して、倍率変化値を演算することを更に含む、請求項15〜16のいずれかに記載のコンピュータ実装された方法。
- 各演算された倍率変化値のそれぞれが、少なくとも二つの独立した母集団データセットに対する所定の閾値を超えることを要する少なくとも一つの基準を、各倍率変化値が満たすと決定することを更に含む、請求項17に記載のコンピュータ実装された方法。
- 前記遺伝子のセットは、LRRN3、AHHR、CDKN1C、PID1、SASH1、GPR15、LINC00599、P2RY6、CLEC10A、SEMA6B、F2R、CTTNBP2およびGPR63から成る、請求項15に記載のコンピュータ実装された方法。
- 少なくとも一つのプロセッサを備えるコンピュータ化したシステムで実行されるとき、請求項15〜19のいずれかに記載の前記方法の一つ以上の工程を前記プロセッサに実施させる、コンピュータ可読指示を含む、コンピュータプログラム製品。
- 個人の喫煙者ステータスを予測するためのキットであって、
40個より少ない遺伝子を有する遺伝子シグネチャに、遺伝子の発現レベルを検出する、試薬のセットであって、前記遺伝子シグネチャは、試験サンプルの中にLRRN3、AHHR、CDKN1C、PID1、SASH1、GPR15、LINC00599、P2RY6、CLEC10A、SEMA6B、F2R、CTTNBP2およびGPR63を含む、試薬のセットと、
前記個人の喫煙者ステータスを予測する前記キットを使用するための説明書と、を備えるキット。 - 前記キットは、喫煙製品の代替品の個人に対する効果を評価するために使用される、請求項21に記載のキット。
- 前記喫煙製品の前記代替品が、加熱式たばこ製品である、請求項22に記載のキット。
- 前記代替品の前記個人に対する前記効果は、前記個人を非喫煙者として分類することである、請求項21〜23のいずれかに記載のキット。
- 生物学的ステータスを予測するために遺伝子シグネチャを取得する、コンピュータ実装された方法であって、
通信ポートと、訓練データセットおよび試験データセットを含む少なくとも一つの電子データベースを記憶する、少なくとも一つの非一時的コンピュータ可読媒体と通信する少なくとも一つのコンピュータプロセッサとを含む、コンピュータシステムによって、前記訓練データセットをネットワークで、複数のユーザー装置へ提供することであって、
前記訓練データセットは、訓練サンプルのセットを含み、前記試験データセットは、試験サンプルのセットを含み、各訓練サンプルおよび各試験サンプルは、遺伝子発現データを含み、生物学的ステータスのセットより選択される、既知の生物学的ステータスを有する患者に対応する、提供することと、
前記ネットワークから、前記訓練データセットに基づいて分類子を取得することによって各々生成する、候補遺伝子シグネチャを受け取ることであって、各候補遺伝子シグネチャは、前記訓練データセットの中で異なる生物学的ステータスを判別するように決定される、遺伝子のセットを含む、受け取ることと、
前記試験サンプルの前記既知の生物学的ステータスを予測するとき、それぞれの候補遺伝子シグネチャの性能に基づいて、前記それぞれの候補遺伝子シグネチャ各々へスコアを割り当てることと、
前記割り当てられたスコアに基づいて、前記候補遺伝子シグネチャのサブセットを特定することと、
前記サブセットの中で、少なくとも閾値数の候補遺伝子シグネチャに含まれていた遺伝子を特定することと、
前記特定された遺伝子を前記遺伝子シグネチャとして記憶することと、を含む、方法。 - 各候補遺伝子シグネチャに許容される遺伝子の最大閾値数を表す数字を、前記複数のユーザー装置へ提供することを更に含む、請求項25に記載の方法。
- 前記試験データセットの一部分を前記ネットワークで、前記複数のユーザー装置へ提供することを更に含み、前記試験データセットの前記一部分は、既知の生物学的ステータスを有する患者に対する前記遺伝子発現データを含み、前記患者の前記既知の生物学的ステータスを含まない、請求項25または26に記載の方法。
- 各候補遺伝子シグネチャについて、前記試験データセットの中の各サンプルの信頼水準を受け取ることを更に含む、請求項27に記載の方法。
- 前記信頼水準は、前記試験データセットの中のサンプルが、前記生物学的ステータスのうちの一つに属すると予測される尤度を示す値である、請求項28に記載の方法。
- 前記スコアは、前記信頼水準に少なくとも一部基づく、請求項28または29に記載の方法。
- 前記スコアは、前記試験データセットの中の前記信頼水準、および患者の前記既知の生物学的ステータスより演算される、適合率−再現率下面積(area under the precision recall:AUPR)測定基準に少なくとも一部基づく、請求項30に記載の方法。
- 前記スコアは、対応する前記候補遺伝子シグネチャが、前記試験データセットの中の前記患者の既知の生物学的ステータスと一致する予測を提供するかに少なくとも一部基づく、請求項25〜31のいずれかに記載の方法。
- 前記対応する候補遺伝子シグネチャが、前記試験データセットの中の前記患者の既知の生物学的ステータスと一致する前記予測を提供するかは、マシューズ相関係数(MCC)を使用して決定される、請求項32に記載の方法。
- 前記候補遺伝子シグネチャは、各候補遺伝子シグネチャに一位および二位を取得させるように、少なくとも二つの異なる測定基準に従ってランク付けされる、請求項25〜33のいずれかに記載の方法。
- 各候補遺伝子シグネチャに対する前記一位および前記二位は、それぞれの候補遺伝子シグネチャ各々に前記スコアを取得させるように平均化される、請求項34に記載の方法。
- 前記生物学的ステータスのセットは、喫煙者ステータスを含む、請求項25〜35のいずれかに記載の方法。
- 前記喫煙者ステータスは、現喫煙者および非喫煙者を含む、請求項36に記載の方法。
- 前記遺伝子シグネチャは、全ゲノムより少なく、AHHR、CDKN1C、LRRN3、PID1、GPR15、SASH1、CLEC10A、LINC00599、P2RY6、DSC2、F2R、SEMA6BおよびTLR5を含む、請求項25〜37のいずれかに記載の方法。
- 前記遺伝子シグネチャは更に、AK8、FSTL1、RGL1およびVSIG4を含む、請求項38に記載の方法。
- 前記遺伝子シグネチャは更に、C15orf54、CTTNBP2、RANK1、GSE1、GUCY1A3、LOC200772、MARC2、MIR4697HGおよびPTGFRNを含む、請求項39に記載の方法。
- 前記遺伝子シグネチャは更に、ASGR2、B3GALT2、CYP4F22、FUCA1、GPR63、GUCY1B3、MB21D2、NLK、NR4A1、P2RY1、PF4、PTGFR、SH2D1B、ST6GALNAC1、TMEM163、TPPP3およびZNF618を含む、請求項40に記載の方法。
- 前記遺伝子シグネチャは、全ゲノムより少なく、LRRN3、AHHR、CDKN1C、PID1、SASH1、GPR15、LINC00599、P2RY6、CLEC10A、SEMA6B、F2R、CTTNBP2およびGPR63を含む、請求項25〜37のいずれかに記載の方法。
- 前記遺伝子シグネチャは更に、DSC2、TLR5、RGL1、FSTL1、VSIG4、AK8、GUCY1A3、GSE1、MIR4697HG、PTGFRN、LOC200772、FANK1、C15orf54、MARC2、TPPP3、ZNF618、PTGFR、P2RY1、TMEM163、ST6GALNAC1、SH2D1B、CYP4F22、PF4、FUCA1、MB21D2、NLK、B3GALT2、ASGR2、NR4A1およびGUCY1B3.を含む、請求項42に記載の方法。
- 前記遺伝子シグネチャは、全ゲノムより少なく、AHHR、P2RY6、KLRG1、LRRN3、COX6B2、CTTNBP2、DSC2、F2R、GUCY1B3、MT2、NGFRAP1、REEP6、SASH1およびTBX21を含む、請求項25〜37のいずれかに記載の方法。
- 少なくとも一つのプロセッサを備えるコンピュータ化したシステムで実行されるとき、請求項25〜44のいずれかに記載の前記方法の一つ以上の工程を前記プロセッサに実施させる、コンピュータ可読指示を含む、コンピュータプログラム製品。
- 対象から取得したサンプルを評価するための、コンピュータ実装された方法であって、
少なくとも一つのハードウェアプロセッサを含むコンピュータシステムによって、前記サンプルと関連付けられるデータセットを受け取ることであって、前記データセットは、全ゲノムより少ない遺伝子のセットに対する定量的な発現データを含み、前記遺伝子のセットは、AHHR、CDKN1C、LRRN3、PID1、GPR15、SASH1、CLEC10A、LINC00599、P2RY6、DSC2、F2R、SEMA6B、TLR5、AK8、FSTL1、RGL1、VSIG4、C15orf54、CTTNBP2、RANK1、GSE1、GUCY1A3、LOC200772、MARC2、MIR4697HG、PTGFRN、ASGR2、B3GALT2、CYP4F22、FUCA1、GPR63、GUCY1B3、MB21D2、NLK、NR4A1、P2RY1、PF4、PTGFR、SH2D1B、ST6GALNAC1、TMEM163、TPPP3およびZNF618を含む、受け取ることと、
前記少なくとも一つのハードウェアプロセッサによって、前記受け取ったデータセットに基づいてスコアを生成することであって、前記スコアは、前記対象の予測される喫煙ステータスを示す、生成することと、を含む、コンピュータ実装された方法。 - 前記スコアは、前記データセットに適用される分類スキームの結果であり、前記分類スキームは、前記データセットの中の前記定量的な発現データに基づいて決定される、請求項46に記載のコンピュータ実装された方法。
- AHHR、CDKN1C、LRRN3、PID1、GPR15、SASH1、CLEC10A、LINC00599、P2RY6、DSC2、F2R、SEMA6B、TLR5、AK8、FSTL1、RGL1、VSIG4、C15orf54、CTTNBP2、RANK1、GSE1、GUCY1A3、LOC200772、MARC2、MIR4697HG、PTGFRN、ASGR2、B3GALT2、CYP4F22、FUCA1、GPR63、GUCY1B3、MB21D2、NLK、NR4A1、P2RY1、PF4、PTGFR、SH2D1B、ST6GALNAC1、TMEM163、TPPP3およびZNF618の各々に対して、倍率変化値を演算することを更に含む、請求項46〜47のいずれかに記載のコンピュータ実装された方法。
- 各演算された倍率変化値のそれぞれが、少なくとも二つの独立した母集団データセットに対する所定の閾値を超えることを要する少なくとも一つの基準を、各倍率変化値が満たすと決定することを更に含む、請求項48に記載のコンピュータ実装された方法。
- 前記遺伝子のセットは、AHHR、CDKN1C、LRRN3、PID1、GPR15、SASH1、CLEC10A、LINC00599、P2RY6、DSC2、F2R、SEMA6B、TLR5、AK8、FSTL1、RGL1、VSIG4、C15orf54、CTTNBP2、RANK1、GSE1、GUCY1A3、LOC200772、MARC2、MIR4697HG、PTGFRN、ASGR2、B3GALT2、CYP4F22、FUCA1、GPR63、GUCY1B3、MB21D2、NLK、NR4A1、P2RY1、PF4、PTGFR、SH2D1B、ST6GALNAC1、TMEM163、TPPP3およびZNF618から成る、請求項46〜49のいずれかに記載のコンピュータ実装された方法。
- 少なくとも一つのプロセッサを備えるコンピュータ化したシステムで実行されるとき、請求項46〜50のいずれかに記載の前記方法の一つ以上の工程を前記プロセッサに実施させる、コンピュータ可読指示を含む、コンピュータプログラム製品。
- 個人の喫煙者ステータスを予測するためのキットであって、
試験サンプルの中の遺伝子シグネチャに遺伝子の発現レベルを検出する、試薬のセットであって、前記遺伝子シグネチャは、AHHR、CDKN1C、LRRN3、PID1、GPR15、SASH1、CLEC10A、LINC00599、P2RY6、DSC2、F2R、SEMA6B、TLR5、AK8、FSTL1、RGL1、VSIG4、C15orf54、CTTNBP2、RANK1、GSE1、GUCY1A3、LOC200772、MARC2、MIR4697HG、PTGFRN、ASGR2、B3GALT2、CYP4F22、FUCA1、GPR63、GUCY1B3、MB21D2、NLK、NR4A1、P2RY1、PF4、PTGFR、SH2D1B、ST6GALNAC1、TMEM163、TPPP3およびZNF618を含む、試薬のセットと、
前記個人の喫煙者ステータスを予測する前記キットを使用するための説明書と、を備えるキット。 - 前記キットは、喫煙製品の代替品の個人に対する効果を評価するために使用される、請求項52に記載のキット。
- 前記喫煙製品の前記代替品は、加熱式たばこ製品である、請求項53に記載のキット。
- 前記代替品の前記個人に対する前記効果は、前記個人を非喫煙者として分類することである、請求項52〜54のいずれかに記載のキット。
- 対象から取得したサンプルを評価するための、コンピュータ実装された方法であって、
少なくとも一つのハードウェアプロセッサを含むコンピュータシステムによって、前記サンプルと関連付けられるデータセットを受け取ることであって、前記データセットは、全ゲノムより少ない遺伝子のセットに対する定量的な発現データを含み、前記遺伝子のセットは、AHHR、P2RY6、KLRG1、LRRN3、COX6B2、CTTNBP2、DSC2、F2R、GUCY1B3、MT2、NGFRAP1、REEP6、SASH1およびTBX21を含む、受け取ることと、
前記少なくとも一つのハードウェアプロセッサによって、前記受け取ったデータセットの中の前記遺伝子のセットに対する前記定量的な発現データに基づいてスコアを生成することであって、前記スコアは、40個より少ない遺伝子に基づき、前記対象の予測される喫煙ステータスを示す、生成することと、を含む、コンピュータ実装された方法。 - 前記スコアは、前記データセットに適用される分類スキームの結果であり、前記分類スキームは、前記データセットの中の前記定量的な発現データに基づいて決定される、請求項56に記載のコンピュータ実装された方法。
- AHHR、P2RY6、KLRG1、LRRN3、COX6B2、CTTNBP2、DSC2、F2R、GUCY1B3、MT2、NGFRAP1、REEP6、SASH1およびTBX21の各々に対して、倍率変化値を演算することを更に含む、請求項56〜57のいずれかに記載のコンピュータ実装された方法。
- 各演算された倍率変化値のそれぞれが、少なくとも二つの独立した母集団データセットに対する所定の閾値を超えることを要する少なくとも一つの基準を、各倍率変化値が満たすと決定することを更に含む、請求項58に記載のコンピュータ実装された方法。
- 前記遺伝子のセットは、AHHR、P2RY6、KLRG1、LRRN3、COX6B2、CTTNBP2、DSC2、F2R、GUCY1B3、MT2、NGFRAP1、REEP6、SASH1およびTBX21から成る、請求項56に記載のコンピュータ実装された方法。
- 少なくとも一つのプロセッサを備えるコンピュータ化したシステムで実行されるとき、請求項56〜60のいずれかに記載の前記方法の一つ以上の工程を前記プロセッサに実施させる、コンピュータ可読指示を含む、コンピュータプログラム製品。
- 個人の喫煙者ステータスを予測するためのキットであって、
試験サンプルの中の遺伝子シグネチャに遺伝子の発現レベルを検出する、試薬のセットであって、前記遺伝子シグネチャは、AHHR、P2RY6、KLRG1、LRRN3、COX6B2、CTTNBP2、DSC2、F2R、GUCY1B3、MT2、NGFRAP1、REEP6、SASH1およびTBX21を含み、前記遺伝子シグネチャは、40個より少ない遺伝子を含む、試薬のセットと、
前記個人の喫煙者ステータスを予測する前記キットを使用するための説明書と、を備えるキット。 - 前記キットは、喫煙製品の代替品の個人に対する効果を評価するために使用される、請求項62に記載のキット。
- 前記喫煙製品の前記代替品は、加熱式たばこ製品である、請求項63に記載のキット。
- 前記代替品の前記個人に対する前記効果は、前記個人を非喫煙者として分類することである、請求項63〜64のいずれかに記載のキット。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022016224A JP7275334B2 (ja) | 2016-09-14 | 2022-02-04 | 個人の生物学的ステータスを予測するためのシステム、方法および遺伝子シグネチャ |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662394551P | 2016-09-14 | 2016-09-14 | |
US62/394,551 | 2016-09-14 | ||
PCT/EP2017/063073 WO2018050299A1 (en) | 2016-09-14 | 2017-05-30 | Systems, methods, and gene signatures for predicting a biological status of an individual |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022016224A Division JP7275334B2 (ja) | 2016-09-14 | 2022-02-04 | 個人の生物学的ステータスを予測するためのシステム、方法および遺伝子シグネチャ |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019532410A true JP2019532410A (ja) | 2019-11-07 |
JP2019532410A5 JP2019532410A5 (ja) | 2020-07-16 |
JP7022119B2 JP7022119B2 (ja) | 2022-02-17 |
Family
ID=59021473
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019513943A Active JP7022119B2 (ja) | 2016-09-14 | 2017-05-30 | 個人の生物学的ステータスを予測するためのシステム、方法および遺伝子シグネチャ |
JP2022016224A Active JP7275334B2 (ja) | 2016-09-14 | 2022-02-04 | 個人の生物学的ステータスを予測するためのシステム、方法および遺伝子シグネチャ |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022016224A Active JP7275334B2 (ja) | 2016-09-14 | 2022-02-04 | 個人の生物学的ステータスを予測するためのシステム、方法および遺伝子シグネチャ |
Country Status (9)
Country | Link |
---|---|
US (1) | US20190244677A1 (ja) |
EP (1) | EP3513344A1 (ja) |
JP (2) | JP7022119B2 (ja) |
KR (2) | KR102421109B1 (ja) |
CN (1) | CN109643584A (ja) |
BR (1) | BR112019004920A2 (ja) |
CA (1) | CA3036597C (ja) |
MX (1) | MX2019002316A (ja) |
WO (1) | WO2018050299A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102517328B1 (ko) * | 2021-03-31 | 2023-04-04 | 주식회사 크라우드웍스 | 작업툴을 이용한 이미지 내 세포 분별에 관한 작업 수행 방법 및 프로그램 |
CN113159571B (zh) * | 2021-04-20 | 2024-08-27 | 中国农业大学 | 一种跨境外来物种风险等级判定及智能识别方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006314315A (ja) * | 2005-05-10 | 2006-11-24 | Synergenz Bioscience Ltd | 肺の機能と異常を調べるための方法と組成物 |
JP2011516046A (ja) * | 2008-03-28 | 2011-05-26 | トラスティーズ オブ ボストン ユニバーシティ | 肺障害の検出のための多元的方法 |
JP2012518997A (ja) * | 2009-02-26 | 2012-08-23 | ジ・オハイオ・ステイト・ユニバーシティ・リサーチ・ファウンデイション | 喫煙未経験者におけるマイクロrna、ならびに関連する材料および方法 |
JP2014531202A (ja) * | 2011-08-29 | 2014-11-27 | カーディオ ディーエクス インコーポレイティッド | 喫煙状態を判定するための方法および組成物 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005000098A2 (en) * | 2003-06-10 | 2005-01-06 | The Trustees Of Boston University | Detection methods for disorders of the lung |
WO2007103541A2 (en) * | 2006-03-09 | 2007-09-13 | The Trustees Of Boston University | Diagnostic and prognostic methods for lung disorders using gene expression profiles from nose epithelial cells |
US8541170B2 (en) * | 2008-11-17 | 2013-09-24 | Veracyte, Inc. | Methods and compositions of molecular profiling for disease diagnostics |
US20120245952A1 (en) * | 2011-03-23 | 2012-09-27 | University Of Rochester | Crowdsourcing medical expertise |
US10329618B2 (en) * | 2012-09-06 | 2019-06-25 | Duke University | Diagnostic markers for platelet function and methods of use |
WO2015091225A1 (en) * | 2013-12-16 | 2015-06-25 | Philip Morris Products S.A. | Systems and methods for predicting a smoking status of an individual |
CA2954169A1 (en) * | 2014-07-14 | 2016-01-21 | Allegro Diagnostics Corp. | Methods for evaluating lung cancer status |
EP3770274A1 (en) * | 2014-11-05 | 2021-01-27 | Veracyte, Inc. | Systems and methods of diagnosing idiopathic pulmonary fibrosis on transbronchial biopsies using machine learning and high dimensional transcriptional data |
-
2017
- 2017-05-30 CN CN201780050613.8A patent/CN109643584A/zh active Pending
- 2017-05-30 EP EP17728486.6A patent/EP3513344A1/en active Pending
- 2017-05-30 JP JP2019513943A patent/JP7022119B2/ja active Active
- 2017-05-30 US US16/333,157 patent/US20190244677A1/en not_active Abandoned
- 2017-05-30 MX MX2019002316A patent/MX2019002316A/es unknown
- 2017-05-30 CA CA3036597A patent/CA3036597C/en active Active
- 2017-05-30 WO PCT/EP2017/063073 patent/WO2018050299A1/en unknown
- 2017-05-30 KR KR1020197009475A patent/KR102421109B1/ko active IP Right Grant
- 2017-05-30 KR KR1020227023834A patent/KR102685289B1/ko active IP Right Grant
- 2017-05-30 BR BR112019004920A patent/BR112019004920A2/pt active Search and Examination
-
2022
- 2022-02-04 JP JP2022016224A patent/JP7275334B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006314315A (ja) * | 2005-05-10 | 2006-11-24 | Synergenz Bioscience Ltd | 肺の機能と異常を調べるための方法と組成物 |
JP2011516046A (ja) * | 2008-03-28 | 2011-05-26 | トラスティーズ オブ ボストン ユニバーシティ | 肺障害の検出のための多元的方法 |
JP2012518997A (ja) * | 2009-02-26 | 2012-08-23 | ジ・オハイオ・ステイト・ユニバーシティ・リサーチ・ファウンデイション | 喫煙未経験者におけるマイクロrna、ならびに関連する材料および方法 |
JP2014531202A (ja) * | 2011-08-29 | 2014-11-27 | カーディオ ディーエクス インコーポレイティッド | 喫煙状態を判定するための方法および組成物 |
Also Published As
Publication number | Publication date |
---|---|
EP3513344A1 (en) | 2019-07-24 |
WO2018050299A1 (en) | 2018-03-22 |
JP7022119B2 (ja) | 2022-02-17 |
JP2022062189A (ja) | 2022-04-19 |
MX2019002316A (es) | 2019-06-24 |
CA3036597C (en) | 2023-03-28 |
US20190244677A1 (en) | 2019-08-08 |
CA3036597A1 (en) | 2018-03-22 |
KR102421109B1 (ko) | 2022-07-14 |
KR20220103819A (ko) | 2022-07-22 |
KR102685289B1 (ko) | 2024-07-16 |
JP7275334B2 (ja) | 2023-05-17 |
BR112019004920A2 (pt) | 2019-06-04 |
CN109643584A (zh) | 2019-04-16 |
KR20190046940A (ko) | 2019-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Whalen et al. | Navigating the pitfalls of applying machine learning in genomics | |
Tian et al. | Benchmarking single cell RNA-sequencing analysis pipelines using mixture control experiments | |
Tang et al. | Tumor origin detection with tissue-specific miRNA and DNA methylation markers | |
Broadhurst et al. | Statistical strategies for avoiding false discoveries in metabolomics and related experiments | |
Zheng et al. | Application of the time-dependent ROC curves for prognostic accuracy with multiple biomarkers | |
Boulesteix et al. | Added predictive value of high-throughput molecular data to clinical data and its validation | |
US10580515B2 (en) | Systems and methods for generating biomarker signatures | |
JP7275334B2 (ja) | 個人の生物学的ステータスを予測するためのシステム、方法および遺伝子シグネチャ | |
JP2023526241A (ja) | 複数の機械学習モデルに基づく臨床予測器 | |
McShane et al. | Development of omics-based clinical tests for prognosis and therapy selection: the challenge of achieving statistical robustness and clinical utility | |
Rahnenführer et al. | Statistical analysis of high-dimensional biomedical data: a gentle introduction to analytical goals, common approaches and challenges | |
Ng et al. | The benefits and pitfalls of machine learning for biomarker discovery | |
Zheng et al. | Comparison of pathway and gene-level models for cancer prognosis prediction | |
Seifert et al. | Integrating biological knowledge and gene expression data using pathway-guided random forests: a benchmarking study | |
Chung et al. | Decoding the exposome: data science methodologies and implications in exposome-wide association studies (ExWASs) | |
Belcastro et al. | The sbv IMPROVER systems toxicology computational challenge: identification of human and species-independent blood response markers as predictors of smoking exposure and cessation status | |
Mittal et al. | Large‐scale parametric survival analysis | |
CN111540410B (zh) | 用于预测个体的吸烟状况的系统和方法 | |
Cousins et al. | Gene set proximity analysis: expanding gene set enrichment analysis through learned geometric embeddings, with drug-repurposing applications in COVID-19 | |
US12060578B2 (en) | Systems and methods for associating compounds with physiological conditions using fingerprint analysis | |
Mamoshina et al. | Testing for batch effect through age predictors | |
Lauria | Rank‐Based miRNA Signatures for Early Cancer Detection | |
Gibbs et al. | Case studies in data analysis | |
Deng et al. | Introduction to the development and validation of predictive biomarker models from high-throughput data sets | |
Yadav et al. | Integrated analysis of gene expressions and targeted mirnas for explaining crosstalk between oral and esophageal squamous cell carcinomas through an interpretable machine learning approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20190405 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190410 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200601 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200601 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210818 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220204 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7022119 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |