CN114556481A - 用于预测测试物质在人类中的适应症的人工智能模型 - Google Patents
用于预测测试物质在人类中的适应症的人工智能模型 Download PDFInfo
- Publication number
- CN114556481A CN114556481A CN202080072814.XA CN202080072814A CN114556481A CN 114556481 A CN114556481 A CN 114556481A CN 202080072814 A CN202080072814 A CN 202080072814A CN 114556481 A CN114556481 A CN 114556481A
- Authority
- CN
- China
- Prior art keywords
- data set
- test
- training data
- training
- artificial intelligence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 239000000126 substance Substances 0.000 title claims abstract description 275
- 238000012360 testing method Methods 0.000 title claims abstract description 196
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 110
- 238000012549 training Methods 0.000 claims abstract description 259
- 210000000056 organ Anatomy 0.000 claims abstract description 159
- 239000000090 biomarker Substances 0.000 claims abstract description 89
- 238000000034 method Methods 0.000 claims abstract description 83
- 241000282412 Homo Species 0.000 claims abstract description 20
- 238000012545 processing Methods 0.000 claims description 79
- 230000000875 corresponding effect Effects 0.000 claims description 61
- 238000004891 communication Methods 0.000 claims description 51
- 230000002411 adverse Effects 0.000 claims description 47
- 230000000694 effects Effects 0.000 claims description 29
- 238000004590 computer program Methods 0.000 claims description 19
- 238000012706 support-vector machine Methods 0.000 claims description 3
- 230000002596 correlated effect Effects 0.000 claims description 2
- 239000003814 drug Substances 0.000 description 89
- 229940079593 drug Drugs 0.000 description 87
- 238000003860 storage Methods 0.000 description 70
- 238000005259 measurement Methods 0.000 description 62
- 108090000623 proteins and genes Proteins 0.000 description 21
- 230000006870 function Effects 0.000 description 20
- 238000011814 C57BL/6N mouse Methods 0.000 description 16
- 230000014509 gene expression Effects 0.000 description 16
- 230000005540 biological transmission Effects 0.000 description 13
- 230000004044 response Effects 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 12
- 239000002207 metabolite Substances 0.000 description 12
- 210000001519 tissue Anatomy 0.000 description 12
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 11
- 241000699670 Mus sp. Species 0.000 description 11
- 238000001647 drug administration Methods 0.000 description 11
- 241001465754 Metazoa Species 0.000 description 10
- 241000699666 Mus <mouse, genus> Species 0.000 description 10
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 9
- CEUORZQYGODEFX-UHFFFAOYSA-N Aripirazole Chemical compound ClC1=CC=CC(N2CCN(CCCCOC=3C=C4NC(=O)CCC4=CC=3)CC2)=C1Cl CEUORZQYGODEFX-UHFFFAOYSA-N 0.000 description 9
- 229960004372 aripiprazole Drugs 0.000 description 9
- 210000004027 cell Anatomy 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 230000009471 action Effects 0.000 description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 210000001124 body fluid Anatomy 0.000 description 7
- 210000002216 heart Anatomy 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 229920002134 Carboxymethyl cellulose Polymers 0.000 description 6
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 6
- DCSBSVSZJRSITC-UHFFFAOYSA-M alendronate sodium trihydrate Chemical compound O.O.O.[Na+].NCCCC(O)(P(O)(O)=O)P(O)([O-])=O DCSBSVSZJRSITC-UHFFFAOYSA-M 0.000 description 6
- 239000010839 body fluid Substances 0.000 description 6
- 239000001768 carboxy methyl cellulose Substances 0.000 description 6
- 235000010948 carboxy methyl cellulose Nutrition 0.000 description 6
- 239000008112 carboxymethyl-cellulose Substances 0.000 description 6
- 229960004170 clozapine Drugs 0.000 description 6
- QZUDBNBUXVUHMW-UHFFFAOYSA-N clozapine Chemical compound C1CN(C)CCN1C1=NC2=CC(Cl)=CC=C2NC2=CC=CC=C12 QZUDBNBUXVUHMW-UHFFFAOYSA-N 0.000 description 6
- 201000010099 disease Diseases 0.000 description 6
- 210000004072 lung Anatomy 0.000 description 6
- 239000002547 new drug Substances 0.000 description 6
- 108020004707 nucleic acids Proteins 0.000 description 6
- 102000039446 nucleic acids Human genes 0.000 description 6
- 150000007523 nucleic acids Chemical class 0.000 description 6
- 239000002504 physiological saline solution Substances 0.000 description 6
- 210000003491 skin Anatomy 0.000 description 6
- TTZHDVOVKQGIBA-IQWMDFIBSA-N sofosbuvir Chemical compound N1([C@@H]2O[C@@H]([C@H]([C@]2(F)C)O)CO[P@@](=O)(N[C@@H](C)C(=O)OC(C)C)OC=2C=CC=CC=2)C=CC(=O)NC1=O TTZHDVOVKQGIBA-IQWMDFIBSA-N 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 102000019034 Chemokines Human genes 0.000 description 5
- 108010012236 Chemokines Proteins 0.000 description 5
- 238000003559 RNA-seq method Methods 0.000 description 5
- 229960004343 alendronic acid Drugs 0.000 description 5
- 210000004556 brain Anatomy 0.000 description 5
- 238000007796 conventional method Methods 0.000 description 5
- GOTYRUGSSMKFNF-UHFFFAOYSA-N lenalidomide Chemical compound C1C=2C(N)=CC=CC=2C(=O)N1C1CCC(=O)NC1=O GOTYRUGSSMKFNF-UHFFFAOYSA-N 0.000 description 5
- 229960004942 lenalidomide Drugs 0.000 description 5
- 210000004185 liver Anatomy 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 5
- 239000013642 negative control Substances 0.000 description 5
- 210000002027 skeletal muscle Anatomy 0.000 description 5
- 229960002063 sofosbuvir Drugs 0.000 description 5
- 210000000952 spleen Anatomy 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 229930186217 Glycolipid Natural products 0.000 description 4
- 102000003886 Glycoproteins Human genes 0.000 description 4
- 108090000288 Glycoproteins Proteins 0.000 description 4
- 102000004895 Lipoproteins Human genes 0.000 description 4
- 108090001030 Lipoproteins Proteins 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- IIDJRNMFWXDHID-UHFFFAOYSA-N Risedronic acid Chemical compound OP(=O)(O)C(P(O)(O)=O)(O)CC1=CC=CN=C1 IIDJRNMFWXDHID-UHFFFAOYSA-N 0.000 description 4
- 210000004100 adrenal gland Anatomy 0.000 description 4
- 150000001413 amino acids Chemical class 0.000 description 4
- 210000000709 aorta Anatomy 0.000 description 4
- 150000001720 carbohydrates Chemical class 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 229960003722 doxycycline Drugs 0.000 description 4
- XQTWDDCIUJNLTR-CVHRZJFOSA-N doxycycline monohydrate Chemical compound O.O=C1C2=C(O)C=CC=C2[C@H](C)[C@@H]2C1=C(O)[C@]1(O)C(=O)C(C(N)=O)=C(O)[C@@H](N(C)C)[C@@H]1[C@H]2O XQTWDDCIUJNLTR-CVHRZJFOSA-N 0.000 description 4
- 238000004453 electron probe microanalysis Methods 0.000 description 4
- UFZOPKFMKMAWLU-UHFFFAOYSA-N ethoxy(methyl)phosphinic acid Chemical compound CCOP(C)(O)=O UFZOPKFMKMAWLU-UHFFFAOYSA-N 0.000 description 4
- 210000003405 ileum Anatomy 0.000 description 4
- 210000001630 jejunum Anatomy 0.000 description 4
- 210000003734 kidney Anatomy 0.000 description 4
- 150000002632 lipids Chemical class 0.000 description 4
- 229960005017 olanzapine Drugs 0.000 description 4
- KVWDHTXUZHCGIO-UHFFFAOYSA-N olanzapine Chemical compound C1CN(C)CCN1C1=NC2=CC=CC=C2NC2=C1C=C(C)S2 KVWDHTXUZHCGIO-UHFFFAOYSA-N 0.000 description 4
- 210000000496 pancreas Anatomy 0.000 description 4
- 229960005489 paracetamol Drugs 0.000 description 4
- 229920001184 polypeptide Polymers 0.000 description 4
- 150000008442 polyphenolic compounds Chemical class 0.000 description 4
- 235000013824 polyphenols Nutrition 0.000 description 4
- 108090000765 processed proteins & peptides Proteins 0.000 description 4
- 102000004196 processed proteins & peptides Human genes 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 239000002994 raw material Substances 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 210000002784 stomach Anatomy 0.000 description 4
- 210000001550 testis Anatomy 0.000 description 4
- 210000001541 thymus gland Anatomy 0.000 description 4
- 210000001685 thyroid gland Anatomy 0.000 description 4
- 238000011222 transcriptome analysis Methods 0.000 description 4
- VSWBSWWIRNCQIJ-HUUCEWRRSA-N (S,S)-asenapine Chemical compound O1C2=CC=CC=C2[C@H]2CN(C)C[C@@H]2C2=CC(Cl)=CC=C21 VSWBSWWIRNCQIJ-HUUCEWRRSA-N 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 241000700159 Rattus Species 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 108010049264 Teriparatide Proteins 0.000 description 3
- 210000000593 adipose tissue white Anatomy 0.000 description 3
- 229960005245 asenapine Drugs 0.000 description 3
- 210000001185 bone marrow Anatomy 0.000 description 3
- 210000005252 bulbus oculi Anatomy 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- DQLATGHUWYMOKM-UHFFFAOYSA-L cisplatin Chemical compound N[Pt](N)(Cl)Cl DQLATGHUWYMOKM-UHFFFAOYSA-L 0.000 description 3
- 229960004316 cisplatin Drugs 0.000 description 3
- 201000010063 epididymitis Diseases 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 210000002429 large intestine Anatomy 0.000 description 3
- 229960001432 lurasidone Drugs 0.000 description 3
- PQXKDMSYBGKCJA-CVTJIBDQSA-N lurasidone Chemical compound C1=CC=C2C(N3CCN(CC3)C[C@@H]3CCCC[C@H]3CN3C(=O)[C@@H]4[C@H]5CC[C@H](C5)[C@@H]4C3=O)=NSC2=C1 PQXKDMSYBGKCJA-CVTJIBDQSA-N 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 229910021645 metal ion Inorganic materials 0.000 description 3
- 108091027963 non-coding RNA Proteins 0.000 description 3
- 102000042567 non-coding RNA Human genes 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 210000003625 skull Anatomy 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- OGBMKVWORPGQRR-UMXFMPSGSA-N teriparatide Chemical compound C([C@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)[C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 OGBMKVWORPGQRR-UMXFMPSGSA-N 0.000 description 3
- 229960005460 teriparatide Drugs 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 206010012289 Dementia Diseases 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 206010062767 Hypophysitis Diseases 0.000 description 2
- 108700011259 MicroRNAs Proteins 0.000 description 2
- 208000028389 Nerve injury Diseases 0.000 description 2
- 208000031481 Pathologic Constriction Diseases 0.000 description 2
- 241000606701 Rickettsia Species 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 2
- 210000002798 bone marrow cell Anatomy 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000009274 differential gene expression Effects 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 230000002124 endocrine Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 230000008764 nerve damage Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 210000003101 oviduct Anatomy 0.000 description 2
- 210000003681 parotid gland Anatomy 0.000 description 2
- 230000001817 pituitary effect Effects 0.000 description 2
- 210000003635 pituitary gland Anatomy 0.000 description 2
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 2
- 229920000053 polysorbate 80 Polymers 0.000 description 2
- 230000001850 reproductive effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 229960000759 risedronic acid Drugs 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000036262 stenosis Effects 0.000 description 2
- 208000037804 stenosis Diseases 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 210000003437 trachea Anatomy 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 2
- 210000001215 vagina Anatomy 0.000 description 2
- 210000003462 vein Anatomy 0.000 description 2
- VQUPQWGKORWZII-WDPYGAQVSA-N (2r,3r)-5,7-dihydroxy-2-(4-hydroxyphenyl)-3-[(2s,3r,4r,5r,6s)-3,4,5-trihydroxy-6-methyloxan-2-yl]oxy-2,3-dihydrochromen-4-one Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@H]1O[C@H]1C(=O)C2=C(O)C=C(O)C=C2O[C@@H]1C1=CC=C(O)C=C1 VQUPQWGKORWZII-WDPYGAQVSA-N 0.000 description 1
- SGKRLCUYIXIAHR-NLJUDYQYSA-N (4r,4ar,5s,5ar,6r,12ar)-4-(dimethylamino)-1,5,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4a,5,5a,6-tetrahydro-4h-tetracene-2-carboxamide Chemical compound C1=CC=C2[C@H](C)[C@@H]([C@H](O)[C@@H]3[C@](C(O)=C(C(N)=O)C(=O)[C@@H]3N(C)C)(O)C3=O)C3=C(O)C2=C1O SGKRLCUYIXIAHR-NLJUDYQYSA-N 0.000 description 1
- GMDCDXMAFMEDAG-CHHFXETESA-N (S,S)-asenapine maleate Chemical compound OC(=O)\C=C/C(O)=O.O1C2=CC=CC=C2[C@H]2CN(C)C[C@@H]2C2=CC(Cl)=CC=C21 GMDCDXMAFMEDAG-CHHFXETESA-N 0.000 description 1
- PTNZGHXUZDHMIQ-UHFFFAOYSA-N 4-(dimethylamino)-1,5,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4a,5,5a,6-tetrahydro-4h-tetracene-2-carboxamide;hydrochloride Chemical compound Cl.C1=CC=C2C(C)C(C(O)C3C(C(O)=C(C(N)=O)C(=O)C3N(C)C)(O)C3=O)C3=C(O)C2=C1O PTNZGHXUZDHMIQ-UHFFFAOYSA-N 0.000 description 1
- OGSPWJRAVKPPFI-UHFFFAOYSA-N Alendronic Acid Chemical compound NCCCC(O)(P(O)(O)=O)P(O)(O)=O OGSPWJRAVKPPFI-UHFFFAOYSA-N 0.000 description 1
- 206010052613 Allergic bronchitis Diseases 0.000 description 1
- 206010002329 Aneurysm Diseases 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241000606161 Chlamydia Species 0.000 description 1
- 241000725101 Clea Species 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- VQUPQWGKORWZII-KTLFEHCLSA-N Dihydrokaempferol-3-O-alpha-L-rhamnopyranoside Natural products O([C@@H]1[C@H](c2ccc(O)cc2)Oc2c(c(O)cc(O)c2)C1=O)[C@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@H](C)O1 VQUPQWGKORWZII-KTLFEHCLSA-N 0.000 description 1
- 206010014418 Electrolyte imbalance Diseases 0.000 description 1
- 208000005189 Embolism Diseases 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 206010018364 Glomerulonephritis Diseases 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 208000032843 Hemorrhage Diseases 0.000 description 1
- 101001135770 Homo sapiens Parathyroid hormone Proteins 0.000 description 1
- 101001135995 Homo sapiens Probable peptidyl-tRNA hydrolase Proteins 0.000 description 1
- 208000017170 Lipid metabolism disease Diseases 0.000 description 1
- VQUPQWGKORWZII-UHFFFAOYSA-N Neoisoengelitin Natural products OC1C(O)C(O)C(C)OC1OC1C(=O)C2=C(O)C=C(O)C=C2OC1C1=CC=C(O)C=C1 VQUPQWGKORWZII-UHFFFAOYSA-N 0.000 description 1
- 206010067482 No adverse event Diseases 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 208000002151 Pleural effusion Diseases 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 208000007536 Thrombosis Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 210000000577 adipose tissue Anatomy 0.000 description 1
- 210000003486 adipose tissue brown Anatomy 0.000 description 1
- 229940062527 alendronate Drugs 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 1
- 210000000436 anus Anatomy 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 210000001367 artery Anatomy 0.000 description 1
- 210000001815 ascending colon Anatomy 0.000 description 1
- 229960001615 asenapine maleate Drugs 0.000 description 1
- 208000029618 autoimmune pulmonary alveolar proteinosis Diseases 0.000 description 1
- 210000000467 autonomic pathway Anatomy 0.000 description 1
- 208000012999 benign epithelial neoplasm Diseases 0.000 description 1
- 210000000941 bile Anatomy 0.000 description 1
- 210000000013 bile duct Anatomy 0.000 description 1
- 210000003445 biliary tract Anatomy 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 210000000133 brain stem Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 210000000621 bronchi Anatomy 0.000 description 1
- 244000144987 brood Species 0.000 description 1
- 208000020450 carbohydrate metabolism disease Diseases 0.000 description 1
- 210000000845 cartilage Anatomy 0.000 description 1
- 210000004534 cecum Anatomy 0.000 description 1
- 210000001638 cerebellum Anatomy 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 210000003477 cochlea Anatomy 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 208000027744 congestion Diseases 0.000 description 1
- 210000002808 connective tissue Anatomy 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 210000000188 diaphragm Anatomy 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 229960004082 doxycycline hydrochloride Drugs 0.000 description 1
- 229940000406 drug candidate Drugs 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 230000000857 drug effect Effects 0.000 description 1
- 210000001198 duodenum Anatomy 0.000 description 1
- 210000000883 ear external Anatomy 0.000 description 1
- 210000003027 ear inner Anatomy 0.000 description 1
- 210000000959 ear middle Anatomy 0.000 description 1
- 230000009982 effect on human Effects 0.000 description 1
- OBWASQILIWPZMG-QZMOQZSNSA-N empagliflozin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1C1=CC=C(Cl)C(CC=2C=CC(O[C@@H]3COCC3)=CC=2)=C1 OBWASQILIWPZMG-QZMOQZSNSA-N 0.000 description 1
- 229960003345 empagliflozin Drugs 0.000 description 1
- 210000000918 epididymis Anatomy 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- 229960002027 evolocumab Drugs 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 210000003722 extracellular fluid Anatomy 0.000 description 1
- 210000001508 eye Anatomy 0.000 description 1
- 210000000744 eyelid Anatomy 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 210000000232 gallbladder Anatomy 0.000 description 1
- 210000004051 gastric juice Anatomy 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 210000002149 gonad Anatomy 0.000 description 1
- 210000000777 hematopoietic system Anatomy 0.000 description 1
- 102000058004 human PTH Human genes 0.000 description 1
- 210000003016 hypothalamus Anatomy 0.000 description 1
- -1 ibritumomab Chemical compound 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 208000017745 inborn carbohydrate metabolic disease Diseases 0.000 description 1
- 210000001613 integumentary system Anatomy 0.000 description 1
- 208000023589 ischemic disease Diseases 0.000 description 1
- 208000017169 kidney disease Diseases 0.000 description 1
- 210000004561 lacrimal apparatus Anatomy 0.000 description 1
- 210000000867 larynx Anatomy 0.000 description 1
- 210000003041 ligament Anatomy 0.000 description 1
- 229960002863 lurasidone hydrochloride Drugs 0.000 description 1
- NEKCRUIRPWNMLK-SCIYSFAVSA-N lurasidone hydrochloride Chemical compound Cl.C1=CC=C2C(N3CCN(CC3)C[C@@H]3CCCC[C@H]3CN3C(=O)[C@@H]4[C@H]5CC[C@H](C5)[C@@H]4C3=O)=NSC2=C1 NEKCRUIRPWNMLK-SCIYSFAVSA-N 0.000 description 1
- 210000004880 lymph fluid Anatomy 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 210000001365 lymphatic vessel Anatomy 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 210000001259 mesencephalon Anatomy 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 201000006417 multiple sclerosis Diseases 0.000 description 1
- 206010028417 myasthenia gravis Diseases 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 235000021590 normal diet Nutrition 0.000 description 1
- 210000004798 organs belonging to the digestive system Anatomy 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 210000003254 palate Anatomy 0.000 description 1
- 210000002741 palatine tonsil Anatomy 0.000 description 1
- 210000000277 pancreatic duct Anatomy 0.000 description 1
- 210000001819 pancreatic juice Anatomy 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 210000002990 parathyroid gland Anatomy 0.000 description 1
- 210000003899 penis Anatomy 0.000 description 1
- 210000000578 peripheral nerve Anatomy 0.000 description 1
- 210000004303 peritoneum Anatomy 0.000 description 1
- 210000003800 pharynx Anatomy 0.000 description 1
- 210000004560 pineal gland Anatomy 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Substances [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 1
- 210000004224 pleura Anatomy 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 229940089617 risedronate Drugs 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 210000003079 salivary gland Anatomy 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 210000001599 sigmoid colon Anatomy 0.000 description 1
- 208000019116 sleep disease Diseases 0.000 description 1
- 208000020685 sleep-wake disease Diseases 0.000 description 1
- 210000004872 soft tissue Anatomy 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 210000000278 spinal cord Anatomy 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 210000002435 tendon Anatomy 0.000 description 1
- 210000001103 thalamus Anatomy 0.000 description 1
- 210000002105 tongue Anatomy 0.000 description 1
- 210000003384 transverse colon Anatomy 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 210000000626 ureter Anatomy 0.000 description 1
- 210000003708 urethra Anatomy 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- 210000001177 vas deferen Anatomy 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6809—Methods for determination or identification of nucleic acids involving differential detection
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/15—Medicinal preparations ; Physical properties thereof, e.g. dissolubility
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/40—ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Medical Informatics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Epidemiology (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Immunology (AREA)
- Zoology (AREA)
- Evolutionary Computation (AREA)
- Medicinal Chemistry (AREA)
- Artificial Intelligence (AREA)
- Pathology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biochemistry (AREA)
- Primary Health Care (AREA)
- Bioethics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Pharmacology & Pharmacy (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Environmental Sciences (AREA)
- General Physics & Mathematics (AREA)
- Wood Science & Technology (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
Abstract
目的是即使在测试物质具有关于用于获取训练数据的现有物质尚未已知的功效的情况下也预测该测试物质的功效。使用通过如下的训练方法训练的人工智能模型,该训练方法包括:将第一训练数据集、第二训练数据集和第三训练数据集彼此相关联地输入到人工智能模型中,以训练所述人工智能模型。第一训练数据集是指示如下的数据集:从已经分别给予在人类中具有已知适应症的多个预定现有物质的相应非人类动物收集到的一个器官或多个不同器官中的各器官中的生物标志物的动态的数据集与指示所给予的预定现有物质的相应名称的标签相关联。第二训练数据集是指示如下的数据集:多个预定现有物质的相应名称的标签与指示针对多个预定现有物质中的各预定现有物质所报告的适应症的标签相关联。第三训练数据集是指示如下的数据集:针对多个预定现有物质中的各预定现有物质所报告的适应症的标签与关于与这些适应症中的各适应症相对应地报告的不良事件的信息相关联。人工智能模型用于预测测试物质在人类中的适应症。
Description
技术领域
本说明书公开了用于预测测试物质在人类中的适应症的方法、用于预测测试物质在人类中的适应症的装置、用于预测测试物质在人类中的适应症的程序、以及用于训练用于预测测试物质在人类中的适应症的人工智能模型的方法以及经训练的人工智能模型。
背景技术
新药的开发从用于寻找新药的候选物质的药物发现研究(发现阶段)开始,然后是使用动物或培养细胞的临床前试验(阶段0)以及人类的阶段I至III临床试验。只有通过了试验的物质才能申请获得厚生劳动省批准作为医药品制造和销售的许可。然后,即使在经过被批准作为医药品所需的审查并被投入市场之后,也提供用于监测在开发阶段和批准审查阶段期间未预测到的不良事件或效果的时间段。如上所述,一种新药投入市场需要大量的时间和金钱。另一方面,据说物质从发现阶段进入制造和销售批准的概率约为1.6%。还据说,在通过临床前试验的物质中,仅13.8%在从临床前试验通过至阶段III的临床试验期间展现出无不良事件的效果并获得批准申请。换句话说,超过80%的候选物质在阶段I至III临床试验期间退出。据说由于退出引起的损失高达每种物质1.5至2亿美元。
作为用于在新药的开发中辅助新药的候选物质的探索的方法,专利文献1公开了一种方法,该方法包括:将从源自已经给予测试物质的个体的一个或多于一个器官的细胞或组织所获得的各器官中的器官相关指标因子的测试数据与初步确定的器官相关指标因子的相应标准数据进行比较,以获得用于计算器官相关指标因子的模式的相似度的模式相似度;以及使用器官相关指标因子的模式相似度作为指标来预测测试物质在一个或多于一个器官中和/或在除该一个或多于一个器官以外的器官中的功效或副作用。
另外,作为用于预测候选物质在新药的开发中的功效或副作用的方法,专利文献2公开了一种人工智能模型,该人工智能模型用于根据与从已经给予测试物质以准备训练数据的非人类动物收集到的多个不同器官相同的多个不同器官中的转录组(transcriptome)的动态来预测测试物质对人类的一个或多于一个作用。该方法包括将指示从已经针对非人类动物中的各非人类动物分别给予对人类具有已知作用的多个现有物质的非人类动物收集到的多个不同器官中的转录组的动态的数据集以及指示各现有物质对人类的已知作用的数据作为训练数据输入到人工智能模型中,以训练人工智能模型。
引用列表
专利文献
专利文献1:WO2016/208776
专利文献2:日本特开6559850
发明内容
发明要解决的问题
本发明的一个目的是根据响应于向除人类以外的动物给予测试物质的生物标志物的动态来有效地预测该测试物质在人类中的适应症。
通过专利文献2中所公开的方法,仅可以预测关于在获取多个器官的转录组数据作为训练数据时使用的现有物质已经已知的功效。
本发明的目的是即使在测试物质具有关于在获取训练数据时使用的现有物质尚未已知的功效的情况下,也预测出该测试物质的功效。
用于解决问题的方案
本发明也可以包括以下方面作为实施例。
项1.本发明的特定实施例涉及一种用于人工智能模型的训练方法。所述训练方法包括:将第一训练数据集、第二训练数据集和第三训练数据集彼此相关联地输入到人工智能模型中,以训练所述人工智能模型;所述第一训练数据集是如下的数据集:指示从已经分别给予在人类中具有已知适应症的多个预定现有物质的相应非人类动物收集到的一个器官或多个不同器官中的各器官中的生物标志物的动态的数据集与指示所给予的预定现有物质的相应名称的标签相关联;所述第二训练数据集是如下的数据集:指示所述多个预定现有物质的相应名称的标签与指示针对所述多个预定现有物质中的各预定现有物质所报告的适应症的标签相关联;所述第三训练数据集是如下的数据集:指示针对所述多个预定现有物质中的各预定现有物质所报告的适应症的标签与关于对应于这些适应症中的各适应症而报告的不良事件的信息相关联;其中,所述人工智能模型用于预测测试物质在人类中的适应症。
项2.在根据项1的训练中,通过所述第二训练数据集使所述第一训练数据集和所述第三训练数据集相关联以生成第四训练数据集,并且将所述第四训练数据集输入到所述人工智能模型中。
项3.在根据项1或2的训练方法中,关于不良事件的所述信息包括指示所述不良事件的标签、以及所述适应症中的不良事件的有无或发生频率。
项4.在根据项1至3中任一项的训练方法中,所述生物标志物是转录组。
项5.在根据项1至4中任一项的训练方法中,所述人工智能模型是单类支持向量机即One-Class SVM。
项6.本发明的特定实施例涉及一种用于人工智能模型的训练装置。所述训练装置包括处理部,其中,所述处理部将第一训练数据集、第二训练数据集和第三训练数据集彼此相关联地输入到人工智能模型中,以训练所述人工智能模型,所述第一训练数据集是如下的数据集:指示从已经分别给予在人类中具有已知适应症的多个预定现有物质的相应非人类动物收集到的一个器官或多个不同器官中的各器官中的生物标志物的动态的数据集与指示所给予的预定现有物质的相应名称的标签相关联;所述第二训练数据集是如下的数据集:指示所述多个预定现有物质的相应名称的标签与指示针对所述多个预定现有物质中的各预定现有物质所报告的适应症的标签相关联;所述第三训练数据集是如下的数据集:指示针对所述多个预定现有物质中的各预定现有物质所报告的适应症的标签与关于对应于这些适应症中的各适应症而报告的不良事件的信息相关联;以及其中,所述人工智能模型用于预测测试物质在人类中的适应症。
项7.本发明的特定实施例涉及一种用于训练人工智能模型的程序,所述程序在由计算机执行时使所述计算机执行如下的步骤:将第一训练数据集、第二训练数据集和第三训练数据集彼此相关联地输入到人工智能模型中,以训练所述人工智能模型。在所述程序中,所述第一训练数据集是如下的数据集:指示从已经分别给予在人类中具有已知适应症的多个预定现有物质的相应非人类动物收集到的一个器官或多个不同器官中的各器官中的生物标志物的动态的数据集与指示所给予的预定现有物质的相应名称的标签相关联;所述第二训练数据集是如下的数据集:指示所述多个预定现有物质的相应名称的标签与指示针对所述多个预定现有物质中的各预定现有物质所报告的适应症的标签相关联;所述第三训练数据集是如下的数据集:指示针对所述多个预定现有物质中的各预定现有物质所报告的适应症的标签与关于对应于这些适应症中的各适应症而报告的不良事件的信息相关联;以及其中,所述人工智能模型用于预测测试物质在人类中的适应症。
项8.本发明的特定实施例涉及一种用于预测测试物质在人类中的适应症的方法。所述方法包括如下的步骤:获取第一测试数据集,所述第一测试数据集是指示从已经给予测试物质的非人类动物收集到的一个或多于一个器官中的生物标志物的动态的数据集,以及将所述第一测试数据集和第二测试数据集输入到通过根据项1至5中任一项所述的方法训练的人工智能模型中,以使用经训练的人工智能模型基于输入到其中的所述第一测试数据集和所述第二测试数据集来预测所述测试物质在人类中的适应症,所述第二测试数据集是多个已知适应症的标签与关于对应于所述多个已知适应症中的各适应症而报告的不良事件的信息相关联的数据集。
项9.在根据实施例8的预测方法中,所述测试物质不包括现有物质或现有物质的等效物质。
项10.在根据实施例8或9的预测方法中,所述测试物质是选自现有物质和现有物质的等效物质中的一种。
项11.本发明的特定实施例涉及一种用于预测测试物质在人类中的适应症的预测装置。所述预测装置包括处理部,其中,所述处理部将第一测试数据集和第二测试数据集输入到通过根据项1至5中任一项所述的方法训练的人工智能模型中,以使用经训练的人工智能模型基于输入到其中的所述第一测试数据集和所述第二测试数据集来预测所述测试物质在人类中的适应症,所述第一测试数据集是指示与从为了生成第一训练数据集而已经给予所述测试物质的非人类动物收集到的一个或多于一个器官相对应的一个或多于一个器官中的生物标志物的动态的数据集,所述第二测试数据集是多个已知适应症的标签与为了生成第三训练数据集而获取的关于与所述多个已知适应症中的各适应症相对应地报告的不良事件的信息相关联的数据集。
项12.本发明的特定实施例涉及一种用于预测测试物质在人类中的适应症的计算机程序,所述计算机程序在由计算机执行时使所述计算机执行如下的步骤:将第一测试数据集和第二测试数据集输入到通过根据项1至5中任一项所述的方法训练的人工智能模型中,以使用经训练的人工智能模型基于输入到其中的所述第一测试数据集和所述第二测试数据集来预测所述测试物质在人类中的适应症,所述第一测试数据集是指示与从为了生成第一训练数据集而已经给予所述测试物质的非人类动物收集到的一个或多于一个器官相对应的一个或多于一个器官中的生物标志物的动态的数据集,所述第二测试数据集是多个已知适应症的标签与关于与所述多个已知适应症中的各适应症相对应地报告的不良事件的信息相关联的数据集。
项13.本发明的特定实施例涉及一种用于预测测试物质在人类中的适应症的预测系统。所述系统包括服务器装置,用于发送第一测试数据集,所述第一测试数据集是指示从已经给予所述测试物质的非人类动物收集到的一个或多于一个器官中的生物标志物的动态的数据集,以及预测装置,用于预测所述测试物质对人类的作用,所述预测装置经由网络连接到所述服务器装置。所述服务器装置包括用于发送所述第一测试数据集的通信部,所述预测装置包括处理部和通信部,其中,所述处理部经由所述预测装置的通信部来获取经由所述服务器装置的通信部发送的所述第一测试数据集,以及将所获取的第一测试数据集和第二测试数据集输入到通过根据项1至5中任一项所述的方法训练的人工智能模型中,以使用经训练的人工智能模型基于输入到其中的所述第一测试数据集和所述第二测试数据集来预测所述测试物质在人类中的适应症,所述第一测试数据集是指示与从为了生成第一训练数据集而已经给予所述测试物质的非人类动物收集到的一个或多于一个器官相对应的一个或多于一个器官中的生物标志物的动态的数据集,所述第二测试数据集是如下的数据集:多个已知适应症的标签与为了生成第三训练数据集而获取的关于对应于所述多个已知适应症中的各适应症而报告的不良事件的信息相关联。
项14.本发明的特定实施例涉及一种用于使用第一训练数据集、第二训练数据集和第三训练数据集来训练人工智能模型的方法,所述人工智能模型用于预测测试物质在人类中的适应症,所述第一训练数据集是如下的数据集:指示从已分别给予在人类中具有已知适应症的多个预定现有物质的相应非人类动物收集到的一个器官或多个不同器官中的各器官中的生物标志物的动态的数据集与指示为了获取指示所述生物标志物的动态的数据集而给予的现有物质的名称的标签相关联,所述第二训练数据集是如下的数据集:指示所述多个预定现有物质的相应名称的标签与指示针对所述多个预定现有物质中的各预定现有物质所报告的适应症的标签相关联,所述第三训练数据集是如下的数据集:指示所述适应症的标签与关于对应于所述适应症中的各适应症所报告的不良事件的信息相关联。
项15.本实施例涉及一种用于使用第一测试数据集和第二测试数据集作为用于预测测试物质在人类中的适应症的测试数据的方法。在所述方法中,所述第一测试数据集是指示与从为了生成第一训练数据集而已给予所述测试物质的非人类动物收集到的一个或多于一个器官相对应的一个或多于一个器官中的生物标志物的动态的数据集,以及所述第二测试数据集是多个已知适应症的标签与关于与所述多个已知适应症中的各适应症相对应地报告的不良事件的信息相关联的数据集。
发明的效果
即使在测试物质关于在获取训练数据时使用的现有物质具有尚未已知的功效的情况下,也可以预测该测试物质的功效。
附图说明
图1示出本发明的概要。
图2示出专利文献2(现有技术)中所描述的发明的概要。
图3示出训练数据的示例。图3的(A)示出第一训练数据的示例。图3的(B)示出第二训练数据的示例。图3的(C)示出第三训练数据的示例。图3的(D)示出第四训练数据的示例。
图4的(A)示出训练系统的硬件结构。图4的(B)示出预测系统的硬件结构。
图5示出训练装置的硬件结构。
图6是示出训练程序的处理的流程的流程图。
图7示出预测装置的硬件结构。
图8是示出预测程序的处理的流程的流程图。
图9示出服务器装置的硬件结构。
图10是示出预测系统中的处理的流程的流程图。
图11示出来自在不使用测试药物的转录组数据的情况下训练的人工智能的预测结果。
图12示出来自使用测试药物的转录组数据进行训练的人工智能的预测结果。
图13示出阿仑膦酸钠(alendronate)的一些决策函数值。
具体实施方式
1.训练方法和预测方法的概要以及术语的说明
首先,概述了如本发明的某些实施例的用于训练人工智能的方法以及预测方法。另外,说明了传统方法与本发明中所包括的训练方法和预测方法之间的差异。
该预测方法预测测试物质在人类中的适应症。优选地,预测方法基于与已经给予对人类具有已知作用的现有物质的非人类动物中的生物标志物的动态、已知适应症以及与该已知适应症相对应地报告的不良事件有关的信息,来预测测试物质在人类中的适应症。使用人工智能模型进行预测。
(1)训练阶段
如图1所示,用于预测的人工智能模型优选地通过包括彼此相关联的三种类型的训练数据集(即,第一训练数据集、第二训练数据集和第三训练数据集)的数据集来训练。
如图1所示,第一训练数据集是如下的数据集,在该数据集中,将指示在向非人类动物分别给予了在人类中具有已知适应症的多个预定现有物质之后从相应的非人类动物收集到的一个器官或者多个不同器官中的各器官中的生物标志物的动态的数据集与指示所给予的预定现有物质的相应名称的标签相关联。如图1所示,生成第一训练数据集。例如,向诸如小鼠等的非人类动物分别给予作为预定现有物质的药物A、B和C,并且从非人类动物分别收集器官或作为器官的一部分的组织。接着,分析收集到的器官或组织中的生物标志物的动态,并根据[指示相应器官名和生物标志物的动态的数据]以及[所给予的药物的相应名称]生成第一训练数据集。图3(A)示出第一训练数据集的更具体示例。在图3(A)所示的第一训练数据集的示例中,最左边的列被称为“第一列”。在图3(A)所示的第一列中,作为示例示出药物名“阿立哌唑(Aripiprazole)”和药物名“EMPA”。在第二列和后续列中,示出各器官中的RNA的表达水平。“心脏(Heart)”和“皮肤(Skin)”是器官名的标签,并且“Alas2”和“Apod”是表达被分析的基因名的标签。在第二列和后续列以及第二行和后续行中,指示相应基因的表达水平的值已作为元素输入。在第一训练数据集中,[指示器官名的标签和指示基因名的标签]以及[指示相应基因的表达水平的值]与指示药物名的标签相对应。
如图1所示,第二训练数据集是如下的数据集,在该数据集中,将指示为了获得第一训练数据集而给予的多个预定现有物质的相应名称的标签(图3的(A)的第一列)与指示针对该多个预定现有物质中的各预定现有物质所报告的适应症的标签相关联。图3(B)示出第二训练数据集的具体示例。在图3(B)所示的第二训练数据集的示例中,最左边的列被称为“第一列”。在图3(B)所示的第一列中,作为示例示出药物名“阿立哌唑”和药物名“EMPA”。第二列和后续列示出针对第一列中列出的各药物所报告的适应症。这里,“神经损伤”被示出为指示药物名“阿立哌唑”的适应症的名称标签,并且“2型糖尿病”被示出为指示药物名“EMPA”的适应症的名称标签。
如图1所示,第三训练数据是如下的数据集,在该数据集中,将指示如图3(B)所示的针对为了获得第一训练数据集而给予的多个预定现有物质中的各预定现有物质所报告的适应症的标签与关于对应于这些适应症中的各适应症所报告的不良事件的信息相关联。这里,关于不良事件的信息可以包括指示不良事件的名称的标签以及不良事件的有无或发生频率。图3(C)示出第三训练数据集的更具体示例。在图3(C)所示的第三训练数据集的示例中,最左边的列被称为“第一列”。在图3(C)的第一列中示出“神经损伤”,它是图3(B)的“适应症1”中所示的药物名“阿立哌唑”的适应症。另外,作为图3(B)的“适应症1”中所示的药物名“EMPA”的适应症,“2型糖尿病”示出在图3(C)的第一列中。图3(C)的第二列和后续列的最上列示出指示不良事件的名称的标签,并且这里示出“睡眠障碍”和“血糖下降”。图3(C)的第二列的第二行和后续行中的数值示出相应不良事件的发生频率。
在本实施例的训练方法中,输入到人工智能中的是第四训练数据集,该第四训练数据集是通过第二训练数据集将第一训练数据集与第三训练数据集相关联而生成的。
图3(D)示出第四训练数据集的示例。在图3(D)所示的第四训练数据集的示例中,最左边的列被称为“第一列”。在第一列和第二列中,示出指示图3(C)中所示的不良事件的名称的标签以及相应不良事件的发生频率。另外,在第四列和后续列中,示出图3(A)中所示的指示器官名的标签和基因名的标签以及基因的表达水平。换句话说,图3(D)示出包括图3(C)的第二列和后续列中的不良事件的发生频率的数据集,其中不良事件的发生频率代替图3(A)中示出药物名的第一列中的标签。
(2)预测阶段
如上述第1.(1)节中所述地训练的人工智能模型用于预测测试物质在人类中的适应症。输入到经训练的人工智能模型中以预测适应症的测试数据集是第一测试数据集和第二测试数据集。第一测试数据集与第二测试数据集一起输入到经训练的人工智能模型中。
第一测试数据集是指示从已经给予测试物质的非人类动物收集到的一个或多于一个器官中的生物标志物的动态的数据集。另外,多个器官与为了生成第一训练数据集而收集到的器官相对应。优选地,第一测试数据是[指示器官名的标签和指示基因名的标签]与[指示相应基因的表达水平的值]相关联的数据,该数据是通过向非人类动物给予一个测试物质并分析从中收集到的一个或多于一个器官中的转录组而获得的。
第二测试数据集是多个已知适应症的标签与为了生成第三训练数据集而获取的、关于与多个已知适应症中的各适应症相对应地报告的不良事件的信息相关联的数据集。这里,多个已知适应症不仅可以包括用作第二训练数据的适应症,还可以包括登记在外部数据库中的已知适应症。在已知适应症中,术语“多个”可以意指例如100、500、1000或2000或更多。
这里,在预测方法中,测试物质不必一定是现有物质或现有物质的等效物质。在测试物质不是现有物质或现有物质的等效物质的情况下,预测方法用作用于预测新物质的适应症的方法。
另外,在预测方法中,可以包括现有物质或现有物质的等效物质作为测试物质。在这种情况下,预测方法用作用于探索现有物质或现有物质的等效物质的新适应症的药物重新定位方法。在使用本说明书中所描述的预测方法作为药物重新定位方法的情况下,优选将测试物质包括在为了获取第一训练数据集而给予的现有物质中。以这种方式,可以提高预测精度。
(3)与传统方法的比较
图2中所示的传统方法是专利文献2中所描述的方法,其中该方法例如向诸如小鼠等的非人类动物分别给予作为现有物质的药物A、B和C,并且从相应的非人类动物收集器官或作为器官的一部分的组织。接着,分析所收集到的器官或组织中的生物标志物的动态以生成第一训练数据集。另外,根据现有物质的例如不良事件、适应症、药物动力学和适应症等的人类临床数据库生成第二训练数据。然后,通过使用第一训练数据集和第二训练数据进行训练来生成图2所示的人工智能模型。换句话说,在传统方法中,通过将生物标志物的动态与现有物质的不良事件、适应症、药物动力学或者和适应症中的每一个相关联来构建人工智能模型。另外,在传统方法中使用的测试数据是如下的数据,该数据指示与从为了生成第一训练数据集而已经给予测试物质的非人类动物收集到的一个器官或多个器官相对应的一个器官或多个不同器官中的生物标志物的动态。
本实施例与传统方法的不同之处在于,作为训练数据,不仅使用生物标志物的动态,而且还使用代替适应症名的与不良事件有关的信息。另外,作为测试数据,也不仅使用生物标志物的动态,而且还使用与多个已知适应症和不良事件有关的信息。
因此,即使在测试物质具有关于获取训练数据时使用的现有物质尚未已知的适应症的情况下,也可以预测测试物质的适应症。
(4)术语的说明
在本发明中,非人类动物不受限制。示例包括诸如小鼠、大鼠、狗、猫、兔、牛、马、山羊、绵羊和猪等的哺乳动物以及诸如鸡等的鸟类。优选地,非人类动物是诸如小鼠、大鼠、狗、猫、牛、马和猪等的哺乳动物,更优选地是小鼠或大鼠等,并且更优选地是小鼠。非人类动物还包括这些动物的胎儿和雏等。
在本发明中,术语“物质”可以包括例如化合物;核酸;糖类;脂类;糖蛋白;糖脂;脂蛋白;氨基酸;多肽;蛋白质;多酚类;趋化因子(chemokines);选自包含上述物质的最终代谢物、中间代谢物和合成原料物质的组的至少一种代谢物质;金属离子;或微生物。另外,物质可以是单质,或者可以是多种物质的混合物。优选地,术语“物质”包括例如医药品、准医药品、药用化妆品、食品、特定保健用食品、具有功能声称食品及其候选。另外,术语“物质”还可以包括在医药批准的临床前试验或临床试验期间中止或中断测试的物质。
“现有物质”不受限制,只要它是现有物质即可。优选地,它是一种对人类具有已知作用的物质。另外,术语“现有物质的等效物质”可以包括与现有物质在结构上类似并具有类似作用的物质。这里,术语“类似作用”意指具有与现有物质相同的作用,但是作用的强度可以是相同的或不同的。
“不良事件”不受限制,只要它是被判断为对人类有害的作用即可。优选示例包括诸如FAERS(https://www.fda.gov/Drugs/GuidanceComplianceRegulatoryInformation/Surveillance/AdverseDrugEffects/ucm082193.htm)或clinicaltrials.gov(https://clinicaltrials.gov/)等的外部数据库中所列出的不良事件。
“适应症”不受限制,只要它是应被减轻、治疗、停止进行或预防的人类的疾患或症状即可。疾患或症状的示例包括诸如上述FAERS、DAILYMED的所有药物标签(https://dailymed.nlm.nih.gov/dailymed/spl-resources-all-drug-labels.cfm)、医学主题词表(Medical Subject Headings)(https://www.nlm.nih.gov/mesh/meshhome.html)、Drugs@FDA(https://www.accessdata.fda.gov/scripts/cder/daf/)或国际疾病分类(https://www.who.int/health-topics/international-classification-of-diseases)等的外部数据库中所列出的疾患或症状。更具体地,适应症的示例包括诸如血栓症、栓塞症和狭窄症(stenosis)等的缺血性疾病(特别是心脏、脑、肺、大肠等);诸如动脉瘤、静脉瘤、充血和出血等的循环障碍(主动脉、静脉、肺、肝脏、脾脏、视网膜等);诸如过敏性支气管炎和肾小球肾炎等的过敏性疾病;诸如阿尔茨海默型痴呆症等的痴呆症;诸如帕金森病、肌萎缩性侧索硬化症和重症肌无力症等的变性疾患(神经、骨骼肌等);肿瘤(良性上皮性肿瘤、良性上皮性肿瘤、恶性上皮性肿瘤、恶性非上皮性肿瘤);代谢性疾病(糖类代谢异常、脂类代谢异常、电解质失衡);传染病(细菌、病毒、立克次体(rickettsia)、衣原体、真菌、原虫、寄生虫等);以及诸如肾脏疾病、系统性红斑和多发性硬化等的与自身免疫性疾病等相关联的症状或疾病。
不良事件的发生率可通过以下方法获得。通过例如从数据库(诸如如上所述的clinicaltrials.gov、FAERS、或DAILYMED的所有药物标签等)中进行文本提取来提取指示不良事件的名称的单词。所提取的一个单词可以算作报告的一个不良事件。对于一种现有物质,可以根据下式获得发生率:发生率=(针对一个不良事件所报告的案例数)/(针对现有物质所报告的不良事件的总案例数)。在数据库中以文本形式登记了与作用相关的说明的情况下,可以在提取与作用相对应的文本之前通过自然语言处理对登记的文本进行语法分析、单词分割或语义分析等。
“器官”不受限制,只要它是存在于如上所述的哺乳动物或鸟类的身体中的器官即可。例如,在哺乳动物的情况下,器官是选自如下项中的至少一种:循环系统器官(心脏、动脉、静脉、淋巴管等)、呼吸系统器官(鼻腔、副鼻腔、喉头、气管、支气管、肺等)、消化系统器官(唇、颊部、腭、齿、牙龈、舌、唾液腺、咽、食道、胃、十二指肠、空肠、回肠、盲肠、阑尾、上行结肠、横结肠、S状结肠、直肠、肛门、肝脏、胆囊、胆管、胆道、胰腺、胰管等)、泌尿系统器官(尿道、膀胱、输尿管、肾脏)、神经系统器官(大脑、小脑、中脑、脑干、脊髓、末梢神经、自主神经等)、女性生殖系统器官(卵巢、输卵管、子宫、阴道等)、乳房、男性生殖系统器官(阴茎、前列腺、睾丸、附睾(epididymis)、输精管)、内分泌系统器官(下丘脑、脑下垂体、松果体、甲状腺、副甲状腺、肾上腺等)、外皮系统器官(皮肤、毛发、指甲等)、造血系统器官(血液、骨髓、脾脏等)、免疫系统器官(淋巴结、扁桃体、胸腺等)、骨和软组织器官(骨、软骨、骨骼肌、结缔组织、韧带、腱、隔膜、腹膜、胸膜、脂肪组织(棕色脂肪、白色脂肪)等和感觉系统器官(眼球、眼睑、泪腺、外耳、中耳、内耳、耳蜗等)。优选地,“器官”可以是选自如下项中的至少一种:骨髓、胰腺、头盖骨、肝脏、皮肤、脑、脑下垂体、肾上腺、甲状腺、脾脏、胸腺、心脏、肺、主动脉、骨骼肌、睾丸、附睾脂肪、眼球、回肠、胃、空肠、大肠、肾脏和腮腺。优选地,所有骨髓、胰腺、头盖骨、肝脏、皮肤、脑、脑下垂体、肾上腺、甲状腺、脾脏、胸腺、心脏、肺、主动脉、骨骼肌、睾丸、附睾脂肪、眼球、回肠、胃、空肠、大肠、肾脏和腮腺在根据本发明的预测中使用。术语“多个器官”不受限制,只要器官的数量是两个或多于两个即可。例如,多个器官可以选自2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24种类型的器官。
术语“器官由来(organ-derived)”意指例如从器官收集,或从所收集到的器官的细胞、组织或体液培养。
术语“体液”包括例如血清、血浆、尿、脊髓液、腹水、胸腔积液、唾液、胃液、胰液、胆汁、乳汁、淋巴液和细胞间质液。
术语“生物标志物”是指可根据物质的给予、在各器官的细胞或组织中和/或在体液中变化的生物物质。可用作“生物标志物”的生物物质的示例是选自以下项中的至少一种:核酸;糖类;脂类;糖蛋白;糖脂;脂蛋白;氨基酸、多肽;蛋白质;多酚类;趋化因子;选自包含上述物质的最终代谢物、中间代谢物和合成原料物质的组的至少一种代谢物质;以及金属离子等。更优选的是核酸。生物标志物优选是根据物质的给予在各器官的细胞或组织中和/或在体液中变化的生物物质的组。生物物质组的示例可以是选自以下项中的至少一种的组:核酸;糖类;脂类;糖蛋白;糖脂;脂蛋白;氨基酸、多肽;蛋白质;多酚类;趋化因子;选自包含上述物质的最终代谢物、中间代谢物和合成原料物质的组的至少一种代谢物质;以及金属离子等。
术语“核酸”优选是指包含在转录组中的RNA的组,诸如mRNA、非编码RNA和microRNA,更优选是指mRNA的组。RNA优选是可在上述器官的细胞或组织中或在体液中的细胞中表达的mRNA、非编码RNA和/或microRNA,更优选是可通过RNA-Seq等检测到的mRNA、非编码RNA和/或microRNA(https://www.ncbi.nlm.nih.gov/gene?LinkName=genome_gene&from_uid=52、http://jp.support.illumina.com/sequencing/sequencing_software/igenome.html)。优选地,可通过RNA-Seq分析的所有RNA用于根据本发明的预测。
术语“指示生物标志物的动态的数据集”意指指示生物标志物已经或尚未响应于现有物质的给予而变化的数据集。优选地,生物标志物的动态指示生物标志物已经响应于现有物质的给予而变化。例如,可以通过以下方法获取数据。针对从已经给予现有物质的非人类动物收集到的某些器官由来的组织、细胞或体液,测量各生物标志物的丰度或浓度,以获取已经给予现有物质的个体的各器官的测量值。另外,从尚未给予现有物质的非人类动物,针对与获取已经给予现有物质的个体的测量值的器官相对应的器官由来的组织、细胞或体液,以相同的方式测量各生物标志物的丰度或浓度,以获取非给予个体的测量值。将已经给予现有物质的个体的各器官由来的各生物标志物的测量值同非给予个体中与已经给予现有物质的个体中的生物标志物相对应的各器官的生物标志物的测量值进行比较,以获取指示其间的差的值作为数据。这里,术语“与…相对应”是指器官和生物标志物相同或是相同类型。优选地,所述差可以表示为从已经给予现有物质的个体由来的相应生物标志物的测量值与非给予个体中与上述生物标志物相对应的生物标志物的测量值的比(诸如商等)。例如,数据包括通过将从已经给予现有物质的个体由来的器官A中的生物标志物A的测量值除以从非给予个体由来的器官A中的生物标志物A的测量值而获得的商。
在生物标志物是转录组的情况下,可以使用可通过RNA-Seq分析的所有RNA。可替代地,可以分析RNA的表达,并使用例如WGCNA(https://labs.genetics.ucla.edu/horvath/CoexpressionNetwork/Rpackages/WGCN A/)将RNA分割为指示与器官名和基因名相关联的各RNA的动态的数据子集(模块)。对于通过WGCNA分割的各模块,可以针对各现有物质计算与1-of-K表示的皮尔逊相关系数,以选择针对各现有物质具有最高相关系数绝对值的模块,并且可以使用包括在所选择的模块中的各器官中的RNA作为生物标志物。
此外,在响应于现有物质的给予的生物标志物是转录组的情况下,可以使用DESeq2分析来获得与尚未给予现有物质的动物的各器官中的转录组相比已经给予现有物质的动物的各器官中的转录组的变化。例如,通过htseq-count对从已经给予现有物质的动物收集到的各器官中的RNA的表达水平以及从尚未给予现有物质的动物收集到的各相应器官中的基因的表达水平进行量化,以获得相应的计数数据。然后,比较相应器官和相应器官中的相应基因的表达水平。作为比较的结果,对于各器官中的各基因,输出已经给予现有物质的动物中的基因表达的变化的log2(倍数(fold))值和用作各变化的概率的指标的p值。基于log2(倍数)值,可以判断是否存在诸如转录组等的生物标志物的动态。
生物标志物的测量值可以通过已知方法获取。在生物标志物是核酸的情况下,可以通过诸如RNA-Seq等的测序或定量PCR等来获取测量值。在生物标志物是糖类、脂类、糖脂、氨基酸、多酚类;趋化因子;或选自包含上述物质的最终代谢物、中间代谢物和合成原料物质的组的至少一种代谢物质等的情况下,可以通过例如质谱分析来获取测量值。在生物标志物是糖蛋白、脂蛋白、多肽或蛋白质等的情况下,可以通过例如ELISA(酶联免疫吸附测定(Enzyme-Linked Immuno Sorbent Assay))方法来获取测量值。用于收集从用于测量的器官由来的组织、细胞或体液的方法以及用于测量生物标志物的预处理方法也是已知的。
“测试物质”是要评价其作用的物质。测试物质可以是现有物质、现有物质的等效物、或新物质。在预测方法中,即使在尚未发现测试物质的作用与现有物质或现有物质的等效物质的作用之间的关系的情况下,也可以预测测试物质对人类的作用。另一方面,在测试物质是选自现有物质或现有物质的等效物中的一种的情况下,可以发现现有物质或现有物质的等效物的未知作用。未知作用可以是一种作用或多种作用。未知作用优选是新适应症。通过预测测试物质在人类中的新适应症,也可以实现药物重新定位。已知向非人类动物给予测试物质。另外,可以以与指示从已经给予现有物质的非人类动物收集到的一个或多于一个器官中的生物标志物的动态的数据相同的方式,获取指示从已经给予测试物质的非人类动物收集到的一个或多于一个器官中的生物标志物的动态的数据。
2.人工智能模型的构建
2-1.训练数据的生成
(1)第一训练数据集的生成
第一训练数据集由指示一个器官或多个不同器官中的各器官中的生物标志物的动态的数据集、以及指示现有物质的名称的标签构成。一个器官或多个不同器官可以从已经分别给予对人类具有已知作用的多个现有物质的相应非人类动物收集。第一训练数据集可以存储在图5中示出为数据库TR1的训练装置10的辅存储部104中。
指示一个器官或多个不同器官中的各器官中的生物标志物的动态的数据集可以通过上述第1.(4)节中所描述的方法获取。
指示相应器官中的生物标志物的动态的各数据项可以与关于所给予的现有物质的名称的信息、关于所收集到的器官的名称的信息、以及关于生物标志物的名称的信息等相关联。“关于名称的信息”可以是名称本身或缩写名称等的标签,或者可以是与相应名称相对应的标签值。
指示生物标志物的动态的数据集中所包括的各数据项用作构成后述的人工智能模型的第一训练数据集中的矩阵的元素。在生物标志物是转录组的情况下,各RNA的表达水平与指示生物标志物的动态的数据集中所包括的数据相对应,并且用作构成第一训练数据集的矩阵的元素。例如,在生物标志物是转录组的情况下,可以使用通过DESeq2分析所获得的各现有物质的log2(倍数)值作为第一训练数据集的各元素。
第一训练数据集的示例如上述第1.(1)节和图3(A)中所示。
作为指示生物标志物的动态的数据集,生物标志物的测量值可以直接用作第一训练数据集的元素,或者可以在用作第一训练数据集的元素之前经过标准化或降维等。标准化方法的示例例如是对指示表达差的数据进行变换,使得平均值为0且方差为1。标准化中的平均值可以是各器官中的平均值、各基因中的平均值或所有数据的平均值。另外,可以通过诸如主成分分析等的统计处理来实现降维。进行统计处理情况下的母群体可以针对各器官、各基因或所有数据来设置。例如,在生物标志物是转录组的情况下,仅有具有相对于通过DESeq2分析所获得的各现有物质的log2(倍数)值不大于预定值的p值的基因才可以用作第一训练数据集的元素。例如,预定值可以是10-3或10-4。优选为10-4。
第一训练数据集中所包括的指示所给予的预定现有物质的相应名称的标签可以是物质本身的名称或者可以被编码。
可以响应于现有物质的更新或指示新生物标志物的动态的数据的添加,更新第一训练数据集。
(2)第二训练数据集的生成
如上述第1.(1)节和图3(B)中所示,通过将指示为了生成第一训练数据集而向非人类动物给予的多个预定现有物质的相应名称的标签与指示针对多个预定现有物质中的各预定现有物质所报告的适应症的标签相关联,来生成第二训练数据集。对于现有物质的适应症,通过针对各现有物质对指示例如现有物质的名称的单词进行搜索,可以从外部数据库(诸如上述第1.(4)节中所述的FAERS、DAILYMED的所有药物标签、医学主题词表、Drugs@FDA或国际疾病分类等)获取与现有物质相对应的适应症的名称的标签。每个现有物质可能存在一种适应症或两种或多于两种适应症。在每个现有物质存在两种或多于两种适应症的情况下,两种或多于两种适应症构成第二训练数据集。可以通过对存储在数据库中的数据集进行文本提取、自然语言处理、数字化处理或图像分析处理等来获取指示针对多个预定现有物质中的各预定现有物质所报告的适应症的标签。例如,在将外部数据库中所存储的、指示与为了生成第一训练数据集而向非人类动物给予的相应现有物质相对应的相应适应症的名称的标签作为文本中的插入进行登记的情况下,可以在提取与作用相对应的文本之前通过自然语言处理对所登记的文本进行语法分析、单词分割或语义分析等。
(3)第三训练数据集的生成
如上述第1.(1)节和图3(C)中所述,第三训练数据是如下的数据集,在该数据集中,指示如图3(B)所示的针对为获取第一训练数据集而给予的多个预定现有物质中的各预定现有物质所报告的适应症的标签与关于对应于这些适应症中的各适应症所报告的不良事件的信息相关联。对于针对多个预定现有物质中的各预定现有物质所报告的适应症,通过针对各现有物质对例如现有物质的名称的单词进行搜索,可以从外部数据库(诸如FAERS、DAILYMED的所有药物标签、医学主题词表、Drugs@FDA或国际疾病分类等)获取与现有物质相对应的适应症的名称的标签。通过对指示适应症名的标签进行搜索,可以从外部数据库(诸如FAERS或clinicaltrials.gov等)获取指示与这些适应症中的各适应症相对应地报告的不良事件的标签。另外,在将指示适应症或不良事件的名称的标签作为文本中的插入进行登记的情况下,可以在提取与作用相对应的文本之前通过自然语言处理对所登记的文本进行语法分析、单词分割或语义分析等。
不良事件的发生频率可以通过上述第1.(4)节中所描述的方法计算。
(4)第四训练数据集的生成
如上述第1.(1)节和图3(D)中所述,通过将针对与指示为了获取第一训练数据而给予的现有物质的名称的标签相对应的适应症所报告的不良事件的发生频率(图3(C)所示的第二列和后续列中的不良事件的发生频率)代入到指示第一训练数据集中所包括的药物名的标签的部分(指示药物名的图3(A)的第一列)中,来生成第四训练数据集。
2-2.训练数据向人工智能模型的输入
人工智能模型不受限制,只要能够解决与本发明相关联的问题即可。在本实施例中,优选使用可以进行关联预测(Link Prediction)的人工智能模型。这种人工智能模型的示例包括One-Class SVM(单类支持向量机)。
使用利用One-Class SVM进行关联预测的情况作为示例来说明输入第四训练数据的示例。要输入到One-Class SVM中的数据作为第四训练数据集被输入到One-Class SVM中,该第四训练数据集是通过利用下式的核函数将第一训练数据集与第三训练数据集相关联而获得的:
k(gAd1,gBd2)=<gA,gB><d1,d2>
这里,<·,·>表示对各向量进行缩放使得12范数等于1、并且取这两个经缩放向量之间的内积的运算符。
作为One-class SVM,例如可以使用来自Python的“scikit-learn”包,其中参数nu=0.1。
2-3.用于训练人工智能模型的系统
图4(A)示出训练系统50的硬件结构。训练系统50包括测量部30和训练装置10,其中测量部30是用于获取生物标志物的测量数据的下一代测序器等。训练装置10可以通过无线或有线网络可通信地连接到测量部30,或者可以经由诸如CD-R等的存储介质获取测量部30所获取的数据。
(1)用于训练人工智能模型的装置
例如,可以使用训练装置10(以下也可以称为“装置10”)来执行人工智能模型的训练。
在装置10及装置10中的处理的说明中,对于与上述第1.节和第2-1.节中描述的术语共通的术语,这里并入上述说明。
装置10至少包括处理部101和存储部。存储部由主存储部102和/或辅存储部104构成。
图5示出装置10的硬件结构。装置10可以连接到输入部111、输出部112和存储介质113。装置10还可以连接到测量部30,其中测量部30是下一代测序器或质谱仪等。另外,装置10可以可通信地连接到外部数据库60,诸如FAERS、DAILYMED的所有药物标签、医学主题词表、Drugs@FDA、国际疾病分类或clinicaltrials.gov等。
在装置10中,处理部101、主存储部102、ROM(只读存储器)103、辅存储部104、通信接口(I/F)105、输入接口(I/F)106、输出接口(I/F)107和媒介接口(I/F)108通过总线109连接以进行互相数据通信。
处理部101由CPU或MPU等构成。处理部101中的处理可以由GPU辅助。处理部101执行辅存储部104或ROM 103中所存储的计算机程序,并处理所获取的数据,由此装置10起作用。处理部101获取如上述第1.节中所述的指示从已经给予现有物质的非人类动物收集到的多个不同器官中的生物标志物的动态的数据集、以及该现有物质对人类的已知作用作为训练数据。另外,处理部101使用这两种类型的训练数据来训练人工智能模型。
ROM 103由掩模ROM、PROM、EPROM或EEPROM等构成,并存储由处理部101执行的计算机程序以及由其使用的数据。ROM 103存储当装置10启动时由处理部101执行的引导程序以及与装置10的硬件的操作相关的程序和设置等。
主存储部102由诸如SRAM或DRAM等的RAM(随机存取存储器)构成。主存储部102用于读出存储在ROM 103和辅存储部104中的计算机程序。当处理部101执行这些计算机程序时,主存储部102也用作工作空间。主存储部102暂时存储经由网络获取的训练数据等以及由辅存储部104读出的人工智能模型的功能等。
辅存储部104由硬盘、诸如闪速存储器等的半导体存储元件、或光盘等构成。在辅存储部104中,存储处理部101所要执行的各种计算机程序以及用于执行计算机程序的各种设置数据。具体地,辅存储部104以非易失性方式存储操作软件(OS)1041、训练程序TP、人工智能模型数据库AI1、用于存储第一训练数据集的数据库TR1、用于存储第二训练数据集的数据库TR2、用于存储第三训练数据集的数据库TR3。训练程序TP与操作软件(OS)1041协作进行如后所述的用于训练人工智能的处理。
通信I/F 105由诸如USB、IEEE1394或RS-232C等的串行接口、诸如SCSI、IDE或IEEE1284等的并行接口、以及由D/A转换器或A/D转换器等构成的模拟接口、以及网络接口控制器(NIC)等构成。通信I/F 105用作通信部105,并且在处理部101的控制下从测量部30或其他外部装置接收数据,并且在必要时将存储在装置10中或由装置10生成的信息发送到测量部30或外部,或者显示该信息。通信I/F 105可以经由网络与测量部30或其他外部装置(未示出,例如其他计算机或云系统)通信。
输入I/F 106由诸如USB、IEEE1394或RS-232C等的串行接口、诸如SCSI、IDE或IEEE1284等的并行接口、以及由D/A转换器或A/D转换器等构成的模拟接口等构成。输入I/F106接受来自输入部111的字符输入、点击或声音输入等。所接受的输入存储在主存储部102或辅存储部104中。
输入部111由触摸面板、键盘、鼠标、手写板或麦克风等构成,并向装置10进行字符输入或声音输入。输入部111可以在外部连接到装置10,或者可以与装置10集成。
输出I/F 107例如由与输入I/F 106相同的接口构成。输出I/F 107将处理部101所生成的信息输出到输出部112。输出I/F 107将由处理部101生成并存储在辅存储部104中的信息输出到输出部112。
输出部112例如由显示器或打印机等构成,并显示从测量部30发送的测量结果、装置10中的各种操作窗口、各项训练数据和人工智能模型等。
媒介I/F 108读出例如存储在存储介质113中的应用软件等。所读出的应用软件等存储在主存储部102或辅存储部104中。另外,媒介I/F 108将处理部101所生成的信息写入存储介质113。媒介I/F 108将由处理部101生成并存储在辅存储部104中的信息写入存储介质113。
存储介质113由软盘、CD-ROM或DVD-ROM等构成。存储介质113通过软盘驱动器、CD-ROM驱动器或DVD-ROM驱动器等连接到媒介I/F 108。用于使计算机执行操作的应用程序等可以存储在存储介质113中。
处理部101可以经由网络获取装置10的控制所需的应用软件和各种设置,而不是从ROM 103或辅存储部104中读取它们。还可以将应用程序存储在网络上的服务器计算机的辅存储部中,并且装置10访问该服务器计算机以下载计算机程序并将其存储在ROM 103或辅存储部104中。
另外,在ROM 103或辅存储部104中,例如安装了提供图形用户界面环境的操作系统,诸如由美国微软公司制造和销售的Windows(商标)。根据第二实施例的应用程序将在操作系统上操作。换句话说,装置10可以是个人计算机等。
(2)用于训练人工智能模型的处理
参考图6,说明用于通过训练程序TP来训练人工智能模型的处理的流程。
处理部101接受操作者通过输入部111输入的用于开始处理的命令,并且在步骤S1中从存储在辅存储部104中的第一训练数据集数据库TR1、第二训练数据集数据库TR2、第三训练数据集数据库TR3分别获取第一训练数据集、第二训练数据集和第三训练数据集。
接着,处理部101接受操作者通过输入部111输入的用于开始第四训练数据集的生成的命令,并且在步骤S2中生成第四训练数据集。
接着,处理部101接受操作者通过输入部111输入的用于输入第四训练数据集的命令,并且在步骤S3中将第四训练数据集输入到人工智能模型AI1中,以训练人工智能模型。
处理部101将经训练的人工智能模型存储在辅存储部104中。
从一个步骤到另一步骤的转变可以根据操作者所输入的命令来进行,或者可以通过前一步骤的完成来触发,使得处理部101可以自动进行转变。
在训练处理中,对于与上述第1.节和第2-1.节中描述的术语和说明共通的术语和说明,这里并入上述说明。
3.人工智能模型对适应症的预测
3-1.测试数据的生成
(1)第一测试数据集的生成
第一测试数据集是指示一个器官或多个不同器官中的各器官中的生物标志物的动态的数据集,并且可以从与已经获取第一训练数据的一个器官或多个不同器官相对应的一个或多于一个器官获取。指示相应器官中的生物标志物的动态的数据集可以通过如上述第1.(4)节中所述的方法以与指示用作第一训练数据的生物标志物的动态的数据集相同的方式获取。
(2)第二测试数据集的生成
如上述第1.(2)节所述,第二测试数据是多个已知适应症的标签与关于与该多个已知适应症中的各适应症相对应地报告的不良事件的信息相关联的数据集。通过对指示适应症名的标签进行搜索,可以从外部数据库(诸如FAERS或clinicaltrials.gov等)获取多个已知适应症的标签以及指示与这些适应症中的各适应症相对应地报告的不良事件的标签。另外,在将指示适应症或不良事件的名称的标签作为文本中的插入进行登记在的情况下,可以在提取与作用相对应的文本之前通过自然语言处理对所登记的文本进行语法分析、单词分割或语义分析等。
不良事件的发生频率可以通过上述第1.(4)节中所描述的方法计算。
3-2.预测系统1
图4(A)示出预测系统51的硬件结构。预测系统51包括测量部30和预测装置20,其中测量部30是用于获取生物标志物的测量数据的下一代测序器等。预测装置20可以经由无线或有线网络连接到测量部30,或者可以经由诸如CD-R等的存储介质获取测量部30所获取的数据。
(1)适应症预测装置
例如,可以使用预测装置20(以下可以简称为“装置20”)来实现适应症的预测。
在装置20及装置20中的处理的说明中,对于与上述第1.节和第2-1.节中描述的术语共通的术语,这里并入上述说明。
图7示出预测装置20(以下也可以称为“装置20”)的硬件结构。装置20至少包括处理部201和存储部。存储部由主存储部202和/或辅存储部204构成。装置20可以连接到输入部211、输出部212和存储介质213。另外,装置20可以连接到测量部30,其中测量部30是下一代测序器或质谱仪等。
在装置20中,处理部201、主存储部202、ROM(只读存储器)203、辅存储部204、通信接口(I/F)205、输入接口(I/F)206、输出接口(I/F)207和媒介接口(I/F)208通过总线209连接以进行互相数据通信。
由于装置20的基本硬件结构与装置10的基本硬件结构相同,因此这里并入上述第2-3.(1)节中的说明。通信接口205用作通信部205。
然而,在装置20的辅存储部204中,以非易失性方式存储操作软件(OS)2041、预测程序PP、经训练的人工智能模型AI2、用于存储第一测试数据集的数据库TS1和用于存储第二测试数据集的数据库TS2,来代替操作软件(OS)1041、训练程序TP、人工智能模型AI1,用于存储第一训练数据集的数据库TR1、用于存储第二训练数据集的数据库TR2和用于存储第三训练数据集的数据库TR3。预测程序PP与操作软件(OS)2041协作进行如后所述的适应症预测处理。
(2)用于预测适应症的处理
参考图8,说明用于通过预测程序PP来预测适应症的处理的流程。
处理部201接受操作者通过输入部211输入的用于开始处理的命令,并且在步骤S51中获取存储在辅存储部204中的第一测试数据集和第二测试数据集。
接着,处理部201接受操作者通过输入部211输入的用于开始预测的命令,并且在步骤S52中将第一测试数据集数据库TS1、第二测试数据集数据库TS2、第一测试数据集和第二测试数据集输入到经训练的人工智能模型AI2中,以预测测试物质的适应症。
此时,经训练的人工智能模型AI2逐一判断所关注的测试物质是否对作为第二测试数据单独输入的所有适应症有效。具体地,经训练的人工智能模型AI2在LP问题中判断所关注的药物与单个适应症之间是否存在关联。
接着,处理部201将结果存储在存储部中。如果测试物质对特定适应症有效,则处理部201根据经训练的人工智能模型AI2导出的结果是标签“1”,并且如果测试物质对特定适应症无效,则该导出的结果是标签“-1”。
换句话说,标有“1”的适应症是针对测试物质预测的适应症。
此外,在人工智能模型是One-Class SVM的情况下,计算指示预测的可靠性的决策函数值。在输出许多适应症作为预测结果的情况下,可以预测出较高值指示更有可能的适应症。另外,在输出许多适应症作为预测结果的情况下,可以以相同的方式使用指示在给予具有与作为测试物质的所关注测试物质类似的作用机理的药物之后收集到的一个或多于一个器官中的转录组的动态的数据进行预测。然后,通过对所关注的测试物质的预测结果和具有类似作用机理的其他测试物质的预测结果之间的比较而发现的这两者共通的适应症可以用作预测结果。
3-3.预测系统2
图4(B)示出预测系统400的结构。
预测系统400可通信地连接到测量部30、训练装置10、预测装置20以及用于发送指示生物标志物的动态的数据集的服务器装置40。训练装置10和预测装置20经由服务器装置40获取由测量部30获取的数据。
(1)服务器装置
关于服务器装置40(在下文中可以简称为“装置40”),对于与上文第1.节和第2-1.节中描述的术语共通的术语,这里并入上述说明。
图9示出服务器装置40(也可以称为“装置40”)的硬件结构。装置40至少包括处理部401和存储部。存储部由主存储部402和/或辅存储部404构成。装置40可以连接到输入部411、输出部412和存储介质413。另外,装置40可以通过有线或无线网络可通信地连接到测量部30,其中测量部30是下一代测序器或质谱仪等。
在装置40中,处理部401、主存储部402、ROM(只读存储器)403、辅存储部404、通信接口(I/F)405、输入接口(I/F)406、输出接口(I/F)407和媒介接口(I/F)408通过总线409连接以进行互相数据通信。
由于装置40的基本硬件结构与装置10的基本硬件结构相同,因此这里并入上述第2-3.(1)节中的说明。通信接口405用作通信部405。
然而,在装置40的辅存储部404中,以非易失性方式存储操作软件(OS)4041、用于存储第一测试数据集的数据库TS1,来代替操作软件(OS)1041、训练程序TP、人工智能模型AI1、用于存储第一训练数据集的数据库TR1、用于存储第二训练数据集的数据库TR2和用于存储第三训练数据集的数据库TR3。
(2)预测系统2的操作
参考图10,说明预测系统的操作。
这里,说明从测量部30对生物标志物的测量值的获取到预测结果的输出的顺序流程。
在步骤S81中,测量部30获取已经给予现有物质的非人类动物的各器官中的生物标志物的测量值。测量部30中的测量值的获取可以响应于操作者对用于开始测量的命令的输入而进行。在步骤S82中,测量部30将获取的测量值发送至服务器装置40。发送处理可以响应于操作者对用于开始发送的命令的输入而进行。
在步骤S83中,服务器装置40的处理部401经由通信I/F 405获取测量值。此时,通信I/F 405用作通信部。
在步骤S84中,响应于操作者通过训练装置10的输入部111输入的用于开始获取测量值的命令,训练装置10的处理部101将用于开始发送测量值的信号从通信I/F 105发送到服务器装置40。服务器装置40的处理部401经由通信I/F 405接受用于开始发送测量值的输入,并且开始从通信I/F 405发送测量值。此时,通信I/F 105和通信I/F 405分别用作通信部105和通信部405。
在步骤S85中,训练装置10的处理部101经由通信I/F 105从外部数据库60获取与向非人类动物给予的现有物质的适应症以及与该适应症相对应的不良事件有关的信息。
另外,在步骤S84中,训练装置10的处理部101经由通信I/F 105获取从服务器装置40发送的测量值(步骤S86),并将测量值存储在训练装置10的存储部中。步骤S86可以在步骤S85之前进行。
接着,在图10的步骤S87中,训练装置10的处理部101根据图6的步骤S1中所示的处理来生成第一训练数据集、第二训练数据集和第三训练数据集。这里并入图6中的步骤S1的说明。
接着,在图10的步骤S88中,训练装置10的处理部101根据图6的步骤S2中所示的处理来从第一训练数据集、第二训练数据集和第三训练数据集生成第四训练数据集。这里并入图6中的步骤S2的说明。
接着,在图10的步骤S89中,训练装置10的处理部101根据图6的步骤S3至S4中所示的处理将第四训练数据集输入到人工智能模型中,以训练该人工智能模型,并将经训练的人工智能模型存储在存储部中。这里并入图6中的步骤S3至S4的说明。
在图10的步骤S90中,在接受来自预测装置20的用于开始发送人工智能模型的命令之后,训练装置10的处理部101经由通信I/F 105向预测装置20发送经训练并存储的人工智能模型。此时,通信I/F 105用作通信部105。
接着,在步骤S91中,测量部30获取已经给予测试物质的非人类动物的各器官中的生物标志物的测量值。测量部30中的测量值的获取可以响应于操作者对用于开始测量的命令的输入而进行。在步骤S92中,测量部30将获取的测量值发送至服务器装置40。发送处理可以响应于操作者对用于开始发送的命令的输入而进行。
在步骤S93中,服务器装置40的处理部401经由通信I/F 405获取测量值。此时,通信I/F 405用作通信部405。
在步骤S94中,响应于操作者通过预测装置20的输入部211输入的用于开始获取测量值的命令,预测装置20的处理部201将用于开始发送测量值的信号从通信I/F 205发送到服务器装置40。服务器装置40的处理部401经由通信I/F 405接受用于开始发送测量值的输入,并且开始从通信I/F 405发送测量值。此时,通信I/F 205和通信I/F 405用作通信部。预测装置20的处理部201经由通信I/F 205获取测量值,并将测量值存储在预测装置20的存储部中。随后,预测装置20的处理部201生成第一测试数据集。如上述第2-4.(1)节所述地生成第一测试数据集。
接着,在步骤S95中,预测装置20的处理部201经由通信I/F 205向训练装置10发送用于开始发送人工智能模型的命令。当接受来自预测装置20的用于开始发送人工智能模型的命令时,训练装置10的处理部101经由训练装置10的通信I/F 105向预测装置20发送经训练的人工智能模型。预测装置20经由通信I/F 205获取经训练的人工智能模型。步骤S95可以在步骤S94之前进行。
接着,在步骤S96中,预测装置20的处理部201将在步骤S94中生成的第一测试数据和存储在存储部中的第二测试数据输入到在步骤S95中获取的经训练的人工智能模型AI2中,并且根据图8的步骤S52预测测试物质对人类的作用。在步骤S97中,预测装置20的处理部201输出结果。可替代地,在图10的步骤S94至S97中,预测装置20的处理部201可以预测与现有物质的新适应症相关的预测结果。
(3)用于构建预测系统的方法
用于构建预测系统的方法包括准备训练装置10和预测装置20的步骤。构建方法还可以包括准备已经给予现有物质的非人类动物的一个或多于一个器官中的生物标志物的测量值、或已经给予测试物质的非人类动物的一个或多于一个器官中的生物标志物的测量值的步骤。
4.计算机程序
4-1.训练程序
训练程序TP是使计算机执行包括上文结合人工智能模型的训练所述的图6的步骤S1至S4的处理以使该计算机用作训练装置10的计算机程序。
4-2.预测程序
预测程序PP是使计算机执行包括上文结合测试物质的作用的预测所述的步骤S51至S53的处理以使该计算机用作预测装置20的计算机程序。
5.存储有计算机程序的存储介质
本节涉及存储有上述计算机程序的存储介质。计算机程序存储在诸如硬盘、诸如闪速存储器等的半导体存储元件、或光盘等的存储介质中。另外,计算机程序可以存储在可经由诸如云服务器等的网络连接的存储介质中。计算机程序可以是可下载形式的或存储在存储介质中的程序产品。
存储介质中的程序的存储格式不受限制,只要如上所述的装置能够读取该程序即可。在存储介质中的存储优选以非易失性方式。
6.变形例
在上述第2.节中,示出训练装置10和预测装置20是不同计算机的实施例。然而,一个计算机可以进行人工智能模型的训练和预测。
在本说明书中,附至硬件的相同附图标记表示相同的部分或相同的功能。
示例
以下示出实施例以更详细地说明本发明。然而,本发明不应被解释为限于以下实施例。
以下动物实验经Karydo TherapeutiX,Inc.的伦理委员会批准而进行。
实验示例I.给予药物的小鼠中的基因表达分析
I-1.给予药物的小鼠的准备及基因表达分析
1.药物的给予
(1)阿仑膦酸钠
将阿仑膦酸钠三水合物(alendronate sodium salt trihydrate)(Wako)在PBS(NACALAI TESQUE,INC.)中的溶解以1.0mg/kg的剂量经皮下注射给11周龄雄性C57BL/6N小鼠,每三天或四天一次,持续八天。药物针对每次给予来新准备。在药物给予后的第8天下午收集各器官。
(2)对乙酰氨基酚(Acetaminophen)
10周龄雄性C57BL/6N小鼠禁食12小时,期间允许小鼠自由饮水。紧接在禁食期后,将溶解在生理盐水(Otsuka Pharmaceutical Co.,Ltd.)中的对乙酰氨基酚(Wako)以单次300mg/kg的剂量经腹腔内给予至小鼠。在给予后,允许小鼠自由正常饮食。在中午之前进行给予,并且在给予后2小时收集器官。
(3)阿立哌唑(Aripiprazole)
将阿立哌唑(Sigma-Aldrich)在0.5%(w/v)羧甲基纤维素(carboxymethylcellulose)400溶液(Wako)中的溶解以单次0.3mg/kg的剂量经腹腔内给予至11周龄雄性C57BL/6N小鼠。在下午给予药物,并且在两小时后收集器官。
(4)阿赛那平(Asenapine)
将马来酸阿赛那平(asenapine maleate)(Chemscene)在生理盐水中的溶解以单次0.3mg/kg的剂量经皮下给予至11周龄雄性C57BL/6N小鼠。在下午给予药物,并且在两小时后收集器官。
(5)顺铂(Cisplatin)
将顺铂(Bristol-Myers Squibb)以单次20mg/kg的剂量经腹腔内给予至11周龄雄性C57BL/6N小鼠。在药物给予后第三天下午收集器官。
(6)氯氮平(Clozapine)
将氯氮平(Sigma-Aldrich)以单次0.3mg/kg的剂量经皮下给予至11周龄雄性C57BL/6N小鼠。首先将氯氮平溶解在乙酸中,然后用生理盐水稀释,并用1M NaOH调节至pH6。在药物给予后两小时的下午收集器官。
(7)多西环素(Doxycycline)
9周龄雄性C57BL/6N小鼠用含5%蔗糖(NACALAI TESQUE,INC.)和2mg/mL的多西环素盐酸盐n-水合物(Wako)的RO水喂养两周。含有药物的RO水每周用新的RO水更换。在药物给予后第13天的下午收集器官。阴性对照组用含5%蔗糖(NACALAI TESQUE,INC.)的RO水喂养。
(8)恩格列净(Empagliflozin)
将溶解在0.5%羧甲基纤维素中的恩格列净(Toronto research chemical)以每日10mg/kg的剂量强制地经口给予至10周龄雄性C57BL/6N小鼠,持续两周。针对每次给予新准备药物。在药物给予开始后的第14天下午收集器官。
(9)来那度胺(Lenalidomide)
将来那度胺(Wako)溶解在含有0.5%羧甲基纤维素和0.25%Tween-80(NACALAITESQUE,INC.)的溶液中,并将该溶液以每日50mg/kg的剂量强制地经口给予至8周龄雄性C57BL/6N小鼠,持续69天。针对每次给予新准备药物。在药物给予开始后的第69天下午收集器官。将含有0.5%羧甲基纤维素和0.25%Tween-80的溶液给予至阴性对照组。
(10)鲁拉西酮(Lurasidone)
将溶解在0.5%羧甲基纤维素溶液中的盐酸鲁拉西酮(Medchemexpress)以单次0.3mg/kg的剂量强制地经口给予至11周龄雄性C57BL/6N小鼠。在药物给予后两小时的下午收集器官。
(11)奥氮平(Olanzapine)
将溶解在0.5%羧甲基纤维素溶液中的奥氮平(Tokyo Chemical Industry Co.,Ltd.)以单次0.3mg/kg的剂量强制地经口给予至11周龄雄性C57BL/6N小鼠。在药物给予后两小时的下午收集器官。
(12)依洛尤单抗(Evolocumab)(Repatha(瑞百安)(商标))
将溶解在生理盐水中的瑞百安(商标)(Astellas Pharma Inc.)以10mg/kg的剂量经皮下注射给11周龄雄性C57BL/6N小鼠,每10天一次,持续四周。在药物给予后4周的下午收集器官。
(13)利塞膦酸(Ricedronate)
将溶解在PBS中的利塞膦酸钠盐(Cayman Chemical Company)以10mg/kg的剂量强制地经口给予至11周龄雄性C57BL/6N小鼠,每隔一天一次,持续8天。针对每次给予新准备药物。在给予开始后的第8天下午收集器官。
(14)索非布韦(Sofosbuvir)
将索非布韦(LKT)以每日20mg/kg的剂量经腹腔内给予至7周龄雄性C57BL/6N小鼠,持续10天。索非布韦首先用DMSO(NACALAI TESQUE,INC.)稀释,然后在给予前用PBS稀释100倍(最终浓度为1.0%DMSO/PBS)。在给予开始后第10天的下午收集器官。
(15)特立帕肽(Teriparatide)
将溶解在生理盐水中的人甲状旁腺激素片段1-34(特立帕肽)(Sigma-Aldrich)以每日40μg/kg的剂量经皮下给予至10周龄雄性C57BL/6N小鼠。在药物给予开始后第14天的下午收集器官。向阴性对照给予生理盐水。
(16)野生型(WT)小鼠
在下午从尚未给予药物的11周龄雄性C57BL/6N小鼠收集器官。
2.小鼠和24个器官转录组分析
(1)器官
根据专利文献1中所描述的方法进行使用小鼠的实验、器官的提取和转录组分析。24个器官为肾上腺、主动脉、骨髓细胞(BM)、脑、结肠、眼、心脏、回肠、空肠、左肾、肝脏、肺、胰腺、腮腺、脑下垂体、骨骼肌、皮肤、头盖骨、脾脏、胃、左睾丸、胸腺、甲状腺和性腺的白色脂肪组织(WAT)。
所有小鼠在约25℃的温度控制室内在交替的12小时的光照和黑暗循环下饲养,并能够自由摄取水和正常饲料(CE-2,CLEA Japan,Inc.,东京,日本)。
(2)转录组分析
转录组分析使用QuantSeq 3’mRNA-Seq Library Prep Kit for Illumina(FWD)(cat#015.384,LEXOGEN)和Illumina NextSeq 500(75bp single-read,ca.400millionreads/run,NextSeq 500/550High Output Kit v2.5,cat#20024906)来进行。
使用从已经给予各药物的小鼠收集到的各器官的差异基因表达数据作为机器学习框架的各药物的特征。根据专利文献1中所描述的方法进行RNA-seq数据处理(转录产物的定位和计数)。
使用TopHat2对mm10进行小鼠基因组的定位。通过DESeq2(1.22.1)来识别药物给予组和阴性对照组(多西环素和来那度胺给予组)或WT小鼠组(已经给予除多西环素和来那度胺以外的药物的对照组)的各器官中的差异基因表达。药物给予组、阴性对照组和WT小鼠组各自分别用n=2进行分析。
3.示例
利用使用One-class SVM的关联预测(LP)来构建人工智能模型,以预测药物的适应症。
3-1.训练
(1)第一训练数据
作为各药物的特征,选择示出各器官中的表达变化P<0.0001的基因。使器官、从所有器官(24器官框架)或单个器官(单器官框架)中选择的所有基因的log2倍数值与器官名的组合、以及为了获取基因表达数据而给予的药物的名称的标签成为集合,并用作第一训练数据。
(2)第二训练数据
使上述第1.节中的给予小鼠的药物名的标签和各药物的适应症的标签成为集合,并用作第二次训练数据。与药物名相对应的适应症名与FDA不良事件报告系统(FAERS:https://open.fda.gov/data/faers/)一致。
(3)第三训练数据
从FAERS(https://www.fda.gov/Drugs/GuidanceComplianceRegulatoryInformation/Surveil lance/AdverseDrugEffects/ucm082193.htm)下载从2014Q2至2018Q1的不良事件报告数据。从报告数据中提取指示与上述第1.节中的给予小鼠的各药物的适应症名相对应的不良事件的单词。将提取的一个单词视为报告的一个不良事件,并且各不良事件的发生频率(%)分别通过下式计算:(针对一种药物的适应症名报告一个不良事件的案例数)/(针对一种药物的适应症名所报告的所有不良事件的数量)。
(4)第四训练数据
当药物名定义为例如A和B时,gA和gB分别指示在给予药物A和B时的24个器官中观察到的转录组的模式(第一训练数据集)。另外,当药物A的适应症和药物B的适应症分别由“1”和“2”表示、并且针对适应症1所报告的不良事件(AE)的元素由i、ii…N表示时,适应症1的向量被表示为d1=(d1i,d1ii,…,d1N)和d2=(d2i,d2ii,…,d2N)(第三训练数据集)。另外,由于第二训练数据集包括指示药物A的名称的标签和指示适应症1的名称的标签的集合、以及指示药物B的名称的标签和指示适应症2的名称的标签的集合,因此这些集合可以分别表示为gAd1和gBd2(第二训练数据集)。这里,在FAERS中,当具有适应症1的患者服用的药物A的记录数量超过10时,将适应症视为阳性(有适应)。
(5)One-Class SVM
作为要输入到One-Class SVM中的数据,通过利用下面的核函数将第一训练数据集与第三训练数据集相关联而获得的第四训练数据集被输入到One-Class SVM中。
k(gAd1,gBd2)=<gA,gB><d1,d2>
这里,<·,·>表示对各向量进行缩放使得12范数等于1、并且取这两个经缩放向量之间的内积的运算符。
作为One-class SVM,使用来自Python的p‘scikit-learn’包,其中参数nu=0.1。
3-2.预测
在经训练的One-class SVM中输入响应于所关注药物的给予的24个器官中的转录组的模式(第一测试数据)、以及登记在FAERS中的[指示所有适应症的名称的标签]和[与适应症相对应的不良事件的名称和不良事件的发生频率的组合(gd)],以使经训练的One-class SVM判断所关注的药物是否对所有适应症单独有效。具体地,在LP问题中,使经训练的One-class SVM判断所关注的药物与单个适应症之间是否存在关联。当所关注的药物对特定适应症有效时,SVM返回标签“1”;并且当所关注的药物对特定适应症无效时,SVM返回标签“-1”。
3-3.示例1
在示例1中,在假设上述第1.节中给予的药物之一的适应症未知的情况下进行预测。换句话说,首先使用与除上述第1.节中给予的药物之一以外的14种药物有关的数据作为训练数据来训练One-class SVM。此后,使用所排除的药物作为所关注的药物,并且将响应于给予所关注的药物的转录组的模式作为第一测试数据连同第二测试数据一起输入在经训练的One-class SVM中以预测适应症。结果在图11中示出。在图11中,TN表示真阴性,TP表示真阳性,FN表示假阴性,以及FP表示真阳性。真阴性指示“非适应症”能够被预测为“非适应症”的项目数,并且真阳性指示“是适应症”能够被预测为“是适应症”的项目数。假阴性指示“是适应症”被预测为“非适应症”的项目数,并且假阳性指示“非适应症”被预测为“是适应症”的项目数。准确率评分是指示预测的准确率的评分。召回率评分是在预测为“是适应症”的情况下的覆盖率。精确率评分指示在预测为“是适应症”的情况下的可靠性。
所有15种药物的准确率评分较高(>0.78)。这些结果指示78%以上的预测适应症或非适应症已被实际报告或尚未报告。另外,召回率评分示出阿仑膦酸钠、阿立哌唑、阿塞那平、氯氮平、恩格列净、鲁拉西酮、奥氮平、依洛尤单抗、利塞膦酸、索非布韦和特立帕肽的较高值(>0.8)。召回率评分指示,可以预测针对这些药物已报告的80%以上的适应症。多西环素的召回率评分为0.527,这指示针对该药物预测了所报告的适应症中的约50%。只有对乙酰氨基酚(APAP)示出高精确率评分(1.000),其他均示出低精确率评分(<0.35)。顺铂和来那度胺的精确率评分和F主评分无法计算,因为这两者均示为0TP和0FN。许多药物的精确率评分如此低的原因被认为主要是因为与TP相比,存在更多的FP。
这些结果指示,本发明的预测方法可用于预测没有已知适应症的新物质的适应症。
3-4.示例2
评价本发明是否可用于探索已知物质的新适应症,即所谓的药物重新定位。使用上述第1.节中列出的所有15种药物的数据来训练人工智能,以预测单个药物的适应症。结果在图12中示出。图中的符号与图11中的符号相同。
作为结果,对于所有药物,TP数增加,FN数减少。召回率评分也提高。此外,所有药物的准确率评分和召回率评分均提高,范围在0.770-1.000之间。这些结果指示,报告的适应症和未报告的适应症这两者均可以77%以上的概率捕获。由于FN的数量较大,因此所有药物的精确率评分都很低。在图12中,FP指示先前尚未报告的潜在新适应症。由于FP的数量相对大,因此当需要缩小候选时,可以通过计算FP中的各适应症的决策函数值并对各药物的各适应症进行排序来缩小候选。图13示出阿仑膦酸钠的决策函数值的示例。另外,对于已知具有类似作用机理的药物(例如,阿仑膦酸钠和利塞膦酸,或阿立哌唑和氯氮平)共通并且被预测为FP的适应症被认为很有可能作为重新定位出的适应症。
这些结果表明本发明的预测方法对于药物重新定位也是有用的。
附图标记列表
10/训练装置
20/预测装置
40/服务器装置
101/处理部
201/处理部
401/处理部
400/预测系统
105/通信部
405/通信部。
Claims (15)
1.一种用于人工智能模型的训练方法,包括:
将第一训练数据集、第二训练数据集和第三训练数据集彼此相关联地输入到人工智能模型中,以训练所述人工智能模型;
所述第一训练数据集是如下的数据集:指示从已经分别给予在人类中具有已知适应症的多个预定现有物质的相应非人类动物收集到的一个器官或多个不同器官中的各器官中的生物标志物的动态的数据集与指示所给予的预定现有物质的相应名称的标签相关联;
所述第二训练数据集是如下的数据集:指示所述多个预定现有物质的相应名称的标签与指示针对所述多个预定现有物质中的各预定现有物质所报告的适应症的标签相关联;
所述第三训练数据集是如下的数据集:指示针对所述多个预定现有物质中的各预定现有物质所报告的适应症的标签与关于对应于这些适应症中的各适应症而报告的不良事件的信息相关联;
其中,所述人工智能模型用于预测测试物质在人类中的适应症。
2.根据权利要求1所述的训练方法,其中,在所述训练中,通过所述第二训练数据集使所述第一训练数据集和所述第三训练数据集相关联以生成第四训练数据集,并且将所述第四训练数据集输入到所述人工智能模型中。
3.根据权利要求1或2所述的训练方法,其中,关于不良事件的所述信息包括指示所述不良事件的标签、以及所述适应症中的不良事件的有无或发生频率。
4.根据权利要求1至3中任一项所述的训练方法,其中,所述生物标志物是转录组。
5.根据权利要求1至4中任一项所述的训练方法,其中,所述人工智能模型是单类支持向量机即One-Class SVM。
6.一种用于训练人工智能模型的装置,包括处理部,
其中,所述处理部将第一训练数据集、第二训练数据集和第三训练数据集彼此相关联地输入到人工智能模型中,以训练所述人工智能模型,
所述第一训练数据集是如下的数据集:指示从已经分别给予在人类中具有已知适应症的多个预定现有物质的相应非人类动物收集到的一个器官或多个不同器官中的各器官中的生物标志物的动态的数据集与指示所给予的预定现有物质的相应名称的标签相关联;
所述第二训练数据集是如下的数据集:指示所述多个预定现有物质的相应名称的标签与指示针对所述多个预定现有物质中的各预定现有物质所报告的适应症的标签相关联;
所述第三训练数据集是如下的数据集:指示针对所述多个预定现有物质中的各预定现有物质所报告的适应症的标签与关于对应于这些适应症中的各适应症而报告的不良事件的信息相关联;以及
其中,所述人工智能模型用于预测测试物质在人类中的适应症。
7.一种用于训练人工智能模型的程序,所述程序在由计算机执行时使所述计算机执行如下的步骤:将第一训练数据集、第二训练数据集和第三训练数据集彼此相关联地输入到人工智能模型中,以训练所述人工智能模型,
所述第一训练数据集是如下的数据集:指示从已经分别给予在人类中具有已知适应症的多个预定现有物质的相应非人类动物收集到的一个器官或多个不同器官中的各器官中的生物标志物的动态的数据集与指示所给予的预定现有物质的相应名称的标签相关联;
所述第二训练数据集是如下的数据集:指示所述多个预定现有物质的相应名称的标签与指示针对所述多个预定现有物质中的各预定现有物质所报告的适应症的标签相关联;
所述第三训练数据集是如下的数据集:指示针对所述多个预定现有物质中的各预定现有物质所报告的适应症的标签与关于对应于这些适应症中的各适应症而报告的不良事件的信息相关联;
其中,所述人工智能模型用于预测测试物质在人类中的适应症。
8.一种用于预测测试物质在人类中的适应症的方法,包括如下的步骤:
获取第一测试数据集,所述第一测试数据集是指示从已经给予测试物质的非人类动物收集到的一个或多于一个器官中的生物标志物的动态的数据集,以及
将所述第一测试数据集和第二测试数据集输入到通过根据权利要求1至5中任一项所述的方法训练的人工智能模型中,以使用经训练的人工智能模型基于输入到其中的所述第一测试数据集和所述第二测试数据集来预测所述测试物质在人类中的适应症,所述第二测试数据集是多个已知适应症的标签与关于对应于所述多个已知适应症中的各适应症而报告的不良事件的信息相关联的数据集。
9.根据权利要求7所述的预测方法,其中,所述测试物质不包括现有物质或现有物质的等效物质。
10.根据权利要求7所述的预测方法,其中,所述测试物质是选自现有物质和现有物质的等效物质中的一种。
11.一种用于预测测试物质在人类中的适应症的预测装置,包括处理部,
其中,所述处理部将第一测试数据集和第二测试数据集输入到通过根据权利要求1至5中任一项所述的方法训练的人工智能模型中,以使用经训练的人工智能模型基于输入到其中的所述第一测试数据集和所述第二测试数据集来预测所述测试物质在人类中的适应症,
所述第一测试数据集是指示与从为了生成第一训练数据集而已经给予所述测试物质的非人类动物收集到的一个或多于一个器官相对应的一个或多于一个器官中的生物标志物的动态的数据集,
所述第二测试数据集是多个已知适应症的标签与为了生成第三训练数据集而获取的关于与所述多个已知适应症中的各适应症相对应地报告的不良事件的信息相关联的数据集。
12.一种用于预测测试物质在人类中的适应症的计算机程序,所述计算机程序在由计算机执行时使所述计算机执行如下的步骤:
将第一测试数据集和第二测试数据集输入到通过根据权利要求1至5中任一项所述的方法训练的人工智能模型中,以使用经训练的人工智能模型基于输入到其中的所述第一测试数据集和所述第二测试数据集来预测所述测试物质在人类中的适应症,
所述第一测试数据集是指示与从为了生成第一训练数据集而已经给予所述测试物质的非人类动物收集到的一个或多于一个器官相对应的一个或多于一个器官中的生物标志物的动态的数据集,
所述第二测试数据集是多个已知适应症的标签与为了生成第三训练数据集而获取的关于与所述多个已知适应症中的各适应症相对应地报告的不良事件的信息相关联的数据集。
13.一种用于预测测试物质在人类中的适应症的预测系统,包括:
服务器装置,用于发送第一测试数据集,所述第一测试数据集是指示从已经给予所述测试物质的非人类动物收集到的一个或多于一个器官中的生物标志物的动态的数据集,以及
预测装置,用于预测所述测试物质对人类的作用,所述预测装置经由网络连接到所述服务器装置,
所述服务器装置包括用于发送所述第一测试数据集的通信部,
所述预测装置包括处理部和通信部,
其中,所述处理部经由所述预测装置的通信部来获取经由所述服务器装置的通信部发送的所述第一测试数据集,以及
将所获取的第一测试数据集和第二测试数据集输入到通过根据权利要求1至5中任一项所述的方法训练的人工智能模型中,以使用经训练的人工智能模型基于输入到其中的所述第一测试数据集和所述第二测试数据集来预测所述测试物质在人类中的适应症,
所述第一测试数据集是指示从为了生成第一训练数据集而已经给予所述测试物质的非人类动物收集到的一个或多于一个器官中的生物标志物的动态的数据集,
所述第二测试数据集是如下的数据集:多个已知适应症的标签与为了生成第三训练数据集而获取的关于对应于所述多个已知适应症中的各适应症而报告的不良事件的信息相关联。
14.一种用于使用第一训练数据集、第二训练数据集和第三训练数据集来训练人工智能模型的方法,所述人工智能模型用于预测测试物质在人类中的适应症,
所述第一训练数据集是如下的数据集:指示从已分别给予在人类中具有已知适应症的多个预定现有物质的相应非人类动物收集到的一个器官或多个不同器官中的各器官中的生物标志物的动态的数据集与指示为了获取指示所述生物标志物的动态的数据集而给予的现有物质的名称的标签相关联,
所述第二训练数据集是如下的数据集:指示所述多个预定现有物质的相应名称的标签与指示针对所述多个预定现有物质中的各预定现有物质所报告的适应症的标签相关联,
所述第三训练数据集是如下的数据集:指示所述适应症的标签与关于对应于所述适应症中的各适应症所报告的不良事件的信息相关联。
15.一种用于使用第一测试数据集和第二测试数据集作为用于预测测试物质在人类中的适应症的测试数据的方法,
所述第一测试数据集是指示与从为了生成第一训练数据集而已给予所述测试物质的非人类动物收集到的一个或多于一个器官相对应的一个或多于一个器官中的生物标志物的动态的数据集,
所述第二测试数据集是多个已知适应症的标签与关于与所述多个已知适应症中的各适应症相对应地报告的不良事件的信息相关联的数据集。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019190332 | 2019-10-17 | ||
JP2019-190332 | 2019-10-17 | ||
PCT/JP2020/039179 WO2021075574A1 (ja) | 2019-10-17 | 2020-10-16 | 被験物質のヒトにおける適応疾患を予測するための人工知能モデル |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114556481A true CN114556481A (zh) | 2022-05-27 |
Family
ID=75538249
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080072814.XA Withdrawn CN114556481A (zh) | 2019-10-17 | 2020-10-16 | 用于预测测试物质在人类中的适应症的人工智能模型 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20240153649A1 (zh) |
EP (1) | EP4047607A4 (zh) |
JP (1) | JPWO2021075574A1 (zh) |
CN (1) | CN114556481A (zh) |
CA (1) | CA3158327A1 (zh) |
IL (1) | IL292185A (zh) |
WO (1) | WO2021075574A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6559850B1 (ja) | 2018-07-27 | 2019-08-14 | Karydo TherapeutiX株式会社 | ヒトにおける被験物質の作用を予測するための人工知能モデル |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6338538A (ja) | 1986-07-31 | 1988-02-19 | Sumitomo Metal Mining Co Ltd | ニツケル硫化物からのニツケルの回収方法 |
EP2777074A4 (en) * | 2011-11-11 | 2015-08-19 | Cold Spring Harbor Lab An Education Corp Of The State Of New York | DRUG SCREENING PROCESSES AND APPLICATIONS THEREOF |
US20150371009A1 (en) * | 2014-06-19 | 2015-12-24 | Jake Yue Chen | Drug identification models and methods of using the same to identify compounds to treat disease |
WO2016208776A1 (ja) | 2015-06-25 | 2016-12-29 | 株式会社国際電気通信基礎技術研究所 | 多器官連関システムを基盤とした予測装置、及び予測プログラム |
US10776712B2 (en) * | 2015-12-02 | 2020-09-15 | Preferred Networks, Inc. | Generative machine learning systems for drug design |
JP6559850B1 (ja) * | 2018-07-27 | 2019-08-14 | Karydo TherapeutiX株式会社 | ヒトにおける被験物質の作用を予測するための人工知能モデル |
-
2020
- 2020-10-16 IL IL292185A patent/IL292185A/en unknown
- 2020-10-16 JP JP2021552483A patent/JPWO2021075574A1/ja active Pending
- 2020-10-16 CA CA3158327A patent/CA3158327A1/en active Pending
- 2020-10-16 WO PCT/JP2020/039179 patent/WO2021075574A1/ja active Application Filing
- 2020-10-16 CN CN202080072814.XA patent/CN114556481A/zh not_active Withdrawn
- 2020-10-16 US US17/769,516 patent/US20240153649A1/en active Pending
- 2020-10-16 EP EP20877483.6A patent/EP4047607A4/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4047607A1 (en) | 2022-08-24 |
JPWO2021075574A1 (zh) | 2021-04-22 |
US20240153649A1 (en) | 2024-05-09 |
CA3158327A1 (en) | 2021-04-22 |
IL292185A (en) | 2022-06-01 |
WO2021075574A1 (ja) | 2021-04-22 |
EP4047607A4 (en) | 2022-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11676684B2 (en) | Artificial intelligence model for predicting actions of test substance in humans | |
Remedios et al. | Social behaviour shapes hypothalamic neural ensemble representations of conspecific sex | |
Alexandrov et al. | Large-scale phenome analysis defines a behavioral signature for Huntington's disease genotype in mice | |
WO2021145434A1 (ja) | 目的とする薬剤又はその等価物質の適応症の予測方法、予測装置、及び予測プログラム | |
US20160321414A1 (en) | Diagnostic Test Planning | |
US11244760B2 (en) | Prediction device based on inter-organ cross talk system | |
Sahm et al. | Increased longevity due to sexual activity in mole-rats is associated with transcriptional changes in the HPA stress axis | |
Scaia et al. | Sex differences in aggression are paralleled by differential activation of the brain social decision-making network in zebrafish | |
US20240153649A1 (en) | Artificial Intelligence Model for Predicting Indications for Test Substances in Humans | |
CN111430037A (zh) | 相似病历查找方法及系统 | |
Navarro-Moreno et al. | Becoming a mother shifts the activity of the social and motivation brain networks in mice | |
Foster | Influence of study design on developmental and reproductive toxicology study outcomes | |
Wei et al. | Functional investigation of a novel ANKRD11 frameshift variant identified in a Chinese family with KBG syndrome | |
US20230253115A1 (en) | Methods and systems for predicting in-vivo response to drug therapies | |
US20230410958A1 (en) | Method and apparatus for analyzing biomarkers | |
US20230301765A1 (en) | Prediction apparatus, prediction system and prediction method | |
Le Goallec et al. | Using deep learning to predict age from liver and pancreas magnetic resonance images allows the identification of genetic and non-genetic factors associated with abdominal aging | |
Sayour et al. | Comparison of mouse models of heart failure with reduced ejection fraction | |
WO2021157739A1 (ja) | シングルセルRNA-Seq解析のカウントデータセットの補正方法、シングルセルRNA-Seqの解析方法、細胞種の構成比率の解析方法、並びにこれらの方法を実行するための装置及びコンピュータプログラム | |
Kim | Mapping the Cellular Landscape of the Brain: A Scalable Approach to Comprehensive Microscopy Data Analysis | |
Chang et al. | High-dimensional causal mediation analysis by partial sum statistic and sample splitting strategy in imaging genetics application | |
Pradella et al. | Prognosis indicators of equine acute abdomen in south Brazil | |
Ellegood et al. | Neuroanatomy and behavior in mice with a haploinsufficiency of AT-rich interactive | |
Sultan | Machine Learning Techniques for Pharmaceutical Bioinformatics | |
Michalski | Aspects for implementation of data mining in gerontology and geriatrics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40068576 Country of ref document: HK |
|
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20220527 |
|
WW01 | Invention patent application withdrawn after publication |