CN113196053A - 信息处理装置、信息处理装置的控制方法及程序 - Google Patents
信息处理装置、信息处理装置的控制方法及程序 Download PDFInfo
- Publication number
- CN113196053A CN113196053A CN201980083701.7A CN201980083701A CN113196053A CN 113196053 A CN113196053 A CN 113196053A CN 201980083701 A CN201980083701 A CN 201980083701A CN 113196053 A CN113196053 A CN 113196053A
- Authority
- CN
- China
- Prior art keywords
- information
- spectrum
- processing apparatus
- information processing
- measured substance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 75
- 238000000034 method Methods 0.000 title claims description 72
- 239000000126 substance Substances 0.000 claims abstract description 160
- 230000003595 spectral effect Effects 0.000 claims abstract description 45
- 239000012535 impurity Substances 0.000 claims abstract description 21
- 238000001228 spectrum Methods 0.000 claims description 99
- 230000006870 function Effects 0.000 claims description 31
- 238000004458 analytical method Methods 0.000 claims description 30
- 230000014759 maintenance of location Effects 0.000 claims description 23
- 238000000862 absorption spectrum Methods 0.000 claims description 15
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 claims description 8
- JLQSXXWTCJPCBC-UHFFFAOYSA-N N-methyl-6-pyridone-3-carboxamide Chemical compound CN1C=C(C(N)=O)C=CC1=O JLQSXXWTCJPCBC-UHFFFAOYSA-N 0.000 claims description 8
- LXNHXLLTXMVWPM-UHFFFAOYSA-N pyridoxine Chemical compound CC1=NC=C(CO)C(CO)=C1O LXNHXLLTXMVWPM-UHFFFAOYSA-N 0.000 claims description 8
- 229940088594 vitamin Drugs 0.000 claims description 7
- 229930003231 vitamin Natural products 0.000 claims description 7
- 235000013343 vitamin Nutrition 0.000 claims description 7
- 239000011782 vitamin Substances 0.000 claims description 7
- GHOKWGTUZJEAQD-ZETCQYMHSA-N (D)-(+)-Pantothenic acid Chemical compound OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-ZETCQYMHSA-N 0.000 claims description 6
- KTLRWTOPTKGYQY-UHFFFAOYSA-N N-methyl-4-pyridone-3-carboxamide Chemical compound CN1C=CC(=O)C(C(N)=O)=C1 KTLRWTOPTKGYQY-UHFFFAOYSA-N 0.000 claims description 6
- 238000002441 X-ray diffraction Methods 0.000 claims description 6
- 238000004993 emission spectroscopy Methods 0.000 claims description 6
- 230000005298 paramagnetic effect Effects 0.000 claims description 6
- 238000002076 thermal analysis method Methods 0.000 claims description 6
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 claims description 5
- 239000002253 acid Substances 0.000 claims description 5
- 229940011671 vitamin b6 Drugs 0.000 claims description 5
- GHOKWGTUZJEAQD-UHFFFAOYSA-N Chick antidermatitis factor Natural products OCC(C)(C)C(O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-UHFFFAOYSA-N 0.000 claims description 4
- 150000001413 amino acids Chemical class 0.000 claims description 4
- 238000001819 mass spectrum Methods 0.000 claims description 4
- 238000000655 nuclear magnetic resonance spectrum Methods 0.000 claims description 4
- 102000004169 proteins and genes Human genes 0.000 claims description 4
- 108090000623 proteins and genes Proteins 0.000 claims description 4
- 239000011677 pyridoxine Substances 0.000 claims description 4
- 235000000346 sugar Nutrition 0.000 claims description 4
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 claims description 4
- 229960003495 thiamine Drugs 0.000 claims description 4
- LDHMAVIPBRSVRG-UHFFFAOYSA-O 1-methylnicotinamide Chemical compound C[N+]1=CC=CC(C(N)=O)=C1 LDHMAVIPBRSVRG-UHFFFAOYSA-O 0.000 claims description 3
- JOAQINSXLLMRCV-UHFFFAOYSA-N 4-{[(2-amino-4-hydroxypteridin-6-yl)methyl]amino}benzoic acid Chemical compound C1=NC2=NC(N)=NC(O)=C2N=C1CNC1=CC=C(C(O)=O)C=C1 JOAQINSXLLMRCV-UHFFFAOYSA-N 0.000 claims description 3
- 241000233866 Fungi Species 0.000 claims description 3
- 238000004566 IR spectroscopy Methods 0.000 claims description 3
- 238000005481 NMR spectroscopy Methods 0.000 claims description 3
- 238000001069 Raman spectroscopy Methods 0.000 claims description 3
- 238000001237 Raman spectrum Methods 0.000 claims description 3
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 claims description 3
- 241000700605 Viruses Species 0.000 claims description 3
- 238000002056 X-ray absorption spectroscopy Methods 0.000 claims description 3
- 238000010521 absorption reaction Methods 0.000 claims description 3
- 238000004847 absorption spectroscopy Methods 0.000 claims description 3
- 235000010323 ascorbic acid Nutrition 0.000 claims description 3
- 229960005070 ascorbic acid Drugs 0.000 claims description 3
- 239000011668 ascorbic acid Substances 0.000 claims description 3
- 238000001479 atomic absorption spectroscopy Methods 0.000 claims description 3
- 238000005251 capillar electrophoresis Methods 0.000 claims description 3
- 238000004587 chromatography analysis Methods 0.000 claims description 3
- 235000014113 dietary fatty acids Nutrition 0.000 claims description 3
- 238000000804 electron spin resonance spectroscopy Methods 0.000 claims description 3
- 238000001362 electron spin resonance spectrum Methods 0.000 claims description 3
- 238000000295 emission spectrum Methods 0.000 claims description 3
- 239000000598 endocrine disruptor Substances 0.000 claims description 3
- 231100000049 endocrine disruptor Toxicity 0.000 claims description 3
- 229930195729 fatty acid Natural products 0.000 claims description 3
- 239000000194 fatty acid Substances 0.000 claims description 3
- 150000004665 fatty acids Chemical class 0.000 claims description 3
- 238000001506 fluorescence spectroscopy Methods 0.000 claims description 3
- 238000002189 fluorescence spectrum Methods 0.000 claims description 3
- 238000004949 mass spectrometry Methods 0.000 claims description 3
- 150000007524 organic acids Chemical class 0.000 claims description 3
- 229940055726 pantothenic acid Drugs 0.000 claims description 3
- 235000019161 pantothenic acid Nutrition 0.000 claims description 3
- 239000011713 pantothenic acid Substances 0.000 claims description 3
- 239000000575 pesticide Substances 0.000 claims description 3
- 238000001420 photoelectron spectroscopy Methods 0.000 claims description 3
- 238000002186 photoelectron spectrum Methods 0.000 claims description 3
- 235000008160 pyridoxine Nutrition 0.000 claims description 3
- 235000019157 thiamine Nutrition 0.000 claims description 3
- 239000011721 thiamine Substances 0.000 claims description 3
- 238000004846 x-ray emission Methods 0.000 claims description 3
- 238000004876 x-ray fluorescence Methods 0.000 claims description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims 4
- RMRCNWBMXRMIRW-BYFNXCQMSA-M cyanocobalamin Chemical compound N#C[Co+]N([C@]1([H])[C@H](CC(N)=O)[C@]\2(CCC(=O)NC[C@H](C)OP(O)(=O)OC3[C@H]([C@H](O[C@@H]3CO)N3C4=CC(C)=C(C)C=C4N=C3)O)C)C/2=C(C)\C([C@H](C/2(C)C)CCC(N)=O)=N\C\2=C\C([C@H]([C@@]/2(CC(N)=O)C)CCC(N)=O)=N\C\2=C(C)/C2=N[C@]1(C)[C@@](C)(CC(N)=O)[C@@H]2CCC(N)=O RMRCNWBMXRMIRW-BYFNXCQMSA-M 0.000 claims 4
- 150000003722 vitamin derivatives Chemical class 0.000 claims 4
- AUNGANRZJHBGPY-UHFFFAOYSA-N D-Lyxoflavin Natural products OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-UHFFFAOYSA-N 0.000 claims 2
- 229960002685 biotin Drugs 0.000 claims 2
- 235000020958 biotin Nutrition 0.000 claims 2
- 239000011616 biotin Substances 0.000 claims 2
- 229960002104 cyanocobalamin Drugs 0.000 claims 2
- 235000000639 cyanocobalamin Nutrition 0.000 claims 2
- 239000011666 cyanocobalamin Substances 0.000 claims 2
- 229960002477 riboflavin Drugs 0.000 claims 2
- 235000019192 riboflavin Nutrition 0.000 claims 2
- 239000002151 riboflavin Substances 0.000 claims 2
- 238000000504 luminescence detection Methods 0.000 claims 1
- 239000000523 sample Substances 0.000 description 78
- 238000010586 diagram Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 14
- 238000010801 machine learning Methods 0.000 description 13
- 238000003860 storage Methods 0.000 description 12
- 238000013528 artificial neural network Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 8
- 238000000926 separation method Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 7
- 238000004088 simulation Methods 0.000 description 7
- 230000004913 activation Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 238000004811 liquid chromatography Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000000717 retained effect Effects 0.000 description 4
- 238000010183 spectrum analysis Methods 0.000 description 4
- 210000002700 urine Anatomy 0.000 description 4
- 239000012472 biological sample Substances 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 235000016709 nutrition Nutrition 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- PVNIIMVLHYAWGP-UHFFFAOYSA-N Niacin Chemical compound OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 description 2
- 229940024606 amino acid Drugs 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 238000009614 chemical analysis method Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 238000004940 physical analysis method Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- YBJHBAHKTGYVGT-OOZYFLPDSA-N 5-[(3as,4r,6ar)-2-oxohexahydro-1h-thieno[3,4-d]imidazol-4-yl]pentanoic acid Chemical compound N1C(=O)N[C@@H]2[C@@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-OOZYFLPDSA-N 0.000 description 1
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- ZZZCUOFIHGPKAK-UHFFFAOYSA-N D-erythro-ascorbic acid Natural products OCC1OC(=O)C(O)=C1O ZZZCUOFIHGPKAK-UHFFFAOYSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 229930003451 Vitamin B1 Natural products 0.000 description 1
- 229930003537 Vitamin B3 Natural products 0.000 description 1
- 229930003571 Vitamin B5 Natural products 0.000 description 1
- 229930003761 Vitamin B9 Natural products 0.000 description 1
- 229930003268 Vitamin C Natural products 0.000 description 1
- 235000001014 amino acid Nutrition 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- FAPWYRCQGJNNSJ-UBKPKTQASA-L calcium D-pantothenic acid Chemical compound [Ca+2].OCC(C)(C)[C@@H](O)C(=O)NCCC([O-])=O.OCC(C)(C)[C@@H](O)C(=O)NCCC([O-])=O FAPWYRCQGJNNSJ-UBKPKTQASA-L 0.000 description 1
- 229960002079 calcium pantothenate Drugs 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- FDJOLVPMNUYSCM-WZHZPDAFSA-L cobalt(3+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2r)-1-[3-[(1r,2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12,17-tris(3-amino-3-oxopropyl)-3,5,8,8,13,15,18,19-octamethyl-2 Chemical compound [Co+3].N#[C-].N([C@@H]([C@]1(C)[N-]\C([C@H]([C@@]1(CC(N)=O)C)CCC(N)=O)=C(\C)/C1=N/C([C@H]([C@@]1(CC(N)=O)C)CCC(N)=O)=C\C1=N\C([C@H](C1(C)C)CCC(N)=O)=C/1C)[C@@H]2CC(N)=O)=C\1[C@]2(C)CCC(=O)NC[C@@H](C)OP([O-])(=O)O[C@H]1[C@@H](O)[C@@H](N2C3=CC(C)=C(C)C=C3N=C2)O[C@@H]1CO FDJOLVPMNUYSCM-WZHZPDAFSA-L 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003891 environmental analysis Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 1
- 238000004186 food analysis Methods 0.000 description 1
- 238000004817 gas chromatography Methods 0.000 description 1
- 229940093915 gynecological organic acid Drugs 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 229960002885 histidine Drugs 0.000 description 1
- 238000002329 infrared spectrum Methods 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960003136 leucine Drugs 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 229960003646 lysine Drugs 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229960004452 methionine Drugs 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229960003512 nicotinic acid Drugs 0.000 description 1
- DFPAKSUCGFBDDF-UHFFFAOYSA-N nicotinic acid amide Natural products NC(=O)C1=CC=CN=C1 DFPAKSUCGFBDDF-UHFFFAOYSA-N 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 239000000447 pesticide residue Substances 0.000 description 1
- 229960005190 phenylalanine Drugs 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- RADKZDMFGJYCBB-UHFFFAOYSA-N pyridoxal hydrochloride Natural products CC1=NC=C(CO)C(C=O)=C1O RADKZDMFGJYCBB-UHFFFAOYSA-N 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- IFGCUJZIWBUILZ-UHFFFAOYSA-N sodium 2-[[2-[[hydroxy-(3,4,5-trihydroxy-6-methyloxan-2-yl)oxyphosphoryl]amino]-4-methylpentanoyl]amino]-3-(1H-indol-3-yl)propanoic acid Chemical compound [Na+].C=1NC2=CC=CC=C2C=1CC(C(O)=O)NC(=O)C(CC(C)C)NP(O)(=O)OC1OC(C)C(O)C(O)C1O IFGCUJZIWBUILZ-UHFFFAOYSA-N 0.000 description 1
- 229960002898 threonine Drugs 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 238000002371 ultraviolet--visible spectrum Methods 0.000 description 1
- 229960004295 valine Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 235000010374 vitamin B1 Nutrition 0.000 description 1
- 239000011691 vitamin B1 Substances 0.000 description 1
- 235000019160 vitamin B3 Nutrition 0.000 description 1
- 239000011708 vitamin B3 Substances 0.000 description 1
- 235000009492 vitamin B5 Nutrition 0.000 description 1
- 239000011675 vitamin B5 Substances 0.000 description 1
- 235000019158 vitamin B6 Nutrition 0.000 description 1
- 239000011726 vitamin B6 Substances 0.000 description 1
- 150000003697 vitamin B6 derivatives Chemical class 0.000 description 1
- 235000019159 vitamin B9 Nutrition 0.000 description 1
- 239000011727 vitamin B9 Substances 0.000 description 1
- 235000019154 vitamin C Nutrition 0.000 description 1
- 239000011718 vitamin C Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/33—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using ultraviolet light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3577—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/64—Fluorescence; Phosphorescence
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N23/00—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
- G01N23/02—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by transmitting the radiation through the material
- G01N23/06—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by transmitting the radiation through the material and measuring the absorption
- G01N23/083—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by transmitting the radiation through the material and measuring the absorption the radiation being X-rays
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N23/00—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
- G01N23/20—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by using diffraction of the radiation by the materials, e.g. for investigating crystal structure; by using scattering of the radiation by the materials, e.g. for investigating non-crystalline materials; by using reflection of the radiation by the materials
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N23/00—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
- G01N23/22—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by measuring secondary emission from the material
- G01N23/223—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by measuring secondary emission from the material by irradiating the sample with X-rays or gamma-rays and by measuring X-ray fluorescence
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/62—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
- G01N27/622—Ion mobility spectrometry
- G01N27/623—Ion mobility spectrometry combined with mass spectrometry
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
- G01N2201/129—Using chemometrical methods
- G01N2201/1296—Using chemometrical methods using neural networks
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8624—Detection of slopes or peaks; baseline correction
- G01N30/8631—Peaks
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8693—Models, e.g. prediction of retention times, method development and validation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Electrochemistry (AREA)
- Toxicology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
信息处理装置辅助用户关于使用学习模型估计的与被测物质有关的定量信息的判断。信息处理装置包括信息获取部和可靠性获取部。信息获取部通过将包含被测物质和杂质的样品的频谱信息输入到学习模型中来获取与被测物质有关的定量信息。可靠性获取部获取与所获取的与被测物质有关的定量信息相关的可靠性。
Description
技术领域
本发明涉及信息处理装置、信息处理装置的控制方法及其程序。
背景技术
频谱分析被广泛用作获知各种样品中包含的特定成分(以下称为“被测物质”)的浓度或量的方法。频谱分析使得能够检测当对样品给予某种刺激时生成的响应,使得能够基于获得的信号来获得关于构成样品的成分的信息(频谱信息)。频谱信息是各自具有温度、质量和特定质量的计数碎片的数量,以及包括光的电磁波的强度,这些特征表征了刺激和响应。频谱分析还包括使用电子碰撞作为刺激来记录通过分解生成的碎片的质量的量并获得诸如结构的信息。
对于频谱分析,存在如下方法:通过在预先使用成分之间的三维尺寸、电荷、亲水性或疏水性等的差异尝试分离之后,利用电磁波进行辐射,来进行分析。该方法称为分离分析。例如,在液相色谱法(以下称为HPLC)中,通过优化分析条件(诸如柱种类、流动相种类、温度、流速等),来从其他物质(以下称为杂质)中分离被测物质。然后,通过测量分离的被测物质的频谱能够获知浓度和量。另外,在难以从杂质中分离被测物质的情况下,可以预先进行去除一部分杂质的预处理,或者可以考虑优化分离条件。除非通过预处理或优化分离条件就能够实现与杂质的分离,否则将尝试通过算术处理进行的峰分割。
作为传统的峰分割方法,存在设置基线的方法、通过使用峰之间的最小值进行垂直分割的方法、以及通过使用专利文献1和专利文献2中描述的最小二乘法来拟合和分割诸如高斯函数的适当函数的方法。
在这方面,HPLC通常用于分析生物样品。然而,由于在生物样品(诸如尿液和血液)中具有很多杂质,并且存在包含源自摄入物的未知杂质的情况,因此,需要操作人员熟悉考虑从杂质中分离被测物质的分离条件、预处理和峰分割方法等。
另外,存在许多如下情况:诸如在食品中的农药残留的分析和环境分析中,样品包含大量的杂质。因此,强烈需要如下方法:使得即使是初学者也能够简单而准确地分析杂质样品中的被测物质,而无需预处理。
引用列表
专利文献
专利文献1:日本特开平6-324029号公报
专利文献2:日本特开2006-177980号公报
专利文献3:日本特开2018-152000号公报
发明内容
技术问题
如上所述,传统上,为了从频谱信息中获取诸如被测物质的浓度和量的定量信息,需要用于分离杂质的预处理和诸如峰分割方法的算术处理。因此,可以想到的是,用户使用基于包括被测物质的样品的频谱信息的学习模型来计算定量信息。用户基于经验等确定计算结果是否准确,如果计算结果不确定,则用户改变分析条件或预处理,并再次从分析开始重复计算流程。因此,即使计算结果不准确,也可以照原样采用计算值,或者相反,可能进行不必要的重新分析。
本发明的目的是辅助用户确定通过使用学习模型估计的被测物质的定量信息。
要注意的是,本发明的目的不限于上述目的,并且本说明书的公开内容的其他目的之一是:实现从稍后在实施例的描述中所描述的构造得到的、且无法通过传统技术实现的功能/效果。
解决问题的技术方案
根据本发明的信息处理装置包括以下部件。具体地,信息处理装置包括:信息获取部,其用于获取通过将包含被测物质和杂质的样品的频谱信息输入到学习模型中而估计的所述被测物质的定量信息;以及可靠性获取部,其用于获取所获取的被测物质的定量信息的可靠性。
本发明的有利效果
本发明使得能够辅助用户确定通过使用学习模型估计的被测物质的定量信息。
附图说明
[图1]是示出根据第一实施例的包括信息处理装置的信息处理系统的整体构造的示例的图。
[图2]是示出第一实施例中的与学习模型的生成有关的处理过程的流程图的示例的图。
[图3]是示出第一实施例中的用于获取可靠性的处理过程的流程图的示例的图。
[图4A]是示出第一实施例中的样品的频谱信息的示例的图。
[图4B]是示出第一实施例中的样品的频谱信息的示例的图。
[图5]是示出第一实施例中的Δ值与相关系数之间的对应关系的示例的图。
[图6]是示出第一实施例中的用于显示被测物质的定量信息和可靠性的画面的示例的图。
[图7]是示出根据第二实施例的包括信息处理装置的信息处理系统的整体构造的示例的图。
[图8]是用于描述第二实施例中的分类学习模型的图。
[图9A]是示出示例1的仿真结果的图。
[图9B]是示出示例2的仿真结果的图。
[图9C]是示出示例3的仿真结果的图。
具体实施方式
下文中将参照附图描述用于执行本发明(实施例)的形式。然而,本发明的范围不限于下述实施例。
[第一实施例]
在描述第一实施例之前,首先描述术语。
(样品)
本实施例中的样品是包含多种类型化合物的混合物。在本实施例中,假设样品包含被测物质和其他物质(杂质)。对样品没有特别限制,只要样品是混合物即可。另外,不需要识别混合物的成分,并且可以包含未知成分。例如,可以是诸如血液、尿液或唾液的生物混合物,或者可以是食物或饮料。对生物样品的分析包括有关样品供体的营养或健康状况的线索,因此该分析具有医学和营养价值。例如,尿中的维生素B3与糖、脂质和蛋白质的代谢以及能量产生相关,因此测量其尿中的代谢物(N1-甲基-2-吡啶酮-5-甲酰胺)对于维持身体健康的营养指导很有用。
(被测物质)
本实施例中的被测物质是样品中包含的一种或多种已知组分。例如,被测物质是从由蛋白质、DNA、病毒、真菌、水溶性维生素、脂溶性维生素、有机酸、脂肪酸、氨基酸、糖、农药和内分泌干扰物组成的组中选择的至少一种。
例如,如果需要获知营养物的量,则被测物质是硫胺素(维生素B1)、核黄素(维生素B2)、作为维生素B3的代谢物的N1-甲基烟酰胺、N1-甲基-2-吡啶酮-5-甲酰胺、作为维生素B6的代谢物的4-吡哆醇酸等。此外,还有水溶性维生素,诸如N1-甲基-4-吡啶酮-3-甲酰胺、泛酸(维生素B5)、吡哆醇(维生素B6)、生物素(维生素B7)、蝶酸单麸氨酸(维生素B9)、氰钴胺(维生素B12)和抗坏血酸(维生素C)。此外,存在氨基酸,诸如L-色氨酸、赖氨酸、蛋氨酸、苯丙氨酸、苏氨酸、缬氨酸、亮氨酸、异亮氨酸和L-组氨酸。此外,被测物质可以是矿物质,诸如钠、钾、钙、镁和磷。
(定量信息)
本实施例中的定量信息是从由样品中包含的被测物质的量、样品中包含的被测物质的浓度、以及样品中被测物质的有无组成的组中选择的至少一种。另外,定量信息是从由样品中包含的被测物质的浓度或量与被测物质的基准量的比率、以及样品中包含的被测物质的量或浓度的比率组成的组中选择的至少一种。
(频谱信息)
本实施例中的频谱信息是从由色谱、光电子频谱、红外吸收频谱(IR频谱)、核磁共振频谱(NMR频谱)、荧光频谱、X-射线荧光频谱、紫外/可见吸收频谱(UV/Vis频谱)、拉曼频谱、原子吸收频谱、火焰发射频谱、发射分光频谱、X射线吸收频谱、X射线衍射频谱、顺磁共振吸收频谱、电子自旋共振频谱、质谱和热分析频谱组成的组中选择的至少一种。
随后,将参照图1描述本实施例中的信息处理系统。图1是示出根据第一实施例的包括信息处理装置的信息处理系统的整体构造的图。
本实施例中的信息处理系统包括信息处理装置10、数据库22和分析器23。信息处理装置10和数据库22彼此连接,以能够经由通信部彼此通信。在本实施例中,通信部由局域网(LAN)21组成。另外,信息处理装置10和分析器23经由诸如通用串行总线(USB)的标准通信部连接。LAN可以是有线LAN、无线LAN或WAN。此外,USB可以是LAN。
数据库22管理通过分析器23的分析而获取的频谱信息。另外,数据库22管理由稍后描述的学习模型生成部分42生成的学习模型(预训练模型)。信息处理装置10经由LAN 21获取由数据库22管理的频谱信息和学习模型。
本实施例中的学习模型是回归学习模型,并且能够将通过诸如深度学习等机器学习生成的模型用作学习模型。这里,将通过使用教师数据训练并构造为能够做出适当的预测的机器学习算法称为学习模型。有多种类型的机器学习算法用于学习模型。例如,能够使用利用神经网络的深度学习。神经网络由输入层、输出层和多个隐藏层组成,其中各个层通过称为激活函数的计算公式相互连接。当使用具有标签(与输入对应的输出)的教师数据时,确定激活函数的系数,使得建立输入与输出之间的关系。利用多个教师数据来确定系数使得能够生成学习模型,该学习模型能够高精度地预测针对输入的输出。
分析器23是用于分析样品、被测物质等的设备。分析器23对应于分析部的示例。如上所述,在本实施例中,信息处理装置10和分析器23可通信地彼此连接。然而,分析器23可以配设在信息处理装置10内部,或者信息处理装置10可以配设在分析器23内部。此外,分析结果(频谱信息)可以经由诸如非易失性存储器的记录介质从分析器23传递到信息处理装置10。
本实施例中的分析器23不受限制,只要其能够获取频谱信息即可,并且能够将使用化学分析方法或物理分析方法的设备用于分析器23。在本实施例中,使用化学分析方法的设备使用从例如由诸如液相色谱法或气相色谱法的色谱法和毛细管电泳法组成的组中选择的至少一种方法。在本实施例中,使用物理分析方法的设备使用从例如由光电子频谱法、红外吸收频谱法、核磁共振频谱法、荧光频谱法、X射线荧光频谱法、可见/紫外吸收频谱法、拉曼频谱法、原子吸收频谱法、火焰发射频谱法、发射频谱法、X射线吸收频谱法、X射线衍射法、使用顺磁共振吸收等的电子自旋共振频谱法、质谱法和热分析方法组成的组中选择的至少一种方法。
例如,使用液相色谱法的设备配备有流动相容器、液体进给泵、样品注入单元、柱、检测器和A/D转换器。作为检测器,使用利用紫外线、可见光、红外线等的电磁波检测器、电化学检测器、离子检测器等。在这种情况下,所得频谱信息是检测器随时间的输出的强度。
信息处理装置10包括通信IF 31、ROM 32、RAM 33、存储部分34、操作部分35、显示部分36和控制部分37,作为其功能部件。
通信IF(接口)31例如由LAN卡和USB接口卡实现。通信IF 31经由LAN 21和USB控制外部设备(例如,数据库22和分析器23)与信息处理装置10之间的通信。ROM(只读存储器)32由非易失性存储器等实现,并存储各种程序等。RAM(随机存取存储器)33由易失性存储器等实现,并临时存储各种信息。存储部分34例如由HDD(硬盘驱动器)等实现,并存储各种信息。操作部分35例如由键盘、鼠标等来实现,并且来自用户的指令被输入到装置中。显示部分36例如由显示器等实现,并向用户显示各种信息。操作部分35和显示部分36在控制部分37的控制下提供作为GUI(图形用户界面)的功能。
控制部分37例如由至少一个CPU(中央处理单元)实现,并且整体地控制信息处理装置10中的处理。控制部分37包括频谱信息获取部分41、学习模型生成部分42、学习模型获取部分43、估计部分44、信息获取部分45、可靠性获取部分46和显示控制部分47,作为其功能部件。
频谱信息获取部分41从分析器23获取至少包括被测物质和杂质的样品的分析结果,具体为样品的频谱信息。另外,可以从预先存储分析结果的数据库22获取样品的频谱信息。此外,以相同的方式获取被测物质的频谱信息。被测物质的频谱信息是在存在单一被测物质的情况下获得的频谱信息。然后,频谱信息获取部分41将所获取的样品的频谱信息输出至估计部分44和可靠性获取部分46。此外,所获取的被测物质的频谱信息被输出至学习模型生成部分42和可靠性获取部分46。
学习模型生成部分42通过使用由频谱信息获取部分41获取的被测物质的频谱信息来生成教师数据。然后,学习模型生成部分42通过使用教师数据进行深度学习并生成学习模型。稍后将详细描述教师数据的生成和学习模型的生成。然后,学习模型生成部分42将所生成的学习模型输出至学习模型获取部分43。另外,学习模型生成部分42可以将所生成的学习模型输出至数据库22。
学习模型获取部分43获取由学习模型生成部分42生成的学习模型。如果学习模型存储在数据库22中,则学习模型获取部分43从数据库22获取学习模型。然后,学习模型获取部分43将获取的学习模型输出到估计部分44。
估计部分44通过将由频谱信息获取部分41获取的样品的频谱信息输入到由学习模型获取部获取的学习模型中,来使学习模型估计样品中包含的被测物质的定量信息。然后,估计部分44将估计的定量信息输出到信息获取部分45。估计部分44对应于用于通过将样品的频谱信息输入到学习模型中来估计被测物质的定量信息的估计部的示例。
信息获取部分45获取由学习模型估计的定量信息。换句话说,信息获取部分45对应于信息获取部的示例,该信息获取部用于获取通过将包含被测物质和杂质的样品的频谱信息输入到学习模型中而估计的被测物质的定量信息。然后,信息获取部分45将获取的定量信息输出到显示控制部分47。
可靠性获取部分46获取由信息获取部分45获取的被测物质的定量信息的可靠性。换句话说,可靠性获取部分46对应于可靠性获取部的示例,该可靠性获取部用于获取所获取的被测物质的定量信息的可靠性。本实施例中的可靠性是指示由学习模型估计的被测物质的定量信息能够被信赖的程度的指标。将在后面详细描述可靠性的获取。然后,可靠性获取部分46将获取的可靠性输出到显示控制部分47。
显示控制部分47使显示部分36显示由信息获取部分45获取的定量信息和由可靠性获取部分46获取的可靠性。显示控制部分47对应于显示控制部的示例。
控制部分37的各个单元中的至少一些可以被实现为独立的设备。另外,一些单元中的各个可以被实现为实现各功能的软件。在这种情况下,实现功能的软件可以经由云或任何其他网络在服务器上运行。在本实施例中,假设各单元由本地环境中的软件实现。
图1所示的信息处理系统的构造仅是示例。例如,信息处理装置10的存储部分34可以包括数据库22的功能,并且存储部分34可以保留各种信息。
随后,将参照图2至图6描述本实施例中的处理过程。
图2是与学习模型的生成有关的处理过程的流程图。
(S201)(分析单独被测物质)
在步骤S201中,分析器23分析单独被测物质并获取被测物质的频谱信息。可以从灵敏度和分析时间的观点适当地选择分析条件。此时,分析器23通过以多种方式改变被测物质的浓度来分析被测物质。需要多少种类型的被测物质取决于物质的性质等。然而,一般而言,期望将被测物质的类型改变三次或更多次。在存在多种类型的被测物质的情况下,期望针对各类型的被测物质来分析被测物质。然而,如果被测物质的信号彼此充分分离,则可以同时分析被测物质。然后,分析器23将获取的频谱信息输出到信息处理装置10。信息处理装置10从分析器23接收频谱信息,并将频谱信息保留在RAM 33或存储部分34中。频谱信息获取部分41获取如此保留的频谱信息。如上所述,可以将作为分析结果的频谱信息保留在数据库22中。在这种情况下,频谱信息获取部分41从数据库22获取频谱信息。另外,分析器23对被测物质进行分析的定时可以是任何定时,只要在步骤S202中生成教师数据之前进行分析即可。
(S202)(生成教师数据)
在步骤S202中,学习模型生成部分42通过使用由频谱信息获取部分41获取的被测物质的频谱信息来生成多个教师数据。将具体描述生成教师数据的方法。通过将由随机数生成的任意波形添加到被测物质的频谱信息中来生成教师数据。例如,在液相色谱法中,由频谱信息(色谱)指示的波形通常具有高斯分布。因此,学习模型生成部分42将其峰高、中值和标准偏差由随机数确定的多个高斯曲线(高斯函数)相加,以生成多个随机噪声。
不需要在整个保留时间内(从样品的注入起,检测器检测到化合物所花费的时间)准备频谱信息。仅需要准备被测物质的峰在中心的修剪数据。修剪范围越宽,由稍后描述的计算部分进行的定量的精度越高,但是增大精度所需的教师数据的数量增加。修剪范围优选为被测物质峰的标准偏差(σ)的6倍或更大至30倍或更小,更优选为10倍或更大至20倍或更小,甚至更优选为14倍或更大至18倍或更小。
随后,将任意波形添加到修剪数据。要添加的波形的数量优选为可能导致峰在色谱上不分离并且彼此交叠的数量,但是通常优选为两个或更大至八个或更小。如果要添加的波形的数量超过八个,则难以预测被测物质的峰的形状,并且定量精度可能降低。如果要添加的波形的数量少于两个,则可能无法对具有交叠峰的色谱进行准确的定量。要添加的波形的数量更优选为三个或更大至六个或更小,并且甚至更优选为四个或更大至五个或更小。假设任意波形的形状具有由下面的等式1表示的高斯函数。
[数学式1]
其中a由相对于被测物质的预期峰高的0到α%范围内的随机数确定,b由相对于修剪范围的最大β%范围内的随机数确定。例如,在相对于被测物质的峰的中心修剪±8σ的范围的情况下,b是在-8σ×β%至+8σ×β%的范围内的任意值。α和β的值优选为50或更大至300或更小,更优选为50或更大至250或更小,并且进一步优选为50或更大至200或更小。值c由如下范围内的随机数确定,该范围优选为被测物质峰的标准偏差的0.1倍或更大至10倍或更小,更优选0.2倍或更大至8倍或更小,并且进一步优选0.5倍或更大至5倍或更小。
学习模型生成部分42生成通过将多个随机噪声中的各个添加到由被测物质的频谱信息指示的波形而生成的多个波形。以这种方式生成的多个波形被用作包含被测物质和杂质的虚拟样品的频谱信息(学习频谱信息)。换句话说,将多个生成的频谱信息确定为构成教师数据的输入数据。此外,学习模型生成部分42将根据作为生成的频谱信息的基础的被测物质的频谱信息识别出的峰高(定量信息),确定为构成教师数据的正确答案数据。以这种方式,学习模型生成部分42生成作为一对输入数据和正确答案数据的多个教师数据。另外,由于学习模型生成部分42在步骤S201中根据被测物质的浓度获取频谱信息,因此针对各浓度生成多个教师数据。应该注意的是,色谱波形的峰宽随着保留时间的增加而趋于增大,因此学习模型生成部分42可以加宽生成的波形的宽度。
专利文献3公开了一种通过将被检体的质谱数据与癌症的有无相关联来进行机器学习的方法。然而,需要大量的教师数据来提高机器学习的精度。在专利文献3中,准备了90,000种数据作为教师数据。换句话说,机器学习使得能够高精度地分析复杂的分析结果,而其缺点是必须准备大量的教师数据。在本实施例中,不需要准备大量的教师数据(这是机器学习的缺点),从而能够减轻用户的负担。
尽管如上所述生成了教师数据,但是可以通过使用分析器23分析多个样品来获取用于学习的样品的频谱信息,并且可以将该频谱信息与被测物质的定量信息一起用作教师数据。另外,可以通过与上述方法不同的方法来生成虚拟样品的频谱信息。
(S203)(生成学习模型)
在步骤S203中,学习模型生成部分42通过使用在步骤S202中针对各浓度生成的多个教师数据,根据预定算法进行机器学习,来生成学习模型。在本实施例中,神经网络被用作预定算法。学习模型生成部分42通过使神经网络使用多个教师数据进行学习来生成学习模型,该学习模型基于样品的频谱信息的输入来估计样品中包含的被测物质的定量信息。由于神经网络的学习方法是公知技术,因此在本实施例中省略详细描述。另外,作为预定算法,例如,可以使用SVM(支持向量机)、DNN(深度神经网络)、CNN(卷积神经网络)等。在存在多种类型的被测物质的情况下,学习模型生成部分42针对各物质构建学习模型。然后,学习模型生成部分42将生成的学习模型存储到RAM 33、存储部分34或数据库22中。
如上所述,基于样品的频谱信息,生成估计样品中包含的被测物质的定量信息的学习模型。
随后,将描述获取可靠性的方法。图3是示出用于获取可靠性的处理过程的流程图。
(S301)(分析样品)
在步骤S301中,分析器23分析目标样品并获取样品的频谱信息。假设分析条件与上述步骤S201中相同。然后,分析器23将获取的频谱信息输出到信息处理装置10。信息处理装置10从分析器23接收频谱信息,并将频谱信息存储到RAM 33或存储部分34中以进行保留。频谱信息获取部分41获取由此保留的频谱信息。如上所述,可以将作为分析结果的频谱信息保留在数据库22中。在这种情况下,频谱信息获取部分41从数据库22获取频谱信息。此外,分析器23分析样品的定时可以是任何定时,只要在步骤S302中估计定量信息之前进行分析即可。
(S302)(估计定量信息)
在步骤S302中,学习模型获取部分43获取存储在RAM 33、存储部分34或数据库22中的学习模型。然后,通过输入在步骤S301中获取的样品的频谱信息,估计部分44使获取的学习模型估计样品中包含的被测物质的定量信息。此外,估计部分44根据需要将估计的定量信息转换为在显示部分36中显示的格式。要在显示部分36中显示的格式可以是g/L、mol/L等的浓度,或者可以是与基准量(标准量)的比率。只要由学习模型估计的值是这些显示格式中的任何一种,就无需转换该值。然后,信息获取部分45从估计部分44获取估计的定量信息,并将该定量信息存储到RAM 33或存储部分34中。
如上所述,即使没有将被测物质的峰与杂质的峰完全分离,使用通过机器学习获得的学习模型也能够准确地获取被测物质的定量信息,而无需关于分析的复杂和高级的知识。结果,即使是非专家也能够容易地对被测物质进行高精度的定量分析。
(S303)(获取可靠性)
在步骤S303中,可靠性获取部分46获取在步骤S302中估计的定量信息的可靠性。将详细描述获取可靠性的方法。
可靠性获取部分46获取由频谱信息获取部分41输出的被测物质的频谱信息。然后,可靠性获取部分46识别根据被测物质的频谱信息识别出的峰(第一峰)的保留时间(第一保留时间)。随后,可靠性获取部分46获取由频谱信息获取部分41输出的样品的频谱信息。然后,可靠性获取部分46根据样品的频谱信息识别具有最接近第一峰的保留时间的保留时间的峰(第二峰)。可靠性获取部分46计算如上所述识别出的第一峰的保留时间与第二峰的保留时间之间的时间差,并将计算出的时间差取为Δ值。另选地,可以将Δ值用作被测物质的频谱信息中的半峰全宽的中心的保留时间与样品的频谱信息的第二峰的半峰全宽的中心的保留时间之间的时间差。
图4A示出了从频谱信息获取部分41获取的样品的频谱信息401。图4A和图4B所示的样品的频谱信息401是色谱,其中纵轴指示信号强度,横轴指示保留时间。图4B示出了如402所指示的、频谱信息401的提取范围。在图4B中,为便于描述,将相同范围内的被测物质的频谱信息403叠加。可靠性获取部分46从被测物质的频谱信息403中识别出第一峰404。然后,可靠性获取部分46识别具有最接近第一峰的保留时间的保留时间的第二峰405。第一峰的保留时间与第二峰的保留时间之间的时间差406是Δ值。
随后,可靠性获取部分46生成包含被测物质和杂质的虚拟样品的多个频谱信息,其具有与计算出的Δ值相同的Δ值。该生成方法类似于在步骤S202中描述的方法。然后,可靠性获取部分46将多个生成的频谱信息输入到在步骤S302中获取的学习模型,并且针对各生成的频谱信息估计虚拟样品中包含的被测物质的定量信息。在本说明书中,估计的定量信息被称为“估计值”。另外,将从在虚拟样品的频谱信息的生成中使用的被测物质的频谱信息中识别出的峰的高度(定量信息)称为“正确答案值”。可靠性获取部分46计算多个估计值与正确答案值之间的相关系数,并将计算出的相关系数用作在步骤S302中估计的定量信息的可靠性。可靠性获取部分46获取以这种方式计算出的可靠性,并将可靠性存储到RAM33或存储部分34中。
尽管在本实施例中在步骤S303中计算了相关系数,但是可以针对各Δ值预先计算相关系数。图5是示出针对各Δ值计算相关系数的结果的图。在预先计算相关系数的情况下,可靠性获取部分46在图5的Δ值的列中搜索同第一峰的保留时间与第二峰的保留时间之间的时间差(Δ值)相同的值。如果作为搜索结果发现了相同的值,则可靠性获取部分46从相关系数列中获取与该值相对应的相关系数,并将所获取的相关系数用作可靠性。除非找到相同的值,否则可靠性获取部分46可以从图5中的Δ值列中识别最接近计算出的Δ值的值。
(S304)(显示定量信息和可靠性)
在步骤S304中,显示控制部分47使显示部分36显示在步骤S302中由学习模型估计的样品中包含的被测物质的定量信息以及在步骤S303中计算出的可靠性。在这种情况下,可以以图形格式或表格格式来布置和显示定量信息和可靠性。图6示出了在显示部分36中显示的画面(窗口)的示例。此外,可以根据诸如“高”或“低”的可靠性值来显示等级。如果计算出的可靠性高于预定阈值,则可以改变估计的定量信息的显示形式,诸如颜色、字符粗细和字符大小。当计算出的可靠性低于预定阈值时,这同样适用。
以这种方式将估计的定量信息的可靠性呈现给用户,从而使用户更容易确定由学习模型估计的被测物质的定量信息能够被信赖的程度。换句话说,可以辅助用户确定通过使用学习模型估计的被测物质的定量信息。
[第二实施例]
随后,将描述第二实施例。在第一实施例中,将估计值与正确答案值之间的相关系数用作可靠性。在第二实施例中,将通过分类学习模型估计的分类概率用作可靠性。
图7是示出根据第二实施例的信息处理系统的整体构造的图。除了以下功能部分之外,第二实施例中的信息处理系统的整体构造以及信息处理装置10的硬件构造和功能构造与第一实施例的相同,因此将省略其描述。
频谱信息获取部分41从分析器23获取至少包括被测物质和杂质的样品的分析结果,具体为样品的频谱信息。另外,可以从预先存储分析结果的数据库22中获取样品的频谱信息。此外,以相同的方式获取被测物质的频谱信息。被测物质的频谱信息是在存在单一被测物质的情况下获得的频谱信息。然后,频谱信息获取部分41将所获取的样品的频谱信息输出至估计部分44。此外,所获取的被测物质的频谱信息被输出至学习模型生成部分42。
学习模型生成部分42通过使用由频谱信息获取部分41获取的被测物质的频谱信息来生成教师数据。然后,学习模型生成部分42通过使用教师数据进行深度学习并生成学习模型。在第二实施例中生成的学习模型是分类学习模型。图8是用于描述第二实施例中的分类学习模型的图。如图8所示,在输出层中有多个节点,并且各节点对应于指示被测物质的定量信息的类别。另外,输出层的各节点的输出值指示分类概率。关于教师数据的生成和学习模型的生成的详细描述如第一实施例中所述。然后,学习模型生成部分42将所生成的学习模型输出至学习模型获取部分43。学习模型生成部分42可以将所生成的学习模型输出至数据库22。
估计部分44通过将由频谱信息获取部分41获取的样品的频谱信息输入到学习模型中,来使由学习模型获取部分43获取的学习模型估计样品中包含的被测物质的定量信息。另外,学习模型获取部分43还使学习模型对估计的定量信息的分类概率进行估计。此外,估计部分44将估计的定量信息输出到信息获取部分45,并且将估计的分类概率输出到可靠性获取部分46。
可靠性获取部分46获取由信息获取部分45获取的被测物质的定量信息的可靠性。本实施例中的可靠性是由学习模型估计的分类概率。因此,将从估计部分44获取的分类概率用作定量信息的可靠性。可靠性获取部分46将获取的可靠性输出到显示控制部分47。
随后,将描述第二实施例中的处理过程。除了以下几点以外,第二实施例中用于生成学习模型的处理过程与图2所示的流程图相同。
在步骤S203中,当学习模型生成部分42生成学习模型时,学习模型生成部分42使用分类学习模型。因此,在利用教师数据进行学习时,使学习模型进行学习,以使浓度的输出值接近100%,其中该输出值在输出层的节点当中具有最大的输出值(分类概率),其对应于作为正确答案数据的定量信息。
除了以下几点以外,第二实施例中用于获取可靠性的处理过程与图3所示的流程图相同。
在步骤S302中,估计部分44使学习模型估计分类概率和样品中包含的被测物质的定量信息。作为学习模型的输出值的、与具有最高分类概率的节点相对应的定量信息被假设为样品中包含的被测物质的定量信息。然后,在步骤S303中,可靠性获取部分46获取估计的分类概率作为可靠性。在步骤S304中,显示控制部分47使显示部分36显示在步骤S302中由学习模型估计的样品中包含的被测物质的定量信息以及在步骤S303中获取的可靠性。
如上所述,可以采用分类学习模型的分类概率作为可靠性。与第一实施例类似,第二实施例也能够辅助用户确定通过使用学习模型估计的被测物质的定量信息。
[其他实施例]
尽管以上已经详细描述了实施例,但是本发明可以被执行为其他形式,诸如系统、装置、方法、程序、存储介质等。具体地,本发明可以应用于通过分配信息处理装置的功能而由多个设备组成的系统,或者可以应用于由单个设备组成的设备。另外,为了在计算机上实现本发明的功能和处理,安装在计算机中的程序代码本身也实现了本发明。此外,本发明的范围还包括用于实现上述实施例中描述的功能和处理的计算机程序本身。另外,当计算机执行读取的程序时,可以实现上述实施例的功能,或者可以基于程序的指令,与计算机上运行的OS等组合实现实施例的功能。在这种情况下,OS等进行部分或全部实际处理,并且该处理使得上述实施例的功能得以实现。此外,可以将从记录介质读取的程序写入配设在插入计算机中的功能扩展板或连接至计算机的功能扩展单元中的存储器中,使得实现上述实施例的一些或全部功能。本发明的范围不限于上述实施例。可以组合上述多个实施例中的至少两个。
[示例]
下面将通过给出示例和比较例来更详细地描述本发明。本发明不限于以下示例。示例1至3对应于第一实施例,示例4对应于第二实施例。
[示例1]
作为示例1,首先,将描述将上述数据处理方法应用于仿真数据的示例,以评估方法的有利效果。
作为被测物质数据(被测物质的频谱信息),准备了11种类型的正态分布波形数据,其中,中值=250,标准偏差=20,峰高=以0.1为增量的0.0-1.0。
将中值、标准偏差和峰高被设置为随机数的四个正态分布波形添加到各被测物质数据,以将结果用作样品数据(虚拟样品的频谱信息)。对于单独被测物质数据,准备了1,000种类型的样品数据。将各样品数据与各样品数据中包含的被测物质数据的峰高组合,以形成11,000个教师数据,并通过使用教师数据进行机器学习以生成回归学习模型。将全连接神经网络用作机器学习方法,并将relu函数和线性函数用作激活函数。均方误差被用作损失函数,并且Adam被用作优化算法。需要大约100个时期(epoch)的迭代操作来获得足够的定量精度。
随后,准备通过与样品数据相同的方法创建的大量样品数据。其中,关注样品数据的峰,其位于被测物质数据的峰附近。将取峰的最大值的保留时间与取被测物质数据的峰的最大值的保留时间进行比较,并选择时间差(Δ值)为25的1100个样品数据。将这些样品数据输入到学习模型,以计算样品数据中包含的被测物质的峰高。图9A示出了示例1的仿真结果。图9A是将横轴作为用于创建样品数据的被测物质的峰高(正确答案值)、并将纵轴作为通过使用学习模型获得的被测物质的峰高(估计值)的图。如图9A所示,正确答案值与估计值之间的相关系数是0.99,并且该相关系数被用作Δ值为25的样品数据的可靠性。
[示例2]
除了选择了Δ值为20的1100个样品数据,将这些样品数据输入到学习模型中,并计算样品数据中包含的被测物质的峰高之外,示例2与示例1相同。示例2的仿真结果在图9B中示出。如图9B所示,相关系数为0.93,并且该值被用作Δ值为20的样品数据的可靠性。
[示例3]
除了选择了Δ值为15的1100个样品数据,将这些样品数据输入到学习模型中,并计算样品数据中包含的被测物质的峰高之外,示例3与示例1和2相同。示例3的仿真结果在图9C中示出。如图9C所示,相关系数为0.87,并且该值被用作Δ值为15的样品数据的可靠性。
[示例4]
在示例4中,使用以与示例1中相同的方式准备的教师数据进行机器学习,以生成分类学习模型。将全连接神经网络用作机器学习方法,并将relu函数和softmax函数用作激活函数。将交叉熵损失函数用作损失函数,并将SGD用作优化算法。需要大约100个时期的迭代操作来获得足够的定量精度。
随后,通过使用与样品数据相同的方法创建11个数据。将这些数据输入到学习模型中,以对样品数据中包含的被测物质的峰高进行分类。另外,将各分类值的分类概率用作可靠性。
本发明不限于上述实施例,并且在不脱离本发明的精神和范围的情况下可以进行各种变型和改变。因此,附上了权利要求以公开本发明的范围。
本申请要求2018年12月20日提交的日本专利申请第2018-238829号的优先权,这些申请的全部内容通过引用并入本文。
[附图标记列表]
10 信息处理装置;
21 LAN;
22 数据库;
23 分析器;
31 通信IF;
32 ROM;
33 RAM;
34 存储部分;
35 操作部分;
36 显示部分;
37 控制部分;
41 频谱信息获取部分;
42 学习模型生成部分;
43 学习模型获取部分;
44 估计部分;
45 信息获取部分;
46 可靠性获取部分;
47 显示控制部分。
Claims (35)
1.一种信息处理装置,其包括:
信息获取部,其用于获取通过将包含被测物质和杂质的样品的频谱信息输入到学习模型中而估计的所述被测物质的定量信息;以及
可靠性获取部,其用于获取所获取的被测物质的定量信息的可靠性。
2.根据权利要求1所述的信息处理装置,其中,所述可靠性获取部通过使用所述样品的频谱信息和所述被测物质的频谱信息,来获取所述可靠性。
3.根据权利要求1所述的信息处理装置,其中,
所述频谱信息是色谱,并且
所述可靠性获取部通过使用基于所述样品的频谱信息而识别的保留时间以及基于所述被测物质的频谱信息而识别的保留时间,来获取所述可靠性。
4.根据权利要求1至3中的任一项所述的信息处理装置,其中,所述可靠性是基于所述被测物质的频谱信息而识别的所述被测物质的定量信息与通过所述学习模型而估计的所述被测物质的定量信息之间的相关系数。
5.根据权利要求1所述的信息处理装置,其中,所述可靠性是通过所述学习模型而估计的分类概率。
6.根据权利要求1至5中的任一项所述的信息处理装置,所述信息处理装置还包括:
显示控制部,其用于使显示部分显示所获取的可靠性。
7.根据权利要求6所述的信息处理装置,其中,所述显示控制部还使所述显示部分显示所获取的被测物质的定量信息。
8.根据权利要求1至7中的任一项所述的信息处理装置,其中,所述学习模型是通过使用多对学习频谱信息作为教师数据而学习的学习模型,所述多对学习频谱信息是,基于所述被测物质的频谱信息、以及基于所述被测物质的频谱信息而识别的所述被测物质的定量信息来生成的。
9.根据权利要求8所述的信息处理装置,其中,所述学习频谱信息是通过使用所述被测物质的频谱信息和随机噪声来生成的。
10.根据权利要求9所述的信息处理装置,其中,所述随机噪声是通过组合多个高斯函数而获得的波形。
11.根据权利要求1至10中的任一项所述的信息处理装置,所述信息处理装置还包括:
估计部,其用于通过将所述样品的频谱信息输入到所述学习模型中,来估计所述被测物质的定量信息。
12.根据权利要求1所述的信息处理装置,其中,所述频谱信息是色谱、光电子频谱、红外吸收频谱、核磁共振频谱、荧光频谱、X-射线荧光频谱、紫外/可见吸收频谱、拉曼频谱、原子吸收频谱、火焰发射频谱、发射分光频谱、X射线吸收频谱、X射线衍射频谱、顺磁共振吸收频谱、电子自旋共振频谱、质谱和热分析频谱中的至少一者。
13.根据权利要求1或12所述的信息处理装置,所述信息处理装置还包括:
分析部,其用于进行用于获取所述样品的频谱信息的分析。
14.根据权利要求13所述的信息处理装置,其中,所述分析部进行色谱法、毛细管电泳法、光电子频谱法、红外吸收频谱法、核磁共振频谱法、荧光频谱法、X射线荧光频谱法、可见/紫外吸收频谱法、拉曼频谱法、原子吸收频谱法、火焰发射频谱法、发射频谱法、X射线吸收频谱法、X射线衍射法、使用顺磁共振吸收的电子自旋共振频谱法、质谱法和热分析方法中的至少一者。
15.根据权利要求1至14中的任一项所述的信息处理装置,其中,所述被测物质是蛋白质、DNA、病毒、真菌、水溶性维生素、脂溶性维生素、有机酸、脂肪酸、氨基酸、糖、农药和内分泌干扰物中的至少一者。
16.根据权利要求1至15中的任一项所述的信息处理装置,其中,所述被测物质是硫胺素、核黄素、N1-甲基烟酰胺、N1-甲基-2-吡啶酮-5-甲酰胺、4-吡哆醇酸、N1-甲基-4-吡啶酮-3-甲酰胺、泛酸、吡哆醇、生物素、蝶酸单麸氨酸、氰钴胺和抗坏血酸中的至少一者。
17.根据权利要求1至16中的任一项所述的信息处理装置,其中,所述定量信息是所述样品中包含的所述被测物质的量、所述样品中包含的所述被测物质的浓度、所述样品中所述被测物质的有无、所述样品中包含的所述被测物质的浓度或量与所述被测物质的基准量的比率、和所述样品中包含的所述被测物质的量或浓度的比率中的至少一者。
18.一种信息处理装置的控制方法,所述控制方法包括:
信息获取步骤,获取通过将包含被测物质和杂质的样品的频谱信息输入到学习模型中而估计的所述被测物质的定量信息;以及
可靠性获取步骤,获取所获取的被测物质的定量信息的可靠性。
19.根据权利要求18所述的信息处理装置的控制方法,其中,所述可靠性获取步骤包括:通过使用所述样品的频谱信息和所述被测物质的频谱信息,来获取所述可靠性。
20.根据权利要求18所述的信息处理装置的控制方法,其中,
所述频谱信息是色谱,并且
所述可靠性获取步骤包括:通过使用基于所述样品的频谱信息而识别的保留时间以及基于所述被测物质的频谱信息而识别的保留时间,来获取所述可靠性。
21.根据权利要求18至20中的任一项所述的信息处理装置的控制方法,其中,所述可靠性是基于所述被测物质的频谱信息而识别的所述被测物质的定量信息与通过所述学习模型而估计的所述被测物质的定量信息之间的相关系数。
22.根据权利要求18所述的信息处理装置的控制方法,其中,所述可靠性是通过所述学习模型而估计的分类概率。
23.根据权利要求18至22中的任一项所述的信息处理装置的控制方法,所述控制方法还包括:
显示控制步骤,使显示部分显示所获取的可靠性。
24.根据权利要求23所述的信息处理装置的控制方法,其中,所述显示控制步骤还包括:使所述显示部分显示所获取的被测物质的定量信息。
25.根据权利要求18至24中的任一项所述的信息处理装置的控制方法,其中,所述学习模型是通过使用多对学习频谱信息作为教师数据而学习的学习模型,所述多对学习频谱信息是,基于所述被测物质的频谱信息、以及基于所述被测物质的频谱信息而识别的所述被测物质的定量信息来生成的。
26.根据权利要求25所述的信息处理装置的控制方法,其中,所述学习频谱信息是通过使用所述被测物质的频谱信息和随机噪声来生成的。
27.根据权利要求26所述的信息处理装置的控制方法,其中,所述随机噪声是通过组合多个高斯函数而获得的波形。
28.根据权利要求18至27中的任一项所述的信息处理装置的控制方法,所述控制方法还包括:
估计步骤,通过将所述样品的频谱信息输入到所述学习模型中,来估计所述被测物质的定量信息。
29.根据权利要求18所述的信息处理装置的控制方法,其中,所述频谱信息是色谱、光电子频谱、红外吸收频谱、核磁共振频谱、荧光频谱、X-射线荧光频谱、紫外/可见吸收频谱、拉曼频谱、原子吸收频谱、火焰发射频谱、发射分光频谱、X射线吸收频谱、X射线衍射频谱、顺磁共振吸收频谱、电子自旋共振频谱、质谱和热分析频谱中的至少一者。
30.根据权利要求18或29所述的信息处理装置的控制方法,所述控制方法还包括:
分析步骤,进行用于获取所述样品的频谱信息的分析。
31.根据权利要求30所述的信息处理装置的控制方法,其中,所述分析步骤包括:进行色谱法、毛细管电泳法、光电子频谱法、红外吸收频谱法、核磁共振频谱法、荧光频谱法、X射线荧光频谱法、可见/紫外吸收频谱法、拉曼频谱法、原子吸收频谱法、火焰发射频谱法、发射频谱法、X射线吸收频谱法、X射线衍射法、使用顺磁共振吸收的电子自旋共振频谱法、质谱法和热分析方法中的至少一者。
32.根据权利要求18至31中的任一项所述的信息处理装置的控制方法,其中,所述被测物质是蛋白质、DNA、病毒、真菌、水溶性维生素、脂溶性维生素、有机酸、脂肪酸、氨基酸、糖、农药和内分泌干扰物中的至少一者。
33.根据权利要求18至32中的任一项所述的信息处理装置的控制方法,其中,所述被测物质是硫胺素、核黄素、N1-甲基烟酰胺、N1-甲基-2-吡啶酮-5-甲酰胺、4-吡哆醇酸、N1-甲基-4-吡啶酮-3-甲酰胺、泛酸、吡哆醇、生物素、蝶酸单麸氨酸、氰钴胺和抗坏血酸中的至少一者。
34.根据权利要求18至33中的任一项所述的信息处理装置的控制方法,其中,所述定量信息是所述样品中包含的所述被测物质的量、所述样品中包含的所述被测物质的浓度、所述样品中所述被测物质的有无、所述样品中包含的所述被测物质的浓度或量与所述被测物质的基准量的比率、和所述样品中包含的所述被测物质的量或浓度的比率中的至少一者。
35.一种程序,其使计算机用作根据权利要求1至17中的任一项所述的信息处理装置的各个部。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018-238829 | 2018-12-20 | ||
JP2018238829 | 2018-12-20 | ||
PCT/JP2019/049158 WO2020129895A1 (ja) | 2018-12-20 | 2019-12-16 | 情報処理装置、情報処理装置の制御方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113196053A true CN113196053A (zh) | 2021-07-30 |
Family
ID=71101751
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980083701.7A Pending CN113196053A (zh) | 2018-12-20 | 2019-12-16 | 信息处理装置、信息处理装置的控制方法及程序 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20210311001A1 (zh) |
JP (1) | JP7483367B2 (zh) |
CN (1) | CN113196053A (zh) |
WO (1) | WO2020129895A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7469799B2 (ja) | 2020-07-08 | 2024-04-17 | 東京都公立大学法人 | 計測装置および計測方法 |
KR102458523B1 (ko) * | 2020-10-13 | 2022-10-25 | 서강대학교산학협력단 | 실리콘 광증배기 기반 광자 계수 엑스선 검출기의 에너지 스펙트럼 데이터 처리 방법 및 서버 |
KR102271995B1 (ko) * | 2021-01-12 | 2021-07-05 | 국방과학연구소 | 인공 신경망을 이용한 지표면 화학 작용제 탐지 시스템 |
CN117980998A (zh) | 2021-09-30 | 2024-05-03 | 富士胶片株式会社 | 学习用数据的获取方法、学习用数据获取系统、软传感器的构建方法、软传感器、学习用数据 |
FR3136856A1 (fr) * | 2022-06-21 | 2023-12-22 | Commissariat A L'energie Atomique Et Aux Energies Alternatives | Méthode de validation des prédictions d’un modèle supervisé d’analyse quantitative multivariée de données spectrales |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4468742A (en) * | 1981-03-17 | 1984-08-28 | The Regents Of University Of California | Microprocessor system for quantitative chromatographic data analysis |
JPH0694696A (ja) * | 1992-09-17 | 1994-04-08 | Hitachi Ltd | クロマトグラム解析方法及びクロマトグラフ装置 |
JPH06324029A (ja) * | 1993-03-15 | 1994-11-25 | Hitachi Ltd | クロマトグラム解析表示方法及びその装置 |
CN1423749A (zh) * | 2000-07-04 | 2003-06-11 | 模式识别系统控股有限公司 | 分析选定的多组分样品的方法 |
US20150066387A1 (en) * | 2013-08-30 | 2015-03-05 | Shimadzu Corporation | Substance identification method and mass spectrometer using the same |
CN106248844A (zh) * | 2016-10-25 | 2016-12-21 | 中国科学院计算技术研究所 | 一种肽段液相色谱保留时间预测方法及系统 |
CN107440684A (zh) * | 2016-05-09 | 2017-12-08 | 三星电子株式会社 | 用于预测分析物的浓度的方法和设备 |
CN108064341A (zh) * | 2017-06-12 | 2018-05-22 | 深圳前海达闼云端智能科技有限公司 | 物质成分检测方法、装置和检测设备 |
CN108351331A (zh) * | 2015-11-05 | 2018-07-31 | 株式会社岛津制作所 | 色谱质谱分析数据处理方法以及处理装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016004525A (ja) * | 2014-06-19 | 2016-01-12 | 株式会社日立製作所 | データ分析システム及びデータ分析方法 |
WO2018117129A1 (ja) * | 2016-12-19 | 2018-06-28 | 株式会社ユカシカド | 尿検査装置および尿検査方法 |
WO2019092837A1 (ja) * | 2017-11-09 | 2019-05-16 | 富士通株式会社 | 波形解析装置 |
-
2019
- 2019-12-16 CN CN201980083701.7A patent/CN113196053A/zh active Pending
- 2019-12-16 WO PCT/JP2019/049158 patent/WO2020129895A1/ja active Application Filing
- 2019-12-17 JP JP2019227570A patent/JP7483367B2/ja active Active
-
2021
- 2021-06-18 US US17/351,787 patent/US20210311001A1/en active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4468742A (en) * | 1981-03-17 | 1984-08-28 | The Regents Of University Of California | Microprocessor system for quantitative chromatographic data analysis |
JPH0694696A (ja) * | 1992-09-17 | 1994-04-08 | Hitachi Ltd | クロマトグラム解析方法及びクロマトグラフ装置 |
JPH06324029A (ja) * | 1993-03-15 | 1994-11-25 | Hitachi Ltd | クロマトグラム解析表示方法及びその装置 |
CN1423749A (zh) * | 2000-07-04 | 2003-06-11 | 模式识别系统控股有限公司 | 分析选定的多组分样品的方法 |
US20150066387A1 (en) * | 2013-08-30 | 2015-03-05 | Shimadzu Corporation | Substance identification method and mass spectrometer using the same |
CN108351331A (zh) * | 2015-11-05 | 2018-07-31 | 株式会社岛津制作所 | 色谱质谱分析数据处理方法以及处理装置 |
CN107440684A (zh) * | 2016-05-09 | 2017-12-08 | 三星电子株式会社 | 用于预测分析物的浓度的方法和设备 |
CN106248844A (zh) * | 2016-10-25 | 2016-12-21 | 中国科学院计算技术研究所 | 一种肽段液相色谱保留时间预测方法及系统 |
CN108064341A (zh) * | 2017-06-12 | 2018-05-22 | 深圳前海达闼云端智能科技有限公司 | 物质成分检测方法、装置和检测设备 |
Also Published As
Publication number | Publication date |
---|---|
JP2020101543A (ja) | 2020-07-02 |
JP7483367B2 (ja) | 2024-05-15 |
US20210311001A1 (en) | 2021-10-07 |
WO2020129895A1 (ja) | 2020-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210311001A1 (en) | Information processing apparatus, control method of information processing apparatus, and computer-readable storage medium therefor | |
Checa et al. | Lipidomic data analysis: tutorial, practical guidelines and applications | |
Xi et al. | Statistical analysis and modeling of mass spectrometry-based metabolomics data | |
WO2020105566A1 (ja) | 情報処理装置、情報処理装置の制御方法、プログラム、算出装置、及び算出方法 | |
US7676329B2 (en) | Method and system for processing multi-dimensional measurement data | |
JP5496650B2 (ja) | サンプル内の個々の要素を識別及び定量化するために分光測定データを分析するシステム、方法及びコンピュータプログラム製品 | |
EP3495812A1 (en) | Analysis data processing method and analysis data processing device | |
Hendrickx et al. | Reverse engineering of metabolic networks, a critical assessment | |
Ortiz et al. | Usefulness of PARAFAC for the quantification, identification, and description of analytical data | |
Percival et al. | Univariate and multivariate statistical approaches to the analysis and interpretation of NMR-based metabolomics datasets of increasing complexity | |
Ju et al. | Identification of rice varieties and adulteration using gas chromatography-ion mobility spectrometry | |
US11841373B2 (en) | Information processing apparatus, method for controlling information processing apparatus, and program | |
Rezaei-Tavirani et al. | Advantage of applying OSC to 1H NMR-based metabonomic data of celiac disease | |
US20220252531A1 (en) | Information processing apparatus and control method for information processing apparatus | |
JP2020106340A (ja) | 情報処理装置、情報処理装置の制御方法、及びプログラム | |
JP2021009135A (ja) | 情報処理装置、情報処理装置の制御方法、及びプログラム | |
CN104350378B (zh) | 用于测量光谱系统的性能的方法和设备 | |
Oller-Moreno et al. | Sliding window multi-curve resolution: application to gas chromatography–ion mobility spectrometry | |
Sena et al. | Chemometrics in bioanalytical chemistry | |
SkOV et al. | Chemometrics, mass spectrometry, and foodomics | |
Akbari Lakeh et al. | Discriminating normal regions within cancerous hen ovarian tissue using multivariate hyperspectral image analysis | |
Wijetunge et al. | Unsupervised learning for exploring MALDI imaging mass spectrometry ‘omics’ data | |
Mohammadkhani et al. | Effect of different pretreatment methods on classification of serum samples measured with 1 H-NMR | |
Mattsson | Analysis of LC-MS data in untargeted nutritional metabolomics | |
Ten-Doménech et al. | Analysis of longitudinal metabolomic data using multivariate curve resolution-alternating least squares and pathway analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |