WO2023121167A1 - 검출 장치의 성능을 예측하기 위한 방법 - Google Patents
검출 장치의 성능을 예측하기 위한 방법 Download PDFInfo
- Publication number
- WO2023121167A1 WO2023121167A1 PCT/KR2022/020688 KR2022020688W WO2023121167A1 WO 2023121167 A1 WO2023121167 A1 WO 2023121167A1 KR 2022020688 W KR2022020688 W KR 2022020688W WO 2023121167 A1 WO2023121167 A1 WO 2023121167A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- optical
- data
- detection device
- noise level
- present disclosure
- Prior art date
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 230
- 238000000034 method Methods 0.000 title claims abstract description 91
- 238000010801 machine learning Methods 0.000 claims abstract description 102
- 239000012491 analyte Substances 0.000 claims abstract description 20
- 230000001419 dependent effect Effects 0.000 claims abstract description 8
- 230000003287 optical effect Effects 0.000 claims description 281
- 238000006243 chemical reaction Methods 0.000 claims description 66
- 238000005259 measurement Methods 0.000 claims description 60
- 230000008569 process Effects 0.000 claims description 23
- 230000036961 partial effect Effects 0.000 claims description 20
- 239000013642 negative control Substances 0.000 claims description 19
- 239000013641 positive control Substances 0.000 claims description 19
- 238000012706 support-vector machine Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 18
- 239000000203 mixture Substances 0.000 claims description 15
- 238000011156 evaluation Methods 0.000 claims description 14
- 238000000354 decomposition reaction Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 8
- 238000003062 neural network model Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000012417 linear regression Methods 0.000 claims description 5
- 239000007788 liquid Substances 0.000 claims description 5
- 230000001678 irradiating effect Effects 0.000 claims description 4
- 230000035945 sensitivity Effects 0.000 claims description 3
- 150000007523 nucleic acids Chemical class 0.000 description 168
- 102000039446 nucleic acids Human genes 0.000 description 166
- 108020004707 nucleic acids Proteins 0.000 description 166
- 238000012360 testing method Methods 0.000 description 69
- 238000013528 artificial neural network Methods 0.000 description 60
- 230000003321 amplification Effects 0.000 description 33
- 238000003199 nucleic acid amplification method Methods 0.000 description 33
- 238000003752 polymerase chain reaction Methods 0.000 description 19
- 238000003860 storage Methods 0.000 description 16
- 239000000975 dye Substances 0.000 description 14
- 238000004422 calculation algorithm Methods 0.000 description 13
- 230000008859 change Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 13
- 238000012549 training Methods 0.000 description 13
- 108020004414 DNA Proteins 0.000 description 11
- 102000053602 DNA Human genes 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 238000000137 annealing Methods 0.000 description 6
- 230000007423 decrease Effects 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- SGTNSNPWRIOYBX-UHFFFAOYSA-N 2-(3,4-dimethoxyphenyl)-5-{[2-(3,4-dimethoxyphenyl)ethyl](methyl)amino}-2-(propan-2-yl)pentanenitrile Chemical compound C1=C(OC)C(OC)=CC=C1CCN(C)CCCC(C#N)(C(C)C)C1=CC=C(OC)C(OC)=C1 SGTNSNPWRIOYBX-UHFFFAOYSA-N 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 238000003064 k means clustering Methods 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 210000004205 output neuron Anatomy 0.000 description 5
- 239000013615 primer Substances 0.000 description 5
- 239000011541 reaction mixture Substances 0.000 description 5
- 241000282326 Felis catus Species 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000010438 heat treatment Methods 0.000 description 4
- 230000001932 seasonal effect Effects 0.000 description 4
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 238000004925 denaturation Methods 0.000 description 3
- 230000036425 denaturation Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000000611 regression analysis Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- VGIRNWJSIRVFRT-UHFFFAOYSA-N 2',7'-difluorofluorescein Chemical compound OC(=O)C1=CC=CC=C1C1=C2C=C(F)C(=O)C=C2OC2=CC(O)=C(F)C=C21 VGIRNWJSIRVFRT-UHFFFAOYSA-N 0.000 description 2
- 108020001019 DNA Primers Proteins 0.000 description 2
- 239000003155 DNA primer Substances 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 238000010222 PCR analysis Methods 0.000 description 2
- GRRMZXFOOGQMFA-UHFFFAOYSA-J YoYo-1 Chemical compound [I-].[I-].[I-].[I-].C12=CC=CC=C2C(C=C2N(C3=CC=CC=C3O2)C)=CC=[N+]1CCC[N+](C)(C)CCC[N+](C)(C)CCC[N+](C1=CC=CC=C11)=CC=C1C=C1N(C)C2=CC=CC=C2O1 GRRMZXFOOGQMFA-UHFFFAOYSA-J 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 210000002364 input neuron Anatomy 0.000 description 2
- 238000011901 isothermal amplification Methods 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 230000005055 memory storage Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000011056 performance test Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 108010053210 Phycocyanin Proteins 0.000 description 1
- 108010004729 Phycoerythrin Proteins 0.000 description 1
- 108010066717 Q beta Replicase Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- MZZINWWGSYUHGU-UHFFFAOYSA-J ToTo-1 Chemical compound [I-].[I-].[I-].[I-].C12=CC=CC=C2C(C=C2N(C3=CC=CC=C3S2)C)=CC=[N+]1CCC[N+](C)(C)CCC[N+](C)(C)CCC[N+](C1=CC=CC=C11)=CC=C1C=C1N(C)C2=CC=CC=C2S1 MZZINWWGSYUHGU-UHFFFAOYSA-J 0.000 description 1
- 239000007984 Tris EDTA buffer Substances 0.000 description 1
- -1 YO-PRO TM -3 Chemical compound 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- DEGAKNSWVGKMLS-UHFFFAOYSA-N calcein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC(CN(CC(O)=O)CC(O)=O)=C(O)C=C1OC1=C2C=C(CN(CC(O)=O)CC(=O)O)C(O)=C1 DEGAKNSWVGKMLS-UHFFFAOYSA-N 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- IDMLRIMDYVWWRJ-UHFFFAOYSA-N calcium crimson Chemical compound CC(=O)OCOC(=O)CN(CC(=O)OCOC(C)=O)C1=CC=CC=C1OCCOC1=CC(NS(=O)(=O)C=2C=C(C(C=3C4=CC=5CCCN6CCCC(C=56)=C4OC4=C5C6=[N+](CCC5)CCCC6=CC4=3)=CC=2)S([O-])(=O)=O)=CC=C1N(CC(=O)OCOC(C)=O)CC(=O)OCOC(C)=O IDMLRIMDYVWWRJ-UHFFFAOYSA-N 0.000 description 1
- NMUGYJRMGWBCPU-UHFFFAOYSA-N calcium orange Chemical compound C=12C=CC(=[N+](C)C)C=C2OC2=CC(N(C)C)=CC=C2C=1C(C(=C1)C([O-])=O)=CC=C1NC(=S)NC(C=1)=CC=C(N(CC(=O)OCOC(C)=O)CC(=O)OCOC(C)=O)C=1OCCOC1=CC=CC=C1N(CC(=O)OCOC(C)=O)CC(=O)OCOC(C)=O NMUGYJRMGWBCPU-UHFFFAOYSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000010224 classification analysis Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- NGCVJRFIBJVSFI-UHFFFAOYSA-I magnesium green Chemical compound [K+].[K+].[K+].[K+].[K+].C1=C(N(CC([O-])=O)CC([O-])=O)C(OCC(=O)[O-])=CC(NC(=O)C=2C=C3C(C4(C5=CC(Cl)=C([O-])C=C5OC5=CC([O-])=C(Cl)C=C54)OC3=O)=CC=2)=C1 NGCVJRFIBJVSFI-UHFFFAOYSA-I 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- VOFUROIFQGPCGE-UHFFFAOYSA-N nile red Chemical compound C1=CC=C2C3=NC4=CC=C(N(CC)CC)C=C4OC3=CC(=O)C2=C1 VOFUROIFQGPCGE-UHFFFAOYSA-N 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 229960002378 oftasceine Drugs 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- INCIMLINXXICKS-UHFFFAOYSA-M pyronin Y Chemical compound [Cl-].C1=CC(=[N+](C)C)C=C2OC3=CC(N(C)C)=CC=C3C=C21 INCIMLINXXICKS-UHFFFAOYSA-M 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- MYIOYATURDILJN-UHFFFAOYSA-N rhodamine 110 Chemical compound [Cl-].C=12C=CC(N)=CC2=[O+]C2=CC(N)=CC=C2C=1C1=CC=CC=C1C(O)=O MYIOYATURDILJN-UHFFFAOYSA-N 0.000 description 1
- TUFFYSFVSYUHPA-UHFFFAOYSA-M rhodamine 123 Chemical compound [Cl-].COC(=O)C1=CC=CC=C1C1=C(C=CC(N)=C2)C2=[O+]C2=C1C=CC(N)=C2 TUFFYSFVSYUHPA-UHFFFAOYSA-M 0.000 description 1
- 229940043267 rhodamine b Drugs 0.000 description 1
- 108700038288 rhodamine-phalloidin Proteins 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- ABZLKHKQJHEPAX-UHFFFAOYSA-N tetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C([O-])=O ABZLKHKQJHEPAX-UHFFFAOYSA-N 0.000 description 1
- JGVWCANSWKRBCS-UHFFFAOYSA-N tetramethylrhodamine thiocyanate Chemical compound [Cl-].C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=C(SC#N)C=C1C(O)=O JGVWCANSWKRBCS-UHFFFAOYSA-N 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 238000010977 unit operation Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N35/00—Automatic analysis not limited to methods or materials provided for in any single one of groups G01N1/00 - G01N33/00; Handling materials therefor
- G01N35/00584—Control arrangements for automatic analysers
- G01N35/00594—Quality control, including calibration or testing of components of the analyser
- G01N35/00613—Quality control
- G01N35/00623—Quality control of instruments
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L7/00—Heating or cooling apparatus; Heat insulating devices
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/84—Systems specially adapted for particular applications
- G01N21/8483—Investigating reagent band
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N35/00—Automatic analysis not limited to methods or materials provided for in any single one of groups G01N1/00 - G01N33/00; Handling materials therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N35/00—Automatic analysis not limited to methods or materials provided for in any single one of groups G01N1/00 - G01N33/00; Handling materials therefor
- G01N35/00584—Control arrangements for automatic analysers
- G01N35/00594—Quality control, including calibration or testing of components of the analyser
- G01N35/00693—Calibration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L2200/00—Solutions for specific problems relating to chemical or physical laboratory apparatus
- B01L2200/06—Fluid handling related problems
- B01L2200/0647—Handling flowable solids, e.g. microscopic beads, cells, particles
- B01L2200/0663—Stretching or orienting elongated molecules or particles
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N35/00—Automatic analysis not limited to methods or materials provided for in any single one of groups G01N1/00 - G01N33/00; Handling materials therefor
- G01N2035/00346—Heating or cooling arrangements
- G01N2035/00356—Holding samples at elevated temperature (incubation)
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N35/00—Automatic analysis not limited to methods or materials provided for in any single one of groups G01N1/00 - G01N33/00; Handling materials therefor
- G01N35/00584—Control arrangements for automatic analysers
- G01N35/00594—Quality control, including calibration or testing of components of the analyser
- G01N35/00613—Quality control
- G01N35/00623—Quality control of instruments
- G01N2035/00653—Quality control of instruments statistical methods comparing labs or apparatuses
Definitions
- the present disclosure relates to techniques related to amplification reactions, and more particularly to techniques for predicting the performance of detection devices.
- PCR stands for polymerase chain reaction and is a technique for rapidly amplifying DNA.
- a detection device is equipment for performing an amplification reaction such as PCR.
- a performance test is performed to determine whether the detection device is suitable for carrying out an amplification reaction such as PCR at the stage of delivery of the detection device.
- a typical performance test for a detection device is largely divided into a calibration step and a noise test step.
- the calibration step is a step of calibrating the detection device with the standard detection device, and takes about 60 minutes.
- the noise test step performed after the calibration step is a major test that can check the performance of the detection device, but since it consumes a long time of 150 to 600 minutes for one device, it is possible to reduce the time consumed in the noise test step. Research on possible techniques is needed.
- the present disclosure has been made in response to the above background art, and is intended to provide a method for predicting a noise test result of a detection device.
- a method of inferring a level of noise comprising: obtaining optical data having information about light among raw data used for optic calibration of the detection device; and inferring a level of noise generated by the detection device using a pre-learned machine learning model that takes the optical data as an input.
- the optical data may include a light measurement value obtained by radiating light of a predetermined wavelength for a predetermined cycle, and mathematically processing the light measurement value. It may include optical features.
- the light irradiation may be performed on a reaction vessel containing a liquid medium and a dye.
- the optical calibration may be characterized in that the intensity of the radiated light is adjusted based on a comparison result between the optical data and a predetermined reference value.
- the optical calibration may be characterized in that the light quantity measurement sensitivity of the detection device is adjusted based on a comparison result between the optical data and a predetermined reference value.
- the method may include extracting optical measurement values and optical features mathematically processing the optical measurement values from the optical data; and inputting the optical measurement values and optical features into the machine learning model to infer the noise level.
- the optical feature may include: a first optical feature comprising a variance or standard deviation for the optical data; a second optical feature comprising an average of the optic data; a third optical feature including a trend calculated by time-series decomposition of the optical data; a fourth optical feature including seasonality calculated by time-series decomposition of the optical data;
- a fifth optical feature including a remainder obtained by subtracting the third and fourth optical features from the optical data; and a sixth optical feature including a variance of a residual calculated by applying a linear regression line to the optical data, and a combination thereof.
- the extraction is such that a plurality of the optical features of different types are created
- the machine learning model includes at least three classifiers corresponding to the optical measurement value and a plurality of optical features, wherein one classifier of the at least three classifiers corresponds to one optical measurement value and one or at least two Corresponding to an optical feature, each of the at least three classifiers outputs one of PASS and FAIL as a preliminary noise level of the detection device when the corresponding optical measurement value and optical feature are input,
- the machine learning model may infer the noise level of the detection device by ensembling outputs of each of the at least three classifiers.
- the extraction is such that a plurality of the optical features of different types are generated, and the inference of the noise level is based on a predetermined p-value, at least one inference from the optical measurements and the plurality of optical features.
- the method may further include extracting features, and the machine learning model may receive input of the at least one inference feature for inferring the noise level.
- the machine learning model may include a model for inferring the noise level using a support vector machine (SVM) or partial least squares method.
- SVM support vector machine
- the machine learning model is a supervised model using a plurality of learning data, each of the plurality of learning data includes, as input data for learning, optical data obtained from a selected detection device, and for learning As the correct answer data, a pass (PASS) or fail (FAIL) indicating the noise level of the selected detection device may be included.
- PASS pass
- FAIL fail
- the noise level of the selected detection device may be characterized in that it is obtained in relation to a Negative Control (NC) composition and/or a Positive Control (PC) composition executed in the selected detection device.
- NC Negative Control
- PC Positive Control
- the optical data includes optical measurement values and a plurality of optical features of different types
- the machine learning model includes a neural network model including an input layer, at least one hidden layer, and an output layer, wherein the input The layer may include an input node corresponding to an optical measurement value and at least one of the one or more optical features, and the output layer may include an output node corresponding to PASS and FAIL.
- a computer readable medium storing a computer program according to an embodiment of the present disclosure to solve the above object
- the computer program when executed by one or more processors, causes the one or more processors to: Includes instructions for performing a method of inferring a noise level generated by a detection device, targeting a detection device that detects the presence or absence of the target analyte in a sample based on a signal dependent on the dependency, the method comprising: : obtaining optical data used for optic calibration of the detection device; and inferring the level of noise generated by the detection device by using a pre-learned machine learning model taking the optical data as an input.
- a computing device for performing a method of inferring a noise level comprising: an input unit for obtaining optical data used for optical calibration of the detection device; and a computing device including a noise level inference unit that infers a noise level generated by the detection device by using a pre-learned machine learning model that takes the optical data as an input.
- the present disclosure may provide a method for testing the performance of a detection device in a shorter time than before.
- 1 is an exemplary diagram illustrating an optical calibration and test process and time required for each step for the delivery of a detection device.
- FIG. 2 is a block diagram of a computing device for inferring a noise level of a detection device according to an embodiment of the present disclosure.
- FIG. 3 is a block diagram of a processor 120 for inferring a noise level of a detection device according to an embodiment of the present disclosure.
- FIG. 4 is a configuration diagram of a noise level inference unit according to an embodiment of the present disclosure.
- 5 is an exemplary view illustrating raw data according to some embodiments of the present disclosure by way of example.
- 6 is graphs showing an exemplary time series graph decomposed into trend, seasonality, and remainder.
- FIG. 7 shows a bar graph of exemplary light feature values for each of the two components, according to one embodiment of the present disclosure.
- FIG. 8 is an exemplary view illustrating a method of generating output data from a machine learning model according to an embodiment of the present disclosure.
- FIG. 9 shows a flowchart of a method for inferring a noise level of a detection device according to an embodiment of the present disclosure.
- FIG. 10 is a simplified and general schematic diagram of an exemplary computing environment in which embodiments of the present disclosure may be implemented.
- a component may be, but is not limited to, a procedure, processor, object, thread of execution, program, and/or computer running on a processor.
- an application running on a computing device and a computing device may be components.
- One or more components may reside within a processor and/or thread of execution.
- a component can be localized within a single computer.
- a component may be distributed between two or more computers. Also, these components can execute from various computer readable media having various data structures stored thereon.
- Components may be connected, for example, via signals with one or more packets of data (e.g., data and/or signals from one component interacting with another component in a local system, distributed system) to other systems and over a network such as the Internet. data being transmitted) may communicate via local and/or remote processes.
- packets of data e.g., data and/or signals from one component interacting with another component in a local system, distributed system
- a network such as the Internet. data being transmitted
- the computing device of the present disclosure is used to encompass any type of server and/or user terminal.
- the term “or” is intended to mean an inclusive “or” rather than an exclusive “or”. That is, unless otherwise specified or clear from the context, “X employs A or B” is intended to mean one of the natural inclusive substitutions. That is, X uses A; X uses B; Or, if X uses both A and B, "X uses either A or B" may apply to either of these cases. Also, the term “and/or” as used herein should be understood to refer to and include all possible combinations of one or more of the listed related items.
- target analyte includes a variety of substances (eg, biological and non-biological substances), which may refer to the same subject as the term “target analyte”.
- Such target analytes are specifically biological substances, more specifically at least one of nucleic acid molecules (eg, DNA and RNA), proteins, peptides, carbohydrates, lipids, amino acids, biological compounds, hormones, antibodies, antigens, metabolites, and cells.
- nucleic acid molecules eg, DNA and RNA
- Target analytes or target analytes can be amplified in a variety of ways: polymerase chain reaction (PCR), ligase chain reaction (LCR) (U.S. Patent No. 4,683,195 and 4,683,202; PCR Protocols: A Guide to Methods and Applications (Innis et al., eds, 1990), strand displacement amplification (SDA) (Walker, et al. Nucleic Acids Res. 20 (7):1691-6 (1992);Walker PCR Methods Appl 3(1):1-6 (1993)), transcription-mediated amplification (Phyffer, et al., J. Clin. Microbiol.
- PCR polymerase chain reaction
- LCR ligase chain reaction
- SDA strand displacement amplification
- the term "detection device” is intended to encompass a vessel for an amplification reaction as well as a device for an amplification reaction including a temperature controller and/or a detector.
- the amplification reaction performed by the detection device in the present specification means that the amplification reaction composition is amplified using an amplification reaction container and an amplification reaction device.
- An example of the detection device may be a nucleic acid detection device, and an example of an amplification reaction may be PCR.
- a component of a nucleic acid detection device is a component that constitutes the nucleic acid detection device, is included in the nucleic acid detection device, or can be mounted on the nucleic acid detection device, for example, parts or parts of the detection device.
- components of an amplification reaction device in this specification should be understood to include an amplification reaction device, an amplification reaction vessel, a reaction container, and/or a filter module, etc.).
- Equipment for the amplification reaction includes various types of equipment capable of controlling the temperature for the amplification reaction. Examples include CFX (Bio-Rad), iCycler (Bio-Rad), LightCycler (Roche), StepOne (ABI), 7500 (ABI), ViiA7 (ABI), QuantStudio (ABI), AriaMx (Agilent), Eco (Illumina ), etc., but is not limited thereto.
- a vessel for an amplification reaction may include a vessel including a tube, strip, plate, and the like.
- a container for an amplification reaction is a system in which a reaction is performed, and may be a well plate.
- a reaction vessel includes one or more reaction containers.
- a reaction container refers to a unit capable of accommodating a reactant (eg, a reaction solution or reaction mixture).
- a test tube, a PCR tube, a strip tube, and a multi well PCR plate are all examples of reaction vessels including one or more reaction containers.
- An example of a reaction container is a well, and the wells described hereinafter may be used interchangeably with the reaction container.
- a nucleic acid detection device is implemented to perform a nucleic acid amplification reaction and a nucleic acid detection operation on a sample or a sample.
- the nucleic acid detection device may be implemented to perform a nucleic acid detection operation without performing a nucleic acid amplification reaction, or the detection device may be implemented to perform a nucleic acid amplification reaction and not perform a nucleic acid detection operation.
- the description will be made on the premise that the nucleic acid detection device is implemented to also perform a nucleic acid amplification reaction.
- the nucleic acid detection device may include an optical module and a thermal module.
- the optical module includes a light source module and a detection module.
- the light source module supplies an appropriate optical stimulus to the sample, and the detection module detects an optical signal generated from the sample in response thereto.
- the optical signal may be luminescence, phosphorescence, chemiluminescence, fluorescence, polarized fluorescence or other colored signal.
- the optical signal may be an optical signal generated in response to an optical stimulus applied to the sample.
- the light source module includes a light source configured to irradiate light onto a sample and a filter filtering light emitted from the light source.
- the light sources may be light sources that emit light having the same wavelength characteristics. For example, when the light sources emit light in the same wavelength range, it means that the amount of light emitted for each wavelength range is the same.
- the same means not only completely the same, but also substantially the same.
- substantially the same means that, for example, when light emitted from two light sources is irradiated to the same optical marker through the same filter, the same kind of emitted light is generated from the optical marker with the same level of light.
- the fact that the plurality of light sources have substantially the same wavelength characteristics means that the light quantity or wavelength range of the plurality of light sources has a deviation of 20%, 15%, or 10%.
- a filter filters light emitted from a light source.
- Filter means to selectively pass the light of a specific wavelength range of the light emitted from the light source, or not to selectively pass the light of a specific wavelength range.
- the selectively passing means passing 50%, 60%, 70%, 80%, or 90% or more of the amount of light in the target wavelength range.
- the selective non-passing means that 50%, 60%, 70%, 80%, or 90% or more of the light quantity of the target wavelength range is blocked without passing through.
- the filter of the present disclosure selectively passes light in a specific wavelength range among light emitted from a light source so that the sample is irradiated. As a result, only a specific optical label among the optical labels included in the sample generates an optical signal.
- dyes include Cy2 TM , YO-PRO TM -1, YOYO TM -1, Calcein, FITC, FluorX TM , Alexa TM , Rhodamine 110, Oregon Green TM 500, Oregon Green TM 488, RiboGreen TM , Rhodamine Green TM , Rhodamine 123, Magnesium Green TM , Calcium Green TM , TO-PRO TM -1, TOTO1, JOE, BODIPY530/550, Dil, BODIPY TMR, BODIPY558/568, BODIPY564/570, Cy3 TM , Alexa TM 546, TRITC, Magnesium Orange TM , Phycoerythrin R&B, Rhodamine Phalloidin, Calcium Orange TM , Pyronin Y, Rhodamine B, TAMRA, Rhodamine Red TM , Cy3.5
- the dye in the present disclosure may be a fluorescent optical label selected from the group consisting of FAM, HEX, CAL Fluor Red 610, Quasar 670, and Quasar 705.
- a detection module detects the signal.
- the detection module detects fluorescence, which is an optical signal generated from the samples.
- the detection module detects the optical signal by generating an electrical signal according to the intensity of the optical signal.
- the detection module includes a detector configured to detect emission light emitted from the sample and a filter configured to filter emission light emitted from the sample.
- the detector is configured to detect emission light emitted from an optical label included in the sample.
- the detector may detect the amount of light for each wavelength by distinguishing the wavelengths of light or detect the total amount of light regardless of the wavelength.
- the detector may use, for example, a photodiode, a photodiode array, a photo multiplier tube (PMT), a CCD image sensor, a CMOS image sensor, an avalanche photodiode (APD), or the like.
- the detector is formed to detect emission light emitted from the optical label included in the sample.
- the detector may be formed toward the sample so that emission light generated from the sample directly reaches the detector, or toward a reflector or optical fiber so that emission light can reach the detector through a reflector or optical fiber.
- the filter of the detection module is a filter for selectively passing emission light emitted from an optical label included in the sample.
- the detection filter of the present disclosure selectively passes emission light emitted from an optical label to accurately detect a target.
- the thermal module is implemented to perform a nucleic acid amplification reaction.
- the thermal module includes a sample holder in which a sample is accommodated.
- the sample holder includes a plurality of holes, and reaction vessels may be located in the holes.
- the reaction vessels may contain samples, from which fluorescence is emitted.
- the sample holder may be a conductive material. When the sample holder is in contact with the reaction vessels, heat can be transferred from the sample holder to the reaction vessels.
- the sample holder may be made of metal such as aluminum, gold, silver, nickel or copper.
- a separate component other than the sample holder may directly supply energy to the reaction vessel to control the temperature of the samples in the reaction vessel.
- the sample holder may be configured to receive the reaction vessels but not to transfer heat to the reaction vessels.
- the thermal block includes a plurality of holes, and reaction vessels may be located in the holes.
- the heating plate is in the form of contacting a thin metal plate to accommodate the sample. It can be operated by passing an electric current through a thin metal to heat the plate.
- sample holder is a receptacle capable of receiving one or more chips or cartridges.
- a cartridge is a fluid cartridge that includes a flow channel.
- the thermal module may additionally include a heat generating element for heating or cooling the sample holder, a heat sink, and a heat sink.
- the thermal module is used for a PCR-based nucleic acid amplification reaction. More specifically, the thermal module may perform a denaturing step, an annealing step, and an extension (or amplification) step to amplify DNA (deoxyribonucleic acid) having a specific nucleotide sequence.
- the denaturation step is a step of separating double-stranded DNA into single-stranded DNA by heating a solution containing a sample and a reagent containing double-stranded DNA as template nucleic acid to a specific temperature, for example, about 95°C. .
- an oligonucleotide primer having a nucleotide sequence complementary to the nucleotide sequence of the nucleic acid to be amplified is provided, and the separated single-stranded DNA is heated to a specific melting temperature (Tm), for example, 60 ° C.
- Tm melting temperature
- the extension step is a step in which double-stranded DNA is formed based on the primers of the partial DNA-primer complex by a DNA polymerase by maintaining the solution at a specific temperature, for example, 72° C. after the annealing step.
- the thermal module can exponentially amplify DNA having the specific nucleotide sequence by repeating the above three steps, for example, 10 to 50 times.
- the thermal module may perform the annealing step and the extension step simultaneously.
- the thermo module may complete one cycle (circulation) by performing two steps consisting of a denaturation step and an annealing/extension step.
- the thermal module is used for an isothermal amplification reaction. More specifically, the thermal module may perform a step of maintaining a selected temperature in order to amplify a specific nucleic acid sequence. For example, a thermal module can be maintained at a temperature selected from 30° C. to 70° C. and allow an isothermal amplification reaction to be performed.
- Such a nucleic acid detection device or detection device includes various conventionally known devices as long as the temperature can be controlled for the amplification reaction. Examples include CFX (Bio-Rad), iCycler (Bio-Rad), LightCycler (Roche), StepOne (ABI), 7500 (ABI), ViiA7 (ABI), QuantStudio (ABI), AriaMx (Agilent), Eco (Illumina ), etc., but is not limited thereto.
- a standard nucleic acid detection device may be designated in advance by a user, and may be a standard device for calibrating other nucleic acid detection devices.
- the calibration process described later may include tests for calibrating another nucleic acid detection device using a standard nucleic acid detection device.
- test result values output from a standard nucleic acid detection device may be used to calibrate other nucleic acid detection devices.
- a conventional method for testing the performance of a nucleic acid detection device according to some embodiments of the present disclosure will be described with reference to FIG. 1 .
- 1 is an exemplary view showing a calibration and test process and time required for each step for the release of a nucleic acid detection device.
- a nucleic acid detection device (PCR device) is worn (210), and a test for calibrating an optic of the nucleic acid detection device may include at least one optic calibration step.
- a test for calibrating an optic of a nucleic acid detection device may be performed in a hardware (HW) calibration step 220 and a dye calibration step 230 as shown in FIG. 1 .
- HW hardware
- a noise test (240) is performed on the optically calibrated nucleic acid detection device through a test for optic calibration, and the nucleic acid detection device determined to pass in the noise test (240) is finally shipped (250).
- a nucleic acid detection device determined to fail in the noise test 240 may be subjected to the noise test 240 again or may be determined not to be released from the factory.
- a noise test includes a test to confirm that a nucleic acid detection device can be used to detect a target analyte.
- the noise test is performed using at least one of a Negative Control composition (NC) or a Positive Control composition (PC).
- step 210 of FIG. 1 is described as an example of wearing a PCR device, the nucleic acid detection device in the present disclosure should not be construed as being limited to the PCR device.
- optical calibration can be represented as any type of test for calibrating the optics of a nucleic acid detection device.
- optical calibration may include any type of test performed prior to testing the noise of the nucleic acid detection device.
- optical calibration may include a test performed in step HW Calibration 220 shown in FIG. 1 .
- the level of noise of the present disclosure described later may represent any type of test for noise of a nucleic acid detection device.
- noise level inference can be performed in the Noise Test 240 step shown in 1.
- the optical calibration of the present disclosure may be characterized by adjusting the intensity of light irradiated onto the sample from the nucleic acid detection device.
- the optical calibration of the present disclosure may include a test of measuring an RFU value by radiating light of a predetermined wavelength to at least one component of a nucleic acid detection device or a standard nucleic acid detection device for a predetermined cycle.
- the nucleic acid detection device may be a detection device different from the standard nucleic acid detection device.
- At least one of the plurality of wells corresponding to a component of the nucleic acid detection device may be a well containing a dye, and at least another well may be provided as a well without a dye.
- a test of including such wells in a nucleic acid detection device for calibration and measuring an RFU value from the wells by irradiating light of a predetermined wavelength may be included in optical calibration.
- Optical calibration of the present disclosure may be performed one or more times for one nucleic acid detection device, or may be performed one or more times for a standard nucleic acid detection device.
- the intensity of the irradiated light may be adjusted based on a comparison result between the optical data and a predetermined reference value.
- At least one component of the nucleic acid detection device and the standard nucleic acid detection device may be composed of the same component.
- optical calibration may be performed on wells that are components of a standard nucleic acid detection device, and then optical calibration may be performed using wells of a previous standard nucleic acid detection device in the nucleic acid detection device.
- Raw data indicating RFU values for each of the wells may be obtained by performing optical calibration in which light of a predetermined wavelength is irradiated for a predetermined cycle through a standard nucleic acid detection device for these 10 wells.
- optical calibration is performed in which light of a predetermined wavelength is irradiated for a predetermined cycle through a nucleic acid detection apparatus for optical calibration to the 10 wells used in the standard nucleic acid detection apparatus thereafter, RFU values for each of the wells are performed
- Other raw data may be obtained.
- the optics of the detection device may be calibrated by comparing the obtained raw data of the standard nucleic acid detection device with other raw data of the nucleic acid detection device.
- the optical calibration may be characterized in that the light quantity measurement sensitivity of the detection device is adjusted based on a comparison result between the optical data and a predetermined reference value.
- an optical measurement value and an optical feature obtained by mathematically processing the optical measurement value are extracted from the optical data, and the optical measurement value and the optical feature are input to the machine learning model to infer the noise level. can do.
- optical calibration may be first performed on components of the nucleic acid detection device, and then optical calibration may be performed by adding components of the previous nucleic acid detection device to the standard nucleic acid detection device.
- the optical calibration of the present disclosure may include a test for comparing an RFU value measured by a nucleic acid detection device with an RFU value measured by a standard nucleic acid detection device different from the nucleic acid detection device.
- optical calibration of the nucleic acid detection device in the present disclosure may be calibrating the nucleic acid detection device with a standard nucleic acid detection device.
- optical calibration may be performed on the nucleic acid detection device through the aforementioned optical calibration.
- the nucleic acid detection device is calibrated based on the raw data according to the optical calibration of the standard nucleic acid detection device, so that the optical calibration result is the same as other raw data of the optical calibration of the standard nucleic acid detection device or higher than a predetermined similar standard.
- the optical calibration of the present disclosure may further include a test process of comparing measured RFU values of the standard nucleic acid detection device and RFU values of the nucleic acid detection device.
- raw data is data that can be obtained from a test, and may be data representing test results for each of the components used in the test of the present disclosure.
- the raw data of the present disclosure may be one of optical calibration measurement data, and may be data indicating an RFU value for each well, which is a component on which optical calibration is performed.
- the raw data may be result data of a test performed on each of the wells.
- the raw data may include RFU values measured for each of the wells during a predetermined cycle.
- the raw data of the present disclosure may include order information of wells, which are components, and information indicating whether a dye is included in wells, which are components.
- the raw data of the present disclosure may include detection channel information to selectively detect and detect light in a specific wavelength region.
- the raw data of the present disclosure may include a signal value.
- the term "signal value" refers to a value obtained by digitizing the level of a signal (eg, signal intensity) actually measured in a cycle of a signal-generating reaction, in particular, an amplification reaction, according to a certain scale, or a modified value thereof.
- the modified value may include a mathematically processed signal value of the actually measured signal value. Examples of mathematically processed signal values of actually measured signal values (i.e., signal values of raw data) are values obtained by adding, multiplying, subtracting, or dividing the measured signal value by a selected constant, logarithmic values, or change values ( value of change).
- the signal value means a value obtained by absolutely or relatively quantifying the magnitude of a signal initially detected by a detector at a corresponding cycle number.
- the signal value may include a change value considering a relationship with another cycle, it is preferable to use a signal value excluding the change value when calculating the first change value in the method of the present disclosure.
- the signal value used in the first step of the method of the present disclosure compared with the first change value and the second order change value, is referred to as "zero order signal value", "raw signal value” or "original signal value”. Also called “value”.
- the unit of the signal value may vary depending on the type of signal generation reaction used. For example, when a signal value is obtained in each cycle by a real-time PCR amplification reaction, the signal value may be a value represented by RFU (Relative Fluorescence Unit).
- the raw data of the present disclosure may include an optical feature obtained by mathematically processing the signal value.
- a cycle refers to a unit of change of a condition in a plurality of measurements accompanied by a change of a certain condition.
- the change in the constant condition means, for example, an increase or decrease in temperature, reaction time, reaction number, concentration, pH, number of copies of a measurement object (for example, nucleic acid), and the like.
- cycles can be time or process cycles, unit operation cycles and reproductive cycles.
- the term cycle may mean one unit of the repetition.
- one cycle means a reaction including denaturation of nucleic acid, hybridization or annealing of nucleic acid and primer, and extension of primer.
- the change in constant conditions is an increase in the number of repetitions of the reaction, and the repeating unit of the reaction including the series of steps is set as one cycle. That is, in the cycle of the present disclosure, for example, the test may be performed on the first well three times, which is a predetermined number of times in the first cycle, which is one cycle. For another example, the test may be repeatedly performed on the first well as many as 10 times, which is a predetermined number of times in the first cycle, which is one cycle.
- cycle period means a specific cycle area consisting of a predetermined number of consecutive cycles in a data set.
- Each of the plurality of cycle sections has a start cycle and an end cycle.
- the plurality of cycle sections may be cycle sections of the same size composed of the same number of cycles, may be cycle sections of different sizes composed of different numbers of cycles, and cycle sections of the same size and cycle sections of different sizes may be mixed. It may have been For example, the entire data set can be divided into a plurality of equally sized cycle sections consisting of 8 cycles. Alternatively, the baseline region of the data set may be divided into cycle sections composed of 10 consecutive cycles, and the exponential phase region may be divided into cycle sections composed of 6 consecutive cycles.
- Inferring the level of noise in the present disclosure is a test for confirming the performance of a nucleic acid detection device, and whether the nucleic acid detection device has performance suitable for performing a nucleic acid detection reaction or reaches a suitable level. there is.
- inferring the level of noise is to measure whether or not a noise signal is output from the nucleic acid detection device itself when performing a nucleic acid detection reaction on an arbitrary test subject through the nucleic acid detection device or to measure the magnitude of the output noise signal. It may be a test for at least one of
- inferring the level of noise may be a noise test associated with at least one of a Negative Control (NC) reaction or a Positive Control (PC) reaction for the nucleic acid detection device.
- the Negative Control composition and the Positive Control composition may be control groups used in experiments according to general scientific methodologies.
- the Negative Control composition is a negative control, and may be a sample for which no test result is predicted. That is, a sample expected to have a test result different from that of the test group, which is the test subject, may be a negative control group.
- a reaction mixture is a reaction mixture containing oligos and enzymes.
- NC does not include the target analyte in the reaction mixture.
- the Positive Control composition is a positive control and may be a sample for which a test result is predicted. That is, a sample expected to have the same test result as the test result of the experimental group may be a positive control group.
- the PC includes the target analyte in the reaction mixture.
- the performance of the nucleic acid detection device may be any type of indicator indicating whether the nucleic acid detection device is suitable for performing PCR.
- the performance of the nucleic acid detection device of the present disclosure may be determined based on whether the nucleic acid detection device itself does not output a noise signal or the size of the noise signal. The presence or absence of a noise signal output from such a nucleic acid detection device itself or a quantitative value of the noise signal can be measured through the above-described noise evaluation.
- noise refers to an unwanted, non-analyte related signal that occurs regardless of the presence or absence of a target analyte.
- noise is electrical-noise recorded as a signal generated by the measuring equipment itself, regardless of whether a signaling reaction is executed or not; and noise in the baseline region in the nucleic acid amplification curve.
- the term noise has a different meaning than an abnormal signal that includes a sudden increase or decrease in the signal.
- the noise of the present disclosure may refer to a signal generated by a nucleic acid detection device itself and not related to PCR analysis. Afterwards, when the user performs PCR analysis using a nucleic acid detection device that outputs a noise signal or outputs a large noise signal, an erroneous nucleic acid amplification reaction analysis result may be provided to the user. In order to prevent this, in the present disclosure, the noise level of the nucleic acid detection device itself may be determined before the nucleic acid detection device is shipped from the factory through inference of the noise level described later.
- raw data may be raw data obtained from optical calibration.
- the raw data may be raw data for each of the components obtained through optical calibration performed on one nucleic acid detection device.
- raw data may be used to predict the level of noise in order to predict the performance of the nucleic acid detection device in the present disclosure.
- optical data having information about light may be obtained.
- the optical data may include an optical measurement value obtained by irradiating light of a predetermined wavelength during a predetermined cycle and an optical feature obtained by mathematically processing the optical measurement value.
- inference data may be input to the machine learning model to infer the noise level, where the inference data may be generated using raw data.
- Inferring the noise level at this time means inferring the noise level generated by the (nucleic acid) detection device by comparing the level of noise generated by the (nucleic acid) detection device with a predetermined value or level. For example, when the noise level is greater than or equal to a predetermined value or level, the corresponding detection device is a pass detection device, and when it is less than or equal to, the corresponding detection device is a fail detection device.
- Raw data of the present disclosure is first described with reference to FIG. 5 .
- 5 is an exemplary view illustrating raw data according to some embodiments of the present disclosure by way of example.
- raw data 400 may include first raw data 401 and second raw data 402 . Since the first raw data 401 and the second raw data 402 include one or more parameters, the raw data 400 may also include one or more parameters.
- the parameters included in the raw data 400 include a first parameter 410 representing a predetermined wavelength, a second parameter 420 representing a component well, and a dye in a component, as shown in FIG.
- a third parameter 430 indicating whether or not included, a fourth parameter 440 indicating cycles, a fifth parameter 450 indicating an average of RFU values measured in one cycle, an RFU value measured in one cycle
- a sixth parameter 460 indicating the minimum value of RFU values measured in one cycle
- a seventh parameter 470 indicating the maximum value of the RFU value measured in one cycle
- an eighth parameter indicating RFU value measurements n times preferably three times in one cycle ( 435) may be included.
- the raw data 400 of the present disclosure may further include other parameters indicating time, channel, and the like.
- variable data may be data representing values corresponding to the aforementioned features. That is, the variable data may be data including values corresponding to features. Accordingly, the raw data may include variable data corresponding to each of included features.
- variable data of the light feature may indicate a name of the light feature and a value corresponding to the light feature.
- raw data 400 includes a fifth parameter 450 representing the average of the corresponding RFU values when RFU measurements are repeated n times, preferably 3 times in one cycle.
- the raw data 400 may include one or more first variable data 451 representing average values when RFU measurements are repeated n times, preferably 3 times, in one cycle corresponding to the fifth parameter 450 there is.
- an optical feature may be a parameter related to noise of a measurement device among parameters of raw data described above.
- a light feature may be a parameter or value that can be calculated from RFU values. That is, the optical feature may be a parameter or value obtained by mathematically processing an optical measurement value, which is an RFU value.
- the optical feature may be a parameter highly related to the performance of the nucleic acid detection device or a parameter highly related to noise generated by the nucleic acid detection device itself.
- parameters highly related to noise generation for example, the variance of RFU values, the standard deviation of RFU values, the average of RFU values, the trend calculated by signal decomposition of the time series graph of RFU values, and seasonality ( seasonal and residual or variance of residuals calculated from RFU values based on a first order simple linear regression line.
- the aforementioned trend, seasonality, and remainder may be data elements used to describe time-series patterns in time-series data analysis in statistics.
- trend, seasonality, and remainder can be expressed as a time series graph, and trend can be expressed as a pattern of data fluctuations that increases or decreases over a long period of time.
- seasonality may be expressed as a pattern that is displayed according to a predetermined period of time.
- the remainder may be expressed as a pattern excluding the aforementioned trend and seasonality, and may be a random element.
- 6 is graphs showing an exemplary time series graph decomposed into trend, seasonality, and remainder.
- time-series data such as the aforementioned raw data
- it may be displayed as a time-series graph 500 .
- the time series graph 500 is time series decomposed, the trend of the time series graph 500 can be represented by a first graph 510, the seasonality can be represented by a second graph 520, and the rest can be represented by a third graph. (530). That is, when the first graph 530, the second graph 520, and the third graph 530 are synthesized again, the original time series graph 500 can be expressed.
- Figure 6 graphs only show examples of graphs, trends, seasonality, and remainder of time series data, and should not be construed as limiting the time series data, trend, seasonality, and remainder of the present disclosure due to FIG.
- the optical feature of the present disclosure may include a first optical feature representing a variance or standard deviation of RFU values measured for a component of a nucleic acid detection device.
- the first light feature may represent a variance or standard deviation of RFU values measured at each of predetermined cycles for raw data. That is, the first light feature may represent a variance or standard deviation of RFU values measured at each of the predetermined cycles of testing performed on one component of the nucleic acid detection device.
- the first raw data of the first well is the average and maximum values of RFU values measured in each of the first to 45th cycles and a minimum value.
- the average of the RFU values measured in the first cycle may be 2000, the maximum value may be 3000, and the minimum value may be 1000.
- the average of the RFU values measured in the second cycle may be 2500, the maximum value may be 4000, and the minimum value may be 1000.
- the average, maximum and minimum values of RFU values mean the average, maximum and minimum values of signal values measured n times, preferably 3 times, within one cycle. This is because the RFU can be measured more than 10 times in each cycle, that is, within one cycle.
- the first raw data may indicate an average, a maximum value, and a minimum value of RFU values measured in each of the 1st to 45th cycles.
- the first light feature for the first raw data may be a variance or standard deviation calculated for each of the above-described first to forty-fifth cycles. Specifically, the variance or standard deviation of each of the cycles may be calculated based on the average, maximum value, and minimum value of the RFU values measured in each of the 1st to 45th cycles, where 45 first light features may be calculated. there is.
- the light feature of the present disclosure may include a second light feature representing an average of RFU values for one component of the nucleic acid detection device.
- the second light feature may represent an average of RFU values of each of predetermined cycles for raw data.
- the calibration process may be performed for predetermined 10 cycles for each well.
- the RFU values may be measured by performing the test a predetermined number of times in one of the predetermined 10 cycles.
- An average RFU value of each of the cycles may be calculated based on the RFU values of each of the 1st to 10th cycles. That is, a first average of the RFU values measured in the first cycle may be calculated, and a second average of the RFU values measured in the second cycle may be calculated.
- the average calculated in this way is the second light feature, and the second light feature may be one of parameters included in the raw data.
- 10 second light features may also be calculated corresponding to each of the 10 cycles.
- the optical feature of the present disclosure includes a third optical feature representing a trend calculated by time-series decomposition of raw data, a fourth optical feature representing seasonality calculated by time-series decomposition of a raw data set, and a raw data set. It may also include a fifth light feature representing a remainder other than the trend and seasonality calculated by time-series decomposition of .
- raw data representing RFU values measured at predetermined cycles may be time series data, and trend, seasonality, and remainder may be calculated by decomposing such raw data.
- the mean and variance of the trend calculated here may be included in the third light feature
- the mean and variance of the seasonality may be included in the fourth light feature
- the average and variance of the others may be included in the fifth light feature.
- optical feature of the present disclosure may include a sixth optical feature including a variance of a residual calculated by applying a linear regression line to optical data.
- the variance of the residuals is calculated through a general calculation method used to calculate the variance of the residuals in regression analysis.
- the optical feature of the present disclosure may correspond to one component and one raw data, or may be a parameter already included in the raw data.
- an average value of RFU values for one cycle may already be included in one row data.
- a parameter representing an average value included in the raw data may be extracted as the first light feature.
- the raw data 400 may include one or more fifth parameters 450 indicating an average of RFU values corresponding to each cycle. Also, the raw data 400 may include one or more first variable data 451 indicating average values for each cycle corresponding to the fifth parameter 450 .
- the fifth parameter 450 may be identified as the first light feature, and the first variable data 451 may be variable data corresponding to the first light feature.
- Parameters and variable data in FIG. 5 described above are only examples, and parameters or variable data included in the raw data set of the present disclosure should not be construed as being limited due to the above examples and FIG. 5 .
- inference data is data input to a machine learning model to predict the level of noise, and may include data highly related to the performance of the nucleic acid detection device. Specifically, at least one parameter among parameters included in the raw data may be selected as the light feature. In addition, at least one of the light features may be selected as an inference feature based on a predetermined p-value to be generated as inference data of the present disclosure. Accordingly, inference data of the present disclosure may be data including one or more inference features selected based on a predetermined p-value.
- one inference data may include light measurement values selected from raw data, one or more light features, and variable data corresponding thereto, wherein the inference feature included in the inference data is Light measurements and light features may be further selected based on the determined p-value.
- the predetermined p-value of the present disclosure is described in detail later.
- one inference data may correspond to one component, or one inference data may correspond to one nucleic acid detection device including a plurality of components.
- Inference data that is not specifically specified throughout the present specification of the present disclosure refers to inference data for one nucleic acid detection device.
- output data may be data representing a result of evaluation on inferred noise.
- the output data of the present disclosure is output through a machine learning model, and may include a result of predicting whether the nucleic acid detection device will pass a level for noise following optical calibration.
- the output data may include a result of predicting whether to omit a test for noise following optical calibration for the nucleic acid detection device.
- At least one of raw data and inference data may be input to a machine learning model to infer a noise level.
- the computing device of the present disclosure performing the method of inferring the noise level of the nucleic acid detection device may input the raw data itself into the machine learning model.
- the computing device of the present disclosure may preprocess raw data to generate inference data, and input the generated inference data to a machine learning model.
- a p-value is a significant probability of statistical hypothesis testing used in statistics, and is generally used to prove the reliability of experimental data.
- the p-value of experimental data is a statistical probability of how many values of the current experimental data will be observed under the assumption that a certain hypothesis is correct.
- a p-value for an experimental hypothesis established based on experimental result data is obtained, and the experimental hypothesis is verified according to whether it is higher than a predetermined standard.
- the predetermined criterion of the p-value can be determined based on the confidence interval of the experimental data, which is the population, but is generally set to 5%, that is, 0.05.
- the p-value of the present disclosure described later is also set to 0.05, which is a general standard, but the p-value of the present disclosure is not limited to 0.05.
- the machine learning model of the present disclosure may be a model for predicting an evaluation result for noise based on a measurement result of a calibration process.
- the machine learning model of the present disclosure may be a model for predicting pass or fail of a noise level based on at least a part of optical data having information on light among raw data resulting from optical calibration.
- passing the noise level is equivalent to passing a predetermined level or value, and may mean that the nucleic acid detection device has excellent performance and is ready for shipment.
- failure of the noise level is the same as the noise level not passing a predetermined level or value, and may mean that the nucleic acid detection device has poor performance and is not in a state available for shipment. Inferring the evaluation result of the nucleic acid detection device thereafter can be regarded as inferring the noise level of the nucleic acid detection device.
- the machine learning model of the present disclosure may be a model that outputs output data using a support vector machine (SVM) or a partial least squares method.
- SVM support vector machine
- the noise level inference unit 124 includes a machine learning model.
- the machine learning model of the present disclosure may include one or more at least three classifiers corresponding to optical measurement values and a plurality of types of optical features. Specifically, one or more classifiers corresponding to light measurement values and variable data of each of the optical features may be included. In addition, the machine learning model of the present disclosure may include a number of classifiers corresponding to the number of predetermined combinations of inference features. Specifically, one or more classifiers corresponding to variable data of each of the inference features may be included.
- Each of the at least three classifiers may be implemented to receive one optical measurement value and an optical feature, or may be implemented to receive at least two optical features.
- Each of the at least three classifiers may output one of pass and fail as a preliminary noise level of the detection device when corresponding optical measurement values and optical features are input.
- the present disclosure may use a disjoint clustering algorithm to predict results for evaluation against noise.
- the computing device may generate an output predicting a level of noise based on input inference data or a raw data set using K-means clustering.
- each group in K-means Clustering can have one centroid, and the input learning data can be assigned to the cluster belonging to the nearest centroid.
- K the number of clusters, is specified, K-means clustering can be used in a learning or iterative manner using K as a hyperparameter.
- K-means clustering may be performed based on an expectation-maximization (EM) algorithm, for example.
- the computing device may repeat a method of randomly determining a center of a cluster, performing clustering based on the determined center, and calculating an average value of data included in the clustered cluster.
- the computing device may perform clustering on the training data set by continuing the above-described iterations until a situation in which a result does not change even if additional iterations are performed.
- a neural network may consist of a set of interconnected computational units, which may generally be referred to as nodes. These nodes may also be referred to as neurons.
- a neural network includes one or more nodes. Nodes (or neurons) constituting neural networks may be interconnected by one or more links.
- one or more nodes connected through a link may form a relative relationship of an input node and an output node.
- the concept of an input node and an output node is relative, and any node in an output node relationship with one node may have an input node relationship with another node, and vice versa.
- an input node to output node relationship may be created around a link. More than one output node can be connected to one input node through a link, and vice versa.
- the value of data of the output node may be determined based on data input to the input node.
- a link interconnecting an input node and an output node may have a weight.
- the weight may be variable, and may be changed by a user or an algorithm in order to perform a function desired by the neural network. For example, when one or more input nodes are interconnected by respective links to one output node, the output node is set to a link corresponding to values input to input nodes connected to the output node and respective input nodes.
- An output node value may be determined based on the weight.
- one or more nodes are interconnected through one or more links to form an input node and output node relationship in the neural network.
- Characteristics of the neural network may be determined according to the number of nodes and links in the neural network, an association between the nodes and links, and a weight value assigned to each link. For example, when there are two neural networks having the same number of nodes and links and different weight values of the links, the two neural networks may be recognized as different from each other.
- a neural network may be composed of a set of one or more nodes.
- a subset of nodes constituting a neural network may constitute a layer.
- Some of the nodes constituting the neural network may form one layer based on distances from the first input node.
- a set of nodes having a distance of n from the first input node may constitute n layers.
- the distance from the first input node may be defined by the minimum number of links that must be passed through to reach the corresponding node from the first input node.
- the definition of such a layer is arbitrary for explanation, and the order of a layer in a neural network may be defined in a method different from the above.
- a layer of nodes may be defined by a distance from a final output node.
- An initial input node may refer to one or more nodes to which data is directly input without going through a link in relation to other nodes among nodes in the neural network.
- it may mean nodes that do not have other input nodes connected by a link.
- the final output node may mean one or more nodes that do not have an output node in relation to other nodes among nodes in the neural network.
- the hidden node may refer to nodes constituting the neural network other than the first input node and the last output node.
- the number of nodes in the input layer may be the same as the number of nodes in the output layer, and the number of nodes decreases and then increases again as the number of nodes progresses from the input layer to the hidden layer.
- the neural network according to another embodiment of the present disclosure may be a neural network in which the number of nodes of the input layer may be less than the number of nodes of the output layer and the number of nodes decreases as the number of nodes increases from the input layer to the hidden layer. there is.
- the neural network according to another embodiment of the present disclosure is a neural network in which the number of nodes in the input layer may be greater than the number of nodes in the output layer, and the number of nodes increases as the number of nodes increases from the input layer to the hidden layer.
- a neural network according to another embodiment of the present disclosure may be a neural network in the form of a combination of the aforementioned neural networks.
- a deep neural network may refer to a neural network including a plurality of hidden layers in addition to an input layer and an output layer.
- Deep neural networks can reveal latent structures in data. In other words, it can identify the latent structure of a photo, text, video, sound, or music (e.g., what objects are in the photo, what the content and emotion of the text are, what the content and emotion of the audio are, etc.).
- Deep neural networks include convolutional neural networks (CNNs), recurrent neural networks (RNNs), auto encoders, generative adversarial networks (GANs), and restricted boltzmann machines (RBMs).
- Deep neural network a deep belief network (DBN), a Q network, a U network, a Siamese network, a Generative Adversarial Network (GAN), and the like.
- DBN deep belief network
- Q Q network
- U U
- Siamese Siamese network
- GAN Generative Adversarial Network
- the network function may include an autoencoder.
- An autoencoder may be a type of artificial neural network for outputting output data similar to input data.
- An auto-encoder may include at least one hidden layer, and an odd number of hidden layers may be disposed between input and output layers. The number of nodes of each layer may be reduced from the number of nodes of the input layer to an intermediate layer called the bottleneck layer (encoding), and then expanded symmetrically with the reduction from the bottleneck layer to the output layer (symmetrical to the input layer).
- Autoencoders can perform non-linear dimensionality reduction. The number of input layers and output layers may correspond to dimensions after preprocessing of input data.
- the number of hidden layer nodes included in the encoder may decrease as the distance from the input layer increases. If the number of nodes in the bottleneck layer (the layer with the fewest nodes located between the encoder and decoder) is too small, a sufficient amount of information may not be conveyed, so more than a certain number (e.g., more than half of the input layer, etc.) ) may be maintained.
- the neural network and the machine learning model may be trained using at least one of supervised learning, unsupervised learning, semi supervised learning, and reinforcement learning.
- Learning of the neural network and the machine learning model may be a process of applying knowledge for the neural network to perform a specific operation to the neural network or the machine learning model.
- Contents of learning and learning data of a neural network described later may also refer to learning and learning data of a machine learning model of the present disclosure.
- a neural network can be trained in a way that minimizes output errors.
- the learning data is repeatedly input into the neural network, the output of the neural network for the training data and the error of the target are calculated, and the error of the neural network is transferred from the output layer of the neural network to the input layer in the direction of reducing the error. It is a process of updating the weight of each node of the neural network by backpropagating in the same direction.
- the learning data in which the correct answer is labeled is used for each learning data (ie, the labeled learning data), and in the case of comparative teacher learning, the correct answer may not be labeled in each learning data.
- learning data in the case of teacher learning regarding data classification may be data in which each learning data is labeled with a category.
- Labeled training data is input to a neural network, and an error may be calculated by comparing an output (category) of the neural network and a label of the training data.
- an error may be calculated by comparing input learning data with a neural network output. The calculated error is back-propagated in a reverse direction (ie, from the output layer to the input layer) in the neural network, and the connection weight of each node of each layer of the neural network may be updated according to the back-propagation. The amount of change in the connection weight of each updated node may be determined according to a learning rate.
- the neural network's computation of input data and backpropagation of errors can constitute a learning cycle (epoch).
- the learning rate may be applied differently according to the number of iterations of the learning cycle of the neural network. For example, a high learning rate may be used in the early stage of neural network training to increase efficiency by allowing the neural network to quickly obtain a certain level of performance, and a low learning rate may be used in the late stage to increase accuracy.
- training data can be a subset of real data (ie, data to be processed using the trained neural network), and therefore, errors for training data are reduced, but errors for real data are reduced. There may be incremental learning cycles.
- Overfitting is a phenomenon in which errors for actual data increase due to excessive learning on training data. For example, a phenomenon in which a neural network that has learned a cat by showing a yellow cat does not recognize that it is a cat when it sees a cat other than yellow may be a type of overfitting. Overfitting can act as a cause of increasing the error of machine learning algorithms.
- Various optimization methods can be used to prevent such overfitting. To prevent overfitting, methods such as increasing the training data, regularization, inactivating some nodes in the network during learning, and using a batch normalization layer should be applied. can
- FIG. 2 is a block diagram of a computing device for determining a noise level of a nucleic acid detection device according to an embodiment of the present disclosure.
- the configuration of the computing device 100 shown in FIG. 2 is only a simplified example.
- the computing device 100 may include other components for performing a computing environment of the computing device 100, and only some of the disclosed components may constitute the computing device 100.
- the computing device 100 of the present disclosure may include an input unit 110 , a processor 120 , and a memory 130 .
- the processor 120 may include one or more cores, and includes a central processing unit (CPU), a general purpose graphics processing unit (GPGPU), and a tensor processing unit (TPU) of the computing device. unit) may include a processor for data analysis.
- the processor 120 may read a computer program stored in the memory 130 and process data for machine learning according to an embodiment of the present disclosure. For example, the processor 120 may perform steps described in FIGS. 8 and 9 of the present disclosure.
- At least one of the CPU, GPGPU, and TPU of the processor 120 may process learning of a network function or machine learning model.
- the CPU and GPGPU together can process learning of network functions or machine learning models, and data classification using network functions or machine learning models.
- processors of a plurality of computing devices may be used together to process learning of a network function or machine learning model and data classification using the network function or machine learning model.
- a computer program executed in a computing device may be a CPU, GPGPU or TPU executable program.
- the memory 130 may store any type of information generated or determined by the processor 120 and any type of information received by the input unit 110 .
- the memory 130 is a flash memory type, a hard disk type, a multimedia card micro type, or a card type memory (eg, SD or XD memory, etc.), RAM (Random Access Memory, RAM), SRAM (Static Random Access Memory), ROM (Read-Only Memory, ROM), EEPROM (Electrically Erasable Programmable Read-Only Memory), PROM (Programmable Read-Only Memory) -Only Memory), a magnetic memory, a magnetic disk, and an optical disk may include at least one type of storage medium.
- the computing device 100 may operate in relation to a web storage that performs a storage function of the memory 130 on the Internet.
- the above description of the memory is only an example, and the present disclosure is not limited thereto.
- the input unit 110 may be configured regardless of its communication mode, such as wired and wireless, and may be configured with various communication networks such as a personal area network (PAN) and a wide area network (WAN). there is.
- the network may be the known World Wide Web (WWW), or may use a wireless transmission technology used for short-range communication, such as Infrared Data Association (IrDA) or Bluetooth.
- IrDA Infrared Data Association
- FIG. 3 is a configuration diagram of a processor 120 for inferring a noise level of a nucleic acid detection apparatus according to an embodiment of the present disclosure.
- the processor 120 includes an optical measurement value extraction unit 121 , an optical feature extraction unit 122 and a noise level inference unit 124 .
- the optical measurement value extractor 121 extracts optical measurement values from optical data.
- the optical feature extraction unit 122 extracts an optical feature obtained by mathematically processing the optical measurement value from the optical data.
- the noise level inference unit 124 infers the level of noise generated by the nucleic acid detection device by using a pre-learned machine learning model that takes the light measurement data set as an input.
- the processor 120 of the present disclosure may obtain raw data generated from optics calibration for calibrating optics of a nucleic acid detection device.
- the optical measurement value extractor 121 may extract an RFU value, which is an optical measurement value, from optical data having light information among raw data.
- the optical feature extractor 122 may extract at least one parameter related to noise of the nucleic acid detection device from the raw data. Specifically, one or more parameters that can be used to predict the level of noise can be extracted from raw data. Parameters extracted in this way may be selected as the light features described above.
- the optical feature extractor 122 of the present disclosure may generate inference data to be used to predict the level of noise based on at least one optical feature. Specifically, the optical feature extractor 122 may obtain the extracted optical features and generate the aforementioned inference data based on the optical features. In one example, inference data may be generated by applying statistical reference values to light features. An example of a statistical reference value is the p-value.
- the noise evaluation result extractor 124 of the present disclosure may acquire output data predicting a noise level by inputting inference data or a raw data set to a machine learning model.
- the processor 120 may obtain raw data generated from optical calibration for optics calibration of the nucleic acid detection device. More specifically, the processor 120 may obtain a raw data set including raw data related to an RFU obtained by radiating light of a predetermined wavelength to at least one component of the nucleic acid detection device for a predetermined cycle.
- the processor 120 extracts at least one parameter related to the noise of the nucleic acid detection device from raw data through the optical measurement value extractor 121 and the optical feature extractor 122 to obtain It can be determined as an optical feature.
- An optical feature of the present disclosure may include at least one of a first, second, third, fourth, fifth, or sixth light feature, as described above.
- the light feature of the present disclosure may further include a seventh light feature representing an average of standard deviations calculated for each of the predetermined cycles of RFU values for a component of the nucleic acid detection device.
- the light feature of the present disclosure may further include an eighth light feature representing the total average of RFU values for all predetermined cycles for a component of the nucleic acid detection device.
- the average standard deviation over the total cycles may be calculated by dividing 20 by the sum of the standard deviations calculated for each of the 20 cycles in the raw data.
- the average of the standard deviations over the total cycles may be included in the seventh light feature.
- the processor 120 through the optical feature extraction unit 122, the processor 120, through the optical feature extraction unit 122, the processor 120, through the optical feature extraction unit 122,
- the noise level prediction may be a test related to the noise of the nucleic acid detection device, and the optical calibration and noise level prediction may be different tests.
- the processor 120 may select, as an inference feature, an optical feature whose relevance to the performance of the nucleic acid detection apparatus is greater than or equal to a critical value from among the extracted at least one parameter based on a predetermined p-value.
- the processor 120 of the present disclosure may generate inference data based on the selected inference feature and variable data corresponding thereto.
- the processor 120 of the present disclosure may generate inference data based on variable data of an optical feature selected as an inference feature through the inference data generation module 160 .
- the threshold is a reference value related to the p-value, and the selection of at least some of the light features as inference features based on the p-value will be described with reference to FIG. 7 .
- FIG. 7 shows a bar graph of exemplary light feature values for each of the two components, according to one embodiment of the present disclosure.
- the x-axis of the bar graph 600 shown in FIG. 7 represents the first light feature and the second light feature for each of the first component 10 and the second component 20 for each predetermined cycle, and The third to eighth light features are shown.
- the predetermined cycles are indicated as “c01” to “c10”, indicating a total of 10 cycles.
- “sd_c01” to “sd_c010” represent the first light feature, which is the standard deviation of the RFU values measured in each cycle
- “m_c01” to “m_c010” represent the second optical feature, which is the average of the RFU values measured in each cycle.
- “sd_original” represents the seventh light feature, which is an average of standard deviations of each cycle, and, as described above, represents an average calculated based on standard deviations of each of 1 cycle to 10 cycles.
- “m_original” represents the eighth light feature, which is the total average calculated based on the averages of each of the predetermined cycles, and the eighth light feature is as described above.
- “m_trend” represents the average of the third optical features representing the trend, and “sd_trend” represents the standard deviation of the third optical features.
- “m_seasonal” represents the average of the fourth light feature indicating seasonality, and “sd_seasonal” represents the standard deviation of the fourth light feature.
- “m_remainder” represents the average of the fifth photonic feature representing the remainder in the time series decomposition, and “sd_remainder” represents the standard deviation of the fifth optical feature representing the remainder in the time series decomposition.
- “m_resid_sd” represents the average of the regression line residuals, and “sd_resid_sd” represents the standard deviation of the regression line residuals.
- the y-axis of the graph 600 shown in FIG. 7 represents variable data corresponding to the light feature.
- the predetermined p-value is 0.05, it may be indicated as the dotted line shown in FIG. 7 and a light feature having a value higher than the y-axis value corresponding to the dotted line may be selected as an inference feature.
- “m_c01” displayed on the x-axis of the graph 600 of FIG. 7 represents the first optical feature of each of the first component 10 and the second component 20 for one cycle, where “m_c01”
- the y-axis value may be variable data corresponding to the first optical feature, and may be an average RFU value of each of the first component 10 and the second component 20 for one cycle.
- the y-axis value of “m_c01” in FIG. 7 corresponds to a value lower than the dotted line, the first optical feature for one cycle may not be selected as an inference feature.
- “m_c03” displayed on the x-axis of the graph 600 of FIG. 7 represents the first optical feature of each of the first component 10 and the second component 20 for 3 cycles.
- the first optical feature for 3 cycles is selected as an inference feature, and the y-axis value of “m_c03” in FIG. 7 is included in the inference data.
- the selected light feature and variable data corresponding to the light feature may be created as inference data.
- the light feature selected herein may be the aforementioned inference feature of the present disclosure.
- the processor 120 may input inference data or raw data to a machine learning model and obtain output data predicting a level of noise.
- a method of generating output data from a machine learning model will be described as follows.
- FIG. 8 is an exemplary view illustrating a method of generating output data from a machine learning model according to an embodiment of the present disclosure.
- a method as shown in FIG. 8 may be performed to predict performance of a nucleic acid detection device and determine whether to omit a test for noise. More specifically, optical calibration may be preferably performed (710) in the HW Calibration (220) process as described in FIG. 1 above. Accordingly, the processor 120 may input optical data acquired through optical calibration to the machine learning model.
- a noise level may be inferred based on optical data obtained through optical calibration (720).
- the machine learning model may predict (730) whether the nucleic acid detection device will pass a noise level following optical calibration.
- the machine learning model or machine learning-based classifier of the present disclosure may refer to a model or classifier that provides an output for input data based on machine learning.
- the machine learning model or machine learning-based classifier of the present disclosure may be a model that outputs output data using a Support Vector Machine (SVM) or a Partial Least Squares (PLS) method as described above.
- SVM Support Vector Machine
- PLS Partial Least Squares
- the machine learning model or machine learning-based classifier may include a model pre-trained through a training dataset.
- the SVM of the present disclosure is a support vector machine, which is one of the fields of machine learning, and is a supervised learning model mainly used for data classification and regression analysis.
- the SVM algorithm defines one or more decision boundaries, which are classification baselines, to classify data categories or classes, and classifies a data set based on the defined decision boundaries.
- the partial least squares method of the present disclosure is one of the dimensionality reduction methods, and is a method of extracting a linear combination variable having a high covariance with the dependent variable.
- the partial least squares method is particularly useful in regression analysis when predictors are closely related to each other or when the number of predictors is greater than the number of cases.
- the machine learning model of the present disclosure may output a prediction result for an evaluation result for noise based on inference data or raw data through at least one of SVM or partial least squares algorithm.
- the machine learning model is an SVM and a partial least squares algorithm in the form of using the output of the SVM as an input to the partial least squares algorithm or using the output of the partial least squares algorithm as the input of the SVM. can be connected in series.
- the machine learning model inputs the same inference data, optic data in parallel to each of the SVM and the partial least squares algorithm, and combines the output of the SVM with the output of the partial least squares method, or It is also possible to ensemble and output a prediction result.
- the processor 120 may input optical data having information about light among acquired raw data to a machine learning model. Also, according to another embodiment of the present disclosure, the processor 120 may generate inference data based on optical data and input the generated inference data to a machine learning model.
- the inference data and raw data include a plurality of variable data as described above, and the machine learning model measures light from optical data having information about light in inference features and raw data of the inference data. It may include a plurality of classifiers corresponding to each value and light feature. That is, the machine learning model may include a plurality of classifiers corresponding to each of the inference features of the inference data. Alternatively, the machine learning model may include at least three classifiers corresponding to light measurement values and light features of the raw data.
- each of the at least three classifiers may correspond to an SVM or partial least squares algorithm.
- one classifier may correspond to a light measurement value.
- one classifier may correspond to one variable data or one optical feature.
- each of the at least three classifiers may predict a pass or fail result for the noise level based on the corresponding optical measurement value and variable data of the optical feature, and output the result as a prediction result.
- the machine learning model of the present disclosure may generate output data predicting a noise level by ensembling outputs of each of at least three classifiers.
- the first inference data of the first component includes first variable data of a first inference feature representing an average value for three cycles and fourth variable data of a fourth inference feature representing a seasonal average.
- the machine learning model may include a first classifier corresponding to the first variable data and a fourth classifier corresponding to the fourth variable data.
- the first prediction result of predicting pass or fail of the evaluation of noise based on the first variable data through the first classifier is output, and the evaluation of noise based on the fourth variable data through the fourth classifier.
- a second prediction result predicting pass or fail of may be output.
- inference data, inference feature, variable data, and classifiers are only examples, and the inference data, inference feature, variable data, and classifier of the present disclosure should not be construed as being limited by the foregoing examples. something to do.
- the machine learning model of the present disclosure may include a number of classifiers corresponding to the number of predetermined combinations of inference features. Specifically, the number of classifiers corresponding to the number of predetermined combinations of the present disclosure predict pass or fail for the noise level by combining variable data of each of the inference features of the predetermined number of combinations, and output a prediction result. can do.
- the classifier may be configured with four.
- each of the four classifiers may output a prediction result of predicting pass or fail based on two of variable data of eight inference features.
- inference features and variable data input to each of the classifiers may overlap.
- the first to second variable data may be input to the first classifier to output the first prediction result
- the second to fourth variable data may be input to the second classifier to output the second prediction result.
- variable data may be repeatedly input to the first classifier and the second classifier.
- one or more variable data input to each of the classifiers may not overlap.
- the machine learning model ensembles one or more prediction results of noise evaluation output through classifiers, and finally output data representing a prediction result of noise evaluation for one detection device.
- the machine learning model of the present disclosure may ensemble prediction results obtained through one or more classifiers to predict whether one nucleic acid detection device will pass a noise level and display it as output data.
- the machine learning model is a supervised model using a plurality of learning data, each of the plurality of learning data includes, as learning input data, optical data obtained from a selected detection device, and as learning answer data, It may include PASS or FAIL indicating the noise level of the selected detection device.
- the noise level of the selected detection device may be obtained in relation to a negative control (NC) composition and/or a positive control (PC) composition executed in the selected detection device.
- NC negative control
- PC positive control
- output data predicted to be subjected to a noise test 740
- output data predicting that the noise test will be omitted 750
- output data output from the machine learning model may include a result of predicting whether the nucleic acid detection device will pass a noise level following optical calibration. Also, the output data of the present disclosure may include a result of predicting whether to omit a test for noise following optical calibration for the nucleic acid detection device.
- the computing device may express step 730 indicated as pass or fail for the noise level prediction in FIG. 8 as three or more results.
- the computing device may set two or more reference values for the noise level and output three or more results within a range determined by the two or more reference values.
- three or more outcomes may include performing a test for noise, skipping a test for noise, and performing a partial test for noise.
- the computing device may generate learning data for learning the machine learning model of the present disclosure based on the output data obtained as described above.
- the machine learning model of the present disclosure may be a model trained by using, as a training data set, variable data labeled with pass or fail levels of noise.
- the training data set may include variable data labeled with a result of evaluating noise in relation to the output data.
- the machine learning model of the present disclosure may be trained by inputting learning data composed of variable data previously labeled for the level of noise by the user.
- the inference data or raw data of the present disclosure may include a plurality of variable data
- the machine learning model may include a neural network model.
- the neural network model of the present disclosure may include an input layer, at least one hidden layer, and an output layer.
- the input layer may include a number of input neurons corresponding to the number of each of the plurality of variable data or the number of predetermined combinations of the plurality of variable data.
- the output layer includes a plurality of output neurons, and each of the output neurons may represent pass or fail classes assigned to each variable data or each variable data combination.
- output neurons included in the output layer may represent three or more classes including pass, partial pass, or fail, for example.
- the test for noise may be omitted. As a result, it is possible to save time and human resources, etc., which are consumed for noise evaluation, and produce a remarkable effect that a nucleic acid detection device can be shipped quickly.
- FIG. 9 is a flowchart of a method for inferring a noise level of a nucleic acid detection device according to an embodiment of the present disclosure.
- the computing device 100 may perform a method of inferring a noise level of a nucleic acid detection device.
- the method of the present disclosure may include acquiring optical data having information on light among raw data used for optical calibration of the nucleic acid detection device ( 810 ).
- optical data of a measured RFU value may be obtained by radiating light having a predetermined wavelength to one component of the nucleic acid detection device for a predetermined cycle.
- the optical data including one or more pieces of optical data obtained in this way may include one or more pieces of raw data obtained in a calibration process of irradiating light of a predetermined wavelength during a predetermined cycle.
- light is irradiated to a reaction vessel containing a liquid medium and a dye
- the calibration process may include adjusting the intensity of light irradiated to a sample from a nucleic acid detection device.
- light may be irradiated onto a reaction vessel containing a liquid medium and a dye
- optical calibration may include adjusting intensity of light irradiated onto a sample in a nucleic acid detection device.
- a liquid medium is a medium in which dye is dissolved. Typically, it includes water and a buffer solution (TE buffer or PBS buffer).
- TE buffer or PBS buffer a buffer solution
- the sample may be a component of the nucleic acid detection device or a material to be tested included in the component.
- the optical calibration may include correcting a resultant value of irradiated light.
- Methods of the present disclosure may also include extracting 820 features of the noise from one or more parameters included in the optics data.
- These light features include: a first light feature representing a variance or standard deviation of RFU values measured for one well, which is a component of a nucleic acid detection device; a second light feature representing an average of RFU values for a component of the nucleic acid detection device; a third optical feature representing a trend feature calculated by time-series decomposition of the optical data; a fourth optical feature representing a seasonal feature calculated by time-series decomposition of the optical data; a fifth optical feature representing remaining features other than the trend feature and the seasonal feature calculated by time-series decomposition of the optical data; or a sixth optical feature comprising a variance of a residual calculated by applying a first order simple linear regression line to the optic data; It may include at least one feature of
- Methods of the present disclosure may include generating 830 inference data to be used to predict a noise level, based on the at least one light feature.
- the optical calibration may include a test comparing an RFU value measured by the nucleic acid detection device with an RFU value measured by a standard nucleic acid detection device different from the nucleic acid detection device.
- prediction of the noise level may be performed in a state in which a negative control (NC) or a positive control (PC) is accommodated in a sample reaction container of a nucleic acid detection device.
- NC negative control
- PC positive control
- the generating of the inference data may include extracting, from raw data, an optical measurement value and an optical feature having a correlation with performance of the nucleic acid detection apparatus equal to or greater than a threshold value among noise generated by the nucleic acid detection apparatus, based on a predetermined p-value; determining an optical measurement value and an optical feature that is equal to or greater than a threshold in relation to the performance of the nucleic acid detection device as an inference feature, and generating inference data including one or more inference features; and generating a result of the evaluation for noise based on the parameter data of the inference feature.
- the inference data may include inference features
- the machine learning model may include a number of classifiers corresponding to the number of predetermined combinations of inference features.
- step 830 of generating inference data described above may be omitted in the method of the present disclosure.
- the method of the present disclosure may include obtaining output data predicting a level of noise by inputting at least one of inference data or raw data to a machine learning model ( 840 ).
- Level prediction for noise may include a noise test associated with at least one of a Negative Control (NC) composition or a Positive Control (PC) composition for the nucleic acid detection device.
- NC Negative Control
- PC Positive Control
- the method of the present disclosure may be implemented through a machine learning model that predicts pass or fail of a noise level by taking inference data or raw data as an input.
- the machine learning model is a pre-trained model that can generate an output on whether a noise level passes or fails based on variable data of an optical feature.
- the output data may include a result of predicting whether the nucleic acid detection device will pass a level of noise following optical calibration.
- the output data may include a result of predicting whether to omit a test for noise following optical calibration for the nucleic acid detection device.
- the machine learning model may refer to any type of model capable of classifying input data through machine learning, and may be, for example, a model that outputs output data using SVM or partial least squares method.
- the inference data may include inference features and a plurality of variable data corresponding to each of them, and the raw data may include light features and a plurality of variable data corresponding to each of them.
- the machine learning model includes a plurality of classifiers corresponding to the optical measurement value and at least one of the plurality of optical features and/or inference features, each of the plurality of classifiers corresponding to the optical measurement value and the optical features and / Or outputs a pass or fail result for inference features, and the machine learning model may generate output data predicting a level of noise by ensembling the output of each of a plurality of classifiers.
- one classifier may correspond to one light measurement value and one light feature.
- the machine learning model may include a number of classifiers corresponding to the number of predetermined combinations of at least one of inference features or optical features.
- a machine learning-based classifier is used to classify a combination of a plurality of variable data corresponding to one of the inference features or the light features, and the number of classifiers used may vary depending on implementation aspects. .
- the machine learning model may include a number of classifiers corresponding to the number of predetermined combinations of a plurality of variable data corresponding to one of the inference features or the light features.
- a machine learning-based classifier for classifying a combination of a plurality of variable data may be used, and the number of classifiers used may be variable according to an implementation aspect.
- the machine learning model may be a trained model using variable data labeled with a pass (PASS) or fail (FAIL) for noise level as a training data set.
- variable data labeled with a plurality of classes may be used.
- the plurality of classes may include, for example, classes corresponding to pass, partial pass, partial fail, or fail.
- the machine learning model includes a neural network model, and the neural network model includes: a number of input neurons corresponding to the number of each of the plurality of variable data included in the inference data or the number of predetermined combinations of the plurality of variable data input layer; at least one hidden layer; and an output layer including a plurality of output neurons.
- each of the plurality of output neurons may represent pass or fail classes assigned to each variable data or each variable data combination.
- This neural network model is a model pre-trained to generate an output for a predefined class by taking a plurality of variable data as an input.
- the method according to one embodiment of the present disclosure can omit a noise test for a nucleic acid detection device that is predicted to have excellent performance, and thus can shorten the test time from about 150 minutes to about 600 minutes per PCR device. Therefore, the method according to an embodiment of the present disclosure can reduce the time required for a noise test and the consumption of manpower, thereby optimizing the inspection of the nucleic acid detection device and maximizing the work efficiency of practitioners related to the nucleic acid detection device. can make it
- FIG. 10 is a simplified and general schematic diagram of an exemplary computing environment in which embodiments of the present disclosure may be implemented.
- program modules include routines, programs, components, data structures, etc. that perform particular tasks or implement particular abstract data types.
- methods of the present disclosure can be applied to single-processor or multiprocessor computer systems, minicomputers, mainframe computers as well as personal computers, handheld computing devices, microprocessor-based or programmable consumer electronics, and the like ( It will be appreciated that each of these may be implemented with other computer system configurations, including those that may be operative in connection with one or more associated devices.
- the described embodiments of the present disclosure may also be practiced in distributed computing environments where certain tasks are performed by remote processing devices that are linked through a communications network.
- program modules may be located in both local and remote memory storage devices.
- Computers typically include a variety of computer readable media.
- Computer readable media can be any medium that can be accessed by a computer, including volatile and nonvolatile media, transitory and non-transitory media, removable and non-transitory media. Includes removable media.
- Computer readable media may include computer readable storage media and computer readable transmission media.
- Computer readable storage media are volatile and nonvolatile media, transitory and non-transitory, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data.
- Computer readable storage media may include RAM, ROM, EEPROM, flash memory or other memory technology, CD-ROM, digital video disk (DVD) or other optical disk storage device, magnetic cassette, magnetic tape, magnetic disk storage device or other magnetic storage device. device, or any other medium that can be accessed by a computer and used to store desired information.
- a computer readable transmission medium typically embodies computer readable instructions, data structures, program modules or other data in a modulated data signal such as a carrier wave or other transport mechanism. Including all information delivery media.
- modulated data signal means a signal that has one or more of its characteristics set or changed so as to encode information within the signal.
- computer readable transmission media includes wired media such as a wired network or direct-wired connection, and wireless media such as acoustic, RF, infrared, and other wireless media. Combinations of any of the above are also intended to be included within the scope of computer readable transmission media.
- System bus 1108 couples system components, including but not limited to system memory 1106 , to processing unit 1104 .
- Processing unit 1104 may be any of a variety of commercially available processors. Dual processor and other multiprocessor architectures may also be used as the processing unit 1104.
- System bus 1108 may be any of several types of bus structures that may additionally be interconnected to a memory bus, a peripheral bus, and a local bus using any of a variety of commercial bus architectures.
- System memory 1106 includes read only memory (ROM) 1110 and random access memory (RAM) 1112 .
- ROM read only memory
- RAM random access memory
- a basic input/output system (BIOS) is stored in non-volatile memory 1110, such as ROM, EPROM, or EEPROM, and is a basic set of information that helps transfer information between components within computer 1102, such as during startup. contains routines.
- RAM 1112 may also include high-speed RAM, such as static RAM, for caching data.
- the computer 1102 may also include an internal hard disk drive (HDD) 1114 (eg, EIDE, SATA) - the internal hard disk drive 1114 may also be configured for external use within a suitable chassis (not shown).
- HDD hard disk drive
- FDD magnetic floppy disk drive
- optical disk drive 1120 e.g., a CD-ROM
- the hard disk drive 1114, magnetic disk drive 1116, and optical disk drive 1120 are connected to the system bus 1108 by a hard disk drive interface 1124, magnetic disk drive interface 1126, and optical drive interface 1128, respectively.
- the interface 1124 for external drive implementation includes at least one or both of USB (Universal Serial Bus) and IEEE 1394 interface technologies.
- drives and their associated computer readable media provide non-volatile storage of data, data structures, computer executable instructions, and the like.
- drives and media correspond to storing any data in a suitable digital format.
- computer readable media refers to HDDs, removable magnetic disks, and removable optical media such as CDs or DVDs, those skilled in the art can use zip drives, magnetic cassettes, flash memory cards, cartridges, etc. It will be appreciated that other tangible media readable by the computer, such as the like, may also be used in the exemplary operating environment and any such media may include computer executable instructions for performing the methods of the present disclosure.
- a number of program modules may be stored on the drive and RAM 1112, including an operating system 1130, one or more application programs 1132, other program modules 1134, and program data 1136. All or portions of the operating system, applications, modules and/or data may also be cached in RAM 1112. It will be appreciated that the present disclosure may be implemented in a variety of commercially available operating systems or combinations of operating systems.
- a user may enter commands and information into the computer 1102 through one or more wired/wireless input devices, such as a keyboard 1138 and a pointing device such as a mouse 1140.
- Other input devices may include a microphone, IR remote control, joystick, game pad, stylus pen, touch screen, and the like.
- an input device interface 1142 that is connected to the system bus 1108, a parallel port, IEEE 1394 serial port, game port, USB port, IR interface, may be connected by other interfaces such as the like.
- a monitor 1144 or other type of display device is also connected to the system bus 1108 through an interface such as a video adapter 1146.
- computers typically include other peripheral output devices (not shown) such as speakers, printers, and the like.
- Computer 1102 may operate in a networked environment using logical connections to one or more remote computers, such as remote computer(s) 1148 via wired and/or wireless communications.
- Remote computer(s) 1148 may be a workstation, computing device computer, router, personal computer, handheld computer, microprocessor-based entertainment device, peer device, or other common network node, and generally includes It includes many or all of the components described for, but for simplicity, only memory storage device 1150 is shown.
- the logical connections shown include wired/wireless connections to a local area network (LAN) 1152 and/or a larger network, such as a wide area network (WAN) 1154 .
- LAN and WAN networking environments are common in offices and corporations and facilitate enterprise-wide computer networks, such as intranets, all of which can be connected to worldwide computer networks, such as the Internet.
- computer 1102 When used in a LAN networking environment, computer 1102 connects to local network 1152 through wired and/or wireless communication network interfaces or adapters 1156. Adapter 1156 may facilitate wired or wireless communications to LAN 1152, which also includes a wireless access point installed therein to communicate with wireless adapter 1156.
- computer 1102 When used in a WAN networking environment, computer 1102 may include a modem 1158, be connected to a communicating computing device on WAN 1154, or establish communications over WAN 1154, such as over the Internet. have other means.
- a modem 1158 which may be internal or external and a wired or wireless device, is connected to the system bus 1108 through a serial port interface 1142.
- program modules described for computer 1102, or portions thereof may be stored on remote memory/storage device 1150. It will be appreciated that the network connections shown are exemplary and other means of establishing a communication link between computers may be used.
- Computer 1102 is any wireless device or entity that is deployed and operating in wireless communication, eg, printers, scanners, desktop and/or portable computers, portable data assistants (PDAs), communication satellites, wireless detectable tags associated with It operates to communicate with arbitrary equipment or places and telephones.
- wireless communication eg, printers, scanners, desktop and/or portable computers, portable data assistants (PDAs), communication satellites, wireless detectable tags associated with It operates to communicate with arbitrary equipment or places and telephones.
- PDAs portable data assistants
- communication satellites e.g., a wireless detectable tags associated with It operates to communicate with arbitrary equipment or places and telephones.
- the communication may be a predefined structure as in conventional networks or simply an ad hoc communication between at least two devices.
- Wi-Fi Wireless Fidelity
- Wi-Fi is a wireless technology, such as a cell phone, that allows such devices, eg, computers, to transmit and receive data both indoors and outdoors, i.e. anywhere within coverage of a base station.
- Wi-Fi networks use a radio technology called IEEE 802.11 (a, b, g, etc.) to provide secure, reliable, and high-speed wireless connections.
- Wi-Fi can be used to connect computers to each other, to the Internet, and to wired networks (using IEEE 802.3 or Ethernet).
- Wi-Fi networks can operate in the unlicensed 2.4 and 5 GHz radio bands, for example, at 11 Mbps (802.11a) or 54 Mbps (802.11b) data rates, or in products that include both bands (dual band) .
- Various embodiments presented herein may be implemented as a method, apparatus, or article of manufacture using standard programming and/or engineering techniques.
- article of manufacture includes a computer program, carrier, or media accessible from any computer-readable storage device.
- computer-readable storage media include magnetic storage devices (eg, hard disks, floppy disks, magnetic strips, etc.), optical disks (eg, CDs, DVDs, etc.), smart cards, and flash memory devices (eg, EEPROM, cards, sticks, key drives, etc.), but are not limited thereto.
- various storage media presented herein include one or more devices and/or other machine-readable media for storing information.
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Clinical Laboratory Science (AREA)
- Molecular Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 개시의 일 실시 예에 따른 표적 분석물질의 존부에 의존적인 신호에 기반하여 샘플 내 상기 표적 분석물질의 존부를 검출하는 검출 장치를 대상으로, 상기 검출 장치에서 발생되는 노이즈에 대한 수준을 추론하는 방법으로서, 상기 검출 장치의 옵틱(optic) 캘리브레이션 에 이용되는 로우(raw) 데이터 중 광에 대한 정보를 갖고 있는 옵틱 데이터를 획득하는 단계; 및 상기 옵틱 데이터를 입력으로 하는 기 학습된 기계학습 모델을 사용하여, 상기 검출 장치에서 발생되는 노이즈에 대한 수준을 추론하는 단계;를 포함한다.
Description
본 개시는 증폭 반응에 관한 기술로서, 보다 구체적으로 검출 장치의 성능을 예측하기 위한 기법에 관한 것이다.
PCR은 중합효소연쇄 반응(Polymerase chain reaction)을 의미하며 DNA를 빠르게 증폭시키는 기술이다. 검출 장치(device)는 PCR과 같은 증폭 반응을 수행하기 위한 장비이다. 검출 장치의 출고 단계에서 검출 장치가 PCR과 같은 증폭 반응을 수행하기에 적합한지 여부를 판단하기 위한 성능 테스트가 실시된다.
검출 장치에 대한 일반적인 성능 테스트는 크게 캘리브레이션(Calibration) 단계 및 노이즈 테스트(Noise test) 단계로 나뉜다. 여기서 캘리브레이션 단계는 검출 장치를 표준 검출 장치로 캘리브레이션 하는 단계이며, 대략 60분이라는 시간이 소모된다. 캘리브레이션 단계 이후에 수행되는 노이즈 테스트 단계는 검출 장치의 성능을 확인할 수 있는 주요 테스트이나, 하나의 기기에 대해 150분에서 600분이라는 긴 시간이 소모가 되기 때문에, 노이즈 테스트 단계에서 소모되는 시간을 줄일 수 있는 기법에 대한 연구가 필요하다.
선행기술문헌
특허문헌
일본 등록특허 제6897655호
본 개시는 전술한 배경기술에 대응하여 안출된 것으로, 검출 장치의 노이즈 테스트 결과를 예측하는 방법을 제공하기 위함이다.
본 개시의 기술적 과제들은 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
전술한 과제를 해결하기 위해 본 개시의 일 실시예에 따라 표적 분석물질의 존부에 의존적인 신호에 기반하여 샘플 내 상기 표적 분석물질의 존부를 검출하는 검출 장치를 대상으로, 상기 검출 장치에서 발생되는 노이즈에 대한 수준을 추론하는 방법으로서, 상기 검출 장치의 옵틱(optic) 캘리브레이션 에 이용되는 로우(raw) 데이터 중 광에 대한 정보를 갖고 있는 옵틱 데이터를 획득하는 단계; 및 상기 옵틱 데이터를 입력으로 하는 기 학습된 기계학습 모델을 사용하여, 상기 검출 장치에서 발생되는 노이즈에 대한 수준을 추론하는 단계;를 포함하는 단계를 포함할 수 있다.
대안적으로, 상기 광 데이터는, 상기 옵틱 데이터는, 사전 결정된 사이클(cycle) 동안 사전 결정된 파장(wavelength)의 광(light)을 조사하여 획득된 광 측정값, 상기 광 측정값을 수학적으로 가공한 광 피쳐(feature)를 포함할 수 있다.
대안적으로, 상기 광의 조사는, 액상 매체와 염료(dye)를 포함하는 반응 용기에 수행되는 것을 특징으로 할 수 있다.
대안적으로, 상기 옵틱 캘리브레이션은, 조사되는 광의 세기(intensity)를, 상기 옵틱 데이터와 소정의 기준치와의 비교 결과에 기초하여 조정하는 것을 특징으로 할 수 있다.
대안적으로, 상기 옵틱 캘리브레이션은, 상기 검출 장치의 광량의 측정 민감도를, 상기 옵틱 데이터와 소정의 기준치와의 비교 결과에 기초하여 조정하는 것을 특징으로 할 수 있다.
대안적으로, 상기 방법은, 상기 옵틱 데이터로부터 광 측정 값 및 상기 광 측정 값을 수학적으로 가공한 광 피쳐(feature)를 추출하는 단계; 및 상기 노이즈 수준을 추론하기 위해 상기 광 측정 값 및 광 피쳐를 상기 기계학습 모델에 입력하는 단계;를 더 포함할 수 있다.
대안적으로, 상기 광 피쳐는, 상기 옵틱 데이터에 대한 분산 또는 표준편차를 포함하는 제 1 광 피쳐; 상기 옵틱 데이터의 평균을 포함하는 제 2 광 피쳐; 상기 옵틱 데이터를 시계열 분해하여 산출되는 추세(trend)를 포함하는 제 3 광 피쳐; 상기 옵틱 데이터를 시계열 분해하여 산출되는 계절성(seasonal)을 포함하는 제 4 광 피쳐;
상기 옵틱 데이터에서 상기 제 3 광 피쳐 및 상기 제 4 광 피쳐를 차감한 나머지(remainder)를 포함하는 제 5 광 피쳐; 및 상기 옵틱 데이터에 선형 회귀 선을 적용하여 계산된 잔차의 분산을 포함하는 제 6 광 피쳐 및 이들의 조합을 포함하는 그룹에서 선택된 적어도 하나의 그룹이 포함될 수 있다.
대안적으로, 상기 추출은 종류가 상이한 복수 개의 상기 광 피쳐가 생성되고,
상기 기계학습 모델은, 상기 광 측정값 및 복수 개의 광 피쳐에 대응되는 적어도 세 개의 분류기(classifier)를 포함하며 - 상기 적어도 세 개의 분류기 중 하나의 분류기는 하나의 광 측정값과 하나 또는 적어도 두개의 광 피쳐에 대응함 - , 상기 적어도 세 개의 분류기 각각은, 대응되는 광 측정값 및 광 피쳐가 입력되면 상기 검출 장치의 예비적 노이즈 수준으로서 합격(PASS)과 불합격(FAIL) 중 어느 하나를 출력하고, 상기 기계학습 모델은 상기 적어도 세개의 분류기 각각에 대한 출력을 앙상블하여서, 상기 검출 장치의 상기 노이즈 수준을 추론하는 것을 특징으로 할 수 있다.
대안적으로, 상기 추출은 종류가 상이한 복수 개의 상기 광 피쳐가 생성되고, 상기 노이즈 수준의 추론은, 사전 결정된 p-value에 기초하여, 상기 광 측정값 및 복수 개의 광 피쳐로부터 적어도 하나의 인퍼런스 피쳐를 추출하는 단계를 더 포함하며, 상기 기계학습 모델은, 상기 노이즈 수준을 추론하기 위한 상기 적어도 하나의 인퍼런스 피쳐를 입력받는 것을 특징으로 할 수 있다.
대안적으로, 상기 기계학습 모델은, SVM(Support Vector Machine) 또는 부분 최소 제곱법(Partial Least Squares)을 이용하여 상기 노이즈 수준을 추론하는 모델을 포함할 수 있다.
대안적으로, 상기 기계학습 모델은, 복수 개의 학습용 데이터를 이용하여 지도 학습된 모델이되, 상기 복수 개의 학습용 데이터 각각은, 학습용 입력 데이터로서, 선택된 검출 장치로부터 획득된 옵틱 데이터를 포함하고, 학습용 정답 데이터로서, 상기 선택된 검출 장치의 노이즈 수준을 나타내는 합격(PASS) 또는 불합격(FAIL)을 포함할 수 있다.
대안적으로, 상기 선택된검출 장치의 노이즈 레벨은, 상기 선택된 검출 장치에서 실행되는 Negative Control(NC) 조성물 및/또는 Positive Control(PC) 조성물과 관련하여 획득되는 것을 특징으로 할 수 있다.
대안적으로, 상기 옵틱 데이터는 광 측정값 및 종류가 상이한 복수의 광 피쳐를 포함하고, 상기 기계학습 모델은 입력 레이어, 적어도 하나의 히든 레이어 및 출력 레이어를 포함하는 신경망 모델을 포함하되, 상기 입력 레이어에는 광 측정값 및 상기 하나 이상의 광 피쳐 중 적어도 하나와 대응되는 입력 노드가 포함되고, 상기 출력 레이어에는 합격(PASS) 및 불합격(FAIL) 대응되는 출력 노드가 포함되는 것을 특징으로 할 수 있다.
전술한 과제를 해결하기 위해 본 개시의 일 실시예에 따라 컴퓨터 프로그램을 저장하는 컴퓨터 판독가능 매체로서, 상기 컴퓨터 프로그램은, 하나 이상의 프로세서에 의해 실행되는 경우, 상기 하나 이상의 프로세서로 하여금, 표적 분석물질의 존부에 의존적인 신호에 기반하여 샘플 내 상기 표적 분석물질의 존부를 검출하는 검출 장치를 대상으로, 상기 검출 장치에서 발생되는 노이즈 수준을 추론하는 방법을 수행하기 위한 명령들을 포함하며, 상기 방법은: 상기 검출 장치의 옵틱(optic) 캘리브레이션에 이용되는 옵틱 데이터를 획득하는 단계; 및 상기 옵틱 데이터를 입력으로 하는 기 학습된 기계학습 모델을 사용하여, 상기 검출 장치에서 발생되는 노이즈의 수준을 추론하는 단계를 포함하는 컴퓨터 판독 가능한 기록 매체를 포함할 수 있다.
전술한 과제를 해결하기 위해 본 개시의 일 실시예에 따라 표적 분석물질의 존부에 의존적인 신호에 기반하여 샘플 내 상기 표적 분석물질의 존부를 검출하는 검출 장치를 대상으로, 상기 검출 장치에서 발생되는 노이즈 수준을 추론하는 방법을 수행하기 컴퓨팅 장치로서, 상기 검출 장치의 옵틱 캘리브레이션에 이용되는 옵틱 데이터를 획득하는 입력부; 및 상기 옵틱 데이터를 입력으로 하는 기 학습된 기계학습 모델을 사용하여, 상기 검출 장치에서 발생되는 노이즈 수준을 추론하는 노이즈 수준 추론부를 포함하는 컴퓨팅 장치를 포함할 수 있다.
본 개시에서 얻을 수 있는 기술적 해결 수단은 이상에서 언급한 해결 수단들로 제한되지 않으며, 언급하지 않은 또 다른 해결 수단들은 아래의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 개시는 기존보다 짧은 시간에 검출 장치의 성능을 테스트하는 방법을 제공할 수 있다.
본 개시에서 얻을 수 있는 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
다양한 양상들이 이제 도면들을 참조로 기재되며, 여기서 유사한 참조 번호들은 총괄적으로 유사한 구성요소들을 지칭하는데 이용된다. 이하의 실시예에서, 설명 목적을 위해, 다수의 특정 세부사항들이 하나 이상의 양상들의 총체적 이해를 제공하기 위해 제시된다. 그러나, 그러한 양상(들)이 이러한 특정 세부사항들 없이 실시될 수 있음은 명백할 것이다. 다른 예시들에서, 공지의 구조들 및 장치들이 하나 이상의 양상들의 기재를 용이하게 하기 위해 블록도 형태로 도시된다.
도 1은 검출 장치의 출고를 위해 옵틱 캘리브레이션 및 테스트 과정 및 단계별 소요 시간을 나타내는 예시도이다.
도 2는 본 개시의 일 실시예에 따라 검출 장치의 노이즈 수준을 추론하기 위한 컴퓨팅 장치의 블록 구성도이다.
도 3은 본 개시의 일 실시 예에 따라 검출 장치의 노이즈 수준을 추론하기 위한 프로세서(120)에 대한 구성도이다.
도 4는 본 개시의 일 실시예에 따른 노이즈 수준 추론부에 대한 구성도이다.
도 5는 본 개시의 몇몇 실시예에 따른 로우 데이터를 예시적으로 도시한 예시도이다.
도 6는 예시적인 시계열 그래프를 추세, 계절성 및 나머지를 분해하여 나타낸 그래프들이다.
도 7은 본 개시의 일 실시예에 따라 2개의 컴포넌트 각각에 대한 예시적인 광 피쳐의 값들을 막대 그래프로 나타내고 있다.
도 8은 본 개시의 일 실시예에 따라 기계학습 모델에서 출력 데이터를 생성하는 방법을 예시적으로 도시한 예시도이다.
도 9은 본 개시의 일 실시예에 따라 검출 장치의 노이즈 수준을 추론하기 위한 방법에 대한 순서도를 도시한다.
도 10는 본 개시의 실시예들이 구현될 수 있는 예시적인 컴퓨팅 환경에 대한 간략하고 일반적인 개략도이다.
다양한 실시예들이 이제 도면을 참조하여 설명된다. 본 명세서에서, 다양한 설명들이 본 개시의 이해를 제공하기 위해서 제시된다. 그러나, 이러한 실시예들은 이러한 구체적인 설명 없이도 실행될 수 있음이 명백하다.
본 명세서에서 사용되는 용어 "컴포넌트", "모듈", "시스템" 등은 컴퓨터-관련 엔티티, 하드웨어, 펌웨어, 소프트웨어, 소프트웨어 및 하드웨어의 조합, 또는 소프트웨어의 실행을 지칭한다. 예를 들어, 컴포넌트는 프로세서상에서 실행되는 처리과정(procedure), 프로세서, 객체, 실행 스레드, 프로그램, 및/또는 컴퓨터일 수 있지만, 이들로 제한되는 것은 아니다. 예를 들어, 컴퓨팅 장치에서 실행되는 애플리케이션 및 컴퓨팅 장치 모두 컴포넌트일 수 있다. 하나 이상의 컴포넌트는 프로세서 및/또는 실행 스레드 내에 상주할 수 있다. 일 컴포넌트는 하나의 컴퓨터 내에 로컬화 될 수 있다. 일 컴포넌트는 2개 이상의 컴퓨터들 사이에 분배될 수 있다. 또한, 이러한 컴포넌트들은 그 내부에 저장된 다양한 데이터 구조들을 갖는 다양한 컴퓨터 판독가능한 매체로부터 실행할 수 있다. 컴포넌트들은 예를 들어 하나 이상의 데이터 패킷들을 갖는 신호(예를 들면, 로컬 시스템, 분산 시스템에서 다른 컴포넌트와 상호작용하는 하나의 컴포넌트로부터의 데이터 및/또는 신호를 통해 다른 시스템과 인터넷과 같은 네트워크를 통해 전송되는 데이터)에 따라 로컬 및/또는 원격 처리들을 통해 통신할 수 있다.
본 개시내용의 컴퓨팅 장치는 임의의 형태의 서버 및/또는 사용자 단말을 포괄하는 의미로 사용된다.
더불어, 용어 "또는"은 배타적 "또는"이 아니라 내포적 "또는"을 의미하는 것으로 의도된다. 즉, 달리 특정되지 않거나 문맥상 명확하지 않은 경우에, "X는 A 또는 B를 이용한다"는 자연적인 내포적 치환 중 하나를 의미하는 것으로 의도된다. 즉, X가 A를 이용하거나; X가 B를 이용하거나; 또는 X가 A 및 B 모두를 이용하는 경우, "X는 A 또는 B를 이용한다"가 이들 경우들 어느 것으로도 적용될 수 있다. 또한, 본 명세서에 사용된 "및/또는"이라는 용어는 열거된 관련 아이템들 중 하나 이상의 아이템의 가능한 모든 조합을 지칭하고 포함하는 것으로 이해되어야 한다.
또한, "포함한다" 및/또는 "포함하는"이라는 용어는, 해당 특징 및/또는 구성요소가 존재함을 의미하는 것으로 이해되어야 한다. 다만, "포함한다" 및/또는 "포함하는"이라는 용어는, 하나 이상의 다른 특징, 구성요소 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는 것으로 이해되어야 한다. 또한, 달리 특정되지 않거나 단수 형태를 지시하는 것으로 문맥상 명확하지 않은 경우에, 본 명세서와 청구범위에서 단수는 일반적으로 "하나 또는 그 이상"을 의미하는 것으로 해석되어야 한다.
그리고, "A 또는 B 중 적어도 하나"이라는 용어는, "A만을 포함하는 경우", "B 만을 포함하는 경우", "A와 B의 구성으로 조합된 경우"를 의미하는 것으로 해석되어야 한다.
당업자들은 추가적으로 여기서 개시된 실시예들과 관련되어 설명된 다양한 예시적 논리적 블록들, 구성들, 모듈들, 회로들, 수단들, 로직들, 및 알고리즘 단계들이 전자 하드웨어, 컴퓨터 소프트웨어, 또는 양쪽 모두의 조합들로 구현될 수 있음을 인식해야 한다. 하드웨어 및 소프트웨어의 상호교환성을 명백하게 예시하기 위해, 다양한 예시적 컴포넌트들, 블록들, 구성들, 수단들, 로직들, 모듈들, 회로들, 및 단계들은 그들의 기능성 측면에서 일반적으로 위에서 설명되었다. 그러한 기능성이 하드웨어로 또는 소프트웨어로서 구현되는지 여부는 전반적인 시스템에 부과된 특정 어플리케이션(application) 및 설계 제한들에 달려 있다. 숙련된 기술자들은 각각의 특정 어플리케이션들을 위해 다양한 방법들로 설명된 기능성을 구현할 수 있다. 다만, 그러한 구현의 결정들이 본 개시내용의 영역을 벗어나게 하는 것으로 해석되어서는 안 된다.
제시된 실시예들에 대한 설명은 본 개시의 기술 분야에서 통상의 지식을 가진 자가 본 발명을 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 개시의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이다. 여기에 정의된 일반적인 원리들은 본 개시의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 발명은 여기에 제시된 실시예 들로 한정되는 것이 아니다. 본 발명은 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다.
용어 “표적 분석물질”은 다양한 물질(예컨대, 생물학적 물질 및 비생물학적 물질)을 포함하는데, 이는 용어 “타겟 분석물(target analyte)”과 동일한 대상을 지칭할 수 있다.
이러한 타겟 분석물은 구체적으로 생물학적 물질, 보다 구체적으로 핵산분자(예컨대, DNA 및 RNA), 단백질, 펩타이드, 탄수화물, 지질, 아미노산, 생물학적 화합물, 호르몬, 항체, 항원, 대사물질 및 세포 중 적어도 하나를 포함할 수 있다.
표적 분석물질이나 타겟 분석물, 특히 타겟 핵산분자는 다양한 방법으로 증폭될 수 있다: 중합효소연쇄반응(polymerase chain reaction (PCR)), 리가아제 연쇄반응(ligase chain reaction (LCR)) (미국특허 제4,683,195호 및 제4,683,202호; PCR Protocols: A Guide to Methods and Applications (Innis et al., eds, 1990)), 가닥 치환 증폭(strand displacement amplification (SDA)) (Walker, et al. Nucleic Acids Res. 20(7):1691-6 (1992); Walker PCR Methods Appl 3(1):1-6 (1993)), 전사 매개 증폭(transcription-mediated amplification) (Phyffer, et al., J. Clin. Microbiol. 34:834-841 (1996); Vuorinen, et al., J. Clin. Microbiol. 33:1856-1859 (1995)), 염기순서기반증폭(nucleic acid sequence-based amplification (NASBA)) (Compton, Nature 350(6313):91-2 (1991)), 롤링서클 증폭(rollingcircle amplification, RCA) (Lisby, Mol. Biotechnol. 12(1):75-99 (1999); Hatchet al., Genet. Anal. 15(2):35-40 (1999)) 및 Q-beta 레플리카제(Q-Beta Replicase) (Lizardi et al., BiolTechnology 6:1197(1988)), loop-mediated isothermal amplication(LAMP, Y. Mori, H. Kanda and T. Notomi, J. Infect. Chemother., 2013, 19, 404-411), recombinase polymerase amplication(RPA, J. Li, J. Macdonald and F. von Stetten, Analyst, 2018, 144, 31-67).본 명세서에서 사용되는 용어 "검출 장치"는 온도 조절기 및/또는 검출기를 포함하는 증폭 반응용 기기 뿐만 아니라 증폭 반응용 용기를 포괄하는 것으로 의도된다. 또한, 본 명세서에서의 검출 장치에서 수행되는 증폭 반응이란 증폭 반응용 조성물이 증폭 반응용 용기 및 증폭 반응용 기기를 이용하여 증폭된다는 것을 의미한다. 검출 장치의 일 예시로 핵산 검출 장치 가 있을 수 있으며, 증폭 반응의 일 예시로 PCR이 있을 수 있다.
본 개시에서 핵산 검출 장치의 컴포넌트(component)는 핵산 검출 장치를 구성하거나, 핵산 검출 장치에 포함되거나 또는 핵산 검출 장치에 장착될 수 있는 구성요소이며, 일례로 검출 장치의 파츠(parts) 또는 부품일 수 있다. 예를 들어, 본 명세서에서 증폭 반응 장치의 컴포넌트는 증폭 반응용 기기, 증폭 반응용 용기, 반응 컨테이너, 및/또는 필터모듈 등)를 포함하는 것으로 이해되어야 한다.
증폭 반응용 기기는 증폭 반응을 위해 온도를 조절할 수 있는 다양한 형태의 기기를 포함한다. 그 예로는 CFX(Bio-Rad), iCycler(Bio-Rad), LightCycler(Roche), StepOne(ABI), 7500 (ABI), ViiA7(ABI), QuantStudio(ABI), AriaMx(Agilent), Eco(Illumina) 등을 들 수 있으나, 이에 제한되지 않는다.
증폭 반응용 용기는 튜브, 스트립, 플레이트 등을 포함하는 용기를 포함할 수 있다.
전술한 컴포넌트들은 예시들일 뿐이며, 전술한 예시들로 인해 본 개시의 PCR 컴포넌트가 제한되어 해석되지 않아야 할 것이다.
본 개시에서 증폭 반응용 용기는 반응이 수행되는 시스템이며, 웰 플레이트(well plate)일 수 있다. 반응용 용기는 하나 이상의 반응 컨테이너를 포함한다. 반응 컨테이너는 반응물(예를 들어, 반응 용액 또는 반응 혼합물)을 수용할 수 있는 단위체(unit)를 말한다. 테스트 튜브, PCR 튜브, 스트립 튜브, multi well PCR plate는 모두 하나 또는 둘 이상의 반응 컨테이너를 포함한 반응용기의 일 구현예이다. 반응 컨테이너의 일례로 웰(well)이 있으며, 이후에 설명되는 웰은 반응 컨테이너와 상호 교환가능하게 사용될 수 있다.
본 개시에 따른 핵산 검출 장치는, 시료 내지 샘플을 대상으로, 핵산증폭 반응과 핵산 검출 작업을 수행하도록 구현된다. 실시예에 따라, 핵산 검출 장치는 핵산증폭 반응을 수행하지 않고 핵산 검출 작업을 수행하도록 구현될 수 있거나, 검출 장치는 핵산증폭 반응을 수행하고 핵산 검출 작업을 수행하지 않도록 구현될 수도 있지만, 이하에서는 핵산 검출 장치가 핵산증폭 반응도 수행하도록 구현되는 것을 전제로 설명하기로 한다.
핵산 검출 장치는 광학(optical) 모듈 및 써멀(thermal) 모듈을 포함할 수 있다.
광학 모듈은 광원 모듈과 검출 모듈을 포함한다. 광원 모듈은 샘플에 적절한 광학 자극을 공급하며, 검출 모듈은 이에 반응하여 샘플로부터 발생하는 광학 신호를 감지한다. 광학 신호는 발광(luminescence), 인광(phosphorescence), 화학발광(chemiluminescence), 형광(fluorescence), 편광형광(polarized fluorescence) 또는 다른 유색 신호(colored signal)일 수 있다. 광학 신호는 샘플에 광학 자극을 주고, 이에 반응하여 발생하는 광학 신호 일 수 있다. 광원 모듈은 샘플에 광을 조사하도록 형성된 광원 및 상기 광원으로부터 조사되는 광을 필터하는 필터를 포함한다.
광원은 서로 동일한 파장 특성을 가지는 광을 방출하는 광원일 수 있다. 예를 들어, 광원이 서로 동일한 파장 영역의 광을 방출하면, 또한 파장 영역별로 방출되는 광량이 서로 동일한 것을 의미한다. 동일하다는 것은 완전히 동일한 것 뿐만 아니라, 실질적으로 동일한 것을 모두 포함하는 의미이다. 실질적으로 동일한 것은 예를 들어 두 광원에서 발생한 광을 동일한 필터를 통하여 동일 광학 표지에 조사하는 경우 광학 표지로부터 동일한 종류의 방출광이 동일한 수준의 광량으로 발생하는 것을 의미한다. 구체적으로 복수의 광원이 실질적으로 동일한 파장 특성을 가지는 것은 복수의 광원의 광량 또는 파장 영역의 편차가 20%, 15% 또는 10% 이내인 것을 의미한다.
필터는 광원으로부터 방출되는 광을 필터링한다. 필터(filtration)는 광원으로부터 방출되는 광 중 특정 파장영역의 광을 선택적으로 통과시키거나, 특정 파장영역의 광을 선택적으로 통과시키지 않는 것을 의미한다. 상기 선택적으로 통과시킨다는 것은 목적하는 파장영역의 광의 광량의 50%, 60%, 70%, 80%, 또는 90% 이상을 통과시키는 것을 의미한다. 상기 선택적으로 통과시키지 않는다는 것은 목적하는 파장영역의 광의 광량의 50%, 60%, 70%, 80%, 또는 90% 이상을 통과시키지 않고 막는 것을 의미한다.
본 개시의 필터는 광원으로부터 방출되는 광 중 특정 파장영역의 광을 선택적으로 통과시켜 샘플에 조사되도록 한다. 이로서 샘플 내 포함된 광학표지 중 특정 광학표지만이 광학 신호를 발생하게 된다.
본 명세서에서의 광학표지는 염료와 상호 교환가능하게 사용될 수 있다. 예를 들어, 염료는 Cy2TM , YO-PROTM -1, YOYOTM -1, Calcein, FITC, FluorXTM , AlexaTM , Rhodamine 110, Oregon GreenTM 500, Oregon GreenTM 488, RiboGreenTM , Rhodamine GreenTM , Rhodamine 123, Magnesium GreenTM , Calcium GreenTM , TO-PROTM -1, TOTO1, JOE, BODIPY530/550, Dil, BODIPY TMR, BODIPY558/568, BODIPY564/570, Cy3TM , AlexaTM 546, TRITC, Magnesium OrangeTM , Phycoerythrin R&B, Rhodamine Phalloidin, Calcium OrangeTM , Pyronin Y, Rhodamine B, TAMRA, Rhodamine RedTM , Cy3.5TM , ROX, Calcium CrimsonTM , AlexaTM 594, Texas Red, Nile Red, YO-PROTM -3, YOYOTM -3, R-phycocyanin, C-Phycocyanin, TO-PROTM -3, TOTO3, DiD DilC(5), Cy5TM , Thiadicarbocyanine, Cy5.5, HEX, TET, Biosearch Blue, CAL Fluor Gold 540, CAL Fluor Orange 560, CAL Fluor Red 590, CAL Fluor Red 610, CAL Fluor Red 635, FAM, Fluorescein, Fluorescein-C3, Pulsar 650, Quasar 570, Quasar 670 및 Quasar 705로 이루어진 군에서 선택된 광학 표지일 수 있다. 광학 표지는 형광 표지, 발광 표지, 화학발광 표지, 전기화학적 표지 및 금속 표지를 포함한다.
특히, 본 개시에서의 염료는 FAM, HEX, CAL Fluor Red 610, Quasar 670, Quasar 705로 이루어진 군에서 선택된 형광(fluorescent) 광학표지일 수 있다.
검출 모듈은 신호를 검출한다. 검출 모듈은 샘플들로부터 발생하는 광학 신호인 형광을 검출한다.
검출 모듈은 광학신호의 세기에 따라 전기 신호를 발생시켜 광학 신호를 검출한다.
상기 검출 모듈은 샘플에서 방출되는 방출광을 감지하도록 형성된 검출기 및 샘플에서 방출되는 방출광을 필터하는 필터를 포함한다.
검출기는 샘플에 포함된 광학표지에서 방출되는 방출광을 감지할 수 있도록 형성된다. 상기 검출기는 광의 파장을 구분하여 파장별 광량을 감지하거나, 파장에 상관없이 총 광량을 감지하는 것일 수 있다. 구체적으로 상기 검출기는 예를 들어 포토 다이오드, 포토 다이오드 어레이, 광전자 증배관(photo multiplier tube; PMT), CCD 이미지 센서, CMOS 이미지 센서, APD(avalanche photodiode) 등을 사용할 수 있다.
검출기는 상기 샘플에 포함된 광학표지에서 방출되는 방출광을 감지할 수 있도록 형성된다.
구체적으로 상기 검출기는 상기 샘플에서 발생하는 방출광이 직접 상기 검출기에 도달할 수 있도록 상기 샘플을 향하여 형성될 수 있으며, 또는 반사체 또는 광섬유를 통하여 방출광이 검출기에 도달할 수 있도록 반사체 또는 광섬유를 향하여 형성될 수 있다.
검출 모듈의 필터는 상기 샘플에 포함된 광학표지에서 방출되는 방출광을 선택적으로 통과시키기 위한 필터이다. 샘플에 포함된 광학표지에서 방출되는 방출광 외 다른 파장영역의 광이 검출기에 감지되는 경우 광학신호를 정확히 검출할 수 없다. 본 개시의 검출필터는 광학표지에서 방출되는 방출광을 선택적으로 통과시켜 타겟을 정확히 검출할 수 있게 한다.
써멀 모듈은 핵산 증폭 반응을 수행하도록 구현된다. 이를 위해 써멀 모듈은 샘플이 수용된 샘플 홀더를 포함한다. 샘플 홀더는 복수의 홀들을 포함하고, 홀들에 반응 용기들이 위치할 수 있다. 반응 용기들은 샘플들을 포함할 수 있고, 샘플들로부터 형광이 방출된다. 샘플 홀더는 전도성 물질일 수 있다. 샘플 홀더가 반응 용기들과 접촉하면, 샘플 홀더로부터 반응 용기에 열이 전달될 수 있다. 예를 들어, 샘플 홀더는 알루미늄, 금, 은, 니켈 또는 구리 등 금속으로 제작될 수 있다. 또는 샘플 홀더가 아닌 별도의 구성이 반응 용기에 직접 에너지를 공급하여 반응 용기 내 샘플들의 온도를 조절할 수 있다. 이러한 경우 상기 샘플 홀더는 반응 용기들을 수용하지만, 반응 용기에 열을 전달하지 않도록 구성될 수 있다.
샘플 홀더의 일 예는 열 블록이다. 열 블록은 복수의 홀들을 포함하고, 홀들에 반응 용기들이 위치할 수 있다.
샘플 홀더의 다른 일 예는 가열 플레이트이다. 가열 플레이트는 샘플을 수용하는 플레이트에 얇은 금속을 접촉시킨 형태이다. 얇은 금속에 전류를 흘려 플레이트를 가열하는 방식으로 작동될 수 있다.
샘플 홀더의 또 다른 일 예는 하나 이상의 칩(chip) 또는 카트리지(cartridge)를 수용할 수 있는 수용부이다. 카트리지의 예는 유체 채널(flow channel)을 포함하는 유체 카트리지이다.
써멀 모듈은 샘플 홀더를 가열하거나 냉각시키기 위한 열 발생 소자, 방열판 및 방열팬을 추가적으로 포함할 수 있다.
구체적으로, 써멀 모듈은 PCR 기반의 핵산 증폭 반응에 이용된다. 보다 구체적으로, 써멀 모듈은 특정 뉴클레오타이드 서열을 갖는 DNA(deoxyribonucleic acid)를 증폭하기 위해 변성 단계(denaturing step), 어닐링 단계(annealing step), 연장(혹은 증폭) 단계(extension step)를 실시할 수 있다. 이 중, 변성 단계는 주형 핵산인 이중 가닥의 DNA를 포함하는 시료 및 시약을 포함하는 용액을 특정 온도, 예를 들어 약 95℃로 가열하여 이중 가닥의 DNA를 단일 가닥의 DNA로 분리하는 단계이다. 어닐링 단계는 증폭하고자 하는 핵산의 뉴클레오타이드 서열과 상보적인 뉴클레오타이드 서열을 갖는 올리고뉴클레오타이드(oligonucleotide) 프라이머를 제공하고, 분리된 단일 가닥의 DNA와 함께 특정 온도인 멜팅 온도(Tm), 예를 들어 60℃로 냉각하여 단일 가닥의 DNA의 특정 뉴클레오타이드 서열에 프라이머를 결합시켜 부분적인 DNA-프라이머 복합체를 형성하는 단계이다. 연장 단계는, 어닐링 단계 이후 상기 용액을 특정 온도, 예를 들어 72℃로 유지하여 DNA 중합효소(polymerase)에 의해 부분적인 DNA-프라이머 복합체의 프라이머를 기초로 이중 가닥의 DNA를 형성하는 단계이다.
일 실시예에서, 써멀 모듈은 전술한 3가지의 단계들을 예를 들어 10회 내지 50회로 반복함으로써 상기 특정 뉴클레오타이드 서열을 갖는 DNA를 기하급수적으로 증폭시킬 수 있다.
다른 실시예에서, 써머 모듈은 어닐링 단계와 연장 단계를 동시에 수행할 수 있다. 이 경우 써머 모듈은 변성 단계와 어닐링/연장 단계로 구성된 2 단계들을 수행함으로써, 하나의 사이클(순환)을 완성할 수도 있다.
구체적으로, 써멀 모듈은 등온 증폭 반응에 이용된다. 보다 구체적으로, 써멀 모듈은 특정 핵산 서열을 증폭하기 위하여, 선택된 온도를 유지하는 단계를 실시할 수 있다. 예를 들어, 써멀 모듈은 30℃ 내지 70℃에서 선택되는 온도를 유지시키며, 등온 증폭 반응이 수행되도록 할 수 있다.
이러한 핵산 검출 장치 또는 검출 장치는 증폭 반응을 위해 온도를 조절할 수 있는 한 종래 공지된 다양한 기기를 포함한다. 그 예로는 CFX(Bio-Rad), iCycler(Bio-Rad), LightCycler(Roche), StepOne(ABI), 7500 (ABI), ViiA7(ABI), QuantStudio(ABI), AriaMx(Agilent), Eco(Illumina) 등을 들 수 있으나, 이에 제한되지 않는다.
본 개시에서 표준 핵산 검출 장치는 사용자에 의해 사전에 지정될 수 있으며, 다른 핵산 검출 장치를 캘리브레이션 하는데 기준이 되는 디바이스일 수 있다. 이후에 설명되는 캘리브레이션 과정은 표준 핵산 검출 장치를 이용하여 다른 핵산 검출 장치를 캘리브레이션 하는 테스트들을 포함할 수 있다. 구체적으로, 표준 핵산 검출 장치로부터 출력되는 테스트의 결과 값들은 다른 핵산 검출 장치를 캘리브레이션 하는데 사용될 수 있다. 표준 핵산 검출 장치를 이용한 다른 핵산 검출 장치의 캘리브레이션 방법에 대한 보다 구체적인 설명은 이후 더 자세히 설명된다.
본 개시의 몇몇 실시예에 따른 핵산 검출 장치의 성능을 테스트하는 기존의 방법에 대해 도 1을 참조하여 설명하면 다음과 같다.
도 1은 핵산 검출 장치의 출고를 위해 캘리브레이션 및 테스트 과정 및 단계별 소요 시간을 나타내는 예시도이다.
구체적으로, 핵산 검출 장치(PCR 디바이스)가 입고(210)되고, 핵산 검출 장치의 옵틱(optic)을 캘리브레이션 하기 위한 테스트는 하나 이상의 옵틱 캘리브레이션을 단계를 포함할 수 있다. 예를 들어, 핵산 검출 장치의 옵틱을 캘리브레이션 하기 위한 테스트는 도 1에 도시된 바에 따라, HW(Hardware) Calibration(220) 단계 및 Dye Calibration(230) 단계로 진행될 수 있다. 이후 옵틱 캘리브레이션 하기 위한 테스트를 통해 옵틱 캘리브레이션 된 핵산 검출 장치에 대해 Noise Test(240)가 진행되고, Noise Test(240)에서 합격으로 결정된 핵산 검출 장치는 최종적으로 출고(250)된다. Noise Test(240)에서 불합격으로 결정된 핵산 검출 장치는 다시 Noise Test(240)를 진행하거나, 또는 출고되지 않도록 결정될 수도 있다.
노이즈 테스트는 핵산 검출 장치가 타겟 분석 물질의 검출에 사용될 수 있지 확인하는 시험을 포함한다. 일 구현예에 따르면, 노이즈 테스트는 Negative Control 조성물 (NC) 또는 Positive Control 조성물(PC) 중 적어도 하나를 이용하여 실시된다.
도 1의 210 단계는 예시로 PCR 디바이스가 입고되는 것으로 기재하였으나, 본 개시에서 핵산 검출 장치가 PCR 디바이스로 제한되어 해석되지 않아야 할 것이다.
이후에 설명되는 본 개시의 옵틱 캘리브레이션 과정은 핵산 검출 장치의 옵틱을캘리브레이션 하기 위한 임의의 형태의 테스트로 나타낼 수 있다. 예를 들어, 옵틱 캘리브레이션은 핵산 검출 장치의 노이즈를 테스트하는 단계 이전에 수행되는 임의의 형태의 테스트를 포함할 수 있다. 다른 예시로, 옵틱 캘리브레이션은 도 1에 도시된 HW Calibration(220) 단계에서 수행되는 테스트를 포함할 수 있다. 또한, 이후에 설명되는 본 개시의 노이즈의 수준(level)은 핵산 검출 장치의 노이즈에 대한 임의의 형태의 테스트를 나타낼 수 있다. 예를 들어, 노이즈의수준 추론은 1에 도시된 Noise Test(240)단계에서 수행될 수 있다.
본 개시의 옵틱 캘리브레이션은 상기 핵산 검출 장치에서 상기 샘플에 조사되는 광의 세기(intensity)를 조정하는하는 것을 특징으로 할 수 있다. 구체적으로, 본 개시의 옵틱 캘리브레이션은 핵산 검출 장치 또는 표준 핵산 검출 장치의 적어도 하나의 컴포넌트에 대해 사전 결정된 사이클 동안 사전 결정된 파장의 광을 조사하여 RFU 값을 측정하는 테스트를 포함할 수도 있다. 여기서, 핵산 검출 장치는 표준 핵산 검출 장치와 상이한 검출 장치일 수 있다.
핵산 검출 장치의 컴포넌트에 해당하는 복수개의 웰들 중 적어도 하나는 염료를 수용한 웰이고, 그리고 적어도 다른 하나는 염료가 없는 웰로 마련될 수 있다. 이와 같은 웰들을 캘리브레이션을 위한 핵산 검출 장치에 포함시키고, 그리고 사전 결정된 파장의 광을 조사하여 웰들로부터 RFU 값을 측정하는 테스트가 옵틱 캘리브레이션에 포함될 수 있다. 본 개시의 옵틱 캘리브레이션은 하나의 핵산 검출 장치에 대해 한번 이상 수행될 수도 있으며, 표준 핵산 검출 장치에 대해서도 한번 이상 수행될 수도 있다.
상기 옵틱 캘리브레이션은, 조사되는 광의 세기(intensity)를, 상기 옵틱 데이터와 소정의 기준치와의 비교 결과에 기초하여 조정할 수 있다.
또한, 옵틱 캘리브레이션에서 핵산 검출 장치 및 표준 핵산 검출 장치의 적어도 하나의 컴포넌트는 동일한 컴포넌트로 구성될 수 있다. 구체적으로, 옵틱 캘리브레이션은 표준 핵산 검출 장치의 컴포넌트인 웰들에 대해 실시되고, 이후에 핵산 검출 장치에 이전의 표준 핵산 검출 장치의 웰들을 사용하여 옵틱 캘리브레이션이 실시될 수도 있다.
예를 들어, 10개의 웰들 중 제 1 웰 및 제 2 웰에 대해서만 염료가 부가되고 나머지 8개의 웰은 염료가 부가되지 않은 웰들일 수 있다. 이러한 10개의 웰들에 대해 표준 핵산 검출 장치를 통해 사전 결정된 파장의 빛을 사전 결정된 사이클동안 조사하는 옵틱 캘리브레이션을 수행하여 웰들 각각에 대한 RFU 값들을 나타내는 로우 데이터가 획득될 수 있다. 또한, 이후에 표준 핵산 검출 장치에서 사용했던 10개의 웰들에 대해 옵틱 캘리브레이션을 위한 핵산 검출 장치를 통해 사전 결정된 파장의 빛을 사전 결정된 사이클동안 조사하는 옵틱 캘리브레이션을 수행하여 웰들 각각에 대한 RFU 값들을 나타내는 다른 로우 데이터가 획득될 수 있다. 이와 같이 획득된 표준 핵산 검출 장치의 로우 데이터와 핵산 검출 장치의 다른 로우 데이터를 비교하여 검출 장치의 옵틱이 캘리브레이션될 수 있다.
전술한 웰들의 개수는 예시들일 뿐이며, 전술한 예시들로 인해 본 개시의 컴포넌트가 제한되어 해석되지 않아야 할 것이다. 또한, 전술한 핵산 검출 장치 및 표준 핵산 검출 장치 각각에 대한 옵틱 캘리브레이션의 수행 순서는 예시일 뿐이며, 전술한 예시로 인해 본 개시의 옵틱 캘리브레이션의 수행 순서가 제한되어 해석되지 않아야 할 것이다.
상기 옵틱 캘리브레이션은, 상기 검출 장치의 광량의 측정 민감도를, 상기 옵틱 데이터와 소정의 기준치와의 비교 결과에 기초하여 조정하는 것을 특징으로 할 수 있다.
본 개시에서는 상기 옵틱 데이터로부터 광 측정 값 및 상기 광 측정 값을 수학적으로 가공한 광 피쳐(feature)를 추출하고, 상기 노이즈 수준을 추론하기 위해 상기 광 측정 값 및 광 피쳐를 상기 기계학습 모델에 입력할 수 있다.
전술한 예시와 상이한 방식으로, 핵산 검출 장치의 컴포넌트에 대해 먼저 옵틱 캘리브레이션이 수행되고, 이후에 표준 핵산 검출 장치에 이전의 핵산 검출 장치의 컴포넌트를 부가하여 옵틱 캘리브레이션이 수행될 수도 있다.
또한, 본 개시의 옵틱 캘리브레이션은 핵산 검출 장치에서 측정된 RFU 값과 핵산 검출 장치와 상이한 표준 핵산 검출 장치에서 측정된 RFU 값을 비교하는 테스트를 포함할 수도 있다. 구체적으로 본 개시에서 핵산 검출 장치를 옵틱 캘리브레이션 하는 것은 핵산 검출 장치를 표준 핵산 검출 장치로 캘리브레이션 하는 것일 수 있다. 구체적으로, 본 개시에서는 전술한 옵틱 캘리브레이션을 통해 핵산 검출 장치에 대해 옵틱 캘리브레이션을 수행할 수 있다. 이에 따라, 표준 핵산 검출 장치의 옵틱 캘리브레이션에 따른 로우 데이터에 기초하여 핵산 검출 장치를 캘리브레이션 하여, 표준 핵산 검출 장치의 옵틱 캘리브레이션의 다른 로우 데이터와 동일하거나 또는 사전 결정된 유사 기준보다 높게 유사한 옵틱 캘리브레이션 결과가 획득될 수 있다. 이와 같이, 본 개시의 옵틱 캘리브레이션은 측정된 표준 핵산 검출 장치의 RFU 값들과 핵산 검출 장치의 RFU 값들을 비교하는 테스트 과정을 추가로 포함할 수도 있다.
본 개시에서 로우 데이터(raw data)는 테스트로부터 얻을 수 있는 데이터이며, 본 개시의 테스트에 사용된 컴포넌트들 각각에 대해 테스트 결과를 나타내는 데이터일 수 있다. 예를 들어, 본 개시의 로우 데이터는 옵틱 캘리브레이션의 측정 데이터 중 하나일 수 있고, 구체적으로 옵틱 캘리브레이션이 수행된 컴포넌트인 웰들 각각에 대한 RFU 값을 나타내는 데이터일 수 있다. 로우 데이터는 웰들 각각에 대해 실시된 테스트의 결과 데이터일 수 있다. 또한, 로우 데이터는 웰들 각각에 대해 사전 결정된 사이클동안 측정된 RFU값들을 포함할 수도 있다.
또한, 본 개시의 로우 데이터는 컴포넌트인 웰의 순서 정보, 컴포넌트인 웰에 염료가 포함되었는지 여부를 나타내는 정보를 포함할 수 있다. 또한, 본 개시의 로우 데이터는 특정 파장 영역의 광을 선택적으로 검출시켜 검출되도록 검출 채널 정보를 포함할 수 있다. 또한, 본 개시의 로우 데이터는 신호값을 포함할 수 있다. 본 명세서에서 용어 "신호값"은 신호-발생 반응, 특히 증폭 반응의 사이클에서 실제적으로 측정된 신호의 수준(예컨대, 신호의 세기)을 일정한 스케일에 따라 수치화한 값 또는 이들의 변형값을 의미한다. 상기 변형값은 상기 실제적으로 측정된 신호값의 수학적으로 가공된 신호값을 포함할 수 있다. 실제적으로 측정된 신호값(즉, 로우 데이터의 신호값)의 수학적으로 가공된 신호값의 예는 측정된 신호값에 선택된 상수를 더하거나 곱하거나, 빼거나, 나누어 얻는 값, 로그값 또는 변화값(value of change)을 포함할 수 있다.
본 개시의 일 구현예에 따르면, 신호값은 검출기에서 해당 사이클 번호에서 최초로 검출되는 신호의 크기를 절대적 또는 상대적으로 정량화한 값을 의미한다. 상기 신호값은 다른 사이클과의 관계를 고려한 변화값을 포함할 수 있음에도 불구하고, 본 개시의 방법에서 1차 변화값을 계산할 때에는 변화값을 배제한 신호값을 사용하는 것이 바람직하다. 본 개시의 방법의 첫 단계에서 사용되는 신호값은, 1차 변화값 및 2차 변화값과 비교하여, "0차 신호값", "원시(raw) 신호값" 또는 "원래의(original) 신호값"으로도 불린다. 상기 신호값의 단위는 이용된 신호 발생 반응의 유형에 따라 달라질 수 있다. 예를 들어, 실시간 PCR 증폭 반응에 의해 각 사이클에서 신호값을 수득하는 경우, 상기 신호값은 RFU(Relative Fluorescence Unit)로 표시되는 값일 수 있다.
또한, 본 개시의 로우 데이터는 상기 신호값을 수학적으로 가공한 광 피쳐를 포함할 수 있다.
본 개시에서 사이클은 일정한 조건의 변화를 수반한 복수의 측정에 있어, 상기 조건의 변화 단위를 말한다. 상기 일정한 조건의 변화는 예를 들어 온도, 반응시간, 반응횟수, 농도, pH, 측정 대상(예를 들어 핵산)의 복제 횟수 등의 증가 또는 감소를 의미한다. 따라서 사이클은 시간(time) 또는 과정(process) 사이클, 단위 운영(unit operation) 사이클 및 재생산(reproductive) 사이클 일 수 있다. 이러한 용어 사이클은 일정한 과정의 반응을 반복하거나 일정한 시간 간격 기준으로 반응을 반복하는 경우, 상기 반복의 하나의 단위를 의미할 수 있다.
일례로, 중합효소 연쇄 반응(PCR)의 경우 하나의 사이클은 핵산의 변성단계(denaturation), 핵산과 프라이머의 결합 단계(hybridization 또는 annealing) 및 프라이머의 연장 단계(extension)를 포함하는 반응을 의미한다. 이 경우 일정한 조건의 변화는 반응의 반복 횟수의 증가이며, 상기 일련의 단계를 포함하는 반응의 반복 단위가 하나의 사이클로 설정된다. 즉, 본 개시의 사이클은 예를 들어, 하나의 사이클인 제 1 사이클에서 사전 결정된 횟수인 3회 동안 제 1 웰에 대해 테스트가 수행될 수 있다. 다른 예를 들어, 하나의 사이클인 제 1 사이클에서 사전 결정된 횟수인 10회 만큼 제 1 웰에 대해 테스트가 반복 수행될 수도 있다.
상기 사이클, 웰 및 사전 결정된 횟수에 대한 예시들로 인해 본 개시의 사이클, 웰 및 사이클의 사전 결정된 횟수가 제한되어 해석되지 않아야 할 것이다.
본 명세서에서 용어 "사이클 구간"은 데이터 세트에서 미리 정해진 수의 연속되는 사이클들로 이루어진 특정한 사이클 영역을 의미한다. 상기 복수의 사이클 구간들은 각각 시작 사이클 및 끝 사이클을 가진다. 상기 복수의 사이클 구간들은 동일한 수의 사이클로 이루어지는 동일한 크기의 사이클 구간일 수 있고, 서로 다른 수의 사이클로 이루어지는 서로 다른 크기의 사이클 구간일 수 있으며, 동일한 크기의 사이클 구간과 서로 다른 크기의 사이클 구간이 혼합된 것일 수도 있다. 예를 들어, 데이터 세트 전체는 8개의 사이클로 이루어지는 동일한 크기의 복수의 사이클 구간들로 나눌 수 있다. 또는, 데이터 세트의 베이스라인 영역(baseline region)은 10개의 연속되는 사이클로 이루어지는 사이클 구간들로 나누고, 지수기(exponential phase) 영역은 6개의 연속되는 사이클로 이루어지는 사이클 구간들로 나눌 수 있다.
본 개시에서 노이즈의 수준을 추론하는 것은 핵산 검출 장치의 성능을 확인하기 위한 테스트이며, 해당 핵산 검출 장치가 핵산 검출 반응을 수행하기에 적합한 성능을 가졌는지 또는 적합한 수준에 이르렀는지여부에 대한 테스트일 수 있다.
구체적으로, 노이즈의 수준을 추론하는 것은 핵산 검출 장치를 통해 임의의 시험 대상에 대해 핵산 검출 반응을 수행하는 경우 핵산 검출 장치 자체에서 노이즈 신호가 출력되는지 여부 또는 출력되는 노이즈 신호의 크기를 측정하는 것 중 적어도 하나에 대한 테스트일 수 있다.
보다 구체적으로, 노이즈의 수준을 추론하는 것은 핵산 검출 장치에 대한 Negative Control (NC) 조성물(reaction) 또는 Positive Control (PC) 조성물(reaction) 중 적어도 하나와 관련된 노이즈 테스트일 수 있다. 여기서 Negative Control 조성물 및 Positive Control 조성물은 일반적인 과학적 방법론에 따른 실험에서 사용되는 대조군일 수 있다. 구체적으로, Negative Control 조성물은 음성 대조군이며, 테스트 결과가 나오지 않을 것으로 예측되는 샘플일 수 있다. 즉, 실험 대상인 실험군의 테스트 결과와 상이한 테스트 결과를 가지는 것으로 예상되는 샘플이 음성 대조군일 수 있다. reaction mixture는 올리고, 엔자임을 포함하는 반응 혼합물이다.
NC는 reaction mixture에 표적 분석물질이 포함되지 않는다.
또한, Positive Control 조성물은 양성 대조군이며, 테스트 결과가 나올 것으로 예측되는 샘플일 수 있다. 즉, 실험군의 테스트 결과와 같은 테스트 결과를 가지는 것으로 예상되는 샘플이 양성 대조군일 수 있다.
PC는 reaction mixture에 표적 분석물질을 포함한다.본 개시에서 핵산 검출 장치의 성능은 핵산 검출 장치가 PCR을 수행하기 적합한지를 나타내는 임의의 형태의 지표일 수 있다. 예를 들어, 본 개시의 핵산 검출 장치의 성능은 핵산 검출 장치 자체에서 노이즈 신호를 출력하지 않는지 여부 또는 그 노이즈 신호의 크기에 기초하여 결정될 수도 있다. 이와 같은 핵산 검출 장치 자체에서 출력되는 노이즈 신호의 존재 여부 또는 노이즈 신호의 정량적인 수치는 전술한 노이즈에 대한 평가를 통해 측정될 수 있다.
본 명세서에서 용어 노이즈는 타겟 분석물의 존재 또는 부존재와 무관하게 발생하는, 원하지 않은(unwanted), 비분석적(non-analyte related) 신호를 의미한다. 예를 들어, 노이즈는 신호발생 반응의 실행 여부와 무관하게 측정 장비 자체에서 발생하는 전기적-노이즈가 신호로 기록된 것; 및 핵산증폭 곡선에서 베이스라인 영역의 노이즈를 포함한다. 따라서, 용어 노이즈는 신호의 급격한 증가 또는 감소를 포함하는 비정상적 신호와 다른 의미를 갖는다.
일례로, 본 개시의 노이즈는 핵산 검출 장치 자체에서 발생되는 신호로서 PCR 분석과 관련이 없는 신호를 의미할 수 있다. 이후에 사용자가 노이즈 신호가 출력되거나 그 노이즈 신호가 크게 출력되는 핵산 검출 장치를 이용하여 PCR 분석을 수행하는 경우에 잘못된 핵산 증폭 반응 분석 결과가 사용자에게 제공될 수도 있다. 이를 방지하기 위해, 본 개시에서는 이후에 설명되는 노이즈 수준을 추론하는 것을 통해 핵산 검출 장치를 출고하기 이전에 핵산 검출 장치 자체의 노이즈 수준이 판단될 수 있다.
본 개시에서 로우 데이터는 옵틱 캘리브레이션으로부터 획득된 로우 데이터일 수 있다. 예를 들어, 로우 데이터는 하나의 핵산 검출 장치에 대해 실시된 옵틱 캘리브레이션에서 획득된 컴포넌트들 각각에 대한 로우 데이터일 수 있다. 또한, 본 개시에서 핵산 검출 장치의 성능을 예측하기 위해, 노이즈에 대한 수준을 예측하는데 로우 데이터가 이용될 수 있다.
본 개시에서는 핵산 검출 장치의 옵틱 캘리브레이션에 이용되는 로우 데이터 중 광에 대한 정보를 갖고 있는 옵틱 데이터를 획득할 수 있다.
여기서, 옵틱 데이터는, 사전 결정된 사이클 동안 사전 결정된 파장의 광을 조사하여 획득된 광 측정값, 상기 광 측정값을 수학적으로 가공한 광 피쳐를 포함할 수 있다.
또한, 노이즈 수준을 추론하기 위해 기계학습 모델에 인퍼런스 데이터가 입력될 수도 있으며, 여기서 인퍼런스 데이터는 로우 데이터를 이용하여 생성될 수 있다.
이때의 노이즈 수준을 추론하는 것은 (핵산) 검출 장치에서 발생되는 노이즈의 수준을 기설정된 수치 또는 수준과 비교하여 상기 검출 장치에서 발생되는 노이즈 수준을 추론하는 것을 의미한다. 예컨대, 노이즈 수준이 기설정된 수치 또는 수준 이상인 경우 해당 검출 장치는 합격(pass) 검출 장치이고, 이하인 경우 해당 검출 장치는 불합격(fail) 검출 장치이다.
본 개시의 로우 데이터가 먼저 도 5를 참조하여 설명된다.
도 5는 본 개시의 몇몇 실시예에 따른 로우 데이터를 예시적으로 도시한 예시도이다.
도 5에 도시된 바와 같이, 로우 데이터(400)는 제 1 로우 데이터(401) 및 제 2 로우 데이터(402)를 포함할 수 있다. 제 1 로우 데이터(401) 및 제 2 로우 데이터(402)는 하나 이상의 파라미터들을 포함하여, 로우 데이터(400)도 하나 이상의 파라미터들을 포함할 수 있다.
구체적으로, 로우 데이터(400)에 포함되는 파라미터들은 도 5에 도시된 바와 같이 사전 결정된 파장에 대해 나타내는 제 1 파라미터(410), 컴포넌트인 웰에 대해 나타내는 제 2 파라미터(420), 컴포넌트에 염료가 포함되었는지 여부를 나타내는 제 3 파라미터(430), 사이클에 대해 나타내는 제 4 파라미터(440), 하나의 사이클에서 측정된 RFU 값들의 평균을 나타내는 제 5 파라미터(450), 하나의 사이클에서 측정된 RFU 값들의 최소값을 나타내는 제 6 파라미터(460) 하나의 사이클에서 측정된 RFU 값의 최대값을 나타내는 제 7 파라미터(470) 및 하나의 사이클에서 n번 바람직하게는 3회 RFU값 측정을 나타내는 제 8 파라미터(435)를 포함할 수 있다. 또한, 도 5에서는 별도의 참조 번호로 표시되지 않았지만 본 개시의 로우 데이터 (400)에는 시간, 채널 등을 나타내는 다른 파라미터들을 더 포함할 수도 있다.
전술한 파라미터들 및 도 5에 도시된 파라미터들은 예시들일 뿐이며, 전술한 예시들로 인해 본 개시의 로우 데이터에 포함될 수 있는 피쳐가 제한되어 해석되지 않아야 할 것이다.
본 개시에서 변수 데이터는 전술한 피쳐와 대응되는 값들을 나타내는 데이터일 수 있다. 즉, 변수 데이터는 피쳐에 대응되는 값들을 포함하는 데이터일 수 있다. 이에 따라, 로우 데이터는 포함하고 있는 피쳐들 각각에 대응하는 변수 데이터를 포함할 수 있다.
일례로, 광 피쳐의 변수 데이터는 광 피쳐의 명칭과 광 피쳐에 대응하는 값을 나타낼 수 있다.
구체적으로 도 5를 참조하여 예를 들면, 로우 데이터(400)에는 하나의 사이클에서 n번 바람직하게는 3번 RFU 측정을 반복했을 때 대응하는 RFU 값의 평균을 나타내는 제 5 파라미터(450)를 하나 이상 포함할 수 있다. 그리고 로우 데이터(400)는 제 5 파라미터(450)에 대응하여 하나의 사이클에서 n번 바람직하게는 3번 RFU 측정을 반복했을 때의 평균값들을 나타내는 제 1 변수 데이터(451)를 하나 이상 포함할 수도 있다.
전술한 피쳐 및 변수 데이터는 예시들일 뿐이며, 전술한 예시로 인해 본 개시의 피쳐 및 변수 데이터가 제한되어 해석되지 않아야 할 것이다.
본 개시에서 광 피쳐는 전술한 로우 데이터의 파라미터들 중 측정 장치의 노이즈와 관련된 파라미터일 수 있다. 또한, 광 피쳐는 RFU 값들로부터 산출될 수 있는 파라미터 또는 값일 수도 있다. 즉, 광 피쳐는 RFU값인 광 측정값을 수학적으로 가공한 파라미터 또는 값일 수도 있다.
구체적으로 광 피쳐는 핵산 검출 장치 성능과 관련이 높은 파라미터일 수 있으며, 또는 핵산 검출 장치 자체에서 생성되는 노이즈 발생과 관련이 높은 파라미터일 수 있다. 구체적으로 노이즈 발생과 관련이 높은 파라미터에 대해 예를 들면, RFU 값들의 분산, RFU 값들의 표준편차, RFU 값들의 평균, RFU 값들의 시계열 그래프에 대해 신호 분해하여 산출되는 추세(trend), 계절성(seasonal) 및 나머지(remainder) 또는 1차 단순 선형 회귀 선에 기초하여 RFU 값들에서 계산되는 잔차의 분산일 수 있다.
전술한 파라미터들은 예시들일 뿐이며, 전술한 예시들로 인해 본 개시의 노이즈 발생과 관련이 높은 파라미터가 제한되어 해석되지 않아야 할 것이다.
전술한 추세, 계절성 및 나머지는 통계학의 시계열 데이터 분석에서 시계열 패턴을 설명하기 위해 사용되는 데이터 요소일 수 있다. 구체적으로 추세, 계절성 및 나머지는 시계열 그래프로 표현될 수 있으며, 추세는 장기적으로 증가하거나 감소하는 데이터의 변동 패턴으로 표현될 수 있다. 또한, 계절성은 사전 결정된 시간의 주기에 따라 나타내는 패턴으로 표현될 수 있다. 또한, 나머지는 전술한 추세 및 계절성을 제외한 패턴으로 표현될 수 있으며, 랜덤 요소일 수 있다.
구체적으로 본 개시의 추세, 계절성 및 나머지에 대해서 도 6을 참조하여 설명된다.
도 6은 예시적인 시계열 그래프를 추세, 계절성 및 나머지를 분해하여 나타낸 그래프들이다.
도 6에 도시된 바와 같이, 전술한 로우 데이터와 같은 시계열 데이터를 그래프로 나타내는 경우 시계열 그래프(500)와 같이 표시될 수 있다. 또한, 시계열 그래프(500)를 시계열 분해하는 경우 시계열 그래프(500)의 추세를 제 1 그래프(510)로 나타낼 수 있고, 계절성을 제 2 그래프(520)로 나타낼 수 있고, 그리고 나머지를 제 3 그래프(530)로 나타낼 수 있다. 즉, 제 1 그래프(530), 제 2 그래프(520) 및 제 3 그래프(530)를 다시 합성하면 원래의 시계열 그래프(500)로 표현될 수 있다.
도 6은 그래프들은 시계열 데이터의 그래프, 추세, 계절성 및 나머지에 대한 예시들을 도시할 뿐이며, 도 6으로 인해 본 개시의 시계열 데이터, 추세, 계절성 및 나머지가 제한되어 해석되지 않아야 할 것이다.
또한 전술한 파라미터들에 따라, 본 개시의 광 피쳐는 핵산 검출 장치의 컴포넌트에 대해 측정된 RFU 값들의 분산 또는 표준편차를 나타내는 제 1 광피쳐를 포함할 수 있다. 구체적으로, 제 1 광 피쳐는 로우 데이터에 대해서 사전 결정된 사이클들 각각에서 측정된 RFU 값들의 분산 또는 표준편차를 나타낼 수 있다. 즉, 제 1 광 피쳐는 핵산 검출 장치의 하나의 컴포넌트에 대해서 실시된 테스트의 사전 결정된 사이클들 각각에서 측정된 RFU 값들의 분산 또는 표준편차를 나타낼 수 있다.
예를 들어, 하나의 제 1 웰에 대해서 캘리브레이션 과정이 사전 결정된 45 사이클동안 실시된 경우, 제 1 웰의 제 1 로우 데이터는 제 1 사이클 내지 제 45 사이클 각각에서 측정된 RFU 값들의 평균, 최대값 및 최소값을 포함할 수 있다. 여기서, 제 1 사이클에서 측정된 RFU 값들의 평균은 2000이고, 최대값은 3000이고, 그리고 최소값은 1000일 수도 있다. 또한, 제 2 사이클에서 측정된 RFU 값들의 평균은 2500이고, 최대값은 4000이고, 그리고 최소값은 1000일 수도 있다.
본 개시에서 RFU 값들의 평균, 최대값 및 최소값은 한 사이클 내에서 n번 바람직하게는 3번 반복하여 측정된 신호값의 평균, 최대값 및 최소값을 의미한다. 각 사이클 즉, 한 사이클 내에서 RFU를 10 번 이상 측정할 수 있기 때문이다.
이와 같이 제 1 로우 데이터는 제 1 사이클 내지 제 45 사이클 각각에서 측정된 RFU 값들의 평균, 최대값 및 최소값을 나타낼 수도 있다. 또한, 제 1 로우 데이터에 대한 제 1 광 피쳐는 전술한 제 1 사이클 내지 제 45 사이클 각각에 대해서 계산되는 분산 또는 표준편차일 수 있다. 구체적으로 제 1 사이클 내지 제 45 사이클 각각에서 측정된 RFU 값들의 평균, 최대값 및 최소값에 기초하여 사이클들 각각의 분산 또는 표준 편차가 계산될 수 있으며, 여기서는 45개의 제 1 광 피쳐가 계산될 수 있다.
전술한 사이클, RFU값들의 평균, 최대값 및 최소값은 예시들일 뿐이며, 전술한 예시들로 인해 본 개시의 사이클, RFU값들, 로우 데이터 또는 제 1 광 피쳐가 제한되어 해석되지 않아야 할 것이다.
또한, 본 개시의 광 피쳐는 핵산 검출 장치의 하나의 컴포넌트에 대해 RFU 값들의 평균을 나타내는 제 2 광 피쳐를 포함할 수도 있다. 구체적으로, 제 2 광 피쳐는 로우 데이터에 대해 사전 결정된 사이클들 각각의 RFU 값들에 대한 평균을 나타낼 수 있다.
예를 들어, 웰들 각각에 대해서 캘리브레이션 과정을 사전 결정된 10사이클동안 수행할 수도 있다. 또한, 사전 결정된 10 사이클들 중 하나의 사이클에서 사전 결정된 횟수만큼 테스트를 실시하여 RFU값들을 측정할 수 있다. 제 1 사이클 내지 제 10 사이클 각각의 RFU값들에 기초하여 사이클들 각각의 RFU값 평균을 계산할 수 있다. 즉, 제 1 사이클에서 측정된 RFU값들의 제 1 평균이 계산되고, 제 2 사이클에서 측정된 RFU값들의 제 2 평균이 계산될 수 있다. 이와 같이 계산되는 평균이 제 2 광 피쳐이며, 제 2 광 피쳐는 로우 데이터에 포함되는 파라미터들 중 하나일 수도 있다. 또한, 이 예시에서 10 사이클들에 대해 산출되는 평균값은 10개이므로, 제 2 광 피쳐도 10 사이클들 각각에 대응하여 10개가 산출될 수 있다.
전술한 사이클은 예시일 뿐이며, 전술한 예시로 인해 본 개시의 사이클, 로우 데이터 또는 제 2 광 피쳐가 제한되어 해석되지 않아야 할 것이다.
또한, 본 개시의 광 피쳐는 로우 데이터를 시계열 분해하여 산출되는 추세(trend)를 나타내는 제 3 광 피쳐, 로우 데이터 세트를 시계열 분해하여 산출되는 계절성(seasonal)을 나타내는 제 4 광 피쳐, 로우 데이터 세트를 시계열 분해하여 산출되는 추세 및 계절성 이외의 나머지(remainder)를 나타내는 제 5 광 피쳐를 포함할 수도 있다.
구체적으로, 본 개시의 사전 결정된 사이클들을 주기로 하여 측정된 RFU값들을 나타내는 로우 데이터는 시계열 데이터일 수 있으며, 이와 같은 로우 데이터를 분해하여 추세, 계절성 및 나머지가 계산될 수도 있다. 여기서 계산되는 추세의 평균 및 분산은 제 3 광 피쳐에 포함될 수 있고, 계절성의 평균 및 분산은 제 4 광 피쳐에 포함될 수 있고, 그리고 나머지의 평균 및 분산은 제 5 광 피쳐에 포함될 수도 있다.
또한, 본 개시의 광 피쳐는 옵틱 데이터에 선형 회귀 선을 적용하여 계산된 잔차의 분산을 포함하는 제 6 광 피쳐를 포함할 수도 있다.
여기서 잔차의 분산은 회귀분석에서 잔차의 분산을 계산하는데 사용되는 일반적인 계산법을 통해 계산된다.
또한, 본 개시의 광 피쳐는 하나의 컴포넌트 및 하나의 로우 데이터에 대응될 수 있으며, 로우 데이터에 이미 포함되어 있는 파라미터일 수도 있다. 예를 들어, 전술한 바와 같이, 1사이클에 대한 RFU 값들의 평균값은 하나의 로우 데이터에 이미 포함되어 있을 수도 있다. 여기서, 로우 데이터에 포함된 평균값을 나타내는 파라미터는 제 1 광 피쳐로 추출될 수 있다.
전술한 제 1 광 피쳐 및 사이클은 예시일 뿐이며, 전술한 예시로 인해 본 개시의 광 피쳐로 추출될 수 있는 파라미터 또는 사이클이 제한되어 해석되지 않아야 할 것이다.
구체적으로 도 5를 참조하여 예를 들면, 로우 데이터 (400)에는 사이클들 마다 대응하는 RFU 값의 평균을 나타내는 제 5 파라미터(450)를 하나 이상 포함할 수 있다. 그리고 로우 데이터 (400)는 제 5 파라미터(450)에 대응하여 사이클별로 평균값들을 나타내는 제 1 변수 데이터(451)를 하나 이상 포함할 수도 있다. 이 경우, 제 5 파라미터(450)는 제 1 광 피쳐로 식별될 수 있으며, 제 1 변수 데이터(451)는 제 1 광 피쳐에 대응하는 변수 데이터일 수 있다.
전술한 도 5에서의 파라미터 및 변수 데이터는 예시들일 뿐이며, 전술한 예시들 및 도 5로 인해 본 개시의 로우 데이터 세트에 포함되는 파라미터 또는 변수 데이터가 제한되어 해석되지 않아야 할 것이다.
본 개시에서 인퍼런스 데이터는 노이즈에 대한 수준을 예측하기 위해 기계학습 모델에 입력되는 데이터이며, 핵산 검출 장치의 성능과 관련이 높은 데이터를 포함할 수 있다. 구체적으로, 로우 데이터에 포함된 파라미터들 중 적어도 하나의 파라미터가 광 피쳐로 선택될 수 있다. 또한, 사전 결정된 p-value에 기초하여 광 피쳐들 중 적어도 하나를 인퍼런스 피쳐로 선택하여 본 개시의 인퍼런스 데이터로 생성될 수 있다. 따라서, 본 개시의 인퍼런스 데이터는 사전 결정된 p-value에 기초하여 선택된 인퍼런스 피쳐를 하나 이상 포함하는 데이터일 수 있다.
이에 따라, 하나의 인퍼런스 데이터는 로우 데이터 로부터 선택된 광 측정값, 하나 이상의 광 피쳐들 및 그들에 대응하는 변수 데이터를 포함할 수 있으며, 여기서 인퍼런스 데이터에 포함되는 인퍼런스 피쳐는 사전 결정된 p-value에 기초하여 추가로 선별된 광 측정값 및 광 피쳐일 수 있다. 본 개시의 사전 결정된 p-value는 이후에 자세히 설명된다.
본 개시에서는 하나의 컴포넌트에 대해 하나의 인퍼런스 데이터가 대응될 수 있거나, 또는 복수개의 컴포넌트를 포함하는 하나의 핵산 검출 장치에 대해 하나의 인퍼런스 데이터가 대응될 수도 있다. 본 개시에 대한 본 명세서에 전체에 걸쳐 특별히 명시하지 않은 인퍼런스 데이터는 하나의 핵산 검출 장치에 대한 인퍼런스 데이터를 의미한다.
본 개시에서 출력 데이터는 추론되는 노이즈에 대한 평가의 결과를 나타내는 데이터일 수 있다. 구체적으로, 본 개시의 출력 데이터는 기계학습 모델을 통해 출력되며, 핵산 검출 장치가 옵틱 캘리브레이션에 후속하는 노이즈에 대한 수준을 통과할 것인지 여부를 예측하는 결과를 포함할 수 있다. 또한, 출력 데이터는 핵산 검출 장치에 대해서 옵틱 캘리브레이션에 후속하는 노이즈에 대한 테스트를 생략할 것인지 여부를 예측하는 결과를 포함할 수도 있다.
본 개시에서는 노이즈 수준을 추론하기 위해 기계학습 모델에 로우 데이터 또는 인퍼런스 데이터 중 적어도 하나가 입력될 수 있다. 바람직하게, 핵산 검출 장치의 노이즈 수준을 추론하는 방법을 수행하는 본 개시의 컴퓨팅 장치는 로우 데이터 그 자체를 기계학습 모델에 입력할 수 있다. 또한, 본 개시의 컴퓨팅 장치는 로우 데이터를 전처리하여 인퍼런스 데이터로 생성하고, 생성된 인퍼런스 데이터를 기계학습 모델에 입력할 수도 있다.
본 개시에서 p-value는 통계학에서 사용되는 통계적 가설 검증의 유의 확률로서, 일반적으로 실험 데이터의 신뢰성을 증명하기 위해 사용된다. 연구 분야에서 실험 데이터의 p-value는 어느 한 가설이 옳다는 가정하에 현재의 실험 데이터의 값들이 얼마나 관찰될지에 대한 통계학적인 확률이다. 구체적으로, 연구 분야에서는 실험 결과 데이터에 기초하여 세운 실험 가설에 대한 p-value를 구하고, 사전 결정된 기준보다 높은 지 여부에 따라 실험 가설을 검증한다. p-value의 사전 결정된 기준은 모집단인 실험 데이터의 신뢰구간에 기초하여 결정될 수 있지만, 일반적으로 5%, 즉 0.05로 설정된다. 이후에 설명되는 본 개시의 p-value도 일반적인 기준인 0.05로 설정하고 있으나, 본 개시의 p-value는 0.05로 제한되지 않는다.
또한, 본 개시의 p-value는 로우 데이터의 파라미터들 중 핵산 검출 장치의 성능과 관련이 높은 일부 피쳐들을 선택하기 위한 기준으로 사용되는 임의의 형태의 통계학 기반의 기준값들의 일례이다. 이에 대한 구체적인 내용은 이후 도 7을 통해 자세히 설명한다. 본 개시의 기계학습 모델은 캘리브레이션 과정의 측정 결과에 기초하여 노이즈에 대한 평가의 결과를 예측하기 위한 모델일 수 있다. 구체적으로, 본 개시의 기계학습 모델은 옵틱 캘리브레이션의 결과인 로우 데이터 중 광에 대한 정보를 갖고 있는 옵틱 데이터의 적어도 일부에 기초하여 노이즈 수준의 합격 또는 불합격인지 예측하기 위한 모델일 수 있다. 여기서 노이즈 수준의 합격은기설정된 수준 또는 수치를 통과한 것과 같으며, 해당 핵산 검출 장치의 성능이 우수하여 출고 가능한 상태임을 의미할 수 있다. 또한, 노이즈 수준의 불합격은 노이즈 수준이 기설정된 수준 또는 수치를 통과하지 못한 것과 같으며, 해당 핵산 검출 장치의 성능이 열등하여 출고 가능한 상태가 아님을 의미할 수 있다. 이후 핵산 검출 장치의 평가 결과를 추론하는 것은 핵산 검출 장치의 노이즈 수준을 추론하는 것으로 볼 수 있다.
이에 따라, 본 개시의 기계학습 모델은 SVM(Support Vector Machine) 또는 부분 최소 제곱법(Partial Least Squares)을 이용하여 출력 데이터를 출력하는 모델일 수 있다.
도 4는 본 개시의 일 실시예에 따른 노이즈 수준추론부에 대한 구성도이다. 도 4를 참조하면 노이즈 수준 추론부(124)는 기계학습 모델을 포함한다.
본 개시의 기계학습 모델은 광 측정값 및 복수의 종류의 광 피쳐들에 대응되는 적어도 세 개의 분류기(classifier)를 하나 이상 포함할 수도 있다. 구체적으로, 광 측정값에 대응되는 분류기, 광 피쳐들 각각의 변수 데이터에 대응되는 분류기를 하나 이상 포함할 수 있다. 또한, 본 개시의 기계학습 모델은 인퍼런스 피쳐들의 사전 결정된 조합의 개수에 대응되는 개수의 분류기를 포함할 수도 있다. 구체적으로, 인퍼런스 피쳐들 각각의 변수 데이터에 대응되는 분류기를 하나 이상 포함할 수 있다.
상기 적어도 세개의 분류기 각각은 하나의 광 측정값 및 광 피쳐를 입력 받도록 구현될 수도 있지만, 적어도 두 개의 광 피쳐를 입력 받도록 구현될 수도 있다.
상기 적어도 세개의 분류기 각각은, 대응되는 광 측정값 및 광 피쳐가 입력되면 상기 검출 장치의 예비적 노이즈 수준으로서 합격과 불합격 중 어느 하나를 출력할 수 있다. 본 개시의 추가적인 실시예에서, 본 개시는 분리형 군집화 알고리즘을 사용하여 노이즈에 대한 평가에 대한 결과를 예측할 수 있다. 예를 들어, 컴퓨팅 장치는 K-means Clustering을 사용하여 입력되는 인퍼런스 데이터 또는 로우 데이터 세트에 기반하여 노이즈에 대한 수준을 예측하는 출력을 생성할 수 있다.
K-means Clustering의 학습 방식과 관련하여, K-means Clustering에서의 각 군집(group)은 하나의 중심(centroid)을 가질 수 있으며, 입력되는 학습 데이터는 가장 가까운 중심에 속한 군집에 할당될 수 있다. 군집의 개수인 K가 지정되는 경우, K를 하이퍼 파라미터로 사용하여 학습 또는 반복되는 방식으로 K-means Clustering이 이용될 수 있다.
K-means Clustering의 학습 또는 반복은 일례로 EM(expectation-maximization) 알고리즘에 기반하여 수행될 수 있다. 예를 들어, 컴퓨팅 장치는 군집의 중심을 무작위로 결정하고, 결정된 중심을 기반으로 클러스터링을 수행하고, 클러스터링된 군집에 포함된 데이터의 평균값을 계산하는 방식을 반복할 수 있다. 컴퓨팅 장치는 추가적인 반복이 있어도 결과가 바뀌지 않는 상황에 도달할 때까지 전술한 반복을 계속함으로써 학습 데이터 셋에 대한 클러스터링을 수행할 수 있다.
본 명세서에 걸쳐, 분류기, 연산 모델, 신경망 모델, 신경망, 네트워크 함수, 뉴럴 네트워크(neural network)는 상호 교환 가능하게 사용될 수 있으며 전술한 표현들은 기계학습 모델의 범주 내에 포함될 수 있다. 신경망은 일반적으로 노드라 지칭될 수 있는 상호 연결된 계산 단위들의 집합으로 구성될 수 있다. 이러한 노드들은 뉴런(neuron)들로 지칭될 수도 있다. 신경망은 적어도 하나 이상의 노드들을 포함하여 구성된다. 신경망들을 구성하는 노드(또는 뉴런)들은 하나 이상의 링크에 의해 상호 연결될 수 있다.
신경망 내에서, 링크를 통해 연결된 하나 이상의 노드들은 상대적으로 입력 노드 및 출력 노드의 관계를 형성할 수 있다. 입력 노드 및 출력 노드의 개념은 상대적인 것으로서, 하나의 노드에 대하여 출력 노드 관계에 있는 임의의 노드는 다른 노드와의 관계에서 입력 노드 관계에 있을 수 있으며, 그 역도 성립할 수 있다. 상술한 바와 같이, 입력 노드 대 출력 노드 관계는 링크를 중심으로 생성될 수 있다. 하나의 입력 노드에 하나 이상의 출력 노드가 링크를 통해 연결될 수 있으며, 그 역도 성립할 수 있다.
하나의 링크를 통해 연결된 입력 노드 및 출력 노드 관계에서, 출력 노드의 데이터는 입력 노드에 입력된 데이터에 기초하여 그 값이 결정될 수 있다. 여기서 입력 노드와 출력 노드를 상호 연결하는 링크는 가중치(weight)를 가질 수 있다. 가중치는 가변적일 수 있으며, 신경망이 원하는 기능을 수행하기 위해, 사용자 또는 알고리즘에 의해 가변 될 수 있다. 예를 들어, 하나의 출력 노드에 하나 이상의 입력 노드가 각각의 링크에 의해 상호 연결된 경우, 출력 노드는 상기 출력 노드와 연결된 입력 노드들에 입력된 값들 및 각각의 입력 노드들에 대응하는 링크에 설정된 가중치에 기초하여 출력 노드 값을 결정할 수 있다.
상술한 바와 같이, 신경망은 하나 이상의 노드들이 하나 이상의 링크를 통해 상호 연결되어 신경망 내에서 입력 노드 및 출력 노드 관계를 형성한다. 신경망 내에서 노드들과 링크들의 개수 및 노드들과 링크들 사이의 연관관계, 링크들 각각에 부여된 가중치의 값에 따라, 신경망의 특성이 결정될 수 있다. 예를 들어, 동일한 개수의 노드 및 링크들이 존재하고, 링크들의 가중치 값이 상이한 두 신경망이 존재하는 경우, 두 개의 신경망들은 서로 상이한 것으로 인식될 수 있다.
신경망은 하나 이상의 노드들의 집합으로 구성될 수 있다. 신경망을 구성하는 노드들의 부분 집합은 레이어(layer)를 구성할 수 있다. 신경망을 구성하는 노드들 중 일부는, 최초 입력 노드로부터의 거리들에 기초하여, 하나의 레이어(layer)를 구성할 수 있다. 예를 들어, 최초 입력 노드로부터 거리가 n인 노드들의 집합은, n 레이어를 구성할 수 있다. 최초 입력 노드로부터 거리는, 최초 입력 노드로부터 해당 노드까지 도달하기 위해 거쳐야 하는 링크들의 최소 개수에 의해 정의될 수 있다. 그러나, 이러한 레이어의 정의는 설명을 위한 임의적인 것으로서, 신경망 내에서 레이어의 차수는 상술한 것과 상이한 방법으로 정의될 수 있다. 예를 들어, 노드들의 레이어는 최종 출력 노드로부터 거리에 의해 정의될 수도 있다.
최초 입력 노드는 신경망 내의 노드들 중 다른 노드들 과의 관계에서 링크를 거치지 않고 데이터가 직접 입력되는 하나 이상의 노드들을 의미할 수 있다. 또는, 신경망 네트워크 내에서, 링크를 기준으로 한 노드 간의 관계에 있어서, 링크로 연결된 다른 입력 노드들을 가지지 않는 노드들을 의미할 수 있다. 이와 유사하게, 최종 출력 노드는 신경망 내의 노드들 중 다른 노드들 과의 관계에서, 출력 노드를 가지지 않는 하나 이상의 노드들을 의미할 수 있다. 또한, 히든 노드는 최초 입력 노드 및 최후 출력 노드가 아닌 신경망을 구성하는 노드들을 의미할 수 있다.
본 개시의 일 실시예에 따른 신경망은 입력 레이어의 노드의 개수가 출력 레이어의 노드의 개수와 동일할 수 있으며, 입력 레이어에서 히든 레이어로 진행됨에 따라 노드의 수가 감소하다가 다시 증가하는 형태의 신경망일 수 있다. 또한, 본 개시의 다른 일 실시예에 따른 신경망은 입력 레이어의 노드의 개수가 출력 레이어의 노드의 개수 보다 적을 수 있으며, 입력 레이어에서 히든 레이어로 진행됨에 따라 노드의 수가 감소하는 형태의 신경망일 수 있다. 또한, 본 개시의 또 다른 일 실시예에 따른 신경망은 입력 레이어의 노드의 개수가 출력 레이어의 노드의 개수보다 많을 수 있으며, 입력 레이어에서 히든 레이어로 진행됨에 따라 노드의 수가 증가하는 형태의 신경망일 수 있다. 본 개시의 또 다른 일 실시예에 따른 신경망은 상술한 신경망들의 조합된 형태의 신경망일 수 있다.
딥 뉴럴 네트워크(DNN: deep neural network, 심층신경망)는 입력 레이어와 출력 레이어 외에 복수의 히든 레이어를 포함하는 신경망을 의미할 수 있다. 딥 뉴럴 네트워크를 이용하면 데이터의 잠재적인 구조(latent structures)를 파악할 수 있다. 즉, 사진, 글, 비디오, 음성, 음악의 잠재적인 구조(예를 들어, 어떤 물체가 사진에 있는지, 글의 내용과 감정이 무엇인지, 음성의 내용과 감정이 무엇인지 등)를 파악할 수 있다. 딥 뉴럴 네트워크는 컨볼루션 뉴럴 네트워크(CNN: convolutional neural network), 리커런트 뉴럴 네트워크(RNN: recurrent neural network), 오토 인코더(auto encoder), GAN(Generative Adversarial Networks), 제한 볼츠만 머신(RBM: restricted boltzmann machine), 심층 신뢰 네트워크(DBN: deep belief network), Q 네트워크, U 네트워크, 샴 네트워크, 적대적 생성 네트워크(GAN: Generative Adversarial Network) 등을 포함할 수 있다. 전술한 딥 뉴럴 네트워크의 기재는 예시일 뿐이며 본 개시는 이에 제한되지 않는다.
본 개시의 일 실시예에서 네트워크 함수는 오토 인코더(autoencoder)를 포함할 수도 있다. 오토 인코더는 입력 데이터와 유사한 출력 데이터를 출력하기 위한 인공 신경망의 일종일 수 있다. 오토 인코더는 적어도 하나의 히든 레이어를 포함할 수 있으며, 홀수 개의 히든 레이어가 입출력 레이어 사이에 배치될 수 있다. 각각의 레이어의 노드의 수는 입력 레이어의 노드의 수에서 병목 레이어(인코딩)라는 중간 레이어로 축소되었다가, 병목 레이어에서 출력 레이어(입력 레이어와 대칭)로 축소와 대칭되어 확장될 수도 있다. 오토 인코더는 비선형 차원 감소를 수행할 수 있다. 입력 레이어 및 출력 레이어의 수는 입력 데이터의 전처리 이후에 차원과 대응될 수 있다. 오토 인코더 구조에서 인코더에 포함된 히든 레이어의 노드의 수는 입력 레이어에서 멀어질수록 감소하는 구조를 가질 수 있다. 병목 레이어(인코더와 디코더 사이에 위치하는 가장 적은 노드를 가진 레이어)의 노드의 수는 너무 작은 경우 충분한 양의 정보가 전달되지 않을 수 있으므로, 특정 수 이상(예를 들어, 입력 레이어의 절반 이상 등)으로 유지될 수도 있다.
뉴럴 네트워크 및 기계학습 모델은 교사 학습(supervised learning), 비교사 학습(unsupervised learning), 반교사학습(semi supervised learning), 또는 강화학습(reinforcement learning) 중 적어도 하나의 방식으로 학습될 수 있다. 뉴럴 네트워크 및 기계학습 모델의 학습은 뉴럴 네트워크가 특정한 동작을 수행하기 위한 지식을 뉴럴 네트워크 또는 기계학습 모델에 적용하는 과정일 수 있다. 이후 설명되는 뉴럴 네트워크의 학습 및 학습 데이터에 대한 내용은 본 개시의 기계학습 모델의 학습 및 학습 데이터에 대한 내용일 수도 있다.
뉴럴 네트워크는 출력의 오류를 최소화하는 방향으로 학습될 수 있다. 뉴럴 네트워크의 학습에서 반복적으로 학습 데이터를 뉴럴 네트워크에 입력시키고 학습 데이터에 대한 뉴럴 네트워크의 출력과 타겟의 에러를 계산하고, 에러를 줄이기 위한 방향으로 뉴럴 네트워크의 에러를 뉴럴 네트워크의 출력 레이어에서부터 입력 레이어 방향으로 역전파(backpropagation)하여 뉴럴 네트워크의 각 노드의 가중치를 업데이트 하는 과정이다. 교사 학습의 경우 각각의 학습 데이터에 정답이 라벨링 되어 있는 학습 데이터를 사용하며(즉, 라벨링된 학습 데이터), 비교사 학습의 경우는 각각의 학습 데이터에 정답이 라벨링 되어 있지 않을 수 있다. 즉, 예를 들어 데이터 분류에 관한 교사 학습의 경우의 학습 데이터는 학습 데이터 각각에 카테고리가 라벨링 된 데이터 일 수 있다. 라벨링된 학습 데이터가 뉴럴 네트워크에 입력되고, 뉴럴 네트워크의 출력(카테고리)과 학습 데이터의 라벨을 비교함으로써 오류(error)가 계산될 수 있다. 다른 예로, 데이터 분류에 관한 비교사 학습의 경우 입력인 학습 데이터가 뉴럴 네트워크 출력과 비교됨으로써 오류가 계산될 수 있다. 계산된 오류는 뉴럴 네트워크에서 역방향(즉, 출력 레이어에서 입력 레이어 방향)으로 역전파 되며, 역전파에 따라 뉴럴 네트워크의 각 레이어의 각 노드들의 연결 가중치가 업데이트 될 수 있다. 업데이트 되는 각 노드의 연결 가중치는 학습률(learning rate)에 따라 변화량이 결정될 수 있다. 입력 데이터에 대한 뉴럴 네트워크의 계산과 에러의 역전파는 학습 사이클(epoch)을 구성할 수 있다. 학습률은 뉴럴 네트워크의 학습 사이클의 반복 횟수에 따라 상이하게 적용될 수 있다. 예를 들어, 뉴럴 네트워크의 학습 초기에는 높은 학습률을 사용하여 뉴럴 네트워크가 빠르게 일정 수준의 성능을 확보하도록 하여 효율성을 높이고, 학습 후기에는 낮은 학습률을 사용하여 정확도를 높일 수 있다.
뉴럴 네트워크의 학습에서 일반적으로 학습 데이터는 실제 데이터(즉, 학습된 뉴럴 네트워크를 이용하여 처리하고자 하는 데이터)의 부분집합일 수 있으며, 따라서, 학습 데이터에 대한 오류는 감소하나 실제 데이터에 대해서는 오류가 증가하는 학습 사이클이 존재할 수 있다. 과적합(overfitting)은 이와 같이 학습 데이터에 과하게 학습하여 실제 데이터에 대한 오류가 증가하는 현상이다. 예를 들어, 노란색 고양이를 보여 고양이를 학습한 뉴럴 네트워크가 노란색 이외의 고양이를 보고는 고양이임을 인식하지 못하는 현상이 과적합의 일종일 수 있다. 과적합은 머신러닝 알고리즘의 오류를 증가시키는 원인으로 작용할 수 있다. 이러한 과적합을 막기 위하여 다양한 최적화 방법이 사용될 수 있다. 과적합을 막기 위해서는 학습 데이터를 증가시키거나, 레귤라이제이션(regularization), 학습의 과정에서 네트워크의 노드 일부를 비활성화하는 드롭아웃(dropout), 배치 정규화 레이어(batch normalization layer)의 활용 등의 방법이 적용될 수 있다.
도 2는 본 개시의 일 실시예에 따라 핵산 검출 장치의 노이즈 수준을 론하기 위한 컴퓨팅 장치의 블록 구성도이다.
도 2에 도시된 컴퓨팅 장치(100)의 구성은 간략화 하여 나타낸 예시일 뿐이다. 본 개시의 일 실시예에서 컴퓨팅 장치(100)는 컴퓨팅 장치(100)의 컴퓨팅 환경을 수행하기 위한 다른 구성들이 포함될 수 있고, 개시된 구성들 중 일부만이 컴퓨팅 장치(100)를 구성할 수도 있다.
본 개시의 컴퓨팅 장치(100)는 입력부(110), 프로세서(120), 메모리(130)를 포함할 수 있다.
프로세서(120)는 하나 이상의 코어로 구성될 수 있으며, 컴퓨팅 장치의 중앙 처리 장치(CPU: central processing unit), 범용 그래픽 처리 장치 (GPGPU: general purpose graphics processing unit), 텐서 처리 장치(TPU: tensor processing unit) 등의 데이터 분석을 위한 프로세서를 포함할 수 있다. 프로세서(120)는 메모리(130)에 저장된 컴퓨터 프로그램을 판독하여 본 개시의 일 실시예에 따른 기계학습을 위한 데이터 처리를 수행할 수 있다. 예를 들어, 프로세서(120)는 본 개시의 도 8 및 도 9에서 기재되는 단계들을 수행할 수 있다.
프로세서(120)의 CPU, GPGPU, 및 TPU 중 적어도 하나가 네트워크 함수 또는 기계학습 모델의 학습을 처리할 수 있다. 예를 들어, CPU 와 GPGPU가 함께 네트워크 함수 또는 기계학습 모델의 학습, 네트워크 함수 또는 기계학습 모델을 이용한 데이터 분류를 처리할 수 있다. 또한, 본 개시의 일 실시예에서 복수의 컴퓨팅 장치의 프로세서를 함께 사용하여 네트워크 함수 또는 기계학습 모델의 학습, 네트워크 함수 또는 기계학습 모델을 이용한 데이터 분류를 처리할 수 있다. 또한, 본 개시의 일 실시예에 따른 컴퓨팅 장치에서 수행되는 컴퓨터 프로그램은 CPU, GPGPU 또는 TPU 실행가능 프로그램일 수 있다.
본 개시의 일 실시예에 따르면, 메모리(130)는 프로세서(120)가 생성하거나 결정한 임의의 형태의 정보 및 입력부(110)가 수신한 임의의 형태의 정보를 저장할 수 있다.
본 개시의 일 실시예에 따르면, 메모리(130)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 컴퓨팅 장치(100)는 인터넷(internet) 상에서 상기 메모리(130)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작할 수도 있다. 전술한 메모리에 대한 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
본 개시에서 입력부(110)는 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 단거리 통신망(PAN: Personal Area Network), 근거리 통신망(WAN: Wide Area Network) 등 다양한 통신망으로 구성될 수 있다. 또한, 상기 네트워크는 공지의 월드와이드웹(WWW: World Wide Web)일 수 있으며, 적외선(IrDA: Infrared Data Association) 또는 블루투스(Bluetooth)와 같이 단거리 통신에 이용되는 무선 전송 기술을 이용할 수도 있다.
본 명세서에서 설명된 기술들은 위에서 언급된 네트워크들뿐만 아니라, 다른 네트워크들에서도 사용될 수 있다.
도 3은 본 개시의 일 실시 예에 따라 핵산 검출 장치의 노이즈 수준을 추론하기 위한 프로세서(120)에 대한 구성도이다.
도 3을 참조하면, 프로세서(120)는 광 측정값 추출부(121), 광 피쳐 추출부(122) 및 노이즈 수준 추론부(124)를 포함한다.
광 측정값 추출부(121)는 옵틱 데이터로부터 광 측정값을 추출한다.
광 피쳐 추출부(122)는 옵틱 데이터 로부터 상기 광 측정값을 수학적으로 가공한 광 피쳐를 추출한다.
노이즈 수준 추론부(124)는 광 측정 데이터 세트를 입력으로 하는 기 학습된 기계학습 모델을 사용하여, 핵산 검출 장치에서 발생되는 노이즈 수준을 추론한다.
본 개시의 프로세서(120)는 핵산 검출 장치의옵틱을 캘리브레이션 하기 위한 옵틱 캘리브레이션에서 생성되는 로우 데이터를 획득할 수 있다.
광 측정값 추출부(121)는 로우 데이터 중 광에 대한 정보를 갖고 있는 옵틱 데이터로부터 광 측정값인 RFU 값을 추출할 수 있다.
광 피쳐 추출부(122)는 로우 데이터로부터, 핵산 검출 장치의 노이즈와 관련되는 적어도 하나의 파라미터를 추출할 수 있다. 구체적으로, 로우 데이터 로부터 노이즈에 대한 수준을예측하는데 사용될 수 있는 파라미터를 하나 이상 추출할 수 있다. 이와 같이 추출된 파라미터들은 전술한 광 피쳐로 선택될 수 있다.
본 개시의 광 피쳐 추출부(122)는 적어도 하나의 광 피쳐에 기초하여, 노이즈의 수준을예측하는데 사용될 인퍼런스 데이터를 생성할 수 있다. 구체적으로, 광 피쳐 추출부(122)는 추출된 광 피쳐를 획득하고, 광 피쳐에 기초하여 전술한 인퍼런스 데이터를 생성할 수 있다. 일례로, 인퍼런스 데이터는 광 피쳐들에 통계학적 기준값을 적용시키는 방식으로 생성될 수 있다. 통계학적 기준값에 대한 일례로 p-value가 존재한다.
본 개시의 노이즈 평가 결과 추출부(124)는 인퍼런스 데이터 또는 로우 데이터 세트를 기계학습 모델에 입력하여 노이즈 수준을 예측하는 출력 데이터를 획득할 수 있다
전술한 옵틱 캘리브레이션, 노이즈의 수준, 로우 데이터 세트, 광 피쳐, 인퍼런스 데이터, 출력 데이터 및 기계학습 모델 등은 이후 도면들을 참조하여 자세히 설명된다.
이하에서는 도면들을 참조하여 핵산 검출 장치의 성능을 예측하기 위한 방법 및 그 방법을 수행하는 컴퓨팅 장치에 대해 설명한다.
프로세서(120)는 핵산 검출 장치 옵틱 캘리브레이션 하기 위한 옵틱 캘리브레이션에서 생성되는 로우 데이터를 획득할 수 있다. 보다 구체적으로, 프로세서(120)는 핵산 검출 장치의 적어도 하나의 컴포넌트에 대해서 사전 결정된 사이클 동안 사전 결정된 파장의 광을 조사함으로써 획득되는 RFU와 관련된 로우 데이터를 포함하는 로우 데이터 세트를 획득할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(120)는 광 측정값 추출부(121) 및 광 피쳐 추출부(122)를 통해 로우 데이터 로부터, 핵산 검출 장치의 노이즈와 관련된 적어도 하나의 파라미터를 추출하여 광 피쳐로 결정할 수 있다. 본 개시의 광 피쳐는 전술한 바와 같이 제 1 광 피쳐, 제 2 광 피쳐, 제 3 광 피쳐, 제 4 광 피쳐, 제 5 광 피쳐 또는 제 6 광 피쳐 중 적어도 하나를 포함할 수 있다.
추가적으로, 본 개시의 광 피쳐는 핵산 검출 장치의 컴포넌트에 대해 RFU 값들의 사전 결정된 사이클들 각각에 대해 산출된 표준편차의 평균을 나타내는 제 7 광 피쳐를 더 포함할 수도 있다. 또한, 본 개시의 광 피쳐는 핵산 검출 장치의 컴포넌트에 대해 사전 결정된 사이클들 전체에 대한 RFU값들의 총 평균을 나타내는 제 8 광 피쳐를 더 포함할 수도 있다.
예를 들어, 사전 결정된 사이클이 20사이클일 경우, 총 사이클에 대한 표준편차의 평균은 로우 데이터에서 20 사이클 각각에 대해 계산된 표준편차의 합에 20을 나누어 계산될 수 있다. 여기서, 총 사이클에 대한 표준편차의 평균은 제 7 광 피쳐에 포함될 수 있다. 전술한 사이클은 예시일 뿐이며, 전술한 예시로 인해 본 개시의 사이클이 제한되어 해석되지 않아야 할 것이다.
본 개시의 다른 일 실시예에 따르면, 프로세서(120)는 광 피쳐 추출부(122)를 통해서,
이전에 선택된 적어도 하나의 광 피쳐에 기초하여, 노이즈에 대한 수준을 예측하는데 사용될 인퍼런스 데이터를 생성할 수도 있다. 여기서 노이즈 수준 예측은 전술한 바와 같이 핵산 검출 장치의 노이즈와 관련된 테스트일 수 있으며, 옵틱 캘리브레이션과 노이즈 수준 예측은 상이한 테스트일 수 있다.
구체적으로, 프로세서(120)는 사전 결정된 p-value에 기초하여, 추출된 적어도 하나의 파라미터들 중에서 핵산 검출 장치의 성능과 관련성이 임계치 이상인 광 피쳐를 인퍼런스 피쳐로 선택할 수도 있다. 여기서, 본 개시의 프로세서(120)는 선택된 인퍼런스 피쳐 및 그에 대응하는 변수 데이터에 기초하여, 인퍼런스 데이터를 생성할 수 있다. 구체적으로, 본 개시의 프로세서(120)는 인퍼런스 데이터 생성 모듈(160)을 통해 인퍼런스 피쳐로 선택된 광 피쳐의 변수 데이터에 기초하여, 인퍼런스 데이터를 생성할 수 있다.
여기서 임계치는 p-value와 관련된 기준값으로, 도 7을 참조하여 p-value에 기초하여 광 피쳐 중 적어도 일부를 인퍼런스 피쳐로 선택하는 것에 대해 설명하면 다음과 같다.
도 7은 본 개시의 일 실시예에 따라 2개의 컴포넌트 각각에 대한 예시적인 광 피쳐의 값들을 막대 그래프로 나타내고 있다.
구체적으로, 도 7에 도시된 막대 그래프(600)의 x축은 제 1 컴포넌트(10) 및 제 2 컴포넌트(20) 각각에 대한 제 1 광 피쳐 및 제 2 광 피쳐를 사전 결정된 사이클별로 나타내고 있고, 그리고 제 3 내지 제 8 광 피쳐를 나타내고 있다.
구체적으로, 도 7에 도시된 그래프의 x축에 표시된 광 피쳐들을 설명하면 다음과 같다. 사전 결정된 사이클을 “c01” 내지 “c10”으로 표시되어 총 10 사이클을 표시하고 있다. 이에 따라, “sd_c01” 내지 “sd_c010”은 각 사이클에서 측정된 RFU값들의 표준편차인 제 1 광 피쳐를 나타내고, “m_c01” 내지 “m_c010”은 각 사이클에서 측정된 RFU값들의 평균인 제 2 광 피쳐를 나타낸다. “sd_original”은 사이클들 각각의 표준편차의 평균인 제 7 광 피쳐를 나타내며, 전술한 바와 같이, 1 사이클 내지 10사이클 각각의 표준편차들에 기초하여 산출된 평균을 나타낸다. “m_original”은 사전 결정된 사이클들 각각의 평균들에 기초하여 산출되는 총 평균인 제 8 광 피쳐를 나타내며, 제 8 광 피쳐는 전술한 바와 같다. “m_trend”는 추세를 나타내는 제 3 광 피쳐의 평균을 나타내고, “sd_trend”는 제 3 광피쳐의 표준편차를 나타낸다. “m_seasonal”은 계절성을 나타내는 제 4 광 피쳐의 평균을 나타내고, “sd_seasonal”은 제 4 광 피쳐의 표준편차를 나타낸다. “m_remainder”는 시계열 분해에서 나머지를 나타내는 제 5 광 피쳐의 평균을 나타내고, “sd_remainder”는 시계열 분해에서 나머지를 나타내는 제 5 광 피쳐의 표준편차를 나타낸다. “m_resid_sd”는 회귀선 잔차의 평균을 나타내고, “sd_resid_sd” 회귀선 잔차의 표준편차를 나타낸다.
전술한 광 피쳐들은 예시들일 뿐이며, 전술한 예시들로 인해 본 개시의 광 피쳐가 제한되어 해석되지 않아야 할 것이다.
또한, 도 7에 도시된 그래프(600)의 y축은 광 피쳐에 대응하는 변수 데이터를 나타내고 있다. 여기서, 사전 결정된 p-value가 0.05인 경우, 도 7에 도시된 점선과 같이 표시될 수 있으며 점선에 해당되는 y축의 값보다 높은 값을 가지는 광 피쳐는 인퍼런스 피쳐로 선택될 수 있다.
구체적으로, 도 7의 그래프(600) x축에 표시된 “m_c01”은 1 사이클에 대한 제 1 컴포넌트(10) 및 제 2 컴포넌트(20) 각각의 제 1 광 피쳐를 나타내고 있으며, 여기서 “m_c01”의 y축 값은 제 1 광 피쳐에 대응하는 변수 데이터일 수 있으며, 1사이클에 대한 제 1 컴포넌트(10) 및 제 2 컴포넌트(20) 각각의 RFU 평균값일 수 있다. 또한, 도 7의 “m_c01”의 y축 값은 점선보다 낮은 값에 해당되므로 1 사이클에 대한 제 1 광 피쳐는 인퍼런스 피쳐로 선택되지 않을 수 있다.
또한, 도 7의 그래프(600) x축에 표시된 “m_c03”은 3 사이클에 대한 제 1 컴포넌트(10) 및 제 2 컴포넌트(20) 각각의 제 1 광 피쳐를 나타낸다. 여기서 “m_c03”의 y축 값은 점선보다 높은 값에 해당되므로 3 사이클에 대한 제 1 광 피쳐는 인퍼런스 피쳐로 선택되고, 도 7의 “m_c03”의 y축 값은 인퍼런스 데이터에 포함될 수도 있다.
전술한 바와 같이, 선택된 광 피쳐 및 그 광 피쳐에 대응하는 변수 데이터는 인퍼런스 데이터로 생성될 수도 있다. 여기서 선택된 광 피쳐는 전술한 본 개시의 인퍼런스 피쳐일 수 있다.
위와 같이 도 7을 참조하여 설명한 내용들은 예시들일 뿐이며, 전술한 예시들로 인해 본 개시의 광 피쳐 또는 그에 대응하는 변수 데이터 등이 제한되어 해석되지 않아야 할 것이다.
본 개시의 일 실시예에 따르면, 프로세서(120)는 인퍼런스 데이터 또는 로우 데이터를 기계학습 모델에 입력하고, 노이즈에 대한 수준을예측하는 출력 데이터를 획득할 수 있다. 구체적으로 도 8을 참조하여 기계학습 모델에서 출력 데이터를 생성하는 방법을 설명하면 다음과 같다.
도 8은 본 개시의 일 실시예에 따라 기계학습 모델에서 출력 데이터를 생성하는 방법을 예시적으로 도시한 예시도이다.
구체적으로, 핵산 검출 장치의 성능을 예측하여 노이즈에 대한 테스트를 생략할지 여부를 결정하기 위해 도 8에 도시된 바와 같은 방법이 수행될 수 있다. 보다 구체적으로, 전술한 도 1에서 설명된 바에 따라 바람직하게 HW Calibration(220) 과정에서 옵틱 캘리브레이션이 수행(710)될 수 있다. 이에 따라, 프로세서(120)는 기계학습 모델에 옵틱 캘리브레이션을 통해 획득되는 옵틱 데이터를 입력할 수 있다.
또한, 본 개시의 일 실시예에 따르면, 옵틱 캘리브레이션을 통해 획득되는 옵틱 데이터에 기초하여 노이즈 수준을추론(720)할 수 있다.
본 개시의 일 실시예에 따르면 기계학습 모델은 핵산 검출 장치가 옵틱 캘리브레이션에 후속하는 노이즈 수준을 합격할 것인지 여부를 예측(730)할 수 있다. 본 개시의 기계학습 모델 또는 기계학습 기반 분류기는 기계학습에 기반하여 입력된 데이터에 대한 출력을 제공하는 모델 또는 분류기를 의미할 수 있다. 예를 들어, 본 개시의 기계학습 모델 또는 기계학습 기반 분류기는 전술한 바와 같이 SVM(Support Vector Machine) 또는 부분 최소 제곱법(Partial Least Squares, PLS)를 이용하여 출력 데이터를 출력하는 모델일 수 있다. 해당 기계학습 모델 또는 기계학습 기반 분류기는 학습 데이터셋을 통해 사전 학습된 모델을 포함할 수 있다.
본 개시의 SVM은 기계학습 분야 중 하나인 서포트 벡터 머신이며, 데이터 분류 및 회귀 분석에 주로 사용되는 지도 학습 모델이다. 구체적으로, SVM 알고리즘은 데이터의 카테고리 또는 클래스를 분류하기 위해 분류 기준선인 결정 경계(Decision Boundary)를 하나 이상 정의하고, 정의된 결정 경계에 기초하여 데이터 집합을 분류한다.
또한, 본 개시의 부분 최소 제곱법은 차원 축소 방법 중 하나이며, 종속 변수와 의 공분산이 높은 선형조합 변수를 추출하는 방법이다. 부분 최소 제곱법은 특히 회귀 분석에서 예측 변수가 서로 밀접하게 관련되거나, 또는 예측 변수의 수가 관측치(case)의 수보다 많은 경우에 유용하게 사용된다.
본 개시의 기계학습 모델은 SVM 또는 부분 최소 제곱법 알고리즘 중 적어도 하나를 통해 인퍼런스 데이터 또는 로우 데이터에 기초하는 노이즈에 대한 평가 결과에 대한 예측 결과를 출력할 수 있다.
본 개시의 추가적인 실시예에서, 기계학습 모델은 SVM의 출력을 부분 최소 제곱법 알고리즘의 입력으로 사용하거나 또는 부분 최소 제곱법 알고리즘의 출력을 SVM의 입력으로 사용하는 형태로 SVM과 부분 최소 제곱법 알고리즘을 직렬적으로 연결할 수도 있다.
본 개시의 추가적인 실시예에서, 기계학습 모델은 동일한 인퍼런스 데이터, 옵틱 데이터를 SVM 및 부분 최소 제곱법 알고리즘 각각에 병렬적으로 입력하고, SVM의 출력과 부분 최소 제곱법의 출력을 조합하거나 또는 앙상블하여 예측 결과를 출력할 수도 있다.
본 개시의 일 실시예에 따라, 프로세서(120)는 획득된 로우 데이터 중 광에 대한 정보를 갖고 있는 옵틱 데이터를 기계학습 모델에 입력할 수 있다. 또한, 본 개시의 다른 일 실시예에 따라, 프로세서(120)는 옵틱데이터에 기초하여 인퍼런스 데이터를 생성하고, 생성된 인퍼런스 데이터를 기계학습 모델에 입력할 수도 있다.
여기서 인퍼런스 데이터 및 로우 데이터는 전술한 바와 같이 복수의 변수 데이터를 포함하며, 기계학습 모델은 인퍼런스 데이터의 인퍼런스 피쳐 및 로우 데이터에서 광에 대한 정보를 갖고 있는 옵틱 데이터로부터 광 측정값 및 광 피쳐 각각에 대응되는 복수의 분류기들을 포함할 수 있다. 즉, 기계학습 모델은 인퍼런스 데이터의 인퍼런스 피쳐들 각각에 대응되는 복수의 분류기들을 포함할 수 있다. 또는, 기계학습 모델은 로우 데이터의 광 측정값 및 광 피쳐들에 대응되는 적어도 세 개의 분류기들을 포함할 수도 있다.
본 개시에서 적어도 세 개의 분류기들 각각은 SVM 또는 부분 최소 제곱법 알고리즘에 대응될 수 있다. 구체적으로, 하나의 분류기는 광 측정값과 대응될 수 있다.
또한, 하나의 분류기는 하나의 변수 데이터 또는 하나의 광 피쳐에 대응될 수 있다. 이 경우, 적어도 세 개의 분류기들 각각은 대응되는 광 측정값과 광 피쳐의 변수 데이터에 기초하여 노이즈 수준에 대한 합격 또는 불합격의 결과를 예측하여 예측 결과로 출력할 수 있다. 또한, 본 개시의 기계학습 모델은 적어도 세 개의 분류기들 각각에 대한 출력을 앙상블함으로써, 노이즈 수준을 예측하는 출력 데이터를 생성할 수 있다.
예를 들어, 제 1 컴포넌트의 제 1 인퍼런스 데이터는 3사이클에 대한 평균값을 나타내는 제 1 인퍼런스 피쳐의 제 1 변수 데이터 및 계절성 평균을 나타내는 제 4 인퍼런스 피쳐의 제 4 변수 데이터를 포함할 수 있다. 이 경우에 기계학습 모델은 제 1 변수 데이터에 대응되는 제 1 분류기 및 제 4 변수 데이터에 대응되는 제 4 분류기를 포함할 수 있다. 또한, 제 1 분류기를 통해 제 1 변수 데이터에 기반하는 노이즈에 대한 평가의 합격 또는 불합격을 예측한 제 1 예측 결과가 출력되고, 그리고 제 4 분류기를 통해 제 4 변수 데이터에 기반하는 노이즈에 대한 평가의 합격 또는 불합격을 예측한 제 2 예측 결과가 출력될 수 있다.
전술한 인퍼런스 데이터, 인퍼런스 피쳐, 변수 데이터 및 분류기는 예시들일 뿐이며, 전술한 예시들로 인해 본 개시의 인퍼런스 데이터, 인퍼런스 피쳐, 변수 데이터 및 분류기가 제한되어 해석되지 않아야 할 것이다.
또한, 본 개시의 기계학습 모델은 인퍼런스 피쳐들의 사전 결정된 조합의 개수에 대응되는 개수의 분류기를 포함할 수 있다. 구체적으로, 본 개시의 사전 결정된 조합의 개수에 대응되는 개수의 분류기는 사전 결정된 조합의 개수의 인퍼런스 피쳐들 각각의 변수 데이터를 조합하여 노이즈 수준에 대한 합격 또는 불합격을 예측하여 예측 결과를 출력할 수 있다.
예를 들어, 사전 결정된 조합의 개수가 2개이고, 제 1 인퍼런스 데이터에 포함된 인퍼런스 피쳐들이 8개인 경우, 분류기는 4개로 구성될 수 있다. 여기서 4개의 분류기 각각은 8개의 인퍼런스 피쳐들의 변수 데이터 중 2개에 기초하여 합격 또는 불합격을 예측한 예측 결과를 출력할 수 있다. 또한, 분류기들 각각에 입력되는 인퍼런스 피쳐들 및 변수 데이터는 중복될 수도 있다. 구체적으로, 제 1 분류기에 제 1 내지 제 2 변수 데이터를 입력하여 제 1 예측 결과를 출력하고, 제 2 분류기에 제 2 내지 제 4 변수 데이터를 입력하여 제 2 예측 결과를 출력할 수 있다. 전술한 제 2 변수 데이터와 같이 변수 데이터는 제 1 분류기와 제 2 분류기에 중복되어 입력될 수도 있다. 또한, 분류기들 각각에 입력되는 하나 이상의 변수 데이터는 중복되지 않을 수도 있다.
전술한 조합의 개수, 분류기의 개수, 인퍼런스 피쳐들의 개수 및 변수 데이터는 예시들일 뿐이며, 전술한 예시들로 인해 본 개시의 사전 결정된 조합의 개수, 분류기의 개수, 인퍼런스 피쳐 및 변수 데이터가 제한되어 해석되지 않아야 할 것이다.
또한, 통상의 기술자라면, 전술한 인퍼런스 데이터의 인퍼런스 피쳐들을 기계학습 모델에 입력하여 예측 결과를 출력하는 것에 대한 설명들 및 예시들이 로우 데이터 세트의 광 피쳐를 기계학습 모델에 입력하여 예측 결과를 출력하는 것에 대한 설명들 또는 예시들로 설명될 수도 있음을 이해할 것이다.
본 개시의 일 실시예에 따라, 기계학습 모델은 분류기들을 통해 출력된 노이즈에 대한 평가에 대한 하나 이상의 예측 결과들을 앙상블하여 최종적으로 하나의 검출 장치에 대한 노이즈에 대한 평가의 예측 결과를 나타내는 출력 데이터를 생성할 수 있다. 즉, 본 개시의 기계학습 모델은 전술한 바와 같이, 하나 이상의 분류기를 통해 획득되는 예측 결과들을 앙상블하여 하나의 핵산 검출 장치가 노이즈 수준을통과할지 여부를 예측하여 출력 데이터로 나타낼 수 있다.
상기 기계학습 모델은, 복수 개의 학습용 데이터를 이용하여 지도 학습된 모델이되, 상기 복수 개의 학습용 데이터 각각은, 학습용 입력 데이터로서, 선택된 검출 장치로부터 획득된 옵틱 데이터를 포함하고, 학습용 정답 데이터로서, 상기 선택된 검출 장치의 노이즈 수준을 나타 내는합격(PASS) 또는 불합격(FAIL)을 포함할 수 있다.
상기 선택된 검출 장치의 노이즈 레벨은, 상기 선택된 검출 장치에서 실행되는 Negative Control(NC) 조성물 및/또는 Positive Control(PC) 조성물과 관련하여 획득되는 것을 특징으로 할 수 있다.
본 개시의 일 실시예에 따라, 기계학습 모델에서 핵산 검출 장치가 노이즈 수준에 미치지 못해 통과하지 못할 것으로 예측한 경우, 노이즈에 대한 테스트 실시(740)할 것으로 예측하는 출력 데이터를 생성할 수 있다. 또는 기계학습 모델에서 핵산 검출 장치가 노이즈 수준에 이르러 통과할 것으로 예측한 경우, 노이즈에 대한 테스트를 생략(750)할 것으로 예측하는 출력 데이터를 생성할 수 있다.
따라서, 본 개시의 일 실시예에 따라 기계학습 모델에서 출력되는 출력 데이터는 핵산 검출 장치가 옵틱 캘리브레이션에 후속하는 노이즈 수준을 통과할 것인지 여부를 예측하는 결과를 포함할 수 있다. 또한, 본 개시의 출력 데이터는 핵산 검출 장치에 대해서 옵틱 캘리브레이션에 후속하는 노이즈에 대한 테스트를 생략할 것인지 여부를 예측하는 결과를 포함할 수도 있다.
본 개시의 추가적인 실시예에 따라, 컴퓨팅 장치는 도 8에서 노이즈 수준 예측에 대한 합격 여부로 표시된 단계(730)를 3개 이상의 결과로 표현할 수도 있다. 예를 들어, 컴퓨팅 장치는 노이즈 수준에 대한 2개 이상의 기준값들을 설정해두고, 2개 이상의 기준 값들에 의해 정해진 범위 내에서 3개 이상의 결과를 출력할 수 있다. 일례로, 3개 이상의 결과는 노이즈에 대한 테스트 실시, 노이즈에 대한 테스트 생략 및 노이즈에 대한 테스트 부분 실시를 포함할 수 있다.
또한, 본 개시의 일 실시예에 따르면, 컴퓨팅 장치는 전술한 바와 같이 획득된 출력 데이터에 기초하여 본 개시의 기계학습 모델의 학습을 위한 학습 데이터를 생성할 수도 있다. 구체적으로, 본 개시의 기계학습 모델은 노이즈의 수준에 대한 합격 또는 불합격이 라벨링된 변수 데이터를 학습 데이터 세트로 하여 교사 학습된 모델일 수 있다. 여기서 학습 데이터 세트는 전술한 바와 같이 출력 데이터와 관련하여 노이즈에 대한 평가의 결과가 라벨링 된 변수 데이터를 포함할 수도 있다. 또한, 사용자가 사전에 노이즈의 수준에 대해 라벨링 한 변수 데이터로 구성된 학습 데이터를 입력하여 본 개시의 기계학습 모델을 학습시킬 수도 있다.
또한, 본 개시의 인퍼런스 데이터 또는 로우 데이터는 복수의 변수 데이터를 포함하며, 기계학습 모델은 신경망 모델을 포함할 수도 있다. 본 개시의 신경망 모델은 입력 레이어, 적어도 하나의 히든 레이어 및 출력 레이어를 포함할 수 있다. 여기서 입력 레이어는 복수의 변수 데이터 각각의 개수 또는 복수의 변수 데이터의 사전 결정된 조합의 개수와 대응하는 개수의 입력 뉴런들을 포함할 수 있다. 또한, 출력 레이어는 복수의 출력 뉴런들을 포함하고, 출력 뉴런들 각각은 각각의 변수 데이터 또는 각각의 변수 데이터 조합에 할당되는 합격 또는 불합격의 클래스(class)들을 나타낼 수 있다. 또한, 출력 레이어에 포함된 출력 뉴런들은 예를 들어, 합격, 부분합격 또는 불합격을 포함하는 3개 이상의 클래스들을 나타낼 수도 있다.
전술한 바와 같이, 본 개시의 몇몇 실시예들에 따르면, 기계학습 모델을 통해 노이즈 수준을 추론하기 이전에 실시되는 옵틱 캘리브레이션의 결과 데이터에 기초하여 노이즈 수준이 합격인 것으로 예측되는 경우 노이즈에 대한 테스트가 생략될 수 있다. 이에 따라 노이즈에 대한 평가에 소모되는 시간 및 인적 자원 등을 절약할 수 있고, 핵산 검출 장치를 빠르게 출고할 수 있다는 현저한 효과가 발생된다.
도 9는 본 개시의 일 실시예에 따라 핵산 검출 장치의 노이즈 수준을 추론하기 위한 방법에 대한 순서도를 도시한다.
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는, 핵산 검출 장치의 노이즈 수준을 추론하는 방법을 수행할 수 있다. 구체적으로, 본 개시의 방법은 핵산 검출 장치의 옵틱 캘리브레이션에 이용되는 로우 데이터 중 광에 대한 정보를 갖고 있는 옵틱 데이터를 를 획득하는 단계(810)를 포함할 수 있다.
옵틱 데이터를 획득하는 단계에서, 핵산 검출 장치의 하나의 컴포넌트에 대해서 사전 결정된 사이클 동안 사전 결정된 파장의 광(light)을 조사함으로써 측정되는 RFU값의 옵틱 데이터를 획득할 수 있다. 이와 같이 획득되는 옵틱 데이터를 하나 이상 포함하는 옵틱 데이터는 사전 결정된 사이클(cycle) 동안 사전 결정된 파장(wavelength)의 광을 조사하는 캘리브레이션 과정에서 획득되는 로우 데이터를 하나 이상 포함할 수 있다.
구체적으로, 광은 액상 매체(liquid medium)와 염료(dye)를 포함하는 반응 용기에 조사되고, 캘리브레이션 과정은 핵산 검출 장치에서 샘플에 조사되는 광의 세기(intensity)를 조정하는 단계를 포함할 수 있다. 구체적으로 광은 액상 매체와 염료를 포함하는 반응 용기에 조사되고, 옵틱 캘리브레이션은 핵산 검출 장치에서 샘플에 조사되는 광의 세기를 조정하는 단계를 포함할 수 있다.
액상 매체는 염료를 녹이는 매체이다. 대표적으로, 물 및 완충액(TE buffer 또는 PBS buffer)을 포함한다.
여기서, 샘플은 핵산 검출 장치의 컴포넌트 또는 컴포넌트에 포함된 테스트 대상인 물질일 수 있다. 또한, 옵틱 캘리브레이션은, 광이 조사된 결과치를 보정하는 단계를 포함할 수 있다.
또한, 본 개시의 방법은 옵틱 데이터에 포함된 하나 이상의 파라미터들로부터 노이즈의 피쳐(feature)를 추출하는 단계(820)를 포함할 수도 있다.
이러한 광 피쳐는, 핵산 검출 장치의 컴포넌트인 하나의 웰에 대해 측정된 RFU 값들의 분산 또는 표준편차를 나타내는 제 1 광 피쳐; 핵산 검출 장치의 컴포넌트에 대해 RFU 값들의 평균을 나타내는 제 2 광 피쳐; 옵틱 데이터를 시계열 분해하여 산출되는 추세 피쳐를 나타내는 제 3 광 피쳐; 옵틱 데이터를 시계열 분해하여 산출되는 계절성 피쳐를 나타내는 제 4 광 피쳐; 옵틱 데이터를 시계열 분해하여 산출되는 추세 피쳐 및 계절성 피쳐 이외의 나머지 피쳐를 나타내는 제 5 광 피쳐; 또는 옵틱 데이터에 1차 단순 선형 회귀 선을 적용하여 계산된 잔차의 분산을 포함하는 제 6 광 피쳐; 중 적어도 하나의 피쳐를 포함할 수 있다.
본 개시의 방법은 적어도 하나의 광 피쳐에 기초하여, 노이즈 수준을 예측하는데 사용될 인퍼런스 데이터를 생성하는 단계(830)를 포함할 수 있다. 여기서, 옵틱 캘리브레이션은 핵산 검출 장치에서 측정된 RFU 값과 핵산 검출 장치와 상이한 표준 핵산 검출 장치에서 측정된 RFU 값을 비교하는 테스트를 포함할 수 있다. 또한, 노이즈 수준에 대한 예측은 핵산 검출 장치의 샘플 반응 용기에 Negative Control (NC) 또는 Positive Control (PC)가 수용된 상태에서 수행되는 것일 수 있다.
인퍼런스 데이터를 생성하는 단계는 사전 결정된 p-value에 기초하여, 핵산 검출 장치에서 발생되는 노이즈 중에서 핵산 검출 장치의 성능과 관련성이 임계치 이상인 광 측정값 및 광 피쳐를 로우 데이터에서 추출하는 단계; 핵산 검출 장치의 성능과 관련서이 임계치 이상인 광 측정값 및 광 피쳐를 인퍼런스 피쳐로 결정하고, 인퍼런스 피쳐를 하나 이상 포함하는 인퍼런스 데이터를 생성하는 단계; 및 인퍼런스 피쳐의 변수 데이터에 기초하여, 노이즈에 대한 평가의 결과를 생성하는 단계를 포함할 수 있다.
여기서, 인퍼런스 데이터는 인퍼런스 피쳐들을 포함하고, 그리고 기계학습 모델은 인퍼런스 피쳐들의 사전 결정된 조합의 개수에 대응되는 개수의 분류기를 포함할 수 있다.
또한, 전술한 인퍼런스 데이터를 생성하는 단계(830)는 본 개시의 방법에서 생략될 수도 있다.
본 개시의 방법은 인퍼런스 데이터 또는 로우 데이터 중 적어도 하나를 기계학습 모델에 입력하여 노이즈에 대한 수준을 예측하는 출력 데이터를 획득하는 단계(840)를 포함할 수 있다.
노이즈에 대한 수준 예측은 핵산 검출 장치에 대한 Negative Control (NC) 조성물 또는 Positive Control (PC) 조성물 중 적어도 하나와 관련된 노이즈 테스트를 포함할 수 있다. 본 개시의 방법은 인퍼런스 데이터 또는 로우 데이터를 입력으로 하여 노이즈 수준의 합격 여부를 예측하는 기계학습 모델을 통해 구현될 수 있다. 기계학습 모델은 광 피쳐의 변수 데이터에 기반하여 노이즈 수준의 합격 여부에 대한 출력을 생성할 수 있도록 사전 학습된 모델이다.
출력 데이터는 핵산 검출 장치가 옵틱 캘리브레이션에 후속하는 노이즈에 대한 수준이 통과할 것인지 여부를 예측하는 결과를 포함할 수 있다. 출력 데이터는 핵산 검출 장치에 대해서 옵틱 캘리브레이션에 후속하는 노이즈에 대한 테스트를 생략할 것인지 여부를 예측하는 결과를 포함할 수 있다.
기계학습 모델은 기계학습을 통해서 입력 데이터에 대한 분류가 가능한 임의의 형태의 모델을 의미할 수 있으며, 예를 들어 SVM 또는 부분 최소 제곱법을 이용하여 출력 데이터를 출력하는 모델일 수 있다.
인퍼런스 데이터는 인퍼런스 피쳐들 및 그들 각각에 대응하는 복수의 변수 데이터를 포함하고, 로우 데이터는 광 피쳐들 및 그들 각각에 대응하는 복수의 변수 데이터를 포함할 수 있다. 기계학습 모델은 광 측정값 및 복수의 광 피쳐들 및/또는 인퍼런스 피쳐들 중 적어도 하나에 대응되는 복수의 분류기들을 포함하며, 복수의 분류기들 각각은 대응되는 광 측정값 및 광 피쳐들 및/또는 인퍼런스 피쳐들에 대한 합격 또는 불합격의 결과를 출력하고, 그리고 기계학습 모델은 복수의 분류기들 각각에 대한 출력을 앙상블함으로써, 노이즈에 대한 수준을 예측하는 출력 데이터를 생성할 수 있다. 여기서 하나의 분류기는 하나의 광 측정값 및 광 피쳐에 대응할 수 있다.
기계학습 모델은 인퍼런스 피쳐들 또는 광 피쳐들 중 적어도 하나의 사전 결정된 조합의 개수에 대응되는 개수의 분류기를 포함할 수 있다. 여기서, 인퍼런스 피쳐들 또는 광 피쳐들 중 하나에 대응하는 복수의 변수 데이터에 대한 조합을 분류하기 위한 기계학습 기반 분류기가 사용되며, 구현의 양태에 따라서 사용되는 분류기들의 개수는 가변적일 수 있다.
또한, 기계학습 모델은 인퍼런스 피쳐들 또는 광 피쳐들 중 하나에 대응하는 복수의 변수 데이터의 사전 결정된 조합의 개수에 대응되는 개수의 분류기를 포함할 수 있다. 여기서도 복수의 변수 데이터에 대한 조합을 분류하기 위한 기계학습 기반 분류기가 사용될 수 있으며, 구현의 양태에 따라서 사용되는 분류기들의 개수는 가변적일 수 있다.
기계학습 모델은 노이즈 수준에 대한 합격(PASS) 또는 불합격(FAIL)이 라벨링된 변수 데이터를 학습 데이터 세트로 하여 교사 학습된 모델일 수 있다. 기계학습 모델의 학습 단계에서 복수개의 클래스들이 라벨링된 변수 데이터가 사용될 수 있다. 복수개의 클래스들은 예를 들어, 합격, 부분합격, 부분 불합격 또는 불합격에 해당하는 클래스를 포함할 수 있다.
기계학습 모델은 신경망 모델을 포함하며, 그리고 신경망 모델은: 인퍼런스 데이터에 포함된 복수의 변수 데이터 각각의 개수 또는 복수의 변수 데이터의 사전 결정된 조합의 개수와 대응하는 개수의 입력 뉴런들을 포함하는 입력 레이어; 적어도 하나의 히든 레이어; 및 복수의 출력 뉴런들을 포함하는 출력 레이어를 포함할 수 있다. 여기서 복수의 출력 뉴런들 각각은 각각의 변수 데이터 또는 각각의 변수 데이터 조합에 할당되는 합격 또는 불합격의 클래스들을 나타낼 수 있다. 이러한 신경망 모델은 복수의 변수 데이터를 입력으로 하여 사전 정의된 클래스에 대한 출력을 생성하도록 사전 학습된 모델이다.
본 개시의 일 실시예에 따른 방법은, 우수한 성능으로 예측되는 핵산 검출 장치에 대한 노이즈 테스트를 생략할 수 있기 때문에, PCR 기기당 대략 150분 내지 600분의 테스트 소요 시간을 단축시킬 수 있다. 따라서, 본 개시의 일 실시예에 따른 방법은 노이즈 테스트에 소요되는 시간 및 투입되는 인력 소모를 줄일 수 있어서, 핵산 검출 장치의 점검을 최적화시킬 수 있을 뿐만 아니라 핵산 검출 장치 관련 실무자들의 업무 효율성을 극대화시킬 수 있다.
전술한 도 9에 도시된 단계들은 필요에 의해 순서가 변경될 수 있으며, 적어도 하나 이상의 단계가 생략 또는 추가될 수 있다. 즉, 전술한 단계는 본 개시의 일 실시예에 불과할 뿐, 본 개시의 권리 범위는 이에 제한되지 않는다.
도 10은 본 개시의 실시예들이 구현될 수 있는 예시적인 컴퓨팅 환경에 대한 간략하고 일반적인 개략도이다.
본 개시가 일반적으로 컴퓨팅 장치에 의해 구현될 수 있는 것으로 전술되었지만, 당업자라면 본 개시가 하나 이상의 컴퓨터 상에서 실행될 수 있는 컴퓨터 실행가능 명령어 및/또는 기타 프로그램 모듈들과 결합되어 및/또는 하드웨어와 소프트웨어의 조합으로써 구현될 수 있다는 것을 잘 알 것이다.
일반적으로, 프로그램 모듈은 특정의 태스크를 수행하거나 특정의 추상 데이터 유형을 구현하는 루틴, 프로그램, 컴포넌트, 데이터 구조, 기타 등등을 포함한다. 또한, 당업자라면 본 개시의 방법이 단일-프로세서 또는 멀티프로세서 컴퓨터 시스템, 미니컴퓨터, 메인프레임 컴퓨터는 물론 퍼스널 컴퓨터, 핸드헬드(handheld) 컴퓨팅 장치, 마이크로프로세서-기반 또는 프로그램가능 가전 제품, 기타 등등(이들 각각은 하나 이상의 연관된 장치와 연결되어 동작할 수 있음)을 비롯한 다른 컴퓨터 시스템 구성으로 실시될 수 있다는 것을 잘 알 것이다.
본 개시의 설명된 실시예들은 또한 어떤 태스크들이 통신 네트워크를 통해 연결되어 있는 원격 처리 장치들에 의해 수행되는 분산 컴퓨팅 환경에서 실시될 수 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 로컬 및 원격 메모리 저장 장치 둘 다에 위치할 수 있다.
컴퓨터는 통상적으로 다양한 컴퓨터 판독가능 매체를 포함한다. 컴퓨터에 의해 액세스 가능한 매체는 그 어떤 것이든지 컴퓨터 판독가능 매체가 될 수 있고, 이러한 컴퓨터 판독가능 매체는 휘발성 및 비휘발성 매체, 일시적(transitory) 및 비일시적(non-transitory) 매체, 이동식 및 비-이동식 매체를 포함한다. 제한이 아닌 예로서, 컴퓨터 판독가능 매체는 컴퓨터 판독가능 저장 매체 및 컴퓨터 판독가능 전송 매체를 포함할 수 있다. 컴퓨터 판독가능 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보를 저장하는 임의의 방법 또는 기술로 구현되는 휘발성 및 비휘발성 매체, 일시적 및 비-일시적 매체, 이동식 및 비이동식 매체를 포함한다. 컴퓨터 판독가능 저장 매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 기타 메모리 기술, CD-ROM, DVD(digital video disk) 또는 기타 광 디스크 저장 장치, 자기 카세트, 자기 테이프, 자기 디스크 저장 장치 또는 기타 자기 저장 장치, 또는 컴퓨터에 의해 액세스될 수 있고 원하는 정보를 저장하는 데 사용될 수 있는 임의의 기타 매체를 포함하지만, 이에 한정되지 않는다.
컴퓨터 판독가능 전송 매체는 통상적으로 반송파(carrier wave) 또는 기타 전송 메커니즘(transport mechanism)과 같은 피변조 데이터 신호(modulated data signal)에 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터 등을 구현하고 모든 정보 전달 매체를 포함한다. 피변조 데이터 신호라는 용어는 신호 내에 정보를 인코딩하도록 그 신호의 특성들 중 하나 이상을 설정 또는 변경시킨 신호를 의미한다. 제한이 아닌 예로서, 컴퓨터 판독가능 전송 매체는 유선 네트워크 또는 직접 배선 접속(direct-wired connection)과 같은 유선 매체, 그리고 음향, RF, 적외선, 기타 무선 매체와 같은 무선 매체를 포함한다. 상술된 매체들 중 임의의 것의 조합도 역시 컴퓨터 판독가능 전송 매체의 범위 안에 포함되는 것으로 한다.
컴퓨터(1102)를 포함하는 본 개시의 여러가지 측면들을 구현하는 예시적인 환경(1100)이 나타내어져 있으며, 컴퓨터(1102)는 처리 장치(1104), 시스템 메모리(1106) 및 시스템 버스(1108)를 포함한다. 시스템 버스(1108)는 시스템 메모리(1106)(이에 한정되지 않음)를 비롯한 시스템 컴포넌트들을 처리 장치(1104)에 연결시킨다. 처리 장치(1104)는 다양한 상용 프로세서들 중 임의의 프로세서일 수 있다. 듀얼 프로세서 및 기타 멀티프로세서 아키텍처도 역시 처리 장치(1104)로서 이용될 수 있다.
시스템 버스(1108)는 메모리 버스, 주변장치 버스, 및 다양한 상용 버스 아키텍처 중 임의의 것을 사용하는 로컬 버스에 추가적으로 상호 연결될 수 있는 몇 가지 유형의 버스 구조 중 임의의 것일 수 있다. 시스템 메모리(1106)는 판독 전용 메모리(ROM)(1110) 및 랜덤 액세스 메모리(RAM)(1112)를 포함한다. 기본 입/출력 시스템(BIOS)은 ROM, EPROM, EEPROM 등의 비휘발성 메모리(1110)에 저장되며, 이 BIOS는 시동 중과 같은 때에 컴퓨터(1102) 내의 구성요소들 간에 정보를 전송하는 일을 돕는 기본적인 루틴을 포함한다. RAM(1112)은 또한 데이터를 캐싱하기 위한 정적 RAM 등의 고속 RAM을 포함할 수 있다.
컴퓨터(1102)는 또한 내장형 하드 디스크 드라이브(HDD)(1114)(예를 들어, EIDE, SATA)-이 내장형 하드 디스크 드라이브(1114)는 또한 적당한 섀시(도시 생략) 내에서 외장형 용도로 구성될 수 있음-, 자기 플로피 디스크 드라이브(FDD)(1116)(예를 들어, 이동식 디스켓(1118)으로부터 판독을 하거나 그에 기록을 하기 위한 것임), 및 광 디스크 드라이브(1120)(예를 들어, CD-ROM 디스크(1122)를 판독하거나 DVD 등의 기타 고용량 광 매체로부터 판독을 하거나 그에 기록을 하기 위한 것임)를 포함한다. 하드 디스크 드라이브(1114), 자기 디스크 드라이브(1116) 및 광 디스크 드라이브(1120)는 각각 하드 디스크 드라이브 인터페이스(1124), 자기 디스크 드라이브 인터페이스(1126) 및 광 드라이브 인터페이스(1128)에 의해 시스템 버스(1108)에 연결될 수 있다. 외장형 드라이브 구현을 위한 인터페이스(1124)는 USB(Universal Serial Bus) 및 IEEE 1394 인터페이스 기술 중 적어도 하나 또는 그 둘 다를 포함한다.
이들 드라이브 및 그와 연관된 컴퓨터 판독가능 매체는 데이터, 데이터 구조, 컴퓨터 실행가능 명령어, 기타 등등의 비휘발성 저장을 제공한다. 컴퓨터(1102)의 경우, 드라이브 및 매체는 임의의 데이터를 적당한 디지털 형식으로 저장하는 것에 대응한다. 상기에서의 컴퓨터 판독가능 매체에 대한 설명이 HDD, 이동식 자기 디스크, 및 CD 또는 DVD 등의 이동식 광 매체를 언급하고 있지만, 당업자라면 집 드라이브(zip drive), 자기 카세트, 플래쉬 메모리 카드, 카트리지, 기타 등등의 컴퓨터에 의해 판독가능한 다른 유형의 매체도 역시 예시적인 운영 환경에서 사용될 수 있으며 또 임의의 이러한 매체가 본 개시의 방법들을 수행하기 위한 컴퓨터 실행가능 명령어를 포함할 수 있다는 것을 잘 알 것이다.
운영 체제(1130), 하나 이상의 애플리케이션 프로그램(1132), 기타 프로그램 모듈(1134) 및 프로그램 데이터(1136)를 비롯한 다수의 프로그램 모듈이 드라이브 및 RAM(1112)에 저장될 수 있다. 운영 체제, 애플리케이션, 모듈 및/또는 데이터의 전부 또는 그 일부분이 또한 RAM(1112)에 캐싱될 수 있다. 본 개시가 여러가지 상업적으로 이용가능한 운영 체제 또는 운영 체제들의 조합에서 구현될 수 있다는 것을 잘 알 것이다.
사용자는 하나 이상의 유선/무선 입력 장치, 예를 들어, 키보드(1138) 및 마우스(1140) 등의 포인팅 장치를 통해 컴퓨터(1102)에 명령 및 정보를 입력할 수 있다. 기타 입력 장치(도시 생략)로는 마이크, IR 리모콘, 조이스틱, 게임 패드, 스타일러스 펜, 터치 스크린, 기타 등등이 있을 수 있다. 이들 및 기타 입력 장치가 종종 시스템 버스(1108)에 연결되어 있는 입력 장치 인터페이스(1142)를 통해 처리 장치(1104)에 연결되지만, 병렬 포트, IEEE 1394 직렬 포트, 게임 포트, USB 포트, IR 인터페이스, 기타 등등의 기타 인터페이스에 의해 연결될 수 있다.
모니터(1144) 또는 다른 유형의 디스플레이 장치도 역시 비디오 어댑터(1146) 등의 인터페이스를 통해 시스템 버스(1108)에 연결된다. 모니터(1144)에 부가하여, 컴퓨터는 일반적으로 스피커, 프린터, 기타 등등의 기타 주변 출력 장치(도시 생략)를 포함한다.
컴퓨터(1102)는 유선 및/또는 무선 통신을 통한 원격 컴퓨터(들)(1148) 등의 하나 이상의 원격 컴퓨터로의 논리적 연결을 사용하여 네트워크화된 환경에서 동작할 수 있다. 원격 컴퓨터(들)(1148)는 워크스테이션, 컴퓨팅 디바이스 컴퓨터, 라우터, 퍼스널 컴퓨터, 휴대용 컴퓨터, 마이크로프로세서-기반 오락 기기, 피어 장치 또는 기타 통상의 네트워크 노드일 수 있으며, 일반적으로 컴퓨터(1102)에 대해 기술된 구성요소들 중 다수 또는 그 전부를 포함하지만, 간략함을 위해, 메모리 저장 장치(1150)만이 도시되어 있다. 도시되어 있는 논리적 연결은 근거리 통신망(LAN)(1152) 및/또는 더 큰 네트워크, 예를 들어, 원거리 통신망(WAN)(1154)에의 유선/무선 연결을 포함한다. 이러한 LAN 및 WAN 네트워킹 환경은 사무실 및 회사에서 일반적인 것이며, 인트라넷 등의 전사적 컴퓨터 네트워크(enterprise-wide computer network)를 용이하게 해주며, 이들 모두는 전세계 컴퓨터 네트워크, 예를 들어, 인터넷에 연결될 수 있다.
LAN 네트워킹 환경에서 사용될 때, 컴퓨터(1102)는 유선 및/또는 무선 통신 네트워크 인터페이스 또는 어댑터(1156)를 통해 로컬 네트워크(1152)에 연결된다. 어댑터(1156)는 LAN(1152)에의 유선 또는 무선 통신을 용이하게 해줄 수 있으며, 이 LAN(1152)은 또한 무선 어댑터(1156)와 통신하기 위해 그에 설치되어 있는 무선 액세스 포인트를 포함하고 있다. WAN 네트워킹 환경에서 사용될 때, 컴퓨터(1102)는 모뎀(1158)을 포함할 수 있거나, WAN(1154) 상의 통신 컴퓨팅 디바이스에 연결되거나, 또는 인터넷을 통하는 등, WAN(1154)을 통해 통신을 설정하는 기타 수단을 갖는다. 내장형 또는 외장형 및 유선 또는 무선 장치일 수 있는 모뎀(1158)은 직렬 포트 인터페이스(1142)를 통해 시스템 버스(1108)에 연결된다. 네트워크화된 환경에서, 컴퓨터(1102)에 대해 설명된 프로그램 모듈들 또는 그의 일부분이 원격 메모리/저장 장치(1150)에 저장될 수 있다. 도시된 네트워크 연결이 예시적인 것이며 컴퓨터들 사이에 통신 링크를 설정하는 기타 수단이 사용될 수 있다는 것을 잘 알 것이다.
컴퓨터(1102)는 무선 통신으로 배치되어 동작하는 임의의 무선 장치 또는 개체, 예를 들어, 프린터, 스캐너, 데스크톱 및/또는 휴대용 컴퓨터, PDA(portable data assistant), 통신 위성, 무선 검출가능 태그와 연관된 임의의 장비 또는 장소, 및 전화와 통신을 하는 동작을 한다. 이것은 적어도 Wi-Fi 및 블루투스 무선 기술을 포함한다. 따라서, 통신은 종래의 네트워크에서와 같이 미리 정의된 구조이거나 단순하게 적어도 2개의 장치 사이의 애드혹 통신(ad hoc communication)일 수 있다.
Wi-Fi(Wireless Fidelity)는 유선 없이도 인터넷 등으로의 연결을 가능하게 해준다. Wi-Fi는 이러한 장치, 예를 들어, 컴퓨터가 실내에서 및 실외에서, 즉 기지국의 통화권 내의 아무 곳에서나 데이터를 전송 및 수신할 수 있게 해주는 셀 전화와 같은 무선 기술이다. Wi-Fi 네트워크는 안전하고 신뢰성 있으며 고속인 무선 연결을 제공하기 위해 IEEE 802.11(a, b, g, 기타)이라고 하는 무선 기술을 사용한다. 컴퓨터를 서로에, 인터넷에 및 유선 네트워크(IEEE 802.3 또는 이더넷을 사용함)에 연결시키기 위해 Wi-Fi가 사용될 수 있다. Wi-Fi 네트워크는 비인가 2.4 및 5GHz 무선 대역에서, 예를 들어, 11Mbps(802.11a) 또는 54 Mbps(802.11b) 데이터 레이트로 동작하거나, 양 대역(듀얼 대역)을 포함하는 제품에서 동작할 수 있다.
본 개시의 기술 분야에서 통상의 지식을 가진 자는 정보 및 신호들이 임의의 다양한 상이한 기술들 및 기법들을 이용하여 표현될 수 있다는 것을 이해할 것이다. 예를 들어, 위의 설명에서 참조될 수 있는 데이터, 지시들, 명령들, 정보, 신호들, 비트들, 심볼들 및 칩들은 전압들, 전류들, 전자기파들, 자기장들 또는 입자들, 광학장들 또는 입자들, 또는 이들의 임의의 결합에 의해 표현될 수 있다.
본 개시의 기술 분야에서 통상의 지식을 가진 자는 여기에 개시된 실시예들과 관련하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 프로세서들, 수단들, 회로들 및 알고리즘 단계들이 전자 하드웨어, (편의를 위해, 여기에서 소프트웨어로 지칭되는) 다양한 형태들의 프로그램 또는 설계 코드 또는 이들 모두의 결합에 의해 구현될 수 있다는 것을 이해할 것이다. 하드웨어 및 소프트웨어의 이러한 상호 호환성을 명확하게 설명하기 위해, 다양한 예시적인 컴포넌트들, 블록들, 모듈들, 회로들 및 단계들이 이들의 기능과 관련하여 위에서 일반적으로 설명되었다. 이러한 기능이 하드웨어 또는 소프트웨어로서 구현되는지 여부는 특정한 애플리케이션 및 전체 시스템에 대하여 부과되는 설계 제약들에 따라 좌우된다. 본 개시의 기술 분야에서 통상의 지식을 가진 자는 각각의 특정한 애플리케이션에 대하여 다양한 방식들로 설명된 기능을 구현할 수 있으나, 이러한 구현 결정들은 본 개시의 범위를 벗어나는 것으로 해석되어서는 안 될 것이다.
여기서 제시된 다양한 실시예들은 방법, 장치, 또는 표준 프로그래밍 및/또는 엔지니어링 기술을 사용한 제조 물품(article)으로 구현될 수 있다. 용어 제조 물품은 임의의 컴퓨터-판독가능 저장장치로부터 액세스 가능한 컴퓨터 프로그램, 캐리어, 또는 매체(media)를 포함한다. 예를 들어, 컴퓨터-판독가능 저장매체는 자기 저장 장치(예를 들면, 하드 디스크, 플로피 디스크, 자기 스트립, 등), 광학 디스크(예를 들면, CD, DVD, 등), 스마트 카드, 및 플래쉬 메모리 장치(예를 들면, EEPROM, 카드, 스틱, 키 드라이브, 등)를 포함하지만, 이들로 제한되는 것은 아니다. 또한, 여기서 제시되는 다양한 저장 매체는 정보를 저장하기 위한 하나 이상의 장치 및/또는 다른 기계-판독가능한 매체를 포함한다.
제시된 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조는 예시적인 접근들의 일례임을 이해하도록 한다. 설계 우선순위들에 기반하여, 본 개시의 범위 내에서 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조가 재배열될 수 있다는 것을 이해하도록 한다. 첨부된 방법 청구항들은 샘플 순서로 다양한 단계들의 엘리먼트들을 제공하지만 제시된 특정한 순서 또는 계층 구조에 한정되는 것을 의미하지는 않는다.
제시된 실시예들에 대한 설명은 임의의 본 개시의 기술 분야에서 통상의 지식을 가진 자가 본 개시를 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 개시의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이며, 여기에 정의된 일반적인 원리들은 본 개시의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 개시는 여기에 제시된 실시예들로 한정되는 것이 아니라, 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다.
Claims (15)
- 표적 분석물질의 존부에 의존적인 신호에 기반하여 샘플 내 상기 표적 분석물질의 존부를 검출하는 검출 장치를 대상으로, 상기 검출 장치에서 발생되는 노이즈에 대한 수준을 추론하는 방법으로서,상기 검출 장치의 옵틱(optic) 캘리브레이션 에 이용되는 로우(raw) 데이터 중 광에 대한 정보를 갖고 있는 옵틱 데이터를 획득하는 단계; 및상기 옵틱 데이터를 입력으로 하는 기 학습된 기계학습 모델을 사용하여, 상기 검출 장치에서 발생되는 노이즈에 대한 수준을 추론하는 단계;를 포함하는노이즈 수준을 추론하는 방법.
- 제 1 항에 있어서,상기 옵틱 데이터는,사전 결정된 사이클(cycle) 동안 사전 결정된 파장(wavelength)의 광(light)을 조사하여 획득된 광 측정값, 상기 광 측정값을 수학적으로 가공한 광 피쳐(feature)를 포함하는노이즈 수준을 추론하는 방법.
- 제 2 항에 있어서,상기 광의 조사는,액상 매체와 염료(dye)를 포함하는 반응 용기에 수행되는노이즈 수준을 추론하는 방법.
- 제 1 항에 있어서,상기 옵틱 캘리브레이션은,조사되는 광의 세기(intensity)를, 상기 옵틱 데이터와 소정의 기준치와의 비교 결과에 기초하여 조정하는 것인노이즈 수준을 추론하는 방법.
- 제 1 항에 있어서,상기 옵틱 캘리브레이션은,상기 검출 장치의 광량의 측정 민감도를, 상기 옵틱 데이터와 소정의 기준치와의 비교 결과에 기초하여 조정하는 것인노이즈 수준을 추론하는 방법.
- 제 1 항에 있어서,상기 방법은,상기 옵틱 데이터로부터 광 측정 값 및상기 광 측정 값을 수학적으로 가공한 광 피쳐(feature)를 추출하는 단계; 및상기 노이즈 수준을 추론하기 위해 상기 광 측정 값 및 광 피쳐를 상기 기계학습 모델에 입력하는 단계;를 더 포함하는노이즈 수준을 추론하는방법.
- 제 6 항에 있어서,상기 광 피쳐는,상기 옵틱 데이터에 대한 분산 또는 표준편차를 포함하는 제 1 광 피쳐;상기 옵틱 데이터의 평균을 포함하는 제 2 광 피쳐;상기 옵틱 데이터를 시계열 분해하여 산출되는 추세(trend)를 포함하는 제 3 광 피쳐;상기 옵틱 데이터를 시계열 분해하여 산출되는 계절성(seasonal)을 포함하는 제 4 광 피쳐;상기 옵틱 데이터에서 상기 제 3 광 피쳐 및 상기 제 4 광 피쳐를 차감한 나머지(remainder)를 포함하는 제 5 광 피쳐; 및상기 옵틱 데이터에 선형 회귀 선을 적용하여 계산된 잔차의 분산을 포함하는 제 6 광 피쳐 및 이들의 조합을 포함하는 그룹에서 선택된 적어도 하나의 그룹이 포함되는노이즈 수준을 추론하는 방법.
- 제 6 항에 있어서,상기 추출은 종류가 상이한 복수 개의 상기 광 피쳐가 생성되고,상기 기계학습 모델은,상기 광 측정값 및 복수 개의 광 피쳐에 대응되는 적어도 세 개의 분류기(classifier)를 포함하며 - 상기 적어도 세 개의 분류기 중 하나의 분류기는 하나의 광 측정값과 하나 또는 적어도 두개의 광 피쳐에 대응함 - ,상기 적어도 세 개의 분류기 각각은, 대응되는 광 측정값 및 광 피쳐가 입력되면 상기 검출 장치의 예비적 노이즈 수준으로서 합격(PASS)과 불합격(FAIL) 중 어느 하나를 출력하고,상기 기계학습 모델은 상기 적어도 세개의 분류기 각각에 대한 출력을 앙상블하여서, 상기 검출 장치의 상기 노이즈 수준을 추론하는노이즈 수준을 추론하는 방법.
- 제 6 항에 있어서,상기 추출은 종류가 상이한 복수 개의 상기 광 피쳐가 생성되고,상기 노이즈 수준의 추론은,사전 결정된 p-value에 기초하여, 상기 광 측정값 및 복수 개의 광 피쳐로부터 적어도 하나의 인퍼런스 피쳐를 추출하는 단계를 더 포함하며,상기 기계학습 모델은,상기 노이즈 수준을 추론하기 위한 상기 적어도 하나의 인퍼런스 피쳐를 입력받는 것인노이즈 수준을 추론하는 방법.
- 제 1 항에 있어서,상기 기계학습 모델은,SVM(Support Vector Machine) 또는 부분 최소 제곱법(Partial Least Squares)을 이용하여 상기 노이즈 수준을 추론하는 모델을 포함하는노이즈 수준을 추론하는 방법.
- 제 1 항에 있어서,상기 기계학습 모델은, 복수 개의 학습용 데이터를 이용하여 지도 학습된 모델이되,상기 복수 개의 학습용 데이터 각각은,학습용 입력 데이터로서, 선택된검출 장치로부터 획득된 옵틱 데이터를 포함하고,학습용 정답 데이터로서, 상기 선택된 검출 장치의 노이즈 수준을 나타 내는합격(PASS) 또는 불합격(FAIL)을 포함하는노이즈 수준을 추론하는 방법.
- 제 11 항에 있어서, 상기 선택된검출 장치의 노이즈 레벨은,상기 선택된 검출 장치에서 실행되는 Negative Control(NC) 조성물 및/또는 Positive Control(PC) 조성물과 관련하여 획득되는 것인노이즈 수준을 추론하는 방법.
- 제 1 항에 있어서,상기 옵틱 데이터 는 광 측정값 및 종류가 상이한 복수의 광 피쳐를 포함하고,상기 기계학습 모델은 입력 레이어, 적어도 하나의 히든 레이어 및 출력 레이어를 포함하는 신경망 모델을 포함하되,상기 입력 레이어에는 광 측정값 및 상기 하나 이상의 광 피쳐 중 적어도 하나와 대응되는 입력 노드가 포함되고,상기 출력 레이어에는 합격(PASS) 및 불합격(FAIL) 대응되는 출력 노드가 포함되는노이즈 수준을 추론하는 방법.
- 컴퓨터 프로그램을 저장하는 컴퓨터 판독가능 매체로서, 상기 컴퓨터 프로그램은,하나 이상의 프로세서에 의해 실행되는 경우, 상기 하나 이상의 프로세서로 하여금, 표적 분석물질의 존부에 의존적인 신호에 기반하여 샘플 내 상기 표적 분석물질의 존부를 검출하는 검출 장치를 대상으로, 상기 검출 장치에서 발생되는 노이즈에 대한 평가 결과를 추론하는 방법을 수행하기 위한 명령들을 포함하며,상기 방법은:상기 검출 장치의 캘리브레이션 과정에 이용되는 옵틱 데이터를 획득하는 단계; 및상기 옵틱 데이터를 입력으로 하는 기 학습된 기계학습 모델을 사용하여, 상기 검출 장치에서 발생되는 노이즈 수준을 추론하는 단계를 포함하는컴퓨터 판독 가능한 기록 매체.
- 표적 분석물질의 존부에 의존적인 신호에 기반하여 샘플 내 상기 표적 분석물질의 존부를 검출하는 검출 장치를 대상으로, 상기 검출 장치에서 발생되는 노이즈 수준을 추론하는 방법을 수행하기 컴퓨팅 장치로서,상기 검출 장치의 옵틱 캘리브레이션에 이용되는 옵틱 데이터를 획득하는 입력부; 및상기 옵틱 데이터를 입력으로 하는 기 학습된 기계학습 모델을 사용하여, 상기 검출 장치에서 발생되는 노이즈 수준을 추론하는 노이즈 수준 추론부를 포함하는컴퓨팅 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020247024235A KR20240125011A (ko) | 2021-12-23 | 2022-12-19 | 검출 장치의 성능을 예측하기 위한 방법 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2021-0186618 | 2021-12-23 | ||
KR20210186618 | 2021-12-23 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2023121167A1 true WO2023121167A1 (ko) | 2023-06-29 |
Family
ID=86903384
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2022/020688 WO2023121167A1 (ko) | 2021-12-23 | 2022-12-19 | 검출 장치의 성능을 예측하기 위한 방법 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR20240125011A (ko) |
WO (1) | WO2023121167A1 (ko) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US20060271308A1 (en) * | 2005-05-13 | 2006-11-30 | Bio-Rad Laboratories, Inc. | Identifying statistically linear data |
KR20180103180A (ko) * | 2016-02-05 | 2018-09-18 | 주식회사 씨젠 | 타겟 분석물질에 대한 데이터 세트의 노이즈 수준 감축 방법 |
US20190279362A1 (en) * | 2016-11-22 | 2019-09-12 | Universidad De Las Palmas De Gran Canaria | Method of non-invasive detection of tumour and/or healthy tissue and hyperspectral imaging apparatus |
KR20200010661A (ko) * | 2018-07-02 | 2020-01-31 | 한림대학교 산학협력단 | 딥러닝 알고리즘을 이용한 자궁 병변 진단 장치 및 방법 |
KR20210076438A (ko) * | 2019-12-16 | 2021-06-24 | 한국과학기술원 | 딥러닝 기반 이상징후 감지 기법을 이용한 노이즈 분석 기반 초고감도 표적신호 검출 방법 및 시스템 |
JP6897655B2 (ja) | 2017-11-13 | 2021-07-07 | 株式会社リコー | デバイス及び検査方法 |
-
2022
- 2022-12-19 WO PCT/KR2022/020688 patent/WO2023121167A1/ko unknown
- 2022-12-19 KR KR1020247024235A patent/KR20240125011A/ko active Search and Examination
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US4683202B1 (ko) | 1985-03-28 | 1990-11-27 | Cetus Corp | |
US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
US4683195B1 (ko) | 1986-01-30 | 1990-11-27 | Cetus Corp | |
US20060271308A1 (en) * | 2005-05-13 | 2006-11-30 | Bio-Rad Laboratories, Inc. | Identifying statistically linear data |
KR20180103180A (ko) * | 2016-02-05 | 2018-09-18 | 주식회사 씨젠 | 타겟 분석물질에 대한 데이터 세트의 노이즈 수준 감축 방법 |
US20190279362A1 (en) * | 2016-11-22 | 2019-09-12 | Universidad De Las Palmas De Gran Canaria | Method of non-invasive detection of tumour and/or healthy tissue and hyperspectral imaging apparatus |
JP6897655B2 (ja) | 2017-11-13 | 2021-07-07 | 株式会社リコー | デバイス及び検査方法 |
KR20200010661A (ko) * | 2018-07-02 | 2020-01-31 | 한림대학교 산학협력단 | 딥러닝 알고리즘을 이용한 자궁 병변 진단 장치 및 방법 |
KR20210076438A (ko) * | 2019-12-16 | 2021-06-24 | 한국과학기술원 | 딥러닝 기반 이상징후 감지 기법을 이용한 노이즈 분석 기반 초고감도 표적신호 검출 방법 및 시스템 |
Non-Patent Citations (11)
Title |
---|
"PCR Protocols: A Guide to Methods and Applications", 1990 |
COMPTON, NATURE, vol. 350, no. 6313, 1991, pages 91 - 2 |
HATCHET, GENET. ANAL., vol. 15, no. 2, 1999, pages 35 - 40 |
LAMPY. MORIH. KANDAT. NOTOMI, J. INFECT. CHEMOTHER., vol. 19, 2013, pages 404 - 411 |
LISBY, MOL. BIOTECHNOL., vol. 12, no. 1, 1999, pages 75 - 99 |
LIZARDI ET AL., BIOLTECHNOLOGY, vol. 6, 1988, pages 1197 |
PHYFFER ET AL., J. CLIN. MICROBIOL., vol. 34, 1996, pages 834 - 841 |
RPA, J. LIJ. MACDONALDF. VON STETTEN, ANALYST, vol. 144, 2018, pages 31 - 67 |
VUORINEN ET AL., J. CLIN. MICROBIOL., vol. 33, 1995, pages 1856 - 1859 |
WALKER ET AL., NUCLEIC ACIDS RES., vol. 20, no. 7, 1992, pages 1691 - 6 |
WALKER PCR METHODS APPL, vol. 3, no. 1, 1993, pages 1 - 6 |
Also Published As
Publication number | Publication date |
---|---|
KR20240125011A (ko) | 2024-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3346411B1 (en) | Computational modeling and classification of data streams | |
WO2016072756A1 (en) | Method of and apparatus for measuring biometric information | |
WO2019164251A1 (en) | Method of performing learning of deep neural network and apparatus thereof | |
WO2019027259A1 (en) | APPARATUS AND METHOD FOR PROVIDING SUMMARY INFORMATION USING ARTIFICIAL INTELLIGENCE MODEL | |
WO2019027208A1 (ko) | 인공 신경망의 훈련 방법 | |
EP3602334A1 (en) | Apparatus and method for providing summarized information using an artificial intelligence model | |
WO2021118173A1 (en) | Electronic device and controlling method of electronic device | |
WO2020036297A1 (en) | Electronic apparatus and controlling method thereof | |
WO2023033329A1 (ko) | 질환 연관 유전자 변이 분석을 통한 질환별 위험 유전자 변이 정보 생성 장치 및 그 방법 | |
WO2016171474A1 (ko) | 표준물질로서 외부 생체분자를 이용한 생체분자의 분석 방법 및 그 키트 | |
WO2024112153A1 (ko) | 유기체 또는 host 추정 방법, 유기체 또는 host를 추정하는 모델의 획득 방법 및 이를 수행하는 컴퓨터 장치 | |
WO2023121167A1 (ko) | 검출 장치의 성능을 예측하기 위한 방법 | |
WO2020004815A1 (ko) | 데이터의 어노말리 감지 방법 | |
WO2021049751A1 (ko) | 인공 지능을 이용한 조리 기기 제어 방법 및 그 시스템 | |
WO2022075678A2 (ko) | 의사 정상 데이터를 이용한 자가 감독 학습 기반의 차량 이상징후 탐지 장치 및 방법 | |
WO2021230469A1 (ko) | 아이템 추천 방법 | |
KR100737042B1 (ko) | 수신기, 방법 및 통신 시스템 | |
WO2024147568A1 (ko) | 분자진단 분석 결과의 획득 방법, 분자진단 분석 결과를 추정하는 모델의 획득 방법 및 이를 수행하는 컴퓨터 장치 | |
WO2024072164A1 (en) | Methods and devices for predicting dimerization in nucleic acid amplification reaction | |
WO2023068823A1 (ko) | 시료 내 표적 분석물질에 대한 양음성 판독 장치 및 방법 | |
WO2023177221A1 (en) | Device for determining presence/absence of target nucleic acid, method for determining presence/absence of target by the device, server for distributing update information, and method for distributing update information by the server | |
WO2020050627A1 (ko) | 시료 미생물의 동정 및 분류 방법 | |
WO2023106638A1 (ko) | Can 메시지 분석과 신경망 모델을 이용한 경량화된 실시간 이상 탐지 방법 | |
WO2023146022A1 (en) | Liquid refining apparatus and diagnosis system including the same | |
WO2024123122A1 (ko) | 체외 진단용 시약 제품의 연구개발 관리 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 22911800 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 20247024235 Country of ref document: KR Kind code of ref document: A |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
ENP | Entry into the national phase |
Ref document number: 2022911800 Country of ref document: EP Effective date: 20240723 |