WO2023068823A1 - 시료 내 표적 분석물질에 대한 양음성 판독 장치 및 방법 - Google Patents

시료 내 표적 분석물질에 대한 양음성 판독 장치 및 방법 Download PDF

Info

Publication number
WO2023068823A1
WO2023068823A1 PCT/KR2022/015987 KR2022015987W WO2023068823A1 WO 2023068823 A1 WO2023068823 A1 WO 2023068823A1 KR 2022015987 W KR2022015987 W KR 2022015987W WO 2023068823 A1 WO2023068823 A1 WO 2023068823A1
Authority
WO
WIPO (PCT)
Prior art keywords
positive
negative reading
learning
signal
negative
Prior art date
Application number
PCT/KR2022/015987
Other languages
English (en)
French (fr)
Inventor
박봉균
서일환
손형석
김광민
차광수
김상원
유원우
Original Assignee
주식회사 씨젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 씨젠 filed Critical 주식회사 씨젠
Publication of WO2023068823A1 publication Critical patent/WO2023068823A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing

Definitions

  • the present invention relates to a positive-negative reading device and method for a target analyte in a sample.
  • PCR polymerase chain reaction
  • Real-time PCR is a PCR-based technology for real-time detection of target nucleic acids in a sample.
  • a signal generator is used that emits a detectable fluorescent signal in proportion to the amount of the target nucleic acid during the PCR reaction.
  • a fluorescence signal proportional to the amount of the target nucleic acid is detected at each measurement point (cycle) through real-time PCR to obtain a data set including each measurement point and the signal value at the measurement point, and comparing the measurement point from the data set
  • An amplification curve or amplification profile curve indicating the intensity of the fluorescence signal to be detected is obtained.
  • an amplification curve by real-time PCR is divided into a baseline region, an exponential region, and a plateau region.
  • the exponential region is a region in which the emitted fluorescence signal increases in proportion to the increase in the PCR amplification product
  • the stagnant region is a region in which the increase in PCR amplification product and the emission of the fluorescence signal reach saturation and the fluorescence signal does not increase any more.
  • the baseline region refers to a region in which a fluorescence signal is maintained constant without change at the beginning of the reaction.
  • the background signal which is the fluorescence signal of the reaction sample itself and the fluorescence signal of the measurement system itself, rather than the fluorescence signal caused by the amplification of the target analyte ) occupies most of the fluorescence signal in the baseline region.
  • the method of using the threshold value predetermines a specific signal threshold value for all reactions to be analyzed (a defined signal threshold is determined for all reactions to be analyzed), and the signal value of the data set reaches the signal threshold value ( It is a method to determine whether it reaches or exceeds.
  • Jeffrey Lerner obtains a function fitted to data in U.S. Patent No. 8,560,247, and determines whether the slope of the obtained function exceeds the maximum amplification slope bound.
  • a method for determining whether a data set has a jump error is disclosed.
  • An object to be solved by the present invention is to provide a technique for more accurately and efficiently reading whether a sample contains the above-described target nucleic acid, that is, whether it is positive or negative.
  • a positive/negative reading device includes an input unit for receiving a signal value from a multi-cycle signal generation reaction targeting a target analyte;
  • the signal generating reaction generates a signal dependent on the presence of the target analyte in the sample, and pre-learns to estimate the presence or absence of the target analyte in the sample from the signal value in the multiple cycles and the order of the multiple cycles. Includes a positive-negative readout.
  • the target analyte may include a target nucleic acid molecule.
  • the signal dependent on the presence of the target analyte may include a fluorescence signal.
  • the signal generation reaction may include a nucleic acid amplification reaction.
  • the positive/negative reading unit may obtain the signal values sequentially from the input unit according to the order of the cycle.
  • the positive/negative readout unit may estimate the presence or absence of the target analyte in the sample after completing acquisition of all signal values of the plurality of cycles from the input unit.
  • learning data including learning input data and learning correct answer data is used, and the learning input data undergoes a signal generation reaction that generates a signal dependent on the presence of the target analyte. It may include previously obtained signal values for each cycle for learning and information about the order of each cycle, and the correct answer data for learning may include information about whether the target analyte is present or not.
  • the plurality of cycle signal values for learning among the input data for learning may be sequentially input to the positive/negative readout unit according to the order of the cycles.
  • a backpropagation method may be used in the process of training the positive-negative reading unit to reduce the difference.
  • the positive-negative readout unit may include a body unit that is learned based at least in part on the input data for learning; and a fine-tuning unit that is combined with the learned body and is trained to infer whether the learning input data is positive or negative when the learning input data is input to the learned body.
  • BERT Bidirectional Encoder Representations from Transformers
  • the body part may be learned according to a semi-supervised learning method.
  • the process of masking some of the input data for learning and then matching the masked part and the process of matching the order or sequence of signal values having the order included in the input data for learning included can be performed.
  • the fine adjustment unit may be learned according to a supervised-learning method.
  • the positive/negative reading unit may include an encoder unit generating a context vector from signal values in the plurality of cycles and an order of each of the cycles; and a binary classifier for estimating whether or not the target analyte is present in the sample from the context vector.
  • the positive-negative readout unit includes a recurrent neural network model or a short-term long-term memory model
  • a weight for a signal value of any one cycle among the plurality of cycles and a cycle temporally preceding any one cycle The weight for the hidden state value calculated for is updated so that the difference between the result output from the output terminal of the positive-negative reading unit and the correct answer data for learning is reduced in response to the input data for learning being input to the input terminal of the positive-negative reading unit.
  • the input/output structure of the positive-negative readout unit may be a many-to-one structure that outputs one data when a plurality of data is input.
  • the positive-negative reading unit may be provided in the positive-negative reading device for each factor predefined as influencing the signal generation of the signal generation reaction.
  • the element may include reaction conditions used in a nucleic acid amplification reaction.
  • reaction conditions may be a reaction medium used for the nucleic acid amplification reaction.
  • reaction medium may be one or more substances selected from the group consisting of pH-related substances, ionic strength-related substances, enzymes, and enzyme stabilization-related substances.
  • the pH-related material may include a buffer
  • the ionic strength-related material may include an ionic material
  • the enzyme stabilization-related material may include sugar
  • the positive-negative reading device further includes a pre-processing unit that performs a predetermined pre-processing operation on the signal values in each of the plurality of cycles, and the positive-negative reading unit further includes a signal value for which the pre-processing operation has been performed by the pre-processing unit. From this, the presence or absence of the target analyte in the sample can be estimated.
  • the preprocessing operation may include a correction operation for an abnormal signal among signal values in the plurality of cycles, a smoothing operation for the signal value in the plurality of cycles, or a regression from a signal value in the plurality of cycles.
  • a baseline subtraction operation of subtracting the applied baseline signal value from the signal value in the plurality of cycles may be included.
  • a positive-negative reading method performed by a positive-negative reading device, includes receiving signal values of the multiple cycles from multiple cycles of signal generation reactions targeting a target analyte;
  • the signal generation reaction generates a signal dependent on the presence of the target analyte in the sample, and the model pre-learned the presence or absence of the target analyte in the sample based on the signal value in the multiple cycles and the order of the multiple cycles. It is performed including the step of estimating using
  • a computer-readable recording medium storing a computer program according to an embodiment, wherein the computer program includes instructions for causing a processor to perform a positive-negative reading method targeting a target analyte performed by a positive-negative reading device. and receiving signal values of the multiple cycles from multiple cycles of signal generating reactions targeting a target analyte;
  • the signal generation reaction generates a signal dependent on the presence of the target analyte in the sample, and the model pre-learned the presence or absence of the target analyte in the sample based on the signal value in the multiple cycles and the order of the multiple cycles. It is performed including the step of estimating using
  • whether a sample is positive or negative for a target analyte may be read by a model trained by a deep learning method.
  • the speed and accuracy of positive-negative reading results can be improved.
  • FIG. 1 is a block diagram of a positive-negative reading system including a positive-negative reading device, a preparation device and a detection device according to an embodiment.
  • FIG. 2 is a conceptual diagram of a positive-negative reading device according to an embodiment.
  • FIG. 3 is a block diagram showing the configuration of a positive-negative reading device according to an exemplary embodiment.
  • FIG. 4 is a conceptual diagram illustrating the concept of a recurrent neural network model.
  • FIG. 5 is a conceptual diagram illustrating a case in which a positive-negative readout unit is implemented as a recurrent neural network according to an exemplary embodiment.
  • FIG. 6 is a hardware block diagram of a positive-negative reading device according to an exemplary embodiment.
  • FIG. 7 is a flow chart of a positive-negative reading method according to an embodiment.
  • FIG. 8 is a graph showing signal values for each temperature in a plurality of cycles of a sample when at least one target analyte is included in the sample according to an embodiment.
  • target analyte includes a variety of substances (eg, biological and non-biological substances), which can refer to the same subject as the term “target analyte”.
  • Such target analytes are specifically biological substances, more specifically at least one of nucleic acid molecules (eg, DNA and RNA), proteins, peptides, carbohydrates, lipids, amino acids, biological compounds, hormones, antibodies, antigens, metabolites, and cells.
  • nucleic acid molecules eg, DNA and RNA
  • sample includes biological samples (eg, cells, tissues, and body fluids) and non-biological samples (eg, food, water, and soil).
  • biological sample is, for example, virus, bacteria, tissue, cell, blood (including whole blood, plasma and serum), lymph, bone marrow, saliva, sputum, swab, aspiration, It may include at least one of milk, urine, feces, eye fluid, semen, brain extract, spinal fluid, joint fluid, thymus fluid, bronchial lavage fluid, ascites fluid, and amniotic fluid.
  • Such a sample may or may not contain the target analyte described above.
  • nucleic acid extraction process known in the art may be performed on the sample estimated to contain the target analyte.
  • the nucleic acid extraction process may vary depending on the type of sample.
  • the extracted nucleic acid is RNA
  • a reverse transcription process may be additionally performed to synthesize cDNA (Reference: Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press (2001).
  • data set refers to data obtained from a signal generating reaction to the target analyte using a signal generating means (signal generating means will be discussed later).
  • the term "signal generating reaction” refers to a reaction that generates a signal dependent on properties, such as activity, amount, or presence (or absence), specifically presence (or absence), of a target analyte in a sample.
  • These signal generating reactions include biological and chemical reactions.
  • the biological reaction includes genetic analysis such as PCR, real-time PCR and microarray analysis, immunological analysis, and bacterial growth analysis.
  • chemical reactions include the process of analyzing the creation, change or destruction of chemicals.
  • the signal generation reaction may be a genetic analysis process, or may be a nucleic acid amplification reaction, an enzymatic reaction, or microbial growth.
  • the signal generation reaction described above is accompanied by a signal change. Accordingly, the degree of progress of the signal generation reaction can be evaluated by measuring the change in the signal.
  • the term “signal” means a measurable output.
  • the measured magnitude or change of this signal serves as an indicator qualitatively or quantitatively indicating the characteristics of the target analyte, specifically the presence or absence of the target analyte in the sample.
  • indicators include fluorescence intensity, luminescence intensity, chemiluminescence intensity, bioluminescence intensity, phosphorescence intensity, charge transfer, voltage, current, power, energy, temperature, viscosity, light scatter, radioactivity intensity, and reflectance. , transmittance and absorbance, but are not limited thereto.
  • signal generating means means a means for providing a signal indicating the characteristics, specifically the presence or absence, of a target analyte to be analyzed.
  • signal generating means can be expressed as “signal generating composition”.
  • Such signal generating means include the label itself or an oligonucleotide to which the label is linked.
  • the label includes a fluorescent label, a luminescent label, a chemiluminescent label, an electrochemical label, and a metal label.
  • the label may be used as a label itself, such as an intercalating dye.
  • the label may be used in the form of a single label or an interactive double label comprising a donor molecule and an acceptor molecule, bound to one or more oligonucleotides.
  • the signal generating means may additionally include an enzyme having nucleic acid cleavage activity to generate a signal (eg, an enzyme having 5' nucleic acid cleavage activity or an enzyme having 3' nucleic acid cleavage activity).
  • an enzyme having nucleic acid cleavage activity to generate a signal (eg, an enzyme having 5' nucleic acid cleavage activity or an enzyme having 3' nucleic acid cleavage activity).
  • various methods are known for generating a signal indicating the presence of a target analyte, particularly a target nucleic acid molecule, using the signal generating means.
  • Representative examples may include: TaqMan TM probe method (US Pat. No. 5,210,015), molecular beacon method (Tyagi, Nature Biotechnology, v.14 MARCH 1996), Scorpion method (Whitcombe et al., Nature Biotechnology 17: 804-807 (1999)), Sunrise or Amplifluor method (Nazarenko et al., Nucleic Acids Research, 25(12):2516-2521 (1997), and U.S. Patent No. 6,117,635), Lux method ( U.S. Patent No.
  • hybridization probe (Bernard PS, et al., Clin Chem 2000, 46, 147-148), PTOCE (PTO cleavage and extension) method (WO 2012/ 096523), PCE-SH (PTO Cleavage and Extension-Dependent Signaling Oligonucleotide Hybridization) method (WO2013/115442), PCE-NH (PTO Cleavage and Extension-Dependent Non-Hybridization) method (PCT/KR2013/012312) and CER method ( WO 2011/037306).
  • the aforementioned term “signal generation reaction” may include a signal amplification reaction.
  • the term “amplification reaction” means a reaction that increases or decreases the signal generated by the signal generating means.
  • the amplification reaction refers to an increase (or amplification) reaction of a signal generated by the signal generating means depending on the presence of a target analyte.
  • amplification of the target analyte may or may not be accompanied. More specifically, the amplification reaction may refer to a signal amplification reaction accompanied by amplification of a target analyte.
  • the data set obtained through the amplification reaction may include an amplification cycle.
  • cycles refers to a unit of change in a condition in a plurality of measurements accompanied by a change in a certain condition.
  • the change in the constant condition means, for example, an increase or decrease in temperature, reaction time, number of reactions, concentration, pH, number of copies of a target (for example, nucleic acid) to be measured, and the like.
  • cycles can be time or process cycles, unit operation cycles and reproductive cycles.
  • cycle means one unit of repetition when a reaction of a certain course is repeated or a reaction is repeated on a regular time interval basis.
  • one cycle means a reaction including denaturation of nucleic acids, annealing of primers, and extension of primers.
  • the change in constant conditions is an increase in the number of repetitions of the reaction, and the repeating unit of the reaction including the series of steps is set as one cycle.
  • an amplification reaction for amplifying a signal representing the presence of a target analyte may be performed in a method in which the target analyte is amplified and the signal is also amplified (eg, real-time PCR method).
  • the amplification reaction may be performed in a method in which only a signal indicating the presence of the target analyte is amplified without amplifying the target analyte (eg, the CPT method (Duck P, et al. , Biotechniques, 9:142-148 (1990)), Invader assay (US Pat. Nos. 6,358,691 and 6,194,149)).
  • the aforementioned target analyte or target analyte, particularly target nucleic acid molecule can be amplified in various ways: polymerase chain reaction (PCR), ligase chain reaction (LCR) (U.S. Patent Nos. 4,683,195 and 4,683,202; PCR Protocols: A Guide to Methods and Applications (Innis et al., eds, 1990)), strand displacement amplification (SDA) (Walker, et al. Nucleic Acids Res. Clin. Microbiol. (Compton, Nature 350(6313):91-2 (1991)), rolling circle amplification (RCA) (Lisby, Mol. Biotechnol. 12(1):75-99 (1999); Hatchet al., Genet 15(2):35-40 (1999)) and Q-Beta Replicase (Lizardi et al., BiolTechnology 6:1197 (1988)).
  • PCR polymerase chain reaction
  • LCR ligase chain reaction
  • the amplification reaction amplifies a signal while accompanying amplification of a target analyte (specifically, a target nucleic acid molecule).
  • a target analyte specifically, a target nucleic acid molecule.
  • the amplification reaction is carried out according to PCR, specifically real-time PCR, or isothermal amplification reaction (eg LAMP or RPA).
  • a data set obtained by a signal generation reaction includes a plurality of data points including cycles of the signal generation reaction and signal values in the cycles.
  • signal value refers to a value obtained by digitizing a signal level (eg, signal intensity) actually measured in a cycle of a signal generation reaction, in particular, an amplification reaction, according to a predetermined scale, or a modified value thereof.
  • the modified value may include a mathematically processed signal value of the actually measured signal value.
  • Examples of mathematically processed signal values of actually measured signal values may include logarithmic values or derivatives.
  • data point means a coordinate value that includes cycle and signal values.
  • data refers to all information constituting a data set. For example, each of the cycle and signal value of the amplification reaction may correspond to data.
  • Data points obtained by the signal generation reaction, particularly the amplification reaction can be represented by coordinate values that can be represented in a two-dimensional orthogonal coordinate system.
  • the X-axis represents the number of cycles
  • the Y-axis represents the signal value measured or processed in the cycle.
  • data set means a collection of said data points.
  • the data set may be a set of data points directly obtained through an amplification reaction performed in the presence of a signal generating means, or may be a modified data set obtained by modifying such a data set.
  • the data set may be some or all of a plurality of data points obtained by an amplification reaction or modified data points thereof.
  • the data set for the target analyte is 200 or less, 150 or less, 100 or less, 80 or less, 60 or less, 50 or less, 45 or less, 40 or less, and 30 or less. Include data points.
  • a data set for a target analyte comprises at least 2, at least 5, at least 10, at least 15 and at least 20 data points.
  • the data set may be a data set obtained by processing a plurality of data sets.
  • the data sets for the plurality of target analytes are optionally obtained through processing of data sets obtained from reactions performed in the one reaction vessel. It can be.
  • data sets for a plurality of target analytes formed in one reaction vessel may be obtained by processing a plurality of data sets obtained from signals measured at different temperatures.
  • the aforementioned data set can be plotted and thereby an amplification curve obtained.
  • FIG. 1 is a block diagram of a positive-negative reading system 100 comprising a positive-negative reading device 1000, a preparation device 2000 and a detection device 3000 according to an embodiment.
  • a positive-negative reading system 100 includes a positive-negative reading device 1000 , a preparation device 2000 and a detection device 3000 . Also, these components may be connected to each other by wired or wireless communication.
  • the block diagram shown in FIG. 1 is merely illustrative, and the spirit of the present invention is not limited to that shown in FIG. 1 .
  • the positive-negative reading system 100 may further include components not shown in FIG. 1 or may not include at least one of the components shown in FIG. 1 .
  • the positive-negative reading system 100 may represent only positive-negative reading devices.
  • each component of the positive-negative reading system 100 may be connected differently from that shown in FIG. 1 .
  • each configuration will be described in detail.
  • the preparation device 2000 is implemented to perform a preparation operation on a sample (or sample or analysis sample).
  • the above-described preparation work performed by the preparation device 2000 includes a nucleic acid extraction work and a reaction mixture preparation work for nucleic acid amplification.
  • the preparation device 2000 may not perform the nucleic acid extraction operation.
  • the nucleic acid extraction operation may be performed by other components not shown in FIG. 1 .
  • the detection device 3000 is implemented to perform a nucleic acid amplification reaction and a nucleic acid detection operation on a sample or a sample. Depending on the embodiment, the detection device 3000 may be implemented to perform a nucleic acid detection operation without performing the nucleic acid amplification reaction. However, hereinafter, the detection device 3000 will be described on the premise that the nucleic acid amplification reaction is also implemented. do.
  • the detection device 3000 may include an optical module and a thermal module.
  • the optical module includes a light source module and a detection module.
  • the light source module supplies an appropriate optical stimulus to the sample, and the detection module detects an optical signal generated from the sample in response thereto.
  • the optical signal may be luminescence, phosphorescence, chemiluminescence, fluorescence, polarized fluorescence or other colored signal.
  • the optical signal may be an optical signal generated in response to an optical stimulus applied to the sample.
  • the light source module includes a light source configured to irradiate light onto a sample and a filter filtering light emitted from the light source.
  • the light sources may be light sources that emit light having the same wavelength characteristics. For example, when the light sources emit light in the same wavelength range, it means that the amount of light emitted for each wavelength range is the same.
  • the same means not only completely the same, but also substantially the same.
  • substantially the same means that, for example, when light emitted from two light sources is irradiated to the same optical marker through the same filter, the same kind of emitted light is generated from the optical marker with the same level of light.
  • the fact that the plurality of light sources have substantially the same wavelength characteristics means that the light quantity or wavelength range of the plurality of light sources has a deviation of 20%, 15%, or 10%.
  • a detection module detects the signal.
  • the detection module detects fluorescence, which is an optical signal generated from the samples.
  • the detection module detects the optical signal by generating an electrical signal according to the strength of the optical signal.
  • the detection module includes a detector configured to detect emission light emitted from the sample and a filter configured to filter emission light emitted from the sample.
  • the detector is configured to detect emission light emitted from an optical label included in the sample.
  • the detector may detect the amount of light for each wavelength by distinguishing the wavelengths of light or detect the total amount of light regardless of the wavelength.
  • the detector may use, for example, a photodiode, a photodiode array, a photo multiplier tube (PMT), a CCD image sensor, a CMOS image sensor, an avalanche photodiode (APD), or the like.
  • the detector is formed to detect emission light emitted from the optical label included in the sample.
  • the detector may be formed toward the sample so that emission light generated from the sample directly reaches the detector, or toward a reflector or optical fiber so that emission light can reach the detector through a reflector or optical fiber.
  • the filter of the detection module is a filter for selectively passing emission light emitted from an optical label included in the sample.
  • the detection filter of the present disclosure selectively passes emission light emitted from an optical label to accurately detect a target.
  • the thermal module is implemented to perform a nucleic acid amplification reaction.
  • the thermal module includes a sample holder in which a sample is accommodated.
  • the sample holder includes a plurality of holes, and reaction vessels may be located in the holes.
  • the reaction vessels may contain samples, from which fluorescence is emitted.
  • the sample holder may be a conductive material. When the sample holder is in contact with the reaction vessels, heat can be transferred from the sample holder to the reaction vessels.
  • the sample holder may be made of metal such as aluminum, gold, silver, nickel or copper.
  • a separate component other than the sample holder may directly supply energy to the reaction vessel to control the temperature of the samples in the reaction vessel.
  • the sample holder may be configured to receive the reaction vessels but not to transfer heat to the reaction vessels.
  • the thermal block includes a plurality of holes, and reaction vessels may be located in the holes.
  • the heating plate is in the form of contacting a thin metal plate to accommodate the sample. It can be operated by passing an electric current through a thin metal to heat the plate.
  • sample holder is a receptacle capable of receiving one or more chips or cartridges.
  • a cartridge is a fluid cartridge that includes a flow channel.
  • the thermal module may additionally include a heat generating element, a heat sink and a heatsink fan for cycling the sample in the sample holder through a series of temperatures.
  • the thermal module is used for a PCR-based nucleic acid amplification reaction. More specifically, the thermal module may perform a denaturing step, an annealing step, and an extension (or amplification) step to amplify DNA (deoxyribonucleic acid) having a specific nucleotide sequence. .
  • the denaturation step is a step of separating double-stranded DNA into single-stranded DNA by heating a solution containing a sample and a reagent containing double-stranded DNA as template nucleic acid to a specific temperature, for example, about 95°C. .
  • a specific temperature for example, about 95°C.
  • an oligonucleotide primer having a nucleotide sequence complementary to the nucleotide sequence of the nucleic acid to be amplified is provided, and the separated single-stranded DNA is heated to a specific melting temperature (Tm), for example, 60 ° C.
  • Tm specific melting temperature
  • This is a step of forming a partial DNA-primer complex by cooling and binding a primer to a specific nucleotide sequence of single-stranded DNA.
  • the extension step is a step in which double-stranded DNA is formed based on the primers of the partial DNA-primer complex by a DNA polymerase by maintaining the solution at a specific temperature, for example, 72° C. after the annealing step.
  • the thermal module can exponentially amplify DNA having the specific nucleotide sequence by repeating the above three steps, for example, 10 to 50 times.
  • the thermal module may perform the annealing step and the extension step simultaneously.
  • the thermo module may complete one cycle (circulation) by performing two steps consisting of a denaturation step and an annealing/extension step.
  • Such a detection device includes various conventionally known instruments as long as the temperature can be controlled for the amplification reaction. Examples include CFX (Bio-Rad), iCycler (Bio-Rad), LightCycler (Roche), StepOne (ABI), 7500 (ABI), ViiA7 (ABI), QuantStudio (ABI), AriaMx (Agilent), Eco (Illumina ), etc., but are not limited thereto.
  • the above-described nucleic acid amplification reaction is performed, if the target analyte is included in the reaction vessel, the amount is amplified, as well as the amount generated by the above-described signal generating means The magnitude of the signal can also be amplified as described above.
  • the detection device 3000 is implemented to detect the magnitude of such a signal. Specifically, the detection device 3000 may monitor in real time the magnitude of the above-described signal that changes as the nucleic acid amplification reaction proceeds. The monitored result may be output from the detection device 3000 in the form of a data set mentioned in the definition of the term.
  • the nucleic acid amplification reaction when the nucleic acid amplification reaction is performed, since the size of the signal generated by the signal generating means can also be amplified, the nucleic acid amplification reaction will be regarded as causing the signal generating reaction discussed above as a term. let's do it.
  • the positive/negative reading device 1000 may receive a detection result of the target analyte of the sample from the detection device 3000 .
  • the positive/negative reading device 1000 may receive the previously described data set from the detection device 3000 .
  • the positive-negative reading device 1000 may read and output whether the sample is positive-negative for the target analyte. This is conceptually illustrated in FIG. 2 .
  • FIG. 2 when the positive-negative reading device 1000 receives a data set as an input as a detection result for a target analyte of a sample, the positive-negative reading device 1000 responds to the data set as an input of the corresponding target analyte of the sample. It reads and outputs whether it is positive or negative.
  • FIG. 3 is a block diagram of a positive-negative reading device 1000 according to an embodiment.
  • the positive-negative reading device 1000 includes an input unit 1100, a pre-processing unit 1200, and a positive-negative reading unit 1300, but is not limited thereto.
  • the positive-negative reading apparatus 1000 may be implemented not to include at least one component shown in FIG. 3 (for example, the pre-processing unit 1200) according to an embodiment, or a component not shown in FIG. 3 may be added. It may be implemented to include as.
  • the input unit 1100 is a component that receives data, and for this purpose, the input unit 1100 can be implemented as an input/output port or terminal.
  • the positive/negative reading device 1000 may receive the aforementioned data set from the detection device 3000 through the input unit 1100 .
  • this data set may include not only the signal value in each cycle detected in the amplification process, but also the order of the cycle of the signal value, but is not limited thereto. no.
  • a data set may include data points paired by response number and signal value, and the data points may be ordered from small to large iterations or large to small iterations.
  • a data set includes data points paired by response time and signal value, and the data points may be arranged according to short time to long time or long time to short time.
  • the unit of the signal value may be, for example, Relative Fluorescence Units (RFU) representing the intensity of a fluorescence signal.
  • REU Relative Fluorescence Units
  • the range of the order of cycles may be 1 to 45, but is not limited thereto.
  • the pre-processing unit 1200 may perform a predetermined pre-processing task on the data set that the positive-negative reading device 1000 receives from the detection device 1300 through the input unit 1100 .
  • unwanted, non-analyte related signals that may occur regardless of the presence or absence of the target analyte in the sample can be removed or corrected.
  • electrical noise that can be generated in the detection device 3000 regardless of whether the above-described signal generation reaction is executed, noise in the baseline region of the nucleic acid amplification curve, or a rapid increase in fluorescence signal (i.e., A jump, spike, or step signal) or rapid decrease (ie, a dip signal) may be removed or corrected.
  • the negative control group is an experimental group in which one or more essential components for the progress of the reaction are not present in the reactants for the signal generating reaction.
  • a negative control group in a nucleic acid amplification reaction is an experimental group without a target analyte, an experimental group without primers, an experimental group without a polymerase, or an experimental group with only a buffer.
  • the negative control used in one embodiment is an experimental group containing components for nucleic acid amplification excluding the target analyte in the nucleic acid amplification reaction.
  • Subtraction of the negative control can be performed by subtracting the signal value of the negative control from the signal value of the data set for the target analyte.
  • the signal values of the data set for the target analyte and the signal values of the negative control were obtained in the same reaction and measurement environment, e.g., in the same reaction run on one and the same amplification and analysis device. is a signal value.
  • the baseline subtraction can be performed by various methods known in the art (eg, US Patent No. 8,560,247).
  • each of these various types of preprocessing operations may be performed in the preprocessor 1200 .
  • a preprocessing operation a method disclosed in US Patent No. 8,560,247 or US Application Publication No. 2015/0186598 may be applied.
  • signals detected from one assay sample vessel if there is a possibility that they include signals for detecting multiple target analytes using a single type of label, such signals
  • An operation for separating or distinguishing signals for each target analyte may be included, which will be described later.
  • the above-described preprocessing may include a task for enabling the learning result of the positive/negative reading unit 1300 to reach a desired level.
  • the positive-negative reading unit 1300 is a neural network
  • the quality of training data used for learning may affect the performance of the positive-negative reading unit 1300. Therefore, preprocessing processes such as standardization or normalization targeting learning data, preprocessing processes such as correcting or removing outliers after detecting them, and clustering learning data having the same or similar characteristics, and then taking this into account so that learning is performed
  • a preprocessing process or a preprocessing process of unifying units of learning data may be performed as the aforementioned preprocessing task.
  • a preprocessing process is already known, a detailed description thereof will be omitted.
  • the positive/negative reading unit 1300 is implemented to read whether a target analyte is present in a sample. To this end, the positive/negative readout unit 1300 may receive the aforementioned data set from the input unit 1100 or the preprocessor 1200.
  • the positive/negative reading unit 1300 can be implemented in various ways.
  • the positive/negative reading unit 1300 can be implemented by a neural network.
  • the information input to the positive-negative reading unit 1300 that is, the data set
  • the information output from the positive-negative reading unit 1300 is the result deduced from the neural network.
  • the information output from the positive/negative reading unit 1300 includes a result inferring whether or not the corresponding target analyte is present in the corresponding sample. If the output data is 'positive', it means that the corresponding target analyte is included in the corresponding sample. On the other hand, if the output data is 'negative', it means that the corresponding target analyte is not included in the corresponding sample.
  • neural network may be used interchangeably with a classifier, computational model, neural network model, or network function.
  • neural networks may be included within the scope of machine learning models.
  • a neural network may consist of a set of interconnected computational units, which may generally be referred to as nodes. These nodes may also be referred to as neurons. A neural network is composed of one or more such nodes. In addition, these nodes (or neurons) constituting neural networks may be interconnected by one or more links.
  • one or more nodes connected through a link may form a relative relationship of an input node and an output node.
  • the concept of an input node and an output node is relative, and any node in an output node relationship with one node may have an input node relationship with another node, and vice versa.
  • an input node to output node relationship may be created around a link. More than one output node can be connected to one input node through a link, and vice versa.
  • the value of data of the output node may be determined based on data input to the input node.
  • a link interconnecting an input node and an output node may have a weight.
  • the weight may be variable, and may be changed by a user or an algorithm in order to perform a function desired by the neural network. For example, when one or more input nodes are interconnected by respective links to one output node, the output node is set to a link corresponding to values input to input nodes connected to the output node and respective input nodes.
  • An output node value may be determined based on the weight.
  • one or more nodes are interconnected through one or more links to form an input node and output node relationship in the neural network.
  • Characteristics of the neural network may be determined according to the number of nodes and links in the neural network, an association between the nodes and links, and a weight value assigned to each link. For example, when there are two neural networks having the same number of nodes and links and different weight values of the links, the two neural networks may be recognized as different from each other.
  • a neural network may be composed of a set of one or more nodes.
  • a subset of nodes constituting a neural network may constitute a layer.
  • Some of the nodes constituting the neural network may form one layer based on distances from the first input node.
  • a set of nodes having a distance of n from the first input node may constitute n layers.
  • the distance from the first input node may be defined by the minimum number of links that must be passed through to reach the corresponding node from the first input node.
  • the definition of such a layer is arbitrary for explanation, and the order of a layer in a neural network may be defined in a method different from the above.
  • a layer of nodes may be defined by a distance from a final output node.
  • An initial input node may refer to one or more nodes to which data is directly input without going through a link in relation to other nodes among nodes in the neural network.
  • it may mean nodes that do not have other input nodes connected by a link.
  • the final output node may refer to one or more nodes that do not have an output node in relation to other nodes among nodes in the neural network.
  • the hidden node may refer to nodes constituting the neural network other than the first input node and the last output node.
  • the number of nodes in the input layer may be greater than the number of nodes in the output layer.
  • the number of nodes in the input layer may be 45 while the number of nodes in the output layer may be 2.
  • the input layer node may be each data point included in the aforementioned data set, and one of the two nodes of the output layer at this time is for 'positive' and the other is for 'negative'.
  • the number of nodes in the output layer is two like this, one may correspond to 'positive' indicating the inclusion of the target analyte in the sample, and the other may correspond to 'negative'. it could be
  • the number of nodes of the input layer may be less than or equal to the number of nodes of the output layer.
  • a 'deep neural network' may refer to a neural network including a plurality of hidden layers in addition to an input layer and an output layer. Deep neural networks allow you to uncover latent structures in your data. In other words, it can identify the latent structure of a photo, text, video, sound, or music (e.g., what objects are in the photo, what the content and emotion of the text are, what the content and emotion of the audio are, etc.). .
  • Deep neural networks include convolutional neural networks (CNN), recurrent neural networks (RNNs), long short-term memory, auto encoders, generative adversarial networks (GANs), limited Boltzmann Restricted boltzmann machine (RBM), deep belief network (DBN), Q network, U network, Siamese network, Generative Adversarial Network (GAN), Bidirectional Encoder Representations from Transformers (BERT) model, etc.
  • CNN convolutional neural networks
  • RNNs recurrent neural networks
  • GANs generative adversarial networks
  • RBM limited Boltzmann Restricted boltzmann machine
  • DNN deep belief network
  • Q network U network
  • Siamese network Generative Adversarial Network
  • GAN Generative Adversarial Network
  • BERT Bidirectional Encoder Representations from Transformers
  • the neural network according to an embodiment may be trained using at least one of supervised learning, unsupervised learning, semi-supervised learning, and reinforcement learning.
  • Learning of the neural network may be a process of applying knowledge for the neural network to perform a specific operation to the neural network.
  • Contents of learning and learning data of the neural network described below may also be contents of learning or learning data of the positive-negative reading unit 1300 of the present disclosure.
  • a neural network can be trained in a way that minimizes errors in output.
  • the learning data is repeatedly input into the neural network, the output of the neural network for the learning data and the error of the target are calculated, and the error of the neural network is back-propagated from the output layer of the neural network to the input layer in the direction of reducing the error (Backpropagation is the process of updating the weight of each node in the neural network.
  • each learning data is labeled with the correct answer (ie, labeled learning data), and in the case of unsupervised learning, the correct answer may not be labeled in each learning data.
  • learning data in the case of supervised learning related to data classification may be data in which each learning data is labeled with a category. Labeled training data is input to the neural network, and an error can be calculated by comparing the output (category) of the neural network and the label of the training data.
  • an error may be calculated by comparing input learning data with a neural network output. The calculated error is back-propagated in a reverse direction (ie, from the output layer to the input layer) in the neural network, and the connection weight of each node of each layer of the neural network may be updated according to the back-propagation. The amount of change in the connection weight of each updated node may be determined according to a learning rate.
  • the neural network's computation of input data and backpropagation of errors can constitute a learning cycle (epoch).
  • the learning rate may be applied differently according to the number of iterations of the learning cycle of the neural network. For example, a high learning rate may be used in the early stages of neural network training to increase efficiency by allowing the neural network to quickly obtain a certain level of performance, and a low learning rate may be used in the late stage to increase accuracy.
  • training data may be a subset of real data (ie, data to be processed using the trained neural network), and therefore, the error for the training data decreases but the error for the actual data increases. There may be learning cycles.
  • Overfitting is a phenomenon in which errors for actual data increase due to excessive learning on training data. For example, a phenomenon in which a neural network that has learned a cat by showing a yellow cat does not recognize that it is a cat when it sees a cat other than yellow may be a type of overfitting. Overfitting can act as a cause of increasing the error of machine learning algorithms.
  • Various optimization methods can be used to prevent such overfitting. To prevent overfitting, methods such as increasing the training data, regularization, inactivating some nodes in the network during learning, and using a batch normalization layer should be applied. can
  • the positive-negative readout unit 1300 is implemented as a neural network, in particular, as a deep neural network, more specifically as a recurrent neural network (RNN), in more detail. Let's take a look.
  • a neural network in particular, as a deep neural network, more specifically as a recurrent neural network (RNN), in more detail. Let's take a look.
  • RNN recurrent neural network
  • a recurrent neural network is one of the neural networks capable of processing time-series data. Therefore, when the positive-negative readout unit 1300 according to an embodiment is implemented as a recurrent neural network, a data set input to the positive-negative readout unit 1300, that is, a multi-cycle signal generation reaction targeting a target analyte. Information on the signal value in each of the plurality of cycles and the order of each of the plurality of cycles, derived from , may be considered by the positive/negative readout unit 1300 as well as information on the order of the signal value.
  • the positive/negative reading unit 1300 determines in which cycle the magnitude of the signal value increases, in which cycle it decreases, and from where the cycle does not change.
  • the positive/negative reading unit 1300 determines in which cycle the magnitude of the signal value increases, in which cycle it decreases, and from where the cycle does not change.
  • the recurrent neural network can be learned by a learning device (not shown in the drawing) according to a supervised-learning method.
  • the learning device includes a processor such as a GPU, but is not limited thereto.
  • Such a recurrent neural network outputs one data when receiving a plurality of data.
  • the input becomes a signal value in a plurality of cycles, and the output becomes whether it is positive or negative. This is shown in FIG. 5 .
  • the input data for learning may include a data set obtained in a process of detecting a specific target analyte in a specific sample.
  • the correct answer data for learning may include whether or not the corresponding target analyte is included in the corresponding sample, that is, whether it is positive or negative.
  • numerous data sets are created and stored in the process of detecting whether various target analytes are included in each of the various samples.
  • the detection result is also generated or stored.
  • input data for learning used for learning to implement a positive readout unit used to determine whether the target analyte in the sample is positive or negative generates a signal that is substantially the same as a signal generating reaction used for analyzing the target analyte in the sample.
  • a data set generated by a reaction generated by a reaction.
  • the aforementioned data set for a specific target analyte of a specific sample (eg, signal values in each of the 45 cycles and information on the order of the cycles) is input to the recurrent neural network. And, as correct answer data for learning, whether or not the corresponding target analyte is included in the corresponding sample is input.
  • each of N pieces of training data as shown in Table 1 below may be input to the recurrent neural network.
  • No Input data for training Answer data for training One ⁇ 100,120,93,... ... ,3000,3100,5000,7000, 7500,8232 ⁇ voice 2 ⁇ 500,720,1030,... ... ,5000,6100,7000,8100, 9500,10232 ⁇ voice ... ... ... N ⁇ 100,123,83,... ,10000,13100,14000,17000, 17500,18232 ⁇ positivity
  • 'No' in Table 1 means a number given to each of the N pieces of training data in order to classify the aforementioned N pieces of training data.
  • these numbers may not be considered for learning of the aforementioned recurrent neural network.
  • the aforementioned N pieces of training data may be input to the recurrent neural network in an order independent of the size of the numbers.
  • the input data for learning includes a plurality of signal values separated by commas ',' in braces ' ⁇ '.
  • the size of these signal values may be 45, but is not limited thereto.
  • a plurality of these signal values separated by commas are sequentially from the left: the first cycle, the second cycle, ... , and the rightmost signal value may be for the last cycle (ex. 45th cycle).
  • the correct answer data for learning may have a value of either 'positive' or 'negative'.
  • 'positive' indicates that the sample for the corresponding No contains the target analyte
  • 'negative' indicates that the sample for the corresponding No does not contain the target analyte.
  • learning is performed using an error backpropagation method so that an error between an output result according to an input and the above-described correct answer data for learning is minimized.
  • the weight (W xh in FIG. 4) for the signal value (x in FIG. 4) of any one cycle among the plurality of cycles, and the The weight (W hh of eh 4) for the hidden state value calculated in the cycle is updated so that the difference between the estimated result and the correct answer data for learning is reduced in response to the input data for learning being input to the input terminal of the positive-negative reading unit. do.
  • This learning process is performed until the performance of the recurrent neural network satisfies a predetermined criterion.
  • the predetermined criterion may be established in a variety of ways. For example, a predetermined criterion may be determined by a known cross-validation.
  • the positive-negative readout unit 1300 may be implemented in a long short-term memory model method.
  • the short-term memory model it is known as a model that compensates for the loss of the influence of past data, which is a disadvantage of recurrent neural networks.
  • the learning method for the long and short term memory model and the utilization method after completion of learning are the same as those of the recurrent neural network, description thereof will be omitted.
  • the positive/negative readout unit 1300 may be implemented in a BERT (Bidirectional Encoder Representations from Transformers) model method.
  • BERT is composed of a body part learned through a pre-training method and a fine-tuning part learned through a fine-tuning method.
  • a plurality of data sets obtained when each of the various samples contains various target analytes are semi-supervised learning methods known as MLM (Mask Language Model) and NSP (Next Sentence Prediction). used for learning).
  • MLM Manufacturing Language Model
  • NSP Next Sentence Prediction
  • each data set includes signal values having an order for each cycle, and learning according to the aforementioned NSP can be applied to the body part through a process of matching the order or precedence relationship of these signal values.
  • supervised learning is performed in which the feature vector derived from the body unit is used as an input and whether or not the target analyte is included in the sample is the correct answer, and the fine adjustment unit is learned accordingly.
  • the BERT model itself is a known technology, except for estimating the target analyte in the sample using the BERT model or whether the data used for its learning is a data set and whether it is positive or negative, the BERT model itself Further description of itself will be omitted.
  • the positive-negative readout unit 1300 is all information included in the data set, that is, signals for all cycles. It can be seen conceptually as including an encoder unit that extracts a context vector from the input value and a binary classification unit that reads positive/negative values based on the extracted context vector.
  • the positive/negative readout unit 1300 may be implemented to include an encoder unit and a binary classification unit.
  • the above-described positive/negative reading unit 1300 may be provided in the positive/negative reading device for each factor predefined as influencing the signal generation of the signal generation reaction.
  • the element includes reaction conditions used in a nucleic acid amplification reaction.
  • the reaction conditions are characterized in that the reaction medium used for the nucleic acid amplification reaction.
  • the reaction medium is one or more substances selected from the group consisting of pH related substances, ionic strength related substances, enzymes and enzyme stabilization related substances.
  • the pH related material includes a buffer
  • the ionic strength related material includes an ionic material
  • the enzyme stabilization related material includes sugar
  • one positive-negative reading unit 1300 may be provided in the positive-negative reading device 1000 for each target analyte such as sars-cov-2 or Zika virus.
  • which positive-negative reading unit 1300 among the plurality of positive-negative reading units 1300 to be used may be determined by a user using a separate algorithm or the positive-negative reading apparatus 1000 .
  • separate positive and negative readouts may be provided depending on the signal generation reaction used to detect the target analyte.
  • a positive or negative readout may be provided for each factor predefined as influencing signal generation of the signal generation response.
  • factors predefined as influencing the signal generation of the signal generation reaction include concentrations of oligonucleotides, enzymes, labels, and reaction composition components for detecting a target analyte.
  • Reactive composition components include buffer, salts, metal ions and dNTPs.
  • the factor predefined as influencing the signal generation of the signal generation reaction includes a signal generation reaction condition.
  • Oligonucleotides include primers or probes.
  • whether a sample is positive or negative for a target analyte can be read by a model trained by a deep learning method.
  • the speed and accuracy of positive-negative reading results can be improved.
  • the above-described positive-negative reading device 1000 can be implemented according to a hardware block configuration diagram as shown in FIG. 6 . Let's look more specifically.
  • the positive/negative reading device 1000 includes a storage device 1610 that stores at least one command, a processor 1620 that executes at least one command of the storage device 1610, and a transceiver 1630. ), an input interface device 1640 and an output interface device 1650.
  • Each of the components 1610 , 1620 , 1630 , 1640 , and 1650 included in the positive-negative reading device 1000 are connected by a data bus 1660 to communicate with each other.
  • the storage device 1610 may perform the function of the storage unit 1400 . Also, the storage device 1610 may include at least one of a memory or a volatile storage medium and a non-volatile storage medium. For example, the storage device 1610 may include at least one of a read only memory (ROM) and a random access memory (RAM).
  • ROM read only memory
  • RAM random access memory
  • the storage device 1610 may further include at least one command to be executed by the processor 1620 to be described later, and store signal values of each of a plurality of cycles input from a user in the input interface device 1640, data for learning, and the like.
  • the processor 1620 may refer to a central processing unit (CPU), a graphics processing unit (GPU), a micro controller unit (MCU), or a dedicated processor on which methods according to embodiments are performed.
  • CPU central processing unit
  • GPU graphics processing unit
  • MCU micro controller unit
  • the processor 1620 may perform the functions of the pre-processing unit 1200 and the positive/negative reading unit 1300 by at least one program command stored in the storage device 1610. Each of these may be stored in a memory in the form of at least one module and executed by a processor.
  • the transmitting/receiving device 1630 may receive or transmit data from an internal device or an external device connected through communication, and may perform the function of the input unit 1100 .
  • the transceiver 1630 may receive data about a data set of samples, analysis samples, and amplified samples from the preparation device 2000 or the detection device 3000 .
  • the input interface device 1640 may receive at least one control signal or set value from a user.
  • the input interface device 1640 may receive a user input such as a preprocessing method to be performed by the preprocessor 1200 and a jumping correction criterion.
  • the output interface device 1650 may output and visualize at least one piece of information including whether or not the target analyte of the sample read by the positive/negative reader 1300 is positive or negative by the operation of the processor 1620 .
  • FIG. 7 is a flow chart of a positive-negative reading method according to an embodiment.
  • the positive-negative reading method according to this flowchart may be performed by the positive-negative reading device 1000 described above.
  • the positive-negative reading method shown in FIG. 7 is only exemplary, and the spirit of the present invention is not limited to that shown in FIG. 7 .
  • the positive-negative reading device 1000 obtains a signal value at each of the plurality of cycles from a multi-cycle signal generation reaction targeting a target analyte in a sample to be read as positive-negative through the input unit 1100.
  • Input can be received (S100).
  • Such a signal value may be received from the detection device 3000 as described above, but is not limited thereto.
  • the positive-negative reading device 1000 uses a pre-learned model to determine the presence or absence of a target analyte in a sample from signal values in a plurality of cycles and the sequence of the plurality of cycles through the positive-negative readout unit 1300. and read (S200).
  • the positive/negative reading unit 1300 may receive the above-described data set from the input unit 1100 or the pre-processing unit 1200 as described above.
  • a target analyte to be detected in a sample included in one reaction container may be one.
  • a signal dependent on the presence of the target analyte may be detected during signal generation using a signal generating composition including a label.
  • the positive/negative reading device 1000 also receives this signal from the detecting device 3000 and reads whether the signal is positive/negative.
  • the reaction container includes signal generating compositions that provide signals depending on the presence of the target analytes, and signals indicating the presence of the target analytes may be provided through the signal generating reaction.
  • the signal generation means it is possible to generate signals having different characteristics (eg, signals of different wavelengths) for each target analyte, and a distinct data set for each target analyte can be obtained.
  • a separate positive-negative readout for each target analyte is provided, and the corresponding data set can be analyzed at the corresponding positive-negative readout to confirm the presence of the target analyte.
  • signals having substantially the same characteristics may be generated for a plurality of target analytes, depending on the signal generating means used.
  • a distinct data set for each target analyte may be obtained through a series of processes.
  • a separate positive-negative readout for each target analyte is provided, and the corresponding data set can be analyzed at the corresponding positive-negative readout to confirm the presence of the target analyte.
  • the input unit 1100 of the positive-negative reading device 1000 receives a detected signal from one assay sample container (reaction tube) from the detection device.
  • the signal is a signal provided by a method of detecting a plurality of target analytes using a single type of label. Let's assume that these signals are received as input.
  • the pre-processing unit 1200 of the positive-negative reading device 1000 divides the above-described signals received by the input unit 1100 from the detection device 3000 into signals for each of a plurality of target analytes. Perform pre-processing to separate. This division or separation operation is described in known methods (eg, WO2015147370, WO2015147377, WO2015147382, WO2015147412). This classification or separation process will be described in more detail with reference to the above-described known methods.
  • a first signal generating composition when a first target analyte and a second target analyte are to be detected in one reaction vessel, when a first signal generating composition is used to detect the first target analyte, the first signal is generated.
  • the composition is capable of generating a signal indicative of the presence of a first target analyte at a first temperature in a signal generating reaction.
  • a signal indicative of the presence of the first target analyte can be generated even at the second temperature.
  • the second signal generating composition when the second signal generating composition is used to detect the second target analyte, the second signal generating composition may prevent a signal from being generated even if the second target analyte exists at the first temperature in the signal generating reaction. there is.
  • the second signal generating composition may generate a signal indicating the presence of the second target analyte at the second temperature.
  • the signal generating reaction includes a reaction performed by the first signal generating composition generating a signal at each of the first temperature and the second temperature when the target analyte is present in the sample.
  • the signal generating reaction is performed by a second signal generating composition that does not generate a signal at the first temperature and generates a signal at the second temperature when a target analyte different from the target analyte is present in the sample. reaction may be further included.
  • the first temperature is a higher temperature than the second temperature. In one embodiment, the first temperature is lower than the second temperature.
  • the signal generating composition there may be a first temperature range that generates a signal for a first target analyte but not a signal for a second target analyte.
  • detection temperatures for each of the two target analytes may be determined in consideration of the above two temperature ranges (the first temperature range and the second temperature range).
  • a relatively high temperature detected among the detected temperatures may be selected from the first temperature range.
  • a relatively high detection temperature only a signal corresponding to the first target analyte is generated even if both the first target analyte and the second target analyte are present in one sample.
  • a relatively low temperature detected temperature among the detected temperatures may be selected from the second temperature range.
  • a signal corresponding to the first target analyte as well as a signal corresponding to the second target analyte are generated.
  • one of the two target analytes has a relatively high temperature detection temperature determined by a corresponding signal generating composition (first signal generating composition), and the other has a corresponding another signal generating composition (second signal generating composition). It has a relatively low temperature detection temperature determined by
  • the preprocessing unit 1200 may separate signals indicating the presence of two target analytes through a predetermined operation, and transmit the result of the separation to the positive/negative reading unit 1300.
  • a 'predetermined operation' will be described with reference to FIG. 8 .
  • CT Chlamydia Trachomatis
  • NG Neisseria Gonorrhoeae
  • the first temperature is 72°C
  • the second temperature is 60°C.
  • CT is an example for a target analyte having a relatively high detection temperature
  • NG is an example for a target analyte having a relatively low detection temperature.
  • Signals for both CT and NG may exist in signals detected at a relatively low detection temperature.
  • a signal for CT may be removed from signals obtained at a relatively low detection temperature by using a signal obtained at a relatively high detection temperature.
  • a signal representing the presence or absence of NG that is, a data set can be obtained.
  • the data set is input to the positive/negative reading unit 1300, whether or not NG in the sample is positive/negative can be read.
  • whether a sample is positive or negative for a target analyte can be read by a model trained by a deep learning method.
  • the speed and accuracy of positive-negative reading results can be improved.
  • the positive-negative reading method described above may be implemented in the form of a computer program programmed to perform each step included in the method.
  • the corresponding computer program may be included in a computer readable recording medium. That is, according to various implementations of the present invention, it can be implemented in the form of a computer readable recording medium for storing the above-described computer program or a computer program stored in the above-described computer readable recording medium.
  • Combinations of each block of the block diagram and each step of the flowchart accompanying the present invention may be performed by computer program instructions. Since these computer program instructions may be loaded into an encoding processor of a general-purpose computer, special-purpose computer, or other programmable data processing equipment, the instructions executed by the encoding processor of the computer or other programmable data processing equipment are each block or block diagram of the block diagram. Each step in the flow chart creates means for performing the functions described.
  • These computer program instructions may also be stored in a computer usable or computer readable memory that can be directed to a computer or other programmable data processing equipment to implement functionality in a particular way, such that the computer usable or computer readable memory
  • the instructions stored in may also produce an article of manufacture containing instruction means for performing the functions described in each block of the block diagram or each step of the flow chart.
  • the computer program instructions can also be loaded on a computer or other programmable data processing equipment, so that a series of operational steps are performed on the computer or other programmable data processing equipment to create a computer-executed process to generate computer or other programmable data processing equipment. It is also possible that the instructions performing the processing equipment provide steps for executing the functions described in each block of the block diagram and each step of the flowchart.
  • each block or each step may represent a module, segment or portion of code that includes one or more executable instructions for executing specified logical function(s). It should also be noted that in some alternative embodiments, it is possible for the functions mentioned in the blocks or steps to occur out of order. For example, two blocks or steps shown in succession may in fact be performed substantially concurrently, or the blocks or steps may sometimes be performed in reverse order depending on their function.

Abstract

본 발명의 일 실시예에 따른 양음성 판독 장치는 표적 분석물질을 타겟으로 하는 복수 사이클의 신호 발생 반응으로부터, 복수 사이클 각각에서의 신호값을 입력받는 입력부; 신호 발생 반응은 시료 내에 표적 분석물질의 존재에 의존적인 신호를 발생시키고, 복수 사이클 각각에서의 신호값 및 복수 사이클 각각의 순서로부터, 시료 내에 표적 분석물질의 존부를 추정하도록 기 학습된 양음성 판독부를 포함할 수 있다.

Description

시료 내 표적 분석물질에 대한 양음성 판독 장치 및 방법
본 발명은 시료 내 표적 분석물질에 대한 양음성 판독 장치 및 방법에 관한 것이다.
중합효소 연쇄반응(Polymerase chain reaction: PCR)으로 공지된 가장 많이 사용되는 핵산증폭반응은 이중가닥 DNA의 변성, DNA 주형에로의 올리고뉴클레오타이드 프라이머의 어닐링 및 DNA 중합효소에 의한 프라이머 연장의 반복된 사이클 과정을 포함한다(Mullis 등, 미국 특허 제4,683,195호, 제4,683,202호 및 제4,800,159호; Saiki et al., Science 230:1350-1354(1985)).
실시간 PCR(Real-time PCR)은 시료에서 타겟 핵산을 실시간으로 검출하기 위한 PCR 기반 기술이다. 특정 타겟 핵산을 검출하기 위하여, PCR 반응 시 타겟 핵산의 양에 비례하여 검출 가능한 형광신호를 방출하는 신호 발생수단이 이용된다. 타겟 핵산의 양에 비례하는 형광신호가 실시간 PCR을 통하여 각 측정지점(사이클) 마다 검출되어, 각 측정지점 및 상기 측정지점에서의 신호값을 포함하는 데이터 세트가 수득되고, 데이터 세트로부터 측정지점 대비 검출되는 형광신호의 세기를 표시한 증폭곡선(amplification curve) 또는 증폭 프로파일 곡선(amplification profile curve)이 수득된다.
일반적으로 실시간 PCR에 의한 증폭곡선은 베이스라인(baseline) 영역, 지수(exponential) 영역, 정체(plateau) 영역으로 구분된다. 지수 영역은 PCR 증폭 산물의 증가에 비례하여 방출되는 형광신호가 증가하는 영역이며, 정체 영역은 PCR 증폭 산물의 증가 및 형광신호의 방출이 포화상태에 이르러 더 이상 형광신호의 증가가 나타나지 않는 영역이다. 베이스라인 영역은 반응 초기에 형광신호가 변화 없이 일정하게 유지되는 영역을 의미한다. 베이스라인 영역은 PCR 반응 산물이 방출하는 형광신호가 검출될 정도로 충분하지 않기 때문에, 타겟 분석 물질의 증폭에 의한 형광신호보다는 반응 시료 자체의 형광신호와 측정 시스템 자체의 형광신호인 배경신호(background signal)가 베이스라인 영역의 형광신호의 대부분을 차지한다.
실시간 PCR의 데이터 세트로부터 타겟 분석 물질의 증폭이 존재하는지 여부를 판단하는 다양한 방법이 개발되어 있다.
예를 들어, 역치값(threshold value)를 이용하는 방법이 있다. 역치값을 이용하는 방법은 분석되어야 하는 모든 반응들에 대한 특정의 신호 역치값을 미리 결정하고(a defined signal threshold is determined for all reactions to be analyzed), 데이터 세트의 신호값이 신호 역치값을 도달(reach) 또는 도과(exceed)하는지를 판단하는 방법이다.
다른 방법으로, Jeffrey Lerner는 미국등록특허 제8,560,247호에서 데이터에 대해서 피팅되는 함수를 수득하고, 상기 수득된 함수의 기울기(slope)가 최대 증폭 기울기 경계(maximum amplification slope bound)를 초과하는지 여부에 따라 데이터 세트에 점프 에러(jump error)가 존재하는지를 결정하는 방법을 개시한다.
또 다른 방법으로, Ronald T. Kurnik 등은 미국공개특허 제2009-0119020호에서 PCR 커브와 같은 성장 곡선(growth curve)의 데이터가 유효(valid)하거나 의미있는 (significant) 성장을 나타내는지를 판단하는 방법을 개시하였다. 상기 방법은 데이터와 2차 함수를 피팅하여, 피팅된 2차 함수를 수득하고, 2차 함수의 통계학적으로 의미있는 값(예컨대, R-square값)을 구한 후에, 통계학적으로 의미 있는 값이 미리 정해진 특정 역치값(예컨대, 0.90 0.99)을 초과하는 지를 판단한다.
본 발명이 해결하고자 하는 과제는, 시료에 전술한 타겟 핵산이 포함되어 있는지 여부, 즉 양음성 여부를 보다 정확하면서도 효율적으로 판독하는 기술을 제공하는 것이다.
다만, 본 발명이 해결하고자 하는 과제는 이상에서 언급한 것으로 제한되지 않으며, 언급되지 않은 또 다른 해결하고자 하는 과제는 아래의 기재로부터 본 발명이 속하는 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
일 실시예에 따른 양음성 판독 장치는 표적 분석물질을 타겟으로 하는 복수 사이클의 신호 발생 반응으로부터 신호값을 입력받는 입력부; 상기 신호 발생 반응은 시료 내에 상기 표적 분석물질의 존재에 의존적인 신호를 발생시키고, 상기 복수 사이클에서의 신호값 및 상기 복수 사이클의 순서로부터, 상기 시료 내에 상기 표적 분석물질의 존부를 추정하도록 기 학습된 양음성 판독부를 포함한다.
또한, 상기 표적 분석물질은 표적 핵산 분자를 포함할 수 있다.
또한, 상기 표적 분석물질의 존재에 의존적인 신호는 형광 신호를 포함할 수 있다.
또한, 상기 신호 발생 반응은 핵산증폭 반응을 포함할 수 있다.
또한, 상기 양음성 판독부는 상기 신호값을 그 사이클의 순서에 따라 순차적으로 상기 입력부로부터 획득할 수 있다.
또한, 상기 양음성 판독부는 상기 복수 사이클의 신호값 모두에 대해 상기 입력부로부터 획득을 완료한 이후에 상기 시료 내 상기 표적 분석물질의 존부를 추정할 수 있다.
또한, 상기 양음성 판독부의 학습 과정에서는 학습용 입력 데이터와 학습용 정답 데이터를 포함하는 학습용 데이터가 이용되되, 상기 학습용 입력 데이터는, 상기 표적 분석물질의 존재에 의존적인 신호를 발생시키는 신호 발생 반응이 이루어져서 기 획득된 복수의 학습용 사이클 별 신호값 및 각 사이클의 순서에 대한 정보를 포함하고, 상기 학습용 정답 데이터는, 상기 표적 분석물질의 존부에 대한 정보를 포함할 수 있다.
또한, 상기 양음성 판독부의 학습 과정에서는 상기 학습용 입력 데이터 중 상기 복수의 학습용 사이클 신호값이 상기 사이클의 순서에 따라 상기 양음성 판독부에 순차적으로 입력될 수 있다.
또한, 상기 양음성 판독부의 학습 과정에서는, 상기 학습용 입력 데이터가 상기 양음성 판독부에 입력된 것에 대응해서 추정된 결과와 상기 학습용 정답 데이터를 비교하는 과정; 및 상기 비교를 통해 도출된 차이가 줄어들도록 상기 양음성 판독부를 학습시키는 과정이 포함되어서 수행될 수 있다.
또한, 상기 차이가 줄어들도록 상기 양음성 판독부를 학습시키는 과정에는, 역전파(backpropagation) 방식이 이용될 수 있다.
또한, 상기 양음성 판독부가 BERT(Bidirectional Encoder Representations from Transformers) 모델을 포함할 때, 상기 양음성 판독부는 상기 학습용 입력 데이터에 적어도 부분적으로 기초해서 학습되는 바디(body)부; 및 상기 학습이 완료된 바디부와 결합되어서, 상기 학습용 입력 데이터가 상기 학습이 완료된 바디부에 입력되면 양음성 여부를 추론하도록 학습되는 미세 조정(fine-tuning)부를 포함할 수 있다.
또한, 상기 바디부는 반지도 학습(semi-supervised learning) 방식에 따라 학습될 수 있다.
또한, 상기 반지도 학습 방식에서는 상기 학습용 입력 데이터 중 일부를 마스킹(masking)한 뒤 상기 마스킹된 일부를 맞추는 과정 및 상기 학습용 입력 데이터에 포함되는 순서를 갖는 신호값의 순서 내지 선후 관계를 맞추는 과정이 포함되어서 수행될 수 있다.
또한, 상기 미세 조정부는 지도 학습(supervised-learning) 방식에 따라 학습될 수 있다.
또한, 상기 양음성 판독부는 상기 복수 사이클에서의 신호값 및 상기 사이클 각각의 순서로부터 컨텍스트 벡터를 생성하는 인코더부; 및 상기 컨텍스트 벡터로부터 상기 시료 내 상기 표적 분석물질의 존부를 추정하는 이진 분류부를 포함할 수 있다.
또한, 상기 양음성 판독부가 순환 신경망 모델 또는 장단기 메모리 모델을 포함할 때의 학습 과정에서는 상기 복수의 사이클 중에서 어느 하나의 사이클의 신호값에 대한 가중치 및 상기 어느 하나의 사이클보다 시간적으로 선행하는 사이클에 대해 연산된 은닉 상태값에 대한 가중치가, 학습용 입력 데이터가 상기 양음성 판독부의 입력단에 입력된 것에 대응해서 상기 양음성 판독부의 출력단에서 출력된 결과와 학습용 정답 데이터 간의 차이가 줄어들도록 갱신됨으로써 학습될 수 있다.
또한, 상기 양음성 판독부가 순환 신경망 모델 또는 장단기 메모리 모델을 포함할 때의 상기 양음성 판독부의 입출력 구조는 복수 개의 데이터를 입력받으면 1개의 데이터를 출력하는 many-to-one 구조일 수 있다.
또한, 상기 양음성 판독부는 상기 신호 발생 반응의 신호 발생에 영향을 미치는 것으로 기 정의된 요소(factor)마다 상기 양음성 판독 장치에 마련될 수 있다.
또한, 상기 요소는 핵산 증폭 반응에 이용되는 반응 조건들을 포함할 수 있다.
또한, 상기 반응 조건은, 상기 핵산 증폭 반응에 이용되는 반응 미디엄일 수 있다.
또한, 상기 반응 미디엄은, pH 관련 물질, 이온 세기 관련 물질, 효소 및 효소 안정화 관련 물질로부터 구성된 군으로부터 선택되는 하나 이상의 물질일 수 있다.
또한, 상기 pH 관련 물질은 버퍼를 포함하고, 상기 이온 세기 관련 물질은 이온성 물질을 포함하고, 상기 효소 안정화 관련 물질은 당을 포함할 수 있다.
또한, 상기 양음성 판독 장치는 상기 복수 사이클 각각에서의 신호값을 대상으로 소정의 전처리 작업을 수행하는 전처리부를 더 포함하며, 상기 양음성 판독부는 상기 전처리부에 의해 상기 전처리 작업이 수행된 신호값으로부터, 상기 시료 내 상기 표적 분석물질의 존부를 추정할 수 있다.
또한, 상기 전처리 작업은, 상기 복수 사이클에서의 신호값 중 비정상 신호(abnormal signal)에 대한 보정 작업, 상기 복수 사이클에서의 신호값에 대한 스무딩(smoothing) 작업 또는 상기 복수 사이클에서의 신호값으로부터 regression된 베이스라인 signal value를 상기 복수 사이클에서의 신호값으로부터 차감하는 베이스라인 차감(baseline subtraciton) 작업을 포함할 수 있다.
일 실시예에 따른 양음성 판독 방법은 양음성 판독 장치에 의해 수행되며, 표적 분석물질을 타겟으로 하는 복수 사이클의 신호 발생 반응으로부터, 상기 복수 사이클에서의 신호값을 입력받는 단계; 상기 신호 발생 반응은 시료 내에 상기 표적 분석물질의 존재에 의존적인 신호를 발생시키고, 상기 복수 사이클에서의 신호값 및 상기 복수 사이클의 순서로부터, 상기 시료 내에 상기 표적 분석물질의 존부를 기 학습된 모델을 이용하여 추정하는 단계를 포함하여 수행된다.
일 실시예에 따른 컴퓨터 프로그램을 저장하는 컴퓨터 판독 가능한 기록 매체로서, 상기 컴퓨터 프로그램은 양음성 판독 장치에 의해 수행되는 표적 분석물질을 타겟으로 하는 양음성 판독 방법을 프로세서가 수행하도록 하기 위한 명령어를 포함하고, 상기 방법은 표적 분석물질을 타겟으로 하는 복수 사이클의 신호 발생 반응으로부터, 상기 복수 사이클에서의 신호값을 입력받는 단계; 상기 신호 발생 반응은 시료 내에 상기 표적 분석물질의 존재에 의존적인 신호를 발생시키고, 상기 복수 사이클에서의 신호값 및 상기 복수 사이클의 순서로부터, 상기 시료 내에 상기 표적 분석물질의 존부를 기 학습된 모델을 이용하여 추정하는 단계를 포함하여 수행된다.
일 실시예에 따르면, 시료의 표적 분석물질에 대한 양음성 여부가 딥러닝 방식에 의해 학습된 모델에 의해 판독될 수 있다. 따라서, 양음성 판독 결과의 신속성 및 정확도가 향상될 수 있다.
도 1은 일 실시예에 따른 양음성 판독 장치, 준비 장치 및 검출 장치를 포함하는 양음성 판독 시스템에 대한 블록도이다.
도 2는 일 실시예에 따른 양음성 판독 장치에 대한 개념도이다.
도 3은 일 실시예에 따른 양음성 판독 장치의 구성을 나타내는 블록도이다.
도 4는 순환 신경망 모델에 대한 개념을 나타낸 개념도이다.
도 5는 일 실시예에 따른 양음성 판독부가 순환 신경망으로 구현된 경우를 나타내는 개념도이다.
도 6는 일 실시예에 따른 양음성 판독 장치의 하드웨어적 블록 구성도이다.
도 7은 일 실시예에 따른 양음성 판독 방법의 순서도이다.
도 8은 일 실시예에 따른 적어도 하나 이상의 표적 분석물질이 샘플에 포함된 경우, 샘플의 복수 사이클 각각에서의 신호값을 온도마다 나타낸 그래프이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 발명의 실시예들을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명의 실시예에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1을 설명하기에 앞서, 본원에서 사용된 용어에 대해 살펴보기로 한다.
용어 "타겟 분석물(target analyte)"은 다양한 물질(예컨대, 생물학적 물질 및 비생물학적 물질)을 포함하는데, 이는 용어 "표적 분석물질"과 동일한 대상을 지칭할 수 있다.
이러한 타겟 분석물은 구체적으로 생물학적 물질, 보다 구체적으로 핵산분자(예컨대, DNA 및 RNA), 단백질, 펩타이드, 탄수화물, 지질, 아미노산, 생물학적 화합물, 호르몬, 항체, 항원, 대사물질 및 세포 중 적어도 하나를 포함할 수 있다.
용어 "시료"는 생물학적 시료(예컨대, 세포, 조직 및 체액) 및 비생물학적 시료(예컨대, 음식물, 물 및 토양)를 포함한다. 이 중, 상기 생물학적 시료는 예컨대, 바이러스, 세균, 조직, 세포, 혈액(전혈, 혈장 및 혈청 포함), 림프, 골수액, 타액, 객담(sputum), 스왑(swab), 흡인액(aspiration), 우유, 소변(urine), 분변(stool), 안구액, 정액, 뇌 추출물, 척수액, 관절액, 흉선액, 기관지 세척액, 복수 및 양막액 중 적어도 하나를 포함할 수 있다. 이러한 시료에는 전술한 타겟 분석물이 포함될 수도 있고 그렇지 않을 수도 있다.
한편, 전술한 타겟 분석물이 핵산분자이거나 핵산분자를 포함하는 경우, 상기 타겟 분석물을 포함할 것으로 추정되는 상기 시료에는 본 기술분야에서 공지된 핵산 추출(nucleic acid extraction) 과정이 수행될 수 있다(참조: Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001)). 상기 핵산 추출 과정은 시료의 종류에 따라 달라질 수 있다. 또한, 상기 추출된 핵산이 RNA인 경우 cDNA를 합성하기 위한 역전사(reverse transcription) 과정을 추가로 거칠 수 있다(참조: Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001).
용어 "데이터 세트"는 신호 발생 수단(신호 발생 수단에 대해서는 후술하기로 한다)을 이용하는 상기 타겟 분석물에 대한 신호 발생 반응으로부터 수득된 데이터를 지칭한다.
이 경우, 용어 "신호 발생 반응"은 시료 내 타겟 분석물의 특성(properties), 예컨대 활성, 양 또는 존재(또는 부존재), 구체적으로 존재(또는 부존재)에 의존적으로 신호를 발생시키는 반응을 의미한다. 이러한 신호 발생 반응은 생물학적 반응 및 화학적 반응을 포함한다. 이 중, 생물학적 반응은 PCR, 실시간 PCR 및 마이크로어레이 분석과 같은 유전적 분석 과정, 면역학적 분석 과정 및 박테리아 성장 분석을 포함한다. 아울러, 화학적 반응은 화학물질의 생성, 변화 또는 파괴를 분석하는 과정을 포함한다. 일 구현예에 따르면, 신호 발생 반응은 유전적 분석 과정일 수 있으며, 또는 핵산증폭반응, 효소 반응 또는 미생물 성장일 수 있다.
한편, 전술한 신호 발생 반응은 신호 변화를 동반한다. 따라서, 이러한 신호 발생 반응의 진행정도는 신호의 변화를 측정함으로써 평가될 수 있다.
여기서, 용어 "신호"는 측정 가능한 아웃풋을 의미한다. 아울러, 이러한 신호의 측정된 크기 또는 변화는 타겟 분석물의 특성, 구체적으로는 시료 내 타겟 분석물의 존재 또는 부존재를 정성적으로 또는 정량적으로 지시하는 지시자 역할을 한다.
여기서, 지시자의 예는 형광 세기(fluorescence intensity), 발광 세기, 화학발광 세기, 생발광 세기, 인광세기, 전하 이동, 전압, 전류, 전력, 에너지, 온도, 점성도, 광 스캐터, 방사능 세기, 반사도, 투광도 및 흡광도를 포함하며, 다만 이에 한정되는 것은 아니다.
전술한 바 있는 용어 "신호 발생 수단"은 분석하고자 하는 타겟 분석물의 특성, 구체적으로 존재 또는 부존재를 나타내는 신호를 제공하는 수단을 의미한다.
용어 "신호 발생 수단"은 "신호 발생 조성물"로 표현할 수 있다.
이러한 신호 발생 수단은 표지 자체 또는 표지가 연결된 올리고뉴클레오타이드를 포함한다.
이 중, 표지는 형광 표지, 발광 표지, 화학발광 표지, 전기화학적 표지 및 금속 표지를 포함한다. 상기 표지는 인터컬레이팅 염료(intercalating dye)와 같이 표지 자체로 사용될 수 있다. 또는 상기 표지는, 단일 표지 또는 공여 분자(donor molecule) 및 수용 분자(acceptor molecule)를 포함하는 상호작용적인 이중 표지의 형태로서, 하나 이상의 올리고뉴클레오타이드에 결합된 형태로 사용될 수 있다.
상기 신호 발생 수단은 신호를 발생시키기 위하여 핵산 절단 활성을 갖는 효소를 추가적으로 포함할 수 있다(예를 들어, 5' 핵산 절단 활성을 갖는 효소 또는 3' 핵산 절단 활성을 갖는 효소).
한편, 상기 신호 발생 수단을 이용하여 표적 분석물질, 특히 타겟 핵산분자의 존재를 나타내는 신호를 발생시키는 다양한 방법이 알려져 있다. 대표적인 예에는 다음이 포함될 수 있다: TaqManTM 프로브 방법(미국특허 제5,210,015호), 분자 비콘 방법 (Tyagi, Nature Biotechnology, v.14 MARCH 1996), 스콜피온(Scorpion) 방법(Whitcombe 등, Nature Biotechnology 17:804-807(1999)), 선라이즈(Sunrise 또는 Amplifluor) 방법(Nazarenko 등, Nucleic Acids Research, 25(12):2516-2521(1997), 및 미국특허 제6,117,635호), 럭스(Lux) 방법(미국특허 제7,537,886호), CPT(Duck P, 등. Biotechniques, 9:142-148(1990)), LNA 방법 (미국특허 제6,977,295호), 플렉서(Plexor) 방법(Sherrill CB, 등, Journal of the American Chemical Society, 126:4550-4556(2004)), Hybeacons (D.J. French, 등, Molecular and Cellular Probes 13:363-374(2001) 및 미국특허 제7,348,141호), 이중표지된 자가-퀀칭된 프로브(Dual-labeled, self-quenched probe; 미국특허 제5,876,930호), 혼성화 프로브(Bernard PS, et al., Clin Chem 2000, 46, 147-148), PTOCE(PTO cleavage and extension) 방법(WO 2012/096523), PCE-SH(PTO Cleavage and Extension-Dependent Signaling Oligonucleotide Hybridization) 방법(WO2013/115442), PCE-NH(PTO Cleavage and Extension-Dependent Non-Hybridization) 방법(PCT/KR2013/012312) 및 CER 방법(WO 2011/037306).
한편, 전술한 용어 "신호 발생 반응"은 신호의 증폭 반응을 포함할 수 있다. 이 때, 용어 "증폭 반응"은 상기 신호 발생 수단에 의하여 발생되는 신호를 증가 또는 감소시키는 반응을 의미한다. 구체적으로, 상기 증폭 반응은 타겟 분석물의 존재에 의존적으로 상기 신호 발생 수단에 의하여 발생하는 신호의 증가(또는 증폭) 반응을 의미한다.
이러한 증폭 반응에서는, 타겟 분석물(예컨대, 핵산분자)의 증폭이 동반되거나 또는 동반되지 않을 수 있다. 보다 구체적으로, 증폭 반응은 타겟 분석물의 증폭이 동반되는 신호의 증폭 반응을 의미할 수 있다.
한편, 상기 증폭 반응을 통하여 수득되는 데이터 세트에는 증폭 사이클이 포함될 수 있다.
여기서, 용어 "사이클"은 일정한 조건의 변화를 수반한 복수의 측정에 있어, 상기 조건의 변화 단위를 말한다. 상기 일정한 조건의 변화는 예를들어 온도, 반응시간, 반응횟수, 농도, pH, 측정 대상(예를 들어 핵산)의 복제 횟수 등의 증가 또는 감소를 의미한다. 따라서 사이클은 시간(time) 또는 과정(process) 사이클, 단위 운영(unit operation) 사이클 및 재생산(reproductive) 사이클 일 수 있다.
보다 구체적으로, 용어 "사이클"은 일정한 과정의 반응을 반복하거나 일정한 시간 간격 기준으로 반응을 반복하는 경우, 상기 반복의 하나의 단위를 의미한다.
일 예로 핵산 증폭 반응의 경우 하나의 사이클은 핵산의 변성단계(denaturation), 프라이머의 어닐링 단계 및 프라이머의 연장 단계(extension)를 포함하는 반응을 의미한다. 이 경우 일정한 조건의 변화는 반응의 반복 횟수의 증가이며, 상기 일련의 단계를 포함하는 반응의 반복 단위가 하나의 사이클로 설정된다.
한편, 표적 분석물질(또는 타겟 분석물)의 존재를 나타내는 신호를 증폭시키기 위한 증폭 반응은 표적 분석물질이 증폭되면서, 신호도 증폭되는 방법으로 실시될 수 있다(예를 들어, 실시간 PCR 방법). 또는 일 구현예에 따르면, 상기 증폭 반응은 타겟 분석물이 증폭되지 않고, 타겟 분석물의 존재를 나타내는 신호만이 증폭되는 방법으로 실시될 수도 있다(예를 들어, CPT method (Duck P, et al., Biotechniques, 9:142-148(1990)), Invader assay (미국특허 제6,358,691호 및 제6,194,149호)).
한편, 전술한 표적 분석물질이나 타겟 분석물, 특히 타겟 핵산분자는 다양한 방법으로 증폭될 수 있다: 중합효소연쇄반응(polymerase chain reaction (PCR)), 리가아제 연쇄반응(ligase chain reaction (LCR)) (미국특허 제4,683,195호 및 제4,683,202호; PCR Protocols: A Guide to Methods and Applications (Innis et al., eds, 1990)), 가닥 치환 증폭(strand displacement amplification (SDA)) (Walker, et al. Nucleic Acids Res. 20(7):1691-6 (1992); Walker PCR Methods Appl 3(1):1-6 (1993)), 전사 매개 증폭(transcription-mediated amplification) (Phyffer, et al., J. Clin. Microbiol. 34:834-841 (1996); Vuorinen, et al., J. Clin. Microbiol. 33:1856-1859 (1995)), 염기순서기반증폭(nucleic acid sequence-based amplification (NASBA)) (Compton, Nature 350(6313):91-2 (1991)), 롤링서클 증폭(rollingcircle amplification, RCA) (Lisby, Mol. Biotechnol. 12(1):75-99 (1999); Hatchet al., Genet. Anal. 15(2):35-40 (1999)) 및 Q-beta 레플리카제(Q-Beta Replicase) (Lizardi et al., BiolTechnology 6:1197(1988)).
한편, 증폭 반응은 타겟 분석물(구체적으로, 타겟 핵산분자)의 증폭이 수반되면서 신호를 증폭한다. 예컨대, 증폭 반응은 PCR, 구체적으로 실시간 PCR에 따라 실시거나 또는 등온 증폭 반응 (예를 들어, LAMP 나 RPA)으로 실시된다.
한편, 신호 발생 반응에 의해 얻은 데이터 세트는 신호 발생 반응의 사이클들 및 사이클들에서의 신호값들을 포함하는 복수의 데이터 지점을 포함한다.
여기서, 용어 "신호값"은 신호 발생 반응, 특히 증폭 반응의 사이클에서 실제적으로 측정된 신호의 수준(예컨대, 신호의 세기)을 일정한 스케일에 따라 수치화한 값 또는 이들의 변형값을 의미한다. 상기 변형값은 상기 실제적으로 측정된 신호값의 수학적으로 가공된 신호값을 포함할 수 있다. 실제적으로 측정된 신호값(즉, 원시 데이터 세트의 신호값)의 수학적으로 가공된 신호값의 예는 로그값 또는 도함수값(derivatives)을 포함할 수 있다.
용어 "데이터 지점(data point)"은 사이클 및 신호값을 포함하는 하나의 좌표값(a coordinate value)을 의미한다. 아울러, 용어 "데이터"는 데이터 세트를 구성하는 모든 정보를 의미한다. 예컨대, 증폭 반응의 사이클 및 신호값 각각은 데이터에 해당될 수 있다.
신호 발생 반응, 특히 증폭 반응에 의해 얻어진 데이터 지점들은 2차원 직교 좌표계에 나타낼 수 있는 좌표값으로 표시될 수 있다. 상기 좌표값에서 X-축은 해당 사이클 수를 나타내며, Y-축은 해당 사이클에서 측정 또는 가공된 신호값을 나타낸다.
용어 "데이터 세트"는 상기 데이터 지점들의 집합을 의미한다. 예를 들어, 데이터 세트는 신호 발생 수단의 존재 하에서 수행된 증폭 반응을 통하여 직접적으로 수득되는 데이터 지점의 집합일 수 있으며 또는 이러한 데이터 세트를 변형한 변형된 데이터 세트일 수 있다. 상기 데이터 세트는 증폭 반응에 의해 수득되는 복수의 데이터 지점들 또는 이의 변형된 데이터 지점들의 일부 또는 전체일 수 있다.
일 구현예에 따르면, 타겟 분석물에 대한 데이터 세트는 200 개 이하, 150 개 이하, 100 개 이하, 80 개 이하, 60 개 이하, 50 개 이하, 45 개 이하, 40 개 이하 및 30 개 이하의 데이터 지점을 포함한다.
일 구현예에 따르면, 타겟 분석물에 대한 데이터 세트는 2 개 이상, 5 개 이상, 10 개 이상, 15 개 이상 및 20 개 이상의 데이터 지점을 포함한다.
한편, 데이터 세트는 복수의 데이터 세트를 가공하여 수득한 데이터 세트일 수도 있다. 복수의 타겟 분석물에 대한 분석을 하나의 반응용기에서 수행하는 경우, 경우에 따라 상기 복수의 타겟 분석물에 대한 데이터 세트는 상기 하나의 반응용기에서 이루어진 반응으로부터 수득된 데이터 세트들의 가공을 통하여 수득될 수 있다. 예를 들어 하나의 반응용기에서 이루어진 복수의 타겟 분석물에 대한 데이터 세트는 서로 다른 온도에서 측정된 신호로부터 수득한 복수의 데이터 세트를 가공(processing)하여 수득될 수 있다.
전술한 데이터 세트는 플롯팅될 수 있으며 이에 의해 증폭곡선이 획득될 수 있다.
이하 도면을 참조하여, 본 발명의 다양한 구현예에 대해 살펴보기로 한다.
도 1은 일 실시예에 따른 양음성 판독 장치(1000), 준비 장치(2000) 및 검출 장치(3000)를 포함하는 양음성 판독 시스템(100)에 대한 블록도이다.
도 1을 참조하면, 양음성 판독 시스템(100)은 양음성 판독 장치(1000)와 준비 장치(2000) 및 검출 장치(3000)를 포함한다. 또한, 이들 구성은 서로 간에 유선 또는 무선 통신에 의해 연결될 수 있다.
다만, 도 1에 도시된 블록도는 예시적인 것에 불과하며, 본 발명의 사상이 도 1에 도시된 것으로 한정 해석되는 것은 아니다. 예컨대, 양음성 판독 시스템(100)은 도 1에 도시되지 않은 구성을 추가로 포함하거나 도 1에 도시된 구성 중 적어도 하나를 포함하지 않을 수 있다.
양음성 판독 시스템(100)은 양음성 판독 장치만을 나타낼 수 있다.
또한, 양음성 판독 시스템(100)의 각 구성은 도 1에 도시된 것과 상이하게 연결될 수도 있다. 이하, 각 구성에 대해 자세하게 살펴본다.
먼저, 준비 장치(2000)는 시료(또는 샘플 또는 분석 샘플)에 대해 준비 작업을 수행하도록 구현된다.
이 때, 준비 장치(2000)가 수행하는 전술한 준비 작업에는 핵산 추출 작업과 핵산증폭용 반응액(reaction mixture) 준비 작업이 포함된다. 다만, 실시예에 따라, 준비 장치(2000)는 핵산 추출 작업을 수행하지 않을 수도 있는데, 이 경우 핵산 추출 작업은 도 1에 도시되지 않은 타 구성에 의해 수행될 수 있다.
검출 장치(3000)는 시료 내지 샘플을 대상으로, 핵산증폭 반응과 핵산 검출 작업을 수행하도록 구현된다. 실시예에 따라, 검출 장치(3000)는 핵산증폭 반응을 수행하지 않고 핵산 검출 작업을 수행하도록 구현될 수도 있지만, 이하에서는 검출 장치(3000)가 핵산증폭 반응도 수행하도록 구현되는 것을 전제로 설명하기로 한다.
검출 장치(3000)는 광학(optical) 모듈 및 써멀(thermal) 모듈을 포함할 수 있다.
광학 모듈은 광원 모듈과 검출 모듈을 포함한다. 광원 모듈은 샘플에 적절한 광학 자극을 공급하며, 검출 모듈은 이에 반응하여 샘플로부터 발생하는 광학 신호를 감지한다. 광학 신호는 발광(luminescence), 인광(phosphorescence), 화학발광(chemiluminescence), 형광(fluorescence), 편광형광(polarized fluorescence) 또는 다른 유색 신호(colored signal)일 수 있다. 광학 신호는 샘플에 광학 자극을 주고, 이에 반응하여 발생하는 광학 신호 일 수 있다. 광원 모듈은 샘플에 광을 조사하도록 형성된 광원 및 상기 광원으로부터 조사되는 광을 필터하는 필터를 포함한다. 광원은 서로 동일한 파장 특성을 가지는 광을 방출하는 광원일 수 있다. 예를 들어, 광원이 서로 동일한 파장 영역의 광을 방출하면, 또한 파장 영역별로 방출되는 광량이 서로 동일한 것을 의미한다. 동일하다는 것은 완전히 동일한 것 뿐만 아니라, 실질적으로 동일한 것을 모두 포함하는 의미이다. 실질적으로 동일한 것은 예를 들어 두 광원에서 발생한 광을 동일한 필터를 통하여 동일 광학 표지에 조사하는 경우 광학 표지로부터 동일한 종류의 방출광이 동일한 수준의 광량으로 발생하는 것을 의미한다. 구체적으로 복수의 광원이 실질적으로 동일한 파장 특성을 가지는 것은 복수의 광원의 광량 또는 파장 영역의 편차가 20%, 15% 또는 10% 이내인 것을 의미한다.
검출 모듈은 신호를 검출한다. 검출 모듈은 샘플들로부터 발생하는 광학 신호인 형광을 검출한다.
검출 모듈은 광학신호의 세기에 따라 전기 신호를 발생시켜 광학 신호를 검출한다.
상기 검출 모듈은 샘플에서 방출되는 방출광을 감지하도록 형성된 검출기 및 샘플에서 방출되는 방출광을 필터하는 필터를 포함한다.
검출기는 샘플에 포함된 광학표지에서 방출되는 방출광을 감지할 수 있도록 형성된다. 상기 검출기는 광의 파장을 구분하여 파장별 광량을 감지하거나, 파장에 상관없이 총 광량을 감지하는 것일 수 있다. 구체적으로 상기 검출기는 예를 들어 포토 다이오드, 포토 다이오드 어레이, 광전자 증배관(photo multiplier tube; PMT), CCD 이미지 센서, CMOS 이미지 센서, APD(avalanche photodiode) 등을 사용할 수 있다.
검출기는 상기 샘플에 포함된 광학표지에서 방출되는 방출광을 감지할 수 있도록 형성된다.
구체적으로 상기 검출기는 상기 샘플에서 발생하는 방출광이 직접 상기 검출기에 도달할 수 있도록 상기 샘플을 향하여 형성될 수 있으며, 또는 반사체 또는 광섬유를 통하여 방출광이 검출기에 도달할 수 있도록 반사체 또는 광섬유를 향하여 형성될 수 있다.
검출모듈의 필터는 상기 샘플에 포함된 광학표지에서 방출되는 방출광을 선택적으로 통과시키기 위한 필터이다. 샘플에 포함된 광학표지에서 방출되는 방출광 외 다른 파장영역의 광이 검출기에 감지되는 경우 광학신호를 정확히 검출할 수 없다. 본 개시의 검출필터는 광학표지에서 방출되는 방출광을 선택적으로 통과시켜 타겟을 정확히 검출할 수 있게 한다.
써멀 모듈은 핵산 증폭 반응을 수행하도록 구현된다. 이를 위해 써멀 모듈은 샘플이 수용된 샘플 홀더를 포함한다. 샘플 홀더는 복수의 홀들을 포함하고, 홀들에 반응 용기들이 위치할 수 있다. 반응 용기들은 샘플들을 포함할 수 있고, 샘플들로부터 형광이 방출된다. 샘플 홀더는 전도성 물질일 수 있다. 샘플 홀더가 반응 용기들과 접촉하면, 샘플 홀더로부터 반응 용기에 열이 전달될 수 있다. 예를 들어, 샘플 홀더는 알루미늄, 금, 은, 니켈 또는 구리 등 금속으로 제작될 수 있다. 또는 샘플 홀더가 아닌 별도의 구성이 반응 용기에 직접 에너지를 공급하여 반응 용기 내 샘플들의 온도를 조절할 수 있다. 이러한 경우 상기 샘플 홀더는 반응 용기들을 수용하지만, 반응 용기에 열을 전달하지 않도록 구성될 수 있다.
샘플 홀더의 일 예는 열 블록이다. 열 블록은 복수의 홀들을 포함하고, 홀들에 반응 용기들이 위치할 수 있다.
샘플 홀더의 다른 일 예는 가열 플레이트이다. 가열 플레이트는 샘플을 수용하는 플레이트에 얇은 금속을 접촉시킨 형태이다. 얇은 금속에 전류를 흘려 플레이트를 가열하는 방식으로 작동될 수 있다.
샘플 홀더의 또 다른 일 예는 하나 이상의 칩(chip) 또는 카트리지(cartridge)를 수용할 수 있는 수용부이다. 카트리지의 예는 유체 채널(flow channel)을 포함하는 유체 카트리지이다.
써멀 모듈은 일련의 온도를 통해 샘플 홀더의 샘플을 순환시키기 위한 열 발생 소자, 방열판 및 방열팬을 추가적으로 포함할 수 있다.
구체적으로, 써멀 모듈은 PCR 기반의 핵산 증폭 반응에 이용된다. 보다 구체적으로, 써멀 모듈은 특정 뉴클레오타이드 서열을 갖는 DNA(deoxyribonucleic acid)를 증폭하기 위해 변성 단계(denaturing step), 어닐링 단계(annealing step), 연장(혹은 증폭) 단계(extension step)를 실시할 수 있다.
이 중, 변성 단계는 주형 핵산인 이중 가닥의 DNA를 포함하는 시료 및 시약을 포함하는 용액을 특정 온도, 예를 들어 약 95℃로 가열하여 이중 가닥의 DNA를 단일 가닥의 DNA로 분리하는 단계이다. 어닐링 단계는 증폭하고자 하는 핵산의 뉴클레오타이드 서열과 상보적인 뉴클레오타이드 서열을 갖는 올리고뉴클레오타이드(oligonucleotide) 프라이머를 제공하고, 분리된 단일 가닥의 DNA와 함께 특정 온도인 멜팅 온도(Tm), 예를 들어 60℃로 냉각하여 단일 가닥의 DNA의 특정 뉴클레오타이드 서열에 프라이머를 결합시켜 부분적인 DNA-프라이머 복합체를 형성하는 단계이다. 연장 단계는, 어닐링 단계 이후 상기 용액을 특정 온도, 예를 들어 72℃로 유지하여 DNA 중합효소(polymerase)에 의해 부분적인 DNA-프라이머 복합체의 프라이머를 기초로 이중 가닥의 DNA를 형성하는 단계이다.
일 실시예에서, 써멀 모듈은 전술한 3가지의 단계들을 예를 들어 10회 내지 50회로 반복함으로써 상기 특정 뉴클레오타이드 서열을 갖는 DNA를 기하급수적으로 증폭시킬 수 있다.
다른 실시예에서, 써머 모듈은 어닐링 단계와 연장 단계를 동시에 수행할 수 있다. 이 경우 써머 모듈은 변성 단계와 어닐링/연장 단계로 구성된 2 단계들을 수행함으로써, 하나의 사이클(순환)을 완성할 수도 있다.
이러한 검출 장치는 증폭 반응을 위해 온도를 조절할 수 있는 한 종래 공지된 다양한 기기를 포함한다. 그 예로는 CFX(Bio-Rad), iCycler(Bio-Rad), LightCycler(Roche), StepOne(ABI), 7500 (ABI), ViiA7(ABI), QuantStudio(ABI), AriaMx(Agilent), Eco(Illumina) 등을 들 수 있으나, 이에 제한되지 않는다.한편, 전술한 핵산증폭 반응이 수행됨에 따라, 반응 용기 내에 표적 분석물질이 포함되어 있다면 그 양이 증폭됨은 물론, 전술한 신호 발생 수단에 의해 발생되는 신호의 크기 또한 전술한 바와 같이 증폭될 수 있다. 이에, 검출 장치(3000)는 이러한 신호의 크기를 검출하도록 구현된다. 구체적으로, 검출 장치(3000)는 핵산증폭 반응의 진행에 따라 변화되는 전술한 신호의 크기를 실시간으로 모니터링할 수 있다. 모니터링된 결과는 용어의 정의 부분에서 언급된 바 있는 데이터 세트의 형태로서 검출 장치(3000)로부터 출력될 수 있다.
한편, 상기 핵산증폭 반응이 수행되면, 신호 발생 수단에 의해 발생되는 신호의 크기 또한 증폭될 수 있다는 점에서, 핵산증폭 반응은 앞서 용어로서 살펴본 바 있는 신호 발생 반응을 야기하는 것으로 이하에서는 간주하기로 하자.
양음성 판독 장치(1000)는 검출 장치(3000)로부터 시료의 표적 분석물질에 대한 검출 결과를 입력받을 수 있다. 예컨대, 양음성 판독 장치(1000)는 앞서 설명된 바 있는 데이터 세트를 검출 장치(3000)로부터 입력받을 수 있다. 그러면, 양음성 판독 장치(1000)는 해당 시료의 표적 분석물질에 대한 양음성 여부를 판독해서 출력할 수 있다. 이는 도 2에 개념적으로 도시되어 있다. 도 2를 참조하면, 양음성 판독 장치(1000)가 입력으로서 시료의 표적 분석물질에 대한 검출 결과로서 데이터 세트를 입력받으면, 이에 대응해서 양음성 판독 장치(1000)는 해당 시료의 해당 표적 분석물질에 대한 양음성 여부를 판독하여 출력한다.
이하에서는, 양음성 판독 장치(1000)의 각 기능적 구성에 대하여, 도 3을 참조하여 보다 구체적으로 살펴본다.
도 3은 일 실시예에 따른 양음성 판독 장치(1000)에 대한 블록도이다.
도 3을 참조하면, 양음성 판독 장치(1000)는 입력부(1100), 전처리부(1200) 및 양음성 판독부(1300)를 포함하며, 다만 이에 한정되는 것은 아니다. 예컨대, 양음성 판독 장치(1000)는 실시예에 따라 도 3에 도시된 적어도 하나의 구성(예컨대 전처리부(1200))을 포함하지 않도록 구현될 수 있으며, 또는 도 3에 도시되지 않은 구성을 추가로 포함하도록 구현될 수도 있다.
먼저, 입력부(1100)는 데이터를 입력받는 구성으로서, 이를 위해 입력부(1100)는 입출력 포트 내지 단자로 구현 가능하다.
이러한 입력부(1100)를 통해 양음성 판독 장치(1000)는 검출 장치(3000)로부터 전술한 데이터 세트를 입력 받을 수 있다.
이 때, 이러한 데이터 세트에는 용어의 정의 부분에 기재된 바와 같이, 증폭 과정에서 검출된 각 사이클에서의 신호값 뿐 아니라, 그 신호값의 사이클에 대한 순서가 포함되어 있을 수 있으며, 다만 이에 한정되는 것은 아니다.
예를 들어, 데이터 세트는 반응 회수와 신호값으로 짝지어진 데이터 지점들을 포함하고, 상기 데이터 지점들은 작은 반응 회수에서 큰 반복회수 또는 큰 반복회수에서 작은 반복회수에 따라 배열될 수 있다.
예를 들어, 데이터 세트는 반응 시간과 신호값으로 짝지어진 데이터 지점들을 포함하고, 상기 데이터 지점들은 짧은 시간에서 긴 시간 또는 긴 시간에서 짧은 시간에 따라 배열될 수 있다.
여기서, 신호값의 단위는, 예컨대 형광신호의 세기를 나타내는 RFU(Relative Fluorescence Units)일 수 있다. 아울러, 사이클의 순서가 갖는 범위는 1 내지 45일 수 있으며, 다만 이에 한정되는 것은 아니다.
전처리부(1200)는 양음성 판독 장치(1000)가 입력부(1100)을 통해 검출 장치(1300)로부터 입력받은 데이터 세트를 대상으로 소정의 전처리 작업을 수행할 수 있다. 이러한 전처리 작업에서는, 표적 분석물질의 시료 내의 존재 또는 부존재 여부와 무관하게 발생 가능한, 원하지 않는(unwanted), 비분석적(non-analyte related) 신호가 제거 내지 보정될 수 있다. 예컨대, 전술한 전처리 작업을 통해서, 전술한 신호 발생 반응의 실행 여부와 무관하게 검출 장치(3000)에서 발생 가능한 전기적-노이즈, 핵산증폭 곡선 중 베이스라인 영역의 노이즈 또는 형광신호의 급격한 증가(즉, 점프(jump), 스파이크(spike) 또는 스텝(step) 신호)나 급격한 감소(즉, 딥(dip) 신호) 등이 제거 내지 보정될 수 있다.
이러한 전처리 작업의 구체적인 방법으로는, 음성 대조군의 차감(negative control subtraction) 또는 베이스라인 차감(baseline subtraction) 등이 있다.
이 중, 음성 대조군의 차감에 대해 먼저 살펴보자. 음성 대조군은 신호 발생 반응을 위한 반응물에서 반응의 진행을 위한 필수성분이 1개 이상 없는 실험군이다. 예를 들어, 핵산증폭 반응에서 음성 대조군은 타겟 분석물이 없는 실험군, 프라이머가 없는 실험군 또는 중합효소가 없는 실험군 또는 완충액만 있는 실험군이다. 구체적으로, 일 실시예에서 이용되는 음성 대조군은, 핵산증폭 반응물에서 타겟 분석물을 제외한 핵산증폭을 위한 성분들이 있는 실험군이다.
음성 대조군의 차감은 타겟 분석물에 대한 데이터 세트의 신호값으로부터 음성 대조군의 신호값을 차감하여 실시할 수 있다. 구체적으로, 타겟 분석물에 대한 데이터 세트의 신호값과 음성 대조군의 신호값은 동일한 반응 및 측정 환경에서 수득한 것이고, 예를 들어, 하나의 동일 증폭 및 분석 장치에서 동일한반응 런(run)에서 수득한 신호값이다.
다음으로, 베이스라인 차감은 당업계에 공지된 다양한 방법(예컨대, 미국특허(제8,560,247호)에 의해 실시할 수 있다.
기타, 전술한 음성 대조군의 차감이나 베이스라인 차감 이외에도, 다양한 방식의 전처리 작업이 존재하며, 일 실시예에 이러한 다양한 방식의 전처리 작업이 각각 전처리부(1200)에서 수행될 수 있다. 예컨대, 전처리 작업으로서, 미국 특허 제8,560,247호 또는 미국 출원공개 제2015/0186598호에 개시된 방법 등이 적용될 수 있다.
뿐만 아니라, 이러한 전처리 작업에는, 하나의 분석 샘플 용기(반응 튜브)로부터 검출된 신호가, 단일 유형의 표지를 이용하여 복수의 표적 분석물질을 검출하기 위한 신호를 포함할 가능성이 있는 경우, 이러한 신호로부터 각각의 표적 분석물질에 대한 신호를 분리 내지 구분하기 위한 작업이 포함될 수도 있는데, 이에 대해서는 후술하기로 한다.
또 한편으로는, 전술한 전처리 작업에는 양음성 판독부(1300)에 대한 학습 결과가 원하는 레벨레 도달할 수 있도록 하기 위한 작업이 포함될 수 있다. 구체적으로 살펴보면, 양음성 판독부(1300)는 신경망이라는 점에서, 학습에 이용되는 학습용 데이터의 퀄리티가 이러한 양음성 판독부(1300)의 성능에 영향을 미칠 수 있다. 이에 학습용 데이터를 대상으로 하는 표준화나 정규화와 같은 전처리 과정, 이상치 탐지 후 이를 보정하거나 제거하는 것과 같은 전처리 과정, 동일 또는 유사한 특성을 갖는 학습용 데이터끼리 클러스터링을 한 이후에 이를 고려해서 학습이 수행되도록 하는 전처리 과정 또는 학습용 데이터가 갖는 단위 등을 통일화하는 전처리 과정 등이 전술한 전처리 작업으로서 수행될 수 있다. 다만, 이러한 전처리 과정 등은 이미 공지된 것이므로, 이에 관한 상세한 설명은 생략하기로 한다.
양음성 판독부(1300)는 시료 내에 표적 분석물질의 존부 여부를 판독하도록 구현된다. 이를 위해 양음성 판독부(1300)는 전술한 데이터 세트를 입력부(1100) 또는 전처리부(1200)로부터 전달받을 수 있다.
이러한 양음성 판독부(1300)는 다양한 방식으로 구현 가능하다.
예컨대 양음성 판독부(1300)는 신경망에 의해 구현 가능하다. 이 경우, 양음성 판독부(1300)에 입력되는 정보, 즉 데이터 세트는 신경망에 입력단에 입력되게 되고, 양음성 판독부(1300)에서 출력되는 정보는 신경망에서 추론된 결과이다. 이 중, 양음성 판독부(1300)에서 출력되는 정보는 해당 시료 내의 해당 표적 분석물질의 존부에 대해 추론된 결과를 포함한다. 이렇게 출력된 데이터가 만약 '양성'이면, 해당 시료에 해당 표적 분석물질이 포함되어 있음을 의미한다. 반면, 출력된 데이터가 '음성'이면 해당 시료에 해당 표적 분석물질이 포함되어 있지 않음을 의미한다.
여기서, 용어 "신경망(neural network)"은 분류기, 연산 모델, 신경망 모델, 또는 네트워크 함수 등과 상호 교환가능하게 사용될 수 있다. 아울러, 신경망을 비롯한 전술한 용어들은 기계학습 모델의 범주 내에 포함될 수 있다.
상기 신경망에 대해 보다 자세하게 살펴보도록 하자. 신경망은 일반적으로 노드라 지칭될 수 있는 상호 연결된 계산 단위들의 집합으로 구성될 수 있다. 이러한 노드들은 뉴런(neuron)들로 지칭될 수도 있다. 신경망은 이러한 노드를 하나 이상 포함하여 구성된다. 아울러, 신경망들을 구성하는 이러한 노드(또는 뉴런)들은 하나 이상의 링크에 의해 상호 연결될 수 있다.
신경망 내에서, 링크를 통해 연결된 하나 이상의 노드들은 상대적으로 입력 노드 및 출력 노드의 관계를 형성할 수 있다. 입력 노드 및 출력 노드의 개념은 상대적인 것으로서, 하나의 노드에 대하여 출력 노드 관계에 있는 임의의 노드는 다른 노드와의 관계에서 입력 노드 관계에 있을 수 있으며, 그 역도 성립할 수 있다. 상술한 바와 같이, 입력 노드 대 출력 노드 관계는 링크를 중심으로 생성될 수 있다. 하나의 입력 노드에 하나 이상의 출력 노드가 링크를 통해 연결될 수 있으며, 그 역도 성립할 수 있다.
하나의 링크를 통해 연결된 입력 노드 및 출력 노드 관계에서, 출력 노드의 데이터는 입력 노드에 입력된 데이터에 기초하여 그 값이 결정될 수 있다. 여기서 입력 노드와 출력 노드를 상호 연결하는 링크는 가중치(weight)를 가질 수 있다. 가중치는 가변적일 수 있으며, 신경망이 원하는 기능을 수행하기 위해, 사용자 또는 알고리즘에 의해 가변 될 수 있다. 예를 들어, 하나의 출력 노드에 하나 이상의 입력 노드가 각각의 링크에 의해 상호 연결된 경우, 출력 노드는 상기 출력 노드와 연결된 입력 노드들에 입력된 값들 및 각각의 입력 노드들에 대응하는 링크에 설정된 가중치에 기초하여 출력 노드 값을 결정할 수 있다.
상술한 바와 같이, 신경망은 하나 이상의 노드들이 하나 이상의 링크를 통해 상호 연결되어 신경망 내에서 입력 노드 및 출력 노드 관계를 형성한다. 신경망 내에서 노드들과 링크들의 개수 및 노드들과 링크들 사이의 연관관계, 링크들 각각에 부여된 가중치의 값에 따라, 신경망의 특성이 결정될 수 있다. 예를 들어, 동일한 개수의 노드 및 링크들이 존재하고, 링크들의 가중치 값이 상이한 두 신경망이 존재하는 경우, 두 개의 신경망들은 서로 상이한 것으로 인식될 수 있다.
신경망은 하나 이상의 노드들의 집합으로 구성될 수 있다. 신경망을 구성하는 노드들의 부분 집합은 레이어(layer)를 구성할 수 있다. 신경망을 구성하는 노드들 중 일부는, 최초 입력 노드로부터의 거리들에 기초하여, 하나의 레이어(layer)를 구성할 수 있다. 예를 들어, 최초 입력 노드로부터 거리가 n인 노드들의 집합은, n 레이어를 구성할 수 있다. 최초 입력 노드로부터 거리는, 최초 입력 노드로부터 해당 노드까지 도달하기 위해 거쳐야 하는 링크들의 최소 개수에 의해 정의될 수 있다. 그러나, 이러한 레이어의 정의는 설명을 위한 임의적인 것으로서, 신경망 내에서 레이어의 차수는 상술한 것과 상이한 방법으로 정의될 수 있다. 예를 들어, 노드들의 레이어는 최종 출력 노드로부터 거리에 의해 정의될 수도 있다.
최초 입력 노드는 신경망 내의 노드들 중 다른 노드들과의 관계에서 링크를 거치지 않고 데이터가 직접 입력되는 하나 이상의 노드들을 의미할 수 있다. 또는, 신경망 네트워크 내에서, 링크를 기준으로 한 노드 간의 관계에 있어서, 링크로 연결된 다른 입력 노드들을 가지지 않는 노드들을 의미할 수 있다. 이와 유사하게, 최종 출력 노드는 신경망 내의 노드들 중 다른 노드들과의 관계에서, 출력 노드를 가지지 않는 하나 이상의 노드들을 의미할 수 있다. 또한, 히든 노드는 최초 입력 노드 및 최후 출력 노드가 아닌 신경망을 구성하는 노드들을 의미할 수 있다.
한편, 일 실시예에 따른 신경망의 경우, 입력 레이어의 노드의 개수가 출력 레이어의 노드의 개수보다 많을 수 있으며, 예컨대 입력 레이어의 노드의 개수는 45개인 반면 출력 레이어의 노드의 개수는 2개일 수 있으며, 이 때의 입력 레이어 노드는 전술한 데이터 세트에 포함되는 각각의 데이터 지점일 수 있고, 이 때의 출력 레이어의 노드 2 개중 어느 하나는 '양성'에 대한 것이고, 다른 하나는 '음성'에 대한 것일 수 있다.출력 레이어의 노드의 개수가 이와 같이 2개일 때, 어느 한 개는 시료 내의 표적 분석물질의 포함을 나타내는 '양성'에 대응한 것일 수 있고,나머지 하나는 '음성'에 대응한 것일 수 있다.
다른 실시예에 따른 신경망의 경우, 입력 레이어의 노드의 개수가 출력 레이어의 노드의 개수 보다 적거나 또는 동일할 수도 있다.
한편, 전술한 신경망 중 '심층 신경망'(DNN: deep neural network)는 입력 레이어와 출력 레이어 외에 복수의 히든 레이어를 포함하는 신경망을 의미할 수 있다. 심층 신경망을 이용하면 데이터의 잠재적인 구조(latent structures)를 파악할 수 있다. 즉, 사진, 글, 비디오, 음성, 음악의 잠재적인 구조(예를 들어, 어떤 물체가 사진에 있는지, 글의 내용과 감정이 무엇인지, 음성의 내용과 감정이 무엇인지 등)를 파악할 수 있다. 심층 신경망은 합성곱 신경망(CNN: convolutional neural network), 순환 신경망(RNN: recurrent neural network), 장단기 메모리(Long Short-Term Memory), 오토 인코더(auto encoder), GAN(Generative Adversarial Networks), 제한 볼츠만 머신(RBM: restricted boltzmann machine), 심층 신뢰 네트워크(DBN: deep belief network), Q 네트워크, U 네트워크, 샴 네트워크, 적대적 생성 네트워크(GAN: Generative Adversarial Network), BERT(Bidirectional Encoder Representations from Transformers) 모델 등을 포함할 수 있다. 다만, 전술한 심층 신경망의 기재는 예시일 뿐이며 본 개시는 이에 제한되지 않는다.
한편, 일 실시예에 따른 신경망은 지도 학습(supervised learning), 비지도 학습(unsupervised learning), 반지도학습(semi supervised learning) 및 강화학습(reinforcement learning) 중 적어도 하나의 방식으로 학습될 수 있다.
이러한 신경망의 학습은 신경망이 특정한 동작을 수행하기 위한 지식을 신경망에 적용하는 과정일 수 있다. 이후 설명되는 신경망의 학습 및 학습 데이터에 대한 내용은 본 개시의 양음성 판독부(1300)의 학습 내지 학습용 데이터에 대한 내용일 수도 있다.
신경망은 출력의 오류를 최소화하는 방향으로 학습될 수 있다. 신경망의 학습에서 반복적으로 학습 데이터를 신경망에 입력시키고 학습 데이터에 대한 신경망의 출력과 타겟의 에러를 계산하고, 에러를 줄이기 위한 방향으로 신경망의 에러를 신경망의 출력 레이어에서부터 입력 레이어 방향으로 역전파(backpropagation)하여 신경망의 각 노드의 가중치를 업데이트 하는 과정이다. 지도 학습의 경우 각각의 학습 데이터에 정답이 라벨링 되어 있는 학습 데이터를 사용하며(즉, 라벨링된 학습 데이터), 비지도 학습의 경우는 각각의 학습 데이터에 정답이 라벨링 되어 있지 않을 수 있다. 즉, 예를 들어 데이터 분류에 관한 지도 학습의 경우의 학습 데이터는 학습 데이터 각각에 카테고리가 라벨링 된 데이터 일 수 있다. 라벨링된 학습 데이터가 신경망에 입력되고, 신경망의 출력(카테고리)과 학습 데이터의 라벨을 비교함으로써 오류(error)가 계산될 수 있다. 다른 예로, 데이터 분류에 관한 비지도 학습의 경우 입력인 학습 데이터가 신경망 출력과 비교됨으로써 오류가 계산될 수 있다. 계산된 오류는 신경망에서 역방향(즉, 출력 레이어에서 입력 레이어 방향)으로 역전파 되며, 역전파에 따라 신경망의 각 레이어의 각 노드들의 연결 가중치가 업데이트 될 수 있다. 업데이트 되는 각 노드의 연결 가중치는 학습률(learning rate)에 따라 변화량이 결정될 수 있다. 입력 데이터에 대한 신경망의 계산과 에러의 역전파는 학습 사이클(epoch)을 구성할 수 있다. 학습률은 신경망의 학습 사이클의 반복 횟수에 따라 상이하게 적용될 수 있다. 예를 들어, 신경망의 학습 초기에는 높은 학습률을 사용하여 신경망이 빠르게 일정 수준의 성능을 확보하도록 하여 효율성을 높이고, 학습 후기에는 낮은 학습률을 사용하여 정확도를 높일 수 있다.
신경망의 학습에서 일반적으로 학습 데이터는 실제 데이터(즉, 학습된 신경망을 이용하여 처리하고자 하는 데이터)의 부분집합일 수 있으며, 따라서, 학습 데이터에 대한 오류는 감소하나 실제 데이터에 대해서는 오류가 증가하는 학습 사이클이 존재할 수 있다. 과적합(overfitting)은 이와 같이 학습 데이터에 과하게 학습하여 실제 데이터에 대한 오류가 증가하는 현상이다. 예를 들어, 노란색 고양이를 보여 고양이를 학습한 신경망이 노란색 이외의 고양이를 보고는 고양이임을 인식하지 못하는 현상이 과적합의 일종일 수 있다. 과적합은 머신러닝 알고리즘의 오류를 증가시키는 원인으로 작용할 수 있다. 이러한 과적합을 막기 위하여 다양한 최적화 방법이 사용될 수 있다. 과적합을 막기 위해서는 학습 데이터를 증가시키거나, 레귤라이제이션(regularization), 학습의 과정에서 네트워크의 노드 일부를 비활성화하는 드롭아웃(dropout), 배치 정규화 레이어(batch normalization layer)의 활용 등의 방법이 적용될 수 있다.
이하, 양음성 판독부(1300)가 신경망, 그 중에서도 심층 신경망으로 구현되는 경우, 보다 구체적으로는 순환 신경망(recurrent neural network, RNN)으로 구현된 경우에 대해 도4와 5를 참조하면서, 보다 자세하게 살펴보기로 하자.
순환 신경망은 시계열적인 데이터를 처리할 수 있는 신경망 중 하나이다. 따라서, 일 실시예에 따른 양음성 판독부(1300)가 순환 신경망으로서 구현될 경우, 이러한 양음성 판독부(1300)에 입력되는 데이터 세트, 즉 표적 분석물질을 타겟으로 하는 복수 사이클의 신호 발생 반응에서 비롯된, 상기 복수 사이클 각각에서의 신호값 및 상기 복수 사이클 각각의 순서에 대한 정보는, 양음성 판독부(1300)에 의해 신호값의 크기 뿐만 아니라 그 순서에 대한 정보까지도 고려될 수 있다. 예컨대, 1 사이클부터 45 사이클 각각에 대한 신호값이 존재할 때, 양음성 판독부(1300)는 신호값의 크기가 몇 번째 사이클에서 커지는지, 몇 번째 사이클에서 작아지는지, 변화하지 않는 사이클이 어디에서부터 어디까지인지, 기울기가 일정한 사이클이 어디에서부터 어디까지인지 등을 양음성 판독 시 고려할 수 있다.
이하, 이러한 순환 신경망 그 자체에 대해 살펴보기로 하자.
먼저, 순환 신경망의 학습 방법에 대해 살펴보면, 순환 신경망은 지도 학습(supervised-learning) 방식에 따라 학습 장치(도면에는 미도시)에 의해 학습될 수 있다. 여기서 학습 장치란 GPU와 같은 프로세서를 포함하며, 다만 이에 한정되는 것은 아니다.
이러한 순환 신경망은, 특히 본 실시예에서는 복수의 데이터를 입력받으면 1개의 데이터를 출력한다. 이 중 입력은 복수의 사이클에서의 신호값이 되고, 출력은 양음성 여부가 된다. 이는 도 5에 도시되어 있다.
다음으로, 순환 신경망의 학습을 위한 데이터를 살펴보자. 순환 신경망의 학습에는, 학습용 입력 데이터와 학습용 정답 데이터로 구분되는 학습용 데이터가 이용된다. 이러한 학습용 데이터는, 복수의 시료 각각에 대한 신호 발생 반응으로부터 수득된 것이다. 구체적으로, 학습용 입력 데이터는 특정 시료 내의 특정 표적 분석물질에 대한 검출 과정에서 수득된 데이터 세트를 포함할 수 있다. 아울러, 학습용 정답 데이터는 해당 시료 내에 해당 표적 분석물질이 포함되어 있는지, 즉 양음성 여부를 포함할 수 있다. 살펴보건데, 현재 업계에서는, 다양한 시료 각각에 대해 다양한 표적 분석물질이 포함되어 있는지를 검출하는 과정에서 수많은 데이터 세트들이 생성되고 저장되어 있다. 아울러, 그 검출 결과 또한 생성 내지 저장되고 있다.
일 구현예에 따르면, 시료내 표적 분석물의 양음성 판단에 사용되는 양성 판독부의 구현을 위하여 학습에 사용되는 학습용 입력 데이터는 상기 시료내 표적 분석물 분석에 사용되는 신호 발생 반응과 실질적으로 동일한 신호 발생 반응에 의하여 생성되는 데이터 세트이다.
다음으로, 순환 신경망의 학습 과정을 살펴보자. 학습용 입력 데이터로서, 특정 시료의 특정 표적 분석물질에 대한 전술한 데이터 세트(예컨대, 45개의 사이클 각각에서의 신호값 및 그 사이클의 순서에 대한 정보)가 순환 신경망에 입력된다. 그리고 학습용 정답 데이터로서, 해당 시료 내에 해당 표적 분석물질이 포함되어 있는지 여부가 입력된다. 예컨대 아래의 표 1과 같은 학습용 데이터 N개 각각이 순환 신경망에 입력될 수 있다.
No 학습용 입력 데이터 학습용 정답 데이터
1 {100,120,93,……,3000,3100,5000,7000, 7500,8232} 음성
2 {500,720,1030,……,5000,6100,7000,8100, 9500,10232} 음성
... ... ...
N {100,123,83,…,10000,13100,14000,17000, 17500,18232} 양성
여기서, 상기 표 1에서 'No'는 전술한 N개의 학습용 데이터를 구분하기 위해, 이러한 N개의 학습용 데이터 각각에 부여된 숫자를 의미한다. 다만, 이러한 숫자가 전술한 순환 신경망의 학습에 고려되지는 않을 수 있다. 예컨대, 전술한 N개의 학습용 데이터는 그 숫자의 크기와는 무관한 순서대로 순환 신경망에 입력될 수 있다.
아울러, 상기 표 1에서 학습용 입력 데이터는 중괄호 '{}' 안에 쉼표 ','로 구분되는 복수 개의 신호값을 포함한다. 표 1에서 이러한 신호값의 크기는 45개일 수 있으며, 다만 이에 한정되는 것은 아니다. 아울러, 쉼표로 구분되는 이러한 신호값 복수 개는, 왼쪽에서부터 순차적으로 첫번째 사이클, 두번째 사이클,…에 대한 것일 수 있으며, 가장 오른쪽에 있는 신호값은 마지막 사이클(ex. 45번째 사이클)에 대한 것일 수 있다.
또한, 상기 표 1에서 학습용 정답 데이터는 '양성' 또는 '음성' 중 어느 하나의 값을 가질 수 있다. 여기서 '양성'이란 해당 No에 대한 시료에 표적 분석물질이 포함되어 있음을 나타내고, '음성'이란 해당 No에 대한 시료에 표적 분석물질이 포함되어 있지 않음을 나타낸다.
그러면, 입력에 따른 출력 결과와 전술한 학습용 정답 데이터 간의 오차가 최소가 되도록, 오류 역전파(backpropagation) 방식에 학습된다.
이 때, 이러한 순환 신경망의 학습에서는, 상기 복수의 사이클 중에서 어느 하나의 사이클의 신호값(도 4의 x)에 대한 가중치(도 4의 Wxh)와, 상기 어느 하나의 사이클보다 시간적으로 선행하는 사이클에서 연산된 은닉 상태값에 대한 가중치(eh 4의 Whh)가, 학습용 입력 데이터가 상기 양음성 판독부의 입력단에 입력된 것에 대응해서 추정된 결과와 학습용 정답 데이터 간의 차이가 줄어들도록 갱신됨으로써 학습된다.
이러한 학습 과정은 순환 신경망의 성능이 소정의 기준을 만족시킬 때까지 수행된다. 소정의 기준은 다양한 방식으로 정해질 수 있다. 예컨대 소정의 기준은 이미 알려진 교차 검증에 의해 결정될 수 있다. 
여기서, 순환 신경망의 학습 과정이나 오류 역전파 방식, 또는 교차 검증 그 자체는 앞서 설명된 바도 있고 이미 공지된 기술이기도 하므로, 이에 관한 자세한 설명은 생략하기로 한다.
한편, 실시예에 따라, 양음성 판독부(1300)는 장단기 메모리(Long Short-Term Memory) 모델 방식으로 구현될 수도 있다. 장단기 메모리 모델의 경우, 순환 신경망의 단점인 과거의 데이터의 영향이 소실되는 것을 보완한 모델로 알려져 있다. 여기서, 장단기 메모리 모델에 대한 학습 방식 및 학습이 완료된 이후의 활용 방식 등은 순환 신경망과 동일하므로, 이에 관한 설명은 생략하기로 한다.
다음으로, 실시예에 따라, 양음성 판독부(1300)는 BERT(Bidirectional Encoder Representations from Transformers) 모델 방식으로 구현될 수도 있다. BERT는 사전 학습(pre-training) 방식으로 학습되는 바디(body)부 및 미세 조정(fine-tuning) 방식으로 학습되는 미세 조정부로 구성된다.
여기서 바디부의 학습 과정에서는 다양한 시료 각각이 다양한 표적 분석물질을 포함하는 경우에 수득된, 복수의 데이터 세트가 MLM(Mask Language Model) 및 NSP(Next Sentence Prediction)라고 알려진 반지도 학습 방식(semi-supervised learning)에 이용된다. 구체적으로, 각각의 데이터 세트의 일부를 마스킹하고 이를 맞추는 과정을 통해, 전술한 MLM에 따른 학습이 바디부에 적용될 수 있다. 또한 각각의 데이터 세트에는 사이클 별 순서를 갖는 신호값들이 포함되어 있는데, 이들 신호값의 순서 내지 선후 관계를 맞추는 과정을 통해, 전술한 NSP에 따른 학습이 바디부에 적용될 수 있다.
아울러, 미세 조정부의 학습 과정에서는, 바디부로부터 도출된 특징 벡터를 입력으로 하고 시료의 표적 분석물질의 포함 여부를 정답으로 하는 지도 학습이 수행되며, 이에 따라 미세 조정부가 학습된다.
그 밖에, BERT 모델을 이용해서 시료 내의 표적 분석물질을 추정하는 것이나 이의 학습에 이용되는 데이터가 데이터 세트 및 양음성 여부라는 것을 제외하고는, BERT 모델 그 자체는 이미 공지된 기술이므로, BERT 모델 그 자체에 대한 추가적인 설명은 생략하기로 한다.
한편, 전술한 양음성 판독부(1300)가 순환 신경망 모델이나 장단기 메모리 모델 또는 BERT 모델에 의해 구현된 경우, 양음성 판독부(1300)는 데이터 세트에 포함된 모든 정보, 즉 모든 사이클에 대한 신호값의 크기가 입력되면 그로부터 컨텍스트 벡터를 추출하는 인코더부와, 이렇게 추출된 컨텍스트 벡터를 기초로 양음성을 판독하는 이진 분류부를 포함하는 것으로, 개념적으로 볼 수 있다. 이러한 점에서, 일 실시예에 따른 양음성 판독부(1300)는 인코더부 및 이진 분류부를 포함하도록 구현될 수도 있다.
한편, 전술한 양음성 판독부(1300)는 신호 발생 반응의 신호 발생에 영향을 미치는 것으로 기 정의된 요소(factor)마다 양음성 판독 장치에 마련될 수 있다.
상기 요소는, 핵산 증폭 반응에 이용되는 반응 조건들을 포함한다.
상기 반응 조건은, 상기 핵산 증폭 반응에 이용되는 반응 미디엄인 것을 특징으로 한다. 상기 반응 미디엄은, pH 관련 물질, 이온 세기 관련 물질, 효소 및 효소 안정화 관련 물질로부터 구성된 군으로부터 선택되는 하나 이상의 물질이다.
pH 관련 물질은 버퍼를 포함하고, 상기 이온 세기 관련 물질은 이온성 물질을 포함하고, 상기 효소 안정화 관련 물질은 당을 포함한다.
예컨대, 양음성 판독부(1300)는 sars-cov-2, 지카 바이러스 등의 표적 분석물질마다 각각 하나씩 양음성 판독 장치(1000)에 마련될 수 있다. 이 경우, 별도의 알고리즘 또는 양음성 판독 장치(1000)를 이용하는 사용자에 의해, 복수 개의 양음성 판독부(1300) 중 어떤 양음성 판독부(1300)가 사용될지 여부가 결정될 수 있다.
일 구현예에 따르면, 동일한 표적 분석물이라도, 표적 분석물의 검출에 사용되는 신호 발생 반응에 따라 별도의 양음성 판독부가 제공될 수 있다.
일 구현예예 따르면, 신호 발생 반응의 신호 발생에 영향을 미치는 것으로 기 정의된 요소(factor)마다 양음성 판독부가 제공될 수 있다.
일 구현예예 따르면, 신호 발생 반응의 신호 발생에 영향을 미치는 것으로 기 정의된 요소(factor)는 표적 분석물질 검출을 위한 올리고뉴클레오타이드, 효소, 표지 및 반응 조성물 성분 농도를 포함한다.
반응 조성물 성분은 buffer, 염, 금속 이온 및 dNTP을 포함한다.
일 구현예예 따르면, 신호 발생 반응의 신호 발생에 영향을 미치는 것으로 기 정의된 요소(factor)는 신호 발생 반응 조건을 포함한다.
올리고뉴클레오타이드는 프라이머 또는 프로브를 포함한다.
이상에서 살펴본 바와 같이, 일 실시예에 따르면, 시료의 표적 분석물질에 대한 양음성 여부가 딥러닝 방식에 의해 학습된 모델에 의해 판독될 수 있다. 따라서, 양음성 판독 결과의 신속성 및 정확도가 향상될 수 있다.
한편, 전술한 양음성 판독 장치(1000)는 도 6에 도시된 것과 같은 하드웨어적 블록 구성도에 따라 구현 가능하다. 보다 구체적으로 살펴보자.
도 6을 참조하면, 양음성 판독 장치(1000)는 적어도 하나의 명령을 저장하는 저장장치(1610) 및 상기 저장장치(1610)의 적어도 하나의 명령을 실행하는 프로세서(1620), 송수신 장치(1630), 입력 인터페이스 장치(1640) 및 출력 인터페이스 장치(1650)를 포함할 수 있다.
양음성 판독 장치(1000)에 포함된 각각의 구성 요소들(1610, 1620, 1630, 1640, 1650)은 데이터 버스(bus, 1660)에 의해 연결되어 서로 통신을 수행할 수 있다.
저장장치(1610)는 저장부(1400)의 기능을 수행할 수 있다. 또한, 저장장치(1610)은 메모리 또는 휘발성 저장 매체 및 비휘발성 저장 매체 중에서 적어도 하나를 포함할 수 있다. 예를 들어, 저장장치(1610)는 읽기 전용 메모리(read only memory, ROM) 및 랜덤 액세스 메모리(random access memory, RAM) 중에서 적어도 하나를 포함할 수 있다.
저장장치(1610)는 후술될 프로세서(1620)에 의해 실행될 적어도 하나의 명령을 더 포함할 수 있고, 입력 인터페이스 장치(1640)에서 사용자로부터 입력된 복수의 사이클 각각의 신호값, 학습용 데이터 등을 저장할 수 있다.
프로세서(1620)는 중앙 처리 장치(central processing unit, CPU), 그래픽 처리 장치(graphics processing unit, GPU), MCU(micro controller unit) 또는 일 실시예들에 따른 방법들이 수행되는 전용의 프로세서를 의미할 수 있다.
도 1을 더 참조하면, 프로세서(1620)는 앞서 설명한 바와 같이, 저장장치(1610)에 저장된 적어도 하나의 프로그램 명령에 의해 전처리부(1200), 양음성 판독부(1300)의 기능을 수행할 수 있으며, 이들 각각은 적어도 하나의 모듈의 형태로 메모리에 저장되어 프로세서에 의해 실행될 수 있다.
송수신 장치(1630)은 내부 장치 또는 통신으로 연결된 외부 장치로부터 데이터를 수신하거나 송신할 수 있고, 입력부(1100)의 기능을 수행할 수 있다. 예를 들어, 송수신 장치(1630)는 준비 장치(2000) 또는 검출 장치(3000)로부터 샘플, 분석 샘플 및 증폭된 샘플의 데이터 세트 등에 대한 데이터를 수신할 수 있다.
입력 인터페이스 장치(1640)는 사용자로부터 적어도 하나의 제어 신호 또는 설정 수치를 입력받을 수 있다. 예를 들어, 입력 인터페이스 장치(1640)는 전처리부(1200)에서 수행될 전처리 방식 및 점핑 보정 기준 등의 사용자 입력을 받을 수 있다.
출력 인터페이스 장치(1650)는 프로세서(1620)의 동작에 의해 양음성 판독부(1300)가 판독한 시료의 표적 분석물질에 대한 양음성 여부를 포함하는 적어도 하나의 정보를 출력하여 가시화할 수 있다.
도 7은 일 실시예에 따른 양음성 판독 방법의 순서도이다. 이러한 순서도에 따른 양음성 판독 방법은, 전술한 양음성 판독 장치(1000)에 의해 수행될 수 있다. 아울러, 도 7에 도시된 양음성 판독 방법은 예시적인 것에 불과한 바, 본 발명의 사상이 도 7에 도시된 것으로 한정 해석되는 것은 아니다.
도 7을 참조하면, 양음성 판독 장치(1000)는 입력부(1100)를 통해 양음성을 판독하고자 하는 시료 내 표적 분석물질을 타겟으로 하는 복수 사이클 신호 발생 반응으로부터 상기 복수의 사이클 각각에서 신호값을 입력 받을 수 있다(S100).
이러한 신호값은 전술한 바와 같이 검출 장치(3000)로부터 전달받은 것일 수 있으며, 다만 이에 한정되는 것은 아니다.
또한, 양음성 판독 장치(1000)는 양음성 판독부(1300)를 통해, 복수의 사이클에서의 신호값 및 상기 복수의 사이클의 순서로부터 시료 내 표적 분석물질의 존재 여부를 기 학습된 모델을 이용하여 판독한다(S200). 여기서, 양음성 판독부(1300)는, 입력부(1100) 또는 전처리부(1200)로부터, 전술한 데이터 세트를 전달받을 수 있음은 전술한 바와 같다.
본 개시의 또 다른 실시 형태에 따르면, 양음성 판독 장치(1000)에 적용되는 동일한 부분에 관해서는 중복을 피하기 위해서 적절히 기재를 생략한다.
하나의 반응 용기에 포함된 시료에서 검출하고자 하는 표적 분석물은 하나 일 수 있다. 표지를 포함하는 시그널 발생 조성물을 이용하여 신호 발생 과정에서 상기 표적 분석물의 존재에 의존적인 신호를 검출할 수 있다.
양음성 판독 장치(1000) 역시 이러한 신호를 검출 장치(3000)로부터 입력 받아서 양음성 여부를 판독한다.
하나의 반응 용기에 포함된 시료에서 검출하고자 하는 표적 분석물은 둘 이상 일 수 있다. 이러한 경우, 상기 반응 용기에는 표적 분석물들의 존재에 의존적으로 신호를 제공하는 신호 발생 조성물들이 포함되어 있으며, 신호 발생 반응을 통하여 표적 분석물들의 존재를 나타내는 신호를 제공할 수 있다.
사용하는 신호 발생 수단에 따라 표적 분석물들 마다 다른 특성을 갖는 신호들 (예를 들어, 서로 다른 파장의 신호)을 발생시키도록 할 수 있고, 표적 분석물 각각에 대한 구별되는 데이터 세트를 수득할 수 있다. 표적 분석물 각각에 대한 양음성 판독부가 별도로 제공되고, 해당하는 데이터 세트를 해당하는 양음성 판독부에서 분석하여 표적 분석물의 존재를 확인할 수 있다.
한편, 사용하는 신호 발생 수단에 따라, 복수의 표적 분석물들에 대하여 실질적으로 동일한 특성의 신호 (예를 들어, 서로 동일한 파장의 신호)를 발생시킬 수 있다. 이러한 경우, 일련의 과정을 통하여, 표적 분석물 각각에 대한 구별되는 데이터 세트를 수득할 수 있다. 표적 분석물 각각에 대한 양음성 판독부가 별도로 제공되고, 해당하는 데이터 세트를 해당하는 양음성 판독부에서 분석하여 표적 분석물의 존재를 확인할 수 있다.
이하, 보다 자세하게 살펴본다. 구현예에서, 양음성 판독 장치(1000)의 입력부(1100)가 검출 장치로부터, 하나의 분석 샘플 용기(반응 튜브)로부터 검출된 신호를 입력 받는다. 그런데, 상기 신호는 단일 유형의 표지를 이용하여 복수의 표적 분석물질을 검출하는 방법에 의하여 제공되는 신호이다. 이러한 신호를 입력받은 것으로 전제하고 살펴보자.
일 구현예에서, 양음성 판독 장치(1000)의 전처리부(1200)는, 입력부(1100)가 검출 장치(3000)로부터 입력받은 전술한 신호를, 복수의 표적 분석물질 각각에 대한 신호로 구분 내지 분리시키는 전처리 작업을 수행한다. 이렇게 구분 내지 분리시키는 작업은 공지된 방법(예컨대, WO2015147370, WO2015147377, WO2015147382, WO2015147412)에 기재되어 있다. 이러한 구분 내지 분리하는 과정에 대해서 전술한 공지된 방법을 참조해서 보다 자세하게 살펴보도록 한다.
예를 들어, 하나의 반응 용기에서 제1 표적 분석물질 및 제2 표적 분석물질을 검출하고자 하는 경우에, 제1 표적 분석물질의 검출을 위하여 제1 신호 발생 조성물이 사용되는 경우, 제1 신호 발생 조성물은 신호 발생 반응에서 제1 온도에서 제1 표적 분석물질의 존재를 나타내는 신호를 발생시킬 수 있다. 또한, 제2 온도에서도 제1 표적 분석물질의 존재를 나타내는 신호를 발생시킬 수 있다. 한편, 제2 표적 분석물질의 검출을 위하여 제2 신호 발생 조성물이 사용되는 경우, 제2 신호 발생 조성물은 신호 발생 반응에서 제1 온도에서 제2 표적 분석물질이 존재하더라도 신호가 발생되지 않도록 할 수 있다. 동시에, 상기 제2 신호 발생 조성물은 제2 온도에서는 제2 표적 분석물질이 존재를 나타내는 신호를 발생시킬 수 있다. 여기서, 신호 발생 반응은, 시료 내에 상기 표적 분석물질이 존재하면 제1 온도 및 제2 온도 각각에서 신호를 발생시키는 제1 신호 발생 조성물에 의해 실시되는 반응을 포함한다. 또한, 신호 발생 반응은, 시료 내에 상기 표적 분석물질과는 상이한 표적 분석물질이 존재하면 상기 제1 온도에서는 신호를 발생시키지 않고, 상기 제2 온도에서는 신호를 발생시키는 제2 신호 발생 조성물에 의해 실시되는 반응을 더 포함할 수 있다.
일 구현예에서, 제1 온도는 제2 온도 보다 높은 온도이다. 일 구현예에서, 제1 온도는 제2 온도 보다 낮은 온도이다.
이러한 관점에서, 신호 발생 조성물에 따라, 제1 표적 분석물질에 대한 신호는 발생시키되, 제2 표적 분석물질에 대한 신호는 발생시키지 않는 제1 온도 범위가 있을 수 있다. 반면, 상기 2개의 표적 분석물질 모두에 대해 신호가 발생되는 제2 온도 범위가 존재할 수 있다.
이에, 전술한 2개의 온도 범위(제1 온도 범위 및 제2 온도 범위)를 고려하여, 2개의 표적 분석물질 각각에 대한 검출 온도가 결정될 수 있다.
예컨대, 제1 온도가 제2 온도 보다 높은 경우, 검출 온도 중 상대적 고온인 상대적 고온 검출 온도는 상기 제1 온도 범위로부터 선택될 수 있다. 상대적 고온 검출 온도에서는 제1 표적 분석물질과 제2 표적 분석물질이 하나의 시료 내에 모두 존재하여도 제1 표적 분석물질에 상응하는 신호만이 발생된다.
아울러, 검출 온도 중 상대적 저온인 상대적 저온 검출 온도는 상기 제2 온도 범위로부터 선택될 수 있다. 상대적 저온 검출 온도에서는 제1 표적 분석물질과 제2 표적 분석물질이 하나의 시료 내에 모두 존재하면, 제1 표적 분석물질에 상응하는 신호 뿐 아니라 제2 표적 분석물질에 상응하는 신호도 발생된다.
즉, 2개의 표적 분석물질 중 하나는 상응하는 신호 발생 조성물(제1 신호 발생 조성물)에 의해 결정되는 상대적 고온 검출 온도를 갖고, 다른 하나는 상응하는 또 다른 신호 발생 조성물(제2 신호 발생 조성물)에 의해 결정되는 상대적 저온 검출 온도를 갖는다.
이를 토대로 살펴보면, 일 실시 예에 따른 전처리부(1200)에서는 2개의 표적 분석물질의 존재를 나타내는 신호를 소정의 연산을 통해 분리할 수 있으며, 이렇게 분리된 결과를 양음성 판독부(1300)에 전달할 수 있다. '소정의 연산'에 대해서는 도 8을 참조해서 살펴보자.
도 8에는 제1 표적물질인 CT(Chlamydia Trachomatis)와 제2 표적물질인 NG(Neisseria Gonorrhoeae)의 다양한 조합을 제1 신호 발생 조성물 및 제2 신호 발생 조성물과 반응시켜 수득된 사이클에 대한 신호값 결과가 도시되어 있다. 제1 온도는 72℃이고, 제2 온도는 60℃이다. 이들 중 CT는 상대적 고온 검출 온도를 갖는 표적 분석물질에 대한 예시이고, 에 불과하고, NG는 상대적 저온 검출 온도를 갖는 표적 분석물질에 대한 예시이다.
도 8의 (a) 및 (e)에 나타낸 바와 같이, 시료 내 CT가 존재하는 경우(CASE 1 및 3)에는 72℃에서 신호가 검출되었다. 아울러, 시료 내 NG만이 존재하는 도 8의 (c)와 (d)의 경우(CASE 2), 60℃인 (d)에서는 신호가 검출되었지만, 72℃인 (c)에서는 신호가 검출되지 않았다.
도 8의 (a), (c) 및 (e)에서 상기 상대적 고온 검출 온도인 72℃에서, 상기 상대적 고온 검출 온도를 갖는 CT에 대한 신호는 발생되지만, 상기 상대적 저온 검출 온도를 갖는 NG에 대한 신호는 발생되지 않는다. 따라서, 상기 상대적 고온 검출 온도에서의 신호 검출로 최소한 상기 상대적 고온 검출 온도를 갖는 CT의 존재를 결정할 수 있다는 것을 알 수 있다. 즉, 상대적 고온 검출 온도에서의 신호인 도 8의 (a), (c) 또는 (e)의 데이터 세트가 양음성 판독부(1300)에 입력되면, 해당 시료 내의 CT에 대한 양음성 여부가 판독될 수 있다.
상대적 저온 검출 온도에서 검출되는 신호에는 CT 및 NG에 대한 신호가 모두 존재할 수 있다. 하지만, 상대적 고온 검출 온도에서 수득한 신호를 이용하여, 상대적 저온 검출 온도에서 수득된 신호 중에서 CT에 대한 신호를 제거할 수 있다. 이를 통하여, NG의 존재여부를 나타내는 신호, 즉, 데이터 세트를 수득할 수 있다. 상기 데이터 세트가 양음성 판독부(1300)에 입력되면, 해당 시료 내의 NG에 대한 양음성 여부가 판독될 수 있다.
예컨대, CT가 시료 내에 존재하는 것으로 선 판독된 후(도 8의 (a) 또는 (e)) 해당 시료 내 NG의 존재를 판독해야 된다면, 도 8의 (b)의 그래프에서 도 8의 (a)의 그래프를 차감하는 작업을 전처리부(1200)가 수행한 뒤, 이렇게 차감된 결과가 양음성 판독부(1300)에 입력되면, 해당 시료 내의 NG의 존재가 판독될 수 있다. 이 때, 도 8의 (a)와 (b)의 그래프는 동일한 cycle에서의 RFU에 대한 크기, 즉 amplitude가 약간 차이가 나는 것을 알 수 있는데, 이 차이를 보정하기 위한 다양한 기법이 존재한다. 다만, 이 기법들은 이미 공지된 것인 바, 이에 관한 자세한 설명은 생략하기로 한다.
또는, CT가 시료 내에 존재하지 않는 것으로 선 판독된 후(도 8의 (c)) 해당 시료 내 NG의 존재를 판독해야 된다면, 도 8의 (b)의 그래프가 양음성 판독부(1300)에 입력되면, 해당 시료 내의 NG의 존재가 판독될 수 있다.
이상에서 살펴본 바와 같이, 일 실시예에 따르면, 시료의 표적 분석물질에 대한 양음성 여부가 딥러닝 방식에 의해 학습된 모델에 의해 판독될 수 있다. 따라서, 양음성 판독 결과의 신속성 및 정확도가 향상될 수 있다.
한편, 전술한 양음성 판독 방법은, 이러한 방법에 포함된 각 단계를 수행하도록 프로그램된 컴퓨터 프로그램의 형태로 구현될 수 있다. 이 경우, 해당 컴퓨터 프로그램은 컴퓨터 판독가능한 기록매체에 포함될 수 있다. 즉, 본 발명의 다양한 구현에에 따르면, 전술한 컴퓨터 프로그램을 저장하는 컴퓨터 판독가능한 기록매체 또는 전술한 컴퓨터 판독가능한 기록매체에 저장된 컴퓨터 프로그램의 형태로 실시 가능하다.
본 발명에 첨부된 블록도의 각 블록과 흐름도의 각 단계의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수도 있다. 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 인코딩 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 인코딩 프로세서를 통해 수행되는 그 인스트럭션들이 블록도의 각 블록 또는 흐름도의 각 단계에서 설명된 기능들을 수행하는 수단을 생성하게 된다. 이들 컴퓨터 프로그램 인스트럭션들은 특정 방법으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 블록도의 각 블록 또는 흐름도 각 단계에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다. 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 블록도의 각 블록 및 흐름도의 각 단계에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.
또한, 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 실시 예들 에서는 블록들 또는 단계들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들 또는 단계들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 품질에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시 예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시 예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 균등한 범위 내에 있는 모든 기술사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (26)

  1. 표적 분석물질을 타겟으로 하는 복수 사이클의 신호 발생 반응으로부터 신호값을 입력받는 입력부; 상기 신호 발생 반응은 시료 내에 상기 표적 분석물질의 존재에 의존적인 신호를 발생시키고,
    상기 복수 사이클에서의 신호값 및 상기 복수 사이클의 순서로부터, 상기 시료 내에 상기 표적 분석물질의 존부를 추정하도록 기 학습된 양음성 판독부를 포함하는
    양음성 판독 장치.
  2. 제 1 항에 있어서,
    상기 표적 분석물질은 표적 핵산 분자를 포함하는
    양음성 판독 장치.
  3. 제 1 항에 있어서,
    상기 표적 분석물질의 존재에 의존적인 신호는,
    형광 신호를 포함하는
    양음성 판독 장치.
  4. 제 1 항에 있어서,
    상기 신호 발생 반응은 핵산증폭 반응을 포함하는
    양음성 판독 장치.
  5. 제 1 항에 있어서,
    상기 양음성 판독부는,
    상기 신호값을 그 사이클의 순서에 따라 순차적으로 상기 입력부로부터 획득하는
    양음성 판독 장치.
  6. 제 1 항에 있어서,
    상기 양음성 판독부는,
    상기 복수 사이클의 신호값 모두에 대해 상기 입력부로부터 획득을 완료한 이후에 상기 시료 내 상기 표적 분석물질의 존부를 추정하는
    양음성 판독 장치.
  7. 제 1 항에 있어서,
    상기 양음성 판독부의 학습 과정에서는 학습용 입력 데이터와 학습용 정답 데이터를 포함하는 학습용 데이터가 이용되되,
    상기 학습용 입력 데이터는, 상기 표적 분석물질의 존재에 의존적인 신호를 발생시키는 신호 발생 반응이 이루어져서 기 획득된 복수의 학습용 사이클 별 신호값 및 각 사이클의 순서에 대한 정보를 포함하고,
    상기 학습용 정답 데이터는, 상기 표적 분석물질의 존부에 대한 정보를 포함하는
    양음성 판독 장치.
  8. 제 7 항에 있어서,
    상기 양음성 판독부의 학습 과정에서는,
    상기 학습용 입력 데이터 중 상기 복수의 학습용 사이클 신호값이 상기 사이클의 순서에 따라 상기 양음성 판독부에 순차적으로 입력되는
    양음성 판독 장치.
  9. 제 8 항에 있어서,
    상기 양음성 판독부의 학습 과정에서는,
    상기 학습용 입력 데이터가 상기 양음성 판독부에 입력된 것에 대응해서 추정된 결과와 상기 학습용 정답 데이터를 비교하는 과정; 및
    상기 비교를 통해 도출된 차이가 줄어들도록 상기 양음성 판독부를 학습시키는 과정이 포함되어서 수행되는
    양음성 판독 장치.
  10. 제 9 항에 있어서,
    상기 차이가 줄어들도록 상기 양음성 판독부를 학습시키는 과정에는,
    역전파(backpropagation) 방식이 이용되는
    양음성 판독 장치.
  11. 제 7 항에 있어서,
    상기 양음성 판독부가 BERT(Bidirectional Encoder Representations from Transformers) 모델을 포함할 때,
    상기 양음성 판독부는,
    상기 학습용 입력 데이터에 적어도 부분적으로 기초해서 학습되는 바디(body)부; 및
    상기 학습이 완료된 바디부와 결합되어서, 상기 학습용 입력 데이터가 상기 학습이 완료된 바디부에 입력되면 양음성 여부를 추론하도록 학습되는 미세 조정(fine-tuning)부를 포함하는
    양음성 판독 장치.
  12. 제 11 항에 있어서,
    상기 바디부는 반지도 학습(semi-supervised learning) 방식에 따라 학습되는
    양음성 판독 장치.
  13. 제 12 항에 있어서,
    상기 반지도 학습 방식에서는,
    상기 학습용 입력 데이터 중 일부를 마스킹(masking)한 뒤 상기 마스킹된 일부를 맞추는 과정 및 상기 학습용 입력 데이터에 포함되는 순서를 갖는 신호값의 순서 내지 선후 관계를 맞추는 과정이 포함되어서 수행되는
    양음성 판독 장치.
  14. 제 11 항에 있어서,
    상기 미세 조정부는,
    지도 학습(supervised-learning) 방식에 따라 학습되는
    양음성 판독 장치.
  15. 제 11 항에 있어서,
    상기 양음성 판독부는,
    상기 복수 사이클에서의 신호값 및 상기 사이클 각각의 순서로부터 컨텍스트 벡터를 생성하는 인코더부; 및
    상기 컨텍스트 벡터로부터 상기 시료 내 상기 표적 분석물질의 존부를 추정하는 이진 분류부를 포함하는
    양음성 판독 장치.
  16. 제 1 항에 있어서,
    상기 양음성 판독부가 순환 신경망 모델 또는 장단기 메모리 모델을 포함할 때의 학습 과정에서는,
    상기 복수의 사이클 중에서 어느 하나의 사이클의 신호값에 대한 가중치 및 상기 어느 하나의 사이클보다 시간적으로 선행하는 사이클에 대해 연산된 은닉 상태값에 대한 가중치가, 학습용 입력 데이터가 상기 양음성 판독부의 입력단에 입력된 것에 대응해서 상기 양음성 판독부의 출력단에서 출력된 결과와 학습용 정답 데이터 간의 차이가 줄어들도록 갱신됨으로써 학습되는
    양음성 판독 장치.
  17. 제 1 항에 있어서,
    상기 양음성 판독부가 순환 신경망 모델 또는 장단기 메모리 모델을 포함할 때의 상기 양음성 판독부의 입출력 구조는,
    복수 개의 데이터를 입력받으면 1개의 데이터를 출력하는 many-to-one 구조인
    양음성 판독 장치.
  18. 제 1 항에 있어서,
    상기 양음성 판독부는,
    상기 신호 발생 반응의 신호 발생에 영향을 미치는 것으로 기 정의된 요소(factor)마다 상기 양음성 판독 장치에 마련되는
    양음성 판독 장치.
  19. 제 18항에 있어서,
    상기 기 정의된 요소는,
    핵산 증폭 반응에 이용되는 반응 조건들을 포함하는
    양음성 판독 장치.
  20. 제 19 항에 있어서,
    상기 반응 조건은, 상기 핵산 증폭 반응에 이용되는 반응 미디엄인 것을 특징으로 하는
    양음성 판독 장치.
  21. 제 20 항에 있어서,
    상기 반응 미디엄은,
    pH 관련 물질, 이온 세기 관련 물질, 효소 및 효소 안정화 관련 물질로부터 구성된 군으로부터 선택되는 하나 이상의 물질인 것을 특징으로 하는,
    양음성 판독 장치.
  22. 제 21 항에 있어서,
    상기 pH 관련 물질은 버퍼를 포함하고,
    상기 이온 세기 관련 물질은 이온성 물질을 포함하고,
    상기 효소 안정화 관련 물질은 당을 포함하는 것을 특징으로 하는
    양음성 판독 장치.
  23. 제 1 항에 있어서,
    상기 양음성 판독 장치는,
    상기 복수 사이클 각각에서의 신호값을 대상으로 소정의 전처리 작업을 수행하는 전처리부를 더 포함하며,
    상기 양음성 판독부는,
    상기 전처리부에 의해 상기 전처리 작업이 수행된 신호값으로부터, 상기 시료 내 상기 표적 분석물질의 존부를 추정하는
    양음성 판독 장치.
  24. 제 23 항에 있어서,
    상기 전처리 작업은,
    상기 복수 사이클에서의 신호값 중 비정상 신호(abnormal signal)에 대한 보정 작업, 상기 복수 사이클에서의 신호값에 대한 스무딩(smoothing) 작업 또는 상기 복수 사이클에서의 신호값으로부터 regression된 베이스라인 signal value를 상기 복수 사이클에서의 신호값으로부터 차감하는 베이스라인 차감(baseline subtraciton) 작업을 포함하는
    양음성 판독 장치.
  25. 양음성 판독 장치에 의해 수행되는 양음성 판독 방법에 있어서,
    표적 분석물질을 타겟으로 하는 복수 사이클의 신호 발생 반응으로부터, 상기 복수 사이클에서의 신호값을 입력받는 단계; 상기 신호 발생 반응은 시료 내에 상기 표적 분석물질의 존재에 의존적인 신호를 발생시키고,
    상기 복수 사이클에서의 신호값 및 상기 복수 사이클의 순서로부터, 상기 시료 내에 상기 표적 분석물질의 존부를 기 학습된 모델을 이용하여 추정하는 단계를 포함하는
    양음성 판독 방법.
  26. 컴퓨터 프로그램을 저장하는 컴퓨터 판독 가능한 기록 매체로서,
    상기 컴퓨터 프로그램은,
    양음성 판독 장치에 의해 수행되는 표적 분석물질을 타겟으로 하는 양음성 판독 방법을 프로세서가 수행하도록 하기 위한 명령어를 포함하고,
    상기 방법은,
    표적 분석물질을 타겟으로 하는 복수 사이클의 신호 발생 반응으로부터, 상기 복수 사이클에서의 신호값을 입력받는 단계; 상기 신호 발생 반응은 시료 내에 상기 표적 분석물질의 존재에 의존적인 신호를 발생시키고,
    상기 복수 사이클에서의 신호값 및 상기 복수 사이클의 순서로부터, 상기 시료 내에 상기 표적 분석물질의 존부를 기 학습된 모델을 이용하여 추정하는 단계를 포함하는
    컴퓨터 판독 가능한 기록 매체.
PCT/KR2022/015987 2021-10-21 2022-10-20 시료 내 표적 분석물질에 대한 양음성 판독 장치 및 방법 WO2023068823A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20210141223 2021-10-21
KR10-2021-0141223 2021-10-21

Publications (1)

Publication Number Publication Date
WO2023068823A1 true WO2023068823A1 (ko) 2023-04-27

Family

ID=86059491

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2022/015987 WO2023068823A1 (ko) 2021-10-21 2022-10-20 시료 내 표적 분석물질에 대한 양음성 판독 장치 및 방법

Country Status (1)

Country Link
WO (1) WO2023068823A1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001032922A2 (en) * 1999-10-29 2001-05-10 Stratagene Methods for detection of a target nucleic acid sequence
US20070111249A1 (en) * 2001-08-21 2007-05-17 Applera Corporation Automatic threshold setting for quantitative polymerase chain reaction
US7363168B2 (en) * 2001-10-02 2008-04-22 Stratagene California Adaptive baseline algorithm for quantitative PCR
KR20110052681A (ko) * 2008-08-08 2011-05-18 스미스 디텍션 인크. Pcr 검정을 위한 검출 알고리즘
KR20170051539A (ko) * 2014-10-01 2017-05-11 주식회사 씨젠 시료의 분석 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001032922A2 (en) * 1999-10-29 2001-05-10 Stratagene Methods for detection of a target nucleic acid sequence
US20070111249A1 (en) * 2001-08-21 2007-05-17 Applera Corporation Automatic threshold setting for quantitative polymerase chain reaction
US7363168B2 (en) * 2001-10-02 2008-04-22 Stratagene California Adaptive baseline algorithm for quantitative PCR
KR20110052681A (ko) * 2008-08-08 2011-05-18 스미스 디텍션 인크. Pcr 검정을 위한 검출 알고리즘
KR20170051539A (ko) * 2014-10-01 2017-05-11 주식회사 씨젠 시료의 분석 방법

Similar Documents

Publication Publication Date Title
Tsai et al. Development of TaqMan probe-based insulated isothermal PCR (iiPCR) for sensitive and specific on-site pathogen detection
Shokralla et al. Pyrosequencing for mini-barcoding of fresh and old museum specimens
Ali et al. Analysis of pork adulteration in commercial burgers targeting porcine-specific mitochondrial cytochrome B gene by TaqMan probe real-time polymerase chain reaction
Chen et al. Rapid Sanger sequencing of the 16S rRNA gene for identification of some common pathogens
Torres et al. Real-time PCR for simultaneous and quantitative detection of quarantine phytoplasmas from apple proliferation (16SrX) group
Dhami et al. A HRM real-time PCR assay for rapid and specific identification of the emerging pest spotted-wing drosophila (Drosophila suzukii)
AU2022202180B2 (en) Method and device for analyzing target analyte in sample
JP2015042182A (ja) 核酸検出方法
Green et al. Developmental validation of VeriFiler™ Plus PCR Amplification Kit: A 6-dye multiplex assay designed for casework samples
JP5542438B2 (ja) 融解曲線解析方法および融解曲線解析装置
WO2023068823A1 (ko) 시료 내 표적 분석물질에 대한 양음성 판독 장치 및 방법
JP2021532802A (ja) リアルタイムpcrを実施する方法
Bini et al. A DNA-based method for distinction of fly artifacts from human bloodstains
Yang et al. Chimeric crRNA improves CRISPR–Cas12a specificity in the N501Y mutation detection of Alpha, Beta, Gamma, and Mu variants of SARS-CoV-2
JP2003174900A (ja) ピロリン酸と核酸の定量方法およびその装置
Pierce et al. Effectiveness and limitations of uracil-DNA glycosylases in sensitive real-time PCR assays
Vilela et al. Phylogenetic analyses of Chlamydia psittaci ompA gene sequences from captive blue-fronted Amazon parrots (Amazona aestiva) with hepatic disease in Brazil
RU2722758C1 (ru) Набор синтетических олигонуклеотидов для выявления ДНК представителей семейства Оленевые
WO2023121167A1 (ko) 검출 장치의 성능을 예측하기 위한 방법
WO2022146052A1 (en) Optical spectrometry-based method and device for detecting target analyte in sample
WO2023153782A1 (en) Device and method for providing interface for setting parameters
Naaum et al. An introduction to DNA-based tools for seafood identification
Gaddam et al. Quantitative and qualitative assessment of sex sorted semen of Bos indicus and Bos taurus breeds
WO2024025390A1 (ko) 파라미터의 임계값 설정용 인터페이스 제공 장치 및 방법
JP2005528120A (ja) 直接pcr定量

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22884045

Country of ref document: EP

Kind code of ref document: A1