WO2015053480A1 - 생물학적 샘플 분석 시스템 및 방법 - Google Patents

생물학적 샘플 분석 시스템 및 방법 Download PDF

Info

Publication number
WO2015053480A1
WO2015053480A1 PCT/KR2014/008167 KR2014008167W WO2015053480A1 WO 2015053480 A1 WO2015053480 A1 WO 2015053480A1 KR 2014008167 W KR2014008167 W KR 2014008167W WO 2015053480 A1 WO2015053480 A1 WO 2015053480A1
Authority
WO
WIPO (PCT)
Prior art keywords
samples
test
positive
pool
sample
Prior art date
Application number
PCT/KR2014/008167
Other languages
English (en)
French (fr)
Inventor
홍유진
남성혁
이용석
강성수
기창석
Original Assignee
삼성에스디에스 주식회사
사회복지법인 삼성생명공익재단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성에스디에스 주식회사, 사회복지법인 삼성생명공익재단 filed Critical 삼성에스디에스 주식회사
Publication of WO2015053480A1 publication Critical patent/WO2015053480A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5002Partitioning blood components

Definitions

  • Embodiments of the present invention relate to techniques for analyzing biological samples.
  • One conventional method for testing multiple samples simultaneously is to test a sample that combines multiple samples at different ratios so that any one of the combined samples depends on the strength of the signal that exhibits a particular property in the test results. There is a way to determine if you have one.
  • Embodiments of the present invention are intended to provide a means for minimizing the number of tests when testing whether a particular property appears for a plurality of biological samples.
  • a plurality of pools generated by combining a plurality of biological samples constituting the n * m matrix, and samples having the same row or column in the matrix
  • An additional sample selector configured to select a minimum number of additional test target samples to perform individual tests of whether the test target property is retained among the plurality of samples when there is a possibility of false positive determination;
  • a test result determiner configured to determine whether the test target property of each of the plurality of samples is retained according to a test result of the additional test target sample.
  • the determining unit may estimate the number of positive samples from among the plurality of samples according to the test values of each of the plurality of pools, and determine whether there is a possibility of false positive determination based on the estimated number of positive samples. have.
  • the determination unit may determine that there is a possibility of false positive determination when the estimated maximum and minimum values of the number of positive samples are different.
  • the additional sample selecting unit may include, for each of the pools in which the test value is determined to be positive, a minimum number of additional numbers necessary to calculate a test result of the remaining samples from the test values of the corresponding pool among the positive samples included in the positive judgment pool. Samples to be inspected can be selected.
  • the additional sample selector may sequentially select the additional test target sample from the positive determination pool having the smallest number of positive samples available in the positive determination pool.
  • the test result determining unit retains the test target property of the remaining positive testable samples included in the pool by using the test value of the corresponding pool and the test value of the additional test target sample included in the pool for each of the positive judgment pools. It can be determined.
  • a plurality of pools generated by combining a plurality of biological samples constituting an n * m matrix, and samples having the same row or column in the matrix
  • Determining Selecting, by the additional sample selecting unit, a minimum number of additional test target samples for performing individual tests on whether the test target property is retained among the plurality of samples when there is a possibility of false positive determination; And determining, by the test result determining unit, whether the test property of each of the plurality of samples is retained according to a test result of the additional test target sample.
  • the determining may include estimating the number of positive samples among the plurality of samples according to the test values of each of the plurality of pools, and determining whether there is a possibility of false positive determination based on the estimated number of positive samples. Can be.
  • the determining step when the estimated maximum and minimum values of the number of positive samples are different, it may be determined that there is a possibility of false positive determination.
  • the additional sample selecting step may include, for each pool that is determined to be positive according to the test value, the minimum number required to calculate the test result of the remaining samples from the test values of the corresponding pool among the positive samples included in the positive judgment pool. Additional samples to be examined can be selected.
  • the additional test target sample may be sequentially selected from the positive determination pool having the smallest number of positive-capable samples included in the positive determination pool.
  • the determining of whether the property to be inspected may include: for each of the positive determination pools, remaining testable samples included in the pool using test values of the corresponding pool and test values of additional test target samples included in the pool. It can be determined whether or not the property to be inspected is retained.
  • one or more samples to be tested are collected to form a pool, and then individual test results of each sample are calculated based on the test results of each pool. The same results can be obtained while reducing the number of inspections when performing.
  • the number of samples to be individually tested may be further minimized. It is possible to obtain accurate test results without minimizing the possibility of false positive determinations.
  • FIG. 1 is a view for explaining a sample pooling (pooling) process according to an embodiment of the present invention
  • FIG. 2 is a block diagram illustrating a biological sample analysis system 100 according to an embodiment of the present invention.
  • 3 and 4 are views for explaining a positive sample estimation method according to the sample collection analysis method according to an embodiment of the present invention
  • FIG. 5 is a diagram illustrating a process of generating a matrix M and calculating minPositive and maxPositive values therefrom from the embodiment shown in FIG. 4.
  • FIG. 6 is a view for explaining an additional test subject sample selection algorithm according to an embodiment of the present invention.
  • FIG. 7 is a view for explaining a graph derived from the embodiment shown in FIG. 4; FIG.
  • FIG. 8 is a diagram for explaining an algorithm for determining a test result of each sample according to the additional test result according to an embodiment of the present invention.
  • FIG. 9 is a diagram for describing a process of estimating a test result of each sample in the graph illustrated in FIG. 7.
  • FIG. 10 is a graph for comparing and comparing the total number of inspections when the sample collection test according to the embodiments of the present invention and the individual test for each sample are performed.
  • 11 is a graph for comparing the total number of tests according to the change in the number of positive samples present in the samples to be tested
  • FIG. 12 is a flowchart for explaining a biological sample analysis method 1200 according to an embodiment of the present invention.
  • the biological sample analysis system 100 is a system for determining whether each of the plurality of biological samples has a specific biological property (that is, a positive response to the specific property).
  • the biological sample analysis system 100 generates a plurality of pools generated by collecting a plurality of biological samples constituting an n * m matrix and samples having the same row or column in the matrix. Is used to determine whether each of the plurality of samples has a property to be inspected.
  • N and m may be the same or different, but n * m must be equal to x.
  • x is greater than or equal to 2.
  • the sample to be tested is a sample for checking whether a specific biological property is present, and may be tissues or body fluids of all living things including humans.
  • samples having the same row or column in the matrix are collected in the same pool.
  • the pool in the illustrated embodiment the P 1 samples that make up the first row of the matrix have been combined, and P n + 1, the samples are combined to configure the first column of the matrix.
  • k pooled samples P 1 , P 2 ,..., P n + m , hereinafter referred to as “pool” for convenience
  • the specific properties mean that each sample is biological, such as a genetic marker such as a specific single nucleotide polymorphism (SNP), a specific genotype in a genetic marker, a specific disease, or the like. It may be whether it has a property.
  • the strength of a signal indicating whether a specific property is retained in a sample is approximately proportional to the number of samples having a corresponding property in a pool. For example, when the number of samples having the specific property is two in the pool, the signal strength according to the test may be about twice as compared to the case of one. If the signal strength measured in a particular pool is sufficient to determine that one or more samples included in that pool have a particular property, the pool may be said to be positive for that particular property.
  • any one of a reference genotype AA, a heterozygous variant genotype AB, and a homozygous variant genotype BB may exist at a corresponding mutation position of the gene included in the sample.
  • a diploid case is illustrated as an example for easy understanding, but the present invention is not limited thereto.
  • Next generation sequencing (NGS) technology can be used to measure signals for variant genotypes.
  • the NGS technique generates a large number of reads, which are sequence fragments of constant length, for a target genomic region, which are mapped to a reference sequence and based on the sequence information of the reads mapped to a specific region. The sequence of the region will be reconstructed.
  • the genotype of a particular location of the sample to be tested can be inferred at an allele frequency at that location in the leads mapped to the region containing that location.
  • the allele frequencies of A and B will be approximately 1/2 and 1/2 respectively.
  • the allele frequencies of A and B would be approximately 1/4 and 3/4, respectively. Therefore, to test whether a sample has a specific single base mutation using NGS technology, the allele frequency of allele B present in the mutant genotypes AB and BB can be measured based on the mapped lead.
  • the allele frequency for the alternative allele B is not always observed to be 1/2 or 1. May occur. This may be due to a series of errors such as sequencing error or mapping error. Therefore, in consideration of such an error, when the allele frequency is observed between 0.4 and 0.6, the rule is determined to be genotype AB, and when it is observed above 0.8, the genotype BB is assigned to assign a test result value of the sample.
  • the SNVer algorithm Wei et al., SNVer: a statistical tool for variant calling in analysis of pooled or individual next-generation sequencing data, Nucleic Acids Res.
  • each pool 39 may be used to determine the genotype of a sample based on mapped reads. You can also use statistical algorithms to calculate likelihood or probability for genotypes (19), 2011).
  • the check value of each pool may also be determined by applying the above rule or algorithm in consideration of the number of collected samples.
  • the above rule or algorithm is only one embodiment for carrying out the present invention, and the present invention is not limited thereto.
  • the biological sample analysis system 100 includes a determination unit 102, an additional sample selection unit 104, and a test result determination unit 106.
  • the determination unit 102 determines whether or not false positive determination possibility exists according to a check value for the test target specific property of each of the plurality of pools generated from the matrix.
  • the additional sample selector 104 selects a minimum number of additional test target samples to perform individual additional tests from among the plurality of test target samples when there is a possibility of false positive determination as a result of the determination by the determination unit 102.
  • An inspection result determining unit 106 determines whether each of the plurality of samples possesses the inspection object property according to the inspection value of each of the plurality of pools and the inspection result of the additional inspection object sample.
  • the determination unit 102 determines whether there is a false positive determination possibility according to the inspection value for the inspection target specific property of each of the plurality of pools generated from the matrix. If it is determined that there is a possibility of false positive determination, an individual test on a part or all samples of the positive pool is performed.
  • the sample corresponding to the point where the positive row pool and the positive column pool cross each other in the nxm matrix is determined as positive. For example, as shown in FIG. 3, when the pools P 1 , P 5, and P 8 are positive, it is determined that the samples S 1 and S 13 are positive. If the probability of having a positive sample in the sample is low, this method is sufficient to determine the positive sample.
  • the determination unit 102 When p (k) is determined for each pool, the determination unit 102 generates a new n * m matrix M as shown in Equation 2 based on the assigned value.
  • the determination unit 102 calculates the minimum value minPositive and the maximum value maxPositive of the number of positive samples using the matrix M as shown in Equations 3 and 4 below.
  • minPositive means the minimum value of the number of positive samples that can be estimated according to the test results of each pool
  • maxPositive means the maximum value, respectively.
  • the determination unit 102 determines whether or not false positive determination is possible using the calculated maxPositive and minPositive values. Specifically, when the maxPositive value is different from the minPositive value, the determination unit 102 determines that there is a possibility of false positive determination.
  • FIG. 5 is a diagram showing the matrix M and the minPositive and maxPositive values calculated therefrom when the test results of the example illustrated in FIG. 4, that is, P 1 , P 3 , P 4 , P 5, and P 8 are positive.
  • the minPositive value is 3, which is different from the maxPositive value of 6, there is a possibility of false positive determination, and thus it may be seen that additional individual inspection of some samples is required.
  • the additional sample selecting unit 104 selects the minimum number of additional inspection target samples from which the individual additional inspection is to be performed. Select.
  • the additional sample selector 104 does not perform an individual test on all samples that are likely to be positive when there is a possibility of false positive determination, but performs an additional individual test on only the smallest number of samples possible. It is configured to. This is because the cost and time also increases as the number of additional individual tests increases. However, this is based on the premise that the strength of a signal (that is, the signal strength of each pool) indicating whether a specific property is retained in a sample is approximately proportional to the number of samples having the property in the pool. If the test results show whether there is a positive sample in the pool but it is difficult to expect the signal intensity to be approximately proportional to the number of positive samples, then individual additional tests should be performed on all samples in the positive pool. . However, even in this case, the present invention determines whether or not false positive determination is possible so that additional tests can be executed only when there is a possibility of false positive determination. Has an advantage.
  • the additional sample selecting unit 104 selects the minimum number of samples for further individual inspection.
  • the additional individual test may be the same test that was performed on the pool, or it may be a test using another technique that can measure for a particular property being tested.
  • the additional sample selecting unit 104 is configured to perform the rest of the remaining samples from the test values of the corresponding pools among the positive samples included in the positive judgment pool for each of the pools (positive judgment pools) determined to be positive according to the test values for each pool. It is configured to select the minimum number of additional test subject samples required to calculate the test results. A detailed test target selection algorithm is described in FIG. 6.
  • the additional sample selecting unit 104 is a pool (P 1 , P 3 , P 4 , P 5 , P 8 ) determined to be positive and the positive samples (S 1 , S 3 , S 4 , S derived therefrom). 13 , S 15 , and S 16 , respectively, are generated as vertices, and a graph G is generated using edges of a line connecting the positive judgment pool and the positive samples. The graph generated through the above method is shown in FIG. 7.
  • the additional sample selecting unit 104 next selects the pool having the smallest number of neighbors among the pools included in the graph, that is, the pool having the smallest possible samples, and selects the neighbors of the selected pool. Construct a configured set D.
  • the additional sample selecting unit 104 subtracts one sample from the set D and checks whether the set D is empty. If the set D is not empty even after subtracting the specific sample, the sample selecting unit 104 selects the extracted specific sample as an additional inspection target sample. For example, even after S 1 is subtracted from the set D, S 13 still remains in the set D, so the additional sample selecting unit 104 selects S 1 as an additional test target sample and excludes it from the graph G. If the set D becomes empty after subtracting a specific sample, the sample selecting unit 104 does not select the specific sample taken out from the graph G immediately. For example, after S 1 is selected, only S 13 remains in the set D, and when the subtracted, the set D becomes an empty set. Therefore, S 13 is not selected for further inspection. This process is repeated until the set D is empty, and then the process is repeated for another pool that is not selected.
  • the above process is summarized and described as follows.
  • S 1 and S 4 are selected as additional test samples from the six benign samples through the above process (marked in gray in the drawing).
  • test result determining unit 106 next checks the test values of the plurality of pools and the additional test subject sample. It is determined whether each of the plurality of samples has the property to be inspected according to the test value for the test.
  • the intensity of the signal measured for the specific property should be approximately proportional to the number of samples having the property in the pool. .
  • the test result of a particular pool must equal the sum of the test results of the positive samples in that pool.
  • the inspection result determination unit 106 determines the inspection result of each sample by using such a property. In other words, the test result determining unit 106 uses the test value of the corresponding pool and the test result of the additional test target sample included in the pool for each of the positive judgment pools. It is configured to determine whether the property to be inspected.
  • the algorithm for determining the result value in the specific test result determining unit 106 is as shown in FIG.
  • a test result value (valS in Fig. 8) of each sample can be allocated as shown in FIG.
  • the test result of the positive pool (valP in Figure 8) will be the sum of the test result of the samples that are positive in the pool.
  • the inspection result determination unit 106 may calculate the inspection value of S 3 through the inspection values of S 1 and S 4 obtained through the additional individual inspection and the inspection values of P 5 obtained through the initial inspection. Repeating this will allow us to calculate the check values for all samples.
  • the example which calculated the test value of each positive testable sample in the case of 0 is shown.
  • the test value of each benign sample can be calculated as follows.
  • the cost and time for the (x-k) tests can be reduced. If, after the k tests, there is a possibility of false positive determination on the sample that is determined to be positive, the cost and time for the (xkq) test can still be saved even if an additional individual test of q samples is required. .
  • FIG. 10 is a graph for comparing and comparing the total number of inspections when the sample collection test according to the embodiments of the present invention is performed and when each test is performed for each sample.
  • FIG. In the graph shown the horizontal axis shows the number of samples, the left bar graph shows the number of tests when individual tests are performed on each sample, and the bar graph on the right shows the number of tests when a sample collection test is performed according to an embodiment of the present invention.
  • the line graphs show the cost savings from the difference in the number of inspections in the two cases. For example, if 16 samples are tested, 16 tests are performed using the conventional method. However, the 4x4 sample collection method requires only 8 tests, which can result in a cost reduction of up to 50%.
  • 11 is a graph for comparing the total number of tests according to the change in the number of positive samples present in the samples to be tested.
  • the horizontal axis represents the number of positive samples present in the sample to be tested
  • the dotted line represents the number of tests for conventional test without pooling
  • the dark gray line If the sample collection test method is used and there is a possibility of false positive determination, all the samples are tested individually (n * n pooling test), and the light gray line uses the sample collection test method, and among the samples that may be false positive determination.
  • the number of tests is shown.
  • the sample collection method of the present invention can still expect a cost reduction effect in the general case even with an increase in the number of positive samples, and in the worst case, additionally compared with the number of inspections of the conventional test method. It can be seen that the increase in the number of tests that must be performed is insignificant.
  • the biological sample analysis method 1200 has a plurality of biological samples constituting an n * m matrix, and the same row or column in the matrix.
  • step 1202 the determination unit 102 determines whether there is a false positive determination possibility according to a check value for the test target property of each of the plurality of pools.
  • step 1204 when there is a possibility of false positive determination as the result of the determination of step 102, the additional sample selecting unit 104 performs the minimum number of additional test subject samples to be individually tested as to whether the test target property is retained among the plurality of samples. Select.
  • step 1206 the test result determining unit 106 determines whether the test target property of each of the plurality of samples is retained according to the test result of the additional test target sample.
  • embodiments of the present invention may include a computer readable recording medium including a program for performing the methods described herein on a computer.
  • the computer-readable recording medium may include program instructions, local data files, local data structures, etc. alone or in combination.
  • the media may be those specially designed and constructed for the purposes of the present invention, or they may be of the kind well-known and available to those skilled in the computer software arts.
  • Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical recording media such as CD-ROMs, DVDs, magnetic-optical media such as floppy disks, and ROM, RAM, flash memory, and the like.
  • Hardware devices specifically configured to store and execute program instructions are included.
  • Examples of program instructions may include high-level language code that can be executed by a computer using an interpreter as well as machine code such as produced by a compiler.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Epidemiology (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Hematology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Urology & Nephrology (AREA)
  • Public Health (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)

Abstract

생물학적 샘플 분석 시스템 및 방법이 개시된다. 본 발명의 일 실시예에 따른 n * m 매트릭스를 구성하는 복수 개의 생물학적 샘플들, 및 상기 매트릭스에서 동일한 행(row) 또는 열(column)을 가지는 샘플들을 수합하여 생성된 복수 개의 풀(pool)을 이용하여 상기 복수 개의 샘플들 각각의 검사 대상 성질 보유 여부를 판정하기 위한 시스템은, 상기 복수 개의 풀 각각의 상기 검사 대상 성질에 대한 검사값에 따라 위양성 판정 가능성이 존재하는지의 여부를 판단하는 판단부; 상기 판단 결과 위양성 판정 가능성이 있는 경우, 상기 복수 개의 샘플 중 상기 검사 대상 성질 보유 여부에 대한 개별 검사를 수행할 최소 개수의 추가 검사 대상 샘플을 선정하는 추가 샘플 선정부; 및 상기 추가 검사 대상 샘플에 대한 검사값에 따라 상기 복수 개의 샘플들 각각의 상기 검사 대상 성질 보유 여부를 판정하는 검사 결과 판정부를 포함한다.

Description

생물학적 샘플 분석 시스템 및 방법
본 발명의 실시예들은 생물학적 샘플을 분석하기 위한 기술과 관련된다.
혈액 샘플을 검사하여 특정 바이러스에 감염되었는지, 혹은 질병을 유발하는 특정 변이를 가지고 있는지 검사하는 예와 같이, 테스트할 대상의 생물학적 샘플이 특정 성질을 가지는지 여부를 검사하기 위해서는 일반적으로 각 대상의 샘플마다 개별적으로 검사를 실행하였다. 따라서 대량의 샘플을 검사해야 할 경우, 샘플 개수만큼의 반복 검사를 위한 시간과 비용이 필요하였다.
대량의 샘플에 대해서 같은 검사를 실행하는 가장 기본적인 방법은 각 샘플에 대해 개별적으로 검사를 실행하는 것이다. 이때 검사 비용은 검사하려는 샘플의 개수만큼 늘어나게 된다. 예를 들어, 발병률이 낮은 질병에 대한 선별 검사의 경우는 검사하는 대부분의 샘플이 음성의 결과를 나타내게 된다. 이와 같은 경우에 검사 비용을 줄이기 위해 여러 개의 샘플을 동시에 검사하기 위한 방법들이 제시되었다.
여러 개의 샘플을 동시에 검사하기 위한 종래 방법 중 하나로는, 여러 샘플을 각기 다른 비율로 합친 샘플에 검사를 시행하여 검사 결과에서 특정 성질을 나타내는 신호의 강도에 따라 합쳐진 샘플들 중 어떤 샘플이 그 성질을 가지는지를 판별하는 방법이 있다. 그러나 이 방법은 동시에 검사할 샘플의 개수가 많아질수록 많은 양의 샘플 채취가 요구된다. 예를 들어, 16개의 샘플을 동시에 검사하기 위해서는 각 시료들이 1:2:22:23:…:214:215 비율로 합쳐지게 된다. 이 경우, 마지막 샘플은 첫 번째 샘플보다 무려 215(=32,768)배나 많은 양이 필요하게 되는데 이를 실제에 적용하기는 거의 불가능하다.
본 발명의 실시예들은 다수 개의 생물학적 샘플에 대하여 특정 성질이 나타나는지의 여부를 검사할 경우의 검사 회수를 최소화하기 위한 수단을 제공하기 위한 것이다.
본 발명의 일 측면에 따르면, n * m 매트릭스를 구성하는 복수 개의 생물학적 샘플들, 및 상기 매트릭스에서 동일한 행(row) 또는 열(column)을 가지는 샘플들을 수합하여 생성된 복수 개의 풀(pool)을 이용하여 상기 복수 개의 샘플들 각각의 검사 대상 성질 보유 여부를 판정하기 위한 시스템으로서, 상기 복수 개의 풀 각각의 상기 검사 대상 성질에 대한 검사값에 따라 위양성 판정 가능성이 존재하는지의 여부를 판단하는 판단부; 상기 판단 결과 위양성 판정 가능성이 있는 경우, 상기 복수 개의 샘플 중 상기 검사 대상 성질 보유 여부에 대한 개별 검사를 수행할 최소 개수의 추가 검사 대상 샘플을 선정하는 추가 샘플 선정부; 및 상기 추가 검사 대상 샘플에 대한 검사 결과에 따라 상기 복수 개의 샘플들 각각의 상기 검사 대상 성질 보유 여부를 판정하는 검사 결과 판정부를 포함하는 생물학적 샘플 분석 시스템이 개시된다.
상기 판단부는, 상기 복수 개의 풀 각각의 상기 검사값에 따라 상기 복수 개의 샘플들 중 양성 가능 샘플의 개수를 추정하고, 추정된 상기 양성 가능 샘플의 개수에 따라 상기 위양성 판정 가능성 존재 여부를 판단할 수 있다.
상기 판단부는, 추정된 상기 양성 가능 샘플 개수의 최대값 및 최소값이 상이한 경우, 위양성 판정 가능성이 존재하는 것으로 판단할 수 있다.
상기 추가 샘플 선정부는, 상기 검사값이 양성으로 판정된 풀 각각에 대하여, 상기 양성 판정 풀에 포함된 양성 가능 샘플 중 해당 풀의 검사값으로부터 나머지 샘플의 검사 결과를 계산하는 데 필요한 최소 개수의 추가 검사 대상 샘플을 선정할 수 있다.
상기 추가 샘플 선정부는, 상기 양성 판정 풀 중 포함된 양성 가능 샘플의 개수가 가장 작은 양성 판정 풀부터 순차적으로 상기 추가 검사 대상 샘플을 선정할 수 있다.
상기 검사 결과 판정부는, 상기 양성 판정 풀 각각에 대하여, 해당 풀의 검사값 및 해당 풀에 포함된 추가 검사 대상 샘플의 검사값을 이용하여 해당 풀에 포함된 나머지 양성 가능 샘플의 상기 검사 대상 성질 보유 여부를 판정할 수 있다.
또한 본 발명의 다른 측면에 따르면, n * m 매트릭스를 구성하는 복수 개의 생물학적 샘플들, 및 상기 매트릭스에서 동일한 행(row) 또는 열(column)을 가지는 샘플들을 수합하여 생성된 복수 개의 풀(pool)을 이용하여 상기 복수 개의 샘플들 각각의 검사 대상 성질 보유 여부를 판정하기 위한 방법으로서, 판단부에서, 상기 복수 개의 풀 각각의 상기 검사 대상 성질에 대한 검사값에 따라 위양성 판정 가능성이 존재하는지의 여부를 판단하는 단계; 추가 샘플 선정부에서, 상기 판단 결과 위양성 판정 가능성이 있는 경우, 상기 복수 개의 샘플 중 상기 검사 대상 성질 보유 여부에 대한 개별 검사를 수행할 최소 개수의 추가 검사 대상 샘플을 선정하는 단계; 및 검사 결과 판정부에서, 상기 추가 검사 대상 샘플에 대한 검사 결과에 따라 상기 복수 개의 샘플들 각각의 상기 검사 대상 성질 보유 여부를 판정하는 단계를 포함하는 생물학적 샘플 분석 방법이 개시된다.
상기 판단 단계는, 상기 복수 개의 풀 각각의 상기 검사값에 따라 상기 복수 개의 샘플들 중 양성 가능 샘플의 개수를 추정하고, 추정된 상기 양성 가능 샘플의 개수에 따라 상기 위양성 판정 가능성 존재 여부를 판단할 수 있다.
상기 판단 단계는, 추정된 상기 양성 가능 샘플 개수의 최대값 및 최소값이 상이한 경우, 위양성 판정 가능성이 존재하는 것으로 판단할 수 있다.
상기 추가 샘플 선정 단계는, 상기 검사값에 따라 양성으로 판정된 풀 각각에 대하여, 상기 양성 판정 풀에 포함된 양성 가능 샘플 중 해당 풀의 검사값으로부터 나머지 샘플의 검사 결과를 계산하는 데 필요한 최소 개수의 추가 검사 대상 샘플을 선정할 수 있다.
상기 추가 샘플 선정 단계는, 상기 양성 판정 풀 중 포함된 양성 가능 샘플의 개수가 가장 작은 양성 판정 풀부터 순차적으로 상기 추가 검사 대상 샘플을 선정할 수 있다.
상기 검사 대상 성질 보유 여부를 판정하는 단계는, 상기 양성 판정 풀 각각에 대하여, 해당 풀의 검사값 및 해당 풀에 포함된 추가 검사 대상 샘플의 검사값을 이용하여 해당 풀에 포함된 나머지 양성 가능 샘플의 상기 검사 대상 성질 보유 여부를 판정할 수 있다.
본 발명의 실시예들에 따를 경우 검사하고자 하는 하나 이상의 샘플들을 모아 풀(pool)을 구성한 뒤 각 풀의 검사 결과를 바탕으로 각 샘플들의 개별 검사 결과를 계산하므로 모든 샘플들에 대해 개별적으로 검사를 수행할 때 보다 검사 회수를 감소시키면서도 동일한 결과를 얻을 수 있다.
또한, 본 발명의 실시예들에 따를 경우 샘플 수합 방법에 의한 검사 결과 위양성 판정 가능성이 있는 경우에도 추가로 개별 검사를 수행하여야 할 샘플의 개수를 최소화할 수 있게 되는 바, 검사에 따르는 시간과 비용을 최소화하면서도 위양성 판정 가능성이 없는 정확한 검사 결과를 얻을 수 있다.
도 1은 본 발명의 일 실시예에 따른 샘플 수합(pooling) 과정을 설명하기 위한 도면
도 2는 본 발명의 일 실시예에 따른 생물학적 샘플 분석 시스템(100)을 나타낸 블록도
도 3 및 도 4는 본 발명의 일 실시예에 따른 샘플 수합 분석 방법에 따른 양성 샘플 추정 방법을 설명하기 위한 도면
도 5는 도 4에 도시된 실시예로부터 매트릭스 M 생성 및 이로부터 minPositive, maxPositive 값 계산하는 과정을 설명하기 위한 도면
도 6은 본 발명의 일 실시예에 따른 추가 검사 대상 샘플 선정 알고리즘을 설명하기 위한 도면
도 7은 도 4에 도시된 실시예로부터 도출된 그래프를 설명하기 위한 도면
도 8은 본 발명의 일 실시예에 따른 추가 검사 결과에 따라 각 샘플의 검사 결과를 판정하기 위한 알고리즘을 설명하기 위한 도면
도 9는 도 7에 도시된 그래프에서 각 샘플의 검사 결과를 추정하는 과정을 설명하기 위한 도면
도 10은 본 발명의 실시예들에 따른 샘플 수합 검사를 수행했을 때와 각 샘플에 대해 개별 검사를 했을 때의 총 검사 회수를 비교하여 설명하기 위한 그래프
도 11은 검사 대상 샘플들에 존재하는 양성 샘플 개수의 변화에 따른 총 검사 회수를 비교하기 위한 그래프
도 12는 본 발명의 일 실시예에 따른 생물학적 샘플 분석 방법(1200)을 설명하기 위한 흐름도
이하, 도면을 참조하여 본 발명의 구체적인 실시형태를 설명하기로 한다. 그러나 이는 예시에 불과하며 본 발명은 이에 제한되지 않는다.
본 발명을 설명함에 있어서, 본 발명과 관련된 공지기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하기로 한다. 그리고, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
본 발명의 기술적 사상은 청구범위에 의해 결정되며, 이하의 실시예는 본 발명의 기술적 사상을 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 효율적으로 설명하기 위한 일 수단일 뿐이다.
본 발명의 일 실시예에 따른 생물학적 샘플 분석 시스템(100)은 복수 개의 생물학적 샘플 각각이 특정 생물학적 성질을 가지는지(다시 말해 상기 특정 성질에 양성 반응을 보이는지)의 여부를 판정하기 위한 시스템이다. 구체적으로, 생물학적 샘플 분석 시스템(100)은 n * m 매트릭스를 구성하는 복수 개의 생물학적 샘플들 및 상기 매트릭스에서 동일한 행(row) 또는 열(column)을 가지는 샘플들을 수합하여 생성된 복수 개의 풀(pool)을 이용하여 상기 복수 개의 샘플들 각각의 검사 대상 성질 보유 여부를 판정하도록 구성된다.
상기와 같은 생물학적 샘플 분석 시스템(100)의 각 구성요소들을 설명하기에 앞서, 검사 대상 샘플로부터 풀을 구성하는 과정을 설명하면 도 1과 같다. 먼저, x개(x = n * m)의 검사 대상 샘플(S1, S2, ..., Sn*m)을 n * m 매트릭스 상에 배열한다. 이때 n과 m은 같을 수도 있고 다를 수도 있으나, n * m 은 x와 같아야 한다. 또한 x는 2보다 크거나 같다. 상기 검사 대상 샘플은 특정한 생물학적 성질을 가지는지의 여부를 검사하기 위한 시료로써, 인간을 포함한 모든 생물의 조직 또는 체액 등일 수 있다.
상기와 같이 매트릭스가 구성되면, 다음으로 매트릭스상에 배열된 x개의 검사 대상 샘플을 k(= n + m)개의 풀(pool)에 나누어 수합(pooling)한다. 이때 상기 매트릭스에서 동일한 행 또는 열을 가지는 샘플들은 동일한 풀에 수합된다. 예를 들어, 도시된 실시예에서 풀 P1에는 매트릭스의 첫번째 행을 구성하는 샘플들이 수합되고, Pn+1에는 매트릭스의 첫번째 열을 구성하는 샘플들이 수합한다. 이와 같은 과정을 통하여 k개의 풀링된 샘플(P1, P2, …, Pn+m, 이하에서는 편의상 "풀"로 줄여 표기)이 생성된다.
다음으로, 각 샘플들이 수합된 k개의 풀에 대해 검사를 수행하여 검사할 특정 성질에 대한 신호를 측정한다. 본 발명의 실시예에서 특정 성질이란, 각 샘플들이 특정 단일염기변이(Single Nucleotide Polymorphism; SNP)와 같은 유전자적 표지자(Genetic marker), 유전자적 표지자에서의 특정 유전형(genotype), 특정 질병 등과 같은 생물학적 특성을 보유하고 있는지의 여부일 수 있다. 상기 검사에서는 샘플 내 특정 성질의 보유 여부를 의미하는 신호의 세기가 풀 내에 해당 성질을 가지는 샘플의 개수와 대략 비례하여 나타난다. 예를 들어, 풀 내에 상기 특정 성질을 가지는 샘플의 개수가 2개인 경우에는 1개인 경우와 비교하여 상기 검사에 따른 신호 세기가 약 2배가 될 수 있다. 만약 특정 풀에서 측정된 신호 세기가 해당 풀에 포함된 하나 이상의 샘플이 특정 성질을 가진다고 판단할 수 있을 만큼 충분하다면, 해당 풀은 상기 특정 성질에 양성(positive)이라고 말할 수 있다.
예를 들어, 상기 검사가 샘플들의 특정 단일염기변이 보유 여부를 검사하는 것이라고 가정하자. 이 경우 샘플에 포함된 유전자의 해당 변이 위치에는 참조 유전자형인 AA, 이형접합(Heterozygous) 변이 유전자형인 AB, 동형접합(Homozygous) 변이 유전자형인 BB 중 어느 하나가 존재할 수 있다. 본 예에서는 이해가 용이하도록 이배체(diploid) 경우를 예로 들었으나, 본 발명이 이에 한정되는 것은 아니다. 또한 변이 유전자형에 대한 신호를 측정하는 방법으로 차세대 시퀀싱(Next Generation Sequencing; 이하, NGS) 기술을 사용할 수 있다. NGS기술은 타겟으로 하는 유전체 영역에 대해 일정한 길이의 서열 조각인 리드들을 대량으로 만들어내는데, 이렇게 생성된 리드들은 참조 서열(reference sequence)에 맵핑되고, 특정 영역에 맵핑된 리드들의 서열 정보를 바탕으로 해당 영역의 서열을 재구성하게 된다.
상기 예에서, 검사 대상 샘플의 특정 위치의 유전자형은 해당 위치를 포함한 영역에 맵핑된 리드들에서의 해당 위치에서의 대립형질빈도(allele frequency)로 유추될 수 있다. 예를 들어, 이형접합(Heterozygous) 유전자형인 AB의 경우 A와 B의 대립유전자빈도는 대략 각각 1/2, 1/2로 관찰될 것이다. 또한, 유전자형이 AB인 샘플과 BB인 샘플을 수합하였을 경우, A와 B의 대립유전자빈도는 대략 각각 1/4, 3/4으로 관찰될 것이다. 따라서 NGS 기술을 이용하여 샘플이 특정 단일염기변이를 가지고 있는지 검사하기 위해서는, 변이 유전자형인 AB와 BB에 존재하는 대립형질 B의 대립형질빈도를 맵핑된 리드 기반으로 측정하면 된다.
한편, NGS 기술을 이용해 맵핑된 리드들을 기반으로 대립형질빈도를 구할 경우, 이배수체인 샘플의 유전형이 AB일때 대체대립형질 B에 대한 대립형질빈도가 항상 1/2 혹은 1로 관찰되지 않는 경우가 발생할 수 있다. 이는 시퀀싱 에러 또는 맵핑 에러와 같은 일련의 에러들에 기인한 것일 수 있다. 따라서 이와 같은 오류를 감안하여 대립형질빈도가 0.4와 0.6 사이로 관찰될 때에는 유전형 AB로 판정하고 0.8이상으로 관찰될 때 유전형 BB로 판정하여 샘플의 검사 결과값을 할당하도록 하는 규칙을 적용할 수 있다. 또는, 맵핑된 리드 기반으로 샘플의 유전형을 판단하기 위한 다른 방법으로 SNVer 알고리즘(Wei et al., SNVer: a statistical tool for variant calling in analysis of pooled or individual next-generation sequencing data, Nucleic Acids Res. 39(19), 2011)과 같이 유전형에 대한 가능성(likelihood)이나 확률(probability)을 계산하는 통계적 알고리즘을 사용할 수도 있다. 각각의 풀의 검사값 역시 수합된 샘플의 개수를 고려하여 상기 규칙 또는 알고리즘을 적용하여 판정할 수 있다. 다만 상기 규칙 또는 알고리즘은 본 발명의 수행을 위한 하나의 실시예에 불과하며, 본 발명이 이에 한정되지는 않는다.
또한, NGS 기술이 본 발명에 용이하게 적용되기 위해서는 각 풀(pool)을 시퀀싱한 결과에서 해당 풀에 수합된 각 샘플의 시퀀싱 리드들이 대략 균등하게 분포한다는 조건이 만족되어야 한다. 예를 들어, 수합된 4개의 샘플이 각각 유전형 AA, AB, AB, AA를 가진다면, 해당 Pool에서 대체대립형질 B에 대한 대립형질빈도는 대략 2/8로 관찰되어야 할 것이다.
도 2는 본 발명의 일 실시예에 따른 생물학적 샘플 분석 시스템(100)을 나타낸 블록도이다. 도시된 바와 같이, 본 발명의 일 실시예에 따른 생물학적 샘플 분석 시스템(100)은 판단부(102), 추가 샘플 선정부(104) 및 검사 결과 판정부(106)를 포함한다.
판단부(102)는 상기 매트릭스로부터 생성된 상기 복수 개의 풀 각각의 상기 검사 대상 특정 성질에 대한 검사값에 따라 위양성 판정 가능성이 존재하는지의 여부를 판단한다.
추가 샘플 선정부(104)는 판단부(102)의 판단 결과 위양성 판정 가능성이 존재하는 경우, 상기 복수 개의 검사 대상 샘플 중 개별 추가 검사를 수행할 최소 개수의 추가 검사 대상 샘플을 선정한다.
검사 결과 판정부(106)는 상기 복수 개의 풀 각각의 검사값 및 상기 추가 검사 대상 샘플에 대한 검사 결과에 따라 상기 복수 개의 샘플들 각각의 상기 검사 대상 성질 보유 여부를 판정한다.
이하에서는 상기와 같이 구성된 본 발명의 일 실시예에 따른 생물학적 샘플 분석 시스템(100)의 각 구성요소들을 상세히 설명한다.
위양성 판정 가능성 여부 판단
전술한 바와 같이, 판단부(102)는 상기 매트릭스로부터 생성된 상기 복수 개의 풀 각각의 상기 검사 대상 특정 성질에 대한 검사값에 따라 위양성 판정 가능성이 존재하는지의 여부를 판단한다. 만약 상기 판단 결과 위양성 판정의 가능성이 있다고 판단될 경우에는, 양성인 풀의 일부 혹은 전체 샘플에 대한 개별 검사를 시행하게 된다.
본 발명의 일 실시예에 따른 n x m 수합 방법에서는 n x m 매트릭스에서 양성인 가로열 풀과 양성인 세로열 풀이 교차되는 지점에 해당하는 샘플을 양성으로 판정하게 된다. 예를 들어, 도 3에 도시된 바와 같이 풀 P1, P5 및 P8이 양성일 경우에는 샘플 S1 및 S13이 양성인 것으로 판정된다. 만약 샘플 중 양성인 샘플이 존재할 확률이 낮다면 이와 같은 방법으로도 양성 샘플을 판정하기에 충분하다.
한편, 도 4에 도시된 바와 같이 샘플 S1, S15, S16이 실제로 양성일 경우에는 풀 P1, P3, P4, P5 및 P8의 검사 결과가 양성으로 관찰될 것이다. 그러나 전술한 방법대로라면 샘플 S1, S3, S4, S13, S15 및 S16이 양성으로 판정될 것이며, 이중 S3, S4, S13은 잘못 판정된 것이다(즉, 위양성 샘플). 따라서 각 풀의 검사 결과에 따라서 위양성 샘플의 존재 가능성 여부를 판단할 필요가 있다.
본 발명의 실시예에서, 판단부(102)는 상기 복수 개의 풀 각각의 검사값에 따라 상기 복수 개의 샘플들 중 양성 가능 샘플의 개수를 추정하고, 추정된 상기 양성 가능 샘플의 개수에 따라 상기 위양성 판정 가능성 존재 여부를 판단한다. 먼저, 판단부(102)는 각 풀의 측정값을 바탕으로 풀 k (1 < = k <= n+m)의 값 p(k)를 수학식 1과 같이 할당한다.
수학식 1
Figure PCTKR2014008167-appb-M000001
각각의 풀에 대하여 p(k)가 정해지면, 다음으로 판단부(102)는 할당된 값을 바탕으로 수학식 2와 같이 새로운 n * m 매트릭스 M을 생성한다.
수학식 2
Figure PCTKR2014008167-appb-M000002
Figure PCTKR2014008167-appb-I000001
이후, 판단부(102)는 상기 매트릭스 M을 이용하여 양성 가능 샘플 개수의 최소값(minPositive)과 최대값(maxPositive)을 수학식 3 및 4와 같이 계산한다. 이때 minPositive는 각 풀들의 검사 결과에 따라 추정 가능한 양성 샘플 개수의 최소값을, maxPositive는 최대값을 각각 의미한다.
수학식 3
Figure PCTKR2014008167-appb-M000003
수학식 4
Figure PCTKR2014008167-appb-M000004
판단부(102)는 계산된 상기 maxPositive 및 minPositive 값을 이용하여 위양성 판정 가능성 여부를 판단한다. 구체적으로, 판단부(102)는 maxPositive 값이 minPositive 값과 상이한 경우, 위양성 판정 가능성이 존재하는 것으로 판단하게 된다.
도 5는 도 4에 도시된 실시예, 즉 P1, P3, P4, P5 및 P8의 검사 결과가 양성인 경우의 매트릭스 M 및 이로부터 계산된 minPositive, maxPositive 값을 나타낸 도면이다. 도시된 바와 같이, 본 실시예의 경우 minPositive 값이 3으로 maxPositive 값인 6과 상이하므로 위양성 판정 가능성이 존재하는 바, 일부 샘플에 대한 추가 개별 검사가 필요함을 알 수 있다.
개별 추가 검사를 위한 최소 샘플 선정
상술한 바와 같이, 판단부(102)의 판단 결과 위양성 판정 가능성이 존재하는 경우, 추가 샘플 선정부(104)는 상기 복수 개의 검사 대상 샘플 중 개별 추가 검사를 수행할 최소 개수의 추가 검사 대상 샘플을 선정한다.
본 발명의 실시예에서 추가 샘플 선정부(104)는 위양성 판정 가능성이 있을 경우에 양성일 가능성이 있는 모든 샘플에 대하여 개별 검사를 수행하는 것이 아니라, 가능한 최소 개수의 샘플만을 대상으로 추가적인 개별 검사를 수행하도록 구성된다. 추가 개별 검사를 하는 샘플의 수가 늘어날수록 그 비용과 시간은 또한 증가하기 때문이다. 그러나 이는 샘플 내 특정 성질의 보유 여부를 의미하는 신호의 세기(즉, 각 풀의 신호 세기)가 풀 내에 해당 성질을 가지는 샘플의 개수와 대략 비례하여 나타날 경우를 전제로 한다. 만약, 검사 결과에서 풀 내 양성 샘플의 존재 여부는 알 수 있으나 신호의 세기가 양성 샘플의 개수와 대략 비례하여 나타나는 것을 기대하기 어려울 경우는, 양성인 풀 내의 모든 샘플에 대해 개별 추가 검사를 실행하여야 한다. 다만, 이 경우에도 본 발명은 위양성 판정 가능성이 있을 경우에만 추가 검사를 실행할 수 있도록 위양성 판정 가능성 여부를 판별하는 바, 항상 모든 양성 가능 샘플에 대해 추가 검사를 수행하는 종래 기술에 비해 비용 및 시간상의 장점을 가진다.
위양성 판정 가능성이 있다고 판단될 경우, 추가 샘플 선정부(104)는 추가 개별 검사를 할 최소 개수의 샘플을 선정한다. 상기 추가 개별 검사는 풀에 수행했던 동일한 검사일 수도 있고, 검사 대상인 특정 성질에 대해 측정할 수 있는 다른 기술을 이용한 검사일 수도 있다.
추가 샘플 선정부(104)는 각 풀에 대한 검사값에 따라 양성으로 판정된 풀(양성 판정 풀) 각각에 대하여, 상기 양성 판정 풀에 포함된 양성 가능 샘플 중 해당 풀의 검사값으로부터 나머지 샘플의 검사 결과를 계산하는 데 필요한 최소 개수의 추가 검사 대상 샘플을 선정하도록 구성된다. 구체적인 추가 검사 대상 샘플 선정 알고리즘을 기재하면 도 6과 같다.
도 4에 도시된 예를 이용하여 도 6에 기재된 알고리즘을 설명하면 다음과 같다. 먼저, 추가 샘플 선정부(104)는 양성으로 판정된 풀(P1, P3, P4, P5, P8) 및 이로부터 도출된 양성 가능 샘플(S1, S3, S4, S13, S15, S16)을 각각 정점(vertex)으로 하고, 양성 판정 풀 및 양성 가능 샘플들을 연결한 선을 에지(edge)로 하는 그래프 G를 생성한다. 상기 방법을 통하여 생성된 그래프를 도 7에 나타내었다.
그래프 G가 생성되면, 다음으로 추가 샘플 선정부(104)는 그래프에 포함된 풀 중 이웃(neighbor)의 개수가 가장 적은 풀, 즉 양성 가능 샘플이 가장 적은 풀을 선택하고, 선택된 풀의 이웃으로 구성된 집합 D를 구성한다. 도시된 실시예에서 이웃의 개수가 가장 적은 풀은 이웃이 2개인 P1, P3 및 P4이므로 이 중 하나인 P1을 선택한다. 그러면 D = {S1, S13}이 된다.
이후, 추가 샘플 선정부(104)는 집합 D에서 하나의 샘플을 빼고, 집합 D가 비어있는지의 여부를 검사한다. 만약 특정 샘플을 뺀 이후에도 집합 D가 비어 있지 않은 경우, 샘플 선정부(104)는 빼낸 상기 특정 샘플을 추가 검사 대상 샘플로 선정한다. 예를 들어, 상기 집합 D에서 S1을 뺀 이후에도 집합 D에는 여전히 S13이 남아 있으므로, 추가 샘플 선정부(104)는 S1을 추가 검사 대상 샘플로 선정하고 그래프 G에서 제외한다. 만약 특정 샘플을 뺀 이후 집합 D가 비게 되는 경우, 샘플 선정부(104)는 빼낸 상기 특정 샘플을 선정하지 않고 바로 그래프 G에서 제외한다. 예를 들어 상기 S1이 선정된 이후, 집합 D에는 S13만이 남게 되며 이를 뺄 경우 집합 D는 빈 집합이 된다. 따라서 S13은 추가 검사 대상 샘플로 선정되지 않는다. 이와 같은 과정은 상기 집합 D가 빌 때까지 반복되며, 이후에는 선택되지 않은 다른 풀에 대하여 상기 과정을 반복한다. 상기 과정들을 순차적으로 요약하여 기재하면 다음과 같다.
1. P1 선택 (select P1)
2. S1을 추가 검사 대상 샘플로 선정 (select S1 for individual test)
3. S13 미선정 (skip S13)
4. P4 선택 (select P4)
5. S4를 추가 검사 대상 샘플로 선정 (select S4 for individual test)
6. S16 미선정 (skip S16)
7. P5 선택 (select P5)
8. S3 미선정 (skip S3)
9. P8 선택 (select P8)
10. S15 미선정 (skip S15)
11. P3 선택 (select P3)
12. 완료 (done)
즉, 상기 과정을 통하여 6개의 양성 가능 샘플 중 S1 및 S4가 추가 검사 대상 샘플로 선정된다(도면에도 회색으로 표기).
개별 샘플의 검사 결과 판정
상기와 같은 과정을 통하여 추가 검사 대상 샘플이 선정되고, 선정된 샘플에 대한 추가 검사가 완료되면, 다음으로 검사 결과 판정부(106)는 상기 복수 개의 풀 각각의 검사값 및 상기 추가 검사 대상 샘플에 대한 검사값에 따라 상기 복수 개의 샘플들 각각의 상기 검사 대상 성질 보유 여부를 판정한다.
전술한 바와 같이, 검사 결과 판정부(106)에서의 검사 결과 판정을 위해서는 특정 풀을 검사했을 때 특정 성질에 대한 측정되는 신호의 세기가 풀 내에 해당 성질을 가지는 샘플의 개수와 대략 비례하여 나타나야 한다. 특정 풀의 검사 결과값은 해당 풀에 포함된 양성인 샘플들의 검사 결과값의 합과 같아야 한다. 검사 결과 판정부(106)는 이와 같은 성질을 이용하여 각 샘플들의 검사 결과를 판정한다. 다시 말해 상기 검사 결과 판정부(106)는 양성 판정 풀 각각에 대하여, 해당 풀의 검사값 및 해당 풀에 포함된 추가 검사 대상 샘플의 검사 결과를 이용하여 해당 풀에 포함된 나머지 양성 가능 샘플의 상기 검사 대상 성질 보유 여부를 판정하도록 구성된다. 구체적인 검사 결과 판정부(106)에서의 결과값을 판정 알고리즘은 도 8에 도시된 바와 같다.
도면 4의 예를 들어 설명하면, 대체대립형질(alternative allele) B에 대한 대립형질빈도를 기반으로 하여 참조 유전자형인 AA일 경우는 0, 이형접합(Heterozygous) 변이 유전자형인 AB일 경우는 1, 동형접합(Homozygous) 변이 유전자형인 BB일 경우는 2와 같이 각 샘플의 검사 결과값(도면 8의 valS) 을 할당할 수 있다. 이 경우, 양성인 풀의 검사 결과값(도면 8의 valP)은 해당 풀 내에 양성인 샘플의 검사결과값의 합이 될 것이다. 예를 들어, P5의 검사값, 즉 신호 세기는 S1, S3, S4 검사값의 합이 될 것이다 (valP[5] = valS[1] + valS[3] + valS[4]). 이를 이용하여, 검사 결과 판정부(106)는 추가 개별 검사를 통해 얻어진 S1과 S4의 검사값과 초기 검사를 통해 얻어진 P5의 검사값을 통해 S3의 검사값을 계산할 수 있다. 이를 반복하면 모든 샘플들에 대한 검사값을 계산할 수 있게 된다.
도 9는 P1, P3, P4, P5, P8의 검사값이 각각 2, 1, 1, 2, 2이고, 추가 검사 대상 샘플인 S1, S4의 검사값이 각각 2, 0인 경우의 각각의 양성 가능 샘플들의 검사값을 계산한 예를 나타낸 것이다. 도시된 바와 같이, 각 양성 가능 샘플들의 검사값은 다음과 같이 계산될 수 있다.
valS[S3] = valP[P5] - valS[S1] - valS[S4] = 2 - 2 - 0 = 0
valS[S13] = valP[P1] - valS[S1] = 2 - 2 = 0
valS[S16] = valP[P4] - valS[S4] = 1 - 0 = 1
valS[S15] = valP[P8] - valS[S13] - valS[S16] = 2 - 0 - 1 = 1
이와 같이 본 발명의 실시예에 따르면, 위와 같은 샘플들의 풀링을 통하여 x개의 샘플에 대한 x번의 개별적인 검사를 수행하는 대신, k개의 풀에 대하여 k번의 검사만을 수행하며, 이를 바탕으로 x개의 샘플에 대한 개별 검사 결과를 추정할 수 있게 된다. 즉, 본 발명의 실시예들에 따를 경우, k번의 검사로 x개의 모든 샘플에 대한 검사 결과를 추정할 수 있는 바, (x-k)번의 검사에 대한 비용 및 시간을 절감할 수 있다. 만약 상기 k번의 검사 이후, 양성으로 판정된 샘플에 위양성(false positive) 판정 가능성이 있어서 q개의 샘플에 대한 추가적인 개별 검사가 필요할 경우에도 여전히 (x-k-q)번의 검사에 대한 비용 및 시간을 절감할 수 있다.
도 10은 본 발명의 실시예들에 따른 샘플 수합 검사를 수행했을 때와 각 샘플에 대해 개별 검사를 했을 때의 총 검사 회수를 비교하여 설명하기 위한 그래프이다. 도시된 그래프에서 가로축은 샘플의 개수, 왼쪽의 막대 그래프는 각 샘플에 대해 개별 검사를 수행했을 때의 검사 회수, 오른쪽의 막대 그래프는 본 발명의 실시예에 따른 샘플 수합 검사 시의 검사 회수를, 선그래프는 두 가지 경우의 검사 회수 차이에 따른 비용 절감 효과를 각각 나타낸 것이다. 예를 들어, 16개 샘플을 검사할 경우 기존의 방법으로는 16번의 검사를 수행하지만, 4x4 샘플 수합 방법을 이용하면 8번의 검사만 수행하면 되므로 최대 50%의 비용 절감 효과를 기대할 수 있다.
샘플 수합 방법의 경우는, 수합된 샘플에 검사를 시행하고 위양성 판정 가능성이 있는 샘플의 경우는 추가적으로 개별 검사를 시행하게 되므로 최악의 경우는 기존 방법보다 많은 회수의 검사를 시행하게 될 수도 있다. 도 11은 검사 대상 샘플들에 존재하는 양성 샘플 개수의 변화에 따른 총 검사 회수를 비교하기 위한 그래프이다. 도시된 그래프에서 가로축은 검사 대상 샘플 중에 존재하는 양성 샘플의 개수를, 점선은 각 샘플에 대해 개별 검사를 수행하는 기존의 방법을 사용할 경우(conventional test without pooling)의 검사 회수를, 짙은 회색선은 샘플 수합 검사 방법을 사용하고 위양성 판정 가능성이 있을 경우에는 해당 모든 샘플에 개별 검사를 하는 경우(n*n pooling test)를, 옅은 회색선은 샘플 수합 검사 방법을 사용하고 위양성 판정 가능성이 있는 샘플 중 개별 검사할 최소 개수의 샘플을 선정하는 방법을 함께 사용할 경우(n*n pooling test + Min. # of sample selection)의 검사 회수를 각각 나타낸다.
또한, 도 11에 도시된 그래프 중 (a)는 16개 샘플을 4*4 샘플 수합 방법을 사용하여 검사할 경우, (b)는 64개 샘플은 8*8 샘플 수합 방법을 사용하여 검사할 경우를 각각 나타낸다. 비교를 위하여, 각 양성 샘플 개수마다 검사 대상 샘플 중 양성 샘플을 랜덤하게 발생시킨 100개의 테스트 케이스를 만들고 각 테스트 케이스마다의 검사 회수를 계산하였다. 도면에서는 100개 테스트 케이스에서의 평균 검사 회수와 이에 대한 표준 편차(그래프에 I자 형태로 표시)를 함께 표시하였다.
먼저, 도 11(a)를 보면, 16개 샘플에 존재하는 양성 샘플의 개수가 3개까지는 위양성 판정 가능성이 있는 샘플 모두에 추가 검사를 하더라도 종래의 방법(점선)보다 적은 회수의 검사를 수행하게 됨을 알 수 있다. 질병 검사를 예로 들면, 일반적으로는 해당 질병의 발병률이 대략 3/16(=0.188)이 경우에 16개 샘플 중 3개의 샘플이 양성이 될 것을 기대할 수 있다. 그러나 이는 매우 높은 발병률로, 일반적인 경우에는 이보다 더 낮기 때문에 실제로는 샘플 수합 방법을 이용하는 것이 일반적으로는 검사 비용의 절감 효과를 가져다 줄 수 있다. 또한, 본 발명의 실시예에 따른 최소 추가 개별 검사 대상 샘플 선정 알고리즘을 적용하면 그렇지 않을 경우보다 검사 회수 감소에 따른 14-30% 정도의 비용 절감을 기대할 수 있음을 알 수 있다.
또한, 도 11(b)의 결과를 보면, 64개 샘플이 모두 양성인 최악의 경우에 본 발명의 실시예에 따른 알고리즘을 적용하지 않을 경우는 80번의 검사를 수행해야 하지만, 적용하는 경우는 65번의 검사만 수행하면 됨을 알 수 있다. 즉, 최악의 경우에도, 본 발명에 따를 경우 기존의 방법보다 1번의 검사만 더 수행하면 된다.
결론적으로, 도 11의 결과를 통해 본 발명이 제시하는 샘플 수합 방법은 양성 샘플 개수의 증가에도 일반적인 경우에는 비용 절감 효과를 여전히 기대할 수 있으며, 최악의 경우에도 기존 검사 방법의 검사 회수와 비교할 때 추가적으로 실행해야 하는 검사 회수의 증가가 미미함을 알 수 있다.
도 12는 본 발명의 일 실시예에 따른 생물학적 샘플 분석 방법(1200)을 설명하기 위한 흐름도이다. 전술한 바와 같이, 본 발명의 일 실시예에 따른 생물학적 샘플 분석 방법(1200)은 n * m 매트릭스를 구성하는 복수 개의 생물학적 샘플들, 및 상기 매트릭스에서 동일한 행(row) 또는 열(column)을 가지는 샘플들을 수합하여 생성된 복수 개의 풀(pool)을 이용하여 상기 복수 개의 샘플들 각각의 검사 대상 성질 보유 여부를 판정하기 위한 방법이다.
단계 1202에서, 판단부(102)는 상기 복수 개의 풀 각각의 상기 검사 대상 성질에 대한 검사값에 따라 위양성 판정 가능성이 존재하는지의 여부를 판단한다.
단계 1204에서, 추가 샘플 선정부(104)는 상기 102 단계의 판단 결과 위양성 판정 가능성이 있는 경우, 상기 복수 개의 샘플 중 상기 검사 대상 성질 보유 여부에 대한 개별 검사를 수행할 최소 개수의 추가 검사 대상 샘플을 선정한다.
단계 1206에서, 검사 결과 판정부(106)는 상기 추가 검사 대상 샘플에 대한 검사 결과에 따라 상기 복수 개의 샘플들 각각의 상기 검사 대상 성질 보유 여부를 판정한다.
한편, 본 발명의 실시예들은 본 명세서에서 기술한 방법들을 컴퓨터상에서 수행하기 위한 프로그램을 포함하는 컴퓨터 판독 가능 기록매체를 포함할 수 있다. 상기 컴퓨터 판독 가능 기록매체는 프로그램 명령, 로컬 데이터 파일, 로컬 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야에서 통상의 지식을 가진 자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광 기록 매체, 플로피 디스크와 같은 자기-광 매체, 및 롬, 램, 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다.
이상에서 대표적인 실시예를 통하여 본 발명에 대하여 상세하게 설명하였으나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 상술한 실시예에 대하여 본 발명의 범주에서 벗어나지 않는 한도 내에서 다양한 변형이 가능함을 이해할 것이다.
그러므로 본 발명의 권리범위는 설명된 실시예에 국한되어 정해져서는 안 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
[부호의 설명]
100: 생물학적 샘플 분석 시스템
102: 판단부
104: 추가 샘플 선정부
106: 검사 결과 판정부

Claims (12)

  1. n * m 매트릭스를 구성하는 복수 개의 생물학적 샘플들, 및 상기 매트릭스에서 동일한 행(row) 또는 열(column)을 가지는 샘플들을 수합하여 생성된 복수 개의 풀(pool)을 이용하여 상기 복수 개의 샘플들 각각의 검사 대상 성질 보유 여부를 판정하기 위한 시스템으로서,
    상기 복수 개의 풀 각각의 상기 검사 대상 성질에 대한 검사값에 따라 위양성 판정 가능성이 존재하는지의 여부를 판단하는 판단부;
    상기 판단 결과 위양성 판정 가능성이 있는 경우, 상기 복수 개의 샘플 중 상기 검사 대상 성질 보유 여부에 대한 개별 검사를 수행할 최소 개수의 추가 검사 대상 샘플을 선정하는 추가 샘플 선정부; 및
    상기 추가 검사 대상 샘플에 대한 검사값에 따라 상기 복수 개의 샘플들 각각의 상기 검사 대상 성질 보유 여부를 판정하는 검사 결과 판정부를 포함하는 생물학적 샘플 분석 시스템.
  2. 청구항 1에 있어서,
    상기 판단부는, 상기 복수 개의 풀 각각의 상기 검사값에 따라 상기 복수 개의 샘플들 중 양성 가능 샘플의 개수를 추정하고, 추정된 상기 양성 가능 샘플의 개수에 따라 상기 위양성 판정 가능성 존재 여부를 판단하는, 생물학적 샘플 분석 시스템.
  3. 청구항 2에 있어서,
    상기 판단부는, 추정된 상기 양성 가능 샘플 개수의 최대값 및 최소값이 상이한 경우, 위양성 판정 가능성이 존재하는 것으로 판단하는, 생물학적 샘플 분석 시스템.
  4. 청구항 1에 있어서,
    상기 추가 샘플 선정부는, 상기 검사값에 따라 양성으로 판정된 풀 각각에 대하여, 상기 양성 판정 풀에 포함된 양성 가능 샘플 중 해당 풀의 검사값으로부터 나머지 샘플의 검사 결과를 계산하는 데 필요한 최소 개수의 추가 검사 대상 샘플을 선정하는, 생물학적 샘플 분석 시스템.
  5. 청구항 4에 있어서,
    상기 추가 샘플 선정부는, 상기 양성 판정 풀 중 포함된 양성 가능 샘플의 개수가 가장 작은 양성 판정 풀부터 순차적으로 상기 추가 검사 대상 샘플을 선정하는, 생물학적 샘플 분석 시스템.
  6. 청구항 4에 있어서,
    상기 검사 결과 판정부는,
    상기 양성 판정 풀 각각에 대하여, 해당 풀의 검사값 및 해당 풀에 포함된 추가 검사 대상 샘플의 검사값을 이용하여 해당 풀에 포함된 나머지 양성 가능 샘플의 상기 검사 대상 성질 보유 여부를 판정하는, 생물학적 샘플 분석 시스템.
  7. n * m 매트릭스를 구성하는 복수 개의 생물학적 샘플들, 및 상기 매트릭스에서 동일한 행(row) 또는 열(column)을 가지는 샘플들을 수합하여 생성된 복수 개의 풀(pool)을 이용하여 상기 복수 개의 샘플들 각각의 검사 대상 성질 보유 여부를 판정하기 위한 방법으로서,
    판단부에서, 상기 복수 개의 풀 각각의 상기 검사 대상 성질에 대한 검사값에 따라 위양성 판정 가능성이 존재하는지의 여부를 판단하는 단계;
    추가 샘플 선정부에서, 상기 판단 결과 위양성 판정 가능성이 있는 경우, 상기 복수 개의 샘플 중 상기 검사 대상 성질 보유 여부에 대한 개별 검사를 수행할 최소 개수의 추가 검사 대상 샘플을 선정하는 단계; 및
    검사 결과 판정부에서, 상기 추가 검사 대상 샘플에 대한 검사값에 따라 상기 복수 개의 샘플들 각각의 상기 검사 대상 성질 보유 여부를 판정하는 단계를 포함하는 생물학적 샘플 분석 방법.
  8. 청구항 7에 있어서,
    상기 판단 단계는, 상기 복수 개의 풀 각각의 상기 검사값에 따라 상기 복수 개의 샘플들 중 양성 가능 샘플의 개수를 추정하고, 추정된 상기 양성 가능 샘플의 개수에 따라 상기 위양성 판정 가능성 존재 여부를 판단하는, 생물학적 샘플 분석 방법.
  9. 청구항 8에 있어서,
    상기 판단 단계는, 추정된 상기 양성 가능 샘플 개수의 최대값 및 최소값이 상이한 경우, 위양성 판정 가능성이 존재하는 것으로 판단하는, 생물학적 샘플 분석 방법.
  10. 청구항 7에 있어서,
    상기 추가 샘플 선정 단계는, 상기 검사값에 따라 양성으로 판정된 풀 각각에 대하여, 상기 양성 판정 풀에 포함된 양성 가능 샘플 중 해당 풀의 검사값으로부터 나머지 샘플의 검사 결과를 계산하는 데 필요한 최소 개수의 추가 검사 대상 샘플을 선정하는, 생물학적 샘플 분석 방법.
  11. 청구항 10에 있어서,
    상기 추가 샘플 선정 단계는, 상기 양성 판정 풀 중 포함된 양성 가능 샘플의 개수가 가장 작은 양성 판정 풀부터 순차적으로 상기 추가 검사 대상 샘플을 선정하는, 생물학적 샘플 분석 방법.
  12. 청구항 10에 있어서,
    상기 검사 대상 성질 보유 여부를 판정하는 단계는, 상기 양성 판정 풀 각각에 대하여, 해당 풀의 검사값 및 해당 풀에 포함된 추가 검사 대상 샘플의 검사값을 이용하여 해당 풀에 포함된 나머지 양성 가능 샘플의 상기 검사 대상 성질 보유 여부를 판정하는, 생물학적 샘플 분석 방법.
PCT/KR2014/008167 2013-10-11 2014-09-02 생물학적 샘플 분석 시스템 및 방법 WO2015053480A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20130121568A KR101473705B1 (ko) 2013-10-11 2013-10-11 생물학적 샘플 분석 시스템 및 방법
KR10-2013-0121568 2013-10-11

Publications (1)

Publication Number Publication Date
WO2015053480A1 true WO2015053480A1 (ko) 2015-04-16

Family

ID=52679154

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2014/008167 WO2015053480A1 (ko) 2013-10-11 2014-09-02 생물학적 샘플 분석 시스템 및 방법

Country Status (4)

Country Link
US (1) US10002232B2 (ko)
KR (1) KR101473705B1 (ko)
CN (1) CN104569368B (ko)
WO (1) WO2015053480A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020135500A1 (zh) * 2018-12-29 2020-07-02 安诺优达基因科技(北京)有限公司 一种构建生物信息分析参照数据集的方法及系统

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11379578B1 (en) 2020-10-16 2022-07-05 Trend Micro Incorporated Detecting malware by pooled analysis of sample files in a sandbox
KR102547548B1 (ko) * 2020-11-03 2023-06-26 문병로 집합적 진단 제어 방법 및 그 시스템
KR102593718B1 (ko) * 2021-05-31 2023-11-14 (주) 옵투스자산운용 집합적 진단 제어 방법 및 그 시스템

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030074585A (ko) * 2000-07-18 2003-09-19 더 유나이티드 스테이츠 오브 아메리카 애즈 리프리젠티드 바이 더 세크레터리 오브 더 디파트먼트 오브 헬쓰 앤드 휴먼 써비시즈 생물학적 데이터의 숨겨진 패턴에 근거한 생물학적 상태의식별 방법
US20100216666A1 (en) * 2007-10-31 2010-08-26 Adrianus Lambertus Johannus Vereijken Method of performing a biological assay
JP4734495B2 (ja) * 2003-01-30 2011-07-27 ハッチンソン,マイケル 分析検査結果を処理するための方法及び装置
US20120185177A1 (en) * 2009-02-20 2012-07-19 Hannon Gregory J Harnessing high throughput sequencing for multiplexed specimen analysis

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5632957A (en) * 1993-11-01 1997-05-27 Nanogen Molecular biological diagnostic systems including electrodes
US20020172965A1 (en) * 1996-12-13 2002-11-21 Arcaris, Inc. Methods for measuring relative amounts of nucleic acids in a complex mixture and retrieval of specific sequences therefrom
AU2002311897A1 (en) * 2001-05-09 2002-11-18 Third Wave Technologies, Inc. Nucleic acid detection in pooled samples
WO2005075678A1 (en) * 2004-02-10 2005-08-18 Yissum Research Development Company Of The Hebrew University Of Jerusalem Determination of genetic variants in a population using dna pools
EP2145185A4 (en) * 2007-04-30 2010-06-02 Nanogen Inc DOSAGE OF SEVERAL ANALYTES

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030074585A (ko) * 2000-07-18 2003-09-19 더 유나이티드 스테이츠 오브 아메리카 애즈 리프리젠티드 바이 더 세크레터리 오브 더 디파트먼트 오브 헬쓰 앤드 휴먼 써비시즈 생물학적 데이터의 숨겨진 패턴에 근거한 생물학적 상태의식별 방법
JP4734495B2 (ja) * 2003-01-30 2011-07-27 ハッチンソン,マイケル 分析検査結果を処理するための方法及び装置
US20100216666A1 (en) * 2007-10-31 2010-08-26 Adrianus Lambertus Johannus Vereijken Method of performing a biological assay
US20120185177A1 (en) * 2009-02-20 2012-07-19 Hannon Gregory J Harnessing high throughput sequencing for multiplexed specimen analysis

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020135500A1 (zh) * 2018-12-29 2020-07-02 安诺优达基因科技(北京)有限公司 一种构建生物信息分析参照数据集的方法及系统

Also Published As

Publication number Publication date
CN104569368B (zh) 2016-08-31
KR101473705B1 (ko) 2014-12-18
CN104569368A (zh) 2015-04-29
US20150105263A1 (en) 2015-04-16
US10002232B2 (en) 2018-06-19

Similar Documents

Publication Publication Date Title
Wright et al. Making new genetic diagnoses with old data: iterative reanalysis and reporting from genome-wide data in 1,133 families with developmental disorders
WO2015053480A1 (ko) 생물학적 샘플 분석 시스템 및 방법
CN107368708B (zh) 一种精准分析dmd基因结构变异断点的方法及系统
RU2014134175A (ru) Способ и система выявления вариации числа копий в геноме
WO2017126943A1 (ko) 염색체 이상 판단 방법
WO2019031785A9 (ko) 유전자 패널에 기초한 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
WO2017135768A1 (ko) 추정 자손의 유전질환 발병 위험성을 예측하는 방법 및 시스템
Lin et al. How to make DNA methylome wide association studies more powerful
CN104302781A (zh) 一种检测染色体结构异常的方法及装置
WO2022105629A1 (zh) 一种用于检测样本污染水平的snp位点的筛选方法及样本污染水平的检测方法
WO2020111378A1 (ko) 질환 진단 보조를 위한 데이터 분석 방법 및 시스템
EP3271481B1 (en) Methods of quality control using single-nucleotide polymorphisms in pre-implantation genetic screening
WO2018030733A1 (ko) 계측-수율 상관성 분석 방법 및 시스템
Budis et al. Non-invasive prenatal testing as a valuable source of population specific allelic frequencies
WO2021025218A1 (ko) 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치 및 방법
WO2015126058A1 (ko) 암 예후 예측 방법
WO2017191871A1 (ko) 변이 검출 표지의 신뢰도를 결정하는 방법 및 장치
WO2016085262A2 (ko) 약물 가상 탐색 방법과 집중 탐색 라이브러리 구축 방법 및 이를 위한 시스템
WO2020235721A1 (ko) 다중 오믹스 분석을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법, 우울증 또는 자살 위험 예측용 마커, 및 다중 오믹스 분석을 이용한 우울증 또는 자살 위험 예측 방법
WO2023090861A1 (ko) 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템 및 방법
EP1798651B1 (en) Gene information display method and apparatus
WO2022245063A1 (ko) 인공 지능 기반의 유전체와 의료 정보 분석 및 의약 물질 개발 방법 및 시스템
Oliveira et al. Homozygosity mapping using whole-exome sequencing: a valuable approach for pathogenic variant identification in genetic diseases
WO2016208827A1 (ko) 유전자를 분석하는 방법 및 장치
WO2020235972A1 (ko) Ngs 데이터를 이용하여 유전형을 예측하는 방법 및 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14852344

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14852344

Country of ref document: EP

Kind code of ref document: A1