KR20150137283A - 생물학적 샘플 분석 시스템 및 방법 - Google Patents

생물학적 샘플 분석 시스템 및 방법 Download PDF

Info

Publication number
KR20150137283A
KR20150137283A KR1020140064878A KR20140064878A KR20150137283A KR 20150137283 A KR20150137283 A KR 20150137283A KR 1020140064878 A KR1020140064878 A KR 1020140064878A KR 20140064878 A KR20140064878 A KR 20140064878A KR 20150137283 A KR20150137283 A KR 20150137283A
Authority
KR
South Korea
Prior art keywords
pools
signal pattern
determination
detection unit
samples
Prior art date
Application number
KR1020140064878A
Other languages
English (en)
Inventor
홍유진
남성혁
김우연
기창석
Original Assignee
사회복지법인 삼성생명공익재단
삼성에스디에스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 사회복지법인 삼성생명공익재단, 삼성에스디에스 주식회사 filed Critical 사회복지법인 삼성생명공익재단
Priority to KR1020140064878A priority Critical patent/KR20150137283A/ko
Priority to CN201410602027.8A priority patent/CN105316223A/zh
Priority to SG10201407814VA priority patent/SG10201407814VA/en
Priority to US14/556,628 priority patent/US20150347674A1/en
Publication of KR20150137283A publication Critical patent/KR20150137283A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection

Landscapes

  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

생물학적 샘플 분석 시스템 및 방법이 개시된다. 본 발명의 일 실시예에 따른 생물학적 샘플 분석 시스템은, 제1 판정 기준값에 따라, 복수 개의 풀 각각의 검사 대상 성질 보유 여부를 판단하는 제1 변이 검출부; 상기 제1 변이 검출부의 판단 결과 양성으로 판단된 풀의 대립형질빈도에 따라 상기 제1 변이 검출부의 판단 결과의 오류 가능성 존재 여부를 판단하는 오류 판단부; 상기 오류 판단부에서 오류 가능성이 존재하는 것으로 판단되는 경우, 제2 판정 기준값에 따라 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단하는 제2 변이 검출부; 및 상기 제1 변이 검출부 및 상기 제2 변이 검출부의 판단 결과에 따라 상기 복수 개의 샘플들 각각의 상기 검사 대상 성질 보유 여부를 판정하는 검사 결과 판정부를 포함한다.

Description

생물학적 샘플 분석 시스템 및 방법{SYSTEM AND METHOD FOR ANALYZING BIOLOGICAL SAMPLE}
본 발명의 실시예들은 생물학적 샘플을 분석하기 위한 기술과 관련된다.
혈액 샘플을 검사하여 특정 바이러스에 감염되었는지, 혹은 특정 질병을 유발하는 유전 변이를 가지고 있는지 검사하는 예와 같이, 테스트할 대상의 생물학적 샘플이 특정 성질을 가지는 지 검사하기 위해서는 일반적으로 각 대상의 샘플마다 개별적으로 검사를 실행하였다. 따라서 대량의 샘플을 검사해야 할 경우, 샘플 개수만큼의 반복 검사를 위한 시간과 비용이 필요하였다. 그러나 발병률이 낮은 질병에 대한 선별 검사의 경우는 검사하는 대부분의 샘플이 음성의 결과를 나타내게 된다. 따라서 검사 비용을 줄이기 위해, 두 개 이상의 샘플을 수합(pooling)한 후에 수합 샘플을 검사하고, 수합된 샘플들 중 검사한 특정 성질을 가지고 있는 샘플이 있는지를 판정하는 수합 검사 방법이 제시되었다. 더 나아가 수합된 샘플들 중 해당 성질을 가지는 샘플이 어떤 샘플인지 식별할 수 있는 방법들도 제시되었다. 이러한 수합 검사는 검사 비용 절감의 장점이 있지만, 여러 샘플들을 한꺼번에 검사하기 때문에 개별 검사에 비해 정확도가 떨어질 수 있다는 단점이 있다.
수합 검사 결과에 오류가 발생하는 주요 원인은 수합된 개별 샘플들이 수합 샘플(pooled sample, 이하 '풀(pool)'로 지칭)에 동일한 비율로 혹은 기대한 비율로 반영되지 않는 것이다. 그 원인은 다양할 수 있으며, 한 가지 예로는 한 개의 풀로 수합되는 샘플들 간의 DNA농도 차이일 수 있다. 일반적으로 수합 검사를 위해서는 한 샘플이 두 개 이상의 풀에 수합되며, 수합된 풀에 대한 검사를 수행하여 어떤 풀이 양성으로 나타나는지에 따라 양성 샘플을 식별할 수 있다. 이때 양성 샘플은 변이를 가지고 있는 샘플을 말하며, 양성 풀은 풀에 수합된 샘플들 중 양성 샘플이 있음을 의미한다.
풀이 양성인지 여부를 판단하기 위한 신호를 측정하는 한 가지 방법으로서, 차세대 시퀀싱(Next Generation Sequencing; 이하 'NGS'로 지칭) 기술을 사용할 수 있다. NGS기술은 타겟으로 하는 유전체 영역에 대해 일정한 길이의 서열 조각인 리드들을 대량으로 만들어내는데, 이렇게 생성된 리드들은 참조 서열(reference sequence)에 맵핑되고, 특정 영역에 맵핑된 리드들의 서열 정보를 바탕으로 해당 영역의 서열을 재구성하게 된다. 특정 위치의 유전자형은 해당 위치를 포함한 영역에 맵핑된 리드들에서의 해당 위치에서의 대립형질빈도(alternative allele frequency)로 유추될 수 있다. 예를 들어 이형접합(Heterozygous) 유전자형인 AB의 경우, 리드들에서의 A와 B의 대립형질빈도는 각각 대략 1/2, 1/2로 관찰될 것이다. 유전자형이 각각 AB와 BB인 2개의 샘플을 수합하였을 경우, A와 B의 대립형질빈도는 각각 대략 1/4, 3/4으로 관찰될 것이다. 따라서 NGS 기술을 이용하여 샘플이 변이를 가지고 있는지 검사하기 위해서는, 변이 유전자형인 AB와 BB에 존재하는 대립형질 B의 대립형질빈도를 맵핑된 리드 기반으로 측정하면 된다. 그러나 이는 하나의 풀로 수합된 샘플들이 풀에 동일한 비율로 존재하는 것을 가정하고 있다. 만약 양성인 샘플이 적은 비율로 풀에 수합되었다면 풀에서 관찰되는 대립형질빈도가 기대한 수준보다 낮게 나타나게 될 것이며, 해당 풀은 음성으로 판정될 확률이 높아진다. 이렇게 해당 샘플이 수합된 풀 중 일부가 음성의 결과를 보이게 되면 샘플의 양성 여부를 정확히 판단하기가 어렵게 된다.
US2012/0185177 (2012. 07. 19)
본 발명의 실시예들은 다수 개의 샘플을 수합하여 유전 변이들의 존재 여부를 검사하는 수합 검사에 있어서, 검사의 정확도를 향상하기 위한 수단을 제공하기 위한 것이다.
본 발명의 예시적인 실시예에 따르면, n * m 매트릭스를 구성하는 복수 개의 생물학적 샘플들, 및 상기 매트릭스에서 동일한 행(row) 또는 열(column)을 가지는 샘플들을 수합하여 생성된 복수 개의 풀(pool)을 이용하여 상기 복수 개의 샘플들 각각의 검사 대상 성질 보유 여부를 판정하기 위한 시스템으로서, 제1 판정 기준값에 따라, 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단하는 제1 변이 검출부; 상기 제1 변이 검출부의 판단 결과 양성으로 판단된 풀의 대립형질빈도에 따라 상기 제1 변이 검출부의 판단 결과의 오류 가능성 존재 여부를 판단하는 오류 판단부; 상기 오류 판단부에서 오류 가능성이 존재하는 것으로 판단되는 경우, 제2 판정 기준값에 따라 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단하는 제2 변이 검출부; 및 상기 제1 변이 검출부 및 상기 제2 변이 검출부의 판단 결과에 따라 상기 복수 개의 샘플들 각각의 상기 검사 대상 성질 보유 여부를 판정하는 검사 결과 판정부를 포함하는 생물학적 샘플 분석 시스템이 제공된다.
상기 오류 판단부는, 상기 제1 변이 검출부의 판단 결과 양성으로 판단된 풀의 대립형질빈도 및 해당 풀 내에 양성으로 판정된 샘플 개수를 비교하여 상기 오류 가능성 존재 여부를 판단할 수 있다.
상기 시스템은, 상기 오류 판단부에서 오류 가능성이 존재하는 것으로 판단되는 경우, 상기 복수 개의 풀의 대립형질빈도가 유효한 신호 패턴을 가지는지의 여부를 판단하는 신호 패턴 판단부를 더 포함할 수 있다.
상기 신호 패턴 판단부는, 상기 복수 개의 풀 각각의 대립형질빈도를 2개의 군으로 군집화하고, 군집화된 각 군 별 대립형질빈도의 평균값을 이용하여 유효한 신호 패턴을 가지는지의 여부를 판단할 수 있다.
상기 신호 패턴 판단부는, 상기 2개의 군 중 어느 하나의 군의 샘플당 대립형질빈도의 평균값이 0 내지 0.1 사이의 값을 가지고, 나머지 군의 샘플당 대립형질빈도의 평균값이 0.4 내지 1 사이의 값을 가지는 경우 유효한 신호 패턴을 가지는 것으로 판단할 수 있다.
상기 제2 변이 검출부는, 상기 신호 패턴 판단부의 판단 결과 상기 복수 개의 풀의 대립형질빈도가 유효한 신호 패턴을 가지는 경우, 상기 제2 판정 기준값에 따라 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단할 수 있다.
상기 제2 판정 기준값은 상기 제1 판정 기준값보다 낮은 값일 수 있다.
본 발명의 다른 예시적인 실시예에 따르면, n * m 매트릭스를 구성하는 복수 개의 생물학적 샘플들, 및 상기 매트릭스에서 동일한 행(row) 또는 열(column)을 가지는 샘플들을 수합하여 생성된 복수 개의 풀(pool)을 이용하여 상기 복수 개의 샘플들 각각의 검사 대상 성질 보유 여부를 판정하기 위한 방법으로서, 제1 변이 검출부에서, 제1 판정 기준값에 따라, 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단하는 제1 변이 검출 단계; 오류 판단부에서, 상기 제1 변이 검출부의 판단 결과 양성으로 판단된 풀의 대립형질빈도에 따라 상기 제1 변이 검출부의 판단 결과의 오류 가능성 존재 여부를 판단하는 단계; 제2 변이 검출부에서, 오류 가능성 존재 여부를 판단하는 단계의 판단 결과 오류 가능성이 존재하는 것으로 판단되는 경우, 제2 판정 기준값에 따라 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단하는 제2 변이 검출 단계; 및 검사 결과 판정부에서, 상기 제1 변이 검출부 및 상기 제2 변이 검출부의 판단 결과에 따라 상기 복수 개의 샘플들 각각의 상기 검사 대상 성질 보유 여부를 판정하는 단계를 포함하는 생물학적 샘플 분석 방법이 제공된다.
상기 오류 가능성 존재 여부를 판단하는 단계는, 상기 제1 변이 검출부의 판단 결과 양성으로 판단된 풀의 대립형질빈도 및 해당 풀 내에 양성으로 판정된 샘플 개수를 비교하여 상기 오류 가능성 존재 여부를 판단할 수 있다.
상기 방법은, 상기 오류 가능성 존재 여부를 판단하는 단계의 판단 결과 오류 가능성이 존재하는 것으로 판단되는 경우, 신호 패턴 판단부에서, 상기 복수 개의 풀의 대립형질빈도가 유효한 신호 패턴을 가지는지의 여부를 판단하는 단계를 더 포함할 수 있다.
상기 유효한 신호 패턴을 가지는지의 여부를 판단하는 단계는, 상기 복수 개의 풀 각각의 대립형질빈도를 2개의 군으로 군집화하고, 군집화된 각 군 별 대립형질빈도의 평균값을 이용하여 유효한 신호 패턴을 가지는지의 여부를 판단할 수 있다.
상기 유효한 신호 패턴을 가지는지의 여부를 판단하는 단계는, 상기 2개의 군 중 어느 하나의 군의 샘플당 대립형질빈도의 평균값이 0 내지 0.1 사이의 값을 가지고, 나머지 군의 샘플당 대립형질빈도의 평균값이 0.4 내지 1 사이의 값을 가지는 경우 유효한 신호 패턴을 가지는 것으로 판단할 수 있다.
상기 제2 변이 검출 단계는, 상기 신호 패턴 판단부의 판단 결과 상기 복수 개의 풀의 대립형질빈도가 유효한 신호 패턴을 가지는 경우, 상기 제2 판정 기준값에 따라 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단할 수 있다.
상기 제2 판정 기준값은 상기 제1 판정 기준값보다 낮은 값일 수 있다.
본 발명의 실시예들에 따를 경우, 양성 샘플이 수합된 교차 풀 중 어느 하나의 풀에서 유의미한 수준의 신호가 관찰되지 않더라도, 변이의 심층 검출을 통해 해당 풀의 양성 여부를 추가적으로 확인할 수 있으므로, 수합 검사에 있어 일부 샘플의 위음성 또는 위양성 판정 가능성을 최소화할 수 있으며, 이에 따라 검사의 정확도를 높일 수 있다.
도 1은 본 발명의 일 실시예에 따른 샘플 수합(pooling) 과정을 설명하기 위한 도면
도 2 내지 도 5는 본 발명의 실시예들에 따른 샘플 수합 검사에서의 판정 오류를 설명하기 위한 예시도
도 6는 본 발명의 일 실시예에 따른 생물학적 샘플 분석 시스템(100)을 나타낸 블록도
도 7 내지 도 9는 본 발명의 실시예들에 따른 샘플 수합 검사에서의 신호 패턴을 설명하기 위한 예시도
도 10은 본 발명의 일 실시예에 따른 생물학적 샘플 분석 방법(1000)을 설명하기 위한 흐름도
이하, 도면을 참조하여 본 발명의 구체적인 실시형태를 설명하기로 한다. 그러나 이는 예시에 불과하며 본 발명은 이에 제한되지 않는다.
본 발명을 설명함에 있어서, 본 발명과 관련된 공지기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하기로 한다. 그리고, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
본 발명의 기술적 사상은 청구범위에 의해 결정되며, 이하의 실시예는 본 발명의 기술적 사상을 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 효율적으로 설명하기 위한 일 수단일 뿐이다.
본 발명의 일 실시예에 따른 생물학적 샘플 분석 시스템(100)은 복수 개의 생물학적 샘플 각각이 특정 생물학적 성질을 가지는지(다시 말해 상기 특정 성질에 양성 반응을 보이는지)의 여부를 판정하기 위한 시스템이다. 구체적으로, 생물학적 샘플 분석 시스템(100)은 n * m 매트릭스를 구성하는 복수 개의 생물학적 샘플들 및 상기 매트릭스에서 동일한 행(row) 또는 열(column)을 가지는 샘플들을 수합하여 생성된 복수 개의 풀(pool)을 이용하여 상기 복수 개의 샘플들 각각의 검사 대상 성질 보유 여부를 판정하도록 구성된다.
본 발명의 일 실시예에 따른 생물학적 샘플 분석 시스템(100)의 각 구성요소들을 설명하기에 앞서, 검사 대상 샘플로부터 풀을 구성하는 과정을 설명하면 도 1과 같다. 먼저, x개(x = n * m)의 검사 대상 샘플(S1, S2, ..., Sn *m)을 n * m 매트릭스 상에 배열한다. 이때 n과 m은 같을 수도 있고 다를 수도 있으나, n * m 은 x와 같아야 한다. 또한 x는 2보다 크거나 같다. 상기 검사 대상 샘플은 특정한 생물학적 성질을 가지는지의 여부를 검사하기 위한 시료로써, 인간을 포함한 모든 생물의 조직 또는 체액 등일 수 있다.
상기와 같이 매트릭스가 구성되면, 다음으로 매트릭스상에 배열된 x개의 검사 대상 샘플을 k(= n + m)개의 풀(pool)에 나누어 수합(pooling)한다. 이때 상기 매트릭스에서 동일한 행 또는 열을 가지는 샘플들은 동일한 풀에 수합된다. 예를 들어, 도시된 실시예에서 풀 X1에는 매트릭스의 첫번째 열을 구성하는 샘플들이 수합되고, Y1에는 매트릭스의 첫번째 행을 구성하는 샘플들이 수합한다. 이와 같은 과정을 통하여 k개의 풀링된 샘플(X1, ..., Xm, Y2, ..., Yn, 이하에서는 편의상 ??로 줄여 표기)이 생성된다.
다음으로, 각 샘플들이 수합된 k개의 풀에 대해 검사를 수행하여 검사할 특정 성질에 대한 신호를 측정한다. 본 발명의 실시예에서 특정 성질이란, 각 샘플들이 특정 단일염기변이(Single Nucleotide Polymorphism; SNP)와 같은 유전자적 표지자(Genetic marker), 유전자적 표지자에서의 특정 유전형(genotype), 특정 질병 등과 같은 생물학적 특성을 보유하고 있는지의 여부일 수 있다. 상기 검사에서는 샘플 내 특정 성질의 보유 여부를 의미하는 신호의 세기가 풀 내에 해당 성질을 가지는 샘플의 개수와 대략 비례하여 나타난다. 예를 들어, 풀 내에 상기 특정 성질을 가지는 샘플의 개수가 2개인 경우에는 1개인 경우와 비교하여 상기 검사에 따른 신호 세기가 약 2배가 될 수 있다. 만약 특정 풀에서 측정된 신호 세기가 해당 풀에 포함된 하나 이상의 샘플이 특정 성질을 가진다고 판단할 수 있을 만큼 충분하다면, 해당 풀은 상기 특정 성질에 양성(positive)이라고 말할 수 있다.
예를 들어, 상기 검사가 샘플들의 특정 단일염기변이 보유 여부를 검사하는 것이라고 가정하자. 이 경우 샘플에 포함된 유전자의 해당 변이 위치에는 참조 유전자형인 AA, 이형접합(Heterozygous) 변이 유전자형인 AB, 동형접합(Homozygous) 변이 유전자형인 BB 중 어느 하나가 존재할 수 있다. 본 예에서는 이해가 용이하도록 이배체(diploid) 경우를 예로 들었으나, 본 발명이 이에 한정되는 것은 아니다. 또한 변이 유전자형에 대한 신호를 측정하는 방법으로 차세대 시퀀싱(Next Generation Sequencing; 이하, NGS) 기술을 사용할 수 있다. NGS기술은 타겟으로 하는 유전체 영역에 대해 일정한 길이의 서열 조각인 리드들을 대량으로 만들어내는데, 이렇게 생성된 리드들은 참조 서열(reference sequence)에 맵핑되고, 특정 영역에 맵핑된 리드들의 서열 정보를 바탕으로 해당 영역의 서열을 재구성하게 된다.
상기 예에서, 검사 대상 샘플의 특정 위치의 유전자형은 해당 위치를 포함한 영역에 맵핑된 리드들에서의 해당 위치에서의 대립형질빈도(alternative allele frequency)로 유추될 수 있다. 예를 들어, 이형접합(Heterozygous) 유전자형인 AB의 경우 A와 B의 대립형질빈도는 대략 각각 1/2, 1/2로 관찰될 것이다. 또한, 유전자형이 AB인 샘플과 BB인 샘플을 수합하였을 경우, A와 B의 대립형질빈도는 대략 각각 1/4, 3/4으로 관찰될 것이다. 따라서 NGS 기술을 이용하여 샘플이 특정 단일염기변이를 가지고 있는지 검사하기 위해서는, 변이 유전자형인 AB와 BB에 존재하는 대립형질 B의 대립형질빈도를 맵핑된 리드 기반으로 측정하면 된다.
한편, NGS 기술이 본 발명에 용이하게 적용되기 위해서는 각 풀(pool)을 시퀀싱한 결과에서 해당 풀에 수합된 각 샘플의 시퀀싱 리드들이 대략 균등하게 분포한다는 조건이 만족되어야 한다. 예를 들어, 수합된 4개의 샘플이 각각 유전형 AA, AB, AB, AA를 가진다면, 해당 Pool에서 대체대립형질 B에 대한 대립형질빈도는 대략 2/8로 관찰되어야 할 것이다. 그러나 풀을 구성하는 각 샘플, 특히 양성 샘플이 풀에 적정한 비율로 수합되지 않을 경우에는 양성 샘플임에도 불구하고 풀 검사 결과가 음성이 될 수 있다. 이를 예를 들어 설명하면 도 2 내지 도 5와 같다.
도 2 내지 도 5는 본 발명의 실시예들에 따른 샘플 수합 검사에서의 판정 오류를 설명하기 위한 예시도이다. 먼저 도 2에 도시된 바와 같이 샘플 S6이 양성 샘플인 경우, X2 및 Y2 두 개의 풀이 양성으로 판정되어야 한다. 그러나 도 3에 도시된 바와 같이 샘플이 수합된 2개의 풀 중 한 개 풀(Y2)이 음성으로 잘못 판정되면 샘플 S6은 음성으로 잘못 판정되게 된다.
또한, 도 4에 도시된 바와 같이 양성 샘플이 2개(S6, S11)인 경우, 양성으로 판정되어야 할 4개의 풀(X2, X3, Y2, Y3) 중 한 개 풀(Y3)이 음성으로 잘못 판정되면 샘플 S10과 S11은 각각 양성, 음성으로 잘못 판정된다. 도 5의 경우에도 양성으로 판정되어야 할 풀 X3이 음성으로 잘못 판정되어 양성이어야 할 샘플 S10이 음성으로 잘못 판정되는 경우이다. 즉, 샘플 수합 검사의 경우 일부 풀이 위음성(False negative) 혹은 위양성(False positive)으로 판정되는 경우 전체 샘플의 판정 결과에 영향을 미치게 된다.
도 6은 본 발명의 일 실시예에 따른 생물학적 샘플 분석 시스템(100)을 나타낸 블록도이다. 도시된 바와 같이, 본 발명의 일 실시예에 따른 생물학적 샘플 분석 시스템(100)은 n * m 매트릭스를 구성하는 복수 개의 생물학적 샘플들, 및 상기 매트릭스에서 동일한 행(row) 또는 열(column)을 가지는 샘플들을 수합하여 생성된 복수 개의 풀(pool)을 이용하여 상기 복수 개의 샘플들 각각의 검사 대상 성질 보유 여부를 판정하기 위한 시스템으로서, 제1 변이 검출부(102), 오류 판단부(104), 신호 패턴 판단부(106), 제2 변이 검출부(108) 및 검사 결과 판단부(110)를 포함한다.
제1 변이 검출부(102)는 제1 판정 기준값에 따라, 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단한다.
오류 판단부(104)는 제1 변이 검출부(102)의 판단 결과 양성으로 판단된 풀의 대립형질빈도에 따라 상기 제1 변이 검출부의 판단 결과의 오류 가능성 존재 여부를 판단한다.
신호 패턴 판단부(106)는 오류 판단부(104)에서 오류 가능성이 존재하는 것으로 판단되는 경우, 상기 복수 개의 풀의 대립형질빈도가 유효한 신호 패턴을 가지는지의 여부를 판단한다.
제2 변이 검출부(108)는 오류 판단부(104)에서 오류 가능성이 존재하는 것으로 판단되거나, 또는 신호 패턴 판단부(106)에서 상기 복수 개의 풀의 대립형질빈도가 유효한 신호 패턴을 가지는 것으로 판단되는 경우, 상기 제1 판정 기준값보다 완화된 값인 제2 판정 기준값에 따라 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단한다.
검사 결과 판단부(110)는 제1 변이 검출부(102) 및 제2 변이 검출부(108)의 판단 결과에 따라 상기 복수 개의 샘플들 각각의 상기 검사 대상 성질 보유 여부를 판정한다.
이하에서는 상기와 같이 구성된 본 발명의 일 실시예에 따른 생물학적 샘플 분석 시스템(100)의 각 구성요소들을 상세히 설명한다.
풀에서 변이 표준 검출( Normal Call )
먼저, 제1 변이 검출부(102)는 제1 판정 기준값에 따라, 상기 복수 개의 풀 각각에서 변이를 검출하여 풀의 양성 여부(검사 대상 성질 보유 여부)를 판단한다.
예를 들어, 제1 변이 검출부(102)는 각 변이에 대해 풀에서 관찰되는 대립형질빈도를 기반으로 풀의 양성 여부를 판정할 수 있다. 특정 풀에 수합된 샘플 중 변이를 가지는 샘플이 1개이고 그 변이가 이형접합(Heterozygous) 유전형일 경우, 해당 풀에서 양성으로 판정되는데 필요한 최소 대립형질빈도가 관찰되게 된다. 상기 최소 대립형질 빈도의 기준값(제1 판정 기준값)은, 예를 들어 수학식 1과 같이 계산할 수 있으며, 관찰된 대립형질빈도가 계산된 기준값보다 클 경우 해당 풀이 양성이라고 판단할 수 있다.
[수학식 1]
최소 대립형질빈도 기준값 = α * (1 / 풀에 수합된 샘플들의 개수)
위 수학식 1에서 α는 풀 내에 샘플들이 일정 비율로 수합된다고 가정할 때, 변이 표준 검출을 위해 요구되는 샘플당 대질형질빈도(alternative allele frequency per sample)의 최소값이다. 예를 들어, 4개의 샘플이 수합된 1개의 풀에 이형접합 유전형 AB 변이를 가지는 샘플이 1개 존재한다고 하자. 이상적으로 4개의 샘플이 수합된 풀에서 하나의 샘플에 해당하는 리드들은 풀 전체 리드의 1/4이 되며, 해당 샘플(양성 샘플)로 추출된 리드들에서 유전형질 A를 가지는 리드와 유전형질 B를 가지는 리드의 개수의 비율은 대략 1:1이 된다. 이러한 경우, 제1 변이 검출부(102)는 샘플당 대립형질빈도의 최소값을 0.5로 하여 변이를 검출할 수 있다. 그러나 시퀀싱 에러 혹은 맵핑 에러와 같은 일련의 에러를 감안하여 α값을 낮추어 적용하는 것 또한 가능하다.
전술한 바와 같이, 최소 대립형질 빈도 값을 이용하여 풀의 양성 여부를 판단하는 방법은 특히 해당 변이 위치에 맵핑된 리드들의 수가 충분히 많을 경우에 적합하다. 제1 변이 검출부(102)는 상기 방법 이외에도 SNVer 알고리즘 등과 같이 유전형에 대한 가능성(likelihood)이나 확률(probability)을 계산하는 통계적 알고리즘을 사용하여 각 풀의 양성 여부를 확인하도록 구성될 수 있다. 즉, 전술한 상기 규칙 또는 알고리즘은 본 발명의 수행을 위한 하나의 실시예에 불과하며, 본 발명이 이에 한정되는 것은 아니다.
오류 가능성 판단
다음으로, 오류 판단부(104)는 제1 변이 검출부(102)의 판단 결과 양성으로 판단된 풀의 대립형질빈도에 따라 상기 제1 변이 검출부의 판단 결과의 오류 가능성 존재 여부를 판단한다. 구체적으로, 오류 판단부(104)는 양성인 풀을 기반으로 샘플이 수합된 풀 중 일부가 음성으로 잘못 판정되었을 가능성이 있는지 판단한다. 만약 상기 판단 결과 에러 가능성이 없다고 판단되면, 검사 결과 판단부(110)는 제1 변이 검출부(102)에서 양성으로 판정된 풀들을 기반으로 각 풀에 수합된 샘플들의 양성 여부를 판정한다.
일 실시예에서, 오류 판단부(104)는 제1 변이 검출부(102)의 판단 결과 양성으로 판단된 풀의 대립형질빈도 및 해당 풀 내에서 양성으로 판정된 샘플 개수를 비교하여 상기 오류 가능성 존재 여부를 판단할 수 있다. 전술한 바와 같이, 풀의 대립형질빈도는 해당 풀에 포함된 양성 샘플의 개수에 대략 비례하게 되므로, 특정 풀의 대립형질빈도에 비해 실제 양성으로 판정된 샘플의 개수가 지나치게 높거나 또는 낮은 경우에는 제1 변이 검출부(102)의 판단 결과에 오류가 있는 것으로 판단될 수 있다.
예를 들어, 오류 판단부(104)는 다음의 수학식 2를 이용하여 상기 오류 가능성 존재 여부를 판단할 수 있다. 수학식 2는 양성인 풀에 대해서, 풀 내에 양성으로 판정된 샘플 개수만큼 양성 샘플이 존재할 확률을 계산하기 위한 식이다. 오류 판단부(104)는 만약 계산된 확률이 정해진 수준 이하인 풀이 존재할 경우 에러 가능성이 있다고 판단할 수 있다.
[수학식 2]
Figure pat00001

수식에서 S는 풀 내의 양성 샘플의 개수, AF는 풀에서 관찰된 대립유전자빈도, CommonVar는 검사 대상 집단(population)에서 흔하게 나타날 수 있는 변이, NotCommonVar는 CommonVar가 아닌 변이를 각각 의미한다. 상기 CommonVar는 예를 들어 1000 Genomes 프로젝트 (Durbin et al . Nature 2010) 데이터에서 1% 이상의 빈도로 존재하는 변이일 수 있으나, 반드시 이에 한정되는 것은 아니다.
한편, 상기 수학식 2는 풀의 대립유전자빈도와 풀 내 양성 샘플의 개수를 이용하여 에러 가능성을 판단하기 위한 하나의 예에 불과하며 본 발명이 이에 한정되는 것은 아님을 유의한다.
유효 신호 패턴 검출 여부 판단
오류 판단부(104)에서 오류 가능성이 존재하는 것으로 판단되는 경우, 다음으로 신호 패턴 판단부(106)는 제1 변이 검출부(102)에서의 표준 변이 검출 과정을 통해 변이가 검출되지 않은 풀(음성 풀)들에 대해 제2 변이 검출부(108)를 통한 변이 심층 검출을 할 필요가 있는지를 결정한다. 신호 패턴 판단부(106)는 상기 복수 개의 풀의 대립형질빈도가 유효한 신호 패턴을 가지는지의 여부를 기준으로 상기 심층 검출 필요 여부를 판단하게 된다.
구체적으로, 신호 패턴 판단부(106)는 상기 복수 개의 풀 각각의 대립형질빈도를 2개의 군으로 군집화하고, 군집화된 각 군 별 대립형질빈도의 평균값을 이용하여 유효한 신호 패턴을 가지는지의 여부를 판단하도록 구성될 수 있다. 이때, 신호 패턴 판단부(106)는 상기 2개의 군 중 어느 하나의 군의 샘플당 대립형질빈도의 평균값이 0 내지 0.1 사이의 값을 가지고, 나머지 군의 샘플당 대립형질빈도의 평균값이 0.4 내지 1 사이의 값을 가지는 경우 유효한 신호 패턴을 가지는 것으로 판단하게 된다. 이를 좀 더 상세히 설명하면 다음과 같다.
본 발명의 실시예에 따른 샘플 분석 시스템(100)은 다수 개의 샘플들이 질병의 발병과 연관되는 것으로 알려진 희귀한 변이(rare variant)를 가지고 있는지 검사하는 데 주로 이용된다. 따라서, 수합된 샘플들 중 특정 희귀 변이를 가진 샘플이 존재할 가능성도 매우 낮다. 따라서 희귀 변이의 경우, 대부분의 풀에서는 대략 0에 가까운 대립형질빈도가 관찰될 것이며, 일부의 풀(즉, 양성 샘플이 수합된 풀)에서만 변이 검출에 유의한 수준의 대립형질빈도가 관찰될 것이다.
도 7 내지 도 9는 본 발명의 실시예들에 따른 샘플 수합 검사에서의 신호 패턴을 설명하기 위한 예시도이다.
먼저 도 7은 샘플들이 희귀 변이를 가지고 있는 경우로서, 이 경우는 대부분의 풀(X1, X3, X4, Y1, Y3, Y4)에서 약 0의 샘플당 대립형질빈도를, 일부 풀(X2, Y2)에서 약 0.4 내지 1 사이의 샘플당 대립형질빈도를 나타내게 된다. 따라서 이 경우 신호 패턴 판단부(106)는 해당 풀이 유효한 신호 패턴을 가지는 것으로 판단할 수 있다.
다음으로, 도 8은 모든 풀에서 높은 수준의 샘플당 대립형질빈도를 보이는 경우이다. 이 경우는 전체 샘플 중 양성인 샘플의 개수가 너무 많아 샘플 수합 방법에 의해서는 정확한 결과를 얻을 수 없는 경우(다시 말해 위양성 샘플이 지나치게 많이 나타나는 경우)이다. 이 경우에는 풀들의 대립형질빈도를 기준으로 군집화하더라도 평균이 0인 군집이 나타나지 않으므로 신호 패턴 판단부(106)는 해당 풀이 유효한 신호 패턴을 가지지 않는 것으로 판단할 수 있다.
다음으로, 도 9는 대부분의 풀에서 낮은 수준의 샘플당 대립형질빈도를 나타내는 경우이다. 이는 실제로 양성 샘플이 존재하지 않으나 시스템 에러(Systematic error) 등으로 인해 풀 내에 낮은 대립형질빈도가 나타나는 경우이다. 이 경우에는 풀들의 대립형질빈도를 기준으로 군집화하더라도 평균이 0.4 내지 1 사이인 군집이 나타나지 않으므로 신호 패턴 판단부(106)는 해당 풀이 유효한 신호 패턴을 가지지 않는 것으로 판단할 수 있다.
전술한 바와 같이, 신호 패턴 판단부(106)는 각 풀의 대립형질빈도가 유효한 신호 패턴을 보이는지를 확인하기 위해서, 풀들을 이들의 대립형질빈도를 기반으로 군집 분석 알고리즘(clustering algorithm)을 통해 2개의 군집(cluster)으로 군집화할 수 있다. 예를 들어, 신호 패턴 판단부(106)는 데이터 마이닝 기법 중의 하나인 K-평균 군집화 (K-mean clustering) 알고리즘을 활용하여 군집화를 수행할 수 있으나, 이는 단지 예시에 불과하며 본 발명이 이에 한정되지는 않는다. 이후, 신호 패턴 판단부(106)는 각 군집에 해당하는 풀들의 대립형질빈도의 평균을 계산한다. 예를 들어, 군집 1의 평균값이 대략 0에 가깝고 군집 2의 평균값이 표준 변이 검출에 유의미한 수준 정도로 나타나면(약 0.4 내지 1 사이), 신호 패턴 판단부(106)는 유효한 신호 패턴을 보이는 것으로 판단하여 다음 단계인 변이 심층 검출을 수행할 수 있다.
풀에서 변이 심층 검출( Deep Call )
제2 변이 검출부(108)는 오류 판단부(104)에서 오류 가능성이 존재하는 것으로 판단되거나, 또는 신호 패턴 판단부(106)에서 상기 복수 개의 풀의 대립형질빈도가 유효한 신호 패턴을 가지는 것으로 판단되는 경우, 상기 제1 판정 기준값보다 완화된 값인 제2 판정 기준값에 따라 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단한다. 다만, 실시예에 따라 신호 패턴 판단부(106)가 샘플 분석 시스템(100)에 포함되지 않는 경우에는, 제2 변이 검출부(108)는 오류 판단부(104)에서 오류 가능성이 존재하는 것으로 판단되는 경우 곧바로 제2 판정 기준값에 따라 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단하도록 구성될 수 있다.
제2 변이 검출부(108)는 제1 변이 검출부(102)와 동일한 알고리즘을 이용하여 각 풀에서 변이를 검출할 수 있다. 다만, 제1 변이 검출부(102)와 달리 제2 변이 검출부(108)는 표준 검출을 하기에 유의할만한 수준의 신호 세기가 관찰되지 않더라도, 일정 수준 이상의 신호의 세기가 관찰되면 변이를 검출하도록 구성될 수 있다. 다시 말해, 제2 변이 검출부에서의 제2 판정 기준값은 제1 판정 기준값보다 낮은, 또는 완화된 값일 수 있다.
예를 들어, 제1 변이 검출부(102) 및 제2 변이 검출부(108)에서 상기 수학식 1을 이용하여 변이를 검출한다고 가정할 경우, 만약 제1 변이 검출부(102)에서 α값으로 0.5를 적용했다면 제2 변이 검출부(108)는 이를 약 0.1 내지 0.2 등의 값으로 낮추어 적용할 수 있다. 이 경우, 특정 풀의 대립형질빈도가 0.4로 관찰되었다면, 제1 변이 검출부(102)는 해당 풀을 음성으로, 제2 변이 검출부(108)는 해당 풀을 양성으로 판단하게 된다. 그러나 이와 달리, 제2 변이 검출부(108)는 제1 변이 검출부(102)와는 다른 알고리즘을 적용하여 각 풀에서 변이를 검출하도록 구성될 수도 있다.
각 샘플의 변이 여부 판정
다음으로, 검사 결과 판단부(110)는 제1 변이 검출부(102) 및 제2 변이 검출부(108)의 판단 결과에 따라 상기 복수 개의 샘플들 각각의 상기 검사 대상 성질 보유 여부를 판정한다. 각 풀의 검사 결과를 이용하여 각 샘플의 검사 대상 성질 보유 여부를 판정하는 방법에 대해서는 전술하였다.
한편, 보다 정확한 각 샘플의 변이 여부 판정을 위해서, 양성 샘플을 판정할 때 해당 샘플이 수합된 풀 중 심층 검출로 변이가 검출된 풀의 개수를 제한할 수 있다. 예를 들어, 심층 검출로 변이가 검출된 풀의 개수를 1개로 제한한다고 가정하면, 샘플이 양성이기 위해서는 해당 샘플이 수합된 2개의 풀 중 적어도 1개는 제1 변이 검출부(102)에서 양성으로 판정되었어야 한다. 제2 변이 검출부(108)에서 양성된 풀만으로 샘플의 양성 여부를 판정하게 될 경우 위양성 판정 가능성이 높아지기 때문이다.
본 발명의 실시예들에 따른 생물학적 샘플 분석 시스템(100)은 풀에서 검출된 변이가 질병을 유발하는데 관련이 있는 희귀 변이인지 정상인 집단에서 흔히 발견되는 변이인지 여부를 알 수 없는 경우 특히 유용하다.
도 10은 본 발명의 일 실시예에 따른 생물학적 샘플 분석 방법(1000)을 설명하기 위한 흐름도이다.
단계 1002에서, 제1 변이 검출부(102)는 기 설정된 제1 판정 기준값에 따라, 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단한다.
단계 1004에서, 오류 판단부(104)는 제1 변이 검출부(102)에서 양성으로 판단된 풀의 대립형질빈도에 따라 상기 제1 변이 검출부의 판단 결과의 오류 가능성 존재 여부를 판단한다. 만약 상기 1004단계의 판단 결과 오류 가능성이 없다고 판단되는 경우에는 바로 1010단계로 진행한다.
이와 달리, 만약 상기 1004 단계의 판단 결과 오류 가능성이 존재하는 것으로 판단되는 경우, 단계 1006에서 신호 패턴 판단부(106)는 상기 복수 개의 풀의 대립형질빈도가 유효한 신호 패턴을 가지는지의 여부를 판단한다. 만약 상기 1006단계의 판단 결과 유효한 신호 패턴이 존재하지 않는 경우에는 바로 1010단계로 진행한다.
이와 달리, 만약 상기 1006 단계의 판단 결과 유효한 신호 패턴이 존재하는 경우, 단계 1008에서 제2 변이 검출부(108)는 제2 판정 기준값에 따라 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단한다.
단계 1010에서, 검사 결과 판정부(110)는 제1 변이 검출부(102) 및/또는 상기 제2 변이 검출부(108)의 판단 결과에 따라 상기 복수 개의 샘플들 각각의 상기 검사 대상 성질 보유 여부를 판정한다.
한편, 본 발명의 실시예들은 본 명세서에서 기술한 방법들을 컴퓨터상에서 수행하기 위한 프로그램을 포함하는 컴퓨터 판독 가능 기록매체를 포함할 수 있다. 상기 컴퓨터 판독 가능 기록매체는 프로그램 명령, 로컬 데이터 파일, 로컬 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야에서 통상의 지식을 가진 자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광 기록 매체, 플로피 디스크와 같은 자기-광 매체, 및 롬, 램, 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다.
이상에서 대표적인 실시예를 통하여 본 발명에 대하여 상세하게 설명하였으나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 상술한 실시예에 대하여 본 발명의 범주에서 벗어나지 않는 한도 내에서 다양한 변형이 가능함을 이해할 것이다.
그러므로 본 발명의 권리범위는 설명된 실시예에 국한되어 정해져서는 안 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
100: 생물학적 샘플 분석 시스템
102: 제1 변이 검출부
104: 오류 판단부
106: 신호 패턴 판단부
108: 제2 변이 검출부
110: 검사 결과 판단부

Claims (14)

  1. n * m 매트릭스를 구성하는 복수 개의 생물학적 샘플들, 및 상기 매트릭스에서 동일한 행(row) 또는 열(column)을 가지는 샘플들을 수합하여 생성된 복수 개의 풀(pool)을 이용하여 상기 복수 개의 샘플들 각각의 검사 대상 성질 보유 여부를 판정하기 위한 시스템으로서,
    제1 판정 기준값에 따라, 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단하는 제1 변이 검출부;
    상기 제1 변이 검출부에서 양성으로 판단된 풀의 대립형질빈도에 따라 상기 제1 변이 검출부의 판단 결과의 오류 가능성 존재 여부를 판단하는 오류 판단부;
    상기 오류 판단부에서 오류 가능성이 존재하는 것으로 판단되는 경우, 제2 판정 기준값에 따라 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단하는 제2 변이 검출부; 및
    상기 제1 변이 검출부 및 상기 제2 변이 검출부의 판단 결과에 따라 상기 복수 개의 샘플들 각각의 상기 검사 대상 성질 보유 여부를 판정하는 검사 결과 판정부를 포함하는 생물학적 샘플 분석 시스템.
  2. 청구항 1에 있어서,
    상기 오류 판단부는, 상기 제1 변이 검출부의 판단 결과 양성으로 판단된 풀의 대립형질빈도 및 해당 풀 내에 양성으로 판정된 샘플 개수를 비교하여 상기 오류 가능성 존재 여부를 판단하는, 생물학적 샘플 분석 시스템.
  3. 청구항 1에 있어서,
    상기 오류 판단부에서 오류 가능성이 존재하는 것으로 판단되는 경우, 상기 복수 개의 풀의 대립형질빈도가 유효한 신호 패턴을 가지는지의 여부를 판단하는 신호 패턴 판단부를 더 포함하는, 생물학적 샘플 분석 시스템.
  4. 청구항 3에 있어서,
    상기 신호 패턴 판단부는, 상기 복수 개의 풀 각각의 대립형질빈도를 2개의 군으로 군집화하고, 군집화된 각 군 별 대립형질빈도의 평균값을 이용하여 유효한 신호 패턴을 가지는지의 여부를 판단하는, 생물학적 샘플 분석 시스템.
  5. 청구항 4에 있어서,
    상기 신호 패턴 판단부는,
    상기 2개의 군 중 어느 하나의 군의 샘플당 대립형질빈도의 평균값이 0 내지 0.1 사이의 값을 가지고,
    나머지 군의 샘플당 대립형질빈도의 평균값이 0.4 내지 1 사이의 값을 가지는 경우 유효한 신호 패턴을 가지는 것으로 판단하는, 생물학적 샘플 분석 시스템.
  6. 청구항 3에 있어서,
    상기 제2 변이 검출부는, 상기 신호 패턴 판단부의 판단 결과 상기 복수 개의 풀의 대립형질빈도가 유효한 신호 패턴을 가지는 경우, 상기 제2 판정 기준값에 따라 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단하는, 생물학적 샘플 분석 시스템.
  7. 청구항 1에 있어서,
    상기 제2 판정 기준값은 상기 제1 판정 기준값보다 낮은 값인, 생물학적 샘플 분석 시스템.
  8. n * m 매트릭스를 구성하는 복수 개의 생물학적 샘플들, 및 상기 매트릭스에서 동일한 행(row) 또는 열(column)을 가지는 샘플들을 수합하여 생성된 복수 개의 풀(pool)을 이용하여 상기 복수 개의 샘플들 각각의 검사 대상 성질 보유 여부를 판정하기 위한 방법으로서,
    제1 변이 검출부에서, 제1 판정 기준값에 따라, 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단하는 제1 변이 검출 단계;
    오류 판단부에서, 상기 제1 변이 검출부에서 양성으로 판단된 풀의 대립형질빈도에 따라 상기 제1 변이 검출부의 판단 결과의 오류 가능성 존재 여부를 판단하는 단계;
    제2 변이 검출부에서, 오류 가능성 존재 여부를 판단하는 단계의 판단 결과 오류 가능성이 존재하는 것으로 판단되는 경우, 제2 판정 기준값에 따라 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단하는 제2 변이 검출 단계; 및
    검사 결과 판정부에서, 상기 제1 변이 검출부 및 상기 제2 변이 검출부의 판단 결과에 따라 상기 복수 개의 샘플들 각각의 상기 검사 대상 성질 보유 여부를 판정하는 단계를 포함하는 생물학적 샘플 분석 방법.
  9. 청구항 8에 있어서,
    상기 오류 가능성 존재 여부를 판단하는 단계는, 상기 제1 변이 검출부의 판단 결과 양성으로 판단된 풀의 대립형질빈도 및 해당 풀 내에 양성으로 판정된 샘플 개수를 비교하여 상기 오류 가능성 존재 여부를 판단하는, 생물학적 샘플 분석 방법.
  10. 청구항 8에 있어서,
    상기 오류 가능성 존재 여부를 판단하는 단계의 판단 결과 오류 가능성이 존재하는 것으로 판단되는 경우,
    신호 패턴 판단부에서, 상기 복수 개의 풀의 대립형질빈도가 유효한 신호 패턴을 가지는지의 여부를 판단하는 단계를 더 포함하는, 생물학적 샘플 분석 방법.
  11. 청구항 10에 있어서,
    상기 유효한 신호 패턴을 가지는지의 여부를 판단하는 단계는, 상기 복수 개의 풀 각각의 대립형질빈도를 2개의 군으로 군집화하고, 군집화된 각 군 별 대립형질빈도의 평균값을 이용하여 유효한 신호 패턴을 가지는지의 여부를 판단하는, 생물학적 샘플 분석 방법.
  12. 청구항 11에 있어서,
    상기 유효한 신호 패턴을 가지는지의 여부를 판단하는 단계는,
    상기 2개의 군 중 어느 하나의 군의 샘플당 대립형질빈도의 평균값이 0 내지 0.1 사이의 값을 가지고,
    나머지 군의 샘플당 대립형질빈도의 평균값이 0.4 내지 1 사이의 값을 가지는 경우 유효한 신호 패턴을 가지는 것으로 판단하는, 생물학적 샘플 분석 방법.
  13. 청구항 10에 있어서,
    상기 제2 변이 검출 단계는, 상기 신호 패턴 판단부의 판단 결과 상기 복수 개의 풀의 대립형질빈도가 유효한 신호 패턴을 가지는 경우, 상기 제2 판정 기준값에 따라 상기 복수 개의 풀 각각의 상기 검사 대상 성질 보유 여부를 판단하는, 생물학적 샘플 분석 방법.
  14. 청구항 8에 있어서,
    상기 제2 판정 기준값은 상기 제1 판정 기준값보다 낮은 값인, 생물학적 샘플 분석 방법.
KR1020140064878A 2014-05-29 2014-05-29 생물학적 샘플 분석 시스템 및 방법 KR20150137283A (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020140064878A KR20150137283A (ko) 2014-05-29 2014-05-29 생물학적 샘플 분석 시스템 및 방법
CN201410602027.8A CN105316223A (zh) 2014-05-29 2014-10-30 生物学样品分析系统及方法
SG10201407814VA SG10201407814VA (en) 2014-05-29 2014-11-25 System and method for analyzing biological sample
US14/556,628 US20150347674A1 (en) 2014-05-29 2014-12-01 System and method for analyzing biological sample

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140064878A KR20150137283A (ko) 2014-05-29 2014-05-29 생물학적 샘플 분석 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR20150137283A true KR20150137283A (ko) 2015-12-09

Family

ID=54702086

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140064878A KR20150137283A (ko) 2014-05-29 2014-05-29 생물학적 샘플 분석 시스템 및 방법

Country Status (4)

Country Link
US (1) US20150347674A1 (ko)
KR (1) KR20150137283A (ko)
CN (1) CN105316223A (ko)
SG (1) SG10201407814VA (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220161938A (ko) * 2021-05-31 2022-12-07 문병로 집합적 진단 제어 방법 및 그 시스템

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423534B (zh) * 2016-05-24 2021-08-06 郝柯 基因组拷贝数变异的检测方法和系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020172965A1 (en) * 1996-12-13 2002-11-21 Arcaris, Inc. Methods for measuring relative amounts of nucleic acids in a complex mixture and retrieval of specific sequences therefrom
IL153856A0 (en) * 2000-07-18 2003-07-31 Correlogic Systems Inc A process for discriminating between biological states based on hidden patterns from biological data
AU2002311897A1 (en) * 2001-05-09 2002-11-18 Third Wave Technologies, Inc. Nucleic acid detection in pooled samples
WO2005075678A1 (en) * 2004-02-10 2005-08-18 Yissum Research Development Company Of The Hebrew University Of Jerusalem Determination of genetic variants in a population using dna pools
EP2145185A4 (en) * 2007-04-30 2010-06-02 Nanogen Inc DOSAGE OF SEVERAL ANALYTES
AU2008319580B2 (en) * 2007-10-31 2014-02-27 Hendrix Genetics B.V. Method of pooling samples for performing a biological assay
WO2010096696A2 (en) * 2009-02-20 2010-08-26 Cold Spring Harbor Laboratory Harnessing high throughput sequencing for multiplexed specimen analysis

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220161938A (ko) * 2021-05-31 2022-12-07 문병로 집합적 진단 제어 방법 및 그 시스템
WO2022255547A1 (ko) * 2021-05-31 2022-12-08 문병로 집합적 진단 제어 방법 및 그 시스템

Also Published As

Publication number Publication date
SG10201407814VA (en) 2015-12-30
CN105316223A (zh) 2016-02-10
US20150347674A1 (en) 2015-12-03

Similar Documents

Publication Publication Date Title
Rice et al. Methods for handling multiple testing
CN111091868B (zh) 一种染色体非整倍体的分析方法及系统
KR20170000744A (ko) 유전자의 복제수 변이(cnv)를 분석하는 방법 및 장치
WO2019222757A1 (en) Inferring selection in white blood cell matched cell-free dna variants and/or in rna variants
KR101795662B1 (ko) 대사 이상 질환 진단 장치 및 그 방법
CN115394357A (zh) 用于判断样本配对或污染的位点组合及其筛选方法和应用
Weedon et al. Very rare pathogenic genetic variants detected by SNP-chips are usually false positives: implications for direct-to-consumer genetic testing
KR101936934B1 (ko) 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
KR101473705B1 (ko) 생물학적 샘플 분석 시스템 및 방법
KR20150137283A (ko) 생물학적 샘플 분석 시스템 및 방법
Ghansah et al. Comparison of molecular surveillance methods to assess changes in the population genetics of Plasmodium falciparum in high transmission
KR102217272B1 (ko) 유전체 변이 정보를 이용한 질병 진단 바이오마커 추출 방법
CN114694752B (zh) 预测同源重组修复缺陷的方法、计算设备和介质
CN114708908B (zh) 检测实体瘤微小残留病灶的方法、计算设备和存储介质
CN113257353B (zh) 基于reads深度进行目的基因外显子水平缺失检测的方法及装置
US20070134706A1 (en) Gene information display method and apparatus
Rao et al. Evaluating the performance of models for predicting the BRCA germline mutations in Han Chinese familial breast cancer patients
JP7064215B2 (ja) 落屑症候群又は落屑緑内障の発症リスクの判定方法
US20160265051A1 (en) Methods for Detection of Fetal Chromosomal Abnormality Using High Throughput Sequencing
CN113195741A (zh) 从循环核酸中鉴定全基因组序列数据中的全局序列特征
JP2021521857A (ja) 多発性骨髄腫の分子分類およびその適用
EP3921446A1 (en) In vitro method for the diagnosis of viral infections
WO2024140368A1 (zh) 一种样本交叉污染的检测方法和装置
JP7072803B2 (ja) 広義原発開放隅角緑内障の発症リスクの判定方法
JP2023038111A (ja) 広義原発開放隅角緑内障の重症化リスクに関する情報の取得方法

Legal Events

Date Code Title Description
N231 Notification of change of applicant
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid