KR101936934B1 - 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스 - Google Patents

염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스 Download PDF

Info

Publication number
KR101936934B1
KR101936934B1 KR1020160160637A KR20160160637A KR101936934B1 KR 101936934 B1 KR101936934 B1 KR 101936934B1 KR 1020160160637 A KR1020160160637 A KR 1020160160637A KR 20160160637 A KR20160160637 A KR 20160160637A KR 101936934 B1 KR101936934 B1 KR 101936934B1
Authority
KR
South Korea
Prior art keywords
mutation
base sequence
type
nucleotide sequence
analysis
Prior art date
Application number
KR1020160160637A
Other languages
English (en)
Other versions
KR20180060764A (ko
Inventor
김상우
김준호
Original Assignee
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단 filed Critical 연세대학교 산학협력단
Priority to KR1020160160637A priority Critical patent/KR101936934B1/ko
Publication of KR20180060764A publication Critical patent/KR20180060764A/ko
Application granted granted Critical
Publication of KR101936934B1 publication Critical patent/KR101936934B1/ko

Links

Images

Classifications

    • G06F19/18
    • G06F19/24

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Artificial Intelligence (AREA)

Abstract

본 발명은 대상샘플의 염기서열을 차세대 염기서열 분석 방법을 이용하여 염기서열을 획득하는 단계, 참조샘플의 염기서열과 대상샘플의 염기서열을 매칭하는 단계, 대상샘플의 염기서열 중 참조샘플의 염기서열과 불 일치하는 유전자 자리를 선별하는 단계 및 염기서열의 변이 유형에 따라 에러가 보정된 돌연변이 확률 산출방식으로 불 일치하는 유전자 자리 중에서 염기서열 변이 후보를 결정하는 단계를 포함하는, 염기서열의 변이 검출방법을 제공한다.

Description

염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스{METHODS FOR DETECTING NUCLEIC ACID SEQUENCE VARIATIONS AND A DEVICE FOR DETECTING NUCLEIC ACID SEQUENCE VARIATIONS USING THE SAME}
본 발명은 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스에 관한 것으로, 보다 구체적으로는 대상샘플 및 참조샘플의 염기서열을 매칭하고, 불 일치하는 자리에 대한 돌연변이 확률값을 산출함으로써 정밀도가 향상된, 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스에 관한 것이다.
대립유전자 (allele) 는 한 쌍으로 존재하는 염색체 내의 하나의 유전자 자리 (locus) 에 대하여 서로 다른 DNA 서열을 갖는 유전자를 의미할 수 있다. 이러한 대립유전자는 개체 내에서 일어난 돌연변이 등 여러 가지 요인에 의해 나타날 수 있다. 구체적으로, 하나의 개체 내에서 돌연변이가 일어난 유전자 자리는 정상의 유전자 자리와 상이한 염기서열을 나타낼 수 있고, 이 결과로 대립유전자가 나타날 수 있다. 이에 따라, 대립유전자를 탐색함으로써 개체 내에 존재하는 돌연변이를 검출할 수 있는 다양한 검사들이 개발되었다. 그러나, 저빈도로 존재하는 돌연변이의 경우, 기존의 검사 방법들은 이를 검출하는 것에 한계가 있었다.
예를 들어, 체성 돌연변이 (somatic mutation) 는 체세포에 생기는 유전자 돌연변이로, 의료분야에서 다양한 문제를 야기하는 것으로 알려져 있다. 특히 체성 돌연변이는 암과 관련되어 있을 수 있다. 이에 따라, 체성 돌연변이 프로파일링 (somatic mutation profiling) 은 암세포의 증식을 유발하는 기작의 변화를 빠르게 알아내는데 이용될 수 있으며, 체성 돌연변이 프로파일링은 종양학의 연구 도구로써 유용할 수 있다. 그러나, 체성 돌연변이는 배선 돌연변이 (germline mutation) 와 다르게 그 발현 비율이 1 % 미만인 경우도 많아 돌연변이를 찾아내는데 어려움이 많다.
이에 따라, 보다 효과적인 저빈도 돌연변이 검출방법들이 요구되고 있는 실정이다.
발명의 배경이 되는 기술은 본 발명에 대한 이해를 보다 용이하게 하기 위해 작성되었다. 발명의 배경이 되는 기술에 기재된 사항들이 선행기술로 존재한다고 인정하는 것으로 이해되어서는 안 된다.
차세대 염기서열 분석기술 (NGS, Next Generation Sequencing) 은 다수의 염기서열 분석 결과물을 산출이 가능하여, 고 처리량 염기서열 분석법 (high-throughput sequencing) 이다. 이러한 높은 밀도의 병행 염기서열 분석은 (parallel sequencing) 낮은 비율로 생겨난 돌연변이 검출에 효과적일 수 있다. 하지만, 라이브러리 제작을 위한 중합효소 연쇄반응도중 생겨나는 편향현상으로 인해, 1 % 이하의 낮은 비율의 돌연변이 유전자는 99 % 이상의 정상 유전자에서 나타난 거짓 양성 (false positive) 에 묻혀 검출이 어려울 수 있다. 이에 따라, 차세대 염기서열 분석기술을 이용한 돌연변이의 최소 검출 가능한 비율은 3 %에 불과한 실정이다.
이상의 문제점을 해결하기 위해, 연구자들은 동일한 유전자 자리를 여러 번 읽는, 뎁스 (depth) 를 높이는 방법을 이용하여 저빈도의 돌연변이 검출의 한계 수치를 높이고자 하였다. 그러나, 이로 인해 거짓 양성 비율 (false positive rate), 즉 검출을 위한 분석의 오류도 함께 증가하였고, 이러한 현상은 정밀도 높은 저빈도의 돌연변이 검출을 위해 여전히 해결해야 할 과제로 남아있다.
이에, 본 발명의 발명자들은 돌연변이 확률값을 보정함으로써 거짓 양성 비율을 줄이고, 정밀도 높은 저빈도의 돌연변이 검출이 가능한 염기서열의 변이 검출방법을 제공할 수 있음을 인식하였다.
이에 본 발명의 해결하고자 하는 과제는 염기서열의 변이 유형에 따라 에러가 보정된 돌연변이 확률값을 제공함으로써, 분석에러를 줄일 수 있고 저빈도 염기서열의 변이를 검출할 수 있도록 정밀도가 향상된, 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스를 제공하는 것이다.
본 발명의 발명자들은 분석 플랫폼 유형에 따라, 나타나는 염기서열의 변이 유형의 분석에러가 다른 것을 인식하였다.
이에, 본 발명의 해결하고자 하는 다른 과제는 분석 플랫폼 유형 및 염기서열의 변이 유형을 고려하여 에러가 보정된 돌연변이 확률값을 제공하여, 분석 플랫폼 유형에 따라 정밀도 높게 저빈도 염기서열의 변이를 검출할 수 있는, 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스를 제공하는 것이다.
본 발명의 과제들은 이상에서 언급한 과제들로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
전술한 바와 같은 과제를 해결하기 위하여 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법은 대상샘플의 염기서열을 차세대 염기서열 분석 (NGS, next generation sequencing) 방법을 이용하여 염기서열을 획득하는 단계, 참조샘플의 염기서열과 대상샘플의 염기서열을 매칭 (matching) 하는 단계, 대상샘플의 염기서열 중 참조샘플의 염기서열과 불 일치하는 유전자 자리를 선별하는 단계 및 염기서열의 변이 유형에 따라 에러가 보정된 돌연변이 확률 산출방식으로 불 일치하는 유전자 자리 중에서 염기서열 변이 후보를 결정하는 단계를 포함한다.
본 발명의 다른 특징에 따르면, 염기서열 변이 후보를 결정하는 단계는, 불 일치하는 유전자 자리의 돌연변이 확률값이 미리 결정된 수준 이상일 경우, 불 일치하는 유전자 자리를 염기서열 변이 후보로 결정하는 단계를 더 포함할 수 있다.
본 발명의 또 다른 특징에 따르면, 염기서열의 변이 유형은, C에서 A로 변이, G에서 A로 변이, T에서 A로 변이, A에서 C로 변이, G에서 C로 변이, T에서 C로 변이, G에서 T로변이, C에서 T로 변이, A에서 T로 변이, T에서 G로 변이, C에서 G로 변이 및 A에서 G로 변이로 이루어진 그룹으로부터 선택된 적어도 하나의 염기서열의 변이 유형일 수 있다.
본 발명의 또 다른 특징에 따르면, 돌연변이 확률값은, 분석 플랫폼 유형에 따라 염기서열의 변이 유형별 분석에러 및 분석에러의 base call quality 점수를 포함하는 분석에러 프로파일을 결정하고, 분석에러 프로파일을 기초로, 적어도 하나 이상의 염기서열의 변이 유형에 대하여 보정된 돌연변이 확률값일 수 있다.
본 발명의 또 다른 특징에 따르면, 분석에러 프로파일은, 대상샘플의 염기서열 중 불 일치하는 유전자 자리의 전, 후로 존재하는 염기서열의 정보를 더 포함할 수 있다.
본 발명의 또 다른 특징에 따르면, 분석 플랫폼 유형이 Illumina hybrid-capture일 경우, 염기서열의 변이 유형별 분석에러 중 C에서 A로 변이 및 G에서 T로 변이 유형에 대한 분석에러의 확률은 나머지 염기서열의 변이 유형의 분석에러의 확률보다 높을 수 있다.
본 발명의 또 다른 특징에 따르면, 분석 플랫폼 유형이 Illumina Amplicon일 경우, 염기서열의 변이 유형 중 G에서 A로 변이, C에서 T로 변이, T에서 A로 변이, A에서 T로 변이, T에서 C로 변이 및 A에서 G로 변이 유형에 대한 분석에러의 확률은 나머지 염기서열의 변이 유형의 분석에러의 확률보다 높을 수 있다.
본 발명의 또 다른 특징에 따르면, 분석 플랫폼 유형이 IonTorrent Amplicon일 경우, 염기서열의 변이 유형 중 G에서 A로 변이, C에서 T로 변이, A에서 C로 변이, T에서 G로 변이, T에서 C로 변이 및 A에서 G로 변이 유형에 대한 분석에러의 확률은 나머지 염기서열의 변이 유형의 분석에러의 확률보다 높을 수 있다.
본 발명의 또 다른 특징에 따르면, 획득하는 단계는 뎁스가 50 내지 5,000으로 설정된 Illumina hybrid-capture을 이용하여 염기서열을 획득하는 단계를 더 포함할 수 있다.
본 발명의 또 다른 특징에 따르면, 획득하는 단계는 뎁스가 100 내지 20,000으로 설정된 Illumina Amplicon을 이용하여 염기서열을 획득하는 단계를 더 포함할 수 있다.
본 발명의 또 다른 특징에 따르면, 획득하는 단계는 뎁스가 100 내지 20,000으로 설정된 IonTorrent Amplicon을 이용하여 염기서열을 획득하는 단계를 더 포함할 수 있다.
본 발명의 또 다른 특징에 따르면, 참조샘플은, 차세대 염기서열 분석 방법을 이용하여 획득할 수 있다.
본 발명의 또 다른 특징에 따르면, 염기서열의 변이는, 저빈도 체성 돌연변이, 샘플의 오염으로 인한 염기서열의 변이 및 유전병으로 인한 염기서열의 변이로 이루어진 그룹으로부터 선택된 적어도 하나를 포함할 수 있다.
전술한 바와 같은 과제를 해결하기 위하여 본 발명의 일 실시예에 따른 염기서열의 변이 검출 디바이스는, 통신부와 동작 가능하게 연결된 프로세서를 포함하고, 프로세서는, 통신부를 통해 대상샘플의 염기서열을 차세대 염기서열 분석 방법을 이용하여 분석된 염기서열을 획득하고, 참조샘플의 염기서열과 대상샘플의 염기서열을 매칭하고, 대상샘플의 염기서열 중 참조샘플의 염기서열과 불 일치하는 유전자 자리를 선별하고, 염기서열의 변이 유형에 따라 에러가 보정된 산출방식으로 산출한, 불 일치하는 유전자 자리의 돌연변이 확률값을 기초로, 불 일치하는 유전자 자리를 염기서열 변이 후보로 결정하도록 구성된다.
본 발명의 다른 특징에 따르면, 프로세서는, 염기서열 변이 후보의 돌연변이 확률값이 일정 수준 이상일 경우, 염기서열 변이 후보를 염기서열 변이로 결정하도록 더 구성될 수 있다.
본 발명의 또 다른 특징에 따르면, 돌연변이 확률값은, 분석 플랫폼 유형에 따라 염기서열의 변이 유형별 분석에러 및 분석에러의 base call quality 점수를 포함하는 분석에러 프로파일을 결정하고, 분석에러 프로파일을 기초로, 적어도 하나 이상의 염기서열의 변이 유형에 대하여 보정된 돌연변이 확률값일 수 있다.
본 발명의 또 다른 특징에 따르면, 분석에러 프로파일은, 대상샘플의 염기서열 중 불 일치하는 유전자 자리의 전, 후로 존재하는 염기서열 정보를 더 포함할 수 있다.
본 발명은 염기서열의 변이 유형에 따라 에러가 보정된 돌연변이 확률값을 제공함으로써, 분석에러를 줄여 저빈도 염기서열의 변이를 검출할 수 있는 효과가 있다. 이에 따라, 본 발명은 정밀도 향상된 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스를 제공할 수 있는 효과가 있다.
또한, 본 발명은 분석 플랫폼 유형 및 염기서열의 변이 유형을 고려하여 에러가 보정된 돌연변이 확률값을 제공함으로써, 분석 플랫폼 유형에 따라 정밀도 높게 저빈도 염기서열의 변이를 검출할 수 있는, 염기서열의 변이 검출방법 및 염기서열의 변이 검출 디바이스를 제공할 수 있는 효과가 있다.
구체적으로, 본 발명은 분석 플랫폼 유형에 따른 염기서열의 변이 유형과 이의 base call quality 점수를 포함하는 분석에러 프로파일을 제공할 수 있고, 이를 기초로 에러가 보정된 돌연변이 확률값을 제공할 수 있는 효과가 있다.
또한, 본 발명은 참조샘플과 불 일치하는 대상샘플의 유전자 자리에 대한 에러가 보정된 확률값이 미리 결정된 수준 이상일 경우, 불 일치하는 유전자 자리를 염기서열 변이 후보로 결정할 수 있는 효과가 있다.
더 나아가, 본 발명은 저빈도 돌연변이뿐만 아니라, 염기서열 분석하고자 하는 샘플이 오염 또는 채취의 어려움으로 인해, 타 샘플 내에서 소량으로 존재할 경우, 이의 검출, 더 나아가 염기서열 분석의 정밀도를 높일 수 있는 효과가 있다.
본 발명에 따른 효과는 이상에서 예시된 내용에 의해 제한되지 않으며, 더욱 다양한 효과들이 본 명세서 내에 포함되어 있다.
도 1은 본 발명의 일 실시예에 따른 염기서열의 변이 검출 디바이스의 개략적인 구성을 도시한 블록도이다.
도 2는 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법을 설명하기 위한 순서도이다.
도 3a는 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법에서 돌연변이 확률값의 보정을 설명하기 위한 순서도이다.
도 3b는 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법에서 제공하는 돌연변이 확률값의 보정을 위한 분석 플랫폼유형에 따른 염기서열의 변이 유형별 전체 분석에러 수 대비 라이브러리 제작 단계에서 생긴 분석에러의 비를 도시한 것이다.
도 3c는 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법에서 제공하는 Illumina hybrid-capture 분석 플랫폼의 분석에러 프로파일을 그래프로 도시한 것이다.
도 3d는 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법에서 제공하는 Illumina Amplicon 분석 플랫폼의 분석에러 프로파일을 그래프로 도시한 것이다.
도 3e는 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법에서 제공하는 IonTorrent Amplicon 분석 플랫폼의 분석에러 프로파일을 그래프로 도시한 것이다.
도 4a는 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법 및 종래의 검출방법을 Illumina hybrid-capture에 적용함에 따라 측정된, 염기서열의 변이 검출의 정밀도, 민감도, F-점수 및 거짓 양성 비율의 결과를 도시한 것이다.
도 4b는 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법 및 종래의 검출방법을 Illumina Amplicon에 적용함에 따라 측정된, 염기서열의 변이 검출의 정밀도, 민감도, F-점수 및 거짓 양성 비율의 결과를 도시한 것이다.
도 4c는 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법 및 종래의 검출방법을 IonTorrent Amplicon에 적용함에 따라 측정된, 염기서열의 변이 검출의 정밀도, 민감도, F-점수 및 거짓 양성 비율의 결과를 도시한 것이다.
발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 발명의 실시예를 설명하기 위한 도면에 개시된 형상, 크기, 비율, 각도, 개수 등은 예시적인 것이므로 본 발명이 도시된 사항에 한정되는 것은 아니다. 또한, 본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명은 생략한다. 본 명세서 상에서 언급된 '포함한다', '갖는다', '이루어진다' 등이 사용되는 경우, '~만'이 사용되지 않는 이상 다른 부분이 추가될 수 있다. 구성요소를 단수로 표현한 경우에 특별히 명시적인 기재 사항이 없는 한 복수를 포함하는 경우를 포함한다.
구성요소를 해석함에 있어서, 별도의 명시적 기재가 없더라도 오차 범위를 포함하는 것으로 해석한다.
본 발명의 여러 실시예들의 각각 특징들이 부분적으로 또는 전체적으로 서로 결합 또는 조합 가능하며, 당업자가 충분히 이해할 수 있듯이 기술적으로 다양한 연동 및 구동이 가능하며, 각 실시예들이 서로에 대하여 독립적으로 실시 가능할 수도 있고 연관 관계로 함께 실시 가능할 수도 있다.
본 명세서의 해석의 명확함을 위해, 이하에서는 본 명세서에서 사용되는 용어들을 정의하기로 한다.
본 명세서에서 사용되는 용어, "차세대 염기서열 분석"은 유전체의 염기서열 분석기술 중 하나로, DNA 조각을 병렬로 처리함으로써 염기서열을 고속으로 분석할 수 있다. 이러한 특징으로, 차세대 염기서열 분석은 고 처리율 시퀀싱 (high-throughput sequencing), 대용량 병렬 시퀀싱 (massive parallel sequencing) 또는 2세대 시퀀싱 (second-generation sequencing) 으로 불릴 수 있다. 또한, 차세대 염기서열 분석은 목적에 따라 다양한 분석 플랫폼으로 이용될 수 있다. 예를 들어, 차세대 염기서열 분석의 분석 플랫폼은 Roche 454, GS FLX Titanium, Illumina MiSeq, Illumina HiSeq, Illumina Genome Analyzer IIX, Life Technologies SOLiD4, Life Technologies Ion Proton, Life Technologies Ion Proton, Complete Genomics, Helicos Biosciences Heliscope, Pacific Biosciences SMRT등이 있을 수 있다. 더 나아가, 차세대 염기서열 분석기술은 염기서열의 변이 검출에 이용 될 수 있다. 염기서열의 변이 검출을 위한 바람직한 분석 플랫폼은 Illumina hybrid-capture, Illumina Amplicon 및 IonTorrent Amplicon일 수 있으나, 이에 제한되는 것은 아니다.
본 명세서에서 사용되는 용어, "염기서열 변이"는 여러 가지 요인으로 인해, 유전체 일어나는 염기서열의 변이를 의미할 수 있다. 예를 들어, 염기서열의 변이는 체성 돌연변이, 샘플의 오염으로 인한 염기서열의 변이 및 유전병으로 인한 염기서열의 변이일 수 있고 더 나아가, 염기서열 변이는 산모의 혈액 내에서, 모체 DNA와 함께 소량으로 존재하는 태아의 DNA로 인해 나타날 수 있는, 대립유전자에 의한 염기서열 변이, 뇌 세포 안에서 소량으로 존재하는 돌연변이를 더 포함할 수 있다. 그러나 염기서열 변인은 전술한 것에 제한되는 것은 아니다.
체성 돌연변이는 체세포에 생기는 유전자 돌연변이를 의미하며, 이러한 돌연변이는 의료분야에서 다양한 문제를 야기할 수 있다. 특히 체성 돌연변이는 암과 관련 있을 수 있다. 이에 따라, 검출하고자 하는 염기서열의 변이는 1 % 이하의 저빈도의 체성 돌연변이일 수 있다.
본 명세서에서 사용되는 용어, "유전자 자리"는 분석된 유전체의 염기서열 중 특정한 위치의 염기서열을 의미할 수 있다. 유전자 자리의 염기서열은 단일 염기서열일 수 있으나 이에 제한되지 않고 연속된 2개 이상의 염기서열일 수도 있다.
본 명세서에서 사용되는 용어, "염기서열의 변이 유형"은 유전체의 염기서열 분석에 있어서, 돌연변이 또는 분석에러로 인해 유전자 자리가 가지는 진짜 염기서열과 다르게 분석될 수 있는 단일 염기서열 (A, T, C, G) 의 변이 유형을 의미할 수 있다. 그러나, 이에 제한되어 해석되어서는 안 된다. 염기서열의 변이 유형은 C에서 A로 변이, G에서 A로 변이, T에서 A로 변이, A에서 C로 변이, G에서 C로 변이, T에서 C로 변이, G에서 T로변이, C에서 T로 변이, A에서 T로 변이, T에서 G로 변이, C에서 G로 변이 및 A에서 G로 변이일 수 있다. 예를 들어, C에서 A로 변이는 C 염기에 대하여 염기서열 분석의 에러 또는 돌연변이로 인해 A로 염기서열 분석되는 변이 유형일 수 있다.
본 명세서에서 사용되는 용어, "뎁스"는 차세대 염기서열 분석에서 하나의 유전자 자리에 대하여 분석되는 정도를 의미할 수 있다. 이때, 뎁스가 높아짐에 따라 유전자 자리를 염기서열 분석한 리드가 증가할 수 있다. 뎁스를 높이는 방법으로, 저 빈도로 존재하는 돌연변이를 검출 할 수 있지만, 이로 인해 거짓 양성 비율, 즉 검출을 위한 분석의 오류도 함께 증가할 수 있다. 이와 대조적으로, 본 발명의 염기서열 변이 검출방법은 뎁스가 증가함에도 낮은 거짓 양성 비율을 유지할 수 있다. 이에 따라, 분석 플랫폼이 Illumina hybrid-capture인 경우, 본 발명의 염기서열 변이 검출방법에 따른 저빈도로 존재하는 돌연변이 검출을 위한 뎁스는 50 내지 5,000일 수 있다. 바람직하게, Illumina hybrid-capture에서의 뎁스는 100 내지 1,000일 수 있지만 이에 제한되는 것은 아니다. 또한, 분석 플랫폼이 Illumina Amplicon인 경우, 본 발명의 염기서열 변이 검출방법에 따른 저빈도로 존재하는 돌연변이 검출을 위한 뎁스는 100 내지 20,000일 수 있다. 바람직하게, Illumina Amplicon에서의 뎁스는 100 내지 10,000일 수 있지만 이에 제한되는 것은 아니다. 더 나아가, 분석 플랫폼이 IonTorrent Amplicon인 경우, 본 발명의 염기서열 변이 검출방법에 따른 저빈도로 존재하는 돌연변이 검출을 위한 뎁스는 100 내지 20,000일 수 있다. 바람직하게, Illumina Amplicon에서의 뎁스는 100 내지 10,000일 수 있지만 이에 제한되는 것은 아니다.
본 명세서에서 사용되는 용어, "대상샘플"은 염기서열의 변이를 확인하고자 하는 환자로부터 수득한 생물학적 시료일 수 있고, 본 명세서에서 사용되는 용어, "참조샘플"은 대상샘플과 대조적으로 염기서열의 변이가 나타나지 않은 정상의 생물학적 시료일 수 있다. 바람직한 대상샘플은 체성 돌연변이와 연관된 종양세포일 수 있고, 바람직한 참조샘플은 정상의 세포에 대하여 미리 염기서열 분석된 데이터일 수 있으나, 이에 제한되는 것은 아니다. 예를 들어, 참조샘플은 대상샘플에 따라 다양하게 선택될 수 있으며, 이의 염기서열은 대상샘플의 염기서열과 함께 분석 될 수도 있다.
대상샘플 내의 염기서열의 변이는 참조샘플에서 분석된 염기서열과 대상샘플의 염기서열을 비교하여 검출 할 수 있다. 예를 들어, 대상샘플의 염기서열을 분석한 후, 참조샘플 염기서열과 매칭한다. 그 다음, 참조샘플의 염기서열과 불 일치하는 대상샘플의 유전자 자리를 선별하고, 불 일치하는 유전자 자리에 대한 돌연변이 확률값을 기초로 대상샘플 내의 염기서열의 변이 후보를 결정할 수 있다.
여기서, "돌연변이 확률값"은 참조샘플과 불 일치하는 대상샘플의 유전자 자리가 염기서열 분석의 에러인지, 진짜 염기서열 변이인지 결정할 수 있는 지표가 될 수 있다. 예를 들어, 불 일치하는 대상샘플의 유전자 자리에 대한 염기서열의 변이 후보로의 결정은 불 일치하는 대상샘플의 유전자 자리에 대한 돌연변이 확률값을 기초로 수행될 수 있다. 예를 들어, 불 일치하는 자리에 대한 돌연변이 확률값이 미리 결정된 수준 이상인 경우, 불 일치하는 유전자 자리는 대상샘플의 염기서열 변이 후보로 결정될 수 있다. 그러나, 이에 제한되는 것은 아니다. 여기서, 불 일치하는 자리의 돌연변이 확률값은 전술한 바와 같이 다양한 염기서열의 변이 유형을 고려하여 보정된 돌연변이 확률값일 수 있다. 구체적으로, 염기서열의 변이 유형을 고려하여 보정된 돌연변이 확률값은, 분석 플랫폼 유형에 따라 염기서열의 변이 유형별 분석에러 및 이들의 base call quality 점수를 포함하는 분석에러 프로파일을 기초로 보정될 수 있다. 여기서 "base call quality 점수"는 특정 유전자 자리에 대하여 염기서열 분석 디바이스가 불러온 (calling) 염기의 신뢰점수 일 수 있다. 보다 구체적으로, base call quality 점수는 시퀀싱 단계에서 생긴 분석에러와 연관될 수 있다. 예를 들어, base call quality 낮은 불 일치하는 유전자 자리는 분석에러로 결정될 수 있고, base call quality 점수가 높은 불 일치하는 유전자 자리는 돌연변이로 결정될 수 있다. 그 결과, base call quality 점수가 높은 유전자 자리의 돌연변이 확률값은 base call quality 점수가 낮은 불 일치하는 유전자 자리보다 높을 수 있다. 그러나, 시퀀싱 전 단계의 라이브러리 제작 단계에서 생긴 분석에러는 base call quality 점수에 의존적이지 않을 수 있다. 이에 따라, 염기서열의 변이 유형을 고려한 돌연변이 확률값은 분석 플랫폼에 따른 base call quality 점수가 높은 분석에러의 염기서열의 변이 유형을 선별하고, 이에 대한 정보를 포함하는 분석에러 프로파일을 결정한다. 그 다음, 결정된 분석에러 프로파일을 기초로 염기서열의 변이 유형에 대한 돌연변이 확률값이 보정될 수 있다.
본 명세서에서 사용되는 용어, "염기서열의 변이 유형에 따라 에러가 보정된 산출방식"은 전술한 분석에러 프로파일을 기초로 보정된, 돌연변이 확률값 산출방식일 수 있다. 예를 들어, base call quality 점수가 다른 염기서열의 변이 유형보다 높은 분석에러의 염기서열의 변이 유형을 가질 수 있는 참조샘플과 불 일치하는 유전자 자리의 경우, 불 일치하는 유전자 자리에 대한 분석에러 확률값은 나머지 염기서열의 변이 유형을 가졌을 경우보다 높게 보정될 수 있다. 이에 따라, 불 일치하는 유전자 자리에 대한 돌연변이 확률값은 다른 염기서열의 변이 유형을 갖는 경우보다 낮게 보정될 수 있다. 이와 대조적으로, base call quality 점수가 다른 염기서열의 변이 유형보다 낮은 분석에러의 염기서열의 변이 유형을 가질 수 있는 참조샘플과 불 일치하는 유전자 자리의 경우, 불 일치하는 유전자 자리에 대한 분석에러 확률값은 다른 염기서열의 변이 유형을 가졌을 경우보다 낮게 보정될 수 있다. 그 결과로, 불 일치하는 유전자 자리에 대한 돌연변이 확률값은 높게 보정될 수 있다. 이에 따라, 본 발명의 염기서열의 변이 검출방법은 유전자 자리에 대한 염기서열을 고려할 수 있는, 염기서열의 변이 유형에 따라 에러가 보정된 돌연변이 확률값을 제공할 수 있다. 이를 통해, 본 발명은 불 일치하는 유전자 자리에 대하여 분석에러와 돌연변이를 정밀도 높은 판별을 제공할 수 있다.
이하에서는, 도 1을 참조하여, 본 발명의 일 실시예에 따른 염기서열의 변이 검출 디바이스를 설명한다.
도 1은 본 발명의 일 실시예에 따른 염기서열의 변이 검출 디바이스의 개략적인 구성을 도시한 블록도이다. 도 1을 참조하면, 염기서열의 변이 검출 디바이스 (100) 는 통신부 (110), 입력부 (120), 표시부 (130), 저장부 (140) 및 프로세서 (150) 를 포함한다.
통신부 (110) 를 통해, 염기서열의 변이 검출 디바이스 (100) 는 대상샘플의 염기서열을 차세대 염기서열 분석 방법을 이용하여 분석된 염기서열을 획득할 수 있다.
입력부 (120) 는 키보드, 마우스, 터치 스크린 패널 등 제한되지 않는다. 사용자는 입력부 (120) 를 통해 염기서열의 변이 검출 디바이스 (100) 를 설정하고, 이의 동작을 지시할 수 있다.
표시부 (130) 는 사용자로부터 용이하게 염기서열의 변이 검출 디바이스 (100) 의 설정이 가능한 메뉴들을 표시할 수 있다. 더 나아가, 표시부 (130) 는 불 일치하는 유전자 자리에 대한 돌연변이 확률값을 기초로 결정한 대상샘플의 염기서열 변이 후보를 사용자가 용이하게 인식할 수 있도록 표시할 수 있다. 이때, 표시부 (130) 는 액정 표시 장치, 유기 발광 표시 장치 등을 포함하는 표시 장치로서, 메뉴들이 사용자에게 디스플레이 되도록 할 수 있다. 또한, 표시부 (130) 는 전술된 것 이외에 본 발명의 목적을 달성할 수 있은 범위 내에서 다양한 형태 또는 방법으로 구현될 수 있다.
저장부 (140) 는 통신부 (110) 를 통해 획득한 대상샘플의 염기서열을 저장할 수 있다. 또한, 불 일치하는 유전자 자리에 대한 돌연변이 확률값을 기초로 결정한 대상샘플의 염기서열 변이 후보를 저장할 수 있다.
프로세서 (150) 는 본 발명의 일 실시예에 따른 염기서열의 변이 검출 디바이스 (100) 를 동작시키기 위한 다양한 명령들을 수행한다. 프로세서 (150) 는 통신부 (110) 와 연결되어, 통신부 (110) 를 통해 대상샘플의 염기서열을 차세대 염기서열 분석 방법을 이용하여 분석한 염기서열을 획득하고, 참조샘플의 염기서열과 대상샘플의 염기서열을 매칭하고, 대상샘플의 염기서열 중 참조샘플의 염기서열과 불 일치하는 유전자 자리를 선별하고, 염기서열의 변이 유형에 따라 에러가 보정된 산출방식으로 산출한, 불 일치하는 유전자 자리의 돌연변이 확률값을 기초로, 불 일치하는 유전자 자리를 염기서열 변이 후보로 결정하도록 구성된다.
이하에서는, 도 2를 참조하여, 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법에 대해 구체적으로 설명한다.
도 2는 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법을 설명하기 위한 순서도이다.
먼저, 대상샘플의 염기서열을 차세대 염기서열 분석 방법을 이용하여 염기서열을 획득한다 (S210). 이때, 획득하는 단계 (S210) 에서는 참조샘플에 대한 염기서열이 없는 경우, 참조샘플에 대한 염기서열분석이 대상샘플의 염기서열 분석과 함께 수행될 수 있다. 예를 들어, 참조샘플과 대상샘플 각각은 복수 개의 리드를 포함할 수 있고, 이 복수 개의 리드들은 참조서열 (reference sequence) 과 매핑 (mapping) 되어 최종 적으로, 획득하는 단계 (S210) 에서는 분석된 참조샘플의 염기서열과 대상샘플의 염기서열을 수집할 수 있다.
그 다음, 참조샘플의 염기서열과 대상샘플의 염기서열을 매칭한다 (S220). 선택적으로, 매칭하는 단계 (S220) 에서는 참조샘플의 염기서열과 하나의 대상샘플에 대한 염기서열이 매칭되고, 이의 결과로 대상샘플의 염기서열이 참조샘플의 염기서열에 매칭될 수 있다. 예를 들어, 매칭하는 단계 (S220) 에서는 획득하는 단계 (S210) 에서 수집한 참조샘플의 염기서열 및 대상샘플의 염기서열을 유전자 자리 별로 비교할 수 있다.
다음으로, 대상샘플의 염기서열 중 참조샘플의 염기서열과 불 일치하는 유전자 자리를 선별한다 (S230). 이때, 참조샘플의 염기서열과 불 일치하는 유전자 자리는 염기서열 변이 또는 염기서열 분석의 에러일 수 있다.
마지막으로, 염기서열의 변이 유형에 따라 에러가 보정된 산출방식으로 산출된, 불 일치하는 유전자 자리에 대한 돌연변이 확률값을 기초로, 불 일치하는 유전자 자리를 염기서열 변이 후보로 결정한다 (S240). 다른 실시예에 따르면, 결정하는 단계 (S240) 에서는 선택적으로, 불 일치하는 유전자 자리에 대한 돌연변이 확률값이 미리 결정된 수준 이상인 경우, 이 불 일치하는 유전자 자리를 염기서열 변이 후보로 결정할 수 있다. 다양한 실시예에 따르면, 결정하는 단계 (S240) 에서 불 일치하는 유전자 자리는 돌연변이 확률값과 무관하게, 분석에러로 결정될 수 있다. 예를 들어, 참조샘플과 대상샘플의 매핑 quality가 미리 결정된 수준 이하일 경우, 분석된 대상샘플의 염기들의 대다수가 base call quality 점수가 미리 결정된 수준 이하일 경우, 유전자 자리에 대한 복수의 리드들이 삽입 또는 결실이 미리 결정된 수준 이상을 나타내는 경우, 복수의 리드들 각각의 불 일치하는 유전자 자리가 미리 결정된 수준 이상을 나타내는 경우, 변이가 매칭 대조군 데이터에서 나타난 경우, 이들 대상샘플의 유전자 자리는 돌연변이 확률값과 상관없이, 분석에러로 결정될 수 있다. 그러나, 유전자 자리에 대한 분석에러의 결정은 전술한 것에 제한되는 것은 아니다.
결정하는 단계 (S240) 에서 다양한 변수들을 고려하여 결정된 염기서열 변이 후보를 제공함으로써, 본 발명의 일 실시예에 따른 염기서열 변이 검출방법 및 이를 이용한 디바이스는 정밀도 높게 염기서열 변이를 검출하여 이를 사용자에게 제공할 수 있다.
이하에서는, 도 3a를 참조하여, 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법에서 제공하는, 불 일치하는 유전자 자리에 대한 돌연변이 확률값의 보정방법에 대해 구체적으로 설명한다.
도 3a는 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법에서 제공하는 돌연변이 확률값의 보정을 설명하기 위한 순서도이다.
먼저, 분석에러 확률값은 염기서열의 변이 유형을 고려하여 보정된 값으로 제공된다. 구체적으로, 분석 플랫폼 유형에 따라 염기서열의 변이 유형별 분석에러 및 이들의 base call quality 점수를 포함하는 분석에러 프로파일을 결정한다 (S310). 보다 구체적으로, 하나의 유전자 자리는 base call quality 점수가 높아짐에 따라 이의 돌연변이 확률이 높아질 수 있다. 이에 따라, 분석에러 프로파일을 결정하는 단계 (S310) 에서는 염기서열의 변이 유형을 고려한 분석에러의 보정을 위해, 분석 플랫폼에 따른 base call quality 점수가 높은 분석에러의 염기서열의 변이 유형을 선별할 수 있다. 예를 들어, 분석 플랫폼이 Illumina hybrid-capture일 경우, 염기서열의 변이 유형별 분석에러 중 C에서 A로 변이 및 G에서 T로 변이 유형의 base call quality 점수는 나머지 유형의 변이보다 높을 수 있다. 즉, Illumina hybrid-capture 에서, C에서 A로 변이 및 G에서 T로 변이 유형은 실제로는 분석에러이지만, 돌연변이로 출력되는 검출의 오류를 범할 수 있다. 또한, 분석 플랫폼이 Illumina Amplicon일 경우, 염기서열의 변이 유형 중 G에서 A로 변이, C에서 T로 변이, T에서 A로 변이, A에서 T로 변이, T에서 C로 변이 및 A에서 G로 변이 유형의 base call quality 점수는 나머지 유형의 변이보다 높을 수 있다. 더 나아가, 분석 플랫폼이 IonTorrent Amplicon일 경우, 염기서열의 변이 유형 중 G에서 A로 변이, C에서 T로 변이, A에서 C로 변이, T에서 G로 변이, T에서 C로 변이 및 A에서 G로 변이 유형의 base call quality 점수는 나머지 유형의 변이보다 높을 수 있다. 결과적으로, 분석에러 프로파일을 결정하는 단계 (S310) 에서는 전술한 분석 플랫폼 유형에 따른 염기서열의 변이 유형별 분석에러 및 이의 base call quality 점수를 포함하는 분석에러 프로파일을 결정할 수 있다. 추가적으로, 분석에러 프로파일은 대상샘플의 염기서열 중 불 일치하는 유전자 자리의 전, 후로 존재하는 염기서열의 정보를 더 포함할 수 있다.
그 다음, 분석에러 프로파일을 결정하는 단계 (S310) 에서 결정된 분석에러 프로파일을 기초로 분석 플랫폼 유형에 따라 염기서열의 변이 유형에 대한 분석에러의 확률값이 보정된다 (S320). 예를 들어, Illumina hybrid-capture에 대하여, 염기서열의 변이 유형별 분석에러 중 C에서 A로 변이 및 G에서 T로 변이 유형에 대한 분석에러의 확률값을 나머지 염기서열의 변이 유형의 분석에러 확률값보다 높게 보정할 수 있다. 또한, Illumina Amplicon에 대하여, 염기서열의 변이 유형 중 G에서 A로 변이, C에서 T로 변이, T에서 A로 변이, A에서 T로 변이, T에서 C로 변이 및 A에서 G로 변이 유형에 대한 분석에러의 확률값을 나머지 염기서열의 변이 유형의 분석에러의 확률값보다 높게 보정할 수 있다. 더 나아가, IonTorrent Amplicon에 대하여, 염기서열의 변이 유형 중 G에서 A로 변이, C에서 T로 변이, A에서 C로 변이, T에서 G로 변이, T에서 C로 변이 및 A에서 G로 변이 유형에 대한 분석에러의 확률값을 나머지 염기서열의 변이 유형의 분석에러의 확률값보다 높게 보정할 수 있다. 결과적으로, 불 일치하는 유전자 자리에 대한 분석에러 확률값은, 분석에러 확률값 보정단계 (S320) 를 통해 보정된, 분석에러 확률값으로 산출된다. 이에 따라, 불 일치하는 유전자 자리에 대한 염기서열을 고려하여 산출된 분석에러 확률값 및 돌연변이 확률값을 기초로 대상샘플의 염기서열 변이 후보가 결정될 수 있다.
이하에서는, 도 3b, 3c, 3d 및 3e를 참조하여, 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법에서 제공하는, 분석에러 프로파일 결정하는 방법에 대하여 구체적으로 설명한다.
도 3b는 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법에서 제공하는 돌연변이 확률값의 보정을 위한 분석 플랫폼유형에 따른 염기서열의 변이 유형별 전체 분석에러 수 대비 라이브러리 제작 단계에서 생긴 분석에러의 비를 도시한 것이다. 도 3c는 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법에서 제공하는 Illumina hybrid-capture 분석 플랫폼의 분석에러 프로파일을 그래프로 도시한 것이다. 도 3d는 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법에서 제공하는 Illumina Amplicon 분석 플랫폼의 분석에러 프로파일을 그래프로 도시한 것이다. 도 3e는 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법에서 제공하는 IonTorrent Amplicon 분석 플랫폼의 분석에러 프로파일을 그래프로 도시한 것이다.
도 3b를 참조하면, 그래프의 x축은 염기서열의 변이 유형을 의미하고, y축은 전체 분석에러 대비 라이브러리 제작 단계에서 생성된 분석 에러가 차지하는 비율을 의미한다. 이때, 염기서열의 변이 유형은 이들의 상보적인 관계를 갖는 염기서열의 변이 유형을 더 포함할 수 있다.
구체적으로, Illumina hybrid-capture의 경우, C에서 A로 변이 (G에서 T로 변이) 유형의 분석에러가 나머지 염기서열의 변이 유형의 분석에러보다 base call quality 점수가 높은 것을 알 수 있다. 즉, Illumina hybrid-capture의 분석 플랫폼은 C에서 A로 변이 (G에서 T로 변이) 유형에 대하여 높은 분석에러가 나타날 수 있다. 이에 따라, Illumina hybrid-capture의 분석 플랫폼은 C에서 A로 변이 (G에서 T로 변이) 유형에 대하여 높은 분석에러 확률값을 갖도록 보정될 수 있다. 분석에러 확률값 보정의 결과로, Illumina hybrid-capture의 분석 플랫폼은 C에서 A로 변이 (G에서 T로 변이) 유형은 낮은 돌연변이 확률값을 갖도록 보정될 수 있다. 추가적으로, 다른 유형보다 낮은 base call quality를 갖는 A에서 C로 변이 (T에서 G로 변이) 유형은, 보다 높은 돌연변이 확률값을 갖도록 보정될 수 있다.
Illumina Amplicon의 경우, G에서 A로 변이 (C에서 T로 변이) 유형, T에서 A로 변이 (A에서 T로 변이) 유형 및 T에서 C로 변이 (A에서 G로 변이) 유형의 분석에러의 base call quality 점수가 높은 것을 알 수 있다. 특히, A에서 G로 변이 (T에서 C로 변이) 유형의 분석에러의 base call quality 점수가, 나머지 염기서열의 변이 유형보다 높이 나타난다. 즉, Illumina Amplicon의 분석 플랫폼은 A에서 G로 변이 (T에서 C로 변이) 유형에 대하여 가장 높은 분석에러가 나타날 수 있다. 이에 따라, Illumina Amplicon의 분석 플랫폼은 A에서 G로 변이 (T에서 C로 변이) 유형 더 나아가, T에서 A로 변이 (A에서 T로 변이) 유형 및 C에서 T로 변이 (G에서 A로 변이) 유형 에 대하여 높은 분석에러 확률값을 갖도록 보정될 수 있다. 분석에러 확률값 보정의 결과로 Illumina Amplicon의 분석 플랫폼은 A에서 G로 변이 (T에서 C로 변이) 유형 더 나아가, T에서 A로 변이 (A에서 T로 변이) 유형 및 C에서 T로 변이 (G에서 A로 변이) 유형에 대하여 낮은 돌연변이 확률값을 갖도록 보정될 수 있다. 추가적으로, 다른 유형보다 낮은 base call quality를 갖는 C에서 A로 변이 (G에서 T로 변이) 유형은, 보다 높은 돌연변이 확률값을 갖도록 보정될 수 있다.
IonTorrent Amplicon의 경우, 모든 염기서열의 변이 유형의 분석에러가 높은 base call quality 점수를 갖는 것을 알 수 있다. 즉, IonTorrent의 분석 플랫폼은 다른 분석 플랫폼에 비하여 모든 변이 유형에서 높은 분석에러가 나타날 수 있다. 이에 따라, IonTorrent Amplicon의 분석 플랫폼은 모든 염기서열의 변이 유형에 대하여 높은 분석에러 확률값을 갖도록 보정하고, 이의 결과로 낮은 돌연변이 확률값을 갖도록 보정될 수 있다.
이상의 세 가지 분석 플랫폼에의 빈도 높게 나타나는 분석에러에 대한 보정을 함으로써, 본 발명의 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 검출 디바이스는 불 일치하는 유전자 자리에 대하여 신뢰도 높은 돌연변이 확률값을 산출 할 수 있다. 이에 따라, 발명은 정밀도 높은 염기서열의 변이 검출을 제공할 수 있다. 더 나아가, 본 발명은 저빈도의 체성 돌연변이를 정밀도 높게 검출 할 수 있다.
도 3c, 3d, 3e를 참조하면, 6 개의 그래프는 염기서열의 변이 유형별 경험적 누적 분포 함수 (ECDF, empirical cumulative distribution function) 로, x축은 염기서열의 변이 유형을 나타내는 유전자 자리에 대한 BAF (B allele frequency) 값을 의미하고, y축은 이들의 BAF값의 누적비율을 의미한다. 이때, BAF값은 유전자 자리에 대하여 분석된 염기의 전체 개수 대비 참조샘플의 염기서열과 불 일치하는 염기 (B allele) 의 빈도를 의미할 수 있다. 각각의 그래프는 분석 플랫폼에 따른, 염기서열의 변이 유형을 나타나내는 유전자 자리들에 대한 BAF 값의 분포를 나타내고, 이를 통해 분석 플랫폼별 분석에러 분포를 확인할 수 있다. 점선의 그래프는 공지된 데이터를 이용하여 구축한 경험적 누적 분포 함수이고, 실선의 그래프는 본 발명에서 제공하는 분석에러 프로파일의 데이터들을 이용하여 추정한 지수분포의 누적 분포 함수이다.
구체적으로, 도 3c 에서 Illumina hybrid-capture의 분석 플랫폼은 전체적인 염기서열의 변이 유형에 대하여 이들 유형을 나타내는 유전자 자리 대부분의 BAF값이 0에 가까운 것을 알 수 있다. C에서 A로 변이 (G에서 T로 변이) 유형을 나타내는 유전자 자리들의 BAF값은 나머지 염기서열의 변이 유형에 비해, 0 내지 0.05의 BAF값을 갖는 유전자 자리가 많은 것을 알 수 있다. 결과적으로, C에서 A로 변이 (G에서 T로 변이) 유형을 가진 유전자 자리의 BAF값들은 상대적으로 다양한 값으로 분포한다. 이 결과는, 도 3c에서, Illumina hybrid-capture의 분석 플랫폼의 경우, C에서 A로 변이 (G에서 T로 변이) 유형이 나머지 염기서열의 변이 유형보다 base call quality 점수가 높게 나타났던 결과와 연관될 수 있다.
도 3d 에서 Illumina Amplicon의 분석 플랫폼은 A에서 G로 변이 (T에서 C로 변이) 유형 더 나아가, T에서 A로 변이 (A에서 T로 변이) 유형 및 C에서 T로 변이 (G에서 A로 변이) 유형에 대하여, 이들 유형을 나타내는 유전자 자리의 BAF값이 다른 염기서열의 변이 유형에 비해 다양한 값으로 분포하는 것을 알 수 있다. 특히, A에서 G로 변이 (T에서 C로 변이) 유형을 나타내는 유전자 자리의 BAF값은 나머지 염기서열의 변이 유형에 비해 0내지 0.10의 BAF값을 가지는 유전자 자리가 많은 것을 알 수 있다. 결과적으로, A 에서 G로 변이 (T에서 C로 변이) 유형 더 나아가, T에서 A로 변이 (A에서 T로 변이) 유형 및 C에서 T로 변이 (G에서 A로 변이) 유형을 가진 유전자 자리의 BAF값들은 상대적으로 다양한 값으로 분포한다. 이 결과는, 도 3c에서, Illumina Amplicon의 분석 플랫폼의 경우, A에서 G로 변이 (T에서 C로 변이) 유형, T에서 A로 변이 (A에서 T로 변이) 유형 및 C에서 T로 변이 (G에서 A로 변이) 유형이 나머지 염기서열의 변이 유형보다 base call quality 점수가 높게 나타났던 결과와 연관될 수 있다.
도 3e 에서 IonTorrent Amplicon의 분석 플랫폼은 전체적인 염기서열의 변이 유형에 대하여 이들 유형을 나타내는 유전자 자리 대부분의 BAF값이 0에 가까운 것을 알 수 있다. 도 3c의 Illumina hybrid-capture의 분석 플랫폼과 비교했을 때, IonTorrent Amplicon의 분석 플랫폼에서 모든 염기서열의 변이 유형은, 이에 대한 유전자 자리의 BAF값이 보다 다양한 값을 갖는 것을 알 수 있다. 이 결과는, 도 3c에서, IonTorrent Amplicon의 분석 플랫폼의 경우, 모든 염기서열의 변이 유형에 대한 base call quality 점수가 높게 나타났던 결과와 연관될 수 있다.
이상의 결과로, Illumina Amplicon, IonTorrent Amplicon 및 IonTorrent Amplicon 모두의 분석 플랫폼에서 본 발명이 제공하는 분석에러 프로파일의 경험적 누적 분포 함수 (점선) 와 이를 통해 추정된 지수 분포의 누적 분포 함수 (실선) 가 피팅 (fitting) 되는 것을 확인할 수 있다. 더 나아가, 세 가지 분석 플랫폼은 BAF값이 상대적으로 다양하고, 0보다 큰 값을 갖는 염기서열의 변이 유형에 대하여, 높은 분석에러 확률값을 갖도록 보정하는 것이 바람직 할 수 있다. 분석에러의 보정의 결과로 세 가지 분석 플랫폼은 BAF값이 상대적으로 다양하고, 0보다 큰 값을 갖는 염기서열의 변이 유형에 대하여, 낮은 돌연변이 확률값을 갖도록 보정될 수 있다. 본 발명의 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 검출 디바이스는 불 일치하는 유전자 자리에 대하여 보정된 산출방법으로 산출한, 돌연변이 확률값을 제공하고, 이를 기초로 불 일치하는 유전자 자리에 대한 분석에러 또는 돌연변이로의 정확한 구별이 가능할 수 있다. 더 나아가, 본 발명은 저빈도의 체성 돌연변이를 정밀도 높게 검출할 수 있다.
본 발명의 일 실시예에 따른 염기서열의 변이 검출방법에 대한 평가
이하에서는, 도 4a, 4b 및 도 4c를 참조하여, 본 발명의 염기서열의 변이 검출방법을 종래의 염기서열의 변이 검출방법과 비교하여 평가한다.
도 4a는 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법 및 종래의 검출방법을 Illumina hybrid-capture에 적용함에 따라 측정된, 염기서열의 변이 검출의 정밀도, 민감도, F-점수 및 거짓 양성 비율의 결과를 도시한 것이다. 도 4b는 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법 및 종래의 검출방법을 Illumina Amplicon에 적용함에 따라 측정된, 염기서열의 변이 검출의 정밀도, 민감도, F-점수 및 거짓 양성 비율의 결과를 도시한 것이다. 도 4c는 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법 및 종래의 검출방법을 IonTorrent Amplicon에 적용함에 따라 측정된, 염기서열의 변이 검출의 정밀도, 민감도, F-점수 및 거짓 양성 비율의 결과를 도시한 것이다.
구체적으로, 종래의 체성 돌연변이의 검출방법은 MuTect이 이용되었다.
평가를 위해, 서로 다른 유전체를 포함하는 A 혈액 샘플 및 B 혈액 샘플을 준비한다.
그 다음, A 혈액 샘플에 B 혈액 샘플을 연속 희석하여, 0.5 %의 B 혈액 샘플이 들어있는 A 혈액 샘플, 1 %의 B 혈액 샘플이 들어있는 A 혈액 샘플, 5 %의 B 혈액 샘플이 들어있는 A 혈액 샘플 및 10 %의 B 혈액 샘플이 들어있는 A 혈액 샘플을 준비하여, 인공 체성 돌연변이 샘플을 준비한다. 즉, A 혈액 샘플에 대하여 B 혈액 샘플은 체성 돌연변이 일 수 있으며, 이의 4 가지 농도는, 체성 돌연변이의 빈도를 의미할 수 있다.
다음으로, 준비된 4 가지의 인공 체성 돌연변이 샘플에 대하여 본 발명의 검출방법 및 MuTect을 Illumina hybrid-capture, Illumina Amplicon 및 IonTorrent Amplicon의 분석 플랫폼에 적용하여 평가한다.
이하에서는, A 혈액 샘플에 B 혈액 샘플을 연속 희석하여, 0.5 %의 B 혈액 샘플이 들어있는 A 혈액 샘플을 본 발명의 일 실시예에 따른 검출방법으로 검출한 결과는 실시예 1로 나타낸다. 이어서, 1 %의 B 혈액 샘플이 들어있는 A 혈액 샘플을 본 발명의 검출방법으로 검출한 결과는 실시예 2로, 5 %의 B 혈액 샘플이 들어있는 A 혈액 샘플을 본 발명의 검출방법으로 검출한 결과는 실시예 3으로 나타낸다. 마지막으로, 10 %의 B 혈액 샘플이 들어있는 A 혈액 샘플을 본 발명의 검출방법으로 검출한 결과는 실시예 4로 나타낸다.
A 혈액 샘플에 B 혈액 샘플을 연속 희석하여, 0.5 %의 B 혈액 샘플이 들어있는 A 혈액 샘플을 MuTect로 검출한 결과는 비교예 1로 나타낸다. 이어서, 1 %의 B 혈액 샘플이 들어있는 A 혈액 샘플을 MuTect로 검출한 결과는 비교예 2로, 5 %의 B 혈액 샘플이 들어있는 A 혈액 샘플을 MuTect로 검출한 결과는 비교예 3으로 나타낸다. 마지막으로, 10 %의 B 혈액 샘플이 들어있는 A 혈액 샘플을 MuTect로 검출한 결과는 비교예 4로 나타낸다.
도 4a에서, 비교예를 참조하면, A 혈액 샘플에 대하여 B 혈액 샘플이 저농도로 존재할수록 검출의 정밀도가 낮아지는 것을 알 수 있다. 특히, 비교예 1의 0.5 % 농도의 정밀도는 비교예 3의 5 % 농도의 정밀도와 비교예 4의 10 % 농도의 정밀도의 약 4분의 1 수준으로 떨어진 것을 알 수 있다. 더 나아가, 거짓 양성 비율은 뎁스가 높아짐에 따라, 4 가지 비교예 모두에서 크게 증가하는 것을 확인할 수 있다.
이와 대조적으로 Illumina hybrid-capture에 본 발명의 검출방법을 적용한 결과인 실시예를 참조하면, Illumina hybrid-capture에 MuTect을 적용한 결과인 비교예의 결과보다 정밀도, 민감도, F-점수 모두 높게 나타났다. 특히, 실시예 1의 0.5 % 농도의 검출의 정밀도는 비교예 1에서의 정밀도보다 약 3.5 배 높게 나타났다. 더 나아가, 거짓 양성 비율은 뎁스가 높아짐에도, 4 가지 실시예 모두에서 0에 근사한 값을 유지하여 본 발명의 검출방법은 분석의 에러 없이 저빈도로 존재하는 체성 돌연변이의 검출이 가능할 수 있다.
도 4b에서, Illumina Amplicon에 MuTect을 적용한 경우, 4 가지 비교예를 참조하면, 4 가지 농도 모두에서 낮은 수준의 정밀도, F-점수를 나타내는 것을 알 수 있다. 더 나아가, 거짓 양성 비율은 뎁스가 높아짐에 따라, 4 가지 비교예 모두에서 크게 증가하는 것을 확인할 수 있다.
이와 대조적으로 Illumina Amplicon에 본 발명의 검출방법을 적용한 실시예를 참조하면, llumina Amplicon에 MuTect을 적용한 결과인 비교예의 결과보다 높은 수준의 정밀도, F-점수가 나타난 것을 알 수 있다. 특히, 실시예 2의 1 % 농도의 정밀도는 비교예 2에서보다 약 70 배 높은 검출의 정밀도를 나타낸 것을 알 수 있다. 더 나아가, 거짓 양성 비율은 뎁스가 높아짐에도, 4 가지 실시예 모두에서 0에 근사한 값을 유지하여 본 발명의 검출방법은 분석의 에러 없이 저빈도로 존재하는 체성 돌연변이의 검출이 가능할 수 있다.
도 4c에서, IonTorrent Amplicon에 MuTect을 적용한 결과인 비교예를 참조하면, A 혈액 샘플에 대하여 B 혈액 샘플이 저농도로 존재할수록 검출의 정밀도와 F-점수가 낮아지는 것을 알 수 있다. 더 나아가, 거짓 양성 비율은 뎁스가 높아짐에 따라, 4 가지 비교예 모두에서 크게 증가하는 것을 확인할 수 있다.
이와 대조적으로 IonTorrent Amplicon에 본 발명의 검출방법을 적용한 결과인 실시예를 참조하면, IonTorrent Amplicon에 MuTect을 적용한 비교예의 결과보다 정밀도가 4 가지 실시예 모두에서 높게 나타났다. 특히, 실시예 2의 1% 농도의 검출의 정밀도는 비교예 2의 결과보다 약 3배 높게 나타났다. 더 나아가, 거짓 양성 비율은 뎁스가 높아짐에도, 4 가지 실시예 모두에서 0에 근사한 값을 유지하여 본 발명의 검출방법은 분석의 에러 없이 저빈도로 존재하는 체성 돌연변이의 검출이 가능할 수 있다.
이상의 실시예와 비교예의 결과로, 본 발명의 일 실시예에 따른 염기서열의 변이 검출방법은 Illumina hybrid-capture, Illumina Amplicon 및 IonTorrent Amplicon의 분석 플랫폼 모두에서, 뎁스가 높아짐에 따라 낮은 거짓 양성 비율을 유지하고, 이에 따라 검출의 오류를 줄일 수 있는 효과가 있다. 이에 따라, 본 발명은 염기서열 변이 검출의 정밀도 높은 분석이 가능한 저빈도 체성돌연변이, 더 나아가 염기서열의 변이 검출방법을 제공할 수 있는 효과가 있다. 또한, 본 발명의 염기서열의 변이 검출방법은 Illumina Amplicon에 적용하였을 때, 1 % 빈도로 존재하는 변이를 검출할 때, 염기서열 검출에 대한 정밀도의 향상효과가 클 수 있다. 더 나아가, 기존의 체성 돌연변이 검출방법을 적용한 분석 플랫폼 모두, 저빈도의 체성 돌연변이의 검출에 대하여, 검출의 정밀도가 낮을 수 있고, 뎁스가 높아짐에 따라 거짓 양성 비율이 높아져 분석의 오류 또한, 증가할 수 있다. 이는 동일한 분석 플랫폼에 본 발명의 염기서열의 변이 검출방법을 적용하여 평가한 결과와 대조되는 결과이다.
이상 첨부된 도면을 참조하여 본 발명의 실시 예들을 더욱 상세하게 설명하였으나, 본 발명은 반드시 이러한 실시 예로 국한되는 것은 아니고, 본 발명의 기술사상을 벗어나지 않는 범위 내에서 다양하게 변형 실시될 수 있다. 따라서, 본 발명에 개시된 실시 예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시 예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 그러므로, 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
100: 염기서열의 변이 검출 디바이스
110: 통신부
120: 입력부
130: 표시부
140: 저장부
150: 프로세서
S210: 획득하는 단계
S220: 매칭하는 단계
S230: 선별하는 단계
S240: 결정하는 단계
S310: 분석에러 프로파일을 결정하는 단계
S320: 분석에러 확률값을 보정하는 단계

Claims (17)

  1. 대상샘플의 염기서열을 차세대 염기서열 분석 (NGS, next generation sequencing) 방법을 이용하여 염기서열을 획득하는 단계;
    참조샘플의 염기서열과 상기 대상샘플의 염기서열을 매칭 (matching) 하는 단계;
    상기 대상샘플의 염기서열 중 상기 참조샘플의 염기서열과 불 일치하는 유전자 자리 (locus) 를 선별하는 단계; 및
    염기서열의 변이 유형에 따라 에러가 보정된 산출방식으로 산출된, 상기 불 일치하는 유전자 자리의 돌연변이 확률값을 기초로, 상기 불 일치하는 유전자 자리를 염기서열 변이 후보로 결정하는 단계를 포함하고,
    상기 염기서열 변이는 1 % 이하의 저빈도 체성 돌연변이인, 염기서열의 변이 검출방법.
  2. 제1항에 있어서,
    상기 염기서열 변이 후보를 결정하는 단계는,
    상기 불 일치하는 유전자 자리의 돌연변이 확률값이 미리 결정된 수준 이상일 경우,
    상기 불 일치하는 유전자 자리를 염기서열 변이 후보로 결정하는 단계를 더 포함하는, 염기서열의 변이 검출방법.
  3. 제1항에 있어서,
    상기 염기서열의 변이 유형은, A에서 C로 변이, A에서 G로 변이, A에서 T로 변이, A에서 C로 변이, C에서 G로 변이, C에서 T로 변이, G에서 T로변이, C에서 T로 변이, A에서 T로 변이, T에서 G로 변이, C에서 G로 변이 및 A에서 G로 변이로 이루어진 그룹으로부터 선택된 적어도 하나의 염기서열의 변이 유형인, 염기서열의 변이 검출방법.
  4. 제1항에 있어서,
    상기 돌연변이 확률값은,
    분석 플랫폼 유형에 따라 염기서열의 변이 유형별 분석에러 및 상기 분석에러의 base call quality 점수를 포함하는 분석에러 프로파일을 결정하고,
    상기 분석에러 프로파일을 기초로, 적어도 하나 이상의 염기서열의 변이 유형에 대하여 보정된 돌연변이 확률값인, 염기서열의 변이 검출방법.
  5. 제4항에 있어서,
    상기 분석에러 프로파일은,
    상기 대상샘플의 염기서열 중 상기 불 일치하는 유전자 자리의 전, 후로 존재하는 염기서열의 정보를 더 포함하는, 염기서열의 변이 검출방법.
  6. 대상샘플의 염기서열을 차세대 염기서열 분석 방법을 이용하여 염기서열을 획득하는 단계;
    참조샘플의 염기서열과 상기 대상샘플의 염기서열을 매칭하는 단계;
    상기 대상샘플의 염기서열 중 상기 참조샘플의 염기서열과 불 일치하는 유전자 자리를 선별하는 단계; 및
    분석 플랫폼 유형에 따라, 염기서열의 변이 유형별 분석에러 및 상기 분석에러의 base call quality 점수를 포함하는 분석에러 프로파일을 기초로 적어도 하나 이상의 염기서열의 변이 유형에 대하여 보정된 산출방식으로 산출된, 상기 불일치하는 유전자 자리의 돌연변이 확률값을 기초로, 염기서열 변이 후보를 결정하는 단계를 포함하고,
    상기 분석 플랫폼 유형이 Illumina hybrid-capture일 경우,
    상기 염기서열의 변이 유형별 분석에러 중 C에서 A로 변이 및 G에서 T로 변이 유형에 대한 분석에러의 확률은 나머지 염기서열의 변이 유형의 분석에러의 확률보다 높은, 염기서열의 변이 검출방법.
  7. 대상샘플의 염기서열을 차세대 염기서열 분석 방법을 이용하여 염기서열을 획득하는 단계;
    참조샘플의 염기서열과 상기 대상샘플의 염기서열을 매칭하는 단계;
    상기 대상샘플의 염기서열 중 상기 참조샘플의 염기서열과 불 일치하는 유전자 자리를 선별하는 단계; 및
    분석 플랫폼 유형에 따라, 염기서열의 변이 유형별 분석에러 및 상기 분석에러의 base call quality 점수를 포함하는 분석에러 프로파일을 기초로 적어도 하나 이상의 염기서열의 변이 유형에 대하여 보정된 산출방식으로 산출된, 상기 불일치하는 유전자 자리의 돌연변이 확률값을 기초로, 염기서열 변이 후보를 결정하는 단계를 포함하고,
    상기 분석 플랫폼 유형이 Illumina Amplicon일 경우,
    상기 염기서열의 변이 유형 중 G에서 A로 변이, C에서 T로 변이, T에서 A로 변이, A에서 T로 변이, T에서 C로 변이 및 A에서 G로 변이 유형에 대한 분석에러의 확률은 나머지 염기서열의 변이 유형의 분석에러의 확률보다 높은, 염기서열의 변이 검출방법.
  8. 대상샘플의 염기서열을 차세대 염기서열 분석 방법을 이용하여 염기서열을 획득하는 단계;
    참조샘플의 염기서열과 상기 대상샘플의 염기서열을 매칭하는 단계;
    상기 대상샘플의 염기서열 중 상기 참조샘플의 염기서열과 불 일치하는 유전자 자리를 선별하는 단계; 및
    분석 플랫폼 유형에 따라, 염기서열의 변이 유형별 분석에러 및 상기 분석에러의 base call quality 점수를 포함하는 분석에러 프로파일을 기초로 적어도 하나 이상의 염기서열의 변이 유형에 대하여 보정된 산출방식으로 산출된, 상기 불일치하는 유전자 자리의 돌연변이 확률값을 기초로, 염기서열 변이 후보를 결정하는 단계를 포함하고,
    상기 분석 플랫폼 유형이 IonTorrent Amplicon일 경우,
    상기 염기서열의 변이 유형 중 G에서 A로 변이, C에서 T로 변이, A에서 C로 변이, T에서 G로 변이, T에서 C로 변이 및 A에서 G로 변이 유형에 대한 분석에러의 확률은 나머지 염기서열의 변이 유형의 분석에러의 확률보다 높은, 염기서열의 변이 검출방법.
  9. 제1항에 있어서,
    상기 획득하는 단계는,
    뎁스 (depth) 가 50 내지 5,000으로 설정된 Illumina hybrid-capture을 이용하여 염기서열을 획득하는 단계를 더 포함하는, 염기서열의 변이 검출 방법.
  10. 제1항에 있어서,
    상기 획득하는 단계는,
    뎁스가 100 내지 20,000으로 설정된 Illumina Amplicon을 이용하여 염기서열을 획득하는 단계를 더 포함하는, 염기서열의 변이 검출 방법.
  11. 제1항에 있어서,
    상기 획득하는 단계는,
    뎁스가 100 내지 20,000으로 설정된 IonTorrent Amplicon을 이용하여 염기서열을 획득하는 단계를 더 포함하는, 염기서열의 변이 검출 방법.
  12. 제1항에 있어서,
    참조샘플은, 차세대 염기서열 분석 방법을 이용하여 획득하는, 염기서열의 변이 검출방법.
  13. 삭제
  14. 통신부와 동작 가능하게 연결된 프로세서를 포함하고,
    상기 프로세서는,
    상기 통신부를 통해 대상샘플의 염기서열을 차세대 염기서열 분석 방법을 이용하여 분석한 염기서열을 획득하고,
    참조샘플의 염기서열과 상기 대상샘플의 염기서열을 매칭하고,
    상기 대상샘플의 염기서열 중 상기 참조샘플의 염기서열과 불 일치하는 유전자 자리를 선별하고,
    염기서열의 변이 유형에 따라 에러가 보정된 산출방식으로 산출한, 상기 불 일치하는 유전자 자리의 돌연변이 확률값을 기초로, 상기 불 일치하는 유전자 자리를 염기서열 변이 후보로 결정하도록 구성되고,
    상기 염기서열 변이는 1 % 이하의 저빈도 체성 돌연변이인, 염기서열의 변이 검출 디바이스.
  15. 제14항에 있어서,
    상기 프로세서는,
    상기 염기서열 변이 후보의 돌연변이 확률값이 일정 수준 이상일 경우,
    상기 염기서열 변이 후보를 염기서열 변이로 결정하도록 더 구성된, 염기서열의 변이 검출 디바이스.
  16. 제14항에 있어서,
    상기 돌연변이 확률값은,
    분석 플랫폼 유형에 따라 염기서열의 변이 유형별 분석에러 및 상기 분석에러의 base call quality 점수를 포함하는 분석에러 프로파일을 결정하고,
    상기 분석에러 프로파일을 기초로, 적어도 하나 이상의 염기서열의 변이 유형에 대하여 보정된 돌연변이 확률값인, 염기서열의 변이 검출 디바이스.
  17. 제16항에 있어서,
    상기 분석에러 프로파일은,
    상기 대상샘플의 염기서열 중 상기 불 일치하는 유전자 자리의 전, 후로 존재하는 염기서열 정보를 더 포함하는, 염기서열의 변이 검출 디바이스.


KR1020160160637A 2016-11-29 2016-11-29 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스 KR101936934B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160160637A KR101936934B1 (ko) 2016-11-29 2016-11-29 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160160637A KR101936934B1 (ko) 2016-11-29 2016-11-29 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스

Publications (2)

Publication Number Publication Date
KR20180060764A KR20180060764A (ko) 2018-06-07
KR101936934B1 true KR101936934B1 (ko) 2019-01-09

Family

ID=62621211

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160160637A KR101936934B1 (ko) 2016-11-29 2016-11-29 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스

Country Status (1)

Country Link
KR (1) KR101936934B1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102345994B1 (ko) * 2020-01-22 2022-01-03 가톨릭대학교 산학협력단 Ngs 분석에서의 질병 관련 유전자 선별 방법 및 장치
KR102530247B1 (ko) * 2020-09-01 2023-05-09 주식회사 아이엠비디엑스 cfDNA의 저빈도 변이 검출을 위해 NGS 분석에 사용되는 고유 단편의 비율을 증가시키는 방법
CN113628683B (zh) * 2021-08-24 2024-04-09 慧算医疗科技(上海)有限公司 一种高通量测序突变检测方法、设备、装置及可读存储介质
KR102427600B1 (ko) * 2021-12-14 2022-08-01 주식회사 테라젠바이오 줄기세포의 배양적응성을 판단하기 위한 체세포 변이를 선별하는 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101638473B1 (ko) * 2014-12-26 2016-07-12 연세대학교 산학협력단 차세대 염기서열 분석법을 기반으로 하는 결실 유전자군 검출 방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003330934A (ja) * 2002-05-10 2003-11-21 Celestar Lexico-Sciences Inc 変異体配列解析装置、変異体配列解析方法、プログラム、および、記録媒体
KR101177320B1 (ko) * 2010-02-26 2012-09-10 문우철 Y형 프로브 및 이것의 변형형, 및 이를 이용한 dna 마이크로어레이, 키트 및 유전자 분석방법
US9487828B2 (en) * 2012-05-10 2016-11-08 The General Hospital Corporation Methods for determining a nucleotide sequence contiguous to a known target nucleotide sequence
KR101583616B1 (ko) * 2014-01-14 2016-01-08 한림대학교 산학협력단 유전체 단위 반복 변이를 검출하는 장치 및 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101638473B1 (ko) * 2014-12-26 2016-07-12 연세대학교 산학협력단 차세대 염기서열 분석법을 기반으로 하는 결실 유전자군 검출 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
M.Li 외 1인, "A new approach for detecting low-level mutations in next-generation sequence data", Genome Biology 2012, 13권, R34, 2012.*

Also Published As

Publication number Publication date
KR20180060764A (ko) 2018-06-07

Similar Documents

Publication Publication Date Title
KR101936933B1 (ko) 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
KR101936934B1 (ko) 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
CN109767810B (zh) 高通量测序数据分析方法及装置
KR101542529B1 (ko) 대립유전자의 바이오마커 발굴방법
CN106909806A (zh) 定点检测变异的方法和装置
JP2019531700A5 (ko)
KR102035615B1 (ko) 유전자 패널에 기초한 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
Anderson et al. ReCombine: a suite of programs for detection and analysis of meiotic recombination in whole-genome datasets
CN110010197A (zh) 基于血液循环肿瘤dna的单核苷酸变异检测方法、装置和存储介质
Vy et al. A composite-likelihood method for detecting incomplete selective sweep from population genomic data
Muller et al. OutLyzer: software for extracting low-allele-frequency tumor mutations from sequencing background noise in clinical practice
CA3099057C (en) Surrogate marker and method for tumor mutation burden measurement
Yang et al. Detecting recent positive selection with a single locus test bipartitioning the coalescent tree
Smart et al. A novel phylogenetic approach for de novo discovery of putative nuclear mitochondrial (pNumt) haplotypes
Demidov et al. ClinCNV: novel method for allele-specific somatic copy-number alterations detection
EP1635276A2 (en) Display method and display apparatus of gene information
KR20150024232A (ko) 질병에 대한 약물 내성 유전체로부터 내성 원인 마커의 발굴 방법
Ahsan et al. A survey of algorithms for the detection of genomic structural variants from long-read sequencing data
KR101882867B1 (ko) 변이 검출 표지의 신뢰도 결정 방법 및 장치
EP1798651B1 (en) Gene information display method and apparatus
US20150347674A1 (en) System and method for analyzing biological sample
US20160265051A1 (en) Methods for Detection of Fetal Chromosomal Abnormality Using High Throughput Sequencing
US20170226588A1 (en) Systems and methods for dna amplification with post-sequencing data filtering and cell isolation
JP5090766B2 (ja) 遺伝子情報の処理装置及び表示装置
KR20230155107A (ko) 진양성 변이 및 위양성 변이를 구별하는 PiSeq 장치 및 알고리즘

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant