KR102319447B1 - Ngs를 이용한 열성유전병 원인 유전변이 판별 방법 및 장치 - Google Patents

Ngs를 이용한 열성유전병 원인 유전변이 판별 방법 및 장치 Download PDF

Info

Publication number
KR102319447B1
KR102319447B1 KR1020190155304A KR20190155304A KR102319447B1 KR 102319447 B1 KR102319447 B1 KR 102319447B1 KR 1020190155304 A KR1020190155304 A KR 1020190155304A KR 20190155304 A KR20190155304 A KR 20190155304A KR 102319447 B1 KR102319447 B1 KR 102319447B1
Authority
KR
South Korea
Prior art keywords
genetic
variants
genetic variation
mutations
cis
Prior art date
Application number
KR1020190155304A
Other languages
English (en)
Other versions
KR20210066276A (ko
Inventor
이정설
한주현
박중영
금창원
Original Assignee
주식회사 쓰리빌리언
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 쓰리빌리언 filed Critical 주식회사 쓰리빌리언
Priority to KR1020190155304A priority Critical patent/KR102319447B1/ko
Priority to PCT/KR2020/016706 priority patent/WO2021107567A1/ko
Publication of KR20210066276A publication Critical patent/KR20210066276A/ko
Application granted granted Critical
Publication of KR102319447B1 publication Critical patent/KR102319447B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Physiology (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

본 발명은 차세대 염기서열 분석(NGS)에서 참조 게놈의 레퍼런스 염기서열과 대상샘플의 염기서열을 비교하여, 두 개 이상의 유전변이가 발생한 유전자를 추출하는 유전자 추출부; 상기 추출된 유전자와 매칭되는 대상샘플의 리드를 검출하는 리드 검출부; 및 상기 리드를 이용하여 열성유전병 원인 유전변이를 판별하는 유전변이 판별부를 포함하는 열성유전병 원인 유전변이 판별 장치를 제공한다.

Description

NGS를 이용한 열성유전병 원인 유전변이 판별 방법 및 장치{Method and Apparatus for discriminating the mutations of genes related to recessive inherited disease using next generation sequencing(NGS)}
본 발명은 차세대 염기서열 분석(NGS)를 이용하여 열성유전병을 유발하는 열성유전병 원인 유전변이 판별 방법 및 장치에 관한 것이다.
인간 게놈 프로젝트가 시작된 이래로, 질병의 원인이 되는 유전자에 관한 많은 연구가 진행되었으며, 유전자의 염기 서열을 밝히기 위한 시퀀싱 기술도 계속 개발되고 있다. 최근에는, 저렴한 비용과 빠른 데이터 생산으로 인해 대용량의 짧은 서열을 생산하는 차세대 염기서열 분석(NGS; Next Generation Sequencing)이 전통적인 생거(Sanger) 시퀀싱 방식을 빠르게 대체하고 있다. 차세대 염기서열 분석(NGS) 기술이 발전함에 따라 리드(단편 서열)을 만들어 내는 비용이 예전의 절반 이하가 되었고, 이를 질병 진단 분야에 응용할 수 있는 가용성도 증가하고 있다.
최근에는 차세대 염기서열 분석(NGS) 기술을 이용해 멘델성 유전질환, 희귀질환, 암 등에서 질병의 원인 유전자를 찾는데 성공하였다.
그러나 차세대 염기서열 분석(NGS)은 상대적으로 저렴한 비용에 대용량의 염기서열 정보를 얻을 수 있는 장점이 있지만, 대용량 정보로부터 질병의 원인 유전자를 찾는 것은 쉽지 않다.
본 발명은 차세대 염기서열 분석(NGS) 기술에서 리드(reads)를 이용하여 열성유전병을 유발하는 열성유전병 원인 유전변이 판별 방법 및 장치에 관한 것이다.
한국특허공고 제10-1614471호에서 리드(reads)를 이용한 유전자 이상 진단 결정 방법에 관하여 개시하고 있는데, 이는 열성유전병을 유발하는 원인 유전변이 판별 방법과는 차이가 있다.
한국특허공고 제10-1614471호 (공고일자, 2016.04.21)
본 발명이 이루고자 하는 기술적 과제는 차세대 염기서열 분석에서 리드를 이용하여 열성유전병을 유발하는 원인 유전변이를 판별하기 위한 열성유전병 원인 유전변이 판별 방법 및 장치에 관한 것이다. 또한, 리드에서 검출된 두 개의 유전변이가 시스 관계변이인지 트랜스 관계변이인지 구별하여 열성유전병을 유발하는 원인 유전변이를 판결하기 위한 열성유전병 원인 유전변이 판별 방법 및 장치에 관한 것이다.
이러한 과제를 해결하기 위하여 본 발명의 실시예에 따른 열성유전병 원인 유전변이 판별 방법은 유전변이 추출부를 통해, 차세대 염기서열 분석(NGS)에서 참조 게놈의 레퍼런스 염기서열과 대상샘플의 염기서열을 비교하여, 두 개 이상의 유전변이가 발생한 유전자를 추출하는 유전자 추출단계; 리드 검출부를 통해, 상기 추출된 유전자와 매칭되는 대상샘플의 리드를 검출하는 리드 검출단계; 및 유전변이 판별부를 통해, 상기 리드를 이용하여 열성유전병 원인 유전변이를 판별하는 유전변이 판별단계를 포함한다.
상기 유전변이 판별단계는, 상기 리드에서 검출된 두 개의 유전변이가 시스 관계변이(cis-related variants)인지 트랜스 관계변이(trans-elated variants)인지 구분하여 트랜스 관계변이로 결정되면 열성유전병 원인 유전변이로 판별하고, 상기 시스 관계변이(cis-related variants)는 상기 두 개의 유전변이가 상동 염색체 중 어느 하나에만 발견된 변이를 말하고, 상기 트랜스 관계변이(trans-elated variants)는 상기 두 개의 유전변이가 상동 염색체 모두에서 발견된 변이를 말한다.
상기 리드를 검출하는 단계는, 상기 추출된 유전자에서 두 개의 유전변이(v1, v2)와 상기 유전변이가 존재하는 위치(p1, p2)를 확인하는 단계; 및 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드의 수(N), 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하는 리드의 수(n1), 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v2을 포함하는 리드의 수(n2), 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1과 v2를 모두 포함하는 리드의 수(c1), 및 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하면서 v2를 포함하지 않는 리드의 수(c2)를 검출하는 단계를 포함할 수 있다.
상기 유전변이 판별단계는, 하기 [식 1]로 산출된 score(v1, v2)가 기준 값 이상이면 두 개의 유전변이(v1, v2)가 시스 관계변이(cis-related variants)로 결정될 수 있다.
[식 1]
Figure 112021061071686-pat00019
(여기서, N은 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드의 수, n1은 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하는 리드의 수, n2는 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v2을 포함하는 리드의 수, c1는 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1과 v2를 모두 포함하는 리드의 수이다.)
상기 유전변이 판별단계는, 하기 [식 2]로 산출되고, score(v1, v2)가 기준 값 이상이면 두 개의 유전변이(v1, v2)가 트랜스 관계변이(trans-elated variants)로 결정될 수 있다.
[식 2]
Figure 112019122845714-pat00002
(여기서, N은 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드의 수, n1은 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하는 리드의 수, n2는 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v2을 포함하는 리드의 수, c2는 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하면서 v2를 포함하지 않는 리드의 수이다.)
상기 리드 중 두 개의 유전변이(v1, v2)를 가지는 제1리드와 두 개의 유전변이(v2, v3)를 가지는 제2리드에 대해서, 유전변이(v1)과 유전변이(v2)가 시스 관계변이(cis-related variants)이고, 유전변이(v2)과 유전변이(v3)가 시스 관계변이(cis-related variants)이면, 유전변이(v1)과 유전변이(v3)는 시스 관계변이(cis-related variants)로 결정되고, 유전변이(v1)과 유전변이(v2)가 시스 관계변이(cis-related variants)이고, 유전변이(v2)과 유전변이(v3)가 트랜스 관계변이(trans-elated variants)이면, 유전변이(v1)과 유전변이(v3)는 트랜스 관계변이(trans-elated variants)로 결정되고, 유전변이(v1)과 유전변이(v2)가 트랜스 관계변이(trans-related variants)이고, 유전변이(v2)과 유전변이(v3)가 트랜스 관계변이(trans-related variants)이면, 유전변이(v1)과 유전변이(v3)는 시스 관계변이(cis-related variants)로 결정될 수 있다.
추출된 상기 유전자는 열성유전병을 유발하는 유전자일 수 있다.
이러한 과제를 해결하기 위하여 본 발명의 실시예에 따른 열성유전병 원인 유전변이 판별 장치는 차세대 염기서열 분석(NGS)에서 참조 게놈의 레퍼런스 염기서열과 대상샘플의 염기서열을 비교하여, 두 개 이상의 유전변이가 발생한 유전자를 추출하는 유전자 추출부; 상기 추출된 유전자와 매칭되는 대상샘플의 리드를 검출하는 리드 검출부; 및 상기 리드를 이용하여 열성유전병 원인 유전변이를 판별하는 유전변이 판별부를 포함한다.
상기 유전변이 판별부는, 상기 리드에서 검출된 두 개의 유전변이가 시스 관계변이(cis-related variants)인지 트랜스 관계변이(trans-elated variants)인지 구분하여 트랜스 관계변이로 결정되면 열성유전병 원인 유전변이로 판별하고, 상기 시스 관계변이(cis-related variants)는 상기 두 개의 유전변이가 상동 염색체 중 어느 하나에만 발견된 변이를 말하고, 상기 트랜스 관계변이(trans-elated variants)는 상기 두 개의 유전변이가 상동 염색체 모두에서 발견된 변이를 말한다.
상기 리드 검출부는, 상기 추출된 유전자에서 두 개의 유전변이(v1, v2)와 상기 유전변이가 존재하는 위치(p1, p2)를 확인하고, 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드의 수(N), 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하는 리드의 수(n1), 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v2을 포함하는 리드의 수(n2), 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1과 v2를 모두 포함하는 리드의 수(c1), 및 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하면서 v2를 포함하지 않는 리드의 수(c2)를 검출할 수 있다.
상기 유전변이 판별부는, 하기 [식 1]로 산출된 score(v1, v2)가 기준 값 이상이면 두 개의 유전변이(v1, v2)를 시스 관계변이(cis-related variants)로 결정할 수 있다.
[식 1]
Figure 112021061071686-pat00020
(여기서, N은 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드의 수, n1은 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하는 리드의 수, n2는 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v2을 포함하는 리드의 수, c1는 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1과 v2를 모두 포함하는 리드의 수이다.)
상기 유전변이 판별부는, 하기 [식 2]로 산출된 score(v1, v2)가 기준 값 이상이면 두 개의 유전변이(v1, v2)를 트랜스 관계변이(trans-elated variants)로 결정할 수 있다.
[식 2]
Figure 112019122845714-pat00004
(여기서, N은 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드의 수, n1은 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하는 리드의 수, n2는 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v2을 포함하는 리드의 수, c2는 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하면서 v2를 포함하지 않는 리드의 수이다.)
상기 리드 중 두 개의 유전변이(v1, v2)를 가지는 제1리드와 두 개의 유전변이(v2, v3)를 가지는 제2리드에 대해서, 유전변이(v1)과 유전변이(v2)가 시스 관계변이(cis-related variants)이고, 유전변이(v2)과 유전변이(v3)가 시스 관계변이(cis-related variants)이면, 유전변이(v1)과 유전변이(v3)는 시스 관계변이(cis-related variants)로 결정되고, 유전변이(v1)과 유전변이(v2)가 시스 관계변이(cis-related variants)이고, 유전변이(v2)과 유전변이(v3)가 트랜스 관계변이(trans-elated variants)이면, 유전변이(v1)과 유전변이(v3)는 트랜스 관계변이(trans-elated variants)로 결정되고, 유전변이(v1)과 유전변이(v2)가 트랜스 관계변이(trans-related variants)이고, 유전변이(v2)과 유전변이(v3)가 트랜스 관계변이(trans-related variants)이면, 유전변이(v1)과 유전변이(v3)는 시스 관계변이(cis-related variants)로 결정될 수 있다.
추출된 상기 유전자는 열성유전병을 유발하는 유전자일 수 있다.
위에서 언급된 본 발명의 기술적 과제 외에도, 본 발명의 다른 특징 및 이점들이 이하에서 기술되거나, 그러한 기술 및 설명으로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
이상과 같은 본 발명에 따르면 다음과 같은 효과가 있다.
본 발명은 차세대 염기서열 분석(NGS)에서 리드를 이용하여 열성유전병을 유발하는 원인 원전변이를 판별할 수 있다.
본 발명은 대상샘플의 리드에서 검출된 두 개의 유전변이가 시스 관계변이 인지 트랜스 관계 변이인지를 구별함으로써 열성유전병을 유발하는 원인 유전변이를 판별하는 시간과 노력을 대폭 감소시킬 수 있다.
본 발명은 리드 길이 이상 떨어져 있는 두 유전변이가 트랜스 관계변이 인지 시스 관계변이 인지를 통계적 유의성에 의하지 않고 결정함으로써 열성유전병을 유발하는 원인 유전변이를 판별하는 시간과 노력을 대폭 감소시킬 수 있다.
이 밖에도, 본 발명의 실시 예들을 통해 본 발명의 또 다른 특징 및 이점들이 새롭게 파악될 수도 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 열성유전병 원인 유전변이 판별 장치의 개략적인 구성을 도시한 블록도이다.
도 2는 본 발명의 일 실시예에 따른, 두 개의 유전변이가 트랜스 관계변이인 경우를 설명하기 위한 도면이다.
도 3은 본 발명의 일 실시예에 따른, 두 개의 유전변이가 시스 관계변이인 경우를 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른, 리드 길이 이상 떨어져 있는 두 유전변이가 트랜스 관계변이인 경우를 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른, 리드 길이 이상 떨어져 있는 두 유전변이가 시스 관계변이인 경우를 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른 열성유전병 원인 유전변이 판별 방법을 설명하기 위한 개략적인 흐름도이다.
도 7은 본 발명의 일 실시예에 따른 열성유전병 원인 유전변이 판결 방법을 설명하기 위한 흐름도이다.
도 8은 본 발명의 일 실시예에 따른, 유전변이가 포함되어 있는 리드를 직접 확인한 분석 결과를 나타낸 도면이다.
본 명세서에서 각 도면의 구성요소들에 참조번호를 부가함에 있어서 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 번호를 가지도록 하고 있음에 유의하여야 한다.
한편, 본 명세서에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.
단수의 표현은 문맥상 명백하게 다르게 정의하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다.
"포함하다" 또는 "가지다" 등의 용어는 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
또한, 본 명세서의 해석의 명확함을 위해, 이하에서는 본 명세서에서 사용되는 용어들을 정의하기로 한다.
본 명세서에서 사용되는 용어, "차세대 염기서열 분석"은 유전체의 염기서열 분석기술 중 하나로, DNA 조각을 병렬로 처리함으로써 염기서열을 고속으로 분석할 수 있다. 이러한 특징으로, 차세대 염기서열 분석은 고 처리율 시퀀싱 (high-throughput sequencing), 대용량 병렬 시퀀싱 (massive parallel sequencing) 또는 2세대 시퀀싱 (second-generation sequencing) 으로 불릴 수 있다. 또한, 차세대 염기서열 분석은 목적에 따라 다양한 분석 플랫폼으로 이용될 수 있다. 예를 들어, 차세대 염기서열 분석의 분석 플랫폼은 Roche 454, GS FLX Titanium, Illumina MiSeq, Illumina HiSeq, Illumina Genome Analyzer IIX, Life Technologie SOLiD4, Life Technologies Ion Proton, Life Technologies Ion Proton, Complete Genomics, Helicos Biosciences Heliscope, Pacific Biosciences SMRT 등이 있을 수 있다. 더 나아가, 차세대 염기서열 분석기술은 염기서열의 변이(유전변이) 검출에 이용 될 수 있다. 염기서열의 변이 검출을 위한 바람직한 분석 플랫폼은 Illumina hybridcapture, Illumina Amplicon 및 IonTorrent Amplicon일 수 있으나, 이에 제한되는 것은 아니다.
본 명세서에서 사용되는 용어, "유전변이"는 여러 가지 요인으로 인해, 염색체에서 일어나는 염기서열의 변이를 의미할 수 있다. 예를 들어, 유전변이는 체성 돌연변이, 샘플의 오염으로 인한 염기서열의 변이 및 유전병으로 인한 염기서열의 변이일 수 있고 더 나아가, 유전변이는 산모의 혈액 내에서, 모체 DNA와 함께 소량으로 존재하는 태아의 DNA로 인해 나타날 수 있는, 대립유전자에 의한 염기서열 변이, 뇌 세포 안에서 소량으로 존재하는 돌연변이를 더 포함할 수 있다. 그러나 유전변이는 전술한 것에 제한되는 것은 아니다.
본 명세서에서 사용되는 용어, "대상샘플"은 유전변이를 확인하고자 하는 환자로부터 수득한 생물학적 시료일 수 있고, 본 명세서에서 사용되는 용어, "참조 게놈(reference genome)"은 대상샘플과 대조적으로 유전변이가 나타나지 않은 정상의 생물학적 시료일 수 있다. 바람직한 대상샘플은 체성 돌연변이와 연관된 종양세포일 수 있고, 바람직한 참조 게놈(reference genome)은 정상의 세포에 대하여 미리 염기서열 분석된 레퍼런스 데이터일 수 있으나, 이에 제한되는 것은 아니다. 예를 들어, 참조 게놈(reference genome)은 대상샘플에 따라 다양하게 선택될 수 있으며, 이의 염기서열은 대상샘플의 염기서열과 함께 분석될 수도 있다.
본 명세서에서 사용되는 용어, "리드(reads)"란 게놈 시퀀서(genome sequencer)에서 출력되는 짧은 길이의 염기서열 데이터이다. 리드 길이는 게놈 시퀀서의 종류에 따라 일반적으로 35~500bp(base pair) 정도로 다양하게 구성되며, 일반적으로 DNA 염기의 경우 A, C, G, T의 알파벳 문자로 표현된다.
도 1은 본 발명의 일 실시예에 따른 열성유전병 원인 유전변이 판별 장치의 개략적인 구성을 도시한 블록도이고, 도 2는 본 발명의 일 실시예에 따른, 두 개의 유전변이가 트랜스 관계변이인 경우를 설명하기 위한 도면이고, 도 3은 본 발명의 일 실시예에 따른, 두 개의 유전변이가 시스 관계변이인 경우를 설명하기 위한 도면이다.
도 1 내지 도 3을 참조하면, 본 발명의 일 실시예에 따른 열성유전병 원인 유전변이 판별 장치(1000)는 유전자 추출부(100), 리드 검출부(300), 및 유전변이 판별부(500)를 포함한다.
유전자 추출부(100)는 차세대 염기서열 분석(NGS)에서 참조 게놈의 레퍼런스 염기서열과 대상샘플의 염기서열을 비교하여, 두 개 이상의 유전변이가 발생한 유전자(G)를 추출할 수 있다. 이때 유전자(G)는 후술할 열성유전병을 유발하는 유전자일 수 있다.
리드 검출부(300)는 대상샘플의 리드를 준비하고, 두 개 이상의 유전변이가 발생한 유전자(G)와 매칭되는 대상샘플의 리드(R)를 검출할 수 있다.
리드 검출부(300)는 추출된 유전자(G)에서 두 개의 유전변이(v1, v2)와 유전변이가 존재하는 위치(p1, p2)를 확인한 후, 두 개의 유전변이 위치(p1, p2) 중 어느 하나라도 포함되는 위치를 가지는 리드를 검출할 수 있다.
또한, 리드 검출부(300)는 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드의 수(N), 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 유전변이 v1을 포함하는 리드의 수(n1), 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 유전변이 v2을 포함하는 리드의 수(n2), 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 유전변이 v1과 v2를 모두 포함하는 리드의 수(c1), 및 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 유전변이 v1을 포함하면서 유전변이 v2를 포함하지 않는 리드의 수(c2)를 검출할 수 있다.
사람의 경우 상동염색체인 부에게서 받은 염색체와 모에게서 받은 염색체 모두에서 유전병을 일으키는 것으로 알려진 유전자의 변이로 인하여 질병이 발병할 경우 이러한 질병을 열성유전병이라 하고, 부에게서 받은 염색체와 모에게서 받은 염색체 중 어느 하나에 유전병을 일으키는 것으로 알려진 유전자의 변이로 인하여 질병이 발병할 경우 이러한 질병을 우성유전병이라 한다.
도 2을 참조하면, 동일 유전자(G)의 서로 다른 위치(p1, p2)에서 발생한 두 개의 유전변이(v1, v2) 중 하나는 부(a)에게서 왔고, 다른 하나는 모(b)에게서 온 경우에, 그 유전자(G)로 인해 질병이 발생하면 그 유전자(G)는 열성유전이라 하고, 그 질병은 열성유전병이다.
반면에, 도 3을 참조하면, 동일 유전자(G)의 서로 다른 위치(p1, p2)에서 발생한 두 개의 유전변이(v1, v2) 모두가 부(a) 또는 모(b) 어느 한쪽에서만 온 경우에, 그 유전자(G)가 열성유전이라면 질병이 발생되지 않는다.
이때, 두 개의 유전변이가 상동 염색체 중 어느 하나에만 발견된 변이를 시스 관계변이(cis-related variants)라 명명하고, 두 개의 유전변이가 상동 염색체 모두에서 발견된 변이를 트랜스 관계변이(trans-elated variants)라 명명한다.
즉, 환자에게서 발견된 유전변이의 유전자가 열성유전 방식으로 질병을 유발하는 경우에, 환자에게서 발견된 유전변이가 부와 모 모두에게 존재한다면(트랜스 관계변이) 이 유전변이는 환자의 열성유전병의 원인 유전변이의 후보가 될 수 있다.
반면에, 환자에게서 발견된 유전변이의 유전자가 열성유전 방식으로 질병을 유발하는 경우에, 환자에게서 발견된 유전변이가 부 또는 모 어느 한쪽에서만 존재한다면(시스 관계변이) 이 유전변이는 열성유전병의 원인 유전변이 후보에서 제외된다.
이와 같이, 동일 유전자의 서로 다른 위치(p1, p2)에서 발생한 두 개 이상의 변이가 시스 관계변이(cis-related variants)인지 트랜스 관계변이(trans-elated variants)인지를 밝혀내는 것은 열성유전병을 유발하는 원인 유전변이 인지 아닌지를 판단하는 중요한 정보가 될 수 있다.
한편, 차세대 염기서열 분석(NGS)에서 검출된 각각의 리드(R)는 부에게서 받은 염색체(a) 염기서열을 읽은 것인지, 모에게서 받은 염색체(b) 염기서열을 읽은 것인지 알 수 없어서, 각 리드(R)에 존재하는 유전변이들이 시스 관계변이 인지 트랜스 관계변이 인지 알 수 없다.
유전변이 판별부(500)는 리드(R)를 이용하여 열성유전병 원인 유전변이를 판별할 수 있다.
유전변이 판별부(500)는 리드(R)에서 검출된 두 개의 유전변이가 시스 관계변이 인지 트랜스 관계변이 인지 구분하여 트랜스 관계변이로 결정되면 두 개의 유전변이를 열성유전병 원인 유전변이로 판별할 수 있다.
이때, 리드(R)에서 검출된 두 개의 유전변이(v1, v2)는 하기 [식 1]로 산출된 score(v1, v2)가 기준 값 이상이면 시스 관계변이(cis-related variants)로 결정될 수 있다.
[식 1]
Figure 112021061071686-pat00021
여기서, N은 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드의 수, n1은 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하는 리드의 수, n2는 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v2을 포함하는 리드의 수, c1는 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1과 v2를 모두 포함하는 리드의 수이다.
이론적으로는 시스 관계변이일 경우에는 p1과 p2를 모두 포함하는 리드라면 v1과 v2가 모두 그 리드에서 나와야 하므로, n1과 n2가 같아야 한다. 그러나, 실험적인 이유 또는 생물학적인 이유 등으로 인해서 n1과 n2가 완전히 같이 않으므로, n1과 n2가 얼마나 유사한지에 대한 통계적 유의성(Fisher's exact p-value)을 가지고 판별할 수 있다.
또한, 리드(R)에서 검출된 두 개의 유전변이(v1, v2)는 하기 [식 1]로 산출된 score(v1, v2)가 기준 값 이상이면 트랜스 관계변이(trans-elated variants)로 결정될 수 있다.
[식 2]
Figure 112019122845714-pat00006
여기서, N은 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드의 수, n1은 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하는 리드의 수, n2는 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v2을 포함하는 리드의 수, c2는 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하면서 v2를 포함하지 않는 리드의 수이다.
이와 같이, 본 발명의 일 실시예에 따른 열성유전병 원인 유전변이 판별 장치(1000)는 차세대 염기서열 분석(NGS)에서 리드를 이용하여 열성유전병을 유발하는 원인 유전변이를 판별할 수 있다.
또한, 두 개의 유전변이가 시스 관계변이 인지 트랜스 관계변이 인지를 구별하기 위해서는 환자의 부와 모 모두에 대해 유전자 검사를 해야 가능하지만, 본 발명의 일 실시예에 따른 열성유전병 원인 유전변이 판별 장치(1000)는 대상샘플의 리드에서 검출된 두 개의 유전변이가 시스 관계변이 인지 트랜스 관계 변이인지를 구별함으로써 열성유전병을 유발하는 원인 유전변이를 판별하는 시간과 노력을 대폭 감소시킬 수 있다.
도 4는 본 발명의 일 실시예에 따른, 리드 길이 이상 떨어져 있는 두 유전변이가 트랜스 관계변이인 경우를 설명하기 위한 도면이고, 도 5는 본 발명의 일 실시예에 따른, 리드 길이 이상 떨어져 있는 두 유전변이가 시스 관계변이인 경우를 설명하기 위한 도면이다.
본 발명의 다른 실시예에 따른 열성유전병 원인 유전변이 판별 장치는 리드 길이 이상 떨어져 있는 두 유전변이가 트랜스 관계변이 인지 시스 관계변이 인지를 판별할 수 있다.
차세대 염기서열 분석(NGS)에서 한 번에 읽을 수 있는 DNA 서열 길이는 제한적이므로, 리드 길이도 150bp 정도로 제한적일 수 밖에 없다.
즉, 리드 길이 이상 떨어져 있는 두 유전변이는 통계적 유의성을 가지고 트랜스 관계변이 인지 시스 관계변이 인지 결정할 수 없다.
본 발명은 리드 길이 이상 떨어져 있는 두 유전변이를 중간에 있는 변이를 이용함으로써 트랜스 관계변이 인지 시스 관계변이 인지 결정할 수 있는 방법을 제시한다.
도 4를 참조하면, v1과 v2가 트랜스 관계변이 이고, v2와 v3가 트랜스 관계변이 이면, v1과 v3는 시스 관계변이다.
상동염색체는 2개의 염색체가 한 쌍이므로, v1과 v2가 다른 염색체에 있고, v2와 v3가 다른 염색체에 있으면 v1과 v3는 같은 염색체에 있어야 하므로 시스 관계변이가 된다.
도 5를 참조하면, v1과 v2가 시스 관계변이 이고, v2와 v3가 트랜스 관계변이 이면, v1과 v3는 트랜스 관계변이다.
상동염색체는 2개의 염색체가 한 쌍이므로, v1과 v2가 동일 염색체에 있고, v2와 v3가 다른 염색체에 있으면 v1과 v3는 다른 염색체에 있어야 하므로 트랜스 관계변이가 된다.
도시하지는 않았지만, , v1과 v2가 시스 관계변이 이고, v2와 v3가 시스 관계변이 이면, v1과 v3는 시스 관계변이다.
이와 같이, 본 발명의 다른 실시예에 따른 열성유전병 원인 유전변이 판별 장치는 리드 길이 이상 떨어져 있는 두 유전변이가 트랜스 관계변이 인지 시스 관계변이 인지를 통계적 유의성에 의하지 않고 결정함으로써 열성유전병을 유발하는 원인 유전변이를 판별하는 시간과 노력을 대폭 감소시킬 수 있다.
이하에서는 도 6 내지 도 8을 참조하여, 본 발명의 일 실시예에 따른 열성유전병 원인 유전변이 판별 방법을 설명한다.
도 6은 본 발명의 일 실시예에 따른 열성유전병 원인 유전변이 판별 방법을 설명하기 위한 개략적인 흐름도이고, 도 7은 본 발명의 일 실시예에 따른 열성유전병 원인 유전변이 판결 방법을 설명하기 위한 흐름도이고, 도 8은 본 발명의 일 실시예에 따른, 유전변이가 포함되어 있는 리드를 직접 확인한 분석 결과를 나타낸 도면이다.
본 발명의 일 실시예에 따른 열성유전병 원인 유전변이 판별 방법은 유전자 추출단계(S100), 리드 검출단계(S300), 및 유전변이 판별단계(S500)를 포함한다.
유전자 추출단계(S100)는 유전자 추출부를 통해, 차세대 염기서열 분석(NGS)에서 참조 게놈의 레퍼런스 염기서열과 대상샘플의 염기서열을 비교한 후(S110), 두 개 이상의 유전변이가 발생한 유전자를 추출할 수 있다(S130).
다음으로, 리드 검출단계(S300)는 리드 검출부를 통해, 추출된 유전자에서 두 개의 유전변이(v1, v2)와 유전변이가 존재하는 위치(p1, p2)를 확인한 후(S310), 두 개의 유전변이 위치(p1, p2) 중 어느 하나라도 포함되는 위치를 가지는 리드를 검출한다(S330).
이때, 리드 수 검출(S330) 단계에서 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드의 수(N), 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하는 리드의 수(n1), 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v2을 포함하는 리드의 수(n2), 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1과 v2를 모두 포함하는 리드의 수(c1), 및 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하면서 v2를 포함하지 않는 리드의 수(c2)를 검출한다.
도 8을 참조하면, 데이터는 대상샘플 1번 염색체의 979690번의 구아닌(G) 염기가 아데닌(A) 염기로 바뀐 유전변이와 대상샘플 1번 염색체의 979835번의 구아닌(G) 염기가 아데닌(A) 염기로 바뀐 유전변이에 대한 각 리드의 결과물이다.
리드 검출단계(S300)에서 추출된 유전자에 포함되어 있는 두 개의 유전변이를 기준으로, 각 리드에서 정상(O)과 유전변이(X)를 표시하여 리드 수를 검출할 수 있다.
다음으로, 유전변이 판별단계(S500)는 유전변이 판별부를 통해, 리드에서 검출된 서로 다른 위치(p1, p2)에서 발생한 두 개의 유전변이(v1, v2)가 시스 관계변이 인지 트랜스 관계변이 인지 결정하고(S510), 트랜스 관계변이를 열성 유전병 원인 유전변이로 판별한다(S530).
이때, 두 개의 유전변이가 상동 염색체 중 어느 하나에만 발견된 변이를 시스 관계변이(cis-related variants)라 명명하고, 두 개의 유전변이가 상동 염색체 모두에서 발견된 변이를 트랜스 관계변이(trans-elated variants)라 명명한다.
리드에서 검출된 서로 다른 위치(p1, p2)에서 발생한 두 개의 유전변이(v1, v2)는 앞서 설명한 [식 1]에 의해 시스 관계변이로 결정될 수 있고, [식 2]에 의해 트랜스 관계변이로 결정될 수 있다.
한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성 가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드 디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다.
이상에서 설명한 본 발명이 전술한 실시예 및 첨부된 도면에 한정되지 않으며, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지로 치환, 변형 및 변경이 가능하다는 것은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.
100: 유전자 추출부 300: 리드 검출부
500: 유전변이 판별부 p1, p2 : 두 개의 유전변이 위치
v1, v2: 두 개의 유전변이

Claims (15)

  1. 유전변이 추출부를 통해, 차세대 염기서열 분석(NGS)에서 참조 게놈의 레퍼런스 염기서열과 대상샘플의 염기서열을 비교하여, 두 개 이상의 유전변이가 발생한 유전자를 추출하는 유전자 추출단계;
    리드 검출부를 통해, 상기 추출된 유전자와 매칭되는 대상샘플의 리드를 검출하는 리드 검출단계; 및
    유전변이 판별부를 통해, 상기 리드를 이용하여 열성유전병 원인 유전변이를 판별하는 유전변이 판별단계를 포함하고,
    상기 리드 검출단계는,
    상기 추출된 유전자에서 두 개의 유전변이(v1, v2)와 상기 유전변이가 존재하는 위치(p1, p2)를 확인하는 단계; 및
    상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드의 수(N), 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하는 리드의 수(n1), 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v2을 포함하는 리드의 수(n2), 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1과 v2를 모두 포함하는 리드의 수(c1), 및 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하면서 v2를 포함하지 않는 리드의 수(c2)를 검출하는 단계를 포함하고,
    상기 유전변이 판별단계는,
    하기 [식 1]로 산출된 score(v1, v2)가 기준 값 이상이면 두 개의 유전변이(v1, v2)가 시스 관계변이(cis-related variants)로 결정되고, 하기 [식 2]로 산출되고, score(v1, v2)가 기준 값 이상이면 두 개의 유전변이(v1, v2)가 트랜스 관계변이(trans-elated variants)로 결정되고, 상기 리드에서 검출된 두 개의 유전변이가 시스 관계변이(cis-related variants)인지 트랜스 관계변이(trans-elated variants)인지 구분하여 트랜스 관계변이로 결정되면 열성유전병 원인 유전변이로 판별하고,
    상기 시스 관계변이(cis-related variants)는 상기 두 개의 유전변이가 상동 염색체 중 어느 하나에만 발견된 변이를 말하고, 상기 트랜스 관계변이(trans-elated variants)는 상기 두 개의 유전변이가 상동 염색체 모두에서 발견된 변이를 말하는 것을 특징으로 하는 열성유전병 원인 유전변이 판별 방법.
    [식 1]
    Figure 112021061071686-pat00022

    [식 2]
    Figure 112021061071686-pat00023
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 제1항에 있어서,
    상기 리드 중 두 개의 유전변이(v1, v2)를 가지는 제1리드와 두 개의 유전변이(v2, v3)를 가지는 제2리드에 대해서,
    유전변이(v1)과 유전변이(v2)가 시스 관계변이(cis-related variants)이고, 유전변이(v2)과 유전변이(v3)가 시스 관계변이(cis-related variants)이면, 유전변이(v1)과 유전변이(v3)는 시스 관계변이(cis-related variants)로 결정되고,
    유전변이(v1)과 유전변이(v2)가 시스 관계변이(cis-related variants)이고, 유전변이(v2)과 유전변이(v3)가 트랜스 관계변이(trans-elated variants)이면, 유전변이(v1)과 유전변이(v3)는 트랜스 관계변이(trans-elated variants)로 결정되고,
    유전변이(v1)과 유전변이(v2)가 트랜스 관계변이(trans-related variants)이고, 유전변이(v2)과 유전변이(v3)가 트랜스 관계변이(trans-related variants)이면, 유전변이(v1)과 유전변이(v3)는 시스 관계변이(cis-related variants)로 결정되는 것을 특징으로 하는 열성유전병 원인 유전변이 판별 방법.
  7. 삭제
  8. 차세대 염기서열 분석(NGS)에서 참조 게놈의 레퍼런스 염기서열과 대상샘플의 염기서열을 비교하여, 두 개 이상의 유전변이가 발생한 유전자를 추출하는 유전자 추출부;
    상기 추출된 유전자와 매칭되는 대상샘플의 리드를 검출하는 리드 검출부; 및
    상기 리드를 이용하여 열성유전병 원인 유전변이를 판별하는 유전변이 판별부를 포함하고,
    상기 리드 검출부는,
    상기 추출된 유전자에서 두 개의 유전변이(v1, v2)와 상기 유전변이가 존재하는 위치(p1, p2)를 확인하고,
    상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드의 수(N), 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하는 리드의 수(n1), 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v2을 포함하는 리드의 수(n2), 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1과 v2를 모두 포함하는 리드의 수(c1), 및 상기 두 개의 유전변이 위치(p1, p2)를 모두 포함하는 리드 중 v1을 포함하면서 v2를 포함하지 않는 리드의 수(c2)를 검출하고,
    상기 유전변이 판별부는,
    하기 [식 1]로 산출된 score(v1, v2)가 기준 값 이상이면 두 개의 유전변이(v1, v2)를 시스 관계변이(cis-related variants)로 결정하고, 하기 [식 2]로 산출된 score(v1, v2)가 기준 값 이상이면 두 개의 유전변이(v1, v2)를 트랜스 관계변이(trans-elated variants)로 결정하고, 상기 리드에서 검출된 두 개의 유전변이가 시스 관계변이(cis-related variants)인지 트랜스 관계변이(trans-elated variants)인지 구분하여 트랜스 관계변이로 결정되면 열성유전병 원인 유전변이로 판별하고,
    상기 시스 관계변이(cis-related variants)는 상기 두 개의 유전변이가 상동 염색체 중 어느 하나에만 발견된 변이를 말하고, 상기 트랜스 관계변이(trans-elated variants)는 상기 두 개의 유전변이가 상동 염색체 모두에서 발견된 변이를 말하는 것을 특징으로 하는 열성유전병 원인 유전변이 판별 장치.
    [식 1]
    Figure 112021061071686-pat00024

    [식 2]
    Figure 112021061071686-pat00025
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 제8항에 있어서,
    상기 리드 중 두 개의 유전변이(v1, v2)를 가지는 제1리드와 두 개의 유전변이(v2, v3)를 가지는 제2리드에 대해서,
    유전변이(v1)과 유전변이(v2)가 시스 관계변이(cis-related variants)이고, 유전변이(v2)과 유전변이(v3)가 시스 관계변이(cis-related variants)이면, 유전변이(v1)과 유전변이(v3)는 시스 관계변이(cis-related variants)로 결정되고,
    유전변이(v1)과 유전변이(v2)가 시스 관계변이(cis-related variants)이고, 유전변이(v2)과 유전변이(v3)가 트랜스 관계변이(trans-elated variants)이면, 유전변이(v1)과 유전변이(v3)는 트랜스 관계변이(trans-elated variants)로 결정되고,
    유전변이(v1)과 유전변이(v2)가 트랜스 관계변이(trans-related variants)이고, 유전변이(v2)과 유전변이(v3)가 트랜스 관계변이(trans-related variants)이면, 유전변이(v1)과 유전변이(v3)는 시스 관계변이(cis-related variants)로 결정되는 것을 특징으로 하는 열성유전병 원인 유전변이 판별 장치.
  14. 삭제
  15. 제1항 또는 제6항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.

KR1020190155304A 2019-11-28 2019-11-28 Ngs를 이용한 열성유전병 원인 유전변이 판별 방법 및 장치 KR102319447B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020190155304A KR102319447B1 (ko) 2019-11-28 2019-11-28 Ngs를 이용한 열성유전병 원인 유전변이 판별 방법 및 장치
PCT/KR2020/016706 WO2021107567A1 (ko) 2019-11-28 2020-11-24 Ngs를 이용한 열성유전병 원인 유전변이 판별 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190155304A KR102319447B1 (ko) 2019-11-28 2019-11-28 Ngs를 이용한 열성유전병 원인 유전변이 판별 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20210066276A KR20210066276A (ko) 2021-06-07
KR102319447B1 true KR102319447B1 (ko) 2021-10-29

Family

ID=76130655

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190155304A KR102319447B1 (ko) 2019-11-28 2019-11-28 Ngs를 이용한 열성유전병 원인 유전변이 판별 방법 및 장치

Country Status (2)

Country Link
KR (1) KR102319447B1 (ko)
WO (1) WO2021107567A1 (ko)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014133369A1 (ko) 2013-02-28 2014-09-04 주식회사 테라젠이텍스 유전체 서열분석을 이용한 태아 염색체 이수성의 진단 방법 및 장치
JP6378529B2 (ja) * 2014-04-28 2018-08-22 国立大学法人 鹿児島大学 遺伝性疾患の検出方法
KR20160010277A (ko) * 2014-07-18 2016-01-27 에스케이텔레콤 주식회사 산모의 무세포 dna의 차세대 서열분석을 통한 태아의 단일유전자 유전변이의 예측방법
KR101638473B1 (ko) * 2014-12-26 2016-07-12 연세대학교 산학협력단 차세대 염기서열 분석법을 기반으로 하는 결실 유전자군 검출 방법
KR101936933B1 (ko) * 2016-11-29 2019-01-09 연세대학교 산학협력단 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
KR102035615B1 (ko) * 2017-08-07 2019-10-23 연세대학교 산학협력단 유전자 패널에 기초한 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
CN109295198A (zh) * 2018-09-03 2019-02-01 安吉康尔(深圳)科技有限公司 用于检测遗传性疾病基因变异的方法、装置及终端设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Alexandra R. Buckley 외, Rare variant phasing using paired tumor:normal sequence data, BMC Bioinformatics, 2019.05.27., Vol.20, No.265, pp.1-11.
Emily S. Wong 외, Interplay of cis and trans mechanisms driving transcription factor binding and gene expression evolution, NATURE COMMUNICATIONS, Vol.8, No.1092, pp.1-13.
Stephane E. Castel 외, Rare variant phasing and haplotypic expression from RNA sequencing with phASER, Nature Communications, 2016.09.08., Vol.7, No.12817, pp.1-6.*
Wen-Yun Yang 외, Leveraging reads that span multiple single nucleotide polymorphisms for haplotype inference from sequencing data, BIOINFORMATICS, 2013.07.03., Vol.29, No.18, pp.2245-2252.

Also Published As

Publication number Publication date
KR20210066276A (ko) 2021-06-07
WO2021107567A1 (ko) 2021-06-03

Similar Documents

Publication Publication Date Title
US10741270B2 (en) Size-based analysis of cell-free tumor DNA for classifying level of cancer
EP3143537B1 (en) Rare variant calls in ultra-deep sequencing
Guo et al. Multi-perspective quality control of Illumina exome sequencing data using QC3
WO2017127741A1 (en) Methods and systems for high fidelity sequencing
Henke et al. Perspectives for identification of mutations in the zebrafish: making use of next-generation sequencing technologies for forward genetic approaches
CA3162089A1 (en) Biterminal dna fragment types in cell-free samples and uses thereof
KR101936934B1 (ko) 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
Normand et al. An introduction to high-throughput sequencing experiments: design and bioinformatics analysis
CN112634984B (zh) 一种同时检测dna甲基化和基因组变异的方法、装置和存储介质
Sakoparnig et al. Whole genome phylogenies reflect long-tailed distributions of recombination rates in many bacterial species
KR102347463B1 (ko) 핵산 서열 분석에서 위양성 변이를 검출하는 방법 및 장치
KR102319447B1 (ko) Ngs를 이용한 열성유전병 원인 유전변이 판별 방법 및 장치
JP2006079334A (ja) 遺伝子情報の表示方法及び表示装置
CN111028885B (zh) 一种检测牦牛rna编辑位点的方法及装置
US10443090B2 (en) Method and apparatus for detecting translocation
US11328794B2 (en) Method for determining relatedness of genomic samples using partial sequence information
Attimonelli et al. Human nuclear mitochondrial sequences (NumtS)
CN117935933B (zh) Cdkn2a/b纯合性缺失的分析方法及系统
CN114175170A (zh) 使用ngs数据预测基因型的方法及装置
KR102347464B1 (ko) 핵산서열 분석에서 진양성 변이를 판별하는 방법 및 장치
US20170226588A1 (en) Systems and methods for dna amplification with post-sequencing data filtering and cell isolation
Sritharan Strategies for Optimisation of Variant Prediction in Yeast Genomes
Gao et al. A theoretical base for non-invasive prenatal paternity testing
Yu et al. LcDel: deletion variation detection based on clustering and long reads
JP2006017461A (ja) 遺伝子情報の表示方法及び表示装置

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant