KR102532991B1 - 태아의 염색체 이수성 검출방법 - Google Patents

태아의 염색체 이수성 검출방법 Download PDF

Info

Publication number
KR102532991B1
KR102532991B1 KR1020200180848A KR20200180848A KR102532991B1 KR 102532991 B1 KR102532991 B1 KR 102532991B1 KR 1020200180848 A KR1020200180848 A KR 1020200180848A KR 20200180848 A KR20200180848 A KR 20200180848A KR 102532991 B1 KR102532991 B1 KR 102532991B1
Authority
KR
South Korea
Prior art keywords
dna sequence
sequence reads
dna
ratio
aneuploidy
Prior art date
Application number
KR1020200180848A
Other languages
English (en)
Other versions
KR20210082098A (ko
Inventor
권영준
오미진
김영훈
허혜진
이우경
김숙
남경우
김성수
Original Assignee
주식회사 랩 지노믹스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 랩 지노믹스 filed Critical 주식회사 랩 지노믹스
Publication of KR20210082098A publication Critical patent/KR20210082098A/ko
Application granted granted Critical
Publication of KR102532991B1 publication Critical patent/KR102532991B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B2503/00Evaluating a particular growth phase or type of persons or animals
    • A61B2503/02Foetus

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 태아의 염색체 이수성 검출방법으로서 태아유래 또는 산모유래 DNA 비율이 증가된 부분을 사용하는 염색체 이수성 검출방법을 제공한다.
본 발명의 태아의 염색체 이수성 검출방법 및 이를 이용하는 컴퓨터 시스템은 염색체 이수성 검출 분야에서 비침습적 방법에 의한 태아의 염색체 이수성 검출방법으로 유용하게 사용될 수 있다.

Description

태아의 염색체 이수성 검출방법{Method for detecting fetal chromosomal aneuploidy}
본 발명은 태아의 염색체 이수성 검출방법에 관한 것으로, 더욱 상세하게는 비침습적 방법에 의한 태아의 염색체 이수성 검출방법에 관한 것이다.
기존의 산전 기형아 검사로는 산모 혈액의 생화학적 지표를 이용한 스크리닝 검사와 융모막 검사, 양수천자와 같은 확진 검사가 있다. 확진검사로 이용되는 융모막 검사와 양수천자는 주사 바늘을 자궁 내로 주입하는 침습적인 검사이기 때문에 1% 미만의 유산율을 보여 산모에게 불안감을 줄 수 있다. 그리고, 생화학적 지표를 이용한 검사는 비침습적인 방법으로 유산될 확률은 없으나 검출률이 낮으며, 다운증후군이 아니어도 양성으로 나올 확률(위양성률)이 5%나 되어 검사의 정확도가 낮다. 이와 같은 단점을 보완한 검사가 NIPT(비침습적 산전 기형아 검사)로, 임신한 산모의 혈액 속에 존재하는 태아의 DNA로부터 차세대 염기서열 분석법(Next Generation Sequencing, NGS)을 이용하여 다운증후군, 에드워드증후군, 파타우증후군 등을 정확하고 안전하게 검사할 수 있다.
NIPT의 성공적인 결과를 얻기 위한 가장 중요한 인자는 모체 혈액 내에 있는 cff(cell free fetal) DNA의 양으로서, cff DNA의 양이 적은 경우에는 부정확한 결과를 야기할 수 있어, 심각한 문제점을 발생시킨다. cff DNA는 일반적으로 전체 모성혈액 내 세포 유리 DNA의 약 10% 내외를 차지하며 20주 이후에 급격하게 증가하기 시작한다. 이상 배수체의 타입에 따라서도 영향을 받는데 삼배수체 21은 유입되는 cff DNA의 양이 증가하지만 삼배수체 13, 18, monosomy X는 감소하는데 태반 내 영양막세포의 강화된 세포소멸기전으로 풀이된다. 그 외 다태임신 시 태아의 수 증가와 유입되는 cff DNA 양은 비례하지 않고 오히려 융모막성(chorionicity)과 무관하게 약 50%로 감소하는 경향을 보이며 쌍태임신의 10-15%에서는 태아 염색체 이상 유무와 무관하게 결과를 얻을 수 없을 정도로 낮은 cff DNA값을 보이기도 한다. 그 외 정상 염색체를 보이는 태아와 태반에 국한된 모자이시즘(confined placental mosaicism)이나 쌍둥이소실(vanishing twin) 등의 이유로 인하여 0.1%의 불일치 결과를 얻을 수 있다.
이렇듯 비침습적 산전검사의 영향 요인이 다양하기 때문에 태아의 염색체 이상을 검출하기 위한 여러 방법들이 나오고 있는 상황이다. 하지만, 그 정확도나 기술적 용이성 등의 측면에서 아직 개선해야 할 부분이 많은 실정이다.
Yu et al., 2014. Size-based molecular diagnostics using plasma DNA for noninvasive prenatal testing. Proc Natl Acad Sci 111: 8583-8588.
본 발명이 해결하고자 하는 과제는 태아의 염색체 이상을 검출하기 위한 방법에 있어서, 비침습적 산전검사의 영향 요인을 최소화하고, 정확도와 기술적 용이성 등이 개선된 검출방법을 제공하는 것이다.
본 발명이 해결하고자 하는 과제는 이상에서 언급한 해결 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
상기 해결 과제를 달성하기 위하여, 본 발명의 일 측면에 따라,
태아 및 산모의 세포유리 DNA 분자를 포함하는 DNA 샘플에서 염색체 이수성을 검출하는 방법으로서,
상기 DNA 샘플의 염기서열 분석 결과에서 세포유리 DNA 서열리드(read)를 수득하는 단계;
상기 세포유리 DNA 서열리드(read)를 참조 염색체와 맵핑(mapping)시켜서 DNA 서열리드를 구별하는 단계;
상기 구별된 DNA 서열리드의 절편크기(fragment size)를 분석하여 기준치 이하 크기에 해당하는 DNA 서열리드의 수를 계산하여 태아유래 DNA 비율이 증가된 DNA 서열리드 수를 얻는 단계;
상기 얻은 태아유래 DNA 비율이 증가된 DNA 서열리드 수에서 이수성 가능성이 있는 염색체의 DNA 서열리드 수를 분석하여 이수성 가능성이 있는 염색체의 태아유래 DNA 비율이 증가된 DNA 서열리드 수를 결정하는 단계;
상기 구별된 DNA 서열리드의 절편크기를 분석하여 기준치 초과 크기에 해당하는 DNA 서열리드의 수를 계산하여 산모유래 DNA 비율이 증가된 DNA 서열리드 수를 얻는 단계;
상기 얻은 산모유래 DNA 비율이 증가된 DNA 서열리드 수에서 상기 이수성 가능성이 있는 염색체와 동일한 염색체의 DNA 서열리드 수를 분석하여 이수성 가능성이 있는 염색체의 산모유래 DNA 비율이 증가된 DNA 서열리드 수를 결정하는 단계;
상기 이수성 가능성이 있는 염색체의 태아유래 DNA 비율이 증가된 DNA 서열리드 수 및 이수성 가능성이 있는 염색체의 산모유래 DNA 비율이 증가된 DNA 서열리드 수의 상대적 비율로부터 파라미터를 결정하는 단계; 및
상기 파라미터를 하나 이상의 컷오프 값(cutoff value)과 비교하여 태아의 염색체 이수성 여부를 결정하는 단계;
를 포함하는 태아의 염색체 이수성 검출방법이 제공된다.
본 발명의 다른 측면에 따라,
태아의 염색체 이수성을 검출하기 위한 연산을 행할 수 있도록 컴퓨팅 시스템을 제어하기 위한 복수의 명령이 암호화된 컴퓨터 판독 가능한 매체를 포함하는 컴퓨터 시스템으로서, 상기 연산은
태아 및 산모의 세포유리 DNA 분자를 포함하는 DNA 샘플의 염기서열 분석 결과에서 세포유리 DNA 서열리드(read) 데이터를 수득하는 단계;
상기 세포유리 DNA 서열리드 데이터를 참조 염색체 데이터와 맵핑(mapping)시켜서 DNA 서열리드를 구별하는 단계;
태아유래 DNA 비율이 증가된 DNA 서열리드를 분석하기 위해 상기 구별된 DNA 서열리드의 절편크기(fragment size)를 분석하여 기준치 이하 크기에 해당하는 DNA 서열리드의 수를 수득함으로써 태아유래 DNA 비율이 증가된 DNA 서열리드 수를 도출하는 단계;
상기 도출한 태아유래 DNA 비율이 증가된 DNA 서열리드 수에서 이수성 가능성이 있는 염색체의 DNA 서열리드 수를 분석하여 이수성 가능성이 있는 염색체의 태아유래 DNA 비율이 증가된 DNA 서열리드 수를 결정하는 단계;
산모유래의 DNA 비율이 증가된 DNA 서열리드를 분석하기 위해 상기 구별된 DNA 서열리드의 절편크기를 분석하여 기준치 초과 크기에 해당하는 DNA 서열리드의 수를 수득함으로써 산모유래 DNA 비율이 증가된 DNA 서열리드 수를 도출하는 단계;
상기 도출한 산모유래 DNA 비율이 증가된 DNA 서열리드 수에서 상기 태아유래 DNA 비율이 증가된 DNA 서열리드로부터 수가 결정되는 태아에서 이수성 가능성이 있는 염색체와 동일한 염색체의 DNA 서열리드 수를 분석하여 이수성 가능성이 있는 염색체의 산모유래 DNA 비율이 증가된 DNA 서열리드 수를 결정하는 단계;
상기 이수성 가능성이 있는 염색체의 태아유래 DNA 비율이 증가된 DNA 서열리드 수 및 상기 이수성 가능성이 있는 염색체의 산모유래 DNA 비율이 증가된 서열리드 수의 상대적 비율로부터 파라미터를 결정하는 단계; 및
상기 파라미터를 하나 이상의 컷오프 값(cutoff value)과 비교하여 태아의 염색체 이수성이 존재하는 것으로 결정하는 단계;
를 포함하는 것인 컴퓨터 시스템이 제공된다.
본 발명의 태아의 염색체 이수성 검출방법[비율 강화 방법(enrichment method)]은 기존 검출 방법에 의하면 위-양성(False positive)으로 판명되었던 검체의 수를 현저히 감소시켜, 위-양성(False positive) 제거에 우수한 효과를 나타냈으므로, 염색체 이수성 검출의 정확도를 현저히 개선시킨 것으로 확인되었다.
따라서, 본 발명의 태아의 염색체 이수성 검출방법 및 이를 이용하는 컴퓨터 시스템은 염색체 이수성 검출 분야에서 비침습적 방법에 의한 태아의 염색체 이수성 검출방법으로 유용하게 사용될 수 있다.
본 발명의 효과는 상기한 효과로 한정되는 것은 아니며, 본 발명의 설명 또는 특허청구범위에 기재된 발명의 구성으로부터 추론 가능한 모든 효과를 포함하는 것으로 이해되어야 한다.
도 1은 본 발명의 일 실시예에 따른 태아의 염색체 이수성 검출방법을 나타내는 프로세스 흐름도이다.
도 2a는 유클리드 거리를 이용하여 선택된 참조집단(ED-based reference selection) 및 임의의 참조집단(Random reference selection)에 대하여 z-스코어를 측정한 결과이다.
도 2b는 비선택 집단(Not_selected_sample), 선택된 참조집단(Selected_reference_set), 및 검체 샘플(Tested_sample)에 대하여 다차원 척도법(Multi-demensional scaling, MDS)을 수행하여 얻은 결과이다.
도 3a는 정상(Normal) 및 13번 염색체 3배수체(Trisomy13) 샘플에 대하여, 도 3b는 정상(Normal) 및 18번 염색체 3배수체(Trisomy18) 샘플에 대하여, 도 3c는 정상(Normal) 및 21번 염색체 3배수체(Trisomy21) 샘플에 대하여, 도 3d는 X 염색체 1배수체(monosomyX), 정상(Normal) 및 X 염색체 3배수체(XXX) 샘플에 대하여, 각각 z-스코어 분석을 수행한 결과이다.
도 4a는 정상(Normal) 및 13번 염색체 3배수체(Trisomy13) 샘플에 대하여, 도 4b는 정상(Normal) 및 18번 염색체 3배수체(Trisomy18) 샘플에 대하여, 도 4c는 정상(Normal) 및 21번 염색체 3배수체(Trisomy21) 샘플에 대하여, 도 4d는 X 염색체 1배수체(monosomyX), 정상(Normal) 및 X 염색체 3배수체(XXX) 샘플에 대하여, 각각 본 발명의 비율 강화 방법으로 계산한 z-스코어(Enrichment-based score) 및 개수-기반 방법으로 계산한 z-스코어(count-based score) 분석 결과이다.
도 5a는 정상(Normal) 및 13번 염색체 3배수체(Trisomy13) 샘플에 대하여, 도 5b는 정상(Normal) 및 18번 염색체 3배수체(Trisomy18) 샘플에 대하여, 도 5c는 정상(Normal) 및 21번 염색체 3배수체(Trisomy21) 샘플에 대하여, 도 5d는 X 염색체의 1배수체(monosomyX), 정상(Normal) 및 X 염색체 3배수체(XXX) 샘플에 대하여, 각각 본 발명의 비율 강화 방법으로 계산한 z-스코어(Enrichment-based score) 및 크기-기반 방법으로 계산한 z-스코어(size-based score) 분석 결과이다.
본 명세서에서, "리드(read)"라 함은, 염기 서열 분석(시퀀싱, sequencing) 라이브러리에 포함된 DNA(deoxyribonucleic acid) 또는 cDNA(complementary DNA) 단편에서 생성한 분석량에 대한 염기쌍 정보를 의미하는 것으로, 염기 서열 분석으로 나온 출력 데이터, 시퀀스(염기 서열)의 조각을 포함할 수 있다.
본 명세서에서, "맵핑(mapping)"이라 함은, 피검체(개인, 환자)의 염기 서열 데이터(sequence read)를 참조 염색체의 염기 서열(reference genome)과 비교하는 작업을 의미한다.
본 명세서에서, "bin"이라 함은 참조 염색체의 염기 서열의 일정 대상 부분을 일정 크기로 나눈 소규모 구간을 의미한다.
본 명세서에서, "FASTQ 데이터"라 함은, 분석을 하는 기초 데이터이며, 서열 ID, 염기 서열 정보, 염기 서열 품질(quality) 등을 포함할 수 있다.
본 명세서에서, "bam 파일(binary alignment/map format file)"이라 함은, FASTQ 데이터의 각 서열들이 참조 염색체의 염기 서열에 맵핑된 결과 파일로서, SAM 파일(sequence alignment/map format file)의 바이너리(이진법) 버전으로, 데이터 분석의 두 번째 단계에서 얻어지는 결과일 수 있다.
본 발명은 태아 및 산모의 세포유리 DNA 분자를 포함하는 DNA 샘플에서 염색체 이수성을 검출하는 방법으로서, 상기 DNA 샘플의 염기서열 분석 결과에서 세포유리 DNA 서열리드(read)를 수득하는 단계; 상기 세포유리 DNA 서열리드(read)를 참조 염색체와 맵핑(mapping)시켜서 DNA 서열리드를 구별하는 단계; 상기 구별된 DNA 서열리드의 절편크기(fragment size)를 분석하여 기준치 이하 크기에 해당하는 DNA 서열리드의 수를 계산하여 태아유래 DNA 비율이 증가된 DNA 서열리드 수를 얻는 단계; 상기 얻은 태아유래 DNA 비율이 증가된 DNA 서열리드 수에서 이수성 가능성이 있는 염색체의 DNA 서열리드 수를 분석하여 이수성 가능성이 있는 염색체의 태아유래 DNA 비율이 증가된 DNA 서열리드 수를 결정하는 단계; 상기 구별된 DNA 서열리드의 절편크기를 분석하여 기준치 초과 크기에 해당하는 DNA 서열리드의 수를 계산하여 산모유래 DNA 비율이 증가된 DNA 서열리드 수를 얻는 단계;상기 얻은 산모유래 DNA 비율이 증가된 DNA 서열리드 수에서 상기 이수성 가능성이 있는 염색체와 동일한 염색체의 DNA 서열리드 수를 분석하여 이수성 가능성이 있는 염색체의 산모유래 DNA 비율이 증가된 DNA 서열리드 수를 결정하는 단계; 상기 이수성 가능성이 있는 염색체의 태아유래 DNA 비율이 증가된 DNA 서열리드 수 및 이수성 가능성이 있는 염색체의 산모유래 DNA 비율이 증가된 DNA 서열리드 수의 상대적 비율로부터 파라미터를 결정하는 단계; 및 상기 파라미터를 하나 이상의 컷오프 값(cutoff value)과 비교하여 태아의 염색체 이수성 여부를 결정하는 단계;를 포함하는 태아의 염색체 이수성 검출방법을 제공한다.
본 발명의 태아의 염색체 이수성 검출방법은 태아 및 산모의 세포유리(cell free) DNA 분자를 포함하는 DNA 샘플에서 염색체 이수성을 검출하는 방법으로서, 예시적으로 도 1에 나타난 프로세스 흐름도에 따라 수행될 수 있다.
일 구현예에서, 상기 DNA 샘플은 혈액, 혈장, 혈청, 소변, 타액, 점막 분비물, 객담, 대변, 눈물, 및 이들의 조합으로 이루어진 군에서 선택되는 1종에서 유래된 것일 수 있다.구체적으로, 염색체 이수성을 산전 진단하기 위해 태아를 임신한 산모로부터 혈액 등의 검체를 얻고, 이로부터 DNA 추출 등 방법으로 DNA 샘플을 얻을 수 있으며, 검체로부터 DNA 분자를 얻는 방법은 당해 기술 분야에서 통상적으로 사용되는 DNA 추출 방법이라면 모두 사용 가능하다.
본 발명의 검출방법은 상기 DNA 샘플의 염기서열 분석 결과에서 세포유리 DNA 서열리드(read)를 수득하는 단계를 포함한다. 이 때, 분석 전 데이터의 품질을 향상시키기 위하여 당해 기술 분야에서 통상적으로 사용되는 퀄리티 콘트롤(quality control) 과정을 수행할 수 있다.
본 발명의 검출방법은 상기 세포유리 DNA 서열리드(read)를 참조 염색체와 맵핑(mapping)시켜서 DNA 서열리드를 구별하는 단계를 포함한다. 상기 단계에서 맵핑은 세포유리 DNA 서열리드와 인간 정상 염색체 전체를 상호비교하여 세포유리 DNA 서열리드가 인간 정상 염색체에서 어떤 염색체에 해당하는지 분석하여 개별 세포유리 DNA 서열리드를 구별할 수 있게 하는 것을 의미할 수 있다. 상기 단계에서 사용되는 참조 염색체는 인간 정상 염색체 전체를 의미할 수 있으며, 바람직하게는 인간 게놈 유전체인 hg19 또는 hg38일 수 있다.
본 발명의 검출방법은 상기 구별된 DNA 서열리드의 절편크기(fragment size)를 분석하여 기준치 이하 크기에 해당하는 DNA 서열리드의 수를 계산하여 태아유래 DNA 비율이 증가된 DNA 서열리드 수를 얻는 단계를 포함한다. 상기 기준치는 분석되는 염색체에 따라 상이할 수 있으며, 태아유래 DNA 비율이 증가되는 정도가 잘 반영될 수 있도록 최적화될 수 있다. 바람직하게는 상기 기준치 이하 크기에 해당하는 DNA 서열리드의 수는 DNA 서열리드의 절편크기 30 bp 이상 158 bp 미만인 DNA 서열리드의 개수일 수 있으며, 더욱 바람직하게는 DNA 서열리드의 절편크기 50 bp 이상 158 bp 미만인 DNA 서열리드의 개수일 수 있다.
본 발명의 검출방법은 상기 얻은 태아유래 DNA 비율이 증가된 DNA 서열리드 수에서 이수성 가능성이 있는 염색체의 DNA 서열리드 수를 분석하여 이수성 가능성이 있는 염색체의 태아유래 DNA 비율이 증가된 DNA 서열리드 수를 결정하는 단계를 포함한다.
일 구현예에서, 상기 단계에서는 정량비교를 위하여 상기 태아유래 DNA 비율이 증가된 DNA 서열리드 수를 평준화시킬 수 있다. 평준화 방법은 GC 함량에 의한 보정, 맵핑성(mappability, 맵핑 가능성)에 의한 보정, 총 리드(total read)에 의한 양적 보정, 분위수(Quantile) 평준화 등 당해 기술 분야에서 통상적으로 사용되는 평준화 방법이라면 제한없이 사용될 수 있다. 또한, 평준화 방법 수행시 대상 서열리드에 따라 적절하게 변형하여 수행할 수 있다. 또한, 상기 평준화 이후에 맵핑성(mappability, 맵핑 가능성) 값을 이용하여 보정할 수 있으며, 이는 평준화 단계에서 사용된 각 bin에 대해 리드가 맵핑되는 위치(position) 비율로 나타낸 값을 의미한다.
본 발명의 검출방법은 상기 구별된 DNA 서열리드의 절편크기를 분석하여 기준치 초과 크기에 해당하는 DNA 서열리드의 수를 계산하여 산모유래 DNA 비율이 증가된 DNA 서열리드 수를 얻는 단계를 포함한다. 상기 기준치는 분석되는 염색체에 따라 상이할 수 있으며, 산모유래 DNA 비율이 증가되는 정도가 잘 반영될 수 있도록 최적화될 수 있다. 바람직하게는 상기 기준치 초과 크기에 해당하는 DNA 서열리드의 수는 DNA 서열리드의 절편크기 158 bp 이상 600 bp 미만인 DNA 서열리드의 개수일 수 있으며, 더욱 바람직하게는 DNA 서열리드의 절편크기 158 bp 이상 500 bp 미만인 DNA 서열리드의 개수일 수 있다.
본 발명의 검출방법은 상기 얻은 산모유래 DNA 비율이 증가된 DNA 서열리드 수에서 상기 이수성 가능성이 있는 염색체와 동일한 염색체의 DNA 서열리드 수를 분석하여 이수성 가능성이 있는 염색체의 산모유래 DNA 비율이 증가된 DNA 서열리드 수를 결정하는 단계를 포함한다.
일 구현예에서, 상기 단계에서는 정량비교를 위하여 상기 산모유래 DNA 비율이 증가된 DNA 서열리드 수는 정량비교를 위하여 평준화시킬 수 있다. 평준화 방법 및 맵핑성 보정 방법은 상기에서 설명한 바와 같다.
본 발명의 검출방법은 상기 이수성 가능성이 있는 염색체의 태아유래 DNA 비율이 증가된 DNA 서열리드 수 및 이수성 가능성이 있는 염색체의 산모유래 DNA 비율이 증가된 DNA 서열리드 수의 상대적 비율로부터 파라미터를 결정하는 단계를 포함한다. 이 때, 상기 상대적 비율은 상기 이수성 가능성이 있는 염색체의 태아유래 DNA 비율이 증가된 DNA 서열리드 수 및 이수성 가능성이 있는 염색체의 산모유래 DNA 비율이 증가된 DNA 서열리드 수의 2개 수치를 포함하는 다양한 연산에 의해 계산될 수 있으며, 정상 염색체와 이수성 가능성이 있는 염색체의 차이점을 통계적으로 비교할 수 있는 방법이면 제한 없이 사용할 수 있다.
바람직하게는, 상기 이수성 가능성이 있는 염색체의 태아유래 DNA 비율이 증가된 DNA 서열리드 수 및 이수성 가능성이 있는 염색체의 산모유래 DNA 비율이 증가된 DNA 서열리드 수의 상대적 비율로부터 파라미터를 결정하는 단계에 있어서, 상기 상대적 비율은 하기 계산식 1 또는 계산식 2에 의해 계산될 수 있다.
<계산식 1>
Figure 112020139595682-pat00001
(
Figure 112020139595682-pat00002
)
<계산식 2>
Figure 112020139595682-pat00003
또한, 상기 파라미터는 하기 계산식 3에 의해 계산될 수 있다.
<계산식 3>
Figure 112020139595682-pat00004
여기서, 상기 정상 참조집단은 상기 이수성 가능성이 있는 염색체에 대하여 정상 염색체를 갖는 것으로 알려진 개체의 집단을 의미한다.
이 때, 상기 파라미터가 컷오프 값보다 큰 경우에 태아의 염색체 이수성이 존재하는 것으로 결정할 수 있다. 일 구현예에 있어서, 태아의 염색체 이수성이 정상 염색체에 비하여 낮은 수의 배수체인 경우에는 상기 파라미터가 음의 값을 가질 수 있고, 그 절대값이 컷오프 값보다 큰 경우에 태아의 염색체 이수성이 존재하는 것으로 결정할 수 있다.
일 구현예에 있어서, 상기 파라미터는 하기 계산식 5[중간값(median)을 이용한 변형 z-스코어(modified z-score)], 계산식 6[삼배수체(trisomy)를 가정했을 때의 평균값 대비 염색체 리드(read) 증가 분율], 계산식 7[삼배수체(trisomy)를 가정했을 때의 중간값 대비 염색체 리드(read) 증가 분율]과 같이 다양한 형태로 계산될 수 있다.
<계산식 5>
Figure 112020139595682-pat00005
<계산식 6>
Figure 112020139595682-pat00006
<계산식 7>
Figure 112020139595682-pat00007
일 구현예에서, 상기 이수성 가능성이 있는 태아유래 DNA 비율이 증가된 DNA 서열리드 수 및 상기 이수성 가능성이 있는 산모유래 DNA 비율이 증가된 서열리드 수의 상대적 비율로부터 파라미터를 결정하는 단계는 단일의 파라미터 또는 다수의 파라미터를 사용할 수 있다.
본 발명의 검출방법은 상기 파라미터를 하나 이상의 컷오프 값(cutoff value)과 비교하여 태아의 염색체 이수성 여부를 결정하는 단계를 포함한다.
일 구현예에서, 태아의 이수성을 검출하기 위한 대조군으로 정상 여아를 임신하고 있는 것으로 이미 결과를 알려진 산모 샘플을 참조집단 데이터로 하여 통계적으로 활용할 수 있다. 이 때, 라이브러리 제작 및 시퀀싱 편향(bias)에 따라 분석하고자 하는 대상 샘플과 참조집단 데이터간의 편차가 존재할 수 있고, 이를 줄이기 위한 방법을 사용할 수 있다. 사용 가능한 방법은 당해 기술 분야에서 통상적으로 사용되는 편차 감소 방법이라면 모두 사용 가능하나, 바람직하게는 다차원 척도법(Multi-demensional scaling, MDS)을 사용할 수 있으며, 더욱 바람직하게는 시퀀싱 환경이 비슷한 샘플을 유클리드 거리(Euclidean distance, ED)를 이용한 다차원 척도법을 수행하여 선택할 수 있다. 구체적으로, 이수성 판정에 활용되지 않는 나머지 영역을 일정 구간으로 나누어(예를 들어, 3M 단위) 각 구간(window) 별로 상기 서술된 평준화 방법으로 보정된 리드 수를 바탕으로 이에 해당하는 n차원의 벡터 값을 얻을 수 있으며, 이 과정에서 얻어지는 타염색체의 리드 수는 참조 데이터 구성에만 사용될 뿐, 실제 이수성 판정에는 사용하지 않는다.
Figure 112020139595682-pat00008
두 샘플 p,q 간의 유클리드 거리(Euclidean Distance)는 하기 계산식 4에 의해 계산되며,
<계산식 4>
Figure 112020139595682-pat00009
분석 샘플에 대해 참조집단으로 사용될 수 있는 모든 데이터간 유클리드 거리를 계산한 후, 테스트 샘플과 유클리드 거리가 가장 짧은 순으로 원하는 수(예를 들어, 참조집단으로 사용 가능한 전체의 50% 만큼의 샘플)의 참조집단 데이터를 구성할 수 있다. 참조집단 선택 수는 임의적이며, 단 100% 모두 선택하게 된다면, 모집단과 동일해지므로 샘플 수가 너무 적어지지 않는 선에서 수를 줄여 가장 가까운 순으로 선택할 수 있다.
염색체 이수성 판정 기준값을 계산하기 위해, 위의 참조집단 선택(reference selection) 방법을 통해 선택된 정상 여아 임신 산모의 데이터들로부터 파라미터 도출에 필요한 상대적 비율값을 계산하고 그 평균과 표준편차 값을 계산한다. 계산된 값을 기준으로 분석하고자 하는 샘플의 각 비율 증가된 리드의 상대적 비율(Enriched Ratio) 값으로 z-테스트(z-test)를 수행하고 z-스코어(z-score) 값에 따른 판단 기준치를 설정하여 염색체 이수성 여부를 검출한다. 상기 판단 기준치는 분석 대상 염색체에 따라 가장 적합한 수치로 조정될 수 있다.
본 발명의 다른 측면에 따라, 태아의 염색체 이수성을 검출하기 위한 연산을 행할 수 있도록 컴퓨팅 시스템을 제어하기 위한 복수의 명령이 암호화된 컴퓨터 판독 가능한 매체를 포함하는 컴퓨터 시스템으로서, 상기 연산은 태아 및 산모의 세포유리 DNA 분자를 포함하는 DNA 샘플의 염기서열 분석 결과에서 세포유리 DNA 서열리드(read) 데이터를 수득하는 단계; 상기 세포유리 DNA 서열리드 데이터를 참조 염색체 데이터와 맵핑(mapping)시켜서 DNA 서열리드를 구별하는 단계; 태아유래 DNA 비율이 증가된 DNA 서열리드를 분석하기 위해 상기 구별된 DNA 서열리드의 절편크기(fragment size)를 분석하여 기준치 이하 크기에 해당하는 DNA 서열리드의 수를 수득함으로써 태아유래 DNA 비율이 증가된 DNA 서열리드 수를 도출하는 단계; 상기 도출한 태아유래 DNA 비율이 증가된 DNA 서열리드 수에서 이수성 가능성이 있는 염색체의 DNA 서열리드 수를 분석하여 이수성 가능성이 있는 염색체의 태아유래 DNA 비율이 증가된 DNA 서열리드 수를 결정하는 단계; 산모유래의 DNA 비율이 증가된 DNA 서열리드를 분석하기 위해 상기 구별된 DNA 서열리드의 절편크기를 분석하여 기준치 초과 크기에 해당하는 DNA 서열리드의 수를 수득함으로써 산모유래 DNA 비율이 증가된 DNA 서열리드 수를 도출하는 단계; 상기 도출한 산모유래 DNA 비율이 증가된 DNA 서열리드 수에서 상기 태아유래 DNA 비율이 증가된 DNA 서열리드로부터 수가 결정되는 태아에서 이수성 가능성이 있는 염색체와 동일한 염색체의 DNA 서열리드 수를 분석하여 이수성 가능성이 있는 염색체의 산모유래 DNA 비율이 증가된 DNA 서열리드 수를 결정하는 단계; 상기 이수성 가능성이 있는 염색체의 태아유래 DNA 비율이 증가된 DNA 서열리드 수 및 상기 이수성 가능성이 있는 염색체의 산모유래 DNA 비율이 증가된 서열리드 수의 상대적 비율로부터 파라미터를 결정하는 단계; 및 상기 파라미터를 하나 이상의 컷오프 값(cutoff value)과 비교하여 태아의 염색체 이수성이 존재하는 것으로 결정하는 단계;를 포함하는 것인 컴퓨터 시스템을 제공한다.
이하, 본 발명을 실시예를 통하여 더욱 상세히 설명한다. 그러나, 하기 실시예는 본 발명을 예시하기 위한 것으로, 본 발명의 범위가 이에 제한되는 것은 아니다.
<실시예>
1. 분석 및 검출 방법
(1) DNA 리드(read)의 정렬(alignment)
페어드-엔드(paired-end) 시퀀싱된 리드들은 분석 전 데이터의 품질을 향상시키는 퀄리티 콘트롤(quality control) 과정으로서 sickle 1.2 version을 사용하여 평균 윈도우(window) 리드 퀄리티(quality) 20을 기준으로 3' 리드 트리밍(trimming)을 진행하였다. 트리밍 완료된 리드를 인간 게놈 참조(human genome reference) 염색체 19번(hg19)에 bwa(Burrows-Wheeler Aligner) 0.6.2 version을 사용하여 정렬(align)을 수행하였다. samtools 1.2 version으로 맵핑 품질(mapping quality) 20 미만의 배열부분(alignment)을 제거하고 picard tools를 사용하여 PCR-중복부분(PCR-duplicates)을 제거한 bam 파일을 이후 분석에 사용하였다(일반적인 NGS 데이터 처리과정에 해당함: mapping 및 bam manipulating).
(2) 리드 크기에 따른 구분 [비율 강화 방법(enrichment method)]
PCR-중복부분을 제거한 bam 파일로부터 임의의 기준 인서트 크기(insert size) 158 bp 미만의 리드만을 모은 태아유래 DNA 비율이 증가된(fetal-enriched) bam 파일과 인서트 크기 158 bp 이상의 리드만을 모은 산모유래 DNA 비율이 증가된(maternal-enriched) bam 파일을 생성하였으며, 이 때 인서트 크기 기준 30 bp 미만 600 bp 이상은 이상치(outlier)로 간주하여 제거하였다.
(3) 리드 수(read count)의 평준화(normalization)
태아유래 DNA 비율이 증가된(fetal-enriched) bam 파일 및 산모유래 DNA 비율이 증가된(maternal-enriched) bam 파일 각각에 대하여 50 kb 단위의 bin 작업된 리드 수(binned read count)를 계산하고, 총 리드 수가 리드 정렬 단계에서 생성된 bam 파일과 같도록 PCR-중복부분 제거된 bam 파일의 총 리드 수를 각 비율 증가된(enriched) bam 파일의 총 리드 수로 나눈 가중치(weight) 값을 곱하여 맞추었다. 이 후 bin의 gc %에 대해 국소 가중 평균 산점도 평활(locally weighted scatterplot smoothing: LOWESS 또는 LOESS) 회귀분석(regression)을 진행하여 GC-평준화된(GC-normalized) 리드 수치를 얻었고 이 때 리드 수 기준 상위 1% 와 하위 1% 의 bin은 이상치(outlier)로 간주하여 LOWESS 회귀분석 모델 생성에 포함시키지 않았다.
GC-평준화 수행 이후 별도로 계산된 맵핑성(mappability, 맵핑 가능성) 값을 역수로 곱하여 맵핑성 보정된 리드 수를 계산하였고, 이 때 사용된 맵핑성 값은 본 실시예 수행시 사용된 파이프라인(pipeline)에 있어서 최적화되어 실제에 가깝게 계산된 값으로서, hg19 참조 서열(reference sequence)을 각 염색체 별로 처음의 위치(position)부터 마지막 위치(position)까지 75 bp 길이, 1 bp 슬라이딩(sliding)으로 생성하여 얻어낸 가상의 FASTQ 데이터를 상기 나열한 실시예와 같은 방법으로 정렬(alignment)시키고 GC-평준화 단계에서 사용된 각 50 kb bin에 대해 리드가 맵핑되는 위치(position) 비율로 나타낸 값이다.
(4) 참조집단의 선택
태아의 이수성을 검출하기 위한 대조군으로 이미 결과를 알고 있는 정상 여아 임신 산모 샘플 참조집단의 데이터를 통계적으로 활용하였다. 이 때 라이브러리 제작 및 시퀀싱 편향(bias)에 따라 테스트하고자 하는 샘플과 참조집단 데이터간의 편차가 존재할 수 있고, 이를 줄이기 위해 시퀀싱 환경이 비슷한 샘플을 유클리드 거리(Euclidean distance, ED)를 사용하여 선택하였다. 즉, 라이브러리 제작이나 시퀀싱에 따라(특히, GC 함량이 영향을 많이 미침) 염색체 구간의 시퀀싱 양이 차이가 날 수 있으며, 이를 보정하기 위하여 평준화(normalization)을 진행함으로써 편차를 보정한다.
이수성 판정에 활용되지 않는 나머지 영역을 일정 구간으로 나누어(예를 들어, 3M 단위) 각 구간(window) 별로 상기 서술된 평준화 방법으로 보정된 리드 수를 바탕으로 이에 해당하는 n차원의 벡터 값을 얻었다. 이 과정에서 얻어지는 타염색체의 리드 수는 참조 데이터 구성에만 사용될 뿐, 실제 이수성 판정에는 사용하지 않는다.
Figure 112020139595682-pat00010
두 샘플 p,q 간의 유클리드 거리는 하기 계산식 4에 의해 계산되며,
<계산식 4>
Figure 112020139595682-pat00011
테스트 샘플에 대해 참조집단으로 사용될 수 있는 모든 데이터간 유클리드 거리를 계산한 후, 테스트 샘플과 유클리드 거리가 가장 짧은 순으로 원하는 수(예를 들어, 참조집단으로 사용 가능한 전체의 50% 만큼의 샘플)의 참조집단 데이터를 구성하였다. 참조집단 선택 수는 임의적이며, 단 100% 모두 선택하게 된다면, 모집단과 동일해지므로 샘플 수가 너무 적어지지 않는 선에서 수를 줄여 가장 가까운 순으로 선택하였다.
전체 참조집단과 유클리드 거리를 이용하여 선택된 참조집단의 샘플간 유사도를 다차원 척도법(Multi-dimensional scaling, MDS)을 이용하여 나타내었다. 이 과정은 클러스터링(clustering) 결과를 확인하기 위한 과정이다.
(5) 태아의 염색체 이수성 검출
태아의 이수성을 검출하기 위해 앞서 설명한 방법으로 평준화된 태아유래 DNA 비율이 증가된(fetal-enriched) 리드 수와 산모유래 DNA 비율이 증가된(maternal-enriched) 리드 수에서 이수성을 판단하고자 하는 염색체의 리드 수만을 취해 그 상대적 비율을 하기 계산식 1 및 계산식 2에 의해 계산하였다.
<계산식 1>
Figure 112020139595682-pat00012
(
Figure 112020139595682-pat00013
)
<계산식 2>
Figure 112020139595682-pat00014
염색체 이수성 판정 기준값을 계산하기 위해, 위의 참조집단 선택(reference selection) 방법을 통해 선택된 정상 여아 임신 산모의 데이터들로부터 하기 계산식 3의 파라미터 값을 계산하고 상위 1% 하위 1% 의 데이터는 제거한 후에 그 평균과 표준편차 값을 구하였다.
<계산식 3>
Figure 112020139595682-pat00015
계산된 값을 기준으로 테스트하고자 하는 샘플의 각 비율 증가된 리드의 상대적 비율(Enriched Ratio) 값으로 z-테스트(z-test)를 수행하고 z-스코어(z-score) 4 이상은 태아로부터 유래된 3배수체(trisomy), z-스코어 -4 이하는 태아로부터 유래된 1배수체(monosomy)로 간주하였고(여아 monosomyX 판단 기준), 그 외에는 태아의 이수성이 없는 것으로 간주하였다.
위 방법을 통해 핵형(karyotype) 확진 검사를 통해 결과를 알고 있는 테스트 샘플 660 개체를 비율 강화 방법(Enrichment method)을 통하여 분석하였고, 동일한 데이터 셋(set)을 사용하여 개수-기반 방법(count-based method)과 크기-기반 방법(size-based method)으로 각각 분석하여 결과를 판정하였다. 여기서, 상기 개수-기반 방법(count-based method)은 최종 파라미터를 계산하기 위한 비율(ratio)을 계산할 때 각 염색체에 맵핑되는 리드의 총합을 평준화(normalization) 등을 거쳐 사용하는 방법이다. 또한, 상기 크기-기반 방법(size-based method)은 최종 파라미터를 계산하기 위한 비율을 계산할 때 각 염색체에 맵핑되는 리드 중에서 특정한 단편 크기fragment size) 구간의 리드 수(read count)만을 수득하여 평준화 등을 거쳐 사용하는 방법이다[Yu et al., 2014. Size-based molecular diagnostics using plasma DNA for noninvasive prenatal testing. Proc Natl Acad Sci 111: 8583-8588].
2. 결과
(1) 참조집단의 선택
유클리드거리를 이용하여 선택된 참조집단은 정상 샘플의 z-스코어 값이 보다 0에 가까움을 확인하였고(도 2a), 테스트 샘플과 가깝게 클러스터링되는 것을 확인하였다(도 2b).
(2) 태아의 염색체 이수성 검출
정상(Normal) 샘플과, 13번 염색체 3배수체(Trisomy13) 샘플(도 3a), 18번 염색체 3배수체(Trisomy18) 샘플(도 3b), 21번 염색체 3배수체(Trisomy21) 샘플(도 3c), X 염색체 1배수체(monosomyX) 및 X 염색체 3배수체(XXX) 샘플(도 3d)에 대하여, 본 발명의 비율 강화 방법(enrichment method)에 의해 계산한 z-스코어를 비교분석한 결과, 정상 염색체 샘플과 염색체 이수성 샘플이 명확히 구분되는 것을 확인하였다.
(3) 다른 방법과의 비교
기존의 개수-기반 방법(count-based method)을 통해 위-양성(False positive)으로 판명되었던 13번 염색체 3배수체(Trisomy13) 1건, 18번 염색체 3배수체(Trisomy18) 1건, 21번 염색체 3배수체(Trisomy21) 1건, X 염색체 1배수체(monosomyX) 2건에 대해 선행 논문[Yu et al., 2014. Size-based molecular diagnostics using plasma DNA for noninvasive prenatal testing. Proc Natl Acad Sci 111: 8583-8588]에서 사용한 크기-기반 방법(size-based method)을 사용하여 계산하면, 마찬가지로 13번 염색체 3배수체(Trisomy13) 1건, 18번 염색체 3배수체(Trisomy18) 1건, 21번 염색체 3배수체(Trisomy21) 2건, X 염색체 1배수체(monosomyX) 2건에 대해 위-양성(False positive) 결과를 얻었으나, 본 발명의 비율 강화 방법(enrichment method)을 사용하여 계산하였을 때에는 6건의 위-양성 건 중 18번 염색체 3배수체(Trisomy18) 1건, 21번 염색체 3배수체(Trisomy21) 1건, X 염색체 1배수체(monosomyX) 2건에 대하여 진-음성(True negative)의 결과를 얻었으며, 13번 염색체 3배수체(Trisomy13) 1건, 21번 염색체 3배수체(Trisomy21) 1건은 동일하게 위-양성(False positive) 결과를 얻었다.
결과적으로, 본 발명의 비율 강화 방법(enrichment method)에 의해서 기존 방법으로는 위-양성(False positive)으로 판명되었던 6개 샘플에 대하여 4개 샘플에서 진-음성(True negative)의 결과를 얻어서, 본 발명의 비율 강화 방법(enrichment method)이 위-양성(False positive) 제거에 있어서 뚜렷이 우수한 것으로 확인되어 염색체 이수성의 정확도를 현저히 개선시킨 것을 알 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 후술하는 청구범위에 의하여 나타내어지며, 청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (13)

  1. 태아 및 산모의 세포유리 DNA 분자를 포함하는 DNA 샘플에서 염색체 이수성을 검출하는 방법으로서,
    상기 DNA 샘플의 염기서열 분석 결과에서 세포유리 DNA 서열리드(read)를 수득하는 단계;
    상기 세포유리 DNA 서열리드(read)를 참조 염색체와 맵핑(mapping)시켜서 DNA 서열리드를 구별하는 단계;
    상기 구별된 DNA 서열리드의 절편크기(fragment size)를 분석하여 기준치 이하 크기에 해당하는 DNA 서열리드의 수를 계산하여 태아유래 DNA 비율이 증가된 DNA 서열리드 수를 얻는 단계;
    상기 얻은 태아유래 DNA 비율이 증가된 DNA 서열리드 수에서 이수성 가능성이 있는 염색체의 DNA 서열리드 수를 분석하여 이수성 가능성이 있는 염색체의 태아유래 DNA 비율이 증가된 DNA 서열리드 수를 결정하는 단계;
    상기 구별된 DNA 서열리드의 절편크기를 분석하여 기준치 초과 크기에 해당하는 DNA 서열리드의 수를 계산하여 산모유래 DNA 비율이 증가된 DNA 서열리드 수를 얻는 단계;
    상기 얻은 산모유래 DNA 비율이 증가된 DNA 서열리드 수에서 상기 이수성 가능성이 있는 염색체와 동일한 염색체의 DNA 서열리드 수를 분석하여 이수성 가능성이 있는 염색체의 산모유래 DNA 비율이 증가된 DNA 서열리드 수를 결정하는 단계;
    상기 이수성 가능성이 있는 염색체의 태아유래 DNA 비율이 증가된 DNA 서열리드 수 및 이수성 가능성이 있는 염색체의 산모유래 DNA 비율이 증가된 DNA 서열리드 수의 상대적 비율로부터 파라미터를 결정하는 단계; 및
    상기 파라미터를 하나 이상의 컷오프 값(cutoff value)과 비교하여 태아의 염색체 이수성 여부를 결정하는 단계;
    를 포함하고,
    상기 상대적 비율이 하기 계산식 1 또는 2에 의해 계산되는 것을 특징으로 하는 태아의 염색체 이수성 검출방법:
    <계산식 1>
    Figure 112023006214158-pat00034

    <계산식 2>
    Figure 112023006214158-pat00035
    .
  2. 제1항에 있어서, 상기 DNA 샘플이 혈액, 혈장, 혈청, 소변, 타액, 점막 분비물, 객담, 대변, 눈물, 및 이들의 조합으로 이루어진 군에서 선택되는 1종에서 유래된 것을 특징으로 하는 태아의 염색체 이수성 검출방법.
  3. 제1항에 있어서,
    상기 기준치 이하 크기에 해당하는 DNA 서열리드의 수가 DNA 서열리드의 절편크기 30 bp 이상 158 bp 미만인 DNA 서열리드의 개수이고,
    상기 기준치 초과 크기에 해당하는 DNA 서열리드의 수가 DNA 서열리드의 절편크기 158 bp 이상 600 bp 미만인 DNA 서열리드의 개수인 것을 특징으로 하는 태아의 염색체 이수성 검출방법.
  4. 제1항에 있어서,
    상기 기준치 이하 크기에 해당하는 DNA 서열리드의 수가 DNA 서열리드의 절편크기 50 bp 이상 158 bp 미만인 DNA 서열리드의 개수이고,
    상기 기준치 초과 크기에 해당하는 DNA 서열리드의 수가 DNA 서열리드의 절편크기 158 bp 이상 500 bp 미만인 DNA 서열리드의 개수인 것을 특징으로 하는 태아의 염색체 이수성 검출방법.
  5. 제1항에 있어서, 상기 이수성 가능성이 있는 염색체의 태아유래 DNA 비율이 증가된 DNA 서열리드 수를 결정하는 단계에서, 상기 태아유래 DNA 비율이 증가된 DNA 서열리드 수를 평준화시키는 것을 특징으로 하는 태아의 염색체 이수성 검출방법.
  6. 제1항에 있어서, 상기 이수성 가능성이 있는 염색체의 산모유래 DNA 비율이 증가된 DNA 서열리드 수를 결정하는 단계에서, 상기 산모유래 DNA 비율이 증가된 DNA 서열리드 수를 평준화시키는 것을 특징으로 하는 태아의 염색체 이수성 검출방법.
  7. 삭제
  8. 삭제
  9. 제1항에 있어서, 상기 이수성 가능성이 있는 염색체의 태아유래 DNA 비율이 증가된 DNA 서열리드 수 및 이수성 가능성이 있는 염색체의 산모유래 DNA 비율이 증가된 DNA 서열리드 수의 상대적 비율로부터 파라미터를 결정하는 단계에 있어서, 상기 파라미터가 하기 계산식 3에 의해 계산되는 것을 특징으로 하는 태아의 염색체 이수성 검출방법:
    <계산식 3>
    Figure 112020139595682-pat00018

    여기서, 상기 정상 참조집단은 상기 이수성 가능성이 있는 염색체에 대하여 정상 염색체를 갖는 것으로 알려진 개체의 집단을 의미한다.
  10. 제9항에 있어서, 상기 정상 참조집단이 다차원 척도법(Multi-demensional scaling, MDS)에 의하여 선택되는 것을 특징으로 하는 태아의 염색체 이수성 검출방법.
  11. 제9항에 있어서, 상기 정상 참조집단이 유클리드 거리를 이용한 다차원 척도법에 의하여 선택되는 것을 특징으로 하는 태아의 염색체 이수성 검출방법.
  12. 제1항에 있어서, 상기 이수성 가능성이 있는 태아유래 DNA 비율이 증가된 DNA 서열리드 수 및 상기 이수성 가능성이 있는 산모유래 DNA 비율이 증가된 서열리드 수의 상대적 비율로부터 파라미터를 결정하는 단계가 단일의 파라미터를 사용하는 것을 특징으로 하는 태아의 염색체 이수성 검출방법.
  13. 태아의 염색체 이수성을 검출하기 위한 연산을 행할 수 있도록 컴퓨팅 시스템을 제어하기 위한 복수의 명령이 암호화된 컴퓨터 판독 가능한 매체를 포함하는 컴퓨터 시스템으로서, 상기 연산은
    태아 및 산모의 세포유리 DNA 분자를 포함하는 DNA 샘플의 염기서열 분석 결과에서 세포유리 DNA 서열리드(read) 데이터를 수득하는 단계;
    상기 세포유리 DNA 서열리드 데이터를 참조 염색체 데이터와 맵핑(mapping)시켜서 DNA 서열리드를 구별하는 단계;
    태아유래 DNA 비율이 증가된 DNA 서열리드를 분석하기 위해 상기 구별된 DNA 서열리드의 절편크기(fragment size)를 분석하여 기준치 이하 크기에 해당하는 DNA 서열리드의 수를 수득함으로써 태아유래 DNA 비율이 증가된 DNA 서열리드 수를 도출하는 단계;
    상기 도출한 태아유래 DNA 비율이 증가된 DNA 서열리드 수에서 이수성 가능성이 있는 염색체의 DNA 서열리드 수를 분석하여 이수성 가능성이 있는 염색체의 태아유래 DNA 비율이 증가된 DNA 서열리드 수를 결정하는 단계;
    산모유래의 DNA 비율이 증가된 DNA 서열리드를 분석하기 위해 상기 구별된 DNA 서열리드의 절편크기를 분석하여 기준치 초과 크기에 해당하는 DNA 서열리드의 수를 수득함으로써 산모유래 DNA 비율이 증가된 DNA 서열리드 수를 도출하는 단계;
    상기 도출한 산모유래 DNA 비율이 증가된 DNA 서열리드 수에서 상기 태아유래 DNA 비율이 증가된 DNA 서열리드로부터 수가 결정되는 태아에서 이수성 가능성이 있는 염색체와 동일한 염색체의 DNA 서열리드 수를 분석하여 이수성 가능성이 있는 염색체의 산모유래 DNA 비율이 증가된 DNA 서열리드 수를 결정하는 단계;
    상기 이수성 가능성이 있는 염색체의 태아유래 DNA 비율이 증가된 DNA 서열리드 수 및 상기 이수성 가능성이 있는 염색체의 산모유래 DNA 비율이 증가된 서열리드 수의 상대적 비율로부터 파라미터를 결정하는 단계; 및
    상기 파라미터를 하나 이상의 컷오프 값(cutoff value)과 비교하여 태아의 염색체 이수성이 존재하는 것으로 결정하는 단계;
    를 포함하고,
    상기 상대적 비율이 하기 계산식 1 또는 2에 의해 계산되는 것을 특징으로 하는 컴퓨터 시스템:
    <계산식 1>
    Figure 112023006214158-pat00036

    <계산식 2>
    Figure 112023006214158-pat00037
    .
KR1020200180848A 2019-12-23 2020-12-22 태아의 염색체 이수성 검출방법 KR102532991B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020190173189 2019-12-23
KR20190173189 2019-12-23

Publications (2)

Publication Number Publication Date
KR20210082098A KR20210082098A (ko) 2021-07-02
KR102532991B1 true KR102532991B1 (ko) 2023-05-18

Family

ID=76897312

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200180848A KR102532991B1 (ko) 2019-12-23 2020-12-22 태아의 염색체 이수성 검출방법

Country Status (1)

Country Link
KR (1) KR102532991B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101618032B1 (ko) * 2015-03-04 2016-05-04 주식회사 랩 지노믹스 비침습적 태아 염색체 이상 검출방법
JP5926795B2 (ja) * 2011-05-31 2016-05-25 ベリー ジェノミクス カンパニー リミテッドBerry Genomics Co., Ltd. 胎芽又は腫瘍染色体のコピー数を検出するシステム及び装置
KR101678962B1 (ko) * 2015-08-21 2016-12-06 이승재 대규모 병렬형 게놈서열분석 방법을 이용한 비침습적 산전검사 장치 및 방법
WO2018178700A1 (en) * 2017-03-31 2018-10-04 Premaitha Limited Method of detecting a fetal chromosomal abnormality

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5926795B2 (ja) * 1975-05-19 1984-06-30 松下電器産業株式会社 極数変換式電動圧縮機の制御装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5926795B2 (ja) * 2011-05-31 2016-05-25 ベリー ジェノミクス カンパニー リミテッドBerry Genomics Co., Ltd. 胎芽又は腫瘍染色体のコピー数を検出するシステム及び装置
KR101618032B1 (ko) * 2015-03-04 2016-05-04 주식회사 랩 지노믹스 비침습적 태아 염색체 이상 검출방법
KR101678962B1 (ko) * 2015-08-21 2016-12-06 이승재 대규모 병렬형 게놈서열분석 방법을 이용한 비침습적 산전검사 장치 및 방법
WO2018178700A1 (en) * 2017-03-31 2018-10-04 Premaitha Limited Method of detecting a fetal chromosomal abnormality

Also Published As

Publication number Publication date
KR20210082098A (ko) 2021-07-02

Similar Documents

Publication Publication Date Title
US11783915B2 (en) Convolutional neural network systems and methods for data classification
JP6971845B2 (ja) 遺伝子の変動の非侵襲的評価のための方法および処理
CA3076159C (en) Analyzing tumor dna in a cell-free sample
Fiorentino et al. The importance of determining the limit of detection of non‐invasive prenatal testing methods
CN107949845B (zh) 能够在多个下一代测序平台上区分胎儿性别和胎儿性染色体异常的计算机系统
US11581062B2 (en) Systems and methods for classifying patients with respect to multiple cancer classes
US20200372296A1 (en) Systems and methods for determining whether a subject has a cancer condition using transfer learning
TWI767888B (zh) 藉由母體血漿dna之淺深度測序以準確定量胎兒dna含量
KR101678962B1 (ko) 대규모 병렬형 게놈서열분석 방법을 이용한 비침습적 산전검사 장치 및 방법
Junhui et al. Evaluation of the Z‐score accuracy of noninvasive prenatal testing for fetal trisomies 13, 18 and 21 at a single center
Budis et al. Combining count-and length-based z-scores leads to improved predictions in non-invasive prenatal testing
EP4086356A1 (en) Methods for determining chromosome aneuploidy and constructing classification model, and device
CN109461473B (zh) 胎儿游离dna浓度获取方法和装置
KR102532991B1 (ko) 태아의 염색체 이수성 검출방법
WO2019213810A1 (zh) 检测染色体非整倍性的方法、装置及系统
TW202300656A (zh) 基因組序列上之拷貝數變異之候選斷點之機械性檢測
KR101618032B1 (ko) 비침습적 태아 염색체 이상 검출방법
US20240043935A1 (en) Epigenetics analysis of cell-free dna
KR102519739B1 (ko) 2단계 Z-score에 기반한 비침습적 산전 검사 방법 및 장치
WO2023010242A1 (zh) 估计无创产前基因检测数据中胎儿核酸浓度的方法和系统
US20230053405A1 (en) Neural network for variant calling
WO2023102786A1 (zh) 基因标志物在预测孕妇早产风险中的应用
CN109686401B (zh) 一种识别异源低频基因组信号唯一性的方法及其应用
CN113889189A (zh) 以生父和母亲dna评估胎儿dna浓度的方法及应用
WO2023031641A1 (en) Methods and devices for non-invasive prenatal testing

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right