KR102199322B1 - 모체 혈장으로부터의 비침습적 산전 분자 핵형분석 - Google Patents

모체 혈장으로부터의 비침습적 산전 분자 핵형분석 Download PDF

Info

Publication number
KR102199322B1
KR102199322B1 KR1020197031373A KR20197031373A KR102199322B1 KR 102199322 B1 KR102199322 B1 KR 102199322B1 KR 1020197031373 A KR1020197031373 A KR 1020197031373A KR 20197031373 A KR20197031373 A KR 20197031373A KR 102199322 B1 KR102199322 B1 KR 102199322B1
Authority
KR
South Korea
Prior art keywords
genomic
density
dna
genomic region
fetal
Prior art date
Application number
KR1020197031373A
Other languages
English (en)
Other versions
KR20190122909A (ko
Inventor
와이 쿤 로사 치우
육 밍 데니스 로
콴 치 찬
페이용 지앙
치욱 인 잔디 유
Original Assignee
더 차이니즈 유니버시티 오브 홍콩
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 차이니즈 유니버시티 오브 홍콩 filed Critical 더 차이니즈 유니버시티 오브 홍콩
Publication of KR20190122909A publication Critical patent/KR20190122909A/ko
Application granted granted Critical
Publication of KR102199322B1 publication Critical patent/KR102199322B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

태아의 게놈에서 미세증폭 또는 미세결실을 검출하기 위한 방법, 시스템 및 장치가 본 명세서에 개시되어 있다. 몇몇 실시형태에서, 상기 방법은 생물학적 샘플에서 복수의 DNA 단편의 각각에 대해 서열 태그를 수취하는 단계; 서열 태그에 대해서 게놈 위치를 결정하는 단계; 복수의 게놈 구역의 각각에서 DNA의 밀도가 비정상적으로 높거나 낮은지를 결정하는 단계; 비정상적으로 높은 밀도를 갖는 연속 게놈 구역 세트를 미세증폭으로서 확인하는 단계; 및 비정상적으로 낮은 밀도를 갖는 연속 게놈 구역 세트를 미세결실로서 확인하는 단계를 포함한다. 생물학적 샘플은 태아를 임신한 암컷 대상체로부터 비침습적으로 얻은 혈액 샘플일 수 있다.

Description

모체 혈장으로부터의 비침습적 산전 분자 핵형분석{NONINVASIVE PRENATAL MOLECULAR KARYOTYPING FROM MATERNAL PLASMA}
관련 출원에 대한 상호 참조
본 출원은 미국 가출원 제61/751,213호(발명의 명칭: "Noninvasive Prenatal Molecular Karyotyping from Maternal Plasma", 출원일: 2013년 1월 10일) 및 미국 특허 출원 제13/837,776호(발명의 명칭: "Noninvasive Prenatal Molecular Karyotyping from Maternal Plasma", 출원일: 2013년 3월 15일)에 대한 우선권을 주장한다. 각각의 우선권 출원은 모든 목적을 위해 그 전문이 참조로 본 명세서에 포함된다.
본 출원은 공동 소유의 미국 특허 출원 제12/178,181호(발명의 명칭: "Diagnosing Fetal Chromosomal Aneuploidy Using Massively Parallel Genomic Sequencing", 발명자: Lo 등, 출원일: 2008년 7월 23일)(이의 개시내용은 그 전문이 참조로 포함됨)에 관한 것이다.
모체 혈장에서의 태아 DNA의 존재는 비침습적 산전 시험을 위한 흥미로운 가능성을 열었다[1, 2]. 최근에, 산전 시험 목적을 위해 순환하는 태아 DNA를 분석하기 위한 대량 동시 서열분석(massively parallel sequencing: MPS)의 사용에 많은 관심이 있다. 따라서, 21번, 13번, 18번 태아 3염색체 및 선택된 성 염색체 이수성은 모체 혈장 DNA에서 MPS를 사용하여 검출되었고[3 내지 7], 임상 서비스로 빠르게 도입되었다.
전체 염색체를 포함하는 카피수 변화로 인한 비정상과 별도로, 모체 혈장의 MPS 기반 분석이 하위염색체 결실 또는 중복을 검출하기에 충분히 민감한지를 평가하는 것이 중요할 것이다. 이외 관련하여, 피터스(Peters) 등은 임신 35주에 얻은 모체 혈장 샘플에서 12번 염색체에서의 4.2Mb 결실의 검출을 보고하였다[8]. 얀센(Jensen) 등은 임신 19주 및 20주에 2명의 임신한 여성으로부터 얻은 모체 혈장 샘플에서 22번 염색체에서의 3Mb 결실의 검출을 보고하였다[9]. 결실된 구역과 별도로, 피터스 등은 또한 12번 염색체에서의 다른 구역 및 14번 염색체에서의 20개의 중첩하지 않는 4Mb 구역에서 통계 분석을 수행하였다[8]. 얀센 등은 다른 한편 22번 염색체에서의 결실된 구역에 대한 이들의 통계 분석에 오직 집중하였다[9]. 따라서, 피터스 등 및 얀센 등이 제시한 데이터로부터, 이 접근법이 미세결실 또는 미세중복의 게놈 방식 연구, 또는 실제로 태아 핵형의 비침습적 결정에 충분히 강건한지가 명확하지 않다.
로 등은 태아 단일 뉴클레오타이드 핵형(single nucleotide polymorphism: SNP)이 모체 혈장 DNA 서열분석을 이용하여 게놈 방식 스케일로 유전자형분석될 수 있다고 보고하였다[10]. 특히, 이들 조사자들은 엄마로부터 태아로 유전된 단일 유전자 장애에 대한 SNP 대립유전자 및 돌연변이가 상대 단상형 용량 분석이라 불리는 과정에 의해 설명될 수 있다고 입증하였다[10]. 팬(Fan) 등은 상대 단상형 용량 분석의 강건함을 확인하였고 엄마로부터 태아로 유전된 약 2.85Mb의 결실을 검출하기 위해 이 접근법을 이용하였다[11]. 비침습적 산전 핵형분석의 임상 실행을 위해 이 방법을 이용하는 데 2가지 관심이 있다. 첫째로, 이 방법은 모체 단상형 분석이 수행될 것을 요하고, 이는 추가의 분석 단계[12,13] 또는 혈통 분석을 요할 수 있다. 둘째로, 이 방법이 신생 하위염색체 결실 또는 중복을 검출하기 위해 사용될 수 있는지 명확하지 않다.
태아의 게놈에서 미세증폭(microamplification) 또는 미세결실(microdeletion)을 검출하기 위한 방법, 시스템 및 장치가 본 명세서에 개시되어 있다. 몇몇 실시형태에서, 상기 방법은 생물학적 샘플에서 복수의 DNA 단편의 각각에 대해 서열 태그를 수취하는 단계; 서열 태그에 대해서 게놈 위치를 결정하는 단계; 복수의 게놈 구역의 각각에서 DNA의 밀도가 비정상적으로 높거나 낮은지를 결정하는 단계; 비정상적으로 높은 밀도를 갖는 연속 게놈 구역 세트를 미세증폭으로서 확인하는 단계; 및 비정상적으로 낮은 밀도를 갖는 연속 게놈 구역 세트를 미세결실로서 확인하는 단계를 포함한다. 생물학적 샘플은 태아를 임신한 암컷 대상체로부터 비침습적으로 얻은 혈액 샘플일 수 있다.
도 1은 태아의 게놈에서 미세증폭 또는 미세결실을 확인하는 방법을 나타내는 흐름도이다.
도 2는 모체 혈장에서 게놈에 걸친 검출된 카피수 비정상의 서코스(Circos) 도면이다. 내부로부터 외부로 사례 01 내지 06이다. 염색체 이디오그램(ideograms)(최외각 고리)은 시계 방향으로 pter 내지 qter 배향된다. 각각의 막대는 1Mb 창을 나타낸다. 혈장에서 증가하거나 감소한 표시의 3개 이상의 연속 1Mb 빈(bin)을 갖는 구역이 각각 녹색 막대 및 적색 막대로 표시된다. 적색 화살표는 이 비정상 구역에서의 근사 염색체 위치를 강조한다.
도 3 및 도 4는 모체 혈장에서 검출된 카피수 비정상을 나타낸다. 각각의 사례에 대해 카피수 비정상을 나타내는 염색체(들)가 도시되어 있다. 게놈 위치는 x축에 도시되어 있고, z 스코어는 y축에 도시되어 있다. 각각의 수직 막대는 1Mb 빈을 나타낸다. 혈장에서 증가하거나 감소한 표시의 3개 이상의 연속 1Mb 빈을 갖는 구역이 각각 녹색 막대 및 적색 막대로 표시된다.
도 5는 모체 혈장에서의 염색체 Y 서열의 비율 및 미세결실/미세중복에 의해 영향받은 구역의 게놈 표시의 변경으로 예상된 태아 DNA 백분율을 나타내는 표이다. (a) Y 염색체 접근법은 수컷 태아의 사례의 경우에만 적용 가능하다. (b) 사례 05의 경우, 엄마가 또한 비정상을 보유하면서, 모체 혈장에서의 영향받은 구역의 게놈 표시는 태아 DNA 백분율을 결정하기 위해 사용될 수 없었다. (c) 이전의 도면 및 이후의 도면은 각각 3번 염색체에서의 미세중복 및 4번 염색체에서의 미세결실로부터 예상된 태아 DNA 백분율을 나타낸다.
도 6은 3Mb 미세결실/미세중복의 검출에 대한 진단학적 감도를 나타낸다. 비정상을 검출하기 위한 진단학적 감도는 태아 DNA 백분율에 대해 도시되어 있다. 전체 15000만개의 혈장 DNA 분자가 분석된다는 것을 가정하여 컴퓨터 시뮬레이션 분석을 수행하였다.
도 7은 태아 DNA 백분율이 5%라는 것을 가정하여 상이한 진단학적 해상도 및 진단학적 감도를 성취하도록 서열분석되고 정렬되는 데 필요한 분자의 수를 나타내는 표이다. 이 이론적 분석에서, 진단학적 특이성은 동일한 방향에서의 기준품의 평균으로부터 3SD 초과(과표시 또는 저표시의 경우)의 게놈 표시를 갖는 3개의 연속 빈의 기준에 기초한 모든 사례의 경우 99.9% 초과이다.
도 8은 실시예에 기재된 샘플에 대한 정보를 나타낸 표이다.
도 9는 본 발명의 실시형태에 따른 시스템 및 방법으로 이용 가능한 예시적인 컴퓨터 시스템(900)의 블록 다이어그램을 나타낸다.
본 발명의 실시형태는 태아 게놈에서 미세증폭 또는 미세결실이 존재하는지를 결정하기 위한 방법, 시스템 및 장치를 제공한다. 간단히 말하면, 이 결정은 생물학적 샘플을 얻는 단계 및 복수의 게놈 구역의 각각으로부터 생긴 샘플에서 게놈 DNA의 양을 정량화하는 단계에 의해 수행될 수 있다. 각각의 게놈 구역에 대한 양은 그 구역에 대한 밀도(즉, 각각의 밀도)를 얻도록 적절하게 정규화되고, 기준 밀도와 비교될 수 있다. 각각의 밀도와 기준 밀도 사이의 통계학적 유의차는 게놈 구역 내의 또는 다수의 게놈 구역에 걸친 미세증폭 또는 미세결실의 존재를 나타낼 수 있다. 거짓 양성을 피하기 위해, 미세증폭 또는 미세결실은 이러한 통계학적 유의차가 적어도 2개의 연속 게놈 구역의 각각에 존재할 때 확인된다.
I. 도입
유전자 또는 염색체의 구역의 카피수의 차이를 검출하기 위한 실시형태를 이용할 수 있다. 미세증폭(또한 미세중복이라 칭함)으로부터 생긴 비정상적으로 높은 카피수의 유전자는 이 유전자의 과발현 또는 병리학적 발현을 발생시켜, 암과 같은 질환을 야기할 수 있다. 반대로, 미세결실로부터 생긴 낮은 카피수의 유전자는 생물학적(예를 들어, 효소) 기능의 손실 또는 발현 감소를 발생시킬 수 있다. 따라서, 비정상 카피수의 검출은 출산 전에 또는 후에 직면할 수 있는 태아의 질환의 조기 경고를 제공할 수 있다.
생물학적 샘플은 태아를 임신한 암컷 대상체로부터 비침습적으로 얻을 수 있다. 샘플은 혈액, 혈장, 혈청, 소변 또는 타액을 포함할 수 있다. 혈액은 무세포 DNA 단편(cell-free DNA fragment)을 함유하고, 임신한 대상체에서 이 단편의 일부는 태아 기원이다. DNA 단편은 서열 태그를 얻기 위해 예컨대 대량 동시 서열분석 기법을 이용하여 서열분석될 수 있다. 합성에 의한 서열분석(sequencing-by-synthesis) 플랫폼(예를 들어, 일루미나(Illumina)/솔렉사(Solexa)), 결찰에 의한 서열분석(sequencing-by-ligation) 플랫폼(예를 들어, 라이프 테크놀로지 솔리드(Life Technology SOLiD) 플랫폼), 또는 단일 분자 서열분석 플랫폼(예를 들어, 헬리코스(Helicos) 또는 퍼시픽 바이오사이언시스(Pacific Biosciences))을 포함하는 임의의 대량 동시 서열분석 플랫폼을 사용할 수 있다. 각각의 서열 태그는 이것이 생성된 DNA 단편의 서열의 전부 또는 일부를 함유하고, 단편에 대한 기원의 게놈 구역을 결정하기 위해 기준 게놈 서열과 정렬될 수 있다.
'빈(bin)'이라고도 칭하는 게놈 구역은 기준 게놈 서열을 분할함으로써 기술될 수 있다. 이 구역은 염색체의 연속 서열 부분에 상응한다. 바람직한 실시형태에서, 각각의 구역은 하나의 염색체와 관련되고, 다수의 염색체에 걸치지 않는다. 몇몇 실시형태에서, 이 구역은 1Mb와 같은 동일한 크기를 갖는다. 게놈 구역의 크기는 본 명세서에 개시된 방법의 해상도, 및 통계학적 확실성으로 미세증폭 및 미세결실을 확인하는 데 필요한 DNA 단편의 수를 결정한다.
II. 방법
도 1은 태아를 임신한 암컷 대상체로부터 얻은 생물학적 샘플을 분석함으로써 태아의 게놈에서 미세증폭 또는 미세결실을 확인하는 방법(100)의 흐름도이고, 생물학적 샘플은 태아 및 암컷 대상체로부터의 무세포 DNA를 포함한다.
단계(110)에서, 생물학적 샘플 내의 복수의 DNA 단편의 각각에 대해서 하나 이상의 서열 태그가 수취된다. 서열 태그는 생거(Sanger) 서열분석 또는 대량 동시 서열분석과 같은 당해 분야에 공지된 임의의 방법을 이용하여 DNA 단편을 서열분석함으로써 얻어질 수 있다. 각각의 태그는 서열분석 '리드(read)'라 칭해질 수 있고, 이것이 생성된 DNA 단편의 부분의 전부에 상응할 수 있다. 예를 들어, 태그는 단편의 일 말단 또는 단편의 내부의 서열을 함유할 수 있다.
DNA 단편은 생물학적 샘플로부터 단리되고 임의의 공지된 방법을 이용하여 서열분석을 위해 제조될 수 있다. 예를 들어, 단편은 예컨대 중합효소 사슬 반응(PCR)을 이용하여 서열분석 전에 카피될 수 있거나, 사용되는 서열분석 기법에 적절한 어댑터 분자 또는 '바코드' 서열에 결찰될 수 있다. 단편은 일루미나 서열분석 및 유사한 기술에서 그런 것처럼 브리지 증폭을 위한 클론 클러스터를 생성하기 위해 또한 사용될 수 있다. 서열분석을 위해 제조된 DNA 단편의 세트는 '서열분석 라이브러리'라 칭해질 수 있다.
몇몇 실시형태에서, 서열 태그는 쌍 지은 말단 서열분석에 따라 생성되고, 여기서 DNA 단편의 카피가 반대 말단으로부터 2의 방향으로 서열분석된다. 2의 방향으로부터의 서열분석 데이터의 비교는 특히 단편의 말단에서 단편의 서열의 검증을 허용한다. 쌍 지은 말단 서열분석으로부터 얻은 서열 태그의 원수(raw number)는 샘플에서 DNA 단편의 수의 추정치를 제공한다. 이 수는 샘플의 크기 및 성질에 따라 100만, 1000만, 10000만, 10억 내지 100억 사이에 변할 수 있다. 몇몇 실시형태에서, 다수의 서열 태그가 동일한 서열(예를 들어, 말단 둘 다에서 동일한 서열)을 나타낼 때, 중복 태그가 추가의 분석으로부터 폐기되거나 배제될 수 있다.
단계(120)에서, 서열 태그에 대해서 게놈 위치가 결정된다. 이를 처음에 당해 분야에 공지된 표준 방법을 이용하여 각각의 서열 태그를 기준 서열, 예컨대 비반복 마스킹된 인간 기준 게놈(NCBI Build 36.1/hg18)과 정렬함으로써 수행한다. 몇몇 실시형태에서, 말단 둘 다가 동일한 염색체에 정렬된 태그만이 추가의 분석을 위해 유지된다. 예를 들어, 기준 서열 사이의 너무 많은 불일치가 존재하는 경우, 또는 태그가 소정의 크기 범위 내에 있지 않은 경우 태그는 또한 폐기될 수 있다. 이의 서열에 기초하여, 각각의 태그는 이후 상기 기재된 바대로 기준 서열 내에 게놈 구역 또는 '빈'으로 정렬된다.
단계(130)에서, 복수의 게놈 구역의 각각에 대해, 게놈 구역 내의 DNA 단편의 각각의 양은 게놈 구역 내에 게놈 위치를 갖는 서열 태그로부터 결정된다. 게놈 구역에 대한 DNA 단편의 각각의 양은, 이 구역으로 배정된 서열 태그에 함유된, 데이터의 전체 또는 이의 일부로부터 계산될 수 있는 매개변수이다. 이 데이터는 예를 들어 태그의 수 및 길이, 및 이들 사이의 중첩의 양을 포함한다. 매개변수의 양은 서열 태그를 생성하기 위해 이용된 기법의 지식으로 계산되고, 이 기법의 가상실제(artifact), 예컨대 동일한 DNA 단편으로부터 생길 수 있는 다수의 태그의 존재를 설명한다. 게놈 구역 내의 각각의 양은 예를 들어 샘플에 존재하는 것으로 추론되고 게놈 구역으로부터 생긴 단편의 수, 또는 게놈 구역으로부터의 DNA의 전체 질량일 수 있다. 바람직한 실시형태에서, 게놈 구역 내의 DNA 단편의 각각의 양은 샘플에서의 이 구역으로부터의 DNA의 양의 정량적 측정치이다.
단계(140)에서, 복수의 게놈 구역의 각각에 대해, 각각의 양은 각각의 밀도를 얻도록 정규화된다. 정규화는 많은 방식으로, 예를 들어 게놈 구역에 대한 각각의 양을 게놈 구역이 생긴 염색체에 대한 각각의 양의 합 또는 전체 게놈의 각각의 양의 합으로 나눠 수행될 수 있다. 각각의 밀도인 정규화의 출력은 상이한 게놈 구역, 예를 들어 상이한 염색체 또는 샘플로부터의 각각의 양이 비교되도록 허용한다. 각각의 밀도는 많은 상이한 해석, 예컨대 게놈 구역으로부터 생긴 샘플에서의 DNA 단편의 수의 분획을 가질 수 있다. 몇몇 실시형태에서, 각각의 양이 직접 비교될 수 있을 때, 정규화가 필요하지 않고, 각각의 밀도는 각각의 양과 동일할 수 있다.
단계(150)에서, 복수의 게놈 구역의 각각에 대해, 각각의 밀도가 기준 밀도와 통계학적으로 상이한지를 확인하기 위해 각각의 밀도는 기준 밀도와 비교된다. 게놈 구역에 대한 기준 밀도는 샘플로부터의 데이터의 일부 또는 전부를 이용하여 얻어질 수 있다. 기준 밀도, 예를 들어 염색체 또는 전체 게놈에 대한 각각의 밀도의 평균은 동일할 수 있다. 기준 밀도는 다른 샘플로부터의 데이터를 이용하여 또한 계산될 수 있다. 예를 들어, 샘플은 각각 태아를 임신한 복수의 암컷 대상체로부터 얻어질 수 있고, 단계(110-140)는 동일한 방식으로 각각의 샘플에서 수행될 수 있다. 특정한 게놈 구역에 대한 기준 밀도는 따라서 샘플의 전부 또는 샘플의 하위세트로부터의 이 구역에 대한 각각의 밀도의 평균이다. 몇몇 실시형태에서, 독립 데이터는 암컷 대상체의 하위세트가 각각 게놈 미세증폭 또는 미세결실이 결여된 태아를 임신하였다는 것을 나타내도록 존재할 수 있고, 따라서 기준 밀도는 미세증폭 또는 미세결실의 부재를 반영하도록 계산될 수 있다.
상기의 관점에서, 기준 밀도는 (이것이 어떻게 계산되는지에 따라) 다수의 또는 모든 게놈 구역에 대해 동일하거나, 각각의 게놈 구역에 대해 상이한 값일 수 있다.
각각의 밀도가 기준 밀도와 통계학적으로 상이한지(즉, 차이가 통계학적으로 유의적인지)를 확인하는 것은 기준 밀도를 계산하기 위해 사용된 각각의 밀도의 분포의 지식을 요할 수 있다. 예를 들어, 하나의 게놈 구역에 대한 기준 밀도가 각각의 밀도의 세트의 평균인 경우, 표준 편차는 이 세트에 대해 계산될 수 있다. (예를 들어, 관심 있는 샘플의 경우) 이 게놈 구역에 대한 하나의 각각의 밀도, 기준 밀도 및 표준 편차를 이용하여, 통계 시험을 수행할 수 있다. 이러한 통계 시험은 Z 시험 또는 스튜던트 t 시험일 수 있고, 각각의 밀도가 기준 값과 동일한 분포로부터 도출될 확률을 제공할 수 있다. 이 확률이 임계치(threshold)보다 낮을 때, 각각의 밀도와 기준 밀도 사이의 차이는 통계학적으로 유의적인 것으로 생각될 수 있다. 대안적으로, 이 차이가 컷오프(cutoff), 예컨대 소정의 여러 표준 편차를 초과하는 경우, 차이는 통계학적으로 유의적인 것으로 생각될 수 있다.
바람직하게는, 각각의 밀도 및 기준 밀도의 비교, 및 이들 사이의 통계 차이의 확인은 모든 게놈 구역에 대한 동일한 기준을 이용하여 이루어진다. 게놈 구역에 통계 차이가 존재하는 경우에, 각각의 밀도가 기준 밀도보다 높거나 낮은지에 유의하도록 이 단계에서 주의를 기울여야 한다.
평균 및 표준 편차 이외에, 기준 밀도를 결정하고 각각의 밀도와 기준 밀도가 다른지를 결정하기 위해 각각의 밀도의 세트에 대해 다른 매개변수를 계산할 수 있다. 제한 없이, 이 매개변수는 중앙값, 모드, 백분위, 변량, 왜곡, 첨도(kurtosis) 및 기타를 포함한다. Z 시험 및 t 시험 이외에, 이 목적을 위해 입력으로서 외래 매개변수를 이용한 시험과 같은 다른 통계 시험을 이용할 수 있다.
단계(160)에서, 기준 밀도와 통계학적으로 상이한 각각의 밀도를 갖는 것으로 확인된 임의의 게놈 구역이 이렇게 확인된 다른 게놈 구역과 연속하는지를 결정한다. 실행자의 관심에 일치하는 바대로, 염색체의 일부, 전체 염색체, 다수의 염색체 또는 전체 게놈과 관련하여 이 결정을 만들 수 있다. 여기서, 게놈 구역이 기준 게놈 서열의 연속 부분에 상응하는 경우 이것은 연속적이다. 바람직한 실시형태에서, 게놈 구역이 동일한 염색체에 상응하는 경우 이것은 오직 연속적일 수 있다. 주로 연속 게놈 구역의 세트가 여기서 중요하고, 각각의 밀도는 각각의 구역에 대한 기준 밀도와 통계학적으로 상이하고, 모든 차이는 동일한 방향에 있다. 즉, 이러한 세트 내에, 각각의 밀도는 모두 기준 밀도보다 높거나(즉, 통계학적으로 높음), 모두 낮다(즉, 통계학적으로 낮음). 이러한 게놈 구역의 세트의 예는 3개의 연속 구역일 것이고, 여기서 모든 3개의 구역의 경우, 기준 밀도는 통계학적으로 상이하고 기준 밀도보다 높다(즉, 통계학적으로 높음). 각각의 밀도가 기준 밀도보다 통계학적으로 높거나 낮은 연속 게놈 구역은 각각 미세증폭 또는 미세결실과 일치한다. 세트에서 더 많은 수의 연속 게놈 구역은 더 많은 미세증폭 또는 미세결실과 일치한다.
단계(170)에서, 제1 연속 게놈 구역은 기준 밀도보다 통계학적으로 높은 각각의 밀도를 갖는 것으로 확인된 적어도 N개의 제1 게놈 구역이 연속일 때 미세증폭(N은 2 이상의 정수임)으로서 확인된다.
단계(180)에서, 제2 게놈 구역은 기준 밀도보다 통계학적으로 낮은 각각의 밀도를 갖는 것으로 확인된 적어도 N개의 제2 게놈 구역이 연속일 때 미세결실로서 확인된다.
III. 비정상 구역의 결정
본 발명을 이용하여 게놈 미세증폭 및 미세결실을 검출하기 위해, 기준 게놈 서열은 게놈 구역 또는 '빈'으로 분할된다. 샘플로부터의 DNA의 단편은 서열에 따라 각각의 구역과 관련되고, 각각의 구역에서의 DNA의 밀도가 결정된다. 대단히 높거나 낮은 밀도를 갖는 구역은 '비정상'으로 생각되고, 미세증폭 또는 미세결실에 상응할 수 있다. 비정상 게놈 구역을 확인하고, 이것이 미세증폭 또는 미세결실에 상응하는지를 결정하기 위한 기준 및 절차는 하기 기재되어 있다.
A. 빈 및 양
본 명세서에서 사용된 게놈 구역의 크기는 실행자가 원하는 바대로 및 사용된 서열분석 방법에 적절한 바대로 다양한 크기를 가질 수 있다. 더 작은 구역이 비정상 밀도의 더 높은 해상도를 허용하지만, 통계학적 확실성으로 비정상 밀도를 확인하기 위해 더 많은 수의 DNA 단편(따라서 더 큰 샘플)을 요한다. 반대로, 더 큰 구역은 더 빈약한 해상도를 제공하지만, 더 적은 수의 DNA 단편을 요한다. 바람직한 실시형태에서, 염색체 및 게놈에 걸친 밀도의 비교 및 정규화를 허용하도록 동일한 크기의 게놈 구역을 사용한다. 게놈 구역은 예를 들어 100kb, 200kb, 500kb, 1Mb, 2Mb, 5Mb 또는 10Mb의 차수의 크기를 가질 수 있다. 몇몇 실시형태에서, 게놈 구역은 (하기 기재된 바대로) 비중첩이고/이거나 인접하지만, 몇몇 경우에 예를 들어 구역의 에지 근처에 발생하는 서열 태그의 분석을 단순화하기 위해 구역 사이에 중첩 또는 갭이 존재할 수 있다.
DNA 단편은 당해 분야에 공지된 대량 동시 서열분석 기법을 이용하여 서열분석될 수 있다. 몇몇 실시형태에서, 일루미나의 합성에 의한 서열분석을 이용하여 서열분석을 실행한다. 이 방법은 서열분석되는 DNA 단편의 GC 함량에 따라 비일치하는 효율로 서열 태그를 생성하는 것으로 공지되어 있다. 따라서, 이 서열분석 가상실제을 설명하기 위해, 수백 내지 수천 개의 염기쌍의 범위의 스케일의 가변적인 수준의 GC 함량을 갖는, 게놈 구역에 대해 결정된 DNA의 각각의 양을 수정하는 것이 바람직할 수 있다. 1Mb 게놈 구역을 사용할 때, 각각의 염색체는 처음에 100kb 빈으로 분할될 수 있고, 국소 가중 산점도 평활도(locally weighted scatterplot smoothing: LOESS)는 서열 태그의 수에서 GC 관련 빈을 수정하기 위해 실행될 수 있다[20]. 100kb 빈은 이후 1Mb 게놈 구역으로 통합될 수 있어서, GC 수정된 밀도는 모든 후속 계산에 사용될 수 있다.
일 실시형태에서, 게놈 구역에서의 DNA의 밀도(예를 들어, 1Mb 빈)는 게놈 표시(GRx-y)로 계산될 수 있고, 여기서 x 및 y는 구역의 시작 및 말단 게놈 좌표를 나타낸다. 각각의 구역으로부터 생긴 서열 리드(또는 태그)의 수는 RCx-y이고, GRx-y는 이 식을 이용하여 계산된다[20]:
Figure 112019108543173-pat00001
여기서, RC총합은 전체 리드 수이다.
RC총합으로 나누는 것은 각각의 밀도를 얻기 위해 게놈 구역 내의 DNA의 각각의 양을 정규화하는 일례이다. 방법의 다른 실행에서, 비율이 결정되지 않고, RCx-y의 값은 게놈 구역 사이에 정확히 비교된다. RC총합이 샘플에 걸쳐 동일하게 제어될 때 이를 수행할 수 있다.
B. 기준품과의 비교
상기 기재된 바대로, 게놈 구역에서의 각각의 밀도는 기준 밀도와 비교될 수 있다. 기준 밀도는 상이한 방식으로, 예를 들어 다수의 게놈 구역에 걸쳐 각각의 밀도를 평균하여, 또는 다수의 샘플로부터 얻은 동일한 게놈 구역에 대한 각각의 밀도를 평균하여 얻어질 수 있다. 게놈 구역에서의 각각의 밀도가 비정상인지를 결정하기 위해, 매개변수는 각각의 밀도 및 기준 밀도를 이용하여 계산되고, 매개변수는 이후 컷오프와 비교된다. 매개변수의 예는 2개의 값 사이의 차이, 차이의 절대 값, 또는 비율을 포함한다. 매개변수를 얻고 컷오프와의 의미 있는 비교를 허용하기 위해 이 값은 적절한 바대로, 예를 들어 스칼라(scalar)를 곱하여 조작될 수 있다.
C. 컷오프
몇몇 실시형태에서, 각각의 밀도 및 기준 밀도로부터 계산된 매개변수가 컷오프를 초과하는지는 각각의 밀도가 비정상(통계학적으로 상이)한지를 나타낼 수 있다. 매개변수의 사인은 각각의 밀도가 비정상으로 높거나 낮은지(각각 미세증폭 또는 미세결실을 제시하는(그러나 결정적은 아님))를 나타낼 수 있다. 예를 들어, 매개변수가 각각의 밀도와 기준 밀도 사이의 단순한 차이인 경우, 비정상으로 높고 낮은 각각의 밀도는 각각 매개변수의 양성 사인 및 음성 사인에 해당한다. 따라서, 컷오프는 양성 또는 음성일 수 있고, 매개변수가 컷오프를 초과하기 위해 이것이 양의 컷오프를 초과하거나 음의 컷오프보다 낮다는 것을 의미하는 것으로 이해될 수 있다. 유사하게, 매개변수가 비율일 때, 이것이 소정의 값보다 크거나 이 값의 역수보다 낮은 경우 컷오프를 초과할 수 있다. 컷오프는 실행자에 의해 원하는 임의의 방식으로 선택될 수 있다. 예를 들어, 이는 임의일 수 있거나, 비정상 밀도의 결정이 원하는 수준의 통계학적 확실성으로 이루어진다는 것을 보장하도록 선택될 수 있다.
일 실시형태에서, 매개변수는 z 시험에서 컷오프와 비교된다. z 시험은 통계 시험이고 z 스코어를 생성하고, 이 스코어는 분포의 폭의 면에서 분포의 평균으로부터 수가 얼마나 먼지의 측정치이다. 여기서, 각각의 밀도 및 기준 밀도를 비교하기 위해 사용된 매개변수는 기준 밀도를 계산하기 위해 사용된 값의 표준 편차로 나눈 이 밀도 사이의 차이이다.
입증의 방식으로, 생물학적 샘플은 정상 태아 핵형을 갖는 8명의 임신(개체) 암컷 대상체로부터 얻어지고, 각각의 밀도는 각각의 샘플을 사용하여 개별적인 1Mb 게놈 구역에 대해 계산된다. 소정의 게놈 구역 x-y의 경우, 샘플로부터의 각각의 밀도는 기준 밀도 평균GRx-y-기준 및 각각의 밀도의 표준 편차를 얻기 위해 평균이 되고(즉, 평균이 계산됨), SDx-y-기준이 계산된다. 시험 샘플은 이후 관심 있는 또 다른 암컷 대상체로부터 얻어지고, 구역 x-y에 대한 각각의 밀도(GRx-y-시험)는 시험 샘플로부터 데이터를 사용하여 계산된다. z 스코어GRx-y인 이 각각의 밀도에 대한 z 스코어는 하기와 같이 계산된다:
Figure 112019108543173-pat00002
z 스코어는 이후 컷오프(예를 들어, 3)와 비교된다. +3 초과 또는 -3 미만의 z 스코어는 시험 샘플로부터의 각각의 밀도가 각각 비정상적으로 높거나 낮다는 것을 나타낸다. 상이한 염색체 사이의 체계적인 샘플간 변화를 최소화하기 위해, 각각의 염색체에 대해 중앙값 보정을 수행한다. 따라서, 특정한 염색체에 상응하는 모든 게놈 구역의 중앙 게놈 표시는 기준선으로서 사용된다. 이 특정한 염색체에 존재하는 모든 구역의 경우, 이 기준선 값으로부터의 차이는 z 스코어의 계산에 사용된다.
게놈 구역에서의 비정상 밀도의 z 스코어, 또는 임의의 다른 측정치는 샘플에서의 태아 DNA의 풍부도에 민감할 수 있다. 당해 분야에 공지된 바대로, 임신한 여성의 혈액 샘플에서의 무세포 DNA의 상당한 백분율은 태아 기원이다. 이 백분율은 임신 시기 및 다른 인자에 따라 1% 미만 내지 20% 초과의 범위인 것으로 관찰되었다. 본 명세서에 기재된 방법에서, 서열 태그는 샘플에서 모체 및 태아 DNA 둘 다로부터 생성된다. 미세증폭 또는 미세결실이 엄마가 아니라 태아의 게놈에 존재하는 경우, 서열 태그를 생성하고 밀도를 결정하기 위해 사용된 소수의 DNA가 태아이므로 상응하는 게놈 구역(들)에서의 비교적 적은 비정상이 DNA의 밀도에서 관찰된다. 반대로, 미세증폭 또는 미세결실이 모체 기원(즉, 모계 유전)인 경우, 이것은 태아 및 엄마 둘 다의 게놈에 존재하고, 이에 따라 실질적으로 샘플에서의 DNA의 모두에 존재한다. 따라서, DNA의 밀도의 더 높은 비정상이 관찰될 것이다. (미세증폭 또는 미세결실은 태아 게놈이 아니라 모체 게놈에 존재하지 않을 것이다).
따라서, 제2 컷오프는 게놈 구역에서의 DNA의 각각의 밀도의 비정상이 모계 유전되는지를 결정하기 위해 이용될 수 있다. 제2 컷오프는 전형적으로 태아 게놈에서의 비정상을 확인하기 위해 이용된 컷오프보다 크고, 기준 밀도로부터의 각각의 밀도의 더 높거나 더 많은 통계학적으로 유의적인 이탈을 요한다. 각각의 밀도 및 기준 밀도가 z 시험을 이용하여 비교될 때, 예를 들어, 모계 유전된 비정상을 확인하기 위한 컷오프로서 작용하는 z 스코어는 모체 게놈으로부터 부재한 비정상을 확인하기 위해 이용된 수회일 수 있다. 몇몇 실시형태에서, 제2 컷오프는 10, 20 이상의 z 스코어에 상응한다.
DNA의 밀도의 더 높은 비정상, 예컨대 모계 유전된 미세증폭 또는 미세결실로부터 생긴 것은 더 낮은 비정상보다 동일한 수준의 확실성으로 확인하기 위해 더 적은 DNA 및 더 작은 서열 태그를 요한다. 따라서, 태아 게놈 비정상을 검출하기 위해 본 명세서에 개시된 방법의 감도는 하기 기재된 바대로 샘플에서의 태아 DNA의 백분율(태아(%))에 따라 달라진다. 비정상 게놈 구역에서의 서열 태그의 저표시 또는 과표시의 정도는 이 구역에 대한 태아 DNA 백분율과 선형으로 상관된다[4]. 몇몇 실시형태에서, 태아 DNA 백분율은 하기 식을 이용하여 계산된다:
Figure 112019108543173-pat00003
.
D. 기준 밀도
상기 기재된 바대로, 특정한 게놈 구역에서의 DNA의 각각의 밀도는 각각의 밀도가 비정상인지를 결정하기 위해 기준 밀도와 비교된다. 기준 밀도는 하나의 샘플 또는 다수의 샘플로부터 얻은 데이터를 이용하여 많은 상이한 방식으로 계산될 수 있다. 하나의 샘플의 경우에, 기준 밀도는 예를 들어 게놈 구역의 세트에 대한 각각의 밀도의 평균일 수 있다. 이 세트는 염색체의 일부 또는 전부, 다수의 염색체 또는 전체 게놈에 상응할 수 있다. 다수의 샘플의 경우에, 각각의 샘플은 전형적으로 상이한 개체로부터 획득된다. 게놈 구역에 대한 기준 밀도는 개체에 걸쳐 평균이 된 이 구역 또는 구역의 세트에 대한 각각의 밀도일 수 있다. 몇몇 실시형태에서, 생물학적 샘플은 미세증폭 또는 미세결실의 부재를 반영하는 기준 밀도를 확립하기 위해 공지된 정상 태아 핵형을 갖는 임신한 암컷 대상체로부터 얻어진다. 기준 밀도는 이후 비공지된 태아 핵형을 갖는 시험 대상체에 대한 각각의 밀도와 비교될 수 있다. 몇몇 실시형태에서, 다수의(또는 모든) 개체의 태아 핵형은 비공지되어 있고, 기준 밀도는 이 개체의 샘플에 존재할 수 있는 비정상의 이전의 지식 없이 계산된다.
기준 밀도는 상이한 게놈 구역에 대해 동일하거나 상이할 수 있다. 예를 들어, 동일한 값은 염색체 상에 또는 게놈 내의 모든 게놈 구역에 사용될 수 있다. 대안적으로, 상이한 값은 각각의 게놈 구역에 대한 기준 밀도로 배정될 수 있다. 기준 밀도는 예컨대 각각의 밀도를 평균하여 각각의 밀도로부터 계산될 필요는 없다 - 예를 들어, 이는 게놈 구역의 상대 크기를 단순히 반영할 수 있다. 상기 기재된 바대로, 기준 밀도는 가상실제, 예컨대 상이한 염색체 또는 게놈 구역에 대한 서열 태그의 비균일한 생성에 수정될 수 있다.
E. 거짓 양성의 회피
게놈 구역에 대한 각각의 밀도가 비정상(예를 들어, 기준 밀도보다 통계학적으로 더 높거나 더 낮음)인 것으로 발견된 후, 게놈 구역이 또한 비정상인 적어도 하나의 다른 게놈 구역과 연속인 경우 미세증폭 또는 미세결실이 확인될 수 있다. 상기 기재된 바대로, 이러한 확인이 만들어지기 위해, 각각의 밀도는 연속 구역에 대해 동일한 방향에서 기준 밀도로부터 이탈되어야 한다. 따라서, 미세증폭은 각각의 밀도가 각각의 구역에서 비정상으로 높은 연속 게놈 구역에 상응하고, 미세결실은 각각의 밀도가 비정상으로 낮은 연속 게놈 구역에 상응한다.
각각의 밀도를 게놈 구역에 대한 기준 밀도와 비교하기 위해 사용된 방법에 따라, 사실 미세증폭 또는 미세결실이 존재하지 않을 때 구역이 DNA의 비정상 밀도를 가질 유의적인 가능성이 존재할 수 있다. 따라서, 많은 게놈 구역이 확립되고 이의 각각의 밀도가 평가될 때, 몇몇 구역은 단순히 우연히 비정상으로 생각될 수 있다. 미세증폭 또는 미세결실을 확인하기 위해 연속 비정상 구역을 요하는 것은 거짓 양성, 즉 오류에 있는 이러한 사건을 확인하는 것의 가능성을 감소시킨다. 이 요건은 또한 게놈 구역의 다수(예를 들어, 2개 또는 3개)의 크기에서 방법의 해상도 한계를 설정한다. 미세증폭 또는 미세결실을 확인하기 위해 2개 이상의 연속 구역이 필요한 경우 예를 들어 1Mb 게놈 구역에 대한 해상도 한계는 2Mb이다.
본 명세서에서 확인된 방법을 이용하여 확인된 미세증폭 또는 미세결실은 당해 분야에 공지된 다른 방법을 이용하여 검증될 수 있다. 이러한 다른 방법은 예를 들어 양수검사 및 제대천자를 포함하고, 침습적이거나 유산의 위험을 포함할 수 있다. 다수의 방법을 이용한 비정상 카피수의 검증은 거짓 양성의 가능성을 추가로 감소시킬 수 있다.
본 명세서에서, 2개 이상의 게놈 구역이 염색체를 따라 또는 게놈 기준 서열에서 연속 서열 위치를 점유하는 경우(이들 사이 또는 이들 중에 다른 게놈 구역은 없음) 연속으로 생각된다. 몇몇 실시형태에서, 연속 구역의 쌍은 서열에서 바로 서로 붙어있고, 따라서 인접으로 생각된다. 2개의 구역(예를 들어, 몇몇 염기쌍) 사이의 서열 갭은 구역이 인접하지 못하게 하지만, 갭이 본 명세서에 개시된 방법 하에 다른 게놈 구역으로서 처리되지 않는 경우 이 구역이 인접하게 한다. 몇몇 실시형태에서, 게놈 구역은 중첩하지 않지만, 중첩하는 구역이 대신 사용될 수 있고 연속일 수 있다. 실행자는 데이터 분석을 단순화하기 위해 또는 다른 이유로 게놈의 소정의 구역에 집중하도록 인접하지 않은, 또는 중첩하지 않은 게놈 구역을 확립하기를 원할 수 있다.
IV. 시뮬레이션 분석
미세결실 또는 미세중복의 검출의 감도 및 특이성은 샘플에서의 태아(%), 서열분석되고 정렬된 혈장 DNA 분자의 수, 및 비정상의 크기를 포함하는 상이한 매개변수에 의해 영향을 받을 수 있다. 따라서, 1) 기존의 서열분석 폭으로 미세결실/미세중복(예를 들어, 약 3Mb 크기)을 검출하는 것의 감도; 및 2) 특정한 태아(%)(예를 들어, 5%)에서 특정한 민감도(예를 들어, 95%/99%)를 성취하기 위해 분석하는 데 필요한 분자의 수를 결정하기 위해 컴퓨터 시뮬레이션 분석을 수행할 수 있다.
각각의 시뮬레이션 분석에서, 전체 게놈(3,000Mb)은 3Mb와 같은 원하는 해상도에 따라 동일한 크기의 빈으로 분할될 수 있다. 몇몇 실시형태에서, 하위염색체 비정상의 검출을 위해, 3개의 연속 빈은 동일한 방향에서의 기준 그룹의 평균과 먼 3 초과의 표준 편차(과표시 또는 저표시)의 게놈 표시를 갖는 것이 필요하다. 따라서, 빈 크기는 원하는 진단학적 해상의 1/3일 것이다. 예를 들어, 1Mb의 빈 크기는 3Mb의 비정상을 검출하는 데 필요하다. 미세결실/미세중복이 다루는 3개의 빈이 태아 DNA의 소수의 집단의 기여로부터 생긴 비정상 게놈 표시를 갖는 것으로 추정될 수 있다. 혈장에서, 영향받은 구역 내의 빈에 해당하는 전체 분자(E)의 예상된 비율은 하기로서 계산될 수 있다:
Figure 112019108543173-pat00004
여기서, f는 혈장에서의 태아 DNA 백분율이고,
d는 비정상에서 염색체 수의 변화이며(d는 미세결실의 경우 -1이고 미세중복의 경우 +1임),
T는 전체 게놈의 빈의 전체 수이다.
상기 계산된 바와 같은 예상된 혈장 표시로 혈장 DNA 분자의 이봉 분포를 추정하여, 예를 들어 1,000의 정상 사례 및 1,000의 영향받은 사례의 시뮬레이션을 수행할 수 있다. 태아(%), 빈 크기 및 분석되는 분자의 전체 수는 원하는 목적을 성취하기 위해 변할 수 있다. 시뮬레이션은 R에서 리비놈(rbinom) 함수를 이용하여 수행될 수 있다(www.r-project.org/).
V. 실시예
이 실시예는 인간 태아 및 모체 DNA에서의 미세증폭 및 미세결실을 확인하는 것을 제공한다.
A. 데이터 분석을 위한 프레임워크
일루미나 HiSeq 2000 시퀀서에서 유동 세포의 일 레인을 사용하여 6개의 시험 사례 및 8개의 대조군의 각각의 모체 혈장 샘플을 분석하였다. 각각의 혈장 DNA 샘플로부터 평균 21100만(범위: 17700만 내지 23600만)개의 DNA 단편을 서열분석하였다. 이러한 서열분석은 사례마다 평균 14400만(범위: 9600만 내지 18000만)개의 정렬 가능하고 중복되지 않은 서열분석된 리드를 생성하였고, 이는 반수체 인간 게놈의 4.81배와 동등하다.
혈장 핵형을 얻기 위해, 전체 게놈을 2,687개의 1Mb 빈으로 분할하였다. 시험 샘플의 각각의 1Mb 빈에 대한 게놈 표시를 기준 그룹과 비교하였다. 정상 게놈 표시를 갖는 구역의 경우, 모든 1Mb 빈의 z 스코어의 예상된 분포는 0에 가까울 것이다. 기준 간격은 +3 내지 -3의 z 스코어로 정의된다. 이러한 기준 간격으로, 통계학적으로 대략 0.3%의 빈이 단지 우연히 이 간격의 밖에 있을 것이다. 2,687개의 빈이 분석되면서, 8개의 빈이 단지 우연히 이 기준 간격의 밖에 있을 것이라는 것을 평균적으로 예상할 것이다. 거짓 양성 콜(call)을 감소시키기 위해, 추가의 기준은 따라서 3개의 연속 1Mb 빈이 기준 간격의 밖에서 및 동일한 방향에서 z 스코어를 나타내는 경우에만 카피수 비정상을 말하는 것에 포함된다.
B. 하위염색체 카피수 비정상의 검출
각각의 사례의 경우 전체 게놈에 걸친 모든 1Mb 빈의 z 스코어는 서코스 도면을 이용하여 작도되었다[21](도 2). 시험 샘플에서, 94.9% 내지 98.7%의 1Mb 빈이 정상 표시를 나타냈다. 3개의 연속 빈이 동일한 비정상을 나타내는 경우에만 카피수 비정상이라 불리는 상기 언급된 기준으로, 카피수 비정상은 거짓 양성이 없는 모든 사례에서 정확히 확인되었다.
도 3 및 도 4는 각각의 사례에 대해 카피수 비정상을 나타내는 염색체(들)의 모든 1Mb 빈의 z 스코어를 나타낸다. 사례 01, 02 및 03의 경우, 저표시는 22번 염색체의 q 암에서 3개의 연속 1Mb 빈에서 검출되었다. 신생 22q11.2 미세결실을 갖는 3개의 사례가 있었다. 사례 04 및 05의 경우, 과표시가 22q번 염색체에서 3개의 연속 1Mb 빈에서 검출되었다. 사례 04는 2.4Mb의 신생 22q11.2 미세중복을 갖는 사례이다. 사례 05는 동일한 구역에서 모계 유전된 미세중복을 갖는 사례이다. 사례 05의 경우, 엄마 자체가 미세중복을 보유하므로, 비정상은 모체 혈장에서 쉽게 검출될 수 있었다. 이는 3개의 연속 빈의 경우 극도로 높은 z 스코어 값(범위, 39.7 내지 71.7)에 의해 지지된다. 태아의 비침습적 산전 시험의 추가의 설명은 SNP 기반 방법, 즉 상대 돌연변이 용량 또는 상대 단상형 용량 분석의 이용으로 진행된다[10, 11, 22]. 사례 06의 경우, 5개의 연속 1Mb 빈이 3번 염색체의 q 암에서 과표시로 검출되었고, 31개의 연속 1Mb 빈이 4번 염색체의 q 암에서 저표시로 검출되었고, 이들은 3q에서의 5Mb 중복 및 4q에서의 31Mb 결실에 상응하였다. 모든 사례의 경우, 검출된 카피수 비정상은 어레이 CGH, FISH 및/또는 QF-PCR에 의해 확인된 것에 필적하는 크기를 가졌다. 사례 05의 경우, 엄마가 보유한 미세중복은 어레이 CGH에 의해 확인되었다. 사례 06의 경우, 엄마가 보유한 균형을 이룬 전좌가 완전 핵형분석에 의해 확인되었다.
C. 태아 DNA 백분율
저표시 또는 과표시를 나타내는 구역으로부터의 DNA 서열을 사용하여 모체 혈장에서의 태아(%)를 예측하였다(도 5). 수컷 태아를 수태한 3의 사례(즉, 사례 02, 03 및 04)의 경우 이 방법을 이용하여 그리고 Y 염색체 기반 방법[4]을 이용하여 태아(%)를 비교함으로써 이 접근법은 검증되었다. 태아(%) 값은 2의 방법 사이에 잘 부합하였다(도 5). 태아 신생 카피수 비정상을 갖는 5의 사례의 경우에, 태아(%)는 9.2% 내지 17.8% 범위이었다. 사례 05의 경우에, 미세중복의 게놈 표시로 예상된 태아(%)는 96.7%이어서, 거의 모든 순환하는 DNA가 이 변화를 보유할 것이라는 것을 제시한다. 이 결과는 엄마가 비정상을 보유한다는 사실과 일치한다.
D. 진단학적 감도를 위한 시뮬레이션 분석
컴퓨터 시뮬레이션을 이용하여 샷건(shotgun) MPS 기반 비침습적 산전 분자 핵형분석의 진단학적 감도를 결정하였다(도 6). 약 15000만개의 리드의 기존의 서열분석 깊이로, 3Mb 염색체 비정상을 검출하기 위한 진단학적 감도는 태아(%)가 5%일 때 대략 96%일 것이다. 민감도는 태아(%)가 6%에 도달할 때 99%로 증가할 것이다. 더 적은 크기의 염색체 비정상을 검출하기 위해, 더 많은 혈장 DNA 분자가 분석될 필요가 있을 것이다. 도 7은 3개의 연속 빈 기준을 이용하여 95%/99% 민감도로 3Mb, 2Mb 및 1Mb의 진단학적 해상도를 성취하기 위해 분석될 필요가 있는 혈장 DNA 분자의 수를 나타낸다. 95%의 진단학적 감도를 성취하기 위해, 각각의 빈에서 대략 42,000개의 분자가 분석될 필요가 있을 것이다. 따라서, 95%의 진단학적 감도에 대해 2Mb 및 1Mb 미세결실/미세중복을 검출하기 위해 분석될 필요가 있는 혈장 DNA 분자의 전체 수는 각각 19200만 및 38000만개일 것이다. 99%의 진단학적 감도를 성취하기 위해, 분석될 필요가 있는 분자의 전체 수는 2의 상이한 해상도의 경우 각각 24000만 및 48000만개일 것이다.
E. 논의
이 작업에서, 태아 염색체 미세결실 및 미세중복의 비침습적 산전 검출을 수행하는 것의 실행가능성은 3Mb 해상도에서 게놈 방식 수준에서 입증되었다. 5의 사례에서 3q, 4q 또는 22q 염색체를 포함하는 태아 유래 하위염색체 결실 또는 중복이 관찰되었다. 6번째 사례에서, 관찰된 매우 높은 z 스코어에 의해 입증된 것처럼, 22q 염색체의 모체 유래 미세중복이 검출되었다. 실제로, 사례 04 및 06은 태아 미세중복이 모체 혈장으로부터 비침습적으로 검출된 처음을 나타낸다. 이 결과는 하나 또는 더 적은 수의 게놈 구역에서 주로 카피수 비정상을 시험하는 것에 집중한 피터스 등[8] 및 얀센 등[9]의 이전의 보고와 비교하여 중요한 단계 진전을 나타낸다. 본 명세서에 제시된 데이터는 샷건 MPS가 게놈 방식 스케일에서, 즉 태아 분자 핵형을 얻기 위해 하위염색체 카피수 비정상을 검출하기 위해 사용될 수 있다는 것을 명확히 나타낸다.
연구된 사례의 3개에서, 모체 혈장 샘플은 침습 절차 후에 채취된다. 이 사례에서의 태아 DNA 백분율은 9.2 내지 17.4% 범위이고, 이는 침습 절차 전에 수집된 샘플에 대해 치우(Chiu) 등[4]이 이전에 관찰한 범위 내에 있다. 유사하게, 연구된 샘플의 대부분이 임신 20주 후에 채취되지만, 이 사례의 태아 DNA 백분율은 또한 임신 이전에 채취된 샘플의 것과 매우 중첩된다. 그럼에도 불구하고, 이것은 제1 및 초기 제2 3개월에서 임의의 침습 절차 전에 수집된 샘플을 사용하여 미래 지향적인 대규모 다기관 연구에서 이 결과를 검증하는 데 유용할 것이다.
분석적으로, 진단학적 알고리즘은 몇몇 실시형태에서 하위염색체 카피수 비정상을 검출하기 위한 모두 +3 초과 또는 모두 -3 미만의 z 스코어를 갖는 3개의 연속 빈을 요한다. 이 알고리즘은 대략 3Mb의 연속 스트레치에 걸쳐 검출 가능한 카피수 비정상을 요한다. 실제로, 데이터로 표시된 바대로, 알고리즘은 2.4Mb의 카피수 비정상을 검출할 수 있었다(사례 04 및 05).
이러한 진단학적 해상도에 도달하도록 수행된 서열분석의 깊이는 3염색체성 시험에 필요한 것보다 훨씬 컸다. 따라서, 각각의 경우에, 3염색체성 시험의 적어도 하나의 상업용 공급자에 의해 수행된 동일한 서열분석 플랫폼을 사용한 12-플렉스 샷건 서열분석과 비교하여, 일루미나 HiSeq 2000 시퀀서의 일 레인에서 서열분석을 수행하였다. 서열분석의 현재의 깊이 및 3Mb의 이의 생성된 진단학적 해상도에서, 현재의 프로토콜은 공지된 병원성 카피수 변이체의 대략 20%를 다룰 수 있다[23]. 99% 민감도로 진단학적 해상도를 각각 2Mb 및 1Mb로 연장하기 위해 24000만 및 48000만개의 혈장 DNA 분자가 서열분석되고 정렬될 필요가 있을 것으로 상기에서 예상되었다. 이 진단학적 해상도에서, 모체 혈장 DNA의 샷건 MPS가 공지된 병원성 카피수 변이체의 각각 대략 50% 및 80%를 다룬다고 예상될 것이다[23]. 대량 동시 시퀀서의 출력의 부단한 증가 및 수반되는 서열분석 비용 감소로, 이러한 서열분석 깊이와 관련된 비용은 수년 내에 건강관리 제공자에게 허용 가능한 수준에 도달할 것이다. 이 접근법에 의해 필요한 서열분석의 양은 샘플마다 10억개의 서열분석된 리드를 사용하여 수행된 이전에 보고된 태아 유래 단일 뉴클레오타이드 변이 검출 방법에 걸쳐 이미 상당한 감소이다[10]. 추가의 비용 감소는 모체 혈장으로부터의 태아 유래 단일 뉴클레오타이드 변이 검출에 대해 성취된 것과 유사한 병원성 카피수 변이체를 보유하는 게놈 구역의 표적화된 서열분석으로부터 생길 수 있다[24,25]. 마지막으로, 단일 분자 서열분석의 출현은, 서열분석된 분자의 게놈 표시를 왜곡시키는 증폭 과정이 필요하지 않으므로, 이 접근법의 진단학적 정확성을 추가로 개선하는 것으로 또한 예상될 것이다[26].
요약하면, 모체 혈장 DNA의 샷건 MPS에 의해 비침습적 산전 분자 핵형을 얻는 것이 실행 가능하다는 것이 입증된다. 이 방법은 태아 신생 카피수 변화, 비균형적인 전좌 및 모체 카피수 변화를 검출할 수 있다. 이 결과는 비침습적 산전 진단의 진단학적 스펙트럼을 추가로 확대시켰다. 결론으로, 단일 유전자 장애를 위해 전체 염색체 이수성[3 - 7], 하위염색체 카피수 변화 및 태아 돌연변이[10]의 산전 검출을 위해 모체 혈장 DNA의 MPS 분석에 기초한 방법이 개발되었다. 비침습적 시험의 이 어레이는 처음에 태아 게놈 및 염색체 비정상의 스크리닝에 적용될 수 있었다. 비침습적 모체 혈장 DNA 시험에 의해 밝혀진 비정상은 종래의 침습적 산전 시험에 의해 추가로 확인될 수 있었다. 대규모 전향적 연구에 의한 검증 시, 비침습적 모체 혈장 DNA 서열분석이 태아 게놈 및 염색체 비정상의 대규모 스펙트럼의 산전 평가를 제공하고 더 안전한 산전 평가를 제공할 수 있다는 것이 고안되었다.
F. 재료 및 방법
윤리 성명. 홍콩의 연합 중국 대학교 - 병원국 신 영토 이스트 클러스터 임상 조사 윤리 위원회(Joint Chinese University of Hong Kong - Hospital Authority New Territories East Cluster Clinical Research Ethics Committee)에 의해 연구를 승인받았다. 임신한 여성이 홍콩의 프린스 오브 웨일즈 병원(Prince of Wales Hospital), 강화 병원(Kwong Wah Hospital) 및 찬육 병원(Tsan Yuk Hospital), 및 서울의 아산 병원(Asan Medical Center)으로부터 서면 동의로 지원하였다.
샘플 수집. 사례 01, 02, 및 03의 경우, 모체 말초 혈액 샘플을 침습 절차 후에 EDTA 함유 관으로 수집하였다(표 1). 사례 04, 05 및 06의 경우, 임의의 침습 절차를 수행하기 전에 모체 말초 혈액 샘플을 수집하였다. 임신 12 3/7주 내지 28 4/7주에 모체 혈액 샘플을 채취하였다(도 8).
6개의 시험 샘플 중에서, 태아 신생 22q11.2 미세결실의 3의 사례(사례 01, 02 및 03), 태아 신생 22q11.2 미세중복(2.4Mb)의 하나의 사례(사례 04) 및 모계 유전된 22q11.2 미세중복(2.4Mb)의 하나의 사례(사례 05)가 있었다. 엄마가 t(3;4)(q29;q32)의 균형된 전좌를 갖는 하나의 사례(사례 06)가 또한 있었고, 태아는 3q29 미세중복(5.1Mb) 및 4q32.1-q35.2 결실(32.9Mb)을 갖는 것으로 밝혀졌다. 완전 핵형분석을 수행하고 태아 핵형은 어레이 비교 게놈 하이브리드화(어레이 CGH)[16], 형광 인시츄 하이브리드화(fluorescence in situ hybridization: FISH) 또는 정량적 형광 PCR(QF-PCR)과 FISH의 조합에 의해 추가로 확인되었다.
샘플 처리 및 DNA 추출. 말초 혈액 샘플을 1600 g에서 4℃에서 10분 동안 원심분리하고 혈장 부분을 16000 g에서 4℃에서 10분 동안 다시 원심분리하였다[17]. 무세포 DNA를 상기 기재된 바대로 QIAamp DSP DNA 혈액 미니 키트(Blood Mini Kit)(퀴아젠(Qiagen))로 1.8 내지 8.4㎖의 모체 혈장으로부터 추출하였다[3]. 추출된 혈장 DNA를 상기 기재된 바대로 렙틴(leptin)(LEP) 유전자를 표적화하는 실시간 PCR 검정에 의해 정량화하였다[18].
혈장 DNA 서열분석. 혈장 DNA의 서열분석 라이브러리를 상기 기재된 바대로 쌍 지은 말단 서열분석 샘플 제조 키트(Paired-End Sequencing Sample Preparation Kit)(일루미나)로 준비하였다[19]. 13 내지 20ng의 추출된 혈장 DNA를 라이브러리 제조에 사용하였다. 어댑터 결찰된 혈장 DNA는 12회 PCR에 의해 농후화되었다. TruSeq PE 클러스터 생성 키트 v3(일루미나)가 구비된 cBot 클론 증폭 시스템(일루미나)에서 클러스터 생성을 수행하였다. 50bp×2의 쌍 지은 말단 포맷으로 HiSeq 2000 서열분석 시스템(일루미나)에서 유동 세포의 일 레인에서 각각의 라이브러리(시험 및 기준 샘플 둘 다)를 서열분석하였다.
서열 정렬 및 여과. 쌍 지은 말단 리드를 쇼트 올리고뉴클레오타이드 정렬 프로그램(Short Oligonucleotide Alignment Program) 2(SOAP2)(http:// http://soap.genomics.org.cn/)을 이용하여 비반복 마스킹된 인간 기준 게놈(NCBI Build 36.1/hg18)으로 정렬하였다. 2개 이하의 뉴클레오타이드 불일치가 쌍 지은 말단 리드의 각각의 구성원에 허용되었다. 말단 둘 다가 삽입 크기 600bp 이하에 이르는 정확한 배향을 갖는 동일한 염색체에 정렬된 쌍 지은 말단 리드만이 하류 분석에 포함되었다. 인간 게놈에서 동일한 시작 및 종료 위치를 나타내는 쌍 지은 말단 리드로 규정되지 않은 중복된 리드가 또한 제거되었다.
G. 실시예의 요약
태아 DNA는 임신한 여성의 혈장에 존재한다. 모체 혈장 DNA의 대량 동시 서열분석은 21번, 18번, 13번 태아 3염색체 및 선택된 성 염색체 이수성을 비침습적으로 검출하기 위해 사용되었다. 대량 동시 서열분석을 이용하여 모체 혈장으로부터 태아 미세결실의 검출을 기술하는 사례 보고가 보고되었다. 그러나, 이의 이전의 보고는 핵형 의존적이거나 하나 또는 더 적은 수의 게놈의 선택된 부분에 구속된 통계 분석을 이용하였다. 이 실시예에서, 모체 혈장 DNA의 대량 동시 서열분석을 통해 전체 게놈에 걸친 3Mb 해상도에서의 비침습적 산전 핵형분석을 수행하기 위한 절차가 보고되었다. 이 방법은 6의 사례로부터 얻은 혈장을 분석하기 위해 이용되었다. 5의 사례에서, 태아 미세중복 또는 미세결실은 모체 혈장으로부터 성공적으로 검출되었다. 태아 미세중복을 갖는 2의 사례는 모체 혈장으로부터의 이러한 변화의 제1 비침습적 산전 검출을 나타냈다. 남은 사례에서, 혈장 DNA 서열분석 결과는 미세중복의 보균자인 임신한 여성과 일치하였다. 2Mb 및 1Mb로의 비침습적 산전 핵형분석의 진단학적 해상도를 증대시키기 위해 서열분석되고 정렬될 필요가 있는 혈장 DNA 분자의 수를 결정하기 위해 시뮬레이션 분석을 수행한다. 결론으로, 대량 동시 서열분석에 의한 모체 혈장으로부터의 비침습적 산전 분자 핵형분석이 실행 가능하고 비침습적 산전 시험의 진단학적 스펙트럼을 증대시킬 것이다.
VI. 컴퓨터 시스템
본 명세서에 언급된 임의의 컴퓨터 시스템은 임의의 적합한 수의 하위시스템을 이용할 수 있다. 이러한 하위시스템의 예는 도 9에서 컴퓨터 장치(900)에 도시되어 있다. 몇몇 실시형태에서, 컴퓨터 시스템은 단일 컴퓨터 장치를 포함하고, 하위시스템은 컴퓨터 장치의 부품일 수 있다. 다른 실시형태에서, 컴퓨터 시스템은 내부 부품과 함께 각각 하위시스템인 다수의 컴퓨터 장치를 포함할 수 있다.
도 9에 도시된 하위시스템은 시스템 버스(975)를 통해 상호연결되어 있다. 추가의 하위시스템, 예컨대 프린터(974), 키보드(978), 저장 장치(들)(979), 모니터(976)(디스플레이 어댑터(982)에 커플링됨), 및 기타가 도시되어 있다. 주변장치 및 입력/출력(I/O) 장치(I/O 콘트롤러(971)에 커플링됨)는 당해 분야에 공지된 임의의 수의 수단, 예컨대 시리얼 포트(977)에 의해 컴퓨터 시스템에 연결될 수 있다. 예를 들어, 시리얼 포트(977) 또는 외부 인터페이스(981)(예를 들어, 이더넷(Ethernet), 와이파이 등)는 컴퓨터 시스템(900)을 광대역 네트워크, 예컨대 인터넷, 마우스 입력 장치 또는 스캐너에 연결하기 위해 사용될 수 있다. 시스템 버스(975)를 통한 상호연결은 중앙 프로세서(973)가 각각의 하위시스템과 소통하게 하고, 시스템 메모리(972) 또는 저장 장치(들)(979)(예를 들어, 고정 디스크, 예컨대 하드 드라이브 또는 광학 디스크)로부터의 명령어의 실행, 및 하위시스템 사이의 정보의 교환을 제어하도록 한다. 시스템 메모리(972) 및/또는 저장 장치(들)(979)는 컴퓨터 판독 가능한 매체를 구현할 수 있다. 본 명세서에 언급된 임의의 데이터는 일 부품으로부터 다른 부품으로 출력될 수 있고 사용자로 출력될 수 있다.
컴퓨터 시스템은 예를 들어 외부 인터페이스(981) 또는 내부 인터페이스에 의해 함께 연결된 복수의 동일한 부품 또는 하위시스템을 포함할 수 있다. 몇몇 실시형태에서, 컴퓨터 시스템, 하위시스템 또는 장치는 네트워크에 걸쳐 소통할 수 있다. 이러한 경우에, 한 컴퓨터는 클라이언트이고 다른 컴퓨터는 서버로서 생각되고, 각각은 동일한 컴퓨터 시스템의 부분일 수 있다. 클라이언트 및 서버는 각각 다수의 시스템, 하위시스템 또는 부품을 포함할 수 있다.
하드웨어(예를 들어, 특정 용도 집적 회로 또는 필드 프로그래밍 가능한 게이트 어레이)를 사용하여 및/또는 모듈식 또는 일체형 방식의 일반적으로 프로그래밍 가능한 프로세서에 의한 컴퓨터 소프트웨어를 사용하여 제어 논리의 형태로 본 발명의 임의의 실시형태가 실행될 수 있는 것으로 이해되어야 한다. 본 명세서에서 사용되는 바대로, 프로세서는 동일한 직접회로 칩에서의 멀티 코어 프로세서, 또는 단일 회로 기판 또는 네트워크에서의 다수의 프로세싱 유닛을 포함한다. 본 명세서에 제공된 개시내용 및 교시내용에 기초하여, 당해 분야의 당업자는 하드웨어 및 하드웨어와 소프트웨어의 조합을 이용하여 본 발명의 실시형태를 실행하기 위한 다른 방식 및/또는 방법을 알고 이해할 것이다.
본원에 기재된 임의의 소프트웨어 부품 또는 기능은 예를 들어 종래의 또는 객체 지향 기법을 이용하여 임의의 적합한 컴퓨터 언어, 예를 들어 자바, C++ 또는 Perl 등을 사용하여 프로세서에 의해 실행되는 소프트웨어 코드로서 실행될 수 있다. 소프트웨어 코드는 저장 및/또는 전송을 위한 컴퓨터 판독 가능한 매체에서 일련의 명령어 또는 명령으로서 저장될 수 있고, 적합한 매체는 랜덤 호출 메모리(RAM), 읽기 전용 메모리(ROM), 자기 매체, 예컨대 하드 드라이브 또는 플로피 디스크, 또는 광학 매체, 예컨대 콤팩트 디스크(CD) 또는 DVD(디지털 다목적 디스크), 플래시 메모리 등을 포함한다. 컴퓨터 판독 가능한 매체는 이러한 저장 또는 전송 장치의 임의의 조합일 수 있다.
이러한 프로그램은 또한 인터넷을 포함하는 다양한 프로토콜에 부합하는 유선, 광학 및/또는 무선 네트워크를 통한 전송에 적합한 반송파 신호를 이용하여 암호화되고 전송될 수 있다. 그러므로, 본 발명의 실시형태에 따른 컴퓨터 판독 가능한 매체는 이러한 프로그램에 의해 암호화된 데이터 신호를 이용하여 생성될 수 있다. 프로그램 코드에 의해 암호화된 컴퓨터 판독 가능한 매체는 호환 장치와 포장되거나 (예를 들어, 인터넷 다운로드를 통해) 다른 장치로부터 별도로 제공될 수 있다. 임의의 이러한 컴퓨터 판독 가능한 매체는 단일 컴퓨터 프로그램 제품(예를 들어, 하드 드라이브, CD 또는 전체 컴퓨터 시스템) 내에 있거나 상에 있고, 시스템 또는 네트워크 내의 상이한 컴퓨터 프로그램 제품 내에 있거나 상에 있을 수 있다. 컴퓨터 시스템은 모니터, 프린터 또는 본 명세서에 언급된 임의의 결과를 사용자에게 제공하기 위한 다른 적합한 디스플레이를 포함할 수 있다.
본 명세서에 기재된 임의의 방법은 단계를 수행하도록 구성될 수 있는 하나 이상의 프로세서를 포함하는 컴퓨터 시스템으로 전부 또는 부분적으로 수행될 수 있다. 따라서, 실시형태는, 잠재적으로 각각의 단계 또는 단계의 각각의 그룹을 수행하기 위한 상이한 부품을 갖는, 본 명세서에 기재된 임의의 방법의 단계를 수행하도록 구성된 컴퓨터 시스템에 관한 것일 수 있다. 숫자의 단계로 제시되어 있지만, 본 명세서에서의 방법의 단계는 동시에 또는 상이한 순서로 수행될 수 있다. 추가로, 이 단계의 부분은 다른 방법으로부터의 다른 단계의 부분과 사용될 수 있다. 또한, 단계의 전부 또는 일부는 임의일 수 있다. 추가로, 임의의 방법의 임의의 단계는 모듈, 회로 또는 이 단계를 수행하기 위한 다른 수단으로 수행될 수 있다.
특정한 실시형태의 구체적인 상세내용은 본 발명의 실시형태의 정신 및 범위로부터 벗어남이 없이 임의의 적합한 방식으로 조합될 수 있다. 그러나, 본 발명의 다른 실시형태는 각각의 개별적인 양상에 대한 구체적인 실시형태 또는 이 개별적인 양상의 구체적인 조합에 관한 것일 수 있다.
본 발명의 예시적인 실시형태의 상기 설명은 예시 및 설명의 목적을 위해 제시되었다. 이것은 배타적이거나 본 발명을 기재된 정확한 형태로 제한하는 것으로 의도되지 않고, 많은 변형 및 변경이 상기 교시내용의 견지에서 가능하다. 당해 분야의 다른 당업자가 고안된 특정한 용도에 적합한 바대로 다양한 변형으로 및 다양한 실시형태로 본 발명을 최고로 이용하도록 본 발명의 원리 및 이의 실질적인 적용을 최고로 설명하기 위해 실시형태가 선택되고 기재되어 있다.
단수 형태의 지칭은, 구체적으로 반대로 표시되지 않은 한, "하나 이상"을 의미하도록 의도된다.
본 명세서에 언급된 모든 특허, 특허 출원, 공보 및 설명은 모든 목적을 위해 그 전문이 참조문헌으로 포함된다. 어떤 것도 선행 기술인 것으로 인정되지 않는다.
참조문헌
Figure 112019108543173-pat00005
Figure 112019108543173-pat00006
Figure 112019108543173-pat00007

Claims (27)

  1. 태아를 임신한 암컷 대상체로부터 얻은 생물학적 샘플에서 태아 DNA 백분율을 추정하는 방법으로서, 상기 생물학적 샘플은 상기 태아 및 상기 암컷 대상체로부터의 무세포 DNA(cell-free DNA)를 포함하고, 상기 방법은,
    상기 생물학적 샘플에서 복수의 DNA 단편의 각각에 대해서 하나 이상의 서열 태그를 수취하는 단계;
    상기 서열 태그에 대해서 게놈 위치를 결정하는 단계;
    하나 이상의 게놈 구역의 각각에 대해서,
    상기 게놈 구역 내에 게놈 위치를 갖는 서열 태그로부터 상기 게놈 구역 내의 DNA 단편의 각각의 양을, 컴퓨터 시스템으로, 결정하는 단계;
    상기 각각의 양을 정규화하여 각각의 밀도를 얻는 단계;
    상기 각각의 밀도를 기준 밀도와 비교하여 상기 각각의 밀도가 상기 기준 밀도와 통계학적으로 상이한지를 확인하는 단계;
    상기 기준 밀도와 통계학적으로 상이한 각각의 밀도를 갖는 것으로 확인된 하나 이상의 게놈 구역의 각각의 밀도 및 기준 밀도로부터 태아 DNA 백분율을 추정하는 단계를 포함하고,
    각각의 게놈 구역의 크기는 10 Mb 이하인 것인, 태아 DNA 백분율을 추정하는방법.
  2. 제1항에 있어서, 태아 DNA 백분율을 추정하는 단계는 하기식을 계산하는 것을 포함하는 것인, 태아 DNA 백분율을 추정하는 방법:
    Figure 112020039827117-pat00008

    상기 식에서, GRx-y시험은 하나 이상의 게놈 구역들의 게놈 구역의 각각의 밀도이고, 평균GRx-y기준은 게놈 구역에 대한 기준 밀도임.
  3. 제1항에 있어서,
    태아 DNA 백분율을 컷오프 값과 비교하는 단계; 및
    컷오프 값과 태아 DNA 백분율과의 비교에 기초하여 암컷 대상체 및 태아 모두가 미세증폭 또는 미세결실을 공유하는지를 결정하는 단계;를 추가로 포함하는 태아 DNA 백분율을 추정하는 방법.
  4. 제3항에 있어서, 태아 DNA 백분율이 컷오프 값보다 큰 경우, 암컷 대상체 및 태아 모두는 미세증폭 또는 미세결실을 공유하는 것으로 결정하는 단계를 추가로 포함하는 태아 DNA 백분율을 추정하는 방법.
  5. 제3항에 있어서, 태아 DNA 백분율이 컷오프 값보다 작은 경우, 태아만 미세증폭 또는 미세결실을 갖는 것으로 결정하는 단계를 추가로 포함하는 태아 DNA 백분율을 추정하는 방법.
  6. 제1항에 있어서, 상기 생물학적 샘플은 모체의 혈액, 혈장, 혈청, 소변 또는 타액인, 태아 DNA 백분율을 추정하는 방법.
  7. 제1항에 있어서, 서열 태그는 대량 동시 서열분석에 의해 얻는 것인, 태아 DNA 백분율을 추정하는 방법.
  8. 제1항에 있어서, 게놈 구역들은 겹치지 않는 것인, 태아 DNA 백분율을 추정하는 방법.
  9. 제1항에 있어서, 게놈 구역들은 인접한 것인, 태아 DNA 백분율을 추정하는 방법.
  10. 제1항에 있어서, 게놈 구역들은 동일한 크기인 것인, 태아 DNA 백분율을 추정하는 방법.
  11. 제10항에 있어서, 각 게놈 구역의 크기는 약 1 Mb인 것인, 태아 DNA 백분율을 추정하는 방법.
  12. 제1항에 있어서, 게놈 구역에 대한 각각의 밀도는, 게놈 구역에 대한 DNA 단편의 각각의 양을 복수의 게놈 구역에 대한 DNA 단편의 전체 양에 의해 나누는 것에 의해 얻어지는 것인, 태아 DNA 백분율을 추정하는 방법.
  13. 제1항에 있어서, 게놈 구역에 대한 각각의 밀도는 게놈 구역에 대한 DNA 단편의 각각의 양과 동일한 것인, 태아 DNA 백분율을 추정하는 방법.
  14. 제1항에 있어서, 게놈 구역에 대한 기준 밀도는, 게놈 구역에서 미세증폭 또는 미세결실을 나타내지 않는 하나 이상의 다른 생물학적 샘플로부터 결정된 복수의 각각의 밀도의 평균 또는 중앙값인, 태아 DNA 백분율을 추정하는 방법.
  15. 제1항에 있어서, 게놈 구역에 대한 기준 밀도는 다른 게놈 구역에 대하여 얻은 복수의 각각의 밀도의 평균 또는 중앙값인, 태아 DNA 백분율을 추정하는 방법.
  16. 제1항에 있어서, 컴퓨터 시스템에 의해, 추정된 태아 DNA 백분율을 보여주는 단계를 추가로 포함하는, 태아 DNA 백분율을 추정하는 방법.
  17. 태아를 임신한 암컷 대상체로부터 얻은 생물학적 샘플을 분석함으로써 태아의 게놈에서 미세증폭 또는 미세결실을 확인하는 방법으로서, 상기 생물학적 샘플은 상기 태아 및 상기 암컷 대상체로부터의 무세포 DNA(cell-free DNA)를 포함하고, 상기 방법은,
    특정된 진단학적 민감도 및 특정된 해상도에 해당하는 미세증폭 또는 미세결실의 크기로 분석되기 위한 DNA 단편의 최소 수를 결정하는 단계;
    상기 생물학적 샘플에서 복수의 DNA 단편의 각각에 대해서 하나 이상의 서열 태그를 수취하는 단계로서, 복수의 DNA 단편은 특정된 진단학적 민감도 및 특정된 해상도를 위한 DNA 단편의 최소 수 이상인 것인 단계;
    상기 서열 태그에 대해서 게놈 위치를 결정하는 단계;
    복수의 게놈 구역의 각각에 대해서,
    상기 게놈 구역 내에 게놈 위치를 갖는 서열 태그로부터 상기 게놈 구역 내의 DNA 단편의 각각의 양을, 컴퓨터 시스템으로, 결정하는 단계;
    상기 각각의 양을 정규화하여 각각의 밀도를 얻는 단계;
    상기 각각의 밀도를 기준 밀도와 비교하여 상기 각각의 밀도가 상기 기준 밀도와 통계학적으로 상이한지를 확인하는 단계;
    상기 각각의 밀도가 상기 기준 밀도보다 통계학적으로 높은 경우, 상기 게놈 구역을 미세증폭으로서 확인하는 단계; 및
    상기 각각의 밀도가 상기 기준 밀도보다 통계학적으로 낮은 경우, 상기 게놈 구역을 미세결실로서 확인하는 단계를 포함하는, 태아의 게놈에서 미세증폭 또는 미세결실을 확인하는 방법.
  18. 삭제
  19. 제17항에 있어서, 상기 생물학적 샘플에서 태아 DNA 백분율을 추정하는 단계; 및 추정된 태아 DNA 백분율을 이용하여 DNA 단편의 최소 수를 결정하는 단계를 추가로 포함하는 것인, 태아의 게놈에서 미세증폭 또는 미세결실을 확인하는 방법.
  20. 제17항에 있어서, 상기 최소 수는 전체 게놈에 대하여 특정되는 것인, 태아의 게놈에서 미세증폭 또는 미세결실을 확인하는 방법.
  21. 제17항에 있어서, 분석되기 위한 DNA 단편의 최소 수는 복수의 게놈 구역의 각각의 게놈 구역에 대한 DNA 단편의 수로부터 계산되는 것인, 태아의 게놈에서 미세증폭 또는 미세결실을 확인하는 방법.
  22. 제21항에 있어서, 95% 진단학적 민감도로 분석되기 위한 DNA 단편의 최소 수는 복수의 게놈 구역의 각각의 게놈 구역에 대하여 42,000 이상인 것인, 태아의 게놈에서 미세증폭 또는 미세결실을 확인하는 방법.
  23. 제21항에 있어서, 99% 진단학적 민감도로 분석되기 위한 DNA 단편의 최소 수는 복수의 게놈 구역의 각각의 게놈 구역에 대하여 53,000 이상인 것인, 태아의 게놈에서 미세증폭 또는 미세결실을 확인하는 방법.
  24. 제17항에 있어서, 각각의 게놈 구역의 크기는 약 1Mb, 약 2 Mb, 또는 약 3 Mb인, 태아의 게놈에서 미세증폭 또는 미세결실을 확인하는 방법.
  25. 제17항에 있어서, 게놈 구역들은 동일한 크기인 것인, 태아의 게놈에서 미세증폭 또는 미세결실을 확인하는 방법.
  26. 제1항 내지 제17항 및 제19항 내지 제25항 중 어느 한 항에 따른 방법을 수행하기 위해 실행시 컴퓨터 시스템을 제어하는 다수의 지시를 저장하는 비전송형 컴퓨터 판독 가능한 매체.
  27. 제26항의 비전송형 컴퓨터 판독 가능한 매체를 포함하는 컴퓨터 시스템.
KR1020197031373A 2013-01-10 2014-01-09 모체 혈장으로부터의 비침습적 산전 분자 핵형분석 KR102199322B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361751213P 2013-01-10 2013-01-10
US61/751,213 2013-01-10
US13/837,776 2013-03-15
US13/837,776 US10643738B2 (en) 2013-01-10 2013-03-15 Noninvasive prenatal molecular karyotyping from maternal plasma
PCT/AU2014/000012 WO2014107765A1 (en) 2013-01-10 2014-01-09 Noninvasive prenatal molecular karyotyping from maternal plasma

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020197004749A Division KR102038125B1 (ko) 2013-01-10 2014-01-09 모체 혈장으로부터의 비침습적 산전 분자 핵형분석

Publications (2)

Publication Number Publication Date
KR20190122909A KR20190122909A (ko) 2019-10-30
KR102199322B1 true KR102199322B1 (ko) 2021-01-06

Family

ID=51061637

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020197004749A KR102038125B1 (ko) 2013-01-10 2014-01-09 모체 혈장으로부터의 비침습적 산전 분자 핵형분석
KR1020197031373A KR102199322B1 (ko) 2013-01-10 2014-01-09 모체 혈장으로부터의 비침습적 산전 분자 핵형분석
KR1020157017193A KR102113896B1 (ko) 2013-01-10 2014-01-09 모체 혈장으로부터의 비침습적 산전 분자 핵형분석

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020197004749A KR102038125B1 (ko) 2013-01-10 2014-01-09 모체 혈장으로부터의 비침습적 산전 분자 핵형분석

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020157017193A KR102113896B1 (ko) 2013-01-10 2014-01-09 모체 혈장으로부터의 비침습적 산전 분자 핵형분석

Country Status (19)

Country Link
US (3) US10643738B2 (ko)
EP (2) EP2943592B1 (ko)
JP (4) JP6251289B2 (ko)
KR (3) KR102038125B1 (ko)
CN (3) CN114724626A (ko)
AU (2) AU2014205038B2 (ko)
CA (1) CA2895206A1 (ko)
DK (1) DK2943592T3 (ko)
ES (1) ES2965274T3 (ko)
FI (1) FI2943592T3 (ko)
HK (2) HK1210811A1 (ko)
HR (1) HRP20231604T1 (ko)
HU (1) HUE064628T2 (ko)
LT (1) LT2943592T (ko)
PL (1) PL2943592T3 (ko)
PT (1) PT2943592T (ko)
RS (1) RS65021B1 (ko)
SG (2) SG11201504795PA (ko)
WO (1) WO2014107765A1 (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10643738B2 (en) * 2013-01-10 2020-05-05 The Chinese University Of Hong Kong Noninvasive prenatal molecular karyotyping from maternal plasma
US10319463B2 (en) 2015-01-23 2019-06-11 The Chinese University Of Hong Kong Combined size- and count-based analysis of maternal plasma for detection of fetal subchromosomal aberrations
EP3347466B1 (en) 2015-09-08 2024-01-03 Cold Spring Harbor Laboratory Genetic copy number determination using high throughput multiplex sequencing of smashed nucleotides
AU2017218149B2 (en) * 2016-02-12 2020-09-03 Regeneron Pharmaceuticals, Inc. Methods and systems for detection of abnormal karyotypes
WO2017213470A1 (ko) * 2016-06-10 2017-12-14 이원다이애그노믹스(주) 다중 z-score에 기반한 비침습적 산전 검사 방법 및 장치
CA3049442A1 (en) * 2017-01-11 2018-07-19 Quest Diagnostics Investments Llc Method for non-invasive prenatal screening for aneuploidy
CN106778069B (zh) * 2017-02-17 2020-02-14 广州精科医学检验所有限公司 确定胎儿染色体中微缺失微重复的方法及设备
CN109280702A (zh) * 2017-07-21 2019-01-29 深圳华大基因研究院 确定个体染色体结构异常的方法和系统
US11646100B2 (en) 2017-08-04 2023-05-09 Billiontoone, Inc. Target-associated molecules for characterization associated with biological targets
US11519024B2 (en) 2017-08-04 2022-12-06 Billiontoone, Inc. Homologous genomic regions for characterization associated with biological targets
BR112020002260A2 (pt) * 2017-08-04 2020-09-08 Billiontoone, Inc. método para facilitar o diagnóstico pré-natal de um distúrbio genético a partir de uma amostra materna associada a uma gestante, método para facilitação de caracterização de uma condição médica a partir de uma amostra compreendendo moléculas alvo e método para quantificação de alvo biológico a partir de uma amostra compreendendo moléculas alvo
CN107992719B (zh) * 2017-11-23 2021-08-06 南方医科大学 一种基于高通量测序的膀胱癌检测试剂盒
PT3735470T (pt) 2018-01-05 2024-01-31 Billiontoone Inc Modelos de controlo de qualidade para garantir a validade dos ensaios baseados em sequenciamento
KR102287096B1 (ko) * 2019-01-04 2021-08-09 테라젠지놈케어 주식회사 모체 시료 중 태아 분획을 결정하는 방법
EP4256565A1 (en) 2020-12-02 2023-10-11 Illumina Software, Inc. System and method for detection of genetic alterations
CN113699225B (zh) * 2021-08-06 2023-11-21 菁良科技(深圳)有限公司 无创产前筛查微缺失或微重复非配对参考品及其制备和应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012071621A1 (en) 2010-11-30 2012-06-07 The Chinese University Of Hong Kong Detection of genetic or molecular aberrations associated with cancer
KR102038125B1 (ko) * 2013-01-10 2019-10-29 더 차이니즈 유니버시티 오브 홍콩 모체 혈장으로부터의 비침습적 산전 분자 핵형분석

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
US20020164816A1 (en) 2001-04-06 2002-11-07 California Institute Of Technology Microfluidic sample separation device
TR201910868T4 (tr) 2006-02-02 2019-08-21 Univ Leland Stanford Junior Dijital analizle invazif olmayan fetal genetik tarama.
CA3176319A1 (en) * 2007-07-23 2009-01-29 The Chinese University Of Hong Kong Analyzing tumor dna in a cell-free sample
US20100112590A1 (en) 2007-07-23 2010-05-06 The Chinese University Of Hong Kong Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment
EP2334812B1 (en) 2008-09-20 2016-12-21 The Board of Trustees of The Leland Stanford Junior University Noninvasive diagnosis of fetal aneuploidy by sequencing
HUE034854T2 (en) 2009-11-05 2018-03-28 Univ Hong Kong Chinese Fetal genomic analysis from maternal biological samples
US20120270739A1 (en) * 2010-01-19 2012-10-25 Verinata Health, Inc. Method for sample analysis of aneuploidies in maternal samples
EP2848703A1 (en) * 2010-01-19 2015-03-18 Verinata Health, Inc Simultaneous determination of aneuploidy and fetal fraction
US20120237928A1 (en) 2010-10-26 2012-09-20 Verinata Health, Inc. Method for determining copy number variations

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012071621A1 (en) 2010-11-30 2012-06-07 The Chinese University Of Hong Kong Detection of genetic or molecular aberrations associated with cancer
KR102038125B1 (ko) * 2013-01-10 2019-10-29 더 차이니즈 유니버시티 오브 홍콩 모체 혈장으로부터의 비침습적 산전 분자 핵형분석

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Genome research 21(6): 974-984 (2011. 2. 7.)

Also Published As

Publication number Publication date
US10643738B2 (en) 2020-05-05
US20240170094A1 (en) 2024-05-23
AU2017228558A1 (en) 2017-10-05
EP2943592B1 (en) 2023-11-08
HRP20231604T1 (hr) 2024-03-15
JP2016511632A (ja) 2016-04-21
US20200176075A1 (en) 2020-06-04
FI2943592T3 (fi) 2023-12-18
WO2014107765A1 (en) 2014-07-17
JP6251289B2 (ja) 2017-12-20
SG11201504795PA (en) 2015-07-30
DK2943592T3 (da) 2024-01-02
KR20190019219A (ko) 2019-02-26
HK1213024A1 (zh) 2016-06-24
CN115132272A (zh) 2022-09-30
EP4280219A3 (en) 2024-02-21
JP2018075013A (ja) 2018-05-17
KR20150105314A (ko) 2015-09-16
JP2020058393A (ja) 2020-04-16
SG10201807047XA (en) 2018-09-27
HUE064628T2 (hu) 2024-04-28
AU2014205038A8 (en) 2015-08-13
LT2943592T (lt) 2024-01-10
AU2017228558B2 (en) 2019-05-30
KR20190122909A (ko) 2019-10-30
CN105051209A (zh) 2015-11-11
US11923046B2 (en) 2024-03-05
CA2895206A1 (en) 2014-07-17
JP6725481B2 (ja) 2020-07-22
ES2965274T3 (es) 2024-04-11
HK1210811A1 (en) 2016-05-06
AU2014205038A1 (en) 2015-07-16
US20140195164A1 (en) 2014-07-10
KR102038125B1 (ko) 2019-10-29
EP2943592A4 (en) 2016-08-31
EP2943592A1 (en) 2015-11-18
PL2943592T3 (pl) 2024-03-11
AU2014205038B2 (en) 2017-07-27
PT2943592T (pt) 2023-12-22
KR102113896B1 (ko) 2020-05-21
AU2017228558C1 (en) 2019-10-03
JP2023014310A (ja) 2023-01-26
RS65021B1 (sr) 2024-01-31
EP4280219A2 (en) 2023-11-22
CN114724626A (zh) 2022-07-08

Similar Documents

Publication Publication Date Title
KR102199322B1 (ko) 모체 혈장으로부터의 비침습적 산전 분자 핵형분석
US10468121B2 (en) Phasing and linking processes to identify variations in a genome
EP3617324B1 (en) Size-based analysis of dna for classification of cancer
JP5938484B2 (ja) ゲノムのコピー数変異の有無を判断する方法、システム及びコンピューター読み取り可能な記憶媒体
AU2023219911A1 (en) Using cell-free DNA fragment size to detect tumor-associated variant
HUE030510T2 (hu) Magzati kromoszómális aneuploidia diagnosztizálása genomszekvenálás alkalmazásával
JP2023552507A (ja) ゲノムの反復領域内のショートリードを可視化するための方法及びシステム
JP2021101629A (ja) ゲノム解析および遺伝子解析用のシステム並びに方法
US20220375544A1 (en) Kit and method of using kit
Bohlander ABCs of genomics
Niehus et al. PopDel identifies medium-size deletions jointly in tens of thousands of genomes
Goldmann Characterization of de novo Mutations in the Human Germline
Ramakrishnan Rajagopalan et al. Systematic and comprehensive benchmarking of an exome sequencing based germline copy-number analysis pipeline to detect clinically relevant CNVs

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant