KR101489568B1 - 태아 유전학적 이상의 비침습성 검출 - Google Patents

태아 유전학적 이상의 비침습성 검출 Download PDF

Info

Publication number
KR101489568B1
KR101489568B1 KR1020127034453A KR20127034453A KR101489568B1 KR 101489568 B1 KR101489568 B1 KR 101489568B1 KR 1020127034453 A KR1020127034453 A KR 1020127034453A KR 20127034453 A KR20127034453 A KR 20127034453A KR 101489568 B1 KR101489568 B1 KR 101489568B1
Authority
KR
South Korea
Prior art keywords
chromosome
delete delete
coverage depth
content
chromosomal
Prior art date
Application number
KR1020127034453A
Other languages
English (en)
Other versions
KR20140023847A (ko
Inventor
푸만 지앙
후이페이 첸
시앙후아 차이
유잉 유안
시우칭 장
팡 첸
Original Assignee
비지아이 헬스 서비스 코포레이션 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=47392194&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR101489568(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 비지아이 헬스 서비스 코포레이션 리미티드 filed Critical 비지아이 헬스 서비스 코포레이션 리미티드
Publication of KR20140023847A publication Critical patent/KR20140023847A/ko
Application granted granted Critical
Publication of KR101489568B1 publication Critical patent/KR101489568B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

본 발명은, 모체의 생물학적 샘플로부터의 뉴클레오티드들의 대량 염기서열분석에 의한 태아의 유전학적 이상의 비침습성 검출 방법에 관한 것이다. 나아가, 본 발명은 염색체의 GC 함량에서의 차이로 인한 염기서열분석 결과들로부터 GC 바이어스를 제거하는 방법을 제공한다. 본 발명은 검출을 훨씬 더 정확하게 할 뿐만 아니라, XO, XXX, XXY 및 XYY 등과 같은 성염색체 이상을 포함하는 태아 염색체 이수성 검출을 위한 종합적인 방법도 제공한다.

Description

태아 유전학적 이상의 비침습성 검출{NONINVASIVE DETECTION OF FETAL GENETIC ABNORMALITY}
본 발명은 임산부로부터의 샘플의 DNA 서열분석(sequencing)에 의한 태아 유전학적 이상의 비침습성(noninvasive) 검출방법에 관한 것이다. 보다 구체적으로, 본 발명은 DNA 샘플들의 증폭 및 서열분석에 의해 도입된 GC 바이어스(bias)를 제거하기 위한 데이터 분석에 관한 것이다. 본 발명은 나아가, 태아의 유전학적 이상, 예컨대 염색체이수성(aneuploidy)을 포함한 염색체 이상들을 검출하기 위한 통계 분석방법에 관한 것이다.
침습성 절차들을 이용한 통상적인 태아기(prenatal) 진단방법들, 예컨대 융모막 융모 샘플링 및 양수검사(amniocentesis)는 태아와 모체 모두에 잠재적인 위험을 갖고 있다. 모체 혈청 마커(maternal serum marker) 및 초음파를 이용한 태아 염색체이수성의 비침습성 스크리닝(screening)을 이용가능하지만, 제한된 감도 및 특이성을 갖는다 (Kagan, 등, Human Reproduction (2008) 23:1968~1975; Malone, 등, N Engl J Med (2005) 353:2001~2011).
최근 연구들은, 임산부의 혈장 중 DNA 분자들의 대규모 병렬 염기서열분석(massively parallel sequencing)에 의한 태아 염색체 이수성의 비침습성 검출이 실행가능함을 입증하여 왔다. 태아 DNA는 모체 혈장 및 혈청에서 검출 및 정량화되어왔다(Lo, 등, Lancet (1997) 350:485 487; Lo, 등, Am. J. hum. Genet. (1998) 62:768~775). 다수의 태아 세포 유형들이 모체 순환 중에서 발생하며, 이는 태아 과립구, 림프구, 유핵적혈구들 및 영양막세포들(trophoblast cells)을 포함한다 (Pertl and Bianchi, Obstetrics and Gynecology (2001) 98:483~490). 태아 DNA는 임신 7주차 혈청에서 검출될 수 있으며, 임신 기간에 따라 증가된다. 모체 혈청 및 혈장 중 존재하는 태아 DNA는 태아 세포 분리 프로토콜들로부터 수득되는 DNA의 농도에 필적한다.
순환 태아 DNA는 태아 성별을 결정하는데 사용되어 왔다 (Lo, 등, Am. J. hum. Genet. (1998) 62:768~775). 또한, 태아 레서스(rhesus) D 유전형은 태아 DNA를 이용하여 검출되어 왔다. 그러나, 순환 태아 DNA의 진단 및 임상 적용들은 모체에 존재하는 유전자들이 아닌, 태아에 존재하는 유전자들에 국한되어 왔다(Pertl and Bianchi, Obstetrics and Gynecology (2001) 98:483~490). 따라서, 태아 DNA의 서열을 결정할 수 있고 태아에서의 염색체 비정상의 명확한 진단을 제공할 수 있는 비침습성 방법에 대한 요구가 여전히 존재한다.
지난 수십년간 모체 혈액 중에서 태아 세포들 및 무세포 태아 핵산들의 발견 및 고수율 샷건(high-throughput shotgun) 서열분석의 적용은 모체 혈장 샘플 중 이수체(aneuploid) 태아에 의해 제공된 염색체들의 제시에서의 작은 변화들을 감지하는 것이 가능하게 되었다. 3염색체성 13, 18 및 21 임신의 비침습성 검출이 달성되어왔다.
그러나, 일부 연구들이 나타내는 바와 같이, 증폭 및 서열분석에 의해 도입되는 GC 바이어스는 염색체이수성 검출의 민감도에 실질적인 한계를 부여하였다. GC 바이어스는 샘플 제조 및 서열분석 과정 동안, 시약 조성, 클러스터(cluster) 밀도 및 온도와 같은 상이한 조건들 하에서 도입될 수 있으며, 이는 GC-풍부 또는 GC-부족이라는 염색체들에 대한 서열분석 데이터에서 상이한 GC 조성 및 현저한 변동이 있는 DNA 분자들의 차별적(differential) 샘플링을 이끈다.
감도 개선을 위하여, GC-바이어스의 효과 제거를 위한 프로토콜들이 개발되어 왔다. Fan과 Quake는, 대응 가중치를 곱하므로써 각 빈(bin)에서 맵핑된(mapped) 수치를 개선하기 위하여, 국소 게놈 GC 함량에 근거하여 가중치를 각 GC 밀도에 적용하므로써 GC 바이어스를 컴퓨터계산으로 제거하는 방법을 개발하였다 (Fan and Quake PLoS ONE (2010) 5:e10439). 그러나, 상기 방법은 검출 정확성을 간섭할 데이터의 약한 왜곡을 일으킬 수 있기 때문에, 성염색체 질환들, 특히 Y 염색체 관련 질환들을 다루는데에는 어려움이 있다.
본 명세서에서, 본 발명자들은 태아의 유전학적 이상 검출에서 보다 높은 감도 및 데이터 왜곡을 회피하기 위하여 GC-바이어스를 컴퓨터연산적으로 제거하는 방법을 설명한다. 본 방법은 GC-함량에 따른 통계적 시험에 사용되는 파라미터들을 규정한다. 추가적으로, 본 발명자들은 추정된 태아 분획(fraction)을 이원(binary) 가설에 의한 진단에 도입하였으며, 이는 보다 높은 감도 및 특이성을 나타내었다. 본 발명의 방법은, 더욱 많은 폴리뉴클레오티드 단편들을 서열분석하므로써 적은 태아 DNA 분획을 함유하는 모체 샘플에 대한 정확도를 예비설정하기 위하여, 태아 유전학적 이상의 비침습성 검출의 감도를 증가시키기는 것이 가능하다는 것을 나타낸다. 이후의 임신 주수에서 모체 혈장의 재샘플링도 진단 감도를 증가시킬 수 있다.
발명의 요약
본 발명은 모체의 생물학적 샘플로부터의 뉴클레오티드의 대량 염기서열분석에 의한, 태아의 유전적 비정상의 비침습성 검출 방법에 관한 것이다. 나아가, 본 발명은 염색체의 GC 함량에서의 차이로 인한 염기서열분석 결과들로부터 GC 바이어스를 제거하는 방법을 제공한다.
따라서, 한 측면에서 본 발명은 염색체의 커버리지 깊이(coverage depth)와 GC 함량간의 관계 수립방법을 제공하며, 상기 방법은 다음 단계들을 포함한다: 하나 이상의 샘플로부터 상기 염색체 및 또다른 하나의 염색체를 망라하는(covering) 다수의 폴리뉴클레오티드 단편들의 서열정보를 수득하는 단계; 상기 서열정보에 근거하여, 상기 단편들을 염색체들에 지정하는(assigning) 단계; 각 샘플에 대한 상기 서열정보에 근거하여 커버리지 깊이 및 GC 함량을 계산하는 단계; 및 상기 염색체의 커버리지 깊이와 GC 함량간의 관계를 결정하는 단계.
한 구체예에서, 상기 폴리뉴클레오티드 단편들은 길이가 약 10bp 내지 약 1000bp(염기쌍)의 범위이다. 또다른 구체예에서, 상기 폴리뉴클레오티드 단편들은 길이가 약 15bp 내지 약 500bp의 범위이다. 또다른 구체예에서, 폴리뉴클레오티드 단편들은 길이가 약 20 내지 약 200bp의 범위이다. 또다른 구체예에서, 상기 폴리뉴클레오티드 단편들은 길이가 약 25bp 내지 약 100bp의 범위이다. 추가의 구체예에서, 상기 폴리뉴클레오티드 단편들은 길이가 약 35bp이다.
한 구체예에서, 상기 서열정보는 병렬 게놈 서열분석(parallel genomic sequencing)에 의해 수득된다. 또다른 구체예에서, 단편의 염색체들로의 지정은, 인간 게놈 서열을 참조하여 단편들의 서열을 비교하므로써 이루어진다. 상기 참조 인간 게놈 서열은 임의의 적당한 및/또는 간행된 인간 게놈 구축물들 예컨대 hg18 또는 hg19일 수 있다. 하나 이상의 염색체에 지정되거나 또는 임의의 염색체에 지정되지 않는 절편들은 무시될 수 있다.
한 구체예에서, 염색체의 커버리지 깊이는 염색체에 지정되는 단편들의 수와 염색체의 특정 기준 판독값들(reference unique reads)간의 비율이다. 또다른 구체예에서, 상기 커버리지 깊이는 정규화된다(normalized). 또다른 구체예에서, 정규화는 모든 다른 상염색체들의 커버리지에 대하여 계산된다. 또다른 구체예에서, 정규화는 모든 다른 염색체들의 커버리지에 대하여 계산된다.
한 구체예에서, 상기 관계는 하기 식과 같다:
Figure 112012109734663-pct00001
식 중, f(GCi,j)는 정규화된 커버리지 깊이와 샘플 i, 염색체 j의 대응 GC 함량간의 관계의 함수를 나타내고, εi,j는 샘플 i, 염색체 j의 잔기들을 나타낸다. 일부 구체예들에서, 커버리지 깊이와 GC 함량간의 관계는 국소 다항 회귀분석(local polynomial regression)에 의하여 계산된다. 일부 구체예들에서, 관계는 비-강성(non-strong) 선형 관계일 수 있다. 일부 구체예들에서, 상기 관계는 뢰스 알고리즘(Loess algorithm)에 의해 결정된다.
일부 구체예들에서, 본 방법은 다음 식에 따라 적합화된(fitted) 커버리지 깊이의 계산을 더 포함한다:
Figure 112012109734663-pct00002
.
일부 구체예들에서, 상기 방법은 하기 식에 따른 표준 분산의 계산을 포함한다:
Figure 112012109734663-pct00003
식 중, ns는 기준 샘플들의 수를 나타낸다.
일부 구체예들에서, 본 방법은 하기 식에 따른 스튜던트 t-통계(student t-statistic) 계산을 더 포함한다:
Figure 112012109734663-pct00004
한 구체예에서, 염색체의 GC 함량은 염색체에 지정되는 모든 단편들의 평균 GC 함량이다. 단편의 GC 함량은 단편 내의 G/C 뉴클레오티드들의 수를 단편의 총 뉴클레오티드 수로 나누어 계산될 수 있다. 다른 구체예에서, 염색체의 GC 함량은 염색체의 특정 기준 판독값들의 총(aggregate) GC 함량이다.
일부 구체예들에서, 적어도 2, 5, 10, 20, 50, 100, 200, 500 또는 1000 개의 샘플들이 사용된다. 일부 구체예들에서, 상기 염색체는 염색체 1, 2,..., 22, X 또는 Y이다.
한 구체예에서, 샘플들은 임신한 여성 대상자들로부터의 것이다. 또다른 구체예에서, 샘플들은 남성 대상자들로부터의 것이다. 또다른 구체예에서, 샘플들은 임신한 여성 대상자들 및 남성 대상자들 모두로부터의 것이다.
일부 구체예들에서, 샘플들은 생물학적 샘플들이다. 일부 구체예들에서, 샘플들은 말초혈액 샘플들이다.
본 발명은 태아의 유전학적 이상을 결정하는 방법도 제공하며, 상기 방법은 다음 단계들을 포함한다: a) 하나의 샘플로부터 다수의 폴리뉴클레오티드 단편들의 서열정보를 수득하는 단계; b) 상기 서열정보에 근거하여 상기 단편들을 염색체들에 지정하는 단계; c) 상기 서열정보에 근거하여 염색체의 커버리지 깊이 및 GC 함량을 계산하는 단계; d) 상기 염색체의 상기 GC 함량을 이용하여 상기 염색체의 적합화된 커버리지 깊이 및 상기 염색체의 커버리지 깊이와 GC 함량간의 수립된(established) 관계를 계산하는 단계; 및 e) 상기 적합화된 커버리지 깊이를 상기 염색체의 상기 커버리지 깊이에 비교하는 단계로, 여기에서 이들간의 차이는 태아 유전학적 이상을 나타낸다.
일부 구체예들에서, 본 방법은 f) 태아 성별을 결정하는 단계를 더 포함한다. 태아 성별은 하기 식에 따라 결정될 수 있다:
Figure 112012109734663-pct00005
식 중, cr.a i,x cr.a i,y 는 X 및 Y 염색체들 각각의 정규화된 상대 커버리지이다.
일부 구체예들에서, 본 방법은 g) 태아 분획을 추정하는(estimating) 단계를 더 포함한다. 상기 태아 분획은 하기 식에 따라 계산될 수 있다:
Figure 112012109734663-pct00006
식 중,
Figure 112012109734663-pct00007
는 염색체 Y 커버리지 깊이와 여성 태아를 가진 임산부로부터의 샘플들의 대응 GC 함량의 관계로부터 계산된 적합화된 커버리지 깊이이며,
Figure 112012109734663-pct00008
는 염색체 Y 커버리지 깊이와 남성 대상자의 대응 GC 함량의 관계로부터 계산된 적합화된 커버리지 깊이를 의미한다. 대안적으로, 상기 태아 분획은 하기 식에 따라 계산될 수 있다:
Figure 112012109734663-pct00009
식 중,
Figure 112012109734663-pct00010
는 염색체 X 커버리지 깊이와 여성 태아를 가진 임산부로부터의 샘플들의 대응 GC 함량의 관계로부터 계산된 적합화된 커버리지 깊이이며,
Figure 112012109734663-pct00011
는 염색체 X 커버리지 깊이와 남성 대상자의 샘플들로부터의 대응 GC 함량의 관계로부터 계산된 적합화된 커버리지 깊이를 의미한다. 나아가, 상기 태아 분획은 하기 식에 따라 계산될 수 있다:
Figure 112012109734663-pct00012
식 중,
Figure 112012109734663-pct00013
는 염색체 X 커버리지 깊이와 여성 태아를 가진 임산부로부터의 샘플들의 대응 GC 함량의 관계로부터 계산된 적합화된 커버리지 깊이이며,
Figure 112012109734663-pct00014
는 염색체 Y 커버리지 깊이와 여성 태아를 가진 임산부로부터의 샘플들의 대응 GC 함량의 관계로부터 계산된 적합화된 커버리지 깊이를 의미하고,
Figure 112012109734663-pct00015
는 염색체 X 커버리지 깊이와 남성 대상자의 샘플들로부터의 대응 GC 함량의 관계로부터 계산된 적합화된 커버리지 깊이를 의미하고,
Figure 112012109734663-pct00016
은 염색체 Y 커버리지 깊이와 남성 대상자의 대응 GC 함량의 관계로부터 계산된 적합화된 커버리지 깊이를 의미한다.
한 구체예에서, 유전학적 이상은 염색체 이상이다. 또다른 구체예에서, 상기 유전학적 이상은 염색체이수성이다. 또다른 구체예에서, 상기 태아 염색체이수성은 3염색체성 13, 18 및 21로 이루어지는 군으로부터 선택되는 상염색체 질환이다. 또다른 구체예에서, 상기 태아 염색체이수성은 XO, XXX, XXY 및 XYY로 이루어지는 군으로부터 선택되는 성염색체 질환이다.
일부 구체예들에서, 염색체의 상기 커버리지 깊이에 대한 적합화된 커버리지 깊이의 비교는 통계적 가설 시험에 의하여 수행되며, 여기에서 한 가설은 태아가 정배수체 (H0)이고, 나머지 가설은 태아가 이수체 (H1)라는 것이다. 두 가설들 모두에 대한 통계분석이 계산될 수 있다. 일부 구체예들에서, 스튜던트 t-통계가 다음 식에 따라 H0 및 H1에 대하여 각각 계산되며:
Figure 112012109734663-pct00017
Figure 112012109734663-pct00018
, 식 중, fxy는 태아 분획이다. 일부 구체예들에서, t1 및 t2 의 로그 유사 비율은 다음 식에 따라 계산된다:
Figure 112012109734663-pct00019
, 식 중, degree는 t 분포 정도를 의미하며, D는 2배성을 의미하고, T는 3염색체성이며,
Figure 112012109734663-pct00020
는 소정의 t 분포 정도에서 조건부 확률 밀도를 나타낸다.
한 구체예에서, 태아 성별은 여성이고, 스튜던트 t-통계는 하기 식에 따라 계산된다:
Figure 112012109734663-pct00021
, 식 중,
Figure 112012109734663-pct00022
는 염색체 X 커버리지 깊이와 여성 태아를 가진 임산부로부터의 샘플들의 대응 GC 함량의 관계로부터 계산된 적합화된 커버리지 깊이이다. 일부 구체예들에서, |t1|>3.13은 태아가 XXX 또는 XO일 수 있음을 나타낸다. 일부 구체예들에서, |t1|>5는 태아가 XXX 또는 XO임을 나타낸다.
또다른 구체예에서, 태아 성별이 남성이고, 스튜던트 t-통계는 다음 식에 따라 계산되고:
Figure 112012109734663-pct00023
,식 중,
Figure 112012109734663-pct00024
는 염색체 X 커버리지 깊이와 여성 태아를 가진 임산부로부터의 샘플들의 대응 GC 함량의 관계로부터 계산된 적합화된 커버리지 깊이를 나타낸다. 일부 구체예들에서, |t2|>3.13은 태아가 XXY 또는 XYY일 수 있음을 나타낸다. 일부 구체예들에서, |t2|>5는 태아가 XXY 또는 XYY임을 나타낸다.
본 발명은 태아의 유전학적 이상의 결정방법을 제공하며, 상기 방법은 다음 단계들을 포함한다: a) 하나 이상의 정상 샘플들로부터 한 염색체 및 또다른 하나의 염색체를 망라하는 다수의 폴리뉴클레오티드 단편들의 서열정보를 수득하는 단계; b) 상기 서열정보에 근거하여, 상기 단편들을 염색체들에 지정하는 단계; c) 각 정상의 샘플들로부터의 상기 서열정보에 근거하여, 상기 염색체의 커버리지 깊이 및 GC 함량을 계산하는 단계; d) 상기 염색체의 커버리지 깊이와 GC 함량 간의 관계를 결정하는 단계; e) 생물학적 샘플로부터의 다수의 폴리뉴클레오티드 단편들의 서열 정보를 수득하는 단계; f) 상기 생물학적 샘플로부터의 상기 서열정보에 근거하여, 상기 단편들을 염색체들에 지정하는 단계; g) 상기 생물학적 샘플로부터의 상기 서열 정보에 근거하여 상기 염색체의 커버리지 깊이 및 GC 함량을 계산하는 단계; h) 상기 염색체의 상기 GC 함량 및 상기 염색체의 커버리지 깊이와 GC 함량간의 관계를 이용하여 상기 염색체의 적합화된 커버리지 깊이를 계산하는 단계; 및 i) 상기 적합화된 커버지리 깊이를 상기 염색체의 상기 커버리지 깊이에 대해 비교하는 단계로, 여기에서 이들간의 차이는 태아의 유전학적 이상을 의미한다.
또다른 측면에서, 본 명세서는 태아의 유전학적 이상의 태아기 진단을 수행하기 위한 다수의 지시사항들(instructions)을 포함하는 컴퓨터 판독 방법(computer readable medium)을 제공하며, 이는 다음 단계들을 포함한다: a) 샘플로부터 다수의 폴리뉴클레오티드 단편들의 서열정보를 수령하는 단계; b) 상기 서열 정보에 근거하여 상기 폴리뉴클레오티드 단편들을 염색체들에 지정하는 단계; c) 상기 서열정보에 근거하여 염색체의 커버리지 깊이 및 GC 함량을 계산하는 단계; d) 상기 염색체의 상기 GC 함량 및 상기 염색체의 커버리지 깊이와 GC 함량과의 수립된 관계를 이용하여 상기 염색체의 적합화된 커버리지 깊이를 계산하는 단계; 및 e) 상기 적합화된 커버리지 깊이를 상기 염색체의 상기 커버리지 깊이에 대해 비교하는 단계로, 여기에서 이들 간의 차이는 유전학적 이상을 나타낸다.
또다른 측면에서, 본 발명은 태아의 유전학적 이상 결정 시스템을 제공하며, 이는 다음 방법들을 포함한다: a) 샘플로부터 다수의 폴리뉴클레오티드 단편들의 서열정보를 수득하기 위한 방법; 및 b) 태아의 유전학적 이상의 태아기 진단을 수행하기 위한 다수의 지시사항들을 포함하는 컴퓨터 판독 방법. 일부 구체예들에서, 상기 시스템은 임신한 여성 대상자로부터 수득된 생물학적 샘플을 더 포함하며, 여기에서 상기 생물학적 샘플은 다수의 폴리뉴클레오티드 단편들을 포함한다.
도 1은, 폴리뉴클레오티드 단편들의 서열정보를 이용하므로써 커버리지 깊이 및 GC 함량을 계산하기 위한 도식적 과정을 보여준다.
도 2는 300개의 참조 경우들로부터의 데이터를 이용하므로써 수립되는 정규화된 커버리지 깊이-GC 함량 상관을 예시한다. 상기 각 경우에 대한 정규화된 커버리지 깊이는 대응하는 서열화된 GC 함량에 대하여 그래프화된다. 십자모양들은 정배수체의 여성 태아의 경우들을 표시한 것이고, 정사각형 모양들은 정배수체 남성 태아의 경우들을 표시한 것이다. 실선은 커버리지 깊이 및 GC 함량의 적합(fitting) 선이다
도 3은 염색체들을 그들의 고유한 상승 GC 함량에 따라 배열하므로써, 정규화된 커버리지 깊이와 대응 GC 함량간의 경향을 나타낸다. 본 명세서에서 각 염색체의 고유한 상승 GC 함량은 300개의 기준 경우들로부터 염색체의 서열화된 태그들의 평균 GC 함량을 의미한다.
도 4는 각 염색체에 대한 GC 부류의 상이한 조성들을 보여준다. 특정 기준 판독값들의 매 35bp 판독값의 GC 함량을 각 염색체에 대하여 계산하고, GC 함량을 36개 수준으로 분류하였으며, 각 수준의 백분율을 각 염색체의 조성 GC로서 계산하였다. 염색체들을 그 후 히트맵(heatmap)으로 그래프화하고 계층적으로 클러스터화하였다.
도 5는 서열분석기 선호(preference) 과정의 수동식 시뮬레이션에 의해, 서열분석 바이어스가 도 2에 나타낸 상관관계를 도입하는 것을 설명한다.
도 6은 서열화된 폴리뉴클레오티드 단편들의 총 수에 대하여 표준편차를 그래프화한 것이다. 150개 샘플들에서, 모든 염색체의 조절된 표준 분산은 특정 판독값 수치의 제곱근 역수와의 선형 관계를 나타낸다.
도 7은 식 3에 의해 계산된 모든 각 염색체의 잔기의 Q-Q 그래프들을 나타낸다. 선형 관계는 정규 분포로 표시된다.
도 8은 염색체 Y 커버리지 깊이의 막대그래프를 나타낸다. 각 경우들의 성별이 염색체 Y의 커버리지 깊이에 의해 구분될 수 있음을 의미하는 2개의 피크가 있다. 이 곡선은, 가우스 커널(Gaussian kernel)을 이용한 커널(kernel) 밀도 추정에 의해 추정된 염색체 Y의 상대적 커버리지 깊이의 분포이다.
도 9는 태아 염색체 이상에 대한 903개 시험 샘플들의 진단 과정의 도식을 나타낸다.
도 10은 염색체이수성의 결과를 나타낸다: 3염색체성 13, 18, 21 및 XO, XXY, XYY 경우들 및 정상의 경우들. 도 10A는 정규화된 커버리지 깊이 대 염색체들 13, 18 및 21의 GC 함량의 그래프를 나타낸다. 도 10B는 염색체 X 및 Y의 그래프들을 나타낸다. 원들은 GC 함량을 이용한 정상의 여성 태아들의 상대적 커버리지 깊이를 나타내고, 점들은 정상의 남성 태아들을 나타낸다. 실선은 상대적 커버리지 및 GC 함량의 적합 선이고, 끊어진 긴 선(dash lines)들은 t-값 절대값이 1이고, 점선들은 t-값의 절대값이 2이고, 점선-끊어진 긴 선(dotdash)들은 t-값의 절대값이 3이다.
도 11은 상이한 진단 방법들의 신뢰값을 비교한다.
도 12는 태아 DNA 분획 및 임신 기간간의 관계를 나타낸다. 모체 혈장 내 태아 DNA의 분획은 임신 기간에 상관된다. 태아 DNA 분획은 X 및 Y 모두에 의해 추정되었다. 평균 태아 DNA 분획 및 임신 기간간에는 통계적으로 유의한 상관관계가 있다 (P<0.001). R2 값은 상관 계수의 제곱이 작음을 나타낸다는 것에 유의하여야 한다. 최소 분획은 3.49%이다.
도 13은 표준 분산과 검출에 요구되는 경우의 수와의 관계를 나타낸다. 모든 염색체의 식 5에 의해 계산된 표준 분산들은 샘플들의 상이한 수에 따라 변화된다. 표준 분산은 샘플들의 수가 100보다 큰 경우 안정하게 된다.
도 14는 무세포 혈장 중 태아의 염색체이수성의 검출에 대한 특정 판독값들의 추정된 수를 태아 DNA 분획의 함수로서 나타낸다. 상기 추정치들은, 각각 상이한 길이를 갖는 염색체들 13, 18, 21 및 X, 심지어는 Y (X와 Y의 관계로부터)의 염색체이수성에 대해 3이상의 신뢰 t-값의 수준을 기초로 한다. 태아 DNA 분획 감소에 따라, 요구되는 샷건 서열들의 총 수는 증가된다. 플로우셀(flowcell) 상에서 채널 당 4백만 서열 판독값들의 서열분석 처리량(throughput)을 이용하여, 3염색체성 21은 무세포 DNA의 3.5%가 태아의 것인 경우 검출될 수 있다. 염색체 X의 염색체이수성은, 분획 및 특정 판독값들 수가 4% 및 500만 판독값과 같이 작은 경우, 쉽게 검출되지 않았다. 상이한 염색체는, 염색체의 GC 구조에 의해 유발될 수 있는, 태아 DNA 분획 및 특정 판독값 수의 상이한 수준을 필요로 하였다.
도 15는 여성 태아에 대한 염색체 13의 3염색체성 검출을 위하여, 매 임신 주수 및 매 시점에서의 데이터 부피에 대한, 데이터 부피 및 임신 기간(주수)에 의해 맵핑된 감도의 등고선그래프를 나타낸다.
도 16은 여성 태아들에 대한 염색체 18의 3염색체성의 검출을 위한 데이터 부피 및 임신 기간(주수)에 의해 맵핑된 감도의, 매 임신 주수 및 매 시점에서의 데이터 부피에 대한, 등고선 그래프를 나타낸다.
도 17은 여성 태아들에 대한 염색체 21의 3염색체성의 검출을 위하여, 데이터 부피와 임신 기간(주수)에 의해 맵핑된 감도의, 매 임신 주수 및 매 시점에서의 데이터 부피에 대한, 등고선 그래프를 나타낸다.
도 18은 여성 태아들에 대한 염색체 X의 3염색체성의 검출을 위하여, 데이터 부피와 임신 기간(주수)에 의해 맵핑된 감도의, 매 임신 주수 및 매 시점에서의 데이터 부피에 대한, 등고선 그래프를 나타낸다.
도 19는 남성의 염색체 13의 3염색체성의 검출을 위하여, 데이터 부피와 임신 기간(주수)에 의해 맵핑된 감도의 등고선 그래프를 나타낸다. 매 임신 주수 및 매 시점에서의 데이터 부피의 경우, 먼저 주어진 데이터 부피에 대한 태아 DNA 분획 및 표준 분산의 경험적 분산을 계산하고, XY 또는 Y에 의해 추정된 분획을 비교한 후, 모든 유형의 염색체 이수성의 감도를 계산하였다.
도 20은 남성의 염색체 18의 3염색체성의 검출을 위한, 데이터 부피와 임신 기간(주수)에 의해 맵핑된 감도의 등고선 그래프를 나타낸다.
도 21은 남성의 염색체 21의 3염색체성의 검출을 위한, 데이터 부피와 임신 기간(주수)에 의해 맵핑된 감도의 등고선 그래프를 나타낸다.
발명의 상세한 설명
본 발명은 모체의 생물학적 샘플로부터의 폴리뉴클레오티드 단편들의 대량 염기서열분석에 의한 태아의 유전자적 비정상의 비침습성 검출 방법에 관한 것이다. 본 발명은 나아가, 염색체의 커버리지 깊이와 대응 GC 함량간의 관계에 근거하여, 염색체의 GC 함량에서의 차이로 인한 서열분석 결과들로부터의 GC 바이어스를 제거하기 위한 방법을 제공한다. 따라서, 본 발명은 폴리뉴클레오티드 단편들의 GC 함량에 대한 각 샘플의 염색체의 커버리지 깊이를 적합화하기 위한 국소적으로 가중된 다항 회귀분석에 의해 GC 함량을 이용하여 스튜던트-t 계산에 이용되는 기준 파라미터들을 컴퓨터로 조절하는 방법을 제공한다.
또한, 본 발명은 통계학적 가설 시험을 이용한 통계학적 방법에 의하여 태아의 유전자적 비정상 결정 방법을 제공한다. 추가적으로, 소정의 통계학적 유의 수준에 대하여 요구되는 임상 샘플들의 양을 결정하는데 유용한 데이터 품질 관리(DQC) 표준들을 계산하기 위한 방법들이 제공된다.
I. 정의
달리 정의되지 않는 경우, 본 명세서에서 사용된 모든 기술 및 과학 용어들은 본 발명이 속하는 기술 분야의 당업자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본 명세서에서 참조된 모든 특허, 출원, 공개 출원들 및 기타 간행물들은 그 전체로서 참고문헌으로서 본 명세서에 통합된다. 본 섹션에서 설명된 정의가, 참고로서 본 명세서에 통합된 특허, 출원들, 공개 출원들 및 기타 간행물들에서 설명된 정의와 상반되거나 또다르게는 그와 일치하지 않는 경우, 본 섹션에 설명된 정의가 참고문헌으로서 본 명세서에 통합된 정의보다 앞서 해석된다.
본 명세서에서 사용된 것과 같은, 단수 형태들 "a", "an"(하나) 및 "the"(그) 라는 표현은, 달리 나타내지 않는 경우 복수의 참조들을 포함한다. 예로서, "a(하나)"의 2량체는 하나 이상의 2량체들을 포함한다.
"염색체 이상"이라는 용어는 대상 염색체와 정상의 동종성 염색체 구조 간의 편차를 의미한다. "정상"이라는 용어는 특정 종의 건강한 개체들에서 나타나는 주(predominant) 핵체(karyotype) 또는 밴딩(banding) 패턴을 의미한다. 염색체 이상은 수적인 이상 또는 구조적 이상일 수 있으며, 이에 제한되지는 않지만, 염색체이수성, 염색체이수성, 배수성(polyploidy), 역위(inversion), 3염색체성, 1염색체성(monosomy), 중복(duplication), 결실, 염색체의 부분 결실, 부가, 염색체의 부분 부가, 삽입, 염색체의 단편, 염색체의 영역, 염색체의 재배열 및 전좌(translocation)를 포함한다. 염색체 이상은 병리학적 조건의 존재 또는 병리학적 조건 발달에 대한 경향과 상관될 수 있다. 본 명세서에서 정의된 바와 같이, 단일의 뉴클레오티드 다형성("SNP")은 염색체 이상이 아니다.
1염색체성 X (XO, 하나의 X 염색체 전체의 부재)는, 살아서 태어난 여아 2500명 중 1명 내지는 3000명 중 1명 꼴로 발생하는, 터너 증후군의 가장 흔한 유형이다 (Sybert and McCauley N Engl J Med (2004) 351:1227~1238). XXY 증후군은, 대략 남성 1000명 중 1명 꼴로 존재하는, 인간 남성들이 추가의 X 염색체를 갖는 증상이다 (Bock, Understanding Klinefelter Syndrome: A Guide for XXY Males and Their Families. NIH Pub. No. 93~3202 (1993)). XYY 증후군은, 인간 남성이 추가의 Y 염색체를 갖는 성 염색체들의 염색체이수성으로, 총 염색체 수가 일반적인 46인 대신 총 47개가 되며, 이는 출생 남아 1000명 당 중 1명 꼴로 발생하고 잠재적으로 남성 불임을 일으킨다 (Aksglaede, 등, J Clin Endocrinol Metab (2008) 93:169~176).
터너 증후군은 몇몇 상태들을 포괄하는데, 이들 중 1염색체성 X (XO, 한개의 성염색체 전체의 부재, 바소체(Barr body)가 가장 흔하다. 전형적인 여성들은 2개의 X 염색체들을 갖는데, 터너 증후군에서는 이들 성염색체들 중 하나가 없다. 이는 2000분의 1 내지 5000분의 1의 표현형으로 여성들에서 일어나며, 이 증후군은 다양한 방식으로 나타난다. 클라인펠터(Klinefelter) 증후군은 인간 남성이 추가의 X 염색체를 갖는 상태이다. 인간에서, 클라인펠터 증후군은 가장 흔한 성염색체 질환으로, 추가 염색체들의 존재에 의해 유발되는 두번째로 가장 흔한 질환이다. 이러한 상태는 대략적으로 남성 1000명 중 한명 꼴로 존재한다. XYY 증후군은 성염색체들의 염색체이수성으로, 여기에서 인간 남성은 추가의 Y 염색체를 가져, 염색체 수가 일반적인 46이 아닌 총 47개이다. 이는 47, XYY 핵형을 생성한다. 이 상태는 일반적으로 자각증상이 없으며, 남성 1000명 중 1명에 일어나는 한편, 잠재적으로 남성 불임을 일으킨다.
3염색체성 13 (파타우 증후군(Patau syndrome)), 3염색체성 18 (에드워드 증후군(Edward syndrome)) 및 3염색체성 21 (다운 증후군(Down syndrome))은 임상적으로 가장 중요한 상염색체 3염색체성이며, 이들의 검출 방법은 언제나 화제가 되어왔다. 상기 태아 염색체 이상형(abberration)의 검출은 태아기 진단에서 매우 중요하다 (Ostler, Diseases of the eye and skin: a color atlas. Lippincott Williams & Wilkins. pp. 72. ISBN 9780781749992 (2004); Driscoll and Gross N Engl J Med (2009) 360: 2556~2562; Kagan, 등, Human Reproduction (2008) 23:1968~1975).
"특정 기준 판독값들(reference unique reads)"이라는 용어는 특정 서열을 갖는 염색체의 단편들을 의미한다. 따라서, 그러한 단편들은 하나의 염색체 위치에 명확하게 지정될 수 있다. 염색체의 특정 기준 판독값들은, hg18 또는 hg19와 같은 간행된 기준 게놈 서열에 근거하여 구축될 수 있다.
"폴리뉴클레오티드", "올리고뉴클레오티드", "핵산" 및 "핵산 분자"라는 용어는 임의의 길이의 뉴클레오티드들의 중합체 형태를 의미하기 위하여 본 명세서에서 상호교환가능하게 사용되며, 리보뉴클레오티드들, 데옥시리보뉴클레오티드들, 이들의 유사체들 또는 혼합물들을 포함할 수 있다. 이러한 용어는 분자의 1차구조만을 의미한다. 따라서, 상기 용어는 3중-, 2중- 및 단일-가닥 데옥시리보핵산 ("DNA"), 및 3중-, 2중- 및 단일-가닥 리보핵산("RNA")을 포함한다. 이는 알킬화 및/또는 캡핑(capping)에 의해 변경된, 그리고 변경되지 않은 형태의 폴리뉴클레오티드도 포함한다. 보다 구체적으로, "폴리뉴클레오티드", "올리고뉴클레오티드", "핵산" 및 "핵산 분자"라는 용어들은, 폴리데옥시리보뉴클레오티드들 (2-데옥시-D-리보오스 포함), tRNA, rRNA, hRNA 및 mRNA를 포함하는 폴리리보뉴클레오티드들 (D-리보오스 포함), 스플라이싱 여부에 관계없이, 퓨린 또는 피리미딘 염기의 N- 또는 C-글리코시드인 임의의 기타 유형의 폴리뉴클레오티드 및 노르뉴클레오티드성 뼈대(backbone)을 포함하는 기타 중합체들, 예로서 폴리아미드 (예로서, 펩티드 핵산들("PNAs")) 및 폴리모르폴리노 (Anti-Virals, Inc., Corvallis, OR.에서 NeuGene®로서 상업적으로 구매가능) 중합체들, 및 기타 합성 서열-특이적 핵산 중합체들을 포함하며, 단 상기 중합체들은 DNA 및 RNA에서 발견되는 것과 같은 염기쌍 및 염기 스태킹(stacking)을 가능하게 하는 구조의 뉴클레오염기들(nucleobases)을 포함한다. 따라서, 이들 용어들은 예로서 3'-데옥시-2',5'-DNA, 올리고데옥시리보뉴클레오티드 N3' 내지 P5' 포스포아미데이트들, 2'-O-알킬-치환된 RNA, DNA와 RNA간의 잡종들 또는 PNAs와 DNA 또는 RNA간의 잡종들을 포함하며, 알려진 유형의 변경들, 예로서 유사체를 갖는 하나 이상의 뉴클레오티드들의 라벨, 알킬화, "캡들(caps)" 치환; 뉴클레오티드간(internucleotide) 변경들, 예컨대 비하전된 연결들을 갖는 것들 (예로서, 메틸 포스포네이트들, 포스포트리에스테르들, 포스포아미데이트들, 카르바메이트들 등), 음으로 하전된 연결들을 갖는 것들 (예로서, 포스포로티오에이트들, 포스포로디티오에이트들, 등) 및 양으로 하전된 연결들을 갖는 것들(예로서, 아미노알킬포스포로아미데이트들, 아미노알킬포스포로트리에스테르들); 펜던트(pendant) 부분들을 함유하는 것들, 예로서 단백질들(효소 (예로서, 뉴클레아제들), 독소들, 항체들, 신호 펩티드들, 폴리-L-리신 등 포함); 삽입물들(intercalators)을 갖는 것들 (예로서, 아크리딘, 소랄렌(psoralen), 등), 킬레이트들을 포함하는 것들 (예로서, 금속들, 방사성 금속들, 보론, 산화 금속들, 등), 알킬레이터들을 포함하는 것들, 변경된 연결들을 갖는 것들 (예로서, 알파 아노머 핵산들 등), 및 폴리뉴클레오티드 또는 올리고뉴클레오티드의 비변경된 형태들을 포함한다.
"대규모 병렬 염기서열분석"은 핵산들의 수백만 단편들의 서열분석을 위한 기술들, 예로서 랜덤하게 단편화된 게놈 DNA의, 평면적이고 광학적으로 투명한 표면으로의 부착 및 각각 제곱 cm 당 주형 ~1,000 복제물들을 각각 포함하는 수백만의 클러스터들을 갖는 고밀도 서열분석 플로우 셀 창출을 위한 고체상 증폭을 이용하는 기술들을 의미한다. 이들 주형들은 4-색 DNA 합성에의한 서열분석(sequencing-by-synthesis) 기술을 이용하여 서열분석된다. Illumina, Inc., San Diego, Calif에 의해 제공되는 제품들 참조. 현재 이용되는 서열분석은 바람직하게는 예비증폭 또는 클로닝 단계 없이 실시되지만, PCR 및 현미경적 주형-기재 서열분석에 대한 반응 챔버들을 갖는 마이크로유체 칩 중에서 증폭에 기초한 방법들과 조합될 수 있다. 특정 인간 염색체에 속하는 것으로서 서열을 확인하기 위해서는 랜덤 서열 정보의 단지 약 30개만이 요구된다. 보다 긴 서열들은 더욱 특정의 타겟들을 독특하게 확인할 수 있다. 본 경우에서는, 다수의 35bp 판독값들이 수득되었다. 대규모 병렬 염기서열분석 방법의 추가적인 설명은 Rogers and Ventner, Nature (2005) 437:326~327에서 찾을 수 있다.
여기 사용된 것과 같은, "생물학적 샘플"이라는 용어는 생물체 또는 바이러스원 또는 거대분자들 및 생분자들의 기타 공급원으로부터 수득되는 임의의 샘플을 의미하고, 핵산 또는 단백질 또는 기타 거대분자가 수득될 수 있는 대상의 임의의 세포 유형 또는 조직을 포함한다. 상기 생물학적 샘플은 생물학적 공급원 또는 가공된 샘플로부터 직접 수득된 샘플일 수 있다. 예로서, 증폭된 분리된 핵산들은 생물학적 샘플을 구성한다. 생물학적 샘플들은, 이에 제한되지는 않지만, 혈액, 혈장, 혈청, 뇌척수액, 활액(synovial fluid), 소변 및 땀과 같은 체액들, 동물 및 식물로부터의 조직 및 기관 샘플들 및 그로부터 유도된 가공된 샘플들을 포함한다.
본 명세서에서 설명된 본 발명의 측면들 및 구체예들은 측면들 및 실시예들로 "이루어지고/거나", "본질적으로 이루어지는" 것으로 이해되어야 한다.
본 발명의 기타 목적들, 장점들 및 특징들은 첨부되는 도면들과 함께 하기 명세서 내용으로부터 명백하여질 것이다.
II. 커버리지 깊이 및 GC 함량간의 관계 수립
본 발명은 염색체의 커버리지 깊이 및 GC 함량간의 관계 수립 방법을 제공하며, 상기 방법은 다음 단계들을 포함한다: 하나 이상의 샘플로부터 상기 염색체 및 또다른 하나의 염색체를 망라하는(covering) 다수의 폴리뉴클레오티드 단편들의 서열정보를 수득하는 단계; 상기 서열정보에 근거하여, 상기 단편들을 염색체들에 지정하는 단계; 각 샘플에 대한 상기 서열정보에 근거하여 커버리지 깊이 및 GC 함량을 계산하는 단계; 및 상기 염색체의 커버리지 깊이 및 GC 함량간의 관계를 결정하는 단계. 상기 단계들의 조작은 특정 순서없이 실시될 수 있다. 일부 구체예들에서, 상기 방법은 다음 순서로 실시될 수 있다: a) 하나의 샘플로부터 상기 염색체 및 또다른 염색체를 망라하는 다수의 폴리뉴클레오티드 단편들의 서열정보를 수득하는 단계; b) 상기 서열정보에 근거하여 상기 단편들을 염색체들에 지정하는 단계; c) 상기 서열정보에 근거하여 각 샘플에 대한 커버리지 깊이 및 GC 함량을 계산하는 단계; d) 상기 염색체의 커버리지 깊이 및 GC 함량간의 관계를 결정하는 단계.
염색체 위치의 커버리지 깊이와 GC 함량을 계산하기 위해서는, 폴리뉴클레오티드 단편들의 서열 정보는 샘플로부터 선택된 주형 DNA의 서열분석에 의해 수득된다. 한 구체예에서, 상기 주형 DNA는 모체의 DNA 및 태아 DNA를 포함한다. 또다른 구체예에서, 주형 DNA는 임신 여성의 혈액으로부터 수득된다. 혈액은, 이에 제한되지는 않지만, 정맥천자(venipuncture)를 포함하는 혈액 인출을 위한 임의의 표준 기술을 사용하여 수집될 수 있다. 예로서, 혈액은 팔꿈치 안쪽 또는 손등의 정맥으로부터 인출될 수 있다. 혈액 샘플들은 태아 임신기간 중 임의의 시기에 임신 여성으로부터 수집될 수 있다. 예로서, 혈액 샘플들은 태아 임신 1~4, 4~8, 8~12, 12~16, 16~20, 20~24, 24~28, 28~32, 32~36, 36~40 또는 40~44주에, 바람직하게는 태아 임신 8~28주 사이에 인간 여성으로부터 수집될 수 있다.
상기 폴리뉴클레오티드 단편들은 서열 정보에 근거한 염색체 위치에 지정된다. 기준 게놈 서열은 특정 기준 판독값들을 수득하는데 사용된다. 거기 사용된 것과 같은, "특정 기준 판독값들"이라는 용어는 기준 게놈 서열에 근거한 특정 게놈 위치에 지정된 모든 특정의 폴리뉴클레오티드 단편들을 의미한다. 일부 구체예들에서, 특정 기준 판독값들은, 예로서 약 10, 12, 15, 20, 25, 30, 35, 40, 50, 100, 200, 300, 500 또는 1000 bp의 동일한 길이를 갖는다. 일부 다른 구체예들에서, 인간 게놈 구축물들 hg18 또는 hg 19는 기준 게놈 서열로서 사용될 수 있다. 염색체 위치는 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10,000 KB이상의 길이를 갖는 염색체 상의 연속적인 범위일 수 있다. 염색체 위치는 단일 염색체일 수도 있다.
여기 사용된 것과 같이, "커버리지 깊이"는, 하기 식을 이용하여, 염색체 위치에 지정되는 단편들의 수와 염색체 위치의 특정 기준 판독값들의 수 간의 비율을 의미한다:
Figure 112012109734663-pct00025
(1)
식 중, n i,j 는 샘플 i 중 염색체 j에 맵핑된 특정 서열 판독값들의 수이고; C i,j 는 샘플 i 중 염색에 j에서의 커버리지 깊이이고; N j 는 염색체 j 중 특정 기준 판독값들의 수이다.
일부 구체예들에서, 하나의 염색체 위치에 지정되지 않거나 다수의 염색체 위치들에 지정되는 폴리뉴클레오티드 단편들은 폐기된다. 일부 구체예들에서, 커버리지 깊이는, 또다른 염색체 위치의 커버리지 깊이, 또다른 염색체, 모든 다른 상염색체들의 평균, 또는 모든 염색체들의 평균에 근거하여, 정규화된다. 일부 구체예들에서, 22 상염색체들의 평균 커버리지 깊이는 상이한 샘플들에 대하여 수득된 서열 판독값들의 총 수에서의 차이점들을 고려하기 위한 정규화 상수로서 사용된다:
Figure 112012109734663-pct00026
(2)
식 중, cri,j는 샘플 i 중의 염색체 j의 상대적인 커버리지 깊이를 의미한다. 앞으로, 각 염색체에 대한 "상대 커버리지 깊이"는 정규화된 값을 의미하고, 상이한 샘플들의 비교 및 이후의 분석에 사용된다.
염색체 위치의 GC 함량은, 염색체 위치에서의 특정 기준 판독값들에 근거하여, 또는 염색체 위치에 지정되는 서열분석된 폴리뉴클레오티드 단편들에 근거하여 염색체 위치의 평균 GC 백분율에 의해 계산될 수 있다. 염색체의 GC 함량은 하기 식을 이용하여 계산될 수 있다:
Figure 112012109734663-pct00027
(3).
Figure 112012109734663-pct00028

식 중, i는 샘플 i를 나타내고; j는 염색체 j를 나타내고; NGCi,j는 DNA 염기들의 G 및 C 수를 나타내고, BASEi.j는 샘플 i 중 염색체 j 상의 DNA 염기들의 수를 나타낸다.
상기 커버리지 깊이 및 GC 함량은 단일 샘플 또는 다수의 샘플들로부터 수득된 폴리뉴클레오티드 단편들의 서열정보에 근거할 것일 수 있다. 염색체 위치의 커버리지 깊이와 GC 함량 간의 관계를 수립하기 위하여, 상기 계산은 적어도 1, 2, 5, 10, 20, 50, 100, 200, 500 또는 1000 샘플들로부터 수득된 폴리뉴클레오티드 단편들의 서열정보에 근거한 것일 수 있다.
일부 구체예들에서, 커버리지 깊이와 GC 함량 간의 관계는 비강성 선형 관계이다. 뢰스 알고리즘 또는 국소적으로 가중된 다항 회귀분석을 사용하여, 커버리지 깊이와 GC 함량간과 같이, 짝을 이루는 값들 간의 비선형 관계(상관)을 평가할 수 있다.
III. 태아의 유전학적 이상의 결정
본 발명은 태아의 유전학적 이상 결정방법을 제공하며, 상기 방법은 다음 단계들을 포함한다: a) 하나의 샘플로부터 다수의 폴리뉴클레오티드 단편들의 서열정보를 수득하는 단계; b) 상기 서열정보에 근거하여 상기 단편들을 염색체들에 지정하는 단계; c) 상기 서열정보에 근거하여 염색체의 커버리지 깊이 및 GC 함량을 계산하는 단계; d) 상기 염색체의 상기 GC 함량을 이용하여 상기 염색체의 적합화된 커버리지 깊이 및 상기 염색체의 커버리지 깊이 및 GC 함량간의 수립된 관계를 계산하는 단계; 및 e) 상기 적합화된 커버리지 깊이를 상기 염색체의 상기 커버리지 깊이에 비교하는 단계로, 여기에서 이들간의 차이는 태아 유전학적 이상을 나타낸다.
상기 방법들은 태아의 염색체 이상들을 검출하는데 사용될 수 있으며, 특히 염색체이수성, 배수성, 1염색체성, 3염색체성, 3염색체성 21, 3염색체성 13, 3염색체성 14, 3염색체성 15, 3염색체성 16, 3염색체성 18, 3염색체성 22, 3배성, 4배성 및 XO, XXY, XYY 및 XXX을 포함하는 성염색체 이상의 검출에 유용하다. 부분적인 1염색체성들 및 부분적인 3염색체성들을 확인하기 위하여, 본 방법에 따라 인간 게놈 내의 특정 영역들에 중점을 둘 수도 있다. 예로서, 본 방법들은 염색체를 건너 펼쳐진 연속된 비중복(nonoverlapping) 50Kb 영역들과 같은, 규정된 염색체 슬라이딩 (sliding) 범위에서의 서열 데이터 분석을 포함할 수 있다. 다른것들 중, 부분적인 3염색체성의 13q, 8p (8p23.1), 7q, 원위 6p, 5p, 3q (3q25.1), 2q, 1q (1q42.1 및 1q21-qter), 부분적인 Xpand 1염색체성 4q35.1가 보고되어 왔다. 예로서, 염색체 18의 긴 암(arm)의 부분 복제물들은, 18q21.1-qter의 복제의 경우에, 에드워드 증후군을 결과로서 일으킬 수 있다(Mewar, 등, Am J Hum Genet. (1993) 53:1269~78).
일부 구체예들에서, 태아의 분획은, 샘플로부터의 폴리뉴클레오티드 단편들에 대해 수득된 서열정보에 근거하여 추정된다. 염색체 X 및 Y의 상기 커버리지 깊이 및 GC 함량이 태아 분획 추정에 사용될 수 있다. 일부 구체예들에서, 태아의 성별은, 샘플로부터의 폴리뉴클레오티드 단편들에 대해 수득된 서열정보에 근거하여 결정된다. 염색체 X 및 Y의 커버리지 깊이 및 GC 함량은 태아 성별 결정에 사용될 수 있다.
일부 구체예들에서, 염색에의 상기 커버리지 깊이에 대한 상기 적합화된 커버리지 깊이의 비교는 통계학적 가설 시험에 의해 수행되며, 여기에서 하나의 가설은 태아가 정배수체 (H0)이고, 다른 하나의 가설은 태아가 이수체 (H1)라는 것이다. 일부 구체예들에서, 상기 스튜던트 t-통계는 두 가설들 모두에 대하여 각각 t1 및 t2로서 계산된다. 일부 구체예들에서, t1과 t2의 로그 유사 비율이 계산된다. 일부 구체예들에서, >1의 로그 유사 비율은 태아의 3염색체성을 나타낸다.
IV. 태아 유전학적 이상의 진단을 위한 컴퓨터 판독 방법 및 시스템
또다른 측면에서, 본 발명은 태아 유전학적 이상의 태아기 진단을 수행하기 위한 복수의 지시사항들을 포함하는 컴퓨터 판독 방법을 제공하며, 이는 다음 단계들을 포함한다: a) 상기 서열정보를 수령하는 단계; b) 상기 서열 정보에 근거하여 상기 폴리뉴클레오티드 단편들을 염색체들에 지정하는 단계; c) 상기 서열정보에 근거하여 상기 염색체의 커버리지 깊이와 GC 함량을 계산하는 단계; d) 상기 염색체의 상기 GC 함량 및 상기 염색체의 커버리지 깊이와 GC 함량과의 수립된 관계를 이용하여 상기 염색체의 적합화된 커버리지 깊이를 계산하는 단계; 및 e) 상기 적합화된 커버리지 깊이를 상기 염색체의 상기 커버리지 깊이에 대해 비교하는 단계로, 여기에서 이들 간의 차이는 유전학적 이상을 나타낸다.
또다른 측면에서, 본 발명은 태아의 염색체이수성 결정을 위한 시스템을 제공하며, 이는 다음 방법들을 포함한다: a) 상기 폴리뉴클레오티드 단편들로부터 서열정보를 수득하기 위한 방법; 및 b) 태아의 유전학적 이상의 태아기 진단을 수행하기 위한 다수의 지시사항들을 포함하는 컴퓨터 판독 방법. 일부 구체예들에서, 상기 시스템은 임신한 여성 대상자로부터 수득된 생물학적 샘플을 더 포함하며, 여기에서 상기 생물학적 샘플은 다수의 폴리뉴클레오티드 단편들을 포함한다.
다수의 상이한 서열분석 방법들 및 변형들이 사용될 수 있음이 당업자에게는 명백할 것이다. 한 구체예에서, 서열분석은 대규모 병렬 염기서열분석을 이용하여 수행된다. 대규모 병렬 염기서열분석, 예컨대 454 플랫폼(platform) (Margulies, 등, Nature (2005) 437:376~380), Illumina Genome Analyzer (또는 Solexa™ platform) 또는 SOLiD (Applied Biosystems) 또는 Helicos True Single Molecule DNA 서열분석 기술 (Harris, 등, Science (2008) 320:106~109), Pacific Biosciences의 단일 분자, 실시간(SMRT™) 기술 및 나노포어 서열분석 (Soni and Meller, Clin Chem (2007) 53:1996~2001) 상에서 가능한 대규모 병렬 염기서열분석은 표본으로부터 분리된 많은 핵산 분자들의 서열분석을 병렬 방식의 높은 차수의 멀티플렉싱(multiplexing)으로 가능하게 한다 (Dear, Brief Funct Genomic Proteomic (2003) 1:397~416). 이들 플랫폼들 각각은 핵산 단편들의 클론적으로 확장된 또는 증폭되지 않은 단일 분자들을 서열화한다. 상업적으로 입수가능한 서열분석 기기를 사용하여 폴리뉴클레오티드 단편들의 서열정보를 수득할 수 있다.
V. 실시예들
하기 실시예들은 본 발명을 상술하기 위하여 제공되나, 본 발명이 이에 제한되는 것은 아니다.
실시예 1 검출 감도에 영향을 미치는 인자들의 분석: GC -바이어스 및 성별
커버리지 깊이와 GC 함량을 계산하기 위한 도식적 절차의 기초구성을 도 1에 나타내었다. 본 발명자들은 hg18 기준 서열들을 l-머(l-mer) (여기에서 l-머는 샘플 서열분석 판독값들과 동일한 "l" 길이를 갖는 인간 서열 기준으로부터 인공적으로 분해된 판독값이다)로 절개함에 의해 특정 기준 판독값들을 생성하기 위하여 소프트웨어를 사용하였으며, "특정" l-머를 특정 기준 판독값들로 모았다. 두번째로, 본 발명자들은 각 염색체의 특정 기준 판독값들에 대하여 본 발명자들의 서열분석된 샘플 판독값들을 맵핑하였다. 세번째로, 명확한 데이터 세트를 얻기 위하여 5분위수 이상점 컷오프(quintile outlier cutoff) 방법을 적용하여 이상점을 제거하였다. 마지막으로, 본 발명자들은 모든 각 샘플에 대한 각 염색체의 커버리지 깊이 및 모든 각 샘플에 대한 각 염색체에 대하여 맵핑된 서열분석된 특정 판독값들의 GC 함량을 계산하였다.
GC 함량이 본 발명자들의 데이터에 어떻게 영향을 미치는지 연구하기 위하여, 본 발명자들은 핵체 결과를 갖는 300개의 정배수체 경우들을 선택하고, 그들의 커버리지 깊이 및 서열화된 판독값들의 관련 GC 함량을 그래프로 분산시켜 나타내었으며, 이는 이들 간에 강한 상관관계가 있음을 나타내었고, 이러한 현상은 이전에는 보고되지 않았었다 (도 2). 도 2에서, 커버리지 깊이는 GC-함량과 강하게 상관되어 있으며, 4, 13, 등과 같은 일부 염색체들에서 명백한 하향(downward) 경향을 보인 한편, 19, 22, 등과 같은 다른 염색체들에서는 상향 경향을 나타내었다. 모든 염색체들을 그들의 고유 GC-함량에 의하여 오름차순으로 배열하였으며, 하향 경향은 보다 낮은 GC-함량군 염색체들에서 존재한 한편, 도 3에 나타낸 것과 같이 보다 높은 GC-함량군 염색체들에서는 상향 경향이 나타났다. 하나의 샘플에 대해 서열분석되는 폴리뉴클레오티드 단편들이 다른 샘플보다 더 높은 GC-함량을 갖는 경우, 이 샘플을 나타내는 커버리지 깊이는 보다 낮은 GC-함량군 염색체들 중 다른 샘플의 커버리지 깊이에 비하여 떨어질 것이며, 반면 보다 높은 GC-함량군 염색체들 중에서는 상승할 것으로 해석될 수 있다.
상이한 GC-함량 염색체들 중에서의 이러한 상이한 변화 경향에 대한 가능한 설명은, 서열분석 공정 내에 도입된 GC-바이어스와 조합된 도 4에 나타낸 상이한 염색체들 중 GC-함량 조성에서의 차이들이다. 각 염색체에 대한 모든 35-머(35-mer) 특정 기준 판독값들의 GC 함량은 GC 함량을 36 수준으로 분류하는데 사용되었다. 각 염색체의 조성 GC로서 각 수준의 백분율을 계산한 후, Heatmap2 소프트웨어를 이용하여 히트맵을 그리는데 사용하였다. 염색체 13을 예로 들면, 이의 큰 부분은 보다 낮은 GC-함량 서열 절편들로 이루어지고, 이의 보다 작은 부분은 높은 GC-함량 서열 절편들로 이루어진다. 서열분석 또는 PCR 과정 동안의 조건이 보다 높은 GC-함량을 갖는 절편 서열화를 선호하는 경우, 낮은 GC-함량을 갖는 염색체 13의 상대적으로 큰 부분은, 이 샘플의 염색체 13에서 커버리지 깊이가 더욱 낮아지게 되는 결과와 함께 서열화되기 어려울 것이다. 비교하여 보면, 염색체 19와 같은 보다 높은 GC-함량에서, 이 샘플의 염색체 19에서의 커버리지 깊이는 염색체 19의 보다 큰 부분이 서열분석기가 선호하는 보다 높은 GC-함량이었던 것에 대해 보다 더 높아진다. 어떤 염색체에서든, GC-부족(GC-poor) 및 GC-풍부(GC-rich) 절편들은 서열화되기 어렵지만, GC-바이어스에 의해 도입된 영향은 상이한 GC-함량 조성을 갖는 상이한 염색체들과 상이하였다. 모든 기준 염색체는 1KB 빈들(bins)로 나누어졌으며, 각 빈에서 특정 기준 판독값의 GC 함량이 계산되었다. 0.001의 단계 크기(step size)에 의해 나누어진 적절한 간격 형태 [0.3, 0.6] 에서 각 빈의 GC 함량, 및 매 간격에서 상대 커버리지가 계산되었다. 도 5는 상대적 커버리지 및 각 염색체에 대한 GC 함량의 그래프들을 나타낸다.
데이터에 대한 태아 성별의 영향을, 독립 표본 T검정(independent two-sample t-test)을 이용하여 분석하였다. 대략 동일한 GC 함량에서 성염색체들을 제외하고 상염색체들간에 유의차는 발견되지 않았지만, 남성과 여성간의 UR%에서는 명백한 차이가 있었으며 (Chiu 등, (2008) Proc Natl Acad Sci USA 105:20458~20463), 이는 상염색체 염색체이수성을 검출하고자 할 때는 태아 성별을 구분할 필요가 없으나, XO, XYY 등과 같은 성염색체 염색체이수성을 검출하고자 할 때는 태아 성별을 먼저 구분하는 것이 필요함을 암시한다.
실시예 2 통계 모델
상기 논의된 현상을 이용하여, 본 발명자들은 커버리지 깊이와 대응 GC 함량간의 관계를 적합화하기 위하여 국소 다항식을 이용하여 보았다. 커버리지 깊이는 다음 식과 같이, GC의 함수 및 정상 분포의 나머지로 이루어진다:
cr i,j = f(GC i,j ) + ε i,j ,j = 1,2,..., 22, X, Y (4)
식 중, f(GC i,j )는 샘플 i, 염색체 j의 커버리지 깊이와 대응 GC 함량 간의 관계에 대한 함수를 나타내고, ε i,j 는 샘플 i, 염색체 j의 나머지를 나타낸다.
상기 커버리지 깊이와 대응 GC 함량 간에는 비강성 선형 관계가 있으며, 따라서 본 발명자들은 커버리지 깊이를 대응 GC 함량을 이용하여 적합화하기 위하여 뢰스 알고리즘을 적용하였으며, 그로부터 본 모델에 중요한 값인, 적합화된 커버리지 깊이를 계산하였다:
Figure 112012109734663-pct00029
(5)
적합화된 커버리지 깊이를 이용하여, 표준분산 및 스튜던트 t를 하기 식 6 및 7에 따라 계산하였다:
Figure 112012109734663-pct00030
(6)
Figure 112012109734663-pct00031
(7)
실시예 3 태아 분획 추정
태아 분획은 본 검출에 매우 중요하기 때문에, 시험 절차 전에 태아 분획을 추정하였다. 이전에 언급한 것과 같이, 본 발명자들은 19개의 성인 남성들에 대한 서열분석을 하였으며, 그들의 커버리지 깊이를 여성 태아를 갖는 경우들의 커버리지 깊이와 비교하였을 때, 남성의 염색체 X의 커버리지 깊이는 여성의 경우에 비해 거의 1/2배였으며, 남성의 염색체 Y의 커버리지 깊이는 여성의 경우에 비해 거의 0.5 더 크다는 것을 발견하였다. 그 후, 하기 식 8, 9 및 10으로서, GC-상관관계를 고려하며, 염색체 X와 Y의 커버리지 깊이에 따른 태아 분획을 추정할 수 있었다:
Figure 112012109734663-pct00032
식 중,
Figure 112012109734663-pct00033
는 여성 태아를 갖는 경우들의 염색체 X 커버리지 깊이와 대응 GC 함량의 회귀분석 상관관계에 의한 적합화된 커버리지 깊이이고,
Figure 112012109734663-pct00034
는 여성 태아를 갖는 경우들의 염색체 X 커버리지 깊이와 대응 GC 함량의 회귀분석 상관관계에 의한 적합화된 커버리지 깊이이며,
Figure 112012109734663-pct00035
는 성인 남성의 염색체 X 커버리지 깊이와 대응 GC 함량의 회귀분석 상관관계에 의한 적합화된 커버리지 깊이를 의미하며,
Figure 112012109734663-pct00036
는 성인 남성의 염색체 Y 커버리지 깊이와 대응 GC 함량의 회귀분석 상관관계에 의한 적합화된 커버리지 깊이를 의미한다. 간단한 계산을 위하여,
Figure 112012109734663-pct00037
Figure 112012109734663-pct00038
은 동일하며,
Figure 112012109734663-pct00039
Figure 112012109734663-pct00040
는 동일하다.
실시예 4 모든 염색체의 나머지의 계산
도 6은, 특정 판독값들의 소정의 총 수 하에서 모든 염색체에 대한 표준편차 (식 3 참조)는 관여하는 기준의 경우들 수에 의해 영향을 받음을 보여준다. 170만의 총 특정 판독값들 수가 각 경우에 대해 서열분석되는 조건 하에서, 선택된 경우들 수가 150을 넘는 경우, 표준편차는 잘 증가하지 않는다. 그러나, 표준편차가 상이한 염색체들에 대해 상이한 경우, GC-바이어스를 고려 후, 본 방법은 염색체 13 (0.0063), 염색체 18 (0.0066) 및 염색체 21(0.0072)에 대하여 적당한(moderate) 표준편차를 가졌다. 염색체 X의 표준편차는 상기 언급된 염색체들보다 더 높으며, 이는 정확한 비정상 검출을 수행하기 위해 방법들을 더 요구할 수 있다.
도 7은 Q-Q 그래프를 나타내며, 여기에서 나머지는 스튜던트-t 계산이 적절함을 암시하는 정상 분포로 집계된다.
실시예 5 태아 성별의 구별
성염색체 질환을 발견하기 위해서는, 태아 성별을 구별하는 것이 최선이다. 본 발명자들이 300가지 경우들에서 Y 염색체의 커버리지 깊이의 빈도 분포를 연구하였을 때 2가지 확실한 피크들이 나타났는데, 이는 Y 염색체의 커버리지 깊이에 의해 성별을 구분하는 힌트를 제공하였다. 도 8에서와 같이, 0.04 미만의 커버리지 깊이를 갖는 경우들은 여성 태아를 갖는 것으로 간주될 수 있으며, 0.051이 넘는 경우 남성 태아를 갖는 것으로 간주될 수 있고, 0.04와 0.051 사이의 경우는 성별이 불확실한 것으로 여겨진다. 이들 성별의 모호함과 염색체이수성의 경우들에 있어서, 기호논리학적(logistic) 회귀분석을 사용하여 하기 식 11과 같이 성별을 예측하였다(Fan, 등, Proc Natl Acad Sci USA (2008) 42:16266~16271):
Figure 112012109734663-pct00041
(11)
식 중, cr.a i,x cr.a i,y 는 각각 X 및 Y의 정규화된 상대 커버리지이다.
핵형 결과 비교시, 태아 성별 구분을 위한 본 발명자들의 방법은 본 발명자들의 300개 기준 경우들에서 100%의 정확도로 상당히 잘 수행되었으나, 901개 경우들에서 실시한 경우 하나의 경우는 실수가 있었으며, 이 잘못된 경우의 Y 염색체의 커버리지 깊이는 0.04 내지 0.051 사이였다.
실시예 6 GC -상관 t-시험 방법의 진단 수행
샘플 보충(recuritment)
903명의 참가자들을 그들의 핵형 결과들을 이용하여 Shenzhen People's Hospital과 Shenzhen Maternal and child care service center로부터 보충하였다. 각 채용 사이트의 제도 리뷰 보드들로부터 인가를 받았으며, 모든 참가자들은 서면의 정보제공 동의를 제공하였다. 혈액 샘플링 시, 모체 연령 및 임신 기간을 기록하였다. 903개 경우들은 2개의 3염색체성 13경우들, 15개의 3 염색체성 18 경우들, 16개의 3염색체성 21 경우들, 3개의 XO 경우들, 2개의 XXY 경우들 및 1개의 XYY 경우들을 포함하였다. 이들의 핵형 결과 분포는 도 9에 나타내었다.
모체 혈장 DNA 서열분석
말초 정맥 혈액 (5밀리리터)을, 각각의 참여한 임산부로부터 EDTA 관들에 모으고, 4시간 후 1,600g에서 10분 동안 원심분리하였다. 혈장을 미세원심분리관으로 옮기고, 16,000g에서 10분 동안 재원심분리하여 잔류 세포들을 제거하였다. DNA 추출까지 무세포 혈장을 80℃에서 저장하였다. 각 혈장 샘플을 동결시키고 단지 1회만 해동시켰다.
대량 병렬 게놈 서열분석을 위하여, 600㎕ 모체 혈장으로부터 추출된 모든 DNA를, Illumina로부터의 변경된 프로토콜에 따라 DNA 라이브러리 구축에 이용하였다. 간략하게는, 모체 혈장 DNA 단편들의 말단-수선(end-repairing)은 T4 DNA 폴리머라아제, Klenow™ 폴리머라아제, 및 T4 폴리뉴클레오티드 키나아제를 이용하여 수행되었다. 상업적으로 이용가능한 어댑터들(adapters) (Illumina)을, 말단 A-잔기들의 첨가 후, DNA 단편들로 결찰시켰다. 어댑터-결찰된 DNA를 그 후, 평균 멀티플렉스 프라이머들을 이용하는 17-사이클 PCR을 이용하여 추가적으로 증폭시켰다. Agencourt AMPure™ 60ml Kit (Beckman)를 이용하여 PCR 생성물들을 정제시켰다. 서열분석 라이브러리들의 크기 분포를, 2100 Bioanalyzer™ (Agilent) 상에서 DNA 1000 키트를 이용하여 분석하고, 실시간 PCR로 정량하였다. 상이한 지수를 갖는 서열분석 라이브러리들을 그 후, Illumina GA II™ (단일-말단(single-end)서열분석) 상에서 클러스터 스테이션(clustrer station) 전에 균등량으로써 하나의 풀로 모았다(pooled).
19개의 남성 정배수체 샘플들을, 태아 DNA 분획의 추정을 위한 이후의 분석을 위해 서열분석하였다. 본 발명자들은, 3염색체성 13, 3염색체성 18, 3염색체성 21 및 성염색체 이상들의 진단을 위하여, 새로운 GC-상관관계 t-검정 방법을 개발하였다. 본 발명자들은 이러한 신규 방법을, 진단 수행 면에서 하기 언급되는 2가지 방법들에 대해 비교하였다.
실시예 7 3염색체성 13, 18 및 21과 같은 태아 염색체이수성의 검출
환자의 경우에서 염색체의 복제수가 정상으로부터 벗어났는지의 여부를 결정하기 위하여, 염색체의 커버리지 깊이를 모든 다른 기준 경우들에 대하여 비교하였다. 모든 이전의 연구는 단지 하나의 귀무가설을 가졌다. 본 발명자들은 2개의 귀무가설을 이용하므로써 최초로 이원 가설들을 도입하였다. 하나의 귀무가설 (H0: 태아가 정배수성이다)은 환자의 경우 분포의 커버리지 깊이 및 모든 정상의 기준 분포의 평균 커버리지 깊이는 균등하다는 가정이었으며, 이는 이러한 귀무가설이 수락된다면 환자 경우가 정배수체라는 것을 의미한다. 스튜던트 t-검정을 이용하여, t1은 하기 식 12를 이용하여 계산될 수 있다:
Figure 112012109734663-pct00042
(12)
다른 하나의 귀무가설(H1:태아는 염색체이수성이다)은, 대략적인 태아 분획을 갖는 환자 경우 분포의 평균 커버리지 깊이는 동일한 태아 분획을 갖는 염색체이수성의 분포의 평균 커버리지 깊이에 균등하다는 것으로, 이는 이러한 귀무가설이 수락되는 경우 이 환자 경우가 이수체임을 의미하는 것이다. 상기 스튜던트 t-통계, t2는 하기 식 13을 이용하여 계산될 수 있다:
Figure 112012109734663-pct00043
(13)
|t1|>3이고, |t2|<3은 대부분의 경우, 특히 정배수체 경우들과 이수체 경우들간의 분포가 완전히 구분되는 경우, 이수체인 경우를 나타내는 한편, 불충분한 정확성 또는 불충분한 태아 분획 등과 같은 다른 조건에서 |t1| 은 3보다 작을 수 있지만, 태아가 비정상이었다. 조합된 t1 및 t2는 보다 정확한 결정을 하도록 보조할 수 있으며, 그 후 본 발명자들은 하기 식 14를 이용하여 t1 및 t2 로그(Log) 유사 비율을 이용하였다:
Figure 112012109734663-pct00044
(14)
식 중, Li,j는 로그 유사 비율이다. 상기 비율이 1보다 크면, 본 발명자들은 태아가 3염색체성일 수 있음을 추정할 수 있었다.
그러나, 여성 태아들을 갖는 경우들에서는, 그의 태아 분획을 추정하기가 어려웠으며, 따라서 계산이 불가능하였다. 그러나, 본 발명자들은 태아 분획의 경험적 분포에 따라 분획의 기준 값(Reference Value:RV) 7%를 제공할 수 있다.
903개 경우들을 조사하였으며, 이들 중 866이 정배수체 태아들이었으며, 이들 중 300개 경우들은 GC 상관관계 스튜던트-t 방법을 전개하기 위하여 임의적으로 선택되었다. 추가적으로, 2 3염색체성 13, 12 3염색체성 18, 16 3염색체성 21, 4 XO (3 XO 경우들, 및 1 키메라 45, xo/46, xx (27:23) 경우로 이루어짐), 2 XXY 및 1XYY 경우가 본 연구에 참여되었다. 배열(alignment) 후, 본 발명자들은, 미스매치(mismatch) 없이, 케이스 당 특정 배열된 판독값들의 170만 데이터의 평균 (SD=306185)을 수득하였다. 본 발명자들에 의해 새롭게 개발된 GC-상관관계 스튜던트 t-검정을 이용하므로써, 모든 T13 경우들 (2 중 2)이 성공적으로 확인되었으며, 901의 비-3염색체성 13 경우들 중 901이 정확하게 분류되었다(도 10a). 이 방법의 감도 및 특이성은 100% 및 100% 이었다 (표 1).
3염색체성 18의 경우, 12 3염색체성 18 경우들 중 12, 및 891 비-3염색체성 18 경우들 중 888이 정확하게 확인될 수 있었다(도 10a). 이러한 방법의 감도 및 특이성은 각각 100% 및 99.66%이었다. 3염색체성 21의 경우, 16 3염색체성 21 경우들 중 16 및 16 비-3염색체성 21 경우들 중 16도 정확하게 검출될 수 있었다 (도 10a). 이러한 방법의 감도 및 특이성은 각각 100% 및 100%이었다.
실시예 8 XO, XXX, XXY, XYY의 검출
본 발명자들은 상기에서 상염색체들의 경우 3염색체성의 검출을 고려하였는데, 성염색체 질환, 예컨대 XO, XXX, XXY 및 XYY도 본 발명의 방법에 의하여 검출될 수 있다.
먼저, 성별 구분에 의하여 성별을 확인하였다. 시험 케이스가 여성 태아를 갖는지 확인하면, 스튜던트-t 값 t1,
Figure 112012109734663-pct00045
은 XXX 또는 XO 검출에 대해 계산될 필요가 있었으며, 식 중
Figure 112012109734663-pct00046
Figure 112012109734663-pct00047
는 식 10에서와 동일한 의미를 갖는다; t1이 3.13 보다 크거나 또는 -3.13 미만인 경우, 이 경우는 XXX 또는 XO일 수 있다. 그러나 정확성이 염색체 X에 대한 커버리지 깊이의 큰 편차에 의해 제한되었음을 고려하여, |t1|>3.13이라 하더라도 |t1|<5인 경우, 본 발명자들은 혈장을 다시 샘플링하고, 보다 신뢰성있는 결정을 내리기 위하여 실험을 반복하였다. |t1|>5은 이 경우 염색체이수성인 것으로 확인되었다. 본 발명자들의 모든 검출 과정들은 데이터가 표준 품질 관리를 만족시킨다는 전제하의 것이다.
시험 샘플이 남성 태아를 갖는 것으로 확인 경우, 태아 DNA 분획은 먼저 Y 및 X에 의해 추정되었다. 한편, 본 발명자들은 염색체 Y의 커버리지 깊이에 의해서만 추정된 태아 DNS 분획을 이용하여 염색체 X에 대한 적합화된 커버리지 깊이를 외삽할 수 있었으며, t2를 계산할 수 있었다
Figure 112012109734663-pct00048
. t2가 너무 크거나(5 초과) 또는 너무 작으면(-5 미만), 태아는 XXY 또는 XYY일 수 있다. 추가적으로, X 및 Y에 의해 독립적으로 추정된 태아 분획들간의 갭(gap)은 성염색체들에 대한 질환들의 검출에 대한 정보를 제공할 것이다.
XO 검출에서, 4 XO 경우들 중 3개가 검출되었으며, 확인에 실패한 경우는 키메라(chimera) 경우였다 (도 10b). 이 방법의 감도 및 특이성은 각각 75% (키메라 경우를 무시한다면 100%) 및 99.55% 였다. XXY 경우들에 대하여, 모든 2 경우들은 성공적으로 확인되었으며, 901의 비-XXY 경우들 중 901이 감도 100% 특이성 100%로 정확하게 분류되었다(도 10b). XYY 경우들에 대하여, 본 발명자들은 그를 정확하게 확인하였으며 (도 10b) 감도 및 특이성은 각각 100% 및 100%였다.
본 발명자들의 새로운 방법이, 보고된 다른 2가지 방법들, z-스코어 및 GC 보정(correction)을 이용한 z-스코어에 비해 장점들이 있는지를 평가하기 위하여, 본 발명자들은 이들 3가지 시도들을 이용하여 900 경우들 및 모든 방법들에 대해 설정된 기준으로서 동일한 300 경우들을 분석하였다. 측정의 정확성은 항상 신뢰값에서 구현되었다 (CV). 본 연구에서, 표준 z-스코어 방법의 CV는 임상적으로 중요한 염색체 18 및 21에서의 다른 시도들에 비해 더욱 커서(도 11), 3염색체성 18 및 21에 대해 보다 낮은 감도율을 나타내었다 (표 1).
상이한 방법들의 감도 및 특이성 비교
진단
(케이스들의 수)
표준 Z-스코어(z-score) 방법 GC 보정을 이용한 z-스코어 방법 GC 상관 t-검정을 이용한 본 발명의 방법
감도 (%) 특이성 (%) 감도 (%) 특이성 (%) 감도 (%) 특이성 (%)
상염색체 3염색체성 13 (2) 50% 99.89 100% 100% 100% 100%
3염색체성 18 (12) 91.67% 100% 100% 99.89% 100% 99.96%
3염색체성 21 (16) 93.75% 100% 100% 100% 100% 100%
이형염색체 XO (3 XO, 1 XO/XX 키메라) 이용가능하지 않음 이용가능하지 않음 이용가능하지 않음 이용가능하지 않음 75% 100%
XXY (1) 이용가능하지 않음 이용가능하지 않음 이용가능하지 않음 이용가능하지 않음 100% 100%
XXY (2) 이용가능하지 않음 이용가능하지 않음 이용가능하지 않음 이용가능하지 않음 100% 100%
이원(binary) 가설 이용가능하지 않음 이용가능하지 않음 이용가능
상기 GC 보정이 있는 z-스코어의 경우, 염색체 13의 CV 값은 100% 감도 및 100% 특이성으로 0.0066이었다. 본 명세서에서 논의된 신규의 GC 상관관계 스튜던트 t 방법의 경우, 염색체 13의 CV 값은 0.0063이었으며, 100% 감도 비율 및 100% 특이성 비율이었다. 염색체 18에서, 이들 두 방법들의 CV는 각각 0.0062 및 0.0066이었으며, 이들에 대한 100% 감도 및 특이성 비율은 각각 99.89% 및 99.96%이었다. 상기 수행은 염색체 21에 대한 이들 두가지 시도들의 CV를 비교하면 각각 0.0088 및 0.0072로 유사하였다. 이들 모두는 본 실시예의 적은 경우들에서 100%의 동일한 감도 비율을 결과로서 초래하였으며, 동일한 100% 특이성 비율을 달성하였다. 이들 두 방법들 모두 표준 z-스코어 방법보다 더 양호하게 수행되었다. GC 상관관계를 이용한 신규 개발된 본 발명자들의 시도는 양호한 수행을 갖는 GC 보정 방법에 필적할 뿐만 아니라, XO, XXY 및 XYY와 같은 성염색체 비정상들의 검출에서 또다른 장점을 가졌다. 본 실시예의 데이터는 공정 GC 보정 방법의 경우, 중량 인자를 곱하므로써 서열 태그들의 수를 수정시 도입된 성염색체들을 나타내는 데이터의 편차에 의하여 태아 성별을 구분하는데는 어려움이 있어, 성염색체 질환의 검출은 어려운 것으로 보임을 보여주고 있다.
실시예 9 데이터 크기, 임신 주수 및 태아 DNA 분획을 고려한 GC -상관관계 t-검정 방법의 이론적 수행
모체 DNA의 높은 백그라운드(background)(Fan, 등, Proc Natl Acad Sci USA (2008) 42:16266~16271)로 인하여, 염색체 이수성 측정은 여전히 어려운 것으로 남아있으며, 임의의 작은 태아 DNA 분획은 오늘날까지 대규모 병렬 게놈 서열분석 (MPGS) 방법에 의한 염색체 이수성 검출에 대한 가장 현저한 제한 인자였다. 그러나, 특히 여성 태아에 대한 MPGS 검출 전에 임상적으로 최소의 태아 DNA 분획을 결정하는데 있어서의 큰 해결책은 없는 한편, 태아 DNA의 분획을 포함하는 것에 관련된 단지 하나의 임상적 단서는 임신 주수이다. 태아 DNA 분획 및 임신기간 사이의 통계적으로 유의한 상관관계가 이전에 보고되어 있다 (Lo, 등, Am. J. Human Genet. (1998) 62:768~775). 본 발명자들의 연구에서, 추정된 태아 DNA 분획 및 임신 기간 사이의 관계를 연구하기 위하여, 본 발명자들은 추정 식 10으로 언급된, 남성 태아들을 갖는 모든 참여자의 경우들(총 427 경우들)의 태아 DNA 분획을 도 12에서 그래프화하였다. 각 샘플에 대한 추정된 태아 DNA 분획은 임신 기간과 상관관계가 있었다 (0.0001보다 작은 P). 이는 임신 기간 20에서, 5% 미만의 태아 DNA 분획을 갖는 65경우들 중 4경우들이 있다 하더라도, 이는 검출 정확성에 불리한 영향을 미칠 수 있음도 나타내었다. 태아 분획 추정 방법을 평가하기 위하여, 본 발명자들은 추정된 태아 분획에서 계층적으로(hierarchically) 분포된 일부 경우들을 선택하고, 그 후 Q-PCR로 또다른 상대 태아 분획의 계산을 보조하였다. 그 후, 본 발명자들은 이들간에 강한 상관관계를 나타내는 상관관계 표준 곡선을 수득하였으며, 이는 본 발명의 방법에 의하여 태아 분획의 추정이 신뢰성있음을 증명하였다.
반면, 서열분석 깊이 (총 특정 판독치들의 수)는 표준편차 값으로써 나타나는 염색체이수성 검출의 정확성에 영향을 미치는 또다른 현저한 인자였다. 본 발명자들의 GC-상관된 방법에 사용된 각 염색체에 대한 표준편차는, 기준 경우 수가 150에 달하는 경우 서열분석 깊이의 일정 수준 하에 고정될 수 있었다(도 13). 상기 서열분석 깊이가 각 염색체에 대한 표준편차에 어떻게 영향을 미치는지 조사하기 위하여, 본 발명자들은 150 경우들을 본 발명의 170만 수준에서 뿐만 아니라, 500만에 달하는 총 특정 판독값들의 수를 이용한 또다른 서열분석 깊이 수준에서도 서열분석하였다 (SD=170만). 이들 2개의 세트들에 의존하여, 본 발명자들은 표준 분산이 도 6에서 실험된 총 특정 판독값들 수의 제곱루트의 역수에 대해 선형이다.
소정의 태아 DNA 분획에 대하여, 본 발명자들은 t1=3에서 염색체 복제 수의 정상으로부터의 편차를 검출하기 위하여 본 방법에서 요구된 총 특정 판독값들을 추정할 수 있었다 (도 14). 태아 DNA 분획이 적을수록, 요구되는 서열분석 깊이가 더욱 크다는 것을 보여주었다. 본 발명자들의 170만 특정 판독값들 세트에서, 본 발명의 방법은 4.5%가 넘는 태아 DNA 분획을 이용하여 염색체 13 및 X에 대한 염색체이수성 태아들을 검출할 수 있었으며, 4%가 넘는 것으로 염색체 21 및 18에 대한 염색체 이수성 태아들을 검출할 수 있었다; 반면 500만 기준 세트에서, 본 발명의 방법은 약 3%의 태아 DNA 분획만으로도 3염색체성 18 및 3염색체성 21을 검출할 수 있었다. 본 발명자들이 약 4%의 태아 분획을 이용하여 XXX 또는 XO와 같은 염색체 X에서 비정상인 태아들을 확인하기를 원하는 경우, 이들 경우들 및 대응 기준 경우들에서 요구되는 총 특정 수는 500만에 달하여야 한다. 태아 DNA가 3.5% 미만인 경우, 서열분석 깊이 필요조건은 20M를 초과하여야 할 것이다. DNA 태아 분획이 보다 낮은 경우, 검출은 신뢰성이 없고 어려울 것이므로, 본 발명자들은 또다른 전략을 제안하였고, 즉 임신기간이 태아 DNA 분획은 임신 기간 증가에 따라 상승될 것이라는 큰 확률에 따라 임신 기간이 더욱 길어졌을 때,본 발명자들은 임산부의 혈장을 재샘플링하고, 본 발명의 실험을 재실시하고 재분석하여야만 하였다. 그리고 이 전략은 적은 태아 DNA 분획을 갖는 것으로 의심되는 샘플들에도 적용될 수 있다.
본 발명자들의 방법이 잘 수행된다 하더라도, 많은 세트의 비정상 경우들 없이는 설득력있지는 않다. 본 발명에 의한 이 GC-상관관계 스튜던트 t 방법의 감도를 측정하기 위하여, 상이한 임신 기간 및 상이한 서열분석 깊이를 고려하여 이론적 감도를 간행하였다.
본 발명자들은 하기 단계들을 이용하여 염색체이수성의 이론적 감도를 계산하였다. 먼저, 태아 DNA 분획을 임신 기간에 적합화하기 위한 회귀분석을 적용하였으며
Figure 112012109734663-pct00049
, 식 중,
Figure 112012109734663-pct00050
은 그의 임신 기간 gsa i 중 태아 DNA 분획의 적합화 수단(mean)이고, 가우스 커널 밀도 추정을 이용하므로써 근사 태아 DNA 분획 분포를 추정하였으며 (Birke, (2008) Journal of Statistical Planning and Inference 139:2851~2862), 태아 DNA 분획 및 임신 기간 간의 관계
Figure 112012109734663-pct00051
에 따라 다른 주수에서의 태아 DNA 분획 분포를 외삽하기 전에, 19 및 20 임신 주수에서 분포된 추정된 태아 DNA 분획을 주로 참조하였고, 상기 식 중,
Figure 112012109734663-pct00052
는 그 임신 기간 중 태아 DNA 분획의 적합화 확률 밀도이며, X는 19 및 20 임신 주수의 데이터이다 (도 12). 두번째로, 본 발명자들은 상기 언급한 바와 같이, 총 특정 판독값 수에 따라 표준 분산을 추정하였으며
Figure 112012109734663-pct00053
, 식 중, tuqn은 총 특정 판독값 수이다. 마지막으로, 매 임신 기간 중 감도를, 태아 DNA 분획 분포 및 각 서열 깊이에서 추정된 표준 분산에 따라 특정의 서열분석 깊이 수준에서, 계산하기 위해서, 모든 태아 DNA 분획에서 오류의 음성 확률 밀도를 계산하였고(여기에서, 태아 DNA 분획 동요는 정상적으로 분포되었다고 가정하였다), 그를 적분하여 그 후 모든 수준의 태아 DNA 분획으로 이루어지는 임신 기간 중 오류 음성률(false negative rate: FNA)을 수득하였고,
Figure 112012109734663-pct00054
, 식 중, j는 염색체 j이다. 쉽게는, 이 임신 기간 중 특정이 서열분석 깊이에서의 이론적인 감도는 1-FNR로서 계산된다. 도 15~21은 본 계산 결과의 그래프들을 나타낸다. 3보다 큰 스튜던트-t는 여성 태아 염색체이수성을 확인하도록 설정된 한편, 남성 태아의 경우 모든 분획에서 오류이 음성의 확률 밀도가 계산되는 경우, 1보다 큰 로그 유사물은, 여성에 비교하여 더욱 높은 감도를 달성할 것을 보조한 이원 가설 중에서 언급된 극히 중요한 값으로서 사용되었다.
그러나, 임신 기간 동안에, 특히 작은-규모 샘플링 중 적은 임신 기간에서는, 태아 DNA 분획의 실제 분포에 무한하게(infinitely) 근접하는 분포를 수득하기가 어렵기 때문에, 본 발명자들의 추론은 상대 보존적이다(relative conservative).
참고문헌
Figure 112012109734663-pct00055
Figure 112012109734663-pct00056

Claims (67)

  1. 다음 단계들을 포함하는, 염색체이수성인 태아의 유전학적 이상을 결정하기 위한 컴퓨터-분석 방법:
    (a) 임신한 여성으로부터 유도된 모체 DNA 및 태아 DNA를 포함하는 말초혈액 샘플로부터 다수의 폴리뉴클레오티드 단편들의 서열정보를 수득하는 단계;
    (b) 각각의 염색체에 대한 동일한 크기의 특정 기준 판독값들에 대해 상기 단편들을 비교함으로써, 상기 서열 정보에 근거하여, 상기 단편들을 염색체들에 지정하는 단계,
    여기에서, 특정 기준 판독값들은 기준 게놈 서열에 근거하여 하나의 염색체 위치에 명확하게 지정될 수 있는 특정 서열을 갖는 염색체의 단편들이다;
    (c) 상기 (b) 단계에서 상기 염색체의 특정 기준 판독값들에 지정된 단편들에 대한 서열 정보에 근거하여, 염색체의 커버리지 깊이 및 GC 함량을 결정하는 단계,
    여기에서 커버리지 깊이는 상기 염색체에 특정하게 지정된 단편들의 수와 기준 인간 게놈 서열에 근거한 동일한 단편 크기의 상기 염색체에 대한 특정 기준 판독값들의 수 간의 비율이다;
    (d) 상기 염색체의 GC 함량을 사용하여 상기 염색체의 적합화된 커버리지 깊이, 및 염색체이수성 부재하에서 상기 염색체에 대한 커버리지 깊이 및 GC 함량 간의 수립된 관계를 결정하는 단계,
    여기에서 상기 수립된 관계는 다음의 단계들을 포함하는 방법으로 결정된다;
    (i) 게놈 DNA를 포함하는 다수의 정배수체 말초혈액 샘플로부터 상기 염색체를 망라하는 다수의 폴리뉴클레오티드 단편들의 서열정보를 수득하는 단계;
    여기에서, 상기 단편 크기는 상기 (a) 단계의 다수의 폴리뉴클레오티드 단편들의 단편 크기와 동일하다;
    (ii) 상기 (b) 단계에서의 상기 서열 정보에 근거하여, 상기 단편들을 염색체들에 지정하는 단계;
    (iii) 상기 (c) 단계에서의 각각의 정배수체 샘플에 대한 상기 서열 정보에 근거하여, 상기 염색체의 커버리지 깊이 및 GC 함량을 결정하는 단계; 및
    (iv) 염색체이수성의 부재하에서 상기 염색체의 커버리지 깊이 및 GC 함량 간의 관계를 결정하기 위하여, (iii) 단계에서 각각의 샘플에 대하여 결정된 커버리지 깊이 및 GC 함량을 사용하는 단계; 및
    (e) 상기 적합화된 커버리지 깊이를 상기 (c) 단계에서 결정된 상기 염색체의 커버리지 깊이와 비교하는 단계,
    여기에서, 상기 커버리지 깊이들 간의 차이는 태아 염색체이수성을 나타낸다.
  2. 제 1항에 있어서, 상기 (a) 단계는 다수의 다른 샘플들로부터의 다수의 폴리뉴클레오티드 단편들의 서열 정보를 수득하는 것을 더 포함하고, 상기 커버리지 깊이는 상이한 샘플들에 대해 수득되는 서열 판독값들의 총 수에서의 차이를 고려하기 위해 정규화된 것임을 특징으로 하는 방법.
  3. 제 1항에 있어서, 상기 커버리지 깊이는, 또 다른 염색체의 평균 커버리지 깊이에 대해, 상이한 샘플들에 대해 수득되는 서열 판독값들의 총 수에서의 차이를 고려하기 위해 정규화된 것임을 특징으로 하는 방법.
  4. 제 1항에 있어서, 상기 커버리지 깊이는, 모든 다른 상염색체의 평균 커버리지 깊이 또는 모든 다른 염색체들의 평균 커버리지 깊이에 대해, 상이한 샘플들에 대해 수득되는 서열 판독값들의 총 수에서의 차이를 고려하기 위해 정규화된 것임을 특징으로 하는 방법.
  5. 제 1항에 있어서, 상기 염색체의 GC 함량은 (c) 단계의 목적을 위해 상기 염색체에 지정하는 모든 단편들의 평균 GC 함량으로서 결정되는 것을 특징으로 하는 방법.
  6. 제 2항에 있어서, 하기 식에 따라 태아 성별을 결정하는 단계를 더 포함하는 것을 특징으로 하는 방법:
    Figure 112014085414012-pct00113

    식 중, cr.ai,x cr.ai,y 는 샘플 i의 X 및 Y 염색체들 각각의 상대 커버리지 깊이이다.
  7. 제 2항에 있어서, 태아 분획을 산정하는 단계를 더 포함하고, 상기 태아 분획은 하기 식들로부터 선택되는 하나의 식에 따라 제 1항의 단계 (c)에서와 같이 결정된 염색체 X 및/또는 Y의 커버리지 깊이를 이용하여 계산되는 것을 특징으로 하는 방법:
    (i)
    Figure 112014085414012-pct00114

    식 중, Cri,Y 는 샘플 i의 염색체 Y의 커버리지 깊이이고,
    Figure 112014085414012-pct00115
    는 염색체 Y 커버리지 깊이와 여성 태아를 가진 임산부들로부터의 샘플들의 대응 GC 함량의 관계로부터 계산된 적합화된 커버리지 깊이이며,
    Figure 112014085414012-pct00116
    는 염색체 Y 커버리지 깊이와 남성 대상자들의 대응 GC 함량의 관계로부터 계산된 적합화된 커버리지 깊이를 의미한다; 또는
    (ii)
    Figure 112014085414012-pct00117


    식 중, Cri,x 는 샘플 i의 염색체 X의 커버리지 깊이이고,
    Figure 112014085414012-pct00118
    는 염색체 X 커버리지 깊이와 여성 태아를 가진 임산부들로부터의 샘플들의 대응 GC 함량의 관계로부터 계산된 적합화된 커버리지 깊이이며,
    Figure 112014085414012-pct00119
    는 염색체 X 커버리지 깊이와 남성 대상자들의 샘플들로부터의 대응 GC 함량의 관계로부터 계산된 적합화된 커버리지 깊이를 의미한다; 또는
    (iii)
    Figure 112014085414012-pct00120

    식 중,
    Figure 112014085414012-pct00121
    는 염색체 X 커버리지 깊이와 여성 태아를 가진 임산부들로부터의 샘플들의 대응 GC 함량의 관계로부터 계산된 적합화된 커버리지 깊이이며,
    Figure 112014085414012-pct00122
    는 염색체 Y 커버리지 깊이와 여성 태아를 가진 임산부들로부터의 샘플들의 대응 GC 함량의 관계로부터 계산된 적합화된 커버리지 깊이를 의미하고,
    Figure 112014085414012-pct00123
    는 염색체 X 커버리지 깊이와 남성 대상자들의 샘플들로부터의 대응 GC 함량의 관계로부터 계산된 적합화된 커버리지 깊이를 의미하고,
    Figure 112014085414012-pct00124
    은 염색체 Y 커버리지 깊이와 남성 대상자들의 대응 GC 함량의 관계로부터 계산된 적합화된 커버리지 깊이를 의미한다.
  8. 제 2항에 있어서, 상기 (c) 단계에서 결정된 상기 염색체의 상기 커버리지 깊이에 대한 상기 적합화된 커버리지 깊이의 비교는 통계적 가설 시험에 의하여 수행되며, 여기에서 하나의 가설은 태아가 정배수체(H0)라는 것이고, 다른 가설은 태아가 상기 염색체의 이수성(H1)을 나타낸다는 것임을 특징으로 하는 방법.
  9. 제 8항에 있어서, 스튜던트 t-통계가 상기 양 가설에 대해 계산되는 것을 특징으로 하는 방법.
  10. 제 9항에 있어서, 상기 스튜던트 t-통계가 다음 식에 따라 H0 및 H1에 대하여 각각 계산되는 것을 특징으로 하는 방법:
    Figure 112014085414012-pct00125

    Figure 112014085414012-pct00126

    식 중, fxy는 태아 분획이고,
    i는 샘플 인덱스이고,
    j는 염색체 수이며,
    Figure 112014085414012-pct00127
    이고,
    식 중, f(GCi,j)는 정규화된 커버리지 깊이와 샘플 i, 염색체 j의 대응 GC 함량간의 관계의 함수를 나타내고, εi,j는 샘플 i, 염색체 j의 잔기들을 나타내고,
    Figure 112014085414012-pct00128
    이며,
    그리고 적합화된 커버리지 깊이를 나타내고,
    stdj 는 하기 식에 따른 표준 분산이고,
    Figure 112014085414012-pct00129

    식 중, ns는 기준 샘플들의 수를 나타낸다.
  11. 제 10항에 있어서, 상기 t1 및 t2 의 로그 유사 비율은 다음 식에 따라 계산되는 것을 특징으로 하는 방법:
    Figure 112014085414012-pct00130
    ,
    식 중, Li,j는 로그 유사 비율이고, degree는 t 분포 정도를 의미하며, D는 2배성을 의미하고, T는 3염색체성이며,
    Figure 112014085414012-pct00131
    Figure 112014085414012-pct00132
    는 소정의 t 분포 정도에서 조건부 확률 밀도를 나타내고,
    상기 비율이 1보다 크면, 태아가 상기 염색체에 대해 3염색체성을 나타내는 것으로 추정된다.
  12. 제 1항 내지 제 11항 중 어느 한 항에 있어서, 상기 방법은 태아 상염색체 염색체이수성의 결정에 사용되는 것을 특징으로 하는 방법.
  13. 제 12항에 있어서, 상기 태아 염색체이수성은 3염색체성 13, 18 및 21로 이루어지는 군으로부터 선택되는 것을 특징으로 하는 방법.
  14. 제 6항에 있어서, 상기 방법은 성염색체 염색체이수성을 결정하기 위해 사용되는 것을 특징으로 하는 방법.
  15. 제 6항에 있어서, 상기 방법은 XO, XXX, XXY 및 XYY로 이루어지는 군으로부터 선택되는 성염색체 염색체이수성을 결정하기 위해 사용되는 것을 특징으로 하는 방법.
  16. 제 1항 내지 제 11항 중 어느 한 항 또는 제 14항 또는 제 15항에 따른 방법을 수행하기 위해 적용되는 다수의 지시사항들을 포함하고, 상기 지시사항들은 제 1항의 (a) 단계에서 수득되는 서열 정보로 보충되는 것을 특징으로 하는 컴퓨터 판독 매체.
  17. 제 1항 내지 제 11항 중 어느 한 항 또는 제 14항 또는 제 15항에 따른 방법을 수행하기 위해 적용되는 수단들을 포함하는 시스템.
  18. 제 12항에 따른 방법을 수행하기 위해 적용되는 수단들을 포함하는 시스템.
  19. 제 13항에 따른 방법을 수행하기 위해 적용되는 수단들을 포함하는 시스템.


















  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 삭제
  36. 삭제
  37. 삭제
  38. 삭제
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
  53. 삭제
  54. 삭제
  55. 삭제
  56. 삭제
  57. 삭제
  58. 삭제
  59. 삭제
  60. 삭제
  61. 삭제
  62. 삭제
  63. 삭제
  64. 삭제
  65. 삭제
  66. 삭제
  67. 삭제
KR1020127034453A 2011-06-29 2011-06-29 태아 유전학적 이상의 비침습성 검출 KR101489568B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/001070 WO2013000100A1 (en) 2011-06-29 2011-06-29 Noninvasive detection of fetal genetic abnormality

Publications (2)

Publication Number Publication Date
KR20140023847A KR20140023847A (ko) 2014-02-27
KR101489568B1 true KR101489568B1 (ko) 2015-02-03

Family

ID=47392194

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127034453A KR101489568B1 (ko) 2011-06-29 2011-06-29 태아 유전학적 이상의 비침습성 검출

Country Status (18)

Country Link
US (1) US9547748B2 (ko)
EP (1) EP2561103B1 (ko)
JP (1) JP5659319B2 (ko)
KR (1) KR101489568B1 (ko)
CN (1) CN103403183B (ko)
AU (1) AU2012261664B2 (ko)
BR (1) BR112012033760B1 (ko)
CA (2) CA2948939C (ko)
DK (1) DK2561103T3 (ko)
ES (1) ES2512448T3 (ko)
HK (1) HK1190758A1 (ko)
MY (1) MY172864A (ko)
PL (1) PL2561103T3 (ko)
RU (1) RU2589681C2 (ko)
SG (1) SG191757A1 (ko)
SI (1) SI2561103T1 (ko)
WO (1) WO2013000100A1 (ko)
ZA (1) ZA201209583B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017051996A1 (ko) * 2015-09-24 2017-03-30 에스케이텔레콤 주식회사 비침습적 태아 염색체 이수성 판별 방법

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11270781B2 (en) 2011-01-25 2022-03-08 Ariosa Diagnostics, Inc. Statistical analysis for non-invasive sex chromosome aneuploidy determination
US20140235474A1 (en) 2011-06-24 2014-08-21 Sequenom, Inc. Methods and processes for non invasive assessment of a genetic variation
SI2561103T1 (sl) 2011-06-29 2014-11-28 Bgi Diagnosis Co., Ltd. Neinvazivna detekcija genetske anomalije ploda
US10424394B2 (en) 2011-10-06 2019-09-24 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9367663B2 (en) 2011-10-06 2016-06-14 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2013052907A2 (en) 2011-10-06 2013-04-11 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10196681B2 (en) 2011-10-06 2019-02-05 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9984198B2 (en) 2011-10-06 2018-05-29 Sequenom, Inc. Reducing sequence read count error in assessment of complex genetic variations
ES2929923T3 (es) 2012-01-20 2022-12-02 Sequenom Inc Procesos de diagnóstico que condicionan las condiciones experimentales
US10504613B2 (en) 2012-12-20 2019-12-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9920361B2 (en) 2012-05-21 2018-03-20 Sequenom, Inc. Methods and compositions for analyzing nucleic acid
US10497461B2 (en) 2012-06-22 2019-12-03 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10482994B2 (en) 2012-10-04 2019-11-19 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US20130309666A1 (en) 2013-01-25 2013-11-21 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2015130696A1 (en) 2014-02-25 2015-09-03 Bionano Genomics, Inc. Reduction of bias in genomic coverage measurements
US10844424B2 (en) 2013-02-20 2020-11-24 Bionano Genomics, Inc. Reduction of bias in genomic coverage measurements
JP6542676B2 (ja) * 2013-02-20 2019-07-10 バイオナノ ジェノミクス、 インコーポレイテッド ナノフルイディクスにおける分子の特性解析
WO2014133369A1 (ko) * 2013-02-28 2014-09-04 주식회사 테라젠이텍스 유전체 서열분석을 이용한 태아 염색체 이수성의 진단 방법 및 장치
HUE061261T2 (hu) 2013-04-03 2023-05-28 Sequenom Inc Eljárások és folyamatok genetikai variánsok nem invazív értékelésére
WO2014190286A2 (en) 2013-05-24 2014-11-27 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CA2898747C (en) * 2013-06-13 2021-09-21 Ariosa Diagnostics, Inc. Statistical analysis for non-invasive sex chromosome aneuploidy determination
LT3011051T (lt) 2013-06-21 2019-05-10 Sequenom, Inc. Genetinių variacijų neinvazinis vertinimo būdas
KR102514024B1 (ko) 2013-10-04 2023-03-23 시쿼넘, 인코포레이티드 유전적 변이의 비침습 평가를 위한 방법 및 프로세스
WO2015054080A1 (en) 2013-10-07 2015-04-16 Sequenom, Inc. Methods and processes for non-invasive assessment of chromosome alterations
WO2015061359A1 (en) * 2013-10-21 2015-04-30 Verinata Health, Inc. Method for improving the sensitivity of detection in determining copy number variations
CN103525939B (zh) * 2013-10-28 2015-12-02 博奥生物集团有限公司 无创检测胎儿染色体非整倍体的方法和系统
AU2015266665C1 (en) * 2014-05-30 2021-12-23 Verinata Health, Inc. Detecting fetal sub-chromosomal aneuploidies and copy number variations
CN104156631B (zh) * 2014-07-14 2017-07-18 天津华大基因科技有限公司 染色体三倍体检验方法
WO2016010401A1 (ko) * 2014-07-18 2016-01-21 에스케이텔레콘 주식회사 산모의 혈청 dna를 이용한 태아의 단일유전자 유전변이의 예측방법
WO2016019042A1 (en) 2014-07-30 2016-02-04 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2016045106A1 (zh) * 2014-09-26 2016-03-31 深圳华大基因股份有限公司 单细胞染色体的cnv分析方法和检测装置
AU2015360298B2 (en) 2014-12-12 2018-06-07 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
CN104789466B (zh) * 2015-05-06 2018-03-13 安诺优达基因科技(北京)有限公司 检测染色体非整倍性的试剂盒和装置
BE1022789B1 (nl) * 2015-07-17 2016-09-06 Multiplicom Nv Werkwijze en systeem voor geslachtsinschatting van een foetus van een zwangere vrouw
KR101817785B1 (ko) * 2015-08-06 2018-01-11 이원다이애그노믹스(주) 다양한 플랫폼에서 태아의 성별과 성염색체 이상을 구분할 수 있는 새로운 방법
KR101678962B1 (ko) 2015-08-21 2016-12-06 이승재 대규모 병렬형 게놈서열분석 방법을 이용한 비침습적 산전검사 장치 및 방법
CN105354443A (zh) * 2015-12-14 2016-02-24 孔祥军 无创产前基因检测分析软件
CN105483229B (zh) * 2015-12-21 2018-10-16 广东腾飞基因科技股份有限公司 一种检测胎儿染色体非整倍体的方法及系统
KR101817180B1 (ko) * 2016-01-20 2018-01-10 이원다이애그노믹스(주) 염색체 이상 판단 방법
US10095831B2 (en) 2016-02-03 2018-10-09 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
JP6785068B2 (ja) * 2016-05-31 2020-11-18 富士フイルム株式会社 生物情報解析方法
CN106096330B (zh) * 2016-05-31 2019-02-01 北京百迈客医学检验所有限公司 一种无创产前生物信息检测分析方法
US11200963B2 (en) 2016-07-27 2021-12-14 Sequenom, Inc. Genetic copy number alteration classifications
CN110191951A (zh) 2017-01-24 2019-08-30 深圳华大生命科学研究院 基于外泌体dna进行无创产前诊断的方法及其应用
CA3207879A1 (en) 2017-01-24 2018-08-02 Sequenom, Inc. Methods and processes for assessment of genetic variations
US20200109452A1 (en) * 2017-03-31 2020-04-09 Premaitha Limited Method of detecting a fetal chromosomal abnormality
US11342047B2 (en) 2017-04-21 2022-05-24 Illumina, Inc. Using cell-free DNA fragment size to detect tumor-associated variant
CN112020565B (zh) * 2018-01-05 2024-05-24 十亿至一公司 用于确保基于测序的测定的有效性的质量控制模板
WO2019195975A1 (zh) * 2018-04-09 2019-10-17 深圳华大生命科学研究院 基因文库的构建方法及其应用
WO2019205132A1 (zh) * 2018-04-28 2019-10-31 深圳华大生命科学研究院 一种胎儿游离核酸的富集方法及其应用
CN111373054A (zh) * 2018-05-31 2020-07-03 深圳华大临床检验中心 确定男性待测样本是否存在三倍体的方法、系统和计算机可读介质
CN109192243B (zh) * 2018-08-13 2021-03-12 成都凡迪医学检验所有限公司 染色体比例的修正方法、装置、介质
KR20200106643A (ko) 2019-03-05 2020-09-15 (주)인실리코젠 바코드 서열 정보 기반 고민감도 유전변이 탐지 및 레포팅 시스템
WO2020226528A1 (ru) * 2019-05-08 2020-11-12 Общество с ограниченной ответственностью "ГЕНОТЕК ИТ" Способ определения кариотипа плода беременной женщины
CN110211654A (zh) * 2019-05-30 2019-09-06 湖南自兴智慧医疗科技有限公司 一种自动隐藏性别信息的核型检测系统及方法
CN111627498B (zh) * 2020-05-21 2022-10-04 北京吉因加医学检验实验室有限公司 一种测序数据gc偏向性校正的方法及其装置
RU2752783C1 (ru) * 2020-12-18 2021-08-03 Федеральное государственное бюджетное учреждение "Ивановский научно-исследовательский институт материнства и детства имени В.Н. Городкова" Министерства здравоохранения Российской Федерации Способ прогнозирования анеуплоидии эмбрионов в программе экстракорпорального оплодотворения у женщин с эндометриоз-ассоциированным бесплодием
WO2023031641A1 (en) * 2021-09-03 2023-03-09 Inserm ( Institut National De La Sante Et De La Recherche Medicale) Methods and devices for non-invasive prenatal testing

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080070792A1 (en) * 2006-06-14 2008-03-20 Roland Stoughton Use of highly parallel snp genotyping for fetal diagnosis
WO2010033578A2 (en) * 2008-09-20 2010-03-25 The Board Of Trustees Of The Leland Stanford Junior University Noninvasive diagnosis of fetal aneuploidy by sequencing
US20100216153A1 (en) * 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10021A (en) * 1853-09-13 Screw-eastemtito- for boots and shoes
GB9704444D0 (en) 1997-03-04 1997-04-23 Isis Innovation Non-invasive prenatal diagnosis
US20010051341A1 (en) 1997-03-04 2001-12-13 Isis Innovation Limited Non-invasive prenatal diagnosis
USRE39920E1 (en) 1997-05-30 2007-11-13 Xenomics, Inc. Methods for detection of nucleic acid sequences in urine
PT2216416E (pt) 1997-05-30 2012-08-16 Trovagene Inc Métodos para detecção de sequências de ácido nucleico na urina
US20020119478A1 (en) 1997-05-30 2002-08-29 Diagen Corporation Methods for detection of nucleic acid sequences in urine
US6492144B1 (en) 1997-05-30 2002-12-10 Diagen Corporation Methods for detection of nucleic acid sequences in urine
WO2005007869A2 (en) 2003-07-10 2005-01-27 Third Wave Technologies, Inc. Assays for the direct measurement of gene dosage
ATE435301T1 (de) 2003-10-16 2009-07-15 Sequenom Inc Nicht invasiver nachweis fötaler genetischer merkmale
US20060046258A1 (en) 2004-02-27 2006-03-02 Lapidus Stanley N Applications of single molecule sequencing
US20100216151A1 (en) 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
EP2423334A3 (en) 2006-02-02 2012-04-18 The Board of Trustees of The Leland Stanford Junior University Non-invasive fetal genetic screening by digital analysis
US20100184043A1 (en) 2006-02-28 2010-07-22 University Of Louisville Research Foundation Detecting Genetic Abnormalities
SI2351858T1 (sl) 2006-02-28 2015-06-30 University Of Louisville Research Foundation Med Center Three, Zaznavanje fetalnih kromosomskih nenormalnosti z uporabo tandema polimorfizmov posameznih nukleotidov
US20100184044A1 (en) 2006-02-28 2010-07-22 University Of Louisville Research Foundation Detecting Genetic Abnormalities
US20080038733A1 (en) 2006-03-28 2008-02-14 Baylor College Of Medicine Screening for down syndrome
US20080090239A1 (en) 2006-06-14 2008-04-17 Daniel Shoemaker Rare cell analysis using sample splitting and dna tags
EP2589668A1 (en) 2006-06-14 2013-05-08 Verinata Health, Inc Rare cell analysis using sample splitting and DNA tags
US20080050739A1 (en) 2006-06-14 2008-02-28 Roland Stoughton Diagnosis of fetal abnormalities using polymorphisms including short tandem repeats
US20080026390A1 (en) 2006-06-14 2008-01-31 Roland Stoughton Diagnosis of Fetal Abnormalities by Comparative Genomic Hybridization Analysis
US8137912B2 (en) 2006-06-14 2012-03-20 The General Hospital Corporation Methods for the diagnosis of fetal abnormalities
AU2007260676A1 (en) 2006-06-14 2007-12-21 Artemis Health, Inc. Rare cell analysis using sample splitting and DNA tags
WO2008014516A2 (en) 2006-07-28 2008-01-31 Living Microsystems, Inc. Selection of cells using biomarkers
US20080176237A1 (en) 2006-12-07 2008-07-24 Biocept, Inc. Non-invasive prenatal genetic screen
US20100112590A1 (en) 2007-07-23 2010-05-06 The Chinese University Of Hong Kong Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment
PT2183693E (pt) 2007-07-23 2014-01-14 Univ Hong Kong Chinese Diagnóstico de aneuploidia cromossómica fetal utilizando sequenciação genómica
SI2561103T1 (sl) 2011-06-29 2014-11-28 Bgi Diagnosis Co., Ltd. Neinvazivna detekcija genetske anomalije ploda

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100216153A1 (en) * 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
US20080070792A1 (en) * 2006-06-14 2008-03-20 Roland Stoughton Use of highly parallel snp genotyping for fetal diagnosis
WO2010033578A2 (en) * 2008-09-20 2010-03-25 The Board Of Trustees Of The Leland Stanford Junior University Noninvasive diagnosis of fetal aneuploidy by sequencing

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PLoS ONE, March 2010, vol 5, Issue 5, pages 1-7 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017051996A1 (ko) * 2015-09-24 2017-03-30 에스케이텔레콤 주식회사 비침습적 태아 염색체 이수성 판별 방법

Also Published As

Publication number Publication date
SI2561103T1 (sl) 2014-11-28
AU2012261664A1 (en) 2013-01-17
ES2512448T3 (es) 2014-10-24
RU2012158107A (ru) 2015-08-10
HK1190758A1 (en) 2014-07-11
CA2791118A1 (en) 2012-12-29
EP2561103B1 (en) 2014-08-27
BR112012033760B1 (pt) 2020-11-17
US20140099642A1 (en) 2014-04-10
EP2561103A4 (en) 2013-08-07
JP5659319B2 (ja) 2015-01-28
EP2561103A1 (en) 2013-02-27
CN103403183B (zh) 2014-10-15
BR112012033760A2 (pt) 2018-02-27
AU2012261664B2 (en) 2014-07-03
KR20140023847A (ko) 2014-02-27
US9547748B2 (en) 2017-01-17
RU2589681C2 (ru) 2016-07-10
CA2948939A1 (en) 2012-12-29
DK2561103T3 (da) 2014-10-20
CN103403183A (zh) 2013-11-20
ZA201209583B (en) 2014-01-29
PL2561103T3 (pl) 2015-02-27
WO2013000100A1 (en) 2013-01-03
MY172864A (en) 2019-12-13
CA2948939C (en) 2021-02-02
CA2791118C (en) 2019-05-07
SG191757A1 (en) 2013-08-30
JP2014520509A (ja) 2014-08-25

Similar Documents

Publication Publication Date Title
KR101489568B1 (ko) 태아 유전학적 이상의 비침습성 검출
KR102184868B1 (ko) 카피수 변이를 판정하기 위한 dna 단편 크기의 사용
JP6161607B2 (ja) サンプルにおける異なる異数性の有無を決定する方法
CN104120181B (zh) 对染色体测序结果进行gc校正的方法及装置
CA3010254C (en) Size-based analysis of fetal dna fraction in maternal plasma
KR20170125044A (ko) 암 스크리닝 및 태아 분석을 위한 돌연변이 검출법
HUE030510T2 (hu) Magzati kromoszómális aneuploidia diagnosztizálása genomszekvenálás alkalmazásával
TW201418474A (zh) 來自血漿之胚胎或腫瘤甲基化模式組(methylome)之非侵入性測定
JP2015512264A (ja) コピー数変異を検出する方法及びシステム
CN113362891A (zh) 用短读测序数据检测重复扩增
JP2015534807A (ja) 胎児の染色体異数性を検出するための非侵襲的方法
EP3018213A1 (en) Method for determining the presence of a biological condition by determining total and relative amounts of two different nucleic acids
TW201441618A (zh) 藉由大量平行rna定序之母體血漿轉錄體分析
EP3662479A1 (en) A method for non-invasive prenatal detection of fetal sex chromosomal abnormalities and fetal sex determination for singleton and twin pregnancies
WO2015035555A1 (zh) 用于确定胎儿是否存在性染色体数目异常的方法、系统和计算机可读介质
TWI489305B (zh) 對胎兒遺傳異常的無創性檢測
WO2018186687A1 (ko) 생물학적 시료의 핵산 품질을 결정하는 방법
CN118136111A (zh) 基因组序列比对方法及其装置
CN115044671A (zh) 可用于胃癌her2伴随诊断的基因甲基化标记物或其组合和应用
KR20200137875A (ko) 2단계 Z-score에 기반한 비침습적 산전 검사 방법 및 장치
GB2564846A (en) Prenatal screening and diagnostic system and method

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
J204 Request for invalidation trial [patent]
J801 Dismissal of trial

Free format text: REJECTION OF TRIAL FOR INVALIDATION REQUESTED 20150430

Effective date: 20150723

Free format text: TRIAL NUMBER: 2015100003010; REJECTION OF TRIAL FOR INVALIDATION REQUESTED 20150430

Effective date: 20150723

FPAY Annual fee payment

Payment date: 20181226

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20191226

Year of fee payment: 6