KR101890466B1 - 고도의 다중 pcr 방법 및 조성물 - Google Patents

고도의 다중 pcr 방법 및 조성물 Download PDF

Info

Publication number
KR101890466B1
KR101890466B1 KR1020157004509A KR20157004509A KR101890466B1 KR 101890466 B1 KR101890466 B1 KR 101890466B1 KR 1020157004509 A KR1020157004509 A KR 1020157004509A KR 20157004509 A KR20157004509 A KR 20157004509A KR 101890466 B1 KR101890466 B1 KR 101890466B1
Authority
KR
South Korea
Prior art keywords
delete delete
primer
dna
target
primers
Prior art date
Application number
KR1020157004509A
Other languages
English (en)
Other versions
KR20150038216A (ko
Inventor
버나드 짐머맨
매튜 엠. 힐
필립 길버트 라크루트
마이클 다드
Original Assignee
내테라, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 내테라, 인코포레이티드 filed Critical 내테라, 인코포레이티드
Priority claimed from US13/683,604 external-priority patent/US20130123120A1/en
Publication of KR20150038216A publication Critical patent/KR20150038216A/ko
Application granted granted Critical
Publication of KR101890466B1 publication Critical patent/KR101890466B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • G06F19/10
    • G06F19/18
    • G06F19/22
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/107Temperature of melting, i.e. Tm
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/143Concentration of primer or probe
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/143Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Organic Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 하나의 반응 용적 속에서 목적한 다수의 핵산 영역을 동시에 증폭시키는 방법 및 이러한 증폭 방법에 사용하기 위한 프라이머의 라이브러리를 선택하는 방법을 제공한다. 본 발명은 또한 증폭된 프라이머 이량체 또는 다른 비-표적 앰플리콘의 최소 형성과 같은, 바람직한 특성을 지닌 프라이머의 라이브러리를 제공한다.

Description

고도의 다중 PCR 방법 및 조성물{HIGHLY MULTIPLEX PCR METHODS AND COMPOSITIONS}
관련 출원의 교차-참조
본 출원은 2012년 11월 21일자로 출원된, 미국 실용신안 출원 일련 번호 제13/683,604호, 및 2012년 7월 24일자로 출원된 미국 가특허원 일련 번호 제61/675,020호의 이익 및 우선권을 청구한다. 미국 실용신안 출원 일련번호 제13/683,604호는 2011년 11월 18일자로 출원된, 미국 실용신안 일련번호 제13/300,235호의 부분 연속 출원이며, 2011년 5월 18일자로 출원된 미국 실용신안 출원 일련번호 제13/110,685호의 부분 연속 출원이고, 2012년 7월 24일자로 출원된 미국 가특허원 일련번호 제61/675,020호의 이익을 청구한다. 미국 실용신안 출원 일련번호 제13/110,685호는 2010년 5월 18일자로 출원된, 미국 가특허원 일련번호 제61/395,850호; 2010년 6월 21일자로 출원된 미국 가특허원 일련 번호 제61/398,159호; 2011년 2월 9일자로 출원된, 미국 가특허원 일련번호 제61/462,972호; 2011년 3월 2일자로 출원된 미국 가특허원 일련번호 제61/448,547호; 및 2011년 4월 12일자로 출원된, 미국 가특허원 일련번호 제61/516,996호의 이익을 청구한다. 미국 실용신안 출원 일련번호 제13/300,235호는 2011년 6월 23일자로 출원된 미국 가특허원 일련번호 제61/571,248호의 이익을 청구한다. 이들 출원 모두의 전문은 본원의 교시를 위해 참조로서 본원에 포함된다.
연방 정부 후원의 연구 또는 개발에 관한 기술
본 연구는 국립 의료원이 승인한 등록 번호 제5R44HD60423-3호에 의해 지원되었다. 미국 정부는 본 출원에 있어서 어떠한 특허 쟁점의 권리를 가질 수 있다.
발명의 분야
본 발명은 일반적으로 하나의 반응 용적의 목적한 다수의 핵산 영역을 연속적으로 증폭시키기 위한 방법 및 조성물에 관한 것이다.
핵산 시료의 검정 처리량을 증가시키고 보다 효율적인 사용을 위하여, 목적한 시료 속의 많은 표적 핵산의 동시에 증폭을 많은 올리고뉴클레오타이드와 시료를 합한 후 당해 시료를 다중 PCR로서 당해 분야에 공지된 공정의 폴리머라제 연쇄 반응(PCR) 조건에 적용시켜 수행할 수 있다. 다중 PCR의 사용은 실험 과정을 유의적으로 단순화시키고 핵산 분석 및 검출에 요구되는 시간을 단축시킬 수 있다. 그러나, 다중 쌍을 동일한 PCR 반응에 가하는 경우, 증폭된 프라이머 이량체와 같은 비-표적 증폭 생성물이 생성될 수 있다. 이러한 생성물을 생성할 위험은, 프라이머의 수가 증가함에 따라 증가한다. 이들 비-표적 앰플리콘(non-target amplicon)은 추가의 분석 및/또는 검정을 위한 증폭된 생성물의 사용을 유의적으로 제한한다. 따라서, 다중 PCR 동안에 비-표적 앰플리콘의 형성을 감소시키기 위한 개선된 방법이 요구된다.
개선된 다중 PCR 방법은 비-침입성 태아 유전 진단(Non-Invasive Prenatal Genetic Diagnosis: NPD)과 같은, 다양한 적용에 유용할 수 있다. 특히, 태아 진단의 현재의 방법은 주치의 및 부모에게 성장하는 태아의 비정상을 경계시킬 수 있다. 태아 진단없이도, 50명의 자녀 중 1명은 심각한 물리적 또는 정신적 장애를 갖고 태어나며, 30명 중의 1명으로 많은 자녀가 선천성 기형의 일부 형태를 가질 것이다. 불행하게도, 표준 방법은, 정확성이 불량하거나, 유산의 위험을 수반하는 침입성 과정을 포함한다. 모계의 혈액 호르몬 수준 또는 초음파 측정을 기반으로 하는 방법은 비-침입성이지만, 이들은 또한, 정확성이 낮다. 양수진단, 융모 생체검사 및 태아 혈액 시료채취는 고도의 정밀성을 갖지만, 침입성이고 유의적인 위험을 수반한다. 양수진단은, 이의 사용 빈도가 과거 15년에 걸쳐 증가되어 왔지만, 미국에서 모든 임산부의 대략 3%에서 수행되었다.
정상의 사람은 모든 건강한 이배체 세포에서 2개 세트의 23개 염색체를 가지며, 1개의 카피는 각각의 부모에서 기원한다. 세포가 너무나 많은 및/또는 너무나 적은 염색체를 함유하는 경우의 핵 세포내 상태는 거대한 퍼센트의 착상 실패, 유산 및 유전 질병에 관여하는 것으로 여겨지고 있다. 염색체 비정상의 검출은 성공적인 임신 기회의 증가 외에, 다른 것들 중에서, 다운 증후군(Down syndrome), 클라인펠터 증후군(Klinefelter's syndrome), 및 터너 증후군(Turner syndrome)과 같은 상태의 개체 또는 배아를 확인할 수 있다. 염색체 비정상에 대한 시험은, 모(mother)의 연령: 35 내지 40세 사이에서 배아의 적어도 40%가 비정상이고, 40세를 초과하면 배아의 50% 이상이 비정상인 것으로 추정되기 때문에 특히 중요하다.
세포 유리된 태아 DNA 및 완전한 태아 세포는 모계 혈액 순환내로 도입될 수 있다는 것이 최근에 발견되었다. 결과적으로, 이러한 유전 물질의 분석은 조기의 NPD를 허용할 수 있다. NPD에 대해 요구되는 민감성 및 특이성을 개선시키고 시간 및 비용을 감소시키는 개선된 방법이 요구되고 있다.
발명의 요약
하나의 측면에서, 본 발명은 핵산 시료 속에서 표적 유전자자리를 증폭시키는 방법을 특징으로 한다. 일부 구현예에서, 당해 방법은 (i) 핵산 시료를 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리에 동시에 하이브리드화하는 시험 프라이머의 라이브러리와 접촉시켜 반응 혼합물을 생산하는 단계; 및 (ii) 상기 반응 혼합물을 프라이머 연장 반응 조건에 적용시켜 표적 앰플리콘을 포함하는 증폭된 생성물을 생산하는 단계를 포함한다. 일부 구현예에서, 당해 방법은 또한 적어도 하나의 표적 앰플리콘(예를 들면, 적어도 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, 또는 99.5%의 표적 앰플리콘)의 존재 또는 부재를 측정하는 단계를 포함한다. 일부 구현예에서, 상기 방법은 또한 적어도 하나의 표적 앰플리콘(예를 들면, 적어도 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, 또는 99.5%의 표적 앰플리콘)의 서열을 측정하는 단계를 포함한다.
본 발명의 측면 중 어느 것의 각종 구현예에서, 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리가 증폭된다. 일부 구현예에서, 증폭된 생성물의 적어도 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, 또는 99.5%는 표적 앰플리콘이다. 일부 구현예에서, 표적 유전자자리 중의 적어도 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, 또는 99.5%가 증폭된다. 다양한 구현예에서, 증폭된 생성물의 60, 50, 40, 30, 20, 10, 5, 4, 3, 2, 1, 0.5, 0.25, 0.1, 또는 0.05% 미만이 프라이머 이량체이다. 일부 구현예에서, 시험 프라이머의 라이브러리는 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 시험 프라이머 쌍을 포함하며, 여기서, 프라이머의 각각의 쌍은 전방(forward) 시험 프라이머 및 동일한 표적 유전자자리에 하이브리드화하는 역 시험 프라이머를 포함한다. 일부 구현예에서, 시험 프라이머의 라이브러리는 상이한 표적 유전자자리에 하이브리드화하는 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 개개 시험 프라이머를 포함하며, 여기서 당해 개개의 프라이머는 프라이머 쌍의 부분이 아니다.
본 발명의 측면 중의 어느 것의 각종 구현예에서, 각각의 시험 프라이머의 농도는 100, 75, 50, 25, 10, 5, 2, 또는 1 nM 미만이다. 각종 구현예에서, 시험 프라이머의 GC 함량은 30 내지 80%, 예를 들면, 40 내지 70% 또는 50 내지 60%이다. 일부 구현예에서, 시험 프라이머의 GC 함량의 범위(예를 들면, 최대 GC 함량 - 최소 GC 함량, 예를 들면, 80% - 60% = 20%의 범위)는 30, 20, 10, 또는 5% 미만이다. 일부 구현예에서, 시험 프라이머의 용융 온도(Tm)는 40 내지 80℃이며, 예를 들면, 포괄적인, 50 내지 70℃, 55 내지 65℃, 또는 57 내지 60.5℃이다. 일부 구현예에서, 시험 프라이머의 용융 온도의 범위는 20, 15, 10, 5, 3, 또는 1℃ 미만이다. 일부 구현예에서, 시험 프라이머의 길이는 15 내지 100개의 뉴클레오타이드이고, 예를 들면, 포괄적인, 15 내지 75개의 뉴클레오타이드, 15 내지 40개의 뉴클레오타이드, 17 내지 35개의 뉴클레오타이드, 18 내지 30개의 뉴클레오타이드, 20 내지 65개의 뉴클레오타이드를 포함한다. 일부 구현예에서, 시험 프라이머는 내부 루프 구조를 형성하는 태그(tag)와 같은 표적 특이적이지 않은 태그를 포함한다. 일부 구현예에서, 당해 태그는 2개의 DNA 결합 영역이다. 각종 구현예에서, 시험 프라이머는 표적 유전자자리에 대해 특이적인 5' 영역, 표적 유전자 자리에 대해 특이적이지 않고 루프 구조를 형성하는 내부 영역, 및 표적 유전자자리에 대해 특이적인 3' 영역을 포함한다. 각종 구현예에서, 3' 영역의 길이는 적어도 7개의 뉴클레오타이드이다. 일부 구현예에서, 3' 영역의 길이는 7 내지 20개의 뉴클레오타이드이며, 예를 들면, 포괄적인, 7 내지 15개의 뉴클레오타이드, 또는 7 내지 10개의 뉴클레오타이드를 포함한다. 각종 구현예에서, 시험 프라이머는 표적 유전자자리에 대해 특이적이지 않은 5' 영역(예를 들면, 태그 또는 공통의 프라이머 결합 부위)에 이어서 표적 유전자자리에 대해 특이적인 영역, 표적 유전자자리에 대해 특이적이지 않고 루프 구조를 형성하는 내부 영역, 및 표적 유전자자리에 대해 특이적인 3' 영역을 포함한다. 일부 구현예에서, 시험 프라이머의 길이의 범위는 50, 40, 30, 20, 10, 또는 5개의 뉴클레오타이드 미만이다. 일부 구현예에서, 표적 앰플리콘의 길이는, 포괄적인, 50 내지 100개의 뉴클레오타이드이고, 예를 들면, 60 내지 80개의 뉴클레오타이드, 또는 60 내지 75개의 뉴클레오타이드를 포함한다. 일부 구현예에서, 표적 앰플리콘의 길이의 범위는 50, 25, 15, 10, 또는 5개의 뉴클레오타이드 미만이다.
본 발명의 측면의 어느 것 중의 각종 구현예에서, 프라이머 연장 반응 조건은 폴리머라제 연쇄 반응 조건(PCR)이다. 각종 구현예에서, 어닐링 단계(annealing step)의 길이는 3, 5, 8, 10, 또는 15분 이상이다. 각종 구현예에서, 연장 단계의 길이는 3, 5, 8, 10, 또는 15분 이상이다.
본 발명의 측면의 어느 것 중의 각종 구현예에서, 시험 프라이머는 태아의 임신한 모친에 기원한 모계 DNA 및 태아 DNA를 포함하는 시료 속에서 적어도 1,000개의 상이한 표적 유전자자리를 동시에 증폭시켜 태아 염색체 기형의 존재 또는 부재를 측정하는데 사용된다. 각종 구현예에서, 상기 방법은 시료 속에서 공통의 프라이머 결합 부위를 DNA 분자에 연결시키는 단계, 연결된 DNA 분자를 적어도 1,000개의 특이적인 프라이머및 공통의 프라이머를 사용하여 증폭시켜 제1 세트의 증폭된 생성물을 생산하는 단계; 및 제1 세트의 증폭된 생성물을 적어도 1,000개 쌍의 특이적인 프라이머를 사용하여 증폭시켜 제2 세트의 증폭된 생성물을 생산하는 단계를 포함한다. 각종의 구현예에서, 적어도 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 프라이머 쌍이 사용된다.
본 발명의 측면의 어느 것 중의 각종 구현예에서, 시험 프라이머는 태아의 추정된 부친의 DNA를 포함하는 시료 속에서 적어도 1,000개의 상이한 표적 유전자자리를 동시에 증폭시키고 태아의 임신한 모친의 모계 DNA 및 태아 DNA를 포함하는 시료 속에서 표적 유전자자리를 동시에 증폭시켜 추정된 아버지가 태아의 생물학적 아버지인지를 확립하는데 사용된다.
본 발명의 측면의 어느 것 중의 각종 구현예에서, 시험 프라이머는 배아의 1개 세포 또는 다수 세포에서 적어도 상이한 1,000개의 표적 유전자자리를 동시에 증폭시켜 염색체 기형의 존재 또는 부재를 측정하는 데 사용된다. 각종 구현예에서, 2개 이상의 배아 세포 세트가 분석되며, 1개의 배아는 시험관내 수정을 위해 선택된다.
본 발명의 측면의 어느 것 중의 각종 구현예에서, 시험 프라이머는 법의학적 핵산 시료 속에서 적어도 1,000개의 상이한 표적 유전자자리를 동시에 증폭시키는데 사용된다. 각종 구현예에서, 어닐링 단계의 길이는 3, 5, 8, 10, 또는 15분 이상이다.
본 발명의 측면의 어느 것 중의 각종 구현예에서, 당해 방법은 시험 프라이머를 사용하여 대조군 핵산 시료 속에서 적어도 1,000개의 상이한 표적 유전자자리를 동시에 증폭시켜 표적 앰플리콘의 제1 세트를 생산하고 시험 핵산 시료 속의 표적 유전자자리를 동시에 증폭시켜 표적 앰플리콘의 제2의 세트를 생산하는 단계; 및 표적 앰플리콘의 제1 및 제2의 세트를 비교하여 표적 유전자자리가 1개의 시료 속에 존재하지만 다른 것에서는 부재하는지, 또는 표적 유전자자리가 대조군 시료와 시험 시료 속에 상이한 수준으로 존재하는지를 측정한다. 각종 구현예에서, 시험 시료는 목적한 질병 또는 표현형(예를 들면, 암), 또는 목적한 질병 또는 표현형에 대한 증가된 위험을 가진 것으로 추측된 개체에서 기원하며; 여기서 표적 유전자자리 중의 하나 이상은 목적한 질병 또는 표현형에 대해 증가된 위험과 관련되거나, 목적한 질병 또는 표현형과 관련된 서열(예를 들면, 다형태 또는 다른 돌연변이)를 포함한다. 각종 구현예에서, 당해 방법은 시험 프라이머를 사용하여 RNA를 포함하는 대조군 시료 속의 상이한 표적 유전자 자리 1,000개를 동시에 증폭시켜 표적 앰플리콘의 제1의 세트를 생산하고 RNA를 포함하는 시험 시료 속의 표적 유전자자리를 동시에 증폭시켜 표적 앰플리콘의 제2 세트를 생산하는 단계; 및 표적 앰플리콘의 제1 및 제2 세트를 비교하여 대조군 시료와 시험 시료 사이의 RNA 발현 수준의 차이의 존재 또는 부재를 측정하는 단계를 포함한다. 각종 구현예에서, RNA는 mRNA이다. 각종 구현예에서, 시험 시료는 목적한 질병 또는 표현형(예를 들면, 암) 또는 목적한 질병 또는 표현형(예를 들면, 암)에 대해 증가된 위험을 가진 것으로 추측된 개체에서 기원하며; 여기서 표적 유전자자리 중의 하나 이상은 목적한 질병 또는 표현형에 대한 증가된 위험과 관련되거나 목적한 질병 또는 표현형과 관련된 서열(예를 들면, 다형성 또는 다른 돌연변이)를 포함한다. 일부 구현예에서, 시험 시료는 목적한 질병 또는 표현형(예를 들면, 암)을 지닌 것으로 진단 된 개체에서 기원하며; 여기서 대조군 시료와 시험 시료 사이의 RNA 발현 수준에 있어서의 차이는, 표적 유전자자리가 목적한 질병 또는 표현형에 대한 증가된 위험 또는 감소된 위험과 관련된 서열(예를 들면, 다형성 또는 다른 돌연변이)을 포함한다.
본 발명의 측면의 어느 것 중의 일부 구현예에서, 시험 프라이머는 본 발명의 방법 중의 어느 것을 사용한 프라이머의 선택과 같은, 하나 이상의 매개변수를 기반으로 한 후보물 프라이머의 라이브러리에서 선택된다. 일부 구현예에서, 시험 프라이머는 적어도 부분적으로 프라이머 이량체를 형성하기 위한 후보물 프라이머의 능력을 기반으로 하여 후보물 프라이머의 라이브러리에서 선택된다.
하나의 측면에서, 본 발명은 후보물 프라이머의 라이브러리에서 시험 프라이머를 선택하는 방법을 특징으로 한다. 각종 구현예에서, 당해 선택은 (i) 컴퓨터 상에서 라이브러리에서 2개의 후보물 프라이머의 대부분 또는 모든 가능한 조합에 대한 비바람직성 점수를 계산하는 단계(여기서 각각의 비바람직성 점수는 적어도 부분적으로 2개의 후보물 프라이머 사이의 이량체 형성의 가능성을 기반으로 한다); (ii) 후보물 프라이머의 라이브러리에서 최대 비바람직성 점수를 지닌 후보물 프라이머를 제거하는 단계; 및 (iii) 단계 (ii)에서 제거된 후보물 프라이머가 프라이머 쌍의 구성원인 경우, 후보물 프라이머의 라이브러리에서 프라이머 쌍의 다른 구성원을 제거하는 단계; 및 (iv) 임의로 단계 (ii) 및 (iii)을 반복함으로써 시험 프라이머의 라이브러리를 선택하는 단계를 포함한다. 일부 구현예에서, 선택 방법은, 라이브러리에 남아있는 후보물 프라이머 배합물에 대한 비바람직성 점수가 모두 최소 한계(minimum threshold) 이하일 때까지 수행된다. 일부 구현예에서, 선택 방법은, 라이브러리 속에 남아있는 다수의 후보물 프라이머가 바람직한 수로 감소될 때까지 수행된다. 다양한 구현예에서, 비바람직성 점수는 라이브러리내 후보물 프라이머의 가능한 배합물의 적어도 적어도 80, 90, 95, 98, 99, 또는 99.5%에 대해 계산된다. 다양한 구현예에서, 라이브러리 속에 남아있는 후보물 프라이머는 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리를 동시에 증폭시킬 수 있다. 다양한 구현예에서, 당해 방법은 또한 (v) 표적 유전자자리를 포함하는 핵산 시료를 라이브러리 속에 남아있는 후보물 프라이머와 접촉시켜 반응 혼합물을 형성시키는 단계; 및 (vi) 상기 반응 혼합물을 프라이머 연장 반응 조건에 적용시켜 표적 앰플리콘을 포함하는 증폭된 생성물을 생산하는 단계를 포함한다.
하나의 측면에서, 본 발명은 후보물 프라이머의 라이브러리에서 시험 프라이머를 선택하는 방법을 특징으로 한다. 다양한 구현예에서, 후보물 프라이머의 라이브러리에서 선택된 시험 프라이머의 선택은 (i) 컴퓨터 상에서 라이브러리에서 2개의 후보물 프라이머의 대부분 또는 모든 가능한 조합에 대해 비바람직성 점수를 계산하는 단계(여기서, 각각의 비바람직성 점수는 적어도 부분적으로 2개의 후보물 프라이머 사이의 이량체 형성 가능성을 기반으로 한다); (ii) 후보물 프라이머의 라이브러리에서 제1의 최소 한계를 초과하는 비바람직성 점수를 갖는 2개의 후보물 프라이머의 배합물의 최대 수 중 일부인 후보물 프라이머를 제거하는 단계; (iii) 단계 (ii)에서 제거된 후보물 프라이머가 프라이머 쌍의 구성원인 경우, 후보물 프라이머의 라이브러리에서 프라이머 쌍의 다른 구성원을 제거하는 단계; 및 (iv) 임의로 단계 (ii) 및 (iii)을 반복함으로써, 시험 프라이머의 라이브러리를 선택하는 단계를 포함한다. 일부 구현예에서, 선택 방법은, 라이브러리 속에 남아있는 후보물 프라이머 배합물에 대한 비바람직성 점수가 모두 제1의 최소 한계 이하일 때까지 수행된다. 일부 구현예에서, 선택 방법은, 라이브러리에 남아있는 후보물 프라이머의 수가 바람직한 수까지 감소될 때까지 수행된다. 다양한 구현예에서, 비바람직성 점수는 라이브러리 속의 후보물 프라이머의 모든 가능한 배합물의 적어도 80, 90, 95, 98, 99, 또는 99.5%에 대해 계산된다. 다양한 구현예에서, 라이브러리 속에 남아있는 후보물 프라이머는 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리를 동시에 증폭시킬 수 있다. 다양한 구현예에서, 당해 방법은 (v) 표적 유전자자리를 포함하는 핵산 시료를 라이브러리 속에 남아있는 후보물 프라이머와 접촉시켜 반응 혼합물을 생산하는 단계; 및 (vi) 반응 혼합물을 프라이머 연장 반응 조건에 적용시켜 표적 앰플리콘을 포함하는 증폭된 생성물을 생산하는 단계를 포함한다.
본 발명의 측면 중 어느 것의 다양한 구현예에서, 선택 방법은 단계 (ii)에 사용된 제1의 최소 한계를 보다 낮은 제2의 최소 한계로 감소시킴으로써 라이브러리 속에 남아있는 후보물 프라이머의 수를 추가로 감소시키는 단계 및 임의로 단계 (ii) 및 (iii)을 반복하는 단계를 포함하다. 일부 구현예에서, 선택 방법은 단계 (ii)에서 사용된 제1의 최소 한계를 보다 높은 제2의 최소 한계로 증가시키는 단계 및 임의로 단계 (ii) 및 (iii)을 반복하는 단계를 포함한다. 일부 구현예에서, 선택 방법은, 라이브러리 속에 남아있는 후보물 프라이머 배합물에 대한 비바람직성 점수가 모두 제2의 최소 한계 이하일 때까지, 또는 라이브러리 속에 남아있는 후보물 프라이머의 수가 바람직한 수로 감소될 때까지 수행된다.
본 발명의 측면 중의 어느 것의 다양한 구현예에서, 상기 방법은, 단계 (i) 전에, 표적 유전자자리에 하이브리드화하는 프라이머를 확인하거나 선택하는 단계를 포함한다. 일부 구현예에서, 다중 프라이머(또는 프라이머 쌍)은 동일한 표적 유전자자리에 하이브리드화하며, 선택 방법은 하나 이상의 매개변수를 기반으로 당해 표적 유전자자리에 대한 하나의 프라이머(또는 하나의 프라이머 쌍)을 선택하기 위해 사용된다. 다양한 구현예에서, 당해 방법은, 단계 (ii) 전에, 다른 프라이머 쌍에 의해 생산된 표적 앰플리콘과 오우버랩되는 표적 앰플리콘을 생산하는 라이브러리에서 프라이머 쌍을 제거하는 단계를 포함한다. 다양한 구현예에서, 후보물 프라이머는 하나 이상의 다른 매개변수를 기반으로 후보물 프라이머의 라이브러리에서의 제거를 위한 비바람직성 점수가 동일한 2개 이상의 후보물 프라이머의 그룹 중에서 선택된다. 일부 구현예에서, 라이브러리 속에 남아있는 후보물 프라이머는 본 발명의 방법 중 어느 것에서 시험 프라이머의 라이브러리로서 사용된다. 일부 구현예에서, 수득되는 시험 프라이머의 라이브러리는 본 발명의 프라이머 라이브러리 중의 어느 것도 포함한다.
본 발명의 측면 중의 어느 것의 다양한 구현예에서, 비바람직성 점수는 적어도 부분적으로 표적 유전자자리의 이형접합성 비율, 표적 유전자자리에서 서열(예: 다형성)과 관련된 질병 우세성, 표적 유전자자리에서 서열(예: 다형성)과 관련된 질병 침투율, 표적 유전자자리에 대한 후보물 프라이머의 특이성, 후보물 프라이머의 크기, 표적 앰플리콘의 용융 온도, 표적 앰플리콘의 GC 함량, 표적 앰플리콘의 증폭 효능, 및 표적 앰플리콘의 크기로 이루어진 그룹 중에서 선택된 하나 이상의 매개변수를 기반으로 한다.
본 발명의 측면 중의 어느 것의 다양한 구현예에서, 비바람직성 점수는 적어도 부분적으로 표적 유전자자리의 이형접합성 비율, 표적 유전자자리에 대한 후보물 프라이머의 특이성; 후보물 프라이머의 크기, 표적 앰플리콘의 용융 온도, 표적 앰플리콘의 GC 함량, 표적 앰플리콘의 증폭 효능, 및 표적 앰플리콘의 크기로 이루어진 그룹 중에서 선택된 하나 이상의 매개변수를 기반으로 하며; 시험 프라이머는 태아의 임신부의 모계 DNA 및 태아 DNA를 포함하는 시료 속의 적어도 1,000개의 상이한 표적 유전자자리를 동시에 증폭시켜 태아 염색체 비정상의 존재 또는 부재를 측정한다. 다양한 구현예에서, 당해 방법은 공통의 프라이머 결합 부위를 시료 속의 DNA 분자에 연결시키는 단계; 연결된 DNA 분자을 적어도 1,000개의 특이적인 프라이머 및 공통의 프라이머를 사용하여 증폭시켜 제1 세트의 증폭된 생성물을 생산하는 단계; 및 제1 세트의 증폭된 생성물을 적어도 1,000개 쌍의 특이적인 프라이머를 사용하여 증폭시켜 제2 세트의 증폭된 생성물을 생산하는 단계를 포함한다. 다양한 구현예에서, 적어도 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 프라이머 쌍이 사용된다. 다양한 구현예에서, 적어도 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리가 증폭된다.
본 발명의 측면 중 어느 것의 다양한 구현예에서, 비바람직성 점수는 적어도 부분적으로 표적 유전자자리의 이형접합성 비율, 표적 유전자자리에 대한 후보물 프라이머의 특이성; 후보물 프라이머의 크기, 표적 앰플리콘의 용융 온도, 표적 앰플리콘의 GC 함량, 표적 앰플리콘의 증폭 효능, 및 표적 앰플리콘의 크기로 이루어진 그룹 중에서 선택된 하나 이상의 매개변수를 기반으로 하며; 시험 프라이머는 태아의 추정 부친(Alleged father)의 DNA를 포함하는 시료 속의 적어도 1,000개의 상이한 표적 유전자자리를 동시에 증폭시키고 태아의 임신부의 모계 DNA 및 태아 DNA를 포함하는 시료 속의 표적 유전자자리를 동시에 증폭시켜 주장된 부친이 태아의 생물학적 부친인지를 확립하는데 사용된다. 다양한 구현예에서, 적어도 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 프라이머 쌍이 증폭된다.
본 발명의 측면 중 어느 것의 다양한 구현예에서, 비바람직성 점수는 적어도 부분적으로 표적 유전자자리의 이형접합성 비율, 표적 유전자자리에 대한 후보물 프라이머의 특이성; 후보물 프라이머의 크기, 표적 앰플리콘의 용융 온도, 표적 앰플리콘의 GC 함량, 표적 앰플리콘의 증폭 효능, 및 표적 앰플리콘의 크기로 이루어진 그룹 중에서 선택된 하나 이상의 매개변수를 기반으로 하며; 시험 프라이머는 태아의 1개 세포 또는 다수 세포에서 적어도 1,000개의 상이한 표적 유전자자리를 동시에 증폭시켜 염색체 이상의 존재 또는 부재를 측정하는데 사용된다. 다양한 구현예에서, 적어도 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리가 증폭된다.
본 발명의 측면 중 어느 것의 다양한 구현예에서, 비바람직성 점수는 적어도 부분적으로 표적 유전자자리의 이형접합성 비율, 표적 유전자자리에 대한 후보물 프라이머의 특이성; 후보물 프라이머의 크기, 표적 앰플리콘의 용융 온도, 표적 앰플리콘의 GC 함량, 표적 앰플리콘의 증폭 효능, 및 표적 앰플리콘의 크기로 이루어진 그룹 중에서 선택된 하나 이상의 매개변수를 기반으로 하며; 시험 프라이머는 외부 핵산 시료에서 적어도 1,000개의 상이한 표적 유전자자리를 동시에 증폭시키는데 사용된다. 다양한 구현예에서, 어닐링 단계의 길이는 3, 5, 8, 10, 또는 15분 이상이다. 다양한 구현예에서, 적어도 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 프라이머 쌍이 증폭된다.
본 발명의 측면 중의 어느 것의 다양한 구현예에서, 비바람직성 점수는 적어도 부분적으로 표적 유전자자리의 이형접합성 비율, 표적 유전자자리의 서열(예: 다형성)과 관련된 질병 유병률, 표적 유전자자리에서 서열(예: 다형성)과 관련된 질병 침투도, 표적 유전자자리에 대한 후보물 프라이머의 특이성, 후보물 프라이머의 크기, 표적 앰플리콘의 용융 온도, 표적 앰플리콘의 GC 함량, 표적 앰플리콘의 효능, 및 표적 앰플리콘의 크기로 이루어진 그룹 중에서 선택된 하나 이상의 매개변수를 기반으로 하며; 당해 방법은 시험 프라이머를 사용하여 적어도 대조군 핵산 내의 1,000개의 상이한 표적 유전자자리를 동시에 증폭시킴으로써 제1 세트의 표적 앰플리콘을 생산하고 시험 핵산 시료 내 표적 유전자자리를 동시에 증폭시킴으로써 제2 세트의 표적 앰플리콘을 생산하는 단계; 및 제1 및 제2 세트의 표적 앰플리콘을 비교하여 표적 유전자자리가 하나의 시료 속에 존재하지만 다른 것에는 존재하지 않는지, 또는 표적 유전자자리가 대조군 시료 및 시험 시료 내 상이한 수준으로 존재하는지를 측정하는 단계를 포함한다. 다양한 구현예에서, 시험 시료는 목적한 질병 또는 표현형, 또는 목적한 질병 또는 표현형에 대한 증가된 위험을 가진 것으로 추측된 개체에서 기원하며; 여기서 하나 이상의 표적 유전자자리는 목적한 질병 또는 표현형에 대한 증가된 위험과 관련되거나, 목적한 질병 또는 표현형과 관련된 표적 유전자자리에서 서열(예: 다형성)을 포함한다. 다양한 구현예에서, 적어도 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리가 증폭된다.
본 발명의 측면 중의 어느 것의 다양한 구현예에서, 비바람직성 점수는 적어도 부분적으로 표적 유전자자리의 이형접합성 비율, 표적 유전자자리의 서열(예: 다형성)과 관련된 질병 유병률, 표적 유전자자리에서 서열(예: 다형성)과 관련된 질병 침투도, 표적 유전자자리에 대한 후보물 프라이머의 특이성, 후보물 프라이머의 크기, 표적 앰플리콘의 용융 온도, 표적 앰플리콘의 GC 함량, 표적 앰플리콘의 효능, 및 표적 앰플리콘의 크기로 이루어진 그룹 중에서 선택된 하나 이상의 매개변수를 기반으로 하며; 당해 방법은 시험 프라이머를 사용하여 RNA를 포함하는 대조군 시료 속의 1,000개의 상이한 표적 유전자자리를 동시에 증폭시킴으로써 제1 세트의 표적 앰플리콘을 생산하고 RNA를 포함하는 시험 시료 내 표적 유전자자리를 동시에 증폭시킴으로써 제2 세트의 표적 앰플리콘을 생산하는 단계; 및 제1 및 제2 세트의 표적 앰플리콘을 비교하여 대조군 시료와 시험 시료 사이의 RNA 발현에 있어서 차이의 존재 또는 부재를 측정하는 단계를 포함한다. 다양한 구현예에서, RNA는 mRNA이다. 다양한 구현예에서, 시험 시료는 목적한 질병 또는 표현형(암과 같은) 또는 목적한 질병 또는 표현형(암과 같은)에 대한 증가된 위험을 가진 것으로 추측된 개체에서 기원하며; 여기서 하나 이상의 표적 유전자자리는 목적한 질병 또는 표현형에 대한 증가된 위험과 관련되거나, 목적한 질병 또는 표현형과 관련된 서열(예: 다형성 또는 다른 돌연변이)을 포함한다. 일부 구현예에서, 시험 시료는 목적한 질병 또는 표현형(암과 같은)으로 진단된 개체에서 기원하며; 여기서 대조군 시료와 시험 시료 사이의 RNA 발현 수준에 있어서의 차이는, 표적 유전자자리가 목적한 질병 또는 표현형에 대해 증가되거나 감소된 위험과 관련된 서열(예를 들면, 다형성 또는 다른 돌연변이)를 포함함을 나타낸다. 다양한 구현예에서, 적어도 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리가 증폭된다.
하나의 측면에서, 본 발명은 프라이머의 라이브러리를 특정으로 한다. 일부 구현예에서, 프라이머는 후보물 프라이머의 라이브러리에서 본 발명의 방법 중 어느 것을 사용하여 선택된다. 일부 구현예에서, 라이브러리는 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리에 동시에 하이브리드화하는 후보물 프라이머의 라이브러리에서 선택된다. 일부 구현예에서, 라이브러리는 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리에 동시에 하이브리드화하는 프라이머를 포함한다. 일부 구현예에서, 라이브러리는 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리를 동시에 증폭시킴으로써 증폭된 생성물의 60, 40, 30, 20, 10, 5, 4, 3, 2, 1, 0.5, 0.25, 0.1, 또는 0.05% 미만이 프라이머 이량체가 되도록 하는 프라이머를 포함하다. 일부 구현예에서, 라이브러리는 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리를 증폭시킴으로써 적어도 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, 또는 99.5%의 증폭된 생성물이 표적 앰플리콘이 되도록 하는 프라이머를 포함한다. 일부 구현예에서, 라이브러리는 표적 유전자자리를 동시에 증폭시킴으로써 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리 이외의 표적화된 유전자자리 중의 적어도 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, 또는 99.5%가 증폭되도록 하는 프라이머를 포함한다. 일부 구현예에서, 프라이머의 라이브러리는 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000 프라이머 쌍을 포함하며, 여기서 프라이머의 각각의 쌍은 전방 시험 프라이머 및 역방 시험 프라이머를 포함하고 여기서 시험 프라이머의 각각의 쌍은 표적 유전자자리에 하이브리드화한다. 일부 구현예에서, 프라이머의 라이브러리는 상이한 표적 유전자자리에 각각 하이브리드화하는 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 개개 프라이머를 포함하며, 여기서 당해 개개 프라이머는 프라이머 쌍들 중 일부가 아니다.
본 발명의 측면 중의 어느 것의 다양한 구현예에서, 각각의 프라이머의 농도는 100, 75, 50, 25, 10, 5, 2, 또는 1 nM 미만이다. 다양한 구현예에서, 프라이머의 GC 함량은 40 내지 70% 또는 50 내지 60%를 포함하는 것과 같은, 30 내지 80%이다. 일부 구현예에서, 프라이머의 GC 함량의 범위는 30, 20, 10, 또는 5% 미만이다. 일부 구현예에서, 프라이머의 용융 온도는 50 내지 70℃, 55 내지 65℃, 또는 57 내지 60.5℃를 포함하는 것과 같은, 40 내지 80℃이다. 일부 구현예에서, 프라이머의 용융 온도의 범위는 15, 10, 5, 3, 또는 1℃ 미만이다. 일부 구현예에서, 프라이머의 길이는 15 내지 75개의 뉴클레오타이드, 15 내지 40개의 뉴클레오타이드, 17 내지 35개의 뉴클레오타이드, 18 내지 30개의 뉴클레오타이드, 또는 20 내지 65개의 뉴클레오타이드를 포함하는 것과 같은, 15 내지 100개의 뉴클레오타이드이다. 일부 구현예에서, 프라이머는 내부 루프 구조를 형성하는 태그와 같은, 표적 특이적이지 않은 태그를 포함한다. 일부 구현예에서, 태그는 2개의 DNA 결합 영역 사이에 있다. 다양한 구현예에서, 프라이머는 표적 유전자자리에 대해 특이적인 5' 영역, 표적 유전자자리에 대해 특이적이지 않고 루프 구조를 형성하는 내부 영역, 및 표적 유전자자리에 대해 특이적인 3' 영역을 포함한다. 다양한 구현예에서, 3' 영역의 길이는 적어도 7 뉴클레오타이드이다. 일부 구현예에서, 3' 영역의 길이는 7 내지 15개의 뉴클레오타이드, 또는 7 내지 10개의 뉴클레오타이드를 포함하는 것과 같은 7 내지 20개의 뉴클레오타이드이다. 다양한 구현예에서, 프라이머는 표적 유전자자리에 대해 특이적이지 않은 5' 영역(다른 태그 또는 공통의 프라이머 결합 부위와 같은)에 이어서 표적 유전자자리에 대해 특이적인 영역, 표적 유전자자리에 대해 특이적이지 않은 내부 영역, 및 표적 유전자자리에 대해 특이적인 3' 영역을 포함한다. 일부 구현예에서, 프라이머의 길이의 범위는 50, 40, 30, 20, 10, 또는 5개 미만의 뉴클레오타이드이다. 일부 구현예에서, 표적 앰플리콘의 길이는 60 내지 80개의 뉴클레오타이드, 또는 60 내지 75개의 뉴클레오타이드를 포함하는 것과 같은 50 내지 100개의 뉴클레오타이드이다. 일부 구현예에서, 표적 앰플리콘의 길이의 범위는 50, 25, 15, 10, 또는 5개 미만의 뉴클레오타이드이다.
하나의 측면에서, 본 발명은 핵산 시료 속에서 표적 유전자자리를 증폭하기 위한 본 발명의 프라이머 라이브러리 중 어느 것을 포함한 키트(kit)를 제공한다. 일부 구현예에서, 당해 키트는 라이브러리를 사용하여 표적 유전자자리를 증폭시키기 위한 설명서를 포함한다.
하나의 측면에서, 본 발명은 잉태된 태아 내 염색체의 배수성 상태를 측정하는 방법을 특징으로 한다. 일부 구현예에서, 당해 방법은 핵산 시료를 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 다형성 유전자자리에 동시에 하이브리드화하는 프라이머의 라이브러리와 접촉시켜 반응 혼합물을 생산함을 포함하며; 여기서 핵산 시료는 태아 모친의 모계 DNA 및 태아의 태아 DNA를 포함한다. 일부 구현예에서, 반응 혼합물은 프라이머 연장 반응 조건에 적용시켜 증폭된 생성물을 생산하고; 당해 증폭된 생성물은 고 배출 서열분석기로 측정하여 서열분석 데이터를 생산하며; 다형성 유전자자리에서 대립유전자 수는 서열분석 데이터를 기반으로 컴퓨터에서 계산되며; 염색체의 상이한 가능한 배수성 상태에 관한 각각의 배수성 가설 다수가 컴퓨터에서 생성되며; 염색체 상의 다형성 유전자자리에서 예측된 대립유전자 수에 대한 결합 분포 모델(joint distribution model)을 컴퓨터 상에서 각각의 배수성 가설에 대해 정립하고; 배수성 가설 각각의 상대적인 가능성을 컴퓨터 상에서 결합 분포 모델 및 대립유전자 수를 사용하여 측정하며; 태아의 배수성 상태는 최대 확률을 갖는 가설에 상응하는 배수성 상태를 선택함으로써 요청(calling)된다.
하나의 측면에서, 본 발명은 잉태된 태아에서 염색체의 배수성 상태를 측정하는 방법을 특징으로 한다. 일 구현예에서, 잉태된 태아에서 염색체의 배수성 상태를 측정하는 방법은 태아 모친의 모계 DNA 및 태아의 태아 DNA를 포함하는 제1의 DNA 시료를 수득하는 단계, DNA를 분리함으로써 제1의 시료를 제조하여 제조된 시료를 수득하는 단계, 염색체 상의 다수의 다형성 유전자자리에서 제조된 시료 속의 DNA를 측정하는 단계, 컴퓨터 상에서 제조된 시료 상에서 제조된 DNA 측정에 의한 다수의 다형성 유전자자리에서 대립유전자 수를 계산하는 단계, 컴퓨터 상에서 각각 염색체의 상이한 가능한 배수성 상태에 관한 다수의 배수성 가설을 생성하는 단계, 컴퓨터 상에서 각각의 배수성 가설에 대한 염색체 상에서 다수의 다형성 유전자자리에서 예측된 대립유전자 수에 대한 결합 분포 모델을 구축하는 단계, 컴퓨터 상에서 결합 분포 모델 및 제조된 시료 상에서 측정된 대립유전자 수를 사용하여 배수성 가설 각각의 상대적인 가능성을 측정하는 단계, 및 최대 확률을 지닌 가설에 상응하는 배수성 상태를 선택함으로써 태아의 배수성 상태를 요청하는 단계를 포함한다.
하나의 측면에서, 본 발명은 모계 및 태아 DNA의 혼합물을 포함하는 시료 속에서 염색체의 비정상적인 분포에 대한 시험 방법을 특징으로 한다. 일부 구현예에서, 당해 방법은 (i) 시료를 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리에 동시에 하이브리드화하는 프라이머의 라이브러리와 접촉시켜 반응 혼합물을 생산하는 단계(여기서, 표적 유전자자리는 다수의 상이한 염색체에서 기원되고; 다수의 상이한 염색체는 시료 속에 비정상적인 분포를 갖는 것으로 예측된 적어도 하나의 제1의 염색체 및 시료 속에 일반적으로 분포된 것으로 예측된 적어도 하나의 제2의 염색체를 포함한다); (ii) 반응 혼합물을 프라이머 연장 반응 조건에 적용시켜 증폭된 생성물을 생산하는 단계; (iii) 증폭된 생성물을 서열분석하여 표적 유전자자리에 대해 지정된 다수의 서열 태그를 수득하는 단계(여기서, 서열 태그는 특이적인 표적 유전자자리에 지정되기에 충분한 길이이다); (iv) 컴퓨터 상에서 다수의 서열 태그를 이들의 상응하는 표적 유전자자리에 지정하는 단계; (v) 컴퓨터 상에서 제1의 염색체의 표적 유전자자리에 지정된 서열 태그의 수 및 제2의 염색체의 표적 유전자자리에 지정된 서열 태그의 수를 측정하는 단계; 및 (vi) 컴퓨터 상에서 단계 (v)에서 나온 수를 비교하여 제1의 염색체의 비정상 분포의 존재 또는 부재를 측정하는 단계를 포함한다.
하나의 측면에서, 본 발명은 태아 이수성의 존재 또는 부재를 측정하는 방법을 제공한다. 일부 구현예에서, 당해 방법은 (i) 모계 및 태아 DNA의 혼합물을 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 비-다형성 표적 유전자자리에 동시에 하이브리드화하는 프라이머의 라이브러리와 접촉시켜 반응 혼합물을 생산하는 단계(여기서, 표적 유전자자리는 다수의 상이한 염색체에서 기원한다); (ii) 반응 혼합물을 프라이머 연장 반응 조건에 적용시켜 표적 앰플리콘을 포함하는 증폭된 생성물을 생산하는 단계; (iii) 컴퓨터 상에서 목적한 제1 및 제2의 염색체의 표적 앰플리콘의 상대적 빈도를 정량화하는 단계; (iv) 컴퓨터 상에서 목적한 제1 및 제2의 염색체의 표적 앰플리콘의 상대적 빈도를 비교하는 단계; 및 (v) 목적한 제1 및 제2의 염색체의 비교된 상대적 빈도를 기반으로 이수성의 존재 또는 부재를 확인하는 단계를 포함한다. 일부 구현예에서, 제1의 염색체는 정배수성인 것으로 추측된 염색체이다. 일부 구현예에서, 제2의 염색체는 이수성인 것으로 추측된 염색체이다.
하나의 측면에서, (a) 태아 및 모계 게놈 DNA를 포함하는 모계 조직 시료로부터 태아 및 모계 게놈 DNA의 혼합물을 수득하는 단계, (b) 단계 (a)의 태아 및 모계 게놈 DNA의 혼합물에서 무작위로 선택된 DNA 단편의 거대한 평행 DNA 서열분석을 수행하여 상기 DNA 단편의 서열을 측정하는 단계, (c) 단계 (b)에서 수득된 서열이 속하는 염색체를 확인하는 단계, (d) 단계 (c)의 데이터를 사용하여 모계 및 태아 게놈 DNA의 상기 혼합물 중 적어도 하나의 제1의 염색체의 양을 측정하는 단계(여기서, 상기 적어도 하나의 제1의 염색체는 태아 속에서 정배수성인 것으로 추정된다), (e) 단계 (c)의 데이터를 사용하여 모계 및 태아 게놈 DNA의 상기 혼합물 중 제2의 염색체의 양을 측정하는 단계(여기서, 상기 제2의 염색체는 태아 속의 이수성이 되는 것으로 추측된다), (f) 태아 및 모계 DNA의 혼합물 중 태아 DNA의 분획을 계산하는 단계, (g) 제2의 표적 염색체가 정배수성인 경우, 단계 (d)에서의 수를 사용하여 제2의 표적 염색체의 양의 예측된 분포를 게산하는 단계, (h) 제2의 표적 염색체가 이수성인 경우, 단계 (d)의 제1의 수 및 단계 (f)에서 태아 및 모계 DNA의 혼합물 중 태아 DNA의 계산된 분획을 사용하여 제2의 표적 염색체의 양의 예측된 분포를 계산하는 단계, 및 (i) 최대 확률 또는 최대 후순위 접근법을 사용하여 단계 (e)에서 측정된 제2의 염색체의 양이 단계 (g)에서 계산된 분포 또는 단계 (h)에서 계산된 분포의 일부일 가능성이 보다 더 있는지를 측정함으로써; 태아 이수성의 존재 또는 부재를 나타내는 단계를 포함하는, 태아 및 모계 게놈 DNA를 포함하는 모계 조직 시료 속에서 태아 이수성의 존재 또는 부재를 측정하기 위한 방법이 기재되어 있다.
본 발명의 측면 중의 어느 것의 다양한 구현예에서, 당해 방법은 또한 태아의 한쪽 또는 양쪽 부모의 유전형 데이터를 수득하는 단계를 포함한다. 일부 구현예에서, 태아의 한쪽 또는 양쪽 부모의 유전형 데이터를 수득하는 단계는 부모의 DNA를 제조하는 단계(여기서 당해 제조 단계는 다수의 다형성 유전자자리에서 DNA를 우선적으로 농축시키는 단계, 임의로, 제조된 부모 DNA를 증폭시키는 단계를 포함한다), 및 다수의 다형성 유전자자리에서 제조된 시료 중 모계 DNA를 측정하는 단계를 포함한다.
본 발명의 측면 중의 어느 것의 다양한 구현예에서, 염색체에서 다수의 다형성 유전자자리의 예측된 대립유전자 수 가능성에 대한 결합 분포 모델을 구축하는 단계는 한쪽 또는 양쪽 부모로부터 수득된 유전 데이터를 사용하여 수행된다. 일부 구현예에서, 시료(예를 들면, 제1의 시료)는 모계 혈장에서 분리되었으며, 여기서 모친으로부터 유전형 데이터를 수득하는 것은 제조된 시료에서 이루어진 DNA 측정을 통해 얻은 모계 유전형 데이터를 평가하여 수행한다.
하나의 측면에서, 잉태된 태아 속의 염색체의 배수성 상태를 측정하는 것을 돕는 진단 박스(diagnostic box)가 기재되어 있으며, 여기서 당해 진단 박스는 본 발명의 방법 중의 어느 것의 제조 및 측정 단계를 실행할 수 있다.
본 발명의 측면 중의 어느 것의 다양한 구현예에서, 대립유전자 수는 이원성이라기 보다는 확률론적이다. 일부 구현예에서, 다수의 다형성 유전자자리에서 제조된 시료 중 DNA의 측정을 또한 사용하여 태자녀 하나 또는 다수의 질병 결합된 일배체형을 유전받았는지를 측정한다.
본 발명의 측면중의 어느 것의 다양한 구현예에서, 대립유전자 수 가능성에 대한 결합 분포 모델을 구축하는 것은 염색체 속의 상이한 위치에서 교차하는 염색체의 가능성에 대한 데이터를 사용하여 염색체 상의 다형성 대립유전자 사이의 의존성을 모델화함으로써 수행한다. 일부 구현예에서, 대립유전자 수에 대한 결합 분포 모델을 구축하고 각각의 가설의 상대적인 가능성을 측정하는 단계는 참조 염색체의 사용을 필요로 하지 않는 방법을 사용하여 수행한다.
본 발명의 측면 중의 어느 것의 다양한 구현예에서, 각각의 가설의 상대적 가능성을 측정하는 것은 제조된 시료 속의 태아 DNA의 추정된 분획을 사용하도록 한다. 일부 구현예에서, 대립혈질 수 가능성을 게산하고 각각의 가설의 상대적인 가능성을 측정하는데 사용된 제조된 시료의 DNA 측정은 1차의 유전 데이터를 포함한다. 일부 구현예에서, 최대 확률을 지닌 가설에 상응하는 배수성 상태를 선택하는 것은 최대 확률 평가 또는 최대 후순위 추정을 사용하여 수행한다.
본 발명의 측면 중의 어느 것의 다양한 구현예에서, 태아의 배수성 상태를 요청하는 것은 또한 결합 분포 모델을 사용하여 측정한 배수성 가설 및 대립유전자 수 가능성을 실제 수 분석으로 일어진 그룹 중에서 취한 통계적 기술을 사용하여 계산된 배수성 가설 각각의 상대적 가능성과 결합시키는 단계, 모계 유전 정보가 사용된 경우 유일하게 이용가능한 통계인, 이형접합성 비율, 시료(예를 들면, 제1의 시료) 또는 제조된 시료, 및 이의 조합의 추정된 태아 분획을 사용하여 계산된 통계인, 특정의 부모 관계에 대해 표준화된 유전형 신호의 가능성을 비교하는 단계를 포함한다.
본 발명의 측면 중의 어느 것의 다양한 구현예에서, 신뢰 추정치는 요청된 배수성 상태에 대해 계산된다. 일부 구현예에서, 당해 방법은 또한 태아의 요청된 배수성 상태를 기반으로 한 임상 작용을 고려하는 단계를 포함하며, 여기서 임상 작용은 임신을 종료하거나 임신을 유지하는 것 중의 하나에서 선택된다.
본 발명의 측면 중의 어느 것의 다양한 구현예에서, 당해 방법은 임신 4 내지 5주째; 임신 5 내지 6주째; 임신 6 내지 7주째; 임신 7 내지 8주째; 임신 8 내지 9주째; 임신 9 내지 10주째; 임신 10 내지 12주째; 임신 12 내지 14주째; 임신 14 내지 20주째; 임신 20 내지 40주째; 처음 3개월; 두번째 3개월; 세번째 3개월; 또는 이의 조합에서 태아에 대해 수행될 수 있다.
본 발명의 측면 중의 어느 것의 다양한 구현예에서, 잉태된 태아에서 염색체의 측정된 배수성 상태를 나타내는 보고는 당해 벙법을 사용하여 생성하였다. 일부 구현예에서, 본 발명의 방법 중 어느 것을 사용하도록 설계된 잉태된 태아에서 표적 염색체의 배수성 상태를 측정하기 위한 키트가 기재되어 있으며, 당해 키트는 다수의 내부 전방 프라이머 및 임의로 다수의 내부 역방 프라이머를 포함하고, 여기서 프라이머 각각은, 표적 염색체, 및 임의로 추가 염색체 상의 다형성 부위 중 하나의 상부 및/또는 하부에 바로 DNA의 영역에 하이브리드화하도록 설계되며, 여기서 하이브리드화 영역은 소수의 염기에 의해 다형성 부위에서 분리되며, 여기서 소수는 1, 2, 3, 4, 5, 6 내지 10, 11 내지 15, 16 내지 20, 21 내지 25, 26 내지 30, 31 내지 60, 및 이의 조합으로 이루어진 그룹 중에서 선택된다.
하나의 측면에서, 본 발명은 주장하는 아버지가 임신모에서 잉태중인 태아의 생물학적 아버지인지를 확립하기 위한 방법을 특징으로 한다. 일부 구현예에서, 당해 방법은 (i) 주장된 부친의 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 다형성 유전자자리를 포함하는 다수의 다형성 유전자자리를 동시에 증폭시켜 제1 세트의 증폭된 생성물을 생산하는 단계; (ii) 임신모에서 채취한 생물학적 시료의 DNA의 혼합된 시료에서 상응하는 다수의 다형성 유전자자리를 동시에 증폭시켜 제2 세트의 증폭된 생성물을 생산하는 단계(여기서 DNA의 혼합된 시료는 태아 DNA 및 모계 DNA를 포함한다); (iii) 컴퓨터 상에서 주장된 아버지가 태아의 생물학적 아버지일 가능성을 제1 및 제2 세트의 증폭된 생성물을 기반으로 한 유전형 측정을 사용하여 측정하는 단계, 및 (iv) 주장된 아버지가 태아의 생물학적 아버지일 측정된 가능성을 사용하여 주장된 아버지가 태아의 생물학적 아버지인지를 측정하는 단계를 포함한다. 다양한 구현예에서, 당해 방법은 모친의 유전 물질에서 상응하는 다수의 다형성 유전자자리를 동시에 증폭시켜 제3 세트의 증폭된 생성물을 생산하는 단계를 추가로 포함하며; 여기서 주장된 아버지가 태아의 생물학적 아버지인 가능성은 제1, 제2, 및 제3 세트의 증폭된 생성물을 기반으로 유전형 측정을 사용하여 측정한다.
하나의 측면에서, 본 발명은 배아의 세트의 각 배자녀 경우에 따라 발달할 상대적 가능성을 평가하는 방법을 제공한다. 일부 구현예에서, 당해 방법은 각각의 배아에서 채취한 시료를 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리에 동시에 하이브리드화하는 프라이머의 라이브러리와 접촉시켜 각각의 배아에 대한 반응 혼합물을 생산하는 단계를 포함하며, 상기 시료는 배아의 하나 이상의 세포에서 각각 채취한다. 일부 구현예에서, 각각의 반응 혼합물은 프라이머 연장 반응 조건에 적용되어 증폭된 생성물을 생산한다. 일부 구현예에서, 당해 방법은 컴퓨터 상에서 증폭된 생성물을 기반으로 각각의 배아의 적어도 하나의 세포의 하나 이상의 특성을 측정하는 단계; 및 컴퓨터 상에서 각각의 배자녀 경우에 따라 발달할 상대적 가능성을 각각의 배아에 대한 적어도 하나의 세포의 하나 이상의 특성을 기반으로 추정하는 단계를 포함한다.
하나의 측면에서, 본 발명은 핵산 시료 속에서 2개 이상의 표적 유전자자리의 양을 측정하는 방법을 특징으로 한다. 일부 구현예에서, 당해 방법은 (i) PCR을 사용하여 제1의 표준 유전자자리, 제2의 표준 유전자자리, 제1의 표적 유전자자리, 및 제2의 표적 유전자자리를 포함하는 핵산 시료를 증폭시켜 증폭된 생성물을 형성하는 단계(여기서 제1의 표준 유전자자리 및 제1의 표적 유전자자리는 동일한 수의 뉴클레오타이드를 갖지만 하나 이상의 뉴클레오타이드에서 상이한 서열을 가지며; 여기서 제2의 표준 유전자자리 및 제2의 표적 유전자자리는 동일한 수의 뉴클레오타이드를 갖지만 하나 이상의 뉴클레오타이드에서 상이한 서열을 갖는다); (ii) 증폭된 생성물을 서열분석하여 증폭된 제2의 표준 유전자자리와 비교된 증폭된 제1의 표준 유전자자리의 상대적인 양을 비교하는 표준 비를 측정하는 단계(여기서 당해 표준 비는 제1의 표준 유전자자리 및 제2의 표준 유전자자리의 증폭에 대한 PCR 효능에 있어서의 차이를 나타낸다); (iii) 증폭된 제2의 표적 유전자자리에 대해 비교된 증폭된 제1의 표적 유전자자리의 상대적인 양을 비교하는 표적 비를 측정하는 단계; 및 (iv) 단계 (iii)에서 측정한 표적 비를 단계 (ii)에서 측정한 표준 비를 기반으로 조절하여 시료 속에서 제1의 표적 유전자자리 및 제2의 표적 유전자자리의 상대적인 양을 측정하는 단계를 포함한다. 다양한 구현예에서, 상기 방법은 시료속에서 제1의 표적 유전자자리 및 제2의 표적 유전자자리의 절대적인 양을 측정하는 단계를 포함한다. 다양한 구현예에서, 당해 방법은 시료 속에서 표적 유전자자리(예를 들면, 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리)의 존재 또는 부재를 측정하는 단계를 추가로 포함한다. 다양한 구현예에서, 당해 방법은 본 발명의 프라이머 라이브러리 중 어느 것도 사용하는 단계를 포함한다. 다양한 구현예에서, 당해 방법은 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리를 동시에 증폭시키는 단계를 포함한다.
하나의 측면에서, 본 발명은 분석용 시료 속에서 다수의 유전적 표적을 정량적으로 측정하는 방법을 특징으로 한다. 일부 구현예에서, 당해 방법은 (i) 분석용 시료에서 기원한 유전 물질을 다수의 표적 특이적인 증폭 시약, 및 표적 특이적인 증폭 시약 표적에 상응하는 다수의 표준 서열과 혼합하는 단계; (ii) 유전 물질 및 표준 서열의 표적 영역을 증폭시켜 표적 앰플리콘 및 표준 서열 앰플리콘을 증폭시키는 단계; 및 (iii) 생산된 표적 앰플리콘 및 표준 서열 앰플리콘의 양을 측정하는 단계를 포함한다. 일부 구현예에서, 유전 물질은 유전자 라이브러리 속에 존재한다. 일부 구현예에서, 유전 표적은 다형성 유전자자리(SNP와 같은)이다. 일부 구현예에서, 양의 측정은 서열을 계수함으로써 달성한다. 일부 구현예에서, 당해 방법은 유전자 라이브러리가 기원하는 시료 속의 적어도 하나의 염색체의 추정된 카피 수를 측정하는 단계를 추가로 포함하며, 여기서 당해 측정은 표적 앰플리콘의 수를 표준 앰플리콘의 서열 판독물의 수와 비교하는 단계를 포함한다. 일부 구현예에서, 표준 서열 및 유전자 라이브러리는 동일한 프라이머에 의해 프라이밍될 수 있는 공통의 프라이밍 부위를 포함한다. 일부 구현예에서, 혼합 단계는 적어도 10; 100, 500; 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 특이적인 증폭 시약 및 적어도 10; 100, 500; 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 표준 서열을 포함한다. 다양한 구현예에서, 당해 방법은 본 발명의 프라이머 라이브러리중 어느 것을 사용하는 단계를 포함한다. 다양한 구현예에서, 당해 방법은 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 영역을 동시에 증폭시키는 단계를 포함한다. 일부 구현예에서, 각각의 표준 서열의 상대적인 양은 알려져 있다. 일부 구현예에서, 각각의 서열의 상대적인 양은 참조 게놈과 관련하여 교정되어 왔다. 일부 구현예에서, 분석용 시료는 태아 및 모계 게놈의 혼합물을 포함한다. 일부 구현예에서, 분석용 시료는 임신한 여성에서 또는 혈액 혈장에서 채취한다. 일부 구현예에서, 참조 게놈은 염색체 13, 18, 21, X, 또는 Y에서 이수성과 같은, 적어도 하나의 이수성을 갖는다. 일부 구현예에서, 참조 게놈은 이배체이다.
하나의 측면에서, 본 발명은 다수의 유전 표준 서열을 포함하는 혼합물을 특징으로 하며, 여기서 혼합물 중의 각각의 유전 표준 서열의 상대적인 양은 참조 게놈에 대해 교정하여 측정하여 왔다. 다양한 구현예에서, 혼합물은 적어도, 10; 100; 500; 10,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 유전 표준 서열을 포함한다. 다양한 구현예에서, 유전 표준 서열은 제1의 공통의 프라이밍 부위, 제2의 공통의 프라이밍 부위, 제1의 표적 특이적인 프라이밍 부위, 제2의 표적 특이적인 프라이밍 부위, 및 제1과 제2의 표적 특이적인 프라이밍 부위 사이에 위치한 마커 서열을 포함하며, 여기서 제1의 표적 특이적인 부위 및 제2의 표적 특이적인 프라이밍 부위는 제1과 제2의 공통의 프라이밍 부위 사이에 위치한다. 다양한 구현예에서, 교정은 본 발명의 프라이머 라이브러리 중 어느 것을 사용함을 포함한다. 다양한 구현예에서, 상기 교정은 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000의 상이한 표적 영역을 동시에 증폭시키는 단계를 포함한다. 일부 구현예에서, 참조 게놈은 염색체 13, 18, 21, X, 또는 Y에서 이수성과 같은, 적어도 하나의 이수성을 갖는다. 일부 구현예에서, 참조 게놈은 이배체이다.
하나의 측면에서, 본 발명은, 계산된 유전 표준 서열이 세트를 생산하는 방법을 특징으로 한다. 일부 구현예에서, 당해 방법은 (i) 참조 게놈으로 제조된 유전자 라이브러리, 다수의 표적 특이적인 증폭 프라이머 시약 세트, 및 표적 특이적인 증폭 시약 세트에 상응하는 다수의 유전 표준 서열을 포함하는 증폭 반응 혼합물을 형성시키는 단계, (ii) 유전자 라이브러리 및 유전 표준 서열을 증폭시켜 표적 서열에서 앰플리콘 및 유전 표준 서열에서 앰플리콘을 생산하는 단계, (iii) 표적 서열에서 앰플리콘 및 유전 표준 서열에서 앰플리콘을 측정하는 단계, 및 (iv) 각각의 유전 표준 서열의 상대적인 양을 각각에 대해 측정함으로써 다수의 유전 표준 서열을 교정하는 단계를 포함한다. 다양한 구현예에서, 적어도 10; 100, 500; 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 유전 표준 서열이 사용된다. 다양한 구현예에서, 당해 방법은 본 발명의 프라이머 라이브러리 중 어느 것도 사용함을 포함한다. 다양한 구현예에서, 당해 방법은 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 서열을 동시에 증폭시키는 단계를 포함한다. 일부 구현예에서, 참조 게놈은 염색체 13, 18, 21, X, 또는 Y에서 이수성과 같은, 적어도 하나의 이수성을 갖는다. 일부 구현예에서, 참조 게놈은 이배체이다.
하나의 측면에서, 본 발명은 본 발명의 방법들 중 어느 것에 따라 계산된 유전 표준 서열의 세트를 제공한다. 하나의 측면에서, 본 발명은, 방법이 수행되기 전, 동안 또는 후에 교정될 수 있는 유전 표준 서열의 세트를 제공한다.
하나의 측면에서, 본 발명은 결실을 갖는 적어도 하나의 대립유전자를 갖는 다수의 목적 유전자의 카피를 측정하는 방법을 특징으로 한다. 일부 구현예에서, 당해 방법은 (i) 분석용 시료에서 기원한 유전 물질을 목적 유전자에 대해 특이적이고 목적 유전자의 대립유전자를 포함하는 결실을 특이적으로 증폭시킬 수 없는 증폭 시약, 목적 유전자에 상응하는 표준 서열, 참조 서열에 대해 특이적인 증폭 시약, 및 참조 서열에 상응하는 표준 서열과 혼합하는 단계; (ii) 목적 유전자 서열, 목적 유전자에 상응하는 표준 서열, 참조 서열, 및 참조 서열에 상응하는 표준 서열을 증폭시켜 목적 앰플리콘의 유전자, 참조 서열 앰플리콘, 및 표준 서열 앰플리콘의 유전자를 생산하는 단계; 및 (iii) 생산된 표적 앰플리콘 및 표준 서열 앰플리콘의 양을 측정하는 단계를 포함한다. 일부 구현예에서, 양을 측정하는 단계는 서열 판독물을 계수함으로써 달성된다. 일부 구현예에서, 당해 방법은, 유전자 라이브러리가 기원한 시료 속의 적어도 하나의 염색체의 추정된 카피 수를 측정하는 단계를 추가로 포함하며, 여기서 당해 측정은 표적 앰플리콘의 다수의 서열을 표준 앰플리콘의 다수의 서열과 비교하는 단계를 포함한다. 일부 구현예에서, 표준 서열 및 유전자 라이브러리는 동일한 프라이머에 의해 프라이밍될 수 있는 공통의 프라이밍 부위를 포함한다. 일부 구현예에서, 각각의 서열의 상대적인 양은 참조 게놈과 관련하여 계산되어 왔다. 다양한 구현예에서, 적어도 10; 100, 500; 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 유전 표준 서열이 사용된다. 다양한 구현예에서, 당해 방법은 본 발명의 프라이머 라이브러리 중의 어느 것도 사용하는 단계를 포함한다. 다양한 구현예에서, 당해 방법은 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 영역을 동시에 증폭시키는 단계를 포함한다. 일부 구현예에서, 참조 게놈은 이배체이다. 일부 구현예에서, 분석용 시료는 혈액에서 채취한다.
본 발명의 측면중의 어느 것의 일부 구현예에서, 표적 유전자자리(예: 다수의 다형성 유전자자리)에서 시료(예: 제1의 시료)의 DNA를 우선적으로 농축시키는 것은 다수의 예비-원형화된 프로브를 수득하는 단계(여기서, 각각의 프로브는 유전자자리(예: 다형성 유전자자리) 중 하나를 표적화하고, 여기서 프로브의 3' 및 5' 말단은 바람직하게는 소수의 염기에 의해 유전자자리의 다형성 부위로 제조된 DNA의 영역에 하이브리드화하도록 설계되며, 여기서 소수는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 내지 25, 26 내지 30, 31 내지 60, 또는 이의 조합이다), 예비-원형화된 프로브를 시료(예: 제1의 시료)의 DNA에 하이브리드화하는 단계, DNA 폴리머라제를 사용하여 하이브리드화된 프로브 말단 사이에 갭을 충전시키는 단계, 예비-원형화된 프로브를 원형화시키는 단계, 및 원형화된 프로브를 증폭시키는 단계를 포함한다.
본 발명의 측면중의 어느 것의 일부 구현예에서, 표적 유전자자리(예: 다수의 다형성 유전자자리)에서 DNA를 우선적으로 농축시키는 것은 다수의 연결-매개된 PCR 프로브를 수득하는 단계(여기서 각각의 PCR 프로브는 표적 유전자자리(예: 다형성 유전자자리) 중의 하나를 표적화하고, 여기서 PCR 프로브의 상부 및 하부는 소수의 염기에 의해 유전자자리의 다형성 부위에서 바람직하게 분리된 DNA의 하나의 쇄 상의 DNA 영역에 하이브리드로하도록 설계되며, 여기서 소수는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 to 25, 26 내지 30, 31 내지 60, 또는 이의 조합이다), 연결-매개된 PCR 프로브를 시료(예: 제1의 시료)의 DNA에 하이브리드화하는 단계, 연결-매개된 PCR 프로브 말단 사이의 갭을 DNA 폴리머라제를 사용하여 충전시키는 단계, 연결-매개된 PCR 프로브를 연결시키는 단계, 및 연결된 연결-매개된 PCR 프로브를 증폭시키는 단계를 포함한다.
본 발명의 다양한 측면의 일부 구현예에서, 표적 유전자자리(예: 다수의 다형성 유전자자리)에서 DNA를 우선적으로 농축시키는 것은 유전자자리(예: 다형성 유전자자리)를 표적화하는 다수의 하이브리드의 포획 프로브를 수득하는 단계, 하이브리드 포획 프로브를 시료(예: 제1의 시료)의 DNA에 하이브리드화하는 단계 및 DNA의 시료(예: 제1의 시료)에서 하이브리드화되지 않은 DNA 중 일부 또는 모두를 물리적으로 제거하는 단계를 포함한다.
본 발명의 측면중의 어느 것의 일부 구현예에서, 하이브리드 포획 프로브는 다형성 부위와 플랭킹(flanking)되어 있지만 다형성 부위와 중첩되지 않은 영역에 하이브리드화하도록 설계되어 있다. 일부 구현예에서, 하이브리드 포획 프로브는 다형성 부위와 플랭킹되어 있지만 다형성 부위와 중첩되지 않는 영역에 하이브리드화하도록 설계되며, 여기서 플랭킹 포획 프로브의 길이는 약 120개 미만의 염기, 약 110개 미만의 염기, 약 100개 미만의 염기, 약 90개 미만의 염기, 약 80개 미만의 염기, 약 70개 미만의 염기, 약 60개 미만의 염기, 약 50개 미만의 염기, 약 40개 미만의 염기, 약 30개 미만의 염기, 및 약 25개 미만의 염기로 이루어진 그룹 중에서 선택될 수 있다. 일부 구현예에서, 하이브리드 포획 프로브는 다형성 부위와 중첩된 영역에 하이브리드화하도록 설계되며, 여기서 다수의 하이브리드 포획 프로브는 각각의 다형성 유전자자리에 대해 적어도 2개의 하이브리드 포획 프로브를 포함하며, 여기서 각각의 하이브리드 포획 프로브는 다형성 유전자자리에서 상이한 대립유전자에 대해 상보성이 되도록 설계된다.
본 발명의 측면 중의 어느 것의 일부 구현예에서, 다수의 다형성 유전자자리에서 DNA를 우선적으로 농축시키는 것은 다수의 내부 전방(inner forward) 프라이머를 수득하는 단계(여기서 각각의 프라이머는 다형성 유전자자리 중 하나를 표적화하고, 여기서 내부로 향한 프라이머의 3' 말단은 다형성 부위의 DNA 상부의 영역에 하이브리드화하도록 설계되어 소수의 염기에 의해 다형성 부위에서 분리되며, 여기서 소수는 1, 2, 3, 4, 5, 6 내지 10, 11 내지 15, 16 내지 20, 21 내지 25, 26 내지 30, 또는 31 내지 60개의 염기 쌍으로 이루어진 그룹 중에서 선택된다), 다수의 내부 역 프라이머를 임의로 수득하는 단계(여기서 각각의 프라이머는 다형성 유전자자리 중 하나를 표적화하고, 여기서 내부 역 프라이머의 3' 말단은 다형성 부위의 DNA 상부의 영역에 하이브리드화하도록 설계되어 소수의 염기에 의해 다형성 부위에서 분리되며, 여기서 소수는 1, 2, 3, 4, 5, 6 내지 10, 11 내지 15, 16 내지 20, 21 내지 25, 26 내지 30, 또는 31 내지 60개의 염기쌍으로 이루어진 그룹 중에서 선택된다), 내부 프라이머를 DNA에 하이브리드화하는 단계, 및 DNA를 폴리머라제 연쇄 반응을 사용하여 증폭시켜 앰플리콘을 형성시키는 단계를 포함한다.
본 발명의 측면중의 어느 것의 일부 구현예에서, 당해 방법은 또한 다수의 외부로 향한(outer forward) 프라이머를 수득하는 단계(여기서 각각의 프라이머는 표적(예: 다형성 유전자자리) 중의 하나를 표적화하고, 여기서 외부로 향한 프라이머는 내부로 향한 프라이머의 상부의 DNA 영역에 하이브리드화하도록 설계된다), 다수의 외부로 향한 프라이머를 수득하는 단계(여기서 각각의 프라이머는 표적 유전자자리(예: 다형성 유전자자리) 중의 하나를 표적화하고, 여기서 외부 역 프라이머는 내부 역 프라이머의 바로 하부의 DNA의 영역에 하이브리드화하도록 설계된다), 제1의 프라이머를 DNA에 하이브리드화하는 단계, 및 DNA를 폴리머라제 연쇄 반응을 사용하여 증폭시키는 단계를 포함한다.
본 발명의 측면 중의 어느 것의 일부 구현예에서, 당해 방법은 또한 다수의 외부 역방 프라이머를 수득하는 단계(여기서 각각의 프라이머는 다형성 유전자자리 중의 하나를 표적화하며, 여기서 외부 역방 프라이머는 내부 역방 프라이머의 바로 하부의 DNA의 영역에 하이브리드화하도록 설계된다), 다수의 외부 전방 프라이머를 임의로 수득하는 단계(여기서 각각의 프라이머는 표적 유전자자리(예를 들면, 다형성 유전자자리) 중의 하나를 표적화하고, 여기서 외부 전방 프라이머는 내부 전방 프라이머의 DNA 상부의 영역에 하이브리드화하도록 설계되어 있다), 제1의 프라이머를 DNA에 하이브리드화시키는 단계, 및 DNA를 폴리머라제 연쇄 반응을 사용하여 증폭시키는 단계를 포함한다.
본 발명의 측면 중의 어느 것의 일부 구현예에서, 시료(예: 제1의 시료)를 제조하는 것은 시료(예: 제1의 시료) 속의 DNA에 공통의 어댑터(adapter)를 붙이는 단계 및 시료(예: 제1의 시료) 속의 DNA를 폴리머라제 연쇄 반응을 사용하여 증폭시키는 단계를 포함한다. 일부 구현예에서, 증폭된 앰플리콘 중의 적어도 하나의 분획은 100 bp 미만, 90 bp 미만, 80 bp 미만, 70 bp 미만, 65 bp 미만, 60 bp 미만, 55 bp 미만, 50 bp 미만, 또는 45 bp 미만이고, 상기 분획은 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 99%이다.
본 발명의 측면 중의 어느 것의 일부 구현예에서, DNA를 증폭시키는 것은 하나 또는 다수의 개개의 반응 용적 속에서 수행되며, 여기서 각각의 개개 반응 용적은 100개 이상의 상이한 전방 및 역방 프라이머 쌍, 200개 이상의 상이한 전방 및 역방 프라이머 쌍, 500개 이상의 상이한 전방 및 역방 프라이머 쌍, 1,000개 이상의 상이한 전방 및 역방 프라이머 쌍, 2,000개 이상의 상이한 전방 및 역방 프라이머 쌍, 5,000개 이상의 상이한 전방 및 역방 프라이머 쌍, 10,000개 이상의 상이한 전방 및 역방 프라이머 쌍, 20,000개 이상의 상이한 전방 및 역방 프라이머 쌍, 50,000개 이상의 상이한 전방 및 역방 프라이머 쌍, 또는 100,000개 이상의 상이한 전방 및 역방 프라이머 쌍을 함유한다.
본 발명의 측면 중의 어느 것의 일부 구현예에서, 시료(예: 제1의 시료)를 제조하는 것은 시료(예: 제1의 시료)를 다수의 부위로 나누는 단계를 포함하고, 여기서 각각의 부위 속의 DNA는 표적 유전자자리(예: 다수의 다형성 유전자자리)의 소세트에서 우선적으로 농축된다. 일부 구현예에서, 내부 프라이머는 프라이머 쌍들을 유사하게 확인함으로써 바람직하지 않은 프라이머 이본쇄(duplexe)를 형성시키고 다수의 프라이머의 바람직하지 않은 프라이머 이본쇄를 형성하는 경향이 있는 것으로 확인된 적어도 하나의 프라이머 쌍을 제거함으로써 선택된다. 일부 구현예에서, 내부 프라이머는 표적화된 유전자자리(예: 다형성 유전자자리)의 상부 또는 하부에 하이브리드화도록 설계된 영역을 함유하며, 임의로 PCR 증폭하도록 설계된 공통의 프라이밍 서열을 함유한다. 일부 구현예에서, 프라이머 중 적어도 일부는 각각의 개개 프라이머 분자에 대해 상이한 무작위 영역을 추가로 함유한다. 일부 구현예에서, 프라이머 중의 적어도 일부는 분자 바코드를 추가로 함유한다.
본 발명의 측면 중의 어느 것의 일부 구현예에서, 우선적인 농축은 제조된 시료 및 2의 인자 이하, 1.5의 인자 이하, 1.2의 인자 이하, 1.1의 인자 이하, 1.05의 인자 이하, 1.02의 인자 이하, 1.01의 인자 이하, 1.005의 인자 이하, 1.002의 인자 이하, 1.001의 인자 이하, 및 1.0001의 인자 이하로 이루어진 그룹 중에서 선택된 인자의 시료(예: 제1의 시료) 사이에 평균 정도의 대립유전자 편향을 생성한다. 일부 구현예에서, 다수의 다형성 유전자자리는 SNP이다. 일부 구현예에서, 제조된 시료 속에서 DNA를 측정하는 것은 서열분석으로 달성된다.
본 발명의 측면 중의 어느 것의 일부 구현예에서, 표적 유전자자리는 동일한 목적 핵산(예를 들면, 동일한 염색체 또는 염색체의 동일한 영역)에 존재한다. 일부 구현예에서, 표적 유전자자리의 적어도 일부는 상이한 목적 핵산(예를 들면, 상이한 염색체)에 존재한다. 일부 구현예에서, 핵산 시료는 단편화되거나 분해된 핵산을 포함한다. 일부 구현예에서, 핵산 시료는 게놈 DNA, cDNA, 또는 mRNA를 포함한다. 일부 구현예에서, 핵산 시료는 단일 세포의 DNA를 포함한다. 일부 구현예에서, 핵산 시료는 실질적으로 세포를 포함하지 않는 혈액 또는 혈장 시료이다. 일부 구현예에서, 핵산 시료는 혈액, 혈장, 타액, 정액, 정자, 세포 배양 상층액, 점액 분비, 치아 플라크, 위장관 조직, 대변, 뇨, 모발, 골, 체액, 눈물, 조직, 피부, 손톱, 난할, 배아, 양수, 융모막 시료, 담즙, 림프액, 자궁경관 점액, 또는 법의학적 시료를 포함하거나 이들에서 기원한다. 일부 구현예에서, 표적 유전자자리는 사람 핵산의 분절이다. 일부 구현예에서, 표적 유전자자리는 단일 뉴클레오타이드 다형성(SNP)을 포함하거나 이로 이루어진다. 일부 구현예에서, 프라이머는 DNA 분자이다.
본 발명의 측면 중의 어느 것의 일부 구현예에서, 시료(예: 제1의 시료) 속의 DNA는 모계 혈장에서 비롯된다. 일부 구현예에서, 시료(예: 제1의 시료)를 제조하는 것은 DNA를 증폭시키는 단계를 포함한다. 일부 구현예에서, 시료(예: 제1의 시료)를 제조하는 것은 표적 유전자자리(예: 다수의 다형성 유전자자리)에서 시료(예: 제1의 시료) 속에 DNA를 우선적으로 농축시키는 단계를 포함한다.
다양한 구현예에서, 프라이머 연장 반응 또는 폴리머라제 연쇄 반응은 폴리머라제에 의한 하나 이상의 뉴클레오타이드의 첨가를 포함한다. 다양한 구현예에서, 프라이머 연장 반응 또는 폴리머라제 연쇄 반응은 연결-매개된 PCR을 포함하지 않는다. 다양한 구현예에서, 프라이머 연장 반응 또는 폴리머라제 연쇄 반응은 리가제에의해 2개의 프라이머를 결합하는 단계를 포함하지 않는다. 다양한 구현예에서, 프라이머는 또한 예비-순환된 프로브, 예비-순환되는 프로브, 순환되는 프로브, 패드록 프로브(Padlock probe), 또는 분자 역 브로브(Molecular Inversion Probe: MIP)로 또한 불릴 수 있는 연결된 역위 프로브(Inverted Probe: LIP)를 포함하지 않는다.
본원에 기술된 본 발명의 측면 및 양태는 "포함하는", "이루어진", 및 "필수적으로 이루어진" 측면 및 양태를 포함하는 것으로 이해된다.
정의
단일 뉴클레오타이드 다형성( SNP )은 동일한 종의 2개의 구성원의 게놈 사이에서 상이할 수 있는 단일 뉴클레오타이드를 말한다. 당해 용어의 사용은, 각각의 변이체가 발생하는 빈도에 있어서의 어떠한 제한도 내포하지 않아야 한다.
서열은 DNA 서열 또는 유전 서열을 말한다. 이는 개체에서 DNA 분자 또는 쇄의 주요, 물리적 구조를 말할 수 있다. 이는 DNA 분자에서 발견된 뉴클레오타이드의 서열, 또는 DNA 분자에 대한 상보성 쇄를 말할 수 있다. 이는 인실리코( in silico)내에서 이의 표시로서 DNA 분자에 함유된 정보를 말할 수 있다.
유전자자리는 SNP를 언급할 수 있는, 개체의 DNA 상의 목적한 특수 영역, 가능한 삽입 또는 결실의 부위, 또는 일부의 다른 관련된 유전적 변화의 부위를 말한다. 질병-연결된 SNP는 또한 질병-연결된 유전자자리를 말할 수 있다.
다형성 대립유전자, 또한 "다형성 유전자자리"는, 유전형이 소정의 종 내에서 개체들 사이에서 변하는 유전자자리 또는 대립유전자를 말한다. 다형성 대립유전자의 일부 예는 단일 뉴클레오타이드 다형성, 짧은 탄뎀 반복체, 결실, 중복, 및 역전을 포함한다.
다형성 부위는 개체들 사이에서 변하는 다형성 영역에서 발견된 특수 뉴클레오타이드를 말한다.
대립유전자는 특수 유전자자리를 점유한 유전자를 말한다.
유전 데이터 또는 "유전형 데이터 ( Genotypic Data )"는 한명 이상의 개체의 게놈의 측면을 기술하는 데이터를 말한다. 이는 유전자자리 중 하나 또는 한 세트, 부분 또는 전체 서열, 부분 또는 전체 염색체, 또는 전체 게놈을 말할 수 있다. 이는 하나 또는 다수의 뉴클레오타이드의 동일성을 나타낼 수 있고; 이는 연속 뉴클레오타이드의 세트 또는 게놈 내 다른 위치의 뉴클레오타이드, 또는 이의 조합을 말할 수 있다. 게놈형 데이터는 전형적으로 인실리코이지만, 화학적으로 암호화된 유전 데이터로서 서열내에 물리적 뉴클레오타이드를 고려하는 것이 또한 가능하다. 유전형 데이터는 개체 "상의", "의", "에서", "로부터" 또는 "상의"인 것으로 일컬어질 수 있다. 유전형 데이터는, 이의 측정이 유전 물질 상에서 이루어지는 경우 유전형 플랫폼(genotyping platform)에서의 산출량 측정을 말할 수 있다.
유전 물질 또는 "유전 시료"는 DNA 또는 RNA를 포함하는 한 명 이상의 개체의 조직 또는 혈액과 같은 물리적 물질을 말한다.
노이지 유전 데이터(Noisy Genetic Data)는 다음 중의 어느 하나를 지닌 유전 데이터를 말한다: 대립유전자 드롭아웃(dropout), 불특정 염기 쌍 측정, 부정확한 염기 쌍 측정, 잃어버린 염기 쌍 측정, 삽입 또는 결실의 불특정 측정, 염색체 분절 카피 수의 불특정 측정, 가짜 신호, 잃어버린 측정, 다른 오차, 또는 이의 조합.
신뢰는 명명된 SNP, 대립유전자, 대립유전자의 세트, 배수성 요청(call), 또는 염색체 분절 카피의 측정된 수가 개체의 실제 유전 상태를 정확하게 나타내는 통계적 가능성을 말한다.
배수성 요청, 또한 "염색체 카피 수 요청", 또는 "카피 수 요청"(CNC)은 세포 내에 존재하는 하나 이상의 염색체의 양 및/또는 염색체 실체를 측정하는 작용을 말할 수 있다.
이수성은, 염색체의 잘못된 수(예를 들면, 완전한 염색체의 잘못된 수 또는 염색체 분절의 잘못된 수, 예를 들면, 염색체 분절의 결실 또는 중복의 존재)가 세포 속에 존재하는 상태를 말한다. 체세포 사람 세포의 경우에, 이는, 세포가 22개 쌍의 상염색체 및 1개 쌍의 성 염색체를 함유하지 않는 경우를 말할 수 있다. 사람 배우자의 경우, 이는, 세포가 23개 염색체 각각 중의 하나를 함유하지 않는 경우를 말할 수 있다. 단일 염색체 유형의 경우에, 이는, 2개 이상 또는 미만의 동종이나 동일하지 않은 염색체 카피가 존재하거나, 동일한 부모에서 기원하는 2개의 염색체 카피가 존재하는 경우를 말할 수 있다. 일부 구현예에서, 염색체 분절의 결실은 미세결실이다.
배수성 상태는 세포내에서 하나 이상의 염색체 유형의 양 및/또는 염색체 실체를 말한다.
염색체는 정상의 체세포내에서 46개체 DNA의 단일 분자를 의미하는 단일 염색체 카피를 말할 수 있으며, 예는 '모친에서 기원한 염색체 18'이다. 염색체는 또한 정상의 사람 체세포내에 23개가 존재하는 염색체 유형을 말할 수 있으며; 예는 '염색체 18'이다.
염색체 실체는 관련 염색체 수, 즉 염색체 유형을 말할 수 있다. 정상의 사람은 22개의 유형의 번호가 매겨진 자가 염색체 유형, 및 2개 유형의 성 염색체를 가진다. 이는 또한 염색체의 부모계 기원으로 언급될 수 있다. 이는 또한 부모로부터 유전된 특수 염색체를 말할 수 있다. 이는 또한 염색체의 다른 확인하는 특징을 말할 수 있다.
유전 물질의 상태 또는 단순히 "유전 상태"는 DNA 상의 SNP의 세트의 실체, 유전 물질의 단계적인 일배체형, 및 삽입, 결실, 반복 및 돌연변이를 포함하는 DNA의 서열을 말할 수 있다. 이는 또한 하나 이상의 염색체, 염색체 분절, 또는 염색체 분절의 세트의 배수성 상태를 말할 수 있다.
대립유전자 데이터는 하나 이상의 대립유전자의 세트에 관한 유전형 데이터의 세트를 말한다. 이는 단계적인, 일배체 데이터를 말할 수 있다. 이는 SNP 실체를 말할 수 있으며, 이는 삽입, 결실, 반복 및 돌연변이를 포함하는, DNA의 서열 데이터를 말할 수 있다. 이는 각각의 대립유전자의 부모계 기원을 포함할 수 있다.
대립유전자 상태는 하나 이상의 대립유전자의 세트내 유전자의 실제 상태를 말한다. 이는 대립유전자 데이터로 기술된 유전자의 실제 상태를 말할 수 있다.
대립유전자 비( Allelic Ratio 또는 allele ratio)는 시료 또는 개체에 존재하는 유전자자리에서 각각의 대립유전자의 양 사이의 비를 말한다. 시료를 서열분석으로 측정한 경우, 대립유전자 비는 유전자자리에서 각각의 대립유전자에 대해 맵핑되는 서열 판독물의 비를 말할 수 있다. 시료를 측정 방법을 기반으로 강도에 의해 측정한 경우, 대립유전자 비는 측정 방법에 의해 평가된 것으로서 이러한 유전자자리에 존재하는 각각의 대립유전자의 양의 비를 말할 수 있다.
대립유전자 수는 특정한 유전자자리에 대해 맵핑한 서열의 수를 말하며, 유전자자리가 다형성인 경우, 이는 대립유전자 각각에 대해 맵핑하는 서열의 수를 말한다. 각각의 대립유전자를 이원성 양식으로 계수하는 경우, 대립유전자 수는 정수(whole number)일 것이다. 대립유전자가 확률론적으로 계수되는 경우, 대립유전자 수는 분획 수일 수 있다.
대립유전자 수 확률은 특정한 유전자자리 또는 다형성 유전자자리에서 대립유전자의 세트에 맵핑할 가능성이 있고, 맵핑의 확률로 결합된 서열의 수를 말한다. 대립유전자 수는, 각각의 계수된 서열에 대한 맵핑의 확률이 이원성(0 또는 1)인 경우, 대립유전자 수 가능성과 동등하다. 일부 구현예에서, 대립유전자 수 가능성은 이원성일 수 있다. 일부 구현예에서, 대립유전자 수 확률은 DNA 측정과 동등할 세트일 수 있다.
대립유전자 분포, 또는 '대립유전자 수 분포'는 유전자자리의 세트내 각각의 유전자자리에 대해 존재하는 각각의 대립유전자의 상대적인 양을 말한다. 대립유전자 분포는 개체, 시료, 또는 시료에서 이루어진 측정 세트를 말할 수 있다. 서열분석과 관련하여, 대립유전자 분포는 다형성 유전자자리의 세트내 각각의 대립유전자에 대해 특정한 대립유전자에 대해 맵핑되는 판독물의 수 또는 가능한 수를 말한다. 대립유전자 측정은 확률적으로, 즉, 소정의 대립유전자가 소정의 서열 판독물에 대해 존재할 가능성이 0 내지 1 사이의 분획이거나, 이들이 이원 양식으로 처리될 수 있는, 즉, 어떠한 소정의 판독물도 특정한 대립유전자의 정확하게 0 또는 1개 카피인 것으로 고려되는 가능성일 수 있다.
대립유전자 분포 양식은 상이한 부모 관계에 대한 대립유전자 분포들의 세트를 말한다. 특정의 대립유전자 분포 양식은 특정의 배수성 상태의 지표일 수 있다.
대립유전자 편향은 DNA의 원래의 시료 속에 존재한 비에 대해 상이한 이형접합성 유전자자리에서 대립유전자의 측정된 비가 DNA의 원래의 시료 속에 존재한 비와 상이한 정도를 말한다. 특정한 유전자자리에서 대립유전자 바이어스 정도는 이러한 유전자자리에서 원래의 DNA 시료 속에서 대립유전자의 비로 나눈, 측정된 것으로서, 이러한 대립유전자에서 관찰된 대립유전자 비와 동등하다. 대립유전자 편형은 0 초과인 것으로 정의될 수 있음으로써, 대립유전자 편향의 정도의 계산이 1 미만인 값, x로 되는 경우, 대립유전자 편향의 정도는 1/x로 재언급될 수 있다. 대립유전자 편향은 증폭 편향, 정제 편향, 또는 상이한 대립유전자에 상이하게 영향을 미치는 일부 다른 현상에 기인할 수 있다.
프라이머 , 또한 "PCR 프로브"는 단일 DNA 분자(DNA 올리고머) 또는 DNA 분자(DNA 올리고머)의 수집을 말하며, 여기서 DNA 분자는 동일하거나, 거의 동일하며, 여기서 프라이머는 표적화된 유전자자리(예를 들면, 표적화된 다형성 유전자자리 또는 비다형성 유전자자리)에 하이브리드화하도록 설계된 영역을 함유하며, PCR 증폭을 허용하도록 설계된 프라이밍 서열을 함유할 수 있다. 프라이머는 또한 분자 바코드(molecular barcode)를 함유할 수 있다. 프라이머는 각각의 개개 분자에 대해 상이한 무작위 영역을 함유할 수 있다. 용어 "시험 프라이머" 및 "후보물 프라이머"는 제한하는 것을 의미하지 않으며 본원에 개시된 프라이머 중의 어느 것을 의미할 수 있다.
프라이머의 라이브러리는 2개 이상의 프라이머의 집단을 말한다. 다양한 구현예에서, 라이브러리는 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 프라이머를 포함한다. 다양한 구현예에서, 라이브러리는 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 프라이머 쌍을 포함하고, 여기서 프라이머의 각각의 쌍은 전방 시험 프라이머 및 역방 시험 프라이머를 포함하고, 여기서 시험 프라이머의 각각이 쌍은 표적 유전자자리에 하이브리드화된다. 일부 구현예에서, 프라이머의 라이브러리는 상이한 표적 유전자자리에 각각 하이브리드화하는 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 개개 프라이머를 포함하며, 여기서 개개 프라이머는 프라이머 쌍들의 부분이 아니다. 일부 구현예에서, 라이브러리는 (i) 프라이머 쌍 및 (ii) 프라이머 쌍의 부분이 아닌 개개 프라이머(예를 들면, 공통의 프라이머) 둘 모두를 갖는다.
하이브리드 포획 프로브는 PCR 또는 직접적인 합성과 같은 다양한 방법에 의해 생성되고, 시료 속의 특이적인 표적 DNA 서열 중의 1개의 쇄에 대해 상보성인 것으로 의도된, 가능하게는 변형된, 특정 핵산 서열을 말한다. 외인성 하이브리드 포획 프로브는 제조된 시료에 가하여 변성-재어닐링 공정(deanture-reannealing process)을 통해 하이브리드화되어 외인성-내인성 단편의 이본체를 형성할 수 있다. 이들 이본체는 이후에 시료에서 각종 수단에 의해 물리적으로 분리될 수 있다.
서열 판독물은 클론 서열분석 방법을 사용하여 측정된 뉴클레오타이드 염기의 서열을 나타내는 데이터를 말한다. 클론 서열분석은 하나의 원래의 DNA 분자 중의 하나, 또는 클론, 또는 집단을 나타내는 서열 데이터를 생산할 수 있다. 서열 판독물은 또한 뉴클레오타이드가 정확하게 요청된 확률을 나타내는 서열의 각각의 염기 위치에서 관련된 품질 점수를 가질 수 있다.
서열 판독물의 맵핑은 특정한 유기체의 게놈 서열 내 오리진의 서열 판독물의 위치를 측정하는 공정이다. 서열 판독물의 오리진의 위치는 판독물의 뉴클레오타이드 서열 및 게놈 서열의 유사성을 기반으로 한다.
조화된 카피 오차, 또한 "조화되는 염색체 이수성"(MCA)은, 하나의 세포가 2개의 동일하거나 거의 동일한 염색체를 함유하는 이수성의 상태를 말한다. 이러한 유형의 이수성은 감수분열시 생식세포의 형성 동안에 발생할 수 있으며 감수분열 비-괴리 오차(meiotic non-disjunction error)로 언급될 수 있다. 이러한 유형의 오차는 감수분열시 발생할 수 있다. 조화되는 삼염색체성은, 소정의 염색체의 3개의 카피가 개체에서 존재하고 카피 중 2개가 동일한 경우를 말할 수 있다.
조화되지 않은 카피 오차, 또한 "유일한 염색체 이수성"(UCA)은, 하나의 세포가 동일한 부모에서 기원하는 2개의 염색체를 함유하는 경우의 이수성의 상태를 말하며, 동종일 수 있지만 동일하지 않을 수 있다. 이러한 유형의 이수성은 감수분열 동안 발생할 수 있으며, 감수분열 오차로 언급될 수 있다. 조화되지 않는 삼염색체성은, 소정의 염색체의 3개의 카피가 개체에 존재하고 카피 중의 2개가 동일한 환자에서 기원하며, 동종이지만 동일하지 않은 경우를 말한다. 조화되지 않는 삼염색체성은, 하나의 부모의 2개의 동종 염색체가 존재하는 경우, 및 염색체의 일부 분절이 동일하지만 다른 분절은 거의 동종인 경우를 말할 수 있다.
동종 염색체는 감수분열 동안에 일반적으로 쌍을 이루는 유전자의 동일한 세트를 함유하는 염색체 카피를 말한다.
동일한 염색체는, 동일한 유전자 세트를 함유하고 각각의 유전자에 대해 이들이 동일하거나 거의 동일한 대립유전자의 동일한 세트를 갖는 염색체 카피를 말한다.
대립유전자 드롭 아웃( ADO )은 특정 대립유전자에서 동종 염색체의 염기 쌍들 세트의 염기 쌍 중 적어도 하나가 검출되지 않는 상황을 말한다.
유전자자리 드롭 아웃(LDO)은 특정 대립유전자에서 동종 염색체의 일단의 염기 쌍에 속한 염기 쌍 둘 모두 검출되지 않는 상황을 말한다.
동형접합성은 상응하는 염색체 유전자자리로서 유사한 대립유전자를 갖는 것을 말한다.
이형접합성은 상응하는 염색체 유전자자리로서 같지 않은 대립유전자를 갖는 것을 말한다.
이형접합성 비율은 소정의 유전자자리에서 이형접합성 대립유전자를 갖는 집단내 개체의 비율을 말한다. 이형접합성 비율은 개체에서 소정의 유전자자리, 또는 DNA의 시료에서 예측되거나 측정된 대립유전자의 비율을 말할 수 있다.
고도의 정보성 단일 뉴클레오타이드 다형성( HISNP )은, 태자녀 모의 유전형 속에 존재하지 않는 대립유전자를 갖는 SNP를 말한다.
염색체 영역은 염색체, 또는 완전한 염색체의 분절을 말한다.
염색체의 분절은 크기의 범위가 하나의 염기 쌍에서 전체 염색체까지 이를 수 있는 염색체의 구획을 말한다.
염색체는 완전한 염색체, 또는 염색체의 분절 또는 구획을 말한다.
카피는 염색체 분절의 카피의 수를 말한다. 이는 염색체 분절의 동일한 카피, 또는 동일하지 않은 동종의 카피를 말할 수 있으며, 여기서 염색체 분절의 상이한 카피는 실질적으로 유사한 세트의 유전자자리를 함유하고 여기서 하나 이상의 유전자자리는 상이하다. M2 카피 오차와 같은 이수성의 일부 경우에서, 동일한 소정의 염색체 분절의 일부 카피 및 동일하지 않은 동일한 염색체 분절의 일부 카피를 가지는 것이 가능하다.
일배체형은 동일한 염색체 상에서 함께 전형적으로 유전된 다수의 유전자자리에서 대립유전자의 조합을 말한다. 일배체형은 2개와 같이 적은 유전자자리 또는 소정의 유전자자리의 세트 사이에서 발생하는 재조합 현상의 수에 의존한 전체 염색체를 말할 수 있다. 일배체형은 또한 통계적으로 관련된 단일 염색분체 상의 단일의 뉴클레오타이드 다형성(SNP)의 세트를 말할 수 있다.
일배체형 데이터 또한 "단계적인 데이터" 또는 "정돈된 유전 데이터"는 이배체 또는 배수체 게놈내 단일 염색체, 즉, 이배체 게놈내 염색체의 격리된 모계 또는 부계 카피의 데이터를 말한다.
단계화는 개체의 소정의 정돈되지 않은, 이배체(또는 다배수성(poluploidy)) 유전 데이터의 일배체형 유전 데이터를 측정하는 작용을 말한다. 이는 하나의 염색체에서 발견된 대립유전자의 세트에 대해, 대립유전자에서 2개의 유전자 중 어느 것이 개체에서 2개의 동종 염색체 각각과 연관되어 있는지를 측정하는 작용을 말할 수 있다.
단계적인 데이터는, 하나 이상의 일배체형이 측정된 유전 데이터를 말한다.
가설은 소정의 유전자자리 세트에서 가능한 배수성 상태, 또는 소정의 유전자자리의 세트에서 가능한 대립유전자 상태의 세트를 말한다. 가능성 세트는 하나 이상의 성분을 포함할 수 있다.
카피 수 가설, 또한 "배수성 상태 가설"은 개체에서 염색체의 카피의 수에 관한 가설을 말한다. 이는 또한 각 염색체의 기원인 부모를 포함하는, 염색체 각각의 실체, 및 부모의 2개의 염색체 중 어느 것이 개체에서 존재하는지에 관한 가설을 말할 수 있다. 이는 또한, 관련된 개체의 염색체 또는 염색체 분절이 있는 경우, 어느 염색체 또는 염색체 분절이 개체의 특정 염색체에 유전적으로 상응하는지에 관한 가설을 말한다.
표적 개체는, 유전 상태가 측정되는 개체를 말한다. 일부 구현예에서, DNA의 제한된 양만 표적 개체에서 얻을 수 있다. 일부 구현예에서, 표적 개체는 태자녀다. 일부 구현예에서, 하나 이상의 표적 개체가 존재할 수 있다. 일부 구현예에서, 한 쌍의 부모에서 기원한 각각의 태아는 표적 개체인 것으로 고려될 수 있다. 일부 구현예에서, 측정되는 유전 데이터는 대립유전자 요청 중의 하나 또는 세트이다. 일부 구현예에서, 측정되는 유전 데이터는 배수성 요청이다.
관련된 개체는 표적 개체과 일배체형 블록을 공유하고, 이와 유전적으로 관련된 특정 개체를 말한다. 이와 관련하여, 관련된 개체는 표적 개체의 유전적 모친, 또는 정자, 극성체, 배아, 태아, 또는 자녀와 같은, 부모에서 기원한 특정 유전물질일 수 있다. 이는 또한 형제, 부모 또는 조부모를 말할 수 있다.
형제자매는 이의 부모가 문제의 개체과 동일한 특정 개체를 말한다. 일부 구현예에서, 이는 태어난 자녀, 배아, 또는 태자녀거나, 태어난 자녀, 배아, 또는 태아에서 기원하는 하나 이상의 세포를 말할 수 있다. 형제자매는 또한 정자, 극성체, 또는 일배체 유전 물질의 어떠한 다른 세트와 같은 부모 중의 하나에서 기원한 일배체 개체를 말할 수 있다. 개체는 자체의 형제자매인 것으로 고려될 수 있다.
태아는 "태아의" 또는 "태아와 유전적으로 유사한 태반의 영역의"를 말한다. 임신한 여성에서, 태반의 일부 부위는 태아와 유전적으로 유사하며, 모계 혈액에서 발견된 자유로이 부유하는 태아 DNA는 태아와 조화된 유전형을 지닌 태반의 일부에서 기원할 수 있다. 태아에서 염색체의 반의 유전 정보는 태아의 모친으로부터 유전됨을 주목한다. 일부 구현예에서, 태아 세포에서 비롯된 이들 모체 유전된 염색체의 DNA는 "태아 기원의"인 것으로 간주되며, "모체 기원의" 것이 아니다.
태아 기원의 DNA는, 이의 유전형이 태아의 유전형과 필수적으로 동일한 세포의 원래의 부분에 있던 DNA를 말한다.
모체 기원의 DNA는 이의 유전형이 모의 유전형과 필수적으로 동일한 세포의 원래의 부분인 DNA를 말한다.
자녀는 배아, 난할구, 또는 태아를 말할 수 있다. 현재 개시된 구현예에서, 기술된 개념은 신생아, 태아, 배아 또는 그 세포들의 세트인 개체에 동등하게 잘 적용됨을 주목한다. 당해 용어 자녀의 사용은, 자녀로서 언급된 개체가 부모의 유전적 자식으로서 언급됨을 함축함을 단순히 의미할 수 있다.
부모는 개체의 유전적 모친 또는 부친을 말한다. 개체는, 유전적 또는 염색체 키메라현상(chimerism)과 같은 경우가 필수적으로 아니라면, 전형적으로 2명의 부모, 모친 및 부친을 가진다. 부모는 개체인 것으로 고려될 수 있다.
부모 관계는 표적의 2명의 부모 중 1명 또는 둘 모두에 대한 2개의 관련 염색체 각각에서, 소정의 SNP의 유전적 상태를 말한다.
바람직하게 발달하다, 또는 "정상적으로 발달하다"는 자궁 속에 착상되어 임신을 생성하고/하거나 임신이 지속되어 실체 출생을 이루는 살아있는 배아, 및/또는 염색체 비정상성이 없는 신생아, 및/또는 질병-연결된 유전자와 같은 다른 바람직하지 않은 유전 상태가 없는 신생아를 말한다. 용어 "바람직하게 발달하다"는 부모 또는 건강관리 협력자가 요구할 수 있는 어느 것을 포함함을 의미한다. 일부 경우에, "바람직하게 발달하다"는 의학적 연구 또는 다른 목적에 유용한 살아있지 않거나 살아있는 배아를 말한다.
자궁내로 삽입은 시험관 수정과 관련하여 자궁 강 내로 배아를 전달하는 공정을 말한다.
모계 혈장은 임신한 여성의 혈액의 혈장 일부를 말한다.
임상 결정은 개체의 건강 또는 생존에 영향을 미치는 결과를 갖는 작용을 취하거나 취하지 않는 어떠한 결정을 말한다. 태아 진단과 관련하여, 임상 결정은 태아를 낙태하거나 낙태하지 않는 결정을 말할 수 있다. 임상 결정은 추가의 시험을 수행하거나, 바람직하지 않은 표현형을 완화시키기 위한 작용을 취하거나, 비정상인 자녀의 출생에 대해 대비하기 위한 작용을 취하는 결정을 말할 수 있다.
진단 상자는 본원에 개시된 방법 중의 하나 또는 다수의 측면을 수행하기 위해 설계된 기계 중의 하나 또는 조합을 말한다. 일 구현예에서, 진단 상자는 환자 관리의 지점에 위치시킬 수 있다. 일 구현예에서, 진단 상자는 서열확인 후에 표적화된 증폭을 수행할 수 있다. 일 구현예에서, 진단 상자는 단독으로나 기술자의 도움으로 기능할 수 있다.
정보학 기반 방법은 다량의 데이터를 이해하기 위한 통계학에 주로 의존하는 방법을 말한다. 태자녀 진단의 측면에서, 이는, 예를 들면, 분자 배열 또는 서열분석에 의한 다량의 유전 데이터를 고려해볼 때, 상태를 직접적으로 물리적으로 측정함에 의한 것보다는, 대부분의 유사한 상태를 통계학적으로 추론함으로써 하나 이상의 대립유전자 또는 하나 이상의 염색체의 배수성 상태를 측정하도록 설계된 방법이다. 본원의 일 구현예에서, 정보과학 기반 방법은 이러한 환자에서 개시된 하나일 수 있다. 본원의 일 구현예에서, 이는 PARENTAL SUPPORTTM일 수 있다.
1차 유전 데이터는 유전자형 플랫폼에 의해 출력되는 동족체 강도 신호를 나타낸다. SNP 배열의 측면에서, 1차 유전 데이터는, 어떠한 유전자형 호출이 수행되기 전의 강도 신호를 나타낸다. 서열분석의 측면에서, 1차 유전 데이터는, 어떠한 염기 쌍의 동일성이 측정되기 전, 및 서열이 게놈에 맵핑되기 전에 서열을 제거하는, 크로마토그램과 유사한, 아날로그 측정을 나타낸다.
2차 유전 데이터는 유전자형 플랫폼에 의해 출력되는 가공된 유전 데이터를 나타낸다. SNP 배열의 측면에서, 제2의 유전 데이터는 SNP 배열 판독기와 결합된 소프트웨어로 제조된 대립유전자 호출을 나타내며, 여기서 소프트웨어는, 소정의 대립유전자가 시료 내에 존재하는지 또는 부재하는지 여부를 호출한다. 서열분석의 측면에서, 제2의 유전 데이터는, 서열이 측정된 염기쌍 동일성, 및 가능하게는 또한 서열이 어디에서 게놈에 맵핑되었는지를 나타낸다.
비- 침입성 태자녀 진단( NPL ), 또는 또한 "비-침입성 태자녀 스크리닝"(NPS)는, 모의 혈액에서 발견된 유전 물질을 이용하여 모에서 잉태되는 태아의 유전 상태를 측정하는 방법을 나타내며, 여기서 유전 물질은 모의 정맥 혈액을 채혈해서 수득한다.
유전자자리에 상응하는 DNA의 우선적 농축, 또는 유전자자리에서 DNA의 우선적 농축은 유전자자리에 상응하는 예비-농축 DNA 혼합물 중 DNA 분자의 퍼센트보다 높은 유전자자리에 상응하는 농축후 DNA 혼합물 중 DNA의 분자의 퍼센트를 생성하는 특정 방법을 말한다. 당해 방법은 유전자자리에 상응하는 DNA 분자의 선택적인 증폭 단계를 포함할 수 있다. 당해 방법은 유전자자리에 상응하지 않는 DNA 분자를 제거하는 단계를 포함할 수 있다. 당해 방법은 방법들의 조합을 포함할 수 있다. 농축 정도는 유전자자리에 상응하는 예비-농축 혼합물 중 DNA 분자의 퍼센트로 나눈 유전자자리에 상응하는 농축-후 혼합물 속의 DNA 분자의 퍼센트로 정의된다. 우선적 농축은 다수의 유전자자리에서 수행될 수 있다. 본원의 일부 구현예에서, 농축 정도는 20 초과이다. 본원의 일부 구현예에서, 농축 정도는 200 초과이다. 본원의 일부 구현예에서, 농축 정도는 2,000 초과이다. 우선적 농축이 다수의 유전자자리에서 수행되는 경우, 농축 정도는 유전자자리의 세트내 유전자자리 모두의 평균 농축 정도를 말할 수 있다.
증폭은 DNA 분자의 카피의 수를 증가시키는 방법을 말한다.
선택적 증폭은 DNA의 특수 분자, 또는 DNA의 특수 영역에 상응하는 DNA 분자의 카피 수를 증가시키는 방법을 말할 수 있다. 이는 또한, 이것이 표적화되지 않은 분자 또는 DNA의 영역을 증가시키는 것보다도 DNA의 특정한 표적화된 분자, 또는 표적화된 영역의 카피의 수를 증가시키는 방법을 말할 수 있다. 선택적인 증폭은 바람직한 농축 방법일 수 있다.
공통의 프라이밍 서열은 예를 들면, 연결, PCR, 또는 연결 매개된 PCR에 의해 표적 DNA 분자의 집단에 첨부될 수 있는 DNA 서열을 말한다. 일단 표적 분자의 집단에 가해지면, 공통의 프라이밍 서열에 특이적인 프라이머를 사용하여 증폭 프라이머의 단일 쌍을 사용하여 표적 집단을 증폭시킬 수 있다. 공통의 프라이밍 서열은 전형적으로 표적 서열과 관련되지 않는다.
공통의 어댑터, 또는 '연결 어댑터' 또는 '라이브러리 태그'는 표적 이본쇄 DNA 분자의 집단의 5-프라임 및 3-프라임 말단에 공유결합으로 연결될 수 있는 공통의 프라이밍 서열을 함유하는 DNA 분자이다. 어댑터의 첨가는, 이로부터 PCR 증폭이 일어나는 표적 집단의 5-프라임 및 3-프라임 말단에 대한 공통의 프라이밍 서열을 제공하여 표적 집단의 모든 분자를 증폭 프라이머의 단일 쌍을 사용하여 증폭시킨다.
표적화는 DNA의 혼합물 속에서, 유전자자리의 세트에 상응하는 DNA 분자를 선택적으로 증폭시키거나 달리는 우선적으로 농축시키는데 사용된 방법을 말한다.
결합 분포 모델은 다수의 무작위 변수, 즉, 동일한 확률 공간으로 정의된 소정의 다수의 무작위 변수의 측면에서 정의된 현상의 확률을 정의하는 모델을 말하며, 여기서 변수의 확률이 연결된다. 일부 구현예에서, 변수의 확률이 연결되지 않는 퇴화 경우가 사용될 수 있다.
현재 개시된 구현예는 첨부된 도면을 참조로 추가로 설명될 것이며, 여기서 유사 구조는 몇개의 그림을 통해 유사 숫자로 언급된다. 나타낸 도면은 필수적으로 크기가 조정되지 않았으며, 대신 현재 개시된 구현예의 원리를 나타낼 때 일반적으로 강조되어 있다.
도 1은 직접적인 다중화된 미니-PCR 방법의 그래프적 묘사이다.
도 2는 반-내포된 미니-PCR 방법의 그래프적 묘사이다.
도 3은 완전히 중첩된 미니-PCR 방법의 그래프적 묘사이다.
도 4는 헤미-내포된 미니-PCR 방법의 그래프적 묘사이다.
도 5는 3중의 헤미-내포된 미니-PCR 방법의 그래프적 묘사이다.
도 6은 단면 중첩된 미니-PCR 방법의 그래프적 묘사이다.
도 7은 단면 미니-PCR 방법의 그래프적 묘사이다.
도 8은 역 반-내포된 미니-PCR 방법의 그래프적 묘사이다.
도 9는 반-내포된 방법에 대한 일부 가능한 흐름도이다.
도 10은 루프된 연결 어댑터의 그래프적 묘사이다.
도 11은 내부적으로 태그된 프라이머의 그래프적 묘사이다.
도 12는 내부 태그를 지닌 일부 프라이머의 예이다.
도 13은 연결 어댑터 결합 영역을 지닌 프라이머를 사용한 방법의 그래프적 묘사이다.
도 14는 2개의 상이한 분석 기술을 사용한 계수 방법에 대한 모의된 배수성 요청 정확도이다.
도 15는 실험 4의 세포주내 다수의 SNP에 대한 2개의 대립유전자의 비이다.
도 16은 염색체에 의해 분류된 실험 4의 세포주에서 다수의 SNP에 대한 2개의 대립유전자의 비이다.
도 17a 내지 도 17d는 염색체에 의해 분류된, 임신한 여성 혈장 시료 속의 다수의 SNP에 대한 2개의 대립유전자의 비이다.
도 18은 데이터 교정 전 및 후 바이어스 분산(binomial variance)에 의해 설명될 수 있는 데이터의 분획이다.
도 19는 짧은 라이브러리 제조 프로토콜 후 시료 속의 태아 DNA의 상대적인 농축을 나타내는 그래프이다.
도 20은 직접적인 PCR 및 반-내포된 방법을 비교하는 판독 그래프의 깊이이다.
도 21은 3개의 게놈 시료의 직접적인 PCR에 대한 판독물의 깊이의 비교이다.
도 22는 3개의 시료의 반-내포된 미니-PCR에 대한 판독물의 깊이의 비교이다.
도 23은 1,200-플렉스(plex) 및 9,600-플랙스 반응에 대한 판독물의 깊이의 비교이다.
도 24는 3개의 염색체에서 6개의 세포에 대한 판독물 수의 비이다.
도 25는 3개의 염색체에서 1ng의 게놈성 DNA 상에서 수행된 2개의 3개-세포 반응 및 제3의 반응 실시에 대한 대립유전자 비이다.
도 26은 3개의 염색체에서 2개의 단일-세포 반응에 대한 대립유전자 비이다.
도 27은 각각의 프라이머 라이브러리에 의해 표적화된 특정한 미니 대립유전자 빈도를 지닌 다수의 유전자자리를 나타내는 2개의 프라이머 라이브러리의 비교이다.
도 28a는 PCR 생성물의 전기영동 그래프이다.
도 28b 내지 도 28m은 도 28a에서 레인 1 내지 12 각각의 일렉트로페로그람(electropherogram)이다.
도 29a 내지 도 29e는 태아 이수성(도 29a)의 측정을 위한 본 발명의 방법의 삽화 묘사이다. 모계 및 부모계 유전형 데이터(혈액 또는 구강 면봉을 이용하여 측정) 및 HapMap 데이터베이스에서 비롯된 교차 빈도 데이터를 이용하여 인실리코(도 29c)에서 각각의 잠재적인 태아 배수성 상태에 대한 다수의 독립적인 가설(도 29b)을 생성하였다. 이들 가설 각각을 확장시켜 상이한 가능한 교차 점을 고려한 부-가설을 포함하였다. 데이터 모델은, 어떤 서열분석 데이터가 소정의 각 가설 태아 유전형 및 상이한 태아 cfDNA 분획과 유사할 수 있는지를 예측하며, 실제 서열분석 데이터와 비교되며; 각각의 가설에 대한 가능성은 베이지안 통계학(Bayesian statistics)을 사용하여 측정한다. 당해 가설 실시예에서, 최대 확률(정배수성)을 갖는 가설을 측정한다(도 29d). 도 29c의 개체 가능성을 각각의 카피수 가설 계열(일염색체성, 이염색체성, 또는 삼배체성)에 대해 요약한다. 최대 확률을 갖는 가설은 배수성 상태로 명명되며, 태아 분획을 나타내고, 시료-특이적인 계산된 정밀성을 나타낸다(도 29e).
도 30a 내지 도30h는 정배수성(도 30a 내지 도 30c), 일염색체성(도 30d), 및 삼염색체성(도 30e 내지 도 30h)의 대표적인 그래프적 묘사이다. 모든 플롯에 대해, x-축은 각각의 염색체에 따른 개개 다형성 유전자자리의 선형 위치를 나타내고(하기에 플롯을 나타냄), y-축은 전체(A+B) 대립유전자 판독물의 분획으로서 A 대립유전자 판독물의 수를 나타낸다. 모계 및 태아 유전형, 및 또한 밴드가 집중되는 y-축 상의 위치는 플롯의 우측에 나타낸다. 가시화를 촉진하는 것이 바람직한 경우, 플롯은 모계 유전형에 따라 색상-코드화함으로써, 적색이 AA의 모계 유전형을 나타내고, 청색이 BB의 모계 유전형을 나타내고, 녹색이 AB의 모계 유전형을 나타내도록 한다. 경우에 따라, 모계 대립유전자 분포는 "태아 유전형" 컬럼에 색상으로 나타낼 수 있다. 대립유전자 기여는 모│태아로 나타냄으로써, 모가 AA이고 태자녀 AB인 대립유전자가 AA|AB로 나타나도록 한다. 도 30a는 2개의 염색체가 존재하고 태아 cfDNA 분획이 0%인 경우 생성된 플롯을 나타낸다. 당해 플롯은 임신하지 않은 여성에서 기원하므로, 유전형이 전적으로 모의 것인 경우의 양식을 나타낸다. 따라서, 대립유전자 집단은 주변 1(AA 대립유전자), 0.5(AB 대립유전자), 및 0(BB 대립유전자) 주변에 집중된다. 도 30b는, 2개의 염색체가 존재하고 태아 분획이 12%인 경우 생성된 플롯을 나타낸다. A 대립유전자 판독물의 분획에 대한 태아 대립유전자의 분포는 y-축을 따라 상향 또는 하향으로 일부 대립유전자 점의 위치를 이동시키므로, 밴드는 1(AA|AA 대립유전자), 0.94(AA|AB 대립유전자), 0.56(AB|AA 대립유전자), 0.50(AB|AB 대립유전자), 0.44(AB|BB 대립유전자), 0.06(BB|AB 대립유전자), 및 0(BB|BB 대립유전자) 주변으로 집중된다. 도 30c는 2개의 염색체가 존재하고 태아 분획이 26%인 경우 생성된 플롯을 나타낸다. 2개의 적색 및 2개의 청색 주변 밴드 및 3개의 중심 녹색 밴드를 포함하는 양식은 용이하게 명백하다(색상은 나타내지 않음). 밴드는 1(AA|AA 대립유전자), 0.87 (AA|AB 대립유전자), 0.63(AB|AA 대립유전자), 0.50(AB|AB 대립유전자), 0.37(AB|BB 대립유전자), 0.13(BB|AB 대립유전자), 및 0(BB|BB 대립유전자) 주변으로 집중된다. 도 30d는, 하나의 염색체가 존재하고 태아 분획이 26%인 경우 생성된 플롯을 나타낸다. 하나의 외부 적색 및 하나의 외부 청색 주변 밴드 및 2개의 중심 녹색 밴드의 특징 양식은 모계로 유전된 일염색체성(색상은 나타내지 않음)을 나타낸다. 태아 만이 대립유전자 판독물에 대해 단일 대립유전자 (A 또는 B)에 기여하기 때문에, 내부 주변 적색 및 청색 밴드는 존재하지 않으며, 밴드의 중심 3개 조는 2개의 밴드로 농축된다(색상은 나타내지 않음). 밴드는 1(AA|A 대립유전자), 0.57(AB|A 대립유전자), 0.43(AB|B 대립유전자), 및 0(BB|B 대립유전자) 주변으로 집중된다. 도 30e는, 3개의 염색체가 존재하고 태아 분획이 27%인 경우 생성된 플롯을 나타낸다. 2개의 적색 및 2개의 청색 주변 밴드 및 2개의 중심의 녹색 밴드의 이러한 양식은 모계-유전된 감수분열 삼염색체성(색상은 나타내지 않음)을 나타낸다. 밴드는 1(AA|AAA 대립유전자), 0.88(AA|AAB 대립유전자), 0.56(AB|AAB 대립유전자), 0.44(AB|ABB 대립유전자), 0.12(BB|ABB 대립유전자), 및 0(BB|BBB 대립유전자) 주변으로 집중된다. 도 30f는, 3개의 염색체가 존재하고 태아 분획이 14%인 생성된 플롯을 나타낸다. 3개의 적색 및 3개의 청색 주변 밴드, 및 2개의 중심 녹색 밴드의 이러한 양식은 부계-유전된 감수분열 삼염색체성(색상은 나타내지 않음)을 나타낸다. 밴드는 1(AA|AAA 대립유전자), 0.93(AA|AAB 대립유전자), 0.87(AA|ABB 대립유전자), 0.60(AB|AAA 대립유전자), 0.53(AB|AAB 대립유전자), 0.47(AB|ABB 대립유전자), 0.40(AB|BBB 대립유전자), 0.13(BB|AAB 대립유전자), 0.07(BB|ABB 대립유전자), 및 0(BB|BBB 대립유전자) 주변에 집중된다. 도 30g는, 3개의 염색체가 존재하고 태아 분획이 35%인 경우에 생성된 플롯을 나타낸다. 2개의 적색 및 2개의 청색 주변 밴드 및 또한 4개의 중심 녹색 밴드의 이러한 양식은 부계-유전된 감수 분열 삼염색체성(색상은 나타내지 않음)을 나타낸다. 밴드는 1(AA|AAA 대립유전자), 0.85(AA|AAB 대립유전자), 0.72(AB|AAA 대립유전자), 0.57(AB|AAB 대립유전자), 0.43(AB|ABB 대립유전자), 0.28(AB|BBB 대립유전자), 0.15(BB|ABB 대립유전자), 및 0(BB|BBB 대립유전자) 주변에 집중된다. 도 30h는, 3개의 염색체가 존재하고 태아 분획이 25%인 경우에 생성된 플롯을 나타낸다. 2개의 적색 및 2개의 청색 주변 밴드 및 4개의 중심 녹색 밴드의 이러한 양식은 부계-유전된 감수 분열 삼염색체성(색상은 나타내지 않음)을 나타낸다. 이러한 양식은 내부 주변 밴드의 위치에 의해 부계-유전된 감수 분열 삼염색체성(도 30g에 나타낸 바와 같음)의 것과는 구별될 수 있다. 구체적으로, 밴드는 1(AA|AAA 대립유전자), 0.78(AA|ABB 대립유전자), 0.67(AB|AAA 대립유전자), 0.56(AB|AAB 대립유전자), 0.44(AB|ABB 대립유전자), 0.33(AB|BBB 대립유전자), 0.22(BB|AAB 대립유전자), 및 0(BB|BBB 대립유전자) 주변에 집중된다.
도 31은 나타낸 바와 같이 (도 31a) 정배수성, (도 31b) T13, (도 31c) T18, (도 31d) T21, (도 31e) 45,X, 및 (도 31f) 47,XXY 시험 시료를 그래프적으로 나타낸다. 각각의 염색체는 플롯의 상단에 나타내며, 태아 및 모계 유전형은 플롯의 우측에 나타내고, x-축은 각각의 염색체를 따라 SNP의 선형 위치를 나타내고, y-축은 전체 판독물의 분획으로서 A 대립유전자 판독물의 수를 나타낸다. 변경된 집단 위치화는 본원에 나타낸 바와 같이, 태아 분획을 기반으로 함에 주목한다. 각각의 점은 단일 SNP 유전자자리를 나타낸다. 태아 및 모계 유전형은 플롯의 우측에 나타내고, 염색체의 실체는 플롯의 상단에 나타낸다.
도 32는, 성 염색체 이수성의 합해진 출생시 유병률은 자가 이수성의 것보다 크다는 것을 나타낸다.
상기 나타낸 도면은 현재 개시된 구현예를 나타내지만, 다른 구현예도 토의에서 나타낸 바와 같이, 또한 고려된다. 당해 기재내용은 표시의 방식으로 제한하지 않고 나열된 구현예를 제공한다. 다수의 다른 변형 및 구현예가 현재 개시된 구현예의 원리의 영역 및 취지 내에 속하는 당해 분야의 숙련가에 의해 고안될 수 있다.
상세한 설명
본 발명은, 흔히 프라이머의 라이브러리 중의 단지 비교적 소수의 프라이머 만이 다중 PCR 반응 동안 형성하는 증폭된 플이머 이량체의 실질적인 양에 관여한다는 놀라운 발견을 부분적으로 기반으로 한다. 후보물 프라이머의 라이브러리에서 제거하기 위해 가장 바람직하지 않은 프라이머를 선택하는 방법이 개발되어 왔다. 무시할 정도의 양(PCR 생성물의 ~0.1%)까지 프라이머 이량체의 양을 감소시킴으로써, 당해 방법은, 생성되는 프라이머 라이브러리가 단일의 다중 PCR 반응에서 거대한 수의 표적 유전자자리를 동시에 증폭시키도록 한다. 프라이머는 표적 유전자자리에 하이브리드화하여 다른 프라이머에 하이브리드화하여 증폭된 프라이머 이량체를 형성시키기 보다는 이들을 증폭시키기 때문에, 증폭될 수 있는 상이한 표적 유전자자리의 수가 증가된다. 보다 낮은 프라이머 농도 및 정상보다 긴 어닐링 시간을 사용하여, 프라이머가 서로에 대해 하이브리드화하여 프라이머 이량체를 형성하는 대신 표적 유전자자리에 하이브리드화하는 가능성을 증가시킴이 또한 밝혀졌다.
게놈 시료 속에서 PCR 증폭 및 19,488개의 표적 유전자자리의 서열분석 동안, 서열분석 판독물 중의 99.4 내지 99.7%가 게놈에 맵핑되고, 이들 중 99.99%가 표적화된 유전자자리에 맵핑된다. 천만 개의 서열분석 판독물을 사용한 혈장 시료의 경우, 전형적으로 19,488개의 표적화된 유전자자리(99.3 %) 중 적어도 19,350개가 증폭되어 서열분석된다. 이러한 거대한 수의 표적 유전자자리를 한번에 동시에 증폭시킬 수 있음은 수천개의 표적 유전자자리를 분석하는데 요구되는 DNA의 양 및 시간의 양을 상당히 감소시킨다. 예를 들어, 단일 세포의 DNA는 수천개의 표적 유전자자리를 동시 분석하기에 충분하며, 이는, DNA의 양이 낮은 적용, 예를 들면, 시험관 수정 또는 아주 적은 DNA를 사용한 외부 시료의 유전적 시험 전 배아의 단일 세포의 유전적 시험에 중요하다. 또한, 시료를 다수의 상이한 반응으로 쪼개기 보다는 하나의 반응 용적(예를 들면, 하나의 체임버 또는 웰) 속에 표적 유전자자리를 분석할 수 있는 것이 반응 사이에 발생할 수 있는 가변성을 감소시킨다. 또한, 상이한 표적 유전자자리 사이에 발생할 수 있는 증폭 편향에 대해 교정하기 위해 참조 표준물을 사용하는 방법이 개발되어 왔다. 예를 들어, GC 함량과 같은 인자로 인하여 표적 유전자자리 사이에 증폭 효능에 있어서의 차이는 동일한 양으로 실제 존재하는 표적 유전자자리에 대해 생산되는 PCR 생성물의 양을 차등화시킬 수 있다. 표적 유전자자리와 유사한 참조 표준물의 사용은 이러한 증폭 편향의 검출을 가능하도록 함으로써 표적 유전자자리의 정량화 동안에 이것이 교정될 수 있도록 한다.
PCR 생성물의 서열분석 동안에, 프라이머 이량체와 같은 인공물이 검출되므로 표적 앰플리콘의 검출을 억제한다. 이러한 제한으로 인하여, 하이브로드화 프로브를 사용한 미세배열을 검출에 흔히 사용하는데, 그 이유는 미세배열이 프라이머 이량체에 기인한 방해에 대해 거의 민감하지 않기 때문이다. 본 발명에 이르러 달성된 최소 비-표적 앰플리콘과의 고 수준의 다중화는 PCR에 이어 미세배열에 대한 대안으로서 사용될 서열분석을 허용한다.
본 발명의 다중-PCR 방법은 유전형, 염색체 비정상성(예를 들면, 태아 염색체 이수성), 유전자 돌연변이 및 다형성(예를 들면, 단일 뉴클레오타이드 다형성, SNP) 분석, 유전자 결실 분석, 친부 측정, 집단 중에서 유전적 차이의 분석, 법의학적 분석, 질병에 대한 소인 측정, mRNA의 정량적 분석, 및 감염제(예를 들면, 세균, 기생충, 및 바이러스)의 검출 및 확인과 같은 다양한 적용에서 존재할 수 있다. 다중 PCR 방법은 또한 부친 시험 또는 태아 염색체 비정상성의 검출과 같은 비-침입성 태아 시험을 위해 사용될 수 있다.
예시적인 프라이머 설계 방법
고도의 다중화된 PCR은 흔히 프라이머 이량체 형성과 같은 비생산적인 부반응에 기인하는 생성물 DNA의 매우 높은 비율의 생산을 야기할 수 있다. 일 구현예에서, 비생산적인 부반응을 유발하는 경향이 가장 큰 특정한 프라이머를 프라이머 라이브러리에서 제거하여 게놈에 맵핑되는 증폭된 DNA의 보다 높은 비율을 생성할 프라이머 라이브러리를 수득할 수 있다. 문제의 프라이머, 즉, 특히 이량체를 안정화시키는 경향이 있는 프라이머는 예상치않게도 서열분석에 의한 후속적인 분석을 위해 극도로 높은 PCR 다중화 수준이 가능하다. 수행이 프라이머 이량체 및/또는 다른 유해한 생성물에 의해 유의적으로 감퇴되는, 서열분석과 같은 시스템에서, 다른 기술된 다중화보다 10배 이상, 50배 이상, 및 100배 이상 더 높은 다중화가 달성되어 왔다. 이는, 과량의 프라이머 이량체가 결과에 인지가능하게 영향을 미치지 않을 프로브계 검출 방법, 예를 들면, 미세배열, TAQMAN, PCR 등에 대치됨에 주목한다. 또한, 당해 분야에서 일반적인 믿음은, 서열분석을 위한 다중화 PCR이 동일한 웰에서 약 100개 검정으로 제한된다는 것이다. 플루이딤(Fluidigm) 및 레인 댄스(Rain Dance)는 하나의 시료에 대한 동시 반응(in parallel reactions)으로 48개 또는 1000개의 PCR 검정을 수행할 플랫폼을 제공한다.
비-맵핑 프라이머 이량체 또는 다른 프라이머 피해 생성물의 양이 최소화되는 라이브러리에 대한 프라이머를 선택하는 다수의 방법이 존재한다. 경험적인 자료는, 소수의 '나쁜' 프라이머가 다량의 비-맵핑 프라이머 이량체 부반응에 관여함을 나타낸다. 이들 '나쁜' 프라이머를 제거하는 것은 표적화된 유전자자리에 맵핑하는 서열 판독물의 퍼센트를 증가시킬 수 있다. '나쁜' 프라이머를 확인하는 한 가지 방법은 표적화된 증폭에 의해 증폭된 DNA의 서열분석 데이터를 관찰하는 것이며; 최대 빈도로 관찰되는 이들 프라이머 이량체를 제거하여 게놈에 대해 맵핑되지 않는 부생성물 DNA를 생성하는 경향이 유의적으로 적은 프라이머 라이브러리를 수득할 수 있다. 또한 다양한 프라이머 조합의 결합 에너지를 계산할 수 있는 공공의 이용가능한 프로그램이 존재하며, 최대 결합 에너지를 사용하여 이들을 제거하는 것은 또한 게놈에 맵핑되지 않는 부생성물 DNA를 생성하는 가능성이 유의적으로 없는 프라이머 라이브러리를 생성할 것이다.
프라이머를 선택하기 위한 일부 구현예에서, 후보물 프라이머의 초기 라이브러리는 하나 이상의 프라이머 또는 프라이머 쌍을 후보물 표적 유전자자리에 설계함으로써 생성된다. 한 세트의 후보물 표적 유전자자리(예를 들면, SNP)는 표적 집단내에서 SNP의 빈도 또는 SNP의 이형접합성 비율과 같은 표적 유전자자리에 대한 바람직한 매개변수에 대한 공공 이용가능한 정보를 기반으로 선택될 수 있다. 일 구현예에서, PCR 프라이머는 Primer3 프로그램(primer3.sourceforge.net; libprimer3 release 2.2.3의 범세계통신망(www), 이의 전문은 본원에 참조로 혼입됨)을 사용하여 설계될 수 있다. 경우에 따라, 프라이머는 특정한 어닐링 온도 범위내에서 어닐링되고/되거나, 특정한 범위의 GC 함량을 가지며/가지거나, 특정한 크기 범위를 가지고/가지거나, 특정한 크기 범위의 표적 앰플리콘을 생산하고/하거나 다른 매개변수 특성을 가지도록 설계될 수 있다. 후보물 표적 유전자자리 당 다중 프라이머 또는 프라이머 쌍을 사용한 출발은, 프라이머 또는 프라이머 쌍이 대부분 또는 모든 표적 유전자자리에 대한 라이브러리 속에 잔존하도록 할 것이다. 일 구현예에서, 선택 범주는, 표적 유전자자리당 적어도 하나의 프라이머 쌍이 라이브러리에 잔존하도록 하는 것을 요구할 수 있다. 이러한 방식으로, 대부분 또는 모든 표적 유전자자리가 제1의 프라이머 라이브러리를 사용하는 경우 증폭될 것이다. 이는 게놈에서 거대한 수의 위치에서 결실 또는 중복을 위한 스크리닝 또는 질병과 관련되거나 질병 위험이 증가된 거대한 수의 서열(예를 들면, 다형성 또는 다른 돌연변이)에 대한 스크리닝과 같은 적용의 경우 바람직하다. 라이브러리에서 선택한 프라이머 쌍이 다른 프라이머 쌍에 의해 생산된 표적 앰플리콘과 오버랩된 표적 앰플리콘을 생산할 수 있는 경우, 프라이머 쌍 중의 하나를 라이브러리에서 제거하여 방해를 방지할 수 있다.
일부 구현예에서, "비바람직성 점수"(점수가 높을 수록 가장 적은 바람직성을 나타낸다)는 후보물 프라이머의 라이브러리에서 2개의 프라이머의 대부분 또는 모든 가능한 조합에 대해 계산(컴퓨터 상에서의 계산과 같음)된다. 다양한 구현예에서, 비바람직성 점수는 라이브러리내 후보물 프라이머의 가능한 조합의 적어도 적어도 80, 90, 95, 98, 99, 또는 99.5%에 대해 계산된다. 각각의 비바람직성 점수는 적어도 부분적으로는 2개의 후보물 프라이머 사이의 이량체 형성의 가능성을 기반으로 한다. 경우에 따라, 비바람직성 점수는 표적 유전자자리의 이형접합성 비율, 표적 유전자자리에서 서열(예: 다형성)과 관련된 질병 유병률, 표적 유전자자리에서 서열(예: 다형성)과 관련된 질병 침투도, 표적 유전자자리에 대한 후보물 프라이머의 특이성, 후보물 프라이머의 크기, 표적 앰플리콘의 용융 온도, 표적 앰플리콘의 GC 함량, 표적 앰플리콘의 증폭 효능, 및 표적 앰플리콘의 크기로 이루어진 그룹 중에서 선택된 하나 이상의 다른 매개변수를 기반으로 할 수 있다. 다수의 인자가 고려되는 경우, 비바람직성 점수는 다양한 매개변수의 칭량된 평균을 기반으로 계산될 수 있다. 당해 매개변수는, 프라이머가 사용될 특수 적용을 위한 이들의 중요성을 기반으로 상이한 중량으로 지정될 수 있다. 일부 구현예에서, 최대 비바람직성 점수를 지닌 프라이머를 라이브러리에서 제거한다. 제거된 프라이머가 하나의 표적 유전자자리에 하이브리드화하는 프라이머쌍의 구성원인 경우, 프라이머 쌍의 다른 구성원도 라이브러리에서 제거할 수 있다. 프라이머를 제거하는 공정은 경우에 따라 반복될 수 있다. 일부 구현예에서, 선택 방법은, 라이브러리 속에 잔존하는 후보물 프라이머조합물에 대한 비바람직성 점수가 모두 최소한계와 동일하거나 미만이 될 때까지 수행된다. 일부 구현예에서, 선택 방법은, 라이브러리 속에 남아있는 후보물 프라이머가 바람직한 수로 감소될 때까지 수행된다.
다양한 구현예에서, 비바람직성 점수가 계산된 후, 제1의 최소 한계를 초과하는 비바람직성 점수를 가진 2개의 후보물 프라이머의 조합의 최대 수 중 일부인 후보물 프라이머를 라이브러리에서 제거한다. 당해 단계는, 제1의 최소 한계 이하의 상호작용을 무시하는데, 이는, 이러한 상호작용이 거의 유의적이지 않기 때문이다. 제거된 프라이머가 하나의 표적 유전자자리에 하이브리드화하는 프라이머 쌍의 구성원인 경우, 프라이머 쌍의 다른 구성원을 라이브러리에서 제거할 수 있다. 프라이머를 제거하는 공정은 경우에 따라 반복될 수 있다. 일부 구현예에서, 선택 방법은, 라이브러리 속에 남아있는 후보물 프라이머에 대한 비바람직성 점수가 모두 제1의 최소 한계 이하일 때까지 수행된다. 라이브러리 속에 남아있는 후보물 프라이머의 수가 바람직한 수보다 더 큰 경우, 프라이머의 수는 제1의 최소 한계를 보다 낮은 제2의 최소 한계로 감소시키고 프라이머를 제거하는 공정을 반복함으로써 감소시킬 수 있다. 라이브러리 속에 남아있는 후보물 프라이머의 수가 바람직한 수보다 더 적은 경우, 당해 방법은 제1의 최소 한계를 보다 높은 제2의 최소 한계로 증가시키고 프라이머를 제거하는 공정을 반복함으로써 지속하여, 보다 많은 후보물 프라이머가 라이브러리 속에 잔존하도록 할 수 있다. 일부 구현예에서, 선택 방법은, 라이브러리 속에 남아있는 후보물 프라이머에 대한 비바람직성 점수가 모두 제2의 최소 한계 이하이거나, 라이브러리 속에 남아있는 후보물 프라이머의 수가 바람직한 수로 감소될 때까지 수행한다.
경우에 따라, 다른 프라이머 쌍에 의해 생산된 표적 앰플리콘과 오버랩된 표적 앰플리콘을 생산하는 프라이머 쌍을 분리된 증폭 반응으로 나눌 수 있다. 다중 PCR 증폭 반응이 후보물 표적 유전자자리(표적 앰플리콘의 중첩으로 인하여 분석에 의하여 후보물 표적 유전자자리를 빼는 것 대신에) 모두를 분석하는 것이 바람직할 수 있다.
이러한 선택 방법은 라이브러리에서 제거되어서 프라이머 이량체에서 바람직한 감소를 달성하는 후보물 프라이머의 수를 최소화한다. 라이브러리에서 소수의 후보물 프라이머를 제거함으로써, 보다 많은(또는 모든) 표적 유전자자리를 수득되는 프라이머 라이브러리를 사용하여 증폭시킬 수 있다.
다수의 프라이머의 다중화는 포함될 수 있는 검정에서 고려할만한 제약을 부여한다. 의도치않게 상호작용하는 검정은 가짜 증폭 생성물을 생성한다. 미니PCR의 크기 제약은 추가의 구속을 초래할 수 있다. 일 구현예에서, 매우 다수의 잠재적인 SNP 표적(약 500 내지 1백만 개 이상)을 사용하고 각각의 SNP를 증폭시키기 위한 프라이머를 설계하기 위한 접근법을 개시하는 것이 가능하다. 프라이머를 설계할 수 있는 경우 DNA 이본쇄 형성을 위한 발표된 열역학적 매개변수를 사용하여 모든 가능한 프라이머의 쌍 사이에 가짜의 프라이머 이본쇄 형성의 가능성을 평가함으로써 가짜 생성물을 형성시키는 가능성이 있는 프라이머를 확인하는 접근법이 가능하다. 프라이머 상호작용은 상호작용과 관련된 기능을 점수매김으로써 순위를 정할 수 있으며 최악의 상호작용 점수를 갖는 프라이머는, 목적한 프라이머의 수가 충족될 때까지 제거한다. SNP가 이형접합성일 가능성이 가장 유용한 경우에, 검정의 목록을 순위를 정하여 가장 이형접합성인 양립성 검정을 선택하는 것이 또한 가능하다. 실험은, 높은 반응성 점수를 지닌 프라이머가 프라이머 이량체를 형성할 가능성이 가장 높음을 입증한다. 높은 다중화시, 모든 거짓된 상호작용을 제거하는 것이 가능할 뿐 아니라, 이들이 전체 반응을 배제할 수 있고, 의도된 표적의 증폭을 크게 제한하므로 인실리코 최대 상호작용 점수를 가진 프라이머 또는 프라이머 쌍을 제거하는 것이 필수적이다. 본 발명자들은 당해 과정을 수행하여 10,000개 프라이머 이하 및 일부 경우에 이상인 복합체 프라이머 세트를 생성하기 위한 당해 공정을 수행하였다. 당해 공정으로 인한 개선은, 최악의 프라이머가 제거되지 않는 반응의 10%와 비교하여, 모든 PCR 생성물의 서열분석에 의해 측정된 것으로서 표적 생성물에서 80% 이상, 90% 이상, 95% 이상, 98% 이상, 및 심지어 99% 이상의 증폭을 실질적으로 가능하게 한다. 앞서 기술한 바와 같은 부분적인 반-내포된 접근법와 결합시키는 경우, 앰플리콘의 90% 이상, 및 심지어 95% 이상이 표적화된 서열에 맵핑될 수 있다.
어느 PCR 프로브가 이량체를 형성할 가능성이 있는지를 측정하는 다른 방법이 존재함에 주목한다. 일 구현예에서, 최적화되지 않은 세트의 프라이머를 사용하여 증폭시킨 DNA의 혼주물의 분석은, 문제가 있는 프라이머를 측정하기에 충분할 수 있다. 예를 들면, 분석은 서열분석을 사용하여 수행될 수 있으며, 최대 수로 존재하는 이들 이량체는 이량체를 형성할 가능성이 최대인 것으로 측정되며, 제거될 수 있다.
당해 방법은 예를 들면, SNP 유전형, 이형접합성 비율 측정, 카피 수 측정, 및 다른 표적화된 서열분석 적용에 대한 다수의 잠재적인 적용을 갖는다. 일 구현예에서, 프라이머 설계 방법은 본 서류의 어딘가에 기술된 미니-PCR 방법과의 조합에서 사용될 수 있다. 일부 구현예에서, 프라이머 설계 방법은 거대한 다중화된 PCR 방법이 일부로서 사용될 수 있다.
프라이머에서 태그의 사용은 프라이머 이량체 생성물의 증폭 및 서열분석을 감소시킬 수 있다. 일부 구현예에서, 프라이머는 태그와 함께 루프 구조를 형성하는 내부 영역을 함유한다. 특수 구현예에서, 프라이머는 표적 유전자자리에 대해 특이적인 5' 영역, 표적 유전자자리에 대해 특이적이지 않고 루프 구조를 형성하는 내부 영역, 및 표적 유전자자리에 대해 특이적인 3' 영역을 포함한다. 일부 구현예에서, 루프 영역은 2개의 결합 영역 사이에 있을 수 있으며, 여기서 2개의 결합 영역은 주형 DNA의 연속된 또는 이웃하는 영역에 결합하도록 설계된다. 다양한 구현예에서, 3' 영역의 길이는 적어도 7개의 뉴클레오타이드이다. 일부 구현예에서, 3' 영역의 길이는 7 내지 20개의 뉴클레오타이드이며, 예를 들면, 7 내지 15개의 뉴클레오타이드, 또는 7 내지 10개의 뉴클레오타이드를 포함한다. 다양한 구현예에서, 프라이머는 표적 유전자자리(예를 들면, 태그 또는 공통의 프라이머 결합 부위)에 대해 특이적이지 않고 5' 영역에 이어서 표적 유전자자리에 대해 특이적인 영역, 표적 유전자자리에 대해 특이적이지 않은 고 루프 구조를 형성하는 내부 영역, 및 표적 유전자자리에 대해 특이적인 3' 영역을 포함한다. 태그-프라이머는 20개 미만, 15개 미만, 12개 미만, 및 심지어 10개 미만의 염기 쌍으로 필수적인 표적-특이적인 서열을 단축시키기 위해 사용될 수 있다. 이는, 표적 서열이 프라이머 결합 부위내에서 단편화되는 경우 표준 프라이머 설계로 우연일 수 있거나, 프라이머 설계로 설계될 수 있다. 당해 방법의 장점은: 이것이 특정의 최대 앰플리콘 길이에 대해 설계될 수 있는 검정의 수를 증가시키고, 이것이 프라이머 서열의 "비-정보성" 서열분석을 단축시킨다는 것이다. 이는 또한 내부 태그화(당해 서류의 다른 곳 참조)와 함께 사용될 수 있다.
일 구현예에서, 다중화되고 표적화된 PCR 증폭에서 비생산성 생성물의 상대적인 양은 어닐링 온도를 상승시킴으로써 감소시킬 수 있다. 하나가 표적 특이적인 프라이머와 동일한 태그를 지닌 증폭 라이브러리인 경우, 어닐링 온도는, 태그가 프라이머 결합에 기여할 것이므로 게놈 DNA와 비교하여 증가될 수 있다. 일부 구현예에서, 본 발명자들은 다른 곳에 보고된 것보다 더 긴 어닐링 시간을 사용하는 것과 함께 앞서 보고된 것보다 현저히 더 낮은 프라이머 농도를 사용한다. 일부 구현예에서, 어닐링 시간은 3분 이상, 5분 이상, 8분 이상, 10분 이상, 15분 이상, 20분 이상, 30분 이상, 60분 이상, 120분 이상, 240분 이상, 480분 이상, 및 심지어 960분 이상일 수 있다. 일 구현예에서, 보다 긴 어닐링 시간이 앞서의 보고에서 보다 더 사용되어, 보다 낮은 프라이머 농도를 허용한다. 다양한 구현예에서, 정상의 연장 시간보다 긴 연장시간, 예를 들면, 3, 5, 8, 10, 또는 15분 이상이 사용된다. 일부 구현예에서, 프라이머 농도는 50 nM, 20 nM, 10 nM, 5 nM, 1 nM와 같이 낮고, 1μM 이하이다. 이는 놀랍게도 고도로 다중화된 반응, 예를 들면, 1,000-플렉스 반응(plex reaction), 2,000-플렉스 반응, 5,000-플렉스 반응, 10,000-플렉스 반응, 20,000-플렉스 반응, 50,000-플렉스 반응, 및 심지어 100,000-플렉스 반응에 대한 견고한 수행능을 생성한다. 일 구현예에서, 증폭은 긴 어닐링 시간과 함께 1, 2, 3, 4 또는 5개의 주기 실시를 사용한 후, 이어서 태그된 프라이머를 사용한 보다 일반적인 어닐링 시간을 지닌 PCR 주기를 수반한다.
표적 위치를 선택하기 위해, 후보물 프라이머 쌍 설계의 혼주물을 사용하여 출발하고 프라이머 쌍 사이의 잠재적으로 역 상호작용의 열역학적 모델을 생성한 후 당해 모델을 사용하여 혼주물 속에서 다른 설계와 비혼화성인 설계를 제거할 수 있다.
선택 공정 후, 라이브러리 속에 남아있는 프라이머는 본 발명의 방법 중 어느 것에서도 사용할 수 있다.
예시적인 프라이머 라이브러리
하나의 측면에서, 본 발명은 본 발명의 방법 중 어느 것을 사용하여 후보물 프라이머의 라이브러리에서 선택된 프라이머와 같은 프라이머의 라이브러리를 특징으로 한다. 일부 구현예에서, 라이브러리는 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리를 하나의 반응 용적으로 동시에 하이브리드화하거나(또는 동시에 하이브리드화할 수 있거나) 또는 동시에 증폭시키는(또는 동시에 증폭시킬 수 있는) 프라이머를 포함한다. 다양한 구현예에서, 라이브러리는 1,000 내지 2,000; 2,000 내지 5,000; 5,000 내지 7,500; 7,500 내지 10,000; 10,000 내지 20,000; 20,000 내지 25,000; 25,000 내지 30,000; 30,000 내지 40,000; 40,000 내지 50,000; 50,000 내지 75,000; 또는 75,000 내지 100,000개를 포함하는 상이한 표적 유전자자리를 하나의 반응 용적으로 동시에 증폭시키는(또는 동시에 증폭시킬 수 있는) 프라이머를 포함한다. 다양한 구현예에서, 라이브러리는 1,000 내지 100,000개의 상이한 표적 유전자자리, 예를 들면, 1,000 내지 50,000; 1,000 내지 30,000; 1,000 내지 20,000; 1,000 내지 10,000; 2,000 내지 30,000; 2,000 내지 20,000; 2,000 내지 10,000; 5,000 내지 30,000; 5,000 내지 20,000; 또는 5,000 내지 10,000개를 포함하는 상이한 표적 유전자자리를 하나의 반응 용적으로 동시에 증폭시키는(또는 동시에 증폭시킬 수 있는) 프라이머를 포함한다. 일부 구현예에서, 라이브러리는 표적 유전자자리를 하나의 반응 용적으로 동시에 증폭시킴으로써(또는 동시에 증폭시킬 수 있음으로써) 60, 40, 30, 20, 10, 5, 4, 3, 2, 1, 0.5, 0.25, 0.1, 또는 0.5% 미만의 증폭된 생성물이 프라이머 이량체가 되도록 하는 프라이머를 포함한다. 다양한 구현예에서, 프라이머 이량체인 증폭된 생성물의 양은 0.5 내지 60%, 예를 들면, 0.1 내지 40%, 0.1 내지 20%, 0.25 내지 20%, 0.25 내지 10%, 0.5 내지 20%, 0.5 내지 10%, 1 내지 20%, 또는 1 내지 10%를 포함한다. 일부 구현예에서, 프라이머는 표적 유전자자리를 하나의 반응 용적으로 동시에 증폭시킴으로써(또는 동시에 증폭시킬 수 있음으로써) 적어도 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, 또는 99.5%의 증폭된 생성물이 표적 앰플리콘이 되도록 한다. 다양한 구현예에서, 표적 앰플리콘인 증폭된 생성물의 양은 50 내지 99.5%이며, 예를 들면, 60 내지 99%, 70 내지 98%, 80 내지 98%, 90 내지 99.5%, 또는 95 내지 99.5%를 포함한다. 일부 구현예에서, 프라이머는 표적 유전자자리를 하나의 반응 용적에서 동시에 증폭시킴으로써(또는 동시에 증폭시킬 수 있음으로써) 적어도 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, 또는 99.5%의 표적화된 유전자자리가 증폭되도록 한다. 다양한 구현예에서, 증폭된 표적 유전자자리의 양은 50 내지 99.5%이며, 예를 들면, 60 내지 99%, 70 내지 98%, 80 내지 99%, 90 내지 99.5%, 95 내지 99.9%, 또는 98 내지 99.99%를 포함한다. 일부 구현예에서, 프라이머의 라이브러리는 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 프라이머 쌍을 포함하며, 여기서 프라이머의 각각의 쌍은 전방 시험 프라이머 및 역방 시험 프라이머를 포함하고 여기서 시험 프라이머의 각각의 쌍은 표적 유전자자리에 하이브리드화된다. 일부 구현예에서, 프라이머의 라이브러리는, 상이한 표적 유전자자리에 각각 하이브리드화하는 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 개개 프라이머를 포함하며, 여기서 개개 프라이머는 프라이머 쌍의 일부가 아니다.
다양한 구현예에서, 각각의 프라이머의 농도는 100, 75, 50, 25, 20, 10, 5, 2, 또는 1 nM 미만, 또는 500, 100, 10, 또는 1 μM 미만이다. 다양한 구현예에서, 각각의 프라이머의 농도는 1μM 내지 100 nM이며, 예를 들면, 1 μM 내지 1 nM, 1 내지 75 nM, 2 내지 50 nM 또는 5 내지 50 nM를 포함한다. 다양한 구현예에서, 프라이머의 GC 함량은 30 내지 80%이며, 예를 들면, 40 내지 70%, 또는 50 내지 60%를 포함한다. 일부 구현예에서, 프라이머의 GC 함량의 범위는 30, 20, 10, 또는 5% 미만이다. 일부 구현예에서, 프라이머의 GC 함량의 범위는 5 내지 30%이고, 예를 들면, 5 내지 20% 또는 5 내지 10%를 포함한다. 일부 구현예에서, 시험 프라이머의 용융 온도(Tm)는 40 내지 80 ℃이며, 예를 들면, 50 내지 70 ℃, 55 내지 65 ℃, 또는 57 내지 60.5 ℃를 포함한다. 일부 구현예에서, Tm은 빌트-인(built-in) SantaLucia 매개변수(primer3.sourceforge.net에서 범세계통신망)를 사용하는 Primer3 프로그램(libprimer3 release 2.2.3)을 사용하여 계산한다. 일부 구현예에서, 프라이머의 용융 온도의 범위는 15, 10, 5, 3, 또는 1℃ 미만이다. 일부 구현예에서, 프라이머의 용융 온도의 범위는 1 내지 15 ℃이며, 예를 들면, 1 내지 10 ℃, 1 내지 5 ℃, 또는 1 내지 3 ℃를 포함한다. 일부 구현예에서, 프라이머의 길이는 15 내지 100개의 뉴클레오타이드이고, 예를 들면, 15 내지 75개의 뉴클레오타이드, 15 내지 40개의 뉴클레오타이드, 17 내지 35개의 뉴클레오타이드, 18 내지 30개의 뉴클레오타이드, 20 내지 65개의 뉴클레오타이드를 포함한다. 일부 구현예에서, 프라이머의 길이의 범위는 50, 40, 30, 20, 10, 또는 5개 미만의 뉴클레오타이드이다. 일부 구현예에서, 프라이머의 길이의 범위는 5 내지 50개의 뉴클레오타이드이며, 예를 들면, 5 내지 40개의 뉴클레오타이드, 5 내지 20개의 뉴클레오타이드, 또는 5 내지 10개의 뉴클레오타이드를 포함한다. 일부 구현예에서, 표적 앰플리콘의 길이는 50 내지 100개의 뉴클레오타이드이고, 예를 들면, 60 내지 80개의 뉴클레오타이드, 또는 60 내지 75개의 뉴클레오타이드를 포함한다. 일부 구현예에서, 표적 앰플리콘의 길이는 50, 25, 15, 10, 또는 5개 미만의 뉴클레오타이드이다. 일부 구현예에서, 표적 앰플리콘의 길이의 범위는 5 내지 50 뉴클레오타이드이고, 예를 들면, 5 내지 25개의 뉴클레오타이드, 5 내지 15개의 뉴클레오타이드, 또는 5 내지 10개의 뉴클레오타이드를 포함한다.
이들 프라이머 라이브러리는 본 발명의 방법 중 어느 것에서도 사용될 수 있다.
예시적인 프라이머 키트
하나의 측면에서, 본 발명은 본 발명의 프라이머 라이브러리중 어느 것을 포함하는 키트(예를 들면, 핵산 시료 속에서 표적 유전자자리를 증폭시키기 위한 키트)를 특징으로 한다. 일부 구현예에서, 본 기재내용에 기술된 방법을 달성하도록 설계된 다수의 프라이머를 포함하는 키트가 제형화될 수 있다. 프라이머는 본원에 개시된 바와 같은 외부 전방 및 역방 프라이머, 내부 전방 및 역방 프라이머일 수 있으며, 이들은 프라이머 설계에서 단락에 개시된 바와 같이 키트 속의 다른 프라이머에 대해 낮은 결합 친화성을 갖도록 설계되어진 프라이머일 수 있으며, 이들은 관련된 단락에 기술된 바와 같은 하이브리드 포획 프로브 또는 예비-원형화된 프로브, 또는 이의 일부 조합일 수 있다. 일 구현예에서, 키트는 본원에 개시된 방법과 함께 사용되도록 설계된 임신성 태아 속의 표적 염색체의 배수성 상태를 측정하기 위해 제형화될 수 있으며, 당해 키트는 다수의 내부 전방 프라이머 및 외부 역방 프라이머를 포함하고, 임의로 외부 전방 프라이머 및 외부 역방 프라이머를 포함하며, 여기서 각각의 프라이머는 표적 염색체, 및 임의로 추가의 염색체 상의 표적 부위(예를 들면, 다형체 부위) 중 하나의 상부 및/또는 하부로 DNA 영역에 하이브리드화하도록 설계된다. 일 구현예에서, 프라이머 키트는 본 문서의 어딘가에 기술된 진단 박스와 함께 사용될 수 있다. 일부 구현예에서, 당해 키트는 표적 유전자자리를 증폭시키기 위한 라이브러리를 사용하기 위한 설명서를 포함한다.
예시적인 다중 PCR 방법
하나의 측면에서, 본 발명은 (i) 핵산 시료를 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리에 동시에 하이브리드화하는 프라이머의 라이브러리와 접촉시켜 반응 혼합물을 생산하는 단계; 및 (ii) 반응 혼합물을 프라이머 연장 반응 조건(예를 들면, PCR 조건)에 적용시켜 표적 앰플리콘을 포함하는 증폭된 생성물을 생산하는 단계를 포함하는, 핵산 시료 속의 표적 유전자자리를 증폭시키는 방법을 특징으로 한다. 일부 구현예에서, 당해 방법은 또한 적어도 하나의 표적 앰플리콘(예를 들면, 적어도 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, 또는 99.5%의 표적 앰플리콘)의 존재 또는 부재를 측정하는 단계를 포함한다. 일부 구현예에서, 당해 방법은 또한 적어도 하나의 표적 앰플리콘(예를 들면, 적어도 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, 또는 99.5%의 표적 앰플리콘)의 서열을 측정하는 단계를 포함한다. 일부 구현예에서, 적어도 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, 또는 99.5%의 표적화된 유전자자리가 증폭된다. 다양한 구현예에서, 60, 50, 40, 30, 20, 10, 5, 4, 3, 2, 1, 0.5, 0.25, 0.1, 또는 0.05% 미만의 증폭된 생성물은 프라이머 이량체이다.
일 구현예에서, 본원에 개시된 방법은 고도로 효율적인 고도의 다중 표적화된 PCR을 사용하여 DNA를 증폭시킨 후 고 처리 서열분석에 의해 각각의 표적 유전자자리에서 대립유전자 빈도를 측정한다. 약 50 또는 100개의 PCR 프라이머를 하나의 반응 용적으로 대부분의 수득되는 서열 판독물이 표적화된 유전자자리에 맵핑되는 방식으로 다중화하는 능력은 신규하며 명확하다. 고도로 다중화된 표적 PCR을 고도의 효율적인 방식으로 허용하는 하나의 기술은 서로와 하이브리드화하는 경향이 없는 프라이머를 설계하는 단계를 포함한다. 전형적으로 프라이머로서 언급되는 PCR 프로브는 적어도 500; 적어도 1,000; 적어도 2,000; 적어도 5,000; 적어도 7,500; 적어도 10,000; 적어도 20,000; 적어도 25,000; 적어도 30,000; 적어도 40,000; 적어도 50,000; 적어도 75,000; 또는 적어도 100,000개의 잠재적인 프라이머 쌍 사이의 잠재적인 역(adverse) 상호작용, 또는 프라이머와 시료 DNA 사이의 원하지 않은 상호작용의 열역학적 모델을 생성한 후, 당해 모델을 사용하여 혼주물 속에서 다른 설계물과 비혼화성인 설계를 제거하는 단계에 의해 선택된다. 고도로 다중화되고 표적화된 PCR이 고도로 효율적인 방식으로 수행되도록 하는 다른 기술은 표적화된 PCR에 대한 부분적이거나 완전히 중첩된 접근법을 사용하는 것이다. 이들 접근법의 하나 또는 조합을 사용하는 것은, 서열 분석하는 경우, 표적화된 유전자자리에 맵핑될 DNA 분자의 대부분을 포함하는 생성되는 증폭된 DNA가 들어있는 단일의 혼주물 속에 적어도 300, 적어도 800, 적어도 1,200, 적어도 4,000 또는 적어도 10,000개의 프라이머의 다중화를 허용한다. 이들 접근법중 하나 또는 조합을 사용하는 것은 단일 혼주물 속의 다수의 프라이머가 표적화된 유전자자리에 맵핑하는 50% 이상, 60% 이상, 67% 이상, 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99%, 또는 99.5% 이상의 DNA 분자를 포함하는 생성되는 증폭된 DNA와 다중화하도록 한다.
일부 구현예에서, 표적 유전 물질의 검출은 다중화 양식으로 수행될 수 있다. 평행하게 수행될 수 있는 유전 표적 서열의 수는 1 내지 10, 10 내지 100, 100 내지 1000, 1000 내지 10,000, 10,000 내지 100,000, 100,000 내지 1,000,000, 또는 1,000,000 내지 10,000,000의 범위일 수 있다. 혼주물 당 100개 이상의 프라이머를 다중화하는 선행 접근법은 프라이머-이량체 형성과 같은 원치않는 부작용과 함께 유의적인 문제점을 초래하여 왔다.
표적화된 PCR
일부 구현예에서, PCR을 사용하여 게놈의 표적 특이적인 위치를 표적화할 수 있다. 혈장 시료 속에서, 원래의 DNA는 고도로 단편화(전형적으로 500 bp 미만, 평균 길이 200 bp 미만)된다. PCR에서, 전방 및 역방 프라이머 둘 모두는 동일한 단편에 어닐링되어 증폭이 가능하도록 한다. 따라서, 단편이 짧은 경우, PCR 검정은 또한 비교적 짧은 영역을 증폭시켜야 한다. MIPS과 같이, 다형성 위치가 폴리머라제 결합 부위와 너무 근접한 경우, 이는 상이한 대립유전자의 증폭시 편향을 초래할 수 있었다. 현재, SNP를 함유하는 것과 같은 다형성 영역을 표적화하는 PCR 프라이머는 전형적으로, 당해 프라이머의 3' 말단이 다형성 염기 또는 염기들에 바로 근접한 염기에 하이브리드화하도록 설계된다. 본원의 구현예에서, 전방 및 역방 PCR 프라이머의 둘 모두의 3' 말단은 표적화된 대립유전자의 변이체 위치(다형성 부위)에서 하나 또는 몇개의 위치가 떨어져 있는 염기에 하이브리드화하도록 설계된다. 다형성 부위(SNP 또는 달리)와, 프라이머의 3' 말단이 하이브리드화하도록 설계된 염기 사이의 염기의 수는 하나의 염기일 수 있거나, 이는 2개의 염기일 수 있거나, 이는 3개의 염기일 수 있거나, 이는 4개의 염기일 수 있거나, 이는 5개의 염기일 수 있거나, 이는 6개의 염기일 수 있거나, 이는 7 내지 10개의 염기일 수 있거나, 이는 11 내지 15개의 염기일 수 있거나, 이는 16 내지 20개의 염기일 수 있다. 전방 및 후방 프라이머는 다형성 부위에서 떨어진 상이한 수의 염기를 하이브리드화하도록 설계될 수 있다.
PCR 검정은 다수로 생성될 수 있지만, 상이한 PCR 검정 사이의 상호작용은 이들을 약 100개 검정을 초과하여 다중화하기 어렵게 한다. 다양한 복합체 분자 접근법을 사용하여 다중화 수준을 증가시킬 수 있지만, 이는 여전히 반응당 100개 미만, 아마도 200개 미만, 또는 아마도 500개 미만의 검정으로 제한될 수 있다. 다량의 DNA를 지닌 시료는 다수의 부반응 중에서 쪼개진 후 서열분석 전에 재조합될 수 있다. 전체 시료 또는 DNA 분자의 일부 소 집단이 제한되는 경우에, 시료를 쪼개는 것은 실질적인 노이즈를 도입시킬 수 있다. 일 구현예에서, 소량 또는 제한된 양의 DNA는 10 pg 미만, 10 내지 100 pg, 100 pg 내지 1 ng, 1 내지 10 ng, 또는 10 내지 100 ng이 양을 말할 수 있다. 당해 방법이, 다수의 혼주물로 쪼갬을 포함하는 다른 방법이 도입된 확률적 노이즈와 관련된 유의적인 문제를 유발할 수 있는 소량의 DNA에서 특히 유용하지만, 당해 방법은 특정한 양의 DNA의 시료에서 실시되는 경우 편향을 최소화시키는 이점을 여전히 제공함에 주목한다. 이러한 상황에서, 공통의 예비-증폭 단계를 사용하여 전체 시료 양을 증가시킬 수 있다. 이상적으로, 이러한 예비-증폭 단계는 대립유전자 분포를 눈에 띄게 변경시키지 않아야 한다.
일 구현예에서, 본원의 방법은 체액의 단일 세포 또는 DNA와 같은 제한된 시료를 사용하여, 서열분석 또는 일부 다른 유전형 방법에 의한 유전형을 위해 다수의 표적화된 유전자자리, 구체적으로 1,000 내지 5,000개의 유전자자리, 5,000 내지 10,000개의 유전자자리 또는 10,000개 이상의 유전자자리에 대해 특이적인 PCR 생성물을 생성할 수 있다. 현재, 5 내지 10개 이상의 표적물의 다중 PCR 반응을 수행하는 것은 주요 챌린지를 나타내며 흔히 프라이머 이량체, 및 다른 인공물과 같은 프라이머 부생성물에 의해 방해된다. 하이브리드화 프로브를 지닌 미세배열을 사용하여 표적 서열을 검출하는 경우, 프라이머 이량체 및 다른 인공물은 이들이 검출되지 않으므로, 무시될 수 있다. 그러나, 검출 방법으로서 서열분석을 사용하는 경우, 많은 대부분의 서열분석 판독은 이러한 인공물을 서열분석할 수 있으며 시료 속의 목적한 표적 서열은 서열분석하지 않을 수 있다. 50 또는 100개 이상의 반응을 하나의 반응 용적으로 다중화한 후 서열분석하는데 사용된 선행 기술에 기술된 방법은 20% 이상, 및 흔히 50% 이상, 많은 경우에 80% 이상 및 일부 경우에 90% 이상의 오프-표적 서열 판독을 생성할 것이다.
일반적으로, 시료의 다수(n)의 표적(50 초과, 100 초과, 500 초과, 또는 1,000 초과)의 표적화된 서열분석을 수행하기 위해서는, 시료를, 하나의 개개 표적을 증폭시키는 다수의 평행 반응으로 쪼갤 수 있다. 이는, PCR 멀티웰 플레이트(multiwell plate) 속에서 수행하거나 FLUIDIGM ACCESS ARRAY(미세유동성 칩 속에서 시료 당 48개 반응) 또는 DROPLET PCR과 같은 시판 플랫폼에서 RAIN DANCE TECHNOLOGY(100 내지 수천개의 표적)에 의해 수행하여 왔다. 불행하게도, 이들 쪼갬-및-혼주 방법(split-and-pool method)은 제한된 양의 DNA를 지닌 시료의 경우 문제가 되는데, 이는 각각의 웰 속에 게놈의 각각의 영역의 하나의 카피가 존재함을 보증하기 위한 충분한 카피의 게놈이 흔히 존재하지 않기 때문이다. 이는, 다형성 유전자자리가 표적화되고 다형성 유전자자리에서 대립유전자의 상대적인 비율이 요구되는 경우 특히 심각한 문제가 되는데, 이는, 쪼갬 및 혼주에 의해 도입된 확률적 노이즈가 DNA의 원래의 시료 속에 존재한 대립유전자의 비율의 매우 불량하게 정밀한 측정을 유발할 것이기 때문이다. 본원에 기술된 것은, 단지 제한된 양의 DNA가 이용가능한 경우에 적용가능한 많은 PCR 반응을 효과적으로 및 효율적으로 증폭시키는 방법이다. 일 구현예에서, 당해 방법은 단일 세포, 체액, 모계 혈장, 생검, 환경 및/또는 외부 시료 속에서 발견된 자유로이 부유하는 DNA와 같은 DNA의 혼합물의 분석을 위해 적용할 수 있다.
일 구현예에서, 표적화된 서열분석은 다음 단계들 중 하나, 다수, 또는 모두를 포함할 수 있다. a) DNA 단편의 양쪽 말단에서 어댑터 서열을 지닌 라이브러리를 생성하고 증폭시키는 단계. b) 라이브러리 증폭 후 다수의 반응물로 나누는 단계. c) DNA 단편의 양쪽 말단에서 라이브러리를 어댑터 서열을 사용하여 생성시키고 임의로 증폭시키는 단계. d) 표적 및 하나의 태그 특이적인 프라이머 당 하나의 표적 특이적인 "전방" 프라이머를 사용하여 선택된 표적의 1000- 내지 10,000-플렉스 증폭을 수행하는 단계. e) 제1 라운드에서 표적 특이적인 전방 프라이머의 일부로서 도입된 공통의 태그에 대해 특이적인 하나(이상의) 프라이머 및 "역" 태그 특이적인 프라이머를 사용하여 당해 생성물의 제2 증폭을 수행하는 단계. f) 제한된 수의 주기를 위해 선택된 태그의 1000-플렉스 예비증폭을 수행하는 단계. g) 생성물을 다수의 분취량으로 나누어 개개 반응물 속의 표적의 소혼주물로 나누는 단계(예를 들면, 이것이 단일플렉스(singleplex)로 내리는 방법 모두를 사용할 수 있지만, 50 내지 500개-플렉스)을 증폭시키는 단계. h) 평행한 소혼주물 반응의 생성물을 혼주시키는 단계. i) 이들 증폭 동안에 프라이머가 서열분석 혼화성 태그(부분적으로 또는 완전한 길이의)를 수반할 수 있어서 생성물이 서열분석될 수 있도록 하는 단계.
고도의 다중화된 PCR
혈장에서 수득된 게놈 DNA와 같은 핵산 시료의 표적 서열(예를 들면, SNP 유전자자리)이 수백 내지 수천개 이상의 표적화된 증폭을 수행하는 방법이 본원에 기재되어 있다. 증폭된 시료는 비교적 프라이머 이량체 생성물을 함유하지 않을 수 있으며 표적 유전자자리에서 낮은 대립유전자 편향을 갖는다. 증폭 동안 또는 후에 생성물이 서열분석 혼화성 어댑터와 함께 첨부되는 경우, 이들 생성물의 분석은 서열분석에 의해 수행될 수 있다.
당해 분야에 공지된 방법을 사용하여 고도의 다중화 PCR 증폭을 수행하는 단계는 과도한 바람직한 증폭 생성물이고 서열분석에 적합하지 않은 프라이머 이량체 생성물의 형성을 초래한다. 이는 이들 생성물을 형성하는 프라이머를 제거하거나, 프라이머의 인실리코 선택을 수행함으로써 경험적으로 감소시킬 수 있다. 그러나, 검정의 수가 많아질수록, 이러한 문제는 더 어려워진다.
하나의 해결책은 5000-플렉스 반응을 수개의 보다 적은-플렉스 증폭, 예를 들면, 150-플렉스 또는 5000-플렉스 반응으로 쪼개거나, 미소유체를 사용하거나 심지어 시료를 개개 PCR 생성물로 쪼개는 것이다. 그러나, 시료 DNA가, 임신성 혈장에 의한 침입성 태아 진단에서와 같이, 제한된 경우, 시료를 다수의 반응 간에 나누는 것은 병목현상을 초래할 것이므로 피해야 한다.
본원에 기술된 것은 시료의 혈장 DNA를 우선 포괄적으로 증폭시킨 후 반응당 보다 중간인 수의 표적 서열을 사용하여 시료를 다수의 다중 표적화된 농축 반응으로 나누는 방법이다. 일 구현예에서, 본원의 방법은 다수의 유전자자리에서 DNA 혼합물을 우선적으로 농축시키기 위해 사용될 수 있으며, 당해 방법은 다음 단계 중 하나 이상을 포함한다: 라이브러리 속의 분자가 DNA 단편의 양쪽 말단에 연결된 어댑처 서열을 갖는 경우 DNA의 혼합물의 라이브러리를 생성하고 증폭시키는 단계, 증폭된 라이브러리를 다수의 반응으로 나누는 단계, 표적 당 하나의 표적 특이적인 "전방" 프라이머를 및 하나 또는 다수의 어댑터 특이적인 공통의 "역" 프라이머를 사용하여 선택된 표적의 다중 증폭의 제1 라운드를 수행하는 단계. 일 구현예에서, 본원의 방법은 "역" 표적 특이적인 프라이머 및 제1 라운드에서 표적 특이적인 전방 프라이머의 일부로서 도입된 공통의 태그에 대해 특이적인 하나 또는 다수의 프라이머를 사용한 제2의 증폭을 수행하는 단계를 추가로 포함한다. 일 구현예에서, 당해 방법은 완전히 중첩된, 헤미-내포된(hemi-nested), 반-내포된(semi-nested), 한면이 완전히 중첩된, 한면이 헤미-내포된, 또는 한면이 반-내포된 PCR 접근법을 포함할 수 있다. 일 구현예에서, 본원의 방법은 DNA 혼합물을 다수의 유전자자리에 우선적으로 농축시키기 위해 사용되며; 당해 방법은 제한된 수의 주기를 위해 선택된 표적의 다중 예비증폭을 수행하는 단계, 당해 생성물을 다수이 분취량으로 나누는 단계 및 개개 반응에서 표적의 소혼주물을 증폭시키는 단계, 및 평행한 소혼주물 반응의 생성물을 혼주시키는 단계를 포함한다. 당해 접근법을 사용하여 50 내지 500개 유전자자리, 500 내지 5,000개 유전자자리, 5,000 내지 50,000개 유전자자리, 또는 심지어 50,000 내지 500,000개 유전자자리에 대한 낮은 수준의 대립유전자 편향을 생성할 수 있는 방식으로 표적화된 증폭을 수행할 수 있다. 일 구현예에서, 프라이머는 부분적인 또는 완전한 길이의 서열분석 혼화성 태그를 수반한다.
작업흐름은 (1) 혈장 DNA와 같은 DNA를 추출하는 단계, (2) 단편의 양쪽 말단에서 공통의 어댑터를 사용하여 단편 라이브러리를 제조하는 단계, (3) 어댑터에 대해 특이적인 공통의 라이브러리를 사용하여 라이브러리를 증폭시키는 단계, (4) 증폭된 시료 "라이브러리"를 다수의 분취량으로 분리하는 단계, (5) 분취량에서 다중(예를 들면, 표적 및 표적-특이적인 프라이머당 하나의 표적 특이적인 프라이머와의 약 100-플렉스, 1,000, 또는 10,000-플렉스) 증폭을 수행하는 단계, (6) 하나의 시료의 분취량을 혼주시키는 단계, (7) 시료를 바코딩(barcoding)하는 단계, (8) 시료를 혼합하고 농도를 조절하는 단계, (9) 시료를 서열분석하는 단계를 포함할 수 있다. 당해 작업흐름은 나열된 단계(예를 들면, 라이브러리 단계를 제조하는 단계 (2)는 3개의 효소 단계(평활 말단, dA 테일링 및 어댑터 연결) 및 3개의 정제 단계) 중의 하나를 함유하는 다수의 소-단계를 포함할 수 있다. 작업흐름의 단계들은 합해지거나, 나누어지거나, 다른 순서(예를 들면, 바 코딩 및 시료의 혼주)로 수행될 수 있다.
라이브러리의 증폭은, 짧은 단편을 보다 효율적으로 증폭시키기 위해 편향되는 방식으로 수행될 수 있음을 주목하는 것이 중요하다. 이러한 방식으로, 보다 짧은 서열, 예를 들면, 임신한 여성의 순환에서 발견된 세포 유리된 태아 DNA(태반 기원의)와 같은 모노-뉴클레오좀 DNA 단편을 우선적으로 증폭시키는 것이 가능하다. PCR 검정은 태그, 예를 들면, 서열분석 태그(일반적으로 15 내지 25개 염기의 트렁케이트된(truncated) 형태)를 가질 수 있다. 다중화 후, 시료의 PCR 다중화를 혼주시킨 후 태그를 태그-특이적인 PCR(연결에 의해 또한 수행될 수 있다)에 의해 완료(바 코딩 포함)시킨다. 또한, 완전한 서열분석 태그를 다중화로서 동일한 반응에 가할 수 있다. 제1 주기에서 표적은 표적 특이적인 프라이머를 사용하여 증폭시킬 수 있으며, 후속적으로 태그-특이적인 프라이머는 SQ-어댑터 서열을 완료시키기 위해 대체된다. PCR 프라이머는 태그를 수반하지 않을 수 있다. 서열분석 태그는 연결에 의해 증폭 생성물에 첨부된다.
일 구현예에서, 클론 서열분석에 의한 증폭된 물질이 평가를 수반한 고도의 다중화 PCR은 태아 이수성의 검출과 같은 다양한 적용을 위해 사용될 수 있다. 전통적인 다중화 PCR이 50개 이하의 유전자자리를 동시에 평가하지만, 본원에 기술된 접근법을 사용하여 50개 이상의 유전자자리를 동시에, 100개 이상의 유전자자리를 동시에, 500개 이상의 유전자자리를 동시에, 1,000개 이상의 유전자자리를 동시에, 5,000개 이상의 유전자자리를 동시에, 10,000개 이상의 유전자자리를 동시에, 50,000개 이상의 유전자자리를 동시에, 및 100,000개 이상의 유전자자리를 동시에 동시 평가하는 것이 가능할 수 있다. 실험은, 10,000개 이상까지의 명백한 유전자자리가 하나의 반응에서, 비-침입성 태아 이수성 진단 및/또는 카피 수 요청을 고 정밀성으로 이루기에 충분히 우수한 효능 및 특이성으로 동시에 평가할 수 있음이 밝혀졌다. 검정은 단일 반응물을, 모계 혈장, 이의 단편, 또는 모계 태반에서 분리된 cfDNA 시료, 이의 단편, 또는 cfDNA 시료의 추가로 가공된 유도체와 같은 시료 전체와 합할 수 있다. 시료(예: cfDNA 또는 유도체)는 또한 다수의 평행한 다중 반응으로 쪼갤 수 있다. 최적의 시료 쪼갬 및 다중화는 다양한 수행 명세를 트레이딩 오프(trading off)함으로써 측정된다. 제한된 양의 물질로 인하여, 시료를 다수의 분획으로 쪼개는 단계는 시료채취 노이즈, 취급 시간을 도입시키고, 오차 가능성을 증가시킬 수 있다. 역으로, 보다 높은 다중화는 둘 모두 시험 수행능을 감소시킬 수 있는 보다 큰 양의 가짜 증폭 및 증폭 시 보다 큰 불균등을 생성할 수 있다.
본원에 기술된 방법의 적용 시 2개의 중요한 관련된 고려는, 대립유전자 빈도 또는 다른 측정이 수득되는 물질에서 원래의 시료(예를 들면, 혈장)의 제한된 양 및 원래의 분자의 수이다. 원래의 분자의 수가 특정 수준 이하인 경우, 무작위 시료채취 노이즈는 유의적으로 되며, 시험의 정밀도에 영향을 미칠 수 있다. 전형적으로, 비-침입성 모계 이수성 진단을 달성하기에 충분한 품질의 데이터는, 측정이 표적 유전자자리 당 500 내지 1000개의 원래의 분자의 등가물을 포함하는 시료에서 수행된 경우 수득될 수 있다. 다수의 명확한 측정, 예를 들면, 시료 용적을 증가시키는 다수의 방법이 존재한다. 시료에 적용된 각각의 조작은 또한 잠재적으로 물질의 손실을 초래한다. 다양한 조작으로 부과된 손실을 특성화하고 특정의 조작의 수율을 피하거나, 경우에 따라 개선시켜 시험의 수행능을 감퇴시킬 수 있는 손실을 피하는 것이 필수적이다.
일 구현예에서, 원래의 시료(예: cfDNA 시료) 모두 또는 분획을 증폭시킴으로써 후속된 단계에서 잠재적인 손실을 경감시키는 것이 가능하다. 시료 속에서 유전 물질 모두를 증폭시켜, 하부 공정에 이용가능한 양을 증가시키는 다양한 방법이 이용가능하다. 일 구현예에서, 연결 매개된 PCR(LM-PCR) DNA 단편은 하나의 명확한 어댑터, 2개의 명확한 어댑터, 또는 많은 명확한 어댑터의 연결 후 PCR에 의해 증폭된다. 일 구현예에서, 다수의 대체 증폭(MDA) phi-29 폴리머라제를 사용하여 모든 DNA를 등온선상으로 증폭시킨다. DOP-PCR 및 변형에서, 무작위 프라이밍을 사용하여 원래의 물질 DNA를 증폭시킨다. 각각의 방법은 모든 나타낸 게놈 영역에 걸친 증폭의 균일성, 원래 DNA의 포획 및 증폭 효능, 및 단편의 길이의 함수로서 증폭 수행능과 같은 특정의 특성을 갖는다.
일 구현예에서, LM-PCR은 3-프라임 타이로신을 갖는 단일의 이형이본체 어댑터(heroduplexed adaptor)와 함께 사용될 수 있다. 이형이본체 어댑터는 제1 라운드의 PCR 동안 원래의 DNA 단편의 5-프라임 및 3-프라임 말단에서 2개의 명확한 서열로 전환될 수 있는 단일의 어댑터 분자의 사용을 가능하도록 한다. 일 구현예에서, 크기 분리, 또는 AMPURE, TASS 또는 다른 유사한 방법에 의해 증폭된 라이브러리를 분획화하는 것이 가능하다. 연결 전에, 시료 DNA는 평활 말단화(blunt ended)한 후, 단일 아데노신 염기를 3-프라임 말단에 가한다. 연결 전에 DNA를 제한 효소 또는 일부 다른 절단 방법을 사용하여 절단할 수 있다. 시료 단편의 3-프라임 아데노신 및 어댑터의 상보성 3-프라임 타이로신 오버행(overhang)의 연결은 연결 효능을 향상시킬 수 있다. PCR 증폭의 연장 단계는 약 200 bp, 약 300 bp, 약 400 bp, 약 500 bp 또는 약 1,000 bp보다 더 긴 단편의 증폭을 감소시키기 위한 시간 관점으로 인해 제한될 수 있다. 모계 혈장에서 발견된 보다 긴 DNA는 거의 전적으로 모계이므로, 이는 태아 DNA의 10 내지 50%가지의 농축 및 시험 수행능의 개선을 야기할 수 있다. 다수의 반응을 시판되는 키트에 의해 명시된 바와 같은 조건을 사용하여 수행하였으며; 시료 DNA 분자의 10% 미만의 성공적인 연결을 생성하였다. 이를 위한 반응 조건의 일련의 최적화는 연결을 대략 70% 개선시켰다.
미니- PCR
다음의 미니-PCR 방법은 짧은 핵산, 분해된 핵산, 또는 단편화된 핵산, 예를 들면, cfDNA를 함유하는 시료에 바람직하다. 전통적인 PCR 검정 설계는 명백한 태아 분자의 유의적인 손실을 초래하지만 손실은 매우 짧은 PCR 검정, 일명 미니-PCR 검정을 설계함으로써 현저히 감소시킬 수 있다. 모계 혈청 중 태아 cfDNA는 고도로 단편화되며 단편 크기는, 평균이 160 bp이고, 표준 편차가 15 bp이며, 최소 크기가 약 100 bp이고, 최대 크기가 약 220 bp인 대략 정규 방식(Gaussian fashion)으로 분포된다. 표적화된 다형성과 관련하여 단편 출발 및 말단 위치의 분포는, 필수적으로 무작위적이지 않지만, 개개 표적 중에서 광범위하게 및 모든 표적 중에서 집합적으로 변하며 하나의 특정한 표적 유전자자리의 다형성 부위는 유전자자리에서 기원하는 다양한 단편 중에서 출발 내지 말단의 어떠한 위치를 점유할 수 있다. 용어 미니-PCR은 추가의 한계 또는 제한없이 정상의 PCR을 말함에 동일하게 양호하게 나타낼 수 있음을 주목한다.
PCR 동안에, 증폭은 전방 및 역방 프라이머 부위 둘 모두를 포함하는 주형 DNA 단편에서만 발생할 것이다. 태아 cfDNA 단편은 짧으므로, 전방 및 역방 프라이머 둘 모두를 포함하는 길이 L의 태아 단편의 가능성을 나타내는 프라이머 부위 둘다의 가능성은 앰플리콘의 길이 대 단편의 길이의 비이다. 이상적인 조건 하에서, 앰플이콘이 45, 50, 55, 60, 65, 또는 70 bp인 검정은 시판되는 주형 단편 분자를 각각 72%, 69%, 66%, 63%, 59%, 또는 56%에서 성공적으로 증폭시킬 것이다. 앰플리콘 길이는 전방 및 역방 프라이밍 부위의 5-프라임 말단 사이에서의 길이이다. 당해 분야에 공지된 것에 의해 전형적으로 사용된 것보다 더 짧은 앰플리콘 길이는 짧은 서열 판복물 만을 요구함으로써 목적한 다형성 유전자자리의 보다 효율적인 측정을 야기할 수 있다. 일 구현예에서, 앰플리콘의 실질적인 분획은 100 bp 미만, 90 bp 미만, 80 bp 미만, 70 bp 미만, 65 bp 미만, 60 bp 미만, 55 bp 미만, 50 bp 미만, 또는 45 bp 미만일 수 있다.
당해 분야에 공지된 방법에서, 본원에 기술된 것과 같은 짧은 검정은, 이들이 요구되지 않고 프라이머 길이, 어닐링 특성, 및 전방 및 역방 프라이머 사이의 거리를 제한함으로써 프라이머 설계에 있어서 고려할만한 구속을 부여하므로, 일반적으로 피해진다.
프라이머의 3-프라임 말단이 다형성 부위의 거의 1 내지 6개 염기 내에 있는 경우 편향된 증폭 잠재능이 있음에 또한 주목한다. 초기 폴리머라제 결합의 부위에서 이러한 단일 염기 차이는 하나의 대립유전자의 우선적인 증폭을 초래할 수 있으며, 이는 관찰된 대립유전자 빈도를 변경시키고 수행능을 감퇴시킬 수 있다. 이들 구속 모두는 특수 유전자자리를 성공적으로 증폭시킬 프라이머를 확인하고, 동일한 다중화 반응에 혼화성인 거대 세트의 프라이머를 설계하도록 한다. 일 구현예에서, 내부 전방 및 역방 프라이머의 3' 말단은 다형성 부위의 상부 DNA 영역에 하이브리드화하며, 소수의 염기에 의해 다형성 부위에서 분리되도록 설계된다. 이상적으로, 염기의 수는 6 내지 10개 염기일 수 있으나, 동일하게 4 내지 15개 염기, 3 내지 20개 염기, 2 내지 30개 염기, 또는 1 내지 60개 염기 사이일 수 있으며, 실질적으로 동일한 말단을 달성한다.
다중 PCR은, 모든 표적이 증폭되는 1 라운드의 PCR을 포함할 수 있거나 1라운드의 PCR에 이어서 하나 이상의 라운드의 중첩된 PCR 또는 중첩된 PCR의 일부 변형을 포함할 수 있다. 중첩된 PCR은 적어도 하나의 염기 쌍에 의해 내부적으로 이전 라운드에서 사용된 프라이머에 결합하는 하나 이상의 신규 프라이머를 사용한 후속 라운드 또는 라운드들의 PCR 증폭으로 이루어진다. 중첩된 PCR은 후속 반응에서 정확한 내부 서열을 갖는 이전 PCR의 증폭 생성물만을 증폭시킴으로써 다수의 가짜 증폭 표적의 수를 감소시킨다. 가짜의 증폭 표적을 감소시키는 것은 특히 서열분석 시 수득될 수 있는 유용한 측정의 수를 증진시킨다. 중첩된 PCR은 전형적으로 앞서의 프라이머 결합 부위에 대해 완전히 내부인 프라이머의 설계 단계, 증폭에 요구되는 최소 DNA 분절 크기를 필수적으로 증가시키는 단계를 포함한다. DNA가 고도로 단편화된 모계 혈장 cfDNA와 같은 시료의 경우, 보다 큰 검정 크기는, 측정이 수득될 수 있는 명확한 cfDNA 분자의 수를 감소시킨다. 일 구현예에서, 당해 효과를 상쇄시키기 위해, 제2 라운드의 프라이머 중 하나 또는 둘 모두를 내부적으로 일부 수의 염기에 연장하는 제1의 결합 부위를 오우버랩함으로써 전체 검정 크기를 최소한으로 증가시키면서 추가의 특이성을 달성하는 부분 중첩 접근법을 사용할 수 있다.
일 구현예에서, PCR 검정의 다중 혼주물을 설계하여 하나 이상의 염색체에서 이형접합성 SNP 또는 하나 이상의 염색체에서 다른 다형성 또는 비-다형성 유전자자리를 잠재적으로 증폭시킬 수 있으며 이들 검정은 단일 반응으로 사용하여 DNA를 증폭시킨다. PCR 검정의 수는 50 내지 200개의 PCR 검정, 200 내지 1,000개의 PCR 검정, 1,000 내지 5,000개의 PCR 검정, 또는 5,000 내지 20,000개의 PCR 검정(각각 50 내지 200-플렉스, 200 내지 1,000-플렉스, 1,000 내지 5,000-플렉스, 5,000 내지 20,000-플렉스, 20,000-플렉스 이상)일 수 있다. 일 구현예에서, 약 10,000개의 PCR 검정(10,000-플렉스)의 다중혼주물을 설계하여 염색체 X, Y, 13, 18, 및 21 및 1 또는 2 상의 이형접합성 SNP 유전자자리를 잠재적으로 증폭시키며 이들 검정은 단일 반응으로 사용됨으로써 모계 혈장 시료, 융모막 융모 시료, 양수 천자 시료, 단일 또는 소수의 세포, 다른 체액 또는 조직, 암, 또는 다른 유전 물질에서 수득된 cfDNA를 증폭시킨다. 각각의 유전자자리의 SNP 빈도는 앰플리콘의 서열분석의 클론성 또는 일부 다른 방법에 의해 측정될 수 있다. 대립유전자 빈도 분포의 통계적 분석 또는 모든 검정의 비를 사용하여 시료가 시험에 포함된 염색체 중의 하나 이상의 삼염색체를 함유하는지를 측정할 수 있다. 다른 구현예에서, 원래의 cfDNA 시료는 2개의 시료로 쪼개지며 평행한 5,000-플렉스 검정이 수행된다. 다른 구현예에서, 원래의 cfDNA 시료는 n개의 시료로 쪼개지고 평행한 (~10,000/n)-플렉스 검정이 수행되며, 여기서 n은 2 내지 12, 또는 12 내지 24, 또는 24 내지 48, 또는 48 내지 96이다. 데이터는 이미 기술된 바와 유사한 방식으로 수집되어 분석된다. 당해 방법은 전좌, 결실, 중복, 및 다른 염색체 비정상을 검출하는데 동등하게 잘 적용될 수 있음에 주목한다.
일 구현예에서, 표적 게놈에 대해 상동성이 없는 테일(tail)을 또한 프라이머 중 어느 것의 3-프라임 또는 5-프라임 말단에 가할 수 있다. 이들 테일은 후속적인 조작, 과정 또는 측정을 촉진한다. 일 구현예에서, 테일 서열은 전방 및 역방 표적 특이적인 프라이머에 대해 동일할 수 있다. 일 구현예에서, 상이한 테일을 전방 및 역방 표적 특이적인 프라이머에 대해 사용할 수 있다. 일 구현예에서, 다수의 상이한 테일은 상이한 유전자자리 또는 유전자자리의 세트에 사용할 수 있다. 특정의 테일은 모든 유전자자리 또는 유전자자리의 소세트 중에서 공유될 수 있다. 예를 들어, 현재의 서열분석 플랫폼 중 어느 것에 의해 요구되는 전방 및 역방 서열에 상응하는 전방 및 역방 테일을 사용하는 것은 증폭 후 직접적인 서열분석을 가능하도록 할 수 있다. 일 구현예에서, 당해 테일은 다른 유용한 서열을 가하기 위해 사용될 수 있는 모든 증폭된 표적 중에서 일반적인 프라이밍 부위로서 사용될 수 있다. 일부 구현예에서, 내부 프라이머는 표적화된 유전자자리(예를 들면, 다형성 유전자자리)의 상부 또는 하부에 하이브리드화하도록 설게된 영역을 함유할 수 있다. 일부 구현예에서, 프라이머는 분자 바코드를 함유할 수 있다. 일부 구현예에서, 프라이머는 PCR 증폭을 허용하도록 설계된 공통의 프라이밍 서열을 함유할 수 있다.
일 구현예에서, 10,000-플렉스 PCR 검정 혼주물을 생성시켜 전방 및 역방 프라이머가 HISEQ, GAIIX, 또는 MYSEQ(ILLUMINA에서 시판됨)와 같은 고 배출 서열분석 장치에 의해 요구되는 필요한 전방 및 역방 서열에 상응하는 테일을 가지도록 한다. 또한, 서열분석 테일에 대해 포함된 5-프라임은 뉴클레오타이드 바코드 서열을 앰플리콘에 가하여, 고 배출 서열분석 장치의 단일 레인 속에서 다수의 시료의 다중 서열분석이 가능하도록 하는 후속적인 PCR에서 프라이밍 부위로서 사용될 수 있는 추가의 서열이다.
일 구현예에서, 10,000-플렉스 PCR 검정 혼주물을 생성하여 역방 프라이머가 고 배출 서열분석 장치에 의해 요구되는 필요한 역방 서열에 상응하는 테일을 갖도록 한다. 제1의 10,000-플렉스 검정을 사용한 증폭 후, 후속적인 PCR 증폭을 모든 표적에 대해 부분적으로 중첩된 전방 프라이머(예를 들면, 6개-염기가 중첩된) 및 제1 라운드에 포함된 역 서열분석 테일에 상응하는 역방 프라이머를 갖는 다른 10,000-플렉스 혼주물을 사용하여 수행할 수 있다. 단지 하나의 표적 특이적인 프라이머 및 공통의 프라이머 한계를 사용한 이러한 후속적인 라운드의 부분적으로 중첩된 증폭은 검정의 요구되는 크기, 감소되는 시료채취 노이즈를 제한하지만, 가짜의 앰플리콘의 수를 크게 감소시킨다. 서열분석 태그를 첨부된 연결 어댑터에 및/또는 PCR 프로브의 일부로서 가하여 태그가 최종 앰플리콘의 일부이도록 할 수 있다.
태아 분획은 시험의 수행능에 영향을 미친다. 모계 혈장에서 발견된 DNA의 태아 분획을 농축시키는 다수의 방법이 존재한다. 태아 분획은 이미 논의된 앞서 기술된 LM-PCR 방법 및 또한 긴 모계 단편의 표적화된 제거에 의해 증가시킬수 있다. 일 구현예에서, 표적 유전자자리의 다중 PCR 증폭 전에, 추가의 다중 PCR 반응을 수행하여 후속적인 다중 PCR에서 표적화된 유전자자리에 상응하는 길고 거대한 모계 단편을 선택적으로 제거할 수 있다. 추가의 프라이머를 설계하여 세포 유리 테마 DNA 단편 중에 존재하는 것으로 예측되는 것보다 다형성에서부터 더 큰 거리의 부위를 어닐링한다. 이들 프라이머는 표적 다형성 유전자자리의 다중 PCR 이전에 1개 주기의 다중 PCR 반응에서 사용할 수 있다. 이들 원위(distal) 프라이머는 DNA의 태그된 조각의 선택적인 인지를 가능하도록 할 수 있는 분자 또는 잔기로 태그된다. 일 구현예에서, DNA의 이들 분자는 1회 주기의 PCR 후 이들 프라이머를 포함하는 새로이 형성된 이본쇄 DNA의 제거를 허용하는 바이오틴 분자로 공유결합적으로 변형시킬 수 있다. 제1 라운드가 원래의 물질가 유사하게 되는 동안에 이본쇄 DNA가 형성되었다. 하이브리드 물질의 제거는 자기 스트렙타비딘 비드의 사용에 의해 달성될 수 있다. 동등하게 잘 작업할 수 있는 다른 태그화 방법이 존재한다. 일 구현예에서, 크기 선택 방법을 사용하여 DNA의 보다 짧은 쇄; 예를 들면, 약 800 bp 미만, 약 500 bp 미만, 또는 약 300 bp 미만의 시료를 농축시킬 수 있다. 짧은 단편의 증폭은 이후에 일반적으로 진행될 수 있다.
본 기재내용에 기술된 미니-PCR 방법은 고도로 다중화된 증폭 및 단일 시료의 단일 반응으로 수백 내지 수천 또는 심지어 수백만의 유전자자리의 분석이 가능하도록 한다. 동시에, 증폭된 DNA의 검출은 다중화될 수 있으며, 수십 내지 수백개의 시료를 하나의 서열분석 레인에서 바코드화 PCR을 사용하여 다중화할 수 있다. 이들 다중화된 검출은 49-플렉스 이하까지 성공적으로 시험되어 왔으며, 보다 높은 정도의 다중화가 가능한다. 실제로, 이는 수백개의 시료가 단일의 서열분석 실행 시 수천개의 SNP에서 유전형화되도록 한다. 이러한 시료의 경우, 당해 방법은 유전형 및 이형접합성 비율의 측정 및 카피 수의 동시 측정을 허용하며, 이들 둘 모두는 이수성 검출 목적으로 사용될 수 있다. 당해 방법은 모계 혈장에서 발견된 자유로이 부유하는 DNA에서, 잉태된 태아의 이수성을 검출하는 데 특히 유용하다. 당해 방법은 태아의 성감별 및/또는 태아의 친부를 예측하는 방법이 일부로서 사용될 수 있다. 이는 돌연변이 용량을 위한 방법의 일부로서 사용될 수 있다. 당해 방법은 특정 양의 DNA 또는 RNA에 대해 사용될 수 있으며, 표적화된 영역은 SNP, 다른 다형성 영역, 비-다형성 영역, 및 이의 조합일 수 있다.
일부 구현예에서, 단편화된 DNA의 연결 매개된 공통의-PCR 증폭을 사용할 수 있다. 연결 매개된 공통의-PCR 증폭을 사용하여 혈장 DNA를 증폭시킬 수 있으며, 이후에 이는 다수의 평행한 반응으로 나눌 수 있다. 이는 또한 짧은 단편을 우선적으로 증폭시킴으로써 태아 분획을 농축시키는데 사용될 수 있다. 일부 구현예에서, 연결에 의해 태그를 분획에 첨가하는 것은 보다 짧은 분획의 검출, 프라이머의 보다 짧은 표적 서열 특이적인 부위의 사용 및/또는 비특이적인 반응을 감소시키는 보다 높은 온도에서 어닐링을 가능하도록 할 수 있다.
본원에 기술된 방법은 다수의 목적을 위해 사용될 수 있으며, 여기서 오염되는 DNA의 양과 혼합되는 DNA의 표적 세트가 존재한다. 일부 구현예에서, 표적 DNA 및 오염되는 DNA는 유전적으로 관련된 개체에서 기원할 수 있다. 예를 들어, 태아(표적)에서 유전적 비정상은 태아(표적) DNA 및 또한 모(오염되는) DNA를 함유하는 모계 혈장에서 검출될 수 있으며; 비정상은 전체 염색체 비정상(예를 들면, 이수성) 부분 염색체 비정상(예를 들면, 결실, 중복, 역전, 전좌), 폴리뉴클레오타이드 다형성(예를 들면, STR), 단일 뉴클레오타이드 다형성, 및/또는 다른 유전적 비정상 또는 차이를 함유하는 모계 혈장에서 검출될 수 있다. 일부 구현예에서, 표적 및 오염되는 DNA는 동일한 개체에서 기원할 수 있지만, 표적 및 오염되는 DNA는 예를 들면, 암의 경우에 하나 이상의 돌연변이에 의해 상이하다(참조: 예를 들면, H. Mamon 등 Preferential Amplification of Apoptotic DNA from Plasma : Potential for Enhancing Detection of Minor DNA Alterations in Circulating DNA. Clinical Chemistry 54:9 (2008)). 일부 구현예에서, DNA는 세포 배양물(세포자멸사) 상층액 속에서 발견될 수 있다. 일부 구현예에서, 후속적인 라이브러리 제조, 증폭 및/또는 서열분석을 위한 생물학적 시료(예: 혈액)속에서 세포자멸사를 유도하는 것이 가능하다. 이러한 목표를 달성하기 위한 다수의 가능한 작업흐름 및 프로토콜을 본원의 어느 곳에 나타낸다.
일부 구현예에서, 표적 DNA는 단일 세포에서, 표적 게놈의 1개 미만의 카피로 이루어진 DNA의 시료에서, 소량의 DNA에서, 혼합 기원의 DNA(예를 들면, 임신성 혈장; 태반 및 모계 DNA; 암 환자 혈장 및 종양: 건강한 DNA와 암 DNA 사이이 혼합물, 이식 등)에서, 다른 체액에서, 세포 배양물에서, 배양물 상층액에서, DNA의 법의학적 시료에서, DNA의 고대 시료에서(예를 들면, 호박 속에 갖힌 곤충), DNA의 다른 시료에서, 그리고 이의 조합에서 기원할 수 있다.
일부 구현예에서, 짧은 앰플리콘 크기를 사용할 수 있다. 짧은 앰플리콘 크기는 단편화된 DNA에 특히 적합하다(참조: 예를 들면, A. Sikora, et sl. Detection of increased amounts of cell-free fetal DNA with short PCR amplicons. Clin Chem . 2010 Jan;56(1):136-8.).
짧은 앰플리콘 크기의 사용은 일부 유의적인 이점을 생성할 수 있다. 짧은 앰플리콘 크기는 최적화된 앰플리콘 효능을 생성할 수 있다. 짧은 앰플리콘 크기는 전형적으로 보다 짧은 생성물을 생산하므로, 비특이적인 프라이밍에 대한 기회가 거의 없다. 보다 짧은 생성물은 집단이 보다 작을 것이므로, 서열분석 유동 셀에서 보다 농밀하게 군집될 수 있다. 본원에 기술된 방법은 보다 긴 PCR 앰플리콘에 동등하게 잘 작업할 수 있음에 주목한다. 앰플리콘 길이는, 경우에 따라, 예를 들면, 보다 긴 서열 길이를 서열분석하는 경우에 증가될 수 있다. 중첩된-PCR 프로토콜에서 제1 단계로서 100 bp 내지 200 bp 길이의 검정을 사용한 146-플렉스 표적화된 증폭을 사용한 실험은 단일 세포 및 게놈 DNA에서 긍정적인 결과로 수행되었다.
일부 구현예에서, 본원에 기술된 방법을 사용하여 SNP, 카피 수, 뉴클레오타이드 메틸화, mRNA 수준, 다른 유형의 RNA 발현 수준, 다른 유전적 및/또는 후생적 특징을 증폭시키고/시키거나 검출할 수 있다. 본원에 기술된 미니-PCR 방법은 다음-세대 서열분석과 함께 사용될 수 있는데; 이는 미세배열, 디지탈 PCR에 의한 계수, 실시간 PCR, 질량-분광 분석 등과 같은 다른 하부 방법과 함께 사용할 수 있다.
일부 구현예에서, 본원에 기술된 미니-PCR 증폭 방법은 소수 집단의 정밀한 정량화를 위한 방법의 일부로서 사용될 수 있다. 이는 스파이크 교정기(spike calibrator)를 사용한 절대적인 정량화를 위해 사용할 수 있다. 이는 매우 깊은 서열분석을 통한 돌연변이/소수의 대립유전자 정량화를 위해 사용할 수 있으며, 고도로 다중화된 양식으로 수행할 수 있다. 이는 사람, 동물, 식물 또는 다른 창조물에서 표준 친자확인 및, 친척 또는 조상의 실체 시험을 위해 사용될 수 있다. 이는 외부 시험을 위해서도 사용될 수 있다. 이는 어떠한 종류의 물질, 예를 들면, 양수 및 CVS, 정자, 수태 생성물(POC)에서 신속한 유전형 및 카피 수 분석(CN)에 사용될 수 있다. 이는 배아에서 채취한 생검된 시료에서 유전형과 같은 단일 세포 분석을 위해 사용될 수 있다. 이는 미니-PCR을 사용한 표적화된 서열분석에 의한 신속한 배아 분석(1일 미만, 1일, 또는 2일 내의 생검)을 위해 사용될 수 있다.
일부 구현예에서, 이는 종양 분석을 위해 사용될 수 있으며: 종양 생검은 흔히 건강한 세포 및 종양 세포의 혼합물이다. 표적화된 PCR은 배경 서열과 근접하거나 배경 서열이 없는 SNP 및 유전자자리의 깊은 서열분석을 허용한다. 이는 종양 DNA에서 이형접합성 분석의 손실 및 카피 수를 위해 사용될 수 있다. 상기 종양 DNA는 종양 환자의 많은 상이한 체액 또는 조직 속에 존재할 수 있다. 이는 종양 재발 및/또는 종양 스크리닝의 검출을 위해 사용될 수 있다. 이는 종자의 품질 조절 시험을 위해 사용될 수 있다. 이는 양식 또는 어업 목적을 위해 사용될 수 있다. 이들 방법 중 어느 것도 배수성 요청의 목적을 위한 비-다형성 유전자자리를 표적화하는데 동등하게 잘 사용될 수 있음에 주목한다.
본원에 개시된 방법의 근간이 되는 기본 방법중의 일부를 기술하는 일부 문헌은 다음을 포함한다: (1) Wang HY, Luo M, Tereshchenko IV, Frikker DM, Cui X, Li JY, Hu G, Chu Y, Azaro MA, Lin Y, Shen L, Yang Q, Kambouris ME, Gao R, Shih W, Li H. Genome Res. 2005 Feb;15(2):276-83. Department of Molecular Genetics, Microbiology and Immunology/The Cancer Institute of New Jersey, Robert Wood Johnson Medical School, New Brunswick, New Jersey 08903, USA. (2) High-throughput genotyping of single nucleotide polymorphims with high sensitivity. Li H, Wang HY, Cui X, Luo M, Hu G, Greenawalt DM, Tereshchenko IV, Li JY, Chu Y, Gao R. Methods Mol Biol. 2007;396 - PubMed PMID: 18025699. (3) A method comprising mUL tiplexing of an average of 9 assays for sequencing is described in: Nested Patch PCR enables highly mul tiplexed mutation discovery in candidate genes. Varley KE, Mitra RD. Genome Res. 2008 Nov;18(11):1844-50. Epub 2008 Oct 10. 본원에 개시된 방법은 상기 참조문헌에서보다도 더 많은 크기 정도의 다중화를 허용함에 주목한다.
표적화된 PCR 변이체 - 중첩
PCR을 수행하는 경우 가능한 많은 작업흐름이 존재하는데; 본원에 개시된 방법에 대해 전형적인 일부 작업흐름이 기재되어 있다. 본원에 요약된 단계는 다른 가능한 단계를 배제하는 것을 의미하지 않을 뿐 아니라 본원에 기술된 단계들 중 어느 것도 당해 방법이 적절히 작업하도록 하기 위해 요구되지 않음을 내포한다. 다수의 매개변수 변화 또는 다른 변형이 문헌에 공지되어 있으며, 본 발명의 본질에 영향을 미치지 않고 이루어질 수 있다. 하나의 특정한 일반화된 작업흐름은 다수의 가능한 변화를 수반하여 하기에 제공된다. 당해 변수는 전형적으로 가능한 제2 PCR 반응, 예를 들면, 수행될 수 있는 상이한 유형의 중첩을 말한다(단계 3). 변수를 상이한 시간에, 또는 본원에 명쾌하게 기술된 것과는 상이한 순서로 수행할 수 있다. 설명을 위해 다형성을 사용하는 예는, 경우에 따라, 비 다형성 유전자자리의 증폭을 위해 용이하게 채택할 수 있다 .
1. 시료 속의 DNA는, 첨부된, 라이브러리 태그 또는 연결 어댑터 태그(LT)로서 흔히 언급된 연결 어댑터를 가질 수 있으며, 여기서 연결 어댑터는 공통의 프라이밍 서열을 함유하며, 공통의 증폭을 수반한다. 일 구현예에서, 이는 단편화 후 서열분석 라이브러리를 생성하도록 설계된 표준 프로토콜을 사용하여 수행할 수 있다. 일 구현예에서, DNA 시료는 평활 말단화시킨 후, A를 3' 말단에 가할 수 있다. T-오버행을 지닌 Y-어댑터를 가하여 연결할 수 있다. 일부 구현예에서, 다른 점성 말단을 A 또는 T 오버행 대신 사용할 수 있다. 일부 구현예에서, 다른 어댑터, 예를 들면, 루프 연결 어댑터를 가할 수 있다. 일부 구현예에서, 어댑터는 PCR 증폭을 위해 설계된 태그를 가질 수 있다.
2. 특이적인 표적 증폭(STA): 수백 내지 수천 내지 수만 및 심지어 수십만 개의 표적의 예비 증폭을 하나의 반응 용적 속에서 다중화할 수 있다. STA는 전형적으로 5 내지 40회 주기, 2 내지 50회 주기, 및 심지어 1 내지 100회 주기로 실시될 수 있지만, 전형적으로 10 내지 30회 주기로 실시된다. 프라이머는 예를 들면, 보다 단순한 작업흐름을 위해 조절되거나 큰 비율의 이량체의 서열분석을 피할 수 있다. 전형적으로 동일한 태그를 수반하는 프라이머 둘 모두의 이량체는 증폭되지 않거나 효율적으로 서열분석되지 않을 것이다. 일부 구현예에서, 1 내지 10회 주기의 PCR을 수행할 수 있으며; 일부 구현예에서, 10 내지 20회 주기의 PCR을 수행할 수 있으며; 일부 구현예에서, 20 내지 30회 주기의 PCR을 수행할 수 있으며; 일부 구현예에서, 30 내지 40회의 PCR을 수행할 수 있고; 일부 구현예에서, 40회 이상 주기의 PCR을 수행할 수 있다. 증폭은 선형 증폭일 수 있다. 다수의 PCR 주기를 최적화시켜 최적 깊이의 판독(DOR) 프로파일을 생성할 수 있다. 상이한 DOR 프로파일이 상이한 목적을 위해 바람직할 수 있다. 일부 구현예에서, 모든 검정들 사이에서 보다 균일한 판독물의 분포가 바람직하며; DOR이 일부 검정의 경우 너무 작은 경우, 확률적 노이즈는 데이터의 경우 너무 커서 너무 유용할 수 없게 될 수 있지만, 판독물의 깊이가 너무 큰 경우, 각각의 추가의 판독물의 미미한 유용성은 비교적 작다.
프라이머 테일은 공통으로 태그된 라이브러리에서 단편화된 DNA를 검출하는 것을 개선시킬 수 있다. 라이브러리 태그 및 프라이머-테일이 동종 서열을 함유하는 경우, 하이브리드화가 개선될 수 있으며(예를 들면, 용융 온도(TM)는 낮아진다) 프라이머는, 프라이머 표적 서열의 일부분 만이 시료 DNA 단편내에 있는 경우 연장될 수 있다. 일부 구현예에서, 13개 이상의 표적 특이적인 염기쌍이 사용될 수 있다. 일부 구현예에서, 10 내지 12개의 표적 특이적인 염기쌍이 사용될 수 있다. 일부 구현예에서, 8 내지 9개의 표적 특이적인 염기쌍이 사용될 수 있다. 일부 구현예에서, 6 내지 7개의 표적 특이적인 염기쌍이 사용될 수 있다. 일부 구현예에서, STA는 예비-증폭된 DNA, 예를 들면, MDA, RCA, 다른 전체의 게놈 증폭, 또는 어댑터-매개된 공통의 PCR에서 수행할 수 있다. 일부 구현예에서, STA는 예를 들면, 크기 선택, 표적 포획, 직접적인 분해에 의해 특정의 서열 및 집단이 농축되거나 고갈된 시료에서 수행될 수 있다.
3. 일부 구현예에서, 제2의 다중 PCR 또는 프라이머 연장 반응을 수행하여 특이성을 증가시키고 바람직하지 않은 생성물을 감소시키는 것이 가능하다. 예를 들면, 보다 작은 검정 혼주물의 평행한 반응물로의 완전히 중첩, 어느 정도-중첩, 반-중첩, 및/또는 세분은 특이성을 증가시키기 위해 사용될 수 있는 모든 기술이다. 실험은, 시료를 400-플렉스 반응으로 쪼개는 것이 정확하게 동일한 프라이머를 사용한 하나의 1,200-플렉스 반응보다 더 큰 특이성을 갖는 생성물 DNA를 생성함을 나타낸다. 유사하게, 실험은 시료를 4개의 2,400-플렉스 반응으로 쪼개는 것이 정확하게 동일한 프라이머를 사용한 하나의 9,600-플렉스 반응보다 더 큰 특이성으로 생성물 DNA를 생성함을 나타낸다. 일 구현예에서, 동일한 및 반대의 방향성의 표적-특이적인 및 태그 특이적인 프라이머를 사용하는 것이 가능하다.
4. 일부 구현예에서, 태그-특이적인 프라이머 및 "공통의 증폭"을 사용한 STA 반응에 의해 (희석, 정제 또는 기타의 것) 생산된 DNA 시료를 증폭시키는, 즉, 많거나 또는 모든 예비-증폭되고 태그된 표적을 증폭시키는 것이 가능하다. 프라이머는 추가의 기능적 서열, 예를 들면, 바코드, 또는 고 배출 서열분석 플랫폼을 서열분석하는데 필수적인 완전한 어댑터 서열을 함유할 수 있다.
이들 방법은 DNA의 특정 시료의 분석을 위해 사용될 수 있으며, DNA의 시료가 특히 작거나, 이것이 DNA의 시료(여기서 당해 DNA는 모계 혈장의 경우에서와 같은 하나 이상의 개체에서 기원한다)인 경우 특히 유용하다. 이들 방법은 단일 또는 소수의 세포, 게놈 DNA, 혈장 DNA, 증폭된 혈장 라이브러리, 증폭된 세포자멸사 상층액 라이브러리, 또는 혼합된 DNA의 다른 시료와 같은 DNA 시료에서 사용될 수 있다. 일 구현예에서, 이들 방법은, 상이한 유전 구성의 세포가 암 또는 이식체를 지닌 것과 같은 단일의 개체 속에 존재할 수 있는 경우에 사용될 수 있다.
프로토콜 변이체 (상기 작업흐름에 대한 변형 및/또는 첨가)
직접적인 다중 미니- PCR: 태그된 프라이머를 지닌 다수의 표적 서열의 특이적인 표적 증폭(STA)을 도 1에 나타낸다. (101)은 X에서 목적한 다형성 유전자자리를 지닌 이본쇄 DNA를 나타낸다. (102)는 공통의 증폭을 위해 첨가된 연결 어댑터를 지닌 이본쇄 DNA를 나타낸다. (103)은 하이브리드화된 PCR 프라이머를 사용하여 공통으로 증폭된 일본쇄 DNA를 나타낸다. (104)는 최종 PCR 생성물을 나타낸다. 일부 구현예에서, STA는 100개 이상, 200개 이상, 500개 이상, 1,000개 이상, 2,000개 이상, 5,000개 이상, 10,000개 이상, 20,000개 이상, 50,000개 이상, 100,000 또는 200,000개 이상의 표적에서 수행될 수 있다. 후속적인 반응에서, 태그-특이적인 프라이머는 모든 표적 서열을 증폭시키고 태그를 연장시켜 시료 색인을 포함하는 서열분석을 위한 모든 필수적인 서열을 포함한다. 일 구현예에서, 프라이머는 태그되지 않을 수 있거나 단지 특정의 프라이머만 태그될 수 있다. 서열분석 어댑터는 통상의 어댑터 연결에 의해 첨가될 수 있다. 일 구현예에서, 초기 프라이머는 태그를 수반할 수 있다.
일 구현예에서, 프라이머는 증폭된 DNA의 길이가 예상치 못하게 짧도록 설계된다. 선행 기술은, 당해 분야의 통상의 기술자가 전형적으로 100+ bp의 앰플리콘을 설계함을 입증한다. 일 구현예에서, 앰플리콘은 80 bp 미만이 되도록 설계할 수 있다. 일 구현예에서, 앰플리콘은 70 bp 미만이 되도록 설계할 수 있다. 일 구현예에서, 앰플리콘은 60 bp 미만이 되도록 설계할 수 있다. 일 구현예에서, 앰플리콘은 50 bp 미만이 되도록 설계할 수 있다. 일 구현예에서, 앰플리콘은 45 bp 미만이 되도록 설계할 수 있다. 일 구현예에서, 앰플리콘은 40 bp 미만이 되도록 설계할 수 있다. 일 구현예에서, 앰플리콘은 35 bp 미만이 되도록 설계할 수 있다. 일 구현예에서, 앰플리콘은 40 내지 65 bp가 되도록 설계할 수 있다.
실험은 1200-플렉스 증폭을 사용하는 당해 프로토콜을 사용하여 수행하였다. 게놈 DNA 및 임신성 혈장 둘다를 사용하였고; 약 70%의 서열 판독물이 표적화된 서열로 맵핑되었다. 세부사항은 또한 당해 문서의 어딘가에 제공된다. 검정의 설계 및 선택없이 1042-플렉스의 서열분석은 프라이머 이량체 생성물인 >99%의 서열을 생성하였다.
후속적인 PCR: STA1후 다중 분취량의 생성물을 동일한 프라이머와의 감소된 복합성의 혼주물과 평행하게 증폭시킬 수 있다. 제1의 증폭은 물질을 충분하게 쪼갤 수 있다. 당해 방법은 작은 시료, 예를 들면, 약 6 내지 100 pg, 약 100 pg 내지 1 ng, 약 1 ng 내지 10 ng, 또는 약 10 ng 내지 100 ng인 것에 특히 우수하다. 당해 프로토콜은 1200-플렉스를 사용하여 3개의 400-플렉스가 되도록 수행하였다. 서열분석 판독물의 맵핑은 1200-플렉스 단독에서 60 내지 70% 근처에서 95% 이상까지 증가시켰다.
어느정도 -중첩된 미니 - PCR:(참조: 도 2) STA 1 후 내부 중첩된 전방 프라이머(103 B, 105 b) 및 하나의(또는 소수의) 태크-특이적인 역방 프라이머(103 A)의 다중 세트를 포함하는 제2의 STA를 수행한다. (101)은 X에서 목적한 다형성 유전자자리를 지닌 이본쇄 DNA를 나타낸다. (102)는 공통 증폭을 위해 가해진 연결 어댑터를 갖는 이본쇄 DNA를 나타낸다. (103)은 하이브리드화된 전방 프라이머 B 및 역방 프라이머 A로 공통적으로 증폭된 일본쇄 DNA를 나타낸다. (104)는 (103)에서 수득한 PCR 생성물을 나타낸다. (105)는 하이브리드화된 중첩된 전방 프라이머 b, 및 (103)과 (104) 사이에 발생한 PCR의 분자의 이미 일부인 역 태그 A를 지닌 (104)에서 수득한 생성물을 나타낸다. (106)은 최종 PCR 생성물을 나타낸다. 당해 작업흐름을 사용하여 일반적으로 95% 이상의 서열을 의도된 표적으로 맵핑한다. 중첩된 프라이머는 외부 전방 프라이머 서열과 오버랩될 수 있지만 추가의 3'-말단 염기를 도입한다. 일부 구현예에서, 1개 내지 20개 사이의 여분의 3' 염기를 사용하는 것이 가능하다. 실험은, 1,200-플렉스 설계에서 9개 이상의 여분의 3' 염기를 사용하는 것이 잘 작업됨을 나타낸다.
완전히 중첩된 미니 - PCR:(참조: 도 3) STA 단계 1 후, 태그(A, a, B, b)를 수반하는 2개의 중첩된 프라이머를 사용하여 제2의 다중 PCR(또는 감소된 다중성의 평행 m.p. PCR)을 수행하는 것이 가능하다. (101)은 X에서 목적한 다형성 유전자자리를 지닌 이본쇄 DNA를 나타낸다. (102)는 공통의 증폭을 위해 첨가된 연결 어댑터를 지닌 이본쇄 DNA를 나타낸다. (103)은 하이브리드화된 전방 프라이머 B 및 역방 프라이머 A를 사용하여 공통적으로 증폭된 일본쇄 DNA를 나타낸다. (104)는 (103)에서 수득한 PCR 생성물을 나타낸다. (105)는 하이브리드화된 중첩된 전방 프라이머 b 및 중첩된 역방 프라이머를 지닌 (104)에서 수득한 생성물을 나타낸다. (106)은 최종 PCR 생성물을 나타낸다. 일부 구현예에서, 2개의 완전한 세트의 프라이머를 사용하는 것이 가능하다. 완전히 중첩된 미니-PCR 프로토콜을 사용하는 실험을 사용하여 단일 및 3개의 세포에서 공통의 연결 어댑터를 첨부하고 증폭시키는 단계 (102)없이 146-플렉스 증폭을 수행하였다.
-내포된 미니- PCR:(참조: 도 4) 단편 말단에 어댑터를 갖는 표적 DNA를 사용하는 것이 가능하다. 전방 프라이머(B) 및 하나(또는 소수의) 태그-특이적인 역방 프라이머(A)의 다중 세트를 포함하는 STA를 수행한다. 제2의 STA는 공통의 태그-특이적인 전방 프라이머 및 표적 특이적인 역방 프라이머를 사용하여 수행할 수 있다. (101)은 X에서 목적한 다형성 유전자자리를 지닌 이본쇄 DNA를 나타낸다. (102)는 공통의 증폭을 위해 첨가된 연결 어댑터를 지닌 이본쇄 DNA를 나타낸다. (103)은 하이브리드화된 역방 프라이머 A를 사용하여 공통적으로 증폭된 일본쇄 DNA를 나타낸다. (104)는 역방 프라이머 A 및 연결 어댑터 태그 프라이머 LT를 사용하여 증폭된 (103)에서 수득한 PCR 생성물을 나타낸다. (105)는 하이브리드화된 전방 프라이머 B를 지닌 (104)에서 수득한 생성물을 나타낸다. (106)은 최종 PCR 생성물을 나타낸다. 당해 작업흐름에서, 표적 특이적인 전방 및 역방 프라이머를 별도의 반응에서 사용함으로써, 반응의 복잡성을 감소시키고 전방 및 역방 프라이머의 이량체 형성을 방지한다. 당해 실시예에서, 프라이머 A 및 B는 제1 프라이머인 것으로 고려될 수 있으며, 프라이머 'a' 및 'b'는 내부 프라이머인 것으로 고려될 수 있다. 당해 방법은 직접적인 PCR만큼 양호하므로 이는 직접적인 PCR에서 크게 개선되어 있지만 프라이머 이량체를 피한다. 세미 중첩된 프로토콜의 제1 라운드, 전형적으로 ~99%의 표적화되지 않은 DNA를 찾을 수 있지만, 제2 라운드 후에는 전형적으로 큰 개선이 있다.
3중 반-내포된 미니 - PCR: (참조: 도 5) 단편 말단에서 어댑터를 갖는 표적 DNA를 사용하는 것이 가능하다. 전방 프라이머(B) 및 하나(또는 소수의) 태그-특이적인 역방 프라이머(A) 및 (a)의 다중 세트를 포함하는 STA를 수행한다. 제2의 STA는 공통의 태그-특이적인 전방 프라이머 및 표적 특이적인 역방 프라이머를 사용하여 수행할 수 있다. (101)은 X에서 목적한 다형성 유전자자리를 지닌 이본쇄 DNA를 나타낸다. (102)는 공통의 증폭을 위해 첨가된 연결 어댑터를 지닌 이본쇄 DNA를 나타낸다. (103)은 하이브리드화된 역방 프라이머 A를 사용하여 공통적으로 증폭된 일본쇄 DNA를 나타낸다. (104)는 역방 프라이머 A 및 연결 어댑터 태그 프라이머 LT를 사용하여 증폭된 (103)에서 수득한 PCR 생성물을 나타낸다. (105)는 하이브리드화된 전방 프라이머(B)를 지닌 (104)에서 수득한 생성물을 나타낸다. (106)은 역방 프라이머 A 및 전방 프라이머 B를 사용하여 증폭된 (105)에서 수득한 PCR 생성물을 나타낸다. (107)은 하이브리드화된 역방 프라이머 'a'를 지닌 (106)에서 수득한 생성물을 나타낸다. (108)은 최종 PCR 생성물을 나타낸다. 당해 실시예에서, 프라이머 'a' 및 'B'는 내부 프라이머인 것으로 고려될 수 있으며, A는 제1 프라이머인 것으로 고려될 수 있다. 임의로, A 및 B 둘 모두는 제1 프라이머인 것으로 고려될 수 있고 'a'는 내부 프라이머인 것으로 고려될 수 있다. 역방 및 전방 프라이머의 지정은 스위치될 수 있다. 작업흐름에서, 표적 특이적인 전방 및 역방 프라이머를 별도의 반응에 사용함으로써, 반응의 복잡성을 감소시키고 전방 및 역방 프라이머의 이량체 형성을 방지할 수 있다. 당해 방법은 직접적인 PCR만큼 양호하므로 직접적인 PCR에서 크게 개선되어 있지만, 프라이머 이량체를 피한다. 반 중첩된 프로토콜의 제1 라운드 후, 전형적으로 ~99%의 표적화되지 않은 DNA를 찾을 수 있지만, 제2 라운드 후에는 전형적으로 큰 개선이 있다.
일-면 중첩된 미니- PCR: (참조: 도 6) 단편 말단에서 어댑터를 갖는 표적 DNA를 사용하는 것이 가능하다. 중첩된 전방 프라이머의 다중화 세트 및 역방 프라이머로서 연결 어댑터 태그를 사용하여 STA를 또한 수행할 수 있다. 이후에, 제2의 STA는 중첩된 전방 프라이머 및 공통의 역방 프라이머의 세트를 사용하여 수행할 수 있다. (101)은 X에서 목적한 다형성 유전자자리를 지닌 이본쇄 DNA를 나타낸다. (102)는 공통의 증폭을 위해 첨가된 연결 어댑터를 지닌 이본쇄 DNA를 나타낸다. (103)은 하이브리드화된 역방 프라이머 A를 사용하여 공통적으로 증폭된 일본쇄 DNA를 나타낸다. (104)는 역방 프라이머 A 및 연결 어댑터 태그 프라이머 LT를 사용하여 증폭된 (103)에서 수득한 PCR 생성물을 나타낸다. (105)는 하이브리드화된 중첩된 전방 프라이머를 지닌 (104)에서 수득한 생성물을 나타낸다. (106)은 최종 PCR 생성물을 나타낸다. 당해 방법은 제1 및 제2의 STA에서 중첩 프라이머를 사용하여 표준 PCR보다 더 짧은 표적 서열을 검출할 수 있다. 당해 방법은 상기 STA 단계 1 - 공통의 태그의 첨부 및 증폭을 이미 수행한 DNA의 시료로 전형적으로 수행하며; 2개의 중첩된 프라이머는 단지 하나의 면 위에 있고, 다른 면은 라이브러리 태그를 사용한다. 당해 방법은 세포자멸사 상층액 및 임신 혈장의 라이브러리에서 수행하였다. 당해 작업흐름으로, 대략 60%의 서열이 의도된 표적에 맵핑되었다. 역 어댑터 서열을 함유한 판독물은 맵핑되지 않으므로, 당해 번호는 역방 어댑터 서열을 함유하는 판독물이 맵핑되는 경우 보다 높을 것으로 예상됨에 주목한다.
단-면 미니 - PCR: 단편 말단에 어댑터를 지닌 표적 DNA를 사용하는 것이 가능하다(참조: 도 7). STA는 전방 프라이머 및 하나(또는 소수의) 태그-특이적인 역방 프라이머를 사용하여 수행할 수 있다. (101)은 X에서 목적한 다형성 유전자자리를 지닌 이본쇄 DNA를 나타낸다. (102)는 공통의 증폭을 위해 첨가된 연결 어댑터를 지닌 이본쇄 DNA를 나타낸다. (103)은 하이브리드화된 전방 프라이머 A를 지닌 일본쇄 DNA를 나타낸다. (104)는 전방 프라이머 A 및 연결 어댑터 태그 역방 프라이머 LT를 사용하여 증폭된 (103)에서 수득한 PCR 생성물을 나타낸다. 당해 방법은 표준 PCR보다 더 짧은 표적 서열을 검출할 수 있다. 그러나, 이는 단지 하나의 표적 특이적인 프라이머가 사용되므로 비교적 비특이적일 수 있다. 당해 프로토콜은 단면 중첩된 미니 PCR의 효과적으로 반이다.
역방 반-내포된 미니- PCR: 단편 말단에서 어댑터를 가진 표적 DNA를 사용하는 것이 가능하다(참조: 도 8). STA는 전방 프라이머 및 하나(또는 소수의) 태그-특이적인 역방 프라이머의 다중 세트를 사용하여 수행할 수 있다. (101)은 X에서 목적한 다형성 유전자자리를 지닌 이본쇄 표준 DNA를 나타낸다. (102)는 공통의 증폭을 위해 가해진 연결 어댑터를 지닌 이본쇄 DNA를 나타낸다. (103)은 하이브리드화된 역 프라이머 B를 지닌 일본쇄 DNA를 나타낸다. (104)는 역 프라이머 B 및 연결 어댑터 태그 전방 프라이머 LT를 사용하여 증폭시킨 (103)에서 수득한 PCR 생성물을 나타낸다. (105)는 하이브리드화된 전방 프라이머 A, 및 내부 역방 프라이머 'b'를 지닌 PCR 생성물 (104)를 나타낸다. (106)은 전방 프라이머 A 및 역방 프라이머 'b'를 사용하는 (105)에서 증폭된 PCR 생성물을 나타내고, 이는 최종 PCR 생성물이다. 당해 방법은 표준 PCR 보다 더 짧은 표적 서열을 검출할 수 있다.
이중 중첩된 PCR과 같은 상기 방법의 단순한 반복 또는 조합인 추가의 변형이 존재할 수 있으며, 여기서 프라이머의 3개 세트가 사용된다. 다른 변형은 1과 1/2면 중첩된 미니-PCR이며, 여기서 STA는 또한 중첩된 전방 프라이머 및 하나(또는 소수의) 태그-특이적인 역방 프라이머의 다중 세트를 사용하여 수행할 수 있다.
이들 변형 모두에서, 전방 프라이머 및 역방 프라이머의 실체는 상호교환될 수 있음에 주목한다. 일부 구현예에서, 중첩된 변이체는 첨부되는 어댑터 태그 및 공통의 증폭 단계를 포함하는 초기 라이브러리 제조없이 동등하게 잘 수행될 수 있다. 일부 구현예에서, 추가 라운드의 PCR이 추가의 전방 및/또는 역방 프라이머 및 증폭 단계와 함께 포함될 수 있으며; 이들 추가의 단계는 표적화된 유전자자리에 상응하는 DNA 분자의 존재를 추가로 증가시키는 것이 바람직한 경우 특히 유용할 수 있음에 주목한다.
중첩된 작업흐름
상이한 정도의 중첩, 및 상이한 정도의 다중화를 사용하여 증폭을 수행하는 많은 방법이 존재한다. 도 9에서, 흐름 차트가 일부 가능한 작업흐름과 함께 제공된다. 10,000-플렉스의 PCR의 사용은 단지 예인 것으로 의미되고; 이들 흐름 차트는 다른 정도의 다중화를 위해 동등하게 잘 작업할 수 있음에 주목한다.
루프 연결 어댑터
예를 들면, 서열분석을 위한 라이브러리를 제공할 목적으로 공통의 태그된 어댑터를 가하는 경우, 어댑터를 연결하기 위한 다수의 방법이 존재한다. 한가지 방법은 시료 DNA를 평활말단화하고, A-테일링을 수행하며 T-오버행(overhang)을 지닌 어댑터와 연결하는 것이다. 어댑터를 연결하는 다수의 다른 방법이 존재한다. 또한 연결될 수 있는 다수의 어댑터가 존재한다. 예를 들면, Y-어댑터를 사용할 수 있으며, 여기서 어댑터는 2개 쇄의 DNA로 이루어지고 여기서 하나의 쇄는 이본쇄 영역, 및 전방 프라이머 영역에 의해 구체화된 영역을 가지며, 여기서 다른 쇄는 제1 쇄에서 이본쇄 영역에 상보성인 이본쇄 영역 및 역 프라이머를 지닌 영역에 의해 구체화되었다. 이본쇄 영역은, 어닐링되는 경우, A 오버행을 지닌 이본쇄 DNA에 대한 연결 목적을 위한 T-오버행을 함유할 수 있다.
일 구현예에서, 어댑터는 DNA의 루프일 수 있으며, 여기서 말단 영역은 상보성이고, 여기서 루프 영역은 전방 프라이머 태그된 영역(LFT), 역방 프라이머 태그된 영역(LRT), 및 2개 사이의 절단 부위를 함유한다(참조: 도 10). (101)은 이본쇄된, 평활말단화된 표적 DNA를 말한다. (102)는 A-테일된 표적 DNA를 말한다. (103)은 T 오버행 'T' 및 절단 부위 'Z'를 지닌 루프된 연결 어댑터를 말한다. (104)는 첨부된 루프된 연결 어댑터를 지닌 표적 DNA를 말한다. (105)는 절단 부위에서 첨부되어 절단된 연결 어댑터를 지닌 표적 DNA를 말한다. LFT는 연결 어댑터 전방 태그를 말하며, LTR은 연결 어댑터 역 태그를 말한다. 상보성 영역은 T 오버행에서 끝날 수 있거나 표적 DNA에 대한 연결을 위해 사용될 수 있는 다른 특징으로 끝날 수 있다. 절단 부위는 UNG에 의한 절단을 위한 일련의 우리실일 수 있거나 제한 효소 또는 다른 절단 방법 또는 바로 염기성 증폭에 의해 인식되고 절단될 수 있는 서열일 수 있다. 이들 어댑터는 라이브러리 제조, 예를 들면, 서열분석을 위해 사용될 수 있다. 이들 어댑터는 본원에 기술된 다른 방법들 중 어느 것, 예를 들면, 미니-PCR 증폭 방법과 함께 사용될 수 있다.
내부적으로 태그된 프라이머
서열분석을 사용하여 소정의 다형성 유전자자리에서 대립유전자를 측정하는 경우, 서열 판독은 전형적으로 프라이머 결합 부위(a)의 상부에서, 및 이후에 다형성 부위(X)에 대해 시작한다. 태그는 전형적으로 11, 좌측에 나타낸 바와 같이 구성된다. (101)은 목적한 다형성 유전자자리 'X', 및 첨부된 태그 'b'를 지닌 프라이머 'a'를 지닌 일본쇄 표적 DNA를 말한다. 비특이적인 하이브리드화를 피하기 위하여, 프라이머 결합 부위('a'에 대해 상보성인 표적 DNA의 영역)는, 길이가 전형적으로 18 내지 30bp이다. 서열 태그 'b'는 전형적으로 약 20bp이고; 많은 사람들이 서열분석 플랫폼 회사에서 시판하는 프라이머 서열을 사용하지만, 이론상으로 이들은 약 15bp보다 더 긴 어떠한 길이일 수 있다. 'a'와 'X' 사이의 거리 'd'는 대립유전자 편향을 피하기 위하여 적어도 2bp일 수 있다. 조심스러운 프라이머 설계가 과도한 프라이머 프라이머 상호작용을 피하는데 필수적인, 본원에 개시된 방법 또는 다른 방법을 사용하여 다중화된 PCR 증폭을 수행하는 경우, 'a'와 'X' 사이의 허용가능한 'd'의 윈도우는 매우 상당히: 2 bp 내지 10 bp, 2 bp 내지 20 bp, 2 bp 내지 30 bp, 또는 심지어 2 bp 내지 30 bp로 변할 수 있다. 따라서, 도 11, 좌측에 나타낸 프라이머 구조를 사용하는 경우, 서열 판독물은 최소 40 bp이어야만 다형성 유전자자리를 측정하기에 충분한 길이의 판독물을 수득하며, 'a' 및 'd'이 길이에 따라 서열 판독물은 60 또는 75 bp 이하일 필요가 있을 수 있다. 일반적으로, 서열 판독물이 길수록, 소정의 수의 판독물을 서열분석하는 비용 및 시간이 커지므로, 필수적인 판독물 길이를 최소하는 것이 시간 및 비용을 절약할 수 있다. 또한, 평균적으로, 판독물 상의 조기 염기 판독물은 판독물에서 후자의 판독물보다 더 정밀하게 판독되므로, 필수적인 서열 판독물 길이를 감소시키는 것이 또한 다형성 영역의 측정의 정밀도를 증가시킬 수 있다.
일 구현예에서, 명명된 내부적으로 표적화된 프라이머, 프라이머 결합 부위(a)는 다수의 분절(a', a", a"'....)로 쪼개지며 서열 태그(b)는 도 11, (103)에 나타낸 바와 같이, 프라이머 결합 부위 중 2개의 중간에 존재하는 DNA의 분절상에 있다. 이러한 구조는, 서열이 보다 짧은 서열 판독물이 되도록 한다. 일 구현예에서, a', + a"는 적어도 약 18 bp이어야하며, 30, 40, 50, 60, 80, 100 또는 100 bp 이상으로 길 수 있다. 일 구현예에서, a"는 적어도 약 6 bp이어야 하고, 일 구현예에서 약 8 내지 16 bp이다. 내부적으로 태그된 프라이머를 사용하여 동등한 모든 다른 인자는 서열 판독물의 길이를 적어도 6 bp, 8 bp, 10 bp, 12 bp, 15 bp 정도로 많이, 및 심지어 20 또는 30 bp 정도로 많이 절단할 수 있다. 이는 유의적인 비용, 시간 및 정밀도 장점을 생성할 수 있다. 내부적으로 태그된 프라이머의 예는 도 12에 제공된다.
연결 어댑터 결합 영역을 지닌 프라이머
단편화된 DNA를 사용한 한가지 쟁점은, 이것이, 길이가 짧으므로, 다형성이 DNA 쇄의 말단에 근접하는 기회가 보다 긴 쇄보다 더 높다는 것이다(즉, (101), 도 10). 다형성의 PCR 포획은 다형성의 양쪽 면에서 적합한 길이의 프라이머 결합 부위를 요구하므로, 유의적인 수의 태그된 다형성을 지닌 DNA 쇄는 프라이머와 표적화된 결합 부위 사이의 불충분한 오버랩으로 인하여 손실될 것이다. 일 구현예에서, 표적 DNA (101)은 (102)에 첨부된 연결 어댑터를 가질 수 있으며, 표적 프라이머(103)은 설계된 결합 영역(a)의 상부로 첨부된 연결 어댑터 태그(lt)에 대해 상보성인 영역(cr)을 가질 수 있으므로(참조: 도 13); 결합 영역(a 에 대해 상보성인 (101)의 영역)이 하이브리드화에 전형적으로 요구된 18bp보다 더 짧은 경우, 라이브러리 태그에 대해 상보성인 프라이머 사의 영역(cr)은, PCR이 진행될 수 있는 지점에서 결합 에너지를 증가시킬 수 있다. 보다 짧은 결합 영역으로 인하여 손실되는 어떠한 특이성도 적합하게 긴 표적 결합 영역을 지닌 다른 PCR 프라이머에 의해 제조될 수 있음에 주목한다. 당해 구현예는 직접적인 PCR, 또는 본원에 기술된 다른 방법 중 어느 것, 예를 들면, 중첩된 PCR, 어느 정도의 중첩된 PCR, 반 중첩된 PCR, 단면 중첩되거나 어느 정도 또는 반 중첩된 PCR, 또는 다른 PCR 프로토콜 중 어느 것과 함께 사용될 수 있다.
서열분석 데이터를 사용하여 관찰된 대립유전자 데이터를 다양한 가설을 위해 예측된 대립유전자 분포와 비교함을 포함하는 분석 방법과 함께 배수성을 측정하는 경우, 낮은 깊이의 판독물을 지닌 대립유전자의 각 추가 판독물은 큰 깊이의 판독물을 지닌 대립유전자의 판독물보다 더 추가의 정보를 수득할 것이다. 따라서, 이상적으로, 각각의 유전자자리가 유사한 수의 대표적인 서열 판독물을 가질 균일한 깊이의 판독물(DOR)을 찾는 것을 원할 수 있다. 따라서, DOR 변이를 최소화하는 것이 바람직하다. 일 구현예에서, 어닐링 시간을 증가시킴으로써 DOR의 변이 계수(이는 DOR의 표준 편차/DOR의 평균으로 정의될 수 있다)를 감소시키는 것이 가능하다. 일부 구현예에서, 어닐링 온도는 2분 이상, 4분 이상, 10분 이상, 30분 이상, 및 1시간 이상, 또는 심지어 그 이상일 수 있다. 어닐링은 평형 공정이므로, 증가되는 어닐링 시간으로 DOR 변이의 개선에 대한 제한은 없다. 일 구현예에서, 프라이머 농도를 증가시키는 것은 DOR 변수를 증가시킬 수 있다.
예시적인 전체 게놈 증폭 방법
일부 구현예에서, 본원의 방법은 표적 유전자자리를 바로 증폭시키기 전에 핵산 시료를 증폭시키기 위한 전체 게놈 적용의 사용과 같이, DNA를 증폭시키는 것을 포함할 수 있다. 소량의 유전 물질을 유사한 유전 데이터의 세트를 포함하는 다량의 유전 물질로 전환시키는 공정인, DNA의 증폭은 폴리머라제 연쇄 반응(PCR)을 포함하나, 이에 한정되지 않는 광범위한 방법으로 수행할 수 있다. DNA를 증폭시키는 한가지 방법은 전체 게놈 증폭(WGA)이다. WGA에 대해 이용가능한 다수의 방법: 연결-매개된 PCR(LM-PCR), 변성 올리고뉴클레오타이드 프라이머 PCR (DOP-PCR), 및 다중 대체 증폭(MDA)이 존재한다. LM-PCR에서, 어댑터로 불리는 짧은 DNA 서열는 DNA의 평활 말단에 연결된다. 이들 어댑터는 PCR에 의해 DNA를 증폭시키는데 사용된 공통의 증폭 서열을 함유한다. DOP-PCR에서, 공통의 증폭 서열을 또한 함유하는 무작위 프라이머를 제1의 라운드의 어닐링 및 PCR에서 사용한다. 이후에, 제2의 라운드의 PCR을 사용하여 공통의 프라이머 서열을 추가로 지닌 서열을 증폭시킨다. MDA는 phi-29 폴리머라제를 사용하며, 이는 DNA를 복제하는 고도로 진행성이고 비-특이적인 효소이며 단일-세포 분석에 사용된다. 단일 세포의 물질의 증폭에 대한 주요 제한은 (1) 극도로 희석된 DNA 농도 또는 극도로 작은 용적의 반응 혼합물이 필요하다는 것과 (2) 전체 게놈에 따른 단백질의 DNA의 신뢰가능한 해리가 어렵다는 것이다. 그럼에도 불구하고, 단일-세포 전체 게놈 증폭는 수년 동안 다양한 적용에 성공적으로 사용되어 왔다. DNA 시료의 DNA를 증폭시키는 다른 방법이 존재한다. DNA 증폭은 DNA의 내부 시료를 서열 세트에서 유사하지만 훨씬 더 많은 양의 DNA의 시료로 전환시킨다. 일부 경우에, 증폭은 요구되지 않을 수 있다.
일부 구현예에서, DNA는 WGA 또는 MDA와 같은 공통의 증폭을 사용하여 증폭시킬 수 있다. 일부 구현예에서, DNA는 표적화된 증폭, 예를 들면, 표적화된 PCR, 또는 순환되는 프로브에 의해 증폭될 수 있다. 일부 구현예에서, DNA는 표적화된 증폭 방법, 또는 하이브리드화 접근법에 의한 포획과 같은, 원치않는 DNA에서의 바람직한 완전하거나 부분적인 분리를 생성하는 방법을 사용하여 우선적으로 농축시킬 수 있다. 일부 구현예에서, DNA는 공통의 증폭 방법 및 우선적인 농축 방법의 조합을 사용하여 증폭시킬 수 있다. 이들 방법들 중 일부의 완전한 설명은 본 서류의 어딘가에서 찾을 수 있다.
예시적인 농축 및 서열분석 방법
일 구현예에서, 본원에 개시된 방법은 표적 유전자자리(예: 다형성 유전자자리)들의 세트의 각 표적 유전자자리(예: 각각의 다형성 유전자자리)의 DNA의 원래 시료에 존재하는 상대적인 대립유전자 빈도를 보존하는 선택적 농축 기술을 사용한다. 농축이 다형성 유전자자리를 분석하기 위한 방법에 특히 유리하지만, 이러한 농축 방법은 경우에 따라 비다형성 유전자자리에 용이하게 채택될 수 있다. 일부 구현예에서 증폭 및/또는 선택적인 농축 기술은 연결 매개된 PCR, 하이브리드화에 의한 단편 포획, 분자 역전 프로브, 또는 다른 원형 프로브와 같은 PCR을 포함할 수 있다. 일부 구현예에서, 증폭 또는 선택적인 농축을 위한 방법은 프로브를 사용함을 포함할 수 있으며, 여기서 표적 서열에 대한 정확한 하이브리드화시, 뉴클레오타이드 프로브의 3-프라임 또는 5-프라임 말단은 소수의 뉴클레오타이드에 의해 대립유전자의 다형성 부위에서 분리된다. 이러한 분리는 대립유전자 편향으로 명명되는, 하나의 대립유전자의 우선적인 증폭을 감소시킨다. 이는, 정확하게 하이브리드화된 프로브의 3-프라임 말단 또는 5-프라임 말단이 대립유전자의 다형성 부위에 인접하거나 매우 가까운 프로브를 사용함을 포함하는 방법에 비하여 개선되어 있다. 일 구현예에서, 하이브리드화 영역이 다형성 부위를 함유할 수 있거나 정확하게 함유하는 프로브는 배제된다. 하이브리드화 부위에서 다형성 부위는 동등하지 않은 하이브리드화를 유발하거나 일부 대립유전자에서 함께 하이브리드화를 억제함으로써 특정의 대립유전자의 우선적인 증폭을 생성한다. 이들 구현예는, 시료가 하나의 개체 또는 개체의 혼합물에서 채취한 순수한 게놈 시료인 것에 상관없이, 이들이 각각의 다형성 유전자자리에서 시료의 원래의 대립유전자 빈도를 보다 잘 보존한다는 점에서 표적화된 증폭 및/또는 선택적인 농축을 포함하는 다른 방법보다 개선되어 있다.
비-침입성 태아 대립유전자 요청 또는 배수성 요청을 위한 방법의 일부로서 DNA의 시료를 표적 유전자자리의 세트에서 농축시키는 기술에 이은 서열분석의 사용은 다수의 기대하지 않은 장점을 부여할 수 있다. 본원의 일부 구현예에서, 당해 방법은 PARENTAL SUPPORTTM(PS)와 같은, 정보학 기반한 방법과 함께 사용하기 위해 유전 데이터를 측정하는 단계를 포함한다. 당해 구현예 중의 일부의 궁극적인 결과는 배아 또는 태아의 소송을 초래할 수 있는 유전 데이터가다. 구현된 방법의 일부로서 개체 및/또는 관련된 개체의 유전 데이터를 측정하는데 사용된 많은 방법이 존재한다. 일 구현예에서, 표적화된 대립유전자의 세트의 농도를 농축시키는 방법이 본원에 기재되어 있으며, 당해 방법은 다음 단계들 중 하나 이상을 포함한다: 유전 물질의 표적화된 증폭, 유전자자리 특이적인 올리고뉴클레오타이드 프로브의 첨가, 구체적인 DNA 쇄의 연결, 목적한 DNA 세트의 분리, 반응의 원치않는 성분의 제거, 하이브리드화에 의한 DNA의 특정 서열의 검출, 및 DNA 서열분석 방법에 의한 DNA의 하나 또는 다수의 쇄의 서열의 검출. 일부 경우에, DNA 쇄는 표적 유전 물질을 말할 수 있으며, 일부 경우에 이들은 프라이머를 말할 수 있고, 일부 경우에, 이들은 합성된 서열, 또는 이의 조합을 말할 수 있다. 이들 단계는 다수의 상이한 순서로 수행할 수 있다.
예를 들면, 표적화된 증폭 전에 DNA의 공통의 증폭 단계는 병목현상의 위험을 제거하고 대립유전자 편향성을 감소시키는 것과 같은 수개의 장점을 부여할 수 있다. DNA는 한면에서 하나씩, 2개의 이웃하는 표적 서열의 영역과 하이브리드화할 수 있는 혼합된 올리고뉴클레오타이드 프로브일 수 있다. 하이브리드화 후, 프로브의 말단은 연결 수단인 폴리머라제, 및 어떠한 필수적인 시약을 가하여 연결시킴으로써 프로브의 순환을 허용할 수 있다. 순환 후, 엑소뉴클레아제를 가하여 비-순환된 유전물질로 분해한 후, 순환된 프로브를 검출할 수 있다. DNA는 한면에 하나씩, 표적 서열의 2개의 이웃하는 영역과 하이브리드화할 수 있는 PCR 프라이머와 혼합될 수 있다. 하이브리드화 후, 프로브의 말단은 연결 수단인, 폴리머라제, 및 PCR 증폭을 완료시키기 위한 어떠한 필수적인 시약을 가하여 연결시킬 수 있다. 증폭되거나 증폭되지 않은 DNA는 유전자자리의 세트를 표적화하는 하이브리드 포획 프로브에 의해 표적화될 수 있으며; 하이브리드화 후, 프로브는 국재화되어 혼합물에서 분리됨으로써 표적 서열 속에 농축된 DNA의 혼합물을 제공할 수 있다.
특정의 유전자자리를 표적화하는 방법에 이어 대립유전자 요청 또는 배수성 요청을 위한 방법의 일부로서 서열분석의 사용은 다수의 예측하지 못한 장점을 부여할 수 있다. DNA가 표적화되거나, 우선적으로 농축될 수 있는 일부 방법은 순환 프로브, 연결된 역전 프로브(LIP, MIP)의 사용, SURESELECT와 같은 하이브리드화 방법에 의한 포획, 및 표적화된 PCR 또는 연결-매개된 PCR 증폭 전략을 사용함을 포함한다.
일부 구현예에서, 본원의 방법은 본원에 추가로 기술된, PARENTAL SUPPORTTM(PS)과 같은, 정보학계 방법과 함께 사용하기 위해 유전 데이터를 측정하는 단계를 포함한다. PARENTAL SUPPORTTM은 본원에 개시된 측면인, 유전 데이터를 조작하기 위한 정보학계 접근법이다. 일부 양태의 궁극적인 결과는 배아 또는 태아의 소송을 초래할 수 있는 유전 데이터에 이은 소송을 초래할 수 있는 데이터를 기반으로 한 임상 결정이다. PS 방법 이면의 알고리즘은 표적 개체, 흔히 배아 또는 태아의 측정된 유전 데이터, 및 관련 개체에서 측정된 유전 데이터를 취하며, 표적 개체의 유전 상태가 알려져 있는 정밀도를 증가시킬 수 있다. 일 구현예에서, 측정된 유전 데이터는 태아 유전 진단 동안에 배수성 측정을 이룬다는 측면에서 사용된다. 일 구현예에서, 측정된 유전 데이터는 시험관 수정 동안 배아에서 배수성 측정 또는 대립유전자 요청을 이룬다는 측면에서 사용된다. 상술한 내용에서 개체 및/또는 관련 개체의 유전 데이터를 측정하는데 사용될 수 있는 많은 방법이 존재한다. 상이한 방법은 다수의 단계를 포함하며, 이들 단계는 흔히 유전 물질의 증폭, 올리고뉴클레오타이드 프로브의 첨가, 상세한 DNA 쇄의 연결, 목적한 DNA 세트의 분리, 반응의 원치않는 성분의 제거, 하이브리드화에 의한 DNA의 특정 서열의 검출, DNA 서열분석 방법에 의한 DNA의 하나 또는 다수의 쇄의 서열의 검출을 포함한다. 일부 경우에, DNA 쇄는 표적 유전 물질을 말할 수 있으며, 일부 경우에 이들은 프라이머를 말할 수 있고, 일부 경우에 이들은 합성된 서열, 또는 이의 조합을 말할 수 있다. 이들 단계는 다수의 상이한 순서로 수행될 수 있다.
이론적으로, 하나의 유전자자리 내지 백만 개의 유전자자리 어디에서도, 게놈에서 어떠한 수의 유전자자리를 표적화하는 것이 가능하다는 것에 주목한다. DNA의 시료를 표적화에 적용시킨 후, 서열분석하는 경우, 서열분석기에 의해 판독되는 대립유전자의 퍼센트는 시료 속의 이들의 천연의 풍부성과 관련하여 농축될 것이다. 농축 정도는 1 퍼센트(또는 심지어 미만) 내지 10-배, 100-배, 1000-배, 또는 심지어 수백만-배까지의 어느 것일 수 있다 사람 게놈에는 대략 30억개의 염기쌍, 및 대략 7500만 개의 다형성 유전자자리를 포함하는, 뉴클레오타이드가 존재한다. 표적화된 유전자자리의 수가 많아질 수록, 가능한 농축의 정도는 더 적어진다. 표적화되는 유전자자리의 수가 적어질 수록, 가능한 농축 정도는 더 커지며, 보다 큰 깊이의 판독물은 소정의 수의 서열 판독물에 대한 이들의 유전자자리에서 달성될 수 있다.
본원의 일 구현예에서, 표적화 또는 우선권(preferential)은 전적으로 SNP에 촛점을 맞출 수 있다. 일 구현예에서, 표적화 또는 우선권은 어떠한 다형성 부위에도 촛점을 맞출 수 있다. 다수의 시판되는 표적화 생성물이 엑손을 농축시키는 데 이용가능하다. 놀랍게도, 전적으로 SNP, 또는 전적으로 다형성 유전자자리를 표적화하는 것은, 대립유전자 분포에 의존하는 NPD에 대한 방법을 사용하는 경우 특히 유리하다. 판독물 계수가, 소정의 염색체에 맵핑하는 판독물의 수를 계수하는 것에 촛점을 맞추고, 분석된 서열 판독물이 다형성인 게놈의 영역에 촛점을 맞추지 않는 경우의 판독물 계수 분석을 포함하는, 서열분석을 사용하는 NPD를 위한 공개된 방법, 예를 들면, 미국 특허 제7,888,017호가 존재한다. 다형성 대립유전자에 촛점을 맞추지 않는 방법의 이들 유형은 대립유전자들의 세트의 우선적 농축 또는 표적화의 유형만큼 많이 유리하지 않을 수 있다.
본원의 구현예에서, SNP에 촛점을 맞추어 게놈의 다형성 영역내 유전자 시료를 농축시키는 표적화 방법을 사용하는 것이 가능하다. 일 구현예에서, 소수의 SNP, 예를 들면, 1 내지 100개의 SNP, 또는 보다 많은 수, 예를 들면, 100 내지 1,000개, 1,000 내지 10,000개, 10,000 내지 100,000개 또는 100,000개 이상의 SNP에 촛점을 맞추는 것이 가능하다. 일 구현예에서, 살아있는 삼염색체 출생과 상호관련된 하나 또는 소수의 염색체, 예를 들면, 염색체 13, 18, 21, X 및 Y, 또는 이의 조합에 촛점을 맞추는 것이 가능하다. 일 구현예에서, 표적화된 SNP를 작은 인자, 예를 들면, 1.01배 내지 100배, 또는 보다 큰 인자, 예를 들면, 100배 내지 1,000,000배, 또는 심지어 1,000,000배 이상 농축시키는 것이 가능하다. 본 발명의 일 구현예에서, 게놈의 다형성 영역내에 우선적으로 농축된 DNA의 시료를 생성하는 표적화 방법을 사용하는 것이 가능하다. 일 구현예에서, DNA의 혼합물이 모계 DNA 및 또한 유리 부유하는 태아 DNA를 함유하는 이들 특성 중의 어느 것을 사용하여 DNA의 혼합물을 생성시키는 당해 방법을 사용하는 것이 가능하다. 일 구현예에서, 이들 인자의 어떠한 조합을 갖는 DNA의 혼합물을 생성시키는 당해 방법을 사용하는 것이 가능하다. 예를 들면, 본원에 기술된 방법을 사용하여 모계 DNA 및 태아 DNA를 포함하고, 모두 염색체 18 또는 21번 상에 위치하며, 평균 1000배 농축된, 200개의 SNP에 상응하는 DNA 속에 우선적으로 농축된 DNA의 혼합물을 생산할 수 있다. 다른 예에서, 염색체 13, 18, 21, X 및 Y 상에 모두 또는 대부분 위치하고, 유전자자리 당 평균 농축이 500배 이상인 10,000개의 SNP 속에 우선적으로 농축된 DNA의 혼합물을 생성시키는 방법을 사용하는 것이 가능하다. 본원에 기술된 표적화 방법 중 어느 것도 사용하여 특정 유전자자리에 우선적으로 농축된 DNA의 혼합물을 생성할 수 있다.
일부 구현예에서, 본원의 방법은 고 배출 DNA 서열분석기를 사용하여 혼합된 분획 속에서 DNA를 측정하는 단계를 포함하며, 여기서 혼합된 분획 속의 DNA는 하나 이상의 염색체에서 측정한 불균형한 수의 서열을 함유하며, 여기서, 하나 이상의 염색체는 염색체 13, 염색체 18, 염색체 21, 염색체 X, 염색체 Y 및 이의 조합을 포함하는 그룹에서 취한다.
본원에는 3개의 방법이 기술되어 있다: 다중 PCR, 하이브리드화에 의한 표적화된 포획, 및 연결된 역전된 프로브(LIP), 여기서 당해 방법을 사용하여 모계 혈장 시료의 충분한 수의 다형성 유전자자리의 측정을 수득하고 분석함으로써 태아 이수성을 검출할 수 있으며; 이는 표적화된 유전자자리의 선택적인 농축이 다른 방법을 배제함을 의미하지 않는다. 다른 방법을 방법의 주요내용을 변경하지 않고 동등하게 잘 사용할 수 있다. 각각의 경우에 검정된 다형성은 단일 뉴클레오타이드 다형성(SNP), 작은 삽입-결실(small indel), 또는 STR을 포함할 수 있다. 바람직한 방법은 SNP의 사용을 포함한다. 각각의 접근법은 대립유전자 빈도 데이터를 생산하며; 각각의 표적화된 유전자자리에 대한 대립유전자 빈도 데이터 및/또는 이들 유전자자리의 결합 대립유전자 빈도 분포를 분석하여 태아의 배수성을 측정할 수 있다. 각각의 접근법은 제한된 공급원 물질 및 모계 혈장이 모계 및 태아 DNA의 혼합물로 이루어진다는 사실로 인하여 이의 자체 고려사항을 갖는다. 당해 방법은 다른 접근법와 결합되어 보다 정밀한 측정을 제공할 수 있다. 일 구현예에서, 당해 방법은 미국 특허 제7,888,017호에 기술된 바와 같은 서열 계수 접근법와 함께 결합될 수 있다. 기술된 접근법을 또한 사용하여 모계 혈장 시료로부터 비침습적으로 태아의 부계를 검출할 수 있다. 또한, 각 접근법을 DNA의 다른 혼합물 또는 순수한 DNA 시료에 적용시켜 이수성 염색체의 존재 또는 부재를 검출하거나, 변성된 DNA 시료로 다수의 SNP의 유전자형을 분석하거나, 분절 카피 수 변이(CNV)를 검출하거나, 목적한 다른 유전형 상태, 또는 이의 일부 조합을 검출할 수 있다.
시료에서 대립유전자 분포의 정밀한 측정
현재의 서열분석 접근법을 사용하여 시료 속에서 대립유전자의 분포를 평가할 수 있다. 한가지 이러한 방법은 셧건 서열분석(shotgun sequencing)으로 명명된, 혼주물 DNA의 서열을 무작위로 시료채취하는 것을 포함한다. 서열분석 데이터에서 특정한 대립유전자의 비는 전형적으로 매우 낮으며 단순한 통계학으로 측정할 수 있다. 사람 게놈은 대략 3천만 개의 염기쌍을 함유한다. 따라서, 사용된 서열분석 방볍이 100bp의 판독물을 제조한 경우, 특정한 대립유전자는 매 3천만 개의 서열 판독물에서 약 1회 측정될 것이다.
일 구현예에서, 본원의 방법은 당해 염색체의 유전자자리의 측정된 대립유전자 분포로부터 DNA의 시료에 동일한 유전자자리들의 세트를 함유하는 2개 이상의 상이한 일배체형의 존재 또는 부재를 판정하는 데 사용된다. 상이한 일배체형은 하나의 개체의 2개의 상이한 동종 염색체, 삼염색체성 개체의 3개의 상이한 동종 염색체, 모계 및 태아의 3개의 상이한 동종 일배체형(여기서 일배체형 중 하나는 모친과 태아 사이에서 공유된다), 모계 및 태아의 3 또는 4개의 일배체형(여기서 일배체형의 1개 또는 2개는 모와 태아 사이에 공유된다), 또는 다른 조합을 나타낼 수 있다. 일배체형 사이에서 다형성인 대립유전자 보다 정보성인 경향이 있지만, 모친 및 태자녀 둘다 동일한 대립유전자에 대해 동종접합성인 어떠한 대립유전자도 단순한 판독물 계수 분석으로부터 이용가능한 정보를 초과하는 측정된 대립유전자 분포를 통해 유용한 정보를 수득할 것이다.
그러나, 이러한 시료의 셧건 서열분석은 시료에 있어서 상이한 일배체형 사이에 다형성이 아니거나 목적하지 않은 염색체를 위한 영역에 대해 많은 서열을 초래하므로, 매우 비효율적이며, 따라서 표적 일배체형의 비율에 대한 정보를 나타내지 않는다. 본원에 기술된 것은 게놈 속에서 다형성인 경향이 큰 시료 속에서 DNA의 분절을 우선적으로 농축시키고/시키거나 특이적으로 표적화하여 서열분석에 의해 수득된 대립유전자 정보의 수율을 증가시키는 방법이다. 농축된 시료 속에서 측정된 대립유전자 분포는 표적 개체에 존재하는 실제 양을 실제로 나타내므로, 표적화된 분절내 소정의 유전자자리에서 다른 대립유전자과 비교하여 하나의 대립유전자의 우선적인 농축이 거의 없거나 없는 것이 중요함에 주목한다. 다형성 대립유전자를 표적하하기 위해 당해 분야에 공지된 현재의 방법은, 존재하는 특정 대립유전자 중 적어도 일부가 검출되도록 보증하도록 설계되는 것이다. 그러나, 이들 방법은 원래의 혼합물 속에 존재하는 다형성 대립유전자의 편견이 없는 대립유전자 분포를 측정할 목적으로 설계되지 않았다. 표적 농축의 어떠한 특수 방법도 농축된 시료를 생산할 수 있을지는 명백하지 않으며, 여기서 측정된 대립유전자 분포는 다른 어떠한 방법보다 원래의 증폭되지 않는 시료에 존재하는 대립유전자 분포를 정확하게 나타낼 수 있다. 많은 농축 방법이 예측될 수 있지만, 이론적으로, 이러한 목적을 달성하기 위해서, 당해 분야의 통상의 기술자는, 현재의 증폭, 표적화 및 다른 우선적인 농축 방법에서 다량의 확률론적 또는 결정론적 편향이 존재함을 인식하고 있다. 본원에 기술된 방법 중의 일 구현예는 게놈 내에서 소정의 유전자자리에 상응하는 DNA의 혼합물 속에서 발견된 많은 대립유전자가 대립유전자 각각의 농축 정도가 거의 동일한 방식으로 증폭되거나, 우선적으로 농축되도록 한다. 이를 말하는 다른 방식은, 당해 방법이 혼합물 속에 존재하는 대립유전자의 상대적인 양이 전적으로 증가되도록 하면서, 각각의 유전자자리에 상응하는 대립유전자 사이이 비가, 이들이 DNA의 원래의 혼합물 속에 존재하는 바와 필수적으로 동일하게 잔존하도록 하는 것이다. 일부 보고된 방법의 경우, 유전자자리의 우선적인 농축은 1% 이상, 2% 이상, 5% 이상 및 심지어 10% 이상의 대립유전자 편향을 생성할 수 있다. 이러한 우선적인 농축은 하이브리드화 접근법에 의한 포획을 사용하는 경우 포획 편형 또는 각각의 사이클에 대해 작을 수 있지만, 20, 30 또는 40 주기에 걸쳐 화합되는 경우 크게 될 수 있는 증폭 편향에 기인할 수 있다. 본원의 목적을 위해, 필수적으로 이를 잔류시키기 위한 비는, 수득되는 혼합물 속의 대립유전자의 비로 나눈 원래의 혼합물 속의 대립유전자의 비가 0.95 내지 1.05, 0.98 내지 1.02, 0.99 내지 1.01, 0.995 내지 1.005, 0.998 내지 1.002, 0.999 내지 1.001, 또는 0.9999 내지 1.0001임을 의미한다. 본원에 나타낸 대립유전자 비의 계산은 표적 개체의 배수성 상태의 측정시 사용될 수 없으며, 대립유전자 편향을 측정하는데 사용되는 유일한 계량일 수 있다.
일 구현예에서, 일단 혼합물이 표적 유전자자리의 세트에서 우선적으로 농축되면, 이는 클론성 시료(단일 분자로부터 생성된 시료; 예는 ILLUMINA GAIIx, ILLUMINA HiSeq, Life Technologies SOLiD, 5500XL를 포함한다)를 서열분석하는 앞서의, 현재의, 또는 다음 세대 서열분석 장치 중의 어느 하나를 사용하여 서열분석할 수 있다. 당해 비는 표적화된 영역내에서 특정한 대립유전자를 통해 서열분석함으로써 평가할 수 있다. 이들 서열분석 판독물은 서열분석하여 대립유전자 유형 및 상응하게 측정된 상이한 대립유전자의 비에 따라 계수할 수 있다. 길이에 있어서 1 내지 약간의 염기인 변화의 경우, 대립유전자의 검출은 서열분석에 의해 수행될 것이며 서열분석 판독물이 문제의 대립유전자에 걸쳐서 포획된 분자의 대립유전자 조성을 평가하는 것이 필수적이다. 유전형에 대해 분석된 포획된 분자의 총 수는 서열분석 판독물의 길이를 증가시킴으로써 증가시킬 수 있다. 모든 분자의 완전한 서열분석은 농축된 혼주물에서 이용가능한 최대 양의 데이터의 수집을 보증할 수 있다. 그러나, 서열분석은 현재 비용이 많이 들고, 보다 적은 수의 서열 판독물을 사용하여 대립유전자 분포를 측정할 수 있는 방법이 보다 가치가 있을 것이다. 또한, 판독물의 최대 가능한 길이에 대한 기술적 제한 및 판독물 길이가 증가하면서 정밀성 제한이 존재한다. 최대 유용성의 대립유전자는, 길이가 1 내지 수개의 염기일 것이지만, 이론적으로 서열분석 판독물의 길이보다 더 짧은 어떠한 대립유전자도 사용할 수 있다. 대립유전자 변화가 모든 유형에서 오지만, 본원에 제공된 실시예는 바로 약간의 이웃하는 염기쌍이 함유된 변이체 또는 SNP에 촛점을 맞춘다. 분절 카피 수 변이체와 같은 보다 큰 변이체는, 분절에 대해 내부인 SNP의 전체 수집이 중복화되므로 많은 경우에 보다 작은 변이의 응집으로 검출할 수 있다. STR과 같은 약간의 염기보다 큰 변이체는 특정한 고려를 필요로 하며 일부 표적화 접근법은 작동하지만 다른 것은 그렇지 않을 것이다.
게놈내에서 하나 또는 다수의 변이체 위치를 구체적으로 분리하여 농축시키는데 사용될 수 있는 다수의 표적화 접근법이 존재한다. 전형적으로, 이는 변이체 서열을 플랭킹하는 불변 서열의 장점을 취하는 것에 의존한다. 기질이 모계 혈장인 경우 서열분석의 내용에서 표적화와 관련된 다른 이에 의한 보고가 존재한다(참조: 예를 들면, Liao 등, Clin. Chem. 2011; 57(1): pp. 92-101). 그러나, 이들 접근법은 엑손을 표적화하는 표적화 프로브를 사용하여, 게놈의 다형성 영역을 표적화하는데 촛점을 맞추지 않는다. 일 구현예에서, 본원의 방법은 다형성 영역에서 전적으로 또는 거의 전적으로 촛점을 맞추는 표적화 프로브를 사용하는 것을 포함한다. 일 구현예에서, 본 기재내용이 방법은 SNP에 전적으로 또는 거의 전적으로 촉점을 맞추는 표적화 프로브를 사용하는 것을 포함한다. 본원의 일부 구현예에서, 표적화된 다형성 부위는 적어도 10%의 SNP, 적어도 20%의 SNP, 적어도 30%의 SNP, 적어도 40%의 SNP, 적어도 50%의 SNP, 적어도 60%의 SNP, 적어도 70%의 SNP, 적어도 80%의 SNP, 적어도 90%의 SNP, 적어도 95%의 SNP, 적어도 98%의 SNP, 적어도 99%의 SNP, 적어도 99.9%의 SNP, 또는 전적으로 SNP로 이루어진다.
일 구현예에서, 본원의 방법을 사용하여 DNA 분자의 혼합물의 유전형(특정 유전자자리에서 DNA의 염기 조성) 및 이들 유전형의 상대적인 비율을 측정할 수 있으며, 여기서 이들 DNA 분자는 하나 또는 다수의 유전적으로 명백한 개체에서 기원할 수 있다. 일 구현예에서, 본원의 방법은 다형성 유전자자리의 세트에서 유전형, 및 이들 유전자자리에 존재하는 상이항 대립유전자의 양의 상대적인 비를 측정할 수 있다. 일 구현예에서, 다형성 유전자자리는 전적으로 SNP로 이루어질 수 있다. 일 구현예에서, 다형성 유전자자리는 SNP, 단일의 탄뎀 반복체(tandem repeat), 및 다른 다형성을 포함할 수 있다. 일 구현예에서, 본원의 방법을 사용하여 DNA의 혼합물 속의 다형성 유전자자리의 세트에서 대립유전자의 상대적인 분포를 측정할 수 있으며, 여기서 DNA의 혼합물은 모에서 기원한 DNA 및 태아에서 기원한 DNA를 포함한다. 일 구현예에서, 결합 대립유전자 분포는 임신한 여성의 혈액에서 분리된 DNA의 혼합물에서 측정할 수 있다. 일 구현예에서, 유전자자리의 세트에서 대립유전자 분포를 사용하여 잉태된 태아에서 하나 이상의 염색체의 배수성 상태를 측정할 수 있다.
일 구현예에서, DNA 분자의 혼합물은 하나의 개체의 다수 세포에서 추출된 DNA에서 유래될 수 있다. 일 구현예에서, DNA가 기원하는 세포의 원래의 수집은, 개체가 모자익(mosaic)(배선 또는 체세포)인 경우, 동일하거나 상이한 유전형의 배수체 또는 일배체 세포의 혼합물을 포함할 수 있다. 일 구현예에서, DNA 분자의 혼합물은 또한 단일 세포로부터 추출된 DNA에서 기원할 수 있다. 일 구현예에서, DNA 분자의 혼합물은 또한 동일한 개체 또는 상이한 개체의 2개 이상의 세포의 혼합물로부터 추출된 DNA에서 기원할 수 있다. 일 구현예에서, DNA 분자의 혼합물은, 유리 DNA를 함유하는 것으로 알려진, 혈액 혈장과 같은 세포로부터 이미 유리된 생물학적 물질로부터 분리된 DNA에서 기원할 수 있다. 일 구현예에서, 당해 생물학적 물질은, 태아 DNA가 혼합물 속에 존재하는 것으로 밝혀진 임신 동안의 경우에서와 같이, 한 명 이상의 개체의 DNA의 혼합물일 수 있다. 일 구현예에서, 생물학적 물질은 모계 혈액에서 발견된 세포의 혼합물에서 기원할 수 있었으며, 여기서 세포들 중 일부는 태아 기원이다. 일 구현예에서, 생물학적 물질은 태아 세포 속에 농축된 임산부의 혈액의 세포일 수 있었다.
순환하는 프로브
본원의 일부 구현예는 문헌에 이미 기술된 "연결된 도립 프로브"(LIP)를 사용하여 본 발명의 다중 PCR 방법에서 LIP가 아닌 프라이머를 사용한 증폭 전 또는 후 표적 유전자자리를 증폭시킴을 포함한다. LIP는 DNA의 원형 분자의 생성을 포함하는 기술을 포함함을 의미하는 일반적인 용어이며, 여기서 프로브는 표적화된 대립유전자의 한면에서 DNA의 표적화된 영역에 하이브리드화하도록 설계됨으로써, 적절한 폴리머라제 및/또는 리가제의 첨가, 및 적절한 조건, 완충제 및 다른 시약이 표적화된 대립유전자를 따라 DNA의 상보성인, 역전된 영역을 완성하여 표적화된 대립유전자에서 발견된 정보를 포획하는 DNA의 원형 루프를 생성하도록 한다. LIP는 또한 예비-순환된 프로브, 예비-순환화 프로브, 또는 순환화 프로브로 불릴 수 있다. LIP 프로브는 50 내지 500개의 뉴클레오타이드 길이의 선형 DNA 분자일 수 있으며, 일 구현예에서 70 내지 100개의 뉴클레오타이드 길이일 수 있고; 일부 구현예에서 이는 본원에 기술된 것보다 더 길거나 짧을 수 있다. 본원의 다른 구현예는 패드록(Padlock) 프로브 및 분자 역전 프로브(MIP)와 같은 LIP 기술의 상이한 생애(incarnation)를 포함한다.
서열분석을 위한 특이적인 위치를 표적화하는 한가지 방법은 프로브를 합성하는 것이며, 여기서 프로브의 3' 및 5' 말단은 표적화된 영역의 측면에 인접한 및 측면 위치에서 표적 DNA에 어닐링함으로써, DNA 폴리머라제 및 DNA 리가제의 첨가가 3' 말단의 연장, 표적 분자에 대해 상보성인 일본쇄 프로브에 대한 염기의 첨가(갭-충전: gap-fill)에 이어, 배경 DNA에서 후속적으로 분리될 수 있는 원형 DNA 분자를 생성하는 원래의 프로브의 3' 말단 내지 5' 말단의 연결을 초래한다. 프로브 말단은 목적한 표적화된 영역에 플랭킹되도록 설계된다. 당해 접근법의 하나의 측면은 일반적으로 명명된 MIP이며 배열 기술과 함께 사용되어 충전된 서열의 특정을 측정한다. 대립유전자 비를 측정하는 환경에서 MIP의 사용의 한가지 결점은, 하이브리드화, 순환 및 증폭 단계가 동일한 유전자자리에서 상이한 대립유전자에 대해 동등한 비율로 일어나지 않는다는 것이다. 이는 원래의 혼합물 속에 존재하는 실제 대립유전자 비를 나타내지 않는 측정된 대립유전자 비를 생성한다.
일 구현예에서, 순환하는 프로브는, 표적화된 다형성 유전자자리의 상부로 하이브리드화되도록 설계된 프로브의 영역 및 표적화된 다형성 유전자자리의 하부로 하이브리드화되도록 설계된 프로브의 영역이 비-핵산 골격을 통해 공유결합으로 연결되도록 작제된다. 당해 골격은 어떠한 생적합성 분자 또는 생적합성 분자의 조합일 수 있다. 가능한 생적합성 분자의 일부 예는 폴리(에틸렌 글리콜), 폴리카보네이트, 폴리우레탄, 폴리에틸렌, 폴리프로필렌, 설폰 중합체, 실리콘, 셀룰로오즈, 플루오로중합체, 아크릴 화합물, 스티렌 블록 공중합체, 및 다른 블록 공중합체이다.
본원의 일 구현예에서, 당해 접근법을 변형시켜 서열내 충전물을 질의하는 수단으로서 서열분석에 용이하게 처리되도록 변형시켜 왔다. 원래의 시료의 원래의 대립유전자 비를 보유하기 위하여 적어도 하나의 중요한 고려사항을 고려하여야만 한다. 갭-충전 영역내 상이한 대립유전자 중에서 다양한 위치는 차등적인 변이체를 생성하는 DNA 폴리머라제에 의한 개시 편향일 수 있으므로 프로브 결합 부위에 너무 근접하지 않아야만 한다. 다른 고려사항은, 추가 변이가 상이한 대립유전자의 동등하지 않은 증폭을 생성할 수 있는 갭-충전 영역내 변이체와 관련된 프로브 결합 부위에 존재할 수 있다는 것이다. 본원의 일 구현예에서, 예비-순환된 프로브의 3' 말단 및 5' 말단은 표적화된 대립유전자의 변이체 위치(다형성 위치)로부터 떨어진 하나 또는 소수의 위치에 있는 염기에 하이브리드화하도록 설계된다. 다형성 위치(SNP 또는 기타)와 예비-순환된 프로브의 3' 말단 및/또는 5'가 하이브리드화하도록 설계된 염기 사이의 염기의 수는 하나의 염기일 수 있거나, 이는 2개의 염기일 수 있거나, 이는 3개의 염기일 수 있거나, 이는 4개의 염기일 수 있거나, 이는 5개의 염기일 수 있거나, 이는 6개의 염기일 수 있거나, 이는 7개 내지 10개의 염기일 수 있거나, 이는 16개 내지 20개의 염기, 20개 내지 30개 염기, 또는 30개 내지 60개 염기일 수 있다. 전방 및 역방 프라이머를 설계하여 다형성 부위로부터 떨어진 상이한 수의 염기를 하이브리드화하도록 할 수 있다. 프로브의 순환화는 거대한 수의 프로브가 생성되어 잠재적으로 혼주되도록 함으로써 많은 유전자자리의 조사가 동시에 가능하도록 하는 현재의 DNA 합성 기술을 사용하여 다량으로 생성시킬 수 있다. 300,000개 이상의 프로브를 사용하여 작업하는 것이 보고되어 왔다. 표적 개체의 게놈 데이터를 측정하는데 사용될 수 있는 프로브를 순환시키는 것을 포함하는 방법은 다음을 포함한다: Porreca 등, Nature Methods, 2007 4(11), pp. 931-936.; 및 또한 Turner 등, Nature Methods, 2009, 6(5), pp. 315-316. 이들 논문에 기술된 방법은 본원에 기술된 다른 방법과 함께 사용될 수 있다. 이들 2개의 논문에 기술된 방법의 특정 단계를 본원에 기술된 다른 방법의 다른 단계와 함께 사용할 수 있다.
본원에 개시된 방법의 일부 구현예에서, 표적 개체의 유전 물질은 임의로 증폭된 후 예비-순환된 프로브의 하이브리드화를 수반하며, 갭 충전을 수행하여 하이브리드화된 프로브의 2개의 말단 사이에 염기를 충전시키고, 2개의 말단을 연결하여 순환된 프로브를 형성하며, 순환된 프로브를 예를 들면, 롤링 환 증폭(rolling circle amplication)을 사용하여 증폭시킨다. 일단 목적한 표적 대립유전자 유전 정보가, 적절하게 설계된 올리고뉴클레오타이드 프로브를, 예를 들면, LIP 시스템 속에 순환시킴으로써 포획하면, 순환된 프로브의 유전 서열은 바람직한 서열 데이터를 수득하기 위해 측정할 수 있다. 일 구현예에서, 적절하게 설계된 올리고뉴클레오타이드 프로브는 표적 개체의 증폭되지 않은 유전 물질에 직접 순환되어 후방으로 증폭될 수 있다. 롤링 환 증폭, MDA, 또는 다른 증폭 프로토콜을 포함하는 다수의 증폭 공정을 사용하여 원래의 유전물질, 또는 순환된 LIP를 증폭시킬 수 있음에 주목한다. 상이한 방법, 예를 들면, 고 배출 서열분석, 생거 서열분석(Sanger sequencing), 다른 서열분석 방법, 하이브리드화에 의한 포획(capture-by-hybridization), 순환에 의한 포획(capture-by-circul arization), 다중 PCR, 다른 하이브리드화 방법, 및 이의 조합을 사용하여 표적 게놈에서 유전 정보를 측정할 수 있다.
일단 개체의 유전 물질이 상기 방법의 하나 이상의 조합을 사용하여 측정되면, 적절한 유전 측정과 함께, PARENTAL SUPPORTTM 방법과 같은, 정보학 기반 방법을 이후에 사용하여 개체의 하나 이상의 염색체의 배수성 상태, 및/또는 대립유전자, 구체적으로 목적한 유전 상태 또는 질병과 상호 관련된 대립유전자 중의 하나 또는 세트의 유전 상태를 측정할 수 있다. LIP의 사용은 유전 서열의 다중화된 포획에 이은 서열분석을 사용한 유전형분석에 의해 보고되어 왔음에 주목한다. 그러나, 단일 세포, 소수의 세포, 또는 세포외 DNA에서 발견된 유전 물질의 증폭을 위한 LIP-계 방법으로 생성된 서열 데이터의 사용은 표적 개체의 배수성 상태를 측정하는 목적으로 사용되지 않아왔다.
ILLUMINA INFINIUM 배열, 또는 AFFYMETRIX 유전자 칩과 같은 하이브리드화 배열에 의해 측정된 유전 데이터에 의하여 개체의 배수성 상태를 측정하는 방법에 기반한 정보학을 적용하는 것은 본 문서의 어딘가에 참조 문헌으로 본 문서에 기술되어 있다. 그러나, 본원에 기술된 방법은 문헌에서 이미 기술된 방법에 비해 개선을 나타낸다. 예를 들어, LIP계 접근법에 이은 고 배출 서열분석은 다중화를 위한 보다 우수한 능력, 보다 우수한 포획 특이성, 보다 우수한 균일성, 및 낮은 대립유전자 편형을 갖는 접근법로 인하여 보다 우수한 유전형 데이터를 제공한다. 보다 큰 다중화는 보다 많은 대립유전자가 표적화되도록 함으로써, 보다 정밀한 결과를 제공한다. 보다 우수한 균일성은, 보다 많은 표적화된 대립유전자가 측정되도록 함으로써 보다 정밀한 결과를 제공한다. 보다 낮은 비율의 대립유전자 편향은 보다 낮은 비율의 잘못된 요청을 초래하여, 보다 정밀한 결과를 제공한다. 보다 정밀한 결과는 임상 결과의 개선, 및 보다 우수한 의학적 관리를 초래한다.
LIP가 서열분석 이외의 방법에 의해 유전형분석을 위한 DNA의 시료 속에서 특이적인 유전자자리를 표적화하는 방법으로 사용될 수 있음이 중요하다. 예를 들어, LIP는 SNP 배열 또는 다른 DNA 또는 RNA계 미세배열을 사용한 유전형검사용 DNA를 표적화하는데 사용될 수 있다.
연결- 매개된 PCR
연결-매개된 PCR을 사용하여 연결되지 않은 프라이머를 사용한 PCR 증폭 전 또는 후에 표적 유전자자리를 증폭시킬 수 있다. 연결-매개된 PCR은 DNA의 혼합물 속의 하나 또는 다수의 유전자자리를 증폭시킴으로써 DNA의 시료를 우선적으로 농축시키는데 사용된 PCR 방법이며, 당해 방법은 프라이머 쌍들의 세트(여기서 쌍의 각각의 프라이머는 표적 특이적인 서열 및 비-표적 서열을 함유하고, 여기서 표적 특이적인 서열은 표적 영역, 다형성 부위의 하나의 상부 및 하나의 하부에 어닐링하도록 바람직하게 설계되어 있으며, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11-20, 21-30, 31-40, 41-50, 51-100, 또는 100 초과에 의해 다형성 부위에서 분리될 수 있다)의 수득; 상부 프라이머의 3-프라임 말단에서 이것과 표적 분자에 대해 상보성인 뉴클레오타이드를 지닌 하부 프라이머의 5-프라임 말단 사이의 일본쇄 영역 충전물까지의 중합화; 상부 프라이머의 마지막 중합된 염기의 하부 프라이머의 인접한 5-프라임 염기까지의 연결; 및 상부 프라이머의 5-프라임 말단 및 하부 프라이머의 3-프라임 말단에서 함유된 비-표적 서열을 사용한 유일하게 중합되고 연결된 분자의 증폭을 포함한다. 명백한 표적에 대한 프라이머의 쌍은 동일한 반응물 속에서 혼합할 수 있다. 비-표적 서열은 공통의 서열로 제공됨으로써 성공적으로 중합되어 연결되어진 프라이머의 모든 쌍이 단일 쌍의 증폭 프라이머로 증폭될 수 있도록 한다.
하이브리드화에 의한 포획
일부 구현예에서, 본원의 방법은 다중 PCR을 사용하는 것 외에 하이브리드화 방법에 의한 다음의 포획 중의 어느 것을 사용하여 표적 유전자자리를 증폭시킴을 포함할 수 있다. 표적 게놈에서 서열의 특이적인 세트의 우선적인 농축은 다수의 방법으로 달성할 수 있다. 본 문서의 어딘가에 LIP가 서열의 특이적인 세트를 표적하는데 사용될 수 있는 방법이 기술되어 있지만, 이러한 출원들 모두에서는 다른 표적화 및/또는 우선적 농축 방법을 동일한 목적을 위해 동등하게 잘 사용할 수 있다. 다른 표적화 방법의 하나의 예는 하이브리드화 접근법에 의한 포획이다. 하이브리드화 기술에 의한 시판되는 포획의 일부 실시예는 AGILENT's SURE SELECT 및 ILLUMINA's TruSeq를 포함한다. 하이브리드화에 의한 포획에서, 바람직한 표적화된 서열에 대해 대부분 상보성이거나 상보성인 올리고뉴클레오타이드의 세트는 DNA의 혼합물에 하이브리드화하도록 한 후, 혼합물로부터 물리적으로 분리한다. 일단 목적한 서열이 표적 올리고뉴클레오타이드에 하이브리드화되면, 표적화 올리고뉴클레오타이드를 물리적으로 제거하는 효과는 또한 표적화된 서열을 제거하는 것이다. 일단 하이브리드화된 올리고가 제거되면, 이들을 이들의 용융 온도 이상으로 가열하고 이들을 증폭시킬 수 있다. 표적화 올리고뉴클레오타이드를 물리적으로 제거하는 일부 방법은 표적화 올리고를 고체 지지체, 예를 들면, 자기 비드, 또는 칩에 공유결합으로 결합시킴에 의한 것이다. 표적화 올리고뉴클레오타이드를 물리적으로 제거하는 다른 방법은 이들을 다른 분자 잔기에 대해 강력한 친화성을 지닌 분자 잔기에 공유 결합시키는 것이다. 이러한 분자쌍의 예는 SURE SELECT에서 사용된 바와 같은 바이오틴 및 스트렙타비딘이다. 따라서, 이러한 표적화된 서열은 바이오틴 분자에 공유결합적으로 부착될 수 있었으며, 하이브리드화 후, 고정된 스트렙타비딘을 지닌 고체 지지체를 사용하여, 표적화된 서열에 하이브리드화되는 바이오티닐화된 올리고뉴클레오타이드를 끌어내릴 수 있다.
하이브리드 포획은 목적한 표적에 대해 상보성인 프로브를 표적 분자에 하이브리드화시킴을 포함한다. 하이브리드 포획 프로브는 표적들 사이에 상대적인 균일성을 지닌 게놈의 거대 분획을 표적화하여 농축시키도록 원래 개발되어 왔다. 본 출원에서는, 모든 영역이 서열분석에 의해 검출될 수 있기에 충분한 균일성으로 증폭되지만, 원래의 시료 속에서 대립유전자의 비율을 유지하는 것이 고려되지 않았다는 것이 중요하였다. 포획 후, 시료 속에 존재하는 대립유전자는 포획된 분자의 직접적인 서열분석에 의해 측정될 수 있다. 이들 서열분석 판독물은 대립유전자 유형에 따라서 분석되고 계수될 수 있다. 그러나, 현재의 기술, 측정된 대립유전자 분포를 사용하여, 포획된 서열은 전형적으로 원래의 대립유전자 분포를 나타내지 않는다.
일 구현예에서, 대립유전자의 검출은 서열분석에 의해 수행된다. 다형성 부위에서 대립유전자 실체를 보증하기 위하여, 서열분석 판독물이 문제의 대립유전자에걸쳐져서 포획된 분자의 대립유전자 조성을 평가하는 것이 필수적이다. 포획 분자는 흔히 가변성 길이이므로, 서열분석시 전체 분자가 서열분석되지 않으면 변이체 위치를 오버랩하는 것을 보증할 수 없다. 그러나, 비용 고려 및 또한 최대로 가능한 길이에 대한 기술적 제약 및 서열분석 판독물의 정밀성은 전체 분자의 서열분석을 달성할 수 없도록 한다. 일 구현예에서, 판독물 길이는 약 30 내지 약 50개로 증가될 수 있거나 약 70개 염기는 표적화된 서열 내에서 변이체 위치를 오버랩하는 판독물의 수를 크게 증가시킬 수 있다.
목적한 위치를 질의하는 판독물의 수를 증가시키는 다른 방법은 직면한 농축된 대립유전자 속에 편향을 초래하지 않는 한, 프로브의 길이를 감소시키는 것이다. 합성된 프로브의 길이는, 하나의 유전자자리에서 발견된 2개의 상이한 대립유전자에 하이브리드화하도록 설계된 2개의 프로브가 원래의 시료 속에서 다양한 대립유전자에 대해 거의 동등한 친화성으로 하이브리드화하도록 충분히 길어야 한다. 현재, 당해 분야에 공지된 방법은 120개 염기 보다 전형적으로 더 긴 프로브를 기술하고 있다. 본 구현예에서, 대립유전자가 1개 또는 소수의 염기인 경우, 포획 프로브는 약 110개 미만의 염기, 약 100개 미만의 염기, 약 90개 미만의 염기, 약 80개 미만의 염기, 약 70개 미만의 염기, 약 60개 미만의 염기, 약 50개 미만의 염기, 약 40개 미만의 염기, 약 30개 미만의 염기, 및 약 25개 미만의 염기일 수 있고, 이는 모든 대립유전자의 동등한 농축을 보장하기에 충분하다. 하이브리드 포획 기술을 사용하여 농축될 DNA의 혼합물이 혈액, 예를 들면, 모계 혈액에서 분리된 자유로이 부유하는 DNA를 포함하는 혼합물인 경우, DNA의 평균 길이는 매우 짧아서, 전형적으로 200개 염기 미만이다. 보다 짧은 프로브의 사용은, 하이브리드 포획 프로브가 목적한 DNA 단편을 포획할 보다 큰 기회를 생성한다. 보다 큰 변화는 보다 긴 프로브를 필요로 할 수 있다. 일 구현예에서, 목적하는 변형은, 길이가 1개(SNP) 내지 수개의 염기이다. 일 구현예에서, 게놈내 표적화된 영역은 하이브리드 포획 프로브를 사용하여 우선적으로 농축시킬 수 있으며, 여기서 하이브리드 포획 프로브는 90개 이하의 염기 길이이고, 80개 미만의 염기 길이, 70개 미만의 염기 길이, 60개 미만의 염기 길이, 50개 미만의 염기 길이, 40개 미만의 염기 길이, 30개 미만의 염기 길이, 또는 25개 미만의 염기 길이일 수 있다. 일 구현예에서, 목적한 대립유전자가 서열분석되는 기회를 증가시키기 위해, 다형성 대립유전자 위치를 플랭킹하는 영역에 하이브리드화하도록 설계된 프로브의 길이는 90개 이상의 염기로부터, 약 80개 염기까지, 또는 약 70개 염기까지, 또는 약 60개 염기까지, 또는 약 50개 염기까지, 또는 약 40개 염기까지, 또는 약 30개 염기까지, 또는 약 25개 염기까지 감소시킬 수 있다.
포획을 가능하도록 하기 위하여 합성된 프로브와 표적 분자 사이의 최대 오버랩이 존재한다. 이러한 합성된 프로브는 가능한 한 짧게 제조될 수 있지만 오버랩에 요구된 이러한 최소 오버랩보다 더 크다. 다형성 영역을 포획화하기 위해 보다 짧은 프로브 길이를 사용하는 효과는, 표적 대립유전자 영역을 오버랩하는 보다 많은 분자가 존재할 것이라는 것이다. 원래의 DNA 분자의 단편화 상태는 또한 표적화된 대립유전자를 오버랩할 판독물의 수에 영향을 미친다. 혈장 시료와 같은 일부 DNA 시료는 생체내에서 일어나는 생물학적 공정으로 인하여 이미 단편화되어 있다. 그러나, 보다 긴 단편을 지닌 시료는 서열분석 라이브러리 제조 및 농축 전에 단편화로 인해 유리하다. 프로브 및 단편 둘 모두가 짧을 경우(~60-80 bp), 최대 특이성은 목적한 주요 영역과 중첩하는데 실패하는 비교적 적은 서열 판독물에서 달성될 수 있다.
일 구현예에서, 하이브리드화 조건을 조절하여 원래의 시료 속에 존재하는 상이한 대립유전자의 포획시 균일성을 최대화할 수 있다. 일 구현예에서, 하이브리드화 온도를 강하시켜 대립유전자 사이에 하이브리드화 편향에 있어서의 차이를 최소화한다. 당해 분야에 공지된 방법은, 온도를 저하시키는 것이 의도되지 않은 표적에 대한 프로브의 하이브리드화를 증가시키는 효과를 가지므로 하이브리드화를 위해 보다 낮은 온도를 사용하는 것을 피한다. 그러나, 목표가 최대의 정확도로 대립유전자 비를 보존하는 경우, 보다 낮은 하이브리드화 온도를 사용하는 접근법은, 현재의 기술이 이러한 접근법와는 벗어나게 교시한다는 사실에도 불구하고, 최적으로 정밀한 대립유전자 비를 제공한다. 하이브리드화 온도는 또한 표적과 합성된 프로브 사이에 보다 큰 오버랩을 요구하도록 증가시켜 표적화된 영역의 실질적인 오버랩을 지닌 표적만이 포획되도록 할 수 있다. 본원의 일부 구현예에서, 하이브리드화 온도는 정상의 하이브리드화 온도에서 약 40℃, 약 45℃, 약 50℃, 약 55℃, 약 60℃, 약 65, 또는 약 70℃까지 강하된다.
일 구현예에서, 하이브리드 포획 프로브를 설계하여 다형성 대립유전자를 플랭킹하는 영역 속에서 발견된 DNA에 대해 상보성인 DNA를 지닌 포획 프로브의 영역이 다형성 부위에 바로 근접하지 않도록 할 수 있다. 대신, 포획 프로브를 설계하여 표적의 다형성 부위를 플랭킹하는 DNA에 대해 하이브리드화하도록 설계된 포획 프로브의 영역이, 길이가 1개 또는 작은 수의 염기와 동등한 작은 거리에 의해 다형성 부위와 반데르발스(van der Waals) 내에 있게 될 포획 프로브의 부위에서 분리되도록 할 수 있다. 일 구현예에서, 하이브리드 포획 프로브는 다형성 대립유전자를 플랭킹하는 영역에 하이브리드화하도록 설계되지만 이를 교차하지 않으며; 이는 플랭킹 포획 프로브로 명명될 수 있다. 플랭킹 포획 프로브의 길이는 약 120개 염기 미만, 약 110개 염기 미만, 약 100개 염기 미만, 약 90 개 염기 미만일 수 있으며, 약 80개 염기 미만, 약 70개 염기 미만, 약 60개 염기 미만, 약 50개 염기 미만, 약 40개 염기 미만, 약 30개 염기 미만, 또는 약 25개 염기 미만일 수 있다. 플랭킹 포획 프로브에 의해 표적화된 게놈의 영역은 다형성 유전자자리에 의해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 내지 20, 또는 20개 염기 쌍까지 분리될 수 있다.
표적화된 포획의 설명은 표적화된 서열 포획을 사용하는 질병 스크리닝 시험을 기반으로 한다. 통상의 표적화된 서열 포획은 AGILENT(SURE SELECT), ROCHE-NIMBLEGEN, 또는 ILLUMINA에 의해 현재 제공된 것들과 유사하다. 포획 프로브를 통상적으로 설계하여 다양한 유형의 돌연변이의 포획을 보증할 수 있었다. 점 돌연변이의 경우, 점 돌연변이와 오버랩되는 하나 이상의 프로브는 돌연변이를 포획하고 서열분석하기 충분하여야 한다.
작은 삽입 또는 결실의 경우, 돌연변이와 오버랩되는 하나 이상의 프로브는 돌연변이를 포함하는 단편을 포획하여 서열분석하기에 충분할 수 있다. 하이브리드화는 참조 게놈 서열에 대해 전형적으로 설계된, 프로브-제한 포획 효능 사이에 거의 충분하지 않을 수 있다. 돌연변이를 포함하는 단편의 포획을 보증하기 위하여, 하나는 정상의 대립유전자에 일치하고 하나는 돌연변이체 대립유전자에 일치하는, 2개의 프로브를 설계할 수 있었다. 보다 긴 프로브는 하이브리드화를 향상시킬 수 있다. 다수의 중첩되는 프로브는 포획을 향상시킬 수 있다. 최종적으로, 프로브를 바로 근접하게, 그러나 중첩되지 않도록 놓음으로써, 돌연변이는 정상 및 돌연변이체 대립유전자의 비교적 유사한 포획 효능을 허용할 수 있다.
단순한 연쇄 반복(STR)의 경우, 이들 고도의 가변성 부위를 중첩하는 프로브는 단편을 잘 포획하지 않는 가능성이 있다. 포획을 향상시키기 위하여, 프로브를 가변 부위에 근접하게 그러나 중첩되지 않도록 둘 수 있다. 이후에, 단편은 정상으로 서열분석하여 STR의 길이 및 조성을 나타낼 수 있다.
큰 결실의 경우, 일련의 중첩 프로브, 엑손 포획 시스템에서 현재 사용된 일반적인 접근법을 작동시킬 수 있다. 그러나, 이러한 접근법을 사용하면 개체가 이형접합성인지를 측정하기가 어려울 수 있다. 포획된 영역내에서 SNP를 표적화하고 평가하는 것은, 개체가 담체임을 나타내는 영역에 걸쳐 이형접합성의 손실을 잠재적으로 나타낼 수 있었다. 일 구현예에서, 중첩되지 않거나 개체 프로브를 잠재적으로 결실된 영역을 따라 배치하고 이형접합성의 척도로서 다수의 포획된 단편을 사용하는 것이 가능하다. 개체가 큰 결실을 수반하는 경우에, 단편의 수의 1/2은 결실되지 않은(이배체) 참조 유전자자리에 대한 포획에 이용가능한 것으로 예측된다. 결과적으로, 결실된 영역에서 수득된 판독물의 수는 일반적인 이배체 유전자자리에서 수득된 것의 거의 1/2이어야 한다. 잠재적으로 결실된 영역을 따라 다수의 개체 프로브로 서열분석 판독물 깊이를 응집시키고 평균을 내는 것은 신호를 향상시켜 진단의 신뢰도를 개선시킬 수 있다. SNP를 표적화하여 이형접합성의 손실을 확인하고 다수의 개체 프로브를 사용하여 이러한 유전자자리에서 근본적인 단편의 양의 정량적 척도를 수득하는 것을 또한 합할 수 있다. 이들 전략 각각 또는 둘 모두는 다른 전략과 합하여 동일한 목표를 보다 우수하게 수득할 수 있다.
Y-염색체 단편의 존재에 의해 나타난 것으로서, 남성 태아의 cfDNA 검출 동안인 경우, 동일한 시험에서 포획되고 서열분석되며, 모친 및 부친이 영향을 받지 않는 경우의 X-연결된 우성 돌연변이체, 또는 모친이 영향을 받지 않는 우성 돌연변이는 태아에 최대 위험을 나타낼 수 있다. 영향을 받지 않은 모에서 동일한 유전자내 2개의 돌연변이체 열성 대립유전자의 검출은, 태자녀 부친으로부터 돌연변이체 대립유전자를, 그리고 잠재적으로 모친으로부터 제2의 돌연변이체 대립유전자를 유전받았음을 내포할 수 있다. 모든 경우, 양수천자 또는 융모막 융모 시료채취에 의한 후속적인 시험을 나타낼 수 있다.
표적화된 포획계 질병 스크리닝 시험은 이수성에 대한 비-침입성 출생전 진단 시험을 기반으로 표적화된 포획과 결합시킬 수 있다.
판독(DOR) 가변성의 깊이를 감소시키기 위한 다수의 방법이 존재한다: 예를 들면, 프라이머 농도를 증가시킬 수 있거나, 보다 긴 표적화된 증폭 프로브를 사용할 수 있거나, 보다 많은 STA 주기(예를 들면, 25개 이상, 30개 이상, 35, 또는 심지어 40개 이상)를 수행할 수 있다.
시료의 DNA 분자의 수를 측정하는 예시적인 방법
제1 라운드의 DNA 증폭 동안에 시료 속의 각각의 원래 DNA 분자에 대한 유일하게 확인된 분자를 생성함으로써 시료 속의 DNA 분자의 수를 측정하는 방법이 본원에 기술되어 있다. 단일 분자 또는 클론 서열분석 방법에 따라 상기 목표를 달성하는 과정이 본원에 기술되어 있다.
당해 접근법은, 하나 이상의 특이적인 유전자자리를 표적화하고 각각의 표적화된 유전자자리의 대부분 또는 모든 태그된 분자가 유일한 태그를 가질 것이며 클론 또는 단일 분자 서열분석을 사용하여 당해 바코드의 서열분석시 서로 구별될 수 있는 방식으로 원래의 분자의 태그된 카피를 생성하는 것을 포함한다. 각각의 유일하게 서열분석된 바코드는 원래의 시료 속의 유일한 분자를 나타낸다. 동시에, 서열분석 데이터를 사용하여 분자가 기원하는 유전자자리를 확인한다. 당해 정보를 사용하여 각각의 유전자자리에 대한 원래의 시료 속에서 유일한 분자의 수를 측정할 수 있다.
당해 방법은, 원래의 시료 속의 다수의 분자의 정량적인 평가가 요구되는 어떠한 적용에도 사용될 수 있다. 또한, 하나 이상의 표적의 유일한 분자의 수를 하나 이상의 다른 표적에 대해 유일한 분자의 수와 관련시켜 상대적인 카피 수, 대랍형질 분포, 또는 대립유전자 비를 측정할 수 있다. 달리는 다양한 표적의 결실된 카피의 수를 분포로 모델화하여 원래의 표적의 대부분 유사한 카피 수를 확인할 수 있다. 적용은 듀켄씨 근이영양증의 매개체에서 발견되는 것과 같은 삽입 및 결실의 검출; 카피 수 변이체에서 관찰된 것과 같은 염색체의 결실 또는 중복 분절의 정량화; 태어난 개체에서 채취한 시료의 염색체 카피 수; 배아 또는 태아와 같이 태어나지 않은 개체에서 채취한 시료의 염색체 카피 수를 포함하나, 이에 한정되지 않는다.
당해 방법은 서열에 의해 표적화된 것 속에 함유된 변이체의 동시 평가와 합해질 수 있다. 이는 원래의 시료 속에서 각각의 대립유전자를 나타내는 분자의 수를 측정하는데 사용될 수 있다. 당해 카피 수 방법은 태어난 그리고 태어나지 않은 개체의 염색체 카피 수를 측정하기 위한 SNP 또는 다른 서열 변이의 평가와; 짧은 서열 변이를 갖지만, 여기서 PCR이 척추 근위축의 담체 검출과 같은 다수의 표적 영역의 증폭될 수 있는 다수의 표적의 증폭될 수 있는 유전자자리의 카피의 구별 및 정량화와; 모계 태반 혈장에서 수득된 자유로이 부유하는 DNA의 태아 이수성의 검출에서와 같이 상이한 개체의 혼합물로 이루어진 시료의 상이한 분자원의 카피 수의 측정과 결합될 수 있다.
일 구현예에서, 단일의 표적 유전자자리에 관한 방법은 다음의 단계 중 하나 이상을 포함할 수 있다: (1) 특이적인 유전자자리의 PCR 증폭을 위한 올리고머의 표준 쌍의 설계. (2) 합성 동안, 표적 유전자자리 또는 게놈에 대해 상보성이 없거나 최소인 명시된 염기의 서열의 표적 특이적인 올리고머 중 하나의 5' 말단에 대한 첨가. 테일로 명명된 당해 서열은 무작위 뉴클레오타이드(random nucleotide)의 서열을 수반하는, 후속적인 증폭을 위해 사용되는 공지된 서열이다. 당해 무작위 뉴클레오타이드는 무작위 영역을 포함한다. 당해 무작위 영역은 각각의 프로브 분자 사이에서 확률적으로 상이한 핵산의 무작위적으로 생성된 서열을 포함한다. 결과적으로, 합성에 이어서, 테일된 올리고머 혼주물은 공지된 서열로 시작한 후, 분자 사이에 상이한 공지되지 않은 서열에 이어서, 표적 특이적인 서열이 이어지는 올리고머의 집합으로 이루어질 것이다. (3) 테일된 올리고머만을 사용한 1 라운드의 증폭(변성, 어닐링, 연장). (4) 엑소뉴클레아제를 반응물에 첨가, PCR 반응의 효과적인 중지, 및 적절한 온도에서 반응물을 항온처리하여 주형에 어닐링하지 않은 전방 일본쇄 올리고를 제거하고 연장시켜 이본쇄 생성물을 형성함. (5) 고온에서 반응물을 항온처리하여 엑소뉴클레아제를 변성시키고 이의 활성을 제거함. (6) 제1 라운드의 PCR에서 생성된 생성물의 PCR 증폭을 가능하도록 하기 위해 다른 표적 특이적인 올리고머와 함께 제1 반응에 사용된 올리고머의 테일에 대해 상보성인 신규 올리고뉴클레오타이드를 반응물에 첨가함. (7) 증폭을 지속하여 하부 클로날 서열분석에 충분한 생성물을 형성함. (8) 서열을 연장시키기에 충분한 수의 염기에 대한 다수의 방법, 예를 들면, 클론 서열분석에 의해 증폭된 PCR 생성물의 측정.
일 구현예에서, 본원의 방법은 다수의 유전자자리를 평행하게 또는 달리 표적화함을 포함한다. 상이한 표적 유전자자리에 대한 프라이머는 독립적으로 생성시킬 수 있고 혼합하여 다중 PCR 혼주물을 생성시킬 수 있다. 일 구현예에서, 원래의 시료는 소-혼주물로 나눌 수 있으며 상이한 유전자자리는 재조합 및 서열분석되기 전에 각각의 소-혼주물 속에서 표적화할 수 있다. 일 구현예에서, 표적화 단계, 및 증폭 주기의 수는, 혼주물을 세분하여 쪼개기 전에 모든 표적의 충분한 표적화, 및 세분된 혼주물 속에서 프라이머의 보다 작은 세트를 사용한 연속 증폭에 의해 후속적인 증폭을 개선시키는 것을 보증하기 전에 수행할 수 있다.
당해 기술이 특히 유용할 수 있는 적용의 한가지 예는, 비-침입성인 태자녀 이수성 진단이고, 여기서 소정의 유전자자리에서 대립유전자의 비 또는 다수의 유전자자리에서 대립유전자의 분포를 사용하여 태아에 존재하는 염색체의 카피의 수를 측정하는데 도움을 줄 수 있다. 이와 관련하여, 초기 시료 속에 존재하는 DNA를 증폭시키는 한편 다양한 대립유전자의 상대적인 양을 유지하는 것이 바람직할 수 있다. 일부 상황에서, 매우 소량의 DNA, 예를 들면, 5,000개 미만의 카피의 게놈, 1,000개 이하의 카피의 게놈, 500개 이하의 카피의 게놈, 및 100개 이하의 카피의 게놈이 존재하는 경우에, 병목현상으로 불리는 현상에 직면할 수 있다. 이는 초기 시료의 특정한 대립유전자의 소수의 카피가 존재하여, 증폭 편향이 DNA의 초기 혼합물 속에서 존재하는 것보다 이들 대립유전자의 유의적으로 상이한 비를 갖는 DNA의 증폭된 혼주물을 생성할 수 있는 경우이다. 유일하거나 거의 유일한 세트의 바코드를 표준 PCR 증폭 전에 DNA의 각각의 쇄에 적용함으로써, 동일한 원래의 분자에서 기원한 서열분석된 DNA의 n개의 분자들의 동일한 세트에서 n-1개 카피의 DNA를 배제시키는 것이 가능하다.
예를 들면, 개체의 게놈내 이형접합성 SNP, 및 각각의 대립유전자의 10개 분자가 DNA의 원래의 시료 속에 존재하는 경우 개체의 DNA의 혼합물을 고려한다. 증폭 후 이러한 유전자자리에 상응하는 DNA의 100,000개의 분자가 존재할 수 있다. 확률론적 공정으로 인하여, DNA의 비는 1:2 내지 2:1일 수 있지만, 원래의 분자 각각은 유일한 태그로 태그되었으므로, 증폭된 혼주물의 DNA가 각각의 대립유전자의 DNA의 정확히 10개 분자에서 기원하였음을 측정하는 것이 가능할 수 있다. 따라서, 당해 방법은 당해 접근법을 사용하지 않은 방법보다 각각의 대립유전자의 상대적인 양의 보다 정확한 측정을 제공할 수 있다. 대립유전자 편향의 상대적인 양을 최소화시키는 것이 바람직한 방법의 경우, 당해 방법은 보다 정밀한 데이터를 제공할 것이다.
표적 유전자자리에 대한 서열분석된 단편의 연합은 다수의 방법으로 달성할 수 있다. 일 구현예에서, 충분한 길이의 서열을 표적화된 단편에서 수득하여 분자 바코드 및 표적 서열에 상응하는 유일한 염기의 충분한 수를 연장시켜서 표적 유전자자리를 명확하게 확인한다. 다른 구현예에서, 무작위적으로 생성된 분자 바코드를 함유하는 분자 바-코드화 프라이머는 또한, 이것이 관련된 표적을 확인하는 유전자자리 특이적인 바코드(유전자자리 바코드)를 함유할 수 있다. 당해 유전자자리 바코드는 각각이 개체의 표적에 대해 모든 분자 바-코드화 프라이머 중에서 동일할 수 있지만 다른 모든 표적과 상이하다. 일 구현예에서 본원에 기술된 태그화 방법은 단면 중첩화 프로토콜과 결합될 수 있다.
일 구현예에서, 분자 바코드화 프라이머의 설계 및 생성을 감소시켜 다음과 같이 실시할 수 있다: 분자 바코드화 프라이머는 표적 서열에 이어 무작위 분자 바코드 영역에 이어 표적 특이적인 서열에 대해 상보성이 아닌 서열로 이루어질 수 있다. 분자 바코드의 서열 5'는 서열 PCR 증폭에 사용될 수 있으며 앰플리콘의 서열분석용 라이브러리로의 전환 시 유용한 서열을 포함할 수 있다. 무작위 분자 바코드 서열은 다수의 방법으로 생성시킬 수 있다. 바람직한 방법은 바코드 영역의 합성 동안 반응에 모든 4개의 염기를 포함시키는 방식으로 분자 태그화 프라이머를 합성한다. 염기의 모든 또는 다양한 조합은 IUPAC DNA 애매성 코드(ambiguity code)를 사용하여 구체화할 수 있다. 이러한 방식으로 분자의 합성된 수집은 분자 바코드 영역 속에 서열의 무작위 혼합물을 함유할 것이다. 바코드 영역의 길이는, 얼마나 많은 프라이머가 유일한 바코드를 함유할 것인지를 측정할 것이다. 유일한 서열의 수는 N L (여기서 N은 염기의 수, 전형적으로 4이고 L은 바코드의 길이이다)로서의 바코드 영역의 길이와 관련되어 있다. 5개 염기의 바코드는 1024개 이하의 유일한 서열을 생성할 수 있으며; 8개 염기의 바코드는 65536개의 유일한 바코드를 생성할 수 있다. 일 구현예에서, DNA는 서열분석 방법으로 측정할 수 있으며, 여기서 서열 데이터는 단일 분자의 서열을 나타낸다. 이는, 단일 분자가 직접 서열분석되는 방법 또는 단일 분자가 증폭되어 서열 장치에 의해 검출가능한 클론을 형성하지만, 본원에서 클론성 서열분석으로 불리는, 단일 분자를 여전히 나타내는 방법을 포함할 수 있다.
증폭 생성물의 정량화를 위한 예시적인 방법 및 시약
목적한 특이적인 핵산 서열의 정량화는 TAQMAN (제조원: LIFE TECHNOLOGIES), INVADER 프로브(제조원: THIRD WAVE TECHNOLOGIES) 등과 같은 정량적 실시간 PCR 기술에 의해 전형적으로 수행된다. 이러한 기술은 다수의 서열의 동시 분석을 평행하게(다중화) 달성하기 위한 제한된 능력 및 단지 협소한 범위의 가능한 증폭 주기에 대해 정밀한 정량적 데이터를 제공하는 능력(예를 들면, PCR 증폭 생산량 대 주기의 수의 논리가 선형 범위에 있는 경우)과 같은 다수의 단점을 지니고 있다. MYSEQ (제조원: ILLUMINA), HISEQ (제조원: ILLUMINA), ION TORRENT (제조원: LIFE TECHNOLOGIES), GENOME ANALYZER ILX (제조원: ILLUMINA), GS FLEX+(ROCHE 454) 등에서 사용된 것과 같은 DNA 서열분석 기술, 특히 고 배출 차-세대 서열분석 기술(흔히 거대하게 평행한 서열분석 기술로 언급됨)을 시료 속에 존재하는 목적한 서열의 카피의 수와 정량적 측정을 위해 사용함으로써 출발 물질에 대한 정량적 정보, 예를 들면, 카피 수 또는 전사 수준을 제공할 수 있다. 고 배출 유전 서열분석기는 바 코드화(즉, 명백한 핵산 서열을 사용한 시료 태그화)의 사용으로 처리하여 개체에서 채취한 특정한 시료를 확인함으로써 1회 수행의 DNA 서열분석기 속의 다수의 시료를 동시 분석할 수 있다. 라이브러리 제제(또는 목적한 다른 핵산 제제) 속의 게놈의 특정 영역이 서열분석되는 회수(판독물의 수)는 목적한 게놈 속의 서열의 카피의 수(또는 cDNA 함유 제제의 경우에 발현 수준)에 비례할 것이다. 그러나, 유전자 라이브러리(및 유사한 게놈 기원한 제제)의 제제 및 서열분석은 목적한 핵산 서열에 대한 정확한 정량적 판독물을 수득하는 것을 방해하는 다수의 편향을 도입할 수 있다. 예를 들면, 상이한 핵산 서열은 유전자 라이브러리 제조 또는 시료 제조 동안에 일어나는 핵산 증폭 단계 동안에 상이한 효율로 증폭시킬 수 있다.
차등적인 증폭 효율과 관련된 문제는 본 발명의 특정 양태를 사용함으로써 완화시킬 수 있다. 본 발명은 정량량의 정밀도를 개선시키는데 사용될 수 있는 증폭 공정에서 포함시키기 위한 표준물의 사용과 관련된 각종 방법 및 조성물을 포함한다. 본 발명은 다른 분야 중에서도, 본원에 기술되고 다른 곳 중에서도, 이의 전문이 각각 본원에 참조로 포함된, 미국 특허 제8,008,018호; 미국 특허 제7,332,277호; PCT 특허 공보 제WO 2012/078792A2호; 및 PCT 공개 특허 공보 제WO 2011/146632 A1호에 기술된 바와 같은 모계 혈액 속의 자유로이 부유하는 태아 DNA를 분석함으로써 태아 속의 이수성의 검출 시 용도이다. 본 발명의 구현예는 또한 시험관 생성된 배아에서 이수성의 검출 시 용도이다. 검출될 수 있는 상업적으로 유의적인 이수성은 사람 염색체 13, 18, 21, X 및 Y의 이수성을 포함한다.
본 발명의 구현예는 사람 또는 비-사람 핵산과 함께 사용될 수 있고, 동물 및 식물 기원한 핵산 둘 모두에 적용될 수 있다. 본 발명의 구현예를 또한 사용하여 결실 또는 삽입에 의해 특징화된 다른 유전 질환에 대한 대립유전자를 검출하고/하거나 정량화할 수 있다. 대립유전자를 함유하는 결실은 목적한 대립유전자의 예측된 담체 속에서 검출될 수 있다.
본 발명의 일 구현예는 공지된 양(상대량 또는 절대량) 속에 존재하는 표준물을 포함한다. 예를 들면, 염색체 8(유전자자리 A 포함)에 대한 이배체 및 염색체 21(유전자자리 B 함유)에 대한 삼배체로 제조된 유전자 라이브러리를 고려한다. 유전자 라이브러리는 시료 속에 존재하는 다수의 염색체의 기능인 양, 예를 들면, 유전자자리 A의 200개 카피 및 유전자자리 B의 300개 카피로 서열을 함유할 당해 시료로 생산될 수 있다. 그러나, 유전자자리 A가 유전자자리 B보다 더 효율적으로 증폭되는 경우, PCR 후에 60,000개 카피의 A 앰플리콘 및 30,000개 카피의 B 앰플리콘이 존재할 수 있으므로, 고 배출 DNA 서열분석(또는 다른 정량적인 핵산 검출 기술)에 의한 분석시 초기 게놈 시료 의 실제 염색체 카피 수를 애매하게 한다. 이러한 문제를 완화시키기 위해, 유전자자리 A에 대한 표준 서열을 사용하며, 여기서 표준 서열은 유전자자리 A와 필수적으로 동일한 효율로 증폭된다. 유사하게, 유전자자리 B에 대한 표준 서열이 생성되며, 여기서 표준 서열은 유전자자리 B와 필수적으로 동일한 효율로 증폭한다. 유전자자리 A의 표준 서열 및 유전자자리 B의 표준 서열을 PCR(또는 다른 증폭 기술) 전에 혼합물에 가한다. 이들 표준 서열은 공지된 양, 상대량 또는 절대량으로 존재한다. 표준 서열 A 및 표준 서열 B의 1;1 혼합물이 앞서의 실시예에서 혼합물에 (증폭 전에) 가해지는 경우, 3000개 카피의 표준 A 앰플리콘이 생성될 수 있으며 1000개 카피의 표준 B 앰플리콘이 생성될 수 있고, 이는, 유전자자리 A가 동일한 세트의 조건 하에서 유전자자리 B보다 3배 더 효율적으로 증폭됨을 나타낸다.
다양한 구현예에서 목적한 SNP(또는 다른 다형성)을 함유하는 게놈의 하나 이상의 선택된 게놈이 구체적으로 증폭되어 후속적으로 서열분석될 수 있다. 당해 표적 특이적인 앰플리콘은 서열분석을 위한 유전자 라이브러리의 형성 동안에 일어날 수 있다. 당해 라이브러리는 증폭을 위한 다수의 표적화된 영역을 함유할 수 있다. 일부 구현예에서, 적어도 10; 100, 500; 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 목적한 영역이 함유된다. 이러한 라이브러리의 예는 본원에 기술되어 있으며, 이의 전문이 본원에 참조로 포함된, 2011년 11월 18일자로 출원된 미국 특허원 제2012/0270212호에서 찾을 수 있다.
많은 고 배출 DNA 서열분석 기술은 유전 출발 물질의 변형, 예를 들면, 공통의 프라이밍 부위 및/또는 바코드의 연결을 필요로 함으로써 후속적인 서열분석 반응을 수행하기 전에 작은 핵산 단편의 클론 증폭을 용이하게 한다. 일부 구현예에서, 하나 이상의 표준 서열을 유전자 라이브러리 형성 동안에 가하거나 라이브러리의 증폭 전에 유전자 라이브러리의 전구체 성분에 가한다. 표준 서열을 선택하여 고 배출 유전 서열분석 기술에 의한 서열분석을 위해 제조된 표적 게놈 단편을 모사(아직 뉴클레오타이드 염기 서열을 기반으로 구별가능함)할 수 있다. 일 구현예에서, 표준 서열은 1, 2, 3, 4 내지 10, 또는 11 내지 20개의 뉴클레오타이드를 제외하고는 표적 게놈 단편과 동일할 수 있다. 일부 구현예에서, 표적 유전 서열이 SNP를 함유하는 경우, 표준 서열은 다형성 염기에서의 뉴클레오타이드를 제외하고는 SNP와 동일할 수 있으며, 이는 천연에서 당해 위치에서 관측되지 않는 4개의 뉴클레오타이드 중 하나인 것으로 선택될 수 있다. 표준 서열은 다수의 표적 유전자자리(예를 들면, 다형성 유전자자리)의 고도의 다중 분석에서 사용될 수 있다. 표준 서열은 라이브러리 형성의 공정 동안(증폭 전)에 공지된 양(상대적인 또는 절대적인)으로 가해져서 분석 시료 속에 목적한 표적 서열의 양을 측정하는데 있어서 보다 큰 정밀성을 위한 표준 미터법(metric)을 제공한다. 앞서 특성화된 배수성 수준, 예를 들어, 모든 자가 염색체에 대해 이배체인 것으로 공지된 게놈으로부터 형성된 서열분석용 라이브러리의 배수성 수준 형성의 지식과 함께 사용된 표준 서열의 공지된 양의 지식의 조합을 사용하여 다수의 표준 서열을 포함하는 혼합물의 배취 사이에 변화에 대한 수 및 이의 상응하는 표적 서열과 관련하여 각각의 표준 서열의 증폭 특성을 보정할 수 있다. 이것이 흔히 거대한 수의 유전자자리를 동시에 분석하는데 필수적임을 고려할 때, 큰 세트의 표준 서열을 포함하는 혼합물을 생산하는 것이 유용하다. 본 발명의 구현예는 다수의 표준 서열을 포함하는 혼합물을 포함한다. 이상적으로 혼합물 중 각각의 표준 서열의 양은 고도로 정밀한 것으로 알려져 있다. 그러나, 실질적인 문제로서 혼합물, 특히 다량의 상이한 합성 올리고뉴클레오타이드를 포함하는 혼합물의 경우 각각의 표준 서열의 양에 있어서의 변화의 유의적인 양이 존재하므로 당해 목적을 달성하기는 매우 어렵다. 이러한 변화는 다수의 공급원, 예를 들면, 배취 사이의 시험관내 올리고뉴클레오타이드 합성 반응 효율, 용적 측정에 있어서의 비 정확성, 피펫팅에 있어서의 변화를 갖는다. 또한, 이러한 변화는 정확하게 동일한 양으로 정확하게 동일한 세트의 표준 서열을 이론적으로 함유하는 상이한 배취 사이에서 발생할 수 있다. 따라서, 표준 서열의 각각이 배취를 독립적으로 보정하는 것은 흥미로운 것이다. 표준 서열의 배취는 공지된 염색체 조성물의 참조 게놈에 대해 보정될 수 있다. 표준 서열의 배취는 서열분석 프로토콜에 포함된 증폭 단계가 없거나 최소인 표준 서열의 배취를 서열분석함으로써 보정할 수 있다. 본 발명의 구현예는 상이한 표준 서열의 보정된 혼합물을 포함한다. 본 발명의 다른 구현예는 상이한 표준 서열의 혼합물을 보정하는 방법 및 이러한 방법으로 제조된 상이한 표준 서열의 보정된 혼합물을 포함한다.
표준 서열의 대상 혼합물 및 이들을 사용하는 방법의 각종 구현예는 적어도 10; 100, 500; 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개 이상의 표준 서열, 및 또한 다양한 중간체 양을 포함할 수 있다. 표준 서열의 수는 DNA 서열분석을 위해 표적화된 라이브러리의 생성 동안 분석을 위해 선택된 표적 서열의 수와 동일할 수 있다. 그러나, 일부 구현예에서, 작제되는 라이브러리에서 표적화된 영역의 수보다 더 적은 수의 표준 서열을 사용하는 것이 유리할 수 있다. 사용되는 고 배출 DNA 서열분석기의 서열분석능의 한계에 반하여 나타나는 것을 피하기 위하여 보다 적은 수를 사용하는 것이 유리할 수 있다. 표준 서열의 수는 표적화된 영역의 수보다 50% 미만, 표적화된 영역의 수보다 40% 미만, 표적화된 영역의 수보다 30% 미만, 표적화된 영역의 수보다 20% 미만, 표적화된 영역의 수보다 10% 미만, 표적화된 영역의 수보다 5% 미만, 표적화된 영역의 수보다 1% 미만, 및 또한 다양한 중간 값일 수 있다. 예를 들면, 유전자 라이브러리가 특이적인 SNP 함유 유전자자리에 대해 표적화된 15,000개 쌍의 프라이머를 사용하여 생성되는 경우, 15,000개의 표적화된 유전자자리 중 1500개에 상응하는 1500개 표준 서열을 함유하는 적합한 혼합물을 라이브러리 작제의 증폭 단계 전에 가할 수 있다.
라이브러리 작제 동안에 가해진 표준 서열의 양은 상이한 구현예 중에서 현저하게 변할 수 있다. 일부 구현예에서, 각각의 표준 서열의 양은 라이브러리 제조 동안 사용된 게놈 물질 시료 속에 존재하는 표적 서열의 예측된 양과 거의 동일할 수 있다. 다른 구현예에서, 각각의 표준 서열의 양은 라이브러리 제조 동안 사용된 게놈 물질 시료 속에 존재하는 표적 서열의 예측된 양보다 크거나 이의 미만일 수 있다. 표적 서열 및 표준 서열의 초기 상대량이 본 발명의 기능에 중요하지 않지만, 당해 양이 라이브러리 제조를 위해 사용된 유전 물질 시료 속에 존재하는 표적 서열의 양 보다 100배 이상 내지 100배 미만의 범위내인 것이 바람직하다. 과도한 양의 표준물은 장치의 소정 실시 시 DNA 서열분석기의 너무나 많은 서열분석능을 사용할 수 있다. 표준 서열의 너무나 적은 양의 사용은 증폭 효율에 있어서 변화의 분석 시 보조가 되기에 불충분한 데이터를 제공할 것이다.
표준 서열은 목적한 증폭된 영역에 대해 뉴클레오타이드 염기 서열에서 매우 유사하게 되도록 선택될 수 있으며; 바람직하게 표준 서열은 분석된 게놈 영역, 즉, "표적 서열"과 정확히 동일한 프라이머-결합 부위를 가진다. 표준 서열은 소정의 유전자자리에서 상응하는 표적 서열과 구별되어야만 한다. 편의성을 위해, 표준 서열의 이러한 구별가능한 영역은 "마커 서열"로 언급될 것이다. 일부 구현예에서, 표적 서열의 마커 서열 영역은 다형성 영역, 예를 들면, SNP를 함유하며, 프라이머 결합 영역에 의해 양쪽 면에서 플랭킹될 수 있다. 표준 서열은 상응하는 표적 서열의 GC 함량에 밀접하게 일치하도록 선택될 수 있다. 일부 구현예에서, 표준 서열의 프라이밍 결합 영역은 공통의 프라이밍 부위에 의해 플랭킹된다. 이들 공통의 프라이밍 부위는 분석을 위한 게놈 라이브러리에 사용된 공통의 프라이밍 부위와 일치하도록 선택된다. 다른 구현예에서, 표준 서열은 공통의 프라이밍 부위를 가지지 않으며 공통의 프라이밍 부위는 라이브러리의 생성 동안 가해진다. 표준 서열은 전형적으로 일본쇄 형태로 제공된다. 표준 서열은 상응하는 표적 서열 및 표적 서열을 증폭시키는데 사용된 서열 특이적인 시약과 관련하여 정의된다. 일부 구현예에서, 표적 서열는 목적한 다형성, 예를 들면, 분석을 위한 핵산 시료 속에 존재하는 SNP, 결실, 또는 삽입을 함유한다. 표준 서열은 표적 서열에 대해 뉴클레오타이드 염기 서열 내에서 유사한 합성 폴리뉴클레오타이드이지만, 그럼에도 불구하고 적어도 하나의 뉴클레오타이드 염기 차이로 인하여 표적 서열로부터 구별됨으로써, 표준 서열에서 기원한 앰플리콘 서열을 표적 서열에서 기원한 앰플리콘 서열과 구분하는 매카니즘을 제공한다. 표준 서열은 동일한 세트의 증폭 시약, 예를 들면, PCR 프라이머로 증폭되는 경우 상응하는 표적 서열과 필수적으로 동일한 증폭 특성을 가지도록 선택된다. 일부 구현예에서, 표준 서열은 상응하는 표적 서열보다 동일한 프라이머 서열 결합 부위를 가질 수 있다. 다른 구현예에서, 표준 서열은 상응하는 표적 서열보다 상이한 프라이머 서열 결합 부위를 가질 수 있다. 일부 구현예에서, 표준 서열은 상응하는 표적 서열로부터 생산된 앰플리콘의 길이와 동일한 길이를 갖는 앰플리콘을 생산하도록 선택될 수 있다. 다른 구현예에서, 표준 서열은 상응하는 표적 서열로부터 생산된 앰플리콘의 길이보다 약간 상이한 길이를 갖는 앰플리콘을 생산하기 위해 선택될 수 있다.
증폭 반응이 완료된 후, 라이브러리를 고 배출 DNA 서열분석기 상에서 서열분석하며, 여기서 개개 분자는 클론적으로 증폭되어 서열분석된다. 표적 서열의 각각의 대립유전자에 대한 서열 판독물의 수가 계수되며, 또한 표적 서열에 상응하는 표준 서열에 대한 서열 판독물의 수가 계수된다. 당해 공정은 또한 표적 서열의 적어도 하나의 다른 쌍 및 상응하는 표준 서열에 대해 수행된다. 예를 들면, 유전자자리 A를 고려할 때, 유전자자리 A의 대립유전자 1에 대한 XA1 판독물이 생산되며; 유전자자리 A의 대립유전자 2에 대한 XA2 판독물이 생산되고 표준 서열 A에 대한 XAC 이 생산된다. (XA1 및 XA2) 대 XAC의 비는 목적한 각각의 유전자자리에 대해 측정된다. 앞서 논의한 바와 같이, 당해 공정은 참조 게놈, 예를 들면, 모든 염생체에 대해 이배체인 것으로 공지된 게놈에서 수행될 수 있다. 당해 공정은 거대한 수의 판독물 값을 제공하기 위해 수회 반복함으로써 판독물의 평균 수 및 다수의 판독물 중 표준 편차를 측정할 수 있다. 당해 공정은 상이한 유전자자리에 상응하는 거대 수의 상이한 표준 서열을 포함하는 혼합물로 수행한다. (1) XA1 및 XA2가 공지된 수의 염색체, 예를 들면, 정상의 사람 여성 게놈에 대해 2에 상응하고 (2) 표준 서열이 이들의 상응하는 천연의 유전자자리와 유사한 증폭(및 검출가능성) 특성을 가지는 것으로 추정함으로써, 다중 표준 혼합물 속의 상이한 표준 서열의 상대적인 양을 측정할 수 있다. 이후에, 보정된 다중 표준 서열을 사용하여 다중 증폭 반응 중 상이한 유전자자리 사이의 증폭 효능에 있어서의 가변성에 대해 조정할 수 있다.
본 발명의 다른 구현예는 서열분석에 의한 정량화를 방해할 수 있는 큰 결실에 의해 특성화된 중복체 및 돌연변이체 유전자를 포함하는, 목적한 특수 유전자의 카피 수를 측정하기 위한 방법 및 조성물을 포함한다. 서열분석은 이러한 결실을 갖는 대립유전자를 검출하는 문제를 가질 수 있다. 증폭 공정에 포함된 표준 서열은 이러한 문제를 감소시키기 위해 사용될 수 있다.
본 발명의 일 구현예에서 분석을 위한 표적 서열은 결실에 의해 특성화된 야생형(즉, 기능성) 형태 및 돌연변이체 형태를 갖는 유전자이다. 이러한 유전자의 예는 SMN1, 즉 유전병인 척추 근위축증(SMA)에 관여하는 결실을 갖는 대립유전자가다. 고 배출 유전 서열분석 기술을 이용하는 유전자의 돌연변이 형태를 수반하는 개체를 검출하는 것은 흥미로운 것이다. 이러한 기술을 결실 돌연변이의 검출에 적용하는 것은, 다른 이유들 중에서도, 서열 분석에서 관찰된 서열의 결실(단순한 점 돌연변이 또는 SNP를 검출하는 것과 대치되는 것으로서)로 인하여 문제가 될 수 있다. 이러한 구현예는 (1) 목적한 유전자에 대해 특이적인 증폭 프라이머의 쌍(여기서, 증폭 시 프라이머는 목적한 유전자(또는 이의 일부)를 증폭시킬 것이고 돌연변이체 대립유전자를 유의적으로 증폭시키지 않을 것이다), (2) 목적한 유전자(즉, 표적 서열)의 야생형 대립유전자에 상응하지만 적어도 하나의 검출가능한 뉴클레오타이드 염기에 의해 상이한 표준 서열, (3) 참조 서열로서 제공되는 제2의 표적 서열에 대해 특이적인 증폭 프라이머의 쌍, 및 (4) 참조 서열에 상응하는 표준 서열을 사용한다.
본 발명의 하나의 양태에서, 목적한 유전자의 카피의 수를 측정하기 위한 방법이 제공되며, 여기서 목적한 유전자는 결실을 포함하는 대립유전자를 의미하는 것을 갖는다. 당해 방법은, 목적한 유전자의 적어도 일부, 또는 목적한 유전자 전체, 또는 목적한 유전자에 인접한 영역을 증폭시키지만, 목적한 유전자의 대립유전자를 포함하는 결실은 증폭시키지 않음으로써, 목적한 유전자에 대해 특이적인, 목적한 유전자, 예를 들면, PCR 프라이머에 대해 특이적인 증폭 시약을 사용할 수 있다. 또한 당해 방법은 목적한 유전자에 상응하는 표준 서열을 사용하며, 여기서 표준 서열은 목적한 유전자의 적어도 하나의 뉴클레오타이드 염기가 상이하다(따라서 표준 서열의 서열은 천연적으로 존재하는 목적한 유잔자와는 용이하게 구별될 수 있다). 전형적으로, 표준 서열은 목적한 유전자와 동일한 프라이머 결합 부위를 함유함으로써 목적한 유전자와 목적한 유전자에 상응하는 표준 서열 사이의 어떠한 증폭 구별도 최소화할 것이다. 반응은 또한 참조 서열에 대해 특이적인 증폭 시약을 포함할 것이다. 참조 서열은 분석될 게놈내에서 공지된(또는 공지된 것으로 적어도 추정된) 카피 수의 서열이다. 반응은 또한 참조 서열에 상응하는 표준 서열을 포함한다. 전형적으로, 참조 서열에 상응하는 표준 서열은 참조 서열과 동일한 프라이머 결합 부위를 함유함으로써 참조 서열과 참조 서열에 상응하는 표준 서열 사이에 어떠한 증폭 구별도 최소화할 것이다.
예시적인 핵산 시료
일부 구현예에서, 유전 시료를 제조하고/하거나 정제할 수 있다. 이러한 목적을 달성하기 위한 당해 분야에 공지된 다수의 표준 과정이 존재한다. 일부 구현예에서, 시료는 원심분리하여 다양한 층으로 분리할 수 있다. 일부 구현예에서, DNA는 여과를 사용하여 분리할 수 있다. 일부 구현예에서, DNA의 제조는 증폭, 분리, 크로마토그래피에 의한 정제, 액체 액체 분리(liquid liquid separation), 분리(isolation), 차등적 농축, 차등적 증폭, 표적화된 증폭, 또는 당해 분야에 공지되거나 본원에 기술된 특정 수의 다른 기술을 포함할 수 있다.
일부 구현예에서, 본원에 개시된 방법은, 시험관 수정, 또는 법의학적 상황에서와 같이 극소량의 DNA가 존재하는 상황에서 사용될 수 있었으며, 여기서 하나 또는 소수의 세포가 이용가능하다(전형적으로 10개 세포 미만, 20개 세포 미만 또는 40개 세포 미만). 이들 구현예에서, 본원에 개시된 방법은 다른 DNA에 의해 오염되지 않은 소량의 DNA로부터 배수성 요청을 제조하기 위해 제공되지만, 여기서 배수성 요청은 소량의 DNA로는 매우 어렵다. 일부 구현예에서, 본원에 개시된 방법은, 표적 DNA가 예를 들면, 태아 검진, 부계 시험, 또는 인지 시험의 생성물과 관련하여 다른 개체의 DNA로 오염된 상황에서 사용될 수 있었다. 이들 방법이 특히 유리할 수 있는 일부 다른 상황은 암 시험의 경우일 수 있으며, 여기서 1개 또는 소수의 세포는 다량의 정상 세포 중에 존재하였다. 이들 방법의 일부로서 사용된 유전적 측정은 DNA 또는 RNA를 포함하는 특정 시료, 예를 들면, 혈액, 혈장, 체액, 뇨, 모발, 눈물, 타액, 조직, 피부, 손톱, 난할구, 배아, 양수액, 융모막 융모 시료, 대변, 담즙, 림프, 경부 점액, 정액, 또는 핵산을 포함하는 다른 세포 또는 물질을 포함하나, 이에 한정되지 않는 시료 속에서 이루어질 수 있었다. 일 구현예에서, 본원에 기술된 방법은 서열분석, 미세배열, qPCR, 디지탈 PCR, 또는 핵산을 측정하는데 사용된 다른 방법과 같은 핵산 검출 방법으로 수행할 수 있었다. 일부 이유로 이것이 바람직한 것으로 발견된 경우, 유전자자리에서 대립유전자 수 가능성의 비를 계산하고, 당해 대립유전자 비를 사용하여 본원에 기술된 방법 중의 일부와 함께 배수성 상태를 측정하여 당해 방법이 적합한지를 제공한다. 일부 구현예에서, 본원에 개시된 방법은 컴퓨터 상에서 프로세싱된 시료에서 이루어진 DNA 측정에 의하여 다수의 다형성 유전자자리에서 대립유전자 비를 계산하는 단계를 포함한다. 일부 구현예에서, 본원에 개시된 방법은 컴퓨터 상에서, 본 기재내용에 기술된 다른 개선의 어떠한 조합과 함께, 프로세싱된 시료에서 이루어진 DNA 측정에 의하여 다수의 다형성 유전자자리에서의 대립유전자 비를 계산하는 단계를 포함한다.
일부 구현예에서, 당해 방법을 사용하여 단일 세포, 소수의 세포, 2 내지 5개의 세포, 6 내지 10개의 세포, 10 내지 20개의 세포, 20 내지 50개의 세포, 50 내지 100개의 세포, 100개 내지 1,000개의 세포, 또는 소량의, 예를 들면, 1 내지 10 피코그램, 10 내지 100 피코그램, 100 피코그램 내지 1 나노그램, 1 내지 10 나노그램, 10 내지 100 나노그램, 또는 100 나노그램 내지 1 마이크로그램의 세포외 DNA를 유전형분석할 수 있다.
예시적인 RNA 발현 연구
본 발명의 다중 PCR 방법을 사용하여 유전자 발현 프로파일링 실험 동안에 평가될 수 있는 표적 유전자자리의 수를 증가시킬 수 있다. 예를 들면, 수천개의 유전자의 발현 수준을 동시에 모니터링하여 개체가 질병(예를 들면, 암)과 관련되거나 질병의 증가된 위험과 관련된 서열(예를 들면, 다형성 또는 다른 돌연변이)를 가지는지를 측정할 수 있다. 이들 방법은 질병이 있거나 없는 환자에서 채취한 시료 속에서 유전자 발현(예를 들면, 특정한 mRNA 대립유전자의 발현)을 비교함으로써 암과 같은 질병에 대한 증가되거나 감소된 위험과 관련된 서열(예를 들면, 다형성 또는 다른 돌연변이)를 확인할 수 있다. 또한, 특정한 치료, 질병, 또는 유전자 발현에 있어서 발달 단계의 효과를 측정할 수 있다. 유사하게, 이들 방법을 사용하여 이의 발현이 감염된 및 감염되지 않은 세포 또는 조직에서 유전자 발현을 비교함으로써 병원체 또는 다른 유기체에 대한 반응시 변화되는 유전자를 확인할 수 있다. 이들 방법에서 서열분석 판독물의 수는 분석되는 다형성의 빈도를 기반으로 조정함으로써 충분한 판독물이 다형성에 대해 수행되어 이들이 존재하는지를 검출하도록 할 수 있다.
일부 구현예에서, RNA(예를 들면, mRNA)를 함유하는 시료는 리버스 트랜스퍼라제(RT)를 사용하여 증폭시키며 수득되는 DNA(예를 들면, cDNA)는 DNA 폴리머라제(PCR)를 사용하여 증폭시킨다. RT 및 PCR 단계는 동일한 반응 용적 속에서 연속으로 또는 별도로 수행할 수 있다. 본 발명의 프라이머 라이브러리 중 어느 것도 당해 역 전사 폴리머라제 연쇄 반응(RT-PCR) 방법에서 사용할 수 있다. 다양한 구현예에서, 역 전사는 올리고-dT, 무작위 프라이머(randem primer), 올리고-dT와 무작위 프라이머의 혼합물, 또는 표적 유전자자리에 대해 특이적인 프라이머를 사용하여 수행된다. 오염되는 게놈 DNA의 증폭을 피하기 위해, RT-PCR에 대한 프라이머를 설계함으로써 하나의 프라이머 중의 일부가 하나의 엑손의 3' 말단에 하이브리드화하고 프라이머의 다른 부분이 인접한 엑손의 5' 말단에 하이브리드화하도록 한다. 이러한 프라이머는 스플라이싱된 mRNA로부터 합성된 cDNA에 아닐링되지만, 게놈 DNA에는 어닐링되지 않는다. 오염되는 DNA의 증폭을 검출하기 위해, RT-PCR 프라이머 쌍을 적어도 하나의 인트론을 함유하는 영역에 플랭킹하도록 설계할 수 있다. cDNA(인트론 비 함유)로부터 증폭된 생성물은 게놈 DNA(인트론 없음)로부터 증폭된 것보다 더 작다. 생성물에 있어서 크기 차이를 사용하여 오염되는 DNA의 존재를 검출한다. 일부 구현예에서 mRNA 서열만이 알려져 있는 경우, 적어도 300 내지 400개 염기쌍이 떨어져 있는 프라이머 어닐링 부위를 선택하는데, 이는 진핵 세포 DNA의 이러한 크기의 단편이 스플라이스 연결부를 함유하는 경향이 있기 때문이다. 달리는, 시료를 DNase로 처리하여 오염되는 DNA를 감퇴시킬 수 있다.
부계 시험을 위한 예시적인 방법
본 발명의 다중 PCR 방법을 사용하여 부계 시험의 정밀도를 개선시킬 수 있는데, 이는 많은 표적 유전자자리가 한번에 분석될 수 있기 때문이다(참조: 예를 들면, 이의 전문이 본원에 참조로 포함된, 2011년 12월 22일자로 출원된 미국 특허 공개 공보 제2012/0122701호). 예를 들어, 다중 PCR 방법은, 수천개의 다형성 유전자자리(예를 들면, SNP)가 본원에 기술된 PARENTAL SUPPORT 알고리즘에서 사용하기 위해 분석되도록 함으로써 주장된 부친이 태아의 생물학적 부친인지를 판별할 수 있다. 일부 구현예에서 당해 방법은 (i) 주장된 부친의 유전 물질에 있어서 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 다형성 유전자자리를 포함하는 다수의 다형성 유전자자리를 동시에 증폭시켜 제1 세트의 증폭된 생성물을 생산하는 단계; (ii) 임신한 모친의 혈액 시료에서 기원하는 DNA의 혼합 시료에서 상응하는 다수의 다형성 유전자자리를 동시에 증폭시켜 제2 세트의 증폭된 생성물을 생산하는 단계(여기서, DNA의 혼합된 시료는 태아 DNA 및 모계 DNA를 포함한다); (iii) 제1 및 제2 세트의 증폭된 생성물을 기반으로 유전형 측정을 사용하여 주장된 부친이 태아의 생물학적 부친인 가능성을 컴퓨터 상에서 측정하는 단계; 및 (iv) 주장된 부친이 태아의 생물학적 부친인 측정된 가능성을 사용하여 주장된 부친이 태아의 생물학적 부친인지를 확립하는 단계를 포함한다. 다양한 구현예에서, 당해 방법은 모친의 유전 물질에서 상응하는 다수의 다형성 유전자자리를 동시에 증폭시켜 제3 세트의 증폭된 생성물을 생산하는 단계를 포함하며; 여기서 주장된 부친이 태아의 생물학적 부친인 가능성은 제1, 제2, 및 제3 세트의 증폭된 생성물을 기반으로 한 유전형 측정을 사용하여 측정한다.
배아 특성화 및 선택을 위한 예시적인 방법
본 발명의 다중 PCR 방법을 사용하여 수천개의 표적 유전자자리를 한번에 분석하도록 함으로써 시험관내 수정을 위한 배아의 선택을 개선시킬 수 있다(참조: 예를 들면, 이의 전문이 본원에 참조로 포함된, 2008년 5월 27일자로 출원되고, 2011년 12월 22일자로 출원된 미국 특허 공개 공보 제2011/0092763호). 예를 들면, 다중 PCR 방법은 수천개의 다형성 유전자자리(예를 들면, SNP)가 본원에 기술된 PARENTAL SUPPORT 알고리즘에서 사용하기 위해 분석되도록 함으로써 시험관 수정을 위한 배아의 세트 중에서 배아를 선택하도록 할 수 있다.
일부 구현예에서, 본 발명은, 배아들의 세트에서 비롯된 각각의 배자녀 원하는 대로 발달할 상대적 가능성을 추정하는 방법을 제공한다. 일부 구현예에서, 당해 방법은 각각의 배아의 시료를 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리와 접촉시켜 각각의 배아에 대한 반응 혼합물을 생산하는 단계(여기서 시료는 각각 배아의 하나 이상의 세포에서 채취한다)를 포함한다. 일부 구현예에서, 각각의 반응 혼합물은 프라이머 연장 반응 조건에 적용시켜 증폭된 생성물을 생산한다. 일부 구현예에서, 당해 방법은 컴퓨터 상에서 증폭된 생성물을 기반으로 하여 각 배아의 적어도 하나의 세포의 하나 이상의 특성을 측정하는 단계; 및 컴퓨터 상에서 각각의 배아에 대한 적어도 하나의 세포의 하나 이상의 특성을 기반으로 하여, 각각의 배자녀 경우에 따라 발달할 상대적인 가능성을 평가하는 단계를 포함한다. 일부 구현예에서, 당해 방법은 본원에 기술된 PARENTAL SUPPORT 알고리즘과 같은 적어도 하나의 특징을 측정하는 정보학 기반 방법을 사용함을 포함한다. 일부 구현예에서, 특징은 배수성 상태를 포함한다. 일부 구현예에서, 특징은 이수성, 정배수성, 모자이크, 결염색체성(nul lsomy), 일염색체성, 편친 이염색체성(uniparental disomy), 삼염색체성, 사염색체성(tetrasomy), 이수성의 유형, 일치하지 않는 카피 오차 삼염색체성, 일치한 카피 오차 삼염색체성, 이수성의 모계 기원, 이수성의 부친 기원, 질병-결합된 유전자의 존재 또는 부재, 특정의 이수성 염색체의 염색체적 실체, 비정상적인 유전 조건, 결실 또는 중복, 특징의 가능성, 및 이의 조합을 포함한다. 특징은 염색체 1, 염색체 2, 염색체 3, 염색체 4, 염색체 5, 염색체 6, 염색체 7, 염색체 8, 염색체 9, 염색체 10, 염색체 11, 염색체 12, 염색체 13, 염색체 14, 염색체 15, 염색체 16, 염색체 17, 염색체 18, 염색체 19, 염색체 20, 염색체 21, 염색체 22, X 염색체 또는 Y 염색체, 및 이의 조합으로 이루어진 그룹 중에서 선택된 염색체와 연관될 수 있다.
예시적인 부계 진단 방법
본 발명의 다중 PCR 방법을 사용하여 태아 염색체의 배수성 상태의 측정과 같은, 부계 진단 방법을 개선시킬 수 있다. 동시에 증폭될 수 있는 다수의 표적 유전자자리를 제공하여, 보다 정밀한 측정을 달성할 수 있다.
일 구현예에서, 본 기재내용은 DNA의 혼합된 시료(즉, 태아 모친의 DNA, 및 태아의 DNA)의, 모친의, 그리고 가능하게는 또한 부계 유전 물질의 시료로 측정된 유전형 데이터에 의하여 잉태된 태아 속의 염색체의 배수성 상태를 측정하고(여기서, 당해 측정은 결합 분포 모델을 사용함으로써 부모계 유전형 데이터를 제공한 상이한 가능한 태아 배수성 상태에 대해 예측된 대립유전자 분포의 세트를 생성함으로써 수행한다); 예측된 대립유전자 분포를 혼합된 시료 속에서 측정된 실제 대립유전자 분포와 비교하며, 예측된 대립유전자 분포 패턴이 관찰된 대립유전자 분포 양식과 가장 근접하게 일치하는 배수성 상태를 선택하기 위한 생체외 방법을 제공한다. 일 구현예에서, 혼합된 시료는 모계 혈액, 또는 모계 혈청 또는 혈장에서 채취한다. 일 구현예에서, DNA의 혼합된 시료는 표적 유전자자리(예를 들면, 다수의 다형성 유전자자리)에 우선적으로 농축될 수 있다. 일 구현예에서, 우선적 농축은 대립유전자 편향을 최소화시키는 방식으로 수행된다. 일 구현예에서, 본 기재내용은 다수의 유전자자리에서 우선적으로 농축됨으로써 대립유전자 편향이 낮도록 하는 DNA의 조성에 관한 것이다. 일 구현예에서, 대립유전자 분포(들)은 혼합된 시료의 DNA를 서열분석함으로써 측정한다. 일 구현예에서, 결합 분포 모델은, 대립유전자가 바이어스적 양식으로 분포될 것으로 추측한다. 일 구현예에서, 예측된 결합 대립유전자 분포의 세트는, 예를 들면, International HapMap Consortium의 데이터를 사용하여 다양한 공급원의 현존하는 재조합 빈도를 고려하면서, 유전적으로 결합된 유전자자리에 대해 생성한다.
일 구현예에서, 본 기재내용은 구체적으로 DNA 혼합물 에서 측정된 유전형 데이터에서 다수의 다형성 유전자자리에서 대립유전자 측정을 관찰함으로써 태아의 이수성 상태를 측정하는, 비-침입성 부계 진단(NPD) 방법을 제공하며, 여기서 특정의 대립유전자 측정은 이수성 태아의 지표인 반면, 다른 대립유전자 측정은 정배수성 태아의 지표이다. 일 구현예에서, 유전형 데이터는 모계 혈장의 DNA 혼합물을 서열분석하여 측정한다. 일 구현예에서, DNA 시료는, 이의 대립유전자 분포가 계산되는 다수의 유전자자리에 상응하는 DNA 분자내에 우선적으로 농축될 수 있다. 일 구현예에서 모친의 유전물질만을 유일하게 또는 대부분 포함하는 DNA의 시료 및 가능하게는 또한 부계 유전물질만을 유일하게 또는 대부분 포함하는 DNA의 시료를 측정한다. 일 구현예에서, 평가된 태아 분획과 함께 한쪽 또는 양쪽 부모의 유전적 측정을 사용하여 태아의 상이한 가능하게 잠재하는 유전 상태에 상응하는 다수의 예측된 대립유전자 분포를 생성하며; 예측된대립유전자 분포는 가설로 명명될 수 있다. 일 구현예에서, 모계 유전 데이터는 천연에서 배타적으로 또는 거의 배타적으로 모인 유전 물질을 측정함에 의해 측정되지 않으며, 오히려, 이는 모계 및 부계 DNA의 혼합물을 포함하는 모계 혈장에서 이루어진 유전적 측정에 의하여 평가된다. 일부 구현예에서, 가설은 하나 이상의 염색체에서 태아의 배수성을 포함할 수 있으며, 태아내 염색체의 분절은 부모, 및 이의 조합으로부터 유전되었다. 일부 구현예에서, 태아의 배수성 상태는 관찰된 대립유전자 측정을 상이한 가설과 비교하고(여기서, 가설의 적어도 일부는 상이한 배수성 상태에 상응한다), 대부분 관찰된 대립유전자 측정이 진실인 경향이 있는 가설에 상응한는 배수성 상태를 선택함으로써 측정된다. 일 구현예에서, 당해 방법은, 유전자자리가 동종접합성 또는 이형접합성인 것에 상관없이 일부 또는 모든 측정된 SNP의 대립유전자 측정 데이터를 사용함을 포함하므로 단지 이형접합성인 유전자자리의 대립유전자를 사용함을 포함하지 않는다. 당해 방법은, 유전 데이터가 단지 하나의 댜형성 유전자자리에 관한 것인 상황에 적절하지 않을 수 있다. 당해 방법은, 유전 데이터가 표적 염색체에 대해 10개 이상의 다형성 유전자자리 또는 20개 이상의 다형성 유전자자리에 대한 데이터를 포함하는 경우 특히 유리한다. 당해 방법은, 유전 데이터가 표적 염색체에 대해 50개 이상의 다형성 유전자자리, 표적 염색체에 대해 100개 이상의 다형성 유전자자리 또는 200개 이상의 다형성 유전자자리를 포함하는 경우에 특히 유리하다. 일부 구현예에서, 유전 데이터는 표적 염색체에 대해 500개 이상의 다형성 유전자자리, 표적 염색체에 대해 1,000개 이상의 다형성 유전자자리, 2,000개 이상의 다형성 유전자자리, 또는 5,000개 이상의 다형성 유전자자리를 포함할 수 있다.
일 구현예에서, 본원에 개시된 방법은 다형성 유전자자리에서 각각의 대립유전자의 독립된 관찰의 수의 정량적인 척도를 생성한다. 이는 2개의 대립유전자의 비에 대한 정보를 제공하지만 하나의 대립유전자의 독립된 관찰의 수를 정량화하지 않는 미세배열 또는 정량적 PCR과 같은 대부분의 방법과는 상이하다. 독립된 관찰의 수에 관한 정량적 정보를 제공하는 방법을 사용하면, 배수성 계산에 당해 비 만이 이용되지만, 자체에 의한 정량적 정보는 유용하지 않다. 독립된 관찰의 수에 대한 정보를 보유하는 중요성을 설명하기 위해, 2개의 대립유전자, A 및 B를 지닌 시료 유전자자리를 고려한다. 제1의 실험에서 20개의 A 대립유전자 및 20개의 B 대립유전자가 관찰되며, 제2 실험에서 200개의 A 대립유전자 및 200개의 B 대립유전자가 관찰된다. 실험 둘 모두에서, 비 (A/(A+B))는 0.5와 동일하지만, 제2의 실험은 A 또는 B 대립유전자의 빈도의 특정성에 대해 첫번째보다 더 많은 정보를 제공한다. 다른 것에 의한 일부 방법은 개체 대립유전자의 대립유전자 비 (채널 비)(즉, xi/yi)를 평균내거나 합하는 것을 포함하며 이를 참조 염색체에 대해 비교하거나 당해 비가 특정한 상황에서 작동하는 것으로 예측되는 방법에 관한 법칙을 사용함으로써, 당해 비를 분석한다. 대립유전자 칭량은 이러한 방법을 내포하지 않으며, 여기서 각각의 대립유전자에 대한 동일한 양의 PCR 생성물에 대해 보증할 수 있고 모든 대립유전자는 동일한 방식으로 작동할 수 있음이 보증된다. 이러한 방법은 다수의 장점을 가지며, 보다 중요하게는, 당해 기재내용에서 어딘가에 기술된 다수의 개선의 사용을 방해한다.
일 구현예에서, 본원에 기대된 방법은 이염색체에서 예측된 대립유전자 빈도 분포 및 감수분열 I 동안의 비분리(nondisjunction), 감수분열 II 동안의 비분리, 및/또는 태아 발달 초기의 유사분열 동안의 비분리로부터 생성되는 삼염색체성의 경우에 예측될 수 있는 다수의 대립유전자 빈도 분포를 전적으로 모델로 한다. 이것이 중요한 이유를 나열하기 위해, 교차가 없는 경우를 상상하면: 감수분열 I 동안의 비분리는, 2개의 상이한 동족체가 하나의 부모로부터 유전되는 삼염색체성을 생성할 수 있으며; 대조적으로 감수분열 II 동안 또는 태아 발달의 초기의 유사분열 동안의 비분리는 하나의 부모로부터 동일한 동족체의 2개 카피를 생성할 수 있다. 각각의 시나리오는 각각의 다형성 유전자자리에서 및 또한 유전적 연결로 인해, 공동으로 고려된 모든 유전자자리에서 상이한 예측된 대립유전자 빈도를 생성할 수 있다. 동족체 사이의 유전 물질의 교환을 초래하는 교차는 유전 양식을 보다 복잡하게 하며; 일 구현예에서, 본 발명은 유전자자리 사이의 물리적 거리 외에 재조합 비 정보를 사용함으로써 이를 수용한다. 일 구현예에서, 감수분열 I 비분리와 감수분열 II 또는 유사분열 비분리 사이의 개선된 구별을 가능하도록 하기 위해, 본 발명은, 동원체에서부터의 거리가 증가하면서 모델내로 증가하는 교차 가능성을 포함시킨다. 감수분열 II 및 유사분열 비분리는, 유사분열 비분리가 하나의 동족체의 동일하거나 거의 동일한 카피를 생성하지만 2개의 동족체는 배우자형성 동안 하나 이상의 교차로 인하여 흔히 상이한 감수분열 II 비분리 현상을 수반함을 나타낸다는 사실로 인하여 구별될 수 있다.
일부 구현예에서, 본원에 개시된 방법은 관찰된 대립유전자 측정을 가능한 태아 유전적 이수성에 상응하는 이론적 가설과 비교하는 단계를 포함하며, 이형접합성 유전자자리에서 대립유전자의 비를 정량화하는 단계는 포함하지 않는다. 유전자자리의 수가 약 20개 이하인 경우, 이형접합성 유전자자리에서 대립유전자가 비를 정량화하는 단계를 포함하는 방법을 사용하여 이룬 배수성 측정 및 가능한 대아 유전 상태에 상응하는 이론적인 대립유전자 분포 가설에 대해 관찰된 대립유전자 측정을 비교하는 단계를 포함하는 방법을 사용하여 이룬 배수성 측정은 유사한 결과를 제공한다. 그러나, 유전자자리의 수가 50개 초과인 경우, 이들 2개의 방법은 유의적으로 상이한 결과를 제공하는 경향이 있는데; 여기서 유전자자리의 수가 400 초과, 1,000초과 또는 2,000 초과인 경우, 이들 2개의 방법은 크게 유의적으로 상이한 결과를 제공하는 경향이 매우 크다. 이러한 차이는, 각각의 대립유전자의 크기를 독립적으로 측정하지 않고 이형접합성 유전자자리에서 대립유전자의 비를 정량화하는 단계 및 당해 비를 합하거나 평균을 내는 단계를 포함하는 방법은 결합 분포 모델을 사용하고/하거나, 연결 분석을 수행하고/하거나, 바이어스 분포 모델을 사용하고/하거나 진전된 다른 통계적 기술을 사용함을 포함하는 기술의 사용을 배제하지만, 관찰된 대립유전자 측정을 가능한 태아 유전 상태에 상응하는 이론적인 대립유전자 분포 가설과 비교하는 단계를 포함하는 방법을 사용하는 것은 측정의 정밀도를 실질적으로 증가시킬 수 있는 이러한 기술을 사용할 수 있다는 사실에 기인한다.
일 구현예에서, 본원에 개시된 방법은 관찰된 대립유전자 측정의 분포가 결합 분포 모델을 사용한 정배수성 또는 이수성 태아의 지표인지를 측정하는 단계를 포함한다. 결합 분포 모델의 사용은, 수득되는 측정이 유의적으로 보다 높게 정밀하다는 점에서 다형성 유전자자리를 독립적으로 처리함으로써 이형접합성 비율을 측정하는 방법보다 상이하고 유의적으로 개선되어 있다. 어느 특정 이론에 얽메이지 않고, 이들이 보다 정밀한 한가지 이유는, 결합 분포 모델이 SNP와, 태아로 성장하는 배아를 형성한 생식세포를 발생시킨 감수분열 동안에 발생한 교차 가능성 사이의 연결을 고려한다는 것이라고 여겨진다. 하나 이상의 가설에 대한 대립유전자 측정의 예측된 분포를 생성하는 경우 연결 개념을 사용하는 목적은, 이것이 연결을 사용하지 않는 경우보다 현저히 우수하게 현실성에 상응하는 예측된 대립유전자 측정 분포를 생성하도록 한다는 것이다. 예를 들면, 2개의 SNP가 존재한다고 상상할 때, 1 및 2는 서로 인접하여 위치하고, 모는 동족체 1에서 SNP 1의 A 및 SNP 2의 A에 있으며, 동족체 1에서 SNP 1의 B 및 SNP 2의 B에 있다. 부친이 동족체 둘 모두에서 SNP 둘 모두에 대해 A에 있고, B가 태아 SNP 1에 대해 측정되는 경우, 이는, 동족체 2가 태아에 의해 유전되었므로, SNP 2에서 태아에 존재하는 B의 매우 높은 가능성이 존재함을 나타낸다. 연관(linkage)을 고려한 모델은 이를 예측할 수 있는 반면, 연관을 고려하지 않는 모델은 이를 고려할 수 없다. 그렇지 않으면, 모친이 SNP1에서 AB 이고 SNP 2 근처에서 AB였던 경우, 당해 위치에서 모계 삼염색체성에 상응하는 2개의 가설을 사용할 수 있었는데 - 하나는 일치하는 카피 오차(감수분열 II 또는 초기 태아 발달 시 유사분열)를 포함하고, 하나는 일치하지 않은 카피 오차(감수분열 I에서 비분리)를 포함한다. 일치하는 카피 오차 삼염색체성의 경우에, 태자녀 SNP 1에서 모친으로부터 AA를 유전받은 경우, 당해 태아는 SNP 2에서 모친으로부터 AA 또는 BB를 유전받지만 AB는 유전받지 않을 가능성이 훨씬 더 크다. 일치하지 않는 카피 오차의 경우에, 태아는 SNP 둘 모두에서 모친으로부터 AB를 유전받을 수 있다. 연관을 고려하여 배수성 요청 방법으로 달성한 대립유전자 분포 가설은 이러한 예측을 이룰 수 있으므로, 연관을 고려하지 않는 배수성 요청 방법보다 고려할만하게 높은 정도로 실제 대립유전자 측정에 상응한다. 연결 접근법은, 대립유전자 비를 계산하고 이들 대립유전자 비를 합하는 것에 의존하는 방법을 사용하는 경우 불가능함에 주목한다.
관찰된 대립유전자 측정을 가능한 태아 유전 상태에 상응하는 이론적 가설과 비교하는 단계를 포함하는 방법을 사용한 배수성 측정은 보다 더 정밀하다고 여겨지는 한가지 이유는, 서열분석을 사용하여 대립유전자를 측정하는 경우에, 당해 방법이, 판독물의 전체 수가 다른 방법보다 적은 경우 대립유전자의 데이터에서 보다 많은 정보를 모을 수 있기 때문인데; 예를 들어, 대립유전자를 계산하여 합하는 단계에 의존하는 방법은 불균형적으로 칭량된 확률적 노이즈를 생산할 수 있다. 예를 들면, 서열분석을 사용하여 대립유전자를 측정함을 포함한 경우, 및 유전자자리의 세트가 존재하였고 단지 5개의 서열 판독물이 각각의 유전자자리에 대해 검출되었던 경우를 상상한다. 일 구현예에서, 대립유전자 각각에 대해, 데이터를 가설된 대립유전자 분포와 비교하여 서열 판독물의 수에 따라 칭량함으로써 이들 측정에 의한 데이터를 적절하게 칭량학 전체 측정에 포함시킬 수 있다. 이는 이형접합성 유전자자리에서 대립유전자의 비를 정량화하는 단계를 포함한 방법과 대조적인데, 그 이유는, 당해 방법이 가능한 대립유전자 비로서 0%, 20%, 40%, 60%, 80% 또는 100%의 비 만을 계산할 수 있으며; 이들 중 어느 것도 예측된 대립유전자 비에 근접할 수 없기 때문이다. 후자의 경우에, 계산된 대립유전자 비는 불충분한 판독물로 인하여 폐기되어야 할 수 있거나 부적절한 칭량을 가질 수 있고 확률적 노이즈를 측정에 도입함으로써 측정의 정밀도를 감소시킬 수 있다. 일 구현예에서, 개개의 대립유전자 측정은 독립된 측정으로 처리될 수 있으며, 여기서 동일한 유전자자리에서 대립유전자에 대해 이루어진 측정 사이의 관계는 상이한 유전자자리에서 대립유전자에 대해 이루어진 측정 사이의 관계와 상이하지 않다.
일 구현예에서, 본원에 개시된 방법은 관찰된 대립유전자 측정의 분포가 이염색체성(RC 방법으로 명명됨)인 것으로 예측되는 참조 염색체에서 관찰된 대립유전자 측정에 대해 어떠한 미터법도 비교하지 않고 정배수성 또는 이수성 태아의 지표인지를 측정하는 단계를 포함한다. 이는 하나 이상의 예측된 이염색체성 참조 염색체에 대해 예측된 염색체에서 기원하여 무작위적으로 서열분석된 단편의 비를 평가함으로써 이수성을 검출하는 셧건 서열분석을 사용하는 방법과 같은 방법보다 유의적으로 개선되어 있다. 이러한 RC 방법은, 예측된 이염색체성 참조 염색체가 실제로 이염색체성이 아닌 경우 부정확한 결과를 생성한다. 이는, 이수성이 단일 염색체의 삼염색체 보다 더 실질적이거나 태자녀 삼염색체성이고 모든 상염색체가 삼염색체성인 경우에서 발생할 수 있다. 여성 삼배체(69, XXX) 태아의 경우, 이염색체성 염색체는 실제로 전혀 존재하지 않는다. 본원에 기술된 방법은 참조 염색체를 필요로 하지 않으며 여성 삼배체 태아에서 삼염색체성 염색체를 정확하게 확인할 수 있다. 각각의 염색체, 가설, 자녀 분획 및 노이즈 수준의 경우, 결합 분포 모델은 참조 염색체 데이터, 전체 자녀 분획 평가, 또는 고정된 참조 가설 중의 어느 것 없이도 적합하게 될 수 있다.
일 구현예에서, 본원에 개시된 방법은 다형성 유전자자리에서 대립유전자를 관찰하는 방법을 사용하여 선행 기술의 방법보다 더 정밀하게 태아의 배수성 상태를 측정함을 입증한다. 일 구현예에서, 당해 방법은 표적화된 서열분석을 사용하여 혼합된 모-태아 유전형을 수득하고 임의로 다수의 SNP에서 모계 및/또는 부계 유전형을 수득하여 상이한 가설하에 다양한 예측된 대립유전자 빈도 분포를 우선 확립한 후, 모-태아 혼합물에서 수득된 정량적인 대립유전자를 관찰하여 어느 가설이 데이터에 가장 잘 맞는지를 평가하며, 여기서 데이터에 가장 잘 맞는 가설에 상응하는 유전 상태는 정확한 유전 상태로 불린다. 일 구현예에서, 본원에 개시된 방법은 또한 요청된 유전 상태가 정확한 유전 상태인 신뢰를 생성하기 위한 적합성 정도를 사용한다. 일 구현예에서, 본원에 개시된 방법은 상이한 부모 내용을 갖는 유전자자리에 대해 발견된 대립유전자의 분포를 분석하는 알고리즘을 사용하는 단계, 및 관찰된 대립유전자 분포를 상이한 부모 내용(상이한 부모계 유전형 양식)에 대해 상이한 배수성 상태를 위한 예측된 대립유전자 분포와 비교하는 단계를 포함한다. 이는 혼합된 모-태아 시료 중 각각의 유전자 자리의 독립된 예의 수를 평가할 수 있도록 하는 방법을 사용하지 않는 방법과 상이하며 이보다 개선되어 있다. 일 구현예에서, 본원에 개시된 방법은 관찰된 대립유전자 측정의 분포가, 모가 이형접합성인 경우의 유전자자리에서 측정된 관찰된 대립유전자 분포를 사용한 정배수성 또는 이수성 태아의 지표인지를 측정하는 단계를 포함한다. 이는, DNA가 우선적으로 농축되어 있지 않거나 특정한 표적 개체에 대해 고도의 정보인 것으로 알려져 있지 않은 유전자자리에 대해 우선적으로 농축된 경우, 이로 인해 배수성 측정에 있어서 서열 데이터들의 세트에 있는 약 2배나 되는 많은 유전적 측정 데이터를 사용할 수 있어 보다 정밀한 측정 결과를 내기 때문에, 모친이 이형접합성인 유전자자리에서 관찰된 대립유전자 분포를 사용하지 않는 방법과는 상이하고 이보다 개선되었다.
일 구현예에서, 본원에 개시된 방법은, 각각의 유전자자리에서 대립유전자 빈도가 천연적으로 다항(그래서 SNP가 이중대립유전자인 경우에 바이어스임)임을 추정하는 결합 분포 모델을 사용한다. 일부 구현예에서, 결합 분포 모델은 베타-이항 분포를 사용한다. 서열분석과 같은 측정 기술을 사용하는 경우, 각각의 유전자자리에 존재하는 각각의 대립유전자에 대한 정량적인 척도를 제공하며, 바이어스 모델은 각각의 유전자자리 및 대립유전자 빈도를 직면한 정도 및 빈도가 추정될 수 있는 신뢰에 적용시킬 수 있다. 대립유전자 비로부터 배수성 요청을 생성하는 당해 분야에서 공지된 방법 또는 정량적인 대립유전자 정보가 폐기되는 방법을 사용하여, 관찰된 비에서의 특정성을 추정할 수 없다. 본 발명은 대립유전자 비를 계산하고 이들 비를 합하여 배수성 요청을 이루는 방법과는 상이하고 개선되어 있는데, 이는, 특정한 유전자자리에서 대립유전자 비를 계산한 후 이들 비를 합하는 단계를 포함하는 어떠한 방법도, 어떠한 소정의 대립유전자 또는 유전자자리의 DNA 양의 척도인 측정된 강도 또는 계수가 정규 방식(Gaussian fashion)으로 분포될 것으로 반드시 추정되기 때문이다. 본원에 개시된 방법은 대립유전자 비율을 계산하는 단계를 포함하지 않는다. 일부 구현예에서, 본원에 개시된 방법은 다수의 유전자자리에서 각각의 대립유전자의 관찰의 수를 모델에 포함시키는 단계를 포함할 수 있다. 일부 구현예에서, 본원에 개시된 방법은 예측된 분포 자체를 계산하는 단계, 대립유전자 측정의 가우시안 분포를 추정하는 어떠한 모델보다 더 정밀할 수 있는 결합 바이어스 분포를 사용하도록 하는 단계를 포함할 수 있다. 바이어스 분포 모델이 가우시안 분포보다 유의적으로 더 정밀한 가능성은, 유전자자리의 수가 증가함에 따라 증가한다. 예를 들어, 20개 미만의 유전자자리가 질의되는 경우, 바이어스 분포 모델이 유의적으로 더 우수할 가능성은 낮다. 그러나, 100개 이상, 또는 특히 400개 이상, 또는 특히 1,000개 이상, 또는 특히 2,000개 이상의 유전자자리가 사용되는 경우, 바이어스 분포 모델은 가우시안 분포 모델보다 유의적으로 더 정밀한 매우 높은 가능성을 가질 것이므로 보다 정밀한 배수성 측정을 야기한다. 바이어스 분포 모델이 가우시안 분포보다 유의적으로 더 정밀하다는 가능성은 또한 각각의 유전자자리에서 관찰의 수가 증가함에 따라 증가한다. 예를 들어, 10개 미만의 명확한 서열이 각각의 유전자자리에서 관찰된 경우, 바이어스 분포 모델이 유의적으로 보다 우수할 가능성은 낮다. 그러나, 50개 이상의 서열 판독물, 또는 특히 100개 이상의 서열 판독물, 또는 특히 200개 이상의 서열 판독물, 또는 특히 300개 이상의 서열 판독물을 각각의 유전자자리에 대해 사용되는 경우, 바이어스 분포 모델은 가우시안 분포 모델보다 유의적으로 더 정밀한 매우 높은 가능성을 가질 것이므로, 보다 정밀한 배수성 측정을 야기한다.
일 구현예에서, 본원에 개시된 방법은 DNA 시료 속에서 각각의 유전자자리에서 각각의 대립유전자의 예의 수를 측정하기 위해 서열분석을 사용한다. 각각의 서열분석 판독물은 구체적인 유전자자리에 맵핑하고 이원성 서열 판독물로서 처리할 수 있으며; 달리는, 판독물의 실체 및/또는 맵핑의 가능성을 서열 판독물의 일부로서 포함시켜 확률론적 방법의 서열 판독물, 즉, 소정의 유전자자리에 맵핑하는 서열 판독물의 가능한 정수 또는 분수를 생성할 수 있다. 2진 계수 또는 수의 확률론을 사용하여 각각의 측정 세트에 대해 이원 분포를 사용하여, 신뢰 구간이 계수의 수 주변에서 계산되도록 허용하는 것이 가능하다. 이원 분포를 사용하는 능력은 보다 정확한 배수성 평가 및 보다 정밀한 신뢰 구간이 계산되도록 한다. 이는 존재하는 대립유전자의 양을 측정하기 위해 강도를 사용하는 방법, 예를 들면, 미세배열을 사용하는 방법, 또는 형광성 판독기를 사용하여 측정함으로써 전기영동 밴드에서 형광적으로 태그된 DNA의 강도를 측정하는 방법과는 상이하며 이보다 개선되어 있다.
일 구현예에서, 본원에 개시된 방법은 현재의 데이터 세트의 측면을 사용하여 당해 데이터 세트에 대해 평가된 대립유전자 빈도 분포에 대한 매개변수를 측정한다. 이는 현재 예측된 대립유전자 빈도 분포, 또는 가능하게 예측된 대립유전자 비에 대한 매개변수를 설정하기 위해 데이터의 훈련 세트 또는 데이터의 선행 세트를 이용하는 방법보다 개선되어 있다. 이는, 수집 및 모든 유전 시료의 측정에 포함된 상이한 세트의 조건이 존재하므로, 현재의 데이터의 세트에서 비롯된 데이터를 사용하여 이러한 시료에 대한 배수성 측정시 사용되어야 하는 결합 분포 모델에 대한 매개변수를 측정하는 방법이 보다 정밀하게 되는 경향이 있을 것이기 때문이다.
일 구현예에서, 본원에 개시된 방법은, 관찰된 대립유전자 측정의 분포가 최대 확률 기술을 사용하는 정배수성 또는 이수성 태아의 지표인지를 측정함을 포함한다. 최대 확률 기술의 사용은, 수득되는 결정인자가 유의적으로 보다 높은 정밀도로 이루어질 것이라는 점에서 단일의 가설 거부 기술을 사용하는 다른 방법과는 상이하고 이보다 유의적으로 개선되어 있다. 하나의 이유는, 단일 가설 거부 기술이 2개 보다는 하나의 측정 분포 만을 기반으로 하여 컷오프 한계(cut off threshold)를 설정하기 때문이며, 이는, 당해 한계가 일반적으로 최적이 아님을 의미한다. 다른 이유는, 최대 확률 기술이 각각의 개개 시료의 특정한 특징과는 상관없이 모든 시료에 대해 사용될 컷오프 한계를 측정하는 대신 각각의 개개 시료에 대한 컷오프 역치의 최적화를 허용하기 때문이다. 다른 이유는, 최대 확률 기술의 사용이 각각의 배수성 요청에 대한 신뢰도의 계산을 허용하기 때문이다. 각각의 요청에 대해 신뢰도 계산을 이루는 능력은, 참여자가 어떠한 요청이 정밀한지, 및 어떤 것이 보다 더 잘못된 것인지를 알도록 한다. 일부 구현예에서, 광범위한 방법을 최대 확률 평가 기술과 합하여 배수성 요청의 정밀도를 향상시킬 수 있다. 일 구현예에서, 최대 확률 기술은 미국 특허 제7,888,017호에 기술된 방법과 함께 사용될 수 있다. 일 구현예에서, 최대 확률 기술은 혼합된 시료 속에서 DNA를 증폭시키기 위해 표적화된 PCR 증폭을 사용한 후 서열분석 및 2011년 몬트리올에서 2011 사람 유전학 국제 회의(the International Congress of Human Genetics 2011)에서 나타낸 바와 같은 TANDEM DIAGNOSTICS에 의해 사용된 것과 같은 판독물 계수 방법을 사용한 분석을 사용하는 방법과 함께 사용될 수 있다. 일 구현예에서, 본원에 개시된 방법은 혼합된 시료 속에서 DNA의 태아 분획을 평가하는 단계 및 배수성 요청 및 배수성 요청의 신뢰 둘 모두를 계산하기 위해 이러한 평가를 사용하는 단계를 포함한다. 이는 둘 모두 충분한 태아 분획에 대한 스크리닝으로써, 이후에 태아 분획을 고려하지 않거나 요청에 대해 신뢰 계산을 생산하지 않는 단일의 가설 거부 기술을 사용하여 이룬 배수성 요청에 의해 평가된 태아 분획을 사용하는 방법과는 상이하고 구별된다.
일 구현예에서, 본원에 개시된 방법은 데이터에 대한 가능성이 노이지(noisy)가 되고 각각의 측정에 대해 활률을 접목시킴으로써 오차를 포함하도록 하는 가능성을 고려한다. 첨부된 확률적 평가를 지닌 측정 데이터를 사용하여 이룬 가설들의 세트에서 정확한 가설을 선택하는 최대 확률 기술의 사용은, 부정확한 측정이 중지될 것이고, 정확한 측정이 배수성 요청을 야기하는 계산에 사용될 것이라는 가능성이 보다 더 있도록 한다. 보다 정밀하도록 하기 위해, 당해 방법은 배수성 측정시 부정확하게 측정된 데이터의 영향을 체계적으로 감소시킨다. 이는, 모든 데이터가 동등하게 정확한 것으로 평가되는 방법 또는 멀리 떨어진 데이터가 배수성 요청을 야기하는 계산에서 독단적으로 배제되는 방법보다 개선되어 있다. 채널 비 측정(channel ratio measurement)을 사용하는 기존의 방법은 개개 SNP 채널 비를 평균냄으로써 당해 방법을 다수의 SNP로 확장시키도록 요청한다. SNP 품질, 및 판독물의 관찰된 깊이를 기반으로 하는 예측된 측정 변이에 의해 개개 SNP를 칭량하는 것은 수득되는 통계의 정밀도를 감소시키지 않으며, 특히 경계선의 경우에 배수성 요청의 정밀도의 유의적인 감소를 초래한다.
일 구현예에서, 본원에 개시된 방법은, 어느 SNP 또는 다른 다형성 유전자자리가 태아에서 이형접합성인지의 지식을 예측하지 않는다. 당해 방법은, 배수성 요청이, 부계 유전형 정보가 이용가능하지 않는 경우에서 이루어질 수 있도록 한다. 이는, 표적에 대한 유전자자리를 적절하게 선택하거나, 혼합된 태아/모계 DNA 시료에서 이루어진 유전적 측정을 해석하기 위하여 SNP가 이형접합성인 지식이 먼저 알려져야만 하는 방법보다 개선되어 있다.
본원에 기술된 방법은, 소량의 DNA가 이용가능하거나, 태아 DNA의 퍼센트가 낮은 경우의 시료에서 사용하는 경우에 특히 유리하다. 이는, 소량의 DNA만 이용가능한 경우 발생하는 상응하게 보다 높은 대립유전자 드롭아웃 비율 및/또는 태아 DNA의 퍼센트가 태아 및 모계 DNA의 혼합된 시료 속에서 낮은 경우 상응하게 더 높은 태아 대립유전자 드롭아웃 비율에 기인한다. 큰 퍼센트의 대립유전자가 표적 개체에 대해 측정되지 않았음을 의미하는, 높은 대립유전자 드롭아웃 비율은 불량하게 정밀한 태아 분획 계산, 및 불량하게 정밀한 배수체 측정을 초래한다. 본원에 개시된 방법은 SNP 사이의 유전 양식에 있어서 연관을 고려하는 결합 분포 모델을 사용하므로, 유의적으로 보다 정밀한 배수성 측정이 이루어질 수 있다. 본원에 기술된 방법은, 혼합물 속에서 태아 상태인 DNA의 분자의 퍼센트가 40% 미만, 30% 미만, 20% 미만, 10% 미만, 8% 미만, 및 심지어 6% 미만인 경우에 정밀한 배수체 측정이 이루어질 수 있도록 한다.
일 구현예에서, 개체의 DNA를 관련된 개체의 DNA와 합하는 경우 측정을 기반으로 개체의 배수성 상태를 측정하는 것이 가능하다. 일 구현예에서, DNA의 혼합물은 모계 혈장에서 발견된 자유로이 부유하는 DNA이며, 이는 공지된 핵형 및 공지된 유전형을 지닌 모친의 DNA를 포함할 수 있으며, 공지되지 않은 핵형 및 공지되지 않은 유전형을 지닌, 태아의 DNA와 혼합될 수 있다. 하나 또는 양쪽 부모의 공지된 유전형 정보를 사용하여 상이한 배수성 상태, 각 부모에서 태아까지의 상이한 염색체 분포, 그리고 선택적으로, 혼합물의 상이한 태아 DNA 분획에 대한 혼합된 시료의 DNA의 다수의 잠재적인 유전 상태를 예측하는 것이 가능하다. 각각의 잠재적인 조성은 가설로 언급될 수 있다. 이후에, 태아의 배수성 상태는 실제 측정을 찾아서, 어느 잠재적인 조성이 관찰된 데이터를 가장 잘 제공하는 가능성이 있는지를 측정함으로써 측정할 수 있다.
상기 의견의 추가 논의는 본 서류 어딘가에서 찾을 수 있다.
비- 칩입성 태아 진단( NPD )
비-침입성 태아 진단의 공정은 다수의 단계를 포함한다. 이들 단계들 중 일부는 (1) 태아에서 유전 물질을 수득하는 단계; (2) 혼합된 시료 속에 존재할 수 있는 태아의 유전물질을 생체외(ex vivo)에서 농축시키는 단계; (3) 유전 물질을 생체외에서 증폭시키는 단계; (4) 유전 물질 속에서 특정한 유전자자리를 생체외에서 우선적으로 농축시키는 단계; (5) 유전 물질을 생체외에서 측정하는 단계; 및 (6) 컴퓨터 상에서 및 생체외에서 유전형 데이터를 분석하는 단계를 포함할 수 있다. 이들 6개 및 다른 관련 단계를 실시하는 것을 줄이는 방법이 본원에 기술되어 있다. 방법 단계들 중 적어도 일부는 신체에 직접 적용되지 않는다. 일 구현예에서, 본 기재내용은 신체에서 분리되어 떨어진 조직 및 다른 생물학적 물질에 적용된 치료 및 진단 방법에 관한 것이다. 당해 방법 단계들 중 적어도 일부는 컴퓨터 상에서 실행된다.
본원의 일부 구현예는, 임상의가 모에 잉태중인 태아의 유전 상태를 비-칩임성 방식으로 측정하도록 함으로써 자녀의 건강을 태아의 유전 물질의 수집에 의해 위험에 처해지지 않도록 하고, 모가 침입성 과정을 겪을 필요가 없도록 한다. 또한, 특정의 측면에서, 본 기재내용은 태아 유전 상태가, 예를 들면, 산전 건강관리예 광범위하게 사용되는, 삼중 시험(triple test)와 같은, 비-침입성 모계 혈청 분석계 스크리닝보다 높은 정밀도, 유의적으로 더 높은 정밀도로 측정되도록 한다.
본원에 개시된 방법의 높은 정밀도는 본원에 기술된 바와 같은, 유전형 데이터의 분석에 대한 정보학 접근법의 결과이다. 현대의 기술적 진보는 고 배출 서열분석 및 유전형 배열과 같은 방법을 사용하여 유전 시료의 다량의 유전 정보를 측정하는 능력을 생성하여 왔다. 본원에 개시된 방법은, 임상의가 다량의 데이터를 이용가능하게 하는 보다 큰 장점을 취하도록 하며, 태아 유전 상태의 보다 정밀한 진단이 되도록 한다. 다수의 구현예의 세부사항이 하기 제공된다. 상이한 구현예는 상술한 단계의 상이한 조합을 포함할 수 있다. 상이한 단계의 상이한 구현예의 다양한 조합을 상호교환적으로 사용할 수 있다.
일 구현예에서, 혈액 시료를 임신한 모에서 취하여, 모체 기원의 DNA 및 태아 기원의 DNA 둘다의 혼합물을 함유하는, 모계 혈액의 혈장 속의 자유로이 부유하는 DNA를 분리하여 태아의 배수성 상태를 측정하는데 사용한다. 일 구현예에서, 본원에 개시된 방법은 다형성 대립유전자에 상응하는 DNA의 혼합물 속의 DNA 서열을, 대립유전자 비 및/또는 대립유전자 분포가 농축시 대부분 지속적으로 잔존하도록 하는 방식으로 우선적으로 농축시킴을 포함한다. 일 구현예에서, 본원에 개시된 방법은 고 효율의 표적화된 PCR 계 증폭을 포함함으로써, 매우 높은 퍼센트의 수득되는 분자가 표적화된 유전자자리에 상응하도록 한다. 일 구현예에서, 본원에 개시된 방법은 모체 기원의 DNA, 및 태아 기원의 DNA 둘 모두를 함유하는 DNA의 혼합물을 서열분석함을 포함한다. 일 구현예에서, 본원에 개시된 방법은 모에서 잉태중인 태아의 배수성 상태를 특정하기 위해 측정된 대립유전자 분포를 사용하는 단계를 포함한다. 일 구현예에서, 본원에 개시된 방법은 측정된 배수성 상태를 임상의에게 보고하는 단계를 포함한다. 일 구현예에서, 본원에 개시된 방법은 임상의 행동, 예를 들면, 융모막 융모 시료 채취 또는 양수 진단과 같은 후속적인 침입성 시험을 수행하는 단계, 삼염색체성 개체의 출생 또는 삼염색체성 태아의 임신 중절수술을 준비하는 단계를 포함한다.
본 출원은 2006년 11월 28일 출원된 미국 실용신안 출원 일련번호 제 11/603,406호(미국 공개 공보 제20070184467호); 2008년 3월 17일자로 출원된 미국 실용신안 출원 일련번호 제12/076,348호(미국 공개 공보 제20080243398호); 2009년 8월 4일자로 출원된, PCT 출원 일련번호 제PCT/US09/52730호(PCT 공보 제WO/2010/017214호); 2010년 9월 30일자로 출원된 PCT 출원 일련번호 제PCT/US10/050824호(PCT 공보 제WO/2011/041485호), 2011년 5월 18일자로 출원된 미국 실용신안 일련번호 제13/110,685호, 및 2012년 10월 3일자로 출원된 PCT 특허원 일련번호 제PCT/12/58578호를 참조하며, 이의 각각의 전문은 본원에 참조로 포함된다. 당해 출원에 사용된 어휘 중의 일부는 이들 참조문헌에서 이의 전례를 가질 수 있다. 본원에 기술된 개념 중의 일부는 이들 참조문헌에서 발견된 개념의 측면에서 보다 잘 이해될 것이다.
자유로이 부유하는 태아 DNA 를 포함하는 모계 혈액의 스크리닝
본원에 기술된 방법을 사용하여 자녀, 태아 또는 다른 표적 개체의 유전형을 측정하는데 도움을 줄 수 있으며, 여기서 표적의 유전 물질은 다른 유전 물질의 양의 존재로 발견된다. 일부 구현예에서 유전형은 하나 또는 다수의 염색체의 배수성 상태를 말할 수 있으며, 이는 하나 또는 다수의 질병 연결된 대립유전자, 또는 이의 일부 조합을 말할 수 있다. 당해 기재내용에서, 당해 논의는 태아의 유전 상태를 측정하는 것에 촛점을 맞추며, 여기서 태아 DNA는 모계 혈액에서 발견되지만, 당해 예는, 본 방법이 적용될 수 있는 가능한 개념으로 한정함을 의미하지 않는다. 또한, 당해 방법은, 표적 DNA의 양이 비-표적 DNA와 특정 비율로 존재하는 경우에 적용가능할 수 있으며; 예를 들면, 표적 DNA는 존재하는 DNA의 0.000001 내지 99.999999% 사이의 어디에서도 구성될 수 있다. 또한, 비-표적 DNA는, 관련 비-표적 개체(들)의 일부 또는 모두의 유전 데이터가 알려져 있는 한, 1명의 개체에서, 또는 심지어 관련 개체에서 반드시 기원할 필요는 없다. 일 구현예에서, 본원에 개시된 방법을 사용하여 태아 DNA를 함유하는 모계 혈액의 태아의 유전형 데이터를 측정할 수 있다. 이는 또한 임신한 여성의 자궁내에 다수의 태자녀 존재하는 경우에, 또는 다른 오염되는 DNA가, 예를 들면, 다른 이미 출생한 형제의 시료 속에 존재할 수 있는 경우 사용될 수 있다.
본 기술은 태반 융모를 통해 모계 순환에 접근하는 태아 혈액 세포의 현상을 이용할 수 있다. 정상적으로, 단지 소수의 태아 세포만이 이러한 양식으로 모계 순환에 도입된다(태아-모계 출혈을 위한 양성의 클라이하우어-베케 시험(Kleihauer-Betke test)을 생성하기에 충분하지 않음). 태아 세포는 다양한 기술에 의해 분류되고 분석되어 특정한 DNA 서열을 찾을 수 있지만, 침입성 과정이 고유하게 갖는 위험은 없다. 당해 기술은 또한 태반 조직의 세포자멸사 후 DNA 방출에 의한 모계 순환에 대한 접근을 획득하는 자유 부유하는 태아 DNA의 현상을 사용할 수 있으며, 여기서 문제의 태반 조직은 태아와 동일한 유전형의 DNA를 함유한다. 모계 혈장에서 발견된 자유로이 부유하는 DNA는 30 내지 40% 정도로 높은 태아 DNA의 비율로 태아 DNA를 함유하는 것으로 밝혀졌다.
일 구현예에서, 혈액은 임신한 여성에서 채혈할 수 있다. 연구는, 모계 혈액이 모체 기원의 자유로이 부유하는 DNA 외에, 태아의 소량의 자유로이 부유하는 DNA를 함유할 수 있음을 입증하여 왔다. 또한, 전형적으로 핵 DNA를 함유하지 않는, 모체 기원의 많은 혈액 세포 외에도, 태아 기원의 DNA를 포함하는 핵화된 태아 혈액 세포가 존재할 수 있다. 태아 DNA를 분리하거나 태아 DNA가 농축된 분획을 생성시키는 당해 분야에 공지된 많은 방법이 있다. 예를 들면, 크로마토그래피는 태아 DNA 속에 농축된 특정의 분획을 생성시킴을 입증한다.
비교적 비-침입성 방식으로 채취하여, 모계 DNA에 대해 이의 비율이 농축되어 있거나, 원래의 이의 비율인, 세포성 또는 자유 부유하는 태아 DNA의 양을 함유하는 모계 혈액, 혈장, 또는 다른 유액의 시료를 가지면, 당해 시료에서 발견된 DNA의 유전형을 분석할 수 있다. 일부 구현예에서, 혈액은 침을 사용하여 정맥, 예를 들면, 경정맥에서 혈액을 빼냄으로써 채혈할 수 있다. 본원에 기술된 방법을 사용하여 태아의 유전형 데이터를 측정할 수 있다. 예를 들면, 이는 하나 이상의 염색체에서 배수성 상태를 측정하는데 사용될 수 있으며, 삽입, 결실, 및 전좌를 포함하는, SNP 하나 또는 세트의 실체를 측정할 수 있다. 이는 하나 이상의 유전형의 특징의 기원인 부모를 포함하는, 하나 이상의 일배체형을 측정하는데 사용될 수 있다.
당해 방법이 ILLUMINA INFINIUM ARRAY 플랫폼, AFFYMETRIX GENECHIP, ILLUMINA GENOME ANALYZER, 또는 LIFE TECHNOLGIES' SOLID SYSTEM과 같은 어떠한 유전형 및/또는 서열분석 방법에 사용될 수 있는 어떠한 핵산과도 작동할 것임에 주목한다. 이는 혈장에서 추출된 자유-부유하는 DNA 또는 이러한 핵산의 증폭(예를 들면, 전체 게놈 증폭, PCR); 다른 세포 유형(예를 들면, 전혈의 사람 림프구)의 게놈 DNA 또는 이의 증폭을 포함한다. DNA의 제조를 위해, 이들 플랫폼 중의 하나에 적합한 게놈 DNA를 생성하는 어떠한 추출 또는 정제 방법도 잘 작동할 것이다. 당해 방법은 RNA의 시료와 함께 잘 작동할 수 있다. 일 구현예에서, 시료의 저장은 분해를 최소화할 방식(예를 들면, 동결 이하, 약 -20℃에서, 또는 보다 낮은 온도에서)으로 수행될 수 있다.
부모 지지
일부 양태를 PARENTAL SUPPORTTM(PS) 방법과 함께 사용할 수 있으며, 이의 구현예는 미국 특허원 제11/603,406호(미국 공보 제20070184467호), 미국 특허원 제12/076,348호(미국 공보 제20080243398호), 미국 특허원 제13/110,685호, PCT 특허원 제PCT/US09/52730호(PCT 공보 제WO/2010/017214호), 및 PCT 특허원 제PCT/US10/050824호(PCT 공보 제WO/2011/041485호)에 기술되어 있으며, 이들은, 전문이 본원에 참조로 포함된다. PARENTAL SUPPORTTM은 유전 데이터를 분석하는데 사용될 수 있는 정보학 기반의 접근법이다. 일부 구현예에서, 본원에 개시된 방법은 PARENTAL SUPPORTTM 방법의 일부인 것으로 고려될 수 있다. 일부 구현예에서, PARENTAL SUPPORT TM 방법은 표적 개체의 유전 데이터를 고 정밀도로, 당해 개체의 하나 또는 소수의 세포, 또는 표적 개체의 DNA 및 하나 또는 다수의 다른 개체의 DNA로 이루어진 DNA의 혼합물의 유전 데이터를 고 정밀도로 측정하거나, 질병-관련된 대립유전자, 목적한 다른 대립유전자, 및/또는 표적 개체에서 하나 또는 다수의 염색체의 배수성 상태를 특이적으로 측정하는데 사용될 수 있는 방법의 집합이다. PARENTAL SUPPORTTM는 이들 방법들 중의 어느 것을 말할 수 있다. PARENTAL SUPPORTTM는 정보학 기반의 방법의 예이다. PARENTAL SUPPORTTM 방법의 예시적인 구현예는 도 29 내지 도 31g에 나열되어 있으며 실시예 19에 기술되어 있다.
PARENTAL SUPPORTTM 방법은 공지된 부모 유전 데이터, 즉, 모친 및/또는 부친의 일배체 및/또는 이배체 유전 데이터를 감수분열의 메카니즘의 지식 및 표적 DNA의 불완전한 측정의 지식, 및 가능하게는 하나 이상의 관련된 개체과 함께, 교차 빈도를 기반으로 하는 집단에 따라 사용하여, 주요 유전자자리의 위치에서 특정 표적 세포(들), 및 표적 DNA 또는 배아의 배수성 상태, 및/또는 다수의 대립유전자에서 유전형을 고도의 신뢰도로 인실리코 재작제한다. PARENTAL SUPPORTTM 방법은 불량하게 측정된 단일 뉴클레오타이드 다형성(SNP)을 재작제할 수 있을 뿐 아니라, 전혀 측정되지 않았던 DNA의 삽입 및 결실, 및 SNP 또는 전체 영역을 재작제할 수 있다. 또한, PARENTAL SUPPORTTM 방법은 단일 세포로부터 다수의 질병-연결된 유전자자리 및 또한 이수성에 대한 스크린 둘 모두를 측정할 수 있다. 일부 구현예에서, PARENTAL SUPPORTTM 방법은 IVF 주기 동안에 생검된 배아의 하나 이상의 세포를 특성화하여 하나 이상의 세포의 유전 상태를 측정하는 데 사용될 수 있다.
PARENTAL SUPPORTTM 방법은 노이지 유전 데이터의 정화를 허용한다. 이는 관련된 개체(부모)의 유전형을 참조물질로서 사용하여 표적 게놈(배아)내 정확한 유전 대립유전자를 부여함으로써 수행할 수 있다. PARENTAL SUPPORTTM이 특히 관련될 수 있는데, 여기서 유전 물질의 단지 소량만이 이용가능하며(예를 들면, PGD) 여기서 유전형의 직접적인 측정은 제한된 양의 유전 물질로 인하여 고유하게 노이지가 있다. PARENTAL SUPPORTTM이 특히 관련될 수 있는데, 여기서 이용가능한 유전 물질의 단지 소 분획만이 표적 개체에서 기원되고(예를 들면, NPD) 여기서 유전형의 직접적인 측정은 다른 개체의 오염되는 DNA 신호로 인하여 고유하게 노이지가 있다. PARENTAL SUPPORTTM 방법은, 통상의 무질서한 이배체 측정이 고 비율의 대랍형질 드롭아웃, 드롭-인(drop-in), 다양한 증폭 바이어스 및 다른 오차에 의해 특징화될 수 있다고 해도, 염색체 분절의 카피 수와 함께, 배아에서 정렬된 이배체 대립유전자 서열을 고도로 정밀하게 재작제할 수 있다. 당해 방법은 잠재하는 유전 모델 및 측정 오차의 잠재하는 모델 둘 모두를 사용할 수 있다. 유전 모델은 각각의 SNP에서 대립유전자 확률 및 SNP 사이의 교차 확률 둘 모두를 측정할 수 있다. 대립유전자 확률은 International HapMap 기획에 의해 개발된 것으로서, HapMap 데이터베이스에서 수득된 데이터를 기반으로 하여 SNP 사이의 부모 및 모델 교차 확률에서 수득된 데이터를 기반으로 각각의 SNP에서 모델화될 수 있다. 적절한 잠재하는 유전 모델 및 측정 오차 모델을 제공하여, 사후 확률 최대화( maxim um a posteriori: MAP) 평가를 계산적 효능에 관한 변형과 함께 사용하여, 배아내 각각이 SNP에서 정확하게, 정렬된 대립유전자 값을 평가할 수 있다.
일부 경우에, 위에서 요약한 기술은 개체에서 기원하는 극소량의 DNA를 제공하여 개체의 유전형을 측정할 수 있다. 이는 하나 또는 소수의 세포의 DNA일 수 있거나, 모계 혈액에서 발견된 소량의 태아 DNA에서 기원할 수 있다.
가설
본 기재내용과 관련하여, 가설은 가능한 유전 상태를 말한다. 이는 가능한 배수성 상태를 말할 수 있다. 이는 가능한 대립유전자 상태를 말할 수 있다. 가설의 세트는 가능한 유전 상태의 세트, 가능한 대립유전자 상태의 세트, 가능한 배수체 상태의 세트, 또는 이의 조합을 말할 수 있다. 일부 구현예에서, 가설들의 세트는, 그 가설들로부터 추정한 하나의 가설이 어떠한 특정 개체의 실제 유전 상태에 상응하도록 설계할 수 있다. 일부 구현예에서, 가설들의 세트를 설계하여 모든 가능한 유전 상태가 그 가설들 중 적어도 하나의 가설에 의해 기술될 수 있도록 할 수 있다. 본원의 일부 구현예에서, 방법의 하나의 측면은, 어느 가설이 문제의 개체가 실제 유전 상태에 상응하는지를 측정하는 것이다.
본원의 다른 구현예에서, 하나의 단계는 가설을 생성시킴을 포함한다. 일부 구현예에서, 이는 카피 수 가설일 수 있다. 일부 구현예에서 이는 관련된 개체 각각의 염색체의 어느 분절이, 경우에 따라, 다른 관련된 개체의 어느 분절에 상응하는지에 관한 가설을 포함할 수 있다. 가설을 생성하는 것은, 고려하에 있는 가능한 유전 상태의 전체 세트가 이들 변수에 의해 포함되도록 변수의 한계를 설정하는 작용을 말할 수 있다.
"배수성 가설", 또는 "배수성 상태 가설"로 또한 명명되는 "카피 수 가설"은 표적 개체에서 소정의 염색체 카피, 염색체 유형, 또는 염색체 단면에 대한 가능한 배수성 상태에 관한 가설을 말할 수 있다. 이는 또한 개체에서 염색체 유형 중 하나 이상의 배수성 상태를 말할 수 있다. 카피 수 가설의 세트는 가설의 세트를 말할 수 있으며, 여기서 각각의 가설은 개체에서 상이한 가능한 배수성 상태에 상응한다. 가설 세트는 가능한 배수성 상태의 세트, 가능한 부모 일배체형 분포의 세트, 혼합된 시료 속에서 가능한 태아 DNA 퍼센트의 세트, 또는 이의 조합에 관한 것일 수 있다.
정상의 개체는 각각의 부모의 각 염색체 유형 중 하나를 함유한다. 그러나, 감수분열 및 유사분열로 인하여, 개체가 각각의 부모로부터 받은 염색체 유형 중 0, 1, 2개 이상을 가지는 것이 가능하다. 실제로는, 부모로부터 받은 염색체 2개 이상을 찾는 것은 드물다. 본원에서, 일부 구현예는 단지 소정의 염색체 중의 0, 1, 또는 2개의 카피가 환자에서 비롯된 가능한 가설만을 고려하며; 이는 부모에서 기원하는 다소의 가능한 카피를 고려하기 위한 사소한 확장이다. 일부 구현예에서, 소정의 염색체의 경우, 9개의 가능한 가설이 존재한다: 부모 기원의 0, 1, 또는 2개 염색체에 관한 3개의 가능한 가설로 곱해진, 모체 기원의 0, 1, 또는 2개의 염색체에 관한 3개의 가능한 가설. Let(m,f)는 가설을 말하며, 여기서 m은 모친으로부터 유전된 소정의 염색체의 수이고, f는 부친으로부터 유전된 소정의 염색체의 수이다. 따라서, 9개의 가설은 (0,0), (0,1), (0,2), (1,0), (1,1), (1,2), (2,0), (2,1), 및 (2,2)이다. 이들은 또한 H00, H01, H02, H10, H12, H20, H21, 및 H22로 쓰여진다. 상이한 가설이 상이한 배수성 상태에 상응한다. 예를 들면, (1,1)은 정상의 이염색체성 염색체를 말하고; (2,1)은 모의 삼염색체성을 말하며, (0,1)은 부계 일염색체성을 말한다. 일부 구현예에서, 2개의 염색체가 하나의 부친으로부터 유전되고 하나의 염색체가 다른 부모로부터 유전되는 경우는 2개의 경우로 추가로 차별화될 수 있다: 하나는, 2개의 염색체가 동일한 경우(일치된 카피 오차)이고, 하나는 2개의 염색체가 상동성이지만 동일하지 않은 경우(일치하지 않는 카피 수)이다. 이들 구현예에서, 6개의 가능한 가설이 존재한다. 다른 세트의 가설, 및 상이한 수의 가설을 사용하는 것이 가능함이 이해되어야 한다.
본원의 일부 구현예에서, 배수성 가설은, 다른 관련된 개체의 어느 염색체가, 표적 개체가 게놈에서 발견된 염색체에 상응하는지에 관한 가설을 말한다. 일부 구현예에서, 당해 방법의 주요사항은, 관련된 개체가 일배체형 블록을 공유하는 것으로 예측될 수 있으며, 관련된 개체의 측정된 유전 데이터를, 표적 개체과 관련된 개체 사이의 일배체형 블록 일치의 지식과 함께 사용하여, 표적 개체에 대한 정확한 유전 데이터를 표적 개체의 유전적 측정 만을 사용하는 것보다 더 높은 신뢰도로 부여하는 것이 가능하다는 것이다. 이와 같이, 일부 구현예에서, 배수성 가설은 단지 다수의 염색체에 관한 것이 아니라, 표적 개체에서 하나 이상의 염색체를 사용하여, 관련된 개체에서 어느 염색체가 동일하거나, 거의 동일한지에 관한 것일 수 있다.
가설의 세트가 정의되면, 논리가 입력 유전 데이터에서 작동하는 경우, 이들은 고려하에 가설 각각에 대한 측정된 통계적 가능성을 출력할 수 있다. 다양한 가설의 확률은 하나 이상의 숙련된 기술, 알고리즘, 및/또는 본원의 어딘가에 기술된 방법 중 하나 이상에 의해 기술된 바와 같이, 입력으로서 관련된 유전 데이터를 사용하여, 각각의 다양한 가설, 확률이 동일한 값에 대해 수학적으로 계산함으로써 측정할 수 있다.
다수의 기술에 의해 측정된 것으로서, 상이한 가설의 확률이 추정되면, 이들을 합할 수 있다. 이는 각각의 가설에 대하여, 각각의 기술에 의해 측정된 것으로서의 확률을 곱함을 포함할 수 있다. 가설의 확률의 곱은 정규화될 수 있다. 하나의 배수성 가설이 염색체에 대한 하나의 가능한 배수성 상태를 말함에 주목한다.
또한 "가설을 합하는", 또는 숙련된 기술의 결과를 합하는 것으로 불리는 "확률을 합하는"의 공정은 선형 대수의 분야의 숙련가에게 친숙할 수 있는 개념이다. 확률을 합하는 한가지 가능한 방식은 다음과 같다: 숙련된 기술을 사용하여 유전 데이터들의 특정 세트에 의하여 일단의 가설을 평가하는 경우, 방법의 출력은 가설의 세트 중의 가설 각각과 1 대 1 방식으로 관련된 확률의 세트이다. 제1의 숙련된 기술에 의해 측정된, 각각의 세트내 가설 중의 하나와 관련되어 있는 확률들의 세트를 제2의 숙련된 기술에 의해 측정된, 각각이 동일한 세트의 가설과 관련되어 있는 확률들의 세트와 합하는 경우, 2개 세트의 확률을 곱한다. 이는, 당해 세트의 각각의 가설의 경우, 이러한 가설과 관련된 2개의 확률을 함께 곱하고, 상응하는 생성물이 출력 확률임을 의미한다. 당해 공정은 특정 수의 전문 기술로 확장될 수 있다. 유일하게 하나의 기술이 사용되는 경우, 출력 확률은 입력 확률과 동일하다. 2개 이상의 전문 기술이 사용되는 경우, 이후에 관련 확률은 동시에 배가될 수 있다. 생성물은 표준화시킴으로서 가설들의 합에서 세트내 가설의 확률의 합은 100%이 된다.
일부 구현예에서, 소정의 가설에 대해 합한 확률이 다른 가설의 어느 것에 대해 합한 확률보다 큰 경우, 당해 가설은 가장 높은 가능성이 있는 것으로 측정된 것으로 고려될 수 있다. 일부 구현예에서, 가설은 가장 가능성이 있는 것으로 측정될 수 있으며, 표준화된 확률이 한계보다 큰 경우 배수성 상태, 또는 다른 유전 상태가 요청될 수 있다. 일 구현예에서, 이는, 가설과 관련된 염색체의 수 및 실체가 배수성 상태로 요청될 수 있음을 의미할 수 있다. 일 구현예에서, 이는, 당해 가설과 관련된 대립유전자의 실체가 대립유전자 상태로서 요청될 수 있음을 의미한다. 일부 구현예에서, 한계는 약 50% 내지 약 80% 일 수 있다. 일부 구현예에서 한계는 약 80% 내지 약 90%일 수 있다. 일부 구현예에서 한계는 약 90% 내지 약 95%일 수 있다. 일부 구현예에서 한계는 약 95% 내지 약 99%일 수 있다. 일부 구현예에서 한계는 약 99% 내지 약 99.9%일 수 있다. 일부 구현예에서 한계는 약 99.9% 초과일 수 있다.
부모 관계( parental context )
부모 관계는 표적의 2명의 부모 중의 1명 또는 둘 모두에 대한 2개의 관련 염색체 중 각각에서, 소정의 대립유전자의 유전 상태를 말한다. 일 구현예에서, 부모 관계는 표적의 대립유전자 상태를 말하는 것이 아니라, 부모의 대립유전자 상태를 말한다. 소정의 SNP에 대한 부모 관계는 4개의 염기쌍, 2개의 부친 및 2개의 모친으로 이루어질 수 있고; 이들은 서로 동일하거나 상이할 수 있다. 이는 전형적으로 "m1m2|f1f2"(여기서, m1 및 m2는 2개의 모계 염색체의 소정의 SNP의 유전 상태이며, f1 및 f2는 2개의 부계 염색체의 소정의 SNP의 유전 상태이다. 일부 구현예에서, 부모 관계는 "f1f2|m1m2"로 기록될 수 있다. 첨자 "1" 및 "2"는 제1 및 제2 염색체의 소정의 대립유전자에서 유전형을 말하며; 또한 "1"로 표지된 염색체 및 "2"로 표지된 염색체의 선택이 임의적임에 주목한다.
본 기재내용에서, A 및 B는 흔히 일반적으로 염기쌍 실체를 나타내는데 사용되며; A 또는 B는 동등하게 C(사이토신), G(구아닌), A(아데닌) 또는 T(티민)을 잘 나타낼 수 있다. 예를 들어, 소정의 SNP 기반 대립유전자에서, 모의 유전형은 염색체 상의 이러한 SNP에서 T였으며, 동종 염색체 상의 SNP에서 G이고, 대립유전자에서 부계 유전형은 동종 염색체 둘 모두의 SNP에서 G이며, 표적 개체의 대립유전자는 AB|BB의 부모 관계를 가지는 것으로 말할 수 있으며; 이는 또한, 대립유전자가 AB|AA의 부모 관계를 가지는 것으로 일컬어질 수 있다. 이론적으로, 4개의 가능한 뉴클레오타이드 중의 어느 것도 소정의 대립유전자에서 발생할 수 있으므로, 예를 들면, 모의 경우 AT의 뉴전형을 가지는 것이 가능하며 부계의 경우 특정 대립유전자에서 GC의 유전형을 가지는 것이 가능함을 주목한다. 그러나, 실험 데이터는, 대부분의 경우에 4개의 가능한 염기 쌍 중의 2개 만이 소정의 대립유전자에서 관찰됨을 나타낸다. 예를 들면, 단일의 연쇄 반복을 사용하는 경우 2개 이상의 부모 관계, 4 이상 및 심지어 10 이상의 정보를 가지는 것이 가능하다. 당해 기재내용에서, 논의는, 본원에 개시된 구현예를 변형시켜 이러한 추정이 유지되지 않는 경우를 고려할 수 있었다고 해도, 단지 2개의 가능한 염기쌍 만이 소정의 대립유전자에서 관찰될 것으로 추정한다.
"부계 정보"는 동일한 부계 정보를 갖는 표적 SNP의 세트 또는 소세트를 말할 수 있다. 예를 들면, 표적 개체에서 소정의 염색체 상에 1000개의 대립유전자를 측정하려는 경우, 정보 AA|BB는 1,000개의 대립유전자의 그룹 중의 모든 대립유전자의 세트를 말할 수 있으며, 여기서 표적이 되는 모의 유전형은 동형접합체이고, 표적이 되는 부계 유전형은 동형접합체이지만, 여기서 모계 유전형 및 부계 유전형은 당해 유전자자리에서 같지 않다. 부계 자료가 단계적이지 않고, 따라서 AB = BA인 경우, 9개의 가능한 부모 관계가 존재한다: AA|AA, AA|AB, AA|BB, AB|AA, AB|AB, AB|BB, BB|AA, BB|AB, 및 BB|BB. 부모 데이터가 단계적이고, 따라서 AB≠BA인 경우, 16개의 상이한 가능한 부모 관계가 존재한다: AA|AA, AA|AB, AA|BA, AA|BB, AB|AA, AB|AB, AB|BA, AB|BB, BA|AA, BA|AB, BA|BA, BA|BB, BB|AA, BB|AB, BB|BA, 및 BB|BB. 성 염색체 상의 일부 SNP를 제외한 염색체 상의 모든 SNP 대립유전자는 이들 부모 관계 중 하나를 갖는다. 한 명의 부모에 대한 부모 관계가 이형접합성인 SNP의 세트는 이형접합성 정보로서 언급될 수 있다.
NPD에서 부모 관계의 용도
비-침입성 태자녀 진단은 예를 들면, 임신한 모친에서 채혈한 혈액에서 비-침입성 방식으로 수득된 유전 물질로 태아의 유전 상태를 측정하기 위해 사용될 수 있는 중요한 기술이다. 혈액은 혈장 DNA의 분리 후, 떨어져서 혈장 분리될 수 있다. 크기 선택을 사용하여 적절한 길이의 DNA를 분리할 수 있다. DNA는 유전자자리의 세트에서 우선적으로 농축될 수 있다. 이후에, 당해 DNA는 유전형 배열에 대한 하이브리드화 및 형광성 측정, 또는 고 배출 서열분석기 상에서 서열분석에 의한 것과 같은 다수의 수단으로 측정할 수 있다.
서열분석이 비-침입성 임태아 검진과 관련하여 태아의 배수성 요청을 위해 사용된 경우, 서열 데이터를 사용하는 다수의 방법이 존재한다. 서열 데이터를 사용할 수 있었던 가장 일반적인 방법은 소정의 염색체에 맵핑하는 다수의 판독물을 단순히 계수하는 것이다. 예를 들어, 태아에서 염색체 21번의 배수성 상태를 측정하려고 노력하는 경우를 상상한다. 또한, 시료 속의 DNA가 태아 기원의 DNA 10%, 및 모체 기원의 DNA 90%로 이루여 있다고 상상한다. 이 경우, 이염색체성인 것으로 예측될 수 있는 염색체, 예를 들면, 염색체 3번 상의 판독물의 평균 수를 관찰할 수 있고, 이를 염색체 21번의 판독물의 수와 비교할 수 있었으며, 여기서 판독물은 유일한 서열의 일부인 이러한 염색체 상의 다수의 염기 쌍에 대해 조절된다. 태자녀 정배수성인 경우, 게놈의 단위당 DNA의 양이 모든 위치에서 거의 동등한 것으로 예측할 수 있다(확률적 변화에 적용됨). 한편, 태자녀 염색체 21번에서 삼염색체성인 경우, 게놈의 다른 위치에서보다 염색체 21번으로부터 유전 단위당 DNA가 약간 더 존재하는 것으로 예측할 수 있다. 구체적으로, 혼합물 중 염색체 21로부터 약 5% 이상의 DNA가 존재하는 것으로 예측될 수 있다. 서열분석을 사용하여 DNA를 측정하는 경우, 다른 염색체로부터 유일한 분절 당 염색체 21번으로부터 약 5% 이상의 유일하게 맵핑가능한 판독물을 예측할 수 있다. 이수성 진단에 대한 편향으로서, 염색체에 유일하게 맵핑가능한 다수의 서열에 대해 조절하는 경우, 특정의 한계보다 더 높은 특수 염색체의 DNA 양을 관찰할 수 있다. 이수성을 검출하는데 사용될 수 있는 다른 방법은, 부모 관계를 고려하는 것을 제외하고는, 상기 것과 유사하다.
어느 대립유전자가 표적에 대한 것인지를 고려하는 경우, 일부 부모 관계가 다른 것보다 더 유익한 가능성을 고려할 수 있다. 예를 들어, AA|BB 및 대칭 정보 BB|AA는 가장 유익한 정보인데, 이는, 태자녀 모와는 상이한 대립유전자를 수반하는 것으로 알려져 있기 때문이다. 대칭의 이유로, AA|BB 및 BB|AA 정보 둘 모두는 AA|BB로 언급될 수 있다. 다른 세트의 유익한 부모 관계는 AA|AB 및 BB|AB인데, 이는, 당해 경우에 태자녀 모가 가지지 않은 대립유전자를 수반하는 50%의 기회를 가지기 때문이다. 대칭으로 인하여, AA|AB 및 BB|AB 정보 둘 모두는 AA|AB로 언급될 수 있다. 제3 세트의 유익한 부모 관계는 AB|AA 및 AB|BB이며, 이는, 이 경우에 태자녀 공지된 부모 대립유전자를 수반하고, 이러한 대립유전자가 또한 모계 게놈에 존재하기 때문이다. 대칭으로 인하여, AB|AA 및 AB|BB 정보 둘 모두는 AB|AA로 언급될 수 있다. 제4의 부모 관계는 AB|AB이며, 여기서 태아는 알려지지 않은 대립유전자 상태를 가지고, 대립유전자 상태에 상관없이, 이는, 모가 동일한 대립유전자를 갖는 것이다. 제5의 부모 관계는 AA|AA이며, 여기서 모친 및 부친은 이형접합성이다.
개시된 구현예의 상이한 실행
표적 개체의 배수성 상태를 측정하는 방법이 본원에 기재되어 있다. 표적 개체는 난할구, 배아, 또는 태아일 수 있다. 본원의 일부 구현예에서, 표적 개체의 하나 이상의 염색체에서 배수성 상태를 측정하는 방법은 당해 문서에 기술된 단계들 중 어느 것, 및 이의 조합을 포함할 수 있다.
일부 구현예에서 태아의 유전 상태를 측정하는데 사용될 유전 물질의 공급원은 모계 혈액에서 분리된, 핵화된 태아 적혈구와 같은 태아 세포일 수 있다. 당해 방법은 임신한 모친에서 혈액 시료를 수득하는 단계를 포함할 수 있다. 당해 방법은, 특정의 색의 조합이 핵화된 적혈구 세포와 독특하게 관련되어 있으며, 유사한 색의 조합은 모계 혈액 속의 다른 어떠한 존재하는 세포와 관련되어 있지 않다는 발상을 기반으로 하여, 가시적인 기술을 사용하여 태아 적혈구 세포를 분리하는 단계를 포함한다. 핵화된 적혈구와 관련된 색상의 조합은 염색에 의해 보다 더 명백해질 수 있는, 핵 주변의 적색의 헤모글로빈, 및 예를 들면, 청색으로 염색될 수 있는 핵 물질이 색상을 포함할 수 있다. 모친 혈액의 세포를 분리하여 이들을 슬라이드 위에 분산시킨 후 적색(헤모글로불린) 및 청색(핵 물질) 둘 모두를 관찰하는 지점을 확인함으로써 핵화된 적혈구의 위치를 확인할 수 있다. 이후에, 현미조작장치를 사용하여 핵화된 적혈구를 추출하고, 유전형 및/또는 서열분석 기술을 사용하여 이들 세포 속의 유전 물질의 유전형의 측면을 측정할 수 있다.
일 구현예에서, 태아 헤모글로불린의 존재하에서만 형광을 나타내고 모계 헤모글로빈의 존재하에서는 형광을 나타내지 않는 금형으로 핵화된 적혈구를 염색하고, 핵화된 적혈구가 모계 또는 태아에서 기원하는지 사이의 모호성을 제거할 수 있다. 본원의 일부 구현예는 유전 물질을 염색하거나 달리는 표지하는 단계를 포함할 수 있다. 본원의 일부 구현예는 태아 세포 특이적인 항체를 사용하여 태아 핵 물질을 구체적으로 표지하는 단계를 포함할 수 있다.
모계 혈액에서 태아 세포를 분리하거나, 모계 혈액에서 태아 DNA를 분리하거나, 모계 유전 물질의 존재하에서 태아 유전 물질의 시료를 농축시키는 많은 다른 방법이 존재한다. 이들 방법들 중 일부는 본원에 나열되어 있지만, 이것이 전적인 목록인 것으로 의도되지는 않는다. 일부 적절한 기술이 편의를 위해 본원에 나열되어 있다: 형광적으로 또는 달리는 태그된 항체의 사용, 크기 배제 크로마토그래피, 자기적으로 또는 달리는 표지된 친화성 태그, 특이적인 대립유전자에서 모와 태아 세포 사이의 차등적인 메틸화와 같은 후생적 차이, 밀도 구배 원심분리에 이은 CD45/14 음성-세포의 CD45/14 고갈 및 CD71-양성 선택, 삼투질 농도가 상이한 단일 또는 이중 퍼콜 구배(Percoll gradient), 또는 갈락토즈 특이적인 렉틴 방법.
본원의 일 구현예에서, 표적 개체는 태자녀고, 상이한 유전형 측정은 태아에서 채취한 다수의 DNA 시료에서 이루어진다. 본원의 일부 구현예에서, 태아 DNA 시료는 분리된 태아 세포에서 기원하며, 여기서 태아 세포는 모계 세포와 혼합될 수 있다. 본원의 일부 구현예에서, 태아 DNA 시료는 자유로이 부유하는 태아 DNA에서 기원하며, 여기서 태아 DNA는 자유로이 부유하는 모계 DNA와 혼합될 수 있다. 일부 구현예에서, 태아 DNA 시료는 모계 DNA 및 태아 DNA의 혼합물을 함유하는 모계 혈장 또는 모계 혈액에서 기원할 수 있다. 일부 구현예에서, 태아 DNA는 99.9:0.1% 내지 99:1%; 99:1% 내지 90:10%; 90:10% 내지 80:20%; 80:20% 내지 70:30%; 70:30% 내지 50:50%; 50:50% 내지 10:90%; 또는 10:90% 내지 1:99%; 1:99% 내지 0.1:99.9% 범위의 모:태아 비로 모계 DNA와 혼합될 수 있다.
표적 개체 및/또는 관련된 개체의 유전 데이터는 유전형 미세배열, 및 고 배출 서열분석을 포함하나, 이에 한정되지 않은 그룹 중에서 취한 도구 및/또는 기술을 사용하여 적절한 유전 물질을 측정함으로써 분자 상태에서 전기 상태로 전환시킬 수 있다. 일부 고배출 서열분석 방법은 생거 DNA 서열분석(Sanger DNA sequencing), 파이로씨퀀씽(pyrosequencing), ILLUMINA SOLEXA 플랫폼, ILLUMINA's GEMONE ANALYZER, 또는 APPLIED BIOSYSTEM's 454 서열분석 플랫폼, HELICOS's TRUE SINGLE MOLECULE SEQUENCING PLATFORM, HALCYON MOLECULAR의 전기 현미경 서열분석 방법, 또는 어떠한 다른 서열분석 방법을 포함한다. 이들 방법 모두는 DNA의 시료 속에 저장된 유전 데이터를 처리되는 도중에 기억 장치 속에 전형적으로 저장되는 유전 데이터의 세트로 물리적으로 전환시킨다.
관련된 개체의 유전 데이터는 개체의 거대 이배체 조직, 개체의 하나 이상의 이배체 세포, 개체의 하나 이상의 반수체 세포, 표적 개체의 난할구, 개체에서 발견된 세포외 유전 물질, 모친 혈액에서 발견된 개체의 세포외 유전 물질, 모친 혈액에서 발견된 개체의 세포, 관련된 개체의 생식세포(들)로부터 생성된 하나 이상의 배아, 이러한 배아에서 채취한 하나 이상의 난할구, 관련된 개체에서 발견된 세포외 유전 물질, 관련 개체에서 기원하는 것으로 알려진 유전 물질, 및 이의 조합을 포함하나, 이에 한정되지 않는 물질을 분석함으로써 측정할 수 있다.
일부 구현예에서, 적어도 하나의 배수성 상태 가설의 세트를 표적 개체의 목적한 염색체 형 각각에 대해 생성시킬 수 있다. 배수성 상태 가설 각각은 표적 개체의 염색체 또는 염색체 분절의 한가지 가능한 배수성 상태를 말할 수 있다. 이러한 가설의 세트는, 표적 개체의 염색체가 가지는 것으로 예측될 수 있는 가능한 배수성 상태 중의 일부 또는 모두를 포함할 수 있다. 가능한 배수성 상태 중의 일부는 결염색체성, 일염색체성, 이염색체성, 편친 이염색체성(uniparental disomy), 정배수성, 삼염색체성, 일치하는 삼염색체성, 일치하지 않는 삼염색체성, 모계 삼염색체성, 부계 삼염색체성, 사염색체성, 균형을 이룬 (2:2) 사염색체성, 균형을 이루지 않은(3:1) 사염색체성, 오염색체성, 육염색체성, 다른 이수성, 및 이의 조합을 포함할 수 있다. 이들 이수성 상태 중 어느 것도 균형을 이루지 않은 전좌, 균형을 이룬 전좌, 로벌슨 전좌(Robertsonian translocation), 재조합, 결실, 삽입, 교차, 및 이의 조합과 같은 혼합되거나 부분적인 이수성일 수 있다.
일부 구현예에서, 측정된 배수성 상태의 지식을 사용하여 임상 결정을 할 수 있다. 전형적으로 기억 장치 속에 물질의 물리적 배열로 저장된 당해 지식은 이후에 보고서로 전환될 수 있다. 이후에 보고서를 실행할 수 있다. 예를 들면, 임상 결정은 임신을 종결시키도록 이루어질 수 있으며; 달리는, 임상 결정은 임신을 지속시키기 위해 이루어질 수 있다. 일부 구현예에서, 임상 결정은 유전 질환의 표현형적 표시의 심각성을 감소시키도록 설계된 중재, 또는 장애아에 대해 준비하기 위한 관련 단계를 취하는 결정을 포함할 수 있다.
본원의 일 구현예에서, 본원에 개시된 방법 중 어느 것도 변형시켜 다수의 표적이 동일한 표적 개체, 예를 들면, 동일한 임신한 모친에서 채혈한 다수의 혈액에서 기원할 수 있게 할 수 있다. 이는, 다수의 유전적 측정이, 이로써 표적 유전형이 측정될 수 있는 보다 많은 데이터를 제공할 수 있으므로, 모델의 정확성을 개선시킬 수 있다. 일 구현예에서, 1개 세트의 표적 유전 데이터는 보고된 1차 데이터로서 제공되고, 다른 것은 1차 표적 유전 데이터를 이중-점검하기 위한 데이터로서 제공된다. 일 구현예에서, 각각 표적 개체에서 취한 유전 물질로부터 측정된, 복수 세트의 유전 데이터는 평행인 것으로 간주되므로, 표적 유전자 데이터의 세트 둘 모두는 고정밀도로 측정된, 모계 유전 데이터의 어느 단면이 태아 게놈을 구성하는지를 측정하는 데 도움을 주는 역할을 한다.
일 구현예에서, 당해 방법은 부계 시험의 목적으로 사용될 수 있다. 예를 들면, 모친의, 그리고 유전적 부친일 수 있거나 부친이 아닐 수 있는 남성의 SNP-기반 유전형 정보, 및 혼합된 시료로부터 측정된 유전형 정보를 제공함으로써, 또한 남성의 유전형 정보가 잉태된 태아의 실제 유전적 부친을 나타내는지를 판별하는 것이 가능하다. 이를 수행하는 단순한 방법은, 모친이 AA이고, 가능한 부친이 AB 또는 BB인 정보를 단순히 관찰하는 것이다. 이 경우, 부계 기여 1/2(AA|AB) 또는 모든(AA|BB) 시간을 각각 알아보는 것을 예측할 수 있다. 예측된 ADO를 고려하여, 관찰된 부계 SNP가 가능한 부친의 것과 관련되어 있는지를 측정하는 것이 간단하다.
본원의 일 구현예는 다음과 같을 수 있다: 임신한 여성이, 그녀의 태자녀 다운증후군으로 고생하고/하거나 낭성 섬유증으로 고생할 것인지 알기를 원하는 경우, 및 그녀가 이들 상태 중의 어느 것으로 고생할 자녀를 낳기를 원치 않는 경우. 의사는 그녀의 혈액을 채취하여, 헤모들로빈을 하나의 마커로 염색함으로써 이것이 명확하게 적색으로 보이고, 핵 물질을 다른 마커로 염색함으로써 이것이 명확이 청색으로 보이도록 한다. 모계 적혈구가 전형적으로 무핵이나, 고 비율의 태아 세포가 핵을 함유한 것을 안다면, 의사는 적색 및 청색 둘다를 나타내는 세포를 확인함으로써 핵화된 적혈구의 수를 가시적으로 분리할 수 있다. 의사는 미세조작기로 슬라이드로부터 이들 세포를 집어올려 이들을 증폭시켜 10개의 개개 세포로 유전형 분석하는 실험실로 보낸다. 유전적 측정을 사용함으로써, PARENTAL SUPPORTTM 방법은, 10개 세포중 6개가 모계 혈액 세포이고, 10개 세포 중 4개가 태아 세포임을 측정할 수 있다. 자녀가 이미 임신한 모친으로부터 태어난 경우, PARENTAL SUPPORTTM을 또한 사용하여, 태아 세포 상의 신뢰할 수 있는 대립유전자 요청을 이루고 이들이 태어난 자녀의 것과 유사하지 않음을 나타냄으로써 태아 세포가 태어난 자녀의 세포와 구별됨을 판별할 수 있다. 당해 방법은, 본원의 부모 시험 구현예에 대한 개념과 유사함에 주목한다. 태아 세포로부터 측정된 유전 데이터는, 많은 대립유전자 드롭 아웃을 포함하므로, 단일 세포를 유전형분석하는데 곤란성으로 인하여, 품질이 매우 불량할 수 있다. 임상의는 측정된 태아 DNA를 부모의 신뢰가능한 DNA 측정과 함께 사용하여 태아 게놈의 측면을 높은 정밀도로 PARENTAL SUPPORTTM을 사용하여 부여할 수 있기 때문에, 태아의 유전 물질에 함유된 유전 데이터를 태아의 예측된 유전 상태로 전환시켜, 컴퓨터 상에 저장할 수 있다. 임상의는 태아의 배수성 상태, 및 목적한 질병-연결된 유전자 다수의 존재 또는 부재 둘 모두를 측정할 수 있다. 태자녀 정배수성이고, 낭성 섬유종에 대한 매개체가 아닌 것으로 밝혀지면, 모는 임신을 지속하는 것을 결정한다.
본원의 일 구현예에서, 임신한 모는, 그녀의 태자녀 어떠한 전체 염색체 비정상으로 고생하는지를 측정하기를 원할 수 있다. 그녀는 그녀의 의사한테 가서, 그녀의 혈액을 제공하고, 그녀 및 그녀의 남편이 그들의 볼 면봉에서 채취한 DNA를 제공한다. 실험실 연구자는 MDA 프로토콜을 사용하여 부모 DNA를 유전형분석함으로써 부모 DNA를 증폭하고, ILLUMINA INFINIUM 배열로 다수의 SNP에서 부모의 유전 데이터를 측정한다. 이후에, 연구자는 혈액을 스핀 다운(spin down)시켜, 혈장을 취하고, 크기 배제 크로마토그래피를 사용하여 자유로이-부유하는 DNA의 시료를 분리한다. 달리는, 연구자는 태아 헤모글로빈에 대해 특이적인 것과 같은, 하나 이상의 형광성 항체를 사용하여 핵화된 태아 적혈구를 분리한다. 연구자는 이후에, 분리되거나 농축된 태아 유전 물질을 취하고 이를 각각의 올리고뉴클레오타이드의 2개 말단이 표적 대립유전자의 한쪽 측면에서 플랭킹 서열에 상응하도록 적절히 설계된 70-머 올리고뉴클레오타이드의 라이브러리를 사용하여 증폭시킨다. 폴리머라제, 리가제, 및 적절한 시약의 첨가 시, 올리고뉴클레오타이드는 갭-충전, 순환화, 목적한 대립유전자의 포획을 겪는다. 엑소뉴클레아제를 가하고, 열-불활성화시키고, 생성물을 PCR 증폭용 주형으로 직접 사용하였다. PCR 생성물을 ILLUMINA GENOME ANALYZER 상에서 서열분석하였다. 서열 판독물을 이후, 태아의 배수성 상태를 예측하는, PARENTAL SUPPORTTM 방법을 위한 입력으로 사용하였다.
다른 구현예에서, 모가 임신중이고, 산모 연령이 많은 한쌍이, 잉태중인 태자녀 다운 증후군, 터너증후군, 프라더 윌리 증후군(Prader Willi syndrome), 또는 일부 다른 전체 염색체 비정상을 가지고 있는지를 알고 싶어한다. 산부인과 전문의는 모친 및 부친에서 혈액을 채혈한다. 혈액은 실험실로 보내져서, 여기서 기술자들은 모계 시료를 원심분리하여 혈장 및 연막으로 분리한다. 연막 속의 DNA 및 부계 혈액 시료를 증폭을 통해 전환시키고, 증폭된 유전 물질 속에 코드화된 유전 데이터를 분자 저장된 유전 데이터로부터 전자적으로 저장된 유전 데이터로 고배출 서열분석기상에서 유전 물질을 작동시켜 추가로 전환시킴으로써 부모계 유전형을 측정한다. 혈장 시료를 5,000-플렉스 반-내포된 표적화된 PCR 방법을 사용하여 유전자자리의 세트에 우선적으로 농축시킨다. DNA 단편의 혼합물을 서열분석에 적합한 DNA 라이브러리로 제조한다. 이후에 DNA를 고 배출 서열분석 방법, 예를 들면, ILLUMINA GAIIx GENOME ANALYZER를 사용하여 서열분석한다 서열분석은 DNA 속에 분자적으로 인코딩된 정보를 컴퓨터 하드웨어 속에 전기적으로 인코딩된 정보로 전환시킨다. 현재 개시된 구현예를 포함하는 정보학 기반 기술, 예를 들면, PARENTAL SUPPORTTM을 사용하여 태아의 배수성 상태를 측정한다. 이는 컴퓨터 상에서, 제조된 시료 상에서 이루어진 DNA 측정에 의하여 다수의 다형성 유전자자리에서 대립유전자 수 확률을 계산하고; 컴퓨터상에서 각각 염색체의 상이한 가능한 배수성 상태에 관한 다수의 배수성 가설을 생성하며; 컴퓨터상에서 각각의 배수성 가설에 대한 염색체 상의 다수의 다형성 유전자자리에서 예측된 대립유전자 수에 대한 결합 분포 모델을 구축하고; 컴퓨터 상에서 결합 분포 모델 및 제조된 시료에서 측정된 대립유전자 수를 사용하여 각각의 배수성 가설의 상대적인 확률을 측정하며; 최대 확률을 갖는 가설에 상응하는 배수성 상태를 선택함으로써 태아의 배수성 상태를 요청하는 단계를 포함할 수 있다. 태아는 다운 증후군을 갖는 것으로 측정된다. 보고서를 출력하거나, 임신한 여성의 산부인과 전문의에게 전기적으로 송신하며, 전문의는 여성에게 진단을 내린다. 여성, 그녀의 남편, 및 의사는 앉아서 이들의 의견을 논의한다. 그 쌍은, 태자녀 삼염색체성 상태로 고생한다는 지식을 기반으로 임신을 중단할 것을 결정한다.
일 구현예에서, 회사는 모친 채혈로부터, 잉태중인 태아에서 이수성을 검출하도록 설계된 진단 기술을 제공하는 것을 결정할 수 있다. 이들의 제품은, 모친이 그녀의 피를 채혈하는 그녀의 산부인과 전문의에게 보여주는 것을 포함할 수 있다. 산부인과 전문의는 또한 태아의 부친으로부터 유전 시료를 수집할 수 있다. 임상의는 모계 혈액에서 혈장을 분리하고, 혈장의 DNA를 정제한다. 임상의는 또한 모계 혈액에서 연막 층을 분리하여 연막으로부터 DNA를 제조할 수 있다. 임상의는 또한 부모 유전 시료로부터 DNA를 제조할 수 있다. 임상의는 본 기재내용에 기술된 분자 생물학 기술을 사용하여 혈장 시료에서 기원한 DNA 속의 DNA에 대한 공통의 증폭 태그를 부착한다. 임상의는 공통적으로 태그된 DNA를 증폭시킬 수 있다. 임상의는 하이브리드화에 의한 포획 및 태그된 PCR을 포함하는 다수의 기술에 의해 DNA를 우선적으로 농축시킬 수 있다. 태그된 PCR은 혈장 기원한 DNA의 효율적인 농축을 초래하는 중첩, 반-중첩 또는 어느 정도의 중첩, 또는 다른 어떠한 접근법을 포함할 수 있다. 표적화된 PCR은 예를 들면, 하나의 반응 용적 속에서 10,000개의 프라이머와 거대하게 다중화시킬 수 있으며, 여기서 프라이머는 염색체 13, 18, 21, X 및 X, 및 Y 둘 모두에 대해 일반적인 유전자자리, 및 임의로 다른 염색체에서 또한 SNP를 표적화한다. 선택적인 농축 및/또는 증폭은 상이한 태그, 분자 바코드, 증폭용 태그 및/또는 서열분석용 태그를 지닌 각각의 개개 분자를 태그화함을 포함할 수 있다. 이후에 임상의는 혈장 시료를 서열분석하고 또한 가능하게는 제조된 모계 및/또는 부계 DNA를 서열분석할 수 있다. 분자 생물학 단계는 진단 박스에 의해 전체적으로 또는 부분적으로 실행될 수 있다. 서열 데이터를 단일 컴퓨터, 또는 '혼탁'으로 발견될 수 있는 바와 같이, 계산 플랫폼(computing platform)의 다른 유형에 공급할 수 있다. 계산 플랫폼은 서열분석기에 의해 이루어진 측정에 의하여 표적화된 다형성 유전자자리에서 대립유전자 수를 계산할 수 있다. 계산 플랫폼은 염색체 13, 18, 21, X 및 Y 각각에 대해 결염색체성, 일염색체성, 이염색체성, 일치된 삼염색체성, 및 일치하지 않은 삼염색체성에 관한 다수의 배수성 가설을 생성할 수 있다. 계산 플랫폼은, 정보가 얻어지는 5개의 염색체 각각에 대한 각각의 배수성 가설에 대해 컴퓨터 상에서 표적화된 유전자자리에서 예측된 대립유전자 수에 대한 결합 분포 모델을 구축할 수 있다. 계산 플랫폼은, 각각의 배수성 가설이 결합 분포 모델 및 혈장 시료에서 기원한 우선적으로 농축된 DNA에서 측정된 대리병질 수를 사용하여 진실이 될 확률을 측정할 수 있다. 계산 플랫폼은 최대 확률로 적절한 가설에 상응하는 배수성 상태를 선택함으로써 각각의 염색체 13, 18, 21, X 및 Y에 대한, 태아의 배수성 상태를 요청할 수 있다. 요청된 배수성 상태를 포함하는 보고서를 생성하여, 이를 산부임과 전문의에게 전자적으로 송신하여, 출력 장치에서 나타낼 수 있거나, 보고서의 인쇄된 하드 카피를 산부인과 전문의에게 전달할 수 있다. 산부인과 전문의는 부모 및 임의로 태아의 부친에게 통지할 수 있으며, 이들은, 어떠한 임상적 선택이 그들에게 개방되어 있는지, 및 어느 것이 가장 바람직한지를 결정할 수 있다.
다른 구현예에서, 이후 "모"로 언급되는 임신한 여성은, 그녀가 그녀의 태자녀 어떠한 유전적 비정상 또는 다른 상태를 수반하고 있는지의 여부를 알기를 원하는지를 결정할 수 있다. 그녀는, 그녀가 임신을 지속하는 것을 확신하기 전에 어떠한 전체적인 이상이 없는지를 보증하기를 원할 수 있다. 그녀는 그녀의 혈액의 시료를 취할 수 있는 그녀의 산부인과 전문의를 방문할 수 있다. 그는 그녀의 뺨에서 본 면봉과 같은 유전 시료를 취할 수 있다. 그는 또한 볼 면봉, 정자 시료, 또는 혈액 시료와 같은 태아의 부친에서 유전 시료를 취할 수 있다. 그는 당해 시료를 임상의에게 보낼 수 있다. 임상의는 모계 혈액 시료 속에서 자유로이 부유하는 태아 DNA의 분획을 농축시킬 수 있다. 임상의는 모계 혈액 시료에서 핵화된 태아 혈액 세포의 분획을 농축시킬 수 있따. 임상의는 본원에 기술된 방법의 각종 측면을 사용하여 티아의 유전 데이터를 측정할 수 있다. 당해 유전 데이터는 태아의 배수성 상태, 및/또는 태아에서 질병 연관된 하나 또는 다수의 대립유전자의 실체를 포함할 수 있다. 태아 검진의 결과를 요약하는 보고서를 생성시킬 수 있다. 당해 보고서는 의사에게 전송되거나 우편으로 보내질 수 있으며, 의사는 태아의 유전 상태를 모에게 말할 수 있다. 모는, 태자녀 하나 이상의 염색체성, 또는 유전적 비정상, 또는 바람직하지 않은 상태를 가지고 있다는 사실을 기반으로 임신을 중지하는 것을 결정할 수 있다. 그녀는 또한, 태자녀 어떠한 전체적인 염색체성 또는 유전적 비정상, 또는 목적한 어떠한 유전적 상태를 가지고 있지 않다는 사실을 기반으로 임신을 지속하는 것을 결정할 수 있다.
다른 예는 정자 공여자에 의해 인공 수정되어 임신된 임신한 여성을 포함할 수 있다. 그녀는, 태자녀 유전 정보를 수반할 위험을 최소화하기를 원한다. 그녀는 전문의사에게 채혈하여, 본원에 기술된 기술을 사용하여 핵화된 태아 적혈구를 분리하며, 조직 시료는 또한 모친 및 유전적 부친에서 수집된다. 태아, 모친 및 부친의 유전 물질은 적절하게는 증폭시켜 ILLUMINA INFINIUM BEADARRAY를 사용하여 유전형 분석되며, 본원에 기술된 방법은 부모 및 태아 유전형을 고 정밀도로 세정하고 단계화하며, 태아에 대한 배수성 요청을 이룬다. 태자녀 정배수성인 것으로 밝혀지고, 표현형적 감수성이 재구축된 태아 유전형으로부터 예측되며, 보고서가 생성되면 모의 주치의에게 보내어 이들이 가장 우수한 임상 결정이 무엇일지를 결정할 수 있도록 한다.
일 구현예에서, 모친 및 부친의 조악한 유전 물질은, 서열이 유사하지만, 양이 보다 많은 DNA의 양으로 증폭시킴으로써 전환시킨다. 이후에, 유전형 분석 방법으로, 핵산에 의해 인코딩된 유전형 데이터를 위에 기술된 것들과 같은 기억 장치 상에 물리적 및/또는 전자적으로 저장할 수 있다. PARENTAL SUPPORTTM 알고리즘을 제조하는 관련 알고리즘, 이의 관련 부분은 본원에 상세히 논의되어 있으며 프로그래밍 언어를 사용하여 컴퓨터 프로그램으로 해석한다. 이후에, 비트 및 바이트를 물리적으로 인코딩하는 대신에, 조악한 측정 데이터를 나타내는 양식으로 정렬된, 컴퓨터 하드웨어 상의 컴퓨터 프로그램의 실행을 통해, 이들은 태아의 배수성 상태의 고 신뢰도 측정을 나타내는 양식으로 전환되어진다. 이러한 전환의 세부사항은 데이터 자체 및 본원에 기술된 방법을 실행하는데 사용된 컴퓨터 언어 및 하드웨어 시스템에 의존할 것이다. 이후에, 물리적으로 구성되어 태아의 고 품질 배수성 측정을 나타내는 데이터는 의사에게 보내질 수 있는 보고서로 전환된다. 이러한 전환은 프린터 또는 컴퓨터 디스플레이를 사용하여 수행될 수 있다. 보고서는 종이 위 또는 다른 적합한 매체 위에 인쇄된 카피일 수 있거나, 또는 이는 전자적일 수 있다. 전자 보고서의 경우에, 이는 전송될 수 있고, 의사가 접근가능한 컴퓨터 상의 위치에 기억 장치에 물리적으로 저장될 수 있거나, 또한 스크린에 나타내어 이를 판독할 수 있게 할 수 있다. 스크린 디스플레이의 경우에, 데이터는 디스플레이 장치 상의 화소(pixel)의 물리적 전환을 유발함으로써 판독가능한 양식으로 전환될 수 있다. 전환은 인광성 스크린에서 물리적으로 방사되는 전자의 방식에 의해, 광자를 방사하거나 흡수하는 기판의 전면에 놓일 수 있는 스크린 상의 화소의 특정한 세트의 투명성을 물리적으로 변화시키는 전기적 전하를 변경시킴에 의해 달성될 수 있다. 이러한 전환은 특수 세트의 화소에 있어서 네마틱에서 콜레스테릭 또는 스메틱 상까지, 액정 속의 분자의 나노규모 배향을 변형시킴으로써 달성할 수 있다. 이러한 전환은, 광자가 의미있는 양식으로 정렬된 다수의 발광 다이오드로 제조된 특수 세트의 픽셀로부터 방사되도록 하는 전류의 방식으로 달성할 수 있다. 이러한 전환은 컴퓨터 스크린, 또는 일부 다른 출력 장치 또는 전송 정보의 사용과 같은 디스플레이 정보를 사용한 다른 어떠한 방식으로 달성할 수 있다. 의사는 이후에 보고서에 따라 행동하여, 보고서 속의 데이터가 행동으로 전환되도록 한다. 이러한 행동은 임신을 지속하거나 중지시키는 것일 수 있으며, 이 경우 유전적 비정상인 잉태된 태아는 죽은 태아로 전환된다. 본원에 나열된 정보를 종합함으로써, 예를 들면, 임신한 모계 및 부계 유전 물질을, 본 기재내용에 요약된 다수의 단계를 통해 유전적 비정상인 태아의 낙태로 이루어지거나, 임신의 중지로 이루어진 의학적 결정으로 전환할 수 있다. 달리는, 주치의가 그의 임신한 환자를 치료하는 것을 돕는 보고서로 유전형 측정의 세트를 전환할 수 있다.
본원의 일 구현예에서, 본원에 기술된 방법을 사용하여 숙주 모, 즉, 임신한 여성이 그녀가 지닌 태아의 생물학적 모가 아닌 경우에도 태아의 배수성 상태를 측정할 수 있다. 본원의 일 구현예에서, 본원에 기술된 모를 사용하여 모계 혈액 시료만을 사용하고, 부계 유전 시료에 대한 요구없이 태아의 배수성 상태를 측정할 수 있다.
현재 개시된 구현예에서 수학의 일부는 이수성 상태의 제한된 수에 관한 가설을 만든다. 일부 경우에, 예를 들면, 단지 0, 1 또는 2개의 염색체가 각각의 환자에서 기원하는 것으로 예측된다. 본원의 일부 구현예에서, 수학적 편차는 사염색체성과 같은 이수성의 다른 형태를 고려하여 확장시킬 수 있으며, 여기서 3개의 염색체는 본원의 근본적인 개념을 변화시키지 않고, 하나의 부모, 오염색체성, 육염색체성 등에서 기원한다. 동시에, 보다 적은 수의 배수성 상태, 예를 들면, 단지 삼염색체성 및 이염색체성에 촛점을 맞추는 것도 가능하다. 전체 수가 아닌 염색체를 나타내는 배수성 측정은 유전 물질의 시료 속에서 모자이크 현상을 나타낼 수 있음에 주목한다.
일부 구현예에서, 유전 비정상은 다운 증후군(또는 삼염색체성 21), 에드워드 증후군(Edwards syndrome)(삼염색체성 18), 파타우 증후군(Patau syndrome)(삼염색체성 13), 터너 증후군(45X), 클라인펠터 증후군(Klinefelter's syndrome)(2X 염색체를 지닌 남성), 프라더-윌리 증후군, 및 디조지 증후군(DiGeorge syndrome)(UPD 15)과 같은 이수성 형태이다. 앞서의 문장에 나열된 것과 같은 선천적 장애는 일반적으로 바람직하지 않으며, 태자녀 하나 이상의 표현형적 비정상으로 고생한다는 지식은, 주치의가 임신을 종결시키고, 장애아의 출생에 준비하기 위한 필수적인 예방책을 취하거나, 염색체 비정상의 심각성을 낮추는 것을 의미하는 일부 치료학적 접근법을 취하는 결정에 대한 근거를 제공할 수 있다.
일부 구현예에서, 본원에 기술된 방법을 매우 초기 임신 기간에, 예를 들면 4주 정도로 조기, 5주 정도로 조기, 6주 정도로 조기, 7주 정도로 조기, 8주 정도로 조기, 9주 정도로 조기, 10주 정도로 조기, 11주 정도로 조기 및 12주 정도로 조기에 사용할 수 있다.
일부 구현예에서, 본원에 개시된 방법은 시험관 수정 동안 배아 선택을 위한 착상전 유전 진단(PGD)과 관련하여 사용되며, 여기서 표적 개체는 배자녀고, 부모계 유전형 데이터를 사용하여 3일째 배아의 1 또는 2개의 세포 생검 또는 5 또는 6일째 배아의 영양외배엽 생검에서 비롯된 서열분석 데이터에 의하여 배아에 대한 배수성 측정을 이룰 수 있다. PGD 설정에서, 자녀 DNA 만을 측정하며, 소수의 세포만, 일반적으로 1 내지 5개 그러나 10, 20 또는 50개 정도로 많은 세포가 시험된다. 이후에, A 및 B 대립유전자(SNP에서)의 출발하는 카피의 총 수는 자녀 유전형 및 다수의 세포에 의해 사소하게 측정된다. NPD에서, 출발하는 카피의 수는 매우 높으므로 PCR 후 대립유전자 비는 출발하는 비를 정밀하게 반영하는 것으로 예측된다. 그러나, PGD에서 소수의 출발 카피는, 오염 및 불완전한 PCR 효능이 PCR 후 대립유전자 비에서 사소한 효과를 가지지 않음을 의미한다. 당해 효과는 서열분석 후 측정된 대립유전자 비에서의 변화를 예측하는데 있어서 판독물의 깊이보다 더 중요할 수 있다. 공지된 자녀 유전형을 제공하는 측정된 대립유전자의 분포는 PCR 프로브 효능 및 오염 확률을 기반으로 한 PCR 공정의 몬테 카를로 시뮬레이션(Monte Carlo simul ation)으로 생성시킬 수 있다. 각각의 가능한 자녀 유전형에 대한 대립 형질 비 분포를 제공하여, 다양한 가설의 가능성을 NIPD에 대해 계산할 수 있다.
최대 확률 평가
생물학적 현상 또는 의학적 상태의 존재 또는 부재를 검출하기 위해 당해 분야에 공지된 대부분의 방법은 단일 가설 거부 시험의 사용을 포함하며, 여기서 상태와 관련된 미터법을 측정하고, 당해 미터법이 소정의 한계의 한 면에 있는 경우, 상태가 존재하지만, 미터법이 한계의 다른 면에 떨어지는 경우, 상태는 부재한다. 단일-가설 거부 시험은, 널(null)과 대안의 가설 사이에 결정하는 경우 널 분포를 관찰한다. 대안의 분포를 고려하지 않고, 관찰된 데이터에 의해 소정의 각 가설의 가능성을 평가할 수 없으므로 요청시 신뢰도를 계산할 수 없다. 따라서, 단일 가설 거부 시험을 사용하여, 특정한 경우와 관련된 신뢰도에 대한 느낌없이 긍정 또는 부정의 대답을 얻는다.
일부 구현예에서, 본원에 개시된 방법은 최대 확률 방법을 사용하여 생물학적 현상 또는 의학적 상태의 존재 또는 부재를 검출할 수 있다. 이는, 상태의 존재 또는 부재를 요청하기 위한 역치를 각각의 경우에 대해 적절한 것으로 조절할 수 있으므로 단일의 가설 거부 기술을 사용하는 방법보다 실질적으로 개선되어 있다. 이는 특히 모계 혈장에서 발견된 자유로이 부유하는 DNA 속에 존재하는 태아 및 모계 DNA의 혼합물로부터 입수할 수 있는 유전 데이터에 의하여 잉태된 태아에서 이수성의 존재 또는 부재를 측정하는 것을 목표로 하는 진단 기술과 특히 관련되어 있다. 이는, 혈장 기원한 분획 속의 태아 DNA의 분획이 변화하면서, 이수성 대 정배수성을 요청하기 위한 최적의 한계가 변하기 때문이다. 태아 분획이 떨어지면서, 이수성과 관련된 데이터의 분포는 정배수성과 관련된 데이터의 분포와 크게 유사해진다.
최대 확률 평가 방법을 각각의 가설과 관련된 분포를 사용하여 각각의 가설에 대해 조건화된 데이터의 가능성을 평가한다. 이후에, 이들 조건적 가능성을 가설 요청 및 신뢰도로 전환시킬 수 있다. 유사하게, 최대 귀납적 평가 방법을 최대 확률 평가와 동일한 조건부 확률을 사용하지만, 또한 가장 우수한 가설을 선택하여 신뢰도를 측하는 경우 이전의 집단을 포함한다.
따라서, 최대 확률 평가(MLE) 기술, 또는 밀접하게 관련된 최대 귀납적(MAP) 기술은 2개의 장점을 제공하는데, 첫째는 이것이 정확한 요청의 기회를 증가시키는 것이고, 이것이 또한 각각의 요청에 대해 신뢰도가 계산되도록 한다는 것이다. 일 구현예에서, 최대 확률로 가설에 상응하는 배수성 상태를 선택하는 것은 최대 확률 평가 또는 최대 귀납적 평가를 사용하여 수행한다. 일 구현예에서, 단일의 가설 거부 기술을 사용하는 당해 분야에 현재 공지된 어떠한 방법도 취하여 이를 재제형화함으로써 이것이 MLE 또는 MAP 기술을 사용하도록 함을 포함하는 잉태된 태아의 배수성 상태를 측정하기 위한 방법이 기재되되어 있다. 이들 기술을 적용함으로써 유의적으로 개선시킬 수 있는 방법의 일부 예는 미국 특허 제8,008,018호, 미국 특허 제7,888,017호, 또는 미국 특허 제7,332,277호에서 찾을 수 있다.
일 구현예에서, 태아 및 모계 게놈 DNA를 포함하는 모계 혈장 시료 속에서 태아 이수성의 존재 또는 부재를 측정하는 방법이 기술되어 있으며, 당해 방법은 모계 혈장 시료를 수득하는 단계; 혈장 시료 속에서 발견된 DNA 단편을 고 배출 서열분석기로 측정하는 단계; 서열을 염색체에 맵핑하여 각각의 염색체에 맵핑되는 서열 판독물의 수를 측정하는 단계; 혈장 시료 속의 태아 DNA의 분획을 계산하는 단계; 제2의 표적 염색체가 정배수성인 경우 존재하는 것으로 예측될 수 있는 표적 염색체의 양의 예측된 분포 및 이러한 염색체가 이수성이었던 경우 예측될 수 있는 하나 또는 다수의 예측된 분포를, 태아 분획 및, 정배수성인 것으로 예측된 하나 또는 다수의 참조 염색체를 맵핑하는 서열 판독물의 수를 사용하여 계산하는 단계; 및 MLE 또는 MAP를 사용하여 분포 중 어느 것이 가장 정확하게 될 가능성이 있는지를 측정함으로써 태아 이수성의 존재 또는 부재를 나타내는 단계를 포함한다. 일 구현예에서, 혈장의 DNA를 측정하는 단계는 거대하게 평행한 셧건 서열분석을 수행하는 단계를 포함할 수 있다. 일 구현예에서, 혈장 시료의 DNA를 측정하는 단계는 예를 들면, 표적화된 증폭을 통해 다수의 다형성 또는 비-다형성 유전자자리에서 우선적으로 농축된 DNA를 서열분석하는 단계를 포함할 수 있다. 다수의 유전자자리는 하나 또는 소수의 예측된 이수성 염색체 및 하나 또는 소수의 참조 염색체를 표적화하도록 설계될 수 있다. 우선적인 농축의 목적은 배수성 측정을 위해 유익한 서열 판독물의 수를 증가시키는 것이다.
배수성 요청 정보학 방법
서열 데이터가 소정의 태아의 배수성 상태를 측정하기 위한 방법이 본원에 기술되어 있다. 일부 구현예에서, 당해 서열은 고 배출 서열분석기 상에서 측정할 수 있다. 일부 구현예에서, 당해 서열 데이터는 모계 혈액에서 분리된 자유로이 부유하는 DNA에서 기원한 DNA 상에서 측정할 수 있으며, 여기서 자유로이 부유하는 DNA는 모체 기원의 일부 DNA, 및 태아/태반 기원의 일부 DNA를 포함한다. 이러한 부분은 본원의 일 구현예를 기술할 것이며, 여기서 태아의 배수성 상태는 분석된 혼합물 속의 태아 DNA의 분획이 알려져 있지 않고 데이터에 의하여 평가될 것으로 추정하여 측정한다. 또한 혼합물 속의 태아 DNA의 분획("태아 분획") 또는 태아 DNA의 퍼센트가 다른 방법으로 측정될 수 있고 태아의 배수성 상태를 측정하는데 있어서 알려져 있는 것으로 추정되는 양태를 기술할 것이다. 일부 구현예에서, 태아 분획은 태아 및 모계 DNA의 혼합물인, 모계 혈액 시료 자체에서 이루어진 유전형 측정만을 사용하여 계산할 수 있다. 일부 구현예에서, 분획은 또한 모친의 측정되거나 달리 알려진 유전형 및/또는 부친의 측정되거나 달리 공지된 유전형을 사용하여 계산할 수 있다. 다른 구현예에서, 태아의 배수성 상태는 이염색으로 추정된 참조 염색체에 대한 태아 DNA의 계산된 분획과 비교하여 문제의 염색체에 대한 태아 DNA의 계산된 분획을 기반으로 유일하게 측정될 수 있다.
바람직한 구현예에서, 특정한 염색체에 대해, 본 발명자들은 N개의 SNP를 관찰하고 분석하고, 이에 대해 다음을 가진 것으로 가정한다:
●NR 자유로이 부유하는 DNA 서열 측정 S=(s1,....,sNR)을 설정한다. 당해 방법은 SNP 측정을 이용하므로, 비-다형성 유전자자리에 상응하는 모든 서열 데이터를 무시할 수 있다. 본 발명자들이 각각의 SNP에 대해 (A,B) 수(여기서 A 및 B는 소정의 유전자자리에서 2개의 대립유전자에 상응한다)를 갖는 단순화된 버젼에서, S는 S=((a1,b1),....,(aN, bN))(여기서 ai는 SNP i 에서 A 수이고, bi는 SNP i 에서 B 수이다),
Figure 112015017677503-pct00001
이다.
●부모 데이터는 다음으로 이루어진다:
○ SNP 미세배열의 유전형 또는 다른 강도에 기반한 유전형 플랫폼:
모친 M=(m1,...,mN), 부친 F=(f1,...,fN)(여기서 mi, fi
Figure 112015017677503-pct00002
(AA,AB, BB)이다).
○ AND/OR 서열 데이터 측정: NRM 모친 측정 SM=(sm1,...,smnrm), NRF 부친 측정 SF=(sf1,...,sfnrf). 상기 증폭과 유사하게, 본 발명자가 각각의 SNP에서 (A,B) 수를 갖는 경우 SM은 ((am1,bm1),...,(amN, bmN)), SF=((af1,bf1),...,(afN, bfN))이다.
종합적으로, 모친, 부친 자녀 데이터는 D = (M,F,SM,SF,S)로 나타낸다. 부모 데이터가 바람직하고 알고리즘의 정밀도를 증가시키지만, 특히 부계 데이터는 필수적이지 않다(NOT). 이는, 심지어 모계 및/또는 부계 데이터의 부재하에서도, 매우 정밀한 카피 수 결과를 얻는 것이 가능함을 의미한다.
고려된 전체 가설(H)에 걸쳐 데이터 로그 가능성
Figure 112015017677503-pct00003
을 최대화하여 가장 우수한 수 평가(
Figure 112015017677503-pct00004
를 유도하는 것이 가능하다. 특히, 제조된 시료에서 측정된 결합 분포 모델 및 대립유전자 수를 사용하고, 이러한 상대적 확률을 사용하여 배수성 가설 각각의 상대적인 확률을 측정하여 다음과 같이 교정될 가능성이 가장 큰 가설을 측정한다:
Figure 112015017677503-pct00005

유사하게, 데이터를 제공한 귀납적 가설 가능성은 다음과 같이 쓰여질 수 있다:
Figure 112015017677503-pct00006

여기서, priorprob(H)는 모델 설계 및 선행 지식을 기반으로, 각각의 가설 H에 대해 지정된 선행 확률(prior probability)이다.
선행들(priors)을 사용하여 최대의 귀납적 평가를 찾는 것도 또한 가능하다:
Figure 112015017677503-pct00007

일 구현예에서, 고려될 수 있는 카피 수 가설은 다음과 같다:
● 일염색체성:
○ 모친 H10(모친의 1개의 카피)
○ 부친 H01(부친의 1개의 카피)
● 이염색체성: H11(모친 및 부친 각각 1개의 카피)
● 단순한 삼염색체성, 교차는 고려되지 않는다:
○ 모친: H21_일치됨(모친의 2개의 동일한 카피, 부친의 1개의 카피), H21_일치되지 않음(모친의 카피, 부친의 1개의 카피 둘 모두)
○ 모친: H12_일치됨(모친의 1개의 카피, 부친의 2개의 동일한 카피), H12_일치되지 않음(모친의 1개의 카피, 부친의 카피 둘 모두)
● 복잡한 삼염색체성, 교차 허용(결합 분포 모델 사용):
○ 모친 H21(모친의 2개의 카피, 부친의 1개의 카피),
○ 부친 H12(모친의 1개의 카피, 부친의 2개의 카피)
다른 구현예에서, 결염색체성(H00), 편친 이염색체성(H20 및 H02), 및 사염색체성(H04, H13, H22, H31 및 H40)이 고려될 수 있다.
교차가 존재하지 않는 경우, 각각의 삼염색체성은, 기원이 유사분열, 감수분열 I, 또는 감수분열 II이었던 것에 상관없이, 일치하거나 일치하지 않는 삼염색체성 중의 하나일 수 있다. 교차로 인하여, 실제의 삼염색체성은 일반적으로 2의 조합이다. 첫째로, 단순한 가설에 대한 가설 가능성을 유도하는 방법이 기술되어 있다. 이후에, 복잡한 가설에 대한 가설 가능성을 유도하기 위한 방법이 개개 SNP 가능성을 교차와 결합시켜 기술되어 있다.
단순한 가설에 대한 LIK (D|H)
일 구현예에서, LIK(D|H)는 다음과 같은 단순한 가설에 대해 측정될 수 있다. 단순한 가설 H의 경우, 전체 게놈에서 가설 H의 로그 가능성, LIK(H)는, 공지되거나 기원한 자녀 분획 cf를 추정하여 개개의 SNP의 로그 가능성의 합으로서 계산될 수 있다. 일 구현예에서 데이터로부터 cf를 유도시키는 것이 가능하다.
Figure 112015017677503-pct00008

이러한 가설은 SNP 사이의 어떠한 연결도 추정하지 않으므로, 결합 분포 모델을 이용하지 않는다.
일부 구현예에서, Log 가능성은 SNP 기준당 측정할 수 있다. 특정 SNP i에서, 태아 배수성 가설 H 및 태아 DNA 퍼센트 cf를 추정할 때, 관찰된 데이터 D의 로그 가능성은 다음과 같이 정의된다:
Figure 112015017677503-pct00009

여기서, m은 가능한 실제 모계 유전형이고, f는 가능한 실제 부계 유전형이며, 여기서, m,f
Figure 112015017677503-pct00010
{AA,AB,BB}이고, c는 가설 H를 제공한 가능한 자녀 유전형이다. 특히, 일염색체성의 경우 c
Figure 112015017677503-pct00011
, 이염색체성의 경우 c
Figure 112015017677503-pct00012
, 삼염색체성의 경우 c
Figure 112015017677503-pct00013
이다.
유전형 선행 빈도: p(m|i)는 pA i 로 나타낸, SNP I에서 공지된 집단 빈도에 기초한, SNP i에서의 모계 유전형의 일반적인 선행 확률이다. 특히
Figure 112015017677503-pct00014
,
Figure 112015017677503-pct00015
,
Figure 112015017677503-pct00016
이다.
부친 유전형 확률, p(f|i)은 유사한 방식으로 측정될 수 있다.
실제 자녀 확률:
Figure 112015017677503-pct00017
은 부모 m, f을 제공하고, 용이하게 계산될 수 있는 가설 H를 추정하여, 실제 자녀 유전형 = c를 얻을 확률이다. 예를 들면, H11의 경우, H21은 일치하며 H21은 일치하지 않고, p(c|m,f,H)는 하기 제공된다.
Figure 112015017677503-pct00018

matched: 일치됨, unmatched: 일치되지 않음
데이터 가능성:
Figure 112015017677503-pct00019
은 실제 모계 유전형 m, 실제 부계 유전형 f, 실제 자녀 유전형 c, 가설 H 및 자녀 분획 cf를 고려해볼 때, SNP i 에서의 특정 데이터 D의 확률이다. 이는 다음과 같이 모친, 부친 및 자녀 데이터의 확률로 나눌 수 있다:
Figure 112015017677503-pct00020

모친 SNP 배열 데이터 가능성: SNP 배열 유전형이 정확하다고 가정할 시 실제 유전형 m과 비교한 SNP i에서의 모친 SNP 배열 유전형 데이터
Figure 112015017677503-pct00021
은 단순히
Figure 112015017677503-pct00022
이다.
모친 서열 데이터 가능성: SNP i 에서의 모친 서열 데이터의 확률은, 수 Si=(ami,bmi)의 경우에, 가외의 노이즈 또는 편향이 연관되지 않을 시, P(SM|m,i)=PX |m(ami)로 정의된 바이어스 확률이고, 여기서, X|m~Binom(pm(A), ami+bmi)와
Figure 112015017677503-pct00023
는 다음과 같이 정의된다:
Figure 112015017677503-pct00024

no call: 요청 없음
부친 데이터 가능성: 유사한 식을 부계 데이터 가능성에 적용한다. 부모 데이터, 특히 부계 데이터의 부재하에 자녀 유전형을 결정하는 것이 가능함에 주목한다. 예를 들어, 부계 유전형 데이터 F가 이용가능한 경우, 바로
Figure 112015017677503-pct00025
을 사용할 수 있다. 부계 서열 데이터 SF가 이용가능하지 않은 경우, 바로 P(SF|f,i)=1을 이용할 수 있다.
일부 구현예에서, 당해 방법은 배수성 가설 각각에 대한 염색체 상의 다수의 다형성 유전자 자리에서의 예측된 대립유전자 수에 대한 결합 분포 모델을 구축함을 포함한다: 하나의 방법은 본원에 기술된 목적을 달성하는 것이다. 유리된 태아 DNA 데이터 가능성:
Figure 112015017677503-pct00026
는 실제 모계 유전형 m, 실제 자녀 유전형 c, 자녀 카피 수 가설 H를 고려해볼 때, 그리고, 자녀 분획 cf를 추정할 시, SNP i 에서의 유리된 태아 DNA 서열 데이터의 확률이다. 이는 사실 SNP i
Figure 112015017677503-pct00027
에서 A 함량의 실제 확률을 고려해볼 때, SNP I에서 서열 데이터 S의 확률이다.
Figure 112015017677503-pct00028

계수를 위해, Si는 (ai,bi)이고, 데이터 속에 초과의 노이즈 또는 편향이 포함되지 않으며,
Figure 112015017677503-pct00029

여기서 X는 Binom(p(A), ai+bi)이고 p(A)=
Figure 112015017677503-pct00030
이다. 정확한 정렬 및 SNP당 (A,B) 수가 알려져 있지 않은 보다 복잡한 경우에,
Figure 112015017677503-pct00031
는 통합된 바이어스의 조합이다.
실제 A 함량 확률:
Figure 112015017677503-pct00032
, 이러한 모친/부친 혼합물의 SNP i 에서 A 함량의 실제 확률은, 실제 모계 유전형 = m, 실제 자녀 유전형 = c, 및 전체 자녀 분획 = cf를 추정하면, 다음과 같이 정의된다:
Figure 112015017677503-pct00033

여기서 #A(g)는 유전형 g의 A의 수이고,
Figure 112015017677503-pct00034
은 모의 소미(somy)이고
Figure 112015017677503-pct00035
는 가설 H 하의 자녀의 배수성(일염색체성의 경우 1, 이염색체의 경우 2, 삼염색체성의 경우 3)이다.
결합 분포 모델의 사용: 복합 가설에 대한 LIK (D|H)
일부 구현예에서, 당해 방법은 각각이 배수성 가설에 대한 염색체의 다수의 다형성 유전자자리에서 예측된 대립유전자 수에 대한 결합 분포 모델의 구축을 포함하고; 이러한 목표를 달성하기 위한 한가지 방법이 본원에 기술되어 있다. 많은 경우에, 삼염색체성은 일반적으로 교차로 인하여 순수하게 일치하지 않거나 일치하지 않으므로, 당해 단락에서는 복합 가설 H21(모계 삼염색체성) 및 H12(부모계 삼염색체성)에 대한 결과를 유도하고, 이를 가능한 교차를 고려하여, 일치된 및 일치되지 않은 삼염색체성과 합한다.
삼염색체성의 경우에, 교차가 존재하지 않는 경우, 삼염색체성은 단순이 일치하거나 일치하지 않는 삼염색체성일 수 있다. 일치한 삼염색체성은, 자녀가 하나의 부모로부터 동일한 염색체 분절 중의 2개 카피를 유전받은 경우이다. 일치하지 않은 삼염색체성은, 자녀가 부모로부터 각각이 동종 염색체 분절의 하나의 카피를 유전받은 경우이다. 교차로 인하여, 염색체의 일부 분절은 일치한 삼염색체성을 가질 수 있으며, 다른 부분은 일치하지 않는 삼염색체성을 가질 수 있다. 당해 단락에는 대립유전자들의 세트에 대한, 즉, 하나 이상의 가설에 대한 다수의 유전자자리에서 예측된 대립유전자 수에 대한 이형접합성 비율에 대한 결합 분포 모델을 구축하는 방법이 기술되어 있다.
SNP i에서,
Figure 112015017677503-pct00036
는 일치된 가설 Hm에 대한 적합성이고,
Figure 112015017677503-pct00037
는 일치되지 않은 가설 Hu에 대한 적합성이며 pc(i)는 SNPs i-1와 i 사이의 교차 확률로 가정한다. 그런 다음, 완전한 가능성을 다음과 같이 계산할 수 있다:
Figure 112015017677503-pct00038

여기서,
Figure 112015017677503-pct00039
는 SNP 1:N에 대해 가설에서 종결 가능성이다. E는 마지막 SNP, E
Figure 112015017677503-pct00040
의 가설이다. 반복적으로, 다음을 계산할 수 있다:
Figure 112015017677503-pct00041

여기서, ~E는 E(E가 아님) 이외의 가설이고, 여기서 고려된 가설은 Hm 및 Hu이다. 특히, 동일한 가설 및 비 교차, 또는 반대의 가설 및 교차를 사용하여 1 대 (i-1) SNP의 가능성을 기반으로, SNPi의 가능성을 곱하여 1:i SNP의 가능성을 계산할 수 있다.
SNP 1의 경우, i=1,
Figure 112015017677503-pct00042
이다.
SNP 2의 경우, i=2,
Figure 112015017677503-pct00043
, i=3:N의 경우 등이다.
일부 구현예에서, 자녀 분획을 측정할 수 있다. 자녀 분획은 자녀에서 기원한 DNA의 혼합물 중 서열의 비를 말할 수 있다. 비-침입성 태아 진단과 관련하여, 자녀 분획은 태아 또는 태아 유전형을 지닌 태반의 일부에서 기원한 모계 혈장 속의 서열의 비를 말할 수 있다. 이는 모계 혈장으로부터 제조된 DNA의 시료속의 자녀 분획을 말할 수 있으며 태아 DNA 속에 농축될 수 있다. DNA의 시료 속에서 자녀 분획을 측정하는 한가지 목적은 태아 상에서 배수성 요청을 이룰 수 있는 알고리즘을 사용하기 위한 것이므로, 자녀 분획은, 비-침입성 태아 검진의 목적을 위해 서열분석하여 분석한 어떠한 DNA 시료도 말할 수 있다.
비-침입성 태자녀 이수성 진단의 방법의 일부인 본 기재내용에 나타낸 알고리즘 중의 일부는 공지된 자녀 분획을 추정하며, 이는 항상 이 경우가 아닐 수 있다. 일 구현예에서, 부모계 데이터의 존재와 함께 또는 존재없이, 선택된 염색체에서 이염색체성에 대한 가능성을 최대화시킴으로써 가장 큰 가능성의 자녀 분획을 찾은 것이 가능하다.
특히, 이염색체성 가설에 대해서 및 염색체 chr에서 자녀 분획 cf에 대해, 위에서 기술된 바와 같은 LIK(D| H11, cf, chr) = log 가능성을 가정한다. Cset 에서 선택된 염색체의 경우(일반적으로 1:16), 정배수성인 것으로 추정하면, 완전한 가능성은 다음과 같다:
Figure 112015017677503-pct00044

가장 가능성 있는 자녀 분획 (
Figure 112015017677503-pct00045
Figure 112015017677503-pct00046
Figure 112015017677503-pct00047
로서 유도된다.
어떠한 염색체들의 세트도 사용하는 것이 가능하다. 또한 참조 염색체에서 정배수성을 추정하지 않고 자녀 분획을 유도하는 것이 가능하다. 당해 방법을 사용하여 다음 상황 중 어느 것에 대한 자녀 분획을 측정하는 것이 가능하다: (1) 하나는 부모에서 배열 데이터 및 모계 혈장에서 셧건 서열분석 데이터를 갖는다; (2) 하나는 부모에서 배열 데이터 및 모계 혈장에서 표적화된 서열분석 데이터를 갖는다; (3) 하나는 부모계 및 모계 혈장 둘 모두에서 표적화된 서열분석 데이터를 갖는다; (4) 하나는 모계 및 모계 혈장 분획 둘 모두에서 표적화된 서열분석 데이터를 갖는다; (5) 하나는 모계 혈장 분획에서 표적화된 서열분석 데이터를 갖는다; (6) 부모 및 자녀 분획 측정의 다른 조합.
일부 구현예에서 정보학 방법을 데이터 드롭아웃에 포함시킬 수 있으며; 이는 보다 높은 정밀도의 배수성 측정을 초래할 수 있다. 본원의 어딘가에 A를 얻을 확률은 실제 모계 유전형, 실제 자녀 유전형, 혼합물 중 자녀의 분획, 및 자녀 카피 수의 직접적인 함수인 것으로 추정하여 왔다. 또한 모계 또는 자녀 대립유전자가 예를 들면, 혼합물 속에서 실제 자녀 AB를 측정하는 것 대신 드롯 아웃될 수 있음이 가능하며, 이는, 대립유전자 A로 맵핑되는 유일한 서열이 측정되는 경우일 수 있다. 게놈 조명 데이터에 대한 부모 드롭아웃 비율 dpg, 서열 데이터에 대한 부모 드롭아웃 비율 dps 및 서열 데이터에 대한 자녀 드롭아웃 비율 dcs를 주목할 수 있다. 일부 구현예에서, 모계 드롭아웃 비율은 0인 것으로 추정될 수 있으며, 자녀 드롭아웃 비율은 낮고; 이 경우, 결과는 드롭아웃에 심각하게 영향받지 않는다. 일부 구현예에서, 대립유전자 드롭아웃의 확률은, 이들이 예측된 배수성요청의 유의적인 효과를 생성하기에 충분히 클 수 있다. 이러한 경우에, 대립유전자 드롭아웃은 여기의 알고리즘으로 포함된다:
부모 SNP 배열 데이터 드롭아웃: 모계 게놈 데이터 M의 경우, 드롭아웃 후 유전형을 md로 가정하면
Figure 112015017677503-pct00048
이고,
여기서 이전과 같이
Figure 112015017677503-pct00049
이며,
Figure 112015017677503-pct00050
는 드롭아웃 비율 d에 대해, 아래에 정의된 바와 같이, 실제 유전형 m을 고려해볼 때, 가능한 드롭아웃 후 유전형 md의 가능성이다.
Figure 112015017677503-pct00051

no call: 요청 없음
유사한 식을 부계 SNP 배열 데이터에 적용한다.
부모계 서열 데이터 드롭아웃: 모계 서열 데이터 SM에 대해
Figure 112015017677503-pct00052
이고,
여기서,
Figure 112015017677503-pct00053
은 상기 단락에서와 같이 정의되며 바이어스 분포로부터 판별한
Figure 112015017677503-pct00054
확률은 부모계 데이터 가능성 단락에서 앞서와 같이 정의된다. 유사한 식을 부모계 서열 데이터에 적용한다.
자유 부유하는 DNA 서열 데이터 드롭아웃:
Figure 112015017677503-pct00055

여기서,
Figure 112015017677503-pct00056
는 자유 부유하는 데이터 가능성에 있어서 본 단락에서 정의한 바와 같다.
구현예에서,
Figure 112015017677503-pct00057
은 실제 모계 유전형
Figure 112015017677503-pct00058
을 제공하고, 드롭아웃 비율 dps
Figure 112015017677503-pct00059
를 관찰된 자녀 유전형
Figure 112015017677503-pct00060
의 확률로 가정하며, 실제 자녀 유전형
Figure 112015017677503-pct00061
를 제공하고, 드롭아웃 비율 dcs를 추정할 때 관찰된 모계 유전형
Figure 112015017677503-pct00062
의 확률이다. nAT가 실제 유전형 c의 A 대립유전자의 수이고, nAD는 관찰된 유전형
Figure 112015017677503-pct00063
에서 A 대립유전자의 수이고, 여기서 nAT = nAD이며 유사하게 nBT는 실제 유전형 c에서 B 대립유전자의 수이며, nBD는 관찰된 유전형
Figure 112015017677503-pct00064
에서 B 대립유전자의 수이고, 여기서 nBT ≥ nBD 이며 d는 드롭아웃 비율인 경우,
Figure 112015017677503-pct00065
이다.
일 구현예에서, 정보학 방법은 무작위 및 지속적인 편향을 포함할 수 있다. 이상적인 단어에서 다수의 서열 수에 있어서 SNP 당 지속적인 시료채취 바이어스 또는 무작위 노이즈(이항 분포 변화 외에)는 존재하지 않는다. 특히, SNP i에서, 모계 유전형 m의 경우, 실제 자녀 유전형 c 및 자녀 분획 cf, 및 X가 SNP i에서 (A+B) 판독물들의 세트 중 A의 수인 경우, X는 X~이항(p, A+B)과 같이 작동하며, 여기서 p는
Figure 112015017677503-pct00066
이고 A 함량의 실제 확률이다.
일 구현예에서, 정보학 방법은 무작위 편향을 포함할 수 있다. 흔한 경우로서, 측정시 a 편향이 존재하는 것으로 가정하여 당해 SNP에서 A를 얻을 확률은 q와 같으며, 이는 상기에 정의한 바와 같은 p와는 약간 상이하다. p가 q와 상이한 정도는 측정 과정의 정밀도 및 다른 인자의 수에 의존하며 p와는 떨어진 q의 표준 편차로 정량화할 수 있다. 일 구현예에서, p에서 중심에 있는 분포의 평균, 일부 규정된 표준 편차 s에 따라 매개변수
Figure 112015017677503-pct00067
와 함께, 베타 변수를 가지는 것으로 q를 모델화하는 것이 가능하다. 특히, 이는
Figure 112015017677503-pct00068
를 제공하며, 여기서
Figure 112015017677503-pct00069
이다.
Figure 112015017677503-pct00070
로 놓은 경우 매개변수
Figure 112015017677503-pct00071
Figure 112015017677503-pct00072
로 유도될 수 있으며, 여기서
Figure 112015017677503-pct00073
이다.
이는 베타-이항 분포의 정의이며, 여기서 하나는 가변 매개변수 q를 갖는 바이어스 분포로부터 판별한 시료채취이고, 여기서 q는 평균 p를 지닌 베타 분포를 따른다. 따라서, 편향이 없는 설정에서, SNP i에서, 실제 모친 유전형 (m)을 추정하는 부모 서열 데이터(SM) 확률은, SNP i에서 모친 서열 A의 수(ami) 및 SNP i에서 모친 서열 B의 수(bmi)를 고려해볼 때, 다음과 같이 계산할 수 있다:
P(SM|m,i)=PX |m(ami); 여기서 X|m~Binom(pm(A), ami+bmi)
이제, 표준 편차 s를 사용한 무작위 편향을 포함하는, 이는 다음과 같이 된다:
X|m~BetaBinom(pm(A), ami+bmi,s)
편향이 없는 경우, 실제 모친 유전형(m), 실제 자녀 유전형(c), 자녀 분획(cf)을 추정하는 모계 혈장 DNA 서열 데이터 (S) 확률은, 자녀 가설 H를 가정할 시, SNP i에서 자유 부유하는 DNA 서열 A의 수 (ai) 및 SNP i에서 자유 부유하는 서열 B의 (bi)를 고려해볼 때, 다음과 같이 계산할 수 있다:
Figure 112015017677503-pct00074

여기서 X는 바이어스(p(A), ai+bi)이고, p(A)는
Figure 112015017677503-pct00075
이다.
일 구현예에서, 표준 편차 s를 사용하는 무작위 편향을 포함하는, 이는 X~BetaBinom(p(A),ai+bi,s)이 되고, 여기서 초과의 변수의 양은 편차 매개변수 s로 규정되거나, 동등하게 N으로 규정된다. s의 값이 작을수록(또는 N의 값이 클수록) 당해 분포는 정규 바이어스 분포에 가까워진다. 편향의 양, 즉, 명확한 내용 AA|AA, BB|BB, AA|BB, BB|AA로부터 상기 N을 추정하여 상기 확률에서 추정된 N을 사용하는 것이 가능하다. 데이터의 거동에 따라서, N은 판독물 ai+bi의 깊이와 상관없이 상수 또는 ai+bi의 함수인 것으로 하여, 판독물의 보다 큰 깊이에 대해 보다 작은 편향을 이룰 수 있다.
일 구현예에서, 정보학 방법은 지속적인 SNP-당 편향을 포함할 수 있다. 서열분석 공정의 인공물로 인하여, 일부 SNP는 실제 A 성분의 양과는 관계없이 지속적으로 보다 낮거나 보다 높을 수 있다. SNP i가 wi 퍼센트의 편향을 다수의 A 수에 가하는 것으로 가정한다. 일부 구현예에서, 이러한 편향은 동일한 조건 하에서 유도된 훈련 데이터의 세트로부터 평가하여, 다음과 같은 부모계 서열 데이터 평가에 다시 가할 수 있고:
P(SM|m,i)=PX |m(ami); 여기서 X|m~BetaBinom(pm(A)+ wi, ami+bmi,s)
자유 부유하는 DNA 서열 데이터 확률을 다음과 같이 평가할 수 있다:
Figure 112015017677503-pct00076

여기서 X는 BetaBinom(p(A)+ wi,ai+bi,s)이다.
일부 구현예에서, 당해 방법은 추가의 노이즈, 차등적인 시료 품질, 차등적인 SNP 품질, 및 무작위 시료채취 편향을 특이적으로 고려하여 씌여질 수 있다. 이의 예는 본원에 제공되다. 당해 방법은 거대한 다중화 미니-PCR 프로토콜을 사용하여 생성된 데이터의 내용에서 특히 유용한 것으로 밝혀졌으며 실험 7 내지 13에서 사용되었다. 당해 방법은 각각 최종 모델에 상이한 종류의 노이즈 및/또는 편향을 도입하는 수개의 단계를 포함한다:
(1) 모계 및 태아 DNA의 혼합물을 함유하는 제1의 시료가 일반적으로 1,000 내지 40,000의 범위인, 크기가 N0인 분자의 원래의 양을 함유하는 것으로 가정하며, 여기서 p는 실제 %ref이고,
(2) 공통의 연결 어댑터를 사용하는 증폭에서, N1개 분자; 일반적으로 N1 ~ N0/2 분자를 시료채취하며 무작위 시료채취 편향을 시료채취에 기인하여 도입하는 것으로 추정한다. 증폭된 시료는 다수의 분자 N2를 함유할 수 있으며, 여기서 N2 >> N1이다. X1이 N1개의 시료채취된 분자 중 참조 유전자자리(SNP 바이어스 당)의 양을 나타내고, 프로토콜의 나머지 전체에서 무작위 시료채취 편향을 도입하는 변수, p1= X1/N1를 나타내도록 한다. 당해 시료채취 편향은 단순한 바이어스 분포 모델을 사용하는 것 대신에, 베타-이항(BB) 분포를 사용함으로써 당해 모델에 포함시킨다. 베타-이항 분포의 매개변수 N은 0<p<1인 SNP에서, 누출 및 증폭 편향에 대해 조절한 후 훈련 데이터로부터 시료 바이어스 당으로 이후에 평가될 수 있다. 누출은, SNP가 잘못 판독되는 가능성이다.
(3) 증폭 단계는 어떠한 대립유전자 편향도 증폭시킬 것이므로, 증폭 편향은 가능한 균일하지 않은 증폭으로 인하여 도입된다. 유전자자리에서 하나이 대립유전자가 f 횟수로 증폭되고 당해 유전자자리에서 다른 대립유전자가 g 횟수로 증폭된다고 가정하면, 여기서 f=geb(여기서 b는 0이다)는 편향이 없음을 나타낸다. 바이어스 매개변수, b가 0에서 중심에 있는 경우 얼마나 더 많거나 적은 A 대립유전자가 특정한 SNP에서 B 대립유전자에 대치되어 증폭되는지를 나타낸다. 매개변수 b는 SNP에서 SNP까지 상이할 수 있다. 바이어스 매개변수 b는 SNP 편향당, 예를 들면, 훈련 데이터에 의하여 평가될 수 있다.
(4) 서열분석 단계는 증폭된 분자의 시료를 서열분석함을 포함한다. 당해 단계에서, 누출이 존재할 수 있으며, 여기서 누출은, SNP가 부정확하게 판독되는 상황이다. 누출은 어떠한 수의 문제로부터도 생성될 수 있으며, 정확한 대립유전자 A로서 뿐 아니라 이러한 유전자자리에서 발견된 다른 대립유전자 B 또는 이러한 유전자자리에서 전형적으로 발견되지 않은 대립유전자 C 또는 D로서의 판독물인 SNP를 생성할 수 있다. 서열분석이 크기 N3(여기서 N3 < N2이다)인 증폭된 시료의 다수의 DNA 분자의 서열 데이터를 측정하는 것을 가정한다. 일부 구현예에서, N3은 20,000 내지 100,000; 100,000 내지 500,000; 500,000 내지 4,000,000; 4,000,000 내지 20,000,000; 또는 20,000,000 내지 100,000,000의 범위일 수 있다. 시료채취된 각각의 분자는 정확하게 판독되는 확률 pg를 가지며, 이 경우 이는 대립유전자 A로서 정확하게 나타날 것이다. 시료는 1-pg의 확률로 원래의 분자와 관련되지 않은 대립유전자로서 부정확하게 판독될 것이며, 확률 pr로서 대립유전자 A와 같이, 확률 pm으로서 대립유전자 B와 같이 또는 확률 po로서 대립유전자 C 또는 대립유전자 D와 같이 보일 것이고, 여기서 pr+pm+po는 1이다. 매개변수 pg, pr, pm, po는 훈련 데이터에 의하여 SNP 기반으로 평가된다.
상이한 프로토콜은 상이한 양의 무작위 시료채취, 상이한 수준의 증폭 및 상이한 유출 편향을 생성하는 분자 생물학 단계에서 변수와 함께 유사한 단계를 포함할 수 있다. 다음의 모델을 이들 경우 각각에 잘 적용시킬 수 있다. SNP 기반 당, 시료채취된 DNA의 양에 대한 모델은 다음과 같이 제공된다:
X3~베타이항(L(F(p,b),pr,pg), N*H(p,b))
여기서 p는 참조 DNA의 실제량이고, b는 SNP 바이어스 기준이며, 상기 기술된 바와 같고, pg는 정확한 판독물의 확률이며, pr은 위에서 기술된 바와 같이, 부정확하지만 우연히 정확한 대립유전자로 보일 확률이고:
Figure 112015017677503-pct00077

일부 구현예에서, 당해 방법은 단순한 바이어스 분포 대신에 베타-이항 분포를 사용하며; 이는 무작위 시료채취 편향을 고려한다. 베타-이항 분포의 매개변수 N은 요구된 기준에서 시료 기준당으로 평가된다. 단지 p 대신에, 바이어스 교정 F(p,b), H(p,b)를 사용하여 증폭 편향을 고려한다. 편향의 매개변수 b는 예정보다 빨리 훈련 데이터에 의하여 SNP 기준당으로 평가된다.
일부 구현예에서, 당해 방법은 p 대신에 누출 정정L(p,pr,pg)을 사용하며; 이는 누출 편향, 즉, 다양한 SNP 및 시료 품질을 고려한다. 일부 구현예에서, 매개변수 pg, pr, po는 예정보다 빨리 훈련 데이터에 의하여 SNP 기준당으로 평가한다. 일부 구현예에서, 매개변수 pg, pr, po는 다양한 시료 품질을 고려하여 현재의 시료로 계속해서 업데이트될 수 있다.
본원에 기술된 모델은 매우 일반적으로 차등적인 시료 품질 및 차등적인 SNP 품질 둘 모두를 고려할 수 있다. 상이한 시료 및 SNP는, 일부 구현예가 베타-이항 분포를 사용하며 이의 평균 및 변화는 DNA의 원래의 양, 및 이의 시료 및 SNP 품질의 함수라는 사실에 의해 예시되는 바와 같이, 상이하게 처리된다.
플랫폼 시료채취
혈장 속에 존재하는 예측된 대립유전자 비가 r(모계 및 태아 유전형을 기반으로 함)인 경우의 단일 SNP를 고려한다. 예측된 대립유전자 비는 합해진 모계 및 태아 DNA에서 A 대립유전자의 예측된 기능으로 정의된다. 모계 유전형 gm 및 자녀 유전형 gc의 경우, 예측된 대립유전자 비는, 유전형을 또한 대립유전자 비로 나타내는 것으로 추정하여, 식 1로 제공된다.
Figure 112015017677503-pct00078

SNP에서 관찰은 존재하는 각각의 대립유전자, na 및 nb(이는 판독물 d의 깊이로 합해진다)을 사용한 맵핑된 판독물의 수로 이루어진다. 한계가 이미 맵핑 확률 및 프레드 점수(phred score)에 적용됨으로써 랩핑 및 대립유전자 관찰이 정확한 것으로 고려될 수 있다고 가정한다. 프레드 점수는 특정한 염기에서 특정한 측정이 잘못된 확률에 관한 수치적 척도이다. 일 구현예에서, 염기를 서열분석으로 측정하는 경우, 프레드 점수는 다른 염기의 염료 강도에 대해 요청된 염기에 상응하는 염료 강도의 비로부터 계산할 수 있다. 관찰 가능성에 대한 가장 간단한 모델은, d 판독물 각각을 대립유전자 비 r을 갖는 거대한 혼주물로부터 독립적으로 얻는 것으로 가정한 바이어스 분포이다. 식 2는 당해 모델을 기술한다.
Figure 112015017677503-pct00079

이항 모델은 다수의 방식으로 확장시킬 수 있다. 모계 및 부계 유전형이 모두 A 또는 모두 B인 경우, 혈장에서 예측된 대립유전자 비는 0 또는 1일 것이고, 이원 확률은 잘 정의되지 않을 것이다. 실제로, 예측되지 않은 대립유전자는 때때로 실제로 관찰된다. 일 구현예에서, 정정된 대립유전자 비
Figure 112015017677503-pct00080
Figure 112015017677503-pct00081
= 1/(na + nb)를 사용하여 소수의 예측되지 않은 대립유전자를 허용한다. 일 구현예에서, 각각의 SNP에서 나타나는 예측되지 않은 대립유전자의 비를 모델화하고, 당해 모델을 사용하여 예측된 대립유전자 비를 정정하는 것이 가능하다. 예측된 대립유전자 비가 0 또는 1이 아닌 경우, 관측된 대립유전자 비는 증폭 바이어스 또는 다른 현상으로 인한 예측된 대립유전자 비에 대한 판독물의 충분히 큰 깊이로 수렴되지 않을 수 있다. 이후에, 대립유전자 비는 바이어스보다 더 높은 변화를 갖는 P(na, nb|r)에 대한 베타-이항 분포를 초래하는, 예측된 대립유전자 비에서 중앙에 있는 베타 분포로서 모델화될 수 있다.
단일 SNP에서의 반응에 대한 플랫폼 모델은, 모계 및 태아 유전형을 고려해볼 때 F(a, b, gc, gm, f) (3), 또는 na = a 및 nb = b를 관찰하는 확률로서 정의될 것이며, 이는 또한 식 1을 통해 태아 분획에 의해 결정된다. F의 기능적 형태는 위에서 논의한 바와 같이, 이원 분포, 베타-이원 분포, 또는 유사한 기능일 수 있다.
Figure 112015017677503-pct00082

일 구현예에서, 자녀 분획은 다음과 같이 측정될 수 있다. 산전 시험에 대한 태아 분획 f의 최대 확률 평가는 부계 정보의 사용없이 유도될 수 있다. 이는, 부계 유전 데이터가 이용가능하지 않은 경우, 예를 들면, 아버지 기록이 실제로 태아의 유전적 아버지가 아닌 경우에 관련있을 수 있다. 태아 분획은 SNP들의 세트인 것으로 평가되며, 여기서 모계 유전형은 0 또는 1이며, 단 2개의 가능한 태아 유전형의 세트를 생성한다. S0은 모계 유전형 0을 갖춘 SNP들의 세트로 정의하고 S1은 모계 유전형 1을 갖춘 SNP들의 세트로 정의한다. S0에서 가능한 태아 유전형은 0 및 0.5이고, 가능한 대립유전자 비 R0(f) = {0,f/2}의 세트를 생성한다. 유사하게, R1(f)는 {1-f/2, 1}이다. 당해 방법은 SNP를 포함하도록 사소하게 확장시킬 수 있으며, 여기서 모계 유전형은 0.5이지만, 이들 SNP는 보다 큰 대립유전자 비의 세트로 인하여 거의 유익하지 않을 것이다.
Na0 및 Nb0을 S0, 및 Na1에서 SNP에 대해 nas 및 nbs으로 형성된 벡터로서 정의하고, Na1 및 Nb1를 유사하게 S1에 대해 정의한다.
Figure 112015017677503-pct00083
의 최대 확률 평가는 식 4로 정의된다.
Figure 112015017677503-pct00084

각각의 SNP에서 대립유전자의 수가 독립적으로 SNP의 혈장 대립유전자 비를 조건으로 하는 것으로 추정하면, 확률은 각 세트 (5)에서 SNP에 대한 곱으로서 나타낼 수 있다.
Figure 112015017677503-pct00085

f에서의 의존성은 R0(f) 및 R1(f)의 가능한 대립유전자 비의 세트를 통한다. SNP 확률 P(nas, nbs|f)은 f에서 조건화된 최대 확률 유전형을 추정함으로써 접근할 수 있다. 충분히 높은 태아 분획 및 판독물 깊이에서, 최대 확률 유전형의 선택은 높은 신뢰도가 될 것이다. 예를 들면, 10 퍼센트의 태아 분획 및 1000의 판독물 깊이는, 모가 유전형 0인 SNP를 고려한다. 예측된 대립유전자 비는 0 및 5 퍼센트이며, 이는 판독물의 충분히 높은 깊이에서 용이하게 구별가능해질 것이다. 추정된 자녀 유전형을 식 5로 치환하여 태아 분획 평가물에 대한 완전한 식 (6)을 생성시킨다.
Figure 112015017677503-pct00086

태아 분획은 [0, 1]의 범위이어야만 하므로 최적화는 제한된 1차원 연구에 의해 용이하게 시행될 수 있다.
낮은 판독물의 깊이 또는 높은 노이즈 수준의 존재하에서, 최대 확률 유전형을 추정하는 것은 바람직하지 않을 수 있으며, 이는 인공적으로 높은 신뢰도를 초래할 수 있다. 다른 방법은 각각의 SNP에서 가능한 유전형에 걸친 합일 수 있으며, S0에서 SNP에 대한 P(na, nb|f)의 경우 다음 식 (7)을 생성한다. 이전의 확률 P(r)은 R0(f)에 걸쳐 균일한 것으로 추정될 수 있거나 집단 빈도를 기반으로 할 수 있다. 그룹 S1에 대한 확장은 사소하다.
Figure 112015017677503-pct00087

일부 구현예에서, 확률은 다음과 같이 유도할 수 있다. 신뢰도는 2개의 가설 Ht 및 Hf의 데이터 가능성에 의하여 계산할 수 있다. 각각의 가설의 가능성은 반응 모델, 추정된 태아 분획, 모계 유전형, 대립유전자 집단 빈도, 및 혈장 대립유전자 수를 기반으로 유도된다.
다음 표기법을 정의한다:
Gm, Gc 실제 모계 및 자녀 유전형
Gaf, Gtf 주장된 부친 및 실제 부친의 실제 유전형
G(gc, gm, gtf) =P(Gc =gc|Gm =gm,Gtf =gtf) 유전 확률
P(g) = P(Gtf = g) 특정한 SNP에서 유전형 g의 집단 빈도
각각의 SNP에서의 관찰이 혈장 대립유전자를 독립적으로 조건으로 한다고 가정하면, 친자 가설의 가능성은 SNP에서의 가능성의 생성물이다. 다음 식은 단일 SNP에 대한 가능성을 유도한다. 식 (8)은 어떠한 가설 h의 가능성에 대한 표현이며, 이는 이후에 Ht 및 Hf의 특수 경우로 나누어진다.
Figure 112015017677503-pct00088

Ht의 경우에, 주장된 부친은 실제 부친이고 태아 유전형은 모계 유전형 및 주장된 부친 유전형으로부터 식 (9)에 따라서 유전된다.
Figure 112015017677503-pct00089

Hf의 경우에, 주장된 부친은 실제 부친이 아니다. 실제 부계 유전형의 가장 우수한 평가는 각각의 SNP에서 집단 빈도에 의해 제공된다. 따라서, 자녀 유전형의 가능성은 식 (10)에서와 같이, 공지된 모계 유전형, 및 집단 빈도로 측정된다.
Figure 112015017677503-pct00090

Figure 112015017677503-pct00091

정확한 부계에 대한 신뢰도 Cp는 베이스 규칙(Bayes rule)(11)을 사용하여 2개의 가능성의 SNP에 걸친 생성물로부터 계산한다.
Figure 112015017677503-pct00092

태아 분획 퍼센트를 사용한 최대 확률 모델
모계 혈청에 함유된 자유로이 부유하는 DNA를 측정하거나, 어떠한 혼합된 시료 속의 유전형 물질을 측정함으로써 태아의 배수성 상태를 측정하는 것은 중요한 시험이다. 예를 들면, 태자녀 특정한 염색체에서 삼염색체성인 경우, 모계 혈액에서 발견된 이러한 염색체의 DNA 총량은 참조 염색체와 관련하여 상승될 것이라고 가정하는 판독물 수 분석을 수행하는 다수의 방법이 존재한다. 이러한 태아에서 삼염색체성을 검출하는 한가지 방법은 소정의 염색체에 상응하는 분석 세트에서 SNP의 수에 따라, 또는 염색체의 유일하게 맵핑가능한 부위의 수에 따라, 각각의 염색체에 대해 예측된 DNA의 양을 표준화하는 것이다. 측정이 표준화되면, 측정된 DNA의 양이 특정의 한계를 초과하는 어떠한 염색체도 삼염색체성으로 측정된다. 이러한 접근법은 문헌[참조: Fan, 등 PNAS, 2008; 105(42); pp. 16266-6271, 및 또한 Chiu 등 BMJ 2011;342:c7401]에 기술되어 있다. 치우(Chiu) 등의 논문에서, 이러한 표준화는 다음과 같은 Z 점수를 계산하여 달성하였다:
시험 경우에 염색체 21 퍼센트에 대한 Z 점수 = ((시험 경우에 염색체 21 퍼센트) - (참조 대조군에서 염색체 21 평균 퍼센트)) / (참조 대조군에서 염색체 21 퍼센트의 표준 편차).
이들 방법은 단일 가설 거부 방법을 사용하여 태아의 배수성 상태를 측정한다. 그러나, 이들은 일부 유의적인 단점으로 고생한다. 태아에서 배수성을 측정하는 이들 방법은 시료 속의 태아 DNA의 퍼센트에 따라 불변하므로, 이들은 하나의 컷 오프를 사용하며; 이의 결과는, 측정의 정밀도가 최적이지 않고, 혼합물 속의 태아 DNA의 퍼센트가 비교적 낮은 경우는 최악의 정밀도로 고생할 것이다.
일 구현예에서, 본원의 방법을 사용하여 태아의 배수성 상태를 측정하는 것은 시료 속에서 태아 DNA의 분획을 고려함을 포함한다. 본원의 다른 구현예에서, 당해 방법은 최대 확률 평가의 사용을 포함한다. 일 구현예에서, 본원의 방법은 원래의 태아 또는 태반인 시료 속에서의 DNA의 퍼센트를 계산함을 포함한다. 일 구현예에서, 이수성을 요청하기 위한 한계는 태아 DNA의 계산된 퍼센트를 기반으로 적절히 조절된다. 일부 구현예에서, DNA의 혼합물 속에서 태아 기원의 DNA의 퍼센트를 평가하기 위한 방법은 모친의 유전 물질, 및 태아의 유전 물질을 포함하는 혼합된 시료를 수득하는 단계, 태아의 부친으로부터 유전 물질을 수득하는 단계, 혼합된 시료 속에서 DNA를 측정하는 단계, 부계 시료의 DNA를 측정하는 단계, 및 혼합된 시료, 및 부계 시료의 DNA 측정을 사용하여 혼합된 시료 속에서 태아 기원의 DNA의 퍼센트를 계산하는 단계를 포함한다.
본원의 구현예에서, 혼합물 중 태아 DNA의 분획, 또는 태아 DNA의 퍼센트를 측정할 수 있다. 일부 구현예에서, 분획은 태아 및 모계 DNA의 혼합물인, 모계 혈장 시료 자체에서 이루어진 유전형 측정 만을 사용하여 계산할 수 있다. 일부 구현예에서, 분획은 모친의 측정되거나 달리 공지된 유전형 및/또는 부친의 측정되거나 달리 공지된 유전형을 사용하여 계산할 수 있다. 일부 구현예에서, 태아 DNA의 퍼센트는 부모 관계의 지식과 함께 모계 및 태아 DNA의 혼합물에서 이루어진 측정을 사용하여 계산할 수 있다. 일 구현예에서, 태아 DNA의 분획은 집단 빈도를 사용하여 계산함으로써 특정한 대립유전자 측정에 있어서의 가능성에 모델을 조절할 수 있다.
본원의 일 구현예에서, 신뢰도는 태아의 배수성 상태의 측정의 정밀도로 계산할 수 있다. 일 구현예에서, 최대 확률(Hmajor)의 가설의 신뢰도는 (1- Hmajor) / ∑(모든 H)로 계산할 수 있다. 모든 가설의 분포가 알려져 있는 경우 가설의 신뢰도를 측정하는 것이 가능하다. 부모계 유전형 정보가 알려져 있는 경우 가설 모두의 분포를 측정하는 것이 가능하다. 정배수성 태아에 대한 예측된 분포 및 이수성 태아에 대한 데이터의 예측된 분포의 지식이 알려져 있는 경우 배수성 측정의 신뢰도를 계산하는 것이 가능하다. 부모계 유전형 데이터가 공지되어 있는 경우 이들 예측된 분포를 계산하는 것이 가능하다. 일 구현예에서, 정상적인 가설 주변 및 비정상적인 가설 주변의 시험 통계의 분포의 지식을 이용하여 요청의 신뢰성 및 또한 한계의 개선 둘 모두를 측정하여 보다 신뢰성있는 요청을 할 수 있다. 이는 혼합물 속의 태아 DNA의 양 및/또는 퍼센트가 낮은 경우, 특히 유용하다. 실질적으로 이수성인 태자녀 시험 통계로 인하여 정배수성인 것으로 밝혀진 경우, 예를 들면, Z 통계가 보다 높은 퍼센트의 태아 DNA가 존재하는 경우에 대해 최적화되는 한계를 기반으로 이루어진 한계를 초과하지 않는 경우의 상황을 피하는데 도움을 줄 것이다.
일 구현예에서, 본원에 개시된 방법을 사용하여 모계 및 태아 유전 물질의 혼합물 속에서 모계 및 태아 표적 염색체의 카피의 수를 측정함으로써 태아 이수성을 측정할 수 있다. 당해 방법은 모계 및 태아 유전물질 둘 모두를 포함하는 모계 조직을 수득하는 것을 포함할 수 있으며; 일부 구현예에서, 당해 모계 조직은 모계 혈액에서 분리된 모계 혈장 또는 조직일 수 있다. 당해 방법은 또한 상술한 모계 조직을 프로세싱함으로써 상기 모계 조직으로부터 모계 및 태아 유전 물질의 혼합물을 수득함을 내포할 수 있다. 당해 방법은 다수의 반응 시료내로 수득된 유전 물질을 분포시켜, 표적 염색체의 표적 서열을 포함하지 않는 개개 반응 시료, 및 표적 염색체의 표적 서열을 포함하지 않는 개개 반응 시료를 무작위로 제공하는, 예를 들면, 시료 상에서 고 배출 서열분석을 수행함을 포함할 수 있다. 당해 방법은 상기 개개 반응 시료 속에 존재하거나 부재하는 유전 물질의 표적 서열을 분석함으로써 반응 시료 속에 아마도 정배수성 태아 염색체의 존재 또는 부재를 나타내는 이원 결과의 제1의 수 및 반응 시료 속에서 가능한 이수성 태아 염색체의 존재 또는 부재를 나타내는 이원 결과의 제2의 수를 제공함을 내포할 수 있다. 다수의 이원 결과들 중 어느 것도 예를 들면, 특정한 염색체, 염색체의 특수 영역, 특정한 유전자자리 또는 유전자자리의 세트에 맵핑하는 서열 판독물을 계수하는 정보학 기술의 방법으로 계산할 수 있다. 당해 방법은 염색체 길이, 염색체의 영역의 길이, 또는 세트 속의 유전자자리의 수를 기반으로 이원 현상의 수를 표준화함을 포함할 수 있다. 당해 방법은 제1 수를 사용하여 반응 시료 속의 아마도 정배수성 태아 염색체에 대한 이원 결과의 수의 예측된 분포를 계산함을 내포할 수 있다. 당해 방법은 예를 들면, 아마도 정배수성 태아 염색체에 대한 이원 결과의 수의 예측된 판독물 수 분포에 (1+n/2)(여기서, n은 추정된 태아 분획이다)를 곱함으로써, 혼합물 속에서 발견된 태아 DNA의 추정된 분획 및 제1의 수를 사용하여 반응 시료 속에서 아마도 이수성 태아 염색체에 대한 이원 결과의 예측된 분포를 계산함을 내포할 수 있다. 일부 구현예에서, 서열 판독물은 이원 결과보다는 확률론적 맵핑에서 처리될 수 있으며; 당해 방법은 보다 높은 정밀도를 생성할 수 있지만, 보다 더 계산력을 요구한다. 태아 분획은, 이의 일부가 본원의 어딘가에 기술되어 있는, 다수의 방법으로 평가할 수 있다. 당해 방법은, 제2 수가 가능한 이수성 태아 염색체에 상응하는지를 측정하기 위한 최대 확률 접근법을 사용함을 포함할 수 있다. 이러한 방법은 측정된 데이터를 고려해볼 때, 태아의 배수성 상태를 정확함의 최대 확률이 있는 가설에 상응하는 배수성 상태가 되도록 요청하는 것을 포함할 수 있다.
최대 확률 모델의 사용은 태아의 배수성 상태를 측정하는 어떠한 방법의 정밀도로 증가시키기 위해 사용될 수 있음에 주목한다. 유사하게, 신뢰도는 태아의 배수성 상태를 측정하는 어떠한 방법에 대해서도 계산될 수 있다. 최대 확률 모델의 사용은, 배수성 측정이 단일 가설 거부 기술을 사용하여 이루어지는 어떠한 방법의 정밀도로 개선시킬 수 있다. 최대 확률 모델은, 가능성 분포가 정상 및 비정상의 경우 둘 모두에 대해 계산될 수 있는 어떠한 방법에 대해서도 사용될 수 있다. 최대 확률 모델의 사용은 배수성 요청에 대한 신뢰도를 계산하는 능력을 내포한다.
방법의 추가 논의
일 구현예에서, 본원에 개시된 방법은 다형성 유전자자리에서 각각의 대립유전자의 독립된 관측의 수의 정량적 척도를 이용하며, 여기서 이는 대립유전자의 비를 계산함을 포함하지 않는다. 이는 유전자자리에서 2개의 대립유전자의 비에 대한 정보를 제공하지만, 다른 대립유전자의 다수의 독립된 관찰을 정량화하지 않는, 일부 미세배열을 기반으로 하는 방법과 같은 방법과는 상이하다. 당해 분야에 공지된 일부 방법은 다수의 독립된 관찰에 관한 정량적 정보를 제공할 수 있지만, 배수성 측정을 이끄는 계산은 단지 대립유전자 비만을 이용하며, 정량적 정보는 이용하지 않는다. 독립된 관찰의 수에 대한 정보를 보유하는 중요성을 나열하기 위하여, 2개의 대립유전자, A 및 B를 지닌 시료 유전자자리를 고려한다. 첫번째 실험에서 20개의 A 대립유전자 및 20개의 B 대립유전자를 관찰하며, 두번째 실험에서 200개의 A 대립유전자 및 200개의 B 대립유전자를 관찰한다. 실험 둘 모두에서 비 (A/(A+B))는 0.5로 같지만, 두번째 실험에서는 A 또는 B 대립유전자의 빈도의 특정성에 대해 첫번째 보다 더 많은 정보를 전달한다. 대립유전자 비를 이용하는 것 보다, 본 방법은 각각의 다형성 유전자자리에서 가장 유사하게 대립유전자 빈도를 보다 정밀하게 모델화하는 정량적 데이터를 사용한다.
일 구현예에서, 본 방법은 다수의 다형성 유전자자리의 측정을 종합하기 위한 유전 모델을 구축하여 이배체성을 삼배체성과 보다 잘 구별하고 또한 삼염색체성의 유형을 측정한다. 또한, 본 발명은 본 방법의 정밀도를 향상시기키 위한 유전 연결 정보를 포함한다. 이는 대립유전자 비를 염색체상에서 모든 다형성 유전자자리에 걸쳐 평균을 내는 당해 분야에 공지된 일부 방법과는 대조적이다. 본원에 개시된 방법은 감수분열 I 동안의 비분리, 감수분열 II 동안의 비분리, 및 태아 발달 조기에 유사분열 동안의 비분리로부터 생성되는 이염색체성 및 또한 삼염색체성에서 예측된 대립유전자 빈도 분포를 명쾌하게 모델화한다. 이것이 중요한 이유를 나열하기 위하여, 감수분열 I 동안에, 2개의 상이한 동족체가 하나의 부모로부터 유전되는 삼염색체성을 생성하는 동안 교차 비분리가 존재하지 않는 경우; 감수분열 II 동안의 비분리 또는 태아 발달 조기의 유사분열은 하나의 부모로부터 동일한 동족체의 2개의 카피를 생성할 수 있다. 각각의 시나리오는 각각의 다형성 유전자자리 및 또한 결합된 것으로 고려된 모든 물리적으로 연결된 유전자자리(즉, 동일한 염색체 상의 유전자자리)에서 상이한 예측된 대립유전자 빈도를 생성한다. 동족체 사이의 유전 물질의 교환을 초래하는 교차는 유전 양식을 보다 복잡하게 하지만, 본 방법은 유전 연결 정보, 즉, 재조합 비 정보 및 유전자자리 사이의 물리적 거리를 사용함으로써 이를 수용한다. 감수분열 I 비분리와 감수분열 II 또는 유사분열 비분리사이를 구별하기 위하여 본 방법은 당해 모델 내로 중심체에서부터의 거리가 증가함에 따라 교차의 증가된 확률을 포함시킨다. 감수분열 II 및 유사분열 비분리는, 유사분열 비분리가 전형적으로 하나의 동족체의 동일하거나 거의 동일한 카피를 생성하지만 감수분열 II 비분리 현상 후 존재하는 2개의 동족체는 배우자 형성 동안에 하나 이상의 교차로 인하여 흔히 상이하다는 사실에 의해 구별될 수 있다.
일 구현예에서, 본원의 방법은, 이염색체성이 추측되는 경우 부모의 일배체형을 측정하지 않을 수 있다. 일 구현예에서, 삼염색체성의 경우, 본 방법은, 혈장이 하나의 부모로부터 2개의 카피를 취하고, 부모 관계는 2개의 카피가 문제의 부모로부터 유전되어 진다는 인식에 의해 판별될 수 있다는 사실을 이용하여 한쪽 부모 또는 양쪽 부모의 일배체에 대해 측정할 수 있다. 특히, 자녀는 부모의 동일한 카피 중 2개(일치된 삼염색체성) 또는 부모의 카피 둘 모두(일치되지 않은 삼염색체성)를 유전할 수 있다. 각각의 SNP에서 일치한 삼염색체성 및 일치하지 않은 삼염색체성의 가능성을 계산할 수 있다. 교차에 대해 계수하는 연결 모델을 사용하지 않는 배수체 요청 방법은, 시료가 모든 염색체에 걸쳐 일치한 삼염색체성 및 일치하지 않은 삼염색체성의 단순한 중량 평균으로부터 삼염색체성의 전체 가능성을 계산할 수 있다. 그러나, 비연결 오차 및 교차를 생성하는 생물학적 메카니즘으로 인하여, 삼염색체성은 교차가 발생하는 경우에만 염색체 상에서 일치에서 비일치로 변화(및 역으로의 변화)할 수 있다. 본 방법은 교차 가능성을 확률적으로 고려함으로써 이를 고려하지 않는 방법보다 더 큰 정밀도의 배수성 요청을 생성한다.
일 구현예에서, 참조 염색체를 사용하여 자녀 분획 및 노이즈 수준의 양 또는 가능성 분포를 측정한다. 일 구현예에서, 자녀 분획, 노이즈 수준, 및/또는 가능성 분포는, 이의 배수성 상태가 측정되는 염색체로부터 입수할 수 있는 유전 정보만을 사용하여 측정한다. 본 방법은 참조 염색체 없이, 및 또한 특정한 자녀 분획 또는 노이즈 수준의 고정 없이 작업한다. 이는, 참조 염색체에서 비롯된 유전 데이터가 자녀 분획 및 염색체 행위를 교정하는 데 있어 필수적인 당해 분야에 공지된 방법에 의하여 유의적으로 개선되고 차별화된 핵심이다.
일 구현예에서 참조 염색체가 태아 분획을 측정할 필요가 없는 경우, 가설의 측정을 다음과 같이 수행한다:
Figure 112015017677503-pct00093
Figure 112015017677503-pct00094
*priorprob(H)
참조 염색체를 사용한 알고리즘을 사용하여, 참조 염색체가 이염색체성인 것으로 전형적으로 추정한 후, (a) 이러한 추정 및 참조 염색체 데이터를 기반으로 가장 유사한 자녀 분획 및 무작위적인 노이즈 수준 N을 고정할 수 있다:
Figure 112015017677503-pct00095

다음에, 감소시키거나
Figure 112015017677503-pct00096

또는 (b) 이러한 추정 및 참조 염색체 데이터를 기반으로 자녀 분획 및 노이즈 수준 분포를 평가한다. 특히, cfr 및 N에 대한 하나의 값만을 고정시키지 않지만, 보다 광범위한 범위의 가능한 cfr에 대해 확률 p(cfr, N)를 지정하며, N 값은:
Figure 112015017677503-pct00097
이고
여기서 priorprob(cfr, N)는 선행 지식 및 실험에 의해 측정된, 특정한 자녀 분획 및 노이즈 수준의 선행 확률이다. 경우에 따라, cfr의 범위, N에 걸쳐 단지 균일화한다. 이후에:
Figure 112015017677503-pct00098
를 기재할 수 있다.
상기 방법 둘 모두는 우수한 결과를 제공한다.
일부 예에서 참조 염색체를 사용하는 것이 바람직하지 않거나, 가능하지 않거나 실현가능한 경우에 주목한다. 이러한 경우에, 각각의 염색체에 대해 별도로 가장 우수한 배수성 요청을 유도하는 것이 가능하다. 특히:
Figure 112015017677503-pct00099

Figure 112015017677503-pct00100
는 단지 참조 염색체에 대해 이염색체성을 추정하지 않고, 가설 H를 추정하여, 각각의 염색체에 대해 별도로, 상기와 같이 측정할 수 있다. 가능하게는, 당해 방법을 사용하여, 각각의 염색체 및 각각의 가설에 대해 확률 형태로, 고정된 노이즈 및 자녀 분획 매개변수를 유지하거나, 매개 변수 중 하나를 고정시키거나, 매개 변수 둘 모두를 유지하는 것이 가능하다.
DNA의 측정, 특히 DNA의 양이 적거나, 또는 DNA가 오염되는 DNA와 혼합된 경우의 측정은 노이즈가 많고/많거나 오류 발생이 쉽다. 이러한 노이즈는 정밀한 유전형 데이터, 및 정밀한 배수성 요청을 거의 생성하지 않는다. 일부 구현예에서, 플랫폼 모델화 또는 노이즈 모델화의 일부 다른 방법을 사용하여 배수성 측정시 노이즈의 유해한 효과를 계산할 수 있다. 본 발명은 채널 둘 모두의 결합 모델을 사용하며, 이는 입력 DNA, DNA 품질, 및/또는 프로토콜 품질의 양으로 인하여 무작위 노이즈에 대해 계산하는, 채널 둘 모두의 결합 모델을 사용한다.
이는, 배수성 측정이 유전자자리에서 대립유전자 강도의 비를 사용하여 이루어지는 당해 분야에 공지된 일부 방법과는 대조적이다. 당해 방법은 정밀한 SNP 노이즈 모델화를 불가능하게 한다. 특히, 측정시 오차는 전형적으로 당해 모델을 일차원 정보를 사용하여 환원시키는, 측정된 채널 강도 비에 구체적으로 의존하지 않는다. 노이즈, 채널 품질 및 채널 상호작용의 정밀한 모델화는 대립유전자 비를 사용하여 모델화될 수 없는, 2차원 결합 모델을 필요로 한다.
특히, 2개의 채널 정보를 비 r을 투여하는 것(여기서, f(x,y)는 r = x/y이다)은 자체가 정밀한 채널 노이즈 및 바이어스 모델화로 이끌지 않는다. 특정한 SNP에서 노이즈는 비의 기능이 아니지만, 즉, 노이즈(x,y)≠f(x,y)이지만, 실제로 채널 둘 모두의 결합 기능이다. 예를 들면, 바이어스 모델에서, 측정된 비의 노이즈는 순수하게 r의 기능이 아닌, r(1-r)/(x+y)의 변화량을 갖는다. 이러한 모델에서, 어떠한 채널 바이어스 또는 노이즈도 포함되지 않는 경우, SNP i에서, 관찰된 채널 X 값은 x=aiX+bi이고, 여기서 X는 실제 채널 값이며, bi는 추가의 채널 바이어스 및 무작위 노이즈이다. 유사하게, y=ciY+di으로 가정한다. (aiX+bi)/(ciY+di)는 X/Y의 기능이 아니므로, 관찰된 비 r=x/y는 실제 비 X/Y를 정밀하게 예측할 수 없거나 잔재 노이즈를 모델화할 수 없다.
본원에 개시된 방법은 측정 채널 모두의 결합 바이어스 분포를 개별적으로 사용하여 노이즈 및 편향을 모델화하는 효과적인 방법을 기술한다. 관련 방정식은 또한 SNP 거동을 효과적으로 조정하는 SNP 지속 편향당, P(good) 및 P(ref|bad), P(mut|bad)를 말하는 단락에서 본 문서 어딘가에서 찾을 수 있다. 일 구현예에서, 본원의 방법은 베타이항 분포를 사용하며, 이는 단지 대립유전자 비에 대한 의존의 제한 실시를 피하지만, 대신 채널 수 둘 모두를 기준으로 한 거동을 모델화한다.
일 구현예에서, 본원에 개시된 방법은 모든 가능한 측정을 사용함으로써 모계 혈장에서 발견된 유전 데이터에 의하여 잉태된 태아의 배수성을 요청할 수 있다. 일 구현예에서, 본원에 개시된 방법은 하위세트의 부모 관계만의 측정을 사용함으로써 모계 혈장에서 발견된 유전 정보에 의하여 잉태된 태아의 배수성을 요청할 수 있다. 당해 분야에 공지된 일부 방법은, 부모 관계가 AA|BB 관계에서 기원하는, 즉, 부모가 소정의 유전자자리에서 둘 모두 동종접합성이지만, 상이한 대립유전자에 대한 것인 경우이다. 당해 방법이 지닌 한가지 문제는, 다형성 유전자자리의 소 집단, 전형적으로 10% 미만이 AA|BB 관계에서 기원한다는 것이다. 본원에 개시된 방법의 일 구현예에서, 당해 방법은, 모계 정보가 AA|BB인 유전자자리에서 이루어진 모계 혈장의 유전적 측정을 사용하지 않는다. 일 구현예에서, 당해 방법은 AA|AB, AB|AA, 및 AB|AB 부모 관계를 사용한 이들 다형성 유전자자리에 대한 혈장 측정을 사용한다.
당해 분야에 공지된 일부 방법은 부모계 유전형 둘 모두 존재하는 AA|BB 관계에서 SNP에서 비롯된 대립유전자 비를 평균내는 단계를 포함하며, 이들 SNP에 대한 평균 대립유전자 비에서 비롯된 배수성 요청을 측정하도록 요구한다. 당해 방법은 차등적인 SNP 행위로 인하여 유의적인 비정밀도를 겪는다. 당해 방법은, 부모계 유전형 둘 모두가 공지되어 있는 것으로 추정함에 주목한다. 대조적으로, 일부 구현예에서, 당해 방법은 부모의 존재를 추정하지 않는 결합 채널 분포를 사용하며, 균일한 SNP 거동을 추정하지 않는다. 일부 구현예에서, 본 방법은 상이한 SNP 거동/중량화를 고려한다. 일부 구현예에서, 당해 방법은 부모계 유전형 하나 또는 둘 모두의 지식을 필요로 한다. 본 방법이 이를 달성할 수 있는 방법의 예는 다음과 같다:
일부 구현예에서, 가설의 로그 가능성은 SNP 기준 당 측정할 수 있다. 특정한 SNP i에서, 태아 배수성 가설 H 및 태아 DNA 퍼센트 cf를 추정하여, 관측된 데이터 D의 로그 가능성은 다음과 같이 정의된다:
Figure 112015017677503-pct00101

여기서 m은 가능한 실제 모계 유전형이고, f는 가능한 실제 부계 유전형이며, 여기서, m,f
Figure 112015017677503-pct00102
{AA,AB,BB}이고, 여기서 c는 가설 H를 제공한 가능한 자녀 유전형이다. 특히, 일염색체성의 경우 c
Figure 112015017677503-pct00103
, 이염색체성의 경우 c
Figure 112015017677503-pct00104
, 삼염색체성의 경우 c
Figure 112015017677503-pct00105
이다. 부모계 유전형 데이터를 포함시키는 것이 보다 정밀한 배수성 측정을 생성하지만, 부모계 유전형 데이터는 본 방법을 잘 작업하는데 필수적이지 않음에 주목한다.
당해 분야에 공지된 일부 방법은 SNP에서 비롯된 대립유전자 비를 평균내는 단계를 포함하며, 여기서 모는 동종접합성이지만 상이한 대립유전자가 혈장(AA|AB 또는 AA|BB 관계)에서 측정되며, 이들 SNP에서 평균 대립유전자 비에 의한 배수성 요청을 측정하도록 청구된다. 당해 방법은, 부모계 유전형이 이용불가능한 경우에 의도된다. 혈장이 동종접합성 및 반대되는 부계 BB의 존재없이 특정한 SNP에서 이종접합성임을 어떻게 정밀하게 요청할 수 있는지: 낮은 자녀 분획을 사용하는 경우에, B 대립유전자의 존재가 바로 노이즈의 존재일 수 있는지를 어떻게 볼 것인가; 추가로, B 존재가 태아 측정의 단순한 대립유전자 드롭 아웃이 아닐 수 있는지를 어떻게 볼 것인가가 의문시됨에 주목한다. 혈장의 이종접합성을 실제적으로 측정할 수 있는 경우에서조차, 당해 방법은 부모계 삼염색체성을 구별할 수 없을 것이다. 특히, 모가 AA이고 일부 B가 혈장 속에서 측정되는 SNP의 경우, 부친의 GG가 GG라면, 생성되는 자녀 유전형은 AGG이고, 33%의 평균비(자녀 분획의 경우 = 100%)가 생성된다. 부친이 AG인 경우, 수득되는 자녀 유전형은 일치된 상염색체성의 경우 AGG일 수 있으며, 33% A 비, 또는 일치되지 않는 삼염색체성의 경우 AAG에 기영하여, 66% A에 대해 보다 더 평균 비를 이끌어낸다. 많은 삼염색체성이 교차되는 염색체 상에 제공되는 경우, 전체 염색체는 일치하지 않은 삼염색체성의 부재와 모든 일치하지 않는 삼염색체성 사이의 어느 부위를 가질 수 있으며, 당해 비는 33 내지 66% 사이의 어느 곳에서도 변할 수 있다. 분명한 이염색체성의 경우, 당해 비는 대략 50%일 수 있다. 결합 모델 또는 평균의 정밀한 오차 모델의 사용없이, 당해 방법은 많은 경우의 부모계 삼염색체성을 놓칠 수 있다. 대조적으로, 본원에 개시된 방법은 이용가능한 유전형 정보 및 집단 빈도를 기반으로, 각각의 부모계 유전형 후보물에 대한 부모계 유전형 확률을 지정하며, 부모계 유전형을 분명하게 요구하지 않는다. 또한, 본원에 개시된 방법은 부모계 유전형 데이터의 부재 또는 존재에서 조차 삼염색체성을 검출할 수 있으며, 연결 모델을 사용하여 일치된 삼염색체성에서 일치하지 않은 삼염색체성까지 가능한 교차점을 확인함으로써 보상될 수 있다.
당해 분야에 공지된 일부 방법은, 모친 또는 부모계 유전형은 알려져 있지 않는 SNP의 대립유전자 비를 평균내고, 이들 SNP에서 평균 비에 의한 배수성 요청을 측정하기 위한 방법을 요청한다. 그러나, 이러한 목표를 달성하기 위한 방법은 기재되어 있지 않다. 본원에 개시된 방법은 이러한 상황에서 정밀한 배수성 요청을 이룰 수 있고, 실시하기 위한 감소는 본 서류의 어딘가에 결합 가능성 최대 확률 방법을 사용하여 기재되어 있으며 임의로 SNP 노이즈 및 바이어스 모델, 및 연결 모델을 이용한다.
당해 분야에 공지된 일부 방법은 대립유전자 비를 평균내는 단계를 포함하며 하나 또는 소수의 SNP에서 평균 대립유전자 비에 의한 배수성 요청을 측정하기 위해 요청된다. 그러나, 이러한 방법은 연결의 개념을 이용하지 않는다. 본원에 개시된 방법은 이들 단점을 겪지 않는다.
DNA의 기원을 측정하기 위한 선행으로서 서열 길이의 사용
서열 길이의 분포가 모계 및 부계 DNA의 경우 상이하며, 태아는 일반적으로 더 짧음이 보고되어 왔다. 본원의 일 구현예에서, 실험 데이터의 형태로 사전 지식을 사용하고, 모계 (P(X| 모계)) 및 태아 DNA (P(X| 태아))의 예측된 길이에 대한 사전 분포를 작제하는 것이 가능하다. 길이가 x인 새로이 확인되지 않은 DNA 서열을 제공함으로써, 제공된 모계 또는 태아에 대한 사전 가능성 x를 기반으로 하여, 제공된 DNA 서열이 모계 또는 부계 DNA일 확률을 지정하는 것이 가능하다. 특히 P(x|모계) > P(x|부계)의 경우, DNA 서열은 P(x|모계) = P(x|모계)/[(P(x|모계) + P(x| 태아)]를 사용하여 모로 분류될 수 있으며, p(x|모계) < p(x|부계)인 경우, DNA 서열은 태아, P(x| 태아) = P(x| 태아)/[(P(x|모계) + P(x| 태아)]로 분류될 수 있다. 본원의 일 구현예에서, 확률이 높은 모계 또는 태아로서 지정될 수 있는 서열을 고려함으로써 이러한 서열에 대해 특이적인 모계 및 태아 서열 길이의 분포를 측정한 후, 이러한 시료 특이적인 분포를 이러한 시료에 대한 예측된 크기 분포로서 사용할 수 있다.
서열분석 비용을 최소화하기 위한 가변성 판독물 깊이
예를 들면, 문헌(참조: Chiu 등 BMJ 2011;342:c7401)에서 진단에 관한 많은 임상 접근법에서, 다수의 매개변수를 사용한 프로토콜을 설정한 후, 시료 프로토콜을 접근법 중 환자 각각에 대해 동일함 매개변수를 사용하여 수행한다. 유전 물질을 측정하기 위한 방법으로서 서열분석을 사용하여 모에서 잉태중인 태아의 배수성 상태를 측정하는 경우에, 한가지 적절한 매개변수는 다수의 판독물이다. 다수의 판독물은 다수의 실제 판독물, 다수의 의도된 판독물, 분획 레인, 완전한 레인, 또는 서열분석기 상의 완전한 유동 세포들을 말할 수 있다. 이들 연구에서, 다수의 판독물은 전형적으로, 모든 또는 거의 모든 시료가 바람직한 정밀도 수준을 달성하는 것을 보증할 수준에서 전형적으로 설정된다. 서열분석은 현재, 비용이 많이 드는 기술이며, 이의 비용은 5백만 개의 맵핑가능한 판독물 당 대략 200불이지만, 당해 가격은 내려가고 있으며, 서열분석을 기반으로 하는 진단이 유사한 수준의 정밀도로 그러나 보다 적은 판독물을 사용하여 작동하도록 허용하는 어떠한 방법도 필수적으로 고려한만한 양의 비용을 절약할 것이다.
배수성 측정의 정밀도는 혼합물 속의 판독물 및 태아 DNA의 분획의 수를 포함하는 다수의 인자에 전형적으로 의존한다. 당해 정밀도는, 혼합물 속의 태아 DNA의 분획이 보다 더 많은 경우 전형적으로 더 높다. 동시에, 정밀도는, 판독물의 수가 더 큰 경우 전형적으로 더 높다. 배수성 상태가 고려할만한 정밀도로 측정되는 2가지 경우를 지닌 상황을 갖는 것이 가능하며, 여기서 첫번째 경우는 두번째보다 혼합물 속에 태아 DNA의 분획이 더 낮고, 보다 많은 판독물이 두번째보다 첫번째 경우에서 서열분석되었다. 혼합물 속의 태아 DNA의 추정된 분획을 제공된 수준의 정밀도를 달성하는데 필수적인 다수의 판독물을 측정하는데 있어서 안내자로서 사용하는 것이 가능하다.
본원의 일 구현예에서, 시료의 세트를 수행할 수 있으며, 여기서 세트내 상이한 시료를 상이한 판독물 깊이로 서열분석하며, 여기서, 각각의 시료에서 수행된 판독물의 수를 선택하며 각 혼합물에 함유된 태아 DNA의 계산된 분획을 고려해볼 때 소정의 정확도 수준을 달성한다. 본원의 일 구현예에서, 이는 혼합된 시료를 측정하여 혼합물 속의 태아 DNA의 분획을 측정함을 내포할 수 있으며; 태아 분획의 이러한 평가는 서열분석을 사용하여 수행할 수 있고, 이는 TAQMAN으로 수행할 수 있으며, 이는 qPCR로 수행할 수 있고, 이는 SNP 배열로 수행할 수 있으며, 이는 소정의 유전자자리에서 상이한 대립유전자를 구별할 수 있는 어떠한 방법도 사용하여 수행할 수 있다. 태아 분획 평가에 대한 요구도는, 실제 측정된 데이터와 비교하는 경우 고려되는 가설의 세트에서 모든 또는 선택된 세트의 태아 분획을 포함하는 가설을 포함시킴으로써 평가할 수 있다. 분획 후 혼합물 속의 태아 DNA를 측정하여, 각각의 시료에 대해 판독될 서열의 수를 측정할 수 있다.
본원의 일 구현예에서, 100명의 임신한 여성이 이들 각각의 OB에 방문하여 그들의 혈액을 항-용해제 및/또는 DNAase를 불활성화시키는 어떤 것이 들어있는 혈액 튜브내로 채혈한다. 이들 각각은 타액 시료를 제공한 이들의 잉태된 태아의 부친에 대한 키트를 집에다 준다. 모든 100개의 쌍들에 대해 유전 물질의 세트 둘 모두를 실험실로 다시 보내며, 여기서 모계 혈액은 회전시켜 외피 및 혈장을 분리시킨다. 혈장은 모계 DNA 및 태반 기원의 DNA의 혼합물을 포함한다. 모계 연막 및 태아 혈액을 SNP 배열을 사용하여 유전형 분석하고, 모계 혈장 시료 속의 DNA는 SURESELECT 하이브리드화 브로브로 표적화한다. 프로브로 분해한(pul l down) DNA를 사용하여, 모계 시료 각각에 대해 1개씩, 100개의 표적화된 라이브러리를 생성시키고, 여기서 각각의 시료는 상이한 태그로 태그시킨다. 각각의 라이브러리에서 분획을 제거하고, 이들 분획 각각을 함께 혼합하여 다중화된 양식으로 ILLUMINA HISEQ DNA 서열분석기의 2개의 레인에 가하며, 여기서 각각의 레인은 대략 5천만 개의 맵핑가능한 판독물을 생성하며, 100개의 다중화된 혼합물에 대해 대략 1억개의 맵핑가능한 판독물을 생성하거나, 시료당 대략 백만 개의 판독물을 생성한다. 서열 판독물을 사용하여 각각이 혼합물 중 태아 DNA의 분획을 측정하였다. 시료 중 50개는 혼합물 속에서 15% 이상의 태아 DAN를 가지며, 백만 개의 판독물은 99.9%의 신뢰도로 태아의 배수성 상태를 측정하기에 충분하였다.
나머지 혼합물 중에서, 25개는 10 내지 15%의 태아 DNA를 가졌으며; 이들 혼합물로부터 제조된 관련 라이브러리 각각의 분획을 다중화시키고 HISEQ의 하나의 레인을 중지시켜 각각의 시료에 대해 추가의 2백만 개의 판독물을 생성하였다. 10 내지 15%의 태아 DNA를 갖는 혼합물 각각에 대한 서열 데이터의 2개 세트를 함께 가하여, 99.9%의 신뢰도로 이들 태아의 배수성 상태를 측정하기에 충분한 시료당 3백만 개의 판독물을 생성하였다.
나머지 혼합물 중에서, 13개는 6 내지 10%의 태아 DNA를 가졌고; 이들 혼합물로부터 제조된 관련된 라이브러리 각각의 분획은 다중화시켜 HISEQ의 하나의 레인을 중지시켜 각각의 시료에 대해 추가로 4백만 개의 판독물을 생성하였다. 6 내지 10%의 태아 DNA를 지닌 혼합물 각각에 대한 서열 데이터의 2개 세트를 함께 가하고, 99.9% 신뢰도로 이들 태아의 배수성 상태를 측정하기에 충분한 혼합물 당 총 5백만 개의 판독물을 생성하였다.
나머지 혼합물 중에서, 8개는 4 내지 6%의 태아 DNA를 가졌으며; 이들 혼합물로부터 제조된 관련 라이브러리 각각의 분획을 다중화하여 HISEQ의 하나의 레인을 중지시켜 각각의 시료당 추가로 6백만 개의 판독물을 생성하였다. 4 내지 6%의 태아 DNA를 갖는 혼합물 각각에 대한 서열 데이터의 2개 세트를 함께 가하여, 99.9%의 신뢰도로 이들 태아의 배수성 상태를 측정하기에 충분한 혼합물당 7백만 개의 판독물을 생성하였다.
나머지 4개의 혼합물 중에서, 이들 모두는 2 내지 4%의 태아 DNA를 가졌으며; 이들 혼합물로부터 제조된 관련 라이브러리 각각의 분획을 다중화하여 HISEQ의 하나의 레인을 중지시켜 각각의 시료에 대해 추가로 1,200만 개의 판독물을 생성하였다. 2 내지 4%의 태아 DNA를 갖는 혼합물 각각에 대한 서열 데이터의 2개 세트를 함께 가하여, 99.9%의 신뢰도로 이들 태아의 배수성 상태를 측정하기에 충분한 혼합물당 1,300만 개의 판독물을 생성하였다.
당해 방법은 100개 이상의 시료에 대하여 99.9%의 정밀도를 달성하기 위해 HISEQ 기계 위에서 서열분석하는 6개의 레인을 요구한다. 동일한 수의 수행이 모든 시료에 대해 요구되는 경우, 모든 배수성 측정이 99.9%의 신뢰도로 이루어지도록 보증하기 위해서, 25개의 서열분석 레인이 취해질 수 있으며, 요청 비가 없거나 4%의 오차율이 용인되는 경우, 이는 14개의 서열분석 레인으로 달성될 수 있었다.
미가공 유전형 데이터의 사용
모계 혈액에서 발견된 태아 DNA에서 측정한 태아 유전 정보를 사용하여 NPD를 달성할 수 있는 다수의 방법이 존재한다. 이들 방법들 중 일부는 SNP 배열을 사용하여 태아 DNA를 측정함을 포함하며, 일부 방법은 표적화되지 않은 서열분석을 포함하고, 일부 방법은 표적화된 서열분석을 포함한다. 표적화된 서열분석은 SNP를 표적화할 수 있으며, 이는 STR을 표적화할 수 있고, 이는 다른 다형성 유전자자리를 표적화할 수 있으며, 이는 비-다형성 유전자자리, 또는 이의 일부 조합을 표적화할 수 있다. 이들 방법들 중 일부는 이러한 측정을 수행하는 기계 속의 센서의 강도 데이터로부터 판별하는 대립유전자의 실체를 요청하는, 시판되거나 적절한 대립유전자 요청기를 사용하는 단계를 포함할 수 있다. 예를 들어, ILLUMINA INFINIUM 시스템 또는 AFFYMETRIX GENECHIP 미세배열 시스템은 DNA의 상보성 분절에 하이브리드화할 수 있는 부착된 DNA 서열를 지닌 비드 또는 미세칩을 포함하고; 하이브리드화 시, 검출될 수 있는 센서 분자의 형광성 특성에 있어서의 변화가 존재한다. 또한 서열분석 방법, 예를 들면, ILLUMINA SOLEXA GENOME SEQUENCER 또는 ABI SOLID GENOME SEQUENCER가 존재하며, 여기서 DNA 단편의 유전 서열이 서열분석되고; 서열분석되는 쇄에 대해 상보성인 DNA의 쇄의 연장 시, 연장된 뉴클레오타이드의 실체는 전형적으로 상보성 뉴클레오타이드에 첨부된 형광성 또는 방사성 태그를 통해 검출된다. 이들 방법 모두에서, 유전형 또는 서열분석 데이터는 전형적으로 형광성 또는 다른 신호, 또는 이의 결함을 기반으로 측정된다. 이들 시스템은 전형적으로 형광성 또는 다른 검출 장치(일차 유전 데이터)의 유사체 출력으로부터 특이적인 대립유전자 요청(2차 유전 데이터)를 제조하는 낮은 수준의 소프트웨어 패키지와 합해진다. 예를 들면, SNP 배열에서 소정의 대립유전자의 경우에, 소프트웨어는 예를 들면, 형광성 강도가 특정의 한계를 초과하거나 이하로 측정되는 경우에 특정의 SNP가 존재하거나 부재하는 요청을 이룰 것이다. 유사하게, 서열분석기의 출력은 염료 각각에 대해 검출된 형광성 수준을 나타내는 크로마토그람이며, 당해 소프트웨어는, 특정의 염기쌍이 A 또는 T 또는 C 또는 G라는 요청을 할 것이다. 고 배출 서열분석기는 전형적으로 판독물로 불리는, 일련의 이러한 측정을 이루며, 이는 서열분석된 DNA 서열의 가장 유사한 구조를 나타낸다. 크로마토그람의 직접적인 유사체 배출은 본원에서 1차 유전 데이터인 것으로 정의되며, 소프트웨어에 의해 이루어진 염기쌍/SNP 요청은 본원에서 2차적인 유전 데이터인 것으로 고려된다. 일 구현예에서, 1차 데이터는 유전형 플랫폼의 프로세싱되지 않은 출력인 미가공 강도 데이터를 말하며, 여기서 유전형 플랫폼은 SNP 배열, 또는 서열분석 플랫폼을 말할 수 있다. 2차의 유전 데이터는 가공된 유전 데이터를 말하며, 여기서 대립유전자 요청은 이루어지거나, 서열 데이터가 염기 쌍에 지정되고/되거나 서열 판독물이 게놈에 대해 맵핑된다.
많은 보다 높은 수준의 적용은 이들 대립유전자 요청, SNP 요청 및 서열분석 판독물, 즉, 유전형 분석 소프트웨어가 생산하는, 2차 유전 데이터의 장점을 취한다. 예를 들어, DNA NEXUS, ELAND 또는 MAQ는 서열분석 판독물을 취하여 이들을 게놈내로 맵핑한다. 예를 들면, 비-침입성 태아기 진단과 관련하여, PARENTAL SUPPORTTM과 같은 복합체 정보학은 다수의 SNP 요청을 지렛대로 이용하여 개체의 유전형을 측정할 수 있다. 또한, 착상 전 유전 진단과 관련하여, 게놈에 맵핑된 서열 판독물의 세트를 취하고, 각각의 염색체, 또는 염색체의 단면에 맵핑된 판독물의 표준화된 수를 취함으로써, 개체의 배수성 상태를 측정하는 것이 가능하다. 비-침입성 태아기 진단과 관련하여, 모계 혈장 속에 존재하는 DNA에서 측정된 서열 판독물의 세트를 취하여 이들을 게놈내로 맵핑하는 것이 가능할 수 있다. 이후에, 각각의 염색체, 또는 염색체의 단면에 맵팽되는 판독물이 표준화된 수를 취하고, 당해 데이터를 사용하여 개체의 배수성 상태를 측정할 수 있다. 예를 들면, 불균형적으로 거대한 수의 판독물을 갖는 염색체는, 혈액이 채혈되는 모가 임신중인 태아에서 삼염색체성인 것으로 결론짓는 것이 가능할 수 있다.
그러나, 실제로, 측정하는 장치의 초기 출력은 동족체 신호이다. 특정의 염기쌍이 서열분석 소프트웨어와 관련된 소프트웨어에 의해 요청되는 경우, 예를 들어, 소프트웨어는 염기쌍 T를 쵸청할 수 있고, 실제로 당해 요청은, 소프트웨어가 가장 가능성이 있는 것으로 여겨지는 요청이다. 그러나, 일부 경우에서, 당해 요청은, 신뢰도가 낮을 수 있는데, 예를 들면, 동족체 신호는, 특정한 염기쌍이 T가 될 가능성이 단지 90%이고, A가 될 가능성이 10%임을 나타낼 수 있다. 다른 예에서, SNP 배열 판독기와 관련된 소프트웨어를 요청하는 유전형은 특정의 대립유전자가 G가 되도록 요청할 수 있다. 그러나, 실제로, 직면한 동족체 신호는, 대립유전자가 G인 가능성이 단지 70%이고 대립유전자가 T일 가능성이 30%임을 나타낼 수 있다. 이들 경우에, 보다 높은 수준의 적용이 보다 낮은 수준의 소프트웨어에 의해 이루어진 유전형 요청 및 서열 요청을 사용하는 경우, 이들은 일부 정보를 상실한다. 즉, 유전형 플랫폼에 의해 직접 측정된 것으로서, 1차 유전 데이터는 첨부된 소프트웨어 패키지에 의해 측정된 2차 유전 데이터보다 더 지저분할 수 있지만, 이는 더 많은 정보를 함유한다. 2차 유전 데이터 서열을 게놈에 맵핑시, 일부 염기가 충분한 명확성으로 판독되지 않고/않거나 맵핑이 명확하지 않으므로 많은 판독물이 배출된다. 1차 유전 데이터 서열 판독물이 사용되는 경우, 2차 유전 데이터 서열 판독물로 먼저 전한되는 경우 매출될 수 있는 모든 또는 많은 판독물을 확률론적 방식으로 판독물을 처리하여 사용할 수 있다.
본원의 구현예에서, 보다 높은 수준의 소프트웨어는 대립유전자 요청, SNP 요청, 또는 보다 낮은 수준의 소프트웨어에 의해 측정된 서열 판독물에 의존하지 않는다. 대신, 보다 높은 수준의 소프트웨어는 유전형 플랫폼으로부터 직접 측정된 유사체 신호에 대한 이의 계산을 기반으로 한다. 본원의 일 구현예에서, PARENTAL SUPPORTTM과 같은 정보학을 기반으로 하는 방법은, 배아/태아/자녀의 유전 데이터를 재구축하는 이의 능력을 가공하여 유전형 플랫폼에 의해 측정된 것으로서 1차 유전 데이터를 직접 사용하도록 변형된다. 본원의 일 구현예에서, PARENTAL SUPPORTTM과 같은 정보학 기반 방법은 1차 유전 데이터를 사용하고, 2차 유전 데이터는 사용하지 않으면서 대립유전자 요청 및/또는 염색체 카피 수 요청을 이룰 수 있다. 본원의 일 구현예에서, 모든 유전 요청, SNP 요청, 서열 판독물, 서열 맵핑은 1차 유전 데이터를 2차 유전 요청으로 전환시키기 보다는, 유전형 플랫폼에 의해 직접 측정된 미가공 강도 데이터를 사용함으로써 확률론적 방식으로 처리된다. 일 구현예에서, 대립유전자 수 확률을 계산하고 각각의 가설의 상대적인 확률을 계산하는데 사용된 제조된 시료의 DNA 측정은 1차 유전 데이터를 포함한다.
일부 구현예에서, 당해 방법은 적어도 하나의 관련 개체의 유전 데이터를 포함하는 표적 개체의 유전 데이터의 정밀도를 증가시킬 수 있으며, 당해 방법은 표적 개체의 게놈에 대해 특이적인 1차 유전 데이터 및 관련 개체(들)의 게놈(들)에 대해 특이적인 유전 데이터를 수득하는 단계, 관련된 개체(들)의 어느 염색체의 분절이 가능하게는 표적 개체의 게놈에서 이들 분절에 상응하는지에 관한 하나 이상의 가설의 세트를 생성시키는 단계, 표적 개체의 1차 유전 데이터 및 관련된 개체(들)의 유전 데이터를 제공한 가설 각각의 확률을 측정하는 단계, 및 각각이 가설과 관련된 확률을 사용하여 표적 개체의 실제 유전 물질의 가장 유사한 상태를 측정하는 단계를 포함한다. 일부 구현예에서, 당해 방법은 표적 개체의 게놈에서 염색체의 분절의 카피의 수를 측정할 수 있으며, 당해 방법은 염색체 분절의 얼마나 많은 카피가 표적 개체의 게놈 속에 존재하는지에 대한 카피 수 가설의 세트를 생성하는 단계, 하나 이상의 관련된 개체의 유전 정보 및 표적 개체의 1차 유전 데이터를 데이터 세트내로 포함시키는 단계, 데이터 세트와 관련된 플랫폼 반응의 특성을 평가하는 단계(여기서, 당해 플랫폼 반응은 실험마다 변할 수 있다), 각각의 카피 수 가설, 소정의 데이터 세트 및 플랫폼 반응 특성의 조건화된 확률을 계산하는 단계, 및 가장 가능성있는 카피 수 가설을 기반으로 염색체 분절의 카피 수을 측정하는 단계를 포함한다. 일 구현예에서, 본원의 방법은 표적 개체에서 적어도 하나의 염색체의 배수성 상태를 측정할 수 있으며, 당해 방법은 표적 개체로부터 그리고 하나 이상의 관련 개체로부터 1차 유전 데이터를 수득하는 단계, 표적 개체의 염색체 각각에 대해 적어도 하나의 배수성 상태 가설의 세트를 생성시키는 단계, 하나 이상의 배출 기술을 사용하여 세트내 각각의 배수성 상태 가설, 사용된 각각의 숙련된 기술에 대한 통계적 확률을, 수득된 유전 데이터를 제공하여 측정하는 단계, 각각의 배수성 상태 가설에 대해, 하나 이상의 숙련된 기술에 의해 측정된 것으로서 통게적 확률을 합하는 단계, 및 각각의 배수성 상태 가설의 합해진 통계적 확률을 기반으로 표적 개체에서 염색체 각각에 대한 배수성 상태를 측정하는 단계를 포함한다. 일 구현예에서, 본원의 방법은 대립유전자의 세트, 표적 개체, 및 표적 개체의 한쪽 또는 양쪽 부모로부터, 그리고 선택적으로, 하나 이상의 관련 개체로부터 대립유전자들의 세트의 대립유전자 상태를 측정할 수 있으며, 당해 방법은 표적 개체, 및 부모 한명 또는 둘 모두, 및 어떠한 관련 개체의 1차 유전 데이터를 수득하는 단계, 표적 개체, 및 부모 한명 또는 둘 모두, 및 임의로 한명 이상의 관련된 개체에 대해 적어도 하나의 대립유전자 가설을 생성시키는 단계(여기서, 당해 가설은 대립유전자의 세트에서 가능한 대립유전자 상태를 기술한다), 수득된 유전 데이터가 가설들의 특정 세트에서 각각의 대립유전자 가설에 대한 통계적 가능성을 측정하는 단계, 및 각각이 대립유전자 가설의 통계적 확률을 기반으로 하여, 표적 개체에 대해, 및 부모 한명 또는 둘 모두에 대해, 및 임의로 한명 이상의 관련된 개체에 대해 대립유전자 상태를 측정하는 단계를 포함한다.
일부 구현예에서, 혼합된 시료의 유전 데이터는 서열 데이터를 포함할 수 있으며, 여기서 당해 서열 데이터는 사람 게놈에 유일하게 맵핑되지 않을 수 있다. 일부 구현예에서, 혼합된 시료의 유전 데이터는 서열 데이터를 포함할 수 있으며, 여기서 서열 데이터는 게놈내 다수의 위치에 맵핑되며, 여기서 각각의 가능한 맵핑은, 소정의 맵핑이 정확한지에 대한 확률과 관련된다. 일부 구현예에서, 서열 판독물은 게놈에 특수 위치와 관련된 것으로 추정되지 않는다. 일부 구현예에서, 서열 판독물은 게놈내 다수의 위치, 및 당해 위치에 속하는 관련된 확률과 관련되어 있다.
염색체 카피 수를 측정하기 위한 방법 계산
하나의 측면에서, 본 발명은 상이한 염색체에 정렬된 서열 태그의 수를 비교함으로써 태아 염색체의 비정상적인 분포에 대해 시험하는 방법을 특징으로 한다(참조: 예를 들면, 이의 전문이 본원에 참조로 포함된, 2012년 4월 20일자로 출원된 미국 특허 제8,296,076호). 당해 분야에 공지된 바와 같이, 용어 "서열 태그"는 예를 들면, 염색체 또는 게놈 영역 또는 유전자에 맵핑될 특정의 보다 큰 서열을 확인하는데 사용될 수 있는 비교적 짧은(예: 15 내지 100) 핵산 서열을 말한다. 일부 구현예에서, 당해 방법은 (i) 모계 또는 태아 DNA의 혼합물을 포함하는 시료를 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 표적 유전자자리에 동시에 하이브리드화하는 프라이머의 라이브러리와 접촉시켜 반응 혼합물을 생산하는 단계(여기서, 표적 유전자자리는 다수의 상이한 염색체에서 기원하며; 여기서 다수의 상이한 염색체는 시료 속에 비정상적인 분포를 갖는 것으로 추측된 적어도 하나의 제1 염색체 및 시료 속에 일반적으로 분포된 것으로 추측된 적어도 하나의 제2 염색체를 포함한다); (ii) 반응 혼합물을 프라이머 연장 반응 조건에 적용시켜 증폭된 생성물을 생산하는 단계; (iii) 증폭된 생성물을 서열분석하여 표적 유전자자리에 정렬되는 다수의 서열 태그를 수득하는 단계(여기서, 서열 태그는 특이적인 표적 유전자자리에 지정되기에 충분한 길이이다); (iv) 컴퓨터 상에서 이들의 상응하는 표적 유전자자리에 대한 다수의 서열 태그를 지정하는 단계; (v) 컴퓨터 상에서 제1의 염색체의 표적 유전자자리에 지정하는 서열 태그의 수 및 제2 염색체의 표적 유전자자리에 지정하는 서열 태그의 수를 측정하는 단계; 및 (vi) 단계 (v)에서 측정된 수를 비교하여 제1 염색체의 비정상적인 분포의 존재 또는 부재를 측정하는 단계를 포함한다.
하나의 측면에서, 본 발명은 염색체 사이의 표적 앰플리콘의 상대적인 빈도를 비교함으로써 태아 이수성의 존재 또는 부재를 측정하는 방법을 제공한다(참조: 예를 들면, 이의 전문이 본원에 참조로 포함된, 2012년 1월 23일자로 출원된, PCT 공보 제WO 2012/103031호). 일부 구현예에서, 당해 방법은 (i) 모계 및 태아 DNA의 혼합물을 포함하는 시료를 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 비-다형성 표적 유전자자리에 동시에 하이브리드화하는 프라이머의 라이브러리와 접촉시켜 반응 혼합물을 생산하는 단계(여기서, 표적 유전자자리는 다수의 상이한 염색체에서 기원한다); (ii) 반응 혼합물을 프라이머 연장 반응 조건에 적용시켜 표적 앰플리콘을 포함하는 증폭된 생성물을 생산하는 단계; (iii) 컴퓨터 상에서 목적한 제1 및 제2 염색체의 표적 앰플리콘의 상대적인 빈도를 정량하는 단계; (iv) 컴퓨터 상에서 목적한 제1 및 제2의 염색체의 표적 앰플리콘의 상대적 빈도를 비교하는 단계; 및 (v) 목적한 제1 및 제2의 염색체의 비교된 상대적 빈도를 기반으로 하여 이수성의 존재 또는 부재를 확인하는 단계를 포함한다. 일부 구현예에서, 제1의 염색체는 정배수성인 것으로 추측된 염색체이다. 일부 구현예에서, 제2의 염색체는 이수성인 것으로 추측된 염색체이다.
태아기 진단의 조합 방법
이수성 또는 다른 유전 결함의 태아기 진단 또는 산전 스크리닝에 사용될 수 있는 많은 방법이 있다. 본 문서의 어딘가에 및 2006년 11월 28일자로 출원된 미국 실용신안 출원 일련번호 제11/603,406호, 2008년 3월 17일자로 출원된 미국 실용신안 출원 일련번호 제12/076,348호, 및 PCT 출원 일련번호 제PCT/S09/52730호에, 관련 개체의 유전 데이터를 사용하여 정밀도를 증가시키고 이를 사용하여 태아와 같은 표적 개체의 유전 데이터를 알거나 평가하는 하나의 이러한 방법이 기재되어 있다. 태아기 진단에 사용된 다른 방법은 모계 혈액 속에서 특정 호르몬의 수준을 측정하는 단계를 포함하며, 여기서 이들 호르몬은 각종 유전 비정상과 관련되어 있따. 이의 예는 수개(일반적으로 2개, 3개, 4개 또는 5개)의 상이한 호르몬의 수준이 모계 혈액 속에서 측정되는 시험인, 3중 시험으로 불린다. 다수의 방법을 사용하여 특정한 결과의 가능성을 측정하는 경우에, 방법이 확정적이지 않거나 자체가 아닌 경우, 이들 방법으로 소정의 정보를 합하여 개개 방법 중 어느 것보다 더 정밀한 예측을 하는 것이 가능하다. 3중 시험에서, 3개의 상이한 호르몬에 의해 소정의 정보를 합하는 것은 예측될 수 있는 개개 호르몬 수준보다 더 정밀한 유전 비정상을 예측할 수 있다.
태아의 유전 상태, 구체적으로 태아내 유전적 비정상의 예측을 합하는 것을 포함하여 태아내에서 유전적 비정상의 가능성에 대해 보다 정밀한 예측을 하는 방법이 본원에 기재되어 있으며, 여기서 이러한 예측은 다양한 방법을 사용하여 이루었다. "보다 정밀한" 방법은 소정의 거짓 양성 비율에서 보다 낮은 거짓 음성 비율을 갖는 비정상성을 진단하는 방법을 말할 수 있다. 본원의 양호한 구현예에서, 하나 이상의 예측은 태아에 대해 공지된 유전 데이터를 기반으로 이루어지며, 여기서 유전적 지식은 PARENTAL SUPPORTTM 방법, 즉, 태아와 관련된 개체의 유전 데이터를 사용하여 보다 큰 정밀도로 태아의 유전 데이터를 측정하는 방법을 사용하여 측정되었다. 일부 구현예에서 유전 데이터는 태아의 배수성 상태를 포함할 수 있다. 일부 구현예에서 유전 데이터는 태아의 게놈에 대한 대립유전자 요청의 세트를 말할 수 있다. 일부 구현예에서 예측의 일부는 3중 시험을 사용하여 이루어질 수 있었다. 일부 구현예에서, 예측의 일부는 모계 혈액 속의 다른 호르몬 수준의 측정을 사용하여 이루어질 수 있었다. 일부 구현예에서, 진단을 고려한 방법에 의해 이루어진 예측은 스크리닝을 고려한 방법에 의해 이루어진 예측과 합할 수 있다. 일부 구현예에서, 당해 방법은 알파-페토단백질(AFP)의 모계 혈액 수준을 측정하는 단계를 포함한다. 일부 구현예에서, 당해 방법은 접합되지 않은 에스트리올(UE3)의 모계 혈액 수준을 측정하는 단계를 포함한다. 일부 구현예에서, 당해 방법은 베타 사람 융모성 고나도트로핀(베타-hCG)의 모계 혈액 수준을 측정하는 단계를 포함한다. 일부 구현예에서, 당해 방법은 침입성 영양세포줄기 항원(ITA)의 모계 혈액 수준을 측정하는 방법을 포함한다. 일부 구현예에서, 당해 방법은 인히빈의 물질 혈액 수준을 측정하는 단계를 포함한다. 일부 구현예에서, 당해 방법은 임신-관련 혈장 단백질 A(PAPP-A)의 모계 혈액 수준을 측정하는 단계를 포함한다. 일부 구현예에서, 당해 방법은 다른 호르몬의 모계 혈액 수준 또는 모계 혈청 마커를 측정하는 단계를 포함한다. 일부 구현예에서, 예측의 일부는 다른 방법을 사용하여 이루어질 수 있다. 일부 구현예에서, 예측중의 일부는 임신 12주 근처에서 초음파 및 혈액 시험 및 16주 주변에서 제2의 혈액 시료를 합한 것과 같은 완전히 통합된 시험을 사용하여 이루어 왔다. 일부 구현예에서, 당해 방법은 태아 목덜미 반투명(NT)을 측정하는 단계를 포함한다. 일부 구현예에서, 당해 방법은 예측을 이루기 위해 전술한 호르몬의 측정된 수준을 사용하는 단계를 포함한다. 일부 구현예에서, 당해 방법은 상술한 방법의 조합을 포함한다.
예측을 합하는 많은 방법이 존재하는데, 예를 들면, 호르몬 측정을 다수의 중간값(MoM)으로 전환시킨 후 가능성 비(LR)로 전환시킬 수 있다. 유사하게, 다른 측정을 NT 분포의 혼합물 모델을 사용하여 LR로 전환시킬 수 있다. NT용 LR 및 생화학적 마커는 연령 및 소화 관련 위험을 곱하여 삼염색체성 21과 같은 다양한 조건에 대한 위험을 유도할 수 있었다. 검출비(DR) 및 거짓-양성 비(FPR)는 소정의 위험 한계를 초과하는 위험을 지닌 집단을 취하여 계산할 수 있었다.
일 구현예에서, 배수성 상태를 요청하는 방법은 결합 분포 모델을 사용하여 측정된 배수성 가설 각각의 상대적인 가능성 및 대립유전자 수 가능성을 판독물 수 비 분석, 이형접합성 비의 비교, 부모계 유전 정보를 사용하는 경우 유일하게 이용가능한 통계, 특정의 부모 관계에 대한 표준화된 유전형 신호의 가능성, 제1의 시료 또는 제조된 시료의 평가된 태아 분획을 사용하여 계산된 통계, 및 이의 조합을 포함하나, 이에 한정되지 않는, 삼염색체성인 태아에 대한 위험 점수를 측정하는 다른 방법에서 취한 통계 기술을 사용하여 계산된 배수성 가설 각각의 상대적인 가능성과 합하는 단계를 포함한다.
다른 방법은 4개의 측정된 호르몬 수준을 사용하는 상황을 포함할 수 있으며, 여기서 이들 호르몬 주변의 가능성 분포는 알려져 있다: 정배수성의 경우 p(x1, x2, x3, x4|e) 및 이수성 경우 p(x1, x2, x3, x4|a). 이후에, DNA 측정을 위한 확률 분포, g(y|e) 및 정배수성 및 이수성 경우에 대한 g(y|a) 각각을 측정할 수 있다. 이들이 소정의 정배수성/이수성의 추측에 의존적인 것으로 가정하여, p(x1, x2, x3, x4|a)g(y|a) 및 p(x1, x2, x3, x4|e)g(y|e)로서 합한 후 각각에 모친 연령이 소정의 이전의 p(a) 및 p(e)를 곱할 수 있다. 이후에, 최대인 것을 선택할 수 있다.
일 구현예에서, 중심 한계 정리를 유발시켜 g(y|a 또는 e) 상에서의 분포가 다수의 시료를 관찰함에 의해, 가우시안, 및 척도 평균 및 표준 편차인지를 추정할 수 있다. 다른 구현예에서, 이들이 소정의 결과와는 독립적이 아님을 추정하여 결합 분포 p(x1, x2, x3, x4|a 또는 e)를 평가하기에 충분한 시료를 수집할 수 있다.
일 구현예에서, 표적 개체에 대한 배수성 상태는, 이의 확률이 최대인 가설과 관련된 배수성 상태인 것으로 측정된다. 일부 경우에, 한가지 가설은 90% 초과의 표준화되고, 합해진 확률을 가질 것이다. 각각의 가설은 배수성 상태 하나 또는 세트와 관련되어 있으며, 이의 표준화되고, 합해진 가능성이 90% 초과이거나, 50%, 80%, 95%, 98%, 99%, 또는 99.9%와 같은 일부 다른 한계 값과 관련된 배수성 상태는 측정된 배수성 상태로서 요청될 가설에 대해 요구된 한계로서 선택될 수 있다.
모계 혈액에 존재하는 이전 임신의 자녀의 DNA
비-침입성 출생전 진단의 한가지 어려움은 현재의 임신의 태아 세포를 이전 임신의 태아 세포와 구별하는 것이다. 어떤 이는, 이전 임신의 유전 물질이 얼마의 시간 후 사라질 것이지만, 결론적인 증거는 나타나지 않았다고 생각한다. 본원의 구현예에서, 부계 기원의 모계 혈액(즉, 태자녀 부친으로부터 유전받은 DNA) 속에 존재하는 태아 DNA는 PARENTAL SUPPORTTM (PS) 방법, 및 부모계 게놈의 지식을 사용하여 측정하는 것이 가능하다. 당해 방법은 단계화된 부모계 유전 정보를 이용할 수 있다. 조부모계 유전 데이터(할아버지 정자의 측정된 유전 데이터와 같은), 또는 다른 태아안 자녀, 또는 유산의 시료의 유전 데이터를 사용하여 단계화되지 않은 유전형 정보에 의하여 부모계 유전형을 단계화하는 것이 가능하다. 또한 HapMap-계 단계화, 또는 부모계 세포의 배체형의 방법으로 단계화되지 않은 유전 정보를 단계화할 수 있다. 성공적인 배체형은, 염색체가 강력한 다발이고 미소유체를 사용하여 별도의 웰 속에서 염색체를 분리하는 경우 유사분열의 상에서 세포를 정지시켜 입증하였다. 다른 구현예에서, 단계화된 부모계 일배체형 데이터를 사용하여 부친의 하나 이상의 동족체의 존재를 검출하는 것이 가능하며, 1명 이상의 자녀의 유전 물질이 혈액 속에 존재함을 내포한다. 태아내 정배수성인 것으로 예측된 염색체에 촛점을 맞춤으로써, 태자녀 삼염색체성에 영향을 받을 가능성을 제외시킬 수 있다. 또한, 태아 DNA가 현재의 부친에서 기원하지 않는 경우를 측정하는 것이 가능하며, 이 경우 3중 시험과 같은 다른 방법을 사용하여 유전적 비정상을 예측할 수 있다.
채혈 이외의 방법을 통해 이용가능한 태아 유전 물질의 다른 공급원이 존재할 수 있다. 모계 혈액 속에서 이용가능한 태아 유전 물질의 경우에, 2개의 주요 범주가 존재한다: (1) 전체 태아 세포, 예를 들면, 핵화된 태아 적혈구 세포 또는 적아구, 및 (2) 자유로이 부유하는 태아 DNA. 전체 태아 세포의 경우에, 태아 세포가 연장된 기간 동안 모계 혈액 속에서 존재함으로써 자녀 또는 이전 임신의 태아의 DNA를 함유하는 임신한 여성의 세포를 분리할 수 있다. 자유로이 부유하는 태아 DNA가 주의 문제로 시스템에서 정화되는 증거가 또한 존재한다. 한 가지 과제(challenge)는, 이의 유전 물질이 세포 속에 함유된 개체의 실체를 측정하는 방법, 즉, 측정된 유전 물질이 이전 임신의 태아에서 기원한 것이 아니라는 것을 확인하는 것이다. 본원의 구현예에서, 모계 유전 물질의 지식을 사용하여 문제의 유전 물질이 모계 유전 물질이 아니라는 것을 확인할 수 있다. 본 서류 또는 본 서류에 언급된 특허 중 어느 것에 기술된 바와 같은, PARENTAL SUPPORTTM와 같은 정보학 기반 방법을 포함하는, 이러한 목적을 달성하기 위한 다수의 방법이 존재한다.
본원의 일 구현예에서, 임신한 모친에서 채취한 혈액은 자유로이 부유하는 태아 DNA를 포함하는 분획, 및 핵화된 적혈구 세포를 포함하는 분획으로 분리할 수 있다. 자유로이 부유하는 DNA는 임의로 농축시킬 수 있으며, DNA의 유전형 정보를 측정할 수 있다. 자유로이 부유하는 DNA의 측정된 유전형 정보의 모계 유전형의 지식을 사용하여 태아 유전형의 측면을 측정할 수 있다. 당해 측면은 배수성 상태, 및/또는 대립유전자 실체의 세트를 말한다. 이후에, 개체의 핵화된 적혈구 세포는 본 서류, 및 다른 참조 특허, 특히 본 서류의 제1 단락에서 언급된 것들의 어딘가에 기술된 방법을 사용하여 유전형 분석할 수 있다. 모계 게놈의 지식은 소정의 단일 혈액 세포가 유전적으로 모의 것인지 또는 아닌지를 측정하도록 한다. 그리고, 상기 기술된 바와 같이 측정된 태아 유전형의 측면은, 단일 혈액 세포가 현재 임신중인 태아에서 유전적으로 기원하는지를 측정할 수 있도록 한다. 필수적으로, 본원의 이러한 측면은, 모친의 유전 지식, 및 가능하게는 부친과 같은 다른 관련된 개체의 유전 정보를, 모계 혈액 속에서 발견된 자유로이 부유하는 DNA의 측정된 유전 정보와 함께 사용하여 모계 혈액 속에서 발견된 분리된 핵화된 세포가 (a) 유전적으로 모계인지, (b) 유전적으로 현재 잉태된 태아에서 기원하는지, 또는 (c) 유전적으로 이전 임신의 태아에서 기원하는지를 측정하도록 한다.
출생전 성 염색체 이수성 측정
당해 분야에 공지된 방법에서, 모계 혈액으로부터 임신중인 태아의 성별을 판별하기 위해 접근법하는 사람들은, 태아의 자유로이 부유하는 DNA(fffDNA)가 모의 혈장 속에 존재한다는 사실을 사용한다. 모계 혈장 속에서 Y-특이적인 유전자자리를 검출할 수 있는 경우, 이는, 잉태중인 태자녀 남자임을 내포한다. 그러나, 혈장 속의 Y-특이적인 유전자자리의 검출의 부재는, Y-특이적인 유전자자리가 남자 태아의 경우에 검출될 수 있는 지를 보증할 수 없도록 fffDNA의 양이 너무 적은 경우 잉태되는 태자녀 여자인지를 항상 보장하지는 않는다.
본원에서는, Y-특이적인 핵산, 즉, 전적으로 부모계 기원 유전자자리의 DNA의 측정을 필요로 하지 않는 신규한 방법을 나타낸다. 앞서 개시된 부모 지지 방법은 교차 빈도 데이터, 부모계 유전형 데이터, 및 정보학 기술을 사용하여 잉태중인 태아의 배수성 상태를 측정한다. 태아의 성별은 성 염색체에서 단순히 태아의 배수성 상태이다. XX인 자녀는 여자녀고, XY는 남아있다. 본원에 기술된 방법은 또한 태아의 배수성 상태를 측정하기 위한 것이다. 성감별이 성 염색체의 배수성 측정과 동의어임에 주목하며; 성감별의 경우에, 추정은 종종, 자녀가 정배수성이어서 약간의 가능한 가설이 존재하는 경우에 이루어진다.
본원에 개시된 방법은 X 및 Y 염색체 둘 모두에 대해 일반적인 유전자자리에서 찾아 태아에 대해 존재하는 태아 DNA의 예측된 양의 측면에서 기본선을 생성하는 것을 포함한다. 이후에, X 염색체에 대해서만 특이적인 영역의 정보를 얻어서 태자녀 여아인지 또는 남아인지를 측정할 수 있다. 남아의 경우에, 본 발명자들은 X 및 Y 둘다에 대해 특이적인 유전자자리보다는 X 염색체에 대해 특이적인 유전자자리에서 태아 DNA를 거의 찾을 수 없는 것으로 예측한다. 대조적으로, 여아 태아에서, 본 발명자는 이들 그룹 각각에 대한 DNA의 양이 동일할 것으로 예측한다. 문제의 DNA는 시료 속에 존재하는 DNA의 양을 정량화할 수 있는 어떠한 기술, 예를 들면, qPCR, SNP 배열, 유전형 배열, 또는 서열분석으로 측정할 수 있다. 개체에서 전적으로 기원하는 DNA의 경우, 본 발명자는 다음을 찾을 수 있는 것으로 예측할 수 있다:
Figure 112015017677503-pct00106

모친의 DNA와 혼합된 태아의 DNA의 경우, 및 혼합물 속의 태아 DNA의 분획이 F인 경우 및 혼합물의 모계 DNA의 분획이 M인 경우에, F+M = 100%이도록 함으로써, 본 발명자는 다음을 찾는 것을 예측할 수 있다:
Figure 112015017677503-pct00107

F 및 M이 알려져 있는 경우에, 예측된 비를 계산하고, 관찰된 데이터를 예측된 데이터와 비교할 수 있다. M 및 F가 알려져 있지 않은 경우, 한계는 과거 데이터를 기반으로 선택할 수 있다. 둘 모두의 경우에서, X 및 Y 둘 모두에 대해 특이적인 유전자자리에서 DNA의 측정된 양을 기본선으로 사용할 수 있으며, 태아의 성별에 대한 시험은 X 염색체 만에 대해 특이적인 유전자자리에서 관찰된 DNA의 양을 기반으로 할 수 있다. 당해 양이 ½F와 거의 동일한 양, 또는 예정된 한계 이하에 속하도록 하는 양까지 기본선보다 낮은 경우, 태아는 남아인 것으로 측정되며, 당해 양이 기본선과 거의 같거나, 예정된 한계 이하에 속하도록 향까지 낮지 않는 경우, 태아는 여아로 측정된다.
다른 구현예에서, X 및 Y 염색체 둘 모두에 대해 일반적인, Z 염색체로 흔히 명명된 유전자자리에서만 찾을 수 있다. Z 염색체 상의 유전자자리의 소세트는 X 염색체에서 전형적으로 항상 A이며, Y 염색체에서는 B이다. Z 염색체의 SNP가 B 유전형을 갖는 것으로 밝혀진 경우, 태아는 남아로 불리며; Z 염색체의 SNP가 단지 A 유전형을 갖는 것으로 밝혀진 경우, 태아는 여아로 불린다. 다른 구현예에서, X 염색체 상에서만 발견된 유전자자리에서 찾을 수 있다. AA|B과 같은 관계는, B의 존재가, 태자녀 부친의 X 염색체를 가지고 있다는 것을 나타내므로 특히 유익하다. AB|B와 같은 관계도, 본 발명자가 남아 티아와 비교하여 여아 태아의 경우에 흔한 것으로 단지 반으로만 존재하는 B를 찾는 것을 예측하므로, 유익하다. 다른 구현예에서, A 및 B 대립유전자 둘 모두가 X 및 Y 염색체 상에 존재하고, 어느 SNP가 부모 Y 염색체에서 기원되고, 어느 것이 부모 X 염색체에서 기원하는지 알려져 있는 경우에 Z 염색체 상에서 SNP를 찾을 수 있다.
일 구현예에서, 염색체 Y 및 염색체 X에 의해 공유된 동종 비-재조합(HNR) 영역 사이에서 변하는 것으로 알려진 단일 뉴클레오타이드 위치를 증폭시키는 것이 가능하다. 당해 HNR 영역내 서열은 X 및 Y 염색체 상에서 크게 동일하다. 이러한 동일한 영역내에는, 집단내 X 염색체 및 Y 염색체 중의 불변이 X 및 Y 염색체 사이에서 상이한 단일 뉴클레오타이드 위치가 존재한다. 각각의 PCR 검정은 X 및 Y 염색체 둘 모두에 존재하는 유전자자리의 서열을 증폭시킬 수 있다. 각각의 증폭된 서열 내에서 서열분석 또는 일부 다른 방법을 사용하여 검출될 수 있는 단일 염기가 존재할 수 있다.
일 구현예에서, 태아의 성별을 모계 혈장 속에서 발견된 태아의 자유로이 부유하는 DNA로부터 측정할 수 있으며, 당해 방법은 다음 단계 중 일부 또는 모두를 포함한다: 1) PCR(정규의 또는 미니-PCR, 및 경우에 따라 다중화) 프라이머를 HNR 영역내에서 X/Y 변이체 단일 뉴클레오타이드 위치를 증폭시키는 단계, 2) 모계 혈장을 수득하는 단계, 3) HNR X/Y PCR 검정을 사용하여 모계 혈장의 표적을 PCR 증폭시키는 단계, 4) 앰플리콘을 서열화하는 단계, 5) 하나 이상의 증폭된 서열내에서 Y-대립유전자의 존재에 대해 서열 데이터를 시험하는 단계. 하나 이상의 존재는 남아 태아를 나타낼 수 있다. 모든 앰플리콘의 Y-대립유전자의 부재는 여아 태아를 나타낸다.
일 구현예에서, 모계 혈장 및/또는 부모계 유전형 속에서 DNA를 측정하기 위해 표적화된 서열분석을 사용할 수 있다. 일 구현예에서, 부모로부터 받은 DNA에서 명확하게 기원한 모든 서열을 무시할 수 있다. 예를 들면, AA|AB와 관련하여, A 서열의 수를 계수하고 모든 B 서열을 무시할 수 있다. 상기 알고리즘에 대한 이형접합성 비율을 측정하기 위하여, 관찰된 A 서열의 수를 소정의 프로브에 대한 전체 서열의 예측된 수와 비교할 수 있다. 시료 기준으로 각각의 프로브에 대해 예측된 수의 서열을 계산할 수 있는 많은 방법이 존재한다. 일 구현예에서, 모든 서열의 어느 분획이 각각의 특이적인 프로브에 속하는지를 측정한 후 이러한 실험적 분획을 사용하여 전체 수의 서열 판독물과 합하여, 각각의 프로브에서 다수의 서열을 평가하는 것이 가능하다. 다른 접근법은 일부 공지된 동종접합성 대립유전자를 표적화한 후 과거 데이터를 사용하여 각각의 프로브에서의 다수의 판독물과 공지된 동종접합성 대립유전자에서 다수의 판독물을 관련시킬 수 있다. 각각의 시료의 경우, 이후에 동종접합성 대립유전자에서 판독물의 수를 측정한 후 당해 측정을 실험적으로 기원한 관계와 함께 사용하여 각각의 프로브에서 다수의 서열 판독물을 평가하는 것이 가능하였다.
일부 구현예에서, 다수의 방법에 의해 이루어진 예측을 결합시켜 태아의 성별을 측정하는 것이 가능하다. 일부 구현예에서, 다수의 방법은 본 기내내용에 기술된 방법으로부터 취한다. 일부 구현예에서, 다수 방법 중의 적어도 하나는 본 기재내용에 기술된 방법으로부터 취한다.
일부 구현예에서, 본원에 기술된 방법을 사용하여 잉태된 태아의 배수성 상태를 측정할 수 있다. 일 구현예에서, 배수성 요청 방법은 X 염색체에 대해 특이적이거나, X 및 Y 염색체 둘 모두에 대해 일반적인 유전자자리를 사용하지만, 어떠한 Y-특이적인 유전자자리를 사용하지 않는다. 일 구현예에서, 배수성 요청 방법은 다음 중 하나 이상을 사용한다: X 염색체에 대해 특이적인 유전자자리, X 및 Y 염색체 둘 모두에 대해 일반적인 유전자자리, 및 Y 염색체에 대해 특이적인 유전자자리, 일 구현예에서, 성별 염색체의 비가 유사한 경우, 예를 들어, 45,X (터너 증후군), 46,XX(일반적인 남아) 및 47,XXX(삼염색체성 X)의 경우, 대립유전자를 다양한 가설에 따라 예측된 대립유전자 분포와 비교함으로써 달성할 수 있다. 다른 구현예에서, 이는 성 염색체의 상대적인 수의 서열 판독물을 정배수성인 것으로 추정된 다수의 참조 염색체와 비교하여 달성할 수 있다. 또한, 이들 방법이 이수성 경우를 포함하도록 확장될 수 있음에 주목한다.
단일 유전자 질병 스크리닝
일 구현예에서, 태아의 배수성 상태를 측정하는 방법은 단일 유전자 질환에 대한 동시 시험이 가능하도록 확장시킬 수 있다. 단일-유전자 질병 진단은 이수성 시험에 대해 사용된 동일한 표적화된 접근법을 지렛대로 하며, 추가의 특이적인 표적을 필요로 한다. 일 구현예에서, 단일 유전자 NPD 진단은 연결 분석을 통한다. 많은 경우에, cfDNA 시료의 직접적인 시험은, 모계 DNA의 존재가 이를 태자녀 모계 돌연변이를 유전받았는지를 측정하는 것을 실제로 불가능하게 하므로, 신뢰할 수 없다. 유일한 부모-기원한 대립유전자의 검출은 거의 도전적이지 않지만, 질병이 우성이고 부친에 의해 운반되는 경우에만 충분히 유익하여, 당해 접근법의 활용을 제한한다. 일 구현예에서, 당해 방법은 PCR 또는 관련된 증폭 접근법을 포함한다.
일부 구현예에서, 당해 방법은 비정상 대립유전자를 일촌 친척(first-degree relatives)에서 비롯된 정보를 사용하여 부모에서 주변을 매우 강력하게 연결된 SNP로 단계화함을 포함한다. 이후에, 부모 지지는 이들 SNP로부터 수득된 표적화된 서열분석 데이터에서 수행하여 정상 또는 비정상인 어느 동족체가 부모 둘 모두로부터 태자녀 유전받았는지를 측정한다. SNP가 충분히 연결되어 있는 한, 태아의 유전형의 유전은 매우 신뢰가능하게 측정될 수 있다. 일부 구현예에서, 당해 방법은 (a) SNP 유전자자리의 세트를 가하여 일반적인 질병의 구체화된 세트를 이수성 시험을 위한 본 발명자들의 다중화 혼주물(mul tiplex pool)에 밀접하게 플랭킹시키는 단계; (b) 이들 가해진 SNP의 대립유전자를 다양한 친척의 유전 데이터를 기반으로 비정상 및 정상의 대립유전자로 신뢰가능하게 단계화하는 단계; 및 (c) 유전된 물질 및 질병 유전자자리 주변의 영역내 부모 동족체에서 태아 일배체형, 또는 단계적인 SNP 대립유전자의 세트를 재작제하여 태아 유전형을 측정하는 단계를 포함한다. 일부 구현예에서, 질병 연결된 유전자자리에 밀접하게 연결된 추가의 프로브는 이수성 시험에 사용되는 다형성 유전자자리의 세트에 가해진다.
태아 이배체형을 재작제하는 것은, 당해 시료가 모계 및 태아 DNA의 혼합물이므로 도전적이기 때문이다. 일부 구현예에서, 당해 방법은 상대적인 정보를 포함함으로써 SNP와 질병 대립유전자를 단계화한 후, SNP 및 위치 특이적인 재조합 가능성에 근거한 재조합 데이터 및 모계 혈장의 유전 측정에 의하여 관찰된 데이터의 물리적 거리를 고려하여 태아의 가장 가능성 있는 유전형을 수득한다.
일 구현예에서, 질병 연결된 유전자자리 당 다수의 추가의 프로브가 표적화된 다형성 유전자자리의 세트에 포함되며; 질병 연관된 유전자자리 당 다수의 추가의 프로브의 수는 4 내지 10, 11 내지 20, 21 내지 40, 41 내지 60, 61 내지 80, 또는 이의 조합일 수 있다.
부모의 배수성 데이터를 단계화하는 것은 과제일 수 있으며, 달성될 수 있는 다수의 방법이 존재한다. 일부는 본 기재내용에 논의되어 있고, 다른 것은 다른 기재내용에 보다 상세시 기술되어 있다(참조: 예를 들면, 2009년 2월 9일자로 출원된 PCT 공보 제WO2009105531호, 및 2009년 8월 4일자로 출원된 PCT 공보 제WO2010017214호; 이들 각각은, 전문이 본원에 참조로 포함된다). 일 구현예에서, 부모는 예를 들면, 하나 이상의 정자 또는 난자를 측정함으로써 반수체인 부모의 조직을 측정함으로써 추론에 의해 단계화할 수 있다. 일 구현예에서, 부모는 환자의 부모(들) 또는 형제자매와 같은 제1 정도 관련성의 측정된 유전형 데이터를 사용하여 추론에 의해 단계화할 수 있다. 일 구현예에서, 부모는 희석(여기서 DNA는 다수의 웰 속에서, 각각의 웰 속에 각각의 반수체의 대략 1개 이하의 카피가 존재하는 것으로 예상되는 지점까지 희석된다)시킨 후, 하나 이상의 웰 속에서 DNA를 측정함으로써 단계화할 수 있다. 일 구현예에서, 부모계 유전형은 가장 가능성있는 상을 부여하는 일배체형 빈도를 기반으로 집단을 사용하는 컴퓨터 프로그램을 사용하여 단계화할 수 있다. 일 구현예에서, 부모는, 단계화된 일배체형 데이터가 다른 부모에 대해, 부모의 하나 이상의 유전적 자식의 단계화되지 않은 유전 데이터와 함께 공지된 경우 단계화될 수 있다. 일 구현예에서, 환자는, 단계화된 일배체형 데이터가 다른 환자에 대해, 환자의 하나 이상의 유전적 자식의 단계화되지 않은 유전 데이터와 함께 공지되어 있는 경우 단계화될 수 있다. 일부 구현예에서, 환자의 유전적 자식은 하나 이상의 배아, 태아 및/또는 출생아일 수 있다. 부모 한 명 또는 둘 모두를 단계화하기 위한 이들 방법 및 다른 방법의 일부는 2010년 8월 19일자로 출원된, 미국 공보 제2011/0033862호; 2011년 2월 3일자로 출원된 미국 공보 제2011/0178719호, 2006년 11월 22일자로 출원된 미국 공보 제2007/0184467호; 2008년 3월 17일자로 출원된 미국 공보 제2008/0243398호에 개시되어 있으며, 이들은 각각, 이의 전문이 본원에 참조로 포함된다.
태아 게놈 재작제
하나의 측면에서, 본 발명은 태아의 일배체형을 측정하기 위한 방법을 특징화한다. 다양한 구현예에서, 당해 방법은, 어느 다형성 유전자자리(SNP와 같은)가 태아에게 유전되었는지를 측정하고 어느 동족체(재조합 현상을 포함)가 태아에 존재하는지(및 이의 의해 다형성 유전자자리 사이에 서열을 삽입함)를 재작제하도록 한다. 경우에 따라, 필수적으로 태아의 전체 게놈이 재작제될 수 있다. 태아의 게놈내에 일부 남아있는 애매성이 존재하는 경우(교차와의 간격과 같이), 이러한 애매성은, 추가의 다형성 유전자자리를 분석함으로써 최소화할 수 있다. 다양한 구현예에서, 다형성 유전자자리를 선택하여 어느 애매성도 바람직한 수준으로 감소시키는 밀도에서 하나 이상의 염색체를 포함한다. 당해 방법은 태아 게놈내 목적한 다른 돌연변이 또는 다형성을 검출하는 것을 지시하기 보다는 연결(태아 게놈에서 연결된 다형성 유전자자리의 존재와 같은)을 기반으로 이들의 검출이 가능하도록 하므로 태아내 목적한 다른 돌연변이 또는 다형성의 검출에 중요한 적용을 갖는다. 예를 들어, 환자가 낭포성 섬유증(CF)과 관련된 돌연변이에 대한 매개체인 경우, 태아의 모친의 모계 DNA 및 태아의 태아 DNA를 포함하는 핵산 시료를 분석하여 태아 DNA가 CF 돌연변이를 함유하는 일배체형을 포함하는지를 측정할 수 있다. 특히, 다형성 유전자자리를 분석하여, 태아 DNA가 CF 돌연변이를 함유하는 일배체형을 포함하는지를 측정함으로써 태아 DNA내 CF 돌연변이 자체를 검출할 수 있다.
일부 구현예에서, 당해 방법은 부모 일배체형(예를 들면, 태아의 모친 또는 부친의 일배체형)을 측정함을 포함한다. 일부 구현예에서, 이러한 측정은 모친 또는 부친의 친척의 데이터를 사용하지 않고 달성된다. 일부 구현예에서, 부모 일배체형은 희석 접근법에 이어서 본원 및 어딘가(참조: 예를 들면, 이의 전문이 본원에 참조로 혼입된, 2010년 8월 19일자로 출원된 미국 공보 제2011/0033862호)에 기술된 바와 같은 서열분석 또는 SNP 유전형 분석을 사용하여 측정한다. DNA는 희석되므로, 하나 이상의 일배체형이 동일한 분획(또는 튜브) 속에 존재할 가능성은 없다. 따라서, 튜브 속에 DNA의 단일 분자로 효과적으로 존재할 수 있으며, 이는 측정될 단일 DNA 분자에 일배체형을 허용한다. 일부 구현예에서, 당해 방법은 DNA 시료를 다수의 분획으로 나눔으로써 분획 중 적어도 하나가 하나의 염색체 또는 염색체 쌍의 하나의 염색체 분절을 포함하도록 하는 단계, 및 적어도 하나의 분획 속에서 DNA 시료를 유전형분석(예를 들면, 2개 이상의 다형성 유전자자리의 존재를 측정)함으로써, 부모 일배체형을 측정하는 단계를 포함한다. 일부 구현예에서, 유전형분석은 서열분석(예를 들면, 셧건 서열분석)을 포함한다. 일부 구현예에서, 유전형은 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 다형성 유전자자리와 같은 다형성 유전자자리를 검출가히 위한 SNP 배열의 사용을 포함한다. 일부 구현예에서, 유전형분석은 다중 PCR의 사용을 포함한다. 일부 구현예에서, 당해 방법은 분획 속의 시료를 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 다형성 유전자자리(예: SNP)에 동시에 하이브리드화하는 프라이머의 라이브러리와 접촉시켜 반응 혼합물을 생산하는 단계; 및 반응 혼합물을 프라이머 연장 반응 조건에 적용시켜 고 배출 서열분석기로 측정된 증폭된 생성물을 생산하여 서열분석 데이터를 생산하는 단계를 포함한다.
일부 구현예에서, 모친의 일배체형은 모친의 친척의 데이터를 사용하여 본원에 기술된 방법 중 어느 것으로도 측정된다. 일부 구현예에서, 부친의 일배체형은 본원에 기술된 방법 중 어느 것에 의해 부친의 친척의 데이터를 사용하여 측정된다. 일부 구현예에서, 일배체형은 부친과 모친 둘 모두에 대해 측정된다. 일부 구현예에서, SNP 배열은 모친(또는 부친) 및 모친(또는 부친)의 친척의 DNA 시료 속에서 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 다형성 유전자자리의 존재를 측정한다. 일부 구현예에서, 당해 방법은 모친(또는 부친) 및/또는 모친(또는 부친)의 친척의 DNA 시료를 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 다형성 유전자자리(예: SNP)에 동시에 하이브리드화하는 프라이머의 라이브러리와 접촉시켜 반응 혼합물을 생산하는 단계; 및 반응 혼합물을 프라이머 연장 반응 조건에 적용시켜 서열분석 데이터를 생산하기 위한 고 배출 서열분석기로 측정되는 증폭된 생성물을 생산하는 단계를 포함한다. 부모 일배체형은 SNP 배열 또는 서열분석 데이터를 기반으로 측정할 수 있다. 일부 구현예에서, 부모 데이터는 당해 서류의 어딘가에 기술되거나 참조된 방법으로 단계화할 수 있다.
당해 부모 일배체형을 사용하여, 태자녀 모계 일배체형을 유전받았는지를 측정할 수 있다. 일부 구현예에서, 태아의 모친의 모계 DNA 및 태아의 태아 DNA를 포함하는 핵산 시료를 SNP 배열로 분석하여 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 다형성 유전자자리를 검출한다. 일부 구현예에서, 태아의 모친의 모계 DNA 및 태아의 태아 DNA를 포함하는 핵산 시료는 시료를 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 다형성 유전자자리(예: SNP)에 동시에 하이브리드화하는 프라이머의 라이브러리와 접촉시켜 반응 혼합물을 생산함으로써 분석한다. 일부 구현예에서, 반응 혼합물은 프라이머 연장 반응 조건에 적용시켜 증폭된 생성물을 생산한다. 일부 구현예에서, 증폭된 생성물은 고 배출 서열분석기를 사용하여 측정함으로써 서열분석 데이터를 생산한다. 다양한 구현예에서, SNP 배열 또는 서열분석 데이터를 사용하여 염색체내 상이한 위치에서 염색체 교차 확률에 대한 데이터를 사용함으로써(예를 들면, HapMap 데이터베이스에서 발견될 수 있는 바와 같은 재조합 데이터를 사용함으로써 어떠한 간격에 대해 재조합 위험 점수를 생성함으로써) 부모 일배체형을 측정하여 염색체 상의 다형성 대립유전자 사이의 의존성을 모델화할 수 있다. 일부 구현예에서, 다형성 유전자자리에서 대립유전자 수는 서열분석 데이터를 기반으로 하는 컴퓨터 상에서 계산한다. 일부 구현예에서, 각각 염색체의 상이한 가능한 배수성 상태에 관한 다수의 배수성 가설을 컴퓨터에서 생성하며; 염색체 상의 다형성 유전자자리에서 예측된 대립유전자 수에 대한 모델(예: 결합 분포 모델)을 각각의 배수성 가설에 대해 컴퓨터 상에서 구축하고; 각각의 배수성 가설의 상대적인 가능성을 결합 분포 모델 및 대립유전자 수를 사용하여 컴퓨터 상에서 측정하며; 태아의 배수성 상태를 최대 확률로 당해 가설에 상응하는 배수성 상태를 선택함으로써 요청한다. 일부 구현예에서, 대립유전자 수에 대한 결합 분포 모델의 구축 및 각각의 가설의 상대적인 확률의 측정은 참조 염색체의 사용을 필요로 하지 않는 방법을 사용하여 수행한다.
일부 구현예에서, 태아 일배체형은 염색체 13, 18, 21, X, 및 Y로 이루어진 그룹 중에서 취한 하나 이상의 염색체에 대해 측정된다. 일부 구현예에서, 태아 일배체형은 모든 태아 염색체에 대해 측정된다. 다양한 구현예에서, 당해 방법은 필수적으로 태아의 전체 게놈을 측정한다. 일부 구현예에서, 일배체형은 태아의 게놈의 적어도 30, 40, 50, 60, 70, 80, 90, 또는 95%에 대해 측정된다. 일부 구현예에서, 태아의 일배체형 측정은, 어느 대립유전자가 적어도 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; 또는 100,000개의 상이한 다형성 유전자자리에 대해 존재하는지에 대한 정보를 포함한다.
DNA 의 조성
태아 및 모계 혈액의 혼합물에서 측정된 서열분석 데이터에서 정보학 분석을 수행하여 태아, 예를 들면, 태아의 배수성에 관한 게놈 정보를 측정하는 경우, 대립유전자의 세트에서 대립유전자 분포를 측정하는 것이 유리할 수 있다. 불행하게도, 모계 혈액 시료의 혈장에서 발견된 DNA 혼합물로부터 태아의 배수성 상태를 측정하기 위해 접근법하는 경우와 같은, 많은 경우에서, 이용가능한 DNA의 양은 혼합물 속에서 우수한 충실도로 대립유전자 분포를 직접 측정하기에 충분하지 않다. 이들 경우에, DNA 혼합물의 증폭은, 바람직한 대립유전자 분포가 우수한 충실도로 측정될 수 있는 DNA 분자의 충분한 수를 제공할 것이다. 그러나, 서열분석을 위한 DNA의 증폭에 전형적으로 사용된 현재의 증폭 방법이 흔히 매우 편향적이이며, 이들이 동일한 양에 의해 다형성 유전자자리에서 대립유전자 둘 모두를 증폭시키지 않음을 의미한다. 편향된 증폭은 원래의 혼합물 속에서 대립유전자 분포로 인하여 매우 상이한 대립유전자 분포를 초래할 수 있다. 대부분의 목적을 위해, 다형성 유전자자리에 존재하는 대립유전자의 상대적인 양의 고도로 정밀한 측정이 요구되지 않는다. 대조적으로, 본원의 구현예에서, 다형성 대립유전자를 구체적으로 농축시키고 대립유전자 비를 보존하는 증폭 또는 농축 방법이 유리할 수 있다.
대립유전자 편향을 최소화시키는 방식으로 다수의 유전자자리에서 DNA의 시료를 우선적으로 농축시키는데 사용될 수 있는 다수의 방법이 기술되어 있다. 일부 예는 다수의 유전자자리를 표적화하기 위한 순환 프로브를 사용하며, 여기서 예비-순환된 프로브의 3' 말단 및 5' 말단은 표적화된 대립유전자의 다형성 부위에서 떨어져 있는 1개 또는 소수의 위치에 있는 염기에 하이브리드화하도록 설계된다. 다른 것은 PCR 프로브를 사용하는 것이며, 여기서 3' 말단 PCR 프로브는 표적화된 대립유전자의 다형성 부위에서 떨어져 있는 1개 또는 소수의 위치에 있는 염기에 하이브리드화하도록 설계된다. 다른 것은 분열(split) 및 혼주물 접근법을 사용하여 DNA의 혼합물을 생성하는 것이며, 여기서 우선적으로 농축된 유전자자리는 직접적인 다중화의 단점없이 낮은 대립유전자 편향으로 농축된다. 다른 것은 하이브리드 포획 접근법을 사용하는 것이며, 여기서 포획 프로브는, 표적의 다형성 부위를 플랭킹하는 DNA에 하이브리드화하도록 설계된 포획 프로브의 영역이 다형성 부위에서 1개 또는 소수의 염기에 의해 분리되도록 설계된다.
다형성 유전자자리의 세트에서 측정된 대립유전자 분포를 사용하여 개체의 배수성 상태를 측정하는 경우에, 이는 유전 측정에 대해 제조되므로 DNA의 시료 속에서 대립유전자의 상대적인 양을 보존하는 것이 바람직하다. 이러한 제조는 WGA 증폭, 표적화된 증폭, 선택적인 농축 기술, 하이브리드 포획 기술, 순환 프로브 또는 특정의 대립유전자에 상응하는 DNA의 분자의 존재를 선택적으로 향상시키고/시키거나 DNA의 양을 증폭시킴을 의미하는 다른 방법을 포함할 수 있다.
본원의 일부 구현예에서, 당해 유전자자리가 최대의 작은 대립유전자 빈도를 갖는 유전자자리를 표적으로 삼도록 설계된 DNA 프로브의 세트가 있다. 본원의 일부 구현예에서, 유전자자리가 당해 유전자자리에서 고도로 유용한 정보를 주는 SNP를 갖는 태아의 최대 확률을 갖는 자리를 표적으로 삼도록 설계된 프로브의 세트가 있다. 본원의 일부 구현예에서, 당해 프로브가 소정의 집단 소그룹에 대해 최적화된 유전자자리를 표적으로 삼도록 설계된 프로브의 세트가 있다. 본원의 일부 구현예에서, 당해 프로브가 집단 소그룹의 특정한 혼합에 대해 최적화된 유전자자리를 표적으로 삼도록 설계된 프로브의 세트가 있다. 본원의 일부 구현예에서, 당해 프로브는 상이한 작은 대립유전자 빈도 프로파일을 갖는 상이한 집단 소그룹에서 기원하는 부모의 특정 쌍에 대해 최적화된 유전자자리를 표적으로 삼도록 설계된 프로브의 세트가 있다. 본원의 일부 구현예에서, 태아 기원의 DNA의 조각에 어닐링된 적어도 하나의 염기 쌍을 포함하는 DNA의 순환된 쇄가 있다. 본원의 일부 구현예에서, 태반 기원의 DNA의 조각에 어닐링된 적어도 하나의 염기 쌍을 포함하는 DNA의 순환된 쇄가 있다. 본원의 일부 구현예에서, 뉴클레오타이드의 적어도 일부는 태아 기원의 DNA에 어닐링된 한편 순환된 DNA의 순환된 쇄가 있다. 본원의 일부 구현예에서, 뉴클레오타이드의 적어도 일부는 태반 기원의 DNA에 어닐링된 한편 순환된 DNA의 순환된 쇄가 있다. 본원의 일부 구현예에서, 프로브 중의 일부는 단일의 연쇄 반복을 표적으로 삼고, 프로브 중 일부는 단일 뉴클레오타이드 다형성을 표적으로 삼는 프로브의 세트가 있다. 일부 구현예에서, 당해 유전자자리는 비-침입성 태아기 진단의 목적으로 선택된다. 일부 구현예에서, 프로브는 비-침입성 태아기 진단의 목적으로 사용된다. 일부 구현예에서, 유전자자리는 순환 프로브, MIP, 하이브리드화 프로브에 의한 포획, SNP 배열 상의 프로브, 또는 이의 조합을 포함할 수 있는 방법을 사용하여 표적이 된다. 일부 구현예에서, 프로브는 순환 프로브, MIP, 하이브리드화 프로브에 의한 포획, SNP 배열 상의 프로브, 또는 이의 조합으로서 사용된다. 일부 구현예에서, 유전자자리는 비-침입성 태아기 진단의 목적으로 서열분석된다.
상대적인 부모 관계와 합할 때 서열의 상대적인 유익성이 보다 큰 경우, 이는, 부모 관계가 공지된 SNP를 함유하는 다수의 서열 판독물을 극대화하는 것은 혼합된 시료에서 서열분석 판독물의 세트의 유익성을 극대화할 수 있다. 일 구현예에서, 모계 정보가 공지된 SNP를 함유하는 다수의 서열 판독물은 qPCR을 사용하여 향상시킴으로써 특이적인 서열을 우선적으로 증폭시킬 수 있다. 일 구현예에서, 모계 정보가 공지된 SNP를 함유하는 다수의 서열 판독물은 순환 프로브(예를 들면, MIP)를 사용함으로써 향상시켜 특이적인 서열을 우선적으로 증폭시킬 수 있다. 일 구현예에서, 부모의 정보가 공지된 SNP를 함유하는 다수의 서열 판독물은 하이브리드화 방법(예를 들면, SURESELET)에 의한 포획을 사용함으로써 향상시켜 특이적인 서열을 우선적으로 증폭시킬 수 있다. 상이한 방법을 사용하여 모계 정보가 공지된 SNP를 함유하는 다수의 서열 판독물을 향상시킬 수 있다. 일 구현예에서, 표적화하는 연장 연결, 연장이 없는 연결, 하이브리드화에 의한 포획, 또는 PCR에 의해 달성될 수 있다.
단편화된 게놈 DNA의 시료에서, DNA 서열의 분획은 개체 염색체에 유일하게 맵핑되며; 다른 DNA 서열은 상이한 염색체에서 발견될 수 있다. 혈장에서 발견된 DNA는, 기원이 모계 또는 태아인 것이 전형적으로 단편화되는 것에 상관없이, 흔히 길이가 500bp 이하이다. 대표적인 게놈성 시료에서, 대략 맵핑가능한 서열의 3.3%가 염색체 13에 맵핑될 것이며; 맵핑가능한 서열의 2.2%가 염색체 18에 맵핑될 것이고; 대략 1.35%의 맵핑가능한 서열이 염색체 21에 맵핑될 것이며; 맵핑가능한 서열의 4.5%가 여성의 염색체 X에 맵핑될 것이고; 대략 맵핑가능한 서열의 2.25%가 염색체 X에 맵핑될 것이며(남성에서); 맵핑가능한 서열의 0.73%가 염색체 Y(남성에서)에 맵핑될 것이다. 이들은 태아에서 이수성일 가능성이 가장 큰 염색체이다. 또한, 짧은 서열 중에서, 20개 서열 중 대략 1개는 dbSNP에 함유된 SNP를 사용하여, SNP를 함유할 것이다. 당해 집단은, 발견되지 않은 많은 SNP가 존재할 수 있는 것을 경우에도 보다 더 높을 수 있다.
본원의 일 구현예에서, 표적화 방법을 사용하여 소정의 염색체에 맵핑되는 DNA의 시료 속의 DNA의 분획을 향상시킴으로서 분획이 게놈 시료에 대해 전형적인 위에서 나열한 퍼센트를 유의적으로 초과하도록 할 수 있다. 본원의 구현예에서, 표적화 방법을 사용하여 DNA의 시료 속의 DNA의 분획을 향상시켜 SNP를 함유하는 서열의 퍼센트가 게놈 시료에 대해 전형적으로 발견될 수 있는 것보다 유의적으로 크도록 할 수 있다. 본원의 일 구현예에서, 표적화 방법을 사용하여 태아기 진단의 목적을 위해 모계 및 태아 DNA의 혼합물에 있어서 SNP들의 세트의 또는 염색체의 DNA를 표적화하는 데 사용될 수 있다.
의심되는 염색체에 맵핑하는 판독물의 수를 계수하고 이를 참조 염색체에 맵핑되는 판독물의 수와 비교함으로써 태아 이수성을 측정하고, 의심되는 염색체 상의 판독물의 과잉이 이러한 염색체에서 태아내 삼염색체성에 상응한다는 가정을 사용하는 방법이 보고되어 있음에 주목한다(미국 특허 제7,888,017호). 태아기 진단을 위한 이들 방법은 어느 종류의 표적화를 사용하지 않을 뿐 아니라, 이들이 태아기 진단을 위한 표적화의 사용을 기술하지 않을 수 있다.
혼합된 시료를 서열분석하는데 있어서 표적화 접근법을 사용함으로써, 보다 적은 서열 판독물로 특정 수준의 정밀도를 달성하는 것이 가능할 수 있다. 이러한 정밀도는 민감성을 말할 수 있거나, 이는 특이성을 말할 수 있거나, 이는 이의 일부 조합을 말할 수 있다. 정밀도의 바람직한 수준은 90% 내지 95%일 수 있으며; 이는 95% 내지 98%일 수 있고; 이는 98% 내지 99%일 수 있으며; 이는 99% 내지 99.5%일 수 있으며; 이는 99.5% 내지 99.9%일 수 있으며; 이는 99.9% 내지 99.99%일 수 있으며; 이는 99.99% 내지 99.999%일 수 있으며; 이는 99.999% 내지 100%일 수 있다. 95%를 초과하는 정밀도의 수준은 고 정밀도로서 언급될 수 있다.
모계 및 태아 DNA의 혼합된 시료로부터 태아의 배수성 상태를 측정할 수 있는 방법을 입증하는 선행 기술에서 발표된 방법이 다수 존재한다[예: G.J. W. Liao 등 Clinical Chemistry 2011; 57(1) pp. 92-101]. 이들 방법은 각각의 염색체를 따라 수천개의 위치에 집중한다. DNA의 혼합된 시료로부터, 특정 다수의 서열 판독물에 대해, 태아에서 고 정밀도의 배수성 측정을 여전히 초래하면서 표적화될 수 있는 염색체를 따른 위치의 수는 예상치못하게 낮다. 본원의 구현예에서, 정밀한 배수성 측정은 표적화된 서열분석을 사용하거나, 표적화의 어떠한 방법, 예를 들면, qPCR, 리간드 매개된 PCR, 다른 PCR 방법, 하이브리드화에 의한 포획, 또는 순환 프로브를 사용하여 이룰 수 있으며, 여기서 표적화될 필요가 있는 염색체에 따른 유전자자리의 수는 5,000 내지 2,000개의 유전자자리일 수 있고; 이는 2,000 내지 1,000개의 유전자자리일 수 있고; 이는 1,000 내지 500개의 유전자자리일 수 있고; 이는 500 내지 300개의 유전자자리일 수 있고; 이는 300 내지 200개의 유전자자리일 수 있고; 이는 200 내지 150개의 유전자자리일 수 있고; 이는 150 내지 100개의 유전자자리일 수 있고; 이는 100 내지 50개의 유전자자리일 수 있고; 이는 50 내지 20개의 유전자자리일 수 있고; 이는 20 내지 10개의 유전자자리일 수 있다. 임의로, 이는 100 내지 500개의 유전자자리일 수 있다. 높은 수준의 정밀도는 소수의 유전자자리를 표적화하고 예상치못한 소수의 서열 판독물을 실행시킴으로써 달성할 수 있다. 판독물의 수는 1억 내지 5,000만 개의 판독물일 수 있고; 판독물의 수는 5,000만 내지 2,000만 개의 판독물일 수 있으며; 판독물의 수는 2,000만 내지 1,000만 개의 판독물일 수 있고; 판독물의 수는 1,000만 내지 500만 개의 판독물일 수 있으며; 판독물의 수는 500만 내지 200백만 개의 판독물일 수 있으며; 판독물의 수는 200만 내지 100만 개의 판독물일 수 있고; 판독물의 수는 100만 내지 50만 개의 판독물일 수 있고; 판독물의 수는 50만 내지 20만 개일 수 있고; 판독물의 수는 20만 내지 10만 개일 수 있으며; 판독물의 수는 10만 내지 5만 개만일 수 있으며; 판독물의 수는 5만 내지 2만 개일 수 있으며; 판독물의 수는 2만 내지 1만 개일 수 있으며; 판독물의 수는 1만 개 이하일 수 있다. 보다 적은 수의 판독물이 보다 많은 양의 투입 DNA에 필수적이다.
일부 구현예에서, 태아 기원의 DNA, 및 모체 기원의 DNA의 혼합물을 포함하는 조성물이 존재하며, 여기서, 염색체 13에 유일하게 맵핑되는 서열의 퍼센트는 4% 이상, 5% 이상, 6% 이상, 7% 이상, 8% 이상, 9% 이상, 10% 이상, 12% 이상, 15% 이상, 20% 이상, 25% 이상, 또는 30% 이상이다. 본원의 일부 구현예에서, 태아 기원의 DNA, 및 모체 기원의 DNA의 혼합물을 포함하는 조성물이 존재하며, 여기서 염색체 18에 유일하게 맵핑되는 서열의 퍼센트는 3% 이상, 4% 이상, 5% 이상, 6% 이상, 7% 이상, 8% 이상, 9% 이상, 10% 이상, 12% 이상, 15% 이상, 20% 이상, 25% 이상, 또는 30% 이상이다. 본원의 일부 구현예에서, 태아 기원의 DNA, 및 모체 기원의 DNA의 혼합물을 포함하는 조성물이 존재하며, 여기서 염색체 21에 유일하게 맵핑되는 서열의 퍼센트는 2% 이상, 3% 이상, 4% 이상, 5% 이상, 6% 이상, 7% 이상, 8% 이상, 9% 이상, 10% 이상, 12% 이상, 15% 이상, 20% 이상, 25% 이상, 또는 30% 이상이다. 본원의 일부 구현예에서, 태아 기원의 DNA, 및 모체 기원의 DNA의 혼합물을 포함하는 조성물이 존재하며, 여기서 염색체 X에 유일하게 맵핑되는 서열의 퍼센트는 6% 이상, 7% 이상, 8% 이상, 9% 이상, 10% 이상, 12% 이상, 15% 이상, 20% 이상, 25% 이상, 또는 30% 이상이다. 본원의 일부 구현예에서, 태아 기원의 DNA, 및 모체 기원의 DNA의 혼합물을 포함하는 조성물이 존재하며, 여기서 염색체 Y에 유일하게 맵핑되는 서열의 퍼센트는 1% 이상, 2% 이상, 3% 이상, 4% 이상, 5% 이상, 6% 이상, 7% 이상, 8% 이상, 9% 이상, 10% 이상, 12% 이상, 15% 이상, 20% 이상, 25% 이상, 또는 30% 이상이다.
일부 구현예에서, 태아 기원의 DNA, 및 모체 기원의 DNA의 혼합물을 포함하는 조성물이 기술되어 있으며, 여기서 염색체에 유일하게 맵핑되고, 적어도 하나의 단일 뉴클레오타이드 다형성을 함유하는 서열의 퍼센트는 0.2% 이상, 0.3% 이상, 0.4% 이상, 0.5% 이상, 0.6% 이상, 0.7% 이상, 0.8% 이상, 0.9% 이상, 1% 이상, 1.2% 이상, 1.4% 이상, 1.6% 이상, 1.8% 이상, 2% 이상, 2.5% 이상, 3% 이상, 4% 이상, 5% 이상, 6% 이상, 7% 이상, 8% 이상, 9% 이상, 10% 이상, 12% 이상, 15% 이상, 또는 20% 이상이고, 여기서 염색체는 그룹 13, 18, 21, X, 또는 Y 중에서 취해진다. 본원의 일부 구현예에서, 태아 기원의 DNA, 및 모체 기원의 DNA의 혼합물을 포함하는 조성물이 존재하며, 여기서 염색체에 유일하게 맵핑되고 단일 뉴클레오타이드 다형성들의 세트 중 적어도 하나의 단일 뉴클레오타이드 다형성을 함유하는 서열의 퍼센트는 0.15% 이상, 0.2% 이상, 0.3% 이상, 0.4% 이상, 0.5% 이상, 0.6% 이상, 0.7% 이상, 0.8% 이상, 0.9% 이상, 1% 이상, 1.2% 이상, 1.4% 이상, 1.6% 이상, 1.8% 이상, 2% 이상, 2.5% 이상, 3% 이상, 4% 이상, 5% 이상, 6% 이상, 7% 이상, 8% 이상, 9% 이상, 10% 이상, 12% 이상, 15% 이상, 또는 20% 이상이고, 여기서 염색체는 염색체 13, 18, 21, X 및 Y의 세트로부터 취해지고, 여기서 단일 뉴클레오타이드 다형성의 세트내 단일 뉴클레오타이드 다형성의 수는 1 내지 10, 10 내지 20, 20 내지 50, 50 내지 100, 100 내지 200, 200 내지 500, 500 내지 1,000, 1,000 내지 2,000, 2,000 내지 5,000, 5,000 내지 10,000, 10,000 내지 20,000, 20,000 내지 50,000, 및 50,000 내지 100,000개이다.
이론적으로, 증폭시 각각의 주기는 존재하는 DNA의 양을 2배로 만들지만; 실제로 증폭의 정도는 2배보다 약간 낮다. 이론적으로, 표적화된 증폭을 포함하는 증폭은 DNA 혼합물의 편향이 자유로운 증폭을 생성할 것이나; 실제로, 상이한 대립유전자는 다른 대립유전자보다 상이한 정도로 증폭되는 경향이 있다. DNA가 증폭되면, 대립유전자 편향의 정도는 증폭 단계의 수와 함께 전형적으로 증가한다. 일부 구현예에서, 본원에 기술된 방법은 DNA를 낮은 수준의 대립유전자 편향으로 증폭시키는 단계를 포함한다. 대립유전자 바이어스 화합물이 각각의 추가의 주기와 화합되므로, 전체 편향의 n번째 루트(root)를 계산함으로써 주기당 대립유전자 편향을 측정할 수 있으며, 여기서 n은 농축 정도의 염기 2 로그이다. 일부 구현예에서, DNA의 제2 혼합물을 포함하는 조성물이 제공되며, 여기서 DNA의 제2 혼합물은 DNA의 제1 혼합물의 다수의 다형성 유전자자리에 우선적으로 농축되고, 여기서, 농축 정도는 적어도 10, 적어도 100, 적어도 1,000, 적어도 10,000, 적어도 100,000 또는 적어도 1,000,000이고, 여기서 각각의 유전자자리에서 DNA의 제2 혼합물 중 대립유전자 비는 DNA의 제1의 혼합물의 다수 다형성 유전자자리의 대립유전자 비와는 평균 1,000%, 500%, 200%, 100%, 50%, 20%, 10%, 5%, 2%, 1%, 0.5%, 0.2%, 0.1%, 0.05%, 0.02%, 또는 0.01% 미만인 비율만큼 상이하다. 일부 구현예에서, DNA의 제2의 혼합물을 포함하는 조성물이 존재하며, 여기서 DNA의 제2의 혼합물은 DNA의 제1의 혼합물의 다수의 다형성 유전자자리에 우선적으로 농축되어 있으며, 여기서 다수의 다형성 유전자자리에 대해 주기당 대립유전자 편향은 평균적으로 10%, 5%, 2%, 1%, 0.5%, 0.2%, 0.1%, 0.05%, 또는 0.02% 미만이다. 일부 구현예에서, 다수의 다형성 유전자자리는 적어도 10개의 유전자자리, 적어도 20개의 유전자자리, 적어도 50개의 유전자자리, 적어도 100개의 유전자자리, 적어도 200개의 유전자자리, 적어도 500개의 유전자자리, 적어도 1,000개의 유전자자리, 적어도 2,000개의 유전자자리, 적어도 5,000개의 유전자자리, 적어도 10,000개의 유전자자리, 적어도 20,000개의 유전자자리, 또는 적어도 50,000개의 유전자자리를 포함한다
일부 구현예
일부 구현예에서, 잉태된 태아에서 염색체의 측정된 배수성 상태를 기재하는 보고서를 생성하는 방법이 본원에 기재되어 있으며, 당해 방법은 태아 모친의 DNA 및 태아의 DNA를 함유하는 제1의 시료를 수득하는 단계; 태아의 부모 한명 또는 둘 모두의 유전형 데이터를 수득하는 단계; DNA를 분리하여 제조된 시료를 수득함으로써 제1 시료를 제조하는 단계; 제조된 시료 속에서 다수의 다형성 유전자자리에서 DNA를 측정하는 단계; 컴퓨터 상에서 제조된 시료에서 이루어진 DNA 측정에 의하여 다수의 다형성 유전자자리에서 대립유전자 수 또는 대립유전자 수 확률을 계산하는 단계; 컴퓨터 상에서, 염색체의 상이한 가능한 배수성 상태에 대해 염색체 상에서 다수의 다형성 유전자자리에서 예측된 대립유전자 수 확률에 관한 다수의 배수성 가설을 생성하는 단계; 컴퓨터 상에서, 태아의 부모 한 명 또는 둘 모두의 유전형 데이터를 사용하여 각각의 배수성 가설에 대한 염색체 상에서의 각각의 다형성 유전자자리의 대립유전자 수 확률에 대한 결합 분포 모델을 구축하는 단계; 컴퓨터 상에서 결합 분포 모델 및 제조된 시료에 대해 계산된 대립유전자 수 확률을 사용하여 배수성 가설 각각이 상대적인 확률을 측정하는 단계; 상기 가설에 상응하는 배수성 상태를 최대 확률로 선택함으로써 태아의 배수성 상태를 요청하는 단계; 및 측정된 배수성 상태를 기재한 보고서를 생성하는 단계를 포함한다.
일부 구현예에서, 당해 방법을 사용하여 다수의 각각의 모에서 다수의 잉태된 태아의 배수성 상태를 측정하며, 당해 방법은: 각각의 제조된 시료 속에서 태아 기원인 DNA의 퍼센트를 측정하는 단계를 추가로 포함하며; 여기서 제조된 시료 속에서 DNA를 측정하는 단계는 각각의 제조된 시료 속에서 DNA 분자의 수를 서열분석함으로써 수행되며, 여기서 DNA의 보다 많은 분자가 태아 DNA의 보다 큰 분획을 갖는 제조된 시료보다 태아 DNA의 보다 작은 분획을 갖도록 제조된 시료의 서열분석이 시행된다.
일부 구현예에서, 당해 방법을 사용하여 다수의 각각의 모에서 다수의 잉태된 태아의 배수성 상태를 측정하며, 여기서 제조된 시료 속에서 DNA를 측정하는 단계는 각각의 태아에 대해, DNA의 제조된 시료의 제1 분획을 서열분석하여 제1의 측정 세트를 수득함으로써 수행되며, 당해 방법은 제1 세트의 DNA 측정을 제공하여, 태아 각각에 대해 각각의 배수성 가설에 대한 제1의 상대적인 확률을 측정하는 단계(여기서 각각의 배수성 가설에 대한 제1의 상대적인 확률 측정은, 이수성 태아에 상응하는 배수성 가설이 유의적이지만 결정적인 확률은 아님을 나타낸다); 이들 태아로부터 제조된 시료의 제2 분획을 재서열분석하여 제2 세트의 측정을 수득하는 단계; 제2 세트의 측정 및 임의로 또한 제1 세트의 측정을 사용하여 태아에 대한 배수성 가설에 대한 제2의 상대적 확률을 측정하는 단계; 및 이의 제2 시료가 상기 가설에 상응하는 배수성 상태를, 제2의 상대적인 확률 결정에 의해 측정된 것으로서 최대 확률로 선택함으로써 재서열분석되는 태아의 배수성 상태를 요청하는 단계를 추가로 포함한다.
일부 구현예에서, 물질의 조성물이 기재되어 있고, 당해 물질의 조성물은 우선적으로 농축된 DNA의 시료를 포함하고, 여기서, 우선적으로 농축된 DNA의 시료는 DNA의 제1 시료의 다수의 다형성 유전자자리에 우선적으로 농축되며, 여기서 DNA의 제1의 시료는 모계 DNA 및 모계 혈장의 태아 DNA의 혼합물로 이루어지고, 여기서 농축의 정도는 적어도 2 인자이고, 여기서 제1 시료와 우선적으로 농축된 시료 사이의 대립유전자 편향은 평균적으로 2% 미만, 1% 미만, 0.5% 미만, 0.2% 미만, 0.1% 미만, 0.05% 미만, 0.02% 미만, 및 0.01% 미만으로 이루어진 그룹 중에서 선택된다. 일부 구현예에서, 이러한 우선적으로 농축된 DNA의 시료를 생성하기 위한 방법이 기재되어 있다.
일부 구현예에서, 태아 및 모계 게놈성 DNA를 포함하는 모계 조직 시료 속의 태아 이수성의 존재 또는 부재를 측정하는 방법이 기재되어 있으며, 당해 방법은 (a) 상기 모계 조직 시료로부터 태아 및 모계 게놈성 DNA의 혼합물을 수득하는 단계; (b) 다수의 다형성 대립유전자에서 태아 및 모계 DNA의 혼합물을 선택적으로 농축시키는 단계; (c) 단계 (a)의 태아 및 모계 게놈성 DNA의 혼합물로부터 선택적으로 농축된 단편을 분포시켜 단일 게놈성 DNA 분자 또는 단일 게놈성 DNA 분자의 증폭 생성물을 포함하는 반응 시료를 제공하는 단계; (d) 단계 (c)의 반응 시료 속에서 게놈성 DNA의 선택적으로 농축된 단편의 거대한 평행 DNA 서열분석을 수행하여 상기 선택적으로 농축된 단편의 서열을 측정하는 단계; (e) 단계 (d)에서 수득된 서열이 속하는 염색체를 확인하는 단계; (f) 단계 (d)의 데이터를 분석하여 i) 모계 및 태아 둘 모두에서 배수체인 것으로 추정되는 적어도 하나의 제1의 표적 염색체에 속하는 단계 (d)에서 측정한 게놈성 DNA의 단편의 수, 및 ii) 제2의 표적 염색체에 속하는 단계 (d)에서 측정한 게놈성 DNA의 단편의 수를 측정하는 단계(여기서, 상기 제2의 염색체는 태아에서 이수성인 것으로 추측된다); (g) 제2의 표적 염색체가 정배수성인 경우 단계 (f) i) 부분에서 측정된 수를 사용하여, 제2의 표적 염색체에 대한 단계 d)에서 측정한 게놈성 DNA의 단편의 수의 예측된 분포를 계산하는 단계; (h) 제2의 표적 염색체가 이수성인 경우, 단계 (f), 부분 i) 및 단계 (b)의 혼합물 속에서 발견된 태아 DNA의 평가된 분획을 사용하여, 제2의 표적 염색체에 대해 단계 (d)에서 측정한 게놈성 DNA의 단편의 수의 예측된 분포를 계산하는 단계; 및 (i) 최대 확률 또는 최대 귀납적 접근법을 사용하여 단계 (f) ii) 부분에서 측정된 게놈성 DNA의 단편의 수가 단계 (g)에서 계산된 분포 또는 단계 (h)에서 계산된 분포의 부분일 가능성이 더 있는지를 측정함으로써; 태아 이수성의 존재 또는 부재를 나타내는 단계를 포함한다.
예시적인 암 진단 방법
숙주내에서 살아있는 암의 DNA가 숙주의 혈액 속에서 발견될 수 있음이 입증되어 있음에 주목한다. 유전 진단이 모계 혈액에서 발견된 혼합된 DNA의 측정에 의하여 이루어질 수 있는 것과 동일한 방법으로, 유전적 진단을 숙주 혈액에서 발견된 혼합된 DNA의 측정에 의하여 동일하게 잘 이루어질 수 있다. 유전적 진단은 이수성 상태, 또는 유전자 돌연변이를 포함할 수 있다. 모계 혈액에서 이루어진 측정으로부터 태아의 배수성 상태 또는 유전적 상태의 측정시 판독하는 본원의 어떠한 청구항도 숙주 혈액에서의 측정으로부터 암의 배수성 상태 또는 유전 상태를 측정하는 데 있어 동일하게 잘 판독할 수 있다.
일부 구현예에서, 본원의 방법은 암의 배수성 상태를 측정하도록 하며, 당해 방법은 숙주의 유전 물질, 및 암의 유전 물질을 함유하는 혼합된 시료를 수득하는 단계; 혼합된 시료 속에서 DNA를 측정하는 단계; 혼합된 시료 속에서 암 기원의 DNA의 분획을 계산하는 단계; 및 혼합된 시료 및 계산된 분획에서 이루어진 측정을 사용하여 암의 배수성 상태를 측정하는 단계를 포함한다. 일부 구현예에서, 당해 방법은 암의 배수성 상태의 측정을 기반으로 암 치료요법을 측정하는 단계를 추가로 포함할 수 있다. 일부 구현예에서, 당해 방법은 암의 배수성 상태의 측정을 기반으로 암 치료제를 투여하는 단계를 추가로 포함할 수 있으며, 여기서 암 치료제는 약제, 생물학적 치료제, 및 항체 기반 치료요법 및 이의 조합을 포함하는 그룹 중에서 취한다.
예시적인 시행 방법
본원에 개시된 어떠한 구현예도 디지탈 전자 회로, 집적 회로, 특별하게 설계된 ASIC(애플리케이션-특이적인 집적 회로), 컴퓨터 하드웨어, 펌웨어(firmware), 소프트웨어, 또는 이의 조합으로 시행될 수 있다. 현재 개시된 양태의 장치는 프로그램화된 프로세서에 의해 실행하기 위한 기계-판독가능한 저장 장치 속에 명백하게 구현된 컴퓨터 프로그램 제품 속에서 시행될 수 있으며; 현재 개시된 구현예의 방법 단계는 지시의 프로그램을 실행하는 프로그램화된 프로세서가 입력 데이터 및 생성되는 출력에서 운용시킴으로써 현재 개시된 구현예의 기능을 수행함으로써 수행될 수 있다. 현재 개시된 구현예는 특수 또는 일반적인 목적일 수 있고, 데이터 및 지시 사항을 수령하고, 데이터 및 설명서를 저장 시스템, 적어도 하나의 입력 장치, 및 적어도 하나의 출력 장치에 전송할 수 있도록 커플링된, 적어도 하나의 프로그램화된 프로세서를 포함하는 프로그램화된 시스템에서 실행될 수 있고/있거나 해석되는 하나 이상의 컴퓨터 프로그램에서 유리하게 시행될 수 있다. 각각의 컴퓨터 프로그램은 경우에 따라 고도의 공정 또는 대상-기원한 프로그래밍 언어로 또는 어셈블리 또는 기계어로 시행될 수 있으며; 특정 경우에, 당해 언어는 편집형 언어 또는 해석형 언어일 수 있다. 컴퓨터 프로그램은 자립형 프로그램으로서, 또는 모듈, 부품, 서브루틴(subroutine), 또는 컴퓨터 환경에서 사용하기에 적합한 다른 유닛으로서 포함하는 어떠한 형태로 배치될 수 있다. 컴퓨터 프로그램은 하나의 부위에서 하나의 컴퓨터 또는 다수의 컴퓨터에서 실행되거나 해석되도록, 또는 다수의 부위를 통해 분산되어 통신 네트워크에 의해 상호연결되도록 배치될 수 있다.
본원에 사용된 것으로서, 컴퓨터 판독가능한 저장 매체는 물리적 또는 명확한 저장(신호와 대치되는 것으로서)를 말하며, 컴퓨터-판독가능한 설명서, 데이터 구조, 프로그램 모듈 또는 다른 데이터와 같은 정보의 명확한 저장을 위한 어떠한 방법 또는 기술로 시행된 휘발성 및 비-휘발성의, 제거가능한 및 제거가능하지 않은 매체를 포함하나, 이에 한정되지 않는다. 컴퓨터 판독가능한 저장 매체는 RAM, ROM, EPROM, EEPROM, 플래쉬 메모리 또는 다른 반도체 기억 장치 기술(고상 메모리 기술), CD-ROM, DVD, 또는 다른 광학 저장, 자기 카세트, 자기 테이프, 자기 디스크 저장 또는 다른 자기 저장 장치, 또는 바람직한 정보 또는 데이터 또는 설명서를 명확하게 저장하는데 사용될 수 있고 컴퓨터 또는 프로세서에 의해 접근가능한 어떠한 다른 물리적 또는 물질 매체를 포함하나, 이에 한정되지 않는다.
본원에 기술된 방법 중 어느 것도 컴퓨터 스크린, 또는 종이 출력과 같은 물리적 양식으로 데이터의 출력을 포함한다. 당해 서류의 어느 곳의 어떠한 구현예의 설명에서도, 기술된 방법이 주치의에 의해 작동될 수 있는 작동가능한 데이터의 출력과 결합될 수 있음은 이해될 수 있다. 또한, 기술된 방법은 임상 치료를 초래하는 임상 결정 또는 작동이 없는 임상 결정과 결합될 수 있다. 표적 개체에 관한 유전 데이터를 측정하기 위해 본 서류에 기술된 구현예 중의 일부는 IVF와 관련하여 전달하기 위한 하나 이상의 배아를 선택하기 위한 결정과 결합될 수 있거나, 임으로 추정된 모의 자궁으로 배아를 전달하는 과정과 결합될 수 있다. 표적 개체에 관한 유전 데이터를 측정하기 위해 본 서류에 기술된 구현예들 중 일부는 잠재적인 염색체 비정상성, 또는 이의 결여의 인식과, 의학적 전문의와 결합될 수 있으며, 임의로 태아기 진단과 관련하여 태아를 유산시키거나 유산시키지 않는 결정과 결합될 수 있다. 본원에 기술된 구현예 중의 일부는 작동가능한 데이터의 출력, 임상 치료를 초래하는 임상 결정의 실행, 또는 행동을 취하지 않는 임상 결정의 실행과 결합될 수 있다.
예시적인 진단 박스
일 구현예에서, 본 기재내용은 본 기내내용에 기술된 방법들 중 어느 것을 부분적으로 또는 완전히 수행할 수 있는 진단 박스를 포함한다. 일 구현예에서, 진단 박스는 주치의의 사무소, 병원 실험실, 또는 환자 보호 지점과 충분히 근접한 어떠한 적합한 위치에 위치할 수 있다. 당해 박스는 전체적으로 자동화된 양식으로 전체 방법을 수행할 수 있거나, 박스는 기술자에 의해 수동으로 완료될 하나 또는 다수의 단계를 필요로 할 수 있다. 일 구현예에서, 당해 박스는 모계 혈장에서 측정된 적어도 유전형 데이터에서 분석할 수 있다. 일 구현예에서, 박스는 진단 박스에서 측정된 유전형 데이터를 이후에 유전형 데이터를 분석하여 가능하게는 또한 보고서를 생성할 수 있는 외부 계산 시설에 송신하기 위한 수단과 연결될 수 있다. 진단 박스는 하나의 용기에서 다른 용기로 수성 또는 액체 시료를 전달할 수 있는 로보트 단위를 포함할 수 있다. 이는 고체 및 액체 둘 모두의 다수의 시약을 포함할 수 있다. 이는 고 배출 서열분석기를 포함할 수 있다. 이는 컴퓨터를 포함할 수 있다.
실험 단락
현재 개시된 구현예는 다음의 실시예에 기술되어 있으며, 이는 본원의 이해에 도움이 되도록 설정되며 이후 수반되는 특허청구범위에 정의된 것으로서 기재내용의 영역을 어떠한 방식으로 제한하는 것으로 고려되지 않아야 한다. 다음의 실시예는 기술된 구현예를 사용하는 방법의 설명 및 완전한 기재내용과 함께 당해 분야의 통상의 기술자에게 제공하기 위해 설정되어 있으며, 본원의 영역을 제한함을 의도하지 않으며 이들은, 하기 실험이 수행된 실험만 또는 모두임을 나타냄을 의도하지 않는다. 사용된 수(예를 들면, 양, 온도 등)와 관련하여 정밀성을 보증하기 위해 노력하였지만, 일부 실험 오차 및 편차가 고려될 수 있다. 달리 나타내지 않는 한, 부분은 용적부이고, 온도는 섭씨 온도이다. 기술된 방법에서 변화는, 실험을 나열함을 의미하는 근본적인 측면을 변화시키지 않고 이루어질 수 있음이 이해되어야 한다.
실험 1
당해 목적은 발표된 방법과 비교하여 비-침입성 태아 삼염색체성 진단의 정밀도를 증진시키는 태아 분획을 계산하기 위해 모계 유전형을 사용하는 베이시안 최대 확률 평가(Bayesian maximum likelihood estimation: MLE) 알고리즘을 나타내기 위한 것이었다.
모계 cfDNA에 대한 모의된 서열분석 데이터는 삼염색체-21 및 각각의 모계 세포주에서 수득된 시료채취 판독물로 생성시켰다. 정확한 이염색체성 및 삼염색체성 요청의 비율은 발표된 방법(참조: Chiu 등 BMJ 2011;342:c7401) 및 본 발명자들의 MLE-기반 알고리즘에 대한 다양한 태아 분획에서 500개의 모의(simulation) 실험에 의해 측정되었다. 본 발명자들은 IRB-증명된 프로토콜 하에 수집한 4명의 임신한 모친 및 부친으로부터 5백만 개의 셧건 판독물을 수득함으로써 당해 모의 시험을 입증하였다. 모계 유전형은 290K SNP 배열에서 수득하였다.(참조: 도 14)
모의 실험에서, MLE-기반 접근법은 9% 정도의 낮은 태아 분획에 대해 99.0%의 정밀도를 달성하였으며 전체 정밀도에 대해 잘 상응하는 신뢰도를 보고하였다. 본 발명자들은 4개의 실제 시료를 사용하여 이들 결과를 입증하였으며, 여기서 본 발명자들은 99%를 초과하는 계산된 확신으로 모든 정확한 요청을 수득하였다. 대조적으로, 츄(Chiu) 등에 대한 발표된 알고리즘의 본 발명자들의 시행은 99.0%의 정밀도를 달성하기 위해 18%의 태아 분획을 필요로 하였고, 9%의 태아 DNA에서 단지 87.8%의 정밀도를 달성하였다.
MLE-기반 접근법과 관련하여 부모계 유전형의 태아 분획 측정은 첫 번째 및 조기 2 번째 3개월 동안 예측된 태아 분획에서 발표된 알고리즘보다 더 높은 정밀도를 달성한다. 또한, 본원에 개시된 방법은 특히 배수성 검출이 보다 어려운 낮은 태아 분획에서, 결과의 신뢰도를 측정하는데 있어서 중대한 신뢰 기준(confidence metric)을 생성한다. 발표된 방법은 거짓 양성율을 미리 정하는 접근법인, 거대 세트의 이배체성 훈련 데이터를 기반으로 배수성을 요청하기 위한 거의 정밀하지 않은 한계 방법을 사용한다. 또한, 신뢰 기준 없이, 발표된 방법은, 요청을 이루기에 불충분한 태아 cfDNA가 존재하는 경우 거짓 음성 결과를 보고하는 위험에 있다. 일부 구현예에서, 신뢰 추정은 요청된 배수성 상태에 대해 계산된다.
실험 2
본 목적은 베이시안 최대 확률 평가(MLE) 알고리즘에서 모계 유전형 및 합맵 데이터(Hapmap data)를 사용함으로써 저 태아 분획으로 이루어진 시료 속에서 태아 삼염색체 18, 21, 및 X의 비-침입성 검출을 개선시키기 위한 것이었다.
4개의 정배수성 및 2개의 삼염색체성-양성 임신의 모계 시료 및 각각의 부계 시료를 태아 핵형이 알려져 있는 부모로부터 IRB-승인된 프로토콜 하에 수득하였다. 모계 cfDNA를 혈장에서 추출하고 대략 1,000만 개의 서열 판독물을 특이적인 SNP를 표적화하는 우선적인 농축 후 수득하였다. 부모 시료를 유사하게 서열분석하여 유전형을 수득하였다.
기술된 알고리즘은 모든 정배수성 시료의 염색체 18 및 21 및 이수성 시료의 정상의 염색체를 정확하게 요청하였다. 삼염색체성 18 및 21은, 남성 및 여성 태아에서 염색체 X 카피 수에서와 같이, 정정되었다. 당해 알고리즘에 의해 생산된 신뢰도는 모든 경우에서 98%를 초과하였다.
기술된 방법은 12% 미만의 태아 DNA를 포함한 시료를 포함한, 6개의 시료의 모든 시험한 염색체의 배수성을 보고하였으며, 이는 1번째 및 조기 2번째-3개월 시료의 대략 30%를 차지한다. 본 MLE 알고리즘과 발표된 방법 사이의 중요한 차이는, 이것이 부모계 유전형 및 합맵 데이터를 지렛대로 하여 정확도를 개선시키고 신뢰 기준을 생성한다는 것이다. 낮은 태아 분획에서, 모든 방법은 거의 정밀하지 않게 되므로; 충분한 태아 cfDNA없이 시료를 정확히 확인하여 신뢰가능한 요청을 이루는 것이 중요하다. 다른 것은 염색체 Y 특이적인 프로브를 사용하여 남아 태아의 태아 분획을 평가하였으나, 공존하는 부모계 유전형은 성 둘 모두에 대한 태아 분획의 평가를 가능하도록 한다. 표적화되지 않은 숏건 서열분석을 사용하는 발표된 방법의 다른 고유의 한계는, 배수성 요청의 정밀도가 GC 풍부성과 같은 인자에서의 차이로 인하여 염색체 중에서 변한다는 것이다. 본 표적화된 서열분석 접근법은 이러한 염색체-규모 변화에 크게 독립적이며 염색체 사이에서 보다 지속적인 수행능을 생성한다.
실험 3
본 목적은, 삼염색체성이 신규 정보학을 사용하여, 삼배체성 태아에서 고 신뢰도록 검출되는지를 측정하여 모계 혈장 속에서 자유로이 부유하는 태아 DNA의 SNP 유전자자리를 분석하는 것이었다.
20mL의 혈액을 비정상적인 초음파 후 임신한 부모에서 채혈하였다. 원심분리 후, 모계 DNA를 연막(DNEASY, 제조원: QIAGEN)으로부터 추출하고; 세포-유리된 DNA를 혈장(QIAAMP 제조원: QIAGEN)으로부터 추출하였다. 표적화된 서열분석을 DNA 시료 둘 모두에서 염색체 2, 21, 및 X에서 SNP 유전자자리에 적용하였다. 최대-확률 베이시안 평가는 모든 가능한 배수성 상태에서 가장 가능성있는 가설을 선택하였다. 당해 방법은 태아 DNA 분획, 배수성 상태 및 배수성 측정시 명백한 신뢰도를 측정하다. 참조 염색체의 배수성에 대해 추정을 이루어지지 않는다. 당해 진단은 당해 분야의 최근 상태인, 서열 판독물 수와는 독립적인 시험 통계학을 사용한다.
본 방법은 염색체 2 및 21의 삼염색체성을 정확하게 진단하였다. 자녀 분획은 11.9% [CI 11.7-12.1]에서 평가하였다. 태아는 효과적으로 1의 신뢰도(오차 확률 < 10-30)의 신뢰도로 염색체 2 및 21의 1명의 모친 및 2명의 부친 카피를 갖는 것으로 밝혀졌다. 이는 염색체 2 및 21 각각에서 92,600 및 258,100개의 판독물을 사용하여 달성하였다.
이는 메타상 핵형에 의해 입증되는 바와 같이, 태자녀 삼배수성인 경우 모계 혈액의 삼염색체성 염색체의 비-침입성 출생전 진단의 최초 입증이다. 비-침입성 진단의 현존하는 방법은 당해 시료에서 이수성을 검출하지 않을 수 있다. 현재의 방법은 이염색체성 참조 염색체와 관련하여 삼염색체성 염색체에서 과잉의 서열 판독물에 의존하지만; 삼염색체성 태아는 이염색체성 참조물질을 가지지 않는다. 또한, 현재의 방법은 태아 DNA의 분획 및 서열 판독물의 수를 사용하여 유사하게 고-신뢰도 배수성 측정을 달성하지 않을 수 있다. 이는 모든 24개 염색체에 대한 접근법을 확장시키는데 용이하다.
실험 4
다음 프로토콜을 표준 PCR(중첩이 사용되지 않았음을 의미)을 사용하는 정배수성 임신의 모체 혈장에서 분리된 DNA 및 또한 삼염색체성 21 세포주의 게놈성 DNA의 800-플렉스 증폭을 위해 사용하였다. 실험실 제조 및 증폭은 단일 튜브 평활 말단화에 이은 A-테일링를 포함하였다. 어댑터 연결을 AGILENT SURESELECT 키트에서 발견된 연결 키트를 사용하여 수행하였으며, PCR을 7 주기 동안 수행하였다. 이후에, 800개의 상이한 프라이머 쌍을 사용하여 15 주기의 STA(95℃에서 30초 동안; 72℃에서 1분 동안; 60℃에서 4분 동안; 65℃에서 1분 동안; 72℃에서 30초 동안)로 염색체 2, 21 및 X에서 SNP를 표적화하였다. 반응은 12.5nM 프라이머 농도로 실시하였다. 이후에, DNA를 ILLUMINA IIGAX 서열분석기로 서열분석하였다. 서열분석기는 190만 개의 판독물을 배출하였으며, 이중 92%가 게놈에 맵핑되었고; 게놈에 맵핑된 판독물 중에서, 99% 이상이 표적화된 프라이머에 의해 표적화된 영역 중 하나에 맵핑되었다. 당해 수는 혈장 DNA 및 게놈 DNA 둘다에 대해 필수적으로 동일하였다. 도 15는 염색체 21에서 공지된 삼염색체성을 사용하여 세포주로부터 취한 게놈 DNA에서 서열분석기에 의해 검출된 ~780개의 SNP에 대한 2개의 대립유전자의 비를 나타낸다. 대립유전자 비는 가시적으로 판독하기 용이하지 않으므로, 대립유전자 비는 용이한 가시화를 위해 본원에서 플롯팅되었음에 주목한다. 원은 이염색체성 염색체에서 SNP를 나타내는 반면, 별표는 삼염색체성 염색체에서 SNP를 나타낸다. 도 16은 도 X에서와 동일한 데이터의 다른 표시이며, 여기서 Y-축은 각각의 SNP에 대해 측정된 A 및 B의 상대적인 수이고, 여기서 X-축은 SNP의 수이며 여기서 SNP는 염색체에 의해 분리된다. 도 16에서, SNP 1 내지 312는 염색체 2에서 발견되며, SNP 313 내지 605는 삼염색체성인 염색체 21에서 발견되고, SNP 606 내지 800은 염색체 X에서 발견된다. 염색체 2 및 X의 데이터는 이염색체성 염색체를 나타내는데, 그 이유는 상대적인 서열 수가 3개의 집단에 놓여있기 때문이다: 그래프의 상단에서의 AA, 그래프의 하단에서의 BB, 및 그래프의 중간에서의 AB. 삼염색체성인 염색체 21의 데이터는 4개의 집단을 나타낸다: 그래프의 상단에서 AAA, 0.65 라인(2/3) 주변에서 AAB,.35 라인(1/3)에서 ABB, 및 그래프의 하단에서 BBB.
도 17a 내지 도 17d는 동일한 800-플렉스 프로토콜에 대한 데이터를 나타내지만 임신한 여성의 4개의 혈장 시료의 증폭된 DNA에서 측정된다. 이들 4개의 시료의 경우, 본 발명자는 7개 부류의 점을 찾는 것으로 예측한다: (1) 그래프의 상단을 따라 모계 및 태아 둘 모두가 AA인 유전자자리가 있고, (2) 그래프의 상단의 약간 아래에 모가 AA이고 태자녀 AB인 유전자자리가 있고, (3) 0.5 라인의 약간 상단에 모가 AB이고 태자녀 AA인 유전자자리가 있고, (4) 0.5 라인을 따라 모계 및 태아 둘 모두가 AB인 인 유전자자리가 있고, (5) 0.5 라인의 약간 아래쪽에 모가 AB이고 태자녀 BB인 유전자자리가 있고, (6) 그래프의 하단 약간 위쪽에 모가 BB이고 태자녀 AB인 유전자자리가 있고, (1) 그래프의 하단을 따라 모계 및 태아 둘 모두가 BB 인 유전자자리가 있다. 태아 분획이 작을 수록, 집단 (1)과 (2), 집단 (3), (4)와 (5), 및 집단 (6)과 (7) 사이에 분리가 일어나지 않는다. 분리는 태아 기원인 DNA의 분획의 1/2인 것으로 예측된다. 예를 들어, DNA가 20% 태아, 및 80% 모인 경우, 본 발명자들은 (1) 내지 (7)이 각각 1.0, 0.9, 0.6, 0.5, 0.4, 0.1 및 0.0에 집중될 것으로 예측한다; 예를 들면, 도 17d, POOL1_BC5_ref_rate를 참조한다. 대신 DNA가 8% 태자녀고, 92% 모인 경우, 본 발명자는, (1) 내지 (7)이 각각 1.00, 0.96, 0.54, 0.50, 0.46, 0.04 및 0.00에 집중될 것으로 예측한다; 예를 들면, 17b, POOL1_BC2_ref_rate를 참조한다. 태아 DNA가 검출되지 않는 경우, 본 발명자들은 (2), (3), (5), 또는 (6)를 찾기를 기대하지 않으며; 달리는 본 발명자는, 당해 분리가 0이므로, (1) 및 (2)가 (3), (4) 및 (5), 및 또한 (6) 및 (7)에서와 같이 서로 상단에 있는 것으로 말할 수 있다; 예를 들면, 도 17c, POOL1_BC7_ref_rate를 참조한다. 도 17a, POOL1_BC1_ref_rate에 대한 태아 분획은 약 25%인 것에 주목한다.
실험 5
DNA 증폭 및 측정의 대부분의 방법은 일부 대립유전자 편향을 생산할 것이며, 여기서 유전자자리에서 전형적으로 발견된 2개의 대립유전자는 DNA의 시료 속의 대립유전자의 실제량을 대표하지 않는 강도 또는 수로 검출된다. 예를 들면, 단일의 개체의 경우, 이종접합성 유전자자리에서 본 발명자는 1:1 비의 2개의 대립유전자를 찾는 것으로 고려하며, 이는 이종접합성 유전자자리에 대해 예측된 이론적 비이며, 본 발명자는 55:45, 또는 심지어 60:40을 찾을 수 있다. 또한, 서열분석과 관련하여, 판독물의 깊이가 낮은 경우, 단순한 확률적 노이즈는 유의적인 대립유전자 편향을 생성할 수 있었음에 주목한다. 일 구현예에서, 각각의 SNP의 거동를 모델화함으로써 지속적인 편향이 특정한 대립유전자에 대해 관찰되는 경우, 당해 편향을 이에 대해 정정할 수 있는 것이 가능하다. 도 18은 바이어스 정정 전 및 후에, 바이어스 변화에 의해 설명될 수 있는 데이터의 분획을 나타낸다. 도 18에서, 별은 800-플렉스 실험에 대한 드믄 서열 데이터에서 관찰된 대립유전자 편향을 나타내고; 원은 정정 후 대립유전자 편향을 나타낸다. 대립유전자 편향이 전적으로 없는 경우, 본 발명자는, 당해 데이터가 x=y 라인을 따라 속하는 것으로 예측할 수 있다. 150-플렉스 표적화된 증폭을 사용하여 DNA를 증폭시킴으로써 생산된 유사한 세트의 데이터는 바이어스 정정 후 1:1 라인에 매우 밀접하게 속하는 데이터를 생산하였다.
실험 6
어댑터 태그에 대해 특이적인 프라이머와 연결된 어댑터를 사용한 DNA의 공통의 증폭(여기서 프라이머 어닐링 및 연장 시간은 수분으로 제한된다)은 보다 짧은 DNA 쇄의 비율을 농축시키는 효과를 갖는다. 서열분석에 적합한 DNA 라이브러리를 생성하도록 설계된 대부분의 라이브러리 프로토콜은 이러한 단계를 함유하며, 실시예 프로토콜을 발표되어 있고 당해 분야의 기술자에게 잘 공지되어 있다. 본 발명의 일부 구현예에서, 공통의 태그를 지닌 어댑터를 혈장 DNA에 연결시키고, 어댑터 태그에 특이적인 프라이머를 사용하여 증폭시켰다. 일부 구현예에서, 공통의 태그는 서열분석에 사용된 바와 동일한 태그일 수 있거나, 이는 PCR 증폭을 위한 유일한 공통의 태그일 수 있거나, 이는 태그의 세트일 수 있다. 태아 DNA는 천연에서 전형적으로 짧으므로, 모계 DNA가 천연에서 둘 모두 짧고 길 수 있지만, 당해 방법은 혼합물 속의 태아 DNA의 비율을 농축시키는 효과를 갖는다. 세포자멸사 세포의 DNA인 것으로 고려되며, 태아 및 모계 DNA 둘 모두를 함유하는, 자유로이 부유하는 DNA는 짧으며-거의 200bp 이하이다. 정맥절개술 후 일반적인 현상인, 세포 분해에 의해 방출된 세포 DNA는 전형적으로 거의 전적으로 모의 것이며, 또한 매우 길어서-거의 500bp 초과이다. 따라서, 수분 이상 동안 주변에서 설정된 혈액 시료는 짧은(태아 + 모) 및 보다 긴(모) DNA의 혼합물을 함유할 것이다. 모계 혈장에서 비교적 짧은 연장 시간을 사용한 공통의 증폭에 이어 표적화된 증폭을 수행하는 것은 표적화된 증폭만을 사용하여 증폭된 혈장과 비교하는 경우 태아 DNA의 상대적인 비율을 증가시키는 경향이 있을 것이다. 이는, 투입이 혈장 DNA인 경우 측정된 태아 퍼센트(수직 축) 대 투입 DNA가 ILLUMINA GAIIx 라이브러리 제조 프로토콜을 사용하여 제조된 라이브러리를 갖는 혈장 DNA인 경우 측정된 태아 퍼센트를 나타내는 도 19에서 찾을 수 있다. 모든 점은 라인 아래에 속하며, 이는 라이브러리 제조 단계가 태아 기원인 DNA의 분획을 농축시킴을 나타낸다. 용혈을 나타내는 적색을 나타내므로 세포 분해로 인해 양이 증가된 모계 DNA 퍼센트일 수 있는 혈장의 2개의 시료는, 라이브러리 제조를 표적화된 증폭 전에 수행하는 경우 태아 분획의 특히 유의적인 농축을 나타낸다. 본원에 개시된 방법은, 용혈 또는 오염되는 DNA의 비교적 긴 쇄를 포함하는 세포가 분해되어 짧은 DNA와 긴 DNA의 혼합된 시료로 오염되는 일부 다른 상황이 발생하는 경우에 특히 유용하다. 전형적으로 비교적 짧은 어닐링 및 연장 시간은, 이들이 5 또는 10초 이하로 짧거나 5 또는 10분으로 길 수 있지만, 30초 내지 2분이다.
실험 7
다음 프로토콜을 정배수성 임신에서 분리된 DNA 및 또한 삼배수성 21 세포주의 게놈성 DNA의 직접적인 PCR 프로토콜, 및 또한 반-중첩 접근법을 사용한 1,200-플렉스 증폭에 사용하였다. 라이브러리 제조 및 증폭은 단일의 튜브 평활 말단화에 이은 A-테일링을 포함하였다. 어댑터 연결은 AGILENT SURESELECT 키트에서 발견된 연결 키트의 변형을 사용하여 수행하였으며, PCR은 7개 주기 동안 수행하였다. 표적화된 프라이머 혼주물에서, 염색체 21의 SNP에 대해 550개 검정, 및 염색체 1 및 X 각각의 SNP에 대해 325개 검정이 존재하였다. 프로토콜 둘 모두는 16 nM 프라이머 농도를 사용하는 15 주기의 STA(95℃에서 30초; 72℃에서 1분; 60℃에서 4분; 65℃에서 30초; 72℃에서 30초)를 포함하였다. 반-중첩 PCR 프로토콜은 29 nM의 내부 전방 태그 농도, 및 1 μM 또는 0.1 uM의 역방 태그 농도를 사용하는 15 주기의 STA(95℃에서 30초; 72℃에서 1분; 60℃에서 4분; 65℃에서 30초; 72℃에서 30초)의 제2의 증폭을 포함하였다. 이후에, DNA를 ILLUMINA IIGAX 서열분석기를 사용하여 서열분석하였다. 직접적인 PCR 프로토콜을 위해, 판독물의 73%를 게놈에 맵핑하고; 반-중첩 프로토콜의 경우, 서열 판독물의 97.2%가 게놈에 맵핑되었다. 따라서, 반-중첩 프로토콜은 대략 30%의 추가의 정보를 생성하며, 이는 아마도 프라이머 이량체를 유발하는 가능성이 가장 큰 프라이머의 제거에 대부분 기인한다.
판독물 가변성의 깊이는, 반-중첩 프로토콜을 사용하는 경우 직접적인 PCR 프로토콜을 사용하는 경우보다 더 큰 경향이 있으며(참조: 도 20), 여기서 다이아몬드 모양은 반-중첩 프로토콜을 사용하여 수행된 유전자자리에 대한 판독물의 깊이를 말하며, 사각형은 중첩없이 수행된 유전자자리에 대한 판독물의 깊이를 말하다. SNP는 다이아몬드의 경우 판독물의 깊이에 의해 배열되므로, 다이아몬드 모양은 모두 곡선에 속하나, 사각형은 느슨하게 관련된 것으로 여겨지며; SNP의 배열은 임의적이고, 이는 좌측에서 우측으로 이의 위치라기 보다는 판독물의 깊이를 나타내는 점의 높이이다.
일부 구현예에서, 본원에 기술된 방법은 판독물(DOR) 변수의 탁월한 깊이를 달성할 수 있다. 예를 들면, 1,200개 검정의 게놈 DNA의 1,200-플렉스의 직접적인 PCR 증폭을 사용하는 당해 실험의 하나의 버젼에서(도 21): 1186개 검정은 10보다 큰 DOR을 가졌고; 판독물의 평균 깊이는 400이었으며; 1063개 검정(88.6%)은 200 내지 800개의 판독물의 깊이를 가졌고, 각각의 대립유전자에 대한 판독물의 수가 의미있는 데이터를 수득하기에 충분히 높지만, 각각의 대립유전자에 대한 판독물의 수가 이들 판독물의 미미한 사용보다 충분히 높지 않은 경우 이상적인 윈도우는 특히 작다. 12개의 대립유전자만이 1035개 판독물에서 최대의 판독물의 보다 높은 깊이를 가졌다. DOR의 표준 편차는 290이었으며, 평균 DOR은 453이었고, DOR의 변동 계수는 64%이었으며, 950,000개의 총 판독물이 존재하였고, 판독물의 63.1%가 게놈에 맵핑되었다. 1,200-플렉스 반-내포된 프로토콜을 사용하는 다른 실험(도 22)에서, DOR이 더 높았다. DOR의 표준 편차는 583이었으며, 평균 DOR은 630이었고, DOR의 변동 계수는 93%이었으며, 870,000개의 총 판독물이 존재하였으며, 판독물의 96.3%가 게놈에 맵핑되었다. 이들 경우 둘 모두에서, SNP는 모에 대한 판독물의 깊이에 의해 배열되므로, 곡선은 판독물의 모계 깊이를 나타냄에 주목한다. 자녀와 부친 사이의 차이는 유의적이지 않으며; 이는 단지 본 설명의 목적을 위한 유의적인 경향이다.
실험 8
당해 실험에서, 반-내포된 1,200-플렉스 PCR 프로토콜을 사용하여 3개 세포 및 1개 세포의 DNA를 증폭시켰다. 당해 실험은 모계 혈액에서 분리된 태아 세포를 사용한 태아 이수성 시험과 관련되거나, 생검 난할구 또는 영양외배엽 시료를 사용한 착상 전 유전 진단을 위한 것이다. 조건 당 2명의 개체(46개의 XY 및 47개의 XX+21)의 1 및 3개의 세포의 3개 복제물이 존재하였다. 검정은 염색체 1, 21 및 X를 표적화하였다. 3개의 상이한 분해 방법을 사용하였다: ARCTURUS, MPERv2 및 알칼린 분해. 서열분석을 하나의 서열분석 레인에서 48개의 시료의 다중화를 수행하였다. 알고리즘을 3개의 염색체 각각, 및 복제물 각각에 대해 정확한 배수성 요청으로 회귀하였다.
실험 9
하나의 실험에서, 4개의 모계 혈장 시료를 제조하고 반-내포된 9,600-플렉스 프로토콜을 사용하여 증폭시켰다. 시료를 다음 방식으로 제조하였다: 40 mL 이하의 모계 혈액을 원심분리하여 연막 및 혈장을 분리하였다. 모계 시료 속의 게놈 DNA를 연막으로부터 제조하고 부계 DNA를 혈액 시료 또는 타액 시료로부터 제조하였다. 모계 혈장 속의 세포-유리된 DNA를 QIAGEN CIRCUL ATING 핵산 키트를 사용하여 분리하고 제조업자의 지시에 따라 45 μL의 TE 완충액 속에서 용출시켰다. 공통의 연결 어댑터를 35 μL의 정제된 혈장 DNA의 각각의 분자의 말단에 첨부하고 라이브러리를 어댑터 특이적인 프라이머를 사용하여 7 주기 동안 증폭시켰다. 라이브러리를 AGENCOURT AMPURE 비드를 사용하여 정제하고 50 μl의 물 속에서 용출시켰다.
3 μl의 DNA를 15 주기의 STA(초기 폴리머라제 활성화의 경우 95℃에서 10분, 이후에, 15주기의 95℃에서 30초; 72℃에서 10초; 65℃에서 1분; 60℃에서 8분; 65℃에서 3분 및 72℃에서 30초; 및 72℃에서 2분 동안 최종 연장)로 9600개 표적-특이적인 태그된 역방 프라이머의 14.5 nM 프라이머 및 하나의 라이브러리 어댑터 특이적인 전방 프라이머를 500 nM에서 사용하여 증폭시켰다.
반-내포된 PCR 프로토콜은 1000 nM의 역 태그 농도, 및 각각의 9600-특이적인 전방 프라이머에 대해 16.6 nM의 농도를 사용하는 15주기의 STA(초기 폴리머라제 활성화의 경우 95℃에서 10분, 이후에, 15 주기의 95℃에서 30초; 65℃에서 1분; 60℃에서 5분; 65℃에서 5분 및 72℃에서 30초; 및 72℃에서 2분 동안 최종 연장)에 대한 제1의 STA 생성물의 희석의 제2 증폭을 포함하였다.
이후에, STA 생성물의 분취량을 표준 PCR로 1 μM의 태그-특이적인 전방 및 바코드화된 역 프라이머를 사용한 10 주기 동안 표준 PCR로 증폭시켜 바코드화된 서열분석 라이브러리를 생성하였다. 각각의 라이브러리의 분취량을 상이한 바코드의 라이브러리와 혼합하고 회전 컬럼을 사용하여 정제하였다.
당해 방법으로, 9,600개의 프라이머를 단일-웰 반응기에서 사용하였으며; 프라이머를 염색체 1, 2, 13, 18, 21, X 및 Y에서 발견된 SNP를 표적화하도록 설계하였다. 이후에, 앰플리콘을 ILLUMINA GAIIX 서열분석기를 사용하여 서열분석하였다. 시료 당, 대략 390만 개의 판독물을 서열분석기로 생성하였으며, 370만 개의 판독물이 게놈에 맵핑되었고(94%), 이들 중, 290만 개의 판독물(74%)이 표적화된 SNP에 맵핑되었으며 판독물의 평균 깊이는 344이고 판독물의 중간 깊이는 255이었다. 4개의 시료에 대한 태아 분획은 9.9%, 18.9%, 16.3%, 및 21.2%인 것으로 밝혀졌다.
상대적인 모계 및 부계 게놈성 DNA 시료를 반-내포된 9600-플렉스 프로토콜을 사용하여 증폭시키고 서열분석하였다. 반-충접된 프로토콜은, 이것이 제1의 STA에서 7.3nM에서 9,600개의 외부 전방 프라이머 및 태그된 역방 프라이머에 적용된다는 점에서 상이하다. 열주기 조건 및 제2의 STA의 조성물, 및 바코드 PCR은 반-내포된 프로토콜과 동일하였다.
서열분석 데이터를 본원에 개시된 정보학 방법을 사용하여 분석하고 배수성 상태를 이의 DNA가 4개의 모계 혈장 시료 속에 존재하는 태아에 대한 6개 염색체에서 요청하였다. 당해 세트에서 모든 28개의 염색체에 대한 배수성 요청은, 정확하게 요청되었지만 신뢰도가 83%인 하나의 염색체를 제외하고는 99.2% 초과의 신뢰도로 정확하게 요청되었다.
도 23은, 100 이상, 200 이상 및 400 이상의 판독물의 깊이를 갖는 SNP의 수가 1,200-플렉스 프로토콜에서보다 유의적으로 더 높다고 해도, 실험 7에 기술된 1,200-플렛스 반-내포된 접근법의 판독물의 깊이와 함께 9,600-플렉스 반-내포된 접근법의 판독물의 깊이를 나타낸다. 90번째 백분위수(percentile)에서 판독물의 수는 10번째 백분위수에서의 판독물의 수로 나누어 판독물의 깊이의 균일성의 지표인 무치수 기준을 수득하였으며; 당해 수가 작을 수록, 판독물의 깊이는 보다 균일(협소)하다. 평균 90번째 백분위수/10번째 백분위수 비는 실험 9에서 수행된 방법의 경우 11.5이지만, 실험 7에서 수행된 방법의 경우 5.6이다. 보다 적은 서열 판독물은, 판독물의 특정의 퍼센트가 판독물 수 한계 초과임을 보증하는데 필수적이므로, 소정의 프로토콜 배수성에 대한 판독물의 깊이가 협소할수록 서열분석 효능에 대해 더 우수하다.
실험 10
하나의 실험에서, 4개의 모계 혈장 시료를 제조하고 반-내포된 9,600-플렉스 프로토콜을 사용하여 증폭시켰다. 실험 10의 세부사항은 중첩 프로토콜이고, 4개의 시료의 실체를 포함하는 것을 제외하고는, 실험 9와 매우 유사하였다. 당해 세트에서 모든 28개 염색체에 대한 배수성 요청은 99.7%를 초과하는 신뢰도록 정확하게 요청되었다. 760만 개(97%)의 판독물이 게놈에 맵핑되었으며, 630만 개(80%)의 판독물이 표적화된 SNP에 맵핑되었다. 판독물의 평균 깊이는 751이었고, 판독물의 중간 깊이는 396이었다.
실험 11
하나의 실험에서, 3개의 모계 혈장 시료를 4개의 동일한 부위로 나누고, 각각의 부위를 2,400개의 다중화된 프라이머(4개의 부위) 또는 1,200개의 다중화된 프라이머(1개 부위)를 사용하여 증폭시키고 총 10,800개의 프라이머에 대해 반-내포된 프로토콜을 사용하여 증폭시켰다. 증폭 후, 당해 부위들을 서열분석을 위해 함께 혼주시켰다. 실험 11의 세부사항은, 중첩 프로토콜이고, 분열 및 혼주 접근법인 것을 제외하고는 실험 9와 매우 유사하였다. 신뢰도가 83%이었던 경우의 하나의 잃은 요청을 제외하고는, 당해 세트에서 모든 21개 염색체에 대한 배수성 요청은 99.7% 초과의 신뢰도로 정확하게 요청되었다. 340만 개의 판독물은 표적화된 SNP에 맵핑되었고, 판독물의 평균 깊이는 404이었고 판독물의 중간 깊이는 258이었다.
실험 12
하나의 실험에서, 4개의 모계 혈장 시료를 4개의 동일한 부위로 나누고, 각각의 부위를 2,400개의 다중화된 프라이머를 사용하여 증폭시키고 총 9,600개의 프라이머에 대해 반-내포된 프로토콜을 사용하여 증폭시켰다. 증폭 후, 당해 부위들을 서열분석을 위해 함께 혼주시켰다. 실험 12의 세부사항은, 중첩 프로토콜이고, 분열 및 혼주 접근법인 것을 제외하고는 실험 9와 매우 유사하였다. 신뢰도가 78% 초과이었던 경우의 하나의 잃은 요청을 제외하고는, 당해 세트에서 모든 28개 염색체에 대한 배수성 요청은 97% 초과의 신뢰도로 정확하게 요청되었다. 450만 개의 판독물은 표적화된 SNP에 맵핑되었고, 판독물의 평균 깊이는 535이었고 판독물의 중간 깊이는 412이었다.
실험 13
하나의 실험에서, 4개의 모계 혈장 시료를 제조하고 총 9,600개의 프라이머에 대해 9,600-플렉스 삼중으로 반-내포된 프로토콜을 사용하여 증폭시켰다. 실험 12의 세부사항은, 3개 라운드의 중첩을 포함한 중첩 프로토콜이고; 3개의 라운드가 15, 10 및 15개의 STA 주기를 각각 포함한 것을 제외하고는 실험 9와 매우 유사하였다. 94.6%로 정확하게 요청된 하나, 및 신뢰도가 80.8%인 하나의 잃은 요청을 제외하고는, 당해 세트에서 28개 염색체 중 27개에 대한 배수성 요청은 99.9% 초과의 신뢰도로 정확하게 요청되었다. 350만 개의 판독물은 표적화된 SNP에 맵핑되었고, 판독물의 평균 깊이는 414이고 판독물의 중간 깊이는 249이었다.
실험 14
하나의 실험에서, 세포의 45 세트를 1,200-플렉스 반-내포된 프로토콜을 사용하여 증폭시키고, 배수성 측정을 3개의 염색체에서 수행하였다. 당해 실험은 3일째 배아의 단일-세포 생검, 또는 5일째 배아의 영양외배엽 생검에서 착상전 유전 진단을 수행하는 조건을 시뮬레이션한다는 것을 의미한다는 것을 주목한다. 15개의 개개 단일 세포 및 30개 세트의 3개의 세포를 총 45개 반응물을 위한 45개의 개개 반응 튜브 속에 두었으며, 여기서 각각의 반응물은 단지 하나의 세포주의 세포를 함유하였지만, 상이한 반응물은 상이한 세포주의 세포를 함유하였다. 세포를 5 μl의 세척 완충액으로 제조하고 5μl의 ARCTURUS PICOPURE 분해 완충액(제조원: APPLIED BIOSYSTEMS)을 가하여 분해하고 56℃에서 20분, 95℃에서 10분 동안 항온처리하였다.
단일/3개의 세포의 DNA를 50 nM 프라이머 농도의 1200개의 표적-특이적인 전방 및 태그된 역방 프라이머를 사용하여 25주기의 STA(초기 폴리머라제 활성화를 위해 95℃에서 10분, 이후에 25 주기의 95℃에서 30초; 72℃에서 10초; 65℃에서 1분; 60℃에서 8분; 65℃에서 3분 및 72℃에서 30초; 및 72℃에서 2분 동안 최종 연장)로 증폭시켰다.
반-내포된 PCR 프로토콜은 1000nM의 역방 태그 특이적인 프라이머 농도, 및 400개의 표적-특이적인 중첩된 전방 프라이머 각각에 대해 60 nM의 농도를 사용하여 20주기의 STA(초기 폴리머라제 활성화를 위해 95℃에서 10분, 이후에 15 주기의 95℃에서 30초; 65℃에서 1분; 60℃에서 5분; 65℃에서 5분 및 72℃에서 30초; 및 72℃에서 2분 동안 최종 연장)를 위한 제2의 STA 생성물의 희석물의 3개의 평행한 제2의 증폭을 포함하였다. 따라서, 3개의 평행한 400-플렉스 반응물에서 제1의 STA에서 증폭된 총 1200개의 표적이 증폭되었다.
이후에, STA 생성물의 분취량을 표준 PCR에 의해 1μM의 태그-특이적인 전방 및 바코드화된 역 프라이머를 사용하는 15주기 동안 증폭시켜 바코드화된 서열분석 라이브러리를 생성시켰다. 각각의 라이브러리의 분취량을 상이한 바코드의 라이브러리와 혼합하고 회전 컬럼을 사용하여 정제하였다.
이러한 방식으로, 1,200개의 프라이머를 단일 세포 반응에서 사용하고; 프라이머를 염색체 1, 21 및 X에서 발견된 SNP를 표적화하도록 설계하였다. 이후에, 앰플리콘을 ILLUMINA GAIIX 서열분석기를 사용하여 서열분석하였다. 시료 당, 대략 390만 개의 판독물을 서열분석기에 의해 게놈에 맵핑된 500,000 내지 800,000 백만 개(5천억개 내지 8천억개)의 판독물을 사용하여 생성시켰다(시료당 모든 판독물의 74% 내지 94%).
세포주의 관련된 모계 및 부계 게놈성 DNA를 보다 적은 주기 및 1200-플렉스 제2의 STA를 지닌 유사한 프로토콜로 동일한 반-내포된 1200-플렉스 검정 혼주물을 사용하여 분석하고, 서열분석하였다.
서열분석 데이터를 본원에 개시된 정보학 방법을 사용하여 분석하고 배수성 상태를 시료에 대한 3개의 염색체에서 요청하였다.
도 24는 3개의 염색체(1 = 염색체 1; 2 = 염색체 21; 3 = 염색체 X)에서 6개 시료에 대한 판독물 비의 표준화된 깊이(수직 축)를 나타낸다. 당해 비는 표준화하고, 3개의 46XY 세포를 포함하는 3개의 웰 각각에 걸쳐 평균낸 염색체에 맵핑된 판독물의 수로 나눈 염색체에 맵핑된 판독물의 수와 동일하게 설정되었다. 46XY 반응물에 상응하는 데이터 점의 3개 세트는 1:1의 비를 갖는 것으로 예측된다. 47XX+21 세포에 상응하는 데이터 점의 3개의 세트는 염색체 1의 경우 1:1, 염색체 21의 경우 1.5:1, 및 염색체 X의 경우 2:1의 비를 갖는 것으로 예측되다.
도 25는 3개의 반응물에 대해 3개의 염색체(1, 21, X)에 대해 플롯팅된 대립유전자 비를 나타낸다. 하부 좌측의 반응물은 3개의 46XY 세포에서 반응을 나타낸다. 좌측 영역은 염색체 1에 대한 대립유전자 비이고, 중간 영역은 염색체 21에 대한 대립유전자 비이며, 우측 영역은 염색체 X에 대한 대립유전자 비이다. 46XY 세포의 경우, 염색체 1에 대해 본 발명자는 AA, AB 및 BB SNP 유전형에 상응하는 1, 0.5 및 0의 비를 찾는 것을 예측하였다. 46XY 세포의 경우, 염색체 21에 대해 본 발명자는 AA, AB 및 BB SNP 유전형에 상응하는 1, 0.5 및 0의 비를 찾는 것을 예측하였다. 46XY 세포에 대해, 염색체 X의 경우 본 발명자는 A, 및 B SNP 유전형에 상응하는 1 및 0의 비를 찾는 것을 예측하였다. 하부 우측의 반응은 3개의 47XX+21 세포의 반응을 나타낸다. 대립유전자 비는 하부 좌측 그래프에서와 같이 염색체로 분리하였다. 47XX+21 세포의 경우, 염색체 1에 대해 본 발명자는 AA, AB 및 BB SNP 유전형에 상응하는 1, 0.5 및 0의 비를 찾는 것을 예측한다. 47XX+21 세포의 경우, 염색체 21에 대해 본 발명자는 AAA, AAB, ABB 및 BBB SNP 유전형에 상응하는 1, 0.67, 0.33 및 0의 비를 찾는 것을 예측한다. 47XX+21 세포의 경우, 염색체 X에 대해 본 발명자는 AA, AB, 및 BB SNP 유전형에 상응하는 1, 0.5 및 0의 비를 찾는 것을 예측한다. 상부 우측에서 플롯은 47XX+21 세포주의 1 ng의 게놈성 DNA를 포함하는 반응물에서 이루어졌다. 도 26은 도 25와 동일한 그래프를 나타내지만, 단지 하나의 세포에서 수행된 반응물에 대한 것이다. 좌측 그래프는 47XX+21 세포를 함유한 반응물이었고 우측 그래프는 46XX 세포를 함유한 반응물에 대한 것이었다.
도 25 도 26에 나타낸 그래프로부터, 본 발명자가 1 및 0의 비를 찾기를 예측한 경우의 염색체에 대해 점의 2개 집단; 본 발명자가 1, 0.5 및 0의 비를 찾기를 예측한 경우 염색체에 대한 점의 3개의 집단, 및 본 발명자가 1, 0.67, 0.33 및 0의 비를 찾기를 예측한 경우 염색체에 대한 점의 4개 집단이 존재함이 가시적으로 명백하다. 모계 지지 알고리즘은 45개의 반응물 중 모두에 대해 3개의 염색체 중 모두에서 정확한 요청을 이룰 수 있었다.
실험 15
하나의 실험에서, 모계 혈장 시료를 제조하고 반-내포된 19,488-플렉스 프로토콜을 사용하여 증폭시켰다. 시료를 다음 방식으로 제조하였다: 20 mL 이하의 모계 혈액을 원심분리하여 연막 및 혈장을 분리하였다. 모계 시료 속의 게놈성 DNA를 연막으로부터 제조하고 부계 DNA를 혈액 시료 또는 타액 시료로부터 제조하였다. 모계 혈장 속의 세포-유리된 DNA를 QIAGEN CIRCULATING NUCLEIC ACID kit를 사용하여 분리하고 50μl의 TE 완충액 속에서 제조업자의 지시에 따라 용출시켰다. 공통의 연결 어댑터를 40 μL의 정제된 혈장 DNA의 각각의 분자 말단에 첨부시키고 라이브러리를 9주기 동안 어댑터 특이적인 프라이머를 사용하여 증폭시켰다. 라이브러리를 AGENCOURT AMPURE 비드로 정제하고 50μl의 DNA 현탁 완충액 속에서 용출시켰다.
6μl의 DNA를 15주기의 STAR 1(초기 폴리머라제 활성화의 경우 95℃에서 10분 동안, 이후에 15 주기의 96℃에서 30초; 65℃에서 1분; 58℃에서 6분; 60℃에서 8분; 65℃에서 4분 및 72℃에서 30초; 및 72℃에서 2분 동안의 최종 연장)으로 7.5 nM 프라이머 농도의 19,488개의 표적-특이적인 태그된 역방 프라이머 및 500nM에서 하나의 라이브러리 어댑터 특이적인 전방 프라이머를 사용하여 증폭시켰다.
반-내포된 PCR 프로토콜은 1000nM의 역 태그 농도, 및 각각의 19,488개의 표적-특이적인 전방 프라이머에 대해 20nM의 농도를 사용하는 15 주기(STAR 2)(초기 폴리머라제 활성화의 경우 95℃에서 10분, 이후에 15주기의 95℃에서 30초; 65℃에서 1분; 60℃에서 5분; 65℃에서 5분 및 72℃에서 30초; 및 72℃에서 2분 동안의 최종 연장) 동안의 STAR 1 생성물의 희석물의 제2 증폭을 포함하였다
이후에, STAR 2 생성물의 분취량을 1μM의 태그-특이적인 전방 및 바코드화된 역방 프라이머를 사용한 12 주기 동안 표준 PCR로 증폭시켜 바코드화된 서열분석 라이브러리를 생성하였다. 각각의 라이브러리의 분취량을 상이한 바코드의 라이브러리와 혼합하고 회전 컬럼을 사용하여 정제하였다.
당해 방식으로, 19,488개의 프라이머를 단일-웰 반응에서 사용하였다; 프라이머를 염색체 1, 2, 13, 18, 21, X 및 Y에서 발견된 SNP를 표적화하도록 설계하였다. 이후에, 앰플리콘을 ILLUMINA GAIIX 서열분석기를 사용하여 서열분석하였다. 혈장 시료의 경우, 대략 1,000만 개의 판독물을 서열분석기에 의해 생성시키고, 940 내지 960만 개의 판독물을 게놈에 맵핑하고(94 내지 96%), 이들 중, 99.95%가 460의 판독물의 평균 깊이 및 350의 판독물의 중간 깊이로 표적화된 SNP에 맵핑하였다. 비교를 위해, 완전하게 균일한 분포는 다음과 같다: 10M 판독물 / 19,488개의 표적 = 513 판독물/표적. 프라이머-이량체의 경우, 30,000개의 판독물은 서열분석된 프라이머-이량체(서열분석기에 의해 생성된 판독물의 0.3%)에서 기원하였다. 게놈 시료의 경우, 판독물의 99.4 내지 99.7%가 게놈에 맵핑되었으며, 이들 중, 표적 SNP에 맵핑된 99.99%, 및 서열분석기에 의해 생성된 판독물의 0.1%가 프라이머-이량체이었다.
1,000만 개의 서열분석 판독물의 경우, 전형적으로 19,488개의 표적화된 SNP 중 적어도 19,350개(99.3 %)가 증폭되고 서열분석되었다. 2M 서열분석 판독물을 지닌 DNA 시료의 경우, 전형적으로 적어도 19,000개의 표적화된 SNP(97.5%)가 증폭되고 서열분석되었다. 판독물의 수는 보다 낮고 서열분석기는 증폭된 생성물중 일부를 잃으므로 보다 낮은 수는 시료 노이즈에 기인할 수 있다. 경우에 따라, 서열분석 판독물의 수를 증가시켜 증폭되고 서열분석되는 표적화된 SNP의 수를 증가시킬 수 있다.
관련된 모계 및 부계 게놈성 DNA 시료를 STAR 1에서 7.5 nM의 반-내포된 19,488개의 외부 전방 프라이머 및 태그된 역방 프라이머를 사용하여 증폭시켰다. STAR 2의 열주기 조건 및, 바코드화 PCR은 반-내포된 프로토콜의 경우와 동일하였다.
407개 시료에 대한 평균 태아 분획은 14.8%인 것으로 밝혀졌다. 서열분석 데이터를 본원에 개시된 정보학 방법을 사용하여 분석하고 배수성 상태를 이의 DNA가 407개의 모계 혈장 시료중 378개에 존재하고 407개의 모계 혈장 시료 중 375개의 염색체 X에 존재하는 태아에 대해 4개의 염색체(13, 18, 21, Y)에서 요청하였다. 당해 세트에서 모든 1,887개의 염색체에 대한 배수성 요청은 90% 초과의 신뢰도로 정확하게 요청되었다. 1887개의 요청 중 1882개는 95%를 초과하였고; 1887개의 요청 중 1,862개는 99% 초과의 신뢰도로 요청되었다.
유사한 대조군 실험을 혈장 PCR 프로토콜에서 혈장에서 추출한 DNA 대신 물을 사용하여 수행하였다. 실험의 이러한 접근법중 6개를 기반으로, 서열분석된 판독물의 5 내지 6%가 프라이머-이량체이었다. 다른 서열분석된 판독물은 배경 노이즈에 기인하였다. 당해 실험은, 심지어 하이브리드화시키기 위한(다른 프라이머에 하이브리드화하여 증폭된 프라이머 이량체를 형성시키기 보다는) 프라이머에 대한 표적 유전자자리를 지닌 핵산 시료의 존재하에서 조차 프라이머 이량체가 거의 형성되지 않음을 입증한다.
실험 16
다음의 실험은 본 발명의 다중화된 PCR 방법 중의 어느 것에서 사용될 수 있는 프라이머의 라이브러리를 설계하여 선택하는 예시적인 방법을 나열한다. 당해 목표는 단일 반응으로 다수의 표적 유전자자리(또는 표적 유전자자리의 소세트)를 동시에 증폭시키는데 사용될 수 있는 후보물 프라이머의 초기 라이브러리에서 프라이머를 선택하기 위한 것이다. 초기 세트의 후보물 표적 유전자자리에 대해, 프라이머는 각각의 표적 유전자자리에 대해 설계되거나 선택되어야할 필요가 없었다. 바람직하게는, 프라이머는 대부분의 바람직한 표적 유전자자리의 거대 부위에 대해 설계되고 선택된다.
단계 1
후보물 표적 유전자자리(예: SNP)의 세트를 표적 집단내 SNP의 빈도 또는 SNP의 이형접합성 비율과 같은, 표적 유전자자리에 대한 바람직한 매개변수에 대해 공공 이용가능한 정보를 기반으로 선택하였다(worldwide web at ncbi.nlm.nih.gov/projects/SNP/; Sherry ST, Ward MH, Kholodov M, 등 dbSNP: the NCBI database of genetic variation. Nucleic Acids Res. 2001 Jan 1;29(1):308-11, 이의 전문은 각각 참조로 포함된다). 각각의 후보물 유전자자리에 대해, 하나 이상의 PCR 프라이머 쌍을 Primer3 프로그램(primer3.sourceforge.net; libprimer3 release 2.2.3에서의 범세계 통신망, 이의 전문은 참조로 각각 포함된다). 특정한 표적 유전자자리에 대한 PCR 프라이머에 대해 실현가능한 설계가 존재하지 않는 경우, 표적 유전자자리를 추가 고려에서 배제하였다.
경우에 따라, "표적 유전자자리 점수"(보다 높은 점수는 보다 높은 바람직성을 나타낸다)는 표적 유전자자리에 대해 다양한 목적한 매개변수의 중량 평균을 기반으로 계산된 표적 유전자자리 점수와 같은, 표적 유전자자리 대부분 또는 모두에 대해 계산될 수 있다. 매개변수는, 프라이머가 사용될 특정한 적용에 대한 이들의 중요성을 기반으로 상이한 중량으로 지정될 수 있다. 예시적인 매개변수는 표적 유전자자리의 이형접합성 비, 표적 유전자자리에서 서열과 관련된 질병 유병률(예를 들면, 다형성), 표적 유전자자리에서 서열과 관련된 질병 침투능(예를 들면, 다형성), 표적 유전자자리를 증폭시키는데 사용된 후보물 프라이머(들)의 특이성, 표적 유전자자리를 증폭시키는데 사용된 후보물 프라이머(들)의 크기, 및 표적 앰플리콘의 크기를 포함한다.
단계 2
열역학적 상호작용 점수는 각각의 프라이머와 모든 프라이머 사이에서 단계 1의 다른 모든 표적 유전자자리에 대해 계산되었다(참조: 예를 들면, Allawi, H. T. & SantaLucia, J., Jr. (1998), "Thermodynamics of Internal C-T Mismatches in DNA", Nucleic Acids Res . 26, 2694-2701; Peyret, N., Seneviratne, P. A., Allawi, H. T. & SantaLucia, J., Jr. (1999), "Nearest-Neighbor Thermodynamics and NMR of DNA Sequences with Internal A-A, C-C, G-G, and T-T Mismatches", Biochemistry 38, 3468-3477; Allawi, H. T. & SantaLucia, J., Jr. (1998), "Nearest-Neighbor Thermodynamics of Internal A-C Mismatches in DNA: Sequence Dependence and pH Effects", Biochemistry 37, 9435-9444.; Allawi, H. T. & SantaLucia, J., Jr. (1998), "Nearest Neighbor Thermodynamic Parameters for Internal G-A Mismatches in DNA", Biochemistry 37, 2170-2179; and Allawi, H. T. & SantaLucia, J., Jr. (1997), "Thermodynamics and NMR of Internal G-T Mismatches in DNA", Biochemistry 36, 10581-10594; Mμl tiPLX 2.1 (Kaplinski L, Andreson R, Puurand T, Remm M. Mμl tiPLX: automatic grouping and evaluation of PCR primers. Bioinformatics. 2005 Apr 15;21(8):1701-2, 이들의 전문은 각각 본원에 참조로 포함된다). 당해 단계는 상호작용 점수의 2D 매트릭스를 생성하였다. 상호작용 점수는 2개의 상호작용하는 프라이머를 포함하는 프라이머-이량체의 가능성을 예측하였다. 점수는 다음과 같이 계산하였다:
상호작용_점수 = max(- deltaG_2, 0.8 * (- deltaG_1))
여기서, deltaG_2는 말단 둘 모두, 즉, 다른 프라이머에 어닐링하는 각각의 프라이머의 3' 말단에서 PCR에 의해 연장가능한 이량체에 대한 깁스 에너지(Gibbs energy)(이량체를 파괴하는데 요구되는 에너지)이고;
deltaG_1은 적어도 하나의 말단에서 PCR에 의해 연장가능한 이량체에 대한 깁스 에너지이다.
단계 3:
각각의 표적 유전자자리에 대해, 하나 이상의 프라이머-쌍 설계가 존재한 경우, 다음 방법을 사용하여 하나의 설계를 선택하였다:
1 유전자자리에 대한 각각의 프라이머-쌍 설계를 위해, 다른 모든 표적 유전자자리에 대한 모든 설계의 모든 프라이머 및 설계에 있어서 2개의 프라이머에 대한 최악의 경우(최대)의 상호작용 점수를 찾는다.
2 최대(최저)로 나쁜 경우의 상호작용 점수를 사용하여 설계를 선택한다.
단계 4
그래프를 구축하여 각각의 절(node)이 하나의 유전자자리 및 이의 관련된 프라이머-쌍 설계(예를 들면, 최대 클릭 문제(Maximal Clique problem))를 나타내도록 하였다. 하나의 모서리(edge)를 절의 매 쌍 사이에 생성시켰다. 중량을 모서리에 연결된 2개의 절과 관련된 프라이머 사이에 최악의-경우(최대) 상호작용에 동등한 각각의 모서리에 지정하였다.
단계 5
경우에 따라, 하나의 설계의 프라이머 중 하나 및 다른 설계의 프라이머 중 하나가 중첩된 표적 영역에 어닐링될 수 있는 2개의 상이한 표적 유전자자리에 대한 설계의 매 쌍에 대해, 추가의 모서리를 2개의 설계에 대한 절 사이에 가하였다. 이들 모서리의 중량을 단계 4에서 지정한 최대 중량과 동일하게 설정하였다. 따라서, 단계 5는 라이브러리를 중첩하는 표적 영역에 어닐링할 수 있는 프라이머를 갖는 것을 방지하므로, 다중 PCR 반응 동안 서로를 방해한다.
단계 6
초기의 상호작용 점수 한계는 다음과 같이 계산하였다:
중량_역치 = max(모서리_중량) - 0.05 * (max(모서리_중량) - min(모서리_중량))
여기서,
max(모서리_중량)는 그래프에서 최대 모서리 중량이고;
min(모서리_중량)는 그래프에서 최소 모서리 중량이다.
한계에 대한 초기 결합은 다음과 같이 설정하였다:
max_중량_역치 = max(모서리_중량)
min_중량_역치 = min(모서리_중량)
단계 7
단계 5의 그래프와 동일한 세트의 절로 이루어지고, 중량_역치를 초과하는 중량을 지닌 모서리 만을 포함하는 새로운 그래프를 구성하였다. 따라서, 단계는 중량_역치와 동일하거나 미만인 점수를 갖는 상호작용은 무시한다.
단계 8
절(및 제거된 절에 연결된 모서리 모두)을 모서리가 남아있지 않을 때까지 단계 7의 그래프에서 제거하였다. 다음 과정을 적용시킴으로써 절을 반복적으로 제거하였다:
1. 최대 정도를 지닌 절을 찾는다(모서리의 최대 점수). 1개 이상이 존재하는 경우 하나를 임의로 선택한다.
2. 상기 선택된 절 및 이에 연결된 절 모두로 이루어지지만, 위에서 선택된 절 미만의 정도를 갖는 어떠한 절을 제외하는 절의 세트를 정의한다.
3. 단계 1의 최소 표적 유전자자리 점수(보다 낮은 점수는 보다 낮은 바람직성을 나타낸다)를 갖는 세트에서 절을 선택한다. 그래프에서 절을 제거한다.
단계 9
그래프에 남아있는 절의 수가 다중화된 PCR 혼주물에 대한 표적 유전자자리의 요구된 수를 만족시키는 경우(허용되는 내성 내에서), 당해 방법을 단계 10에서 지속하였다.
그래프에 너무 많거나 너무 적은 절이 존재하는 경우, 이원 조사를 수행하여 어떤 한계 값이 그래프에 남아있는 절의 바람직한 수를 야기할 수 있는지를 측정하였다. 다음에 그래프에 너무 많은 절이 존재한 경우, 중량 한계 결합을 다음과 같이 조절하였다:
max_중량_역치 = 중량_역치
또한(그래프에 2개의 약간의 절이 존재한 경우), 중량 한계 결합을 다음과 같이 조절하였다:
min_중량_역치 = 중량_역치
이후에, 중량 한계를 다음과 같이 조절하였다:
중량_역치 = (max_중량_역치 + min_중량_역치) / 2
단계 7 내지 9를 반복하였다.
단계 10
그래프에 남아있는 절과 관련된 프라이머-쌍 설계를 프라이머의 라이브러리를 위해 선택하였다. 당해 프라이머 라이브러리를 본 발명의 방법 중의 어느 것에도 사용할 수 있다.
경우에 따라, 프라이머를 설계하고 선택하는 방법을 프라이머 라이브러리에 대해 수행하였으며, 여기서 단지 하나의 프라이머(프라이머 쌍 대신)을 표적 유전자자리의 증폭에 사용한다. 이 경우에, 절은 표적 유전자자리(프라이머 쌍보다는) 당 하나의 프라이머를 나타낸다.
실험 17
도 27은 본 발명의 방법을 사용하여 설계된 2개의 프라이머 라이브러리를 비교한 그래프이다. 당해 그래프는 각각의 프라이머 라이브러리에 의해 표적화된 특정한 작은 대립유전자 빈도를 지닌 유전자자리의 수를 나타낸다. "신규 혼주물" 라이브러리의 선택 동안에, 보다 많은 프라이머를 유지하였다. 당해 라이브러리는 보다 많은 표적 유전자자리, 특히 비교적 많은 작은 대립유전자 빈도(이는 태아 염색체 비정상을 검출하기 위한 것과 같이, 본 발명의 일부 방법을 위해 보다 유익한 대립유전자가다)를 지닌 표적 유전자자리의 증폭을 가능하도록 한다.
이들 프라이머 라이브러리를 다음의 다중 PCR 방법에 사용하였다. 혈액(20-40 mL)을 각각의 피험자로부터 2 내지 4개의 CELL-FREETM DNA 튜브(제조원: Streck)에 수집하였다. 혈장(최소 7 mL)을 각각의 시료 2,000g에서 20분 동안에 이어서 3,220g에서 30분 동안의 이중 원심분리 프로토콜을 통해 분리하고, 상층액을 최초 회전 후 이전시켰다. cfDNA를 7 내지 20 mL 혈장에서 QIAGEN QIAamp 순환 핵산 키트를 사용하여 분리하고 45μl의 TE 완충액 속에 용출시켰다. 순수한 모계 게놈성 DNA를 첫번째 원심분리 후 수득된 연막에서 분리하고, 순수한 부계 게놈성 DNA는 혈액, 타액 또는 볼 시료로부터 유사하게 제조하였다.
모계 cfDNA, 모계 게놈성 DNA, 및 부계 게놈성 DNA 시료를 15 주기 동안 11,000개의 표적-특이적인 검정을 사용하여 예비-증폭시키고 분취량을 15 주기의 제2의 PCR 반응물에 중첩된 프라이머를 사용하여 이전시켰다. 최종적으로, 시료를 제3의 12-주기 라운드의 PCR에서 바코드화된 태그를 가함으로써 서열분석을 위해 제조하였다. 따라서, 11,000개의 태그를 단일 반응에서 증폭시켰으며; 표적은 염색체 13, 18, 21, X, 및 Y에서 발견된 SNP를 포함하였다. 이후에 앰플리콘을 ILLUMINA GAIIx 또는 HISEQ 서열분석기를 사용하여 서열분석하였다. 부계 표현형을 태아 유전형보다 더 낮은 판독물 깊이(~20%의 cfDNA 판독물 깊이)에서 서열분석하였다.
실험 18
경우에 따라, PCR 생성물의 크기 및 양을 Agilent Technologies 2100 Bioanalyzer와 같은 표준 방법을 사용하여 분석할 수 있다(도 28a 내지 도 28m). 예를 들면, 중첩의 부재하에 본원에 기술된 직접적인 PCR 방법을 2,400-플렉스 시험(도 28b 내지 28g) 및 19,488-플렉스 실험(도 28h 내지 도 28m)에서 사용하였다. 프라이머의 양은 도 28b 내지 도 28d 및 도 28h 내지 도 28j의 경우 10 nM이었다. 프라이머의 양은 도 28e 내지 도 28g 및 28k 내지 28m의 경우 1 nM이었다. 투입 DNA의 양은 28b, 도 28e, 도 28h, 및 도 28k의 경우 24 ng이었고, 도 28c, 도 28f, 도 28i, 및 도 28l의 경우 80 ng 이었으며, 도 28d, 도 28g, 도 28j, 및 도 28m의 경우 250 ng이었다. 추가의 투입 DNA는 목적한 180개 염기쌍 생성물의 보다 높은 비율을 생성하였다. 140개 염기 쌍에서 피크는 프라이머 이량체 생성물이었다.
실험 19
원리 증명 연구는 모든 염색체에 걸쳐 동일하게 높은 정밀도로 T13, T18, T21, 45,X, 및 47,XXY의 검출을 입증하였다.
환자
임신한 쌍을 지방법에 따라 기관감사위원회(Institutional Review Board)에 의해 승인된 프로토콜 하에 구체적인 산전 보호 센터에 등록시켰다. 포함 기준은 적어도 18세 이상의 연령, 적어도 9주의 잉태 연령, 단태 임신, 및 서명된 고지된 동의서였다. 혈액 시료를 임신한 모친에서 채혈하고, 혈액 또는 볼 시료를 부친에서 수집하였다. T13(파타우 증후군(Patau Syndrome))을 지닌 2명의 임산부, T18(에드워드 증후군)을 지닌 2명의 임산부, T21(다운 증후군)을 지닌 2명의 임산부, 45,X를 지닌 2명의 임산부, 47,XXY를 지닌 2명의 임산부, 및 90명의 정상의 임산부를 ~500명의 여성의 집단에서 시험 전에 선택하여 어느 염색체 비정상을 당해 방법이 검출하는지를 시험하였다. 정상의 태아 핵형을 시료에 대한 분자 핵형분석으로 확인하였으며, 여기서 출생 후 태아 조직이 이용가능하였다. 정배수성 시료를 저-위험 여성에서 침입성 시험 전에 수집하였다. 이수성 시료를 침입성 시험 후 적어도 7일째에 수집하고 이수성을 독립된 실험실에서 반응계내 하이브리드화에서 세포유전학적 핵형분석 또는 형광성을 통해 입증하였다.
시료 제조 및 다중 PCR
도 30a 내지 도 30e, 도 30g, 도 30h, 및 31a 내지 도 31g에서의 데이터의 경우, 시료 제조 및 19,488-플렉스-PCR을 실시예 15에 기술된 바와 같이 수행하였다. 도 30f에서의 데이터의 경우, 시료 제조 및 11,000-플렉스-PCR을 실험 17에 기술된 바와 같이 수행하였다.
방법론 및 데이터 분석
알고리즘을 부모계 유전형 및 교차 빈도 데이터(합맵 데이터베이스(HapMap database)의 데이터와 같음)를 고려하여 매우 큰 수의 가능한 태아 배수성 상태에 대해 19,488개의 다형성 유전자자리, 및 다양한 태아 cfDNA 분획에서 예측된 대립유전자 분포를 계산하였다(도 29a 내지 도29 c). 대립유전자 비 기반-방법과는 달리, 이는 또한 연결 불균형을 고려하고, 비-가우시안 데이터 모델을 사용하여 관찰된 플랫폼 특징 및 증폭 편향이 소정의 SNP에서 대립유전자 측정의 예측된 분포를 기술한다. 이후에, 이는 다양한 예측된 대립유전자 분포를 cfDNA 시료(도 29c)에서 측정한 실제 대립유전자 분포에 대해 비교하고, 서열분석 데이터를 기반으로 한 각각의 가설(일염색체성, 이염색체성, 또는 삼염색체성, 이에 대해 다양한 잠재적인 교차를 기반으로 다수의 가설이 존재한다)의 가능성을 계산한다. 알고리즘은 각각의 개체의 일염색체성, 이염색체성, 또는 삼염색체성 가설의 가능성을 합하여(도 29d), 카피 수 및 태아 분획으로서 최대의 전체 가능성으로 배수성 상태를 요청한다(도 29e). 실험실 연구자가 시료 핵형에 대해 맹검처리되어 있지 않았지만, 당해 알고리즘은 사람 중재없이 배수성 상태를 요청하였으며 진실에 대해 맹검처리되었다.
데이터 해석
일반화된 데이터의 그래프적 표시
목적한 염색체의 배수성 상태를 측정하기 위하여, 알고리즘은 염색체당 3,000 내지 4,000개의 SNP에서 각각의 2개의 가능한 대립유전자의 서열 수의 분포를 고려하였다. 알고리즘이 자체를 가시화에 기대지 않는 접근법을 사용하여 배수성 요청을 하는 것을 주목하는 것이 중요하다. 따라서, 나열의 목적을 위해, 데이터를 본원에 A 및 B로 표지된, 2개의 가장 유사한 대립유전자의 비로서 단순화된 양식으로 나타냄으로써 관련된 양상이 보다 용이하게 가시화되도록 할 수 있다. 이러한 단순화된 나열은 알고리즘의 특성 중의 일부를 고려하지 않는다. 예를 들면, 대립유전자 비를 나타내는 가시화 방법을 사용하여 나열하는 것이 불가능한 알고리즘의 2개의 중요한 측면은: 1) 연결 불균형을 지렛대화하는 능력, 즉 하나의 SNP에서 측정이 이웃하는 SNP의 유사한 실체에서 갖는 영향, 및 2) 플랫폼 특성 및 증폭 편향이 소정의 SNP에서 대립유전자 측정의 예측된 분포를 기술하는 비-가우시안 데이터 모델의 용도. 또한, 알고리즘이 각각의 SNP에서 2개의 가장 일반적인 대립유전자만을 고려하며, 다른 가능한 대립유전자는 무시함에 주목한다.
도 30a 내지 도 30h의 그래프적 표시는 이에 대해 2개, 1개, 또는 3개의 태아 염색체가 존재하는 시료를 포함한다. 일반적으로, 이는 정배수성(도 30a 내30c) 일염색체성(도 30d), 및 삼염색체성(도 30e 내지 도 30h)을 각각 나타낸다. 모든 플롯에서, 각각의 점은 단일 SNP를 나타내며, 여기서 표적화된 SNP는 수평한 축을 따라 하나의 염색체에 대해 좌측에서 우측으로 순서적으로 플롯팅된다. 수직 축은 이러한 SNP에 대한 A 및 B 대립유전자 두 다에 대한 판독물의 총 수의 분획으로서 A 대립유전자에 대한 판독물의 수를 나타낸다. 측정은 모계 혈액에서 분리한 총 cfDNA에서 수행하였으며 cfDNA는 모계 및 태아 cfDNA 둘 모두를 포함하므로; 각각의 점은 이러한 SNP에 대한 태아 및 모계 DNA 기여의 조합을 나타냄에 주목한다. 따라서, 모계 cfDNA의 비율을 0%에서 100%로 증가시키는 것은 모계 및 태아 유전형에 따라, 플롯내에서 일부 점을 상향 또는 하향으로 점진적으로 이동시킬 것이다. 이는 상응하는 플롯과 함께 하기에 보다 상세히 기술되어 있다.
가시화를 촉진하는 것이 요구되는 경우, 모계 유전형은 각각의 점의 국재화에 보다 더 기여하며 대부분의 삼염색체는 모에서 유전하므로, 점은 모계 유전형에 따라 색상-코드화될 수 있으며; 이는 배수성 상태를 가시화하는데 보조한다. 구체적으로, 이에 대한 모계 유전형이 AA인 SNP는 적색으로 나타낼 수 있으며, 이에 대한 모계 유전형이 AB인 것은 녹색으로 나타낼 수 있으며, 이에 대한 모계 유전형이 BB인 것은 청색으로 나타낼 수 있다.
모든 경우에서, 모계 및 태아 둘 모두에서 A 대립유전자(AA)에 대해 동종접합성인 SNP는, B 대립유전자가 존재하지 않은 수 있으므로 A 대립유전자의 분획이 높기 때문에, 플롯의 상부 한계와 밀접하게 관련된 것으로 밝혀져 있다. 역으로, 모계 및 태아 둘 모두에서 B 대립유전자에 대해 이형접합성인 SNP는, B 대립유전자만이 존재하여야 하므로 A 대립유전자 판독물의 분획이 낮기 때문에, tdhe 플롯의 보다 낮은 한계와 밀접하게 관련된 것으로 밝혀져 있다. 플롯의 보다 높은 및 보다 낮은 제한과 밀접하게 관련되지 않은 스폿은, 이의 모, 태아 또는 둘 모두가 이형접합성인 SNP를 나타내고; 이들 스폿은 태아 배수성을 확인하는데 유용하지만, 또한 부계 대 모계 유전성을 측정하는 데 유익할 수 있다. 이들 점은 모계 및 태아 유전형 및 태아 분획 둘다를 기반으로 분리되며, 자체로 y-축을 따라 각각의 개개 점의 상세한 위치는 입체화학적 및 태아 분획 둘 모두에 의존한다. 예를 들면, 모가 AA이고 태자녀 AB인 유전자자리는 A 대립유전자 판독물의 상이한 분획을 가짐으로써 태아 분획에 따라서, y-축을 따라 상이한 위치선정을 갖는 것으로 예측된다.
존재하는 2개의 염색체
도 30a 내지 도 30c는, 시료가 전적으로 모인 경우(태아 cfDNA는 존재하지 않음, 도 30a) 2개의 염색체의 존재가 중간의 태아 cfDNA 분획을 함유하거나( 30b), 높은 태아 cfDNA 분획을 함유함(도 30c)을 나타내는 데이터를 묘사한다.
도 30a는 임신하지 않은 여성의 혈액에서 분리한 cfDNA로부터 수득한 데이터를 나타낸다. 태아 cfDNA가 존재하지 않고 시료가 모계 cfDNA 만을 함유하는 경우, 플롯은 순수하게 정배수성 모계 유전형을 나타내고; 홀마크(Hallmark) 양식은 점의 "집단"을 포함한다: 적색 집단은 점의 상단과 밀접하게 관련되어 있고(모계 유전형이 AA인 SNP), 청색 집단은 점의 하단과 밀접하게 관련되어 있으며(모계 유전형이 BB인 SNP), 하나는 녹색 집단에 집중되어 있다(모계 유전형이 AB인 SNP)(색상은 나타내지 않음).
태아 cfDNA가 존재하는 경우, 점의 위치는, 집단이 별개의 "밴드"로 분리되도록 이동한다. 태아 분획이 0%인 시료의 경우, 점의 그룹화는 "집단"으로 언급되며(도 30a에서와 같이), 태아 분획이 >0%인 모든 시료의 경우, 점의 그룹화는 "밴드"로 언급된다(도 30b 내지 도 30j에서와 같이). 태아 분획이 충분히 높은 경우, 이들 별개의 밴드는 용이하게 가시화될 것이다. 구체적으로, 도 30b 및 도 30c는 각각 중간 및 고 태아 분획으로 나타난 2개의 태아 염색체와 관련된 특징적인 양식을 입증한다. 이러한 양식은 모에서 이형접합성인 SNP에 상응하는 3개의 중심 녹색 밴드, 및 모에서 동형접합성인 SNP에 상응하는 점의 상단(적색) 및 하단(청색) 둘 모두에서 2개의 "주변" 밴드를 포함한다(색상은 나타내지 않음).
도 30b는 정배수성 태아를 지니고 12%의 태아 cfDNA 분획을 지닌 여성의 혈장 시료에서 분리한 cfDNA로부터 수득한 데이터를 나타낸다. 여기서, 플롯의 상단 및 하단과 밀접하게 연관된 점의 집단을 각각 2개의 명백한 밴드로 분리하였다: 플롯의 상부 또는 하부 한계와 밀접하게 관련되어 남아있는 하나의 적색 및 하나의 청색 외부 주변 밴드, 및 플롯의 한계에서 분리된 하나의 적색 및 하나의 청색 내부 주변 밴드(색상은 나타내지 않음). 0.92 및 0.08 주변에 집중된, 이들 내부 주변 밴드는, 이에 대한 모계 유전형이 AA이고 태아 유전형이 AB(적색으로 나타냄)인 SNP, 및 모계 유전형이 BB이고 태아 유전형이 AB인 SNP(청색으로 나타냄) 각각을 나타낸다. 녹색 점의 중심 집단은 확장되지만, 당해 태아 분획에서 명백한 밴드로의 분리는 용이하게 가시적이지 않다.
높은 태아 cfDNA 분획에서, 2개의 염색체의 존재(3개의 녹색 밴드 및 또한 2개의 적색 및 2개의 청색 주변 밴드)는 용이하게 명확하다(색상은 나타내지 않음). 30c은 26%의 태아 cfDNA 분획에서 정배수성 태아를 지닌 여성의 혈장 샘플에서 수득한 데이터를 나타낸다. 여기서, 주변 밴드를 분리함으로써 내부 밴드가 증가된 태아 cfDNA 분획에서 B 대립유전자의 변경된 수준으로 인한 플롯의 중심을 향해 이동하도록 한다. 유의적으로, 보다 높은 태아 분획에서, 중심 녹색 집단의 3개의 명백한 밴드로의 분리는 이제 용이하게 명확해진다. 이 경우에 0.37, 0.50 및 0.63 주변에 집단화된, 이러한 중심 3개의 밴드는 이들 SNP에 상응하며 여기서 모계 유전형은 AB이고, 태아 유전형은 AA(상단), AB(중간) 및 BB(하단)이다.
이들 홀마크 양식, 즉 3개의 녹색 밴드 및 4개의 주변 밴드(2개의 적색 및 2개의 청색)은 여성(XX) 태아에서 X 염색체 또는 자가 정배수성에서와 같은 2개의 염색체의 존재를 나타낸다.
존재하는 하나의 염색체
태자녀 단지 단일 염색체를 유전받아서, 단지 단일 대립유전자를 유전받은 경우, 태아의 이형접합성은 불가능하다. 이와 같이, 유일하게 가능한 태아 SNP 실체는 A 또는 B이다. 따라서, 모계-유전된 일염색체성 염색체는, 이에 대한 모가 이형접합성인 SNP를 나타내는 2개의 중심 녹색 밴드의 특징적인 패턴을 가지고 있으며, 이에 대한 모가 동형접합성이고, 플롯의 상한 및 하한(1 및 0)과 밀접하게 관련되어 남아있는 SNP를 나타내는 단일의 주변 적색 및 녹색 밴드를 각각 갖는다(도 30d) (색상은 나타내지 않음). 내부 주변 밴드의 부재에 주목한다. 이러한 양식은 모계-유전된 상염색체 일염색체에서와 같이 하나의 염색체의 존재, 또는 남자(XY) 태아에서 X 염색체의 경우를 나타낸다.
존재하는 3개의 염색체
삼염색체성 염색체는 3개의 특징적인 양식을 갖는다. 제1 양식은 모계-유전된 감수분열 삼염색체성, 태자녀 모친으로부터 2개의 동종접합성의 동일하지 않은 염색체를 유전받은 유사분열 오차를 나타낸다(도 30e); 이러한 양식은 각각 2개의 주변 적색 및 청색 밴드를 지닌 2개의 중심 녹색 밴드를 나타낸다(색상은 나타내지 않음). 제2의 양식은 부계-유전된 유사분열 삼염색체를 나타내고, 여기서 태아는 부친로부터 2개의 동종의, 동일하지 않은 염색체를 유전받는다(도 30f); 이러한 양식은 4개의 중심 녹색 밴드 및 각각 3개의 주변 적색 및 청색 밴드를 포함한다(색상은 나타내지 않음). 제3의 양식은 모-(도 30g) 또는 부계-유전된(도 30h) 유사분열 삼염색체성, 태자녀 모계 또는 부친으로부터 2개의 동일한 염색체를 유전받은 유사분열 오차를 나타내며; 이러한 양식은 각각 2개의 주변 적색 및 청색 밴드를 지닌 4개의 중심 녹색 밴드를 포함한다. 모계- 및 부계-유전된 유사분열 삼염색체성은 플랭킹된 적색 및 청색 밴드의 치환에 의해 적색 및 청색 내부 주변 밴드(이들은 플롯의 한계와 관련되지 않는다)가 부계-유전된 유사분열 삼염색체에서 중심에 보다 가까워지도록 함으로써 구별할 수 있다(색상은 나타내지 않음). 이는 동일한 염색체의 부계 기여에 기인한다. 본 발명자들의 앞서의 결과는, 난할구 단계, 모계-유전된 삼염색체의 66.7%가 유사분열이고, 삼염색체의 10.2% 만이 부계-유전됨을 나타낸다.
Y 염색체의 경우, PS 방법은 상이한 세트의 가설을 고려한다: 0, 1, 또는 2개의 염색체가 존재한다. 각각의 유전자자리에 서열 판독물에 대한 모계 기여가 없고 이형접합성 유전자자리가 가능하지 않기 때문에(2개의 Y 염색체가 필수적으로 2개의 동일한 염색체를 포함하지 않는 경우), 밴드는 플롯의 상단(A 대립유전자) 또는 하단(B 대립유전자)과 밀접하게 관련되어 남으며(데이터 미표시), 분석은 정량적인 대립유전자 수 데이터에 의존하여 크게 단순화된다. 당해 방법은 SNP를 질의할 수 있기 때문에, 이는 Y 염색체의 동종의, 비-재조합체 SNP를 사용하므로 하나의 프로브 쌍에 대해 X 및 Y 둘 모두에 대한 데이터를 수득한다.
이수성의 확인
이러한 플롯-기반 가시화 방법을 사용하는 상염색체 이수성의 확인은 충분한 태아 분획의 제공시 간단해지며, 위에서 기술한 바와 같이 비정상적인 수의 염색체가 존재하는 플롯을 단지 확인하는 단계를 필요로 한다. X 및 Y 염색체의 카피 수의 지식을 합하여 성 염색체 이수성이 존재하는지를 확인한다. 구체적으로, 47,XXX 유전형을 지닌 태아를 나타내는 플롯은 전형적인 "삼-염색체" 양식을 가질 것이며, 47,XXY 유전형을 갖는 태아를 나타내는 플롯은 X 염색체에 대해 전형적인 "이-염색체" 양식을 가질 것이지만, 또한 하나의 Y 염색체의 존재를 나타내는 대립유전자 판독물을 가질 것이다. 당해 방법은 47,XYY를 요청할 수 있으며, 여기서 "하나의-염색체" 양식은 단일의 X 염색체의 존재를 나타내며, 대립유전자 판독물은 2개의 Y 염색체의 존재를 나타낸다. 45,X 유전형을 지닌 태아는 X 염색체에 대해 전형적인 "하나의 염색체" 양식, 및 0개의 Y 염색체를 나타내는 데이터를 가질 것이다.
태아 분획의 효과
위에서 논의한 바와 같이, 태아의 서열 판독물의 수는 플롯에서 y-축을 따라 각각의 점의 상세한 위치에 기여한다. 태아 분획은 태아 및 모에서 기원하는 판독물의 비율에 영향을 미치므로, 이는 또한 각각의 점의 위치화에 영향을 미칠 것이다. 도 30c 내지 도 30e도 30g 및 도 30h에서와 같이, 태아 cfDNA의 고 분획(일반적으로 ~20% 초과)에서, 점 집단이 주로 모계 유전형을 기반으로 하지만, 이의 유전형이 모계 유전형과는 구별되는 대립유전자의 태아 DNA의 존재는 집단을 다수의 명확한 밴드로 이동시킨다. 그러나, 태아 분획이 감소하면서(도 30b 및 30f에서와 같이), 점은 극 및 플롯의 중심을 향해 퇴행하여 더 단단한 클러스터를 생성한다. 구체적으로, 주변 적색 밴드의 세트(여기서 모계 유전형은 AA이다)는 플롯의 상단을 향해 퇴행하고; 주변 청색 밴드의 세트(여기서 모계 유전형은 BB이다)는 하단을 향해 퇴행하며; 중심 녹색 밴드이 세트(여기서 모는 이형접합성이다)는 플롯의 중심에서 단일 집단으로 농축된다(도 30b 및 도 30c와 비교)(색상은 나타내지 않음). 이수성이 낮은 태아 분획의 경우에 이러한 가시화 기술을 사용하여 눈에 의해 용이하게 명백하지 않지만, 당해 알고리즘은 3%의 태아 분획과 같이 매우 낮은 태아 분획을 사용하여 배수성 상태를 확인할 수 있다. 통계 기술은 관찰된 데이터를 소정의 시료 매개변수 세트(카피 수, 부계 유전형, 및 태아 분획 포함)에 대한 대립유전자 분포를 예측하는 매우 정밀한 데이터 모델과 비교하므로 이를 수행하는 것이 가능하다. 데이터 모델 정확성은 낮은 태아 분획의 경우에 중요하며, 이는 상이한 배수성 상태에 대한 대립유전자 분포 사이의 차이가 태아 분획과 비례하기 때문이다. 또한, 알고리즘은, 데이터 세트가 확실한 태아 배수성 측정을 이루기에 충분한 데이터를 함유하지 않는 경우 측정될 수 있다.
결과
표적화된 SNP에 맵핑하는 서열분석 판독물은 유익한 것으로 여겨졌으며 알고리즘에 의해 사용되었다. 95% 이상의 표적화된 유전자자리는 서열 분석 결과에서 관찰되었다. 주요 배수성 요청을 가시화하기 위한 플롯은 도 31a 내지 도 31g에 나타나 있다. 도 31a는 정배수성 시료를 나타낸다. 여기서, 염색체 13, 18, 및 21은 전형적인 "2개 염색체" 양식(본원에 기술된 바와 같음)을 갖는다. 이는 중심의 녹색 밴드, 및 2개의 적색 및 2개의 청색 주변 밴드의 3개조를 갖는다. 이는, X 염색체에 대한 2개의 중심 녹색 밴드 및 플롯의 주변을 따라 Y 염색체 밴드의 존재와 함께, 정배수성 XY 유전형을 나타낸다(색상은 나타내지 않음).
가장 우세한 상염색체 삼염색체, T13, T18, 및 T21는 각각 31b, 31c, 및 31d에 나타낸다. 구체적으로, 도 31b는 T13 시료를 나타낸다. 여기서, 염색체 18 및 21은 전형적인 "2개의 염색체" 패턴을 나타내고, 염색체 X는 전형적인 "하나의 염색체" 양식을 나타내고, Y 염색체의 판독물이 존재한다. 함께, 이는 염색체 18 및 21에서 이염색체를 나타내며 태아 XY 유전형을 확인한다. 그러나, 염색체 13은 구체적으로 전형적인 "삼-염색체" 양식을 나타낸다. 유사하게, 도 31c는 T18 시료를 나타내고, 도 31d는 T21 시료를 나타낸다.
당해 방법은 또한 45,X (도 31e), 47,XXY (도 31f), 및 47,XYY (도 31g)를 포함하는 성 염색체 이수성을 검출할 수 있다. 당해 방법은 염색체 13, 18, 21, X, 및 Y에서 카피 수를 요청함에 주목한다; 전체 염색체 수는 나머지 염색체에서 이염색체로 추정되는 것으로 보고되어 있다. 45,X 시료를 나타내는 플롯의 X 염색체 영역은 단일 염색체의 존재를 나타낸다. 그러나, 염색체 13, 18, 및 21에 대한 "2개 염색체" 양식과 커플링된, Y 염색체의 판독물의 결여는 45,X 유전형을 나타낸다. 역으로, 47,XXY 시료는 2개의 X 염색체의 존재를 나타내는 플롯을 생성한다. 당해 데이터는 또한 Y 염색체의 대립유전자에 대한 판독물을 나타낸다. 염색체 13, 18, 및 21의 2개 카피의 존재와 함께, 이는 47,XXY 유전형을 나타낸다. 47,XYY 유전형은 X 염색체에 대한 "하나의 염색체" 양식, 및 2개의 Y 염색체의 존재를 나타내는 판독물의 존재로 나타난다.
논의
당해 방법은 모계 혈액에서 비-침입적으로 T13, T18, T21, 45,X, 47,XXY, 및 47,XYY를 검출하였다. 당해 방법은 19,488 SNP의 표적화된 다중화 PCR 증폭 및 고-배출 서열분석에 의해 모계 혈장의 cfDNA의 정보를 얻는다. 부계 유전형 정보, 및 태아 분획 및 DNA 품질을 포함하는, 다수의 시료 매개변수를 고려하는 방법의 세련된 정보학 분석과 커플링시켜 7개의 가장 일반적인 유형의 출생시 이수성(T13, T18, T21, 45,X, 47,XXX, 47,XXY, 및 47,XYY)과 연루된 5개의 염색체 중 모두에서 태아 신호를 확실하게 검출하여 고도로 정밀한 배수성 요청을 이룬다. 당해 방법은 가장 유의적으로 큰 임상 범위 및 시료-특이적인 계산된 정밀도(개별화된 위험 점수와 유사)를 포함하는, 앞서의 방법보다 다수의 임상 장점을 제공한다.
증가된 임상 범위
당해 방법은 상염색체 삼염색체 및 성 염색체 이수성을 정밀하게 검출하는 이의 능력을 제공하면서, 임상적으로 이용가능한 NIPT 방법론과 비교하여 이수성 범위에 있어서 대략 2배의 증가를 제공한다. 본원에 나타낸 방법은 성 염색체에서 배수성을 고도의 정밀도로 요청하는 유일한 비침입성 시험이다. 선행의 DNA 혼합 장치 및 본 발명자의 실험 검정에서 분석된 분리된 혈장 시료는, 당해 방법이 47,XXX를 포함하는 성 염색체 비정상의 보다 큰 집단을 검출할 것임을 제안한다. 여기서 나타낸 방법은 또한 고 민감성 및 특이성으로 염색체 13, 18, 및 21에서 이수성을 검출하며, 적절한 프라이머 설계와 함께 나머지 염색체에서 또한 카피 수를 검출할 수 있는 것으로 예측된다.
시료-특이적인 계산된 정밀도
유의적으로, 당해 방법은 각각의 시료 속의 각각의 염색체에서 배수성 요청에 대한 시료-특이적인 정밀도를 계산한다. 당해 방법으로 계산된 정밀도는 불량한 품질의 DNA 또는 불량한 정밀도 시험 결과를 야기하는 경향이 있는 저 태아 분획을 갖는 개체의 시료를 확인하여 표시함으로써 부정확한 요청의 비율을 유의적으로 낮추는 것으로 예측된다. 대조적으로, 거대한 평행의 셧건 서열분석(MPSS)-기반 방법은 단일의 가설 거부 시험을 사용하여 양성 또는 음성 요청을 생성하며, 이들의 정밀도 평가는 개체의 시료의 특징보다는 발표된 연구 집단을 기반으로 하므로, 이는 집단과 동일한 정밀도를 갖는 것으로 추측된다. 그러나, 집단 분포의 테일내 매개변수를 갖는 시료에 대한 개체의 정밀도는 유의적으로 상이할 수 있다. 이는 조기 잉태 나이에서와 같은 낮은 태아 분획, 또는 낮은 DNA 품질을 갖는 시료의 경우 악화된다. 이들 시료는 일반적으로 확인되지 않으며 후속처리용으로 표시되지 않으며, 이는 놓친 요청을 야기할 수 있다. 그러나, 본 방법은 태아 분획, 다수의 DNA 품질 기준을 포함하는 많은 매개변수를 고려하여 각각의 염색체 카피 수 요청, 이러한 요청에 대한 시료-특이적인 정밀도를 달성한다. 이는, 당해 방법이 개체의 시료를 낮은 정밀도로 확인하여 후속용으로 이들을 표시하도록 한다. 이는 특히 태아 분획이 전형적으로 낮은 경우 조기 임신 단계에서 놓친 요청을 거의 제거하는 것으로 예측된다. 이러한 가정은, 변경(redraw) 및 재분석을 단순히 필요로 하는 요청이 없으므로, 놓친 요청에 대해서는 매우 바람직한 요청이 아니라는 것이다.
계산된 정밀도의 전통적인 위험 점수로의 전환
당해 방법은 고-위험 임신 여성에 대한 이수성의 조절된 위험을 제공할 수 있으며, 여기서 조절된 위험은 선험적(a priori) 위험을 고려한다(참조: Benn P, Cuckle H, Pergament E. Non-invasive prenatal diagnosis for Down syndrome: the paradigm will shift, but slowly. ultrasound Obstet Gynecol 2012;39:127-130, 이의 전문은 본원에 참조로 포함된다). 본 방법이 각각의 환자에게 통상화된 계산된 정밀도를 제공하지만, 임상 용도를 위해 이들 정밀도는 전통적인 위험 점수로 전환될 수 있으며, 이러한 점수는 또한 이수성 임신의 위험을 나타내지만 분획으로 표현된다. 전통적 위험 점수는 연령-관련 위험 및 생화학적 표지의 혈청 수준을 포함하는 다양한 매개변수를 고려하여, 위험 점수를 초과하는 모는 고-위험으로 고려되고 이에 대해 후속적인 침입성 진단 과정이 추천되는 위험 점수를 부여한다. 당해 방법은 이러한 위험 점수를 유의적으로 개선함으로써, 거짓 양성 및 거짓 음성 비 둘 모두를 감소시키고, 개체의 모 위험의 보다 정밀한 평가를 부여한다. 본원에 사용된 것으로서 계산된 정밀도는, 배수성 요청이 정확하며, 퍼센트로 표현되지만, 실험 19에서 사용된 계산된 정밀도는 연령-관련된 위험을 포함하지 않는 가능성이 있다. 위험 점수의 계산은 전형적으로 연령-관련된 위험을 포함하므로, 계산된 정밀도 및 전통적인 위험 점수는 상호교환가능하지 않으며; 이들은 합하여 전통적인 위험 점수로 전환하여야 한다. 연령-관련된 위험과 계산된 정밀도를 합하기 위한 식은:
Figure 112015017677503-pct00108

(여기서, R1은 본 방법에 의해 계산된 위험 점수이고 R2는 첫번째 3개월 스크리닝에 의해 계산된 위험 점수이다)이다.
SNP -기반 방법은 증폭 변수를 지닌 쟁점을 무효화한다
일부 다른 방법에 의해 사용된 계수 방법에 대한 고유의 단점은, 이들이 참조 염색체에 맵핑한 것에 대한 목적한 염색체(예를 들면, 염색체 21)에 맵핑되는 판독물의 수의 비를 측정함으로써 태아 배수성 상태를 측정한다는 점이다. 염색체 13, X, 및 Y를 포함하는, GC 함량이 높거나 낮은 염색체는 고 가변성으로 증폭시킨다. 이는 목적한 염색체의 대립유전자 판독물의 비를 참조 염색체의 비로 변경시킴으로써 카피 수 요청을 혼동할 수 있는, 태아 cfDNA 신호에 대해 규모로 비교가능한 단일 변화를 야기할 수 있다. 이는 염색체 13, X, 및 Y에 대해 낮은 정밀도를 야기할 수 있다. 유의적으로, 이러한 문제는 조기 잉태 연령에서의 경우인 경향에서와 같이, 낮은 태아 cfDNA 분획에서 악화된다.
대조적으로, SNP-계 방법은 염색체 사이에 일관된 증폭 수준에 의존하지 않으므로, 모든 염색체에 걸쳐 동등하게 정밀한 결과를 제공하는 것으로 예측된다. 본 방법은 부분적으로 다형성 유전자자리에서 상이한 대립유전자의 상태적인 수를 고찰하며, 이에 의해 정의가 단일 뉴클레오타이드에 의해서만 상이하므로, 이는 참조 염색체의 사용을 필요로 하지 않으며, 이는 판독물 수를 정량화하는데 의존하는 방법에 대해 고유한 염색체-대-염색체 증폭 변수를 지닌 문제를 필요없도록 한다. 정배수성인 참조 염색체를 필요로 하는 정량적 방법과는 달리, 본 방법은 편친 이염색체성과 유사한 카피 수 중성 비정상 및 또한 삼염색체를 검출할 수 있을 것으로 예측된다.
조기 검출의 중요성
유의적으로, 성 염색체 이수성의 결합된 출생시 우세성은 가장 일반적인 상염색체 이수성의 것보다 더 크다(도 32). 그러나, 성염색체 비정상을 신뢰있게 검출하는 정규적인 비-침입성 스크리닝 방법이 현재 존재하지 않는다. 따라서, 성 염색체 비정상은 일반적으로 다운 증후군 또는 다른 상염색체 이수성에 대한 정규 시험의 부작용으로서 출생전에 일반적으로 검출되며; 경우들의 많은 비율이 전적으로 놓쳐진다. 조기 및 정밀한 검출은, 조기 치료학적 개입이 임상 결과를 개선시키는 많은 이들 질환에 중요하다. 예를 들면, 터너 증후군은, 이의 전체 출생시 유병률이 2,500명의 여성 중 1명이지만, 청소년기 때까지 진단되지 않는다. 성장 호르몬 치료요법이 당해 질환으로부터 야기되는 단신(short stature)을 방지하는 것으로 알려져 있지만, 치료는 4세 이전에 개시하는 경우 유의적으로 보다 효과적이다. 또한, 에스트로겐 대체 치료요법은 터너 증후군을 지닌 환자에서 2차 성징을 자극할 수 있으나, 다시 치료요법은 10대 이전에, 증후군이 일반적으로 검출되기 전에 개시되어야 한다. 이와 함께, 이는 성 염색체 이수성의 조기, 정규의, 및 안전한 검출의 중요성을 강조한다. 당해 방법은 성 염색체 비정상에 대한 정규의 스크린으로서 제공되는 가능성을 지닌 첫번째 접근법을 제공한다.
추가의 적용
당해 방법은 표적화된 증폭을 이용하므로, 이는 미세결실 및 미세복제와 같은 초현미경적 비정상을 검출하기 위해 유일하게 유지된다. MPSS와 같은 비-표적화된 방법이 디조지 미세결실 증후군(DiGeorge microdeletion syndrome)을 검출하는 것으로 밝혀져 있으나, 이는 당해 접근법이 실행할 수 없도록 하기에 충분히 높은 수준의 게놈 범위를 필요로 하였다. 이는, 서열분석 판독물의 매우 작은 분획이 유익할 것이므로, 비-표적화된 증폭이 초현미경적 영역에 효과적이지 않은 수개의 자릿수일 것이기 때문이다. 또한, 현재 이용가능한 방법이 성 염색체에 대한 배수성 상태를 정밀하게 확인하는데 문제가 있다는 사실은, 이들이 또한 보다 작은 염색체 분절에서 다양한 증폭 문제에 직면할 것임을 제안한다.
유사하게, SNP 기반 방법은 세포유전학적 핵형 및/또는 형광성 반응계내 하이브리드화에 의존하는 CVS 및 양수천자와 같은 전통적인 침입성 방법 또는 계수에 의존한 현재의 비침입성 방법에 의해 검출되지 않을 카피 수-중성 비정상인 UPD 질환을 검출할 수 있다. 이는, SNP-기반 방법이 유일하게 개체의 일배체형을 구별할 수 있지만 임상적으로 이용가능한 MPSS-기반 및 표적화된 방법은 비-다형성 유전자자리를 증폭시킴으로써 예를 들면, 목적한 염색체가 동일한 부모에서 기원하는지를 측정할 수 없기 때문이다. 이는, 프라더-윌리(Prader-Willi), 안젤만(Angelman), 및 벡크위드-와이드만 증후군(Beckwith-Wiedemann syndrome)을 포함하는 이들 미세결실/미세중복 및 UPD 증후군이 일반적으로 산전에 진단되지 않으며, 흔히 출산 후 초기에 잘못 진단됨을 의미한다. 이는 치료학적 중재를 유의적으로 지연시킨다. 또한, 당해 방법은 SNP를 표적화하므로, 당해 방법은 또한 부모 일배체형 재작제를 촉진시켜, 개체의 질병-연결된 유전자자리의 태아 유전의 검출을 허용한다(참조: Kitzman JO, Snyder MW, Ventura M, 등 Noninvasive whole-genome sequencing of a human fetus. Sci Transl Med 2012;4:137ra76, 이의 전문은 본원에 참조로 포함된다).
본원에 나타낸 결과는 산전 이수성을 확인하기 위한 당해 방법의 확장된 영역을 입증한다. 구체적으로, 19,488개의 SNP를 증폭시키고 서열분석함으로써, 당해 방법은 염색체 13, 18, 21, X, 및 Y에서 카피 수를 검출할 수 있으며, 어떠한 다른 임상적으로 이용가능한 비-침입성 방법에 의해 검출되지 않는 삼배체 및 UPD와 같은 다른 염색체 비정상을 검출하기 위해 유일하게 예측된다. 증가된 임상 범위 및 강력한 단순하고-특이적인 계산된 정밀도는, 당해 방법이 태아 염색체 이수성을 검출하기 위한 침입성 시험에 대한 가치있는 부가물을 제공할 수 있음을 제안한다.
본원에 인용된 모든 특허, 특허원, 및 발표된 참조문헌은, 이의 전문이 참조로 본원에 포함되어 있다. 본원의 방법이 이의 특정한 구현예와 관련하여 기술되어 있지만, 이는 추가로 변형될 수 있음이 이해될 것이다. 또한, 본 출원은 본원의 방법이 속한 분야에 공지되거나 통상의 실시 내에 있고, 첨부된 특허청구범위의 영역에 속하는 것으로서 본 기재내용으로부터 벗어남을 포함하는, 어떠한 변화, 사용, 또는 본원의 방법의 조정을 포함하는 것으로 의도된다. 예를 들면, DNA에 대한 본원에 개시된 방법 중 어느 것도 RNA를 DNA로 전환시키는 역 전사 단계를 포함함으로써 RNA에 대해 용이하게 조정될 수 있다. 설명을 위해 다형성 유전자자리를 사용하는 예는 경우에 따라 비 다형성 유전자자리의 증폭을 위해 용이하게 조정될 수 있다.
<110> Natera, Inc. <120> Highly Multiplex PCR Methods and Compositions <130> IPA141367-US <150> US61/675,020 <151> 2012-07-24 <150> US13/683,604 <151> 2012-11-21 <160> 12 <170> KopatentIn 2.0 <210> 1 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 1 aactcacata gcacacgacg ctcttccgat cttgcaagca ca 42 <210> 2 <211> 39 <212> DNA <213> Synthetic construct <400> 2 tcctctgtga cacgacgctc ttccgatctc cctgctctt 39 <210> 3 <211> 40 <212> DNA <213> Synthetic construct <400> 3 tcctctctct acacgacgct cttccgatct cgggctgtca 40 <210> 4 <211> 42 <212> DNA <213> Synthetic construct <400> 4 tacatccttg agacacgacg ctcttccgat ctgctgtgca gt 42 <210> 5 <211> 42 <212> DNA <213> Synthetic construct <400> 5 tttgcttgag ctacacgacg ctcttccgat ctcgggagtt tc 42 <210> 6 <211> 42 <212> DNA <213> Synthetic construct <400> 6 gtcttatggt ggacacgacg ctcttccgat ctcaaagcca gt 42 <210> 7 <211> 50 <212> DNA <213> Synthetic construct <400> 7 aactcacata gctgatcggt acacgacgct cttccgatct tgcaagcaca 50 <210> 8 <211> 47 <212> DNA <213> Synthetic construct <400> 8 tcctctgtgt gatcggtaca cgacgctctt ccgatctccc tgctctt 47 <210> 9 <211> 48 <212> DNA <213> Synthetic construct <400> 9 tcctctctct tgatcggtac acgacgctct tccgatctcg ggctgtca 48 <210> 10 <211> 50 <212> DNA <213> Synthetic construct <400> 10 tacatccttg agtgatcggt acacgacgct cttccgatct gctgtgcagt 50 <210> 11 <211> 50 <212> DNA <213> Synthetic construct <400> 11 tttgcttgag cttgatcggt acacgacgct cttccgatct cgggagtttc 50 <210> 12 <211> 50 <212> DNA <213> Synthetic construct <400> 12 gtcttatggt ggtgatcggt acacgacgct cttccgatct caaagccagt 50

Claims (102)

  1. (a) 표적 유전자자리를 포함하는 핵산 시료를 적어도 1,000개의 상이한 프라이머 쌍을 포함하는 시험 프라이머의 라이브러리와 접촉시켜 하나의 반응 볼륨에 반응 혼합물을 생산하는 단계로서, 여기서 각각의 프라이머 쌍은 동일한 표적 유전자자리에 하이브리드화하는 전방 시험 프라이머 및 역방 시험 프라이머를 포함하고, 프라이머는 분자 역 프로브 (molecular inversion probe: MIP)를 포함하지 않는, 단계; 및
    (b) 상기 반응 혼합물을 폴리머라제 연쇄 반응 (PCR) 조건에 적용시켜 표적 앰플리콘을 포함하는 증폭된 생성물을 생산하는 단계로서, 여기서 각각의 시험 프라이머의 농도는 10 nM 미만이고; 반응 조건의 어닐링 단계의 길이는 10분 초과이며; 적어도 1,000개의 상이한 표적 유전자자리가 동시에 증폭되고; (i) 증폭된 생성물의 20% 미만이 시험 프라이머 이량체이고, (ii) 증폭된 생성물의 적어도 80%가 표적 앰플리콘이며, (iii) 표적 유전자자리의 적어도 80%가 증폭되는, 단계; 및
    (c) 증폭된 생성물을 서열분석하는 단계
    를 포함하는, 핵산 시료 중의 표적 유전자자리를 증폭시키는 방법.
  2. 제1항에 있어서, 적어도 5,000개의 상이한 표적 유전자자리가 증폭되는, 방법.
  3. 제1항에 있어서, 표적 앰플리콘의 길이가 100개 미만의 뉴클레오타이드인, 방법.
  4. 제1항에 있어서, 시험 프라이머가, 적어도 부분적으로 후보물 프라이머가 프라이머 이량체를 형성하는 능력을 기반으로 후보물 프라이머의 라이브러리 중에서 선택되는, 방법.
  5. 제1항에 있어서, 시료가 태아를 임신한 모친으로부터의 모계 DNA 및 태아 DNA를 포함하고, 상기 방법이 서열분석 데이터로부터 태아 염색체 이상의 존재 또는 부재를 측정하는 단계를 포함하는, 방법.
  6. 제1항에 있어서, 표적 유전자자리가 사람 게놈에 존재하거나, 표적 유전자자리가 사람의 단일의 뉴클레오타이드 다형성을 포함하는, 방법.
  7. 제1항에 있어서, 핵산 시료가 종양, 이식편 또는 태아로부터의 DNA를 포함하는, 방법.
  8. 제1항에 있어서, 시료가 단일 세포로부터의 DNA를 포함하는, 방법.
  9. 제1항에 있어서, 시험 프라이머의 라이브러리가 후보물 라이브러리의 라이브러리로부터 하기 단계를 포함하는 방법에 의해 선택되는 방법:
    (a) 컴퓨터 상에서 상기 라이브러리로부터 2개의 후보물 프라이머의 가능한 조합 중의 적어도 90%에 대한 비바람직성(undesirability) 점수를 계산하는 단계로서, 여기서 각각의 비바람직성 점수는 적어도 부분적으로 상기 2개의 후보물 프라이머 사이의 이량체 형성의 가능성을 기반으로 하는, 단계;
    (b) 상기 후보물 프라이머의 라이브러리로부터 제1의 최소 한계를 초과하는 비바람직성 점수를 지닌 2개의 후보물 프라이머의 조합의 최대 수의 일부인 후보물 프라이머를 제거하는 단계;
    (c) 단계 (b)에서 제거된 후보물 프라이머가 프라이머 쌍의 구성원인 경우, 상기 후보물 프라이머의 라이브러리로부터 상기 프라이머 쌍의 다른 구성원을 제거하는 단계; 및
    (d) 임의로 단계 (b) 및 (c)를 반복함으로써 시험 프라이머의 라이브러리를 선택하는 단계.
  10. 제9항에 있어서,
    (i) 단계 (b)에서 사용된 제1의 최소 한계를 보다 낮은 제2의 최소 한계로 감소시키고, 라이브러리 중에 남아있는 후보물 프라이머 조합에 대한 비바람직성 점수가 모두 상기 제2의 최소 한계와 동일하거나 상기 제2의 최소 한계 미만일 때까지, 또는 라이브러리 중에 남아있는 후보물 프라이머의 수가 바람직한 수로 감소될 때까지 단계 (b) 및 (c)를 반복함으로써 라이브러리 중에 남아있는 후보물 프라이머의 수를 추가로 감소시키는 단계; 또는
    (ii) 단계 (b)에서 사용된 제1의 최소 한계를 보다 높은 제2의 최소 한계로 증가시키고, 라이브러리 중에 남아있는 상기 후보물 프라이머 조합에 대한 비바람직성 점수가 모두 상기 제2의 최소 한계와 동일하거나 상기 제2의 최소 한계 미만일 때까지, 또는 라이브러리 중에 남아있는 후보물 프라이머의 수가 바람직한 수로 감소될 때까지 단계 (b) 및 (c)를 반복함으로써 라이브러리 중에 남아있는 후보물 프라이머의 수를 증가시키는 단계
    를 포함하는, 방법.
  11. 제9항에 있어서, 단계 (b) 전에, 또 다른 프라이머 쌍에 의해 생성된 표적 앰플리콘과 겹치는 표적 앰플리콘을 생성하는 라이브러리로부터 프라이머 쌍을 제거하는 단계를 추가로 포함하는, 방법.
  12. 제9항에 있어서, 비바람직성 점수가 적어도 부분적으로 표적 유전자자리의 이형접합성 비율, 표적 유전자자리에서 다형성 또는 돌연변이와 관련된 질병 유병률, 표적 유전자자리에서 다형성 또는 돌연변이와 관련된 질병 침투능, 표적 유전자자리에 대한 상기 후보물 프라이머의 특이성, 후보물 프라이머의 크기, 표적 앰플리콘의 용융 온도, 표적 앰플리콘의 구아닌-시토신 (GC) 함량, 표적 앰플리콘의 증폭 효율, 및 표적 앰플리콘의 크기로 이루어진 그룹 중에서 선택된 하나 이상의 매개변수를 기반으로 하는, 방법.
  13. 제9항에 있어서, 적어도 1,000개의 상이한 시험 프라이머의 라이브러리를 선택하는 단계 및 적어도 1,000개의 상기 선택된 시험 프라이머를 사용하여 적어도 1,000개의 상이한 표적 유전자자리를 동시에 증폭시키는 단계를 포함하는, 방법.
  14. 제1항에 있어서, 프라이머 쌍의 프라이머의 용융 온도가 55 내지 65℃인, 방법.
  15. 삭제
  16. 제1항에 있어서, 프라이머 쌍의 프라이머의 용융 온도가 57 내지 60.5℃인, 방법.
  17. 제1항에 있어서, PCR이 내포된 (nested) PCR인, 방법.
  18. 제1항에 있어서, 표적 앰플리콘의 길이의 범위가 50 내지 100개 뉴클레오타이드인, 방법.
  19. 제1항에 있어서, 프라이머 쌍이 염색체 X, Y, 13, 18 및 21 상의 잠재적 이형접합성 SNP 유전자자리를 증폭시키도록 고안되고, 이들 검정은 모계 혈장 시료로부터 수득된 cfDNA를 증폭시키기 위한 단일 반응에 사용되는, 방법.
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 삭제
  36. 삭제
  37. 삭제
  38. 삭제
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
  53. 삭제
  54. 삭제
  55. 삭제
  56. 삭제
  57. 삭제
  58. 삭제
  59. 삭제
  60. 삭제
  61. 삭제
  62. 삭제
  63. 삭제
  64. 삭제
  65. 삭제
  66. 삭제
  67. 삭제
  68. 삭제
  69. 삭제
  70. 삭제
  71. 삭제
  72. 삭제
  73. 삭제
  74. 삭제
  75. 삭제
  76. 삭제
  77. 삭제
  78. 삭제
  79. 삭제
  80. 삭제
  81. 삭제
  82. 삭제
  83. 삭제
  84. 삭제
  85. 삭제
  86. 삭제
  87. 삭제
  88. 삭제
  89. 삭제
  90. 삭제
  91. 삭제
  92. 삭제
  93. 삭제
  94. 삭제
  95. 삭제
  96. 삭제
  97. 삭제
  98. 삭제
  99. 삭제
  100. 삭제
  101. 삭제
  102. 삭제
KR1020157004509A 2012-07-24 2012-11-21 고도의 다중 pcr 방법 및 조성물 KR101890466B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261675020P 2012-07-24 2012-07-24
US61/675,020 2012-07-24
PCT/US2012/066339 WO2014018080A1 (en) 2012-07-24 2012-11-21 Highly multiplex pcr methods and compositions
US13/683,604 2012-11-21
US13/683,604 US20130123120A1 (en) 2010-05-18 2012-11-21 Highly Multiplex PCR Methods and Compositions

Publications (2)

Publication Number Publication Date
KR20150038216A KR20150038216A (ko) 2015-04-08
KR101890466B1 true KR101890466B1 (ko) 2018-08-21

Family

ID=49997695

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157004509A KR101890466B1 (ko) 2012-07-24 2012-11-21 고도의 다중 pcr 방법 및 조성물

Country Status (10)

Country Link
JP (10) JP6392222B2 (ko)
KR (1) KR101890466B1 (ko)
CN (1) CN104685064A (ko)
AU (1) AU2012385961B9 (ko)
CA (1) CA2877493C (ko)
HK (1) HK1211058A1 (ko)
IL (1) IL236435A0 (ko)
RU (1) RU2650790C2 (ko)
SG (1) SG11201408813VA (ko)
WO (1) WO2014018080A1 (ko)

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10083273B2 (en) 2005-07-29 2018-09-25 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US10081839B2 (en) 2005-07-29 2018-09-25 Natera, Inc System and method for cleaning noisy genetic data and determining chromosome copy number
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
AU2009279734A1 (en) 2008-08-04 2010-02-11 Natera, Inc. Methods for allele calling and ploidy calling
US10017812B2 (en) 2010-05-18 2018-07-10 Natera, Inc. Methods for non-invasive prenatal ploidy calling
ES2640776T3 (es) 2009-09-30 2017-11-06 Natera, Inc. Métodos para denominar de forma no invasiva ploidía prenatal
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
WO2011146632A1 (en) 2010-05-18 2011-11-24 Gene Security Network Inc. Methods for non-invasive prenatal ploidy calling
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
CA2821906C (en) 2010-12-22 2020-08-25 Natera, Inc. Methods for non-invasive prenatal paternity testing
CN103717751A (zh) 2011-05-19 2014-04-09 塞昆纳姆股份有限公司 用于多重核酸鉴定的产品和方法
CA2877493C (en) * 2012-07-24 2020-08-25 Natera, Inc. Highly multiplex pcr methods and compositions
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
US9499870B2 (en) 2013-09-27 2016-11-22 Natera, Inc. Cell free DNA diagnostic testing standards
US10262755B2 (en) 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
WO2015164432A1 (en) * 2014-04-21 2015-10-29 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
EP3134541B1 (en) * 2014-04-21 2020-08-19 Natera, Inc. Detecting copy number variations (cnv) of chromosomal segments in cancer
EP3224376B2 (en) * 2014-11-28 2023-04-26 uniQure IP B.V. Dna impurities in a composition comprising a parvoviral virion
US20170349926A1 (en) * 2014-12-22 2017-12-07 DNAe Group Holdings LTD. Bubble primers
US10233489B2 (en) * 2015-04-24 2019-03-19 Agena Bioscience, Inc. Multiplexed method for the identification and quantitation of minor alleles and polymorphisms
EP3294906A1 (en) * 2015-05-11 2018-03-21 Natera, Inc. Methods and compositions for determining ploidy
GB2539675B (en) * 2015-06-23 2017-11-22 Cs Genetics Ltd Libraries of multimeric barcoding reagents and kits thereof for labelling nucleic acids for sequencing
KR20180043369A (ko) 2015-09-11 2018-04-27 더 제너럴 하스피탈 코포레이션 뉴클레아제 dsb의 완전한 호출 및 시퀀싱(find-seq)
EP3420100B1 (en) 2016-02-25 2021-04-07 H. Hoffnabb-La Roche Ag Elimination of primer-primer interactions during primer extension
US20190106751A1 (en) * 2016-04-15 2019-04-11 Natera, Inc. Methods for lung cancer detection
EP3827812A1 (en) * 2016-07-29 2021-06-02 The Regents of the University of California Adeno-associated virus virions with variant capsid and methods of use thereof
CN109790587B (zh) * 2016-09-30 2023-06-13 富士胶片株式会社 从100pg以下的人类基因组DNA判别其来源的方法、识别个人的方法及分析造血干细胞的植活程度的方法
US11485996B2 (en) 2016-10-04 2022-11-01 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
AU2018225348A1 (en) 2017-02-21 2019-07-18 Natera, Inc. Compositions, methods, and kits for isolating nucleic acids
WO2019010456A1 (en) * 2017-07-07 2019-01-10 Stephen Quake NON-INVASIVE PRENATAL DIAGNOSIS OF SINGLE GENE DISORDERS USING DIGITAL DROPLET PCR
KR101977976B1 (ko) * 2017-08-10 2019-05-14 주식회사 엔젠바이오 앰플리콘 기반 차세대 염기서열 분석기법에서 프라이머 서열을 제거하여 분석의 정확도를 높이는 방법
US11286468B2 (en) 2017-08-23 2022-03-29 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases with altered PAM specificity
EP3694993A4 (en) * 2017-10-11 2021-10-13 The General Hospital Corporation METHOD OF DETECTING A SITE-SPECIFIC AND UNDESIRED GENOMIC DESAMINATION INDUCED BY BASE EDITING TECHNOLOGIES
CN108334745B (zh) * 2018-03-19 2022-02-08 青岛理工大学 一种聚合酶链反应过程非线性混杂系统建模方法
AU2019256287A1 (en) 2018-04-17 2020-11-12 The General Hospital Corporation Sensitive in vitro assays for substrate preferences and sites of nucleic acid binding, modifying, and cleaving agents
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
KR20210044249A (ko) 2018-08-08 2021-04-22 이니바타 엘티디. 가변성 복제 다중 pcr
CN112080558B (zh) * 2019-06-13 2024-03-12 杭州贝瑞和康基因诊断技术有限公司 同时检测hba1/2和hbb基因突变的试剂盒和方法
EP4004927A4 (en) * 2019-07-22 2023-08-02 Mission Bio, Inc. USING MACHINE LEARNING TO OPTIMIZE ASSAYS FOR UNICELLULAR TARGETED DNA SEQUENCING
EP4077719A1 (en) * 2019-12-16 2022-10-26 Agilent Technologies, Inc. Genomic scarring assays and related methods
JP7320468B2 (ja) 2020-03-10 2023-08-03 Ntn株式会社 操舵機能付ハブユニットおよびこれを備えた車両
CN113979895B (zh) * 2020-07-08 2023-03-24 中国科学技术大学 一种精确序列可控的自降解聚合物及其制备方法和应用
WO2022076574A1 (en) * 2020-10-08 2022-04-14 Claret Bioscience, Llc Methods and compositions for analyzing nucleic acid
EP4292825A1 (en) 2021-03-18 2023-12-20 Canon Kabushiki Kaisha Liquid injection method, liquid injection device, and liquid cartridge
CA3230790A1 (en) 2021-09-01 2023-03-09 Natera, Inc. Methods for non-invasive prenatal testing

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008125471A (ja) 2006-11-22 2008-06-05 Olympus Corp マルチプレックスな核酸増幅方法
US20090023190A1 (en) 2007-06-20 2009-01-22 Kai Qin Lao Sequence amplification with loopable primers
WO2009086608A2 (en) 2007-12-26 2009-07-16 Eppendorf Array Technologies S.A. Method and kit to perform a pcr amplification and micro- array detection in the same medium and/or same chamber

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US300235A (en) 1884-06-10 Chaeles b
US6479235B1 (en) * 1994-09-30 2002-11-12 Promega Corporation Multiplex amplification of short tandem repeat loci
US6251604B1 (en) * 1999-08-13 2001-06-26 Genopsys, Inc. Random mutagenesis and amplification of nucleic acid
AU2001238068A1 (en) * 2000-02-07 2001-08-14 Illumina, Inc. Nucleic acid detection methods using universal priming
US7582420B2 (en) * 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
CA2409774A1 (en) * 2000-05-23 2001-11-29 Variagenics, Inc. Methods for genetic analysis of dna to detect sequence variances
US6977162B2 (en) 2002-03-01 2005-12-20 Ravgen, Inc. Rapid analysis of variations in a genome
EP2159285B1 (en) * 2003-01-29 2012-09-26 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
CN1496413A (zh) 2003-05-09 2004-05-12 清华大学 用于多重pcr条件优化的方法和组分
EP1706488B1 (en) * 2004-01-12 2013-07-24 Roche NimbleGen, Inc. Method of performing pcr amplification on a microarray
US7618777B2 (en) * 2005-03-16 2009-11-17 Agilent Technologies, Inc. Composition and method for array hybridization
US8515679B2 (en) 2005-12-06 2013-08-20 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US8532930B2 (en) 2005-11-26 2013-09-10 Natera, Inc. Method for determining the number of copies of a chromosome in the genome of a target individual using genetic data from genetically related individuals
ES2739483T3 (es) 2006-02-02 2020-01-31 Univ Leland Stanford Junior Detección genética fetal no invasiva mediante análisis digital
WO2007111937A1 (en) * 2006-03-23 2007-10-04 Applera Corporation Directed enrichment of genomic dna for high-throughput sequencing
WO2008088236A1 (ru) * 2007-01-17 2008-07-24 Uchrezhdenie Rossiiskoi Akademii Nauk Institut Molekulyarnoi Biologii Im. V.A. Engeldardta (Imb Ran ) Способ генетической идентификации личности на основе анализа однонуклеотидного полиморфизма генома человека с использованием олигонуклеотидного биологического микрочипа (биочипа)
EP2121983A2 (en) * 2007-02-02 2009-11-25 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
WO2009032779A2 (en) * 2007-08-29 2009-03-12 Sequenom, Inc. Methods and compositions for the size-specific seperation of nucleic acid from a sample
FR2925480B1 (fr) * 2007-12-21 2011-07-01 Gervais Danone Sa Procede d'enrichissement d'une eau en oxygene par voie electrolytique, eau ou boisson enrichie en oxygene et utilisations
WO2009105531A1 (en) 2008-02-19 2009-08-27 Gene Security Network, Inc. Methods for cell genotyping
US20110092763A1 (en) 2008-05-27 2011-04-21 Gene Security Network, Inc. Methods for Embryo Characterization and Comparison
AU2009279734A1 (en) 2008-08-04 2010-02-11 Natera, Inc. Methods for allele calling and ploidy calling
CA3069082C (en) 2008-09-20 2022-03-22 The Board Of Trustees Of The Leland Stanford Junior University Noninvasive diagnosis of fetal aneuploidy by sequencing
US10017812B2 (en) 2010-05-18 2018-07-10 Natera, Inc. Methods for non-invasive prenatal ploidy calling
ES2640776T3 (es) 2009-09-30 2017-11-06 Natera, Inc. Métodos para denominar de forma no invasiva ploidía prenatal
ES2821500T3 (es) * 2009-11-06 2021-04-26 Univ Leland Stanford Junior Diagnóstico no invasivo del rechazo de injertos en pacientes con trasplante de órganos
US20110312503A1 (en) * 2010-01-23 2011-12-22 Artemis Health, Inc. Methods of fetal abnormality detection
US8574832B2 (en) * 2010-02-03 2013-11-05 Massachusetts Institute Of Technology Methods for preparing sequencing libraries
WO2013052557A2 (en) 2011-10-03 2013-04-11 Natera, Inc. Methods for preimplantation genetic diagnosis by sequencing
WO2011146632A1 (en) 2010-05-18 2011-11-24 Gene Security Network Inc. Methods for non-invasive prenatal ploidy calling
EP2426217A1 (en) * 2010-09-03 2012-03-07 Centre National de la Recherche Scientifique (CNRS) Analytical methods for cell free nucleic acids and applications
US8877442B2 (en) 2010-12-07 2014-11-04 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive determination of fetal inheritance of parental haplotypes at the genome-wide scale
EP3564392B1 (en) * 2010-12-17 2021-11-24 Life Technologies Corporation Methods for nucleic acid amplification
CA2821906C (en) 2010-12-22 2020-08-25 Natera, Inc. Methods for non-invasive prenatal paternity testing
KR20190002733A (ko) * 2010-12-30 2019-01-08 파운데이션 메디신 인코포레이티드 종양 샘플의 다유전자 분석의 최적화
US20120190020A1 (en) 2011-01-25 2012-07-26 Aria Diagnostics, Inc. Detection of genetic abnormalities
CA2877493C (en) 2012-07-24 2020-08-25 Natera, Inc. Highly multiplex pcr methods and compositions

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008125471A (ja) 2006-11-22 2008-06-05 Olympus Corp マルチプレックスな核酸増幅方法
US20090023190A1 (en) 2007-06-20 2009-01-22 Kai Qin Lao Sequence amplification with loopable primers
WO2009086608A2 (en) 2007-12-26 2009-07-16 Eppendorf Array Technologies S.A. Method and kit to perform a pcr amplification and micro- array detection in the same medium and/or same chamber

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
Bioinformatics (2005) 21(8):1701-1702
Biotechniques (2009) 46(7):511-517
BMC Bioinformatics (2010) 11:143
BMC Genomics (2005) 6:102
BMC Medical Genomics (2008) 1:5
Nature Biotechnology (2003) 21(6):673-678
Nucleic Acids Research (2007) 35(7):e47
PNAS (2011) 108(16):6549-6554

Also Published As

Publication number Publication date
JP7343563B2 (ja) 2023-09-12
JP6997814B2 (ja) 2022-02-10
RU2650790C2 (ru) 2018-04-17
AU2012385961B9 (en) 2017-05-18
AU2012385961A1 (en) 2015-02-12
JP6392222B2 (ja) 2018-09-19
SG11201408813VA (en) 2015-02-27
JP2015526073A (ja) 2015-09-10
JP2020058388A (ja) 2020-04-16
JP2022037145A (ja) 2022-03-08
JP6997815B2 (ja) 2022-02-10
CA2877493C (en) 2020-08-25
AU2012385961B2 (en) 2017-04-13
HK1211058A1 (en) 2016-05-13
JP2018183189A (ja) 2018-11-22
IL236435A0 (en) 2015-02-26
JP2022027975A (ja) 2022-02-14
CN104685064A (zh) 2015-06-03
JP2022051949A (ja) 2022-04-01
CA2877493A1 (en) 2014-01-30
JP2020054402A (ja) 2020-04-09
RU2014152883A (ru) 2016-09-10
JP2020054401A (ja) 2020-04-09
JP6997813B2 (ja) 2022-02-10
JP6916153B2 (ja) 2021-08-11
JP2020054400A (ja) 2020-04-09
JP7348330B2 (ja) 2023-09-20
WO2014018080A1 (en) 2014-01-30
JP2022027971A (ja) 2022-02-14
KR20150038216A (ko) 2015-04-08
JP7027468B2 (ja) 2022-03-01

Similar Documents

Publication Publication Date Title
US11390916B2 (en) Methods for simultaneous amplification of target loci
KR101890466B1 (ko) 고도의 다중 pcr 방법 및 조성물
US10731220B2 (en) Methods for simultaneous amplification of target loci
US11312996B2 (en) Methods for simultaneous amplification of target loci
US20170051355A1 (en) Highly multiplex pcr methods and compositions
US20220307086A1 (en) Methods for simultaneous amplification of target loci
EP2847347B1 (en) Highly multiplex pcr methods and compositions
US20230383348A1 (en) Methods for simultaneous amplification of target loci

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant