KR20150070111A - 염색체 이상의 검출 방법 - Google Patents

염색체 이상의 검출 방법 Download PDF

Info

Publication number
KR20150070111A
KR20150070111A KR1020157007576A KR20157007576A KR20150070111A KR 20150070111 A KR20150070111 A KR 20150070111A KR 1020157007576 A KR1020157007576 A KR 1020157007576A KR 20157007576 A KR20157007576 A KR 20157007576A KR 20150070111 A KR20150070111 A KR 20150070111A
Authority
KR
South Korea
Prior art keywords
chromosome
score
sequence
nucleic acid
matching
Prior art date
Application number
KR1020157007576A
Other languages
English (en)
Inventor
찰스 에드워드 셀커크 로버츠
로버트 올드
프란세스코 크레아
Original Assignee
프리마이타 헬스 엘티디
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프리마이타 헬스 엘티디 filed Critical 프리마이타 헬스 엘티디
Publication of KR20150070111A publication Critical patent/KR20150070111A/ko

Links

Images

Classifications

    • G06F19/22
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6879Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for sex determination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/16Assays for determining copy number or wherein the copy number is of special importance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2545/00Reactions characterised by their quantitative nature
    • C12Q2545/10Reactions characterised by their quantitative nature the purpose being quantitative analysis
    • C12Q2545/101Reactions characterised by their quantitative nature the purpose being quantitative analysis with an internal standard/control
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

본 발명은 염색체 이상의 검출 방법에 관한 것이고, 특히 본 발명은 태아 임신 동안 모체 혈액으로부터 얻어진 혈장 샘플 내의 세포 유리 DNA 분자의 서열 분석을 포함하는, 태아 염색체 이상, 예컨대 21번 삼염색체증 (다운 증후군)의 진단에 관한 것이다.

Description

염색체 이상의 검출 방법 {METHOD OF DETECTING CHROMOSOMAL ABNORMALITIES}
본 발명은 염색체 이상의 검출 방법에 관한 것이고, 특히 본 발명은 태아 임신 동안 모체 혈액으로부터 얻어진 혈장 샘플 내의 세포 유리 DNA 분자의 서열 분석을 포함하는, 태아 염색체 이상, 예컨대 21번 삼염색체증 (다운 증후군)의 진단에 관한 것이다.
다운 증후군은 비교적 흔한 유전 질환으로서, 약 800명의 정상 출산 중 1명에서 발생한다. 상기 증후군은 과잉의 전체 21번 염색체 (21번 삼염색체증, T21), 또는 보다 덜 통상적으로는 그 염색체의 과잉의 실질적인 부분의 존재에 의해 야기된다. 다른 상염색체를 수반한 삼염색체증 (즉, T13 또는 T18)도 또한 정상 출산에서 일어나지만 T21보다는 드물다.
일반적으로, 과잉 염색체에 의해 또는 염색체의 결핍 때문에 초래되는 태아 이수성이 존재하는 병태는 검출가능한 모체의 세포 유리 혈장 DNA 내의 태아 DNA 분자 집단의 불균형을 생성한다.
태아 염색체 이상의 산전 진단을 위한 신뢰가능한 방법의 개발은 생식 치료에서 장기 목표였다 (Puszyk et al., 2008, Prenat Diagn 28, 1-6). 양수천자 또는 융모막 융모 샘플 채취에 의한 태아 물질 확보를 기초로 한 방법은 침습적이고, 심지어 숙련된 임상의에 의한 경우에도 임신에 대해 무시할 수 없는 위험을 야기할 수 있다. 현재 실무에서, 이러한 침습적 진단 방법은 대체로 모체 연령 때문에 또는 생화학적 시험 또는 초음파 검사를 통한 사전 스크리닝을 통해 다운 증후군 태아 임신 가능성이 증가한 표지가 있을 경우에 사용된다. 신뢰할 수 있고, 임신 초기 3개월에 적용가능하고, 결과를 신속하게 확보하고, 비용이 저렴한 비-침습적 산전 진단 (NIPD) 방법이 필요하다.
상기 목표 달성을 향한 진전은 임신 여성의 혈장 내의 세포 유리 DNA가 태아 기원의 성분을 포함한다는 발견을 이용함으로써 이루어졌다 (Lo et al., 1997, Lancet 350, 485-487). 세포 유리 혈장 DNA (이하에서 '혈장 DNA'로 언급함)는 대개 5%-20%가 태아 기원의 것이고 나머지는 모체의 것인 짧은 DNA 분자 (80-200 bp)로 주로 이루어진다 (Birch et al., 2005, Clin Chem 51, 312-320; Fan et al., 2010, Clin Chem 56, 1279-1286). 혈장 DNA 분자의 세포 기원, 및 이들이 혈액 내로 들어가고 이후에 순환계로부터 소실되는 메카니즘은 잘 이해되지 않고 있다. 그러나, 태아 성분은 주로 태반 내의 아폽토시스성 세포 사멸의 결과임이 널리 알려져 있다 (Bianchi, 2004, Placenta 25, S93-S101). 태아 기원의 혈장 DNA 분자의 비율은 경우에 따라 다양하고, 실질적으로 개체 차이가 존재한다. 개체 차이에 추가로, 임신 연령이 증가함에 따라 태아 성분이 증가한다는 일반적인 경향이 추가된다 (Birch et al., 2005, 상기 문헌; Galbiati et al., 2005, Hum Genet 117, 243-248). 태아 성분은 임신 초기에, 대개 제8주만큼 초기에 쉽게 검출가능하다.
원칙적으로, 혈장 내의 세포 유리 태아 DNA가 모체 성분에 의해 희석되지 않으면, T21의 특징을 일으키는 과잉 염색체는 정상 임신에 비해 그 염색체로부터 유래된 50% 초과의 DNA 분자를 생성할 것으로 예상된다. 그러나, 태아 기원의 세포 유리 혈장 DNA의 성분에 대한 10%의 전형적인 값을 고려할 때, 발생하는 불균형은 단지 5%, 또는 정상 임신에 대한 1.00에 비해 1.05의 값으로의 21번 염색체-유래 단편의 수의 상대적인 증가인 것으로 예상된다. 혈장 DNA의 태아 성분이 10% 값보다 더 작거나 더 큰 상황에서, 모체 혈장 내의 분자들의 집단 내의 21번 염색체-유래 분자의 수의 불균형은 그에 상응하여 더 작거나 더 클 것이다.
따라서, T21에 대한 진단 시험의 기초는 모체 혈장으로부터 DNA 분자에 대한 뉴클레오티드 서열 데이터를 얻는 것이다 ('DNA 서열분석'). 일단 부분적 또는 완전한 뉴클레오티드 서열 정보를 개별 DNA 분자로부터 얻은 후, 가장 간단하게는 참조 인간 게놈(들)과 비교함으로써 개별 분자들을 그들이 기원하는 염색체에 배정하기 위해 생물 정보공학 기술을 적용해야 한다. T21을 갖는 태아의 임신의 경우에, 분자들의 집단 내의 경미한 불균형은 정상 임신으로부터 예상되는 것에 비해 21번 염색체-유래 분자의 수의 과잉으로서 검출가능하다.
21번 염색체가 인간 게놈의 단지 작은 비율 (2% 미만)만을 구성한다는 사실에 비추어, 신뢰가능한 진단을 위해 그 염색체로부터 충분히 많은 수를 수집하기 위해서, 모체 혈장으로부터 매우 많은 DNA 분자를 무작위로 샘플링하고, 서열분석하고, 생물 정보공학에 의해 특정한 염색체에 배정해야 한다. (1) 그로부터 유래된 뉴클레오티드 서열 정보의 특징을 규정한 후, (2) 염색체 위치에 신뢰할 수 있게 배정하기 위해 요구되는 혈장 DNA 분자의 총수는 모든 또는 대부분의 태아 게놈을 샘플링하기 위해 요구된 것보다 더 작지만, 적어도 수십만 개의 분자이다. 요구되는 최소의 수는 모체의 세포 유리 혈장 DNA 분자들의 집단의 태아 성분을 이루는 혈장 DNA의 비율의 함수이다. 대개, 그 수는 1백만 내지 수백만 개의 분자이다.
특정한 염색체 위치로부터의 DNA 분자를 계수할 때 요구되는 높은 정량적 정확성 때문에 상기 방법의 적용에 대한 도전이 작지 않다. 또한, 모체 혈장으로부터의 DNA는, 태아 성분이 작은 부분을 이루는 게놈의 혼합물이다. 상기 정량적 기술 문제는 DNA 샘플 내의 특정 유전자좌에서 돌연변이의 확인과는 특성이 상이하다.
충분히 많은 수의 혈장 DNA에 대해서 일부 뉴클레오티드 서열 데이터를 얻을 수 있고, 충분히 많은 수를 그의 염색체 기원에 배정하기 위해 생물 정보공학 방법을 신뢰가능하게 적용할 수 있음을 고려할 때, 통계적 신뢰성을 보유하면서 혈장 DNA 분자의 집단 내의 염색체 불균형의 존재 또는 부재를 결정하기 위해 통계적 방법을 적용할 수 있다.
모체 혈장으로부터의 DNA 단편의 무작위 샘플이지만 완전한 게놈의 일부만을 구성하는 샘플을 서열분석한다는 상기 아이디어는 문헌 [Fan et al., 2008, Proc Natl Acad Sci U S A 105, 16266-16271] 및 [Chiu et al., 2008, Proc Natl Acad Sci U S A 105, 20458-20463]에 기재된 NIPD 방법의 기초이다.
본 기술분야의 이전의 진단 방법에서는 그의 염색체 기원에 배정하기에 충분한 길이의 서열을 얻기 위해, 비교적 오류가 없는 고품질 서열 데이터를 생성하는 대규모 병렬형 DNA 서열분석 기술을 이용하였다. 상기 목적을 위해 대규모 병렬형 서열분석 (차세대 서열분석 또는 제2 세대 서열분석으로도 알려짐)을 이용하는, 현재까지 알려진 이들 방법의 유의한 단점은, 수행되는 서열분석이 시간이 많이 소요되고 비싼 생물 정보공학을 필요로 하는 아주 큰 데이터를 생성하는 풀-서비스 게놈 서열분석기 - 주로 일루미나(Illumina) HiSeq -에서 고품질로 이루어진다는 점이다. 실행 시간 및 분석 과정은 전체적으로 수 주가 소요될 수 있다. 추가의 단점은 이들 장치의 자본 지출이 크고 (현재 50만 달러 초과), 따라서 이에 대한 광범위한 접근이 제한된다는 점이다. 또한, 복합화 능력이 제한되고, 따라서 이들 고가 장비를 사용하기 힘들게 만들고, 많은 환자들에 대한 신속 처리량 진단에 대한 접근을 추가로 제한한다. 그러나, 이러한 단점들이 대규모 병렬형 서열분석의 개발의 개시를 막지 않을 정도로 비-침습적 산전 진단에 대한 임상적 필요성이 존재한다.
그러나, 특정 자동화 서열분석 장치는 대개 통상적인 게놈 서열분석을 위해 요구되는 것보다 실질적으로 덜 양호한 품질의 서열 데이터를 생성한다. 이렇게 생성된 서열 데이터는 빈번한 오류를 특징으로 한다. 이들 오류는 종류가 다양하지만, 가장 흔하게는 매우 빈번한 '삽입-결실(indel)'이고, 이것은 정확하지 않은 과잉 염기 (삽입) 또는 결실된 염기를 전달하는 서열분석 장치에 의해 야기되는 오류이다. 또한, 짧은 단독중합체 런(run) (즉, 몇 개의 동일한 염기의 런)을 효과적으로 서열분석하는 능력이 고유하게 존재하지 않는다. 또한, 서열분석 오류는 또한 염기가 부정확하게 배정되는 '미스매치'를 포함할 수 있다.
상기 '경제 등급' 서열분석은 몇몇 벤치톱형 고 처리량 서열분석기, 예컨대 이온 토렌트(Ion Torrent) 서열분석 플랫폼에 의해 저렴하고 신속하게 생산된 종류의 것이다. 상기 서열분석 플랫폼은 반도체 서열분석 기술 (Rothberg et al., 2011, Nature 475, 348-352)에 기반한 것이다. 뉴클레오티드가 폴리머라제-촉매 반응에서 성장하는 DNA 쇄 내로 포함될 때, 양성자가 방출된다. pH의 연관된 변화를 검출함으로써, 상기 기술은 뉴클레오티드가 첨가되는지 그렇지 않은지 여부를 검출한다. 반도체 칩을 4가지 DNA 뉴클레오티드 전구체 (dATP, dCTP, dGTP 또는 dTTP) 중 하나로 순차적으로 채운다. 뉴클레오티드가 성장하는 쇄 내로 포함되지 않으면 전압이 생성되지 않고, 2개의 뉴클레오티드가 첨가되면 전압 변화는 대략 두 배이다. 염기의 단독중합체 런을 서열분석하는 것은 단독중합체 길이가 증가함에 따라 문제가 된다. 삽입-결실 오류 (정확하지 않은 염기 삽입 또는 결실)가 빈번하고, 특히 단독중합체 런과 연관된다.
DNA 샘플을 서열분석할 수 있기 전에, 작업흐름은 특이적 어댑터 서열 부착, 및 에멀젼 PCR을 수반한다. 준비 시간은 대개 6시간 미만이고, 서열분석 실행 자체는 3시간 미만이다. 이온 토렌트 서열분석 플랫폼의 성능은 다른 고 처리량 벤치톱형 서열분석기와 함께 최근에 검토되었다 (Loman et al. 2012, Nature Biotechnology 30(5), 434-439; Liu et al. 2012, Journal of Biomedicine and Biotechnology 2012, 1-11; Quail et al. 2012, BMC Genomics, 13(341)). 이온 토렌트 장치에 의해 생성된 서열 데이터의 품질은 빈번한 삽입-결실 오류를 특징으로 하는 것으로 인식된다.
태아 이상 분야 내에서의 정확한 진단은 매우 중요하다. 따라서, 대개 특정 자동화 서열분석 장치에 의해 특징지워지는 매우 빈번한 삽입 또는 결실 (삽입-결실) 오류 및 잘못 처리된 짧은 단독중합체 런에 관대한 진단 방법이 절실하게 필요하다.
본 발명의 제1 측면에 따르면,
(a) 여성 대상체로부터 얻은 생물학적 샘플 내의 핵산 분자에 대한 서열 데이터를 얻는 단계;
(b) 서열 데이터 내의 각각의 핵산 서열과 참조 게놈의 특유한 부분에 상응하는 서열 사이의 매칭 분석을 수행하여, 각각의 매칭된 핵산이 참조 게놈 내의 특정한 염색체 또는 상기 염색체의 일부에 배정되도록 하고, 여기서 상기 매칭 분석은 참조 게놈 내의 염기에 상응하는 각각의 핵산 내의 각각의 염기에 대한 정확도 점수 및 임의의 삽입, 결실, 모호성 및/또는 치환에 대한 페널티부과 점수를 생성하여, 각각의 핵산에 대한 총 점수가 미리 결정된 점수 역치를 달성할 경우 매치가 배정되도록 하는 것인 단계; 및
(c) 각각의 하나 이상의 참조 염색체에 배정된 매칭 핵산의 총수에 대한, 표적 염색체에 배정된 매칭 핵산의 총수의 비를 측정하는 단계
를 포함하고, 여기서 정상 임신에서의 비와 비교할 때 측정된 비의 통계적으로 유의한 차이는 표적 염색체에서 태아 이상을 나타내는 것인,
여성 대상체로부터 얻은 생물학적 샘플에서 태아 염색체 이상을 검출하는 방법이 제공된다.
본 발명의 제2 측면에 따르면,
(a) 임신한 여성 대상체로부터 생물학적 샘플을 얻는 단계;
(b) 생물학적 샘플 내의 핵산 분자에 대한 서열 데이터를 얻는 단계;
(c) 서열 데이터 내의 각각의 핵산 서열과 참조 게놈의 특유한 부분에 상응하는 서열 사이의 매칭 분석을 수행하여, 각각의 매칭된 핵산이 참조 게놈 내의 특정한 염색체 또는 상기 염색체의 일부에 배정되도록 하고, 여기서 상기 매칭 분석은 참조 게놈 내의 염기에 상응하는 각각의 핵산 내의 각각의 염기에 대한 정확도 점수 및 임의의 삽입, 결실, 모호성 및/또는 치환에 대한 페널티부과 점수를 생성하여, 각각의 핵산에 대한 총 점수가 미리 결정된 점수 역치를 달성할 경우 매치가 배정되도록 하는 것인 단계; 및
(d) 각각의 하나 이상의 참조 염색체에 배정된 매칭 핵산의 총수에 대한, Y 염색체에 배정된 매칭 핵산의 총수의 비를 측정하는 단계
를 포함하고, 여기서 미리 결정된 비 초과의 매칭 Y 염색체 서열의 존재는 남성 태아의 존재를 나타내고, 미리 결정된 비 미만의 매칭 Y 염색체 서열의 존재는 여성 태아의 존재를 나타내는 것인,
임신한 여성 대상체 내의 태아의 성별을 예측하는 방법을 제공한다.
도 1: Prinseq 서열 중복 요약 통계
간명한 요약 통계를 생성할 때, 및 또한 중요하게는, 원 데이터가 아래 표에 제시된 샘플에 널리 존재하는 중복 서열의 수를 생성할 때 Prinseq의 사용의 예시.
Figure pct00001

도 2: 본 발명의 방법에 따른 27개 혈장 샘플의 분석. 도 2는 정상 임신으로부터의 혈장 샘플 (샘플 1-15) 및 21번 삼염색체증 임신으로부터의 혈장 샘플 (샘플 16-27)에 대한 Z 점수를 보여준다.
본 발명의 제1 측면에 따르면,
(a) 여성 대상체로부터 얻은 생물학적 샘플 내의 핵산 분자에 대한 서열 데이터를 얻는 단계;
(b) 서열 데이터 내의 각각의 핵산 서열과 참조 게놈의 특유한 부분에 상응하는 서열 사이의 매칭 분석을 수행하여, 각각의 매칭된 핵산이 참조 게놈 내의 특정한 염색체 또는 상기 염색체의 일부에 배정되도록 하고, 여기서 상기 매칭 분석은 참조 게놈 내의 염기에 상응하는 각각의 핵산 내의 각각의 염기에 대한 정확도 점수 및 임의의 삽입, 결실, 모호성 및/또는 치환에 대한 페널티부과 점수를 생성하여, 각각의 핵산에 대한 총 점수가 미리 결정된 점수 역치를 달성할 경우 매치가 배정되도록 하는 것인 단계; 및
(c) 각각의 하나 이상의 참조 염색체에 배정된 매칭 핵산의 총수에 대한, 표적 염색체에 배정된 매칭 핵산의 총수의 비를 측정하는 단계
를 포함하고, 여기서 정상 임신에서의 비와 비교할 때 측정된 비의 통계적으로 유의한 차이는 표적 염색체에서 태아 이상을 나타내는 것인,
여성 대상체로부터 얻은 생물학적 샘플에서 태아 염색체 이상을 검출하는 방법이 제공된다.
본 발명은 매우 빈번한 치환 및 삽입-결실 오류 및 잘못 처리된 짧은 단독중합체 런을 특이적으로 견디는 적절한 생물 정보공학 처리를 명시한다. 상기 생물 정보공학 처리는 적절하게 효율적인 방식으로, 즉 실제적으로 실행불가능한 큰 비율의 서열 데이터를 임의의 염색체에 매칭될 수 없는 것으로서 거부하거나 또는 서열을 부정확한 염색체 위치에 배정하지 않으면서 신뢰성을 조합하여 서열의 염색체에 대한 신뢰가능한 배정을 허용한다.
염색체 이상
본 발명이 그 검출시에 유용할 수 있는 적합한 염색체 이상의 예는 다음을 포함한다: 다운 증후군 (21번 삼염색체증), 에드워드(Edward) 증후군 (18번 삼염색체증), 파타우(Patau) 증후군 (13번 삼염색체증), 9번 삼염색체증, 워카니(Warkany) 증후군 (8번 삼염색체증), 묘안(Cat Eye) 증후군 (22번 염색체의 4 카피), 22번 삼염색체증, 및 16번 삼염색체증.
추가로 또는 대안적으로, 유전자, 염색체, 또는 염색체의 일부의 이상, 카피수의 검출은 다음을 포함하는 군으로부터 선택된 병태의 검출 및/또는 진단을 포함할 수 있다: 울프-허쉬호른(Wolf-Hirschhorn) 증후군 (4p-), 묘성(Cri du chat) 증후군 (5p-), 윌리암스-보이렌(Williams-Beuren) 증후군 (7-), 야콥센(Jacobsen) 증후군 (11-), 밀러-디커(Miller-Dieker) 증후군 (17-), 스미쓰-마게니스(Smith-Magenis) 증후군 (17-), 22ql l.2 결실 증후군 (구개심장안면(Velocardiofacial) 증후군, 디조지(DiGeorge) 증후군, 뿔줄기 기형 얼굴(conotruncal anomaly face) 증후군, 선천적 흉선 무형성증, 및 스트롱(Strong) 증후군으로도 알려짐), 안젤만(Angelman) 증후군 (15-), 및 프라더-윌리(Prader-Willi) 증후군 (15-).
추가로 또는 대안적으로, 염색체 카피수 이상의 검출은 터너(Turner) 증후군 (울리히-터너(Ullrich-Turner) 증후군 또는 일염색체 X), 클라인펠터(Klinefelter) 증후군, 47,XXY 또는 XXY 증후군, 48,XXYY 증후군, 49,XXXXY 증후군, 삼중 X 증후군, XXXX 증후군 (사염색체 X, 사중 X, 또는 48,XXXX로도 불림), XXXXX 증후군 (오염색체 X 또는 49,XXXXX로도 불림) 및 XYY 증후군을 포함하는 군으로부터 선택된 병태의 검출 및/또는 진단을 포함할 수 있다.
한 실시양태에서, 표적 염색체는 13번 염색체, 18번 염색체, 21번 염색체, X 염색체 또는 Y 염색체이다.
한 실시양태에서, 태아 염색체 이상은 태아 염색체 이수성이다. 추가의 실시양태에서, 태아 염색체 이수성은 13번 삼염색체증, 18번 삼염색체증 또는 21번 삼염색체증이다. 또 다른 추가의 실시양태에서, 태아 염색체 이수성은 21번 삼염색체증 (다운 증후군)이다. 상기 실시양태에서, 관련 기술 분야의 통상의 기술자는 본 발명의 방법이, 태아가 전체 염색체보다는 21번 염색체의 실질적인 부분을 보유한 환자를 진단하기 위해 적용될 수 있음을 쉽게 이해할 것이다.
샘플 추출
샘플은 일상적인 절차에 따라 임신한 여성 대상체로부터 얻을 수 있음이 이해될 것이다. 한 실시양태에서, 생물학적 샘플은 모체 혈액, 혈장, 혈청, 소변 또는 타액이다. 추가의 실시양태에서, 생물학적 샘플은 모체 혈장이다.
모체 혈장을 얻는 단계는 일반적으로 5-20 ml 혈액 샘플 (일반적으로 말초 혈액 샘플)을 임신한 여성 대상체로부터 채취하는 (일반적으로 정맥천자에 의해) 것을 포함할 것이다. 따라서, 그러한 샘플을 얻는 것은 태아 공간에 대해 비침습적임을 특징으로 하고, 모체에 대해 최소로 침습적이다. 혈장은 원심분리에 의해 세포 물질의 제거 후에 통상적인 수단에 의해 제조된다 (Maron et al., 2007, Methods Mol Med 132, 51-63).
DNA를 혈장 DNA의 뉴클레오티드 서열에 대해 편향되지 않은 통상적인 방법에 의해 모체 혈장으로부터 추출한다 (Maron et al., 2007, 상기 문헌). 혈장 DNA 분자의 집단은 일반적으로 태아 기원의 부분 및 모체 기원의 부분을 포함할 것이다.
서열 데이터 확보
충분한 수의 혈장 DNA 분자, 적어도 500,000개 및 일반적으로 수백만 개의 분자에 대한 DNA 서열 데이터 (Fan and Quake, 2010, PLoS One 5)를 일반적으로 생물 정보공학 분석을 위해 얻고 준비한다. 충분한 수는 검출되는 이상의 종류에 대해 통계적으로 결정될 것이다. 생물 정보공학 분석은 특정한 염색체의 특유한 서열에 대한 신뢰가능한 매치의 형태로 요구되는 정보를 효과적으로 추출하면서 삽입-결실 및 미스매치 오류를 견디도록 특이적으로 설명된다.
본 발명이 서열 데이터를 얻기 위한 임의의 특정 기술로 제한되지 않음은 통상의 기술자에 의해 이해될 것이다. 그러나, 본 발명의 방법은 서열 데이터의 품질이 통상적인 게놈 서열분석에 대해 일반적으로 관찰되는 것보다 덜 최적일 때 더 유용할 것임이 이해된다. 예를 들어, 한 실시양태에서, 서열 데이터는 폴리머라제 연쇄 반응의 이용을 포함하는 서열분석 플랫폼에 의해 얻어진다. 추가의 실시양태에서, 서열 데이터는 차세대 서열분석 플랫폼을 이용하여 얻어진다. 상기 서열분석 플랫폼은 문헌 [Loman et al. (2012) Nature Biotechnology 30(5), 434-439]; [Quail et al. (2012) BMC Genomics 13, 341]; [Liu et al. (2012) Journal of Biomedicine and Biotechnology 2012, 1-11]; 및 [Meldrum et al. (2011) Clin Biochem Rev. 32(4): 177-195]에서 심도있게 논의 및 검토되었고; 그 서열분석 플랫폼은 본원에 참조로 포함된다.
적합한 차세대 서열분석 플랫폼의 예는 다음을 포함한다: 로슈(Roche) 454 (즉, 로슈 454 GS FLX), 어플라이드 바이오시스템즈(Applied Biosystems)의 SOLiD 시스템 (즉, SOLiDv4), 일루미나의 GAIIx, HiSeq 2000 및 MiSeq 서열분석기, 라이프 테크놀로지스(Life Technologies)의 이온 토렌트 반도체-기반 서열분석 기기, 퍼시픽 바이오사이언시스(Pacific Biosciences)의 PacBio RS 및 생어(Sanger)의 3730xl.
각각의 로슈의 454 플랫폼은 파이로시퀀싱을 이용하고, 이에 의해 화학발광 신호는 염기 도입을 나타내고, 신호 강도는 단독중합체 리드(read)를 통해 도입된 염기의 수와 연관성이 있다.
한 실시양태에서, 서열 데이터는 반도체-기반 서열분석 방법의 이용을 포함하는 서열분석 플랫폼으로부터 얻어진다. 반도체-기반 서열분석 방법의 장점은 기기, 칩 및 시약의 제조 비용이 낮고, 서열분석 과정이 신속하고 (emPCR에 의한 오프-셋에도 불구하고), 시스템을 확대할 수 있다는 것이지만, 이것은 emPCR에 사용되는 비드 크기에 의해 다소 제한될 수 있다.
한 실시양태에서, 서열 데이터는 합성에 의한 서열분석의 이용을 포함하는 서열분석 플랫폼에 의해 얻어진다. 일루미나의 합성에 의한 서열분석 (SBS) 기술은 현재 성공적이고, 세계적으로 널리 채택된 차세대 서열분석 플랫폼이다. TruSeq 기술은 단일 염기가 성장하는 DNA 가닥 내로 포함될 때 그의 검출을 가능하게 하는 독점적 가역적 종료자-기반 방법을 사용하는 대규모 병렬형 서열분석을 지지한다. 형광 표지된 종료자는 각각의 dNTP가 첨가되면서 영상화된 후, 다음 염기의 도입을 허용하기 위해 절단된다. 4개의 모든 가역적 종료자-결합 dNTP는 각각의 서열분석 사이클 동안 존재하기 때문에, 천연 경쟁이 도입 편향을 최소화한다.
한 실시양태에서, 서열 데이터는 나노포어-기반 서열분석 방법의 이용을 포함하는 서열분석 플랫폼으로부터 얻어진다. 추가의 실시양태에서, 나노포어-기반 방법은 예컨대 옥스포드 나노포어 테크놀로지스(Oxford Nanopore Technologies)에 의해 사용된 기술에서처럼 살아있는 세포의 세포막 및 단백질 채널의 상황을 모방하는 유기-타입 나노포어의 이용을 포함한다 (예를 들어, 문헌 [Branton D, Bayley H, et al. (2008). Nature Biotechnology 26 (10), 1146-1153]). 추가의 실시양태에서, 나노포어-기반 방법은 금속, 중합체 또는 플라스틱 물질로 구축된 나노포어의 이용을 포함한다.
한 실시양태에서, 차세대 서열분석 플랫폼은 라이프 테크놀로지스의 이온 토렌트 플랫폼 또는 일루미나의 MiSeq로부터 선택된다. 이 실시양태의 차세대 서열분석 플랫폼은 크기가 작고 빠른 회전 속도를 특징으로 하지만, 제한된 데이터 처리량을 제공한다.
추가의 실시양태에서, 차세대 서열분석 플랫폼은 라이프 테크놀로지스의 이온 토렌트 퍼스널 게놈 머신(Personal Genome Machine)인 퍼스널 게놈 머신 (PGM)이다. 이온 토렌트 장치는 합성에 의한 서열분석 (SBS)과 유사한 전략을 사용하지만, 뉴클레오티드 도입 동안 DNA 폴리머라제의 활성에 따른 수소 이온의 방출에 의한 신호를 검출한다. 본질적으로, 이온 토렌트 칩은 매우 민감한 pH 미터이다. 각각의 이온 칩은 다수의 서열분석 반응의 동시 검출을 허용하는, 수백만 개의 이온-감수성 전계 효과 트랜지스터 (ISFET) 센서를 포함한다. ISFET 장치의 사용은 관련 기술 분야의 통상의 기술자에게 잘 알려져 있고, 본 발명의 방법에 의해 요구되는 서열 데이터를 얻기 위해 사용될 수 있는 기술의 범위 내에서 잘 할 수 있다 (Prodromakis et al. (2010) IEEE Electron Device Letters 31(9), 1053-1055; Purushothaman et al. (2006) Sensors and Actuators B 114, 964-968; Toumazou and Cass (2007) Phil. Trans. R. Soc. B, 362, 1321-1328; WO 2008/107014 (DNA 일렉트로닉스 엘티디(DNA Electronics Ltd)); WO 2003/073088 (토우마조우(Toumazou)); US 2010/0159461 (DNA 일렉트로닉스 엘티디); 각각의 서열분석 방법은 본원에 참조로 포함됨).
454 및 이온 토렌트 둘 모두에 의해 사용되는 SBS 화학은 또한 보다 긴 리드에도 도움이 된다. 이온 토렌트는 현재 로슈 454의 것보다 훨씬 더 짧은 단편으로 제한되지만, 이것은 향후 개발될 버전에서는 개선될 것이다. 로슈 454 및 이온 토렌트 플랫폼 둘 모두는 정확하지 않은 삽입 또는 결실 (삽입-결실)로서 드러나는 단독중합체 서열 오류의 공통적인 문제를 갖는다. 로슈는 DNA 일렉트로닉스로부터 얻은 라이센스를 통해 이온 토렌트와 유사한 검출 방법을 채택할 것이고, 이것은 454 및 이온 토렌트 플랫폼을 본질적으로 동일하게 만들 가능성이 있는 것으로 생각된다.
한 실시양태에서, 서열 데이터는 이온, 예컨대 수소 이온 방출의 이용을 포함하는 서열분석 플랫폼에 의해 얻어진다. 상기 실시양태는 많은 중요한 이점을 제공한다. 예를 들어, 이온 토렌트 PGM은 문헌 [Quail et al. 2012; 상기 문헌]에서 시판되는 가장 저렴한 퍼스널 게놈 머신 (즉, 대략 $80,000)으로 기재되어 있다. 또한, 문헌 [Loman et al. 2012; 상기 문헌]은 이온 토렌트 PGM을 가장 신속한 처리 (80-100 Mb/h) 및 가장 짧은 실행 시간 (~3 h)을 보이는 것으로서 설명하고 있다. 그러나, 이온 토렌트 PGM이 빈번한 삽입-결실 오류라는 특징을 갖는다는 사실이 문헌에 잘 기록되어 있다. 예를 들어, 문헌 [Loman et al. 2012; 상기 문헌]은 이온 토렌트 PGM이 가장 짧은 리드 및 최악의 단독중합체-연관 삽입-결실 오류 비율을 생성하였다고 설명하고 있다. 높은 오류 비율의 문제는 MiSeq 총 오류 비율이 실질적으로 PGM 총 오류 비율보다 더 낮다고 주장하는 일루미나 MiSeq 및 이온 토렌트 PGM 사이의 비교에서 추가로 확인된다 (http://www.illumina.com/documents/analysis of inaccuracies in ion torrent long read application . pdf). 이온 토렌트 PGM의 오류 비율에 대한 상기 불리한 특성은 독립적인 블로그 사이트, 예컨대 http://omicsomics.blogspot.co.uk/http://pathogenomics.bham.ac.uk/bloq/author/nick/에서 논의되어 있다.
이온 토렌트 장치의 보다 추후 세대가 또한 본 발명에서 유용할 수 있음이 이해될 것이고, 예를 들어 한 실시양태에서, 서열 데이터는 라이프 테크놀로지스의 이온 토렌트 플랫폼, 예컨대 PI 또는 PII 칩을 갖는 이온 프로톤(Ion Proton), 및 그의 추가의 파생 장치 및 부품을 기초로 한 다중 반복(multiplex capable iteration)에 의해 얻어진다.
또한, 본 발명의 발명자들은 이온 토렌트 PGM을 사용하여 본 발명에 따라 서열 데이터를 얻는 단계를 수행할 때 존재하는 삽입-결실의 수를 분석하였고, 그 결과를 표 1에 요약한다:
Figure pct00002
표 1은 4개의 모체 혈장 DNA 샘플로부터의 데이터를 보여주고, 본 발명에 따라 얻어지고, 서열분석되고, 염색체 위치에 매칭된 모체 혈장 DNA 분자의 세트로부터 1 이상 또는 2 이상의 삽입-결실을 갖는 분자의 빈도를 요약한 것이다. 대부분의 맵핑된 서열 리드는 적어도 하나의 삽입-결실을 보인다. 이들 데이터는 본 발명의 방법에 따라 얻은 매칭된 서열 리드 ("우수 히트")를 나타낸다.
따라서, 이온 토렌트 플랫폼, 또는 실제로 다른 퍼스널 게놈 머신이, 특히 그 결과가 태아의 낙태 여부를 궁극적으로 결정할 수 있을 때, 염색체 이상을 진단하기 위한 핵심 기술에 부적합할 것임은 통상의 기술자에게 명백할 것이다. 반면에, 일루미나 게놈 분석기(Genome Analyser) 및 보다 최근의 HiSeq 2000은 고 처리량 대규모 병렬형 서열분석에 대한 표준을 설정하였지만 (Quail et al. 2012, BMC Genomics, 13(341)), 그러한 장치는 보다 고가이고, 시간이 많이 소요된다.
그러나, 본 발명의 방법은 오류 빈발 장치, 예컨대 이온 토렌트 장치의 유리한 특성 (즉, 비용, 속도 및 처리량)을, 높은 오류 비율에 대한 단점을 놀랍게도 극복한 저 엄격도 매칭 분석과 조합한 것이다.
중복 붕괴( collapsing )
Prinseq는 이온 토렌트 PGM 서열분석 데이터의 품질 및 특징을 모니터링하기 위한 메타게놈 도구(metagenomic tool)로서 사용하였다 (Schmieder and Edwards, 2011, Bioinformatics 27, 863-864). 이것은 염기 조성, 길이 분포, 염기 품질 판정, 디-뉴클레오티드 빈도 및 중복 서열에 관한 원 서열 데이터에 대한 요약 통계를 제공한다.
염색체 매치의 비율이 진단에 관련되기 때문에, 하나의 중요한 통계는 데이터 내의 정확한 중복의 수이며; 또한, 모체 혈장에서 천연적으로 보이는 정확한 중복 서열의 가능성은 낮고; 그 발생은 예기치 않은 인공적인 것이다. 따라서, 정확한 중복 서열 붕괴 단계를 수행함으로써 중복 서열을 제거하는 것은 중요한 전처리 단계로 고려된다.
따라서, 한 실시양태에서, 본 발명의 방법은 매칭 분석 단계 전에 얻어진 서열 데이터로부터 중복 리드를 붕괴시키는 단계를 추가로 포함한다.
중복 서열의 붕괴를 수행할 수 있는 방법은 통상의 기술자에게 자명할 것이다. 예를 들어, FASTX-툴키트(Toolkit) 내의 FASTQ/A 콜랩서(Collapser) 소프트웨어는 리드 계수의 정확한 수를 유지하면서 동일한 서열을 단일 서열로 붕괴시키는 능력을 제공한다.
도 1은 서열 중복 분포의 예를 보여주고, 중복인 총 리드의 백분율 (본 특정 예에서 10%)을 보여준다. 정확한 중복 서열 (전체 길이에 걸쳐 동일한 서열)을 붕괴시키기 위해 FASTX-툴키트를 사용하였다.
매칭 분석
이전의 비-침습적 이수성의 적용 (Chiu et al., 2008, Proc Natl Acad Sci U S A 105, 20458-20463)은 솔렉사(Solexa)/일루미나 짧은 리드 서열분석 기술을 사용하였다. 이들 리드는 모두 길이가 36 bp이었고, 게놈 반복체 및 카피수 변이를 설명하기 위해 시도된 게놈 맵핑 절차에 엄격한 리드를 사용하였다. 이들은 반복 마스킹된 게놈에 리드를 맵핑하고, 전체 리드 길이에 걸쳐 100% 동일성을 갖는 게놈 내의 한 위치에만 맵핑된 리드를 계수하였다.
반면에, 이온 토렌트 PGM을 본 발명의 방법에 적용할 경우에는, 대략 20 내지 260 bp의 가변 길이의 서열이 생성되었다.
상기 설명된 바와 같은 정확한 중복 리드의 붕괴 후에, 본 발명의 방법은 매칭 분석을 수행한다. 상기 매칭 분석은 일반적으로 적합한 소프트웨어를 사용하여 비마스킹된 참조 게놈에 대해 수행되는 생물 정보공학 분석을 수반한다.
한 실시양태에서, 매칭 분석은 Bowtie2 또는 BWA-SW (Li and Durbin (2010) Bioinformatics, Epub) 정렬 소프트웨어 또는 최대 정확 매칭(Maximal Exact Matching) 기술을 이용하는 정렬 소프트웨어, 예컨대 BWA-MEM (lh3lh3.users.sourceforge.net/download/mem-poster.pdf) 또는 CUSHAW2 (http://cushaw2.sourceforge.net/) 소프트웨어를 이용하여 수행한다. 추가의 실시양태에서, 매칭 분석은 Bowtie2 소프트웨어를 이용하여 수행한다. 추가의 실시양태에서, Bowtie2 소프트웨어는 Bowtie2 2.0.0-beta7이다.
대안적인 실시양태에서, 매칭 분석은 최대 정확 매칭 (MEM) 기술을 이용하는 정렬 소프트웨어, 예컨대 BWA-MEM (lh3lh3.users . sourceforge . net / downioad/mem-poster.pdf) 또는 CUSHAW2 (http://cushaw2.sourceforge.net/) 소프트웨어를 이용하여 수행한다. MEM 알고리즘은 보다 큰 정확도를 제공한다는 이점을 갖는 것으로 생각된다.
솔렉사/일루미나 데이터를 위해 사용되는 것보다 더 긴 리드 길이의 사용시의 이점은 리드가 소프트 클립될 수 있다는 것이고, 반복 마스킹이 맵핑 전에 필요하지 않음이 밝혀졌다.
특유한 염색체 위치에 대한 서열의 맵핑을 위해, 삽입-결실/미스매치 비용 가중치가 상기 분석에서 낮은 것으로 파라미터로 표시되어야 한다. 이들 전제 조건 하에, 비-엄격한 단편-길이 매치가 결정된다. 상기 생물 정보공학 방법을 이용하여, 일반적으로 약 95%의 샘플 리드가 게놈에 맵핑된다. 리드는 이들이 게놈 내의 특유한 위치에 매칭되면 염색체 위치에 배정된 것으로 단지 계수되고, 일반적으로 특유하게 매칭되고 후속적으로 염색체 배정에 대해 계수되는 샘플 리드의 비율은 약 50%이다.
매칭 공정은 가장 단순하게 하나 이상의 참조 게놈을 사용하는 것이 이해될 것이다. 그러나, 다른 방법, 예컨대 특정한 염색체 이상, 예컨대 21번 삼염색체증에 대한 잠재적으로 불균형 상태인 서열의 세트를 어느 서열이 형성하는지 결정하기 위해 많은 정상 임신 및 영향받은 임신으로부터의 축적된 서열 데이터가 분석되는 참조 게놈 미사용 방법이 사용될 수 있음이 고려된다.
한 실시양태에서, 전체 염색체에 대한 매칭 분석이 수행되고, 예를 들어 분석은 그에 따라 과량의 제시된 염색체를 검출하는 것을 포함할 것이다. 대안적인 실시양태에서, 매칭 분석은 상기 염색체의 일부에 대해 수행되고, 예를 들어 매치는 염색체의 특정한 미리 결정된 영역에 대해서만 분석될 것이다. 본 발명의 상기 실시양태는 염색체의 특정 영역을 표적으로 함으로써 보다 민감한 매칭 기술을 제공한다고 생각된다.
본 발명의 비-엄격한 매칭 분석은 일반적으로 정확도 점수가 매칭 염기에 대해 배정되고 페널티가 치환 또는 미스매치, 리드 또는 참조 내의 모호성의 존재 (즉, N) 및 리드 또는 참조 내의 갭의 존재 (즉, 삽입 또는 결실)에 대해 배정되는 정렬 채점 시스템을 포함한다. 일단 점수가 각각의 히트에 대해 계산되면, 점수를 최소 정렬 점수 역치와 비교한다. 본 발명에서 일반적으로 사용된 채점 시스템에서는 Bowtie2 소프트웨어에 따라 국소 정렬 채점방식을 사용한다.
한 실시양태에서, 참조 게놈 내의 염기에 상응하는 핵산 내의 각각의 염기에 배정된 정확도 점수는 양의 점수이다. 추가의 실시양태에서, +2의 양의 점수가 참조 게놈 내의 염기에 상응하는 핵산 내의 각각의 염기에 배정된다 (즉, 매치 점수는 +2이다). 예를 들어, Bowtie2 소프트웨어는 리드 캐릭터가 참조 캐릭터에 정렬되고 캐릭터가 매칭되는 각각의 위치에 대해 +2의 매치 점수를 설정한다. 매치 점수는 Bowtie2 소프트웨어에서 "- -ma" (또는 매치 보너스)로 언급된다.
한 실시양태에서, 임의의 삽입, 결실, 모호성 및/또는 치환에 대한 페널티부과 점수는 감소된 점수, 예컨대 음의 점수이다.
추가의 실시양태에서, -6의 음의 점수가 치환 또는 미스매치에 대해 배정된다 (즉, 미스매치 또는 치환 페널티는 -6이다). 예를 들어, 6의 값은 리드 캐릭터가 참조 캐릭터에 정렬되고 캐릭터가 매칭되지 않는 (그리고, 어느 캐릭터도 N이 아닌) 각각의 위치에 대해 정렬 점수로부터 공제된다. 미스매치 또는 치환 페널티는 Bowtie2 소프트웨어에서 "- -mp"로 언급된다.
한 실시양태에서, 모호성에 대한 음의 점수 (N 페널티)는 -1이다. 예를 들어, 1의 값은 리드, 참조, 또는 둘 모두가 모호성 캐릭터, 예컨대 N을 함유하는 위치에 대해 정렬 점수로부터 공제된다. 모호성 또는 N 페널티는 Bowtie2 소프트웨어에서 "- -np"로 언급된다.
한 실시양태에서, 삽입 또는 결실에 대한 음의 점수는 삽입 또는 결실 내의 각각의 잔기에 대해 -5 플러스 -3이다. 추가의 실시양태에서, 리드 단편 내의 갭 페널티는 갭에 대해 -5, 갭 내의 각각의 연장에 대해 -3이다. 예를 들어, "길이 -2" 리드 갭은 총 -11의 페널티 (즉, 갭에 대해 -5, 갭 내의 제1 연장에 대해 -3 및 갭 내의 제2 연장에 대해 -3)를 받는다. 리드 단편 내의 갭 페널티는 Bowtie2 소프트웨어에서 "- -rdg"로 언급된다.
추가의 실시양태에서, 참조 단편 내의 갭 페널티는 갭에 대해 -5이고, 갭 내의 각각의 연장에 대해 -3이다. 참조 단편 내의 갭 페널티는 Bowtie2 소프트웨어에서 "- -rfg"로 언급된다.
한 실시양태에서, 최소 정렬 점수는 하기 식에 따라 계산한다:
a + b*ln (L)
상기 식에서, a 및 b는 매칭 정확도를 최적화하기 위해 결정된 채점 파라미터를 의미하고, ln은 리드 길이 (L)의 자연 로그를 의미한다.
추가의 실시양태에서, 최소 정렬 점수는 하기 식에 따라 계산한다:
20 + 8.0*ln (L)
상기 식에서, ln은 리드 길이 (L)의 자연 로그를 의미한다.
예를 들어, 20개 염기의 리드 길이에 대해, 최소 점수 역치는 20 + 8*ln20 = 20 + 8*2.995 = 20+23.97 = 43.97. 따라서, 20개 염기 리드 길이에 대한 완벽한 매치는 43.97의 최소 점수 역치에 도달하지 않는 40으로 평가될 것이고, 따라서 20개 염기의 리드 길이는 일반적으로 너무 짧아 매치로 간주되지 않을 것이다.
이와 반대로, 50개 염기의 리드 길이에 대해, 최소 점수 역치는 20 + 8*ln50 = 20 + 8*3.91 = 20+31.3 = 51.3이다. 따라서, 50개 염기 리드 길이에 대한 완벽한 매치는 100으로 평가될 것이고, 따라서, 50개 염기의 리드 길이는 몇 개의 미스매치 및 삽입-결실을 용인하고, 매칭 히트로서 계속 간주될 것이다.
최소 정렬 점수의 개념은 보다 적은 삽입-결실 및 미스매치를 갖기 위해 보다 짧은 리드 길이를 필요로 하고 보다 긴 리드 길이가 보다 많은 수의 삽입-결실 및 미스매치를 갖도록 허용함이 이해될 것이다. 따라서, 한 실시양태에서, 핵산 단편 리드는 대략 25 bp 내지 대략 250 bp를 포함한다.
또한, 정렬 소프트웨어의 다른 예 (즉, BWA-SW, BWA-MEM 및 CUSHAW2)가 Bowtie2에 대해 상기 설명한 채점 시스템과 유사한 방식으로 작동함이 이해될 것이다.
따라서, 본원에 설명된 정렬 분석 소프트웨어 (예컨대 Bowtie2, BWA-SW, BWA-MEM 및 CUSHAW2)는 다음과 같은 문제 해결 때문에 특히 유리하다: (1) 정확한 중복 서열; (2) 단독중합체 런; (3) 빈번한 삽입-결실 오류; (4) 게놈 내의 반복 서열; 및 (5) 상당한 수준의 카피수 변이.
비 계산
일단 히트의 총수가 본원에서 규정된 매칭 분석에 따라 제시된 염색체에 배정되면, 히트는 일반적으로 공통 수 (적합하게는 1백만 개 히트 당)에 대해 정규화된다. 이어서, 다른 염색체에 대한 히트와 비교한, 표적 염색체에 대한 각각의 히트의 비를 그 예가 본원의 실시예 1에서 설명되는 간단한 수학에 따라 계산한다.
상기 언급된 공통 수에 대한 정규화에 추가로, 일반적으로 태아에서 기원하는 모체 혈장 DNA의 비율을 추정할 수 있는 것이 유용하고; 이것은 모체 혈장 DNA의 샘플 내에 태아 염색체 이상을 검출하기에 충분한 태아 DNA가 존재함을 확인할 것이다. 예를 들어, 한 실시양태에서, 본 발명의 방법은 샘플 내의 태아 DNA의 양을 기초로 하여 매칭된 히트의 수를 정규화하거나 조정하는 단계를 추가로 포함한다.
통계적 유의성
본 발명의 진단 시험을 통계적 기초 하에 수행하기 위해, 본 발명의 방법은 다른 염색체에 대한 히트와 비교한, 표적 염색체에 대한 각각의 히트의 비의 통계적 유의성을 계산하는 단계를 추가로 포함한다. 한 실시양태에서, 통계적 유의성 시험은 감소된 계수 데이터의 통상적인 통계적 분석에 따른 z-점수의 계산을 포함한다. 그러나, 다른 통계적 방법이 관련 기술 분야의 통상의 기술자에 의해 적용될 수 있음이 이해될 것이다.
계수 비 "표적 염색체/다른 염색체" 내의 오류 분포가 거의 정상적인 것으로 가정되는 경우, z-점수는 요소가 평균으로부터 어느 정도의 표준 편차로 존재하는지 나타낸다.
z-점수는 하기 식으로부터 계산할 수 있다:
z = (X - μ) / σ
상기 식에서, z는 z-점수이고, X는 요소의 값이고, μ는 집단 평균이고, σ는 집단 값의 표준 편차이다. 본 발명에 따라 21번 삼염색체증의 존재를 시험할 때, 계수 비에 대한 2.0 이상의 z-점수 값은 계수 비 값이 21번 삼염색체증 임신을 나타낼 대략 98%의 확률을 나타낸다.
성별 예측 방법
태아의 부계 모체로부터 유전된 염색체 Y DNA의 존재는 남성 태아의 진단 마커이다. 본 발명의 추가의 측면은 염색체 Y 서열의 존재에 의해 표시되는 태아의 성별 검출이다.
태아가 여성인 경우에 Y 염색체 성분의 사용은 배제되지만, 부계 유전된 Y-염색체 대신에, 부계 유래된 유전자 대립유전자를 검출하는 것이 가능하다. 이들 중에는 모체 혈장 DNA 내의 DNA 서열의 소량 성분으로서 존재하는 대립유전자로서 명백한 태아 SNP (단일 뉴클레오티드 다형성)가 존재한다 (Dhallan et al., Lancet 369, 474-481). 본 발명에서처럼 태아 게놈의 일부만이 서열분석될 경우, 태아의 부계로부터 유전되고 비교적 보다 풍부한 모체 대립유전자와 상이한 변이체로서 검출되는 상기 대립유전자의 수는 태아 기원의 혈장 DNA의 비율의 함수이다. 이것은 태아 기원의 모체 혈장 DNA의 비율을 측정하기 위한 대체가능한 성별-독립적 방법을 제공한다.
본 발명의 제2 측면에 따르면,
(a) 임신한 여성 대상체로부터 생물학적 샘플을 얻는 단계;
(b) 생물학적 샘플 내의 핵산 분자에 대한 서열 데이터를 얻는 단계;
(c) 서열 데이터 내의 각각의 핵산 서열과 참조 게놈의 특유한 부분에 상응하는 서열 사이의 매칭 분석을 수행하여, 각각의 매칭된 핵산이 참조 게놈 내의 특정한 염색체 또는 상기 염색체의 일부에 배정되도록 하고, 여기서 상기 매칭 분석은 참조 게놈 내의 염기에 상응하는 각각의 핵산 내의 각각의 염기에 대한 정확도 점수 및 임의의 삽입, 결실, 모호성 및/또는 치환에 대한 페널티부과 점수를 생성하여, 각각의 핵산에 대한 총 점수가 미리 결정된 점수 역치를 달성할 경우 매치가 배정되도록 하는 것인 단계; 및
(d) 각각의 하나 이상의 참조 염색체에 배정된 매칭 핵산의 총수에 대한, Y 염색체에 배정된 매칭 핵산의 총수의 비를 측정하는 단계
를 포함하고, 여기서 미리 결정된 비 초과의 매칭 Y 염색체 서열의 존재는 남성 태아의 존재를 나타내고, 미리 결정된 비 미만의 매칭 Y 염색체 서열의 존재는 여성 태아의 존재를 나타내는 것인,
임신한 여성 대상체 내의 태아의 성별을 예측하는 방법을 제공한다.
남성 임신에서, Y-염색체 물질의 양은 태아 기원의 혈장 DNA의 비율의 척도이다. 태아가 여성인 경우에, 상기 척도는 적용될 수 없고, 태아 기원의 혈장 DNA의 비율을 결정하기 위해 다른 수단이 채용된다. 고도로 다형성인 대체의 부계 유래된 대립유전자 변이체, 예컨대 짧은 직렬 반복체가 혈장 내의 태아 DNA의 비율을 정량하기 위해 분석될 수 있음은 통상의 기술자에게 분명할 것이다.
본 발명의 제1 측면의 검출 방법에 관련한 모든 실시양태는 본 발명의 제2 측면의 성별 예측 방법에 동일하게 적용됨이 이해될 것이다.
다음 연구는 본 발명을 예시한다:
실시예 1: 혈장 샘플 내의 21번 삼염색체증의 검출
21번 삼염색체증의 진단에 있어서 본 발명의 방법의 유효성을 평가하기 위해, 일상적인 절차에 따라 정상 임신 및 21번 삼염색체증 임신으로부터 혈장 샘플을 따로 얻었다 (예를 들어, 5-20 ml 혈액 샘플을 대상체로부터 채취하고, 혈장을 분리한 후 혈장 DNA를 추출하였다).
이어서, 혈장 DNA를 이온 토렌트 PGM 장치를 사용하는 서열 분석으로 처리하였다. 예를 들어, 어댑터를 부착하고, 라이브러리를 제조하고, 에멀젼 PCR을 수행한 후 서열 분석하였다.
이어서, 다수의 개별 분자, 대개 1백만-1천만 리드에 대하여 대략 25 bp-250 bp에 대해 서열 데이터를 얻었다.
데이터를 상기 설명된 바와 같은 생물 정보공학 분석으로 처리하였다. 예를 들어, 중복 리드를 FASTX-툴키트를 사용하여 붕괴시켰다. 이어서, 데이터를 정확하게 상기 설명된 바와 같이 Bowtie2 소프트웨어를 사용하는 매칭 분석으로 처리하여, 참조 게놈에 대해 비-엄격한 단편 길이 특유한 매치를 제조하였다. 카피수 변이를 또한 배제하였다.
맵핑된 리드의 수 및 그들의 염색체 위치를 4개의 모체 혈장 DNA 샘플, 즉, 2개의 정상 임신 (N1 및 N2) 및 2개의 21번 삼염색체증 임신 (T21/1 및 T21/2)에 대해 표 2에 제시한다:
Figure pct00003
이어서, 표 2의 데이터를 4개의 모체 혈장 DNA 샘플, 즉, 2개의 정상 임신 (N1 및 N2) 및 2개의 21번 삼염색체증 임신 (T21/1 및 T21/2)에 대해 표 3에 제시한 '1백만 개 우수 히트당'을 기초로 하여 정규화하였다:
Figure pct00004
표 2 및 3에 제시된 4개의 모체 샘플은 태아가 남성로 확인된 임신으로부터 얻었고, 이들 데이터를 얻은 혈장 샘플로부터의 것임을 주목한다. 상기 결과는 본 발명의 제2 측면에 따라 표 2 및 3의 데이터로부터 쉽게 예측될 수 있었다.
본 발명에 따라 21번 삼염색체증을 검출하기 위해, 다른 상염색체에 대한 총 히트에 상대적인 21번 염색체 히트의 비를 각각의 샘플에 대해 계산하였다.
N1, N2, T21/1 및 T21/2에 대한 값은 표 4에 제시된 바와 같았다.
Figure pct00005
2개의 21번 삼염색체증 사례에 대한 불균형은 각각 1.0846 및 1.0462이고, 따라서 21번 삼염색체증 샘플과 일치하고, 여기서 태아 DNA의 비율은 5% 내지 15%이다.
표준 편차의 값을 결정하기 위해 연장된 데이터 세트를 사용하여, 시험한 4개의 샘플에 대한 z-점수는 각각 2개의 정상 사례에 대해 -0.16 및 -0.29, 및 2개의 21번 삼염색체증 사례에 대해 5.50 및 2.55이고, 이것은 2개의 21번 삼염색체증 사례는 대략 99% 이상의 확률로 검출되었음을 나타낸다.
27개의 혈장 샘플, 즉, 정상 임신으로부터 혈장 샘플 (샘플 1-15) 및 21번 삼염색체증 임신으로부터 혈장 샘플 (샘플 16-27)에 대해 유사한 절차를 수행하고, z-점수 결과를 표 5, 및 도 2에 그림으로 제시하였고, 여기서 12개의 21번 삼염색체증 사례에 대한 z-점수는 4.59 내지 17.86이고, 15개의 정상 사례에 대해 2.09 내지 -1.31임을 볼 수 있다. 표 5에서는 또한 다른 염색체에 상대적인 21번 염색체의 백분율의 차이를 보여주고, 여기서 12개의 21번 삼염색체증 사례에 대해 더 큰 백분율을 볼 수 있다.
Figure pct00006
본원에서 실시예 1, 표 5 및 도 2에 제시된 데이터는 혈장 DNA 샘플 내에서 21번 삼염색체증을 정확하고 비-침습적으로 진단하기 위해 사용되는 본 발명의 방법의 명백한 능력을 입증한다.

Claims (31)

  1. (a) 여성 대상체로부터 얻은 생물학적 샘플 내의 핵산 분자에 대한 서열 데이터를 얻는 단계;
    (b) 서열 데이터 내의 각각의 핵산 서열과 참조 게놈의 특유한 부분에 상응하는 서열 사이의 매칭 분석을 수행하여, 각각의 매칭된 핵산이 참조 게놈 내의 특정한 염색체 또는 상기 염색체의 일부에 배정되도록 하고, 여기서 상기 매칭 분석은 참조 게놈 내의 염기에 상응하는 각각의 핵산 내의 각각의 염기에 대한 정확도 점수 및 임의의 삽입, 결실, 모호성 및/또는 치환에 대한 페널티부과 점수를 생성하여, 각각의 핵산에 대한 총 점수가 미리 결정된 점수 역치를 달성할 경우 매치가 배정되도록 하는 것인 단계; 및
    (c) 각각의 하나 이상의 참조 염색체에 배정된 매칭 핵산의 총수에 대한, 표적 염색체에 배정된 매칭 핵산의 총수의 비를 측정하는 단계
    를 포함하고, 여기서 정상 임신에서의 비와 비교할 때 측정된 비의 통계적으로 유의한 차이는 표적 염색체에서 태아 이상을 나타내는 것인,
    여성 대상체로부터 얻은 생물학적 샘플에서 태아 염색체 이상을 검출하는 방법.
  2. 제1항에 있어서, 표적 염색체가 13번 염색체, 18번 염색체, 21번 염색체, X 염색체 또는 Y 염색체인 방법.
  3. 제1항 또는 제2항에 있어서, 태아 염색체 이상이 태아 염색체 이수성인 방법.
  4. 제3항에 있어서, 태아 염색체 이수성이 13번 삼염색체증, 18번 삼염색체증 또는 21번 삼염색체증인 방법.
  5. 제4항에 있어서, 태아 염색체 이수성이 21번 삼염색체증 (다운 증후군)인 방법.
  6. (a) 임신한 여성 대상체로부터 생물학적 샘플을 얻는 단계;
    (b) 생물학적 샘플 내의 핵산 분자에 대한 서열 데이터를 얻는 단계;
    (c) 서열 데이터 내의 각각의 핵산 서열과 참조 게놈의 특유한 부분에 상응하는 서열 사이의 매칭 분석을 수행하여, 각각의 매칭된 핵산이 참조 게놈 내의 특정한 염색체 또는 상기 염색체의 일부에 배정되도록 하고, 여기서 상기 매칭 분석은 참조 게놈 내의 염기에 상응하는 각각의 핵산 내의 각각의 염기에 대한 정확도 점수 및 임의의 삽입, 결실, 모호성 및/또는 치환에 대한 페널티부과 점수를 생성하여, 각각의 핵산에 대한 총 점수가 미리 결정된 점수 역치를 달성할 경우 매치가 배정되도록 하는 것인 단계; 및
    (d) 각각의 하나 이상의 참조 염색체에 배정된 매칭 핵산의 총수에 대한, Y 염색체에 배정된 매칭 핵산의 총수의 비를 측정하는 단계
    를 포함하고, 여기서 미리 결정된 비 초과의 매칭 Y 염색체 서열의 존재는 남성 태아의 존재를 나타내고, 미리 결정된 비 미만의 매칭 Y 염색체 서열의 존재는 여성 태아의 존재를 나타내는 것인,
    임신한 여성 대상체 내의 태아의 성별을 예측하는 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 매칭 분석을 Bowtie2 또는 BWA-SW 소프트웨어 또는 최대 정확 매칭(Maximal Exact Matching) 기술을 이용하는 소프트웨어, 예컨대 BWA-MEM 또는 CUSHAW2 소프트웨어에 의해 수행하는 것인 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 매칭 분석이 핵산을 참조 게놈 내의 상기 염색체의 미리 결정된 부분에 매칭시키는 단계를 포함하는 것인 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 정확도 점수가 양의 점수인 방법.
  10. 제9항에 있어서, 양의 점수가 참조 게놈 내의 염기에 상응하는 핵산 내의 각각의 염기에 대해 +2인 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 임의의 삽입, 결실, 모호성 및/또는 치환에 대한 페널티부과 점수가 감소된 점수, 예컨대 음의 점수인 방법.
  12. 제11항에 있어서, 치환에 대한 음의 점수가 -6이고, 모호성에 대한 음의 점수가 -1이고, 삽입 또는 결실에 대한 음의 점수가 삽입 또는 결실 내의 각각의 잔기에 대해 -5 플러스 -3인 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 최소 점수 역치가 하기 식
    a + b*ln (L)
    [상기 식에서, a 및 b는 매칭 정확도를 최적화하기 위해 결정된 채점 파라미터를 의미하고, ln은 리드(read) 길이 (L)의 자연 로그를 의미함]
    에 의해 정의되는 것인 방법.
  14. 제13항에 있어서, a가 20을 나타내고, b가 8.0을 나타내는 것인 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 분석된 핵산 서열이 대략 25 bp 내지 대략 250 bp를 포함하는 것인 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 생물학적 샘플이 모체 혈액, 혈장, 혈청, 소변 또는 타액인 방법.
  17. 제16항에 있어서, 생물학적 샘플이 모체 혈장인 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 매칭 분석 단계 전에 얻어진 서열 데이터로부터 중복 리드를 붕괴시키는 단계를 추가로 포함하는 방법.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 샘플 내의 태아 DNA의 양을 기초로 하여 매칭된 히트(hit)의 수를 정규화하거나 조정하는 단계를 추가로 포함하는 방법.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, 서열 데이터가 차세대 서열분석 플랫폼에 의해 얻어지는 것인 방법.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, 서열 데이터가 폴리머라제 연쇄 반응의 이용을 포함하는 서열분석 플랫폼에 의해 얻어지는 것인 방법.
  22. 제1항 내지 제20항 중 어느 한 항에 있어서, 서열 데이터가 합성에 의한 서열분석의 이용을 포함하는 서열분석 플랫폼에 의해 얻어지는 것인 방법.
  23. 제1항 내지 제20항 중 어느 한 항에 있어서, 서열 데이터가 이온, 예컨대 수소 이온 방출의 이용을 포함하는 서열분석 플랫폼에 의해 얻어지는 것인 방법.
  24. 제1항 내지 제20항 중 어느 한 항에 있어서, 서열 데이터가 반도체-기반 서열분석 방법의 이용을 포함하는 서열분석 플랫폼으로부터 얻어지는 것인 방법.
  25. 제1항 내지 제20항 중 어느 한 항에 있어서, 서열 데이터가 나노포어-기반 서열분석 방법의 이용을 포함하는 서열분석 플랫폼으로부터 얻어지는 것인 방법.
  26. 제25항에 있어서, 상기 나노포어-기반 방법이 유기-타입 나노포어의 이용을 포함하는 것인 방법.
  27. 제25항 또는 제26항에 있어서, 상기 나노포어-기반 방법이 금속, 중합체 또는 플라스틱 물질로 구축된 나노포어의 이용을 포함하는 것인 방법.
  28. 제27항에 있어서, 차세대 서열분석 플랫폼이 로슈(Roche) 454 (즉, 로슈 454 GS FLX), 어플라이드 바이오시스템즈(Applied Biosystems)의 SOLiD 시스템 (즉, SOLiDv4), 일루미나(Illumina)의 GAIIx, HiSeq 2000 및 MiSeq 서열분석기, 라이프 테크놀로지스(Life Technologies)의 이온 토렌트(Ion Torrent) 반도체 서열분석 플랫폼, 퍼시픽 바이오사이언시스(Pacific Biosciences)의 PacBio RS 및 생어(Sanger)의 3730xl로부터 선택되는 것인 방법.
  29. 제1항 내지 제20항 중 어느 한 항에 있어서, 서열 데이터가 라이프 테크놀로지스의 이온 토렌트 플랫폼 또는 일루미나의 MiSeq에 의해 얻어지는 것인 방법.
  30. 제29항에 있어서, 서열 데이터가 라이프 테크놀로지스의 이온 토렌트 퍼스널 게놈 머신(Personal Genome Machine) (이온 토렌트 PGM)에 의해 얻어지는 것인 방법.
  31. 제30항에 있어서, 서열 데이터가 라이프 테크놀로지스의 이온 토렌트 플랫폼, 예컨대 PI 또는 PII 칩을 갖는 이온 프로톤(Ion Proton), 및 그의 추가의 파생 장치 및 부품을 기초로 한 다중 반복(multiplex capable iteration)에 의해 얻어지는 것인 방법.
KR1020157007576A 2012-08-30 2013-08-29 염색체 이상의 검출 방법 KR20150070111A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261695182P 2012-08-30 2012-08-30
GBGB1215449.8A GB201215449D0 (en) 2012-08-30 2012-08-30 Method of detecting chromosonal abnormalities
GB1215449.8 2012-08-30
US61/695,182 2012-08-30
PCT/GB2013/052261 WO2014033455A1 (en) 2012-08-30 2013-08-29 Method of detecting chromosomal abnormalities

Publications (1)

Publication Number Publication Date
KR20150070111A true KR20150070111A (ko) 2015-06-24

Family

ID=47074981

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157007576A KR20150070111A (ko) 2012-08-30 2013-08-29 염색체 이상의 검출 방법

Country Status (10)

Country Link
US (1) US20150267255A1 (ko)
EP (1) EP2890813A1 (ko)
JP (1) JP2015526101A (ko)
KR (1) KR20150070111A (ko)
CN (1) CN104968800A (ko)
CA (1) CA2883464A1 (ko)
GB (1) GB201215449D0 (ko)
HK (1) HK1212391A1 (ko)
IN (1) IN2015MN00457A (ko)
WO (1) WO2014033455A1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101686146B1 (ko) * 2015-12-04 2016-12-13 주식회사 녹십자지놈 핵산의 혼합물을 포함하는 샘플에서 복제수 변이를 결정하는 방법
WO2017023148A1 (ko) * 2015-08-06 2017-02-09 이원 다이애그노믹스 게놈센타(주) 다양한 플랫폼에서 태아의 성별과 성염색체 이상을 구분할 수 있는 새로운 방법
KR101721480B1 (ko) 2016-06-02 2017-03-30 주식회사 랩 지노믹스 염색체 이상 검사 방법 및 시스템
WO2017126943A1 (ko) * 2016-01-20 2017-07-27 이원다이애그노믹스(주) 염색체 이상 판단 방법
WO2021107676A1 (ko) * 2019-11-29 2021-06-03 주식회사 녹십자지놈 인공지능 기반 염색체 이상 검출 방법

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015181718A1 (en) * 2014-05-26 2015-12-03 Ebios Futura S.R.L. Method of prenatal diagnosis
WO2016010401A1 (ko) * 2014-07-18 2016-01-21 에스케이텔레콘 주식회사 산모의 혈청 dna를 이용한 태아의 단일유전자 유전변이의 예측방법
US20160026759A1 (en) * 2014-07-22 2016-01-28 Yourgene Bioscience Detecting Chromosomal Aneuploidy
KR101638473B1 (ko) * 2014-12-26 2016-07-12 연세대학교 산학협력단 차세대 염기서열 분석법을 기반으로 하는 결실 유전자군 검출 방법
BE1022789B1 (nl) * 2015-07-17 2016-09-06 Multiplicom Nv Werkwijze en systeem voor geslachtsinschatting van een foetus van een zwangere vrouw
CN115433769A (zh) * 2015-08-12 2022-12-06 香港中文大学 血浆dna的单分子测序
CN108475301A (zh) * 2015-12-04 2018-08-31 绿十字基因组公司 用于确定包含核酸的混合物的样品中的拷贝数变异的方法
GB201522665D0 (en) * 2015-12-22 2016-02-03 Premaitha Ltd Detection of chromosome abnormalities
CN105926043B (zh) * 2016-04-19 2018-08-28 苏州贝康医疗器械有限公司 一种提高孕妇血浆游离dna测序文库中胎儿游离dna占比的方法
WO2018178700A1 (en) * 2017-03-31 2018-10-04 Premaitha Limited Method of detecting a fetal chromosomal abnormality
CN109280702A (zh) * 2017-07-21 2019-01-29 深圳华大基因研究院 确定个体染色体结构异常的方法和系统
CN108268752B (zh) * 2018-01-18 2019-02-01 东莞博奥木华基因科技有限公司 一种染色体异常检测装置
CN108396058A (zh) * 2018-01-19 2018-08-14 刘晓雯 检测染色体异常的产前诊断方法
CN110033828B (zh) * 2019-04-03 2021-06-18 北京各色科技有限公司 基于芯片检测dna数据的性别判断方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2012005217A (es) * 2009-11-06 2012-07-23 Univ Hong Kong Chinese Analisis genomico a base de tamaño.
WO2012135730A2 (en) * 2011-03-30 2012-10-04 Verinata Health, Inc. Method for verifying bioassay samples
CA2840418C (en) * 2011-07-26 2019-10-29 Verinata Health, Inc. Method for determining the presence or absence of different aneuploidies in a sample

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017023148A1 (ko) * 2015-08-06 2017-02-09 이원 다이애그노믹스 게놈센타(주) 다양한 플랫폼에서 태아의 성별과 성염색체 이상을 구분할 수 있는 새로운 방법
US11339426B2 (en) 2015-08-06 2022-05-24 Eone Diagnomics Genome Center Co., Ltd. Method capable of differentiating fetal sex and fetal sex chromosome abnormality on various platforms
KR101686146B1 (ko) * 2015-12-04 2016-12-13 주식회사 녹십자지놈 핵산의 혼합물을 포함하는 샘플에서 복제수 변이를 결정하는 방법
WO2017126943A1 (ko) * 2016-01-20 2017-07-27 이원다이애그노믹스(주) 염색체 이상 판단 방법
KR101721480B1 (ko) 2016-06-02 2017-03-30 주식회사 랩 지노믹스 염색체 이상 검사 방법 및 시스템
WO2021107676A1 (ko) * 2019-11-29 2021-06-03 주식회사 녹십자지놈 인공지능 기반 염색체 이상 검출 방법

Also Published As

Publication number Publication date
US20150267255A1 (en) 2015-09-24
WO2014033455A1 (en) 2014-03-06
IN2015MN00457A (ko) 2015-09-04
JP2015526101A (ja) 2015-09-10
EP2890813A1 (en) 2015-07-08
CA2883464A1 (en) 2014-03-06
CN104968800A (zh) 2015-10-07
HK1212391A1 (en) 2016-06-10
GB201215449D0 (en) 2012-10-17

Similar Documents

Publication Publication Date Title
KR20150070111A (ko) 염색체 이상의 검출 방법
AU2022200046B2 (en) Maternal plasma transcriptome analysis by massively parallel RNA sequencing
KR102339760B1 (ko) 대규모 병렬 게놈 서열분석을 이용한 태아 염색체 이수성의 진단 방법
KR101817785B1 (ko) 다양한 플랫폼에서 태아의 성별과 성염색체 이상을 구분할 수 있는 새로운 방법
SG191757A1 (en) Noninvasive detection of fetal genetic abnormality
CN108604258B (zh) 染色体异常判断方法
US20200109452A1 (en) Method of detecting a fetal chromosomal abnormality
KR101907650B1 (ko) 비침습적 태아 염색체 이수성 판별 방법
RU2627673C2 (ru) Способ неинвазивной пренатальной диагностики анеуплоидий плода
KR102519739B1 (ko) 2단계 Z-score에 기반한 비침습적 산전 검사 방법 및 장치
CN111321210B (zh) 一种无创产前检测胎儿是否患有遗传疾病的方法
WO2019092438A1 (en) Method of detecting a fetal chromosomal abnormality
KR20170036649A (ko) 비침습적 태아 염색체 이수성 판별 방법
US20220101947A1 (en) Method for determining fetal fraction in maternal sample
Vinh A Method to Create NIPT Samples with Turner Disorder to Evaluate NIPT Algorithms
WO2023031641A1 (en) Methods and devices for non-invasive prenatal testing

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid