KR20160002705A - 폴리뉴클레오티드 샘플의 서열분석에서 바이어스를 확인하고 조정하는 방법 및 키트 - Google Patents

폴리뉴클레오티드 샘플의 서열분석에서 바이어스를 확인하고 조정하는 방법 및 키트 Download PDF

Info

Publication number
KR20160002705A
KR20160002705A KR1020157024623A KR20157024623A KR20160002705A KR 20160002705 A KR20160002705 A KR 20160002705A KR 1020157024623 A KR1020157024623 A KR 1020157024623A KR 20157024623 A KR20157024623 A KR 20157024623A KR 20160002705 A KR20160002705 A KR 20160002705A
Authority
KR
South Korea
Prior art keywords
polynucleotide
nucleotide
sample
different
fragments
Prior art date
Application number
KR1020157024623A
Other languages
English (en)
Inventor
윔 반 크리킨지
Original Assignee
엠디엑스헬스 에스에이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엠디엑스헬스 에스에이 filed Critical 엠디엑스헬스 에스에이
Publication of KR20160002705A publication Critical patent/KR20160002705A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2545/00Reactions characterised by their quantitative nature
    • C12Q2545/10Reactions characterised by their quantitative nature the purpose being quantitative analysis
    • C12Q2545/101Reactions characterised by their quantitative nature the purpose being quantitative analysis with an internal standard/control
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

뉴클레오티드 위치에서 상이한 뉴클레오티드를 갖는 이종 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드 샘플의 1개 이상의 뉴클레오티드 위치에서 1종 이상의 뉴클레오티드를 결정하는 방법이 개시된다. 개시된 방법은 폴리뉴클레오티드 샘플의 서열분석 중에 서열분석 바이어스의 제어에 이용될 수 있다. 적합한 샘플은 환자의 진단, 예후예측 및 치료에 사용하기 위한 환자 샘플을 포함할 수 있다.

Description

폴리뉴클레오티드 샘플의 서열분석에서 바이어스를 확인하고 조정하는 방법 및 키트{METHODS AND KITS FOR IDENTIFYING AND ADJUSTING FOR BIAS IN SEQUENCING OF POLYNUCLEOTIDE SAMPLES}
본 발명의 분야는 폴리뉴클레오티드 샘플을 서열분석하는 방법에 관한 것이다. 특히, 본 발명의 분야는 폴리뉴클레오티드 샘플의 서열분석에서 바이어스를 확인하는 방법에 관한 것이다. 방법은 질환 또는 장애를 보유한 환자의 진단, 예후예측 및 치료에 이용되는 서열분석 방법에서 바이어스의 확인 및 조정에 적응될 수 있다.
지난 30년에 걸쳐서, 유전적 돌연변이 및 후성적 변형의 검출이 의학에서 중요한 임상도구로서 출현하였다. 돌연변이 및 후성적 변화, 예컨대 메틸화는 제한효소를 이용하는 방법 (예를 들어, 메틸화-특이적 디지털 핵형분석 (MSDK) 및 조합 비술파이트 제한 분석 (COBRA)), 폴리머라제 연쇄반응 (PCR) (예를 들어, 메틸화-특이적 PCR (MSP), 헤비 메틸 PCR, 및 메틸라이트(methylight) PCR), 혼성화 (예를 들어, 에피-마이크로어레이 및 비드-어레이), 및 DNA 서열분석 (예를 들어, 클로날 (피로/생거(Sanger)) 서열분석, 또는 합성-유형 서열분석)을 이용하여 검출하여 왔다. 특히, DNA 서열분석의 비용을 절감시켜주는 DNA 서열분석 기술에 있어서의 진보는 질환의 유전학 및 후성유전학의 포괄적인 조사를 가능케 해주었다.
그러나, 다양한 난제 때문에, 풍부화 서열분석을 이용하는 게놈규모에서의(genome-wide) 서열분석은 오직 연구의 장에서만 주로 수행되어 왔으며 임상 진단학에 대해서는 적응된 바 없다. 예를 들어, 게놈규모에서의 비술파이트 서열분석 (BSS)에 대한 난제 중 일부는 임상 샘플이 고도로 이종이고 다양한 정도의 메틸화를 갖는 대립유전자를 함유한다는 사실을 포함한다. 충분한 정도의 감도와 특이성으로 주어진 위치에서 메틸화 (또는 주어진 위치에서 메틸화의 결여)를 검출하기 위해서는 비교적 큰 샘플 크기가 요구된다. 따라서, 비교적 작은 샘플 크기를 사용하는 후성적 변형 및 유전적 돌연변이 검출의 감도 및 특이성을 개선하는 DNA 서열분석의 새로운 방법이 바람직하다. 특히, DNA 서열분석의 이들 새로운 방법은 임상 진단학에서의 도구로서 게놈규모에서의 서열분석을 이용한다는 난제에 대처하여 해결하여야 한다.
뉴클레오티드 위치에서 상이한 뉴클레오티드를 갖는 이종 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 뉴클레오티드를 결정하는 방법이 개시된다. 방법은 이종 폴리뉴클레오티드의 뉴클레오티드 위치에서 다수의 상이한 뉴클레오티드의 존재를 확인하는 데 이용될 수 있다.
방법은 하기 단계 (a) 및 (b)를 포함할 수 있다: (a) 뉴클레오티드 위치를 스패닝하는 폴리뉴클레오티드 샘플의 표적 영역을 서열분석하는 단계; 및 (b) 폴리뉴클레오티드 단편의 세트를 서열분석하는 단계 (여기서, 폴리뉴클레오티드 단편은 (i) 폴리뉴클레오티드 샘플의 표적 영역에 상응하는 폴리뉴클레오티드 서열; 및 (ii) 뉴클레오티드 태그를 포함할 수 있는, 폴리뉴클레오티드 단편을 표적 영역과 구별하기 위한 태그를 포함함). 폴리뉴클레오티드 단편의 세트는 전형적으로는 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 상이한 뉴클레오티드를 갖는 2종 이상의 상이한 폴리뉴클레오티드 단편을 포함한다.
방법에서, 표적 영역과 폴리뉴클레오티드 단편의 세트는 동일하거나 상이한 반응 혼합물에서 서열분석될 수 있다. 표적 영역과 폴리뉴클레오티드 단편의 세트를 서열분석하기 위한 반응 혼합물은 표적 영역에 특이적으로 혼성화하는 1종 이상의 프라이머 및 폴리뉴클레오티드 단편의 세트에 특이적으로 혼성화하는 1종 이상의 프라이머를 포함할 수 있다. 예를 들어, 폴리뉴클레오티드 단편의 세트에 특이적으로 혼성화하는 프라이머는 폴리뉴클레오티드 단편의 세트에 존재하는 뉴클레오티드 태그에 특이적으로 혼성화하는 서열을 포함할 수 있다.
방법은 딥 시퀀싱(deep sequencing)을 수행하는 단계를 포함할 수 있다. 일부 실시양태에서, 방법은 이종 폴리뉴클레오티드의 뉴클레오티드 위치에서 뉴클레오티드 검출에 요구되는 서열분석의 깊이를 결정하는 단계를 포함할 수 있다. 다른 실시양태에서, 방법은 이종 폴리뉴클레오티드의 뉴클레오티드 위치에서 상이한 뉴클레오티드에 대한 서열분석 바이어스를 결정하는 단계를 포함할 수 있다.
방법에 이용되는 폴리뉴클레오티드 단편의 세트는 전형적으로는 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 상이한 뉴클레오티드를 갖는 2종 이상의 상이한 폴리뉴클레오티드 단편을 포함한다. 일부 실시양태에서, 폴리뉴클레오티드 단편의 세트는 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 시토신 또는 티민을 갖는 2종 이상의 상이한 폴리뉴클레오티드 단편을 포함한다. 예를 들어, 폴리뉴클레오티드 단편의 세트는 측정될 뉴클레오티드 위치에서 하나의 뉴클레오티드 단편내 뉴클레오티드 위치에서는 시토신이고 다른 뉴클레오티드 단편내 뉴클레오티드 위치에서는 티미딘인 것을 제외하고는 동일한 뉴클레오티드 서열을 갖는 2종의 상이한 폴리뉴클레오티드 단편을 포함할 수 있거나 또는 그들로 이루어질 수 있다. 일부 실시양태에서, 폴리뉴클레오티드 단편의 세트는 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 시토신 또는 티민을 갖는 2종의 상이한 폴리뉴클레오티드 단편의 등몰량을 포함할 수 있다. 방법은 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 시토신 또는 티민을 갖는 2종의 상이한 폴리뉴클레오티드 단편의 등몰량을 포함하는 폴리뉴클레오티드 단편의 세트를 서열분석하는 단계, 및 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 시토신 또는 티민에 대한 오류 발견률을 측정하는 단계를 포함할 수 있다.
방법에 이용된 폴리뉴클레오티드 단편의 세트는 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 각각 아데닌, 구아닌, 시토신 또는 티민을 갖는 4종 이상의 상이한 폴리뉴클레오티드 단편을 포함할 수 있다. 예를 들어, 폴리뉴클레오티드 단편의 세트는 측정될 뉴클레오티드 위치에서, 하나의 뉴클레오티드 단편내 뉴클레오티드 위치에서는 아데닌이고; 또 다른 뉴클레오티드 단편내 뉴클레오티드 위치에서는 구아닌이며; 또 다른 뉴클레오티드 단편내 뉴클레오티드 위치에서는 시토신이며; 또 다른 뉴클레오티드 단편내 뉴클레오티드 위치에서는 티미딘인 것을 제외하고는 동일한 뉴클레오티드 서열을 갖는 4종의 상이한 폴리뉴클레오티드 단편을 포함할 수 있거나 또는 그들로 이루어질 수 있다. 일부 실시양태에서, 폴리뉴클레오티드 단편의 세트는 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 각각 아데닌, 구아닌, 시토신 또는 티민을 갖는 4종의 상이한 폴리뉴클레오티드 단편의 등몰량을 포함할 수 있다. 방법은 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 각각 아데닌, 구아닌, 시토신 또는 티민을 갖는 4종의 상이한 폴리뉴클레오티드 단편의 등몰량을 포함하는 폴리뉴클레오티드 단편의 세트를 서열분석하는 단계, 및 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 아데닌, 구아닌, 시토신 또는 티민에 대한 오류 발견률을 측정하는 단계를 포함할 수 있다.
개시된 방법은 DNA 및 RNA를 포함할 수 있는 임의의 공급원으로부터의 핵산을 이용할 수 있다. 일부 실시양태에서, 폴리뉴클레오티드 샘플은 게놈 DNA를 포함한다. 추가 실시양태에서, 게놈 DNA는 DNA중 비-메틸화된 시토신 잔기를 선택적으로 변형시켜 검출가능한 변형된 잔기를 생성하지만 메틸화된 시토신 잔기는 변형시키지 않는 시약으로 서열분석 이전에 처리된다. 또 다른 추가 실시양태에서, 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서의 뉴클레오티드는 메틸화된 시토신 또는 변형된 잔기이고, 폴리뉴클레오티드 단편의 세트는 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 시토신 또는 티민을 갖는 2종 이상의 상이한 폴리뉴클레오티드 단편을 포함한다. 방법은 뉴클레오티드 위치에서 메틸화된 시토신을 갖는 폴리뉴클레오티드 샘플의 이종 폴리뉴클레오티드 (1)의 개수:뉴클레오티드 위치에서 비-메틸화된 시토신을 갖는 폴리뉴클레오티드 샘플의 이종 폴리뉴클레오티드 (2)의 개수의 비를 계산하는 단계를 포함할 수 있다.
방법은 전형적으로는 측정될 뉴클레오티드 위치를 스패닝하는 폴리뉴클레오티드 샘플의 표적 영역을 서열분석하는 단계를 포함한다. 일부 실시양태에서, 표적 영역은 뉴클레오티드 위치에 대하여 5'인 폴리뉴클레오티드 샘플의 적어도 약 10개 뉴클레오티드를 포함하고/하거나 표적 영역은 뉴클레오티드 위치에 대하여 3'인 폴리뉴클레오티드 샘플의 적어도 약 10개 뉴클레오티드를 포함한다. 다른 실시양태에서, 표적 영역은 뉴클레오티드 위치에 대하여 5'인 폴리뉴클레오티드 샘플의 적어도 약 20, 30, 40, 50개 또는 그보다 많은 뉴클레오티드를 포함하고/하거나 표적 영역은 뉴클레오티드 위치에 대하여 3'인 폴리뉴클레오티드 샘플의 적어도 약 20, 30, 40, 50개 또는 그보다 많은 뉴클레오티드를 포함한다. 따라서, 표적 영역은 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100개 또는 그보다 많은 뉴클레오티드를 포함할 수 있다.
폴리뉴클레오티드 단편의 세트의 폴리뉴클레오티드 단편은 전형적으로는 (i) 폴리뉴클레오티드 샘플의 표적 영역에 상응하는 폴리뉴클레오티드 서열; 및 (ii) 폴리뉴클레오티드 단편을 표적 영역과 구별하기 위한 태그, 예컨대 뉴클레오티드 태그를 포함한다. 일부 실시양태에서, 뉴클레오티드 태그는 폴리뉴클레오티드 샘플의 표적 영역에 존재하지 않는 적어도 약 2, 3, 4 또는 5개 뉴클레오티드의 뉴클레오티드 서열을 포함한다. 예를 들어, 뉴클레오티드 태그는, 예를 들어 DNA 서열분석이 수행된 후에 또는 DNA 서열분석이 수행되는 동안에, 표적 서열과 폴리뉴클레오티드 단편의 구별에 이용될 수 있다 (예를 들어, 뉴클레오티드 태그를 포함하는 폴리뉴클레오티드에 특이적으로 혼성화하는 프라이머 및/또는 프로브를 이용함으로써).
방법은 또한 폴리뉴클레오티드 샘플의 2개 이상의 상이한 뉴클레오티드 위치에서 2종 이상의 뉴클레오티드를 결정하는 데 이용될 수 있다. 일부 실시양태에서, 방법은 다음의 단계 (a) 및 (b)를 포함할 수 있다: (a) 2개 이상의 뉴클레오티드 위치를 스패닝하는 폴리뉴클레오티드 샘플의 표적 영역을 서열분석하는 단계; 및 (b) 폴리뉴클레오티드 단편의 세트를 서열분석하는 단계 (여기서, 폴리뉴클레오티드 단편은 (i) 폴리뉴클레오티드 샘플의 표적 영역에 상응하는 폴리뉴클레오티드 서열; 및 (ii) 폴리뉴클레오티드 단편을 표적 영역과 구별하기 위한 태그, 예컨대 뉴클레오티드 태그를 포함함). 폴리뉴클레오티드 단편의 세트는 상이한 폴리뉴클레오티드 단편을 포함할 수 있으며, 각각은 2개 이상의 뉴클레오티드 위치에서 2종 이상 뉴클레오티드의 상이한 가능한 조합을 가지고 2개 이상의 뉴클레오티드 위치에서 2종 이상의 뉴클레오티드의 모든 상이한 가능한 조합을 나타낸다.
폴리뉴클레오티드 단편의 세트가 폴리뉴클레오티드 샘플의 2개 이상의 상이한 뉴클레오티드 위치에서 2종 이상의 상이한 뉴클레오티드를 갖는 2종 이상의 상이한 폴리뉴클레오티드 단편을 포함하는 일부 실시양태에서, 폴리뉴클레오티드 단편의 세트는 폴리뉴클레오티드 샘플의 2개 이상의 뉴클레오티드 위치에서 시토신 또는 티미딘을 갖는 상이한 폴리뉴클레오티드 단편을 포함할 수 있다. 추가 실시양태에서, 폴리뉴클레오티드 단편의 세트는 상이한 폴리뉴클레오티드 단편을 포함할 수 있으며, 각각은 폴리뉴클레오티드 샘플의 2개 이상의 뉴클레오티드 위치에서 시토신 또는 티미딘의 상이한 가능한 조합을 가지고 2개 이상의 뉴클레오티드 위치에서 시토신 또는 티미딘의 모든 상이한 가능한 조합을 나타낸다. 이 경우에, 폴리뉴클레오티드 단편의 세트내 폴리뉴클레오티드 단편의 상이한 조합의 총수 (#)는 방정식 # = 2N에 의하여 표시될 수 있고, 여기에서 N은 상이한 뉴클레오티드 위치의 총수를 나타내고, "2"는 상이한 뉴클레오티드 위치에서의 뉴클레오티드에 대한 2종의 상이한 가능성 (즉, 시토신 또는 티미딘)을 나타낸다. 또 다른 추가 실시양태에서, 폴리뉴클레오티드 단편의 세트는 상이한 폴리뉴클레오티드 단편의 등몰량을 포함할 수 있으며, 각각은 폴리뉴클레오티드 샘플의 2개 이상의 뉴클레오티드 위치에서 시토신 또는 티미딘의 상이한 가능한 조합을 가지고 2개 이상의 뉴클레오티드 위치에서 시토신 또는 티미딘의 모든 상이한 가능한 조합을 나타낸다.
다른 실시양태에서, 폴리뉴클레오티드 단편의 세트는 폴리뉴클레오티드 샘플의 2개 이상의 뉴클레오티드 위치에서 아데닌, 구아닌, 시토신 또는 티민을 갖는 상이한 폴리뉴클레오티드 단편을 포함할 수 있다. 추가 실시양태에서, 폴리뉴클레오티드 단편의 세트는 상이한 폴리뉴클레오티드 단편을 포함할 수 있으며, 각각은 폴리뉴클레오티드 샘플의 2개 이상의 뉴클레오티드 위치에서 아데닌, 구아닌, 시토신 또는 티미딘의 상이한 가능한 조합을 가지고 2개 이상의 뉴클레오티드 위치에서 아데닌, 구아닌, 시토신 또는 티미딘의 모든 상이한 가능한 조합을 나타낸다. 이 경우에, 폴리뉴클레오티드 단편의 세트내 폴리뉴클레오티드 단편의 상이한 조합의 총수 (#)는 방정식 # = 4N에 의하여 표시될 수 있으며, 여기에서 N은 상이한 뉴클레오티드 위치의 총수를 나타내고 "4"는 상이한 뉴클레오티드 위치에서의 뉴클레오티드에 대한 4가지 상이한 가능성 (즉, 아데닌, 구아닌, 시토신 또는 티미딘)을 나타낸다. 또 다른 추가 실시양태에서, 폴리뉴클레오티드 단편의 세트는 상이한 폴리뉴클레오티드 단편의 등몰량을 포함할 수 있으며, 각각은 폴리뉴클레오티드 샘플의 2개 이상의 뉴클레오티드 위치에서 아데닌, 구아닌, 시토신 또는 티미딘의 상이한 가능한 조합을 가지고 2개 이상의 뉴클레오티드 위치에서 아데닌, 구아닌, 시토신 또는 티미딘의 모든 상이한 가능한 조합을 나타낸다.
개시된 방법은 후성적 유전자좌 또는 유전학적 유전자좌의 특정 대립유전자에 대한 서열분석 바이어스를 결정하는 단계를 또한 포함할 수 있다. 방법은 하기 단계 (a) 내지 (c)를 포함할 수 있다: (a) 특정 대립유전자를 포함하는 대립유전자의 세트를 서열분석하여 대립유전자의 세트가 1개 이상의 뉴클레오티드 위치에서 축중성인 서열의 세트를 수득하는 단계; (b) 서열의 세트에서 대립유전자의 서열을 동정하는 단계; 및 (c) 대립유전자의 서열에 대한 발생의 관찰 빈도 대 대립유전자의 서열에 대한 발생의 기대 빈도를 계산하는 단계. 후속하여, 측정된 서열분석 바이어스를 이용하여 특정 대립유전자를 측정하는 서열분석 방법에서 수행된 서열분석의 깊이를 변형시킬 수 있다.
뉴클레오티드 위치에서 상이한 뉴클레오티드를 갖는 이종 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 뉴클레오티드를 결정하는 개시된 방법을 실시하기 위한 키트가 또한 본원에 개시된다. 키트는 (i) 뉴클레오티드 위치를 스패닝하는 폴리뉴클레오티드 샘플의 표적 영역을 서열분석하기 위한; 및 (ii) 본원에서 고려되는 바와 같은 폴리뉴클레오티드 단편의 세트를 서열분석하기 위한 올리고뉴클레오티드 프라이머를 포함할 수 있다. 키트는 폴리뉴클레오티드 단편의 세트를 추가로 포함할 수 있다. 본원에서 고려되는 바와 같이, 폴리뉴클레오티드 단편은 폴리뉴클레오티드 샘플의 표적 영역에 상응하는 폴리뉴클레오티드 서열을 포함할 수 있고, 폴리뉴클레오티드 단편은, 예를 들어 DNA 서열분석 후에 또는 DNA 서열분석 중에 폴리뉴클레오티드 단편을 표적 영역과 구별하기 위한 태그 (예를 들어, 뉴클레오티드 태그)를 추가로 포함할 수 있다 (예를 들어, 뉴클레오티드 태그를 포함하는 폴리뉴클레오티드 단편에 특이적으로 혼성화하는 프라이머 및/또는 프로브를 이용함으로써). 폴리뉴클레오티드 단편의 세트는 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 상이한 뉴클레오티드를 갖는 2종 이상의 상이한 폴리뉴클레오티드 단편을 포함할 수 있다. 상이한 폴리뉴클레오티드 단편은 폴리뉴클레오티드 단편의 세트에 등몰량으로 존재할 수 있다. 키트는 폴리뉴클레오티드 샘플의 서열분석 수행을 위한 1종 이상의 시약, 예컨대 효소 및 완충제를 추가로 포함할 수 있다.
개시된 방법 및 키트는 진단, 예후예측 및 치료를 필요로 하는 환자, 예컨대 질환 또는 장애를 보유하거나 또는 보유하는 것으로 의심되는 환자의 진단, 예후예측 및 치료에 이용될 수 있다. 개시된 방법은 진단 및/또는 예후예측을 필요로 하는 환자의 진단 및/또는 예후예측을 포함할 수 있으며, 후속하여 환자의 진단 및/또는 예후예측 후에 진단 및/또는 예후예측을 필요로 하는 환자에 치료약을 투여하는 단계를 추가로 포함할 수 있다. 본원에서 고려되는 방법은 하기 단계 (a) 및 (b)를 포함할 수 있다: (a) 본원 개시의 DNA 서열분석 방법을 이용하는, 환자 DNA 샘플중 표적 서열의 DNA 서열을 제공하는 분석을 의뢰하는 단계; 및 (b) 후속하여 분석 결과에 기초하여 환자에 치료약을 투여하는 단계.
도 1은 본원에서 고려되는 방법의 한 실시양태를 도시한다.
도 2는 SEQ-C-YR 내부 대조군의 폴리뉴클레오티드 구성원에 대한 서열분석 바이어스를 도시한다.
도 3은 메틸화-특이적 PCR을 통해 수행된 11개 환자 샘플에 대한 메틸화 분석의 상관관계를 도시한다.
도 4는 6개 비술파이트-처리 샘플 (양성 3개, 음성 3개)의 딥 시퀀싱을 통해 24개 위치에서의 메틸화 분석을 도시한다.
도 5는 11개 비술파이트-처리 샘플의 딥 시퀀싱을 통해 24개 위치에서의 메틸화 분석을 도시한다.
도 6은 대조군으로서 액틴 베타에 관해서 GSTP1의 비율 대비 도 2에 예시된 바와 같은 서열분석 바이어스에 대한 메틸화 % 보정의 대수 그래프를 제공한다.
도 7은 실시예 2의 실험에서 수득된 앰플리콘의 길이의 박스앤드위스커(box-and-whisker) 플롯을 제공한다.
도 8은 앰플리콘의 각 뉴클레오티드 위치에 대한 컨센서스 뉴클레오티드 (즉, 가장 빈번하게 발생하는 뉴클레오티드)의 발생 빈도의 플롯을 제공한다.
도 9는 실시예 2의 앰플리콘에 대한 축중성 위치에서의 C 및 T의 총수 대비 각 축중성 위치에서의 T의 수 (즉, T 대 C + T의 빈도)의 플롯을 제공한다.
도 10은 대립유전자가 관찰된 횟수 대 대립유전자중 C 개수의 박스플롯을 제공한다.
이하에 및 본 출원 전역에 걸쳐서 기재되는 바와 같이, 본 발명은 몇몇 정의를 사용하여 본원에 기술된다.
문맥상 별도로 규정하거나 지시하지 않는 한, 용어 "단수 용어"는 "1개 이상"을 의미한다. 예를 들어, "폴리뉴클레오티드"는 "1개 이상의 폴리뉴클레오티드"를 의미하도록 해석되어야 한다. 어구 "뉴클레오티드 위치"는 "1개 이상의 뉴클레오티드 위치"를 의미하도록 해석되어야 한다.
본원에서 사용되는 바와 같이, "약", "대략", "실질적으로" 및 "현저하게"는 통상의 기술자에 의하여 이해될 것이며, 그들이 사용되는 문맥에서 어느 정도까지는 변동할 것이다. 이들 용어가 사용되는 상황을 전제로 통상의 기술자에게 분명하지 않은 이들 용어의 사용이 존재할 경우, "약" 및 "대략"은 그 특정 용어의 ±≤10%를 의미할 것이며, "실질적으로" 및 "현저하게"는 그 특정 용어의 ±>10%를 의미할 것이다.
본원에서 사용되는 바와 같이, 용어 "포함한다(include)" 및 "포함하는(including)"은 용어 "포함한다(comprise)" 및 "포함하는(comprising)"과 동일한 의미를 갖는다. 예를 들어, "단계를 포함하는(include) 방법"은 "단계를 포함하는(comprise) 방법"을 의미하도록 해석되어야 한다. 용어 "포함한다(comprise)" 및 "포함하는(comprising)"은 청구범위에 열거된 성분에 덧붙여 부가적인 성분의 포함을 허용하는 "열려 있는(open)" 과도적 용어인 것으로 해석되어야 한다. 용어 "이루어진다(consist)" 및 "~로 이루어지는(consisting of)"은 청구범위에 열거된 성분 이외에 부가적인 성분의 포함을 허용하지 않는 "닫혀 있는(closed)" 과도적 용어인 것으로 해석되어야 한다. 용어 "본질적으로 ~로 이루어지는(consisting essentially of)"은 부분적으로 닫혀 있고 권리주장 요지의 성질을 근본적으로 변경하지 않는 부가적인 성분만의 포함을 허용하도록 해석되어야 한다.
본원에서 사용되는 바와 같이, 용어 "대상체" 또는 "개체"와 상호교환적으로 사용될 수 있는 용어 "환자"는 의료, 응급처치(attention) 또는 치료 받는 이를 언급하며 인간 환자를 포함할 수 있다. 본원에서 사용되는 바와 같이, 용어 "환자"는 질환 또는 장애와 관련된 1종 이상 유전자의 메틸화 상태를 특징으로 하거나 또는 질환 또는 장애와 관련된 유전적 돌연변이를 특징으로 하는 질환 또는 장애가 발생할 위험에 처한 사람을 포함하도록 의미된다. 유전자의 "메틸화 상태"는 예를 들어 대조군 유전자에 비하여 유전자의 프로모터의 "메틸화 상태"를 포함할 수 있다. 유전적 돌연변이는 질환 또는 장애와 관련된 유전자 안에 위치될 수 있다.
본원에서 사용되는 바와 같이, ~을 필요로 하는 환자는 세포 증식성 질환 또는 장애 (예를 들어, 암, 예컨대 유방암, 전립선암, 결장암, 폐암, 담낭암, 뇌암, 자궁암, 난소암, 두경부암, 위암, 간암, 백혈병 및 림프종), 신경퇴행성 질환 또는 장애 (예를 들어, 알츠하이머병, 파킨슨병 및 헌팅턴병), 정신 질환 또는 장애 (예를 들어, 정신분열병 및 우울증), 대사 질환 또는 장애 (예를 들어, 제1형 또는 제2형 당뇨병), 심혈관 질환 또는 장애 (예를 들어, 심근경색증 또는 졸중), 염증성 질환 또는 장애 (예를 들어, 관절염), 및 면역 질환 또는 장애를 포함한 (이에 제한되지는 않음) 질환 또는 장애를 보유하거나 또는 그러한 질환 또는 장애가 발생할 위험에 처한 환자를 포함할 수 있다.
개시된 방법은 질환 또는 장애와 관련되거나 질환 또는 장애와 관련된 1개 이상의 돌연변이를 특징으로 하는 1종 이상 유전자의 프로모터 영역의 메틸화 상태에 기초하여 진단 또는 예후예측을 필요로 하는 환자의 진단 또는 예후예측에 이용될 수 있다. 본원에서 사용되는 바와 같이, 용어 "진단한다" 또는 "진단" 또는 "진단하는"은 질환, 증후군 또는 병태를 구별하거나 확인하는 것 또는 특정 질환, 증후군 또는 병태를 보유하고 있거나 그들이 발생할 위험에 처한 환자를 구별하거나 확인하는 것을 언급한다. 본원에서 사용되는 바와 같이, 용어 "예후예측한다" 또는 "예후예측" 또는 "예후예측하는"은 환자에서 질환, 증후군, 병태 또는 치료요법의 결과를 예측하는 것을 언급한다.
개시된 방법은 치료를 필요로 하는 환자의 치료에 이용될 수 있다. 예를 들어, 개시된 방법은 질환 또는 장애와 관련되거나 질환 또는 장애와 관련된 1개 이상의 돌연변이를 특징으로 하는 1종 이상 유전자의 프로모터 영역의 메틸화 상태에 기초하여 진단 또는 예후예측을 필요로 하는 환자의 진단 또는 예후예측에 이용될 수 있다. 진단 또는 예후예측에 후속하여, 환자에는 질환 또는 장애의 진단 또는 예후예측에 기초하여 적합한 치료약이 투여될 수 있다.
개시된 방법은 환자 샘플중 핵산의 특성화에 이용될 수 있다. 용어 "샘플" 또는 "환자 샘플"은 생물학적 샘플, 예컨대 조직 (예를 들어, 생검으로부터 수득한 조직) 및 체액을 포함하도록 의미된다. "체액"은 혈액, 혈청, 혈장, 타액, 뇌척수액, 흉수, 눈물, 유미관액, 림프, 담 및 정액을 포함할 수 있으나 이에 제한되지는 않는다. 샘플은 핵산, 단백질 또는 양쪽 모두를 포함할 수 있다.
본원 개시의 방법은 폴리뉴클레오티드 샘플의 DNA 서열 분석 수행시에 적용될 수 있다. 특히, 본원 개시의 방법은, 이종 폴리뉴클레오티드 샘플의 폴리뉴클레오티드 구성원이 1개 이상의 위치에서 상이한 뉴클레오티드를 가지는, 이종 폴리뉴클레오티드 샘플의 DNA 서열 분석 수행시에 적용될 수 있다. 적합한 이종 폴리뉴클레오티드 샘플은 야생형 폴리뉴클레오티드 서열을 갖는 폴리뉴클레오티드 및 야생형 폴리뉴클레오티드와 비교하여 1개 이상의 위치에서 1개 이상의 돌연변이를 갖는 폴리뉴클레오티드를 포함할 수 있다.
본원 개시의 방법은 특히 메틸화 분석 수행시에 적용될 수 있다. 예를 들어, 본원 개시의 방법은 샘플을 비-메틸화된 시토신 잔기는 선택적으로 변형하고 메틸화된 시토신 잔기는 변형시키지 않는 작용제로 처리한 후 폴리뉴클레오티드 샘플의 서열분석 수행시에 적용될 수 있다. 비술파이트 처리는 통상적으로는 폴리뉴클레오티드 샘플중 비-메틸화된 시토신 잔기 → 우라실 잔기로 전환시키기 위해 수행된다. 처리된 폴리뉴클레오티드 샘플은 이어서 우라실 잔기가 궁극적으로 티미딘 잔기로 전환되는 DNA 합성을 위한 주형 (예를 들어, PCR 증폭에서 또는 서열분석 반응에서)으로서 이용될 수 있다. 처리된 폴리뉴클레오티드 샘플의 서열분석을 수행함으로써, 주어진 위치에서 티미딘 잔기 대 시토신 잔기의 검출은 각각 최초 샘플중 비-메틸화된 시토신 또는 최초 샘플중 메틸화된 시토신을 나타낼 것이다.
본원 개시의 방법은 고속대량처리 또는 초고속대량처리 서열분석 방법을 포함할 수 있는 다종다양한 서열분석 방법에 적용될 수 있다. 본원 개시의 방법은 표적 영역의 서열분석 이전에 내부 대조군을 폴리뉴클레오티드 샘플에 첨가하여 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 뉴클레오티드를 결정하는 단계를 포함할 수 있다. 내부 대조군은 전형적으로는 폴리뉴클레오티드 단편의 세트를 포함한다. 그 세트의 폴리뉴클레오티드 단편의 각각은 폴리뉴클레오티드 샘플의 표적 영역에 상응하는 폴리뉴클레오티드 서열 및 폴리뉴클레오티드 단편을 표적 영역과 구별하기 위한 뉴클레오티드 태그를 포함한다. 폴리뉴클레오티드 단편의 세트는 상이한 폴리뉴클레오티드 단편을 포함할 수 있으며, 각각은 뉴클레오티드 위치에서 상이한 뉴클레오티드를 가지고 뉴클레오티드 위치에서 상이한 뉴클레오티드의 모든 상이한 가능한 조합을 나타낸다. 그에 따라, 폴리뉴클레오티드 단편은 축중성 세트를 나타내는 것으로 생각될 수 있다. 내부 대조군으로서 사용하기 위한 폴리뉴클레오티드의 세트의 일례를 도 1에 예시하였다.
본원에서 사용되는 바와 같이, "폴리뉴클레오티드 샘플의 표적 영역에 상응하는 폴리뉴클레오티드 서열을 포함하는 폴리뉴클레오티드 단편"은 폴리뉴클레오티드 샘플의 표적 영역과 동일한 서열을 갖는 폴리뉴클레오티드 단편 또는 본원 개시 방법의 서열분석 단계 수행을 통해 측정될 예정인 폴리뉴클레오티드 샘플의 표적 영역의 1개 이상 뉴클레오티드 위치에서만 변화가 있는 서열을 갖는 폴리뉴클레오티드 단편을 의미한다. 예를 들어, 표적 영역이 서열 ACGTACGTYACGTACGT (서열 1)을 갖는 경우, 세트의 폴리뉴클레오티드 단편은 ACGTACGTCACGTACGT (서열 2) 또는 ACGTACGTTACGTACGT (서열 3)와 같은 서열을 가질 수 있다. 표적 서열이 N개 위치에서 C/T 축중성을 갖는 경우, 세트의 폴리뉴클레오티드 단편의 총수 (#)는 2N일 것이며, 여기에서 각각의 축중성 위치는 2종의 상이한 뉴클레오티드 중 하나 (즉, C 또는 T)일 수 있다. 또 다른 예로서, 표적 영역이 서열 ACGTACGTNACGTACGT (서열 4)을 갖는 경우, 폴리뉴클레오티드 단편은 ACGTACGTCACGTACGT (서열 5), ACGTACGTTACGTACGT (서열 6), ACGTACGTAACGTACGT (서열 7) 또는 ACGTACGTGACGTACGT (서열 8)와 같은 서열을 가질 수 있다. 표적 서열이 N개 위치에서 A/C/G/T 축중성을 갖는 경우, 세트의 폴리뉴클레오티드 단편의 총수 (#)는 4N일 것이며, 여기에서 각각의 축중성 위치는 4종의 상이한 뉴클레오티드 중 하나 (즉, A, C, G 또는 T)일 수 있다.
세트의 폴리뉴클레오티드 단편은 폴리뉴클레오티드 샘플이 서열중 1개 이상의 뉴클레오티드 위치에서 변이성을 보이는 1개 이상의 위치에서 축중성을 소유할 수 있다. 일부 실시양태에서, 폴리뉴클레오티드 단편의 세트는 1개 이상의 뉴클레오티드 위치에서 축중성에 기초하여 모든 가능한 폴리뉴클레오티드 단편을 포함한다. 추가 실시양태에서, 폴리뉴클레오티드 단편의 세트는 뉴클레오티드 위치에서 상이한 뉴클레오티드를 갖는 상이한 폴리뉴클레오티드 단편 각각의 등몰 농도를 포함한다.
본 방법의 일부 실시양태에서, 폴리뉴클레오티드 샘플 및 폴리뉴클레오티드 단편의 세트는 동일 반응 혼합물에서 서열분석될 수 있다. 그러한 실시양태에서, 폴리뉴클레오티드 샘플 및 폴리뉴클레오티드 단편은 반응 혼합물에 등몰 농도로 존재할 수 있다.
본원에서 사용되는 바와 같이, "SEQ_C_YR" 합성은 1개 이상의 위치에서 C/T 축중성을 보이는 주형의 합성 세트를 언급한다. SEQ_C_YR 합성 유전자는 비-메틸화된 시토신 → 티미딘으로의 최종적인 전환에 기초하여 1개 이상의 위치에서 이종성을 보이는 폴리뉴클레오티드 샘플의 서열분석시 내부 대조군 또는 외부 대조군으로서 사용될 수 있다.
폴리뉴클레오티드 서열에서, 표시 "Y"는 본원에서는 임의의 피리미딘 (예를 들어, C 또는 T)을 의미하도록 의도된다. 본원에서 사용되는 표시 "X"는 임의의 뉴클레오티드 (예를 들어, A, C, G 또는 T)를 나타내도록 이용될 수 있다.
본원에 개시된 세트의 폴리뉴클레오티드 단편은 전형적으로는 태그를 가지며, 그러한 태그는 폴리뉴클레오티드 식별 태그를 포함할 수 있으나 이에 제한되지는 않는다. 예를 들어, 폴리뉴클레오티드 식별 태그는, 예를 들어 그 폴리뉴클레오티드 식별 태그를 포함하는 폴리뉴클레오티드 단편에 특이적으로 혼성화하는 프라이머 및/또는 프로브를 사용함으로써 DNA 서열분석 후에 또는 DNA 서열분석 중에, 폴리뉴클레오티드 단편을 폴리뉴클레오티드 샘플의 폴리뉴클레오티드와 구별하는 데에 이용될 수 있다. 적합한 폴리뉴클레오티드 식별 태그는 폴리뉴클레오티드 샘플의 폴리뉴클레오티드에 관하여 뉴클레오티드 치환, 삽입 또는 결실을 포함할 수 있다. 2, 3, 4, 5개 또는 그보다 많은 뉴클레오티드의 치환은 적합한 폴리뉴클레오티드 식별 태그를 제공할 수 있다.
개시된 방법은 관련 기술분야에 알려져 있는 바와 같은 각종 DNA 서열분석 방법에 적용될 수 있다. 개시된 방법에 적합한 또는 적응가능한 DNA 서열분석 과정은 합성에 의한 서열분석, 단일-분자 실시간 서열분석, 이온 반도체 서열분석, 피로시퀀싱(pyrosequencing), 라이게이션에 의한 서열분석, 쇄 종결 서열분석, 매시블리 패러렐 시그너처 시퀀싱(massively parallel signature sequencing), 폴로니(Polony) 서열분석, DNA 나노볼 서열분석, 헬리스코프(Heliscope) 단일 분자 서열분석, 나노포어 DNA 서열분석, 혼성화에 의한 서열분석, 질량분석법으로의 서열분석, 미세유체 생거 서열분석, 및 현미경검사-기반 서열분석 기술을 포함할 수 있으나 이에 제한되지는 않는다. 그에 따라, 개시된 방법은 생거 서열분석법 또는 맥삼(Maxam)-길버트(Gilbert) 서열분석법, 소위 "1세대" DNA 서열분석 기술에 기반한 전통적인 DNA 서열분석 방법, 및 고속대량처리 분석에 보다 수용적인 방법, 소위 "2세대" 및 "3세대" DNA 서열분석 기술"에 적용될 수 있다. (예를 들어 하기 참조: Mardis, Ann. Rev. Genomics and Human Genetics, Vol. 9: 387-402 (2008); Metzker, Genome Research, (2005) 15:1767-1776; Moorthie et al., Hugo J. v. 5(1-4), Dec. (2011); 및 Schadt et al., Human Molecular, Genetics, Vol. 19, No. R2, pp. R227-2490, September 21, 2010; 및 Shendure et al., Nature Biotechnology 26, 1135-1145 (2008))
실시예
하기 실시예는 예시적인 것이며 권리주장 요지의 범위를 제한하도록 의도되지 않는다.
실시예 1 - SEQ-C-YR 대조군을 사용한 표적화 딥 비술파이트 처리 서열분석
재료 및 방법
DNA 프라이머 및 샘플
개시된 방법을 사용하여 글루타치온-S-트랜스퍼라제 유전자 (GSTP1)의 메틸화를 분석하였다. GSTP1 유전자 프로모터 영역에 대응하는 유전적 위치 67351027에서부터 67351365에 이르는 11번 염색체상의 서열이 하기와 같이 밑줄에서처럼 분석되었다:
Figure pct00001
그에 따라, 분석 영역은 다음의 서열을 가졌다:
Figure pct00002
GSTP1 유전자의 이들 영역에 대한 메틸화-특이적 프라이머를 하기와 같이 메틸화된 DNA를 특이적으로 증폭하는 데 이용하였다:
GSTP1 MSP 확인 검정
Figure pct00003
MSP 프라이머에 의하여 증폭된 영역의 상류 및 하류의 대략 200 bp 영역을 서열분석하기 위하여 설계된 플랭킹 프라이머를 다음과 같이 선택하였다:
표적화 딥 BT 시퀀싱
Figure pct00004
SEQ-C-YR 주형으로서, 본 발명자들은 대략 195 bp의 표적화 딥 BT 서열분석 영역과 동일한 영역을 커버하는 합성 축중성 DNA 단편의 세트를 설계하였다. 그러나, 본 발명자들은 합성 축중성 DNA 단편에 의하여 수득된 서열 판독물과 환자 샘플에 의하여 수득된 서열 판독물간을 구별하기 위하여 고유 폴리뉴클레오티드 식별 (ID) 태그를 합성 축중성 DNA 단편에 첨가하였다.
67351068에서부터 67351263에 이르는 11번 염색체상의 비술파이트-전환 DNA 서열은 다음과 같다:
Figure pct00005
메틸화된 또는 비-메틸화된 시토신을 잠재적으로 갖는 위치에서 축중성 (Y)의 혼입 후, 67351068에서부터 67351263에 이르는 11번 염색체상의 비술파이트-전환 DNA 서열은 다음과 같다:
Figure pct00006
C/T 축중성을 갖는 당해 표적 영역내 9개 위치가 존재한다. 그에 따라, SEQ-C-YR 주형은 29 = 512 구성원을 갖는 합성 축중성 DNA 단편의 세트를 포함하였다.
합성 축중성 DNA 단편에 대한 ID 태그로서, 디-시토신 서열을 다음과 같이 표적 서열 안에 삽입하였다:
Figure pct00007
ID 태그를 포함하는 DNA를 특이적으로 증폭하고, 그에 따라 합성 축중성 DNA 단편과 환자 샘플간을 구별하는 데 사용될 수 있는 프라이머를 다음과 같이 설계하였다:
ID 태그를 함유하는 앰플리콘간 구별을 위한 프라이머
Figure pct00008
11인 환자로부터의 생검으로부터의 코어로부터의 샘플을 하기 샘플 목록으로부터 메틸화 분석을 위해 선택하고 제조하였다:
Figure pct00009
11개 샘플 중 8개는 "양성 대조군" 상태로 배정되었고, 11개 샘플 중 3개는 "음성 대조군" 상태로 배정되었다.
메틸화 분석
대조군으로서, 인간 결장암 세포주 HCT116 DKO로부터의 DNA뿐만 아니라 시험관내 (IV)-메틸화 DNA (S7821, 케미콘 인코포레이티드(Chemicon Inc.))도 이용하였다. 하기 키트와 시약이 또한 이용되었다: 이지 디엔에이 메틸레이션(EZ DNA Methylation)TM 키트, D5001 (자이모 리서치, Zymo Research); 패스트스타트 하이 피델리티 피시알 시스템 (FastStart High Fidelity PCR System), 03553400001 (로슈, Roche); 하이 퓨어 피시알 클린업 마이크로 키트(High Pure PCR Cleanup Micro Kit), 04983912001 (로슈); 퀀트-아이티(Quant-iT)TM 피코그린(PicoGreen)® dsDNA 검정 키트, P7589 (라이프 테크놀로지스, Life Technologies); 트루섹(TruSeq) DNA HT 샘플 프렙(Prep) 키트 A, FC-121-2001 (일루미나, Illumina); 트루섹 DNA HT 샘플 프렙 키트 B, FC-121-2002 (일루미나); 및 마이섹(MiSeq) 시약 키트 v2, 15034097 (일루미나).
모든 샘플 및 IV-메틸화 DNA에 대하여, 제조업자의 프로토콜에 따라 이지 디엔에이 메틸레이션TM 키트를 사용하여 비술파이트 처리를 통해 1000 ng을 전환시켰다. 이어서 제조업자의 프로토콜에 따라 패스트스타트 하이 피델리티 피시알 시스템을 사용하고 하기 마스터 믹스를 사용하여 전환된 DNA의 앰플리콘을 제조하였다:
마스터 믹스의 제조
Figure pct00010
프라이머 및 샘플을 전술한 바와 같이 사용하였다.
하기 사이클링 프로파일을 사용하여 제조업자의 프로토콜에 따라 P9700 기구 (어플라이드 바이오시스템즈, Applied Biosystems)상에서 PCR 반응을 수행하였다:
PCR 서모사이클러 프로파일
Figure pct00011
모든 앰플리콘의 길이를 바이오-애널라이저(Bio-analyzer) (애질런트, Agilent)상에서 검증하였다. 제조된 앰플리콘을 이어서 제조업자의 프로토콜에 따라 퀀트-아이티TM 피코그린® dsDNA 검정 키트를 사용하여 정제하였고, 이어서 제조업자의 프로토콜에 따라 하이 퓨어 피시알 클린업 마이크로 키트를 사용하여 정제하였다. 모든 앰플리콘의 특성화 및 정제 후, 환자 샘플로부터 유래한 앰플리콘 및 합성 유전자로부터 유래한 앰플리콘 양쪽 모두를 함께 등몰량으로 풀링하였다(pooled).
이어서 환자 샘플의 앰플리콘과 합성 유전자의 앰플리콘의 등몰 혼합물을 사용하여 시퀀스 레디(sequence ready) 트루섹 라이브러리를 제조하고 이를 일루미나의 마이섹 기구상에서 서열분석하였다. 모든 혼합물은 서열분석 후 모든 서열분석된 주형간을 구별하기 위하여 상이한 다중 식별자(MID)를 부여 받았다. 제조업자의 프로토콜에 따라 마이섹 시약 키트 v2를 사용하여 서열분석을 수행하였다.
결과
도 1은 본 실시예에서 수행된 방법을 넓게 설명한다. 도 2에서, SEQ-C-YR 주형의 구성원에 대한 판독물의 개수 대 주형내 C의 개수를 비교함으로써 서열분석 바이어스를 분석하였다. 도 2에 도시된 바와 같이, 주어진 위치에서 시토신보다는 티미딘의 개수가 더 많은 SEQ-C-YR 주형의 그들 구성원은 보다 높은 개수의 판독물을 보였는데, 이는 이들 구성원이 보다 용이하게 서열분석되었음을 시사한다. 시토신에 관해서 티미딘에 대한 서열분석 바이어스는 대략 5인 것으로 측정되었다. 대략 1 x 104의 서열 깊이에서, 주어진 위치에서 모든 티미딘을 갖는 주형은 대략 2000개 판독물을 부여하였고, 반면에 대략 1 x 106의 서열 깊이에서, 주어진 위치에서 모든 시토신을 갖는 주형은 대략 400개 판독물을 부여하였다.
도 3은 메틸화-특이적 PCR의 수행에 기초하여 11개 환자 샘플에 대한 메틸화의 상관관계를 예시한다. 메틸화-특이적 프라이머를 사용하여 7개 위치에서 메틸화 %를 측정하고, 이어서 % 메틸화/비-메틸화 (M/U(%))를 대조군으로서 액틴 베타에 관하여 GSTP1 대비 플로팅하였다. "양성"으로 특성화된 샘플의 8개 중 7개가 지정 컷오프를 상회하였다. "음성"으로 특성화된 3개 샘플뿐만 아니라 "양성"으로 특성화된 샘플 중 하나도 지정 컷오프를 하회하였다.
다음으로, 3개의 양성 샘플 (45409, 45399 및 45266번) 및 3개의 음성 샘플 (45214, 45257 및 45260번)을 24 CpGs를 커버링하는 영역 전역에 걸쳐서 완전히 서열분석하였다. C의 주어진 개수 (즉, 0-24)를 갖는 대립유전자에 대한 판독물의 개수를 도 4에 플로팅하였다. 도시된 바와 같이, 양성 샘플은 고-메틸화 (즉, > 대략 7개 위치에서)를 보이는 대립유전자를 보다 많은 수 함유하였고, 반면에 음성 샘플은 그러한 고-메틸화를 보이는 대립유전자를 적은 수 함유하였다.
모든 11개 샘플을 도 5에 도시된 바와 같이 완전-대립유전자 분석에 투입하였다. 심지어는 낮은 검출가능 역치를 갖는 음성 샘플에 대해서 조차도, 환자 샘플 안에서 고-메틸화 대립유전자를 검출하는 것이 가능하였다.
도 6은 대조군으로서 액틴 베타에 관해서 GSTP1의 비율 대비 도 2에 예시된 바와 같은 서열분석 바이어스에 대한 메틸화 % 보정의 대수 그래프를 제공한다. 도시된 바와 같이, 3개 음성 샘플은 컷오프 수준을 하회하였고, 8개 양성 샘플은 컷오프 수준을 상회하였다.
실시예 2 - SEQ -C- YR : 합성 유전자를 사용한 차세대 서열분석 DNA 메틸화 데이터에 대한 보정방법
문제점의 서술 및 목표
차세대 서열분석 (NGS)은 1종 이상 유전자의 DNA-메틸화 상태를 측정하기 위한 메틸화-특이적 PCR (MSP)에 대한 대안책으로서 이용될 수 있다. 두 가지 주요 이점이 NGS와 관계가 있다. 첫 번째, MSP와 비교하여 NGS는 유전자의 보다 용이한 다중화 및 보다 큰 패널을 가능케 해주는데, 그 이유는 MSP는 상이한 형광단의 스펙트럼 분리에 의존하며 종종 4종 유전자의 패널에 한정되기 때문이다. 두 번째, NGS로 수득된 정보량이 굉장히 더 크다는 것이며, 그 이유는 NGS는 각각의 개별 뉴클레오티드에 대한 정보 및 고유 대립유전자의 빈도를 담고있기 때문이다. 그러나 MSP로는, 메틸화된 유전자의 카피는 표준곡선 및 종종은 대조군 유전자를 사용하여 측정될 수 있다. 이것 때문에, 메틸화된 대립유전자를 오직 검출하되, 비-메틸화된 변이체는 검출하지 않는 메틸화-특이적 프라이머가 설계될 필요가 있다. 그러나, 이들 프라이머는 메틸화된 변이체에 전적으로 특이적인 것은 아니며 특정 위치에서 워블(wobble) (즉, 국소적 미스매치)을 허용한다.
사례연구 개관
인간 유전자 MGMT는 다형성아교모세포종 (GBM)에서 알킬화제에 대한, 그리고 잠재적으로는 또한 가벼운 뇌 종양에 대한 예후예측 바이오마커로서 일반적으로 및 예보 바이오마커로서 적용된다. 당해 유전자가 메틸화되면, 이는 알킬화제, 예컨대 테모졸로마이드를 사용하는 화학요법, 및 방사선요법에 대한 유익한 반응에 기인한 보다 양호한 예후예측을 표시한다. NGS 출현 전에는, DNA-메틸화 상태는 전형적으로는 MGMT ACTB 대조군 유전자의 카피를 측정하고 비율을 산출함으로써 MSP로 측정하였다. 보다 높은 비율은 메틸화된 MGMT 카피의 보다 많은 개수 및 MGMT 유전자가 메틸화를 통해서 사일런싱되는 보다 높은 가능성을 표시한다. 당해 비율에 종종 해석가능성(interpretability)을 위해 계수 1000이 곱해지지만, 2 이상의 비율은 MGMT가 메틸화됨을 표시하는 것으로 간주된다.
링코핑 대학교(Linkoping University, 스웨덴)로부터의 총 121개 GBM 샘플을 전술한 MSP 방법 및 NGS를 사용하여 분석하였다. NGS를 위하여, 완전 MSP 앰플리콘을 포함하였으며, 그리하여 166 염기 길이인 최종 서열이 도출되는 프라이머를 개발하였다. NGS 데이터의 최종 분석은 1개 이상 C 뉴클레오티드의 메틸화 빈도 또는 총수 또는 1개 이상 특정 대립유전자의 빈도 또는 수에 기반할 수 있다. NGS 앰플리콘은 총 19개 CpG 디뉴클레오티드 (즉, 메틸화될 수 있는 C)를 함유한다. MSP 앰플리콘과 비교하여, NGS 앰플리콘은 5' → 3'으로의 상대적인 순서로, MSP 앰플리콘의 일부가 아닌 4개의 C; 정방향 MSP 프라이머의 일부인 5개의 C; MSP 앰플리콘의 내부 부분중 7개의 C; 및 역방향 MSP 프라이머중 3개의 C로 이루어져 있다. 대략 100000X의 서열분석 깊이가 각각의 샘플에 대하여 구상된다.
합성 유전자 세트
관심 C의 위치에서 축중성 뉴클레오티드 (즉, 관심 위치에서 C 또는 T)를 보유한 합성 유전자 세트를 생성하였으며, 달리는 "SEQ_C_YR 합성 유전자"로서 언급된다. 관심 C는 모두 메틸화될 수 있는 CpG 디뉴클레오티드의 일부이고, MSP 앰플리콘의 일부이다. 따라서, 오로지 4개의 리딩(leading) C만이 합성 유전자 세트에서 축중성이 아니며, 그에 따라 15개의 총 축중성 C가 남게된다. 축중성 뉴클레오티드를 갖는 모든 가능한 합성 유전자의 등몰 농도를 갖는 앰플리콘 혼합물을 제조하였으며 215 = 32768 고유 대립유전자를 포함하였다. 당해 앰플리콘 혼합물을 임상 샘플과 동일한 방식으로 서열분석하였다. 기술적인 중복실험을 시행하여 결과를 검증하였다.
139665개 판독물의 총 서열분석 깊이가 수득되었다. 제1 품질 대조군으로서, 각 앰플리콘의 길이를 측정하였다. 도 7에서의 박스앤드위스커 플롯은 중앙값, 25%, 및 75% 4분위수(quartile)가 길이에 있어서 기대된 166 염기의 전부임을 보여준다. 실제로, 서열분석된 대립유전자의 95.45%가 정확하게 166 염기쌍 (bp) 길이고, 반면에 1.08%는 167 bp 길이며 3.48%는 166 bp보다 짧았다. 이것은 예기치 않은 것인데, 그 이유는 서열분석 품질과 판독물 길이간에 기지의 연결고리가 존재하기 때문이다. 주목할 것은 모든 서열이 완전 앰플리콘 길이의 적어도 90%이라는 것이다.
다음으로, 앰플리콘의 각각의 위치에 대하여, 관찰된 뉴클레오티드를 결정하였으며, 그에 따라 각각의 위치에 대하여 139665개 호출(call)이 도출된다. 이들 호출은 뉴클레오티드 (A, C, T 또는 G) 중 하나, 비-측정 뉴클레오티드 (N, 염기 호출 없음), 또는 절단 서열의 경우에 뉴클레오티드의 부재이었다. 각각의 위치에 대하여, 분모(denominator)로서 모든 잠재적 뉴클레오티드를 사용하여 컨센서스 뉴클레오티드 (즉, 관찰된 가장 유력한 뉴클레오티드)의 빈도를 측정하였으며, 그에 따라 올바른 염기 호출이 없는 대립유전자 또는 절단 대립유전자를 배제시키게 된다. (도 8 참조). 15개의 축중성 C를 제외하고는 뉴클레오티드의 대부분 전부에 대해 전체적인 높은 빈도 (즉 > 98%)가 관찰되었다. 비-축중성 C에 대하여, 컨센서스 빈도는 최소로 98.91%이었다. 축중성 C에 대하여, C 및 T 호출의 혼합물로는 대략 50%의 빈도가 기대된다 (즉, 바이어스가 없다는 가정하에). 그러나, 서열분석 바이어스가 관찰되었으며 (즉, > 0.5), 축중성 위치의 대부분에 대하여 메틸화된 C에 비하여 비-메틸화된 C의 보다 높은 빈도가 검출된다 (즉, 비술파이트 처리 후의 T). 도 9는 C와 T 양쪽 모두의 총수에 관련하여 T의 총수를 묘사함으로써 당해 바이어스를 좀더 상세히 설명해주고 있다. 바이어스는 위치 134, 139 및 151에서의 뉴클레오티드에 대하여 보다 적은 것으로 보이지만, T의 평균 빈도는 58.37%이며, 이는 기대치 0.5보다 현저히 더 큰 것이다 (p < 0.0001; t-검정). 절단 서열 및 비-호출 뉴클레오티드를 컨센서스 빈도의 측정시 고려에 넣었을 때 유사한 결과가 수득되었다. 당해 방법으로 측정한 최소 컨센서스 빈도는 93.87%이었다.
최종적으로, 비-컨센서스 뉴클레오티드를 검사하였다. 오직 호출된 뉴클레오티드를 고려할 경우, 단지 15개의 축중성 C가 적어도 50000개 판독물의 높은 커버리지에 도달하지만, 결코 67013개보다 많지는 않다. 모든 다른 뉴클레오티드에 대하여 관찰된 최고 커버리지는 1417개 판독물 또는 1.01% 빈도이었다. 절단 및 비-호출 뉴클레오티드를 고려에 넣었을 때, 비-컨센서스 호출의 빈도는 비-축중성 C에 대하여 6.07% 정도로 높았으며, 그러나 모든 다른 비-컨센서스 호출은 3.5% 미만의 빈도를 가졌다.
대립유전자 바이어스
다음으로, NGS 데이터의 최대 가능성을 설명해 준 상세한 대립유전자 해석을 수행하였다. 이번 단계에서는, 모든 비-축중성 C가 고-컨센서스로 호출되었기 때문에, 오직 축중성 C만이 분석되었다. 20개 (0.01%) 서열이 절단형이었고, 위치 151에서의 15번째 및 최종 축중성 C에 대한 정보를 담고있지 않았다. 모든 가능한 합성 유전자의 등몰 농도를 갖는 앰플리콘 혼합물은 215 = 32768 고유 대립유전자를 함유하였다. 모든 불완전 대립유전자 (즉, 15개의 축중성 C 위치 중 어느 위치에서 비-측정 뉴클레오티드를 갖는 대립유전자)의 필터링 후, 총 125500개 (89.86%) 판독물이 존속되었다 (125500/139665). 필터링 후, 26717개 (81.53%) 고유 대립유전자가 동정될 수 있었으며 (26717/32768), 이는 대립유전자, 즉 모든 가능한 합성 유전자 중 거의 20%가 당해 판독 깊이에서 검출되지 않았음을 시사한다. 도 10은 대립유전자내 C의 개수의 함수 (X-축)로서 대립유전자가 관찰되었던 횟수 (Y-축)로의 박스플롯을 도시한다.
각각의 위치에서 보다 높은 판독 깊이를 갖는 외좌층(outlier)이 존재하였다. 그러나, 서열분석된 대립유전자에 존재하는 C의 개수와 관찰된 판독 깊이간에 명백하고 일반적인 역상관관계가 존재한다. 도 4에서의 뢰스(loess) 회귀선은 이러한 경향을 확인시켜 준다 (곡선). 임의의 서열분석 바이어스의 부재하에 분포가 균일하리라고 가정하면, 기대 판독 깊이는 고유 대립유전자당 3.83이다 (평탄선). 모든 대립유전자가 비-호출 염기를 포함하였을 때 4.26으로의 기대 판독 깊이 증가를 포함시킨다. 그러므로, 개별 뉴클레오티드 수준 및 심지어 더 나아가서는 대립유전자 수준 양쪽 모두에서 명백한 서열분석 바이어스가 존재한다. 그 중에서도 특히, 완전 비-메틸화된 대립유전자 (즉, 축중성 위치에서의 모든 T)가 73회 서열분석되었고, 반면에 완전 메틸화된 대립유전자 (즉, 축중성 위치에서의 모든 C)는 겨우 2회 관찰되었다. 따라서, 완전 메틸화된 대립유전자는 완전 비-메틸화된 대립유전자에 비해 대략 35배 더 얕은 깊이를 보인다. 뢰스 회귀 분석은 커다란 불일치를 평탄화하였지만, 완전 메틸화된 대립유전자에 비하여 완전 비-메틸화된 대립유전자에 대하여 17.5배 증가의 서열 바이어스를 여전히 나타내었다.
최종적으로, 앰플리콘 혼합물중의 모든 고유 대립유전자가 검출되지는 않았다. 상기에서 관찰된 관찰 서열분석 바이어스에 비추어, 비-서열분석 및 비-검출 대립유전자는 T에 비해 보다 많은 C를 우선적으로 함유할 것이다. 실제로, 표 1에서는 T에 비해 보다 많은 C를 함유하는 대립유전자가 십중팔구 보다 덜 서열분석 및 검출되었다는 일반적 경향을 보여주고 있다.
Figure pct00012
결론
합성 유전자의 혼합물 사용시, 커다란 서열 바이어스가 관찰되었다. "메틸화된" 대 "비-메틸화된"으로서 대립유전자를 분류하는 데 사용되는 실제 알고리즘에 따라서는, 혼합물을 서열분석하여 수득한 정보는 특정 대립유전자가 서열분석의 깊이에 기초하여 검출될 가능성의 측정에 사용될 수 있다. 따라서, 합성 유전자의 혼합물은 환자의 메틸화 상태가 정확히 분류되는 것을 보장하기 위하여 정확한 서열분석 깊이를 결정하기 위한 도구로서 사용될 수 있다.
적용 A - 완전 메틸화된 대립유전자의 동정에 요구되는 최소 판독 깊이의 측정
일례로서, 환자의 메틸화 상태는 완전 메틸화된 대립유전자가 환자 샘플의 서열분석에서 관찰된 경우에만 "메틸화된"으로서 분류될 수 있다 (즉, "메틸화된"으로서 상태를 분류하기 위해서는 빈번하고 조밀한 메틸화를 필요로 함). 모든 15개 위치에서 축중성 C를 갖는 합성 유전자의 혼합물을 생성하고 서열분석함으로써, 완전 메틸화된 대립유전자의 오직 2개 판독물이 관찰되었다 (즉, 축중성 위치에서의 모든 C). 그러나, 임의의 바이어스의 부재하에서는 3 내지 4개 판독물이 기대되었을 것이다. (도 4 참조). 최대 관찰된 비-컨센서스 뉴클레오티드는 거의 1500의 판독 깊이를 가졌다. 그러나, 이것은 총 커버리지의 함수이다.
일반적으로, 특정 대립유전자의 동정에 요구되는 최소 서열분석 깊이는 이항 검정을 이용하여 측정될 수 있다. 비-축중성 뉴클레오티드에 기초하여 행해진 분석을 토대로, 관찰된 서열이 서열분석 오류 (즉, 컨센서스 호출)로부터 유래하지 않도록 보장되기 위해서는 적어도 약 2%의 빈도가 요구된다. 이러한 2% 빈도를 최소로서 및 1%를 서열분석 오류에 기인한 백그라운드로서 취하면, 10개의 대립유전자가 총 500 판독물에서 검출되자마자 이항 검정은 유의성이 있게 된다 (p=0.0377). 특정 대립유전자에 대한 최소 판독 깊이에 도달하기 위해서는, 이미 100,000을 상회하고 있는 전체적인 총 커버리지를 완전 메틸화된 대립유전자의 전체적인 기대 빈도 및 관찰 빈도에 기초하여 2.6배 내지 5배 증가시켜야 한다.
적용 B - NGS 플랫폼으로의 MSP 검정의 전임
MSP 검정은 다음의 두 프라이머를 이용한다: 부위 스패닝 5개 C에 어닐링하는 정방향 프라이머; 및 부위 스패닝 3개 C에 어닐링하는 역방향 프라이머. 양쪽 프라이머 사이에 있는 7개 C는 최종 앰플리콘의 일부이지만, MSP를 사용하는 최종 결과에 영향을 미치지 않는다 (즉, 프라이머 사이의 증폭 서열은 MSP에서 성공적인 증폭에 대체로 무관하다). 프라이머는 어닐링 부위에서 완전 메틸화된 역방향 상보체에 결합하도록 설계되지만, 비-완전 매칭물의 증폭이 발생할 수 있으며, 달리는 "워블"로 언급된다. 증폭이 일어나기 위해서는 완벽하게 매칭될 필요가 있는 프라이머의 3' 말단에서의 C를 제외하고는, 이러한 소위 "워블"은 프라이머 위치내 C의 어느 것에서도 발생할 수 있다. 따라서, "워블"은 프라이머 위치내 C 중 6개에서 발생할 수 있다.
이러한 점은 MSP 결과를 적응시킬 때 고려되어야 할 총 27 * 15개, 즉 바꿔 말하면 1920개의 대립유전자를 가져온다. 27은 프라이머 사이 7개 C의 비-관련 상태를 반영하는 계수이고, 반면에 "15"는 "워블"이 고려될 때 프라이머 부위에서 관련 대립유전자의 개수를 반영하는 계수이다. 139665의 총 커버리지에 기초하여, 총 커버리지 또는 오직 완전 서열 (즉, 비-호출 염기 등은 없음)만이 고려되는지에 따라 그들 1920개 대립유전자가 7353 내지 8184회 관찰되어야 한다고 계산될 수 있다. 그러나, 종합한 모든 이들 대립유전자는 단지 3072회 관찰되거나, 즉 바꿔 말하면 기대 빈도의 37.5% 내지 41.8%이다. 200의 커버리지가 환자가 메틸화되었다고 호칭하기 위한 최소한도라고 생각된다면, 그에 따라 커버리지는 샘플당 대략 10000 (즉, 9093) 판독물의 깊이로 낮출 수 있다. 당해 분석을 개별 C 뉴클레오티드에 취하면, 역방향 프라이머내 메틸화된 C의 기대 빈도는 (10/15)*200/9093, 즉 바꿔 말하면 1.47%일 것이며, 여기에서 모든 가능성이 균일하게 존재한다고 가정하면, "10/15"는 MSP에 의한 모든 증폭가능한 대립유전자 (200개 예상) 중에서 역방향 프라이머내 "워블" 뉴클레오티드 위치의 하나에서의 C의 개수를 반영한다. 백그라운드를 포함시키면, 이들은 총 9093개 판독물에서 검출된다. 이항 검정은 이것이 관찰되었던 대략 1% 서열분석 오류보다 여전히 현저히 더 크다는 것을 표시한다 (p=0.0008). 유사한 계산이 대립유전자 수준에서 행해질 수 있으며, 여기에서 98개 비-메틸화된 세포의 백그라운드에서 대략 2개의 메틸화된 세포가 검출될 수 있다.
적용 C - 검출 감도의 측정
실제 감도는 2%보다 현저히 더 크며, 그 이유는 이것이 검출의 한계가 아니기 때문이다. 서열분석 오류가 무작위적이고 서로 독립적인 것으로 생각될 때 및 커버리지가 충분히 클 때, 그에 따라 개별 뉴클레오티드 수준에서의 오류는 배가될 수 있거나, 또는 검출 한계는 1%*1%*1%*1%*1%*1%*1%*1% 또는 1e16 대립유전자중 불과 1개로서 계산될 수 있다. 후자의 커버리지는 현실적으로 달성될 수 없기 때문에, 1개의 동일한 대립유전자에서 다중 오류가 발생하기 마련이다. 오류를 평가하기 위하여, 정방향 및 역방향 프라이머로부터의 모든 8개 C 위치가 검사될 수 있다. 서열분석 오류는 위치가 호출되지 않는 위치 또는 장소에서 A 또는 G가 관찰되는 경우에 특성화될 수 있다. 이러한 점은, C → T 또는 T → C 서열분석 오류 관찰 무능력에 기인하여, 감도의 경미한 과대평가 또는 검출의 실제 한계의 과소평가를 가져올 수 있다. 전체 139665 판독물 중에서 단지 115개만이 2개 이상의 그러한 오류 (즉, 두 서열분석 오류가 동일 대립유전자에서 발생하는 관찰된 기회)를 함유한다. MSP 앰플리콘에 기반한 NGS 검정을 이용하여, 1214개 세포의 백그라운드중 1개 세포의 검출 감도가 달성될 수 있다 (즉, 그 수준 밑에서는 관찰된 대립유전자 빈도가 서열분석 오류에 기인한 것이 아니라고 확신할 수 없는 검출 수준). 당해 검출 감도는 샘플의 메틸화 여부를 측정하기 위하여 고정비가 적용되고, 그에 따라 998개 비-메틸화된 세포의 백그라운드에서 2개 세포의 검출 한계로 귀착되는, 즉 바꿔 말하면 NGS 검정에 대한 것에 비해 거의 2.5 더 높은 MSP 검정보다 현저히 더 양호할 수 있다. 그러나, MSP 검정에 대한 고정비는 대규모 시리즈의 샘플을 가로질러 메틸화 비의 2모드성 분포에 기초한다.
요약
SEQ_C_YR 합성 유전자는: (1) 종종 검정으로 동정해 낼 필요가 있는 대립유전자의 과소대표(underrepresentation)의 원인이 되는 서열분석 바이어스를 결정하기 위하여; (2) 특정 대립유전자의 검출에 요구되는 최소 커버리지를 측정하기 위하여; (3) 감도 (진단적 의미에서)와 특이성 (진단적 및 DNA 서열 의미에서)의 점에서 성능 특징을 검증하기 위하여; 및 (4) 특정 대립유전자는 검출하기 어려울 수 있다고 알고 있기 때문에 적절한 NGS 검정의 구축에 도움을 주기 위하여; 서열분석 방법에서 교정자(calibrator)로서 이용될 수 있다.
전술한 설명에서, 통상의 기술자에게는 본 발명의 범위와 취지로부터 일탈함이 없이 본원에 개시된 본 발명에 다양한 치환 및 변형이 행해질 수 있음이 바로 명백할 것이다. 본원에 예시적으로 기재된 본 발명은 적절하게는 본원에 구체적으로 개시되지 않는 임의의 요소 또는 요소들, 제한 또는 제한들의 부재하에 실시될 수 있다. 채용되고 있는 용어 및 표현은 제한이 아니라 설명의 용어로서 사용되며, 그러한 용어와 표현의 사용에 있어서, 예시되고 기재된 특색의 임의의 등가물 또는 그들의 일부를 배제할 의도는 없으며, 본 발명의 범위 안에서 다양한 변형이 가능하다고 인식된다. 따라서, 비록 본 발명이 구체적 실시양태 및 임의적인 특색에 의하여 실례를 들어 설명되었지만, 본원에 개시된 개념의 변형 및/또는 변화는 통상의 기술자에 의하여 호소될 수 있다는 것, 및 그러한 변형 및 변화는 본 발명의 범위 안에 있는 것으로 간주된다는 것을 이해하여야 한다.
다수의 특허 및 비-특허 참조문헌이 본원에 인용되었다. 인용 참조문헌은 그 전문이 본원에 참조로 포함된다. 인용 참조문헌에서의 용어의 정의와 비교하여 본 명세서에서의 용어의 정의 사이에 불일치가 존재하는 경우에는, 그 용어는 명세서에서의 정의에 기초하여 해석되어야 한다.
SEQUENCE LISTING <110> MDxHealth SA Van Criekinge, Wim <120> METHODS AND KITS FOR IDENTIFYING AND ADJUSTING FOR BIAS IN SEQUENCING OF POLYNUCLEOTIDE SAMPLES <130> 5545-00020 <150> 61/763,771 <151> 2013-02-12 <160> 18 <170> PatentIn version 3.5 <210> 1 <211> 17 <212> DNA <213> Artificial <220> <223> Random nucleotide sequence provided for illustrative purposes <400> 1 acgtacgtya cgtacgt 17 <210> 2 <211> 17 <212> DNA <213> Artificial <220> <223> Random nucleotide sequence provided for illustrative purposes <400> 2 acgtacgtca cgtacgt 17 <210> 3 <211> 17 <212> DNA <213> Artificial <220> <223> Random nucleotide sequence provided for illustrative purposes <400> 3 acgtacgtta cgtacgt 17 <210> 4 <211> 17 <212> DNA <213> Artificial <220> <223> Random nucleotide sequence provided for illustrative purposes <220> <221> misc_feature <222> (9)..(9) <223> n is a, c, g, or t <400> 4 acgtacgtna cgtacgt 17 <210> 5 <211> 17 <212> DNA <213> Artificial <220> <223> Random nucleotide sequence provided for illustrative purposes <400> 5 acgtacgtca cgtacgt 17 <210> 6 <211> 17 <212> DNA <213> Artificial <220> <223> Random nucleotide sequence provided for illustrative purposes <400> 6 acgtacgtta cgtacgt 17 <210> 7 <211> 17 <212> DNA <213> Artificial <220> <223> Random nucleotide sequence provided for illustrative purposes <400> 7 acgtacgtaa cgtacgt 17 <210> 8 <211> 17 <212> DNA <213> Artificial <220> <223> Random nucleotide sequence provided for illustrative purposes <400> 8 acgtacgtga cgtacgt 17 <210> 9 <211> 338 <212> DNA <213> Homo sapiens <400> 9 cctgctgtct gtttactccc taggccccgc tggggacctg ggaaagaggg aaaggcttcc 60 ccggccagct gcgcggcgac tccggggact ccagggcgcc cctctgcggc cgacgcccgg 120 ggtgcagcgg ccgccggggc tggggccggc gggagtccgc gggaccctcc agaagagcgg 180 ccggcgccgt gactcagcac tggggcggag cggggcggga ccacccttat aaggctcgga 240 ggccgcgagg ccttcgctgg agtttcgccg ccgcagtctt cgccaccagt gagtacgcgc 300 ggcccgcgtc cccggggatg gggctcagag ctcccagc 338 <210> 10 <211> 183 <212> DNA <213> Homo sapiens <400> 10 gaaaggcttc cccggccagc tgcgcggcga ctccggggac tccagggcgc ccctctgcgg 60 ccgacgcccg gggtgcagcg gccgccgggg ctggggccgg cgggagtccg cgggaccctc 120 cagaagagcg gccggcgccg tgactcagca ctggggcgga gcggggcggg accaccctta 180 taa 183 <210> 11 <211> 18 <212> DNA <213> Artificial <220> <223> Primer utilized for amplifying human GSTP1 gene <400> 11 cggggtgtag cggtcgtc 18 <210> 12 <211> 21 <212> DNA <213> Artificial <220> <223> Primer utilized for amplifying human GSTP1 gene <400> 12 ccgccccaat actaaatcac g 21 <210> 13 <211> 20 <212> DNA <213> Artificial <220> <223> Primer utilized for amplifying human GSTP1 gene <400> 13 gaaagaggga aaggtttttt 20 <210> 14 <211> 20 <212> DNA <213> Artificial <220> <223> Primer utilized for amplifying human GSTP1 gene <400> 14 aaccttataa aaataatccc 20 <210> 15 <211> 191 <212> DNA <213> Artificial <220> <223> Partial sequence of bisulfite-treated and amplified human GSTP1 gene <400> 15 gaaagaggga aaggtttttt cggttagttg cgcggcgatt tcggggattt tagggcgttt 60 ttttgcggtc gacgttcggg gtgtagcggt cgtcggggtt ggggtcggcg ggagttcgcg 120 ggatttttta gaagagcggt cggcgtcgtg atttagtatt ggggcggagc ggggcgggat 180 tatttttata a 191 <210> 16 <211> 195 <212> DNA <213> Artificial <220> <223> Partial sequence of human GSTP1 gene having Y degeneracy at CpG positions <400> 16 gaaagaggga aaggtttttt cggttagttg cgcggcgatt tcggggattt tagggcgttt 60 ttttgcggtc gacgttyggg gtgtagyggt ygtyggggtt ggggtyggcg ggagttcgcg 120 ggatttttta gaagagcggt yggygtygtg atttagtatt ggggyggagc ggggcgggat 180 tatttttata aggtt 195 <210> 17 <211> 197 <212> DNA <213> Artificial <220> <223> Partial sequence of human GSTP1 gene having Y degeneracy at CpG positions and including a CC tag <400> 17 gaaagaggga aaggtttttt cggttagttg cgcggcgatt tcggggattt cctagggcgt 60 ttttttgcgg tcgacgttyg gggtgtagyg gtygtygggg ttggggtygg cgggagttcg 120 cgggattttt tagaagagcg gtyggygtyg tgatttagta ttggggygga gcggggcggg 180 attattttta taaggtt 197 <210> 18 <211> 15 <212> DNA <213> Artificial <220> <223> Primer for amplifying sequence of human GSTP1 gene having Y degeneracy at CpG positions and including a CC tag <400> 18 ttcggggatt cctta 15

Claims (33)

  1. 뉴클레오티드 위치에서 상이한 뉴클레오티드를 갖는 이종 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 뉴클레오티드를 결정하는 방법이며,
    (a) 뉴클레오티드 위치를 스패닝하는 폴리뉴클레오티드 샘플의 표적 영역을 서열분석하는 단계; 및
    (b) 폴리뉴클레오티드 단편의 세트를 서열분석하는 단계 (여기서, 폴리뉴클레오티드 단편은 폴리뉴클레오티드 샘플의 표적 영역에 상응하는 폴리뉴클레오티드 서열을 포함하고, 폴리뉴클레오티드 단편은 폴리뉴클레오티드 단편을 표적 영역과 구별하기 위한 뉴클레오티드 태그를 추가로 포함하며, 폴리뉴클레오티드 단편의 세트는 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 상이한 뉴클레오티드를 갖는 2종 이상의 상이한 폴리뉴클레오티드 단편을 포함함)
    를 포함하는 방법.
  2. 제1항에 있어서, 동일 반응 혼합물에서 폴리뉴클레오티드 샘플을 서열분석하는 단계 및 폴리뉴클레오티드 단편의 세트를 서열분석하는 단계를 포함하는 방법.
  3. 제2항에 있어서, 폴리뉴클레오티드 샘플 및 폴리뉴클레오티드 단편이 동일 반응 혼합물에 등몰량으로 존재하는 것인 방법.
  4. 제1항에 있어서, 서열분석 수행이 딥 시퀀싱(deep sequencing) 수행을 포함하는 것인 방법.
  5. 제1항에 있어서, 뉴클레오티드 위치에서 뉴클레오티드를 검출하는데 요구되는 서열분석의 깊이를 결정하는 단계를 추가로 포함하는 방법.
  6. 제1항에 있어서, 뉴클레오티드 위치에서 상이한 뉴클레오티드에 대한 서열분석 바이어스를 결정하는 단계를 추가로 포함하는 방법.
  7. 제1항에 있어서, 폴리뉴클레오티드 단편의 세트가 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 시토신 또는 티민을 갖는 2종 이상의 상이한 폴리뉴클레오티드 단편을 포함하는 것인 방법.
  8. 제7항에 있어서, 폴리뉴클레오티드 단편의 세트가 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 시토신 또는 티민을 갖는 2종의 상이한 폴리뉴클레오티드 단편의 등몰량을 포함하는 것인 방법.
  9. 제8항에 있어서, 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 시토신 또는 티민에 대한 오류 발견률을 측정하는 단계를 추가로 포함하는 방법.
  10. 제1항에 있어서, 폴리뉴클레오티드 단편의 세트가 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 아데닌, 구아닌, 시토신 또는 티민을 갖는 4종 이상의 상이한 폴리뉴클레오티드 단편을 포함하는 것인 방법.
  11. 제10항에 있어서, 폴리뉴클레오티드 단편의 세트가 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 아데닌, 구아닌, 시토신 또는 티민을 갖는 4종의 상이한 폴리뉴클레오티드 단편의 등몰량을 포함하는 것인 방법.
  12. 제11항에 있어서, 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 아데닌, 구아닌, 시토신 또는 티민에 대한 오류 발견률을 측정하는 단계를 추가로 포함하는 방법.
  13. 제1항에 있어서, 폴리뉴클레오티드 샘플이 게놈 DNA를 포함하는 것인 방법.
  14. 제13항에 있어서, 게놈 DNA가 서열분석 이전에 DNA 중 비-메틸화된 시토신 잔기를 선택적으로 변형시켜 검출가능한 변형된 잔기를 생성하지만 메틸화된 시토신 잔기는 변형시키지 않는 시약으로 처리되는 것인 방법.
  15. 제14항에 있어서, 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서의 뉴클레오티드가 메틸화된 시토신 또는 변형된 잔기이고, 폴리뉴클레오티드 단편의 세트가 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 시토신 또는 티민을 갖는 2종 이상의 상이한 폴리뉴클레오티드 단편을 포함하는 것인 방법.
  16. 제15항에 있어서, 비-메틸화된 시토신을 갖는 폴리뉴클레오티드 샘플의 이종 폴리뉴클레오티드에 대한 메틸화된 시토신을 갖는 폴리뉴클레오티드 샘플의 이종 폴리뉴클레오티드의 비를 계산하는 단계를 추가로 포함하는 방법.
  17. 제1항에 있어서, 뉴클레오티드 태그가 폴리뉴클레오티드 샘플의 표적 영역에 존재하지 않는 적어도 약 2개 뉴클레오티드의 뉴클레오티드 서열을 포함하고, 폴리뉴클레오티드 단편의 세트의 서열분석이 뉴클레오티드 태그를 포함하는 폴리뉴클레오티드에 특이적으로 혼성화하는 프라이머를 사용하는 단계를 포함하는 것인 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 2개 이상의 상이한 뉴클레오티드 위치에서 상이한 뉴클레오티드를 갖는 이종 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드 샘플의 2개 이상의 상이한 뉴클레오티드 위치에서 2종 이상의 뉴클레오티드를 결정하는 단계를 포함하며, 상기 단계는
    (a) 2개 이상의 상이한 뉴클레오티드 위치를 스패닝하는 폴리뉴클레오티드 샘플의 표적 영역을 서열분석하는 단계; 및
    (b) 폴리뉴클레오티드 단편의 세트를 서열분석하는 단계 (여기서, 폴리뉴클레오티드 단편의 세트는 폴리뉴클레오티드 샘플의 표적 영역에 상응하는 폴리뉴클레오티드 서열을 포함하고, 폴리뉴클레오티드 단편은 폴리뉴클레오티드 단편을 표적 영역과 구별하기 위한 뉴클레오티드 태그를 추가로 포함하며, 폴리뉴클레오티드 단편의 세트는 폴리뉴클레오티드 샘플의 2개 이상의 상이한 뉴클레오티드 위치에서 2종 이상의 상이한 뉴클레오티드를 갖는 2종 이상의 상이한 폴리뉴클레오티드 단편을 포함함)
    를 포함하는 것인 방법.
  19. 제18항에 있어서, 폴리뉴클레오티드 단편의 세트가 폴리뉴클레오티드 샘플의 2개 이상의 뉴클레오티드 위치에서 시토신 또는 티미딘을 갖는 상이한 폴리뉴클레오티드 단편을 포함하는 것인 방법.
  20. 제19항에 있어서, 폴리뉴클레오티드 단편의 세트가 폴리뉴클레오티드 샘플의 2개 이상의 뉴클레오티드 위치에서 시토신 또는 티미딘을 갖는 폴리뉴클레오티드 단편의 모든 가능한 상이한 조합을 포함하는 것인 방법.
  21. 제20항에 있어서, 폴리뉴클레오티드 단편의 세트가 폴리뉴클레오티드 샘플의 2개 이상의 뉴클레오티드 위치에서 시토신 또는 티미딘을 갖는 폴리뉴클레오티드 단편의 모든 가능한 상이한 조합을 등몰량으로 포함하는 것인 방법.
  22. 제18항에 있어서, 폴리뉴클레오티드 단편의 세트가 폴리뉴클레오티드 샘플의 2개 이상의 뉴클레오티드 위치에서 아데닌, 구아닌, 시토신 또는 티민을 갖는 상이한 폴리뉴클레오티드 단편을 포함하는 것인 방법.
  23. 제22항에 있어서, 폴리뉴클레오티드 단편의 세트가 폴리뉴클레오티드 샘플의 2개 이상의 뉴클레오티드 위치에서 아데닌, 구아닌, 시토신 또는 티민을 갖는 폴리뉴클레오티드 단편의 모든 가능한 상이한 조합을 포함하는 것인 방법.
  24. 제23항에 있어서, 폴리뉴클레오티드 단편의 세트가 폴리뉴클레오티드 샘플의 2개 이상의 뉴클레오티드 위치에서 아데닌, 구아닌, 시토신 또는 티민을 갖는 폴리뉴클레오티드 단편의 모든 가능한 상이한 조합을 등몰량으로 포함하는 것인 방법.
  25. 뉴클레오티드 위치에서 상이한 뉴클레오티드를 갖는 이종 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 뉴클레오티드를 결정하는 키트이며,
    (a) (i) 뉴클레오티드 위치를 스패닝하는 폴리뉴클레오티드 샘플의 표적 영역의 서열분석; 및
    (ii) 폴리뉴클레오티드 단편의 세트의 서열분석
    를 위한 올리고뉴클레오티드 프라이머; 및
    (b) 폴리뉴클레오티드 단편의 세트 (여기서, 폴리뉴클레오티드 단편은 폴리뉴클레오티드 샘플의 표적 영역에 상응하는 폴리뉴클레오티드 서열을 포함하고, 폴리뉴클레오티드 단편은 폴리뉴클레오티드 단편을 표적 영역과 구별하기 위한 뉴클레오티드 태그를 추가로 포함하고, 폴리뉴클레오티드 단편의 세트는 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 상이한 뉴클레오티드를 갖는 2종 이상의 상이한 폴리뉴클레오티드 단편을 포함함)
    를 포함하는 것인 키트.
  26. 제25항에 있어서, 폴리뉴클레오티드 단편의 세트가 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 시토신 또는 티민을 갖는 2종 이상의 상이한 폴리뉴클레오티드 단편을 포함하는 것인 키트.
  27. 제26항에 있어서, 폴리뉴클레오티드 단편의 세트가 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 시토신 또는 티민을 갖는 2종의 상이한 폴리뉴클레오티드 단편의 등몰량을 포함하는 것인 키트.
  28. 제25항에 있어서, 폴리뉴클레오티드 단편의 세트가 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 아데닌, 구아닌, 시토신 또는 티민을 갖는 4종 이상의 상이한 폴리뉴클레오티드 단편을 포함하는 것인 키트.
  29. 제28항에 있어서, 폴리뉴클레오티드의 세트가 폴리뉴클레오티드 샘플의 뉴클레오티드 위치에서 아데닌, 구아닌, 시토신 또는 티민을 갖는 4종의 상이한 폴리뉴클레오티드 단편의 등몰량을 포함하는 것인 키트.
  30. 제27항에 있어서, 표적 영역이 뉴클레오티드 위치에 대하여 5'인 폴리뉴클레오티드 샘플의 적어도 약 20개 뉴클레오티드를 포함하고, 표적 영역이 뉴클레오티드 위치에 대하여 3'인 폴리뉴클레오티드 샘플의 적어도 약 20개 뉴클레오티드를 포함하는 것인 키트.
  31. 제27항에 있어서, 표적 영역이 뉴클레오티드 위치에 대하여 5'인 폴리뉴클레오티드 샘플의 적어도 약 50개 뉴클레오티드를 포함하고, 표적 영역이 뉴클레오티드 위치에 대하여 3'인 폴리뉴클레오티드 샘플의 적어도 약 50개 뉴클레오티드를 포함하는 것인 키트.
  32. 제27항 내지 제33항 중 어느 한 항에 있어서, 뉴클레오티드 태그가 폴리뉴클레오티드 샘플의 표적 영역에 존재하지 않는 적어도 약 2개 뉴클레오티드의 뉴클레오티드 서열을 포함하는 것인 키트.
  33. 제27항에 있어서, 폴리뉴클레오티드 샘플의 서열분석을 수행하기 위한 1종 이상의 시약을 추가로 포함하는 키트.
KR1020157024623A 2013-02-12 2014-02-12 폴리뉴클레오티드 샘플의 서열분석에서 바이어스를 확인하고 조정하는 방법 및 키트 KR20160002705A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361763771P 2013-02-12 2013-02-12
US61/763,771 2013-02-12
PCT/IB2014/058942 WO2014125421A1 (en) 2013-02-12 2014-02-12 Methods and kits for identifying and adjusting for bias in sequencing of polynucleotide samples

Publications (1)

Publication Number Publication Date
KR20160002705A true KR20160002705A (ko) 2016-01-08

Family

ID=50239704

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157024623A KR20160002705A (ko) 2013-02-12 2014-02-12 폴리뉴클레오티드 샘플의 서열분석에서 바이어스를 확인하고 조정하는 방법 및 키트

Country Status (10)

Country Link
US (1) US10119166B2 (ko)
EP (1) EP2956553B1 (ko)
JP (1) JP2016506755A (ko)
KR (1) KR20160002705A (ko)
CN (1) CN105473734A (ko)
AU (1) AU2014217518A1 (ko)
BR (1) BR112015019425A2 (ko)
CA (1) CA2901120C (ko)
IL (1) IL240535A0 (ko)
WO (1) WO2014125421A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10036316B2 (en) * 2012-10-02 2018-07-31 United Technologies Corporation Geared turbofan engine with high compressor exit temperature
CN105893788B (zh) * 2016-04-26 2018-04-17 哈尔滨工程大学 利用参考基因组信息的半导体测序平台的测序数据校正方法
JP7036438B2 (ja) 2016-05-06 2022-03-15 リージェンツ オブ ザ ユニバーシティ オブ ミネソタ 分析標準及びその使用方法
US20200010907A1 (en) * 2017-03-17 2020-01-09 Mdxhealth Sa Mgmt epigenetic deep-sequencing assay

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2366459A1 (en) * 1999-03-26 2000-10-05 Affymetrix, Inc. Universal arrays
US20060275782A1 (en) 1999-04-20 2006-12-07 Illumina, Inc. Detection of nucleic acid reactions on bead arrays
US20100035249A1 (en) * 2008-08-05 2010-02-11 Kabushiki Kaisha Dnaform Rna sequencing and analysis using solid support

Also Published As

Publication number Publication date
IL240535A0 (en) 2015-10-29
AU2014217518A1 (en) 2015-09-03
BR112015019425A2 (pt) 2017-08-22
CA2901120A1 (en) 2014-08-21
EP2956553B1 (en) 2020-01-08
CA2901120C (en) 2021-05-04
US20160017415A1 (en) 2016-01-21
JP2016506755A (ja) 2016-03-07
WO2014125421A1 (en) 2014-08-21
CN105473734A (zh) 2016-04-06
US10119166B2 (en) 2018-11-06
EP2956553A1 (en) 2015-12-23

Similar Documents

Publication Publication Date Title
JP6082141B2 (ja) Dna試料の分類
JP6968894B2 (ja) メチル化dnaの多重検出方法
EP2885427B1 (en) Colorectal cancer methylation marker
US9540697B2 (en) Prostate cancer markers
WO2017112738A1 (en) Methods for measuring microsatellite instability
KR20160002705A (ko) 폴리뉴클레오티드 샘플의 서열분석에서 바이어스를 확인하고 조정하는 방법 및 키트
WO2020034888A1 (zh) 诊断肿瘤的dna甲基化相关的标记物及其应用
US20220364173A1 (en) Methods and systems for detection of nucleic acid modifications
KR101561034B1 (ko) 이노신 함유 변형 프라이머를 이용한 바이설파이트 처리에 의해 변환된 dna의 메틸화 검출방법
EP2788505B1 (en) Methods of detecting mutations and epigenetic changes
US20180223367A1 (en) Assays, methods and compositions for diagnosing cancer
JP2023500923A (ja) 大腸癌検出方法
JP7447155B2 (ja) Sdc2遺伝子のメチル化検出方法
KR102652502B1 (ko) 대사증후군 예측용 후성유전 메틸화 마커, 및 이를 이용한 키트
WO2024075828A1 (ja) アルツハイマー病を発症する可能性を判定するためのデータ収集方法及びキット
KR20240104309A (ko) 폐암 특이적 메틸화 마커 유전자를 이용한 폐암 검출 방법
US20100003680A1 (en) Method For Determining The Methylation Rate of a Nucleic Acid
JP2005198533A (ja) 哺乳動物の神経芽細胞腫の予後を判定する方法

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid