KR101862756B1 - 관심있는 3-d 게놈 영역 서열화 전략 - Google Patents

관심있는 3-d 게놈 영역 서열화 전략 Download PDF

Info

Publication number
KR101862756B1
KR101862756B1 KR1020137003437A KR20137003437A KR101862756B1 KR 101862756 B1 KR101862756 B1 KR 101862756B1 KR 1020137003437 A KR1020137003437 A KR 1020137003437A KR 20137003437 A KR20137003437 A KR 20137003437A KR 101862756 B1 KR101862756 B1 KR 101862756B1
Authority
KR
South Korea
Prior art keywords
dna
sequence
fragment
interest
fragments
Prior art date
Application number
KR1020137003437A
Other languages
English (en)
Other versions
KR20130049808A (ko
Inventor
막스 얀 반 민
보테르 레오나르 드 라트
Original Assignee
세르겐티스 비.브이.
코닌클리즈케 네덜란드세 아카데미 반 베텐샤펜
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 세르겐티스 비.브이., 코닌클리즈케 네덜란드세 아카데미 반 베텐샤펜 filed Critical 세르겐티스 비.브이.
Publication of KR20130049808A publication Critical patent/KR20130049808A/ko
Application granted granted Critical
Publication of KR101862756B1 publication Critical patent/KR101862756B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/101Crosslinking agents, e.g. psoralen
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/107Chemical cleaving agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/30Oligonucleotides characterised by their secondary structure
    • C12Q2525/307Circular oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • General Chemical & Material Sciences (AREA)

Abstract

본 발명은 교차 연결된 DNA 단편화, 단편화된 교차 연결된 DNA 결합, 표적 뉴클레오타이드 서열을 포함한 결합된 DNA 단편의 적어도 한 부분의 서열을 결정하고 교차연결 역전 및 표적 뉴클레오타이드 서열을 포함하는 관심있는 게놈(genomic) 영역의 서열 결정 방법에 관한 것이다.

Description

관심있는 3-D 게놈 영역 서열화 전략{3-D genomic region of interest sequencing strategies}
본 발명은 분자 생물학의 분야이고 더욱 특별히 DNA 기술에 관한 것이다. 본 발명은 더욱 자세하게 DNA의 서열화에 관한 것이다. 본 발명은 관심있는 게놈 영역의 DNA 서열(부분) 결정을 위한 전략에 관한 것이다. 특히, 본 발명은 서로 공간적 구성에 게놈 영역의 상기 서열의 결정에 관한 것이다. 더욱이, 본 발명은 종양 및 다른 상태로 있는 조직의 스크리닝에 있어서, 개별화된(personalised) 진단 및 의학적 치료의 개발에 있어서 본 발명의 방법의 사용에 관한 것이다.
DNA 샘플의 게놈 영역에 있어서 선택적으로 캡처 및/또는 선택적으로 증폭 및 순차적으로 순서가 되어있는 시퀀싱을 위한 "표적 농축(target enrichment)" 전략을 개발하기 위해 상당한 노력을 다해왔다(Mamanova et al., Nature Methods, 2010, (2):111-118에 리뷰되었다). 게놈 농축 전략은 특정 게놈 영역에 집중할 수 있도록 하기 때문에, 완벽한 게놈 분석에 비교해서 시간 및 비용면에서 더욱 효과적이고 또한 분석하는데 훨씬 덜 어렵기 때문에 중요하다. 다른 게놈 농축 전략이 존재한다. 예를 들어, 단일 프라이머 쌍을 사용한 PCR 반응 수행은 게놈 영역을 증폭할 것이고 그래서 게놈 영역을 농축한다. 그러나, 상기 PCR 생산물의 크기는 제한해서 만들 수 있다. 긴 PCR 프로토콜은 현재 증폭할 수 있는 10 내지 40 kb의 이상 제한을 갖지만(Cheng et al., Proc Natl Acad Sci U S A, 1994; 91(12): 5695699), 이러한 접근법은 견고성 부족한 경향이 있고 각 PCR은 최적화 및 검증을 필요로 하고, 여전히 크기 제한은 제한된다. 증폭될 수 있는 영역의 크기뿐만 아니라 분석의 견고성을 향상시키기 위해서, 타일화(tiled) 접근 방식은 관심의 게놈 영역을 위해 특별히 설계된 수많은 PCR 프라이머 쌍을 사용하여 개발되었다. 이러한 프라이머들은 다중 PCR 접근 또는 레인단스(RainDance) PCR에 있어서 예를 위하여 사용된다. 표적 원형화와 같은 다양한 효소적 방법은 표적화된 증폭 전략과 호환된다. 다른 방법들은, 어레이 또는 수용액 상에서, 혼성화를 통한 관심있는 게놈 영역을 포획하기 위해 사용하는 길이에 있어서 60 내지 120 염기의 프로브를 포함하는 포획 프로브(capture probes)의 사용을 수반한다.
상기 예시로부터 명확한 바와 같이, 관심있는 게놈 영역을 농축하기 위해서, 관심있는 게놈 영역을 통한 서열 정보는 프로브 및/또는 포획을 위한 프라이머들 및/또는 관심있는 게놈 영역의 증폭 설계에 필요하기 때문에 사전에 요구된다. 예를 들어, 30 Mb 서열을 농축하기 위해서, 6,000 번의 별도의 PCRs이 일반적으로 요구된다. 포획 프로브를 가지고 요구된 120 bp 프로브 적어도 250,000보다 많은 심지어 더욱 서열 정보가 요구되고 30 Mb 서열을 포획하기 위해서 설계되어야만 한다. 이러한 분석은 상기 프로브 및/또는 관심있는 게놈 영역을 광범위하게 커버하는 프라이머를 위한 서열 정보를 사용에 의해서 편향된다. 그들은 설계된 주형 서열로부터 너무 많은 이탈한 서열은 선별하지 않고 따라서 예를 들어 삽입은 검출하지 않을 것이다. 게다가, 이러한 접근 방식은 일반적으로 상기 분석 전에 약 100 염기 쌍의 서열로 DNA 단편화가 필요하다. 이것은 관심 영역 내에서 재배열(rearrangements) 간주하기 때문에, 정보의 손실로 결과된 많은 조각 이상으로 부서진 구별된 관심있는 게놈 영역을 의미한다. 그래서, 수천의 짧은 서열을 요구하지 않고 관심있는 상기 영역의 자연적으로 완전한 서열화 가설을 가능케 하는 훨씬 덜 편향된 개선된 게놈 농축 전략을 위한 요구가 있다.
포유류 핵의 구조물의 연구에 있어서, 분석될 수 있는 게놈 영역의 구조 조직을 갖는 염색체 형태 포획(3C/4C) 분석이 개발되었다(WO 2007/004057, WO 2008/08845). 이러한 기술들은 세포의 생체 내(in vivi) 교차 연결, 예를 들어, 포름알데하이드(formaldehyde)를 가지고 그들의 3차원 구조물에 있어서 고정된 상기 DNA를 포함하는 염색질 구조와 같은 것을 수반한다. 다음으로, 상기 염색질(chromatin)은 예를 들어 제한효소로 단편화되고 상기 교차 연결된 DNA 단편의 결합이 뒤따른다. 그 결과, 서로 근접한 DNA 단편들이 결합된다. 상기 결합 생산물은 순차적으로 PCR 증폭되고 단편의 상기 근접도로 지시된 결합된 DNA 단편의 상호작용(interaction) 빈도를 위해서 분석된다. 상기 PCR 증폭은 관심있는 상기 게놈 영역 안에 표적 서열 위에 기초될 수 있다. 상호작용의 높은 빈도는 먼 근접도를 의미한다. 상기 DNA 단편을 확인하기 위해서, 서열정보가 요구된다. 이 같은 서열정보는 프로브를 포함하는 마이크로어레이를 가지고 증폭된 단편 검출 또는 증폭된 단편(일반적으로 최소한 20 내지 30 염기 쌍이 게놈 상에 연관된 위치를 확인하기 위해서 충분하다)의 작은 부분의 서열화에 의해서 제공될 수 있다. 어떤 경우에 있어서, 상기 수많은 DNA 단편은, 예를 들어, 염색체내부(intrachromosomal) 및 염색체끼리(interchromosomal) 상호작용을 결정하기 위해 사용된 정보에 관찰점에서 상기 단편의 근접도를 의미하는 상호 작용의 빈도로 확인되었다.
세포 안에서 DNA 교차연결 및 단편화 그리고 교차-연결된 DNA 단편의 순차적인 결합의 과정은 표적 뉴클레오타이드 서열, 예를 들어 표적 뉴클레오타이드 서열을 둘러싼 선형화된 염색체 주형을 포함하는 관심있는 게놈 영역의 분석을 위한 독특한 시작점을 제공한다는 것을 이제 발견하였다. 본 발명은 DNA 교차 결합은 선형 염색체 주형 상에서 가까운 서열을 표적 뉴클레오타이드 서열에 우선적으로 교차 연결한다는 개념에 기초한다. 예를 들어, 포름알데하이드(Formaldehyde)는 교차연결자로서 사용될 수 있다. 교차연결 이후, 상기 DNA는 그것의 교차연결 상태에 DNA가 남아있는 동안 (효소적)처리, 예를 들어, 단편화 및 결합을 받을 수 있다. 서로 근접해 있는 교차연결된 단편들만이 결합될 수 있다. 표적 뉴클레오타이드 서열을 포함하는 DNA 단편에 연결되는 DNA 단편은 실제로 표적 뉴클레오타이드 서열을 포함하는 관심 게놈 영역을 대표한다. 이것은 염색체 내(intra-chromosomal) 교차연결의 기회가 평균적으로 항상 염색체 간(interchromosomal) 교차연결 빈도보다 높기 때문이다. 일반적으로 다른 단편이 교차연결될 기회는 직선 거리와 반대로 관련된다. 실제 교차연결 조건에 따라 추정하면, 관심있는 표적 뉴클레오타이드와 결합된 단편의 20 내지 30%는 표적 뉴클레오타이드 서열로부터 0.5 Mb 이내에 위치하는 반면, 관심있는 표적 뉴클레오타이드와 결합된 단편의 50 내지 80%는 표적 뉴클레오타이드 서열을 포함하는 염색체로부터 비롯된다. 상기 표적 뉴클레오타이드 서열을 포함하는 결합된 DNA 단편 및 관심있는 게놈 영역은 표적 뉴클레오타이드 서열을 인식하는 하나 또는 그 이상 올리고뉴클레오타이드 프라이머 사용에 의해서 증폭, 즉 농축된다. 상기 관심있는 게놈 영역의 서열은 이 분야에 잘 알려진 (초고속) 서열화 기술을 사용해서 순차적으로 결정될 수 있다. 상기 관심있는 게놈 영역에 집중하기 위해 광범위한 서열정보가 요구되지 않기 때문에 상기 방법은 덜 편향된다. 예를 들어, 관심있는 게놈 영역은 관심있는 대립유전자를 포함한다. 표적 뉴클레오타이드 서열은 상기 관심있는 대립유전자의 서열 안에 존재하지 않도록 선별될 수 있다. 관심있는 게놈 영역은 상기 관심있는 대립 유전자의 서열 정보를 요구하지 않고 표적 뉴클레오타이드 서열을 사용함으로써 증폭된다. 따라서, 관심있는 대립 유전자는 그 대립 유전자로부터 어떤 서열을 요구하지 않고 농축될 수 있다. 상기 농축의 방법 효과는 관심있는 대립 유전자적 서열을 커버하는 올리고뉴클레오타이드 및/또는 프로브를 사용에 의해서 편향되지 않는다는 것이다. 게다가, 상기 결합 단계는 서로 근접한 단편들의 결합을 포함하기 때문에, 상기 방법은 또한 분리된 대립유전자의 서열 분석을 가능케 한다. 예를 들어, 교차연결된 DNA 샘플이 다중 대립유전자를 포함할 때(예를 들어, 상기 DNA 샘플은 이형성 세포 군집으로부터 기원하기 때문 또는 배수성(ploidy)이 하나보다 크기 때문), 각각 대립유전자는 다른 게놈적 이웃을 갖는다. 표적 뉴클레오타이드 서열을 포함하는 DNA 단편은 단지 같은 공간에 존재하는 DNA 단편과 함께 상호반응한다. 그래서, 결합된 DNA 단편은 상기 단편이 기원한 게놈 환경을 대표한다. 모든 다른 결합된 DNA 단편의 서열의 적어도 일부를 결정함으로써, 상기 다른 결합된 DNA 단편의 서열 정보를 사용하여 DNA 단편 서열들은 순차적으로 연결될 수 있고, 분리된 관심있는 게놈 영역에 대한 서열이 구축될 수 있다.
도 1은 본 발명에 의한 관심있는 게놈 영역의 서열 결정 방법의 개략을 나타내는 도이다. 상기 방법은 하기의 단계를 포함한다:
(a) 교차연결, 여기서 예를 들어, 포름알데하이드(formaldehyde) 고정에 의해 그들의 관련된 단백질(예를 들어, 히스톤(histones))을 통해 핵(nucleus;N)의 인근 DNA 서열이 공간적으로 교차연결(대부분 염색체(Ch) 부근의 서열, 예를 들면 같은 유전자의 서열).
관심있는 게놈 영역 A, B, C, D 및 E의 5개의 추정 단편을 나타냄;
(b) 다음, 예를 들어, 제한효소(예를 들어, 빈번한 (4) 커터(cutter)(예를 들어, NlaIII))로 절단(digestion)을 실시함으로써, 상기 교차연결 샘플 DNA을 단편화;
(c) 교차연결된 제한 단편을 연결시켜 DNA 원형을 형성;
(d) 교차연결의 역전 후 증폭 단계, 예를 들어 관심있는 게놈 영역 부근 또는 내부의 관찰점(viewpoint)에서 (정반대(inverse)) PCR 프라이머 세트를 이용하여 PCR을 실시. 이 관찰점과 교차연결하는 단편(A, B, C, D 및 E)을 증폭하고 게놈의 남은 부분을 농축.
예를 들어 원형 전체(긴 판독)의 서열 결정에 의해 증폭된 단편을 서열화. 또한, PCR 증폭 재료를 우선 단편화하여 예를 들어 Illumina 또는 SOLiD sequencing을 위한 적합한 서열화 라이브러리를 제작.
(e) 다음 상기 판독으로부터 콘틱을 구축, 서열을 참고 게놈과 비교하여 유전적 다형성(variation)을 확인
도 2는 5개의 다른 관찰점(A, B, C, D 및 E)에서의 BRCA1 유전자의 개략을 나타낸 도이다. 검정색 화살표는 순“‡향(sense direction)을 의미한다. 원내의 숫자 및 화살표는 유전자 서열상의 위치를 나타낸다. 관찰점 E는 유전자의 개시점이며 관찰점 A는 종료점이다. 이들의 관찰점은 약 15~25 kB 떨어져 있다.
도 3은 실시예에 기재된 BRCA1 유전자의 서열화를 위한 교차연결된 샘플 DNA의 조제 중에 찍은 DNA 샘플의 겔 전기영동을 나타내는 도이다.
(A) M열은 람다 DNA PstI 마커 DNA를 의미한다, 1열은 절단되지 않은 대조군을 나타낸다, 2열은 NlaIII 첫번째 절단된 대조군, 3열은 NlaIII 첫번째 절단된 샘플의 결합 이후 결합 대조군이다, 4열은 NspI를 가지고 두번째 절단을 나타낸다.
(B) M열은 람다 DNA PstI 마커 DNA를 나타낸다. A, B, C, D 및 E열은 실시예 부분에서 설명된 것처럼 단계 67로부터 샘플에 대응하고 도 2에서 설명된 관찰점에 대응하는 다른 DNA 증폭의 증폭 생산물을 나타낸다.
정의
하기 설명 및 실시예에 있어서, 많은 용어를 사용한다. 용어와 같이 주어진 시야(scope)를 포함하는 명세서 및 청구항의 명확하고 일관성 있는 이해를 제공하기 위해서 하기 정의를 제공한다. 달리 언급하지 않는 한 본 발명에서 정의된 모든 기술적 및 과학적 용어는 이러한 발명이 속한 분야에 일반적인 기술의 하나에 의해서 일반적으로 이해되는 것처럼 동일한 의미를 갖는다. 상기 모든 출판물, 특허 출원, 특허 및 다른 참고들의 공개는 참고에 의해서 그것들의 전체에 있어서 본 발명은 구체화된다.
본 발명에 방법에 있어서 사용된 종래 기술 수행의 방법은 당업자에게 명확하다. 분자 생물학, 생화학, 전산 화학, 세포 배양, 재조합 DNA, 생물정보학, 유전학, 서열화 및 관련 분야에 있어서 종래 기술의 적용은 상기 분야에 있어서 기술로 잘 알려지고 논의된다, 예를 들어, 하기 참고 문헌: Sambrook et al. ., Molecular Cloning. A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. Y., 1989; Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, New York, 1987 및 주기적 업데이트; 및 the series Methods in Enzymology, Academic Press, San Diego.
본 발명에서 사용된, 단수 형태 “하나(a) “, ”하나(an)” 및 “상기(the)”는 본문에서 명확하게 달리 구술하지 않는 한 복수 대상물을 포함한다. 예를 들어, 상기 사용된 것과 같이 “하나(a)” DNA 분자 분리를 위한 방법은 복수 분자 분리를 포함한다(예를 들어, 10의, 100의, 1000의, 10의 수천의, 100의 수천의, 수백만 또는 더 많은 분자들).
본 발명에 있어서 “관심있는 게놈 영역(genomic region of interest)”이란 DNA 서열의 적어도 한 부분을 결정하기에 바람직한 유기체(organism)의 DNA 서열이다. 예를 들어, 질환과 연관되는 대립유전자가 포함되는 것으로 예측되는 게놈 영역은 관심있는 게놈 영역이 될 수 있다. 본 발명에서 사용된 것과 같이, 상기 용어 “대립유전자(들)(allele(s))”은 부분적 위치에 유전자의 어느 하나 또는 그 이상 대체가능한 형태를 의미한다. 유기체의 2배체 세포(diploid cell)에 있어서, 주어진 유전자의 대립유전자는 염색체상에 특정한 위치 또는 장소들(locus)(장소(loci)의 복수형)에 위치한다. 하나에 대립유전자는 상동 염색체의 쌍의 각 염색체 위에 나타난다. 그래서, 2배체 세포에 있어서, 두 개 대립 유전자 및 두 개에 분리된(다른) 관심있는 게놈 영역이 존재한다.
본 발명에 있어서 "핵산(nucleic acid)"이란 피리미딘(pyrimidine) 및 퓨린(purine) 염기, 바람직하게 각각 사이토신(cytosine), 사이미딘(thymine) 및 우라실(uracil) 및 아데닌(adenine) 및 구아닌(guanine)의 임의의 폴리머 또는 올리고머를 포함한다(모든 목적에서 그 전체 내용이 참조로서 본 발명에 포함되는 Albert L. Lehninger, Principles of Biochemistry, 793-800 페이지(Worth Pub. 1982) 참조). 본 발명은 임의의 데옥시리보뉴클레오타이드(deoxyribonucleotide), 리보뉴클레오타이드(ribonucleotide) 또는 펩티드 핵산 성분 및 임의 화학적 변이체, 예를 들면 이들 염기의 메틸화(methylated), 하이드록시메틸화(hydroxymethylated) 또는 글리코실화(glycosylated) 형태 및 이와 유사한 것을 생각한다. 상기 폴리머 또는 올리고머는 구성에 있어서 이형적(heterogeneous) 또는 상동적(homogenous)일 수 있고 자연적으로 발생하는 원료로부터 분리되거나 인위적 또는 합성적으로 생산될 수 있다. 또한, 상기 핵산은 DNA 또는 RNA 또는 이의 혼합물일 수 있고, 상동이중체(homoduplex) 또는 이형이중체(homoduplex) 및 혼성 상태를 포함하는 단일-가닥 또는 이중-가닥 형태로 영구 또는 일시적으로 존재할 수 있다.
"샘플 DNA(sample DNA)”는 DNA를 포함하는 유기체(organism) 또는 유기체의 조직 또는 조직 및/또는 세포배양으로부터 수득한 샘플이다. 유기체로부터 샘플 DNA는 임의의 타입의 유기체, 예를 들어, 미생물, 바이러스, 식물, 곰팡이, 동물, 인간 및 박테리아 또는 이들의 조합으로부터 수득될 수 있다. 예를 들어, 박테리아 및/또는 바이러스 감염이 의심되는 인간 환자로부터의 조직 샘플은 인간 세포뿐만 아니라 바이러스 및/또는 박테리아를 포함할 수 있다. 상기 샘플은 세포 및/또는 세포 핵을 포함할 수 있다. 상기 샘플 DNA는 그 유기체의 DNA 검사를 정당화하는 특정 질환, 예를 들면 암 혹은 임의의 다른 상태를 가지는 위험이 있거나 또는 그 혐의가 있는, 환자 또는 인간에서 유래될 수 있다.
본 발명에 있어서 "교차연결(crosslinking)"은 반응하는 두 개의 상이한 위치에서 DNA를 반응시켜, 이들 두 개의 상이한 위치가 연결될 수 있음을 의미한다. 상기 두 개의 다른 위치 사이의 연결은 직접적으로 DNA 가닥 사이에 공유 결합을 형성할 수 있다. 두 개의 DNA 가닥은 DNA 가닥 사이에 공유 결합을 형성하는 UV-조사를 사용해서 직접적으로 교차연결된다. 상기 두 개의 다른 위치 사이의 연결은 작용제(agent), 예를 들어 교차연결자 분자를 통하여 간접적으로 이루어질 수 있다. 첫번째 DNA 부분은 2 개의 반응성기를 포함하는 교차연결자 분자의 첫번째 반응 그룹에 연결될 수 있고, 교차연결자 분자의 두번째 반응 그룹은 두번째 DNA 부분에 연결될 수 있으며, 따라서 교차연결자 분자를 통해 간접적으로 첫번째 및 두번째 DNA 부분을 교차연결시킬 수 있다. 또한, 교차 연결은 하나 이상의 분자를 통해 두 개의 DNA 가닥 사이에 간접적으로 형성될 수 있다. 예를 들어, 사용될 수 있는 일반적인 교차연결자 분자는 포름알데하이드(formaldehyde)이다. 포름알데하이드는 단백질-단백질 및 DNA-단백질 교차연결을 유도한다. 따라서 포름알데하이드는 그들의 관련 단백질을 통해 다른 DNA 가닥을 서로 교차연결시킬 수 있다. 예를 들어, 포름알데하이드는 교차연결자 분자를 통해 단백질과 DNA를 연결하는 단백질 및 DNA와 반응할 수 있다. 따라서, 두 개의 DNA 부분은 포름알데하이드를 사용하여 교차연결되어 제 1 DNA 부분과 단백질 사이의 연결을 형성할 수 있고, 단백질은 제 2 DNA 부분에 연결되는 다른 포름알데하이드 분자와의 제 2 연결을 형성할 수 있다. 그래서, DNA1-교차연결자-단백질-교차연결자-DNA2와 같이 표현되는 교차연결을 형성한다.
어떤 경우에 있어서, 본 발명에 따른 교차연결은 서로 물리적으로 근접한 DNA 가닥들 사이에 (직접 또는 간접적으로) 연결을 형성하는 것을 포함하는 것으로 이해된다. DNA 가닥은 세포 내에서 서로 물리적으로 근접할 수 있는데, 서열의 관찰점에서 예를 들면 100 kb 떨어지면서, DNA가 고도로 조직화(organised)되기 때문이다. 교차연결 방법이 순차적인 단편화 및 결합 단계와 양립할 수 있는 한, 본 발명의 목적을 위해 그러한 교차연결은 고려 될 수 있다.
"교차연결된 DNA의 샘플(sample of crosslinked DNA)”은 교차연결이 실시된 샘플 DNA이다. 상기 샘플 DNA 교차연결은 샘플내의 삼차원 상태의 DNA를 대개 완전하게 유지하는 영향이 있다. 이와 같이 서로 물리적으로 인접한 DNA 사슬은 서로 가까운 상태(vicinity)를 유지한다.
본 발명에 있어서 "교차연결을 역전(Reversing crosslinking)"은 교차연결된 DNA가 더 이상 교차연결되지 않고, 순차적인 증폭 및/또는 서열화 단계에 적합한 교차연결의 파괴를 포함한다. 예를 들어, 포름알데하이드에 의한 교차연결된 샘플 DNA 위에 프로테아제 K(protease K) 처리 수행은 상기 샘플 중에 존재하는 단백질을 분해한다. 교차연결된 DNA는 단백질을 통하여 간접적으로 연결되므로, 프로테아제 처리 자체가 DNA 간의 교차연결을 역전시킬 수 있다. 그러나, DNA에 연결된 상태의 단백질 단편은 순차적인 서열화 및/또는 증폭을 방해할 수 있다. 따라서, DNA 및 단백질 사이의 연결 역전이 "교차연결 역전"을 가져올 수 있다. DNA-교차연결자-단백질 연결은 예를 들어 70℃에서의 배양에 의한 가열 단계를 통하여 역전될 수 있다. 샘플 DNA 중에 다량의 단백질이 존재할 경우, 부가적으로 프로테아제로 상기 단백질을 분해하는 것이 종종 바람직하다. 따라서, 교차연결된 샘플에 연결된 상기 DNA 가닥이 서열화 및/또는 증폭에 적합하게 되는 임의의 "교차연결 역전" 방법이 고려될 수 있다.
"DNA를 단편화(Fragmenting DNA)"는 교차연결 DNA 또는 비-교차연결 DNA, 또는 임의의 다른 DNA일 수 있는 DNA에 적용하면 DNA 단편을 초래하는 임의의 기법을 포함한다. 상기 분야에 잘 알려진 기술은 초음파처리(sonication), 전단(shearing) 및/또는 제한효소 처리이지만, 다른 기술 또한 상정할 수도 있다.
"제한 엔도뉴클레아제(restriction endonuclease)” 또는 “제한효소(restriction enzyme)”는 이중-가닥 DNA 분자 중의 특이적 뉴클레오타이드 서열(인식 부위)을 인식하고 각 인식 부위 또는 근처의 DNA 분자의 양 가닥을 절단하고 평활 또는 3' 또는 5' 돌출부 말단을 남겨두는 효소이다. 상기 인식되는 특이적 뉴클레오타이드 서열은 절단의 빈도를 결정할 수 있다. 예를 들면 6 뉴클레오타이드의 뉴클레오타이드 서열은 평균적으로 4096 뉴클레오타이드마다 발생하는 반면, 4 뉴클레오타이드의 뉴클레오타이드 서열은 보다 높은 빈도로 평균적으로 256 뉴클레오타이드마다 발생한다.
본 발명에 있어서 "결합(Ligating)"은 별개의 DNA 단편의 접합을 포함한다. 상기 DNA 단편은 평활 말단이거나 서로 혼성화할 수 있는 돌출부와 같은 호환 돌출부(점착성 돌출부)를 가질 수 있다. 상기 DNA 단편의 접합은 결합효소, DNA 결합효소에 의한 효소적일 수 있다. 그러나, 또한, 비-효소적 결합은 DNA 단편이 연결되는 한 예를 들어, 공유 결합 형성이 사용될 수 있다. 일반적으로 상기 분리(separate) 가닥의 하드록실(hydroxyl) 및 포스페이트(phosphate) 그룹 사이에 포스포디에스터(phosphodiester) 결합을 형성한다.
일반적으로, "올리고뉴클레오타이드 프라이머(Oligonucleotide primers)"는 DNA의 합성을 촉진할 수 있는 뉴클레오타이드의 가닥을 나타낸다. DNA 중합효소는 프라이머 없이 DNA를 새롭게(de novo) 합성할 수 없다. 프라이머는 DNA와 혼성화한다, 즉 염기쌍을 형성한다. 서로 상보적인 염기쌍을 형성할 수 있는 뉴클레오타이드는 예를 들면 시토신과 구아닌, 티민과 아데닌, 아데닌과 우라실, 구아닌과 우라실이다. 프라이머와 기존의 DNA 사슬 사이의 상보성은 100%일 필요는 없다. 즉 프라이머의 모든 염기가 기존의 DNA 사슬과 염기 쌍형성(pairing)할 필요는 없다.
기존의 DNA 사슬과 혼성화한 프라이머의 3'말단에서 주형으로서 기존의 사슬을 사용하여 뉴클레오타이드가 받아들여진다(주형이 DNA 합성을 지정). 본 발명자들은 "프라이머(primers)"로서 증폭 반응 중에서 사용되는 합성 올리고뉴클레오타이드 분자를 나타낸다.
"증폭(Amplifying)"은 폴리뉴클레오타이드(polynucleotide) 증폭 반응, 즉 하나 이상의 시작 서열에서 복제되는 폴리뉴클레오타이드의 군집을 나타낸다. 증폭은 중합효소 연쇄 반응(PCR), 선형 중합효소 반응, 핵산 서열-기초된 증폭, 순환 원형 증폭(rolling circle amplification) 및 이와 같은 반응들에 제한하지 않지만 이들을 포함하는 다양한 증폭 반응을 나타낼 수 있다.
“서열화(Sequencing)”는 핵산 샘플, 예를 들어, DNA 또는 RNA에 있어서 뉴클레오타이드(염기 서열)의 순서를 결정하는 것에 관한 것이다. 많은 기술들은 Sanger 서열화 및 Roche, Illumina 및 Applied Biosystems에 의해 제공되는 초고속(High throughput) 서열화 기술과 같이 가용될 수 있다.
용어 "콘틱(contig)"은 DNA 서열 분석에 관련하여 사용하고 인접한 뉴클레오타이드 서열을 갖는 두 개 이상의 DNA 단편으로부터 유도된 DNA가 재조립된 인접한 연장(stretches) 부분에 관한 것이다. 따라서, 콘틱은 관심있는 게놈 영역의 (부분적) 인접한 서열을 제공하는 한 세트의 중복된(overlapping) DNA 단편이어도 된다. 또한, 콘틱은 참조 서열과 정렬하면 인접 뉴클레오타이드 서열을 형성할 수 있는, 한 세트의 DNA 단편이어도 된다. 예를 들면, 용어 "콘틱"은 그 부근의 적어도 하나와 각각의 (결합된) DNA 단편(들)의 서열 중복을 가지도록 배열하는, 일련의 (결합된) DNA 단편(들)을 포함한다. 연결 또는 커플링된 (결합된) DNA 단편(들)은 손으로 또는 바람직하게 FPC, PHRAP, CAP3 등과 같은 적절한 컴퓨터 프로그램을 사용해서 정돈되고 또한, 분리된 콘틱으로 분류된다.
"어뎁터(adaptor)"는 이들이 단편의 말단과 결합할 수 있도록 설계된, 한정된 수의 염기쌍, 예를 들면 약 10 내지 약 30 염기 쌍의 길이를 가지는, 짧은 이중가닥 올리고뉴클레오타이드 분자이다. 일반적으로 어뎁터는 서로 일부분이 상보적인 뉴클레오타이드 서열을 가지는, 두 개의 합성 올리고뉴클레오타이드로 구성된다. 적절한 조건 하에서 용액 중에서 두 개의 합성 올리고뉴클레오타이드를 혼합하면, 이들은 서로 어닐링하여 이중가닥 구조를 형성한다. 어닐링(annealing) 후, 어뎁터 분자의 하나의 말단은 그 말단이 제한 단편의 말단에 적합해 거기에 결합할 수 있도록 설계할 수 있고 어뎁터의 다른 말단은 그 말단이 연결되지 않도록 설계할 수 있지만, 예를 들면 어뎁터가 DNA 단편 사이에 결합될 때, 이것은 반드시 들어맞지는 않는다.
"결정자(identifier)"는 어뎁터 또는 프라이머에 첨가되거나 그 서열에 포함되거나 또는 독특한 결정자를 제공하기 위해 표지로서 사용될 수 있는 짧은 서열이다. 이러한 서열 결정자(또는 태그(tag))는 특이적 핵산 샘플 확인을 위해 사용되는, 다양하기는 하지만 규정된 길이, 일반적으로는 4 내지 16 bp의 독특한 염기서열일 수 있다. 예를 들어, 4 bp 태그는 4(exp4) = 256 의 다른 태그가 가능하다. 대표적인 실시예는 혼성화에 의한 독특한 검출에 일반적으로 사용되는 태그로서 해당 기술 분야에 있어서 ZIP 서열이다(Iannone et al. Cytometry 39:131-140, 2000). 본 발명에 의한 결정자는 유용한데, 이는 이러한 결정자를 사용함으로써, 추가적인 처리에 따라 (PCR) 샘플의 기점(origin)을 결정할 수 있기 때문이다. 다른 핵산 샘플 유래의 가공된 생산물을 조합하는 경우, 다른 결정자를 사용하여 다른 핵산 샘플을 확인할 수 있다. 예를 들면 본 발명에 의해 초고속 유전자 서열 분석을 사용하여 서열화를 실시할 수 있으므로, 다중의 샘플을 조합할 수 있다. 따라서 결정자는 다른 샘플에 대응하는 서열의 확인을 도울 수도 있다. 결정자는 DNA 단편과의 결합을 위해 어뎁터 중에 포함되어 DNA 단편 서열 확인을 도울 수 있다. 결정자는 적어도 두 개 염기 쌍에 의해 서로 다른 것이 바람직하고 오독(misreads)을 방지하기 위해 두 개의 동일한 연속적 염기를 포함하지 않는 것이 바람직하다. 결정자의 기능은 어뎁터 또는 프라이머 등의 다른 기능과 때때로 조합할 수 있다.
본 발명에 있어서 "크기 선별(Size selection)"은 특정 사이즈 범위 분자, 예를 들면 (결합된) DNA 단편 또는 증폭된(결합된) DNA 단편을 선택하는 기법을 포함한다. 사용될 수 있는 기술들은 예를 들면, 겔 전기영동, 크기 배제, 겔 추출 크로마토그래프이지만 특정 크기를 가지는 분자를 선택할 수 있는 한, 이들에만은 한정되지 않고, 이러한 기법은 충분하다.
삭제
용어 "정렬(aligning)" 및 "배열(alignment)" 는 동일 또는 유사한 뉴클레오타이드가 짧은 또는 긴 스트레치 부분의 존재에 기초한 두 개 이상의 뉴클레오타이드 서열의 비교를 의미한다. 배열을 위한 방법 및 컴퓨터 프로그램은 관련 분야에 잘 알려져 있다. 정렬하기 위해 사용 또는 적용될 수 있는 하나의 컴퓨터 프로그램은 1991년 12월 10일에 미합중국 저작권 협회(Washington, D.C.20559)에 있어서, 사용자를 위한 문서와 함께 출원된 Genentech, Inc.에 의해 작성된 "Align2"이다.
본 발명의 한 양상에 있어서, 표적 뉴클레오티드 서열을 포함한 관심있는 게놈 영역의 서열을 결정하기 위한 방법으로서, 교차연결된 DNA를 단편화하는 단계, 단편화된 교차연결된 DNA를 연결시키는 단계, 교차연결을 역전시키는 단계 및 표적 뉴클레오티드 서열을 포함한 연결 DNA 단편의 서열 중 적어도 일부분을 결정하는 단계 및 결정한 서열을 사용하여 관심있는 게놈 영역의 서열을 구축하는 단계를 포함하는 방법을 제공한다. 교차연결된 DNA의 샘플은 교차연결에 노출된 샘플 DNA를 포함한다. 그것이 샘플 중에 존재할 때의 샘플 DNA의 교차연결은 DNA의 삼차원 구조의 대략적인 유지를 가져온다. 예를 들어, 표준 교차연결 물질은 포름알데하이드(formaldehyde)가 사용된다. 샘플은 환자 및/또는 질환 조직에서 얻을 수 있으며, 다른 유기체 또는 같은 유기체의 다른 절편에서 유래해도 좋고 예를 들면 1 환자 유래의 샘플, 정상 조직 유래의 1 샘플과 질환 조직 유래의 1 샘플 등이라도 좋다. 따라서, 샘플은 본 발명에 의해 분석해 참조 샘플과 비교할 수 있고 또는 다른 샘플을 분석해 서로 비교할 수 있다. 예를 들어 유방암을 가지는 것이 의심되는 환자로부터 의심스러운 종양에서 검체를 얻을 수 있다. 다른 검체는 비질환 조직에서 얻을 수 있다. 양쪽 모두에서 유래하는 조직 검체는 본 발명에 의해 분석할 수 있다. 관심있는 게놈 영역은 BRCA1 및 BRCA2 유전자일 수 있으며 이들의 유전자는 83 kb 길이 및 86 kb 길이이다(Mazoyer, 2005, Human Mutation25:415~422 중에 총설된다). 본 발명에 의한 관심있는 게놈 영역의 서열을 결정하는 것 및 다른 생검 재료의 게놈 영역 서열 및/또는 참조 BRCA 유전자 서열을 서로 비교함으로써 환자 진단 및/또는 환자 치료 결정 및/또는 질환 진행 예후의 예측을 돕는, 유전자 돌연변이를 발견할 수 있다.
교차연결된 DNA의 샘플을 단편화함으로써 관심있는 게놈 영역에서 유래하는 DNA 단편은 서로 인접한 채로 있는데, 이들은 교차연결하고 있기 때문이다. 이들의 교차연결된 DNA 단편을 순차적으로 결합시키면, 교차연결이기 때문에 서로 인접한 관심있는 게놈 영역의 DNA 단편은 결합된다. 이형 연결은 근접 결합이라고 부를 수도 있다. 표적 뉴클레오티드 서열을 포함한 DNA 단편은 서열 레벨에서는 광범위의 직선 거리 내에서 DNA 단편과 연결할 수 있다. 표적 뉴클레오티드 서열을 포함한 단편을 포함한 연결 단편의 서열의 것(적어도 일부분)을 결정함으로써 관심있는 게놈 영역의 공간 주변 내의 DNA 단편의 서열을 얻을 수 있다. 각각의 표적 뉴클레오티드 서열이 다중의 다른 DNA 단편과 교차연결할 수 있다. 결과적으로 대개 하나 이상의 DNA 단편이 표적 뉴클레오티드 서열을 포함한 단편과 연결할 수 있다. 결합된(증폭된) 연결 DNA 단편의(부분적) 서열과 표적 뉴클레오티드 서열을 포함한 단편을 조합함으로써 관심있는 게놈 영역의 서열을 구축할 수 있다. 표적 뉴클레오티드 서열을 포함한 단편과 결합된 DNA 단편은 결합된 DNA 단편 중에 존재할 수 있는 임의의 단편을 포함한다.
본 발명이 속한 기술분야에서 DNA를 교차연결시키는 단계 및 DNA 단편을 단편화해 연결시키는 단계를 포함하는 방법이 알려져 있다(예를 들어, WO 2007/004057 또는 WO 2008/08845). 이러한 방법은 다른 DNA 단편 간의 상호작용 빈도의 확인을 목적으로 하고 표적 뉴클레오티드 서열과 인접하는 단편의 일차 뉴클레오타이드 서열의 확인은 목적으로 하지 않는다. 상호작용 빈도를 검출하기 위한 4 C를 사용하는 원래의 아이디어는 짧은 서열 판독부분만이 필요하다. 짧은 서열 판독이 상호작용하는 빈도를 판독의 염색체 위치에 대해서 플롯한다. 이러한 플롯의 패턴은 특정 대상 게놈 영역이 게놈 중의 다른 영역과 상호작용할 수 있을지, 또는 예를 들면 염색체 사이에서 전위가 일어난 것을 나타낸다. 예를 들면 표적 뉴클레오티드 서열을 함유하는 염색체 이외의 염색체상에서 고빈도의 판독부분이 관찰될 경우, 그것은 전위를 나타낸다. 본 발명에서는 상호작용의 빈도는 결정하지 않는다. 본 발명에서는 교차연결된 DNA를 단편화하여 그 DNA 단편을 순차적으로 연결시킴으로써 표적 뉴클레오티드 서열 주변의 게놈 영역이 실제 포착되고 서열 화되면, 게놈 영역의 콘틱을 재구축할 수 있는 것이 지금 판명되었다.
본 발명이 속하는 기술 분야에서 알려진 방법으로는 표적 뉴클레오티드 서열을 가지는 짧은 서열 판독부분의 상호작용 빈도의 결정에 초점을 맞추고 있지만, 본 발명의 초점은 DNA 단편의 서열 및 연결 DNA 단편의 커플링에서 관심있는 게놈 영역의 콘틱을 구축할 수 있는 (DNA 단편 및 표적 뉴클레오티드 포함) 연결 DNA 단편의 서열 전체, 또는 적어도 광범위의 일부 결정에 있다.
선형화된 결합된 단편
본 발명의 하나의 구체적인 실시예에 있어서, 하기의 단계를 포함하는 표적 뉴클레오타이드 서열을 포함하는 관심있는 게놈 영역의 서열을 결정 방법이 제공된다:
a) 교차연결된 DNA의 샘플을 제공;
b) 상기 교차연결된 DNA를 단편화;
c) 상기 단편화된 교차연결된 DNA를 결합;
d) 상기 교차연결을 역전(reversing);
e) 선택적으로 상기 단계 d)의, 바람직하게 제한효소를 가지고 DNA를 단편화;
f) 선택적으로, 적어도 하나의 어뎁터에 단계 d) 또는 e)의 단편화된 DNA를 결합;
g) 선택적으로, 표적 뉴클레오타이드에 혼성화하는 적어도 하나의 올리고 뉴클레오타이드 프라이머를 이용하여 상기 표적 뉴클레오타이드 서열을 포함하는 단계 d) 또는 e)의 DNA 단편을 증폭, 또는 적어도 하나의 어뎁터에 혼성화하는 적어도 하나의 첨가 프라이머를 사용하여 단계 f)의 DNA를 증폭;
h) 바람직하게 초고속 유전자 서열 분석 기술(high throughput sequencing)을 사용한 표적 뉴클레오타이드 서열을 포함하는 단계 d), e), f) 또는 g)의 (증폭된) 결합된 DNA 단편의 적어도 한 부분의 서열을 결정;
i) 상기 결정된 서열로부터 관심있는 게놈 영역의 콘틱 구축.
단계 a)에 있어서 교차연결된 DNA의 샘플은 본 명세서의 다른 부분에서 설명된 것처럼 제공된다.
상기 교차연결된 DNA의 샘플은 단계 b)에서 단편화된다. 상기 교차연결된 DNA 단편화에 의해서, 상기 교차연결에 의해서 하나에 유지된 DNA 단편이 생성된다. 상기 단계 b) 단편화는 초음파처리를 포함하고 효소적 DNA 말단 회복이 뒤따른다. 초음파 처리는 랜덤한 부위에서의 DNA의 단편화를 가져와, 그것은 평활 말단일 수 있거나 3' 또는 5'돌출부를 가질수 있게 된다. 이들의 DNA 절단점은 랜덤하게 존재하고, 어뎁터 및/또는 순차적인 단계 c)에 있어서 서로의 단편의 결합을 가능하게 하는 평활 말단을 가지는 DNA 단편을 얻을 수 있도록, DNA를 (효소에 의해 ) 회복하고 발생할 수 있는 3' 또는 5'돌출부를 채울 수 있기 때문이다. 또는 예를 들어 핵산말단분해효소(exonucleases, 엑소뉴클레아제)를 사용하여 돌출부 뉴클레오타이드를 제거함으로써, 돌출부를 평활 말단으로 할 수도 있다. 단편화 단계 b)는 하나 이상의 제한효소, 또는 이들의 조합을 이용한 단편화를 포함할 수도 있다. 제한효소에 의한 단편화는 평균 단편 사이즈의 조절을 가능하게 할 수 있기 때문에 유리하다. 형성되는 단편은 순차적인 단계 c)에 있어서 단편의 결합을 가능하게 하는 적합 돌출부 또는 평활 말단을 가질 수 있다. 또한 교차연결된 DNA의 하나의 샘플을 복수의 부표본(subsamples)으로 나누는 경우, 각각의 부표본에 다른 인식 부위를 가지는 제한효소를 사용할 수 있다. 이것은 다른 인식 부위를 가지는 다른 제한 효소를 사용함으로써 각각의 부표본에서 다른 DNA 단편을 얻을 수 있으므로 유리하다.
다음 단계 c)에 있어서, 상기 단편은 결합된다. 다중 다른 DNA 단편에 연결된 표적 뉴클레오타이드 서열을 포함하는 단편 때문에 하나 DNA 단편보다 그 이상 상기 표적 뉴클레오타이드 서열을 포함하는 단편에 결합된다. 이것은 DNA 단편의 조합에 결과한 것은 상기 교차 연결에 의해서 서로 붙잡은 그것들처럼 각기 다른 근접도이다. 결합된 DNA 단편 안에 상기 DNA 단편의 다른 조합 및/또는 순서를 형성한다. 제한효소의 인식부위는 알려진 효소적 제한을 통하여 얻게된 상기 DNA 단편에 경우에 있어서, 다른 DNA 단편 사이 분리를 의미하는 또는 재구성된 제한효소 인식부위의 나머지처럼 상기 단편을 확인 가능하게 만든다. 무작위 단편화를 통하여 얻은 DNA 단편 경우에 있어서, 초음파 처리 및 순차적인 효소 DNA 및 회복과 같은, 다른 것으로부터 하나에 단편을 구별하는 것이 더욱 어렵다. 사용된 단편화 방법이 무엇인지 상관없이, 상기 결합 단계 c)는 단편 사이에 있어서 결합 어뎁터 서열, 어뎁터의 존재에 있어 수행된다. 대체가능하게 상기 어뎁터는 분리 단계에서 결합된다. 이것은 상기 다른 단편은 확인된 상기 단편 사이에 있어서 위치한 상기 어뎁터 서열에 의해서 쉽게 확인될 수 있기 때문에 유리하다. 예를 들면, DNA 단편 말단이 평활 말단인 경우, 상기 어뎁터 서열은 분리된 DNA 단편 사이에 가장자리를 의미하는 DNA 단편 말단의 각각에 인접하게 된다. 다음, 상기 교차연결은 두 개 또는 그 이상 단편을 포함하는 결합된 DNA 단편의 전체를 결과하는 단계 d)에서 역전된다. 결합된 DNA 단편의 전체의 부분 모집단은 표적 뉴클레오타이드 서열을 포함하는 DNA 단편을 포함한다. 상기 교차연결 역전에 의해서, 상기 DNA의 구조적/공간적 고정은 방출되고 이 같은 단계를 위한 적합한 기질이 되지않는 교차연결된 DNA처럼 순차적인 단계, 예를 들어, 증폭 및/또는 서열화를 가능하게 된다. 상기 순차적 단계 e) 및/또는 f) 상기 교차연결의 역전 후에 수행된다. 그러나, 또한, 단계 e) 및/또는 f) 상기 결합된 DNA 단편이 여전히 상기 교차연결된 상태에 있는 동안 수행된다.
상기 결합된 DNA 단편은 선택적으로 단계 e)에서 바람직하게 제한효소를 가지고 단편화된다. 상기 첫번째 단편화된 단계 및 상기 선택적 두번째 단편화 단계는 순차적 증폭 단계 및/또는 서열 결정 단계를 갖는 적합한 크기의 결합된 DNA 단편 수득에 목적한다. 게다가, 두번째 단편화 단계는, 바람직하게 효소를 갖는 단계 f)에 어뎁터의 선택적 결합을 가지는 적합한 결합된 단편 말단을 결과한다. 상기 두번째 단편화 단계 상기 교차연결 역전 후에 수행된다. 그러나, 또한, 이것은 상기 DNA 단편이 여전히 교차연결되는 동안 두번째 단편화 단계 e) 및/또는 결합 단계 f)를 수행 가능하다.
제한효소를 포함하는 단편화 단계 b) 및 e) 경우에 있어서, 이것은 단계 b)의 인식 부위보다 긴 단계 e)의 제한효소 인식부위를 우선된다. 그래서, 상기 e)의 효소는 단계 b)보다 낮은 빈도로 절단된다. 이것은 제한된 DNA 후에 수득된 단계 e)의 평균 단편 크기보다 작은 단계 b)의 평균 DNA 단편 크기를 의미한다. 이러한 방법은 첫번째 단편화 단계에 있어서 순차적으로 결합된 비교적 작은 단편이 형성된다. 단계 b) 보다 훨씬 낮은 빈도 절단된 단계 e)의 두번째 제한효소처럼 상기 DNA 단편의 대부분은 단계 E)의 제한 인식부위를 포함하지 않는다. 그래서, 상기 결합된 DNA 단편이 상기 두번째 단계에서 순차적으로 단편화될 때 단계 b)의 DNA 단편의 대다수가 온전하게 남는다. 이것은 관심있는 게놈 영역을 위한 콘틱을 세우기 위해 사용된 단계 b)의 상기 DNA 단편의 결합된 서열 때문에 유용하다. 만일 상기 단계 b)의 단편화는 상기 단계 c)의 단편화보다 훨씬 낮은 빈도라면, 상기 결과는 콘틱을 구축하는 것에 유용한 상대적으로 커다란 DNA 서열의 손실 될 수 있는 단편화된 단계 b)의 단편이 된다. 그래서, 단계 b) 및 e)에 있어서 간편화를 위해 사용된 방법에 관계없이, 이것은 예를 들어, 단계 e)에 의해서 크게 단편화되지 않은 크게 온전한 산물로 남는 단계 b)의 DNA 단편과 같은 단계 e)에 비교된 것처럼 더욱 빈번한 단계 b)의 단편화에 우선된다.
단계 d) 또는 e) 적어도 하나 어뎁터의 상기 수득된 결합된 DNA 단편은 선택적으로 결합된다. 상기 결합된 DNA 단편의 말단은 어뎁터와 같은 것의 결합에 적합하게 되는 것이 필요하다. 선형 DNA인 단계 d) 또는 e)의 결합된 DNA 단편처럼, 어뎁터의 결합은 프라이머 혼성화 서열을 위해 제공한다. 표적 뉴클레오타이드를 포함하는 결합된 DNA 단편과 결합된 상기 어뎁터 서열은 PCR을 사용해서 증폭된 DNA 분자를 위해 제공한다.
다음 단계 g)에 있어서, 표적 뉴클레오타이드 서열을 포함하는 단계 f)의 DNA는 표적 뉴클레오타이드 서열에 혼성화하는 적어도 하나에 올리고뉴클레오타이드 프라이머 및 적어도 하나에 어뎁터에 혼성화하는 적어도 하나에 부가적 프라이머를 사용해서 증폭된다. 선택적인 결합된 어뎁터의 단계 f)처럼, 또한, 상기 표적 뉴클레오타이드를 포함하는 단계 d) 또는 e)의 DNA는 적어도 하나 올리고뉴클레오타이드 프라이머를 사용해서 단계 g)에서 증폭된다.
다음, 상기 (증폭된) 결합된 DNA의 서열은 결정된 표적 뉴클레오타이드 서열을 포함하는 단계 d), e), f) 또는 g)에서 수득한다. 상기 서열 결정은 바람직하게 관심있는 완전한 게놈 영역 걸쳐 결정된 서열의 높은 수를 가능케 하고 더욱 편리한 것과 같은 초고속(high throughput) 유전자 서열화 기술을 사용해서 수행된다. 상기 DNA 단편의 서열을 결정될 때, 중복 판독은 세워진 관심있는 게놈 영역으로부터 수득된다. 무작위 단편화에 의해서 수득된 상기 DNA 단편 경우에 있어서, 상기 단편화 단계의 무작위 산물은 이미 중복된 판독에 있어서 서열화 결과될 때 DNA 단편에 있어서 결과한다. 상기 샘플 크기 증가, 예를 들어 수많은 분석 세포의 증가에 의해서 세워진 관심있는 게놈 영역의 신뢰도는 증가된다.
그 대신에, 단계 b)에서 복수 부표본이 분석될 때, 다른 제한효소를 사용해서, 또한, 중복 판독이 수득된다. 복수의 부표본 증가에 의해서, 수많은 중복 단편은 증가, 세워진 관심있는 게놈 영역의 콘틱의 신뢰도를 증가한다. 이러한 중복된 결정된 서열로부터 콘틱은 구축된다. 그 대신에, 만일 서열이 중복하지 않으면, 예를 들어, 단일 제한효소가 단계 b)에서 사용될 때, 참고 서열과 함께 (결합된) DNA 단편의 정렬은 관심있는 게놈 영역의 콘틱을 구축하는 것을 가능케 한다.
원형화된 결합된 단편
대체 가능한 실시예에 있어서, 하기의 단계를 포함하는 표적 뉴클레오타이드 서열을 포함하는 관심있는 게놈 영역의 서열을 결정 방법이 제공된다.
a) 교차-연결된 DNA 샘플을 제공;
b) 상기 교차연결된 DNA를 단편화;
c) 상기 단편화된 교차연결된 DNA를 결합;
d) 상기 교차연결을 역전;
e) 선택적으로 단계 d)의, 바람직하게 제한효소를 가지고, DNA를 단편화
f) 단계 d) 또는 e)의 DNA의 원형화;
g) 선택적으로 및 바람직하게, 표적 뉴클레오타이드 서열에 혼성화하는 적어도 하나에 프라이머를 바람직하게 이용한 상기 표적 뉴클레오타이드 서열을 포함하는 원형화된 DNA를 증폭;
h) 초고속 유전자 서열 분석을 사용해서 표적 뉴클레오다이드를 포함하는 (증폭된) 결합된 DNA 단편의 적어도 한 부분의 서열을 결정;
i) 결정된 서열로부터 관심있는 게놈의 영역의 콘틱 구축.
교차연결된 DNA의 단계 a) 샘플에 있어서 본 발명에서 달리 설명된 것처럼 제공된다. 상기 교차연결된 DNA의 샘플은 단계 b)에서 단편화된다. 상기 교차연결된 DNA 단편화에 의해서, DNA 단편은 상기 교차연결에 의해서 서로 붙잡혀 생산된다. 상기 단계 b) 단편화는 초음파처리(sonication)를 포함하고 효소적 DNA 말단 회복에 의해서 따르게 된다. 무작위 부분에 DNA의 단편화에 있어서 결과한 초음파처리는 이러한 DNA 중단점(breakpoints)은 무작위로 발행하는 것처럼 평활 말단 또는 3'- 또는 5'- 돌출부 둘 다 가질 수 있게 되는 상기 DNA는 가능한 3'- 또는 5'- 돌출부를 채움으로 (효소적으로) 회복된다. 그 같은 DNA 단편은 순차적 단계 c)에서 어뎁터 또는 각기 다른 상기 단편의 결합을 가능하게 하는 평활 말단을 수득된다. 또한, 그 대신에, 상기 돌출부는 예를 들어, 핵산분해효소(exonucleases)를 사용해서 돌출부 뉴클레오타이드 제거에 의해서 평활 말단이 만들어지게 된다. 또한, 단계 b) 단편화는 제한효소 또는 이의 조합을 갖는 단편화를 포함한다. 제한효소를 갖는 단편화는 이것이 평균 단편 크기의 조절을 가능케 하는 것처럼 유리하다. 더욱이, 상기 형성된 단편은 순차적인 단계 c)에서 더 이상의 변형(modification)없이 단편의 결합을 가능케 하는 적합한 돌출부 또는 평활 말단을 가진다. 더욱이, 복수의 부표본에 교차연결된 DNA의 샘플을 나눌 때, 다른 인식 부위를 갖는 각기 부표본을 위한 제한효소가 사용된다. 이것은 각 부표본으로부터 수득될 수 있는 다른 DNA 단편에 다른 인식 부위를 갖는 다른 제한효소 사용에 의해서 때문에 유리하다.
상기 다음 단계 c)에 있어서, 상기 단편은 결합된다. 제한효소를 통하여 수득한 DNA 단편에 있어서, 알려진 제한효소의 인식 부위는 유지 또는 다른 DNA 단편 사이에 분리를 의미하는 재편성된 제한효소 인식 부위처럼 단편 확인 가능한 것을 만든다. 초음파처리 및 순차적인 효소 DNA 말단 회복과 같은 무작위 단편화를 통하여 수득한 DNA 단편 경우에 있어서, 이것은 다른 것으로부터 한 단편을 구별하는 것이 더욱 어렵게 된다. 단편화 방법에 사용된 것이 무엇인지 상관없이 상기 단계 c) 결합은 단편 사이에 있어서 결합 어뎁터 서열, 어뎁터의 존재 하에 수행된다. 그 대신에 상기 어뎁터는 분리 단계에서 결합된다. 이것은 상기 단편 사이에 있는 상기 어뎁터 서열 확인에 의해서 쉽게 확인될 수 있는 다른 단편 때문에 유리하다. 예를 들면, DNA 단편 말단이 평활 말단인 경우, 상시 어뎁터 서열은 상기 DNA 단편 말단에 인접하게 된다.
다음, 상기 교차연결은 두 개 또는 그 이상 단편을 포함하는 결합된 DNA 단편의 전체에 있어서 결과하는 단계 d)에서 역전된다. 결합된 DNA 단편의 전체의 부분 모집단은 상기 표적 뉴클레오타이드 서열을 포함하는 DNA 단편을 포함한다. 상기 교차연결 역전에 의해서, 상기 DNA의 구조적/공간적 고정은 방출되고 상기 DNA 서열은 이 같은 단계를 위한 기질을 적합하게 되지 않는 교차연결된 DNA처럼 순차적 단계, 예를 들어, 증폭 및/또는 서열화를 위해서 가능하게 된다.
상기 순차적 단계 e) 및/또는 f)는 상기 교차연결의 역전 후에 수행하게 된다. 또한, 그러나, 단계 e) 및/또는 f)는 상기 교차연결된 상태에서 결합된 DNA 단편 여전히 있는 동안 수행된다.
상기 결합된 DNA 단편은 선택적으로 단계 e)에서 바람직하게 제한효소를 가지고 단편화된다. 상기 교차연결 역전 후에 수행되는 단편화뿐만 아니라 이것은 또한 역전된 교차연결 전에 수행된 두번째 단편화를 직면하게 된다. 이것은 만일 적합한 제한효소가 선택되면 단계 f)에서 수득된 것처럼 원형화된 결합된 DNA 단편에 결과하는 적합한 말단의 결합에 유리한 상기 결합된 DNA 단편의 적합한 말단에 단편화 단계 및 결과의 조절을 가능케 하는 제한효소처럼 단편화를 위한 제한효소를 사용하는 것을 우선된다. 그러나, 다른 방법을 사용한 단편화, 예를 들어, 절단 및/또는 초음파처리 및 순차적인 효소적 DNA 말단 회복은 형성된 평활 말단 이중 가닥 DNA는 원형화된 DNA 형성에 결합된다.
상기 첫번째 단편화 단계 및 선택적 두번째 단편화 단계는 순차적인 원형화, 증폭 단계 및/또는 서열 결정 단계를 갖는 적합한 결합된 DNA 단편 수득에 목적된다. 제한효소를 포함하는 단계 b) 및 e) 단편화 경우에 있어서, 이것은 평균으로, 단계 b) 단편화에서 수득된 것 같은 긴 단편, 단계 e) 단편화 결과에 우선된다. 제한효소를 포함하는 단계 b) 및 e) 단편화 경우에 있어서, 이것은 단계 e)의 상기 제한효소 인식 부위가 단계 b)의 인식 부위보다 긴 것을 우선된다. 상기 단계 e)의 효소는 단계 b)보다 낮은 빈도로 절단한다. 이것은 단계 b)의 평균 DNA 단편 크기가 제한 DNA 후에 수득된 단계 e)의 평균 단편 크기보다 작은 것을 의미한다. 첫번째 단편화 단계에 있어서, 이러한 방법은 순차적으로 결합된 비교적 작은 단편을 형성한다. 단계 b)보다 훨씬 낮은 빈도로 절단하는 단계 e)의 두번째 제한효소처럼 대부분 상기 DNA 단편은 단계 e)의 제한 인식 부위를 포함하지 않는다. 그래서, 상기 두번째 단계에서 상기 결합된 DNA 단편이 순차적으로 단편화될 때 수많은 상기 단계 b)의 DNA 단편은 온전한 산물을 남긴다. 이것은 상기 단계 b)의 DNA 단편의 결합된 서열은 관심있는 게놈 영역을 위한 콘틱을 구축하는 것에 사용되기 때문에 유용하다. 만일 상기 단계 b)의 단편화가 단계 c)의 단편화보다 훨씬 낮은 빈도이면, 상기 결과는 콘틱 구축에 유용한 비교적 큰 DNA 서열의 손실에 있어서 결과하는 단편화된 단계 b)의 단편이 된다. 그래서, 단계 b) 및 e)에서 단편화를 위해 사용된 방법인지 상관없이, 이것은 온전한 산물, 예를들어 단계 e)에 의해서 넓게 단편화되지 않은 넓게 남기는 단계 b)의 DNA 단편과 같은 단계 e)에 비교한 것과 같이 더욱 빈번한 단계 b)의 단편화를 우선된다.
역전된 단계 d) 또는 e)의 수득된 결합된 DNA 단편은 다음 단계 f)에서 원형화된다. 이것은 교차연결된 동안 교차연결된 DNA 원형화하기 좋기 않게 되기 때문에 상기 원형화 전에 교차연결 역전하는 것이 유리하게 된다. 그러나, 또한, 원형화는 결합된 DNA 단편이 교차연결되는 동안 수행된다. 이것은 심지어 상기 결합 단계 동안과 같은 필요하지 않은 부가적 원형화 단계를 가능하게 된다. 원형화된 결합된 DNA 단편은 이미 형성되고 그래서 원형화 단계 f)는 단계 c)를 동시에 발생한다. 그러나, 이것은 부가적 원형화 단계 형성을 우선한다. 원형화는 폐쇠된 원을 형성하는 것 같은 상기 결합된 DNA 단편의 말단의 결합을 수반한다.
DNA 단편을 포함하는 원형화된 DNA는 순차적으로 표적 뉴클레오타이드 서열에 혼성화하는 적어도 하나의 프라이머를 사용해서 증폭된다. 상기 증폭 단계를 위한, 필요한 교차연결 역전은 교차연결된 DNA 때문에 증폭을 방해 받거나 방지할 수 있다. 바람직하게 두 개 프라이머가 역 PCR 반응에서 표적 뉴클레오타이드 서열에 혼성화에 사용된다. 이러한 방법에 있어서, 상기 표적 뉴클레오타이드 서열을 포함하는 상기 DNA 단편과 함께 결합된 상기 원형화된 DNA의 DNA 단편은 증폭된다.
다음, 상기 표적 뉴클레오타이드 서열을 포함하는 단계 d), e), f) 또는 g)에 있어서 수득된 (증폭된) 결합된 DNA 단편의 서열이 결정된다. 상기 서열 결정은 바람직하게 조금더 편리하고 관심있는 완전한 게놈 영역을 커버하기 위해 결정된 매우 많은 서열을 가능케 하는 것 같은 초고속(high throughput) 유전자 서열화 기술을 사용해서 수행된다. 이러한 결정된 서열로부터, 콘틱은 관심있는 게놈 영역에 구축된다. 상기 DNA 단편의 서열이 결정될 때, 중복 판독은 세워진 관심있는 게놈 영역으로부터 수득된다. 무작위 단편화에 의해서 수득된 상기 DNA 단편 경우에 있어서, 상기 단편화 단계의 무작위 산물은 중복 판독에 결과하는 서열화될 때 DNA 단편에 이미 결과된다
상기 샘플 크기 증가, 예를 들어, 수많은 분석된 세포 증가에 의해서, 상기 세워진 관심있는 게놈 영역의 신뢰도는 증가된다.
그 대신에, 단계 b)에서 다른 제한효소를 사용해서 복수의 부표본이 분석될 때, 또한, 중복판독이 수득된다. 복수의 부표본 증가에 의해서, 수많은 중복 단편은 세워진 관심있는 게놈 영역의 콘틱의 신뢰도가 증가한다. 이러한 중복된 결정된 서열로부터 콘틱은 구축되게 된다. 그 대신에, 만일 서열이 중복하지 않으면, 예를 들어, 단계 b)에서 단일 제한효소가 사용되었을 때, 참고 서열을 가지고 (결합된) DNA 단편의 정렬은 관심있는 게놈 영역의 콘틱을 구축하는 것을 가능케 한다.
다중 표적 서열
하나의 실시예에 있어서, 두 개 표적 뉴클레오타이드 서열을 포함하는 관심있는 게놈 영역의 서열을 결정을 위한 방법이 제공된다. 이러한 방법은 상기 증폭 단계까지 상기에서 개략된 것처럼 동일한 단계를 수반한다. 상기 증폭단계는 이제 하나 표적 뉴클레오타이드를 사용하지 않지만, 두 개이다. 상기 두 개 표적 뉴클레오타이드 서열을 위한 두 개 다른 프라이머는 각 표적 뉴클레오타이드 서열을 위한 하나에 프라이머 PCR 반응에서 사용된다. 두 개 표적 뉴클레오타이드 서열로부터 두 개 프라이머 결합 부위가 결합된 DNA 단편에 나타낼 때, 상기 두 개 프라이머는 우측 방향을 갖는 상기 프라이머 결합 부위를 제공한 상기 두 개 프라이머 결합 부위 사이에서 상기 서열을 증폭한다. 원형화된 결합된 DNA 단편을 갖는 것은 우측 방향을 갖는 선형 결합된 DNA 단편에 비교한 것처럼 높은 두 개 프라이머 결합 부위를 위한 기회처럼 유리하게 된다(선형 결합된 DNA 단편에 비교한 것처럼 4 개 방향의 두 개는 증폭된다). 더욱 실시예에 있어서, 상기 두 개 표적 뉴클레오타이드에 대하여, 상기 관심있는 게놈 영역은 각 표적 뉴클레오타이드 프라이머는 상기 PCR 증폭 반응에 있어서 사용되는 것을 위한 더욱 표적 뉴클레오타이드를 포함한다. 단일 증폭에 있어서 다중 표적 뉴클레오타이드 및 연관된 프라이머 조합에 의해서 증폭물(amplicon)을 생산하는 프라이머의 조합을 기회가 증가한다.
예를 들어, 상기 실시예 부분에서 설명된 것과 같이 5 개 다른 표적 뉴클레오타이드는 상기 BRCA1 유전자를 위해 사용된다(도 2 참조). PCR은 하나 표적 뉴클레오타이드 서열(또한 관찰점과 같은 것에 관한 것이다.)로부터 프라이머 선별, 예를 들어, 다른 것과 함께 A, B에 의해서 수행된다. 또한, PCR은 각 표적 뉴클레오타이드, A, B, C, D 및 E로부터 프라이머를 사용해서 수행된다. 이러한 관심있는 게놈 영역을 위해 농축될 증폭과 같은 것을 수행하는 각기 다른 물리적 근접도에 있는 표적 뉴클레오타이드와 같이 활성화될 수 있는 증폭물과 같은 결합된 DNA 단편에 상기 프라이머 결합 부위 말단 이상을 제공된다.
따라서, 본 발명에 있어서 상기 관심있는 게놈 영역뿐만 아니라 하나 또는 그 이상 표적 뉴클레오타이드 서열을 포함하고 표적 뉴클레오타이드 서열과 혼성화를 제공되는 상기 증폭단계에 프라이머 및 하나 또는 그 이상 부가적 표적 뉴클레오타이드 연관을 위해 제공되는 하나 또는 그 이상 프라이머, 상기 프라이머를 사용해서 증폭된 원형화된 DNA 또는 증폭된 결합된 DNA 단편을 포함하는 관심있는 게놈 영역의 서열을 결정하기 위한 방법이 제공된다.
결합된 DNA 단편의 서열 결정
상기 결합된 DNA 단편의 서열을 결정의 단계는 바람직하게 초고속 유전자 서열 분석(high throughput sequencing) 기술을 포함한다. 초고속 유전자 서열 분석 방법는 본 발명이 속한 기술 분야에 잘 알려진 방법이고 원리에 있어서 어떤 방법이 본 발명에 있어서 사용되는 것이 고려된다. 초고속 유전자 서열 분석 기술은 제조사의 설명서(예를 들어, Roche, Illumina 또는 Applied Biosystems에 의해서 제공된 것)에 의해서 수행된다. 일반적으로, 서열 어뎁터는 상기 (증폭된) 결합된 DNA 단편에 결합된다. 본 발명에서 설명된 것과 같이 PCR 예를 위해 사용에 의해서 선형 또는 원형화 단편이 증폭된 경우에 있어서, 상기 증폭된 생산물은 상기 어뎁터의 결합을 가능케 하는 선형이다. 적합한 말단은 결합 어뎁터 서열(예를 들어, 말단, 상보적 엇갈리게 배열된 말단) 결합을 위해 제공된다. 그 대신에, PCR 또는 다른 증폭 방법을 위해 사용된 프라이머(들)은 상기 증폭 단계 g)에서 어뎁터 서열과 함께 형성된 증폭된 생산물과 같은 어뎁터 서열을 포함한다. 증폭되지 않은 원형화된 단편의 경우에 있어서, 상기 원형화된 단편은 바람직하게 예를 들어, 온전한 산물을 남기는 상기 표적 뉴클레오타이드를 포함하는 상기 DNA 단편과 함께 결합된 DNA 단편과 같은 상기 역 PCR 반응을 위한 프라이머 결합 부위 사이에 있어서 제한효소를 사용해서 단편화된다. 또한, 서열화 어뎁터는 상기 본 발명의 방법의 단계 c) 및 f)에 있어서 포함된다. 이러한 서열화 어뎁터는 이러한 단계에 있어서 선택적으로 이미 사용된 상기 어뎁터의 어뎁터 서열 부분 및/또는 게다가 이러한 단계에서 제공되는 분리된 서열 어뎁터처럼 포함된다.
바람직하게 긴 판독은 초고속 유전자 서열 분석 방법을 사용에서 활성화된다. 이러한 방법은 단계 b)의 DNA 단편이 결정된다. DNA 단편 서열은 참고 서열 및/또는 각기 다른 것을 가지고 비교된다. 예를 들어, 또한, 본 발명에 여기 이후에 DNA 단편 서열은 유전 정보를 보유한 세포의 단편의 비율을 결정하기 위해서 사용된 것처럼 설명되었다. 또한, 이 같은 서열에 인접한 DNA 단편 의 DNA 단편 서열에 의해서 고유한 결합된 DNA 단편은 확인된다. 이것은 무작위 단편화에 의해서 단계 b)에서 수득된 DNA 단편일 때 특별한 상기 경우에 있어서이다. 두 개 세포는 매우 작은 정밀한 같은 DNA 단편을 위해 제공될 경우 상기 동일하게 될 결합된 단편과 같은 상기 DNA 단편 말단을 홀로 둔다. 그래서, DNA 단편 확인에 의해서 이러한 방법은 세포 및/또는 특별한 돌연변이를 포함하는 관심있는 게놈 영역의 비율은 결정된다.
따라서, 이것은 상기 결합된 DNA 단편의 완전한 서열을 위해 제공하는 것이 필요없다. 이것은 결정된 DNA 단편 서열과 같은 적어도 하나에 (다중) DNA 단편을 가로지르는 서열이 우선된다. 또한, 이것은 심지어 짧은 서열 판독, 예를 들어, 50 내지 100 뉴클레오타이드의 짧은 판독에 고려된다. 이 같은 시나리오에 있어서, 이것은 작은 단편에 있어서 (증폭된) 결합된 DNA 단편은 순차적으로 초고속 유전자 서열 분석 방법에 적합한 적절한 어뎁터와 함께 결합된 것에 우선된다. 표준 서열화 프로토콜 경우에 있어서, 이것은 손실된 결합된 DNA 단편을 간주하는 정보를 의미한다. 짧은 판독과 함께 이것은 완전한 DNA 단편 서열을 확인하는 것이 가능하지 않게 된다. 이 같은 완전한 짧은 판독 경우에 있어서, 단편화할 때 결합된 DNA 단편을 분리하는 것과 같은 부가적인 가공 단계를 제공하는데 계획된 이것은 상기 결합된 DNA 단편을 위해 세워진 콘틱, 상기 짧은 판독으로부터인 것과 같은 결정자(identifiers)와 함께 결합되거나 장치된다. 짧은 서열 판독을 수반하는 초고속 유전자 서열 분석 기술과 같은 것은 짝지어진 말단 서열화를 수반한다. 짝지어진 말단 서열화 및 짧은 서열 판독을 사용하는 것에 의해서, 다른 DNA 단편을 포함하는 DNA 분자를 서열화를 위해 사용된 DNA 단편의 양쪽 말단으로부터 상기 짧은 판독은 결합된 DNA 단편의 커플링을 가능케 한다. 이것은 두 개 서열 판독은 양쪽 말단으로부터 결정된 서열에 관련된 일련의 비교적 큰 DNA 서열을 연결될 수 있기 때문이다. 이러한 방법은 콘틱은 상기 (증폭된)결합된 DNA 단편을 위해 구축되게 된다. 그러나, 확인된 DNA 단편 없이 고려된 짧은 판독을 사용해서, 상기 짧은 서열 판독으로부터 때문에 관심있는 게놈 영역은 특히 상기 관심있는 게놈 영역이 증폭될 때 세워지게 된다. DNA 단편에 대한 정보 및/또는 관심있는 게놈 영역 분리는(이배체 세포의 경우를 위해) 잃게 되지만, DNA 돌연변이는 여전히 확인된다.
따라서, (증폭된) 연결 DNA 서열의 서열 중 적어도 일부분을 결정하는 단계는 짧은 서열 판독부분을 포함하지만, DNA 단편 서열을 확인할 수 있도록, 보다 긴 서열 판독부분을 결정하는 것이 바람직하다. 또한, (증폭된) 결합된 DNA 단편을 위한 다른 초고속 유전자 서열 분석 전략을 사용하는 것이 고려된다. 예를 들어, 짝지어진 말단 서열화로부터의 짧은 서열 판독부분과 보다 긴 서열 판독부분을 가지는 비교적 멀리 떨어진 말단의 조합도 고려될 수 있고, 이와 같이 (증폭된) 결합된 DNA 단편을 위해 콘틱이 구축될 수 있다.
하나에 실시예에 있어서 본 발명은 활성화된 서열정보의 질적 조절을 위해서 제공하는 것에 사용된다. 초고속 유전자 서열 분석의 방법에 의해서 제공된 것처럼 상기 서열의 분석에 있어서, 서열화 에러(error)가 발생한다. 서열화 에러는 상기 DNA 가닥에 있어서 포함된 오류(예를 들어, 상기 주형에 비-상보적)염기를 포함하는 상기 DNA 가닥의 연장하는 동안 실시예에서 발생한다. 서열화 에러는 증폭된 및/또는 그것의 돌연변이를 포함하지 않는 서열화된 상기 원래의 DNA와 같은 돌연변이로부터 다르게 된다. 본 발명에 있어서, DNA 단편 서열은 고유하게 된 서열 이것에 결합된 DNA 단편의 적어도 하나에 부분 서열과 함께 결정된다. 상기 결합된 DNA 단편의 고유함은 그것들처럼 단계 h)에서 결정된 서열의 질적 조절 위해 제공된 단계 c)에서 형성된다. 결합된 DNA 단편이 증폭되었을 때, 그리고 충분한 깊이에 서열화, 상기 동일한 고유한 (결합된) DNA 단편(들)의 다중 복제수는 서열화된다. 상기 동일한 원래의 결합된 DNA 단편으로부터 기원한 복제수의 서열은 비교되고 증폭 및/또는 서열화 에러는 확인된다
구체적인 실시예
더욱더, 본 발명의 방법에 있어서, 교차연결된 DNA의 샘플로부터 상기 관심있는 다중 게놈 영역의 서열이 결정된다. 관심있는 각각에 게놈 영역을 위해서, 표적 뉴클레오타이드 서열이 설계된 연관된 프라이머(들)을 위해서 제공된다. 상기 관심있는 다중 게놈 영역은 또한 중복된 관심있는 게놈 영역이 됨에 따라서 결정된 상기 서열의 크기는 증가한다. 예를 들어, 일반적으로 1MB를 포함하는 표적 뉴클레오타이드 서열을 포함하는 관심있는 게놈 영역의 서열 경우에 있어서, 관심있는 부분적으로 중복된 게놈 영역 조합, 예를 들어, 0.1MB의 중복과 함께 각각 연관된 표적 뉴클레오타이드 서열을 가지고 4.6 MB (0.9 + 3 * ( 0.1 + 0.8) + 0.1+ 0.9 = 4.6 MB)의 서열에 결과하는 관심있는 5개 게놈 영역 조합 때문에 매우 확장된 상기 서열의 관심있는 게놈 영역의 크기 결정되거나 달리 분석된다. 또한, 관심있는 게놈 영역 안에 정의된 거리에 다중 표적 뉴클레오타이드 서열은 평균 범위 및/또는 상기 게놈 영역을 가로지르는 범위의 균일성을 증가하는 것에 사용된다.
게다가, 결정자는 단계 g)의 상기 올리고뉴클레오타이드 프라이머의 적어도 하나에 포함된다. 또한, 결정자은 상기 단계 c) 결합 동안 단편 사이에서 결합을 위해 사용된 것과 같은 어뎁터 서열에 포함된다. 상기 올리고뉴클레오타이드 프라이머에 있어서 결정자를 포함하는 것에 의해서, 교차연결된 DNA의 복수의 샘플 또는 복수의 부표본을 분석할 때, 각 샘플의 기원은 쉽게 결정된다. 교차연결된 DNA의 (부)표본은 상기 교차연결된 DNA의 원래 샘플 상기 동일한 것인 동안 및/또는 다른 유기체 또는 환자로부터 실시예를 위해 수득된 DNA의 샘플을 다르게 처리된다. 결정자는 상기 샘플의 처리가 집중될 때, 예를 들어 동일한 처리 단계가 수행될 때, 다르게 처리된 샘플 조합을 가능케 한다. 초고속 유전자 서열 분석을 수반하는 단계 h) 서열화할 때 처리의 집합(convergence)과 같은 것은 특별히 유리하게 된다.
단계 g) 증폭 전 또는 후에 본 발명의 방법에 있어서 크기 선별 단계가 수행된다. 겔 추출 크로마토그래피, 겔 전기영동 또는 밀도 구배 원심분리를 사용해서 크기 선별 단계가 수행된 것과 같이 일반적으로 본 발명이 속한 분야에 있어서 알려진 방법이 된다. 바람직하게 DNA는 20 내지 20,000 염기 쌍 사이, 바람직하게 50 내지 10,0000 염기 쌍, 더욱 바람직하게 100 내지 3,000 염기 쌍 사이 크기로 선별된다 크기 선별 단계는 PCR 증폭 및/또는 다음세태 서열화에 의해서 긴 판독의 서열화를 위한 최적화된 크기 범위에 있어서 (증폭된) 결합된 DNA 단편을 위한 선택을 가능케 한다. 최근에 일반적으로 가능한 500 뉴클레오타이드의 판독의 서열화는 Pacific Biosciences(http://www.pacificbiosciences.com/)에 의해서 개발된 검색 가능한 1,000 내지 10,000 뉴클레오타이드의 판독을 의미하는 the Single Molecule Real Time (SMRT™)와 같은 회사 DNA 서열화 기술에 의해서 최근 진보한다.
관심있는 게놈 영역의 세포의 배수성이 1보다 큰 경우, 각각의 배수성을 위해 본 발명에 의한 방법의 단계 h)에서 콘틱을 구축한다. 게놈 중의 임의의 주어진 표적 부위의 게놈 환경은 대부분 선형 염색체 주형 상의 표적 서열과 물리적으로 인접한 DNA 게놈 서열로 구성되므로, 각각 각각의 염색체 주형 재구축이 가능하게 된다. 관심있는 게놈 영역의 배수성이 1보다 큰 경우, 다중의 대상 게놈 영역(또는 이들의 상당물)이 세포 중에 존재한다. 이들의 다중 대상 게놈 영역은 일반적으로 같은 공간을 차지하지 않는데, 즉 이들은 공간에서 분리되어 있다. 세포 중의 각 관심있는 게놈 영역 유래의 이러한 세포의 교차연결된 DNA의 샘플이 단편화될 때, 표적 뉴클레오티드 서열을 포함한 대응하는 DNA 단편이 형성될 수 있다. 이들의 DNA 단편은 이들의 부근 DNA 단편과 각각 결합한다. 따라서 결합된 DNA 단편은 다른 관심있는 게놈 영역을 나타낸다. 예를 들어, 배수성이 2일 경우 독자적인 돌연변이를 각각 가져 1 MB 떨어진 2개의 단편이 결합된 DNA 단편 내에서 함께 발견될 때, 이들의 2개의 단편은 같은 관심있는 게놈 영역에서 유래하는 것으로 결론지을 수 있다. 따라서 이 시나리오에서는 2개의 단편을 확인하고 둘다 동일한 게놈 영역에 배치한다. 따라서, 확인된 단편의 서열에서 콘틱을 구축하면, 돌연변이를 보유하는 이들의 2개의 단편은 하나의 특정 게놈 영역의 콘틱을 구축하는데 사용되며 한쪽에서 다른 게놈 영역에 관해 구축되는 콘틱은 돌연변이를 보유하지 않을 것이다.
그래서, 본 발명의 상기 방법에 있어서, 콘틱 구축의 단계 h)는 하기 단계를 포함한다:
1) 단계 b)의 단편을 확인;
2) 게놈 영역에서 상기 단편 배치(assigning);
3) 상기 단편의 상기 서열로부터 상기 게놈 영역을 위한 콘틱 구축.
또한, 고유한 돌연변이를 포함한 3개의 단편이 존재하는 경우(A*, B* 및 C*), 관심 게놈의 배수성이 2이다. 이 때, 2개의 돌연변이 단편을 포함한 결합 생산물을 확인되는데, 1개의 결합 생산물은 A*B*를 포함하며 1개는 A*C*를 포함한다. 또한 비-돌연변이 단편을 포함하는 결합 생산물은 BC 및 AC로 확인된다. 이 시나리오에서는 결합된 DNA 단편 A*B 및 A*C*는 단편 A*에 의해 커플링되고 결합된 DNA 단편 BC 및 AC는 단편 C에 의해 커플링된다. 이 시나리오에서는 DNA 단편 A*, B* 및 C*는 같은 게놈 영역에 배치되는 반면, A, B 및 C는 다른 게놈 영역에 배치된다. 따라서 이와 같이 게놈 영역에 단편을 배치하는 단계 2)는 다른 결합 생산물을 확인하는 단계와 DNA 단편을 포함한 다른 결합 생산물을 커플링시키는 단계를 포함한다.
게다가, 상기 동일한 것은 이형성(heterogeneous) 세포 군집을 위해 적용한다. 예를 들어, 이형성 세포 군집(예를 들어, 다른 기원을 갖는 세포 또는 정상 세포 및 유전적으로 돌연변이된 세포(예를 들어, 암세포)을 포함하는 유기체로부터 세포)을 포함해서 제공된 교차연결된 DNA의 샘플 경우에 있어서 다른 게놈 환경(세포에서 게놈 환경이 다르게 된 또는 다른 세포로부터 게놈 환경이 다르게 된)에 연관된 각 관심있는 게놈 영역을 위해 콘틱은 구축되게 된다.
돌연변이 확인
대체 가능한 실시예에 있어서, 돌연변이의 존재 또는 부재 확인을 위한 방법이 제공된다.
첫번째 실시예에 있어서, 하기의 단계를 포함하는 복수의 샘플을 위해 세워진 콘틱을 포함하는 상기에 설명된 것처럼 본 발명의 방법의 어떤 것의 단계 a) 내지 h)를 포함하는 유전적 돌연변이의 존재 또는 부재 식별 방법이 제공된다:
i) 복수의 샘플의 콘틱에 정렬;
j) 복수의 샘플로부터 관심있는 게놈 영역에서 돌연변이의 존재 또는 부재 확인.
그 대신에, 하기 단계를 포함하는 상기 설명된 것처럼 본 발명의 방법의 어떤 것의 단계 a) 내지 g)를 포함하는 제공된 유전적 돌연변이의 존재 또는 부재 확인을 위한 방법이다:
i) 참고 서열에 상기 콘틱에 정렬.
j) 관심있는 게놈 영역에 있어서 유전적 돌연변이의 존재 또는 부재 확인.
유전적 돌연변이는 유전적 돌연변이를 포함하는 상기 샘플의 하나(또는 그 이상) 경우에 있어서 예를 들어 다중 샘플의 상기 콘틱을 비교에 의해서 확인될 수 있다. 이것은 상기 다른 샘플의, 예를 들어, 확인된 유전적 돌연변이의 존재의 서열에 비교했을 때 다른 상기 콘틱의 서열처럼 관찰된다. 상기 샘플의 콘틱 사이에 서열차이가 관찰되지 않는 경우에 있어서, 유전적 돌연변이가 없는 것이 확인된다. 그 대신에, 또한, 참고 서열은 정렬된 콘틱의 서열에 사용된다. 상기 샘플의 콘틱의 서열이 유전적 돌연변이가 관찰된 상기 참고 서열의 서열로부터 다를 때, 예를 들어 유전적 돌연변이의 존재가 확인된다. 관찰된 상기 샘플 또는 샘플 및 상기 참고 서열의 콘틱 사이에 서열 차이가 없는 경우에 있어서, 유전적 돌연변이의 부재는 확인된다.
이것은 유전적 돌연변이의 존재 또는 부재 확인을 위한 콘틱을 구축하는 것이 필요 없게 된다. DNA 단편 서열이 정렬되는 한, 각기 다르거나 참고 서열과 함께 유전적 돌연변이의 존재 또는 부재는 확인된다. 그래서, 본 발명의 대체가능한 실시예에 있어서, 방법이 설명된 것처럼 상기 방법의 어떤 것에 있어서, 콘틱 구축의 단계 h)없이 유전적 돌연변이의 존재 또는 부재 확인을 위해 제공된다.
방법과 같은 것은 상기 설명되고 하기의 단계처럼 상기 방법의 어떤 것의 단계 a) 내지 g)를 포함한다.
h) 상기 (증폭된) 결합된 DNA 단편의 결정된 서열을 참고 서열에 정렬
i) 상기 결정된 서열에 있어서 유전적 돌연변이의 존재 또는 부재 확인.
그 대신에, 방법은 하기 단계를 포함하는 상기 설명된 것과 같은 상기 방법의 어떤 것의 단계 a) 내지 g)를 포함하는 결정된 (증폭된) 결합된 DNA 단편의 복수의 샘플 서열을 포함하는 유전적 돌연변이의 존재 또는 부재를 확인하기 위해 제공된다:
h) 복수의 샘플의 (증폭된) 결합된 DNA 단편의 결정된 서열 정렬.
i) 상기 결정된 서열에서 우전적 돌연변이의 존재 또는 부재 확인.
대립 유전자의 비율 또는 유전적 돌연변이 보유한 세포
이미 상기에 언급된 것처럼, 이형성 세포 군집으로부터 교차연결된 DNA의 샘플(예를 들어, 다른 기원을 갖는 세포 또는 정상 세포 및 유전적으로 돌연변이된 세포(예를 들어, 암세포)를 포함하는 유기체로부터 세포)이 제공될 때, 다른 게놈 환경(예를 들어 세포에서 다른 대립유전자로부터 다른 게놈 환경이 되거나 다른 세포로부터 다른 게놈 환경)에 연관된 관심있는 각 게놈 영역을 위해 콘틱이 구축되게 된다. 게다가, 단편의 비율 또는 유전적 돌연변이를 보유한 결합된 DNA 단편은 대립유전자의 비율 또는 상기 유전적 돌연변이를 보유한 세포에 연관되게 결정된다. 상기 DNA 단편의 결합은 무작위 과정, 상기 수집(collection)및 단일 세포 및/또는 세포로부터 관심있는 단일 게놈 영역의 부분을 나타내고 고유하게 되는 DNA 단편의 순서이다. 더욱이, 무작위 단편화 과정, 예를 들어, 초음파처리를 포함하는 단계 b) 단편화 경우에 있어서, 상기 부수어진 DNA에 포인트는 특별하게 결합된(또한 고유한 단편 말단을 가진) 이것에 상기 다른 DNA 단편의 전후사정 안에 부가적 고유한 특징을 위해 제공된다.
그래서 또한, 상기 유전적 돌연변이를 갖는 단편을 포함한 확인은 결합된 DNA 단편 DNA 단편의 고유한 순서 및 수집을 갖는 결합된 DNA 단편 확인을 포함한다. 대립 유전자의 비율 또는 유전적 돌연변이를 보유한 세포는, 예를 들어, 암을 위한 치료 요법인 환자의 경우에 있어서, 치료의 평가에 중요하게 된다. 암 세포는 특별한 유전적 돌연변이를 보유한다. 돌연변이와 같은 것을 보유한 세포의 비율(percentage)은 치료의 성공 또는 실폐를 위한 측정이 된다. 대체가능한 실시예에 있어서, 방법은 유전적 돌연변이를 보유한 단편의 비율 및/또는 유전적 돌연변이를 보유한 결한된 DNA 단편의 비율을 결정하기 위해 제공된다. 이러한 실시예에 있어서, 유전적 돌연변이는 특별한 유전적 돌연변이 또는 특별한 유전적 돌연변이의 선별과 같이 정의된다.
첫번째 실시예에 있어서, 방법은 하기 단계를 포함하는 상기 설명된 것처럼 상기 방법의 어떤 것의 상기 단계 a) 내지 h)를 포함하는 이형성이 되는 것이 의심되는 세포군집으로부터 유전적 돌연변이를 보유한 단편의 비율을 결정을 위해 제공된다:
i) 단계 b)의 상기 단편 확인;
j) 상기 단편에 있어서 유전적 돌연변이의 존재 또는 부재 확인;
k) 상기 유전적 돌연변이를 보유한 단편의 수 결정;
l) 상기 유전적 돌연변이를 보유하지 않은 단편의 수 결정;
m) 상기 유전적 돌연변이를 보유한 단편의 비율 계산.
대체 가능한 실시예에 있어서, 방법은 하기 단계를 포함한 상기 설명된 것처럼 상기 방법의 어떤 것의 단계 a) 내지 h)를 포함은 이형성이 되는 것이 의심되는 세포 군집으로부터 유전적 돌연변이를 갖는 단편을 보유한 결합 생산물의 비율을 결정을 위해 제공된다.
i) 단계 b)의 상기 단편 확인;
j) 상기 단편에 있어서 유전적 돌연변이의 존재 또는 부재 확인;
k) 상기 유전적 돌연변이를 갖거나 없는 단편을 보유한 단계 f)의 결합 생산물 확인;
l) 상기 유전적 돌연변이를 갖는 상기 단편을 보유한 결합 생산물의 수 결정;
m) 상기 유전덕 돌연변이를 갖지 않는 단편을 보유한 결합 생산물의 수 결정;
n) 상기 유전적 돌연변이를 보유한 결합 생산물의 비율 계산.
이러한 실시예의 방법에 있어서, 유전적 돌연변이의 존재 또는 부재는 참고 서열에 정렬 및/또는 복수의 샘플의 DNA 단편 서열을 포함하는 것에 의해서 단계 j)에서 확인된다.
본 발명에 있어서 상기 방법에 있어서, 확인된 유전적 돌연변이는 SNP, 단일 뉴클레오타이드 다형성, 삽입, 역전 및/또는 전위가 된다. 관찰된 결손 및/또는 삽입 경우에 있어서, 결손 및/또는 삽입을 보유한 샘플로부터 단편 및/또는 결합 생산물은 상기 결손 및/또는 삽입을 확인하기 위해서 참고 샘플과 함께 비교된다. 또한, 결손, 삽입, 역전 및/또는 전위는 분석된 단편에 염색체적 중단점(breakpoints)(breakpoints)의 존재 위에 기초해서 확인된다.
또 다른 실시예에 있어서, 상기에 설명된 것처럼 상기 방법에 있어서, 메틸화된 뉴클레오타이드의 존재 또는 부재는 DNA 단편, 결합된 DNA 단편 및/또는 관심있는 게놈 영역에서 결정된다. 예를 들어, 상기 단계 a) 내지 f)의 DNA는 중아황산염(bisulphite)을 가지고 처리된다 중아황산염(bisulphite)을 가지고 처리된 DNA는 사이토신(cytosine) 잔기를 우라실(uracil)로 전환하지만 영향받지 않은 5-메틸사이토신(methylcytosine) 잔기를 남긴다. 그래서, 중아황산염(bisulphite) 처리는 상기 개별적 사이토신 잔기의 메틸화 상태, DNA의 부분의 상기 메틸화 상태의 단일- 뉴클레오타이드 분석(resolution) 정보에 의존하는 상기 DNA 서열에 특이적 변화를 소개한다. 처리된 및 다른 것은 처리되지 않은 상기 샘플의 하나를 포함하는 부표본으로 샘플 분할에 의해서 메틸화된 뉴클레오타이드는 확인된다. 그 대신에, 또한, 중아황산염(bisulphite)을 가지고 처리된 복수의 샘플로부터 서열은 정렬되거나 중아황산염(bisulphite)을 가지고 처리된 샘플로부터 서열은 참고 서열에 정렬된다.
(짧은) 서열 판독 분석할 때, 이것은 상기 사용한 프라이머의 서열화를 방지하기 위해서 관심이 된다. 그래서, 대체가능한 방법은 상기 프라이머서열은 초고속 유전자 서열 분석 단계 전에 제거된다. 그래서, 대체가능한 방법에 있어서, 다음 방법은 하기 단계를 포함하는 표적 뉴클레오타이드 서열을 포함하는 관심있는 게놈 영역의 상기 서열 결정을 위해 제공된다.
a) 교차-연결된 DNA의 샘플 ;
b) 상기 교차연결된 DNA를 단편화;
c) 상기 단편화된 교차연결된 DNA를 결합;
d) 상기 교차연결을 역전;
e) 선택적으로, 바람직하게 제한효소를 가지고 단계 d)의 DNA를 단편화;
f) 선택적으로, 적어도 하나의 어뎁터에 단계 d) 또는 e)의 단편화된 DNA를 결합;
g) 타입 III 제한효소 인식 부위 및 상기 표적 뉴클레오타이드 서열에 혼성화하는 ⑵를 보유한 5' 돌출부를 바람직하게 포함한 적어도 하나의 프라이머를 사용해서 상기 표적 뉴클레오타이드 서열을 포함하는 단계 d) 또는 e)의 상기 결합된 DNA 단편을 증폭 또는 타입 III 제한효소 인식 부위 및 상기 표적 뉴클레오타이드 서열 및 상기 적어도 하나의 어뎁터에 혼성화하는 적어도 하나의 프라이머에 혼성화하는 ⑵를 보유한 5' 돌출부를 바람직하게 포함한 ⑴ 적어도 하나의 프라이머를 사용해서 단계 f)의 결합된 DNA 단편을 증폭;
h) 상기 방출된 이중-가닥 프라이머 서열을 제거하기 위한 크기 선별 단계에 의해서 따르는 타입 III 제한효소를 가지고 관심있는 상기 증폭된 뉴클레오타이드 서열 절단;
i) 바람직하게 초음파처리에 의한, 상기 DNA를 단편화;
j) 선택적으로, 다음세대 서열화를 위해서 요구된 이중-가닥 어뎁터 서열 결합;
k) 바람직하게 초고속 유전자 서열 분석을 사용해서 상기 표적 뉴클레오타이드 서열을 포함하는 단 d), e), f) 또는 g)의 상기 (증폭된) 결합된 DNA 단편의 서열의 적어도 하나의 부분 결정;
l) 상기 결정된 서열로부터 관심있는 게놈 영역에 유전적 다형성 확인 및 콘틱 구축.
대체 가능한 실시예에 있어서, 본 발명에서 설명된 것처럼 상기 방법의 어떤 것에 있어서, 단계 g)에 있어서 프라이머는 모이어티(moiety)를 보유한, 예를 들어, 바이오틴(biotin), 고체 제공물에 결합을 통해 (증폭된) 결합된 DNA 단편의 선택적 정제를 위해서 사용된다.
하나의 실시예에 있어서, 상기 표적 뉴클레오타이드 서열을 포함하는 결합된 DNA 단편은 표적 뉴클레오타이드에 환성화하는 혼성화 프로브(또는 포획 프로브)를 가지고 포획된다. 상기 혼성화 프로브는 고형 제공물에 직접적으로 붙게 되거나 포획 바이오틴 모이어티(예를 들어 스트렙타비딘(streptavidin)을 가지고 코팅된 비드)를 위해서 적합한 고체 제공물에 결합이 가능하게 하는 모이어티를 포함한다. 어떤 경우에 있어서, 상기 표적 뉴클레오타이드 서열을 포함하는 결합된 DNA 단편은 그래서 상기 표적 뉴클레오타이드 서열을 포함하지 않는 결합된 DNA 단편으로부터 상기 표적 뉴클레오타이드 서열을 포함하는 결합된 DNA를 분리하는 것을 가능케 한다. 그래서, 포획 단계는 상기 표적 뉴클레오타이드 서열을 포함하는 결합된 DNA 단편을 위해 농축하는 것을 가능케 한다. 그래서, 본 발명을 통해 포함된, 또한, 농축 단계인 증폭 단계가 수행된다. 그 대신에, 표적 뉴클레오타이드 서열에 직접된 프로브를 갖는 포획 단계가 수행된다. 관심있는 게놈 영역을 위해 적어도 하나의 포획 프로브는 표적 뉴클레오타이드를 위해서 포획을 위해 사용된다. 관심있는 게놈 영역을 위해 하나의 프로브보다 그 이상이 다중 표적 뉴클레오타이드 서열을 위해서 사용된다. 예를 들면, 상기 BRCA1 유전자를 위해서 설명된 것처럼 비슷한, 상기 5개 표적 뉴클레오타이드의 하나의 하나 프라이머가 포획 프로브(A, B, C, D 또는 E)처럼 사용된다. 그 대신에, 상기 5개 프라이머는 상기 관심있는 게놈 영역을 포획하는 조합된 형태(A, B, C, D 및 E)에서 사용된다.
하나의 실시예에 있어서 증폭 단계 및 포획 단계는 예를 들어, 첫번째 수행한 포획단계 및 증폭단계 또는 반대보다 조합된다.
하나의 실시예에 있어서, 포획 프로브는 (증폭된) 결합된 DNA 단편에 포함된 어뎁터 서열에 혼성화하는 것을 사용된다.
< 실시예 >
이것은 완전한 Brca1 유전자 서열 결정하는 것에 사용된 본 발명에 있어서 전체 유전자 서열화 접근 방식의 실시예이다. 사용된 상기 세포는 Brca1 자리에 2288 위치에 T가 결손된 것을 갖는 유방암 접착성 세포주인 SUM149PT 세포이다(Elstrodt et al. Cancer Res, 2006). 도 1은 상기 방법의 개략을 나타낸다.
세포 배양
SUM149PT 세포는 10% FCS/패니실린-스트렙토마이신을 포함하는 RPMI 배지와 함께 플레이트에 가득하게 150 cm2 디쉬 이상에서 배양하였다. 계대배양 전 그리고 디쉬의 계산은 20×106 SUM149PT 세포를 포함하는 가득찬 150 cm2 디쉬를 나타낸다.
고정 및 세포 융해
배양된 세포는 PBS를 가지고 세척하였고 실온에서 10분 동안 2% 포름알데하이드(formaldehyde)/10% FCS가 포함된 PBS를 가지고 고정하였다. 상기 세포는 순차적으로 세척 및 수집되고 융해 버퍼(50 mM Tris-HCl pH7.5, 150 mM NaCl, 5 mM EDTA, 0.5% NP-40, 1% TX-100 및 1X 완전 프로테아제 억제제(Complete protease inhibitors)(Roche #11245200)에 담겨졌고 얼음 위에서 10 분동안 배양한다. 세포는 순차적으로 세척하였고 물(Milli-Q)에 담겨졌다.
단편화 1 : 절단( digestion )
상기 고정된 융해 세포는 NlaIII(New England Biolabs #R0125)를 가지고 절단하였다.
결합 1
상기 NlaIII 효소는 가열-불활성화하였고 순차적으로 결합 단계는 T4 DNA 결합효소(T4 DNA Ligase)(Roche, #799009)을 사용해서 수행하였다.
교차-연결 역전( Reversing cross - linking )
상기 샘플에, Prot K (10 ㎎/㎖) 첨가하였고 65℃에서 배양하였다. RNA 분해효소 A(RNase A)(10 ㎎/㎖, Roche #10109169001) 순차적으로 첨가하였고 상기 샘플은 37℃에서 배양하였다. 다음, 페놀-클로로포름 추출을 수행하였고 DNA를 포함하는 상층액은 침전되었고 펠렛화 되었다. 상기 펠렛은 10 mM Tris-HCl pH 7.5.에 희석하였다.
단편화 2 : 2차 절단
상기 절단 및 결합된 샘플은 NspI (New England Biolabs #R0602S)을 가지고 절단하였다.
결합 2 : 2차 결합 및 정제
상기 샘플에 Prot K (10 ㎎/㎖) 첨가하였고 65℃에서 배양하였다. RNase A (10 ㎎/㎖, Roche #10109169001) 순차적으로 첨가하였고 상기 샘플은 37℃에서 배양하였다. 다음, 페놀-클로로포름 추출을 수행하였고 상기 DNA를 포함하는 상층액은 침전되었고 펠렛화 되었다. 상기 펠렛은 10 mM Tris-HCl pH 7.5에서 희석하였다. 상기 농축-주형은 이같이 완료되었고 바로 저장하거나 계속될 수 있다.
결합된 DNA 단편 증폭 : PCR
상기 프라이머는 거의 20 kb의 상기 프라이머 세트, 예를 들어, “관찰점(viewpoints)”의 간격을 갖는 NlaIII 제한 단편의 상기 제한 부위 가까이(<50 bp) 반대의 독특한 프라이머처럼 설계된 상기 Brca1 유전자 자리의 PCR-농축을 위해 사용하였다(도 2 및 표 1 참조).
사용된 프라이머 서열의 개요
이름 관찰점 서열번호 서열 시작(5') 끝(3')
BRCA1_9.9_fw A 1 CTGGTGGGATCTGTCATTT
6470734

6470752
BRCA1_9.9_rev A 2 TGGTAGCAAACACTTCCAC
6470481

6470463
BRCA1_28.9_fw B 3 TATAAGTTTGCCTGCTGCAC
6489743

6489762
BRCA1_28.9_rev B 4 TTTCCTTAACAATGCACAAA
6489413

6489394
BRCA_50.1_fw C 5 CATTACTGTAGAAGTTCCCTAAA
6511331

6511353
BRCA_50.1_rev C 6 ACCATTGCTGTTCCTTCTAA
6510682

6510663
BRCA_65.2_fw D 7 TCCTCCTGAAGAGAAACTTG
6526103

6526122
BRCA_65.2_rev D 8 AGTTCCCACCTTGAAGAATC
6525783

6525764
BRCA_91.5_fw E 9 AGTGAGCGCCGAATTTGC
6552296

6552313
BRCA_91.5_rev E 10 GCGAAGACCTTTCATTCC
6552022

6552005
프라이머들은 서열 지도(예를 들어, 50.1 (kb)) 위에 위치이고 순방향(fw) 또는 역방향(rev) 프라이머가 되는 상기 BRCA1 유전자에 참고해서 명명(이름)하였다. vp는 관찰점을 의미한다. ID는 예를 들어 서열번호 1 내지 10 서열번호를 의미한다. 상기 프라이머에 연관된 BRCA1 유전자의 서열은 또한, 상기 프라이머들은 주형처럼 정상 DNA를 사용해서 증폭물을 형성할 수 없는 외부 방향, 예를 들어, 역방향에 있다는 것을 주목해 주십시오를 의미(시작(5') 및 끝(3'))한다.
일반적인 농축-PCR 반응은 25 ㎕ 구성:
- 2.5 ㎕ 10X PCR 버퍼 3 (확장 긴 주형 중합효소와 함께 제공된)
- 0.5 ㎕ dNTP (10mM)
- 0.5 ㎕ 순방향 프라이머(프라이머 저장용액 1 ㎍/㎕로부터 1/7 희석)
- 0.5 ㎕ 역방향 프라이머(프라이머 저장용액 1 ㎍/㎕로부터 1/7 희석의)
- 0.375 ㎕ 확장 긴 주형 중합효소 (Roche #11759060001)
- 농축-주형의 100 ng
- 총 볼륨 25 ㎕에 X ㎕ 물(Milli-Q)
상기 증폭된 결합된 DNA 단편 서열화
표준 SOLiD 프로토콜에 있어서, SOLiD 서열화를 위한 라이브러리 준비를 갖는 과정.
결과
상기 다른 관찰점으로부터 판독 분포는 상기 관찰점의 자리 주변에 최고였다. 또한, 통계를 [표 2]에 나타내었다. 관찰점 라이브러리 C, D 및 E로부터 읽은 서열은 상기 2288delT 돌연변이를 확인하였다.
또한, 이것은 50124 b. B로부터 15807 염기쌍은 적용되지 않은 관찰점 A로부터, 적용되지 않은 상기 BRCA1 유전자의 서열을 결정하였다. C, D 및 E 모두 상기 BRCA1 서열은 적용되지 않았다.
관찰점 당 서열판독 통계
vp M TR % MtT mean median % nt 20x
A 898515 13715420 6.55 531 3 11.5
B 17578 7401964 0.24 10 0 4.90
C 2098974 11190246 18.76 1241 29 63
D 3113059 9851741 31.60 1840 45 74.70
E 134324 9108300 1.47 79 42 71.70
관찰점 라이브러리(vp, A-E) 당 서열판독 통계를 의미한다. M (BRCA1에 상응하는 판독), TR(전체 판독 수), % MtT(표적에 상응하는 전체 판독의 %), mean (중간 범위), median(중앙 범위), %nt 20x (20번 범위보다 더 많은 상기 BRCA1 유전자로부터 뉴클레오타이드의 %). 그래서, 상기 단일 관찰점 C, D 및 E로부터, 상기 적용되지 않은 100 kb의 완전한 BRCA1, 상기 BRCA1 유전자의 관찰점 A 85 kb는 적용되지 않은 것으로부터, 상기 BRCA1 유전자의 관찰점 B 50 kb는 적용되지 않은 것으로부터 및 상기 C, D 및 E 관찰점으로부터 2288delT 돌연변이를 확인하였다.
<110> KONINKLIJKE ACADEMIE VAN WETENSCHAPPEN CERGENTIS B.V. <120> 3-D genomic region of interest sequencing strategies <130> 13FPI-01-007 <150> US61/362778 <151> 2010-07-09 <160> 10 <170> KopatentIn 1.71 <210> 1 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> BRCA1_9.9_fw <400> 1 ctggtgggat ctgtcattt 19 <210> 2 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> BRCA1_9.9_rev <400> 2 tggtagcaaa cacttccac 19 <210> 3 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> BRCA1_28.9_fw <400> 3 tataagtttg cctgctgcac 20 <210> 4 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> BRCA1_28.9_rev <400> 4 tttccttaac aatgcacaaa 20 <210> 5 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> BRCA_50.1_fw <400> 5 cattactgta gaagttccct aaa 23 <210> 6 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> BRCA_50.1_rev <400> 6 accattgctg ttccttctaa 20 <210> 7 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> BRCA_65.2_fw <400> 7 tcctcctgaa gagaaacttg 20 <210> 8 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> BRCA_65.2_rev <400> 8 agttcccacc ttgaagaatc 20 <210> 9 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> BRCA_91.5_fw <400> 9 agtgagcgcc gaatttgc 18 <210> 10 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> BRCA_91.5_rev <400> 10 gcgaagacct ttcattcc 18

Claims (41)

  1. 하나 이상의 관심있는 게놈 영역의 서열 결정 방법으로서,
    여기서, 각 관심있는 영역은 표적 뉴클레오타이드 서열을 포함하고, 상기 방법은 하기를 포함함:
    교차연결된(crosslinked) DNA를 단편화(fragmenting),
    상기 단편화된 교차연결된 DNA를 결합(ligation),
    상기 교차연결을 역전(reversing),
    상기 표적 뉴클레오타이드 서열을 포함하는 결합된 DNA 단편의 적어도 한 부분의 서열을 결정(determining), 및
    상기 관심있는 게놈(genomic) 영역의 콘틱(contig)을 구축하기 위하여 상기 결정된 서열을 이용.
  2. 하나 이상의 관심있는 게놈 영역의 서열 결정 방법으로서,
    여기서, 각 관심있는 영역은 표적 뉴클레오타이드 서열을 포함하고, 상기 방법은 하기 단계를 포함함:
    a) 교차연결된 DNA의 샘플을 제공;
    b) 상기 교차연결된 DNA를 단편화;
    c) 상기 단편화된 교차연결된 DNA를 결합;
    d) 상기 교차연결을 역전;
    h) 상기 표적 뉴클레오타이드 서열을 포함하는 단계 d)의 DNA의 적어도 한 부분의 서열을 결정; 및
    i) 상기 결정된 서열로부터 상기 관심있는 게놈 영역의 콘틱을 구축.
  3. 제 2 항에 있어서, 추가로 하기의 단계를 포함하는 방법:
    e) 단계 d)의 DNA를 단편화;
    여기서, 단계 h)에서의 DNA는 단계 e)의 DNA 단편을 나타냄.
  4. 제 3 항에 있어서, 상기 단편화 단계 e)는 제한효소를 가지고 수행되는 방법.
  5. 제 2 항 또는 제 3 항에 있어서, 추가로 하기의 단계를 포함하는 방법:
    f) 적어도 하나의 어뎁터에 제 2 항의 단계 d)의 DNA를 결합 또는 제 3 항의 단계 e)의 단편화된 DNA를 결합;
    여기서, 단계 h)에서의 DNA는 단계 f)의 결합된 DNA 단편을 나타냄.
  6. 제 5 항에 있어서, 추가로 하기의 단계를 포함하는 방법:
    g) 상기 표적 뉴클레오타이드 서열에 혼성화하는 적어도 하나의 프라이머를 이용하여 상기 표적 뉴클레오타이드 서열을 포함하는 단계 d), e) 또는 f)의 DNA 단편을 증폭;
    여기서, 단계 h)에서의 DNA는 단계 g)의 증폭된 DNA 단편을 나타냄.
  7. 제 2 항에 있어서, 단계 h)는 초고속 유전자 서열분석 기술(High-throughput sequencing)을 사용하여 서열을 결정하는 것을 포함하는 방법.
  8. 하나 이상의 관심있는 게놈 영역의 서열 결정 방법으로서,
    여기서, 각 관심있는 영역은 표적 뉴클레오타이드 서열을 포함하고, 상기 방법은 하기 단계를 포함함:
    a) 교차연결된 DNA의 샘플을 제공;
    b) 상기 교차연결된 DNA를 단편화;
    c) 상기 단편화된 교차연결된 DNA를 결합;
    d) 상기 교차연결을 역전;
    f) 단계 d)의 DNA를 원형화 ;
    h) 초고속 유전자 서열분석 기술을 사용하여 상기 표적 뉴클레오타이드를 포함하는 단계 f)의 원형화된 DNA의 적어도 하나의 부분의 서열을 결정; 및
    i) 상기 결정된 서열로부터 상기 관심있는 게놈 영역의 콘틱 구축.
  9. 제 8 항에 있어서, 추가로 하기의 단계를 포함하는 방법:
    e) 단계 d)의 DNA를 단편화;
    여기서, 단계 f)에서의 DNA는 단계 e)의 DNA 단편을 나타냄.
  10. 제 9 항에 있어서, 상기 단편화 단계 e)는 제한효소를 가지고 수행되는 방법.
  11. 제 8 항에 또는 제 9 항에 있어서, 추가로 하기의 단계를 포함하는 방법:
    g) 상기 표적 뉴클레오타이드 서열을 포함하는 단계 f)의 원형화된 DNA를 증폭;
    여기서, 단계 h)에서의 DNA는 단계 g)의 증폭된 DNA를 나타냄.
  12. 제 11 항에 있어서, 단계 g)에서 상기 표적 뉴클레오타이드 서열에 혼성화하는 적어도 하나의 프라이머가 이용되는 방법.
  13. 제 2 항 또는 제 8 항에 있어서, 상기 단편화 단계 b)는 초음파처리(sonication)에 이어서 효소적 DNA 말단 회복(repair)을 포함하는 방법.
  14. 제 2 항 또는 제 8 항에 있어서, 상기 단편화 단계 b)는 제한효소로 단편화하는 것을 포함하는 방법.
  15. 제 3 항 또는 제 9 항에 있어서, 상기 단편화 단계 b)는 제한효소로 단편화하는 것을 포함하고, 상기 단편화 단계 e)는 단계 b)의 상기 제한효소의 인식 서열보다 긴 인식 서열을 가지는 제한효소를 포함하는 방법.
  16. 제 2 항 또는 제 8 항에 있어서, 상기 결합 단계 c)는 어뎁터(adaptor)의 존재하에서 수행되고 단편 사이에 어뎁터 서열을 결합하는 방법.
  17. 제 2 항 또는 제 8 항에 있어서, 단계 b)에서 복수의 부표본(subsample)이 단편화되고, 각 부표본(subsample)에 대해 다른 인식 부위를 가지는 제한효소가 사용되는 방법.
  18. 제 6 항에 있어서, 상기 관심있는 게놈 영역은 하나 이상의 표적 뉴클레오타이드 서열을 추가로 포함하며, 상기 증폭 단계 g)에서 상기 표적 뉴클레오타이드 서열과 혼성화하는 프라이머가 제공되고, 하나 이상의 추가적인 표적 뉴클레오타이드에 상응하는 하나 이상의 프라이머가 제공되며, 상기 프라이머를 이용하여 결합된 DNA 단편이 증폭되거나 원형화된 DNA이 증폭되는 방법.
  19. 제 11 항에 있어서, 상기 관심있는 게놈 영역은 하나 이상의 표적 뉴클레오타이드 서열을 추가로 포함하며, 상기 증폭 단계 g)에서 상기 표적 뉴클레오타이드 서열과 혼성화하는 프라이머가 제공되고, 하나 이상의 추가적인 표적 뉴클레오타이드에 상응하는 하나 이상의 프라이머가 제공되며, 상기 프라이머를 이용하여 결합된 DNA 단편이 증폭되거나 원형화된 DNA이 증폭되는 방법.
  20. 제 6 항에 있어서, 결정자(identifier)가 단계 g)의 상기 프라이머의 적어도 하나에 포함되는 방법.
  21. 제 12 항에 있어서, 결정자가 단계 g)의 상기 프라이머의 적어도 하나에 포함되는 방법.
  22. 제 6 항에 있어서, 상기 증폭 단계 g)의 전 또는 후에 크기 선별 단계가 수행되는 방법.
  23. 제 11 항에 있어서, 상기 증폭 단계 g)의 전 또는 후에 크기 선별 단계가 수행되는 방법.
  24. 제 22 항에 있어서, 상기 크기 선별 단계는 겔 추출 크로마토그래피, 겔 전기영동 또는 밀도 구배 원심분리를 사용하여 수행되는 방법.
  25. 제 23 항에 있어서, 상기 크기 선별 단계는 겔 추출 크로마토그래피, 겔 전기영동 또는 밀도 구배 원심분리를 사용하여 수행되는 방법.
  26. 제 22 항에 있어서, DNA는 20 내지 20,0000 염기 쌍 사이의 크기를 선별하는 방법.
  27. 제 23 항에 있어서, DNA는 20 내지 20,0000 염기 쌍 사이의 크기를 선별하는 방법.
  28. 제 2 항 또는 제 8 항에 있어서, 하나 이상의 관심있는 게놈 영역을 포함하는 세포의 배수성(ploidy)이 1 보다 큰 경우, 각 배수성을 위해 단계 i)에서 콘틱을 구축하는 방법.
  29. 제 2 항 또는 제 8 항에 있어서, 상기 콘틱 구축의 단계 i) 는 하기의 단계를 포함하는 방법:
    1) 단계 b)의 단편을 확인(identifying);
    2) 게놈 영역에 상기 단편을 배치(assigning); 및
    3) 상기 게놈 영역을 위한 콘틱 구축.
  30. 제 29 항에 있어서, 게놈 영역에 상기 단편을 배치하는 단계 2)는 다른 결합 생산물 확인하고 상기 확인된 단편에 상기 다른 결합 생산물을 커플링하는 것을 포함하는 방법.
  31. 제 1 항, 제 2 항, 제 3 항, 제 7 항, 제 8 항 또는 제 9 항 중 어느 한 항의 모든 단계를 포함하고, 콘틱은 복수의 샘플을 위해 구축되며, 하기의 추가적인 단계를 포함하는 유전적 돌연변이의 존재 또는 부재 확인 방법:
    j) 상기 복수의 샘플의 콘틱을 정렬(aligning); 및
    k) 상기 복수의 샘플로부터 상기 관심있는 게놈 영역의 유전적 돌연변이의 존재 또는 부재를 확인.
  32. 제 1 항, 제 2 항, 제 3 항, 제 7 항, 제 8 항 또는 제 9 항 중 어느 한 항의 모든 단계를 포함하고, 하기의 추가적인 단계를 포함하는 유전적 돌연변이의 존재 또는 부재 확인 방법:
    j) 참고 서열에 상기 콘틱을 정렬; 및
    k) 상기 관심있는 게놈 영역에서 유전적 돌연변이의 존재 또는 부재를 확인.
  33. 제 1 항, 제 2 항, 제 3 항, 제 7 항, 제 8 항 또는 제 9 항 중 어느 한 항의 모든 단계를 포함하고, 제 1 항의 상기 관심있는 게놈 영역의 콘틱을 구축하기 위하여 상기 결정된 서열을 이용하는 단계 또는 제 2 항, 제 3 항, 제 7 항, 제 8 항 또는 제 9 항의 단계 i)는 하기의 단계로 대체되는, 유전적 돌연변이의 존재 또는 부재 확인 방법:
    1) 결합된 DNA 단편의 상기 결정된 서열을 참고 서열에 정렬; 및
    2) 상기 결정된 서열에서 유전적 돌연변이의 존재 또는 부재를 확인.
  34. 제 1 항, 제 2 항, 제 3 항, 제 7 항, 제 8 항 또는 제 9 항 중 어느 한 항의 모든 단계를 포함하고, 결합된 DNA 단편의 복수의 샘플 서열이 결정되며, 제 1 항의 상기 관심있는 게놈 영역의 콘틱을 구축하기 위하여 상기 결정된 서열을 이용하는 단계 또는 제 2 항, 제 3 항, 제 7 항, 제 8 항 또는 제 9 항의 단계 i)는 하기의 단계로 대체되는, 유전적 돌연변이의 존재 또는 부재 확인 방법:
    1) 복수의 샘플의 결합된 DNA 단편의 상기 결정된 서열을 정렬; 및
    2) 상기 결정된 서열에서 유전적 돌연변이의 존재 또는 부재를 확인.
  35. 제 1 항, 제 2 항, 제 3 항, 제 7 항, 제 8 항 또는 제 9 항 중 어느 한 항의 모든 단계를 포함하고, 제 1 항의 상기 관심있는 게놈 영역의 콘틱을 구축하기 위하여 상기 결정된 서열을 이용하는 단계 또는 제 2 항, 제 3 항, 제 7 항, 제 8 항 또는 제 9 항의 단계 i)는 하기의 단계로 대체되는, 이형성 (heterologous)이 되는 것이 의심되는 세포 군집으로부터 유전적 돌연변이를 보유한 단편의 비율 결정 방법:
    1) 제 1 항의 교차연결된 DNA를 단편화하는 단계 또는 제 2 항, 제 3 항, 제 7 항, 제 8 항 또는 제 9 항의 단계 b)의 상기 단편을 확인;
    2) 상기 단편에서 유전적 돌연변이의 존재 또는 부재를 확인;
    3) 상기 유전적 돌연변이를 보유한 단편의 수를 결정;
    4) 상기 유전적 돌연변이를 보유하지 않는 단편의 수를 결정; 및
    5) 상기 유전적 돌연변이를 보유한 단편의 비율을 계산.
  36. 제 1 항, 제 2 항, 제 3 항, 제 7 항, 제 8 항 또는 제 9 항 중 어느 한 항의 모든 단계를 포함하고, 제 1 항의 상기 관심있는 게놈 영역의 콘틱을 구축하기 위하여 상기 결정된 서열을 이용하는 단계 또는 제 2 항, 제 3 항, 제 7 항, 제 8 항 또는 제 9 항의 단계 i)는 하기의 단계로 대체되는, 이형성이 되는 것이 의심되는 세포 군집으로부터 유전적 돌연변이를 가지는 단편을 보유한 결합 생산물의 비율 결정 방법:
    1) 제 1 항의 교차연결된 DNA를 단편화하는 단계 또는 제 2 항, 제 3 항, 제 7 항, 제 8 항 또는 제 9 항의 단계 b)의 상기 단편을 확인;
    2) 상기 단편에서 유전적 돌연변이의 존재 또는 부재를 확인;
    3) 상기 유전적 돌연변이를 갖거나 갖지 않는 상기 단편을 보유한 결합 생산물을 확인;
    4) 상기 유전적 돌연변이를 갖는 상기 단편을 보유한 결합 생산물의 수를 결정;
    5) 상기 유전적 돌연변이를 갖지 않는 상기 단편을 보유한 결합 생산물의 수를 결정; 및
    6) 상기 유전적 돌연변이를 보유한 결합 생산물의 비율을 계산.
  37. 제 35 항에 있어서, 상기 단계 2)에서 유전적 돌연변이의 존재 또는 부재는 참고 서열에 정렬, 복수의 샘플의 단편 서열 비교, 또는 참고 서열에 정렬 및 복수의 샘플의 단편 서열 비교를 통하여 확인되는 방법.
  38. 제 31 항에 있어서, 상기 유전적 돌연변이는 단일 뉴클레오타이드 다형성(single nucleotide polymorphism; SNP), 결손, 삽입, 역전, 및 전위로 이루어진 군에서 선택되는 적어도 하나인 방법.
  39. 제 38 항에 있어서, 결손, 삽입, 또는 결손 및 삽입은 상기 결손, 삽입, 또는 결손 및 삽입을 보유한 샘플로부터의 단편, 결합 생산물, 또는 단편 및 결합 생산물의 수와 참고 샘플의 비교를 통하여 확인되는 방법.
  40. 제 38 항에 있어서, 상기 유전적 돌연변이는 분석된 단편에서 염색체적 중단점(breakpoints)의 존재에 기초하여 확인되는 방법.
  41. 제 2 항 또는 제 8 항에 기재된 단계 a) 내지 d)를 포함하는, 하나 이상의 DNA 단편, 결합된 DNA 단편 및 다수의 관심있는 게놈 영역의 서열에서 메틸화된 뉴클레오타이드의 존재 또는 부재를 결정하는 방법.
KR1020137003437A 2010-07-09 2011-07-08 관심있는 3-d 게놈 영역 서열화 전략 KR101862756B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US36277810P 2010-07-09 2010-07-09
US61/362,778 2010-07-09
PCT/NL2011/050504 WO2012005595A2 (en) 2010-07-09 2011-07-08 V3-d genomic region of interest sequencing strategies

Publications (2)

Publication Number Publication Date
KR20130049808A KR20130049808A (ko) 2013-05-14
KR101862756B1 true KR101862756B1 (ko) 2018-05-30

Family

ID=44629077

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137003437A KR101862756B1 (ko) 2010-07-09 2011-07-08 관심있는 3-d 게놈 영역 서열화 전략

Country Status (25)

Country Link
US (1) US12006538B2 (ko)
EP (3) EP3360975B1 (ko)
JP (1) JP5977234B2 (ko)
KR (1) KR101862756B1 (ko)
CN (1) CN103180459B (ko)
AU (1) AU2011274642B2 (ko)
BR (1) BR112013000552B8 (ko)
CA (1) CA2804450C (ko)
CY (1) CY1121702T1 (ko)
DK (2) DK3360975T3 (ko)
ES (2) ES2916339T3 (ko)
HR (1) HRP20180593T1 (ko)
HU (1) HUE037359T2 (ko)
IL (2) IL224127B (ko)
LT (1) LT2591125T (ko)
NO (1) NO2591125T3 (ko)
NZ (1) NZ606228A (ko)
PL (2) PL2591125T3 (ko)
PT (2) PT2591125T (ko)
RS (1) RS57295B1 (ko)
RU (1) RU2603082C2 (ko)
SG (1) SG186954A1 (ko)
SI (1) SI2591125T1 (ko)
WO (1) WO2012005595A2 (ko)
ZA (1) ZA201300375B (ko)

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2010242073C1 (en) 2009-04-30 2015-12-24 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
HUE037359T2 (hu) 2010-07-09 2018-08-28 Cergentis B V A fontos V3-D genom-régió szekvenálási stratégiái
US9163281B2 (en) 2010-12-23 2015-10-20 Good Start Genetics, Inc. Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction
AU2012304328B2 (en) 2011-09-09 2017-07-20 The Board Of Trustees Of The Leland Stanford Junior University Methods for obtaining a sequence
CA2850509C (en) 2011-10-14 2023-08-01 President And Fellows Of Harvard College Sequencing by structure assembly
EP2768983A4 (en) 2011-10-17 2015-06-03 Good Start Genetics Inc METHODS OF IDENTIFYING MUTATIONS ASSOCIATED WITH DISEASES
US11021737B2 (en) 2011-12-22 2021-06-01 President And Fellows Of Harvard College Compositions and methods for analyte detection
EP4249605A3 (en) 2011-12-22 2023-11-15 President And Fellows Of Harvard College Methods for analyte detection
US8209130B1 (en) 2012-04-04 2012-06-26 Good Start Genetics, Inc. Sequence assembly
US10227635B2 (en) 2012-04-16 2019-03-12 Molecular Loop Biosolutions, Llc Capture reactions
WO2013184754A2 (en) 2012-06-05 2013-12-12 President And Fellows Of Harvard College Spatial sequencing of nucleic acids using dna origami probes
US9411930B2 (en) * 2013-02-01 2016-08-09 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
US10089437B2 (en) * 2013-02-01 2018-10-02 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
WO2014129894A1 (en) * 2013-02-19 2014-08-28 Cergentis B.V. Sequencing strategies for genomic regions of interest
US10138509B2 (en) 2013-03-12 2018-11-27 President And Fellows Of Harvard College Method for generating a three-dimensional nucleic acid containing matrix
EP2971159B1 (en) 2013-03-14 2019-05-08 Molecular Loop Biosolutions, LLC Methods for analyzing nucleic acids
EP2971278B1 (en) * 2013-03-15 2022-08-10 The Broad Institute, Inc. Methods for determining multiple interactions between nucleic acids in a cell
US10287621B2 (en) 2013-04-11 2019-05-14 Pelin Sahlén Targeted chromosome conformation capture
KR102282990B1 (ko) 2013-06-04 2021-07-28 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Rna-가이드된 전사 조절
WO2015010051A1 (en) 2013-07-19 2015-01-22 Ludwig Institute For Cancer Research Whole-genome and targeted haplotype reconstruction
GB2517936B (en) * 2013-09-05 2016-10-19 Babraham Inst Chromosome conformation capture method including selection and enrichment steps
WO2015048595A1 (en) * 2013-09-27 2015-04-02 Jay Shendure Methods and systems for large scale scaffolding of genome assemblies
US10851414B2 (en) 2013-10-18 2020-12-01 Good Start Genetics, Inc. Methods for determining carrier status
GB201320351D0 (en) * 2013-11-18 2014-01-01 Erasmus Universiteit Medisch Ct Method
US11053548B2 (en) 2014-05-12 2021-07-06 Good Start Genetics, Inc. Methods for detecting aneuploidy
EP2960818A1 (en) * 2014-06-24 2015-12-30 Institut Pasteur Method, device, and computer program for assembling pieces of chromosomes from one or several organisms
WO2016007839A1 (en) 2014-07-11 2016-01-14 President And Fellows Of Harvard College Methods for high-throughput labelling and detection of biological features in situ using microscopy
EP3174980A4 (en) 2014-08-01 2018-01-17 Dovetail Genomics, LLC Tagging nucleic acids for sequence assembly
US11408024B2 (en) 2014-09-10 2022-08-09 Molecular Loop Biosciences, Inc. Methods for selectively suppressing non-target sequences
EP3224595A4 (en) 2014-09-24 2018-06-13 Good Start Genetics, Inc. Process control for increased robustness of genetic assays
US11279974B2 (en) 2014-12-01 2022-03-22 The Broad Institute, Inc. Method for in situ determination of nucleic acid proximity
WO2016112073A1 (en) * 2015-01-06 2016-07-14 Good Start Genetics, Inc. Screening for structural variants
WO2016134034A1 (en) 2015-02-17 2016-08-25 Dovetail Genomics Llc Nucleic acid sequence assembly
US11807896B2 (en) 2015-03-26 2023-11-07 Dovetail Genomics, Llc Physical linkage preservation in DNA storage
US10395759B2 (en) * 2015-05-18 2019-08-27 Regeneron Pharmaceuticals, Inc. Methods and systems for copy number variant detection
US12018314B2 (en) 2015-07-02 2024-06-25 Arima Genomics, Inc. Accurate molecular deconvolution of mixture samples
WO2017061861A1 (en) * 2015-10-05 2017-04-13 Koninklijke Nederlandse Akademie Van Wetenschappen Targeted locus amplification using cloning strategies
WO2017070123A1 (en) 2015-10-19 2017-04-27 Dovetail Genomics, Llc Methods for genome assembly, haplotype phasing, and target independent nucleic acid detection
US10900031B2 (en) 2015-10-19 2021-01-26 Zhejiang Annoroad Bio-Technology Co. Ltd. Method for constructing high-resolution single cell Hi-C library with a lot of information
GB201518843D0 (en) * 2015-10-23 2015-12-09 Isis Innovation Method of analysing DNA sequences
GB2559526B (en) 2015-11-03 2021-02-17 Harvard College Method and apparatus for volumetric imaging of a three-dimensional nucleic acid containing matrix
ES2926495T3 (es) * 2015-12-04 2022-10-26 10X Genomics Inc Métodos y composiciones para el análisis de ácidos nucleicos
CA3014911A1 (en) * 2016-02-23 2017-08-31 Dovetail Genomics, Llc Generation of phased read-sets for genome assembly and haplotype phasing
CN116200465A (zh) 2016-04-25 2023-06-02 哈佛学院董事及会员团体 用于原位分子检测的杂交链反应方法
GB201608000D0 (en) * 2016-05-06 2016-06-22 Oxford Biodynamics Ltd Chromosome detection
CN105839196B (zh) * 2016-05-11 2018-04-17 北京百迈客生物科技有限公司 一种真核生物DNA的Hi‑C高通量测序建库方法
EP3954771A1 (en) 2016-05-13 2022-02-16 Dovetail Genomics, LLC Recovering long-range linkage information from preserved samples
KR101915701B1 (ko) * 2016-06-16 2018-11-07 한국한의학연구원 돌연변이 발생률의 측정 방법
GB2569252A (en) 2016-08-31 2019-06-12 Harvard College Methods of combining the detection of biomolecules into a single assay using fluorescent in situ sequencing
GB2570412A (en) 2016-08-31 2019-07-24 Harvard College Methods of generating libraries of nucleic acid sequences for detection via fluorescent in situ sequencing
PL3548633T3 (pl) 2016-12-01 2024-04-02 Oxford BioDynamics PLC Zastosowanie epigenetycznych interakcji chromosomów w diagnostyce nowotworów
CN109789167A (zh) 2017-04-14 2019-05-21 哈佛学院董事及会员团体 用于产生细胞衍生的微丝网络的方法
CN107119120A (zh) * 2017-05-04 2017-09-01 河海大学常州校区 一种基于染色质3d构象技术的关键作用分子检测方法
US11873481B2 (en) 2017-11-21 2024-01-16 Arima Genomics, Inc. Preserving spatial-proximal contiguity and molecular contiguity in nucleic acid templates
CN112770776A (zh) 2018-07-30 2021-05-07 瑞德库尔有限责任公司 用于样品处理或分析的方法和系统
US20220251640A1 (en) * 2019-05-17 2022-08-11 The Broad Institute, Inc. Methods of determination of genome architecture and epigenetic profile
GB202006546D0 (en) 2020-05-04 2020-06-17 Cergentis B V Method
WO2021224225A1 (en) 2020-05-04 2021-11-11 Cergentis B.V. Method
WO2021224233A1 (en) 2020-05-04 2021-11-11 Cergentis B.V. Method
GB202006550D0 (en) 2020-05-04 2020-06-17 Cergentis B V Method
EP4251772A1 (en) 2020-11-26 2023-10-04 Stichting Het Nederlands Kanker Instituut- Antoni van Leeuwenhoek Ziekenhuis Personalized tumor markers
WO2022246275A1 (en) * 2021-05-21 2022-11-24 The Board Of Trustees Of The Leland Stanford Junior University Next-generation volumetric in situ sequencing
GB202111194D0 (en) 2021-08-03 2021-09-15 Cergentis B V Method

Family Cites Families (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5077204A (en) * 1984-06-21 1991-12-31 Chiron Corporation Yeast endopeptidase for basic amino-acid site cleavage, preparation and use
US9328391B1 (en) 1984-08-22 2016-05-03 The United States Of America As Represented By The Secretary, Department Of Health And Human Services Cloning and expression of HIV-1 DNA
JPS6226300A (ja) 1984-10-10 1987-02-04 セントコ−・インコ−ポレ−テツド Htlv−3dnaのクロ−ニングおよび発現
US5221518A (en) * 1984-12-14 1993-06-22 Mills Randell L DNA sequencing apparatus
US5258507A (en) * 1990-11-08 1993-11-02 Amoco Corporation Labeling reagents useful for the chemical attachment of nitrophenyl derivative ligands to DNA probes
US6060644A (en) * 1994-03-24 2000-05-09 Iowa State University Research Foundation, Inc. Isolation and use of cuticular lipid genes
EP1736554B1 (en) * 1996-05-29 2013-10-09 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions
WO1998020032A1 (en) * 1996-11-07 1998-05-14 The Board Of Trustees Of The Leland Stanford Junior University Sprouty protein and coding sequence
US6261804B1 (en) * 1997-01-21 2001-07-17 The General Hospital Corporation Selection of proteins using RNA-protein fusions
EP1009802B1 (en) * 1997-02-12 2004-08-11 Eugene Y. Chan Methods for analyzimg polymers
WO1999028446A2 (en) * 1997-12-02 1999-06-10 E.I. Du Pont De Nemours And Company Branched chain amino acid biosynthetic enzymes
US6455692B1 (en) * 1998-08-04 2002-09-24 Transgenomic, Inc. Method of concentrating polynucleotides using MIPC
US6291168B1 (en) * 1998-10-27 2001-09-18 Auburn University Nucleic acid sequences diagnostic for pathogenic E.coli O157:H7, methods of identification and kit therefore
US20050232900A1 (en) * 1999-05-18 2005-10-20 Crucell Holland B.V. Serotype of adenovirus and uses thereof
CA2378687A1 (en) * 1999-06-18 2000-12-28 Elitra Pharmaceuticals, Inc. Nucleotide sequences of moraxella catarrhalis genome
US7470507B2 (en) * 1999-09-01 2008-12-30 Whitehead Institute For Biomedical Research Genome-wide location and function of DNA binding proteins
US20040014195A1 (en) * 1999-12-29 2004-01-22 Diversa Corporation Nitrilases, nucleic acids encoding them and methods for making and using them
US20060292560A1 (en) * 2000-08-14 2006-12-28 Robert Burgess Transcription factor target gene discovery
US6709861B2 (en) * 2000-11-17 2004-03-23 Lucigen Corp. Cloning vectors and vector components
US20030054347A1 (en) * 2001-04-27 2003-03-20 The Regents Of The University Of Michigan Latrophilin Polynucleotides
US20030013863A1 (en) * 2001-07-16 2003-01-16 Buchholz Wallace G. High resolution DNA size standards
US20030157705A1 (en) * 2001-08-10 2003-08-21 Fodor William L. Engineered recombinant molecule that regulates humoral and cellular effector functions of the immune system
AUPR823601A0 (en) * 2001-10-12 2001-11-08 University Of Queensland, The Automated genotyping
AU2003237312A1 (en) * 2002-05-29 2003-12-19 University Of Washington Mutants of gad65 and ian5 relating to diabetes
CA2497338A1 (en) * 2002-08-30 2004-03-18 Japan Science And Technology Corporation Method of targeted gene disruption, genome of hyperthermostable bacterium and genome chip using the same
CA2500129C (en) * 2002-09-30 2011-03-29 F. Hoffmann-La Roche Ag Oligonucleotides for genotyping thymidylate synthase gene
US7575865B2 (en) * 2003-01-29 2009-08-18 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
CA2796381A1 (en) * 2003-03-06 2004-09-16 Children's Hospital, Inc. Genes of an otitis media isolate of nontypeable haemophilus influenzae
FR2852317B1 (fr) * 2003-03-13 2006-08-04 Biopuces a sondes et leurs methodes d'utilisation
EP1670505B1 (en) * 2003-09-18 2012-11-14 GOVERNMENT OF THE UNITED STATES OF AMERICA, as represented by THE SECRETARY, DEPARTMENT OF HEALTH AND HUMAN SERVICES Dna promoters and anthrax vaccines
US20060150283A1 (en) * 2004-02-13 2006-07-06 Nickolai Alexandrov Sequence-determined DNA fragments and corresponding polypeptides encoded thereby
US20060107345A1 (en) * 2003-09-30 2006-05-18 Nickolai Alexandrov Sequence-determined DNA fragments and corresponding polypeptides encoded thereby
WO2005039389A2 (en) * 2003-10-22 2005-05-06 454 Corporation Sequence-based karyotyping
JP2007512811A (ja) * 2003-11-10 2007-05-24 インベスチゲン, インコーポレイテッド 検出のための核酸を調製する方法
AU2005284980A1 (en) * 2004-09-10 2006-03-23 Sequenom, Inc. Methods for long-range sequence analysis of nucleic acids
US20070048748A1 (en) * 2004-09-24 2007-03-01 Li-Cor, Inc. Mutant polymerases for sequencing and genotyping
US20060223073A1 (en) * 2005-03-31 2006-10-05 Boyes Barry E Methods of using a DNase I-like enzyme
EP1910537A1 (en) * 2005-06-06 2008-04-16 454 Life Sciences Corporation Paired end sequencing
US8407013B2 (en) * 2005-06-07 2013-03-26 Peter K. Rogan AB initio generation of single copy genomic probes
EP1907571B1 (en) * 2005-06-15 2017-04-26 Complete Genomics Inc. Nucleic acid analysis by random mixtures of non-overlapping fragments
CA2613248A1 (en) * 2005-06-23 2006-12-28 Keygene N.V. Improved strategies for sequencing complex genomes using high throughput sequencing technologies
CN105039313B (zh) * 2005-06-23 2018-10-23 科因股份有限公司 用于多态性的高通量鉴定和检测的策略
CA2614118C (en) 2005-07-04 2013-11-26 Erasmus University Medical Center 4c
US20090143240A1 (en) * 2005-08-25 2009-06-04 Harbison Christopher T Novel Methods for Genome-Wide Location Analysis
WO2007030678A2 (en) * 2005-09-07 2007-03-15 Whitehead Institute For Biomedical Research Methods of genome-wide location analysis in stem cells
AU2006312378B2 (en) 2005-11-14 2012-02-16 Keygene N.V. Method for high throughput screening of transposon tagging populations and massive parallel sequence identification of insertion sites
US8481054B2 (en) * 2005-12-28 2013-07-09 The UAB Foundation Pneumococcal serotypes
GB0603251D0 (en) * 2006-02-17 2006-03-29 Isis Innovation DNA conformation
EP2043728A2 (en) 2006-07-11 2009-04-08 Microchips, Inc. Multi-reservoir pump device for dialysis, biosensing, or delivery of substances
WO2008015396A2 (en) * 2006-07-31 2008-02-07 Solexa Limited Method of library preparation avoiding the formation of adaptor dimers
US20100143990A1 (en) * 2006-11-27 2010-06-10 Achkar Juehane Fermentative production of hydroxytyrosol
ES2923759T3 (es) * 2006-12-14 2022-09-30 Life Technologies Corp Aparato para medir analitos utilizando matrices de FET
DK2121977T3 (en) 2007-01-11 2017-09-18 Erasmus Univ Medical Center Capture (4C) OF CHROMOSOMES WITH CIRCULAR CONFORMATION
US7835871B2 (en) * 2007-01-26 2010-11-16 Illumina, Inc. Nucleic acid sequencing system and method
EP2130927A4 (en) * 2007-03-07 2010-08-04 Univ Tokyo METHOD FOR AMPLIFYING A DNA FRAGMENT
US7932030B2 (en) * 2007-04-05 2011-04-26 The Board Of Supervisors Of Louisiana State University And Agricultural And Mechanical College System for pulling out regulatory elements using yeast
US20080248958A1 (en) * 2007-04-05 2008-10-09 Hollenbach Andrew D System for pulling out regulatory elements in vitro
CA2689356A1 (en) * 2007-06-01 2008-12-11 454 Life Sciences Corporation System and meth0d for identification of individual samples from a multiplex mixture
EP2053132A1 (en) * 2007-10-23 2009-04-29 Roche Diagnostics GmbH Enrichment and sequence analysis of geomic regions
US8518640B2 (en) * 2007-10-29 2013-08-27 Complete Genomics, Inc. Nucleic acid sequencing and process
US8263367B2 (en) * 2008-01-25 2012-09-11 Agency For Science, Technology And Research Nucleic acid interaction analysis
WO2009143212A1 (en) * 2008-05-21 2009-11-26 Mito Tech Llc Computer system and computer-facilitated method for nucleic acid sequence alignment and analysis
CN104232617A (zh) * 2008-05-23 2014-12-24 生命科技公司 用于dna提取的方法和试剂盒
FR2945545B1 (fr) * 2009-05-14 2011-08-05 Univ Aix Marseille Ii Methode de detection d'adn procaryote extrait d'un echantillon de selles
JP2013503605A (ja) * 2009-09-01 2013-02-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マイクロアレイの選択のためのデバイス及び方法
EP2354243A1 (en) 2010-02-03 2011-08-10 Lexogen GmbH Complexity reduction method
JP5901046B2 (ja) * 2010-02-19 2016-04-06 国立大学法人 千葉大学 OATP1B3mRNAの新規な選択的スプライシングバリアント
HUE037359T2 (hu) 2010-07-09 2018-08-28 Cergentis B V A fontos V3-D genom-régió szekvenálási stratégiái
US10858699B2 (en) * 2016-08-30 2020-12-08 Integrated Dna Technologies, Inc. Cleavable hairpin primers

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Biochimica et Biophysica Acta (BBA) - Molecular Cell Research, Volume 1783, Issue 11, November 2008, Pages 2052-2060
Martti T. Tammi, ‘The Principles of Shotgun Sequencing and Automated Fragment Assembly’, Center for Genomics and Bioinformatics, Karolinska Institutet, Stockholm, Sweden (2003.04.13.)
Methods in Enzymology, Volume 375, 2003, Pages 493-507

Also Published As

Publication number Publication date
US12006538B2 (en) 2024-06-11
CN103180459B (zh) 2016-10-19
WO2012005595A8 (en) 2012-04-26
CA2804450C (en) 2022-10-11
PT3360975T (pt) 2022-04-11
WO2012005595A3 (en) 2012-03-08
NO2591125T3 (ko) 2018-09-01
SI2591125T1 (en) 2018-08-31
DK2591125T3 (en) 2018-05-14
CN103180459A (zh) 2013-06-26
CA2804450A1 (en) 2012-01-12
BR112013000552A2 (pt) 2016-05-24
LT2591125T (lt) 2018-07-25
EP4063518A1 (en) 2022-09-28
EP2591125A2 (en) 2013-05-15
RU2013105459A (ru) 2014-08-20
SG186954A1 (en) 2013-02-28
KR20130049808A (ko) 2013-05-14
DK3360975T3 (da) 2022-04-11
NZ606228A (en) 2014-12-24
PT2591125T (pt) 2018-05-09
JP5977234B2 (ja) 2016-08-24
IL256509B (en) 2020-02-27
JP2013530709A (ja) 2013-08-01
ES2667346T3 (es) 2018-05-10
RS57295B1 (sr) 2018-08-31
EP2591125B1 (en) 2018-04-04
IL256509A (en) 2018-02-28
PL2591125T3 (pl) 2018-09-28
AU2011274642A1 (en) 2013-02-21
HRP20180593T1 (hr) 2018-07-27
ES2916339T3 (es) 2022-06-30
CY1121702T1 (el) 2020-07-31
EP3360975A1 (en) 2018-08-15
BR112013000552B8 (pt) 2023-01-17
AU2011274642B2 (en) 2015-05-21
HUE037359T2 (hu) 2018-08-28
ZA201300375B (en) 2014-03-26
EP3360975B1 (en) 2022-03-30
IL224127B (en) 2018-01-31
PL3360975T3 (pl) 2022-07-11
BR112013000552B1 (pt) 2021-03-02
US20130183672A1 (en) 2013-07-18
ES2667346T9 (es) 2018-06-11
RU2603082C2 (ru) 2016-11-20
WO2012005595A2 (en) 2012-01-12

Similar Documents

Publication Publication Date Title
KR101862756B1 (ko) 관심있는 3-d 게놈 영역 서열화 전략
US10235494B2 (en) Strategies for high throughput identification and detection of polymorphisms
KR102643955B1 (ko) 근접 보존 전위
US20110105338A1 (en) Expression-linked gene discovery
US20160040228A1 (en) Sequencing strategies for genomic regions of interest

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant