KR102332522B1 - 삼차원 dna 구조에서 뉴클레오티드 서열의 상호작용을 분석하기 위한 방법 - Google Patents

삼차원 dna 구조에서 뉴클레오티드 서열의 상호작용을 분석하기 위한 방법 Download PDF

Info

Publication number
KR102332522B1
KR102332522B1 KR1020167015969A KR20167015969A KR102332522B1 KR 102332522 B1 KR102332522 B1 KR 102332522B1 KR 1020167015969 A KR1020167015969 A KR 1020167015969A KR 20167015969 A KR20167015969 A KR 20167015969A KR 102332522 B1 KR102332522 B1 KR 102332522B1
Authority
KR
South Korea
Prior art keywords
dna
interaction
interactions
restriction enzyme
nucleotide sequence
Prior art date
Application number
KR1020167015969A
Other languages
English (en)
Other versions
KR20160079120A (ko
Inventor
프랑크 그로스벨드
토비아스 크노흐
Original Assignee
에라스무스 유니버시테이트 메디시 센트럼 로테르담
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에라스무스 유니버시테이트 메디시 센트럼 로테르담 filed Critical 에라스무스 유니버시테이트 메디시 센트럼 로테르담
Publication of KR20160079120A publication Critical patent/KR20160079120A/ko
Application granted granted Critical
Publication of KR102332522B1 publication Critical patent/KR102332522B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/682Signal amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/101Crosslinking agents, e.g. psoralen
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/10Detection mode being characterised by the assay principle
    • C12Q2565/133Detection mode being characterised by the assay principle conformational analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/501Detection characterised by immobilisation to a surface being an array of oligonucleotides

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

본 발명은
(a) 교차 결합된 DNA의 시료를 제공하는 단계;
(b) 제1 제한 효소로 교차 결합된 DNA를 분해하는 단계;
(c) 교차 결합된 뉴클레오티드 서열을 라이게이션시키는 단계;
(d) 교차 결합을 역전시키는 단계;
(e) 단계 (d)로부터 라이게이션된 분자를 단편화하는 단계;
(f) 단계 (c)에서 다른 뉴클레오티드 서열에 라이게이션된 뉴클레오티드 서열의 말단에 대한 농축을 위해 제1 제한 효소의 분해 부위에 인접한 서열을 나타내는 하나 이상의 올리고뉴클레오티드에 단계 (e)로부터의 단편을 하이브리드화시키는 단계; 및
(g) 상호작용(들)에 연관된 뉴클레오티드 서열을 확인하기 위해 농축된 단편의 뉴클레오티드 서열을 분석하는 단계를 포함하는, 3차원 DNA 구조 내에서 다른 뉴클레오티드 서열과 관심의 하나 이상의 영역(들)로부터 하나 이상의 뉴클레오티드 서열(들)의 상호작용을 분석하는 방법을 제공한다.

Description

삼차원 DNA 구조에서 뉴클레오티드 서열의 상호작용을 분석하기 위한 방법 {METHOD FOR ANALYSING THE INTERACTION OF NUCLEOTIDE SEQUENCES IN A THREE-DEMENSIONAL DNA STRUCTURE}
본 발명은 크로마틴(chromatin)과 같은 삼차원 DNA 구조에서 뉴클레오티드 서열의 상호 작용을 분석하기 위한 방법에 관한 것이다.
다수의 최근 연구들은 게놈이 링커 영역에 의해 분리된 수많은 자기 회합성(self-associating) 도메인에서 조직되어 있음을 보여준다. 이러한 소위 "위상 도메인(topological domain)"은 일반적으로 300 킬로 베이스 페어(Kb) 내지 1 메가 베이스 페어(1 Mb)범위이다. 비록 후자가 경우일 필요 없지만 위상 도메인은 루프가 영역 간 상호작용을 허여하도록 인접한 크로마틴의 두 부분을 가져오는 것으로 정의되는 크로마틴 루프의 시리즈로 구성된다. 이러한 루프는 다이나믹하며 CTCF 및 코헤신를 포함하는 수많은 단백질 및 도메인 내 유전자의 조절을 위해 요구되는 전사 인자 시리즈에 의존한다. 다른 루프가 유전자의 발현에서 기능을 가지는 동안; 도메인 내 많은 루프는 오직 구조적인 것, 즉 분리된 도메인을 제조하는 유전자의 폴딩이 가능하게 하는 것으로 생각된다. 후자 유형의 루프 (크로마틴 인접)는 위상 도메인 내 빈번하고 다른 위상 도메인들에서 위치된 크로마틴 사이에는 훨씬 적다.
조절 DNA 요소는 각각 다른 것 및 도메인 내 유전자와 상호작용하고 복잡한 상호작용 네트워크를 형성한다. 이러한 요소 및 그들 상호작용 내 변화는 (유전자에서 변이를 더하여) 차례로 종의 개인간 차이 또는 질병을 일으키는데 책임이 있는 유전자 발현에서 차이에 책임이 있다. 그러므로 이러한 요소는 질환의 진단 및 치료를 위해 중요해지고 있다. 그러나, 상당한 노력이 그들의 기능의 설명에 최근에 투여되었음에도 불구하고, 이러한 조절 네트워크는 여전히 상대적으로 알려져 있지 않다.
조절 요소는 유전자를 활성 또는 억제하는 전사 인자를 위한 하나 이상의 결합 위치를 포함하는 짧은 단편이다. 비록 그들이 특정 인자 예컨대 p300 또는 크로마틴 변형의 결합에 의해 인지될 수 있다고 하더라도, 조절 요소는 종종 그들의 표적 유전자로부터 멀리 위치하고 이는 종종 그들이 상호작용하는 유전자를 명확하지 않게 한다. 게놈의 공간 조직에서, 그들은 그들의 표적 유전자로 인접한다. 예를 들어, 다지(polydactyly)에서, 비록 영향을 받는 인핸서(enhancer)는 게놈의 직선 맵에서 영향을 받는 성장인자 유전자 Shh로부터 약 1 Mbp 떨어져 위치하더라도, 이는 핵의 3D 공간에서 유전자로 가깝게 연결된다.
비록 이는 조절 요소가 루프에 의해 유전자를 조절하는 것이 이미 명백했지만, 염색체 형태 캡쳐(3C)는 이러한 상호작용의 빠른 확인을 허여함에 의해 이 분야에서 혁신을 가져왔다. 3C 기술의 기본 원리는 핵 공간에서 DNA 단편의 인접이 교차 결합에 의해 검출될 수 있고,이어서 라이게이션된 생성물(ligated product)의 제한 효소 분해, 라이게이션 및 증폭이 될 수 있다. 수많은 3C 유형 기술은 상호작용 및 방법에 대해 더 정보를 제공하는 것으로 그 후 개발되었고, 유전자가 조절되는 방법은 : 3C/3C-qPCR; 3C-seq/4C-seq; 4C (3C-on-a chip); 5C (3C carbon copy); 및 Hi-C이다.
이러한 각각의 방법은 다양한 이점 및 단점과 관련되어 있다(표 1). 3C 및 4C 기술은 아주 힘들고, 유전자자리의 사전 지식을 요구하며 특정 시점으로부터 상호작용을 관찰하는 것으로 제한된다. 다양한 상호작용을 분석하기 위해서, 수많은 다른 시점이 별도의 분석을 요구하여 사용되어야만 한다. 3C 및 4C 기술은 게놈 와이드 데이터를 산출하지 않는다.
5C 및 HiC 기술은 더 진보되었다. 5C는 프라이머 디자인에 높은 필요가 있고 수많은 별도 상호작용의 분석을 허여하지만, 게놈 와이드 커버리지(genome wide coverage)를 제공하지 않는다. HiC는 이것이 높은 해상도 분석 (일반적으로 40 Kbp)를 제공하는 것 없이 전체 게놈을 분석하기 위해 많은 양의 시퀀싱을 요구하기 때문에 매우 비싸다. 분석의 대부분 최근 HiC 방법은 새로운 알고리즘이 사용되고 10 Kbp의 해상도를 제공한다. 그러나, 이는 막대한 양의 시퀀싱을 요구한다 (6개 생물학적 복제물(biological replicate)로부터 34 억 맵핑된 짝지어진 말단 판독). 이 규모에 대한 시퀀싱은 대부분 연구자 그룹이 이용할 수 없다. 또한, 관심은 HiC 방법에 의해 수행되는 시퀀싱의 중요한 부분이 이러한 적용을 위해 필요하지 않은 것을 의미하는 특정 유전자자리들(loci) 또는 도메인들의 제한된 세트, 예를 들어 질병에서 유전자 변경에 연관되는 영역이 연관되는 특정 질문에 매우 자주 관련되어 있다.
그러므로 상기 제한으로부터 고통 받지 않는 삼차원 크로마틴 구조에서 뉴클레오티드 서열의 상호작용 분석을 위한 증진된 방법에 대한 요구가 있다.
표 1 - 다른 크로마틴 형태 캡쳐링 기술 간 비교
Figure 112016057494527-pct00001
본 발명자들은 5C 및 HiC의 단점을 극복하기 위해 '표적된-크로마틴 캡쳐(T2C)'이라는 새로운 기술을 개발하였다.
T2C는 게놈의 도메인 및 하나 또는 여러 특정 영역의 구획화 내 상호작용을 확인하기 위해 관심의 하나 이상의 영역(들)으로부터 3C 라이게이션 생성물의 선택적 농축(selective enrichment)을 이용한다. 관심의 영역은 큰 (예를 들어 많은 메가 베이스 크기) 연속적인 게놈 영역이거나 대체적으로 작은 영역의 모음(각각 몇 메가베이스)일 수 있다.
모든 캡쳐된 제한 단편은 삼차원 게놈 구조에서 그 서열과 상호작용하는 뉴클레오티드 서열을 확인하기 위한 "시점(viewpoint)"으로 사용될 수 있다. T2C의 출력은 제한 단편-수준 분해능으로 로컬 상호작용 맵을 제공한다. 방법은 Hi-C 방법보다 상당히 적은 시퀀스 노력 및 덜 복잡한 생물정보 분석을 포함한다. T2C가 또한 표적 영역(들)의 외부 영역으로 표적된 영역(들) 내 단편의 상호작용을 확인하기 때문에, 방법은 5C 방법의 제한에 의해 방해되지 않는다.
그러므로, 제1측면에서, 본 발명은
(a) 교차 결합된 DNA의 시료를 제공하는 단계;
(b) 제1 제한 효소로 교차 결합된 DNA를 분해하는 단계;
(c) 교차 결합된 뉴클레오티드 서열을 라이게이션 하는 단계;
(d) 교차 결합을 역전하는 단계;
(e) (d)로부터 라이게이션된 분자를 단편화하는 단계;
(f) (c) 단계에서 또다른 뉴클레오티드 서열에 라이게이션된 뉴클레오티드 서열의 말단에 대한 농축을 위해 제1 제한효소의 분해 위치에 인접한 서열을 나타내는 하나 이상의 올리고뉴클레오티드에 대해 (e)로부터 단편을 하이브리드화하는 단계; 및
(g) 상호작용(들)에 연관된 뉴클레오티드 서열을 확인하기 위한 농축된 단편의 뉴클레오티드 서열을 분석하는 단계를 포함하는,
3차원 DNA 구조 내에서 다른 뉴클레오티드 서열과 관심의 하나 이상의 영역(들)로부터 하나 이상의 뉴클레오티드 서열(들)의 상호작용을 분석하는 방법을 제공한다.
방법은 삼차원 크로마틴 구조에서 다른 뉴클레오티드 서열과 관심의 하나 이상의 게놈 영역(들)로부터 하나 이상의 뉴클레오티드 서열(들)의 상호작용을 분석하기 위해 사용될 수 있다.
제1 제한 효소는 6-8 bp 인식 부위를 인식하는 임의의 제한 효소일 수 있다.
제1 제한효소는 BglII, HindIII, EcoRI, BamHI, SpeI, PstI 및 NdeI으로 구성된 그룹에서 선택될 수 있다.
방법의 (e) 단계에서, 라이게이션된 분자는 제2 제한 효소, 예컨대 효소는 4 또는 5 bp 뉴클레오티드 서열 인식 부위 또는 심지어 디뉴클레오티드(dinucleotide) 서열을 인지하는 것으로 분해(digestion)되어 단편화될 수 있다.
제2 제한 효소는 TspEI, MaeII, AluI, NlaIII, HpaII, FnuDII, MaeI, DpnI, MboI, HhaI, HaeIII, RsaI, TaqI, CviRI, MseI, Sth132I, AciI, DpnII, Sau3AI 및 MnlI으로 구성된 그룹으로부터 선택될 수 있다.
또한, (e)단계에서, 라이게이션된 분자는 기계적 수단, 예컨대 쉬어링(shearing) 또는 초음파 분해(sonication)에 의해 단편화될 수 있다.
또한, 제1 제한 효소는 제2 제한 효소가 비 특이적 뉴클레아제 또는 쉬어링의 기계적 수단에 의해 대체될 경우에서 4-6 염기쌍 인식 위치 (6 bp는 축퇴성 서열 (degenerate sequence)임)를 인지하는 임의의 제한 효소일 수 있다. 이는 이들이 더 주된 제한 단편이기 때문에, 하이브리드화 (하기 참조)를 위한 더 높은 수의 올리고뉴클레오티드들 및 상호작용의 더 높은 분해능을 야기한다.
(f) 단계에서, 하나 이상의 올리고뉴클레오티드 프로브(들)은 마이크로어레이에 위치되거나 비드에 캡쳐되거나, 또는 대체적으로 나중에 비드에 캡쳐되는 용액에 존재할 수 있다.
올리고뉴클레오티드 프로브(들)은 제1 제한 효소의 제한 위치, 예컨대 제1 제한 효소의 제한 위치의 100 bp 내 서열에 인접한 서열을 인지할 수 있다.
(f) 단계에서, 뉴클레오티드 서열 단편은 다수의 올리고뉴클레이티드를 포함하는 올리고뉴클레오티드 프로브의 세트에 대해 하이브리드화될 수 있고, 이들 각각은 관심의 게놈 영역으로부터 뉴클레오티드 서열에 대한 제1 제한 효소의 분해 위치에 인접한 서열에 대해 하이브리드화한다.
올리고뉴클레오티드 프로브의 세트는 제1 제한 효소로 관심의 게놈 영역(들)을 처리함으로써 얻을 수 있는 상당한 모든 제한 단편에 대해 특이적 프로브를 포함한다.
라이게이션된 뉴클레오티드 서열 단편이 하이브리드화에 의해 어레이에 캡쳐, 증폭 및/또는 시퀀싱되거나 또는 올리고뉴클레오티드 프로브의 동일 세트에 대해 하이브리드화된 다른 시료의 구분을 허여할 수 있도록 어댑터 서열은 단계 (f) 전 (e)로부터 뉴클레오티드 서열 단편의 하나 또는 둘 모두 말단에 라이게이션일 수 있다. 어댑터는 또다른 시료로부터 구별되는 하나의 시료를 허여하는 특정 어드레스 서열을 포함할 수 있다. 특정 어드레스 서열을 가진 모든 서열은 또한 하나의 특정 시료로부터 유래된 것으로 알려져 있다.
방법의 (g) 단계는 농축된 뉴클레오티드 서열 단편의 고속 대량 처리 시퀀싱을 포함할 수 있다.
방법의 (g) 단계는 생물정보학적 분석 및/또는 상호작용(들)의 시각화가 이어질 수 있다.
관심의 영역 (예컨대 관심의 게놈 영역)은 관심의 유전자 좌 (genetic locus)를 포함할 수 있다.
관심의 영역은 모두 길이가 약 1 -50 MB일 수 있다.
만약 (g) 단계에서 특정 유전 요소를 포함하는 농축된 뉴클레오티드 서열 단편의 서열만 유전 요소로 상호작용(들)에 연관된 뉴클레오티드 서열(들)을 확인하기 위해 분석된다면 본 발명의 방법은 삼차원 구조에서 다른 뉴클레오티드 서열과 특정 유전 요소의 상호작용을 분석하기 위해 사용될 수 있다.
유전 요소는 전사 인자에 대한 결합 위치 또는 인슐레이터(insulator) 또는 장벽 요소(barrier element)를 포함할 수 있다.
유전적 요소는 관심의 영역, 예를 들어 요소가 질환에서 재배열 또는 제거된 유전 영역에 빈번하게 연관되거나 가까운 것일 수 있다.
본 발명의 방법은 또한 유전자를 포함하는 관심의 영역에서 상호작용의 수, 유형 또는 밀도를 분석함으로써 유전자의 발현 상태를 결정하기 위해 사용될 수 있다.
방법은 관심의 영역에서 두 시료를 분석하고 상호작용의 수, 유형 또는 밀도를 비교함으로써 두 시료간 유전자 활성을 비교하기 위해 사용될 수 있다.
방법은 단백질, 예컨대 전사 인자가 특정 상호 작용을 위해 책임이 있는 것을 확인하기 위해 사용될 수 있다.
시료는, 예를 들어 동일 대상체로부터 다른 조직으로부터; 다른 시점에서 단일 대상체로부터; 다른 대상체로부터 동등한 시료로부터(예를 들어, 건강한/질환의/질환이 의심되는 대상체)일 수 있다.
방법은 질환 및 비질환 세포로부터 교차 결합된 DNA 시료를 분석함으로써 특정 질환 상태의 지시자인 하나 이상의 DNA-DNA 상호작용들, DNA-DNA 상호작용 또는 DNA-DNA 상호 작용의 패턴이 특정 질환 상태의 지시자인 것을 보여주는 질환 및 비질환 세포로부터 DNA 서열들 간 삼차원 크로마틴 구조에서 뉴클레오티드 서열의 상호작용 간 차이를 확인하기 위해 사용될 수 있다.
발명의 방법은 DNA-DNA 상호작용에서 변화에 의하거나 연관된 질환 또는 신드롬의 진단 또는 예후에 사용될 수 있다. 이 관점에서, (a) 단계는 대상체로부터 교차 결합된 DNA 시료를 제공하는 것을 포함하고; (g) 단계는 영향을 받지 않는 대조군의 그것으로 DNA 서열 간 상호작용을 비교하는 것을 포함하고; 대상체가 질환 또는 신드롬으로부터 고통받고 있는 지시자 또는 대상체가 진환 또는 신드롬으로부터 고통받을 것인 지시자에서 대조군 및 대상체의 차이.
질환은 유전되는 유전 질환, 또는 체세포 유전 질환, 예컨대 암일 수 있다.
제2측면에서, 발명은 또한
(a) 하나 이상의 제제와 시료를 접촉시키는 단계; 및
(b) 발명의 제1측면의 방법을 수행하는 단계를 포함하며 여기서 (a) 단계는 시료로부터 교차 결합된 DNA를 제공하는 것을 포함하는, DNA의 삼차원 구조를 조절하는 하나 이상의 제제를 확인하기 위한 검정 방법을 제공하며,
여기서 (ⅰ) 제제의 존재 하에 DNA 상호작용 및 (ⅱ) 제제의 부재에서 DNA 상호작용의 차이는 DNA의 삼차원 구조를 조절하는 제제의 지시자임.
T2C는 알려진 5C 또는 HiC 방법보다 상당한 이점을 제공한다,
예를 들어:
5C에 상반되는 것으로 모든 제한 단편은 '시점'으로 기여하고 모든 그들의 상호작용은 그들이 짧거나 긴 거리 또는 다른 염색체에 있는지 여부를 확인시켜줄 수 있다
게놈의 구획화는 HiC에서 요구되었던 많은 서열화 노력(sequence effort)에 대한 요구 없이 관심의 영역에서 확인될 수 있으며, 따라서 상당히 비용을 감소한다.
다른 기술과 대비될 때 유전자 자리의 더 나은 커버리지(Coverage) 및 분해능이 획득된다. T2C의 분해능이 사용되는 제한 효소에 기반되지만, 종종 1-10 Kb의 체계 (6 bp 인지 제한 효소에 대해 평균 4-5 kb)이다. 이는 통상 HiC로 획득되는 통상 40 Kbp bins 보다 상당히 더 나은 분해능을 제공한다.
도 1 : T2C 절차의 개요
분리된 교차 결합된 크로마틴은 인접 제한 단편 사이 지지 링크에 대해 희석된 조건 하에 분해되고 라이게이션된다. 탈교차 결합 및 2차 분해 후, 돌출부(oeverhang)는 복구되고 이어서 어댑터 라이게이션(adaptor ligation)된다. 어댑터는 시퀀싱 방법, 예를 들어 짝지어진 말단 일루미나 또는 선택적으로 짧은 어드레스 서열을 위해 요구되는 서열을 포함한다. 다른 어드레스는 어드레스 서열이 이 것이 유래되었던 시료로 서열의 매칭을 허여하는 멀티플렉싱(올리고뉴클레오티드 프로브의 동일 세트에 대한 다른 시료의 혼성)을 허여하기 위한 다른 시료로 사용될 수 있다. 생성된 라이브러리(들)는 비드에 포획될 수 있는 용액에서 어레이 또는 올리고뉴클레오티드 프로프에 고유한 올리고뉴클레오티드 프로프의 세트에 대해 하이브리드화된다. 고유한 올리고뉴클레오티드 프로프(green squiggles)은 제1 제한 부위에 가능한 가까이 위치된다. 하이브리드화된 DNA는 게놈의 선택된 영역으로부터 모든 상호작용의 라이브러리를 포함하고 일루미나 HiSeq2000에 짝찌어진 말단 시퀀싱되며 이어서 생물 정보학 분석 및 상호작용의 시각화(즉, 인접 서열)된다. 수직 검은 선은 제1 제한 효소 분해 부위를 나타낸다. 오렌지색 작은 수직 선은 제2 제한 효소 분해 위치를 나타낸다.
도 2 : Hi-C 데이터 및 4C 데이터로 인간 chr11p15.5 영역에 대한 T2C에 의해 검출된 상호작용의 비교
A) 40Kbp 분해능에서 나타내어지는 관심의 H19/IGF2 영역을 커버하는 IMR90 세포에 대해 생성된 Hi-C 데이터 (Zuin 외 (2013) 출판)
B) (A)에서와 같이 동일한 40 kbp bins를 사용하여 나타내어지는 HB2 세포에서 T2C에 의해 관찰된 상호작용. 두 방법에 의해 관찰된 전체적 위상 도메인 페턴은 유사하다.
C) 단편 수준에서 그들의 실제 분해능에서 나타내어지는 T2C 데이터. 오른쪽에서 컬러 바는 판독의 낮은 (파란색)부터 높은 (노란색) 수까지 각각 상호작용에 대한 서열 판독의 빈도(frequency)를 제공한다. 판독의 수는 두 단편 간 라이게이션의 빈도를 나타내며 그러므로 핵의 삼차원 공간에서 이들 단편 간 상호작용이다.
D) T2C(두꺼운 빨간선)에 의해 이 특정 시점에 대해 관찰된 상호작용과 대비되는 IGF2 유전자에 가까운 하나의 시점에 대한 4C 상호작용 데이터. 시점은 방법 간 직접 비교를 허여하도록 (c)에 또한 표시된다. 얇은 빨간선은 비교의 용이성을 위해 상호작용 단편의 수를 표시한다.
도 3 : β-글로빈 유전자자리에 대한 구획화 및 상호작용의 비교
T2C를 E12.5 마우스로부터 마우스 일차 적혈구 세포 (A) 및 마우스 태아 뇌 세포 (B) 에 대한 β-글로빈 유전자자리 주변 ~2 MB 영역에서 수행하였다. 다른 생물학적 물질 사이의 위상학적 도메인 패턴이 두 생물학적 시료에서 상호작용의 다른 수의 같은 독립으로 보인다. E12.5 마우스로부터 마우스 일차 적혈구 세포 (C) 및 마우스 태아 뇌 세포 (D)에 대한 β-글로빈 유전자자리 주변 상호작용에 대해 줌인 (Zoom in). 흰선은 β-글로빈 유전자자리에서 특정 관심의 영역(β-글로빈 프로모터 및 LCR과 같은)을 나타낸다. LCR, β-글로빈 프로모터 및 3'HS1 간 상호작용이 마우스 뇌 세포에서 손실되었다. 모든 상호작용은 동일한 컬러모드로 정규화된다. 유전자 자리의 선형 표현은 적혈구 세포 내 LDB1 및 CTCF의 결합 위치를 가진 하단에서 나타내어진다.
도 4 : LDB1 또는 CTCF 결합 위치를 포함하는 단편의 상호작용의 비교
마우스 일차 적혈구 세포에 대한 LDB1 (A), (B), 또는 CTCF (C), (D)에 결합하는 단편에 대한 β-글로빈 유전자자리 주변 ~2MB 영역에서 상호작용. β-글로빈 유전자자리 주변 위상 도메인이 마우스 뇌 세포와 대비될 때 마우스 간 세포에서 명확하게 묘사된다. 마우스 일차 적혈구 세포 (E), (G) 및 마우스 뇌 세포 (F), (H)에 대한 β-글로빈 유전자자리 주변에서 LDB1 결합 단편 (E), (F) 및 CTCF 결합 단편(G), (H) 간 상호작용의 표시 줌 인 (Zoom in). 흰선은 β-글로빈 유전자자리에서 특정 관심영역(3'HS1, β-글로빈 프로모터 및 LCR)을 나타낸다. LCR, β-글로빈 프로모터 및 3'HS1 간 태아 간 상호작용이 마우스 뇌 세포에서 손실되었다. 모든 상호작용은 동일한 컬러모드로 정규화된다. 하단은 적혈구 세포 내 LDB1 및 CTCF의 결합 위치를 가진 β-글로빈 유전자 자리의 선형 표시를 나타낸다.
도 5 : 단편만을 포함하는 LDB1 또는 CTCF에 대한 상호작용의 평균, 중앙값 및 수.
LDB1 (A) 및 CTCF (B) 상호작용의 수는 일차 적혈구 세포와 비교될 때 마우스 태아 뇌에서 더 낮았다. 더욱이, LDB1 (C) 또는 CTCF (D) 모두 상호작용 파트너 간 거리의 평균 및 중앙값이 마우스 일차 적혈구 세포와 비교될 때 마우스 태아 뇌세포에서 더 낮았다.
도 6 내지 10 : 마우스 태아 뇌 (도 6), 마우스 태아 간 (도 7), 인간 HB2 (도 8), 인간 TEV (도 9), 및 인간 HEV (도 10) 세포에 대한 상호작용 매트릭스의 시각화, 모두 ~2 Mbp 영역 및 로그 빈도 범위 및 무지개 색상 코드를 시각화에 사용함. 도면은 명확하게 우수한 분해능 및 T2C의 질 및 직접적 시각 판독을 보여주고, 이는 게놈이 루프 응집체/로제트 도메인을 형성하는 크로마틴 루프로 구성된, 소염색체 도메인에서 조직된다. 이는 종 특이적 (도 6 및 도 7, 과 도 8 내지 10 비교), 조직/세포 특이적 (도 6 및 도 7 및 도 8-10)이고, 유전자 활성 (도 6, 7, 8 및 9), 및 코헤신과 같은 구조적으로 관련된 단백질의 존재(도 8 및 도 9)에 의존적이다. 그러므로, 구조는 또한 유전적 또는 구조적 변화에서 질환 상태, 상호작용 변화에 의존적이다 (도 6 및 도 7, 또는 도 9 및 도 10).
11 : 이뮤노글로불린 중쇄 유전자 자리 및 프레더-윌리/엔젤만 신드롬 영역 (Prader-Willi/Angelmann Syndrome region)에서, 유전자 마커 간 공간 거리의 시뮬레이션된 크로마틴 모델 묘사 및 관계/평가 : a, 시뮬레이션된 무작위-워크/자이언트-루프(Random-Walk/Giant-Loop) 모델 및 다중-루프 소구획 모델의 볼륨 렌더링 이미지. 중기 염색체 (top)의 형태 및 크기를 가진 시작 형태로서, 로제트는 적층되었다 (alpha). 이러한 시작 구조로부터, 열역학적 평형에서 간기 염색체는 몬테-카를로에 의해 비응축되었고 브라우니안 동역학 단계를 완화하였다. 큰 루프 (5 Mbp)를 포함하는 시뮬레이션된 무작위-워크/자이언트 루프 모델의 볼륨 렌더링 이미지가 보여졌다 (왼쪽; beta). 큰 루프는 구별된 구조를 형성하지 않았으나 자유롭게 혼합된 것에 주목한다 (왼쪽; beta). 대조적으로, 126 kbp 크기 루프 및 링커를 포함하는 시뮬레이션된 다중-루프 소구획화 모델의 볼륨 렌더링 이미지에서, 로제트는 루프가 자유롭게 혼합되지되지 않은 구별된 크로마틴 영역을 형성한다 (중간; 감마, 126 kbp 루프 및 63 kbp 링커를 포함하는 시뮬레이션된 RW/GL 모델의 이미지에서, 다시 구별된 크로마틴 영역은 MLS 모델과 대조적으로 소구획화 형태를 형성하지 않았다 (오른쪽; delta). B: 무작위-워크 자이언트 루프 및 다중-루프 소구획화 모델은: 큰 루프가 비-DNA 백본(backbone)에 부착된 RW/GL 모델을 나타낸다. 루프 간 크로마틴 링커를 포함하는 시뮬레이션된 모델을 나타낸다. MLS 모델은 126 kbp 루프 및 개별 로제트 스패닝 1-2 Mbp를 가진 링커를 포함하는 것을 보여준다.
12 : 다양한 다중-루프-소구획화 모델 (모델 파라미터 : 루프 사이즈/ 링커 사이즈/모델이름)에 대한 공간 거리의 크로마틴 모델 설명 및 관계/평가를 위한 다른 교차 결합 확률 (Di : 상호작용의 거리)에 대한 시뮬레이션된 상호작용 맵.
도 13 : 다양한 무작위-워크-자이언트-루프 모델 (모델 파라미터 : 루프 사이즈/ 링커 사이즈/모델이름)에 대한 공간 거리의 크로마틴 모델 설명 및 관계/평가를 위한 다른 교차 결합 확률 (Di : 상호작용의 거리)에 대한 시뮬레이션된 상호작용 맵.
본 발명은 삼차원 DNA 구조에서 뉴클레오티드 서열 간 상호작용을 분삭허기 위한 방법에 관한 것이다.
삼차원 DNA 구조
용어 "삼차원 DNA 구조"는 단백질 분자에서 아미노산 서열의 고차 구조와 유사하게, DNA 이중 나선, 형성, 예를 들어 루프 및 접힘인 고차 구조를 가진 DNA를 포함하는 구조를 의미한다. 구조는 단독의 DNA로 구성될 수 있고, 또는 추가로 다른 분자, 예컨대 단백질을 포함할 수도 있다. 크로마틴은 DNA 및 단백질 간의 복합체의 예시이다.
본 발명의 방법은 게놈의 삼차원 크로마틴 구조의 분석에 이상적으로 적합하다.
크로마틴의 주요 기능은 1) 세포에 맞는 더 작은 부피로 DNA를 패킹하는 것, 2) 유사 분열을 허여하도록 DNA에 앵커 포인트를 제공하는 것, 및 4) 유전자 발현, DNA 복제 및 수선하는 것이다. 크로마틴의 가장 풍부한 단백질 요소는 DNA를 조밀하게 하는 히스톤이다.
크로마틴의 구조는 다양한 인자들에 의존한다. 전체 구조는 세포 주기의 단계에 의존되며: 간기 동안 크로마틴은 DNA를 전사 및 복제하는 RNA 및 DNA 폴리머라제에 대해 접근을 허여하기 위해 구조적으로 느슨해진다. 간기 동안 크로마틴의 국소 구조는 DNA를 제시하는 유전자에 의존하며 : 활발하게 전사되는 DNA 코딩 유전자들은 DNA 코딩 비활성 유전자들이 구조 단백질에 결합되고 더 타이트하게 패킹(이질염색질(heterochromatin))되는 동안 더 느슨하게 패킹되고 RNA 폴리머라제(진정염색질(euchromatin)이라 불림)로 결합되는 것이 확인된다. 또한 크로마틴에서 구조적 단백질의 후성적 화학적 변형은 국소 크로마틴 구조, 특히 메틸화 및 아세틸화에 의한 히스톤 단백질의 화학적 변형을 변경한다. 세포가 분할을 위해 준비, 즉 유사 분열 또는 감수 분열에 들어감으로써, 크로마틴은 핵분열 말기 동안 염색체의 분리를 용이하게 하기 위해 보다 더 타이트하게 팩킹한다.
진핵 세포의 핵에서, 간기 염색체는 구별된 염색체 영역을 점유한다. 최근 메가베이스-크기 국소 크로마틴 상호작용 도메인이 확인되었고, "위상 도메인(topological domains)"이라 불리운다 (Dixon 외 (2012, Nature 485, 376-380). 이들 도메인은 이질염색질의 확산을 억누르는 게놈의 영역과 상관관계가 있다. 도메인은 다른 세포 유형을 가로질러 안정하고 종을 가로질러 높게 보존되며, 위상 도메인들이 포유류 게놈의 내제적 특성임을 나타낸다.
또한 위상 도메인들은 로제트(Rosette) 같은 구조의 시리즈로 게놈의 가능한 고차 구조를 제안하는 서로와 상호작용한다.
본 발명의 방법은 게놈, 염색체 또는 이의 부분 내 위상 도메인들 또는 고차 구조들을 확인하고 특징을 나타내기 위해 사용될 수 있다.
게놈의 공간 조직은 이의 생물학적 기능과 직접적으로 연결되어 있고, 그래서 이는 고차 게놈 구조를 이해하기 위해 중요하다.
비록 발명의 방법은 게놈의 삼차원 크로마틴 구조의 분석을 위해 이상적으로 적합하지만, 이는 임의의 삼차원 구조에서 뉴클레오티드 서열 상호작용 분석에 적용될 수 있다.
핵산, 예컨대 DNA는 그 자체, 다른 핵산들 및 다른 분자들 예컨대 단백질과 "사차 구조(quaternary structure)"를 자발적으로 형성할 수 있다. 본 발명의 방법은 임의의 핵산을 포함하는 구조의 삼차원 구조를 분석하기 위해 사용될 수 있다. 예를 들어 방법은 DNA 나노기술에 사용되는 인공 핵산 빌딩 블럭의 계층적 조립(hierarchical assembly)을 조사 및 확인하기 위해 사용될 수 있다.
관심의 영역(REGION OF INTEREST)
본 발명은 다른 뉴클레오티드 서열을 가진 관심의 영역에서 뉴클레오티드 서열(들) 간 상호작용을 분석하는 것을 포함한다.
관심의 영역은 하나 (이상)의 염색체 내 관심의 게놈 영역일 수 있다.
관심의 영역은 관심의 특정 게놈 유전자자리(Locus)를 포함할 수 있다. 유전자 좌는 유전자의 특정 위치 또는 DNA 서열 또는 염색체에 위치이다. 관심의 게놈 영역은 하나 또는 둘의 플랭킹 영역들(flanking regions)과 함께 특정 유전자자리, 예컨대 특정 유전자의 서열을 포함할 수 있다. 관삼의 영역은 예를 들어, 유전자의 양쪽에서 약 1, 2, 3 또는 4 MB의 서열을 포함할 수 있다.
"다른 뉴클레오티드 서열", 즉 관심의 영역 내 뉴클레오티드 서열들이 상호작용하는 것을 가진 뉴클레오티드 서열들은 그들 스스로 관심의 영역에서 위치되거나, 또는 그들이 다른 영역, 예컨대 다른 염색질로부터의 동일 염색질(들)의 다른 부분일 수 있다. 유전자들의 조절이 변하거나 또는 유전자를 상실할 때 이러한 영역들과 상호작용은 질환의 경우에 변경될 수 있다.
DNA
3D DNA 구조는 하나 이상의 유전자 좌들로 구성되거나 또는 포함하는 게놈 DNA를 포함할 수 있다.
방법
본 발명의 방법은 하기 단계를 포함한다 :
(a) 교차 결합된 DNA의 시료를 제공하는 단계;
(b) 제1 제한효소로 교차 결합된 DNA를 분해하는 단계;
(c) 교차 결합된 뉴클레오티드 서열을 라이게이션 하는 단계; 및
(d) 교차 결합을 역전하는 단계.
본 발명의 방법의 이러한 처음 4 단계들은 Dekker 등 (2002) Science 295:1306에 기술된 염색체 형태 캡쳐(Chromosome Conformation Capture, 3C); 및 WO 2007/004057에 기술된 4C(Capture and Characterise Colocalised Chromatin)에 대해 유사한 것이다.
3C 유사 템플레이트는 알려진 방법들, 예컨대 Splinter 외, (2004) Methods Enzymol. 375, 493-507에 의해 기술된 방법을 사용하여 제조될 수 있다. 요약하자면, 시료, 예컨대 세포, 조직 또는 핵들은 가교제(cross-linking agent), 예컨대 포름알데히드를 사용하여 고정된다. 제1 제한 효소 분해는 다음으로 수행됨으로서 DNA는 교차 결합된 핵의 내용물 내에서 분해된다. 그리고 나서 분자간 라이게이션은 비-교차 결합 DNA 단편들(즉, 분자내 또는 임의 라이게이션) 간 라이게이션을 넘어 교차 결합 DNA 단편들(즉 분자간 라이게이션)간 라이게이션을 선호하는 낮은 DNA 농도에서 수행된다. 다음으로, 교차 결합은 역전되고 DNA는 정제된다. 생성된 3C 템플레이트는 그들이 핵 공간 내에서 원래 가까웠기 때문에 라이게이션된 제한 단편들을 포함한다.
제1 제한 효소가 분자간 라이게이션 단계 전에 DNA를 분해하기 위해 사용되기 때문에, 제1 제한 효소에 대한 효소 인식 부위는 제1 (표적) 뉴클레오티드 서열 및 라이게이션된 뉴클레오티드 서열을 분리할 것이다. 따라서 제1 제한 효소 인식 부위는 제1(표적) 뉴클레오티드 서열 및 라이게이션된 뉴클레오티드 서열(즉, 라이게이션된 제2 서열) 사이에 위치된다.
교차 결합(CROSS-LINKING)
가교제들(Cross-linking agents)-예컨대 포름알데히드-는 다른 이웃의 단백질들 및 핵산에 대해 단백질을 교차 결합하기 위해 사용될 수 있다. 그러므로, 둘 이상의 뉴클레오티드들은 이들 뉴클레오티드 서열들 중 하나에 대해 결합하는 단백질들을 통해 교차 결합될 수 있다. 포름알데히드 이외의 가교제들은 또한 뉴클레오티드 서열들을 직접 교차 결합하는 이들 가교제들을 포함하여 본 발명에 따라 사용될 수 있다. 교차 결합 DNA 제제들의 예시는 이에 제한되지 않으나, 자외선, 미토마이신 C(mitomycin C), 질소 머스타드, 멜팔란, 1,3-부타디엔 디에폭사이드, cis 디아민디클로로플레티넘(Ⅱ)(diaminedichloroplatinum(Ⅱ)) 및 사이클로포스파미드를 포함한다.
적절하게, 가교제는 상대적으로 짧은 거리 예컨대 약 2 Å를 연결하는 교차 결합을 형성함으로서, 역전될 수 있는 밀접한 상호작용들을 선택한다.
교차 결합은 예를 들어 상온에서 2 % 포름알데히드 내 세포를 항온처리함으로써 예컨대 상온에서 10분간 2 % 포름알데히드가 첨가된 DMEM 10% FCS 10 ml 내에서 1 × 107 세포를 항온처리함으로써 수행될 수 있다.
제한효소로 분해 (DIGESTION WITH RESTRICTION ENZYME)
교차 결합된 DNA는 제1 제한효소로 분해된다.
제한 엔도뉴클레아제는 DNA의 당-인산 백본을 분해하는 효소이다. 대부분 실용적 세팅들에서, 주어진 제한 효소는 단지 몇 베이스의 구간(strech) 내 이중 DNA의 양 가닥들을 자른다. 제한 효소를 위한 기질은 인지 위치/서열로 불리는 이중 가닥 DNA의 서열들이다.
제한 인지 위치의 길이는 사용되는 제한 효소에 의존적으로 다양하다. 인지 서열의 길이는 효소가 빈번하게 DNA의 서열에서 분해하는 방식에 영향을 준다.
그들의 제한 위치들과 함께 DNA의 4 bp 서열을 인지하는 제한 효소는 다음을 포함한다: : AATT (TspEI), ACGT (MaeII), AGCT (AluI), CATG (NlaIII), CCGG (HpaII), CGCG (FnuDII), CTAG (MaeI), GATC (DpnI, DpnII, Sau3AI & MboI), GCGC (HhaI), GGCC (HaeIII), GTAC (RsaI), TCGA (TaqI), TGCA (CviRI), TTAA (MseI), CCCG (Sth132I), CCGC (AciI) 및 CCTC (MnlI).
그들의 제한 위치들과 함께 DNA의 6 bp 서열을 인지하는 제한 효소는 다음을 포함한다: AACGTT (AclI), AAGCTT (HindIII), AATATT (SspI), ACATGT (BspLU11I), ACCGGT (AgeI), ACGCGT (MluI), ACTAGT (SpeI), AGATCT (BglII), AGCGCT (Eco47III), AGGCCT (StuI), AGTACT (ScaI), ATCGAT (ClaI), ATGCAT (AvaIII), ATTAAT (VspI), CAATTG (MfeI), CACGTG (PmaCI), CAGCTG (PvuII), CATATG (NdeI), CCATGG (NcoI), CCCGGG (SmaI), CCGCGG (SacII), CCTAGG (AvrII), CGATCG (PvuI), CGGCCG (XmaIII), CGTACG (SplI), CTCGAG (XhoI), CTGCAG (PstI), CTTAAG (AflII), GAATTC (EcoRI), GACGTC (AatII), GAGCTC (SacI), GATATC (EcoRV), GCATGC (SphI), GCCGGC (NaeI), GCGCGC (BsePI), GCTAGC (NheI), GGATCC (BamHI), GGCGCC (NarI), GGGCCC (ApaI), GGTACC (KpnI), GTATAC (SnaI), GTCGAC (SalI), GTGCAC (ApaLI), GTTAAC (HpaI), TACGTA (SnaBI), TCATGA (BspHI), TCCGGA (BspMII), TCGCGA (NruI), TCTAGA (XbaI), TGATCA (BclI), TGCGCA (MstI), TGGCCA (BalI), TGTACA (Bsp1407I), TTATAA (PsiI), TTCGAA (AsuII) 및 TTTAAA (AhaIII).
그들의 제한 위치들과 함께 DNA의 7 bp 서열을 인지하는 제한 효소는 다음을 포함한다: CCTNAGG (SauI), GCTNAGC (EspI), GGTNACC BstEII 및 TCCNGGA PfoI.
그들의 제한 위치들과 함께 DNA의 8 bp 서열을 인지하는 제한 효소는 다음을 포함한다: : ATTTAAAT (SwaI), CCTGCAGG (Sse8387I), CGCCGGCG (Sse232I), CGTCGACG (SgrDI), GCCCGGGC (SrfI), GCGATCGC (SgfI), GCGGCCGC (NotI), GGCCGGCC (FseI), GGCGCGCC (AscI), GTTTAAAC (PmeI) 및 TTAATTAA (PacI).
또한 둘 이상의 염기들이 인지되는 DNA의 3 또는 5 bp 서열들을 효율적으로 야기하는 인지 서열 내 특정 위치에서 가능한 의미인 축퇴성 서열(degenerate sequence)들을 인지하는 제한 효소들이다. 이는 2bp를 효율적으로 인지하기 위한 효소의 조합, 예를 들어 효율적으로 2 bp CG 서열을 인지하기 위한 HpyCH21V, MspI, HinPII 및 TaqI의 조합을 또한 사용할 수 있다.
제1 제한 효소 (또는 효소들의 조합)은 2, 4, 5, 6, 7 또는 8 bp를 인지할 수 있다.
제1 제한 효소는 특히 6-커터, 예컨대 HindIII 또는 BglII일 수 있다.
제2 제한 효소 (또는 효소들의 조합)는 DNA의 2 또는 4 bp 서열을 인지할 수 있거나 비특이적 뉴클레아제(이 경우 오직 제한된 분해가 적용됨) 또는 기기적 파쇄에 의해 대체될 수 있다.
교차 결합의 라이게이션 및 역전 (LIGATION AND REVERSAL OF CROSS-LINKING)
분해 단계는 그리고나서 이어서 분자간 상호작용에 호의적인 희석된 조건 하에서 라이게이션 및 호환 가능한 말단을 통한 DNA의 연결을 한다.
라이게이션은 라이게이즈 효소의 첨가에 의해 유도될 수 있다.
라이게이션 반응은 낮은 DNA 농도에서 예컨대 약 1-5 ng/μl로 수행될 수 있다.
교차 결합은 제제 예컨대 프로테이나제 K의 첨가에 의해 역전될 수 있다.
방법의 추가 단계들
본 발명의 방법은 또한 하기를 포함할 수 있다 :
(e) 라이게이션된 DNA를 예를 들어 제2 제한 효소(예컨대 4 bp 인지 효소) 또는 다른 뉴클레아제들로 또는 기기적 시어링(shearing)에 의해 단편화하는 단계. 후자 경우에서, DNA 말단들은 어댑터 서열의 추가를 허여하는 평활 말단화(blunt ended)가 되도록 수복될 수 있다.
(f) 시료들 간 구별을 허여하는 특이적 서열 (다른 특이적 서열을 가진 링커를 포함하는 다른 시료) 및/또는 고속 대량 처리 시퀀싱을 허여하는 서열들을 포함하는 어댑터 서열에 대한 라이게이션 단계;
(g) 하나 이상의 유전자 좌들을 나타내는 하나의 올리고뉴클레오티드 프로브 또는 올리고뉴클레오티드 프로브의 세트(들)에 대해 라이게이션된 시료를 하이브리드화하는 단계. 올리고뉴클레오티드의 하나 또는 세트(들)은 (a) 단계 및 그들의 하이브리드화 온도로 제1 제한 위치에 대한 근접의 기초에서 선택된다. 후자는 그들의 길이 및 염기 조성물에 의존한다. 세트에서 다른 올리고뉴클레오티드 프로브들은 유사한 하이브리드화/녹는 온도들을 가져야 한다. 게다가, 그들은 반복적 DNA의 하이브리드화를 방지하기 위해 특이해야 한다. 올리고뉴클레오티드 프로브들은 고체 표면에 부착될 수 있거나 고체 표면에 캡처를 허여하는 태그 예컨대 비오틴, 바람직하게 스트렙타비딘 비드를 포함한다.
(h) 비 하이브리드화된 물질을 제거하기 위해 하이브리드화 후 하이브리드화된 고체 표면을 강하게 세척.
(i) 하이브리드화된 물질을 용출.
(j) 예를 들어 짝지어진 말단 일루미나 시퀀싱에 의해 하이브리드화된 물질 시퀀싱
(k) 게놈에 대해 다시 시퀀스를 맵핑하기 위해 생물정보학을 사용 및 상호작용의 메트릭스 생성.
단편화 (FRAGMENTATION)
라이게이션된 DNA 분자는 당업계에 알려진 다양한 방법, 예컨대 제2 제한 효소 또는 다른 뉴클레아제들로; 방사선 또는 중이온들을 사용하여; 또는 기기적 수단들 예컨대 초음파 또는 시어링으로 분해에 의해 단편화될 수 있다.
제2 제한 효소는 방법의 (b) 단계에서 사용된 제1 제한 효소보다 더 빈번하게 DNA를 분해해야한다. 제2 제한 효소는 제1 제한 효소보다 DNA(인지 위치)의 더 짧거나 더 일반적인 구역을 인지할 수 있다.
만약 제1 제한 효소가 6-8 bp 커터이면, 제2 제한 효소는 예를 들어 2 또는 4-커터일 수 있다.
제2 제한효소는 예를 들어 4-커터 예컨대 Dpn II 또는 NlaIII일 수 있다.
제2 제한효소 (또는 효소들의 조합)는 DNA의 2 또는 4 bp 서열을 인지할 수 있고 비특이적 뉴클레아제 (이 경우 오직 제한된 분해가 적용됨) 또는 기기적 단편화에 의해 대체될 수 있다. 수많은 비-서열 특이적 뉴클레아제들, 예컨대 미구균(Micrococcal) 뉴클레아제 또는 DNaseⅠ이 있다.
기기적 방법, 예컨대 시어링, 비특이적 뉴클레아제들 또는 자외선 또는 중이온들을 사용한 처리에 따라, 뉴클레오티드 서열들의 말단들은 다음 단계들을 허여하도록 표준 방법들에 의해 '수복'될 필요가 있을 수 있다.
어댑터 (ADAPTER)
어댑터는 시퀀싱 목적, 즉 방법을 위한 시퀀싱 분석, 예컨대 일루미나 방법을 가능하도록 단계 (e)로부터 단편들의 말단들에 대해 라이게이션될 수 있다.
어댑터는 어드레스 서열을 포함할 수 있다. 다른 어드레스 서열들은 어드레스 서열이 이것이 유도된 시료로 서열의 매칭을 허여하는 (올리고뉴클레오티드 프로브들의 같은 세트에 대해 다른 시료들의 하이브리드화) 멀티플렉싱을 허여하기 위해 다른 시료들에 대해 사용된다. 어드레스 서열들은 다중 시료들 또는 내부 스파이킹이 사용될 때 유용하다.
어댑터 서열이 하이브리드화 전에 첨가되는 것이 바람직하다. 하이브리드화 후 라이게이션에 의해 그들에 추가할 수 있으나 이는 DNA가 단일 가닥 DNA로 하이브리드화를 떼어내기 때문에 덜 효율적인 것으로 보인다.
하이브리드화 ( HYBRIDISATION )
방법의 (f) 단계에서, 뉴클레오티드 서열 단편들은 상호작용 하는 뉴클레오티드 서열을 포함하는 단편들에 대해 농축을 위해 하나 이상의 올리고뉴클레오티드 프로브(들)에 대해 하이브리드화된다.
올리고뉴클레오티드 프로브들은 고체 지지체, 예컨대 어레이 또는 비드들(하기 참조)에 대해 부착되거나 캡쳐될 수 있다.
올리고뉴클레오티드 프로브들은 제1 제한 효소의 제한 위치들의 위치를 유념하는 관심의 영역으로부터 서열(들)에 기초로 디자인된다.
각 올리고뉴클레오티드 프로브는 제1 제한 위치에 가깝게 위치되는 서열로 상응한다. 본 발명의 방법의 (d) 단계에서 제조된 라이게이션된 DNA 분자는 제1 제한 효소의 제한 위치에서 연결되는 다른 뉴클레오티드 서열을 포함한다. 다른 뉴클레오티드 서열들은 삼차원 구조에서 "상호작용" (즉 교차 결합되기에 충분히 가까운)하였다. 라이게이션 분자가 단편화될 때, 일부 단편들은 단일 뉴클레오티드 서열, 내부 단편화(예를 들어 제2 제한 효소에 의해 내부 분해)으로부터 유래될 것이다. 다른 단편들은 상호작용하는 뉴클레오티드 서열들 둘 다로부터 유래될 것이다.
제1 제한 효소에 가깝게 위치된 서열을 가진 선택적인 단편들에 의해, 단편들은 "상호작용하는 단편" 즉, 라이게이션 단계(c)에 의해 제1 제한 효소의 제한 위치에서 연결된 두 뉴클레오티드성려들의 부분을 포함하는 것을 나타내는 그것들에 대해 농축된다.
올리고뉴클레오티드 프로브들
적합하게, 올리고뉴클레오티드 프로브들은 길이에서 적어도 15, 20, 25, 30 또는 40 뉴클레오티드일 것이다.
올리고뉴클레오티드 프로브들은 제1 제한 효소의 제한 효소 인식 위치에 가능한 가깝도록 디자인된다. 용어 "인접한 (adjacent to)"은 그들이 제1 제한 효소 인식 위치로부터 약 100 뉴클레오티드, 예컨대 약 90, 80, 70, 60, 50, 40, 30, 20, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1 뉴클레오티드(들) 떨어진 내 위치를 인지하도록 올리고뉴클레오티드 프로브들이 디자인된 것을 의미한다.
만일 관심의 영역이 제1 제한 효소 (RE1)의 X 인식 부위를 가지면, RE1으로 분해는 X+1 단편들을 생산할 것이다. 이들 단편들은 양 말단에서 RE1 인식 부위를가질 것이며, 따라서 이는 관심 영역에서 모든 단편들을 포함하기 위한 2X 올리고뉴클레오티드 프로브들을 디자인하기 위해 필수적이다.
올리고뉴클레오티드 프로브들의 라이브러리는 제1 제한 효소로 관심의 영역(들)을 치료함으로써 획득된 실질적으로 모든 제한 단편들에 대해 특이적인 올리고뉴클레오티드들을 포함할 수 있다. 이 문맥에서 "실질적으로 모든"은 제한 단편-플랭킹 위치들의 적어도 60, 70, 80, 90, 95 또는 99%를 의미한다.
때때로, 말단들 중 하나를 나타내는 올리고뉴클레오티드 프로브를 디자인하는 것이 불가능하며, 예를 들어 다음과 같다:
(ⅰ) 서열이 반복될 수 있음
(ⅱ) 제2 인식 효소 위치(RE2)가 RE1 위치에 너무 가까울 수 있음
(ⅲ) 두 RE1 위치 사이에 RE2 위치가 없음(비특이적 뉴클레아제 또는 기기적 단편화가 사용될 때 이는 적용되지 않음)
만일 상기 한정 중 어느 것이 적용될 때, 특정 RE1 제한 단편 또는 이의 말단에 대한 올리고뉴클레오티드 프로브는 올리고뉴클레오티드 프로브들의 세트로부터 생략될 수 있으나, 올리고뉴클레오티드 세트는 실질적으로 모든 RE1-플랭킹 위치들에 대해 여전히 올리고뉴클레오티드 프로브들을 포함할 것이다.
분석
단편들이 "상호작용"을 나타내는 것들로 농축되면, 상호작용에 연관된 뉴클레오티드 서열들은 시퀀싱에 의해 특징지어질 수 있다.
짝지어진-말단 시퀀싱은 우리의 알려진 기술, 예컨대 일루미나 시스템을 사용하여 수행될 수 있다.
라이게이션된 뉴클레오티드 서열 단편들이 어레이에 캡쳐, 증폭 및/또는 시퀀싱되도록 어댑터 서열은 바람직하게 단계 (e) 전 또는 덜 선호되게 단계 (f) 후로부터 뉴클레오티드 서열 단편들의 하나 또는 양 말단들에 대해 라이게이션될 수 있다. 어댑터 서열은 다양한 시료들이 동일 어레이 즉, 멀티플렉싱(multiplexing)에서 분석될 때 시료를 인지하기 위한 어드레스를 제공할 수 있다. 이는 현재 레인 당 ± 1억5천 시퀀스 판독을 산출하는 일루미나 기기의 하나의 레인에서 멀티플렉스 8 시료를 가능하게 한다.
더 상세하게, 단편들은 말단 수복되고 A-tail되고, 및 표시된 아댑터들은 A-tail된 DNA 단편들에 대해 라이게이션될 수 있다.
생성된 아댑터-변형된 DNA 라이브러리는 캡쳐, 용출 및 PCR 증폭될 수 있다. 본 발명의 방법에서, 단편들은 농축 단계(단계 (f)) 전 PCR 증폭되지 않을 수 있다.
그리고 나서 클러스터 생성 및 고성능 시퀀싱은 알려진 기술(예를 들어 일루미나 클러스터 시약 및 HiSeQ 200 시퀀서를 사용하여)에 의해 수행될 수 있다.
상호작용 빈도들은 이전에 기술된 이차원 히트맵을 제조함으로써 시각화될 수 있다 (상기와 같이 Liberman-Aiden 외 (Science 2009 326:289-293; Dixon 외 (2012). 두 임의의 유전자자리 간 상호작용 빈도들은 연쇄 불균형 플롯 (linkage disequilibrium plot)과 유사한 방법으로 각각 유전자자리 교차로부터 유래된 대각선인 축 오프 포인트를 확인함으로써 시각화될 수 있다.
맵에서 각 포인트는 두 단편들(근접한 두 단편) 간 상호작용 위치를 나타낸다. 맵에서 각 상호작용 포인트의 강도는 이를 나타내는 단편의 상호작용/근접의 빈도와 관련이 있다. 대각선에서 포인트들은 자가-라이게이션 효과를 나타낼 뿐만 아니라 바로 이웃의 단편들에 대한 라이게이션을 나타낸다. 시각화는 기본적으로 메트릭스 분석이다.
시료
시료는 교차 결합하거나 할 수 있는 DNA를 포함하는 임의의 물리적 독립체일 수 있다. 시료는 생물학적 물질일 수 있거나 이로부터 유래될 수 있다.
시료는 하나 이상의 세포들, 하나 이상의 핵들, 또는 하나 이상의 조직 시료들일 수 있거나 이로부터 유래될 수 있다. 독립체들은 DNA- 예컨대 크로마틴이 존재하는 임의의 독립체일 수 있거나 이로부터 유래될 수 있다. 시료는 하나 이상의 분리된 세포들 또는 하나 이상의 분리된 조직 시료들, 또는 하나 이상의 분리된 핵들일 수 있거나 이로부터 유래될 수 있다.
시료는 살아있는 세포들 및/또는 죽은 세포들 및/또는 핵 용해물들 및/또는 분리된 크로마틴일 수 있거나 이로부터 유래될 수 있다.
시료는 질환 및/또는 비-질환 대상체들의 세포들일 수 있거나 이로부터 유래될 수 있다.
시료는 질환으로부터 고통을 받는 것으로 의심되는 대상체일 수 있거나 이로부터 유래될 수 있다.
시료는 그들이 미래 질환으로부터 고통 받을 가능성에 대해 테스트하기 위한 대상체일 수 있거나 이로부터 유래될 수 있다.
시료는 생존 또는 비-생존 환자 재료일 수 있거나 이로부터 유래될 수 있다.
표준 시료는 시료들이 스파이킹 시료의 서열 판독을 사용하여 정상화될 수 있기 때문에 다른 시료들 간 더 나은 비교를 허여하기 위해 각각 실험 시료(스파이킹)에 대해 더해질 수도 있다. 스파이킹 시료는 1단계에서 세포들의 형태에서 스파이킹을 허여하기 위한 실험 시료보다 다른 종들로부터 일 수 있으며, 대체적으로 스파이킹 시료는 이의 고유 어드레스를 가지거나 절차 내 후 단계에서 스파이킹될 때 다른 종들로부터 일 수 있다.
어레이 (ARRAY)
전형적으로, 올리고뉴클레오타이드 프로브의 세트를 지지체 상에 고정시키거나 비드(bead)와 같은 고체 지지체에 포획시킬 수 있다. 지지체(예를 들면, 고체 지지체)는 유리, 실리카, 플라스틱, 나일론 또는 니트로셀룰로즈와 같은 다양한 물질로 제조될 수 있다. 고체 지지체에 부착되는 경우, 이는 바람직하게는 강성이며, 평편한 표면을 갖는다. 지지체는 전형적으로 약 1 내지 10,000,000개의 별개의 공간 지정 영역(addressable region), 또는 셀을 갖는다. 약 10 내지 1,000,000 또는 약 100 내지 100,000 또는 약 1000 내지 100,000개의 셀을 갖는 지지체가 일반적이다. 셀의 밀도는 전형적으로 평방 센티미터내 적어도 약 1000, 10,000, 100,000 또는 1,000,000개의 셀을 갖는다. 일부 지지체에서, 모든 셀은 올리고뉴클레오타이드 프로브의 혼합물 또는 올리고뉴클레오타이드 프로브의 세트에 의해 점유되어 있다. 다른 지지체에서, 일부 셀은 프로브의 혼주된 혼합물 또는 올리고뉴클레오타이드 프로브의 세트에 의해 점유되어 있고, 다른 세포는 적어도 합성 방법, 단일 유형의 올리고뉴클레오타이드에 의해 수득가능한 순도의 정도까지 점유되어 있다.
>6 bp 인식 서열을 인식하는 제한 효소의 경우, 약 2 x 750,000개의 올리고뉴클레오타이드 프로브의 단일 어레이를 사용하여, 예를 들면, 각각의 제한 부위의 각각의 면에 1개의 올리고뉴클레오타이드 프로브를 지닌, 완전한 인간 또는 마우스 게놈을 포괄(cover)한다.
용액 중의 올리고뉴클레오타이드 프로브
용액 중의 올리고뉴클레오타이드 프로브는 스트렙타비딘 비드에 의해 포획될 수 있는 바이오틴을 함유하는 올리고뉴클레오타이드와 같은, 고체 표면에 포획될 수 있는 모이어티(moiety)를 함유할 수 있다. 용액 중 하이브리드화가 보다 효율적일 수 있다.
포획은 하이브리드화 이후에 일어날 수 있다.
하이브리드화
본원에 사용된 것으로서, 용어 "하이브리드화"는, "핵산의 가닥이 염기쌍화를 통해 상보적 가닥으로 결합하는 공정"을 포함할 것이다.
선택적 하이브리드화할 수 있는 뉴클레오타이드 서열은 일반적으로 올리고뉴클레오타이드 프로브의 길이에 걸쳐 상응하는 상보성 뉴클레오타이드 서열에 대해 적어도 75%, 85%, 90%, 95% 또는 98% 상동성일 것이다. 선택성은 하이브리드화 동안에 염 및 온도 조건에 의해 측정된다.
"특이적인 하이브리드화"는 엄격한 조건(stringent condition)(예를 들면, 65℃ 및 0.1xSSC {1xSSC = 0.15 M NaCl, 0.015 M Na-시트레이트 pH 7.0}) 하에서 특정 뉴클레오타이드 서열에 대해서만 분자의 결합, 중복, 또는 하이브리드화를 말한다. 엄격한 조건은, 올리고뉴클레오타이드 프로브가 이의 표적 서열에 하이브리드화하지만, 다른 서열에는 하이브리드화하지 않을 조건이다. 엄격한 조건은 서열-의존성이며 상이한 환경에서 상이하다. 보다 긴 서열은 구체적으로 보다 높은 온도에서 하이브리드화한다. 일반적으로, 매우 엄격한 조건은 규정된 이온 강도 및 pH에서 특이적인 서열에 대해 열 용융 온도(Tm) 보다 약 5℃ 더 낮도록 선택된다. 하이브리드화 온도는 용융 온도(Tm)보다 낮은 온도이며 하이브리드화 온도가 Tm에 근접할 수록, 하이브리드화는 더 엄격해지게 되며, 이는 미스매치된 DNA 서열이 서로 하이브리드화하지 않을 것임을 의미한다. 올리고뉴클레오타이드 서열은 게놈 DNA보다 과량이어서 효율적으로, 바람직하게는 완전하게 되어야 하며 이에 의해 정량적 하이브리드화가 보장되어야 한다. 전형적으로, 엄격한 조건은 pH 7.0 내지 8.3에서 적어도 약 0.01 내지 1.0M Na 이온 농도의 염 농도(또는 다른 염)를 포함한다. 엄격한 조건은 또한 포름아미드 또는 테트라알킬 암모늄 염과 같은, 탈염제의 첨가로 달성될 수 있다.
본 발명을 이제 실시예로써 추가로 설명할 것이며, 이들 실시예는 본 발명을 수행하는데 있어서 이 분야의 통상의 기술자를 보조하기 위해 제공됨을 의미하며어떠한 방식으로도 본 발명의 영역을 한정하는 것으로 의도되지 않는다.
실시예
실시예 1 - 공지된 광범위한 상호작용을 확인하는 T2C
상기 방법을 시험하고 이를 다른 방법과 비교하기 위해, 본 발명자들은 우선 앞서 염색체의 광범위한 상호작용 및, Hi-C 및 4C 데이타가 비교용으로 이미 이용가능한 점착(cohesion) 및 CTCF의 역할을 연구하기 위해 미리 사용되었던 인간 11번 염색체 상의 IGF/H19 영역을 선택하였다 (도 2).
어레이-기반 올리고뉴클레오타이드의 세트를 H19 유전자자리의 대략 2.1Mbp 영역인, 344 BglII 단편에 상응하는 총 524개 올리고뉴클레오타이드를 포괄하는 모든 BglII 단편의 말단 근처에서 맵핑하여 설계하였다. 다수의 BglII 단편은, 말단 중의 하나를 나타내는 올리고뉴클레오타이드의 설계를 허용하지 않았는데, 그 이유는 이 서열이 반복적이거나 4bp 인식 효소 부위(NlaIII)가 BglII 부위에 매우 근접하거나 BglII 단편으로부터 완전히 부재하기 때문이었다. 교차 결합된 BglII 제한된 DNA를 연결하고, 탈교차 결합시키고, NlaIII 효소로 분해하고 탈교차 결합 후 올리고뉴클레오타이드 어레이에 하이브리드화하였다(방법 참고).
HiC에 대해 사용된 것으로서 게놈의 40kb 결합을 우선 사용한 시퀀싱된 라이게이션 생성물의 분석은, T2C가 IMR90 세포에 대해 딕슨(Dixon) 등((2012), 상기 참고)에 의해 관찰된 바와 같이 유사한 전체적인 상호작용 패턴을 나타냄을 입증하였다(상기 부위 외부의 상호작용 또는 다른 염색체와의 상호작용이 또한 관찰되지만 나타내지는 않는다). 이는 또한 상이한 세포주 사이에서 위상적 도메인과 유사한 전체적인 구조적 특징의 이미 관찰된 보존과 일치한다(도 2A+B).
그러나, T2C를 사용하여, 제한 단편 분해시 상호작용 맵(도 2C)이 수득되었으며, 이는 상기 영역의 일반적인 크로마틴 조직화와 관련하여 훨씬 더 상세한 사항 및 유전자와 이들의 조절 요소 사이의 접촉을 나타내었다.
T2C의 이 크로마틴 구조를 비교하기 위하여, 상기 데이타를 4C 데이타와 비교하였고 특수한 CTCF 시점에 대해 수득된 4C 데이타를 T2C 데이타에 존재하는 동일한 시점에 대해 관찰된 상호작용 데이타에 대해 다음에 플롯팅하였다(도 2D).
개개의 상호작용의 판독 범위에 있어 일부 변화가 있다고 해도, 동일한 상호작용이 4C 및 T2C에 의해 관찰될 수 있다. 따라서, T2C 방법은 재생가능한 결과를 생성하며, 상호작용(또는 밀접하게 근접성인)하여 위상적인 도메인내 전체적인 게놈 구조를 명확히 재생하여 6bp 인식 제한 단편에 대해 예측된 약 4 내지 5kbp의 분해능을 제공한다.
실시예 2 - 상이한 생물학적 물질을 기반으로 하는 상이한 상호작용 네트워크를 확인하는 T2C
상이한 유전자 발현 상태가 상이한 크로마틴 상호작용을 지닌 상이한 생물학적 조직내에서 검출될 수 있는지를 또한 시험하기 위하여, T2C를 E12.5 마우스로부터 마우스 태아 간으로부터의 마우스 일차 적혈구 세포 및 뇌 세포에 생체내(in vivo) 적용하였다. 잘 연구된 β-글로빈 유전자자리를 유전자 주변의 ~2MB의 영역내 예로서 사용하였다. β-글로빈이 태아 뇌 세포와 비교하여 일차 적혈구 세포에서 보다 고도로 발현되므로, 보다 농밀한 수의 상호작용이 이 세포 유형 내 유전자 주변 및 유전자와 이의 유전자자리 조절 영역(LCR) 사이에서 예측됨은 잘 확립되어 있다. β-글로빈 영역은 6bp 효소로서 HindIII로 분해하였으며 799개 올리고뉴클레오타이드 프로브를 유전자자리(724개 단편, 이들 중 많은 것이 반복성이다)내 HindIII 단편의 말단을 덮도록 설계하고 교차 결합한 후 DpnII로 재-분해하였다.
DpnII로 절단한 후 하이브리드화된 단편의 분석은 각각의 위상적 도메인내 많은 상호작용을 지닌 마우스 주요 적혈구 세포 및 마우스 태아 뇌 세포 둘 다에서 목적 영역내 5개의 위상 도메인(~2 MB)을 나타내었다. 위상적 도메인은 또한 서로 상호작용하며, 이는 게놈의 일련의 로케트 유사 구조로의 가능한한 고차원의 구조를 제안한다. 상이한 생물학적 물질 사이의 위상적 도메인의 수가 동일한 것으로 여겨진다고 해도 위상적 도메인내 및 이들 사이의 상호작용은 마우스 일차 적혈구 세포와 비교하여 마우스 태아 뇌 세포내에서 거의 농밀하지 않는 것으로 여겨진다(도 3). 모든 β-글로빈 영역내의 주밍(zooming)은, 태아 간 물질내 β-글로빈 유전자자리내 모든 잘 공지된 상호작용을 나타낸다. β-글로빈 프로모터와 LCR 사이 및 LCR-3'HS1 사이와 같은 상호작용은 명확하게 가시적이다(도 3). 이들은 태아 뇌 시료로부터는 부재한다. 더욱이, β-글로빈 프로모터에 대해 지금까지 보고된 것보다 더 떨어진 새로운 추가의 상호작용을 확인하는 것이 가능하다. 이들은 β-글로빈 프로모터로부터 ~1Mbp 떨어져서 국재화된다.
태아 간 세포내 중요한 조절 전사 인자의 결합 부위, LDB1 복합체 또는 구조 인자 CTCF의 결합 부위의 상호작용을 또한 비교하였다. LDB1은 태아 뇌 세포와 비교하는 경우 마우스 주요 적혈구 세포내 β-글로빈 유전자자리 및 이의 LCR 상에 매우 농축되어 있다. ChIP-seq에 의해 측정된 것으로서(참조: 예를 들면, Soler 외 (2010) Genes Dev;24(3):277-89) LDB1 또는 CTCF 전사 인자 결합 부위를 함유하는 제한 단편만을 시각화함으로써, 모든 상호작용 중의 어느 상호작용이 LDB1 복합체 또는 CTCF를 포함하는지를 즉시 유추하는 것이 가능하다(도 4). 마우스 일차 적혈구 세포에서, 보다 LDB1 점유된 제한 단편이 마우스 뇌 세포와 비교하는 경우 유전자자리내 다른 위치와의 상호작용을 갖는지가 또한 명확하다(도 4). 또한, 매우 근접한 2개의 단편 사이의 거리의 평균은 태아 간 세포에서 더 크며, 이는 게놈의 이 부위가 태아 뇌와 비교하는 경우 태아 간에서 덜 농밀하지 않음을 제안한다(도 5).
따라서, T2C는 태아 뇌 내의 동일한 사일런트 유전자자리(silent locus)에 대하여 일차 태아 간 세포내 활성인 β-글로빈 유전자자리와 같은 유전자의 발현 상태에 의존한 도메인내 상이한 상호작용 및 위상적 도메인을 검출하기 위한 유용한 도구이다. 또한, 상호작용의 고 수준의 분해능은 β-글로빈 유전자자리 LDB1 결합 부위 및 루프의 크기에 대해 나타난 바와 같은 신규한 관찰을 허용한다. 예를 들면, DNA 결실에 의해 유발된 β-탈라세미아내에서와 같은 이러한 유전자자리내 결실은 상호작용 시그날의 변화를 통해 즉각적으로 가시성이 될 수 있다.
논의
유전자 조절에 있어서 크로마틴 상호작용의 역할의 중요성이 잘 확립되어 있다. 그러나, 게놈의 상호작용 및 구획화(compartmentalization)에 대한 정보를 제공하기 위한 신속하고, 용이하며 가능한 기술의 요구가 증가하고 있다. T2C는 이러한 요구를 만족시킨다. 어떠한 제한 단편도 '시점(viewpoint)'을 제공할 수 있으며, 일종의 또는 긴, 또는 다른 염색체에 대한(본원에 나타내지 않음) 모든 이들의 상호작용이 확인될 수 있다. 따라서, 다중 3C-seq, 4C 또는 5C 실험은 수행할 필요가 없다. 더욱이, T2C를 사용하여, 게놈의 구획화를, 비용을 유의적으로 증가시키는, HiC에 대해 요구되는 큰 서열 노력을 요하지 않고도 목적한 영역 내에서 확인할 수 있다.
T2C의 설계로 인하여, 다른 기술과 비교하는 경우, 유전자자리의 보다 우수한 포함 및 분해를 수득한다. T2C의 분해는 사용된 제한 효소를 기준으로 한다. 일차 적혈구 세포 및 HB2 세포로부터 교차 결합된 크로마틴을 HindIII 또는 BglII로 분해하는 것은 각각 2.9Kb 및 6.1Kb의 평균 분해를 생성하였다. 이는 HiC로 수득된 일반적인 40Kbp 빈(bin)보다 유의적으로 보다 우수한 분해를 제공한다. 더욱이, 시퀀싱 목적을 위해 단편(하이브리드화 전 제2 절단 후) 상에 연결된 올리고뉴클레오타이드내 적절한 어드레스(address)를 가함으로써 어드레스 서열이, 이것이 기원하는 시료를 확인하므로 동일한 세트의 올리고뉴클레오타이드에 대해 상이한 시료를 다중화(multiplexing)시키는 것을 허용한다. 다중화(multiplexing)는 T2C의 비용을 추가로 절감시킨다.
또한, T2C를 lgf2 유전자자리에 대해 3C-seq 및 HiC와 비교하고 β-글로빈 유전자자리에 대해 이미 발표된 3C-qPCR 데이타와 비교하여, 동일한 위상적 도메인 및 상호작용 네트워크를 확인한다. 이들 모두는, 게놈의 구체적인 영역의 상호작용 및 구획화 모두를 확인하기 위한 도구로서 T2C의 강도를 나타낸다.
따라서, T2C는 힘든 과정 또는 거대한 시퀀싱 노력없이 게놈 및 크로마틴 상호작용의 국소적 공간 구조를 탐색하기 위한 구하기 쉬운, 비용 효과적인 도구이다.
실시예 1 및 2에 대한 물질 및 방법
크로마틴 분리 및 라이브러리 제조
마우스 태아 간 E12.5으로부터 마우스 일차 적혈구 세포, 마우스 태아 뇌 세포 및 인간 유방 내피 세포주(HB2)로부터 핵을 분리하여 교차 결합시켰다. 크로마틴을 6-커터(cutter)(마우스 세포의 경우 HindIII 및 HB2 세포의 경우 BglII)로 분해하고, 라이게이션하여 탈-교차 결합시켰다. 생성되는 라이브러리로부터 50㎍의 DNA를 흔한 4-커터(마우스 세포의 경우 DpnII 또는 NlaIII, HB2 세포의 경우 NlaIII)로 분해하였다. 모든 이들 단계를 앞서 기술된 3C-seq 프로토콜에 따라 수행하였다(참고: Stadhouders, R. 외 Nat Protoc 8, 509-524 (2013)).
유전자 주변(chr7: 109875617-111971734, mm9)의 ~2MB로 연장되는 HindIII 제한 부위에 가능한한 근접한 유일한 올리고뉴클레오타이드를 함유하는 β-글로빈 유전자자리에 대한 마이크로어레이를 설계하였다. Igf2 유전자자리의 경우, 유일한 올리고뉴클레오타이드를 ~2.1MB의 부위로 연장되는 BglII 제한 부위(ch11: 1091427- 3228670, hg19)에 근접하도록 설계하였다. 마이크로어레이 상의 하이브리드화에 의해 농축된 라이게이션 생성물은 제1 및 제2 디자인 각각에 대한 1억개 이상의 유일한 판독쌍을 생성하는 짝지어진 말단 시퀀싱에 의해 서열화하였다.
최종 라이브러리를 변형된 Illumina TruSeq DNA 프로토콜(www.illumina.com)에 따른 Illumina Cluster Station and HiSeq 2000 Sequencer 상에서 분석을 위해 제조한다. 요약하면, 20㎍의 분해된 라이브러리를 AMPure XP 비드(제조원: Beckman Coulter)을 사용하여 정제하고 말단-복구하였다. 이제, 평활-말단화된 단편은 ATP의 존재하에서 클레노우 엑소 효소(Klenow exo enzyme)를 사용하여 A-테일화하고 AMPure XP 비드를 사용하여 다시 정제하였다. 색인된 어댑터(Indexed adapter)(제조원: Illumina)를 AMPure XP 비드를 사용한 연속된 정제와 함께 A-테일화된 DNA 단편에 라이게이션하였다.
어레이 포획
생성되는 어댑터-변형된 DNA 라이브러리를 64시간 동안 42℃에서 통상적으로 제조된 NimbleGen Sequence Capture 2.1M 포획 어레이 상에서 NimbleGen 하이브리드화 시스템 상의 NimbleGen Sequence Capture array protocol (www.nimblegen.com/seqcapez)에 따라 하이브리드화하였다. 포획된 DNA 단편을 하이브리드화된 어레이로부터 용출시키고 MinElute 컬럼(제조원: Qiagen)을 사용하여 정제하였다. 포획된 DNA 단편을 PCR에 의해 푸션 폴리머라제(Phusion polymerase)를 사용하여 다음과 같이 증폭시켰다: 98℃에서 30초, (98℃에서 10초, 60℃에서 30초, 72℃에서 30초)의 24 주기, 72℃에서 5분의 최종 연장. PCR 생성물을 AMPure XP 비드를 사용하여 정제하고 30μl의 재현탁 완충액 속에서 용출시켰다. 1 마이크로리터를 Agilent Technologies 2100 생물분석기 상에서 DNA 1000 검정을 사용하여 로딩하여 라이브러리 농도를 측정하고 품질을 점검하였다.
클러스터(cluster) 생성 및 고속 대량 처리 시퀀싱
클러스터 생성은 Illumina 클러스터 시약 제조 프로토콜(www.illumina.com)에 따라 수행한다. 요약하면, 1μl의 10 nM TruSeq DNA 라이브러리 스톡을 NaOH로 변성시키고, 9-10 pM로 희석시키고 플로우셀(flowcell) 상에 하이브리드화한다. 하이브리드화된 단편을 연속적으로 증폭시키고, 선형화하고 Illumina 짝지어진 말단 시퀀싱 사용자 안내 프로토콜에 따라 말단-차단시켰다. 시퀀싱 프라이머의 하이브리드화 후, 합성에 의한 시퀀싱(sequencing-by-synthesis)을 101 주기 프로토콜을 지닌 HiSeq 2000 Sequencer를 사용하여 제조업자의 프로토콜에 따라 수행하였다. 시퀀싱된 단편을 NaOH로 HiSeq 2000을 사용하여 변성시키고 인덱스-프라이머(index-primer)를 단편에 하이브리드화하였다. 인덱스를 7-주기 프로토콜로 시퀀싱하였다. 상기 단편을 NaOH로 변성시키고, 연속적으로 증폭시키며, 선형화하고 말단-차단하였다. 시퀀싱 프라이머의 하이브리드화 후, 제3의 판독물의 합성에 의한 시퀀싱을 HiSeq 2000 Sequencer를 사용하여 101-주기 프로토콜로 수행하였다.
실시예 3 - 게놈의 3D 구조의 결정
게놈의 동적인 3차원 크로마틴 구조 및 이의 기능 - 유전 정보의 저장 및 발현에 대한 명백한 동시-점진적인 연결은-, ~130년의 집중된 연구 후에, 현 시대의 중심적인 쟁점 중의 하나이다. 이 실시예에서는, 마우스 및 인간 게놈의 상세한 3D 구조를 모든 물리적 게놈 상호작용(HRHTiCIC2), 규모 분석, 및 중합체 시뮬레이션의 신규한 우수한 선택적인 고속 대량 처리 고-분해능 염색체 상호작용 포획을 결합한 이미 가시적인 수단에 의해 약간의 염기쌍으로부터 메가 염기쌍 수준까지 직접 측정할 수 있으며: 명확하게 존재하고 차등적으로 압축된 크로마틴 섬유는 링커에 의해 연결된 ~500-1500 kbp의 정의된 루프 응집체/로제트(rosette(소-염색체 도메인)을 형성하는 ~30-150 kbp의 루프내로 폴딩(folding)된다. 복합체(나선) 루프 및 루프-루프 구조가 존재하며 상호작용은 상이한 세포형 또는 기능 상태 사이에서 단지 약간 그러나 유의적인 정도로 변한다. 이후에, 규모 분석 증명들은, DNA 서열과 게놈 구조 사이의 강력한 점진적인 교락(entanglement)을 나타낸다. 결론적으로, 이는 게놈의 구체적 구조적 "시퀀싱"에 대한 길을 최종적으로 열었고 따라서 "게놈 불특정성 원리(genomic uncertainty principle)"의 한계에서 실제 시스템 게놈학을 실현하고, 이들 모두가 진단 및 치료의 게놈 이해 및 R&D를 위한 기본적으로 중요하다.
게놈의 구조 및 기능이 불가분한 시스템으로서 명백하게 동시-진화하여 유전 정보의 물리적 저장 및 발현을 허용하였다는 사실에도 불구하고, 게놈의 동적인 3차원의 고차원 구조, 이의 공간 및 일시적인 변형, 또는 기능적인 다차원 상호작용 및 조절 네트워크에 대한 이의 관련성 중의 어느 것도, 17세기에 에이. 반 리우벤혹(A. van Leeuwenhoek)에 의한 세포 핵의 발견 및 다음의 많은 다른 보다 최근의 랜드마크적 결과: 메트상 염색체의 발견/설명(참고: C. W. Nagli(1842)/W. Hofmeister(1848), DNA(참고: Miescher (1869)), DNA 이중 나선(참고: R. E. Franklin, L. C. Pauling, J. D. Watson, and F. H. Crick, (1953)), 뉴클레오솜(nucleosome)(참고: R. Kornberg (1973)/A. Olins & D. Olins (1974)) 및 뉴클레오솜의 3D 구조(참고: K. Luger (1997))이래로 새천년의 전환시기에서 전체 인간 게놈의 시퀀싱까지 아직도 상세히 측정되지 않았다. 이후에, 이는 게놈 구조화 및 기능이 실제로 유전자 발현 및 따라서 개인과 이들의 질병 병력 사이의 고유의 차이에 관여하는 시스템 유전학(참고: Knoch, 2003) 뿐만 아니라 기능적인 환경적 게놈 변경의 수용기 및 따라서 궁극적으로는 외부 질병 원인이 명백해졌다.
게놈의 크기, 구조, 및 복잡성은 10- 9으로부터 10-5 m으로 및 10- 10 으로부터 105s으로 확장하였으므로, 거대한 실험적 챌린지를 야기하였다: 이미 뉴클레오솜이 어떻게 간격을 두고, 위치하고, 리모델링하는지, 및 생리적 염 농도에서 섬유로 폴딩된 뉴클레오솜 쇄가 지속된 논쟁의 문제인지 여부/어떻게 지속적 논쟁의 문제인지: 예를 들면, 문헌(참고: Finch and Klug (1976))은 정규의 솔레노이드, 생체내(in vivo) 중성자 스캐터링 실험이, 전혀 압축되지 않은 것, 또는 고도의 다형성 및 동적 기능 의존성 구조와는 대조적으로, 우세한 핵 특징으로서 30±5 nm의 섬유 직경이 뉴클레오솜 농도 분포, 거대 분자의 확산으로서 동적 및 기능적 특성, 및 DNA 서열의 규모분석은 예측할 수 없음을 나타내었다.
고-차원 크로마틴 구조는 1세기 이상 동안 심지어 보다 큰 논쟁의 문제가 되어 왔다: 광학 현미경 연구(참고: Rabl(1885) 및 Boveri(1909))는 조직계측 자가-유사 모델을 이끌었으며, 이는 영역 구조화(territorial organization)를 제안하였고, 전자 현미경 이전에 코밍스(Comings)(1968, 1978) 및 보겔(Vogel) 및 슈뢰더(Schroeder)(1974)의 모델에서와 같은 보다 무작위적인 간기 구조화(interphase organization)를 제안하였다. 폴슨(Paulson) 및 램믈리(Laemmli)(1980)의 방사-루프-스캐폴드 모델(radial-loop-scaffold model)에서 핵 매트릭스/스캐폴드(scaffold)에 부착된 크로마틴 루프는 중기(metaphase) 염색체의 농축 정도를 설명하여야 하였다. 문헌(참고: Pienta & Coffey (1977, 1984년 발표))에 따르면, 이들 루프는 간기에서 지속되었으며, 중기에서 스택된 로제트(stacked rosette)를 형성하였다. 문헌(참고: C. Cremer & T. Cremer (1974,1982))에 의한 미세-조사(micro-irradiation)는 이미 가졌고 문헌(참고: C. Cremer & T. Cremer (2001), P. Lichter (1988)) 및 이후 출판물에 의한 형광성 반응계내 하이브리드화(fluorescence in situ hybridization: FISH)는 중기(탈-)농축(~850 G, Q, R, 및 C 표의문자(ideogram) 밴드는 ~2500 소-염색체 도메인으로 나뉘어진다) 동안 이들의 구조적 지속성을 포함하여 간기(interphase) 동안에 염색체, 이들의 arm, 및 소-염색체 도메인의 영토적 구조화를 최종적으로 입증하였다. 반면, 크로마틴 로제트는 전자 현미경에 의해 시각화되었지만 서반구에서는 심각하게 받아들여지지 않았다. 문헌(Erenpreisa, 1989, Belmont & Bruce (1994))은 또한 전자 현미경을 기준으로 하여 소-영토내 폴딩(intra-sub-territorial folding)에 대한 나선형의 계층적 염색사 섬유(CF) 모델을 제안하였다. 거의 동일한 시기에, 작은 FISH 표지된 유전 영역들 사이의 공간적 거리 측정은 구조적 "파괴(demolition)"로 인하여 문헌(참고: Sachs (1995; Yokota, 1995; Yokota, 1997; Knoch, 1998; Knoch, 2002))에 의한 제1의 분석적 루프화된 중합체 설명을 갖는 무작위-워크/자이언트-루프(Random-Walk/Giant-Loop(RW/GL)) 모델을 이끌었으며, 여기서 1 내지 5Mbp 루프는 비-단백질 골격에 부착되어 있다. 이후에, FISH 기술, 고-해상도 현미경, 및 염색체의 거대한 평행 중합체 시뮬레이션을 보존하는 구조를 사용한 거리 측정의 조합은 로제트 다중-루프-소구획(rosette Multi-Loop-Subcompartment: MLS) 모델만을 생성할 수 있었으며, 여기서 60 내지 120 kbp 루프는 유사한 링커에 의해 연결된 로제트를 형성한다. 다시, 뉴클레오솜 농도 분포의 생체내 측정, 및 거대분자의 확산으로서 동적 및 기능적 특성은 크로마틴 폴딩과 같은 소 루프 응집물/로제트와 유일하게 호환되며 DNA 서열의 크기조정은, 기타의 경우 본원에서 발견된 이 패턴을 달리 설명할 수 없기 때문에, 이를 또한 예측한다.
이후에, 물리적 상호작용은 기능적 화학 반응 따라서 공정 쇄의 중심에 있기 때문에, 전사 인자에 대한 수개의 결합 부위를 함유하는 짧은 조절 요소는 거대한 게놈 분리를 통해 유전자 전사를 조절하므로, 수행된 구조 또는 변형 또는 이러한 구조, 예를 들면, 루프의 새로운 형성은 공간 근접성과 관련되기 때문에, 상호반응 가능성을 변화시키므로, 이들의(물리적) 상호작용 경향성에 있어서 생성되는 변화는 유전자 발현에 있어서의 변화에 관여한다. 이는 또한, 이들 구조의 형성시 전사 캐스케이드(cascade)의 인자들이 예를 들면, CTCF 또는 점착으로서의 이중 또는 다중 사용의 경우로서 또는 직접 중요한 역할을 하는 것으로 여겨지는 논리적 이유로 인하여 이미 명백하다. 결과적으로, 게놈 구조 및 기능적 조절 둘 다는 개인들과 이들의 질병 병력 사이의 고유의 차이에 관여할 뿐 아니라, 궁극적으로 기능적인 환경적 게놈 변경 따라서 궁극적으로 외부 질병 원인의 수용자인 전사 캐스케이드를 통해 유전적으로 시스템에 관여함이 명백해진다.
i) 국소적으로 보다 또는 덜 압축된 크로마틴 섬유의 여부, ii) 루프 응집체/로제트내 폴딩의 존재 여부(이는 모든 이들 실험, 및 약간의 내지 메가 염기쌍 수준에서 게놈 "live" 주기 형태와 관련하여 모든 기능적 요건과 일치한다), iii) 이들 구조의 일반적인 크기조정 행위가 존재하는지의 여부, iv) DNS 서열 자체의 광범위한 상관관계와의 일치 여부, 및 이것이 v) 신규의 생체내 측정과 일치하는지의 여부를 측정하기 위하여, 모든 물리적 게놈 상호작용(모든 것을 지닌 모든 것) 시도의 신규한 선택적인 고-분해 고-처리량 염색체 상호작용 포획 - HRHTiCIC2을 개발하였으며, 이는 또한 필수적으로(상기 방법 참고): i) ~107 개의 포획된/제조된 세포로 시작하고, ii) 세포를 포름알데하이드 고정(즉, DNA-DNA, RNA-RNA, DNA-RNA, 단백질-단백질, DNA-단백질, RNA-단백질 및 보다 복잡한 게놈성 교차결합이 형성된다), iii) 제1 제한 효소와의 핵 내 제한(restriction)을 허용하도록 투과성이 되며, iv) 교차 결합된 단편의 추출로 인한 거대 희석으로 이들 복합체 내에서 주로 재-연결을 허용한 후, v) 탈-교차 결합, 정제, 및 DNA 키메라 단편의 <500bp 크기로의 제2의 고-빈도 제한 효소 또는 초음파(최대 분해에 있어서)에 의한 최종적인 단축의, 진단 및 치료를 위한 게놈의 효율적이고 값싼 구조적 시퀀싱에 대한 길을 연다. 이후에, vi) 명확해진 영역 HRHTiCIC2 DNA 상호작용 단편 라이브러리를 유일한 및 하이브리드화 최적화된 올리고당 ~109-1010 분자를 사용하는 DNA 포획 어레이(비드 포획화가 또한 가능하다)를 사용하여 생성시키며(즉, 포획은 항상 선형 요법이며 포화와는 거리가 멀다), 이는 후속적으로 제1 제한 효소 다음에 직접 위치한다. vii) 고속 대량 시퀀싱 후에, 수득된 서열을 트리밍(trimming)하여 제1 제한 효소까지 서열 조각만을 함유하도록 한 다음, 우선 전체 참고 게놈에 대하여 맵핑하고 제1 제한효소와 제2 제한효소 사이의 영역만을 함유하는 차폐된 서열에 대해 또한 2개의 제한 효소를 사용하는 경우에, 최종적으로 단지 100%로 유일하게 맵핑된 서열을 사용한다.
이 신규의 선택적인 HRHTiCIC2 시도는 큰 장점을 갖는다: i) 이제 다른 상호작용 포획 기술과 비교하여 한정된 인자들은 단지 시퀀싱 능력/비용이며 제1 제한 효소, 포획된 영역의 크기, 상호작용 빈도 범위, 및 복잡한 실험의 수 사이의 선택된 관계: 예를 들면, 2Mbp 영역내, 1-106 상호작용 빈도 범위 및 10 내지 100배 복합법을 사용한 ~500 bp 단편 분해는 시퀀싱 10 내지 100개의 레인을 용이하게 달성할 수 있다(주목: 또한 수개의 영역은 하나의 포획 어레이에 존재할 수 있다). ii) 올리고 위치의 설계로 인하여, 최대 데이터 cleanness, 따라서 최소의 시퀀싱을 사용한 최대의 상호작용 정보가 달성된다. iii) 이후에, 전체 공정이 구조 보전을 위해 최적화되며(상기 방법 참고), 이는 고-분해능 FISH 동안에 또한 중요 지점이며, 여기서 이미 약간의 차이는 역사적으로 상이한 염색체 모델로 이끌어왔다. 이는 또한 정밀한/미묘한 실험실/벤치 취급에 의해 흔히 달성되는, 각각의 단계에서 왜곡 및 DNA 손실의 최소화를 포함한다. 주목할만하게도, 어떠한 공지된 서열 왜곡, (비용 소모적인 프라이머), 또는 PCR 단계도 본원의 시퀀싱까지 포함되지 않는다.
이후에, 50 내지 100 bp의 가능한 단편 길이(평균 ~50nm 또는 ~140 bp의 유리 DNA의 지속성 길이; 전형적인 단백질/뉴클레오솜 결합 영역 ~200-500 bp)를 사용하여 이 방법의 기본적인 한계에 도달하지 않을 뿐 아니라 보다 중요하게도 제시간으로 제공된 순간에서 각각의 세포내 유일한 개개의 확률론적 단편 셋팅/조건/주변과의 각각의 고-분해 상호작용의 개성에서 비롯되는 게놈의 불특정성 원리로서 본원에 도입된 것이며, 이는 측정에 의해 파괴되므로 - 불특정성 원리의 전통적인 정의는: i) 이미 세포 집단은 세포 상태의 분포 및 기능적 차이를 가지고, ii) 각각의 단편은 보다 더 또는 덜 동적인(따라서 안정하거나 가변성인) 개개의 DNA, RNA, 단백질, 제한 연합을 가지므로, 전체적인 교차 결합, 제한, 및 재-연결은 상이한 개개 효율을 가지며, 물론, iii) 올리고 하이브리드화 포획과 관련하여 DNA 서열, 시퀀싱, 및 맵핑이 또한 이에 가해진다. 따라서, 말기에 단지 확률적 분석 및 진술이 일반적으로 및 전통적인 광 이중-슬릿 실험(light double-slit experiment)으로부터 잘 공지된 양자 메소스코픽 시스템(quantum mesoscopic system)으로부터 공지된 바와 같이 도출된다. 현재, 적어도 영향받은 인자/매개변수의 실제 상태는 셀 수 없이 많고, 계산할 수 없으며(실질적으로 이들의 비-선형성으로 인하여), 모든 단일 단편에 대해 상이하며 게다가 측정에 의해 파괴되므로, 어떠한 합리적인 교정 수단은 존재하지 않는다. 이는 항상 어떠한 상호작용 포획화 종류에 대한 경우였으며, 효과가 낮은 분해능(그럼에도 불구하고 무의미하지만 이들의 효과에 있어서 유해하지 않은 교정을 허용함)에 의해 평균이 되었다고 해도, 이제 근본적인 한계에 도달한다. 이는 전례가 없는 통찰력을 지닌 이 근본적인 수준에서 이의 완전성 및 미에 있어서 모든 이들 효과보다 통합된 상호작용 정보를 감지하기 위한 기회를 연다.
필요한 분해능 및 생물학적 영향을 가진 크로마틴 섬유 형상 및 3D 구조를 시험하기 위하여, 인간 염색체 11p 15.5-15.4, 즉, IGF/H19 영역, 및 마우스 염색체 7qE3-F1, 즉, β-글로빈 영역을 선택하였는데, 이는 둘다 ~2.1Mbp 영역이 FISH 및 후생적 및 국소적 대조군 영역 조절의 3C 실시예에 의해 잘 연구되어 있기 때문이다. 제1 제한 효소로서 Bgl II 및 Hind III, 및 제2 제한 효소로서 NlaIII를 사용함으로써, 각각 평균 6121 및 2915bp를 지닌 ~200-500 bp까지 작아진 많은 단편을 생성시킨다. 심지어 보다 높은 분해를 연구하기 위하여, 크로마틴 섬유 형상을 이후에 일반적으로 고 분해능에서 분석하고 본 발명자들은 ~50 내지 500bp를 갖고 평균 단편 크기가 549bp인 10개의 상이한 마우스 염색체 상에 총 99.5 Mbp의 대략(및 낮은 시퀀싱 포함) 15개 영역을 시험하였다. 따라서, 본 발명자들은 분자 및 뉴클레오솜(평균 뉴클레오솜 반복체 길이는 ~200 bp이므로, 3-6 kbp는 평균 ~15-30의 뉴클레오솜에 상응함) 및 심지어 소뉴클레오솜 분해능 따라서 즉, 유전 불특정성 원리의 수준을 달성하였다. 종, 세포주, 및 기능적/구조적 차이들 사이의 차이를 시험하기 위하여, 인간 HB2 세포주 및 점착 절단가능한 TEV/HRV RAD21-eGFP 세포주 시스템(절단되지 않은 및 절단된 점착, Zuin 외 2013 PNAS, 프레스 상태), 및 마우스 태아 뇌(β-글로빈 불활성) 및 태아 간(β-글로빈 활성) 세포를 사용하였다. 크로마틴 섬유 형성을 시험하기 위하여 또한 태아 간 세포를 사용하였다. 시퀀싱과 관련하여 ~107개의 투입 세포를 사용하여, 상응하는 물질(예를 들면, 2개의 상이한 상태)를 포획 어레이에서 복합화하여 동일한 조건을 보증하였다. 1 또는 2개의 레인을 동일한 시퀀싱 실시 또는 상이한 시퀀싱 실시로 시퀀싱하였다. 다양한 효과로 인하여 충분한 미스매치 비율(참조 게놈에 대해 및 내에서 시퀀싱 차이/오차에 대해 계산하기 위함)을 가진 전체 게놈에서 서열만이 유일하며 제1 제한 부위와 제2 제한 부위 사이에서 유일하게 맵핑하는 서열에 대해 정화하였다.
따라서, 대수의 및 무지개색 빈도 범위를 갖는 직사각형의 상호작용 매트릭스(2개의 거울이 있는 삼각형의 1/2)내 영역의 상호작용의 s 분류(sSorting) 및 플롯팅이 실험 자체의 유효성 및 일반적으로 6차수 크기 및 대각선을 제외한 4-5 분포를 차지하는 전례없는 빈도 범위를 직접 나타낸다. 따라서, 빈도가 10-4 내지 10-5인 드믄 상호작용은 이 영역 크기의 셋팅, 단편 분해, 및 시퀀싱 노력에서 시각화될 수 있다. 이는 이 관련성을 변화시키는 2-4 차수까지 용이하게 증가될 수 있다. 이후에, ~107 백만개의 투입 세포와 관련하여 단편당 평균 축적된 입력의 관계는 ~0.1-1.0% 효능의 HRHTiCIC2를 나타낸다. 이후에, 패턴은, 수준이 도달함을 명확하게 나타내며, 여기서 통계적 한계내 불확정성 원리는 안정한 확률론적 수준에 도달하였는데, 이는, 동일한 실험에 대한 상이한 시퀀싱 레인으로부터의 영상이 다중화 여부와 상관없이 단지 약간의 통계적 편차를 나타내기 때문이다.
T2C로부터 시각적 수단에 의한 3D 구조의 측정
많은 수의 서열 판독물에도 불구하고 및 비- 또는 자가 라이게이션된 단편의 항목을 나타내는 대부분의 대각선인 요소에도 불구하고, 상이한 실험의 모든 상호작용 매트릭스는 재현가능하게 보다 또는 덜 빈(empty) 재생성인데, 즉 우세하고 균일한 노이즈 또는 배경이 없으며, 따라서 포획되는 올리고가 존재하고 작업되었음을 입증한다. "emptiness"는 또한 명확하게 및 임의적이지 않게 구조화되며 매우 높은 정도의 세부사항에 대해 복제물에서 동일한 것으로 여겨지는데, 즉, 통계적으로 갑자기 나타나는 상호작용이 없거나 보다 우세한 상호작용에 근접한 어딘가에 통계적으로 군집되지 않는다. 따라서, 확실히 >104개의 세포로부터의 정보가 과정에서 잔존한다는 것을 고려할 때, 노이즈는 원칙적으로 공정의 어떠한 단계에서도 나타날 수 있으며, 심지어 예를 들면, 상호작용을 향한 정상의 분포된 노이즈 시그날의 유사하지 않은 고도로 편향된 왜곡을 추정하는 경우, 시그날 대 노이즈 비는 >105-106이어야 한다.
이미 가시적으로 훨씬 더 놀랍게도, 상호작용 자체는 모든 규모의 게놈 분리에서 명확하게 명백한 패턴의 외관 및, 패턴들이 다른 규모에서 지속적으로 존재하거나 재출현하지 않는 사실(게놈이 규모 브릿징 시스템이므로 이들은 하여야 한다)과 관련하여 심지어 보다 더 놀라운 것이며, 이러한 패턴이 발생하는 기회는 생각치못하게 작기 때문에, 다수의 및 비선형 매개변수가 관련됨에도 불구하고 전체 T2C 과정이 실제로 작동함을 즉시 나타낸다. 공지된 시점에 대한 첫번째 비교는, T2C를 사용하는 경우 상호작용의 PCR 확장이 나타나지 않으므로 비록 동일한 단편 분포에 대해 훨씬 더 선명하고 급격한 상호작용을 사용한다고 해도, T2C와, 예를 들면 3Cseq와의 일치를 나타낸다. 결과적으로, 상세한 상호작용 패턴은 이제 훨씬 더 용이하게 해석될 수 있다.
육안 검사에 의한 크로마틴 섬유의 형상의 측정:
가장 작은 게놈 규모에서, 보다 큰 게놈 분리와 비교하여, < 5-10 kbp(즉, < 25-50 뉴클레오솜)에 대해 대각선과 평행인 밴드 내에 보다 농밀한 상호작용 패턴이 명확하게 존재한다. 이 패턴은 국소 단편 분해와는 상관없이 변하며(그럼에도 불구하고 고려될 필요는 있음) 균질한, 예를 들면, 증가된 게놈 분리에 대해 감소하는 가우시안 유사 상호작용 "스미어(smear)"와는 대조적으로, 이들 사이에 비상호작용 "갭"과의 명백한 상호작용으로 이루어진다. 따라서, 결과적으로 육안 검사를 이 규모 - DNA/뉴클레오솜의 규모에서 - 안정하고 규정된 상호작용이 존재하므로 이들 상호작용은 공간적 근접성의 결과이기 때문에, 뉴클레오솜의 압축이 불규칙으로 존재하지만 그럼에도 구조적으로 규정된 구조로 존재함을, 즉 섬유의 개념이 적용됨을 나타내며, 이는, 일반적인 용어로서 이의 변화에 기인하여 평균 밀도 등을 가진 "준-섬유(quasi-fiber)"로 부를 수 있었다. 명백하게, 나선 크로마틴 섬유 모델에 의해 제안된 바와 같은 구조적으로 어딘가 정확하게 동일하고 균일한 섬유가 균질한 밴드-유사 소패턴과는 대조적으로 생성될 수 있으며, 뉴클레오솜의 일정하게 역동적인 무작위 워크(walk)는 또한 게놈 분리의 기능으로서 레이글리(Reighley) 분포된 상호작용을 지닌 균질한 상호작용 패턴을 생성할 수 있다. 따라서, 육안 검사에 의해 크로마틴 "준-섬유"의 존재, 이의 국소적 상호작용 및 따라서 전체 T2C 과정 경계에 걸쳐 자연적으로 평균된 조밀성 구조를 판독할 수 있다.
육안 검사에 의한 소염색체 구조 도메인(domain)의 측정:
가장 큰 규모에서 수백개 내지 ~1-1.5Mbp 범위의, 날카로운 경계를 가지고 다른 도메인과 상호작용하는 사각형과 유사한 도메인의 외형이 또한 수개의 놀랄만한 일반적인 특성과 함께 즉시 가시성(비록 마우스의 경우와 비교하여 인간에서 보다 우세하지만)이다: 첫째로, 이들의 소구조를 무시하는 순간 도메인 내 상호작용 빈도는 일반적으로 평균의 균일한 높이를 가지고 소도메인 사이의 상호작용을 정의하는 다른 균일한 높이에 대한 가장자리로 떨어진다. 따라서, 일반적인 연속된 상호작용 감소와 커지는 게놈 분리 및 다른 도메인과의 명확하고 규정된 상호작용에 대한 흔한 사고와는 대조적으로 계단형 경우와 유사한 상호작용 거동이 존재한다. 둘째로, 도메인의 경계에서, 대각선 근처에서 또한 크로마틴 준-섬유가 작동하고 링커가 구조적 측면에서 매우 탄력적이므로 도메인 사이의 상호작용이 필수적으로 강하고 복잡하다고 해도 도메인 사이에 명확한 이전 또는 링커 영역이 존재한다. 결과적으로, 이들 결과는 구조적으로 안정한 소-염색체 단위의 존재를 다시 입증하며, 이는 비교적 안정하며 역사적 개관에 기술된 바와 같이 이들의 경계부에서 서로 특히 잘 상호작용한다. 이후에, 하나의 큰 루프, 무작위 워크 또는 프랙탈 구상체 유사 폴딩 모두는 급격한 가장자리 및 본원에 발견된 정의된 거동을 생성하지 않을 수 있으므로, 이 수준에서 이미, 도메인내 평균적으로 균일한 상호작용 및 가장자리에서의 급격한 강하는 이미 루프-응집체에 대하여 및 심지어 링커에 의해 연결된 도메인의 로제트 유사 구조를 나타낸다.
육안 검사에 의한 크로마틴 고 차수 구조, 즉, 염색체의 루프/응집체/로제트 폴딩의 형상의 측정
중간 규모에서, 따라서 소-염색체 도메인 수준에서, 상호작용 패턴은 상호작용 간의 명확하게 뚜렷한 갭에 의해 다시 특징화되며, 이는 교차 선형 또는 그리드-유사 패턴으로 정렬되어 있다. 흥미롭게도, 선형 패턴은 소-염색체 도메인의 외부에 연속하여 존재하며, 여기서 후속적인 소-염색체 도메인으로부터 기원하는 선형 패턴과 "교차"한다. 이후에, 여기서 관찰된 일반적인 보다 낮은 일반적인 상호작용 빈도 수준 및 덜 복잡한 상호작용 패턴은 도메인내로 다시 선형 패턴을 수반하도록 하며, 이는, 매우 더 단순한/명확한 패터 외부(patter outside)가 또한 명백하게 도메인내에 존재하지만, 추가의 상호작용에 의해 농축되어 있고 보다 복잡해졌음을 나타낸다. 이제, 대각선에 대해 역으로 이러한 선을 따라서 이를 다음의 관련 상호작용에 대해 수직으로 수반하는 출발 시점으로 고려할 수 있다(이는 외부로부터 도메인 내로 수평으로 다시 따라갈 수 있다). 이후에, 대각선에서 상호작용 점에 다시 수평으로 국재화한다. 이를 반복하는 것은 대각선에서 제2의 상호작용 점을 제공하며 이제 대부분의 경우에 이러한 제2의 상호작용은 또한 제1 및 따라서 출발점과 상호작용함을 입증할 수 있다. 따라서, 상호작용의 격자(grid)는 수동으로 구성할 수 있다. 이는 상호작용을 수직으로 및 수평으로 투사함으로써 향상될 수 있으며, 염색체 서열을 따라 피크-유사 패턴을 생성하며, 이러한 피크는 교차된 선형 패턴과 일치한다. 이는 마우스의 경우와 비교하여 인간에서 보다 우세하다. 수십개의 킬로 염기쌍에 대한 규모에 있어서 상호작용은 특히 크로마틴 루핑(chromatin looping)으로써 단지 고려될 수 있으며, 이는, 루프 염기들이 상호작용에 의해 시각화되는 수개의 연속 루프가 일치하는 루프 염기를 가짐을, 즉, 루프가 코어와 응집함으로써, 또한 루프의 로제트가 보다 또는 덜 명확한 코어와 응집함을 의미한다. 상호작용과 격자-유사 패턴 사이의 갭은 또한, 다른 폴딩 유사 무작위-워크 자이언트 루프(random-walk giant loop), 염색사 유사, 또는 프랙탈 소구 패턴이 명확한 도메인 경계의 부재하에, 및 명확하게는 명백한 도메인 경계가 아닌, 균질한 상호작용 패턴을 생성할 수 있으므로, 이들은 이의 기원일 수 없다. 이는 또한 준-크로마틴 섬유로의 비-압축용 경우일 수 있으며, 이는 뉴클레오솜 구조의 바다(sea-of nucleosome organization)가 거대하고 매우 동적인 상호작용 가능성을 생성하는 것을 예측할 수 있다. 주목할만하게도, 상이한 규모에서의 데이타 구조는, 모든 규모에서 상호작용이 실제로 교차-연결되어 상이한 잠재적인 교차-연결가능한 제제에 의존할 수 있다는 가정이 옳고, 따라서 특이적인 DNA 위치 또는 단백질 등의 사이의 교차연결이 이러한 패턴을 생성한다는 추측이 거의 가능성이 없음을 또한 입증한다. 또한, 단순한 패턴은, 크로마틴의 압축 밀도에 있어서의 변화 및 루프내에 추가의 상호작용이 다양한 형태를 대신한다는 사실로 인하여 보다 복잡하다: 대규모에서 단순한 루프 또는 심지어 초-나선 유사 패턴은 그렇게 여겨지는 반면, 소규모에서 주요 루프 염기 상호작용 주변의 패턴은 로제트 코어의 구조 및 국소 크로마틴 압축 및 이들 둘 다의 확장을 나타낸다. 비록 최대 분해능에서의 실험이 일반적으로 크로마틴 섬유 형상을 보다 상세히 시험하기 위해 이루어져서 정밀한 시퀀싱은 거의 포함하지 않았지만, 이들 데이타의 전체적인 평가는, 실제로 특수한 상호작용 패턴을 초래하는 내부 및 외부 루프를 지닌 상세한 코어 구조 및 루프 응집물/로제트에 기여할 수 잇는 수개의 이러한 구조의 발견을 생성하였다. 따라서, 도메인과 이들의 패턴 사이의 상호작용은 2개의 기원에 기여할 수 있다: 한편, 후속적인 도메인의 루프 응집물/로제트 코어는 상대적으로 낮은 수의 루프에 기인할 수 있으므로 밀도 및 루프 역학은 매우 용이하게 상호작용한다. 다른 한편, 세포 집단에서 유사분열 염색체가 존재하며, 여기서 농축도는 본질적으로 매우 높다. 따라서, 이 패턴은 세포 주기 전체에서 구조화 및 이의 역학 둘다를 지속적으로 설명하며, 다시 이는, 달리 응집체/로제트 코어 사이의 코어 상호작용이 중합체 섬유 배출에 의해 차폐될 수 있기 때문에 압축된 크로마틴 섬유로 유일하게 가능하다.
상이한 세포 타입의 기능, 또는 세포, 또는 질병 상태의 치료로서 육안 검사에 의한 3D 구조의 측정
일반적으로 조절 또는 의도적인 시스템 왜곡으로 인한 종, 세포형, 영역적, 기능적 또는 구조적 차이로서의 구조 변화를 시험하기 위하여, 인간 IGF/H19 11p 15.5-15.4 영역과 마우스 β-글로빈 7qE3-F1을 인간HB2 및 TEV/HEV 세포, 및 마우스 태아 뇌(FB) 및 간(FL) 세포에서 시험하였다: 일반적인 일반 도메인은 HB2, TEV, HEV, 및 FB 및 FL 세포, 및 따라서 동일한 종의 상이한 세포형에서 명확히 동일하지만, 적어도 선택된 영역으로 인하여 인간과 마우스 사이에서 상이하다. 보다 세부적으로 미세한 정도로 인간HB2 세포는 TEV/HEV 시스템과 비교하여 도메인내에 보다 및 더 조밀한 상호작용 패턴을 나타내는 것으로 여겨진다. FB를 FL 세포와 비교하는 것은 이러한 명백한 차이: 추가의 루프가 앞서의 실험으로부터 예측된 바와 같이 형성되는 β-글로빈 유전자자리에 대해 입증될 수 있는 바와 같이 상호작용의 단일 또는 소 그룹에 흔히 속하는 매우 치밀한 차이를 나타내지 않는다. 그럼에도 불구하고, 본원에서 용어 작은(small)은, 이러한 단일 루프 형성이 실제로 β-글로빈 전사, 즉 전체 경로를 실제로 활성화시킴으로써 세포의 전체 특성이 변화될 수 있으므로 상대적이다. 이후에, 그러나, TEV/HEV 시스템에서 점착부(게놈 구조에서 주요 구성적 역할을 하는 것으로 일컬어짐)의 절단은 현저한 변화가 아니라 단지 보다 약간 및 보다 균일하게 확산된 상호작용을 실제로 잘 초래하며, 이는 약간 더 큰 굴곡성/동적 구조이지만 게놈 광범위한 분석에서와 같이 앞서 고려한 것 만큼 크지 않음을 제안한다. 따라서, 점착은 단일이 아니고 분명하게는 주요/단일 성분 관여제일 수 없지만, 대신 명백하게는 게놈 구조에 영향을 미치는/형성하는 명백한 수개의 성분들 중 하나이며 게놈 구조의 굴곡성과 안전성 사이의 점전적인 균형을 나타낸다. 결과적으로, 이들 변화는 상이한 조건 하에서 T2C 및 이의 분석의 재생가능한 품질 및 명확한 일반 게놈 구조가 존재함을 나타낼 뿐 아니라, 본질적으로 국소적으로 상세하게 게놈 불특정성 원리의 도달된 수준이 시스템을 미세-조절하는 것으로 고려되는 큰 테마의 변형임을 나타낸다. 따라서, 명백하게 단지 ~2 Mbp 크기의 게놈 영역에서 다량의 상호작용 데이타가 존재하여 조심스럽게 상세히 분석되어야 한다.
T2C와 비교하여 몬테 - 카를로 (Monte-Carlo) 및 브라우니안 -역학( Brownian -Dynamics) 시뮬레이션 에 의한 보다 고차원 구조의 3D 크로마틴의 측정
예정된 조건을 사용하여 독립적으로 및 보다 명확한 방식으로 모든 규모에서 이 거동을 실험하고 이해하기 위하여, 최근에 중합체 모델을 개발하여 3차원 게놈 조직화에 대한 일반적인 실험 결과, 설계 및 가설을 평가(조정하지 않음)하였다. 여기에 분해는 신장가능하고, 구부릴수 있는 중합체 분절, 및 ~1 내지 2.5kbp와 비교가능한 분해를 지닌 용적 배제를 기준으로 하며 거대 루프(0.5 내지 5.0Mbp)가 굴곡성 골격을 닮은 링커에 의해 연결된 랜덤-워크/자이언트-루프 모델(Random-Walk/Giant-Loop model)을 특징으로 하며, 다양한 크기(60 내지 250kbp)의 링커로 연결된 보다 작은 루프(60-250 kbp)를 지닌 로제트-유사 응집체(0.5 내지 2Mbp)를 지닌 다중-루프 소구획(Multi-Loop Subcompartment (MLS)) 모델을 특징으로 한다. 이러한 시뮬레이션은 향상되었으며 최초로 2차원 공간 거리 및 상호작용 맵(상이한 교차 결합 확률 및 정도에 대해)이 매우 높은 통계적 유효성으로 계산되었다. 육안 비교는, 즉시 모든 상기 기술된 효과 해석이 시뮬레이션과 일치하며 이후 상기 상호작용은 본원에서 모델화된 뉴클레오솜이 없음을 고려하는 심지어 약간 상세한 모든 모델 매개변수의 함수이다: i) 일반적으로 상호작용 정도는 상호작용 및 교차 결합 가능성에 의존하고, ii) 도메인 크기, 도메인 분리, 및 루프의 공간은 이들의 크기에 비례하며, iii) 도메인들 간의 상호작용은 링커 크기, 루프의 크기 및 수, 즉, 로제트의 밀도에 의존한다. 따라서, 루프 크기, 루프 수, 크로마틴 섬유 지속성 및 따라서 생성되는 배제 효과로 인한 로제트의 밀도의 미묘한 조합은 궁극적으로 분산시키기 위한 많은 수 및 로제트의 차폐효과, 및 또한 전체 도메인 사이의 상호작용 패턴에 있어서 미묘한 영향을 초래한다. 도메인 사이의 링커 및 도메인간 상호작용에 대한 이의 비례원칙은 명확하게 가시적일 뿐 아니라 본 발명자들이 본원에 응집체/로제트 경계에서 루프의 상호작용 및 유사한 효과의 이해를 생성하기 위해 미묘하게 나타낸 비 평형 효과이다. 또한 일반적으로 상호작용 매트릭스 및 전용의 크로마틴 섬유의 존재에 대한 링크의 큰 공동화는 명백하며 또한 교차 결합 확률, 반경, 및 빈도가, 비록 이러한 관련성이 분명하게 조정가능하지 않게 너무 복합한 매개변수 세트를 함유하기 때문에 비교적 낮은 것으로 추정될 수 있음을 입증한다. 비록 실험이 가장 높은 분해능을 보이더라도, 실제로 압축의 변수로 인하여 보다 복잡할 수 있기 때문에, 이 모델은 또한 다양한 이러한 구조가 존재하지만 앞으로 훨씬 더 상세하게 시험되어야 하는 로제트의 루프 염기에서 특수한 거동을 명확히 나타낸다.
상호작용간의 유전 거리의 함수로서 및 몬테-카를로 및 브라우니언-역학 시뮬레이션의 크기조정 거동 및 DNA 자체내에서 긴-범위의 상관관계의 크기조정과 비교하여 상호작용의 빈도의 크기조정 거동으로부터 T2C의 크기조정의 거동의 측정에 의한 3D 크로마틴의 고 차수 구조의 측정:
메가 염기쌍 및 소도메인 수준을 통해 수개의 염기쌍의 규모로부터 전체 염색체 규모 및 따라서 핵(10-9 내지 10-5m 연장 규모)까지의 거동을 통합된 규모-브릿지 방식으로 시험하기 위하여, 본 발명자들은 크기조정 분석(scaling analysis)을 도입하여 이의 능력: i) 일반적인 상호작용 감소, 즉 공간 거리 증가, ii) 소-염색체 도메인 유사 구조, iii) 소도메인내 응집된 루프/로제트 유사 구조에 기여할 수 있는 미세 구조를 지닌 다중-크기조정 거동을 사용하여, 명확하게 긴 범위의 크기조정을 나타냄으로써 제공된 상이한 시뮬레이션된 모델의 게놈 분리의 기능으로서 상호작용 빈도의 크기 조정을 나타내었다. 모든 매개변수 변화는 본원의 규모로 변화된 크기조정 거동에서 재-발견될 수 있다. 이는 다른 크기조정의 측정과 일치한다. 따라서, 예를 들면, 자가-유사 프랙탈 브릿징 및 모든 규모에서 동일하게 관찰된 것으로서 균일한 크기 조정은 존재하지 않지만, 이의 편차는 도메인 및 루프내 소구조를 나타낸다.
상이한 영역의 크기조정 거동은 염색체의 소세트의 크기조정 거동과 비교되므로 일반적인 크기조정 거동으로부터의 국소 구조 편차에 의해 우세해지며 또한 본원에서 사용된 상호작용의 양에 의해 절충된다. 그럼에도 불구하고, 크기조정 거동은 i) 미세 구조를 사용한 긴-범위의 다중-크기조정 거동, ii) 다양한 종, 세포형, 기능/왜곡 차이에 대해 미묘하지만 일반적으로 차이가 없음을 나타낸다.
전체 게놈에서 상이한 발표된 실험의 이들의 게놈 분리의 기능으로서 상호작용 빈도의 크기조정 거동은 또한 i) 미세-구조를 사용한 긴-범위의 다중-크기조정 거동, ii) 다양한 종, 세포형, 기능/왜곡 차이에 대해 미묘하지만 일반적으로 차이가 없음을 나타낸다. 그러나, 실험 및 모델화된 크기조정 거동 둘 다는, 다양한 크기(60-250 kbp)의 링커에 의해 연결된 보다 작은 루프(60-250 kbp)를 지닌 루프 응집물(0.5-2Mbp)을 지닌 루프 응집된/로제트 유사 게놈 구조와만 일치한다.
물리적 공간 근처에 있는 것은 또한 DNA 서열 공간 근처에도 존재하여야 하고, 모든 종류의 돌연변이는 게놈 구조 자체에 의해 편향될 것이므로, 본 발명자들은 가능한 가장 단순한 상관관계 분석에 의해 DNA 서열의 상관관계 거동, 즉, 2개의 상이한 인간 및 마우스 전체 시퀀싱된 균주에 대한 상이한 크기의 윈도우내에서 염기쌍 조성물의 평균 제곱근 편차를 시험하였다: 긴-범위 멱승법 상관관계(long-range power-law correlation)는 거의 전체 관찰가능한 규모에서 상관관계 분석을 사용하여 발견되었고, ii) 국소 상관관계 계수를 사용하여 소수의 염기쌍의 규모, 40 내지 3400 bp의 제1의 최대, 및 105 내지 3x105 bp의 제2의 최대 규모에서 무작위적 상관관계에 근접한 종 특이적인 다중-크기조정 거동을 나타내며, iii) 추가의 미세-구조는 제1 및 제2의 최대로 존재한다. 일반적인 및 상세한 거동은 마우스의 경우와 비교하여 인간에서 더 강력하지만, 상이한 염색체 내에서 거의 동일하고 특정의 염색체에 대해서만 어느 정도 보다 큰 정도로 편차가 존재한다. 모든 규모에서 거동은 게놈 구조의 긴-범위 다중-크기조정에 대해 세부적으로 동일할 뿐 아니라, 옳은 규모에서도 동일하다. 따라서, 발견된 제2의 최대치는 소-염색체 도메인의 크기 및 위치에 상응한다. 특히, 미세 구조 수준에서, 제1의 일반적인 최대치에서 뉴클레오솜 결합에 대해 앞서 이미 입증된 연합은 이제 제2의 최대치까지 또한 연장되며 앞서 예측한 바와 같이 여기서 루프 구조와 연합한다.
이후로, 최대 분해능에서의 상호작용 크기조정은, 상이한 염색체를 따라서 동일한 최대에서 DNA 서열의 크기조정 거동과 동일한 거동을 나타낸다: 비록 미세-구조가 실험적 분해로 인하여 발견될 수 없다고 해도, ~4 kbp를 초과하는 규모면에서 광범위한 피크 및 보다 강력한 상호작용 감소를 지닌 일반적인 거동은 상호작용 실험 및 DNA 서열 둘 다에 있어서, 압축된 크로마틴 섬유가 실제로 존재함을 제안한다.
T2C의 상세한 설명으로 실시예 3의 방법
HB2 세포주 및 세포 배양
HB2 세포(1-7HB2, 인간 포유동물 관강 상피 세포주 MTSV1-7의 클론 유도체)를 0.2mM L-글루타민, 100 units/ml의 페니실린, 100 mg/ml의 스트렙토마이신, 10% FCS, 5㎍/ml의 하이드록시코르티손, 및 10㎍/ml의 인간 인슐린이 보충된 DMEM 속에서 배양하였다. 앞서의 3C 연구에서 본 발명자들은 수개 영역의 핵형 및 DNA 메틸화를 확인하였다.
TEV/HRV 세포주 시스템 및 세포 배양
절단가능한 TEV/HRV RAD21-eGFP 세포주 시스템은 HEK293T 세포주 시스템이며, 이는 절단가능한 RAD21-eGFP 융합 단백질 및 내인성 RAD21 녹-다운(knock-down)에 대한 siRNA를 암호화하는 pRTS-1 벡터로 형질감염시켰다. 둘 다는 중간의 및 따라서 동시에 양방향 프로모터의 독시사이클린 유도된 활성화에 의해 발현된다. RAD2-eGFP 융합-단백질의 경우, 절단가능한 RAD21(여기서, 제1의 RAD21-세파라제 절단 부위는 인간 리노바이러스의 3C 프로테아제(HRV 프로테아제)의 절단 부위로 PCR-계 돌연변이유발(제2의 절단 부위는 변하지 않고 남아서 세포 세포독성이 거의 없도록 보증한다)을 사용하여 대체시킨다)을 eGFP 앞에 삽입시켰다. 담배 에치 바이러스(tobacco etch virus) 프로테아제(TEV 프로테아제)는 HRV 절단 부위를 인식하지 않으므로 대조군으로서 작용할 수 있다. 내인성 RAD21 녹-다운 서열은 다음의 3'UTR-지시된 siRNA를 사용한 녹-다운을 허용한다:
5'-ACUCAGACUUCAGUGUAUA-3' (Scc1-1),
5'-AGGACAGACUGAUGGGAAA-3' (Scc1-2).
TEV/HRV RAD21-eGFP 세포주 시스템의 생성을 위하여 원래의 HEK293T 세포주를 0.2mM L-글루타민, 100 units/ml 페니실린, 100 mg/ml 스트렙토마이신, 10% FCS가 보충된 DMEM 속에서 배양시키고, 37℃ 및 5% CO2에서 성장시켰다. 형질감염을 위해, 제조업자의 지시에 따라서 리포펙타민 2000(제조원: Invitrogen)을 사용하였다. 벡터를 지닌 세포를 150㎍/mL 하이그로마이신 함유 배지 속에서 성장시켜 선택하였다. 단일 클론을 집어올려 RAD21cv 및 RAD21wt 작제물의 발현 및 내인성 RAD21 고갈에 대해 2㎍/ml 독시사이클린을 사용한 유도 3일 후에 분석하였다. 수득되는 TEV/HRV RAD21-eGFP 세포주는, 0.2mM L-글루타민이 보충된 DMEM 속에서 37℃ 및 5% CO2 하에서 잘 배양되었다.
실험을 위해 및 HRV(또는 대조군으로서 제공됨으로써, 형질감염이 일어나지만, 절단되지 않는 TEV)를 사용하여 삽입유전자 발현을 활성화시키기 위해, 세포를 2㎍/ml의 독시사이클린의 존재하에서 3일 동안 배양하였다. 이후에, 세포를 분할하여 50% confluency까지 재종균배양하고 다시 제조업자의 지시사항에 따라 리포펙타민 2000(제조원: Invitrogen)을 사용하여 HRV 또는 TEV 벡터로 형질감염시켰다. 프로테아제 형질감염 후 24시간 째에 세포를 실험에 사용하였다.
마우스로부터의 세포 제조
마우스 태아 간 및 태아 뇌 세포를 위해, 1 내지 2마리의 형질전환 FVB/N 마우스로부터 임신 12.5일째에 ~10개의 배아를 시퀀싱될 말단에서 충분한 세포 집단 및 충분한 DNA인 복합체를 갖기 위해 실험에 의해 요구되는 ~1천만 개의 세포에 대해 사용하였다. 마우스를 70% EtOH로 세척하고 복부를 개복하여 이들을 느슨하게 자르기 전 및 난황난 및 태반으로부터 이들을 제거하기 전에 배아를 함유하는 자궁경관을 제거하였다. 작고 발육하지 않은 배아를 버렸다. 배아를 0.5 ml의 10% FCS/PBS가 들어있는 빙상이 페트리 디쉬 속에 수집한다. 이후에, 태아 간 및 뇌를 배아로부터 절개하여 500 μl의 10% FCS/PBS를 함유하는 빙상의 튜브(1 ml) 속에 수집하였다. 이후에, 세포를 P1000/1ml 플라스틱 피펫 팁으로 재현탁시키고 결합조직을 25 μl의 2.5% 콜라게나제 스톡(0.125% 말기 농도)를 가하여 분해하고 ~45분 동안 37℃에서 항온처리하였다. 이후에, 세포 현탁액을 12ml의 10% FCS/PBS가 들어있는 팔콘 튜브로 실온에서 이전시킨 후 다시 P1000/1ml 플라스틱 피펫 팁을 사용하여 6-웰 플레이트 내부에 위치된 스크래퍼 메쉬(scraper mesh)를 통해 약하게 짜내었다. 메쉬를 2ml의 10% FCS/PBS로 실온에서 세척하여 메쉬로부터 세포 모두를 획득하였다. 수득된 단일 세포 현탁액을 12 ml의 10%FCS/PBS의 말기 용적이 들어있는 팔콘 튜브에 실온에서 다시 수집하였다. 주목할만하게, 본 발명자들은 세포의 스트레스를 최소로 유지시켜 세포 핵에 대한 어떠한 손상도 피하도록 하였다. 태아 간 및 뇌 물질/세포의 재현탁, 콜라게나제 처리, 및/또는 스크랩핑 둘 다의 후에 유리 슬라이드에 스폿팅하여 DAPI를 사용한 핵의 염색하에 또는 염색없이(또는 궁극적으로 어떠한 다른 면역형광성 또는 형광성 반응계내 하이브리드화), 현미경에 의한 세포 및 특히 핵 완전성에 대해 확인하였다.
세포의 HRHT iCIC 2 교차 결합/고정
게놈 및 전체 세포의 교차 결합/고정을 위하여, 세포를 우선 계수하고 이들의 농도를 실온에서 12ml의 10% FCS/PBS 속에서 1천만개로 조절하고 15ml의 폴리프로필렌 튜브(세포 배양을 위해 사용하였으므로 튜브 벽에 세포가 과도하게 흡착/고정되지 않는다, Greiner Bio One)에 넣었다. 이후에, 650μl의 37% 포름알데하이드 PBS 용액을 즉, 1.9%의 포름알데하이드의 최종 농도를 교차 결합/고정에 사용하여, 세포 응집을 피하기 위해 약하게 텀블링(tumbling)하면서 실온에서 10분 동안 가하였다. 주목: 이 단계에서 교차 결합/고정을 위한 포름알데하이드의 농도는 다음 단계에 이상적이며 인간 및 마우스 세포에 대한 세포/핵 완전성과 관련하여 본 발명자들이 본원에서 사용하였으며; 이것이 일반적으로 유지될 수 있다고 해도, 다른 농도 및 항온처리 시간이 보다 우수한 결과를 달성하는 경우는 알려져 있다. 따라서, 튜브를 얼음(이 시점으로부터 본 발명자들은 DNA의 제1 제한 분석(하기 참조)까지 빙상에서 유지시켜 물질의 어떠한 손상도 피하였다)에 두고, PBS중 1.6ml의 냉 1M 글리신을 가하여 교차 결합/고정 반응을 정지시켰다. 이후에, 세포를 8분 동안 1300rpm으로 4℃에서 회전시키고, 수득되는 펠렛을 빙냉 PBS로 세척하고, 14ml까지의 PBS를 가하기 전에 1ml 속에 먼저 넣은 후 다시 8분 동안 1300rpm으로 4℃에서 회전시켰다. 상층액을 버린 후, 본 발명자들은 분해 및 제1 제한 효소를 바로 지속할 것을 충고함에도 불구하고, 펠렛을 이제 또한 저장을 위해 동결시킬 수 있었다. 다시 세포를 DAPI로 핵의 염색을 하고/ 염색 없이, 현미경에 의해 세포 및 특히 핵 완전성에 대해 확인하기 위해 유리 슬라이드에 스폿팅하였다 (주목: 다시 세포를 이제 또한 어떠한 다른 면역형광성 또는 형광성 in situ hybridization 실험에 궁극적으로 사용할 수 있었다).
세포 핵의 준비 및 제1의 핵 게놈 DNA 제한
세포를 분해하고 세포 핵을 제조하기 위하여, 본 발명자들은 10mM 트리스 pH 8.0(50μl 1M), 10 mM NaCl(10μl 5M), 0,2% NP-40(100μl 10%), 100μl 50x 완전한 단백질 억제제(50X = 1ml의 PBS중 1개의 정제)로 구성된 빙상의 5ml의 신선한(완전한 활성을 위해) 용해 완충액을 제조하고, 5ml 이하의 MilliQ(4.74ml)로 충전시켰다. 교차 결합/고정의 마지막 단계에서 제조한 펠렛을 1ml의 이 용해 완충액에 넣고, 재현탁시키고, 다른 4ml를 충전시켜 총 5ml가 되도록 하고 빙상에서 10분 동안 항온처리하였다. 이제 유리된 세포 핵을 5분 동안 1800rpm에서 4℃로 회전시키고, 펠렛을 0.5ml의 빙냉 PBS 안전한-고정 튜브에 넣고, 1분 동안 2600rpm으로 4℃에서 회전시켰다. 여기서 다시 상층액을 제거한 후 잠시-동결시켜 핵을 -80℃에서 저장하는 것이 가능하다. 확인을 위해 본 발명자들은 핵을 유리 슬라이드 위에 스폿팅하여 현미경 및/또는 DAPI로 핵의 염색에 의해 핵 완전성을 확인하였다.
제1 제한(1st restriction)을 위해, 핵을 이제 1.2x 제한 완충액(60 μl 제한 완충액, 440 μl MilliQ 및 필요한 경우 BSA에 대해 조절함)으로 재현탁시키고 1.5ml의 안전-고정 튜브에 이전시켰다. 이후에, 핵막하층(nuclear lamina)을 온화하게 침투시키기 위하여, 튜브를 37℃에 두고 7.5 μl의 20% SDS(0.3% 말기 농도)를 가하고, 37℃에서 1시간 동안 900 rpm에서 진탕시키면서 항온처리하였다. 핵막하층의 추가로 온화환 침투를 위해 50μl의 트리톤-X-100(2% 말기 농도)를 가한 후, 핵을 다시 37℃에서 1시간 동안 900rpm에서 진탕하면서 항온처리하였다. 주목: SDS 및 트리톤-X-100 단계 둘 다는 매우 조심스럽게 수행하여 어떠한 교차 결합도 피하는 것이 필요하며 - 다시 본 발명자들은 핵을 DAPI 염색하에/염색없이 현미경으로 확인함으로써 확인하였다. 분해되지 않은 물질(소위 제1 제한 분해되지 않은 대조군)의 추가의 조절을 위해, 이제 5μl의 분취량을 취하여 -20℃에서 저장하였다. 이후에, 400 Units의 선택된 제한 효소를 가하고 밤새(~20 h) 37℃에서 항온처리하였다. 모든 경우에 인간 세포의 경우 제한 효소 BglII(제조원: Roche)을 사용하였다. 마우스 세포의 경우에는 본 발명자들은 HindIII(제조원: Roche) 또는 ApoI(제조원: New England Biolabs)를 사용하였다. 주목: 이의 최적 온도가 ApoI의 경우 50℃라고 해도, 37℃를 사용하여 시료의 부분 탈교차 결합을 방지하여야 한다; -). 다시 제한분해의 추가의 조절을 위해, 이제 5μl의 분취량을 취하여 -20℃에서 저장하였다(소위 제1 제한분해된 대조군). 제1 제한 후, 40μl의 20% SDS(농도 1.6%)를 나머지 시료에 가하여 제한 분해를 정지시키고 900 rpm에서 진탕시면서 65℃에서 20 내지 25분 동안 항온처리하여 핵막하층의 추가의 파괴를 정지시켰다.
제한분해된 게놈 DNA의 희석, 재- 라이게이션 및 탈-교차 결합
이후에, 완전히 분해된 핵 물질을 50ml의 팔콘 튜브에 이전하고 6.125ml의 1.15x 라이게이션 완충액(6.125ml: 5421ml MilliQ + 704μl 라이게이션 완충액)을 가하여 희석시켰다. 이후에, 375μl의 20% 트리톤-X-100(농도 1.0%)를 가하고 10분 마다 손으로 진탕시키면서 37℃ 수욕 속에서 1시간 동안 항온처리하였다. 이후에, 20μl의 리가제 HC 5U/ l(총 100U, 제조원: Roche)을 가하고 16℃에서 밤새(~20 시간) 항온처리한 후 추가로 30분 항온처리를 실온에서 수행하였다. 라이게이션되지 않은 및 라이게이션된 DNA를 탈-교차 결합시키기 위해, 30μl의 10 mg/ml 프로테이나제 K를 가하고 65℃에서 수욕 속에서 밤새(~20 시간) 항온처리하였다. 다시, 재-라이게이션 및 탈-교차 결합의 추가의 조절을 위하여, 이제 5μl의 분취량을 취하여 -20℃에서 저장하였다(소위 재-라이게이션/탈-교차 결합 대조군).
DNA 정제 및 제2(재-라이게이션된-)DNA 제한 분해/초음파 처리
시료의 추가의 처리를 위해, 우선 DNA를 30μl의 10 mg/ml RNAse(총 300㎍)를 가하고 37℃에서 30 내지 45분 동안 항온처리한 후 실온에서 약간 냉각하고 7ml의 페놀-클로로포름을 가하며 격렬하게 교반하였다. 이후에, 시료를 4,000rmp(2200xg)에서 15분 동안 원심분리한 후 상부 상을 새로운 50ml 튜브에 넣고 7ml의 MilliQ 및 ml당 1μl의 글리코겐, 1.5ml의 2M 아세트산나트륨 pH 5.6을 가하고, 35ml의 100% 에탄올을 가하여 정제를 향상시키고, 온화하지만 골고루 혼합한 후 -80℃에서 1.5 내지 3시간 동안 두었다. 이를 이어서 4,000 rmp(2200xg)에서 15분 동안 직접 원심분리하고, 상층액을 제거하고, 10ml의 70% EtOH를 가하고, 재현탁시키고, 다시 4,000 rmp(2200xg)에서 4℃에서 15분 동안 원심분리하였다. 상층액을 제거한 후, 펠렛을 20분 동안 건조시키고 150l의 10 mM 트리스 pH 7.5 속에서 37℃에서 30분 동안 용해시켰다. 다시 재-라이게이션 및 탈-교차 결합의 추가의 조절을 위해, 이제 5μl의 분취량을 취하여 -20℃에서 저장하였다(소위 제1 정제 대조군).
이후에, 수득되는 재-라이게이션되고 탈-교차 결합된 정제된 물질을 제2 제한분해로 단축시켰다. 우선, 이 단계에서 DNA의 양을 조절하기 위해, 1μl의 분취량을 2% 아가로즈 겔 상에서 공지된 농도의 종-매치된 게놈 DNA의 참고 시료를 따라 이동시켰다. 이후에, DNA를 0.5ml/튜브 속에서 100ng/μl 농도로 조절하고 DNA의 ㎍당 1U의 선택된 제한 효소를 가함으로써 제2 제한 효소로 제한분해하고 밤새(~20 시간) 37℃에서 항온처리하였다. 모든 경우에 인간 세포에 대해, 제한 효소 NlaII(제조원: New England Biolabs)를 사용하였다. 마우스 세포의 경우, 본 발명자들은, HindIII를 제1 제한 효소 DpnII(제조원: New England Biolabs)로서 사용하거나 ApoI이 제1 제한 효소로서 사용하는 경우에서 15초 가동 및 45초 중지의 10회 주기의 효소 초음파처리를 사용하였다.
다양한 DNA 대조군의 처리
상이한 단계에서 DNA의 완전성의 조절을 위해 다음의 대조군을 사용하였다: i) 제1 제한분해되지 않은 대조군, ii) 제1 제한분해된 대조군, iii) 재-라이게이션/탈-교차 결합 대조군, iv) 제1 정제 대조군, 및 v) 제2 제한분해/최종 정제 대조군. 이들 시료를 2% 아가로즈 겔 상에서 상응하는 플라스미드 DNA를 사용하여 조절하고, 이를 외부 제한분해 대조군으로서 나란히 제한분해하고, 재-라이게이션시키고 정제하였다. 대조군 i) 내지 iii)의 경우, 분취량을 10 μl의 프로테이나제 K(10 mg/ml)와 함께 90 μl의 10 mM 트리스 pH 7.5 에서 65 ℃로 적어도 1 시간 동안 항온처리하였다. DNA를 3 μl의 10 mg/ml RNAse를 가하고 37 ℃에서 30 내지 45분 동안 항온처리하여 정제한 후, 실온으로 잠깐 냉각시키고 MilliQ를 500 μl(~400 ml)까지 및 또한 500 μl 페놀-크롤로포름을 가하고 격렬하게 진탕시켰다. 이후에, 대조군을 13,200 rpm에서 15분 동안 원심분리하고, ml당 2μl의 글리코겐, 50μl의 2M 아세트산나트륨 pH 5.6을 가하고, 850μl의 100% EtOH를 가하고, 13,200rmp에서 20분 동안 원심분리에 직접 진행 전에 온화하지만 골고루 혼합하고 잠깐 동결시키고, 상층액을 제거하고, 1 ml의 70 EtOH를 첨가하고, 4℃에서 13,200 rpm으로 원심분리하고, 재생된 상층액을 제거하고, 펠렛을 20분 동안 건조시키며 10 mM 트리스 pH 7.5 20μl 내 37 ℃로 30분 동안 용해하였다.
T2C 일반 DNA 전체 게놈 시퀀싱 라이브러리 제조
일반적으로, DNA T2C 단편 라이브러리를 본 발명자로부터의 향상시키는 변형을 가진 Illumina TruSeq DNA 프로토콜(www.illumina.com, TruSeq DNA 시료 제조 LS 프로토콜; part#15026489 Rev. C)에 따라 Illumina Cluster Station 및 HiSeq 2000 Sequencer에서 시퀀싱 분석을 준비하였다: i) DNA 단편의 정제, ii) 평활 말단 상태에 도달하기 위한 말단-수복, iii) 단계 iv)에서 키메라를 피하기 위한 3'-말단 아데닐화, iv) 최종적인 다중화 단계를 포함하는 시퀀싱 어댑터 라이게이션, 및 최종적으로 v) T2C 전체 게놈 시퀀싱 DNA 단편 라이브러리의 정제.
따라서, 우선 T2C DNA 단편 라이브러리의 농도를 Quant-it dsDNA 광범위 검정 키트를 사용하는 1μl의 물질을 사용하여 미세 튜닝(tuning)을 위해 다시 측정하였다. 이후에, 시료를 5㎍ 각각의 T2C DNA 단편 라이브러리의 4개 세트로 분할하고 다음의 완전한 과정을 이들 4개 세트의 물질 각각에 대해 수행하였다:
i) 제2 제한분해 후 T2C DNA 라이브러리를 정제하기 위해 AMPure XP 비드(제조원: Beckman Coulter)를, 1.0μl의 분해된 DNA당 1.8μl의 AMPure XP 비드를 가함으로써 사용하였다. 이를 실온에서 5분 동안 항온처리하고, 자기 스탠드에 두고 실온에서 5분 동안 항온처리하고, 상층액을 비드를 방해하지 않고 버렸다. 비드를 새로이 제조한 70% 에탄올로 2회 세척하고, 37℃에서 5분 동안 두어 비드가 건조되도록 하였다. 이후에, 비드를 50μl의 PCR grade의 물 속에 재현탁시키고 실온에서 5분 동안 항온처리하고, 자기 스탠드 상에 5분 동안 두고, 최종적으로 50μl의 상층액을 새로운 튜브에 이전시켰다. 1 마이크로리터를 정제되고 분해된 DNA의 품질을 측정하기 위해 DNA 1000 검정을 사용하여 Agilent Technologies 2100 생물분석기 상에 최종적으로 로딩하였다.
ii) T2C 라이브러리 DNA 단편의 최종-수복를 위하여, 이들을 제한분해하거나 오버행 말단(overhang end)과 함께 먼저 초음파처리하므로, 4개의 물질 세트를 각각 50μl로 96웰 플레이트에 이전시켰다. 물질의 오염을 방지하기 위해 인-라인 조절 시약을 사용하지 않았으므로, 10μl의 재현탁 완충액을 가한 후, 40μl의 end repair 혼합물을 가하고, 전체 부피를 10회 아래 위로 골고루 그러나 온화하게 피펫팅하여 혼합하였다. 이후에, 플레이트를 마이크로-밀봉 'B' 접착성 밀봉물로 덮고 예비-가열된 열 사이클러 상에서 30℃로 30분 동안 두었다. 플레이트로부터 점착성 밀봉을 제거한 후, 우선 AMPure XP 비드를, 이들이 잘 분산될 때까지 와동시키고, 160μl(24μl의 PCR grade 물과 혼합된 136μl의 AMPure XP 비드로 이루어짐)를 웰에 가하고 전체 부피를 아래 위로 10회 골고루 그러나 온화하게 피펫팅하여 피펫팅하였다. 15분 동안 항온처리한 후, 액체가 투명하게 나타날 때까지 플레이트를 실온에서 다른 15분 동안 자기 스텐드에 두었다. 127.5μl의 상층액을 2회 제거한 후, 200μl의 새로이 제조된 80% EtOH를 비드를 교란시키지 않고 플레이트의 웰내로 채우고, 실온에서 30초 동안 항온처리하고 비드를 교란시키지 않으면서 다시 버렸다. 이를 2회 반복한 후 플레이트를 15분 동안 건조시켰다. 단지 이후에 플레이트를 자기 스탠드로부터 제거하고 펠렛을 17.5μl의 재현탁 완충액과 함께 재현탁시킨 후, 완전히 그러나 온화하게 10회 위 아래로 피펫팅하여 혼합하였다. 실온에서 2분 동안 항온처리한 후, 다시 액체가 투명해질 때까지 플레이트를 다시 자기 스탠드에 실온에서 5분 동안 둔 후, 다음 단계에서 3'-말단의 아데닐화를 위해 준비된 최종-수복된 물질을 함유하는 15μl의 투명한 상층액을 제거하였다.
iii) 말단-수복된 HRHT iCIC DNA 단편 라이브러리의 3'-단계 아데닐화를 위해, 즉, 서로에 대한 라이게이션으로부터 평활말단을 방지하기 위해, 및 따라서 단계 iv)에서 어댑터 라이게이션 반응 동안 낮은 비율의 키메라 형성(연결된 주형)을 보장하기 위해, ATP의 존재하에 클레노우 엑소 효소를 사용하였다. 어댑터의 3' 말단에서 상응하는 단일의 'T' 뉴클레오타이드는 어댑터를 단편에 연결하기 위한 상보성 오버행을 제공하였다.
따라서, 15μl의 말단-수복된 T2C DNA 단편 라이브러리를 새로운 0.3ml의 PCR 플레이트로 이전하였다. 물질의 오염을 방지하기 위한 인-라인 대조군 시약을 다시 사용하지 않았으므로, 2.5μl의 재현탁 완충액을 가한 후, 12.5μl의 해동된 A-테일 혼합물을 가한 후, 상하로 10회 골고루 그러나 온화하게 피펫팅하였다. 이후에, 플레이트를 미세밀봉 'B' 점착성 밀봉으로 밀봉하였고, 플레이트를 예비-가열된 열 사이클러 상에 37℃에서 30분 동안 두었다. 열 사이클러로부터 플레이트를 제거한 직후, 어댑터 라이게이션이 일어났다.
iv) 어댑터 #6 및 #12로 색인되어 제공되는 Illumina를 사용하여 시퀀싱 어댑터를 라이게이션시키기 위해, DNA 어댑터 튜브 및 종결 라이게이션 완충액 튜브를 사용하였고, 600xg에서 5초 동안 원심분리하였다. 사용 직전에, 라이게이션 혼합물을 함유하는 튜브를 Illumina가 추천한 바와 같이 -25℃ 저장으로부터 제거하였다. 물질의 오염을 피하기 위한 인-라인 대조군 시약을 사용하지 않았으므로, 2.5μl의 재현탁 완충액을 다른 PCR 플레이트의 웰에 가하고, 2.5μl의 라이게이션 혼합물을 또한 가하였다. 이후에, 적절한 어댑터 튜브로부터 2.5μl를 가하고 상하로 10회 골고루 그러나 온화하게 피펫팅하였다. 이후에, 플레이트를 다시 미세밀봉 'B' 점착성 밀봉물로 밀봉하고 플레이트를 280xg에서 1분 동안 원심분리하였다. 이후에, 플레이트를 예비-가열된 열 사이클러 상에서 30℃로 10분 동안 항온처리하고, 플레이트를 사이클러로부터 취하고, 점착성 밀봉물을 제거하고, 5μl의 정지 라이게이션 완충액을 가하고, 골고루 그러나 온화하게 상하로 10회 피펫팅하였다.
v) Sequencer 적응된 T2C DNA 단편 라이브러리를 다시 정제하기 위하여 AMPure XP 비드를 사용하였다. 따라서, AMPure XP 비드를, 이들이 잘 분산될 때까지 원심분리하고 42.5μl의 혼합된 AMPure XP 비드를 웰에 가하고 상하로 10회 골고루 그러나 온화하게 피펫팅한 후, 실온에서 15분 동안 항온처리하였다. 이후에, 플레이트를 자기 스탠드에 실온에서 최소 5분 이상 동안 액체가 투명해질 때까지 두었다. 이후에, 80μl의 상층액을 각각의 플레이트의 웰로부터 제거하며 이 동안 플레이트를 자기 스탠드에 잔류시키고, 200μl의 새로이 제조된 80% EtOH를 비드를 교란시키지 않고 가하고, 실온에서 30초동안 항온처리하였다. 이후에, 완전한 상층액을 제거하였다. 이 EtOH 세척을 2회 수행한 후, 여전히 자기 스탠드에 놓여있는 플레이트를 실온에서 15분 동안 공기-건조시켰다. 자기 스탠드로부터 제거한 후, 건조된 펠렛을 52.5μl의 재현탁 완충액을 사용하여 재현탁시키고, 상하로 10회 골고루 그러나 온화하게 피펫팅하였다. 2분 동안 항온처리한 후, 플레이트를 다시 자기 스탠드에 실온에서 최소 5분 이상 액체가 투명해질 때까지 두었다. 이후에, 50μl의 투명한 상층액을 2초 세정 동안 새로운 0.3. PCR 플레이트에 이전시키고, 50μl의 와동된 AMPure XP 비드를 가하고, 상하로 10회 골고루 그러나 온화하게 피펫팅하였다. 이후에, 플레이트를 실온에서 15분 동안 다시 항온처리하고, 플레이트를 다시 자기 스탠드 상에 실온에서 최소 5분 이상 액체가 투명해질 때가지 두었다. 95μl의 상층액을 제거하고, 이 동안에 플레이트는 여전히 자기 스탠드에 두고, 200μl의 새로이 제조된 80% EtOH를 각각의 웰에 비드를 교란시키지 않고 가하고, 실온에서 30초 동안 항온처리하였다. 이후에, 완전한 상층액을 제거하였다. 이 EtOH 세척을 다시 2회 수행한 후, 여전히 자기 스탠드에 놓여있는 플레이트를 실온에서 15분 동안 공기-건조시켰다. 자기 스탠드로부터 제거한 후, 건조된 펠렛을 22.5μl의 재현탁 완충액을 사용하여 재현탁시키고, 상하로 10회 골고루 그러나 온화하게 피펫팅하였다. 다시 2분 동안 항온처리한 후 플레이트를 다시 자기 스탠드에 실온에서 최소 5분 이상 동안 액체가 투명해질 때까지 두었다. 최종적으로, 각각의 플레이트의 웰로부터 20μl의 투명한 상층액을 수집하고 나란하게 처리된 T2C DNA 단편 라이브러리 4개 중 각각으로부터의 물질을 혼주(pooling)시켰다.
영역 DNA 시퀀싱 포획 마이크로어레이 설계
고-분해능을 달성하고 고속 대량 처리량 다중화된 시퀀싱을 허용하고 이에 따라 매우 관련된 국소 상호작용 맵핑을 달성하기 위하여, 즉, 고 품질 T2C 2 를 달성하기 위하여, 특별한 포획 어레이를 설계하여 불필요한 배경의 시퀀싱을 피하면서 목적한 게놈 영역에 대해 특이적으로 선택하여, 즉, 제1 제한분해 후 재-라이게이션된 DNA 조각의 선택을 위해, 즉, 특이적이고 비교적 작은 게놈 영역내에서만의 상호작용을 위해 직접적으로, 최적화된 영역 DNA 시퀀싱 라이브러리를 생성하였다. 이후에, NimbleGen과의 밀접한 협동에서, 본 발명자들은 2.1M 포획 마이크로어레이, 즉, 원칙적으로 동량의 상이한 올리고를 사용하여 210만개의 상이한 게놈 서열을 피싱(fishing)할 수 있는 포획 마이크로어레이에 대한 DNA 올리고를 설계하였다. 실제 고 품질의 결과 T2C 만을 달성하기 위하여(!), 목적한 것이 이 제1 제한분해의 재-라이게이션 후 각각의 측면의 시퀀싱에 놓이므로, 1개의 올리고를 핵 전체 게놈 제한분해에서 사용된 제1 제한분해 부위에 대해 가능한한 근접한 상향 및 한개의 하향으로 위치시켰다. 올리고를 NimbleGen 및 본 발명자들이 72±3bp의 올리고 길이를 가지고, 전체 게놈 내에서 유일한 외형(허용된 미스매치 없음)을 가지며, 마이크로어레이에서 가장 우수하고 유사한 포획, 즉, 유사한 하이브리드화와 관한 mm9 및 HG19게놈 구조물을 사용하는 인간 및 마우스 게놈의 선택된 영역에 대해 설계하였다. 이후에, 올리고를 추가로 선택하였다: 제2 제한 효소를 사용하여 시퀀싱용의 재-라이게이션된 DNA 라이브러리를 단축시키는 경우에, 올리고는 제1 및 제2 제한분해 부위 사이에 위치하여야 했다. 초음파를 사용하여 재-라이게이션된 DNA를 단축시키는 경우에 제1 제한분해 부위의 150bp내 올리고만을 선택하였다. 제1 또는 제2 또는 심지어 제한분해 부위 둘 다를 교차하는, 단지 하나의 올리고가 존재한 경우에, 총 10% 이하내에서 올리고 개시 또는 말단에 유일한 절단을 허용하는데, 즉, 올리고는 보증 특이성 및 유사한 하이브리드화 효율에 대해 최소 62bp를 지닌 DNA 조각을 명확하게 포획할 수 있다. 동일한 조건을 제1 제한분해 부위에 대해 초음파 경우에서 적용하였다. 이후에, 본 발명자들은 게놈상에 올리고를 맵핑하고 조건들이 충족하는지 및 올리고가 다른 게놈 특성과 관련하여 적절히 위치하는지의 여부를 수동으로 조절하였다. 마이크로어레이의 생산을 위하여, 210만개 수의 가능한 상이한 올리고 O정렬을 선택된 올리고 O선택됨의 수로 나눈 후 NimbleGen에 의한 포획 마이크로어레이의 생산 공정 동안 실제 포획 어레이에 있어서, 각각의 선택된 올리고를 N분산된 횟수,
Figure 112016057494527-pct00002
으로 나누었다. 따라서, 제1 및 제2 제한 효소를 사용한 포획(하기 참고)을 위해 사용된 올리고의 수를 사용하여 본 발명자들은 마이크로어레이에서 각각 상이한 올리고에 대해 ~1010개의 올리고 분자를 가지도록 보증할 수 있으므로, 본 발명자들이 투입물로서 사용한 107개의 세포를 사용하여, 본 발명자들은 어레이의 포화도로부터 > 105 내지 106까지 떨어뜨린다. 실험 과정에서 포획 어레이까지의 손실을 고려하는 경우, ~250회 이상의 올리고 및 총 ~50회 이상의 게놈 영역에서 초음파를 사용한 실험의 경우에 여전히 > 102를 포함한다.
제1 및 제2 제한 효소를 사용한 실험을 고려할 때, 선택된 영역 크기 사이의 균형, 상호작용 매트릭스의 생성된 크기, 즉, 이 영역내 모든 제한분해 단편들 사이의 모든 가능한 상호작용, 및 각각의 가능한 상호작용에 대해 최소 4 내지 5차수 규모의 고 빈도 영역을 달성하기 위한 시퀀싱 능력(본 발명자들은 평균 2 내지 3차수의 규모를 추정하며, 이는 4 내지 5차수 규모의 확대를 야기한다)을 계산하였다. 따라서, ~3억 및 5억개 서열, 즉 가능한 상호작용 현상의 3억 및 5억개 서열의 2개의 시퀀싱 레인에서 시퀀싱 능력을 위해, 500 내지 1,000개의 올리고 상호작용당 평균 100 내지 1,000개의 시퀀싱 현상을 달성할 목표로 가짐으로써 상호작용 단편이 최적이다. 이후에, 포함된 게놈 영역은 분해능, 즉, 게놈 내 제1 제한 효소의 평균 간격에만 의존한다.
제1 및 제2 제한 효소의 경우에 본 발명자들은 다음과 같이 올리고 및 포획 어레이를 선택하였다: 인간의 경우에 이는 ~1,110,650 내지 ~3,216,350번 염기쌍 위치로부터의 11번 염색체 상의 H19/IGF2 영역, 즉, 2,105,700 bp 크기의 영역 및 525개 올리고에 대해 수행되었다. 마우스의 경우에, 이는 ~109,876,350 내지 111,966,600번 염기쌍 위치로부터의 7번 염색체상의 β-글로빈 영역, 즉, 2,090,250 bp 크기의 영역 및 800개 올리고에 대해 수행되었다.
HRHT iCIC 2 영역 DNA 시퀀싱 라이브러리 제조 - 마이크로어레이 포획
T2C 전체 게놈 DNA 단편 시퀀싱 라이브러리로부터 소선택된 영역의 T2C DNA 단편 시퀀싱 라이브러리를 생산하기 위하여, 시퀀싱 어댑터의 라이게이션 후 혼주된 DNA 라이브러리를 NimbleGen 어레이 포획 프로토콜 및 (www.nimblegen.com/seqcapez, NimbleGen Arrays 사용자 안내서, 서열 포획 어레이 전달 버젼 3.2)로부터의 향상된 변형을 사용하여 상기 기술된 새롭고 구체적으로 개발된 포획 마이크로어레이로 소선택에 적용시켰다: 전체 공정은 i) 마이크로어레이 하이브리드화, ii) 세척 후 iii) 마이크로어레이로부터 포획된 영역 DNA 라이브러리의 용출.
i) 따라서, 포획 3시간 전에, 하이브리드화 시스템을 42℃로 설정하였고, 첫번째 열 차단을 95℃로 설정하였고, 다른 하나는 70℃로 설정하여 평형화시켰다. 이후에, 하이브리드화 혼합물을, 300μl의 1 mg/ml Cot-1 DNA를 혼주된 DNA 라이브러리에 시퀀싱 어댑터의 라이게이션 후 가하여 제조하였다. 다중화된 시료를 사용하는 경우 단지 4개 세트의 물질을 혼주시킬 뿐 아니라 다중화된 시료도 혼주시켰다. 이는 마이크로어레이 능력을 저장하며, 포획될 DNA의 양이 마이크로어레이의 포화중에 있으므로 이를 DNA 양, 농도, 및 사용될 방법에 따라 10 내지 100개의 시료까지 다중화를 위해 Room에 두었다. 여기서 다중화는 2개의 상이한 물질을 혼주시킴으로써 강하시켰다. 이후에 시료를 스피드백(SpeedVac) 속에서 60 ℃로 대략 30 내지 45분 동안 건조시키고, 11.2μl의 VWR 물을 재수화를 위해 가하고, 와동시키고, 30초 동안 최대 속도에서 원심분리한 후 10분 동안 70℃ 열 블록에 위치시켜 DNA를 완전히 가용화시켰다. 두번째 와동 및 다시 최대 속도에서 30초 동안 원심분리한 후, 18.5μl의 2X SC 하이브리드화 완충액 및 SC 하이브리드화 성분 A를 가한 후, 와동시키고 다시 최대 속도에서 30초 동안 원심분리시켰다. 이후에, DNA를 변성시키기 위하여, 시료를 95℃ 열 블록에 10분 동안 둔 후 최대 속도에서 30초 동안 다른 원심분리를 수행하였다. 이후에, 시료를 42℃에 두고 이로부터 마이크로어레이 하이브리드화 체임버 상에 즉시 로딩(완전한 마이크로어레이 시스템을 나란히 제조하였다)하고 42℃에서 64시간 동안 하이브리드화하였다.
ii) 마이크로어레이 상에서 포획된 영역 T2C DNA 라이브러리를 세척하기 위해, 우선 용출 체임버를 NimbleGen 정령 사용자 안내서에 따라 조립하였다. 따라서, 마이크로어레이 슬라이드를 42℃ NimbleGene 하이브리드화 시스템으로부터 제거하고 100ml의 47.5℃로 가열된 SC 세척 완충액 II를 함유하는 분해 바신(disassembly basin)내에 직접 두었다. 평형화를 위해 사용된 ~10초 후, 혼합기를 벗기고 슬라이드를 SC 세척 완충액 II를 함유하는 제2의 세척 튜브에 47.5℃에서 이전시키고, 밀폐된 세척 튜브를 10회 초당 1 역전의 비율로 역전시켰다. 이후에, 슬라이드를 32ml의 엄격한 세척 완충액을 함유하는 새로운 세척 튜브에 47.5℃에서 이전시키고, 밀폐된 튜브를 초당 1회 역전의 비율로 10회 역전시킨 후, 47.5℃에서 5분 동안 두고, 다시 초당 1회 역전의 비율로 10회 역전시켰다. 이후에, 슬라이드를 다시 32ml의 엄격한 세척 완충액을 함유하는 새로운 튜브에 47.5℃에서 이전시키고, 밀폐된 튜브를 초당 1회 역전의 비율로 10회 역전시킨 후, 47.5℃에서 5분 동안 두고, 다시 초당 1회 역전의 비율로 10회 역전시켰다. 이후에, 슬라이드를 실온에서 32ml의 SC 세척 완충액 I를 함유하는 새로운 튜브로 이전시키고, 밀폐된 튜브를 2분 동안 초당 1회 역전의 비율로 역전시켰다. 이후에, 슬라이드를 다시 32ml의 SC 세척 완충액 II를 함유하는 새로운 튜브에 실온에서 이전시키고, 밀폐된 튜브를 1분 동안 초당 1회 역전의 비율로 역전시켰다. 이후에, 슬라이드를 다시 실온에서 32ml의 SC 세척 완충액 III을 함유하는 새로운 튜브로 이전시키고, 밀폐된 튜브를 초당 1회 역전의 비율로 10회 역전시켰다.
iii) 포획된 영역 T2C DNA 단편 시퀀싱 라이브러리를 마이크로어레이로부터 용출시키기 위하여, 슬라이드를 실온에서 NimbleGen EL1 용출 시스템으로 이전시켰다. 이후에, ~900μl의 125mM NaOH를 용출 체임버에 이것이 가득 찰때까지 가하고 10분 동안 항온처리하였다. 용출된 영역 DNA 단편 시퀀싱 라이브러리를 1.5ml 튜브내로 피펫팅하고 900μl의 125mM NaOH까지 채우고, 이어서 1.5ml의 튜브 속에서 먼저 제조된 16μl의 20% 아세트산 용액 및 500μl의 Qiagen 완충액 PBI의 잘 혼합된 용액 516μl를 함유하는 2개의 새로운 튜브에 동일하게 분배시켰다. 이후에, 혼합물을 원심분리시 단일의 MinElute 컬럼에 이전시켜 각각 700μl의 수회 단계에서 컬럼을 통해 용액을 배출시켰다. 이후에, 750μl의 완충액 PE를 컬럼에 두고 완전히 원심분리하였다. 이후에, MinElute 컬럼을 2ml의 수집 튜브에 두고 최대 속도에서 1분 동안 원심분리하여 임의의 잔류 완충액 PE도 제거하였다. 유동-통과물을 버린 후, 깨끗한 1.5ml의 튜브 속의 MinElute 컬럼을 위치시키기 전에, 25μl의 완충액 EB를 컬럼에 가하고, 1분 동안 항온처리하며 최대 속도에서 1분 동안 원심분리하였다.
T2C 증폭, 클러스터 생성, 및 짝지어진-말단 고속 대량 처리 시퀀싱
우선 짝지어진-말단 시퀀싱을 위해, T2C 영역 DNA 단편 시퀀싱 라이브러리를, 98℃에서 30초 동안 12 주기의 (98℃에서 10초, 60℃에서 30초, 72℃에서 30초), 72℃에서 5분의 최종 연장을 사용하여 Phusion 폴리머라제를 이용하여 PCR에 의해 우선 시퀀싱용으로 농축시켰다. 각각 1㎍의 T2C 영역 DNA 단편 라이브러리에 대해, 5μl의 PCR 프라이머 칵테일 및 25μl의 PCR 마스터 혼합물을 PCR 플레이트에 가하였다. 정제를 위해 AMPure XP 비드(제조원: Beckman Coulter)를, 1.0 μl의 DNA당 1.8 μl의 AMPure XP 비드를 가하여 사용하였다. 이를 실온에서 5분 동안 항온처리하고, 자기 스탠드에 두고 실온에서 5분 동안 항온처리하며, 상층액을 비드의 교란없이 버렸다. 비드를 새로이 제조된 70% 에탄올로 2회 세척하고, 37℃에서 5분 동안 두어 비드가 건조되도록 하였다. 이후에, 비드를 30μl의 재현탁 완충액 속에 재현탁시키고 실온에서 5분 동안 항온처리하고, 자기 스탠드에 5분 동안 두고, 최종적으로 50μl의 상층액을 새로운 튜브에 이전시켰다. 1 마이크로리터를 최종적으로 DNA 1000 검정을 사용하는 Agilent Technologies 2100 생물분석기에 로딩하여 정제되고 분해된 DNA의 품질을 측정하였다.
클러스터 생성을 Illumina cBot 사용자 안내서(www.illumina.com, part#15006165 RevE)에 따라 수행하였다. 요약하면, 1μl의 10 nM TruSeq DNA 라이브러리 스톡 DNA를 NaOH로 변성시키고, 10pM로 희석시키고 플로우셀 상에 하이브리드화하였다. 하이브리드화된 단편을 Illumina 짝지어진 말단 시퀀싱 사용가 안내서 프로토콜에 따라서 연속 증폭시키고, 선형화하며 말단-차단시켰다. 시퀀싱 프라이머를 하이브리드화한 후, 합성에 의한 시퀀싱을, 101 주기 프로토콜을 사용하는 HiSeq 2000 Sequencer를 제조업자의 지시에 따라 사용하여 수행하였다. 시퀀싱된 단편을 NaOH로 HiSeq 2000을 사용하여 변성시키고 색인-프라이머를 단편상에 하이브리드화하였다. 색인은 7개 주기 프로토콜로 시퀀싱하였다. 단편을 NAOH로 변성시키고, 연속적으로 증폭시키며, 선형화하고 말단-차단하였다. 시퀀싱 프라이머를 하이브리드화한 후, 제3의 판독물의 합성에 의한 시퀀싱을 101-주기 프로토콜을 사용한 HiSeq 2000 Sequencer를 사용하여 수행하였다.
HRHT iCIC 2 서열 맵핑 및 분류
열(raw) 서열 판독물을 시퀀싱 방향으로 제1 제한 효소 인식 서열의 존재에 대해 확인하였다. 제1 효소 인식 부위 다음의 서열을 제거하였다. 오버행 이후 인식 부위의 염기가 분명하지 않은 경우, 판독물을 오버행의 말단 이후의 모든 염기를 제거함으로써 추가로 트리밍(trimming)하였다. 이후에, 이들 트리밍된 서열을 전체 인간게놈 NCBI36/hg18 조립체에 대해서 및 마우스 NCBI37/mm9 조립체에 대해서 Burrows-Wheeler Alignment(BWA) 도구를 사용하여 정렬하였다. 따라서, 다음의 디폴트(default) 매개변수 세트를 사용하였다([] 괄호안의 매개변수의 값을 사용함):
bwa aln[options] <prefix> <in.fq>
-n NUM 0.02 오차율(부유) 하에서 최대 #diff(int) 또는 소실된 프로브[0.04]
-o INT 갭 개방의 최대 수 또는 분획[1]
-e INT 갭 연장의 최대 수, 불능의 긴 갭에 대해서는 -1[-1]
-i INT 말단을 향해서 INT bp내에서 인델(indel)을 도입하지 않음[5]
-d INT 긴 결실을 연장시키기 위한 최대 발생[10]
-l INT 씨드(seed) 길이[32]
-k INT 씨드에 있어서 최대 차이[2]
-m INT 줄에서 최대 엔트리[2000000]
-t INT 쓰레드(thread)의 수[1]
-M INT 미스매치 패널티[3]
-O INT 갭 개방 패널티[11]
-E INT 갭 연장 패널티[4]
-R INT 동일하게 최고의 히트(hit)인 >INT가 존재하는 경우 서치 중지[30]
-q INT 35bp까지 하향된 판독물 트리밍에 대한 품질 쓰레드(thread)[0]
-f FILE stdout대신 결과를 작성하기 위한 파일
-B INT 바코드 길이
-L 긴 결실에 대한 로그-규모 갭 패널티
-N 비-반복 모드: 모든 n-차이 히트에 대한 서치(slooow)
-I 도입이 Illumina 1.3+ FASTQ-유사 패턴.
-b 도입 판독 파일이 BAM 패턴내에 있음.
-0 단일의 말단 판독물만을 사용(-b로 효과적임)
-1 쌍으로 제1 판독물 사용(-b로 효과적임)
-2 쌍으로 제2 판독물 사용(-b로 효과적임)
-Y 여과기 카사노바-여과된 서열
제2 제한 효소를 사용하는 경우(따라서 초음파의 경우는 아님)에 유일한 서열을 이후 제2 제한 효소들 사이의 서열 부분을 제외하고 제1 효소 인식 부위를 함유하지 않았던 차폐된 게놈에 제2 단계에서 정렬시켰다. 최종적으로, 이들 서열만을 SAMtool을 사용하여 쌍을 이룸으로써 짝지어진-말단 2원 정렬(Binary Alignment)/맵(BAM) 파일을 생성하였으며, 이는, 전체 및 차폐된 게놈 참조 서열 둘다에서 유일한 정렬을 나타내었다. 주목: 정렬은 유일하지만, 그럼에도 불구하고 미스매치 등을 함유하며, 이는 참고 게놈에 대한 본 발명자들의 세포/마우스의 차이를 암시하거나 시퀀싱 오차에 대해 수행하지 않는다. 불행히도, 거짓 양성 또는 거짓 음성 정렬을 구별하는 방법은 또한 없다. 결과적으로, 수득되는 짝지어진-말단 서열은 이후에 시퀀싱의 오차율, 참고 서열의 품질, 및 본 발명자들의 세포/마우스의 DNA 서열의 이 참고 게놈에 대한 차이에 의해 측정된 오차율과 함께 상호작용 정보를 함유한다. 공지된 오차율을 사용한 이 공정의 말기에 미스매치없이 유일한 서열에 대한 거짓 양성 및 거짓 음성 결과의 대략적인 추정은, 이 오차가 본 발명자들의 과정으로 인한 오차 축적 및 오차 감소 후 1% 미만임을 나타낸다. 이는 또한 전체 공정 전반에 걸쳐서 초기 미가공 서열로부터 최종 결과까지 서열 쌍의 감소로부터 유추될 수 있다.
상기 명세서에서 언급된 모든 공보는 본원에 참고로 포함된다. 기술된 본 발명의 방법 및 시스템의 다양한 변형 및 변화가 본 발명의 영역 및 취지에서 벗어남이 없이 이 분야의 숙련가에게 명백할 것이다. 본 발명은 구체적인 바람직한 구현예와 함께 기술되어 있지만, 청구된 본 발명은 이러한 특수한 구현예로 과도하게 한정되지 않아야 함이 이해되어야 한다. 실제로, 분자 생물학 또는 관련 분야의 숙련가에게 명백한 본 발명을 수행하기 위한 기술된 방식의 다양한 변형은 다음의 특허청구의 범위 내에 있음이 의도된다.
<110> Erasmus Universiteit Medisch Centrum Rotterdam <120> METHOD <130> P102847PCT <140> PCT/IB2014/002485 <141> 2014-11-18 <150> GB 1320351.8 <151> 2013-11-18 <160> 2 <170> PatentIn version 3.5 <210> 1 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR-directed siRNA, Scc1-1 <400> 1 acucagacuu caguguaua 19 <210> 2 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR-directed siRNA, Scc1-2 <400> 2 aggacagacu gaugggaaa 19

Claims (43)

  1. (a) 교차 결합된 DNA의 시료를 제공하는 단계;
    (b) 제1 제한 효소로 교차 결합된 DNA를 분해하는 단계;
    (c) 교차 결합된 뉴클레오티드 서열을 라이게이션시키는 단계;
    (d) 교차 결합을 역전시키는 단계;
    (e) 단계 (d)로부터 라이게이션된 분자를 단편화하는 단계;
    (f) 단계 (c)에서 다른 뉴클레오티드 서열에 라이게이션된 뉴클레오티드 서열의 말단에 대한 농축을 위해 제1 제한 효소의 분해 부위에 인접한 서열을 나타내는 하나 이상의 올리고뉴클레오티드 프로브에 단계 (e)로부터의 단편을 하이브리드화시키는 단계에 있어서, 하나 이상의 올리고뉴클레오티드 프로브(들)이 마이크로어레이에 스폿팅되거나 비드 상에 포획되거나, 후속적으로 비드 상에 포획되는 용액 속에 존재하는 것인 단계; 및
    (g) 상호작용(들)에 연관된 뉴클레오티드 서열을 확인하기 위해 농축된 단편의 뉴클레오티드 서열을 분석하는 단계를 포함하는,
    3차원 DNA 구조 내에서 다른 뉴클레오티드 서열과 관심의 하나 이상의 영역(들)로부터 하나 이상의 뉴클레오티드 서열(들)의 상호작용을 분석하는 방법.
  2. 제1항에 있어서, 3차원-크로마틴 구조내에서 다른 뉴클레오티드 서열과 관심의 하나 이상의 게놈 영역(들)로부터 하나 이상의 뉴클레오티드 서열(들)의 상호작용을 분석하기 위한 방법.
  3. 제1항에 있어서, 상기 제1 제한 효소가 6 내지 8 bp 인식 부위를 인식하는 제한 효소인 방법.
  4. 제3항에 있어서, 상기 제1 제한 효소가 BglII, HindIII, EcoRI, BamHI, SpeI, PstI 및 NdeI로 이루어진 그룹으로부터 선택되는 방법.
  5. 제1항에 있어서, 단계 (e)에서, 라이게이션된 분자가 제2 제한 효소를 사용한 분해에 의해 단편화되는 방법.
  6. 제5항에 있어서, 제2 제한 효소가 4 또는 5 bp 뉴클레오티드 서열 인식 부위를 인식하는 방법.
  7. 제6항에 있어서, 상기 제2 제한 효소가 TspEI, MaeII, AluI, NlaIII, HpaII, FnuDII, MaeI, DpnI, MboI, HhaI, HaeIII, RsaI, TaqI, CviRI, MseI, Sth132I, AciI, DpnII, Sau3AI 및 MnlI으로 이루어진 그룹으로부터 선택되는 방법.
  8. 제1항에 있어서, 단계 (e)에서, 상기 라이게이션된 분자가 기계적 수단에 의해 단편화되는 방법.
  9. 제8항에 있어서, 단계 (e)에서, 상기 라이게이션된 분자가 쉬어링(shearing)에 의해 단편화되는 방법.
  10. 제1항에 있어서, 단계 (e)에서 상기 라이게이션된 분자가 2bp 효소를 인식하는 제한 효소 또는 제한 효소의 조합을 사용하거나 일반적인 뉴클레아제에 의한 제한된 분해를 사용하여 단편화되는 방법.
  11. 제1항에 있어서, 단계 (e)에서, 상기 라이게이션된 분자가 방사선 또는 중 이온(heavy ion)을 사용하여 단편화되는 방법.
  12. 제1항에 있어서, 단계 (e) 후에 단편화된 분자의 DNA 말단이 수복되는 방법.
  13. 제1항에 있어서, 단계 (e) 후에 어댑터가 시퀀싱 목적으로 라이게이션되는 방법.
  14. 제13항에 있어서, 상기 어댑터가 어드레스 서열(address sequence)을 포함하는 방법.
  15. 제14항에 있어서, 다수의 올리고뉴클레오티드가 다중화(multiplexing)되는 경우 상이한 시료의 구별이 가능하도록 다른 시료 내에서 다수의 어드레스 서열을 포함하여 사용되는 것인 방법.
  16. 제1항에 있어서, 상기 올리고뉴클레오티드 프로브(들)이 제1 제한 효소의 제한 부위에 인접한 서열을 인식하는 방법.
  17. 제16항에 있어서, 상기 올리고뉴클레오티드 프로브(들)가 제1 제한 효소의 제한 부위의 100 bp내 서열을 인식하는 방법.
  18. 제1항에 있어서, 단계 (f)에서, 상기 뉴클레오티드 서열 단편이, 다수의 올리고뉴클레오티드를 포함하는 올리고뉴클레오티드 프로브의 세트에 하이브리드화되며, 이들 각각은 관심의 게놈 영역으로부터의 뉴클레오티드 서열 상의 제1 제한 효소의 분해 부위에 인접한 서열에 하이브리드화하는 방법.
  19. 제18항에 있어서, 상기 올리고뉴클레오티드 프로브의 세트가 제1 제한효소로 관심의 게놈 영역(들)을 처리함에 의해 획득가능한 실질적으로 모든 제한 단편에 대해 특이적인 프로브를 포함하는 방법.
  20. 제1항에 있어서, 단계 (g)가 농축된 뉴클레오티드 서열 단편의 고속 대량 처리 시퀀싱을 포함하는 방법.
  21. 제1항에 있어서, 단계 (g)가 상호작용(들)의 생물정보 분석 및 시각화를 수반하는 방법.
  22. 제2항에 있어서, 상기 관심의 게놈 영역이 관심의 유전자자리를 포함하는 방법.
  23. 제1항에 있어서, 상기 관심의 영역이 1 내지 10 MB인 방법.
  24. 제1항 내지 제23항 중 어느 한 항에 따른 단계 (a) 내지 (g)를 수행하는 단계를 포함하는 3차원 구조에서 다른 뉴클레오티드 서열과 특정 유전 요소의 상호작용을 분석하는 방법으로서,
    단계 (g)에서 특정 유전 요소를 포함하는 농축된 뉴클레오티드 서열 단편의 서열만이 유전 요소와의 상호작용(들)에 연관된 뉴클레오티드 서열(들)을 확인하기 위해 분석되는 것인 방법.
  25. 제24항에 있어서, 상기 유전 요소가 전사 인자에 대한 결합 부위 또는 인슐레이터(insulator) 또는 장벽 요소(barrier element)를 포함하는 방법.
  26. 제24항에 있어서, 상기 유전 요소가 관심의 영역 내에 있는 방법.
  27. 제1항 내지 제23항 중 어느 한 항에 따른 단계 (a) 내지 (g)를 수행하고, 유전자를 포함하는 관심의 영역 내에서 상호작용의 수, 유형 또는 밀도를 분석하는 단계를 포함하는, 유전자의 발현 상태를 측정하는 방법.
  28. 시료 둘 다에 대해 제1항 내지 제23항 중 어느 한 항에 따른 단계 (a) 내지 (g)를 수행하고, 관심의 영역 내에서 상호작용의 수, 유형 또는 밀도를 비교하는 단계를 포함하는, 2개의 시료 사이의 유전자 활성을 비교하는 방법.
  29. 제28항에 있어서, 상기 시료가 동일한 대상체로부터의 상이한 조직으로부터; 다른 시점에 따른 단일 대상체로부터; 상이한 대상체로부터의 동등한 조직으로부터 기원하는 방법.
  30. 제1항 내지 제23항 중 어느 한 항에 따른 단계 (a) 내지 (g)를 수행하는 단계를 포함하는 특정 질병 상태의 지표인 하나 이상의 DNA-DNA 상호작용을 확인하는 방법으로서,
    단계 (a)에서, 교차 결합된 DNA의 시료가 질병이 있는 세포 및 질병이 없는 세포로부터 제공되고, 질병이 있는 세포 및 질병이 없는 세포로부터 DNA 서열들 사이의 3차원 크로마틴 구조 내 뉴클레오티드 서열의 상호작용 사이의 차이는 DNA-DNA 상호작용 또는 DNA-DNA 상호작용의 패턴이 특정 질병 상태의 지표를 나타내는 것인 방법.
  31. 제1항 내지 제23항 중 어느 한 항에 따른 단계 (a) 내지 (g)를 수행하는 단계를 포함하는 DNA-DNA 상호작용내 변화에 의해 유발되거나 이와 관련된 질병 또는 증후군의 진단 또는 예후를 위한 정보를 제공하기 위한 방법으로서,
    단계 (a)는 대상체로부터 교차 결합된 DNA의 시료를 제공함을 포함하고; 단계 (f)는 DNA 서열들 사이의 상호작용을 영향받지 않은 대조군의 상호작용과 비교함을 포함하며; 대조군과 대상체 사이의 차이가, 대상체가 질병 또는 증후군으로부터 고통받고 있는 지표이거나 대상체가 질병 또는 증후군으로 고통 받을 것이라는 지표인 것인 방법.
  32. 제31항에 있어서, 상기 질병이 유전병인 방법.
  33. 제31항에 있어서, 상기 질병이 암인 방법.
  34. (a) 하나 이상의 제제와 시료를 접촉시키는 단계; 및
    (b) 제1항 내지 제23항 중 어느 한 항에 따른 단계 (a) 내지 (g)를 수행하는 단계에 있어서, 단계 (a)는 시료로부터 교차 결합된 DNA 제공을 포함하는 단계
    를 포함하는,
    DNA의 3차원 구조를 조절하는 하나 이상의 제제를 확인하기 위한 검정 방법으로서,
    (i) 제제의 존재하의 DNA 상호작용과 (ii) 제제의 부재하의 DNA 상호작용 사이의 차이는 DNA의 3차원 구조를 조절하는 제제의 지표인 방법.
  35. 제1항 내지 제23항 중 어느 한 항에 있어서, 육안 검사에 의해 10kbp 보다 작은 분해능으로 게놈의 3차원 구조를 확인하기 위한 방법.
  36. 삭제
  37. 제1항 내지 제23항 중 어느 한 항에 있어서, 육안 검사에 의해 10 kbp 보다 작은 분해능으로 크로마틴 섬유 구조를 측정하는 것을 확인하기 위한 방법.
  38. 제1항 내지 제23항 중 어느 한 항에 있어서, 육안 검사에 의해 10 kbp 보다 작은 분해능으로 염색체의 소염색체 도메인 구조를 확인하기 위한 방법.
  39. 제1항 내지 제23항 중 어느 한 항에 있어서, 육안 검사에 의해 10 kbp 보다 작은 분해능으로 염색체의 루프 응집체(loop aggregate)/로제트 구조(rosette structure)를 확인하기 위한 방법.
  40. 제1항 내지 제23항 중 어느 한 항에 있어서, 몬테-카를로(Monte-Carlo) 및 브라우니언-동적 시뮬레이션(Brownian-Dynamic simulation)과 비교하는 경우 10kbp보다 작은 분해능으로 염색체의 루프 응집체/로제트 구조를 확인하기 위한 방법.
  41. 제1항 내지 제23항 중 어느 한 항에 있어서, 상호작용 사이의 유전적 거리의 함수로서 몬테-카를로 및 브라우니언-역학 시뮬레이션으로부터의 크기조정 거동(scaling behaviour)과 DNA 자체 내 긴-범위 상관관계의 크기 조정을 비교하여 상호작용의 빈도의 크기 조정 거동으로부터 10kbp 보다 작은 분해능을 갖는 염색체의 루프 응집체/로제트 구조를 확인하기 위한 방법.
  42. 삭제
  43. 삭제
KR1020167015969A 2013-11-18 2014-11-18 삼차원 dna 구조에서 뉴클레오티드 서열의 상호작용을 분석하기 위한 방법 KR102332522B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1320351.8 2013-11-18
GBGB1320351.8A GB201320351D0 (en) 2013-11-18 2013-11-18 Method
PCT/IB2014/002485 WO2015071748A1 (en) 2013-11-18 2014-11-18 Method for analysing the interaction of nucleotide sequences in a three-dimensional dna structure

Publications (2)

Publication Number Publication Date
KR20160079120A KR20160079120A (ko) 2016-07-05
KR102332522B1 true KR102332522B1 (ko) 2021-11-29

Family

ID=49883800

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167015969A KR102332522B1 (ko) 2013-11-18 2014-11-18 삼차원 dna 구조에서 뉴클레오티드 서열의 상호작용을 분석하기 위한 방법

Country Status (9)

Country Link
US (1) US10934575B2 (ko)
EP (1) EP3071710B1 (ko)
JP (1) JP2016537029A (ko)
KR (1) KR102332522B1 (ko)
CN (1) CN105992825A (ko)
AU (1) AU2014349817B2 (ko)
CA (1) CA2928012C (ko)
GB (1) GB201320351D0 (ko)
WO (1) WO2015071748A1 (ko)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2554572B (en) * 2015-03-26 2021-06-23 Dovetail Genomics Llc Physical linkage preservation in DNA storage
WO2016207647A1 (en) * 2015-06-24 2016-12-29 Oxford Biodynamics Limited Epigenetic chromosome interactions
US10900031B2 (en) * 2015-10-19 2021-01-26 Zhejiang Annoroad Bio-Technology Co. Ltd. Method for constructing high-resolution single cell Hi-C library with a lot of information
WO2017096158A1 (en) * 2015-12-04 2017-06-08 10X Genomics, Inc. Methods and compositions for nucleic acid analysis
GB201608000D0 (en) 2016-05-06 2016-06-22 Oxford Biodynamics Ltd Chromosome detection
EP3954771A1 (en) 2016-05-13 2022-02-16 Dovetail Genomics, LLC Recovering long-range linkage information from preserved samples
WO2018100381A1 (en) * 2016-12-01 2018-06-07 Oxford Biodynamics Limited Application of epigenetic chromsomal interactions in cancer diagnostics
WO2019005763A1 (en) * 2017-06-26 2019-01-03 Phase Genomics Inc. METHOD FOR REGROUPING DNA SEQUENCES
CN108300767B (zh) * 2017-10-27 2021-08-20 清华大学 一种核酸复合体中核酸区段相互作用的分析方法
CN108197431B (zh) * 2018-01-24 2022-04-05 清华大学 染色质相互作用差异的分析方法和系统
EP3746566A1 (en) * 2018-01-31 2020-12-09 Dovetail Genomics, LLC Sample prep for dna linkage recovery
EP3847261A1 (en) * 2018-09-05 2021-07-14 Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft A method for engineering synthetic cis-regulatory dna
EP3973070A1 (en) * 2019-05-22 2022-03-30 Oxford Nanopore Technologies PLC Protocol for detecting interactions within one or more dna molecules within a cell
ES2922973T1 (es) 2020-07-20 2022-09-22 Enanta Pharm Inc Peptidos funcionalizados como agentes antivirales
US11384090B2 (en) 2020-11-23 2022-07-12 Enanta Pharmaceuticals, Inc. Spiropyrrolidine derived antiviral agents
WO2022109360A1 (en) 2020-11-23 2022-05-27 Enanta Pharmaceuticals, Inc. Novel spiropyrrolidine derived antiviral agents
US11352363B1 (en) 2020-11-23 2022-06-07 Enanta Pharmaceuticals, Inc. Spiropyrrolidine derived antiviral agents
CN113215141A (zh) * 2021-02-23 2021-08-06 华南农业大学 细菌hi-c基因组及质粒构象捕获方法
US11319325B1 (en) 2021-05-11 2022-05-03 Enanta Pharmaceuticals, Inc. Macrocyclic spiropyrrolidine derived antiviral agents
US11339170B1 (en) 2021-07-23 2022-05-24 Enanta Pharmaceuticals, Inc. Spiropyrrolidine derived antiviral agents
US11325916B1 (en) 2021-07-29 2022-05-10 Enanta Pharmaceuticals, Inc. Spiropyrrolidine derived antiviral agents
GB202111195D0 (en) * 2021-08-03 2021-09-15 Cergentis B V Method for targeted sequencing
CN113946730B (zh) * 2021-10-19 2023-03-17 四川大学 一种基于基因数据的染色质层次结构分析的可视化方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007004057A2 (en) * 2005-07-04 2007-01-11 Erasmus University Medical Center Chromosome conformation capture-on-chip (4c) assay
WO2008084405A2 (en) 2007-01-11 2008-07-17 Erasmus University Medical Center Circular chromosome conformation capture (4c)
WO2012005595A2 (en) 2010-07-09 2012-01-12 Wouter Leonard De Laat V3-d genomic region of interest sequencing strategies

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7348178B1 (en) * 1994-03-14 2008-03-25 New York University Medical Center Recombinant adenoviral vector system
WO2014168575A1 (en) 2013-04-11 2014-10-16 Sahlén Pelin Targeted chromosome conformation capture

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007004057A2 (en) * 2005-07-04 2007-01-11 Erasmus University Medical Center Chromosome conformation capture-on-chip (4c) assay
JP2009500031A (ja) 2005-07-04 2009-01-08 エラスムス ユニバーシティ メディカル センター 染色体コンフォメーションキャプチャ−オン−チップ(4c)アッセイ
WO2008084405A2 (en) 2007-01-11 2008-07-17 Erasmus University Medical Center Circular chromosome conformation capture (4c)
JP2010515449A (ja) 2007-01-11 2010-05-13 エラスムス ユニバーシティ メディカル センター 環状染色体コンホメーション捕捉(4c)
WO2012005595A2 (en) 2010-07-09 2012-01-12 Wouter Leonard De Laat V3-d genomic region of interest sequencing strategies
JP2013530709A (ja) 2010-07-09 2013-08-01 セルゲンティス ビー.ブイ. 対象の3−dゲノム領域配列決定戦略

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Nature Genetics volume 38, pages 1348-1354 (2006. 11.)

Also Published As

Publication number Publication date
AU2014349817B2 (en) 2020-11-12
CA2928012C (en) 2023-05-16
US10934575B2 (en) 2021-03-02
US20160289738A1 (en) 2016-10-06
CN105992825A (zh) 2016-10-05
EP3071710B1 (en) 2019-05-15
KR20160079120A (ko) 2016-07-05
AU2014349817A1 (en) 2016-05-19
WO2015071748A1 (en) 2015-05-21
EP3071710A1 (en) 2016-09-28
GB201320351D0 (en) 2014-01-01
JP2016537029A (ja) 2016-12-01
CA2928012A1 (en) 2015-05-21

Similar Documents

Publication Publication Date Title
KR102332522B1 (ko) 삼차원 dna 구조에서 뉴클레오티드 서열의 상호작용을 분석하기 위한 방법
AU2021204024B2 (en) RNA-guided human genome engineering
Jathar et al. Technological developments in lncRNA biology
JP5690068B2 (ja) 環状染色体コンホメーション捕捉(4c)
EP3365464B1 (en) Method of analysing dna sequences
EP2083090B1 (en) Nucleic acid interaction analysis
US10900974B2 (en) Methods for identifying macromolecule interactions
US11370810B2 (en) Methods and compositions for preparing nucleic acids that preserve spatial-proximal contiguity information
CN111909991B (zh) 一种捕获rna原位高级结构及相互作用的方法
Knoch A Guided Protocol for Array Based T2C: A High‐Quality Selective High‐Resolution High‐Throughput Chromosome Interaction Capture
Franke The role of higher-order chromatin organization at the SOX9 locus in gene regulation and disease
Belaghzal et al. HI-C 2.0: An Optimized Hi-C Procedure for High-Resolution Genome-Wide Mapping of Chromosome Conformation [preprint]
Belaghzal Let us know how access to this document benefits you.

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant