KR20200066648A - 고효율의 표적화된 원위치 게놈 전체 프로파일링 - Google Patents

고효율의 표적화된 원위치 게놈 전체 프로파일링 Download PDF

Info

Publication number
KR20200066648A
KR20200066648A KR1020207012088A KR20207012088A KR20200066648A KR 20200066648 A KR20200066648 A KR 20200066648A KR 1020207012088 A KR1020207012088 A KR 1020207012088A KR 20207012088 A KR20207012088 A KR 20207012088A KR 20200066648 A KR20200066648 A KR 20200066648A
Authority
KR
South Korea
Prior art keywords
dna
chromatin
run
cut
cells
Prior art date
Application number
KR1020207012088A
Other languages
English (en)
Inventor
스티븐 헤니코프
오쿠 하티스 세다 카야
테리 돈 브라이슨
피터 제임스 스케네
Original Assignee
프레드 헛친슨 켄서 리서치 센터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=65811500&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR20200066648(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 프레드 헛친슨 켄서 리서치 센터 filed Critical 프레드 헛친슨 켄서 리서치 센터
Publication of KR20200066648A publication Critical patent/KR20200066648A/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6872Intracellular protein regulatory factors and their receptors, e.g. including ion channels
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6804Nucleic acid analysis using immunogens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6841In situ hybridisation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/705Fusion polypeptide containing domain for protein-protein interaction containing a protein-A fusion
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2522/00Reaction characterised by the use of non-enzymatic proteins
    • C12Q2522/10Nucleic acid binding proteins

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Saccharide Compounds (AREA)

Abstract

세포 내에서 염색질 DNA의 서열에 대한 관심의 염색질 관련 인자의 결합을 검출하는 방법으로서, 투과화된 세포 또는 핵을 관심의 염색질 관련 인자를 특이적으로 인식하는 특이적 결합제와 접촉시키는 단계로, 특이적 결합제는 불활성이거나 활성화 가능한 트랜스포좀인 뉴클레아제에 연결되는 것인 단계; 뉴클레아제 또는 트랜스포사제를 활성화시킴으로써, 관심의 염색질 관련 인자에 결합된 염색질 DNA의 서열을 절제하는 단계; 절제된 DNA를 단리하는 단계; 및 절제된 DNA의 서열을 결정함으로써, 세포에서 염색질 DNA의 서열에 대한 관심의 염색질 관련 인자의 결합을 검출하는 단계를 포함하는 방법.

Description

고효율의 표적화된 원위치 게놈 전체 프로파일링
관련 출원에 대한 상호 참조
본 출원은 2017년 9월 25일자로 출원된 미국 가출원 제62/562,918호의 이익을 주장하며, 이는 구체적으로 그 전문이 본원에 참고로 포함된다.
기술 분야
본 개시 내용은 염색질 프로파일링 방법에 관한 것이다. 구체적으로, 본 개시 내용은 전사 인자 및 뉴클레오솜과 같은 DNA 결합 단백질을 프로파일링하는 방법에 관한 것으로, 여기서 트랜스포사제 또는 뉴클레아제와 같은 효소에 의한 항체 표적화 제어 절단은 DNA 서열 분석을 위해 결합된 DNA를 방출한다.
전사 인자(TF: transcription factor)가 DNA 상의 자신의 결합 부위에 작용함으로써 유전자 발현 패턴을 유도하고, 따라서 게놈 전체(genome-wide) TF 맵핑은 개별 연구자 및 대규모 인프라 프로젝트 모두에 대한 중심 목표가 되었다. TF 프로파일링은 가장 일반적으로 30년 이전에 처음 소개된 이후로 거의 변하지 않은 프로토콜인 염색질 면역 침전법(ChIP: Chromatin immunoprecipitation)을 사용하여 수행된다(Solomon and Varshavsky, 1985). 세포를 포름알데히드로 가교 결합시키고, 염색질을 단편화하고 가용화하고, 항체를 첨가하고, DNA 추출을 위해 항체 결합된 염색질을 회수한다. DNA 맵핑 기술의 계속적인 발전은 X-ChIP(포름알데히드 가교 결합 ChIP)의 사용을 혁명적으로 변화시켰으며, ChIP-seq를 통해 TF의 염기쌍 분석 맵핑이 실현 가능해졌다(Rhee and Pugh, 2011; Skene and Henikoff, 2015; He et al., 2015).
전사 인자 및 다른 단백질과 직접적으로 물리적 상호 작용을 하는 특정 DNA 부위를 염색질 면역 침전에 의해 단리하여 생체 내에서 관심 단백질에 결합된 표적 DNA 부위의 라이브러리를 생성할 수 있다. 대량 병렬 서열 분석의 출현으로 라이브러리를 신속하게 분석하고 전체 게놈 서열 데이터베이스에 맵핑하여 DNA와 임의의 단백질의 상호 작용 패턴, 또는 임의의 후성 유전적 염색질 변형 패턴을 결정할 수 있다. 이는 전사 인자, 폴리머라제 및 전사기구, 구조 단백질, 단백질 변형, 및 DNA 변형과 같은 일련의 ChIP 가능 단백질 및 변형에 적용될 수 있다. ChIP 서열 분석(ChIP-seq)은 단백질이 예를 들어 유전자 발현을 조절하기 위해서, DNA와 어떻게 상호 작용하는 지를 결정하는 데 사용될 수 있다. ChIP-seq 기술은 현재 주로 혼성화 배열이 필요한 ChIP-칩의 대안으로 간주한다. 배열이 고정된 프로브 개수에 제한되기 때문에 이것은 반드시 약간의 편향을 가져온다. ChIP-seq의 개선은 전체 게놈이 단편화되어 면역 침전을 위한 가용성 추출물을 생성하는 동안 생체 내 패턴을 보존하기 위해 가교 결합 단계를 유지한다. 그러나 가교 결합은 에피토프 마스킹을 촉진할 수 있고 위양성 결합 부위를 생성할 수 있다(Teytelman et al., 2013; Park et al., 2013; Jain et al., 2015; Baranello et al., 2016; Meyer and Liu, 2014). 또한, ChIP은 정전기 접촉을 방해하지 않는 이온 조건을 사용하여 가교 결합 없이 수행될 수 있다(Kasinathan et al., 2014). '천연(Native)' ChIP는 X-ChIP 방법과 유리하게 비교되는 감도 및 특이성이 절충된 직접적인 단백질-DNA 상호 작용의 맵을 제공한다. 천연 ChIP는 또한 에피토프 마스킹의 문제를 최소화하고 X-ChIP에 비해 효율을 향상시켜 적은 출발 세포 수에 보다 적합하게 만든다(O'Neill et al., 2006; Brind'Amour et al., 2015). 그러나 단백질-DNA 복합체의 불완전한 추출 효율 및 결합의 잠재적인 손실의 문제가 남아있다. 또한, 가용화는 모든 염색질을 항체에 노출시켜 신호 대 잡음을 제한하고 특정 염색질 특징을 식별하기 위해 추가 서열 분석이 필요한 비특이적 배경을 생성한다. 이러한 편향 및 비효율성으로 인해, ChIP는 많은 수의 세포를 필요로 하므로, 예를 들어 제한된 수의 1차 세포 또는 소량의 조직이 있는 경우에는 적합하지 않다. 따라서 새롭고 더 나은 비-CHIP 기반 방법이 필요하다. 본 개시 내용은 그러한 요구를 충족시킨다.
실시 양태는 첨부 도면과 함께 다음의 상세한 설명에 의해 쉽게 이해될 것이다. 실시 양태는 첨부 도면의 그림에 제한이 아닌 예로서 도시된다.
[도 1A-1D]는 본원에 개시된 CUT&RUN 방법이 TF-DNA 복합체의 제한된 분해물을 생성한다는 것을 보여준다. [도 1A]; CUT&RUN 전략의 개략도. 자성 비드에 부착된 핵은 핵공을 통해 확산되는 항체(또는 선택적으로 1차 및 2차 항체) 및 단백질 A-MNase(pA-MN)로 연속적으로 처리될 수 있다. MNase 절단을 활성화시키기 위해 Ca++ 첨가 후, 단편이 방출되어 핵 밖으로 확산된다. 상등액으로부터 추출된 DNA를 사용하여 페어드-엔드(paired-end) 서열 분석을 위한 라이브러리를 제조한다. [도 1B]; CUT&RUN은 염색질 입자를 절단하고 에스. 세레비지에(S. cerevisiae) 핵으로 방출하며, 여기서 내인성 H2A 유전자는 H2A-3XFLAG로 대체되고, CUT&RUN에 적용되고, Ca++ 중 0℃에서 지시된 시간 동안 인큐베이션되었다. 불용성(in) 및 가용성(sol) 분획으로부터 추출된 DNA를 1% 아가로스 겔에서 전기영동시켰다. No 1°Ab(1°Ab 없음) 대조군을 1차 마우스 항-FLAG 항체를 첨가하지 않은 것을 제외하고는 10분 동안 동시에 분해시켰다. [도 1C]; 명시된 TF 샘플의 서열 분석에서 맵핑된 페어드-엔드 리드(read)의 크기 분포. 비교를 위해 H2A 크기 분포가 포함된다. 염기 쌍의 각 길이 스텝에서 모든 포인트의 합이 1이 되도록 데이터를 정규화한다. [도 1D]; ORGANIC ChIP-seq(약 2천만~3천만 개의 맵핑된 페어드-엔드 리드) 및 표준 ChIP-seq(Paul et al., 2015)(약 500만 개의 Abf1 및 약 1억 2600만 개의 Reb1 맵핑된 단일-말단 50 bp 리드)와 비교하여 120 bp 미만 및 150 bp 초과의 단편 길이 클래스를 나타내는 Abf1 및 Reb1 샘플(트랙당 약 2 ~ 3백만 개의 맵핑된 페어드-엔드 리드)에 대한 시간 경과 프로파일. 음성 대조군 트랙은 1차 항체(No 1°Ab)를 제거한 결과를 나타낸다. 각 TF 및 단편 크기 그룹 내에서, Y 축 부류는 정규화된 카운트를 나타내는 IGV에 의해 자동 스케일링되며 단편 크기 클래스가 중첩된다. 점은 유의한 Abf1(위) 및 Reb1(아래) 모티프의 위치를 표시한다. 이 영역은 염색체 3에서 가장 큰 Abf1 모티프 클러스터를 갖는 것으로 선택되었다.
[도 2A 및 2B]는 CUT&RUN의 정확성과 강건성이 ChIP-seq와 유리하게 비교되는 것을 보여준다. 1" 내지 32" 시간 경과 샘플을 풀링하고 120 bp 미만 및 150 bp 초과 크기 클래스로 분리하는 단일 실험(20160630)의 CUT&RUN 데이터세트의 Abf1(도 2A) 및 Reb1(도 2B) 히트 맵(왼쪽). 또한 120 bp 미만 크기 부류의 ORGANIC ChIP-seq(중간) 및 표준 ChIP-seq 데이터세트(오른쪽)를 나타낸다. Abf1은 약 10 bp 이격된 2개의 DNA 결합 도메인을 갖는 반면(Cho et al., 1995), Reb1은 단일 Myb 유사 DNA 결합 도메인을 갖는다(Morrow et al., 1990). MNase 분해 후 Abf1 염색질의 가용화는 특이성과 감도 사이의 최상의 균형을 얻기 위해 600 mM NaCl을 필요로 하였지만, Reb1의 경우 80 mM이 가장 좋은 결과를 얻었으며(Kasinathan et al., 2014), 이는 비교에 사용된 데이터세트이다. ORGANIC와 ChIP-exo 및 ChIP-chip의 이전의 비교(Kasinathan et al., 2014)에서와 같이 통계적으로 유의미한 모든 Abf1 및 Reb1 모티프 세트는 감도(정확한 TF에 의한 부위의 점유) 및 특이성(부정확한 TF의 부위로부터 배제)을 판단하기 위한 '최적 표준'으로 간주된다. 정렬된 프로파일링 데이터는 디스플레이를 위해(Abf1과 Reb1 부위가 서로 50 bp 이내인 81개 부위를 제거) 동일한 TF(위) 및 다른 TF(아래)에 대한 모티프를 중심에 두고 배향되었고 log2 스케일링 및 대비 = 5를 이용한 Java Treeview를 사용하여 120 bp 미만의 데이터세트의 -1 kb 내지 + 1 kb 범위의 평균 픽셀 밀도로 정렬하였다. CUT&RUN(120 bp 미만의 단편을 기반으로 함)과 ChIP-seq에 대해 독립적으로 정렬을 수행하였으며, 이 경우에 측면 영역에 대해 점유된 부위의 대략적인 비율이 분명해지고 상단 패널(정확한 TF)과 하단 패널(부정확한 TF)의 비교는 데이터세트에 대한 감도/특이성 균형을 반영한다. ChIP-seq 데이터를 기반으로 하는 위치 특이적 점수 행렬(PSSM: position-specific scoring matrix)을 사용하여 에스. 세레비지에 게놈의 MAST 검색을 통해 부위를 결정했지만 CUT&RUN 데이터를 기반으로 하는 PSSM을 이용한 MAST를 사용하여 유사한 결과를 얻었다.
[도 3A-3C]는 CUT&RUN이 TF 결합 부위를 고해상도로 맵핑함을 보여준다. [도 3A]; 단편 말단의 맵핑은 결합된 1"~32" 데이터세트로부터 정규화된 모든 염기쌍 카운트를 플롯팅하여 게놈 전체에 배향되고 정렬된 모티프에서 평균을 낸 Abf1 및 Reb1 CUT&RUN 데이터세트에 대해 깊은 '구멍'과 가파른 '벽'을 보여준다(도 2 참조). 상류 및 하류 '기울기'에서 명백한 약 10 bp 주기성을 갖는 톱니 패턴은 [도 3A]에 나타낸 1 bp 해상도 프로파일과 11 bp 슬라이딩 윈도우로 평활화된 동일한 프로파일 사이의 차이에 대한 [도 3B] 자기 상관 분석으로 확인되며, 이는 또한 평균 G + C 함량(가는 선)에서 상응하는 주기성이 없음을 보여준다. [도 3C]는 [도 3A]와 동일하지만, 11 bp 슬라이딩 윈도우로 평활화되어 더 큰 규모로 표시된다. Reb1 주변의 기울기가 +150 및 -150에서 감소를 보인다는 사실은 ORGANIC 입력 데이터로부터 150 bp 초과의 크기 부류에 근거하여 아래에 나타낸(Nucls(뉴클레오좀), 임의적인 Y축) 단계별 뉴클레오솜의 존재를 반영할 가능성이 있다(Kasinathan et al. , 2014).
[도 4A-4C]는 CUT&RUN이 큰 이동성 염색질 복합체를 정확하게 맵핑함을 보여준다. [도 4A]; 2개의 MNase 분해 시점(2.5' 및 10', 샘플당 평균 2,200만 리드)에 대한 Mot1 ORGANIC 데이터와 정렬된, 1차 항체 없음(1°Ab 없음) 음성 대조군을 포함하는 Mot1 CUT&RUN 시간 경과 실험(샘플당 평균 ~ 300만 페어드-엔드 리드)을 나타내는 대표적인 트랙(Zentner and Henikoff, 2013). 점선으로 도시된 TBP 부위는 Mot1 피크가 TBP 피크 최댓값의 바로 상류에 있다는 것을 나타낸다. [도 4B]; 절대 정량화를 나타내는 스파이크-인(spike-in) 정규화된 120배 범위의 Sth1 CUT&RUN 분해에 대한 점유 프로파일. [도 4C]; Sth1 ORGANIC 프로파일(약 1500만 리드)은 CUT&RUN 5초 샘플(약 2백만 리드)과 일치를 보여준다. 120 bp 미만의 동일한 CUT&RUN 5초 프로파일이 두 패널(도 4B)과 (도 4C) 모두에서 서로 다른 스케일로 나타냄에 주의한다.
[도 5A-5D]는 CUT&RUN이 드문 매우 불용성인 에스. 세레비지에 키네토코어 복합체를 맵핑함을 보여준다. [도 5A]; 지시된 시간 동안 분해를 정지시킨 후, 샘플을 반으로 나누고 가용성 분획 및 총 DNA를 모두 추출하였다. 라이브러리 제조 전에 AMPure 비드로 총 DNA에서 큰 단편을 제거하였다. Cse4 및 H2A 트랙이 동일한 Y 축 스케일에 있는 에스. 세레비지에 동원체 1에 대해 정규화된 카운트를 나타낸다. 동원체에 대해 유사한 최댓값도 게놈 전체에서 나타났다. [도 5B]는 [도 5A]와 동일하지만 동원체에서 5kb 간격으로 확대되었다. [도 5C]; 불용성 Cse4 및 H2A의 점유, 여기서 중점 주위에 정렬된 16개의 모든 에스. 세레비지에 동원체의 중앙값에 대한 log2 (불용성) = log2 (총)-log2 (가용성) = log2 (총/가용성)로 정의된다. 공개된 X-ChIP-seq 프로파일(Pekgoz Altunkaya et al., 2016)은 비교를 위해 동일한 척도로 나타낸다(왼쪽). 별표 : log2(ChIP/입력)는 2개의 복제물에서 평균을 냈다 [도 5D]; 지시된 시간 동안 분해된 포름알데히드 가교 결합된 세포에 적용된 Cse4 및 H2A CUT&RUN의 정규화된 카운트 프로파일.
[도 6A-6C]는 CUT&RUN이 CTCF의 고해상도 풋프린트를 맵핑한다는 것을 보여준다. [도 6A]; ENCODE CTCF ChIP(GSM749690), CTCF ChIP-exo, 및 CUT&RUN에서 1천만 개의 무작위로 샘플링된 리드에 대한 게놈 유전자 좌의 대표적인 신호. 상단 패널에서 y 축은 CUT&RUN의 높은 동적 범위를 나타내는 모든 데이터세트에 대해 동일하다. 하단 패널에서 y 축은 개별적으로 설정된다. [도 6B]; 인간 K562 세포에서 120 bp 미만(단편 말단 포함)과 150 bp 초과의 부류로 분리된 CUT&RUN 풀링된 데이터세트(7.5분 내지 45분) 및 CTCF에 대한 ENCODE X-ChIP-seq 및 고해상도 X-ChIP-seq(Skene 및 Henikoff) , 2015)의 히트 맵. 데이터가 DNaseI 과민성 부위에서 발견되고 게놈 위치에 의해 정렬된 CTCF 모티프에 중심을 두고 그로 배향된 편향되지 않은 접근법에 의해 부위를 결정하였다. 상류 및 하류 뉴클레오솜의 비대칭 방출은 모티프의 뉴클레오솜 어느 한쪽에 대한 접근을 제어하는 에피토프 위치로부터 비롯될 수 있다. [도 6C]; 상기와 같이 부위에 중심을 둔 CUT&RUN 분해 시간 경과로 인한 120 bp 미만의 단편으로부터의 말단 위치의 평균 플롯. 데이터는 ± 1 kb 측면에 위치한 영역 내에서 최대 신호의 백분율로 나타낸다.
[도 7A 및 7B]는 CTCF가 모든 부위에서 강력한 풋프릿트에도 불구하고 CUT&RUN 피크의 서브 세트에 직접적으로 결합함을 보여준다. [도 7A]; 염색질은 천연 조건하에서 단편화하고 가용화하고 천연 입력으로서 직접 서열 분석하거나 CTCF 결합된 염색질은 면역 침전시키고 서열 분석하였다. ENCODE X-ChIP-seq는 비교 목적으로 분석하였다. 천연 조건하에서 CTCF 결합의 피크를 식별하고 CTCF 모티프와 가장 잘 일치하는 것을 중심으로 하였다(JASPAR 데이터베이스 MA0139.1, jaspar.genereg.net/). 데이터는 천연 ChIP DNA 단편(20~75 bp) 및 CUT&RUN(120 bp 미만)에 대한 히트 맵으로 이러한 부위(-1 내지 +1 kb)에 대해 플롯팅하였으며 천연 CTCF ChIP 점유(중심 영역(-30 내지 +30 bp)에 대한 합계 빼기 측면(-1000 내지 -700 및 +700 내지 +1000 bp)에 대한 합계)로 정렬하였다. 아래 그래프는 피크 호출된 부위(-30 내지 +30 bp)에서 상이한 기술에 대한 서열 분석 카운트의 누적 백분율을 보여주며, 이는 CTCF 모티프와의 유사성에 따라 순위가 매겨진다. 이는 천연 ChIP 피크에서 염색질 프로파일링 기술 사이에서 높은 일치성을 보여준다. 천연 ChIP 및 CUT&RUN에 대한 동적인 범위 스케일은 입력 및 ENCODE 패턴을 나타내는데 필요한 천연 입력 및 ENCODE X-ChIP에 대한 것보다 ~30~40배 높다는 것에 주목한다. [도 7B]; [도 7A]에 따른 처리를 통해 CUT&RUN 피크 호출된 부위에 대해 플롯팅된 데이터. 누적 분포는 CUT&RUN 부위에 대한 더 낮은 모티브 점수로의 이동을 보여준다(CUT&RUN과 천연 ChIP 사이의 분리 참조).
[도 8A-8C]는 CUT&RUN이 천연 ChIP와 함께 직접 및 간접 3D 접촉 부위를 식별할 수 있음을 보여준다. [도 8A]; CTCF 및 CTCF ChIA-PET 단편(GSM1872886; 15보다 큰 점수)에 대한 CUT&RUN(120 bp 미만), 천연 ChIP(20~75 bp) 데이터를 나타내는 전형적인 게놈 영역. ChIA-PET 단편은 직접 상호 작용(천연 ChIP 피크 중첩) 또는 간접 상호 작용(CUT&RUN 피크만 중첩)으로 부여된다. [도 8B]; 피크 호출된 부위는 직접(천연 ChIP에만 존재) 또는 간접(CUT&RUN에만 존재)으로 분리되었다. 직접 부위 또는 동일한 수의 무작위 게놈 위치와 교차하는 Hi-C 단편이 식별되었다. 그런 후 Hi-C 상호 작용 단편을 Hi-C 원시 신호와 비교하여 간접 부위 및 CUT&RUN 신호와 교차시켰다. 데이터는 CUT&RUN 점수로 순위 매기고 창 크기 1500의 이동 평균으로 플롯팅하였다. [도 8C]; 직접 부위를 함유한 ChIA-PET 단편을 식별하고 상호 작용 단편을 상기와 같이 직접 피크, 간접 피크 또는 무작위 위치와 교차시켰다. 이러한 부위와 중첩되지 않는 상호 작용 단편은 비분류로 분류하였다. 박스 플롯은 상호 작용 단편에서 관찰된 접촉에 대한 CUT&RUN 점수를 나타낸다.
[도 9A 및 9B]는 CUT&RUN이 단백질-DNA 상호 작용의 간단한 정량화를 허용한다는 것을 보여준다. [도 9A]; K562 세포에서 CTCF에 대해 CUT&RUN의 분해 시간 경과를 수행하였다. 방출된 단편의 정량을 허용하기 위해, 절단 반응 후 1 ng의 초파리 DNA를 첨가하였다. 120 bp 미만의 서열 분석된 단편의 평균 플롯을 DNaseI 부위 내에서 발견된 CTCF 모티프 위에 중심을 두었다. 데이터는 파리 리드 수(스파이크-인 정규화) 또는 총 인간 리드 수(표준 정규화)에 정규화하였다. [도 9B]: 출발 재료의 역가 측정을 이용하여 CTCF 결합 게놈 전체를 맵핑하였다. 스파이크-인 또는 표준 정규화를 사용하여 120 bp 미만의 서열 분석된 단편에 대해 히트 맵 및 평균 플롯을 생성하였다. 데이터는 DNaseI 부위 내에서 발견된 CTCF 모티프 위에 중심을 두었다.
[도 10]은 CUT&RUN 및 ORGANIC ChIP가 정성적으로 유사한 TF 점유 프로파일을 생성함을 보여준다. 1”내지 32”및 64”내지 128”시간 경과 샘플로부터 풀링된 CUT&RUN 데이터 및 ≤120 bp 및 ≥150 bp 단편 길이에 대한 ORGANIC 및 표준 ChIP-seq에 대한 Abf1 및 Reb1 프로파일의 대표적인 예. MNase-seq 프로파일은 회색으로 표시된다. 체크 표시(tick)는 중요한 Abf1(위) 및 Reb1(아래) 모티프의 위치를 표시한다. Y 축은 IGV에 의해 각 영역 내에서 자동 스케일링하였다.
[도 11A 및 11B]는 CUT&RUN DNA 방출의 동역학을 보여준다. [도 11A]; 이 연구에 기술된 2가지의 효모 TF에 대해 0℃에서 1~128초 분해 시간 시리즈에 걸쳐 펠렛 분획(샘플당 10 ㎕)의 DNA의 1% 아가로스 겔에서의 전기영동. 이들 부위는 효모 게놈에서 평균 약 10kb 떨어져 있기 때문에, Abf1 및 Reb1 둘 다에 대해 분해 시간이 1초 내지 128초의 분해 시간에 따라 점진적으로 감소하는 단편 크기를 관찰할 수 있다. 인간 게놈에서 CTCF 부위 사이의 평균 거리는 종래의 겔 분석을 사용하여 절단을 관찰하기에는 너무 크다. [도 11B]; 피코그린(Picogreen) 형광 측정에 기초한 DNA 방출 백분율: [상등액]/([상등액] + [펠렛]) 100. 총 수율 약 500 ng/샘플.
[도 12A-12C]는 상등액에서 결합된 TF의 정량적 회수를 보여준다. [도 12A]; AMPure 비드에서 큰 단편을 제거한 후 상등액 분획(가용성)을 총 DNA와 비교한 것을 제외한 본원에 기술된 단일 실험으로부터의 CUT&RUN 데이터의 Abf1 및 Reb1 프로파일의 비교. [도 12B]; [도 12A]에서 높은 TF 점유의 확대된 영역. [도 12C]; CUT&RUN ≤120 bp 분해 데이터의 모티프에 대한 히트 맵 정렬 및 TF 점유에 의한 정렬은 로그 스케일링 및 대비 = 5를 이용한 것을 제외하고는 2를 중심으로 본원에 기술된 바와 같이 수행하였다.
[도 13A-13E]는 CUT&RUN 및 ORGANIC ChIP-seq에 기초한 Abf1 및 Reb1 모티프가 유사하다는 것을 보여준다. MEME 모티프 검색 프로그램은 [도 13A-B] 1"~32" 풀링된 CUT&RUN ≤120 bp 데이터 및 (도 13C) 600 mM Abf1 및 (도 13D) 80 mM Reb1 ORGANIC 데이터에 적용되었으며, 로그-오즈 서열 로고을 나타낸다. CUT&RUN 및 ORGANIC을 사용하여 결정된 모티프 간의 근접한 일치에 유의한다. [도 13E]; 모티프를 이용한 피크 호출의 백분율이다. 각 ≤120 bp 데이터세트에 대해, 유사한 피크 수(엄격한 ~ 650개 및 완화된 ~ 1100개)를 복구하도록 설정된 임계 값을 사용하여 피크를 호출하였다.
[도 14]는 CUT&RUN이 원위치(in situ)에서 절단 동역학을 보여준다. 1" 내지 32" 및 64" 및 128" 시간 경과 샘플을 풀링하고 ≤120 bp(왼쪽) 및 ≥150 bp(오른쪽) 크기 부류로 분리한 단일 실험(20160630)에서 CUT&RUN 데이터의 Abf1(왼쪽) 및 Reb1(오른쪽) 히트 맵의 비교. Treeview를 로그 스케일링 및 대비 = 3으로 사용하였다는 점을 제외하고는 TF 점유에 의한 모티프 정렬 및 순서 매김은 이전에 설명된 바와 같이 수행하였다. 분해 시간이 증가하면 TF가 더 많이 방출되어 동적 범위에서 눈에 띄는 변화가 없이 ≥150 bp 단편의 '구멍'이 깊어진다. CUT&RUN은 입자 검출을 위해 MNase-seq보다 훨씬 높은 동적 범위를 보여준다(하단 패널과 상단 패널 비교).
[도 15A-15B]는 Mot1에 대한 CUT&RUN 및 ORGANIC 프로파일을 보여준다. [도 15A]; 2개의 CUT&RUN 및 2개의 ORGANIC 시점의 히트 맵은 TBP 부위를 주변에 정렬되며 각 부위를 둘러싼 2 kb 영역에 걸쳐 Mot1 점유를 증가시켜 순서 매겨진다. 킨다. [도 15B]; 120배 범위에 걸친 Mot1 CUT&RUN 분해에 대한 점유 프로파일로, 스파이크-인에 정규화되었으며, 절대 정량화를 나타낸다.
[도 16A-16B]는 Sth1에 대한 CUT&RUN 및 ORGANIC 프로파일을 보여준다. [도 16A]; 동일한 곡선 하 면적이 존재하도록 정규화된 Sth1 CUT&RUN AMPure 비드 여과된 총 DNA 단편의 길이 분포. 시간 경과에 따라 균일한 분해 및 방출이 관찰된다. 두 개의 생물학적 복제물로부터의 데이터를 합한다. 항-FLAG 1차 항체 없음(Ab 없음). [도 16B]; Gal4 UAS에 RSC의 맵핑과 일치를 나타내는 Gal1-Gal4 영역(ChrII: 276,000~281,000)의 트랙(UASg, Floer et al., 2010).
[도 17A-17C]는 CUT&RUN이 드문 매우 불용성인 에스. 세레비지에 키네토코어 복합체를 맵핑함을 보여준다. [도 17A]; 항체 및 pA-MN 첨가 후, 샘플을 반으로 나누고, pA-MN을 칼슘으로 활성화시키고, 표준 100 mM NaCl 완충액(-) 또는 2 M NaCl(+)을 함유하는 완충액으로 반응을 정지시켰다. 절대 복구를 반영하기 위해 스파이크-인 정규화를 사용하는 염색체 1에 대한 트랙을 표시한다. [도 17B]; Cse4 및 H2A 고염 대 저염 추출된 단편의 로그 비율의 근접도. [도 17C]; 중점 주위에 정렬된 16개의 모든 에스. 세레지에 동원체의 중앙값에 대한 고염 대 저염 추출된 단편의 로그 비율.
[도 18]은 CUT&RUN이 X-ChIP-seq를 재현하지만 동적 범위가 더 높은 것을 보여준다. 이전에 확인된 CTCF 결합 부위에서 게놈 전체 동적 범위를 직접 비교하기 위해, ENCODE CTCF X-ChIP-seq(GSM749690) 및 CUT&RUN 데이터세트에서 천만 개의 리드를 무작위로 선택하고 ENCODE 피크 호출된 부위(GSM749690_narrowPeak)에서 플롯하였다. 상단 플롯은 이러한 부위에 대한 원시 카운트의 평균(mean average)을 보여주며 아래 히트 맵은 게놈 위치에 따라 순서 매겨진다.
[도 19A-19D]는 CUT&RUN이 얼음 위에서 수행될 때 낮은 배경을 나타냄을 보여준다. 프로토콜 최적화 과정에서, 다양한 온도에서 절단 반응을 수행하였다. [도 19A]; 처음에 MNase 반응에 37℃를 사용였다. 그러나 데이터를 면밀히 분석하여 낮은 게놈 전체의 배경 밀도로 CTCF를 그의 실제 부위에서 명확하게 맵핑했음에도, 임의의 DNase1 부위에서 특이적 배경을 가짐을 보였다. 특이적 배경은 핵 주위로 확산되고 염색질의 접근 가능한 영역을 절단하는 단백질 A-MNase에 의해 여전히 결합되어 있는 유리된 염색질 복합체로부터 발생한다고 판단하였다. [도 19B]; 이 가설을 테스트하기 위해, CTCF 항체 및 단백질 A-MNase가 원위치에서 결합된 후, 제한된 초음파 처리로 핵 외피를 파괴하여 염색질을 큰 반응 부피로 방출시켰다. 파괴된 조건하에서 CUT&RUN을 수행할 때 이 특이적 배경은 더 이상 관찰되지 않았다. [도 19C]; 실온에서 절단 반응을 수행함으로써 이들 염색질 복합체의 확산을 제한하였다. 신호 대 잡음 비는 낮게 시작되었지만 시간이 지남에 따라 증가했으며 8분까지는 잡음과 신호를 구분할 수 없었다. [도 19D]; 그러나 얼음 위에서 반응을 유지함으로써 신호 대 잡음 비는 높고 시간과 무관했다. 따라서, 절단 반응을 위한 온도를 제어함으로써, 낮은 배경이 강건하게 유지될 수 있다.
[도 20A-20C]는 CUT&RUN의 높은 신호 대 잡음 비로 X-ChIP-seq로는 불가능한 DNA 결합 부위의 강건한 식별이 가능하다는 것을 보여준다. K562 세포에서 Myc 및 Max에 대해 CUT&RUN을 수행하고 ENCODE X-ChIP-seq 데이터세트(GSM935410; GSM935539)와 비교하였다. 각 데이터세트에 대해 천만 개의 리드가 무작위로 선택되었으며(도 20A) 전형적인 게놈 영역이 표시된다. Myc에 대해 상이한 항체가 사용되었으므로 정량 비교는 불가능함을 알아야 한다. [도 20B]; CUT&RUN 또는 이전에 ENCODE로 식별된 Myc와 Max 피크 호출된 부위 사이에 중첩을 나타내는 비례 벤 다이어그램. [도 20C]; Max CUT&RUN(n = 20146)으로 식별되는 피크 호출된 부위에서 플롯팅된 CUT&RUN 및 ENCODE X-ChIP-seq 신호를 보여주는 히트 맵. 부위는 Max CUT&RUN 점수로 순위가 매겨졌으며 히트 맵의 동적 범위 변화에 주목해야 한다.
[도 21]은 CUT&RUN이 높은 동적 범위로 밀집된 염색질을 맵핑할 수 있음을 보여준다. 절단 후 모든 DNA를 추출한 후 크기를 선별하거나 절단 단편이 핵 밖으로 확산되도록 하여 K562 세포에서 H3K27me3에 대해 CUT&RUN을 수행하였다. 비교를 위해 ENCODE H3K27me3 X-ChIP-seq(GSM733658) 데이터세트를 분석하였다. 각 데이터세트에 대해 천만 개의 리드를 무작위로 선택하고 일반적인 게놈 영역을 동일하게 스케일링된 하단 패널과 ENCODE 데이터세트에 리스케일링된 하단 패널로 표시한다.
[도 22A 및 22B]는 변형된 천연 ChIP 프로토콜이 완전한 단백질 추출을 허용함을 보여준다. [도 22A]; 다양한 SDS 및 초음파 조건을 갖는 천연 조건하에서 RNA 폴리머라제 II(RNAPII) 및 CTCF의 추출 효율을 테스트하기 위한 웨스턴 블롯팅. [도 22B]; 천연 조건하에서 CTCF의 잠재적인 재분배를 테스트하기 위해, 추출물을 높은 스코어링 모티프(양성), 또는 셔플링된 서열(음성), 또는 세포당 1000개의 복제본에서 601 뉴클레오솜 위치 결정 서열을 갖는 95 bp DNA 프로브와 함께 인큐베이션하였다. ChIP 및 DNA 추출 후, 정량적 PCR을 사용하여 게놈(게놈믹)의 고유 피크 또는 DNA 프로브에 대한 CTCF 결합에 대해 테스트하였다.
[도 23]은 CUT&RUN으로 식별된 피크가 천연 ChIP의 피크보다 더 다양한 모티프 점수 범위를 가지고 있음을 보여준다. 천연 CTCF ChIP(뚜렷한 피크를 함유하지 않는 거짓 양성은 제거되었음) 및 CUT&RUN에서 피크 호출을 수행하였다. 기본 DNA 서열을 양방향으로 100 bp 연장하였고, JASPAR 위치 빈도 매트릭스(MA0139.1)에 대한 최상의 일치 및 점수를 계산하였다. 히스토그램은 모티프 점수의 분포를 나타낸다.
[도 24]는 CUT&RUN이 세포에서 DNA까지 하루 미만을 필요로 한다는 것을 보여준다. CUT&RUN 프로토콜의 개략적인 개요. 세포를 수거하여 콘카나발린 A(Concanavalin A) 코팅된 자성 비드에 결합시킨다. 세포막을 디기토닌으로 투과화하여 특이적 항체가 그의 표적을 찾을 수 있게 한다. 항체와 인큐베이션한 후, 비드를 간단히 세척한 후 pA-MN과 함께 인큐베이션한다. 세포를 0℃로 냉각시키고, Ca2+의 첨가로 분해를 시작한다. 스파이크-인 DNA를 포함하는 킬레이트화에 의해 반응을 정지시키고, 절단에 의해 용액으로 방출된 DNA 단편을 상등액으로부터 추출한다.
[도 25]는 당일 양성 대조군으로서 풍부한 히스톤 에피토프(H3K27me3)의 테이프스테이션(tapestation) 분석을 보여준다. 이 샘플의 나머지는 서열 분석을 위한 라이브러리를 만드는데 사용하였으며 결과는 [도 28]에 나타낸다.
[도 26]은 항-CTCF 항체를 사용한 CUT&RUN 절단된 단편의 테이프스테이션 분석을 보여준다. 이 샘플의 나머지는 서열 분석을 위한 라이브러리를 만드는데 사용하였으며 결과는 [도 29]에 나타낸다.
[도 27]은 신호 대 잡음 변화가 거의 없는 분해 시간에 따른 수율 증가를 보여준다. 스파이크-인 DNA로 스케일링함으로써, 절단된 DNA 단편의 양의 정량적 측정이 가능하다. 대략 20,000개 CTCF CUT&RUN 결합 부위에 대한 평균 신호를 음성 대조군 영역으로서 동일한 수의 비중첩 전사 개시 부위(TSS)와 비교한다. 부위의 중심 또는 TSS에 대해 -50 내지 +50 bp 영역에 대해 스케일링된 신호에서의 스파이크를 합산하였다.
[도 28]은 H3K27me3의 CUT&RUN이 인간 폴리콤 염색질 지형(landscape)을 프로파일링하기 위해 100개의 세포만 필요로 한다는 것을 보여준다. CUT&RUN에 의해 H3K27me3를 프로파일링하기 위한 출발 물질로서 다양한 수의 K562 세포를 사용하였다. 페어드-엔드 25x25 bp 일루미나(Illumina) 서열 분석 및 복제물 제거 후, 750만 리드를 무작위로 선택하여 y 축에 표시된 바와 같이 원시 카운트를 나타내는 베드그래프(bedgraph)를 생성하는데 사용하였다. 비교를 위해, ENCODE XChIP-seq 데이터(GSM733658)를 유사하게 분석하였다.
[도 29]는 CUT&RUN이 인간 CTCF 피크를 설명하기 위해 단지 1000개의 세포와 4백만 개의 리드를 필요로 한다는 것을 보여준다. CUT&RUN을 사용하여 다양한 수의 K562 세포에서 CTCF 결합 부위를 맵핑하였다. 페어드-엔드 서열 분석에 이어, 4백만 개의 비중복 리드를 무작위로 선택하여 y축에 표시된 바와 같이 대로 원시 카운트를 나타내는 베드그래프를 생성하는데 사용하였다. 비교를 위해, ENCODE X-ChIP-seq 데이터(GSM749690)를 유사하게 분석하였다.
[도 30]은 스핀 칼럼 DNA 정제가 크고 작은 단편 모두를 부분적으로 배제한다는 것을 보여준다. 상이한 길이의 DNA 단편에 결합하는 스핀 칼럼의 효율을 테스트하기 위해, 2 ㎍의 10 bp 래더를 칼럼을 통해 정제하고 입력으로서 2 ㎍과 비교하였다. DNA를 10% 폴리아크릴 아미드 겔 전기영동에 의해 분석하고 SYBRgold로 염색하였다. 덴시토메트리를 좌측에 나타낸다. CUT&RUN의 경우 큰 단편을 제거하면 배경이 줄어들지만 작은 단편을 제거하면 DNA 결합 단백질을 프로파일링할 때 회수에 영향을 준다. 따라서, 스핀 칼럼 정제(단계 39-46)는 뉴클레오솜에는 바람직하지만 전사 인자 및 매우 낮은 세포 수에는 덜 바람직할 수 있으며, 이 경우 대안적인 PCI 프로토콜(단계 47-58)이 권장된다.
[도 31A 및 31B]는 CUT&RUN.ChIP가 다중 단백질 복합체의 성분을 효율적으로 맵핑함을 보여준다. [도 31A]; CUT&RUN 상등액에 적용된 ChIP. 표적화된 단백질에 3XFLAG 태그 및 항-FLAG 항체(토끼 항-마우스 2차 항체가 뒤따름, 도시되지 않음)를 사용함으로써, CUT&RUN 상등액에서 회수된 pA-MN/항체 복합체는 FLAG 펩티드의 첨가에 의해 DNA-단백질 복합체와 경쟁한다. 이어서, 제2 항체를 첨가하고 면역 침전물을 단백질 A 자성 비드에 포획한다. [도 31B]; 에스. 세레비지에 뉴클레오솜에 적용된 CUT&RUN.ChIP; 11개의 유전자를 걸치고 있는 영역의 대표적인 예를 도시한다. 1. 3XFLAG-H2A.Z(녹색) 또는 3XFLAG-H2B(파란색)를 사용하여 CUT&RUN을 먼저 수행하였다. 2. 이어서, 입력 및 상등액을 지시된 바와 같이 다양한 히스톤 변형 및 대조군(IgG) 항체를 사용하여 ChIP-seq에 적용하였다. 지형 패턴을 설명하기 위해 프로파일을 자동 스케일링한다. 프로파일 분석(미제시)은 H2A.Z 히스톤 변이체가 활성 유전자의 프로모터보다 풍부하고 히스톤 H4 아세틸화 및 H3K4me3에 대해서는 농축되지만, 이전 연구와 일치하는 H3K36me3에 대해서는 고갈됨을 나타낸다.
[도 32A 및 32B]는 다중 단백질 복합체의 단백질 성분을 확인하기 위한 CUT&RUN.프로테오믹스를 보여준다. [도 32A]; pA-MN-6His의 맵. [도 32B]; CUT&RUN에 의해 방출된 입자의 단백질 정제 및 프로테옴 분석 전략.
[도 33A-33D]는 H3 돌연변이 DMG에서의 H3K27M 혼입이 H3 변이체 의존적임을 보여준다. [도 33A]; 표적 하 절단 및 뉴클레아제를 이용한 방출(CUT&RUN) 프로토콜의 개략도. [도 33B]; 서로 다른 DMG 세포주에서 H3K27M 항체를 사용한 CUT&RUN 데이터를 IGV로 나타낸 것으로, 상단 패널은 최고 신호에 비해 그룹 자동 스케일링되어 있으며 하단 패널은 개별적으로 자동 스케일링되어 있다. [도 33C]; H3 돌연변이 DMG 세포 주에서 H3K27me3 및 H3K27ac 도메인에 존재하는 H3K27M CUT&RUN 신호의 평균(위) 및 히트 맵(아래) 프로파일. [도 33D] 상단: H3 돌연변이 DMG 세포주의 CUT&RUN 반응 상등액으로부터의 단백질 추출물에서 H3K27me3, H3K27M 및 IgG 항체로 수행한 H3K27M 및 H3K27me3에 대한 웨스턴 블로팅.
[도 34A-34C]는 H3 돌연변이 DMG가 독특한 H3K27me3 도메인을 나타낸다는 것을 보여준다. [도 34A]; 표지된 유전자를 나타내는 IGV 트랙. [도 34B]; 정규화에 둔감한 피어슨의 상관관계와 정규화에 민감한 린의 상관관계를 사용하는 DMG 세포주에서 H3K27me3 CUT&RUN에 대한 상관 매트릭스. [도 34C]; 계층적 클러스터링을 사용하여 DMG 세포주 사이에서의 차이를 기반으로 도메인을 분류한 H3K27me3 도메인에 존재하는 H3K27me3 CUT&RUN의 히트 맵으로, 관련 클러스터의 번호는 1-6이다. [도 34A]와 관련하여 WNT6은 클러스터 3에서, WT1는 클러스터 5에서 PRDM1는 클러스터 6에서 확인된다.
[도 35A-35C]는 H3K27me3이 H3 돌연변이 DMG에서 원시 줄기세포 유사 구성을 채택함을 보여준다. [도 35A]; [도 34]에서 식별된 차등 H3K27me3 도메인의 클러스터에 존재하는, 이 보고에 사용된 모든 세포주로부터의 H3K27me3 CUT&RUN의 평균 프로파일(위) 및 히트 맵(아래). [도 35B]: 린의 상관관계를 이용하여 히스톤 야생형(VUMC), 신경 줄기세포(CB660 및 U5), ES 세포(H1) 및 2개의 H3 돌연변이 DMG 세포주에서 게놈 전체 H3K27me3 CUT&RUN을 비교하는 상관 매트릭스. [도 35C]: 지정된 세포주에 특이적이거나 공유된 H3K27me3 도메인의 수, 클러스터 6과 중첩되는 도메인의 수 및 게놈 좌표를 무작위 셔플링한 후 클러스터 6과 중첩되는 도메인 수를 표시하는 막대그래프. 실험과 무작위 중복 사이의 카이 제곱에 의해 도출된 P 값.
[도 36A-36B]는 H3K27M이 H3.3 돌연변이 DMG에서 hESC 및 신경 특이적 유전자의 조합에 혼입됨을 보여준다. [도 36A]; 피어슨 상관관계를 이용하여 히스톤 야생형(VUMC), 신경 줄기세포(CB660 및 U5), ES 세포(H1) 및 2개의 H3 돌연변이 DMG 세포주, 및 히스톤 돌연변이 DMG 세포주에서 H3K27ac에 대한 게놈 전체 CUT&RUN을 비교하는 상관 매트릭스. [도 36B]: H3K27ac가 hESC에 특이적이거나(좌측 상단), hESC 및 NSC에 공유되거나(좌측 하단), hESC에 특이적이거나(우측 하단), H3.3K27M에서만 발견되는(우측 상단) 유전자 좌에서 H3.3K27M에서 H3K27M, 및 H3.3K27M, H1, CB660 및 U5에서 H3K27ac에 대한 CUT&RUN 신호를 나타내는 IGV 트랙.
[도 37A-37C]는 H3K27M이 DMG에서 PRC2를 격리시키지 않음을 보여준다. [도 37A]; H3.3K27M 세포주에서 수행된 H3K27me3, H3K27M, SUZ12 및 MTF2 항체와의 반응으로부터의 CUT&RUN 데이터를 나타내는 IGV. [도 37B]; H3.3K27M-DMG에서 H3K27me3 또는 H3K27M 농축된 영역에서 H3K27me3, H3K27M, SUZ12, 및 MTF2 CUT&RUN의 농축을 보여주는 평균 프로파일. [도 37C]; H3.1K27M-DMG 세포주에서 H3K27me3- 및 H3K27M-농축된 영역에서 SUZ12 및 MTF2의 농축을 나타내는 평균 프로파일.
[도 38]은 H3.3K27M 또는 야생형 H3.3을 발현하는 293T 세포의 H3.3K27M 웨스턴 블롯을 나타낸다. LV = 렌티 바이러스 감염, P = 형질 감염. 숫자는 FLAG 야생형 H3.3을 발현하는 293T에 대한 백분율로서 H3에 대해 정규화된 H3K27me3 밴드 강도의 덴시토메트리 값을 나타낸다.
[도 39A-39B]는 H3K27M에 대한 감도를 나타내는 모델이 줄기 유사 기원 세포, 2차 돌연변이, 및 발달 상황에 의존한다는 것을 보여준다. [도 39A]; 신경 교종 생성에서 기원 세포, 2차 돌연변이 및 H3K27M 사이에 협력을 보여주는 개략도. [도 39B]; PRC2 지형에 대한 H3K27M의 기여 모델. 야생형 H3.1 및 H3.3, H3.1K27M(* 포함) 또는 H3.3K27M(* 포함)을 함유하는 뉴클레오솜을 나타낸다. H3.1K27M은 많은 줄기세포성 및 증식 유발 유전자의 탈억제를 촉진하지만 저수준의 잔류 PRC2 활성은 여전히 유전자의 서브세트를 침묵시킬 수 있다. H3.3K27M은 억제 신호가 발생하더라도 줄기세포성 유전자의 침묵을 방지하지만 야생형 H3.1을 포함하는 PRC2 도메인의 강력한 침묵을 허용한다.
[도 40A-40B]는 CUT&RUN.Salt가 별개의 CENP-A/B/C 복합체를 방출한다는 것을 보여준다. [도 40A]: CENP-A, CENP-B, 및 CENP-C CUT&RUN.Salt 분획에서 D7Z1(왼쪽) 및 DXZ1(오른쪽)에 맵핑된 병합된 쌍의 조각 길이 분석. [도 40B]; CENP-A, CENP-B, 및 CENP-C CUT&RUN 250 bp × 250 bp의 병합된 쌍을 D5Z2, D7Z1, 및 DXZ1 배열에 맵핑: 이 콘티그들로부터 2개의 직렬 이량체들에 걸친 영역을 제시한다. 채워진 상자는 CENP-B 박스를 나타낸다.
[도 41A-41D]. CENP-B는 CENP-A/B/C를 안정화시킨다. CUT&RUN은 투과화된 세포를 사용하여 수행하였다(Skene and Henikoff 2017a). [도 41A]; SF1, D7Z1, 및 D7Z2 서열에 CENP-B CUT&RUN.Salt의 맵핑. 엣지 효과를 피하기 위해, 페어드-엔드 25 bp × 25 bp 리드를 각 콘티그를 나타내는 직렬로 3중으로 중복된 340 bp 이량체 컨센서스 서열에 맵핑하였다. 중간 이량체의 평균 점유를 나타낸다. [도 41B]; CUT&RUN.Salt 분획에서 CENP-B 박스 모티프 점수(여기서 1은 CENP-B 박스의 중앙 15 bp에 대한 동일성을 나타내며 0은 3개 초과의 불일치를 나타냄)와 CENP-A/IgG 농축 배수 값 사이의 상관관계. 2개의 실험의 평균(10분 및 30분 분해 시간)을 나타낸다. [도 41C]; 킬로베이스당 모티브 밀도는 B와 동일하다. [도 41D]; 이 실험에 사용된 암컷 K562 세포에 없는 Y 염색체 α 부수체(DYZ3), 반복 마스크된 Hg19 게놈, 주석 달린 β 부수체, 및 CENP-B 박스가 없는 균질한 배열(D7Z2)로부터의 α 부수체에 대해 CENP-A CUT&RUN.Salt 농축 배수를 나타낸다. 데이터는 250 bp × 250 bp의 맵핑된 병합 쌍이다.
[도 42]는 인간 동원체에서 CENP-A/B/C의 구조적 및 입체 구조적 변형을 보여준다(상단 패널). D7Z1에 대해 평균 낸 CENP CUT&RUN.Salt 250 bp × 250 bp 병합된 쌍의 높은 엄격도 맵핑. 2개의 직렬 이량체의 CENP CUT&RUN.Salt는 D7Z1 콘티그 아래에 나타낸다(하단 패널). CENP-A 및 CENP-B CUT&RUN.Salt 및 CENP-A N-ChIP에서 양쪽 방향으로 CENP-A/B/C의 배향을 나타내는 상이한 이량체 단위의 CENP-A 프로파일의 오버레이.
[도 43A-43B]는 염색질 단백질의 고처리량의 원위치 프로파일링을 위한 자동화된 플랫폼을 보여준다. [도 43A]; AutoCUT&RUN 작업 흐름. (1) 세포 또는 조직을 콘카나발린 A 코팅된 비드에 결합시키고, 디기토닌으로 투과화하고, 염색질 단백질을 표적화하는 항체와 인큐베이션시킨다. (2) 샘플은 96 웰 플레이트에 배열하고 (3) 세척 중 자기 분리를 위해 96 웰 자기 플레이트(α) 및 온도 조절을 위한 순환하는 수조(γ)로 보내지는 알루미늄 냉각 블록(β)이 장착된 Biomek 로봇에서 처리한다. (4) AutoCUT&RUN은 풀링 및 서열 분석 준비가 된 2 일 동안 최대 96개의 라이브러리를 2일 내에 생성한다. [도 43B]; H1(주황색) 및 K562(보라색) 세포에서 활성(분홍색) 및 억제(파란색) 염색질을 표시하는 히스톤 H3 변형의 AutoCUT&RUN 프로파일의 계층적으로 클러스터링된 상관 매트릭스. 피어슨 상관관계는 게놈에 걸쳐 500 bp 빈으로 분할된 리드 카운트의 log2 변환된 값을 사용하여 계산하였다.
[도 44A-44D]는 AutoCUT&RUN이 H1 및 K562 세포의 예상되는 염색질 지형을 재현함을 보여준다. [도 44A]; H1 세포 및 K562 세포에서 H3K27me3, H3K4me2, 및 H3K27ac 도메인 내에 속하는 게놈의 상대적인 양을 보여주는 스케일링된 벤 다이어그램. [도 44B]; 대표적인 유전자 좌(NODAL)에서 H1 세포에서 H3K4me2 및 H3K27me3의 중첩뿐만 아니라 K562 세포에서 H3K27me3 도메인의 확장 및 H3K4me2와의 중첩 손실을 보여주는 게놈 브라우저 트랙. [도 44C]; 단일 프로모터를 갖는 유전자의 TSS를 중심으로 H1 세포에서 히스톤 변형의 AutoCUT&RUN 프로파일의 분포를 보여주는 히트 맵으로, 5'에서 3'의 전사 방향에 따라 좌에서 우로 그리고 RNA-seq 값(FPKM)에 따른 순위 매김에 따라 배향되어 있다. [도 44D]; K562 세포에서 전사 활성이고 억제된 프로모터에 대한 AutoCUT&RUN 히스톤 변형 프로파일의 분포를 보여주는 히트 맵.
[도 45A-45E]는 세포 유형 특이적 프로모터 활성을 정확하게 예측하는 선형 회귀 모델을 보여준다. [도 45A]; 단일 프로모터 유전자에 대한 RNA-seq 값을 K562 데이터에 대해 훈련된 모델에 의해 예측되는 K562 프로모터 CREAM 점수와 비교하는 밀도 산점도. [도 45B]; H1 및 K562 세포에서 단일 프로모터 유전자에 대한 CREAM 점수의 산점도. 컬러 도트는 CREAM 점수가 H1 세포 또는 K562 세포에서 ≥ 2배 농축된다는 것을 나타낸다. [도 45C]; 상응하는 RNA-seq 값에 맵핑된 H1 세포 또는 K562 세포 중 ≥ 2배 농축된 프로모터 CREAM 점수의 산점도. 파란색 점선은 2 배 차이 컷오프를 나타낸다. [도 45D]; 프로모터 CREAM 점수에 따라, 또는 RNA-seq 발현 값에 따라 세포 유형 특이적이라고 불리는 유전자 사이의 중첩을 나타내는 스케일링된 벤 다이어그램. CREAM 대 RNA-seq에 따라 반대 세포 유형 특이성을 갖는 것으로 예측된 유전자를 표시한다(스케일링된 검은 원). [도 45E]; ≥ 2 kb로 분리된 모든 프로모터의 H1 및 K562 CREAM 점수를 비교하는 산점도. H1 및 K562 세포 정체성의 마스터 조절 인자는 컬러 원으로 표시한다. OTX2와 TAL1은 둘다 구별할 수 있는 두 개의 프로모터를 가지고 있다.
[도 46A 및 46B]는 AutoCUT&RUN이 동결된 종양 샘플의 염색질 지형을 프로파일링하는데 적합하다는 것을 보여준다. [도 46A]; DMG 실험 셋업. 뇌간의 유사한 영역으로부터 유래한 2개의 DMG 세포주를 면역 손상된 마우스의 뇌에서 이종 이식편으로 배양하고, 형성시 종양을 절제하고 동결시켰다. 이종 이식편을 해동시키고 세포 배양물로부터 직접 수거된 대조군 DMG 샘플과 병행하여 AutoCUT&RUN에 의해 처리하였다. [도 46B]; 세포 배양물(C.C.)에서 또는 이종 이식편(Xeno.)으로 배양된 VUMC-10 및 SU-DIPG-XIII 세포에서 활성 및 억제된 염색질을 표시하는 히스톤 H3 변형의 Auto CUT&RUN 프로파일의 계층적으로 클러스터링된 상관 매트릭스. 또한, 품질 대조군으로서 H3K27ac를 또한 이들 세포주에서 상이한 항체(*)를 사용하여 수동으로 프로파일링하였다. 피어슨 상관관계는 게놈에 걸쳐 500 bp 빈으로 분할된 리드 카운트의 log2 변환된 값을 사용하여 계산하였다.
[도 47A-47C]는 프로모터 CREAM 점수가 DMG 샘플에서 유전자 활성을 구별하는 것을 보여준다. [도 47A]; VUMC-10 및 SU-DIPG-XIII 세포 배양 샘플의 프로모터 CREAM 점수를 비교하는 산점도. 종양 성장에 연루된 여러 세포 신호 전달 성분의 프로모터의 위치는 컬러 원으로 표시한다. [도 47B]; VUMC-10 세포 배양물(C.C.) 및 이종 이식편(Xeno.raft) 샘플의 프로모터 CREAM 점수를 비교하는 산점도. 388개의 프로모터만이 이들 샘플 사이의 CREAM 점수에서 ≥ 2배 차이를 갖는다. [도 47C]; 세포 배양물(C.C.) 또는 이종 이식편(Xeno.) 뿐만 아니라 H1 및 K562 세포에서 배양된 VUMC-10(V) 및 SU-DIPG-XIII(S) 세포 사이의 프로모터 CREAM 점수의 스피어만 상관관계의 계층적으로 클러스터링된 매트릭스.
[도 48A-48E]는 auto CUT&RUN이 세포 유형 특이적 인핸서 요소를 식별함을 보여준다. [도 48A]; H1 세포에서 접근 가능한 염색질 부위(ATAC-seq 피크)와 H3K4me2 AutoCUT&RUN 프로파일에서 호출된 피크의 중첩을 보여주는 스케일링된 벤 다이어그램. [도 48B]; 모든 H3K4me2+/ATAC+ TSS에 대한 H3K4me1 H3K4me2 및 H3K4me3의 평균 농축. [도 48C]; 모든 H3K4me2+/ATAC+ 원위 조절 요소(DRE: distal regulatory element)에 대한 H3K4me1 H3K4me2 및 H3K4me3의 평균 농축. [도 48D]; 세포 배양물(C.C.) 또는 이종 이식편(Xeno.) 뿐만 아니라 H1 및 K562 세포에서 배양한 VUMC-10(V) 및 SU-DIPG-XIII(S) 세포에서 인핸서 CREAM 점수의 스피어만 상관관계의 계층적으로 클러스터링된 매트릭스. [도 48E]; 대표적인 유전자 좌(SOX2)에서 VUMC-10 세포(V), 두 가지 DMG 세포주(D)에 특이적인, 또는 DMG 세포 및 H1 세포에 일반적인 추정 인핸서 요소(화살표)의 국소화를 보여주는 게놈 브라우저 트랙
[도 49A-49E]는 Auto CUT&RUN이 히스톤 마크뿐만 아니라 NPAT 및 CTCF를 정확하게 맵핑함을 보여준다. [도 49A]; 변형된 CUT&RUN 프로토콜로 자동화가 가능하다. ConA 비드 결합된 샘플을 염색질 단백질 특이적 항체와 인큐베이션하고, 연속 세척, 단백질 A-MNase 융합 단백질의 테더링 및 Ca2+를 첨가함으로써 DNA의 절단을 위해 Biomek 상에 배열한다. 라이브러리 제조 전에 분해된 DNA를 정제할 필요가 없도록 하기 위해, Ca2 +를 특이적으로 킬레이트하지만 적절한 적절한 Mg2 +를 남겨두어 말단 연마 및 염색질 단편에 대한 일루미나 Y 어댑터의 결찰을 허용하는 EGTA 단독 정지 완충액으로 반응을 정지시킨다. 그 다음에 염색질 단백질을 프로테이나아제 K로 분해하고 인덱싱된 CUT&RUN 라이브러리를 Ampure 자성 비드를 사용하여 Biomek에서 정제한다. [도 49B]; NPAT가 H1 및 K562 세포 모두에서 HIST1 유전자 클러스터의 프로모터에서 농축됨을 보여주는 를 보여주는 NPAT 및 CTCF AutoCUT&RUN의 게놈 브라우저 트랙. [도 49C]; CTCF가 HOXA 유전자 좌의 절연체 영역에 결합됨을 확인하는 게놈 브라우저 트랙. [도 49D]; 단일 프로모터를 갖고 H1 세포에서의 상응하는 RNA-seq 값을 갖는 유전자의 TSS 주위에 표시된 히스톤 마크의 AutoCUT&RUN 프로파일 사이의 피어슨 상관관계의 표. [도 49E]; 단일 프로모터를 갖고 H1 세포에서의 상응하는 RNA-seq 값을 갖는 유전자의 TSS 주위에 표시된 히스톤 마크의 AutoCUT&RUN 프로파일 사이의 피어슨 상관관계의 표.
[도 50A-50G]는 시스 조절 요소의 활성을 예측하기 위한 선형 회귀 모델을 개발하는 것을 보여준다. [도 50A]; 단일 프로모터 유전자에 대한 H1 RNA-seq 값을 H1 데이터에 대해 훈련된 모델에 의해 예측된 H1 프로모터 CREAM 점수와 비교하는 밀도 산점도. [도 50B]; 단일 프로모터 유전자에 대한 H1 RNA-seq 값을 K562 데이터에 대해 훈련된 모델에 의해 예측된 H1 프로모터 CREAM 점수와 비교하는 밀도 산점도. [도 50C]; H1 및 K562 세포에서 단일 프로모터 유전자에 대한 RNA-seq 값의 산점도. 점은 RNA 발현 수준이 H1 세포 또는 K562 세포에서 ≥ 2배 농축됨을 나타낸다. [도 50D]; 상응하는 프로모터 CREAM 점수에 맵핑된 H1 세포 또는 K562 세포에서 ≥ 2배 농축된 RNA-seq 값을 갖는 유전자의 분포를 보여주는 산점도. 점선은 2배 차이 컷오프를 나타낸다. [도 50E]; CREAM 점수 및 RNA-seq 둘 다에 의해 식별된 세포 유형 특이적 단일 프로모터 유전자의 수집물에서 과도하게 표시된 유전자 온톨로지(GO: Gene Ontology) 용어. [도 50F]; 프로모터 CREAM 점수(RNA-seq는 아님)에 따라 세포 유형 특이적으로 식별되는 단일 프로모터 유전자의 수집물에서 과도하게 표시된 GO 용어(도 45D의 벤 다이어그램 참조). [도 50G]; GO 용어는 RNA-seq(그러나 프로모터 CREAM 점수는 아님)에 따라 세포 유형 특이적으로 식별되는 단일 프로모터 유전자의 수집물에서 과도하게 표시된 GO 용어.
[도 51]은 DMG 특이적 SMAD3 프로모터 활성을 보여준다. 대표적인 유전자 좌(SMAD3)에서의 VUMC-10 및 SU-DIPG-XIII 세포에서 Auto CUT&RUN에 의해 프로파일링된 히스톤 마크의 게놈 브라우저 트랙으로 세포 배양물 및 이종 이식편 샘플로부터의 프로파일의 일치를 나타낸다. SU-DIPG-XIII 세포에서 H3K27ac 신호는 잡음이 있지만, 이 문제는 항체 특이적이다. 비교를 위해, 대안 항체(*)를 사용하여 H3K27ac를 수동으로 프로파일링하였다. 화살촉은 VUMC-10(V) 또는 SU-DIPG-XIII(S) 세포에서 특이적으로 활성인 것으로 예상되는 프로모터를 나타낸다.
[도 52A-52C]는 프로모터 CREAM이 DMG 특이적 유전자 조절 프로그램을 식별함을 보여준다. [도 52A]; CREAM 분석에 따라 VUMC-10 세포에서 ≥ 2배 농축된 프로모터의 수집물에서 과도하게 표시된 GO 용어. [도 52B]; CREAM 분석에 따라 SU-DIPG-XIII 세포에서≥ 2배 농축된 프로모터의 수집물에서 과도하게 표시된 GO 기간. [도 52C]; SU-DIPG-XIII 세포 배양물(C.C.) 및 이종 이식편(Xeno.) 샘플의 프로모터 CREAM 점수를 비교하는 산점도. 1,619개의 프로모터가 이들 샘플 사이의 CREAM 점수에서 ≥ 2배 차이를 갖는다.
[도 53A-53D]는 autoCUT&RUN이 근위 및 원위 시스 조절 요소를 구별하는 민감한 방법을 보여준다. [도 53A]; 접근 가능한 염색질 부위(ATAC-seq 피크)와 H1 세포에서 히스톤 마크의 다양한 Auto CUT&RUN 프로파일에서 호출된 피크의 중첩 표. [도 53B]; ATAC+ 또는 ATAC-로 호출된 H3K4me2 피크에서 ATAC 신호의 평균 농축. [도 53C]; ATAC+ 또는 ATAC-로 호출된 H3K4me2+ TSS에서 H3K27me3 신호의 평균 농축. [도 53D]; 모든 H3K4me2+/ATAC+ TSS 및 원위 조절 요소(DRE)에 대해 정규화된 H3K4me1, H3K4me2 및 H3K4me3 프로파일의 분포를 보여주는 히트 맵.
[도 54]는 CUT&RUN이 태아 감마 대 성인 베타 글로빈 전환을 식별함을 보여준다.
[도 55]는 100개의 세포로 높은 CUT&RUN 데이터 품질을 보여준다. 다양한 수의 K562 세포를 CUT&RUN에 의해 H3K27me3를 프로파일링하기 위한 출발 물질로서 사용하였다. 페어드-엔드 25x25 bp 일루미나 서열 분석 및 복제물 제거 후, 750만 개의 단편을 무작위로 선택하여 원시 카운트를 나타내는 트랙을 생성하는데 사용하였다. ENCODE X-ChIP-seq 데이터는 전체 프로파일(상위 트랙)과 CUT&RUN과 비교하기 위해 750만 개의 무작위로 선택된 하위 집합에 대해 나타낸다.
[도 56]은 내배엽으로 분화된 인간 ES 세포의 자동화된 CUT&RUN 프로파일링을 나타낸다. "활성"(H3K4me3) 및 "억제"(H3K27me3) 히스톤 변형 및 H1 배아 줄기세포 및 H1 세포 배양물로부터 유래된 분화된 내배엽 세포(DE)에 대한 CTCF에 대한 복제 CUT&RUN 프로파일을 보여주는 스크린 샷. POLD1 전사 단위는 우측에 확대되어(박스 영역) 분화 중에 프로모터를 활성에서 억제 변형으로의 전환을 나타낸다. POLD1은 지연 가닥(lagging strand) DNA 폴리머라제(Pol-델타)의 촉매 서브 유닛을 코딩화하며, 이는 복제기구의 프로모터 활성에서 억제성 염색질 상태로의 전환이 세포주기로부터의 출구에 해당한다는 것을 시사한다.
[도 57]은 고 Ca++/저염 분해와의 개선된 일관성을 보여준다. 고 Ca++/저염 또는 표준 프로토콜을 사용하여 지시된 바와 같이 20초 내지 27분 범위에 걸쳐 분해와 2개의 상이한 항체로 CUT&RUN을 수행하였다. 4개의 시간 경과 시리즈 실험으로부터의 17개의 H3K27ac 데이터세트를 풀링하고, 74,906개의 피크를 MACS2를 사용하여 호출하였다. 각각의 데이터세트에 대해 피크 위치를 점수 매기고 피크 벡터 사이의 상관관계(R2)를 계산하였다.
[도 58A 및 58B]는 H3K27ac CUT&RUN을 보여준다. [도 58A]; 대표적인 20 Mb 영역을 나타낸다. [도 58B]; 단편의 히트 맵은 MACS2 점수로 순위가 매겨진 74,906개의 H3K27ac 피크에 대해 ± 1kb를 계수한다.
[도 59A-59D]는 온전한 조직 및 FACS 단리된 세포의 CUT&RUN 프로파일링을 나타낸다. [도 59A]; 뇌와 날개 성충반을 10개의 유충으로부터 절제하여, 온전한 고정되지 않은 재료는 디기토닌으로 가볍게 투과화하고 CUT&RUN을 위한 항체 및 pAMNase 용액에 담군다. [도 59B]; vg -Q 인핸서를 사용하여 흔적(vg) 유전자를 발현하는 세포에서 GFP를 생산하고, 디스크를 분리하고, 10,000개의 GFP 양성 세포를 FACS에 의해 단리하였다. [도 59C]; 폴리콤 억제된 ANTP 복합체를 통한 온전한 조직 및 FACS 단리된 세포로부터의 H3K27me3의 CUT&RUN 프로파일. 안테나페디아(Antennapedia)(Antp) 유전자는 뇌에서 억제되고 메틸화되지만 날개 성충반에서는 발현되고 메틸화되지 않는다. 또한, FACS 단리된 세포에서도 Antp의 탈억제가 분명하며 배경 대비 신호 비율이 높다. [도 59D]; 뇌(억제된 곳), 날개 성충반(세포의 대략 20%가 vg를 발현하고 나머지는 그렇지 않음) 및 FACS 단리된 vg 발현 세포에서 vg 유전자에 대한 H3K27me3 프로파일.
[도 60A 및 60B]는 CUT&RUN 데이터의 크기 기반 피크 정점 검출을 보여준다. [도 60A]; 정점 검출 방법론. 농축 영역 내에 포함된 CUT&RUN 단편을 단편 오프셋 vs. 단편 길이 산점도에 맵핑하고 데이터에서 뢰스(LOESS) 곡선을 유도하고 곡선에서 국소 최솟값이 발생하는 단일 염기쌍 위치를 정점으로 보고한다. [도 60B]; 단일 염기쌍 CTCF 피크 정점을 2성분 가우스 혼합 모델을 사용하여 예측된 단편 크기에 의해 분배하였고, MEME를 사용하여 2개의 코호트 각각에 대한 정점을 둘러싸는 20 bp 윈도우에 농축된 모티프를 검출하였다.
[도 61]은 CUT&RUN의 개선된 벡터에 대한 플라스미드 맵이다.
[도 62]는 단백질 A-Tn5 발현 벡터를 나타낸다. 단백질 A의 C-말단이 26개 잔기의 가요성 링커 펩티드에 의해 트랜스포사제로부터 분리된 과활성 Tn5 트랜스포사제의 형태(pA-Tn5)가 구축되었다. 스태필로코커스 단백질 A의 2개의 IgG 결합 도메인은 pK19pA-MN 벡터로부터 PCR 증폭하고(Schmid et al. 2004), 발현 벡터 pTXB1-Tn5에서 과활성 Tn5 대립 유전자(E54K, L372P)에 C-말단 융합하였다(Picelli et al, 2014). DDDKEF(GGGGS)4(서열 번호 1)로 구성된 가요성 링커를 단백질 A와 Tn5 사이에 포함시켰다. 또한, 단백질 A의 N-말단에 3개의 직렬 FLAG 에피토프 태그를 삽입함으로써 3XFLAG-태그된 형태(pAf-Tn5)를 구축하였다. lac 오퍼레이터의 하류 서열은 효율적인 리보솜 결합 부위로 대체되었다.
[도 63A와 63B]는 ITIS 전략과 낮은 세포 수에 대한 적용을 보여준다. [도 63A]; pA-Tn5 트랜스포좀을 형성하기 위해 유리 19-mer Tn5 말단 DNA 이중체가 로딩될 때, pA-MN이 ChIC(Chromatin Immunocleavage; 염색질 면역 절단) 및 CUT&RUN에 사용될 수 있는 것과 동일한 방식으로 pA-Tn5가 태그멘테이션(tagmentation)에 사용될 수 있다. 태그멘테이션에서, 트랜스포존의 모자이크 말단(Mosaic End) 서열 및 사용된 서열 분석 플랫폼과 상용 가능한 어댑터 오버행에 상응하는 2개의 말단-이중체 DNA로 로딩된 비-서열 특이적 트랜스포사제는 자르기와 붙이기 반응을 수행하여, 트랜스포존 말단 서열과 어댑터 오버행을 갖는 절단 부위의 양쪽 말단을 캡핑한다. CUT&RUN과 달리, 입자의 방출은 없지만, 오히려 태그멘테이션 후, DNA를 추출하고 3' 말단에서 모자이크 말단에 상보적인 서열을 갖는 프라이머 및 5' 측에 서열 분석 어댑터를 사용하여 PCR에 적용한다. [도 63B]; 가변 세포 수 실험으로부터의 테이프스테이션 판독의 예.
[도 64]는 다른 pA-Tn5 구축물의 ITIS 라이브러리를 보여준다. 음성 대조군(IgG, 기니피그 항-토끼 IgG), CTCF DNA-결합 단백질(토끼 단클론), RNA 폴리머라제 C-말단 도메인 세린-5 포스페이트(PolIIS5, 마우스 단클론), 및 히스톤 H3 리신 27 트리메틸(H3K27me3, 토끼 단클론)에 대한 것을 포함한 다양한 항체와 함께 사용될 때, 라이브러리는 12 사이클의 PCR 후에 특징적인 크기 분포를 나타냈다. pAf-Tn5 제제에서 더 많은 이. 콜라이(E. coli) DNA의 존재가 라이브러리 단편의 더럽혀진 배경을 유발하였지만, pA-Tn5 및 3XFLAG-pA-Tn5(pAf-Tn5) 모두에서 유사한 결과가 관찰되었다.
[도 65]는 ITIS 프로파일이 CUT&RUN 프로파일과 유리하게 비교되는 것을 보여준다. 위: ITIS에 의해 생성된 단편의 맵핑은 동일한 RNA 폴리머라제 II(RNAPII) Ser5 마우스 단클론 항체를 사용하여 CUT&RUN에 비해 데이터 품질이 향상되었음을 보여주며, 여기서 ≤120 bp 단편은 RNAPII의 전사 개시 형태를 나타내는 날카로운 스파이크를 나타낸다. 과다 분해로 인해 접근 가능한 영역에서 절단이 발생할 수 있는 CUT&RUN(27분 내지 9분 트랙 비교)과 달리, pA-Tn5의 각 분자는 단일 말단에만 잘라서 붙여 넣기만 가능하므로 일단 부하를 전달하면, 더 이상 반응할 수 없다. 결과적으로 배경은 CUT&RUN을 사용하여 가능한 것보다 훨씬 더 감소한다. 하단: H3K27me3의 경우 CUT&RUN의 2,500만 개에 비해 650-690만 개의 ITIS 샘플의 맵핑된 리드 수가 훨씬 적음에도 불구하고 ITIS와 CUT&RUN 사이의 일치는 매우 근접한다. ITIS와 CUT&RUN 모두의 경우, 나타난 프로파일을 생성하려면 5600백만 개의 리드가 필요했던 ENCODE ChIP-seq보다 프로파일이 눈에 띄게 깨끗하다. 왼쪽에서 오른쪽으로 패널은 동일한 영역의 연속 3배 배율을 보여준다.
[도 66A]는 히스톤 변형에 대한 ITIS와 CUT&RUN 간의 근접한 일치를 보여준다. 문헌[Janssens et al.(2018)]에 기술된 바와 같이 ITIS 및 CUT&RUN 데이터세트로부터 상관관계 플롯을 구성하였다. 동일한 항체를 ITIS 및 CUT&RUN 모두에 사용하였다: H3K27me3(Cell Signaling Technology 카탈로그 번호 9733), H3K4 디-메틸("2", Millipore 카탈로그 번호 07-030), H3K4 트리-메틸("3" , Active Motif 카탈로그 번호 39159) 및 H3K27ac(Millipore 카탈로그 번호 MABE647).
[도 66B]는 CTD-세린-포스포릴화된 RNAPII에 대한 ITIS와 CUT&RUN 사이의 근접한 일치를 보여준다. 문헌[Janssens et al.(2018)]에 기술된 바와 같이 ITIS 및 CUT&RUN 데이터세트로부터 상관관계 플롯을 구성하였다. 괄호 안의 숫자는 CTD 헵타머 잔기를 나타내며, 여기서 "m"은 마우스 단클론 항체(Abcam 카탈로그 번호 ab5408, 이어서 Abcam 카탈로그 번호 ab46540 토끼 항-마우스 항체)를 나타내며, "p"는 Abcam 카탈로그 번호 5095 토끼 다클론 항체를 나타낸다. ITIS 및 CUT&RUN 모두에 동일한 항체를 사용하였다.
[도 67]은 pA-Tn5 결합에 대한 게놈 전체 과민성을 나타내고, 염 농도를 증가시킴으로써 태그멘테이션이 본질적으로 제거된다. ATAC-seq MACS2 피크 점수로 순서가 매겨진 선택된 데이터세트의 히트 맵 디스플레이는 150 mM NaCl 조건하의 ITIS가 ATAC-seq 피크 점수와 강한 상관관계가 있음을 보여준다. 대조적으로, 150 mM 조건하의 ITIS는 CUT&RUN에서 보이는 것과 유사한 ATAC-seq 피크 호출과 약간의 역 상관관계를 보여주며, 과민성 신호는 300 mM NaCl에서 pA-Tn5 첨가 및 태그멘테이션을 수행함으로써 본질적으로 제거된다. 이는 테더링되지 않은 Tn5에 의한 과민성으로 인한 것이며, 염 처리가 이를 제거하는데 효과적임을 확인해 준다. ATAC-seq 피크 호출(61,153)은 GSE31755(K562 세포)에서 유래한 것이다. 히트 맵은 임의의 선형 스케일로 Java TreeView를 사용하여 플로팅되었다.
[도 68]; ITIS 단편이 여러 크기 부류로 분류된 것을 보여준다. ITIS 라이브러리가 페어드-엔드 서열 분석에 적용되었을 때, 전사 인자를 나타내는 작은 단편 및 모노뉴클레오솜 및 더 낮은 수준의 디뉴클레오솜을 나타내는 큰 단편으로 예상되는 프로파일을 얻었다. 약 10 bp 주기성은 테더링된 절단의 엄격한 제약을 반영 할 가능성이 있다.
[도 69A-69B]는 고염이 표적화되지 않은 태그멘테이션 및 작은 단편 회수를 감소시키는 것을 보여준다. [도 69A]; 맵핑된 단편 수는 백만으로 표시된다. Ov는 CUT&RUN에 이어 NuGen Ovation 라이브러리 제조 키트를 사용한 어댑터를 원위치 결찰이다. 표적화된 신호에 대한 과민성 부위 검출의 상대적인 크기는 과민성 부위 검출이 있다 하더라도 거의 없는 경우 CUT&RUN과 비교함으로써 H3K27me3 트랙으로부터 추정될 수 있다. 세척 단계의 염 농도를 높이면 과민성이 감소하는 것으로 보인다. 이는 과민성이 테더링되지 않은 Tn5으로 인해 발생하지만, 조건을 조정하여 감소 또는 제거할 수 있음을 확인해준다. 도 69B; 150 mM NaCl(상부 패널)에서 수행된 결합 및 태그멘테이션과 함께 상이한 항-RNAPII 항체를 사용하여 2개의 별개의 크기 부류가 관찰되는 반면, 300 mM NaCl에서는 더 작은 크기 부류가 급격히 감소된다.
[도 70]은 pA-MNase의 이. 콜라이 DNA 오염이 스파이크-인 캘리브레이션을 대체할 수 있음을 보여준다. H3K27me3(100~6,000개 세포) 및 CTCF(1,000~100,000개 세포)에 대한 K562 세포 CUT&RUN 데이터세트(GSE104550)의 단편을 에스. 세레비지의 반복-마스크된 게놈 및 전체 게놈 이. 콜라이에 맵핑하였다.
[도 71]은 RNAPII-Ser5P에 대한 ITIS 피크 호출이 전사 개시 부위에 해당함을 보여준다. ITIS를 검증하기 위해, 기본 파라미터를 갖는 MACS2를 사용하여 pA-Tn5 및 pA-3XFLAG-Tn5 RNAPII-Ser5P 데이터세트 모두에 대해 피크를 호출하여 각각 대략 17,500개의 피크를 생성하였다. 인간 K562 세포에 대해 실행된 PRO-seq로부터 처리된 데이터세트(SRA GSM1480327)를 피크 호출에 정렬시켰다. ITIS MACS2 점수로 순서가 정해질 때 PRO-seq 점유와 PolII-Ser5 ITIS 점수 사이의 밀접한 일치가 나타나며, 여기서 파란색 히트 맵 값은 각 피크 호출의 3' 측에 대한 PRO-seq 점유를 나타내고 노란색 값은 5' 측에 대한 PRO-seq 점유를 나타낸다.
[도 72]는 9가 20개의 서로 다른 항체와 2개의 서로 다른 세포 배치에서 각각 2개의 세포 유형에 대해 단일 96 웰 플레이트에서 함께 실행된 6개의 ITIS 샘플에 대한 계층적 클러스터링을 나타내는 상관 매트릭스이다. 1시간 또는 4.5시간 동안 투과화한 후, 항체를 첨가하고(1:50) 4℃에서 하룻밤 인큐베이션하였다. 이어서, 플레이트를 8채널 피펫터 및 96 웰 플레이트 핸들러를 사용하여 ITIS에 적용하였고, 모든 웰로부터의 거의 등몰 샘플을 풀링하고 단일 일루미나 2500 Rapid flow cell에서 서열 분석하여 평균 샘플당 3백만 페어드-엔드 리드를 얻었다. 5개의 상이한 RNA PolII 항체를 제외하고, 모든 생물학적 복제물은 다른 항체에 의해 결합된 모든 샘플의 배제로 함께 클러스터링되었으며, 이는 고처리량의 ITIS에 대해 현저한 정도의 재현성을 입증하였다.
[도 73]은 ITIS를 사용하여 낮은 세포 수에 대한 단편 회수를 보여준다. K562 세포를 60,000개 세포에서 20개 세포로 줄여가며 연속 희석하고 H3K27me3 및 RNAPII-Ser2+5에 대해 ITIS를 수행하였다. H3K27me3의 경우 20개 세포, RNAPII의 경우 60개 세포까지 단편의 대략 선형 회수(로그 스케일)를 나타낸다.
[도 74]는 인간 단편 수와 이. 콜라이 단편 수 사이에 역의 관계가 있음을 보여주며, 이는 CUT&RUN에 대해 관찰된 것과 유사한 pA-Tn5 제조에서 이. 콜라이 오염이 ITIS의 스파이크-인 프록시로 사용되었음을 확인해 준다.
[도 75]는 20개의 세포로 줄어든 낮은 세포 배경을 갖는 높은 CUT&RUN 데이터 품질을 보여준다.
A. 용어 및 정의
다음의 상세한 설명에서, 본원의 일부를 형성하고 실시될 수 있는 예시적인 실시 양태에 의해 도시된 첨부 도면을 참고한다. 다른 실시 양태들이 이용될 수 있고 그 범위를 벗어나지 않고 구조적 또는 논리적 변경이 이루어질 수 있음을 이해해야 한다. 그러므로 다음의 상세한 설명은 제한적인 의미로 다루어서는 안 되며, 실시 양태의 범위는 첨부된 청구 범위 및 그 등가물에 의해 정의된다.
다양한 작업은 실시 양태들을 이해하는데 도움이 될 수 있는 방식으로 다수의 개별 작업으로서 차례로 설명될 수 있다; 그러나 설명 순서는 이들 조작이 순서 의존적임을 암시하는 것으로 해석되어서는 안 된다.
설명을 목적으로, "A/B" 형태 또는 "A 및/또는 B" 형태의 문구는 (A), (B), 또는 (A 및 B)를 의미한다. 설명을 목적으로, "A, B, 및 C 중 적어도 하나" 형태의 문구는 (A), (B), (C), (A 및 B), (A 및 C), (B 및 C), 또는 (A, B 및 C)를 의미한다. 설명을 목적으로, "(A)B" 형태의 문구는 (B) 또는 (AB)를 의미하며, 다시 말해, A는 선택적 요소이다.
본 설명은 "실시 양태" 또는 "실시 양태들"이라는 용어를 사용할 수 있으며, 이는 각각 하나 이상의 동일하거나 상이한 실시 양태를 나타낼 수 있다. 또한, 실시 양태와 관련하여 사용되는 바와 같이 "포함하는(comprising)", "포함하는(including)", "갖는" 등의 용어는 동의어이다.
본 설명은 "실시 양태" 또는 "실시 양태들"이라는 용어를 사용할 수 있으며, 이는 각각 하나 이상의 동일하거나 상이한 실시 양태를 나타낼 수 있다. 또한, 실시 양태와 관련하여 사용되는 바와 같이 "포함하는(comprising)", "포함하는(including)", "갖는" 등의 용어는 동의어이며, 일반적으로 "개방" 용어(예를 들어, 용어 "포함하는"은 "~을 포함하는 그러나 ~에 제한되지는 않는"으로 해석되어야 하고, 용어 "갖는"은 "적어도 ~을 갖는"으로 해석되어야 하고, 용어 "포함하다"는 "~을 포함하지만 ~에 제한되지 않는" 등으로 해석되어야 함)로서 의도된다.
본원의 임의의 복수 및/또는 단수 용어의 사용과 관련하여, 당업자는 문맥 및/또는 적용에 적절할 때 복수에서 단수로 및/또는 단수에서 복수로 번역할 수 있다. 명확성을 위해 다양한 단수/복수 순열이 본원에서 명시적으로 제시될 수 있다.
달리 명시되지 않는 한, 기술적 용어는 일반적인 용법에 따라 사용된다. 분자 생물학에서 일반적인 용어의 정의는 출판사(Jones and Bartlet)에서 출판한 문헌[Benjamin Lewin, Genes IX, 2008 (ISBN 0763752223)]; 출판사(Blackwell Science Ltd.)에서 출판한 문헌[Kendrew et al. (eds.), The Encyclopedia of Molecular Biology, 1994 (ISBN 0632021829)]; 및 출판사(VCH Publishers, Inc.)에서 출판한 문헌[Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, 1995 (ISBN 9780471185710)]; 및 기타 유사한 참고 문헌에서 찾아볼 수 있다. 상충하는 경우, 본 명세서의 용어가 우선할 것이다.
본 개시 내용의 다양한 실시 양태들의 검토를 용이하게 하기 위해, 다음의 특정 용어들에 대한 설명을 제공한다.
항체: 적어도 하나의 경쇄 또는 중쇄 면역글로불린 가변 영역을 포함하고, 염색질 DNA와 관련된 단백질 상의 에피토프와 같은 항원의 에피토프에 특이적으로 결합하는 폴리펩티드 리간드. 항체는 단클론 항체, 다클론 항체, 또는 항체 단편을 포함할 수 있다.
항원과 관련하여, 용어 "특이적으로 결합한다"는 염색질 DNA에 결합된 특정 단백질과 같은 특정 폴리펩티드, 예를 들어 전사 인자와 항체 또는 다른 리간드의 전체 또는 일부의 우선적인 결합을 의미한다. 특이적 결합제는 실질적으로 특정 염색질 관련 인자와 같이 정의된 표적에만 결합한다. 특이적 결합제와 같은 분자와 비-표적 폴리펩티드 사이에서 소량의 비특이적 상호 작용이 발생할 수 있는 것으로 인식된다. 그럼에도, 특이적 결합은 항원의 특이적 인식을 통해 매개되는 것으로 구별될 수 있다. 선택적 반응성 항체는 항원에 결합하지만 낮은 친화력으로 그렇게 할 수 있다. 특이적 결합은 전형적으로, 예컨대 비-표적 폴리펩티드와 비교하여, 표적 폴리펩티드에 대한 결합된 항체 또는 다른 리간드의 양(단위 시간당)에서 2배 초과, 예컨대 5배 초과, 10배 초과, 또는 100배 초과의 증가를 초래한다. 특정 단백질과 특이적으로 면역 반응성인 항체를 선택하기 위해서는 다양한 면역 분석 형식이 적합하다. 예를 들어, 고상 ELISA 면역 분석은 단백질과 특이적으로 면역 반응성인 단클론 항체를 선택하기 위해 통상적으로 사용된다. 특이적 면역 반응성을 결정하는데 사용할 수 있는 면역 분석 형식 및 조건에 대한 설명은 문헌[Harlow & Lane, Antibodies, A Laboratory Manual, Cold Spring Harbor Publications, New York(1988)]을 참조한다.
항체는 중쇄 및 경쇄로 구성될 수 있으며, 이들 각각은 가변 중쇄(VH) 영역 및 가변 경쇄(VL) 영역으로 지칭되는 가변 영역을 갖는다. 동시에, VH 영역과 VL 영역은 항체에 의해 인식되는 항원에 결합하는 역할을 한다. 여기에는 온전한 면역글로불린 및 당 업계에 잘 알려진 이들의 변이체 및 일부분, 예컨대 Fab' 단편, F(ab)'2 단편, 단쇄 Fv 단백질("scFv"), 및 이황화 안정화된 Fv 단백질("dsFv") 디아 바디 및 기타 모든 변형이 포함된다. 상기 용어는 또한 키메라 항체(예를 들어, 인간화 쥣과 항체), 이종 접합체 항체(예컨대, 이중 특이적 항체)와 같은 재조합 형태를 포함한다. 또한, 피어스(Pierce) 카탈로그 및 핸드북[1994-1995(Pierce Chemical Co., Rockford, 111.)]; 문헌[Kuby, Immunology, 3rd Ed., W.H. Freeman & Co., New York, 1997]을 참조한다.
"단클론 항체"는 B 림프구의 단일 클론 또는 단일 항체의 경쇄 및 중쇄 유전자가 형질 감염된 세포에 의해 생성된 항체이다. 단클론 항체는 예를 들어 면역 비장 세포와 골수종 세포의 융합으로부터 하이브리드 항체 형성 세포를 제조함으로써 당업자에게 공지된 방법에 의해 생성된다. 이 융합 세포와 그들의 자손은 "하브리도마"로 불린다. 단클론 항체는 인간화된 단클론 항체를 포함한다.
증폭: 본원에 기술된 방법에 의해 확인 및/또는 수득된 핵산과 같은 핵산 분자의 복제 수를 증가시키는 것. 생성된 증폭 산물을 "앰플리콘"이라고 한다. 핵산 분자(예를 들어, DNA 또는 RNA 분자)의 증폭은 핵산 분자(단편 포함)의 복제 수를 증가시키는 기술의 사용을 지칭한다.
증폭의 예는 샘플에서 핵산 주형에 프라이머의 혼성화를 허용하는 조건하에서 샘플이 한 쌍의 올리고뉴클레오티드 프라이머와 접촉하는 폴리머라제 연쇄 반응(PCR: polymerase chain reaction)이다. 프라이머는 적합한 조건하에서 신장되고, 주형으로부터 분리되고, 재어닐링되고, 신장되고, 해리되어 핵산의 복제 수를 증폭시킨다. 이 사이클은 반복될 수 있다. 증폭 산물은 전기영동, 제한 엔도뉴클레아제 절단 패턴, 올리고뉴클레오티드 혼성화 또는 결찰, 및/또는 핵산 서열 분석과 같은 기술으로 특성화될 수 있다.
시험관 내 증폭 기술의 다른 예로는 다른 것들 중에서 정량적 실시간 PCR; 역전사 효소 PCR(RT-PCR); 실시간 PCR(rt PCR); 실시간 역전사 효소 PCR(rt RT-PCR); 네스티드(nested) PCR; 가닥 치환(strand displacement) 증폭(미국 특허 제5,744,311호 참조); 전사 없는 등온 증폭(미국 특허 제6,033,881호, 복구 연쇄 반응 증폭(WO 90/01069 참조); 리가아제 연쇄 반응 증폭(유럽 특허 공보 EP-A-320 308 참조); 갭 충전 리가아제 연쇄 반응 증폭(미국 특허 제5,427,930호 참조), 커플링된 리가제 검출 및 PCR(미국 특허 제6,027,889호 참조) 및 NASBA™ RNA 전사 없는 증폭(미국 특허 제6,025,134호 참조)이 포함된다.
결합 또는 안정한 결합: 하나의 핵산 분자의 또 다른 핵산 분자 또는 자신과의 혼성화, 항체의 펩티드와의 결합, 또는 단백질의 다른 단백질과의 결합(예를 들어, 전사 인자의 보조 인자와의 결합) 또는 단백질의 핵산 분자와의 결합(예를 들어, 전사 인자의 염색질 DNA와 같은 핵산과의 결합)과 같은 두 물질 또는 분자 간의 결합.
결합 부위: 다른 분자가 안정적으로 결합하는, 단백질, DNA 또는 RNA 상의 영역. 일 예에서, 결합 부위는 전사 인자와 같은 염색질 관련 인자가 결합하는 염색질 DNA와 같은 DNA 분자 상의 부위이다(전사 인자 결합 부위로 지칭됨).
접촉: 예를 들어 고체 형태 및/또는 액체 형태의 직접적인 물리적 결합에 놓임. 접촉은 단리된 세포, 예를 들어 투과화된 세포와 원위치에서 또는 대상체에게 투여함으로써 생체 내에서 발생할 수 있다.
대조군: 참조 표준. 대조군은 기저 수준 또는 양을 나타내거나 조직 또는 세포 또는 이의 집단에 존재하는 공지된 값 또는 값의 범위일 수 있다. 대조군은 또한 세포 또는 조직 대조군, 예를 들어 비-질환 상태의 조직일 수 있다. 시험 샘플과 대조군의 차이는 증가 또는 반대로 감소일 수 있다. 차이는 정성적 차이 또는 정량적 차이, 예를 들어 통계적으로 유의한 차이일 수 있다. 일부 실시 양태에서, 대조군은 DNA 내 스파이크 및/또는 오염 DNA와 같은 부가된 DNA이다.
상보적: 이중 가닥 DNA 또는 RNA 가닥은 2개의 상보적 가닥의 염기 쌍으로 이루어진다. 상보적 결합은 하나의 핵산 분자의 염기가 또 다른 핵산 분자의 염기와 수소 결합을 형성할 때 발생한다. 일반적으로, 염기 아데닌(A)은 티미딘(T) 및 우라실(U)에 상보적인 한편, 시토신(C)은 구아닌(G)에 상보적이다. 예를 들어, 하나의 ssDNA 분자의 서열 5'-ATCG-3'는 또 다른 ssDNA의 3'-TAGC-5'에 결합하여 dsDNA를 형성할 수 있다. 이 예에서, 서열 5'-ATCG-3'은 3'-TAGC-5'의 역상보체이다.
핵산 분자는 각 분자의 모든 염기의 완전한 수소 결합 없이도 서로 상보적일 수 있다. 예를 들어, 상보적 핵산 서열과의 혼성화는 상보체가 모든 뉴클레오티드 위치가 아닌 일부에서 결합하는 상이한 엄격도의 조건하에서 발생할 수 있다.
공유 연결된: 원자 사이의 전자 쌍을 공유하는 것을 특징으로 하는 공유 결합의 형성에 의한 원자 사이의 공유 연결을 말한다. 일 예에서, 공유 연결은 핵산 가닥의 골격에서 포스포디에스테르 결합과 같은 산소와 인 사이의 결합이다. 다른 예에서, 공유 연결은 핵산 및 단백질 및/또는 이의 둘 이상의 단백질 또는 이들의 단편, 예컨대 항체 및 효소, 예를 들어 트랜스포사제에 대한 항체, 또는 뉴클레아제에 대한 항체 사이에 것이다.
가교제: 한 분자가 또 다른 분자에 부착하는 것을 촉진하는 화학 작용제 또는 빛. 가교제는 단백질-핵산 가교제, 핵산-핵산 가교제, 및/또는 단백질-단백질 가교 제일 수 있다. 이러한 작용제의 예는 당 업계에 공지되어있다. 일부 실시 양태에서, 가교제는 가역성 가교제이다. 일부 실시 양태에서, 가교제는 비가역성 가교제이다.
검출 가능한 표지: 다른 분자의 검출을 용이하게 하기 위해 그 분자에 직접 또는 간접적으로 접합된 화합물 또는 조성물. 표지의 특정의 비제한적인 예는 형광 태그, 효소 연결, 및 방사성 동위 원소를 포함한다. 일부 예에서, 표지는 항체 또는 핵산에 부착되어 항체 또는 핵산이 특이적으로 결합하는 분자의 검출을 용이하게 한다.
DNA 서열 분석: 주어진 DNA 분자의 뉴클레오티드 순서를 결정하는 과정. 일반적으로, 서열 분석은 자동화된 생어(Sanger) 서열 분석(AB 13730x1 genome analyzer), 고체 지지체 상 파이로시퀀싱(454 sequencing, Roche), 가역적 종결을 이용한 합성에 의한 서열 분석(ILLUMINA® Genome Analyzer), 결찰에 의한 서열 분석(ABI SOLiD®) 또는 가상 종결 인자를 이용한 합성에 의한 서열 분석(HELISCOPE®)을 사용하여 수행될 수 있다. 개시된 방법과 함게 사용하기 위한 다른 차세대 서열 분석 기술에는 대용량 병렬 시그니처 서열 분석(MPSS: Massively Parallel Signature Sequencing), 폴로니(Polony) 서열 분석, 이온 토렌트 반도체((Ion Torrent semiconductor) 서열 분석, DNA 나노볼(nanoball) 서열 분석, 헬리스코프(Heliscope) 단일 분자 서열 분석, 단일 분자 실시간(SMRT: Single molecule real time) 서열 분석, 및 나노포어(Nanopore) DNA 서열 분석이 포함된다.
고 처리량 기술: 로봇 공학, 데이터 처리 및 제어 소프트웨어, 액체 처리 장치, 및 검출기의 조합을 통해, 고 처리량 기술을 통해 짧은 기간, 예를 들어 24시간 미만, 12시간 미만, 6시간 미만, 또는 심지어 1시간 미만 내에 잠재적 시약, 조건, 또는 표적을 신속하게 스크리닝할 수 있다.
혼성화: 올리고뉴클레오티드 및 이들의 유사체는 상보성 염기 사이의 왓슨-크릭(Watson-Crick), 후그스틴(Hogsteen) 또는 역 후그스틴(Hogsteen) 수소 결합을 포함하는 수소 결합에 의해 혼성화한다. 일반적으로, 핵산은 피리미딘(시토신(C),우라실(U) 및 티민(T)) 또는 퓨린(아데닌(A) 및 구아닌(G))인 질소성 염기로 이루어진다. 이들 질소성 염기는 피리미딘과 퓨린 사이에 수소 결합을 형성하고, 피리미딘과 퓨린의 결합은 "염기쌍 형성"으로 지칭된다. 보다 구체적으로, A는 T 또는 U와 수소 결합하고, G는 C와 결합할 것이다. "상보적"은 2개의 별개의 핵산 서열 또는 동일한 핵산 서열의 2개의 별개의 영역 사이에서 발생하는 염기쌍 형성을 지칭한다.
"특이적으로 혼성화 가능한" 및 "특이적으로 상보적"은 올리고뉴클레오티드(또는 이의 유사체)와 DNA, 또는 RNA 사이에 안정하고 특이적인 결합이 일어나도록 충분한 정도의 상보성을 나타내는 용어이다. 올리고뉴클레오티드 또는 올리고뉴클레오티드 유사체는 특이적으로 혼성화 가능하기 위해서 그의 표적 서열에 100% 상보적일 필요는 없다. 올리고뉴클레오티드 또는 유사체는 특이적 결합이 요구되는 조건하에서 올리고뉴클레오티드 또는 유사체의 비-표적 서열에 대한 비특이적 결합을 피하기에 충분한 정도의 상보성이 있을 때 특이적으로 혼성화 가능하다. 이러한 결합은 특이적 혼성화로 지칭된다.
단리: "단리된" 생물학적 성분은 성분이 자연적으로 발생하는 유기체 세포의 다른 생물학적 성분, 예를 들어 염색질 외 DNA 및 RNA, 단백질 및 소기관으로부터 실질적으로 분리 또는 정제되어있다. "단리된" 핵산 및 단백질은 표준 정제 방법에 의해 정제된 핵산 및 단백질을 포함한다. 상기 용어는 또한 숙주 세포에서 재조합 발현에 의해서 재조된 핵산 및 단백질뿐만 아니라 화학적으로 합성된 핵산을 포함한다. 용어 "단리된"은 생물학적 성분에 미량의 오염이 없음을 의미하지 않으며, 적어도 50% 단리된 핵산 분자, 예컨대 적어도 75%, 80%, 90%, 95%, 98%, 99%, 또는 심지어 100% 단리된 핵산 분자를 포함할 수 있음을 이해해야 한다.
질량 분석법: 샘플로부터 기체 상 이온을 생성한 후, 질량 대 전하 비율(m/z)에 따라 분리하여 검출함으로써 샘플을 분석하는 방법. 샘플로부터 기체 상 이온을 생성하는 방법은 전기 분무 이온화(ESI: electrospray ionization), 매트릭스 보조 레이저 탈착 이온화(MALDI: matrix-assisted laser desorption-ionization), 표면 강화 레이저 탈착 이온화(SELDI: surface-enhanced laser desorption-ionization), 화학 이온화, 및 전자 충격 이온화(EI: electron-impact ionization)를 포함한다. m/z 비율에 따른 이온 분리는 4중 극자 질량 분석기(Q), 비행시간(TOF: time-of-flight) 질량 분석기, 자기 섹터 질량 분석기, 3D 및 선형 이온 트랩(IT: linear ion trap), 푸리에 변환 이온 사이클로트론 공명(FT-ICR: Fourier-transform ion cyclotron resonance) 분석기, 및 이들의 조합(예를 들어, 4중 극자 비행시간 분석기, 또는 Q-TOF 분석기)을 포함한 임의의 유형의 질량 분석기로 수행될 수 있다. 분리하기 전에, 샘플은 1차원 이상의 크로마토그래피 분리, 예를 들어 1차원 이상의 액체 또는 크기 배제 크로마토그래피가 적용될 수 있다.
핵산(분자 또는 서열): 제한 없이, cDNA, mRNA, 게놈 DNA, 및 합성(예컨대, 화학적으로 합성된) DNA 또는 RNA 또는 이들의 혼성체를 포함하는 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중합체. 핵산은 이중 가닥(ds) 또는 단일 가닥(ss)일 수 있다. 단일 가닥일 경우, 핵산은 센스 가닥 또는 안티센스 가닥일 수 있다. 핵산은 천연 뉴클레오티드(예컨대, A, T/U, C 및 G)를 포함할 수 있고, 표지된 뉴클레오티드와 같은 천연 뉴클레오티드의 유사체도 포함할 수 있다. 핵산의 일부 예는 본원에 개시된 프로브를 포함한다. DNA의 주요 뉴클레오티드는 데옥시아데노신 5'-트리포스페이트(dATP 또는 A), 데옥시구아노신 5'-트리포스페이트(dGTP 또는 G), 데옥시시티딘 5'-트리포스페이트(dCTP 또는 C) 및 데옥시티미딘 5'-트리포스페이트(dTTP 또는 T)이다. RNA의 주요 뉴클레오티드는 아데노신 5'-트리포스페이트(ATP 또는 A), 구아노신 5'-트리포스페이트(GTP 또는 G), 시티딘 5'-트리포스페이트(CTP 또는 C) 및 우리딘 5'-트리포스페이트(UTP 또는 U)이다. 뉴클레오티드는 예를 들어 미국 특허 제5,866,336호(Nazarenko et al.)에 기재된 바와 같이 변형된 염기, 변형된 당 모이어티, 및 변형된 포스페이트 골격을 함유하는 뉴클레오티드를 포함한다. 구조상의 임의의 위치에서 뉴클레오티드를 변형시키는데 사용될 수 있는 변형된 염기 모이어티의 예는 다른 것들 중에서 5-플루오로우라실, 5-브로모라실, 5-클로로우라실, 5-요오도우라실, 히포크산틴, 크산틴, 아세틸시토신, 5-(카르복시히드록실메틸) 우라실, 5-카르복시메틸아미노메틸-2-티오우리딘, 5-카르복시메틸아미노메틸우라실, 디히드로우라실, 베타-D-갈락토실퀴오신, 이노신, N~6-이소펜테닐아데닌, 1-메틸구아닌, 1-메틸이노신, 2,2-디메틸구아닌, 2-메틸아데닌, 2-메틸구아닌, 3-메틸시토신, 5-메틸시토신, N6-아데닌, 7-메틸구아닌, 5-메틸아미노메틸우라실, 메톡시아미노메틸-2-티오우라실, 베타-D-만노실퀴오신, 5'-메톡시카르복시메틸우라실, 5-메톡시우라실, 2-메틸티오-N6-이소펜테닐아데닌, 우라실-5-옥시아세트산, 슈도우라실, 퀴오신, 2-티오시토신, 5-메틸-2-티오우라실, 2-티오우라실, 4-티오우라실, 5-메틸우라실, 우라실-5-옥시아세트산 메틸에스테르, 우라실-S-옥시아세트산, 5-메틸-2-티오우라실, 3-(3-아미노-3-N-2-카르복시프로필)우라실, 2,6-디아미노푸린 및 비오티닐화된 유사체를 포함하지만 이에 제한되지는 않는다. 구조상의 임의의 위치에서 뉴클레오티드를 변형시키는데 사용될 수 있는 변형된 당 모이어티의 예는 아라비노스, 2-플루오로아라비노스, 자일로스, 및 헥소오스, 또는 포스페이트 골격의 변형된 성분, 예컨대 포스포로티오에이트, 포스포로디티오에이트, 포스포아미도티오에이트, 포스포아미데이트, 포스포디아미데이트, 메틸포스포네이트, 알킬 포스포트리에스테르, 또는 포름아세탈 또는 유사체를 포함하지만 이에 제한되지는 않는다.
펩티드/단백질/폴리펩티드: 이 모든 용어는 펩티드 결합 또는 펩티드 결합 모방체에 의해 연결된 아미노산 및/또는 아미노산 유사체의 중합체를 지칭한다. 20개의 자연 발생 아미노산 및 당 업계에 공지된 단일 문자 및 3 문자 명칭.
샘플: 식물, 또는 동물 등과 같은 유기체 또는 그의 일부로부터 얻은 생물학적 물질(예컨대, 핵산)을 포함하는 생물학적 샘플과 같은 샘플. 특정 실시 양태에서, 생물학적 샘플은 인간 대상체와 같은 동물 대상체로부터 수득된다. 생물학적 샘플은 다른 것들 중에서 박테리아, 효모, 원생동물 및 아메바와 같은 단세포 유기체, 다세포 유기체(예컨대, 식물 또는 동물, 건강한 또는 건강해 보이는 인간 대상체 또는 진단되거나 조사된 병태 또는 질환에 걸린 인간 환자의 샘플을 포함함)를 제한 없이 포함하는 임의의 살아있는 유기체로부터 얻거나, 그에 의해 배설 또는 분비되는 임의의 고체 또는 유체 샘플이다. 예를 들어, 생물학적 샘플은 골수, 조직 생검, 전혈, 혈청, 혈장, 혈액 세포, 내피세포, 순환 종양 세포, 림프액, 복수액, 간질액("세포외액"으로도 알려져 있으며 특히 치은 열구액을 포함하여 세포 사이의 공간에서 발견되는 체액을 포함), 뇌척수액(CSF: cerebrospinal fluid), 타액, 점액, 가래, 땀, 소변. 또는 임의의 기타 분비물, 배설물, 또는 기타 체액일 수 있다.
서열 동일성/유사성: 둘 이상의 핵산 서열, 또는 둘 이상의 아미노산 서열 사이의 동일성/유사성은 서열 사이의 동일성 또는 유사성의 측면에서 표현된다. 서열 동일성은 백분율 동일성 측면에서 측정될 수 있으며; 백분율이 높을수록 서열이 더 동일하다. 핵산 또는 아미노산 서열의 상동체 또는 오솔로그(ortholog)는 표준 방법을 사용하여 정렬될 때 비교적 높은 정도의 서열 동일성/유사성을 보유한다.
비교를 위한 서열 정렬 방법은 당 업계에 잘 알려져 있다. 다양한 프로그램 및 정렬 알고리즘이 문헌[Smith & Waterman, Adv. Appl. Math. 2:482, 1981; Needleman & Wunsch, J. Mol. Biol. 48:443, 1970; Pearson & Lipman, Proc. Natl. Acad. Sci. USA 85:2444, 1988; Higgins & Sharp, Gene, 73:237-44, 1988; Higgins & Sharp, CABIOS 5: 151-3, 1989; Corpet et al, Nuc. Acids Res. 16: 10881-90, 1988; Huang et al. Computer Appls. in the Biosciences 8, 155-65, 1992; and Pearson et al, Meth. Mol. Bio. 24:307-31, 1994]에 기재되어 있다. 문헌[Altschul et al, J. Mol. Biol. 215:403-10, 1990]은 서열 정렬 방법 및 상동성 계산에 대한 상세한 고려 사항을 제시한다.
NCBI 기본 국소 정렬 검색 도구(BLAST: Basic Local Alignment Search Tool)(Altschul et al, J. Mol. Biol. 215: 403-10, 1990)는 서열 분석 프로그램 blastp, blastn, blastx, tblastn, 및 tblastx와 관련하여 사용하기 위한, 국립 생물 정보 센터(NCBI, National Center of Biological Information, 미국 20894 메릴랜드주 국립 의학 도서관(National Medicine of Library) 베테스다 빌딩 38 A 8N805호 소재) 및 인터넷을 포함하는 여러 출처로부터 이용 가능하다. Blastn은 핵산 서열을 비교하는 데 사용되는 한편, blastp는 아미노산 서열을 비교하는 데 사용된다. 추가 정보는 NCBI 웹 사이트에서 찾을 수 있다.
일단 정렬되면, 일치 개수는 동일한 뉴클레오티드 또는 아미노산 잔기가 두 서열에서 나타나는 위치의 개수를 세어 결정된다. 퍼센트 서열 동일성은 일치 개수를 식별된 서열에 제시된 서열의 길이 또는 연결된 길이(예컨대, 식별된 서열에 제시된 서열의 100개의 연속 뉴클레오티드 또는 아미노산 잔기)로 나눈 후 결괏값에 100을 곱함으로써 결정된다. 예를 들어, 1554개의 뉴클레오티드를 갖는 시험 서열과 정렬될 때 1166개의 일치를 갖는 핵산 서열은 시험 서열과 75.0% 동일하다(1166÷1554* 100 = 75.0). 퍼센트 서열 동일성 값은 가장 가까운 소수 첫째 자리에 반올림한다. 예를 들어 75.11, 75.12, 75.13 및 75.14는 75.1로 내림하고 75.15, 75.16, 75.17, 75.18 및 75.19는 75.2로 반올림한다. 길잇값은 항상 정수이다. 다른 예에서, 하기와 같이 식별된 서열로부터 20개의 연속 뉴클레오티드와 정렬하는 20개 뉴클레오티드 영역을 함유하는 표적 서열은 식별된 서열과 75%의 서열 동일성을 공유하는 영역을 함유한다(즉, 15±20* 100 = 75).
두 개의 핵산 분자가 밀접하게 관련되어 있다는 말은 엄격한 조건하에서 두 분자가 서로 혼성화한다는 것이다. 엄격한 조건은 서열 의존적이고 환경 매개변수에 따라 다르다.
특이적 결합제: 단백질, 효소, 다당류, 올리고뉴클레오티드, DNA, RNA, 재조합 벡터 또는 소분자와 같은 정의된 표적에만 실질적으로 또는 우선적으로 결합하는 작용제. 핵산 특이적 결합제는 DNA와 같은 정의된 핵산 또는 핵산 내의 특정 영역에만 실질적으로 결합한다. 일부 실시 양태에서, 특이적 결합제는 관심 표적 핵산에 특이적으로 결합하는 프로브 또는 프라이머이다. 일부 실시 양태에서, 특이적 결합제는 염색질 DNA와 같은 관심 표적 핵산에 특이적으로 결합하는 전사 인자이다. 단백질 특이적 결합제는 정의된 단백질, 또는 단백질 내의 특정 영역에만 실질적으로 결합한다. 예를 들어, "특이적 결합제"는 특정 폴리펩티드에 실질적으로 결합하는 항체 및 다른 작용제를 포함한다. 항체는 폴리펩티드에 특이적인 단클론 또는 다클론 항체뿐만 아니라 그의 면역학적으로 효과적인 부분("단편")일 수 있다. 특정 작용제가 특정 폴리펩티드에만 실질적으로 결합한다는 것은 일상적인 절차를 사용하거나 조정함으로써 쉽게 결정될 수 있다. 하나의 적합한 시험관 내 분석은 웨스턴 블롯팅 절차를 이용한다(문헌[Harlow and Lane, Using Antibodies: A Laboratory Manual, CSHL, New York, 1999]을 포함한 많은 표준 교과서에 기술됨). 일부 실시 양태에서, 특이적 결합제는 항체이다.
전사 인자: 전사를 조절하는 단백질. 특히, 전사 인자는 RNA 폴리머라제의 결합 및 전사의 개시를 조절한다. 전사 인자는 상류 또는 하류에 결합하여 RNA 폴리머라제 결합을 보조하거나 차단함으로써 유전자의 전사를 향상시키거나 억제한다. 전사 인자라는 용어는 불활성 및 활성화된 전사 인자 둘 모두를 포함한다.
전사 인자는 전형적으로 유전자 발현의 조절에 영향을 주는 모듈식 단백질이다. 예시적인 전사 인자는 다른 것들 중에서 AAF, abl, ADA2, ADA-NF1, AF-1, AFP1, AhR, AIIN3, ALL-1, 알파-CBF, 알파-CP 1, 알파-CP2a, 알파-CP2b, 알파Ho, 알파H2-알파H3, Alx-4, aMEF-2, AML1, AMLla, AMLlb, AMLlc, AMLl델타N, AML2, AML3, AML3a, AML3b, AMY-1L, A-Myb, ANF, AP-1, AP-2알파A, AP-2알파B, AP-2베타, AP-2감마, AP-3(1), AP-3(2), AP-4, AP-5, APC, AR, AREB6, Arnt, Arnt(774 M 형태), ARP-1, ATBF1-A, ATBF1-B, ATF, ATF-1, ATF-2, ATF-3, ATF-3델타ZIP, ATF-a, ATF-a델타, ATPF1, Barhll, Barhl2, Barxl, Barx2, Bcl-3, BCL-6, BD73, 베타-카테닌, Binl, B-Myb, BP1, BP2, 브라마(brahma), BRCA1, Brn-3a, Brn-3b, Brn-4, BTEB, BTEB2, B-TFIID, C/EBP알파, C/EBP베타, C/EBP델타, CACC결합 인자, Cart-1, CBF(4), CBF(5), CBP, CCAAT-결합 인자, CCMT-결합 인자, CCF, CCG1, CCK-la, CCK-lb, CD28RC, cdk2, cdk9, Cdx-1, CDX2, Cdx-4, CFF, ChxlO, CLIMI, CLIM2, CNBP, CoS, COUP, CPl, CPIA, CPIC, CP2, CPBP, CPE 결합 단백질, CREB, CREB-2, CRE-BPl, CRE-BPa, CREM알파, CRF, Crx, CSBP-1, CTCF, CTF, CTF-1, CTF-2, CTF-3, CTF-5, CTF-7, CUP, CUTL1, Cx, 사이클린 A, 사이클린 Tl, 사이클린 T2, 사이클린 T2a, 사이클린 T2b, DAP, DAX1, DB1, DBF4, DBP, DbpA, DbpAv, DbpB, DDB, DDB-1, DDB-2, DEF, 델타CREB, 델타Max, DF-1, DF-2, DF-3, Dlx-1, Dlx-2, Dlx-3, DIx4(긴 아이소형), Dlx-4(짧은 아이소형), Dlx-5, Dlx-6, DP-1, DP-2, DSIF, DSIF-pl4, DSIF-pl60, DTF, DUX1, DUX2, DUX3, DUX4, E, El 2, E2F, E2F+E4, E2F+pl07, E2F-1, E2F-2, E2F-3, E2F-4, E2F-5, E2F-6, E47, E4BP4, E4F, E4F1, E4TF2, EAR2, EBP-80, EC2, EF1, EF-C, EGR1, EGR2, EGR3, EIIaE-A, EIIaE-B, EIIaE-C알파, EIIaE-C베타, EivF, EIf-1, EIk-1, Emx-1, Emx-2, Emx-2, En-1, En-2, ENH 결합 단백질, ENKTF-1, EPASl, 엡실론Fl, ER, Erg-1, Erg-2, ERR1, ERR2, ETF, Ets-1, Ets-1 델타Vil, Ets-2, Evx-1, F2F, 인자 2, 인자 name, FBP, f-EBP, FKBP59, FKHL18, FKHRL1P2, Fli-1, Fos, FOXB1, FOXC1, FOXC2, FOXD1, FOXD2, FOXD3, FOXD4, FOXE1, FOXE3, FOXF1, FOXF2, FOXGla, FOXGlb, FOXGlc, FOXH1, FOXI1, FOXJla, FOXJlb, FOXJ2(긴 아이소형), FOXJ2(짧은 아이소형), FOXJ3, FOXKla, FOXKlb, FOXKlc, FOXL1, FOXMla, FOXMlb, FOXMlc, FOXN1, FOXN2, FOXN3, FOXOla, FOXOlb, FOX02, FOX03a, FOX03b, FOX04, FOXP1, FOXP3, Fra-1, Fra-2, FTF, FTS, G 인자, G6 인자, GABP, GABP-알파, GABP-베타l, GABP-베타2, GADD 153, GAF, 감마CMT, 감마CACl, 감마CAC2, GATA-1, GATA-2, GATA-3, GATA-4, GATA-5, GATA-6, Gbx-1, Gbx-2, GCF, GCMa, GCNS, GF1, GLI, GLI3, GR 알파, GR 베타, GRF-1, Gsc, Gscl, GT-IC, GT-IIA, GT-IIB알파, GT-IIB베타, H1TF1, H1TF2, H2RIIBP, H4TF-1, H4TF-2, HAND1, HAND2, HB9, HDAC1, HDAC2, HDAC3, hDaxx, 열 유도 인자, HEB, HEBl-p67, HEBl-p94, HEF-1 B, HEF-1T, HEF-4C, HEN1, HEN2, Hesxl, Hex, HIF-1, HIF-l알파, HIF-l베타, HiNF-A, HiNF-B, HINF-C, HINF-D, HiNF-D3, HiNF-E, HiNF-P, HIP1, HIV-EP2, Hlf, HLTF, HLTF(Metl23), HLX, HMBP, HMG I, HMG I(Y), HMG Y, HMGI-C, HNF-IA, HNF-IB, HNF-IC, HNF-3, HNF-3알파, HNF-3베타, HNF-3감마, HNF4, HNF-4알파, HNF4알파l, HNF-4알파2, HNF-4알파3, HNF-4알파4, HNF4감마, HNF-6알파, hnRNP K, HOX11, HOXAl, HOXAIO, HOXAIO PL2, HOXA11, HOXA13, HOXA2, HOXA3, HOXA4, HOXA5, HOXA6, HOXA7, HOXA9A, HOXA9B, HOXB-1, HOXB13, HOXB2, HOXB3, HOXB4, HOXBS, HOXB6, HOXA5, HOXB7, HOXB8, HOXB9, HOXC10, HOXC11, HOXC12, HOXC13, HOXC4, HOXC5, HOXC6, HOXC8, HOXC9, HOXD10, HOXD11, HOXD12, HOXD13, HOXD3, HOXD4, HOXD8, HOXD9, Hp55, Hp65, HPX42B, HrpF, HSF, HSF1(긴), HSF1(?은), HSF2, hsp56, Hsp90, IBP-1, ICER-II, ICER-li감마, ICSBP, Idl, Idl H', Id2, Id3, Id3/Heir-1, IF1, IgPE-1, IgPE-2, IgPE-3, I카파B, I카파B-알파, I카파B-베타, I카파BR, II-l RF, IL-6 RE-BP, 11-6 RF, INSAF, IPF1, IRF-1, IRF-2, B, IRX2a, Irx-3, Irx-4, ISGF-1, ISGF-3, ISGF3알파, ISGF-3감마, 1st- 1, ITF, ITF-1, ITF-2, JRF, Jun, JunB, JunD, 카파 인자, KBP-1, KER1, KER-1, Koxl, KRF-1, Ku 자가항원, KUP, LBP-1, LBP-la, LBXl, LCR-Fl, LEF-1, LEF-IB, LF-A1, LHX1, LHX2, LHX3a, LHX3b, LHXS, LHX6.1a, LHX6.1b, LIT-1, Lmol, Lmo2, LMX1A, LMX1B, L-Myl(긴 형태), L-Myl(짧은 형태), L-My2, LSF, LXR알파, LyF-1, Lyl-l, M 인자, Madl, MASH-1, Maxl, Max2, MAZ, MAZ1, MB67, MBF1, MBF2, MBF3, MBP-1(1), MBP-1(2), MBP-2, MDBP, MEF-2, MEF-2B, MEF-2C(433 AA 형태), MEF-2C(465 AA 형태), MEF-2C(473 M 형태), MEF-2C/델타32(441 AA 형태), MEF-2D00, MEF-2D0B, MEF-2DA0, MEF-2DAO, MEF-2DAB, MEF-2DA'B, Meis-1, Meis-2a, Meis-2b, Meis-2c, Meis-2d, Meis-2e, Meis3, Meoxl, Meoxla, Meox2, MHox(K-2), Mi, MIF-1, Miz-1, MM-1, MOP3, MR, Msx-1, Msx-2, MTB-Zf, MTF-1, mtTFl, Mxil, Myb, Myc, Myc 1, Myf-3, Myf-4, Myf-5, Myf-6, MyoD, MZF-1, NCI, NC2, NCX, NELF, NER1, Net, NF Ill-a, NF NF-1, NF-1A, NF-1B, NF-1X, NF-4FA, NF-4FB, NF-4FC, NF-A, NF-AB, NFAT-1, NF-AT3, NF-Atc, NF-Atp, NF-Atx, Nf etaA, NF-CLEOa, NF-CLEOb, NF델타E3A, NF델타E3B, NF델타E3C, NF델타E4A, NF델타E4B, NF델타E4C, Nfe, NF-E, NF-E2, NF-E2 p45, NF-E3, NFE-6, NF-Gma, NF-GMb, NF-IL-2A, NF-IL-2B, NF-jun, NF-카파B, NF-카파B(-유사), NF-카파Bl, NF-카파B 1, 전구체, NF-카파B2, NF-카파B2(p49), NF-카파B2 전구체, NF-카파El, NF-카파E2, NF-카파E3, NF-MHCIIA, NF-MHCIIB, NF-muEl, NF-muE2, NF-muE3, NF-S, NF-X, NF-X1, NF-X2, NF-X3, NF-Xc, NF-YA, NF-Zc, NF-Zz, NHP-1, NHP-2, NHP3, NHP4, NKX2-5, NKX2B, NKX2C, NKX2G, NKX3A, NKX3A vl, NKX3A v2, NKX3A v3, NKX3A v4, NKX3B, NKX6A, Nmi, N-Myc, N-Oct-2알파, N-Oct-2베타, N-Oct-3, N-Oct-4, N-Oct-5a, N-Oct-5b, NP-TCII, NR2E3, NR4A2, Nrfl, Nrf-1, Nrf2, NRF-2베타l, NRF-2감마l, NRL, NRSF 형태 1, NRSF 형태 2, NTF, 02, OCA-B, Oct-1, Oct-2, Oct-2.1, Oct-2B, Oct-2C, Oct-4A, Oct4B, Oct-5, Oct-6, Octa-인자, 옥타머 결합 인자, oct-B2, oct-B3, Otxl, Otx2, OZF, pl07, pl30, p28 조절인자, p300, p38erg, p45, p49erg,-p53, p55, p55erg, p65델타, p67, Pax-1, Pax-2, Pax-3, Pax-3A, Pax-3B, Pax-4, Pax-5, Pax-6, Pax-6/Pd-5a, Pax-7, Pax-8, Pax-8a, Pax-8b, Pax-8c, Pax-8d, Pax-8e, Pax-8f, Pax-9, Pbx-la, Pbx-lb, Pbx-2, Pbx-3a, Pbx-3b, PC2, PC4, PC5, PEA3, PEBP2알파, PEBP2베타, Pit-1, PITX1, PITX2, PITX3, PKNOX1, PLZF, PO-B, 폰틴 52, PPAR알파, PPAR베타, PPAR감마l, PPAR감마2, PPUR, PR, PR A, pRb, PRD1-BF1, PRDI-BFc, Prop-1, PSE1, P-TEFb, PTF, PTF알파, PTF베타, PTF델타, PTF감마, Pu 박스 결합 인자, Pu 박스 결합 인자(B JA-B), PU.1, PuF, Pur 인자, Rl , R2, RAR-알파l , RAR-베타, RAR-베타2, RAR-감마, RAR-감마l, RBP60, RBP-J카파, Rel, RelA, RelB, RFX, RFXl, RFX2, RFX3, RFXS, RF-Y, ROR알파l, ROR알파2, ROR알파3, ROR베타, ROR감마, Rox, RPF1, RPG알파, RREB-1, RSRFC4, RSRFC9, RVF, RXR-알파, RXR-베타, SAP-la, SAPlb, SF-1, SHOX2a, SHOX2b, SHOXa, SHOXb, SHP, SIII-pl lO, SIII-pl5, SIII-pl8, SIM', Six-1, Six-2, Six-3, Six-4, Six-5, Six-6, SMAD-1, SMAD-2, SMAD-3, SMAD-4, SMAD-5, SOX-11, SOX-12, Sox-4, Sox-5, SOX-9, Spl, Sp2, Sp3, Sp4, Sph 인자, Spi-B, SPIN, SRCAP, SREBP-la, SREBP-lb, SREBP-lc, SREBP-2, SRE-ZBP, SRF, SRY, SRPl, Staf-50, STATl알파, STATl베타, STAT2, STAT3, STAT4, STAT6, T3R, T3R-알파l, T3R-알파2, T3R-베타, TAF(I)110, TAF(I)48, TAF(I)63, TAF(II)100, TAF(II)125, TAF(II)135, TAF(II)170, TAF(II)18, TAF(II)20, TAF(II)250, TAF(II)250델타, TAF(II)28, TAF(II)30, TAF(II)31, TAF(II)55, TAF(II)70-알파, TAF(II)70-베타, TAF(II)70-감마, TAF-I, TAF-II, TAF-L, Tal-1, Tal-l베타, Tal-2, TAR 인자, TBP, TBX1A, TBX1B, TBX2, TBX4, TBXS(긴 아이소형), TBXS(짧은 아이소형), TCF, TCF-1, TCF-1A, TCF-1B, TCF-1C, TCF-1D, TCF-1E, TCF-1F, TCF-1G, TCF-2알파, TCF-3, TCF-4, TCF-4(K), TCF-4B, TCF-4E, TCF베타l, TEF-1, TEF-2, tel, TFE3, TFEB, TFIIA, TFIIA-알파/베타 전구체, TFIIA-알파/베타 전구체, TFIIA-감마, TFIIB, TFIID, TFIIE, TFIIE-알파, TFIIE-베타, TFIIF, TFIIF-알파, TFIIF-베타, TFIIH, TFIIH*, TFIIH-CAK, TFIIH-사이클린 H, TFIIH-ERCC2/CAK, TFIIH-MAT1, TFIIH-M015, TFIIH-p34, TFIIH-p44, TFIIH-p62, TFIIH-p80, TFIIH-p90, TFII-I, Tf-LFl, Tf-LF2, TGIF, TGIF2, TGT3, THRAl, TIF2, TLE1, TLX3, TMF, TR2, TR2-11, TR2-9, TR3, TR4, TRAP, TREB-1, TREB-2, TREB-3, TREFl, TREF2, TRF(2), TTF-1, TXRE BP, TxREF, UBF, UBP-1, UEF-1, UEF-2, UEF-3, UEF-4, USF1, USF2, USF2b, Vav, Vax-2, VDR, vHNF-lA, vHNF-lB, vHNF-lC, VITF, WSTF, WT1, WT1I, WT1 I-KTS, WT1 I-del2, WT1-KTS, WTl-del2, X2BP, XBP-1, XW-V, XX, YAF2, YB-1, YEBP, YY1, ZEB, ZF1, ZF2, ZFX, ZHX1, ZIC2, ZID, ZNF 174를 포함하지만 이에 제한되지는 않는다.
활성화된 전사 인자는 자극에 의해 활성화되어 전사 인자 상태의 측정 가능한 변화, 예를 들어 인산화, 메틸화 등과 같은 번역 후 변형을 초래하는 전사 인자이다. 전사 인자의 활성화는 특정 DNA 서열 또는 특정 단백질, 예컨대 다른 전사 인자 및/또는 보조 인자에 대한 친화도의 변화를 초래할 수 있다.
트랜스포좀: 트랜스포사제-트랜스포존 복합체. 트랜스포존 돌연변이 유발을 위한 통상적인 방법은 일반적으로 플라스미드 상에 트랜스포사제를 위치시킨다. "트랜스포좀"으로 불리는 일부 이러한 시스템에서, 트랜스포사제는 전위 반응을 촉매할 수 있는 트랜스포존 인식 부위와 기능적 복합체를 형성할 수 있다. 트랜스포사제 또는 인테그라제는 트랜스포사제 인식 부위에 결합하고, 때때로 "태그멘테이션"이라고 불리는 과정에서 트랜스포사제 인식 부위를 표적 핵산에 삽입할 수 있다.
결합을 허용하는 조건하에서: 원하는 활성을 허용하는 임의의 환경, 예를 들어 핵산 분자 및/또는 단백질 분자와 같은 2개 이상의 분자가 결합할 수 있는 조건을 설명하는데 사용되는 문구. 이러한 조건은 분자의 결합을 용이하게 하는 특정 농도의 염 및/또는 다른 화학 물질을 포함할 수 있다.
본 개시 내용의 실시 또는 시험을 위한 적절한 방법 및 재료를 아래에 기술한다. 이러한 방법 및 재료는 단지 예시적인 것이며 제한하려는 것은 아니다. 본원에 기술된 것과 유사하거나 동등한 다른 방법 및 재료가 사용될 수 있다. 예를 들어, 본 개시 내용이 속하는 기술 분야에서 잘 알려진 종래의 방법은, 예를 들어, 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual, 2d ed., Cold Spring Harbor Press, 1989; Sambrook et al., Molecular Cloning: A Laboratory Manual, 3d ed., Cold Spring Harbor Press, 2001; Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing Associates, 1992(및 2000년까지의 보충판); Ausubel et al., Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, 4th ed., Wiley & Sons, 1999; Harlow and Lane, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1990; and Harlow and Lane, Using Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1999]을 포함하는 여러 일반적이고 더 구체적인 참고 문헌에 기술되어있다. 또한, 재료, 방법, 및 실시예는 단지 예시적인 것이며 제한하려는 것은 아니다.
B. 도입
ChIP의 체계적 편향과 아티팩트(artifact)로 인한 불확실성은 다른 원리에 기반한 방법의 필요성을 강조한다. 비-ChIP 맵핑 방법의 부류는 키메라 융합에 의한 DNA 결합 단백질에 효소의 테더링 및 국소 부근의 DNA에 대한 효소의 작용을 수반한다. 예를 들어, DamID(van Steensel et al., 2001) 및 관련 방법(Southall et al., 2013; Hass et al., 2015)에서, 에쉐리키아 콜라이(Escherichia coli) Dam 메틸트랜스퍼라제는 TF에 테더링되어 생체 내 GATC 부위에서 아데닌의 N6 메틸화를 촉매한다. N6-메틸-지정 제한 효소를 사용하여 부위들을 게놈 전체에 맵핑할 수 있다. 그러나 DamID의 해상도는 GATC 부위의 분포에 의해 제한되므로 DamID는 서열 분석 리드-아웃(read-out)을 사용하여 잠재적으로 얻을 수 있는 고해상도를 얻을 수 없다(Aughey and Southall, 2016). 대안적인 효소 테더링 방법인 염색질 내인성 절단(ChEC: chromatin endogenous cleavage)은 엔도-엑소뉴클레아제 마이크로코커스의 뉴클레아제(MNase: Micrococcal Nuclease)를 TF에 테더링한다(Schmid et al., 2004). ChEC에서, MNase는 세포를 투과화하고 제어된 절단을 위해 칼슘을 첨가함으로써 활성화된다. 최근에 일루미나 서열 분석 리드-아웃이 ChEC(ChEC-seq)에 적용되어 거의 염기쌍 분해능을 달성하였다(Zentner et al., 2015). 효소 테더링 방법은 살아있는 세포 또는 투과화된 세포로부터 직접 DNA를 추출하여 염색질을 용해시키고 회수할 필요가 없이 생체 내(DamID) 또는 원위치(ChEC)에서 수행되므로 ChIP와 근본적으로 다르다. DamID 및 ChEC는 맵핑되는 각각의 TF에 대해 상이한 키메라 융합 작제물이 생성되어야 할 것을 요구하여, 예를 들어 동물 모델, 환자 생검 및 번역 후 변형으로의 전이 가능성을 제한한다. 최초의 염색질 면역 절단(ChIC) 방법에서, 가교 결합된 세포로부터의 조 핵은 먼저 TF 특이적 항체로 처리된 후, 단백질 A와 MNase(pA-MN) 사이의 키메라 융합이 첨가되고 칼슘에 의해 활성화된다(Schmid et al. 2004). 단백질 A는 면역글로불린 G에 특이적으로 결합하여 융합 단백질의 필요성을 없앤다.
C. 예시적인 실시 양태의 설명
효소 테더링 방법의 장점을 유지하면서 적용성 및 사용 용이성을 기존의 다른 방법론을 대체할 정도로 확장시킨 ChIC의 주요 개발 내용을 본원에서 개시한다. 개시된 방법의 독특한 특징은 가교 결합 없이, TF의 양 측면에서 칼슘 유도된 MNase 절단과 같은 유도된 절단 수 초 후에, TF-DNA 복합체가 용액으로 방출되어 원심분리 및 DNA 추출에 의해 서열 분석을 위한 순수한 TF 결합된 DNA 단편을 간단히 회수할 수 있다는 것이다. 또한, 일부 예에서, 자성 비드에서 절차를 수행함으로써, 개시된 표적 하 절단 및 뉴클레아제를 이용한 방출(CUT&RUN: Cleavage Under Targets and Release Using Nuclease) 방법은 원위치 방법의 장점을 유지하면서 ChIP-seq보다 더 간단하다. CUT&RUN에 의한 표적화된 분해는 표준 ChIP 방법의 서열 분석 깊이의 약 1/10만을 필요로 하여, ChIP의 완전한 게놈 단편화에 비해 배경을 크게 줄인다. 더욱이, 간단한 스파이크-인 대조군은 다른 방법으로는 불가능한 단백질 결합의 정확한 정량을 허용한다. 개시된 방법은 낮은 출발 세포 수를 허용하고, 자성 비드에서 반응을 수행함으로써 로봇 자동화가 가능하다.
표적 하 절단 및 뉴클레아제를 이용한 방출(CUT&RUN)은 예를 들어 마이크로코커스의 뉴클레아제에 의한, 항체-표적화된 제어된 절단이 페어드-엔드 DNA 서열 분석을 위한 상등액으로 특정 단백질-DNA 복합체를 방출하는 후성 유전체 프로파일링 전략이다. 표적화된 단편만이 용액으로 들어가고, 대다수의 DNA가 남겨짐에 따라, CUT&RUN은 염색질 결합을 조사하기 위한 다른 기술과 비교하여 현저히 낮은 배경 수준을 갖는다. CUT&RUN은 해상도, 신호 대 잡음, 및 필요한 서열 분석 깊이에 있어 가장 널리 사용되는 염색질 면역 침전(CHIP) 프로토콜을 능가한다. ChIP와 대조적으로, CUT&RUN에는 용해도 및 DNA 접근성 아티팩트가 없으며 불용성 염색질을 프로파일링하고 가교 결합 없이 장거리 3D 접촉을 검출하는데 사용될 수 있다. 또한, 핵의 단리를 필요로 하지 않고 히스톤 변형을 위해 단지 1 또는 2개 이내의 세포 및 전사 인자 맵핑을 위해 1000개의 세포로 출발하여 고품질 데이터를 제공하는 개선된 CUT&RUN 프로토콜을 본원에서 개시한다. 세포에서 정제된 DNA까지 CUT&RUN은 실험실 벤치에서 하루 미만을 요구한다.
세포(또는 세포 집단)에서 DNA 서열에 대한 관심의 염색질 관련 인자의 결합을 검출하는 방법을 본원에 개시한다. 특정 실시 양태에서, 개시된 방법은 약 4℃ 미만의 온도에서 가교 결합되지 않은 투과화된 세포를 관심의 염색질 관련 인자를 특이적으로 인식하는 특이적 결합제와 접촉시키는 단계를 포함하며, 여기서 특이적 결합제는 불활성이고 활성화 가능한 뉴클레아제 또는 선택적으로 불활성이고 활성화 가능한 트랜스포사제를 포함하는 트랜스포좀에 예를 들어 양이온과 같은 이온의 첨가에 의해 연결된다. 특정 실시 양태에서, 세포 및/또는 세포의 핵은 세포를 투과화하는 작용제, 예를 들어 세제, 예를 들어 트리톤(Triton) 및/또는 NP-40 또는 다른 작용제, 예를 들어 디기토닌과 세포를 접촉시킴으로써 투과화된다. 온전한 세포 또는 핵을 사용함으로써, 개시된 방법은 ChIP 방법에 비해 달리 단편화 및 다른 처리 단계에 의해 변경될 수 있는 천연 염색질 구조를 관찰하는 장점을 갖는다. 실시 양태에서, 뉴클레아제 또는 트랜스포사제는 예를 들어 외인성 활성화제를 사용하여 활성화된다. 일단 활성화되면 뉴클레아제 또는 트랜스포사제는 관심의 염색질 관련 인자에 결합된 DNA의 서열을 절제할 수 있다. 특정 실시 양태에서, 반응은 관심의 염색질 관련 인자에 결합된 DNA를 절제하기에 충분하지만 뉴클레아제 또는 트랜스포사제가 확산하여 접근 가능한 DNA를 비특이적으로 절단하지 않도록 충분히 짧은 시간 동안 진행될 수 있다. 특정 실시 양태에서, 이 기간은 약 1초 내지 약 4시간이다.
뉴클레아제를 사용할 때, 특정 관심의 염색질 관련 인자에 대해 기간을 선택할 수 있다. 예를 들어, 매우 풍부한 단백질일 경우, 시간이 지남에 따라 단백질이 방출되고 게놈 내 접근 가능한 DNA를 파괴하기 때문에(결합되지 않더라고 농도에 따라 아마도 선형인 원하지 않는 부작용임) 10분조차도 너무 길 수 있다. 뉴클레아제를 불활성화시킨 후, 관심의 염색질 관련 인자에 결합된 절제된 DNA가 회수된다. 이 절제된 염색질을 단리하고 조사하여 절제된 DNA의 서열을 결정함으로써, 세포(또는 세포 집단)에서 DNA의 서열에 대한 관심의 염색질 관련 인자의 결합을 검출할 수 있다.
트랜스포사제를 사용할 때는 상기 제약이 적용되지 않다. 트랜스포사제가 사용될 때, 단편은 결합된 상태로 유지된다. 이는 트랜스포사제와 관련하여 문제가 되지 않는데 그 이유는 트랜스포사제가 태그멘테이션 중에 방출되지 않기 때문이며, 이것이 이 방법의 주요 이점이다. 실제로, Tn5는 자신의 페이로드를 삽입할 때 다른 곳에서 손상을 일으킬 수 없다("원앤던(one and done)"). 따라서 이러한 방법을 사용하면 모든 인자에 대해 시간 변동이 중요한 매개변수가 아니라 완전한 태그(37℃에서 약 1시간)가 된다. 이것이 주요 장점이다. 따라서, 면역 테더링된 삽입 서열 분석(ImmunoTethered Insertion Sequencing)(ITIS 또는 IT-seq)으로 명명된 CUT&RUN의 개선을 본원에서 추가로 개시한다. 표준 CUT&RUN은 데이터 품질의 상당한 손실 없이 100~1000개 세포에 적용될 수 있지만, 고 처리량 단일 세포 적용은 표적화된 단편을 함유하는 상등액을 나머지 게놈을 함유하는 세포로부터 분리해야 하기 때문에 복잡하다. 또한, 상자성 비드에 세포를 고정하여 제공되는 쉬운 작업 흐름은 DNA 서열 분석 라이브러리 제조가 뒤따르며, 전체 절차의 시간, 비용 및 노력을 크게 증가시킨다. 하기 실시예에 개시된 바와 같이, 본 발명자들은 과활성 Tn5 트랜스포사제와 같은 트랜스포사제를 단백질 A에 융합시키고 서열 분석 플랫폼 상용 가능한 모자이크 말단 올리뉴클레오티드가 로딩된 단백질 A/Tn5 복합체에 의한 pA-MN의 첨가를 대체함으로써 CUT&RUN의 역량을 확장시켰다. Mg++에 의한 Tn5의 활성화는 벌크 및 단일 세포 적용 모두에 대한 PCR 증폭을 위해 준비된 항체 표적화된 태그멘테이션을 초래한다. 본원에 개시된 ITIS 방법은 방법의 매력적인 특징인 하루 안에 살아있는 세포로부터 증폭된 서열 준비된 라이브러리를 제공한다.
특정 실시 양태에서, DNA는 염색질 DNA이다. 특정 실시 양태에서, 세포 및/또는 핵은 가교 결합 단계가 적용될 수 있다. 다른 실시 양태에서, 세포는 가교 결합 단계가 적용되지 않는다.
ChIC, ChEC 및 ChEC-seq는 절단을 표적화하는 단계 및 이러한 절단을 표적화 부위에 가깝게 맵핑하는 단계에 기초한다. 대조적으로, 개시된 방법은 DNA-단백질 복합체가 상등액으로 방출될 정도로 서로 충분히 가까운 절단 쌍을 사용한다. 개시된 방법에서, 방출된 DNA-단백질 복합체로부터의 DNA를 정제하고 라이브러리 제조 및 서열 분석에 적용한다. 개시된 방법의 다른 실시 양태에서, 상등액을 추출하지 않고, 오히려 추가의 분석 방법론, 예를 들어 1) 염 분획법(CUT&RUN.Salt); 2) 입력으로서 CUT&RUN으로부터의 상등액을 사용하는 ChIP-seq(CUT&RUN.ChIP); 3) 상등액 내 입자의 단백질 상보체 특성화를 거친다. CUT&RUN의 이러한 세 가지 확장 모두 DNA-단백질 복합체를 상등액으로 방출해야 하므로 CUT&RUN의 독특한 혁신을 나타낸다. 실시 양태에서, 상기 방법은 세포 밖으로 확산된 절제된 DNA를 염 분획법에 적용하는 단계를 포함한다. 실시 양태에서, 방법은 상등액을 ChIP-seq에 적용하는 단계를 포함한다. 실시 양태에서, 방법은 관심의 염색질 관련 인자와 관련된 하나 이상의 단백질의 정체를 결정하는 단계를 포함한다. 실시 양태에서, 단백질의 정체를 결정하는 단계는 항체의 사용을 포함한다. 실시 양태에서, 단백질의 정체를 결정하는 단계는 질량 분석법을 포함한다.
특정 실시 양태에서, 염색질 DNA는 뉴클레아제를 사용하여 절단되며, 이는 항체와 같은 특이적 결합제에 연결 및/또는 테더링된다. 따라서, 실시 양태에서, 개시된 방법은 가교 결합되지 않은 투과화된 세포를 관심의 염색질 관련 인자를 특이적으로 인식하는 특이적 결합제와 접촉시키는 단계를 포함하며, 여기서 특이적 결합제는 염색질 DNA로 트랜스포존의 통합을 허용하는 조건하에서 하나 이상의 인공 트랜스포좀에 연결된다. 특정 실시 양태에서, 뉴클레아제는 엔도데옥시리보뉴클레아제, 예컨대 마이크로코커스의 뉴클레아제(MNase)이다. 활성화될 수 있다는 것은 뉴클레아제가 불활성 상태에서 활성 상태로 전환될 수 있음을 의미한다. 이 전환은 이펙터를 추가하거나 조건을 변경하여 개시될 수 있다. 특정 실시 양태에서, 이펙터는 Ca2 + 또는 Mg++ 이온과 같은 소분자 또는 원자이다. 사용될 수 있는 뉴클레아제는 이 활성이 활성화될 수 있다면, 단일 또는 바람직하게는 이중 가닥 절단 부위인 절단 부위를 DNA 내로 유도할 수 있는 임의의 단백질이다. 개시된 방법에 사용된 뉴클레아제는 일반적으로 뉴클레오솜 링커 영역 및 뉴클레아제 과민성 부위에서, 대부분 서열 무관한 방식으로 DNA를 절단할 수 있다. 그러나 많은 뉴클레아제는 서열 특이적 방식으로 DNA를 절단하는데, 즉 절단은 주로 소수의 뉴클레오티드의 인식 서열에서 발생한다. 불활성 상태라는 것은 뉴클레아제의 활성이 모니터링하기에는 너무 낮거나, 활성일 때 최대 속도의 10% 미만, 바람직하게는 4% 미만 또는 1% 미만인 것을 의미한다. 비활성 상태에서 활성 상태로의 전이는 예를 들어 화합물의 첨가에 의해 또는 온도를 전환함으로써 유발될 수 있다. 특히 유용한 뉴클레아제는 마이크로코커스의 뉴클레아제(MN)이며, 이의 활성은 Ca2 + 이온에 엄격하게 의존한다. 이 효소는 뉴클레오솜 링커 영역 및 뉴클레아제 과민성(HS) 부위에서 염색질 내 DNA 이중 가닥 절단을 도입한다. 특히 유용한 MNase의 예는 뉴클레아제 A의 성숙 사슬(젠뱅크(Genbank) P00644의 아미노산 83 내지 231(이는 이로써 2017년 9월 25일자로 이용 가능한 참고로 포함됨)을 코딩하는 서열이다. 활성을 보유하는 변이체, 예컨대 젠뱅크 P00644의 아미노산 83 내지 231과 적어도 70%, 80%, 90%, 95% 또는 심지어 99%의 동일성을 갖는 것들이 또한 고려된다.
본 개시 내용의 효소, 예를 들어 뉴클레아제는 정의된 부위, 바람직하게는 서열 특이적 부위의 정의된 부위에서 염색질에 결합하는 염색질 단백질에 테더링된다. 관심의 이 염색질 단백질에 효소를 테더링함으로써, 이전의 비특이적 효소(예를 들어, 뉴클레아제)는 테더링된 염색질 단백질에 의해 정의된 특정 서열로 동원된다.
본 개시 내용의 바람직한 실시 양태에서, 뉴클레아제(또는 다른 효소 활성)가 태그된다. 사용된 태그는 임의의 유형의 태그, 예를 들어 단백질의 정제를 용이하게 하기 위한 His 태그, 또는 헤마글루티닌(HA) 에피토프와 같은 에피토프, 또는 아비딘, 스트렙타비딘 또는 비오틴일 수 있다.
바람직한 실시 양태에 따르면, 뉴클레아제는 융합 단백질 X-뉴클레아제 또는 뉴클레아제-X의 일부이며, 여기서 X는 펩티드 도메인이다. X는 에피토프 또는 항체일 수 있고, X는 또한 예를 들어 비오틴에 대해, 친화성 도메인일 수 있다. 본 출원과 관련하여, 항체라는 것은 완전 항체 또는 상호 작용을 지시하기에 충분한 항체의 일부를 의미한다. 이러한 일부는 바람직하게는 항체의 가변 영역 Fab이다.
일부 실시 양태에서, 항체는 하나 이상의 트랜스포좀에 간접적으로 커플링된다. 일부 실시 양태에서, 트랜스포사제는 항체에 특이적으로 결합하는 특이적 결합제에 연결된다. 일부 실시 양태에서, 특이적 결합제는 단백질 A, 단백질 G 또는 항체에 특이적으로 결합하는 제2 항체를 포함한다. 일부 실시 양태에서, 항체는 제1 항체이고, 방법은 세포를 제1 항체에 특이적으로 결합하는 제2 항체와 접촉시키는 단계를 추가로 포함하고, 여기서 트랜스포사제는 제2 항체에 특이적으로 결합하는 특이적 결합제에 연결된다. 일부 실시 양태에서, 특이적 결합제는 단백질 A 또는 단백질 G 또는 제2 항체에 특이적으로 결합하는 제3 항체를 포함한다. 일부 실시 양태에서, 염색질 DNA 서열에 대한 관심의 염색질 관련 인자의 결합은 직접적이다.
뉴클레아제 및/또는 트랜스포사제는 또한 스태필로코커스의(staphylococcal) 단백질 A(pA)의 전부 또는 일부 또는 스태필로코커스의 단백질 G(pG)의 전부 또는 일부 또는 pA 및 pG(pAG) 둘 다에 융합될 수 있다. 이들 단백질은 토끼 및 마우스 IgG에 대해 실제로 상이한 친화도를 갖는다. 뉴클레아제는 또한 임의의 다른 단백질 또는 단백질 모이어티, 예를 들어 항체에 대한 친화도를 갖는 pA 또는 pG의 유도체에 융합될 수 있다. 본 개시 내용의 바람직한 실시 양태는 실시 예에서 상세히 설명된 융합 단백질 pAG-MN이다. 이 경우, pA 모이어티는 스태필로코커스의 단백질 A의 2개의 IgG 결합 도메인, 즉 젠뱅크 AAA26676(이는 이로써 2017년 9월 25일자로 이용 가능한 참고로 포함됨)의 아미노산 186 내지 327을 함유한다. 젠뱅크 AAA26676의 아미노산 186 내지 327과 적어도 70% 80%, 90%, 95% 또는 심지어 99%의 동일성의 서열 동일성을 갖는 것들과 같이 활성을 보유하는 변이체가 또한 고려된다. 그러나 본 개시 내용은 이러한 특정 융합 단백질로 제한되지 않는다. 대안적으로, 효소, 예를 들어 뉴클레아제는 펩티드 결합 이외의 결합에 의해 X 도메인에 화학적으로 연결될 수 있다.
뉴클레아제 활성화 시간은 반응이 일어나는 온도에 크게 좌우된다. 효소 반응이 얼음 상에서 즉, 0도에서 수행되는 경우, 활성화 시간은 그에 따라 조정되며, 이는 약 10℃ 미만, 예컨대 약 10℃, 약 9℃, 약 8℃, 약 7℃, 약 6℃, 약 5℃, 약 4℃, 약 3℃, 약 2℃, 약 1℃ 또는 약 0℃ 미나, 그러나 약 -4℃ 초과의 온도에서 수행되는 동일한 효소 반응에 비해 길어진다.
뉴클레아제 또는 트랜스포사제와 같은 효소를 연결 및/또는 테더링하는 방법은 통상적이며, 예를 들어 미국 특허 제7,790,379호(이는 이로써 그 전체가 본원에 참고로 포함됨)에서 찾아볼 수 있다. 특정 실시 양태에서, 뉴클레아제 또는 트랜스포사제는 융합 단백질의 일부이다. 특정 실시 양태에서, 융합 단백질은 스태필로코커스의 단백질 A(pA), 스태필로코커스의 단백질 G(pG), pA와 pG(pAG) 사이의 융합, 또는 항체를 포함한다.
특정 실시 양태에서, 특이적 결합제는 항체 또는 그의 특이적 결합 단편을 포함한다. 염색질 관련 인자, 또는 이의 단편 또는 보존적 변이체는 수용체 폴리펩티드의 에피토프에 면역 반응성이거나 결합하는 항체를 생성하는데 사용될 수 있다. 다클론 또는 단클론 항체 및 단클론 항체의 단편, 예컨대 Fab, F(ab') 2 및 Fv 단편뿐만 아니라 염색질 관련 인자로부터 유래된 펩티드에 특이적으로 결합할 수 있는 임의의 작용제가 생성될 수 있다. 최적으로, 염색질 관련 인자에 대해 생성된 항체는 관심의 염색질 관련 인자에 특이적으로 결합할 것이다. 즉, 이러한 항체는 단백질을 인식하고 이에 결합할 것이고 다른 단백질을 실질적으로 인식하거나 결합하지 않을 것이다. 항체가 표적 또는 관심의 내재화 수용체 폴리펩티드에 특이적으로 결합한다는 것은 다수의 표준 면역 분석 방법 중 어느 하나, 예를 들어, 웨스턴 블롯팅 기술(Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.)에 의해 결정된다.
면역원으로 사용하기에 적합한 실질적으로 순수한 표적 또는 내재화 수용체 폴리펩티드는 정제 또는 재조합 발현에 의해 단리된다. 대안적으로, 항체는 합성 표적에 대해 생성될 수 있다.
다클론 항체의 제조는 당업자에게 공지되어있다. 예를 들어, 문헌[Green et al., "Production of Polyclonal Antisera," in Immunochemical Protocols pages 1-5, Manson, ed., Humana Press 1992; Coligan et al., "Production of Polyclonal Antisera in Rabbits, Rats, Mice and Hamsters," in: Current Protocols in Immunology, section 2.4.1, 1992]을 참조한다. 단클론 항체의 제조도 마찬가지로 통상적이다. 예를 들어, 문헌[[Kohler & Milstein, Nature 256:495, 1975; Coligan et al., sections 2.5.1-2.6.7; and Harlow et al., in: Antibodies: a Laboratory Manual, page 726, Cold Spring Harbor Pub., 1988]을 참조한다. 기재된 바와 같이 식별되고 단리된 표적 또는 내재화 수용체 폴리펩티드의 에피토프에 대한 단클론 항체는 문헌[Kohler and Milstein, Nature 256:495, 1975]의 고전적인 방법 또는 이의 파생 방법에 따라 쥣과 하이브리도마로부터 제조될 수 있다. 특정 항체는 또한 인간 이하 영장류 항체로부터 유래될 수 있다. 개코 원숭이에서 치료적으로 유용한 항체를 생성시키는 일반적인 기술은, 예를 들어 WO 91/11465(1991) 및 문헌[Losman et al., Int . J. Cancer 46:310, 1990]에서 찾아볼 수 있다. 대안적으로, 염색질 관련 인자에 특이적으로 결합하는 항체는 인간화된 단클론 항체로부터 유래될 수 있다. 인간화 단클론 항체는 마우스 면역글로불린의 중쇄 및 경쇄 가변 사슬의 마우스 상보성 결정 영역을 인간 가변 도메인으로 이동시킨 후 마우스 대응물의 프레임워크 영역에 인간 잔기를 치환함으로써 생성된다. 항체는 조합 면역글로불린 라이브러리로부터 단리된 인간 항체 단편으로부터 유래될 수 있다. 예를 들어, 문헌[Barbas et al., in: Methods: a Companion to Methods in Enzymology, Vol. 2, page 119, 1991; Winter et al., Ann. Rev. Immunol . 12:433, 1994]을 참조한다. 인간 면역글로불린 파지 라이브러리를 생성하는데 유용한 클로닝 및 발현 벡터는 예를 들어 스트라타진(STRATAGENE)® 클로닝 시스템(미국 캘리포니아주 라 졸라 소재)으로부터 구입할 수 있다. 항체는 온전한 분자뿐만 아니라 그의 단편, 예컨대 에피토프 결정 인자에 결합할 수 있는 Fab, F(ab')2 및 Fv를 포함한다. 이들 단편을 제조하는 방법은 당 업계에 공지되어있다(예를 들어, 문헌[Harlow and Lane, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, New York, 1988] 참조). 에피토프는 항체의 파라토프가 결합하는 항원 상의 임의의 항원 결정 인자이다. 에피토프 결정 인자는 일반적으로 아미노산 또는 당 측쇄와 같은 분자의 화학적 활성 표면 기로 이루어지며 일반적으로 특정 3차원 구조적 특성뿐만 아니라 특정 전하 특성을 갖는다.
효소와 같은 분자, 예를 들어 뉴클레아제 및 트랜스포사제는 당업자에게 공지된 많은 수단을 이용하여 서로 연결될 수 있다. 링커는 분자를 다른 분자에 결합시키는데 사용되는 임의의 분자일 수 있다. 연결될 분자 및 검출 방법이 수행되는 조건과 같은 인자에 따라, 링커는 유연성, 안정성 및 특정 화학 및/또는 온도 매개변수에 대한 저항성과 같은 특성을 최적화하기 위해 길이 및 조성이 다양할 수 있다. 링커는 연결된 분자가 염색질 관련 인자에 결합할 수 있고 효소가 염색질 DNA를 절단할 수 있게 하도록 충분한 길이여야 한다.
특정 실시 양태에서, 염색질 DNA 서열에 대한 관심의 염색질 관련 인자의 결합은 직접적이다. 다시 말하면, 관심의 염색질 관련 인자는 염색질 DNA와 직접 접촉하고, 예를 들어 DNA 결합 전사 인자의 경우와 마찬가지로 염색질 DNA와 직접 물리적 접촉을 한다. 따라서, 일부 실시 양태에서, 관심의 염색질 관련 인자는 전사 인자이다. 다른 실시 양태에서, 관심의 염색질 관련 인자의 염색질 DNA 서열에 대한 결합은 간접적이다. 다시 말해서, 접촉은 복합체의 구성원을 통한 것과 같이 간접적일 수 있다. 이러한 방식으로 더 긴 범위의 상호 작용이 설명될 수 있다.
특정 실시 양태에서, 염색질 결합제와 상호 작용하는 단백질이 또한 검출될 수 있고 이들의 정체가 결정될 수 있다. 이러한 단백질은 면역친화도 분석와 커플링된 질량 분광 분석법, 매트릭스 보조 레이저 탈착/이온화 비행시간(MALDI-TOF) 질량 맵핑 및 액체 크로마토그래피/4중 극자 비행 전기분무 이온화 이중 질량 분석기(tandem mass spectrometr)(LC/Q-TOF-ESI-MS/MS)의 사용, 2차원 폴리아크릴아미드 겔 전기영동(2D-PAGE)에 의해 분리된 단백질의 서열 태그(Kiernan et al., Anal. Biochem., 301: 49-56, 2002; Poutanen et al., Mass Spectrom., 15: 1685-1692, 2001), 전자 분무 이온화(ESI), 표면 강화 레이저 탈착 이온화(SELDI), 화학 이온화, 및 전자 충격 이온화(EI)에 의해 검출될 수 있다. m/z 비율에 따른 이온 분리는 4중 극자 질량 분석기(Q), 비행시간(TOF) 질량 분석기, 자기 섹터 질량 분석기, 3D 및 선형 이온 트랩, 푸리에 변환 이온 사이클로트론 공명(FT-ICR) 분석기, 및 이들의 조합(예를 들어, 4중 극자 비행시간 분석기, 또는 Q-TOF 분석기)을 포함한 임의의 유형의 질량 분석기로 수행될 수 있다. 분리하기 전에, 샘플은 1차원 이상의 크로마토그래피 분리, 예를 들어 1차원 이상의 액체 또는 크기 배제 크로마토그래피에 적용될 수 있다.
SELDI와 같은 질량 분석법을 사용하여 샘플 내 단백질을 분석하고 식별할 수 있다. 일 예에서, 표면 강화 레이저 탈착 이온화 비행시간(SELDI-TOF) 질량 분석법은 예를 들어 ProteinChip™(Ciphergen Biosystems, 미국 캘리포니아주 팔로 알토 소재)을 사용하여 단백질 발현을 검출하는데 사용된다. 이러한 방법은 당 업계에 잘 알려져 있다(예를 들어, 미국 특허 제5,719,060호; 미국 특허 제6,897,072호 및 미국 특허 제6,881,586호 참조). SELDI는 분석물 포집 또는 탈착을 향상시키는 표면의 에너지 스트림에 분석물을 제공하는 탈착을 위한 고상 방법이다.
일부 실시 양태에서, 세포 또는 이의 집단은 고체 표면, 예를 들어 비드 또는 마이크로타이터 플레이트의 벽에 고정된다. 이러한 고체 표면에 세포를 커플링하는 방법은 예를 들어 고 처리량 기술과 관련하여 당 업계에 알려져있다.
실시 양태에서, DNA 태그와 같은 태그는 예를 들어, 절제된 염색질 DNA의 한쪽 또는 양쪽 말단에서 절제된 염색질 DNA에 추가될 수 있다. 개시된 방법의 과정에서 다양한 태그 서열이 절제된 염색질 DNA에 공유적으로 추가될 수 있다. 본원에 사용된 바와 같이, 용어 "태그"는 핵산에 일부 기능성을 제공하기 위해 다른 핵산에 부착되는 뉴클레오티드 서열을 의미한다. 태그의 예는 바코드, 프라이머 부위, 친화성 태그, 및 리포터 모이어티 또는 이들의 임의의 조합을 포함한다.
일부 실시 양태에서, 태그는 핵산 태그이다. 일부 실시 양태에서, 핵산 태그는 바코드를 포함한다. 이들 핵산 바코드는 예를 들어 샘플, 유기체 등에 의해 절제된 염색질 DNA에 태그를 붙이기 위해 사용될 수 있어서, 다수의 샘플이 샘플 기원에 대한 정보를 보존하면서 동시에 분석될 수 있다. 일반적으로, 바코드는 하나 이상의 특정 핵산을 식별하는데 사용될 수 있는 하나 이상의 뉴클레오티드 서열을 포함할 수 있다. 바코드는 인공 서열일 수 있거나 자연 발생 서열일 수 있다. 바코드는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 이상의 연속적인 뉴클레오티드를 포함할 수 있다. 일부 실시 양태에서, 바코드는 적어도 약 4, 10, 20, 30, 40, 50, 60, 70 80, 90, 100개 이상의 연속적인 뉴클레오티드를 포함한다. 일부 실시 양태에서, 바코드를 포함하는 핵산 집단에서 바코드의 적어도 일부는 상이하다. 일부 실시 양태에서, 바코드의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99%가 상이하다. 이러한 더 많은 실시 양태에서, 모든 바코드는 상이하다. 바코드를 포함하는 핵산 집단에서 상이한 바코드의 다양성은 예를 들어 스핏-풀(spit-pool) 방법을 사용하여 무작위로 생성되거나 비-무작위로 생성될 수 있다. 일부 실시 양태에서, 방대한 수의 이용 가능한 바코드는 각각의 태그된 절제된 염색질 DNA 분자가 고유한 식별을 포함하도록 허용함을 이해할 것이다. 주형 핵산의 혼합물에서 각각의 분자의 고유한 식별은 예를 들어 일배체형 서열 분석, 부모 대립 유전자 식별, 메타 게놈 서열 분석, 및 게놈의 샘플 서열 분석에서 다수의 염색체, 게놈, 세포, 세포 유형, 세포 질환 상태 및 종을 갖는 샘플 내 개별 핵산 분자를 확인하기 위해 몇몇 용도에서 사용될 수 있다.
일부 실시 양태에서, 핵산 태그는 서열 분석 어댑터를 포함한다. 서열 분석 어댑터는 절제된 염색질 DNA의 각 말단에서 동일하거나 상이할 수 있다. 서열 어댑터를 포함하면 예를 들어 페어드-엔드, 및/또는 배열 기반 서열 분석과 같은 차세대 서열 분석을 사용하여, 생성된 단편화된 DNA의 서열 분석을 용이하게 한다.
일부 실시 양태에서, 핵산 태그는 보편적 프라이밍 부위를 포함한다. 보편적 프라이밍 부위를 포함하면 예를 들어 PCR 기반 증폭을 사용하여 생산된 단편화된 DNA의 증폭을 용이하게 한다. 일 실시 양태에서, 프라이머 서열은 증폭에 사용되는 프라이머와 상보적일 수 있다. 다른 실시 양태에서, 프라이머 서열은 서열 분석에 사용되는 프라이머와 상보적이다. 특정 실시 양태에서, 염색질 DNA는 예를 들어 트랜스포사제를 사용하여 동시에 태그되고 절단된다. 따라서, 실시 양태에서, 개시된 방법은 가교 결합되지 않은 투과화된 세포를 관심의 염색질 관련 인자를 특이적으로 인식하는 특이적 결합제와 접촉시키는 단계를 포함하고, 여기서 특이적 결합제는 염색질 DNA로 트랜스포존의 통합을 허용하는 조건하에서 하나 이상의 인공 트랜스포좀에 연결된다.
일부 실시 양태에서, 상기 방법은 세포에서 DNA 서열에 대한 관심의 염색질 관련 인자의 결합 부위를 결정하기 위한 원위치 방법이다. 일부 실시 양태에서, 상기 방법은 투과화된 세포를 관심의 염색질 관련 인자에 특이적으로 결합하는 제1 항체와 접촉시키는 단계를 포함하며, 여기서 제1 항체는 복수의 트랜스포좀, 예컨대 2, 3, 4, 5, 6, 7, 8, 또는 심지어 그 이상, 예를 들어 2~4, 또는 심지어 2~10 및 그 사이의 임의의 개수에 커플링된다. 실시 양태에서, 복수의 트랜스포좀 각각은 하나 이상의 트랜스포사제, 및 제1 트랜스포사제 인식 부위를 포함하는 제1 DNA 분자 및 제2 트랜스포사제 인식 부위를 포함하는 제2 DNA 분자를 포함하는 트랜스포존을 포함한다. 실시 양태에서, 상기 방법은 예를 들어 Mg2+와 같은 2가 양이온으로 트랜스포사제를 활성화시킴으로써, 관심의 염색질 관련 인자에 결합된 DNA의 서열을 절제하고 DNA 태그로 태그하는 단계를 포함하며, 여기서 하나 이상의 트랜스포사제가 제1 및 제2 DNA 분자를 염색질 DNA로 통합시킴으로써, 염색질 DNA를 절단하고 제1 및 제2 DNA 분자로 태그한다. 실시 양태에서, 상기 방법은 절제된 DNA를 단리하는 단계를 포함한다. 실시 양태에서, 상기 방법은 절제된 DNA의 서열을 결정함으로써, 관심의 염색질 관련 인자의 결합을 세포 내 하나 이상의 DNA의 서열에 맵핑하는 단계를 포함한다. 실시 양태에서, 항체는 하나 이상의 트랜스포사제에 간접적으로 커플링된다. 실시 양태에서, 트랜스포사제는 제1 항체에 특이적으로 결합하는 특이적 결합제에 연결된다. 실시 양태에서, 상기 방법은 세포를 제1 항체에 특이적으로 결합하는 제2 항체와 접촉시키는 단계를 추가로 포함하고, 여기서 트랜스포사제는 제2 항체에 특이적으로 결합하는 특이적 결합제에 연결된다. 실시 양태에서, 상기 방법은 세포를 제1 항체에 특이적으로 결합하는 제2 항체와 접촉시키는 단계; 세포를 제2 항체에 특이적으로 결합하는 제3 항체와 접촉시키는 단계를 추가로 포함하며, 여기서 트랜스포사제는 제3 항체에 특이적으로 결합하는 특이적 결합제에 연결된다.
특정 실시 양태에서, 상기 방법은 가교 결합되지 않은 투과화된 세포를 관심의 염색질 관련 인자에 특이적으로 결합하는 항체와 접촉시키는 단계를 포함하고, 여기서 항체는 하나 이상의 트랜스포좀에 커플링된다. 특정 실시 양태에서, 하나 이상의 트랜스포좀은 하나 이상의 트랜스포사제; 및 제1 트랜스포사제 인식 부위를 포함하는 제1 DNA 분자 및 제2 트랜스포사제 인식 부위를 포함하는 제2 DNA 분자를 포함하는 트랜스포존을 포함한다. 특정 실시 양태에서, 상기 방법은, 예를 들어 2가 양이온의 첨가로 트랜스포사제를 활성화시킴으로써, 관심의 염색질 관련 인자에 결합된 DNA의 서열을 절제하고 DNA 태그로 태그하는 단계를 포함하며, 여기서 하나 이상의 트랜스포사제는 제1 및 제2 DNA 분자를 염색질 DNA로 통합시킨다. 실시 양태에서, 상기 방법은 절제된 DNA를 분리하는 단계; 및 절제된 DNA의 서열을 결정함으로써, 관심의 염색질 관련 인자의 결합을 세포 내 하나 이상의 DNA 서열에 맵핑하는 단계를 포함할 수 있다. 인공 트랜스포좀은 하나 이상의 트랜스포사제 및 트랜스포존을 포함한다. 트랜스포존은 제1 트랜스포사제 인식 부위를 포함하는 제1 DNA 분자 및 제2 트랜스포사제 인식 부위를 포함하는 제2 DNA 분자를 포함한다. 트랜스포존(또는 실제로 절단된 트랜스포존의 두 부분)의 통합은 단편화 부위의 양쪽에 통합된 제1 및 제2 DNA 분자를 갖는 절단된(또는 단편화된) DNA를 생성한다. 이러한 방식으로, 염색질 DNA는 단편화 부위에서 단편화되고 태그된다. 일부 예에서, 트랜스포사제 인식 부위는 동일한 서열을 갖는 반면, 다른 예에서, 트랜스포사제 인식 부위는 상이한 서열을 갖는다. 염색질 DNA에 걸쳐 여러 번의 삽입으로, DNA는 차세대 서열 분석 방법으로 분석할 수 있는 작은 단편으로 효과적으로 단편화된다. 일부 실시 양태에서, 염색질 DNA는 2개 이상의 상이한 트랜스포좀과 접촉하고, 상이한 트랜스포좀은 상이한 DNA 서열을 포함한다. 따라서, 태그된 염색질 DNA는 5' 및 3' 말단에서 상이한 트랜스포존 서열로 태그될 수 있다.
트랜스포존의 제1 및 제2 DNA 분자는 다양한 태그 서열을 추가로 포함할 수 있으며, 이는 개시된 방법의 과정에서 단편에 공유적으로 첨가될 수 있다. 본원에 사용된 바와 같이, 용어 "태그"는 핵산에 일부 기능성을 제공하기 위해 다른 핵산에 부착되는 뉴클레오티드 서열을 의미한다. 태그의 예는 바코드, 프라이머 부위, 친화성 태그 및 리포터 모이어티 또는 이들의 임의의 조합, 예를 들어 상기 기재된 것들을 포함한다.
개시된 방법은 임의의 트랜스포사제를 사용할 수 있다. 일부 실시 양태는 과 활성 Tn5 트랜스포사제 및 Tn5 형 트랜스포사제 인식 부위(Goryshin and Reznikoff, J. Biol. Chem., 273:7367(1998)), 또는 MuA 트랜스포사제 및 R1 및 R2 말단 서열을 포함하는 Mu 트랜스포사제 인식 부위(Mizuuchi, K., Cell, 35: 785, 1983; Savilahti, H, et al, EMBO J., 14: 4893, 1995)의 사용을 포함할 수 있다. 과활성 Tn5 트랜스포사제(예를 들어, EZ-Tn5™ 트랜스포사제)와 복합체를 형성하는 예시적인 트랜스포사제 인식 부위. 본원에 제공된 특정 실시 양태와 함께 사용될 수 있는 전위 시스템의 추가 예는 스태필로코커스 아우레우스(Staphylococcus aureus) Tn552(Colegio et al, J. Bacteriol, 183: 2384-8, 2001 ; Kirby C et al, Mol. Microbiol, 43: 173-86, 2002), Tyl(Devine & Boeke, Nucleic Acids Res., 22: 3765-72, 1994 및 국제 공개 WO 95/23875), 트랜스포존 Tn7(Craig, N L, Science. 271: 1512, 1996; Craig, N L, Review in: Curr Top Microbiol Immunol, 204:27-48, 1996), Tn/O 및 IS 10(Kleckner N, et al, Curr Top Microbiol Immunol, 204:49-82, 1996), 마리너(Mariner) 트랜스포사제(Lampe D J, et al, EMBO J., 15: 5470-9, 1996), Tel(Plasterk R H, Curr. Topics Microbiol. Immunol, 204: 125-43, 1996), P 인자(Gloor, G B, Methods Mol. Biol, 260: 97-1 14, 2004), Tn3(Ichikawa & Ohtsubo, J Biol. Chem. 265: 18829-32, 1990), 박테리아 삽입 서열(Ohtsubo & Sekine, Curr. Top. Microbiol. Immunol. 204: 1-26, 1996), 레트로바이러스(Brown, et al, Proc Natl Acad Sci USA, 86:2525-9, 1989), 및 효모의 레트로트랜스포존(Boeke & Corces, Annu Rev Microbiol. 43 :403-34, 1989)을 포함한다. 더 많은 예는 IS5, TnlO, Tn903, IS91 1, 및 조작된 형태의 트랜스포사제 패밀리 효소(Zhang et al,(2009) PLoS Genet. 5:el000689. Epub 2009 Oct 16; Wilson C. et al(2007) J. Microbiol. Methods 71 :332-5) 및 미국 특허 제5,925,545호; 제5,965,443호; 제6,437,109호; 제6,159,736호; 제6,406,896호; 제7,083,980호; 제7,316,903호; 제7,608,434호; 제6,294,385호; 제7,067,644호; 제7,527,966호; 및 국제 특허 공개 WO2012103545호(이들 모두는 구체적으로 그 전문이 본원에 참고로 포함됨)에 기재된 것들을 포함한다. 일부 실시 양태에서, 트랜스포사제는 Tn5 트랜스포사제 또는 이의 과활성 돌연변이체이다. 일부 실시 양태에서, 트랜스포사제는 Mu 트랜스포존이다.
특정 실시 양태에서, 절제된 염색질 DNA 단편은 절제된 염색질 DNA를 고정하기에 적합한 친화성 분자로 코팅된 비드, 막, 또는 표면(예를 들어, 웰 또는 튜브)과 같은 기판상에 단편을 고정시켜 정제된다. 특정 실시 양태에서, 친화성 분자는 실리카 또는 카르복실 코팅된 자성 비드(SPRI 비드)이다. 특정 실시 양태에서, 라이브러리(예를 들어, 일루미나® 서열 분석(Illumina® Inc., 미국 캘리포니아주 샌 디에고 소재)와 같은 차세대 서열 분석 적용을 위한)는 자성 입자상에 구축된다. 이어서 동일한 DNA 흡수 자성 비드를 사용하여 생성된 라이브러리를 정제할 수 있다. 일부 실시 양태에서, 웰에 또는 비드, 예를 들어 자성 비드로서 친화성 표면을 제공하는 추가의 이점은 개시된 방법이 염색질 물질을 출발하여 서열 분석 라이브러리 구축 및 정제까지 96 웰 포맷 또는 미세 유체 플랫폼에서와 같은 다수의 샘플의 병렬 처리에 적용될 수 있다는 것이다. 특정 실시 양태에서, 절제된 염색질 DNA는 핵산 단편과 또는 핵산 단편이 결합된 특정 염색질 관련 인자 및/또는 항체로부터 방출된 후 정제된다.
일부 실시 양태에서, 절제된 염색질 DNA의 정체는 대량 병렬 서열 분석과 같은 DNA 서열 분석에 의해 결정된다. 일부 기술은 고체 유동 세포 기판에서 어댑터 결찰된 절제된 염색질 DNA의 클러스터 증폭을 사용할 수 있다. 이어서, 유동 세포 표면상의 결과로 생긴 고밀도 배열의 주형 클러스터는 예를 들어 형광 표지된 가역적 종결자 뉴클레오티드를 사용하여 동시에 합성에 의한 서열 분석을 받을 수 있다.
주형은 각 리드 과정에서 염기별로 서열 분석될 수 있다. 특정 실시 양태에서, 결과 데이터는 샘플 서열을 공지된 게놈 서열에 정렬시키는 데이터 수집 및 분석 소프트웨어를 사용하여 분석될 수 있다. 이 기술의 감도는 서열 분석 실행의 깊이(예를 들어, 맵핑된 서열 태그의 수), 게놈의 크기, 및 표적 인자의 분포와 같은 인자에 의존할 수 있다. 다수의 짧은 리드를 통합함으로써, 매우 정확한 결합 부위의 위치를 지정할 수 있다. 특정 실시 양태에서, 데이터를 사용하여 실제 단백질 결합 부위의 수십 개의 염기쌍 내에 결합 부위를 위치시킬 수 있고, 결합 부위에서의 태그 밀도는 상이한 DNA 부위에 대한 단백질의 결합 친화도의 정량 및 비교를 허용할 수 있다.
일반적으로, 서열 분석은 자동화된 생어의 서열 분석(AB 13730x1 genome analyzer), 고체 지지체 상 파이로시퀀싱(454 sequencing, Roche), 가역적 종결을 이용한 합성에 의한 서열 분석(ILLUMINA® Genome Analyzer), 결찰에 의한 서열 분석(ABI SOLiD®) 또는 가상 종결 인자를 이용한 합성에 의한 서열 분석(HELISCOPE®)을 사용하여 수행될 수 있다. 개시된 방법들과 함께 사용하기 위한 다른 차세대 서열 분석 기술은 대용량 병렬 시그니처 서열 분석(MPSS, 폴로니 서열 분석, 이온 토렌트 반도체 서열 분석, DNA 나노볼 서열 분석, 헬리스코프 단일 분자 서열 분석, 단일 분자 실시간(SMRT) 서열 분석, 및 나노포어 DNA 서열 분석을 포함한다. 일부 실시 양태에서, 절제된 염색질 DNA는 예를 들어 뉴클레오티드 서열을 결정함으로써 분석된다. 일부 예에서, 뉴클레오티드 서열은 증폭을 포함하거나 포함하지 않는 서열 분석 또는 혼성화 기술을 사용하여 결정된다.
특정 실시 양태에서, 방법은 쉽게 수행될 수 있고 데이터는 재현성 있게 얻을 수 있다. 특정 실시 양태에서, 이들 방법은 다수의 DNA 결합 단백질 및/또는 염색질 변화 인자(modifier)를 스크리닝하는데 사용된다. 특정 실시 양태에서, 제공된 방법을 사용하여 5, 10, 50, 100, 200, 500, 750 또는 1000개 이상의 DNA 결합 단백질 및/또는 염색질 조절 인자(CR: chromatin regulator) 및 그의 변형된 형태를 스크리닝한다. 변형된 형태는 돌연변이체 및 번역 후 변형된 DNA 결합 단백질 및/또는 염색질 변화 인자를 포함하지만, 이에 제한되지는 않는다.
특정 실시 양태에서, 제공된 방법을 사용하여 하기 DNA 결합 단백질 및/또는 염색질 변화 인자 및 그의 변형된 형태 중 하나 이상을 스크리닝한다: AAF, abl, ADA2, ADA-NF1, AF-1, AFP1, AhR, AIIN3, ALL-1, 알파-CBF, 알파-CP 1, 알파-CP2a, 알파-CP2b, 알파Ho, 알파H2-알파FB, Alx-4, aMEF-2, AML1, AMLla, AMLlb, AMLlc, AMLl델타N, AML2, AML3, AML3a, AML3b, AMY-1L, A-Myb, ANF, AP-1, AP-2알파A, AP-2알파B, AP-2베타, AP-2감마, AP-3(1), AP-3(2), AP-4, AP-5, APC, AR, AREB6, Arnt, Arnt(774 M 형태), ARP-1, ATBF1-A, ATBF1-B, ATF, ATF-1, ATF-2, ATF-3, ATF-3 델타ZIP, ATF-a, ATF-a델타, ATPFl, Barhll, Barhl2, Barxl, Barx2, Bcl-3, BCL-6, BD73, 베타-카테닌, Binl, B-Myb, BP1, BP2, 브라마, BRCAl, Brn-3a, Brn-3b, Brn-4, BTEB, BTEB2, B-TFIID, C/EBP알파, C/EBP베타, C/EBP델타, CACC결합 인자, Cart-1, CBF(4), CBF(5), CBP, CCAAT-결합 인자, CCMT-결합 인자, CCF, CCG1, CCK-la, CCK-lb, CD28RC, cdk2, cdk9, Cdx-1, CDX2, Cdx-4, CFF, ChxlO, CLIM1, CLIM2, CNBP, CoS, COUP, CP1, CP1A, CP1C, CP2, CPBP, CPE 결합 단백질, CREB, CREB-2, CRE-BPl, CRE-BPa, CREM알파, CRF, Crx, CSBP-1, CTCF, CTF, CTF-1, CTF-2, CTF-3, CTF-5, CTF-7, CUP, CUTL1, Cx, 사이클린 A, 사이클린 Tl, 사이클린 T2, 사이클린 T2a, 사이클린 T2b, DAP, DAX1, DB1, DBF4, DBP, DbpA, DbpAv, DbpB, DDB, DDB-1, DDB-2, DEF, 델타CREB, 델타Max, DF-1, DF-2, DF-3, Dlx-1, Dlx-2, Dlx-3, DIx4(긴 아이소형), Dlx-4(짧은 아이소형), Dlx-5, Dlx-6, DP-1, DP-2, DSIF, DSIF-pl4, DSIF-pl60, DTF, DUX1, DUX2, DUX3, DUX4, E, E12, E2F, E2F+E4, E2F+pl07, E2F-1, E2F-2, E2F-3, E2F-4, E2F-5, E2F-6, E47, E4BP4, E4F, E4F1, E4TF2, EAR2, EBP-80, EC2, EF1, EF-C, EGR1, EGR2, EGR3, EIIaE-A, EIIaE-B, EIIaE-C알파, EIIaE-C베타, EivF, EIf-1, EIk-1, Emx-1, Emx-2, Emx-2, En-1, En-2, ENH 결합 단백질, ENKTF- 1, EPAS 1, 엡실론F 1, ER, Erg- 1, Erg-2, ERR1, ERR2, ETF, Ets- 1, Ets-1 델타Vil, Ets-2, Evx-1, F2F, 인자 2, 인자 name, FBP, f-EBP, FKBP59, FKHL18, FKHRL1P2, Fli-1, Fos, FOXB1, FOXC1, FOXC2, FOXD1, FOXD2, FOXD3, FOXD4, FOXE1, FOXE3, FOXF1, FOXF2, FOXGla, FOXGlb, FOXGlc, FOXH1, FOXI1, FOXJla, FOXJlb, FOXJ2(긴 아이소형), FOXJ2(짧은 아이소형), FOXJ3, FOXKla, FOXKlb, FOXKlc, FOXL1, FOXMla, FOXMlb, FOXMlc, FOXN1, FOXN2, FOXN3, FOXOla, FOXOlb, FOX02, FOX03a, FOX03b, FOX04, FOXP1, FOXP3, Fra-1, Fra-2, FTF, FTS, G 인자, G6 인자, GABP, GABP-알파, GABP-베타l, GABP-베타2, GADD 153, GAF, 감마CMT, 감마CACl, 감마CAC2, GATA-1, GATA-2, GATA-3, GATA-4, GATA-5, GATA-6, Gbx-1, Gbx-2, GCF, GCMa, GCNS, GF1, GLI, GLI3, GR 알파, GR 베타, GRF-1, Gsc, Gscl, GT-IC, GT-IIA, GT-IIB알파, GT-IIB베타, HlTFl, H1TF2, H2RIIBP, H4TF-1, H4TF-2, HAND 1, HAND2, HB9, HDAC1, HDAC2, HDAC3, hDaxx, 열 유도 인자, HEB, HEBl-p67, HEBl-p94, HEF-1 B, HEF-1T, HEF-4C, HEN1, HEN2, Hesxl, Hex, HIF-1, HIF-l알파, HIF-l베타, HiNF-A, HiNF-B, HINF-C, HINF-D, HiNF-D3, HiNF-E, HiNF-P, HIP1, HIV-EP2, Hlf, HLTF, HLTF(Metl23), HLX, HMBP, HMG I, HMG I(Y), HMG Y, HMGI-C, HNF-1A, HNF-IB, HNF-1C, HNF-3, HNF-3알파, HNF-3베타, HNF-3감마, HNF4, HNF- 4알파, HNF4알파l, HNF-4알파2, HNF-4알파3, HNF-4알파4, HNF4감마, HNF-6알파, hnRNP K, HOX11, HOXA1, HOXA10, HOXA10 PL2, HOXA11, HOXA13, HOXA2, HOXA3, HOXA4, HOXA5, HOXA6, HOXA7, HOXA9A, HOXA9B, HOXB-1, HOXB13, HOXB2, HOXB3, HOXB4, HOXBS, HOXB6, HOXA5, HOXB7, HOXB8, HOXB9, HOXC10, HOXC11, HOXC12, HOXC13, HOXC4, HOXC5, HOXC6, HOXC8, HOXC9, HOXD10, HOXD11, HOXD12, HOXD13, HOXD3, HOXD4, HOXD8, HOXD9, Hp55, Hp65, HPX42B, HrpF, HSF, HSF1(긴), HSF1(?은), HSF2, hsp56, Hsp90, IBP-1, ICER-II, ICER-li감마, ICSBP, Idl, Idl H', Id2, Id3, Id3/Heir-1, IF1, IgPE-1, IgPE-2, IgPE-3, I카파B, I카파B-알파, I카파B-베타, I카파BR, II- 1 RF, IL-6 RE-BP, 11-6 RF, INSAF, IPF1, IRF-1, IRF-2, B, IRX2a, Irx-3, Irx-4, ISGF-1, ISGF-3, ISGF3알파, ISGF-3감마, lst-1, ITF, ITF-1, ITF-2, JRF, Jun, JunB, JunD, 카파y 인자, KBP-1, KER1, KER-1, Koxl, KRF-1, Ku 자가항원, KUP, LBP-1, LBP-la, LBX1, LCR-F1, LEF-1, LEF-1B, LF-A1, LHX1, LHX2, LHX3a, LHX3b, LHXS, LHX6.1a, LHX6.1b, LIT-1, Lmol, Lmo2, LMX1A, LMX1B, L-Myl(긴 형태), L-Myl(짧은 형태), L-My2, LSF, LXR알파, LyF-1, Lyl-l, M 인자, Madl, MASH-1, Maxl, Max2, MAZ, MAZ1, MB67, MBF1, MBF2, MBF3, MBP-1(1), MBP-1(2), MBP-2, MDBP, MEF-2, MEF-2B, MEF-2C(433 AA 형태), MEF-2C(465 AA 형태), MEF-2C(473 M 형태), MEF-2C/델타32(441 AA 형태), MEF-2D00, MEF-2D0B, MEF-2DA0, MEF-2DAO, MEF-2DAB, MEF-2DA'B, Meis-1, Meis-2a, Meis-2b, Meis-2c, Meis-2d, Meis-2e, Meis3, Meoxl, Meoxla, Meox2, MHox(K-2), Mi, MIF-1, Miz-1, MM-1, MOP3, MR, Msx-1, Msx-2, MTB-Zf, MTF-1, mtTFl, Mxil, Myb, Myc, Myc 1, Myf-3, Myf-4, Myf-5, Myf-6, MyoD, MZF-1, NCI, NC2, NCX, NELF, NER1, Net, NF Ill-a, NF NF-1, NF-1A, NF-1B, NF-1X, NF-4FA, NF-4FB, NF-4FC, NF-A, NF-AB, NFAT-1, NF-AT3, NF-Atc, NF-Atp, NF-Atx, Nf베타A, NF-CLEOa, NF-CLEOb, NF델타E3A, NF델타E3B, NF델타E3C, NF델타E4A, NF델타E4B, NF델타E4C, Nfe, NF-E, NF-E2, NF-E2 p45, NF-E3, NFE-6, NF-Gma, NF-GMb, NF-IL-2A, NF-IL-2B, NF-jun, NF-카파B, NF-카파B(-유사), NF-카파Bl, NF-카파Bl, 전구체, NF-카파B2, NF-카파B2(p49), NF-카파B2 전구체, NF-카파El, NF-카파E2, NF-카파E3, NF-MHCIIA, NF-MHCIIB, NF-muEl, NF-muE2, NF-muE3, NF-S, NF-X, NF-X1, NF-X2, NF-X3, NF-Xc, NF-YA, NF-Zc, NF-Zz, NHP-1, NHP-2, NHP3, NHP4, NKX2-5, NKX2B, NKX2C, NKX2G, NKX3A, NKX3A vl, NKX3A v2, NKX3A v3, NKX3A v4, NKX3B, NKX6A, Nmi, N-Myc, N-Oct-2알파, N-Oct-2베타, N-Oct-3, N-Oct-4, N-Oct-5a, N-Oct-5b, NP-TCII, NR2E3, NR4A2, Nrfl, Nrf-1, Nrf2, NRF-2베타l, NRF-2감마l, NRL, NRSF 형태 1, NRSF 형태 2, NTF, 02, OCA-B, Oct-1, Oct-2, Oct-2.1, Oct-2B, Oct-2C, Oct-4A, Oct4B, Oct-5, Oct-6, Octa-인자, 옥타머 결합 인자, oct-B2, oct-B3, Otxl, Otx2, OZF, pl07, pl30, p28 조절인자, p300, p38erg, p45, p49erg,-p53, p55, p55erg, p65델타, p67, Pax-1, Pax-2, Pax-3, Pax-3A, Pax-3B, Pax-4, Pax-5, Pax-6, Pax-6/Pd-5a, Pax-7, Pax-8, Pax-8a, Pax-8b, Pax-8c, Pax-8d, Pax-8e, Pax-8f, Pax-9, Pbx-la, Pbx-lb, Pbx-2, Pbx-3a, Pbx-3b, PC2, PC4, PC5, PEA3, PEBP2알파, PEBP2베타, Pit-1, PITX1, PITX2, PITX3, PKNOX1, PLZF, PO-B, 폰틴 52, PPAR알파, PPAR베타, PPAR감마l, PPAR감마2, PPUR, PR, PR A, pRb, PRD1-BF1, PRDI-BFc, Prop-1, PSE1, P-TEFb, PTF, PTF 알파, PTF베타, PTF델타, PTF감마, Pu 박스 결합 인자, Pu 박스 결합 인자(BJA-B), PU. l, PuF, Pur 인자, Rl, R2, RAR-알파l, RAR-베타, RAR-베타2, RAR-감마, RAR-감마l, RBP60, RBP-J카파, Rel, RelA, RelB, RFX, RFX1, RFX2, RFX3, RFXS, RF-Y, ROR알파l, ROR알파2, ROR알파3, ROR베타, ROR감마, Rox, RPF1, RPG알파, RREB-1, RSRFC4, RSRFC9, RVF, RXR-알파, RXR-베타, SAP- la, SAP lb, SF-1, SHOX2a, SHOX2b, SHOXa, SHOXb, SHP, SIII-pl lO, SIII-pl5, SIII-pl8, SIM', Six-1, Six-2, Six-3, Six-4, Six-5, Six-6, SMAD-1, SMAD-2, SMAD-3, SMAD-4, SMAD-5, SOX-11, SOX-12, Sox-4, Sox-5, SOX-9, Spl, Sp2, Sp3, Sp4, Sph 인자, Spi-B, SPIN, SRCAP, SREBP-la, SREBP-lb, SREBP-lc, SREBP-2, SRE-ZBP, SRF, SRY, SRP1, Staf-50, STATl알파, STATl베타, STAT2, STAT3, STAT4, STAT6, T3R, T3R-알파l, T3R-알파2, T3R-베타, TAF(I)110, TAF(I)48, TAF(I)63, TAF(II)100, TAF(II)125, TAF(II)135, TAF(II)170, TAF(II)18, TAF(II)20, TAF(II)250, TAF(II)250델타, TAF(II)28, TAF(II)30, TAF(II)31, TAF(II)55, TAF(II)70-알파, TAF(II)70-베타, TAF(II)70-감마, TAF-I, TAF-II, TAF-L, Tal-1, Tal-l베타, Tal-2, TAR 인자, TBP, TBXIA, TBXIB, TBX2, TBX4, TBXS(긴 아이소형), TBXS(짧은 아이소형), TCF, TCF-1, TCF-1A, TCF-1B, TCF-1C, TCF-1D, TCF-1E, TCF-1F, TCF-1G, TCF-2알파, TCF-3, TCF-4, TCF-4(K), TCF-4B, TCF-4E, TCF베타l, TEF-1, TEF-2, tel, TFE3, TFEB, TFIIA, TFIIA-alpl^eta 전구체, TFIIA-알파/베타 전구체, TFIIA-감마, TFIIB, TFIID, TFIIE, TFIIE-알파, TFIIE-베타, TFIIF, TFIIF-알파, TFIIF-베타, TFIIH, TFIIH*, TFIIH-CAK, TFIIH-사이클린 H, TFIIH-ERCC2/CAK, TFIIH-MAT1, TFIIH-M015, TFIIH-p34, TFIIH-p44, TFIIH-p62, TFIIH-p80, TFIIH-p90, TFII-I, Tf-LFl, Tf-LF2, TGIF, TGIF2, TGT3, THRA1, TIF2, TLE1, TLX3, TMF, TR2, TR2-11, TR2-9, TR3, TR4, TRAP, TREB-1, TREB-2, TREB-3, TREF1, TREF2, TRF(2), TTF-1, TXRE BP, TxREF, UBF, UBP-1, UEF-1, UEF-2, UEF-3, UEF-4, USF1, USF2, USF2b, Vav, Vax-2, VDR, vHNF-lA, vHNF-lB, vHNF-lC, VITF, WSTF, WT1, WT1I, WT1 I-KTS, WT1 I-del2, WT1-KTS, WTl-del2, X2BP, XBP-1, XW-V, XX, YAF2, YB-1, YEBP, YYl, ZEB, ZF1, ZF2, ZFX, ZHX1, ZIC2, ZID, ZNF174, ASH1L, ASH2, ATF2, ASXL1, BAP1, bcllO, Bmil, BRG1, CARM1, KAT3A/CBP, CDC73, CHD1, CHD2, CTCF, DNMT1, DOTL1, EHMT1, ESET, EZH1, EZH2, FBXL10, FRP(Plu- 1), HD AC 1, HDAC2, HMGA1, hnRNPAl, HP1 감마, Hsetlb, JaridlA, JaridlC, KIAA1718 JHDM1D, KAT5, KMT4, LSD1, NFKB P100, NSD2, MBD2, MBD3, MLL2, MLL4, P300, pRB, RbAP46/48, RBP1, RbBP5, RING IB, RNApolII P S2, RNApolII P S5, ROC1, sap30, setDB 1, Sf3bl, SIRT1, Sirt6, SMYD1, SP1, SUV39H1, SUZ12, TCF4, TET1,TRRAP, TRX2, WDR5, WDR77, 및/또는 YYl. 이들 DNA 결합 단백질 및/또는 염색질 변화 인자에 대한 항체는 시판되고 있다.
본원에 사용된 바와 같이, 염색질 관련 인자는 염색질 상의 하나 이상의 부위에서 발견될 수 있고/거나 일시적인 방식으로 염색질과 결합할 수 있는 인자이다. 낮은 존재비의 염색질 관련 인자의 예는 전사 인자(예를 들어, 종양 억제 인자, 종양 유전자, 세포주기 조절 인자, 발생 및/또는 분화 인자, 일반적인 전사 인자(TF)), ATP 의존성 염색질 리모델러(예를 들어, (P)BAF, MOT1, ISWI, INO80, CHD1), 활성화 인자(예를 들어, 히스톤 아세틸 트랜스퍼라제(HAT)) 복합체, 억제 인자(예를 들어, 히스톤 데아세틸라제(HDAC)) 복합체, 보조 활성화 인자, 보조 억제 인자, 다른 염색질 리모델러, 예를 들어 히스톤 (데-)메틸라제, DNA 메틸라제, 복제 인자 등을 포함하지만, 이에 제한되지는 않는다. 이러한 인자는 세포주기의 특정 단계(예를 들어, G1, S, G2, M 단계)에서, 특정 환경 신호(예를 들어, 성장 및 다른 자극 신호, DNA 손상 신호, 세포 사멸 신호)에, 형질 감염 및 일시적 또는 안정한 발현 시(예를 들어, 재조합 인자), 또는 감염 시(예를 들어, 바이러스 인자) 염색질(DNA, 히스톤)과 상호 작용할 수 있다.
풍부한 인자는 염색질의 성분, 예를 들어 히스톤 및 그의 변이체이다. 히스톤은 번역 후 변형을 통해 히스톤 꼬리에서 변형되어 DNA 및 핵 단백질과의 상호 작용을 변경하고 예를 들어 유전자 조절, DNA 복구 및 염색체 응축에 영향을 줄 수 있다. H3 및 H4 히스톤은, 예를 들어 메틸화, 아세틸화, 인산화, 유비퀴틴화, 수모화, 시트룰린화 및 ADP-리보실화에 의해 공유적으로 변형될 수 있는 뉴클레오솜으로부터 돌출된 긴 꼬리를 갖는다. 히스톤 H2A 및 H2B의 코어도 변형될 수 있다.
특정 실시 양태에서, 고 처리량 방식으로 샘플 처리를 허용하는 개시된 방법이 제공된다. 예를 들어, 10, 50, 100, 200, 500, 750, 1000개 이상의 염색질 관련 인자 및/또는 염색질 변형은 동시에 면역 침전 및/또는 분석될 수 있다. 일 실시 양태에서, 예를 들어 96 웰 플레이트를 사용하여 최대 96개의 샘플이 한 번에 처리될 수 있다. 다른 실시 양태에서, 예를 들어 6 웰, 12 웰, 32 웰, 384 웰 또는 1536 웰 플레이트를 사용하여 더 적거나 더 많은 샘플이 처리될 수 있다. 일부 실시 양태에서, 제공된 방법은 예를 들어 일반적인 0.5 ml, 1.5 ml 또는 2.0 ml 크기의 튜브와 같은 튜브에서 수행될 수 있다. 이 튜브는 튜브 랙, 플로트 또는 기타 고정 장치에 배열될 수 있다.
특정 실시 양태에서, 샘플은 약 1개 세포, 약 2개 세포, 약 3개 세포, 약 5개 세포, 약 10개 세포, 약 25개 세포, 약 50개 세포, 약 100개 세포, 약 150개 세포, 약 200개 세포, 약 300개 세포, 약 400개 세포, 약 500개 세포, 약 1000개 세포, 약 2000개 세포, 약 3000개 세포, 약 4000개 세포, 약 5000개 세포, 약 10,000개 세포, 약 20,000개 세포, 약 30,000개 세포, 약 40,000개 세포, 약 50,000개 세포, 약 100,000개 세포, 약 200,000개 세포, 약 300,000개 세포, 약 400,000개 세포, 약 500,000개 세포 또는 약 1,000,000개 세포를 포함할 수 있다. 일부 실시 양태에서, 샘플은 약 1개 세포 내지 약 10,000개 세포, 또는 약 10,000개 세포 내지 약 100,000개 세포, 또는 그 이상을 포함할 수 있다.
전사 인자 및 다른 단백질, 예컨대 히스톤과 직접 물리적으로 상호 작용을 하는 특정 DNA 부위는 단리될 수 있으며, 이는 생체 내 단백질에 의해 결합된 표적 DNA 부위의 라이브러리를 생성한다. 일부 실시 양태에서, DNA와 관심 단백질(예를 들어, 전사 인자, 폴리머라제 또는 전사기구)의 상호 작용 패턴을 분석하거나 관심의 후성 유전적 염색질 변형(예를 들어, 히스톤 변형 또는 DNA 변형)의 패턴을 분석하기 위해 전체 게놈 서열 데이터베이스와 함께 대용량 병렬 서열 분석이 사용될 수 있다.
개시된 방법은 또한 유기체, 예를 들어 식물 또는 동물 대상체, 예컨대 포유동물 대상체, 예를 들어 인간 대상체에서의 질환 상태와 같은 질환 상태를 모니터링하는 데 적합하다. 특정 질환 상태는 생체 내에서 염색질 DNA에 대한 단백질 및/또는 핵산의 차등 결합에 의해 유발 및/또는 특성화될 수 있다. 예를 들어, 특정 상호 작용은 질환 세포에서는 일어날 수 있지만 정상 세포에서는 일어나지 않을 수 있다. 다른 예에서, 특정 상호 작용은 정상 세포에서는 일어날 수 있지만 질환 세포에서는 일어나지 않을 수 없다. 따라서, 개시된 방법을 사용하여 생체 내 상호 작용의 프로파일은 질환 상태와 연관될 수 있다.
따라서, 개시된 방법의 양태는 표적 핵산과 단백질 및/또는 핵산과 질환 상태, 예를 들어 암, 또는 바이러스 또는 박테리아 감염의 상호작용을 연관시키는 것에 관한 것이다. 질환 상태와의 상관관계는 식물, 및 인간과 같은 동물을 제한 없이 포함하는 임의의 유기체에 대해 이루어질 수 있는 것으로 이해된다.
질환과 연관된 상호 작용 프로파일은 유사한 "지문"을 가짐으로써 세포에서 질환을 식별 및/또는 진단하기 위한 "지문"으로서 사용될 수 있다. 염색질 관련 인자 및 염색질 DNA의 프로파일은 암과 같은 질환 상태에서 관련된 결합 단백질 및/또는 핵산을 식별하기 위해, 예를 들어 특정 단백질 및/또는 핵산을 잠재적 진단 및/또는 치료 표적으로 식별하기 위해 사용될 수 있다. 또한, 프로파일은 질환 상태를 모니터링하는 데, 예를 들어 치료에 대한 반응, 질환 진행을 모니터링하고/거나 대상체에 대한 치료 결정을 하는 데 사용될 수 있다.
상호 작용 프로파일을 얻는 능력은 예를 들어 샘플에 존재하는 프로파일을 특정 질환 상태와 연관된 것과 비교함으로써 질환 상태를 진단할 수 있게 하며, 여기서 프로파일에서 유사성은 특정 질환 상태를 나타낸다.
따라서, 개시된 방법의 양태는 질환 상태, 예를 들어 암, 또는 바이러스 또는 박테리아 감염과 같은 감염과 연관된 상호 작용 프로파일에 기초하여 질환 상태를 진단하는 것에 관한 것이다. 질환 상태의 진단은 식물, 및 인간과 같은 동물을 제한 없이 포함하는 임의의 유기체에 대해 이루어질 수 있는 것으로 이해된다.
본 개시 내용의 양태는 환경 스트레스 또는 상태와 상호 작용 프로파일과의 상관 관계에 관한 것으로, 예를 들어 전체 유기체 또는 세포 샘플과 같은 샘플, 예를 들어 세포 배양물은 열 충격, 삼투압, 저산소증, 추위, 산화 스트레스, 방사선, 기아, 화학 물질(예를 들어, 치료제 또는 잠재적 치료제) 등과 같은, 그러나 이에 제한되지 않는 환경 스크레스에 노출될 수 있다. 스트레스가 가해진 후, 대표적인 샘플은 예를 들어 다양한 시점에서 분석될 수 있고, 대조군, 예컨대 유기체 또는 세포, 예를 들어 유기체의 세포로부터의 샘플, 또는 표준 값과 비교될 수 있다.
일부 실시 양태에서, 개시된 방법은 상호 작용 프로파일을 조정하는 작용제, 예를 들어 비정상 것, 예를 들어 질환 상태와 연관된 것에서 무질환 상태를 나타내는 것으로 변경하는 작용제를 위해 화학 물질 라이브러리를 스크리닝하는 데 사용될 수 있다. 세포, 조직, 또는 심지어 전체 동물을 화학 물질 라이브러리의 상이한 구성원에 노출시키고 본원에 기재된 방법을 수행함으로써, 화학 물질 라이브러리의 상이한 구성원은, 예를 들어 고 처리량 방법을 사용하여, 비교적 짧은 시간에 상호 작용 프로파일에 대한 그들의 영향에 대해 동시에 스크리닝될 수 있다.
일부 실시 양태에서, 시험 물질의 스크리닝은 다수의 잠재적 조절 인자 화합물을 함유하는 조합 라이브러리를 테스트하는 것을 포함한다. 조합 화학 물질 라이브러리는 시약과 같은 다수의 화학적 "빌딩 블록"을 조합함으로써 화학적 합성 또는 생물학적 합성에 의해 생성된 다양한 화합물의 집합일 수 있다. 예를 들어, 폴리펩티드 라이브러리와 같은 선형 조합 화학 물질 라이브러리는 주어진 화합물 길이(예를 들어, 폴리펩티드 화합물의 아미노산 수)에 대해 가능한 모든 방식으로 한 세트의 화학 빌딩 블록(아미노산)을 조합함으로써 형성된다. 화학 빌딩 블록의 이러한 조합 혼합을 통해 수백만의 화합물이 합성될 수 있다.
적절한 물질은 라이브러리, 예를 들어 조합 라이브러리의 합성 또는 천연 화합물에 포함될 수 있다. 수많은 라이브러리들이 상업적으로 이용 가능하거나 쉽게 생산될 수 있다. 안티센스 올리고뉴클레오티드 및 올리고펩티드와 같은 무작위 올리고뉴클레오티드의 발현을 포함하여, 다양한 유기 화합물 및 생체 분자의 무작위 및 유도된 합성을 위한 수단이 또한 공지되어있다. 대안적으로, 박테리아, 진균, 식물 및 동물 추출물 형태의 천연 화합물 라이브러리가 이용 가능하거나 쉽게 생산될 수 있다. 또한, 천연 또는 합성적으로 생성된 라이브러리 및 화합물은 통상적인 화학적, 물리적 및 생화학적 수단을 통해 쉽게 변형되고, 조합 라이브러리를 생성하는데 사용될 수 있다. 이러한 라이브러리는 다수의 상이한 화합물의 스크리닝에 유용하다.
라이브러리는 다양한 수의 조성물(구성원), 예컨대 약 100개 이하의 구성원, 예컨대 약 1,000개 이하의 구성원, 예컨대 약 5,000개 이하의 구성원, 예컨대 약 10,000개 이하의 구성원, 예컨대 약 100,000개 이하의 구성원, 예컨대 약 500,000개 이하의 구성원, 심지어 약 500,000개 초과의 구성원을 포함할 수 있다. 일 예에서, 방법은 다수의 잠재적 치료 화합물을 함유하는 조합 화학 물질 또는 펩티드 라이브러리를 제공하는 단계를 포함할 수 있다. 그런 다음, 이러한 조합 라이브러리는 본원에 개시된 방법에 의해 스크리닝되어 원하는 특징적인 활성을 나타내는 라이브러리 구성원(특히 화학 종 또는 서브 클래스)을 식별한다.
본원에 개시된 방법을 사용하여 식별된 화합물은 통상적인 "리드 화합물(lead compound)"로서 작용할 수 있거나 스스로 잠재적 또는 실제 치료제로서 사용될 수 있다. 일부 경우에서, 후보 작용제의 풀은 식별되어 집단 내 어느 개별 작용제 또는 작용제의 서브풀이 원하는 활성을 갖는지를 결정하기 위해 추가로 스크리닝될 수 있다.
라이브러리와 함께 대조 반응을 수행할 수 있다. 이러한 선택적인 대조 반응은 적절하며 스크리닝의 신뢰성을 증가시킬 수 있다. 따라서, 개시된 방법은 이러한 대조 반응을 포함할 수 있다. 대조 반응은 전사 조절 인자와 무관하게 전사 인자 활성을 측정하는 음성 대조 반응일 수 있다. 대조 반응은 또한 공지된 전사 조절 인자의 관점에서 전사 인자 활성을 측정하는 양성 대조 반응일 수 있다.
개시된 방법에 의해 식별된 화합물은 다양한 조건에 대한 약물 개발을 위한 치료제 또는 리드 화합물로서 사용될 수 있다. 유전자 발현은 세포 분열, 성장, 복제, 분화, 복구, 세포 감염 등을 포함한 모든 생물학적 과정에서 기본이기 때문에 전사 인자 활성을 모니터링하고 활성을 조절하는 화합물을 식별하는 능력은 신생물, 염증, 알레르기성 과민증, 대사 질환, 유전자 질환, 바이러스 감염, 박테리아 감염, 진균 감염 등을 포함하는 다양한 병태에 대해 약물 리드를 식별하는 데 사용될 수 있다. 또한, 바이러스, 진균, 농해충 등과 같은 바라지 않는 유기체에서 전사 인자를 특이적으로 표적화하는 것으로 식별된 화합물은 살진균제, 살균제, 제초제, 살충제 등으로 작용할 수 있다. 따라서, 전사 인자 활성과 관련된 병태의 범위는 인간 및 다른 동물에서와, 및 식물, 예컨대 농업 용도에서의 병태를 포함한다.
본원에 개시된 방법에 사용하기에 적합한 샘플은 유기체 또는 그 일부, 예컨대 식물, 동물, 박테리아 등(예컨대, 식물 또는 동물, 건강하거나 건강해 보이는 인간 대상체 또는 암과 같은 진단되거나 조사된 병태 또는 질환에 걸린 인간 환자 샘플을 포함함)으로부터 얻은 임의의 통상적인 생물학적 샘플을 포함한다. 샘플은 또한 임의의 기관 또는 조직(종양 생검과 같은 생검 또는 부검 표본을 포함)으로부터 수득된 샘플일 수 있거나 세포(1차 세포 또는 배양된 세포에 관계없이), 조직 또는 기관을 포함할 수 있다. 예시적인 샘플은 세포, 조직 생검(예를 들어, 종양 생검), 미세 바늘 흡인물 및/또는 조직 절편(예를 들어, 동결 조직 절편 및/또는 파라핀 매립된 조직 절편)을 제한 없이 포함한다. 다른 예에서, 샘플은 순환 종양 세포(세포 표면 마커에 의해 식별될 수 있음)를 포함한다. 특정 예에서, 샘플은 직접(예를 들어, 신선 또는 동결) 사용되거나, 사용 전에 예를 들어, 고정(예를 들어, 포르말린 사용) 및/또는 왁스 내 매립(예를 들어, 포르말린 고정 파라핀 매립(FFPE: formalin-fixed paraffin-embedded) 조직 샘플)에 의해 조작될 수 있다. 대상체로부터 조직을 얻는 임의의 방법이 이용될 수 있고, 사용된 방법의 선택은 조직의 유형, 대상체의 연령, 또는 진료의가 이용할 수 있는 절차와 같은 다양한 인자에 의존할 것임을 이해할 것이다.
다음의 실시예들은 특정의 구체적인 특징들 및/또는 실시 양태들을 설명하기 위해 제공된다. 이 실시예는 본 발명을 기술된 구체적인 특징 또는 실시 양태에 제한하는 것으로 해석되어서 안된다.
실시예
실시예 1
염색질 면역 절단(ChIC)은 TF 특이적 항체를 사용하여 MNase를 테더링하고 결합 부위에서만 절단하는 장점이 있다. 심층(deep) 서열 분석에 ChIC를 적용시키기 위해, 심층 서열 분석 라이브러리의 중요한 특징이 되는 DNA에서 배경 절단이 나타나는 것을 감소시키는 개시된 방법을 개발하였다. 핵의 가벼운 MNase 처리로 올리고뉴클레오솜을 남기고 모노뉴클레오솜 및 TF-DNA 복합체를 유리시킨다는 것이 관찰되었다. TF의 양쪽에서 표적화된 절단은 또한 TF-DNA 복합체를 상등액으로 방출하고, 펠렛화된 핵에 나머지 게놈을 남길 것이다. 얼음에서 짧은 분해 반응을 수행함으로써, TF 결합된 MNase가 게놈 주위로 확산하고 접근 가능한 염색질을 절단하기 전에 TF-DNA 복합체가 상등액으로부터 회수될 수 있음이 발견되었다. 이 이론적 근거에 기초하여 초기 CUT&RUN 프로토콜(도 1A)을 개발하고 개선하였다.
일례에서, 프로토콜은 다음 단계들을 포함한다:
(1) 고정되지 않은 핵을 렉틴 코팅된 자성 비드에 고정하는 단계;
(2) 항체 및 단백질 A-MNase(pA-MN)와 연속적으로 인큐베이션시킨 후 최소한의 세척 단계;
(3) 얼음에서 Ca++와 혼합하여 절단 반응을 개시한 후 수 초 내지 수분 후에 킬레이션에 의해 정지시키는 단계; 및
(4) 원심분리시켜 방출된 TF-DNA 복합체를 함유하는 상등액을 회수하는 단계.
그런 다음 상등액에서 DNA를 추출하여 서열 분석 라이브러리 제조에 바로 사용한다.
CUT&RUN은 염색질 복합체의 제한된 분해를 일으킨다.
처음에 조 효모 핵을 사용하여 CUT&RUN 프로토콜을 수행하였다. CUT&RUN 및 ChIP-seq을 엄격히 비교하기 위해서, 동일한 FLAG 태그된 TF 균주, 동일한 핵 제조 프로토콜, 동일한 마우스 항-FLAG 단클론 항체 및 일루미나 라이브러리 제조 및 페어드-엔드 서열 분석에 대한 동일한 절차를 사용하였다(Kasinathan et al. 2014). 마우스 단백질 A가 마우스 IgG에만 약하게 결합하기 때문에, CUT&RUN에 토끼 항-마우스 2차 항체를 사용하였다. CUT&RUN의 효율을 테스트하기 위해, 3XFLAG 태그된 히스톤 H2A를 발현하는 사카로마이세스 세레비지에 균주를 사용하였고, 이는 게놈 전체 뉴클레오솜 단편을 방출할 것으로 예상된다. 실제로, 0℃에서 100배 분해 시간 경과에 따라 점진적인 절단이 관찰되었고, 모노뉴클레오솜 크기까지 작아진 단편의 방출은 1차 항체의 존재에 전적으로 의존하였다(도 1B).
그런 다음 CUT&RUN을 두 개의 구조적으로 구별되는 에스. 세레비지에 TF, ARS 결합 인자 1(Abf1), 및 rDNA 인핸서 결합 단백질 1(Reb1)에 적용하여 샘플당 약 2~3 백만개의 맵핑된 페어드-엔드 리드를 얻었다. 4초에서 128초 사이의 시점에서 맵핑된 단편의 크기 분포가 ~ 150 bp 미만에서 거의 중첩될 수 있는 것으로 밝혀졌다(도 1C). 32배 범위에 걸친 시점들 사이의 이러한 근사한 일치는 Ca++의 첨가시 TF 결합 단편의 제한된 분해가 빠르게 발생한다는 것을 시사하고, 분해 시간이 중요한 매개변수가 아님을 입증한다.
맵핑된 TF 단편 크기는 ~ 150 bp에서 피크를 나타낸 H2A 단편과 달리 ~ 100 bp에서 피크를 나타냈다. TF 복합체는 ~ 100 bp보다 작을 것이고, 뉴클레오솜은 ~ 150 bp일 것이므로 120 bp 미만 및 150 bp 초과의 단편이 별도로 맵핑될 것으로 예상되었다. 시점 프로파일은 각 영역의 각 TF 모티프에 대해 120 bp 미만의 부류에서 선명한 CUT&RUN 피크를 보여준다(도 1D 및 도 10). 스파이크-인 대조군에 정규화될 때 피크 점유의 느린 단조 증가를 제외하고(도 11A-11B), 1초 내지 128초 간격 내에서 시점 사이에 일관된 차이가 관찰되지 않았으며, 이는 TF-DNA 복합체의 점진적인 방출이 제한된 분해 반응을 일으킨다는 것을 확인해준다. 작은 단편의 총 DNA 추출 및 정제는 거의 동일한 결과를 가져왔으며(도 12A-12C), 이는 상등액으로부터 DNA의 추출이 TF 결합 단편을 정량적으로 회수한다는 것을 입증한다.
CUT&RUN은 원위치에서 효모 TF 결합 부위를 고해상도로 강건하게 맵핑한다 .
120 bp 미만의 단편이 TF 결합 부위 주위의 절단을 나타내는지 확인하기 위해, 유의한 모든 Abf1 및 Reb1 모티프를 게놈에서 확인하였고, CUT&RUN 데이터를 기반으로 한 모티프와 ORGANIC 데이터를 기반으로 한 모티프가 거의 동일하다는 것을 발견하였다(도 13A-13D). ORGANIC 유래 모티프를 사용하여 효모 게놈을 스캔하여 CUT&RUN과 완전히 독립적으로 결정된 1899개의 Abf1 및 1413개의 Reb1 모티프의 종합적인 목록을 제공하였다. 피크 호출의 대부분은 각 데이터세트에 대한 모티프와 중첩되었으며 Abf1의 경우 ORGANIC보다 CUT&RUN의 성능이 다소 우수하고 Reb1의 경우에는 반대임을 확인하였다(도 13E). ≤120 bp 및 ≥150 bp 프로파일을 이러한 모티프를 중심으로 하여 히트 맵을 구성하였다. 각각의 Abf1 및 Reb1 모티프를 중심으로 2 kb 간격으로 점유에 따라 순위가 정해졌을 때, TF 부위의 >90%가 측면 영역에 비해 상응하는 모티프 위의 단편에 의해 점유되는 것으로 관찰되었다(도 2A-2B 및 도 14 상단 패널), 이는 가능성이 높은 참 양성을 나타낸다. Abf1 및 Reb1 모티프에 대한 CUT&RUN 점유는 히트 맵에서 CUT&RUN에 대한 배경보다 높은 대비로 나타난 뉴클레아제 접근성(도 14, 하단 패널)에 비해 높은 동적 범위를 나타냈다. 대조적으로, Abf1 단편은 비중첩 Reb1 부위에서 무시할 수 있는 점유를 보여 주었고, 비중첩 Abf1 부위에서 Reb1 단편에 대해서는 그 반대로도 나타났다(도 2A-2B 및 도 14, 중간 패널). TF 모티프의 존재와 TF의 점유 사이의 거의 완전한 대응, 및 상이한 TF의 부위에서의 일반적인 부재는 CUT&RUN이 TF 결합에 대해 매우 민감하고 특이적임을 암시한다.
CUT&RUN을 고해상도 ChIP-seq와 직접 비교하기 위해, 'ORGANIC' ChIP-seq 데이터를 Abf1 및 Reb1 모티프에 대해 유사하게 정렬하였다. 이전에 보고된 바와 같이(Kasinathan et al., 2014), ORGANIC ChIP-seq는 게놈 전체에서 Abf1 참 양성 모티프의 대부분과 거의 모든 Reb1 모티프를 검출하였다(도 2A-2B, 상단 중간 패널). 80 mM NaCl 추출로 최상의 Reb1 데이터를 얻었고 600 mM NaCl로 최상의 Abf1 데이터를 얻었지만, Reb1의 동적 범위는 빈번한 거짓 양성 점유가 있는 Abf1의 동적 범위보다 항상 우수하였다(도 2A-2B, 하단 중간 패널). 대조적으로, CUT&RUN은 ~ 10배 더 적은 페어드-엔드 리드로 동일한 범위의 분해 시점에 걸쳐 두 TF에 대해 동일한 동적 범위를 보였으며, 이는 CUT&RUN이 ORGANIC ChIP-seq보다 더 강건하다는 것을 입증한다. 이러한 고해상도 방법(Kasinathan et al., 2014)과 비교하여, 가교 및 초음파 처리를 사용한 표준 ChIP-seq는 열등한 감도와 특이성을 나타냈다(도 2A-2B, 오른쪽 패널). 따라서 CUT&RUN은 ChIP-seq에 비해 향상된 감도/특이성 균형을 갖춘 강건한 TF 점유 맵을 제공한다.
CUT&RUN의 해상도를 추정하기 위해서, 단편 말단의 평균 밀도로서 각 TF의 '풋프린트(footprint)'를 모티프 중점 주위에 플로팅하였다. Abf1 및 Reb1 모두에 대해, 날카로운 20 bp 폭의 풋프린트가 관찰되었는데, 이는 이들 전사 인자가 거의 염기쌍 해상도로 모티프를 중심으로 ~ 20 bp를 보호한다는 것을 나타낸다(도 3A). 흥미롭게도, 절단 지도에서 상류 및 하류 '기울기'는 Abf1과 Reb1 모티프의 양쪽에 톱니 패턴을 나타내고, > 100 bp에 대해 '이빨' 사이 거리는 약 10 bp 간격이며, 자기 상관 분석에 의해 염기 조성에 무관함을 확인하였다(도 3B). 이러한 10 bp 주기적 절단 선호도는 B 형태 DNA의 1회전당 10 bp 주기성과 일치하며, 이는 테더링된 MNase가 DNA 이중 나선의 한 면에 우선적으로 접근하도록 이들 결합된 TF의 양쪽에 있는 DNA가 공간적으로 배향됨을 시사한다. TF에 대한 MNase의 테더링은 MNase가 뉴클레오솜의 표면에서도 근처의 DNA를 절단하도록 제한하며, 이는 염색질 섬유의 유연성을 시사한다(도 3C). 따라서, 0℃에서 관찰된 매우 빠른 동역학은 테더링 부위 근처의 절단을 위해 작동 준비된(poised) 고정된 MNase에 기인한다.
CUT&RUN은 염색질 결합된 복합체를 정확하게 맵핑한다
ChIP 기반 방법의 경우 염색질 지형의 이동성 성분을 고해상도로 맵핑하는 것은 어려울 수 있다. 예를 들어, 대략 1 메가달톤의 17개 서브유닛의 RSC 뉴클레오솜 리모델링 복합체가 일시적으로 에워싸는 뉴클레오솜을 동적으로 슬라이딩하게 하고(Lorch et al., 2010; Ramachandran et al., 2015), Mot1 DNA 트랜스로카아제는 고친화도 결합 부위로부터 TATA 결합 단백질(TBP: TATA-binding protein)을 동적으로 제거한다(Zentner and Henikoff, 2013; Auble et al., 1997). X-ChIP는 뉴클레오솜 리모델링 복합체를 가장 가까운 뉴클레오솜에 가교 결합시키지만, 천연 ChIP는 뉴클레오솜이 고갈된 영역(NDR: nucleosome-depleted region)에서와 뉴클레오솜 상에서 모두 그들의 작용 부위에서 효모 염색질 리모델러를 성공적으로 포획한다(Zentner et al., 2013). CUT&RUN이 이러한 큰 염색질 결합 복합체를 프로파일링하기 위해, 너무 커서 핵공을 통해 확산할 수 없을 수 있는 원위치에서 CUT&RUN에 의해 가용화된 염색질보다는 총 DNA를 추출하는 것이 최적인 것으로 확인되었다. 따라서, 모든 DNA를 추출하고 AMPure 비드로 큰 DNA 단편을 우선적으로 제거하였다. 이 변형된 프로토콜이 > 2 자릿수의 분해 범위에 걸쳐 Mot1에 적용되었을 때, ORGANIC 프로파일링을 사용하여 얻은 것과 매우 유사하지만, 페어드-엔드 리드의 수는 단지 ~ 15%인 염색질 프로파일이 관찰되었다(도 4A). TBP 결합 부위의 상류 측에서 Mot1 피크는 CUT&RUN 및 ORGANIC 프로파일 둘 다에 대해 나타나며, 이는 Mot1이 시험관 내에서와 같이(Wollmann et al., 2011) 생체 내에서 상류 측으로부터 TBP에 접근한다는 것을 확인해 준다(Zentner and Henikoff, 2013). 히트 맵 및 평균 플롯 분석에서 ≤120 bp 단편은 TBP 부위와 근접하게 추적되는 반면, ≥150 bp 단편은 국소 부근에 넓게 퍼져 분포됨을 보여주며, 이는 아마도 Mot1 전좌 동역학을 나타낸다(도 15A-15B). CUT&RUN을 RSC 복합체의 촉매 성분인 Sth1에도 적용시켰다. RSC는 NDR에서 뉴클레오솜을 슬라이딩하게 하는 작용을 하며, 효모 유전자를 전사 개시 부위의 바로 하류에 +1 뉴클레오솜의 유추된 중심(dyad) 축에서 정렬시켰다(Ramachandran et al., 2015). 5초 내지 30분의 시간 경과에 따라 균일한 분해가 관찰되었고(도 16A), GAL4 UAS 바로 위에 존재비를 확인하였다(도 16B)(Floer et al., 2010). Sth1 피크는 NDR에서 가장 풍부하며, CUT&RUN 프로파일은 5초에서 10분 사이의 분해 시간으로 수율이 점진적으로 증가하는 것을 보여주며(도 4B), 이는 CUT&RUN 프로토콜을 사용하여 정량적 제한 분해가 이루어짐을 나타낸다. 최대 분해 시간 동안 동시에 처리된, 그러나 1차 항-FLAG 항체가 생략된, 3XFLAG-Sth1 핵으로부터 유래된 음성 대조군에 대해 거의 평평한 선이 관찰되었다. Sth1 CUT&RUN의 결과는 Sth1 ORGANIC 프로파일링(Ramachandran et al., 2015)의 결과와 비슷하지만 훨씬 높은 수율을 보인다(도 4C). CUT&RUN은 염색질 결합 복합체, 심지어 매우 크고 동적인 염색질 관련 복합체의 효율적인 고해상도 맵핑을 제공하는 것으로 결론내렸다.
CUT&RUN은 드문 불용성 DNA-결합 단백질 복합체를 분석한다.
Abf1 및 Reb1은 비교적 풍부한 TF이지만, 많은 관심의 DNA 결합 단백질은 드물기 때문에 ChIP에 의해 프로파일링하기 어려울 수 있다. 출아 효모에서, 염색체당 단 하나의 동원체 뉴클레오솜이 존재하는데, 이는 Abf1 또는 Reb1의 몰 존재비의 단지 약 1%에 불과하다. H3 대신에 CenH3(Cse4) 히스톤 변이체를 함유하는 동원체 뉴클레오솜을 연구하는 것에 추가의 과제는 그가 세포주기 전체에 걸쳐 다중 메가 달톤 키네토코어 복합체의 일부이며(Akiyoshi et al., 2010), 이로써 매우 불용성이 된다(Krassovsky et al., 2012)는 것이다. CUT&RUN에 의해 Cse4 뉴클레오솜을 프로파일링하기 위해, 샘플을 분해 후 분할하고, 하나의 분취액에서 상등액만을 추출하고 다른 것에서 총 DNA를 추출하였다. 이러한 방식으로, 가용성 및 불용성 키네토코어 복합체의 회수를 비교할 수 있다. 동시에, 히스톤 H2A도 유사하게 프로파일링하였다. 총 염색질과 가용성 염색질을 구별함으로써, 불용성 펠렛에서 각 히스톤의 점유를 유추할 수 있다. 불용성 키네토코어에 대해 예상된 바와 같이, 염색체에서 가장 높은 Cse4 점유는 동원체에서 보인다(도 5A). 놀랍게도, 게놈 전체의 모든 뉴클레오솜에 존재하는 불용성 H2A의 점유 또한 동원체에서 최대이다. 실제로, 모든 16개의 효모 동원체에서 본 발명자들은 분해 시간 경과에 따라 대략 120 bp의 기능적인 동원체에 국한된 매우 유사한 Cse4 및 H2A의 농축을 표준 X-ChIP보다 4배 더 나은 분해능으로 관찰한다(도 5B). 또한, 본 발명자들은 CUT&RUN을 적용하기 전에 포름알데히드 가교 결합된 세포에서 유래한 비드 결합된 염색질에서 총 DNA를 추출하여 유사한 결과를 얻었다(도 5C). 흥미롭게도, 가교 결합은 더 뚜렷한 프로파일 및 양쪽의 단계별 뉴클레오솜의 출현을 초래하며, 이는 가교 결합에 의한 염색질 유연성의 감소로 해석되는 한편, 기본 전략이 가교 결합된 세포에 적용될 수 있음을 입증한다.
CUT&RUN 상등액과 총 DNA 사이에 관찰된 차이가 키네토코어 염색질의 차등적 용해도로 인한 것임을 확인하기 위해, 샘플을 분해 전에 분할하고, 한 분취액의 경우, 2 M NaCl로 절단 반응을 정지시키고 서열 분석을 위해 상등액을 회수하였다. 총 DNA의 경우 고염 분획에 대해 유사한 결과를 얻었다(도 17A-17C). 동원체 뉴클레오솜에서 불용성 H2A의 명백한 존재는 그 조성에 대한 지속적인 논쟁을 직접 다룬다(Wisniewski et al., 2014; Henikoff et al., 2014; Aravamudhan et al., 2013; Shivaraju et al., 2012). 또한, 효모 동원체 뉴클레오솜이 > 90% A+T인 DNA를 랩핑함에 따라(Krassovsky et al., 2012), >100배 분해 시간 경과(도 5)에 따른 동원체 분자의 온전성은 CUT&RUN이 AT 풍부 DNA에 대한 MNase의 고유한 선호에 의해 편향되지 않는다(Chung et al., 2010; McGhee and Felsenfeld, 1983)는 것을 입증해준다. CUT&RUN은 큰 DNA 결합 복합체, 심지어 드물고 불용성이며 AT가 풍부한 것을 맵핑할 수 있다고 결론내렸다.
CUT&RUN은 가까운 염색질을 탐침한다 .
≥150 bp의 프로파일의 조사(도 1D 및 도 4A-4C)는 결합 부위 주변에서 넓은 피크를 나타내는데 때로는 분해 시간에 따라 깊어지는 부위 자체에 해당하는 '노치'가 있다. 이 패턴은 가용성 단편을 생성하는 TF-DNA 복합체 주위의 절단 및 TF 결합된 부위에 충분히 가까운 제2 절단으로 인한 한 말단을 가진 단편의 점진적 방출을 나타내는 것으로 해석되었다. ≥150 bp 단편의 히트 맵 분석은 또한 양쪽에서 대략 0.5 kb를 연장하는, 자신의 각각의 결합 모티프에 대해 Abf1 및 Reb1 단편의 점유를 보였다(도 2A-2B). 이러한 연장된 국소 절단은 DamID(van Steensel et al., 2001)의 > 1 kb 도달 거리를 연상시키며, 이는 테더의 유연성이 근처의 염색질의 탐침을 초래함을 시사한다.
CUT&RUN은 인간 전사 인자 결합 부위를 고해상도로 맵핑한다
CUT&RUN은 잘 연구된 간단한 게놈에서 원리 증명을 확립하여, 이를 인간 K562 세포의 CCCTC 결합 인자(CTCF)에 적용하였다. 다양한 방법의 효율성을 직접 비교하기 위해 각 기술에 대해 천만 건의 리드를 무작위로 선택하였으며 원시 점수를 서열 분석된 리드당 정보 내용의 표시로서 플로팅하였다. 효모 TF의 경우와 마찬가지로 CTCF CUT&RUN은 표준 X-ChIP-seq 및 ChIP-exo를 포함한 다른 프로파일링 방법보다 높은 동적 범위를 나타냈다(도 6A). DNaseI 과민성 부위 또는 이전에 확인된 결합 부위 내에서 발견된 CTCF 모티프에 정렬될 때, CUT&RUN 및 X-ChIP-seq CTCF 히트 맵은 CUT&RUN이 더 높은 동적 범위를 가지면서 강한 일치를 나타냈다(도 6B). CUT&RUN이 저온에서 수행될 때(도 19A-19D) 항체 없는 대조군은 검출되지 않은 배경을 나타냈다(도 18). 출아 효모 TF의 경우와 같이, 인접 단편의 방출이 관찰되었으며, 이는 CTCF 부위에 바로 인접한 단계별 뉴클레오솜에 해당한다. 테더링된 MNase의 절단 위치인 짧은 CUT&RUN 단편의 말단 위치만을 플로팅함으로써, CTCF 모티프와 관련하여 정의된 위치에서 뚜렷한 '트램 트랙'이 44 bp 분리되어 관찰되었다. 더욱이, 정확한 절단 패턴은 대략 300배 시간 경과 분해 범위에서 CTCF 결합된 부위의 양쪽에 우세한 단일 염기쌍 절단 부위와 일치하며, 이는 획득된 제한 분해물을 강조한다(도 6C). 이 패턴은 절단 위치가 세포 집단 내에서 정확하고 매우 균일하다는 것을 나타낸다. 결과는 CUT&RUN이 동일한 실험에서 TF와 측면 염색질을 모두 정확하게 맵핑함을 시사한다. CTCF에는 11개의 징크 핑거가 있으므로 비정상적으로 안정적인 단백질-DNA 상호 작용을 나타낼 수 있다. 따라서, CUT&RUN은 짧은 E-박스 모티프에 결합하고 b 체류 시간을 갖는 염기성 루프-나선형 단백질인 Myc 및 Max를 사용하여 테스트하였다(Phair et al., 2004). CUT&RUN은 Myc와 Max를 모두 고해상도로 성공적으로 맵핑하였다(도 20A). Max의 경우, 동일한 항체가 사용되었으므로 ENCODE ChIP-seq 데이터와의 정량적 비교가 가능하며, 여기서 CUT&RUN은 훨씬 더 높은 동적 범위를 가지므로 훨씬 더 많은 수의 Max 결합 부위를 강건하게 식별할 수 있었다, E-박스에서 DNA에 결합하기 위해 Myc는 Max와 이종이량체를 형성하지만(Blackwood et al., 1991) Max는 또한 다른 결합 파트너를 갖는다(Ayer and Eisenman, 1993). 예상된 바와 같이 거의 모든 Myc 결합 부위에 존재하는 Max와 매우 높은 중첩이 나타났다. 대조적으로, 10배 더 적은 Max 부위가 확인되었기 때문에 Myc 및 Max에 대해 ENCODE X-ChIP-seq에 의해 이전에 식별된 결합 부위 사이에 중첩은 거의 없다. 그러나 Max ENCODE X-ChIP-seq 데이터가 Max CUT&RUN 부위에 정렬되었을 때 높은 점유가 나타났으며(도 20C), 이는 CUT&RUN에 비해 X-ChIP-seq의 더 낮은 동적 범위가 X-ChIP-seq로 이러한 Max 결합 부위를 식별할 수 없는 원인이 되었음을 시사한다.
CUT&RUN은 밀집된 염색질 내 히스톤 변형을 맵핑한다
항체-테더링된 MNase는 고등 진핵생물에서 고도로 밀집된 이질 염색질 영역에서 배제될 수 있고 따라서 CUT&RUN은 진정 염색성 영역에서 단백질-DNA 상호 작용의 분석으로 제한될 수 있다는 가능성을 고려하였다. 따라서, 억제 히스톤 마크 H3K27me3에 대해 CUT&RUN을 수행하였다. CUT&RUN 및 ENCODE X-ChIP-seq로부터 1 천만 리드를 분석하여, 유사한 H3K27me3 지형을 그러나 CUT&RUN에 대해 훨씬 더 높은 동적 범위에서 관찰하였는데, 이는 단백질 A-MNase가 밀집된 염색질에 접근할 수 있음을 보여준다(도 21). 또한, H3K27me3 절단된 염색질은 온전한 핵으로부터 가용성 분획으로 쉽게 방출되어, CUT&RUN이 밀집된 염색질에서 단백질-DNA 상호 작용을 탐침하는 데 적용 가능하다는 것을 나타낸다.
CUT&RUN은 긴 범위의 게놈 접촉을 방향에 따라 맵핑한다
TF에 인접한 뉴클레오솜 크기 단편이 TF 함유 단편과 함께 방출됨에 따라, 3D 인접성도 절단 및 방출의 대상이 되는지에 대한 의문을 가졌다. Hi-C 및 ChIA-PET(Tang et al., 2015; Lieberman-Aiden et al., 2009)와 같은 염색체 구조 포착(3C: Chromosome-Conformation-Capture) 방법은 3D 게놈 전체 접촉을 맵핑하는데 선호되는 기술이다. 이들 방법은 X-ChIP와 동일한 포름알데히드 가교 결합 프로토콜을 사용하여 인핸서에 결합된 TF와 보조 활성화 인자를 통한 프로모터와의 접촉 사이에서와 같은 3D 상호 작용을 식별한다. 이 예에서, 상호 작용 중 하나가 포름알데히드에 의해 가교 결합된 간접 단백질-단백질 상호 작용에 의한 것이더라도, X-ChIP에 의해 식별된 단백질의 결합 부위는 프로모터 및 인핸서를 둘 다 포함할 것이다. 그러나 X-ChIP 및 3C 기반 맵핑에는 모두 직접 부위와 간접 부위를 구분할 체계적인 방법이 없다. 따라서, 단백질-단백질 상호 작용의 일시적 특성으로 인해 이전에 TF 특이적 DNA 결합 모티프를 함유하는 직접 결합 부위만을 맵핑하는 결과를 보여준 천연 ChIP를 사용하여 CTCF 결합 부위를 맵핑하려고 시도하였다(Kasinathan et al., 2014). 단백질 재분포의 증거 없이 거의 완전한 단백질 추출을 달성하는 새로운 천연 ChIP 프로토콜(아래 참조)이 개발되었다(도 22A-22B). 천연 조건하에 높은 모티프 점수를 갖는 2298개의 부위를 식별하였다. 대조적으로, CTCF의 CUT&RUN 맵핑은 X-ChIP에도 존재하는, 다양한 범위의 모티프 점수를 갖는 대략 22,000개의 부위를 검출하였다(도 23). 예상대로 천연 ChIP에 의해 식별된 모든 부위는 CUT&RUN 및 X-ChIP에 의해 강건하게 검출되었으며, 이는 유사한 신호 분포를 보여준다(도 7A). 그럼에도, 유의한 천연 ChIP 신호가 없는 CUT&RUN 부위는 유사한 누적 분포 카운트를 갖는 천연 ChIP 입력에서 강건한 풋프린트를 보여주었고(도 7B), 이는 3D 게놈 상호 작용에 대해 예상되는 바와 같이 알려지지 않은 결합 인자의 존재를 나타낸다. 이는 X-ChIP와 마찬가지로 CUT&RUN이 직접(천연 CTCF 피크) 및 간접(CUT&RUN 피크만) 염색질 상호 작용을 고해상도로 발견할 수 있음을 나타낸다.
천연 ChIP에서 관찰되지 않은 CTCF CUT&RUN 부위가 접촉 부위에 해당하는지 확인하기 위해 직접 및 간접 부위를 ChIA-PET에서 관찰한 접촉 부위와 비교하였다. CTCF ChIA-PET은 CTCF를 통해 매개되는 상호 작용하는 게놈 영역을 식별하지만, 직접적으로 CTCF 결합된 영역과 상호 작용하는 간접적으로 결합된 영역 사이를 식별할 수는 없다. 전형적인 대략 1 Mb 게놈 영역의 경우, 모든 높은 스코어링 ChIA-PET 단편은 직접 및 간접 부위와 중첩된다(도 8A). 맵핑된 CTCF ChIA-PET 융합 단편은 사용된 6-커터 제한 효소에 대한 부위 사이의 거리에 의해 결정되는 수 kb 범위에 있는 반면, 직접 및 간접 CUT&RUN CTCF 부위는 모두 거의 염기쌍 분해능으로 맵핑된다. 또한, 직접 부위의 91%가 CTCF ChIA-PET 데이터에 존재하며, 이 ChIA-PET 단편의 43%가 간접 부위와 상호 작용하고 나머지는 높은 CUT&RUN 신호를 함유하였으며(도 8C), 이는 이들이 임계값을 호출하는 피크 바로 아래 여러 접촉과 관련된 간접 부위임을 나타낸다.
CUT&RUN이 간접 접촉 상호 작용을 검출할 수 있다는 추가의 증거로서, 직접 부위와 간접 부위 사이에서 높은 빈도의 Hi-C 상호 작용과 간접 부위에서 Hi-C 점수와 CUT&RUN 신호 사이의 정량적 상관관계가 발견되었다(도 8B). 따라서 CUT&RUN과 천연 ChIP를 비교하여 거의 염기쌍 분해능으로 접촉 부위를 맵핑하고, 긴 범위 게놈 상호 작용으로 인한 간접 단백질 결합 부위와 직접 단백질 결합 부위를 구별하고, 이러한 접촉에 대한 방향성을 결정할 수 있지만 다른 방법으로는 가능하지 않다.
CUT&RUN은 낮은 세포 수로 정량적 측정을 허용한다
전형적인 ChIP-seq 실험에는 많은 수의 세포가 필요하며, 낮은 세포 수의 ChIP는 풍부한 단백질로 제한되었다(Kasinathan et al., 2014; Brind'Amour et al., 2015). 600,000에서 1 천만에 이르는 K562 세포 수로 출발하여 CTCF CUT&RUN을 수행하였다. 데이터세트 사이의 절대 점유를 비교하기 위해 단백질 점유의 정확한 정량적 측정을 허용하는 스파이크-인 전략을 사용하였다(아래의 재료 및 방법 참조). 스파이크-인 DNA에 정규화될 때, 절단 사건의 수는 출발 세포 수에 비례하는 것으로 관찰되었다(도 9A-9B). 더욱이, 데이터가 인간 게놈에 정렬된 총 리드 수에 정규화될 때, 샘플에서 명백한 차이가 없으며, 이는 낮은 입력 재료로 높은 데이터 품질이 유지됨을 나타낸다.
고찰
염색질 프로파일링을 위한 간단한 방법
CUT&RUN은 문헌(Laemmli and co-workers, Schmid et al., 2004)의 ChIC 항체 테더링된 뉴클레아제 전략을 기반으로 한다. ChIC를 게놈 전체 프로파일링 방법에 적용하기 위해 중요한 다섯 가지를 변형하였다. 첫째, 투과화된 세포 또는 조 핵을 자성 비드에 고정하여 신속하고 효율적인 용액 변화를 가능하게 하여 CUT&RUN은 하루에 수행되고 자동화에 적합하다. 둘째, 항체 및 pA-MNase를 에피토프가 보존되고 접근 가능한 천연의 고정되지 않은 핵에 결합시켰다. 셋째, 고정된 MNase에 의한 절단이 0차 반응이므로, 빙냉 온도에서 분해를 수행하였으며, 이는 방출된 단편의 확산을 제한하여 배경을 감소시킨다. 넷째, 천연 염색질을 사용하였으며, 이로써 용해도에 기초하여 절단된 단편을 분획하여 방출된 염색질 복합체를 특이적으로 농축할 수 있다(Sanders, 1978; Teves and Henikoff, 2012; Jahan et al., 2016). 불용성 벌크 염색질이 제거되었으며, 입자의 양쪽에서 절단된 염색질 단편만이 상등액에 들어간다. 다섯째, DNA 추출 후, 이들 가용성 단편을 일루미나 라이브러리 제조 및 페어드-엔드 DNA 서열 분석에 사용하였다. CUT&RUN은 단순성, 분해능, 강건성, 효율성, 데이터 품질 및 고도로 불용성인 복합체에 대한 적용성과 관련하여 ChIP-seq와 마찬가지거나 그보다 잘 수행한다. CUT&RUN은 원위치에서 반응을 수행함으로써 달성되는 본질적으로 낮은 배경으로 인해 다른 고해상도 방법론의 서열 분석 깊이의 대략 1/10만을 필요로 한다. MNase가 활성화될 때 핵이 온전하기 때문에, CUT&RUN은 표적화 부위 주위의 국소 환경을 탐지할 수 있다. 실제로, CUT&RUN은 인간 세포에서 비교적 낮은 서열 분석 깊이에서 염기쌍 분해능으로 3D 접촉 부위를 회수한다.
CUT&RUN는 광범위하게 적용 가능하다
ChIC는 12년 전에 서던 블롯팅을 사용한 기본 맵핑 방법으로 설명되었지만 이를 사용하는 단일 발행물은 알지 못한다. 한편, ChIP-seq 단독은 히스톤 변형, 전사 인자 및 염색질 관련 단백질을 포함하여 거의 모든 유형의 염색질 성분을 프로파일링하기 위한 약 30,000개의 간행물에서 언급되었다. ChIP와 마찬가지로 CUT&RUN은 항체 기반이므로 염색질의 모든 에피토프에 적용할 수 있으므로 ChIP용으로 개발된 대규모 항체 생산 인프라를 활용하는 염색질 프로파일링의 일반적인 방법이 된다. CUT&RUN은 ChIP-seq 및 CUT&RUN 데이터세트를 처리하고 비교하기 위해 주문형 소프트웨어로 구현한 표준 및 스파이크-인 정규화 선택 사항을 사용하여 정량적 점유 프로파일을 제공한다. CUT&RUN의 유일한 비표준 특징은 pA-MN 융합 단백질을 요구한다는 것이며, 이는 >100,000개 샘플을 프로파일링하기에 충분한 pA-MN을 생성하는 박테리아 배양물로부터 배치로 생성 및 정제될 수 있다. CUT&RUN은 ChIP와는 다른 원리를 기반으로 하기 때문에, 가교 결합, 초음파 및 가용화 관련 문제를 해결할 수 있다. 절단은 결합 부위 주변에서만 발생하기 때문에 CUT&RUN의 배경은 낮은 반면, ChIP는 먼저 전체 게놈을 분쇄하고, 이러한 단편은 여전히 서열 분석되어야 하는 게놈 전체의 배경 잡음의 원인이 된다. 본 발명자들이 사용한 짧은 저온 조건하에서 검출되는 배경이 거의 없고, 접근 가능하거나 AT가 풍부한 DNA에 대한 선호도의 부재, 효모 게놈에서 본질적으로 모든 Abf1 및 Reb1 모티프의 회수는 CUT&RUN이 때때로 ChIP를 괴롭힌 아티팩트 유형의 대상이 아님을 시사한다(Teytelman et al., 2013; Park et al., 2013; Jain et al., 2015; Baranello et al., 2016; Kasinathan et al., 2014). 더욱이, CUT&RUN 항체 결합은 면역 형광 현미경법 조건과 유사한 온전한 핵 환경에서 발생하므로, 세포학적으로 검증된 항체, 심지어 CHIP에서 실패한 항체에 대해서도 성공적일 것이다. CUT&RUN은 표적화된 절단 반응 후에만 염색질을 용해시키기 때문에, 고전적인 염색질 염 분획법(Sanders, 1978; Teves and Henikoff, 2012; Jahan et al., 2016)을 특정 TF 및 염색질 복합체에 확장시키는데 적합하다.
CUT&RUN은 긴 범위 접촉을 정확하게 맵핑한다
CUT&RUN에 온전한 핵을 사용한 결과는 항체 테더링된 MNase의 긴 도달 범위가 국소 환경을 탐지할 수 있다는 것이다. 효모에서, TF 측면에 있는 DNA의 한 표면에서 절단이 관찰되었고, 거리에 따라 점차 감소하였다. 인간 세포에서 이전에 CTCF에 대한 접촉 부위로서 확인된 부위에서 절단이 관찰되었다. 최근에, CTCF 결합 부위가 주어진다면, CTCF 결합 부위가 주어진다면 Hi-C 접촉 부위가 컴퓨터를 이용하여 높은 신뢰도로 예측되었다(Sanborn et al., 2015). CUT&RUN은 CTCF 결합 부위와 상호 작용을 모두 맵핑하고, 천연 ChIP 프로토콜이 직접적으로 TF 결합된 부위를 식별하기 때문에, 직접 및 간접 TF 결합 부위 사이에 고해상도 구별을 이용하여 3D 접촉 맵을 농축시키면서 게놈의 완전한 고해상도 1D 맵을 제공할 수 있다.
낮은 배경 수준은 서열 분석 비용을 감소시킨다
ChIP-seq 분석은 일반적으로 샘플 사이의 서로 다른 수의 리드를 보상하는 정규화를 포함한다. ChIP-seq에서, 전체 게놈 단편화는 예를 들어 야생형과 녹다운 세포주를 비교할 때, 정규화의 기초를 제공하는 일정한 저밀도 게놈 전체 배경을 초래한다. 풍부한 단백질에 대해서는 정규화가 실패하지만, 이는 스파이크-인 대조군(Bonhoure et al., 2014; Chen et al., 2015; Orlando et al., 2014)을 사용하여 보정될 수 있다. 그러나 엄격한 스파이크-인 전략은 다른 종으로부터의 세포의 첨가가 필요하고, 정량은 항체 교차 반응성에 의존한다(Orlando et al., 2014). CUT&RUN에서 배경이 낮음에도 샘플 간 정규화를 위해, 다른 종으로부터 일정한 소량의 단편화된 스파이크-인 DNA의 추가로 단백질 점유의 정확한 정량이 충족되고 가능하게 된다. CUT&RUN을 사용한 낮은 배경 수준의 절단은 피크를 선명하게 정의하는 데에 더 적은 리드가 필요하다. 예를 들어, CTCF 시점마다 단지 약 천만 개의 페어드-엔드 리드가 필요했으며 이는 저해상도 ChIP-seq에 대한 요건과 유사하며, CTCF에 대해 약 1억 개의 리드가 필요한 ChIP-exo보다 훨씬 적었다(Rhee and Pugh, 2011). 또한, Max 및 H3K27me3의 경우, CUT&RUN에 대해 천만 개의 리드는 매우 높은 동적 범위를 제공했지만, 천만 개의 리드는 Max ENCODE X-ChIP-seq에서 피크를 호출하는데 불충분했다. 이러한 비용 효율성으로 인해 CUT&RUN은 특히 서열 분석 깊이가 제한적일 경우 ChIP-seq의 대체법으로서 매력적이다. CUT&RUN의 높은 효율은 원위치 프로파일링과 ChIP 사이의 근본적인 차이로 인한 것일 수 있다: CUT&RUN은 생체 내 3D 형태를 유지하므로 항체는 1차 결합 반응에서 노출된 표면에만 접근하지만, ChIP에서는 항체가 분쇄된 세포 또는 핵의 가용화 가능한 게놈 전체 내용물과 상호작용한다. 더욱이, CUT&RUN 절단은 사실상 0차 반응이며, 게놈의 결합된 모든 에피토프에 대해 짧은 저온 시간 과정 동안 꾸준한 입자 방출을 초래한다. 에피토프 존재비를 설명하자면, 600,000개의 세포로 약 22,000개의 직접 및 간접적인 CTCF 부위의 맵핑은 전형적으로 약 5000개 세포로 H3K27me3과 같은 풍부한 히스톤 변형에 제한되는 초저(ultra-low) 입력 ChIP-seq 프로토콜의 감도와 비슷한 것으로 추정된다(Brind'Amour et al., 2015). 초저 입력 ChIP는 약 2 kb 해상도만 제공하는 반면 CUT&RUN은 거의 염기쌍 해상도를 제공한다. 개시된 방법의 자동화를 위한 내재하는 강건성, 높은 정보 내용, 낮은 입력 및 서열 분석 요건 및 적합성은 CTCF 및 다른 TF의 CUT&RUN 프로파일링이 후성 유전체 진단에 적용될 수 있음을 나타낸다. 요약하면, CUT&RUN은 ChIP 및 그 파생법에 비해 실질적인 여러 가지 장점을 갖는다: 낮은 서열 깊이 요건을 초래하는 낮은 배경으로 사용이 간편하여 로봇 자동화가 가능하며, 동시에 간단한 스파이크-인 전략으로 정확한 정량화가 가능하다. 따라서 모든 중요한 양태에서 CUT&RUN은 ChIP 기반 전략에 대한 매력적인 대안을 제공한다.
재료 및 방법
각각의 내인성 프로모터의 제어하에 Flag 태그된 H2A(SBY2688), Cse4(SBY5146), Abf1 및 Reb1을 포함하는 생물학적 W1588-4C 에스. 세레비지에 균주는 이전에 기술되었다(Kasinathan et al., 2014; Krassovsky et al., 2012; Gelbart et al., 2001). 효모 핵은 기술된 바와 같이 제조하고(Kasinathan et al., 2014), 0.5~0.6 ml 분취량으로 급속 동결시키고 -80℃에 보관하였다. 인간 K562 세포는 표준 조건하에서 배양하였다. 전기영동 겔 분석 및 면역 블롯팅을 위해 표준 프로토콜을 사용하였다. 사용된 항체는 마우스 항-FLAG(M2, Sigma, 미국 미주리주 세인트 루이스 소재, MO, 카탈로그 #F1804), 토끼 항-마우스(Abcam, 영국 캠브리지 소재, UK, 카탈로그 #ab46540), CTCF(Millipore, 미국 매사추세츠주 빌레리카 소재, 카탈로그 #07-729), H3K27me3(Millipore 카탈로그 #07-449), c-Myc(Cell Signaling Technology, 미국 매사추세츠주 비벌리 소재, 카탈로그 #D3N8F), Max(Santa Cruz Biotechnology, 미국 텍사스주 달라스 소재, 카탈로그 #sc-197) 및 RNA Pol II(8WG16, Abcam 카탈로그 #ab817)이었다. pK19pA-MN 플라스미드는 울리치 램나이(Ulrich Laemmli)로부터 기증받았고, pA-MN 단백질은 기술된 바(Schmid et al., 2004)와 같이 이. 콜라이 세포로부터 제조하였다. 효모 핵 CUT&RUN을 위한 CUT&RUN은 공개된 절차에 따라 제조된 조 핵으로 시작한다. 다음 프로토콜을 단계별 형식으로 제공한다(아래 참조). OD600 약 0.7에서 약 5 X 108개의 세포의 핵을 기술된 바(Orsi et al., 2015)와 같이 제조하고, 10개의 600 mL 분취액으로 나누고, 급속 동결시키고 -80℃에서 유지한 후 사용 전에 얼음에서 해동시킨다. Bio-Mag Plus 콘카나발린 A(렉틴) 코팅된 비드를 각각 1 mM의 MgCl2, CaCl2 및 MnCl2이 보충된 HNT(20 mM HEPES pH 7.5, 100 mM NaCl 및 0.1% 트윈 20)로 평형화하였다. 렉틴을 활성화시키기 위해서는 Ca++ 및 Mn++만이 필요하며, MgCl2를 생략하는 것은 비드에 대한 투과화 세포의 결합에 영향을 미치지 않았다. 비드(300 mL)를 해동된 핵 분취액과 신속하게 혼합하고 실온(RT)에서 ≥5분 유지하고, 마그넷 스탠드에 두어 투명하게 하고(<1분), 마그넷 스탠드에서 디캔팅하였다. 이어서, 비드를 프로테아제 억제제(로슈 컴플리트 정제(Roche Complete tablet)) 및 1 mM 페닐메틸술포닐 플루오라이드(PMSF)(= HNT-PPi)가 보충된 HNT(3% 소 혈청 알부민(BSA) 및 2 mM EDTA pH 8 함유)에서 RT에서 5분 인큐베이션한 후, HNT-PPi + 0.1% BSA(차단 완충액)와 5' 인큐베이션하고, 마그넷 스탠드를 사용하여 디캔팅하였다. 비드를 마우스 비드 항-FLAG 항체(1:200~1:350)와 4℃에서 2시간 동안 인큐베이션하고, 디캔팅하고, HNT + PMSF로 1회 세척한 후, 차단 완충액에서 토끼 항-마우스 IgG 항체(1:200)와 4℃에서 1시간 동안 인큐베이션하였다. 비드를 HNT + PMSF에서 1회 세척한 후, 차단 완충액에서 pA-MN(600 mg/ml, 1:200)과 4℃에서 1시간 동안 인큐베이션하였다. 비드를 HNT + PMSF에서 2회 및 20 mM HEPES pH 7.5, 100 mM NaCl(분해 완충액)(경우에 따라 Sth1 및 Mot1에 대해 10% 폴리에틸렌 글리콜 8000 포함)에서 1회 세척하였다. 비드를 1.2 ml 분해 완충액에 넣고, 8 X 150 mL 분취액으로 나누고, 0℃로 평형화한 후, CaCl2와 빠르게 혼합하였고, 150 mL 2`[200 mM NaCl, 20 mM EDTA, 4 mM EGTA, 50 mg/ml RNase A(Thermo Scientific, 미국 매사추세츠주 월섬 소재, 카탈로그 #EN0531) 및 40 mg/ml 글리코겐(Sigma, 카탈로그 #10901393001), 스파이크-인으로서 포름알데히드 가교 결합된 MNase 처리된 초파리 염색질로부터 추출된 이종의 대부분 모노뉴클레오솜 크기의 DNA 단편 5~50 pg/ml 함유]로 반응을 정지시켰다. 37℃에서 20분 동안 인큐베이션한 후, 비드를 4℃에서 13,000 rpm으로 5분 동안 원심분리하고, 상등액을 마그넷 스탠드에서 꺼내어 3 mL 10% SDS 및 2 mL 프로테이나아제 K(Invitrogen, 미국 캘리포니아주 칼즈배드 소재, 카탈로그 #25530049)와 혼합하고, 70℃에서 10분 동안 인큐베이션한 후, 완충된 페놀-클로로포름-이소아밀알코올(25:24:1, Sigma P2069)로 실온에서 1회 추출하고, 상 잠금(phase-lock) 튜브(Qiagen, 독일 힐덴 소재, 카탈로그 #129046)로 옮기고, 1 vol CHCl3으로 재추출하고, 2 mL 2 mg/ml 글리코겐을 함유하는 새로운 튜브로 옮기고, 2~2.5 vol 에탄올을 첨가하여 침전시키고, 얼음에서 냉각시키고 4℃에서 13,000 rpm으로 10분 동안 원심분리하였다. 펠렛을 100% 에탄올로 헹구고, 공기 건조하고, 25 mL 0.1 x TE8(= 1 mM 트리스 pH 8, 0.1 mM EDTA)에 용해시켰다. 고염 추출을 위해 CUT&RUN을 확장하기 위해, 50 mL 부피로 분해를 수행하고, RNase를 생략하고 표준 200 mM NaCl을 4M NaCl로 대체하여 50 mL 2XSTOP으로 정지시켰다. 37℃에서 20분 후, 200 mL 67 mg/ml RNase A를 첨가하고, 20분 동안 인큐베이션한 후, 13,000 rpm으로 원심분리하여 상등액을 청정화하였다. 포유류 세포에 대한 CUT&RUN. 인간 K562 세포를 ATCC(미국 버지니아주 머내서스 소재, 카탈로그 #CCL-243)로부터 구입하였다. 원심분리 기반 프로토콜을 사용하여 CUT&RUN을 수행하였다. 천만 세포를 원심분리(600 g, 스윙 버켓 로터에서 3분)에 의해 수거하고 빙냉 인산염 완충 식염수(PBS)에서 세척하였다. 1 ml NE1(20 mM HEPES-KOH pH 7.9; 10 mM KCl; 1 mM MgCl2; 0.1% 트리톤 X-100; 20% 글리세롤)에서 저장성(hypotonic) 용해에 의해 얼음에서 5분 동안 핵을 단리한 후 상기와 같이 원심분리하였다(일부 세포에서 뉴클레아제는 DNA의 Mg++ 의존적 분해를 일으켰으며, 이 경우 0.5 mM 스페르미딘이 1mM MgCl2를 대체할 수 있음). 1.5 ml 완충액 1(20 mM HEPES pH 7.5; 150 mM NaCl; 2 mM EDTA; 0.5 mM 스페르미딘; 0.1% BSA)에서 핵을 간단히 세척한 후 1.5 ml 완충액 2(20 mM HEPES pH 7.5; 150 mM NaCl; 0.5 mM 스페르미딘; 0.1% BSA)에서 세척하였다. 500 ml 완충액 2에 핵을 재현탁하고 10 ml 항체를 첨가하고 4℃에서 2시간 동안 인큐베이션하였다. 핵을 1 ml 완충액 2에서 3회 세척하여 결합되지 않은 항체를 제거하였다. 핵을 300 ml 완충액 2에 재현탁하고 5 ml pA-MN을 첨가하고 4℃에서 1시간 동안 인큐베이션하였다. 핵을 0.5 ml 완충제 2에서 3회 세척하여 결합되지 않은 pA-MN을 제거하였다. 튜브를 빙수 중의 금속 블록에 놓고, 최종 농도 2 mM가 되도록 100 mM CaCl2와 빠르게 혼합하였다. EDTA 및 EGTA를 각각 10 mM 및 20 mM의 최종 농도로 첨가하여 반응을 켄칭시키고, 초파리 DNA로부터의 모노뉴클레오솜 크기의 DNA 단편 1 ng을 스파이크-인으로서 첨가하였다. 4℃에서 1시간 동안 핵을 인큐베이션함으로써 절단된 단편을 상등액으로 유리시키고, 상기와 같이 원심분리하여 핵을 펠렛화하였다. 상등액으로부터 DNA 단편을 추출하여 서열 분석 라이브러리의 구축에 사용하였다. 이 프로토콜을 또한 자성 비드(아래에 나타냄)와 함께 사용하도록 조정하였다. TF ChIP-seq 데이터세트에서 스파이크-인 정규화 게놈 전체 배경은 전형적으로 라이브러리 제조 및 서열 분석의 샘플 간 편차를 보상하기 위한 정규화에 일정한 배경 수준을 제공하기에 충분히 높다. 표준 정규화의 경우, 게놈의 각 염기 위치에 해당하는 단편 말단의 수를 맵핑된 총 리드 말단 수로 나누었다. 그러나 본질적으로 낮은 CUT&RUN의 배경 수준은 정량적 비교를 위한 스파이크-인 대조군을 필요로 한다(Hu et al., 2014). 인간 CUT&RUN의 스파이크-인 정규화를 위해, 일정한 소량의 드로소필라 멜라노가스터(Drosophila melanogaster) DNA를 각 반응에 첨가하였다. 페어드-엔드 리드를 인간 및 파리 게놈 모두에 맵핑하여 인간 프로파일을 파리 리드 수에 정규화하였다(도 9A-9B). 내부 정규화를 사용하여, 분해 시간 경과에 따라 절단의 증가가 관찰되지 않았다. 그러나 파리 스파이크-인 DNA에 정규화함으로써, 시간에 따른 절단 수준에서 약 4배 증가가 관찰되었다. 따라서 CUT&RUN은 단백질-DNA 상호 작용의 정확한 정량화가 가능하다. 라이브러리 제조, 서열 분석 및 데이터 처리 서열 분석 라이브러리는 KAPA DNA 폴리머라제 라이브러리 제조 키트 프로토콜(www.kapabiosystems.com/product-applications/products/next-generation-sequencing-2/dna-library-preparation/kapa-hyper-prep-kits/)에 따라 8회 이상의 사이클을 증폭하여, 크기 선별이 없음을 제외하고는 문헌[Kasinathan et al., 2014; Henikoff et al., 2011]에 기술된 바와 같이 DNA 단편으로부터 제조하였다. 불용성 염색질에서 유래하는 큰 단편의 총 DNA 샘플을 고갈시키기 위해, 샘플을 ½ 부피의 아젠코트(Agencourt) AMPure XP 비드와 혼합하고 5~10 분 동안 유지하고 마그넷 스탠드에 두어 상등액을 유지하고 비드를 버렸다. 남아있는 큰 단편이 나타나는 것을 감소시키기 위해, KAPA 폴리머라제 라이브러리 제조 방법을 사용하는 PCR 사이클의 수를 14 사이클로 증가시키고 이에 따라 어댑터 농도를 증가시켰다. PCR 사이클의 수를 증가시키는 것은 폴리머라제가 완전히 통과하기에 너무 긴 단편의 선형 증폭보다 짧은 단편의 지수적 증폭을 선호한다. 라이브러리는 일루미나 HiSeq 2500에서 페어드-엔드 모드에서 25 사이클 동안 서열 분석하였다. 페어드-엔드 단편을 sacCer3/V64 게놈에 맵핑하고 SAM 파일 생성하기 위해 기술된 바와 같이 Novoalign(Novocraft)을 사용하여 FlyBase로부터 얻은 디. 멜라노가스터 게놈 서열의 r5.51(2013년 5월)을 구축 및 공개한다. 인간 샘플의 경우, 페어드-엔드 단편은 Bowtie2를 사용하여 hg19에 맵핑하였다. 데이터 처리를 위한 사용자 지정 스크립트는 Supplementary 소프트웨어에서 제공되며 github.com/peteskene에서 다운로드할 수 있다. 비교 분석의 경우, NCBI SRA 아카이브에서 다운로드한 공개적으로 사용 가능한 데이터세트는 ERR718799(Abf1), SRR2568522(Reb1), GSM749690(CTCF; 1%의 가짜 발견율을 갖는, 게놈 전체에서 20 bp 스텝으로 150 bp 슬라이딩 윈도우)이었고, CTCF ChIP-exo BAM 파일은 친절하게도 프랭크 푸우(Frank Pugh)에게 제공받았다. CUT&RUN 피크 쪽으로 편향되지 않은 TF 특정 모티프 세트를 얻기 위해 MEME 모티프 찾기 프로그램을 효모 ORGANIC ChIP-seq 피크 호출에 적용하였다. 결과 로그 오즈(log-odds) 위치 특이적 점수 행렬(PSSM)을 에스. 세레비지에 게놈의 MAST 검색에 사용하여 유의한 로그-오즈 모티프 점수를 갖는 부위를 식별하였다. 이것은 1899개의 Abf1 부위와 1413개의 Reb1 부위를 식별하였다. 이전 연구를 따라, 효모 TF 결합 부위의 그 TF에 대한 모티프로의 대응은 참 양성 호출에 대한 '최적 표준'이 되도록 사용하였다(Rhee and Pugh, 2011; Kasinathan et al., 2014; Zentner et al , 2015; Ganapathi et al., 2011). 카시나탄(Kasinathan) 등의 임계값 방법(Kasinathan et al., 2014)을 사용하여 호출된 피크로부터 로그 오즈 PSSM을 구축하기 위해 MEME를 사용하였다. 피크 호출 컷오프는 피크 사이 거리 = 100, 최소 피크 너비 = 50, 최대 피크 너비 = 1000인 풀링된 1초 ~ 32초 ≥120 bp Abf1 및 Reb1 데이터세트에 대해 99.5번째 백분위 수의 정규화 카운트이다. CUT&RUN과 ORGANIC 모티프 회수를 비교하기 위해, 피크 호출 임계값을 조정하여 비슷한 수의 피크를 보고하였다. PWMTools(ccg.vital-it.ch/pwmtools/)를 사용하여 로그 오즈 서열 로고를 생성하였다. IGV를 사용하여 트랙 스크린 샷을 생성하였다(Thorvaldsdottir et al., 2013).
실시예 1에 대한 참고 문헌(이들 각각은 그 전문이 참고로 포함됨)
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
효모 핵에 대한 CUT&RUN 프로토콜: OD600 약 0.7에서의 약 5 X 108개 에스. 세레비지에 세포(Orsi et al., 2015). 핵을 제조하는 다른 방법은 동등한 결과를 제공할 것으로 예상된다. Bio-Mag Plus 콘카나발린 A 코팅된 비드는 폴리사이언스(Polysciences, Inc., 미국 펜실베이니아주 워링턴 소재, 카탈로그 #86057)에서 구입할 수 있다. 분해 완충액(150 ml) 3 ml 1M HEPES pH 7.5, 20 mM, 3 ml 5M NaCl 100 mM, 물 150 ml가 될 때까지. 사용 직전에 1 mM 페닐메탄일술포닐 플루오라이드(PMSF, 에탄올 중 100 mM 저장액)를 첨가하고 첨가 후 얼음 위에 유지한다. HNT 세척 완충액(100 ml) 사용 직전에 100 ml 분해 완충액 100 mL 트윈 20 0.1%, 사용 직전 1 mM PMSF(= HNT-Pi). 비드 제조용. HNT ++ = HNT +1 mM CaCl2, + 1 mM MnCl2. 렉틴을 활성화하려면 Ca++ 및 Mn++이 필요하다. 제조업체는 1 mM MgCl2도 권장하지만, 이는 DNA 분해를 유발할 수 있으며 MgCl2를 생략하면 투과화된 핵이 비드에 결합하는데 아무런 영향을 미치지 않는다. HNT-PPi 차단 완충액(20 ml): 20 ml HNT 세척 완충액 67 mL 30% BSA 0.1% 2 미니-컴플리트 울트라(mini-complete Ultra)(Roche) 프로테아제 억제제 정제, 사용하기 직전 1 mM PMSF HNT 프리블록(pre-block)(1 ml당) 900 mL HNT-PPi 100 mL 30% BSA 3% 4 mL 0.5M EDTA 2 mM, 사용하기 직전 1 mM PMSF 2XSTOP(10 ml) 400 ml 5M NaCl 200 mM 400 mL 0.5M EDTA 20 mM 200 mL 0.2M EGTA 4 mM + 50 mL Thermo RNase A(10 mg/ml) 50 mg/ml + 20 mL 글리코겐(20 mg/ml) 40 _g/ml 물 10 ml가 될 때까지. 스파이크-인의 경우 약 10 pg/ml 스파이크-인 DNA를 추가한다(예를 들어, 포름알데히드 가교 결합된 초파리 S2 세포의 MNase 분해로부터 모노뉴클레오솜 크기의 단편). 1XSTOP(10 ml) 200 ml 5M NaCl 100 mM 200 mL 0.5M EDTA 10 mM 100 mL 0.2M EGTA 2 mM 물 10 ml가 될 때까지.
절차:
예비 차단: 1 ml HNT 프리블록을 부드럽게 피펫팅하여 추가한다. 5분 동안 방치한 후 회전시키고 마그넷 스탠드에 두고 상등액을 빼낸 후 다음 단계를 계속한다. 항체 결합: 1 ml 차단 완충액(0.1% BSA 포함 HNT-PPi)에서 5분 차단한다. 마그넷 스탠드에 두고 상등액을 빼내고 500 mL 차단 완충액에 넣는다. 볼텍싱하면서 500 mL 항-FLAG(5mL 시그마 M2 마우스 항-FLAG 항체 함유- 최종 1:200)를 부드럽게 첨가한다. 4℃에서 2시간 동안 회전 장치에서 인큐베이션한다. 회전시키고 1 ml HNT-Pi 세척 완충액에서 한 번 세척한다.
2차 항체 결합(선택 사항): 마우스 단클론 항체를 사용하는 경우, pA-MN 결합의 높은 특이성을 제공하기 위해 토끼 항-마우스 2차 항체(예를 들어, Abcam ab46540)가 필요하다. 2차 항체를 사용하면 절단 속도가 1~2 자릿수 정도 증폭된다. 1시간 동안 인큐베이션하는 것을 제외하고 3단계와 동일한 절차를 따른다.
pA-MN를 결합시킨다: 상등액을 빼내고 500 mL 차단 완충액에 넣는다. 볼텍싱하면서 5 mL pA-MN(600 mg/ml)을 함유하는 500 mL의 차단 완충액을 첨가한다. 4℃에서 1시간 동안 회전 장치에서 인큐베이션한다. 회전시키고 1 ml HNT-Pi 세척 완충액에서 2회 세척한다.
분해: 디캔팅하고 1 ml 분해 완충액에서 1회 세척하고, 1.2 ml 분해 완충액에 넣고, 각각 8 x 150 mL 시점 분취액으로 나누어 튜브 바닥에 직접 놓는다. 얼음물에 1.7 ml 튜브에 맞는 블록에서 0℃로 평형화한다. 각 튜브의 측면에 3 mL 100 mM CaCl2(2 mM이 되도록) 방울을 놓는다. 시간 경과를 얻기 위해, 튜브를 볼텍싱하고 얼음물 홀더에서 다시 놓아 분해를 시작한다. 150 mL 2XSTOP(선택적으로 스파이크-인 DNA가 첨가됨)의 첨가에 의해 정지시킨다. 총 DNA 추출을 위해: 샘플에 3 mL 10% SDS 3mL(0.1%가 되도록) 및 2.5 mL 프로테이나아제 K(20 mg/ml)을 샘플에 첨가하고 볼텍싱한다. 가끔 뒤집어 혼합하면서 70℃에서 10분 동안 인큐베이션한다(포름알데히드 가교 결합된 세포의 경우, 65℃에서 4시간 동안 인큐베이션하여 가교 결합을 역전시킴). 300 mL 페놀-클로로포름-이소아밀과 혼합하고, 13 krpm으로 5분 회전시키고 새로운 튜브에 디캔팅한다. ½ 부피(150 mL)의 AMPure 비드를 첨가하고 잘 섞는다. 10분 동안 방치하고 마그넷 스탠드에 둔다. 상등액을 새로운 튜브로 옮기고 남은 비드를 제거한 후, 상등액을 1 ml 에탄올로 침전시키고, 냉각시키고 회전시킨다. 1 ml 100% 에탄올에 세척하고 라이브러리 제조를 위해 25 ml 0.1xTE8에 넣는다. 염색질 결합된 복합체: 총 DNA 추출 절차를 따른다. HMT, 분해 및 STOP 완충액에 0.5mM 스페르미딘을 포함시킨다. 염 분획법을 위해: 분해 슬러리의 부피를 150 mL에서 50 mL로 줄이고 200 mM NaCl을 4M NaCl로 대체한 2XSTOP으로 반응을 정지시키고 RNase를 제거한다. 37℃에서 인큐베이션한 후 수 중 RNase(100 mg/ml) 200 mL를 첨가하고 37℃에서 20분 동안 인큐베이션한 후, 계속해서 13,000rpm에서 5' 회전시켜 상등액을 펠릿과 분리한다.
절제된 단편의 단리: 37℃에서 20분 인큐베이션한다. 4℃ 13,000 rpm에서 5' 회전시키고 마그넷 스탠드에 두고 상등액을 새로운 튜브로 빼낸다. 비드 펠릿을 300 mL 1XSTOP(RNase 또는 글리코겐 없음)에 넣는다. 3mL 10% SDS(0.1%가 되도록)를 첨가하고, 볼텍싱하고, 2.5 mL 프로테이나아제 K(20mg/ml)를 샘플에 첨가한다. 가끔 뒤집어 혼합하면서 70℃에서 10분 동안 인큐베이션한다.
라이브러리를 위해 상등액 DNA를 추출한다: 300 mL 페놀-클로로포름-이소아밀 알코올과 혼합하고, 상 잠금 튜브로 옮기고, 회전시킨 후, 300 mL 클로로포름으로 추출한다. 첨가하기 전에 2 mL의 2 mg/ml 글리코겐을 함유하는 새로운 튜브로 꺼낸다. 750 mL 에탄올을 첨가하고, 냉각시키고 회전시킨다. 펠렛을 1 ml 100% 에탄올로 세척하고, 공기 건조하고, 25 mL 0.1xTE8에 용해시킨다. 일부 DNA는 고 분자량 DNA의 대략 ~ 1%를 차지하며, 이는 용해되지만 라이브러리 제조 중에 현저하게 증폭되지는 않는다.
겔 분석을 위한 펠렛 분획을 추출한다(선택 사항): 300 mL 페놀-클로로포름-이소아밀 알코올과 혼합하고, 13,000 rpm으로 5분 회전시키고 대략 5분 동안 마그넷 스탠드에 놓고 빼낸다. 첨가하기 전에 튜브에 2 mL의 2 mg/ml 글리코겐을 함유하는 새로운 튜브로 수성층을 꺼낸다. 750 mL 에탄올을 첨가하고 냉각시킨 후 회전시킨다. 1 ml 100% 에탄올로 펠렛을 세척하고, 공기 건조하고, 25 mL 0.1xTE8에 용해시킨 후, 13 krpm으로 10분 원심분리하여 비드에서 나온 대부분의 불용성의 갈색 물질을 펠렛화한다. 프로토콜을 사용하여 인간 K562 세포에서 CTCF, Myc, Max 및 H3K27me3을 맵핑하였다. 매우 낮은 배경이 관찰되었다. 이 프로토콜은 온전한 핵에서 반응 부피로 '침출된' 절단 염색질 단편에 의존한다. 실험의 종료 시 온전한 핵을 스핀 다운하고 상등액 분획으로부터 DNA를 추출한다. 이는 유리된 염색질 단편을 단리하므로 추가의 크기 선택이 필요하지 않다. 프로토콜은 각 단계에서 핵을 단리하기 위해 원심분리(600 g; 3분; 스윙 버켓 로터) 또는 콘카나발린 A 코팅된 자성 비드(BioMag Plus #86057)를 사용할 수 있다.
전형적인 실험 샘플: (반응당 10 x 106개 세포): i. 항체 없음; 유리 pA-MNase(즉, 세척되지 않은 PA-MNase); ii. 항체 없음 + pA-MNase(배경 MNase 활성에 대한 대조군); iii. 항체 + pA-MNase(실험 샘플). 본 발명자들은 CaCl2 첨가 전('입력')과 반응이 정지된 후('종료') 소량의 QC 샘플을 취하여 분획 전 MNase 반응이 어떻게 진행되었는지 분석한다. 프로테아제 억제제(로슈 컴플리트 EDTA 무함유)를 50x 저장액으로부터 1x의 최종 농도로 완충액에 첨가한다.
1. 선택 사항: 비드를 준비한다(10 x 106당 50 ml 비드 사용). 3배 부피의 결합 완충액에서 3회 세척한다. 1배 부피의 결합 완충액에 재현탁한다.
2. 세포 수거; 스윙 버켓 로터(일반적으로 샘플당 1,000만 개 세포)에서 600 g로 3분 스핀 다운한다.
3. 부드럽게 피펫팅하여 1 ml의 차가운 인산염 완충 식염수(1,000만 개 초과 세포일 경우 스케일 업)에 재현탁하여 세포를 세척한다. 상기와 같이 스핀 다운한다.
4. 부드럽게 피펫팅하여 1 ml NE1에 세포를 재현탁한다(1,000만 개 초과 세포일 경우 스케일 업). 얼음 위에 10분 동안 둔다.
자성 비드: 상기와 같이 스핀 다운하고 NE1에 재현탁한다. 비드를 직접 첨가하여 부드러운 피펫팅으로 핵에 재현탁한다. 혼합 플랫폼에서 실온에서 5분. 약 2분 동안 자석에 결합시키고, 상등액을 버린다. 또는 원심분리: 스윙 버켓 로터에서 600 g으로 3분 핵을 펠렛화한다.
5. 부드럽게 피펫팅하여 1.7 ml CUT&RUN 완충액 1에 재현탁하고 1.7 ml 에펜도르프(Eppendorf) 튜브로 옮긴다. 얼음 위에 5분 동안 둔다. 상기와 같이 자석 또는 원심분리에 의해 핵을 수집한다.
6. 부드럽게 피펫팅하여 1.5 ml CUT&RUN 완충액 2에 재현탁한다. 상기와 같이 자석 또는 원심분리로 핵을 수집한다.
7. 부드럽게 피펫팅하여 CUT&RUN 완충액 2에 재현탁한다. 0.5 ml 에펜도르프 튜브에 500 ml 부피 중 1,000만 개 세포를 사용한다. 2차 항체를 포함하여 필요에 따라 항체를 첨가한다. 4℃에서 혼합 플랫폼에 2시간 동안 둔다(0.5 ml 튜브는 원심분리를 위해 더 단단한 펠렛을 제공하고 인큐베이션 동안 액체가 튀는 것을 감소시켜 핵 완전성을 유지함).
8. 4℃에서 혼합 플랫폼에 500 ml CUT&RUN 완충액 2로 5분씩 3회 세척한다. 상기와 같이 자석 또는 원심분리에 의해 핵을 수집한다.
9. 300 ml CUT&RUN 완충액 2에 재현탁한다. 3 mg 단백질 A-MNase 융합체(600 ng/ml에서 5 ml 또는 360 ng/ml에서 8.3 ml)를 첨가한다. 4℃에서 혼합 플랫폼에 1시간 동안 둔다(300 ml 반응 부피는 1.7 ml 튜브에서 상등액 분획이 쉽게 추출/EtOH 침전될 수 있게 함).
10. 4℃에서 혼합 플랫폼에 300 ml CUT&RUN 완충액 2로 5분씩 3회 세척한다. 유리 MNase 샘플일 경우에는 하지 않는다(혼합 플랫폼에 보관). 상기와 같이 자석 또는 원심분리에 의해 핵을 수집한다.
11. 300 ml CUT&RUN 완충액 2에 재현탁한다. '입력'으로서 12 ml를 취해 288 ml DNA 추출 완충액에 넣는다.
12. 젖은 얼음에 튜브를 둔다(분해는 0℃에서 수행해야 함 - 온도를 유지하기 위해 알루미늄 블록을 사용하는 것이 바람직함). 최종 농도 2 mM(6 ml의 100 mM CaCl2)로 CaCl2를 첨가한다. 빠르게 뒤집어서 섞고 젖은 얼음 위에 둔다. 원하는 시간 동안 인큐베이션한다(예를 들어, 15분). 전형적으로 유리 MNase 샘플을 37℃에서 5분 동안 둔다. 이것은 아가로스 겔 전기영동에 의해 분해가 평가될 수 있게 한다.
13. EDTA의 마스터 믹스를 10 mM가 되도록, EGTA를 20 mM가 되도록 첨가하여 정지시킨다. 빠르게 뒤집어 섞고 얼음 위에 둔다. '종료'로서 12 ml를 취하여 288 mL DNA 추출 완충액에 넣는다. 선택 사항: 스파이크-인 DNA 첨가
선택 사항 A
14. 4℃에서 혼합 플랫폼에 1시간 동안 두어 염색질 단편이 침출되도록 한다. 600 g SW 로터에서 3분 스핀 다운한다(자성 비드 방식을 사용하더라도). 상등액을 취한다.
15. 3 ml 10% SDS(최종 농도 0.1%), 5 ml의 10 mg/ml 프로테이나제 K, 2 ml의 1 mg/ml RNaseA 및 5 ml 5M NaCl(최종 농도 300 mM)을 첨가하여 상등액으로부터 DNA를 추출한다. 볼텍싱하고 55℃에서 1시간 동안 둔다. 페놀 추출; EtOH 침전(1 ml 글리코겐 첨가); EtOH 세척한다. 20 ml H20에 재현탁한다.
선택 사항 B
14. 모든 DNA를 추출한 후 매우 간단한 크기 선별을 사용하여 작은 크기의 풋프린트에서 큰 크기의 절단되지 않은 게놈 조각을 분리한다. 이것은 핵공을 통해 확산되지 않을 수 있는 크고 잠재적으로 불용성인 단백질 복합체에 더 좋다.
전체 반응물, 3 ml 10% SDS(최종 농도 0.1%), 5 ml의 10 mg/ml 프로테이나아제 K, 2 ml의 1 mg/ml RNaseA 및 5 ml 5 M NaCl(최종 농도 300 mM)에서 DNA를 추출한다. 볼텍싱하고 55℃에서 1시간 동안 둔다. 페놀 추출한 후 EtOH 침전시킨다(1 ml 글리코겐 첨가); 150 ml H20에서 EtOH 세척 및 재현탁한다.
15. 벡크만(Beckmann) 아젠코트 AMPure XP 비드(A63881)를 사용하여 절단 단편의 크기 선별(약 700 bp)
사용하기 전에 비드를 실온으로 데운다;
75 ml 비드를 넣고 10x 피펫팅하여 혼합한다;
실온에서 5분 동안 인큐베이션한다;
2분 동안 마그넷 위에 둔다;
상등액 분획을 취하고(비드에 부착된 높은 MW DNA를 취하지 않아야 함. 비드를 확인하기 위해 상등액 분획을 스핀 다운할 수 있음);
700 ml EtOH 및 1 ml 글리코겐을 첨가하여 침전시킨다(추가 염이 필요하지 않음);
70% EtOH 세척한다;
20 ml H20에 재현탁한다.
완충액:
프로테아제 억제제(로슈 컴플리트 EDTA 무함유)는 물 중 50x 저장액으로부터 1x가 되도록 첨가됨
결합 완충액
1 x PBS;
1 mM CaCl2;
1 mM MgCl2;
1 mM MnCl2;
NB: 본 발명자들은 일부 세포에서 뉴클레아제가 DNA의 Mg++ 의존성 분해를 일으키는 것을 확인하였다. 결합 완충액에 Mg++가 있으면 제조업체의 권장 사항을 따르지만 렉틴을 활성화하려면 Ca++ 및 Mn++만 필요하다. MgCl2를 생략하는 것은 투과화된 세포와 비드의 결합에 영향을 미치지 않았다.
NE1:
20 mM Hepes-KOH pH 7.9;
10 mM KCl;
1 mM MgCl2;
0.1% 트리톤 X-100; 및
20% 글리세롤.
완충액:
NB: 본 발명자들은 1 mM MgCl2을 대신하여 0.5 mM 스페르미딘을 사용하여 Mg++ 의존적 DNA 분해를 방지할 수 있음을 확인한다.
CUT&RUN 완충액 1:
20 mM Hepes pH 7.5;
150 mM NaCl;
2 mM EDTA;
0.5 mM 스페르미딘;
0.1% BSA.
CUT&RUN 완충액 2:
20 mM Hepes pH 7.5;
150 mM NaCl;
0.5 mM 스페르미딘;
0.1% BSA.
기타 시약:
100 mM CaCl2;
10% SDS;
5M NaCl;
500 mM EDTA;
프로테이나아제 K;
500 mM EGTA;
RNaseA;
추출 완충액.
프로토콜 중에 취한 12 ml QC 샘플의 DNA 추출:
페놀 추출;
에탄올 침전;
에탄올 세척;
20 mL H2O에 재현탁;
RNase 처리;
0.7% 아가로스 겔에서 전기영동.
실시예 2
표적 하 절단 및 뉴클레아제를 이용한 방출(CUT&RUN)은 마이크로코커스의 뉴클레아제에 의한 항체 표적화 제어된 절단이 페어드-엔드 DNA 서열 분석을 위한 상등액으로 특정 단백질-DNA 복합체를 방출하는 후성 유전체 프로파일링 전략이다. 표적화된 단편만이 용액에 들어가고 대다수의 DNA가 남게 됨에 따라 CUT&RUN은 배경 수준이 매우 낮다. CUT&RUN은 분해능, 신호 대 잡음, 및 서열 분석 깊이에 있어 가장 널리 사용되는 염색질 면역 침전(CHIP) 프로토콜을 능가한다. ChIP와 대조적으로, CUT&RUN은 용해도 및 DNA 접근성 아티팩트가 없으며 불용성 염색질을 프로파일링하고 가교 결합 없이 장거리 3D 접촉을 검출하는데 사용될 수 있다. 여기서 본 발명자들은 단지 히스톤 변형에 대한 단지 100개의 세포와 전사 인자에 대한 1000개의 세포로 출발하여 고품질 데이터를 제공하는, 핵의 단리가 필요하지 않은 개선된 CUT&RUN 프로토콜을 제시한다. 세포에서 정제된 DNA까지 CUT&RUN은 실험실 벤치에서 하루 미만을 요구한다.
도입
프로토콜의 개발
다세포 유기체 내의 모든 세포ㄷ는 동일한 게놈 서열을 갖지만, 상이한 유전자 발현 패턴은 조직 특화를 뒷받침한다. 유전자 발현의 차이는 전사 인자(TF)의 결합 및 이들이 뉴클레오솜을 변형시키고 이동시키는 염색질 결합된 복합체를 동원하는 것으로부터 발생한다. 결과적으로, 히스톤 변이체 및 번역 후 변형(PTM: post-translational modification)을 포함하는 TF, 염색질 결합된 복합체 및 염색질 상태의 게놈 전체 맵핑이 연구의 주요 초점이 되었다. 30년 넘게, 염색질 면역 침전(ChIP)은 단백질-DNA 상호 작용을 맵핑하는 주요한 방법이었다. ChIP를 사용하여, 세포를 포름알데히드와 가교 결합시킨 후, 전체 세포 내용물을 가용화하여 염색질 섬유를 단편화하고, 항체를 첨가하여 관심의 염색질 단편을 단리한다. ChIP에 대한 리드아웃 전략이 겔 전기영동1에서 대규모 병렬 서열 분석2 ,3으로 30년 넘게 발전하였던 반면, ChIP의 기본은 크게 변하지 않은 채 남아 있다. ChIP-seq는 TF4,5의 염기쌍 해상도 맵핑을 허용하지만, 감도, 많은 수의 세포에 대한 요건, 및 가교 결합 및 가용화로 인한 아티팩트를 제한하는 높은 배경의 문제가 남아 있다6 ~10. ChIP와 다른 원리를 기반으로 하는 대체 방법이 없었더라면, 오도하는 거짓 양성 아티팩트와 참 양성을 구분하기 어려웠을 것이다. ChIP의 이러한 한계 중 일부를 해결할 수 있는 단백질-DNA 상호 작용의 게놈 전체 맵핑을 위해 대안적인 전략이 사용되어왔다. 예를 들어, DNase 1 풋프린팅11, FAIRE-seq12, Sono-seq13, MNase-seq14,15 및 ATAC-seq16을 포함한 여러 방법이 서열 분석 리드-아웃을 사용하여 TF 결합 게놈 전체를 맵핑하는 데 사용된다. 그러나 이들 접근법은 특정 단백질을 표적화하지 않기 때문에, 어느 하나의 TF에만 한정되지 않는다. 또한, 이들은 특정 염색질 상태, 예컨대 건강 상태와 질환 상태를 임상적으로 구별하는 데 사용할 수 있는 히스톤 PTM으로 구분된 것들을 맵핑하는 데 사용될 수 없다17. 다른 방법은 관심 단백질과 DamID18의 경우 주변 DNA를 메틸화하는 효소 사이의 융합을 유전적으로 조작함으로써18, 또는 염색질 내인성 절단(ChEC)의 경우에 단백질의 풋프린트의 표적화된 절단19에 의해 표적 특이적 맵핑을 제공한다. 효소 테더링 접근법은 염색질을 단편화하고 용해시킬 필요 없이 생체 내(DamID) 또는 원위치(ChEC)에서 수행된다. 그러나 트랜스제닉 접근법이 필요하기 때문에, ENCODE와 같은 대규모 인프라 컨소시엄으로의 확장성과 임상 설정으로의 이동 가능성이 제한된다. 또한, 이러한 방법은 히스톤 PTM을 맵핑할 수 없다. 이들 제한은 염색질 면역 절단(ChIC) 방법에 의해 부분적으로 극복되었는데, 여기서 가교 결합된 세포로부터의 조 핵을 먼저 TF 특이적 항체로 처리한 후, 단백질 A와 마이크로코커스의 뉴클레아제(pA-MN) 사이의 융합 단백질로 처리하였으며, 이는 칼슘 이온에 의해 활성화될 수 있다19. 그러나 ChIC는 서던 블롯 리드-아웃을 사용하여 개발되었으므로 게놈 전체 프로파일링에 대한 적용 가능성은 10년이 넘도록 불분명하게 남았다. 본 발명자들은 최근에 CUT&RUN(표적 하 절단 및 뉴클레아제를 사용한 방출: 도 24)20라고 명명한 ChIC 전략을 개발하였다. 개시된 프로토콜은 고정되지 않은 핵을 취해 이들을 콘카나발린 A 코팅된 자성 비드를 사용한 고체 지지체에 부착시켜 간단한 조작을 가능하게 하였다. 0℃에서 칼슘에 노출된 지 몇 초 후에 항체와 pA-MN이 표적 단백질에 특이적으로 원위치 결합한 후, TF의 양쪽에서 절단이 일어났다. 가교 결합되지 않은 핵이 사용되었기 때문에, 두 번의 절단으로 방출된 절단된 단편은 핵 밖으로 자유롭게 확산되므로, 온전한 핵을 간단히 펠렛화함으로써, 방출된 염색질 단편을 함유하는 상등액을 사용하여 서열 분석을 위한 DNA를 직접 추출하였다. 0℃에서 Ca2 + 의존적 분해 반응을 수행하는 것이 절단된 염색질 복합체의 확산을 제한하는데 필수적이며, 그렇지 않으면 접근 가능한 DNA를 절단 및 방출하는 것으로 밝혀졌다. 종합적으로, CUT&RUN은 가교 결합 ChIP-seq보다 훨씬 높은 신호 대 잡음 비를 가지고 있어 이전에 알려지지 않은 게놈 특징을 식별할 수 있다. CUT&RUN은 단지 1 천만 개의 서열 분석된 리드로 포유동물 TF의 염기쌍 분해능을 달성하였다.
단백질-DNA 상호 작용의 정량적 맵핑에 대한 필요성이 점차 명백해지고 있다21. 그러나 염색질의 게놈 전체 가용화 및 면역 침전을 수반하는 ChIP의 복잡성으로 인해, 항체 교차 반응성을 갖는 상이한 종으로부터의 고정된 수의 세포가 스파이크-인되는 관련된 정량화 전략이 필요하다22. 보존된 에피토프에 대한 요건은 일반적인 적용 가능성을 제한한다. 대조적으로, CUT&RUN의 고유한 단순성으로 인해, 결합 이벤트를 정확하게 정량화하는 데 이종 DNA를 이용한 간단한 스파이크-인 전략이면 충분하였다. 요약하면, CUT&RUN은 ChIP-seq에 비해 몇 가지 장점이 있다: (1) 이 방법은 가교 결합되지 않은 세포에서 원위치에서 수행되며 염색질 단편화 또는 가용화가 필요하지 않다. (2) 본질적으로 낮은 배경은 낮은 서열 깊이와 ChIP에 보이지 않는 낮은 신호 게놈 특징의 식별을 허용한다. (3) 간단한 절차는 하루 안에 완료될 수 있으며 로봇 자동화에 적합하다. (4) 이 방법은 기존 방법론에 비해 낮은 세포 수로 사용될 수 있다. (5) 단백질-DNA 상호 작용의 정확한 정량을 위해 간단한 스파이크-인 전략이 사용될 수 있다. 따라서 CUT&RUN은 생물학적 연구에서 가장 보편적인 방법 중 하나인 ChIPseq의 매력적인 대체법에 제시한다.
실험 설계
원위치 표적화 절단 및 염색질 복합체의 방출을 위한 CUT&RUN 방법은 간단하며 표준 실험실 장비를 사용하여 하루 안에 완료할 수 있다. 본원에서 프로토콜을 특정 상황에 맞게 조정하는데 사용할 수 있는 상세한 프로토콜 및 다양한 선택 사항을 제공한다. CUT&RUN의 강점 중 하나는 전체 반응이 원위치에서 수행되어 항체와 pA-MN이 핵으로 자유롭게 확산된다는 것이다. 원래 프로토콜은 세포의 저장성 용해 및 트리톤 X-100으로 세포 처리의 조합에 의해 제조된 핵을 사용하였다. 이는 다수의 세포주에서 성공적이었지만, 본 발명자들은 최근 비이온성 세제 디기토닌에 의해 투과화될 수 있는 세포를 사용하도록 프로토콜을 조정했으며, 이는 ChEC-seq23 및 ATAC-seq24를 포함한 다른 원위치 방법에서 성공적으로 사용되었다. 디기토닌은 막으로 분배되고 콜레스테롤을 추출한다. 콜레스테롤이 결여된 막은 디기토닌에 의해 최소한으로 영향을 받는다25 ,26. 핵 외피는 혈장 막에 비해 상대적으로 콜레스테롤이 없다. 이와 같이, 디기토닌으로 세포를 처리하는 것은 핵 완전성을 손상시키지 않으면서 세포를 투과화하는 강건한 방법에 해당한다26. 여기에 기술된 프로토콜은 디기토닌을 사용하지만 개별 실험 상황은 다른 방법으로 온전한 핵을 생성할 것을 요구할 수 있으며 그러한 핵은 적절한 방법으로 제조되어 콘카나발린 A 코팅된 비드에 결합된 후 단계 10에서 아래 프로토콜을 시작할 수 있다20. 본질적으로 배경이 낮고 낮은 세포 수를 처리할 수 있는 프로토콜의 한계 중 하나는 회수되는 DNA의 양이 매우 낮아 심지어 민감한 모세관 전기영동 또는 피코그린 분석(예를 들어, 애질런트(Agilent) 테이프스테이션 및 큐빗(Qubit))에 의한 분석에도 문제가 있다는 것이다. 또한, 최소 풋프린트를 절단하는 고해상도 맵핑 기술은 일반적으로 대략 50 bp PCR 앰플리콘을 설계하는 것이 불가능하기 때문에 알려진 결합 유전자 좌의 PCR 기반 분석에는 적합하지 않다. 이와 같이, 풍부한 에피토프를 표적화하는 양성 대조군 항체를 사용하는 것이 권장되며, 따라서 DNA가 쉽게 검출될 수 있다. H3K27me3에 대해 생성된 토끼 단클론 항체가 성공적으로 사용되었으며, 모세관 전기영동은 절단된 단편의 양이 출발 세포의 수에 비례한다는 것을 보여준다. 뉴클레오솜 사다리는 테이프스테이션 또는 기타 민감한 전기영동 분석 방법(도 25)에 의해 예상되며, 단클론 항체의 사용은 문제 해결을 복잡하게 할 수 있는 잠재적인 로트 간 변동을 피한다. CTCF와 같이 덜 풍부한 에피토프의 경우, 심지어 민감한 전기영동 분석을 통해서도 절단된 조각을 검출하기가 더 어렵다(도 26). H3K37me3과 같은 모세관 전기영동에 의해 양성 대조군에 대해 예상되는 분해된 DNA 패턴이 관찰되면, 이 샘플을 서열 분석할 필요는 없다. 음성 대조군으로서, 서열 편향 없이 낮은 효율로 염색질을 무작위로 코팅하는 비특이적 토끼 IgG 항체의 사용이 권장된다. 테더링이 없으면 pA-MN의 약간의 캐리 오버가 과도하게 접근 가능한 DNA의 우선적인 단편화를 야기할 가능성을 증가시키기 때문에, 항체 없는 대조군은 권장되지 않는다. 표적화된 절단은 Ca2 + 이온을 첨가한 후 수초 내에 발생하는 것으로 나타났으며, 입체적으로 조절되는 테더링 반응으로 인해 절단 패턴은 시간이 지남에 따라 일정하였다. 그러나 분해 시간이 길수록 신호 대 잡음 비의 명백한 변화없이 더 많은 재료가 방출된다(도 27). 따라서 에피토프 존재비 및 항체 농도에 따라 조정할 수 있는 출발점으로 30분 동안 분해하는 것이 권장된다. CUT&RUN 방법의 응용법은 모든 ChIP 기반 응용법을 대체할 잠재력을 갖는다. ChIP-seq가 현재 사용되는 전형적인 연구 프로젝트에 대해, CUT&RUN은 대부분의 분자 생물학 실험실에 이미 존재하는 표준 장비를 사용하여 벤치 탑에서 완전히 수행될 수 있으므로 CUT&RUN으로의 전환은 효율적으로 수행될 수 있다. 또한, CUT&RUN이 자성 비드, 코팅된 플레이트 또는 유리 슬라이드와 같은 고체 지지체에 쉽게 부착될 수 있는 투과화된 세포에서 원위치에서 수행되므로, 이 방법은 세포로부터 서열 분석 라이브러리로의 고처리량을 허용하는 로봇 공학으로 쉽게 이전될 것이다. CUT&RUN은 자동화하기 어려운 불용성 물질을 제거하기 위해 초음파 처리기와 같은 장비 또는 고속 회전 단계가 필요하지 않기 때문에 로봇 공학으로의 CUT&RUN은 ChIP-seq보다 더 간단할 것이다. 표준 가교 결합 ChIP 프로토콜은 형광 활성화 세포 분류 또는 절제 후 또는 임상 설정에서 종종 얻게 되는 낮은 세포 수에는 적합하지 않다. 이 한계에 비추어, ATAC-seq는 5000개의 세포까지 줄여 사용되었다24. 그러나 ATAC-seq는 염색질의 접근 가능한 영역에 있으며 히스톤 PTM에 의해 구분되는 염색질 상태를 구별할 수 없는 TF의 비특이적 식별로 제한된다. 가교 결합 ChIP에서 낮은 효율을 초래하는 에피토프 마스킹 문제는 천연 ChIP 전략을 사용하여 완화될 수 있으며, 이는 풍부한 뉴클레오솜 에피토프에 대해 5000개의 세포에 불과한 세포로 고품질의 데이터를 제공하는 것으로 나타났지만 TF에는 적용되지 않는다27. 여기서, CUT&RUN은 H3K27me3를 프로파일링하기 위해 100개의 세포 또는 CTCF 서열 특이적 DNA 결합 단백질을 위해 1000개의 세포에 적용하기에 적합한 것으로 보인다. 따라서, CUT&RUN은 드문 세포 유형에 대한 단백질-DNA 상호 작용의 표적화된 게놈 전체 맵을 가능하게 한다. 단일 세포 게놈 분석에서의 최근 진보는 단일 세포 조합 인덱싱("sci": single-cell combinatorial indexing)이며, 이에 의해 스플릿-풀 바코딩(split-pool barcoding)을 이용하여 개별 단리된 세포에 대해 반응을 수행할 필요 없이 다수의 온전한 개별 세포를 고유하게 표지한다. 이 접근법은 단일 세포에서 트랜스크립톰(transcriptome)28, 염색질 접근성(sci-ATAC-seq29), 및 3-D 상호 작용(sci-Hi-C30)을 프로파일링하는데 성공적으로 사용되었다. ChIP과 달리 CUT&RUN은 온전한 투과화된 세포 내에서 수행되므로 단일 세포 에피토프 특이적 후성 유전체 지형을 맵핑하기 위해 조합 바코드를 사용할 수 있다. 프로토콜의 추가 개발은 단백질 복합체 내에서 서브 유닛의 점유를 맵핑하기 위해 순차적인 ChIP의 대체법을 포함할 수 있다. 순차적인 ChIP-seq는 전형적으로 쉽지 않으며, 제2 면역 침전 단계 후 매우 낮은 수율로 인해, 이는 풍부한 염색질 복합체에만 적합하다. 그러나 먼저 CUT&RUN을 수행함으로써, 높은 효율로 상등액으로 유리된 절단된 염색질 복합체는 제2 항체로 면역 침전될 수 있다. 이 적용은 게놈 전체의 염색질 복합체의 조성 분석 및 맵핑을 허용한다. CUT&RUN이 원위치 절단 접근법이고 염색질 섬유의 고유한 유연성으로 인해 인접한 뉴클레오솜 및 3D 접촉을 포함하는 국소 염색질 구조를 탐지할 수 있다는 것이 밝혀졌다. 3D 핵 조직의 게놈 전체 맵핑에 널리 사용되고 기술인 Hi-C, ChIA-PET 및 Hi-ChIP는 단백질-단백질 상호 작용을 안정화시키기 위해 포름알데히드 가교 결합에 의존한다31 -33. 따라서, 이들 기술은 매우 큰 핵 구조가 가교 결합될 수 있기 때문에 양성 게놈 상호 작용을 맵핑하기 위한 공식적인 거리 제한이 없다. 대조적으로, TSA-seq34 및 게놈 아키텍쳐 맵핑(genome architecture mapping)35은 거리가 제한되며, 따라서 반응성 종의 제한된 확산 또는 세포의 냉동 절편에 의해 세포학적 거리를 측정한다. 유사하게, CUT&RUN에서, 단백질 A-MNase의 도달 범위는 이들 중 하나에 테더링하여 절단되기 위해 에피토프로부터 절단이 얼마나 멀리 발생할 수 있는지, 따라서 2개의 상호 작용하는 DNA 유전자 좌가 얼마나 근접해야 하는지에 대한 본질적인 한계를 제공한다. CUT&RUN을 근접성 기반 결찰 방법과 결합하면, 핵 아키텍처의 인자 특이적 고해상도 맵을 생성할 수 있다. 다른 신규 응용법이 구상될 수 있다. 항체가 이용 가능한 임의의 에피토프는 잠재적으로 CUT&RUN을 사용하는 프로파일링에 적용될 수 있고, IncRNA의 CUT&RUN 원위치 맵핑은 DRIP-seq36에 대한 관심 받는 대안이 될 것으로 보인다. 또한, CUT&RUN이 불용성 염색질을 프로파일링하는 능력20은 CUT&RUN을 염 분획법과 조합하면 후성 유전체 맵이 염색질 용해도에 기반하도록 허용할 것임을 나타내며, 이는 전통적으로 고전적인 "활성" 염색질을 정의하는데 사용되어 왔다37 -39. 이러한 방식으로, 프로파일링되는 각각의 DNA-결합 단백질 또는 염색질 특징은 그의 용해도, 주요 물리적 특성에 대한 정보로 풍부해질 수 있다. 염 분획법은 MNase 기반 ChIP-seq39와 함께 수행될 수 있지만39, 고염은 항체 결합 전에 복합체를 방해하고 에피토프의 손실을 유발할 수 있는 반면, CUT&RUN과 함께, 염 분획법은 항체가 결합되고 단편이 절단된 후에만 수행된다.
다른 방법과의 비교
표 1은 CUT&RUN 및 세 가지 ChIP-seq 방법인 X-ChIP-seq3, ChIP-exo4 및 NChIP-seq40에 대한 메트릭스(metrics)를 열거한다. 이러한 ChIP-seq 방법과 비교하여 CUT&RUN은 더 적은 수의 세포와 더 적은 리드를 필요로 하며 신호 대 잡음 비가 높으며 단편화 편향이 없으며 더 빠르며 정량을 위해 스파이크-인을 이용할 수 있다.
[표 1]
Figure pct00006
ChIP 기반 기술의 중요한 발전은 차세대 서열 분석을 활용하여 단백질-DNA 상호 작용의 염기쌍 분해능 게놈 전체 맵을 생성하는 것이다41. 초음파 처리를 사용하여 최소 ~ 200 bp 단편으로 염색질을 단편화하는 표준 가교 결합 ChIP와 달리, ChIP-exo에서 엑소 뉴클레아제 처리 또는 고해상도 X-ChIP-seq 또는 천연 ChIP 접근법에서 MNase 분해는 분해를 제한하거나 거의 제한한다4 ,5,20,40,42. 그러나 가교 결합 전략에서의 이러한 해상도의 개선은 종종 서열 깊이 요건 및 필요한 세포의 수의 증가의 대가이다. 예를 들어, ChIP-exo에서 인접 뉴클레오솜과 같이 단지 표적 단백질 이외의 것을 함유하는 임의의 초음파 처리된 단편은 최소한의 TF 풋프린트를 생성하는데 엑소-뉴클레아제에 대한 차단을 형성하여 명백한 국소화된 배경의 원인이 되고, 이는 고해상도 피크 쌍을 호출하기 위해 세포 수와 서열 분석 깊이의 증가를 필요로 한다. 천연 ChIP는 종종 이러한 관련 문제를 겪지 않지만 강력한 세제 없이 가용성 염색질 추출물을 생성해야 하기 때문에 일반적인 적용 가능성이 제한적이므로 안정적으로 결합된 단백질에 가장 적합하며 경우에 따라 최적화가 필요할 수 있다. 가교 결합 ChIP 방법에 사용되는 것과 같은 초음파 처리는 무작위가 아니므로 단편화 편향이 발생한다는 것을 이전에 보였다5 ,43. CUT&RUN은 단편화 없이 온전한 세포 또는 핵에서 수행되므로 모든 게놈 구획을 탐침하는데 사용할 수 있다. 게놈 전체 분해에 MNase를 사용하는 기술은 효소의 A/T 편향의 문제가 있으며44 우선적으로 개방 염색질을 분해한다. 대조적으로, CUT&RUN은 입체적으로 조절된 절단 반응을 수반하며, 본 발명자들은 검출 가능한 A/T 또는 DNA 접근성 편향의 문제가 없음을 보였다20.
ChIP의 경우와 마찬가지로, CUT&RUN의 성공은 주로 표적에 대한 항체의 친화성과 결합에 사용되는 조건하의 특이성에 좌우된다. 항체는 CUT&RUN을 사용하여 고체 상태에서 그의 에피토프에 결합하기 때문에, 면역 형광법(IF: immunofluorescence)에 의해 특이성에 대해 성공적으로 시험된 항체는 IF가 일반적으로 고정을 수반한다는 주의 사항과 함께 CUT&RUN과 함께 작동할 가능성이 높은 반면, 포름알데히드 고정은 CUT&RUN의 효율을 감소시킨다. 표준 CUT&RUN 프로토콜에서, 본 발명자들은 절단된 염색질 복합체가 핵 밖으로 확산되도록 하여 온전한 핵에 남아있는 분해되지 않은 게놈을 포함한 상등액 분획으로부터 절단 DNA를 간단하게 단리하도록 할 것을 권장한다. 그러나 염색질 복합체가 너무 커서 확산되지 않거나 단백질-단백질 상호 작용이 절단된 복합체를 보유할 수 있다. 이 경우 분해 후 총 DNA를 추출할 수 있다. 다량의 상자성 카르복실화 비드(예를 들어, 아젠코트 AMPure XP 비드)를 사용하여 매우 간단히 크기 선별을 수행하여~ 700 bp 미만의 단편이 선택될 것이다. 이 전략은 ~ 1 MDa 효모 RSC 복합체에 성공적이었다20.
재료
시약
* 세포 현탁액. 인간 K562 세포, 초파리 S2 세포를 사용하였고 뇌 및 성충반과 같은 초파리 조직을 절제하고, 효모를 스페로플라스트(spheroplast)하였다.
* 콘카나발린 코팅된 자성 비드(Bangs Laboratories, 카탈로그 번호 BP531)
* 관심의 에피토프에 대한 항체. 예를 들어, CUT&RUN에 의한 1D 및 3D 상호 작용을 맵핑하기 위한 토끼 α-CTCF 다클론 항체(Millipore 07-729)
* 풍부한 에피토프에 대한 양성 대조군 항체, 예를 들어 α-H3K27me3 토끼 단클론 항체(Cell Signaling Technology, 카탈로그 번호 9733)
* 에피토프가 없는 음성 대조군 항체, 예를 들어 기니피그 α-토끼 항체
* 5% 디기토닌(EMD Millipore, 카탈로그 번호 300410)
* 단백질 A 마이크로코커스의 뉴클레아제(pA-MNase) 융합 단백질. -20℃에서 보관한다.
* 스파이크-인 DNA(예를 들어, 사카로마이세스 세레비지에 마이크로코커스의 뉴클레아제 처리된 염색질, 요청시 저자가 제공)
* 증류, 탈이온 또는 RNAse 무함유 H2O(dH2O(예를 들어, Promega, 카탈로그 번호 P1197)
* 1 M 염화망간(MnCl2; Sigma-Aldrich, 카탈로그 번호 203734)
* 1 M 염화칼슘(CaCl2; Fisher, 카탈로그 번호 BP510)
* 1 M 염화칼륨(KCl; Sigma-Aldrich, 카탈로그 번호 P3911)
* 1 M 히드록시에틸 피페라진에탄술폰산 pH 7.5(HEPES(Na+); Sigma-Aldrich, 카탈로그 번호 H3375)
* 1 M 히드록시에틸 피페라진에탄술폰산 pH 7.9(HEPES(K+); Sigma-Aldrich, 카탈로그 번호 H3375)
* 5 M 염화나트륨(NaCl; Sigma-Aldrich, 카탈로그 번호 S5150-1L)
* 0.5 M 에틸렌디아민테트라아세트산(EDTA; Research Organics, 카탈로그 번호 3002E)
* 0.2 M 에틸렌 글리콜-비스(β-아미노에틸 에테르)-N,N,N',N'-테트라아세트산(EGTA; Sigma-Aldrich, 카탈로그 번호 E3889)
* 2 M 스페르미딘(Sigma-Aldrich, 카탈로그 번호 S2501)
* 로슈 컴플리트 프로테아제 억제제 EDTA 무함 정제(Sigma-Aldrich, 카탈로그 번호 5056489001)
* 2 mg/ml 글리코겐(Sigma-Aldrich, 카탈로그 번호 10930193001의 1:10 희석액)
* RNase A: DNase 및 프로테아제 무함유(10 mg/ml; Thermo Fisher Scientific, 카탈로그 번호 EN0531)
* 겔 및 PCR 클린 업 키트(Clean-up kit)(Macherey-Nagel NucleoSpinR, 카탈로그 번호 740609.250)
* 아젠코트 AMPure XP 자성 비드(Beckman Coulter, 카탈로그 번호 A63880)
* 10% 소듐 도데실 술페이트(SDS; Sigma-Aldrich, 카탈로그 번호 L4509)
* 프로테이나아제 K(Thermo Fisher Scientific, 카탈로그 번호 EO0492)
* 페놀-클로로포름-이소아밀 알코올 25:24:1(PCI; Invitrogen, 카탈로그 번호 15593049)
* 클로로포름(Sigma, 카탈로그 번호 366919-1L)
* 1 M 트리스-HCl pH 8.0
* 에탄올(Decon Labs, 카탈로그 번호 2716)
* 큐빗 dsDNA HS 키트(Life Technologies, 카탈로그 번호 Q32851)
시약 셋업
5% 디기토닌: 실험을 위해 충분한 디기토닌을 재구성하기 위해, 분말을 2 ml 마이크로 원심분리 튜브에 칭량하고, 마이크로웨이브 오븐에서 작은 비이커에 끓인 물을 피펫으로 넣다 뺐다 하여 1000 ㎕ 피펫 팁을 데웠다. 온수를 디기토닌 분말이 있는 튜브에 피펫팅하여 5%(w/v)로 만들고, 뚜껑을 닫고 디기토닌이 완전히 용해될 때까지 빠르게 최대로 볼텍싱하였다. 이 저장액을 냉장하면 일주일 이내에 사용할 수 있지만 디기토닌이 천천히 침전되므로 재가열이 필요하다. 디기토닌의 효과는 배치마다 다르므로 세포 유형에 사용할 농도를 결정하기 위해 트립판 블루의 투과성을 테스트하는 것을 권장한다. 0.02~0.1% 디기토닌으로 K562 세포에 대해 우수한 결과를 얻었다.
디기토닌은 독성이 있으며 분말을 계량할 때 특히 주의해야 한다. 디기토닌 저장액은 디메틸술폭시드(DMSO)에 용해시켜 제조할 수 있지만, DMSO는 피부를 통해 흡수될 수 있음을 알아야 한다.
결합 완충액: 400 ㎕ 1M HEPES-KOH pH 7.9, 200 ㎕ 1M KCl, 20 ㎕ 1M CaCl2 및 20 ㎕ 1M MnCl2를 혼합하고 dH2O로 최종 부피를 20 ml로 만든다. 완충액을 4℃에서 6개월 동안 보관한다.
콘카나발린 A 코팅된 비드: 각 최종 샘플 및/또는 분해 시점에 대해 10 ㎕가되도록 슬러리의 충분한 양을 부드럽게 재현탁하고 회수한다. 2 ml 튜브 내 1.5 ml 결합 완충액으로 옮긴다. 튜브를 마그넷 스탠드에 두어 투명해지도록 한다(30초 내지 2분). 액체를 회수하고 마그넷 스탠드에서 꺼낸다. 1.5 ml 결합 완충액을 넣고 뒤집거나 부드러운 피펫팅으로 혼합하고 마이크로 원심분리기에서 빠른 펄스로 뚜껑과 측면에서 액체를 제거한다. 비드 슬러리의 부피(최종 샘플당 10 ㎕)와 동일한 부피의 결합 완충액에 재현탁한다. 세척 완충액: 1 ml 1 M HEPES pH 7.5, 1.5 ml 5 M NaCl, 12.5 ㎕ 2 M 스페르미딘을 혼합하고, dH2O를 사용하여 최종 부피를 50 ml로 만들고, 1 로슈 컴플리트 프로테아제 억제제 EDTA 무함유 정제를 첨가한다. 완충액을 4℃에서 최대 1주일 동안 보관한다. Dig 세척 완충액: 160~800 ㎕ 5% 디기토닌을 40 ml 세척 완충액과 혼합한다. 디기토닌의 효과는 배치마다 다르므로 사용 농도를 결정하기 위해 트립판 블루의 투과성을 테스트하는 것을 권장한다. 0.02~0.1% 디기토닌으로 K562 세포에 대해 우수한 결과를 얻었다. 완충액을 4℃에서 최대 1일 동안 보관한다.
항체 완충액: 8 ㎕ 0.5 M EDTA를 2 ml Dig 세척 완충액과 혼합하고 얼음에 둔다. 각 항체의 분취액으로 나누고 항체 용액 또는 혈청을 최종 농도 1:100 또는 제조사가 권장하는 면역 형광 농도로 첨가한다. 2XSTOP: 4.2 ml dH2O에 340 ㎕ 5M NaCl, 200 ㎕ 0.5M EDTA, 100 ㎕ 0.2M EGTA, 20 ㎕ 5% 디기토닌, 25 ㎕ RNase A, 125 ㎕ 2 mg/ml 글리코겐 및 2 pg/ml 이종 스파이크-인 DNA를 첨가한다. 완충액을 4℃에서 최대 1주일 동안 보관한다.
캘리브레이션을 위한 이종 스파이크-인 DNA는 대략 200 bp 평균 크기로 단편화되어야 한다(예를 들어, 모노뉴클레오솜 크기의 단편의 MNase 처리된 샘플). 본 발명자들은 맵핑된 총 리드 수를 정규화 인자로만 사용하므로 스파이크-인 DNA가 거의 필요하지 않다. 예를 들어, 1.5 pg를 첨가하면 1~1000만 개의 맵핑된 실험 리드에 대해 1,000 ~ 10,000개의 맵핑된 스파이크-인 리드가 생긴다(반비례).
절차
세포를 비드에 결합시키기
* 시간 30분
항체를 첨가하기 전의 모든 단계는 세포에 대한 스트레스를 최소화하기 위해 실온에서 수행한다. 프로토콜 전반에 걸쳐 DNA 파손을 최소화하는 것이 중요하므로, 재현탁 및 격렬한 볼텍싱 중에 공동 현상을 피할 것을 권장한다.
1) 실온에서 신선한 배양물(들)을 수거하고 세포를 계수한다. 동일한 프로토콜을 샘플 및/또는 분해 시점당 100 내지 250,000개의 포유동물 세포에 사용할 수 있다.
* 일시 정지 시점: 필요한 경우 Mr. Frosty 이소프로필 알코올 챔버를 사용하여 10% DMSO에서 세포를 동결 보존할 수 있다. 급속 동결은 권장되지 않는데, 배경 DNA를 손상시켜 최종 데이터 품질에 영향을 줄 수 있기 때문이다.
2) 실온에서 600 x g 3분 원심분리하고 액체를 회수한다.
3) 1.5 ml의 실온 세척 완충액에 부드럽게 피펫팅하여 재현탁하고 필요한 경우 2 ml 튜브로 옮긴다.
4) 실온에서 600 x g 3분 원심분리하고 액체를 회수한다.
5) 단계 3 및 단계 4를 반복한다.
6) 1 ml의 실온 세척 완충액에 부드럽게 피펫팅하여 재현탁한다.
7) 실온에서 세포를 부드럽게 볼텍싱하면서 비드 슬러리를 첨가한다.
8) 실온에서 5-10분 회전시킨다.
9) 사용되는 각 항체에 하나씩, 1.5 ml 튜브에 분취액으로 나눈다.
라이브러리 제조를 필요로 하지 않으면서 절차의 성공을 평가하려면 양성 대조군 항체(예를 들어, α-H3K27me3)와 음성 대조군 항체(예를 들어, α- 토끼)를 동시에 포함한다. 테더링의 부재로 인해 결합되지 않은 임의의 pA-MN이 "시한폭탄"으로 작용하고 접근 가능한 DNA를 분해하여 결과적으로 DNA 접근 가능한 부위의 배경이 될 수 있으므로 항체 없는 대조군을 포함하지 않는다.
(1차) 항체를 결합시키기
* 시간 15분 내지 하룻밤, 인큐베이션이 길수록 더 높은 수율 제공
10) 마그넷 스탠드에 두어 액체를 투명하게 하여 빼낸다.
* 정확한 용액 전달을 위해서는 저잔류(low-retention) 피펫 팁이 선호되지만, 디캔팅하는 동안 비드 손실을 피하기 위해 종래(낮은 결합이 아닌) 마이크로 원심분리 튜브만 사용한다.
11) 낮게(대략 1100 rpm) 설정된 볼텍싱 믹서에 각 튜브를 낮은 각도로 놓고 부드럽게 볼텍싱하면서 50 ㎕의 항체 완충액(샘플 및/또는 분해 시점당)을 측면을 따라 분출하여 용액이 비드의 대부분 또는 전부를 제거하도록 한다. 톡톡 두드려 남은 비드를 제거한다.
항체 처리 중에 EDTA의 존재는 ConA를 활성화시키기 위해 사용되는 과량의 2가 양이온을 제거하는데, 이는 비드로부터 Ca++의 캐리 오버가 pA-MN의 첨가 후 가닥 절단을 조기에 개시할 수 있기 때문이다. 세포가 투과화될 때 2가 양이온의 킬레이트화는 대사 과정을 신속하게 중단시키고 내인성 DNAse 활성을 방지하는 역할을 한다. pA-MN 첨가 전에 EDTA를 세척하면 효소의 불활성화를 방지한다. 세척 완충액 중의 스페르미딘은 Mg++의 제거를 보상하기 위한 것이며, 그렇지 않을 경우 염색질 특성에 영향을 줄 수 있다.
12) 4℃에서 대략 2시간 동안, 또는 실온에서 5~10분 동안 튜브 회전 장치에 놓는다.
* 일시 정지 시점 항체 인큐베이션은 4℃에서 하룻밤 진행될 수 있다.
13) 마이크로 원심분리기에서 빠른 펄스로 뚜껑과 측면에서 액체를 제거한다.
14) 마그넷 스탠드에 두어 액체를 투명하게 하고(대략 30 초) 모든 액체를 빼낸다.
15) 1 ml의 Dig 세척 완충액을 첨가하고, 뒤집기에 의해, 또는 덩어리가 계속되면 1 ml의 팁을 사용하여 부드러운 피펫팅에 의해 혼합하고, 마이크로 원심분리기에서 빠른 펄스로 뚜껑과 측면에서 액체를 제거한다. 2차 항체를 결합시킨다(필요한 경우)
* 시간 15분 ~ 1.5시간
1차 항체에 대한 단백질 A의 결합 효율은 숙주 종 및 IgG 아이소형에 의존한다. 예를 들어, 단백질 A는 토끼 및 기니피그 IgG에는 잘 결합하지만 마우스 및 염소 IgG에는 잘 결합하지 않으므로 이러한 후자의 항체의 경우 토끼 α- 마우스와 같은 2차 항체가 권장된다.
16) 마그넷 스탠드에 두어 모든 액체를 투명하게 하여 빼낸다.
17) 낮게(대략 1100 rpm) 설정된 볼텍싱 믹서에 각 튜브를 낮은 각도로 놓고 부드럽게 볼텍싱하면서 50 ㎕의 Dig 세척 완충액(샘플 및/또는 분해 시점당)을 측면을 따라 분출하여 용액이 비드의 대부분 또는 전부를 제거하도록 한다. 톡톡 두드려 남은 비드를 제거한다.
18) 2차 항체를 1:100의 최종 농도 또는 면역 형광에 대해 제조업체가 권장하는 농도로 혼합한다.
19) 4℃에서 약 1시간 동안, 또는 실온에서 5~10분 동안 튜브 회전 장치에 놓는다.
20) 마이크로 원심분리기에서 빠른 펄스로 뚜껑과 측면에서 액체를 제거한다.
21) 마그넷 스탠드에 두어 모든 액체를 투명하게 하고 빼낸다.
22) 1 ml의 Dig 세척 완충액을 첨가하고, 뒤집기에 의해, 또는 덩어리가 계속되면 1 ml의 팁을 사용하여 부드러운 피펫팅에 의해 혼합하고, 마이크로 원심분리기에서 빠른 펄스로 뚜껑과 측면에서 액체를 제거한다.
단백질 A-MNase 융합 단백질을 결합시키기
* 시간 15분 ~ 1.5시간
23) 마그넷 스탠드에 두어 모든 액체를 투명하게 하고 빼낸다.
24) 낮게(대략 1100 rpm) 설정된 볼텍싱 믹서에 각 튜브를 낮은 각도로 놓고 부드럽게 볼텍싱하면서 50 ㎕의 Dig 세척 완충액(샘플 및/또는 분해 시점당)을 측면을 따라 분출하여 용액이 비드의 대부분 또는 전부를 제거하도록 한다. 톡톡 두드려 남은 비드를 제거한다.
25) pA-MNase에 대략 700 ng/ml의 최종 농도로 혼합한다(예를 들어, 2.5 ㎕/요청시 제공된 140 ㎍/ml 글리세롤 저장액의 1:10 희석액의 50 ㎕).
26) 4℃에서 약 1시간 동안, 또는 실온에서 5~10분 동안 튜브 회전 장치에 놓는다.
27) 마이크로 원심분리기에서 빠른 펄스로 뚜껑과 측면에서 액체를 제거한다.
28) 마그넷 스탠드에 두어 모든 액체를 투명하게 하고 빼낸다.
29) 1 ml의 Dig 세척 완충액을 첨가하고, 뒤집기에 의해, 또는 덩어리가 계속되면 부드러운 피펫팅에 의해 혼합하고, 마이크로 원심분리기에서 빠른 펄스로 뚜껑과 측면에서 액체를 제거한다.
30) Dig 세척 단계 28~29를 반복한다.
표적화된 분해
* 시간 45분
31) 마그넷 스탠드에 두어 모든 액체를 투명하게 하고 빼낸다.
32) 낮게(대략 1100 rpm) 설정된 볼텍싱 믹서에 각 튜브를 낮은 각도로 놓고 부드럽게 볼텍싱하면서 100 ㎕의 Dig 세척 완충액(샘플 및/또는 분해 시점당)을 측면을 따라 첨가하여 용액이 비드의 대부분 또는 전부를 제거하도록 한다. 톡톡 두드려 남은 비드를 제거한다.
33) 습한 얼음에 놓인 히터 블록의 1.5 ml 웰에 튜브를 삽입하여 0℃로 냉각시킨다.
34) 블록에서 각 튜브를 꺼내 부드러운 볼텍싱으로 2 ㎕ 100 mM CaCl2(1 M 저장액으로부터 1:10으로 희석)에서 혼합한 후 즉시 튜브를 0℃ 블록에서 다시 놓는다.
35) 원하는 분해 시간 동안 0℃에서 인큐베이션한다(기본 30분).
MNase는 DNA에 결합하지만 Ca++가 존재하는 경우에만 절단하므로 분해는 게놈의 접근 가능한 영역을 분해할 수 있는 방출된 pA-MNase 결합 입자의 후속 확산보다 온도에 덜 의존적인 것으로 보이는 0차 반응이다. 확산으로 인한 배경 절단을 최소화하면서 대부분의 세포 집단에서 입자의 절단 및 방출은 0℃에서 얻을 수 있다. 본 발명자들은 주변 온도 이상에서 분해는 허용할 수 없는 배경 절단 수준을 초래한다는 것을 발견하였다.
36) 100 ㎕ 2XSTOP을 첨가하고 부드럽게 볼텍싱하여 혼합한다. 여러 시점이 있는 경우 100 ㎕를 100 ㎕ 2XSTOP에 꺼내어 부드럽게 볼텍싱하여 혼합한다.
예를 들어 처리 또는 분해 시점을 비교하기 위해 DNA 양을 캘리브레이션하기 위한 이종 스파이크-인 DNA는 2XSTOP에 존재해야 한다. 이는 CUT&RUN에 특히 중요한데, 샘플의 정규화를 위한 배경 절단이 너무 적기 때문이다.
표적 염색질 방출
* 시간 20분
37) 37℃에서 10분 인큐베이션하여 불용성 핵 염색질로부터 CUT&RUN 단편을 방출한다.
38) 4℃에서 16,000 x g로 5분 원심분리하고 마그넷 스탠드에 둔다.
선택 사항 A: 스핀 칼럼에 의한 빠른 DNA 추출
* 시간 20분
39) 스핀 칼럼을 수집 튜브에 넣고 400 ㎕ 완충액 NT1(뉴클레오스핀(NucleoSpin) 키트 또는 동급 제품)을 첨가한다.
40) 펠렛에서 상등액을 깨끗이 디캔팅하고 스핀 칼럼 내 NT1로 옮기고 부드럽게 위아래 피펫팅하여 혼합한다.
41) 11,000 x g에서 30초 동안 원심분리한다. 통과액을 버린다.
42) 700 ㎕ 완충액 NT3을 첨가한다. 11,000 x g에서 30초 원심분리한다. 통과액을 버린다.
43) 700 ㎕ 완충액 NT3을 첨가한다. 11,000 x g에서 30초 원심분리한다. 통과액을 버리고 로터에 다시 놓는다.
44) 11,000 x g에서 1분 동안 원심분리한다. 5분 동안 건조한다.
45) 새 튜브에 넣고 20~40 ㎕ 완충액 NE를 막에 첨가하고 로터에 다시 놓는다.
46) 1분 후 11,000 x g에서 1분 동안 원심분리한다.
선택 사항 B: 대안적인 DNA 추출(≤80 bp 단편의 정량적 회수에 바람직함)
* 시간 1.5시간
47) 펠렛에서 상등액을 깨끗이 디캔팅하고 새로운 1.5 ml 마이크로 원심분리 튜브로 옮긴다.
48) 각 샘플에 2 ㎕ 10% SDS(0.1%가 되도록) 및 2.5 ㎕ 프로테이나아제 K(20 mg/ml)를 첨가한다. 뒤집어서 혼합하고 70℃에서 10분 인큐베이션한다.
49) 300 ㎕ PCI를 추가하고 ~ 2초 전속 볼벡싱에 의해 혼합한다.
50) 상 잠금 튜브로 옮기고 실온에서 16,000 x g로 5분 동안 원심분리한다.
51) 300 ㎕ 클로로포름을 첨가하고 대략 10x 뒤집어 혼합한다.
52) 피펫팅하여 액체를 2 ㎕ 2 mg/ml 글리코겐을 함유한 새로운 튜브로 꺼낸다.
53) 750 ㎕ 100% 에탄올을 첨가하고 볼텍싱 또는 튜브 뒤집기에 의해 혼합한다.
54) 얼음에서 냉각시키고 4℃ 16,000 x g에서 10분 동안 원심분리한다.
55) 액체를 따르고 종이 타월 위에서 흘러나오게 한다.
56) 펠렛을 1 ml 100% 에탄올에서 헹구고 4℃ 16,000 x g에서 1분 동안 원심분리한다.
57) 액체를 조심스럽게 따르고 종이 타월 위에 흘러나오게 한다. 공기 건조한다.
58) 펠렛이 건조되면 25~50 ㎕ 1 mM 트리스-HCl pH8 0.1 mM EDTA에 용해시킨다.
라이브러리 제조 및 서열 분석
* 시간 2~4일
59) 선택 사항: 예를 들어 큐빗 기기로 형광 검출을 사용하여 1~2 ㎕를 정량한다.
60) 선택 사항: 예를 들어 테이프스테이션 기기를 사용하여 형광 검출을 이용한 모세관 전기영동에 의해 절단된 단편의 존재 및 크기 분포를 평가한다.
분해되지 않은 일부 긴 DNA가 누출될 것이며, 이것이 전형적인 전사 인자의 CUT&RUN에 대한 Qubit 형광에서 가장 두드러질 것이 된다. 이들의 경우, 회수된 표적화된 DNA는 겔 분석 또는 심지어 테이프스테이션에 의해 검출되기에는 양이 너무 적고 크기가 너무 작다. 이러한 경우 테이프스테이션 또는 바이오애널라이저(Bioanalyzer) 분석으로 정량화하기 위해 PCR 증폭 라이브러리를 만들어야만 할 수도 있다.
61) 제조사의 지침에 따라 단일 튜브 프로토콜을 사용하여 Tru-Seq 어댑터로 일루미나 서열 분석을 위한 바코드 라이브러리를 제조한다. 빠른 PCR 사이클은 폴리머라제가 완성하기에는 너무 긴 큰 DNA 단편의 선형 증폭보다 원하는 CUT&RUN 단편의 지수적 증폭을 선호한다.
큰 DNA 단편의 기여를 최소화하려면 PCR 사이클은, 바람직하게는 60℃ 10초 결합된 어닐링/신장 단계를 이용한, 12~14 사이클 이상이어야 한다. Hyper-prep 키트(KAPA Biosystems)로 우수한 결과를 얻었다.
62) 큐빗과 같은 dsDNA 특이적 분석을 사용하여 라이브러리 수율을 정량화한다.
63) 애질런트 4200 테이프스테이션 분석을 통해 라이브러리의 크기 분포를 결정한다.
64) 제조사의 지시에 따라 바코드 라이브러리에서 페어드-엔드 일루미나 서열 분석을 수행한다.
CUT&RUN의 배경이 매우 낮기 때문에, 일반적으로 5백 만개의 페어드-엔드 리드는 전사 인자 또는 뉴클레오솜 변형, 심지어 인간 게놈에도 충분하다. 경제성을 극대화하기 위해, 본 발명자들은 2-레인 유동 세포에서 레인당 최대 24개의 바코드 샘플을 혼합하고, 페어드-엔드 25x25 bp 서열 분석을 수행한다. CUT&RUN에는 단일 말단 서열 분석이 권장되지 않는데, 전사 인자와 인접 뉴클레오솜 사이의 분해능과 구별이 희생되기 때문이다.
데이터 처리 및 분석
* 시간 1일(가변)
65) Bowtie2 버전 2.2.5를 사용하여 페어드-엔드 리드를 다음 선택 사항을 이용하여 정렬한다: -local -very sensitive-local --no-unal --no-mixed --no-discordant --phred33 -I 10 -X 700. 스파이크-인 단편을 맵핑하기 위해, --no-overlap --no-dovetail 선택 사항을 또한 사용하여 실험 게놈의 스파이크-인 DNA와 교차 맵핑을 방지한다.
서열 분석된 단편을 ≤120 bp 및 ≥150 bp 크기 부류로 분리하면 DNA-결합 단백질의 국소 부근의 맵핑을 제공할 수 있지만, 이것은 테더링된 MNase에 의한 DNA에 입체적 접근에 따라 달라질 수 있다. CUT&RUN에는 단일 말단 서열 분석이 권장되지 않는데, 전사 인자와 인접 뉴클레오솜 사이의 분해능과 구별을 희생시켜야 하기 때문이다.
66) 월드 와이드 웹에서 도메인 이름 github.com/peteskene로부터 이용 가능한 스크립트는 처리, 스파이크-인 캘리브레이션, 및 분석 CUT&RUN 데이터에 맞게 사용자 정의된다.
결과
인간 K562 세포를 37℃에서 배양하고, 계수하고, 저속 원심분리에 의해 1 x 106 세포/ml로 수거하고, 세척 완충액에 2회 현탁하고 펠렛화한 후, 300 ㎕ 부피의 세척 완충액으로 희석하고 혼합하여 50 내지 6,000개 세포 사이의 배가 시리즈를 달성하였다. Ca2 +- 및 Mn2 +-세척된 ConA 코팅된 자성 비드 슬러리 10 ㎕를 결합 완충액 중에서 각 세포 현탁액에 부드럽게 볼텍싱하면서 첨가하였다. 10분 후, 세포를 마그넷 스탠드에서 수집하고, 디캔팅하고, 항-H3K27me3(1:100, CST #9733), 2 mM EDTA 및 0.05% 디기토닌을 함유하는 50 ㎕ 항체 완충액에 재현탁하고 4℃에서 15시간 동안 인큐베이션하였다. 마그넷 스탠드에서 비드를 수집하고 1 ml의 차가운 Dig 세척액에서 1회 세척한 후, 세포를 Dig 세척액 중 100 ㎕ pA-MN(1:500 360 ㎍/ml)에 재현탁하고 4℃에서 1시간 동안 인큐베이션하였다. 비드를 마그넷 스탠드에서 수집하고, 1 ml의 Dig 세척액에서 2회 세척하고, 150 ㎕의 Dig 세척액에 재현탁하고 0℃로 냉각시켰다. 3 ㎕ 100 mM CaCl2를 첨가하고, 30분 동안 0℃ 인큐베이션을 계속하였다. 반응을 1 vol 2XSTOP으로 종결하고, 37℃에서 20분 동안 인큐베이션하고, 4℃ 16,000 xg에서 5초 동안 원심분리하였다. 상등액 및 펠렛 모두 단계 47~58에 따라 추출하였다. 펠릿으로부터의 DNA를 큐빗 형광에 의해 정량화하였다. 선택된 상등액 분획으로부터의 DNA를 테이프스테이션 분석에 의해 분석하고(도 26) 일루미나 PE25x25 서열 분석에 적용하였다. 전형적인 ChIP-seq 실험은 높은 출발 세포 수를 사용하여 결과적으로 면역 침전된 다수의 고유한 초음파 처리된 단편을 생성한다. 대조적으로, CUT&RUN은 낮은 세포 수를 허용하고 상대적으로 낮은 배경을 가지므로 고유 한 단편의 수는 일반적인 서열 깊이보다 적다. 따라서, 낮은 세포 수 실험으로부터 높은 서열 분석 깊이는 PCR 복제물의 중복 서열 분석을 초래할 수 있다. 추정된 PCR 복제물을 제거하고 맵핑된 단편을 교체 없이 무작위로 샘플링하여 샘플당 750만 개의 고유한 리드를 생성하여 누적 리드로부터 정규화된 카운트로 표시하였다(도 28). 비교를 위해, K562 세포에서 H3K27me3에 대한 ENCODE 데이터세트로부터 750만 개의 고유한 리드의 샘플을 샘플링하였다. 세포 수를 100개로 감소시켜 데이터 품질 손실이 거의 발생하지 않았음이 명백하다. 대조적으로, 동일한 깊이에서 샘플링된 ENCODE 프로파일은 ChIP에 고유한 높은 배경으로 인해 흐릿한 프로파일을 보여준다. 항-CTCF 항체(1:100, Millipore 07-729)를 사용한 CUT&RUN을 유사하게 수행하여 1000개 세포까지의 데이터 품질에 손실이 거의 없는 프로파일을 생성하였다(도 29). 스핀-칼럼 추출(단계 39~46)은 간단하고 빠르며 뉴클레오솜 범위에서 단편을 효과적으로 회수하는 동시에 라이브러리 제조를 방해할 수 있는 매우 큰 단편의 농도를 감소시킨다(도 30). 따라서, 이 DNA 추출 선택 사항은 대부분의 CUT&RUN 응용 분야에 선호된다. 그러나 낮은 세포 수에서 TF의 CUT&RUN의 경우, 작은 단편의 보다 우수한 회수를 위해 유기 추출(단계 47~58)이 바람직하다.
실시예 2에 대한 참고 문헌(이들 각각은 그 전문이 참고로 포함됨)
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
실시예 3
순차적 ChIP에 대한 고효율 대안으로서 CUT&RUN. ChIP
염색질 인자는 DNA에 결합하기 위해 복합체를 형성하지만, 공동 점유를 식별하는 현재의 방법은 순차적 ChIP의 비효율성에 의해 심각하게 제한된다. 순차적 ChIP는 제2 ChIP 풀다운에 대한 입력으로서 제1 가교 결합 ChIP 반응 후 회수된 염색질 면역 침전물을 사용하여 수행된다. 그러나 가교 결합 ChIP의 비효율성으로 인해, 제2 ChIP 이후에 회수되는 물질의 양은 매우 적을 수 있고, 전형적으로 순차적 ChIP를 PCR에 제한하고, 게놈 전체 적용을 위해 순차적 ChIP-seq를 허용하는 경우는 거의 없다. 예를 들어, [6]에서 본 발명자들은 인간 키네토코어 복합체에서 순차적 ChIP-seq를 성공적으로 수행했지만, 단지 복합체가 동원체에서 수천 개의 복제본으로 존재하는 직렬의 반복적인 α-부수체 서열에 존재하기 때문이다. 그러나 CUT&RUN이 ChIP보다 훨씬 효율적이므로 본 발명자들은 CUT&RUN 상등액을 ChIP의 입력으로 사용할 수 있다고 추론하였다. 본 발명자들은 고효율의 CUT&RUN을 사용하여 염색질 입자를 방출하고, 두 번째 염색질 성분에 이 재료를 사용한 ChIP가 무시할만한 배경으로 훨씬 더 효율적이라는 것을 확인한다.
CUT&RUN.ChIP를 테스트하기 위해, FLAG 태그된 히스톤에 CUT&RUN을 적용한 후 FLAG 펩티드를 사용하여 상등액에 존재하는 입자로부터의 pA-MN 결합된 항체와 경쟁한 후 CUT&RUN 상등액의 천연 ChIP에 대한 다른 히스톤 마크에 두 번째 항체를 첨가하였다(도 31A). 대표적인 뉴클레오솜 지형은 모든 뉴클레오솜에 대한 마커인 H2B에 비해 히스톤 변이체 H2A가 H4 아세틸화 및 H3K4 트리메틸화가 풍부하지만, ChIP[7, 8]를 사용하여 이러한 변형을 맵핑하는 이전 연구와 일치하는 프로모터 근위 뉴클레오솜에 대한 H3K36 트리메틸화(도 31B)가 고갈됨을 보여준다. 단일 ChIP 연구는 이미 프로모터 근위 뉴클레오솜에 이러한 변형이 풍부하거나 고갈되었다는 것을 확립했지만, 그들은 동일한 뉴클레오솜에 있는 정도를 확립하지 않았다. 이 CUT&RUN.ChIP 절차는 예를 들어 포유동물 세포에서 발달 조절되는 유전자에서 전사 준비가 된 메커니즘을 다루기 위해 프로모터에서 2가 염색질 상태를 정의하는데 사용될 수 있다[9].
실시예 4
CUT&RUN 단백질 식별.
CUT&RUN.ChIP는 DNA-단백질 복합체의 단백질 성분이 사전에 알려져 있고 항체를 이용할 수 있을 때만 단백질 성분을 식별할 수 있지만, 복합체에서 미지의 성분을 식별하기 위해서는 다른 전략이 필요하다. ChIP의 낮은 효율로 인해, 단백질 식별을 수행하기에 충분한 면역 침전물을 수득하기는 어렵지만, CUT&RUN 상등액으로의 높은 입자 방출 효율은 하류 단백체 분석에 충분한 물질을 제공한다. 그러나 본 발명자들은 방출된 입자가 CUT&RUN 상등액으로 방출된 총 물질의 일부만을 포함한다는 것을 발견하였으므로 하류 프로테옴 분석을 위해 pA-MN/항체 결합 복합체를 정제하는데 사용될 수 있는 6-His 태그를 가진 단백질 A-MNase 형태를 설계하고 생산하였다(도 32A). 절차는 CUT&RUN 상등액으로 방출된 입자를 니켈-아가로스(예를 들어, 퀴아젠(Qiagen) 및 기타 판매사로부터 이용 가능한 Ni-NTA 아가로스)와 같은 친화성 매트릭스에 결합시키는 것이다. 제조사의 권장 사항에 따라 세척 및 용리 후, 복합체의 단백질 성분의 은 염색된 SDS-PAGE 분석 및 액체 크로마토그래피-질량 분석을 위해 충분한 양의 순수한 복합체를 얻어야 한다(도 32B).
실시예 4에 대한 참고 문헌(이들 각각은 그 전문이 참고로 포함됨)
Figure pct00011
Figure pct00012
실시예 5
줄기세포 유사 PRC2 활성과 활성화된 발생 프로그램의 공존은 미만성 뇌간 신경교종(Diffuse Midline Glioma ) 염색질 지형을 정의한다.
도입
미만성 뇌간 신경 교종은 <5%의 5년 전체 생존율을 갖는 치명적인 소아 CNS 종양이다(Mackay et al. 2017). 이들 종양의 대략 80%가 히스톤 H3.1 또는 H3.3을 코딩하는 유전자에서 돌연변이를 가지며, 그 중 가장 두드러지는 것은 리신 27에서 메티오닌으로 "온코히스톤" 돌연변이(H3K27M)이다(Schwartzentruber et al. 2012; Wu et al. 2012). 세포 내 총 H3의 대략 5~15%를 포함하는 돌연변이체 히스톤 H3에도 불구하고, 이들 종양은 폴리콤 억제 복합체 2(PRC2: Polycomb Repressive Complex 2) 메틸트랜스퍼라제 EZH2에 의해 촉매되고 전사적으로 침묵의 염색질과 연관된 H3 꼬리 변형인 리신 27 트리메틸화(H3K27me3)를 낮은 수준으로 갖는다(Chan et al. 2013; Lewis et al. 2013). H3K27M 꼬리가 EZH2 활성 부위에 결합하고 그것의 촉매 활성을 억제한다는 것을 입증하는 시험관 내 연구(Bender et al. 2013; Lewis et al. 2013; Justin et al. 2016), 전체적으로 PRC2 지형을 다시 프로그래밍할 수 있다는 H3K27M의 이소성 발현 연구(Bender et al. 2013; Chan et al. 2013), 및 DMG 환자 샘플에서 낮은 총 H3K27me3의 발견(Chan et al. 2013; Lewis et al. 2013)은 H3K27M에 의한 EZH2 활성의 전체적 억제가 신경 교종을 유발한다(Morgan and Shilatifard 2013; Weinberg et al. 2017)는 것을 사실로 가정하는 모델로 이어졌다.
더 최근의 결과는 이 모델에 문제를 제기하였다. 첫째, 재구성된 뉴클레오솜 모델에서, PRC2는 야생형 뉴클레오솜과 유사한 친화도로 H3K27M 함유 뉴클레오솜에 결합하였으며, 이는 H3K27M에 대한 높은 친화도를 갖는 EZH2와 일치하지 않는다(Wang et al. 2017). 둘째, 1,000명의 환자 샘플에 대한 대규모 게놈 분석은 전체 PRC 억제제를 표현모사하는 EZH2 변이를 확인하지 못했다(Mackay et al. 2017). 마지막으로, 최근 DMG에서의 ChIP- Seq 분석은 놀라운 잔류 H3K27me3 도메인을 보여 주었으며, 그 중 일부는 히스톤 야생형 DMG보다 더 많은 H3K27me3을 함유한다고 입증하였다(Mohammad et al. 2017; Piunti et al. 2017). PRC2 억제제의 존재에도 불구하고 특정 PRC2 도메인의 보유를 기본으로 하는 조절 논리는 여전히 알지 못한다(Weinberg et al. 2017; Funato and Tabar 2018). 또한 H3K27M이 종양 발생을 촉진하기 위해서는 특정 발생 신호 또는 2차 돌연변이가 필요할 수 있음이 분명해졌다. 예를 들어, H3K27M만으로는 매우 좁은 발생 윈도우 내에서를 제외하고 쥣과 모델에서 신경 교종을 유도하기에 불충분하다(Pathania et al. 2017). 또한, DMG 세포 집단의 단일-세포 RNA-seq 분석은 특정 미분화된 전구 기원 세포가 종양을 야기한다는 것을 시사한다(Filbin et al. 2018). 또한, H3.1K27M을 가진 ACVR1 돌연변이와 H3.3K27M을 가진 PDGFRA 증폭의 공동-발생의 관찰은 H3 돌연변이가 발암의 원인이 되는 유전자 변화 인자를 필요로 한다는 것을 나타낸다. DMG에서 염색질 지형에 대한 발생 신호 및 2차 돌연변이의 영향은 아직 완전히 밝혀지지 않았다.
H3K27M 함유 DMG에서 관찰된 질환의 염색질 지형을 더 잘 이해하기 위해, 본 발명자들은 게놈 전체에 단백질:DNA 상호 작용을 맵핑하는 최근에 설명된 방법인 표적 하 절단 및 뉴클레아제를 이용한 방출(CUT&RUN)(Skene and Henikoff 2017; Skene et al. 2018)을 히스톤 돌연변이가 없거나 H3 꼬리 내 위치 27에서 H3.1 또는 H3.3에서 리신에서 메티오닌으로의 치환을 함유하는 환자 유래 DMG 세포주 패널에 적용하였다(도 33A). 이 방법은 돌연변이체 H3K27M 히스톤의 게놈 전체의 국소화를 고해상도로 프로파일링할 수 있게 하고, 정규화 대조군으로서 외인성 세포 스파이크-인의 사용을 통해 게놈 전체 H3K27me3 점유의 매우 정량적인 비교를 제공한다. DMG 세포주 및 형질 전환되지 않은 줄기세포의 대표 패널에 정량적 CUT&RUN의 적용은 히스톤-돌연변이 DMG에서 잔류 PRC2 활성이 DMG가 줄기 유사 및 분화된 세포 마커의 혼합물을 동시에 발현함에도 불구하고, 배아 줄기세포에서 PRC2 활성과 매우 일치함을 밝힌다. 이러한 결과는 분화 신호에 직면한 원시 줄기세포 유사 PRC2 지형의 유지 및 감소된 PRC2 활성이 H3K27M-DMG의 특징 및 이러한 치명적인 소아 종양에 대한 잠재적인 취약점을 정의하고 있음을 나타낸다.
결과
DMG에서 H3K27M 침착은 H3 변이 의존적이다
본 발명자들은 먼저 H3.1 또는 H3.3에서 K27M 돌연변이를 보유한 환자 DMG 세포주에서 H3K27M 온코히스톤의 게놈 전체의 국소화를 분석하고자 하였다. H3.1은 복제 의존적 방식으로 염색질에 침착되어 게놈 전체에 균일한 분포를 일으키는 히스톤 변이체이다(Maze et al. 2014). 대조적으로, H3.3 변이체는 복제 독립적 방식으로 침착되고 높은 히스톤 턴오버의 부위에 축적된다(Maze et al. 2014). H3.1K27M-DMG 및 H3.3K27M-DMG에서 H3K27M의 게놈 전체 국소화를 평가하기 위해, H3K27M에 대한 항체를 3개의 DMG 세포주 SU-DIPG-IV(H3.1K27M), SU-DIPG-XIII(H3.3K27M) 및 VUMC-10(MYCN-증폭된, H3 야생형)에서 CUT&RUN 반응에 사용하였다. 항-H3K27M 항체는 H3K27M에 대해 매우 특이적이지만 H3.1K27M과 H3.3K27M을 구별할 수 없다(Piunti et al. 2017; Fang et al. 2018). H3.3K27M DMG 세포에서 H3K27M CUT&RUN 프로파일은 정의된 도메인에서 H3.3K27M이 축적됨을 보여준다(도33B). 또한, 동일한 세포주에서 H3K27M을 H3K27me3 및 H3K27ac CUT&RUN과 비교하였을 때, H3.3K27M 피크는 H3K27ac 피크와 밀접한 상관관계가 있으며, 활성 히스톤 턴오버 부위에서 H3.3 혼입과 일치하는 H3K27me3 도메인과 최소의 중첩을 나타냈다(도 33C). H3.3K27M 세포주에서 H3K27M의 게놈 전체 국소화 분석은 PTN(도 33B), H3F3A 및 MYC를 포함하여 DMG 발암에 중요한 역할을 하는 여러 유전자에서의 축적을 보여준다(Mackay et al. 2017; Qin et al. 2017). 또한, H3.3K27M은 ESC의 리 프로그래밍 인자 Sox2 및 MYC(Takahashi and Yamanaka 2006)를 포함하여 배아 줄기 세포(ESC)에서 전사적으로 활성인 유전자좌에 존재하며, 이는 원시 기원의 세포를 시사한다. DHH, SUFU, PTCH1, GLI1 및 GLI2를 포함한 SHH 신호 전달 경로의 성분은 또한 헤지호그 경로의 활성화를 나타내는 H3K27M 축적의 부위이다(Monje et al. 2011).
H3.3K27M과 대조적으로, H3.1K27M 세포주에서 H3K27M 항체를 사용한 CUT&RUN 프로파일링은 복제 의존적 혼입과 일치하는 정의된 도메인의 농축 없이 게놈 전체에 균일한 분포를 나타낸다(도 33B, 33C). H3.1K27M 및 H3.3K27M이 유사한 수준으로 발현되기 때문에, H3.1K27M 세포주에서 식별 가능한 피크의 결여는 발현에 기인하지 않는다(도 33D). H3.3K27M 및 H3.1K27M의 히트 맵은 H3.3K27M-DMG 세포주에서 정의된 피크(도 33C)를 분명히 보여주지만, H3.1K27M 세포주에서는 그렇지 않다. 이들 데이터는 또한 H3.1K27M이 H3.3K27M 배경에서 관찰된 배경 이상의 수준으로 존재함을 입증하며, 이는 게놈 전체에 검출 가능한 혼입을 나타낸다(도 33C). 대조군으로서, H3K27M 항체를 VUMC-10에서 CUT&RUN 반응에 사용하였다. 유의한 신호는 관찰되지 않았고, 웨스턴 블롯에서도 신호가 관찰되지 않았으며, 이는 H3K27M에 대한 항체의 특이성을 확인해준다(도 33C, 33D).
H3K27M - DMG는 야생형 신경 교종에 존재하지 않는 고유한 H3K27me3 도메인을 함유한다
H3.1K27M 및 H3.3K27M DMG 세포주에서 H3K27M 국소화의 상이한 패턴의 발견은 H3K27M 및 H3K27me3 국소화 사이의 관계를 조사할 기회를 제공하였다. H3K27M은 EZH2에 결합하고 EZH2 활성을 직접 억제하는 것으로 제안되었으며(Weinberg et al. 2017; Funato and Tabar 2018), 이는 H3K27me3 및 H3K27M이 큰 도메인을 공동 점유해서는 안 됨을 의미한다. H3K27me3 및 H3K27M이 큰 도메인 내에서 상호 배타적인지 여부를 확인하기 위해, DMG 세포주에서 H3K27me3 특이적 항체로 CUT&RUN을 수행하였다. 또한, 외인성 스파이크-인을 통해 H3K27me3 함량이 크게 다른 DMG 세포주에서 PRC2 도메인 크기와 강건성을 정량적으로 측정하는 CUT&RUN 기능을 활용하였다. 1x106개 인간 세포 대 5x104개 초파리 세포의 고정 비율로 CUT&RUN 반응에 초파리 S2 세포를 첨가하였다. H3K27me3 항체는 초파리와 인간 H3K27me3를 모두 인식하므로 인간 및 초파리 리드 서열 분석을 통해 일관된 대조군에 대한 정규화 및 인간 샘플 간의 직접 비교를 가능하게 하였다. 스파이크-인 리드는 세포주 사이의 정량적 웨스턴 블롯 결과와 근접하게 추적되어 정량적 정규화 전략의 유효성을 확인한다. 흥미롭게도, H3K27me3 함량은 DMG 세포주 사이에서 상당히 다양하지만(도 33D), 이전에 거의 검출할 수 없는 수준의 H3K27me3를 갖는다고 보고된 H3.1K27M 및 H3.3K27M 세포주(Grasso et al. 2015; Piunti et al. 2017)를 포함하여 이들 모두에서 H3K27me3 도메인이 확인되었다(도 34A). 피어슨의 상관관계 분석은 야생형 대응물보다 H3.1K27M과 H3.3K27M의 종양 간 H3K27me3 분포에서 높은 유사성을 보여주며, 이는 DMG의 게놈 및 트랜스크립톰 분석에서 관찰된 유사한 관계와 일치한다(Mackay et al. 2017)(도 34B). 그러나 분포 및 신호 강도의 결합된 차이를 관찰하기 위해 정규화에 민감한 린의 상관관계를 사용한 상관 분석은 H3.1K27M DMG 세포주에서 감소한 H3K27me3 침착의 결과인 H3.3과 H3.1의 분리를 보여준다(도 34B). 종양 억제제 WT1(도 34A)을 포함하여 관심의 수많은 유전자 좌에서 히스톤 돌연변이 DMG에서 많은 농축된 영역을 발견하였다. CDKN2a와 같은 알려진 종양 억제제는 H3.3K27M 및 히스톤 야생형 세포주에서 PRC2 표적이었으며, H3.1K27M 세포주에서는 그렇지 않았으며, 이는 이전 보고서와 일치한다(Piunti et al. 2017).
각 세포주에 고유한 구체적인 H3K27me3 영역을 결정하기 위해, 각 세포주에 대해 게놈 전체의 정규화된 신호를 사용하여 게놈의 모든 염기쌍에서 임의의 2개의 세포주 사이에서 신호에서 최대 차이를 정의하고 높은 차등 신호의 연속된 영역에 근거하여 "피크"를 호출하였다. 이어서 k-평균 클러스터링을 사용하여 각 세포주에서 H3K27me3 신호에 따라 차등 H3K27me3 피크를 그룹화하여 결과적으로 6개의 클러스터를 포함하는 최적의 솔루션을 얻었다. 상이한 DMG 세포주에서 차등 H3K27me3 도메인의 비교는 H3.1K27M 및 H3.3K27M 세포주에 존재하지 않는 야생형 세포주에 존재하는 PRC2 도메인의 여러 클러스터를 보여준다(도 34C). 차등 H3K27me3 영역(상위 4개의 클러스터)의 대다수는 야생형에 특이적이지만, H3.3K27M 세포에 H3K27me3을 보유하는 수백 개의 영역(클러스터 5)과 야생형에는 전혀 농축이 존재하지 않으면서 H3.3K27M에서 H3K27me3가 농축된(도 34C) 추가 몇 가지(클러스터 6)가 남아 있다. 클러스터 6 도메인은 수많은 T 박스, 포크헤드(Forkhead) 및 디스탈레스(Distal-less) 패밀리 구성원을 포함하여 세포 유형 특이적 전사 인자와 중첩되며, 이는 히스톤 야생형 종양과 기원 세포 차이를 시사한다. 또한, 클러스터 6은 PRDM1 및 VGLL3을 포함한 알려진 여러 종양 억제 인자를 포함하는데, 이는 종종 혈액학 및 난소 악성 종양에서 각각 돌연변이 된다(도 34A)(Mandelbaum et al., 2010; Karube et al. 2011).
H3.1K27M 세포주에서 매우 낮은 잔류 H3K27me3 도메인의 확인은 H3K27M이 이들 세포에 게놈 전체에 침착되어 있다는 점에서 흥미롭다(도 33C, 34A). 이 결과는 PRC2가 H3.1K27M의 국소 존재하에서 활성이지만 덜 효율적임을 시사한다. PRC2 도메인에서 H3.1K27M이 없는 영역을 찾지 못했지만, H3.1의 일부가 국소적으로 제거되고, PRC2 도메인의 복원을 가능하게 하는 적합한 EZH2 기질인 야생형 H3.3으로 대체될 수도 있다. 이 가능성을 조사하기 위해, CUT&RUN을 사용하여 H3.1K27M 세포주에서 야생형 H3.3 국소화를 평가하였다. K27me3 도메인에서 H3.3의 농축이 관찰되지 않는다. H3.1K27M 세포주에서 H3.1K27M의 균일한 분포 및 PRC2 도메인 내에서 관찰된 일관된 신호를 고려할 때, 이러한 데이터는 H3K27M 및 H3K27me3이 염색질에서 국소적으로 공존할 수 있음을 시사한다.
H3K27M - DMG는 줄기 유사 H3K27me3 구성을 갖는다
야생형 신경 교종에는 존재하지 않는 H3K27M-DMG에 특이적으로 보유된 H3K27me3 도메인의 식별, 및 H3K27M 및 H3K27me3 함유 유전자 좌의 공존은 DMG 염색질 지형이 단지 EZH2 활성에 대한 H3K27M 영향에 의해 결정되지 않을 수 있다는 것을 나타낸다. 히스톤 돌연변이 DMG에서 관찰된 고유한 H3K27me3 패턴은 대신에 종양에 대한 기원 세포로부터 유래할 수 있다. 이를 조사하기 위해, 본 발명자들은 DMG 내 H3K27me3 도메인을 신경 줄기세포(NSC) 패널 및 DSC의 추정 전구체가 발생할 가능성이 있는 인공의 발생 궤적을 나타내는 ESC의 도메인과 정량적으로 비교하고자 하였다. ESC는 H3K27me3이 낮고 이전에 H3K27M 신경교종 발생(Funato et al. 2014)의 모델로 사용되어, H3 돌연변이 DMG와의 적절한 비교에 도움이 되는 한편, 태아 전뇌 유래 NSC는 교모 세포종에 대한 확립된 대조군이다(Pollard et al. 2009).
양적 비교를 가능하게 하기 위해 상기에 설명한 스파이크-인 전략을 사용하여 형질 전환되지 않은 H1 ESC 및 NSC 주 CB660 및 U5에서 H3K27me3에 대한 CUT&RUN을 수행하였다. 모든 세포 유형에서 강력한 PRC2 도메인이 식별되었다(도 35A). H3.1K27M 및 H3.3K27M 세포주에서 H3K27me3에 대한 게놈 전체 프로파일은 히스톤 야생형 DMG보다 ESC 및 NSC 주와 일관되게 더 높은 상관관계가 있다. 놀랍게도, 린의 상관관계를 통해 절대 H3K27me3 수준을 포함하는 정량적 비교는 ESC 주와 H3.3K27M 간의 높은 관련성을 보여주며, 이는 H3.3K27M에서 H3K27me3 도메인의 원시 줄기 유사 구성을 시사한다(도 35B). 고유한 H3K27me3 도메인을 추가로 조사하기 위해, 이전의 차등 H3K27me3 분석에서 히스톤 돌연변이 DMG 특이적 클러스터(클러스터 6)에 포함된 H3K27me3이 농축된 영역에 집중하였다. ESC와 NSC 주 사이의 클러스터 6에서 H3K27me3 도메인 비교는 H3.3K27M 세포주에서 클러스터 6에서 식별된 도메인과 실질적으로 중첩된다는 것을 보여준다(도 35C). 이는 전체 H3K27me3이 ESC에 적다는 것을 고려하면 흥미로우며 이것이 원시 줄기세포 상태를 유지하는데 중요한 부위임을 나타낸다. 또한, 상호 배타적인 분화 경로와 관련된 상당수의 전사 인자가 클러스터 6 내에 존재하며, 이는 DMG 전구 세포에 이미 존재하거나 2차 돌연변이의 축적 중에 데 노보 생성될 가능성이 있는 PRC2 표적 세트를 나타낸다. DMG에 특이적이지만 형질 전환되지 않은 줄기세포에는 존재하지 않는 클러스터 6 유전자에는 종양 억제 유전자 PRDM1 및 VGLL3 유전자와 기타 조직 특이적 전사 인자가 포함된다.
H3K27M - DMG는 활성화된 발달 경로의 염색질 시그니처를 함유한다
H3K27me3 프로파일링은 H3K27M-DMG가 원시 줄기 유사 상태를 가짐을 보였다; 따라서, DMG에서 H3K27ac 및 H3.3K27M 농축이 줄기세포와 유사한 프로파일을 반영하는 지의 여부를 확인하고자 하였다. ESC, NSC, 및 DMG에서 H3K27ac 피크와 DMG에서 H3.3K27M 피크를 비교하는 상관 매트릭스를 생성하여 상이한 세포주 사이의 활성 염색질 프로파일의 유사성을 확인하였다. H3.3K27M DMG 세포주에서 H3K27ac 및 H3K27M은 0.76 및 0.81의 높은 상관 계수를 보였다(Piunti et al. 2017)(도 36A). 히스톤 야생형 DMG 주는 다른 DMG 세포주와의 상관관계가 불량한 것으로 나타났으며(도 36A), 이는 2차 돌연변이의 상이한 무리 및 추정되는 상이한 기원의 세포와 일치한다(Mackay et al. 2017). 흥미롭게도, H3 돌연변이 DMG 주는 ESC보다 NSC 주와 더 밀접하게 관련되어 있었고(도 36A), 이는 H3 돌연변이 DMG에서 H3K27me3 도메인이 NSC보다는 ESC와 유사하다는 발견과 대조된다(도 35B). H3.3 돌연변이 DMG 세포에서 H3.3K27M 농축은 ESC보다 NSC에서 H3K27ac 농축과 더 일치하였으며, 이는 H3.3K27M이 NSC와 전체적으로 더 유사한 활성 염색질 환경에 혼입됨을 나타낸다.
H3 돌연변이 DMG 샘플에 존재하는 공유된 H3K27M/H3K27ac 피크는 U5 세포주와 가장 밀접하게 공유하는 Olig1, Olig2(도 36B) 및 GFAP와 같은 신경교 성숙에 관여하는 유전자 및 두 NSC 주와 공유되는 일반적인 신경 조절인자 NEUROD1 및 NES를 포함한다. 또한, ESC 또는 NSC 간에 공유되지 않는 H3K27M/H3K27ac 피크는 음향 고슴도치(Sonic Hedgehog) 및 WNT 신호 전달 경로의 성분, 및 희소돌기 아교세포 전구체 특이적 활성 유전자, 예컨대 PDGFRA(도 36B)를 포함하며, 이는 NSC의 발생적으로 하류의 유전자의 활성화를 나타낸다(Filbin et al. 2018). POU5F1과 같은 hESC 특이적 조절 인자는 DMG H3K27ac/H3K27M 피크가 없지만 이들은 SOX2 및 MYC 유전자 좌에 존재하며, 이는 ESC와 NSC 모두에서 강력하게 활성적이다(도 36B). 종합하면, 이들 데이터는 분화를 시도하지만 줄기세포 특이적 염색질 조절 메커니즘을 종결할 수 없는 원시 DMG 전구 세포와 일치하여 줄기 및 분화 관련 활성 유전자의 분화 차단 및 비정상적 공존을 초래한다.
H3.3K27M은 전체적으로 PRC2 지형을 변경하지 않는다
여기에 제시된 데이터는 줄기 유사 기원 세포 및 2차 돌연변이가 DMG에서 염색질 지형의 주요 결정 인자인 모델과 일치한다. 이전 연구는 H3K27M의 발현이 H3K27me3 수준을 히스톤 돌연변이 DMG에서 관찰되는 수준으로 감소시키고 PRC2 분포를 재구성할 수 있지만, H3K27me3 손실의 정도와 시간의 범위는 광범위하게 다양하다는 것을 시사하였다(Bender et al. 2013; Chan et al. 2013; Lewis et al. 2013). 또한 ESC를 사용한 최신 보고는 H3.3K27M이 EZH2를 염색질로 직접 동원하여 일부 유전자 좌에서 EZH2를 억제하는 동시에 다른 곳에서는 PRC2 활성을 촉진할 수 있다는 것을 밝혔다(Fang et al. 2018). 우리의 DMG 패널에서 PRC2 국소화를 조사하기 위해 CUT&RUN 반응에서 절대적인 PRC2 서브 유닛 SUZ12 및 선택적인 서브 유닛 MTF2에 대한 항체를 사용하였다. SUZ12 및 MTF2 신호는 두 H3 돌연변이 DMG 세포주모두에서 H3K27me3 피크 내에서 고도로 농축되었으며, 이는 EZH2에 의한 H3K27me3의 침착을 매개하는 PRC2 성분과 일치한다(도 37A, 37B). 그러나 SUZ12 및 MTF2는 H3.3K27M 세포주에서 H3K27me3 농축된 도메인에 비해 H3K27M 농축된 도메인과 공동-국소화되었다(도 37B). 더욱이, SUZ12 및 MTF2 신호는 H3K27me3 도메인에서 그들의 농축이 무작위 샘플링된 영역보다 현저히 증가함에 따라 H3K27M 매개된 동원에 의해 예상될 수 있는 H3.1K27M 세포주에서 게놈 전체 분포의 증거를 나타내지 않았으며, 이는 H3K27M 분포와 대조된다(도 37C). 또한, SUZ12 및 MTF2 신호는 각각의 세포주에서 H3K27M 영역 내 H3K27M 신호와의 상관관계가 거의 없으며, 이는 SUZ12 및 MTF2가 H3K27M 의존적 방식으로 게놈과 상호 작용할 가능성이 없음을 나타낸다. 본 발명자들은 H3K27M에 의한 PRC2 격리가 불가능하다고 결론 내린다.
우리의 데이터는 H3.3K27M이 생리학적 수준에서 발현될 때 EZH2 활성을 강력하게 억제해서는 안 된다는 것을 나타낸다. 이 가설을 테스트하기 위해, 낮은 MOI에서 렌티바이러스 형질 도입 시스템과 플라스미드 기반 형질 감염 시스템을 모두 사용하여 DMG에서 보이는 것과 유사한 수준으로 293T 세포에 H3.3K27M을 도입하였다. 모든 세포가 적절한 작제물을 함유하도록 항생제 선별을 사용하였다. 웨스턴 블롯팅은 6 일의 발현 후 H3.3K27M이 H3.1K27M 및 H3.3K27M 세포주에서 관찰된 수준과 유사한 수준으로 존재함을 입증한다(도 38). 중요하게도, 총 H3 수준과 비교하여, 이소성 H3.3K27M은 총 H3의 작은 부분을 나타내며, 이는 하나의 H3F3A 또는 HIST1H3b 대립 유전자의 생리적 H3 수준과 일치한다(도 38). H3.3K27M의 강건한 발현에도, H3K27me3 수준의 최소 감소가 관찰된다(도 38). 이러한 데이터는 전체적으로 EZH2를 강력하게 억제하는 H3.3K27M과 일치하지 않으며 대신 DMG의 PRC2 지형이 기원 세포와 2차 돌연변이의 조합에 의해 형성되는 모델을 추가로 지지한다(도 39A).
고찰
DMG는 치료 옵션이 거의 없는 발생 제한적이고 치명적이고 소아 CNS 종양이다. 이러한 종양에서 염색질 지형의 특성화는 새로운 치료 전략으로 이어질 수 있지만 환자 유래 시료 및 세포주의 부족에 의해 제한되어왔다. 단일 세포 트랜스크립톰 분석을 이용한 최근 보고는 DMG가 희소돌기 아교세포 전구 세포와 가장 전사적으로 유사하지만, 줄기세포와 성숙한 신경 교세포의 마커를 비정상적으로 발현함을 보여주었다(Filbin et al. 2018). 발생 궤적인 PRC2 활성의 또 다른 중요한 조절 인자가 DMG에서 원시 상태와 성숙한 상태의 기능 장애 조합을 또한 반영하는 지의 여부는 알려지지 않았다. 여기서 CUT&RUN을 사용하여 DMG 세포주와 형질 전환되지 않은 줄기세포의 대표 패널에서 염색질 지형을 프로파일링하였다. 우리의 데이터는 H3K27M-DMG에 존재하는 낮은 수준의 잔류 PRC2 활성이 ESC PRC2 지형과 가장 근접하게 유사하다는 것을 보여준다. 염색질의 전사 활성 영역의 탐침은 GFAP를 포함하는 성숙한 신경교세포의 마커와 함께 SOX2 및 MYC의 발현을 보여준다. 종합하면, 우리의 데이터는 발생 프로그램의 활성화 및 H3K27M의 존재에도 ES 유사 PRC2 활성을 유도하는 줄기세포-특이적 염색질 조절 네트워크와 일치한다.
우리의 CUT&RUN 접근법으로 또한 H3.1K27M과 H3.3K27M가 DMG의 PRC2 지형의 원인이 되는 현재 모델을 분석할 수 있었으며, 이 중 일부는 H3K27M에 대한 EZH2의 친화도 증가에 중점을 두고 있다(Weinberg et al. 2017; Fang et al. 2018; Funato 및 Tabar 2018). 최근 연구는 H3.3K27M이 마우스 ESC의 다른 유전자 좌에서 PRC2 활성을 촉진하면서 일부 작동 준비된 인핸서에서 EZH2를 부적절하게 격리하고 억제할 수 있음을 시사하였다(Fang et al. 2018). 그들의 모델은 PRC2 성분이 격리로 인해 H3.3K27M-DMG 세포주에서 H3K27M 부위의 대규모 서브 세트로 국소화되어야 하고, 그렇지 않으며 PRC2 활성이 상당히 변경되지 않을 것으로 예측한다. 우리의 데이터세트에서, 격리와 일치하지 않는 H3K27M 농축된 부위와 PRC2 성분 사이의 최소한의 중복을 관찰하였다. 또한, 293T에서 생리학적 수준에서 H3.3K27M의 이소성 발현이 H3K27me3 수준을 감소시키지 않았으며, 이는 EZH2를 전체적으로 강력하게 억제하는 H3.3K27M의 개념을 지지하지 않는다는 것을 발견하였다(Weinberg et al. 2017). 우리의 데이터는 H3.3K27M과 EZH2의 상호 작용이 H3.3K27M-DMG에서 볼 수 있는 감소된 PRC2 활성의 주요 결정 인자가 아닐 가능성이 있음을 나타낸다.
H3.1 돌연변이 DMG에서 PR3 지형에 대한 H3.1K27M의 영향은 알려져 있지 않다. H3.1K27M-DMG에서 관찰된 비정상적인 염색질 지형을 더 잘 이해하기 위해서 H3K27me3, H3K27M, 및 H3K27ac 데이터를 사용하였다. H3.1 돌연변이 DMG의 우리의 프로파일링은 H3.1K27M이 복제 의존적 방식으로 게놈 전체에 침착됨을 밝혔다. 정량적 CUT&RUN은 매우 낮은 잔류 PRC2 활성 및 H3.1K27M과 공동 점유를 식별하였다. PRC2 활성의 나머지 부위는 H3.3K27M-DMG 및 ESC에 존재하는 부위와 유사하였다. 또한 격리 모델의 또 다른 예측인 H3.1K27M에 의해 동원된 PRC2 성분의 게놈 전체 침착에 대한 증거를 관찰하지 못하였다. 대신, 우리의 데이터는 줄기세포 특이적 PRC2 동원 모집 메커니즘이 WT1과 같은 종양 억제 유전자 좌를 억제함으로써 종양 발생을 촉진하여 유전자 좌의 서브 세트에서 H3K27M 억제를 극복한다는 것을 제외하고는 PRC2 활성을 국소적으로 억제하는 염색질 관련 H3K27M과 일치한다(도 39B).
H3K27M이 DMG에서 볼 수 있는 비정상적인 PRC2 지형의 주요 결정 인자가 아니라면 이들이 어떻게 발생하는가. 우리의 데이터는 기원 세포, 발생 상황 및 2차 돌연변이가 DMG에서 H3K27M이 작용하는 PRC2 지형을 지시하기 위해 상승 작용을 한다는 것을 나타낸다(도 39A). 이들 데이터는 또한 H3.3K27M이 원시 줄기 유사 염색질 구성을 갖는 세포에서 그 효과를 발휘하는 모델을 지지하는데, 이는 이미 기원 세포에 존재하거나 2차 돌연변이에 의해 매개되는 역분화 동안 획득될 수 있다. H3K27M이 신경 교종 발생의 초기 사건임을 입증하는 계통 발생학적 분석은 종양 발생을 촉진하기 위해 2차 돌연변이를 획득하고 발생적으로 조절되는 신호 캐스케이드의 활성화 이전에 존재해야 한다(Nikbakht et al. 2016)고 주장한다. H3.3K27M은 SOX2 및 MYC와 같은 분화 중 침묵이 필요한 전사적 활성 유전자 좌에 혼입될 때 새로운 PRC2 도메인이 발생하고, 줄기세포 조절 네트워크의 활성화를 유지하는 것을 방지하지만 분화 신호에 대한 반응을 허용하여 발암에 기여할 가능성이 있다(도 39B). 대조적으로, H3.1K27M의 게놈 전체 분포는 염색질을 PRC2 활성에 불응성으로 만들어 특정 유발성 유전자의 침묵을 방지할 수 있는 반면, 줄기세포 특이적 PRC2 동원 메커니즘은 종양 억제인자의 비효율적이지만 효과적인 억제를 촉진한다(도 39B). 최근 보고에서 H3.3K27M이 Cbx7과 염색질과의 결합을 감소시키고(Tatavosian et al. 2018) Cbx 단백질이 발생적으로 제어되는 PRC2 도메인의 확립에 잘 입증된 역할을 갖는다(Morey et al. 2012)는 것을 보였기 때문에, 본 발명자들은 크로모도메인 함유 단백질이 H3K27M의 표적이 될 수 있음을 추측한다.
H3K27M이 단지 특정 염색질 상황에서 종양 형성의 원인이 될 수 있음을 시사하는 모델은 세포 유형과 발달 단계에 따라 H3K27M에 대한 차등 민감도를 나타내는 다른 연구에 의해 뒷받침된다(Funato et al. 2014; Pathania et al. 2017). 또한, H3K27M 돌연변이 DMG와 비슷한 H3K27me3 수준을 가진 영아 상의세포종 및 방사 신경 교세포의 최근 확인은 H3K27 돌연변이가 비정상적으로 낮은 수준의 PRC2 활성을 촉진하는데 필요하지 않음을 보여준다(Bayliss et al. 2016). 또한, 최근 RUNX1 돌연변이와 함께여야만 발견되는 급성 골수성 백혈병의 서브 세트에서 H3K27M의 최근 확인은 H3K27M의 영향이 낮은 H3K27me3에 의해 정의된 줄기 유사 염색질 상태에서 가장 심각한 모델을 추가로 지지한다(Lehnertz et al. al. 2017). 그 보고에서, RUNX1 돌연변이 단독은 RUNX1 야생형 블라스트보다 H3K27me3의 수준이 낮았으며, RUNX1 돌연변이와 H3.1K27M의 조합은 RUNX1 돌연변이 히스톤 야생형 세포보다 낮은 수준을 나타냈다. ACVR1 돌연변이 및 PDGFRA 증폭은 AML에서 RUNX1 돌연변이와 DMG에서 유사한 역할을 할 수 있으며, 세포를 H3K27M의 효과에 감작시킨다. 종합하면, 이 발견은 PRC2 활성을 감소시키기 위해 2차 돌연변이 및 발생 맥락이 충분할 수 있음을 보여주며, H3K27M 온코히스톤이 그 효과를 발휘할 수 있는 환경을 제공한다.
DMG에서 활성화된 발생 프로그램과 공존하는 줄기 유사 PRC2 지형의 발견은 또한 임상적이고 치료적 의미를 갖는다. 줄기 유사 PRC2 활성의 분석을 용이하게 할 수 있는 염색질 변형 효소의 소분자 억제제, 예컨대 EZH2 억제제 또는 HDAC 억제제와 결합된 레티노산과 같은 존재의 전략으로 차별화를 유도하는 것은 단독 요법으로서 어느 하나를 사용하는 것보다 더 효과적일 것이다. 여기에 제시된 모델은 또한 DMG가 다른 원시 줄기세포보다 EZH2 억제제 단독 요법에 더 민감하지 않을 것임을 시사하는데, 이들이 원시 줄기세포보다 더 높은 수준의 H3K27me3를 갖는 PRC2 도메인의 서브 세트를 포함하고 있기 때문이다. CNS 종양의 EZH2 억제제를 받고 있는 소아 환자에서 발생하는 2차 T 세포 림프종의 최근 보고는 EZH2 억제제에 대한 줄기세포 감도와 일치하며 PRC2 매개된 억제를 완화하면서 분화를 촉진하는 조합 요법의 이점을 주장한다. DMG에서 분화 유도 및 염색질 변형제와 결합된 티로신 키나아제 억제제에 의한 PDGFRA 증폭과 같은 2차 돌연변이의 표적화는 또한 이러한 불변의 치명적인 소아 악성 종양에 대한 생산적인 치료적 접근법일 수 있다.
세포 배양 재료 및 방법
SU-DIPG-IV(H3.1K27M), SU-DIPG-VI(H3.3K27M) 및 SU-DIPG-XIII(H3.3K27M) 세포는 관대하게도 스탠포드 대학교 엠. 몬제(M. Monje)의 실험실에서 제공받았다. VUMC-10 세포를 얻었다. 세포를 페니실린/스트렙토마이신이 보충되고 20 ng/mL의 인간 EGF 및 20 ng/mL의 인간 bFGF 20 ng/mL 보충된 뉴로컬트(NeuroCult) 배지(StemCell Technologies, 캐나다 브리티시컬럼비아 밴쿠버 소재)에서 배양하였다. 해리를 위해 세포를 아큐타아제(Accutase)로 계대하였다. 초파리 S2 세포를 18 mM L-글루타민이 보충된 HYQ-SFX 곤충 배지(ThermoFisher)에서 로그 단계까지 배양하고 스크래핑에 의해 수거하였다. 293T 세포를 10% 태아 소 혈청 및 2 mM L-글루타민이 보충된 DMEM(ThermoFisher)에서 배양하였다.
전체 세포 용해물 제조:
각 샘플에 대해 대략 3~5x106 세포를 펠렛화하고 PBS로 1회 세척하고 200 ㎕ 표준 단백질 샘플 완충액을 펠렛에 첨가하였다. 샘플을 볼텍싱하고, 100℃에서 5분 동안 끓이고 실온으로 냉각시켰다. 벤조나제(1 ㎕)를 첨가하고 샘플을 실온에서 5분 동안 인큐베이션한 후 추가 사용을 위해 동결시켰다.
CUT&RUN
기술된 바(Skene et al. 2018)와 같이 CUT&RUN을 수행하였다. 사용된 항체에는 H3K27me3(Cell Signaling Technologies 9733), H3K27M(Abcam ab190631), H3K27ac(Millipore MABE647), H3(Abcam ab24834), H3.3(Abnova), MTF2(ThermoFisher), SUZ12(Abcam ab12073) 및 토끼 IgG 아이소형 대조군 EPR25A(Abcam ab172730)이 포함된다. CUT&RUN 반응의 경우, 1:50으로 사용된 SUZ12 및 MTF2를 제외하고 모든 항체를 1:100 희석으로 사용하였다. ViCell(ThermoFisher)에 의해 계수된 바에 따라, 1,000,000 인간 세포 대 50,000 S2 세포의 비로 초파리 S2 세포를 사용하여 스파이크-인 정규화를 수행하였다.
라이브러리 제조 및 서열 분석
추출된 DNA를 KAPA 하이퍼-프렙(Hyper-prep) 라이브러리 제조 키트 프로토콜(Roche, Inc.)에 적용하고 기술된 바(Lu et al Orkin Cell 2018)와 같이 작은 단편을 보존하기 위해 말단 복구 반응 및 폴리-A 테일링 반응을 <60℃에서 수행하는 변형을 이용하여, 이전에 기술된 바(Skene and Henikoff 2017)와 같이 증폭하였다. Bowtie2를 사용하여 인간 리드를 hg19에 정렬하였다. IgG 대조군과 비교하여 농축 부위를 식별하기 위한 사용자 지정 스크립트는 github.com/Henikoff/Cut-and-Run에서 이용 가능하다.
데이터 분석
서열 분석 리드는 Bowtie2(Langmead et al. 2012)를 사용하여 hg19 게놈 빌드에 맵핑하고 베드툴스(bedtools)(Quinlan and Hall 2010)를 사용하여 페어드-엔드 단편 베드 파일 및 스파이크 정규화된 베드그래프를 생성하였다, hg19 게놈에 걸쳐있는 10 kb 창에 맵핑된 정규화된 단편 카운트를 사용하여 R(www.r- project.org)에서 상관관계 히트 맵을 생성하였다. 농축된 영역 및 영역 정점을 사용자 지정 스크립트를 사용하여 호출하였다. R의 ggplot 유틸리티(ggplot2.tidyverse.org)를 사용하여 CUT&RUN 산점도를 생성하였다. CUT&RUN 신호 히트 맵 및 메타플롯 프로파일은 딥툴스(deeptools)를 사용하여 생성하였다(Ram
Figure pct00013
rez et al. 2014). 베드툴 교차 유틸리티를 사용하여 농축된 영역 교차점을 정량화하였다. 데이터세트를 Integative Genomics Viewer를 사용하여 가시화하였다(Robinson et al. 2011).
실시예 5에 대한 참고 문헌(이들 각각은 그 전문이 참고로 포함됨)
Figure pct00014
Figure pct00015
Figure pct00016
실시예 6
인간 동원체 염색질 복합체의 예상치 못한 형태 변화
염색체 분리의 충실도는 동원체라고 불리는 특정 염색체 유전자 좌에 모이는 단백질성 키네토코어를 통한 방추사 미세 소관에 의한 효율적인 염색체 포획에 좌우된다. 인간 동원체는 대략 170개 염기쌍(bp) α-부수체 반복 단위(Alexandrov et al. 2001)의 0.5 내지 5 Mb 길이의 직렬 배열을 포함한다. α-부수체 DNA는 영장류 계통에서 유래하였으며 그 이후로 반복 확장에 의해 진화하여 코어에 매우 균질한 신생 배열이 생겼으며, 동원체 가장자리를 차지하는 α-부수체 서열이 더 분기된다. 인접한 맵으로 균질한 α-부수체 배열의 어셈블리는 기존의 서열 어셈블리 기술에 심각한 문제를 제시하였다. 이 문제를 해결하기 위해, 최근에 기능적 동원체 α 부수체의 드 노보 식별을 위해 동원체 단백질에 의해 결합된 서열의 상향식 계층적 클러스터링을 사용하였다. 가장 풍부한 α-부수체 배열이 특성화된 SF1 및 SF2 앞염색체(suprachromosomal) α 부수체 패밀리(Alexandrov et al. 2001)에 각각 속하는 기본 340 bp 또는 342 bp 이량체 단위(Henikoff et al. 2015)를 포함한다는 것을 발견하였다.
동원체 α 부수체는 표준 히스톤 H3은 동원체 단백질 A((CENP-A)라고 불리는 는 cenH3 변이체로 대체된 특수한 염색질에 포함된다(Palmer et al. 1987; Fukagawa and Earnshaw 2014). CENP-A는 CENP-B, CENP-C, CENP-N, CENP-T, CENP-W, CENP-S, 및 CENP-X를 포함하는 구성적인 동원체 관련 네트워크(CCAN: constitutive centromere-associated network) 복합체의 일부이다(Hori et al. 2008). 천연 ChIP(N-ChIP), 가교결합 ChIP(X-ChIP) 및 순차적 ChIP을 포함하는 DNA 서열 분석(ChIP-seq) 전략과 함께 비교 염색질 면역 침전(ChIP)을 사용하여, 본 발명자들은 이전에 CENP-B, CENP-C, 및 CENP-T가 물리적으로 통합되어 CENP-A 뉴클레오솜과 응집성 복합체를 형성함을 보였다. CENP-A, CENP-C, 및 CENPT X-ChIP의 마이크로코커스의 뉴클레아제(MNase) 분해는 α-부수체 이량체보다 > 165 bp 보호 효과를 보인 반면(Thakur and Henikoff 2016), 천연 조건하에서 MNase 분해는 주로 약 100 내지 약 135 bp 범위의 더 짧은 CENP-A 결합된 α-부수체 단편을 생성하였다(Hasson et al. 2013; Henikoff et al. 2015; Nechemia- Arbely et al. 2017).
본 발명자들과 다른 연구자들은 350~500 mM NaCl로 추출할 때 동원체 염색질이 안정적임을 발견하였다(Zhang et al. 2012; Hasson et al. 2013; Henikoff et al. 2015). 본 발명자들은 또한 500 mM NaCl이 저염 조건에 비해 동원체 염색질의 회수를 증가시켰다(Thakur and Henikoff 2016)는 것을 발견하고, 회수의 차이가 동원체 염색질의 성질에서 정성적인 차이를 반영하는 지의 여부에 대한 의문을 제기하였다. 고전적인 염색질 염 분획법은 상이한 물리적 특성(Sanders 1978), 기능(Rocha et al. 1984), 및 게놈 전체 분포(Henikoff et al. 2009; Jahan et al. 2016)에 의해 뉴클레오솜을 분리하는데 사용되었기 때문에, 본 발명자들은 대부분의 동원체 염색질이 일반적으로 천연 MNase-ChIP 연구에서 회수되는 가용성 분획이 없는 CCAN 성분의 존재에 의해 불용성이 되었는지 궁금하였다.
천연 조건하에서 차등적 용해도가 동원체 염색질의 정성적인 차이를 반영할 가능성을 다루기 위해, 염 분획된 염색질을 동원체 단백질의 N-ChIP에 적용하였다. 또한, 특이적 동원체 성분을 프로파일링하기 위해 최근에 개발된 우리의 CUT&RUN(표적 하 절단 및 뉴클레아제를 이용한 방출) 원위치 표적화된 맵핑 방법을 적용함으로써 염 용해도의 차이를 탐구한다. 동일한 α-부수체 서브패밀리에 속하는 이량체 반복 사이의 작은 서열 차이가 동원체 단백질 결합과 복합체 자체의 구조에서의 차이에 해당한다는 것을 발견하였다.
결과 및 고찰
CUT&RUN 염 분획법(CUT&RUN.Salt)은 별개의 CENP -A 함유 복합체를 방출한다
ChIP가 30년 넘는 동안 특이적 단백질-DNA 상호 작용을 맵핑하는 주요한 방법이었지만 ChIP-seq 아티팩트의 최근 보고(Park et al. 2013; Teytelman et al. 2013; Jain et al. 2015)는 비-ChIP 방법을 사용한 검증의 중요성을 강조하였다(Zentner et al. 2015). 동원체 연구에서 특히 우려되는 점은 N-ChIP에 사용되는 MNase가 니블링 및 내부 절단을 유발하고(Brogaard et al. 2012), 입자가 완전히 또는 부분적으로 포장되는지에 대한 불확실성을 야기하는 경향이다(Hasson et al. 2013). 본 발명자들은 최근에 게놈의 나머지 부분을 용해시키지 않으면서 온전한 항체 표적 입자의 정확한 절단 및 방출을 유발한다는 점에서 ChIP와 관련 없는 효율적인 표적화된 뉴클레아제 방법인 CUT&RUN을 도입하였다(Skene and Henikoff 2017b). 가장 최근의 최근 CUT&RUN 프로토콜(Skene and Henikoff 2017a)에서, 항체를 자성 비드에 결합된 투과화된 세포에 첨가한 후 항체에 결합하는, MNase와 단백질 A(pA-MN) 사이의 단백질 융합을 첨가한다. MNase는 칼슘에 의해 활성화된 후 175 mM NaCl의 존재하에 EDTA 및 EGTA와 킬레이트화에 의해 정지된다. MNase가 CUT&RUN의 특정 부위에 테더링되면 검출되는 니블링, 접근성 편향, 또는 높은 AT 풍부 DNA에서조차 분해 시간에서 두자릿수 더 큰 범위에 걸쳐 내부 절단이 없다. 또한, 염색질 가용화가 없기 때문에, 불용성 펠렛에서 추출된 DNA의 CUT&RUN 절단 패턴도 프로파일링할 수 있다(Skene and Henikoff 2017b). 염 분획법(CUT&RUN.Salt)에 대해 CUT&RUN을 적용하기 위해, 킬레이트 정지 완충액을 RNase 없이 첨가하고, 상등액을 제거한 후, 세포/비드 펠렛을 500 mM NaCl과 함께 인큐베이션하였다. 그런 다음 저염 및 고염 상등액 및 최종 펠렛으로부터 DNA를 추출하였다(도 49A). CUT & RUN은 DNA가 절단되기 전에 항체 인식이 발생한다는 점에서 염 분획법에 매우 적합하지만, ChIP에서는 항체 인식 또는 DNA 회수가 입자 완전성의 손실과 같은 염으로 유도된 입자 형태의 변화에 영향을 받을 수 있다. 세 가지 분획 모두에 대해, CENP-A, CENP-B, 및 CENP-C의 DNA에 대한 qPCR 분석에서 동원체 α 부수체의 뚜렷한 농축을 관찰하였지만 음성 대조군 H3K27me3 CUT&RUN.Salt 염기 서열 분석 라이브러리에서는 그렇지 않았다(도 49B). 우리의 N-ChIP 결과와 일치하여, 고염 CUT&RUN.Salt 분획에서 대다수의 염색질(약 70%~80%)이 증폭되었다(도 49C).
페어드-엔드 25 bp × 25 bp DNA 서열 분석을 거치고 컨센서스 α-부수체 배열에 맵핑된 경우, 세 분획 모두는 배경 대조군에 비해 균질한 이량체 α-부수체(SFI, D5Z2, D7Z1, 및 SF2)에 대해 CENP-A, NPNP-B, 및 CENP-C의 강한 농축 및 비동원체 α 부수체(D5Z 및 D7Z2)에 대해 약한 농축을 보였다. 함동원체 히스톤 마크(H3K9me2 및 H3K9me3)는 예상대로 α 부수체에 대해 약한 농축을 보였지만, 진정 염색성 마크(H3K27me2 및 H3K27me3)는 강력한 고갈을 나타냈다.
CUT&RUN.Salt 단편의 단편 길이 분포를 분석하기 위해, CUT&RUN.Salt 분획에 대해 페어드-엔드 250 bp × 250 bp 서열 분석을 수행하고 활성의 동원체 α-부수체 콘티그에 병합된 쌍을 맵핑하였다. N-ChIP 염 분획 사이에서 볼 수 있는 이질적인 크기 분포와 대조적으로, 저염 및 고염 CUT&RUN.Salt 분획 사이에 훨씬 더 많은 균일한 크기 분포를 관찰하였다(도 40A). CENP-A, CENPB, 및 CENP-CCUT&RUN.Salt의 경우, 세 가지 모든 분획은 약 160~185 bp에서 주요 피크와 약 340 bp에서 작은 피크를 나타냈다. α-부수체 콘티그에 대한 CENP-A CUT&RUN.Salt 프로파일은 X-ChIP를 사용하여 관찰된 것과 유사한 저염, 고염, 및 펠렛 분획의 별개의 CCAN 복합체를 밝혔다(Thakur and Henikoff 2016). 따라서, CUT&RUN.Salt는 천연의 조건하에서 온전한 CENP-A/B/C 복합체를 방출할 뿐만 아니라(따라서 잠재적인 가교 결합 아티팩트를 방지함) 테더링되지 않은 MNase가 100 bp 하위 입자를 생성하는 N-ChIP와 대조적으로 입자를 파괴로부터 보존한다.
강력하고 밀집된 CENP-B 박스는 CENP-A/B/C 복합체를 안정화한다
CENP-A N-ChIP의 경우 상기에 나타낸 바와 같이, CENP-A, CENP-B, 및 CENP-C CUT&RUN.Salt에 대한 차등적 용해도는 동일한 α-부수체 콘티그에 걸쳐 염을 증가시키면서 나타난 점유가 증가함에 따라 CENP-B 박스에서 가장 두드러졌다. 흥미롭게도, 여러 340 bp 단위에 평균을 냈을 때, 고염 및 펠렛 분획에서 CENP-B 박스에 대해 CENP-B CUT&RUN 점유 피크가 정확하게 관찰되었으나 저염 분획에 대해서는 관찰되지 않았다(도 41A). CUT&RUN에서 CCAN 입자의 보존과 종합해 보면, 평균 피크의 이러한 부재는 두 가지 뚜렷한 부류의 입자가 있음을 나타낸다: 파괴에 내성을 보이고 CENP-B가 농축된 안정한 입자 및 CENP-B가 고갈된 덜 안정한 입자.
본 발명자들은 CUT&RUN.Salt에 의해 측정된 바와 같은 CCAN 완전성이 CENP-B의 안정화 역할을 반영하는지 궁금하였다. 인간 동원체에서 분기 기울기가 있는 α-부수체 서열의 존재는 이 가능성을 시험할 기회를 제공한다(Henikoff et al. 2015). 가장 최근의 확장된 풍부한 CENP-A 농축된 α-부수체 이량체 배열은 고밀도 CENP-B 박스(340 bp 이량체당 약 1개의 CENP-B 박스)를 포함한다. 오래된 α 부수체는 진화 시간에 걸쳐 무작위 돌연변이가 축적되어 CENP-B 박스의 완전한 손실 또는 변성으로 이어지기 때문에 더욱 분기된다. 본 발명자들은 원조 모티프에서 CENP-B 박스 서열의 분기가 CENP-A/B/C에 결합하는 α 부수체의 능력과 따라서 동원체를 형성하는 능력에 해당하는지 궁금하였다.
이 문제를 해결하기 위해, 먼저 17 bp CENP-B 박스의 중간 15 bp가 원조인 것으로 확인하였는데, 이는 대부분의 균질한 SF1(예를 들어, D5Z2). SF2(예를 들어, Cen13 유사) 및 SF3(예를 들어, DXZ1) α-부수체 콘티그에 일정한 간격으로 존재하기 때문이다. 그런 다음 모티프 정렬 및 검색 도구(MAST)를 사용하여 이 모티프의 통계적으로 유의한 출현을 확인하고 0(3개 초과의 불일치)와 1(동일) 사이에서 점수를 매겼다. CENP-B 모티프 점수의 증가가 비특이적 IgG CUT&RUN 점유과 비교하여 CENP-A의 농축과 연관된다는 것을 확인하였다(도 41B). 특히, 2개의 생물학적 복제물에 대해 평균을 내었을 때, 3개의 모든 염 분획에 대해 피어슨 상관계수 r = 0.66~0.83임을 관찰하였다. 강력한 CENP-B 박스의 존재가 CENP-A/B/C의 안정화와 관련된다고 결론내린다.
CENP-B 박스 밀도는 이량체 배열에서 가장 높은 것에서부터 이종 단량체에서 가장 낮은 것까지 다양하다. CENP-B가 서열 의존적 방식으로 CENP-B 박스에 결합함에 따라, CENP-B 단백질 밀도는 또한 더 신생의 균질한 어레이에서 더 높을 것으로 예상된다. 본 발명자들은 오래된 서열로부터의 CENP-B 박스의 손실 정도(CENP-B 박스 밀도의 감소)가 이들 서열에 대한 CENP-A 결합의 감소와 연관되는지를 시험하였다. 더 긴 α 부수체 콘티그에서 CENP-A 농축에 대한 CENP-B 밀도를 플롯팅하고 CENP-B 모티프의 밀도와 CENP-A 농축 사이의 강한 상관관계(r = 0.62~0.75)를 관찰하였다(도 41C). 이것은 강력하고 밀집된 CENP-B 박스의 유지가 α-부수체 동원체에 대한 CENP-A/B/C 결합 효율을 증가시킨다는 것을 나타낸다. 균질한 기능적 α-부수체 배열 내의 CENP-B 박스가 존재하는 CENP-A/B/C 입자를 안정화시키도록 진화하였다는 우리의 증거는 CENP-B가 CENP-C를 안정화시킴으로써 분리 충실도에 기여한다는 제안을 지원한다(Fachinetti et al. 2015).
분기한 α 부수체는 CENPA 어셈블리에 대해 일부 역량을 유지한다
조밀한 CENP-B 박스가 있는 매우 균질한 배열에서 최고 CENP-A 농축이 발생했지만, qPCR 분석은 또한 CUT&RUN.Salt 및 염 분획 N-ChIP 실험에서 CENP-B 박스를 희박하게 포함하거나 포함하지 않는 분기하는 서열에 적은 양의 CENP-A를 나타냈다(도 41C). 분기 α 부수체에서 세포학적으로 낮은 수준의 CENP-A를 검출하는 것은 CENP-A로 밝게 염색된 균질한 이량체의 검출과 비교할 때 낮은 복제본 수로 인해 어렵다. 예를 들어, 균질한 D7Z1(1.5~3.8 Mb)은 CENP-A를 사용한 강력한 세포학적 공동 국소화 현상을 보여주지만, 분기한 D7Z2(0.1~0.5 Mb)는 CENP-A 결합에 대해 음성인 것으로 보고되었다(Slee et al. 2012). 본 발명자들은 β 부수체(68 내지 69 bp 함동원체 직렬 반복 배열)을 포함한 비동원체 서열을 가진 비균질한 단량체 α 부수체에 대한 CUT&RUN.Salt 샘플에서 CENP-A 농축을 비교하였다. 반복 마스크된 게놈 및 β-부수체 배열에 비해 D7Z2에 3배 초과의 CENP-A 농축을 확인하였으며(도 41D), 이는 심지어 CENP-B 모티프가 완전히 결핍된 분기한 α-부수체 배열조차도 CENP-A 어셈블리에 대한 일부 역량을 유지함을 나타낸다.
거의 균질한 α-부수체 배열에서 CENP-A/B/C의 예상하지 못한 구조적 및 입체 구조적 변형
완벽하게 균질한 α-부수체 배열은 표준 서열 분석 리드에서 고유하게 조립될 수 없지만 대략 5%의 분기는 일부 서열 분석된 리드를 콘티그로 조립하기에 충분하다. 본 발명자들은 매우 균일한 배열의 모든 복사본이 동일한 패턴을 보일 것으로 예상 했으므로 250 bp × 250 bp 병합된 쌍을 맵핑했을 때 인접한 반복체 사이에 주요 차이점을 발견하여 놀랐다. 주석이 달린 BAC 클론과 게놈 콘티그에 상응하는 균질한 배열 내에서 3가지 주요 변이 유형을 관찰하였다(도 42): (1) CENP-A/B/C에 의한 개별 이량체의 차등 점유. 본 발명자들은 단일 배열 내에서 가장 낮은 점유도 이량체와 가장 높은 점유된 이량체 사이의 농축에서 최대 약 50배의 차이를 관찰하였다. (2) CENP-B 박스에 대한 CENP-A/B/C의 방향. SF1 α-부수체 이량체 배열 내 2개의 CENP-B 박스 간 거리는 헤드-테일 방식으로 단방향으로 배향된 340 bp이다. 따라서, CENPA/B/C 함유 복합체의 방향은 단방향일 것으로 예상된다. 이 기대와 달리, 본 발명자들은 CENPA/B/C가 단일 연속 α-부수체 콘티그 내에서도 CENP-B 박스 방향에 대해 어느 측면으로든 배향될 수 있음(도 42에 빨간색 화살표)을 관찰하였다. (3) 구조적 변이. 본 발명자들은 이량체의 단량체 둘 다에 대한 거의 동일한 CENP-A/B/C 결합을 가진 전체 340 bp 걸친 대칭 복합체 또는 이량체의 하나의 단량체를 우선적으로 점유하는 비대칭 복합체를 포함하여 이들 콘티그에 CENP-A/B/C의 상이한 구성을 관찰하였다. α-부수체 이량체에서 CENP-A 함유 입자의 이러한 급격한 구조적 변화는 서열에서 현저한 차이가 거의 없는 것으로 관찰되었다. 예를 들어, [도 42]의 하단 패널에서 중첩되어 나타낸 4개의 인접한 340 bp D7Z1 반복 단위는 쌍별 비교에서 88%~96% 동일하지만, CCAN 구조에서 4개 모두 서로 다르다. 따라서, 약간의 α-부수체 서열 변이는 CENP-A 함유 복합체의 결합 거동에 영향을 미치는 것으로 보일 것이다. 분명히, 여러 CCAN 형태는 외부 키네토코어를 동원할 수 있지만, 단지 단일 구조적 형태가 동원에 충분할 수 있다. 이러한 차이는 CCAN이 결합된 서열에 고유할 수 있거나 초파리 D1, GAGA 인자, 및 Prod 단백질과 유사한 비히스톤 부수체 DNA 결합 단백질의 배제를 반영한다(Levinger and Varshavsky 1982; Raff et al. 1994; Torok et al. 1997).
염 분획법을 이용한 CENP-A/B/C의 우리의 맵핑은 균질한 α-부수체 배열이 CENP-A, CENP-B, CENP-C, 및 CENP-T를 포함하는 단일 응집성 CCAN 복합체에 의해 점유됨을 보였던 이전 보고를 확인해준다(Thakur and Henikoff 2016). CENP-B 박스 위에 CENP-T 서브 복합체를 맵핑함으로써 각각의 α-부수체 이량체 단위가 2개의 CENP-A/H4/H2A/H2B 서브뉴클레오솜 사이의 CENP-TWSX 서브 입자 주위를 우회전 슈퍼헬리컬 키랄성으로 감싼다는 모델을 제안하게 되었다. MNase 분해에 대한 가교 결합되지 않은 CCAN 감도는 CENP-A 뉴클레오솜의 구조에 관한 상반된 결론에 이르게 한 DNA 보호의 차이를 부분적으로 설명할 수 있다. 그러나 염 분획법으로 N-ChIP에 따라, 본 발명자들은 이제 저염 조건을 사용하여 관찰된 CENP-A 입자(Lacoste et al. 2014; Nechemia-Arbely et al. 2017)가 게놈 전체에 전체 CENP-A의 작은 부분만을 포함한다는 것을 보인다. 대조적으로, 주요 N-ChIP 염 분획은 훨씬 더 큰 DNA 단편을 보호하는 입자로 이루어지며, 이는 온전한 CCAN 복합체의 존재와 일치한다. 균질한 α-부수체 배열에서 CENP-B 박스에 대한 CENP-B 결합은 CCAN 완전성을 촉진한다는 우리의 증거는 CENP-B에 특이적 역할에 대한 증거를 제공한다. 또한, CCAN 성분이 CENP-B 박스가 없거나 CENP-B의 농축을 나타내지 않는 D7Z2 α-부수체 배열에 낮은 수준으로 동원된다는 우리의 발견은 CENP-B가 없더라도 고유한 CCAN 동원 가능성이 있음을 시사한다. 따라서 CCAN 점유는 α-부수체 서열에 의해 결정되지만 배열에 대한 CENP-B 결합에 의해 향상될 수 있다.
재료 및 방법
세포주, 항체, 및 프라이머
염 분획 N-ChIP 분석은 CENP-A Flag 태그된 HT1080-1b 세포주(Thakur and Henikoff 2016)에서 수행하였으며, CUT&RUN.Salt 실험은 K562 세포주에서 수행하였다. 사용된 항체는 항-CENP-A(Abcam, ab13939), 항-CENP-B(Abcam, ab25734), 항-CENP-C(Abcam, ab33034), 히스톤 H3K27me3(Cell Signaling Technologies, 9733), IgG(Antibodies Online, ABIN102961) 및 MTPOL(GeneTex, GTX105137)이었다.
CUT&RUN.Salt
인간 K562 세포 또는 핵의 CUT&RUN은 분해 후 프로토콜이 염 분획을 허용하도록 변형된 것을 제외하고는 본질적으로 기술된 바(Skene and Henikoff 2017b)와 같이 수행하였다. [도 41]에 나타낸 실험은 핵보다는 투과화된 세포를 사용하였다(Skene and Henikoff 2017a). 페어드-엔드 250 bp × 250 bp 또는 25 bp × 25 bp 서열 분석을 수행하였다.
서열 분석
페어드-엔드 250 bp × 250 bp 리드는 기술된 바(Henikoff et al. 2015)와 같이 매개 변수 -q 25 -L 25 -o 15에 의한 SeqPrep을 사용하여 트리밍하고 병합하였다. 병합된 쌍 및 페어드-엔드 25 bp × 25 bp 리드는 Bowtie2를 사용하여 다음 매개변수에 의해 맵핑하였다; - -end-to-end - -very-sensitive - -no-mixed - -no-discordant -q - -phred33 -I 10 -X 700. CUT&RUN.Salt의 경우, 리드 카운트는 기술된 바(Skene and Henikoff 2017b)와 같이 스파이크-인 대조군을 사용하여 캘리브레이션하였다. 농축 값은 비특이적 IgG 대조군에 대한 특이적 항체에 대해 캘리브레이션된 리드 카운트의 비율을 나타낸다. 모티프 강도 및 밀도를 추정하기 위해, 본 발명자들은 15 bp CENP-B 박스 모티프가 가장 균질한 SF1(예를 들어, Cen1 유사), SF2(예를 들어, Cen13 유사), 및 SF3(예를 들어, DXZ1) α-부수체 배열에서 규칙적인 간격으로 발견되기 때문에 원조가 된다고 판단하였다. CENP-B 모티프를 식별하고 CENP-B 박스 불일치 및 밀도를 계산하기 위해 기술된 바(Zentner et al. 2015)와 같이 통계적으로 유의한 출현에 대해 콘티그를 스캔하였다. 본 발명자들은 15 bp 컨센서스에 대한 동일성의 정도로서 모티프 점수를 정의하며, 여기서 15개 일치 중 15개는 1, 3개 초과의 불일치는 0이며, 각 불일치는 0(유의한 모티프 없음)에서 1(완벽한 모티프)까지의 척도에 대해 0.25의 값을 뺀다.
실시예 6에 대한 참고 문헌(이들 각각은 그 전문이 참고로 포함됨)
Figure pct00017
Figure pct00018
Figure pct00019
실시예 7
염색질 변형의 자동화된 원위치 프로파일링은 세포 유형 및 유전자 조절 프로그램을 분석한다
도입
세포는 유전자 발현을 제어하는 시스-조절 DNA 요소의 활성을 변경함으로써 그들의 고유한 정체성 및 기능적 특성을 확립한다1 ,2. 프로모터 요소는 모든 유전자의 5' 전사 개시 부위(TSS) 근처에 있지만, 인핸서와 같은 원위 시스 조절 요소는 종종 DNA 내 긴 스트레치를 연결하여 선택된 프로모터와 상호 작용하고 세포 유형 특이적 유전자 발현을 지시한다1 ,2. 유전자 함량(즉, DNA 서열) 외에도, 우리의 세포는 또한 유전적 후성 유전적 정보의 형태로 세포 분열에 걸쳐 이러한 별개의 시스 조절 확인을 전달하여 그들이 독특한 세포 정체성을 전달할 수 있게 한다3 ,4. 이러한 시스 조절 요소를 인식하는 핵 단백질의 결함은 종종 특정 조직 및 세포 유형에서 나타나는 많은 인간 질환의 근본이 된다5-9. 환자 샘플의 분자 진단에 대한 기준을 제공하기 위해 인체에 포괄적인 지도를 생성하려는 노력이 진행 중이다10,11. 건강 세포 및 질환 세포에서 세포 유형 특이적 염색질 지형을 특성화하는 것이 이 지도에 필수적이지만, 기술적 한계는 이 프로젝트에 필요한 대규모 염색질 단백질의 게놈 전체 프로파일링을 위한 전통적인 접근 방식의 구현을 방해해왔다.
후성 유전적 오작동이 많은 인간 질환의 근본이 된다는 인식이 커지고 있음에도, 환자 샘플의 후성 유전체를 프로파일링하는 방법은 거의 이용 가능하지 않다. 후성 유전체 기술의 임상 잠재력을 실현하려면 많은 수의 환자 샘플을 동시에 프로파일링할 수 있는 강건하고 확장 가능한 접근 방식이 필요하다. 고 처리량 서열 분석과 결합된 항원 특이적 항체를 사용한 염색질 면역 침전은 염색질 프로파일링에 광범위하게 사용되었지만, 이 방법은 노동 집약적이고 아티팩트가 발생하기 쉬우며13, 약한 신호를 게놈 배경 잡음과 구별하기 위해 높은 서열 분석 깊이를 필요로 하기 때문에 임상 적용을 위해 확장하기 어렵다. 최근에, 본 발명자들은 인자 특이적 항체를 사용하여 게놈 결합 부위에 마이크로코커스의 뉴클레아제(MNase)를 테더링하는 대안적인 염색질 프로파일링 기술로서 CUT&RUN을 도입하였다14 ,15. 표적화된 뉴클레아제는 결합 부위 주위에서 염색질을 절단하고, 방출된 DNA는 표준 라이브러리 제조 기술을 사용하여 용이하게 서열 분석되어, 단백질-DNA 상호 작용의 효율적인 맵핑을 초래한다. CUT&RUN은 배경이 매우 낮기 때문에 고품질 게놈 전체 프로파일을 얻는데 필요한 샘플 양과 서열 분석 비용을 크게 줄일 수 있다14,16.
여기서 본 발명자들은 CUT&RUN 프로토콜을 변형하여 액체 처리 로봇에서 96 웰 형식으로 염색질 단백질 및 변형을 프로파일링한다. H1 인간 배아 줄기세포(hESC) 주 및 K562 백혈병 세포주에 이 방법을 적용하여, 세포 유형을 비교하고 그들의 독특한 유전자 조절 프로그램을 식별하는 강건한 정량적 측정법을 개발한다. 또한, 본 발명자들은 이 방법이 동결된 종양 샘플에서 염색질 특징을 정의하여 그들의 세포 정체성을 결정할 수 있음을 보여준다. AutoCUT&RUN은 염색질 기반 유전자 조절의 고 처리량 연구에 이상적이며 클리닉에서 일상적인 환자 샘플의 염색질 지형을 검사할 수 있다.
결과
염색질 단백질의 게놈 전체 프로파일링을 위한 자동화된 플랫폼
CUT&RUN을 자동화 형식에 적용하기 위해 벡크만(Beckman) Biomek FX 액체 처리 로봇을 장착하여 자기 분리 및 온도 제어를 용이하게 한다(도 43A). 먼저, 세포를 콘카나발린 A 코팅된 자성 비드에 결합시켜 모든 후속 세척을 자기 분리로 수행할 수 있다. 그런 다음 비드 코팅된 샘플을 항체와 인큐베이션하고 최대 96개의 샘플을 플레이트에 배열한다(도 43A). 연속적인 세척, 단백질 A-MNase 융합 단백질의 테더링, DNA의 절단, 및 샘플 상등액으로의 절단된 염색질 단편의 방출은 Biomek에서 수행한다(도 49A). 게놈 프로토콜 자동화에 대한 주요 걸림돌은 일반적으로 라이브러리 제조 전에 소량의 핵산 정제가 필요하다는 것이다. 이 장애물을 극복하기 위해, 본 발명자들은 일루미나 라이브러리 어댑터의 직접 결찰을 위해 염색질 단편에서 DNA 말단을 연마하는 방법을 개발하였다(도 49A). 이어서, PCR 농축 전후에 Ampure XP 자성 비드를 사용하여 인덱싱된 CUT&RUN 라이브러리를 Biomeck에서 정제한다. 말단 연마, 어댑터 결찰, 및 PCR 농축 반응은 별도의 써모사이클러에서 수행한다. 이 AutoCUT&RUN 프로토콜을 사용하면 단일 운영자가 풀링되고 서열 분석될 준비가 된 최대 96개의 라이브러리를 2일 내에 생성할 수 있다(도43A).
AutoCUT&RUN의 효능을 테스트하기 위해, 활성 염색질 상태(H3K4me1, H3K4me2, H3K4me3, 및 H3K27ac) 및 하나의 억제 변형(H3K27me3)을 표시하는 4개의 히스톤 변형을 표적화하는 항체를 사용하여 H1 hESC 및 K562 세포의 2개의 생물학적 복제물을 동시에 프로파일링하였다. 각 히스톤 마크에 대한 전체 리드 분포를 비교한 결과, 샘플이 생물학적 복제물와 높은 상관관계가 있으며, 편향되지 않은 계층적 매트릭스로 서로 클러스터링된다는 것을 확인하였다(도 43B). 또한, 활성 히스톤 마크의 게놈 전체 프로파일은 주어진 세포 유형 내에서 서로 클러스터링되고, 억제 히스톤 마크 H3K27me3으로부터 분리되었다(도 43B). 이들 프로파일은 IgG 음성 대조군과 거의 연관되지 않기 때문에 항체 특이적 신호를 나타낸다. 종합적으로, 이러한 결과는 AutoCUT&RUN 염색질 프로파일링이 히스톤 마크의 세포 유형 특이적 분포를 재현 가능하게 포착한다는 것을 나타낸다.
히스톤은 염색질에서 DNA와 밀착 결합되어 있기 때문에 체류 시간이 짧은 DNA 결합 전사 인자를 맵핑하는데 AutoCUT&RUN을 적용할 수 있는 지의 여부도 조사하였다. 두 전사 인자, 히스톤 유전자 좌 특이적 유전자 조절 인자 NPAT와 절연체 단백질 CTCF로 AutoCUT&RUN의 성능을 테스트하였다17,18. NPAT 및 CTCF 모두의 AutoCUT&RUN 프로파일은 H1 및 K562 세포에서 예상되는 표적에 매우 특이적이며(도 49B, 49C), K562 세포에서 CTCF의 신호 감도는 우리의 이전 결과와 비슷하였다15. 따라서 AutoCUT&RUN은 다양한 DNA 결합 단백질의 고 처리량, 게놈 전체 프로파일링에 적합하다.
발생 가소성을 유지하기 위해, hESC는 H3K27me3 및 H3K4 메틸화가 중첩되어 표시되는 선택적 이질 염색질(facultative heterochromatin)의 억제된 도메인에 산재되어 있는 일반적으로 개방된 과아세틸화 염색질 지형을 가지고 있다19-22. AutoCUT&RUN은 hESC에서 이러한 기능을 재현한다. H1 세포는 계통 제한된 K562 세포주와 비교하여 H3K27ac를 증가시켰지만, 억제 히스톤 마크 H3K27me3의 도메인은 H1 세포에서는 드물지만 K562 세포에서는 우세하다는 것이 관찰되었다(도 44A). 또한, H1 세포에서 H3K27me3과 H3K4me2 신호 사이에 광범위한 중첩이 관찰되었지만 K562 세포에서는 그렇지 않았다(도 44A, 44B). 따라서, AutoCUT&RUN 프로파일은 hESC에서 확인된 특수 염색질 특성과 일치한다.
히스톤 꼬리에 대한 번역 후 변형은 전사 활성과 밀접한 관련이 있는 것으로 널리 보고되었다. 히스톤 변형의 우리의 AutoCUT&RUN 프로파일이 시스 조절 요소의 전사 활성을 나타내는 지의 여부를 확인하기 위해, RNA-seq 발현 데이터에 따라 순위가 정해진 유전자의 전사 개시 부위(TSS) 주위에 5개의 히스톤 마크의 분포를 조사하였다(도 44C, 44D)23. 활성 마크 H3K4me3은 두 세포 유형(H1 및 K562에 대해 각각 r = 0.70 및 0.81) 이어서 H3K4me2 및 H3K27ac(도 49D, 49E)의 발현과 가장 높은 상관관계가 있음이 발견된다. 억제 히스톤 마크 H3K27me3은 발현과 역상관된다(H1 및 K562에서 각각 r = -0.16 및 -0.53)(도 49D, 49E). 본 발명자들은 이 5개의 마크에 대한 AutoCUT&RUN이 전사 활성을 광범위하게 재현하여, 세포 유형 특이적 유전자 조절 프로그램을 식별하는 전략을 제공한다고 결론내린다.
간단한 염색질 측정법은 AutoCUT&RUN 데이터로부터 유전자 발현 프로그램을 분석한다.
세포 유형을 비교하고 이들의 유전자 조절 프로그램을 구별하기 위해 AutoCUT&RUN 데이터에 적용할 수 있는 정량적 측정법을 개발하고자 하였다. H3K4 메틸화 및 H3K27ac는 주로 활성 프로모터를 표시하지만, H3K27me3은 유전자 억제 정도를 나타내기 때문에, 이들 마크를 단일 모델로 조합함으로써 더 강건한 유전자 활성 측정법을 개발할 수 있다고 추론하였다. RNA-seq는 세포 유형 특이적 유전자 발현 프로그램을 식별하는데 널리 사용되었으며23, 따라서 정규화된 H3K4me2, H3K27ac, 및 H3K27me3 리드 카운트를 프로모터를 상대적인 활성 점수로 할당하는 시스 조절 요소 활성 모델(CREAM: Cis-Regulatory Element Activity Model)에 통합한 가중 선형 회귀 모델을 훈련하기 위한 기준으로서 RNA-seq 데이터를 사용하였다. H3K4me2를 H3K4me3 및 H3K4me1 보다 선택하였는데 마크가 상호 의존적이며, H3K4me2가 근위 및 원위 시스 조절 요소(아래 참조)의 활성을 모델링하는데 고유하게 적용될 수 있기 때문이다. K562 세포의 프로모터에 적용될 때, CREAM 점수는 RNA-seq 값(r = 0.83)과 매우 밀접한 상관관계가 있으며(도 45A), ChIP(r=0.81)에 의해 맵핑된 최대 39개의 히스톤 변형을 사용한 유사한 모델과 유전자 발현을 예측할 수 있는 비슷한 성능을 제공한다24. 또한, K562 세포에 대해 훈련된 가중 CREAM은 H1 세포에 적용될 때 잘 수행되며(도 50A, 50B). 이는 모델 및 데이터 품질이 특성화되지 않은 세포 유형에 프로모터 점수를 할당하기에 충분히 강건하다는 것을 나타낸다.
이 모델을 사용하여 AutoCUT&RUN이 세포 유형 특이적 활성을 갖는 프로모터를 정확하게 식별하는 지의 여부를 조사하였다. 처음에 단일 TSS를 갖는 유전자에 대한 분석에 초점을 맞추었으며, 이를 명백하게 RNA-seq 값에 할당할 수 있으며, CREAM 점수가 H1 또는 K562 세포에서 2배 초과로 농축된 프로모터를 호출하였다(도 45B). 비교를 위해, 또한 RNA-seq 발현 값에 따라 H1 또는 K562 세포에 2배 초과로 농축된 유전자를 호출하였다(도 50C). RNA-seq 값에서 생성된 플롯에 CREAM 점수로 식별된 H1 및 K562 특정 유전자를 표시함으로써, 세포 유형 특이적으로 CREAM 점수로 식별된 많은 유전자가 RNA-seq에 의해 간과되며(도 45B, 45C). 그리고 그 반대의 경우도 적용된다(도 50C, 50D)는 것이 발견되며, 이는 이러한 방법이 수많은 유전자의 발현 변화에 대한 차등 민감성을 나타냄을 시사한다. 고무적으로, CREAM 점수와 RNA-seq에 따라 세포 유형 특이적이라고 호출된 865개의 유전자는 발생 조절 인자에 대해 매우 농축되지만 CREAM 점수 또는 RNA-seq만으로 호출되는 유전자는 발생 GO 용어에 대해 농축되지 않는다(도 45D, 50E~50G). 또한, CREAM에 의해 세포 유형 특이적으로 호출된 35/2,014개의 유전자만이 RNA-seq에 따라 반대 세포 유형 특이성을 갖는다(도 45D). 따라서, AutoCUT&RUN을 적용하여 세포 유형 특이적 발생 조절 인자를 정확하게 식별할 수 있다.
AutoCUT&RUN 데이터가 고도로 특성화된 전사 인자의 세포 유형 특이성을 재현하는 지의 여부를 결정하기 위해, 모든 프로모터를 포함하도록 CREAM 분석을 확장하였다. hESC 다능성 네트워크(NANOG , SOX2 , SALL4, 및 OTX2)의 성분이 H1 세포에서 고도로 농축되는 반면, 조혈 전구 세포 운명의 조절 인자(PU.1, TAL1 , GATA1, 및 GATA2)가 K562 세포에서 고도로 농축됨이 발견된다(도 45E)25,26. 흥미롭게도, 이 방법은 또한 대체 프로모터 활성(예를 들어, OTX2TAL1)의 차이를 식별하여 RNA-seq를 사용하여 불가능한 특징인 주어진 세포 유형에서 발현되는 특정 유전자 아이소형의 표시를 제공한다(도 45E). 본 발명자들은 AutoCUT&RUN가 세포 정체성의 마스터 조절 인자의 식별을 가능하게 하여 고 처리량 형식으로 세포 유형을 특성화할 수 있는 강력한 도구를 제공하다고 결론내린다.
AutoCUT&RUN에 의한 종양의 프로파일링
단백질-DNA 상호 작용을 프로파일링하는 종래의 방법(예를 들어, ChIP-seq)은 일반적으로 소량의 출발 물질을 종종 포함하고 급속 동결된 임상 관련 샘플을 처리할 수 없다. AutoCUT&RUN이 동결된 종양 표본을 프로파일링하기에 적합한 지 시험하기 위해, 뇌간의 유사한 영역에서 생검되었지만 발암 배경이 상이한 두 가지 미만성 뇌간 신경 교종(DMG) 환자 유래 세포주(VUMC-10 및 SU-DIPG-XIII)를 얻었다27. 이 DMG 세포주 모두 쥐과 모델에서 이종 이식편을 쉽게 형성하며, 본 발명자들은 AutoCUT&RUN을 적용하여 마우스 뇌에 접종시킨 후 종양 형성 시 재절제하고 전형적인 임상 조건하에서 동결시킨 VUMC-10 및 SU-DIPG-XIII 이종 이식편에서 히스톤 변형을 프로파일링하였다(도 46A). 비교를 위해, 본 발명자들은 또한 세포 배양물로부터 직접 DMG를 수거하고 동일한 AutoCUT&RUN 플레이트에서 이들을 프로파일링하였다(도 46A). 다시, 복제물이 매우 유사하다는 것을 알았으므로 추가 분석을 위해 이들을 합하였다. 중요하게는, 세포 배양 샘플은 상응하는 동결된 이종 이식편에서 프로파일링된 동일한 마크 프로파일과 높은 상관관계가 있었고, 이종 이식 조직 및 세포 배양 샘플에 대한 AutoCUT&RUN은 유사한 데이터 품질을 생성하였다(도 46B, 도 51). 따라서 AutoCUT&RUN은 동결된 조직 샘플에서 게놈 전체의 염색질 프로파일을 신뢰할 수 있게 생성한다.
암 환자를 효과적인 치료군으로 층화하려면 동일한 조직에서 유래한 종양 이형을 구별해야 하고 VUMC-10 및 SU-DIPG-XIII 샘플은 AutoCUT&RUN의 진단 가능성을 탐색하는데 이상적이다. 이 샘플에 CREAM을 적용하여 VUMC-10과 SU-DIPG-XIII 세포 사이의 차등 활성을 나타내는 5,006개의 프로모터를 식별하였다(도 47A). 이들 종양의 뉴런 기원과 일치하여, VUMC-10 및 SU-DIPG-XIII 특이적 프로모터는 둘 다 뉴런 발생에 관여하는 유전자에 대해 상당히 농축된다(도 52A, 52B). 세포 신호 전달에 관여하는 유전자는 또한 SU-DIPG-XIII 세포에서도 과도하게 발현된다(도 52B); 예를 들어, PDGFR 유전자의 프로모터 및 그의 리간드 PDGF는 SU-DIPG-XIII 세포에서 매우 활성적이다(도 47A). 이것은 DMG가 종종 종양 성장을 촉진하는 PDGFR-α의 활성화 돌연변이를 포함한다는 관찰과 일치한다7. 또한, TGF-β 신호 전달 경로28의 성분인 SMAD3 유전자의 한 프로모터는 SU-DIPG-XIII 세포에서 특이적으로 활성인 반면, 2개의 상이한 SMAD3 프로모터는 VUMC-10 세포에서 활성적이다(도 47A,도 51). 이는 종양 특이적 활성을 나타내는 프로모터를 식별하기 위해 AutoCUT&RUN이 적용될 수 있음을 시사하고, 이는 종양 성장 및 치료제에 대한 잠재적 감수성을 유도할 수 있는 신호 전달 경로를 암시한다.
진단 도구로서, CREAM을 이용한 AutoCUT&RUN을 사용하여 세포 유형과 조직 샘플을 정량적으로 평가하고 건강한 세포 유형 및 질환 세포 유형의 사전 정의된 기준 맵 내에 배치할 수 있다고 추론하였다. 이 아이디어와 일치하여, CREAM 점수는 5,006개의 유전자 프로모터가 VUMC-10과 SU-DIPG-XIII 사이의 차등 활성을 나타내지만(도 47A), 388개의 프로모터만이 VUMC-10 동결된 이종 이식편과 VUMC-10 배양 세포 사이에서 차등적으로 활성적임을 나타내고(도 47B), 1,619개의 프로모터 만이 SU-DIPG-XIII 이종 이식편과 배양된 세포 사이에서 차등적으로 활성적이다(도 52C). 또한, 4개의 DMG 샘플의 프로모터 CREAM 점수를 H1 및 K562 세포와 비교할 때, DMG 이종 이식편이 상응하는 세포 배양 샘플과 단연코 가장 유사하다는 것이 발견한다(도 47C). 본 발명자들은 AutoCUT&RUN은 동결된 종양 샘플에 세포 정체성을 할당하는 신뢰할 수 있는 방법으로 사용할 수 있다고 결론내린다.
세포 유형 특이적 인핸서의 고 처리량 맵핑
유전자 프로모터의 세포 유형 특이적 활성은 종종 인핸서와 같은 원위 시스 조절 요소로부터의 신호를 포함시킴으로써 확립된다1 ,2. 프로모터와 유사하게, 인핸서는 또한 H3K4me229를 나타내고, 활성 인핸서는 전형적으로 H3K27ac로 표시되지만, 억제된 인핸서는 H3K27me3로 표시된다22 ,30,31. 이것은 본 발명자들이 프로모터 CREAM 점수를 할당하는데 사용한 AutoCUT&RUN 프로파일이 세포 유형 특이적 인핸서의 식별을 또한 허용함을 시사한다. 이 가능성을 조사하기 위해, 먼저 우리의 H1 데이터를 활성 프로모터와 인핸서 모두가 농축된 ATAC-seq에 의해 생성된 이용 가능한 염색질 접근성 맵과 비교하였다32 ,33. 프로파일링한 마크 중 H3K4me2 피크가 ATAC-seq와 가장 높은 중첩을 나타내고(도 48A, 도 53A) 36,725/52,270 ATAC-seq 피크(대략 70 %)를 식별한다. 흥미롭게도, H3K4me2는 ATAC-seq 프로파일에서 피크로 호출되지 않은 추가 71,397개의 부위에도 우세하다(도 48A, 도 53A). 이들 다수의 H3K4me2 특이적 부위는 낮지만 검출 가능한 ATAC-seq 신호를 나타내며(도 53B), 이는 이들이 억제된 프로모터 및 인핸서에 해당할 수 있음을 나타낸다. 이러한 해석에 일치하여, 평균 H3K4me2+/ATAC- TSS는 ATAC+ TSS보다 높은 H3K27me3 신호를 갖는다(도 53C). H3K4me2+/ATAC+ 피크를 주석이 달린 TSS와 중첩되는 피크와 중첩되지 않는 피크로 나눔으로써, 3K4me3이 프로모터에서 훨씬 농축되지만, HH3K4me1은 원위 조절 요소에서 더욱 농축됨(도 48B, 48C, 도 53D)이 발견되고, 이는 이러한 원위 조절 요소는 인핸서가 농축될 가능성이 높음을 시사한다22 ,3. 따라서, AutoCUT&RUN에 의한 H3K4me2의 맵핑 부위는 유전자 발현 프로그램을 제어하는 활성 및 억제된 시스 조절 요소의 레퍼토리를 정의하기 위한 민감한 방법을 제공한다.
마지막으로, AutoCUT&RUN을 사용하여 세포 유형 특이적 인핸서를 식별할 수 있는 지의 여부를 조사하였다. 추정 인핸서 부위의 수를 확장하기 위해, 우리의 모든 샘플로부터 H3K4me2 프로파일에서 호출된 비 TSS 피크 목록을 작성하였다. 그 후 선형 회귀 모델을 사용하여 요소 인핸서 CREAM 점수를 할당하고 상이한 세포 유형 간의 상관관계를 조사하였다. 본 발명자들은 DMG 세포 배양 샘플 및 이종 이식편의 인핸서 CREAM 점수가 높은 상관관계가 있으며(SU-DIPG-XIII 및 VUMC-10 세포에 대해 각각 r = 0.75 및 0.87)(도 48D), 및 SU-DIPG-XIII 세포의 인핸서 CREAM 점수가 VUMC-10 세포와 약한 양의 상관관계를 보임(예를 들어 r = 0.19)을 발견하며, 이는 아마도 이들의 공통 뉴런 기원에도 불구하고 세포 유형 특이적 차이를 반영한다. 예를 들어, SOX2 다능성 유전자 좌의 인핸서는 이전에 제안된 바와 같이35 VUMC-10 세포보다 더 원시적인 신경 줄기세포 유형과 유사한 SU-DIPG-XIII 세포와 일치하는, SU-DIPG-XIII 세포와 VUMC-10 세포의 차이를 나타낸다(도 48E). 따라서 AutoCUT&RUN은 세포 유형 및 조직 샘플을 계층화하기 위한 엄격한 방법을 제공한다.
고찰
본 발명자들은 일루미나 라이브러리 제조를 위해 염색질 단편의 직접 결찰을 개발함으로써 CUT&RUN 기술을 자동화된 플랫폼에 적용하고 세척 단계와 라이브러리 정제를 위한 자기 분리 단계를 구현하였다. AutoCUT&RUN은 단 2일 내에 항원 표적화된 염색질 단백질의 96개의 게놈 전체 프로파일을 생성하여, 처리량 및 염색질 지형을 조사하기 위해 가능한 연구 규모를 극적으로 증가시킨다. 본 발명자들은 단지 3개의 히스톤 변형(H3K27ac, H3K27me3 및 H3K4me2) 프로파일링이 프로모터 및 인핸서의 세포 유형 특이적 활성을 결정하는데 충분함을 보이며, 상이한 세포 유형의 후성 유전적 조절을 비교하는 강력한 정량적 측정법을 제공한다. 자동화된 작업 흐름은 실험 간의 기술적 변동성을 줄여 생물학적 복제물과 다양한 샘플 유형에서 일관된 프로파일을 생성한다.
AutoCUT&RUN을 계속 최적화하기 위해 하드웨어 수정 및 계산 개발을 계획할 수 있다. 다양한 항체 수집물을 스크리닝함으로써 AutoCUT&RUN을 사용하여 효율적으로 프로파일링할 수 있는 핵 단백질 레퍼토리가 크게 확장될 것이다. 또한, 현재의 AutoCUT&RUN 프로토콜은 보편적인 액체 처리 로봇에 최적화되어 있지만 가역적 자석 써모사이클러 블록을 통합한 주문형 로봇은 CUT&RUN 반응 및 라이브러리 제조가 그 자리에서 수행되도록 하여 프로토콜을 더욱 간소화할 수 있다. 마지막으로, 인핸서 및 프로모터 활성의 둘 모두 조합을 사용하는 것과 같이 데이터의 추가 측면을 통합함으로써 세포 유형을 구별하는 측정법이 개선될 수 있다.
AutoCUT&RUN으로 동결된 조직 샘플을 프로파일링하는 탁월한 재현성은 후성 유전학적 의료 분야를 변화시킬 수 있는 잠재력을 갖는다12. 현재 환자 진단에 사용되는 다른 게놈학 접근 방식과 비교하여 AutoCUT&RUN은 질환 세포 내에서 염색질 단백질을 프로파일링할 수 있는 고유한 기능을 갖는다. 예를 들어, 염색질 단백질에서 발암성 융합에 의해 야기된 암은 AutoCUT&RUN에 의해 프로파일링되어 염색질 지형에 기초한 분자 진단을 제공함과 동시에 드 노보 돌연변이 단백질에 의해 파괴된 유전자 좌를 맵핑할 수 있다. 이것은 환자 층화를 위한 강력한 도구를 제공할 뿐만 아니라 히스톤 데아세틸라제 또는 히스톤 메틸트랜스퍼라제 억제제와 같은 염색질 조절 요법이 의도한 효과를 갖는지의 직접적인 판독을 제공할 수 있다.
방법
AutoCUT&RUN
간략하게, 이전에 기술한 바와 같이 세포 또는 조직 샘플을 콘카나발린 A 코팅된 자성 비드(Bangs Laboratories, 카탈로그 번호 BP531)에 결합시키고, 디기토닌으로 투과화하고, 단백질 특이적 항체에 결합시킨다14. 그런 다음 샘플을 96 웰 플레이트에 배열하고 세척 단계 중에 샘플을 자기 분리하기 위해 96S 슈퍼 마그넷 플레이트(Super Magnet Plate)(Alpaqua SKU A001322), 및 PCR 플레이트용 알루미늄 히트 블록 인서트(V & P Scientific, Inc. VP741I6A)가 장착된 벡크만 Biomek FX 액체 처리 로봇에서 처리하고, 냉각 장치로 보내 2 mM CaCl2를 첨가한 후 0~4℃에서 MNase 분해 반응을 수행한다. 그런 다음 9분 후 EGTA를 첨가하여 MNase 분해 반응을 정지시키고 후속 효소 반응에 Mg2 +를 첨가한다. 이 단계는 라이브러리 제조 전에 DNA 정제가 필요하지 않다. 이어서 분해 중에 상등액으로 방출된 염색질 단편을 말단 복구 및 바코드된 Y 어댑터와의 결찰을 위한 기질로서 사용한다. 결찰 전에, A 테일링 단계를 58℃에서 수행하여 라이브러리에서 서브 뉴클레오솜 단편을 보존한다36,37. 말단 복구 및 어댑터 결찰 반응을 별도의 써모사이클러에서 수행하였다. 이어서, 염색질 단백질을 프로테이나제 K로 분해하고, 어댑터 결찰된 DNA 단편을 크기 선택에 의한 2라운드의 PCR 전 Ampure 비드 클린업을 사용하여 Biomeck FX 상에서 정제하였다. KAPA PCR 키트(KAPA 카탈로그 #KK2502)를 사용하여 써모사이클러 상에서 PCR 농축 반응을 수행하였다. 원하지 않는 단백질과 자가 결찰된 어댑터를 제거하기 위해 크기 선별에 의한 2라운드의 PCR 후 Ampure 비드 클린업을 Biomeck FX에서 수행하였다. 애질런트 4200 테이프스테이션에서 AutoCUT&RUN 라이브러리의 크기 분포를 분석하였으며 큐빗 형광 측정계(Life Technologies)로 라이브러리 수율을 정량화하였다. 프레드 허친슨 암 연구 센터 GSR(Fred Hutchinson Cancer Research Center Genomics Shared Resource)에서 일루미나 HiSeq 2500 플랫폼에서 2레인 유동 세포에 대한 페어드-엔드 25x25 bp 서열 분석을 위해 등몰로 농도 레인마다 최대 24개의 바코드 AutoCUT&RUN 라이브러리를 풀링하였다.
항체
본 발명자들은 토끼 항-CTCF(1:100, Millipore 카탈로그 #07-729), 토끼 항-NPAT(1:100, Thermo Fisher 카탈로그 #PA5-66839), 토끼 항-H3K4me1(1:100, Abcam 카탈로그 #ab8895), 토끼 항-H3K4me2(1:100, Millipore 카탈로그 #07-030), 토끼 항-H3K4me3(1:100, Active Motif 카탈로그 #39159), 토끼 항-H3K27me3(1:100, Cell Signaling Tech 카탈로그 #9733S)을 사용하였다. pAMNase는 많은 마우스 항체에 효율적으로 결합하지 않기 때문에, 어댑터로서 토끼 항-마우스 IgG(1:100, Abcam, 카탈로그 #ab46540)를 사용하였다. H3K27ac는 H1 및 K562 세포에서 AutoCUT&RUN에 의해 프로파일링하고 VUMC-10 및 SU-DIPG-XIII 세포주에서 토끼 항-H3K27ac(1:50, Millipore 카탈로그 #MABE647)를 사용하여 수동으로 프로파일링하였다. H3K27ac는 토끼 항-H3K27ac(1: 100, Abcam 카탈로그 #ab45173)를 사용하여 VUMC-10 및 SU-DIPG-XIII 세포주 및 이종 이식편에서 AutoCUT&RUN에 의해 프로파일링하였다.
세포 배양
인간 K562 세포는 ATCC(미국 버지니아주 매너서스, 카탈로그 #CCL-243)에서 구입하여 공급자의 프로토콜에 따라 배양하였다. 인간 H1 hESC는 WiCell(카탈로그 #WA01-로트 #WB35186)로부터 구입하여 mTeSRTM1 보충제(STEMCELL Technologies 카탈로그 #85852)를 함유하는 mTeSRTM1 기본 배지(STEMCELL Technologies 카탈로그 #85851)에서 Matrigel™(Corning) 코팅 플레이트에서 배양하였다. 소아 DMG 세포주 VUMC-DIPG-10(Esther Hulleman, 네덜란드 암스테르담 VU 대학 메디컬 센터) 및 SU-DIPG-XIII(Michelle Monje, 미국 캘리포니아주 스탠포드 대학교)은 관련 기관으로부터 물질 이전 계약을 통해 획득하였다. NS-A Basal Medium with NS-A 증식 보충제(STEMCELL Technologies, 카탈로그 #05751), 100 U/mL의 페니실린/스트렙토마이신, 20ng/mL 표피 성장 인자(PeproTech, 카탈로그 #AF-100-15), 및 20 ng/mL 섬유 아세포 성장 인자(PeproTech, 카탈로그 #100-18B)가 보충된 NeuroCult NS-A 기본 배지에서 유지시켰다.
환자 유래 이종 이식편
모든 마우스 연구는 동물 관리 및 사용 위원회(Institute of Animal Care and Use Committee) 승인 프로토콜에 따라 수행하였다. NSG 마우스는 우리에서 사육하였고 종양 개시 전에 2~3개월까지 키웠다. 두개 내 이종 이식편은 람다의 2mm 측면 및 1mm 후방 위치에서 3 ㎕에 현탁된 100,000개 세포의 정위 주사에 의해 확립되었다. 증상 마우스를 안락사시키고 분석을 위해 이들의 종양을 절제하였다.
주석 달기 및 데이터 분석
하기 선택 사항을 이용한 Bowtie2 버전 2.2.5를 사용하여 페어드-엔드 리드를 정렬한다: --local --very-sensitive-local --no-unal --no-mixed --no-discordant --phred33 -I 10 -X 700. 또한, 스파이크-인 단편을 맵핑하기 위해, 스파이크-인 DNA와 실험 게놈의 크로스-맵핑을 피하기 위해 --no-overlap --no-dovetail 선택 사항을 사용한다. 베드툴 및 UCSC bedGraphToBigWig 프로그램을 사용하여 파일을 처리하였다.
다양한 샘플의 게놈 전체 분포 간의 상관관계를 조사하기 위해 게놈에 대해 500 bp의 빈(bin)을 생성하여 약 6백만 개의 항목이 있는 배열을 생성하였다. 각 빈의 리드를 계수하고 이들 빈 카운트의 log2 변환된 값을 사용하여 상이한 실험 사이의 피어슨 상관 점수를 결정하였다. 그런 다음 피어슨 점수 매트릭스에서 계층적 클러스터링을 수행하였다.
프로모터 주위의 히스톤 마크 프로파일의 분포를 조사하기 위해, build hg19에 대한 유전자의 참조 목록을 UCSC 테이블 브라우저(genome.ucsc.edu/cgi-bin/hgTables)에서 다운로드하여 추가 분석을 위한 유전자 전사 방향성에 따라 방향을 정했다. 미토콘드리아 게놈에 맵핑하는 유전자일때 서로 1 kb 이내의 TSS를 갖는 유전자를 제거하여 32,042개 TSS의 목록을 생성하였다. RNA 서열 분석 데이터는 H1 및 K562 세포(ENCSR537BCG 및 ENCSR000AEL)에 대한 ENCODE 프로젝트로부터 얻었다. featureCounts(http://bioinf.wehi.edu.au/featureCounts/)를 사용하여 RNA 리드를 계수하고 FPKM(Fragments Per Kilobase per Million mapped reads)으로 변환하고 유전자 발현 값으로 해당 TSS에 할당하였다. H1 세포에 대한 ATAC 서열 분석 데이터는 유전자 옴니버스 발현(GEO)(GSE85330)으로부터 얻고 bowtie2를 사용하여 hg19에 맵핑하였다. 미토콘드리아 DNA는 리드의 대략 50%를 차지하고 이 연구에서 제거되었다.
CREAM 알고리즘 훈련
프로모터에서 히스톤 변형 데이터를 RNA-seq 값에 맞추는 정확성을 보장하기 위해, 하나 초과의 프로모터를 갖는 유전자를 이전에 생성된 TSS 목록에서 제거하였다. 유전자 RPPH1 및 RMRP는 H1 세포에서 매우 높은 수준으로 발현되었고, 따라서 이상치인 것으로 간주하여 회귀 왜곡을 피하기 위해 제거하여 n = 12,805 유전자 목록을 남겼다.
C로 표시되는 각 히스톤 마크에 대해 이들 프로모터에 상대적인 CUT&RUN 신호를 할당하기 위해, TSS의 염기 쌍 리드 카운트 +/- 1kb는 점수 매겨지는 프로모터에 대한 서열 분석 깊이 및 조사된 총 프로모터 수 둘 모두에 정규화하였다. 사전 정규화는 항체들 사이의 서열 분석 깊이 및 감도 차이를 모두 설명하기 위한 것이고 후자의 정규화는 모델이 각 요소의 상대적 가중치를 변화시키지 않고 상이한 수의 시스 조절 요소에 적용될 수 있도록 포함된다. FPKM 값을 RNA-seq에 사용하였다.
RNA-seq 발현 값에 피팅된 히스톤 데이터의 선형 조합을 사용하여 선형 모델을 훈련시켰다:
Figure pct00020
, 여기서 Ci는 각 히스톤 변형에 대한 가중치이고, xi
Figure pct00021
로 나타내며, 여기서 C는 상기에 기술된 정규화된 염기쌍 카운트이고, α는 발현이 없는 유전자를 수용하기 위한 의사(pseudo) 카운트이다. RNA-seq 값은
Figure pct00022
와 유사하게 변환되었다. 대수 변환을 사용하여 데이터를 선형화하였다. CUT&RUN 데이터와 RNA-seq 사이의 회귀선을 최대화하는 각 히스톤 변형에 대한 의사 카운트와 가중치를 계산하기 위해 최소화 단계를 수행하였다.
히스톤 마크 H3K27ac, H3K27me3, 및 H3K4me2는 최소 중복 정보를 제공할 것으로 예상되었다. K562 세포에 최적화된 3가지 히스톤 마크 모델은 다음과 같이 설명된다:
Figure pct00023
이 방정식을 사용하여 모든 CREAM 점수를 생성하였다.
염색질 도메인 호출
H1 및 K562 세포의 전체 염색질 지형을 비교하기 위해, IgG CUT&RUN 대조군에 비해 영역이 농축된 사용자 지정 스크립트를 사용하여 염색질 도메인을 호출하였다. 마크들 중에서 농축된 영역을 비교하고 베드툴 교차를 사용하여 중첩을 확인하였다. 중첩하는 농축된 영역 내 염기쌍의 수에 의해 중첩 영역을 정량화하고 이를 사용하여 벤 다이어그램을 생성하였다.
벤 다이어그램
모든 벤 다이어그램은 화이트헤드 인스티튜트(Whitehead Institute)(barc.wi.mit.edu/tools/venn/)에서 공개적으로 이용 가능한 BaRC 웹 툴을 사용하여 생성하였다.
CREAM 점수를 사용한 세포 유형 특이적 프로모터 활성 계산
원시 프로모터 CREAM 점수는 일반적으로 -10에서 10 범위 내에 해당하며, 여기서 숫자가 작을수록 더 적은 전사 활성을 나타낸다. 상이한 세포 유형을 비교할 때 데이터의 이상치를 설명하기 위해 2 표준 편차 내에서 CREAM 점수는 z 정규화되었다. 음수 값과 0 값은 배수 변화를 계산하기 복잡하게 하므로 데이터는 가장 음수 값만큼 x 및 y 방향으로 이동시켰다. 다양한 세포 유형에 대한 프로모터 CREAM 점수 간의 배수 차이는 서로에 대해 역 로그 10 정규화된 CREAM 점수를 나누어서 계산하였다. 보존적 2배 컷오프를 사용하여 각각의 경우에 세포 유형 특이적 프로모터를 결정하였다(도 45B, 45E, 47A, 47B). 각 유전자 목록은 통계적으로 농축된 생물학적 과정을 식별하기 위해 유전자 온톨로지(geneontology.org/)에 의해 분류하였다.
프로모터 활성에 기초한 세포 유형 사이의 상대적인 유사성을 조사하기 위해 > 1kb 떨어진 모든 프로모터에 대한 CREAM 점수를 사용하여 배열을 생성하였고, 샘플의 각 쌍별 조합에 대해 스피어만 상관관계를 계산하였다. 스피어만 상관 값의 계층적 클러스터링을 사용하여 세포 유형 사이의 상대적인 유사성을 가시화하였다다.
AutoCUT&RUN 및 ATAC-seq 데이터에 대한 피크 호출
AutoCUT&RUN에 의해 프로파일링된 생물학적 복제물은 높은 상관관계가 있는 것으로 나타났으며(도 43B), 피크를 호출하기 전에 복제물을 결합시켰다. 툴 MACS2를 사용하여 피크를 호출하고 명령 라인에서 다음 명령을 사용하였다: "macs2 call peaks -t file -f BEDPE -n name -q 0.01 --keep-dup all -g 3.137e9". 0.01의 FDR 컷오프를 사용하였다.
CREAM 점수로부터 세포 유형별 DRE 활성 계산
인간 게놈에서 원위 시스 조절 요소 목록을 어셈블링하기 위해, 본 발명자들은 MACS2를 사용하여 'AutoCUT&RUN 및 ATAC-seq의 피크 호출' 방법 섹션에 기술된 동일한 플래그를 사용하여 각 샘플로부터 H3K4me2 프로파일의 피크를 호출하였다. TSS와 추정 인핸서를 구별하기 위해, 주석이 달린 TSS로부터 <2.5 kb 떨어진 피크를 제거하고, 이들 추정 인핸서 주변의 윈도우 +/- 1kb에 프로모터 활성을 예측하도록 훈련된 알고리즘을 사용하여 CREAM 점수를 할당하였다. 샘플 간의 프로모터 CREAM 점수를 비교하는 상관 매트릭스와 동일한 방식으로 샘플 간의 인핸서 CREAM 점수를 비교하는 상관 매트릭스를 생성하였다.
실시예 7에 대한 참고 문헌(이들 각각은 그 전문이 참고로 포함됨)
Figure pct00024
Figure pct00025
Figure pct00026
실시예 8
단일 세포 CUT&RUN에 의한 복합 조직의 후성 유전체 프로파일링
단일 세포 분석은 발생의 분자 특성화에 대한 주요한 접근법이 되고 있으며, 최근 단일 세포 바코드 기술의 발전은 복합 조직의 유전자 발현 및 DNA 접근성 프로파일링에 적용되었다. 그러나 RNA-seq는 조절 요소를 특성화하거나 맵핑할 수 없으며, ATAC-seq는 DNA 초(hyper) 접근 부위에 제한되며 ChIP-seq는 단일 세포 전략을 심각하게 추구하기에는 너무 비효율적이다. 그러나 CUT&RUN 항체 테더링된 뉴클레아제 방법은 효율성과 해상도면에서 ChIP-seq를 훨씬 뛰어 넘었다. 이것은 ITIS에도 적용된다. 본원에 개시된 바와 같이, 원래의 CUT&RUN 방법은 전체 조직 및 분류된 세포로 확장될 수 있으며, 단지 100개의 세포만으로 높은 데이터 품질을 달성하며, 본 발명자들은 고 처리량 자동화 파이프라인을 개발하였다.
단일 세포 기술의 최근 발전을 활용하기 위해 두 가지 별개의 단일 세포 CUT&RUN(scCUT&RUN) 전략이 개발되었다. 첫째, 상업적인 자동 나노웰 플레이트 시스템은 scCUT&RUN을 위해 수천 개의 온전한 세포를 배열, 바코드 및 증폭하기에 적합하다. 이 전략을 적용하기 위해, 테더링된 MNase에 의해 생성된 단편은 온전한 세포에서 서열 분석 어댑터에 결찰된 후 단일 세포 인덱싱을 위해 나노웰 플레이트에 배열한다. 둘째, 본 발명자들은 96 웰 플레이트 풀에서 세포의 조합 바코드를 얻기 위해 벌크 세포 집단의 스플릿-풀링을 적용할 것이다. 플레이트로부터 세포를 모아서 새로운 96 웰 플레이트로 재배열한 후에는 1 라운드 초과의 바코드 결찰, 리풀링 및 재배열이 뒤따를 것이다. 보편적인 단일 세포 바코드 전략에 CUT&RUN을 적용함으로써 염색질 프로파일링과 관련하여 단일 세포 프로파일링에 대한 고유한 장점을 비교할 수 있다. 평가를 위해, 인간 K562 세포 및 초파리 S2 세포는 선택된 히스톤 변형, RNA 폴리머라제 II 변형, 및 구성적 전사 인자에 대한 항체와 같이 사용된다. 예비 연구에서, 두 가지 전략 모두 개별 핵 내에 DNA 단편을 유지하면서 CUT&RUN 후에 일루미나 어댑터의 천연 원위치 결찰에 의해 수행하는 것으로 나타났다. 핵 완전성을 유지하면 개별 세포의 단편을 인덱싱할 수 있으며 고유한 일련의 바코드는 풀링된 서열 분석으로부터 단일 세포 지형을 구축한다.
동종 세포주에서 이종 세포 집단 및 복합 조직으로 이동하여, scCUT&RUN은 인간 CD34+ 1차 조혈 세포 및 초파리 고환에 적용된다. 우리의 기본 CUT&RUN 프로토콜을 수정하면 온전한 초파리 성충반(imaginal disc)과 뇌가 충분히 투과화되어 데이터 품질을 강하게 감소시킬 수 있는 조직 처리로 인한 손상을 피할 수 있다. FACS 단리는 높은 데이터 품질로 CUT&RUN로 이어질 수 있다. CD34+ 림프계 세포의 FACS 단리된 아집단, 및 온전하고 유동의 분류된 초파리 생식계 조직은 CUT&RUN 및 어댑터 결찰에 사용되며 이후 인덱싱을 위해 나노 분배 또는 스플릿-풀링 또는 둘 다가 사용된다. 이 두 시스템에서 조절 요소와 유전자 발현의 발생 변화를 평가할 수 있다.
절단의 염기쌍 정밀도를 활용하는 CUT&RUN 데이터를 위한 컴퓨터 툴을 개발하였다. 하나는 단편 길이를 사용하여 피크 정점을 호출하는 새로운 피크 호출 알고리즘과 절단의 염기쌍 해상도를 유지하기 위해 스무딩하지 않고 농축을 결정하는 경험적 절차를 최적화하고 평가하는 것이다. 두 번째 툴은 CUT&RUN 프로파일링으로 식별할 수 있는 뉴클레오솜 파괴의 일반적인 염색질 시그니처에 대한 우리의 최근의 설명을 기반으로 단편 길이 정보를 이용하여 인핸서 및 프로모터 활성을 예측하는 알고리즘의 개발일 것이다. 이들 방법은 DNA 단편 길이에 고유한 구조 정보를 이용할 수 있게 한다. 본 발명자들은 세포 유형을 구별하기 위해 RNA-seq에 널리 사용되는 단일 세포 차원 축소 툴을 사용하고, 인핸서 프로모터 유전자 조합을 식별하는 사용자 맞춤형 분석 소프트웨어를 개발할 것이다.
인간 유전자 조절 요소는 잘 정의되어 있지 않다. 인간 게놈에 의해 코딩된 단백질의 약 10%는 전사 인자(TF)이며, 이는 그들의 작용 부위에 서열-특이적 결합에 의해 유전자를 조절한다. 조절 요소에 전사 인자의 결합은 발생 및 중요한 생리적 과정을 제어하는 유전자 조절 체계의 정점에 있다. TF 결합의 비정상적인 조절은 많은 인간 질환의 주요 요인이며, TF 결합 부위(TFBS)를 편집하려는 현재의 노력은 질환의 중재를 위한 유망한 방법이다. 그러나 TFBS 맵핑의 현재 한계는 이러한 도구의 임상 적용을 위태롭게 할 수 있다. 예를 들어, 겸상 적혈구 빈혈 및 β-탈라세미아 환자를 치료하는 강력한 전략은 태아 감마 글로빈 유전자를 "재개"하여 결함이 있는 성인 베타 글로빈 발현으로 인한 증상을 완화시키는 것이다. 감마와 베타 글로빈 유전자 사이의 발생 전환을 담당하는 억제 전사 인자의 결합 부위를 편집하면 이를 달성할 수 있다. 최근까지 억제 TF BCL11A의 결합 부위의 확인은 TF 맵핑을 위한 보편적인 방법의 한계로 인해 실패하였다. 주요 결합 부위는 BCL11A의 CUT&RUN 맵핑으로 쉽게 식별되었다[1]; 이것은 즉시 가장 일반적인 인간 유전 질환 중 하나의 증상을 완화시키기 위한 편집 전략을 가능하게 하며, 실제로 이 결합 부위에서 돌연변이를 갖는 겸상 적혈구 질환 환자는 적혈구의 약화된 겸상 적혈구화를 나타낸다.
조절 요소의 ChIP-seq 맵핑의 한계. 염색질 면역 침전(ChIP)은 염색질 생물학에서 가장 널리 사용되는 기술 중 하나이다. 그러나 30년 이전에 처음 기술된 이후 ChIP의 수행 방식에는 거의 변화가 없었다[3]. 오히려, ChIP를 사용한 큰 성공은 판독 기술의 경이적인 개선에서 비롯되었다. 판독 플랫폼은 서던 블로팅에서 정량 PCR, 마이크로 어레이로, 지난 10년에 걸쳐 고 처리량 서열 분석(ChIP-seq)으로 진행되었다[4- 7]. CHIP-seq는 ENCODE 프로젝트만을 구성하는 2000건이 넘는 ChIP-seq 실험을 통해 게놈 서열을 이해하기 위한 기본 전략이 되었다.
이러한 대규모 투자에도 불구하고, ChIP에 사용되는 염색질 가교 결합 및 전단 전략에는 세 가지 주요 한계가 있다[8-12]. 1) 가교 결합은 에피토프 마스킹으로 이어져, 면역 침전 효율을 감소시키고 신호 대 잡음 비를 감소시킨다. 예를 들어, NIH PCRP(Protein Capture Reagents Program)은 736개의 인간 전사 인자에 대한 1406개의 고도로 검증된 면역 침전 및/또는 면역 블롯팅 등급 마우스 단클론 항체(mAb) 집합을 생성하였다[13]. 컨소시엄은 HuProt 인간 단백질 마이크로 어레이를 동족 표적에 대해 높은 특이성을 가진 mAb를 식별하기 위한 1차 검증 도구로서 사용하였다.
그럼에도, ENCODE 표준에 기반한 ChIP-seq에는 305 mAb의 샘플 중 50개만이(16%) 만족스러운 것으로 판단되었다. 2) 가교 결합은 염색질을 불용성으로 만들므로 ChIP는 일반적으로 초음파 처리를 사용하여 염색질을 전단한다. 초음파 처리는 200 ~ 300 bp의 염색질 단편을 생성하는 반면, 전형적인 염색질 결합 단백질의 풋프린트는 약 20 bp이므로 실제 결합 부위는 ChIP 맵핑으로부터 컴퓨터로 추론되어야 한다. 따라서 ChIP에 가장 널리 사용되는 프로토콜은 서열 분석 판독으로 가능한 염기쌍 해상도를 활용하는 것보다 훨씬 부족하다. 3) 초음파 처리에 의해 가교 결합된 염색질의 가용화는 극적으로 편향된다. ChIP이 면밀하게 평가되면, 많은“초 ChIP 가능”영역[8],“유령(phantom)”피크[10], 및 기타 거짓 양성 아티팩트가 일반적으로 발견된다[9, 12]. 간단히 말해, ChIP-seq는 낮은 신뢰성, 저조한 수율, 낮은 해상도, 및 낮은 정확도로 인해 방해받는다. 최신 버전의 ChIP는 엑소뉴클레아제 처리(ChIP-exo[4] 및 ChIP-nexus[7])로 해상도가 개선되었지만 이러한 방법은 번거롭고 비효율적이다. ChIP의 이러한 문제는 대체의 후성 유전체 맵핑 방법의 필요성을 강조한다.
CUT&RUN. 새로운 후성 유전체 프로파일링 전략의 개발에 의한 ChIP-seq의 한계[5, 14-16]. CUT&RUN을 사용하면, 인자 특이적 항체를 사용하여 마이크로코커스의 뉴클레아제(MNase)를 염색질에 테더링할 수 있다. 그런 다음 MNase를 활성화하여 TFBS 주변의 DNA를 절단하여 DNA를 페어드-엔드 DNA 서열 분석을 위한 상등액으로 방출한다(도 1A). CUT&RUN은 가용화 및 면역 침전 단계를 없애므로 ChIP에 비해 고유한 장점을 갖는다. 염색질 인자 및 DNA 절단에 결합하는 모든 단계가 온전한 핵에서 발생하고, 간단한 DNA 정제가 뒤따르기 때문에, CUT&RUN의 수율 및 특이성은 ChIP-seq보다 훨씬 높다. CUT&RUN은 간단하고 효율적이며 비용 효율적이며 ChIP-seq를 완전히 대체할 수 있다.
CUT&RUN의 범위 확장. 본 발명자들은 먼저 CUT&RUN을 사용하여 효모 및 인간 염색질 단백질 및 TF의 결합 부위를 확인하고 불용성 출아 효모 동원체의 히스톤 구성을 확인하고, 가교 결합 또는 결찰 없이 CTCF로 가교 결합된 부위를 정확하게 맵핑하였다[16]. 그 후 다른 주제를 조사하기 위해 CUT&RUN의 범위를 확장하였다. 여기에는 고등 진핵생물의 동원체, 염색질 구조 및 전사 조절이 포함된다: 1) CUT&RUN 후 염 분획에 의해, 인간 동원체는 매우 균질한 배열 내에서 상이한 α-부수체 이량체 단위에 내부 키네토코어 복합체의 예상치 못한 구조적 및 입체구조적 변이를 나타냄을 발견하였다[18]. 2) 또한 CUT&RUN을 사용하여 CENP-B에 대한 결합 부위가 없는 구대륙 원숭이의 α-부수체 단량체에서 기능적 동원체("CENP-B 파라독스" [19])를 식별하였다. 3) 전사에 의해 생성된 뉴클레오솜의 비대칭 언래핑을 설명함에 있어서, 본 발명자들은 조절 요소에서 CUT&RUN에 의해 생성된 단편을 사용하여 세포에서 뉴클레오솜 언래핑의 동일한 시그니처 및 심지어 무세포 인간 혈장 DNA가 뉴클레오솜 리모델링에 의해 생성될 수 있음을 보여준다[20]. 단편 위치와 길이를 기반으로 한 조절 요소 식별은 CUT&RUN의 주요 특징이다.
많은 BCL11A 항체가 수년에 걸쳐 ChIP-seq에 실패하여 태아에서 성인으로의 전환이 유전자 좌 조절 영역(LCR: Locus Control Region) 먼 상류에 위치한다는 모델로 이어졌다. 본 발명자들은 ChIP-seq에 실패한 항체에 의한 CUT&RUN을 사용하여 억제 인자가 단백질 결합 마이크로 어레이에 의해 식별한 동일한 TGACCA 모티프에 우선적으로 결합하고(도 54, 상단), 단지 21 bp 떨어진 태아 감마 글로빈 프로모터에서 2개 중 하나의 모티프에 결합한다(도 54, 중간)는 것을 보여주었다. 이 모티프는 태아 헤모글로빈의 유전성 지속의 양성 상태를 가진 개체에서 돌연변이되며, 본 발명자들은 계속하여 이 부위를 편집하고 BCL11A가 더 이상 결합되지 않음을 보임으로써 이 부위가 억제를 조절한다는 것을 입증하였다(도 54, 아래).
단일 세포에서 조절 요소를 식별하기 위해, 단일 세포 나노웰 인덱싱 및 스플릿-풀 조합 인덱싱의 두 가지 별개의 바코드 전략이 사용될 수 있으며, 둘 다 단일 세포 RNA-seq(scRNA-seq)에 대해 크게 성공적으로 사용되었다[28, 29].
CUT&RUN과 ChIP - seq의 비교. 본 발명자들은 1) 인자 결합 부위의 해상도와 2) 신호 대 잡음 비에 의해 후성 유전체 맵핑 방법을 비교한다. 신호 대 잡음 비는 특히 결합 부위의 정밀도와 회상을 결정하고 심층(deep) 서열 분석의 어떤 적용 범위가 필요한지와 이에 따른 실험 비용을 결정하는데 특히 중요하다. ChIP 방법에는 두 가지 주요 한계가 있다. 첫째, 가용성 염색질 제제를 생성하려면 전체 게놈을 염색질 단편으로 절단해야 하는데 이는 게놈 전체의 배경 잡음의 원인이 된다. 둘째,정의상 모든 ChIP 방법은 면역 침전에 의존하는데 여기서 염색질 입자의 가용성 및 회수율이 최적화되어야 한다. 이와 반대로, 개시된 CUT&RUN 기술은 온전한 핵에서 인자 결합 부위에만 DNA 절단을 표적화하는 것에 기초하기 때문에 ChIP와 직교한다[16]. 이 전략은 가용성 염색질 제제의 필요성을 제거하고, 절단 DNA를 서열 분석함으로써 결합 부위에서 특이적 신호를 제공한다.
본 발명자들은 신속하고 효율적인 용액 교환을 위해 콘카나발린 A(ConA) 코팅 자성 비드를 사용하여 세포 취급을 최적화하였다. 항체와 단백질 A-MNase를 에피토프가 보존되고 접근할 수 있는 천연의 고정되지 않은 핵에 결합시킨다. 입자의 양쪽에서 절단된 염색질 단편만이 상등액에 들어가기 때문에, 불용성 벌크 염색질의 나머지가 간단히 제거된다. 비특이적 DNA의 대다수가 남아 있기 때문에, CUT&RUN은 배경 수준이 매우 낮아서 ChIP에 비해 비용을 크게 감소시키며, 여기서 세포의 전체 가용화된 내용물은 항체에 노출된다. 스파이크-인 대조군은 이제 정규화의 선호되는 방법이므로[30], 본 발명자들은 CUT&RUN 데이터를 정규화하기 위한 간단한 전략을 구현하였다. 절단 반응 후 비드 결합된 온전한 세포 샘플에 작은 고정된 양의 단편화된 효모 DNA를 추가한다. 그런 다음 DNA를 함께 추출하고 라이브러리를 제조하고 서열 분석한다. 효모 게놈 어셈블리에 대한 리드 맵핑을 사용하여 실험 사이의 샘플 리드 카운트를 정규화한다.
본 발명자들은 CUT&RUN이 단순성, 분해능, 강건성, 효율성, 데이터 품질, 및 불용성 복합체에 대한 적용성 측면에서 ChIP-seq를 능가한다는 것을 발견한다[16]. CUT&RUN은 원위치 반응을 수행함으로써 달성되는 본질적으로 낮은 배경으로 인해 CIP-seq의 서열 분석 깊이의 약 1/10만 필요하다.
포유동물 게놈에서 CUT&RUN의 성능을 테스트하기 위해, 인간 K562 세포에서 CTCF를 맵핑하였다[2]. 절단 풋프린트는 양쪽에 주된 단일 염기쌍 절단 부위를 가지며 대략 300배의 분해 범위에서 일관되며(도 6C), 이는 CUT&RUN이 결합된 인자의 최소 풋프린트를 나타내는 제한된 분해에 도달함을 강조한다. [도 6A]에서, 하단 패널은 ENCODE ChIP-seq, ChIP-exo 및 CUT&RUN 데이터세트에서 샘플링된 천만 개의 단편에 대한 결과를 비교한다. 프로파일링은 CUT&RUN이 ENCODE ChIP-seq에서 감지된 피크와 일치하는 날카로운 피크를 정의함을 보여준다. ChIP-exo는 이러한 피크 중 일부를 감지하지만 많은 부위는 일반적으로 컴퓨터로 정제된 광범위한 리드 말단의 분포를 보인다. CUT&RUN은 주로 제한된 DNA 절단의 내재적인 낮은 배경으로 인해 다른 방법론보다 더 적은 서열 분석 깊이를 필요로 하였다. 이를 통해 데이터 품질이 향상되어 실험 비용이 크게 감소한다. CTCF 부위 측면에 있는 뉴클레오솜은 또한 특이적으로 방출되며, 독특한 크기의 DNA 단편으로 보인다.
낮은 세포 수를 이용한 CUT&RUN의 성능. 표준 ChIP-seq 프로토콜은 FACS 또는 절제 후, 또는 임상 설정에서 종종 얻어지는 낮은 세포 수에는 적합하지 않다. ATAC- seq를 사용하여 5000개 정도의 세포로 샘플을 프로파일링하였지만 ATAC-seq는 염색질의 접근 가능한 영역에 있는 TF의 비특이적 식별에 제한된다. 본 발명자들은 최근 CUT&RUN이 낮은 세포 수에 대해 높은 데이터 품질을 제공함을 보였다([2], 도 55). H3K27me3에 대해 6,000에서 100으로 줄어든 세포 수 감소로 인해 데이터 품질 손실이 발생하는 경우는 거의 없다. 대조적으로, 동일한 깊이에서 샘플링된 ENCODE 프로파일은 ChIP 고유의 높은 배경으로 인해 흐릿하다. 하이너(Hainer) 연구자들에 의해 시약 부피 및 라이브러리 제조 단계를 약간 변형함으로써 훨씬 더 적은 세포 수가 달성되었다(Hainer et al.) [23]. 따라서, CUT&RUN은 낮은 세포 수 적용을 위해 단백질-DNA 상호 작용의 표적화된 게놈 맵을 가능하게 한다.
벌크 세포 및 조직의 저비용 프로파일링을 위한 자동화 CUT&RUN. 본 발명자들은 CUT&RUN 프로토콜을 변형하여 '직접 결찰'로 부르며, 여기서 하상등액의 단백질-DNA 입자는 최종 연마 및 결찰에 사용되며, 이는 로봇에서 세포에서 라이브러리까지 모든 단계를 수행하는 것을 가능하게 하였다. 자동화 CUT&RUN을 위해 세포를 ConA 코팅 자성 비드와 혼합하고 투과화 세제(디기토닌) 및 항체를 2 mM EDTA와 함께 추가하여 활성 공정을 정지시킨다. 4℃에서 하룻밤 인큐베이션한 후 비드/세포 슬러리를 96 웰 플레이트의 웰로 옮긴다. CUT&RUN은 로봇에서 어댑터의 결찰 및 Ampure 비드 클린업을 통해 수행하며, 플레이트를 증폭을 위한 PCR 사이클러로 이동시킨 후 다음 최종 바코드 라이브러리의 세정을 위해 로봇으로 돌려보낸다. NIH 4D Nucleome 프로젝트를 위해 준비된 데이터세트의 예는 인간 배아 줄기세포(H1)의 한정적인 내배엽으로의 분화가 주요 DNA 복제 유전자인 POLD1에 대해 프로모터 뉴클레오솜의 H3K4me3가 H3K27me3으로 변형하는 전환을 수반한다는 것을 보여준다(도 56).
원위치 결찰을 이용한 CUT&RUN. sciRNA-seq(단일 세포 조합 인덱싱 RNA 서열 분석)[31] 및 Split-seq(스플릿-풀 결찰 기반 트랜스크립톰 서열 분석)[28]은 벌크 세포 또는 핵에서 RNA가 cDNA로 원위치 전환된 후 바코드 어댑터를 cDNA 말단에 결찰시키는 전략이다. cDNA 합성 및 결찰 중에 RNA의 누출을 방지하기 위해 세포를 고정한다. 그러나 본 발명자들은 고정 없이 DNA 누출을 방지하는 간단한 천연 절차를 개발하였다. 뉴클레오솜 코어 입자가 저염/고농도의 2가 양이온 조건에서 응집한다는 관찰[32]에 기초하여, 10 mM CaCl2와 3.5 mM HEPES pH 7.5에서 분해를 수행한다. 이러한 조건하에서, 단편은 상등액으로의 검출 가능한 방출 없이 3배 더 높은 속도로 절단된다(데이터 미제시). 자석 위에서 상등액을 제거하고 150 mM NaCl 및 20 mM EGTA를 함유하는 용출 완충액을 첨가하여 반응을 정지시키고, 이 용출 완충액은 작은 DNA 단편을 상등액에 방출하며 자동화 CUT&RUN에 사용되는 직접 말단 연마 및 어댑터 결찰과 상용 가능하다. 이 변형된 프로토콜을 사용하여 분해로부터 생성된 라이브러리는 시간 경과 데이터(도 57)에 대해 H3K27ac 피크의 일관성이 향상되었음을 보였는데, 아마도 분해 중 입자의 방출을 방지함으로써 이들이 접근 가능한 DNA를 아티팩트로 분해할 수 있는 핵 내에서 이들의 확산을 제거하였기 때문이다. 따라서 CUT&RUN의 간단한 변형은 데이터 품질을 향상시키고 고정 없이 나노웰 분배 및 스플릿-풀 바코드를 위해 준비한다.
이 변형된 CUT&RUN 프로토콜을 원위치 결찰에 적용하려면, 비드/세포에 20 mM EGTA, 10 mM MgCl2 및 3.5 mM HEPES를 함유하는 완충액을 첨가하여 반응을 정지시켰다. 이러한 조건하에서, 저염 및 높은 Mg++ 조건은 응집된 염색질 상태를 유지하는 한편, EGTA는 마그네슘보다 칼슘을 우선적으로 킬레이트하여 절단을 정지시킨다. 바 코딩된 일루미나 어댑터를 사용하여 말단 연마 및 결찰 시약을 첨가한 후, 총 DNA 추출, 일루미나 프라이머를 사용한 PCR 증폭, 및 서열 분석이 이어졌다. 대부분의 단편이 어댑터 이량체이지만, 그럼에도 H3K27ac CUT&RUN 실험으로 전체 게놈 패턴을 확인하기에 맵핑된 리드가 충분하였음을 확인하였다(도 58A). 이 실험에서 약 300,000개의 단편만으로, 프로파일은 동일한 Abcam ab4729 항체를 사용하여 30배(약 9백만)를 이용한 CUT&RUN 및 130배(~ 4천만) 이상의 단편을 이용한 ENCODE ChIP-seq의 프로파일과 유사하며, 이는 순위가 정해진 H3K27ac CUT&RUN 피크와 근접한 일치로 확인되었다(도 58B). 이러한 결과는 원위치 어댑터 결찰이 작동하여 scCUT&RUN 인덱싱 전략을 적용할 준비를 한다는 것을 보여준다.
원위치 결찰 최적화. 이 최초의 원위치 결찰 실험으로부터 우리의 예비 개념 증명 결과는 유망하지만, 평활 말단 결찰의 효율은 매우 낮았으며, 라이브러리 제조는 어댑터-이량체에 의해 좌우된다. 하나의 가능한 해결책은 추가적인 Ampure 비드 선별 단계를 포함하는 것이지만, 이것은 전체 수율을 감소시킬 것이다. 또 다른 해결책은 A-꼬리 형성 단계를 추가하고 돌출된 3' T 염기가 있는 어댑터를 사용하는 것이다. 또한, 본 발명자들은 루프에 데옥시-우라실이 있는 헤어핀 어댑터를 합성하여 어댑터 이량체의 형성을 방지할 수 있다. 결찰 처리 후, 우라실-N-데글리코실라제에 의한 분해는 나노웰에서의 바코드 증폭 또는 스플릿-풀링의 첫 번째 라운드에 적합한 돌출 말단을 형성한다. 또 다른 해결책은 결찰 중에 결합할 때마다 평활 말단 어댑터를 재생할 제한 효소를 포함하는 것이다.
나노웰 바코드. 원래 올리고가 내장된 RNA seq를 위해 설계된 다카라 SMARTer ICELL8 단일 세포 시스템은 최근 ATAC-seq에 적용되었으며[33], 본 발명자들은 염색질 프로파일링에 대한 유사한 인덱싱 전략을 따를 것이다. CUT&RUN은 어댑터 결찰 단계를 통해 대량으로 수행되며 자성 비드의 사용을 생략한다. 세척 사이에서 부드럽게 원심분리하면서 디기토닌 투과화된 세포를 사용하는 우리의 원래의 프로토콜을 따를 것이며[26], 여기서 느슨한 세포 펠렛은 부드러운 피펫팅 및/또는 볼텍싱에 의해 단일 세포로 분산된다. 단일 세포를 ICELL8 칩의 개별 나노웰에 분배하고 영상화하며, 각각의 나노웰을 72개의 상이한 바코드가 있는 일루미나 i5 프라이머를 행으로 분배하고 72개의 상이한 i7 프라이머를 열로 분배함으로써 인덱싱하며, 이로써 플레이트에서 모두 5184개의 나노웰을 구별한다. ICELL8 시스템 이미징 스테이션은 단일 세포를 가진 웰을 자동으로 식별하고, 서열 분석을 위해 세포 형태를 분류한다. 전형적으로 ICELL8 칩의 5184개 나노웰 중 약 1/3은 단일 세포를 수용하므로, 플레이트의 영상화는 재료에 대해 세포당 약 $1의 전체 비용으로 접종된 나노웰만 사용하도록 한다. 나노웰 플레이트는 밀봉될 것이며, 플레이트는 표준 CUT&RUN을 위해 수행된 바와 같이 14 사이클의 PCR에 적용된다. 그런 다음 바코드 및 증폭 단편을 수동 DNA 추출을 위해 풀링할 것이다.
단일 세포 바코드를 통한 판독에 충분한 Ampure 비드 클린업 및 페어드-엔드 DNA 서열 분석. 본 발명자들은 풀링된 샘플의 1억 5천만 페어드-엔드 단편 서열 또는 세포당 대략 100,000개의 리드를 기대한다. 수득량을 기초로 하여, 본 발명자들은 풍부한 히스톤 변형을 위한 낮은 세포 수 실험에서 달성하였다(예를 들어, 도 55).
스플릿 -풀 결찰 . 배열 기반 조합 바코드는 특히 수천 개의 세포를 심층 프로파일링하는데 적합하다. 그러나 스플릿-풀링은 특수한 장비를 필요로 하지 않으며 간단한 수동 방법을 사용하여 수행될 수 있으므로, 이 빠르게 개선되는 부류의 단일 세포 전략은 다양한 직접적인 단일 세포 전략과 아직 치열하게 경쟁해야 한다. 본 발명자들은 기술된 바[28]와 유사한 스플릿-풀링 전략을 따를 것이다. 간단히, 본 발명자들은 저염 높은 2가 양이온 조건에서 대량으로 CUT&RUN을 수행할 것이다. 본 발명자들은 5' 말단에서 평활하며 3' 말단에서 점착성 오버행을 가진 범용 링커를 사용하여 원위치 결찰을 수행할 것이다. 링커의 5' 말단은 CUT&RUN에 의해 생성된 연마된 DNA 단편 말단에 결찰될 것이지만, 3' 점착성 말단은 수 태그라고 하는 96개의 고유한 태그의 5' 말단에 상보적일 것이다. 이 홀수 태그의 다른 말단은 짝수 태그라고 하는 상이한 세트의 96개의 고유한 태그의 5' 말단에 상보적일 것이다. 세포는 풀링되고 96 웰 플레이트에 반복적으로 분할될 것이다. 각 라운드에서, 96개의 웰 각각에 분포된 고유한 태그는 DNA 말단에 결찰될 것이다. 점착성 말단 결찰은 첫 번째 단계에서 수행된 평활 말단 결찰보다 효율적이므로 대부분 또는 모든 포착된 CUT&RUN 말단은 효과적으로 바코드되어야 한다. 각 세포가 고유한 일련의 태그(바코드)를 갖도록 하기 위해, 동일한 세트의 홀수 및 짝수 태그를 재사용하여 여러 개의 스플릿-풀링 주기를 실행할 것이다. 마지막으로, 모든 세포가 풀링되고 일루미나 어댑터를 함유한 터미널 태그가 결찰될 것이다. 풀링된 세포의 총 DNA 추출에 이어 라이브러리 제조 및 Ampure 비드 클린업이 수행된다. 이 시점에서 각 세포에는 이미 고유한 바코드가 있으므로 다른 인덱스 프라이머를 사용할 필요가 없다. 첨가된 바코드의 길이에 따라 100 x 100 bp 이상으로 리드 쌍이 생성될 것이다.
세포주에 scCUT &RUN을 적용. 복합 조직에 scCUT&RUN을 적용하기 위한 전제 조건으로, 단일 세포 전략을 ENCODE Tier 1 인간 K562 세포와 modENCODE 초파리 S2 세포에 모두 적용할 것이다. 인간과 초파리 세포 모두에 대해 선택된 히스톤 변형(H3K4me1, H3K27ac, H3K27me3 및 H3K36me3) 및 RNA 폴리머라제 II(CTD-Ser5P 및 CTD-Ser2P), 및 인간을 위한 CTCF와 초파리를 위한 GAGA 인자와 같은 풍부한 구성적 TF에 대한 항체를 사용할 것이다. K562 및 S2는 균일한 세포주이며, 유전자 발현, 염색질 지형, 및 활성 인핸서의 기능적 맵핑에 대해 광범위하게 특성화되어 있다. 각 항체는 우리의 대량 CUT&RUN 실험에서 검증되었다. 본 발명자들은 원위치 결찰의 효율이 개별 세포에서의 특징의 적용 범위를 결정할 것으로 예상하고, 단일 세포 프로파일을 벌크 프로파일과 비교하여 우리의 세포별 적용 범위, 세포당 요구되는 최적의 서열 분석 깊이, 그리고 배열된 프로파일링 대 스플릿-풀링 전략의 효과를 결정할 것이다. 단일 세포 플랫폼에서 에피토프의 조합을 프로파일하는 것을 이용하여 프로모터-인핸서-유전자 조합을 식별할 것이다. 여기에는 단일 인자 항체 및 쌍으로 CUT&RUN을 수행하는 단계, 및 개별 세포에서 두 개의 에피토프의 동시성에 의해 상호 작용하는 조절 요소를 정의하는 단계가 포함될 것이다.
예비 연구에 사용된 저염/고농도의 2가 양이온 하에서 핵 및 염색질 완전성이 유지되더라도, 이후의 조작은 손상을 유발할 수 있지만 새로운 말단은 인덱싱 어댑터와 상용 가능하지 않을 것이다. 예비 연구에서 원위치 결찰의 낮은 효율은 평활 말단 결찰 중에 프라이머 이량체의 우세에 기인한 것이며, 제안된 바와 같이 변형된 어댑터를 사용하면 효율성이 크게 향상될 것으로 기대된다. 효율이 높으면 대략 1000개의 세포만으로도 개별 세포에서 수만 개의 조절 요소를 식별하고 세포 유형을 효율적으로 클러스터링하기에 충분한 적용 범위가 될 것이기 때문에 본 발명자들은 나노웰 전략을 선호할 것이다. 적용 범위가 높으면 더 적은 세포가 필요할 것이며, 그러면 단일 칩에서 최대 8개의 상이한 항체 또는 조직 샘플을 분석할 수 있을 것으로 기대된다. 그러나 결찰 효율이 낮으면, 세포 유형을 러스터링 단계는 더 많은 개별 세포를 필요로 할 것이며, 각 스플릿-풀 라운드는 고유 바코드의 수에 96을 곱하기 때문에 스플릿-풀 바코드가 더 매력적이다. 20배 더 작은 크기의 초파리 게놈의 경우 각 세포에서 비례적으로 더 적은 DNA 단편은 동일한 양의 서열 분석으로 더 많은 세포를 프로파일링할 수 있게 하여 초파리에 대한 스플릿-풀 바코드를 선호한다.
온전한 파리 성충반에서의 CUT&RUN.
CUT&RUN의 효율성으로 조직 및 단리된 세포 유형에서 염색질 프로파일링이 가능하다. 사소한 변형으로, 본 발명자들은 초파리 유충에서 온전한 조직을 처리하거나 FACS 분류 세포를 처리하는데 우리의 세포주 프로토콜을 적용하였다. 3령 후기 유충에서 유충의 뇌와 날개의 성충반을 절제하고(도 59A), 고정되지 않은 조직을 디기토닌으로 투과화한 다음 온전한 조직을 ConA 비드로 가볍게 코팅하였다. 이 단계를 통해 완충액을 변경하여 시약이 조직에 간단히 흡수될 수 있으며 모든 조직 취급은 완충액 교환을 위해 자석을 사용하여 튜브에서 수행된다. 차단, 항체 및 pA-MNase 테더링 단계에서 염색질의 분해를 방지하기 위해 2 mM EDTA와 5 mM 스페르미딘을 포함시켰으며, 조직과 DNA는 2일의 절차를 통해 온전하게 남아 있음을 발견하였다. 본 발명자들은 10마리의 유충의 날개 성충반이 ~ 60만 개의 날개 디스크 세포(뇌에서 더 많이)를 제공하여, 높은 데이터 품질로 히스톤 변형 및 염색질 인자를 프로파일링하기에 충분한 재료를 제공한다고 추정한다. 본 발명자들은 처음으로 폴리콤 억제된 영역을 비교하기 위해 유충 뇌와 날개 디스크에서 H3K27me3을 프로파일링하였다. 대표 영역을 나타낸다(도 59C). ANTP-복합체에는 초파리의 여러 세그먼트 정체성 호메오박스 유전자가 포함되어 있으며, 이러한 유전자는 폴리콤 억제에 의해 부분적으로 조절된다. 안테나페디아(Antp: Antennapedia) 유전자는 유충 뇌의 대부분의 세포에서 침묵하되 날개 성충반의 모든 세포에서 발현된다. H3K27me3 패턴에서의 상응하는 변화는 Antp 유전자에 걸쳐 명백하며, 이는 뇌 샘플에서 H3K27 트리메틸화되지만 날개 조직에서는 거의 메틸화되지 않았다. ANTP-복합체 외부의 낮은 배경과 H3K27 트리메틸화된 영역의 높은 신호는 조직 간 염색질 상태가 다른 영역을 식별하는 것을 간단하게 만든다. 유사하게, 본 발명자들은 세포 배양 샘플에서와 유사한 데이터 품질로 H3K27Ac, H3K27me2 및 폴리콤을 포함한 조직 샘플에서 다중 히스톤 변형 및 염색질 인자를 프로파일링하여, 소량의 온전한 재료로부터 염색질 상태를 완전히 특성화할 수 있음을 입증하였다. 이는 조직이 제한적인 돌연변이 동물의 프로파일링에 특히 유용하다.
온전한 조직은 다양한 세포 유형을 함유한다. CUT&RUN과 FACS 단리를 결합하여 날개 성충반으로부터의 하위 세트의 세포를 프로파일링하였다. 흔적 유전자의 특성화된 인핸서를 사용하여 날개 성충반의 증식 주머니에서 GFP를 생산한 후(도 59B), 본 발명자들이 세포 표면상 당단백질을 분해하지 않는다고 발견한 Accutase(Innovative Cell Technologies, Inc)를 사용하여 세포를 분리하였다. 이를 통해 FACS 정렬 후 세포를 ConA 비드에 결합시키고, 표준 벌크 CUT&RUN 프로토콜로 세포를 처리할 수 있었다. H3K27me3 프로파일링에 충분한 FACS 20분 후 입력 재료의 9%를 나타내는 약 10,000개의 GFP 양성 세포를 회수하며, 결과는 게놈 전체의 온전한 날개 성충반과 유사하다. 흔적 유전자 자체는 세포 배양 및 유충 뇌 샘플에서 H3K27me3 도메인에 포함되어 있다(도 59D). 날개 성충반 샘플에서 H3K27me3이 감소한 것처럼 보이지만, 이 조직은 흔적 발현이 있거나 없는 세포의 혼합물이다. 대조적으로, FACS 단리된 흔적 발현 세포는 흔적 유전자에 걸쳐 낮은 H3K27me3 메틸화를 나타낸다. 이러한 결과는 표준 프로토콜을 약간 변형하여 온전한 조직 또는 FACS 단리된 비고정 세포에서 정확하게 세포를 프로파일링할 수 있음을 확인해준다. 조직이 자기적으로 조작되므로 전체 조직 CUT&RUN은 어댑터 결찰 및 세정을 통해 로봇으로 쉽게 수행할 수 있으며, 이어서 바로 분리 및 스플릿-풀 바코드 결찰을 수행할 수 있다.
스플릿 - 풀링을 통한 1차 세포 및 온전한 조직에서의 scCUT &RUN. 본 발명자들은 scCUT&RUN 프로토콜을 개발하기 위해, CUT&RUN을 단일 세포 수준에서 광범위하게 특성화되는 두 가지 모델 시스템에 적용할 것이다. 첫째, 인간 조혈 세포에서 히스톤 변형 및 염색질 인자를 프로파일링하고, 이들 세포의 전사 다양성과 단일 세포 염색질 프로파일링을 비교할 것이다. 둘째, 생식계 줄기세포에서 감수분열 후 정자까지의 전체 발생 서열이 존재하는 초파리 고환에서 염색질을 프로파일링할 것이다. 인간에 비해 20배 더 작은 게놈 크기의 초파리는 또한 이 기술 개발 프로젝트의 서열 분석 비용을 감소시킨다. 이 두 시스템은 세포 상태에 대한 염색체 프로파일링의 정확성을 평가하고 단일 세포 염색질 프로파일링을 클러스터링하기 위한 컴퓨터 프레임 워크를 개발하는데 사용된다.
인간 조혈 세포에서의 scCUT&RUN. 골수로부터의 다능성 CD34+ 세포는 표면 마커로 구별되는 10가지 범주의 혈액 세포로 분화된다. 이들 세포 유형의 전사 다양성은 벌크, FACS-단리된 세포 및 단일 세포 앙상블에서 광범위하게 특성화되었다. 이 시스템을 사용하여 히스톤 변형의 scCUT&RUN 프로파일링이 CD34+ 세포 집단의 다양성을 정확하게 재현하는 방법을 평가할 것이다. 건강한 개인의 골수로부터 FACS 단리된 인간 CD34+ 1차 조혈 세포를 얻는다. 나노웰에 분배하고 개별 세포를 인덱싱하기 위한 순차적 스플릿-풀링 단계를 위해 CUT&RUN 및 어댑터 결찰 단계를 대량으로 수행할 것이다.
CD34+ 세포에서 RNAPII(CTD-S5P 및 CTD-S2P)의 2가지 변형, 3가지의 히스톤 변형(H3K27Ac, H3K27me3 및 H3K4me1) 및 2개의 염색질 인자(CTCF 및 조혈 TF PU.1)를 프로파일링할 것이다. RNAPII의 프로파일은 작동 준비된 유전자 프로모터 및 활성인 유전자 프로모터를 식별할 것이고, H3K27Ac 및 H3K4me1은 활성 프로모터 및 인핸서, 및 폴리콤 억제된 염색질에서 H3K27me3을 보고할 것이다. 이러한 프로파일은 1000~2000개의 세포의 전사 상태를 식별하는데 사용될 것이다. 모든 데이터를 결합하여 1억 개의 페어드-엔드 리드는 CD34+ 세포에서 벌크 염색질 지형을 재현해야 하고, 본 발명자들은 이러한 프로파일의 깊이를 표준 CUT&RUN 프로파일링과 비교하여 효율성을 평가할 것이다. 그런 다음 개별 바코드 세포의 유전자 프로모터에서 단편 적용 범위를 검사할 것이다. 효율적인 회수를 통해 10,000 ~ 100,000개의 독립 단편이 한 번의 세포 실행에서 특징들을 포함해야 한다. 더 많은 세포를 처리하여 각 CD34+ 서브 타입으로부터의 단편을 완전히 포획할 수 있다. 많은 유전자에 걸친 희박한 적용 범위조차도 세포 유형을 클러스터링하고 구별하기에 충분하다. 본 발명자들은 scCUT&RUN 데이터세트에서 유래된 클러스터를 동일한 10가지 세포 타입의 단일 세포 ATAC-seq 및 RNA-seq 데이터세트에서 유래된 클러스터와 비교하여, 필수적인 세포 수 및 서열 분석 깊이를 벤치마킹하여 세포 유형을 엄격하게 구별할 것이다[33]. H3K27Ac는 또한 인핸서에서 풍부하므로 프로모터와 거리가 먼 단편은 부위를 잠정적으로 식별한다.
파리 고환에서의 scCUT&RUN. 초파리 고환을 고형 조직이 있는 단일 세포 CUT&RUN의 모델 시스템으로 사용할 것이다. 초파리 난소와 고환은 가장 큰 성체 기관이며 복부에서 쉽게 절제된다. 그러나 난소는 과배수체 너스(nurse) 세포가 두드러지는 반면, 고환은 체세포 상피 세포, 체세포 낭포 세포, 및 생식계 세포로 구성된다. 이 생식계 집단에는 6~10가지 생식계 줄기세포, 유사분열로 증식하는 생식원 세포(gonial cell), 성장하는 1차 정모세포, 감수분열 세포, 및 분화 정자 세포가 있는 정자 발생의 모든 발달 단계가 포함된다. 따라서, 고환의 단일 세포 프로파일링은 생식계 발생의 염색질 서열을 클러스터링하고 순서화할 수 있게 할 것이다. 이러한 모든 단계는 염색되지 않은 핵의 현미경법에 의해 쉽게 구별되며, 이는 나노 웰의 영상화가 별개의 세포 유형에 프로파일을 할당하는데 유용할 것이기 때문에 배열 기반 인덱싱을 선호하는 한 가지 상황이다. 본 발명자들은 생식계 특이적 유전자 발현 프로그램의 활성화와 조절에서 염색체 전체의 변화를 추적할 것이다. 초파리 정자 형성은 고환 특이적 TBP 관련 인자(tTAF)를 사용하여 정자 형성 단계에서 출발하는 선택적인 유전자 프로모터를 광범위하게 활성화 및 조절한다. 본 발명자들은 이용 가능한 항체를 사용하여 TAF5(체세포 및 초기 생식계 TFIID 성분 [36]), 주요 정모 세포 변이체 캐논볼(Can)[37], 그리고 H3K27Ac 및 H3K27me3 히스톤 변형을 프로파일링할 것이다. TAF5와 캐논볼 프로파일링은 히스톤 변형 프로파일링으로부터 단일 세포 클러스터링을 알아내는데 사용될 것인데, 선택적인 프로모터에서 이들 tTAF의 결합 부위가 후기 생식계 세포와 비교하여 체세포와 초기 생식계 세포 사이에서 고유할 것이기 때문이다. 마지막으로, 소량의 유전자 집합이 감수 분열 후 세포에서만 발현되는 것으로 알려져 있으며[38], 이들 유전자의 리드는 이들 세포로부터 바코드를 클러스터링하는데 사용될 것이다.
정자 형성 중에 두 가지 주요 염색체 전체 리모델링 사건이 있다. 첫째, 성장하는 1차 정모 세포에서 메가베이스 크기의 Y 염색체 유전자가 활성화되고, 전체 X 염색체가 때 이르게 비활성화되었다는 약간의 증거가 있다. 둘째, 대부분의 코어 히스톤은 분화하는 정자 세포에서 염색질로부터 제거되고, 프로타민 및 정자 특이적 비-히스톤 단백질로 대체된다. 포유동물의 정자 형성에서, X 염색체 불활성화 및 히스톤/프로타민 치환은 H3.3 및 H2A.Z 히스톤 변이체에 의한 염색질 리모델링을 포함하므로, 본 발명자들은 이들 보존된 변이체를 프로파일링할 것이다.
초파리 고환. 우리의 예비 세포학적 특성화는 초파리 H2A.Z 동족체가 1차 정모 세포의 X 염색체에 적당히 농축된다는 것을 보여주며, 이는 때 이른 X 불활성화가 초파리에서도 이 변이를 포함할 수 있다는 생각과 일치한다(데이터 미제시). 생식계 염색체 불활성화 중에 히스톤 변이체가 X 염색체 전체에 걸쳐 또는 특정 부위 또는 유전자에서 농축되는 지의 여부는 어떠한 시스템에서도 알려져 있지 않고 있다; 단일 세포 염색질 프로파일링이 이를 해결한다.
피크 호출의 기초로서 CUT&RUN 단편 길이. 현재, 특정 유전자 좌에서 후성 유전자 데이터의 농축 분석은 전형적으로 특정 표적에 대해 보고된 역할(예를 들어, 침묵에서 H3K27me3 또는 활성 유전자 발현에서 H3K4me3)에 기초한 추론, 또는 관심 영역에서 다중 프로파일의 중첩 분석을 포함한다. 10년이 넘는 후성 유전자 데이터 분석에서 거의 변화가 없었던 이 접근 방식은 대량 집단에서도 구현하기 어려운 표적 개선 및 매개변수 최적화(예를 들어, [14])를 위한 복잡한 방법이 필요하다. 따라서 표준 분석 패러다임을 개선하기 위해 CUT&RUN에서 얻은 고유 정보를 활용하고자 하였다. CIP-seq 스타일의 게놈 전체 후성 유전체 프로파일을 생성하는 것 외에도 MNase-seq와 유사하지만 특정 표적 에피토프에 대한 염기쌍 분해능으로 서열 분석된 단편 길이에 대한 정보를 보존한다. 단편 길이는 단일 분자 수준에서 단백질 결합의 성질을 밝힐 수 있다; 예를 들어, TF는 작은 풋프린트를 보호하고 종종 80 bp 미만의 짧은 단편을 남겨두는 한편, 뉴클레오솜은 두 번의 랩(wrap)에서 약 150 bp의 DNA를 보호한다. 본 연구실은 과거 MNase-seq 데이터의 단편 길이 정보를 사용하여 원위 조절 요소에서 TF 결합, 및 활성 전사 부위에서 부분적으로 파괴된 뉴클레오솜의 존재를 추정하였다[20, 39]. 이로부터 영감을 받아, 본 발명자들은 염기쌍 분해능에서 CUT&RUN 피크 내에서 조절 활성의 부위를 예측하기 위해 단편 크기를 사용하는 계산 방법을 개발하였다. V 플롯 방법과 유사하게 예측된 단편 크기가 최소화되는 피크 내에서 단일 염기쌍을 식별하기 위해 피크 중심 대 단편 길이에서 단편 오프셋의 분포에 대한 뢰스 회귀 분석을 사용하였으며[39], 이는 결합 또는 조절 활성의 가장 높은 가능성을 나타냈다(도 60A). K562 세포에서 CTCF를 표적화한 실험에서 CUT&RUN 데이터에 우리의 방법을 적용했을 때, 두 가지 주요 모집단에 해당하는 정점을 발견하였다: CTCF 결합 모티프와 중첩이 고도로 농축된 작은 단편 모집단, 및 전형적으로 뉴클레오솜을 선호하는 GC 풍부한 서열과 중첩되는 더 큰 단편 모집단[40](도 60B). 이러한 결과는 작은 DNA 단편의 정점이 CTCF 결합 부위를 보다 정확하게 정의하여 이들을 절단된 영역 내의 측면에 있는 뉴클레오솜과 구별함을 보여준다. 따라서, 단편 크기 계층화는 인자가 결합된 부위를 고해상도로 식별하는 효과적인 방법이다.
CUT&RUN 단편 길이를 사용하여 조절 요소 식별
CUT&RUN 데이터에 대한 피크 호출 알고리즘의 비교. 후성 유전체 데이터를 처리하기 위한 기존의 분석 소프트웨어 패키지는 특히 ChIP-seq를 염두에 두고 작성되었으므로 높은 잡음 데이터에서 신호를 추출하도록 설계되어 있다. 이러한 방법은 일반적으로 게놈에서 배경 리드 카운트를 추정한 후 직접 결합의 유일한 지표로서 더 높은 신호를 사용한다. CUT&RUN은 배경이 매우 낮기 때문에 이러한 접근 방식은 피크 호출에 적합하지 않다. 그러나 CUT&RUN 데이터에는 ChIP-seq에 부족한 DNA 단편 크기 정보가 포함되어 있는데, 그 이유는 TF 결합된 부위가 일반적으로 짧은 DNA 단편으로서 나타나고 CUT&RUN에서 또한 방출되는 측면에 위치한 뉴클레오솜은 ~ 150 bp 단편으로 나타나기 때문이다. 본 발명자들은 일반적인 피크 호출 알고리즘과 우리의 단편 크기 기반 알고리즘을 직접 비교하여 성능을 결정하고 단편 크기 정보를 사용하는 효과적인 알고리즘을 개발할 것이다. ENCODE 프로젝트의 표준으로 사용되는 두 가지 주요 피크 호출 패키지인 MACS2 및 SPP 알고리즘을 테스트할 것이다. 먼저 대량 실험에서 CTCF에 CUT&RUN 데이터를 사용할 것이다. CTCF에는 잘 정의된 DNA 결합 모티프가 있으며, 이는 각 알고리즘의 재호출 및 해상도를 테스트하기 위한 "최적 표준"을 제공한다. 각 알고리즘의 감도를 결정하기 위해 각 알고리즘별로 CTCF 모티프와 중첩되는 감지된 피크 수를 비교할 것이다. 해상도를 결정하기 위해 각각 피크 정점을 갖는 CTCF 모티프까지의 거리에 대한 누적 분포 함수(CDF: Cumulative Distribution Function) 곡선을 구성할 것이다. 단편 크기 기반의 결합 부위 검출에 의한 상기한 우리의 예비 연구를 통해 우리의 방법이 CUT&RUN 데이터에 대해 현재 피크 호출보다 성능이 뛰어나다고 확신한다.
scCUT &RUN 데이터를 이용한 단편 길이 기반 피크 호출. 단일 세포 서열 분석 기술은 샘플 내 비균질성에 대한 중요한 정보를 전달할 수 있다. 이것은 t-분포 확률적 임베딩(tSNE: Distributed Stochastic Neighbor Embedding)[31] 및 UMAP(Uniform Manifold Approximation and Projection)[41]과 같은 차원 축소 전략을 통해 달성된다. 이러한 클러스터링 방법은 세포 조건을 구별하기 위해 많은 디지털 차원(예를 들어, 단일 세포의 유전자 표현 값)을 사용한다. 세포 유형 사이의 발생 궤적 또는 전이 상태는 의사 시간적(pseudotemporal) 클러스터 구성에 의해 추론될 수 있다. 수천 개의 차원을 제공하는 scRNA-seq 데이터를 사용하는 이러한 방법은 강건하므로 수백 개의 개별 세포에서 차원을 거의 샘플링하지 않아도 클러스터링을 유도하기에 충분하다. 그러나 scRNA-seq는 정량적 발현 척도로 리드 카운트를 사용하지만, 데이터세트는 풍부한 전사체에 의해 두드러지고 높은 잡음에 의해 제한되며, 이는 PCR 증폭 아티팩트를 제거하기 위한 정교한 방법이 필요하다. 더 최근에는 scATAC-seq에 의해 단일 세포에서 측정된 DNA 접근성이 CD34+ 림프계 세포를 분류하는데 사용되었다[42]. 이 방법에서 추정 조절 요소를 식별할 수 있지만 각 특정 부위에서 염색질 인자가 결합하는 것은 알려져 있지 않으며 scATAC-seq는 DNA 모티프를 사용하여 부위에서 인자를 추측한다. 조절 요소에서의 인자 결합에 대한 직접적인 조사는 세포 유형의 조절 방법을 이해하기 위해 조절 요소 및 결정적 TF의 결합에서의 변화에 기초하여 세포 유형의 궤적을 생성할 것이다. 그러나 ChIP 기반 프로파일링에는 단일 세포에 대한 감도가 부족하다. 더욱이, 세포에서 적은 복제본 수의 DNA 분자(G1 기 이배체 세포에서 2개의 복제본)로 인해, 모든 단일 세포 후성 유전체 프로파일링 기술은 각 차원에 대한 이진값에 의해 제한된다.
본 발명자들은 단일 세포 후성 유전체 프로파일링 분석에 두 가지 개선을 제안한다. 본 발명자들은 1) CUT&RUN의 감도, 및 2) 단일 세포 분석을 위한 유익한 차원으로 불리는 부위의 수를 최대화하기 위해 단편 크기 정보를 사용할 것이다. 하이너(Hainer) 연구자들[23]은 최근 scCUT&RUN 감도가 scATAC-seq보다 1자리수 더 높은 것으로 나타났으며, 이는 CUT&RUN이 차원 감소 전략에 우수한 입력을 제공할 것이라는 것을 암시한다. CUT&RUN 프로파일링에서 DNA 단편 크기가 직접적인 TF 결합을 알려주기 때문에, 단편 크기는 단일 세포 염색질 프로파일링에서 잡음을 감소시키는 이상적인 척도를 제시한다. 본 발명자들은 먼저 벌크 세포 집단의 결합 부위를 정의한 후 해당 부위에서 DNA 단편 크기로 개별 세포의 각 부위를 나타낸다. 이 값은 차원 축소 전략의 입력으로 사용될 것이다. 주성분 분석(PCA: Principal Component Analysis)은 scATAC-seq 데이터에 대해 구현되었으며, 본 발명자들은 우선 H3K27Ac 및 H3K27me3 변형을 위해 림프계 세포에서 생성된 scCUT&RUN 데이터세트에 의한 PCA, 및 PU.1 TF를 사용하여 단일 세포 데이터에서 가장 많은 변화를 포획하는 주요 부위를 정의할 것이다. 그런 다음 scCUT&RUN 데이터 또는 PCA 정의된 서브 세트를 이용하여 tSNE 또는 UMAP 알고리즘을 사용할 것이다. 이는 알려진 림프계 하위 집단 탐지에 사용할 최적의 차원 수를 테스트할 것이다. 그런 다음 DNA 단편 크기를 고려하는 것과 모든 조각을 풀링하는 것을 비교할 것이다. 본 발명자들은 초파리 고환의 단일 세포에 대한 유사한 분석을 수행할 것이며, 여기서 줄기세포에서 분화 정자로의 생식계 세포의 발생 궤적은 결정적인 전사 인자를 포함하여 잘 정의되어 있다. 단계 특이적 인핸서의 활성화와 유전자 표현의 변화를 지시할 수 있을 것으로 기대된다. 이러한 연구는 인자 특이적 맵핑이 (scSUT&RUN에 의한) 히스톤 변형의 더 일반적인 맵핑, (scATAC-seq에 의한) DNA 접근성 및 scRNA-seq에 의한 유전자 발현과 어떻게 비교되는지 평가할 수 있기 때문에 적절하다.
scCUT &RUN의 단일 세포에서 인핸서 및 유전자 발현의 정의 염색질을 통한 RNA 폴리머라제의 결합 및 진행은 생체 내에서 동적 뉴클레오솜 중간체를 생성한다. 본 발명자들은 이전에 특징적인 서브뉴클레오솜 길이의 DNA 단편이 활성 유전자의 프로모터에서 발견됨을 보였다[20]. 서브뉴클레오솜 단편은 MNase 절단 후와 CUT&RUN 후에 H3K27Ac 변형으로 나타난다. 이 서브뉴클레오솜 단편은 환자의 혈액 혈청에서 발견되는 세포가 없는 DNA에서도 유전자 발현에 대해 보고하는데 사용될 수 있으며, 따라서 mRNA를 얻기가 어렵거나 불가능한 상황에서 기원 세포 유형을 정의하는데 유용하다[20]. 중요하게는, 서브뉴클레오솜 단편은 전사 활성 프로모터에 제한되지 않지만, TF 결합이 뉴클레오솜과 경쟁하는 CTCF 결합 부위의 특징이 된다. 이것은 임의의 TF의 결합이 뉴클레오솜과 경쟁하여 독특한 서브뉴클레오솜 단편을 생성할 것으로 예상되는 인핸서를 식별하는 유일한 전략을 제공한다. 본 발명자들은 먼저 다음을 위해 생성된 인간 K562 및 파리 S2 세포에서 H3K27Ac에 대한 CUT&RUN 데이터를 사용할 것이다; H3K27Ac에 대한 CUT&RUN은 게놈의 활성 조절 요소에 대한 데이터를 효과적으로 농축시킨다. 훈련 실험에서, 본 발명자들은 세포 집단에서 뉴클레오솜 위치를 유도하고, 잠재적인 인자 결합 부위를 정의하기 위해 단편 길이 피크-호출 알고리즘을 사용하여 서브뉴클레오솜 단편의 빈도를 조사할 것이다. RNA-seq 및 STARR-seq로 각각 정의된 이러한 세포주에서 알려진 유전자 발현 레퍼토리와 인핸서를 사용하여 이러한 호출의 성능을 테스트할 것이다.
이 전략의 이점은 서브뉴클레오솜 길이의 단일 리드가 활성 조절 요소에 대해 고유하게 진단되어야 하므로 개별 세포에서 인핸서를 조사하는 방법을 제공한다는 것이다. 본 발명자들은 유전자 프로모터에서 서브뉴클레오솜 단편을 가진 림프계 세포 유형에 주석을 달 것이며, 그리고 프로모터로부터 더 먼 단편에 대해 프로모터 및 조절 요소의 세포 유형 특이적 맵을 제공한다. 마지막으로, 본 발명자들은 프로모터를 개별 세포의 인핸서와 연결하여 조절 요소 용도를 유추하기 시작할 것을 목표로 한다. scCUT&RUN 후 개별 세포의 게놈 전체에 서브뉴클레오솜 단편에 주석을 달아 이를 수행할 것이다. 또한, 동일한 실험에서 히스톤 변형에 대한 항체를 사용하여 인핸서 및 프로모터의 적용 범위 증가를 평가할 것이다. 예를 들어, H3K27Ac 및 H3K4me1에 대한 항체 둘 다로 pA-MNase를 테더링하면 히스톤 변형은 히스톤 변형 둘 다 및 어느 하나의 히스톤 변형으로 인핸서를 포획할 수 있다(단일 항체 실험으로부터 어느 변형으로 인해 어느 부위가 가능성이 있는지 디콘볼루션할 수 있음). 이 실험의 목표는 현재 어떤 기술로는 불가능한 추론인 개별 세포에서 동시에 어떤 쌍의 부위가 관여하는지 묻는 것이다. 이 접근법이 유망한 경우, 특히 흥미로운 쌍은 동시에 H3K4me1에 대한 항체를 사용하여 활성 인핸서를 매핑하고 RNAPII-CTD-S5P에 대한 항체로 관여된 프로모터를 맵핑하는 것일 것이다. 충분한 적용 범위로, 이 조합으로 표적 프로모터가 RNAPII와 연관될 때 또는 인핸서-프로모터 상호 작용이 더 동적일 때 유전자에 대한 다수의 활성 인핸서가 결합되는지 평가할 수 있다.
실시예 8에 대한 참고 문헌(이들 각각은 그 전문이 참고로 포함됨)
Figure pct00027
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
실시예 9
개선된 CUT&RUN 벡터
최근까지, 본원에 개시된 바와 같이 CUT&RUN에 사용된 모든 pA-MNase는 원래의 pK19-pA-MN 벡터로부터 유래하였다(Schmid et al., 2004). 그러나, 이 구축물에에 의해 생성된 융합 단백질은 IgG 칼럼을 사용하여 이. 콜라이 과발현 세포의 용 해물로부터 정제를 필요로 하며, 낮은 pH로 용리시킨 후 중화는 배치 사이에 변동을 초래하였다. 정제 프로토콜을 개선하기 위해, pK19-pA-MN에 6-His 태그를 추가하였다(Bornhorst and Falke, 2000). 이를 통해 니켈 수지 칼럼에서 간단하고 가볍게 정제할 수 있다(도 61 참조). 또한, 상용 6-His 코발트 수지 키트도 매우 깨끗하고 고활성 효소를 제공한다(Pierce™ Pull-Down PolyHis Protein:Protein Interaction Kit, 카탈로그 #21277)는 것을 확인하였다.
6-His 태그는 원칙적으로 CUT&RUN 상등액으로부터의 염색질 풀다운에 사용될 수 있지만, 이것은 실제로 6-His 태그를 수지로부터 방출하기 위해서 킬레이트제를 필요로 함으로써 복잡하다. 따라서, 본 발명자들은 또한 CUT&RUN.ChIP(Brahma and Henikoff, 2018)에 적용될 수 있는 HA(헤마글루티닌) 태그를 첨가하여 CUT&RUN 상등액이 과도한 Tag 특이적 펩티드로 처리되어 항체를 방출하여 염색질 면역 침전을 위한 제2 항체에 의한 결합을 허용한다. MNase 융합 구축물에 HA 태그를 사용하여, 본 발명자들은 HA 또는 3XFLAG와 같은 에피토프 태그에 대한 항체뿐만 아니라 CUT&RUN.ChIP를 임의의 항체로 수행하도록 함으로써 방법의 다양성을 증가시킨다.
단백질 A는 마우스 IgG에 단지 약하게 결합하므로 마우스 항체의 경우 일반적으로 단백질 G가 사용된다. MNase 융합 단백질의 다양성을 추가로 개선하기 위해, pK19-pA-MN에서 단백질 A 도메인에 인접한 단일 단백질 G 도메인을 추가하였다. 이것은 2차 항체를 필요로 하지 않으면서 대부분의 모든 상용 항체에 강력하게 결합하는 융합 단백질을 초래했다(Eliasson et al., 1988). 또한, 본 발명자들은 토끼 항체에 대한 결합을 더 증가시키기 위해 단백질 G 코딩 서열에서 3개의 잔기를 돌연변이시켰다(Jha et al., 2014).
결과 pA/G-MNase 구축물의 맵을 도면에 나타낸다. 본 발명자들은 일반적인 CUT&RUN 적용을 위해 pA/G-MNase가 pA-MNase와 매우 유사하게 작동하지만 더 쉽게 정제되고 더 다양하며, 예를 들어 마우스 1차 단클론 항체에 대한 2차 항체를 필요로 하지 않으면서 CUT&RUN을 수행할 수 있다는 것을 확인하였다.
실시예 9에 대한 참고 문헌(이들 각각은 그 전문이 참고로 포함됨)
Figure pct00032
실시예 10
면역 테더링된 삽입 서열 분석에 의한 신속한 표적화 후성 유전체 프로파일링
대규모 병렬 서열 분석의 출현과 염기당 비용의 급격한 감소는 게놈 혁명을 가속화시켰지만, 후성 유전체 프로파일링의 큰 가능성은 염색질 단편을 게놈에 맵핑하는데 사용되는 방법론의 한계로 인해 지연되었다1. 서열 분석을 이용한 염색질 면역 침전(ChIP-seq)은 현재 염색질 프로파일링에 가장 널리 사용되는 방법이다2. 그러나 ChIP-seq는 초음파 처리된 단편의 수백 개의 염기쌍 크기로 해상도가 제한되지만, ChIP-exo3, MNase-X-ChIP-seq4 및 ORGANIC5와 같은 변형은 염기쌍 분해능을 제공하여 서열 분석 플랫폼을 최대한 활용한다. 그럼에도, 가교 결합 방법에 대한 가교 결합, 에피토프 마스킹 및 아티팩트에 대한 문제가 남아 있으며, 낮은 수율은 많은 수의 세포를 필요로 한다2,6-9. 또한, ChIP에 대한 대안들, 특히 DamID10, ChEC-seq7 및 CUT&RUN11,12를 포함한 효소 테더링 방법이 발전하였으며, 여기서 관심의 특정 단백질은 원위치에서 표적화된 후 게놈 전체에서 프로파일링된다. 예를 들어 램리(Laemmli)의 염색질 면역절단(ChIC) 전략13을 기반으로 하는 CUT&RUN은 특정 항체와 단백질 A/마이크로코커스의 뉴클레아제(pA-MNase) 융합 단백질을 가교 결합 없이 투과화된 세포에 연속적으로 첨가하여 관심의 염색질 단백질 또는 변형을 표적화한다11. MNase는 칼슘을 첨가하여 활성화되고 DNA 추출, 라이브러리 제조 및 페어드-엔드 서열 분석을 위해 단편이 상등액으로 방출된다. CUT&RUN은 ChIP-seq보다 훨씬 낮은 배경 수준으로 특정 염색질 성분의 염기쌍 분해능을 제공하여 게놈 전체 프로파일링 비용을 크게 감소시킨다. CUT&RUN은 데이터 품질을 크게 떨어뜨리지 않으면서 100~1000개 세포에 적용될 수 있지만12,14 고 처리량 단일 세포 적용은 표적화 단편을 함유하는 상등액을 나머지 게놈을 함유하는 세포와 분리해야하기 때문에 복잡하다. 또한, 상자성 비드에 세포를 고정시켜서 제공되는 쉬운 작업 흐름은 DNA 서열 분석 라이브러리 제조가 뒤따라야하며, 전체 절차의 시간, 비용 및 노력을 크게 증가시킨다.
여기 본 발명자들은 단백질 A에 과활성 Tn5 트랜스포사제15를 융합하고 일루미나 상용 가능한 모자이크 말단 올리고뉴클레오티드로 로딩된 단백질 A/Tn5 복합체에 의해 pA-MN의 첨가를 대체하여 ChIP-seq 및 CUT&RUN의 한계를 극복한다. Mg++를 이용한 Tn5의 활성화는 벌크 및 단일 세포 적용 모두에 대한 PCR 증폭을 위해 준비된 항체-표적화된 태그멘테이션을 초래한다. 생존 세포부터 시작하여, 단일 튜브 면역 테더링된 삽입 서열 분석(ITIS: ImmunoTethered Insertion Sequencing) 프로토콜은 하루에 증폭된 서열 준비 라이브러리를 제공한다.
방법
재료
시약
● 세포 현탁액. 본 발명자들은 인간 K562 세포를 사용하였다.
● 콘카나발린 코팅된 자성 비드(Bangs Laboratories, 카탈로그 번호 BP531)
● 관심의 에피토프에 대한 항체. 예를 들어, CUT&RUN에 의한 1D 및 3D 상호 작용을 맵핑하기 위한 토끼 α-CTCF 다클론 항체(Millipore 07-729)
● 풍부한 에피토프에 대한 양성 대조군 항체, 예를 들어 α-H3K27me3 토끼 단클론 항체(Cell Signaling Technology, 카탈로그 번호 9733)
● 2차 항체, 예를 들어 기니피그 α- 토끼 항체
● 5% 디기토닌(EMD Millipore, 카탈로그 번호 300410)
● 단백질 A-Tn5(pA-Tn5) 융합 단백질. -20℃에서 보관한다.
● 일루미나 상용 가능한 오버행이 있는 모자이크 말단 이중 가닥 올리고뉴클레오티드(서열 정보는 참고 문헌 16으로부터 유래되며, 유로핀스(Eurofins)를 통해 주문함, TE 완충액 중 100 μM )
모자이크 말단_역방향 [PHO]CTGTCTCTTATACACATCT (서열 번호 2)
모자이크 말단_어댑터 A TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG (서열 번호 3)
모자이크 말단_어댑터 B GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG (서열 번호 4)
● 증류, 탈이온화 또는 RNAse 무함유 H2O(dH2O(예를 들어, Promega, 카탈로그 번호 P1197)
● 1 M 염화망간(MnCl2; Sigma-Aldrich, 카탈로그 번호 203734)
● 1 M 염화칼슘(CaCl2; Fisher, 카탈로그 번호 BP510)
● 1 M 염화칼륨(KCl; Sigma-Aldrich, 카탈로그 번호 P3911)
● 1 M 염화마그네슘(MgCl2)
● 1 M 히드록시에틸 피페라진에탄술폰산 pH 7.5(HEPES (Na+); Sigma-Aldrich, 카탈로그 번호 H3375)
● 1 M 히드록시에틸 피페라진에탄술폰산 pH 7.9(HEPES (K+); Sigma-Aldrich, 카탈로그 번호 H3375)
● 5 M 염화나트륨(NaCl; Sigma-Aldrich, 카탈로그 번호 S5150-1L)
● 0.5 M 에틸렌디아민테트라아세트산(EDTA; Research Organics, 카탈로그 번호 3002E)
● 2 M 스페르미딘(Sigma-Aldrich, 카탈로그 번호 S2501)
● 로슈 컴플리트 프로테아제 억제제(Roche Complete Protease Inhibitor) EDTA 무함유 정제(Sigma-Aldrich, 카탈로그 번호 5056489001)
● 2 mg/ml 글리코겐(시그마-알드리치(Sigma-Aldrich)의 1:10 희석, 카탈로그 번호 10930193001)
● RNase A: DNase 및 프로테아제 무함유(10 mg/ml; Thermo Fisher Scientific, 카탈로그 번호 EN0531)
● 10% 소듐 도데실 술페이트(SDS; Sigma-Aldrich, 카탈로그 번호 L4509)
● 프로테이나아제 K(Thermo Fisher Scientific, 카탈로그 번호 EO0492)
● 아젠코트 AMPure XP 상자성 비드(Beckman Coulter, 카탈로그 번호 A63880)
● 1 M 트리스-HCl pH 8.0
● 에탄올(Decon Labs, 카탈로그 번호 2716)
● NEBNext HiFi 2x PCR 마스터 믹스
● PCR 프라이머(고유 인덱스를 가진 주문형 PCR 프라이머의 서열은 참고 문헌1718에서 유래함)
장비
● 원심분리기 에펜도르프(Eppendorf) 5810, 스윙 버킷
● 원심분리기 에펜도르프 5424, 고정각 로터
● 원심분리기 에펜도르프 5415R, 냉장 고정각 로터
● Macsimag 자기 분리기(Miltenyi, 카탈로그 번호 130-092-168), 1.7 및 2 ml 마이크로퓨지 튜브의 바닥에서 액체를 깨끗하게 회수할 수 있음.
● 볼텍스 믹서(Vortex mixer)(예를 들어, VWR Vortex Genie)
● 마이크로 원심분리기(예를 들어, VWR 모델 V)
● 1.5 ml 마이크로 원심분리 튜브(Genesee, 카탈로그 번호 22-282)
● 2 ml 마이크로 원심분리 튜브(Axygen, 카탈로그 번호 MCT-200-C)
● 튜브 로테이터(Labquake, Thermo Fisher)
● 1.5 ml 마이크로 원심분리 튜브용 웰이 있는 히터 블록
● 수조(37℃, 55℃ 및 70℃로 설정됨)
● MaXtract 상 잠금 마이크로 원심분리 튜브(Qiagen, 카탈로그 번호 139046)
● 모세관 전기영동 기기(예를 들어, 애질런트 테이프스테이션 4200)
● 큐빗 형광 측정기(Life Technologies, 카탈로그 번호 Q33216)
시약 셋업
5% 디기토닌 DMSO에 디기토닌 분말(Calbiochem)을 5%(w/v)로 용해한다.
결합 완충액 400 ㎕ 1M HEPES-KOH pH 7.9, 200 ㎕ 1M KCl, 20 ㎕ 1M CaCl2 및 20 ㎕ 1M MnCl2를 혼합하고 dH2O로 최종 부피를 20 ml로 만든다. 완충액을 4℃에서 6개월 동안 보관한다.
콘카나발린 A 코팅된 비드 각 최종 샘플 및/또는 분해 시점에 대해 10 ㎕가 되도록 슬러리의 충분한 양을 부드럽게 재현탁하고 회수한다. 2 ml 튜브 내 1.5 ml 결합 완충액으로 옮긴다. 튜브를 마그넷 스탠드 위에 두어 투명해지도록 한다(30초 내지 2분). 액체를 회수하고 마그넷 스탠드에서 치운다. 1.5 ml 결합 완충액을 넣고, 뒤집거나 부드러운 피펫팅으로 혼합하고 마이크로 원심분리기에서 빠른 펄스로 뚜껑과 측면에서 액체를 제거한다. ConA 비드 슬러리의 부피(샘플당 10 ㎕)와 동일한 부피의 결합 완충액에 재현탁한다.
Tn5-어댑터 복합체: 각각의 모자이크 말단-어댑터 A(ME-A) 및 모자이크 말단-어댑터 B(ME-B) 올리고뉴클레오티드를 모자이크 말단 - 역 올리고뉴클레오티드와 어닐링한다. 사전 어닐링된 ME-A 및 ME-B 올리고뉴클레오티드의 100 uM 등몰 혼합물 16 ㎕을 100 ㎕의 5.5 uM 단백질 A-Tn5 융합 단백질과 혼합한다. 혼합물을 실온에서 회전 플랫폼상에서 1시간 동안 인큐베이션한 후 -20℃에서 보관한다.
세척 완충액 1 ml 1 M HEPES pH 7.5, 1.5 ml 5 M NaCl, 12.5 ㎕ 2 M 스페르미딘을 혼합하여, dH2O를 사용하여 최종 부피를 50 ml로 만들고, 1개의 로슈 컴플리트 프로테아제 억제제 EDTA 무함유 정제를 첨가한다. 완충액을 4℃에서 최대 1주일 동안 보관한다.
Dig 세척 완충액 400 ㎕ 5% 디기토닌을 40 ml 세척 완충액과 혼합한다. 완충액을 4℃에서 최대 1일 동안 보관한다.
항체 완충액 8 ㎕ 0.5 M EDTA를 2 ml Dig 세척 완충액과 혼합하고 사용할 때까지 얼음에 둔다.
Dig-med 완충액 20 ml Dig 세척 완충액을 600 ㎕ 5 M NaCl와 혼합한다. 완충액을 4℃에서 최대 1일 동안 보관한다.
태그멘테이션 완충액 Mix 20 ㎕ 1 M MgCl2을 2 ml Dig-med 완충액과 혼합하고 사용할 때까지 얼음에 둔다.
절차
세포 투과화 및 1차 항체 인큐베이션
시간 1.5시간 내지 수 일
1) 실온에서 신선한 배양물을 수거하고 세포를 계수한다. 동일한 프로토콜을 샘플당 최대 500,000개의 포유류 세포에 사용할 수 있다.
일시 정지 지점: 필요한 경우 Mr. Frosty 이소프로필 알코올 챔버를 사용하여 10% DMSO에서 세포를 동결 보존할 수 있다. 급속 동결은 권장되지 않는데, 배경 DNA를 파괴하여 최종 데이터 품질에 영향을 줄 수 있기 때문이다.
2) 실온에서 600 x g 3분 원심분리하고 액체를 회수한다.
3) 1.5 ml의 실온 세척 완충액에 부드럽게 피펫팅하여 재현탁하고 필요한 경우 2 ml 튜브로 옮긴다.
4) 실온에서 600 x g 3분 원심분리하고 액체를 회수한다.
5) 단계 3 및 4를 반복한다.
6) 낮게(~ 1100rpm) 설정된 볼텍스에 놓고 1 ml 냉각 항체 완충액에 재현탁한다.
7) 각 항체에 대해 하나씩 사용될 세포 슬러리를 1.5 ml 튜브에 100 ㎕ 분취액으로 나눈다.
8) 1-2 ㎕ 항체를 추가한다.
9) 실온에서 1~2시간 또는 4℃에서 최대 수일 동안 회전시킨다.
2차 항체 결합시키기
시간 1시간
10) 낮게(대략 1100 rpm) 설정된 볼텍싱 믹서에 각 튜브를 놓고 10 ㎕의 활성화된 ConA 비드 슬러리를 서서히 첨가한다.
11) 실온에서 뉴테이션하거나(nutate) 회전시켜 결합을 허용한다(5~10 분).
12) 100 ㎕ Dig 세척액마다 1~2 ㎕의 2차 항체(예를 들어, 토끼 1차용 기니피그 항-토끼)를 혼합한다.
13) 마이크로 원심분리기에서 빠른 펄스로 뚜껑과 측면에서 액체를 제거하고 마그넷 스탠드에 튜브를 둔다.
14) 모든 액체를 빼내고 낮게(대략 1100 rpm) 설정된 볼텍싱 믹서에 각 튜브를 낮은 각도로 놓고 부드럽게 볼텍싱하면서 100 ㎕의 2차 항체 혼합물을 분출하여 용액이 비드의 대부분 또는 전부를 제거하도록 한다. 톡톡 두드려 남은 비드를 제거한다.
15) 실온에서 약 30분 동안 뉴테이션하거나 회전시킨다.
16) 빠르게 회전시키고, 마그넷 스탠드에 두어 투명하게 하고, 모든 액체를 빼낸다.
17) 1 ml Dig 세척 완충액을 첨가하고, 뒤집기에 의해, 또는 덩어리가 계속되면 부드러운 피펫팅에 의해 혼합한다.
18) 단계 16-17을 2회 반복한다.
단백질 A-Tn5 융합 단백질을 결합시키기
시간 1.5시간
19) Dig-med 완충액에서 pA-Tn5 복합체를 샘플당 100 ㎕에 대해 1:200의 최종 농도로 혼합한다.
20) 마그넷 스탠드에 두어 모든 액체를 투명하게 하고 빼낸다.
21) 낮게(대략 1100 rpm) 설정된 볼텍싱 믹서에 각 튜브를 낮은 각도로 놓고 부드럽게 볼텍싱하면서 100 ㎕의 pA-Tn5 혼합물을 측면을 따라 분출하여 용액이 비드의 대부분 또는 전부를 제거하도록 한다. 톡톡 두드려 남은 비드를 제거한다.
22) 실온에서 1시간 동안 튜브 뉴테이터 회전기에 놓는다.
23) 빠르게 회전시키고, 마그넷 스탠드에 두어 모든 액체를 투명하게 하고 빼낸다.
24) 1 ml의 Dig-med 완충액을 첨가하고, 뒤집기에 의해, 또는 덩어리가 계속되면 부드러운 피펫팅에 의해 혼합한다.
25) 단계 23-24 단계를 2회 반복한다.
태그멘테이션
시간 1.2시간
26) 빠르게 회전시키고, 마그넷 스탠드에 두어 모든 액체를 투명하게 하고 빼낸다.
27) 낮게(대략 1100 rpm) 설정된 볼텍싱 믹서에 각 튜브를 낮은 각도로 놓고 부드럽게 볼텍싱하면서 샘플당 100 ㎕의 태그멘테이션 완충액을 측면을 따라 첨가하여 용액이 비드의 대부분 또는 전부를 제거하도록 한다. 톡톡 두드려 남은 비드를 제거한다.
28) 37℃에서 1시간 동안 인큐베이션한다.
태그멘테이션 정지 & DNA 추출
시간 1.5시간
29) 실온에서 각 샘플에 4.5 ㎕ 0.5M EDTA, 5.5 ㎕ 10% SDS 및 1 ㎕ 20 mg/ml 프로테이나아제 K를 첨가한다.
30) 55℃에서 30분 인큐베이션하여 분해한다.
31) 70℃에서 20분 인큐베이션하여 프로테이나아제 K를 불활성화한다.
32) 1.1배 부피(122 ㎕) AMPure XP 상자성 비드를 첨가하고 최대로 볼텍싱한다.
33) 빨리 회전시키고 실온에서 10~15분 동안 둔다.
34) 자석 위에 올려놓고 투명해지도록 둔 후 액체를 조심스럽게 빼낸다.
35) 자석에 위에서 비드를 건드리지 않으면서, 1 ml 80% 에탄올을 첨가한다.
36) 튜브 바닥까지 1 ml 피펫으로 액체를 빼내고 1 ml 80% 에탄올을 첨가한다.
37) 1 ml 피펫으로 액체를 빼낸다.
38) 20 ㎕ 피펫으로 남은 액체를 제거하고 4~5분 동안 건조한다.
39) 마그넷 스탠드에서 치우고 30 ㎕ 10 mM 트리스-HCl pH 8을 첨가하고 최대로 볼텍싱한다.
40) 5분 후에 마그넷 스탠드에 올려놓고 투명해지도록 둔다.
41) 피펫으로 새로운 튜브로 액체를 꺼낸다.
PCR
시간 1시간
42) 21 ㎕ DNA + 각 샘플마다 다른 바코드를 사용하는 2 ㎕ 맞춤 Ad1_noMX i5 + 2 ㎕ v2_Ad2 바코드 i7 프라이머를 혼합하다.
43) 25 ㎕ NEBNext HiFi 2x PCR 마스터 믹스를 첨가한다.
44) 혼합하고, 빨리 회전시키고 써모사이클러에 넣고 가열된 뚜껑으로 사이클링 프로그램을 시작한다.
45) 사이클 1: 72℃에서 5분(갭 충전)
46) 사이클 2: 98℃에서 30초
47) 사이클 3: 98℃에서 10초
48) 사이클 4: 63℃에서 30초
49) 사이클 3~4를 13회 반복한다.
50) 72℃에서 1분 그리고 8℃에서 유지한다.
● 큰 DNA 단편 및 과량의 프라이머의 기여를 최소화하려면 PCR 사이클은, 바람직하게는 60~63℃ 10초 결합된 어닐링/신장 단계를 이용한, 12~14회 이상이어야 한다.
PCR 후 세정
51) 튜브가 냉각된 후, 사이클러에서 꺼내 1.1 부피(55 ㎕)의 Ampure XP 비드를 첨가하고, 잠시 완전히 볼텍싱한다.
52) 빨리 회전시키고 실온에 10~15분 동안 둔다.
53) 자석 위에 올려놓고 투명해지도록 둔 후 액체를 조심스럽게 회수한다. 자석 위에서 비드를 건드리지 않으면서, 200 ㎕ 80% 에탄올을 첨가한다.
54) 튜브 바닥까지 피펫으로 액체를 빼내고 200 ㎕ 80% 에탄올을 첨가한다.
55) 액체를 빼내고 20 ㎕ 피펫으로 남은 액체를 제거하고 4~5분 동안 건조한다.
56) 마그넷 스탠드에서 꺼내고 30 ㎕ 10 mM 트리스-HCl pH 8을 첨가하고 최대로 볼텍싱한다.
57) 5분 후에 마그넷 스탠드에 두고 투명해지도록 둔다.
58) 피펫으로 새로운 튜브로 액체를 꺼낸다.
DNA 서열 분석 및 데이터 처리
59) 애질런트 4200 테이프스테이션 분석에 의해 라이브러리의 크기 분포를 결정한다.
60) 제조업체가 권장하는 최종 농도를 목표로 하여 라이브러리를 혼합하여 원하는 바와 동일한 표현을 달성한다.
61) 제조사의 지침에 따라 바코드 라이브러리에서 페어드-엔드 일루미나 서열 분석을 수행한다.
62) 본 발명자들은 Bowtie2 버전 2.2.5를 사용하여 페어드-엔드 리드를 다음 선택 사항을 이용하여 정렬한다: -local -very sensitive-local --no-unal --no-mixed --no-discordant --phred33 -I 10 -X 700. 캘리브레이션을 위한 단편을 맵핑하기 위해, 본 발명자들은 또한 --no-overlap --no-dovetail 선택 사항을 사용하여 실험 게놈이 스파이크-인 DNA와 교차 맵핑하는 것을 방지한다.
결과 및 고찰
우리의 기본 ITIS 프로토콜은 (1) 세포를 투과화하는 단계, (2) 1차 항체를 첨가하고 인큐베이션하는 단계, (3) 콘카나발린 A 코팅된 상자성 비드에 고정하는 단계, (4) 2차 항체를 첨가하고, 배양하고 세척하는 단계, (5) pA-Tn5(도 62)를 첨가하고 세척하는 단계, (6) Mg++와 인큐베이션하는 단계, (7) 반응을 정지시키고 프로테이나아제 K로 분해하는 단계 및 (8) 상자성 세정을 위해 Ampure XP 비드를 첨가하는 단계(도 63A)를 포함한다. 모든 작업은 단일 튜브 또는 마이크로 타이터 플레이트의 웰에서 수행되고, 자성 비드로부터의 수성 용출은 PCR 준비된 DNA 라이브러리를 생성한다. 14 사이클의 PCR 후 10% 분취액의 테이프스테이션 디스플레이는 RNAPII-Ser5 및 H3K27me3에 대한 단편-어댑터의 사다리를 보여주지만, 두 개의 상이한 pA-Tn5 구축물을 사용하는 IgG 대조군에는 그렇지 않다(도 64). 6,000 내지 400,000개 범위의 세포 수에 대한 사다리를 나타낸다(도 63B). 프로파일은 H3K27me3의 경우 60,000개, RNA 폴리머라제 II 세린-5(RNAPII-Ser5)의 경우 20,000개로 낮아진 세포 수에 대해 거의 동일하며, 작은 단편(<100 bp + 양쪽의 61-bp 어댑터), 모노뉴클레오솜(~ 170 bp + 어댑터) 및 올리고뉴클레오좀을 나타낸다. CUT&RUN의 경우 뉴클레오솜 및 비뉴클레오솜의 에피토프에 대해 유사한 뉴클레오좀 사다리가 나타났으며 양쪽에 링커 영역 내에서 절단에 의해 이웃하는 뉴클레오솜의 방출로서 해석된다. 더 낮은 세포 수에서, 작은 단편 및 모노 뉴클레오솜의 감소 및 올리고 뉴클레오솜의 증가와 함께, 단편의 평균 길이가 현저히 증가한다. 본 발명자들은 세포 수에 따른 크기 분포의 이러한 차이를 제한적인 양의 1차 항체로 인한 것으로 해석하며, 따라서 더 높은 세포 수에서는 모든 이용 가능한 에피토프에 결합하는 충분한 항체가 없는데 이는 본 발명자들이 CUT&RUN에 대해 이전에 보고한 한계이다12. 세포 수가 감소함에 따라, 거의 모든 부위가 항체로 포화되어, 도메인이 풍부한 H3K27me3에 대한 입자와 전사 개시 부위 및 유전자에 대해 풍부한 RNAPII-Ser5의 입자 사이에서 단편을 방출할 가능성이 더 높다. 동일한 농도의 항체를 가정하면, 뉴클레오솜당 최대 2개의 H3K27me3의 복제본이 있지만 RNAPII 복합체당 C 말단 도메인(CTD) 헵타머의 최대 52개의 복제본이 있기 때문에 RNAPII-Ser5보다 H3K27me3에 대해 더 많은 세포로서 고갈이 일어날 것이다. 본 발명자들은 며칠 동안 1차 항체의 인큐베이션이 ITIS 수율에 영향을 미치지 않는다는 것을 발견하였다.
본 발명자들은 먼저 RNAPII의 프로파일링을 위해 ITIS를 CUT&RUN과 비교하였다. CUT&RUN을 사용하면 분해 길이에 따라 단편 수율이 결정된다. 분해가 적으면, 표적화된 입자의 양 측면에서 절단을 거친 세포 집단 내의 일부의 부위만이 단편을 상등액으로 방출하며 신호가 낮아진다. 과다 분해는 표적화되지 않은 분해를 초래할 수 있으며 pA-MN 결합된 단편을 방출하는데, 이는 RNAPII 및 H3K27ac와 같이 고도로 풍부한 에피토프에 대해 심각해지는 문제이다. CUT&RUN으로 표적화되지 않은 분해를 감소시키기 위해, 본 발명자들은 이전에 뉴클레오솜 코어 입자의 침전을 초래하는 것으로 나타난 저염 및 고농도의 2가 양이온을 사용하여 분해가 수행되도록 프로토콜을 변경하였다. 실제로, CUT&RUN 분해를 위해 3.5 mM HEPES pH 7.5 및 10 mM CaCl2를 사용하여, 분해 중에 H3K27ac 표적화된 염색질의 방출이 검출되지 않았지만, 150 mM NaCl의 첨가시 정량적 방출이 검출되었다. 이 절차는 상관 매트릭스 분석에 의해 시점 간 변동을 크게 줄였으며(도 57), 이후 모든 적용에 대해 이 개선된 CUT&RUN 프로토콜을 채택하였다. 그럼에도, 개선된 CUT&RUN 프로토콜이 항 -RNAPII-Ser5 항체를 사용하여 RNAPII의 개시 형태에 적용되었을 때, 0℃에서 1분 내지 27분의 시간 경과에 따라 과소분해와 과분해가 모두 관찰되었다(도 65). 대조적으로, 상이한 농도의 동일한 항체 및 2개의 상이한 pA-Tn5 구축물을 사용하는 ITIS는 유전자체에 대해 낮고 넓은 도메인을 갖는 프로모터에 대해 급격한 피크를 나타내었고 최고의 CUT&RUN 시점(9분)보다 낮은 배경을 나타냈다. 본 발명자들은 RNAPII 에피토프(Ser-2, Ser5, Ser2+Ser5 및 Ser7)에 대한 4개의 추가 항체를 사용하여 RNAPII CUT&RUN의 일관성을 확인하였다. 상관관계 매트릭스 분석은 5개의 항체 모두가 동일한 실험에서 서로 다른 항체를 배제에 생물학적 복제물의 클러스터링 없이 게놈 전체에 매우 일치하는 프로파일을 제공하는 반면, 우리의 최상의 실험을 위한 CUT&RUN 프로파일은 동일한 인큐베이션 혼합물로부터 시점들을 연속적으로 취하였다는 사실에도 불구하고 더 낮은 전체 일치성을 보인다(도 66B). 본 발명자들은 ITIS가 개선된 CUT&RUN 프로토콜을 사용하여 나타난 것보다 낮은 배경으로 RNAPII에 대한 강건한 프로파일링을 제공한다고 결론지었다. 본 발명자들은 상이한 이용하여 침묵(H3K27me3) 및 활성(H3K4me2 및 H3K27me3) 히스톤 변형에 대한 ITIS 프로파일링에 대해 유사하게 높은 강건성과 일치성을 관찰하였다(도 66A).
Tn5를 사용한 태그멘테이션은 이전에 과민성 부위 검출을 위해 보편적인 ATAC-seq 방법에 따라 비표적화 방식으로 적용되었으며17 ITIS의 과제는 항체 표적화된 프로파일링과 혼동될 비표적화된 태그멘테이션을 피하는 것이다. 비표적화된 태그멘테이션의 정도를 분석하기 위해, 본 발명자들은 CUT&RUN 양성 대조군으로서 사용한 H3K27me3에 대한 토끼 단클론 항체를 사용하였는데, 그 이유는 이 에피토프가 본질적으로 과민성 부위가 없는 게놈의 침묵된 영역에서만 발견되기 때문이다. 인간 K562 세포에서 과민성 부위를 확인하기 위해 최근에 발표된 ATAC-seq 데이터세트(GSM2695561)에 대한 61,153개의 피크 호출 세트를 다운로드하였다. 과민성 부위의 위치로서 각 피크의 중간점을 사용하여, 본 발명자들은 pA-Tn5 복합체 첨가 중 및/또는 후에 세포의 다양한 처리 후 H3K27me3 ITIS에 의해 생성된 단편을 정렬하였다. 본 발명자들은 생리학적(대략 150 mM) NaCl을 사용하는 ITIS에 대한 과민성 부위의 높은 점유가 pA-Tn5 결합 후 짧은 500 mM 염 세척을 사용하여 약간 감소했지만 결합, 세척 및 태그멘테이션에 300 mM NaCl을 사용하여 제거되었음을 발견하였다(도 69A). 61,153개의 ATAC-seq 부위가 점수별로 순서 매겨졌을 때, CUT&RUN은 ATAC-seq 점수와 약한 음의 상관관계를 보였던 반면, 150 mM NaCl과 단지 짧은 500 mM NaCl 세척을 사용하는 ITIS는 강한 상관관계가 있는 히트 맵을 생성하였으며(도 67), 이는 pA-Tn5가 인큐베이션 중에 게놈 전체의 과민성 부위에 결합하고, 세척 및 태그멘테이션 중에 상당한 양의 활성 효소 복합체가 유지됨을 확인해준다. 놀랍게도, 500 mM NaCl로 장기간 세척하면 ATAC-seq 부위에서의 점유가 CUT&RUN에서 볼 수 있는 수준으로 감소하였다. pA-Tn5 결합, 세척 및 태그멘테이션 결과 중에 300 mM의 NaCl 농도를 사용하여 과민성 부위 점유의 추가 감소를 얻었다. 이 약한 역-상관관계가 과민성 부위가 매몰된 H3K27me3 도메인 내 고농도의 에피토프에 기인하며, 이는 결과적으로 H3K27me3이 없는 도메인에 매몰된 부위에 비해 이들 부위 측면에 위치한 H3K27me3 뉴클레오솜에 결합된 pA-Tn5에 의한 배경 단편의 우선적인 방출을 초래한다. 이러한 결과는 또한 한 세트의 어댑터로 복합체화된 테더링되지 않은 Tn5, 이어서 상이한 세트의 어댑터로 복합체화된 pA-Tn5와 인큐베이션하고, 고염 처리를 생략함으로써 동일한 샘플에서 ITIS 및 ATAC-seq 모두를 수행할 수 있음을 시사한다.
본 발명자들은 이온 농도가 ITIS 단편의 크기 분포에 영향을 줄 수 있음을 확인한다. ITIS는 전사 인자를 나타내는 작은 단편(≤120 bp)과 낮은 수준의 디뉴클레오솜과 함께 대부분의 모노뉴클레오솜을 나타내는 큰 단편(150 bp)을 생성한다(도 68)는 것을 확이한다. 약 10 bp 주기성은 효모 전사 인자의 CUT&RUN에 대해 나타난 덜 눈에 띄는 주기성과 유사하게, 테더링된 절단의 엄격한 한계를 반영할 가능성이 있으며, 이는 DNA 이중 나선의 한 면에 대한 효소의 접근을 반영하는 것으로 해석되었다11. 비표적화된 pA-Tn5를 제거하기 위해 염 농도를 증가시킴으로써, 작은 단편 크기 집단의 감소가 또한 관찰되었다(도 69B). 또한, 하기 표에서 이. 콜라이 게놈을 맵핑하는 단편의 수가 감소함을 관찰하였다.
300 mM NaCl에서 Tn5 결합 및 태그멘테이션은 인간 K562 세포에서 이. 콜라이 DNA 오염을 감소시킨다
Figure pct00033
맵핑된 페어드-엔드 리드는 두 가지 다른 ITIS 실험에서 계수된다. 첫 번째 실험에서 150 mM NaCl을 pA-Tn5 결합에 사용한 후 두 번의 짧은 500 mM 세척 후 150 mM NaCl에서 태그멘테이션을 수행하였다. 두 번째 실험에서, 300 mM NaCl을 pA-Tn5 결합에 사용하고, 이어서 3회 짧은 세척 및 태그멘테이션을 수행하였다. 정제 중에, Tn5 트랜스포사제는 이. 콜라이 DNA의 이용 가능한 단편에 결합하고, 일부는 정제 과정을 통해 결합된 상태로 유지된다. 임의의 배치의 트랜스포사제에 대해, 반응에 도입된 이. 콜라이 DNA 오염의 백분율은 샘플을 캘리브레이션하여 정량적으로 비교할 수 있도록 "비 침습적" 스파이크-인 프록시 역할을 한다.
이 오염 물질은 Tn5 코딩 유전자가 이. 콜라이에서 높은 수준의 발현으로 유도되어 이. 콜라이 게놈 DNA에 결합하는 고농도의 효소를 생성하고 일부는 정제 과정에서 남아 세포 DNA와 함께 동시에 태그멘테이션된다. 정제 중에 이 오염 물질을 제거하기 위한 프로토콜이 있지만, 300 mM NaCl 프로토콜이 이. 콜라이 DNA를 미미한 수준으로 감소시킨다는 것을 발견하였다. CTCF와 같은 비교적 드문 에피토프는 히스톤 변형과 같은 더 풍부한 에피토프보다 더 높은 수준의 오염을 보였으며, 낮은 균일한 배경만을 제공하는 IgG는 매우 높은 오염을 보인다는 것을 알았다. 이는 이. 콜라이 오염을 캘리브레이션을 위한 스파이크-인의 "비 침습적" 프록시로 사용할 수 있음을 나타낸다. 스파이크-인 캘리브레이션은 샘플을 비교하는데 필수적이며20, 특히 배경 수준이 너무 낮아 캘리브레이션에 사용할 수 없는 CUT&RUN 및 ITIS와 같은 방법의 경우에 특히 그렇다. 이. 콜라이 DNA 오염이 스파이크-인을 위한 프록시로 사용될 수 있는지를 테스트하기 위해, 에스. 세레비지에 효모 DNA 스파이크-인을 포함한 H3K27me3(100~6,000 세포) 및 CTCF(1,000~100,000 세포)에 대해 연속 희석된 프로파일링된 세포로부터 K562 세포 데이터세트를 사용하여 이. 콜라이 게놈에 단편을 맵핑하였다. 실제로, 두 세포 수 범위에 대해, 효모 스파이크-인과이. 콜라이 오염 사이의 상관관계는 가능한 측정 오차 내에서 동일할 정도로 가깝다(R2 = 0.96, 도 70). 따라서 pA-MNase를 오염시키는 이. 콜라이 DNA를 사용하여 CUT&RUN을 캘리브레이션할 수 있으며, 이는 스파이크-인의 필요성을 없애며, pA-Tn5를 오염시키는 이. 콜라이 DNA가 ITIS에 적합한 스파이크-인 프록시 역할을 한다는 증거를 확인해 준다. CUT&RUN 샘플에 pA-MNase를 첨가하는 것이 정지 완충액에 이종 스파이크-인 DNA를 첨가하는 것보다 먼저 수행되므로 CUT&RUN 과정의 초기 단계에서 샘플 간 변동을 제어하기 때문에 이. 콜라이 오염을 스파이크-인 프록시로 사용하는 것은 이종 스파이크-인을 사용하는데 유리하고, 이 이점은 ITIS로 확장된다. 이. 콜라이 게놈은 CUT&RUN 스파이크-인에 사용되는 효모 또는 초파리 게놈보다 단순하며 반복 마스킹이 필요하지 않으며, 모든 진핵생물에 대해 이종이기 때문에 거의 모든 ITIS 적용에 충분하다.
본 발명자들은 ITIS를 검증하기 위해 RNAPII-Ser5 데이터세트를 사용하였다. RNAPII는 PRO-seq를 사용하여 K562 세포에서 프로파일링하였으며, 이는 RNAPII의 활성 부위에서 초기 사슬을 맵핑하는 전사 실행 방법이며, 그래서 ChIP-seq, CUT&RUN 및 ITIS와 같은 염색질 기반 방법과 직교한다. 기본 파라미터가 있는 MACS2를 사용하여 pA-Tn5 및 pA-3XFLAG-Tn5 데이터세트 모두에 대해 피크를 호출하여(도 64, PolIIIS5) 각각 ~ 17,500개의 피크를 생성하였다. 인간 K562 세포(SRA GSM1480327)에 대해 처리된 PRO-seq 데이터세트를 피크 호출에 정렬한다. ITIS MACS2 점수로 순서를 매기면 PRO-seq 점유와 PolII-Ser5 ITIS 점수 사이의 근접한 일치가 나타나며, 여기서 파란색 히트 맵 값은 각 피크 호출의 3' 측에 대한 PRO-seq 점유를 나타내고 노란색 값은 5' 측에 대한 PRO-seq 점유를 나타낸다(도 71). 이는 PolII-Ser5 ITIS가 임의의 외부 주석에 대한 기준을 필요로 하지 않으면서 RNAPII의 개시 형태를 맵핑하는 지의 직접적인 검증을 제공한다. 두 가지 형태의 pA-Tn5에 대한 피크 호출에서 매우 유사한 PRO-seq 히트 맵이 생성된다. 본 발명자들은 ITIS가 RNAPII의 정확한 맵을 제공한다고 결론 내린다.
ITIS가 후성 유전체 성분에 보다 일반적으로 사용될 수 있는 지의 여부를 결정하고 고 처리량에 맞게 프로토콜을 적용하기 위해, 본 발명자들은 반응 부피를 절반으로 줄이고, 수거되어 투과화된 K562 및 H1 인간 배아 줄기세포 각각 두 배치로부터 96 웰 마이크로 타이터 플레이트의 개별 웰로 분배하였다. 총 96개의 샘플에 대해 1:50 농도의 20개 항체 세트 중 하나를 각 샘플에 첨가하였다. 4℃에서 하룻밤 인큐베이션한 후, 플레이트에서 ITIS를 수행하고, Ampure 비드를 첨가하고 용출액을 96개의 상이한 바코드를 사용하여 14 사이클로 증폭시킨 다음 풀링하였다. 테이프스테이션 분석에 기초한 크기 분포 및 큐빗 판독에 기초한 농도를 사용하여 대략 등몰 양의 96개 모든 샘플을 혼합하고 단일 2 레인 유동 세포에서 서열 분석하였다. 본 발명자들은 평균 ~ 300만개의 페어드-엔드 리드를 인간 게놈에 맵핑하였다. 상관 매트릭스 분석을 위해 계층적 클러스터링을 사용하여 K562와 H1 세포에 대한 모든 생물학적 복제물이 예외 없이 함께 클러스터링됨을 발견하였다(도 72). 이러한 뛰어난 재현성은 ITIS의 강건성을 확인하는 동시에 ITIS가 히스톤 변형(H3K4me1-me3, K27ac 및 me3) 및 변이(H2A.Z), 전사 인자(CTCF, Myc, Sox2, Oct4 및 NPAT) 및 염색질 결합 복합체(PolII, Med1, Suz12 및 Ring1B)를 포함하여 다양한 에피토프에 적합하다는 것을 입증한다.
결론적으로, 본 발명자들은 테더링된 효소의 항체-표적화를 태그멘테이션과 결합하고 살아있는 세포에서 서열 분석 준비 라이브러리까지 단 하루만이 필요한 새로운 방법을 기술하였다. ITIS는 RNAPII 프로파일링에서 CUT&RUN 방법을 능가하며 히스톤 및 CTCF 전사 인자 프로파일링에서 유사한 결과를 달성한다. ITIS의 작업 흐름은 CUT&RUN과 비슷하지만 더 단순하기 때문에 조직 및 종양 샘플에의 응용 및 고 처리량에 쉽게 적용될 수 있다21. 또한, ITIS는 단일 세포 ChIT/ATAC-seq를 포함하여 단일 세포 ATAC-seq18 ,22-25에 적용된 동일한 프로토콜에 따라 단일 세포 응용에 쉽게 적용할 수 있다. ITIS는 벤치 탑, 고 처리량 파이프라인 및 궁극적으로 클리닉을 위해 염색질 지형의 특정 성분을 프로파일링하는 최고의 방법으로서 ChIP-seq를 대체할 수 있는 잠재력을 갖는다.
실시예 10에 대한 참고 문헌(이들 각각은 그 전문이 참고로 포함됨)
Figure pct00034
Figure pct00035
실시예 11 면역 표적화 삽입 서열 분석을 이용한 낮은 세포 및 단일 세포 후성 유전체 프로파일링
ChIP-seq의 주요 한계는 수천 개미만의 세포를 필요로 하는 적용 분야에는 너무 비효율적이라는 것이다(Brind'Amour et al., 2015). 본 발명자들은 CUT&RUN이 데이터 품질의 손실 없이 최소 100개의 세포에 적합하다는 것을 보였다(Skene et al., 2018). ITIS에 의한 대부분의 실험에서, 50,000~500,000개의 인간 K562 또는 H1 ES 세포를 사용하였다. ITIS가 낮은 세포 수에도 적용될 수 있는지 확인하기 위해, K562 세포를 20개 세포로 줄어들도록 연속 희석하고 14 사이클을 사용하는 우리의 표준 프로토콜에 따라 H3K27me3 및 RNAPII-Ser2+5에 대해 ITIS를 수행하였다. 테이프스테이션 분석을 기초로 하며, 선형 회수(로그 스케일로 H3K27me3의 경우 20개 세포, RNAPII의 경우 60개 세포로 줄임)를 관찰하였다(도 73), 따라서, ITIS는 낮은 세포 수를 요구하는 적용 분야에 사용할 수 있다.
본 발명자들은 샘플을 서열 분석하고 인간의 단편 수와 이. 콜라이의 단편 수를 플로팅하였다(도 74). 가장 낮은 세포 수(20~200개 세포)에 대해 대략 선형인, 세포 수와 방출된 단편 수 사이의 단조 관계(R2 = 0.46)가 관찰된다. 또한, 인간의 단편 수와 이. 콜라이의 단편 수 사이의 역의 관계가 관찰된다. 이는 이. 콜라이 오염이 CUT&RUN에서 관찰한 것과 유사하게 낮은 세포 수로 ITIS의 스파이크-인 프록시 역할을 할 수 있음이 확인된다.
낮은 세포 수의 H27me3 ITIS 프로파일을 조사하여 CUT&RUN 프로파일과 비교했을 때, 200개 세포까지 줄여 데이터 품질 손실이 없고 60개 세포에 대해 신호 대 잡음에서 단지 약간의 감소가 관찰되지만, 그럼에도 100개 세포에 의한 CUT&RUN에 대해 얻어진 것보다 더 우수하다(도 75). 본 발명자들은 ITIS가 낮은 세포 수에 적합하다고 결론 내린다.
세포 유형을 구별하는 것과 같은 여러 적용 분야에서는 단일 세포가 필요하며, 단편이 드물면 수백에서 수천 개의 개별 단일 세포 라이브러리로부터 디컨볼루션을 위한 충분한 정보를 제공해야 한다(Buenrostro et al., 2015; Cusanovich et al., 2018; Rosenberg et al., 2018). 단일 세포 적용의 경우, 본 발명자들은 최근 ATAC-seq에 적용된 다카라 ICELL8 시스템에서 ITIS를 평가하였다(Mezger et al., 2018). ICELL8은 개별 세포를 단일 웰로 분류하는 분배기를 포함하여 72x72 배열의 나노웰을 사용한다. 나노 분배기는 서브 세트의 웰에만 단일 세포를 침착시키고, 다른 것은 세포가 없거나 여러 세포를 얻는다. 따라서, ICELL8은 형광 현미경을 사용하여 배열을 영상화하고, 단일 세포가 있는 웰을 인식하고, 시약 및 프라이머를 단일 세포가 있는 웰에만 분배한다. ICELL8은 세포가 태그멘테이션 단계를 통해 온전하게 유지된다는 점에서 ITIS와 상용 가능하므로, 어댑터가 원위치 태그멘테이션에 의해 삽입된 후에 분배될 수 있다. 이에 이어, 단일 나노웰로부터 유래된 DNA 단편을 구별하기 위해 각각 수평 및 수직으로 배열된 72개의 i7 및 72개의 i5 바코드 프라이머로 증폭하는데, 그전에 페어드-엔드 서열 분석 중에 각 말단으로부터 판독된 다중화된 i7 및 i5 인라인 바코드를 사용하는 서열 분석을 위해 그 내용물을 결합한다.
단일 세포 ITIS는 태그멘테이션 후 PCR 증폭만을 필요로 하므로, 다른 플랫폼에 쉽게 적용된다. ATAC-seq는 세포 분류(Buenrostro et al., 2015) 및 ICELL8 나노분배(Mezger et al., 2018)에 의한 분배를 이용하여 구현되었으며 원칙적으로 액적 캡슐화에 직접 적용 가능하다(Zheng et al., 2017). ITIS가 ICELL8에 대해 개략적으로 설명된 것과 동일한 단계를 사용하는 조합 바코드를 포함하는 이들 및 기타 단일 세포 플랫폼에 유사하게 적용될 수 있을 것으로 기대된다.
각 세포를 캘리브레이션하기 위해, 염 처리를 생략하여 항체에 의해 특이적으로 결합된 부위에 중첩된 과민성 부위를 얻는다. 염 처리가 없으면 또한 오염된 이. 콜라이 DNA의 높은 수준의 태그멘테이션이 발생한다. 이. 콜라이 단편의 총 수에 대한 과민성 부위 단편의 총 수의 비율을 취함으로써, 배수성을 추론할 수 있는데, 그 이유는 과민성 부위는 배수성으로 스케일링되는 반면, 이. 콜라이 단편은 세포 성분으로 스케일링되기 때문이다. 이 배수성 캘리브레이션은 세포주기 단계 및 S기 진행에 대한 정보를 주는데, G2가 G1보다 2배의 비율을 가질 것이고, 그 사이 S기는 세포가 수거될 당시에 특정 세포에서 얼마나 많은 게놈이 복제되는지에 따라 결정되기 때문이다. 과민성 부위 단편 카운트는 또한 항체-표적화된 ITIS 부위를 캘리브레이션하는데, 둘 다 세포 배수성으로 스케일링되기 때문이다. 따라서, 달리 바람직하지 않은 태그멘테이션된 단편을 제거하지 않음으로써 본 발명자들은 단일 세포 프로파일링의 성능을 향상시킬 수 있는 유용한 세포 특이적 정보를 얻을 수 있다.
단일 세포에 대한 ITIS의 적용은 대량의 집단에도 적용 가능한 항체의 다중화를 가능하게 한다. 예를 들어, RNAPII 및 H3K27 아세틸화에 대한 항체를 이용한 다중화는 RNA-seq 및 ATAC-seq를 사용하여 달성된 것과 유사한 단일 세포에서의 프로모터 및 인핸서에 대한 정보를 제공할 것이다(Cusanovich et al., 2018). 다중 ITIS의 조합 가능성은 상이한 후생 유전체 특징에 대한 항체의 이용 가능성에 의해서만 제한되는 반면, 각각의 다중 OMIC 방법은 단일 쌍의 특징에 전용된다. 더욱이, 다중 ITIS는 "다중-OMIC" 전략에 필요한 2개의 완전히 다른 기질을 사용하는 이중성으로 야기되는 고유한 복잡성 없이 동일한 게놈 리드 아웃을 얻을 수 있다는 장점이 있다. 다중화 전략의 예는 1) 1차 토끼 항체; 2) 기니피그 항-토끼 2차 항체 및 세척; 3) 하나의 어댑터 세트와 복합체화된 pA-Tn5 및 세척; 4) 1차 마우스 항체; 5) 토끼 항-마우스 2차 항체 및 세척; 6) 제2 어댑터 세트와 복합체화된 pA-Tn5 및 세척의 연속적인 첨가일 것이며, 여기서 첫 번째 pA-Tn5로의 포화는 토끼 1차 및 기니피그 2차 IgG 에피토프를 가리고, pA-Tn5에 이용 가능한 토끼 항-마우스 2차 IgG만이 결합하게 둔다. 태그멘테이션은 Mg++의 첨가에 의해 통상적으로 수행되고 세포는 나노 분배되거나 다른 플랫폼을 위해 준비된다. 단계 1~3은 현재 프로토콜의 단계와 동일하며, 단계 4~6은 다른 IgG 분자를 사용하는 것을 제외하고 단계 1~3과 동일하다. 따라서 ITIS 및 CUT&RUN에 이미 사용된 재료(기니피그 항-토끼 및 토끼 항-마우스 2차 항체)로 수행할 수 있다. 원칙적으로 이 절차는 추가 다중화를 허용하는 스트렙타비딘/비오틴과 같은 다른 친화도 시스템에 적용할 수 있다.
다중화 전략의 예는 각각의 표적이 고유한 바코드로 표지될 수 있도록 항체+pA-Tn5+인덱싱된 어댑터 복합체를 제조하고 이들 복합체를 표적에 결합시키고 표적 특이적 인덱스로 태그멘테이션하는 연속적으로 라운드를 수행하는 것이다. 모자이크 말단과 시퀀서 어댑터 사이에 바코드 서열의 삽입은 제1의 1차 항체를 제2의 항체와 구별하기에 충분할 것이다. 원하는 수의 상이한 에피토프가 표적화된 후, 세포는 나노 분배되거나 다른 플랫폼을 위해 준비된다.
ITIS의 또 다른 고유한 적용은 동일한 DNA에서 서로 다른 두 단백질의 상호 작용 또는 근접성 또는 히스톤 변형을 감지할 수 있다는 것이다. 상기한 바와 같이, 항체+pA-Tn5+인덱싱된 어댑터 복합체 또는 더 간단하게 항체 A + pA-Tn5 + P5 어댑터 또는 항체 B + pA-Tn5 + P7 어댑터 복합체는 시험관 내에서 제조될 수 있고 이들 복합체는 투과화된 온전한 세포로 순차적으로 도입될 수 있다. 어댑터 교환을 피하기 위해 첫 번째 태크화가 완료된 후 두 번째 복합체가 도입될 것이다. 각 말단에 P5 및 P7 어댑터가 모두 있는 단편만 라이브러리 제조 중에 증폭될 수 있으므로 두 단백질이 있는 DNA 분자가 라이브러리에서 농축될 것이다. 이 접근법은 또한 DNA상의 두 표적 단백질의 상대적인 배향에 관한 정보를 제공할 것이다. 이 접근법의 가능한 적용은 H3K27me3 및 H3K4me3 히스톤 마크를 모두 갖는 2가 뉴클레오솜, 개척 전사 인자 및 협력 전사 인자 등을 포함한다.
또한, Tn5는 DNA를 태그멘테이션할 뿐만 아니라 광범위한 크기 범위의 DNA 삽입물을 삽입할 수 있다. 따라서, 염색질의 완전성을 보존하는 것이 바람직하고 DNA의 단편화를 방지해야 하는 적용에 사용될 수 있다.
실시예 11에 대한 참고 문헌(이들 각각은 그 전문이 참고로 포함됨)
Figure pct00036
특정 실시 양태가 본원에서 예시되고 설명되었지만, 당업자는 동일한 목적을 달성하기 위해 계산된 다양한 대안 및/또는 동등한 실시 양태 또는 구현들이 나타낸 실시 양태에 대체되고 범위를 벗어나지 않으면서 기술될 수 있음을 이해할 것이다. 당업자는 실시 양태가 다양한 방법으로 이용될 수 있음을 이해할 것이다. 본 출원은 본원에서 논의된 실시 양태의 임의의 응용 또는 변형을 포함하도록 의도된다. 그러므로 실시 양태는 특허 청구 범위 및 이의 등가물에 의해서만 제한되도록 명백하게 의도된다.
SEQUENCE LISTING <110> Fred Hutchinson Cancer Research Center <120> HIGH EFFICIENCY TARGETED IN SITU GENOME-WIDE PROFILING <130> 18-010-PCT <150> US 62/562,918 <151> 2017-09-25 <160> 4 <170> PatentIn version 3.5 <210> 1 <211> 26 <212> PRT <213> Artificial sequence <220> <223> polypeptide linker <400> 1 Asp Asp Asp Lys Glu Phe Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 20 25 <210> 2 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 2 ctgtctctta tacacatct 19 <210> 3 <211> 33 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 3 tcgtcggcag cgtcagatgt gtataagaga cag 33 <210> 4 <211> 34 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 4 gtctcgtggg ctcggagatg tgtataagag acag 34

Claims (67)

  1. 세포에서 DNA 서열에 대한 관심의 염색질 관련 인자의 결합 부위를 결정하는 원위치(in situ) 방법으로서,
    투과화된 세포를 관심의 염색질 관련 인자에 특이적으로 결합하는 제1 항체와 접촉시키는 단계로서 제1 항체는 복수의 트랜스포좀에 커플링되며, 복수의 트랜스포좀 각각은
    - 하나 이상의 트랜스포사제; 및
    - 제1 트랜스포사제 인식 부위를 포함하는 제1 DNA 분자 및
    제2 트랜스포사제 인식 부위를 포함하는 제2 DNA 분자
    를 포함하는 트랜스포존
    을 포함하는 것인 단계;
    트랜스포사제를 활성화시킴으로써, 관심의 염색질 관련 인자에 결합된 DNA의 서열을 절제하고 DNA 태그로 태그하는 단계로 하나 이상의 트랜스포사제는 제1 및 제2 DNA 분자를 염색질 DNA로 통합시킴으로써, 염색질 DNA를 절단하고 제1 및 제2 DNA 분자로 태그하는 단계;
    절제된 DNA를 단리하는 단계; 및
    절제된 DNA의 서열을 결정함으로써, 세포에서 하나 이상의 DNA의 서열에 대한 관심의 염색질 관련 인자의 결합을 맵핑하는 단계
    를 포함하는 방법.
  2. 제1항에 있어서, 항체는 하나 이상의 트랜스포사제에 간접적으로 커플링되는 것인 방법.
  3. 제2항에 있어서, 트랜스포사제는 제1 항체에 특이적으로 결합하는 특이적 결합제에 연결되는 것인 방법.
  4. 제1항에 있어서,
    세포를 제1 항체에 특이적으로 결합하는 제2 항체와 접촉시키는 단계를 추가로 포함하며, 트랜스포사제는 제2 항체에 특이적으로 결합하는 특이적 결합제에 연결되는 것인 방법.
  5. 제1항에 있어서,
    세포를 제1 항체에 특이적으로 결합하는 제2 항체와 접촉시키는 단계;
    세포를 제2 항체에 특이적으로 결합하는 제3 항체와 접촉시키는 단계를 추가로 포함하며,
    트랜스포사제는 제3 항체에 특이적으로 결합하는 특이적 결합제에 연결되는 것인 방법.
  6. 제3항 내지 제5항 중 어느 하나의 항에 있어서, 특이적 결합제는 단백질 A 또는 단백질 G 또는 제1 항체, 제2 항체 및/또는 제3 항체에 특이적으로 결합하는 제3 항체를 포함하는 것인 방법.
  7. 제1항에 있어서, 염색질 DNA의 서열에 대한 관심의 염색질 관련 인자의 결합은 직접적인 것인 방법.
  8. 제1항 내지 제7항 중 어느 하나의 항에 있어서, 관심의 염색질 관련 인자는 전사 인자인 방법.
  9. 제1항 내지 제8항 중 어느 하나의 항에 있어서, 세포는 고체 표면에 고정되는 것인 방법.
  10. 제9항에 있어서, 고체 표면은 마이크로타이터 플레이트의 벽 또는 비드를 포함하는 것인 방법.
  11. 제1항 내지 제10항 중 어느 하나의 항에 있어서, 제1 및/또는 제2 DNA 분자는 바코드를 추가로 포함하는 것인 방법.
  12. 제1항 내지 제11항 중 어느 하나의 항에 있어서, 제1 및/또는 제2 DNA 분자는 서열 분석 어댑터를 추가로 포함하는 것인 방법.
  13. 제1항 내지 제12항 중 어느 하나의 항에 있어서, 제1 및/또는 제2 DNA 분자는 보편적 프라이밍 부위를 추가로 포함하는 것인 방법.
  14. 제1항 내지 제13항 중 어느 하나의 항에 있어서, 하나 이상의 트랜스포사제는 Tn5 트랜스포사제를 포함하는 것인 방법.
  15. 제1항 내지 제13항 중 어느 하나의 항에 있어서, 하나 이상의 트랜스포사제는 Mu 트랜스포사제를 포함하는 것인 방법.
  16. 제1항 내지 제13항 중 어느 하나의 항에 있어서, 하나 이상의 트랜스포사제는 IS5 또는 IS91 트랜스포사제를 포함하는 것인 방법.
  17. 제1항 내지 제13항 중 어느 하나의 항에 있어서, 하나 이상의 트랜스포좀은 둘 이상의 상이한 트랜스포좀을 포함하고, 상이한 트랜스포좀은 상이한 DNA 서열을 염색질 DNA에 통합시키는 것인 방법.
  18. 제1항 내지 제17항 중 어느 하나의 항에 있어서, 생성된 DNA 단편을 단리하는 단계를 추가로 포함하는 방법.
  19. 제18항에 있어서, 단리된 핵산 단편을 분석하는 단계를 추가로 포함하는 방법.
  20. 제19항에 있어서, 단리된 핵산 단편을 분석하는 단계는 뉴클레오티드 서열을 결정하는 단계를 포함하는 것인 방법.
  21. 제20항에 있어서, 뉴클레오티드 서열은 증폭을 포함하거나 포함하지 않는 서열 분석 또는 혼성화 기술을 사용하여 결정되는 것인 방법.
  22. 제1항 내지 제21항 중 어느 하나의 항에 있어서, 세포는 원핵 세포인 방법.
  23. 제1항 내지 제21항 중 어느 하나의 항에 있어서, 세포는 진핵 세포인 방법.
  24. 제23항에 있어서, 세포는 인간 세포인 방법.
  25. 제1항 내지 제24항 중 어느 하나의 항에 있어서, 세포 및/또는 세포의 핵은 세포를 디기토닌과 접촉시킴으로써 투과화되는 것인 방법.
  26. 제1항 내지 제25항 중 어느 하나의 항에 있어서, 절제된 DNA를 염 분획법에 적용하는 단계를 추가로 포함하는 방법.
  27. 제1항 내지 제26항 중 어느 하나의 항에 있어서, 관심의 염색질 관련 인자와 관련된 하나 이상의 단백질의 정체를 결정하는 단계를 추가로 포함하는 방법.
  28. 제1항 내지 제27항 중 어느 하나의 항에 있어서, 하나 이상의 트랜스포좀의 분획은 공지된 양의 오염 DNA를 포함하고, 오염 DNA는 캘리브레이션에 사용될 수 있는 것인 방법.
  29. 제1항 내지 제28항 중 어느 하나의 항의 방법을 포함하는, 절제된 염색질 DNA의 라이브러리를 제조하는 방법.
  30. 세포에서 염색질 DNA 서열에 대한 관심의 염색질 관련 인자의 결합을 검출하는 방법으로서,
    가교 결합되지 않은 투과화된 세포를 관심의 염색질 관련를 특이적으로 인식하는 특이적 결합제와 접촉시키는 단계로서 특이적 결합제는 비활성 상태의 뉴클레아제 또는 트랜스포사제에 연결되는 것인 단계;
    뉴클레아제 또는 트랜스포사제를 활성화시킴으로써, 관심의 염색질 관련 인자에 결합된 DNA를 절제하는 단계;
    세포 밖으로 확산된 절제된 DNA를 단리하는 단계; 및
    절제된 DNA의 서열을 결정함으로써, 세포에서 DNA 서열에 대한 관심의 염색질 관련 인자의 결합을 맵핑하는 단계
    를 포함하는 방법.
  31. 제30항에 있어서, 염색질 DNA의 서열에 대한 관심의 염색질 관련 인자의 결합은 간접적인 것인 방법.
  32. 제30항에 있어서, 염색질 DNA의 서열에 대한 관심의 염색질 관련 인자의 결합은 직접적인 것인 방법.
  33. 제30항 내지 제32항 중 어느 하나의 항에 있어서, 관심의 염색질 관련 인자는 전사 인자인 방법.
  34. 제30항 내지 제33항 중 어느 하나의 항에 있어서, 세포는 고체 표면에 고정되는 것인 방법.
  35. 제34항에 있어서, 고체 표면은 마이크로타이터 플레이트의 벽 또는 비드를 포함하는 것인 방법.
  36. 제30항 내지 제35항 중 어느 하나의 항에 있어서, 절제된 염색질 DNA를 핵산 태그로 태그하는 단계를 추가로 포함하는 방법.
  37. 제36항에 있어서, 핵산 태그는 서열 분석 어댑터를 포함하는 것인 방법.
  38. 제36항 또는 제37항에 있어서, 핵산 태그는 바코드를 포함하는 것인 방법.
  39. 제36항 내지 제38항 중 어느 하나의 항에 있어서, 핵산 태그는 보편적 프라이밍 부위를 포함하는 것인 방법.
  40. 제30항 내지 제39항 중 어느 하나의 항에 있어서, 뉴클레아제는 활성화될 때, 염색질 관련 인자의 결합 부위의 어느 한쪽에서 DNA 서열을 절단하는 것인 방법.
  41. 제30항 내지 제40항 중 어느 하나의 항에 있어서, 뉴클레아제는 2가 양이온의 첨가에 의해 활성화될 수 있는 것인 방법.
  42. 제30항 내지 제41항 중 어느 하나의 항에 있어서, 뉴클레아제는 MNase인 방법.
  43. 제30항 내지 제42항 중 어느 하나의 항에 있어서, 뉴클레아제는 Ca2 + 이온에 의해 활성화되는 것인 방법.
  44. 제30항 내지 제43항 중 어느 하나의 항에 있어서, 뉴클레아제 활성은 킬레이트제의 첨가에 의해 켄칭되는 것인 방법.
  45. 제30항 내지 제39항 중 어느 하나의 항에 있어서, 트랜스포좀은
    - 하나 이상의 트랜스포사제; 및
    - 제1 트랜스포사제 인식 부위를 포함하는 제1 DNA 분자; 및
    제2 트랜스포사제 인식 부위를 포함하는 제2 DNA 분자
    를 포함하는 트랜스포존
    을 포함하며,
    하나 이상의 트랜스포사제는 제1 및 제2 DNA 분자를 염색질 DNA에 통합함으로써 염색질 DNA를 절단하고 제1 및 제2 DNA 분자로 태그하는 것인 방법.
  46. 제45항에 있어서, 제1 및/또는 제2 DNA 분자는 바코드를 추가로 포함하는 것인 방법.
  47. 제45항 또는 제46항에 있어서, 제1 및/또는 제2 DNA 분자는 서열 분석 어댑터를 추가로 포함하는 것인 방법.
  48. 제45항 내지 제47항 중 어느 하나의 항에 있어서, 제1 및/또는 제2 DNA 분자는 보편적 프라이밍 부위를 추가로 포함하는 것인 방법.
  49. 제45항 내지 제48항 중 어느 하나의 항에 있어서, 하나 이상의 트랜스포사제는 Tn5 트랜스포사제, Mu 트랜스포사제, IS5 또는 IS91 트랜스포사제, 또는 이들의 조합을 포함하는 것인 방법.
  50. 제30항 내지 제49항 중 어느 하나의 항에 있어서, 특이적 결합제는 항체인 방법.
  51. 제30항 내지 제50항 중 어느 하나의 항에 있어서, 생성된 DNA 단편을 단리하는 단계를 추가로 포함하는 방법.
  52. 제51항에 있어서, DNA 단편은 크기에 기초하여 단리되는 것인 방법.
  53. 제52항에 있어서, 단리된 핵산 단편을 분석하는 단계를 추가로 포함하는 방법.
  54. 제53항에 있어서, 단리된 핵산 단편을 분석하는 단계는 뉴클레오티드 서열을 결정하는 것을 포함하는 것인 방법.
  55. 제54항에 있어서, 뉴클레오티드 서열은 증폭을 포함하거나 포함하지 않는 서열 분석 또는 혼성화 기술을 사용하여 결정되는 것인 방법.
  56. 제30항 내지 제55항 중 어느 하나의 항에 있어서, 뉴클레아제 또는 트랜스 포사제는 융합 단백질의 일부인 방법.
  57. 제30항 내지 제56항 중 어느 하나의 항에 있어서, 뉴클레아제 또는 트랜스포사제는 링커를 사용하여 특이적 결합제에 연결되는 것인 방법.
  58. 제30항 내지 제57항 중 어느 하나의 항에 있어서, 세포는 원핵 세포인 방법.
  59. 제30항 내지 제58항 중 어느 하나의 항에 있어서, 세포는 진핵 세포인 방법.
  60. 제59항에 있어서, 세포는 인간 세포인 방법.
  61. 제30항 내지 제60항 중 어느 하나의 항에 있어서, 세포 및 세포의 핵은 세포를 디기토닌과 접촉시킴으로써 투과화되는 것인 방법.
  62. 제30항 내지 제61항 중 어느 하나의 항에 있어서, 절제된 DNA를 염 분획법에 적용하는 단계를 추가로 포함하는 방법.
  63. 제30항 내지 제62항 중 어느 하나의 항에 있어서, 상등액을 ChIP-seq에 적용하는 단계를 추가로 포함하는 방법.
  64. 제30항 내지 제63항 중 어느 하나의 항에 있어서, 관심의 염색질 관련 인자와 결합된 하나 이상의 단백질의 정체를 결정하는 단계를 추가로 포함하는 방법.
  65. 제64항에 있어서, 단백질의 정체를 결정하는 단계는 항체의 사용을 포함하는 것인 방법.
  66. 제65항에 있어서, 단백질의 정체를 결정하는 단계는 질량 분석법을 포함하는 것인 방법.
  67. 제30항 내지 제66항 중 어느 하나의 항의 방법을 포함하는, 절제된 염색질 DNA의 라이브러리를 제조하는 방법.
KR1020207012088A 2017-09-25 2018-09-25 고효율의 표적화된 원위치 게놈 전체 프로파일링 KR20200066648A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762562918P 2017-09-25 2017-09-25
US62/562,918 2017-09-25
PCT/US2018/052707 WO2019060907A1 (en) 2017-09-25 2018-09-25 HIGH PERFORMANCE TARGETED IN SITU PANGENOMIC PROFILING

Publications (1)

Publication Number Publication Date
KR20200066648A true KR20200066648A (ko) 2020-06-10

Family

ID=65811500

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207012088A KR20200066648A (ko) 2017-09-25 2018-09-25 고효율의 표적화된 원위치 게놈 전체 프로파일링

Country Status (10)

Country Link
US (2) US11733248B2 (ko)
EP (3) EP4339298A3 (ko)
JP (2) JP7241069B2 (ko)
KR (1) KR20200066648A (ko)
CN (1) CN111727248A (ko)
CA (1) CA3077270A1 (ko)
DK (2) DK4060041T3 (ko)
ES (1) ES2924185T3 (ko)
FI (1) FI4060041T3 (ko)
WO (1) WO2019060907A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022216133A1 (ko) * 2021-04-09 2022-10-13 주식회사 셀레믹스 간소화된 차세대 염기서열 분석 라이브러리 전처리 방법

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
ES2663234T3 (es) 2012-02-27 2018-04-11 Cellular Research, Inc Composiciones y kits para recuento molecular
ES2711168T3 (es) 2013-08-28 2019-04-30 Becton Dickinson Co Análisis masivo en paralelo de células individuales
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
EP4300099A3 (en) 2016-09-26 2024-03-27 Becton, Dickinson and Company Measurement of protein expression using reagents with barcoded oligonucleotide sequences
WO2019084043A1 (en) 2017-10-26 2019-05-02 10X Genomics, Inc. METHODS AND SYSTEMS FOR NUCLEIC ACID PREPARATION AND CHROMATIN ANALYSIS
EP3752832A1 (en) 2018-02-12 2020-12-23 10X Genomics, Inc. Methods characterizing multiple analytes from individual cells or cell populations
EP3788171B1 (en) * 2018-05-03 2023-04-05 Becton, Dickinson and Company High throughput multiomics sample analysis
US11932899B2 (en) 2018-06-07 2024-03-19 10X Genomics, Inc. Methods and systems for characterizing nucleic acid molecules
CN112805389A (zh) 2018-10-01 2021-05-14 贝克顿迪金森公司 确定5’转录物序列
US11845983B1 (en) 2019-01-09 2023-12-19 10X Genomics, Inc. Methods and systems for multiplexing of droplet based assays
EP3914728B1 (en) 2019-01-23 2023-04-05 Becton, Dickinson and Company Oligonucleotides associated with antibodies
EP3924505A1 (en) 2019-02-12 2021-12-22 10X Genomics, Inc. Methods for processing nucleic acid molecules
US11467153B2 (en) 2019-02-12 2022-10-11 10X Genomics, Inc. Methods for processing nucleic acid molecules
WO2021011433A1 (en) * 2019-07-12 2021-01-21 New York Genome Center, Inc Methods and compositions for scalable pooled rna screens with single cell chromatin accessibility profiling
US11939622B2 (en) 2019-07-22 2024-03-26 Becton, Dickinson And Company Single cell chromatin immunoprecipitation sequencing assay
WO2021092386A1 (en) 2019-11-08 2021-05-14 Becton Dickinson And Company Using random priming to obtain full-length v(d)j information for immune repertoire sequencing
WO2021146207A1 (en) 2020-01-13 2021-07-22 Becton, Dickinson And Company Methods and compositions for quantitation of proteins and rna
EP3872190A1 (en) 2020-02-26 2021-09-01 Antibodies-Online GmbH A method of using cut&run or cut&tag to validate crispr-cas targeting
WO2021231779A1 (en) 2020-05-14 2021-11-18 Becton, Dickinson And Company Primers for immune repertoire profiling
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
WO2022056309A1 (en) * 2020-09-11 2022-03-17 Fred Hutchinson Cancer Research Center Improved high efficiency targeted in situ genome-wide profiling
EP4001429A1 (en) 2020-11-16 2022-05-25 Antibodies-Online GmbH Analysis of crispr-cas binding and cleavage sites followed by high-throughput sequencing (abc-seq)
US11739443B2 (en) 2020-11-20 2023-08-29 Becton, Dickinson And Company Profiling of highly expressed and lowly expressed proteins
CN112553695B (zh) * 2021-02-23 2021-05-11 翌圣生物科技(上海)有限公司 鉴定靶蛋白染色质结合图谱的快速建库方法
CN113025731A (zh) * 2021-03-04 2021-06-25 宁夏医科大学总医院 一种基于靶向扩增子富集策略的高通量病原菌检测试剂盒
CN112795563A (zh) * 2021-03-23 2021-05-14 上海欣百诺生物科技有限公司 生物素化的转座体在回收CUT&Tag或ATAC-seq产物中的用途及方法
CN113046381A (zh) * 2021-04-12 2021-06-29 南华大学 用于分离生物体内特异性蛋白-dna复合体的方法、融合蛋白及其制备方法
EP4347884A1 (en) * 2021-05-24 2024-04-10 University of Essex Enterprises Limited Method and system for identifying genomic regions with condition sensitive occupancy/positioning of nucleosomes and/or chromatin
WO2023277763A1 (en) * 2021-06-28 2023-01-05 Chen Xingqi Method of preparing dna from formalin-fixed-paraffin-embedded (ffpe) tissue samples
CN113801915B (zh) * 2021-07-30 2023-01-24 生物岛实验室 获取目标rna结合蛋白靶rna的方法
CA3223731A1 (en) * 2021-08-11 2023-02-16 Illumina, Inc. Detection of analytes using targeted epigenetic assays, proximity-induced tagmentation, strand invasion, restriction, or ligation
CN114106196A (zh) * 2021-10-29 2022-03-01 陈凯 抗体-转座酶融合蛋白及其制备方法和应用
WO2023081243A1 (en) * 2021-11-03 2023-05-11 Toreador Therapeutics, Inc. Methods and systems for super-resolution study of therapies
WO2023212580A1 (en) * 2022-04-25 2023-11-02 Fred Hutchinson Cancer Center Profiling rna at chromatin targets in situ by antibody-targeted tagmentation
WO2024008891A1 (en) * 2022-07-07 2024-01-11 Cambridge Enterprise Limited Methods for mapping binding sites of compounds
WO2024049928A1 (en) * 2022-08-30 2024-03-07 Northeastern University Epigenetic analysis after single cell interactions using microfluidics
CN117385478A (zh) * 2023-04-28 2024-01-12 南京诺唯赞生物科技股份有限公司 一种组合物及研究蛋白质-dna互作基因文库的构建方法
CN117106857B (zh) * 2023-10-24 2024-02-09 北京大学 一种血浆游离染色质的检测方法、试剂盒及其应用

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU622426B2 (en) 1987-12-11 1992-04-09 Abbott Laboratories Assay using template-dependent nucleic acid probe reorganization
ATE138106T1 (de) 1988-07-20 1996-06-15 David Segev Verfahren zur amplifizierung und zum nachweis von nukleinsäuresequenzen
SG46445A1 (en) 1990-01-26 1998-02-20 Immunomedics Inc Vaccines against cancer and infectious diseases
US5427930A (en) 1990-01-26 1995-06-27 Abbott Laboratories Amplification of target nucleic acids using gap filling ligase chain reaction
PT700521E (pt) 1993-05-28 2003-10-31 Baylor College Medicine Metodo e espectrometro de massa para dessorcao e ionizacao de analitos
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
US5648211A (en) 1994-04-18 1997-07-15 Becton, Dickinson And Company Strand displacement amplification using thermophilic enzymes
EP0776376B1 (en) 1994-07-15 2001-11-21 Akzo Nobel N.V. Use of rna polymerase to improve nucleic acid amplification process
AT402203B (de) 1995-06-13 1997-03-25 Himmler Gottfried Dipl Ing Dr Verfahren zur transkriptionsfreien amplifizierung von nucleinsäuren
CA2255774C (en) 1996-05-29 2008-03-18 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions
US5866336A (en) 1996-07-16 1999-02-02 Oncor, Inc. Nucleic acid amplification oligonucleotides with molecular energy transfer labels and methods based thereon
US5965443A (en) 1996-09-09 1999-10-12 Wisconsin Alumni Research Foundation System for in vitro transposition
US5925545A (en) 1996-09-09 1999-07-20 Wisconsin Alumni Research Foundation System for in vitro transposition
NZ516848A (en) 1997-06-20 2004-03-26 Ciphergen Biosystems Inc Retentate chromatography apparatus with applications in biology and medicine
US6159736A (en) 1998-09-23 2000-12-12 Wisconsin Alumni Research Foundation Method for making insertional mutations using a Tn5 synaptic complex
WO2000066265A2 (en) 1999-04-27 2000-11-09 Ciphergen Biosystems, Inc. Probes for a gas phase ion spectrometer
US6406896B1 (en) 1999-08-02 2002-06-18 Wisconsin Alumni Research Foundation Transposase enzyme and method for use
WO2001068807A2 (en) 2000-03-16 2001-09-20 Fred Hutchinson Cancer Research Center Identification of in vivo dna binding loci of chromatin proteins using a tethered nucleotide modification enzyme
EP1339863A2 (en) 2000-12-05 2003-09-03 Wisconsin Alumni Research Foundation Double transposition methods for manipulating nucleic acids
US7527966B2 (en) 2002-06-26 2009-05-05 Transgenrx, Inc. Gene regulation in transgenic animals using a transposon-based vector
US7316903B2 (en) 2003-03-28 2008-01-08 United States Of America As Represented By The Department Of Health And Human Services Detection of nucleic acid sequence variations using phase Mu transposase
WO2004093645A2 (en) 2003-04-17 2004-11-04 Wisconsin Alumni Research Foundation Tn5 transposase mutants and the use thereof
US7608434B2 (en) 2004-08-04 2009-10-27 Wisconsin Alumni Research Foundation Mutated Tn5 transposase proteins and the use thereof
US7790379B2 (en) * 2005-05-19 2010-09-07 Universite De Geneve Mapping of proteins along chromatin by chromatin cleavage
ES2762866T3 (es) 2011-01-28 2020-05-26 Illumina Inc Reemplazo de nucleótidos por bibliotecas doblemente etiquetadas y direccionales
WO2013078470A2 (en) * 2011-11-22 2013-05-30 MOTIF, Active Multiplex isolation of protein-associated nucleic acids
DK2999784T4 (en) 2013-05-22 2023-02-20 Active Motif Inc Målrettet transposition til anvendelse i epigenetiske studier
CA2909972A1 (en) 2013-05-23 2014-11-27 The Board Of Trustees Of The Leland Stanford Junior University Transposition into native chromatin for personal epigenomics
US20160208323A1 (en) * 2013-06-21 2016-07-21 The Broad Institute, Inc. Methods for Shearing and Tagging DNA for Chromatin Immunoprecipitation and Sequencing
AU2015247779B2 (en) 2014-04-15 2021-06-24 Illumina, Inc. Modified transposases for improved insertion sequence bias and increased DNA input tolerance
EP3146046B1 (en) 2014-05-23 2020-03-11 Digenomix Corporation Haploidome determination by digitized transposons
EP3256604B1 (en) 2015-02-10 2020-03-25 Illumina, Inc. Methods and compositions for analyzing cellular components
WO2016156469A1 (en) * 2015-03-31 2016-10-06 Max-Delbrück-Centrum für Molekulare Medizin Genome architecture mapping on chromatin
US10934636B2 (en) 2015-08-12 2021-03-02 CeMM—FORSCHUNGSZENTRUM FÜR MOLEKULARE MEDIZIN GmbH Methods for studying nucleic acids
US11680253B2 (en) 2016-03-10 2023-06-20 The Board Of Trustees Of The Leland Stanford Junior University Transposase-mediated imaging of the accessible genome

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022216133A1 (ko) * 2021-04-09 2022-10-13 주식회사 셀레믹스 간소화된 차세대 염기서열 분석 라이브러리 전처리 방법

Also Published As

Publication number Publication date
ES2924185T3 (es) 2022-10-05
EP4339298A3 (en) 2024-04-17
JP2023015327A (ja) 2023-01-31
EP3688157B1 (en) 2022-04-27
EP3688157A4 (en) 2021-05-26
US11733248B2 (en) 2023-08-22
WO2019060907A1 (en) 2019-03-28
EP3688157A1 (en) 2020-08-05
AU2018335575A1 (en) 2020-04-16
CA3077270A1 (en) 2019-03-28
EP4060041A1 (en) 2022-09-21
EP4060041B1 (en) 2023-12-27
EP4339298A2 (en) 2024-03-20
CN111727248A (zh) 2020-09-29
DK3688157T3 (da) 2022-07-04
US11885814B2 (en) 2024-01-30
US20220228203A1 (en) 2022-07-21
JP7241069B2 (ja) 2023-03-16
FI4060041T3 (fi) 2024-03-26
JP2021500860A (ja) 2021-01-14
US20220214356A1 (en) 2022-07-07
DK4060041T3 (da) 2024-04-02

Similar Documents

Publication Publication Date Title
US20220228203A1 (en) High efficiency targeted in situ genome-wide profiling
CN108368540B (zh) 研究核酸的方法
Lambert et al. Defining the budding yeast chromatin‐associated interactome
US20160208323A1 (en) Methods for Shearing and Tagging DNA for Chromatin Immunoprecipitation and Sequencing
US20230332213A1 (en) Improved high efficiency targeted in situ genome-wide profiling
US20230227813A1 (en) Parallel analysis of individual cells for rna expression and dna from targeted tagmentation by sequencing
WO2002014550A9 (en) Transcription factor target gene discovery
AU2018335575B2 (en) High efficiency targeted in situ genome-wide profiling
JP2004537039A (ja) 試料中の多数のdna結合タンパク質およびdna相互作用を検出する方法並びにこれを実施するための装置、システムおよびキット
Marr Probing Genome-Wide Native Chromatin Structure via Histone Surface Accessibilities

Legal Events

Date Code Title Description
E902 Notification of reason for refusal