JP2021523719A - Ccctc結合因子バリアント - Google Patents

Ccctc結合因子バリアント Download PDF

Info

Publication number
JP2021523719A
JP2021523719A JP2020564128A JP2020564128A JP2021523719A JP 2021523719 A JP2021523719 A JP 2021523719A JP 2020564128 A JP2020564128 A JP 2020564128A JP 2020564128 A JP2020564128 A JP 2020564128A JP 2021523719 A JP2021523719 A JP 2021523719A
Authority
JP
Japan
Prior art keywords
cbs
ctcf
amino acid
variant
consensus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020564128A
Other languages
English (en)
Inventor
テイラー コットマン,レベッカ
テイラー コットマン,レベッカ
ジョン,ジェイ.キース
Original Assignee
ザ ジェネラル ホスピタル コーポレイション
ザ ジェネラル ホスピタル コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ザ ジェネラル ホスピタル コーポレイション, ザ ジェネラル ホスピタル コーポレイション filed Critical ザ ジェネラル ホスピタル コーポレイション
Publication of JP2021523719A publication Critical patent/JP2021523719A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1135Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against oncogenes or tumor suppressor genes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4703Inhibitors; Suppressors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1044Preparation or screening of libraries displayed on scaffold proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/40Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
    • C07K2319/43Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation containing a FLAG-tag
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • C07K2319/81Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本発明は、野生型CTCFのアミノ酸配列と配列が異なる、少なくとも1つのジンクフィンガーにおける少なくとも1つのアミノ酸残基を含む操作されたCCCTC結合因子(CTCF)バリアントであって、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで変異体CTCF結合配列(CBS)に結合し、変異体CBSは、コンセンサスCBSのヌクレオチド配列と配列が異なる少なくとも1つのヌクレオチド塩基を含み、野生型CTCFのアミノ酸配列と配列が異なる少なくとも1つのアミノ酸残基は、操作されたCTCFバリアントのZF7、ZF6、ZF5、ZF4、およびZF3のいずれかの位置−1、+1、+2、+3、+5、および+6におけるアミノ酸残基からなる群から選択される、操作されたCTCFバリアントに関する。

Description

優先権の主張
本出願は、2018年5月17日に出願された米国仮特許出願第62/672,682号明細書、および2019年4月2日に出願された米国仮特許出願第62/828,277号明細書の利益を主張する。前述の米国仮特許出願の全内容は、参照により本明細書に組み入れられる。
連邦支援による研究または開発
本発明は、アメリカ国立衛生研究所によって授与された助成金第GM118158号の下で政府援助により行われた。政府は、本発明におけるある一定の権利を有する。
本発明は、少なくとも一部には、変更したDNA結合特異性を有する操作されたCCCTC結合因子バリアントに関する。
CCCTC結合因子(CTCF)は、高次クロマチン構造を維持することによって必須のゲノムオーガナイザーとして作用し、一方で細胞分化におけるおよび遺伝子発現の促進または抑制における役割も有するマルチドメインタンパク質である(Ong and Corces, Nature Reviews Genetics (2014);Phillips and Corces, Cell (2009))。CTCFは、ゲノムのメガベースにまたがるトポロジカル関連ドメイン(TAD)、ならびに遺伝子クラスター内の微調整された遺伝子断絶または遺伝子活性化につながるより小型のサブTADを維持する(Ali et al., Current Opinion in Genetics & Development (2016);Nora et al., Nature (2012);Rao et al., Cell (2014))。加えて、CTCFは、転写の速度に影響を与えることによってmRNAスプライシングを調節することが見出されており、より最近では、二本鎖断裂における相同組み換え修復を促進することに関わっている(Shukla et al., Nature (2011);Hilmi et al., Science Advances (2017);Han et al., Scientific Reports (2016))。CTCFは、CTCF結合部位(CBS)を認識する11フィンガージンクフィンガー(ZF)アレイを介してゲノムのあらゆる場所で結合する。CBSは、典型的に、高度に保存された15bpのコア配列を有して、長さが40bpである。
本発明は、少なくとも一部には、野生型CTCFよりも高いアフィニティーで変異体CBSに結合し得る操作されたCTCFバリアントの開発に基づく。
本発明は、野生型CTCFのアミノ酸配列と配列が異なる、少なくとも1つのジンクフィンガーにおける少なくとも1つのアミノ酸残基を含む操作されたCCCTC結合因子(CTCF)バリアントであって、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで変異体CTCF結合配列(CBS)に結合し、変異体CBSは、コンセンサスCBSのヌクレオチド配列と配列が異なる少なくとも1つのヌクレオチド塩基を含み、野生型CTCFのアミノ酸配列と配列が異なる少なくとも1つのアミノ酸残基は、操作されたCTCFバリアントのZF7、ZF6、ZF5、ZF4、およびZF3のいずれかの位置−1、+1、+2、+3、+5、および+6におけるアミノ酸残基からなる群から選択される、操作されたCTCFバリアントに関する。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置2にチミン(T)、アデニン(A)、またはグアニン(G)残基を有する変異体CTCF結合配列(CBS)に結合し、操作されたCTCFは、ZF7の位置+3にアミノ酸残基トレオニン、アスパラギン、またはヒスチジンを含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置2にG残基を有する変異体CBSに結合し、操作されたCTCFは、ZF7の位置+2〜+6にアミノ酸配列DHLQT、EHLNV、AHLQV、EHLRE、DHLQV、EHLKV、EHLVV、DHLRT、またはDHLATを含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置3にT、G、またはC残基を有する変異体CBSに結合し、操作されたCTCFは、ZF7の位置−1〜+3に:アミノ酸配列RKHDもしくはRRSDを含み、変異体CBSはコンセンサスCBSモチーフの位置3にT残基を有する;アミノ酸配列RKAD、IPRI、RKHD、もしくはRKDDを含み、変異体CBSはコンセンサスCBSモチーフの位置3にG残基を有する;または、アミノ酸配列GIVN、ELLN、QALL、もしくはPHRMを含み、変異体CBSはコンセンサスCBSモチーフの位置3にC残基を有する。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置5にT、G、またはA残基を有する変異体CBSに結合し、操作されたCTCFは、ZF6の位置+2〜+6に:アミノ酸配列NAMKR、GNMAR、EGMTR、SNMVR、もしくはNAMRGを含み、変異体CBSはコンセンサスCBSモチーフの位置5にT残基を有する;または、アミノ酸配列EHMGR、DHMNR、THMKR、EHMRR、もしくはTHMNRを含み、変異体CBSはコンセンサスCBSモチーフの位置5にG残基を有する。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置6にT、G、またはC残基を有する変異体CBSに結合し、操作されたCTCFは、ZF6の位置−1〜+3に:アミノ酸配列MNESもしくはHRESを含み、変異体CBSはコンセンサスCBSモチーフの位置6にT残基を有する;または、アミノ酸配列RPDT、RTDI、もしくはRHDTを含み、変異体CBSはコンセンサスCBSモチーフの位置6にG残基を有する。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置7にC、A、またはT残基を有する変異体CBSに結合し、操作されたCTCFは、ZF5の位置+2〜+6に:アミノ酸配列HGLKV、HRLKE、HALKV、SRLKE、もしくはDGLRVを含み、変異体CBSはコンセンサスCBSモチーフの位置7にT残基を有する;アミノ酸配列HTLKVもしくはHGLKVを含み、変異体CBSはコンセンサスCBSモチーフの位置7にA残基を有する;または、アミノ酸配列SRLKE、HRLKE、もしくはNRLKEを含み、変異体CBSはコンセンサスCBSモチーフの位置7にC残基を有する。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置8にC、A、またはT残基を有する変異体CBSに結合し、操作されたCTCFは、ZF5の位置+2〜+6に:アミノ酸配列ATLKR、QALRR、GGLVR、またはHGLIRを含み、変異体CBSはコンセンサスCBSモチーフの位置8にT残基を有する;アミノ酸配列ANLSR、TGLTR、HGLVR、またはGGLTRを含み、変異体CBSはコンセンサスCBSモチーフの位置8にA残基を有する;アミノ酸配列HTLRR、TVLKR、ADLKR、またはHGLRRを含み、変異体CBSはコンセンサスCBSモチーフの位置8にC残基を有する。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置10にT、A、またはC残基を有する変異体CBSに結合し、操作されたCTCFは、ZF4の位置+2〜+6に:アミノ酸配列AHLRKを含み、変異体CBSはコンセンサスCBSモチーフの位置10にT残基を有する;アミノ酸配列AKLRV、EKLRI、もしくはAKLRIを含み、変異体CBSはコンセンサスCBSモチーフの位置10にA残基を有する;または、アミノ酸配列TKLKVを含み、変異体CBSはコンセンサスCBSモチーフの位置10にC残基を有する。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置11にT、A、またはC残基を有する変異体CBSに結合し、操作されたCTCFは、ZF4の位置+2〜+6に:アミノ酸配列ATLRRもしくはRRLDRを含み、変異体CBSはコンセンサスCBSモチーフの位置11にT残基を有する;アミノ酸配列TNLRR、ANLRR、もしくはGNLTRを含み、変異体CBSはコンセンサスCBSモチーフの位置11にA残基を有する;または、アミノ酸配列AMLKR、HMLTR、AMLRR、もしくはTMLRRを含み、変異体CBSはコンセンサスCBSモチーフの位置11にC残基を有する。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置13にT、A、またはC残基を有する変異体CBSに結合し、操作されたCTCFは、ZF3の位置+2〜+6に:アミノ酸配列QQLIV、SQLIV、QQLLV、GELVV、もしくはQQLLIを含み、変異体CBSはコンセンサスCBSモチーフの位置13にT残基を有する;アミノ酸配列GQLIV、GQLTV、GKLVT、TELII、もしくはQGLLVを含み、変異体CBSはコンセンサスCBSモチーフの位置13にA残基を有する;または、アミノ酸配列QQLLT、GQLLT、GELLT、もしくはQQLLIを含み、変異体CBSはコンセンサスCBSモチーフの位置13にC残基を有する。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置2、6、7、および10にそれぞれA、G、T、およびT残基を有する変異体CBSに結合し、操作されたCTCFは、(i)操作されたCTCFのZF4の位置+2〜+6にアミノ酸配列AKLKK、AKLRK、AHLRV、AKLRV、またはSKLRL;(ii)操作されたCTCFのZF5の位置+2〜+6にアミノ酸配列ERLRV、NRLKV、SRLKE、またはNRLKV;(iii)操作されたCTCFのZF6の位置−1〜+3にアミノ酸配列RPDT、RTET、またはRADV;および(iv)操作されたCTCFのZF7の位置+2〜+6にアミノ酸配列DNLLA、SNLLV、DNLMA、またはDNLRV、を含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置2、6、7、および10にそれぞれG、G、T、およびT残基を有する変異体CBSに結合し、操作されたCTCFは、(i)操作されたCTCFのZF4の位置+2〜+6にアミノ酸配列GHLKK、AHLRK、またはGKLRI;(ii)操作されたCTCFのZF5の位置+2〜+6にアミノ酸配列SRLKE、DALRR、DGLKR、またはTRLRE;(iii)操作されたCTCFのZF6の位置−1〜+6にアミノ酸配列RPDTMKRまたはRTENMKM;および(iv)操作されたCTCFのZF7の位置+2〜+6にアミノ酸配列EHLKV、DHLLA、またはHHLDV、を含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置2、5、および11にそれぞれA、G、およびA残基を有する変異体CBSに結合し、操作されたCTCFは、(i)操作されたCTCFのZF4の位置+2〜+6にアミノ酸配列SNLRR、GNLVR、GNLRR、GNLKR、ANLRR、NNLRR、またはTNLRR;(ii)操作されたCTCFのZF6の位置+2〜+6にアミノ酸配列EHMKR、EHMRR、THMKR、EHMNR、またはEHMAR;および(iii)操作されたCTCFのZF7の位置+2〜+6にアミノ酸配列DNLLT、DNLLV、DNLQT、DNLLA、DNLAT、DNLQA、DNLMA、またはDNLMT、を含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置2、5、および11にそれぞれG、G、およびA残基を有する変異体CBSに結合し、操作されたCTCFは、(i)操作されたCTCFのZF4の位置+2〜+6にアミノ酸配列GNLVR、GNLRR、GNLAR、GNLMR、ANLRR、SNLRR、またはNNLRR;(ii)操作されたCTCFのZF6の位置+2〜+6にアミノ酸配列EHMNR、EHMKR、EHMRR、SHMNR、SHMRR、THMKR、またはDHMNR;および(iii)操作されたCTCFのZF7の位置+2〜+6にアミノ酸配列EHLKV、EHLAE、STLNE、DHLQV、EHLNV、DHLNT、EHLQA、またはHHLMH、を含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置6、7、および10にそれぞれG、T、およびT残基を有する変異体CBSに結合し、操作されたCTCFは、(i)操作されたCTCFのZF4の位置+2〜+6にアミノ酸配列GHLKK、AHLKK、TKLRL、TKLKL、GHLRK、THLKK、またはAHLRK;(ii)操作されたCTCFのZF5の位置+2〜+6にアミノ酸配列TRLKEまたはSRLKE;および(iii)操作されたCTCFのZF6の位置−1〜+3にアミノ酸配列RADN、RHDT、RRDT、RPDT、RTSS、またはRNDT、を含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFのアミノ酸配列と配列が異なる、少なくとも1つのジンクフィンガーにおける少なくとも1つのアミノ酸残基を含み、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで変異体CTCF結合配列(CBS)に結合し、変異体CBSは、コンセンサスCBSのヌクレオチド配列と配列が異なる少なくとも1つのヌクレオチド塩基を含み、野生型CTCFのアミノ酸配列と配列が異なる少なくとも1つのアミノ酸残基は、操作されたCTCFバリアントのZF7、ZF6、ZF5、ZF4、およびZF3のいずれかの位置−1、+1、+2、+3、+5、および+6におけるアミノ酸残基からなる群から選択される。
一部の実施形態において、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置2においてコンセンサスCBSと異なる変異体CTCF結合配列(CBS)に結合する操作されたCCCTC結合因子(CTCF)バリアントであって、操作されたCTCFは、ZF7の位置+3にアミノ酸残基トレオニン、アスパラギン、またはヒスチジンを含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置2にCからGへの変異を有する変異体CBSに結合し、操作されたCTCFは、ZF7の位置+2〜+6にアミノ酸配列DHLQT、EHLNV、AHLQV、EHLRE、DHLQV、EHLKV、DHLQV、EHLVV、DHLRT、DHLAT、またはDHLQTを含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置3においてコンセンサスCBSと異なる変異体CBSに結合し、操作されたCTCFは、ZF7の位置−1〜+3にアミノ酸配列RKHD、RRSD、GIVN、ELLN、またはPHRMを含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置5においてコンセンサスCBSと異なる変異体CBSに結合し、操作されたCTCFは、ZF6の位置+2〜+6にアミノ酸配列NAMKR、EHMGR、DHMNR、THMKR、EHMRR、またはTHMNRを含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置6においてコンセンサスCBSと異なる変異体CBSに結合し、操作されたCTCFは、ZF6の位置−1〜+3にアミノ酸配列MNES、HRES、RPDT、RTDI、またはRHDTを含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置7においてコンセンサスCBSと異なる変異体CBSに結合し、操作されたCTCFは、ZF5の位置+2〜+6にアミノ酸配列HGLKV、HRLKE、HALKV、SRLKE、DGLRV、HTLKV、またはNRLKEを含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置8においてコンセンサスCBSと異なる変異体CBSに結合し、操作されたCTCFは、ZF5の位置+2〜+6にアミノ酸配列ATLKR、QALRR、GGLVR、HGLIR、ANLSR、TGLTR、HGLVR、GGLTR、HTLRR、TVLKR、ADLKR、またはHGLRRを含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置10においてコンセンサスCBSと異なる変異体CBSに結合し、操作されたCTCFは、ZF4の位置+2〜+6にアミノ酸配列AHLRK、AKLRV、GGLGL、AKLRI、TKLKV、またはSKLRVを含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置11においてコンセンサスCBSと異なる変異体CBSに結合し、操作されたCTCFは、ZF4の位置+2〜+6にアミノ酸配列ATLRR、RRLDR、TNLRR、ANLRR、GNLTR、AMLKR、HMLTR、AMLRR、またはTMLRRを含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置13においてコンセンサスCBSと異なる変異体CBSに結合し、操作されたCTCFは、ZF3の位置+2〜+6にアミノ酸配列QQLIV、SQLIV、QQLLV、GELVV、QQLLI、GQLIV、GQLTV、TELII、QGLLV、QQLLT、GQLLT、GELLT、またはQQLLIを含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置2、6、7、および10においてコンセンサスCBSと異なる変異体CBSに結合し、操作されたCTCFは、
(i)ZF4の位置+2〜+6にアミノ酸配列AKLKK、AKLRK、AHLRV、AKLRV、またはSKLRL;
(ii)ZF5の位置+2〜+6にアミノ酸配列ERLRV、NRLKV、SRLKE、またはNRLKV;
(iii)ZF6の位置−1〜+3にアミノ酸配列RPDT、RTET、またはRADV;および
(iv)ZF7の位置+2〜+6にアミノ酸配列DNLLA、SNLLV、DNLMA、またはDNLRV
を含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置2、6、7、および10においてコンセンサスCBSと異なる変異体CBSに結合し、操作されたCTCFは、
(i)ZF4の位置+2〜+6にアミノ酸配列GHLKK、AHLRK、またはGKLRI;
(ii)ZF5の位置+2〜+6にアミノ酸配列SRLKE、DALRR、DGLKR、またはTRLRE;
(iii)ZF6の位置−1〜+36にアミノ酸配列RPDTMKRまたはRTENMKM;および
(iv)ZF7の位置+2〜+6にアミノ酸配列EHLKV、DHLLA、またはHHLDV
を含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置2、5、および11においてコンセンサスCBSと異なる変異体CBSに結合し、操作されたCTCFは、
(i)ZF4の位置+2〜+6にアミノ酸配列SNLRR、GNLVR、GNLRR、GNLKR、ANLRR、NNLRR、またはTNLRR;
(ii)ZF6の位置+2〜+6にアミノ酸配列EHMKR、EHMRR、THMKR、EHMNR、またはEHMAR;および
(iii)ZF7の位置+2〜+6にアミノ酸配列DNLLT、DNLLV、DNLQT、DNLLA、DNLAT、DNLQA、DNLMA、またはDNLMT
を含む。
一部の実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置2、5、および11においてコンセンサスCBSと異なる変異体CBSに結合し、操作されたCTCFは、
(i)ZF4の位置+2〜+6にアミノ酸配列GNLVR、GNLRR、GNLAR、GNLMR、ANLRR、SNLRR、またはNNLRR;
(ii)ZF6の位置+2〜+6にアミノ酸配列EHMNR、EHMKR、EHMRR、SHMNR、SHMRR、THMKR、またはDHMNR;および
(iii)ZF7の位置+2〜+6にアミノ酸配列EHLKV、EHLAE、STLNE、DHLQV、EHLNV、DHLNT、EHLQA、またはHHLMH
を含む。
一実施形態において、操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで、コンセンサスCBSモチーフの位置6、7、および10においてコンセンサスCBSと異なる変異体CBSに結合し、操作されたCTCFは、
(i)ZF4の位置+2〜+6にアミノ酸配列GHLKK、AHLKK、TKLRL、TKLKL、GHLRK、THLKK、またはAHLRK;
(ii)ZF5の位置+2〜+6にアミノ酸配列TRLKEまたはSRLKE;および
(iii)ZF6の位置−1〜+3にアミノ酸配列RADN、RHDT、RRDT、RPDT、RTSS、またはRNDT
を含む。
一部の実施形態において、操作されたCTCFバリアントは、コヒーシン(cohesion)と相互作用してエンハンサー−プロモーターループの形成を媒介して遺伝子発現をモジュレートする。
別の態様において、本発明は、それを必要とする対象を治療する方法を特質とし、方法は、本明細書において記載される操作されたCTCFバリアントの治療上有効量を対象に投与するステップを含む。
一部の実施形態において、対象は癌を有し得る。
別の態様において、本発明は、1つまたは複数の変異を持つCBSの制御下にある遺伝子の発現を活性化するまたは抑制する方法を特質とし、方法は、請求項1から15のいずれか一項に記載の操作されたCTCFと遺伝子における関心対象の配列とを接触させ、それにより遺伝子の発現が調節されるステップを含む。
別の態様において、本発明は、本明細書において記載される操作されたCTCFバリアントを含む薬学的組成物を特質とする。
別の態様において、本発明は、遺伝子の調節のための遺伝子発現システムを特質とし、システムは、本明細書において記載される操作されたCTCFバリアントをコードする核酸を含む。
別の態様において、本発明は、請求項1から15のいずれか一項に記載の操作されたCTCFバリアントと関心対象の配列とを接触させて結合複合体を形成し、それによりクロマチンの構造が変更されるステップを含む、クロマチンの構造を変更する方法を特質とする。
別の態様において、本発明は、1つまたは複数の変異を持つCBSの制御下にある遺伝子の発現を活性化するまたは抑制する方法を特質とし、方法は、1つまたは複数の変異を持つCBSと本明細書において記載される操作されたCTCFバリアントとを接触させるステップを含む。
別の態様において、本発明は、本明細書において記載される操作されたCTCFバリアントを含むキットを特質とする。
本開示において、「含む(comprises)」、「含む(comprising)」、「含有する(containing)」、および「有する(having)」等は、米国特許法においてそれらに帰する意味を有し、「含む(includes)」、「含む(including)」等を意味し得;「から本質的になる」または「本質的に構成する」は、同様に米国特許法において帰される意味を有し、当該用語は制約がなく、列挙されるものの基本的なまたは新規な特徴が、列挙されるもの以外のものの存在によって変化しない限りにおいて、列挙されるもの以外のものの存在を可能にするが、先行技術実施形態を除外する。
別様に定義されていない限り、本明細書において使用されるすべての技術的および科学的用語は、本発明が属する技術分野における当業者によって一般に理解されるものと同じ意味を有する。方法および材料は、本発明における使用のために本明細書において記載され、当技術分野において公知の他の適切な方法および材料も使用され得る。材料、方法、および例は単なる例示であり、限定的であることを意図されない。本明細書において言及されるすべての刊行物、特許出願、特許、配列、データベースエントリー、および他の参考文献は、それらの全体を参照により組み入れられる。矛盾する場合、定義を含めた本明細書が制御するであろう。
本発明の他の特質および利点は、以下の詳細な説明および図面から、ならびに特許請求の範囲から明白であろう。
例として与えられるが、記載される具体的な実施形態に本発明を限定することを意図されない以下の詳細な説明は、参照により本明細書に組み入れられる添付の図面と併せて理解され得る。
CTCF結合部位における例示的な11フィンガーCTCFジンクフィンガーアレイタンパク質−DNA相互作用の略図。11フィンガーアレイの各ジンクフィンガーは、タンパク質−DNA塩基接触が、各アルファ−ヘリックスの位置−1、2、3、および6におけるアミノ酸によってなされる認識アルファ−ヘリックスを含有した。位置2はここに示されていない結合部位の反対側の鎖と交差鎖接触することから、ここでは位置−1、3、および6のみを描写した。結合部位に対する配列は、ChIP−seqデータ(Nakahashi et al., 2013)に由来した。結合部位を、3つのセグメント:5’隣接(灰色の線)、コア(黒色の線)、および3’隣接(薄い灰色の線)に分割した。各セグメント内の各ヌクレオチドの位置に番号が付されている。ダッシュは、ジンクフィンガーアレイと結合部位との間の公知のDNA−タンパク質接触(黒色)、および理論的DNA−タンパク質接触(灰色)を示す。アレイのジンクフィンガー3〜7(白色)は、コア配列とタンパク質−DNA接触する(黒色の太線を引かれた)。CTCF結合DNAフラグメントのChIP−exoおよびDNAseIフットプリンティングによって示唆されるように(Hashimoto, H. et al., 2017)、ジンクフィンガー8とジンクフィンガー9〜11との間に考え得る5〜6個の塩基対ギャップ(水平の破線によって表される)があった。CTCFは、結合部位の3’末端に結合するタンパク質のN末端側を有して、3’−5’方向でその標的部位に結合することに留意されたい。 B2Hベータ−ガラクトシダーゼレポーターアッセイの略図。B2Hレポーターアッセイは、Gal4のGal11P媒介性の導きを使用して、結合を示した。大腸菌(E.coli)は、2つのプラスミドで形質転換される:一方のプラスミドは、ジンクフィンガー−Gal11P融合体およびRNAポリメラーゼのアルファN末端ドメイン(α−NTD)−Gal4融合体の両方をコードし;第2のプラスミドは、β−ガラクトシダーゼをコードするlacZ遺伝子の発現を推進する弱いプロモーターの上流に改変可能な結合配列を含有した。標的配列に結合し得るジンクフィンガー−Gal11P融合体は、プロモーターにα−NTD−Gal4融合体を導き、それによってlacZの発現を誘導した。β−ガラクトシダーゼレベルのこの増加を、単純な比色分析ONPGに基づくアッセイによって検出した。CTCFジンクフィンガーアレイ−gal11P融合体は、この略図においてCTCF結合部位に結合しており、lacZの上流にあるプロモーター領域にα−NTD−Gal4融合体を導き、発現につながった。 B2H B−galアッセイにおける倍活性化は、11フィンガーアレイのCTCFジンクフィンガー1〜11が全長標的部位と相互作用する場合に最大であった。5つの標的部位(凡例に示された配列)を、全CTCFジンクフィンガーアレイおよび4つの異なる部分集合(x軸に示される)とともに試験した。CTCF結合部位の最も高度に保存された配列であるコア配列(黒色かつ太字)を、独立して、およびHashimoto, H. et al. Mol. Cell. 2017(黒色および薄い灰色);Persikov, A and Singh, M. NAR. 2014(中間の灰色);およびNakahashi, H. et al., Cell Rep. 2013(非常に薄い灰色および濃い灰色)に由来する異なる分量の隣接配列を用いて試験した。陽性対照は、細菌およびヒト背景において公知の配列に強く結合する公知の3フィンガージンクフィンガーの結合活性を反映する。陰性対照は、RNAポリメラーゼのアルファN末端ドメイン(α−NTD)−Gal4融合体がlacZのプロモーターに直接導かれない場合のベースラインのベータ−ガラクトシダーゼレベルを反映する。このベースラインを使用して、CTCFジンクフィンガーアレイがgal11Pに融合する場合の倍活性化を算出した。 CTCFジンクフィンガーアレイは、CTCF結合部位内のコア領域のある特定の位置における配列変化に敏感である。40bpの参照CBSの各位置における4つの考え得るヌクレオチドのそれぞれを、B2HyにおいてCTCFジンクフィンガーアレイを結合する能力について試験した。倍活性化は、バックグラウンドβ−ガラクトシダーゼレベルを上回る結合活性を反映する(バックグラウンドβ−galレベルは、gal11Pに融合したジンクフィンガーアレイを有しないgal4−RNAポリメラーゼ融合体の存在下における、各結合部位を有するサンプルからのβ−galのレベルから獲得される)。上の参照配列は、3つのセグメント:5’隣接(濃い灰色で線を引かれた)、コア(黒色で線を引かれた)、および3’隣接(灰色で線を引かれた)に分割されている。各セグメント内の各ヌクレオチドの位置に番号が付されている。ダッシュは、ジンクフィンガーアレイと結合部位との間の公知のDNA−タンパク質接触(黒色)、および理論的DNA−タンパク質接触(灰色)を示す。結合部位のコア配列1〜15(黒色、太字)は、アレイのジンクフィンガー3〜7(白色、黒色の輪郭)と相互作用し、結合配列の変化に最も敏感であるように見える。5’隣接配列ならびに3’隣接配列への変更は、結合に負の影響を与えなかった。 CTCF結合部位の最大結合能。参照結合部位(下部)に改変を行って、ヌクレオチド変化を組み合わせ、それは個々にCTCFジンクフィンガーアレイの結合活性の増加を示した。コア配列モチーフは太字であり、一方で加えられた変化には下線が引かれている。11フィンガーCTCFジンクフィンガーアレイの結合活性を、B2Hベータ−ガラクトシダーゼレポーターアッセイにおいて三つ組で定量した。倍活性化は、DNA結合タンパク質が存在しない場合のバックグラウンドレベルを上回る結合活性を反映する。 B2Hベータ−ラクタマーゼ阻害剤選択の略図。選択システムは、CBSへのジンクフィンガーアレイの結合の成功が、lacZの代わりに、抗生物質のベータ−ラクタマーゼクラスの阻害剤であるBlaC発現を推進する点を除いて、レポーターシステムと同じ構成要素を含有した。BlaCの発現は、カルベニシリンプレート上での成長を可能にした。選択は、ベータラクタマーゼの阻害剤であるクラブラン酸の添加によって推進された。BlaCの低レベルの発現は、カルベニシリンプレート上での成長をもたらし得るが、クラブラン酸の添加は、BlaC活性を阻害し、偽陽性の枯渇および結合部位に加えられた任意の改変に対する強い結合因子のさらなる富化をもたらす。gal11Pに融合したジンクフィンガーアレイにおける変異のライブラリーを、低ストリンジェンシーな条件、それに続くクラブラン酸の勾配での選択により、変更した結合配列への結合因子に対して選択した。勾配の最も高いストリンジェンシーな末端での成長は、新たな結合配列への強い結合因子である、ジンクフィンガーアレイにおけるバリアントを示した。 図7A〜C 変更したCTCF結合部位に対するバリアントの結合活性。選択プレートの高ストリンジェンシーな勾配から採取されたバリアントを、コア配列の位置2(灰色の星)における4つすべての考え得るヌクレオチドを表す配列に対する結合活性について試験した。選択から取り出されたバリアントのアミノ酸配列がヒートマップの上に挙げられており、コア配列の位置2に存在するヌクレオチドをy軸に示した。図7A:位置2におけるヌクレオチドがTである。図7B:位置2におけるヌクレオチドがAである。図7C:結合におけるヌクレオチドを、ベータ−ガラクトシダーゼレポーターシステムおよび比色分析ONPGアッセイによって定量した。野生型結合部位配列に対する野生型CTCFジンクフィンガーアレイの結合活性を白色の点によって示した。各ヌクレオチド変化に対するZF7アルファ認識ヘリックスの略図が左側にある。それは、結合配列におけるトリプレットと相互作用するアミノ酸残基を含んだ。アルファヘリックスの位置3におけるアミノ酸は、ライブラリーにおいて様々に異なり、「X」によって示される。 図7−1と同様である。 認識ヘリックス内の変動の増加は、より強い結合因子をもたらした。ライブラリーにおける差異のために4つのアミノ酸を標的にして、選択におけるより高い柔軟性を可能にし、選定される改変された結合部位へのより強い結合因子を生んだ。コア配列の位置2(灰色の星)におけるC:G変化を標的にするZF7を、拡大手法を使用してバリアントに対して選択した。各アミノ酸コドンを、示される部位(「X」)で「VNS」コドンと置き換えた。12個のコロニーを選択の高ストリンジェンシーな末端から採取し、示されるヌクレオチドがコア配列の位置2にある場合にCTCF結合部位に結合するそれらの能力について試験した。選択されたバリアントのアミノ酸配列はx軸に挙げられており、コア配列の位置2におけるヌクレオチドはy軸にある。野生型結合配列に対する野生型ジンクフィンガーアレイ結合活性が白色の点によって示されている。 図9A〜C CBSにおけるコアモチーフの位置3での変更した結合部位配列を結合する選択されたバリアント。バリアントのライブラリーに対して実施された選択は、11フィンガーCTCFジンクフィンガーアレイのZF7における認識ヘリックスの位置−1〜3における変更に集中した。「VNS」コドンを、「X」によって示される位置に導入し、CBSにおけるコアモチーフの位置3(灰色の星)での3つの異なるヌクレオチド変化に対して選択した。直接的なタンパク質−DNA接触は破線によって示されている。(A)結合部位におけるA:T変化に対して実施された選択、(B)A:G変化、(C)A:C変化。取り出されたほとんどのバリアントは、変更した特異性の代わりに、緩和した結合特異性を有した。 図9−1と同様である。 図9−1と同様である。 図10A〜B CBSにおけるコアモチーフの位置5での配列変化を標的にして実施された選択。バリアントのライブラリーに対して実施された選択は、ZF6認識ヘリックスの位置2〜6における変更に集中し、4番目の位置は変化しないままであった。「VNS」コドンを、「X」によって示される位置に導入し、CBSのコアモチーフにおけるコアモチーフの位置5(灰色の星)での3つの異なるヌクレオチド変化に対して選択した。直接的なタンパク質−DNA接触を破線によって示した。(A)結合部位におけるC:T変化に対して実施された選択、(B)C:G変化。C:A変化に対する選択プレート上での勾配の低ストリンジェンシーな末端を越えて成長したバリアントはなく、弱い/不十分な結合因子と見なされたバリアントはなかった。結合配列におけるC:G変化を標的にする「THMKR」を除いて、取り出されたほとんどのバリアントは、変更した特異性の代わりに、緩和した結合特異性を有した。 図10−1と同様である。 図11A〜C CBSにおけるコアモチーフの位置6での配列変化を標的にして実施された選択。バリアントのライブラリーに対して実施された選択は、ZF6認識ヘリックスの位置−1〜3における変更に集中した。「VNS」コドンを、「X」によって示される位置に導入し、CBSにおけるコアモチーフの位置6(灰色の星)での3つの異なるヌクレオチド変化に対して選択した。直接的なタンパク質−DNA接触は破線によって示されている。(A)結合部位におけるA:T変化に対して実施された選択、(B)A:G変化、(C)A:C変化。A:T選択から分析されたバリアントは、緩和した結合プロファイルを有し、一方でA:G選択からのバリアントは、変化したヌクレオチドのみに対して強い結合を示した。A:C選択において、優れた結合因子は同定されなかった。 図11−1と同様である。 図11−1と同様である。 図12A〜C CBSにおけるコアモチーフの位置7での配列変化を標的にして実施された選択。バリアントのライブラリーに対して実施された選択は、ZF5認識ヘリックスの位置4〜6における変更に集中し、4番目の位置は変化しないままであった。「VNS」コドンを、「X」によって示される位置に導入し、CBSにおけるコアモチーフの位置7(灰色の星)での3つの異なるヌクレオチド変化に対して選択した。直接的なタンパク質−DNA接触は線によって示されている。(A)結合部位におけるG:T変化に対して実施された選択、(B)G:A変化、(C)G:C変化。 図12−1と同様である。 図12−1と同様である。 図13A〜C CBSにおけるコアモチーフの位置8での配列変化を標的にして実施された選択。バリアントのライブラリーに対して実施された選択は、ZF5認識ヘリックスの位置2〜6における変更に集中し、4番目の位置は変化しないままであった。「VNS」コドンを、「X」によって示される位置に導入し、CBSにおけるコアモチーフの位置8(灰色の星)での3つの異なるヌクレオチド変化に対して選択した。直接的なタンパク質−DNA接触は線によって示されている。(A)結合部位におけるG:T変化に対して実施された選択、(B)G:A変化、(C)G:C変化。同じライブラリーを用いて出現する異なるバリアントは、配列における、しかし結合部位での異なる位置における、同じ変化に結合するために使用されていることに留意されたい。 図13−1と同様である。 図13−1と同様である。 図14A〜C CBSにおけるコアモチーフの位置10での配列変化を標的にして実施された選択。バリアントのライブラリーに対して実施された選択は、ZF4認識ヘリックスの位置2〜6における変更に集中し、4番目の位置は変化しないままであった。「VNS」コドンを、「X」によって示される位置に導入し、CBSにおけるコアモチーフの位置10(灰色の星)での3つの異なるヌクレオチド変化に対して選択した。直接的なタンパク質−DNA接触は線によって示されている。(A)結合部位におけるG:T変化に対して実施された選択、(B)G:A変化、(C)G:C変化。G:C選択は、勾配選択プレートの高ストリンジェンシーな末端でいかなる成長ももたらさなかった。結合データは、中間層領域から採取されたコロニーを反映し、それは、それらが結合因子として十分に働かなかったためである。白色の点は、野生型結合配列に対する野生型CTCFジンクフィンガーアレイ結合活性を示す。 図14−1と同様である。 図14−1と同様である。 図15A〜C CBSにおけるコアモチーフの位置11での配列変化を標的にして実施された選択。バリアントのライブラリーに対して実施された選択は、ZF4認識ヘリックスの位置2〜6における変更に集中し、4番目の位置は変化しないままであった。「VNS」コドンを、「X」によって示される位置に導入し、CBSにおけるコアモチーフの位置11(灰色の星)での3つの異なるヌクレオチド変化に対して選択した。直接的なタンパク質−DNA接触は線によって示されている。(A)結合部位におけるG:T変化に対して実施された選択、(B)G:A変化、(C)G:C変化。 図15−1と同様である。 図15−1と同様である。 図16A〜C CBSにおけるコアモチーフの位置13での配列変化を標的にして実施された選択。バリアントのライブラリーに対して実施された選択は、ZF3認識ヘリックスの位置2〜6における変更に集中し、4番目の位置は変化しないままであった。「VNS」コドンを、「X」によって示される位置に導入し、CBSにおけるコアモチーフの位置13(灰色の星)での3つの異なるヌクレオチド変化に対して選択した。直接的なタンパク質−DNA接触は線によって示されている。(A)結合部位におけるG:T変化に対して実施された選択、(B)G:A変化、(C)G:C変化。 図16−1と同様である。 図16−1と同様である。 CBSへの複数の配列変化に対するマルチフィンガーバリアントの結合活性。CBSのコアモチーフにおけるそれらそれぞれのトリプレットに結合する、11フィンガーアレイのうちのジンクフィンガー4〜7の認識ヘリックスの略図。変更したアミノ酸は「X」によって示されており、野生型CBSに対するヌクレオチド変化は、略図における灰色の星によっておよび太文字によって示されている。このライブラリーにおいて、ZF1〜3およびZF8〜11を改変した。タンパク質−DNA接触は、ZF認識ヘリックスとCBS配列との間の線によって示されている。野生型CBSへの野生型CTCF11フィンガージンクフィンガーアレイ結合強度が白い点によって示されている。ZF4〜7における各バリアント認識ヘリックスのアミノ酸配列はy軸に挙げられており、改変されたCBS(赤色の変化)または野生型CBSに対する結合活性は、B2H β−galレポーターアッセイによって反映されている。 CBSへの複数の配列変化に対するマルチフィンガーバリアントの結合活性。以前はC:A変化があったCBSの位置2に今はC:G変化があることを除いて、以前と同じ選択。この選択から取り出されたバリアントは、野生型CBSに結合することなく、改変されたCBSに対する結合活性を有した。野生型11フィンガーZFアレイのみが、野生型CBSに対する結合活性を示し(白い点)、改変されたCBSに結合する能力を示さなかった。興味深いことには、ライブラリーにおいて選択された支配的バリアントは、認識ヘリックスの位置9で生じる変異を含有し、それは、オリゴ合成の間に(各位置における誤ったヌクレオチドの0.05%の可能性)またはこれらのライブラリーを構築する間のPCRを通じて導入された。 CBSへの複数の配列変化に対するマルチフィンガーバリアントの結合活性。個々のプールされた高ストリンジェンシーな選択からのバリアントを一緒にまとめ、野生型CBSに対する3つの変化(灰色の星または太字によって示される)に対して選択した。バリアントを、野生型CTCFジンクフィンガーアレイと並行して、改変されたCBSおよび野生型CBSに対する結合についてアッセイした。選択から取り出されたバリアントは、改変されたCBSに結合することができたが、野生型配列には結合することができなかった。逆に、野生型ジンクフィンガーアレイは、野生型CBSに結合することができたが、改変されたものには結合することができなかった。 CBSへの複数の配列変化に対するマルチフィンガーバリアントの結合活性。個々のプールされた高ストリンジェンシーな選択からのバリアントを一緒にまとめ、野生型CBSに対する3つの変化(灰色の星または太字によって示される)に対して選択した。バリアントを、野生型CTCFジンクフィンガーアレイと並行して、改変されたCBSおよび野生型CBSに対する結合についてアッセイした。選択から取り出されたバリアントは、改変されたCBSに結合することができたが、野生型配列には結合することができなかった。逆に、野生型ジンクフィンガーアレイは、野生型CBSに結合することができたが、改変されたものには結合することができなかった。 CBSへの複数の配列変化に対するマルチフィンガーバリアントの結合活性。個々のプールされた高ストリンジェンシーな選択からのバリアントを一緒にまとめ、野生型CBSに対する3つの変化(灰色の星または太字によって示される)に対して選択した。バリアントを、野生型CTCFジンクフィンガーアレイと並行して、改変されたCBSおよび野生型CBSに対する結合についてアッセイした。選択から取り出されたバリアントは、改変されたCBSに結合することができたが、野生型配列には結合することができなかった。逆に、野生型ジンクフィンガーアレイは、野生型CBSに結合することができたが(白い点)、改変されたものには結合することができなかった。 野生型CTCFは、野生型CTCF標的部位への結合活性を有し、2つのバリアント標的部位への結合活性を有しない。B2Hアッセイに見られるように、ヒト細胞背景において、内因性CTCFが野生型CBSに結合し、バリアント結合部位に結合しないことを確認するために、本発明者らは、ヒト赤白血病細胞株であるK562細胞を回収し、ChIP−qPCRによりCTCF結合を検討した。CTCFに架橋されたゲノムDNAを富化するCTCF特異的抗体を使用して、CTCFを、公知のCTCF標的部位へのおよび2つの内因性バリアント結合部位配列への結合についてアッセイした。2セットのqPCRプライマーを各結合部位(1.1、1.2等によって示される)に対して設計した。結合を、抗体で処理されていない架橋されかつ超音波処理されたサンプルの1%インプットを上回る標的部位の富化によって判定し、それは、関心対象の部位のレベルを、抗体で富化されていないサンプルにおける関心対象の部位の頻度と比べた倍増加として表すためのものである。各サンプルの抗体に基づく富化は、未処理の、それゆえ富化されていないインプットを上回る倍富化によって定量される。陰性対照は、CTCFが結合しない標的部位のバックグラウンドqPCR増幅レベルを反映する。この陰性レベルを上回るものはどんなものでも、富化されており、CTCF結合を示すと見なされ、一方で下回るものはどんなものでも、未富化でなく、それゆえCTCFによる結合がないと見なされる。野生型CTCFは、細菌B2Hレポーターアッセイによって予測されるように、バリアント結合部位への検出可能な結合なしで、野生型標的部位に結合する。 図23A〜B ヒト細胞における、外因性野生型およびバリアントCTCF結合活性。CTCFバリアントが選択された5つのバリアント結合部位のうちの1つに合致する2つの内因性バリアント結合部位配列を、ヒトゲノムにおいて同定した(バリアント部位1およびバリアント部位2)。バリアント部位1およびバリアント部位2のバリアント結合部位配列に結合するように選択された、3×HAタグを有する野生型CTCFおよび3×HAタグ付けされた操作されたCTCFバリアントのうちの1つの両方を、ChIP−qPCRによりヒト細胞における結合についてアッセイした。図23A:3×HAタグ付けされた野生型CTCFは、野生型CTCF結合部位に結合し、いずれのバリアント結合部位にも結合しない。ヒトK562細胞に、3×HAタグ付けされたCTCFを発現するプラスミドをトランスフェクトし、外因性CTCF(3×HAタグ付けされた)を特異的に富化しかつ内因性CTCT(タグなし)結合を富化しないHA抗体で処理した。陰性対照は、CTCFによって占有されない領域の富化を有しないChIP−qPCRレベルを示すために提供されている。これらの結果は、外因性野生型CTCFが、内因性CTCFと同じ結合活性を有することを実証する。図23B:3×HAタグ付けされたバリアントCTCFは、バリアント結合部位に結合し、野生型CTCF結合部位に結合しない。3×HAをタグ付けされたバリアントCTCFを発現するK562細胞をChIP−qPCRによって分析し、HA特異的抗体で処理した。図22および23Aにあるのと同じ部位を、バリアントCTCF結合について調べた。バリアントCTCFは、バリアント特異的HA抗体での富化によって示されるようにバリアント部位に結合し得、HA抗体に基づく富化の欠如によって示されるように野生型結合部位において検出可能な結合は見られなかった。 図23−1と同様である。 図24A〜B バリアント結合部位周辺に位置する遺伝子の野生型対照と比べた遺伝子発現の変化。G3結合部位配列に対して選択されたバリアントCTCF、および他の結合部位配列に対して選択されたバリアントCTCFを、野生型K562において発現させた。バリアントCTCFをGFPに融合させ、ヌクレオフェクションの72時間後にGFP+細胞からRNAを単離した。cDNAをRNAから作出し、RT−qPCRによって定量した。サンプルにわたる遺伝子発現レベルを、ハウスキーピング遺伝子(HPRT)に対して正規化した。遺伝子発現の変化は、GFPをタグ付けされた野生型CTCFを発現する野生型K562における遺伝子発現レベルと比べたものである。図24A.野生型CTCF対照と比べた、バリアントCTCFの存在下におけるG3バリアント結合部位周辺の遺伝子の遺伝子発現の変化。図24B.野生型対照と比べた、他のバリアント結合部位周辺の遺伝子の遺伝子発現の変化。 図24−1と同様である。 MYCの上流にあるバリアント結合部位の導入は、内因性MYC発現の低下につながる。MYC TSSの約2kb上流にあるCTCF結合部位を、CTCFバリアント選択に使用された6つの異なる配列のうちの1つと置き換えた(表に挙げられる)。野生型CTCF結合部位配列からの4〜6ヌクレオチド変化を有するこれらの配列の導入は、CTCF結合部位が欠失しかつループ形成が分断された場合と同じレベルまで、内因性MYC発現の低下をもたらす。WT_6配列は、天然CTCF結合部位からの4つの点変異を有するが、これらの変化は、B2Hレポーターアッセイからの結果によって示されるように、野生型CTCF結合に影響を有しないはずである。WT_6細胞株におけるMYC発現レベルは野生型K562のMYC発現レベルと同等であることから、これは事実であるように見える。K562活力はMYC発現に結び付くため、すべてのバリアント細胞株を、別個のPGKプロモーターから発現される外因性MYCを有するK562細胞株(exoMYC.K562)において作出した。 図26A〜B バリアントCTCFは、操作されたG3バリアント結合部位に結合することができ、MYC発現を回復させることができる。G3バリアント結合部位配列に結合するように選択されたCTCFバリアントを、G3_3.K562細胞株において発現させた。ヌクレオフェクションの72時間後に、細胞をMYC発現およびDNAでのCTCF占有率について分析した。バリアントおよび野生型((wt)によって示される)のZFヘリックスの残基は凡例に挙げられている。G3結合部位配列およびCTCFジンクフィンガーアレイの相互作用する認識ヘリックスも図示されている。図26A.内因性MYCレベルは、CTCFバリアントが発現した場合に、G3_3細胞株において野生型レベルに回復する。内因性MYC発現レベルは、RT−qPCRによって定量され、G3_3細胞株の低下した内因性MYCレベルと比べたものである。CTCF結合部位へのいかなる変更もないexoMYC.K562細胞株からの内因性MYCレベルが陽性対照として示されている(破線によって分離されている)。図26B.CTCFバリアントは、G3_3細胞株において導入されたバリアント結合部位に結合することができ、一方で野生型CTCFは結合しない。CTCF Ab特異的富化は、野生型およびバリアントCTCFの両方を捕捉し、一方でHA Abは、HAタグ付けされたCTCF(一過性に発現する)のみを検出するであろう。exoMYC.K562は、ChIP−qPCRに対する対照として含まれ、破線によって分離されている。exoMYC.K52は、MYCの上流にあるCTCF結合部位に天然配列を有し、野生型CTCF結合を示すはずである。外因性に発現されるCTCF(バリアントおよび野生型)にHAをタグ付けし、G3_3細胞株において発現させる。ChIP−qPCRを実施して、MYCの約2kb上流にある野生型部位を置き換えたバリアントCTCF部位へのCTCF結合を調べた(MYC部位)。ゲノムにおける他の場所での内因性G3部位および公知のCTCF結合を有しない領域が、それぞれ陽性および陰性対照として働いた。バリアントCTCFは、CTCFおよびHA抗体の両方での富化によって示されるように、バリアント部位に結合することができ、一方で野生型CTCFは結合しない。 図26−1と同様である。 図27A〜B バリアントCTCFは、操作されたA3バリアント結合部位に結合することができ、MYC発現を回復させることができる。A3バリアント結合部位配列に結合するように選択されたCTCFバリアントを、A3_4.K562細胞株において発現させた。ヌクレオフェクションの72時間後に、細胞をMYC発現およびDNAでのCTCF占有率について分析した。バリアントおよび野生型((wt)によって示される)のZFヘリックスの残基は凡例に挙げられている。A3結合部位配列およびCTCFジンクフィンガーアレイの相互作用する認識ヘリックスも図示されている。図27A.内因性MYCレベルは、CTCFバリアントが発現した場合に、A3_4細胞株において野生型レベルに回復する。内因性MYC発現レベルは、RT−qPCRによって定量され、A3_4細胞株の低下した内因性MYCレベルと比べたものである。CTCF結合部位へのいかなる変更もないexoMYC.K562細胞株からの内因性MYCレベルが陽性対照として示されている(破線によって分離されている)。図27B.CTCFバリアントは、A3_4細胞株において導入されたバリアント結合部位に結合することができ、一方で野生型CTCFは結合しない。CTCF Ab特異的富化は、野生型およびバリアントCTCFの両方を捕捉し、一方でHA Abは、HAタグ付けされたCTCF(一過性に発現する)のみを検出するであろう。exoMYC.K562は、ChIP−qPCRに対する対照として含まれ、破線によって分離されている。exoMYC.K52は、MYCの上流にあるCTCF結合部位に天然配列を有し、野生型CTCF結合を示すはずである。外因性に発現されるCTCF(バリアントおよび野生型)にHAをタグ付けし、A3_4細胞株において発現させる。ChIP−qPCRを実施して、MYCの約2kb上流にある野生型部位に置き換えたバリアントCTCF部位へのCTCF結合を調べた(MYC部位)。ゲノムにおける他の場所での内因性A3部位および公知のCTCF結合を有しない領域が、それぞれ陽性および陰性対照として働いた。バリアントCTCFは、陰性対照を上回るCTCFおよびHA抗体の両方での富化によって示されるように、バリアント部位に結合することができ、一方で野生型CTCFは結合しない。 図27−1と同様である。 バリアントCTCFは、他_10バリアント結合部位細胞株のMYC発現を回復させる。他バリアント結合部位配列に結合するように選択されたCTCFバリアントを、他10.K562細胞株において発現させた。ヌクレオフェクションの72時間後に、細胞をMYC発現について分析した。バリアントおよび野生型CTCF((wt)によって示される)のZFヘリックスの残基は凡例に挙げられている。他結合部位配列およびCTCFジンクフィンガーアレイの相互作用する認識ヘリックスも図示されている。A.内因性MYCレベルは、CTCFバリアントが発現した場合に、他_10細胞株において野生型レベルに回復する。内因性MYC発現レベルは、RT−qPCRによって定量され、他_10細胞株の低下した内因性MYCレベルと比べたものである。CTCF結合部位へのいかなる変更もないexoMYC.K562細胞株からの内因性MYCレベルが陽性対照として示されている(破線によって分離されている)。 バリアントCTCFは、A他_2バリアント結合部位細胞株のMYC発現を回復させる。A他バリアント結合部位配列に結合するように選択されたCTCFバリアントを、A他_2.K562細胞株において発現させた。ヌクレオフェクションの72時間後に、細胞をMYC発現について分析した。バリアントおよび野生型CTCF((wt)によって示される)のZFヘリックスの残基は凡例に挙げられている。A他結合部位配列およびCTCFジンクフィンガーアレイの相互作用する認識ヘリックスも図示されている。A.内因性MYCレベルは、CTCFバリアントが発現した場合に、A他_2細胞株において野生型レベルに回復する。内因性MYC発現レベルは、RT−qPCRによって定量され、A他_2細胞株の低下した内因性MYCレベルと比べたものである。CTCF結合部位へのいかなる変更もないexoMYC.K562細胞株からの内因性MYCレベルが陽性対照として示されている(破線によって分離されている)。
詳細な説明
これまで、野生型CTCFよりも高いアフィニティーで変異体CBSに結合するように設計される利用可能な操作されたCTCFバリアントはない。それゆえ、野生型CTCFよりも高いアフィニティーで変異体CBSに結合し得る操作されたCTCFバリアントの必要性がある。
本開示は、少なくとも一部には、ジンクフィンガーアレイに変更を有するCTCFバリアントを、1つまたは複数の点変異を持するCBS、すなわち変異体CBSを認識するように操作し得るという発見に基づく。
CTCF
CCCTC結合因子(CTCF)は、高次クロマチン構造を維持することによって必須のゲノムオーガナイザーとして作用し、一方で細胞分化におけるおよび遺伝子発現の促進または抑制における役割も有するマルチドメインタンパク質である。CTCFは、ゲノムのメガベースにまたがるトポロジカル関連ドメイン(TAD)、ならびに遺伝子クラスター内の微調整された遺伝子断絶または遺伝子活性化につながるより小型のサブTADを維持する。加えて、CTCFは、転写の速度に影響を与えることによってmRNAスプライシングを調節することが見出されており、より最近では、二本鎖断裂における相同組み換え修復を促進することに関わっている。野生型CTCFは、標準的CTCF結合部位(CBS)を認識する11フィンガージンクフィンガーアレイを介してゲノムのあらゆる場所で結合する。
野生型CTCF ZFアレイは、ZF3〜6の位置−1〜+6に以下の配列:
ZF3の位置−1〜+6:TSGELVR(配列番号1)
ZF4の位置−1〜+6:EVSKLKR(配列番号2)
ZF5の位置−1〜+6:DTYKLKR(配列番号3)
ZF6の位置−1〜+6:QSGTMKM(配列番号4)
ZF7の位置−1〜+6:RKSDLGV(配列番号5)
を含む。
野生型CTCFは、下記で示されるアミノ酸配列:
Figure 2021523719
と比較して、80%を上回る、85%を上回る、90%を上回る、95%を上回る、96%を上回る、97%を上回る、98%を上回る、または99%を上回る配列同一性を有するアミノ酸配列を有する。
2つの異なる核酸またはポリペプチド配列を比較する目的のために、一方の配列(試験配列)は、もう一方(比較配列)と特異的パーセンテージ同一であると記載され得る。パーセンテージ同一性は、様々なBLASTプログラムに組み入れられる、Karlin and Altschul, Proc. Natl. Acad. Sci. USA, 90:5873-5877 (1993)のアルゴリズムによって判定され得る。パーセンテージ同一性は、アメリカ国立生物工学情報センター(NCBI)ウェブサイトで利用可能である「BLAST 2 Sequences」ツールによって判定され得る。Tatusova and Madden, FEMS Microbiol. Lett., 174(2):247-250 (1999)を参照されたい。DNA−DNA一対比較に関しては、BLASTNプログラムが、初期設定パラメーター(例えば、マッチ:1;ミスマッチ:−2;オープンギャップ:5ペナルティー;伸長ギャップ:2ペナルティー;ギャップx_ドロップオフ:50;期待値:10;およびワードサイズ:11、フィルターあり)を用いて使用される。タンパク質−タンパク質一対比較に関しては、BLASTPプログラムが、初期設定パラメーター(例えば、行列:BLOSUM62;ギャップオープン:11;ギャップ伸長:1;x_ドロップオフ:15;期待値:10.0;およびワードサイズ:3、フィルターあり)を使用して採用され得る。2つの配列のパーセント同一性は、BLASTを使用して、試験配列と比較配列とをアラインし、比較配列の同じ位置におけるアミノ酸またはヌクレオチドと同一であるアラインされた試験配列におけるアミノ酸またはヌクレオチドの数を判定し、かつ同一のアミノ酸またはヌクレオチドの数を比較配列におけるアミノ酸またはヌクレオチドの数で割ることによって算出される。BLASTを使用して2つの配列を比較する場合、それは配列をアラインし、規定のアラインされた領域にわたるパーセント同一性を生み出す。2つの配列がそれらの長さ全体にわたってアラインされる場合、BLASTによって生み出されるパーセント同一性は、2つの配列のパーセント同一性である。BLASTが2つの配列をそれらの長さ全体にわたってアラインしない場合には、試験配列および比較配列のアラインされていない領域における同一のアミノ酸またはヌクレオチドの数はゼロであると見なされ、パーセント同一性は、アラインされた領域における同一のアミノ酸またはヌクレオチドの数を足し、かつその数を比較配列の長さで割ることによって算出される。BLASTプログラムの様々なバージョン、例えばBLAST2.1.2またはBLAST+2.2.22を使用して、配列を比較し得る。
CTCF結合部位(CBS)
CBSは、典型的に、高度に保存された15bpのコア配列(またはコアモチーフ)を有して、長さが40bpである。コア配列に隣接する配列は著しくあまり保存されていないが、それでもやはりゲノムのあらゆる部位におけるCTCF結合に重要である(図1)。
野生型CTCFは、以下のコア配列:5’−NCDNHNGRNGDNNNN−3’を含有する「コンセンサスCBSモチーフ」に結合する。
一実施形態において、コンセンサスCBSモチーフは、以下のコア配列:5’−CCAGCAGGGGGCGCT−3’(配列番号6)を含有する。他のコア配列は当技術分野において公知である。
コア配列に隣接するヌクレオチドが、CTCF内に存在する11フィンガーZFアレイによって結合されるかどうかは未知である。コンセンサスCTCF結合配列(CBS)に結合した11フィンガージンクフィンガー(ZF)アレイの共結晶構造は、11フィンガーZFアレイのZF3〜7のみが、高度に保存されたコア配列に直接結合するように見え、一方でZF8〜11および1〜2は、配列特異的接触を媒介しないように見えることを示唆する。ZFアレイの漸進的切り取りは、ZF8〜11およびZF1〜2が、CBSへのCTCFのDNA結合およびDNaseIフットプリンティングを向上させ得ることを示唆し、ならびにChIP−SeqおよびChIP−Exoデータは、ZF9〜11が重要なタンパク質−DNA接触を作り出し得ることを示唆する(Rhee and Pugh, Cell (2011);Nakahashi et al., Cell Reports (2013))。興味深いことには、CBSに結合したCTCF Zアレイの共結晶構造は、ジンクフィンガー2〜9のみを含有し、他のフィンガーは構造において目に見えず、モチーフの隣接領域と相互作用するジンクフィンガーはDNAとの安定な接触を作り出し得ないという意見と一致する(Hashimoto, et al., Molecular Cell (2017))。ゆえに、アレイの11フィンガーすべてがCTCFのDNA結合活性に対してどんな影響を有するのか、およびすべてのジンクフィンガーまたは部分集合がDNAと接触するかどうかは不明なままである。
CTCF結合は、CBSの保存された15bpコアモチーフの変化に敏感であり、マウスでは、ある特定の位置における単一ヌクレオチド変化はCTCF結合の喪失につながり得る(Nakahashi et al., Cell Reports (2013))。CTCF結合部位は、消化管癌患者由来の一次サンプルにおいてCTCF結合部位のコア配列に局在する癌関連変異を有して、ならびに発がん遺伝子および腫瘍抑制遺伝子の付随する非定型遺伝子発現プロファイルを有して、癌における変異ホットスポットであると報告されている(Guo et al., Nature Communications (2018))。CTCF結合部位の小さな欠失は、両方とも癌発生における役割を担うMYCおよびPTGS2等の遺伝子の発現の喪失につながることも示されている(Schuijers et al., Cell Reports (2018);Kang et al., Oncogene (2015))。
本明細書において記載される方法を使用して、複数のジンクフィンガーを含む操作されたCTCFバリアントを選択し得および作出し得、選択されたポリペプチドは、野生型CTCFと配列が異なる、少なくとも1つのジンクフィンガーにおける少なくとも1つのアミノ酸残基を有し、操作されたCTCFバリアントは、関心対象のDNA配列(例えば、コンセンサスCBS配列に少なくとも1つの変異を持するCBS)に結合するが、コンセンサスCBSには結合しない。本発明の方法を使用すると、足場ポリペプチドは、異なる構造的および機能的特質を有する、足場に基づく新たなジンクフィンガーポリペプチド内に再操作され、それにより新たなポリペプチドは関心対象の配列に結合するが、足場タンパク質の天然に存在するDNA結合部位には結合しない。
「ジンクフィンガー」または「Zf」という用語は、亜鉛によって安定化されるDNA結合ドメインを有するポリペプチドを指す。個々のDNA結合ドメインは、典型的に「フィンガー」と称される。Zfタンパク質は、少なくとも1つのフィンガー、好ましくは2つのフィンガー、3つのフィンガー、または6つのフィンガーを有する。2つ以上のZfを有するZfタンパク質は、「マルチフィンガー」または「マルチZf」タンパク質と称される。各フィンガーは、典型的に、およそ30アミノ酸の、亜鉛をキレートするDNA結合ドメインを含む。これらのタンパク質の1つのクラスを特徴付けする例示的なモチーフは、「C(2)H(2)クラス」として知られる−Cys−(X)(2〜4)−Cys−(X)(12)−His−(X)(3〜5)−His(配列番号7)であり、式中、Xは任意のアミノ酸である。このクラスの単一のZfは、典型的に、2つのシステイン残基と一緒に亜鉛と連動する2つの不変ヒスチジン残基を含有するアルファヘリックスからなる。
核酸結合因子およびその標的核酸、例えばCTCF(バリアントまたは野生型)およびCBSに関する「に結合する」または「結合すること」という用語は、結合により、核酸結合因子が生物学的に重大な機能、例えば転写活性化、結合部位への他のタンパク質の導き、および/またはクロマチン構造の変更を媒介することが可能となるような、分子間相互作用、例えばイオン性、共有結合性、ロンドン分散力、双極子−双極子、または水素結合による、核酸の標的核酸配列への核酸結合因子の配列依存的結合を指す。そのような結合は、遺伝子発現の活性化、過剰発現、抑制、または不活性化等、遺伝子の発現のモジュレーションをもたらし得る。
核酸結合因子およびその標的核酸、例えばCTCF(バリアントまたは野生型)およびCBSに関する「には結合しない」という用語は、核酸における標的配列の存在の欠如(例えば、CBSにおける1つまたは複数の点変異に起因した)の結果としての、分子間相互作用、例えばイオン性、共有結合性、ロンドン分散力、双極子−双極子、または水素結合による、核酸への核酸結合因子の配列特異的結合の欠如を指す。そのような非結合により、核酸結合因子は生物学的に重大な機能、例えば転写活性化、DNA修飾、DNA切断、結合部位への他のタンパク質の導き、および/またはクロマチン構造の変更、を媒介することが可能とならない。
Zfタンパク質内の各フィンガーは、DNA配列内の約2〜約5塩基対に結合する。典型的に、Zfタンパク質内の単一のZfは、DNA配列内の3または4塩基対「サブサイト」に結合する。したがって、「サブサイト」とは、単一のジンクフィンガーによって結合されるDNA配列である。「マルチサブサイト」とは、1つを上回る数のジンクフィンガーによって結合されるDNA配列であり、少なくとも4bp、好ましくは6bp、またはそれを上回る数を含む。マルチZfタンパク質は、少なくとも2つ、典型的には3つ、4つ、5つ、6つ、またはそれを上回る数のサブサイト、すなわち当該タンパク質の各フィンガーに対して1つを結合する。
組成物および方法
野生型CTCFよりも高いアフィニティーで変異体CBSに結合し得る操作されたCTCFバリアントが本明細書において記載される。操作されたCTCFバリアントは、変異体CBS(コンセンサスCBSの核酸配列と配列が異なる少なくとも1つの核酸を有するCBS)の制御下にある遺伝子を調節することにおいて使用され得る。CTCFバリアントは、野生型CTCFのアミノ酸配列と配列が異なる、少なくとも1つのジンクフィンガーにおける少なくとも1つのアミノ酸残基を有する。
例示的な操作されたCTCFバリアントには、
(1)ZF7の位置+2〜+6にアミノ酸配列DHLQT(配列番号8)、EHLNV(配列番号9)、AHLQV(配列番号10)、EHLRE(配列番号11)、DHLQV(配列番号12)、EHLKV(配列番号13)、DHLQV(配列番号14)、EHLVV(配列番号15)、DHLRT(配列番号16)、DHLAT(配列番号17)、もしくはDHLQT(配列番号18);
(2)ZF7の位置+2〜+6にアミノ酸配列DHLQT(配列番号19)、EHLNV(配列番号20)、AHLQV(配列番号21)、EHLRE(配列番号22)、DHLQV(配列番号23)、EHLKV(配列番号24)、DHLQV(配列番号25)、EHLVV(配列番号26)、DHLRT(配列番号27)、DHLAT(配列番号28)、もしくはDHLQT(配列番号29);
(3)ZF6の位置+2〜+6にアミノ酸配列NAMKR(配列番号30)、EHMGR(配列番号31)、DHMNR(配列番号32)、THMKR(配列番号33)、EHMRR(配列番号34)、もしくはTHMNR(配列番号35);
(4)ZF6の位置−1〜+3にアミノ酸配列MNES(配列番号36)、HRES(配列番号37)、RPDT(配列番号38)、RTDI(配列番号39)、もしくはRHDT(配列番号40);
(5)ZF5の位置+2〜+6にアミノ酸配列HGLKV(配列番号41)、HRLKE(配列番号42)、HALKV(配列番号43)、SRLKE(配列番号44)、DGLRV(配列番号45)、HTLKV(配列番号46)、もしくはNRLKE(配列番号47);
(6)ZF5の位置+2〜+6にアミノ酸配列ATLKR(配列番号48)、QALRR(配列番号49)、GGLVR(配列番号50)、HGLIR(配列番号51)、ANLSR(配列番号52)、TGLTR(配列番号53)、HGLVR(配列番号54)、GGLTR(配列番号55)、HTLRR(配列番号56)、TVLKR(配列番号57)、ADLKR(配列番号58)、もしくはHGLRR(配列番号59);
(7)ZF4の位置+2〜+6にアミノ酸配列AHLRK(配列番号60)、AKLRV(配列番号61)、GGLGL(配列番号62)、AKLRI(配列番号63)、TKLKV(配列番号64)、もしくはSKLRV(配列番号65);
(8)ZF4の位置+2〜+6にアミノ酸配列ATLRR(配列番号66)、RRLDR(配列番号67)、TNLRR(配列番号68)、ANLRR(配列番号69)、GNLTR(配列番号70)、AMLKR(配列番号71)、HMLTR(配列番号72)、AMLRR(配列番号73)、もしくはTMLRR(配列番号74);
(9)ZF3の位置+2〜+6にアミノ酸配列QQLIV(配列番号75)、SQLIV(配列番号76)、QQLLV(配列番号77)、GELVV(配列番号78)、QQLLI(配列番号79)、GQLIV(配列番号80)、GQLTV(配列番号81)、TELII(配列番号82)、QGLLV(配列番号83)、QQLLT(配列番号84)、GQLLT(配列番号85)、GELLT(配列番号86)、もしくはQQLLI(配列番号87);
(10)ZF4の位置+2〜+6にアミノ酸配列AKLKK(配列番号88)、AKLRK(配列番号89)、AHLRV(配列番号90)、AKLRV(配列番号91)、もしくはSKLRL(配列番号92);ZF5の位置+2〜+6にアミノ酸配列ERLRV(配列番号93)、NRLKV(配列番号94)、SRLKE(配列番号95)、もしくはNRLKV(配列番号96);ZF6の位置−1〜+3にアミノ酸配列RPDT(配列番号97)、RTET(配列番号98)、もしくはRADV(配列番号99);およびZF7の位置+2〜+6にアミノ酸配列DNLLA(配列番号100)、SNLLV(配列番号101)、DNLMA(配列番号102)、もしくはDNLRV(配列番号103);
(11)ZF4の位置+2〜+6にアミノ酸配列GHLKK(配列番号104)、AHLRK(配列番号105)、もしくはGKLRI(配列番号106);ZF5の位置+2〜+6にアミノ酸配列SRLKE(配列番号107)、DALRR(配列番号108)、DGLKR(配列番号109)、もしくはTRLRE(配列番号110);ZF6の位置−1〜+3にアミノ酸配列RPDT(配列番号111)もしくはRTEN(配列番号112);およびZF7の位置+2〜+6にアミノ酸配列EHLKV(配列番号113)、DHLLA(配列番号114)、もしくはHHLDV(配列番号115);
(12)ZF4の位置+2〜+6にアミノ酸配列SNLRR(配列番号116)、GNLVR(配列番号117)、GNLRR(配列番号118)、GNLKR(配列番号119)、ANLRR(配列番号120)、NNLRR(配列番号121)、もしくはTNLRR(配列番号122);ZF6の位置+2〜+6にアミノ酸配列EHMKR(配列番号123)、EHMRR(配列番号124)、THMKR(配列番号125)、EHMNR(配列番号126)、もしくはEHMAR(配列番号127);およびZF7の位置+2〜+6にアミノ酸配列DNLLT(配列番号128)、DNLLV(配列番号129)、DNLQT(配列番号130)、DNLLA(配列番号131)、DNLAT(配列番号132)、DNLQA(配列番号133)、DNLMA(配列番号134)、もしくはDNLMT(配列番号135);
(13)ZF4の位置+2〜+6にアミノ酸配列GNLVR(配列番号136)、GNLRR(配列番号137)、GNLAR(配列番号138)、GNLMR(配列番号139)、ANLRR(配列番号140)、SNLRR(配列番号141)、もしくはNNLRR(配列番号142);ZF6の位置+2〜+6にアミノ酸配列EHMNR(配列番号143)、EHMKR(配列番号144)、EHMRR(配列番号145)、SHMNR(配列番号146)、SHMRR(配列番号147)、THMKR(配列番号148)、もしくはDHMNR(配列番号149);およびZF7の位置+2〜+6にアミノ酸配列EHLKV(配列番号150)、EHLAE(配列番号151)、STLNE(配列番号152)、DHLQV(配列番号153)、EHLNV(配列番号154)、DHLNT(配列番号155)、EHLQA(配列番号156)、もしくはHHLMH(配列番号157);または
(14)ZF4の位置+2〜+6にアミノ酸配列GHLKK(配列番号158)、AHLKK(配列番号159)、TKLRL(配列番号160)、TKLKL(配列番号161)、GHLRK(配列番号162)、THLKK(配列番号163)、もしくはAHLRK(配列番号164);ZF5の位置+2〜+6にアミノ酸配列TRLKE(配列番号165)もしくはSRLKE(配列番号166);およびZF6の位置−1〜+3にアミノ酸配列RADN(配列番号167)、RHDT(配列番号168)、RRDT(配列番号169)、RPDT(配列番号170)、RTSS(配列番号171)、もしくはRNDT(配列番号172)
を含有するものが含まれる。
一部の実施形態において、操作されたCTCFバリアントは、上記で挙げられたアミノ酸配列の2つ以上の組み合わせを含有する。
本開示の一実施形態において、コンセンサスCBS内のある特定の位置における変異は、ランダム化ライブラリーから、変異したCBS配列を認識し得るバリアントを選択するために使用された細菌ツーハイブリッドシステムにおいて、野生型CTCFジンクフィンガーアレイによる結合を実質的に低下させた。フィンガーを一緒に組み合わせることを使用して、複数の点変異を持するCBSを認識し得るバリアントCTCFジンクフィンガーアレイを作出し得る。本開示の一部の実施形態において、これらのジンクフィンガーアレイバリアントを持するCTCFタンパク質を使用して、CBS(すなわち、非標準的CBS)内に1つまたは複数の変異を持つ部位におけるCTCF結合活性を回復させる。本開示の一部の実施形態において、CTCFバリアントは、ゲノムにおける代替的な非CBS部位を認識し得る。一部の実施形態において、そのようなCTCFバリアントを使用して、遺伝子を故意に断絶し得および/またはゲノムの高次構造をかき乱し得、それによって関心対象のある特定の標的遺伝子の発現を変更する人工TADおよび/またはエンハンサー−プロモーターループを創出し得る。
疾患の診断および治療
本明細書において記載される操作されたCTCFバリアントは、変異体CBSに起因した異常な遺伝子調節が根本的要因である疾患を治療するために使用され得る。本明細書において記載される操作されたCTCFバリアントは、例えば、野生型CTCFには結合しない変異体CBSに結合し得、それによって遺伝子調節を変更しまたは回復させ、それが疾患の進行を逆転させ得るまたは減速させ得る。CTCF結合は、MYC等のがん遺伝子の発現を調節することが示されている。CTFC結合部位に蓄積した変異および野生型CTCF結合の喪失は、がん遺伝子の調節異常および発がんの危険性の増加に関連している。MYCの転写調節異常は、侵襲性の強い腫瘍細胞における最も頻度が高い事象の1つであり、調節異常は、エンハンサー−プロモーターループを分断するCTCF結合部位における変異の結果である。操作されたCTCFバリアントは、変異した部位に結合し得、正常な遺伝子発現レベルを回復させ得、癌発生の危険性を低下させる。別の場合には、脆弱X症候群は、繰り返し領域における重複およびFMR1発現の喪失の結果である。X染色体における反復領域の重複は、CTCF結合部位を分断し、FMR1の発現を推進するエンハンサー−プロモーターループの喪失につながる。操作されたCTCFバリアントは、エンハンサー−プロモーターループを回復させ得、FMR1発現の回復につながる。ヒトパピローマウイルス(HPV)および他の組み込み型ウイルス(HIV等)は、近隣エンハンサーからのウイルスゲノムのCTCF媒介性断絶によってしばしばサイレンシングされる。HPV18の場合、ウイルスゲノムのプロモーター領域にCTCF結合部位がある。CTCF結合部位に変異を有するHPV18は、結合部位におけるこれらの配列変異がCTCFによってもはや認識され得ないためサイレンシングされない。操作されたCTCFバリアントは、変異したHPVが組み込まれたゲノムに結合し得、断絶しているループを回復させ得るであろう。
キット
操作されたCTCFバリアントおよび/または本明細書において記載される操作されたCTCFをコードする核酸、ならびに使用のための取扱説明書を含むキットも本明細書において提供される。
操作されたCTCFバリアントの他の適用
本明細書において記載される操作されたCTCFは、いくつかの他の適用において使用され得、その一部は本明細書において開示される。
一部の実施形態において、操作されたCTCFバリアントまたはそのような操作されたCTCFバリアントをコードする核酸を使用して、CTCFと他のクロマチン組織化タンパク質との複雑な相互作用をさらに解明し得る。クロマチンの構造維持は、細胞内で厳密に調節され、CTCFは主要な役割を担う。どのようにして高次構造が細胞分裂を越えて引き継がれ、細胞分化を通じて維持されるかは依然として不明なままであり、CTCFバリアントの使用は、その役割を明らかにするのに役立ち得る。CTCFバリアントを使用して、どのようにしてループがゲノムにわたって形成されるかを調査し得、ならびに研究および治療的適用のために内因性遺伝子発現に影響を与える様式で正常なゲノムアーキテクチャーを改変し得または回復させ得るであろう。それらを使用して、また、本発明者らがTADに基づくゲノム組織化の進化的意味合いおよび遺伝子発現のエピジェネティック調節をよりよく理解し得るように先祖代々のCTCF結合部位を再建し得るであろう、または研究および治療的適用のために内因性遺伝子発現に影響を与える代替的なゲノムアーキテクチャーを創出し得るであろう。
材料および方法
以下の材料および方法を、下記で示される実施例において使用した。
B2Hレポーターアッセイ構成要素の構築
ジンクフィンガー細菌発現プラスミドは、gal11Pに融合したCTCFジンクフィンガーアレイ(またはバリアント)を含有した。CTCF11フィンガージンクフィンガーアレイのすべてまたは一部のアミノ末端をgal11Pのカルボキシ末端に、それらの間にFlagタグリンカーを用いて融合させた。ジンクフィンガー発現プラスミドは、カナマイシン耐性遺伝子を含有する。細菌レポータープラスミドとして知られる第2のプラスミドは、BsaI制限消化、それに続くCTCF結合部位を含有するアニールされたオリゴのT4媒介性ライゲーションを介して導入されたCTCF結合部位配列を含有した。レポータープラスミドは、CTCF結合部位が結合された場合にlacZの発現を促進する細菌lacプロモーターを含有した。レポータープラスミドは、クロラムフェニコール耐性遺伝子も有する。
細菌ツーハイブリッド(B2H)ランダム化ライブラリー構築
相補的オリゴは、意図的に配列に導入される「VNS」または「NNS」変動を用いて、IDTによって合成された。オリゴをアニールし、T4リガーゼを使用してジンクフィンガー発現プラスミド(XbaIおよびBamHIで事前に消化された)にライゲーションした。ライゲーション反応物をQiagen Mineluteカラムを使用して精製し、精製された基質をエレクトロコンピテントXL1blue大腸菌(E.coli)系統に電気形質転換した。SOC中にて37℃で1時間の回復後、50ug/mLのカナマイシンを有する150mLのLuriaブロス(LB)に形質転換物を植菌した。培養物が0.400〜0.600のOD600に到達した(37℃で約10時間の成長)後、培養物をスピンダウンし、Qiagen Maxiprepキットを使用してライブラリーを回収した。
細菌ツーハイブリッド(B2H)レポーターアッセイ
600ngのgal11P−ジンクフィンガー発現プラスミド、および関心対象のCTCF結合部位を有する600ngのレポータープラスミドを、RNAポリメラーゼのアルファN末端ドメイン(α−NTD)−Gal4融合体とともに、150uLのΔλ大腸菌(E.coli)系統に化学的に形質転換した。プラスミドおよび細胞混合物を氷上で30分間インキュベートし、42℃で1分間熱ショックを与え、氷上で2分間回復させ、その後に500uLのLuriaブロス中での1時間の回復が続いた。回復後、形質転換物を、カナマイシン(50ug/mL)、クロラムフェニコール(12.5ug/uL)選択LB寒天プレートにプレーティングした。37℃での14〜16時間の成長後、コロニーを採取し、1mLの誘導培地(50ug/uLのカナマイシン、12.5ug/mLのクロラムフェニコール、10ug/mLのZnCl、および500ug/mLのIPTGを有するLuriaブロス)中で一晩成長させた。15〜17時間の成長後、25uLの一晩の培養物を1mLの新鮮な誘導培地に継代培養し、37℃で2時間または培養物が分光光度計によって測定されるD595 0.157〜0.268の間になるまで成長させた。次いで、100uLの継代培養物を、リゾチームとPopCultureソープとの11uLの1:10混合物を使用して最低15分間溶解した。次いで、15uLの溶解混合物を、以前に記載された比色分析ONPGアッセイによってLacZの倍活性化について分析した。結合を、LacZの倍活性化によって定量した。陰性対照(gal11Pに融合したジンクフィンガータンパク質なし)のβ−galレベルを上回るサンプルのβ−galレベルの倍増加を算出することによって、倍活性化を判定した。
細菌ツーハイブリッド(B2H)選択アッセイ
選択アッセイに関与したプラスミドは、1つの違いのみを有して、以前と同じである。レポータープラスミドは、LacZを、カルベニシリン等のβ−ラクタム環クラスの抗生物質に対する抗生物質耐性遺伝子であるBlaCと入れ替えることによって選択プラスミドであるように作製される。ジンクフィンガー−gal11P発現プラスミドにライゲーションされたオリゴのプールからバリアントのライブラリーを構築することによって、選択を行う。これらを、関心対象のCTCF結合部位を有する選択プラスミドを含有するエレクトロコンピテントΔλ大腸菌(E.coli)系統に電気形質転換する。細胞を1mLのSOC中にて37℃で1時間回復させ、その後に、4mLの誘導培地(以前に記載された)中にて37℃で付加的な3時間の選択プラスミドの誘導が続く。合計4時間後、形質転換物を低ストリンジェンシーなプレート(50ug/mLのカナマイシン、12.5ug/mLのクロラムフェニコール、100ug/mLのカルベニシリン、10ug/mLの塩化亜鉛、および200ug/mLのIPTG、および0.45ug/mLのクラブラン酸を有するLB寒天)にプレーティングする。プレートを、20〜24時間37℃で一晩成長させ、次いで、コロニーを2mLのLBを有する表面から回収する。50uLの削り取られたコロニーを、50ug/mLのカナマイシンおよび12.5ug/mLのクロラムフェニコールを有する1mLのテリフィックブロス(TB)に継代培養し、37℃で14〜16時間成長させた。翌日、プラスミドを一晩の培養物から回収し、関心対象のCTCF結合部位を有する以前と同じ選択プラスミドを含有する化学的コンピテントΔλ大腸菌(E.coli)系統に化学的に形質転換する。化学的形質転換は、37℃で1時間の回復後に誘導培地中で2時間の成長を加えて、以前に記載されるように実施される。合計3時間の成長後、細胞を高ストリンジェンシーな選択勾配プレートにプレーティングする。高ストリンジェンシーな勾配プレートは、濃度が約1から開始して最高40ug/mLまでのクラブラン酸の勾配を有して、50ug/mLのカナマイシン、12.5ug/mLのクロラムフェニコール、100ug/mLのカルベニシリン、10ug/mLのZnCl、200ug/mLのIPTGを含有する。プレートを37℃で20〜24時間インキュベートした。最も高いレベルのクラブラン酸を有する勾配で成長したコロニーを採取し、50ug/mLのカナマイシンを有する1mLのTB中で成長させ、一晩成長させてプラスミドを回収した。次いで、バリアントプラスミドをサンガーシーケンシングし、ならびにB2H β−galレポーターアッセイにおいて結合活性について分析した。
高ストリンジェンシーな勾配プレート
高ストリンジェンシーな選択勾配プレートは、濃度が約1から開始して40ug/mLまでのクラブラン酸の勾配を有して、50ug/mLのカナマイシン、12.5ug/mLのクロラムフェニコール、100ug/mLのカルベニシリン、10ug/mLのZnCl、200ug/mLのIPTGを含有する。クラブラン酸の勾配を得るために、約25℃の傾斜(くさびの細い先がLB寒天でどうにか覆われるだけのような十分な角度)を有するように、ピペットチップを使用して長方形プレートを持ち上げる。50ug/mLのカナマイシン、12.5ug/mLのクロラムフェニコール、100ug/mLのカルベニシリン、10ug/mLのZnCl、200ug/mLのIPTG、および4ug/mLのクラブラン酸を有する20〜25mLのLB寒天を傾けたプレートに添加し、底のくさびを形成する。固まり次第、プレートを平らに置き、50ug/mLのカナマイシン、12.5ug/mLのクロラムフェニコール、100ug/mLのカルベニシリン、10ug/mLのZnCl、200ug/mLのIPTG(クラブラン酸を有しない)を有する20〜25mLのLB寒天を上部に注ぐ。これにより、約1ug/mLから最高4.0ug/mLに及ぶ範囲のクラブラン酸の勾配を有するプレートが創出される。
ChIP−qPCRを使用したCTCF結合アッセイ
3×10個細胞/mLの密度でのトランスフェクションの18〜24時間前に、K562細胞を播種した。バリアントごとに300万個のK562を、提供される最適化プロトコールを使用したLonzaキットVを使用してトランスフェクトし、10cmディッシュにプールした。pCAGプロモーターによって発現されるHAエピトープタグ付けされたCTCF(野生型またはバリアント)を発現する5ugのプラスミドを、各100万個の細胞反応物に対して使用した。トランスフェクションの72時間後、およそ1000万個の細胞を1%ホルムアルデヒドを用いて37℃で10分間架橋した。反応を、1.2mLの2.5Mグリシンを用いて37℃で5分間消光した。細胞を430gで10分間ペレットにし、SFX250 Branson超音波処理器で5.5分間、32%の振幅で、1.3秒間オフ、0.7秒間オンで超音波処理した。次いで、サンプルを半分に分け、一方をCTCFに特異的な抗体とともに4℃で回転させながら一晩沈殿させ、他方をHA特異的抗体とともに一晩沈殿させた。翌日、抗体が結合したクロマチン複合体を、回転させながらG−dynabeadsとともに4℃で2時間インキュベートした。ビーズを、1mLの氷冷RIPA150洗浄バッファー(0.1%SDS、0.1%DOC、1%Triton X−100、1mM EDTA、10mM Tris−HCl pH8、150mM NaCl)中で3回、1mLの氷冷RIPA500洗浄バッファー(0.1%SDS、0.1%DOC、1%Triton X−100、1mM EDTA、10mM Tris−HCl pH8、500mM NaCl)中で3回、1mLの氷冷LiCl洗浄バッファー(10mM Tris−HCl pH8、250mM LiCl、0.5%Triton X−100、0.5%DOC)で3回、および1mLの氷冷10mM Tris−HCl pH8.5中で1回洗浄した。抗体クロマチン複合体を、新しく添加された5mM DTTを有する100uLの溶出バッファー(10mM Tris−HCl pH8、0.1%SDS、150mM NaCl)中にビーズから溶出した。ビーズを、900rpmで振とうしながら、溶出バッファーとともに65℃で1時間インキュベートした。ビーズを磁石によってペレットにし、上清をきれいなチューブに移し、そこで室温に冷ました後、1uLのRNAse(Roche 11119915001)をサンプルに添加し、600rpmにて37℃で30分間インキュベートした。3uLのプロテイナーゼK[20mg/mL]をサンプルに添加し、65℃で一晩インキュベートした(Lifetech #100005393)。翌日、160uLのPEG/NaCl(20%PEG、2.5M NaCl)を有する100uLのSPRIビーズをサンプルに添加し、ボルテックスし、磁石上にビーズをペレットにする前に室温で5分間インキュベートした。ペレットを80%エタノールで2回洗浄し、150uLの10mM Tris−HCl pH8中での最終溶出の前に5分間空気乾燥させた。リアルタイムqPCRによる、抗体によって処理されていない1%インプットを上回るフラグメント富化の定量のために、3uLの回収された上清を、5uLのSYBR qPCRマスターミックスおよび2uLのプライマーミックスと混合した。
バリアント結合部位細胞株の作出
MYC TSSの約2kb上流にあるCTCF結合部位に導入されたバリアント結合部位を有する細胞株を、exoMYC.K562に、SpCas9−P2A−GFP、CTCF結合部位を標的にするgRNA、および6つの異なるバリアント結合部位を導入するHDR鋳型としての6つの個別のssODNのうちの1つをヌクレオフェクトすることによって作出した。exoMYC.K562は、PGKプロモーターから発現される外因性MYC構築物を形質導入されたK562細胞株である。内因性MYC発現の任意の低下はK562細胞の生存に影響を与え得ることから、これが必要であった。単一細胞クローン増殖のために、GFP+細胞を96ウェルプレートに高希釈で選別した。増殖され次第、gDNAおよびRNAを抽出して、クローン細胞集団を遺伝子型判定および表現型判定した。内因性MYCの低下を有し、また所望のHDR事象のための標的部位でホモ接合性に見えるクローン株を調査において使用した。
RT−qPCRによってMYC発現を定量する
MYCの上流にバリアント結合部位を持するように編集された300万個のK562細胞のゲノムに、LonzaキットVプロトコールに従って、バリアントCTCFを発現する5ugのプラスミドをヌクレオフェクトした。ヌクレオフェクションの72時間後、NucleoSpin RNA Plus RNA単離プロトコールに従って、100万個の細胞をRNA抽出のために単離した。Thermo High−Capacity RNA−to−cDNAキットにより、RNAをcDNAに変換した。3uLの1:20希釈のcDNAを5uLのThermo Fast SYBRgreenマスターミックスと混合し、標準PCR増幅プロトコールに従って、RT−qPCR機器でランした。
結果
CTCF結合効率に影響を及ぼす、CBSにおける単一ヌクレオチド置換
本発明者らは、細菌ツーハイブリッド(B2H)システムを使用して、野生型CTCF結合を分断する単一のまたは複数の配列変化を持つ変異したCBSに結合するCTCFのジンクフィンガーアレイを考案し得るであろうと本発明者らは推論した(Wright et al. Nature Protocols (2006);Sander et al., Nature Methods (2010);Maeder et al. Molecular Cell. (2008))。本発明者らは、以前に記載された細菌ツーハイブリッド(B2H)システムを使用して、以前に規定されたコンセンサスCBS部位内の単一ヌクレオチド置換の影響を体系的に規定した(Joung et al., PNAS (2000))。B2Hシステムにおいて、関心対象の標的部位へのDNA結合ジンクフィンガーアレイの結合を、レポーター遺伝子(例えば、ベータ−ガラクトシダーゼまたは抗生物質耐性遺伝子)の転写の増加をもたらすように構成し得る(図2)。これを行うために、2つの融合体を、レポーター構築物を持つ大腸菌(E.coli)細胞において発現させる。第1の融合体は、酵母Gal4融合体のフラグメントと相互作用する酵母Gal11Pタンパク質のフラグメントに融合したジンクフィンガーアレイからなる。第2の融合体は、酵母Gal4フラグメントとの大腸菌(E.coli)RNAポリメラーゼアルファサブユニットのN末端ドメインの融合体(α−Gal4融合体)からなる。レポーター構築物は、プロモーターの上流に位置する、ジンクフィンガーアレイに対する結合部位を有して、関心対象のレポーター遺伝子の発現を推進する弱い大腸菌(E.coli)プロモーターからなる。ジンクフィンガー結合部位へのジンクフィンガー−Gal11P融合体の結合は、アルファ−Gal4融合体を持するRNAポリメラーゼ複合体の導きをもたらし、レポーター遺伝子の転写の増加がもたらされる。レポーター遺伝子が、β−ガラクトシダーゼ(β−gal)をコードするlacZである場合、ベータ−gal発現のレベルは、十分に確立された比色分析ONPGに基づくアッセイを使用して容易に定量され得る(図2)。
このB2Hレポーターアッセイにおいて、本発明者らは、15bpコンセンサスCBS配列だけでなく、ジンクフィンガーアレイ全体(ZF1〜11)および全CTCF結合部位(CBS)が、lacZ遺伝子の最適な発現に要求されることを判定し(図3)、それはヒト細胞10、11における観察されたCTCF結合要件を模倣する。転写開始部位に対するCBS部位の位置決めを最適化した後、本発明者らは、次いで、CBSに点変異を体系的に導入し、lacZ発現に対するそれらの影響を試験した。これらの結果は、15bpコア配列の外側にあるヌクレオチドの変異が、lacZ発現にほとんど影響を有しないことを実証した。しかしながら、それに反して、コア配列内のある特定の位置におけるある特定の配列は、結合なしまたは結合の低下をもたらした(図4)。本発明らの結果は、ヒト細胞におけるCTCF結合部位に関するChIP−Seqデータと密接に合致し、CTCFコアにおける点変異がCTCF結合の喪失につながる、文献における他の調査を反映する。まとめると、これらの結果は、B2HシステムにおけるCTCFジンクフィンガーアレイの結合活性が、ヒト細胞における無傷CTCFタンパク質の結合活性を模倣することを強く示唆する。
結合部位の隣接領域のほとんどの配列変化は、結合効率にほとんど影響を有しなかったものの、ある特定の変更は、lacZ発現の倍活性化をわずかに向上させるように見えた。それゆえ、本発明者らは、B2Hアッセイにおいて規定される「最善の」ヌクレオチドを持つより「最適化された」CBSが、lacZ発現のより高い倍活性化につながり得るかどうかを試験したが、本発明者らは、元のコンセンサス配列(NakahashiらのChIP−seqデータに由来する)と比較していかなる高い活性も観察しなかった(図5)。
単一の変更したヌクレオチドを有する変異したCBSに結合する操作されたCTCFバリアントの作出
次に、本発明者らは、本発明者らがB2Hシステムを使用して、野生型CTCFジンクフィンガーアレイによって認識されない変異したCBSを認識し得るCTCFジンクフィンガーアレイバリアントを選択し得るかどうかを判定しようと努めた。これを行うために、本発明者らはB2Hレポーター構築物を改変し、lacZ遺伝子を、ベータ−ラクタマーゼをコードし、それゆえベータ−ラクタム抗生物質(例えば、カルベニシリン)に対する耐性を付与するblaC遺伝子で置き換えた(図6)。この改変により、本発明者らは、blaC発現を推進する弱いプロモーターの上流に位置する変異体CBSに効率的に結合し得るCTCFジンクフィンガーアレイバリアントを発現する細胞を選択することが可能となる。次第により高くなるレベルのblaC発現は、カルベニシリンを含有する培地および次第により高くなる濃度のベータ−ラクタマーゼ阻害剤クラブラン酸を使用することによって選択され得る。クラブラン酸の勾配は、単一の寒天プレート内で創出され得(図6;材料および方法を参照されたい)、それによって、阻害剤の様々な濃度における細胞のサンプリングが可能となる。
この改変されたB2H選択システムを用いて、本発明者らは、まず、このシステムにおいて、野生型CTCFジンクフィンガーアレイによる結合を無効にする単一点変異を持つCBSに結合し得るCTCFジンクフィンガーアレイバリアントを同定しようと努めた。初回の一連の選択実験において、本発明者らは、(上記で引用される以前に公開された共結晶構造によって示される)ZF7のアルファ−ヘリックス認識ヘリックスの3番目の位置(+3)に存在するアスパラギン酸(D)によって接触されるCの変異を持つ変異体CBSに結合し得るCTCFジンクフィンガーアレイバリアントを同定しようと努めた。本発明者らは、ZF7の+3位置をコードするコドンが、縮重NNSコドン(式中、N=G、A、C、またはT、およびS=GまたはC)を使用してランダム化された、CTCFジンクフィンガーアレイバリアントのランダム化ライブラリーを創出した。本発明者らは、次いで、B2H選択システムを使用して、このライブラリーを調べて、ZF +3によって接触される位置にCからT、CからG、およびCからAへの置換を持つCBSを認識し得るバリアントを同定した。最初に、0〜0.45ug/mlに及ぶクラブラン酸勾配を有する低ストリンジェンシーなプレートに対して選択を実施し、生存コロニーを回収し、バリアントジンクフィンガーアレイをコードするプラスミドを精製した。バリアントのこの選択された部分集合を、次いで、カルベニシリンおよび0〜4ug/mlに及ぶクラブラン酸の勾配を有するプレートでのB2Hシステムにおける高ストリンジェンシーな選択に供した。バリアントジンクフィンガーアレイをコードするプラスミドを、最も高い濃度のクラブラン酸を有する勾配プレートの末端で成長したコロニーから精製し、シーケンシングし、次いでベータ−ガラクトシダーゼアッセイによってB2Hレポーターアッセイにおいて試験した。
図7A〜Cに見られ得るように、本発明者らは、元のコンセンサスCBSと比較して、変異したCBSに対する優先的な結合活性(B2Hレポーターアッセイによって判断される)を示すCTCFジンクフィンガーアレイバリアントを獲得した。これらのクローンは、ZF7の+3位置における特定のアミノ酸の選択も示し、T部位に対するCに関してはトレオニン(T)が選択され、A部位に対するCに関してはアスパラギン(N)が選択され、G部位に対するCに関してはヒスチジン(H)が選択された。これらのアミノ酸の正体は、Zif268ジンクフィンガーアレイを使用した以前のジンクフィンガー選択に基づき、変異体ヌクレオチドを認識することが予想され得るものと一致する。しかしながら、本発明者らは、変更した結合活性を有する変異体の選択に成功したものの、ほとんどの場合において、変異したCBSに対するバリアントの結合活性は、コンセンサスCBSに対する野生型CTCFジンクフィンガーアレイのものほど強くなかった(B2Hレポーターアッセイによって判断される)(図7A〜C)。
Zif268ジンクフィンガーアレイのDNA結合特異性を再操作することと合わせた本発明者らの以前の経験に基づき、本発明者らは、より強い結合バリアントを獲得することは、ZF7における+3位置に隣接するアミノ酸の変更を要求し得ると仮説を立てた。この考えを試験するために、本発明者らは、本発明者らが縮重VNSコドン(式中、V=G、A、またはC)を使用してZF7の位置+2、+3、+5、および+6をランダム化した、バリアントのより大きなライブラリーを創出した。ZF7の位置+4は、それがZFドメインの内部コアに面し、DNAと接触しないと予想されるため変更されなかった。本発明者らは、次いで、このライブラリーを使用して上で記載されるB2H選択を実施して、野生型CTCFジンクフィンガーアレイにおけるZF7 +3によって接触される位置にCからGへの変異を有する変異体CBSを同定し得るバリアントを同定した。これらの選択により、変異体CBSに対するより強い結合活性を示しかつ選択されたアミノ酸の同一性においてある程度のコンセンサスを示すバリアントが同定された(図8)。
この成功に基づき、本発明者らは、ZF7、ZF6、ZF5、ZF4、およびZF3に対する位置−1、+1、+2、および+3または+2、+3、+5、および+6をランダム化した付加的なランダム化ライブラリーを作出した。本発明者らは、次いで、ライブラリーにおけるランダム化された残基によって接触されると予想される位置にヌクレオチド置換を持する様々な合致した変異体CBSに対して、これらのライブラリーを使用して上で記載される選択を実施した(図9〜16)。高ストリンジェンシーな選択プレートの最も選択的な末端における個々の生存コロニーからのバリアントの分析は、これらの選択の多くが、関心対象の変異体CBSに対する高い活性を有するバリアントを生み出すことを示し、およびこれらのクローンのシーケンシングは、アミノ酸配列において概してある程度のコンセンサスがあることを示し、選択が上手く生じていることを示唆した(図9〜16)。
複数の変更したヌクレオチドを有する変異したCBSに結合する操作されたCTCFバリアントの作出
単一の変更したヌクレオチド位置を有するCBSを認識し得るCTCFジンクフィンガーバリアントを同定することに成功したため、本発明者らは、次に、複数の変異したヌクレオチドを持つCBSを認識し得るバリアントを同定しようと努めた。これを行うために、本発明者らは、個々の変異を持つ、CBS内の異なる「サブサイト」に結合するようにそれぞれが選択されたZFバリアントを組み換えようと努めた。しかしながら、マルチフィンガーアレイにおけるZFの間に存在する周知の前後関係依存的効果が理由で、本発明者らは、本発明者らが、任意の所与の変更したサブサイトに対して、選択されたZFバリアントのプール(単一のバリアントではなく)を一緒に組み換えて、複数の変異を持つCBSを認識するように一緒になって最善に働く変異したZFの組み合わせを同定するストラテジーに取り組んだ。様々な変異したCBSサブサイトに対するZFバリアントのプールを単離するために、本発明者らは、単一変異を持つCBS部位に関して本発明者らが実施した高ストリンジェンシーな選択プレートから残りすべてのクローンを回収した(図9〜16に描写される)。これらのプールにおける様々な選択されたクローンのディープシーケンシングは、予想どおりに各選択内にある程度のコンセンサスを有する多様な配列を生み出した(表1)。
本発明者らは、次いで、ZF4、5、6、および7に対するバリアントのプールを組み換えて、これらの位置に対する様々な変更した認識ヘリックスを持するCTCFジンクフィンガーアレイを創出し、次いで、ZF4、5、6、および7に対するサブサイトに様々なヌクレオチド置換の組み合わせを持つ5つの異なる変異したCBSに対してB2H選択(材料および方法を参照されたい)を実施した(図17〜21)。これらの選択からのクローンのシーケンシングは、各フィンガーに対するある特定の認識ヘリックス配列が複数回選択されることを示し、選択により、一緒に上手く働く組み合わせが同定されていることを示唆した。重要なことには、多重に変異したCBSの5つすべてに関して、同定されたCTCFジンクフィンガーアレイバリアントのいくつかは、B2Hアッセイによって判断されるように、それらが選択された部位に対して良好な結合活性を示した(図17〜21)。加えて、5つの変異体CBS部位のうちの4つに関して、本発明者らは、変異体CBSに結合するだけでなく、元の変異していない(コンセンサス)CBSに結合することもできないバリアントを同定することができた。ゆえに、本明細書で記載される本発明者らの手法を使用して、本発明者らは、元の野生型CTCFジンクフィンガーアレイによって効率的に結合されない多重に変異したCBSを認識し得るCTCF ZFアレイバリアントを同定することができると本発明者らは結論付けた。
ヒト細胞における変異体および野生型CBSへの操作されたCTCFバリアントの結合特異性
モチーフにわたる複数の配列変化を有するCBSを認識し得る操作されたバリアントに成功したため、本発明者らは、次に、バリアントが、ヒト細胞背景においてこれらの同じ変異体結合部位に結合し得、一方で野生型CBSに結合しないかどうかを調べることを望んだ。まず、本発明者らが、結合するようにCTCFバリアントを選択していた5つの変異した結合部位のそれぞれに対する15bpコア配列と合致する、ヒトゲノムにおける部位の集合体を本発明者らは見出した(図17〜21に記載される)。本発明者らは、次いで、5つの変異した結合部位のうちの1つ(図20に描写される配列)と合致する配列を有する2つのバリアント結合部位ならびに公知のCBSに注目して、B2Hレポーターアッセイが示唆するであろうように、内因性CTCFが野生型CBSに結合し得、バリアント結合部位には結合しないかどうかを判定した(図20)。赤白血病細胞株であるヒトK562を回収し、CTCF特異的抗体を使用したChIP−qPCRによって分析してCTCF−DNA結合を検出した。野生型CTCFは、変異したCBSと合致する2つの異なる標的部位への検出可能な結合を示さなかったが、野生型CTCF結合部位の大幅な富化を示し、B2Hレポーターアッセイの結果を支持した(図22)。次に、本発明者らは、K562におけるプラスミドトランスフェクションによって送達された、過剰発現した外因性の3×HAタグ付けされた野生型CTCFが、内因性CTCFに関して観察されたものと同じ結合プロファイルを有するかどうかを確かめることを望んだ。野生型K562に3×HA−CTCFをトランスフェクトし、72時間後に回収し、HA特異的抗体を用いたChIP−qPCR分析のために処理した。外因性の野生型3×HA−CTCFは、内因性の野生型CTCFと同じく、野生型CBSに結合し得、バリアント結合部位には結合し得ず、プラスミド送達によるCTCFの過剰発現が、生物学的に関連した挙動を反映することを示唆した(図23A)。これらの結果に基づき、本発明者らは、次に、バリアントCTCFが、ヒトゲノム原産のバリアント結合部位に結合する能力を検討した。選定されたバリアントは、B2Hアッセイにおける選択から取り出されたものであり、B2Hレポーターアッセイによって、図22〜23Bにおいて使用されたバリアント部位1および2と同じ配列を有するバリアント部位に結合することが示された。K562に3×HAタグ付けされたCTCFバリアントをトランスフェクトし、以前と同じ部位をChIP−qPCRによって結合活性について検討した。バリアント特異的HA富化は、バリアント結合部位に存在しかつ野生型部位に欠如しており、本発明者らが、天然CBSに結合することなく、たった3つのヌクレオチド変化を有する変異体CBSに特異的に結合し得るバリアントを考案することに成功したことを示唆した(図23B)。
ループ形成を介した操作されたCTCFバリアントによる遺伝子発現調節
CTCFは、ゲノムのCTCF−コヒーシン媒介性ループ形成により遺伝子発現を変更する能力を有する。本発明者らは、バリアントCTCFが、内因性バリアント結合部位に結合した場合に、野生型CTCFの遺伝子調節能を再生し得るかどうかを確かめることに好奇心を持った。遺伝子発現変化を調べるために、本発明者らは、バリアント結合部位の1Mb領域内の遺伝子に重点を置いた。バリアント部位1.1および1.2に対して1Mb領域内に11個の遺伝子が同定され、バリアント部位2.1および2.2に対して別の10個の遺伝子が同定された。バリアント部位1およびバリアント部位2に結合する能力を有する、GFPに融合したバリアントCTCFをK562にヌクレオフェクトした。ヌクレオフェクションの72時間後、RNAをGFP+細胞から単離し、遺伝子発現レベルを、野生型CTCF対照をヌクレオフェクトされたK562から抽出されたRNAと比較した。バリアント部位1.1および1.2に対する11個の遺伝子のうち、6個の遺伝子が、野生型CTCF対照をヌクレオフェクトされた細胞(JJ388)と比べて遺伝子発現の変化を示した(図24A)。バリアント部位2.1および2.2に対して同定された10個の遺伝子のうちの2個が、野生型対照と比べて変更した遺伝子発現レベルを有した(図24B)。このデータは、バリアントCTCFタンパク質がヒト細胞においてそれらの標的配列に結合するだけでなく、それが、おそらくループまたはサブTADの形成により遺伝子発現を調節する天然CTCFの生物学的役割を再生もすることを示唆する。
次に、本発明者らは、CTCFバリアントが、エンハンサー−プロモーターループを創出する公知のCTCF結合部位で野生型CTCFの生物学的機能を再現し得ることを実証することを望んだ。MYC発現は、MYCの転写開始部位(TSS)の約2kb上流にあるCTCF結合部位と、MYC TSS14の約1kb下流にあるCTCF結合部位との間で形成されるループによって維持される。CTCFが両方の部位に結合した場合、コヒーシンが、CTCFのコヒーシン相互作用ドメインを介して両方のCTCFを連結し、MYCの発現を維持するループが創出される。CTCF結合部位の一方または両方が分断された場合、CTCF媒介性ループは失われ、MYC発現14の低下がある。MYC TSSの約2kb上流にあるCTCF結合部位に5つの異なるバリアント結合部位配列(図25に規定される)を含有する5つの細胞株を作出した。これを、ホスホグリセリン酸キナーゼ(PGK)プロモーターを介して外因性MYCを発現するレンチウイルス構築物を形質導入されたK562バックグラウンド(exoMYC.K562)において行って、内因性MYC発現の低下が引き起こし得る任意の低下した細胞適応を補完した。CTCF結合部位への点変異がなされた付加的な6つの細胞株を作出し、それは、B2Hレポーターアッセイからの結果によって示されるように野生型CTCF結合に影響を有しないはずである。バリアント結合部位に対してホモ接合性のクローン細胞株からRNAを単離し、内因性MYC遺伝子発現レベルを逆転写酵素リアルタイムqPCR(RT−qPCR)によってアッセイした。バリアントCTCF結合部位を有する単離された細胞株のそれぞれは、低下したレベルのMYC発現を示し、CTCF媒介性ループが分断されることを示唆した(図25)。
この結果に基づき、本発明者らは、これらの改変された細胞株におけるバリアントCTCFの発現が、操作された部位に結合し得およびMYC発現を回復させ得るかどうかを確かめることを望んだ。HAタグ付けされた野生型CTCFおよびHAタグ付けされたCTCFバリアントを、それらの合致するバリアント結合部位を含有する細胞株において発現させた。G3バリアント結合部位に結合するように選択されたバリアントをG3_3細胞株において、A3バリアントをA3_4細胞株において発現させた、等。HAタグ付けされた野生型CTCFも、結合についておよび内因性MYC発現の回復について、バリアント細胞株のそれぞれにおいて試験した。exoMYC.K562における内因性MYC発現のレベルは、MYC TSSの上流にあるCTCF結合部位に変更がないことから野生型対照として働いた。操作された細胞株において発現したCTCFバリアントは、内因性MYC発現を回復させ、一方でこれらの細胞株における野生型CTCFの発現は、MYC発現を回復させ得なかった(図26A〜29)。同じサンプルを、野生型CTCFまたはバリアントCTCFによるバリアント結合部位の占有率について、CTCFまたはHA抗体を用いてCTCF結合DNAフラグメントを富化するChIP−qPCRによって分析した。野生型CTCFは、バリアント結合部位の低下した占有率を有し、MYC発現の継続的低下と一致し、一方でバリアントCTCFタンパク質は、それらが選択されたバリアント部位に結合し得、ならびにMYC発現をレスキューし得た(図26〜29)。まとめると、これらのデータは、本発明者らが、新規な配列に結合し得、かつ依然としてコヒーシンと相互作用して、遺伝子発現プロファイルを維持するループを形成するCTCFバリアントを考案したことを示唆する。

種々のCTCF結合部位に関して選択されたバリアントのアミノ酸配列。すべてのアミノ酸配列は、NからC末に挙げられている。選択の最も高いストリンジェンシーで成長するコロニーを削り取り、プールし、ジンクフィンガーをコードするプラスミドを単離し、ディープシーケンシングした。読み取りの数は、三つ組で実施された選択からプールされた集団において、バリアントがどのくらい顕著であったかを反映する。
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
Figure 2021523719
参考文献
Figure 2021523719
他の実施形態
本発明は、その詳細な説明と併せて記載されているが、前述の説明は例示することを意図されるものであり、添付の特許請求の範囲によって規定される本発明の範囲を限定するものではない。他の態様、利点、および改変は、以下の特許請求の範囲内にある。

Claims (26)

  1. 野生型CTCFのアミノ酸配列と配列が異なる、少なくとも1つのジンクフィンガーにおける少なくとも1つのアミノ酸残基を含む操作されたCCCTC結合因子(CTCF)バリアントであって、前記操作されたCTCFバリアントは、野生型CTCFよりも高いアフィニティーで変異体CTCF結合配列(CBS)に結合し、前記変異体CBSは、コンセンサスCBSのヌクレオチド配列と配列が異なる少なくとも1つのヌクレオチド塩基を含み、前記野生型CTCFのアミノ酸配列と配列が異なる前記少なくとも1つのアミノ酸残基は、前記操作されたCTCFバリアントのZF7、ZF6、ZF5、ZF4、およびZF3のいずれかの位置−1、+1、+2、+3、+5、および+6におけるアミノ酸残基からなる群から選択される、操作されたCTCFバリアント。
  2. 前記変異体CBSは、前記コンセンサスCBSモチーフの位置2にチミン(T)、アデニン(A)、またはグアニン(G)残基を有し、前記操作されたCTCFは、ZF7の位置+3にアミノ酸残基トレオニン、アスパラギン、またはヒスチジンを含む、請求項1に記載の操作されたCTCFバリアント。
  3. 前記変異体CBSは、前記コンセンサスCBSモチーフの位置2にG残基を有し、前記操作されたCTCFは、ZF7の位置+2〜+6にアミノ酸配列DHLQT、EHLNV、AHLQV、EHLRE、DHLQV、EHLKV、EHLVV、DHLRT、またはDHLATを含む、請求項1に記載の操作されたCTCFバリアント。
  4. 前記変異体CBSは、前記コンセンサスCBSモチーフの位置3にT、G、またはC残基を有し、前記操作されたCTCFは、ZF7の位置−1〜+3に:
    アミノ酸配列RKHDもしくはRRSDを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置3にT残基を有する;
    アミノ酸配列RKAD、IPRI、RKHD、もしくはRKDDを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置3にG残基を有する;または、
    アミノ酸配列GIVN、ELLN、QALL、もしくはPHRMを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置3にC残基を有する、
    請求項1に記載の操作されたCTCFバリアント。
  5. 前記変異体CBSは、前記コンセンサスCBSモチーフの位置5にT、G、またはA残基を有し、前記操作されたCTCFは、ZF6の位置+2〜+6に:
    アミノ酸配列NAMKR、GNMAR、EGMTR、SNMVR、もしくはNAMRGを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置5にT残基を有する;または、
    アミノ酸配列EHMGR、DHMNR、THMKR、EHMRR、もしくはTHMNRを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置5にG残基を有する、
    請求項1に記載の操作されたCTCFバリアント。
  6. 前記変異体CBSは、前記コンセンサスCBSモチーフの位置6にT、G、またはC残基を有し、前記操作されたCTCFは、ZF6の位置−1〜+3に:
    アミノ酸配列MNESもしくはHRESを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置6にT残基を有する;または、
    アミノ酸配列RPDT、RTDI、もしくはRHDTを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置6にG残基を有する、
    請求項1に記載の操作されたCTCFバリアント。
  7. 前記変異体CBSは、前記コンセンサスCBSモチーフの位置7にC、A、またはT残基を有し、前記操作されたCTCFは、ZF5の位置+2〜+6に:
    アミノ酸配列HGLKV、HRLKE、HALKV、SRLKE、もしくはDGLRVを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置7にT残基を有する;
    アミノ酸配列HTLKVもしくはHGLKVを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置7にA残基を有する;または、
    アミノ酸配列SRLKE、HRLKE、もしくはNRLKEを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置7にC残基を有する、
    請求項1に記載の操作されたCTCFバリアント。
  8. 前記変異体CBSは、前記コンセンサスCBSモチーフの位置8にC、A、またはT残基を有し、前記操作されたCTCFは、ZF5の位置+2〜+6に:
    アミノ酸配列ATLKR、QALRR、GGLVR、またはHGLIRを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置8にT残基を有する;
    アミノ酸配列ANLSR、TGLTR、HGLVR、またはGGLTRを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置8にA残基を有する;
    アミノ酸配列HTLRR、TVLKR、ADLKR、またはHGLRRを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置8にC残基を有する、
    請求項1に記載の操作されたCTCFバリアント。
  9. 前記変異体CBSは、前記コンセンサスCBSモチーフの位置10にT、A、またはC残基を有し、前記操作されたCTCFは、ZF4の位置+2〜+6に:
    アミノ酸配列AHLRKを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置10にT残基を有する;
    アミノ酸配列AKLRV、EKLRI、もしくはAKLRIを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置10にA残基を有する;または、
    アミノ酸配列TKLKVを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置10にC残基を有する、
    請求項1に記載の操作されたCTCFバリアント。
  10. 前記変異体CBSは、前記コンセンサスCBSモチーフの位置11にT、A、またはC残基を有し、前記操作されたCTCFは、ZF4の位置+2〜+6に:
    アミノ酸配列ATLRRもしくはRRLDRを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置11にT残基を有する;
    アミノ酸配列TNLRR、ANLRR、もしくはGNLTRを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置11にA残基を有する;または、
    アミノ酸配列AMLKR、HMLTR、AMLRR、もしくはTMLRRを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置11にC残基を有する、
    請求項1に記載の操作されたCTCFバリアント。
  11. 前記変異体CBSは、前記コンセンサスCBSモチーフの位置13にT、A、またはC残基を有し、前記操作されたCTCFは、ZF3の位置+2〜+6に:
    アミノ酸配列QQLIV、SQLIV、QQLLV、GELVV、もしくはQQLLIを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置13にT残基を有する;
    アミノ酸配列GQLIV、GQLTV、GKLVT、TELII、もしくはQGLLVを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置13にA残基を有する;または、
    アミノ酸配列QQLLT、GQLLT、GELLT、もしくはQQLLIを含み、前記変異体CBSは前記コンセンサスCBSモチーフの位置13にC残基を有する、
    請求項1に記載の操作されたCTCFバリアント。
  12. 前記変異体CBSは、前記コンセンサスCBSモチーフの位置2、6、7、および10にそれぞれA、G、T、およびT残基を有し、前記操作されたCTCFは、
    (i)前記操作されたCTCFのZF4の位置+2〜+6にアミノ酸配列AKLKK、AKLRK、AHLRV、AKLRV、またはSKLRL;
    (ii)前記操作されたCTCFのZF5の位置+2〜+6にアミノ酸配列ERLRV、NRLKV、SRLKE、またはNRLKV;
    (iii)前記操作されたCTCFのZF6の位置−1〜+3にアミノ酸配列RPDT、RTET、またはRADV;および
    (iv)前記操作されたCTCFのZF7の位置+2〜+6にアミノ酸配列DNLLA、SNLLV、DNLMA、またはDNLRV
    を含む、請求項1に記載の操作されたCTCFバリアント。
  13. 前記変異体CBSは、前記コンセンサスCBSモチーフの位置2、6、7、および10にそれぞれG、G、T、およびT残基を有し、前記操作されたCTCFは、
    (i)前記操作されたCTCFのZF4の位置+2〜+6にアミノ酸配列GHLKK、AHLRK、またはGKLRI;
    (ii)前記操作されたCTCFのZF5の位置+2〜+6にアミノ酸配列SRLKE、DALRR、DGLKR、またはTRLRE;
    (iii)前記操作されたCTCFのZF6の位置−1〜+6にアミノ酸配列RPDTMKRまたはRTENMKM;および
    (iv)前記操作されたCTCFのZF7の位置+2〜+6にアミノ酸配列EHLKV、DHLLA、またはHHLDV
    を含む、請求項1に記載の操作されたCTCFバリアント。
  14. 前記変異体CBSは、前記コンセンサスCBSモチーフの位置2、5、および11にそれぞれA、G、およびA残基を有し、前記操作されたCTCFは、
    (i)前記操作されたCTCFのZF4の位置+2〜+6にアミノ酸配列SNLRR、GNLVR、GNLRR、GNLKR、ANLRR、NNLRR、またはTNLRR;
    (ii)前記操作されたCTCFのZF6の位置+2〜+6にアミノ酸配列EHMKR、EHMRR、THMKR、EHMNR、またはEHMAR;および
    (iii)前記操作されたCTCFのZF7の位置+2〜+6にアミノ酸配列DNLLT、DNLLV、DNLQT、DNLLA、DNLAT、DNLQA、DNLMA、またはDNLMT
    を含む、請求項1に記載の操作されたCTCFバリアント。
  15. 前記変異体CBSは、前記コンセンサスCBSモチーフの位置2、5、および11にそれぞれG、G、およびA残基を有し、前記操作されたCTCFは、
    (i)前記操作されたCTCFのZF4の位置+2〜+6にアミノ酸配列GNLVR、GNLRR、GNLAR、GNLMR、ANLRR、SNLRR、またはNNLRR;
    (ii)前記操作されたCTCFのZF6の位置+2〜+6にアミノ酸配列EHMNR、EHMKR、EHMRR、SHMNR、SHMRR、THMKR、またはDHMNR;および
    (iii)前記操作されたCTCFのZF7の位置+2〜+6にアミノ酸配列EHLKV、EHLAE、STLNE、DHLQV、EHLNV、DHLNT、EHLQA、またはHHLMH
    を含む、請求項1に記載の操作されたCTCFバリアント。
  16. 前記変異体CBSは、前記コンセンサスCBSモチーフの位置6、7、および10にそれぞれG、T、およびT残基を有し、前記操作されたCTCFは、
    (i)前記操作されたCTCFのZF4の位置+2〜+6にアミノ酸配列GHLKK、AHLKK、TKLRL、TKLKL、GHLRK、THLKK、またはAHLRK;
    (ii)前記操作されたCTCFのZF5の位置+2〜+6にアミノ酸配列TRLKEまたはSRLKE;および
    (iii)前記操作されたCTCFのZF6の位置−1〜+3にアミノ酸配列RADN、RHDT、RRDT、RPDT、RTSS、またはRNDT
    を含む、請求項1に記載の操作されたCTCFバリアント。
  17. コヒーシン(cohesion)と相互作用してエンハンサー−プロモーターループの形成を媒介して遺伝子発現をモジュレートする、請求項1から16のいずれか一項に記載の操作されたCTCFバリアント。
  18. 請求項1から17のいずれか一項に記載の操作されたCTCFバリアントの治療上有効量を対象に投与するステップを含む、それを必要とする対象を治療する方法。
  19. 前記対象は癌を有する、請求項18に記載の方法。
  20. 請求項1から17のいずれか一項に規定の変異体CBSの制御下にある遺伝子の発現を活性化するまたは抑制する方法であって、前記遺伝子は、前記変異体CBSの制御下で異常に発現しており、前記変異体CBSと請求項1から17のいずれか一項に記載の操作されたCTCFとを接触させ、それによって前記遺伝子の発現を調節するステップを含む、方法。
  21. 前記操作されたCTCFは、コヒーシンと相互作用してエンハンサー−プロモーターループの形成を媒介することによって前記遺伝子の発現を活性化するまたは抑制する、請求項20に記載の方法。
  22. 請求項1から17のいずれか一項に記載の操作されたCTCFバリアントを含む、薬学的組成物。
  23. 請求項1から17のいずれか一項に記載の操作されたCTCFバリアントをコードする核酸を含む、遺伝子の調節のための遺伝子発現システム。
  24. 請求項1から17のいずれか一項に記載の操作されたCTCFバリアントと変異体CBSとを接触させて結合複合体を形成し、それによりクロマチンの構造が変更されるステップを含む、クロマチンの構造を変更する方法。
  25. 1つまたは複数の変異を持つCBSと請求項1から17のいずれか一項に記載の操作されたCTCFバリアントとを接触させるステップを含む、1つまたは複数の変異を持つCBSの制御下にある遺伝子の発現をモジュレートする方法。
  26. 請求項1から17のいずれか一項に記載の操作されたCTCFバリアントおよび本明細書において記載される方法における使用のための取扱説明書を含む、キット。
JP2020564128A 2018-05-17 2019-05-17 Ccctc結合因子バリアント Pending JP2021523719A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862672682P 2018-05-17 2018-05-17
US62/672,682 2018-05-17
US201962828277P 2019-04-02 2019-04-02
US62/828,277 2019-04-02
PCT/US2019/032937 WO2019222670A1 (en) 2018-05-17 2019-05-17 Ccctc-binding factor variants

Publications (1)

Publication Number Publication Date
JP2021523719A true JP2021523719A (ja) 2021-09-09

Family

ID=68541036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020564128A Pending JP2021523719A (ja) 2018-05-17 2019-05-17 Ccctc結合因子バリアント

Country Status (6)

Country Link
US (2) US11041155B2 (ja)
EP (1) EP3793584A4 (ja)
JP (1) JP2021523719A (ja)
AU (1) AU2019269692A1 (ja)
CA (1) CA3100726A1 (ja)
WO (1) WO2019222670A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7379160B2 (ja) 2017-04-21 2023-11-14 ザ ジェネラル ホスピタル コーポレイション CRISPR-Cpf1を使用する誘導性で調整可能な多重ヒト遺伝子制御
CN114146186B (zh) * 2021-11-04 2023-05-12 华中科技大学同济医学院附属协和医院 基于锍盐稳定的靶向hdac的多肽药物偶联体及其应用
WO2023196220A2 (en) * 2022-04-04 2023-10-12 The General Hospital Corporation Method for genome-wide functional perturbation of human microsatellites using engineered zinc fingers
WO2024026269A1 (en) * 2022-07-25 2024-02-01 The General Hospital Corporation Ccctc-binding factor (ctcf)-mediated gene activation

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060246440A1 (en) * 2002-10-23 2006-11-02 Joung J K Methods for producing zinc finger proteins that bind to extended dna target sequences

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9824544D0 (en) * 1998-11-09 1999-01-06 Medical Res Council Screening system
US7833784B2 (en) 2005-11-28 2010-11-16 The Scripps Research Institute Zinc finger binding domains for TNN
US20110294873A1 (en) 2008-10-23 2011-12-01 Université de Lausanne Gene Transfer Vectors Comprising At Least One Isolated DNA Molecule Having Insulator Or Boundary Properties And Methods To Identify The Same
EP2414524B1 (en) 2009-04-03 2017-08-23 Centre National De La Recherche Scientifique Gene transfer vectors comprising genetic insulator elements and methods to identify genetic insulator elements
US20120178647A1 (en) * 2009-08-03 2012-07-12 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
JP6535333B2 (ja) 2013-09-04 2019-06-26 シーエスアイアール 遺伝子発現をサイレンシングする遺伝子制御エレメントを標的とする部位特異的ヌクレアーゼ単一細胞アッセイ
US10590433B2 (en) 2014-03-14 2020-03-17 University Of Washington Genomic insulator elements and uses thereof
EP3337908A4 (en) * 2015-08-18 2019-01-23 The Broad Institute, Inc. METHOD AND COMPOSITIONS FOR CHANGING THE FUNCTION AND STRUCTURE OF CHROMATIN GRINDING AND / OR DOMAINS

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060246440A1 (en) * 2002-10-23 2006-11-02 Joung J K Methods for producing zinc finger proteins that bind to extended dna target sequences

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GALINA N. FILIPPOVA ET AL., CANCER RESEARCH, vol. 62, no. 1, JPN6023018528, 1 January 2002 (2002-01-01), pages 48 - 52, ISSN: 0005058804 *
JESSAMY C. TIFFEN ET AL., INTERNATIONAL JOURNAL OF CANCER, vol. 133, no. 7, JPN6023018532, 30 March 2013 (2013-03-30), pages 1603 - 1613, ISSN: 0005058805 *
MAOLU YIN ET AL., CELL RESEARCH, vol. 27, JPN6023018527, 27 October 2017 (2017-10-27), pages 1365 - 1377, ISSN: 0005058806 *

Also Published As

Publication number Publication date
US11041155B2 (en) 2021-06-22
CA3100726A1 (en) 2019-11-21
AU2019269692A1 (en) 2020-11-19
EP3793584A4 (en) 2022-10-26
WO2019222670A1 (en) 2019-11-21
EP3793584A1 (en) 2021-03-24
US20190382767A1 (en) 2019-12-19
US20210102213A1 (en) 2021-04-08

Similar Documents

Publication Publication Date Title
JP2021523719A (ja) Ccctc結合因子バリアント
O'Brien et al. Differential regulation of mouse and human nephron progenitors by the Six family of transcriptional regulators
US20190359951A1 (en) Transcription activator-like effector (tale) - lysine-specific demethylase 1 (lsd1) fusion proteins
Wu et al. Structural and functional interaction between the human DNA repair proteins DNA ligase IV and XRCC4
EP3703701A1 (en) Methods of rescuing stop codons via genetic reassignment with ace-trna
AU2015229227B2 (en) Genomic insulator elements and uses thereof
US9370551B2 (en) Compositions and methods of treating head and neck cancer
EP2526199A2 (en) Methods of generating zinc finger nucleases having altered activity
WO2020007325A1 (en) Cas9 variants and application thereof
Cui et al. Allosteric inhibition of CRISPR-Cas9 by bacteriophage-derived peptides
Li et al. The MBD7 complex promotes expression of methylated transgenes without significantly altering their methylation status
JP2022538789A (ja) 新規crispr dnaターゲティング酵素及びシステム
US11072782B2 (en) Construct for epigenetic modification and its use in the silencing of genes
EP2522726A1 (en) Zinc finger nucleases for p53 editing
KR20230137399A (ko) 기능성 핵산 분자 및 방법
CN113544257A (zh) 中国仓鼠卵巢细胞中内源性逆转录病毒的表征及灭活
WO2020069331A1 (en) Artificial rna-guided splicing factors
JP2023551678A (ja) 免疫直交性aavおよび免疫ステルスcrispr-casの操作
Yang et al. A novel RHH family transcription factor aCcr1 and its viral homologs dictate cell cycle progression in archaea
AU2003215094A1 (en) Zinc finger libraries
US11866734B2 (en) Super enhancer for driving pluripotency network and stemness circuitry
Luo et al. Transposase N-terminal phosphorylation and asymmetric transposon ends inhibit piggyBac transposition in mammalian cells
LaRoche-Johnston et al. Group II introns generate functional chimeric relaxase enzymes with modified specificities through exon shuffling at both the RNA and DNA level
WO2024102947A1 (en) Cas12a system for combinatorial transcriptional repression in eukaryotic cells
Weinstein Characterization of the Promoter Region for the EVI2A Gene

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220516

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230516

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230814

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231205

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240305

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240424