JP2013529083A - 新規のdna結合タンパク質及びその使用 - Google Patents

新規のdna結合タンパク質及びその使用 Download PDF

Info

Publication number
JP2013529083A
JP2013529083A JP2013511148A JP2013511148A JP2013529083A JP 2013529083 A JP2013529083 A JP 2013529083A JP 2013511148 A JP2013511148 A JP 2013511148A JP 2013511148 A JP2013511148 A JP 2013511148A JP 2013529083 A JP2013529083 A JP 2013529083A
Authority
JP
Japan
Prior art keywords
tale
domain
sequence
cells
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013511148A
Other languages
English (en)
Other versions
JP6208580B2 (ja
Inventor
ディー.グレゴリー フィリップ
シー.ミラー ジェフリー
パッション デイビッド
ジェイ.レバー エドワード
タン シュアン
ウルノフ フョードル
チャン レイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sangamo Therapeutics Inc
Original Assignee
Sangamo Therapeutics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangamo Therapeutics Inc filed Critical Sangamo Therapeutics Inc
Publication of JP2013529083A publication Critical patent/JP2013529083A/ja
Application granted granted Critical
Publication of JP6208580B2 publication Critical patent/JP6208580B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P27/00Drugs for disorders of the senses
    • A61P27/02Ophthalmic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/21Endodeoxyribonucleases producing 5'-phosphomonoesters (3.1.21)
    • C12Y301/21004Type II site-specific deoxyribonuclease (3.1.21.4)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Cell Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Epidemiology (AREA)
  • Mycology (AREA)
  • Neurosurgery (AREA)
  • Neurology (AREA)
  • Immunology (AREA)
  • Ophthalmology & Optometry (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

TALE DNA結合ドメインを含む新規のDNA結合ドメインを含む、ポリペプチド、それらをコードするポリヌクレオチド、細胞、及び生物が本明細書に開示される。内因性細胞配列の遺伝子発現及び/又はゲノム編集の調節のために、これらの新規のDNA結合ドメインを使用する方法も開示される。

Description

関連出願の相互参照
本出願は、2010年5月17日出願の米国仮出願第61/395,836号、2010年8月12日出願の同第61/401,429号、2010年10月13日出願の同第61/455,121号、2010年12月20日出願の同第61/459,891号、2011年2月2日出願の同第61/462,482号、2011年3月24日出願の同第61/465,869号の利益を主張し、それらの開示は、参照によりその全体が本明細書に組み込まれる。
連邦政府支援の研究下でなされた発明に対する権利の声明文
該当なし
技術分野
本発明は、遺伝子操作されたDNA結合タンパク質を使用した内在性遺伝子及び他のゲノム遺伝子座の発現状態の遺伝的修飾及び制御のための方法を提供する。
発明の背景
多くの、恐らくほとんどの生理学的及び病態生理学的プロセスを、遺伝子発現の選択的上方又は下方制御によって制御することができる。選択的制御によって制御することができる病理学の例として、数例を挙げると、リウマチ性関節炎における炎症性サイトカインの不適切な発現、高コレステロール血症における肝臓LDL受容体の過小発現、血管新生促進因子の過剰発現、及び固形腫瘍成長における抗血管新生因子の過小発現が挙げられる。加えて、ウイルス、細菌、真菌、及び原虫等の病原体を、それらの宿主細胞の遺伝子発現を変更することによって制御することができる。したがって、簡単に有益な遺伝子を上方制御し、かつ病原遺伝子を下方制御することができる治療的アプローチへの明らかに満たされていない必要性が存在する。
加えて、選択された遺伝子の選択的過剰及び過小発現を可能にする簡単な方法は、科学界にとって大変有用であろう。細胞モデル系、トランスジェニック動物、及びトランスジェニック植物における遺伝子の制御を可能にする方法は、学術研究所、製薬会社、ゲノミクス会社、及びバイオテクノロジー産業における広範な使用を見出すであろう。
遺伝子発現は、通常、転写因子と呼ばれる配列特異的DNA結合タンパク質の機能の変更を介して制御される。それらは、プロモーターでの転写開始複合体の形成又は機能の効率に影響を与えるように作用する。転写因子は、正の様式(活性化)又は負の様式(抑制)で作用し得る。
転写因子の機能は、構成的(常に「オン」)又は条件付きであり得る。条件付きの機能は、様々な手段によって転写因子に与えられ得るが、これらの制御機構の大部分は、細胞質における因子の隔離及び誘導性放出、並びにそれに続く核転座、DNA結合及び活性化(又は抑制)に依存する。この様式で機能する転写因子の例には、プロゲステロン受容体、ステロール応答要素結合タンパク質(SREBP)及びNF−カッパBが挙げられる。リン酸化に応答する転写因子又はそれらの同族DNA認識配列に結合するそれらの能力を変更することによる小分子リガンドの例が存在する(Hou et al.,Science 256:1701(1994)、Gossen & Bujard,Proc.Nat’l Acad Sci 89:5547(1992)、Oligino et al.,Gene Ther.5:491−496(1998)、Wang et al.,Gene Ther.4:432−441(1997)、Neering et al.,Blood 88:1147−1155(1996)、及びRendahl et al.,Nat.Biotechnol.16:757−761(1998))。
亜鉛フィンガータンパク質(「ZFP」)由来のDNA結合ドメインを含む組換え転写因子は、内在性遺伝子の遺伝子発現を制御する能力を有する(例えば、米国特許第6,534,261号、同第6,599,692号、同第6,503,717号、同第6,689,558号、同第7,067,317号、同第7,262,054号を参照のこと)。亜鉛フィンガータンパク質を含有するこれらの遺伝子操作された転写因子を使用する臨床試験は、これらの新規の転写因子が種々の状態を治療することができることを示している(例えば、Yu et al.(2006)FASEB J.20:479−481を参照のこと)。
ゲノム生物学における別の目的とする主要分野は、特にいくつかのゲノムの完全なヌクレオチド配列の決定の観点から、ゲノム配列の標的化変更である。そのような標的化切断事象を、例えば、標的化変異誘発を誘導するために、細胞DNA配列の標的化欠失を誘導するために、かつ所定の染色体遺伝子座で標的化組換えを促進するために使用することができる。例えば、米国特許公開第20030232410号、同第20050208489号、同第20050026157号、同第20050064474号、同第20060188987号、同第2008015996号、及び国際公開第WO2007/014275号を参照されたく、それらの開示は、全ての目的のために参照によりそれらの全体が組み込まれる。Santiago et al.(2008)Proc Natl Acad Sci USA 105:5809−5814、Perez et al.(2008)Nat Biotechnol 26:808−816(2008)も参照されたい。
ヌクレアーゼの切断ドメインを設計されたDNA結合タンパク質(例えば、FokI等由来のヌクレアーゼ切断ドメインに結合される亜鉛フィンガータンパク質(ZFP))に結合させる人工ヌクレアーゼは、真核細胞において標的化切断のために使用されている。例えば、亜鉛フィンガーヌクレアーゼ媒介性ゲノム編集は、(1)所望の修飾のための特に標的部位における生細胞のゲノム内での二本鎖切断(DSB)の作成によって、かつ(2)DNA修復の自然機構にこの切断を「修復」させることによって、特定の位置でヒトゲノムの配列を修飾することが示されている。
特異性を増大させるために、切断事象は、DNA結合時に二量体化して、触媒的に活性なヌクレアーゼ複合体を形成する特注設計された亜鉛フィンガーヌクレアーゼの1つ以上の対を使用して誘導される。加えて、特異性は、ヘテロ二量体の形成時にのみ二本鎖DNAを切断する遺伝子操作された切断半ドメインを含む亜鉛フィンガーヌクレアーゼの1つ以上の対を使用することによってさらに増大されている。例えば、参照によりその全体が本明細書に組み込まれる、米国特許公開第20080131962号を参照されたい。
人工ヌクレアーゼによって作成される二本鎖切断(DSB)は、例えば、標的化変異誘発を誘導するために、細胞DNA配列の標的化欠失を誘導するために、かつ所定の染色体遺伝子座で標的化組換えを促進するために使用されている。例えば、米国特許公開第20030232410号、同第20050208489号、同第20050026157号、同第20050064474号、同第20060188987号、同第20060063231号、同第20070218528号、同第20070134796号、同第20080015164号、並びに国際公開第WO07/014275号及び同第WO2007/139982号を参照されたく、それらの開示は、全ての目的のために参照によりそれらの全体が組み込まれる。したがって、標的ゲノム位置でDSBを生成する能力は、任意のゲノムのゲノム編集を可能にする。
DSBを修復する2つの主要なはっきりと異なる経路、相同組換え及び非相同末端結合(NHEJ)が存在する。相同組換えは、細胞修復プロセスを誘導するために、テンプレート(「ドナー」として既知である)として相同配列の存在を必要とし、修復の結果は、エラーがなく、予測可能である。相同組換えのためのテンプレート(又は「ドナー」)配列の不在下で、細胞は、典型的には、エラーを起こしやすいNHEJプロセスを介してDSBを修復しようと試みる。
キサントモナス属の植物病原菌は、重要な作物において多くの病害を引き起こすことで知られている。キサントモナスの病原性は、25個を超える異なるエフェクタータンパク質を植物細胞に注入する保存されたIII型分泌(T3S)系に依存する。これらの注入されるタンパク質の中には、植物転写活性化因子を模倣し、かつ植物トランスクリプトームを操作する転写活性化因子様のエフェクター「TALE」又は「TAL−エフェクター」)がある(Kay et al(2007)Science 318:648−651を参照のこと)。これらのタンパク質は、DNA結合ドメイン及び転写活性化ドメインを含有する。最もよく特性化されたTALEのうちの1つは、トウガラシ斑点細菌病(Xanthomonas campestris pv.Vesicatoria)由来のAvrBs3である(Bonas et al(1989)Mol Gen Genet 218:127−136及び国際公開第WO2010079430号を参照のこと)。TALEは、DNA認識を媒介する集中型反復ドメインを含有し、約33〜35個のアミノ酸を含有するそれぞれの反復単位は、1つの標的塩基を特定する。TALEは、核局在化配列及びいくつかの酸性転写活性化ドメインも含有する(総説については、Schornack S,et al(2006)J Plant Physiol 163(3):256−272を参照のこと)。加えて、植物病原菌ラルストニア・ソラナセラムにおいて、ラルストニア・ソラナセラム次亜種1株GMI1000及び次亜種4株RS1000におけるキサントモナスのAvrBs3ファミリーに相同のbrg11及びhpx17と指定される2つの遺伝子が見出されている(Heuer et al(2007)Appl and Envir Micro 73(13):4379−4384を参照のこと)。これらの遺伝子は、ヌクレオチド配列において相互に98.9%同一であるが、hpx17の反復ドメインにおいて1,575bpの欠失分だけ異なる。しかしながら、両方の遺伝子産物は、キサントモナスのAvrBs3ファミリータンパク質と40%未満の配列同一性を有する。
これらのTALEのDNA結合特異性は、タンデムTALE反復単位において見出される配列に依存する。反復配列は、約33〜35個のアミノ酸を含み、反復は、典型的には、相互に91〜100%相同である(Bonasら、同書)。12及び13位の超可変ジ残基(hypervariable diresidue)の同一性とTALEの標的配列における隣接ヌクレオチドの同一性との間に一対一対応があるように見受けられる(Moscou and Bogdanove(2009)Science 326:1501及びBoch et al(2009)Science 326:1509−1512を参照のこと)。これらの2つの隣接アミノ酸は、反復可変ジ残基(Repeat Variable Diresidue)(RVD)と称される。実験的に、12位及び13位のHD配列がシトシン(C)への結合につながり、NGがTに、NIがAに結合し、NNがG又はAに結合し、かつNGがTに結合するように、これらのTALEのDNA認識のための天然コードが決定されている。これらの特異性決定TALE反復単位は、変異体TALEタンパク質を作製するために、天然TALE反復単位と変更された数の反復との新たな組み合わせを伴ってタンパク質に組み立てられている。それらの天然構造にあるとき、これらの変異体は、新しい配列と相互作用し、かつ植物細胞におけるレポーター遺伝子の発現を活性化することができる(Bochら、同書)。しかしながら、これらのタンパク質は、天然(全長)TALEタンパク質構造を維持し、構築物内のTALE反復単位の数及び同一性のみが変化した。全て又はほぼ全てのTALEタンパク質はまた、TALEヌクレアーゼ融合タンパク質(「TALEN」)を作成するために、FokIタンパク質由来のヌクレアーゼドメインに融合しており、これらのTALENが酵母細胞においてエピソームレポーター遺伝子を切断することが示されている(Christian et al.(2010)Genetics 186(2):757−61;Li et al.(2011a)Nucleic Acids Res.39(1):359−372)。そのような構築物はまた、適切な配列増幅スキームが採用されるとき、酵母細胞中の内在性遺伝子を定量化可能なレベルまで修飾することができ、哺乳類及び植物細胞中の内在性遺伝子を、検出可能であるが定量化不可能なレベルまで修飾することができる。Li et al.(2011b)Nucleic Acids Res.epub doi:10.1093/nar/gkr188、Cermak et al.(2011)Nucleic Acids Res.epub doi:10.1093/nar/gkr218を参照されたい。二段階濃縮スキームが植物及び動物細胞における活性を検出するために必要とされたという事実は、ほぼ全てのTALEタンパク質とFokIタンパク質由来のヌクレアーゼドメインとの間の融合物が植物及び動物細胞中の内在性遺伝子を効率的に修飾しないことを示す。言い換えると、TALE反復配列をFokI切断ドメインに結合させるためのこれらの研究において使用されるペプチドは、高等真核生物における内在性遺伝子のFokIドメインによる効率的な切断を許容しない。したがって、これらの研究は、内因性の真核性環境における高度に活性な切断を可能にするであろう、TALE配列をヌクレアーゼドメインに結合させるために使用することができる組成物を開発する必要性を強調する。
様々な細胞型における内在性遺伝子の制御のための遺伝子操作された転写因子、並びに多数のモデル、診断及び治療体系、並びにあらゆる種類のゲノム遺伝子操作及び編集用途においても同様に使用することができる遺伝子操作されたヌクレアーゼを含む、様々な用途のためにこれらの結合タンパク質の範囲、特異性、及び有用性を増加させる遺伝子操作されたDNA結合ドメインの必要性が未だ存在する。
したがって、本発明は、内因性遺伝子座の発現状態又は配列の標的化操作の方法を提供する。本発明のいくつかの実施形態において、本発明の方法は、遺伝子操作された転写因子、遺伝子操作されたヌクレアーゼ(「TALEN」)、リコンビナーゼ、トランスポザーゼ、インテグラーゼ、メチラーゼ、酵素ドメイン、及びレポーターを形成するために、機能タンパク質ドメイン(集合的に「TALE融合物」)に融合した1つ以上のTALE反復単位を含むDNA結合タンパク質を使用する。いくつかの態様において、ポリペプチドは、内因性標的DNAでの効率的かつ特異的な機能のために、さらなるTALEタンパク質配列に結合される少なくとも1つのTALE反復単位を含む。TALE反復ドメインのN末端及び任意でC末端に結合されるこれらのさらなる配列は、「Nキャップ」及び「Cキャップ」配列とも称される。したがって、本発明は、1つ以上(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20個以上)のTALE反復及び/又は半反復単位を含むポリペプチドを提供する。
したがって、一態様において、少なくとも1つのTALE反復単位(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個以上の反復単位(複数を含む))を含むDNA結合ポリペプチドが本明細書で提供される。ポリペプチドは、典型的には、TALE反復(複数を含む)のDNA結合機能又はTALE融合タンパク質の機能活性を支援する任意の長さのNキャップ配列(ポリペプチド)を含む。任意で、ポリペプチドは、Cキャップ配列(ポリペプチド)、例えば、約250個未満のアミノ酸のCキャップ配列(C+230Cキャップ、残基C−20から残基C+230まで)も含み得る。加えて、ある特定の実施形態において、本明細書に記載のTALEポリペプチドのTALE反復単位のうちの少なくとも1つは、非定型の反復可変ジ残基(RVD)領域を含む。TALE反復単位は、キサントモナス、ラルストニア、又は別の関連細菌から単離された野生型ドメインであり得、かつ/又はいくつかの様式で遺伝子操作され得る(例えば、非自然発生であり得る)。ある特定の実施形態において、少なくとも1つのTALE反復単位は、遺伝子操作される(例えば、非自然発生、非定型、コドン最適化、それらの組み合わせ等)。ある特定の実施形態において、TALE反復ドメイン内の1つ以上のアミノ酸(例えば、TALE反復のうちの1つ内のRVD)は、ドメインが選択された標的配列(典型的には、自然発生TALE DNA結合ドメインによって結合される標的配列とは異なる)に結合するように変更される。他の実施形態では、少なくとも1つのTALE反復単位は、TALE反復単位の4、11、12、13、若しくは32位のアミノ酸のうちのいくつか又は全てにおいて修飾される。いくつかの実施形態において、少なくとも1つのTALE反復単位は、1つのTALE反復単位の2、3、4、11、12、13、21、23、24、25、26、27、28、30、31、32、33、34、若しくは35位のアミノ酸のうちの1つ以上において修飾される。他の実施形態では、TALE反復をコードする核酸は、DNA配列が変更されるが、アミノ酸配列は変更されないように修飾される。いくつかの実施形態において、DNA修飾は、コドン最適化のためである。さらなる実施形態において、少なくとも1つのTALE反復単位は、上述の修飾の組み合わせによって変更される。いくつかの実施形態において、いくつかの修飾されたTALE反復単位を含むTALEタンパク質が提供される。自然発生及び非自然発生TALE反復単位の組み合わせも提供される。好ましい実施形態では、(野生型又は遺伝子操作された)TALEタンパク質は、内因性標的DNAで効率的かつ特異的に機能するために、Nキャップ配列及び任意でCキャップ配列をさらに含む。いくつかの実施形態において、Nキャップは、残基N+1〜N+136(残基番号付けスキームの説明については図1Bを参照のこと)、又はそれらの任意のフラグメントを含む。他の実施形態では、Cキャップは、残基C−20〜C+28、C−20〜C+39、C−20〜C+55、若しくはC−20〜C+63、又はそれらの任意の全長TALE C末端のフラグメントを含む。ある特定の実施形態において、TALE反復ドメイン、並びにNキャップ配列及び任意でCキャップ配列を含むポリペプチドは、制御ドメイン又は機能ドメイン、例えば、転写活性化因子、転写抑制因子、ヌクレアーゼ、リコンビナーゼ、トランスポザーゼ、インテグラーゼ、メチラーゼ等をさらに含む。
これらのタンパク質をコードするポリヌクレオチドも薬学的組成物として提供される。加えて、本発明は、これらのタンパク質/ポリヌクレオチドを含み、かつ/又はこれらのタンパク質によって修飾(例えば、子孫に受け継がれるゲノム修飾)される宿主細胞、細胞株、及びトランスジェニック生物(例えば、植物、真菌、動物)を含む。例示的な細胞及び細胞株には、動物細胞(例えば、ヒトを含む哺乳類、幹細胞等の細胞)、植物細胞、細菌細胞、原虫細胞、魚細胞、又は真菌細胞が挙げられる。別の実施形態では、細胞は、哺乳類細胞である。これらのタンパク質及び/又はポリヌクレオチドを作成かつ使用する方法も提供される。
一態様において、1つ以上の異種ポリペプチドドメイン、例えば、機能(制御)ドメインに動作可能に結合される1つ以上の遺伝子操作されたTALE反復単位、Nキャップ配列、及び任意でCキャップ配列を含む融合タンパク質が本明細書において提供される。遺伝子操作されたTALE反復を目的とする機能タンパク質ドメインに結合させるための任意の構造化リンカー又は可撓性リンカーとして、TALE反復のモジュールを含むライブラリが提供される。機能タンパク質ドメイン(例えば、転写活性化因子、抑制因子、又はヌクレアーゼ)は、融合タンパク質のC末端若しくはN末端で位置付けされ得る。本明細書に記載の融合タンパク質を作製する方法も提供される。
本発明は、遺伝子操作されたTALE融合タンパク質に好適な標的配列(部位)を同定するための方法も提供する。いくつかの実施形態において、同定された標的部位は、天然TALE標的配列と比較して、増加したグアニンヌクレオチド(「G」)数を有する。他の実施形態では、標的は、自然発生TALEタンパク質において典型的な隣接チミジンヌクレオチド(「T」)を必要としない。いくつかの実施形態において、遺伝子操作されたTALEタンパク質での使用のために選択されるRVDは、標的配列におけるGヌクレオチドの認識のために、1つ以上のNK(アスパラギン−リジン)RVDを含有する。自然に見出されるものとは異なる、ヌクレオチド塩基を認識することができる新規の(非自然発生)RVDが、本発明においてさらに提供される。非定型又は非自然発生RVD(TALE反復単位の12位及び13位のアミノ酸配列)の非限定的な例には、表30Aに示されるRVDが挙げられ、例えば、Tを認識するVG及びIA、A及びTを認識するRG、並びにA、C、及びTを認識するAAが提供される。全てのヌクレオチド塩基(例えば、A、C、T、及びG)と同等に相互作用することができるRVDも提供される。本明細書に記載の組成物及び方法において有用なさらなるRVDが、表27に示される。
ユーザの選択によって、TALEヌクレアーゼ(「TALEN」)ヘテロ二量体による修飾の影響下にある核酸上の2つの標的部位の間の距離又はギャップ間隔を制約するか、又は制約しない方法も、本発明によって提供される。いくつかの実施形態において、ギャップ間隔が、12〜13個の塩基対に制約される一方で、他の実施形態では、遺伝子操作されたTALENは、12〜21個の塩基対のギャップ間隔を含むDNA標的を切断するように設計される。いくつかの実施形態において、TALENヘテロ二量体は、それぞれの単量体結合部位の間に1〜34個のヌクレオチドのギャップを含む配列を切断するように設計される。さらにさらなる実施形態では、TALENは、+28C末端切断(C+28 Cキャップ)を含むTALEN構造を利用することによって、12又は13個の塩基対ギャップを有する標的を切断するよう制約される。他の実施形態では、設計されたTALENは、+63C末端切断を含むTALEN構造を使用して、12〜21個の塩基対ギャップ間隔を含む標的核酸を切断するよう作製され、ギャップ間隔の要件の柔軟性のため、好適なTALEN標的部位を同定することができる可能性を増加させる。いくつかの実施形態において、TALENは、R1/2反復がT以外のヌクレオチド塩基を標的とすることができるように、遺伝子操作されたR1/2反復を有する。
別の態様では、本発明は、遺伝子操作されたTALE DNA結合ドメイン融合物のためのベクターを提供し、ベクターは、TALE反復配列に隣接するTALE Nキャップ及びCキャップ配列並びに位置を含み、複数のTALE反復単位、リンカー配列、プロモーター、選択可能なマーカー、ポリアデニル化シグナル部位、機能タンパク質ドメイン等のクローニングを可能にする。特定のTALE DNA結合ドメイン及びそれらのドメイン(例えば、TALEN)を含む融合タンパク質を即時に組み立てることができるように、(例えば、遺伝子操作された)少なくとも1つのTALE反復単位を含むモジュールアーカイブライブラリの構築方法も本発明によって本明細書で提供される。
さらに別の態様では、本発明は、細胞内の内因性細胞遺伝子の発現を調節する方法を提供し、本方法は、内因性細胞遺伝子内の第1の標的部位を、機能ドメイン(例えば、転写調節ドメイン)に融合した第1の遺伝子操作されたTALEに接触させ、それによって、内因性細胞遺伝子の発現を調節する工程を含む。別の態様では、本発明は、細胞中の内因性細胞遺伝子の発現を調節する方法を提供し、本方法は、内因性細胞遺伝子内の標的部位を融合TALEタンパク質に接触させる工程を含み、TALEは、遺伝子操作されたTALE反復ドメインを含み、したがって、TALEが所望の配列に対して特異性を有する。いくつかの実施形態において、調節作用は、内在性遺伝子の発現を活性化することである。いくつかの実施形態において、内在性遺伝子の発現は阻害される。さらに別の実施形態では、内在性遺伝子の活性化又は抑制は、TALE融合タンパク質の結合によって調節され、したがって、内因性活性化因子又は抑制因子が、目的とする遺伝子の制御領域に結合することができない。
一実施形態において、接触工程は、内因性細胞遺伝子内の第2の標的部位を、第2の遺伝子操作されたTALE融合タンパク質に接触させる工程をさらに含み、それによって、第2の内因性細胞遺伝子の発現を調節する。別の実施形態では、第1及び第2の標的部位は、隣接している。ある特定の実施形態において、第1及び第2の標的部位は、例えば、TALE転写因子を使用して2つ以上の遺伝子の発現を調節するように、異なる遺伝子内に存在する。他の実施形態では、第1及び第2の標的部位は、例えば、同一の遺伝子内で切断するために1対のTALEN融合タンパク質が使用されるとき、同一の遺伝子内に存在する。第1及び第2の標的部位は、塩基対(「ギャップ寸法」)、例えば、1〜20個(又はその間の任意の数)又はさらにそれ以上の塩基対のうちのいずれかによって分離される。別の実施形態では、接触工程は、3つ以上の標的部位を接触させる工程をさらに含む。ある特定の実施形態において、2組の標的部位は、2対のTALENによって接触され、2組の標的における特異的欠失又は挿入を作成するために使用される。別の実施形態では、第1のTALEタンパク質は、制御又は機能ドメインを含む融合タンパク質である。別の実施形態では、第1のTALEタンパク質は、少なくとも2つの制御又は機能ドメインを含む融合タンパク質である。別の実施形態では、第1及び第2のTALEタンパク質は、それぞれ制御ドメインを含む融合タンパク質である。別の実施形態では、第1及び第2のTALEタンパク質は、それぞれ少なくとも2つの制御ドメインを含む融合タンパク質である。1つ以上の機能ドメインは、TALEタンパク質の末端のいずれか(又は両方)に融合することができる。TALE融合タンパク質のうちのいずれかは、これらのタンパク質をコードするポリヌクレオチドとして提供され得る。
さらに別の態様では、本発明は、ヌクレアーゼドメインを本明細書に記載のTALE反復ドメインに結合させるCキャップのための組成物を提供し、結果として生じる融合タンパク質は、高度に活性なヌクレアーゼ機能を呈する。いくつかの実施形態において、Cキャップは、天然TALE C末端隣接配列由来のペプチド配列を含む。他の実施形態では、Cキャップは、TALE反復ドメイン由来のペプチド配列を含む。さらに別の実施形態では、Cキャップは、TALEタンパク質に由来しない配列を含む。Cキャップは、キメラ構造も呈し得、例えば、天然TALE C末端隣接配列由来のペプチド配列及び/又はTALE反復ドメイン及び/又は非TALEポリペプチドを含む。
本明細書に記載の組成物又は方法のうちのいずれかにおいて、制御又は機能ドメインは、転写抑制因子、転写活性化因子、ヌクレアーゼドメイン、DNAメチルトランスフェラーゼ、タンパク質アセチルトランスフェラーゼ、タンパク質デアセチラーゼ、タンパク質メチルトランスフェラーゼ、タンパク質デアミナーゼ、タンパク質キナーゼ、及びタンパク質ホスファターゼからなる群から選択され得る。いくつかの態様において、機能ドメインは、後成的制御因子である。植物において、そのようなTALE融合物を、標準の技法を使用して異種交配させることによって除去することができる。そのような実施形態では、融合タンパク質は、非限定的な例として、ヒストンメチルトランスフェラーゼ、DNAメチルトランスフェラーゼ、又はヒストンデアセチラーゼ等の後成的制御因子を含むであろう。例えば、共同所有の米国特許第7,785,792号を参照されたい。
したがって、いくつかの態様において、TALE融合タンパク質は、ヌクレアーゼドメイン(「TALEN」)に融合したTALE反復ドメインを含む。上述のように、いくつかの実施形態において、TALE反復ドメインは、Nキャップ配列及び任意でCキャップ配列にさらに融合する。他の実施形態では、ヌクレアーゼドメインは、ヌクレアーゼドメインの効率的な触媒機能を提供するリンカーペプチド配列を介して、Nキャップのアミノ末端又はCキャップのカルボキシ末端のいずれかに結合される。ヌクレアーゼドメインは、自然発生し得るか、遺伝子操作され得るか、又は非自然発生し得る。いくつかの実施形態において、ヌクレアーゼドメインは、IIS型ヌクレアーゼ(例えば、FokI)に由来する。他の実施形態では、TALE DNA結合ドメインは、BfiIヌクレアーゼドメインに動作可能に結合される。いくつかの実施形態において、FokIドメインは、2つの切断半ドメインを含む一本鎖ヌクレアーゼドメインであり、他の実施形態では、FokI切断半ドメインである。本発明のいくつかの態様において、単一のTALENタンパク質が、標的DNAにおいて二本鎖切断を誘導するために単独で使用される一方で、他の実施形態では、TALENは、1対のヌクレアーゼの一部として使用される。いくつかの実施形態において、対が、FokI半ドメインを含む2つのTALENを含み、DNA切断を達成するためにFokI半ドメインの対形成が必要とされる一方で、他の場合においては、TALENタンパク質は、亜鉛フィンガーヌクレアーゼと組み合わせて使用され、DNA切断を達成するために2つのFokI切断ドメインの対形成が必要とされる。いくつかの実施形態において、TALE DNA結合ドメインは、亜鉛フィンガーに融合して、亜鉛フィンガー/TALEハイブリッドDNA結合ドメインを作製する。いくつかの事例において、ハイブリッドDNA結合ドメインは、DNA標的結合部位内でのDNA塩基の内部ストレッチとの相互作用を省略することができる。いくつかの実施形態において、FokIドメインは、ホモ二量体を形成することができ、他の事例において、TALEN対のそれぞれのメンバー由来の2つの同一でないFokI切断ドメインのヘテロ二量体化が、標的化切断活性に必要とされる。これらのヘテロ二量体のTALEN対において、同一の種類の2つのFokIドメインは、生産的にホモ二量体化することができない。他の実施形態では、TALEN対が使用され、1つのFokI切断ドメインは、対形成が生じ得るように不活性であるが、標的DNAは、両方の鎖を切断するというよりはむしろ、DNA分子の一方の鎖上に切れ目を作成するように切れ目が入れられる。
本明細書に記載の組成物又は方法のうちのいずれかにおいて、TALE融合タンパク質は、TALE融合タンパク質核酸によってコードされ得る。ある特定の実施形態において、TALE融合タンパク質をコードする配列は、プロモーターに動作可能に結合される。したがって、ある特定の実施形態において、内在性遺伝子発現又はゲノム修飾を調節する方法は、細胞にTALEタンパク質をコードする核酸を最初に投与する工程をさらに含む。TALE融合タンパク質は、レトロウイルス発現ベクター、アデノウイルス発現ベクター、DNAプラスミド発現ベクター、又はAAV発現ベクター等の発現ベクターから発現され得る。いくつかの実施形態において、発現ベクターは、レンチウイルスベクターであり、これらの実施形態のうちのいずれかでは、レンチウイルスベクターは、インテグラーゼを欠いている。
任意の細胞型の任意の所望の標的遺伝子座(例えば、内在性遺伝子)に特異的なTALEN(例えば、TALEN対)も、本発明において提供される。非限定的な例には、NTF3、VEGF、CCR5、IL2Rγ、BAX、BAK、FUT8、GR、DHFR、CXCR4、GS、Rosa26、AAVS1(PPP1R12C)、MHC遺伝子、PITX3、ben−1、Pou5F1(OCT4)、C1、RPD1等に特異的なTALENが挙げられる。
本明細書に記載のTALE反復ドメインは、内因性細胞遺伝子の転写開始部位の上流、又はそれに隣接した標的部位に結合し得る。あるいは、標的部位は、内因性細胞遺伝子の転写開始部位の下流のRNAポリメラーゼ休止部位に隣接し得る。さらにさらなる実施形態では、TALE融合タンパク質(例えば、TALEN)は、遺伝子のコード配列内の部位、又は例えば、リーダー配列、トレーラー配列、若しくはイントロン等の遺伝子内若しくは遺伝子に隣接した非コード配列内の部位、又はコード領域の上流若しくは下流のいずれかの非転写領域内の部位に結合する。
別の態様では、細胞内の1つ以上の目的とする遺伝子を切断するための方法が本明細書に記載されており、本方法は、(a)TALENタンパク質(複数を含む)が発現されて、1つ以上の遺伝子が切断されるような条件下で、細胞に、1つ以上の遺伝子内の標的部位に結合する1つ以上のTALENタンパク質(複数を含む)(又はTALENをコードするポリヌクレオチド)を導入することを含む。2つ以上のTALENタンパク質が導入される実施形態において、1つ、いくつか、若しくは全てをポリヌクレオチド又はポリペプチドとして導入してもよい。いくつかの態様において、該遺伝子切断は、標的化遺伝子の機能的破壊をもたらす。標的化DNAの切断は、NHEJの後に続き得、わずかな挿入又は欠失(インデル)が切断部位で挿入される。次いで、これらのインデルは、切断位置での非特異的変異の導入を介して機能的破壊を引き起こす。
さらに別の態様では、細胞のゲノムに外因性配列を導入するための方法が本明細書に記載されており、本方法は、(a)TALENタンパク質(複数を含む)が発現され、遺伝子内の1つ以上の標的部位が切断されるような条件下で、細胞に、標的遺伝子内の標的部位に結合する1つ以上のTALENタンパク質(複数を含む)(又はTALENタンパク質(複数を含む)をコードするポリヌクレオチド)を導入する工程、及び(b)細胞を外因性ポリヌクレオチドに接触させる工程を含み、したがって、DNA標的部位(複数を含む)の切断が相同組換えによる外因性ポリヌクレオチドのゲノムへの組込みを刺激する。ある特定の実施形態において、外因性ポリヌクレオチドは、ゲノムに物理的に組み込まれる。他の実施形態では、外因性ポリヌクレオチドは、二本鎖切断の相同指向修復(HDR)に関連付けられる特殊化された核酸複製プロセスを介する宿主細胞ゲノムへの外因性配列のコピーによってゲノムに組み込まれる。さらに他の実施形態では、ゲノムへの組込みは、非相同依存性標的組込み(例えば「末端捕捉」)を介して生じる。いくつかの実施形態において、外因性ポリヌクレオチドは、同族リコンビナーゼ(例えば、それぞれ、Cre又はFRT)による認識のために、リコンビナーゼ認識部位(例えば、loxP又はFLP)を含む。ある特定の実施形態において、外因性配列は、小動物(例えば、ウサギ、又はマウス、ラット等の齧歯類)のゲノムに組み込まれる。一実施形態において、TALE融合タンパク質は、トランスポザーゼ、リコンビナーゼ、又はインテグラーゼを含み、TALE反復ドメインは、特異的に所望される標的配列を認識するために遺伝子操作されている。いくつかの実施形態において、TALEポリペプチドが使用される。いくつかの態様において、TALE融合タンパク質は、トランスポザーゼ又はインテグラーゼを含み、CHO細胞特異的トランスポザーゼ/インテグラーゼ系の開発のために使用される。
いくつかの実施形態において、TALE融合タンパク質は、メチルトランスフェラーゼを含み、TALE反復ドメインは、特異的に所望される標的配列を認識するために遺伝子操作されている。いくつかの実施形態において、TALE反復ドメインは、ゲノム又はクロマチンの後成的修飾に作用する機能を果たすタンパク質複合体のサブユニットに融合する。
さらにさらなる実施形態において、そのTALE融合は、レポーター又は選択マーカーをさらに含み、TALE反復ドメインは、特異的に所望される標的配列を認識するために遺伝子操作されている。いくつかの態様において、レポーターが蛍光マーカーである一方で、他の態様では、レポーターは、酵素である。
別の態様では、TALE融合タンパク質のうちの1つ以上を含む組成物が本明細書に記載される。ある特定の実施形態において、組成物は、薬学的に許容される賦形剤との組み合わせで1つ以上のTALE融合タンパク質を含む。いくつかの実施形態において、組成物は、TALE融合タンパク質をコードするポリヌクレオチドを含む。いくつかの実施形態は、TALENをコードするDNA分子を含む組成物を含む。他の実施形態では、組成物は、TALENをコードするRNA分子を含む。いくつかの組成物は、核酸ドナー分子をさらに含む。
別の態様では、本明細書に記載の1つ以上のTALE融合タンパク質をコードするポリヌクレオチドが本明細書に記載される。ポリヌクレオチドは、例えば、mRNAであり得る。
別の態様では、プロモーター(例えば、構成的、誘導的、組織特異的等)に動作可能に結合される本明細書に記載の1つ以上のTALE融合タンパク質をコードするポリヌクレオチドを含むTALE融合タンパク質発現ベクターが本明細書に記載される。
別の態様では、1つ以上のTALE融合タンパク質及び/又は1つ以上のポリヌクレオチド(例えば、本明細書に記載のTALE融合タンパク質をコードする発現ベクター)を含む宿主細胞が本明細書に記載される。ある特定の実施形態において、宿主細胞は、1つ以上の亜鉛フィンガータンパク質及び/又はベクターをコードするZFPをさらに含む。宿主細胞は、これらのタンパク質発現ベクターのうちの1つ以上で安定的に形質転換され得るか、又は一時的にトランスフェクトされ得るか、又はそれらの組み合わせであり得る。他の実施形態では、1つ以上のタンパク質発現ベクターは、宿主細胞において1つ以上の融合タンパク質を発現する。別の実施形態では、宿主細胞は、外因性ポリヌクレオチドドナー配列をさらに含む。細菌、植物、魚、酵母、藻、昆虫、寄生虫、又は哺乳類細胞を含むが、それらに限定されない任意の原核又は真核宿主細胞を採用することができる。いくつかの実施形態において、宿主細胞は、植物細胞である。他の態様では、宿主細胞は、植物の栄養部分、貯蔵器官、果実、花及び/又は種子組織等の植物組織の一部である。さらなる実施形態において、宿主細胞は、藻細胞である。他の実施形態では、宿主細胞は、線維芽細胞である。本明細書に記載の実施形態のうちのいずれかにおいて、宿主細胞は、幹細胞、例えば、胚幹細胞を含み得る。幹細胞は、哺乳類幹細胞、例えば、造血幹細胞、間葉幹細胞、胚幹細胞、神経幹細胞、筋肉幹細胞、肝幹細胞、皮膚幹細胞、誘導性多能性幹細胞、及び/又はそれらの組み合わせであり得る。ある特定の実施形態において、幹細胞は、ヒト誘導性多能性幹細胞(hiPSC)又はヒト胚幹細胞(hESC)である。本明細書に記載の実施形態のうちのいずれかにおいて、宿主細胞は、胚細胞、例えば、マウス、ラット、ウサギ、又は他の哺乳動物細胞の1つ以上の胚を含み得る。いくつかの態様において、幹細胞又は胚細胞は、例えば、変異が遺伝的であるように生殖系列に組み込まれるTALE媒介性ゲノム修飾を有する動物を含むトランスジェニック動物の開発において使用される。さらなる態様では、これらのトランスジェニック動物、すなわち、マウス、ラット、ウサギが、研究目的で使用される一方で、他の態様では、トランスジェニック動物は、家畜動物、すなわち、ウシ、ニワトリ、ブタ、ヒツジ等である。さらにさらなる態様では、トランスジェニック動物、すなわち、ヤギ、ウシ、ニワトリ、ブタは、治療目的のために使用される動物であり、他の態様では、トランスジェニック動物は、ペット、すなわち、ネコ、イヌ、ウマ、鳥、又は魚である。
本発明によって提供される別の態様は、TALE結合に好適な核酸標的を同定するための方法である。いくつかの実施形態において、典型的な自然発生TALEタンパク質によって使用される標的は、標的部位へのその類似性に基づいて選択される。他の実施形態では、遺伝子操作されたTALEタンパク質が、非定型の標的配列と相互作用できるようにするように変更されているため、典型的な自然発生TALEタンパク質によって利用されない標的が選択される。いくつかの実施形態において、この変更は、非定型の(非自然発生又は稀な)RVD配列の選択を伴う。さらなる実施形態において、使用される非定型のRVDは、所望の標的配列におけるG残基の認識のための「NK」RVDである。他の実施形態では、遺伝子操作されたTALEタンパク質が、核酸塩基の非天然比率と相互作用できるようにするように変更されているため、核酸塩基の非天然比率を含有する標的が選択される。いくつかの実施形態において、所望の標的配列における塩基の比率は、異常な数のG残基を含む。他の実施形態では、所望の標的配列における塩基の比率は、異常な数の非定型のジヌクレオチド、トリヌクレオチド、又はテトラヌクレオチドを含む。TALE−DNA結合相互作用に最も最適な標的を同定するための設計ルールがさらに提供される。これらのルールは、最適なジヌクレオチド及びトリヌクレオチド対を含む標的部位配列の選択の指針を提供する。加えて、これらのルールは、当業者が、所望の場合、これらの配列を回避し得るように、より最適性の低いジヌクレオチド及びトリヌクレオチド対の指針も提供する。標的配列の選択の際にユーザにより高い柔軟性を提供するために、全てのヌクレオチドと相互作用することができるRVDも提供される。
一態様において、本発明は、インビボでのゲノム操作のための組成物及び方法を提供する。ある特定の実施形態において、TALENをコードするmRNAは、所望の場合、特定のDSBを導入するために、生殖腺、卵子、又は胚に注入され得る。いくつかの実施形態において、ドナーヌクレオチドは、生物における特定の標的組込みを引き起こすために、TALENmRNAとともに共送達される。
さらにさらなる態様では、本発明のTALEドメインタンパク質(及びこれらのTALE反復タンパク質を含む融合タンパク質)を含むキットが本明細書において提供される。これらのキットは、ユーザによるゲノム操作を促進するために使用され得るため、例えば、ゲノム内の所望の標的又はセーフハーバー遺伝子座を切断するTALENを提供することができる。TALENを、核酸(例えば、DNA若しくはRNA)又はタンパク質のいずれかとして提供することができる。いくつかの事例において、タンパク質を、安定性を増加させるように製剤化することができるか、又は乾燥形態で提供することができる。いくつかの事例において、キットは、診断目的のために使用される。いくつかの事例において、キットに含まれるTALE融合物は、転写制御因子である。いくつかの事例において、TALE融合物は、レポーターを含む。
パネルAは、TALEタンパク質を示す。図1Aは、TALEタンパク質のドメイン構造の概略図を示す(原寸に比例して描写されていない)。「N」及び「C」は、それぞれ、アミノ末端及びカルボキシ末端を示す。TALE反復ドメイン、Nキャップ、及びCキャップが表示され、このタンパク質におけるNキャップ及びCキャップの残基番号付けスキームが示される。「R0」は、TALE反復単位といくつかの構造的相同性を共有することができ、かつDNA標的配列においてチミンを特定することができる第1のタンデムTALE反復に先行する34個のアミノ酸を表す。「R1/2」は、典型的なTALE反復の最初の20個の残基との相同性を有する、(残基がC−20からC−1まで番号付けされた)20個の残基のペプチド配列であるC末端TALE「半反復」を意味する。NLSは、核局在化配列である。ADは、酸性活性化ドメインである。
パネルBは、TALEタンパク質を示す。図1B(配列番号135)は、1〜152個のN末端アミノ酸残基を欠失させるように設計されたクローニングスキームで単離された、クローニングされた天然TALEタンパク質(以下、「TALE13」と称される)の一次配列を示す。Nキャップ及びCキャップは、配列の下に黒色の太線によって示され、Nキャップにおける位置N+1及びN+136並びにCキャップにおける位置C+1及びC+278が示される。半反復は、Cキャップの最初の20個の残基であり、「C+1」で示される位置の直前で終わる。TALE反復及び半反復における下線を引いた残基は、標的結合中の反復によって接触されるDNAヌクレオチドを特定するアミノ酸(RVD)を示す。
パネルA及びBは、TALE13(TR13)の予測標的とともに使用するためのレポーター構築物を示す。図2A(配列番号136)は、1〜4個のTR13標的をベクターに挿入するために使用されるクローニング部位を示すレポーターベクターの概略図を示す。斜字体の領域は、ルシフェラーゼ遺伝子のプロモーター領域である。図2B(配列番号137)は、2個のTR13標的を含有する、使用されたリンカー配列を示す。
パネルA及びBは、0〜4個のTR13標的を含有するレポーター構築物の概略図(図3A)、及びそれぞれ、R13x1〜R13x4で示される、1〜4個のTR13標的を含有するルシフェラーゼレポーター構築物上でのTALE13−VP16融合タンパク質(TR13−VP16、VP16由来の活性化ドメインに結合されるTALE13)による相乗的なレポーター遺伝子活性化(図3B)を示す。pGL3は、任意のTR13標的要素を欠如している対照レポーターベクターである。
パネルA及びBは、TALE VP16融合タンパク質によるレポーター遺伝子活性化を示す。図4Aは、VP16ドメイン並びに本研究において使用したレポーター構築物の付加を有するか、又は有さないTALEタンパク質の概略図である。R13×2が、TALE13(TR13)標的のうちの2つが挿入される構築物を示す一方で、R15×2は、TALE15(TR15)標的のうちの2つが挿入される構築物を示す。図4Bは、TALEタンパク質単独ではなく、VP16融合を有するTALEタンパク質によるレポーター遺伝子活性化を示す。したがって、TALEタンパク質中に存在する天然転写活性化ドメインは、このアッセイでは、哺乳類細胞において機能的ではなかった。さらに、観察された転写活性は、正しい標的がそれらの対応するTALE VP16融合物と一致するときのみ、レポーター遺伝子活性化が生じるため、特異的であった。クローニングされたTALE13及びTALE15は、それぞれ、TR13及びTR15で示される。TR13−VP16及びTR15−VP16は、それらのC末端に融合したさらなるVP16活性化ドメインを有するTR13及びTR15に類似している。
パネルA及びBは、プロモーターに対する標的配列配置の位置効果を示す。図5Aは、標的配列がSV40プロモーターに対して近位(R13×4)又は遠位(R13×4D)のいずれかで配置されるレポーター構築物の概略図を示す。図5Bは、示されるTALEによるレポーター遺伝子活性化を示す。「nR13V−d145C」が、SV40核局在化配列、145個のアミノ酸残基がC末端から欠失したTR13配列(C+133 Cキャップを産出する)、及びVP16活性化ドメインを含有する発現構築物を指す一方で、「R13−VP16」は、TALE13配列及びVP16活性化ドメインを含有する発現構築物を指す。示されるように、(i)全長TALEの145個のC末端アミノ酸は、レポーター遺伝子活性化に必要とされず、(ii)標的配列がプロモーター配列の近位に配置されるとき、レポーター遺伝子活性化が最も高い。
パネルA及びBは、TALE融合物を用いたレポーター遺伝子(ルシフェラーゼ)活性化を示すグラフである。図6Aは、遺伝子操作されたTALE18タンパク質(ここではR23570、後の図ではNT−Lと称される)を含む融合タンパク質を用いたレポーター遺伝子の活性化を示す。レポーター構築物は、ルシフェラーゼ遺伝子の上流で遺伝子操作されたTALE18標的の2つのコピーを含有する。このレポーターの活性化は、17.5個の遺伝子操作された反復配列(17個の全TALE反復及び1個の半反復)、TR13のタンデムTALE反復に隣接するN及びC末端配列(Nキャップ及びCキャップ)、並びにVP16活性化ドメインを含有するR23570Vでのみ観察される。N末端隣接配列及びC末端隣接配列(Nキャップ及びCキャップ)の両方の欠失は、活性を無効にする(nR23570S−dNCを偽構築物と比較する)。nR23570S−dNCは、SV40 NLS(n)、単一のp65活性化ドメイン(S)に融合した17.5個の遺伝子操作されたTALE反復配列を含有するが、TALE由来のN末端配列及びC末端配列(Nキャップ及びCキャップ)を欠如している(dNC)。nR23570SS−dNCは、2つのp65ドメインを有することを除いて、nR23570S−dNCと同一である。R0−VP16構築物は、R23570と同一であるが、タンデムTALE反復を欠如している。「偽」は、発現構築物を欠如した実験の結果を示す。図6Bは、遺伝子操作された(非自然発生)TALE18ドメインを含む融合タンパク質による、その染色体環境における内在性遺伝子の活性化を示す。NTF3遺伝子を標的とするように設計された遺伝子操作されたTALE18(R23570V)は、内因性NTF3 mRNAレベルの実質的な増加をもたらし得る。同一の条件下において、NTF3 mRNAの発現は、R0−VP16又はGFPのいずれによっても影響を及ぼされない。R23570V及びR0−VP16は、上述のように説明される。
パネルA〜Dは、さらなる例示的なNTF3特異的TALE転写因子融合物を示す。図7Aは、NTF3プロモーター(配列番号138)における例示的なタンパク質及びそれらの標的の図解を示す。2つのTALE転写因子変異体は、VP16活性化ドメインに結合され、HEK293細胞中で発現された。下の配列は、ヒトNTF3のプロモーター近位領域を示す。下線を引いた塩基は、NT−L TALE反復ドメインの標的部位を示す。鉤状矢印は、NTF3転写の開始部位を示す。図7Bは、図7Aに描かれた上のタンパク質又は下のタンパク質のいずれかを発現するHEK293細胞における相対NTF3 mRNAレベルを示す。「eGFP」は、強化されたGFPを発現する対照プラスミドでトランスフェクトされた細胞を示す。測定を4重に行い、エラーバーは、標準偏差を示す。図7Cは、図7Aに描かれた上のタンパク質又は下のタンパク質のいずれかを発現するHEK293細胞から分泌されるNTF3タンパク質のレベルを示す。ELISAアッセイを用いて測定を2重に行い、エラーバーは、標準偏差を示す。「負」は、空ベクター対照でトランスフェクトされた細胞を示す。図7Dは、RVD(文字の一番上の列)、予想される結合部位(文字の2番目の列)、及びNT−LのSELEX由来の塩基頻度マトリックス(一番下のグラフ)を示す。マトリックスの1番目及び5番目の位置を除いて、最も頻繁に選択された塩基は、標的遺伝子座配列と一致する。
パネルA及びBは、ELISAによってアッセイされた、種々の遺伝子操作されたTALE DNA結合ドメインの一連のN末端及びC末端切断物のDNA結合能力を示すグラフである。図8Aは、9.5個のTALE反復を含むNT3特異的TALE DNA結合ドメインのデータを示し、図8Bは、9.5個のTALE反復を含むVEGF特異的TALE DNA結合ドメインのデータを示す。両方の組のデータについて、N末端切断が行われたとき、C末端は、C+95位で維持された一方で、C末端切断では、N末端は、N+137位で維持された(これらの構築物は、N+136 Nキャップ残基に付加されるメチオニン残基を有する)。見られるように、両方のタンパク質は、タンパク質がN+134位よりも離れたN末端で切断されたときに、このアッセイの条件下で、相対DNA結合親和性の明らかな減少を示した。さらに、両方のタンパク質は、C末端がアミノ酸C+54を超えて切断されたときに、このアッセイの条件下で、相対DNA結合親和性の明らかな減少を示した。
パネルA及びBは、ELISAによってアッセイされた、上述の一連のN末端及びC末端切断物のDNA結合活性を示す。図9Aにおいて、NTF3特異的TALE DNA結合ドメインについてのデータが示されるが、この場合、N末端切断を試験したとき、C末端は、C+54位で維持された。C末端切断について、N末端アミノ酸は、N+134位であった。図9Bにおいて、VEGF特異的TALE DNA結合ドメインについてのデータが示される。示されるように、N末端及びC末端は、図9Aについて上で説明されるように維持された。
活性に関与するTALE機能ドメインの解離を示す。表16において説明されるように示される構築物によるレポーター遺伝子活性化の活性を調査した。結果は、(i)N末端152個のアミノ酸及びC末端183個のアミノ酸が、このアッセイにおいて、強力な機能に必要ではないこと、かつ(ii)R0領域及びロイシン豊富なドメインを含むタンデムTALE反復に隣接する配列が、このアッセイにおいて、細胞における機能活性を回復することを示す。第1のTALE反復に先行するN末端配列又は最後の反復に続くC末端配列のいずれかの欠失は、このアッセイにおいて、機能活性を無効にする。R13V−d145Cは、C+133 Cキャップを有し、R13V−d182Cは、C+95 Cキャップを有し、R13V−dCは、C+22 Cキャップを有し、nR13V−dNは、N+8 Nキャップを有し、nR13V−d223Nは、N+52 Nキャップを有し、nR13V−d240は、N+34 Nキャップを有する。
パネルA及びBは、K562細胞におけるFokIドメインの2つのコピーに結合されたTALE13のヌクレアーゼ活性を示す。図11Aは、哺乳類細胞におけるヌクレアーゼ活性を検出するための一本鎖アニーリングに基づくレポーターアッセイ(SSA)の概略図を示す。このアッセイにおけるレポーター構築物(SSA−R13)は、TALE13標的を含有し、GFPコード配列のN末端部分(GF)とC末端部分(FP)との間に挟まれている。プラスミドSSA−R13は、GFP発現を単独で駆動することができないが、R13標的の切断は、GFPのN末端(GF)部分とC末端(FP)部分との間の相同組換えを促進して、機能的GFPを形成する。したがって、TALENタンパク質のヌクレアーゼ活性を、GFP陽性細胞の割合を分析することによって評価した。図11Bは、TALENタンパク質によるヌクレアーゼ活性を実証する。TALEN(R13d182C−scFokI、C+95 Cキャップ)を用いてSSA−R13レポーター構築物から生成されたGFP陽性細胞は、ヌクレアーゼプラスミドを欠如する対照実験(偽)と比較して、著しく増加した。R13d182C−scFokIは、FokIドメインの間のGGGGS配列の12個のコピーによって結合されるFokIドメインの2つのコピーが、VP16活性化ドメインを置換するために使用されることを除いて、上述のR13V−d182Cと同一である。
インビトロでのTALE13エフェクタードメイン−FokI切断半ドメイン融合物のヌクレアーゼ活性を示す臭化エチジウムゲルを示す。列は、4つのTALEドメインヌクレアーゼ切断タンパク質:L2又はL8リンカーのいずれかを用いたN+137、C+28配置を有するヌクレアーゼ融合物(実施例7を参照のこと)、L2リンカーを用いたN+137、C+39配置を有するヌクレアーゼ融合物を示し、L2リンカーでのN+137、C+63融合物についてのデータを示す。2つの標的部位の間のギャップ間隔は、ウェルの真下に示され、数字は、標的間のbpの数を示す。「S」は、対の半分のみの単一の標的部位を示す。「PmlI」は、標準の制限酵素での切断を示し、空は、ヌクレアーゼをコードするプラスミドなしで実験を行ったときの結果を示す。
示されるTALE13−FokI切断半ドメイン融合物によって得られたDNA切断を示すグラフである。「二量体ギャップ」は、2つの標的部位間のbpの数を示し、「パーセントDNA切断」は、どれだけのDNAが反応において切断されたかを示す。結果は、事実上100パーセントのDNA切断が、4つのヌクレアーゼのうちの3つを試験したこれらの反応条件において達成可能であることを示す。
TALEドメイン−FokI半切断ドメイン融合物のヌクレアーゼ活性を示す、臭化エチジウム染色ゲルを示す。この実験において、N末端は、C末端がC+63配置で維持された間、変化した。Pml1及び空対照は、図12と同一である。この実験で試験されたN末端切断物は、N+137、N+134、N+130、及びN+119であった。異なるDNA標的部位は、標識が、同族のレーンを下回るのではなく上回ることを除いて、図12にあるように示される。ヌクレアーゼの活性は、N末端が約+134〜+137よりも短いときに減少する。5bpのギャップ標的及び8bpのギャップ標的についてそれぞれのレーンに装填されたDNAの量が不均等であったため、これらのレーンにおける下方のバンドがDNA切断産物を表すのか、又は逆方向反復での非効率的なPCRによるバックグラウンドなのかを決定することは困難である。
パネルA及びBは、K562細胞におけるTALEN活性を示す。図15A(配列番号342)は、1対のCCR5特異的ZFN(8267/8196)の結合部位も含むTALE対を標的とするNTF3のためにレポータープラスミドにおいて使用された標的配列を示す。図15Bは、SSAヌクレアーゼアッセイの結果を示すグラフであり、(−)NT3 R18 C28L8(薄灰色バー、C+28 Cキャップ、L8リンカー)が、NTF3特異的対の一方のメンバーが存在するときにのみ観察されたデータを示し、(+)NT3 R18 C28L8(濃灰色バー)は、対の両方のメンバーが存在したときの結果を示す。「8267EL8196KK」は、CCR5特異的ZFN対を用いた結果を示す。
NTF3標的TALENの種々の対で処理された細胞上でのCel−I Surveyor(商標)ミスマッチアッセイ(Transgenomics、「Cel−Iアッセイ」)の結果を示す。1〜30で番号付けされた試料は、本文において記載されるものである。(+)は、Cel−I酵素の添加を意味し、(−)は、少しの酵素も添加しないアッセイを意味する。約226bpのバンドは、試料の大部分において明らかであり、ヌクレアーゼによる内因性NTF3標的の切断によって誘導されたミスマッチを示し、野生型配列とのミスマッチの領域を導入する非相同末端結合が続く。「gfp」は、細胞が、GFPをコードするプラスミドのみをトランスフェクトした対照を示す。ゲル上で定量化されたNHEJ活性の割合は、Cel−I酵素を含有するそれぞれの試料において示される。ゲルは、対が、哺乳類細胞中のこの内因性遺伝子座において、いくつかの試料中の全体の対立遺伝子の最大8.66%で標的化された遺伝子座の破壊を誘導したことを実証する。
パネルA〜Cは、K562細胞におけるNTF3特異的TALENの活性を示す。図17Aは、NT−L TALEN融合のために作製された遺伝子操作されたパートナーであるNT−Rと指定される遺伝子操作されたTALENタンパク質についてのSELEX特異性データを示す。予想される塩基及び対応するRVDが、プロットの上に示される。+63C末端隣接領域を、このSELEX実験に使用した。図17Bは、K562細胞における4つのNTF3特異的TALEN対を使用したCel−Iアッセイの結果のゲルを示し、培養条件は、30℃又は37℃のいずれかであった。示されるデータから見られるように、最も活性を示した対は、37℃で3%、かつ低温ショック条件下(30℃)では9%の遺伝子修飾レベルを実証した(2010年12月5日に電子公開されたDoyon et al.(2010)Nat Methods 8(1):74−9、及び米国出願第12/800,599号)。その後、低温ショック研究からのPCRプール由来の84個の増幅産物を配列決定し、図17Cに示される7個の変異対立遺伝子を同定した(配列番号343〜350)。見られるように、わずかのインデルが観察された。
パネルA及びBは、TALENを使用したK562細胞におけるNTF3遺伝子座の内因性切断後に観察された配列決定の結果を示す。図18Aは、染色体の配列(配列番号139〜140)を示し、囲みは、2つのTALENの結合部位を描写する。図18Bは、野生型(「wt」)配列(配列番号141〜175)と整列した、実施例8において説明される異なるNTF3 TALEN対で処理された細胞からのNTF3遺伝子座の配列決定の結果の集録を示す。
NTF3特異的TALENによって誘導されたDSBを介しての内在性遺伝子における標的組込み事象の結果を示す。DSBにおける捕捉のためのオリゴヌクレオチドを、TALEN結合部位間の間隙内の全ての可能性のある配列に対応するオーバーハングを含有するように合成した。挿入されたオリゴヌクレオチド及び推定上の切断部位の外側領域からプライムする一組のプライマーを使用してPCRを行った。NTF3特異的TALENの8つの異なる対を試験し、対は、A〜Hでラベル表示されている。説明文は、レーンがどのように読み出されるかを実証するゲルの部分を示す。
パネルA〜Dは、TALEN対によって内因性染色体遺伝子座で誘導されたDSB後の、NHEJによって媒介されるその遺伝子座でのオリゴヌクレオチド二本鎖の捕捉を示す。図20Aは、NTF3標的遺伝子座の一部(上の二本鎖、配列番号351)、及びこの研究に使用したオリゴヌクレオチド二本鎖のうちの1つ(下の二本鎖、配列番号352)を示す。NT−L+28及びNT−R+63の結合部位は、上の配列の下線の箇所である。二本鎖(5’CTGG)を最も効率的に捕捉する切断オーバーハングも強調表示されている。図20Bは、NTF3標的遺伝子座の一部(上の二本鎖、配列番号353)、及びこの研究に使用した第2のオリゴヌクレオチド二本鎖(下の配列、配列番号354)を示す。NT−L+28及びNT−R+63の結合部位は、上の配列の下線の箇所である。この第2の二本鎖(5’TGGT)を最も効率的に捕捉する切断オーバーハングも示されている。図20C(配列番号355〜357)は、図20Aに示されるオリゴヌクレオチド二本鎖の存在下でのK562細胞におけるNT−L+28及びNT−R+63の発現後の結果を示す。その後、うまく組み込まれた二本鎖とゲノムDNAとの間の接合部を、二本鎖内でアニールする1つのプライマー及び天然NTF3遺伝子座にアニールする1つのプライマーを用いて増幅した。結果として生じる増幅産物をクローニング及び配列決定した。上の「予想される」配列は、切断された遺伝子座へのオリゴヌクレオチド二本鎖の完全な連結に起因する配列を示す。囲みは、接合配列における二本鎖オーバーハングの位置を強調表示している。下の2つの列は、この研究から得られた接合配列を提供する。示されるように、11個の接合配列が、切断オーバーハングへの二本鎖の完全な連結に起因した一方で、1つの接合配列は、NHEJによる修復前の切除と一致した短い欠失(12bp)を呈した。図20D(配列番号358〜362)は、図20Aに示される二本鎖と比較して、1つの塩基によってシフトする4bpのオーバーハングを有する図20Bに示されるオリゴヌクレオチド二本鎖が使用されたことを除いて、図20Cに示される実験の結果を示す。一番下の4つの列は、この研究から得られた接合配列を提供する。示されるように、4つのはっきりと異なる配列が同定され、それぞれ、NHEJ媒介修復前の切除に一致した短い欠失を呈する。
テンプレートの効率的な増幅を破壊し得るPCR増幅中に天然TALE反復ドメインにおいて形成されることが予測される可能性のある二次DNA構造のうちのいくつかを示す。Mfoldを使用して、TALE反復タンパク質のDNA配列の分析を行った(M.Zuker,Nucleic Acids Res.31(13):3406−15,(2003))。第1の全TALE反復配列をコードする核酸の5’末端で開始する核酸配列の800個の塩基対を分析した。分析した配列は、約7.5個の反復を含有した。分析は、いくつかの非常に安定した二次構造を明らかにした。
34個のアミノ酸反復単位におけるそれぞれの位置で保存アミノ酸を示すキサントモナス細菌由来の1963個のTALE反復のインシリコ分析の図式的結果を示す。文字の寸法は、任意の所与の位置で観察される多様性に反比例しており、より大きな文字は、多様性への耐性の低さを示し、より小さい文字は、所与の位置で観察することができる代替アミノ酸を示す。異なる色の濃さは、異なる化学的分類のアミノ酸を表す。1963個のTALE反復のこの試料において、最も頻度の高いRVDは、28.8%のHD、20.6%のNI、15.1%のNN、13.2%のNG、8.5%のNS、5.5%のHG、及び5.5%のNG*であった(星印は、RVDが、より典型的な34残基の反復の代わりに33残基のTALE反復において観察されたことを示す)。15個の他のRVD配列がこの試料において観察されたが、これらは全て、1%未満の頻度を有した。
選択されたTALE反復モジュールのPCR増幅産物にタンデムに結合し、かつそれらをベクター骨格に連結させて、所望のTALE融合タンパク質を作成するために使用される方法の概略図を示す。特異的プライマーが、実施例11に列記される。組み立てられたTALE融合物がクローニングされるベクター骨格も示される。融合パートナードメインは、TALEN対の一方のメンバーの産生を可能にするFokIヌクレアーゼ触媒ドメインである。
パネルA及びBは、RFLPをコードする異種構造の短いセグメントの内因性CCR5遺伝子座への相同性に基づく導入を駆動するためのTALENの使用を示す。図24Aは、アッセイ概略図を示し、使用したPCRプライマーの位置及びBglI部位を示す。図24Bは、CCR5特異的TALEN対によって導入されたDSBへの46bpのドナー配列の挿入を示すゲルを示す。ドナー配列が特有のBglI制限部位を含有するため、標的部位のPCR増幅時、その後のBglIでのPCR産物の消化時に、TALEN対によって切断され、かつ46bpのドナー配列を挿入した配列は、図に示されるように、2つのBglI切断産物を有する。
パネルA及びBは、標的ギャップ間隔と比較した、TALENの切断有効性を示すグラフである。図25Aは、+28/+28対形成を有するCCR5特異的TALEN対(両方のTALEN上にC+28 Cキャップ)のパネルの活性を示し、図25Bは、+63/+63対形成を含むCCR5特異的TALEN対(両方のTALEN上にC+63 Cキャップ)のパネルの活性を示す。見られるように、+28/+28対の活性は、2つの標的配列間の12又は13bpのギャップ間隔により密に制約される一方で、+63/+63対は、12〜23bpの範囲のギャップ間隔にわたって活性を呈する。
異なる長さのCキャップ配列、又は別の言い方をすると、全TALE反復の配列をヌクレアーゼドメインに結合する異なる配列を有するCCR5特異的TALEN対の内因性活性を示すグラフである。C−2からC+278までのCキャップを産出するために、C末端切断をC末端配列にわたって行った。これらの構築物を、細胞が37℃(薄色の正方形)又は低温ショック条件(30℃、濃色のダイヤモンド)のいずれかでインキュベートされた18bpのギャップ間隔を有する内因性標的に対して、K562細胞におけるTALEN活性について試験した。活性は、全TALE反復の配列をFokI切断ドメインに結合させるために使用した配列の同一性に大いに依存した。我々のCキャップ表記法がC+0を含まないため、C−1 Cキャップ値をX=0としてプロットし、C−2をX=−1としてプロットしたことに留意する。C+5、C+28等をX=5、X=28等としてプロットした。ピーク活性が、C+63 Cキャップ配列について観察された。
RVD分析のために選択された例示的なTALENの特異性を示す。TALENは、11個の塩基標的配列、5’−TTGACAATCCT−3’(配列番号178)に結合するように設計された。5〜7位での標的の同一性が、CAA(設計された標的)、CGA、TCG、又はTTGのいずれかであるように、この標的が6位で変更されるときにELISA分析によって決定されるDNA結合結果が示される。
試験した全てのRVDにおいて測定されたELISA親和性のグラフ表示である。データが、20×20のグリッドに示され、RVDの第1のアミノ酸(12位)がグリッドの左側に垂直に示され、RVDの第2のアミノ酸(13位)がグリッドの上に水平に示される。それぞれのグリッドにおける文字A、C、G、及びTの寸法は、それぞれ、CAA部位、CCA部位、CGA部位、及びCTA部位に対して標準化されたELISAシグナルの平方根に基づいて寸法決定されている。多くのRVDは、自然発生HD、NI、NG、NS、NN、IG、HG、及びNK RVDと比較して、DNA結合特性を改善した。最も頻繁に自然に見出される4つのRVD(HD、NG、NI、及びNN)は、参考のために囲まれている。これらの4つのRVDについて、ELISAによる好ましい塩基は、予想される好ましい塩基に一致した。
C末端半反復がT以外のヌクレオチド塩基との相互作用を許容するためにRVDで変更した、TALENの活性の測定結果を示すゲルである。上述のCel−Iアッセイによって決定されたTALEN活性が示される。矢印は、インデルでのCel−I切断の結果であるバンドを示す。レーン割り当ては、実施例16の表32に列記されるものである。これらの結果は、TALEN C末端半反復を、所望の場合、それぞれのヌクレオチド塩基に結合するよう遺伝子操作することができることを実証する。
完全に非定型のRVD(完全置換)、1つのタイプ若しくは特異性の全ての反復単位(例えば、「T」を特定するRVDを有する全ての反復単位等)が非定型のRVDで置換された反復ドメイン(タイプ置換)、又は配列を有する1つの反復単位のみが非定型のRVDを含む反復単位で置換されたTALEN(単独置換)のいずれかを含むTALE反復単位を有するTALENを使用した、TALEN活性の測定を示すゲルである。37度又は低温ショック条件下(30度)のいずれかで活性アッセイを行い、任意の測定可能なNHEJ活性の定量化がレーン上に示される。
ラット胚のTALEN処理後に生まれたラットの子におけるNHEJ事象の存在を示す一連のゲルである。ゲノムDNAをラットの子から単離し、ヌクレアーゼ標的部位周囲の領域上でPCRを行った。その後、T7エンドヌクレアーゼを使用して、産物を、NHEJによって誘導されたミスマッチについて試験した。矢印は、ミスマッチの存在からもたらされるバンドを示す。試験した66匹のラットの子のうち7匹(11%)が、NHEJ事象に対して陽性であった。
発明の詳細な説明
導入
本出願は、TALE反復ドメインを遺伝子操作して、所望の内因性DNA配列を認識することができること、及び機能ドメインのそのような遺伝子操作されたTALE反復ドメインへの融合を用いて、機能状態、又は遺伝子を含むその天然のクロマチン環境に存在する内因性細胞遺伝子座の実際のゲノムDNA配列を修飾することができることを実証する。したがって、本発明は、遺伝子を含む内因性細胞遺伝子座を高い有効性で特異的に認識するように遺伝子操作されたTALE融合DNA結合タンパク質を提供する。結果として、本発明のTALE融合物を、内在性遺伝子転写の活性化及び抑制の両方を介して、内在性遺伝子発現を制御するために使用することができる。TALE融合物を、他の制御又は機能ドメイン、例えば、ヌクレアーゼ、トランスポザーゼ、又はメチラーゼに結合して、内因性染色体の配列を修飾することもできる。
本明細書に記載の方法及び組成物は、新規のヒト及び哺乳類の治療適用、例えば、遺伝的疾患、癌、真菌、原虫、細菌、及びウイルス感染、虚血、血管疾患、関節炎、免疫学的障害等の治療、並びに機能ゲノムアッセイの提供、並びに研究及び薬物スクリーニングのための遺伝子操作された細胞株の発生、及び耐病性の増加を含むが、それに限定されない、変更された表現型を有する植物を開発するための手段、並びに果実熟成特性、糖及び油組成物、収率、並びに色の変更を可能にする。
本明細書に記載されるように、2つ以上のTALE融合物を、任意の細胞に投与することができ、同一の標的内因性細胞遺伝子又は異なる標的内因性細胞遺伝子のいずれかを認識する。
別の実施形態では、TALE融合タンパク質は、以下に記載される少なくとも1つ以上の制御ドメインに結合される。制御又は機能ドメインの非限定的な例には、KRAB及びVP16等の転写因子抑制因子、又は活性化因子ドメイン、共抑制因子及び共活性化因子ドメイン、DNAメチルトランスフェラーゼ、ヒストンアセチルトランスフェラーゼ、ヒストンデアセチラーゼ、並びにエンドヌクレアーゼFokI由来の切断ドメイン等のDNA切断ドメインが挙げられる。
ゲノム編集(例えば、遺伝子の切断、例えば、外因性配列の切断に続く挿入(物理的挿入若しくは相同指向修復を介しての挿入)及び/又は切断に続くNHEJによる遺伝子の変更;1つ以上の遺伝子の部分的若しくは完全な不活性化;内在性遺伝子の変更された機能状態を有する対立遺伝子の生成;制御要素の挿入等)並びに生殖系列に運び込まれるゲノムの変更に有用なヌクレアーゼドメインに融合した1つ以上のTALE反復単位、Nキャップ、及び任意でCキャップを含む融合タンパク質を含む組成物及び方法も本明細書に記載されている。例えば、標的細胞中の1つ以上の遺伝子を編集(変更)するために、これらの組成物(試薬)を作製及び使用する方法も開示される。したがって、本明細書に記載の方法及び組成物は、1つ以上の遺伝子の標的化された遺伝子変更(例えば、ノックイン)及び/若しくは(部分的又は完全な)ノックアウト、並びに/又は任意の標的対立遺伝子の配列のランダム化変異のための極めて効率的な方法を提供し、したがって、ヒト疾患の動物モデルの生成を可能にする。
ヌクレアーゼドメインを、高度に活性なヌクレアーゼ機能を提供するTALE反復配列に結合させるための組成物(Cキャップ)も本明細書に開示される。いくつかの実施形態において、Cキャップは、天然TALE C末端隣接配列由来のペプチド配列を含む。他の実施形態では、Cキャップは、TALE反復ドメイン由来のペプチド配列を含む。さらに別の実施形態では、Cキャップは、非TALE配列を含む。Cキャップは、天然TALE C末端隣接配列由来のペプチド配列及び/若しくはTALE反復ドメインを含有し、かつ/又はこれらの供給源のうちのいずれも含有しないキメラ構造も呈し得る。
TALENを、目的とするドナーのAAVS1(共同所有の米国特許公開第20080299580号を参照のこと)又はCCR5(共同所有の米国特許公開第20080159996号を参照のこと)等のセーフハーバー遺伝子座への挿入を可能にするように遺伝子操作することもできる。ドナーは、目的とする遺伝子を含み得るか、又はshRNA、RNAi、若しくはmiRNA等の目的とするRNAをコードし得る。
遺伝子操作されたTALE融合タンパク質(例えば、転写活性化因子、転写抑制因子、及びヌクレアーゼ)の発現を、tet−制御系に代表される系及びRU−486系によって制御することもできる(例えば、Gossen & Bujard,Proc Natl Acad Sci 89:5547(1992)、Oligino et al.,Gene Ther.5:491−496(1998)、Wang et al.,Gene Ther.4:432−441(1997)、Neering et al,Blood 88:1147−1155(1996)、及びRendahl et al.,Nat.Biotechnol.16:757−761(1998)を参照のこと)。これらは、小分子にTALE融合活性化因子及び抑制因子の発現における制御を与え、ひいては、小分子に目的とする標的遺伝子(複数を含む)における制御を与える。この有益な特徴を、細胞培養モデル、遺伝子治療、並びにトランスジェニック動物及び植物において用いることができる。
概論
本方法の実践、並びに本明細書に開示の組成物の調製及び使用は、別途示されない限り、当技術分野の技術の範囲内の分子生物学、生化学、クロマチン構造及び分析、計算化学、細胞培養、組換えDNA、並びに関連分野における従来の技法を採用する。これらの技法は、文献において十分に説明されている。例えば、Sambrook et al.MOLECULAR CLONING:A LABORATORY MANUAL,Second edition,Cold Spring Harbor Laboratory Press,1989 and Third edition,2001、Ausubel et al.,CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,John Wiley & Sons,New York,1987及び定期的に更新されたもの、METHODS IN ENZYMOLOGYシリーズ,Academic Press,San Diego、Wolffe,CHROMATIN STRUCTURE AND FUNCTION,Third edition,Academic Press,San Diego,1998、METHODS IN ENZYMOLOGY,Vol.304,“Chromatin”(P.M.Wassarman and A.P.Wolffe,eds.),Academic Press,San Diego,1999、並びにMETHODS IN MOLECULAR BIOLOGY,Vol.119,“Chromatin Protocols”(P.B.Becker,ed.)Humana Press,Totowa,1999を参照されたい。
定義
「核酸」、「ポリヌクレオチド」、及び「オリゴヌクレオチド」という用語は、同義に使用され、線状若しくは環状立体配座、かつ一本鎖形態若しくは二本鎖形態のいずれかのデオキシリボヌクレオチド又はリボヌクレオチドポリマーを指す。本開示の目的において、これらの用語は、ポリマーの長さを限定すると解釈されるべきではない。本用語は、天然ヌクレオチドの既知の類似体、並びに塩基、糖、及び/又はリン酸塩部分(例えば、ホスホロチオエートバックボーン)で修飾されるヌクレオチドを網羅し得る。概して、特定のヌクレオチドの類似体は、同一の塩基対形成特異性を有し、すなわち、Aの類似体は、Tと塩基対を形成する。
「ポリペプチド」、「ペプチド」、及び「タンパク質」という用語は、アミノ酸残基のポリマーを指すよう同義に使用される。本用語は、1つ以上のアミノ酸が、対応する自然発生アミノ酸の化学的類似体又は修飾された誘導体であるアミノ酸ポリマーにも適用する。
「結合」は、巨大分子間(例えば、タンパク質と核酸との間)の配列特異的な非共有相互作用を指す。相互作用が全体として配列特異的である限り、結合相互作用の全ての構成要素が配列特異的である必要はない(例えば、DNAバックボーンにおけるリン酸塩残基との接触)。そのような相互作用は、概して、10-6M以下の解離定数(Kd)を特徴とする。「親和性」は、結合の強さを指し、高い結合親和性は、低いKdと相関している。
「結合タンパク質」は、別の分子に非共有的に結合することができるタンパク質である。結合タンパク質は、例えば、DNA分子(DNA結合タンパク質)、RNA分子(RNA結合タンパク質)、及び/又はタンパク質分子(タンパク質結合タンパク質)に結合することができる。タンパク質結合タンパク質の場合、それは、それ自体に結合することができ(ホモ二量体、ホモ三量体等を形成するために)、かつ/又は異なるタンパク質(単数若しくは複数)の1つ以上の分子に結合することができる。結合タンパク質は、2つ以上の種類の結合活性を有し得る。例えば、亜鉛フィンガータンパク質は、DNA結合、RNA結合、及びタンパク質結合活性を有する。
「TALE反復ドメイン」(「反復配列」でもある)は、TALEのその同族標的DNA配列への結合に関与し、かつ1つ以上のTALE「反復単位」を含む配列である。単一の「反復単位」(「反復」とも称される)は、典型的には、33〜35アミノ酸長であり、自然発生TALEタンパク質内で他のTALE反復配列と少なくともいくらかの配列相同性を呈する。本明細書に記載のTALE反復単位は、概して、(X)1~11−(XRVD2−(X)20~22(配列番号399)の形態であり、XRVD(12位及び13位)は、自然発生TALEタンパク質において超可変性を呈する。12位及び13位のアミノ酸の同一性を変更することによって、反復単位が相互作用するものとのDNAヌクレオチド(又は二本鎖DNAにおける相補的ヌクレオチド対)の同一性の選好を変更することができる。「非定型」RVDは、例えば、5%未満の自然発生TALEタンパク質、好ましくは、2%未満の自然発生TALEタンパク質、及びさらにより好ましくは、1%未満の自然発生TALEタンパク質における、自然にまれに生じるか、又は決して生じないRVD配列(12位及び13位)である。非定型のRVDは、非自然発生であり得る。
「Nキャップ」ポリペプチド及び「N末端配列」という用語は、TALE反復ドメインのN末端部分に隣接するアミノ酸配列(ポリペプチド)を指すために使用される。Nキャップ配列は、TALE反復ドメイン(複数を含む)がDNAに結合するよう機能する限り、任意の長さ(アミノ酸を含まない)であり得る。したがって、Nキャップ配列は、TALE反復ドメインへの適切な構造的安定化の提供、及び/又はDNAとの非特異的接触に関与し得る。Nキャップ配列は、自然発生であり得るか、又は非自然発生であり得、例えば、任意の全長TALEタンパク質のN末端領域に由来し得る。Nキャップ配列は、好ましくは、全長TALEタンパク質において見出されるポリペプチドのフラグメント(切断物)、例えば、TALE反復ドメインのDNA結合機能を支援するか、又はTALE融合タンパク質活性に支援を提供するのに十分な自然発生TALEタンパク質におけるTALE反復ドメインに隣接するN末端領域の任意の切断物である。それぞれのTALE反復単位が典型的なRVDを含み、かつ/又はCキャップがTALEタンパク質の全長自然発生C末端領域を含むとき、Nキャップ配列は、自然発生TALEタンパク質の全長N末端領域を含まない。したがって、上述のように、この配列は、必ずしもDNA認識に関与しないが、内因性標的DNAでの効率的かつ特異的な機能又はTALE融合タンパク質の効率的な活性を強化し得る。TALE反復ドメインのN末端部分に最も近いNキャップ配列の部分は、TALE反復単位に対していくらかの相同性を有し得、「R0反復」と称される。典型的には、標的部位のすぐ5’側の位置の好ましいヌクレオチドは、チミジン(T)である。NキャップのR0反復部分は、TALE反復によって特定される標的配列に隣接するT(又は二本鎖DNAにおいてTに塩基対形成されるA)と相互作用することを好み得る。R0配列の一例が以下に示される:LDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLN(配列番号1)。
「Cキャップ」又は「C末端領域」という用語は、TALE反復ドメインのC末端部分に隣接し得る、任意で存在するアミノ酸配列(ポリペプチド)を指す。Cキャップは、0個の残基を含む末端のC末端TALE反復の任意の部分、TALE反復又は全TALE反復の切断物も含み得る。C末端領域の最初の20個の残基は、典型的には、TALE反復単位の最初の20個の残基と相同であり、TALE反復ドメインによって特定されるDNA配列の3’のヌクレオチドの選好を特定することができるRVD配列を含有し得る。存在するとき、TALE反復の最初の20個の残基と相同のC末端領域のこの部分は、「半反復」とも称される。C末端領域内の残基の番号付けスキームは、この典型的な部分的相同性を反映する。番号付けスキームは、C−20で始まり、C−19、C−18、C−17、C−16、C−15、C−14、C−13、C−12、C−11、C−10、C−9、C−8、C−7、C−6、C−5、C−4、C−3、C−2、C−1に増加し、C+1に増加し、その後、ポリペプチドのC末端に向かってC+2、C+3等に増加する。C+28 Cキャップは、残基C−20から残基C+28(包括的)までの配列を指し、したがって、48個の残基の長さを有する。Cキャップ配列は、自然発生(例えば、自然発生タンパク質のフラグメント)若しくは非自然発生(例えば、1つ以上のアミノ酸欠失、置換、及び/若しくは付加を含む自然発生タンパク質のフラグメント)、又はCキャップの役割を果たす能力を有する任意の他の自然又は非自然配列であり得る。C末端領域は、TALE反復ドメイン(複数を含む)のDNA結合機能に絶対に必要というわけではないが、いくつかの実施形態において、Cキャップは、DNAと相互作用することができ、例えば、TALE反復ドメインのC末端でヌクレアーゼを含む融合タンパク質において、機能ドメインの活性を強化することもできる。
「亜鉛フィンガーDNA結合タンパク質」(又は結合ドメイン)は、亜鉛イオンの配位を介して安定化される構造を有する結合ドメイン内のアミノ酸配列の領域である、1つ以上の亜鉛フィンガーを介して配列特異的様式でDNAに結合するタンパク質、又はより大きいタンパク質内のドメインである。亜鉛フィンガーDNA結合タンパク質という用語は、多くの場合、亜鉛フィンガータンパク質又はZFPと略される。
「選択された」亜鉛フィンガータンパク質又はTALE反復ドメインを含むタンパク質は、その産生が、ファージディスプレイ、相互作用トラップ、又はハイブリッド選択等の経験的プロセスに主に由来するタンパク質である。例えば、米国特許第5,789,538号、米国特許第5,925,523号、米国特許第6,007,988号、米国特許第6,013,453号、米国特許第6,200,759号明細書、国際公開第WO95/19431号、国際公開第WO96/06166号、国際公開第WO98/53057号、国際公開第WO98/54311号、国際公開第WO00/27878号、国際公開第WO01/60970号、国際公開第WO01/88197号、及び国際公開第WO02/099084を参照されたい。
「配列」という用語は、DNA又はRNAであり得、線状、環状、又は分岐であり得、かつ一本鎖又は二本鎖のいずれかであり得る、任意の長さのヌクレオチド配列を指す。「ドナー配列」という用語は、ゲノムに挿入されるヌクレオチド配列を指す。ドナー配列は、任意の長さ、例えば、2〜10,000(又はそれらの間若しくはそれらを超える任意の整数)長のヌクレオチド、好ましくは、約100〜1,000(又はそれらの間の任意の整数)長のヌクレオチド、より好ましくは、約200〜500長のヌクレオチドであり得る。
「相同非同一配列」は、第2の配列とある程度の配列同一性を共有するが、第2の配列の配列とは同一ではない第1の配列を指す。例えば、変異体遺伝子の野生型配列を含むポリヌクレオチドは、変異体遺伝子の配列と相同であり、非同一である。ある特定の実施形態において、2つの配列の間の相同の程度は、通常の細胞機構を利用して、それらの間の相同組換えを許容するのに十分な程度である。2つの相同非同一配列は、任意の長さであってもよく、それらの非相同の程度は、(例えば、標的化された相同組換えによるゲノム点変異の修正のために)単一のヌクレオチドと同程度に小さくてもよく、又は(例えば、染色体における所定の異所的部位での遺伝子の挿入のために)10キロベース以上と同程度に大きくてもよい。相同非同一配列を含む2つのポリヌクレオチドは、同一の長さである必要はない。例えば、20〜10,000個のヌクレオチド又はヌクレオチド対の外因性ポリヌクレオチド(すなわち、ドナーポリヌクレオチド)を使用することができる。
核酸及びアミノ酸配列同一性を決定するための技法は、当技術分野において既知である。典型的には、そのような技法は、遺伝子のmRNAのヌクレオチド配列を決定すること、及び/又はそれによってコードされるアミノ酸配列を決定すること、並びにこれらの配列を第2のヌクレオチド若しくはアミノ酸配列と比較することを含む。ゲノム配列を、この様式で決定及び比較することもできる。概して、同一性は、それぞれ、2つのポリヌクレオチド又はポリペプチド配列の正確なヌクレオチドとヌクレオチド又はアミノ酸とアミノ酸の一致を指す。2つ以上の配列(ポリヌクレオチド又はアミノ酸)を、それらのパーセント同一性を決定することによって比較することができる。2つの配列のパーセント同一性は、核酸又はアミノ酸配列にかかわらず、短い方の配列の長さで割って100を乗じた、2つの整列した配列の間での正確な一致の数である。
あるいは、ポリヌクレオチド間の配列類似性の程度を、相同領域間での安定した二本鎖の形成と、その後の一本鎖特異的ヌクレアーゼ(複数を含む)での消化と、消化されたフラグメントの寸法決定とを許容する条件下における、ポリヌクレオチドのハイブリダイゼーションによって決定することができる。2つの核酸、又は2つのポリペプチド配列は、配列が、上述の方法を使用して決定されるように、分子の定義された長さにわたって、少なくとも約70%〜75%、好ましくは80%〜82%、より好ましくは85%〜90%、さらにより好ましくは92%、さらにより好ましくは95%、及び最も好ましくは98%の配列同一性を呈するとき、相互に実質的に相同である。本明細書で使用されるとき、実質的に相同とは、特定のDNA又はポリペプチド配列に対して完全同一性を示す配列も指す。実質的に相同であるDNA配列を、その特定の系について定義されるように、例えば、ストリンジェントな条件下でのサザンハイブリダイゼーション実験において同定することができる。適切なハイブリダイゼーション条件を定義することは、当技術分野の技術の範囲内である。例えば、上記のSambrook et al.,Nucleic Acid Hybridization:A Practical Approach,editors B.D.Hames and S.J.Higgins,(1985)Oxford;Washington,DC;IRL Press)を参照されたい。
「組換え」は、2つのポリヌクレオチド間の遺伝情報交換のプロセスを指す。本開示の目的において、「相同組換え(HR)」は、例えば、相同指向修復機構を介する細胞内の二本鎖切断の修復中に行われるそのような交換の特殊化形態を指す。このプロセスは、ヌクレオチド配列相同性を必要とし、「ドナー」分子を「標的」分子(すなわち、二本鎖切断を経験する分子)のテンプレート修復に使用し、かつそれがドナーから標的への遺伝情報の導入につながるという理由から「非交差型遺伝子変換」又は「短経路遺伝子変換」として広く既知である。任意の特定の理論によって束縛されることを望むことなく、そのような導入は、切断された標的とドナーとの間に形成されるヘテロ二本鎖DNAのミスマッチ修正、及び/又は標的の一部になる遺伝情報を再合成するためにドナーが使用される「合成依存性鎖アニーリング」、及び/又は関連プロセスを伴い得る。そのような特殊化されたHRは、ドナーポリヌクレオチドの配列の一部又は全てが、標的ポリヌクレオチドに組み込まれるように、多くの場合、標的分子の配列の変更をもたらす。
本開示の方法において、本明細書に記載の1つ以上の標的化されたヌクレアーゼは、所定の部位で、標的配列(例えば、細胞クロマチン)内に二本鎖切断を作成し、切断領域内のヌクレオチド配列に対して相同性を有する「ドナー」ポリヌクレオチドを、細胞に導入することができる。二本鎖切断(DSB)の存在が、ドナー配列の組込みを促進することが示されている。ドナー配列は、物理的に組み込まれ得るか、又はドナーポリヌクレオチドは、相同組換えを介する切断の修復のためのテンプレートとして使用され、ドナーと同様に細胞クロマチンへのヌクレオチド配列の全て若しくは一部の導入をもたらす。したがって、細胞クロマチン内の第1の配列を変更することができ、ある特定の実施形態において、ドナーポリヌクレオチドに存在する配列に変換することができる。したがって、「置換する」又は「置換」という用語の使用は、1つのヌクレオチド配列と別のヌクレオチド配列との置換(すなわち、情報的な意味では、配列の置換)を表すものとして理解することができ、1つのポリヌクレオチドと別のポリヌクレオチドとの物理的又は化学的置換を必ずしも必要としない。いくつかの実施形態において、2つのDSBは、本明細書に記載の標的化されたヌクレアーゼによって導入され、DSB間のDNAの欠失をもたらす。いくつかの実施形態において、「ドナー」ポリヌクレオチドは、これらの2つのDSB間に挿入される。
したがって、ある特定の実施形態において、目的とする領域内の配列と相同のドナー配列の部分は、置換されるゲノム配列に対して、約80〜99%(又はそれらの間の任意の整数)の配列同一性を呈する。他の実施形態では、例えば、100個を超える連続塩基対のうちの1個のヌクレオチドのみがドナー配列とゲノム配列の間で異なる場合、ドナー配列とゲノム配列との間の相同性は、99%より高い。ある特定の場合において、ドナー配列の非相同部分は、新しい配列が目的とする領域に導入されるように、目的とする領域内に存在しない配列を含有し得る。これらの事例において、非相同配列は、概して、目的とする領域内の配列と相同又は同一の50〜1,000個の塩基対(若しくはそれらの間の任意の整数値)又は1,000よりも大きい任意の数の塩基対の配列によって隣接される。他の実施形態では、ドナー配列は、第1の配列と非相同であり、非相同組換え機構によってゲノムに挿入される。
本明細書に記載の方法のうちのいずれかにおいて、ヌクレアーゼドメインに融合したさらなるTALE融合タンパク質、並びにTALE(又は亜鉛フィンガー)ヌクレアーゼのさらなる対を、細胞内のさらなる標的部位のさらなる二本鎖切断のために使用することができる。
本明細書に記載の方法のうちのいずれかを、目的とする遺伝子(複数を含む)の発現を破壊するドナー配列の標的化組込みによる細胞内の1つ以上の標的配列の部分的又は完全な不活性化のために使用することができる。部分的又は完全に不活性化された遺伝子を有する細胞株も提供される。
さらに、1つ以上の外因性配列を組み込むために、本明細書に記載の標的組込みの方法も使用することができる。外因性核酸配列は、例えば、1つ以上の遺伝子若しくはcDNA分子、又は任意の種類のコード配列若しくは非コード配列、並びに1つ以上の制御要素(例えば、プロモーター)を含み得る。加えて、外因性核酸配列は、1つ以上のRNA分子(例えば、ショートヘアピンRNA(shRNA)、阻害性RNA(RNAi)、マイクロRNA(miRNA)等)を生成し得る。
「切断」は、DNA分子の共有結合バックボーン切断を指す。切断を、リン酸ジエステル結合の酵素又は化学的加水分解を含むが、それらに限定されない様々な方法によって開始することができる。一本鎖切断及び二本鎖切断の両方が可能であり、二本鎖切断は、2つのはっきりと異なる一本鎖切断事象の結果として生じ得る。DNA切断は、平滑末端又は付着末端のいずれかの生成をもたらし得る。ある特定の実施形態において、融合ポリペプチドは、標的化された二本鎖DNA切断のために使用される。
「切断半ドメイン」は、第2のポリペプチド(同一のポリペプチド又は異なるポリペプチドのいずれか)とともに、切断活性(好ましくは、二本鎖切断活性)を有する複合体を形成するポリペプチド配列である。「第1及び第2の切断半ドメイン」、「+及び−切断半ドメイン」、並びに「右及び左切断半ドメイン」という用語は、二量体化する切断半ドメインの対を指すために同義に使用される。
「遺伝子操作された切断半ドメイン」は、別の切断半ドメイン(例えば、別の遺伝子操作された切断半ドメイン)で偏性ヘテロ二量体を形成するように修飾された切断半ドメインである。参照によりそれらの全体が本明細書に組み込まれる、米国特許公開第2005/0064474号、同第2007/0218528号、及び同第2008/0131962号も参照されたい。
「クロマチン」は、細胞ゲノムを含む核タンパク質構造である。細胞クロマチンは、核酸、主にDNA、並びにヒストン及び非ヒストン染色体タンパク質を含むタンパク質を含む。真核細胞クロマチンの大部分は、ヌクレオソームの形態で存在し、ヌクレオソームコアは、それぞれ2つのヒストンH2A、H2B、H3、及びH4を含む八量体と会合した約150個の塩基対のDNAを含み、(生物に応じて変化する長さの)リンカーDNAは、ヌクレオソームコアの間に延在する。ヒストンH1の分子は、概して、リンカーDNAと会合している。本開示の目的において、「クロマチン」という用語は、原核性及び真核性の両方の全ての種類の細胞核タンパク質を網羅するよう意図されている。細胞クロマチンは、染色体及びエピソームクロマチンの両方を含む。
「染色体」は、細胞のゲノムの全て又は一部を含むクロマチン複合体である。細胞のゲノムは、多くの場合、細胞のゲノムを含む全ての染色体の集合であるその核型を特徴とする。細胞のゲノムは、1つ以上の染色体を含み得る。
「エピソーム」は、複製核酸、核タンパク質複合体、又は細胞の染色体核型の一部ではない核酸を含む他の構造である。
エピソームの例には、プラスミド及びある特定のウイルスゲノムが挙げられる。
「標的部位」又は「標的配列」は、結合するのに十分な条件が存在する場合、結合分子が結合する核酸の一部を定義する核酸配列である。例えば、配列5’−GAATTC−3’は、Eco RI制限エンドヌクレアーゼの標的部位である。
「植物」細胞は、単子葉(単子葉植物)又は双子葉(双子葉植物)植物の細胞を含むが、それらに限定されない。単子葉植物の非限定的な例には、トウモロコシ、コメ、大麦、オート麦、小麦、ソルガム、ライ麦、サトウキビ、パイナップル、タマネギ、バナナ、及びココナツ等の穀物用植物が挙げられる。双子葉植物の非限定的な例には、タバコ、トマト、ヒマワリ、綿、テンサイ、ジャガイモ、レタス、メロン、大豆、キャノーラ(菜種)、及びムラサキウマゴヤシが挙げられる。植物細胞は、植物の任意の部分及び/又は植物発育の任意の段階由来である。
「外因性」分子は、通常細胞中に存在しないが、1つ以上の遺伝子方法、生化学的方法、又は他の方法によって細胞に導入することができる分子である。「細胞中に普通に存在する」かは、細胞の特定の発育段階及び環境条件に関して決定される。したがって、例えば、筋肉の胚発育中にのみ存在する分子は、成人筋肉細胞に対して外因性の分子である。同様に、熱ショックによって誘導される分子は、熱ショックを受けていない細胞に対して外因性の分子である。外因性分子は、例えば、機能不全の内因性分子の機能バージョン又は通常に機能する内因性分子の機能不全バージョンを含み得る。外因性分子はまた、通常別の種、例えば、動物のゲノムに導入されるヒト配列において見出される分子であり得る。
外因性分子は、とりわけ、コンビナトリアルケミストリープロセスによって生成される分子等の小分子であり得るか、又はタンパク質、核酸、炭水化物、脂質、糖タンパク質、リポタンパク質、多糖類、上述の分子の任意の修飾された誘導体、若しくは上述の分子のうちの1つ以上を含む任意の複合体等の巨大分子であり得る。核酸は、DNA及びRNAを含み、一本鎖又は二本鎖であり得、線状、分岐、又は環状であり得、かつ任意の長さであり得る。核酸は、二本鎖を形成することができる核酸、並びに三本鎖形成核酸を含む。例えば、米国特許第5,176,996号及び同第5,422,251号を参照されたい。タンパク質は、DNA結合タンパク質、転写因子、クロマチンリモデリング因子、メチル化DNA結合タンパク質、ポリメラーゼ、メチラーゼ、デメチラーゼ、アセチラーゼ、デアセチラーゼ、キナーゼ、ホスファターゼ、インテグラーゼ、リコンビナーゼ、リガーゼ、トポイソメラーゼ、ジャイレース、及びヘリカーゼを含むが、それらに限定されない。
外因性分子は、内因性分子と同一の種類の分子、例えば、外因性タンパク質又は核酸であり得る。例えば、外因性核酸は、細胞に導入される感染ウイルスゲノム、プラスミド、若しくはエピソーム、又は細胞中に通常存在しない染色体を含み得る。細胞中に外因性分子を導入するための方法が当業者に既知であり、脂質媒介導入(すなわち、中性及びカチオン性脂質を含むリポソーム)、電気穿孔、直接注入、細胞融合、粒子銃、リン酸カルシウム共沈、DEAE−デキストラン媒介導入、及びウイルスベクター媒介導入を含むが、これらに限定されない。
対称的に、「内因性」分子は、特定の環境条件下において特定の発育段階の特定の細胞内に通常存在する分子である。例えば、内因性核酸は、染色体、ミトコンドリアのゲノム、葉緑体のゲノム、若しくは他の小器官のゲノム、又は自然発生エピソーム核酸を含み得る。さらなる内在性分子は、タンパク質、例えば、転写因子及び酵素を含み得る。
「融合」分子は、2つ以上のサブユニット分子が、好ましくは共有結合的に結合される分子である。サブユニット分子は、分子の同一の化学的種類であり得るか、又は分子の異なる化学的種類であり得る。第1の種類の融合分子の例には、融合タンパク質(例えば、TALE反復ドメインと切断ドメインとの間の融合物)、及び融合核酸(例えば、上述の融合タンパク質をコードする核酸)が挙げられるが、それらに限定されない。第2の種類の融合分子の例には、三本鎖形成核酸とポリペプチドとの間の融合物、及び副溝結合剤と核酸との間の融合物が挙げられるが、これらに限定されない。
細胞における融合タンパク質の発現は、細胞への融合タンパク質の送達、又は細胞への融合タンパク質をコードするポリヌクレオチドの送達に起因し得、ポリヌクレオチドが転写され、転写物が翻訳されて、融合タンパク質を生成する。トランススプライシング、ポリペプチド切断、及びポリペプチド連結も、細胞におけるタンパク質の発現に関与し得る。細胞へのポリヌクレオチド及びポリペプチドの送達の方法が本開示の他の箇所で提示されている。
本開示の目的において、「遺伝子」は、遺伝子産物(以下を参照のこと)をコードするDNA領域、並びに遺伝子産物の産生を制御する全てのDNA領域(そのような制御配列がコード配列及び/又は転写配列に隣接するか否かにかかわらず)を含む。したがって、遺伝子は、プロモーター配列、ターミネータ、リポソーム結合部位及び内部リポソーム進入部位等の翻訳制御配列、エンハンサー、サイレンサー、インスレーター、境界要素、複製起点、マトリックス付着部位、並びに遺伝子座制御領域を含むが、これらに限定されない。
「遺伝子発現」は、遺伝子に含有される情報の遺伝子産物への変換を指す。遺伝子産物は、遺伝子の直接転写産物(例えば、mRNA、tRNA、rRNA、アンチセンスRNA、リボザイム、構造的RNA、shRNA、RNAi、miRNA、若しくは任意の他の種類のRNA)、又はmRNAの翻訳によって産生されるタンパク質であり得る。遺伝子産物は、キャッピング、ポリアデニル化、メチル化、及び編集等のプロセスによって修飾されるRNA、並びに例えば、メチル化、アセチル化、リン酸化、ユビキチン化、ADPリボシル化、ミリスチリル化、及びグリコシル化によって修飾されるタンパク質も含む。
「ギャップ寸法」は、核酸標的上の2つのTALE標的部位の間のヌクレオチドを指す。ギャップは、1〜100個の塩基対又は5〜30個の塩基対、好ましくは、10〜25個の塩基対、及びより好ましくは、12〜21個の塩基対を含むが、それらに限定されない、任意の寸法であり得る。したがって、好ましいギャップ寸法は、12、13、14、15、16、17、18、19、20、又は21個の塩基対であり得る。
遺伝子発現の「調節」は、遺伝子の活性の変化を指す。発現の調節は、遺伝子活性化及び遺伝子抑制を含み得るが、それらに限定されない。ゲノム編集(例えば、切断、変更、不活性化、ドナー組込み、ランダム変異)を用いて、発現を調節することができる。遺伝子不活性化は、本明細書に記載の修飾因子を含まない細胞と比較した、遺伝子発現の任意の減少を指す。したがって、遺伝子不活性化は、部分的又は全体的であり得る。
「目的とする領域」は、例えば、遺伝子、又は遺伝子内若しくは遺伝子に隣接する非コード配列等の細胞クロマチンの任意の領域であり、その中で、外因性分子に結合することが所望される。結合は、標的化されたDNA切断及び/又は標的化組換えのためであり得る。目的とする領域は、例えば、染色体、エピソーム、小器官ゲノム(例えば、ミトコンドリア、葉緑体)、又は感染ウイルスゲノムに存在し得る。目的とする領域は、遺伝子のコード領域内、例えば、リーダー配列、トレーラー配列、若しくはイントロン等の転写非コード領域内、又はコード領域の上流又は下流のいずれかの非転写領域内であり得る。目的とする領域は、最小で単一のヌクレオチド対長、若しくは最大2,000のヌクレオチド対長、又は任意の整数値のヌクレオチド対であり得る。
「動作可能結合」及び「動作可能に(operatively)結合される」(又は「動作可能に(operably)結合される」)という用語は、2つ以上の構成要素(配列要素等)の並置に関連して同義に使用され、両方の構成要素が正常に機能し、かつ構成要素のうちの少なくとも1つが他の構成要素のうちの少なくとも1つにおいて発揮される機能を媒介し得る可能性を許容するように構成要素が配列される。例として、プロモーター等の転写制御配列は、転写制御配列が、1つ以上の転写制御因子の存在又は不在に応じてコード配列の転写レベルを制御するときに、コード配列に動作可能に結合される。転写制御配列は、概して、シスでコード配列と動作可能に結合されるが、それに直接隣接する必要はない。例えば、エンハンサーは、それらが隣接していない場合でも、コード配列に動作可能に結合される転写制御配列である。
融合ポリペプチドに関して、「動作可能に結合される」という用語は、構成要素のそれぞれが、動作可能に結合されない場合に実行するであろう機能と同一の機能を他の構成要素への結合において実行するという事実を指し得る。例えば、TALE反復ドメインが切断ドメインに融合する融合ポリペプチドに関して、TALE反復ドメイン及び切断ドメインは、融合ポリペプチドにおいて、TALE反復ドメイン部分が、その標的部位及び/又はその結合部位に結合することができる一方で、切断ドメインが、標的部位の近くでDNAを切断することができる場合、動作可能結合状態にある。
タンパク質、ポリペプチド、若しくは核酸の「機能フラグメント」は、その配列が、全長タンパク質、ポリペプチド、若しくは核酸と同一ではないが、全長タンパク質、ポリペプチド、若しくは核酸と同一の機能を保持するか、又は全長タンパク質、ポリペプチド、若しくは核酸と比較して、強化された機能を有する、タンパク質、ポリペプチド、若しくは核酸である。さらに、機能フラグメントは、全長タンパク質、ポリペプチド、若しくは核酸よりも少ない機能を有し得るが、依然としてユーザによって定義される十分な機能を有する。機能フラグメントは、対応する天然の分子よりも多い残基、少ない残基、若しくは対応する天然の分子と同一の数の残基を有し得、かつ/又は1つ以上のアミノ酸若しくはヌクレオチド置換を含有し得る。核酸の機能(例えば、コーディング機能、別の核酸にハイブリダイズする能力)を決定するための方法は、当技術分野において周知である。同様に、タンパク質の機能を決定するための方法が周知である。例えば、ポリペプチドのDNA結合機能を、例えば、フィルタ結合、電気泳動移動度シフト、又は免疫沈降アッセイによって決定することができる。DNA切断を、ゲル電気泳動によってアッセイすることができる。上記のAusubel et al.を参照されたい。別のタンパク質と相互作用するタンパク質の能力を、例えば、免疫共沈降、2ハイブリッドアッセイ、又は相補(遺伝的及び生化学的の両方)によって決定することができる。例えば、Fields et al.(1989)Nature 340:245−246、米国特許第5,585,245号及びPCT WO98/44350号を参照されたい。
TALE反復ドメインを、例えば、超可変ジ残基領域、例えば、TALEタンパク質内の反復単位の12位及び/又は13位の遺伝子操作(1つ以上のアミノ酸の変更)を介して、所定のヌクレオチド配列に結合するために「遺伝子操作する」ことができる。いくつかの実施形態において、4、11、及び32位のアミノ酸を遺伝子操作することができる。他の実施形態では、非定型のRVDを、遺伝子操作されたTALEタンパク質で使用するために選択することができ、より広範囲の非天然標的部位の特定を可能にする。例えば、NK RVDを、標的配列におけるGヌクレオチドの認識に使用するために選択することができる。他の実施形態では、反復単位のアミノ酸を変更して、反復単位の特性(すなわち、安定性又は二次的構造)を変化させることができる。したがって、遺伝子操作されたTALEタンパク質は、非自然発生のタンパク質である。いくつかの実施形態において、TALE反復ドメインをコードする遺伝子は、TALE反復アミノ酸を特定するコドンは変更されるが、特定されたアミノ酸は変更されないように(例えば、コドン最適化の既知の技法を介して)、DNAレベルで遺伝子操作される。遺伝子操作されたTALEタンパク質の非限定的な例としては、設計及び/又は選択によって得られるものである。設計されたTALEタンパク質は、その設計/組成が主に合理的基準に由来する、自然に生じないタンパク質である。設計についての合理的基準には、置換ルール、並びに既存のTALE設計及び結合データの情報を格納するデータベース内の情報を処理するためのコンピュータアルゴリズムの適用が含まれる。「選択された」TALE反復ドメインは、その産生が、主に、ファージディスプレイ、相互作用トラップ、又はハイブリッド選択等の経験的プロセスに由来する、非自然発生又は非定型のドメインである。
「多量体化ドメイン」は、TALE融合タンパク質のアミノ末端領域、カルボキシ末端領域、又はアミノ及びカルボキシ末端領域で組み込まれるドメインである。それらのドメインは、複数のTALE融合タンパク質単位の多量体化を可能にする。多量体化ドメインの例には、ロイシンジッパーが挙げられる。多量体化ドメインを小分子によって制御することもでき、多量体化ドメインは、小分子又は外部リガンドの存在下においてのみ別の多量体化ドメインとの相互作用を可能にするために適切な立体配座を想定する。このようにして、外因性リガンドを用いて、それらのドメインの活性を制御することができる。
上述の方法において有用な標的部位は、他の基準による評価の影響下にあり得るか、又はそのような部位に特異的なTALE融合タンパク質の設計若しくは選択(必要に応じて)及び産生のために直接使用され得る。潜在的な標的部位を評価するためのさらなる基準は、遺伝子内の特定の領域へのそれらの近接性である。制御配列等の標的遺伝子を有する実証可能な生物学的有意性のあるセグメントを必ずしも含まないか、又は重複しない標的部位を選択することができる。標的セグメントをさらに評価するための他の基準は、そのようなセグメント若しくは関連セグメントに結合するTALE融合タンパク質の先行する可用性、及び/又は所定の標的セグメントに結合するように新しいTALE融合タンパク質を設計する容易性を含む。
標的セグメントが選択された後、セグメントに結合するTALE融合タンパク質は、様々なアプローチによって提供され得る。いったんTALE融合タンパク質が、選択、設計、又はさもなければ所定の標的セグメントに提供されると、TALE融合タンパク質又はそれをコードするDNAが合成される。TALE反復ドメインを含有するタンパク質をコードするDNAを合成及び発現する例示的な方法が、以下に記載される。その後、TALE融合タンパク質又はそれをコードするポリヌクレオチドを、TALE融合タンパク質が結合する標的部位を含有する標的遺伝子の発現の調節又は分析のために使用することができる。
TALE DNA結合ドメイン
本明細書に記載のポリペプチドは、1つ以上(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個以上)のTALE反復単位を含む。複数のTALE反復単位を含むTALE DNA結合ドメインが、特異性に関与する配列を決定するために研究されている。1つの生物内で、TALE反復は、典型的には、高度に保存される(RVDを除く)が、異なる種にわたってはよく保存されない場合もある。
本明細書に記載のポリペプチドにおいて見出されるTALE反復単位は、概して、X1−X2−X3−X4−X5−X6−X7−X8−X9−X10−X11−(XRVD2−(X)20~22(配列番号399)の形態であり、Xは、任意のアミノ酸であり、XRVD(12位及び13位)は、DNA結合に関与している。そのようなドメインの非限定的な例示的な実施形態には、X1がロイシン(L)又はメチオニン(M)残基を含む実施形態、X10がアラニン(A)残基又はバリン(V)残基を含む実施形態、(X)20~22が配列(Gly又はSer)−(X)19~21(配列番号400)を含む実施形態、(X)20~22が配列(X)3~4−(Ala又はThr)−(X)16~17(配列番号401)を含む実施形態、(X)20~22が配列(X)4~5−(Leu又はVal)−(X)15~16(配列番号402)を含む実施形態、及び上述の実施形態のうちのいずれかの組み合わせ(例えば、X1がロイシン(L)又はメチオニン(M)残基を含み、X10がアラニン(A)残基を含み、X1がL又はMを含み、(X)20~22が配列Gly/Ser−(X)19~21を含み、(X)20~22が配列Gly/Ser−(X)2~3−Ala/Thr−(X)16~17を含み、X10がアラニン(A)又はバリン(V)残基を含み、かつ(X)20~22が配列Gly/Ser−(X)19~21を含む等)が含まれる。
本明細書に記載の組成物のTALE反復単位及び本明細書に記載の方法は、任意の好適なTALEタンパク質に由来し得る。TALEタンパク質の非限定的な例には、ラルストニア種又はキサントモナス種に由来するTALEタンパク質が挙げられる。したがって、いくつかの実施形態において、DNA結合ドメインは、植物病原菌キサントモナスに由来する1つ以上の自然発生及び/又は遺伝子操作されたTALE反復単位を含む(Boch et al,(2009)Science 326:1509−1512、及びMoscou and Bogdanove,(2009)Science 326:1501を参照のこと)。他の実施形態では、DNA結合ドメインは、植物病原菌ラルストニア・ソラナセラムに由来する1つ以上の自然発生及び/又は遺伝子操作されたTALE反復単位、又はTALEタンパク質ファミリー由来の他のTALE DNA結合ドメインを含む。本明細書に記載のTALE DNA結合ドメイン(少なくとも1つのTALE反復単位を含む)は、(i)自然に見出されない1つ以上のTALE反復単位、(ii)1つ以上の自然発生TALE反復単位、(iii)非定型のRVDを有する1つ以上のTALE反復単位、並びに(i)、(ii)、及び/又は(iii)の組み合わせを含み得る。いくつかの実施形態において、本発明のTALE DNA結合ドメインは、完全に非自然発生又は非定型の反復単位からなる。さらに、2つ以上のTALE反復単位を含む本明細書に記載のポリペプチドにおいて、(自然発生又は遺伝子操作された)TALE反復単位は、同一の種に由来し得るか、又はあるいは、異なる種に由来し得る。
表1は、2つのTALEタンパク質内の例示的な反復単位のアライメントを示す。それぞれのTALE反復が、別々のライン上に示され、列は、反復の種類、その反復の開始位置、反復の名称、超可変位置における残基、及び全体の反復配列を示す。
Figure 2013529083
AAB00675.1(13.5個のTALE反復)、AAB69865.1(13.5個の反復)、AAC43587.1(17.5個の反復)、AAD01494.1(12.5個の反復)、AAF98343.1(25.5個の反復)、AAG02079.2(25.5個の反復)、AAN01357.1(8.5個の反復)、AAO72098(17.5個の反復)、AAQ79773.2(5.5個の反復)、AAS46027.1(28.5個の反復)、AAS58127.2(13.5個の反復)、AAS58128.2(17.5個の反復)、AAS58129.3(18.5個の反復)、AAS58130.3(9.5個の反復)、AAT46123.1(22.5個の反復)、AAT46124.1(26.5個の反復)、AAW59491.1(5.5個の反復)、AAW59492.1(16.5個の反復)、AAW59493.1(19.5個の反復)、AAW77510.1(5.5個の反復)、AAY43358(21.5個の反復)、AAY43359.1(11.5個の反復)、AAY43360.1(14.5個の反復)、AAY54166.1(19.5個の反復)、AAY54168.1(16.5個の反復)、AAY54169.1(12.5個の反復)、AAY54170.1(23.5個の反復)、ABB70129.1(21.5個の反復)、ABB70183.1(22.5個の反復)、ABO77779.1(17.5個の反復)等を含む、いくつかのTALE DNA結合タンパク質が同定されており、標準のGenBank検索において見出すことができる。
TALE型のタンパク質も細菌ラルストニア・ソラナセラムにおいて見出されており、表2は、これらのDNA結合ドメインの2つの例の類似の比較を列記する。
Figure 2013529083
ラルストニア由来のTALE型のタンパク質のさらなる例には、ABO27069.1(10.5個の反復)、ABO27070.1(11.5個の反復)、ABO27071.1(7.5個の反復)、ABO27072.1(3.5個の反復)等が挙げられる。
本明細書に記載のTALE反復ドメインを含むDNA結合ポリペプチドは、さらなるTALEポリペプチド配列、例えば、N末端(Nキャップ)配列、及び任意で反復ドメインに隣接するC末端(Cキャップ)配列も含み得る。Nキャップ配列は、DNA結合ポリペプチド及びこれらのTALE反復ドメインを含有するDNA結合ポリペプチドを含む融合タンパク質の機能(例えば、DNA結合、切断、活性化等)を支援するのに十分な任意の長さの自然又は非自然発生配列であり得る。ある特定の実施形態において、タンパク質は、反復ドメインのTALEタンパク質N末端の領域のフラグメント(切断物)を含むNキャップ配列(例えば、反復ドメインのTALEポリペプチドのN末端の少なくとも130〜140個の残基(例えば、131、132、133、134、135、136、137、138、139、又は140個の残基)を含むNキャップ配列)を含む。他の実施形態では、本明細書に記載のTALE反復ドメインポリペプチドにおいて、タンパク質は、反復ドメインのTALEタンパク質C末端のフラグメント(切断された)領域を含むCキャップ配列(例えば、C−20〜C+28、C−20〜C+55、又はC−20〜C+63を含むCキャップ配列)を含む。ある特定の実施形態において、Cキャップ配列は、半反復(C−20〜C−1)を含む。本明細書に記載のTALE DNA結合ポリペプチドは、Nキャップ配列、Cキャップ配列、又はNキャップ配列及びCキャップ配列の両方を含む。
表1及び表2に示されるTALE反復の完全なタンパク質配列(TALE反復ドメイン、並びにN末端及びC末端配列を含む)が、以下の表3に示される。表1及び表2のTALE反復配列は、太字で示される。
Figure 2013529083
天然又は遺伝子操作されたTALE反復単位を使用して、新規の配列に結合する人工TALEタンパク質及びTALE融合タンパク質を産生することができる(同書のBoch et al、及びMorbitzer et al,(2010)Proc.Natl.Acad.Sci.USA 107(50):21617−21622を参照のこと)。例えば、国際公開第WO2010/079430号も参照されたい。この新規の標的配列を植物細胞中のレポーター遺伝子の上流に挿入したとき、研究者は、レポーター遺伝子の活性化を実証することができた。FokI切断ドメインを含む人工TALE融合物は、生細胞内のDNAを切断することもできる(同書のChristin et al、同書のLi et al(2011a)及び(2011b)、Cernak et al(2011)Nucl.Acid.Res.epub doi:10.1093/nar/gcr218を参照のこと)。
遺伝子操作されたTALEタンパク質及びTALE融合タンパク質は、自然発生TALEタンパク質と比較して、新規の結合特異性を有し得る。遺伝子操作方法は、合理的設計及び種々の種類の選択を含むが、それらに限定されない。合理的設計は、例えば、単一又は複数のTALE反復のためのモジュールのヌクレオチド配列を含むデータベースの使用を含む。ファージディスプレイ及び2ハイブリッド系を含む例示的な選択方法は、米国特許第5,789,538号、同第5,925,523号、同第6,007,988号、同第6,013,453号、同第6,410,248号、同第6,140,466号、同第6,200,759号、及び同第6,242,568号、並びに国際公開第WO98/37186号、同第WO98/53057号、同第WO00/27878号、同第WO01/88197号、及び英国特許第2,338,237号に開示されている。自然発生TALEタンパク質において、可能性のあるジペプチドモチーフの限定されたレパートリーのみが、典型的に採用される。したがって、本明細書に記載されるように、全ての可能性のあるモノ及びジペプチド配列を含有するTALE関連ドメインが構築され、候補TALEタンパク質に組み立てられている。したがって、ある特定の実施形態において、DNA結合タンパク質の1つ以上のTALE反復単位は、非定型のRVDを含む。
さらに、同一の種の自然発生TALEタンパク質において、反復単位は、多くの場合、フレームワーク配列内で可変性をほとんど示さない(すなわち、残基(複数を含む)は、直接DNA接触に関与しない(RVD残基ではない))。この可変性の欠如は、個々のTALE反復単位間の進化的関係、及び隣接反復間でのタンパク質折り畳みの要件を含む、いくつかの要因に起因し得る。しかしながら、異なる植物病原性細菌種間において、フレームワーク配列は異なり得る。例えば、トウガラシ斑点細菌病(Xanthomonas campestris pv.Vesicatoria)におけるTALE反復配列において、タンパク質AvrBs3は、ラルストニア・ソラナセラム由来のbrg11及びhpx17反復単位と40%未満の相同性を有する(Heuer et al(2007)Appl Environ Micro 73(13):4379−4384を参照のこと)。TALE反復は、それぞれの細菌の天然環境におけるストリンジェントな機能選択下にあり、例えば、TALEが制御する宿主植物中の遺伝子の配列由来であり得る。したがって、本明細書に記載されるように、TALEフレームワーク内の変異体(例えば、Nキャップ及びCキャップ配列等の反復単位の外側のTALE反復単位又は配列内)を、当技術分野において既知の種々の方法によって、標的化又はランダム変異誘発により導入することができ、結果として得られるTALE融合タンパク質を、最適な活性についてスクリーニングすることができる。
多TALE反復モジュールはまた、上述のDNA結合ドメインの組み立て(少なくとも1つのTALE反復単位を含む)のみならず、小さいTALE多量体(すなわち、三量体、四量体、五量体等)の組み立てにも有用であり得、小さいTALE DNA結合ドメイン間でキャッピング領域としても機能するスパニングリンカーは、塩基のスキッピングを可能にし、より高いDNA結合特異性をもたらし得る。結合された小さいTALE DNA結合ドメインの使用は、個々のTALE反復のレベルで厳密な機能モジュール性の要件を緩和し、より複雑かつ/又は特定のDNA認識スキームの開発を可能にし、所与のモジュール内の隣接モチーフ由来のアミノ酸は、所望のDNA標的配列の共同認識のために相互に自由に相互作用し得る。小さいTALE DNA結合ドメインを、ランダム化ジペプチドモチーフ(又は任意の他の同定された重要な位置)を有する好適な選択系(すなわち、ファージディスプレイ)を用いて結合及び発現することができ、それらの核酸結合特性に基づいて選択することができる。あるいは、任意の特定の所望のTALE融合タンパク質の迅速な構築を可能にするために、多TALE反復モジュールを使用して、反復モジュールのアーカイブを作成することができる。
融合タンパク質(及び融合タンパク質をコードするポリヌクレオチド)の設計及び構築のための標的部位の選択及び方法は、当業者に既知であり、参照によりそれらの全体が本明細書に組み込まれる、米国特許出願公開第20050064474号及び同第20060188987号に詳細に記載されている。
亜鉛フィンガーDNA結合ドメインに対するTALE DNA結合ドメインを結合する人工融合タンパク質を産生することもできる。これらの融合物を、所望の機能ドメインにさらに結合することもできる。
加えて、これら及び他の参考文献に開示されるように、キャッピング配列(Nキャップ及びCキャップ配列)として機能することができる配列が、TALE反復ドメインとリンカーとの間の界面で必要とされるが、TALE DNA結合ドメイン及び/又は亜鉛フィンガードメインを、例えば、5以上のアミノ酸長のリンカー(例えば、TGEKP(配列番号48)、TGGQRP(配列番号49)、TGQKP(配列番号50)、及び/又はTGSQKP(配列番号51))を含む、任意の好適なリンカー配列を使用して、ともに結合することができる。したがって、リンカーが使用されるとき、TALE DNA結合ドメインを所望の融合パートナードメインに結合させるために、5つ以上のアミノ酸のリンカーを、キャップ配列とともに使用することができる。6以上のアミノ酸長の例示的なリンカー配列については、米国特許第6,479,626号、同第6,903,185号、及び同第7,153,949号も参照されたい。加えて、TALE反復ドメインと融合した機能タンパク質ドメインとの間のリンカーを、最も効率的なゲノム修飾を可能にするために、柔軟であるか、又は位置的に制約されるかのいずれかになるよう構築することができる。異なる長さのリンカー及び組成物を試験することができる。
融合タンパク質
本明細書に記載のDNA結合タンパク質を含む融合タンパク質(例えば、TALE融合タンパク質)及び異種制御若しくは機能ドメイン(又はその機能フラグメント)も提供される。一般的なドメインには、例えば、転写因子ドメイン(活性化因子、抑制因子、共活性化因子、共抑制因子)、ヌクレアーゼドメイン、サイレンサードメイン、癌遺伝子ドメイン(例えば、myc、jun、fos、myb、max、mad、rel、ets、bcl、myb、mosファミリーメンバー等);DNA修復酵素並びにそれらの関連因子及び修飾因子;DNA転位酵素並びにそれらの関連因子及び修飾因子;クロマチン関連タンパク質並びにそれらの修飾因子(例えば、キナーゼ、アセチラーゼ、及びデアセチラーゼ);並びにDNA修飾酵素(例えば、メチルトランスフェラーゼ、トポイソメラーゼ、ヘリカーゼ、リガーゼ、キナーゼ、ホスファターゼ、ポリメラーゼ、エンドヌクレアーゼ)、DNA標的酵素、例えば、トランスポゾン、インテグラーゼ、リコンビナーゼ、及びリゾルバーゼ、並びにそれらの関連因子及び修飾因子、核ホルモン受容体、ヌクレアーゼ(切断ドメイン又は半ドメイン)、及びリガンド結合ドメインが含まれる。他の融合タンパク質は、レポーター又は選択マーカーを含み得る。レポータードメインの例には、GFP、GUS等が挙げられる。植物細胞において特定の有用性を有するレポーターは、GUSを含む。
活性化の達成に好適なドメインには、HSV VP16活性化ドメイン(例えば、Hagmann et al.,J.Virol.71、5952−5962(1997)を参照のこと)、核ホルモン受容体(例えば、Torchia et al.,Curr.Opin.Cell Biol.10:373−383(1998)を参照のこと)、核因子カッパBのp65サブユニット(Bitko & Barik,J.Virol.72:5610−5618(1998)及びDoyle & Hunt,Neuroreport 8:2937−2942(1997))、Liu et al.,Cancer Gene Ther.5:3−28(1998))、又はVP64等の人工キメラ機能ドメイン(Beerli et al.,(1998)Proc.Natl.Acad.Sci.USA 95:14623−33)、及びデグロン(Molinari et al.,(1999)EMBO J.18,6439−6447)が含まれる。さらなる例示的な活性化ドメインには、Oct−1、Oct−2A、Sp1、AP−2、及びCTF1(Seipel et al.,EMBO J.11,4961−4968(1992)、並びにp300、CBP、PCAF、SRC1 PvALF、AtHD2A、及びERF−2が含まれる。例えば、Robyr et al.(2000)Mol.Endocrinol.14:329−347、Collingwood et al.(1999)J.Mol.Endocrinol.23:255−275、Leo et al.(2000)Gene 245:1−11、Manteuffel−Cymborowska(1999)Acta Biochim.Pol.46:77−89、McKenna et al.(1999)J.Steroid Biochem.Mol.Biol.69:3−12、Malik et al.(2000)Trends Biochem.Sci.25:277−283、及びLemon et al.(1999)Curr.Opin.Genet.Dev.9:499−504を参照されたい。さらなる例示的な活性化ドメインには、OsGAI、HALF−1、C1、AP1、ARF−5、−6、−7、及び−8、CPRF1、CPRF4、MYC−RP/GP、並びにTRAB1が含まれるが、それらに限定されない。例えば、Ogawa et al.(2000)Gene 245:21−29、Okanami et al.(1996)Genes Cells 1:87−99、Goff et al.(1991)Genes Dev.5:298−309、Cho et al.(1999)Plant Mol.Biol.40:419−429、Ulmason et al.(1999)Proc.Natl.Acad.Sci.USA 96:5844−5849、Sprenger−Haussels et al.(2000)Plant J.22:1−8、Gong et al.(1999)Plant Mol.Biol.41:33−44、及びHobo et al.(1999)Proc.Natl.Acad.Sci.USA 96:15,348−15,353を参照されたい。
本明細書に記載のDNA結合ドメインと機能ドメインとの間の融合タンパク質(又は融合タンパク質をコードする核酸)の形成において、活性化ドメイン又は活性化ドメインと相互作用する分子のいずれかが機能ドメインとして好適であることは、当業者には明らかである。本質的には、活性化複合体を補充することができ、かつ/又は標的遺伝子に対する活性(例えば、ヒストンアセチル化等)を活性化することができる任意の分子が、融合タンパク質の活性化ドメインとして有用である。融合分子において機能ドメインとしての使用に好適なISWI含有ドメイン及び/又はメチル結合ドメインタンパク質等の絶縁体ドメイン、局在化ドメイン、並びにクロマチンリモデリングタンパク質が、例えば、共同所有の米国特許出願第2002/0115215号及び同第2003/0082552号並びに共同所有の国際公開第WO02/44376号に記載されている。
例示的な抑制ドメインは、KRAB A/B、KOX、TGFベータ誘導性初期遺伝子(TIEG)、v−erbA、SID、MBD2、MBD3、DNMTファミリーのメンバー(例えば、DNMT1、DNMT3A、DNMT3B)、Rb、及びMeCP2を含むが、それらに限定されない。例えば、Bird et al.(1999)Cell 99:451−454、Tyler et al.(1999)Cell 99:443−446、Knoepfler et al.(1999)Cell 99:447−450、及びRobertson et al.(2000)Nature Genet.25:338−342を参照されたい。さらなる例示的な抑制ドメインは、ROM2及びAtHD2Aを含むが、それらに限定されない。例えば、Chem et al.(1996)Plant Cell 8:305−321、及びWu et al.(2000)Plant J.22:19−27を参照されたい。
ある特定の実施形態において、TALE融合タンパク質によって結合される標的部位は、細胞クロマチンのアクセス可能な領域に存在する。アクセス可能な領域を、例えば、共同所有の国際公開第WO01/83732号に記載されるように決定することができる。標的部位が細胞クロマチンのアクセス可能な領域に存在しない場合、1つ以上のアクセス可能な領域を、共同所有の国際公開第WO01/83793号に記載されるように生成することができる。さらなる実施形態において、融合分子のDNA結合ドメインは、その標的部位がアクセス可能な領域にあるか否かにかかわらず、細胞クロマチンに結合することができる。例えば、そのようなDNA結合ドメインは、リンカーDNA及び/又はヌクレオソームDNAに結合することができる。この種類の「パイオニア」DNA結合ドメインの例は、ある特定のステロイド受容体及び肝細胞核因子3(HNF3)において見出される。Cordingley et al.(1987)Cell 48:261−270、Pina et al.(1990)Cell 60:719−731、及びCirillo et al.(1998)EMBO J.17:244−254。
融合分子を、当業者に既知のように、薬学的に許容される担体で製剤化することができる。例えば、Remington’s Pharmaceutical Sciences,17th ed.,1985、及び共同所有の国際公開第WO00/42219号を参照されたい。
いったん融合分子がそのDNA結合ドメインを介して標的配列に結合すると、融合分子の機能構成要素/ドメインを、遺伝子の転写に影響を与えることができる様々な異なる構成要素のうちのいずれかから選択することができる。したがって、機能的成分は、活性化因子、抑制因子、共活性化因子、共抑制因子、及びサイレンサー等の多様な転写因子ドメインを含み得るが、これらに限定されない。
さらなる例示的な機能ドメインが、例えば、共同所有の米国特許第6,534,261号及び米国特許出願公開第2002/0160940号において開示されている。
外因性小分子又はリガンドによって制御される機能ドメインを選択することもできる。例えば、RheoSwitch(登録商標)技術を採用することができ、機能ドメインは、外部のRheoChem(商標)リガンドの存在下で、その活性立体配座のみを想定する(例えば、米国特許第20090136465号を参照のこと)。したがって、TALE融合タンパク質を、制御可能な機能ドメインに動作可能に結合することができ、結果として得られるTALE融合タンパク質の活性は、外部リガンドによって制御される。
ある特定の実施形態において、TALE DNA結合タンパク質、又はそのフラグメントは、TALE DNA結合ドメインの少なくとも1つのヌクレアーゼ(切断ドメイン、切断半ドメイン)への融合(TALE反復ドメイン、Nキャップ配列、並びに/又はCキャップ配列のN末端及び/若しくはC末端)を介して、ヌクレアーゼとして使用される。本明細書に開示の融合タンパク質の切断ドメイン部分を、任意のエンドヌクレアーゼ又はエキソヌクレアーゼから得ることができる。切断ドメインが由来し得る例示的なエンドヌクレアーゼには、制限エンドヌクレアーゼ及びホーミングエンドヌクレアーゼが含まれるが、それらに限定されない。例えば、2002−2003 Catalogue,New England Biolabs,Beverly,MA、及びBelfort et al.(1997)Nucleic Acids Res.25:3379−3388を参照されたい。DNAを切断するさらなる酵素が既知である(例えば、S1ヌクレアーゼ、マングビーンヌクレアーゼ、膵臓DNase I、ミクロコッカスヌクレアーゼ、酵母HOエンドヌクレアーゼ、Linn et al.(eds.)Nucleases,Cold Spring Harbor Laboratory Press,1993も参照のこと)。これらの酵素(又はその機能フラグメント)のうちの1つ以上を、切断ドメイン及び切断半ドメインの源として使用することができる。
同様に、切断半ドメインは、上で説明されるように、切断活性に二量体化を必要とする任意のヌクレアーゼ又はその部分に由来し得る。概して、融合タンパク質が切断半ドメインを含む場合、2つの融合タンパク質が切断に必要とされる。あるいは、2つの切断半ドメインを含む単一のタンパク質を使用することができる。2つの切断半ドメインは、同一のエンドヌクレアーゼ(又はその機能フラグメント)に由来し得るか、又はそれぞれの切断半ドメインは、異なるエンドヌクレアーゼ(又はその機能フラグメント)に由来し得る。加えて、2つの融合タンパク質の標的部位は、好ましくは、相互に対して配置され、したがって、2つの融合タンパク質のそれらのそれぞれの標的部位への結合は、例えば、二量体化によって、切断半ドメインが機能切断ドメインを形成することを可能にする相互に空間的配向に、切断半ドメインを配置する。したがって、ある特定の実施形態において、標的部位の近端は、5〜8個のヌクレオチド又は15〜18個のヌクレオチドによって分離される。しかしながら、任意の整数のヌクレオチド又はヌクレオチド対が、2つの標的部位の間に介在し得る(例えば、2〜50個以上のヌクレオチド対)。概して、切断部位は、標的部位の間にある。
制限エンドヌクレアーゼ(制限酵素)は、多くの種において存在し、DNAに配列特異的に結合することができ(認識部位で)、結合部位で、又は結合部位の近くで、DNAを切断することができる。ある特定の制限酵素(例えば、IIS型)は、認識部位から除去された部位でDNAを切断し、分離可能な結合及び切断ドメインを有する。例えば、IIS型酵素FokIは、一方の鎖上のその認識部位から9番目のヌクレオチドで、かつ他方の鎖上のその認識部位から13番目のヌクレオチドで、DNAの二本鎖切断を触媒する。例えば、米国特許第5,356,802号、同第5,436,150号、及び同第5,487,994号、並びにLi et al.(1992)Proc.Natl.Acad.Sci.USA 89:4275−4279、Li et al.(1993)Proc.Natl.Acad.Sci.USA 90:2764−2768、Kim et al.(1994a)Proc.Natl.Acad.Sci.USA 91:883−887、Kim et al.(1994b)J.Biol.Chem.269:31,978−31,982を参照されたい。したがって、一実施形態において、融合タンパク質は、少なくとも1つのIIS型制限酵素由来の切断ドメイン(若しくは切断半ドメイン)及び1つ以上のTALE DNA結合ドメインを含み、遺伝子操作され得るか、又は遺伝子操作され得ない。
その切断ドメインが結合ドメインから分離可能である例示的なIIS型制限酵素には、FokI及びBfiIが含まれる(Zaremba et al,(2004)J Mol Biol.336(1):81−92を参照のこと)。Fok酵素は、二量体として活性である(Bitinaite et al.(1998)Proc.Natl.Acad.Sci.USA 95:10,570−10,575を参照のこと)。TALE反復ドメイン−FokI融合物(又はCキャップ及びNキャップをさらに含むその変異体)を使用した細胞配列の標的化二本鎖切断及び/又は標的化置換のために、それぞれFokI切断半ドメインを含む2つの融合タンパク質を使用して、触媒的に活性な切断ドメインを再構成することができる。あるいは、TALE反復ドメイン及び2つのFokI切断半ドメインを含有する単一のポリペプチド分子を使用することもできる。別の好ましいIIS型制限酵素は、BfiIである(Zaremba et al,(2004)J Mol Biol.336(1):81−92を参照のこと)。この酵素の切断ドメインを、そのDNA結合ドメインから分離することができ、TALE DNA結合ドメインに動作可能に結合して、TALENを作成することができる。
切断ドメイン又は切断半ドメインは、切断活性を保持するか、又は機能切断ドメインを形成するために多量体化(例えば、二量体化)する能力を保持するタンパク質の任意の部分であり得る。
例示的なIIS型制限酵素が、その全体が本明細書に組み込まれる国際公開第WO07/014275号に記載されている。さらなる制限酵素は、分離可能な結合及び切断ドメインも含有し、これらは、本開示によって熟慮される。例えば、Roberts et al.(2003)Nucleic Acids Res.31:418−420を参照されたい。
切断特異性を強化するために、ある特定の実施形態において、切断ドメインは、例えば、それら全ての開示が、参照によりそれらの全体が本明細書組み込まれる、米国特許公開第20050064474号、同第20060188987号、同第20080131962号、同第20090311787号、同第20090305346号、同第20110014616号、及び米国特許出願第12/931,660号に記載されるように、ホモ二量体化を最小限に抑えるか、又は阻止する、1つ以上の遺伝子操作された切断半ドメイン(二量体化ドメイン変異体とも称される)を含む。FokIの446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537、及び538位のアミノ酸残基は全て、FokI切断半ドメインの二量体化に影響を与えるための標的である。
偏性ヘテロ二量体を形成するFokIの例示的な遺伝子操作された切断半ドメインは、第1の切断半ドメインがFokIの490及び538位のアミノ酸残基での変異を含み、かつ第2の切断半ドメインが486及び499位のアミノ酸残基での変異を含む対を含む。
偏性ヘテロ二量体を形成するFokIのさらなる遺伝子操作された切断半ドメインを、本明細書に記載の融合タンパク質において使用することができる。第1の切断半ドメインは、FokIの490及び538位のアミノ酸残基での変異を含み、第2の切断半ドメインは、486及び499位のアミノ酸残基での変異を含む。
したがって、一実施形態において、490位での変異は、Glu(E)をLys(K)に置換し、538位での変異は、Iso(I)をLys(K)に置換し、486位での変異は、Gln(Q)をGlu(E)に置換し、499位での変異は、Iso(I)をLys(K)に置換する。具体的には、本明細書に記載の遺伝子操作された切断半ドメインは、1つの切断半ドメインにおいて490位(E→K)及び538位(I→K)を変異させて、「E490K:I538K」と指定される遺伝子操作された切断半ドメインを産生することによって、かつ別の切断半ドメインにおいて486位(Q→E)及び499位(I→L)を変異させて、「Q486E:I499L」と指定される遺伝子操作された切断半ドメインを産生することによって調製される。本明細書に記載の遺伝子操作された切断半ドメインは、異常な切断が最小限に抑えられるか、又は無効にされる、偏性ヘテロ二量体変異体である。例えば、その開示が全ての目的のために参照によりその全体が組み込まれる、米国特許公開第2008/0131962号の実施例1を参照されたい。
本明細書に記載の遺伝子操作された切断半ドメインは、異常な切断が最小限に抑えられるか、又は無効にされる、偏性ヘテロ二量体変異体である。例えば、国際公開第WO07/139898号の実施例1を参照されたい。ある特定の実施形態において、遺伝子操作された切断半ドメインは、486位、499位、及び496位(野生型FokIに対して番号付けされた)での変異、例えば、486位の野生型Gln(Q)残基をGlu(E)残基に置換し、499位の野生型Iso(I)残基をLeu(L)残基に置換し、かつ496位の野生型Asn(N)残基をAsp(D)又はGlu(E)残基(それぞれ、「ELD」及び「ELE」ドメインとも称される)に置換する変異を含む。他の実施形態では、遺伝子操作された切断半ドメインは、490位、538位、及び537位(野生型FokIに対して番号付けされた)での変異、例えば、490位の野生型Glu(E)残基をLys(K)残基に置換し、538位の野生型Iso(I)残基をLys(K)残基に置換し、かつ537位の野生型His(H)残基をLys(K)残基又はArg(R)残基(それぞれ、「KKK」及び「KKR」ドメインとも称される)に置換する変異を含む。他の実施形態では、遺伝子操作された切断半ドメインは、490位及び537位(野生型FokIに対して番号付けされた)での変異、例えば、490位の野生型Glu(E)残基をLys(K)残基に置換し、かつ537位の野生型His(H)残基をLys(K)残基又はArg(R)残基(それぞれ、「KIK」及び「KIR」ドメインとも称される)に置換する変異を含む(2010年2月8日出願の米国仮出願第61/337,769号及び2010年9月23日出願の米国仮出願第61/403,916号を参照のこと)。加えて、「シャーキー(Sharkey)」又は「シャーキー(シャーキープライム(Sharkey prime))」変異として既知の変異を含むFokIヌクレアーゼドメイン変異体を使用することができる(Guo et al,(2010)J.Mol.Biol.doi:10.1016/j.jmb.2010.04.060を参照のこと)。
本明細書に記載の遺伝子操作された切断半ドメインを、任意の好適な方法を使用して、例えば、米国特許公開第20050064474号、同第20070134796号、同第20080131962号に記載の野生型切断半ドメイン(FokI)の部位指向性変異誘発によって調製することができる。
TALE融合ポリペプチド及び核酸を、組換え遺伝学の分野における慣用的な技法を使用して作製することができる。本発明で使用される一般的な方法を開示する基本的な文書には、Sambrook et al.,Molecular Cloning,Laboratory Manual(2nd ed.1989)、Kriegler,Gene Transfer and Expression:A Laboratory Manual(1990)、及びCurrent Protocols in Molecular Biology(Ausubel et al.,eds.,1994))が含まれる。加えて、本質的には、任意の核酸を、様々な商業的供給源のうちのいずれかから特注することができる。同様に、ペプチド及び抗体を、様々な商業的供給源のうちのいずれかから特注することができる。
2つの代替の方法は、典型的には、新しく設計されたDNA結合ペプチドを発現するために必要とされるコード配列を作成するために使用される。1つのプロトコルは、重複したオリゴヌクレオチドを利用するPCRに基づく組み立て手順である。これらのオリゴヌクレオチドは、それらを異なるDNA結合ドメインのそれぞれに特異的にする反復ドメインの12位及び13位に主に置換を含有するが、それらに限定されない。さらに、アミノ酸置換を、4、11、及び32位で作製することができる。アミノ酸置換を、1つの反復単位内の2、3、4、21、23、24、25、27、30、31、33、34、及び/又は35位で作製することもできる。いくつかの実施形態において、反復単位は、1つの位置での置換を含有し、他の実施形態では、反復単位は、2〜18個のアミノ酸置換を含有する。いくつかの実施形態において、アミノ酸配列を変更することなく、反復単位のヌクレオチド配列を変更することができる。
当業者に既知のタンパク質精製の任意の好適な方法を使用して、本発明のTALE融合タンパク質を精製することができる(上記のAusubel、上記のSambrookを参照のこと)。加えて、任意の好適な宿主、例えば、細菌細胞、昆虫細胞、酵母細胞、哺乳類細胞等を使用することができる。
したがって、融合分子は、当業者に周知のクローニング及び生化学的接合の方法によって構築される。融合分子は、DNA結合ドメイン及び機能ドメイン(例えば、転写活性化又は抑制ドメイン)を含む。融合分子は、任意で、核局在化シグナル(例えば、SV40媒体T抗原からのシグナル等)並びにエピトープ標識(例えば、FLAG及び血球凝集素等)も含む。融合タンパク質(及びそれらをコードする核酸)は、翻訳リーディングフレームが融合の構成要素の間に保存されるように設計される。本明細書に記載の融合タンパク質は、本明細書に記載のDNA結合ポリペプチドのN末端及び/又はC末端で1つ以上の機能ドメインを含み得る。
一方で機能ドメイン(又はその機能フラグメント)のポリペプチド構成要素と、他方で非タンパク質DNA結合ドメイン(例えば、抗生物質、挿入剤、副溝結合剤、核酸)との間の融合物は、当業者に既知の生化学的接合の方法によって構築される。例えば、Pierce Chemical Company(Rockford,IL)の目録を参照されたい。副溝結合剤とポリペプチドとの間の融合物を作成するための方法及び組成物が記載されている。Mapp et al.(2000)Proc.Natl.Acad.Sci.USA 97:3930−3935。
標的化切断のためのさらなる方法
任意の所望の遺伝子(複数を含む)中に標的部位を含む任意のヌクレアーゼを、本明細書に開示の方法において使用することができる。例えば、ホーミングエンドヌクレアーゼ及びメガヌクレアーゼは、非常に長い認識配列を有し、それらのうちのいくつかは、統計的基礎に従って、ヒト大のゲノムに一度存在する可能性が高い。所望の遺伝子中に標的部位を有する任意のそのようなヌクレアーゼを、標的化切断のために、例えば、亜鉛フィンガーヌクレアーゼ及び/若しくはメガヌクレアーゼを含むTALE反復ドメインヌクレアーゼ融合物の代わりに、又はそれに加えて使用することができる。
ある特定の実施形態において、ヌクレアーゼは、メガヌクレアーゼ(ホーミングエンドヌクレアーゼ)である。自然発生メガヌクレアーゼは、15〜40個の塩基対切断部位を認識し、通常、4つのファミリー:LAGLIDADGファミリー、GIY−YIGファミリー、His−Cystボックスファミリー、及びHNHファミリーに分類される。例示的なホーミングエンドヌクレアーゼには、I−SceI、I−CeuI、PI−PspI、PI−Sce、I−SceIV、I−CsmI、I−PanI、I−SceII、I−PpoI、I−SceIII、I−CreI、I−TevI、I−TevII、及びI−TevIIIが含まれる。それらの認識配列が既知である。米国特許第5,420,032号、米国特許第6,833,252号、Belfort et al.(1997)Nucleic Acids Res.25:3379-3388、Dujon et al.(1989)Gene 82:115-118、Perler et al.(1994)Nucleic Acids Res.22,1125-1127、Jasin(1996)Trends Genet.12:224-228、Gimble et al.(1996)J.Mol.Biol.263:163-180、Argast et al.(1998)J.Mol.Biol.280:345-353、及びNew England Biolabsの目録も参照されたい。
主にLAGLIDADGファミリー由来の自然発生メガヌクレアーゼ由来のDNA結合ドメインは、植物、酵母、ショウジョウバエ、哺乳類細胞、及びマウスにおいて部位特異的ゲノム修飾を促進するために使用されているが、このアプローチは、メガヌクレアーゼ認識配列を保存する相同遺伝子(Monet et al.(1999),Biochem.Biophysics.Res.Common.255:88−93)、又は認識配列が導入された事前に遺伝子操作されたゲノム(Route et al.(1994),Mol.Cell Biol.14:8096−106、Chilton et al.(2003),Plant Physiology.133:956−65、Puchta et al.(1996),Proc.Natl.Acad.Sci.USA 93:5055−60、Rong et al.(2002),GenesDev.16:1568−81、Gouble et al.(2006),J.Gene Med.8(5):616−622)のいずれかの修飾に限定されている。したがって、医学的又は生物工学的関連部位で新規の結合特異性を呈するために、メガヌクレアーゼを遺伝子操作する試みが行われている(Porteus et al.(2005),Nat.Biotechnol.23:967−73、Sussman et al.(2004),J.Mol.Biol.342:31−41、Epinat et al.(2003),Nucleic Acids Res.31:2952−62、Chevalier et al.(2002)Molec.Cell 10:895−905、Epinat et al.(2003)Nucleic Acids Res.31:2952−2962、Ashworth et al.(2006)Nature 441:656−659、Paques et al.(2007)Current Gene Therapy 7:49−66、米国特許公開第20070117128号、同第20060206949号、同第20060153826号、同第20060078552号、及び同第20040002092号)。
送達
TALE融合タンパク質、TALE融合タンパク質をコードするポリヌクレオチド、並びに本明細書に記載のタンパク質及び/又はポリヌクレオチドを含む組成物を、例えば、TAL融合タンパク質をコードするmRNAの注入を含む、任意の好適な手段によって、標的細胞に送達することができる。Hammerschmidt et al.(1999)Methods Cell Biol.59:87−115を参照されたい。
遺伝子操作された転写因子を含むタンパク質の送達方法は、例えば、米国特許第6,453,242号、同第6,503,717号、同第6,534,261号、同第6,599,692号、同第6,607,882号、同第6,689,558号、同第6,824,978号、同第6,933,113号、同第6,979,539号、同第7,013,219号、及び同第7,163,824号において記載されており、それらの全ての開示は、参照によりそれらの全体が本明細書に組み込まれる。
本明細書に記載のTALEタンパク質融合物を、TALEタンパク質融合物のうちの1つ以上をコードする配列を含有するベクターを使用して送達することもできる。プラスミドベクター、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、ポックスウイルスベクター、ヘルペスウイルスベクター、及びアデノ関連ウイルスベクター等を含むが、それらに限定されない任意のベクター系を使用することができる。参照によりそれらの全体が本明細書に組み込まれる、米国特許第6,534,261号、同第6,607,882号、同第6,824,978号、同第6,933,113号、同第6,979,539号、同第7,013,219号、及び同第7,163,824号も参照されたい。さらに、これらのベクターのうちのいずれかが、配列をコードする1つ以上のTALEタンパク質融合物を含み得ることは明らかである。したがって、1つ以上のTALEタンパク質融合物(例えば、TALENの対)が細胞に導入されるとき、TALEタンパク質融合物を、同一のベクター又は異なるベクターで輸送することができる。複数のベクターが使用される場合、それぞれのベクターは、配列をコードする1つ又は複数のTALEタンパク質融合物を含み得る。
従来のウイルス及び非ウイルスに基づく遺伝子導入方法を使用して、細胞(例えば、哺乳類細胞)、全生物、又は標的組織において遺伝子操作されたTALEタンパク質融合物をコードする核酸を導入することができる。そのような方法を使用して、細胞に、TALEタンパク質融合物をコードする核酸をインビトロで投与することができる。ある特定の実施形態において、TALEタンパク質融合物をコードする核酸は、インビボ又はエクスビボ使用のために投与される。非ウイルスベクター送達系は、DNAプラスミド、ネイキッド核酸、及びリポソーム又はポロキサマー等の送達ビヒクルと錯体形成された核酸を含む。ウイルスベクター送達系は、細胞への送達後にエピソームゲノム又は組込みゲノムのいずれかを有するDNA及びRNAウイルスを含む。遺伝子操作されたDNA結合タンパク質及びこれらの結合タンパク質を含む融合タンパク質のインビボ送達の総説については、例えば、Rebar(2004)Expert Opinion Invest.Drugs 13(7):829−839、Rossi et al.(2007)Nature Biotech.25(12):1444−1454、並びにAnderson,Science 256:808−813(1992)、Nabel & Felgner,TIBTECH 11:211−217(1993)、Mitani & Caskey,TIBTECH 11:162−166(1993)、Dillon,TIBTECH 11:167−175(1993)、Miller,Nature 357:455−460(1992)、Van Brunt,Biotechnology 6(10):1149−1154(1988)、Vigne,Restorative Neurology and Neuroscience 8:35−36(1995)、Kremer & Perricaudet,British Medical Bulletin 51(1):31−44(1995)、Haddada et al.,in Current Topics in Microbiology and Immunology Doerfler and Bohm(eds.)(1995)、及びYu et al.,Gene therapy 1:13−26(1994)等の一般的な遺伝子送達の参考文献を参照されたい。
非ウイルスベクター送達系は、電気穿孔、リポフェクション、微量注入、微粒子銃、ビロゾーム、リポソーム、免疫リポソーム、ポリカチオン又は脂質:核酸接合体、ネイキッドDNA、人工ビリオン、及び薬剤で強化されたDNAの取込みを含む。例えば、Sonitron2000システム(Rich−Mar)を使用したソノポレーションを、核酸の送達に使用することもできる。ウイルスベクター送達系は、細胞への送達後にエピソームゲノム又は組込みゲノムのいずれかを有するDNA及びRNAウイルスを含む。さらなる例示的な核酸送達系は、Amaxa Biosystem(Cologne,Germany)、Maxcyte,Inc.(Rockville,Maryland)、BTX Molecular Delivery Systems(Holliston,MA)、及びCopernicus Therapeutics Incによって提供されるものを含む(例えば、米国特許第6008336号を参照のこと)。リポフェクションは、例えば、米国特許第5,049,386号、米国特許第4,946,787号、及び米国特許第4,897,355号に記載されており、リポフェクション試薬が市販されている(例えば、Transfectam(商標)及びLipofectin(商標))。ポリヌクレオチドの効率的な受容体認識リポフェクションに好適なカチオン性及び中性脂質は、Felgnerの国際公開第WO91/17424号、国際公開第WO91/16024号に記載のものを含む。細胞(エクスビボ投与)又は標的組織(インビボ投与)に送達することができる。
免疫脂質複合体等の標的化されたリポソームを含む脂質:核酸複合体の調製は、当業者に周知である(例えば、Crystal,Science 270:404−410(1995)、Blaese et al.,Cancer Gene Ther.2:291−297(1995)、Behr et al.,Bioconjugate Chem.5:382−389(1994)、Remy et al.,Bioconjugate Chem.5:647−654(1994)、Gao et al.,Gene Therapy 2:710−722(1995)、Ahmad et al.,Cancer Res.52:4817−4820(1992)、米国特許第4,186,183号、同第4,217,344号、同第4,235,871号、同第4,261,975号、同第4,485,054号、同第4,501,728号、同第4,774,085号、同第4,837,028号、及び同第4,946,787号を参照のこと)。
送達のさらなる方法は、EnGeneICの送達ビヒクル(EDV)に送達される核酸のパッケージングの使用を含む。これらのEDVは、抗体の一方のアームが標的組織に対する特異性を有し、かつ他方のアームがEDVに対する特異性を有する二重特異性抗体を使用して、標的組織に特異的に送達される。抗体は、EDVを標的細胞の表面に運び、その後、EDVは、エンドサイトーシスによって細胞に運び込まれる。いったん細胞に入ると、内容物が放出される(MacDiarmid et al(2009)Nature Biotechnology vol 27(7)p.643を参照のこと)。
好適な細胞には、真核及び原核細胞並びに/又は細胞株が含まれるが、それらに限定されない。そのような細胞から生成されるそのような細胞又は細胞株の非限定的な例には、COS、CHO(例えば、CHO−S、CHO−K1、CHO−DG44、CHO−DUXB11、CHO−DUKX、CHOK1SV)、VERO、MDCK、WI38、V79、B14AF28−G3、BHK、HaK、NS0、SP2/0−Ag14、HeLa、HEK293(例えば、HEK293−F、HEK293−H、HEK293−T)、及びperC6細胞、並びにスポドプテラ・フルギペルダ(Sf)等の昆虫細胞、又はサッカロミセス、ピチア、及びシゾサッカロミセス等の真菌細胞が挙げられる。ある特定の実施形態において、細胞株は、CHO−K1、MDCK、又はHEK293細胞株である。さらに、TALE融合物での治療後に治療される対象への再導入のために、初代細胞を単離して、エクスビボで使用することができる。好適な初代細胞には、末梢血単核細胞(PBMC)、及びCD4+T細胞又はCD8+T細胞等であるが、それらに限定されない他の血球サブセットが含まれる。好適な細胞には、一例として、胚幹細胞、誘導性多能性幹細胞、造血幹細胞、神経幹細胞、間葉幹細胞、筋肉幹細胞、及び皮膚幹細胞等の幹細胞も含まれる。
修飾された幹細胞を、いくつかの実施形態において使用することもできる。例えば、アポトーシスへの耐性を持たされた幹細胞を、治療的組成物として使用することができ、幹細胞は、本発明のTALE融合タンパク質も含有する。アポトーシスへの耐性は、例えば、幹細胞中のBAX若しくはBAK特異的TALENを使用してBAX及び/若しくはBAKをノックアウトすること、又はこの場合もやはり、例えば、カスパーゼ−6特異的TALENを使用して、カスパーゼ内で破壊されるものをノックアウトすることによって発生し得る。
造血幹細胞へのDNAの導入方法が、例えば、米国特許第5,928,638号に開示されている。造血幹細胞、例えば、CD34+細胞への導入遺伝子の導入に有用なベクターには、アデノウイルス35型が含まれる。
本明細書に記載のポリヌクレオチドの導入に好適なベクターには、非組込みレンチウイルスベクター(IDLV)が含まれる。例えば、Ory et al.(1996)Proc.Natl.Acad.Sci.USA 93:11382−11388、Dull et al.(1998)J.Virol.72:8463−8471、Zuffery et al.(1998)J.Virol.72:9873−9880、Follenzi et al.(2000)Nature Genetics 25:217−222、米国特許公開第2009/054985号を参照されたい。上述のように、開示の方法及び組成物を、任意の種類の細胞において使用することができる。動物細胞の子孫、変異体、及び誘導体を使用することもできる。
DNA構築物を、様々な従来の技法によって所望の植物宿主に(例えば、そのゲノムに)導入することができる。そのような技法の概説については、例えば、Weissbach & Weissbach Methods for Plant Molecular Biology(1988,Academic Press,N.Y.)Section VIII,pp.421−463、及びGrierson & Corey,Plant Molecular Biology(1988,2d Ed.),Blackie,London,Ch.7−9を参照されたい。
例えば、DNA構築物を、植物細胞プロトプラストの電気穿孔及び微量注入等の技法を用いて植物細胞のゲノムDNAに直接導入することができるか、又はDNA構築物を、DNA粒子銃等の微粒子銃法を用いて植物組織に直接導入することができる(例えば、Klein et al(1987)Nature 327:70−73を参照のこと)。あるいは、DNA構築物を、好適なT−DNA隣接領域と合わせて、従来のアグロバクテリウム・ツメファシエンス宿主ベクターに導入することができる。武装解除及びバイナリーベクターの使用を含むアグロバクテリウム・ツメファシエンス媒介型形質転換技法が、科学文献において十分に説明されている。例えば、Horsch et al(1984)Science 233:496−498、及びFraley et al(1983)Proc.Nat’l.Acad.Sci.USA 80:4803を参照されたい。
加えて、非アグロバクテリウム細菌、又はリゾビウム種NGR234、シノリゾビウム・メリロティ、メソリゾビウム・ロティ、ジャガイモウイルスX、カリフラワーモザイクウイルス、及びキャッサバベインモザイクウイルス、並びに/若しくはタバコモザイクウイルス等のウイルスを使用して、遺伝子導入を達成することができる。例えば、Chung et al.(2006)Trends Plant Sci.11(1):1−4を参照されたい。
アグロバクテリウム・ツメファシエンス宿主の毒性機能は、バイナリーT−DNAベクター(Bevan(1984)Nuc.Acid Res.12:8711−8721)又は共培養手順(Horsch et al(1985)Science 227:1229−1231)を用いて、細胞が細菌に感染するときに、植物細胞DNAへの構築物及び隣接マーカーの挿入を誘導する。概して、アグロバクテリウム形質転換系を使用して、双子葉植物を遺伝子操作する(Bevan et al(1982)Ann.Rev.Genet 16:357−384、Rogers et al(1986)Methods Enzymol.118:627−641)。アグロバクテリウム形質転換系を使用して、DNAを単子葉植物及び植物細胞に形質転換、並びに導入することもできる。米国特許第5,591,616号、Hernalsteen et al(1984)EMBO J 3:3039−3041、Hooykass−Van Slogteren et al(1984)Nature 311:763−764、Grimsley et al(1987)Nature 325:1677−179、Boulton et al(1989)Plant Mol.Biol.12:31−40、及びGould et al(1991)Plant Physiol.95:426−434を参照されたい。
代替の遺伝子導入及び形質転換方法は、ネイキッドDNAのカルシウム、ポリエチレングリコール(PEG)、又は電気穿孔媒介型取込みを介するプロトプラスト形質転換(Paszkowski et al.(1984)EMBO J 3:2717−2722、Potrykus et al.(1985)Molec.Gen.Genet.199:169−177、Fromm et al.(1985)Proc.Nat.Acad.Sci.USA 82:5824−5828、及びShimamoto(1989)Nature 338:274−276を参照のこと)、並びに植物組織の電気穿孔(D’Halluin et al.(1992)Plant Cell 4:1495−1505)を含むが、それらに限定されない。植物細胞形質転換のためのさらなる方法は、微量注入、炭化ケイ素媒介型DNA取込み(Kaeppler et al.(1990)Plant Cell Reporter 9:415−418)、並びに微小発射銃(microprojectile bombardment)(Klein et al.(1988)Proc.Nat.Acad.Sci.USA 85:4305−4309、及びGordon−Kamm et al.(1990)Plant Cell 2:603−618を参照のこと)を含む。
生物
本明細書に記載の方法及び組成物は、植物、動物(例えば、マウス、ラット、霊長類、家畜、ウサギ等の哺乳動物)、魚等の真核生物を含むが、それらに限定されない、遺伝子発現を制御し、かつ/又はゲノム修飾を介して生物を変更することが所望される任意の生物に適用できる。真核(例えば、酵母、植物、真菌、魚、並びに猫、犬、マウス、ウシ、羊、及びブタ等の哺乳類細胞)細胞を使用することができる。本明細書に記載の1つ以上のホモ接合KO遺伝子座又は他の遺伝的修飾を含有する生物由来の細胞も使用することができる。
例示的な哺乳類細胞には、目的とする生物の任意の細胞又は細胞株、例えば、卵母細胞、K562細胞、CHO(チャイニーズハムスター卵巣)細胞、HEP−G2細胞、BaF−3細胞、シュナイダー細胞、COS細胞(SV40 T抗原を発現するサル腎臓細胞)、CV−1細胞、HuTu80細胞、NTERA2細胞、NB4細胞、HL−60細胞、及びHeL細胞、293細胞(例えば、Graham et al.(1977)J.Gen.Virol.36:59を参照のこと)、並びにSP2又はNS0等の骨髄腫細胞(例えば、Galfre and Milstein(1981)Meth.Enzymol.73(B):3 46を参照のこと)が挙げられる。胚及び成人幹細胞を使用することができるように、末梢血単核球(PBMC)又はT細胞も使用することができる。例えば、使用することができる幹細胞には、胚幹細胞(ES)、誘導性多能性幹細胞(iPSC)、間葉幹細胞、造血幹細胞、肝幹細胞、皮膚幹細胞、及び神経幹細胞が含まれる。
例示的な標的植物及び植物細胞には、穀類作物(例えば、小麦、トウモロコシ、コメ、キビ、大麦)、果実作物(例えば、トマト、リンゴ、ナシ、イチゴ、オレンジ)、飼料作物(例えば、ムラサキウマゴヤシ)、根菜作物(例えば、ニンジン、ジャガイモ、テンサイ、ヤムイモ)、葉菜作物(例えば、レタス、ほうれん草)、消費用の植物性作物(例えば、大豆及び他のマメ類、カボチャ、ピーマン、ナス、セロリ等)、顕花植物(例えば、ペチュニア、バラ、キク)、針葉樹及び松の木(例えば、松、モミ、トウヒ)、ポプラの木(例えば、ヤマナラシ×ウラジロハコヤナギ)、繊維作物(綿、ジュート、亜麻、竹)、ファイトレメディエーションにおいて使用される植物(例えば、重金属集積植物)、油料作物(例えば、ヒマワリ、菜種)、並びに実験的目的に使用される植物(例えば、シロイヌナズナ)を含む作物等の単子葉及び双子葉植物が挙げられるが、それらに限定されない。したがって、開示の方法及び組成物は、アスパラガス属、カラスムギ属、アブラナ属、ミカン属、スイカ属、トウガラシ属、カボチャ属、ニンジン属、ムカシヨモギ属、ダイズ属、ワタ属、オオムギ属、アキノノゲシ属、ドクムギ属、トマト属、リンゴ属、キャッサバ属、タバコ属、ショカツサイ属、イネ属、ワニナシ属、インゲンマメ属、エンドウ属、ナシ属、サクラ属、ダイコン属、ライムギ属、ナス属、モロコシ属、コムギ属、ブドウ属、ササゲ属、及びトウモロコシ属由来の種を含むが、それらに限定されない様々な種類の植物にわたる用途を有する。植物細胞という用語は、単離された植物細胞、並びに全植物、又は種子、カルス、葉、根等の全植物の一部を含む。本開示は、上述の植物の種子も網羅し、種子は、導入遺伝子若しくは遺伝子構築物を有し、かつ/又は本明細書に記載の組成物及び/若しくは方法を使用して修飾されている。本開示は、上述のトランスジェニック植物の子孫、クローン、細胞株、又は細胞をさらに網羅し、該子孫、クローン、細胞株、又は細胞は、導入遺伝子若しくは遺伝子構築物を有する。
藻は、目的とする化合物、すなわち、生物燃料、プラスチック、炭化水素等を製造するためにますます利用されている。例示的な藻種には、珪藻及び藍色細菌を含む微細藻類、並びにボトリオコッカス・ブラウニー、クロレラ、ドナリエラ・テルチオレクタ、グラシラリア、プリュウロクリシス・カルテラエ、サルガッサム、及びアルバが含まれる。
TALE融合タンパク質による遺伝子発現の制御を決定するためのアッセイ
様々なアッセイを使用して、TALE融合タンパク質による遺伝子発現制御のレベルを決定することができる。特定のTALE融合タンパク質の活性を、様々なインビトロ及びインビボアッセイを使用して、例えば、タンパク質又はmRNAレベル、産物レベル、酵素活性、腫瘍成長の測定によって、レポーター遺伝子の転写活性化又は抑制によって、第2のメッセンジャーレベル(例えば、cGMP、cAMP、IP3、DAG、Ca.sup.2+)によって、サイトカイン及びホルモン産生レベルによって、並びに例えば、免疫アッセイ(例えば、抗体を用いたELISA及び免疫組織化学的アッセイ)、ハイブリダイゼーションアッセイ(例えば、RNase保護、ノーザンブロット、in situハイブリダイゼーション、オリゴヌクレオチド配列研究)、比色アッセイ、増幅アッセイ、酵素活性アッセイ、腫瘍成長アッセイ、表現型アッセイ等を用いた新血管形成によって評価することができる。
TALE融合タンパク質は、典型的には、培養細胞、例えば、293細胞、CHO細胞、VERO細胞、BHK細胞、HeLa細胞、COS細胞、植物細胞株、植物カルス培養物等を使用して、インビトロでの活性について最初に試験される。好ましくは、ヒト細胞が使用される。TALE融合タンパク質は、多くの場合、レポーター遺伝子を有する一時的発現系を使用して最初に試験され、その後、標的内在性遺伝子の制御が、インビボ及びエクスビボの両方で細胞及び動物において試験される。TALE融合タンパク質は、細胞中で組換え的に発現するか、動物若しくは植物に移植された細胞中で組換え的に発現するか、又はトランスジェニック動物又は植物中で組換え的に発現することができ、かつ本明細書に記載の送達ビヒクルを使用して、タンパク質として、動物、植物、若しくは細胞に投与することができる。本細胞を、固定するか、溶液に入れるか、動物に注入するか、又はトランスジェニック若しくは非トランスジェニック動物において自然発生させることができる。
遺伝子発現の調節は、本明細書に記載のインビトロ又はインビボアッセイのうちの1つを使用して試験される。試料又はアッセイは、調節の程度を試験するために、TALE融合タンパク質で処理され、かつ試験化合物を有しない対照試料と比較される。
TALE融合タンパク質の効果を、上述のパラメータのうちのいずれかを試験することによって測定することができる。任意の好適な遺伝子発現、表現型、又は生理学的変化を用いて、TALE融合タンパク質の影響を評価することができる。機能的結果が無傷の細胞又は動物を使用して決定されるとき、腫瘍成長、新血管形成、ホルモン放出、両方の既知の遺伝子マーカー及び特性化されていない遺伝子マーカーの両方に対する転写変化(例えば、ノーザンブロット又はオリゴヌクレオチド配列研究)、細胞成長又はpH変化等の細胞代謝の変化、並びにcGMP等の細胞内の第2のメッセンジャーの変化等の様々な影響を測定することもできる。
内在性遺伝子発現のTALE融合タンパク質媒介制御のための好ましいアッセイを、インビトロで行うことができる。1つの好ましいインビトロアッセイ形式において、培養細胞中の内在性遺伝子発現のTALE融合タンパク質媒介制御は、ELISAアッセイを使用してタンパク質産生を試験することによって測定される。試験試料は、空ベクター又は別の遺伝子に標的化される非関連TALE融合タンパク質で処理された対照細胞と比較される。
別の実施形態では、内在性遺伝子発現のTALE融合タンパク質媒介制御は、標的遺伝子mRNAの発現レベルを測定することによってインビトロで決定される。遺伝子発現のレベルは、増幅を使用して、例えば、PCR、LCR、又はハイブリダイゼーションアッセイ、例えば、ノーザンハイブリダイゼーション、RNase保護、ドットブロット法を使用して測定される。RNase保護が一実施形態において使用される。タンパク質又はmRNAのレベルは、直接標識又は間接標識検出剤、例えば、本明細書に記載の蛍光標識又は放射活性標識核酸、放射活性標識又は酵素標識抗体等を使用して検出される。
あるいは、レポーター遺伝子系を、ルシフェラーゼ、緑色蛍光タンパク質、CAT、又はベータガラクトシダーゼ等のレポーター遺伝子に動作可能に結合される標的遺伝子プロモーターを使用して考案することができる。レポーター構築物は、典型的には、培養細胞に共トランスフェクトされる。最適なTALE融合タンパク質での処理後、レポーター遺伝子の転写、翻訳、又は活性の量は、当業者に既知の標準の技法に従って測定される。
内在性遺伝子発現のTALE融合タンパク質媒介制御の監視に有用な好ましいアッセイ形式の別の実施例が、インビボで行われる。このアッセイは、新血管形成(例えば、VEGF)等の腫瘍支持に関与する遺伝子である腫瘍促進遺伝子の発現を阻害するか、又はp53等の腫瘍抑制遺伝子を活性化するTALE融合物の試験に特に有用である。このアッセイにおいて、最適なTALE融合物を発現する培養腫瘍細胞は、無胸腺マウス、放射線照射マウス、又はSCIDマウス等の免疫不全マウスに皮下注入される。好適な期間、好ましくは、4〜8週間後に、腫瘍成長は、例えば、容積又はその2つの最大寸法で測定され、対照と比較される。統計的に有意な減少を有する腫瘍(例えば、スチューデントT検定を用いて)は、成長阻害を有すると考えられる。あるいは、腫瘍の新血管形成の程度を測定することもできる。腫瘍の血管新生及び腫瘍の血管の数について、内皮細胞特異的抗体を使用した免疫アッセイを使用して染色する。血管の数の統計的に有意な減少を有する腫瘍(例えば、スチューデントT検定を用いて)は、新血管形成阻害を有すると考えられる。
上述のトランスジェニック及び非トランスジェニック植物又は動物は、インビボでの内在性遺伝子発現の制御の試験に好ましい実施形態としても使用される。トランスジェニック生物は、典型的には、最適なTALE融合物を発現する。あるいは、最適なTALE融合物を一時的に発現する生物、送達ビヒクル中のTALE融合タンパク質が投与された生物を使用することができる。内在性遺伝子発現の制御は、本明細書に記載のアッセイのうちのいずれか1つを使用して試験される。
TALE融合タンパク質をコードする核酸
従来のウイルス及び非ウイルスに基づく遺伝子導入方法を使用して、全生物又は標的組織中の哺乳類細胞において遺伝子操作されたTALEドメイン融合物をコードする核酸を導入することができる。そのような方法を使用して、インビトロで、TALEドメイン融合物をコードする核酸を細胞に投与することができる。好ましくは、TALEドメイン融合物をコードする核酸は、インビボ又はエクスビボ使用のために投与される。非ウイルスベクター送達系は、DNAプラスミド、ネイキッド核酸、及びリポソーム等の送達ビヒクルと錯体形成された核酸を含む。ウイルスベクター送達系は、細胞への送達後にエピソームゲノム又は組込みゲノムのいずれかを有するDNA及びRNAウイルスを含む。遺伝子治療手順の総説については、Anderson,Science 256:808−813(1992)、Nabel & Felgner,TIBTECH 11:211−217(1993)、Mitani & Caskey,TIBTECH 11:162−166(1993)、Dillon,TIBTECH 11:167−175(1993)、Miller,Nature 357:455−460(1992)、Van Brunt,Biothechnology 6(10):1149−1154(1988);Vigne,Restorative Neurology and Neuroscience 8:35−36(1995)、Kremer & Perricaudet,British Medical Bulletin 51(1):31−44(1995)、Haddada et al.,in Current Topics in Microbiology and Immunology Doerfler and Bohm(eds)(1995)、及びYu et al.,Gene Therapy 1:13−26(1994)を参照されたい。
遺伝子操作されたTALEドメイン融合物をコードする核酸の送達のためのRNA又はDNAウイルスに基づく系の使用は、体内の特定の細胞にウイルスを標的化し、かつウイルスペイロードを核に輸送するための高度に進化したプロセスを利用する。ウイルスベクターを、(インビボで)患者に直接投与することができるか、又はそれらを使用して、インビトロで細胞を治療することができ、修飾された細胞は、(エクスビボで)患者に投与される。TALEドメイン融合物の送達のための従来のウイルスに基づく系は、遺伝子導入のために、レトロウイルス、レンチウイルス、アデノウイルス、アデノ関連ウイルス、及びヘルペスシンプレックスウイルスベクターを含み得る。ウイルスベクターは、現在、標的細胞及び組織における遺伝子導入の最も効率的かつ汎用的方法である。宿主ゲノムにおける組込みは、レトロウイルス、レンチウイルス、及びアデノ関連ウイルス遺伝子導入方法を伴って可能となり、多くの場合、挿入された導入遺伝子の長期発現をもたらす。さらに、高い導入効率が、多くの異なる細胞型及び標的組織において観察されている。
レトロウイルスの内性を、外来のエンベロープタンパク質を組み込むことによって変更することができ、標的細胞の潜在的標的集団を拡大する。レンチウイルスベクターは、非分裂細胞形質導入するか、又は感染させ、かつ典型的には、高いウイルス力価を産生することができるレトロウイルスベクターである。したがって、レトロウイルス遺伝子導入系の選択は、標的組織に依存するであろう。レトロウイルスベクターは、最大6〜10kbの外来配列のパッケージング能力を有するシス作用の長い末端反復から成る。最小限にシス作用したLTRは、ベクターの複製及びパッケージングに十分であり、その後、治療遺伝子を標的細胞に組み込んで、恒久的な導入遺伝子発現を提供するために使用される。広く使用されているレトロウイルスベクターは、マウス白血病ウイルス(MuLV)、テナガザル白血病ウイルス(GaLV)、サル免疫不全ウイルス(SIV)、ヒト免疫不全ウイルス(HIV)、及びそれらの組み合わせに基づくベクターを含む(例えば、Buchscher et al.,J.Virol.66:2731−2739(1992)、Johann et al.,J Virol.66:1635−1640(1992)、Sommerfelt et al,Virol.176:58−59(1990)、Wilson et al.,J.Virol.63:2374−2378(1989)、Miller et al.,J.Virol.65:2220−2224(1991);PCT/US94/05700を参照のこと)。
TALEドメイン融合物の一時的発現が好ましい適用において、アデノウイルスに基づく系が典型的に使用される。アデノウイルスに基づくベクターは、多くの細胞型において非常に高い形質導入効率の能力があり、細胞分裂を必要としない。そのようなベクターを用いて、高い力価及びレベルの発現が得られている。このベクターを、比較的簡単な系において大量に産生することができる。アデノ関連ウイルス(「AAV」)ベクターを、例えば、核酸及びペプチドのインビトロ産生において、並びにインビボ及びエクスビボでの遺伝子治療手順のために、標的核酸を用いて細胞を形質導入するために使用することもできる(例えば、West et al.,Virology 160:38−47(1987)、米国特許第4,797,368号、国際公開第WO93/24641号、Kotin,Human Gene Therapy 5:793−801(1994)、Muzyczka,J.Clin.Invest.94:1351(1994)を参照のこと)。組換えAAVベクターの構築は、米国特許第5,173,414号、Tratchin et al.,Mol.Cell Biol.5:3251−3260(1985)、Tatchin,et al.,MolCell Biol.4:2072−2081(1984)、Hermonat & Muzyczka,Proc Natl Acad Sci USA 81:6466−6470(1984)、及びSamulski et al.,J.Virol.63:03822−3828(1989)を含むいくつかの出版物に記載されている。
具体的には、少なくとも6つのウイルスベクターアプローチが、現在、臨床試験における遺伝子導入に利用可能であり、レトロウイルスベクターが、群を抜いて最も頻繁に使用される系である。これらのウイルスベクターの全ては、形質導入剤を生成するためにヘルパー細胞株に挿入される遺伝子によって欠陥ベクターの相補性を伴うアプローチを利用する。
pLASN及びMFG−Sは、臨床試験において使用されているレトロウイルスベクターの例である(Dunbar et al.,Blood 85:3048−305(1995)、Kohn et al.,Nat.Med.1:1017−102(1995)、Malech et al.,Proc Natl Acad Sci USA 94:22 12133−12138(1997))。PA317/pLASNは、遺伝子治療試験において使用された最初の治療ベクターである(Blaese et al.,Science 270:475480(1995))。50%以上の形質導入効率が、MFG−Sパッケージングベクターにおいて観察されている(Ellem et al.,Immunol Immunother.44(1):10−20(1997)、Dranoff et al.,Hum.Gene Ther.1:111−2(1997))。
組換えアデノ関連ウイルスベクター(rAAV)は、欠陥性及び非病原性のパルボウイルスアデノ関連2型ウイルスに基づく遺伝子送達系の有望な代替案である。全てのベクターは、導入遺伝子発現カセットに隣接するAAVの145bpの逆方向末端反復のみを保持するプラスミドに由来する。形質導入細胞のゲノムへの組込みによる効率的な遺伝子導入及び安定した導入遺伝子送達は、このベクター系の重要な特徴である(Wagner et al.,Lancet 351:9117 1702−3(1998)、Kearns et al.,Gene Ther.9:748−55(1996))。
複製欠陥性組換えアデノウイルスベクター(Ad)は、高力価で産生され、かついくつかの異なる細胞型を容易に感染させることができるため、主に、結腸癌の遺伝子治療のために使用される。ほとんどのアデノウイルスベクターは、導入遺伝子がAd E1a、E1b、及びE3遺伝子を置換し、その後、複製欠陥ベクターが、トランス内で欠失した遺伝子機能を供給するヒト293細胞において増殖するように遺伝子操作される。Adベクターは、肝臓、腎臓、及び筋肉系組織において見出される細胞等の非分裂の分化した細胞を含む、複数の種類の組織をインビボで形質導入することができる。従来のAdベクターは、高い運搬能力を有する。臨床試験におけるAdベクターの使用の例には、筋肉内注入での抗腫瘍免疫のためのポリヌクレオチド治療が含まれた(Sterman et al.,Hum.Gene Ther.7:1083−9(1998))。遺伝子導入のためのアデノウイルスベクターの使用のさらなる例には、Rosenecker et al,Infection 24:1 5−10(1996)、Sterman et al.,Hum.Gene Ther.9:7 1083−1089(1998)、Welsh et al.,Hum.Gene Ther.2:205−18(1995)、Alvarez et al.,Hum.Gene Ther.5:597−613(1997)、Topf et al.,Gene Ther.5:507−513(1998)、Sterman et al.,Hum.Gene Ther.7:1083−1089(1998)、米国特許公開第2008/0159996号が挙げられる。
パッケージング細胞は、宿主細胞を感染させることができるウイルス粒子を形成するために使用される。そのような細胞には、アデノウイルスをパッケージングする293細胞、及びレトロウイルスをパッケージングするpsi2細胞又はPA317細胞が含まれる。遺伝子治療において使用されるウイルスベクターは、通常、核酸ベクターをウイルス粒子にパッケージングする産生細胞株によって生成される。ベクターは、典型的には、パッケージング、及びそれに続く宿主への組込みに必要な最小限のウイルス配列、タンパク質を発現させるために発現カセットによって置換される他のウイルス配列を含有する。欠損したウイルス機能は、パッケージング細胞株によってトランス内で供給される。例えば、遺伝子治療において使用されるAAVベクターは、典型的には、パッケージング及び宿主ゲノムへの組込みに必要とされるAAVゲノム由来のITR配列のみを有する。他のAAV遺伝子、すなわち、rep及びcapをコードするが、ITR配列を欠如するヘルパープラスミドを含有するウイルスDNAは、細胞株中にパッケージングされる。細胞株は、ヘルパーとしてのアデノウイルスにも感染する。ヘルパーウイルスは、AAVベクターの複製及びヘルパープラスミド由来のAAV遺伝子の発現を促進する。ヘルパープラスミドは、ITR配列の欠如のため、大量にパッケージングされない。アデノウイルスでの汚染を、例えば、AAVよりもアデノウイルスの方が反応しやすい熱処理によって減少させることができる。
多くの遺伝子治療用途において、遺伝子治療ベクターを高度の特異性で特定の組織型に送達することが望ましい。ウイルスベクターは、典型的には、ウイルスの外面にウイルス被覆タンパク質を有する融合タンパク質としてリガンドを発現することによって、所定の細胞型に対する特異性を有するように修飾される。リガンドは、目的とする細胞型上に存在することで既知の受容体に対する親和性を有するように選択される。例えば、Han et al.,Proc Natl Acad Sci USA 92:9747−9751(1995)は、モロニーマウス白血病ウイルスを、gp70に融合するヒトヘレグリンを発現するように修飾することができ、かつ組換えウイルスが、ヒト上皮成長因子受容体を発現するある特定のヒト乳癌細胞を感染させることを報告した。この原理を、リガンド融合タンパク質を発現するウイルスの他の対、及び受容体を発現する標的細胞にまで拡大することができる。例えば、繊維状ファージを、事実上任意の選択される細胞受容体に対して特異的結合親和性を有する抗体フラグメント(例えば、FAB又はFv)を示すように遺伝子操作することができる。上述の説明は、主に、ウイルスベクターに適用されるが、同一の原理を非ウイルスベクターにも適用することができる。そのようなベクターを、特定の標的細胞による取込みを好むと考えられる特定の取込み配列を含有するように遺伝子操作することができる。
遺伝子治療ベクターを、以下に記載されるように、個々の患者への投与によって、典型的には、全身投与(例えば、静脈内、腹腔内、筋肉内、皮下、若しくは頭蓋内注入)、又は局所適用によって、インビボで送達することができる。あるいは、ベクターを、個々の患者から外植される細胞(例えば、リンパ球、骨髄穿刺液、組織生検)、又は万能ドナー造血幹細胞等の細胞にエクスビボで送達することができ、通常、ベクターを組み込んだ細胞の選択後に、患者への細胞の再移植が続く。
診断、研究、又は遺伝子治療のためのエクスビボ細胞トランスフェクション(例えば、宿主生物へのトランスフェクトされた細胞の再注入を介する)が、当業者に周知である。好ましい実施形態では、細胞は、TALE融合核酸(遺伝子又はcDNA)でトランスフェクトされた対象の生物から単離され、対象の生物(例えば、患者)に戻して再注入される。エクスビボトランスフェクションに好適な種々の細胞型が、当業者に周知である(例えば、Freshney et al.,Culture of Animal Cells,Manual of Basic Technique(3rd ed.1994)、並びに患者からの細胞の単離及び培養方法に関する議論について引用される参考文献を参照のこと)。
一実施形態において、幹細胞は、細胞トランスフェクション及び遺伝子治療のために、エクスビボ処置において使用される。幹細胞を使用する利点は、それらを、インビトロで他の細胞型に分化することができるか、又はそれらが骨髄に移植する哺乳動物(細胞のドナー等)に導入することができることである。GM−CSF、IFN−ガンマ、及びTNF−アルファ等のサイトカインを使用して、臨床的に重要な免疫細胞型にCD34+細胞をインビトロで分化するための方法が既知である(Inaba et al.,J.Exp.Med.176:1693−1702(1992)を参照のこと)。
幹細胞は、既知の方法を使用して、形質導入及び分化のために単離される。例えば、幹細胞は、CD4+及びCD8+(T細胞)、CD45+(panb細胞)、GR−1(顆粒球)、並びにIad(分化した抗原提示細胞)等の望ましくない細胞に結合する抗体で骨髄細胞をパニングすることによって、骨髄細胞から単離される(Inaba et al.,J.Exp.Med.176:1693−1702(1992)を参照のこと)。例示的な幹細胞には、ヒト胚幹細胞(hES)、誘導性多能性幹細胞(iPSC)、造血幹細胞、間葉幹細胞、神経幹細胞、及び筋肉幹細胞が含まれる。
治療的TALEドメイン融合核酸を含有するベクター(例えば、レトロウイルス、アデノウイルス、リポソーム等)を、インビボでの細胞の形質導入のために、生物に直接投与することもできる。あるいは、ネイキッドDNAを投与することができる。投与は、分子を導入して、血液又は組織細胞と最終的に接触させるために通常使用される経路のうちのいずれかによる。そのような核酸の投与に好適な方法が利用可能かつ当業者に周知であり、2つ以上の経路を使用して、特定の組成物を投与することができるが、特定の経路は、多くの場合、別の経路よりも迅速かつ効果的な反応を提供することができる。
薬学的に許容される担体は、投与される特定の組成物、並びに組成物の投与に使用される特定の方法によってある程度決定される。したがって、以下に記載されるように、本発明の薬学的組成物の多種多様の好適な製剤が存在する(例えば、Remington’s Pharmaceutical Sciences,17th ed.,1989を参照のこと)。
薬学的組成物及び投与
TALE融合物及びTALE融合物をコードする発現ベクターを、遺伝子発現の調節のため、かつ治療的又は予防的用途、例えば、癌、虚血、糖尿病性網膜症、黄斑変性、リウマチ性関節炎、乾癬、HIV感染、鎌状赤血球貧血、アルツハイマー病、筋ジストロフィー、神経変性疾患、血管疾患、嚢胞性線維症、脳卒中等のために、患者に直接投与することができる。TALE融合タンパク質遺伝子治療によって阻害することができる微生物の例には、病原菌、例えば、クラミジア、リケッチア細菌、マイコバクテリア、ブドウ球菌、連鎖球菌、肺炎球菌、髄膜炎菌及び淋菌、クレブシエラ菌、プロテウス菌、セラチア菌、シュードモナス菌、レジオネラ菌、ジフテリア、サルモネラ菌、桿菌、コレラ菌、破傷風、ボツリヌス中毒症、炭疽菌、ペスト、レプトスピラ症、及びライム病原因菌;感染性真菌、例えば、アスペルギルス属、カンジダ種;胞子虫類(例えば、マラリア原虫)、根足虫(例えば、エントアメーバ属)、及び鞭毛虫(トリパノソーマ属、リーシュマニア属、トリコモナス属、ジアルジア属等)等の原虫;ウイルス疾患、例えば、肝炎(A型、B型、又はC型)、ヘルペスウイルス(例えば、VZV、HSV−1、HSV−6、HSV−II、CMV、及びEBV)、HIV、エボラ、アデノウイルス、インフルエンザウイルス、フラビウイルス、エコーウイルス、ライノウイルス、コクサッキーウイルス、コモウイルス、呼吸器合胞体ウイルス、ムンプスウイルス、ロタウイルス、麻疹ウイルス、風疹ウイルス、パルボウイルス、ワクチニアウイルス、HTLVウイルス、デング熱ウイルス、乳頭腫ウイルス、ポリオウイルス、狂犬病ウイルス、及びアルボウイルス、脳炎ウイルス等が挙げられる。
治療的に有効な量の投与は、治療される組織との最終接触部にTALE融合物を導入するために通常使用される経路のうちのいずれかによる。TALE融合物は、任意の好適な様式で、好ましくは、薬学的に許容される担体を用いて投与される。そのような調節剤の投与に好適な方法が利用可能かつ当業者に周知であり、2つ以上の経路を使用して、特定の組成物を投与することができるが、特定の経路は、多くの場合、別の経路よりも迅速かつ効果的な反応を提供することができる。
例えば、静脈内、筋肉内、皮内、及び皮下経路等による非経口投与に好適な製剤には、抗酸化物質、緩衝液、静菌剤、及び製剤を対象とするレシピエントの血液で等張にする溶質を含有し得る水性及び非水の等張滅菌溶液、並びに懸濁化剤、可溶化剤、増粘剤、安定化剤、及び防腐剤を含み得る水性及び非水の滅菌懸濁液が含まれる。本発明の実践において、組成物を、例えば、静脈内注入によって、経口で、局所的に、腹腔内に、膀胱内に、又は髄腔内に投与することができる。化合物の製剤は、アンプル及びバイアル等の単位用量又は多用量の密封容器で提示され得る。注入溶液及び懸濁液を、前述の滅菌粉末、顆粒、及び錠剤から調製することができる。
植物における遺伝子発現の制御
TALE融合物を使用して、病害抵抗性の増加、構造及び貯蔵多糖類、風味、タンパク質、及び脂肪酸の修飾、果実の熟成、収率、色、栄養学的特徴、貯蔵能力の向上、渇水又は冠水/浸水耐性等の形質のために、植物を遺伝子操作することができる。具体的には、油産生の強化のための作物種の遺伝子操作、例えば、油料種子において産生される脂肪酸の修飾を目的とする。例えば、米国特許第7,262,054号、並びに米国特許公開第2008/0182332号及び同第20090205083号を参照されたい。
種油は、主に、脂肪酸のグリセロールエステルであるトリアシルグリセロール(TAG)から成る。これらの植物油の商業生産は、主に、6つの主要な油料作物(大豆、油やし、菜種、ヒマワリ、綿実、及びピーナッツ)によって説明される。植物油は、マーガリン、ショートニング、サラダ油、及びフライ油として、ヒトの消費に主に(90%)使用される。残りの10%は、潤滑油、油脂化学物質、生物燃料、洗剤、及び他の工業用途等の非食品用途に使用される。
これらの用途のそれぞれにおいて使用される油の所望の特性は、特に、TAGを構成する脂肪酸中に存在する鎖長及び二重結合の数において大きく異なる。これらの特性は、膜流動性及び温度感度を制御するために、植物によって操作される。TALEドメイン融合物を使用して同一の特性を制御し、食品用途及び工業用途のために改良された特性を有する油を産生することができる。
油料種子作物のTAG中の主要な脂肪酸は、16〜18個の炭素長であり、0〜3個の二重結合を含有する。パルミチン酸(16:0[16個の炭素:0個の二重結合])、オレイン酸(18:1)、リノール酸(18:2)、及びリノレン酸(18:3)が優勢である。二重結合の数、又は飽和の程度は、結果として生じる油の融解温度、反応性、料理における性能、及び健康属性を決定する。
リノール酸(18:2)へのオレイン酸(18:1)の変換に関与する(その後、18:3の構成の前駆体になる)酵素は、オメガ−6デサチュラーゼとも称される、デルタ12−オレイン酸デサチュラーゼである。脂肪酸脱飽和経路におけるこの工程でのブロックは、ポリ不飽和油脂を犠牲にしてオレイン酸の蓄積をもたらすはずである。
一実施形態において、TALEドメイン(複数を含む)を含有するタンパク質は、大豆におけるFAD2−1遺伝子の発現を制御するために使用される。ミクロソームデルタ6デサチュラーゼをコードする2つの遺伝子が、近年、大豆からクローニングされており、FAD2−1及びFAD2−2と称される(Heppard et al.,Plant Physiol.110:311−319(1996))。FAD2−1(デルタ12デサチュラーゼ)は、大豆種子におけるオレイン酸脱飽和の大部分を制御するようである。したがって、TALE融合物を使用して、植物におけるFAD2−1の遺伝子発現を調節することができる。具体的には、油料種子中のオレイン酸(18:1)の蓄積を増加させるために、TALEドメイン融合物を使用して、大豆におけるFAD2−1遺伝子の発現を阻害することができる。さらに、TALE融合物を使用して、デルタ−9デサチュラーゼ、他の植物由来のデルタ−12デサチュラーゼ、デルタ−15デサチュラーゼ、アセチル−CoAカルボキシラーゼ、アシル−ACP−チオエステラーゼ、ADP−グルコースピロホスホリラーゼ、デンプンシンターゼ、セルロースシンターゼ、スクロースシンターゼ、老化関連遺伝子、重金属キレート剤、脂肪酸ヒドロペルオキシドリアーゼ、ポリガラクツロナーゼ、EPSPシンターゼ、植物ウイルス遺伝子、植物真菌病原遺伝子、及び植物細菌病原遺伝子等の任意の他の植物遺伝子の発現を調節することができる。
機能ゲノムアッセイ
TALE融合物は、遺伝子発現の表現型結果及び機能を決定するアッセイのための用途を有する。分析技法における近年の進歩は、集中的な大量の配列決定の試みと相まって、以前に利用可能であった分子標的よりもはるかに多くの分子標的を同定及び特性化する機会をもたらしている。遺伝子及びそれらの機能についてのこの新しい情報は、基本的な生物学的理解を加速し、治療的介入のために多くの新しい標的を提示する。いくつかの場合において、分析ツールは、新しいデータの生成に追いついていない。全体的な差次的遺伝子発現の測定における近年の進歩による例が提供される。遺伝子発現マイクロアレイ、差次的cDNAクローニング頻度、減算的ハイブリダイゼーション、及びディファレンシャルディスプレイ法に代表されるこれらの方法は、異なる組織内で、又は特定の刺激物に応答して、上方若しくは下方制御される遺伝子を非常に迅速に同定することができる。そのような方法は、形質転換、腫瘍進行、炎症応答、神経障害等の生物学的プロセスを調査するためにますます使用されている。当業者は、現在、所与の生理学的現象と相関する差次的発現遺伝子の長いリストを非常に容易に生成することができるが、個々の差次的発現遺伝子と現象との間の因果関係を実証するのは困難である。現在のところ、機能を差次的発現遺伝子に割り当てるための簡単な方法は、差次的遺伝子発現を監視する能力に追いついていない。
従来の分子アプローチを使用して、全長cDNAをクローニングし、それを哺乳類発現ベクターにサブクローニングし、かつ組換えベクターを適切な宿主細胞にトランスフェクトすることよって、候補遺伝子の過剰発現を達成することができる。このアプローチは、特に最初の候補遺伝子が単純な発現配列標識(EST)によって表されるとき、容易であるが労働集約的である。「従来の」方法による候補遺伝子の過小発現は、さらにより厄介である。アンチセンス方法及び標的化リボザイムに依存する方法は信用できず、選択された標的のほんの一部分のみにおいて成功を収めている。相同組換えによる遺伝子ノックアウトは、組換え誘導の幹細胞においてかなり有効に働くが、体細胞由来の細胞株においては非常に非効率的に働く。いずれの場合においても、同系ゲノムDNAの大きいクローン(約10kb)は、効率的に働くために、組換えのために単離されるはずである。
TALE融合技術を使用して、差次的遺伝子発現研究を迅速に分析することができる。遺伝子操作されたTALEドメイン融合物を、任意の内因性標的遺伝子を上方又は下方制御するために、手軽に使用することができる。遺伝子特異的DNA結合ドメインを作成するために、非常にわずかの配列情報が必要とされる。これは、TALEドメイン融合技術を、不十分に特性化された差次的発現遺伝子の長いリストの分析に理想的なものにする。当業者は、それぞれの候補遺伝子についてのTALEに基づくDNA結合ドメインを簡単に作製し、人工転写因子を上方及び下方制御するキメラを作成し、かつモデル系において候補遺伝子を1つずつオン又はオフに切り替えることによって、研究中の表現型上での上方又は下方制御の結果(形質転換、サイトカイン等への応答)を試験することができる。
遺伝子操作されたTALEドメイン融合物を使用して機能情報をゲノムデータに追加するこの特定の例は、単に実例にすぎない。1つの遺伝子又は複数の遺伝子の特定の上方若しくは下方制御から恩恵を受けることができる任意の実験的状況は、遺伝子操作されたTALE融合物の信頼度及び使い易さから恩恵を受けることができる。
さらに、より従来の方法によって達成することができる実験的制御よりも大きい実験的制御が、TALEドメイン融合物によって付与され得る。これは、遺伝子操作されたTALE融合物の産生及び/又は機能を、小分子制御下に配置することができるためである。このアプローチの例は、Tet−On系、エクジソン制御系、及び変異体プロゲステロン受容体を含むキメラ因子を組み込む系によって提供される。これらの系は全て、小分子制御下にZFP制御因子の機能及び/又は発現を配置することによって、小分子制御を任意の内在性遺伝子又は任意の導入遺伝子に間接的に与えることができる。
トランスジェニック生物
TALE融合技術のさらなる適用は、遺伝子発現を操作し、かつ/又はゲノムを変更して、トランスジェニック動物又は植物を産生する。細胞株と同様に、内在性遺伝子の過剰発現又はトランスジェニックマウス等のトランスジェニック動物への異種遺伝子の導入は、極めて容易なプロセスである。同様に、トランスジェニック植物の産生は周知である。本明細書に記載のTALEドメイン融合技術を使用して、トランスジェニック動物及び植物を容易に生成することができる。
遺伝子発現を操作するために遺伝子操作されたTALEドメイン融合物を使用することは、前節に記載の小分子制御系を用いる成体動物に限定され得る。TALEドメインに基づく抑制因子の発現及び/又は機能を、開発中にオフに切り替え、成体動物において意のままにオンに切り替えることができる。このアプローチは、モジュールを発現するTALE融合物の添加に依存し、相同組換えは必要とされない。TALEドメイン融合抑制因子がトランスドミナントであるため、生殖系列伝達又はホモ接合性の心配はない。これらの問題は、不十分に特性化された遺伝子候補(cDNA又はESTクローン)からマウスモデルにするのに必要とされる時間及び労働に劇的な影響を及ぼす。この能力を使用して、治療的介入のために遺伝子標的を迅速に同定及び/又は検証し、新規のモデル系を生成し、かつ複雑な生理学的現象(発生、造血、形質転換、神経機能等)の分析を可能にすることができる。キメラ標的化マウスを、Hogan et al.,Manipulating the Mouse Embryo:Laboratory Manual,(1988)、Teratocarcinomas and Embryonic Stem Cells:Practical Approach,Robertson,ed.,(1987)、及びCapecchi et al.,Science 244:1288(1989)に従って誘導することができる。
TALE融合物をコードする核酸を細胞又は胚に送達することによって、遺伝子修飾動物を生成することができる。典型的には、胚は、受精した一細胞段階の胚である。核酸の送達を、胚の核又は細胞質への微量注入を含む当技術分野において既知の方法のうちのいずれかによって行うことができる。TALE融合物をコードする核酸を、所望の場合、ドナー核酸と共送達することができる。その後、胚は、遺伝子修飾動物を開発するために当技術分野において既知のように培養される。
本発明の一態様において、目的とする遺伝子又は遺伝子座をコードする少なくとも1つの染色体の配列が編集された遺伝子修飾動物が提供される。例えば、編集された遺伝子は、転写されないか、又は適切に翻訳されないように不活性化し得る。あるいは、配列を、遺伝子の代替の形態が発現されるように編集することができる(例えば、発現タンパク質における1つ以上のアミノ酸の挿入(ノックイン)又は欠失(ノックアウト))。加えて、目的とする遺伝子は、制御領域等の挿入配列を含み得る。遺伝子修飾動物は、編集された配列に対してホモ接合性であり得るか、又はヘテロ接合性であり得る。いくつかの実施形態において、遺伝子修飾動物は、Rosa26、HPRT、CCR5、又はAAVS1(PPP1R12C)遺伝子座等の「セーフハーバー」遺伝子座に配列挿入(ノックイン)したかもしれない。これらのノックイン動物を、他の染色体遺伝子座でさらに編集することができる。いくつかの実施形態において、目的とする配列が、任意の選択マーカーなしで、かつ/又はプロモーターなしでセーフハーバーに挿入されるため、発現を駆動する内因性プロモーターに依存する。いくつかの態様において、宿主種動物に特異的なある特定の遺伝子がヒト相同体に置換されるように、遺伝子修飾動物を「ヒト化」することができる。このようにして、遺伝子修飾動物は、ヒト遺伝子(例えば、第IX因子)を発現させることによって産生され、ヒト遺伝子、タンパク質、又は疾患を研究するための動物モデル系の開発を可能にする。いくつかの実施形態において、目的とする遺伝子は、それぞれ、同族リコンビナーゼCre及びFLPの認識のために、loxP又はFRT等のリコンビナーゼ認識部位をさらに含んでもよく、目的とする挿入遺伝子(複数を含む)に隣接し得る。遺伝子修飾動物と、同族リコンビナーゼ(例えば、Cre)を発現する別の遺伝子修飾動物との交配が、挿入遺伝子を欠如する子孫をもたらすように、ヌクレアーゼ部位を含有する遺伝子を挿入することができる。
用途
開示の方法及び組成物を使用して、所望の遺伝子座で遺伝子制御を制御することができる。最適な遺伝子を、TALE反復ドメインに融合する転写制御ドメインに応じて、活性化するか、又は抑制することができる。TALE活性化因子を、分化した細胞からiPSCを産生するという目標のために、多能性誘導遺伝子に標的化することができる。これは、特定の病状のためのインビトロ及びインビボモデル開発に、かつiPSCに由来する細胞治療薬の開発に役立ち得る。
TALE融合物は、それ自体、治療薬として、特に脳又は眼等の免疫特権組織において有用であり得る。例えば、設計された活性化因子は、適切な機能(例えば、VEGF)のため、過剰発現される場合に毒性である遺伝子のために、天然スプライス変異体比を必要とする遺伝子産物の用量を増加させるのに特に有用である。設計されたTALE制御因子への一時的な曝露は、後成的変化を強要する機能ドメインの使用を介して、遺伝子発現状態の恒久的な切り替えも可能にする。この技術は、幹細胞を生成し、かつそれらの分化経路を制御するために、さらなる有用性を提供し得る。さらに、TALE融合物は、免疫抑制患者において役立ち得る。
開示の方法及び組成物を、任意の1つの遺伝子又は複数の遺伝子のゲノム編集のために使用することもできる。ある特定の適用において、方法及び組成物を、ゲノム配列の不活性化のために使用することができる。現在に至るまで、トウモロコシ及びラット等の経済的に重要な種を含む少なくとも9つの高等真核生物のゲノムへの修飾を標的とするための切断に基づく方法が使用されており、そのような機能は、以前は利用不可能であった。他の適用では、本方法及び組成物は、編集されていない遺伝子と比較して、異なる発現若しくは生物学的特性を有する遺伝子の新規の対立遺伝子形態の生成を含む、ランダム変異の生成、又はヒト化遺伝子の組込みを可能にし、次いで、細胞又は動物モデルの生成を可能にする。他の適用では、本方法及び組成物を、それらの遺伝子の新規の対立遺伝子形態を保有する動物の同定又は選択を可能にする遺伝子の定義された位置でのランダム変異を作成するために使用することができる。他の適用では、本方法及び組成物は、ゲノムの任意の選択された領域への外因性(ドナー)配列の標的化組込みを可能にする。制御配列(例えば、プロモーター)を、標的化様式で、目的とする部位において組み込むことができる。「組込み」とは、物理的挿入(例えば、宿主細胞のゲノムへ)、加えて、相同指向DNA修復中に生じる特殊化された核酸情報交換プロセスを介するドナー配列のコピーによる宿主細胞ゲノムへの組込みの両方を意味する。
ドナー配列は、shRNA、miRNA等の核酸も含むことができる。これらの小さい核酸ドナーを使用して、目的とする遺伝子へのゲノム内でのそれらの影響を研究することができる。動物遺伝子のゲノム編集(例えば、不活性化、組込み、及び/又は標的若しくはランダム変異)を、例えば、単一切断事象によって、切断後の非相同末端結合によって、切断後の相同指向修復機構によって、切断後のドナー配列の物理的組込みによって、2つの部位での切断後の2つの切断部位の間の配列を欠失させるための結合によって、コード領域へのミスセンス若しくはナンセンスコドンの標的化組換えによって、遺伝子又は制御領域を破壊するための遺伝子若しくはその制御領域への無関連配列(すなわち、「スタッファー」配列)の標的化組換えによって、又は転写物のミススプライシングを引き起こすためのイントロンへのスプライスアクセプター配列の標的化組換えによって達成することができる。いくつかの適用において、特定の位置でTALEN誘導DSBを使用して、目的とする導入遺伝子を、哺乳類又は植物ゲノム内のセーフハーバー遺伝子座に組み込むことができる。米国特許公開第20030232410号、同第20050208489号、同第20050026157号、同第20050064474号、同第20060188987号、同第20060063231号、及び国際公開第WO07/014275号を参照されたく、それらの開示は、全ての目的のために、参照によりそれらの全体が組み込まれる。これらのTALENを、標的化遺伝子操作のために、キットの構成要素として供給することもできる。
任意で新規又は非定型のRVDを有し、さらに任意でNキャップ及び/若しくはCキャップ残基に取り付けられるTALE反復ドメインは、リコンビナーゼ、トランスポザーゼ、リゾルバーゼ、又はインテグラーゼ等のDNAを操作する酵素に融合することもできる。したがって、それらのドメインを使用して、標的化トランスポゾン等のような手段及び/又は治療薬の開発を可能にするであろう標的化融合タンパク質を作製することができる。さらに、任意でNキャップ及びCキャップ残基に取り付けられるTALE反復ドメインは、ヌクレアーゼドメインに融合して、デザイナー制限酵素を作成することができる。例えば、任意でNキャップ及びCキャップ残基に取り付けられるTALE反復ドメインは、ヌクレアーゼ融合でのDNA調製物の処理が、ちょうど所望の位置で切断を生じさせ得るように、一本鎖FokIドメイン(最適なリンカーを使用して、2つのFokI切断半ドメインがともに結合される場所)に融合することができる。この技術は、標準の制限酵素では容易には着手されないDNA配列のクローニング及び操作に有用であろう。そのような系は、製造中に使用される特殊化された細胞系においても有用であろう。例えば、CHO由来の細胞株は、内因的に活性なトランスポザーゼ/インテグラーゼ系を有しない。TALEトランスポザーゼ/インテグラーゼ系を、CHO細胞における特異的標的化のために開発することができ、かつTALE DNA結合ドメインの高度な特異性のため、ノックアウト/ノックイン、ゲノム編集等に有用であり得る。
TALE融合タンパク質を使用して、所定の遺伝子座への特定のDNA結合タンパク質の結合を阻止することができる。例えば、遺伝子操作されたTALEタンパク質が宿主細胞中で発現され、それがDNA上の部位を占有するというだけの理由で、天然制御タンパク質を、プロモーターにおけるその天然標的への結合からブロックすることができ、したがって、対照タンパク質による制御を阻止する。
TALE融合タンパク質を、RNAに結合するように遺伝子操作することができる。このようにして、例えば、スプライスドナー及び/又はスプライスアクセプター部位を被覆することができ、mRNAにおける特定の位置でのスプライシングを阻止するであろう。他の態様では、TALEを、例えば、shRNA、miRNA、又はRNAi等の特定の機能的RNAに結合するように遺伝子操作することができる。
TALE融合タンパク質は、診断法において有用であり得る。例えば、本タンパク質を、ゲノム中のある特定の配列を認識するように遺伝子操作し、特定の疾患に関連することが既知の対立遺伝子を同定することができる。例えば、これらの疾患のうちの1つに罹患する可能性を決定するか、又は症状の重症度を予知するために、特定の数のTALE反復単位を有するTALE融合物を、トリヌクレオチド反復障害(例えば、ハンチントン病)を有する可能性を有する患者におけるトリヌクレオチド反復の数を測定するある種の「ヤード尺」として利用することができる。これらの融合タンパク質を、診断キットの構成要素として供給することもでき、目的とするゲノムマーカーの迅速な同定を可能にする。さらに、これらのタンパク質を、細胞から精製し、かつ目的とする遺伝子の対立遺伝子の種類の分析、mRNA発現レベルの測定等に用いる診断キットにおいて、又は診断試薬のために使用することができる。TALE融合物を、多チャンネル又は微小流体分析のために、シリコンチップ又はビーズに取り付けてもよい。
TALE融合物は、製造環境において有用であり得る。TALE転写因子融合物又はTALENを、目的とする細胞株(例えば、CHO細胞)又は藻(例えば、生物燃料の産生のため)において使用することができる。
遺伝子又はゲノム遺伝子座のTALE融合タンパク質媒介ゲノム編集についての様々な適用が存在する。本明細書に記載の方法及び組成物は、ヒト疾患のモデルの生成及び所望の特性を有する植物作物を可能にする。
本明細書において引用される全ての出版物及び特許出願は、それぞれの個々の出版物又は特許出願が、参照により組み込まれることを具体的かつ個別に示唆されるかのように、参照により本明細書に組み込まれる。
前述の発明は、理解の明瞭さのために、実例及び例証としてある程度詳細に記載されているが、本発明の教示の観点から、添付の特許請求の範囲の精神又は範囲から逸脱することなく、本発明に対してある特定の変更及び修正を行うことができることは当業者には容易に明らかであろう。
実施例1:キサントモナス・アクソノポディスからの天然TALEのクローニング
初期の設計フレームワークとしての機能を果たし得る天然TALEタンパク質を同定するために、高度の特異性、並びに哺乳類細胞における標的配列結合の証拠の両方を呈する基準の天然TALEを同定した。具体的には、12.5個のTALE反復(TALE13と称される、12個の全反復及び1個の半反復)を含有するTALEタンパク質を、以下のプライマー対:pthA d152N EcoR、ACGTGGATTCATGGTGGATCTACGCACGCTC(配列番号52)及びpthA Sac2 Rev、TACGTCCGCGGTCCTGAGGCAATAGCTCCATCA(配列番号53)を使用して、PCR増幅によって、キサントモナス・アクソノポディスからクローニングした。プライマー対を、最初は、N末端の152個のアミノ酸を切断したAvrBs3遺伝子を増幅するように設計した。これらの配列は、植物細胞への輸送に必要であるが、さもなければ機能にとっては不必要であることが以前に示されている(Szurek et al(2002)Mol.Micro 46(1)p.13−23を参照のこと)。中心タンデム反復の数の変化を有する高度に保存された配列を特徴とするいくつかのTALEタンパク質を、これらのプライマー対を用いてPCRによって単離した。hssB3.0として報告されたTALE15を除いて(Shiotani et al(2007)J.Bacteriol 189(8):3271−9)、単離した他のTALEタンパク質は、公開文献において報告されていないため、新規のタンパク質のようである。これらには、それぞれ、13、9、及び16個のTALE反復を有する、TALE13、TALE9、及びTALE16が含まれる。
(Nキャップの長さが推測された)TALE13のドメインマップが図1Aに示され、ドメインを示す配列及びタンパク質が相互作用するDNA配列を決定するアミノ酸は、この作業で使用した位置番号付けシステムの指標とともに、図1Bに示される。
実施例2:TALE13及び他のTALEの切断並びにDNA結合への影響
最大活性を提供するキャッピング配列の範囲の初期の調査として、いくつかのTALE切断を行った。これらの切断が、以下の表4に示される。
Figure 2013529083
切断の領域を、以下のように番号付けする:N末端において、終点は、最初の真のTALE反復の最初の塩基からN末端方向にアミノ酸残基の数え上げる数として表される(図1Bを参照のこと)。例えば、N+91の標識は、最初の真の反復のN末端からN末端方向に91個のアミノ酸をそのままの状態で残すN末端での切断を説明する。C末端において、終点は、最後の全TALE反復の最後のアミノ酸からC末端方向のアミノ酸の数によって表される。TALE13、クローン番号1と命名した切断番号1は、全長TALEタンパク質のN末端の152個のアミノ酸を除去させ、単一のメチオニン残基を結果として生じるN末端に付加させ、したがって、N+137終点(Nキャップ)を有し、このクローンを約2.5kbの長さにする。切断番号2も、全長TALEタンパク質のN末端の152個のアミノ酸を除去させ、単一のメチオニン残基を結果として生じるN末端に付加させ、したがって、N+137終点、並びにNLSの5’端のC末端配列下流を有し、このクローンを約2.0kbの長さにする。切断番号3は、ロイシン豊富な領域を欠失させる(ロイシン豊富な領域は、半反復のC末端であり、CキャップのC+52にまで及ぶ)ことを除いて、クローン番号2に類似しており、このクローンを約1.6kbの長さにする。切断番号4は、N末端で、R0反復配列を含むそれ以下まで欠失されたことを除いて、クローン番号2に類似しており、このクローンを約1.6kbの長さにする。切断番号5は、C末端側でのその欠失がロイシン豊富な配列(クローン番号2に類似)を含むことを除いて、クローン番号4に類似しており、このクローン約1.4kbの長さにする。このタンパク質のために同定された内因性標的部位が依然として存在していないが、全長TALE13タンパク質の推定標的配列は、TATAAATACCTTCT(配列番号54)である。切断番号6は、152個のアミノ酸をN末端から欠失させ、C末端領域において、43個のさらなるアミノ酸が欠失されたことを除いて、クローン番号2に類似している。切断番号7は、165個のアミノ酸をN末端から欠失させ、クローン番号6と同一のC末端欠失を有する。切断番号6及び番号7が以下で議論される。
標準のSELEXアッセイを切断されたTALEタンパク質上で実行し、これらのタンパク質が結合するDNA配列を同定し(SELEX方法論については、Perez,E.E.et al.Nature Biotech.26,808-816(2008)を参照のこと)、結果が、表5及び表6に示される。表5に示される実験を、標的ライブラリN18TAを用いて行った。N18TAライブラリは、以下の配列:
N18TA:5’CAGGGATCCATGCACTGTACGTTTNNNNNNNNNNNNNNNNNNAAACCACTTGACTGCGGATCCTGG3’(配列番号55)を有するDNA二本鎖を含み、Nは、4つ全ての塩基の混合物を示す。さらなるライブラリ(示されるような)は、以下の配列を含む:
N22AT:5’CAGGGATCCATGCACTGTACGAAANNNNNNNNNNNNNNNNNNNNNNTTTCCACTTGACTGCGGATCCTGG3’(配列番号59)
N21TA:5’CAGGGATCCATGCACTGTACGTTTNNNNNNNNNNNNNNNNNNNNNAAACCACTTGACTGCGGATCCTGG3’(配列番号60)
N23TA:5’CAGGGATCCATGCACTGTACGTTTNNNNNNNNNNNNNNNNNNNNNNNAAACCACTTGACTGCGGATCCTGG3’(配列番号61)
N26:5’CAGGGATCCATGCACTGTACGTTNNNNNNNNNNNNNNNNNNNNNNNNNNAACCACTTGACTGCGGATCCTGG3’
N30CG:
5’CAGGGATCCATGCACTGTACGCCCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGGGCCACTTGACTGCGGATCCTGG3’(配列番号62)
データは、塩基頻度マトリックスとして、以下の表5に示される。これらのマトリックスにおけるそれぞれの位置で、囲みは、予想されるRVD標的塩基を示し、数は、それぞれの回収した塩基の種類の相対的な頻度を示しており、1.0は、100%を示した。
Figure 2013529083
TALE13、クローン番号1のタンパク質は、N末端の152個のアミノ酸を欠如しているにもかかわらず、その結合において高度に選択的であるように見える。TALE13、クローン番号2についてのSELEXデータが、表6に示される。この図において、SELEXは、標的配列の2つの異なるライブラリで繰り返され、両方のライブラリと類似の結果をもたらした。
Figure 2013529083
クローン番号3、4、及び5を、SELEX手順に供し、コンセンサス配列は検出されなかった。したがって、TALE結合ドメインは、このアッセイにおいてコンセンサス配列を産生するために、クローン番号2からのクローンに含まれるN末端及びC末端キャップ配列を必要とするようである。Bartsevich et al.,Stem Cells 2003;21:632−7に記載されるように、本質的にDNA結合ELISAアッセイを使用して、活性についてさらなる切断を実行及び試験した。切断が以下の表7に示され、ELISA結果も含まれている。これらの切断における開始N末端は、アミノ酸152であり、上述の番号1、番号2、及び番号3の切断におけるN末端と同一である。この詳細な切断シリーズにおいて、終点は、以下の通りである。
Figure 2013529083
これらのデータは、このインビトロアッセイにおける効率的なTALE結合が、N+122〜N+137、さらにC+53〜C+95の残基を必要とすることを示唆する(N+121を含むそれ以下のNキャップ残基は、強力な結合に十分ではなく、C+52を含むそれ以下のCキャップ残基は、強力な結合に十分ではなかった)。
予備的なマッピング研究は、最適な結合活性を達成するために、キサントモナスTALEの最小のNキャップ及びCキャップ配列の推定を可能にした。N末端キャップについて、第1の真の反復の開始より前のN+122〜N+137のいくつかの数のアミノ酸を含む配列が、DNA結合活性に必要とされるようである。ラルストニアキャップの類似のキャップ例を、キサントモナスTALEに対する構造的相同性に基づいて作製することができる(以下の表8を参照のこと)。C末端キャップにおいて、太字のアミノ酸は、RVDを示す。
Figure 2013529083
実施例3:天然TALEタンパク質9及び16の結合特異性
2つのさらなる天然TALEタンパク質を、SELEX手順に供して、これらのタンパク質が結合する標的DNA配列を同定した。TALE9が、以下のDNA標的:TANAAACCTT(配列番号56)を特定する8.5個のTALE反復を有する一方で、TALE16は、以下の標的:TACACATCTTTAACACT(配列番号57)を予測する15.5個のTALE反復を有する。データは、表9及び10に示される。表9において、クローン番号2の構造のTALE9タンパク質が使用されており、結果が示されている。TALE13、クローン番号2と同様に、この実験は、第2の部分的にランダム化されたDNAライブラリで繰り返され、第1のライブラリと類似のデータをもたらした。TALE13について上で記載したように、TALE9は、その標的配列に高度に特異的である。
Figure 2013529083
表10は、N18TAライブラリを有するTALE16タンパク質についてのSELEXデータを示し、この場合もやはり、同定された標的の高度の配列特異性を実証する。
Figure 2013529083
効率的なDNA結合のための条件をさらに調査するために、さらなる切断をTALEタンパク質において行った。上の表4は、これらの切断を示す。TALE9をクローン番号6の切断において試験したとき(表11)、DNA結合特異性が維持された(表11を表9と比較)。
Figure 2013529083
実施例4:哺乳類細胞におけるTALE融合タンパク質によるレポーター遺伝子活性化
哺乳類細胞におけるTALEドメイン融合物の機能活性を調査するために、遺伝子操作されたレポーター構築物を以下のように作製した。クローニングされたTALE13又はTALE15の標的配列の1つ以上のコピーを、NheI部位とBglII部位との間のレポーター構築物に挿入し、それによって、標的を、pGL3プラスミド(Promega)中の最小のSV40プロモーターによって駆動されるホタルルシフェラーゼ発現単位から上流に配置する(図2を参照のこと)。pGL3プラスミドのプロモーター領域が図2Aに示され、TALE13の2つの予測標的部位を含有する配列が、図2Bに示される。図3に示される実験において、TALEタンパク質構築物(2つの標的を含有するレポータープラスミドとともに)(図3A)、及び内部対照としてレニラルシフェラーゼ(Promega)を含有する発現構築物を、ヒト293細胞に共トランスフェクトした。その後、それぞれのTALEタンパク質によって誘導されたホタルルシフェラーゼ活性を、トランスフェクションの2日後に分析した。複数の標的に応じて、TALE VP16融合物は、哺乳類細胞におけるレポーター遺伝子発現を相乗的に活性化することができる(図3)。さらに、図4Bに示されるように、VP16活性化ドメイン(TR13−VP16及びTR15−VP16)を付加したTALEタンパク質は、ルシフェラーゼレポーター遺伝子を活性化する。VP16ドメインを有しない天然TALEタンパク質の発現は、ルシフェラーゼを活性化しない(TR13及びTR15)。したがって、レポーター遺伝子活性化は、正しい標的がそれらの対応するTALE融合物と一致する場合にのみ観察され、転写活性化が標的化DNA結合に起因することを示唆する。
次に、TALE標的配列を、標的化プロモーターに対して遠位の位置及び近位の位置の両方に挿入した。この実験において、図5Aに示されるように、TALE13標的を使用し、4つの標的配列をプロモーターの上流(例えば「R13×4」)又は下流(「R13×4D」)のいずれかに挿入した。図5Bに示される結果は、TALE13結合部位を目的とするプロモーターに近接近して上流に配置したときに、最適活性化が見られることを実証する。
実施例5:人工TALE転写因子の構築
TALEタンパク質を転写制御ドメインに結合して、哺乳類細胞におけるレポーター遺伝子発現を調節することができることを実証した後、所望の標的特異性を有するTALE転写因子を遺伝子操作するための実験を行った。TR13 VP16のサイレント変異(すなわち、アミノ酸配列の変更を伴わないヌクレオチド配列の変更)を導入して、それぞれ、最初のタンデム反復の開始部及び最後のタンデム反復の最後部に、2つの特有の制限部位、ApaI及びHpaIを作成した。その後、これらのApaI及びHpaI部位を、合成タンデム反復をTR13 VP16骨格にクローニングするために使用し、タンデム反復に隣接する完全なN末端及びC末端配列、並びにVP16活性化ドメインを有する遺伝子操作されたTALEを生成した。
標的化配列は、NT3プロモーター配列内に配置されるGGAGCCATCTGGCCGGGT(配列番号58)であった。以前に、この配列を標的とするZFP TF23570は、内因性NTF3遺伝子発現を活性化することを示した(共同所有の米国特許仮出願第61/206,770号を参照のこと)。遺伝子操作されたTALE18アミノ酸配列のタンデム反復を変更して、目的とする標的ヌクレオチドを特定するように、TALE AvrBs3由来の17.5個のタンデム反復を、骨格として使用して、TALE18(「NT−L」とも命名された)を遺伝子操作した。遺伝子操作されたTALE18由来のDNA結合ドメインのアミノ酸配列は、以下の表12に示されており、RVDは、太字の囲みで示されている。
Figure 2013529083
先の遺伝子操作の試みにおいて使用した4つのRVD(それぞれ、A、C、G及びTを標的とする、NI、HD、NN、及びNG)に加えて、我々は、2つの自然発生タンパク質において同族標的部位グアニンで観察されたように、DNA標的部位におけるGヌクレオチドに対応する位置で、TALE反復のサブセットにNK RVDも組み込んだ(同書のMoscou et alを参照のこと)。先の実験的研究(同書のBoch et alを参照のこと)に一致して、我々は、平均して、NI、HD、NGが、それぞれ、アデニン、シトシン、及びチミンへの強い選好を示し、かつNNが、グアニンへの選好を示したが、アデニンに結合することもできることを見出した。対照的に、NK RVDは、グアニンへの強い選好を示し、少なくとも1つのグアニンを含む部位を標的とする遺伝子操作されたTALEタンパク質の改善の可能性を表す。
その後、遺伝子操作されたTALE18の17.5個のタンデム反復をコードするDNA配列を、以下のように、アミノ酸配列から誘導し、それぞれ約40ヌクレオチド長である84個の重複オリゴで合成した。最初に、全1.8kb DNA配列を11個のブロックに分け、それぞれのブロックを被覆する重複オリゴをPCRに基づく方法によって組み立て、その後、PCRをオーバーラップさせることによって、11個のブロックをともに融合させて4個のより大きいブロックにし、最後に、最も外側のプライマー対を用いてPCRをオーバーラップさせることによって、4個のブロックを組み立てて全長にした。その後、合成されたタンデム反復を配列確認し、上述のように、TR13−VP16のApaI及びHpaI部位にクローニングして、NT−3プロモーター(R23570V)を標的とする遺伝子操作されたTALE18(NT−L)の発現構築物を生成した。
その後、この遺伝子操作されたタンパク質(NT−Lと命名した)の特異性をSELEXによって決定し、結果は、以下の表13に示される。見られるように、データは、所望の配列に結合する完全に新規のTALEタンパク質を遺伝子操作することが可能であることを実証する。以下の表13にも示されるように、SELEX選択を、クローン番号6の切断(上を参照のこと)においてNT−Lでも行い、TALE9と同様に、NT−Lの特異性がこの切断内で維持されることを実証する。SELEX実験を、クローン番号7の切断においてNT−Lでも行い、DNA結合特異性が維持されたことを示した。
Figure 2013529083
次に、遺伝子操作されたNT−Lタンパク質の転写活性を、標的配列の2つのコピーを含有するルシフェラーゼレポーター構築物に対して分析した。以下の表14及び図6Aに示されるように、遺伝子操作された17.5個のタンデム反復を含有するが、その他の点ではTR13−VP16と同一である、遺伝子操作されたNT−L融合タンパク質(R23570V)が、強力なレポーター遺伝子活性化を駆動することができる一方で、タンデム反復(R0−VP16)を有しない類似の構築物は、ルシフェラーゼを活性化しない。反復に隣接するN末端又はC末端配列(それぞれ、nR23570S−dNC及びnR23570S−dNC)のいずれかの欠失が、転写活性を無効にしたため、全長タンデム反復(Nキャップ及びCキャップ)に隣接するTALE配列は、レポーター遺伝子活性化に必要とされる。nR23570S−dNCと命名された構築物は、SV40核局在化シグナル(n)を含有し、遺伝子操作されたNT−L反復(R23570)は、単一のp65活性化ドメイン(S)に融合した。この構築物は、反復のみを含有し、TALE由来のN末端又はC末端配列(dNC)は含有しなかった。構築されたnR23570SS−dNCは、2つのp65活性化ドメインを有したことを除いて、nR23570S−dNCについて記載したことと同一であった。
表14に見られるように、最も高いレベルのレポーターの活性化が、R23570V構築物で見出された。NT−L反復をN末端及びC末端キャッピング領域の不在下で使用したときに、バックグラウンドを超える活性化がこのアッセイにおいて観察されなかったことに留意する(nR23570S−dNCを偽構築物と比較)。
Figure 2013529083
次に、遺伝子操作された融合タンパク質が、哺乳類細胞中のその染色体遺伝子座において内在性遺伝子を活性化することができるかを確かめるために、構築物を用いて、内因性NTF3遺伝子を標的化した。図6Bの実験において、遺伝子操作されたNT−L(R23570V)、並びに対照構築物(R0−VP16、GFP)を、ヒト293細胞に一時的にトランスフェクトした。トランスフェクションの2日後、NT−3発現レベルをTaqman分析によって分析した。図6Bに示されるように、遺伝子操作されたNT−L(R23570V)の発現が、ヒト293細胞におけるNTF3 mRNA発現の実質的な増加につながる一方で、対照タンパク質(R0−VP16又はGFP)の発現は、NTF3発現レベルに影響を与えなかった。内在性遺伝子の発現を活性化するために、特異的に遺伝子操作されたTALEドメイン融合タンパク質を哺乳類細胞において使用したのはこれが初めてである。
さらなる例示的な構築物を作製して、TALE反復ドメインに隣接するC末端領域の278個全ての残基が活性に必要とされるかを決定した。このさらなる構築物(+95)は、TALE反復ドメインとVP16活性化ドメイン(すなわち、C+95Cキャップ)との間にC末端領域の最初の95個の残基のみを含有した。図7は、これらの2つの構築物(+278構築物は、図6においてR23570Vと称されている)の図解、及びmRNA及びタンパク質レベルでのこれらのタンパク質のNTF3活性化への影響を示す。これらの構築物のうちのより長い方の構築物(+278C末端(又は全長)ドメインを含有する)のSELEX結果も示される。図で見られるように、両方のTALE転写因子構築物は、mRNA及びタンパク質レベルの両方でNTF3発現を上方制御することができる。
VEGF、CCR5、及びPEDF遺伝子中の領域における結合に特異的な構築物も生成した。上述のように、反復ドメインを、上述の方法論を用いて、これらの標的に結合するように遺伝子操作した。これらのタンパク質の標的部位が、以下の実施例7に示される。タンパク質は、10反復DNA結合ドメイン又は18反復DNA結合ドメインのいずれかを含有した。
さらに、9.5反復NTF3特異的及び9.5反復VEGF特異的TALE DNA結合ドメインにおいて一連の切断を行った。切断は、TNT Coupled Reticulocyte Lysate系(Promega)において発現され、以下のように、DNAフラグメントに結合するために溶解物を使用した。250ナノグラムのヌクレアーゼ融合クローンプラスミドを含有する5μLの水を20μLの溶解物に添加し、かつ30℃で90分間インキュベートすることによって、タンパク質が発現された。結合アッセイを上述のように行った。標準の方法論を使用したウエスタンブロット法は、発現したタンパク質が全て同等に発現されたことを確認した。結合アッセイの結果が図8に示される。これらの実験において、N末端の切断のために、C末端アミノ酸をC+95で保持し、一方で、C末端切断のために、N末端をN+137構造で維持した。図から見られるように、このアッセイにおいて、タンパク質が、最初の真の反復のN末端側に少なくとも134個のアミノ酸、及び半反復のC末端側に少なくとも54個のアミノ酸を含有したときに、最大の結合が観察され、興味深いことに、これは、NTF3配列に標的化されたTALE DNA結合ドメイン及びVEGF配列に標的化されたTALE DNA結合ドメインの両方ともに当てはまった(パネルAとパネルBを比較)。C末端を(上で記載されるようにC+95ではなく)+54まで切断する場合に、タンパク質を使用して重要なN末端134位の周囲の切断を繰り返し、N末端を(N+137ではなく)+134位まで切断する場合に、C末端切断を繰り返した。データが図9に示され、先の実験において観察されたように、C末端を+54を超えて切断したとき、かつ/又はN末端を+134を超えて切断したときに、類似したDNA結合の減少を示す。これらのデータは、このインビトロ親和性アッセイにおける最適な結合のための最小のキャップが、N+134位及びC+54位にまで及ぶことを示す。
実施例6:哺乳類細胞におけるDNA標的化に関与するTALE機能ドメインの解離
この実施例では、以下の表15に示されるように、TALE13タンパク質N末端又はC末端での種々の欠失を生成した。
Figure 2013529083
全ての構築物を、VP16活性化ドメイン(VP16を有する構築物は「R13V」と指定される)及び核局在化シグナル(NLSを有する構築物は「nR13」と指定される)に結合させ、予測したTALE13標的の2つのコピーを含有するレポーター構築物由来のレポーター遺伝子活性化について試験した(図10、上のパネル)。
図10に示されるように、この組の構築物(表15を参照のこと)において強力なレポーター活性化活性を保持する最小の領域は、そのN末端で152個のアミノ酸及びそのC末端で183個のアミノ酸を欠如するR13V−d182Cである。結果は、最初のタンデム反復及び最後の反復に続くロイシン豊富な領域に先行するR0領域が、このアッセイにおいて最適な結合を提供する一方で、核局在化シグナル及びそのC末端で天然の活性化ドメインを含有する領域は、哺乳類細胞におけるDNA標的に不必要であることを確認する。
実施例7:ヌクレアーゼドメインに結合されるTALEのヌクレアーゼ切断活性の実証
次に、人工TALEヌクレアーゼ(TALEN)に関連したTALEのDNA標的化能力を評価した。FokIドメイン間でGGGS配列の12個のコピーによって結合されるFokIヌクレアーゼドメインの2つのコピーが、VP16活性化ドメインを置換するために使用されたことを除いて、上述のR13V−d182Cと同一であるR13d182C−scFokIと称される構築物を生成するために、実施例6で定義されるTALE13のDNA標的ドメインを、ヌクレアーゼドメインに結合させた。次に、TALEN構築物を、一本鎖アニーリング(SSA)に基づくレポーターアッセイにおけるヌクレアーゼ活性について試験した(共同所有の米国特許公開第20110014616号を参照のこと)。
このアッセイにおいて使用したレポーター構築物(図11A、SSA−R13)は、GFPコード配列のN末端部分(GF)とC末端部分(FP)との間に挟まれた予測TALE13標的を含有する。レポーターSSA−R13は単独で、GFP発現を駆動することはできないが、TALE13標的での切断は、GFPのN末端部分及びC末端部分の間で相同組換え(HR)を促進して、機能的なGFP導入遺伝子を形成する。結果が図11Bに示される実験において、(偽)TALEN構築物を有するか、又は有しないSSA−R13レポーター構築物を、先に記載されるように、K562細胞に一時的にヌクレオフェクトした。
ヌクレオフェクションの2日後、GFP陽性細胞の割合をフローサイトメトリーによって分析した。図11Bに示されるように、約7%のGFP陽性細胞を、TALEN融合によってSSA−R13レポータープラスミドから生成し(R13d182C−scFokI)、約1.4%のTALEプラスミドを欠如する対照実験(偽)と比較して、SSA−R13レポーター中のTALE13標的における切断の著しい増加を表す。
これらのデータは、TALE DNA結合ドメインを使用して、哺乳類細胞中のDNAの部位特異的切断の機能的TALENを生成することができることを実証する。
TALEドメイン融合物はまた、FokI切断半ドメインを使用して構築された。これらの実施例のために、野生型FokI半切断ドメインを使用し、したがって、ヌクレアーゼ活性のために、ホモ二量体が、融合物のうちの2つから形成されるはずである。これらの融合物について、TALE13DNA結合ドメインは、TALE DNA結合ドメインを、FokIを特定する配列に隣接するプラスミドにクローニングすることによって、それぞれのFokI半ドメインに融合した。加えて、種々のリンカーを、DNA結合ドメインとヌクレアーゼドメインとの間での使用について試験した。以下のようなリンカーL2及びL8を使用した:L2=GS(配列番号71)及びL8=GGSGGSGS(配列番号72)。それら2つが相互から2〜22bpだけ分離されるようにそれぞれの標的結合部位の間のギャップ間隔を変化させて、標的部位を、TOPO2.1標的ベクター(Invitrogen)にクローニングした。標的DNAを生成するために、標的ベクターの約1kbの領域のPCR増幅を行った。TALE DNA結合ドメインはまた、上述のように切断され、上の実施例2及び6で説明された命名法と同一の命名法を使用して説明される。TALEドメインヌクレアーゼ融合クローンを、250ナノグラムのヌクレアーゼ融合クローンプラスミドを含有する5μLの水を20μLの溶解物に添加し、かつ30℃で90分間インキュベートすることによって、TNTウサギ網状赤血球溶解物系において発現させた。
次に、溶解物を使用して、以下のように標的DNAを切断した。2.5μLの溶解物を、50ナノグラムのPCRで増幅された標的DNA及び1倍の濃度の最終緩衝液2(New England Biolabs)を含有する50μLの反応物に添加した。切断反応は、37℃で1時間であり、65℃で20分間の熱不活性化段階が続いた。その後、反応物を高速で遠心分離して、標的DNAを溶解物から分離し、溶解物を反応ウェル中のペレットに凝縮させた。DNAを含有する上清を、ピペットで吸い上げ、臭化エチジウム染色アガロースゲル(Invitrogen)上に流し、別々の無傷の標的DNAを切断された標的DNAから分離した。その後、アガロースゲルを、アルファEaseFC(Alpha Innotech)ソフトウェアを使用して分析し、切断されていない大きいDNAバンド及び標的DNAの単一の切断事象に由来する2つの小さいDNAバンド中に存在する標的DNAの量を測定した。ゲルに装填された標的DNAの総量のうち切断されたDNAの割合は、それぞれの反応における切断率を表す。
我々は、融合物を効率的な結合に必要とされる特定の領域にまで減らす目的で、TALEタンパク質の隣接領域を最小限に抑えることを所望し、余分なペプチド配列をトリミングすることは、FokI切断ドメインのより制約された付着を提供するであろうと推論し、TALENの触媒活性を改善し得る。TALE DNA結合ドメインのN末端及びC末端(配列番号73及び配列番号369)での切断を、以下に示されるように行い、切断部位は、アミノ酸配列の上に示され、予測される二次構造(C=ランダムコイル、H=ヘリックス)は、配列の下に示される。
Figure 2013529083
C末端欠失研究の結果が、図12及び図13に示される。図12は、臭化エチジウム染色アガロースゲル上で切断産物を視覚化することによる、標的配列の切断を示す。図12において、L2又はL8は、使用されたリンカーを示しており、それぞれのレーンの下の番号は、二量体の2つの標的DNA結合部位間のbpの差を示した。「S」は、活性ヌクレアーゼホモ二量体がDNAを形成することができないような1つのみの標的DNA結合部位の存在を示す。「Pmll」は、TALE結合部位の隣のクローニングされたDNA標的配列内に配置される特有の制限部位の市販の制限酵素(New England Biolabs)を使用した、切断の正の制御反応を示す。PmlI部位での切断は、クローニングされた標的部位がPCRで増幅された標的DNA中に存在することを示し、切断されたDNAのおおよその予想寸法も示す。空は、TALENが産生されないようにプラスミドをコードするTALENを有しない負の制御TNT反応を示す。データは、図13にグラフ形式で示され、タンパク質の切断活性が、少なくとも9個の塩基の長さのスペーサー用のC+28及びC+39Cキャップを伴って著しく増加することを示す。これらの実験を続け、さらなるCキャップ(C−2、C+5、C+11、C+17、C+22、C+25、C+28、及びC+63)を構築した。結果が、以下の表16に要約される。「スペーサー」は、標的部位間の塩基対の数を示し、「SC」は、標的中に1つのみの結合部位を含有する試料を示す。
Figure 2013529083
上に示されるデータに見られるように、このアッセイにおいて、融合ヌクレアーゼのように、C末端が約C+5を超えて切断されるとき、タンパク質の活性が低くなるようである。
示されるスペーサーで標的が提示されるときのさらなるC末端切断点を伴うTALE13ヌクレアーゼの切断活性も評価し、結果は、以下の表17に示される。「S」は、切断標的が、TALE13への単一の結合部位を含有したことを示す。
Figure 2013529083
TALEタンパク質のC末端領域で行われた作業と同様に、欠失は、N末端においても作製された。データが図14に示され、切断がN+137位に比較的接近して導入されるとき、N末端欠失を有するタンパク質の活性が減少することは明らかである。この図において、それぞれの列は、対応するN末端切断及び使用した別々のクローンの数で表示される。「S」は、標的において単一のみの結合部位が存在したことを示す。これらの結果の合計は、TALENがFokI半ドメイン又は一本鎖構造と相互作用することができる2つの半ドメインのいずれかに結合するときに、活性がかなり高くなり得るが、Nキャップ及びCキャップの長さは、結果として生じるTALENのDNA切断特性に影響を与えることを示す。
TALENを、哺乳類細胞中で内因性標的に結合するように構築した。10反復のNTF3結合ドメインを、上述のFokI半ドメインに結合した。加えて、NTF3特異的パートナー(rNTF3)を、標準の重複オリゴヌクレオチド構築技術を用いて商業的に構築した。合成NTF3パートナーを、C末端:C+63、C+39、及びC+28で3つの変異体を用いて作製し、TALE DNA結合ドメインを、エピトープ標識及び核局在化シグナルをC末端に、かつ野生型FokI切断ドメインをC末端に付加する標準のZFNベクターにクローニングした。これらの実験で使用した構築物の完全なアミノ酸配列が、実施例23に示される。
9.5反復のNTF3−Fok1融合物、及び18反復のNTF3特異的NT−Lタンパク質に加えて、TALENもまた、VEGF遺伝子に特異的な部位を標的とするように作製した。この融合タンパク質は、9.5個の反復単位を含有し、上述のように構築した。18反復のNT−L及びVEGF特異的TALENもまた、+28、+39、又は+63のいずれかのC末端切断で作製した。次に、これらの合成融合ヌクレアーゼを、種々の組み合わせで、上述のヌクレアーゼアッセイにおいてインビトロで使用した。基質配列が以下に示され、大文字は、種々の融合物の標的結合部位を示す。
Figure 2013529083
これらの研究の結果は、以下の表18及び表19に示される。
Figure 2013529083
表18が、それぞれのTALEN対の二重試験を示すことに留意する。例えば、試料1及び16は、TALEN単量体の同一の組み合わせである。
Figure 2013529083
「NN」は、左(NT−L)及び右(NT−R)のNTF3TALENの両方に結合する内因性NTF3標的の関連部分を指す。番号1又は番号2は、同一の構築物の異なるクローンを指す。
したがって、これらのタンパク質は、ヌクレアーゼとしてインビトロにおいて活性である。
これらのタンパク質を、上述のSSAレポーター系を使用した哺乳類細胞におけるエンドヌクレアーゼ活性のアッセイにおいても使用した。NTF3部位での切断を受けての切除が、発現能力のある完全なGFPレポーターをもたらすように、標的基質(図15Aに示される、配列番号452)を、分離されたGFPレポーター間にクローニングした。この基質は、NTF3標的配列及びCCR5遺伝子標的に特異的な標的配列の両方を含有する。図15Bは、NTF3特異的TALEタンパク質の選択を使用したこの実験の結果を示す。この実験において、以下のNTF3特異的TALEN融合物を使用した。TALE13C28L2は、C+28切断及びL2リンカーを有する上述のTALE13誘導体である。rNT3R17C28L2は、C+28切断及びL2リンカーを有する、(NT3遺伝子のコード鎖に対して逆のDNA鎖を標的とする)17.5反復のNT3特異的タンパク質である。rNT3R17C39L2は、C+39C末端を有する類似の構築物であり、rNT3R17C63L2は、C+63C末端を有する。このrNT3R17 DNA結合ドメインは、NT−Rとも称される。8267EL/8196zKKは、1対のCCR5特異的亜鉛フィンガーヌクレアーゼを用いた対照である。「−NT3R18C28L8」で表示されるデータが、(NTF3遺伝子のコード鎖に対して前方のDNA鎖を標的とする)NTF3特異的パートナーの不在下での結果を示す一方で、「+NT3 R18 C28L8」で表示されるデータは、パートナーの存在下での結果を示す。この場合、パートナーは、17.5個の反復を有し、C28位で切断され、かつL8リンカーを含有するNTF3特異的タンパク質である。図に見られるように、TALENの正しい対形成は、レポーター遺伝子の効率的な切断、したがって、レポーター遺伝子発現につながる。
実施例8:哺乳類細胞中の内因性遺伝子座を切断するための遺伝子操作されたTALENの使用
上述の二量体対を、NTF3遺伝子座に標的化し(表18を参照のこと)、その後、哺乳類細胞中の内因性遺伝子座で試験した。示される二量体対を、製造業者によって提供される標準の方法を用いて、Amaxa Biosystemsデバイス(Cologne,Germany)を使用してK562細胞にヌクレオフェクトし、トランスフェクション後に一過性の低温ショック成長条件に供した(米国出願第12/800,599号を参照のこと)。
細胞を30℃で3日間インキュベートし、その後、DNAを単離して、Cel−I分析に使用した。このアッセイは、野生型配列と比較して、試料におけるミスマッチを検出するように設計される。ミスマッチは、TALENによる切断に起因した、DNAにおける二本鎖切断の結果であり、非相同末端結合(NHEJ)のエラーを起こしやすいプロセスによって修復される。NHEJは、多くの場合、小さい付加又は欠失を導入し、Cel−Iアッセイは、それらの変化を検出するように設計される。アッセイを、以下のプライマー:LZNT3−F4:5’−GAAGGGGTTAAGGCGCTGAG−3’(配列番号80)及びLZNT3−1077R:5’−AGGGACGTCGACATGAAGAG−3’(配列番号81)で増幅された産物を使用して、例えば、米国特許公開第20080015164号、同第20080131962号、及び同第20080159996号に記載されるように行った。これらのプライマーは、内因性配列から272bpの増幅産物を増幅し、Cel−Iアッセイによる切断は、約226bp及び46bpの産物を産生する。226bpの産物が可視的である一方で、46bpの産物は、それらの寸法の理由から、ゲル上で見るのは困難である。結果が図16に示され、観察されたゲノム修飾の割合は、Cel−I酵素を含むレーンに示される。図から明らかであるように、これらの試料中で生じるヌクレアーゼ誘導変異が存在し、試料が二重に再産生可能である(例えば、レーン7とレーン22、又はレーン12とレーン27を比較)。
研究を、トランスフェクション後に37℃又は30℃のいずれかでインキュベートした細胞を使用して、対15、13、12、及び10(表18を参照のこと)で繰り返し、結果が図17に示される。最初に、NT−R TALE DNA結合ドメインを、上述のSELEXアッセイにおいて試験し、結果が図17Aに示される。K562細胞中で発現されるとき、これらのタンパク質は、Cel−Iアッセイによって明らかにされる強力な遺伝子修飾をもたらし、37℃及び30℃で試験した最も活性の高いヘテロ二量体(対12)の推定レベルは、3%及び9%であった(図17Bを参照のこと)。さらに、サンガー配列決定は、30℃の試料で分析した84個のうち7個の変異対立遺伝子を同定し、非相同末端結合(NHEJ)を介したエラーを起こしやすい切断修復に一致した変異スペクトル(少量の欠失)も明らかにした(図17C)。
これらの研究は、本明細書に記載のTALEN構造が、内因性遺伝子座で、かつ哺乳類細胞中で、効率的なNHEJ媒介遺伝子修飾を駆動することができることを示す。
これらの研究は、ヌクレアーゼドメインを、高度に活性なヌクレアーゼ機能を提供するTALE反復配列に結合させるために使用され得る組成物も明らかにする。試料を、NTF3遺伝子座で大規模シークエンシング(deep sequencing)にも供した。試料を4bpの配列でバーコード付けし、50bpの読み取り長を、Illumina Genome Analyzer機器(Illumina,San Diego,CA)において使用した。配列を、カスタムpythonスクリプトで処理した。ヌクレアーゼ活性によって誘導される二本鎖切断の結果としての非相同末端結合(NHEJ)活性の特徴として、配列を、付加又は欠失(「インデル」)の存在について分析した。結果が図18に示される。内因性遺伝子座において、これらの2つのタンパク質によって認識される標的配列の間に12個の塩基対ギャップが存在する(図18Aを参照のこと)。図18Bに示されるように、哺乳類細胞中の内因性NTF3遺伝子座に対する活性を実証する多数のインデルが存在する。図18Bにおいて、内因性遺伝子座における野生型配列は、「wt」で示される。
実施例9:TALEN切断後の内因性遺伝子座への標的組込み
NTF3でのTALE媒介標的組込みは、HDR DNA修復経路を介して、又はNHEJ経路を介して起こり得る。我々は、NHEJによる小さい二本鎖オリゴヌクレオチドの捕捉に基づいてNTF3でのTALE媒介標的組込みをアッセイする実験を設計した。我々は、先に、ZFN誘導DNA二本鎖切断(DSB)の部位でのオリゴヌクレオチドの捕捉を示した。この種の標的組込みは、ZFN対のFokI部分によって作成されるものに相補的な5’オーバーハングの存在によって強化された(が、絶対に必要ではなかった)。FokIは、4bpの5’オーバーハングを自然に作成し、ZFNとの関連で、FokIヌクレアーゼドメインは、4bp又は5bpのいずれかの5’オーバーハングを作成する。NTF3 TALENによって残されるオーバーハングの位置及び組成が未知であるため、我々は、NTF3 TALEN結合部位(NT3−1F〜NT3−9R)の間の12bpのスペーサー領域における全ての可能性のある4bpの5’オーバーハングで9個の二本鎖オリゴヌクレオチドドナーを設計した(表20を参照のこと)。
Figure 2013529083
これらのドナーは、2つの5’末端ホスホロチオエート結合を含有し、5’リン酸塩を欠如し、プライマー内部F.相補的オリゴヌクレオチド(NT3−1FとNT3−1R、例えば)に対する結合部位を、95℃まで加熱し、かつ0.1℃/分で室温まで冷却することによって、10mMのTris(pH8.0)、1mMのEDTA、50mMのNaCl中でアニールした。ドナーオリゴヌクレオチド(5μLの40μMのアニールされたオリゴヌクレオチド)を、FF−120をプログラミングするよう設定されたAmaxa Nucleofector(Lonza)を使用して、かつSF溶液を使用して、20μLのトランスフェクション混合物中で、8個の異なるTALEN対(A〜H、それぞれ400ngのプラスミド、表21を参照のこと)のそれぞれで、200,000個のK562細胞に個別にトランスフェクトした。
Figure 2013529083
細胞を、トランスフェクションの3日後に採取し、50μLのQuickExtract溶液(Epicentre)中で溶解させた。1マイクロリットルの粗溶解物を、以下に記載されるPCR分析に使用した。
我々は、内部F及びGJC 273Rプライマーを使用して、オリゴヌクレオチド及び染色体によって作成される接合部のPCR増幅によるNTF3 TALENによって作成されるDSBへのオリゴヌクレオチドドナーの標的組込みをアッセイした。オリゴヌクレオチドドナーの完全な連結に基づくPCR増幅産物の予想寸法は、染色体における切断の位置によって変化する。図19に見られるように、ドナーの組込みを、TALEN及びドナーオーバーハングの多くの組み合わせで検出した。最大のシグナルは、12bpのスペーサー領域の中心に近いCTGG及びTGGTオーバーハングで見られた。NHEJによって捕捉されるドナーを含有する内因性染色体遺伝子座を配列決定し、図20に示す。NTF3標的遺伝子座(上の二本鎖)及びこの研究のために使用されたオリゴヌクレオチド二本鎖のうちの1つ(下の二本鎖)が示され、NT−L+28及びNT−R+63に対する結合部位は、上の配列中の下線の箇所である。二本鎖(5’CTGG)を最も効率的に捕捉する切断オーバーハングも強調表示されている。また、図20Bに示されるのは、この研究のために使用された第2のオリゴヌクレオチド二本鎖である。NT−L+28及びNT−R+63に対する結合部位は、上の配列中の下線の箇所である。この第2の二本鎖(5’TGGT)を最も効率的に捕捉する切断オーバーハングも示される。次に、TALEN NT−L+28及びNT−R+63を、図20Aに示されるオリゴヌクレオチド二本鎖の存在下でK562細胞中に発現させた。次に、うまく組み込まれた二本鎖とゲノムDNAとの間の接合部を、二本鎖内でアニールする1つのプライマー及び天然のNTF3遺伝子座にアニールする1つのプライマーを使用して増幅した。結果として生じる増幅産物を、クローニング及び配列決定した。図20Cの「予想される」配列は、切断された遺伝子座へのオリゴヌクレオチド二本鎖の完全な連結に起因するであろう配列を示す。囲みは、接合配列中の二本鎖オーバーハングの位置を強調表示する。下の2つのラインは、この研究から得られた接合配列を提供する。示されるように、11個の接合配列が、切断オーバーハングへの二本鎖の完全な連結に起因した一方で、1つの接合配列は、NHEJによる修復前の切除に一致した短い欠失(12bp)を呈した。図20Dは、図20Aに示される二本鎖と比較して、1つの塩基によって変化する4bpのオーバーハングを有する、図20Bに示されるオリゴヌクレオチド二本鎖を使用したことを除いて、図20Cに示される実験の結果を示す。下の4つのラインは、この研究から得られた接合配列を提供する。示されるように、それぞれがNHEJ媒介修復前の切除に一致した短い欠失を呈する、4つのはっきりと異なる配列が同定された。
実施例10:新規のTALEタンパク質をコードする遺伝子の効率的な組み立て
天然タンパク質において見出されるTALE反復をコードするDNA配列は、それらの対応するアミノ酸配列と同程度に繰り返される。天然TALEは、典型的には、それぞれの反復の配列間に数個のみの塩基対分の相違を有する。反復DNA配列は、所望の全長DNA増幅産物を効率的に増幅することを困難にし得る。これは、天然TALEを含有するタンパク質のためにDNAを増幅することを試みるときに示されている。Mfold(M.Zuker,Nucleic Acids Res.31(13):3406−15,(2003))を使用した上のTALE反復タンパク質のDNA配列のさらなる分析は、それらが、効率的な増幅を破壊する反復配列を有するのみならず、非常に安定した二次構造も含有することを明らかにした。この分析において、第1の全反復配列をコードする核酸の5’末端で開始する配列の800個の塩基対を分析した。したがって、分析した核酸配列は、約7.5反復の配列を含有した。これらの二次構造のうちのいくつかが、図21に示される。
これらの構造は、TALE反復のうちのいずれかの間、又は隣接していない反復間で生じる。TALE反復を含有するDNA配列の効率的な増幅を提供するために、この二次構造を破壊し、かつ全長増幅産物に向けて反応にバイアスをかけるためのサイレント変異の導入を、二次構造を安定化させる働きをするTALE反復の領域において行った。その後、プライマーを、目的とするTALE配列の効率的な増幅を可能にするように作製する。次に、PCR増幅産物を、検証のために配列決定し、融合タンパク質において使用するためにクローニングした。加えて、サイレント変異を、哺乳類細胞におけるコドン最適化のためにTALEヌクレオチド配列中に作製した。類似のコドン最適化を、他の宿主細胞系(例えば、植物、真菌等)における最適発現のために使用することができる。
実施例11:TALE融合タンパク質をコードする遺伝子の迅速な構築方法
様々なTALE融合タンパク質の迅速な組み立てを可能にするために、ともに結合することができる反復モジュールのアーカイブを作成して、ほぼ任意の選択される標的DNA配列に特異的なTALE DNA結合ドメインを作成する方法を開発した。所望の標的DNA配列に基づいて、1つ以上のモジュールを選択し、PCRに基づくアプローチを介して取り出す。モジュールを、タンデムに結合し、最適な融合パートナードメインを含有するベクター骨格の中に連結する。
4つのTALE反復単位を含有するモジュールを、256個の可能性のあるDNAテトラヌクレオチド配列(例えば、1つのモジュールがAAAA標的のため、1つのモジュールがAAAT標的のため等)のそれぞれに対して特異性を有するように構築した。加えて、モジュールを、全ての64個の可能性のあるDNAトリヌクレオチド標的、全ての可能性のある64個のジヌクレオチドDNA標的、並びに4個の単一ヌクレオチド標的のためにも作成した。ジペプチド認識領域(RVD反復可変ジペプチドとも称される)について、以下のコードを使用した:アデニンの認識について、RVDは、NI(アスパラギン−イソロイシン)であり、シトシンについて、RVDは、HD(ヒスチジン−アスパラギン酸塩)であり、チミンについて、RVDは、NG(アスパラギン−グリシン)であり、R(グアニン又はアデニンへの同程度の特異性)について、RVDは、NN(アスパラギン−アスパラギン)であった。加えて、いくつかのタンパク質においてNNよりもGに対して高い特異性をもたらすように見えたため、いくつかの遺伝子操作されたTALEにおいて、RVD NK(アスパラギン−リジン)を、Gの認識について選択した。さらに、RVDのN末端の最後から2番目の位置(反復単位の11位)は、N又はアスパラギンであった(典型的には、この位置は、S又はセリンである)。このモジュールアーカイブを、任意の他のRVDを使用して拡大することができる。
完全な配列反復を有するDNAのPCR特異性、クローニング、及び操作は、厄介である。したがって、アーカイブを構築するために、多くの天然TALE反復配列を分析して、DNAレベルで反復配列を多様化する目的で、アミノ酸配列のどの部分の可変性が許容され得るかを確認した。結果が図22に示されており、文字の寸法は、所与の位置で観察された多様性に反比例し、大きい文字が、多様性への耐性が低いことを示す一方で、小さい文字は、他のアミノ酸が時々観察される位置を示す。例えば、1位で、反復単位の第1のアミノ酸であるL、すなわちロイシンは、本質的かつ不変的に観察される。しかしながら、4位で、3つの異なるアミノ酸:E、すなわちグルタミン酸、A、すなわちアラニン、又はD、すなわちアスパラギン酸が時々見出される。加えて、反復単位をコードするDNA鎖が別の反復単位とは異なる配列を有することを可能にするように、特定のアミノ酸をコードするコドンを交換することができるが、アミノ酸配列は同一のままであるように、遺伝子コードにおける重複性を活用して種々の反復モジュールをコードするヌクレオチド配列も変更した。これらの技法の全てを、DNA結合ドメインの内部が任意の所望の標的を認識し得る、遺伝子操作されたTALE DNA結合ドメインを構築するために使用することができるモジュールのプールに対して利用した。
設計者がモジュールの位置を特定することを可能にするために、そのDNA標的部位の3’末端で切断するIIS型制限酵素、BsaIを使用した。BsaIは、以下に示される配列を認識する。酵素切断後に残される切断されたDNAの「付着末端」(配列番号102〜105)も説明される。
Figure 2013529083
当業者によって理解されるように、付着末端の配列は、制限認識部位の3’側のDNAの配列に依存する。したがって、相互へのそれらの付着末端の連結は、正しい配列が存在する場合にのみ生じる。これを活用して、PCR増幅産物がBsaIで切断された時点で付着末端を認識するであろう所望のモジュールを増幅するPCRプライマーを開発した。次に、PCR産物をBsaI切断後に合わせて、ユーザによって特定される順序でのみ産物をともに連結することを可能にした。1〜16個の全TALE反復からなる最大4つのモジュールを連結する組み立てスキームが、図23に示される。使用したプライマーは、以下の通りであり、番号付けは、図に示される番号付けに対応する。列記されるプライマーを使用して、最大4つのモジュールを連結するよう意図されているが、同一の概念を用いることによって、より多くのプライマーを添加して、4つを超えるモジュールを連結することができる。
プライマー:
T1F−Bsa GGATCCGGATGGTCTCAACCTGACCCCAGACCAG(配列番号106)
T1R−Bsa GAGGGATGCGGGTCTCTGAGTCCATGATCCTGGCACAGT(配列番号107)
T2F−Bsa GGATCCGGATGGGTCTCAACTCACCCCAGACCAGGTA(配列番号108)
T2R−Bsa GAGGGATGCGGGTCTCTCAGCCCATGATCCTGGCACAGT(配列番号109)
T3F−Bsa GGATCCGGATGGGTCTCAGCTGACCCCAGACCAG(配列番号110)
T3R−Bsa GAGGGATGCGGGTCTCTCAAACCATGATCCTGGCACAGT(配列番号111)
T4F−Bsa GGATCCGGATGGGTCTCATTTGACCCCAGACCAGGTA(配列番号112)
T4R−Bsa CTCGAGGGATGGTCTCCTGTCAGGCCATGATCC(配列番号113)
この方法を使用するとき、BsaIで切断されたPCR増幅産物の連結は、「A」モジュールの3’末端が「B」モジュールの5’末端に連結し、かつ「B」モジュールの3’末端が「C」モジュールの5’末端にのみ連結することができる場合等にのみ生じ得る。加えて、連結されたモジュールがクローニングされるベクター骨格は、「A」モジュールの5’末端のみ、かつ「D」モジュールの3’末端のみが連結して、ベクターの環を完了するように、特定のBsaIで切断された付着末端も含有する。したがって、遺伝子操作されたTALE DNA結合ドメイン内のそれぞれのモジュールの位置は、ユーザによって選択されるPCRプライマーによって決定される。
現時点で、TALE DNA結合ドメインのDNA標的部位は、典型的には、標的の5’末端(R0反復によって認識される)及び標的の3’末端(R1/2反復によって認識される)のTヌクレオチドによって隣接される。したがって、ベクター骨格は、特定のモジュールを含有する連結されたPCR増幅産物が、ベクター内のR0配列とR1/2配列との間のフレームにクローニングされるように設計されている。加えて、ベクターは、融合パートナーのために、TALEタンパク質及び最適な外因性ドメインのユーザ指定のC末端ドメイン型(切断されているか、又は切断されていない)を含有する。図23に示される設計において、外因性ドメインは、TALEヌクレアーゼの産生を可能にするFokIドメインである。ベクターは、CMVプロモーター、核局在化シグナル、発現を監視するための標識、及びポリA部位等の融合タンパク質の発現に必要な配列をさらに含有する。ここで、このベクターを、ユーザの選択した細胞にトランスフェクトすることができる。加えて、異なる細胞系に所望され、かつ/又は必要とされる選択マーカー、ドメイン、又は他の遺伝子を含有するように、ベクターをさらに修飾することができる。
実施例12:特定の内因性TALENの設計及び特性化
TALEN設計方法を評価するために、我々は、ヒトCCR5遺伝子内のデルタ32変異(以下に太字下線で示される)の位置付近でのTALEN媒介遺伝子修飾の実証に努めた(Stephens JC et al,(1998)Am J Hum Gen 62(6):1507−15を参照のこと)。この研究のために、我々は、16個の二量体標的(配列番号114〜122)のパネルを定義した、デルタ32の位置で4つの「左」及び4つの「右」結合部位(以下を参照のこと)のクラスターを指定した。
Figure 2013529083
このパネル内で、個々の標的を、5〜27bpの範囲のギャップ寸法で分離した。記載される全てのタンパク質において(特に注記されない限り)、「T」を特定するRVDがNGであり、「A」を特定するRVDがNIであり、「C」を特定するRVDがHDであり、かつ「G」を特定するRVDがNNであるように、TALENタンパク質を、実施例11に記載の方法を使用して組み立てた。次に、2つの代替のタンパク質を、それぞれの標的のために生成し、48個又は83個のいずれかの残基のC末端セグメントを有した。最後に、「左」及び「右」のタンパク質の全ての一対組み合わせ(8×8=合計64)を、K562細胞中で発現させ、内因性遺伝子座の修飾についてアッセイした。以下の表22を参照されたい(3日目及び10日目)。
Figure 2013529083
標的部位が様々なギャップ寸法を含有したため、最も高い活性を示すヌクレアーゼに関するデータを、2つの標的部位の間の距離について分析することもできる。標的部位のギャップ寸法を示すことを除いて上の表22のパネルに類似したパネルが、以下の表23に示される。
Figure 2013529083
したがって、表22及び表23のデータを比較して、これらの対が最も高い活性を示すギャップ寸法の範囲が、12〜21bpを含むが、11bp未満又は23bpを超えるギャップを除外するかを決定することができる。
我々のTALEN構造が、他の主要な細胞DNA修復経路:相同指向性修復(HDR)を介して遺伝子編集を誘導できることを実証するために、従前の研究において導入遺伝子組込みのための可能性のあるセーフハーバーとして有望であることが示された(Lombardo et al(2007)Nat Biotechnol 25:1298−1306を参照のこと)CCR5内の第2の遺伝子座(遺伝子座162と命名した)を標的とした。4つの「左」及び4つの「右」の結合部位を指定し(以下の配列番号123〜131を参照のこと)、2つの代替のTALENをそれぞれのために構築し(+28及び+63変異体)、Cel−Iアッセイ(配列番号370〜379)を使用して、+28/+28及び+63/+63対形成をNHEJ媒介遺伝子修飾についてスクリーニングした。
Figure 2013529083
以下の表24に示されるように、試験した24個の対のうち16個の対が、最大21%のレベルの検出可能な修飾をもたらした。
Figure 2013529083
次に、BglII制限部位を有する46bpの挿入を標的化された遺伝子座に導入するように設計されたドナーDNAフラグメントを用いて、2つの活性の最も高い対(L172+28/R185+28及びL161+63/R177+63)をK562細胞に導入した。使用したドナー配列は、実施例23に示される。
挿入後、組み込まれた標識ドナー配列は、5’−5’TCATCTTTGGTTTTGTGGGCAACATGCTGGTCATCCTCATCTAGATCAGTGAGTATGCCCTGATGGCGTCTGGACTGGATGCCTCGTCTAGAAAACTGCAAAAGGCTGAAGAGCATGACTGACATCTACCTGCTCAAC−3’(配列番号177)であり、特有のBglI制限部位に下線を引いた。
ドナー挿入がHDRを介して生じる場合、挿入部位を含有する領域をPCR増幅し、その後、BglI消化に供することができ、以下に示されるように、上の鎖が、標的部位の配列(配列番号133)を示し、下の鎖(配列番号134)が、標識ドナーを挿入させる標的の配列を示す。上の鎖の下線を引いた配列がTALEN結合部位を示す一方で、下の鎖の下線を引いた配列は、BglI 制限部位(配列番号445〜450)を示す。
Figure 2013529083
図24に示されるように、挿入を含有するクローンのPCR産物は、BglI消化後に2つのフラグメントを有した。PCR及びBglI消化スキームが図24Aに示される一方で、結果が図24Bに示され、極めて効率的な編集を明らかにした。したがって、我々のTALEN構造は、内因性遺伝子座でHDRを介して効率的な遺伝子修飾を誘導した。
実施例13:選択されたTALEN構造のギャップ間隔選好の試験
2つの好ましいTALEN構造(C+28Cキャップ又はC+63Cキャップ対)のギャップ間隔選好を試験するために、ギャップ間隔に従って、C+28/C+28又はC+63/C+63の対形成を含有する全てのTALEN対を活性について分類した。結果が図25に示され、小さい方のTALENタンパク質、C+28/C+28対が、より制約されたギャップ間隔選好を有し、標的配列が12個又は13個の塩基対のギャップで分離される標的において最も高い活性を示すことを実証する。逆に、図25Bに示される大きい方のTALENタンパク質、C+63/C+63対は、12〜23個の塩基対のギャップ間隔を含有する標的において活性を示す。
実施例14:ヌクレアーゼドメインを高度に活性なヌクレアーゼ機能を提供するTALE反復配列に結合させるために使用することができる組成物の体系的マッピング
ヌクレアーゼドメインを高度に活性なヌクレアーゼ機能を提供するTALE反復配列に結合させるために使用することができる組成物の体系的マッピング。最初に、1つのTALEN対を、2つの結合ドメイン間の定義されたギャップ間隔を有する単一の標的に対して選択した。選択したTALEN対は、CCR5遺伝子に特異的であり、かつ18個の塩基対ギャップ間隔を有する、L538/R557対として実施例12に記載されるものであった。一連の切断がC−2〜C+278のCキャップをもたらすように、欠失を上述のように行った。
Figure 2013529083
次に、Cel−Iミスマッチアッセイを用いてK562細胞におけるヌクレアーゼ活性を分析するために、これらの切断を使用した。結果(%NHEJ)は、以下の表25及び図26に示される。
Figure 2013529083
データは、Cキャップが約C+63であるとき、言い換えると、ペプチドLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVA(配列番号451)を使用して、結合全長TALE反復の配列をFokI切断ドメインに結合させるときに、この内因性標的に対するこのヌクレアーゼ対のピーク活性が生じることを実証する。この実験において、ヌクレアーゼを前述のようにK652細胞中で試験し、細胞を30℃又は37℃のいずれかでインキュベートした。C+63Cキャップの活性比のおおよその推定は、C+278と比較して、37℃でのインキュベーションでは20倍を超え、30℃のインキュベーションでは6倍を超えた。
ヌクレアーゼドメインを内因性遺伝子座での高度に活性なヌクレアーゼ機能を可能にする全長TALE反復の配列に結合させるために使用することができる組成物をより細かく特性化するために、さらなる切断を構築した。30個のCキャップ:C−41、C−35、C−28、C−21、C−16、C−8、C−2、C−1、C+5、C+11、C+17、C+22、C+28、C+34、C+39、C+47、C+55、C+63、C+72、C+79、C+87、C+95、C+109、C+123、C+138、C+153、C+183、C+213、C+231、及びC+278を含む、一連の微細な切断を組み立てた。我々のCキャップ表記法が残基−20で開始することに留意する。したがって、C−41、C−35、C−28、及びC−21は、Cキャップを完全に欠如し、かつ20、14、7、又は0個の残基を最後の34個の残基の全TALE反復のC末端から除去した構築物を示す。構築物の対を、標的部位の間に以下のギャップ間隔:0、2、4、7、10、14、18、23、28、及び34個の塩基対を用いて、適切な標的部位に対して試験した。対を、SSAアッセイにおいてレポーター遺伝子に対して、並びに哺乳類細胞において内因性遺伝子座に対して試験した。Cキャップが以下に説明されており、説明図は、TALE DNA結合ドメインの最後の全反復で開始し、かつC末端に向かう点を示す。
Figure 2013529083
実験のための標的部位が以下に示され、7bpのギャップ間隔を有する対を説明する。−C−16、C−21、C−28、C−35、及びC−41Cキャップ構築物が、対中のそれぞれのTALENの半反復においてRVDを除去し、かつそのような構築物が、同一の標的DNA配列に対して9bpのギャップ間隔を効果的に有することに留意する。試験した全ての他のギャップ間隔の標的部位を、試験されるギャップ間隔に応じて、標的間の塩基対を除去するか、又はさらなる塩基対を挿入するかのいずれかによって構築した。
Figure 2013529083
TALENタンパク質をコードする遺伝子を、実施例11及び12に記載されるように組み立て、Cel−Iアッセイによって評価した。データは、以下の表26Aに示される。示されるように、本明細書に記載のTALEタンパク質は、全長TALEタンパク質と比較して、内因性遺伝子座に対する機能性の完全な喪失なく、それ自体が半反復及びTALE反復ドメインに及ぶ切断を含む、C末端切断に耐えることができる。
Figure 2013529083
加えて、C末端切断を、以下の実施例19に記載されるように、DLSSAアッセイにおいて、レポーター遺伝子に対して試験した。これらの実験において、CCR5特異的TALENの4つの対を、これらの対の標的部位がDLSSAレポータープラスミドに組み込まれたレポーター系において使用した。4つのTALENの結合部位が上に示されており、TALENを、4つの対、L543+R551(対1)、L538+R551(対2)、L543+R557(対3)L538+R557(対4)として使用した。ギャップ間隔は、対の結合部位間のヌクレオチドの挿入又は欠失によって変化した。データは、以下の表26B〜Eに示され、数値は、DLSSAアッセイによって検出された相対的な蛍光強度、ひいては切断の程度を示す。全ての試料を、その結合部位がDLSSA挿入においても存在する対照TALEN対に対して標準化した(正の対照)。負の対照は、TALENの不在下で行われたアッセイである。レポーター番号4は、正確なDNA結合配列及び内因性配列と同一のギャップ配列を有し、したがって、内因性遺伝子座におけるCel−Iデータと比較することができる。レポーター番号4からの4つのTALEN対のDLSSAデータは、表26Aに示される。これらのデータは、レポーター系を用いて見出された結果の間の一般的な相関関係を説明しており、内因性標的において観察された結果は近似しており、したがって、レポーター系は、任意の内因性アッセイにおいて試験する候補ヌクレアーゼのためのスクリーニング手段として有用である。これは、系において貴重なモデル細胞を用いて作業する場合、あるいは標的細胞型が利用不可能であるか、又はスクリーニング目的での使用が困難であるかのいずれかの場合に有用な手段である。これはまた、標的配列が内因性ゲノム内で利用不可能である場合に、TALEN技術基盤を開発かつ最適化するのに有用な手段である。活性ヌクレアーゼをDLSSAによって同定し、その後、最終評価のために内因性系に入れることができる。
Figure 2013529083
Figure 2013529083
Figure 2013529083
Figure 2013529083
したがって、Cel−I及びDLSSA結果は、適切なCキャップが使用され、かつNキャップが存在するときに、これらのタンパク質が、実質的かつ強力な活性を有することを示す。さらに、ギャップ間隔は、より大きいギャップ間隔と比較して、C末端切断のより小さいサブセットを伴って活性を示すより小さいギャップ間隔で観察される最大活性に影響を与え得る。我々は、相対的なDLSSA活性が、同一の温度(37℃)で得られた同一のTALENに対して、内因性活性と直線的に関連するようには見えないことにも留意する。レポーターの結果は、C+153、C+183、C+213、C+231、及びC+278Cキャップを有する構築物に対して、ヒト細胞の天然の内因性遺伝子座において観察された活性よりも著しく高度の相対的な活性をもたらす。したがって、レポーター系、さらには哺乳類細胞中のレポーター系における活性は、哺乳類細胞中の天然の内因性遺伝子座における活性を必ずしも予測しない。
実施例15:新規の(非定型)RVD
代替の(非定型)RVDを調査して、DNA結合特異性を決定する位置の他のアミノ酸を変更することができるかを決定した。その結合活性は、SELEX及びELISAによって中央位置でのミスマッチに敏感であると示されたTALE結合ドメインを構築した。このタンパク質は、配列5’−TTGACAATCCT−3’(配列番号178)に結合し、配列5’−TTGACCATCCT−3’(配列番号179)、5’−TTGACGATCCT−3’(配列番号180)、又は5’−TTGACTATCCT−3’(配列番号181)に対してわずかな結合活性示した(図27に示されるELISAデータ)。これらの標的は、中間の三重核酸を意味するCXA標的と称され、Xは、A、C、T、又はGのいずれかである。
その後、このTALE骨格を使用して、6位の塩基を標的とするTALE反復に対する代替のRVD(アミノ酸12及び13)のDNA結合特異性を特性化した。このRVDをコードする2つのコドンをランダム化し、クローンを配列決定することによってスクリーニングして、完全な反復単位が存在することを確実にした。次に、正しいクローンを、標的配列4つのバージョンに対するDNA結合ELISAで分析し、それぞれの配列は、新規の(すなわち、非定型)RVDが相互作用するであろう位置(すなわち、TTGACATCCT(配列番号178)、TTGACATCCT(配列番号182)、TTGACATCCT(配列番号183)又はTTGACATCCT(配列番号184))において、A、C、T、又はGのいずれかを有した。これらの研究の結果は、以下の表27Aに示されており、このアッセイが、RVD VGがTと特異的に相互作用することができ、RGがTと相互作用することができ、TAがTと相互作用することができAAがA、C、及びTと相互作用することができることを同定したことを実証する。
Figure 2013529083
これらの最初の研究後に、全ての可能性のあるRVD組み合わせで分析を行い、高い活性及び特異性を有するいくつかのRVD組み合わせを同定した。加えて、試験した全ての塩基に同等にうまく結合するRVDを同定した。データが、数値形式で以下の表27Bに示され、図28にも示される。以下に示されるデータにおいて、全てのデータを、バックグラウンドELISAシグナルを差し引くことによってバックグラウンド修正し、その後、CAA部位を有するNI、CCA部位を有するHD、CGA部位を有するNN、及びCTA部位を有するNGの平均値に標準化した。
Figure 2013529083
Figure 2013529083
Figure 2013529083
Figure 2013529083
Figure 2013529083
このデータは、データが20×20のグリッドで示される図28にも示されている。RVDの第1のアミノ酸(12位)は、グリッドの左に示され、RVDの第2のアミノ酸(13位)は、グリッドの上に示される。それぞれのグリッド中の文字A、C、G、及びTの寸法は、それぞれ、CAA部位、CCA部位、CGA部位、及びCTA部位に対して標準化されたELISAシグナルの平方根に基づいて寸法決定されている。囲まれたRVDは、キサントモナスによってコードされるTALEタンパク質において見出される頻繁に生じる天然RVDを示す。多くのRVDは、自然発生HD、NI、NG、NS、NN、IG、HG、及びNK RVDに対して、DNA結合特性を改善した。例示的な新規のRVD及びそれらの同族ヌクレオチド塩基は、Nが全ての塩基との正の相互作用を表す部分を含む。
A:RI、KI、HI
C:ND、KD、AD
G:DH、SN、AK、AN、DK、HN
T:VG、IA、IP、TP、QA、YG、LA、SG、HA、NA、GG、KG、QG
N:KS、AT、KT、RA
既知のRVDの分析を介してRVD配列を候補となる新規の結合剤であると仮定される特定の配列に意図的に変更する研究にも着手した。したがって、以下のRVDを試験した。
Figure 2013529083
オリゴヌクレオチドを、上述のTALE構築物の特定の変更を可能にするように作製した。その後、これらの特定のオリゴヌクレオチドを発現ベクターにクローニングし、実施例11に記載されるように組み立て、結果として得られるタンパク質抽出物を、DNA結合ELISA及びSELEXで分析して、RVDの結合特性を決定する。
非定型のRVDを含むこれらのTALE DNA結合ドメインのうちの12個を、上述のSELEX分析に供した。SELEX分析の結果が、以下の表28に示される。表において、天然RVDについてのデータ(縦列の「RVD」中の太字)は、例示的な新規のRVDとともに示されており、多くの場合において、新規のRVDが、天然RVDと比較して、同等又はより高い標的化された塩基に対する選好を実証することを示す。
Figure 2013529083
Figure 2013529083
Figure 2013529083
Figure 2013529083
次に、これらのRVDを、全長TALENに関連した活性について試験した。実施例12に記載のCCR5特異的TALENとの比較のために、CCR5特異的18反復TALENを、全ての新規のRVDを用いて産生した。このTALEN対の標的部位が、以下に再び示される。101041TALEN単量体が修飾されたパートナーであった一方で、101047パートナーには全ての天然RVDが残された。
Figure 2013529083
加えて、典型的なRVD及び新規の(非定型)RVDの両方を含むCCR5特異的TALENも、新規のRVDが全て1つの種類に置換された、例えば、全てのRVDが「T」又は「A」を認識するCCR5特異的TALENにおいて構築した。典型的なRVDについて先の実施例11及び12に記載されるコード、すなわち、A=NI、C=HD、G=NN、T=NGを使用した。新規のRVDについて、この初期分析において、以下を試験した:A=HI、NI、又はKI、C=ND、KD、cND、G=SN、AK、DH、cHN、KN、T=TP、IA、VG、SGgs、又はIP。小文字が使用されるとき、これらは、RVD位置に隣接した位置の変更を示し、例えば「cND」は、反復単位中の11位、12位、及び13位が変更されたことを示す。これらの研究のために、候補RVDを、表27Bに示されるデータによって選択し、主要タンパク質の証拠を作成するために使用した。さらなるTALEタンパク質を、全一式からの代替の非定型のRVDを用いて構築することができる。加えて、非定型のRVDを、塩基を特定するRVDの混合物を作成することができるように選択することができる(例えば、1つのTALENタンパク質を、TP及びIA RVDの両方を用いて構築して、異なる位置で「T」を特定することができる)。
反復単位のRVD配列が以下の表29A〜29Cに示されており、全ての変異した位置が太字フォントで示される。
Figure 2013529083
Figure 2013529083
Figure 2013529083
その後、これらの新規のTALENを、30℃及び37℃での内因性CCR5遺伝子座に対する切断活性について試験し、前述のCel−Iアッセイで分析し、NHEJの誘導に活性であることを示した(例えば、図30を参照のこと)。表示されていないレーンは、フレームシフト変異を伴う非機能TALEN構築物を表すことに留意する。
結果は、新規の(非定型)RVDが、それぞれのTALE反復単位が新規のRVDを含むTALENタンパク質、並びにタイプ置換されたか、又は単独に置換されたTALENにおいて使用されるときに、DNAを切断することができることを示す。
実施例16:新規のTALEC末端半反復
天然TALEの大部分は、Tヌクレオチド塩基との相互作用を特定するために、C末端半反復中のNG RVDを使用する。したがって、新規のC末端半反復の生成を調査して、TALE標的の拡大を可能にした。Pou5F1及びPITX3遺伝子を標的とするTALENを、バックボーンとして使用し、C末端半反復内のRVD(Cキャップアミノ酸C−9及びC−8)を変更して、代替の核酸を特定した。これらの変異体中に、Aを認識するためにNI RVDを、Cを認識するためにHDを、Gを認識するためにNKを挿入し、対照は、Tを認識するためのNGであった。使用したTALENは、15〜18個のRVDを含有し、これらの2つの遺伝子中の様々な標的配列を標的とした。
結果が図29に示され、C末端半反復中のRVD位置を、Tのみ以外のヌクレオチド塩基と相互作用するように遺伝子操作することができるか、又は全ての塩基を同等に認識するように設計することができることを実証する。レーン割り当て、標的配列、及びこのCel−Iアッセイにおいて測定されたNHEJの%が、以下の表30に示される。
Figure 2013529083
このデータは、新規の半反復を有するTALENが、それらのそれぞれの標的を切断することができることを実証する。
実施例17:最適な標的配列の同定
最適な標的配列、ひいては最適なTALENタンパク質設計を決定するために、複数のSELEXアッセイからの結果を使用してインシリコ分析を行い、i)R1反復(N末端反復)単位の最良の標的、かつii)二量体及び三量体環境において、それらの隣接する反復単位と関連して、特定のRVD反復がどのように挙動するかを決定した。これらの研究において、Aを認識するためにNI RVDを、Cを認識するためにHDを、Gを認識するためにNNを、Tを認識するためにNGを使用した。
結果は、表31、32及び33に要約されている。表31中の値は、標的塩基の観察された頻度と偶然に予想したその塩基の頻度(すなわち、0.25)との間の比率の対数(4進法)として計算されたログオッズスコアである。1.0のスコアは、標的塩基が100%の確率で観察された(すなわち、偶然予想した頻度よりも4倍頻度が高い)ことを示し、0.0のスコアは、標的塩基が25%の確率で観察されたことを示し、負のスコアは、標的塩基が25%未満の確率で観察されたことを示す。表31の値は、62個の別々のTALEタンパク質からのSELEXデータから成るデータセットの適切な位置の平均の塩基頻度から計算された。「R1 RVD」で表示される値は、N末端TALE反復(及びそれぞれの結合部位における同族位置)を指す。「R2+RVD」で表示される値は、全ての他のRVD(及びそれぞれの結合部位における同族位置)を指す。このデータは、全ての他の位置に対するN末端位置における、HD、NN、及びNG RVDを有するTALE反復の特異性の劇的な差異を示す。
表32及び33に示される値は、二量体(表32)又は三量体(表33)のいずれかの環境におけるスコアに対する、それぞれの塩基について独立して決定されたそれらのログオッズスコアの変化を表し、67個の別々のTALEタンパク質についてのSELEXデータから決定した。したがって、HD RVDに隣接したNN RVD(NN RVDが構築物のN末端により近く、HD RVDが構築物のC末端により近い)の−0.12値は、これらの2つのRVDが相互に独立して挙動する場合、二量体における両方の位置のログオッズスコアの合計が、予想よりも0.12低いことを示す。同様に、表33Cの−0.34値は、第2のNN RVD付近のN末端側に隣接され、かつHD RVD付近のC末端側に隣接されるNN RVDが、目的とするNN RVDが全てのNN RVDの平均値よりも0.34低いログオッズスコアを有することを示すことを表す。表32、33A、33B、33C、及び33Dの負の値は、相互から完全に独立している場合よりも不十分に機能する隣接RVDの組み合わせを示す。
Figure 2013529083
Figure 2013529083
Figure 2013529083
Figure 2013529083
Figure 2013529083
Figure 2013529083
注記:表33A〜33Dにおいて、斜字体は、データセットにおける3つ未満の値を示し、全ての他の数は、確率変化を決定するために使用される少なくとも3つの値を含有する。
これらの結果は、最適な反復単位結合への文脈依存が存在することを実証し、最適なタンパク質設計/標的同定のために、反復単位は完全にはモジュール式ではないこと示す。概して、これらのデータを使用して、特定のTALEの標的選択及び最適なTALENの設計の両方を最適化する設計ルールを提案することができる。例えば、NIは、文脈依存の最も低いRVDであり、R1位置での最良のRVDは、NIであるように見受けられる(例えば、理想的には、標的部位は、R0及びR1−NIを収容するためにTAで開始すべきである)。AC、AT、CC、CA、TA、AAが、標的とするのに最善の二量体である一方で、GG、GC、AG、TT、CG、GT、及びTCは、最悪の二量体であるように見受けられる。三量体に関して、AAC、ATG、GCA、ATA、ACG、及びATCが、標的とするのに非常に良好な三量体である一方で、GGC、AGC、TGC、TTT、GGA、AGT、GGT、GGG、TCT、GTC、CTT、及びAGGは、最悪の三量体であるように見受けられる。したがって、これらの設計ルールを合わせて、最適に結合するTALENを作成することができる。同様に、表28中のNK、AK、及びDK RVDでのSELEX研究、並びにNK RVDでのさらなるSELEX研究(図17A)は、13位でリジン(K)を有するRVDが、NK、AK、又はDK RVDに対して隣接するNI RVD C末端に、AではなくGを特定させる傾向があることを示す。したがって、典型的なRVD及びNK RVDのために決定される設計ルールは、13位で同一の残基を有する非定型のRVDにも適用されるべきである。
実施例18:ヒト幹細胞におけるTALENによって駆動された標的組込みの実証
TALEN系の多用途性を実証するために、TALENを用いて、ヒト胚幹細胞(ESC)及び誘導性多能性幹細胞(iPSC)における標的組込みを駆動した。ヒトESC及びiPSCを、ピューロマイシンマーカーの発現がAAVS1プロモーターによって駆動されるAAVS1遺伝子座への制限部位をさらに含むピューロマイシンドナー核酸の標的組込みために使用した。ドナー及び従った方法は、共同所有の国際公開第WO2010117464号において以前に説明されているドナー及び方法であった(Hockemeyer et al(2009)Nat Biotechnol 27(9):851−857も参照されたく、その中で、我々は、AAVS1遺伝子座へのそのような構築物の標的組込みの自発的頻度が、我々のアッセイの検出の限界より低いことを実証した)。使用したヌクレアーゼは、実施例11に記載のAAVS1遺伝子座に特異的なTALENであり、標的結合部位は、以下に示される:
Figure 2013529083
最初に、この遺伝子座を、正しい標的事象後にのみピューロマイシン耐性遺伝子(PURO)を内因性PPP1R12Cプロモーターの制御下で発現した遺伝子トラップアプローチを用いて標的化した。次に、PPP1R12C遺伝子座を、ホスホグリセリン酸キナーゼ(PGK)プロモーターからピューロマイシン耐性遺伝子PUROを発現した自律的選択カセットを使用して標的化した。ピューロマイシン耐性細胞のクローンを生育し、標準の方法を使用して、制限DNAに対してサザンブロットでスクリーニングした。この実験で使用したプローブは、PPP1R12C/AAVS1遺伝子座に対し、かつ組み込まれたドナーを用いて、DNAの小さい制限フラグメントである(したがって、より高い移動性を有した)配列を認識した。標的化の効率は、使用したドナーから高度に独立しており、単離クローンの約50%が、ヘテロ接合性又はホモ接合性のいずれかの正しく標的化された事象を有し、かつ所望の遺伝子座でのみ導入遺伝子を担持した。この効率は、ZFNを用いて先に観察された効率と比較できる。PPP1R12C遺伝子座を標的とすることで、導入された導入遺伝子の発現をもたらした。構成的なeGFP発現カセットをさらに担持するSA−PUROドナープラスミドを用いて標的化されたときに、強化された緑色蛍光タンパク質(eGFP)の均一発現が、hESC及びiPSCにおいて観察された。重要なことに、TALENを使用して遺伝子操作されたhESCは、多能性マーカーOCT4、NANOG、SSEA4、Tra−1−81、及びTra−1−60のそれらの発現によって示されるように多能性のままであった。
ヒトOCT4遺伝子の第1のイントロンに対するTALEN(OCT4−Int1−TALEN)も設計し、標的配列が、3つの異なるドナープラスミドと組み合わせて以下に示される:
101125:GACCCTGCCTGCTCCT(配列番号329)
101225:CACCTGCAGCTGCCCAG(配列番号330)
TALENは、+63Cキャップを利用し、典型的なRVD(それぞれ、A、C、G、及びTを標的とする、NI、HD、NN、及びNG)を使用した。101125は、15.5個のTALE反復を含み、101225は、16.5個のTALE反復を含んだ。101225は、その標的部位における3’Gを認識するために、NN RVDを有する半反復を利用した。
正しい標的化事象は、内因性OCT4プロモーターの制御下でのピューロマイシン及びOCT4エクソン1−eGFP融合タンパク質の両方の発現を特徴とする。最初の2つのドナープラスミドを、OCT4の第1のイントロンにスプライスアクセプターeGFP−2A−自己切断型ペプチド(2A)−ピューロマイシンカセットを組み込むように設計し、単に相同アームの設計の点で異なり、第3のドナーを、GFP−2A−ピューロマイシンカセットのリーディングフレームへのエクソン1の直接融合を発生させるように遺伝子操作した。両方の戦略は、サザンブロット分析及び単細胞由来のクローンのDNA配列決定によって決定されたようにOCT4遺伝子座への正しい標的化遺伝子付加をもたらした。標的化の効率は、hESC及びiPSCの両方において67%〜100%に及んだ。
TALENを使用して、hESC中で発現しない遺伝子座を遺伝子操作することができるかを試験するために、TALENを、PITX3遺伝子の第1のコーディングエクソン内で切断するよう遺伝子操作した(同一の設計並びに101125及び101225で使用した組み立て手順を使用して)。標的配列は、以下に示される:
101148:GGCCCTTGCAGCCGT(配列番号331)
101146:CAGACGCTGGCACT(配列番号332)
電気穿孔後、標的化事象を、外部の5’及び内部の3’プローブを使用して、サザンブロット分析によって評価した。ドナー指定のeGFP導入遺伝子をPITX3において単独で担持する単細胞由来のクローンを、平均して6%の確率で得た。注目すべきは、分析した96個のhESCクローンのうちの1つが、PITX3エクソン1(WI番号3)hESCの両方の対立遺伝子に導入遺伝子を担持しており、第一段階における非発現遺伝子の両方の対立遺伝子の功を奏する遺伝的修飾を実証する。
これらの結果は、幹細胞のゲノムへの標的組込みを駆動するためにTALENを使用する能力を実証する。
実施例19:インビボにおけるTALEN媒介遺伝子編集の例
カエノラブディティス・エレガンスにおけるTALENゲノム編集。インビボ遺伝子編集のためにTALENを動物において使用することができることを実証するために、以下の実験を行った。カエノラブディティス・エレガンスben−1変異に特異的なTALEN対を、RNAとして送達し、Driscoll et al((1989)J.Cell.Biol.109:2993−3003)に記載されるベノミル耐性についてスクリーニングした。ben−1変異体表現型は優性であり、通常の解剖顕微鏡下で子孫の100%において可視的である。簡潔に、野生型カエノラブディティス・エレガンス雌雄同体を、ben−1を標的とするTALENをコードするmRNAの注入前に、通常のNGM寒天プレート上で栽培した。
TALENをコードする核酸を、標準の制限クローニング手順を使用して、SP6インビトロ転写ベクター(IVT)に挿入した。ICTベクター骨格は、pJK370に由来しており、生殖細胞系翻訳を支援するために、先に示された5’及び3’UTR配列を含有する(Marin and Evans(2003)Development 130:2623−2632を参照のこと)。mMessagemMachine(登録商標)(Ambion)及びポリAテーリングキット(Ambion)を使用して、5’キャップ構造及びポリAを含有するmRNAの産生をインビトロで行い、NanoDrop分光光度計(Thermoscientific)を用いて定量化する前に、Ambion MEGAClear(商標)カラム上で精製した。Zeiss Axiovert顕微鏡下で、Narishige IM300注入器を使用してmRNA注入を行った。以下の相違点を有する標準のカエノラブディティス・エレガンスDNA注入プロトコル(Stinchcomb et al.(1985)Mol Cell Biol 5:3484−3496を参照のこと)に従って、mRNAの注入を行った:制御装置を、窒素ガスタンクからの圧力が60psiとなるように調整した。P注入及びPバランス測定を、それぞれ、15psi及び2psiに調整した。これらの圧力値は、線虫生殖腺への流体のより穏やかな放出を可能にするために、DNA注入に典型的に使用される圧力値よりも低い。全てのmRNAを500ng/μLで注入し、TALENをコードする全てのmRNAを対として注入し、したがって、針における全体のmRNA濃度は1000ng/μLであった。
mRNA注入後、動物を、7μMのベノミルを含有するプレートに移した。F1自己子孫を、若年成人として、動物の腹側に触れることによってスクリーニングした。ヘテロ接合性変異体動物が、複数の正弦曲線様の動作を用いて反転して応答する一方で、野生型動物は麻痺しており、この能力を欠如する。麻痺していないF1動物を、(上述の)標的部位のPCR/Cel−I分析のために個別に溶解するか、又は新たなベノミルプレートに個別に移すかのいずれかを行い、ホモ接合体を標的部位上で配列決定することによって、麻痺していないF2から単離した。101318/101321と指定される1つのTALEN対は、ben−1変異表現型の復帰を引き起こし、F1子孫がベノミルに耐性を示すことが見出された。ベノミル耐性動物の配列分析は、標的位置における2つの異なる正真正銘のインデルを明らかにした。このTALEN対の標的部位における遺伝子座が以下に示され、それらの配列が実施例23に示される。
Figure 2013529083
これらのデータは、TALENがインビボでゲノム編集することができることを実証する。
ラットにおけるTALENゲノム編集。次に、TALENを使用して、ラットゲノムを編集した。内因性ラットIgM遺伝子におけるエクソン2を標的とするラットIgM特異的TALEN対101187/101188を、上の実施例11及び12に記載されるように構築した。ラットゲノム中の標的配列が以下に示され、太字及び大文字は、TALE DNA結合ドメインの標的部位を示し、小文字は、ギャップ又はスペーサー領域を示す。
Figure 2013529083
次に、これらのTALEN対をコードする核酸を、Menoret et al(2010)Eur J Immunol.Oct;40(10):2932−41に記載されるようにラット胚に注入した。TALENをコードする核酸を、以下の表35に示される用量で、前核(PNI、DNA)又は細胞質内(IC、RNA)注入のいずれかで注入した。
Figure 2013529083
*注記:全ての妊娠した母親が出産したわけではなく、NDは「決定されず」である。
ある割合の注入した胚を偽妊娠した雌ラットに移植し、結果として得られる新生児をゲノム編集についてアッセイした。DNAを、前核DNA注入に起因するラットの子から単離し、Kim et al(2009)Genome Res.19(7):1279−1288に記載のT7ミスマッチ分析に供した。簡潔に、371bpのPCR産物を作成するために、プライマーセットGJC153F〜154Rを使用してPCRを行った。プライマー対が以下に示される:
GJC 153Fプライマー:5’ggaggcaagaagatggattc(配列番号453)
GJC 154Rプライマー:5’gaatcggcacatgcagatct(配列番号454)
この分析のために、標準的技法によって単離された100ngのテーリングgDNAを使用した。以下のように、5uLのPCR産物を使用して、可能性のあるヘテロ二本鎖を形成することを可能にした:95℃/95℃〜85℃(−2℃/秒)/85℃〜25℃(−0.1℃/秒)/4℃で2’。その後、これを、以下の条件下で、T7エンドヌクレアーゼI(NEBiolabs照会:M0302L)で消化した:5uLのPCRヘテロ二本鎖+1uLの10×NEB2+0.5uLのT7エンド+3.5uLのH2O/20’(37℃)。消化後、反応物を、0.5×TAE中の1.2%のアガロースゲルで電気泳動させた。分析した66匹中7匹のラットの子は、T7アッセイによるNHEJ活性に対して陽性であり(図31に示される)、配列決定は、NHEJ関連インデルの存在を明らかにした(例えば、ラット3.3における1bpの欠失及びラット3.4における90bpの欠失)。
トランスジェニック動物を生成するために、目的とする核酸を有するTALEN対を、ラット細胞への標的組込みのために使用する。TALEN対によって標的化されるラット細胞は、ラット胚幹細胞、1つ以上の細胞を持つGFPを含有するラット胚、又は誘導性多能性幹(iPS)細胞に変換できる任意のラット細胞型である。TALEN対は、細胞に送達され、CAGプロモーターを最適に含有するプラスミドDNA、5’キャップ構造及び3’ポリ−アデノシンテールを最適に有するmRNA、TALENオープンリーディングフレームをコードする核酸を含有する精製タンパク質又はウイルス粒子であり得る。ドナーDNAは、切断部位の両側に50〜1000bpの相同性を含有する一本鎖若しくは二本鎖環状プラスミドDNA、又は切断部位の両側に50〜1000bpの相同性を含有する一本鎖若しくは二本鎖環状プラスミドDNAであり得る。TALEN及びドナーは、ラット細胞若しくは胚の微量注入、電気穿孔を介してのラット細胞のトランスフェクション、脂質に基づく膜融合、リン酸カルシウム沈殿、PEI等、精製ヌクレアーゼタンパク質とのインキュベーション(例えば、細胞透過性ペプチドに融合する場合)、又はラット細胞若しくは胚のウイルス感染によって送達される。これらの方法は、当技術分野において既知である。注入又はトランスフェクトした細胞又は胚から改変ラットを生成する手段は、選択される送達方法に依存する。胚について、胚を偽妊娠したラットの子宮に移植し、前述のように出産予定日に到達させる。修飾された細胞について、3つの方法が実行可能である:a)ラット細胞が胚幹細胞である場合、ラット胚盤胞は、修飾されたラット幹細胞を注入されるべきであり、胚盤胞を偽妊娠したラットの子宮に移植し、出産予定日に到達させるか、b)細胞(又はその核)は、除核卵母細胞(体細胞核移植)に微量注入されるべきであり、結果として得られる胚を偽妊娠したラットの子宮に移植し、出産予定日に到達させるか、又はc)細胞は、iPS細胞に変換されるべきであり、ラット胚盤胞に注入されるべきである。胚盤胞を偽妊娠したラットの子宮に移植し、出産予定日に到達させる。その後、ラットの子を、PCR又は当技術分野において既知の任意の他の手段を用いて、導入遺伝子の存在についてアッセイする。
植物におけるTALENゲノム編集。トウモロコシRPD1及びC1遺伝子に特異的なTALEN対を、上の実施例11に記載されるように構築し、それらの標的配列が、RPD1遺伝子座と比較して、以下に示される(配列番号382〜387):
Figure 2013529083
C1遺伝子座に対して作製されたTALEN対が、同様に以下に示される(配列番号 388〜390):
Figure 2013529083
さらなるTALEN対を、以下のように、C1遺伝子座に対して作製した(配列番号 391〜398):
Figure 2013529083
植物特異的TALEN対を、二重ルシフェラーゼ一本鎖アニーリングアッセイ(DLSSA)を使用して、活性について哺乳類Neuro2A細胞において分析した。これは、一時的にトランスフェクトされた細胞においてZFN又はTALEN活性を定量化するために使用される新規の系であり、かつPromegaのDual−Luciferase Reporter(登録商標)Assay Systemに基づいている。実施例13を参照されたい。系は、単一の管(ウェル)内で、2つの個々のレポーター酵素、ホタル及びレニラルシフェラーゼの連続測定を可能にする。ホタル及びレニラルシフェラーゼレポーターの両方を、再び遺伝子操作し、アッセイ条件を最適化する。ホタルルシフェラーゼレポーター構築物は、ZFN又はTALENのいずれかのためにDNA結合部位によって分離されるホタルコード領域の2つの不完全なコピーを含有する。この研究において、5’コピーは、ホタル遺伝子のN末端部分の約3分の2に由来し、3’コピーは、ホタル遺伝子のC末端部分の約3分の2に由来する。2つの不完全なコピーは、約600bpの相同アームを含有する。分離されたホタルフラグメントは、ルシフェラーゼ活性を示さない。ZFN又はTALEN対によって引き起こされるDNA二本鎖切断は、一本鎖アニーリング経路によって隣接反復間の組換えを刺激し、その後、ホタルルシフェラーゼ機能を回復する。共トランスフェクトされたレニラルシフェラーゼプラスミドは、内部対照を提供する。それぞれのレポーターの発光活性は、ルミノメーター上で読み取られる。実験的レポーター(ホタル)の活性を内部対照(レニラ)の活性に標準化することは、細胞生存及び/又はトランスフェクション効率の差異によって引き起こされる実験的可変性を最小限に抑える。標準化された値を、所与のZFN又はTALEN対の活性を決定するために使用する。これは、系において貴重なモデル細胞を用いて作業する場合、又は目的とする標的細胞型が利用不可能であるか、あるいはスクリーニング目的での使用が困難である場合に有用な手段である。これは、標的配列が内因性ゲノムにおいて利用不可能である場合に、TALEN技術の基盤を開発及び最適化するのにも有用な手段である。活性ヌクレアーゼをDLSSAによって同定し、その後、最終評価のために内因性系に入れることができる。植物標的上の活性TALEN対は、以下の表35Aに示される。
Figure 2013529083
次に、標準の方法を使用して、TALEN対を、トウモロコシHi II胚に金粒子銃を介して送達した(Frame et al,(2000)In vitro cellular & developmental biology.36(1):21−29)。1つのTALEN対につき合計で約90個の授粉したトウモロコシ胚を形質転換し、ゲノムDNA抽出のために液体窒素中でプールし、かつ凍結させる前に、カルス開始培地上で約7日間成長させた。ゲノムDNAを、DNeasy Plant Miniprepキット(Qiagen)を使用して、銃を照射したプレート1枚につき4〜6個の凍結した胚から単離した。その後、それぞれのTALEN標的を、3つの生物学的三重反復からなるプールしたゲノムDNAから、High−Fidelity Phusion Hot Start II Polymerase(NEB)を使用する二段階PCRによって増幅した。第1ラウンドにおいて、それぞれの部位を、400ngのゲノムDNA及び表35Bに列記されるプライマーを使用して、20サイクルのPCRで増幅した。第2ラウンドにおいて、第1ラウンドのPCR由来の1uLの産物並びにプライマーSOLEXA−OUT−F1及びSOLEXA−OUT−R1を使用して、さらに20サイクルを行い、完全なIllumina配列決定増幅産物を生成した。その後、結果として生じるPCR産物を、Qiaquick PCR Purificationカラム(Qiagen)で精製し、それぞれ50nMに標準化し、合計8個の部位が単一のIlluminaレーンにおいて配列決定されるように同等の容積中で合わせた。未処理のゲノムDNA由来の対照増幅産物を、別々のレーンにおいて提示した。Illumina単一読み取り100bp配列決定を、ELIM Biopharmaceuticals(Hayward,CA)で行った。
Figure 2013529083
配列決定は、以下の表36に示されるように、TALEN処理された胚由来の細胞プールにおいて多数のインデルの存在を明らかにした。配列分析の詳細は、以下の通りである:TALEN処理されたトウモロコシ胚に由来するバーコード化された配列をともにプールし、100bpの読み取り長の配列決定のために、Illumina GA2シーケンサー上に提示した。偽処理されたトウモロコシ胚に由来するバーコード化された配列をともにプールし、100bpの読み取り長の配列決定のために、同一のIllumina GA2シーケンサーの別々のレーン上に提示した。それぞれの結果として得られるデータファイル中の配列をバーコードで分類し、修飾されていないゲノム配列に対して整列させた。胚のわずかの部分は、胚の大部分と比較して、C1遺伝子において3bpの挿入を含有した。予想したTALEN切断部位に集中した10bpのウィンドウ内の少なくとも2つの隣接する挿入された塩基又は欠失した塩基からなるインデルを、可能性のあるNHEJ事象と見なし、さらに処理した。所与のTALEN処理された試料及び同族の偽処理された試料の両方において同様の頻度で生じたインデルを配列決定人工物と見なし、廃棄した。
Figure 2013529083
表37は、上に示される8個の試料において最も観察されたインデルを示し、TALENが、遺伝子標的及びヌクレアーゼの全ての対の両方でNHEJを誘導することができたことを実証する。それぞれの試料について、変更されていないゲノム配列は、下線を引いた2つのTALEN結合部位の間のギャップで示される。欠失した塩基は、コロンによって示され、挿入した塩基は、波括弧によって示され、「{」は、挿入した配列の始まりを示し、「}」は、挿入した配列の終わりを示す。
Figure 2013529083
Figure 2013529083
Figure 2013529083
インデル頻度は、全ての試料において類似した(0.0087%〜0.0185%又は約11,000個の事象中1個の事象〜5,400個の事象中1個の事象)。これは、制限要素が、TALEN活性ではなくトウモロコシ胚への微粒子銃送達であることを暗示する。TALEN処理されたトウモロコシ胚に由来するバーコード化された配列をともにプールし、100bpの読み取り長の配列決定のために、Illumina GA2シーケンサー上に提示した。
次に、これらのTALENを用いて、任意の所望の目的とするDNAのTALENによって作成されるDSBへの標的組込み(TI)を駆動する。TIを、当技術分野において既知の方法を用いて、単子葉植物又は双子葉植物において達成することができる(例えば、Shukla et al(2009)Nature 459:437、及びCai et al(2009)Plant Mol Biol 69:699を参照のこと)。所望の場合、選択されたTALENのトランスジェニックの新規の植物種を安定的に生成することもでき、変異が所望される別の株へのTALEN株の交雑を可能にし、いくつかの子孫が所望の変異のみを含有し、かつTALEN導入遺伝子が分離されるように子孫の分離が続く。
したがって、これらの実施例は、本発明の新規のTALENが、植物及び動物系において、インビボでゲノム編集することができることを実証する。
実施例21:TALE反復単位の変更
TALE反復単位における変更を調査するために、キサントモナス及びラルストニアの両方からの配列を比較した。ラルストニア由来の52個の特有の反復単位を試験して、それぞれの位置における残基頻度を観察し、その後、これらの値を編集した。データが以下の表38に示され、アミノ酸は、左から右に1文字のコードで示され、反復単位の位置は、上から下に示され、RVD位置は、太字で示される。
Figure 2013529083
次に、これらの反復単位を、キサントモナス由来の反復単位と合わせて、特有の反復単位を作成することができる。ラルストニア反復において見出される残基とキサントモナス残基において見出される残基との組み合わせの反復配列は、増加したDNA結合親和性、増加したDNA結合特異性、又は低下した酸化に対する感受性等の改善された特性を有するタンパク質を産出することができる。そのような反復単位の組み合わせの例には、以下のものが挙げられ、変更された残基が太字及びより大きいフォントサイズで示されている:
Figure 2013529083
この可能性を調査するために、以下の表39に示される反復単位を構築した。表は、第1のラインに典型的なラルストニア反復単位を示し、第2のラインにキサントモナス反復単位を示す。ラルストニア由来の残基及びTALE反復の配列要件の両方を探索するように設計された他の変形の両方を含有する新規の反復が、それに続くライン上に示されている。第2のライン上の典型的なキサントモナス反復単位との違いの全てに下線が引かれている。次に、列3〜27中の太字の位置を変更することによって、反復単位を遺伝子操作した。その後、これらの新規の遺伝子操作された反復単位を、実施例15及び図27に示される新規のRVDを試験するように設計された系に置換し、結果として得られる構築物をインビトロで翻訳し、ELISAで使用した。ELISAで使用した標的配列は、Cと相互作用するために、全てのこれらの新規のフレームワーク変異体中のRVDがHDで一定に保持される、実施例15に記載の「C」変異体(例えば、TTGACATCC、配列番号182)であった。ELISA結果(3つの異なる実験の平均)が表39に示されており、全て標準の配列反復単位配列に標準化された。
Figure 2013529083
ELISA結果から見られるように、2、3、4、6、7、8、9、10、又は11位における変異を有する遺伝子操作された(例えば、新規の)フレームワークを含むTALE DNA結合ドメインの活性が減少した(2、3、4、7、及び11位における変異が、結合に最も著しく影響した)。対照的に、20、21、24、25、26、及び27位における置換の多くは、DNA結合に最小の影響を与えたか、又は実際にDNA結合を増大させたかのいずれかであった。最大の結合増大は、ラルストニア反復における21〜27位のうちの1つ以上の残基が、キサントモナス反復に置換されたときに生じた。
ハイブリッド反復単位を直列に合わせて、任意の所望のタンパク質を認識することができる新規のTALEタンパク質を作成する。これらの新規のTALE DNA結合ドメインは、ヌクレアーゼドメイン、転写制御ドメイン、又は任意の他の活性タンパク質ドメインにも結合され、DNA相互作用後の測定可能な結果を引き起こす。
実施例21:TALE亜鉛フィンガーDNA結合ドメインハイブリッドの構築
亜鉛フィンガーをTALE DNA結合ドメインに融合させて、ハイブリッドDNA結合ドメインを作成し、その後、ヌクレアーゼに結合させた。標的DNA配列が以下に示され、CCR5遺伝子内に遺伝子座を取り囲む領域を含む。結合部位の上及び下に示されるのは、TALE DNA結合ドメインの標的結合部位であり、亜鉛フィンガー結合部位は、標的配列上に太字下線で示される。太字/下線の「TAG」配列が、CCR5特異的ZFN SBS番号8267の第4のフィンガーの結合部位である一方で、太字/下線の「AAACTG」配列は、CCR5特異的ZFN SBS番号8196の第3及び第4のフィンガーの結合部位である(米国特許出願第11/805,707号を参照のこと)。以下の配列は、亜鉛フィンガーDNA標的が、DNA鎖上のTALE DNA結合ドメイン標的と隣接せず、「内部ギャップ」を作成することを示す。したがって、この種の融合は、実践者が、所望の場合、内部ギャップ領域内でDNA領域を飛ばすことを可能にする。
Figure 2013529083
以下の表40は、研究の結果を示す。これらの研究において、1つのヌクレアーゼパートナーは、7、10、又は13個のいずれかの塩基分の内部ギャップと一定に保持される。次に、クレアーゼパートナーは、4〜16個の塩基分の内部ギャップを含むタンパク質と対合する。表に示されるように、TALE/亜鉛フィンガーハイブリッドDNA結合ドメインは、内部ギャップが4〜16個の塩基に及ぶ場合に、活性ヌクレアーゼ対を形成することができる。
Figure 2013529083
実施例22:TALEインテグラーゼ融合タンパク質の構築
ある特定のホットスポットへの選好が存在するが、レトロウイルスのライフサイクルの間、ウイルスゲノムRNAを逆転写し、かつ多くの異なる部位で宿主ゲノムに組み込む。レトロウイルスベクターを利用する適用、特に遺伝子治療において、癌遺伝子座付近での遺伝子操作されたウイルスゲノムのランダム組込みによるレトロウイルスベクターの考えられる発癌性は、潜在的な危険因子を示す。そのような潜在的な問題を打開するために、特定のTALE DNA結合ドメインを利用することによって、ウイルスインテグラーゼの特異性を既定の部位に再指向する。融合物を、全体若しくは切断されたインテグラーゼ、及び全体若しくは切断されたインテグラーゼ結合タンパク質で作製する(例えば、HIVインテグラーゼのLEDGF)。さらに、対の1つのメンバーが1つのタンパク質(例えば、タンパク質1)に融合する組込み体であり、第2の対がTALE DNA結合ドメインの別のタンパク質(例えば、タンパク質2)との融合物である融合対を作製し、タンパク質1及びタンパク質2は相互に結合する。対が目的とする細胞中で発現されるように、融合対を発現ベクターにクローニングする。哺乳類ゲノム標的について、融合対は、発現哺乳類発現ベクターを使用して発現される。TALEN誘導性DNA融合後にドナーが切断部位に組み込まれるように、TALEN融合物の発現の間、ドナーDNAを供給する。
実施例23:種々のTALE構築物の配列
DNA及びタンパク質配列
コード配列に下線を引いた、完全なTALEN構築物配列(配列番号217)
GACTCTTCGCGATGTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCTGGCTAACTAGAGAACCCACTGCTTACTGGCTTATCGAAATTAATACGACTCACTATAGGGAGACCCAAGCTGGCTAGCGTTTAAACTTAAGCTGATCCACTAGTCCAGTGTGGTGGAATTCGCCATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCCGCCGCTGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTTACTCCCGAACAAGTAGTAGCGATAGCCAGTAATAACGGAGGTAAACAAGCCTTGGAGACGGTCCAAAGGTTGCTCCCGGTCTTGTGTCAGGCACATGGGCTGACGCCTCAACAGGTCGTCGCGATAGCGTCTAATAATGGAGGAAAGCAAGCTCTGGAAACCGTCCAGCGACTCCTTCCGGTTCTGTGCCAGGCTCATGGTCTGACTCCGCAGCAAGTCGTTGCTATAGCGTCCAACATCGGAGGCAAACAGGCCCTGGAGACCGTGCAGCGGTTGTTGCCTGTGCTTTGCCAAGCCCACGGGCTTACGCCTGAGCAAGTGGTGGCGATTGCCAGTAACAACGGCGGCAAACAAGCCCTTGAGACTGTGCAGAGGCTCTTGCCGGTACTCTGCCAAGCACACGGCTTGACCCCCGAGCAGGTTGTAGCCATAGCTAGTCACGACGGGGGTAAGCAAGCGTTGGAAACGGTGCAAGCACTTCTCCCCGTTCTCTGTCAAGCGCATGGACTTACCCCGGAACAGGTGGTCGCCATTGCAAGCCATGATGGAGGAAAGCAGGCGCTCGAAACAGTCCAGGCACTTTTGCCCGTACTTTGTCAAGCTCACGGTCTCACCCCGGAACAGGTGGTAGCCATTGCATCTAACATCGGAGGTAAGCAAGCATTGGAAACGGTTCAGGCCCTGTTGCCTGTACTTTGCCAGGCGCACGGTCTGACACCTGAGCAGGTTGTCGCCATCGCTAGCAACGGAGGTGGGAAACAGGCACTTGAAACTGTGCAGAGGCTTCTGCCGGTGCTGTGCCAAGCGCATGGCCTTACACCCGAGCAAGTAGTGGCTATTGCGAGTCATGATGGAGGCAAGCAAGCGCTGGAGACTGTCCAACGACTTCTTCCGGTCTTGTGTCAGGCACATGGATTGACCCCTCAACAAGTCGTGGCGATAGCTAGCAACGGCGGTGGAAAACAGGCCCTCGAAACCGTCCAGCGACTGCTCCCCGTACTGTGTCAAGCCCATGGACTTACCCCAGAACAAGTTGTGGCGATTGCCTCTAACAATGGTGGGAAGCAAGCTCTTGAGACGGTGCAGGCGTTGTTGCCCGTGCTTTGTCAAGCTCACGGGCTCACGCCAGAGCAAGTGGTCGCTATCGCGAGTAATAAAGGGGGCAAACAAGCCTTGGAGACAGTGCAAAGGCTCCTGCCAGTGCTCTGCCAGGCTCATGGTTTGACACCCGAACAGGTAGTTGCAATAGCGAGTCATGATGGCGGAAAGCAAGCTCTTGAAACTGTGCAGCGGCTGTTGCCTGTACTGTGTCAAGCCCACGGGCTGACACCGGAACAAGTTGTAGCGATCGCTAGCCACGATGGCGGGAAACAAGCTCTGGAAACGGTACAGAGACTCCTCCCAGTGCTTTGTCAGGCACACGGCCTCACGCCAGAGCAGGTTGTCGCCATCGCGTCAAACAATGGTGGAAAGCAGGCCCTGGAGACAGTCCAACGGTTGCTGCCGGTCCTTTGCCAGGCTCACGGGTTGACCCCCCAGCAGGTCGTGGCCATTGCCTCAAACAAGGGCGGTAGGCCAGCATTGGAGACGGTGCAGAGGCTTCTGCCTGTGCTCTGCCAAGCGCATGGACTCACCCCCGAGCAAGTGGTTGCTATCGCAAGTAACAACGGAGGGAAACAAGCGCTCGAAACCGTGCAAAGGTTGCTCCCCGTTCTCTGTCAGGCGCACGGTCTTACGCCACAACAGGTGGTGGCGATTGCATCTAATGGAGGCGGACGCCCTGCCTTGGAGAGCATTGTGGCCCAGCTGTCCAGGCCGGACCCTGCCCTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGAGGTTCTGGCGGCAGCGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCTTGATAACTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTACTGGGCGGTTTTATGGACAGCAAGCGAACCGGAATTGCCAGCTGGGGCGCCCTCTGGTAAGGTTGGGAAGCCCTGCAAAGTAAACTGGATGGCTTTCTCGCCGCCAAGGATCTGATGGCGCAGGGGATCAAGCTCTGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGACCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAATTATTAACGCTTACAATTTCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATAGCACGTGCTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGGCTTTTGCTGGCCTTTTGCTCACATGTTCTT
NTF3修飾及びインビトロ切断研究において使用したそれぞれのTALENの完全なタンパク質及びコード配列
それぞれの発現構築物の配列を再生成するために、上述の構築物の下線を引いた領域を以下に示されるそれぞれのCDSに置換する。
>NT L+28(配列番号218)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPAAVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASNIGGKQALETVQALLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQALLPVLCQAHGLTPEQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNKGGRPALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGGSGGSGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>NT L+28(配列番号219)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCCGCCGCTGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTTACTCCCGAACAAGTAGTAGCGATAGCCAGTAATAACGGAGGTAAACAAGCCTTGGAGACGGTCCAAAGGTTGCTCCCGGTCTTGTGTCAGGCACATGGGCTGACGCCTCAACAGGTCGTCGCGATAGCGTCTAATAATGGAGGAAAGCAAGCTCTGGAAACCGTCCAGCGACTCCTTCCGGTTCTGTGCCAGGCTCATGGTCTGACTCCGCAGCAAGTCGTTGCTATAGCGTCCAACATCGGAGGCAAACAGGCCCTGGAGACCGTGCAGCGGTTGTTGCCTGTGCTTTGCCAAGCCCACGGGCTTACGCCTGAGCAAGTGGTGGCGATTGCCAGTAACAACGGCGGCAAACAAGCCCTTGAGACTGTGCAGAGGCTCTTGCCGGTACTCTGCCAAGCACACGGCTTGACCCCCGAGCAGGTTGTAGCCATAGCTAGTCACGACGGGGGTAAGCAAGCGTTGGAAACGGTGCAAGCACTTCTCCCCGTTCTCTGTCAAGCGCATGGACTTACCCCGGAACAGGTGGTCGCCATTGCAAGCCATGATGGAGGAAAGCAGGCGCTCGAAACAGTCCAGGCACTTTTGCCCGTACTTTGTCAAGCTCACGGTCTCACCCCGGAACAGGTGGTAGCCATTGCATCTAACATCGGAGGTAAGCAAGCATTGGAAACGGTTCAGGCCCTGTTGCCTGTACTTTGCCAGGCGCACGGTCTGACACCTGAGCAGGTTGTCGCCATCGCTAGCAACGGAGGTGGGAAACAGGCACTTGAAACTGTGCAGAGGCTTCTGCCGGTGCTGTGCCAAGCGCATGGCCTTACACCCGAGCAAGTAGTGGCTATTGCGAGTCATGATGGAGGCAAGCAAGCGCTGGAGACTGTCCAACGACTTCTTCCGGTCTTGTGTCAGGCACATGGATTGACCCCTCAACAAGTCGTGGCGATAGCTAGCAACGGCGGTGGAAAACAGGCCCTCGAAACCGTCCAGCGACTGCTCCCCGTACTGTGTCAAGCCCATGGACTTACCCCAGAACAAGTTGTGGCGATTGCCTCTAACAATGGTGGGAAGCAAGCTCTTGAGACGGTGCAGGCGTTGTTGCCCGTGCTTTGTCAAGCTCACGGGCTCACGCCAGAGCAAGTGGTCGCTATCGCGAGTAATAAAGGGGGCAAACAAGCCTTGGAGACAGTGCAAAGGCTCCTGCCAGTGCTCTGCCAGGCTCATGGTTTGACACCCGAACAGGTAGTTGCAATAGCGAGTCATGATGGCGGAAAGCAAGCTCTTGAAACTGTGCAGCGGCTGTTGCCTGTACTGTGTCAAGCCCACGGGCTGACACCGGAACAAGTTGTAGCGATCGCTAGCCACGATGGCGGGAAACAAGCTCTGGAAACGGTACAGAGACTCCTCCCAGTGCTTTGTCAGGCACACGGCCTCACGCCAGAGCAGGTTGTCGCCATCGCGTCAAACAATGGTGGAAAGCAGGCCCTGGAGACAGTCCAACGGTTGCTGCCGGTCCTTTGCCAGGCTCACGGGTTGACCCCCCAGCAGGTCGTGGCCATTGCCTCAAACAAGGGCGGTAGGCCAGCATTGGAGACGGTGCAGAGGCTTCTGCCTGTGCTCTGCCAAGCGCATGGACTCACCCCCGAGCAAGTGGTTGCTATCGCAAGTAACAACGGAGGGAAACAAGCGCTCGAAACCGTGCAAAGGTTGCTCCCCGTTCTCTGTCAGGCGCACGGTCTTACGCCACAACAGGTGGTGGCGATTGCATCTAATGGAGGCGGACGCCCTGCCTTGGAGAGCATTGTGGCCCAGCTGTCCAGGCCGGACCCTGCCCTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGAGGTTCTGGCGGCAGCGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>NT L+63(配列番号220)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASNIGGKQALETVQALLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQALLPVLCQAHGLTPEQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNKGGRPALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>NT L+63(配列番号221)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCCATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTTACTCCCGAACAAGTAGTAGCGATAGCCAGTAATAACGGAGGTAAACAAGCCTTGGAGACGGTCCAAAGGTTGCTCCCGGTCTTGTGTCAGGCACATGGGCTGACGCCTCAACAGGTCGTCGCGATAGCGTCTAATAATGGAGGAAAGCAAGCTCTGGAAACCGTCCAGCGACTCCTTCCGGTTCTGTGCCAGGCTCATGGTCTGACTCCGCAGCAAGTCGTTGCTATAGCGTCCAACATCGGAGGCAAACAGGCCCTGGAGACCGTGCAGCGGTTGTTGCCTGTGCTTTGCCAAGCCCACGGGCTTACGCCTGAGCAAGTGGTGGCGATTGCCAGTAACAACGGCGGCAAACAAGCCCTTGAGACTGTGCAGAGGCTCTTGCCGGTACTCTGCCAAGCACACGGCTTGACCCCCGAGCAGGTTGTAGCCATAGCTAGTCACGACGGGGGTAAGCAAGCGTTGGAAACGGTGCAAGCACTTCTCCCCGTTCTCTGTCAAGCGCATGGACTTACCCCGGAACAGGTGGTCGCCATTGCAAGCCATGATGGAGGAAAGCAGGCGCTCGAAACAGTCCAGGCACTTTTGCCCGTACTTTGTCAAGCTCACGGTCTCACCCCGGAACAGGTGGTAGCCATTGCATCTAACATCGGAGGTAAGCAAGCATTGGAAACGGTTCAGGCCCTGTTGCCTGTACTTTGCCAGGCGCACGGTCTGACACCTGAGCAGGTTGTCGCCATCGCTAGCAACGGAGGTGGGAAACAGGCACTTGAAACTGTGCAGAGGCTTCTGCCGGTGCTGTGCCAAGCGCATGGCCTTACACCCGAGCAAGTAGTGGCTATTGCGAGTCATGATGGAGGCAAGCAAGCGCTGGAGACTGTCCAACGACTTCTTCCGGTCTTGTGTCAGGCACATGGATTGACCCCTCAACAAGTCGTGGCGATAGCTAGCAACGGCGGTGGAAAACAGGCCCTCGAAACCGTCCAGCGACTGCTCCCCGTACTGTGTCAAGCCCATGGACTTACCCCAGAACAAGTTGTGGCGATTGCCTCTAACAATGGTGGGAAGCAAGCTCTTGAGACGGTGCAGGCGTTGTTGCCCGTGCTTTGTCAAGCTCACGGGCTCACGCCAGAGCAAGTGGTCGCTATCGCGAGTAATAAAGGGGGCAAACAAGCCTTGGAGACAGTGCAAAGGCTCCTGCCAGTGCTCTGCCAGGCTCATGGTTTGACACCCGAACAGGTAGTTGCAATAGCGAGTCATGATGGCGGAAAGCAAGCTCTTGAAACTGTGCAGCGGCTGTTGCCTGTACTGTGTCAAGCCCACGGGCTGACACCGGAACAAGTTGTAGCGATCGCTAGCCACGATGGCGGGAAACAAGCTCTGGAAACGGTACAGAGACTCCTCCCAGTGCTTTGTCAGGCACACGGCCTCACGCCAGAGCAGGTTGTCGCCATCGCGTCAAACAATGGTGGAAAGCAGGCCCTGGAGACAGTCCAACGGTTGCTGCCGGTCCTTTGCCAGGCTCACGGGTTGACCCCCCAGCAGGTCGTGGCCATTGCCTCAAACAAGGGCGGTAGGCCAGCATTGGAGACGGTGCAGAGGCTTCTGCCTGTGCTCTGCCAAGCGCATGGACTCACCCCCGAGCAAGTGGTTGCTATCGCAAGTAACAACGGAGGGAAACAAGCGCTCGAAACCGTGCAAAGGTTGCTCCCCGTTCTCTGTCAGGCGCACGGTCTTACGCCACAACAGGTGGTGGCGATTGCATCTAATGGAGGCGGACGCCCTGCCTTGGAGAGCATTGTGGCCCAGCTGTCCAGGCCGGACCCTGCCCTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>NT R+28(配列番号222)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>NT R+28(配列番号223)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAATCTTACTCCAGAGCAGGTCGTCGCAATCGCGTCGAATAACGGGGGAAAGCAAGCACTGGAAACCGTGCAGAGGTTGTTGCCGGTCTTGTGTCAGGCTCACGGCTTGACACCTGCCCAAGTGGTGGCCATTGCGTCGAACATCGGGGGAAAACAGGCACTTGAAACAGTCCAGAGACTTTTGCCCGTCCTCTGCCAGGCGCACGGCCTCACGCCGGATCAGGTGGTAGCCATCGCGTCAAACATCGGAGGGAAGCAGGCTCTGGAAACGGTGCAGCGGCTTTTGCCGGTACTTTGCCAAGCTCATGGGCTCACGCCAGCCCAAGTGGTAGCTATCGCATCGCACGACGGAGGGAAGCAGGCCTTGGAGACAGTGCAACGGCTCCTCCCCGTGTTGTGCCAGGCACATGGGTTGACTCCAGAGCAGGTCGTAGCAATCGCCTCCAATATCGGGGGAAAGCAAGCGTTGGAGACAGTGCAGCGACTGCTGCCTGTGCTTTGCCAGGCTCATGGCCTGACGCCCGATCAGGTAGTGGCAATCGCGTCAAACAAAGGTGGAAAGCAGGCACTCGAAACGGTACAGCGCTTGCTGCCCGTCTTGTGTCAGGCCCACGGTCTGACACCCGACCAGGTAGTCGCGATTGCGTCGAACATCGGGGGAAAGCAAGCGTTGGAAACGGTACAACGCCTGCTCCCGGTGCTCTGCCAGGCTCATGGACTTACACCCGAGCAGGTGGTCGCCATCGCGTCAAACATCGGAGGCAAACAGGCATTGGAGACAGTGCAGCGCCTTCTCCCAGTCTTGTGTCAGGCCCACGGTCTGACACCCGACCAGGTCGTCGCGATTGCATCGAATGGAGGTGGGAAACAGGCCCTTGAGACAGTACAGAGGCTTTTGCCCGTGTTGTGCCAGGCCCACGGACTCACACCCGAACAAGTCGTCGCCATTGCCAGCCATGATGGAGGTAAACAGGCACTTGAGACTGTCCAGCGCCTCCTGCCGGTGCTGTGCCAAGCACATGGGCTGACCCCGCAGCAAGTCGTAGCGATCGCCTCGAATGGTGGAGGAAAACAAGCGCTTGAAACCGTCCAGAGGTTGCTCCCGGTGCTGTGCCAGGCACATGGCCTTACGCCTGAACAAGTAGTCGCGATTGCCAGCAACAAAGGCGGAAAACAGGCTCTCGAAACGGTCCAGCGGTTGCTGCCGGTGTTGTGCCAGGCGCACGGTCTTACACCGGACCAGGTGGTGGCGATTGCCTCCCACGATGGGGGTAAACAGGCACTGGAAACCGTGCAGAGATTGCTCCCAGTACTTTGTCAGGCACATGGTCTGACTCCTGCTCAAGTGGTCGCGATCGCCTCGAACAATGGCGGAAAGCAGGCGCTCGAAACGGTACAGCGGCTCCTTCCGGTGCTCTGCCAAGCCCACGGATTGACGCCAGAACAGGTCGTGGCAATTGCGTCACACGACGGTGGAAAGCAGGCGCTCGAAACTGTGCAAAGACTCCTGCCCGTACTCTGCCAGGCACACGGTTTGACTCCCCAGCAGGTAGTGGCCATCGCGAGCAATAAGGGAGGAAAGCAGGCGCTTGAAACGGTGCAGAGACTTCTGCCCGTGCTTTGTCAAGCCCACGGGCTGACTCCGGAGCAGGTAGTGGCCATCGCCTCAAACAACGGAGGAAAGCAAGCTCTCGAAACCGTACAGAGGCTTCTCCCCGTGCTCTGTCAGGCCCACGGGTTGACCCCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>NT R+63(rNT3 C+63とも称される)(配列番号224)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>NT R+63(配列番号225)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAATCTTACTCCAGAGCAGGTCGTCGCAATCGCGTCGAATAACGGGGGAAAGCAAGCACTGGAAACCGTGCAGAGGTTGTTGCCGGTCTTGTGTCAGGCTCACGGCTTGACACCTGCCCAAGTGGTGGCCATTGCGTCGAACATCGGGGGAAAACAGGCACTTGAAACAGTCCAGAGACTTTTGCCCGTCCTCTGCCAGGCGCACGGCCTCACGCCGGATCAGGTGGTAGCCATCGCGTCAAACATCGGAGGGAAGCAGGCTCTGGAAACGGTGCAGCGGCTTTTGCCGGTACTTTGCCAAGCTCATGGGCTCACGCCAGCCCAAGTGGTAGCTATCGCATCGCACGACGGAGGGAAGCAGGCCTTGGAGACAGTGCAACGGCTCCTCCCCGTGTTGTGCCAGGCACATGGGTTGACTCCAGAGCAGGTCGTAGCAATCGCCTCCAATATCGGGGGAAAGCAAGCGTTGGAGACAGTGCAGCGACTGCTGCCTGTGCTTTGCCAGGCTCATGGCCTGACGCCCGATCAGGTAGTGGCAATCGCGTCAAACAAAGGTGGAAAGCAGGCACTCGAAACGGTACAGCGCTTGCTGCCCGTCTTGTGTCAGGCCCACGGTCTGACACCCGACCAGGTAGTCGCGATTGCGTCGAACATCGGGGGAAAGCAAGCGTTGGAAACGGTACAACGCCTGCTCCCGGTGCTCTGCCAGGCTCATGGACTTACACCCGAGCAGGTGGTCGCCATCGCGTCAAACATCGGAGGCAAACAGGCATTGGAGACAGTGCAGCGCCTTCTCCCAGTCTTGTGTCAGGCCCACGGTCTGACACCCGACCAGGTCGTCGCGATTGCATCGAATGGAGGTGGGAAACAGGCCCTTGAGACAGTACAGAGGCTTTTGCCCGTGTTGTGCCAGGCCCACGGACTCACACCCGAACAAGTCGTCGCCATTGCCAGCCATGATGGAGGTAAACAGGCACTTGAGACTGTCCAGCGCCTCCTGCCGGTGCTGTGCCAAGCACATGGGCTGACCCCGCAGCAAGTCGTAGCGATCGCCTCGAATGGTGGAGGAAAACAAGCGCTTGAAACCGTCCAGAGGTTGCTCCCGGTGCTGTGCCAGGCACATGGCCTTACGCCTGAACAAGTAGTCGCGATTGCCAGCAACAAAGGCGGAAAACAGGCTCTCGAAACGGTCCAGCGGTTGCTGCCGGTGTTGTGCCAGGCGCACGGTCTTACACCGGACCAGGTGGTGGCGATTGCCTCCCACGATGGGGGTAAACAGGCACTGGAAACCGTGCAGAGATTGCTCCCAGTACTTTGTCAGGCACATGGTCTGACTCCTGCTCAAGTGGTCGCGATCGCCTCGAACAATGGCGGAAAGCAGGCGCTCGAAACGGTACAGCGGCTCCTTCCGGTGCTCTGCCAAGCCCACGGATTGACGCCAGAACAGGTCGTGGCAATTGCGTCACACGACGGTGGAAAGCAGGCGCTCGAAACTGTGCAAAGACTCCTGCCCGTACTCTGCCAGGCACACGGTTTGACTCCCCAGCAGGTAGTGGCCATCGCGAGCAATAAGGGAGGAAAGCAGGCGCTTGAAACGGTGCAGAGACTTCTGCCCGTGCTTTGTCAAGCCCACGGGCTGACTCCGGAGCAGGTAGTGGCCATCGCCTCAAACAACGGAGGAAAGCAAGCTCTCGAAACCGTACAGAGGCTTCTCCCCGTGCTCTGTCAGGCCCACGGGTTGACCCCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>TALE13+28(rNT番号C+28とも称される)(配列番号226)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPSLAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>TALE13 +28(配列番号227)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCCATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGTCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>TALE13+39(rNT3、C+39とも称される)(配列番号228)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPSLAALTNDHLVALACLGGRPALDAVKKGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>TALE13+39(配列番号229)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCCATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGTCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGAGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>TALE13+50(配列番号230)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPSLAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>TALE13+50(配列番号231)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCCATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGTCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>TALE13+63(配列番号232)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPSLAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>TALE13+63(配列番号233)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCCATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGTCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>TALE13+79(配列番号234)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPSLAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>TALE13+79(配列番号235)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCCATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGTCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>TALE13+95(配列番号236)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPSLAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMSGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>TALE13+95(配列番号237)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTACCCATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGTCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGCGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
2.CCR5研究に使用したTALEN構築物及びタンパク質配列
コード配列に下線を引いた、完全なTALEN構築物配列(配列番号238):
GACTCTTCGCGATGTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCTGGCTAACTAGAGAACCCACTGCTTACTGGCTTATCGAAATTAATACGACTCACTATAGGGAGAGCCAAGCTGACTAGCGTTTAAACTTAAGCTGATCCACTAGTCCAGTGTGGTGGAATTCGCCATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCTTGATAACTCGAGTCTAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTACTGGGCGGTTTTATGGACAGCAAGCGAACCGGAATTGCCAGCTGGGGCGCCCTCTGGTAAGGTTGGGAAGCCCTGCAAAGTAAACTGGATGGCTTTCTCGCCGCCAAGGATCTGATGGCGCAGGGGATCAAGCTCTGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGACCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAATTATTAACGCTTACAATTTCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATAGCACGTGCTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGGCTTTTGCTGGCCTTTTGCTCACATGTTCTT
それぞれのCCR−5で標的化されたTALENの完全なタンパク質及びコード配列
それぞれの発現構築物の配列を再生成するために、上述の構築物の下線を引いた領域を以下に示されるそれぞれのCDSに置換する。
>CCR5 L161(+28)(配列番号239)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 L161(+28)(配列番号240)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 L161(+63)(配列番号241)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 L161(+63)(配列番号242)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 L164(+28)(配列番号243)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 L164(+28)(配列番号244)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGACCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 L164(+63)(配列番号245)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 L164(+63)(配列番号246)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 L167(+28)(配列番号247)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 L167(+28)(配列番号248)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAGGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 L167(+63)(配列番号249)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 L167(+63)(配列番号250)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAGGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 L172(+28)(配列番号251)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 L172(+28)(配列番号252)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCTAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 L172(+63)(配列番号253)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 L172(+63)(配列番号254)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCTAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 R175(+28)(配列番号255)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 R175(+28)(配列番号256)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 R175(+63)(配列番号257)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 R175(+63)(配列番号258)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCTTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 R177(+28)(配列番号259)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 R177(+28)(配列番号260)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 R177(+63)(配列番号261)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 R177(+63)(配列番号262)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 R178(+28)(配列番号263)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 R178(+28)(配列番号264)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 R178(+63)(配列番号265)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 R178(+63)(配列番号266)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 R185(+28)(配列番号267)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 R185(+28)(配列番号268)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 R185(+63)(配列番号269)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 R185(+63)(配列番号270)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 L532(+28)(配列番号271)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 L532(+28)(配列番号272)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 L532(+63)(配列番号273)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 L532(+63)(配列番号274)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 L538(+28)(配列番号275)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 L538(+28)(配列番号276)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGACCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 L538(+63)(配列番号277)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 L538(+63)(配列番号278)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 L540(+28)(配列番号279)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 L540(+28)(配列番号280)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 L540(+63)(配列番号281)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 L540(+63)(配列番号282)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 L543(+28)(配列番号283)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 L543(+28)(配列番号284)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 L543(+63)(配列番号285)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 L543(+63)(配列番号286)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCCATGATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 R549(+28)(配列番号287)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 R549(+28)(配列番号288)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 R549(+63)(配列番号289)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 R549(+63)(配列番号290)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 R551(+28)(配列番号291)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQTLETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 R551(+28)(配列番号292)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAACATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 R551(+63)(配列番号293)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 R551(+63)(配列番号294)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGATCAAGTCGTGGCCATTGCAAATAATAACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 R557(+28)(配列番号295)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 R557(+28)(配列番号296)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 R557(+63)(配列番号297)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 R557(+63)(配列番号298)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAATAACAATGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAACGGAGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCCACGACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 R560(+28)(配列番号299)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 R560(+28)(配列番号300)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
>CCR5 R560(+63)(配列番号301)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
>CCR5 R560(+63)(配列番号302)
ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACCGCGGGGTACCTATGGTGGACTTGAGGACACTCGGTTATTCGCAACAGCAACAGGAGAAAATCAAGCCTAAGGTCAGGAGCACCGTCGCGCAACACCACGAGGCGCTTGTGGGGCATGGCTTCACTCATGCGCATATTGTCGCGCTTTCACAGCACCCTGCGGCGCTTGGGACGGTGGCTGTCAAATACCAAGATATGATTGCGGCCCTGCCCGAAGCCACGCACGAGGCAATTGTAGGGGTCGGTAAACAGTGGTCGGGAGCGCGAGCACTTGAGGCGCTGCTGACTGTGGCGGGTGAGCTTAGGGGGCCTCCGCTCCAGCTCGACACCGGGCAGCTGCTGAAGATCGCGAAGAGAGGGGGAGTAACAGCGGTAGAGGCAGTGCACGCCTGGCGCAATGCGCTCACCGGGGCCCCCTTGAACCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAATGGCGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGACTCACCCCAGACCAGGTAGTCGCAATCGCGTCGCATGACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCACATGACGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAACATCGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCAACAACAACGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGGCTGACCCCAGACCAGGTAGTCGCAATCGCGTCGAACATTGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACACCGGAGCAAGTCGTGGCCATTGCATCAAATATCGGTGGCAAACAGGCTCTTGAGACGGTTCAGAGACTTCTCCCAGTTCTCTGTCAAGCCCACGGGCTGACTCCCGATCAAGTTGTAGCGATTGCGAGCAATGGGGGAGGGAAACAAGCATTGGAGACTGTCCAACGGCTCCTTCCCGTGTTGTGTCAAGCCCACGGTTTGACGCCTGCACAAGTGGTCGCCATCGCCTCCAACGGTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGTTTGACCCCAGACCAGGTAGTCGCAATCGCCAACAATAACGGGGGAAAGCAAGCCCTGGAAACCGTGCAAAGGTTGTTGCCGGTCCTTTGTCAAGACCACGGCCTTACGCCTGCACAAGTGGTCGCCATCGCCTCCAATATTGGCGGTAAGCAGGCGCTGGAAACAGTACAGCGCCTGCTGCCTGTACTGTGCCAGGATCATGGCCTGACACCCGAACAGGTGGTCGCCATTGCTAGCAACGGGGGAGGACGGCCAGCCTTGGAGTCCATCGTAGCCCAATTGTCCAGGCCCGATCCCGCGTTGGCTGCGTTAACGAATGACCATCTGGTGGCGTTGGCATGTCTTGGTGGACGACCCGCGCTCGATGCAGTCAAAAAGGGTCTGCCTCATGCTCCCGCATTGATCAAAAGAACCAACCGGCGGATTCCCGAGAGAACTTCCCATCGAGTCGCGGGATCCCAGCTGGTGAAGAGCGAGCTGGAGGAGAAGAAGTCCGAGCTGCGGCACAAGCTGAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCAGGAACAGCACCCAGGACCGCATCCTGGAGATGAAGGTGATGGAGTTCTTCATGAAGGTGTACGGCTACAGGGGAAAGCACCTGGGCGGAAGCAGAAAGCCTGACGGCGCCATCTATACAGTGGGCAGCCCCATCGATTACGGCGTGATCGTGGACACAAAGGCCTACAGCGGCGGCTACAATCTGCCTATCGGCCAGGCCGACGAGATGCAGAGATACGTGGAGGAGAACCAGACCCGGAATAAGCACATCAACCCCAACGAGTGGTGGAAGGTGTACCCTAGCAGCGTGACCGAGTTCAAGTTCCTGTTCGTGAGCGGCCACTTCAAGGGCAACTACAAGGCCCAGCTGACCAGGCTGAACCACATCACCAACTGCAATGGCGCCGTGCTGAGCGTGGAGGAGCTGCTGATCGGCGGCGAGATGATCAAAGCCGGCACCCTGACACTGGAGGAGGTGCGGCGCAAGTTCAACAACGGCGAGATCAACTTCAGATCT
CCR5ドナー配列:
5’AGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGCCAAGCTCAGAATTAACCCTCACTAAAGGGACTAGTCCTGCAGGTTTAAACGAATTCGCCCTTGATACTTATTAACCATACCTTGGAGGGGAAATCACACATGAAAAGTGTCATTTCTTTACTAATCATATTCATGTCTTTTCTCCCCATAGCAAGACAAAGACCTGTTTTAAACACATTTACAACCTATATGTTGCCTTGTACTAGGTAAAAAGTTGTACATTTCTGAAATAATTTTGGTATTTCTGTTCAGATCACTAAACTCAAGAATCAGCAATTCTCTGAGGCTTTCTTTTAAATATACATAAGGAACTTTCGGAGTGAAGGGAGAGTTTGTCAATAACTTGATGCATGTGAAGGGGAGATAAAAAGGTTGCTATTTTTCATCAACATATTTTGATTTGGCTTTCTATAATTGATGGGCTTAAAAGATCTAATCTACTTTAAACAGATGCCAAATAAATGGATGAATCTTAGACCCTCTATAACAGTAACTTCCTTTTAAAAAAGACCTCTCCCACCCCACCCCCAGCCCAGGCTGTGTATGAAAACTAAGCCATGTGCACAACTCTGACTGGGTCACCAGCCCACTTGAGTCCGTGTCACAAGCCCACAGATATTTCCTGCTCCCCAGTGGATCGGGTGTAAACTGAGCTTGCTCGCTCGGGAGCCTCTTGCTGGAAAATAGAACAGCATTTGCAGAAGCGTTTGGCAATGTGCTTTTGGAAGAAGACTAAGAGGTAGTTTCTGAACTTCTCCCCGACAAAGGCATAGATGATGGGGTTGATGCAGCAGTGCGTCATCCCAAGAGTCTCTGTCACCTGCATAGCTTGGTCCAACCTGTTAGAGCTACTGCAATTATTCAGGCCAAAGAATTCCTGGAAGGTGTTCAGGAGAAGGACAATGTTGTAGGGAGCCCAGAAGAGAAAATAAACAATCATGATGGTGAAGATAAGCCTCACAGCCCTGTGCCTCTTCTTCTCATTTCGACACCGAAGCAGAGTTTTTAGGATTCCCGAGTAGCAGATGACCATGACAAGCAGCGGCAGGACCAGCCCCAAGATGACTATCTTTAATGTCTGGAAATTCTTCCAGAATTGATACTGACTGTATGGAAAATGAGAGCTGCAGGTGTAATGAAGACCTTCTTTTTGAGATCTGGTAAAGATGATTCCTGGGAGAGACGCAAACACAGCCACCACCCAAGTGATCACACTTGTCACCACCCCAAAGGTGACCGTCCTGGCTTTTAAAGCAAACACAGCATGGACGACAGCCAGGTACCTATCGATTGTCAGGAGGATGATGAAGAAGATTCCAGAGAAGAAGCCTATAAAATAGAGCCCTGTCAAGAGTTGACACATTGTATTTCCAAAGTCCCACTGGGCGGCAGCATAGTGAGCCCAGAAGGGGACAGTAAGAAGGAAAAACAGGTCAGAGATGGCCAGGTTGAGCAGGTAGATGTCAGTCATGCTCTTCAGCCTTTTGCAGTTTTCTAGACGAGGCATCCAGTCCAGACGCCATCAGGGCATACTCACTGATCTAGATGAGGATGACCAGCATGTTGCCCACAAAACCAAAGATGAACACCAGTGAGTAGAGCGGAGGCAGGAGGCGGGCTGCGATTTGCTTCACATTGATTTTTTGGCAGGGCTCCGATGTATAATAATTGATGTCATAGATTGGACTTGACACTTGATAATCCATCTTGTTCCACCCTGTGCATAAATAAAAAGTGATCTTTTATAAAGTCCTAGAATGTATTTAGTTGCCCTCCATGAATGCAAACTGTTTTATACATCAATAGGTTTTTAATTGCCTACATAGATGTCTACATTGAATTAACTCTCTTTTTGGCCAAGCAATGAAGTTTTGTAGTGAAGGGAAGGTTTGCTGCTAGCTTCCCTGTCCACTAGATGGAGAGCTTGGCTCTGTTGGGGGAATTCATGAAAGCACCATCTCACCAAATAAAATCTTGTGCTCTATAGCACCATGGAGTGAATGAAGCTTTGACAACAATTAAGGGCGAATTCGCGGCCGCTAAATTCAATTCGCCCTATAGTGAGTCGTATTACAATTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTATACGTACGGCAGTTTAAGGTTTACACCTATAAAAGAGAGAGCCGTTATCGTCTGTTTGTGGATGTACAGAGTGATATTATTGACACGCCGGGGCGACGGATGGTGATCCCCCTGGCCAGTGCACGTCTGCTGTCAGATAAAGTCTCCCGTGAACTTTACCCGGTGGTGCATATCGGGGATGAAAGCTGGCGCATGATGACCACCGATATGGCCAGTGTGCCGGTCTCCGTTATCGGGGAAGAAGTGGCTGATCTCAGCCACCGCGAAAATGACATCAAAAACGCCATTAACCTGATGTTCTGGGGAATATAAATGTCAGGCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTCACGTAGAAAGCCAGTCCGCAGAAACGGTGCTGACCCCGGATGAATGTCAGCTACTGGGCTATCTGGACAAGGGAAAACGCAAGCGCAAAGAGAAAGCAGGTAGCTTGCAGTGGGCTTACATGGCGATAGCTAGACTGGGCGGTTTTATGGACAGCAAGCGAACCGGAATTGCCAGCTGGGGCGCCCTCTGGTAAGGTTGGGAAGCCCTGCAAAGTAAACTGGATGGCTTTCTTGCCGCCAAGGATCTGATGGCGCAGGGGATCAAGCTCTGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGACCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAATTATTAACGCTTACAATTTCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAG3’(配列番号176)
3.遺伝子活性化研究に使用したTALE構築物及びタンパク質配列
コード配列に下線を引いた、完全なTALE構築物配列(配列番号303):
TAATACGACTCACTATAGGGAGACCCAAGCTGGCTAGCTTAAGCTGATCCACTAGTCCAGTGTGGTGGAATTCGCTAGCGCCACCATGGCCCCCAAGAAGAAGAGGAAGGTGGGAATCGATGGGGTACCCGCCGCTGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGGCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGCAGGCACGGGTTGTTACAGCTCTTTCGCAGAGTGGGCGTCACCGAACTCGAAGCCCGCAGTGGAACGCTCCCCCCAGCCTCGCAGCGTTGGGACCGTATCCTCCAGGCATCAGGGATGAAAAGGGCCAAACCGTCCCCTACTTCAACTCAAACGCCGGACCAGGCGTCTTTGCATGCATTCGCCGATTCGCTGGAGCGTGACCTTGATGCGCCCAGCCCAACGCACGAGGGAGATCAGAGGCGGGCAAGCAGCCGTAAACGGTCCCGATCGGATCGTGCTGTCACCGGTCCCTCCGCACAGCAATCGTTCGAGGTGCGCGCTCCCGAACAGCGCGATGCGCTGCATTTGCCCCTCAGTTGGAGGGTAAAACGCCCGCGTACCAGTATCGGGGGCGGCCTCCCGGATCCTGGTACGCCCACGGCTGCCGACCTGGCAGCGTCCAGCACCGTGATGCGGGAACAAGATGAGGACCCCTTCGCAGGGGCAGCGGATGATTTCCCGGCATTCAACGAAGAGGAGCTCGCATGGTTGATGGAGCTATTGCCTCAGGACCGCGGCCGCGCCCCCCCGACCGATGTCAGCCTGGGGGACGAGCTCCACTTAGACGGCGAGGACGTGGCGATGGCGCATGCCGACGCGCTAGACGATTTCGATCTGGACATGTTGGGGGACGGGGATTCCCCGGGTCCGGGATTTACCCCCCACGACTCCGCCCCCTACGGCGCTCTGGATATGGCCGACTTCGAGTTTGAGCAGATGTTTACCGATGCCCTTGGAATTGACGAGTACGGTGGCGGCCGCGACTACAAGGACGACGATGACAAGTAAGCTTCTCGAGTCTAGCTAGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGCATCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGGGGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTAATTCTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCCGGGAGCTTGTATATCCATTTTCGGATCTGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAGGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGCGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGACCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAGCGGGACTCTGGGGTTCGAAATGACCGACCAAGCGACGCCCAACCTGCCATCACGAGATTTCGATTCCACCGCCGCCTTCTATGAAAGGTTGGGCTTCGGAATCGTTTTCCGGGACGCCGGCTGGATGATCCTCCAGCGCGGGGATCTCATGCTGGAGTTCTTCGCCCACCCCAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTATACCGTCGACCTCTAGCTAGAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCGACGGATCGGGAGATCTCCCGATCCCCTATGGTCGACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTACAACAAGGCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCTGCTTCGCGATGTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCTGGCTAACTAGAGAACCCACTGCTTACTGGCTTATCGAAAT
遺伝子活性化研究に使用したそれぞれのTALEの完全なタンパク質及びコード配列
それぞれの発現構築物の配列を再生成するために、上述の構築物の下線を引いた領域を以下に示されるそれぞれのCDSに置換する。
NT−L+95タンパク質が、SV40由来の核局在化配列(NLS)を含む一方で、NT−L+278の核内輸送が、TALE C末端隣接領域3に存在する内因性局在化配列に依存することに留意する。
>NT−L+278 VP16(配列番号304)
MVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASNIGGKQALETVQALLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQALLPVLCQAHGLTPEQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNKGGRPALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMSRHGLLQLFRRVGVTELEARSGTLPPASQRWDRILQASGMKRAKPSPTSTQTPDQASLHAFADSLERDLDAPSPTHEGDQRRASSRKRSRSDRAVTGPSAQQSFEVRAPEQRDALHLPLSWRVKRPRTSIGGGLPDPGTPTAADLAASSTVMREQDEDPFAGAADDFPAFNEEELAWLMELLPQDRGRAPPTDVSLGDELHLDGEDVAMAHADALDDFDLDMLGDGDSPGPGFTPHDSAPYGALDMADFEFEQMFTDALGIDEYGGGRDYKDDDDK
>NT−L+278 VP16(配列番号305)
ATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTTACTCCCGAACAAGTAGTAGCGATAGCCAGTAATAACGGAGGTAAACAAGCCTTGGAGACGGTCCAAAGGTTGCTCCCGGTCTTGTGTCAGGCACATGGGCTGACGCCTCAACAGGTCGTCGCGATAGCGTCTAATAATGGAGGAAAGCAAGCTCTGGAAACCGTCCAGCGACTCCTTCCGGTTCTGTGCCAGGCTCATGGTCTGACTCCGCAGCAAGTCGTTGCTATAGCGTCCAACATCGGAGGCAAACAGGCCCTGGAGACCGTGCAGCGGTTGTTGCCTGTGCTTTGCCAAGCCCACGGGCTTACGCCTGAGCAAGTGGTGGCGATTGCCAGTAACAACGGCGGCAAACAAGCCCTTGAGACTGTGCAGAGGCTCTTGCCGGTACTCTGCCAAGCACACGGCTTGACCCCCGAGCAGGTTGTAGCCATAGCTAGTCACGACGGGGGTAAGCAAGCGTTGGAAACGGTGCAAGCACTTCTCCCCGTTCTCTGTCAAGCGCATGGACTTACCCCGGAACAGGTGGTCGCCATTGCAAGCCATGATGGAGGAAAGCAGGCGCTCGAAACAGTCCAGGCACTTTTGCCCGTACTTTGTCAAGCTCACGGTCTCACCCCGGAACAGGTGGTAGCCATTGCATCTAACATCGGAGGTAAGCAAGCATTGGAAACGGTTCAGGCCCTGTTGCCTGTACTTTGCCAGGCGCACGGTCTGACACCTGAGCAGGTTGTCGCCATCGCTAGCAACGGAGGTGGGAAACAGGCACTTGAAACTGTGCAGAGGCTTCTGCCGGTGCTGTGCCAAGCGCATGGCCTTACACCCGAGCAAGTAGTGGCTATTGCGAGTCATGATGGAGGCAAGCAAGCGCTGGAGACTGTCCAACGACTTCTTCCGGTCTTGTGTCAGGCACATGGATTGACCCCTCAACAAGTCGTGGCGATAGCTAGCAACGGCGGTGGAAAACAGGCCCTCGAAACCGTCCAGCGACTGCTCCCCGTACTGTGTCAAGCCCATGGACTTACCCCAGAACAAGTTGTGGCGATTGCCTCTAACAATGGTGGGAAGCAAGCTCTTGAGACGGTGCAGGCGTTGTTGCCCGTGCTTTGTCAAGCTCACGGGCTCACGCCAGAGCAAGTGGTCGCTATCGCGAGTAATAAAGGGGGCAAACAAGCCTTGGAGACAGTGCAAAGGCTCCTGCCAGTGCTCTGCCAGGCTCATGGTTTGACACCCGAACAGGTAGTTGCAATAGCGAGTCATGATGGCGGAAAGCAAGCTCTTGAAACTGTGCAGCGGCTGTTGCCTGTACTGTGTCAAGCCCACGGGCTGACACCGGAACAAGTTGTAGCGATCGCTAGCCACGATGGCGGGAAACAAGCTCTGGAAACGGTACAGAGACTCCTCCCAGTGCTTTGTCAGGCACACGGCCTCACGCCAGAGCAGGTTGTCGCCATCGCGTCAAACAATGGTGGAAAGCAGGCCCTGGAGACAGTCCAACGGTTGCTGCCGGTCCTTTGCCAGGCTCACGGGTTGACCCCCCAGCAGGTCGTGGCCATTGCCTCAAACAAGGGCGGTAGGCCAGCATTGGAGACGGTGCAGAGGCTTCTGCCTGTGCTCTGCCAAGCGCATGGACTCACCCCCGAGCAAGTGGTTGCTATCGCAAGTAACAACGGAGGGAAACAAGCGCTCGAAACCGTGCAAAGGTTGCTCCCCGTTCTCTGTCAGGCGCACGGTCTTACGCCACAACAGGTGGTGGCGATTGCATCTAATGGAGGCGGACGCCCTGCCTTGGAGAGCATTGTGGCCCAGCTGTCCAGGCCGGACCCTGCCCTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGCAGGCACGGGTTGTTACAGCTCTTTCGCAGAGTGGGCGTCACCGAACTCGAAGCCCGCAGTGGAACGCTCCCCCCAGCCTCGCAGCGTTGGGACCGTATCCTCCAGGCATCAGGGATGAAAAGGGCCAAACCGTCCCCTACTTCAACTCAAACGCCGGACCAGGCGTCTTTGCATGCATTCGCCGATTCGCTGGAGCGTGACCTTGATGCGCCCAGCCCAACGCACGAGGGAGATCAGAGGCGGGCAAGCAGCCGTAAACGGTCCCGATCGGATCGTGCTGTCACCGGTCCCTCCGCACAGCAATCGTTCGAGGTGCGCGCTCCCGAACAGCGCGATGCGCTGCATTTGCCCCTCAGTTGGAGGGTAAAACGCCCGCGTACCAGTATCGGGGGCGGCCTCCCGGATCCTGGTACGCCCACGGCTGCCGACCTGGCAGCGTCCAGCACCGTGATGCGGGAACAAGATGAGGACCCCTTCGCAGGGGCAGCGGATGATTTCCCGGCATTCAACGAAGAGGAGCTCGCATGGTTGATGGAGCTATTGCCTCAGGACCGCGGCCGCGCCCCCCCGACCGATGTCAGCCTGGGGGACGAGCTCCACTTAGACGGCGAGGACGTGGCGATGGCGCATGCCGACGCGCTAGACGATTTCGATCTGGACATGTTGGGGGACGGGGATTCCCCGGGTCCGGGATTTACCCCCCACGACTCCGCCCCCTACGGCGCTCTGGATATGGCCGACTTCGAGTTTGAGCAGATGTTTACCGATGCCCTTGGAATTGACGAGTACGGTGGCGGCCGCGACTACAAGGACGACGATGACAAG
>NT−L+95 VP16(配列番号306)
MAPKKKRKVGIDGVPAAVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASNIGGKQALETVQALLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQALLPVLCQAHGLTPEQVVAIASNKGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNKGGRPALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMSGSRGRAPPTDVSLGDELHLDGEDVAMAHADALDDFDLDMLGDGDSPGPGFTPHDSAPYGALDMADFEFEQMFTDALGIDEYGGGRDYKDDDDK
>NT−L+95 VP16(配列番号307)
ATGGCCCCCAAGAAGAAGAGGAAGGTGGGAATCGATGGGGTACCCGCCGCTGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTTACTCCCGAACAAGTAGTAGCGATAGCCAGTAATAACGGAGGTAAACAAGCCTTGGAGACGGTCCAAAGGTTGCTCCCGGTCTTGTGTCAGGCACATGGGCTGACGCCTCAACAGGTCGTCGCGATAGCGTCTAATAATGGAGGAAAGCAAGCTCTGGAAACCGTCCAGCGACTCCTTCCGGTTCTGTGCCAGGCTCATGGTCTGACTCCGCAGCAAGTCGTTGCTATAGCGTCCAACATCGGAGGCAAACAGGCCCTGGAGACCGTGCAGCGGTTGTTGCCTGTGCTTTGCCAAGCCCACGGGCTTACGCCTGAGCAAGTGGTGGCGATTGCCAGTAACAACGGCGGCAAACAAGCCCTTGAGACTGTGCAGAGGCTCTTGCCGGTACTCTGCCAAGCACACGGCTTGACCCCCGAGCAGGTTGTAGCCATAGCTAGTCACGACGGGGGTAAGCAAGCGTTGGAAACGGTGCAAGCACTTCTCCCCGTTCTCTGTCAAGCGCATGGACTTACCCCGGAACAGGTGGTCGCCATTGCAAGCCATGATGGAGGAAAGCAGGCGCTCGAAACAGTCCAGGCACTTTTGCCCGTACTTTGTCAAGCTCACGGTCTCACCCCGGAACAGGTGGTAGCCATTGCATCTAACATCGGAGGTAAGCAAGCATTGGAAACGGTTCAGGCCCTGTTGCCTGTACTTTGCCAGGCGCACGGTCTGACACCTGAGCAGGTTGTCGCCATCGCTAGCAACGGAGGTGGGAAACAGGCACTTGAAACTGTGCAGAGGCTTCTGCCGGTGCTGTGCCAAGCGCATGGCCTTACACCCGAGCAAGTAGTGGCTATTGCGAGTCATGATGGAGGCAAGCAAGCGCTGGAGACTGTCCAACGACTTCTTCCGGTCTTGTGTCAGGCACATGGATTGACCCCTCAACAAGTCGTGGCGATAGCTAGCAACGGCGGTGGAAAACAGGCCCTCGAAACCGTCCAGCGACTGCTCCCCGTACTGTGTCAAGCCCATGGACTTACCCCAGAACAAGTTGTGGCGATTGCCTCTAACAATGGTGGGAAGCAAGCTCTTGAGACGGTGCAGGCGTTGTTGCCCGTGCTTTGTCAAGCTCACGGGCTCACGCCAGAGCAAGTGGTCGCTATCGCGAGTAATAAAGGGGGCAAACAAGCCTTGGAGACAGTGCAAAGGCTCCTGCCAGTGCTCTGCCAGGCTCATGGTTTGACACCCGAACAGGTAGTTGCAATAGCGAGTCATGATGGCGGAAAGCAAGCTCTTGAAACTGTGCAGCGGCTGTTGCCTGTACTGTGTCAAGCCCACGGGCTGACACCGGAACAAGTTGTAGCGATCGCTAGCCACGATGGCGGGAAACAAGCTCTGGAAACGGTACAGAGACTCCTCCCAGTGCTTTGTCAGGCACACGGCCTCACGCCAGAGCAGGTTGTCGCCATCGCGTCAAACAATGGTGGAAAGCAGGCCCTGGAGACAGTCCAACGGTTGCTGCCGGTCCTTTGCCAGGCTCACGGGTTGACCCCCCAGCAGGTCGTGGCCATTGCCTCAAACAAGGGCGGTAGGCCAGCATTGGAGACGGTGCAGAGGCTTCTGCCTGTGCTCTGCCAAGCGCATGGACTCACCCCCGAGCAAGTGGTTGCTATCGCAAGTAACAACGGAGGGAAACAAGCGCTCGAAACCGTGCAAAGGTTGCTCCCCGTTCTCTGTCAGGCGCACGGTCTTACGCCACAACAGGTGGTGGCGATTGCATCTAATGGAGGCGGACGCCCTGCCTTGGAGAGCATTGTGGCCCAGCTGTCCAGGCCGGACCCTGCCCTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGCGGATCCCGCGGCCGCGCCCCCCCGACCGATGTCAGCCTGGGGGACGAGCTCCACTTAGACGGCGAGGACGTGGCGATGGCGCATGCCGACGCGCTAGACGATTTCGATCTGGACATGTTGGGGGACGGGGATTCCCCGGGTCCGGGATTTACCCCCCACGACTCCGCCCCCTACGGCGCTCTGGATATGGCCGACTTCGAGTTTGAGCAGATGTTTACCGATGCCCTTGGAATTGACGAGTACGGTGGCGGCCGCGACTACAAGGACGACGATGACAAG
>TALE13+278 VP16(配列番号308)
MAPKKKRKVGIDGVPAAVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMSRHGLLQLFRRVGVTELEARSGTLPPASQRWDRILQASGMKRAKPSPTSTQTPDQASLHAFADSLERDLDAPSPTHEGDQRRASSRKRSRSDRAVTGPSAQQSFEVRAPEQRDALHLPLSWRVKRPRTSIGGGLPDPGTPTAADLAASSTVMREQDEDPFAGAADDFPAFNEEELAWLMELLPQDRGRAPPTDVSLGDELHLDGEDVAMAHADALDDFDLDMLGDGDSPGPGFTPHDSAPYGALDMADFEFEQMFTDALGIDEYGGGRDYKDDDDK
>TALE13+278 VP16(配列番号309)
ATGGCCCCCAAGAAGAAGAGGAAGGTGGGAATCGATGGGGTACCCGCCGCTGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGGCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGCAGGCACGGGTTGTTACAGCTCTTTCGCAGAGTGGGCGTCACCGAACTCGAAGCCCGCAGTGGAACGCTCCCCCCAGCCTCGCAGCGTTGGGACCGTATCCTCCAGGCATCAGGGATGAAAAGGGCCAAACCGTCCCCTACTTCAACTCAAACGCCGGACCAGGCGTCTTTGCATGCATTCGCCGATTCGCTGGAGCGTGACCTTGATGCGCCCAGCCCAACGCACGAGGGAGATCAGAGGCGGGCAAGCAGCCGTAAACGGTCCCGATCGGATCGTGCTGTCACCGGTCCCTCCGCACAGCAATCGTTCGAGGTGCGCGCTCCCGAACAGCGCGATGCGCTGCATTTGCCCCTCAGTTGGAGGGTAAAACGCCCGCGTACCAGTATCGGGGGCGGCCTCCCGGATCCTGGTACGCCCACGGCTGCCGACCTGGCAGCGTCCAGCACCGTGATGCGGGAACAAGATGAGGACCCCTTCGCAGGGGCAGCGGATGATTTCCCGGCATTCAACGAAGAGGAGCTCGCATGGTTGATGGAGCTATTGCCTCAGGACCGCGGCCGCGCCCCCCCGACCGATGTCAGCCTGGGGGACGAGCTCCACTTAGACGGCGAGGACGTGGCGATGGCGCATGCCGACGCGCTAGACGATTTCGATCTGGACATGTTGGGGGACGGGGATTCCCCGGGTCCGGGATTTACCCCCCACGACTCCGCCCCCTACGGCGCTCTGGATATGGCCGACTTCGAGTTTGAGCAGATGTTTACCGATGCCCTTGGAATTGACGAGTACGGTGGCGGCCGCGACTACAAGGACGACGATGACAAG
>TALE13+133 VP16(配列番号310)
MVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMSRHGLLQLFRRVGVTELEARSGTLPPASQRWDRILQASGGSGHRGRAPPTDVSLGDELHLDGEDVAMAHADALDDFDLDMLGDGDSPGPGFTPHDSAPYGALDMADFEFEQMFTDALGIDEYGGGRDYKDDDDK
>TALE13+133 VP16(配列番号311)
ATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGTGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGGCGTTGGCCGCGTTGACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGCAGGCACGGGTTGTTACAGCTCTTTCGCAGAGTGGGCGTCACCGAACTCGAAGCCCGCAGTGGAACGCTCCCCCCAGCCTCGCAGCGTTGGGACCGTATCCTCCAGGCATCGGGGGGATCCGGCCACCGCGGCCGCGCCCCCCCGACCGATGTCAGCCTGGGGGACGAGCTCCACTTAGACGGCGAGGACGTGGCGATGGCGCATGCCGACGCGCTAGACGATTTCGATCTGGACATGTTGGGGGACGGGGATTCCCCGGGTCCGGGATTTACCCCCCACGACTCCGCCCCCTACGGCGCTCTGGATATGGCCGACTTCGAGTTTGAGCAGATGTTTACCGATGCCCTTGGAATTGACGAGTACGGTGGCGGCCGCGACTACAAGGACGACGATGACAAG
>TALE13+95 VP16(配列番号312)
MVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMSGSRGRAPPTDVSLGDELHLDGEDVAMAHADALDDFDLDMLGDGDSPGPGFTPHDSAPYGALDMADFEFEQMFTDALGIDEYGGGRDYKDDDDK
>TALE13+95 VP16(配列番号313)
ATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGGCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGCGGATCCCGCGGCCGCGCCCCCCCGACCGATGTCAGCCTGGGGGACGAGCTCCACTTAGACGGCGAGGACGTGGCGATGGCGCATGCCGACGCGCTAGACGATTTCGATCTGGACATGTTGGGGGACGGGGATTCCCCGGGTCCGGGATTTACCCCCCACGACTCCGCCCCCTACGGCGCTCTGGATATGGCCGACTTCGAGTTTGAGCAGATGTTTACCGATGCCCTTGGAATTGACGAGTACGGTGGCGGCCGCGACTACAAGGACGACGATGACAAG
>TALE13+23 VP16(配列番号314)
MVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLRQAHGLTPEQVVAIASNGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVAGSRGRAPPTDVSLGDELHLDGEDVAMAHADALDDFDLDMLGDGDSPGPGFTPHDSAPYGALDMADFEFEQMFTDALGIDEYGGGRDYKDDDDK
>TALE13+23 VP16(配列番号315)
ATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGGCGTTGGCCGCGTTAACCAACGACCACCTCGTCGCCGGATCCCGCGGCCGCGCCCCCCCGACCGATGTCAGCCTGGGGGACGAGCTCCACTTAGACGGCGAGGACGTGGCGATGGCGCATGCCGACGCGCTAGACGATTTCGATCTGGACATGTTGGGGGACGGGGATTCCCCGGGTCCGGGATTTACCCCCCACGACTCCGCCCCCTACGGCGCTCTGGATATGGCCGACTTCGAGTTTGAGCAGATGTTTACCGATGCCCTTGGAATTGACGAGTACGGTGGCGGCCGCGACTACAAGGACGACGATGACAAG
>TALE13△1−13 VP16(配列番号316)
MVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMSRHGLLQLFRRVGVTELEARSGTLPPASQRWDRILQASGMKRAKPSPTSTQTPDQASLHAFADSLERDLDAPSPTHEGDQRRASSRKRSRSDRAVTGPSAQQSFEVRAPEQRDALHLPLSWRVKRPRTSIGGGLPDPGTPTAADLAASSTVMREQDEDPFAGAADDFPAFNEEELAWLMELLPQDRGRAPPTDVSLGDELHLDGEDVAMAHADALDDFDLDMLGDGDSPGPGFTPHDSAPYGALDMADFEFEQMFTDALGIDEYGGGRDYKDDDDK
>TALE13△1−13 VP16(配列番号317)
ATGGTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGCAGGCACGGGTTGTTACAGCTCTTTCGCAGAGTGGGCGTCACCGAACTCGAAGCCCGCAGTGGAACGCTCCCCCCAGCCTCGCAGCGTTGGGACCGTATCCTCCAGGCATCAGGGATGAAAAGGGCCAAACCGTCCCCTACTTCAACTCAAACGCCGGACCAGGCGTCTTTGCATGCATTCGCCGATTCGCTGGAGCGTGACCTTGATGCGCCCAGCCCAACGCACGAGGGAGATCAGAGGCGGGCAAGCAGCCGTAAACGGTCCCGATCGGATCGTGCTGTCACCGGTCCCTCCGCACAGCAATCGTTCGAGGTGCGCGCTCCCGAACAGCGCGATGCGCTGCATTTGCCCCTCAGTTGGAGGGTAAAACGCCCGCGTACCAGTATCGGGGGCGGCCTCCCGGATCCTGGTACGCCCACGGCTGCCGACCTGGCAGCGTCCAGCACCGTGATGCGGGAACAAGATGAGGACCCCTTCGCAGGGGCAGCGGATGATTTCCCGGCATTCAACGAAGAGGAGCTCGCATGGTTGATGGAGCTATTGCCTCAGGACCGCGGCCGCGCCCCCCCGACCGATGTCAGCCTGGGGGACGAGCTCCACTTAGACGGCGAGGACGTGGCGATGGCGCATGCCGACGCGCTAGACGATTTCGATCTGGACATGTTGGGGGACGGGGATTCCCCGGGTCCGGGATTTACCCCCCACGACTCCGCCCCCTACGGCGCTCTGGATATGGCCGACTTCGAGTTTGAGCAGATGTTTACCGATGCCCTTGGAATTGACGAGTACGGTGGCGGCCGCGACTACAAGGACGACGATGACAAG
4.種々のDNA配列
図37に説明される実験のために使用したドナー(配列番号318)
AGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGCCAAGCTCAGAATTAACCCTCACTAAAGGGACTAGTCCTGCAGGTTTAAACGAATTCGCCCTTGATACTTATTAACCATACCTTGGAGGGGAAATCACACATGAAAAGTGTCATTTCTTTACTAATCATATTCATGTCTTTTCTCCCCATAGCAAGACAAAGACCTGTTTTAAACACATTTACAACCTATATGTTGCCTTGTACTAGGTAAAAAGTTGTACATTTCTGAAATAATTTTGGTATTTCTGTTCAGATCACTAAACTCAAGAATCAGCAATTCTCTGAGGCTTTCTTTTAAATATACATAAGGAACTTTCGGAGTGAAGGGAGAGTTTGTCAATAACTTGATGCATGTGAAGGGGAGATAAAAAGGTTGCTATTTTTCATCAACATATTTTGATTTGGCTTTCTATAATTGATGGGCTTAAAAGATCTAATCTACTTTAAACAGATGCCAAATAAATGGATGAATCTTAGACCCTCTATAACAGTAACTTCCTTTTAAAAAAGACCTCTCCCACCCCACCCCCAGCCCAGGCTGTGTATGAAAACTAAGCCATGTGCACAACTCTGACTGGGTCACCAGCCCACTTGAGTCCGTGTCACAAGCCCACAGATATTTCCTGCTCCCCAGTGGATCGGGTGTAAACTGAGCTTGCTCGCTCGGGAGCCTCTTGCTGGAAAATAGAACAGCATTTGCAGAAGCGTTTGGCAATGTGCTTTTGGAAGAAGACTAAGAGGTAGTTTCTGAACTTCTCCCCGACAAAGGCATAGATGATGGGGTTGATGCAGCAGTGCGTCATCCCAAGAGTCTCTGTCACCTGCATAGCTTGGTCCAACCTGTTAGAGCTACTGCAATTATTCAGGCCAAAGAATTCCTGGAAGGTGTTCAGGAGAAGGACAATGTTGTAGGGAGCCCAGAAGAGAAAATAAACAATCATGATGGTGAAGATAAGCCTCACAGCCCTGTGCCTCTTCTTCTCATTTCGACACCGAAGCAGAGTTTTTAGGATTCCCGAGTAGCAGATGACCATGACAAGCAGCGGCAGGACCAGCCCCAAGATGACTATCTTTAATGTCTGGAAATTCTTCCAGAATTGATACTGACTGTATGGAAAATGAGAGCTGCAGGTGTAATGAAGACCTTCTTTTTGAGATCTGGTAAAGATGATTCCTGGGAGAGACGCAAACACAGCCACCACCCAAGTGATCACACTTGTCACCACCCCAAAGGTGACCGTCCTGGCTTTTAAAGCAAACACAGCATGGACGACAGCCAGGTACCTATCGATTGTCAGGAGGATGATGAAGAAGATTCCAGAGAAGAAGCCTATAAAATAGAGCCCTGTCAAGAGTTGACACATTGTATTTCCAAAGTCCCACTGGGCGGCAGCATAGTGAGCCCAGAAGGGGACAGTAAGAAGGAAAAACAGGTCAGAGATGGCCAGGTTGAGCAGGTAGATGTCAGTCATGCTCTTCAGCCTTTTGCAGTTTTCTAGACGAGGCATCCAGTCCAGACGCCATCAGGGCATACTCACTGATCTAGATGAGGATGACCAGCATGTTGCCCACAAAACCAAAGATGAACACCAGTGAGTAGAGCGGAGGCAGGAGGCGGGCTGCGATTTGCTTCACATTGATTTTTTGGCAGGGCTCCGATGTATAATAATTGATGTCATAGATTGGACTTGACACTTGATAATCCATCTTGTTCCACCCTGTGCATAAATAAAAAGTGATCTTTTATAAAGTCCTAGAATGTATTTAGTTGCCCTCCATGAATGCAAACTGTTTTATACATCAATAGGTTTTTAATTGCCTACATAGATGTCTACATTGAATTAACTCTCTTTTTGGCCAAGCAATGAAGTTTTGTAGTGAAGGGAAGGTTTGCTGCTAGCTTCCCTGTCCACTAGATGGAGAGCTTGGCTCTGTTGGGGGAATTCATGAAAGCACCATCTCACCAAATAAAATCTTGTGCTCTATAGCACCATGGAGTGAATGAAGCTTTGACAACAATTAAGGGCGAATTCGCGGCCGCTAAATTCAATTCGCCCTATAGTGAGTCGTATTACAATTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTATACGTACGGCAGTTTAAGGTTTACACCTATAAAAGAGAGAGCCGTTATCGTCTGTTTGTGGATGTACAGAGTGATATTATTGACACGCCGGGGCGACGGATGGTGATCCCCCTGGCCAGTGCACGTCTGCTGTCAGATAAAGTCTCCCGTGAACTTTACCCGGTGGTGCATATCGGGGATGAAAGCTGGCGCATGATGACCACCGATATGGCCAGTGTGCCGGTCTCCGTTATCGGGGAAGAAGTGGCTGATCTCAGCCACCGCGAAAATGACATCAAAAACGCCATTAACCTGATGTTCTGGGGAATATAAATGTCAGGCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTCACGTAGAAAGCCAGTCCGCAGAAACGGTGCTGACCCCGGATGAATGTCAGCTACTGGGCTATCTGGACAAGGGAAAACGCAAGCGCAAAGAGAAAGCAGGTAGCTTGCAGTGGGCTTACATGGCGATAGCTAGACTGGGCGGTTTTATGGACAGCAAGCGAACCGGAATTGCCAGCTGGGGCGCCCTCTGGTAAGGTTGGGAAGCCCTGCAAAGTAAACTGGATGGCTTTCTTGCCGCCAAGGATCTGATGGCGCAGGGGATCAAGCTCTGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGACCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAATTATTAACGCTTACAATTTCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAG
TALE13レポーター構築物(下線部分はTALE13結合部位及びSV40プロモーター)(配列番号319):
GGTACCGAGCTCTTACGCGTGCTAGTATAAATACCTTCTGCCTTACTAGTATAAATACCTTCTGCCTTGCTAGCTCGAGATCTGCGATCTGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATCGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTTGGCATTCCGGTACTGTTGGTAAAGCCACCATGGAAGACGCCAAAAACATAAAGAAAGGCCCGGCGCCATTCTATCCGCTGGAAGATGGAACCGCTGGAGAGCAACTGCATAAGGCTATGAAGAGATACGCCCTGGTTCCTGGAACAATTGCTTTTACAGATGCACATATCGAGGTGGACATCACTTACGCTGAGTACTTCGAAATGTCCGTTCGGTTGGCAGAAGCTATGAAACGATATGGGCTGAATACAAATCACAGAATCGTCGTATGCAGTGAAAACTCTCTTCAATTCTTTATGCCGGTGTTGGGCGCGTTATTTATCGGAGTTGCAGTTGCGCCCGCGAACGACATTTATAATGAACGTGAATTGCTCAACAGTATGGGCATTTCGCAGCCTACCGTGGTGTTCGTTTCCAAAAAGGGGTTGCAAAAAATTTTGAACGTGCAAAAAAAGCTCCCAATCATCCAAAAAATTATTATCATGGATTCTAAAACGGATTACCAGGGATTTCAGTCGATGTACACGTTCGTCACATCTCATCTACCTCCCGGTTTTAATGAATACGATTTTGTGCCAGAGTCCTTCGATAGGGACAAGACAATTGCACTGATCATGAACTCCTCTGGATCTACTGGTCTGCCTAAAGGTGTCGCTCTGCCTCATAGAACTGCCTGCGTGAGATTCTCGCATGCCAGAGATCCTATTTTTGGCAATCAAATCATTCCGGATACTGCGATTTTAAGTGTTGTTCCATTCCATCACGGTTTTGGAATGTTTACTACACTCGGATATTTGATATGTGGATTTCGAGTCGTCTTAATGTATAGATTTGAAGAAGAGCTGTTTCTGAGGAGCCTTCAGGATTACAAGATTCAAAGTGCGCTGCTGGTGCCAACCCTATTCTCCTTCTTCGCCAAAAGCACTCTGATTGACAAATACGATTTATCTAATTTACACGAAATTGCTTCTGGTGGCGCTCCCCTCTCTAAGGAAGTCGGGGAAGCGGTTGCCAAGAGGTTCCATCTGCCAGGTATCAGGCAAGGATATGGGCTCACTGAGACTACATCAGCTATTCTGATTACACCCGAGGGGGATGATAAACCGGGCGCGGTCGGTAAAGTTGTTCCATTTTTTGAAGCGAAGGTTGTGGATCTGGATACCGGGAAAACGCTGGGCGTTAATCAAAGAGGCGAACTGTGTGTGAGAGGTCCTATGATTATGTCCGGTTATGTAAACAATCCGGAAGCGACCAACGCCTTGATTGACAAGGATGGATGGCTACATTCTGGAGACATAGCTTACTGGGACGAAGACGAACACTTCTTCATCGTTGACCGCCTGAAGTCTCTGATTAAGTACAAAGGCTATCAGGTGGCTCCCGCTGAATTGGAATCCATCTTGCTCCAACACCCCAACATCTTCGACGCAGGTGTCGCAGGTCTTCCCGACGATGACGCCGGTGAACTTCCCGCCGCCGTTGTTGTTTTGGAGCACGGAAAGACGATGACGGAAAAAGAGATCGTGGATTACGTCGCCAGTCAAGTAACAACCGCGAAAAAGTTGCGCGGAGGAGTTGTGTTTGTGGACGAAGTACCGAAAGGTCTTACCGGAAAACTCGACGCAAGAAAAATCAGAGAGATCCTCATAAAGGCCAAGAAGGGCGGAAAGATCGCCGTGTAATTCTAGAGTCGGGGCGGCCGGCCGCTTCGAGCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTAAAATCGATAAGGATCCGTCGACCGATGCCCTTGAGAGCCTTCAACCCAGTCAGCTCCTTCCGGTGGGCGCGGGGCATGACTATCGTCGCCGCACTTATGACTGTCTTCTTTATCATGCAACTCGTAGGACAGGTGCCGGCAGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCCCAAGCTACCATGATAAGTAAGTAATATTAAGGTACGGGAGGTACTTGGAGCGGCCGCAATAAAATATCTTTATTTTCATTACATCTGTGTGTTGGTTTTTTGTGTGAATCGATAGTACTAACATACGCTCTCCATCAAAACAAAACGAAACAAAACAAACTAGCAAAATAGGCTGTCCCCAGTGCAAGTGCAGGTGCCAGAACATTTCTCTATCGATA
TALE13のDNA配列(配列番号320):
GTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGTGCCCCCCTGAACCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATATTGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGCGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCAATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGCACAGGTGGTGGCCATCGCCAGCAATATTGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTCGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGACCAGGTGGTGGCCATCGCCAGCAATGGCGGTGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCCACGATGGCGGCAAGCAGGCGCTGGAGACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGCCCATGGCCTGACCCCGGAGCAGGTGGTGGCCATCGCCAGCAATGGCGGCGGCAGGCCGGCGCTGGAGAGCATTGTTGCCCAGTTATCTCGCCCTGATCCGGCGTTGGCCGCGTTGACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGCAGGCACGGGTTGTTACAGCTCTTTCGCAGAGTGGGCGTCACCGAACTCGAAGCCCGCAGTGGAACGCTCCCCCCAGCCTCGCAGCGTTGGGACCGTATCCTCCAGGCATCAGGGATGAAAAGGGCCAAACCGTCCCCTACTTCAACTCAAACGCCGGACCAGGCGTCTTTGCATGCATTCGCCGATTCGCTGGAGCGTGACCTTGATGCGCCCAGCCCAACGCACGAGGGAGATCAGAGGCGGGCAAGCAGCCGTAAACGGTCCCGATCGGATCGTGCTGTCACCGGTCCCTCCGCACAGCAATCGTTCGAGGTGCGCGCTCCCGAACAGCGCGATGCGCTGCATTTGCCCCTCAGTTGGAGGGTAAAACGCCCGCGTACCAGTATCGGGGGCGGCCTCCCGGATCCTGGTACGCCCACGGCTGCCGACCTGGCAGCGTCCAGCACCGTGATGCGGGAACAAGATGAGGACCCCTTCGCAGGGGCAGCGGATGATTTCCCGGCATTCAACGAAGAGGAGCTCGCATGGTTGATGGAGCTATTGCCTCAG
TALE VEGF−1及びCCR5−1のタンパク質及び遺伝子配列
>VEGF−1(配列番号321)
VDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPQQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMS
>VEGF−1(配列番号322)
GTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTGACGCCTCAACAGGTCGTCGCGATAGCGTCTAATAATGGAGGAAAGCAAGCTCTGGAAACCGTCCAGCGACTCCTTCCGGTTCTGTGCCAGGCTCATGGTCTGACTCCGCAGCAAGTCGTTGCTATAGCGTCCAACATCGGAGGCAAACAGGCCCTGGAGACCGTGCAGCGGTTGTTGCCTGTGCTTTGCCAAGCCCACGGGCTTACGCCTGAGCAAGTGGTGGCGATTGCCAGTAACAACGGCGGCAAACAAGCCCTTGAGACTGTGCAGAGGCTCTTGCCGGTACTCTGCCAAGCACACGGCTTGACCCCCGAGCAGGTTGTAGCCATAGCTAGTCACGACGGGGGTAAGCAAGCGTTGGAAACGGTGCAAGCACTTCTCCCCGTTCTCTGTCAAGCGCATGGACTTACCCCGGAACAGGTGGTCGCCATTGCAAGCCATGATGGGGGTAAGCAAGCGTTGGAAACGGTGCAAGCACTTCTCCCCGTTCTCTGTCAAGCGCATGGACTTACCCCGGAACAGGTGGTCGCCATTGCAAGCCATGATGGAGGAAAGCAGGCGCTCGAAACAGTCCAGGCACTTTTGCCCGTACTTTGTCAAGCTCACGGTCTCACCCCGGAACAGGTGGTAGCCATTGCATCTAACGGAGGGGGCAAACAAGCCTTGGAGACAGTGCAAAGGCTCCTGCCAGTGCTCTGCCAGGCTCATGGTTTGACACCCGAACAGGTAGTTGCAATAGCGAGTCATGATGGCGGAAAGCAAGCTCTTGAAACTGTGCAGCGGCTGTTGCCTGTACTGTGTCAAGCCCACGGGCTGACACCGGAACAAGTTGTAGCGATCGCTAGCCACGATGGCGGGAAACAAGCTCTGGAAACGGTACAGAGACTCCTCCCAGTGCTTTGTCAGGCACACGGCCTCACGCCAGAGCAGGTTGTCGCCATCGCGTCACATGATGGGGGCAAACAAGCCTTGGAGACAGTGCAAAGGCTCCTGCCAGTGCTCTGCCAGGCTCATGGTTTGACACCCGAACAGGTAGTTGCAATAGCGAGTCATGATGGCGGAAAGCAAGCTCTTGAAACTGTGCAGCGGCTGTTGCCTGTACTGTGTCAAGCCCACGGGCTGACACCGGAACAAGTTGTAGCGATCGCTAGCCACGATGGCGGGAAACAAGCTCTGGAAACGGTACAGAGACTCCTCCCAGTGCTTTGTCAGGCACACGGCCTCACGCCAGAGCAGGTTGTCGCCATCGCGTCAAACGGTGGAGGGAAACAAGCGCTCGAAACCGTGCAAAGGTTGCTCCCCGTTCTCTGTCAGGCGCACGGTCTTACGCCACAACAGGTGGTGGCGATTGCATCTAATGGAGGCGGACGCCCTGCCTTGGAGAGCATTGTGGCCCAGCTGTCCAGGCCGGACCCTGCCCTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGC
>CCR5−1(配列番号323)
VDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASNKGGKQALETVQALLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGKQALETVQALLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVADHAQVVRVLGFFQCHSHPAQAFDDAMTQFGMS
>CCR5−1(配列番号324)
GTGGATCTACGCACGCTCGGCTACAGCCAGCAGCAACAGGAGAAGATCAAACCGAAGGTTCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTCGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCAAGTATCAGGACATGATCGCAGCGTTGCCAGAGGCGACACACGAAGCGATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGTGGCGGGAGAGTTGAGAGGTCCACCGTTACAGTTGGACACAGGCCAACTTCTCAAGATTGCAAAACGTGGCGGCGTGACCGCAGTGGAGGCAGTGCATGCATGGCGCAATGCACTGACGGGGGCCCCCCTGAACCTTACACCCGAGCAAGTAGTGGCTATTGCGAGTAATAAAGGGGGTAAGCAAGCGTTGGAAACGGTGCAAGCACTTCTCCCCGTTCTCTGTCAAGCGCATGGACTTACCCCGGAACAGGTGGTCGCCATTGCAAGCCATGATGGAGGAAAGCAGGCGCTCGAAACAGTCCAGGCACTTTTGCCCGTACTTTGTCAAGCTCACGGTCTCACCCCGGAACAGGTGGTAGCCATTGCATCTAACGGAGGGGGCAAACAAGCCTTGGAGACAGTGCAAAGGCTCCTGCCAGTGCTCTGCCAGGCTCATGGTTTGACACCCGAACAGGTAGTTGCAATAGCGAGTCATGATGGCGGAAAGCAAGCTCTTGAAACTGTGCAGCGGCTGTTGCCTGTACTGTGTCAAGCCCACGGGCTGACACCGGAACAAGTTGTAGCGATCGCTAGCAACGGCGGAGGTAAGCAAGCATTGGAAACGGTTCAGGCCCTGTTGCCTGTACTTTGCCAGGCGCACGGTCTGACACCTGAGCAGGTTGTCGCCATCGCTAGCAACGGAGGTGGGAAACAGGCACTTGAAACTGTGCAGAGGCTTCTGCCGGTGCTGTGCCAAGCGCATGGCCTTACACCCGAGCAAGTAGTGGCTATTGCGAGTCATGATGGAGGCAAGCAAGCGCTGGAGACTGTCCAACGACTTCTTCCGGTCTTGTGTCAGGCACATGGATTGACCCCTCAACAAGTCGTGGCGATAGCTAGCAACATCGGAGGCAAACAGGCCCTGGAGACCGTGCAGCGGTTGTTGCCTGTGCTTTGCCAAGCCCACGGGCTTACGCCTGAGCAAGTGGTGGCGATTGCCAGTAACAACGGGGGCAAACAAGCCTTGGAGACAGTGCAAAGGCTCCTGCCAGTGCTCTGCCAGGCTCATGGTTTGACACCCGAACAGGTAGTTGCAATAGCGAGTCATGATGGCGGAAAGCAAGCTCTTGAAACTGTGCAGCGGCTGTTGCCTGTACTGTGTCAAGCCCACGGGCTGACACCGGAACAAGTTGTAGCGATCGCTAGCCACGATGGCGGGAAACAAGCTCTGGAAACGGTACAGAGACTCCTCCCAGTGCTTTGTCAGGCACACGGCCTCACGCCAGAGCAGGTTGTCGCCATCGCGTCAAACGGTGGAGGGAAACAAGCGCTCGAAACCGTGCAAAGGTTGCTCCCCGTTCTCTGTCAGGCGCACGGTCTTACGCCACAACAGGTGGTGGCGATTGCATCTAATGGAGGCGGACGCCCTGCCTTGGAGAGCATTGTGGCCCAGCTGTCCAGGCCGGACCCTGCCCTGGCCGCGTTAACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCGCTGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGCCTTGATCAAAAGAACCAATCGCCGTATTCCCGAACGCACATCCCATCGCGTTGCCGACCACGCGCAAGTGGTTCGCGTGCTGGGTTTTTTCCAGTGCCACTCCCACCCAGCGCAAGCATTTGATGACGCCATGACGCAGTTCGGGATGAGC
AAVS1特異的TALENの遺伝子配列
101077ORF(下線部分はTALE領域)(配列番号325):
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
101079ORF(下線部分はTALE領域)(配列番号326):
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
ben−1特異的TALEN ORFの配列:
101318(配列番号327)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPDQVVAIANNNGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
101321(配列番号328)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHRGVPMVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVKYQDMIAALPEATHEAIVGVGKQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPAQVVAIANNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQAHGLTPAQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS
pZMt−101380(配列番号444)
ctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatacgcgtaccgctagccaggaagagtttgtagaaacgcaaaaaggccatccgtcaggatggccttctgcttagtttgatgcctggcagtttatggcgggcgtcctgcccgccaccctccgggccgttgcttcacaacgttcaaatccgctcccggcggatttgtcctactcaggagagcgttcaccgacaaacaacagataaaacgaaaggcccagtcttccgactgagcctttcgttttatttgatgcctggcagttccctactctcgcgttaacgctagcatggatgttttcccagtcacgacgttgtaaaacgacggccagtcttaagctcgggccccaaataatgattttattttgactgatagtgacctgttcgttgcaacaaattgatgagcaatgcttttttataatgccaactttgtacaaaaaagcaggctccgaattcgcccttttaattaatgcagtgcagcgtgacccggtcgtgcccctctctagagataatgagcattgcatgtctaagttataaaaaattaccacatattttttttgtcacacttgtttgaagtgcagtttatctatctttatacatatatttaaactttactctacgaataatataatctatagtactacaataatatcagtgttttagagaatcatataaatgaacagttagacatggtctaaaggacaattgagtattttgacaacaggactctacagttttatctttttagtgtgcatgtgttctcctttttttttgcaaatagcttcacctatataatacttcatccattttattagtacatccatttagggtttagggttaatggtttttatagactaatttttttagtacatctattttattctattttagcctctaaattaagaaaactaaaactctattttagtttttttatttaataatttagatataaaatagaataaaataaagtgactaaaaattaaacaaataccctttaagaaattaaaaaaactaaggaaacatttttcttgtttcgagtagataatgccagcctgttaaacgccgtcgacgagtctaacggacaccaaccagcgaaccagcagcgtcgcgtcgggccaagcgaagcagacggcacggcatctctgtcgctgcctctggacccctctcgagagttccgctccaccgttggacttgctccgctgtcggcatccagaaattgcgtggcggagcggcagacgtgagccggcacggcaggcggcctcctcctcctctcacggcaccggcagctacgggggattcctttcccaccgctccttcgctttcccttcctcgcccgccgtaataaatagacaccccctccacaccctctttccccaacctcgtgttgttcggagcgcacacacacacaaccagatctcccccaaatccacccgtcggcacctccgcttcaaggtacgccgctcgtcctccccccccccccctctctaccttctctagatcggcgttccggtccatggttagggcccggtagttctacttctgttcatgtttgtgttagatccgtgtttgtgttagatccgtgctgctagcgttcgtacacggatgcgacctgtacgtcagacacgttctgattgctaacttgccagtgtttctctttggggaatcctgggatggctctagccgttccgcagacgggatcgatttcatgattttttttgtttcgttgcatagggtttggtttgcccttttcctttatttcaatatatgccgtgcacttgtttgtcgggtcatcttttcatgcttttttttgtcttggttgtgatgatgtggtctggttgggcggtcgttctagatcggagtagaattctgtttcaaactacctggtggatttattaattttggatctgtatgtgtgtgccatacatattcatagttacgaattgaagatgatggatggaaatatcgatctaggataggtatacatgttgatgcgggttttactgatgcatatacagagatgctttttgttcgcttggttgtgatgatgtggtgtggttgggcggtcgttcattcgttctagatcggagtagaatactgtttcaaactacctggtgtatttattaattttggaactgtatgtgtgtgtcatacatcttcatagttacgagtttaagatggatggaaatatcgatctaggataggtatacatgttgatgtgggttttactgatgcatatacatgatggcatatgcagcatctattcatatgctctaaccttgagtacctatctattataataaacaagtatgttttataattattttgatcttgatatacttggatgatggcatatgcagcagctatatgtggatttttttagccctgccttcatacgctatttatttgcttggtactgtttcttttgtcgatgctcaccctgttgtttggtgttacttctgcaggactagtccagtgtggtggaattcgccatggactacaaagaccatgacggtgattataaagatcatgacatcgattacaaggatgacgatgacaagatggcccccaagaagaagaggaaggtgggcattcacggggtacctatggtggacttgaggacactcggttattcgcaacagcaacaggagaaaatcaagcctaaggtcaggagcaccgtcgcgcaacaccacgaggcgcttgtggggcatggcttcactcatgcgcatattgtcgcgctttcacagcaccctgcggcgcttgggacggtggctgtcaaataccaagatatgattgcggccctgcccgaagccacgcacgaggcaattgtaggggtcggtaaacagtggtcgggagcgcgagcacttgaggcgctgctgactgtggcgggtgagcttagggggcctccgctccagctcgacaccgggcagctgctgaagatcgcgaagagagggggagtaacagcggtagaggcagtgcacgcctggcgcaatgcgctcaccggggcccccttgaacctgaccccagaccaggtagtcgcaatcgcgtcgcatgacgggggaaagcaagccctggaaaccgtgcaaaggttgttgccggtcctttgtcaagaccacggccttacaccggagcaagtcgtggccattgcatcacatgacggtggcaaacaggctcttgagacggttcagagacttctcccagttctctgtcaagcccacgggctgactcccgatcaagttgtagcgattgcgagcaatgggggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacgcctgcacaagtggtcgccatcgcctccaatattggcggtaagcaggcgctggaaacagtacagcgcctgctgcctgtactgtgccaggatcatggactcaccccagaccaggtagtcgcaatcgcgtcgcatgacgggggaaagcaagccctggaaaccgtgcaaaggttgttgccggtcctttgtcaagaccacggccttacaccggatcaagtcgtggccattgcaaataataacggtggcaaacaggctcttgagacggttcagagacttctcccagttctctgtcaagcccacgggctgactcccgatcaagttgtagcgattgcgagcaacatcggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacgcctgcacaagtggtcgccatcgcctcccacgacggcggtaagcaggcgctggaaacagtacagcgcctgctgcctgtactgtgccaggatcatgggctgaccccagaccaggtagtcgcaatcgccaacaataacgggggaaagcaagccctggaaaccgtgcaaaggttgttgccggtcctttgtcaagaccacggccttacaccggagcaagtcgtggccattgcatcaaatatcggtggcaaacaggctcttgagacggttcagagacttctcccagttctctgtcaagcccacgggctgactcccgatcaagttgtagcgattgcgaataacaatggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacgcctgcacaagtggtcgccatcgccaacaacaacggcggtaagcaggcgctggaaacagtacagcgcctgctgcctgtactgtgccaggatcatggtttgaccccagaccaggtagtcgcaatcgcgtcgaacattgggggaaagcaagccctggaaaccgtgcaaaggttgttgccggtcctttgtcaagaccacggccttacaccggatcaagtcgtggccattgcaaataataacggtggcaaacaggctcttgagacggttcagagacttctcccagttctctgtcaagcccacgggctgactcccgatcaagttgtagcgattgcgaataacaatggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacgcctgcacaagtggtcgccatcgcctccaatattggcggtaagcaggcgctggaaacagtacagcgcctgctgcctgtactgtgccaggatcatggcctgacacccgaacaggtggtcgccattgctagcaacgggggaggacggccagccttggagtccatcgtagcccaattgtccaggcccgatcccgcgttggctgcgttaacgaatgaccatctggtggcgttggcatgtcttggtggacgacccgcgctcgatgcagtcaaaaagggtctgcctcatgctcccgcattgatcaaaagaaccaaccggcggattcccgagagaacttcccatcgagtcgcgggatcccagctggttaaatcagaactcgaagaaaaaaagagcgagctgcggcataaactcaaatatgtccctcatgagtacatagaactgattgaaatcgcccgcaattccacccaggatcggattcttgaaatgaaagtgatggaattttttatgaaagtttacggctatcgcgggaagcaccttggggggtcgcggaagccggacggtgctatttacactgtcggttccccgatcgattatggcgtaattgttgacacgaaagcatattcgggtgggtataatcttcctattggtcaggctgatgagatgcagcggtacgttgaagagaatcagacgcggaacaagcatattaacccaaatgagtggtggaaggtgtatccatcatcggtcaccgaatttaagttcttgtttgtgtcgggccactttaaggggaactacaaggcccaacttaccaggttgaatcacataaccaactgtaacggagctgttctgtcagtagaagagctgttgataggcggggaaatgattaaagcaggtacattaacgttggaggaagtacgccgcaagtttaataacggcgagattaactttagatctgagacctgataaacaaacacacggtctcctcgagctcgcagatcgttcaacatctggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgagatgggtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagatccgataagcttaagggcgaattcgacccagctttcttgtacaaagttggcattataaaaaataattgctcatcaatttgttgcaacgaacaggtcactatcagtcaaaataaaatcattatttgccatccagctgatatcccctatagtgagtcgtattacatggtcatagctgtttcctggcagctctggcccgtgtctcaaaatctctgatgttacattgcacaagataaaaatatatcatcatgcctcctctagaccagccaggacagaaatgcctcgacttcgctgctgcccaaggttgccgggtgacgcacaccgtggaaacggatgaaggcacgaacccagtggacataagcctgttcggttcgtaagctgtaatgcaagtagcgtatgcgctcacgcaactggtccagaaccttgaccgaacgcagcggtggtaacggcgcagtggcggttttcatggcttgttatgactgtttttttggggtacagtctatgcctcgggcatccaagcagcaagcgcgttacgccgtgggtcgatgtttgatgttatggagcagcaacgatgttacgcagcagggcagtcgccctaaaacaaagttaaacatcatgagggaagcggtgatcgccgaagtatcgactcaactatcagaggtagttggcgtcatcgagcgccatctcgaaccgacgttgctggccgtacatttgtacggctccgcagtggatggcggcctgaagccacacagtgatattgatttgctggttacggtgaccgtaaggcttgatgaaacaacgcggcgagctttgatcaacgaccttttggaaacttcggcttcccctggagagagcgagattctccgcgctgtagaagtcaccattgttgtgcacgacgacatcattccgtggcgttatccagctaagcgcgaactgcaatttggagaatggcagcgcaatgacattcttgcaggtatcttcgagccagccacgatcgacattgatctggctatcttgctgacaaaagcaagagaacatagcgttgccttggtaggtccagcggcggaggaactctttgatccggttcctgaacaggatctatttgaggcgctaaatgaaaccttaacgctatggaactcgccgcccgactgggctggcgatgagcgaaatgtagtgcttacgttgtcccgcatttggtacagcgcagtaaccggcaaaatcgcgccgaaggatgtcgctgccgactgggcaatggagcgcctgccggcccagtatcagcccgtcatacttgaagctagacaggcttatcttggacaagaagaagatcgcttggcctcgcgcgcagatcagttggaagaatttgtccactacgtgaaaggcgagatcaccaaggtagtcggcaaataaccctcgagccacccatgaccaaaatcccttaacgtgagttacgcgtcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagcattgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgtt

Claims (21)

  1. 単離された非自然発生DNA結合ポリペプチドであって、
    少なくとも1つのTALE反復単位;
    Nキャップポリペプチド;及び
    Cキャップポリペプチド
    を含み、前記Cキャップポリペプチドは、TALEタンパク質のフラグメントを含む、ポリペプチド。
  2. 少なくとも1つのTALE反復単位は、非定型の反復可変ジ残基(repeat variable di−residue)(RVD)を含む、請求項1に記載の単離されたポリペプチド。
  3. 前記タンパク質は、表27に示される非定型のRVDを含む、請求項2に記載のポリペプチド。
  4. 前記Cキャップポリペプチドは、約230アミノ酸長未満である、請求項1〜3のいずれかに記載のポリペプチド。
  5. 前記Cキャップは、TALE反復ドメインを含む、請求項1〜5のいずれかに記載のポリペプチド。
  6. 請求項1〜5のいずれかに記載のポリペプチドと、少なくとも1つの機能ドメインと、を含む、融合タンパク質。
  7. 前記機能ドメインは、転写活性化因子又は転写抑制因子である、請求項6に記載の融合タンパク質。
  8. 前記機能ドメインは、ヌクレアーゼを含む、請求項7に記載の融合タンパク質。
  9. 前記ヌクレアーゼは、IIS型エンドヌクレアーゼからの少なくとも1つの切断ドメイン又は切断半ドメインを含む、請求項8に記載の融合タンパク質。
  10. 請求項1〜5のいずれかに記載のポリペプチド又は請求項6〜9のいずれかに記載の融合タンパク質をコードする、ポリヌクレオチド。
  11. 請求項1〜5のいずれかに記載のポリペプチド、請求項6〜9のいずれかに記載の融合タンパク質、又は請求項10に記載のポリヌクレオチドを含む、宿主細胞。
  12. 請求項1〜5のいずれかに記載のポリペプチド、請求項6〜9のいずれかに記載の融合タンパク質、又は請求項10に記載のポリヌクレオチドを含む、薬学的組成物。
  13. 細胞内の内在性遺伝子の発現を調節する方法であって、
    前記細胞内に、請求項6〜9のいずれかに記載の融合タンパク質又は前記融合タンパク質をコードするポリヌクレオチドを導入することを含み、前記融合タンパク質は、前記内在性遺伝子内の標的部位に結合するTALE反復ドメインを含み、さらに前記内在性遺伝子の発現が調節される、方法。
  14. 前記調節は、遺伝子活性化を含む、請求項13に記載の方法。
  15. 前記調節は、遺伝子抑制又は不活性化を含む、請求項13に記載の方法。
  16. 前記融合タンパク質は、切断ドメイン又は切断半ドメインを含み、前記内在性遺伝子は、切断によって不活性化される、請求項15に記載の方法。
  17. 不活性化は、非相同末端結合(NHEJ)を介して生じる、請求項16に記載の方法。
  18. 細胞のゲノム内の目的とする領域を修飾する方法であって、
    前記細胞に、請求項8若しくは9に記載の少なくとも1つの融合タンパク質又は前記融合タンパク質をコードするポリヌクレオチドを導入することを含み、前記融合タンパク質は、前記細胞のゲノム内で標的部位に結合するTALE反復ドメインを含み、前記融合タンパク質は、前記目的とする領域内で前記ゲノムを切断する、方法。
  19. 前記修飾することは、前記目的とする領域に欠失を導入することを含む、請求項18に記載の方法。
  20. 前記修飾することは、外因性核酸を前記目的とする領域に導入することを含み、前記方法は、前記外因性核酸を前記細胞に導入することをさらに含み、前記外因性核酸は、相同組換え又はNHEJ媒介末端捕捉によって前記目的とする領域に組み込まれる、請求項18に記載の方法。
  21. 前記細胞は、植物細胞、動物細胞、魚細胞、及び酵母細胞からなる群から選択される真核細胞である、請求項13〜20のいずれかに記載の方法。
JP2013511148A 2010-05-17 2011-05-17 新規のdna結合タンパク質及びその使用 Active JP6208580B2 (ja)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US39583610P 2010-05-17 2010-05-17
US61/395,836 2010-05-17
US40142910P 2010-08-12 2010-08-12
US61/401,429 2010-08-12
US45512110P 2010-10-13 2010-10-13
US61/455,121 2010-10-13
US201061459891P 2010-12-20 2010-12-20
US61/459,891 2010-12-20
US201161462482P 2011-02-02 2011-02-02
US61/462,482 2011-02-02
US201161465869P 2011-03-24 2011-03-24
US61/465,869 2011-03-24
PCT/US2011/000885 WO2011146121A1 (en) 2010-05-17 2011-05-17 Novel dna-binding proteins and uses thereof

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016135751A Division JP2016182143A (ja) 2010-05-17 2016-07-08 新規のdna結合タンパク質及びその使用

Publications (2)

Publication Number Publication Date
JP2013529083A true JP2013529083A (ja) 2013-07-18
JP6208580B2 JP6208580B2 (ja) 2017-10-04

Family

ID=44991974

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013511148A Active JP6208580B2 (ja) 2010-05-17 2011-05-17 新規のdna結合タンパク質及びその使用
JP2016135751A Pending JP2016182143A (ja) 2010-05-17 2016-07-08 新規のdna結合タンパク質及びその使用

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2016135751A Pending JP2016182143A (ja) 2010-05-17 2016-07-08 新規のdna結合タンパク質及びその使用

Country Status (9)

Country Link
US (8) US8586526B2 (ja)
EP (2) EP2571512B1 (ja)
JP (2) JP6208580B2 (ja)
KR (1) KR101953237B1 (ja)
CN (1) CN103025344B (ja)
AU (1) AU2011256838B2 (ja)
CA (1) CA2798988C (ja)
IL (1) IL222961B (ja)
WO (1) WO2011146121A1 (ja)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014521317A (ja) * 2011-07-15 2014-08-28 ザ ジェネラル ホスピタル コーポレイション 転写活性化因子様エフェクターの組立て方法
WO2015020218A1 (ja) * 2013-08-09 2015-02-12 独立行政法人理化学研究所 Dna結合タンパク質ドメインの改変による高活性taleタンパク質
WO2015019672A1 (ja) * 2013-08-09 2015-02-12 国立大学法人広島大学 Dna結合ドメインを含むポリペプチド
WO2015068785A1 (ja) 2013-11-06 2015-05-14 国立大学法人広島大学 核酸挿入用ベクター
JP2016529904A (ja) * 2013-08-27 2016-09-29 リコンビネティクス・インコーポレイテッドRecombinetics,Inc. 効率的な非減数分裂対立遺伝子移入
WO2016159110A1 (ja) * 2015-03-31 2016-10-06 国立研究開発法人農業生物資源研究所 バイナリー遺伝子発現システム
JP2016175922A (ja) * 2016-04-25 2016-10-06 国立大学法人広島大学 Dna結合ドメインを含むポリペプチド
US9890364B2 (en) 2012-05-29 2018-02-13 The General Hospital Corporation TAL-Tet1 fusion proteins and methods of use thereof
JP2018057407A (ja) * 2013-11-18 2018-04-12 クリスパー セラピューティクス アーゲー Crispr−casシステムの材料及び方法
US10006011B2 (en) 2013-08-09 2018-06-26 Hiroshima University Polypeptide containing DNA-binding domain
US10676749B2 (en) 2013-02-07 2020-06-09 The General Hospital Corporation Tale transcriptional activators
JP2020110152A (ja) * 2013-07-26 2020-07-27 プレジデント アンド フェローズ オブ ハーバード カレッジ ゲノムエンジニアリング
WO2020209332A1 (ja) 2019-04-09 2020-10-15 国立研究開発法人科学技術振興機構 核酸結合性タンパク質
JP2020531572A (ja) * 2017-08-04 2020-11-05 北京大学Peking University メチル化により修飾されたdna塩基を特異的に認識するtale rvdおよびその使用
US10920242B2 (en) 2011-02-25 2021-02-16 Recombinetics, Inc. Non-meiotic allele introgression
US11624077B2 (en) 2017-08-08 2023-04-11 Peking University Gene knockout method
US11891631B2 (en) 2012-10-12 2024-02-06 The General Hospital Corporation Transcription activator-like effector (tale) - lysine-specific demethylase 1 (LSD1) fusion proteins

Families Citing this family (553)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120196370A1 (en) 2010-12-03 2012-08-02 Fyodor Urnov Methods and compositions for targeted genomic deletion
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
US8772008B2 (en) * 2009-05-18 2014-07-08 Sangamo Biosciences, Inc. Methods and compositions for increasing nuclease activity
US20120204278A1 (en) 2009-07-08 2012-08-09 Kymab Limited Animal models and therapeutic molecules
US9445581B2 (en) 2012-03-28 2016-09-20 Kymab Limited Animal models and therapeutic molecules
DK2517557T4 (da) 2009-07-08 2023-09-25 Kymab Ltd Dyremodeller og terapeutiske molekyler
US8586526B2 (en) 2010-05-17 2013-11-19 Sangamo Biosciences, Inc. DNA-binding proteins and uses thereof
CN106834320B (zh) 2009-12-10 2021-05-25 明尼苏达大学董事会 Tal效应子介导的dna修饰
EP4328304A2 (en) 2010-02-08 2024-02-28 Sangamo Therapeutics, Inc. Engineered cleavage half-domains
EP2660318A1 (en) * 2010-02-09 2013-11-06 Sangamo BioSciences, Inc. Targeted genomic modification with partially single-stranded donor molecules
BR112012020257A8 (pt) * 2010-02-11 2018-02-14 Recombinetics Inc métodos e aparelhos para produzir artiodátilos transgênicos
US9567573B2 (en) 2010-04-26 2017-02-14 Sangamo Biosciences, Inc. Genome editing of a Rosa locus using nucleases
EP2392208B1 (en) * 2010-06-07 2016-05-04 Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Fusion proteins comprising a DNA-binding domain of a Tal effector protein and a non-specific cleavage domain of a restriction nuclease and their use
CA2805442C (en) 2010-07-21 2020-05-12 Sangamo Biosciences, Inc. Methods and compositions for modification of an hla locus
AU2011312562B2 (en) 2010-09-27 2014-10-09 Sangamo Therapeutics, Inc. Methods and compositions for inhibiting viral entry into cells
CA2814143C (en) 2010-10-12 2020-09-08 The Children's Hospital Of Philadelphia Methods and compositions for treating hemophilia b
US9267123B2 (en) 2011-01-05 2016-02-23 Sangamo Biosciences, Inc. Methods and compositions for gene correction
KR20140046408A (ko) * 2011-02-25 2014-04-18 리컴비네틱스 인코포레이티드 유전자 변형 동물 및 이의 생산방법
SG10201602651YA (en) 2011-04-05 2016-05-30 Cellectis Method for the generation of compact tale-nucleases and uses thereof
WO2012145601A2 (en) 2011-04-22 2012-10-26 The Regents Of The University Of California Adeno-associated virus virions with variant capsid and methods of use thereof
ES2657825T3 (es) 2011-06-06 2018-03-07 Bayer Cropscience Nv Métodos y medios para modificar el genoma de una planta en un sitio preseleccionado
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
CA2841541C (en) 2011-07-25 2019-11-12 Sangamo Biosciences, Inc. Methods and compositions for alteration of a cystic fibrosis transmembrane conductance regulator (cftr) gene
US9370551B2 (en) * 2011-07-27 2016-06-21 The Broad Institute, Inc. Compositions and methods of treating head and neck cancer
CN103981149A (zh) 2011-08-22 2014-08-13 拜尔作物科学公司 修饰植物基因组的方法和手段
EP3839049A3 (en) 2011-09-19 2021-10-20 Kymab Limited Antibodies, variable domains & chains tailored for human use
KR102209330B1 (ko) 2011-09-21 2021-01-29 상가모 테라퓨틱스, 인코포레이티드 이식 유전자 발현의 조절을 위한 방법 및 조성물
WO2013045916A1 (en) 2011-09-26 2013-04-04 Kymab Limited Chimaeric surrogate light chains (slc) comprising human vpreb
US9222105B2 (en) 2011-10-27 2015-12-29 Sangamo Biosciences, Inc. Methods and compositions for modification of the HPRT locus
WO2013074999A1 (en) 2011-11-16 2013-05-23 Sangamo Biosciences, Inc. Modified dna-binding proteins and uses thereof
EP2780376B1 (en) * 2011-11-18 2017-03-08 Université Laval Methods and products for increasing frataxin levels and uses thereof
US8450107B1 (en) 2011-11-30 2013-05-28 The Broad Institute Inc. Nucleotide-specific recognition sequences for designer TAL effectors
US10801017B2 (en) 2011-11-30 2020-10-13 The Broad Institute, Inc. Nucleotide-specific recognition sequences for designer TAL effectors
US20130137173A1 (en) * 2011-11-30 2013-05-30 Feng Zhang Nucleotide-specific recognition sequences for designer tal effectors
US9253965B2 (en) 2012-03-28 2016-02-09 Kymab Limited Animal models and therapeutic molecules
EP3835420A1 (en) 2011-12-05 2021-06-16 Factor Bioscience Inc. Methods and products for transfecting cells
CA3226329A1 (en) * 2011-12-16 2013-06-20 Targetgene Biotechnologies Ltd Compositions and methods for modifying a predetermined target nucleic acid sequence
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
CN103193871B (zh) * 2012-01-04 2018-05-15 清华大学 根据蛋白质-dna复合物晶体结构设计新型tale的方法
WO2013102289A1 (zh) * 2012-01-04 2013-07-11 清华大学 特异结合和靶定dna-rna 杂合双链的方法
WO2013102290A1 (zh) * 2012-01-04 2013-07-11 清华大学 特异识别含有5-甲基化胞嘧啶的dna的方法
CA2865011C (en) 2012-02-29 2021-06-15 Sangamo Biosciences, Inc. Methods and compositions for treating huntington's disease
DK3415158T3 (da) 2012-03-15 2021-01-11 Cellectis Repeat-variable direster til targeting af nukleotider
US9637739B2 (en) * 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
US10251377B2 (en) 2012-03-28 2019-04-09 Kymab Limited Transgenic non-human vertebrate for the expression of class-switched, fully human, antibodies
GB2502127A (en) 2012-05-17 2013-11-20 Kymab Ltd Multivalent antibodies and in vivo methods for their production
US20130274129A1 (en) 2012-04-04 2013-10-17 Geneart Ag Tal-effector assembly platform, customized services, kits and assays
US11518997B2 (en) 2012-04-23 2022-12-06 BASF Agricultural Solutions Seed US LLC Targeted genome engineering in plants
CN109536526B (zh) 2012-04-25 2020-06-09 瑞泽恩制药公司 核酸酶介导的使用大靶向载体的靶向
EP3597741A1 (en) 2012-04-27 2020-01-22 Duke University Genetic correction of mutated genes
US9738879B2 (en) 2012-04-27 2017-08-22 Duke University Genetic correction of mutated genes
CN104428414B (zh) 2012-05-02 2022-01-21 陶氏益农公司 苹果酸脱氢酶的靶向修饰
KR102116153B1 (ko) 2012-05-07 2020-05-27 상가모 테라퓨틱스, 인코포레이티드 도입유전자의 뉴클레아제-매개 표적화된 통합을 위한 방법 및 조성물
EA201492222A1 (ru) * 2012-05-25 2015-05-29 Селлектис Способы конструирования неаллореактивной и устойчивой к иммуносупрессии т-клетки для иммунотерапии
UA118014C2 (uk) 2012-05-25 2018-11-12 Те Ріджентс Оф Те Юніверсіті Оф Каліфорнія Спосіб модифікації днк-мішені
US20150017136A1 (en) * 2013-07-15 2015-01-15 Cellectis Methods for engineering allogeneic and highly active t cell for immunotherapy
US10815500B2 (en) * 2012-06-05 2020-10-27 Cellectis Transcription activator-like effector (TALE) fusion protein
EP2861737B1 (en) 2012-06-19 2019-04-17 Regents Of The University Of Minnesota Gene targeting in plants using dna viruses
AR091482A1 (es) * 2012-06-21 2015-02-04 Recombinetics Inc Celulas modificadas geneticamente y metodos par su obtencion
US10648001B2 (en) 2012-07-11 2020-05-12 Sangamo Therapeutics, Inc. Method of treating mucopolysaccharidosis type I or II
EP2872154B1 (en) 2012-07-11 2017-05-31 Sangamo BioSciences, Inc. Methods and compositions for delivery of biologics
EP2872625B1 (en) 2012-07-11 2016-11-16 Sangamo BioSciences, Inc. Methods and compositions for the treatment of lysosomal storage diseases
US20150104873A1 (en) * 2012-07-11 2015-04-16 University of Nevada, Las Vegas Genome Surgery with Paired, Permeant Endonuclease Construct
WO2014018601A2 (en) * 2012-07-24 2014-01-30 Cellectis New modular base-specific nucleic acid binding domains from burkholderia rhizoxinica proteins
CN105188767A (zh) * 2012-07-25 2015-12-23 布罗德研究所有限公司 可诱导的dna结合蛋白和基因组干扰工具及其应用
US10058078B2 (en) 2012-07-31 2018-08-28 Recombinetics, Inc. Production of FMDV-resistant livestock by allele substitution
EP2890780B8 (en) 2012-08-29 2020-08-19 Sangamo Therapeutics, Inc. Methods and compositions for treatment of a genetic condition
KR102357105B1 (ko) * 2012-09-04 2022-02-08 더 스크립스 리서치 인스티튜트 표적화된 바인딩 특이도를 갖는 키메라 폴리펩타이드들
UA119135C2 (uk) 2012-09-07 2019-05-10 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб отримання трансгенної рослини
UA118090C2 (uk) * 2012-09-07 2018-11-26 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив
CA2884162C (en) 2012-09-07 2020-12-29 Dow Agrosciences Llc Fad3 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks
US9597357B2 (en) 2012-10-10 2017-03-21 Sangamo Biosciences, Inc. T cell modifying compounds and uses thereof
CN103772506A (zh) * 2012-10-22 2014-05-07 北京唯尚立德生物科技有限公司 一种“转录激活子样效应因子-功能基团-雌激素受体”功能蛋白及其应用
CN110669746B (zh) 2012-10-23 2024-04-16 基因工具股份有限公司 用于切割靶dna的组合物及其用途
MX367031B (es) 2012-11-01 2019-08-02 Cellectis Plantas para la produccion de proteinas terapeuticas.
CA2890110C (en) 2012-11-01 2023-05-02 Factor Bioscience Inc. Methods and products for expressing proteins in cells
AU2013346504A1 (en) 2012-11-16 2015-06-18 Cellectis Method for targeted modification of algae genomes
CA2891510C (en) * 2012-11-16 2022-10-18 Transposagen Biopharmaceuticals, Inc. Site-specific enzymes and methods of use
CN104884626A (zh) * 2012-11-20 2015-09-02 杰.尔.辛普洛公司 Tal介导的转移dna插入
EP2929017A4 (en) 2012-12-05 2016-09-28 Sangamo Biosciences Inc METHODS AND COMPOSITIONS FOR REGULATION OF METABOLIC DISORDERS
IL300199A (en) * 2012-12-06 2023-03-01 Sigma Aldrich Co Llc CRISPR-based genome modification and regulation
SG10201912327SA (en) 2012-12-12 2020-02-27 Broad Inst Inc Engineering and Optimization of Improved Systems, Methods and Enzyme Compositions for Sequence Manipulation
DK2921557T3 (en) 2012-12-12 2016-11-07 Broad Inst Inc Design of systems, methods and optimized sequence manipulation guide compositions
EP3434776A1 (en) 2012-12-12 2019-01-30 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
US8697359B1 (en) * 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
DK2931898T3 (en) 2012-12-12 2016-06-20 Massachusetts Inst Technology CONSTRUCTION AND OPTIMIZATION OF SYSTEMS, PROCEDURES AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH FUNCTIONAL DOMAINS
PL2921557T3 (pl) * 2012-12-12 2017-03-31 Broad Inst Inc Projektowanie systemów, sposoby i optymalizowane kompozycje kierujące do manipulacji sekwencją
RU2721275C2 (ru) * 2012-12-12 2020-05-18 Те Брод Инститьют, Инк. Доставка, конструирование и оптимизация систем, способов и композиций для манипуляции с последовательностями и применения в терапии
CA2894668A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas systems and methods for altering expression of gene products in eukaryotic cells
ES2741951T3 (es) * 2012-12-17 2020-02-12 Harvard College Modificación por ingeniería genética del genoma humano guiada por ARN
US9708589B2 (en) 2012-12-18 2017-07-18 Monsanto Technology Llc Compositions and methods for custom site-specific DNA recombinases
TR201808715T4 (tr) 2012-12-21 2018-07-23 Cellectis Düşük soğuk indüklü tatlandırması olan patatesler.
ES2904803T3 (es) 2013-02-20 2022-04-06 Regeneron Pharma Modificación genética de ratas
WO2014130955A1 (en) 2013-02-25 2014-08-28 Sangamo Biosciences, Inc. Methods and compositions for enhancing nuclease-mediated gene disruption
JP2016507244A (ja) 2013-02-27 2016-03-10 ヘルムホルツ・ツェントルム・ミュンヒェン・ドイチェス・フォルシュンクスツェントルム・フューア・ゲズントハイト・ウント・ウムベルト(ゲーエムベーハー)Helmholtz Zentrum MuenchenDeutsches Forschungszentrum fuer Gesundheit und Umwelt (GmbH) Cas9ヌクレアーゼによる卵母細胞における遺伝子編集
US10240125B2 (en) 2013-03-14 2019-03-26 Immusoft Corporation Methods for in vitro memory B cell differentiation and transduction with VSV-G pseudotyped viral vectors
AU2014235794A1 (en) 2013-03-14 2015-10-22 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
US20140363561A1 (en) * 2013-03-15 2014-12-11 J.R. Simplot Company Tal-mediated transfer dna insertion
US10793867B2 (en) 2013-03-15 2020-10-06 Monsanto Technology, Llc Methods for targeted transgene-integration using custom site-specific DNA recombinases
US11332719B2 (en) * 2013-03-15 2022-05-17 The Broad Institute, Inc. Recombinant virus and preparations thereof
US10113162B2 (en) 2013-03-15 2018-10-30 Cellectis Modifying soybean oil composition through targeted knockout of the FAD2-1A/1B genes
US11039586B2 (en) 2013-03-15 2021-06-22 Monsanto Technology Llc Creation and transmission of megaloci
EP2970997A1 (en) * 2013-03-15 2016-01-20 Regents of the University of Minnesota Engineering plant genomes using crispr/cas systems
US9788534B2 (en) 2013-03-18 2017-10-17 Kymab Limited Animal models and therapeutic molecules
US9828582B2 (en) * 2013-03-19 2017-11-28 Duke University Compositions and methods for the induction and tuning of gene expression
WO2014153470A2 (en) 2013-03-21 2014-09-25 Sangamo Biosciences, Inc. Targeted disruption of t cell receptor genes using engineered zinc finger protein nucleases
EP2981614A1 (en) 2013-04-02 2016-02-10 Bayer CropScience NV Targeted genome engineering in eukaryotes
RU2723130C2 (ru) 2013-04-05 2020-06-08 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи Способы и композиции для встраивания экзогенной последовательности в геном растений
WO2014169810A1 (zh) * 2013-04-16 2014-10-23 深圳华大基因科技服务有限公司 分离的寡核苷酸及其用途
ES2699578T3 (es) 2013-04-16 2019-02-11 Regeneron Pharma Modificación direccionada del genoma de rata
CN103233004B (zh) * 2013-04-28 2015-04-29 新疆农垦科学院 一种人工dna分子及检测目标基因表达的方法
US9783618B2 (en) 2013-05-01 2017-10-10 Kymab Limited Manipulation of immunoglobulin gene diversity and multi-antibody therapeutics
US11707056B2 (en) 2013-05-02 2023-07-25 Kymab Limited Animals, repertoires and methods
US9783593B2 (en) 2013-05-02 2017-10-10 Kymab Limited Antibodies, variable domains and chains tailored for human use
JP2016518142A (ja) 2013-05-10 2016-06-23 サンガモ バイオサイエンシーズ, インコーポレイテッド ヌクレアーゼ媒介ゲノム遺伝子操作のための送達方法および組成物
US11311575B2 (en) 2013-05-13 2022-04-26 Cellectis Methods for engineering highly active T cell for immunotherapy
US11077144B2 (en) 2013-05-13 2021-08-03 Cellectis CD19 specific chimeric antigen receptor and uses thereof
US9873894B2 (en) 2013-05-15 2018-01-23 Sangamo Therapeutics, Inc. Methods and compositions for treatment of a genetic condition
KR20230136697A (ko) * 2013-06-05 2023-09-26 듀크 유니버시티 Rna-가이드 유전자 편집 및 유전자 조절
EP3011033B1 (en) 2013-06-17 2020-02-19 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
WO2014204729A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using viral components
JP6625971B2 (ja) 2013-06-17 2019-12-25 ザ・ブロード・インスティテュート・インコーポレイテッド 配列操作のためのタンデムガイド系、方法および組成物の送達、エンジニアリングおよび最適化
CN113425857A (zh) 2013-06-17 2021-09-24 布罗德研究所有限公司 用于肝靶向和治疗的crispr-cas系统、载体和组合物的递送与用途
AU2014281027A1 (en) 2013-06-17 2016-01-28 Massachusetts Institute Of Technology Optimized CRISPR-Cas double nickase systems, methods and compositions for sequence manipulation
FR3008424B1 (fr) * 2013-07-09 2017-12-15 Centre National De La Recherche Scient (Cnrs) Procede de modification ciblee du genome pour la generation d'un organisme animal
AU2014287397B2 (en) 2013-07-10 2019-10-10 President And Fellows Of Harvard College Orthogonal Cas9 proteins for RNA-guided gene regulation and editing
US20160264982A1 (en) * 2013-07-16 2016-09-15 Shanghai Institutes For Biological Sciences, Chinese Academy Of Sciences Method for plant genome site-directed modification
WO2015017866A1 (en) 2013-08-02 2015-02-05 Enevolv, Inc. Processes and host cells for genome, pathway, and biomolecular engineering
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
EP3988654A1 (en) 2013-08-28 2022-04-27 Sangamo Therapeutics, Inc. Compositions for linking dna-binding domains and cleavage domains
WO2015033343A1 (en) 2013-09-03 2015-03-12 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Compositions and methods for expressing recombinant polypeptides
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US20150079680A1 (en) 2013-09-18 2015-03-19 Kymab Limited Methods, cells & organisms
EP3051942B1 (en) 2013-10-01 2020-09-02 Kymab Limited Animal models and therapeutic molecules
US9476884B2 (en) 2013-10-04 2016-10-25 University Of Massachusetts Hybridization- independent labeling of repetitive DNA sequence in human chromosomes
EP3057432B1 (en) 2013-10-17 2018-11-21 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering in hematopoietic stem cells
CN110713995B (zh) 2013-10-17 2023-08-01 桑格摩生物科学股份有限公司 用于核酸酶介导的基因组工程改造的递送方法和组合物
JP6484987B2 (ja) 2013-10-21 2019-03-20 Jnc株式会社 エビルシフェラーゼの触媒蛋白質の変異遺伝子とその使用法
WO2015059690A1 (en) 2013-10-24 2015-04-30 Yeda Research And Development Co. Ltd. Polynucleotides encoding brex system polypeptides and methods of using s ame
MX2016005379A (es) 2013-10-25 2017-02-15 Livestock Improvement Corp Ltd Marcadores geneticos y usos de los mismos.
WO2015065964A1 (en) 2013-10-28 2015-05-07 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
UA121459C2 (uk) 2013-11-04 2020-06-10 Дау Агросаєнсиз Елелсі Рекомбінантна молекула нуклеїнової кислоти для трансформації рослини сої
BR102014027436B1 (pt) 2013-11-04 2022-06-28 Dow Agrosciences Llc Molécula de ácido nucleico recombinante, e método para a produção de uma célula vegetal transgênica
EP3066110B1 (en) 2013-11-04 2021-12-29 Corteva Agriscience LLC Optimal maize loci
JP6633532B2 (ja) 2013-11-04 2020-01-22 ダウ アグロサイエンシィズ エルエルシー 最適なトウモロコシ遺伝子座
CN111218447A (zh) 2013-11-07 2020-06-02 爱迪塔斯医药有限公司 使用统治型gRNA的CRISPR相关方法和组合物
EP3068905A4 (en) 2013-11-11 2017-07-05 Sangamo BioSciences, Inc. Methods and compositions for treating huntington's disease
PT3492593T (pt) 2013-11-13 2021-10-18 Childrens Medical Center Regulação da expressão de genes mediada por nucleases
US9951353B2 (en) * 2013-11-15 2018-04-24 The United States Of America, As Represented By The Secretary, Dept. Of Health And Human Services Engineering neural stem cells using homologous recombination
EP2878667A1 (en) * 2013-11-29 2015-06-03 Institut Pasteur TAL effector means useful for partial or full deletion of DNA tandem repeats
CN105940109A (zh) 2013-12-06 2016-09-14 国立健康与医学研究所 用于在受试者的视网膜色素上皮中表达目的多核苷酸的方法和药物组合物
CN105940013B (zh) 2013-12-09 2020-03-27 桑格摩生物科学股份有限公司 用于治疗血友病的方法和组合物
KR102170502B1 (ko) 2013-12-11 2020-10-28 리제너론 파마슈티칼스 인코포레이티드 게놈의 표적화된 변형을 위한 방법 및 조성물
US20150166985A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting von willebrand factor point mutations
KR20160097327A (ko) 2013-12-12 2016-08-17 더 브로드 인스티튜트, 인코퍼레이티드 유전자 산물, 구조 정보 및 유도성 모듈형 cas 효소의 발현의 변경을 위한 crispr-cas 시스템 및 방법
CA2932436A1 (en) 2013-12-12 2015-06-18 The Broad Institute, Inc. Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders
WO2015089364A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
JP6793547B2 (ja) 2013-12-12 2020-12-02 ザ・ブロード・インスティテュート・インコーポレイテッド 最適化機能CRISPR−Cas系による配列操作のための系、方法および組成物
SG10201804976YA (en) 2013-12-12 2018-07-30 Broad Inst Inc Delivery, Use and Therapeutic Applications of the Crispr-Cas Systems and Compositions for Genome Editing
AU2014368892B2 (en) 2013-12-20 2019-06-13 Fred Hutchinson Cancer Center Tagged chimeric effector molecules and receptors thereof
US10774338B2 (en) 2014-01-16 2020-09-15 The Regents Of The University Of California Generation of heritable chimeric plant traits
KR102415811B1 (ko) 2014-01-31 2022-07-04 팩터 바이오사이언스 인크. 핵산 제조 및 송달을 위한 방법 및 산물
SI3102673T1 (sl) 2014-02-03 2020-11-30 Sangamo Therapeutics, Inc. Postopki in sestavki za zdravljenje beta talasemije
CN113215219A (zh) 2014-02-13 2021-08-06 宝生物工程(美国) 有限公司 从核酸的初始集合中耗尽靶分子的方法、以及用于实践其的组合物和试剂盒
CN104844696A (zh) * 2014-02-19 2015-08-19 北京大学 一种转录激活子样效应因子功能蛋白设计、合成及其应用
WO2015127439A1 (en) 2014-02-24 2015-08-27 Sangamo Biosciences, Inc. Methods and compositions for nuclease-mediated targeted integration
TW201538518A (zh) 2014-02-28 2015-10-16 Dow Agrosciences Llc 藉由嵌合基因調控元件所賦予之根部特異性表現
EP3114227B1 (en) 2014-03-05 2021-07-21 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa
US11141493B2 (en) 2014-03-10 2021-10-12 Editas Medicine, Inc. Compositions and methods for treating CEP290-associated disease
EP3116997B1 (en) 2014-03-10 2019-05-15 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating leber's congenital amaurosis 10 (lca10)
US11339437B2 (en) 2014-03-10 2022-05-24 Editas Medicine, Inc. Compositions and methods for treating CEP290-associated disease
EP3929279A1 (en) 2014-03-18 2021-12-29 Sangamo Therapeutics, Inc. Methods and compositions for regulation of zinc finger protein expression
EP3981876A1 (en) 2014-03-26 2022-04-13 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating sickle cell disease
US10507232B2 (en) 2014-04-02 2019-12-17 University Of Florida Research Foundation, Incorporated Materials and methods for the treatment of latent viral infection
CN103923215B (zh) * 2014-04-15 2016-02-10 中国农业大学 使ACC-α基因启动子PⅢ失活的物质及其应用
JP6265020B2 (ja) * 2014-04-16 2018-01-24 Jnc株式会社 エビルシフェラーゼの触媒蛋白質の変異遺伝子とその使用法
US9522936B2 (en) 2014-04-24 2016-12-20 Sangamo Biosciences, Inc. Engineered transcription activator like effector (TALE) proteins
DE102014106327A1 (de) 2014-05-07 2015-11-12 Universitätsklinikum Hamburg-Eppendorf (UKE) TAL-Effektornuklease zum gezielten Knockout des HIV-Korezeptors CCR5
CN106413760B (zh) 2014-05-08 2020-01-14 桑格摩生物科学股份有限公司 用于治疗亨廷顿病的方法和组合物
WO2015175642A2 (en) 2014-05-13 2015-11-19 Sangamo Biosciences, Inc. Methods and compositions for prevention or treatment of a disease
EP3152319A4 (en) 2014-06-05 2017-12-27 Sangamo BioSciences, Inc. Methods and compositions for nuclease design
CA2952906A1 (en) 2014-06-20 2015-12-23 Cellectis Potatoes with reduced granule-bound starch synthase
CA2954201A1 (en) 2014-07-08 2016-01-14 Vib Vzw Means and methods to increase plant yield
WO2016005985A2 (en) 2014-07-09 2016-01-14 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Method for reprogramming cells
MX2017000555A (es) 2014-07-14 2017-08-10 Univ Washington State Desactivacion de nanos que produce ablacion de celulas de linea germinal.
US10738278B2 (en) 2014-07-15 2020-08-11 Juno Therapeutics, Inc. Engineered cells for adoptive cell therapy
WO2016014837A1 (en) 2014-07-25 2016-01-28 Sangamo Biosciences, Inc. Gene editing for hiv gene therapy
US9816074B2 (en) 2014-07-25 2017-11-14 Sangamo Therapeutics, Inc. Methods and compositions for modulating nuclease-mediated genome engineering in hematopoietic stem cells
CA2956224A1 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
WO2016019144A2 (en) 2014-07-30 2016-02-04 Sangamo Biosciences, Inc. Gene correction of scid-related genes in hematopoietic stem and progenitor cells
ES2746529T3 (es) 2014-09-04 2020-03-06 Memorial Sloan Kettering Cancer Center Terapia génica de globina para tratar hemoglobinopatías
IL234638A0 (en) 2014-09-14 2014-12-02 Yeda Res & Dev NMDA receptor antagonists for the treatment of Gaucher disease
CN113699113A (zh) 2014-09-16 2021-11-26 桑格摩治疗股份有限公司 用于造血干细胞中核酸酶介导的基因组工程化和校正的方法和组合物
CN105440111B (zh) * 2014-09-30 2019-08-13 深圳华大基因研究院 一对转录激活子样效应因子核酸酶及其编码序列与应用
WO2016054326A1 (en) 2014-10-01 2016-04-07 The General Hospital Corporation Methods for increasing efficiency of nuclease-induced homology-directed repair
WO2016077273A1 (en) * 2014-11-11 2016-05-19 Q Therapeutics, Inc. Engineering mesenchymal stem cells using homologous recombination
WO2016081924A1 (en) 2014-11-20 2016-05-26 Duke University Compositions, systems and methods for cell therapy
US10457960B2 (en) 2014-11-21 2019-10-29 Regeneron Pharmaceuticals, Inc. Methods and compositions for targeted genetic modification using paired guide RNAs
WO2016094867A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Protected guide rnas (pgrnas)
US10889834B2 (en) 2014-12-15 2021-01-12 Sangamo Therapeutics, Inc. Methods and compositions for enhancing targeted transgene integration
CN107109427B (zh) 2014-12-23 2021-06-18 先正达参股股份有限公司 用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物
EP3247366A4 (en) 2015-01-21 2018-10-31 Sangamo Therapeutics, Inc. Methods and compositions for identification of highly specific nucleases
JP6929791B2 (ja) 2015-02-09 2021-09-01 デューク ユニバーシティ エピゲノム編集のための組成物および方法
EP3256585A4 (en) 2015-02-13 2018-08-15 Factor Bioscience Inc. Nucleic acid products and methods of administration thereof
WO2016135507A1 (en) * 2015-02-27 2016-09-01 University Of Edinburgh Nucleic acid editing systems
CN104694539A (zh) * 2015-03-09 2015-06-10 上海市同济医院 一种利用talen技术构建可敲除小鼠cramp基因质粒的方法
EP3273971A4 (en) 2015-03-27 2018-12-05 Yeda Research and Development Co. Ltd. Methods of treating motor neuron diseases
EP4335918A3 (en) 2015-04-03 2024-04-17 Dana-Farber Cancer Institute, Inc. Composition and methods of genome editing of b-cells
JP2018511333A (ja) 2015-04-15 2018-04-26 ダウ アグロサイエンシィズ エルエルシー 導入遺伝子発現のための植物プロモータ
KR20170136573A (ko) 2015-04-15 2017-12-11 다우 아그로사이언시즈 엘엘씨 트랜스젠 발현을 위한 식물 프로모터
KR102535217B1 (ko) 2015-04-24 2023-05-19 에디타스 메디신, 인코포레이티드 Cas9 분자/가이드 rna 분자 복합체의 평가
US11827904B2 (en) 2015-04-29 2023-11-28 Fred Hutchinson Cancer Center Modified stem cells and uses thereof
US10179918B2 (en) 2015-05-07 2019-01-15 Sangamo Therapeutics, Inc. Methods and compositions for increasing transgene activity
MX2017014446A (es) 2015-05-12 2018-06-13 Sangamo Therapeutics Inc Regulacion de expresion genica mediada por nucleasa.
EP3303586A1 (en) 2015-05-29 2018-04-11 Juno Therapeutics, Inc. Composition and methods for regulating inhibitory interactions in genetically engineered cells
ES2886599T3 (es) 2015-06-17 2021-12-20 Poseida Therapeutics Inc Composiciones y métodos para dirigir proteínas a loci específicos en el genoma
WO2016205759A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
US9957501B2 (en) 2015-06-18 2018-05-01 Sangamo Therapeutics, Inc. Nuclease-mediated regulation of gene expression
RU2021120582A (ru) 2015-06-18 2021-09-02 Те Брод Инститьют, Инк. Мутации фермента crispr, уменьшающие нецелевые эффекты
ES2594486B1 (es) * 2015-06-19 2017-09-26 Biopraxis Research Aie Molécula de ácido nucleico, proteína de fusión y método para modificar el material genético de una célula
ES2895652T3 (es) 2015-07-07 2022-02-22 Inst Nat Sante Rech Med Métodos y composiciones farmacéuticas para expresar un polinucleótido de interés en el sistema nervioso periférico de un sujeto
CA2991301A1 (en) 2015-07-13 2017-01-19 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
MA42895A (fr) 2015-07-15 2018-05-23 Juno Therapeutics Inc Cellules modifiées pour thérapie cellulaire adoptive
MX2017016844A (es) 2015-07-16 2018-08-15 Biokine Therapeutics Ltd Composiciones y procedimientos para tratar cancer.
FI3331355T3 (fi) 2015-08-06 2024-06-17 Univ Missouri Sikojen lisääntymishäiriö- ja keuhkotulehdusoireyhtymävirukselle (PRRSV) resistentti sika ja soluja, joilla on muokattuja CD163-geenejä
ES2929110T3 (es) 2015-08-25 2022-11-24 Univ Duke Composiciones y métodos para mejorar la especificidad en ingeniería genética usando endonucleasas guiadas por ARN
US10837024B2 (en) 2015-09-17 2020-11-17 Cellectis Modifying messenger RNA stability in plant transformations
TW201718861A (zh) 2015-09-22 2017-06-01 道禮責任有限公司 用於轉殖基因表現之植物啟動子及3’utr
TW201718862A (zh) 2015-09-22 2017-06-01 Dow Agrosciences Llc 用於轉殖基因表現之植物啟動子及3’utr
IL258030B (en) 2015-09-23 2022-08-01 Sangamo Therapeutics Inc Htt suppressing factors and their uses
US11970710B2 (en) 2015-10-13 2024-04-30 Duke University Genome engineering with Type I CRISPR systems in eukaryotic cells
US10280429B2 (en) 2015-10-22 2019-05-07 Dow Agrosciences Llc Plant promoter for transgene expression
US20190225955A1 (en) 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
AU2016343887B2 (en) 2015-10-28 2023-04-06 Sangamo Therapeutics, Inc. Liver-specific constructs, factor VIII expression cassettes and methods of use thereof
WO2017079428A1 (en) 2015-11-04 2017-05-11 President And Fellows Of Harvard College Site specific germline modification
WO2017078935A1 (en) 2015-11-04 2017-05-11 Dow Agrosciences Llc Plant promoter for transgene expression
EP3380622A4 (en) 2015-11-23 2019-08-07 Sangamo Therapeutics, Inc. METHODS AND COMPOSITIONS FOR MODIFYING IMMUNITY
CA3008413A1 (en) 2015-12-18 2017-06-22 Sangamo Therapeutics, Inc. Targeted disruption of the t cell receptor
BR112018012235A2 (pt) 2015-12-18 2018-12-04 Sangamo Therapeutics Inc rompimento alvejado do receptor de células de mhc
JP2019505511A (ja) 2016-01-06 2019-02-28 イェダ リサーチ アンド ディベロップメント カンパニー リミテッドYeda Research And Development Co.Ltd. 悪性疾患、自己免疫疾患および炎症性疾患を処置するための組成物および方法
US20170202931A1 (en) 2016-01-15 2017-07-20 Sangamo Therapeutics, Inc. Methods and compositions for the treatment of neurologic disease
WO2017125931A1 (en) 2016-01-21 2017-07-27 The State Of Israel, Ministry Of Agriculture & Rural Development, Agricultural Research Organization (Aro) (Volcani Center) Parthenocarpic plants and methods of producing same
WO2017130205A1 (en) 2016-01-31 2017-08-03 Hadasit Medical Research Services And Development Ltd. Autosomal-identical pluripotent stem cell populations having non-identical sex chromosomal composition and uses thereof
JP7012650B2 (ja) 2016-02-02 2022-01-28 サンガモ セラピューティクス, インコーポレイテッド Dna結合ドメインと切断ドメインとを連結するための組成物
EP3410843A1 (en) 2016-02-02 2018-12-12 Cellectis Modifying soybean oil composition through targeted knockout of the fad3a/b/c genes
WO2017135316A1 (ja) * 2016-02-04 2017-08-10 花王株式会社 変異リゾプス属菌
WO2017138008A2 (en) 2016-02-14 2017-08-17 Yeda Research And Development Co. Ltd. Methods of modulating protein exocytosis and uses of same in therapy
US20190216891A1 (en) 2016-03-06 2019-07-18 Yeda Research And Development Co., Ltd. Method for modulating myelination
EP3433362B1 (en) 2016-03-23 2021-05-05 Dana-Farber Cancer Institute, Inc. Methods for enhancing the efficiency of gene editing
EP3433364A1 (en) 2016-03-25 2019-01-30 Editas Medicine, Inc. Systems and methods for treating alpha 1-antitrypsin (a1at) deficiency
CA3022600A1 (en) 2016-04-29 2017-11-02 Adverum Biotechnologies, Inc. Evasion of neutralizing antibodies by a recombinant adeno-associated virus
CR20180589A (es) 2016-05-13 2019-02-27 4D Molecular Therapeutics Inc Cápsulas variantes de virus adenoasociados y métodos de uso de estas
CN109476715B (zh) 2016-05-26 2023-06-27 纽海姆有限公司 产无籽果实的植物
AU2017268842B2 (en) 2016-05-27 2022-08-11 Aadigen, Llc Peptides and nanoparticles for intracellular delivery of genome-editing molecules
GB2552861B (en) 2016-06-02 2019-05-15 Sigma Aldrich Co Llc Using programmable DNA binding proteins to enhance targeted genome modification
MA45491A (fr) 2016-06-27 2019-05-01 Juno Therapeutics Inc Épitopes à restriction cmh-e, molécules de liaison et procédés et utilisations associés
MA45455A (fr) 2016-06-27 2019-05-01 Juno Therapeutics Inc Procédé d'identification d'épitopes peptidiques, molécules qui se lient à de tels épitopes et utilisations associées
US11344511B2 (en) 2016-07-27 2022-05-31 Case Western Reserve University Compounds and methods of promoting myelination
EP3827812A1 (en) 2016-07-29 2021-06-02 The Regents of the University of California Adeno-associated virus virions with variant capsid and methods of use thereof
CA3032822A1 (en) 2016-08-02 2018-02-08 Editas Medicine, Inc. Compositions and methods for treating cep290 associated disease
WO2018027078A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
US11193136B2 (en) 2016-08-09 2021-12-07 Vib Vzw Cellulose synthase inhibitors and mutant plants
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
CA2941315C (en) 2016-08-12 2018-03-06 Api Labs Inc. High thebaine poppy and methods of producing the same
CA3033374A1 (en) 2016-08-15 2018-02-22 Enevolv, Inc. Molecule sensor systems
US10576167B2 (en) 2016-08-17 2020-03-03 Factor Bioscience Inc. Nucleic acid products and methods of administration thereof
WO2018035354A1 (en) 2016-08-17 2018-02-22 Monsanto Technology Llc Methods and compositions for short stature plants through manipulation of gibberellin metabolism to increase harvestable yield
IL247368A0 (en) 2016-08-18 2016-11-30 Yeda Res & Dev Diagnostic and therapeutic uses of exosomes
SG10201913948PA (en) 2016-08-24 2020-03-30 Sangamo Therapeutics Inc Engineered target specific nucleases
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
PE20190568A1 (es) 2016-08-24 2019-04-22 Sangamo Therapeutics Inc Regulacion de la expresion genica usando nucleasas modificadas
US10960085B2 (en) 2016-09-07 2021-03-30 Sangamo Therapeutics, Inc. Modulation of liver genes
JP6866475B2 (ja) 2016-09-23 2021-04-28 フレッド ハッチンソン キャンサー リサーチ センター マイナー組織適合性(h)抗原ha−1に特異的なtcr及びその使用
KR20190062505A (ko) 2016-10-03 2019-06-05 주노 쎄러퓨티크스 인코퍼레이티드 Hpv-특이적 결합 분자
CN110291199B (zh) 2016-10-03 2023-12-22 美国陶氏益农公司 用于转基因表达的植物启动子
US10519459B2 (en) 2016-10-03 2019-12-31 Dow Agrosciences Llc Plant promoter from Panicum virgatum
EP3523422A1 (en) 2016-10-05 2019-08-14 FUJIFILM Cellular Dynamics, Inc. Generating mature lineages from induced pluripotent stem cells with mecp2 disruption
BR112019006652A2 (pt) 2016-10-13 2019-07-02 Juno Therapeutics Inc métodos e composições para imunoterapia envolvendo moduladores da via metabólica do triptofano
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
GB201617559D0 (en) 2016-10-17 2016-11-30 University Court Of The University Of Edinburgh The Swine comprising modified cd163 and associated methods
US11192925B2 (en) 2016-10-19 2021-12-07 Adverum Biotechnologies, Inc. Modified AAV capsids and uses thereof
WO2018075736A1 (en) 2016-10-20 2018-04-26 Sangamo Therapeutics, Inc. Methods and compositions for the treatment of fabry disease
CA3041668A1 (en) 2016-10-31 2018-05-03 Sangamo Therapeutics, Inc. Gene correction of scid-related genes in hematopoietic stem and progenitor cells
US11312972B2 (en) 2016-11-16 2022-04-26 Cellectis Methods for altering amino acid content in plants through frameshift mutations
US11542508B2 (en) 2016-11-28 2023-01-03 Yeda Research And Development Co. Ltd. Isolated polynucleotides and polypeptides and methods of using same for expressing an expression product of interest
WO2018102665A1 (en) 2016-12-01 2018-06-07 Sangamo Therapeutics, Inc. Tau modulators and methods and compositions for delivery thereof
WO2018102612A1 (en) 2016-12-02 2018-06-07 Juno Therapeutics, Inc. Engineered b cells and related compositions and methods
CA3045338A1 (en) 2016-12-05 2018-06-14 Juno Therapeutics, Inc. Production of engineered cells for adoptive cell therapy
JP7416406B2 (ja) 2016-12-08 2024-01-17 ケース ウェスタン リザーブ ユニバーシティ 機能的ミエリン産生を増進させるための方法および組成物
US20190323019A1 (en) * 2016-12-21 2019-10-24 Yi-Hua Hsu Composition for editing a nucleic acid sequence and method using the same
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
EP3563159A1 (en) 2016-12-29 2019-11-06 Ukko Inc. Methods for identifying and de-epitoping allergenic polypeptides
WO2018129021A1 (en) * 2017-01-06 2018-07-12 The Johns Hopkins University Modular, inducible repressors for the control of gene expression
IL250479A0 (en) 2017-02-06 2017-03-30 Sorek Rotem Genetically engineered cells expressing a disarm system that confers resistance to phages and methods for their production
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
WO2018165629A1 (en) 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
EP3596217A1 (en) 2017-03-14 2020-01-22 Editas Medicine, Inc. Systems and methods for the treatment of hemoglobinopathies
WO2018170338A2 (en) 2017-03-15 2018-09-20 Fred Hutchinson Cancer Research Center High affinity mage-a1-specific tcrs and uses thereof
IL269458B2 (en) 2017-03-23 2024-02-01 Harvard College Nucleic base editors that include nucleic acid programmable DNA binding proteins
AU2018251150B2 (en) 2017-04-13 2024-05-09 Albert-Ludwigs-Universität Freiburg New sequence specific reagents targeting CCR5 in primary hematopoietic cells
EP3615668B1 (en) 2017-04-25 2024-02-28 Cellectis Alfalfa with reduced lignin composition
CA3061612A1 (en) 2017-04-28 2018-11-01 Acuitas Therapeutics, Inc. Novel carbonyl lipids and lipid nanoparticle formulations for delivery of nucleic acids
RU2019139045A (ru) 2017-05-03 2021-06-03 Сангамо Терапьютикс, Инк. Способы и композиции для модификации гена регулятора трансмембранной проводимости при кистозном фиброзе (cftr)
IL252151A0 (en) 2017-05-07 2017-07-31 Fainzilber Michael Treatment of stress disorders
EP3622070A2 (en) 2017-05-10 2020-03-18 Editas Medicine, Inc. Crispr/rna-guided nuclease systems and methods
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
US10780119B2 (en) 2017-05-24 2020-09-22 Effector Therapeutics Inc. Methods and compositions for cellular immunotherapy
US11512287B2 (en) 2017-06-16 2022-11-29 Sangamo Therapeutics, Inc. Targeted disruption of T cell and/or HLA receptors
ES2871400T3 (es) 2017-06-20 2021-10-28 Inst Nat Sante Rech Med Células inmunitarias deficientes en SUV39H1
IL253642A0 (en) 2017-07-24 2017-09-28 Seger Rony Combined treatment for cancer
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
BR112020001364A2 (pt) 2017-07-31 2020-08-11 Regeneron Pharmaceuticals, Inc. métodos para testar e modificar a capacidade de uma crispr/cas nuclease.
RU2019143568A (ru) 2017-07-31 2021-09-02 Регенерон Фармасьютикалс, Инк. Способы и композиции для оценки crispr/cas-индуцированной рекомбинации с экзогенной донорной нуклеиновой кислотой in vivo
US11021719B2 (en) 2017-07-31 2021-06-01 Regeneron Pharmaceuticals, Inc. Methods and compositions for assessing CRISPER/Cas-mediated disruption or excision and CRISPR/Cas-induced recombination with an exogenous donor nucleic acid in vivo
CN109384833B (zh) * 2017-08-04 2021-04-27 北京大学 特异性识别甲基化修饰dna碱基的tale rvd及其应用
US11692166B2 (en) 2017-08-23 2023-07-04 Technion Research & Development Foundation Limited Compositions and methods for improving alcohol tolerance in yeast
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
JP7407701B2 (ja) 2017-09-06 2024-01-04 フレッド ハッチンソン キャンサー センター strepタグ特異的キメラ受容体およびその使用
US20210106618A1 (en) 2017-09-06 2021-04-15 Fred Hutchinson Cancer Research Center Methods for improving adoptive cell therapy
CR20200165A (es) 2017-09-20 2020-06-05 4D Molecular Therapeutics Inc Variantes de cápsides de virus adenoasociados y métodos de uso de estas
MX2020003536A (es) 2017-10-03 2020-09-14 Juno Therapeutics Inc Moleculas de union especifica a virus de papiloma humano (hpv).
EP3697906A1 (en) 2017-10-16 2020-08-26 The Broad Institute, Inc. Uses of adenosine base editors
EP3697435A1 (en) 2017-10-20 2020-08-26 Fred Hutchinson Cancer Research Center Compositions and methods of immunotherapy targeting tigit and/or cd112r or comprising cd226 overexpression
US11851679B2 (en) 2017-11-01 2023-12-26 Juno Therapeutics, Inc. Method of assessing activity of recombinant antigen receptors
IL255664A0 (en) 2017-11-14 2017-12-31 Shachar Idit Hematopoietic stem cells with enhanced properties
AU2018368786A1 (en) 2017-11-17 2020-06-18 Iovance Biotherapeutics, Inc. TIL expansion from fine needle aspirates and small biopsies
JP2021503885A (ja) 2017-11-22 2021-02-15 アイオバンス バイオセラピューティクス,インコーポレイテッド 末梢血からの末梢血リンパ球(pbl)の拡大培養
CN111770999A (zh) 2017-11-27 2020-10-13 4D分子治疗有限公司 腺相关病毒变体衣壳和用于抑制血管生成的应用
US20220267403A1 (en) 2017-12-01 2022-08-25 Fred Hutchinson Cancer Research Center Binding proteins specific for 5t4 and uses thereof
WO2019113321A1 (en) 2017-12-06 2019-06-13 Memorial Sloan-Kettering Cancer Center Globin gene therapy for treating hemoglobinopathies
EP3501268B1 (en) 2017-12-22 2021-09-15 KWS SAAT SE & Co. KGaA Regeneration of plants in the presence of histone deacetylase inhibitors
EP3508581A1 (en) 2018-01-03 2019-07-10 Kws Saat Se Regeneration of genetically modified plants
WO2019140278A1 (en) 2018-01-11 2019-07-18 Fred Hutchinson Cancer Research Center Immunotherapy targeting core binding factor antigens
IL257225A (en) 2018-01-29 2018-04-09 Yeda Res & Dev Treatment of sarcoma
EP3749350A4 (en) 2018-02-08 2021-12-01 Sangamo Therapeutics, Inc. SPECIFICALLY MODIFIED TARGET-SPECIFIC NUCLEASES
EP3752601A4 (en) 2018-02-15 2022-03-23 Memorial Sloan-Kettering Cancer Center ANTI-FOXP3 DRUG COMPOSITIONS AND METHODS OF USE FOR ADOPTIVE CELL THERAPY
WO2019161151A1 (en) 2018-02-15 2019-08-22 Monsanto Technology Llc Compositions and methods for improving crop yields through trait stacking
US20210079061A1 (en) 2018-02-26 2021-03-18 Fred Hutchinson Cancer Research Center Compositions and methods for cellular immunotherapy
RU2020133851A (ru) 2018-03-16 2022-04-19 Иммьюсофт Корпорейшн B-клетки, генетически модифицированные для секреции фоллистатина, и способы их применения для лечения связанных с фоллистатином заболеваний, состояний, нарушений и для увеличения роста и силы мышц
JP7334178B2 (ja) 2018-03-19 2023-08-28 リジェネロン・ファーマシューティカルズ・インコーポレイテッド CRISPR/Cas系を使用した動物での転写モジュレーション
EP3545756A1 (en) 2018-03-28 2019-10-02 KWS SAAT SE & Co. KGaA Regeneration of plants in the presence of inhibitors of the histone methyltransferase ezh2
CN112585276A (zh) 2018-04-05 2021-03-30 朱诺治疗学股份有限公司 产生表达重组受体的细胞的方法和相关组合物
CA3095027A1 (en) 2018-04-05 2019-10-10 Juno Therapeutics, Inc. T cell receptors and engineered cells expressing same
CA3095084A1 (en) 2018-04-05 2019-10-10 Juno Therapeutics, Inc. T cells expressing a recombinant receptor, related polynucleotides and methods
EP3784254A1 (en) 2018-04-27 2021-03-03 Iovance Biotherapeutics, Inc. Closed process for expansion and gene editing of tumor infiltrating lymphocytes and uses of same in immunotherapy
EP3567111A1 (en) 2018-05-09 2019-11-13 KWS SAAT SE & Co. KGaA Gene for resistance to a pathogen of the genus heterodera
US11690921B2 (en) 2018-05-18 2023-07-04 Sangamo Therapeutics, Inc. Delivery of target specific nucleases
GB201809273D0 (en) 2018-06-06 2018-07-25 Vib Vzw Novel mutant plant cinnamoyl-coa reductase proteins
WO2019236943A2 (en) 2018-06-07 2019-12-12 The Brigham And Women's Hospital, Inc. Methods for generating hematopoietic stem cells
WO2019238911A1 (en) 2018-06-15 2019-12-19 KWS SAAT SE & Co. KGaA Methods for improving genome engineering and regeneration in plant ii
WO2019238832A1 (en) 2018-06-15 2019-12-19 Nunhems B.V. Seedless watermelon plants comprising modifications in an abc transporter gene
CN112566924A (zh) 2018-06-15 2021-03-26 科沃施种子欧洲股份两合公司 改善植物中基因组工程化和再生的方法
EP3807299A1 (en) 2018-06-15 2021-04-21 KWS SAAT SE & Co. KGaA Methods for enhancing genome engineering efficiency
US20220306699A1 (en) * 2018-06-27 2022-09-29 Altius Institute For Biomedical Sciences Nucleic Acid Binding Domains and Methods of Use Thereof
WO2020006131A2 (en) * 2018-06-27 2020-01-02 Altius Institute For Biomedical Sciences Nucleases for genome editing
WO2020006132A1 (en) * 2018-06-27 2020-01-02 Altius Institute For Biomedical Sciences Gapped and tunable repeat units for use in genome editing and gene regulation compositions
EP3818075A1 (en) 2018-07-04 2021-05-12 Ukko Inc. Methods of de-epitoping wheat proteins and use of same for the treatment of celiac disease
WO2020018964A1 (en) 2018-07-20 2020-01-23 Fred Hutchinson Cancer Research Center Compositions and methods for controlled expression of antigen-specific receptors
EP3841113A1 (en) 2018-08-22 2021-06-30 Fred Hutchinson Cancer Research Center Immunotherapy targeting kras or her2 antigens
JP2021536229A (ja) 2018-08-23 2021-12-27 サンガモ セラピューティクス, インコーポレイテッド 操作された標的特異的な塩基エディター
AU2019329984A1 (en) 2018-08-28 2021-03-11 Fred Hutchinson Cancer Center Methods and compositions for adoptive T cell therapy incorporating induced notch signaling
EP3623379A1 (en) 2018-09-11 2020-03-18 KWS SAAT SE & Co. KGaA Beet necrotic yellow vein virus (bnyvv)-resistance modifying gene
JP2022500052A (ja) 2018-09-18 2022-01-04 サンガモ セラピューティクス, インコーポレイテッド プログラム細胞死1(pd1)特異的ヌクレアーゼ
US20240165232A1 (en) 2018-09-24 2024-05-23 Fred Hutchinson Cancer Research Center Chimeric receptor proteins and uses thereof
IL262658A (en) 2018-10-28 2020-04-30 Memorial Sloan Kettering Cancer Center Prevention of age related clonal hematopoiesis and diseases associated therewith
BR112021008573A2 (pt) 2018-11-05 2021-10-26 Iovance Biotherapeutics, Inc. Métodos para expandir linfócitos infiltrantes de tumor em uma população terapêutica de linfócitos infiltrantes de tumor, para tratar um sujeito com câncer e de expansão de células t, população terapêutica de linfócitos infiltrantes de tumor, composição de linfócitos infiltrantes de tumor, saco de infusão estéril, preparação criopreservada, e, uso da composição de linfócitos infiltrantes de tumor.
SG11202104630PA (en) 2018-11-05 2021-06-29 Iovance Biotherapeutics Inc Selection of improved tumor reactive t-cells
MX2021004775A (es) 2018-11-05 2021-06-08 Iovance Biotherapeutics Inc Expansion de linfocitos infiltrantes de tumores (tils) usando inhibidores de la via de proteina cinasa b (akt).
SG11202104663PA (en) 2018-11-05 2021-06-29 Iovance Biotherapeutics Inc Treatment of nsclc patients refractory for anti-pd-1 antibody
BR112021008973A8 (pt) 2018-11-09 2023-05-02 Juno Therapeutics Inc Receptores de células t específicos para mesotelina e uso dos mesmos em imunoterapia
US20220023348A1 (en) 2018-11-28 2022-01-27 Forty Seven, Inc. Genetically modified hspcs resistant to ablation regime
EA202191463A1 (ru) 2018-11-28 2021-10-13 Борд Оф Риджентс, Дзе Юниверсити Оф Техас Систем Мультиплексное редактирование генома иммунных клеток для повышения функциональности и устойчивости к подавляющей среде
AU2019386830A1 (en) 2018-11-29 2021-06-24 Board Of Regents, The University Of Texas System Methods for ex vivo expansion of natural killer cells and use thereof
GB201820109D0 (en) 2018-12-11 2019-01-23 Vib Vzw Plants with a lignin trait and udp-glycosyltransferase mutation
US20220193131A1 (en) 2018-12-19 2022-06-23 Iovance Biotherapeutics, Inc. Methods of Expanding Tumor Infiltrating Lymphocytes Using Engineered Cytokine Receptor Pairs and Uses Thereof
WO2020146805A1 (en) 2019-01-11 2020-07-16 Acuitas Therapeutics, Inc. Lipids for lipid nanoparticle delivery of active agents
WO2020157573A1 (en) 2019-01-29 2020-08-06 The University Of Warwick Methods for enhancing genome engineering efficiency
WO2020163017A1 (en) 2019-02-06 2020-08-13 Klogenix Llc Dna binding proteins and uses thereof
AU2019428629A1 (en) 2019-02-06 2021-01-28 Sangamo Therapeutics, Inc. Method for the treatment of mucopolysaccharidosis type I
CA3130618A1 (en) 2019-02-20 2020-08-27 Fred Hutchinson Cancer Research Center Binding proteins specific for ras neoantigens and uses thereof
JP2022522473A (ja) 2019-03-01 2022-04-19 アイオバンス バイオセラピューティクス,インコーポレイテッド 液性腫瘍からの腫瘍浸潤リンパ球の拡大培養及びその治療的使用
MX2021010611A (es) 2019-03-05 2021-11-12 The State Of Israel Ministry Of Agriculture & Rural Development Agricultural Res Organization Aro Vo Aves con genoma editado.
CN114174327A (zh) 2019-03-08 2022-03-11 黑曜石疗法公司 用于可调整调控的cd40l组合物和方法
US20220160764A1 (en) 2019-03-11 2022-05-26 Fred Hutchinson Cancer Research Center High avidity wt1 t cell receptors and uses thereof
EP3708651A1 (en) 2019-03-12 2020-09-16 KWS SAAT SE & Co. KGaA Improving plant regeneration
JP7461368B2 (ja) 2019-03-18 2024-04-03 リジェネロン・ファーマシューティカルズ・インコーポレイテッド タウの播種または凝集の遺伝的修飾因子を同定するためのcrispr/casスクリーニングプラットフォーム
US11781131B2 (en) 2019-03-18 2023-10-10 Regeneron Pharmaceuticals, Inc. CRISPR/Cas dropout screening platform to reveal genetic vulnerabilities associated with tau aggregation
MX2021011426A (es) 2019-03-19 2022-03-11 Broad Inst Inc Metodos y composiciones para editar secuencias de nucleótidos.
MX2021012152A (es) 2019-04-02 2021-11-03 Sangamo Therapeutics Inc Metodos para el tratamiento de beta-talasemia.
JP2022527809A (ja) 2019-04-03 2022-06-06 リジェネロン・ファーマシューティカルズ・インコーポレイテッド 抗体コード配列をセーフハーバー遺伝子座に挿入するための方法および組成物
CN113766921A (zh) 2019-04-23 2021-12-07 桑格摩生物治疗股份有限公司 染色体9开放阅读框72基因表达的调节物及其用途
TW202106699A (zh) 2019-04-26 2021-02-16 美商愛德維仁生物科技公司 用於玻璃體內遞送之變異體aav蛋白殼
TW202106700A (zh) 2019-04-26 2021-02-16 美商聖加莫治療股份有限公司 Aav 工程化
BR112021021200A2 (pt) 2019-05-01 2021-12-21 Juno Therapeutics Inc Células expressando um receptor quimérico de um locus cd247 modificado, polinucleotídeos relacionados e métodos
MX2021013219A (es) 2019-05-01 2022-02-17 Juno Therapeutics Inc Celulas que expresan un receptor recombinante de un locus de tgfbr2 modificado, polinucleotidos relacionados y metodos.
US20220249559A1 (en) 2019-05-13 2022-08-11 Iovance Biotherapeutics, Inc. Methods and compositions for selecting tumor infiltrating lymphocytes and uses of the same in immunotherapy
SI3840767T1 (sl) * 2019-05-29 2024-04-30 Hubro Therapeutics As Peptidi
WO2020244759A1 (en) 2019-06-05 2020-12-10 Klemm & Sohn Gmbh & Co. Kg New plants having a white foliage phenotype
AU2020290509A1 (en) 2019-06-14 2021-11-11 Regeneron Pharmaceuticals, Inc. Models of tauopathy
EP3757219A1 (en) 2019-06-28 2020-12-30 KWS SAAT SE & Co. KGaA Enhanced plant regeneration and transformation by using grf1 booster gene
KR20220042139A (ko) 2019-07-04 2022-04-04 유코 아이엔씨. 에피토프 제거된 알파 글리아딘 및 복강병 및 글루텐 민감성의 관리를 위한 이의 용도
IL268111A (en) 2019-07-16 2021-01-31 Fainzilber Michael Methods of treating pain
CA3144687A1 (en) 2019-07-18 2021-01-21 Steven A. Goldman Cell-type selective immunoprotection of cells
JP2022542102A (ja) 2019-07-23 2022-09-29 ムネモ・セラピューティクス Suv39h1欠損免疫細胞
US10501404B1 (en) 2019-07-30 2019-12-10 Factor Bioscience Inc. Cationic lipids and transfection methods
US20220267732A1 (en) 2019-08-01 2022-08-25 Sana Biotechnology, Inc. Dux4 expressing cells and uses thereof
CA3147717A1 (en) 2019-08-20 2021-02-25 Fred Hutchinson Cancer Research Center T-cell immunotherapy specific for wt-1
AU2020336302A1 (en) 2019-08-23 2022-03-03 Sana Biotechnology, Inc. CD24 expressing cells and uses thereof
CN114616002A (zh) 2019-09-13 2022-06-10 瑞泽恩制药公司 使用由脂质纳米颗粒递送的crispr/cas系统在动物中进行的转录调控
JP2022550608A (ja) 2019-10-02 2022-12-02 サンガモ セラピューティクス, インコーポレイテッド プリオン病の治療のためのジンクフィンガータンパク質転写因子
EP4041897A1 (en) * 2019-10-11 2022-08-17 Basf Plant Science Company GmbH Increase in corn transformation efficacy by the n-terminus of a tale
JP2022553389A (ja) 2019-10-25 2022-12-22 アイオバンス バイオセラピューティクス,インコーポレイテッド 腫瘍浸潤リンパ球の遺伝子編集及び免疫療法におけるその使用
IL270306A (en) 2019-10-30 2021-05-31 Yeda Res & Dev Prevention and treatment of pre-myeloid and myeloid malignancies
AU2020376048A1 (en) 2019-11-01 2022-06-02 Sangamo Therapeutics, Inc. Compositions and methods for genome engineering
US20210130828A1 (en) 2019-11-01 2021-05-06 Sangamo Therapeutics, Inc. Gin recombinase variants
MX2022005572A (es) 2019-11-08 2022-06-09 Regeneron Pharma Estrategias crispr y aav para la terapia de retinosquisis juvenil ligada al cromosoma x.
CA3157872A1 (en) 2019-11-12 2021-05-20 Otto Torjek Gene for resistance to a pathogen of the genus heterodera
WO2021108363A1 (en) 2019-11-25 2021-06-03 Regeneron Pharmaceuticals, Inc. Crispr/cas-mediated upregulation of humanized ttr allele
JP2023506734A (ja) 2019-12-11 2023-02-20 アイオバンス バイオセラピューティクス,インコーポレイテッド 腫瘍浸潤リンパ球(til)の産生のためのプロセス及びそれを使用する方法
IL271656A (en) 2019-12-22 2021-06-30 Yeda Res & Dev System and methods for identifying cells that have undergone genome editing
BR112022013355A2 (pt) 2020-01-08 2022-09-20 Obsidian Therapeutics Inc Célula modificada, molécula de ácido nucleico, vetor, primeiro polinucleotídeo e segundo polinucleotídeo, método de produção de uma célula modificada, métodos para tratar ou prevenir uma doença em um sujeito em necessidade, para introduzir uma célula modificada, para modificar geneticamente uma ou mais células, e, sistema para a expressão sintonizável
WO2021152587A1 (en) 2020-01-30 2021-08-05 Yeda Research And Development Co. Ltd. Treating acute liver disease with tlr-mik inhibitors
AU2021232598A1 (en) 2020-03-04 2022-09-08 Regeneron Pharmaceuticals, Inc. Methods and compositions for sensitization of tumor cells to immune therapy
EP4125348A1 (en) 2020-03-23 2023-02-08 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized ttr locus comprising a v30m mutation and methods of use
BR112022019060A2 (pt) 2020-03-25 2022-11-29 Sana Biotechnology Inc Células neurais hipoimunogênicas para o tratamento de distúrbios e condições neurológicas
JP2023523855A (ja) 2020-05-04 2023-06-07 アイオバンス バイオセラピューティクス,インコーポレイテッド 腫瘍浸潤リンパ球の製造方法及び免疫療法におけるその使用
EP4146798A1 (en) 2020-05-04 2023-03-15 Saliogen Therapeutics, Inc. Transposition-based therapies
EP4146284A1 (en) 2020-05-06 2023-03-15 Cellectis S.A. Methods to genetically modify cells for delivery of therapeutic proteins
CN115803435A (zh) 2020-05-06 2023-03-14 塞勒克提斯公司 用于在细胞基因组中靶向插入外源序列的方法
JP2023525304A (ja) 2020-05-08 2023-06-15 ザ ブロード インスティテュート,インコーポレーテッド 標的二本鎖ヌクレオチド配列の両鎖同時編集のための方法および組成物
CN115835873A (zh) 2020-05-13 2023-03-21 朱诺治疗学股份有限公司 用于产生表达重组受体的供体分批细胞的方法
CN111518220A (zh) * 2020-05-14 2020-08-11 重庆英茂盛业生物科技有限公司 一种融合蛋白及其设计方法
US20230190871A1 (en) 2020-05-20 2023-06-22 Sana Biotechnology, Inc. Methods and compositions for treatment of viral infections
US20230183751A1 (en) 2020-05-21 2023-06-15 Oxford Genetics Limited Hdr enhancers
GB202007577D0 (en) 2020-05-21 2020-07-08 Oxford Genetics Ltd Hdr enhancers
EP4153739A1 (en) 2020-05-21 2023-03-29 Oxford Genetics Limited Hdr enhancers
GB202007578D0 (en) 2020-05-21 2020-07-08 Univ Oxford Innovation Ltd Hdr enhancers
WO2021247836A1 (en) 2020-06-03 2021-12-09 Board Of Regents, The University Of Texas System Methods for targeting shp-2 to overcome resistance
CN116234558A (zh) 2020-06-26 2023-06-06 朱诺治疗学有限公司 条件性地表达重组受体的工程化t细胞、相关多核苷酸和方法
CA3189338A1 (en) 2020-07-16 2022-01-20 Acuitas Therapeutics, Inc. Cationic lipids for use in lipid nanoparticles
WO2022023576A1 (en) 2020-07-30 2022-02-03 Institut Curie Immune cells defective for socs1
AU2021325941A1 (en) 2020-08-13 2023-03-09 Sana Biotechnology, Inc. Methods of treating sensitized patients with hypoimmunogenic cells, and associated methods and compositions
EP4204545A2 (en) 2020-08-25 2023-07-05 Kite Pharma, Inc. T cells with improved functionality
WO2022066973A1 (en) 2020-09-24 2022-03-31 Fred Hutchinson Cancer Research Center Immunotherapy targeting pbk or oip5 antigens
WO2022066965A2 (en) 2020-09-24 2022-03-31 Fred Hutchinson Cancer Research Center Immunotherapy targeting sox2 antigens
CA3196599A1 (en) 2020-09-25 2022-03-31 Sangamo Therapeutics, Inc. Zinc finger fusion proteins for nucleobase editing
US20230374447A1 (en) 2020-10-05 2023-11-23 Protalix Ltd. Dicer-like knock-out plant cells
WO2022076606A1 (en) 2020-10-06 2022-04-14 Iovance Biotherapeutics, Inc. Treatment of nsclc patients with tumor infiltrating lymphocyte therapies
CA3195019A1 (en) 2020-10-06 2022-04-14 Maria Fardis Treatment of nsclc patients with tumor infiltrating lymphocyte therapies
WO2022076353A1 (en) 2020-10-06 2022-04-14 Fred Hutchinson Cancer Research Center Compositions and methods for treating mage-a1-expressing disease
EP4228637A1 (en) 2020-10-15 2023-08-23 Yeda Research and Development Co. Ltd Method of treating myeloid malignancies
KR20230090367A (ko) 2020-11-04 2023-06-21 주노 쎄러퓨티크스 인코퍼레이티드 변형된 불변 cd3 이뮤노글로불린 슈퍼패밀리 쇄 유전자좌로부터 키메라 수용체를 발현하는 세포 및 관련 폴리뉴클레오티드 및 방법
US20220162625A1 (en) * 2020-11-11 2022-05-26 Monsanto Technology Llc Methods to improve site-directed integration frequency
WO2022104109A1 (en) 2020-11-13 2022-05-19 Catamaran Bio, Inc. Genetically modified natural killer cells and methods of use thereof
CN117042600A (zh) 2020-11-16 2023-11-10 猪改良英国有限公司 具有经编辑的anp32基因的抗甲型流感动物
WO2022115611A1 (en) 2020-11-25 2022-06-02 Catamaran Bio, Inc. Cellular therapeutics engineered with signal modulators and methods of use thereof
JP2023550979A (ja) 2020-11-26 2023-12-06 ウッコ インコーポレイテッド 改変された高分子量グルテニンサブユニット及びその使用
US20240002839A1 (en) 2020-12-02 2024-01-04 Decibel Therapeutics, Inc. Crispr sam biosensor cell lines and methods of use thereof
EP4259651A2 (en) 2020-12-14 2023-10-18 Fred Hutchinson Cancer Center Compositions and methods for cellular immunotherapy
WO2022133149A1 (en) 2020-12-17 2022-06-23 Iovance Biotherapeutics, Inc. Treatment of cancers with tumor infiltrating lymphocytes
IL279559A (en) 2020-12-17 2022-07-01 Yeda Res & Dev Controlling the ubiquitination process of mlkl for disease treatment
WO2022133140A1 (en) 2020-12-17 2022-06-23 Iovance Biotherapeutics, Inc. Treatment with tumor infiltrating lymphocyte therapies in combination with ctla-4 and pd-1 inhibitors
JP2024500804A (ja) 2020-12-18 2024-01-10 イェダ リサーチ アンド ディベロップメント カンパニー リミテッド Chd2ハプロ不全の処置における使用のための組成物及びその同定方法
EP4019639A1 (en) 2020-12-22 2022-06-29 KWS SAAT SE & Co. KGaA Promoting regeneration and transformation in beta vulgaris
EP4019638A1 (en) 2020-12-22 2022-06-29 KWS SAAT SE & Co. KGaA Promoting regeneration and transformation in beta vulgaris
KR20230137900A (ko) 2020-12-31 2023-10-05 사나 바이오테크놀로지, 인크. Car-t 활성을 조정하기 위한 방법 및 조성물
WO2022165260A1 (en) 2021-01-29 2022-08-04 Iovance Biotherapeutics, Inc. Methods of making modified tumor infiltrating lymphocytes and their use in adoptive cell therapy
WO2022198141A1 (en) 2021-03-19 2022-09-22 Iovance Biotherapeutics, Inc. Methods for tumor infiltrating lymphocyte (til) expansion related to cd39/cd69 selection and gene knockout in tils
JP2024511420A (ja) 2021-03-22 2024-03-13 ジュノー セラピューティクス インコーポレイテッド ウイルスベクター粒子の効力を評価する方法
CN118019546A (zh) 2021-03-23 2024-05-10 艾欧凡斯生物治疗公司 肿瘤浸润淋巴细胞的cish基因编辑及其在免疫疗法中的用途
US20240207318A1 (en) 2021-04-19 2024-06-27 Yongliang Zhang Chimeric costimulatory receptors, chemokine receptors, and the use of same in cellular immunotherapies
US20240191186A1 (en) 2021-05-05 2024-06-13 FUJIFILM Cellular Dynamics, Inc. Methods and compositions for ipsc-derived microglia
AU2022272489A1 (en) 2021-05-10 2023-11-30 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Pharmaceutical compositions for treating neurological conditions
EP4337787A1 (en) 2021-05-14 2024-03-20 Akoya Biosciences, Inc. Amplification of rna detection signals in biological samples
JP2024519029A (ja) 2021-05-17 2024-05-08 アイオバンス バイオセラピューティクス,インコーポレイテッド Pd-1遺伝子編集された腫瘍浸潤リンパ球及び免疫療法におけるその使用
US20220389436A1 (en) 2021-05-26 2022-12-08 FUJIFILM Cellular Dynamics, Inc. Methods to prevent rapid silencing of genes in pluripotent stem cells
KR20240013135A (ko) 2021-05-27 2024-01-30 사나 바이오테크놀로지, 인크. 조작된 hla-e 또는 hla-g를 포함하는 저면역원성 세포
AU2022294310A1 (en) 2021-06-13 2024-05-09 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Method for reprogramming human cells
EP4370544A2 (en) 2021-07-14 2024-05-22 Sana Biotechnology, Inc. Altered expression of y chromosome-linked antigens in hypoimmunogenic cells
WO2023288281A2 (en) 2021-07-15 2023-01-19 Fred Hutchinson Cancer Center Chimeric polypeptides
EP4377446A1 (en) 2021-07-28 2024-06-05 Iovance Biotherapeutics, Inc. Treatment of cancer patients with tumor infiltrating lymphocyte therapies in combination with kras inhibitors
WO2023010135A1 (en) 2021-07-30 2023-02-02 Tune Therapeutics, Inc. Compositions and methods for modulating expression of methyl-cpg binding protein 2 (mecp2)
EP4377459A2 (en) 2021-07-30 2024-06-05 Tune Therapeutics, Inc. Compositions and methods for modulating expression of frataxin (fxn)
EP4130028A1 (en) 2021-08-03 2023-02-08 Rhazes Therapeutics Ltd Engineered tcr complex and methods of using same
EP4380966A2 (en) 2021-08-03 2024-06-12 Genicity Limited Engineered tcr complex and methods of using same
WO2023014825A1 (en) 2021-08-03 2023-02-09 Akoya Biosciences, Inc. Rna detection by selective labeling and amplification
WO2023014922A1 (en) 2021-08-04 2023-02-09 The Regents Of The University Of Colorado, A Body Corporate Lat activating chimeric antigen receptor t cells and methods of use thereof
AU2022325231A1 (en) 2021-08-11 2024-02-08 Sana Biotechnology, Inc. Genetically modified cells for allogeneic cell therapy to reduce complement-mediated inflammatory reactions
CA3227613A1 (en) 2021-08-11 2023-02-16 William Dowdle Inducible systems for altering gene expression in hypoimmunogenic cells
AU2022326565A1 (en) 2021-08-11 2024-02-08 Sana Biotechnology, Inc. Genetically modified cells for allogeneic cell therapy
KR20240073006A (ko) 2021-08-11 2024-05-24 사나 바이오테크놀로지, 인크. 동종이계 세포 요법을 위한 유전자 변형된 1차 세포
WO2023019225A2 (en) 2021-08-11 2023-02-16 Sana Biotechnology, Inc. Genetically modified cells for allogeneic cell therapy to reduce instant blood mediated inflammatory reactions
IL311333A (en) 2021-09-09 2024-05-01 Iovance Biotherapeutics Inc Processes for the production of TIL products using a strong PD-1 TALEN
CA3231278A1 (en) 2021-09-10 2023-03-16 Deepika Rajesh Compositions of induced pluripotent stem cell-derived cells and methods of use thereof
US20230242922A1 (en) 2021-09-13 2023-08-03 Life Technologies Corporation Gene editing tools
CA3234612A1 (en) 2021-10-14 2023-04-20 Weedout Ltd. Methods of weed control
WO2023069790A1 (en) 2021-10-22 2023-04-27 Sana Biotechnology, Inc. Methods of engineering allogeneic t cells with a transgene in a tcr locus and associated compositions and methods
WO2023076880A1 (en) 2021-10-25 2023-05-04 Board Of Regents, The University Of Texas System Foxo1-targeted therapy for the treatment of cancer
AU2022379633A1 (en) 2021-10-27 2024-04-11 Regeneron Pharmaceuticals, Inc. Compositions and methods for expressing factor ix for hemophilia b therapy
US20230187042A1 (en) 2021-10-27 2023-06-15 Iovance Biotherapeutics, Inc. Systems and methods for coordinating manufacturing of cells for patient-specific immunotherapy
WO2023077053A2 (en) 2021-10-28 2023-05-04 Regeneron Pharmaceuticals, Inc. Crispr/cas-related methods and compositions for knocking out c5
WO2023077050A1 (en) 2021-10-29 2023-05-04 FUJIFILM Cellular Dynamics, Inc. Dopaminergic neurons comprising mutations and methods of use thereof
WO2023081900A1 (en) 2021-11-08 2023-05-11 Juno Therapeutics, Inc. Engineered t cells expressing a recombinant t cell receptor (tcr) and related systems and methods
AU2022408167A1 (en) 2021-12-08 2024-06-06 Regeneron Pharmaceuticals, Inc. Mutant myocilin disease model and uses thereof
WO2023105244A1 (en) 2021-12-10 2023-06-15 Pig Improvement Company Uk Limited Editing tmprss2/4 for disease resistance in livestock
GB202118058D0 (en) 2021-12-14 2022-01-26 Univ Warwick Methods to increase yields in crops
AU2022421236A1 (en) 2021-12-22 2024-06-27 Sangamo Therapeutics, Inc. Novel zinc finger fusion proteins for nucleobase editing
CA3241438A1 (en) 2021-12-23 2023-06-29 Sana Biotechnology, Inc. Chimeric antigen receptor (car) t cells for treating autoimmune disease and associated methods
WO2023126458A1 (en) 2021-12-28 2023-07-06 Mnemo Therapeutics Immune cells with inactivated suv39h1 and modified tcr
WO2023129940A1 (en) 2021-12-30 2023-07-06 Regel Therapeutics, Inc. Compositions for modulating expression of sodium voltage-gated channel alpha subunit 1 and uses thereof
WO2023131616A1 (en) 2022-01-05 2023-07-13 Vib Vzw Means and methods to increase abiotic stress tolerance in plants
WO2023131637A1 (en) 2022-01-06 2023-07-13 Vib Vzw Improved silage grasses
WO2023137472A2 (en) 2022-01-14 2023-07-20 Tune Therapeutics, Inc. Compositions, systems, and methods for programming t cell phenotypes through targeted gene repression
WO2023137471A1 (en) 2022-01-14 2023-07-20 Tune Therapeutics, Inc. Compositions, systems, and methods for programming t cell phenotypes through targeted gene activation
WO2023144199A1 (en) 2022-01-26 2023-08-03 Vib Vzw Plants having reduced levels of bitter taste metabolites
WO2023147488A1 (en) 2022-01-28 2023-08-03 Iovance Biotherapeutics, Inc. Cytokine associated tumor infiltrating lymphocytes compositions and methods
WO2023150620A1 (en) 2022-02-02 2023-08-10 Regeneron Pharmaceuticals, Inc. Crispr-mediated transgene insertion in neonatal cells
WO2023150798A1 (en) 2022-02-07 2023-08-10 Regeneron Pharmaceuticals, Inc. Compositions and methods for defining optimal treatment timeframes in lysosomal disease
WO2023154578A1 (en) 2022-02-14 2023-08-17 Sana Biotechnology, Inc. Methods of treating patients exhibiting a prior failed therapy with hypoimmunogenic cells
WO2023158836A1 (en) 2022-02-17 2023-08-24 Sana Biotechnology, Inc. Engineered cd47 proteins and uses thereof
TW202340457A (zh) 2022-02-28 2023-10-16 美商凱特製藥公司 同種異體治療細胞
WO2023173123A1 (en) 2022-03-11 2023-09-14 Sana Biotechnology, Inc. Genetically modified cells and compositions and uses thereof
WO2023196877A1 (en) 2022-04-06 2023-10-12 Iovance Biotherapeutics, Inc. Treatment of nsclc patients with tumor infiltrating lymphocyte therapies
WO2023201207A1 (en) 2022-04-11 2023-10-19 Tenaya Therapeutics, Inc. Adeno-associated virus with engineered capsid
WO2023201369A1 (en) 2022-04-15 2023-10-19 Iovance Biotherapeutics, Inc. Til expansion processes using specific cytokine combinations and/or akti treatment
WO2023220040A1 (en) 2022-05-09 2023-11-16 Synteny Therapeutics, Inc. Erythroparvovirus with a modified capsid for gene therapy
WO2023220035A1 (en) 2022-05-09 2023-11-16 Synteny Therapeutics, Inc. Erythroparvovirus compositions and methods for gene therapy
WO2023220043A1 (en) 2022-05-09 2023-11-16 Synteny Therapeutics, Inc. Erythroparvovirus with a modified genome for gene therapy
WO2023220608A1 (en) 2022-05-10 2023-11-16 Iovance Biotherapeutics, Inc. Treatment of cancer patients with tumor infiltrating lymphocyte therapies in combination with an il-15r agonist
EP4279085A1 (en) 2022-05-20 2023-11-22 Mnemo Therapeutics Compositions and methods for treating a refractory or relapsed cancer or a chronic infectious disease
WO2023240282A1 (en) 2022-06-10 2023-12-14 Umoja Biopharma, Inc. Engineered stem cells and uses thereof
WO2023250511A2 (en) 2022-06-24 2023-12-28 Tune Therapeutics, Inc. Compositions, systems, and methods for reducing low-density lipoprotein through targeted gene repression
WO2024006911A1 (en) 2022-06-29 2024-01-04 FUJIFILM Holdings America Corporation Ipsc-derived astrocytes and methods of use thereof
GB2621813A (en) 2022-06-30 2024-02-28 Univ Newcastle Preventing disease recurrence in Mitochondrial replacement therapy
WO2024015881A2 (en) 2022-07-12 2024-01-18 Tune Therapeutics, Inc. Compositions, systems, and methods for targeted transcriptional activation
WO2024013514A2 (en) 2022-07-15 2024-01-18 Pig Improvement Company Uk Limited Gene edited livestock animals having coronavirus resistance
WO2024026474A1 (en) 2022-07-29 2024-02-01 Regeneron Pharmaceuticals, Inc. Compositions and methods for transferrin receptor (tfr)-mediated delivery to the brain and muscle
WO2024040254A2 (en) 2022-08-19 2024-02-22 Tune Therapeutics, Inc. Compositions, systems, and methods for regulation of hepatitis b virus through targeted gene repression
WO2024055017A1 (en) 2022-09-09 2024-03-14 Iovance Biotherapeutics, Inc. Processes for generating til products using pd-1/tigit talen double knockdown
WO2024055018A1 (en) 2022-09-09 2024-03-14 Iovance Biotherapeutics, Inc. Processes for generating til products using pd-1/tigit talen double knockdown
WO2024064642A2 (en) 2022-09-19 2024-03-28 Tune Therapeutics, Inc. Compositions, systems, and methods for modulating t cell function
WO2024062138A1 (en) 2022-09-23 2024-03-28 Mnemo Therapeutics Immune cells comprising a modified suv39h1 gene
WO2024073606A1 (en) 2022-09-28 2024-04-04 Regeneron Pharmaceuticals, Inc. Antibody resistant modified receptors to enhance cell-based therapies
WO2024098027A1 (en) 2022-11-04 2024-05-10 Iovance Biotherapeutics, Inc. Methods for tumor infiltrating lymphocyte (til) expansion related to cd39/cd103 selection
US20240182561A1 (en) 2022-11-04 2024-06-06 Regeneron Pharmaceuticals, Inc. Calcium voltage-gated channel auxiliary subunit gamma 1 (cacng1) binding proteins and cacng1-mediated delivery to skeletal muscle
WO2024098024A1 (en) 2022-11-04 2024-05-10 Iovance Biotherapeutics, Inc. Expansion of tumor infiltrating lymphocytes from liquid tumors and therapeutic uses thereof
WO2024100604A1 (en) 2022-11-09 2024-05-16 Juno Therapeutics Gmbh Methods for manufacturing engineered immune cells
WO2024107765A2 (en) 2022-11-14 2024-05-23 Regeneron Pharmaceuticals, Inc. Compositions and methods for fibroblast growth factor receptor 3-mediated delivery to astrocytes
WO2024107670A1 (en) 2022-11-16 2024-05-23 Regeneron Pharmaceuticals, Inc. Chimeric proteins comprising membrane bound il-12 with protease cleavable linkers
WO2024112711A2 (en) 2022-11-21 2024-05-30 Iovance Biotherapeutics, Inc. Methods for assessing proliferation potency of gene-edited t cells

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010079430A1 (en) * 2009-01-12 2010-07-15 Ulla Bonas Modular dna-binding domains and methods of use
WO2011072246A2 (en) * 2009-12-10 2011-06-16 Regents Of The University Of Minnesota Tal effector-mediated dna modification

Family Cites Families (137)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4179337A (en) 1973-07-20 1979-12-18 Davis Frank F Non-immunogenic polypeptides
US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
US4535060A (en) 1983-01-05 1985-08-13 Calgene, Inc. Inhibition resistant 5-enolpyruvyl-3-phosphoshikimate synthetase, production and use
US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
US4761373A (en) 1984-03-06 1988-08-02 Molecular Genetics, Inc. Herbicide resistance in plants
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
US4940835A (en) 1985-10-29 1990-07-10 Monsanto Company Glyphosate-resistant plants
CA1293460C (en) 1985-10-07 1991-12-24 Brian Lee Sauer Site-specific recombination of dna in yeast
US4810648A (en) 1986-01-08 1989-03-07 Rhone Poulenc Agrochimie Haloarylnitrile degrading gene, its use, and cells containing the gene
ES2018274T5 (es) 1986-03-11 1996-12-16 Plant Genetic Systems Nv Celulas vegetales resistentes a los inhibidores de glutamina sintetasa, preparadas por ingenieria genetica.
US4975374A (en) 1986-03-18 1990-12-04 The General Hospital Corporation Expression of wild type and mutant glutamine synthetase in foreign hosts
US5276268A (en) 1986-08-23 1994-01-04 Hoechst Aktiengesellschaft Phosphinothricin-resistance gene, and its use
US5273894A (en) 1986-08-23 1993-12-28 Hoechst Aktiengesellschaft Phosphinothricin-resistance gene, and its use
US5013659A (en) 1987-07-27 1991-05-07 E. I. Du Pont De Nemours And Company Nucleic acid fragment encoding herbicide resistant plant acetolactate synthase
US5422251A (en) 1986-11-26 1995-06-06 Princeton University Triple-stranded nucleic acids
US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
US5006333A (en) 1987-08-03 1991-04-09 Ddi Pharmaceuticals, Inc. Conjugates of superoxide dismutase coupled to high molecular weight polyalkylene glycols
US5162602A (en) 1988-11-10 1992-11-10 Regents Of The University Of Minnesota Corn plants tolerant to sethoxydim and haloxyfop herbicides
US5176996A (en) 1988-12-20 1993-01-05 Baylor College Of Medicine Method for making synthetic oligonucleotides which bind specifically to target sites on duplex DNA molecules, by forming a colinear triplex, the synthetic oligonucleotides and methods of use
US5501967A (en) 1989-07-26 1996-03-26 Mogen International, N.V./Rijksuniversiteit Te Leiden Process for the site-directed integration of DNA into the genome of plants
US5484956A (en) 1990-01-22 1996-01-16 Dekalb Genetics Corporation Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
AU7979491A (en) 1990-05-03 1991-11-27 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
US5204253A (en) 1990-05-29 1993-04-20 E. I. Du Pont De Nemours And Company Method and apparatus for introducing biological substances into living cells
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
US5767366A (en) 1991-02-19 1998-06-16 Louisiana State University Board Of Supervisors, A Governing Body Of Louisiana State University Agricultural And Mechanical College Mutant acetolactate synthase gene from Ararbidopsis thaliana for conferring imidazolinone resistance to crop plants
US5420032A (en) 1991-12-23 1995-05-30 Universitge Laval Homing endonuclease which originates from chlamydomonas eugametos and recognizes and cleaves a 15, 17 or 19 degenerate double stranded nucleotide sequence
US5356802A (en) 1992-04-03 1994-10-18 The Johns Hopkins University Functional domains in flavobacterium okeanokoites (FokI) restriction endonuclease
US5436150A (en) 1992-04-03 1995-07-25 The Johns Hopkins University Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease
US5792640A (en) 1992-04-03 1998-08-11 The Johns Hopkins University General method to clone hybrid restriction endonucleases using lig gene
US5487994A (en) 1992-04-03 1996-01-30 The Johns Hopkins University Insertion and deletion mutants of FokI restriction endonuclease
US5792632A (en) 1992-05-05 1998-08-11 Institut Pasteur Nucleotide sequence encoding the enzyme I-SceI and the uses thereof
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
EP0604662B1 (en) 1992-07-07 2008-06-18 Japan Tobacco Inc. Method of transforming monocotyledon
CA2154581C (en) 1993-02-12 2008-12-16 Srinivasan Chandrasegaran Functional domains in flavobacterium okeanokoites (foki) restriction endonuclease
US6242568B1 (en) 1994-01-18 2001-06-05 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
CA2681922C (en) 1994-01-18 2012-05-15 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US6140466A (en) 1994-01-18 2000-10-31 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
WO1995025809A1 (en) 1994-03-23 1995-09-28 Ohio University Compacted nucleic acids and their delivery to cells
US5585245A (en) 1994-04-22 1996-12-17 California Institute Of Technology Ubiquitin-based split protein sensor
US6808904B2 (en) 1994-06-16 2004-10-26 Syngenta Participations Ag Herbicide-tolerant protox genes produced by DNA shuffling
GB9824544D0 (en) 1998-11-09 1999-01-06 Medical Res Council Screening system
ATE407205T1 (de) 1994-08-20 2008-09-15 Gendaq Ltd Verbesserung in bezug auf bindungsproteine bei der erkennung von dna
US7285416B2 (en) 2000-01-24 2007-10-23 Gendaq Limited Regulated gene expression in plants
US6326166B1 (en) 1995-12-29 2001-12-04 Massachusetts Institute Of Technology Chimeric DNA-binding proteins
US5789538A (en) 1995-02-03 1998-08-04 Massachusetts Institute Of Technology Zinc finger proteins with high affinity new DNA binding specificities
US5853973A (en) 1995-04-20 1998-12-29 American Cyanamid Company Structure based designed herbicide resistant products
US6084155A (en) 1995-06-06 2000-07-04 Novartis Ag Herbicide-tolerant protoporphyrinogen oxidase ("protox") genes
US5928638A (en) 1996-06-17 1999-07-27 Systemix, Inc. Methods for gene transfer
US5925523A (en) 1996-08-23 1999-07-20 President & Fellows Of Harvard College Intraction trap assay, reagents and uses thereof
JPH10117776A (ja) 1996-10-22 1998-05-12 Japan Tobacco Inc インディカイネの形質転換方法
GB9703369D0 (en) 1997-02-18 1997-04-09 Lindqvist Bjorn H Process
GB2338237B (en) 1997-02-18 2001-02-28 Actinova Ltd In vitro peptide or protein expression library
US6342345B1 (en) 1997-04-02 2002-01-29 The Board Of Trustees Of The Leland Stanford Junior University Detection of molecular interactions by reporter subunit complementation
GB9710809D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
GB9710807D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
US6410248B1 (en) 1998-01-30 2002-06-25 Massachusetts Institute Of Technology General strategy for selecting high-affinity zinc finger proteins for diverse DNA target sites
WO1999045132A1 (en) 1998-03-02 1999-09-10 Massachusetts Institute Of Technology Poly zinc finger proteins with improved linkers
GB9819693D0 (en) 1998-09-10 1998-11-04 Zeneca Ltd Glyphosate formulation
US7013219B2 (en) 1999-01-12 2006-03-14 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US7070934B2 (en) 1999-01-12 2006-07-04 Sangamo Biosciences, Inc. Ligand-controlled regulation of endogenous gene expression
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
AU2982900A (en) 1999-02-03 2000-08-25 Children's Medical Center Corporation Gene repair involving the induction of double-stranded dna cleavage at a chromosomal target site
US6451732B1 (en) 1999-06-04 2002-09-17 Syngenta, Limited Herbicidal compositions of glyphosate trimesium
AU776576B2 (en) 1999-12-06 2004-09-16 Sangamo Biosciences, Inc. Methods of using randomized libraries of zinc finger proteins for the identification of gene function
EP1180480B1 (en) 2000-01-26 2012-11-14 Dai Nippon Printing Co., Ltd. Heat-sealing method
DE60143192D1 (de) 2000-02-08 2010-11-18 Sangamo Biosciences Inc Zellen zur entdeckung von medikamenten
US20020061512A1 (en) 2000-02-18 2002-05-23 Kim Jin-Soo Zinc finger domains and methods of identifying same
DE60126483T2 (de) 2000-04-28 2007-12-06 Sangamo BioSciences, Inc., Richmond Gezielte Modifikation der Chromatinstruktur
ATE374249T1 (de) 2000-04-28 2007-10-15 Sangamo Biosciences Inc Datenbanken von regulatorischen sequenzen, methoden zu ihrer herstellung und verwendung
WO2001088197A2 (en) 2000-05-16 2001-11-22 Massachusetts Institute Of Technology Methods and compositions for interaction trap assays
US6919204B2 (en) 2000-09-29 2005-07-19 Sangamo Biosciences, Inc. Modulation of gene expression using localization domains
US6368227B1 (en) 2000-11-17 2002-04-09 Steven Olson Method of swinging on a swing
WO2002044376A2 (en) 2000-11-28 2002-06-06 Sangamo Biosciences, Inc. Modulation of gene expression using insulator binding proteins
US7067317B2 (en) 2000-12-07 2006-06-27 Sangamo Biosciences, Inc. Regulation of angiogenesis with zinc finger proteins
US7273923B2 (en) 2001-01-22 2007-09-25 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
GB0108491D0 (en) 2001-04-04 2001-05-23 Gendaq Ltd Engineering zinc fingers
US7262054B2 (en) 2002-01-22 2007-08-28 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
ATE347593T1 (de) 2002-01-23 2006-12-15 Univ Utah Res Found Zielgerichtete chromosomale mutagenese mit zinkfingernukleasen
WO2009095742A1 (en) 2008-01-31 2009-08-06 Cellectis New i-crei derived single-chain meganuclease and uses thereof
US20060078552A1 (en) 2002-03-15 2006-04-13 Sylvain Arnould Hybrid and single chain meganucleases and use thereof
WO2003080809A2 (en) 2002-03-21 2003-10-02 Sangamo Biosciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
US7361635B2 (en) 2002-08-29 2008-04-22 Sangamo Biosciences, Inc. Simultaneous modulation of multiple genes
EP1581610A4 (en) 2002-09-05 2009-05-27 California Inst Of Techn USE OF CHIMERIC NUCLEASES TO STIMULATE GENE TARGETING
JP4966006B2 (ja) 2003-01-28 2012-07-04 セレクティス カスタムメイドメガヌクレアーゼおよびその使用
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
US7972854B2 (en) 2004-02-05 2011-07-05 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US7189691B2 (en) 2004-04-01 2007-03-13 The Administrators Of The Tulane Educational Fund Methods and compositions for treating leukemia
US20060063231A1 (en) 2004-09-16 2006-03-23 Sangamo Biosciences, Inc. Compositions and methods for protein production
CN101273141B (zh) 2005-07-26 2013-03-27 桑格摩生物科学股份有限公司 外源核酸序列的靶向整合和表达
EP2341135A3 (en) 2005-10-18 2011-10-12 Precision Biosciences Rationally-designed meganucleases with altered sequence specificity and DNA-binding affinity
WO2007060495A1 (en) 2005-10-25 2007-05-31 Cellectis I-crei homing endonuclease variants having novel cleavage specificity and use thereof
AU2007254251A1 (en) 2006-05-19 2007-11-29 Sangamo Therapeutics, Inc. Methods and compositions for inactivation of dihydrofolate reductase
WO2007139898A2 (en) 2006-05-25 2007-12-06 Sangamo Biosciences, Inc. Variant foki cleavage half-domains
JP5551432B2 (ja) 2006-05-25 2014-07-16 サンガモ バイオサイエンシーズ, インコーポレイテッド 遺伝子不活性化のための方法と組成物
WO2008010009A1 (en) 2006-07-18 2008-01-24 Cellectis Meganuclease variants cleaving a dna target sequence from a rag gene and uses thereof
EP3070169B1 (en) 2006-12-14 2018-05-09 Dow AgroSciences LLC Optimized non-canonical zinc finger proteins
ATE489465T1 (de) 2007-04-26 2010-12-15 Sangamo Biosciences Inc Gezielte integration in die ppp1r12c-position
US8790345B2 (en) 2007-08-21 2014-07-29 Zimmer, Inc. Titanium alloy with oxidized zirconium for a prosthetic implant
CN101878307B (zh) 2007-09-27 2017-07-28 陶氏益农公司 以5‑烯醇式丙酮酰莽草酸‑3‑磷酸合酶基因为靶的改造锌指蛋白
US8563314B2 (en) 2007-09-27 2013-10-22 Sangamo Biosciences, Inc. Methods and compositions for modulating PD1
WO2009042753A1 (en) 2007-09-28 2009-04-02 Two Blades Foundation Bs3 resistance gene and methods of use
RU2499599C2 (ru) 2007-09-28 2013-11-27 Интрексон Корпорейшн Конструкции терапевтического переключения генов и биореакторы для экспрессии биотерапевтических молекул и их применение
CA2703045C (en) 2007-10-25 2017-02-14 Sangamo Biosciences, Inc. Methods and compositions for targeted integration
AU2009313275B2 (en) 2008-11-10 2015-08-20 Two Blades Foundation Pathogen-inducible promoters and their use in enhancing the disease resistance of plants
US9834787B2 (en) 2009-04-09 2017-12-05 Sangamo Therapeutics, Inc. Targeted integration into stem cells
US8772008B2 (en) 2009-05-18 2014-07-08 Sangamo Biosciences, Inc. Methods and compositions for increasing nuclease activity
JP2012529287A (ja) 2009-06-11 2012-11-22 トゥールゲン インコーポレイション 部位−特異的ヌクレアーゼを用いた標的ゲノムの再配列
EP2449135B1 (en) 2009-06-30 2016-01-06 Sangamo BioSciences, Inc. Rapid screening of biologically active nucleases and isolation of nuclease-modified cells
WO2011017293A2 (en) 2009-08-03 2011-02-10 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
US8586526B2 (en) * 2010-05-17 2013-11-19 Sangamo Biosciences, Inc. DNA-binding proteins and uses thereof
AU2010282958B2 (en) 2009-08-11 2015-05-21 Sangamo Therapeutics, Inc. Organisms homozygous for targeted modification
WO2011049627A1 (en) 2009-10-22 2011-04-28 Dow Agrosciences Llc Engineered zinc finger proteins targeting plant genes involved in fatty acid biosynthesis
US8956828B2 (en) 2009-11-10 2015-02-17 Sangamo Biosciences, Inc. Targeted disruption of T cell receptor genes using engineered zinc finger protein nucleases
CN105384827A (zh) 2009-11-27 2016-03-09 巴斯夫植物科学有限公司 嵌合内切核酸酶及其用途
DE112010004584T5 (de) 2009-11-27 2012-11-29 Basf Plant Science Company Gmbh Chimäre Endonukleasen und Anwendungen davon
CA2782014C (en) 2009-11-27 2021-08-31 Basf Plant Science Company Gmbh Optimized endonucleases and uses thereof
US20110203012A1 (en) 2010-01-21 2011-08-18 Dotson Stanton B Methods and compositions for use of directed recombination in plant breeding
EP4328304A2 (en) 2010-02-08 2024-02-28 Sangamo Therapeutics, Inc. Engineered cleavage half-domains
EP2660318A1 (en) 2010-02-09 2013-11-06 Sangamo BioSciences, Inc. Targeted genomic modification with partially single-stranded donor molecules
US9567573B2 (en) 2010-04-26 2017-02-14 Sangamo Biosciences, Inc. Genome editing of a Rosa locus using nucleases
EP2392208B1 (en) 2010-06-07 2016-05-04 Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Fusion proteins comprising a DNA-binding domain of a Tal effector protein and a non-specific cleavage domain of a restriction nuclease and their use
CA2802360A1 (en) 2010-06-14 2011-12-22 Iowa State University Research Foundation, Inc. Nuclease activity of tal effector and foki fusion protein
US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
WO2013074999A1 (en) * 2011-11-16 2013-05-23 Sangamo Biosciences, Inc. Modified dna-binding proteins and uses thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010079430A1 (en) * 2009-01-12 2010-07-15 Ulla Bonas Modular dna-binding domains and methods of use
WO2011072246A2 (en) * 2009-12-10 2011-06-16 Regents Of The University Of Minnesota Tal effector-mediated dna modification

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
BOCH,J. ET AL.: "Breaking the code of DNA binding specificity of TAL-type III effectors.", SCIENCE, vol. 326, no. 5959, JPN6014046456, 29 October 2009 (2009-10-29), pages 1509 - 1512, XP002581597, ISSN: 0003105320 *
KACHALOVA, G.S. ET AL: "Structural Analysis of the Heterodimeric Type IIS Restriction Endonuclease R.BspD6I Acting as a Comp", J. MOL. BIOL., vol. 384, no. 2, JPN6015025974, 2008, pages 489 - 502, XP025609976, ISSN: 0003105328, DOI: 10.1016/j.jmb.2008.09.033 *
LIPPOW, S.M. ET AL.: "Creation of a type IIS restriction endonuclease with a long recognition sequence.", NUCLEIC ACIDS RES., vol. 37, no. 9, JPN7015001765, 2009, pages 3061 - 3073, XP008155323, ISSN: 0003105323, DOI: 10.1093/nar/gkp182 *
MOSCOU, M.J. ET AL.: "A simple cipher governs DNA recognition by TAL effectors.", SCIENCE, vol. 326, no. 5959, JPN6015025970, 2009, pages 1501, XP002599998, ISSN: 0003105325 *
SHUKLA,V.K. ET AL.: "Precise genome modification in the crop species Zea mays using zinc-finger nucleases.", NATURE, vol. 459, no. 7245, JPN6014046474, 21 May 2009 (2009-05-21), pages 437 - 441, ISSN: 0003105324 *
SZUREK, B. ET AL.: "Eukaryotic features of the Xanthomonas type III effector AvrBs3: protein domains involved in transcr", PLANT J., vol. 26, no. 5, JPN6015025968, 2001, pages 523 - 534, ISSN: 0003105322 *
TOWNSEND,J.A. ET AL.: "High-frequency modification of plant genes using engineered zinc-finger nucleases.", NATURE, vol. 459, no. 7245, JPN6014046476, 21 May 2009 (2009-05-21), pages 442 - 445, XP002588972, ISSN: 0003105326, DOI: 10.1038/NATURE07845 *
WILLIAMS, R.J.: "Restriction endonucleases: classification, properties, and applications.", MOL BIOTECHNOL., vol. 23, no. 3, JPN6015025973, 2003, pages 225 - 243, XP009034361, ISSN: 0003105327, DOI: 10.1385/MB:23:3:225 *
ZHU, W. ET AL.: "The C terminus of AvrXa10 can be replaced by the transcriptional activation domain of VP16 from the", PLANT CELL, vol. 11, no. 9, JPN6015025967, 1999, pages 1665 - 1674, ISSN: 0003105321 *

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10920242B2 (en) 2011-02-25 2021-02-16 Recombinetics, Inc. Non-meiotic allele introgression
US11472849B2 (en) 2011-07-15 2022-10-18 The General Hospital Corporation Methods of transcription activator like effector assembly
JP2014521317A (ja) * 2011-07-15 2014-08-28 ザ ジェネラル ホスピタル コーポレイション 転写活性化因子様エフェクターの組立て方法
US10273271B2 (en) 2011-07-15 2019-04-30 The General Hospital Corporation Methods of transcription activator like effector assembly
US9890364B2 (en) 2012-05-29 2018-02-13 The General Hospital Corporation TAL-Tet1 fusion proteins and methods of use thereof
US10894950B2 (en) 2012-05-29 2021-01-19 The General Hospital Corporation TAL-Tet1 fusion proteins and methods of use thereof
US11891631B2 (en) 2012-10-12 2024-02-06 The General Hospital Corporation Transcription activator-like effector (tale) - lysine-specific demethylase 1 (LSD1) fusion proteins
US10731167B2 (en) 2013-02-07 2020-08-04 The General Hospital Corporation Tale transcriptional activators
US10676749B2 (en) 2013-02-07 2020-06-09 The General Hospital Corporation Tale transcriptional activators
JP6993063B2 (ja) 2013-07-26 2022-01-13 プレジデント アンド フェローズ オブ ハーバード カレッジ ゲノムエンジニアリング
JP2020110152A (ja) * 2013-07-26 2020-07-27 プレジデント アンド フェローズ オブ ハーバード カレッジ ゲノムエンジニアリング
US11306328B2 (en) 2013-07-26 2022-04-19 President And Fellows Of Harvard College Genome engineering
JP2015033365A (ja) * 2013-08-09 2015-02-19 国立大学法人広島大学 Dna結合ドメインを含むポリペプチド
US10006011B2 (en) 2013-08-09 2018-06-26 Hiroshima University Polypeptide containing DNA-binding domain
US10030235B2 (en) 2013-08-09 2018-07-24 Hiroshima University Polypeptide containing DNA-binding domain
WO2015020218A1 (ja) * 2013-08-09 2015-02-12 独立行政法人理化学研究所 Dna結合タンパク質ドメインの改変による高活性taleタンパク質
WO2015019672A1 (ja) * 2013-08-09 2015-02-12 国立大学法人広島大学 Dna結合ドメインを含むポリペプチド
US11359186B2 (en) 2013-08-09 2022-06-14 Hiroshima University Polypeptide containing DNA-binding domain
JP2020089386A (ja) * 2013-08-27 2020-06-11 リコンビネティクス・インコーポレイテッドRecombinetics,Inc. 効率的な非減数分裂対立遺伝子移入
US11477969B2 (en) 2013-08-27 2022-10-25 Recombinetics, Inc. Efficient non-meiotic allele introgression in livestock
JP2016529904A (ja) * 2013-08-27 2016-09-29 リコンビネティクス・インコーポレイテッドRecombinetics,Inc. 効率的な非減数分裂対立遺伝子移入
US10959414B2 (en) 2013-08-27 2021-03-30 Recombinetics, Inc. Efficient non-meiotic allele introgression
WO2015068785A1 (ja) 2013-11-06 2015-05-14 国立大学法人広島大学 核酸挿入用ベクター
EP3865575A1 (en) 2013-11-06 2021-08-18 Hiroshima University Vector for nucleic acid insertion
JP2018057407A (ja) * 2013-11-18 2018-04-12 クリスパー セラピューティクス アーゲー Crispr−casシステムの材料及び方法
WO2016159110A1 (ja) * 2015-03-31 2016-10-06 国立研究開発法人農業生物資源研究所 バイナリー遺伝子発現システム
JPWO2016159110A1 (ja) * 2015-03-31 2018-02-01 国立研究開発法人農業・食品産業技術総合研究機構 バイナリー遺伝子発現システム
JP2016175922A (ja) * 2016-04-25 2016-10-06 国立大学法人広島大学 Dna結合ドメインを含むポリペプチド
JP2020531572A (ja) * 2017-08-04 2020-11-05 北京大学Peking University メチル化により修飾されたdna塩基を特異的に認識するtale rvdおよびその使用
JP7207665B2 (ja) 2017-08-04 2023-01-18 北京大学 メチル化により修飾されたdna塩基を特異的に認識するtale rvdおよびその使用
US11897920B2 (en) 2017-08-04 2024-02-13 Peking University Tale RVD specifically recognizing DNA base modified by methylation and application thereof
US11624077B2 (en) 2017-08-08 2023-04-11 Peking University Gene knockout method
WO2020209332A1 (ja) 2019-04-09 2020-10-15 国立研究開発法人科学技術振興機構 核酸結合性タンパク質

Also Published As

Publication number Publication date
US20190169640A1 (en) 2019-06-06
US8586526B2 (en) 2013-11-19
US9322005B2 (en) 2016-04-26
US20170016030A1 (en) 2017-01-19
US20140134741A1 (en) 2014-05-15
IL222961B (en) 2018-08-30
US9783827B2 (en) 2017-10-10
AU2011256838A1 (en) 2012-12-06
IL222961A0 (en) 2013-02-03
WO2011146121A1 (en) 2011-11-24
CN103025344A (zh) 2013-04-03
AU2011256838B2 (en) 2014-10-09
CN103025344B (zh) 2016-06-29
EP2571512B1 (en) 2017-08-23
US11661612B2 (en) 2023-05-30
JP6208580B2 (ja) 2017-10-04
US20220356493A1 (en) 2022-11-10
US10253333B2 (en) 2019-04-09
CA2798988C (en) 2020-03-10
CA2798988A1 (en) 2011-11-24
KR101953237B1 (ko) 2019-02-28
US20140134740A1 (en) 2014-05-15
JP2016182143A (ja) 2016-10-20
US20110301073A1 (en) 2011-12-08
EP3156062A1 (en) 2017-04-19
KR20130111219A (ko) 2013-10-10
EP2571512A4 (en) 2013-11-20
US20140134723A1 (en) 2014-05-15
US8912138B2 (en) 2014-12-16
US20180010152A1 (en) 2018-01-11
US9493750B2 (en) 2016-11-15
EP2571512A1 (en) 2013-03-27

Similar Documents

Publication Publication Date Title
US11661612B2 (en) DNA-binding proteins and uses thereof
JP6812478B2 (ja) ヌクレアーゼ媒介性遺伝子破壊を増強するための方法および組成物
JP6144691B2 (ja) 修飾されたdna結合タンパク質およびその使用
JP5940977B2 (ja) 標的改変によるホモ接合生物
CA2910427A1 (en) Delivery methods and compositions for nuclease-mediated genome engineering

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150930

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20160712

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20160804

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20161007

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170531

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170907

R150 Certificate of patent or registration of utility model

Ref document number: 6208580

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250