JP7282697B2 - 新規タンパク質細孔 - Google Patents

新規タンパク質細孔 Download PDF

Info

Publication number
JP7282697B2
JP7282697B2 JP2019572644A JP2019572644A JP7282697B2 JP 7282697 B2 JP7282697 B2 JP 7282697B2 JP 2019572644 A JP2019572644 A JP 2019572644A JP 2019572644 A JP2019572644 A JP 2019572644A JP 7282697 B2 JP7282697 B2 JP 7282697B2
Authority
JP
Japan
Prior art keywords
csgg
csgf
pore
seq
peptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019572644A
Other languages
English (en)
Other versions
JPWO2019002893A5 (ja
JP2020530276A5 (ja
JP2020530276A (ja
Inventor
ルモー,ハン
デール ヴェレン,サンダー,エグベルト ヴァン
ゲルヴェン,ナニ ヴァン
ジャヤシンヘ,ラクマル,ニシャンタ
エリザベス,ジェーン ウォレス
シン,パトリック,ラージ
ジョージ ハンブリー,リチャード
ジョーダン,マイケル,ロバート
キルグール,ジョン,ジョセフ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vlaams Instituut voor Biotechnologie VIB
Vrije Universiteit Brussel VUB
Original Assignee
Vlaams Instituut voor Biotechnologie VIB
Vrije Universiteit Brussel VUB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vlaams Instituut voor Biotechnologie VIB, Vrije Universiteit Brussel VUB filed Critical Vlaams Instituut voor Biotechnologie VIB
Publication of JP2020530276A publication Critical patent/JP2020530276A/ja
Publication of JP2020530276A5 publication Critical patent/JP2020530276A5/ja
Publication of JPWO2019002893A5 publication Critical patent/JPWO2019002893A5/ja
Priority to JP2023081191A priority Critical patent/JP2023113692A/ja
Application granted granted Critical
Publication of JP7282697B2 publication Critical patent/JP7282697B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/475Growth factors; Growth regulators
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6872Intracellular protein regulatory factors and their receptors, e.g. including ion channels
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B82NANOTECHNOLOGY
    • B82YSPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
    • B82Y15/00Nanotechnology for interacting, sensing or actuating, e.g. quantum dots as markers in protein assays or molecular motors
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B82NANOTECHNOLOGY
    • B82YSPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
    • B82Y5/00Nanobiotechnology or nanomedicine, e.g. protein engineering or drug delivery
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Nanotechnology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Cell Biology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Food Science & Technology (AREA)
  • Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Toxicology (AREA)
  • Medical Informatics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

本発明は、新規タンパク質細孔および分析物検出および特徴解析におけるそれらの用途に関する。本発明はさらに、膜貫通細孔複合体および細孔複合体の製造方法、および分子感知および核酸配列決定用途での使用に関する。
ナノ細孔感知は、分析物分子とイオン導電性チャネルとの間の個々の結合事象または相互作用事象の観察に依存する分析物検出および特徴付けのアプローチである。ナノ細孔センサーは、電気的に絶縁された膜にナノメートル寸法の単一の細孔を配置し、分析物分子の存在下の細孔を通して電圧駆動イオン電流を測定することによって作成されうる。ナノ細孔内またはその近くの分析物の存在は、細孔を通るイオンの流れを変化させ、結果としてチャネル上で測定されるイオン電流または電流を変化させる。分析物の同一性は、その独特の電流シグネチャ、特に電流ブロックの持続時間および程度、および細孔とのその相互作用時間中の電流レベルの差異を通して明らかになる。分析物は、有機および無機の小分子、ならびに様々な生物学的または合成の巨大分子およびポリヌクレオチド、ポリペプチド、および多糖類を含むポリマーでありうる。ナノ細孔感知は同一性を明らかにし、検出された分析物の単一分子カウンティングを実施することができるが、ヌクレオチド、アミノ酸またはグリカン配列などの分析物組成に関する情報、ならびにメチル化およびアシル化、リン酸化、水酸化、酸化、還元、グリコシル化、脱炭酸、脱アミノ、その他などの、塩基、アミノ酸またはグリカンの修飾の存在に関する情報も提供できる。ナノ細孔感知は、迅速かつ安価なポリヌクレオチドを可能にする可能性があり、数十~数万個の塩基長のポリヌクレオチドの単分子配列読み取りを提供する。
ナノ細孔感知を使用したポリマー特徴付けの重要な二つの構成要素は、(1)細孔を通したポリマー移動の制御と、(2)ポリマーが細孔を通して移動するときの構成された基本要素の差別である。ナノ細孔感知の間、細孔の最も狭い部分は、通過する分析物の関数としての電流シグネチャに関してナノ細孔の最も差別化された部分であるリーダーヘッドを形成する。CsgGは、ゲートのない非選択的タンパク質分泌チャネルとして大腸菌(Escherichia coli)から識別されたもの(Goyal et al., 2014)であり、分析物を検出および特徴付けるためのナノ細孔として使用されてきた。この文脈で細孔の特性を改善する野生型CsgG細孔に対する突然変異が開示されてきた(WO2016/034591、WO2017/149316、WO2017/149317およびWO2017/149318、PCT/GB2018/051191、全てが参照により本明細書に組み込まれる)。
分析物がポリヌクレオチドである場合、ヌクレオチド差別はこうした突然変異体細孔を通る通路によって達成されるが、電流シグネチャは、チャネル収縮の高さおよび分析物との相互作用表面の範囲が、観察された電流とポリヌクレオチド配列との間の関係に影響を及ぼすように、配列依存であること、また複数のヌクレオチドが観察された電流に寄与することが示されてきた。ヌクレオチド差別の電流範囲は、CsgG細孔の突然変異を通して改善されてきたが、ヌクレオチド間の電流の差異をさらに改善できる場合、配列決定システムはより高い性能を持つことになる。従って、ナノ細孔感知の機能を改善する新しい方法を特定する必要性がある。
本開示は、CsgG細孔を結合しそれによってCsgG細孔内に別の追加的なチャネルまたは細孔の収縮を導入する、修飾CsgFペプチド、特に切断CsgF断片に関する。本発明のその他の態様はまた、単離された膜貫通細孔複合体と、二つの連続したリーダーヘッドを持つナノ細孔感知プラットフォーム内での、前記CsgG:CsgF複合体と修飾CsgFペプチドまたは断片の使用に関する。
本発明の第一の態様は、CsgG細孔およびCsgFペプチドを含む細孔に関する。一態様では、CsgFペプチドは、CsgG結合領域と、細孔内の収縮部を形成する領域とを含む。一態様では、CsgFペプチドはCsgFのC末端ヘッドドメインを欠く切断CsgFペプチドである。別の態様では、CsgFペプチドは、C末端ヘッドおよびCsgFのネックドメインの一部を欠く切断CsgFペプチドである。別の態様では、CsgFペプチドは、CsgFのC末端ヘッドドメインおよびネックドメインを欠く切断CsgFペプチドである。細孔はまた、本明細書で細孔複合体として、単離された細孔複合体としても言及される。単離された細孔複合体は、CsgG細孔またはその相同体もしくは突然変異体、ならびに修飾CsgFペプチドまたはその相同体もしくは突然変異体、特に切断CsgF断片またはその相同体もしくは突然変異体を含む。一実施形態では、前記修飾CsgFペプチド、または相同体もしくは突然変異体は、CsgG細孔またはその相同体もしくは突然変異体の内腔内に位置する。別の実施形態では、前記単離された細孔複合体は二つ以上のチャネル収縮部を有し、一つは、CsgG細孔によって位置付けまたは提供され、その収縮ループによって形成されたもので、もう一つの追加的なチャネル収縮部またはリーダーヘッドは、修飾CsgFペプチドまたはその相同体もしくは突然変異体によって導入されたものである。一実施形態では、前記CsgG-細孔またはCsgG様の細孔は、野生型の細孔ではなく突然変異体CsgG細孔であり、特定の実施形態では、例えば、前記チャネル収縮ループ内に突然変異が存在する。別の実施形態では、修飾CsgFペプチドまたはその相同体もしくは突然変異体を含む単離された細孔複合体は、0.5 nm~2.0 nmの範囲の直径を有するCsgFチャネル収縮部を有する。一実施形態では、細孔複合体は、(i)第一の開口部と、βバレルを含む中間部分と、第二の開口部と、第一の開口部から中間部分を通って第二の開口部に延びる内腔とを備えたCsgG細孔であって、中間部分の内腔表面がCsgG収縮部を画定するものと、(ii)複数の修飾CsgFペプチドであって、CsgF収縮領域およびCsgF結合領域(本明細書では、CsgG結合ドメインまたはCsgFの領域ともいう)を有し、修飾CsgFペプチドが、CsgG細孔のβバレル内にCsgF収縮部を形成し、またCsgG収縮部およびCsgF収縮部がCsgG細孔のβバレル内で同軸に間隙を介しているものとを含む。CsgG細孔の内腔表面は、CsgG収縮を画定するCsgGモノマーの一つ以上のループ領域を含みうる。CsgF収縮領域およびCsgF結合領域は通常、CsgF成熟ペプチドのN末端部分に対応する。一実施形態では、細孔複合体は、CsgA、CsgB、およびCsgEを含まない。
第二の態様では、本発明は、修飾CsgFペプチドまたはその相同体もしくは突然変異体に関し、タンパク質またはペプチドは、タンパク質の一部の切断または欠失を介して修飾され、配列番号6のCsgF断片またはその相同体または突然変異体のCsgF断片をもたらす。一実施形態は、修飾または切断CsgFペプチド、またはCsgF相同体もしくは突然変異体の修飾ペプチドに関し、前記修飾ペプチドは、配列番号39、または配列番号40またはその相同体もしくは突然変異体を含み、別の方法として、前記修飾ペプチドは、配列番号15またはその相同体もしくは突然変異体、別の方法として配列番号54、または配列番号55またはその相同体もしくは突然変異体を含む。別の実施形態では、修飾CsgFペプチドが開示されており、ここで、配列番号15を含む領域内の一つ以上の位置が修飾され、また、前記突然変異体は、配列番号15に対する最低でも35%のアミノ酸同一性を、配列番号15を含む領域に対応するペプチド断片内に保持することが要求される。
一実施形態は、CsgG細孔および修飾CsgFペプチドを含む細孔に関し、ここで、修飾CsgFペプチドは、CsgGに結合し、細孔内に収縮部を形成する。
一実施形態は、本発明の第二の態様による、前記修飾CsgFペプチドまたはその相同体もしくは突然変異体をコードするポリヌクレオチドに関する。別の実施形態では、CsgG細孔および修飾CsgFペプチドまたはその相同体もしくは突然変異体を含む、単離された細孔複合体は、前記修飾CsgFペプチドが、本発明の第二の態様で開示されたペプチドにより提供されるペプチドであるという点で特徴付けられる。
別の実施形態は、単離された細孔複合体に関し、ここで修飾CsgFペプチドおよびCsgG細孔または前記細孔またはその相同体もしくは突然変異体のモノマーが共有結合されている。さらに具体的には、前記結合は、CsgGモノマー内の配列番号3またはその相同体の132、133、136、138、140、142、144、145、147、149、151、153、155、183、185、187、189、191、201、203、205、207または209に対応する位置にある、システイン残基を介して、または、非天然の反応性または光反応性アミノ酸を介してなされる。
好ましい実施形態は、単離された膜貫通細孔複合体、または膜組成物に関し、これは、本発明の単離された細孔複合体、および膜の構成要素を含む。特に、前記膜貫通細孔複合体または膜組成物は、本発明の単離された細孔複合体、膜の構成要素または絶縁層の構成要素で構成される。
一実施形態は、本明細書に開示される細孔を生成するための方法に関し、方法は、本明細書で開示される一つ以上のCsgGモノマーおよび本明細書で開示されるCsgFペプチドを宿主細胞内で共発現して、それによって細胞内での膜貫通細孔複合体形成を可能にする工程を含む。CsgFペプチドは、アミノ酸配列の適切な位置に酵素切断部位を含む修飾CsgFペプチドまたはタンパク質を切断することによって細胞内で製造されてもよい。
一実施形態は、本明細書に開示される細孔を生成するための方法に関し、方法は、一つ以上の精製されたCsgGモノマーを一つ以上の精製された修飾CsgFペプチドと接触させて、それによって細孔のin vitro形成を可能にする工程を含む。修飾CsgFペプチドは、細孔の形成の前または後に切断されるアミノ酸配列の適切な位置にある酵素切断部位を含むペプチドでもよい。
本発明の第三の態様は、前記膜貫通細孔複合体を生成するための方法に関し、ここで、細孔は、CsgG細孔またはその相同体もしくは突然変異体、および修飾CsgFペプチドまたはその相同体もしくは突然変異体によって形成された単離された複合体であり、方法は、適切な宿主細胞内で、CsgG配列番号2またはその相同体もしくは突然変異体、および修飾または切断されたCsgF(配列番号5の断片を含む)またはその相同体もしくは突然変異体を共発現して、それによってin vivo細孔複合体形成を可能にする工程を含む。特定の実施形態では、前記修飾CsgFペプチドまたはその相同体もしくは突然変異体は、配列番号12または配列番号14またはその相同体もしくは突然変異体を含む。別の方法として、単離された細孔複合体を生成するための方法は、細孔複合体のin vitro再構成のために、配列番号3またはその相同体もしくは突然変異体のCsgGモノマーを、修飾CsgFペプチドまたはその相同体もしくは突然変異体と接触させる工程を含む。特定の実施形態では、前記方法の修飾CsgFペプチドは、配列番号15または配列番号16またはその相同体もしくは突然変異体を含む。
本発明の別の態様は、標的分析物の存在、不在または一つ以上の特性を決定するための方法に関連し、この方法は、
(i) 標的分析物が細孔チャネル内に移動するように、標的分析物を前記単離された細孔複合体または膜貫通細孔複合体と接触させる工程と、
(ii) 分析物が細孔チャネルを通って移動する時に一つ以上の測定値を取り、それによって分析物の存在、不在または一つ以上の特性を決定する工程とを含む。
一実施形態では、前記分析物はポリヌクレオチドである。特に、ポリヌクレオチドを分析物として使用する前記方法は、(i)ポリヌクレオチドの長さ、(ii)ポリヌクレオチドの同一性、(iii)ポリヌクレオチドの配列、(iv)ポリヌクレオチドの二次構造および(v)ポリヌクレオチドが修飾されているかどうかから選択される一つ以上の特性を決定する工程を含む。
別の実施形態では、分析物は、タンパク質、またはペプチドであり、またさらなる実施形態では、前記分析物は、多糖類、または例えば、薬理学的活性化合物、有毒化合物および汚染物質などであるがこれに限定されない小さな有機または無機の化合物である。
別の実施形態では、単離された膜貫通細孔複合体を使用したポリヌクレオチドまたは(ポリ)ペプチドを特徴付ける方法が説明されており、ここで、細孔複合体は、CsgG細孔またはその相同体もしくは突然変異体、および修飾CsgFペプチドまたはその相同体もしくは突然変異体を含む単離された複合体である。特に、前記CsgG細孔またはその相同体もしくは突然変異体は、CsgG細孔チャネルを形成する6~10個のCsgGモノマーを含む。
本発明のさらなる態様は、標的分析物の存在、不在、または一つ以上の特性を決定するための本発明の前述の態様による前記単離された細孔複合体または膜貫通細孔複合体の使用を開示している。さらに、本発明は、(a)前記単離された細孔複合体および(b)膜の構成要素を含む標的分析物を特徴付けるためのキットにも関連する。
図の説明
説明した図面は概略的であり、非限定的である。図面では、図示目的のために一部の要素のサイズが誇張され、尺度通りには描かれていない場合がある。
CsgG細孔の構造および複合体形成のためのCsgFとの界面。CsgGオリゴマー(例えば、九量体)(金色)の断面図(A)、側面図(B)および上面図(C)、表面(A)およびリボン(B、C)を表示)、単一のCsgGプロトマーは淡青色で着色(D)(CsgG X線構造PDBエントリー:4uv3に基づく)。CsgG収縮ループ(CLループ)は、配列番号3に従って残基46~61にわたり、すべてのパネルで濃灰色で示され、また(E)の左下にあるループに対応する。側鎖がCsgG βバレルの内腔に面するCsgG残基は、(E)および(D)に示すように灰色中間色であり、β鎖で標識されている。これらの残基は、天然または非天然のアミノ酸、例えば、細孔性ペプチド(例えば、修飾CsgFペプチドまたはその相同体を含む)のCsgG細孔またはモノマーへの付着(共有結合架橋)に使用できるものなど、置換に使用できる部位を表す。一部の実施形態では、架橋残基には、Cysおよび反応性アミノ酸、および光反応性アミノ酸、アジドホモアラニン、ホモプロパルギルグリシン、ホモアレルグリシン、p-アセチル-Phe、p-アジド-Phe、p-プロパルギルオキシ-Phe、およびp-ベンゾイル-Pheが含まれ(Wang et al. 2012、 Chin et al. 2002)、また配列番号3に従って、位置132、133、136、138、140、142、144、145、147、149、151、153、155、183、185、187、189、191、201、203、205、207または209に置換することができる。(E)CsgGモノマーのCLループおよび膜貫通型ベータ鎖の拡大図を示す。CsgG収縮ループ(濃青色で着色)は、CsgG細孔(パネルA)内のオリフィスまたは最も狭い通路を形成する。一部の実施形態では、配列番号3によるCLループ、56、55、および51の三つの位置は、CsgGチャネルオリフィスまたは「リーダーヘッド」の直径および化学的特性および物理的特性に特に重要である。これらは、CsgG細孔および相同体のナノ細孔感知特性を変化させるための好ましい位置を表す。 CsgG:CsgF複合体タンパク質の共発現および複合体精製。(A)CsgG(配列番号2+C末端ストレップIIタグ)およびCsgF(配列番号4+C末端6×Hisタグ)を共発現するE. coli培養から始まるCsgG:CsgF複合体の精製プロトコルの概略図を示す。このプロトコルには、再懸濁細胞を中断し、膜結合タンパク質の1% DDM抽出を行う工程が含まれる。CsgG:CsgF複合体および過剰なCsgFは、ニッケルIMACカラム上で親和性精製による第一の濃縮を受け、その後、ストレプトアビジンカラム上のCsgG:CsgF複合体の第二の親和性濃縮を受ける。(B)IMAC(左)およびストレプトアビジン(右)精製工程のCoommassie染色SDS-PAGE CsgGおよびCsgFに対応するタンパク質バンドが標識化されている。特に、IMAC溶出物は、CsgG結合型ストレップタグを使用して親和性プルダウンに保持されなかったN末端で切断CsgF断片(ラベル*)を含有し、CsgFのN末端がCsgGとの複合体形成に必要であることを示す。 in vitro再構成に伴うCsgG:CsgF複合体タンパク質精製。(A)CsgG(淡灰色)と、過剰CsgFで補足されたCsgG(濃灰色)のサイズ排除クロマトグラフィー(SEC)実施(BioRad Enrich 650 10/300カラムを使用)を重ね合わせたクロマトグラム。クロマトグラムは、CsgG実施のためのCsgG 9量体(a)およびCsgG 18量体(b)と、過剰な遊離CsgF(c)と、複合体にCsgFを組み込むためにより高めの水力動力学的半径(分子量)で溶出する9量体CsgG:CsgF複合体(d)および18量体CsgG:CsgF複合体(e)とに対応する溶出ピークを示す。(B)パネル(A)で標識化された代表的種のネイティブPAGE分析であって、CsgG 9量体とCsgG 18量体の複合体へのCsgFの組み込みによる高めの分子量へのシフトを確認する。これらの実験は、CsgG:CsgF複合体が、精製された構成要素から始めてin vitro再構成できることを実証している。(C)これまでに報告されているCsgG 9量体およびCsgG 18量体のリボン表現(Goyal et al. 2014(PDBエントリー4uv3))。CsgG 18量体は、CsgG 9量体の二量体で形成される。パネルAおよびパネルBに示されるSECおよびネイティブPAGE解析は、CsgG 18量体がCsgFと複合体形成しやすいことを実証する。 (図3-1と同じ) cryo-EMで決定されるCsgG:CsgF構造。(A)CsgG:CsgF複合体の低温電子顕微鏡写真であり、9量体および18量体のCsgG:CsgF複合体の存在を示し、9量体および18量体形態の数多くの単一粒子がそれぞれ実線の円および破線の円で強調表示されている。(B)側面から見たCsgG:CsgF 9量体複合体の二つの代表的クラス平均。クラス平均には、それぞれ6020~4159個の個別粒子が含まれる。クラス平均は、CsgFのオリゴマー複合体に対応するCsgG粒子の上部の追加的な密度の存在を明らかにする。CsgFオリゴマー内には、「ヘッド」領域と「ネック」領域、およびCsgG βバレルの内腔内に存在する領域の三つの明確な領域が見られ、CsgG CLループ(ラベルG)によって形成される収縮部の上部に積み重ねられた収縮部または狭い通路(ラベルF)を形成する。この後者のCsgF領域は、CsgF収縮ペプチド(FCP)と呼ばれる。 (図4-1と同じ) CsgG:CsgF複合体の三次元構造モデル。21個のクラス平均に割り当てられた20.000粒子から計算された、CsgG:CsgF 9量体複合体の3D cryoEM電子密度の断面図。右図は、cryoEM密度にドッキングされたCsgG 9量体のX線構造(PDBエントリー:4uv3)と重ね合わせたものを示す。CsgG、CsgF、およびCsgFのヘッド、ネックおよびFCPドメインに対応する領域が示されている。断面図は、CsgF FCP領域が、CsgG収縮ループ(ラベルG)の上およそ2 nmにCsgGチャネル内に追加的な収縮部(ラベルF)を形成することを示す。 cryo-EM構造に基づくCsgG:CsgF細孔複合体の概略図。(A)単一の収縮部(ラベル(1))を保持する、断面図のCsgGナノ細孔の概略図。CsgGベースのナノ細孔は、CsgG収縮ループ(配列番号3による残基46~61)によって作製された0.5~1.5 nmのオリフィスを含む3.5~4 nm幅のチャネルを形成する。CsgFと複合体を形成する時、第二の収縮部またはオリフィスは、CsgGチャネル(ラベル(2)/F)に導入され、チャネル出口はCsgFヘッドドメイン(図5参照)によって塞がれるようになる(図5参照)。修飾CsgFペプチドを使用する時、例えば、ネック領域およびヘッド領域を欠くCsgF収縮ペプチド(FCP)に対応するものを使用する時、パネル(B)でCsgG:CsgF cryo-EM密度の断面図と、パネル(C)で概略図で示されるように、CsgG:CsgF細孔複合体が二つの連続したチャネル収縮またはオリフィス((1)および(2))で形成される。修飾CsgFペプチドのネック領域およびヘッド領域を除去することで、チャネル出口の閉塞が緩和される。 (バイオ)ポリマー(A)または単一分子分析物(B)のナノ細孔感知用途のためのCsgG:CsgF細孔複合体の使用の概略図。ポリマー感知で使用される場合、修飾CsgFペプチドによって導入される第二のチャネル収縮部は、分析物との接触領域を増加させ、第二の相互作用部位およびリーダーヘッドを形成する。単一分子ナノ細孔感知で使用される場合、修飾CsgFペプチドによって導入される第二のチャネル収縮部は、第二の独立した分析物相互作用部位を作り出す。(C)連続したCsgG(1)およびCsgF(2)収縮部またはリーダーヘッドを通過し、それらと相互作用する小分子の理論的チャネルコンダクタンスプロファイルの概略図(六角形と三角形で示される)。 例示的なCsgF相同体の多重配列アライメント。整列された配列は成熟タンパク質として示されている(すなわち、それらのN末端シグナルペプチド(SP)を欠く)。ボックスで囲まれた配列は、一部の実施形態においてCsgF収縮ペプチド(FCP)に対応する配列保存のCsgF領域(35~100%の一対配列同一性の間を参照―図10を参照)を示す。多重配列アライメントに含まれるCsgF相同体は、Q88H88、A0A143HJA0、Q5E245、Q084E5、F0LZU2、A0A136HQR0、A0A0W1SRL3、B0UH01、Q6NAU5、G8PUY5、A0A0S2ETP7、E3I1Z1、F3Z094、A0A176T7M2、D2QPP8、N2IYT1、W7QHV5、D4ZLW2、D2QT92、A0A167UJA2である。E. coli CsgF(配列番号15)および示されたCsgF相同体のFCP領域は、配列番号18~36に対応する。 CsgG相互作用配列およびCsgF収縮ペプチド(FCP)を形成するE. coli CsgF領域の実験的評価。パネル(A)は、E. coli CsgG(配列番号2)と共発現された四つのN末端 CsgF断片(配列番号8のCsgF残基1~27、配列番号10、配列番号12および配列番号14)の成熟配列(すなわち、配列番号5の残基1~19に対応するCsgFシグナルペプチドを除去した後)、(配列番号8、配列番号1~27、配列番号12、配列番号14、配列番号12、および配列番号14)を示す。(B)CsgGおよびCsgF共発現実験の粗製細胞可溶化物のSDS-PAGE分析についての抗ストレップ(左)および抗His(右)ウエスタンブロット分析。抗ストレップ分析は、すべての共発現実験におけるCsgGの発現を示し、抗Hisウエスタンブロット分析は、切断突然変異体CsgF 1~64(配列番号14)に対してのみCsgF断片の検出可能レベルを示す。Hisタグ付きナノ本体(Nb)を陽性対照として使用した。(C)CsgG:CsgF共発現実験におけるCsgF断片の存在についての抗Hisドットブロット解析。上部の行は、細胞可溶化物全体を、中間および下部の行は、ストレップ親和性プルダウン実験の溶出物および貫流を示す。これらのデータは、CsgF断片1~64およびずっと小さな範囲CsgF 1~48が、ストレップタグ付きCsgGとの複合体として特異的にプルダウンされることを実証する。CsgF断片1~27および1~38は、対応するCsgF断片の検出可能レベルをもたらさず、CsgGとの複合体形成の兆候を示さない。 CsgG相互作用配列およびCsgF収縮ペプチド(FCP)を形成するCsgF領域の多重配列アライメント。図は、CsgG相互作用に対応する領域における、CsgFペプチドの多重配列アライメントおよびコンセンサス配列およびその既知の相同体を示す。CsgF相同体は、PFAMドメインPF03783によって定義される。これらのペプチドはCsgGに結合し、CsgG βバレルの内腔に局在化し、ここで、これらはCsgGチャネル内に追加的な収縮部を形成する。これらのペプチドおよびその相同体は、CsgF収縮ペプチドまたはFCPの例である。示されるFCPの一対配列同一性は、35~98%の範囲である。 (図10-1と同じ) (図10-1と同じ) CsgG:CsgF複合体の高解像度cryoEM構造。CsgGは淡灰色で示され、CsgFは濃灰色で示されている。A. CsgG:CsgF複合体の3.4Å解像度での最終電子密度マップ。側面図。B. CsgG:CsgFが9:9化学量論を含み、C9対称性を有することを示すcryoEM構造の上面図。C. CsgG:CsgF複合体の内部構造。GC、CsgG収縮部、FC、CsgF収縮部。D. CsgGタンパク質とCsgFタンパク質の間の相互作用。CsgGおよびCsgG収縮部はそれぞれ淡灰色および灰色で着色されている。CsgFは濃灰色で着色されている。CsgGおよびCsgFの残基は、それぞれ淡灰色および黒色でラベル付けされている。 CsgG:CsgF複合体の2つのリーダーヘッド。CsgGは淡灰色で示され、CsgG細孔のリーダーヘッドは濃灰色で示されている。CsgFは黒色に示され、CsgFのリーダーヘッドはラベル付けされている。 CsgF WTとのin vivoでのCsgGの共発現。アンピシリン抵抗性を有するpT7ベクター中のC末端ストレップタグ付きCsgGポリペプチドをコードする遺伝子と、カナマイシン抵抗性を有するpRhamベクター中のC末端タグCsgFポリペプチドをコードする遺伝子とが、アンピシリンおよびカナマイシンの両方の存在下でまとめてE. coli BL21DE3細胞に形質転換された。タンパク質を、18℃、250rpmで一晩発現させ、CsgG-CsgF複合体をストレップタグ精製を使用して精製した後、Hisタグ精製を行った。A.ストレップ精製前のタンパク質試料(複製)。B.His精製後のタンパク質試料(三つの溶出画分)。タンパク質を4~20%のトリスゲル上に流した。 CsgGおよびCsgFのin vitro共発現およびCsgG-CsgF複合体の熱安定性。異なるベクター中のCsgGおよびCsgF DNAが、in vitro転写および翻訳反応で共発現されている。タンパク質は、S-35メチオニンで放射能標識化され、X線フィルム上に露出されている。複合体の安定性は、反応混合物を異なる温度で10分間培養することによって評価される。 プロテアーゼ切断部位を用いたCsgG:CsgF複合体の作製。A. TEVまたはC3またはその他任意のプロテアーゼ切断部位は、要求される部位(例えば、配列番号6の30と31、35と36、40と41、45と46の間)でCsgFペプチドに導入されうる。CsgGは金色で、CsgFドメインは赤で表示されている。一つのCsgFサブユニット1~35は明瞭化のために緑色で着色されている。36~45は紫色で示されている。10個のヒスチジンタグがピンクで示され、CsgGのストレップタグが青色で示されている。B. 全長CsgG:CsgF複合体のプロテアーゼ切断のためのSDS-PAGE(4~20%TGX)であって、TEVプロテアーゼ切断部位が配列番号6の35~36の間に挿入されている。M:分子量マーカー、レーン1:CsgG:CsgF全長複合体のストレップ後精製、レーン2:ストレップ後濃縮、レーン3:ゲルろ過後、レーン4:TEVプロテアーゼで切断されCsgG:CsgF複合体を生成、レーン5:ストレップ精製後のCsgG:CsgFの貫流、レーン6:CsgG:CsgFを60°Cで10分間加熱。レーン7:ストレップカラムから溶出されたCsgG:CsgF複合体、レーン8:対照としてのCsgG細孔、レーン9:対照としてのTEVプロテアーゼ。 CsgG:CsgF複合体の熱安定性。M: 分子量マーカー、レーン1:CsgG細孔、レーン2:室温でのCsgG:CsgF複合体:レーン3~9:CsgG:CsgF試料を、異なる温度(それぞれ40、50、60、70、80、90、100℃)で10分間加熱した。レーン1:A. Y51A/F56Q/N55V/N91R/K94Q/R97W-del(V105-I107):CsgF-(1-45).B. Y51A/F56Q/N55V/N91R/K94Q/R97W-del(V105-I107):CsgF-(1-35).C. Y51A/F56Q/N55V/N91R/K94Q/R97W-del(V105-I107):CsgF-(1-30).試料を7.5%TGXゲル上でSDS-PAGEに供した。CsgF-(1-45)とCsgF-(1-35)の両方を有するCsgG:CsgF複合体は、レーン1のCsgG細孔バンドからのシフトを示す。従って、これらの複合体の両方は90℃まで熱安定性があることが明らかである。複合体および細孔は、100℃でCsgGモノマーまで分解する(レーン9)。同じ熱安定性パターンがCsgF-(1-30)を有するCsgG:CsgF複合体で見られるが、CsgG細孔(レーン1)とCsgG-CsgF複合体(レーン2-8)のタンパク質バンド間のシフトを確認するのは困難である。 合成CsgFペプチドを使用したin vitro。再構成を介したCsgG:CsgF形成。野生型CsgGまたは改変した収縮部Y51A/F56Q/K94Q/R97W/R192D-del(V105-l107)を有するCsgG突然変異体を使用したin vitro再構成を介したCsgG:CsgF形成を示すネイティブPAGE。成熟CsgF(配列番号6)の最初の34残基に対応するAlexa594標識化CsgFペプチドを、50 mM Tris、100 mM NaCl、1 mM EDTA、5 mM LDAO/C8D4中、2:1モル比で、精製されたストレップタグ付きCsgGまたはY51A/F56Q/K94Q/R97W/R192D-del(V105-l107)に室温で15分間にわたり加え、再構成させた。StrepTactinビーズに対してCsgG-strepをプルダウンした後、試料をネイティブPAGEで分析した。WTおよびY51A/F56Q/K94Q/R97W/R192D-del(V105-l107)CsgGの両方が、蛍光タグによって視覚化されたCsgF N末端ペプチドを結合する。 図18 CsgG:CsgFまたはCsgG:FCP複合体の安定化。A. SS結合を作製できるCsgG(配列番号3)およびCsgF(配列番号6)の対の特定されたアミノ酸位置。B. CsgG-Q153CとCsgF-G1Cの間のS-S結合を示す概略図。 CsgG:CsgF複合体のシステイン架橋。A. Y51A/F56Q/N91R/K94Q/R97W/Q153C-del(V105-I107)およびCsgF-G1Cタンパク質を別個に精製され、4℃で1時間または一晩培養して、複合体を形成し、S-S形成させた。S-S形成を促進するための酸化剤は加えられなかった。対照のCsgG細孔(Y51A/F56Q/N91R/K94Q/R97W/Q153C-DEL(V105-I107))および複合体(DTTを有するものと有しないもの)を、100℃で10分間加熱して、複合体をCsgGモノマー(CsgG、30KDa)とCsgFモノマー(CsgF、15KDa)とに分解した。CsgGおよびCsgF間の二量体(CsgG-CsgF、45Kda)は、S-S結合形成を確認する還元剤が存在しない場合に見られる。二量体形成の増加は、1時間培養に比べて一晩培養したものに見られる。B. 質量分析解析が、一晩培養したものからゲル精製された-CsgFバンド上で実施された。タンパク質をタンパク質分解的に切断してトリプシンペプチドを生成した。LC-MS/MS配列決定方法を実施し、示されたリンクペプチドに対応して、上記の前駆体イオンの特定がなされた。この前駆体イオンを断片化し、断片イオンを観察した。これらには、それぞれのペプチド用のイオンと、無傷のジスルフィド結合を組み込む断片とが含まれる。このデータは、CsgFのC1とCsgFのC153との間のジスルフィド結合の存在についての強力な証拠を提供する。 CsgG:CsgF複合体のシステイン架橋の効率の改善。レーン1:Y51A/F56Q/N91R/K94Q/R97W/N133C-del(V105-I107)およびCsgF-T4Cタンパク質は共発現され、CsgG:CsgF複合体が精製された。レーン2:複合体をDTTの存在下で加熱し、複合体を置換モノマー(CsgGおよびCsgF)に分解した。DTTは、形成された場合にCsgG-N133CとCsgF-T4Cの間の任意のS-S結合に分解される。レーン3:複合体を酸化剤銅オルソフェナントロリンと共にインキュベートし、S-S結合形成を促進する。レーン4:酸化した試料を、DTTの不在化で100℃に加熱して、複合体を分解した。CsgG-CsgFに対応する45Kdaの新しいバンドが現れ、S-S結合形成が確認される。 DNA鎖がCsgG:CsgF複合体を通過するときの電流シグネチャ。C末端ストレップタグを含むCsgG細孔(Y51A/F56Q/N91R/K94Q/R97W-del(V105-I107))を、C末端Hisタグおよび配列番号6の35と36の間のTEVプロテアーゼ切断部位を含む全長CsgFタンパク質と共発現させて、複合体を作製した。 次に、精製された複合体をTEVプロテアーゼによって切断して、所与のCsgG:CsgF複合体を作製した。TEV切断は、切断部位にENLYFQ配列を残すことに注目されたい。A. CsgFの17位置では突然変異はない。B. CsgFではN17S突然変異体。 DNA鎖がCsgG:CsgF複合体を通過するときの電流シグネチャ。複合体は、CsgF-(1~35)突然変異体を有するC末端ストレップタグを含むY51A/N55V/F56Q/N91R/K94Q/R97W-del(V105-I107)細孔を培養することによって作製された。A. CsgF-N17S-(1-35)。B. CsgF-N17V-(1-35)。 DNA鎖がCsgG:CsgF複合体を通過するときの電流シグネチャ。複合体は、CsgF-N17S-(1-35)を有するC末端ストレップタグを含む異なるCsgG細孔を培養することによって作製した。A. CsgG細孔はY51A/N55V/F56Q/N91R/K94Q/R97W-del(V105-I107)である。B. CsgG細孔は、Y51T/N55V/F56Q/N91R/K94Q/R97W-del(V105-I107)である。C. CsgG細孔はY51A/N55I/F56Q/N91R/K94Q/R97W-del(V105-I107)である。D. CsgG細孔は、Y51A/F56A/N91R/K94Q/R97W-del(V105-I107)である。E. CsgG細孔は、Y51A/F56I/N91R/K94Q/R97W-del(V105-I107)である。F. CsgG細孔は、Y51S/N55V/F56Q/N91R/K94Q/R97W-del(V105-I107)である。 (図23-1と同じ) DNA鎖がCsgG:CsgF複合体を通過するときの電流シグネチャ。複合体は、三つの異なる長さのCsgFを有するC末端を含むE. coli精製されたY51A/N55V/F56Q/N91R/K94Q/R97W-del(V105-I107)細孔を培養することにより作製された。A. CsgF-(1-29)、B. CsgF-(1-35)、C. CsgF-(1-45)。矢印は信号の範囲を示す。意外にも、CsgF-(1-29)を有する複合体は、最大範囲を有する信号を生成する。 DNA鎖がCsgG:CsgF複合体を通過するときの電流シグネチャの信号対雑音比。異なるCsgG:CsgF複合体は、同じCsgFペプチドCsgF-(1-35)を有する異なるCsgG細孔(1-Y51A/F56Q/N91R/K94Q/R97W-del(V105-I107)2-Y51A/N55I/F56Q/N91R/K94Q/R97W-del(V105-I107)3-Y51A/N55V/F56Q/N91R/K94Q/R97W-del(V105-I107)4-Y51A/F56A/N91R/K94Q/R97W-del(V105-I107)5-Y51A/F56I/N91R/K94Q/R97W-del(V105-I107)6-Y51A/F56V/N91R/K94Q/R97W-del(V105-I107)7-Y51S/N55A/F56Q/N91R/K94Q/R97W-del(V105-I107)8-Y51S/N55V/F56Q/N91R/K94Q/R97W-del(V105-I107)9-Y51T/N55V/F56Q/N91R/K94Q/R97W-del(V105-I107))を培養することにより作製された。DNA転座実験で異なる短くくねくねした線のパターンが観察され、その信号対雑音比が測定された。より高い精度は、より大きな信号対雑音比で得ることができる。 狭いリーダーヘッドでの配列決定エラー。CsgG細孔のリーダーヘッドとのDNA塩基相互作用の表現。約5個の塩基が、DNA鎖が細孔を通して転座する時に、任意の時点で電流信号を支配する。B. 信号のプロットのマッピング。カスタムHMMを使用してモデル化された信号にマップされた複数の読取値について、ホモポリマー実施を欠く混合配列について、および10 Tの三つのホモポリマー実施を含む配列についての事象検出シグナル。 CsgG:CsgF複合体のリーダーヘッドのマッピング。CsgG:CsgF複合体についてのリーダーヘッド差別プロット。各リードヘッド位置で塩基が変動する時のモデル化された電流の平均変動。長さnのアルファベットを有する長さkのモデルについての位置iでのリードヘッド差別を計算するために、リードヘッド位置iでの差別を、サイズnのそれぞれのnk-1群についての電流レベルの標準偏差の中央値として定義した。式中、位置iは変動し、一方でその他の位置は一定に保たれる。B. リーダーヘッドをマップする静止DNA鎖:一つの塩基がDNAバックボーン(Ispc3)から欠失している一組のpolyA DNA鎖(SS20~SS38)が作成された。各鎖において、ISpc3の位置は3’末端から5’末端に向かって移動する。CsgG細孔を用いた前回の実験に基づき、DNAの7番目の位置はCsgG収縮部内に位置することが期待される。このDNAに対応するSS26は強調表示されている。(A)からのモデルに基づき、4~5の塩基はCsgGおよびCsgGリーダーヘッドを分離することが期待される。従って、およそ位置12および13はCsgF収縮部内にあることが期待される。これらの位置に対応するSS31およびSS32のDNA鎖は強調表示されている。CおよびD。二つのリーダーヘッドのマッピング:各鎖の3’末端でのビオチン修飾が一価ストレプトアビジンと共に複合体化され、各鎖から生成される電流ブロックがMinIONセットアップ内に記録される。iSpc3位置が細孔内の収縮部の上または下に存在する場合、偏向は期待されない。ところが、iSpc3が収縮部内に位置する時、より高い電流レベルが細孔を通過することが期待される。これは、塩基の欠失によって生成される余分な空間がより多くのイオンを通過させるためである。従って、各DNA鎖について通過する電流をプロットすることによって、二つのリーダーヘッドの位置をマッピングすることができる。予想されるように、DNA鎖の位置7がiSpc3(C)によって占有されるとき、電流の最も大きな偏向が見られる。位置6および8でのiSpc3はまた、平均polyA電流レベル全体にわたって高めの偏向を生成する。従って、DNA鎖の6、7および8位置は、第一のリーダーヘッド(CsgGリーダーヘッド)を表す。予想されるとおり、12番目および13番目の位置はiCsp3によって占有され、ベースラインのpolyAからの別の逸脱が観察される(D)。これは、細孔の第二のリーダーヘッド(CsgFリーダーヘッド)を示す。結果はまた、二つのリーダーヘッドがおよそ4~5塩基分離れていることを確認する。 (図27-1と同じ) リーダーヘッド差別および塩基寄与。左側のパネルは、各突然変異体の細孔のリードヘッドの差別を示し、これは、各リードヘッド位置の塩基が変動するときのモデル化された電流の平均変動である。長さnのアルファベットを有する長さkのモデルについての位置iでのリードヘッド差別を計算するために、リードヘッド位置iでの差別を、サイズnのそれぞれのnk-1群についての電流レベルの標準偏差の中央値として定義した。式中、位置iは変動し、一方でその他の位置は一定に保たれる。右側のパネルは塩基寄与プロットを示す。リーダーヘッドの位置iに塩基b(A、T、GまたはC)を有するすべての配列文脈についての電流中央値。 ダブルリーダーヘッド細孔のエラープロファイル。A. CsgG:CsgF複合体および二つのリーダーヘッドを有するDNAの塩基の相互作用の概略図。赤色:強力な相互作用、オレンジ色:弱い相互作用、灰色:相互作用なし。B. 欠失におけるエラーの比較。Y51A/F56Q/N91R/K94Q/R97W/R192D-del(V105-I107)およびY51A/N55V/F56Q/N91R/K94Q/R97W-del(V105-I107)からの読取:CsgF-N17S-(1-35)細孔は、E. coli DNAの同一の領域から呼び出された塩基であった。読取は、Minimap2(https://arxiv.org/abs/1708.01492)を使用して基準ゲノムと整列され、結果的なアライメントがSavant Genome Browser(https://www.ncbi.nlm.nih.gov/pubmed/20562449)で視覚化された。Y51A/F56Q/N91R/K94Q/R97W/R192D-del(V105-I107)読取の大部分は、Tホモポリマー内に単一の塩基欠失(黒いボックス)を含み、これはCsgG:CsgF読取の大部分には存在しない。C. ホモポリマーの長さに対する、Y51A/F56Q/N91R/K94Q/R97W/R192D-del(V105-I107)(青色)およびY51A/N55V/F56Q/N91R/K94Q/R97W-del(V105-I107):CsgF-N17S-(1-35)細孔(緑色)から生成された粗製データからのコンセンサス精度の比較。 CsgG:CsgF複合体のホモポリマー呼び出し。(A)に示される配列を有するDNAは、Y51A/F56Q/N91R/K94Q/R97W/R192D-del(V105-I107)細孔(B)およびY51A/N55V/F56Q/N91R/K94Q/R97W-del(V105-I107):CsgF-N17S-(1-35)細孔(C)を通して転座され、それらの信号が(A)で赤色で示された第一のpolyTセクションについて分析された。ポリTセクションが単一のリーダーヘッドを含むCsgG細孔を通過する時(モデルはリーダーヘッド内に位置する5つの塩基に基づく)、信号内に平坦な線を生成する。従って、欠失エラーを引き起こすことの多いこの領域の塩基の正確な数を決定するのは困難である。DNAが二つのリーダーヘッドを含むCsgG:CsgF複合体を通過する時(モデルは、二つのリーダーヘッド内とその間に位置する9つの塩基に基づく)、ポリTセクションは平坦な線ではなく複数の段を示す。これらの段についての情報は、ホモポリマー領域内の塩基数を正確に特定するのに使用されうる。この追加情報は、欠失エラーを著しく減少させ、全体的なコンセンサス精度を改善する。 (図30-1と同じ) (図30-1と同じ) (図30-1と同じ) CsgG細孔の特徴付け(Y51A/F56Q/N91R/K94Q/R97W/-del(V105-I107)。A.CsgG細孔のリーダーヘッド差別。各リードヘッド位置で塩基が変動する時のモデル化された電流の平均変動。長さnのアルファベットを有する長さkのモデルについての位置iでのリードヘッド差別を計算するために、リードヘッド位置iでの差別を、サイズnのそれぞれのnk-1群についての電流レベルの標準偏差の中央値として定義した。式中、位置iは変動し、一方でその他の位置は一定に保たれる。B. CsgG細孔の塩基寄与プロット。リーダーヘッドの位置Iに塩基b(A、T、GまたはC)を有するすべてのk量体についての電流中央値。C. DNA鎖がCsgG細孔を通過するときの電流シグネチャ。
本発明は、特定の実施形態に関して説明され、特定の図面を参照しながら説明するが、本発明はそれに限定されず、特許請求の範囲によってのみ限定される。請求項の参照符号は、範囲を限定するものと解釈されないものとする。もちろん、当然のことながら、本発明の任意の特定の実施形態に従ってすべての態様または利点が必ずしも達成されるわけでないことが理解されるべきである。従って、当業者であれば、本明細書に教示または推奨されるように、本明細書に教示されるように、一つまたは複数の利点を達成または最適化する方法で本発明が具現化または実行されうることを認識するであろう。
本発明は、構成および作動方法の両方で、その特徴および利点と共に、以下の詳細な説明を添付図面と併せて読んだときに最も良好に理解されうる。本発明の態様および利点は、以下に記述される実施形態を参照しながら明らかとなり、かつそれによって解明される。本明細書全体を通して、「一実施形態」または「実施形態」に関する言及は、実施形態に関連して説明した特定の特徴、構造または特性が、本発明の少なくとも一つの実施形態に含まれることを意味する。従って、本明細書全体での様々な場所で「一実施形態での」または「実施形態での」という表現の出現は、必ずしも同じ実施形態に言及するとは限らないが、そのように言及している可能性もある。同様に、当然のことながら、本発明の例示的な実施形態の説明では、本発明の様々な特徴は、本開示を合理化し、さまざまな発明の態様のうちの一つ以上を理解を助ける目的で、単一の実施形態、図またはその記述にまとめられることがある。しかしながら、本開示のこの方法は、特許請求の範囲において、各請求項に明示的に記載されているよりも多くの特徴が必要とされる意図を反映するものとして解釈されるべきではない。むしろ、以下の特許請求の範囲が反映するように、発明の態様は、開示された上記の単一の実施形態のすべての特徴よりも少ない。
本明細書および添付の特許請求の範囲で使用される場合、単数形「a」、「an」、および「the」は、その内容が明確に別途指示されない限り、複数の指示対象を含む。従って、例えば、「ポリヌクレオチド」は2つ以上のポリヌクレオチドを含み、「ポリヌクレオチド結合タンパク質」は2つ以上のこのようなタンパク質を含み、「ヘリカーゼ」は2つ以上のヘリカーゼを含み、「モノマー」は2つ以上の「モノマー」を意味し、「細孔」は2つ以上の細孔および同種のものを含む。
本明細書のすべての考察において、アミノ酸の標準的な一文字コードが使用される。これらは、以下のとおりである:アラニン(A)、アルギニン(R)、アスパラギン(N)、アスパラギン酸(D)、システイン(C)、グルタミン酸(E)、グルタミン(Q)、グリシン(G)、ヒスチジン(H)、イソロイシン(I)、ロイシン(L)、リジン(K)、メチオニン(M)、フェニルアラニン(F)、プロリン(P)、セリン(S)、スレオニン(T)、トリプトファン(W)、チロシン(Y)およびバリン(V)。標準的な置換法も使用され、すなわち、Q42Rは位置42のQがRと置き換えられることを意味する。
特定の位置における異なるアミノ酸が/記号によって分離される段落では、/記号は「または」を意味する。例えば、Q87R/Kは、Q87RまたはQ87Kを意味する。
異なる位置が/記号で分離されている段落では、/記号は「および」を意味し、Y51/N55はY51およびN55であることを意味する。
本明細書に開示されるすべてのアミノ酸置換、欠失、および/または追加は、これと反対の記載がない限り、配列番号3に示される配列の変異体を含む突然変異体CsgGモノマーを意味する。
配列番号3に示される配列の変異体を含む突然変異体であるCsgGモノマーへの言及は、以下に開示されるさらなる配列番号に記載された配列の変異体を含む突然変異体CsgGモノマーを含む。配列番号3に示される配列の変異体を含む突然変異体CsgGモノマーを参照しながら本明細書に開示される置換物、欠失および/または追加に相当する配列の変異体を含むCsgGモノマーに対し、アミノ酸置換、欠失、および/または追加を行うことができる。
本明細書に引用されるすべての刊行物、特許および特許出願は、上記または下記かを問わず、参照によりその全体が本明細書に援用される。
定義
単数の名詞を言及する時に不定冠詞または定冠詞(例えば、「a」、または「an」、「the」)が使用される場合、これには、別途特に記載のない限りその名詞の複数が含まれる。「含む」という用語が本明細書および特許請求の範囲で使用される場合、その他の要素または工程は除外されない。さらに、明細書および特許請求の範囲における第一、第二、第三およびこれに類する用語は、類似した要素を区別するために使用され、また必ずしも逐次的または時間的順序を説明するために使用されるとは限らない。使用される用語は、適切な状況下で互換性があり、本明細書に記述した本発明の実施形態は、本明細書に記述または図示される他の配列で動作する能力があることが理解されるべきである。以下の用語または定義は、本発明の理解を助けるためにのみ提供される。本明細書に特に定義されない限り、本明細書で使用されるすべての用語は、本発明の当業者にとって同じ意味を有する。実施者は特に、当技術の定義および用語については、Sambrook et al.、Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Press, Plainsview, New York (2012)、 and Ausubel et al., Current Protocols in Molecular Biology (Supplement 114), John Wiley & Sons, New York (2016)を参照のこと。本明細書に提供される定義は、当業者によって理解されるものよりも狭い範囲を有すると解釈されるべきではない。
本明細書で使用される場合、「約」という用語は、開示された方法を実施するために適切な±20%または±10%、より好ましくは±5%の変化、より好ましくは±1%の変化、より好ましくは±0.1%の変化を包含するとともに本明細書で使用される。
本明細書で使用される場合、「ヌクレオチド配列」、「DNA配列」または「核酸分子」は、リボヌクレオチドまたはデオキシリボヌクレオチドのどちらかの、任意の長さのポリマー形態のヌクレオチドを指す。この用語は、分子の主要構造のみを指す。従って、この用語は、二本鎖DNA、および一本鎖DNA、およびRNAを含む。本明細書で使用される場合、「核酸」という用語は、各ヌクレオチド上の3’末端および5’末端がホスホジエステル結合によって結合される、単一鎖または二本鎖の共有結合型のヌクレオチド配列である。ポリヌクレオチドは、デオキシリボヌクレオチド塩基またはリボヌクレオチド塩基から構成されてもよい。核酸はin vitroで合成で製造されるか、または天然源から単離されうる。核酸は、修飾DNAまたはRNA、例えば、メチル化されたDNAまたはRNAなど、または、7-メチルグアニオシンによる5’キャッピング、切断およびポリアデニル化など3’プロセシング、およびスプライシングなどの翻訳後修飾を受けたRNAなどさらに含みうる。核酸は、例えばヘキシトール核酸(HNA)、シクロヘキセン核酸(CEna)、トレオース核酸(TNA)、グリセロール核酸(GNA)、ロック核酸(LNA)、およびペプチド核酸(PNA)などの合成核酸(XNA)も含みうる。「ポリヌクレオチド」として本明細書で言及される核酸のサイズは、一般的に二本鎖ポリヌクレオチドについては塩基対(bp)の数として表現され、または一本鎖ポリヌクレオチドの場合にはヌクレオチド(nt)の数として表現される。1000 bpまたは1000 ntは、1キロベース(kb)に等しい。長さが約40ヌクレオチド未満のポリヌクレオチドは典型的に「オリゴヌクレオチド」と呼ばれ、ポリメラーゼ連鎖反応法(PCR)などのDNAの操作で使用するためのプライマーを含みうる。
本明細書で使用される場合、「遺伝子」とは、遺伝子のプロモーター領域、ならびにコード配列の両方を含む。これは、ゲノム配列(可能性のあるイントロンを含む)のことである場合と、プロモーター配列に動作可能に連結された、重ね継ぎされたメッセンジャーに由来するcDNAのことである場合の両方がある。
「コード配列」はヌクレオチド配列であり、これは、適切な調節配列の制御下に配置されたときに、mRNAに転写および/またはポリペプチドに翻訳される。コード配列の境界は、5’末端の翻訳開始コドンおよび3’末端の翻訳停止コドンによって決定される。コード配列は、mRNA、cDNA、組み換えヌクレオチド配列、またはゲノムDNAを含みうるが、これらに限定されず、また、イントロンがある一定の状況下で存在してもよい。
本開示の文脈における「アミノ酸」という用語は、その最も広い意味で使用され、アミン(NH)およびカルボキシル(COOH)官能基を、各アミノ酸に特異的な側鎖(例えば、R基)と共に含有する有機化合物を含むことを意味する。一部の実施形態では、アミノ酸は、天然のL α-アミノ酸または残基を指す。天然アミノ酸について一般的に使用される1文字および3文字の略語が本明細書で使用される: A=Ala、C=Cys、D=Asp、E=Glu、F=Phe、G=Gly、H=His、I=Ile、K=Lys、L=Leu、M=Met、N=Asn、P=Pro、Q=Gln、R=Arg、S=Ser、T=Thr、V=Val、W=Trp、Y=Tyr(Lehninger, A. L., (1975) Biochemistry, 2d ed., pp. 71-92, Worth Publishers, New York)。「アミノ酸」という用語はさらに、D-アミノ酸、レトロ-インベルソアミノ酸ならびにアミノ酸類似体などの化学修飾アミノ酸、ノルロイシンなどの通常はタンパク質に組み込まれていない天然アミノ酸、ならびに当業界ではβ-アミノ酸などのアミノ酸に特徴的なものとして知られる特性を有する化学的に合成された化合物を含む。例えば、ペプチド化合物が天然のPheまたはProと同じ構造制限をもたらすことを可能にする、フェニルアラニンまたはプロリンの類似体または模倣体が、アミノ酸の定義に含まれる。このような類似体および模倣体は、本明細書では、それぞれのアミノ酸の「機能的等価物」と呼ばれる。アミノ酸の他の例は、Roberts and Vellaccio、The Peptides: Analysis, Synthesis, Biology, Gross and Meiehofer, eds., Vol. 5 p. 341, Academic Press, Inc., N.Y. 1983に記載があり、参照により本明細書に組み込まれる。
「タンパク質」、「ポリペプチド」、および「ペプチド」という用語は、本明細書でさらに互換性をもって使用され、アミノ酸残基のポリマーおよびアミノ酸残基の変異体および合成類似体を指す。従って、これらの用語は、一つ以上のアミノ酸残基が、合成非天然のアミノ酸(対応する天然のアミノ酸の化学的類似体など)、および天然のアミノ酸ポリマーである、アミノ酸ポリマーに適用される。ポリペプチドはまた、グリコシル化、タンパク質分解切断、脂質化、シグナルペプチド切断、プロペプチド切断、リン酸化等を含み得るが、これに限定されない、成熟修飾プロセスまたは翻訳後修飾プロセスを受けることができる。「組み換えポリペプチド」とは、組み換え型技術を使用して、例えば、組み換え型ポリヌクレオチドまたは合成ポリヌクレオチドの発現を介して、作製されたポリペプチドを意味する。キメラポリペプチドまたはその生物学的活性部分が組み換えによって生成される場合、それはまた、実質的に培養培地を含まないことが好ましく、例えば、培養培地はタンパク質調製物の体積の約20%未満、より好ましくは約10%未満、最も好ましくは約5%未満を占める。「単離された」とは、自然状態で正常に付随する構成要素を実質的にまたは本質的に含まない材料を意味する。例えば、本明細書で使用される場合、「単離ポリペプチド」は、自然発生的な状態でそれに隣接する分子から精製されたポリペプチド、例えば、前記ポリペプチドに隣接する産生宿主内に存在する分子から除去されたタンパク質複合体またはCsgFペプチドなどを指す。単離されたCsgFペプチド(任意選択的に切断CsgFペプチド)は、アミノ酸化学合成により生成することも、組み換え型生成によって生成することもできる。単離された複合体は、複合体(例えば、CsgG細孔およびCsgFペプチド)の成分の精製後にin vitro再構成によって生成することもでき、また組み換え型共発現によって生成することもできる。
「オルソログ」および「パラログ」は、遺伝子の祖先関係を説明するために使用される進化的概念を包含する。パラログは、祖先遺伝子の複製を起源とする同じ種内の遺伝子であり、オルソログは種分化によって起源となった異なる生物体由来の遺伝子であり、共通の祖先遺伝子にも由来する。
タンパク質の「相同体」、「相同体(複数)」は、問題の未修飾または野生型のタンパク質に対してアミノ酸置換、欠失および/または挿入を有し、かつそれらが由来する未修飾タンパク質と類似した生物学的活性および機能的活性を有する、ペプチド、オリゴペプチド、ポリペプチド、タンパク質および酵素を包含する。本明細書で使用される場合、「アミノ酸同一性」という用語は、配列がある比較枠にわたってアミノ酸ごとに同一である程度を指す。従って、「配列同一性の割合」は、二つの最適に並べられた配列を比較枠にわたり比較し、同一のアミノ酸残基(例えば、Ala、Pro、Ser、Thr、Gly、Val、Leu、Ile、Phe、Tyr、Trp、Lys、Arg、His、Asp、Glu、Asn、Gln、CysおよびMet)が両方の配列内で発生する位置の数を決定して、一致する位置の数を求め、比較枠内の位置の総数(すなわち、枠サイズ)で割って、結果に100を掛けて配列の同一性の割合を求めることによって計算される。
「CsgG細孔」という用語は、複数のCsgGモノマーを含む細孔を定義する。各々のCsgGモノマーは、E. coli(配列番号3)からの野生型モノマー、E. coli CsgGの野生型相同体であってもよく、例えば、配列番号68~88に示されるアミノ酸配列のいずれか一つ、またはその任意の変異体(例えば、配列番号3および68~88のいずれか一つの変異体)を有するモノマーなどがある。変異体CsgGモノマーはまた、修飾CsgGモノマーまたは突然変異体CsgGモノマーと呼ばれうる。変異体における修飾または突然変異には、本明細書に開示される修飾のうちのいずれか一つ以上、または前記修飾の組み合わせが含まれるがこれらに限定されない。
本発明のすべての態様および実施形態について、CsgG相同体は、配列番号3に示す野生型E. coli CsgGに対して少なくとも50%、60%、70%、80%、90%、95%または99%の完全な配列同一性を持つポリペプチドを意味する。CsgG相同体はまた、CsgG様タンパク質の特性であるPFAMドメインPF03783を含むポリペプチドも意味する。現在知られているCsgG相同体およびCsgG構造の一覧については、http://pfam.xfam.org//family/PF03783に記載がある。同様に、CsgG相同ポリヌクレオチドは、配列番号1に示す野生型E. coli CsgGに対して少なくとも50%、60%、70%、80%、90%、95%または99%の完全な配列同一性を有するポリヌクレオチドを含むことができる。配列番号3に示すCsgGの相同体の例は、配列番号68~88に示す配列を有する。
「修飾CsgFペプチド」または「CsgFペプチド」という用語は、そのC末端(例えば、N末端断片)から切断されたCsgFペプチド、および/または切断部位を含むように修飾されたCsgFペプチドを定義する。CsgFペプチドは、野生型E. coli CsgF(配列番号5または配列番号6)の断片、またはE. coli CsgFの野生型相同体の断片であってもよく、例えば、CsgF(例えば、配列番号17~36に示されるアミノ酸配列のいずれか一つを含むペプチド)、またはそれらの任意の変異体(例えば、切断部位を含むように修飾されたもの)などがある。
本発明のすべての態様および実施形態について、CsgF相同体は、配列番号6に示す野生型E. coli CsgFに対して少なくとも50%、60%、70%、80%、90%、95%または99%の完全な配列同一性を持つポリペプチドを意味する。一部の実施形態では、CsgF相同体はまた、CsgF様タンパク質の特性であるPFAMドメインPF10614を含むポリペプチドを意味する。現在知られているCsgF相同体およびCsgF構造の一覧については、http://pfam.xfam.org//family/PF10614に記載がある。同様に、CsgF相同ポリヌクレオチドは、配列番号4に示す野生型E. coli CsgFに対して少なくとも50%、60%、70%、80%、90%、95%または99%の完全な配列同一性を有するポリヌクレオチドを含むことができる。配列番号6に示すCsgGの相同体の切断された領域の例は、配列番号17~36に示す配列を有する。
「CsgF成熟ペプチドのN末端部分」という用語は、CsgF成熟ペプチドのN末端から始まる最初の60、50、または40個のアミノ酸残基(シグナル配列は含まない)に対応するアミノ酸配列を有するペプチドを指す。CsgF成熟ペプチドは、野生型または突然変異体(例えば、一つ以上の突然変異体を有する)でもよい。
配列同一性は、全長ポリヌクレオチドまたはポリペプチドの断片または部分に対するものでもありうる。従って、配列は、全長基準配列と全体的な配列同一性が50%しかない場合でも、特定の領域、ドメインまたはサブユニットの配列は、基準配列と80%、90%、または99%の配列同一性を共有することがある。それぞれCsgG相同体については配列番号1、またはCsgF相同体ついては配列番号4の核酸配列に対する相同性は、単純に配列同一性に限定されるものではない。多くの核酸配列は、明らかに低い配列同一性しか持たないにも関わらず、相互に生物学的に有意な相同性を示すことがある。相同核酸配列は、低い厳密性の条件下で相互に雑種形成するものと考えられる(M.R. Green、J. Sambrook、2012、Molecular Cloning:A Laboratory Manual、Four Edition、Books 1-3、Cold Spring Harbor Laboratory Press、Cold Spring Harbor、NY)。
「野生型」という用語は、天然の発生源から単離された遺伝子または遺伝子産物を指す。野生型遺伝子は、集団で最も頻繁に観察されるものであり、従って任意にデザインされた遺伝子の「標準」または「野生型」の形態である。対照的に、「修飾された」、「突然変異体」または「変異体」という用語は、野生型遺伝子または遺伝子産物と比較した場合に、配列の修飾(例えば、置換、切断、または挿入)、翻訳後修飾および/または機能的特性(例えば、変更された特徴)を示す遺伝子または遺伝子産物を指す。天然の突然変異体は単離されることができ、これらは、野生型の遺伝子または遺伝子産物と比較したときに、特性が変化したという事実によって識別されることが注目に値する。天然のアミノ酸を導入または置換するための方法は、当技術分野で周知である。例えば、メチオニン(M)は、突然変異体モノマーをコードするポリヌクレオチドの関連する位置で、メチオニンのコドン(ATG)をアルギニンのコドン(CGT)で置換することによって、アルギニン(R)で置換されうる。非天然のアミノ酸を導入または置換するための方法も、当技術分野で周知である。例えば、非天然のアミノ酸は、突然変異体モノマーを発現するために使用されるIVTTシステムに合成アミノアシル-TrNAを含めることによって導入されうる。別の方法として、非天然のアミノ酸は、それらの特定のアミノ酸の合成(すなわち、非天然型)類似体の存在下で、特定のアミノ酸に対する栄養要求性であるE. coli内に突然変異体モノマーを発現することによって導入されてもよい。突然変異体モノマーが部分的なペプチド合成を用いて生成される場合、それらは裸のライゲーションによって生成されうる。同類置換は、アミノ酸を、類似の化学構造、類似の化学的特性、または類似の側鎖体積を持つ他のアミノ酸で置換する。導入されたアミノ酸は、置換するアミノ酸に類似した極性、親水性、疎水性、塩基性、酸性、中和性または電荷を有しうる。あるいは、同類置換は、既存の芳香族アミノ酸または脂肪族アミノ酸の場所に、芳香族または脂肪族である別のアミノ酸を導入してもよい。保存アミノ酸の変化は当技術分野で周知であり、以下の表1に定義される20個の主要アミノ酸の特性に従って選択されうる。アミノ酸が類似の極性を持つ場合、これは表2のアミノ酸側鎖についてのヒドロパシースケールを参照することによっても決定されうる。
Figure 0007282697000001
Figure 0007282697000002
突然変異体または修飾タンパク質、モノマーまたはペプチドは、任意の方法で、また任意の部位で化学修飾されてもよい。突然変異体または修飾モノマーまたはペプチドは、一つ以上のシステインへの分子の付着(システイン連鎖)、一つ以上のリジンへの分子の付着、一つ以上の非天然アミノ酸への分子の付着、エピトープの酵素修飾、または末端修飾によって、化学修飾されることが好ましい。こうした修飾を実施するための適切な方法は、当技術分野で周知である。修飾タンパク質、モノマーまたはペプチドの突然変異体は、任意の分子の付着によって化学修飾されてもよい。例えば、修飾タンパク質、モノマーまたはペプチドの突然変異体は、染料または発蛍色素分子の付着によって化学修飾されうる。一部の実施形態では、突然変異体または修飾モノマーまたはペプチドは、モノマーまたはペプチドを含む細孔と標的ヌクレオチドまたは標的ポリヌクレオチド配列との間での相互作用を促進する分子アダプターによって化学修飾される。分子アダプターは、環状分子、シクロデキストリン、雑種形成能力のある種、DNA結合剤またはインターキレーター、ペプチドまたはペプチド類似体、合成ポリマー、芳香族平面分子、正電荷を持つ分子、またはまたは水素結合の能力を持つ小分子であることが好ましい。
アダプターの存在は、細孔およびヌクレオチド配列またはポリヌクレオチド配列のホストゲスト化学を改善し、それによって突然変異体モノマーから形成される細孔の配列決定能力を改善する。ホストゲスト化学の原理は当技術分野で周知である。アダプターは、ヌクレオチドまたはポリヌクレオチド配列とのその相互作用を改善する細孔の物理的または化学的特性に対する効果を持つ。アダプターは、細孔のバレルまたはチャネルの電荷を変化させるか、またはヌクレオチド配列またはポリヌクレオチド配列と特異的に相互作用するか、またはそれに結合して、それによって細孔とのその相互作用を促進しうる。従って、本開示において提供される修飾CsgFペプチドは、前記タンパク質または酵素の細孔に対して十分に近接する酵素またはタンパク質に結合されてもよく、これは修飾CsgFペプチドを含む細孔複合体の特定の用途を促進しうる。
この文脈では、タンパク質はまた、例えば、組み換えDNA技術によって作製される融合タンパク質(特に遺伝子融合と呼ばれる)であってもよい。タンパク質はまた、共役結合されてもよく、または「共役結合」してもよく、これは本明細書で使用される場合、安定した共有結合をもたらす化学的および/または酵素的な共役結合を意味する。
タンパク質は、いくつかのポリペプチドまたはタンパク質モノマーが相互に結合または相互作用する時、タンパク質複合体を形成しうる。「結合」は、直接的または間接的を問わず何らかの相互作用を指す。直接的な相互作用とは、結合相手間の接触、例えば共有結合または結合による接触を意味する。間接的相互作用とは、相互作用相手が二つ以上の化合物の複合体内で相互作用する任意の相互作用を意味する。相互作用は、一つ以上の架橋分子の支援によって完全に間接的でもよく、または相手間で依然として直接接触がある部分的に間接的なものでもよく、この場合、一つ以上の化合物の追加的な相互作用によって安定化される。本開示で言及される「複合体」は、異なる機能を有しうる、二つ以上の関連性のあるタンパク質の群として定義される。タンパク質複合体の異なるポリペプチド間の関連性は、疎水性またはイオン力などの非共有相互作用を介してもよく、またはジスルフィド架橋またはペプチド結合などの共有結合または結合を介するものでもよい。共有「結合(binding)」または「結合(coupling)」は本明細書では互換的に使用され、それぞれシステイン間または(光)反応性アミノ酸間での生体共役を意味し、安定した複合体を形成する化学的共有結合である、「システイン結合」または「反応性または光反応性アミノ酸結合」が関与してもよい。光反応性アミノ酸の例には、アジドホモアラニン、ホモプロパルギルグリシン、ホモアレルグリシン、p-アセチルPhe、p-アジド-Phe、p-プロパルギルオキシ-Phe、およびp-ベンゾイル-Pheが含まれる(Wang et al2012、in Protein Engineering、DOI: 10.5772/28719、 Chin et al. 2002、Proc. Nat. Acad. Sci. USA 99(17)、 11020-24)。
「生物学的細孔」は、膜の一方の側から他方の側への分子およびイオンの転位を可能にするチャネルまたは穴を画定する膜貫通型タンパク質構造である。細孔を通ったイオン種の転位は、細孔の両側に適用される電位差によって駆動されうる。「ナノ細孔」は、分子またはイオンが通過するチャネルの最小直径がナノメートル(10-9メートル)である生物学的細孔である。一部の実施形態では、生物学的細孔は膜貫通型タンパク質細孔でありうる。生物学的細孔の膜貫通型タンパク質構造は、本質的にモノマーまたはオリゴマーであってもよい。一般に、細孔は、中心軸の周りに配置された複数のポリペプチドサブユニットを含み、それによってナノ細孔が存在する膜に対して実質的に垂直に延びるタンパク質で裏打ちされたチャネルを形成する。ポリペプチドサブユニットの数は限定されない。一般に、サブユニット数は5から最大30であり、サブユニットの数は6~10であることが適切である。別の方法として、サブユニットの数は、ペルフリンゴリシンまたは関連する大きな膜孔の場合には定義されない。タンパク質で裏打ちされたチャネルを形成するナノ細孔内のタンパク質サブユニットの部分は一般に、一つ以上の貫通膜型βバレルおよび/またはα-らせんセクションを含みうる二次構造モチーフを含む。
本明細書で互換的に使用される「細孔」、「細孔複合体」、または「複合体細孔」という用語は、オリゴマー細孔のことであり、例えば、少なくとも一つのCsgGモノマー(例えば、二つ以上のCsgGモノマー、三つ以上のCsgGモノマーなど、一つ以上のCsgGモノマー)またはCsgG細孔(CsgGモノマーを含む)、およびCsgFペプチド(例えば、修飾または切断CsgFペプチド)が複合体で関連付けられ、共に細孔またはナノ細孔を形成する。本開示の細孔複合体は、生物学的細孔の特徴を持つ、すなわち、典型的な膜貫通型タンパク質構造を持つ。細孔複合体が膜構成要素、膜、細胞、または絶縁層を持つ環境で提供される時、細孔複合体は膜または絶縁層に挿入され、「膜貫通細孔複合体」を形成する。
本開示の細孔複合体または膜貫通細孔複合体は、分析物の特徴付けに適している。一部の実施形態では、記載されている細孔複合体または膜貫通型複合体は、例えば、異なるヌクレオチド間を高い感度で差別化できるため、ポリヌクレオチド配列の配列決定に使用することができる。本開示の細孔複合体は、実質的に単離されたか、精製されたかまたは実質的に精製された、単離された細孔複合体としうる。本開示の細孔複合体は、通常はその天然の状態に関連付けられる脂質またはその他の細孔、またはその他のタンパク質(例えば、CsgE、CsgA、CsgB)などその他の化合物が全く含まれていない場合に、または膜の区画から十分に濃縮されている場合に、「単離」または精製されている。細孔複合体は、その意図された使用に干渉しない担体または希釈剤と混合される場合、実質的に単離される。例えば、細孔複合体は、10%未満、5%未満、2%未満、または1%未満のその他の構成要素(トリブロック共重合体、脂質、またはその他の細孔など)を含む形態で存在する場合に、実質的に単離または実質的に精製されている。別の方法として、本開示の細孔複合体は、膜内に存在するときに膜貫通細孔複合体でありうる。本開示は、同一の突然変異体モノマーを含むCsgGから誘導されたホモオリゴマー細孔を含む単離された細孔複合体を提供し、これはその相同体としてのCsgGモノマーの突然変異形態も含みうる。別の方法として、ヘテロオリゴマーCsgG細孔を含む単離された細孔複合体が提供されており、これは突然変異体および野生型CsgGモノマーから成る、または異なる形態のCsgG変異体、突然変異体、または相同体から成るCsgG細孔でもよい。単離された細孔複合体は、典型的に少なくとも7個、少なくとも8個、少なくとも9個、または少なくとも10個のCsgGモノマーを含み、また2個、3個、4個、5個、6個、7個、8個、9個、10個のCsgFペプチドなど、一つ以上の(修飾)CsgFペプチドを含む。細孔複合体は、任意のCsGモノマー:CsgFペプチド比を含みうる。一実施形態では、CsGモノマー:CsgFペプチド比は1:1である。
本明細書で互換的に使用される「収縮部」、「オリフィス」、「収縮領域」、「チャネル収縮」、または「収縮部位」は、イオンおよび標的分子(例えば、ポリヌクレオチドまたは個別ヌクレオチドを含むがこれらに限定されない)の通過を許容するが、細孔複合体チャネルを通した他の非標的分子の通過を許容しない、細孔または細孔複合体の内腔表面によって画定される開口部を意味する。一部の実施形態では、収縮部は、細孔または細孔複合体内の最も狭い開口部である。この実施形態では、収縮部は、細孔を通る分子の通過を制限するように機能しうる。収縮部のサイズは典型的には、核酸配列決定用途でのナノ細孔の適合性を決定する主要要因である。収縮部が小さすぎる場合、配列決定される分子は通過できない。しかし、チャネルを通るイオン流に対する最大効果を達成するために、収縮部は大きすぎるべきではない。例えば、収縮部は、標的分析物の溶剤にアクセス可能な横断直径よりも広くてはならない。理想的には、任意の収縮部は、分析物を通過する分析物の横断直径にできるだけ近づけるべきである。核酸および核酸塩基の配列決定について、適切な収縮部直径はナノメートルの範囲(10-9メートル範囲)内である。適切には、直径は0.5~2.0 nmの領域であるべきであり、典型的には、直径は0.7~1.2 nmの領域である。野生型E. coli CsgGの収縮部は、約9Å(0.9 nm)の直径を有する。CsgG様の細孔および修飾CsgFペプチドまたはその相同体もしくは突然変異体を含む細孔複合体内で形成されたCsgF収縮部は、0.5~2 nmの範囲または0.7~1.2 nmの範囲の直径を持ち、従って核酸配列決定に適している。
二つ以上の収縮部が存在し、かつ各収縮部が間隔を置いている時、それぞれの収縮部は、同時に核酸鎖内の個別のヌクレオチドと相互作用するか、または「読み取る」場合がある。この状況では、チャネルを通るイオン流の低減は、ヌクレオチドを含むすべての収縮部の流れの制限が組み合わされた結果である。従って、一部の実例では、二重の収縮部は複合電流信号をもたらしうる。一定の状況では、一つの収縮部、または「リーディングヘッド」についての電流読み出しは、二つのこうしたリーディングヘッドが存在する時には個別に決定できない場合がある。野生型E. coli CsgG(配列番号3)の収縮部は、隣接するタンパク質モノマー内の位置51(Tyr51)における一連のチロシン残基の並置によって形成される、またそれぞれ位置56および55におけるフェニルアラニン残基およびアスパラギン残基(Phe 56およびAsn 55)からも形成される二つの環状リングを含む(図1)。CsgGの野生型細孔構造は、ほとんどの場合、CsgG収縮部(本明細書で「CsgG チャネル収縮部」として言及)を構成する二つの環状リングの幅を広げる、変更する、または除去するといった組み換え遺伝子技術を介して再操作されて、単一の明確なリーディングヘッドを残す。CsgGオリゴマー細孔内の収縮部モチーフは、配列番号3で示す、野生型モノマーE. coli CsgGポリペプチド内の位置38~63のアミノ酸残基に位置する。 この領域を考慮すると、任意のアミノ酸残基位置50~53、54~56、および58~59での突然変異体と、野生型CsgG構造のチャネル内でのTyr51、Asn55、およびPhe56の側鎖の位置付けの重要さとが、リーディングヘッドの特性を修正または変更するために有利であることが示された。CsgG細孔および修飾CsgFペプチドまたはその相同体もしくは突然変異体を含む細孔複合体に関する本開示は、意外にも、CsgG含有細孔複合体に対して別の収縮部(本明細書では「CsgFチャネル収縮部」として言及)を追加し、修飾CsgFペプチドによる複合体形成を介して、細孔内に適切な追加的な第二のリーダーヘッドを形成する。前記追加的なCsgFチャネル収縮部またはリーダーヘッドは、CsgG細孔の収縮ループ、または突然変異したGcsG細孔の収縮ループに隣接して位置付けられる。前記追加的なCsgFチャネル収縮部またはリーダーヘッドは、CsgG細孔の締付ループから、または突然変異したGcsG細孔の収縮ループから、5 nm以下など、1、2、3、4、5、6、7、8、9 nmなど、約10 nm以下の位置に位置付けられる。本開示の細孔複合体または膜貫通細孔複合体は、二つのリーダーヘッドを備えた細孔複合体を含み、すなわち、こうした方法で位置付けられたチャネル収縮部は、他の収縮部チャネルリーダーヘッドの精度に干渉することなく、適切な別個のリーダーヘッドを提供する。従って、前記細孔複合体は、CsgG突然変異体細孔(組み込まれた参考文献WO2016/034591、WO2017/149316、WO2017/149317、WO2017/149318、国際特許出願第PCT/GB2018/051191号を参照、それぞれ細孔の特性を改善する野生型CsgG細孔に対する突然変異体が列挙されている)と、野生型CsgG細孔またはその相同体を、修飾CsgFペプチドまたはその相同体もしくは突然変異体と共に含んでもよく、前記CsgFペプチドはリーダーヘッドを形成する別の収縮チャネルを有する。
細孔
本発明は、意外にも細孔複合体内に追加的なチャネル収縮部またはリーダーヘッドを導入する、細胞外に位置するCsgFペプチドと複合体を形成するCsgG細孔に関する。さらに、本開示は、細孔複合体内でCsgFペプチドによって作製される収縮部の位置情報を提供し、ペプチドはCsgG細孔の内腔に挿入され、収縮部位はCsgFタンパク質のN末端部分内にある。さらに、本開示の修飾または切断CsgFペプチドは、細孔複合体形成に十分であることが示されたと共に、バイオセンシング用途のための手段および方法を提供する。本開示は、野生型および突然変異体のCsgG細孔(例えば、WO2016/034591、WO2017/149316、WO2017/149317、WO2017/149318および国際特許出願公開第PCT/GB2018/051191号で開示)またはその相同体もしくは突然変異体であって、修飾または切断されたCsgFペプチドおよびその突然変異体または相同体と組み合わせて、まとめて、CsgG様の細孔複合体が分析物(ポリヌクレオチドなど)と相互作用する能力を改善するものを含む。(修飾または切断された)CsgFペプチドを用いた複合体形成によってCsgG様ナノ細孔チャネル内に導入された追加的な収縮部は、通過する分析物との接触面を拡張し、分析物検出および特徴付けのための第二のリーダーヘッドの役目をすることができる。CsgFの新規突然変異体または修飾型と組み合わされた突然変異体CsgGモノマーを含む細孔は、ポリヌクレオチドなどの分析物の特徴付けを改善することができ、ポリヌクレオチドが孔を通して移動するときに観察された電流間でのより差別化された直接的な関係を提供する。特に、明確な距離で間隙をおいて積み重ねられた二つのリーダーヘッドを持つことで、CsgG:CsgF細孔複合体は、少なくとも一つのホモポリマー的な区間(例えば、単一のCsgGリーダーヘッドの相互作用の長さを超過する、同じヌクレオチドのいくつかの連続的コピー)を含むポリヌクレオチドの特徴付けを促進しうる。さらに、定義された距離で二つの積み重ねられた収縮部を有することにより、CsgG:CsgF複合体細孔を通過する有機または無機の薬剤および汚染物質を含む小分子分析物は、二つの独立したリーダーヘッドを連続的に通過する。どちらのリーダーヘッドの化学的性質も独立して修飾することができ、それぞれに分析物と一意的な相互作用特性が与えられ、そのため分析物検出中に追加的な差別力を提供する。
第一の態様では、本発明は、CsgG細孔またはその相同体もしくは突然変異体、またはCsgG様の細孔、および修飾CsgFペプチドまたはその相同体もしくは突然変異体を含む、単離された細孔複合体に関する。実際に、本開示は、修飾CsgFペプチド(その切断されたもの、突然変異体および/または変異体でありうる)を含む、修飾CsgG生物学的細孔に関する。一実施形態では、前記修飾CsgFペプチドまたはその相同体もしくは突然変異体の間の相互作用領域は、CsgG細孔またはその相同体もしくは突然変異体の内腔に位置する。別の実施形態では、細孔複合体は、CsgG細孔の少なくとも一つの収縮部によって提供され、また少なくとも一つがCsgFペプチドによって導入され、CsgG細孔と共に複合体を形成する、二つ以上の収縮部位またはリーダーヘッドを有する。配列番号5のアミノ酸残基39~64の範囲、あるいはより具体的には配列番号5のアミノ酸残基49~64の範囲内の位置を含めたN末端CsgG位置が、検出可能な量の安定したCsgG:CsgG複合体を可能にするように示されている。一実施形態では、修飾CsgFペプチド(例えば、本明細書に記述したもの)によって生成されるCsgF収縮部は、細孔複合体のCsgG細孔の第一の収縮部に隣接するか、または接近する。CsgGまたはCsgG様タンパク質細孔の場合、収縮部位は、ベータ鎖のループ領域によって形成されるように決定されている(図1参照)。
一実施形態では、修飾CsgFペプチドは、前記修飾が特に、収縮領域を含み、かつCsgGモノマーまたはその相同体もしくは突然変異体を結合する制約によって画定されるN末端CsgFペプチド断片を含む、切断CsgFタンパク質または断片を意味する、ペプチドである。前記修飾CsgFペプチドはさらに、細孔複合体の特定の特性を促進しうる突然変異または相同配列を含んでもよい。特定の実施形態では、修飾CsgFペプチドは、野生型前タンパク質(配列番号5)または成熟タンパク質(配列番号6)配列またはその相同体と比較して、CsgFタンパク質切断を含む。これらの修飾ペプチドは、CsgGおよび修飾または切断されたCsgFペプチドによって形成されるCsgG様細孔内に、追加的な収縮部位またはリーダーヘッドを導入する細孔複合体の構成要素として機能することが意図されている。切断された修飾ペプチドの例を以下に記載する。
修飾CsgFペプチドの相同体の例は、例えば、実施例3で決定され、異なる細菌株に相同または類似の収縮部領域を含むCsgF様のタンパク質またはCsgFペプチドを明らかにし、これは類似の細孔複合体の使用において有用でありうる。CsgFペプチドが異なる野生型または突然変異体CsgG細孔と組み合わせて使用できるように、様々なCsgF相同体に由来するCsgFペプチド中の構造的特性およびCsgG-結合要素が保存される。これには、CsgG細孔の非同族CsgFとの複合体が含まれ、CsgG細孔およびCsgFが由来する親CsgG相同体は、同じオペロン、細菌種または株から生じる必要がないことを意味する。
代替的な実施形態では、細孔複合体内のCsgG細孔は野生型の細孔ではないが、細孔特性も同様に増加させるための突然変異または修飾を含む。CsgG細孔またはその相同体、および修飾CsgFペプチドまたはその相同体によって形成される、本開示の単離された細孔複合体は、CsgG細孔の野生型形態によって形成されうるか、または特定のアミノ酸残基の有向の突然変異誘発によるなど、CsgG細孔内でのさらなる修飾がなされて、細孔複合体内で使用するためのCsgG細孔の望ましい特性がさらに改善される。例えば、本発明の実施形態では、突然変異はチャネル内の収縮部の数、サイズ、形状、配置または配向を変更することが意図されている。修飾突然変異体CsgG細孔を含む細孔複合体は、ポリペプチド配列内の特定の標的アミノ酸残基の挿入、置換、および/または欠失をもたらす公知の遺伝子工学技術によって準備されてもよい。オリゴマーCsgG細孔の場合、突然変異は各モノマーのポリペプチドサブユニット内、またはモノマーのうちのいずれか一つまたはすべてのモノマー内で作製されうる。本発明の一実施形態では、説明した突然変異は、オリゴマータンパク質構造内のすべてのモノマーポリペプチドに対して作製されるのが適切である。突然変異体CsgGモノマーは、配列が野生型CsgGモノマーの配列から変異し、かつ細孔を形成する能力を維持するモノマーである。細孔を形成するための突然変異体モノマーの能力を確認する方法は、当技術分野で周知である。本開示は、野生型および突然変異体のCsgG細孔(例えば、WO2016/034591、WO2017/149316、WO2017/149317、WO2017/149318および国際特許出願公開第PCT/GB2018/051191号で開示)またはその相同体であって、修飾または切断されたCsgFペプチドおよびその突然変異体または相同体と組み合わせて、まとめて、CsgG様の細孔複合体が分析物(ポリヌクレオチドなど)と相互作用する能力を改善するものを含む。突然変異体CsgG細孔は、一つ以上の突然変異体モノマーを含みうる。CsgG細孔は、同一のモノマー、または二つ以上の異なるモノマーを含むヘテロポリマーを含むホモポリマーであってもよい。モノマーは、任意の組み合わせで下記に説明した一つ以上の突然変異体を有してもよい。
修飾CsgFペプチドを含むナノ細孔複合体は、特定の実施形態では野生型CsgFタンパク質のN末端断片または切断のみを含むため、配列番号6に示される野生型CsgFタンパク質と比較して異なる。ところが、修飾CsgFペプチドは、CsgG細孔および修飾CsgFペプチドを含む複合体によって形成される細孔においてアミノ酸置換としての突然変異がより良好な第二の収縮部位を許容するという意味で、追加的または代替的に突然変異したCsgFペプチドであり得る。そのため、突然変異体モノマーは、二つのリーダーヘッドを含むように複合体の機能が改善されることに加えて、前記複合体がヌクレオチド配列決定に使用される時、すなわち、改善されたポリヌクレオチド捕捉およびヌクレオチド差別の改善が示される時、ポリヌクレオチド読取特性を改善しうる可能性がある。特に、突然変異ペプチドから構成される細孔が、野生型よりも簡単にヌクレオチドおよびポリヌクレオチドを捕捉する。さらに、突然変異ペプチドから構成された細孔は、電流範囲の増加を示す場合があり、これは異なるヌクレオチド間の差別を容易にし、状態の分散を減少させ、これが信号対雑音比を増大させる。さらに、ポリヌクレオチドが突然変異体から構成される細孔を通して移動するとき、電流に寄与するヌクレオチドの数は減少しうる。これは、ポリヌクレオチドが細孔およびポリヌクレオチド配列を通して移動する時、観察される電流間の直接的な関係の識別を容易にする。さらに、突然変異ペプチドから構成される細孔は、増加したスループットの増大を示すことがあり、例えば、ポリヌクレオチドなどの分析物と相互作用する可能性が高い。これにより、細孔を使用した分析物の特徴付けが容易になる。突然変異ペプチドから構成された細孔は、より簡単に膜に挿入することができ、または細孔複合体の近傍に追加的なタンパク質を保持するより簡単な方法を提供しうる。
別の実施形態では、本発明の細孔複合体内に提供されるCsgF収縮部位は、0.5 nm~2.0 nmの範囲の直径を有し、それによって上述のように核酸配列決定に適した細孔複合体を提供する。
細孔は、CsgFペプチドのCsgG細孔への共有結合によって安定化されうる。共有結合性は、例えば、ジスルフィド結合であってもよく、またはクリックケミストリーでもよい。CsgFペプチドおよびCsgG細孔は、例えば、1と153、4と133、5と136、8と187、8と203、9と203、11と142、11と201、12と149、12と203、26と191、および29と144といった、それぞれ配列番号6と配列番号3の位置の対に対応する位置にある一つ以上の残基を介して、共有結合されてもよい。
細孔において、CsgFペプチドとCsgG細孔との間の相互作用は、例えば、1と153、4と133、5と136、8と187、8と203、9と203、11と142、11と201、12と149、12と203、26と191、および29と144とった、それぞれ配列番号6および配列番号3の位置の対の一つ以上に対応する位置での疎水性相互作用または静電気的相互作用によって安定化されうる。
上記の一つ以上の位置にあるCsgFおよび/またはCsgGの残基は、細孔内のCsgGとCsgFとの間の相互作用を強化するために修飾されてもよい。
一実施形態では、本発明の細孔は、単離されうる、実質的に単離されうる、精製されうる、または実質的に精製されうる。本発明の細孔は、脂質またはその他の細孔などのその他任意の構成要素を全く含まない場合、単離または精製されている。細孔は、その意図された使用に干渉しない担体または希釈剤と混合される場合、実質的に単離されている。例えば、細孔は、10%未満、5%未満、2%未満、または1%未満のその他の構成要素(トリブロック共重合体、脂質、またはその他の細孔など)を含む形態で存在する場合、実質的に単離または実質的に精製されている。別の方法として、本発明の細孔は膜内に存在しうる。適切な膜について以下で考察する。
本発明の細孔は、個別または単一の細孔として存在しうる。別の方法として、本発明の細孔は、二つ以上の細孔の相同集団または異種集団に存在しうる。
CsgFペプチド
本発明の第二の態様は、新規修飾CsgFモノマー(ペプチド)、またはCsgFタンパク質、またはCsgF相同体または突然変異体の修飾もしくは切断されたペプチドに関する。これらの新規の修飾CsgFペプチドは、第二または追加のリーダーヘッドを組み込むために細孔複合体で使用されてもよい。前記修飾または切断は、野生型CsgFの、または突然変異体または相同体のCsgFタンパク質の断片をもたらすことが好ましく、N末端断片がより好ましい。
成熟CsgF(配列番号6に示す)は、「CsgF収縮ペプチド」(FCP)、「ネック」領域および「ヘッド」領域(図4および5に示す)といった3つの主領域に分けることができる。CsgFペプチドの「ヘッド」領域は、本明細書に記載の細孔のリーダーヘッドとは異なる。CsgFペプチドの「ヘッド」領域はまた、「C末端ヘッドドメイン」と呼ばれてもよい。
FCPはCsgG β-バレルと接触領域を形成し、ここで追加的な収縮部が生じる。ネック領域は、β-バレルから突き出す。CsgG:CsgFオリゴマーでは、これはFCPを球状ヘッド領域に接続する薄壁の中空管を形成する。
多重配列アライメント(図8)、共精製実験(図9)、3.4 Å分解能(図11)におけるCsgG:CsgF複合体のcryoEM再構成に基づき、CsgF収縮ペプチド、ネック領域およびヘッド領域は、成熟CsgF内の連続した三つの残基として画定されうる。
FCPは、成熟CsgF(配列番号6)のおよそ残基1~35にわたる。FCPは、異なるCsgFオルソログを比較する時に、タンパク質の最も保存された領域を形成する(図8、図10)。CryoEMの3D再構成は、CsgG膜貫通ヘアピンTM1(配列番号3の残基134~154)およびTM2(配列番号3の残基184~208)(図1E、11)との非共有結合性の接触による、CsgG β-バレル内部を結合する十分に画定された構造であるFCP形態を示す(TM1およびTM2は、Goyal Pら、2014で定義)。再構成では、FCPの9つのコピーが、CsgGオリゴマー(9個のモノマーを含む)を結合し、まとめて成熟CsgG(配列番号3、図1E、図11)の残基46~61にわたる連続ループによって形成されたCsgG収縮部の上部の約2 nmよりも高い追加的収縮部を生じさせる。
cryoEMの3D再構成はまた、CsgF N末端残基も、CsgG β-バレルの底部または上部(配向に応じて)付近を結合し、β-バレルを残基32で出ることを示す。これは、CsgG:CsgF結合面における残基対の平均接触時間を示すMDシミュレーション(表4)とよく一致している。cryoEM構造およびMDシミュレーションは、残基33~34が、十分に(ただし厳密にではない)保存されたPro残基(配列番号6のPro 35)がCsgFネック領域に移行するCsgG β-バレルの外側に存在することを示す。CsgFネックは、立体配置的柔軟性を指し示すCsgG:CsgFの3D再構成において原子レベルでは分解されていない。CsgFネックは、多重配列アライメントおよび二次構造予測に基づいて、残基36からほぼ残基50(配列番号6)にわたることが予測される。CsgFヘッド領域は、CsgFのC末端部を形成し、およそ残基51からCsgF C末端までわたることが予測される。CsgG:CsgF複合体では、この領域は、CsgG:CsgFチャネルを塞ぐように見える球状構造を生じさせるようオリゴマー形成する(図4、5)。CsgFオルソログの多重配列アライメントは、CsgFネックが最も保存されていない領域であることを示しており、またあるオルソログと別のオルソログでは長さが変化しうることを示唆している(図8)。
本発明の一部を形成するCsgFペプチドは、C末端ヘッドを欠くか、C末端ヘッドおよびCsgFのネックドメインの一部を欠く(例えば、切断CsgFペプチドはCsgFのネックドメインの一部分のみを含みうる)か、C末端ヘッドおよびCsgFのネックドメインを欠く、切断CsgFペプチドである。CsgFペプチドはCsgFネックドメインの一部を欠いていてもよく、例えば、CsgFペプチドは、例えば、ネックドメインのN末端にあるアミノ酸残基36(配列番号6を参照)からなど(例えば、配列番号6の残基36-40、36-41、36-42、36-43、36-45、36-46から、残基36-50または36-60まで)、ネックドメインの一部分を含みうる。CsgFペプチドは、CsgG結合領域と、細孔内の収縮部を形成する領域とを含むことが好ましい。CsgG結合領域は典型的に、CsgFタンパク質(配列番号6または別の種由来の相同体)の残基1~8、および/または残基29~32を含み、一つ以上の修飾を含みうる。細孔内の収縮部を形成する領域は典型的に、CsgFタンパク質(配列番号6または別の種由来の相同体)の残基9~28を含み、一つ以上の修飾を含みうる。残基9~17は、保存されたモチーフNPXFGGXXX17を含み、回転領域を形成する。残基9~28は、αらせんを形成する。X17(配列番号6のN17は、細孔内のCsgF収縮部の最も狭い部分に対応する収縮部領域の頂点を形成する。CsgF収縮領域はまた、CsgG βバレル、主に配列番号6の残基9、11、12、18、21および22との接触を安定化させる。
CsgFペプチドは典型的に、28~50アミノ酸、例えば29~49、30~45または32~40アミノ酸などの長さを有する。CsgFペプチドは、29~35アミノ酸、または29~45アミノ酸を含むことが好ましい。CsgFペプチドは、配列番号6の残基1~35に対応するFCPのすべてまたは一部を含む。 CsgFペプチドがFCPより短い場合、切断はC末端でなされることが好ましい。
配列番号6またはその相同体もしくは突然変異体のCsgF断片は、24、25、26、27、28、29、30、31,32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54または55のアミノ酸の長さを有してもよい。
CsgFペプチドは、残基1から残基25~60のうちのいずれか一つ(例えば配列番号6の27~50、例えば28~45)までの配列番号6のアミノ酸配列、または配列番号6の相同体からの対応する残基、またはそのいずれかの変異体を含みうる。より具体的には、CsgFペプチドは、配列番号39(配列番号6の残基1~29)またはその相同体または変異体を含みうる。
このようなCsgFペプチドの例は、配列番号15(配列番号6の残基1~34)、配列番号54(配列番号6の残基1~30)、配列番号40(配列番号6の残基1~45)、または配列番号55(配列番号6の残基1~35)およびそれらの任意の相同体または変異体から本質的に構成されるかまたは構成される。CsgFペプチドの他の例は、以下の配列番号を含む、それらから本質的に構成されるか、またはそれらから構成される:配列番号 7、配列番号 8、配列番号 9、配列番号 10、配列番号 11、配列番号 12、配列番号 13、配列番号 14、配列番号 16。
CsgFペプチドでは、一つ以上の残基、例えば、配列番号 15、配列番号 39、配列番号 40、配列番号54、または配列番号55は修飾されてもよい。
例えば、CsgFペプチドは、配列番号6の以下の一つ以上に対応する位置に修飾を含んでもよい:G1、T4、F5、R8、N9、N11、F12、A26およびQ29。
CsgFペプチドは、システイン、疎水性アミノ酸、荷電アミノ酸、非ネイティブ反応性アミノ酸、または光反応性アミノ酸を、例えば、配列番号6の以下の一つ以上に対応する位置に導入するように修飾されてもよい:G1、T4、F5、R8、N9、N11、F12、A26およびQ29。
例えば、CsgFペプチドは、配列番号6の以下の一つ以上に対応する位置に修飾を含んでもよい:N15、N17、A20、N24、およびA28。CsgFペプチドは、CsgG-CsgF複合体を安定化させるためにD34に対応する位置に修飾を含みうる。特定の実施形態では、CsgFペプチドは、以下の置換のうちの一つ以上を含む:N15S/A/T/Q/G/L/V/I/F/Y/W/R/K/D/C、N17S/A/T/Q/G/L/V/I/F/Y/W/R/K/D/C、A20S/T/Q/N/G/L/V/I/F/Y/W/R/K/D/C、N24S/T/Q/A/G/L/V/I/F/Y/W/R/K/D/C、A28S/T/Q/N/G/L/V/I/F/Y/W/R/K/D/CおよびD34F/Y/W/R/K/N/Q/C。CsgFペプチドは、例えば、一つ以上の以下の置換を含みうる:G1C、T4C、N17S、およびD34YまたはD34N。
CsgFペプチドは、全長CsgFなどの長いタンパク質を酵素を使用して切断することによって生成されうる。特定の部位での切断は、適切な位置に酵素切断部位を含むように全長CsgFなどの長いタンパク質を修飾することによって指図されうる。こうした酵素切断部位を含むように修飾されたCsgFアミノ酸配列の例が、配列番号56~67に示されている。切断後、追加された酵素切断部位のすべてまたは一部は、CsgGと関連付けられて細孔を形成するCsgFペプチド内に存在しうる。従って、CsgFペプチドは、そのC末端における酵素切断部位のすべてまたは一部をさらに含んでもよい。
適切なCsgFペプチドの一部の例を、以下の表3に示す。
Figure 0007282697000003
Figure 0007282697000004
特定の実施形態では、前記CsgF断片は、アミノ酸配列番号39、またはその突然変異体または相同体を含む。特に、配列番号39は、成熟CsgFペプチド(配列番号6)の最初の29個のアミノ酸を含む。別の実施形態では、本発明の修飾CsgFペプチドは配列番号40を含む切断ペプチドである。特に、配列番号40は、成熟CsgFペプチド(配列番号6)の最初の45個のアミノ酸を含む。特に、CsgF収縮部位およびCsgGへの結合部位は、N末端CsgFペプチド領域内に位置し、配列番号5のアミノ酸39~64(配列番号39および配列番号40内に存在)、または特に配列番号5のアミノ酸49~64(配列番号40内に存在するが、配列番号39内には存在しない、配列番号39によってコードされる後者の断片はCsgGとの弱めの相互作用を示す(例を参照))が、複合体により高い安定性を与えるという点で、さらに特徴付けられる。従って、本開示は、CsgG細孔またはその相同体もしくは突然変異体とのin vivoでの複合体形成を可能にするために、前記ペプチド、または前記N末端断片または収縮部位領域を含むペプチドに対してタンパク質の切断をすることによって、CsgFタンパク質の修飾を提供する。一実施形態では、配列番号37または配列番号38を含む修飾CsgFペプチドに関して、さらなる制限がある。最後に、CsgF相同ペプチド、特に収縮領域(FCPペプチド)内に配置されているCsgF相同ペプチドの識別は、前記単離された複合体の一部を形成しうる修飾CsgFペプチド相同体も提供する(例えば、図8および10を参照)。
さらなる実施形態は、配列番号15を含む修飾または切断CsgFペプチドに関連し、ここで前記配列番号15は、CsgFチャネル収縮を含む単離された細孔複合体をもたらすために、CsgGまたはその相同体および修飾CsgFペプチドを含む複合体細孔のin vitro再構成に十分なCsgG結合部位および/または収縮部位の領域からのいくつかの残基を含むCsgFタンパク質の領域を含む。別の実施形態は、配列番号16を含む前記修飾CsgFペプチドを説明しており、これは、CsgFタンパク質のN末端断片および二つの追加的なアミノ酸(KD)を含み、これが、(合成)ペプチドの溶解性および安定性を増加させるとともに、前記複合体細孔のin vitro再構成を許容する。前記修飾CsgFペプチドが配列番号15、配列番号16またはその相同体もしくは突然変異体を含む実施形態がさらに提供されており、ここで、前記修飾CsgFペプチドはさらに突然変異がなされているが、前記配列番号15または16に対応する修飾CsgFペプチドの領域内で、それぞれ配列番号15、または配列番号16に対して、例えば、40%、50%、60%、70%、80%、85%、90%のアミノ酸同一性など、最低でも35%のアミノ酸同一性がなおも保持されている。前記修飾CsgFペプチドが配列番号15、配列番号16またはその相同体もしくは突然変異体を含む実施形態がさらに提供されており、ここで、前記修飾CsgFペプチドはさらに突然変異がなされているが、前記配列番号15または16に対応する修飾CsgFペプチドの領域内で、それぞれ配列番号15、または配列番号16に対して、最低でも40%、45%、50%、60%、70%、80%、85%、90%のアミノ酸同一性がなおも保持されている。これらの突然変異領域は、上述の通り、CsgF収縮部位の特性を変更および/または改善することを意図しており、そのため例えば、より正確な標的分析を得ることができる。別の実施形態では、修飾CsgFペプチドが開示されており、ここで、配列番号39、配列番号40、配列番号54、または配列番号55を含む領域の一つ以上の位置が修飾され、また前記突然変異体が配列番号39、配列番号40、配列番号54、または配列番号55を含む領域に対応するペプチド断片において、配列番号39、配列番号40、配列番号54、または配列番号55の最低でも35%のアミノ酸同一性、または40%、50%、60%、70%、80%、85%、90%、95%のアミノ酸同一性を保持する。
そのため、本発明のさらなる実施形態は、CsgG細孔またはその相同体もしくは突然変異体、ならびにその変性CsgFペプチドまたはその相同体もしくは突然変異体を含む単離された細孔複合体に関連し、ここで、前記修飾CsgFペプチドは本発明の第二の態様に記載されるように定義される。
追加的な実施形態は、単離された細孔複合体に関連し、ここで、少なくとも一つのモノマーを介した前記CsgG細孔および修飾CsgFペプチドは、共有結合を介して結合される。前記共有結合または結合は、システイン結合を介して可能な一つの例であり、システインのスルフヒドリル側基は、別のアミノ酸残基または部分と共有結合する。第二の可能性において、共有結合性、非天然の(光)反応性アミノ酸間の相互作用を介して得られる。(光)反応性アミノ酸は、タンパク質複合体の架橋に使用できる天然アミノ酸の人工的アナログを指し、タンパク質およびペプチドにin vivoまたは in vitroで組み込まれうる。一般的な使用における光反応性アミノ酸類似体は、ロイシンおよびメチオニン、およびパラ-ベンゾイル-フェニル-アラニン、ならびにアジドホモアラニン、ホモプロパルギルグリシン、ホモアレルグリシン、p-アセチル-Phe、p-アジド-Phe、p-プロパルギルオキシ-Phe、およびp-ベンゾイル-Pheに対する光反応性ジアジリン類似体である(Wang et al. 2012、Chin et al. 2002)。紫外線光に暴露されると、これらは活性化され、光反応性アミノ酸類似体のいくつかのオングストローム内にある相互作用タンパク質に結合される。しかしながら、前記共有結合性が発生しうるCsgGモノマー中の位置は、修飾CsgFペプチドへの暴露に依存する。図1に示すように、いくつかのアミノ酸は、共有結合性を提供する位置、すなわち配列番号3またはその相同体の位置132、133、136、138、140、142、144、145、147、149、151、153、155、183、185、187、189、191、201、203、205、207または209にある。
本発明の別の態様は、前記修飾CsgFペプチドを含む構成体に関し、前記ペプチドは共有結合している。「構成体」は、修飾CsgFおよび/またはCsgGまたはその相同体から誘導される二つ以上の共有結合したモノマーを含む。別の言い方をすると、構成体は複数のモノマーを含みうる。別の態様では、本発明は本発明の少なくとも一つの構成体を含む細孔複合体も提供する。細孔複合体は、十分な構成体を含み、必要に応じて細孔を形成するモノマーを含む。例えば、八量体細孔は、(a)それぞれ二つのモノマーを含む四つの構成体、(b)それぞれ四つのモノマーを含む二つの構成体、(c)二つのモノマーを含む一つの構成体と構成体の一部を形成しない六つのモノマー、または(d)一つの構成体内の一つもしくは二つのCsgFモノマーと、六つもしくは七つのCsgGモノマーを有する一つの構成体、あるいはさらには(e)CsgGモノマーのみを含む別の構成体に加えてCsgFおよびCsgGモノマーを有する構成体を含みうる。例えば、九量体細孔に対して同一および追加的な可能性が提供される。構成体およびモノマーのその他の組み合わせが、当業者によって想定され得る。本発明の一つ以上の構成体は、配列決定、ポリヌクレオチドなどの特徴付けのための細孔複合体を形成するために使用されうる。構成体は、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個または少なくとも10個のモノマーを含みうる。構成体は二つのモノマーを含むことが好ましい。二つ以上のモノマーは同一であっても異なっていてもよく、CsgF、CsgG、CsgG/CsgF融合モノマーまたはその相同体、またはそれらの任意の組み合わせであってもよい。
別の実施形態は、本発明の前記修飾CsgFペプチドまたはその相同体もしくは突然変異体をコードするポリヌクレオチドまたは核酸分子、または上述の構成体をコードするポリヌクレオチドに関する。
特定の実施形態は、本発明の第一および第二の態様による単離された細孔複合体と、膜の構成要素とを含む、単離された膜貫通細孔複合体に関する。前記単離された膜貫通細孔複合体は、核酸配列決定などの分子感知の使用に直接適用可能である。別の方法として、本明細書で説明した本発明の単離された細孔複合体による修飾CsgG/CsgF生物学的細孔、および膜、膜構成要素、または絶縁層を含む、膜組成物が提供される。一つの実施形態は、本発明による単離された細孔複合体から成る単離された膜貫通細孔複合体と、膜の構成要素とに関する。
CsgG:CsgF複合体は非常に安定しているが、CsgFが切断されると、CsgG:CsgF複合体の安定性は全長CsgFを含む複合体と比較して減少する。従って、例えば、本明細書で特定される位置にシステイン残基を導入した後で、ジスルフィド結合をCsgGとCsgGの間に作製して、複合体をより安定させることができる。細孔複合体は、これまでに述べた方法のいずれかで作製することができ、ジスルフィド結合形成は、酸化剤(例えば、銅-オルソフェナントロリン)を使用することによって誘発されうる。その他の相互作用(例えば、疎水性相互作用、電荷充電相互作用/静電相互作用)も、システイン相互作用の代わりにそれらの位置で使用することができる。
別の実施形態では、非天然アミノ酸がそれらの位置に組み込まれてもよい。この実施形態では、共有結合は、クリックケミストリーを介して作製される。例えば、アジドまたはアルキンを有する非天然アミノ酸、またはジベンゾシクロオクチン(DBCO)基および/またはビシクロ[6.1.0]ノニン(BCN)基を、これらの位置の一つ以上に導入されうる。
こうした安定化させる突然変異は、例えば、本明細書に開示される修飾などのCsgGおよび/またはCsgFに対するその他の任意の修飾と組み合わせることができる。
CsgG細孔は、CsgFペプチドへの付着を促進するように修飾された2、3、4、5、6、7、8、9または10個など少なくとも一つのCsgGモノマーを含みうる。例えば、システイン残基は、配列番号3の位置132、133、136、138、140、142、144、145、147、149、151、153、155、183、185、187、189、191、201、203、205、207および209に対応する一つ以上の位置に、および/またはCsgFと接触してCsgGへの共有結合を促進することが予測される表4に記載された任意の一つの位置に導入されうる。システイン残基を介した共有結合に対する代替的または追加として、細孔は疎水性相互作用または静電相互作用によって安定化されうる。こうした相互作用を促進するために、配列番号3の位置132、133、136、138、140、142、144、145、147、149、151、153、155、183、185、187、189、191、201、203、205、207および209の一つ以上に対応する位置で、および/またはCsgFと接触することが予測される表4に記載された任意の一つの位置で、非ネイティブ反応性または光反応性アミノ酸が。
CsgFペプチドは、CsgG細孔への付着を促進するように修飾されうる。例えば、システイン残基は、配列番号6の位置1、4、5、8、9、11、12、26または29に対応する一つ以上の位置に、および/またはCsgFと接触してCsgGへの共有結合を促進することが予測される表4に記載された任意の一つの位置に導入されうる。システイン残基を介した共有結合に対する代替的または追加として、細孔は疎水性相互作用または静電相互作用によって安定化されうる。こうした相互作用を促進するために、配列番号6の位置1、4、5、8、9、11、12、26または29の一つ以上に対応する位置で、および/またはCsgFと接触することが予測される表4に記載された任意の一つの位置で、非ネイティブ反応性または光反応性アミノ酸が。
好ましい例示的なCsgFペプチドは、配列番号6に対する以下の突然変異を含む: N15X/N17X/A20X/N24X/A28XX/D34X、式中、XはN/S/A/T/Q/G/L/V/I/F/Y/W/R/K/D/C、XはN/S/A/T/Q/G/L/V/I/F/Y/W/R/K/D/C、XはA/S/T/Q/N/G/L/V/I/F/Y/W/R/K/D/C、XはN/S/T/Q/A/G/L/V/I/F/Y/W/R/K/D/C、XはA/S/T/Q/N/G/L/V/I/F/Y/W/R/K/D/CおよびXはD/F/Y/W/R/K/N/Q/Cである。位置N15、N17、A20、N24およびA28での突然変異体は、収縮突然変異体であり、位置34での突然変異体は、CsgG細孔の底部との相互作用pf CsgFに影響して相互作用を安定化させる。
CsgG細孔
CsgG細孔は、本発明の同一の突然変異体モノマーを含むホモオリゴマー細孔であってもよい。CsgG細孔は、例えば、本明細書に開示される少なくとも一つの突然変異体モノマーを含む、CsgGから誘導されるヘテロオリゴマー細孔であってもよい。
CsgG細孔は、任意の数の突然変異体モノマーを含みうる。細孔は、一般に、7個、8個、9個、または10個の突然変異体モノマーなど、少なくとも7個、少なくとも8個、少なくとも9個、または少なくとも10個の同一の突然変異体モノマーを含む。CsgG細孔は、8個または9個の同一の突然変異体モノマーを含むことが好ましい。
好ましい実施形態では、ヘテロオリゴマーCsgG細孔(モノマーのうちの10個、9個、8個または7個など)内のすべてのモノマーは、本明細書に開示される突然変異体モノマーであり、ここでそれらの少なくとも一つは他と異なる。これらは互いに異なりうる。
CsgG細孔内の突然変異体モノマーは、すべてほぼ同一の長さであるか、または同一の長さであることが好ましい。本発明の細孔内の突然変異体モノマーのバレルは、ほぼ同一の長さであるか、または同一の長さであることが好ましい。長さは、アミノ酸数および/または長さの単位で測定されうる。
突然変異体モノマーは、配列番号3の変異体であってもよい。配列番号3のアミノ酸配列の全長にわたり、変異体は、アミノ酸同一性に基づき、その配列に対し少なくとも50%相同であることが好ましい。変異体は、配列全体にわたる配列番号3のアミノ酸配列に対するアミノ酸同一性に基づき、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%であることが好ましく、また少なくとも95%、97%または99%の相同性を持ちうることがより好ましい。例えば、100以上、例えば125、150、175または200以上の連続的なアミノ酸範囲にわたり、少なくとも80%、例えば、少なくとも85%、90%または95%のアミノ酸同一性を有しうる(「ハード相同性」)。
CsgGモノマーは、高度に保存されている(WO2017/149317の図45~47から容易に理解できる)。さらに、配列番号3に関連した突然変異の知識から、配列番号3以外のCsgGモノマー突然変異の同等の位置を決定することが可能である。
従って、配列番号3に示される配列の変異体および本明細書の特許請求の範囲その他に記載される特定のそのアミノ酸突然変異体を含む突然変異体CsgGモノマーに関する言及は、配列番号68~88およびその対応するアミノ酸突然変異に示される配列の変異体を含む突然変異体CsgGモノマーも包含する。同様に、配列番号3に示される配列の変異体および本明細書において記載される特定のアミノ酸突然変異を含むCsgGモノマーに関する細孔の使用が関与する構成体、細孔または方法への言及は、上記に開示された配列番号およびその対応するアミノ酸突然変異の変異体を含む突然変異体CsgGモノマーに関連する構成体、細孔または方法を包含する。さらに理解されるとおり、本発明は、高度に保存された領域を示す特異化では明示的に特定されていない他の変異体CsgGモノマーにも及ぶ。
当技術分野の標準的な方法を使用して、相同性を決定してもよい。例えば、UWGCGパッケージは、例えば、そのデフォルト設定で使用して、相同性を計算するために使用できるBESTFITプログラムを提供する(Devereux et al (1984) Nucleic Acids Research 12, p387-395)。PILEUPおよびBLASTアルゴリズムは、相同性またはラインアップ配列(同等な残基または対応する配列を特定するなど(典型的に、それらのデフォルト設定で))の計算に使用されうる。例えば、Altschul S. F. (1993) J Mol Evol 36:290-300、 Altschul, S.F et al (1990) J Mol Biol 215:403-10に記載がある。BLAST解析を実行するソフトウェアは、National Center for Biotechnology Information(http://www.ncbi.nlm.nih.gov/)から公に利用可能である。
配列番号3は、野生型CsgGモノマーであり、大腸菌株 K-12 substr. MC4100に由来する。配列番号3の変異体は、別のCsgG相同体に存在する任意の置換を含みうる。好ましいCsgG相同体を配列番号68~88に示す。変異体は、配列番号3と比較して配列番号68~88に存在する置換のうちの一つ以上の組み合わせを含みうる。例えば、配列番号3と配列番号68~88のいずれか一つとの間で異なる配列番号3の位置のうち任意の一つ以上の位置で突然変異を作製してもよい。こうした突然変異は、配列番号3におけるアミノ酸を、配列番号68~88のいずれか一つにおける対応する位置からのアミノ酸の置換であってもよい。あるいは、これらの任意の一つの位置での突然変異は、任意のアミノ酸との置換でもよく、または欠失または挿入の突然変異(1~10アミノ酸の欠失または挿入などで、2~8または3~6アミノ酸の欠失または挿入など)でもよい。本明細書に開示される突然変異以外に、配列番号3と配列番号66~88の全ての間に保存されるアミノ酸は、本発明の変異体中に存在することが好ましい。しかしながら、配列番号3と配列番号66~88の全ての間に保存されるこれらの位置のうちの任意の一つ以上の位置で保存的突然変異を作製してもよい。
本発明は、配列番号3の特定の位置に対応するCsgGモノマーの構造内の位置で、配列番号3の特定の位置に置換されたものとして本明細書に記載した任意の一つ以上のアミノ酸を含む細孔形成CsgG突然変異体モノマーを提供する。対応する位置は、当技術分野の標準技術によって決定されうる。例えば、上述のPILEUPアルゴリズムおよびBLASTアルゴリズムを使用して、CsgGモノマーの配列を配列番号3と整列させ、それによって対応する残基を特定できる。
細孔形成突然変異体モノマーは一般に、配列番号3の配列を有するCsgGモノマーと同じ3D構造など、野生型CsgGモノマーと同じ3D構造を形成する能力を保持する。CsgGの3D構造は当技術分野で周知であり、例えば、Goyal et al(2014)Nature 516(7530):250-3に開示されている。本発明の突然変異によってCsgG突然変異体モノマーに与えられる改善された特性が保持されることを条件に、本明細書に記載の突然変異に加えて野生型CsgG配列で任意の数の突然変異を作製しうる。
典型的には、CsgGモノマーは、3つのαらせんおよび5つのβシートを含む構造を形成する能力を保持する。突然変異体は、少なくとも、第一のαらせん(配列番号3内のS63で開始される)に対するN末端であるCsgGの領域内と、第二のαらせん(配列番号3のG85~A99)内と、第二のαらせんと第一のβシートの間のループ(配列番号3のQ100~N120)内と、第四および第五のシート(配列番号3のそれぞれ、S173~R192およびR198~T107)内と、第四および第五のβシート間のループ(配列番号3のF193~Q197)内に、CsgGモノマーが膜貫通細孔(ここで膜貫通細孔はポリペプチドを転位する能力を持つ)を形成する能力に影響を及ぼすことなく作製されうる。従って、ポリヌクレオチドを転位できる細孔を形成するために、モノマーの能力に影響を与えることなく、任意のCsgGモノマー内のこれらの領域にさらなる突然変異がなされうることが想定される。突然変異体は、ポリヌクレオチドを転位できる細孔を形成するモノマーの能力に影響を及ぼすことなく、任意のαらせん(配列番号3のS63~R76、G85~A99またはV211~L236)内、または任意のβシート(配列番号3のI121~N133、K135~R142、I146~R162、S173~R192またはR198~T107)内など、その他の領域内に作製されうることも予想される。また、一つ以上のアミノ酸の欠失は、ポリヌクレオチドを転位できる細孔を形成するモノマーの能力に影響を及ぼすことなく、αらせんおよびβシートを連結する任意のループ領域内、および/またはCsgGモノマーのN末端および/またはC末端領域内に作製できることも予想される。
アミノ酸置換は、上述のものに加えて、例えば、最大1、2、3、4、5、10、20または30個の置換など、配列番号3のアミノ酸配列に作製されてもよい。同類置換は、アミノ酸を、類似の化学構造、類似の化学的特性、または類似の側鎖体積の他のアミノ酸で置換する。導入されたアミノ酸は、置換するアミノ酸に類似した極性、親水性、疎水性、塩基性、酸性、中和性または電荷を有しうる。あるいは、同類置換は、既存の芳香族アミノ酸または脂肪族アミノ酸の場所に、芳香族または脂肪族である別のアミノ酸を導入してもよい。保存アミノ酸の変化は当技術分野で周知であり、上記表1に定義される20の主要アミノ酸の特性に従って選択されうる。アミノ酸が類似の極性を持つ場合、これは表2のアミノ酸側鎖についてのヒドロパシースケールを参照することによっても決定されうる。
配列番号3のアミノ酸配列の一つ以上のアミノ酸残基を、上述のポリペプチドから追加的に欠失させてもよい。最大1、2、3、4、5、10、20または30またはそれ以上の残基が欠失されうる。
変異体は、配列番号3の断片を含みうる。こうした断片は細孔形成活性を保持する。断片は、長さが少なくとも50、少なくとも100、少なくとも150、少なくとも200または少なくとも250アミノ酸であってもよい。こうした断片は、細孔を生成するために使用されうる。断片は、配列番号3のドメインにわたる膜、すなわちK135~Q153およびS183~S208を含むことが好ましい。
一つ以上のアミノ酸が、代替的にまたは追加的に上述のポリペプチドに追加されてもよい。延長部が、配列番号3のアミノ酸配列またはポリペプチド変異体またはその断片のアミノ末端またはカルボキシ末端に提供されてもよい。延長部は、例えば長さが1~10アミノ酸の間でかなり短くてもよい。あるいは、延長部は、例えば、最大50アミノ酸または100アミノ酸など長めでもよい。担体タンパク質が、本発明によるアミノ酸配列に融合されてもよい。その他の融合タンパク質について以下で詳細に検討する。
本明細書に記載のCsgG細孔は、野生型CsgG細孔またはその相同体もしくは突然変異体/変異体を含む。変異体は、配列番号3のアミノ酸配列から変化し、かつ細孔を形成するその能力を保持するアミノ酸配列を有するポリペプチドである。変異体は一般に、細孔形成を担う配列番号3の領域を含む。β-バレルを含む、CsgGの細孔形成能力は、各サブユニット内のβ-シートによって提供される。配列番号3の変異体は典型的に、β-シート、すなわちK134~Q154およびS183~S208を形成する配列番号3内の領域を含む。一つ以上の修飾は、結果として生じる変異体が細孔を形成する能力を保持する限り、β-シートを形成する配列番号3の領域に作製されうる。配列番号3の変異体は、そのαらせんおよび/またはループ領域内に、置換、付加または欠失など、一つ以上の修飾を含むことが好ましい。
突然変異体CsgGモノマーは、その配列が野生型CsgGモノマーの配列から変化し、細孔を形成する能力を保持するモノマーである、突然変異体CsgGモノマーであってもよい。突然変異体モノマーはまた、本明細書では変異体と呼ばれうる。細孔を形成するための突然変異体モノマーの能力を確認するための方法は当技術分野で周知であり、以下でより詳細に検討される。
CsgG細孔に含まれうる特定の細孔形成CsgG突然変異体モノマーは、以下の修飾のうちの任意の一つ以上を含みうる。
- 配列番号3のR97に相当する位置でのW、
- 配列番号3のR93に相当する位置でのW、
- 配列番号3のR97に相当する位置でのY、
- 配列番号3のR93に相当する位置でのY、
- 配列番号3におけるR93およびR97に対応するそれぞれの位置でのY、
- 配列番号3のR192に対応する位置でのD、
- 配列番号3のV105-I107に対応する位置での残基の欠失、
- 配列番号3のF193~L199に対応する一つ以上の位置での残基の欠失、
- 配列番号3の195~L199に対応する位置の残基の欠失、
- 配列番号3の193~L199に対応する位置の残基の欠失、
- 配列番号3のR191に対応する位置でのT、
- 配列番号3のK49に対応する位置でのQ、
- 配列番号3のK49に対応する位置でのN、
- 配列番号3のK42に対応する位置でのQ、
- 配列番号3のE44に対応する位置でのQ、
- 配列番号3のE44に対応する位置でのN、
- 配列番号3のL90に対応する位置でのR、
- 配列番号3のL91に対応する位置でのR、
- 配列番号3のI95に対応する位置でのR、
- 配列番号3のA99に対応する位置でのR、
- 配列番号3のE101に対応する位置でのH、
- 配列番号3のE101に対応する位置でのK、
- 配列番号3のE101に対応する位置でのN、
- 配列番号3のE101に対応する位置でのQ、
- 配列番号3のE101に対応する位置でのT、
- 配列番号3のQ114に対応する位置でのK。
CsgG細孔形成モノマーは、配列番号3内のY51に対応する位置にあるAおよび/または配列番号3内のF56に対応する位置にあるQをさらに含むことが好ましい。
配列番号3の位置97に対応する位置でRからWへの置換を含むCsgGモノマーから構成された細孔は、標的ポリヌクレオチドを特徴付ける時(または配列決定する)に、位置97に修飾のない同一の細孔と比較して、精度の増大を示す。精度の増大はまた、R97Wの代わりに、CsgGモノマーが、配列番号3の位置97に対応する位置でRからWへの修飾、または配列番号3の位置93および97に対応する位置でRからYへの修飾を含む場合にも見られる。従って、細孔は、修飾がアミノ酸の疎水性を増大させるように、配列番号3のR97またはR93に対応する位置に修飾を含む、一つ以上の突然変異体CsgGモノマーから構成されうる。例えば、こうした修飾は、例えば、WおよびYを含むがこれに限定されない、疎水性側鎖を含む任意のアミノ酸でのアミノ酸置換を含みうる。
配列番号3の位置192に対応する位置にRからD、Q、F、SまたはTへの突然変異を含むCsgGモノマーは、正電荷の減少に起因しうる位置192での置換を持たないモノマーよりも発現しやすい。従って、位置192は、正電荷を減少させるアミノ酸で置換されうる。R192D/Q/F/S/Tを含むモノマーはまた、モノマーから形成された突然変異体細孔の能力を改善して、ポリヌクレオチドなどの分析物と相互作用し、それを特徴付ける追加的修飾も含みうる。しかしながら、一実施形態では、配列番号3の位置193に対応する位置での残基はRまたはKであることが好ましく、Rであることがより好ましい。
V105、A106およびI107の欠失、F193、I194、D195、Y196、Q197、R198およびL199の欠失、またはD195、Y196、Q197、R198およびL199の欠失、および/またはF191Tを含むCsgGモノマーを含む細孔は、標的ポリヌクレオチドを特徴付ける(または配列決定する)時に、精度の増大を示す。位置105~107のアミノ酸は、ナノ細孔のキャップ内のcis-ループに対応し、位置193~199のアミノ酸は、細孔の別の端にあるtrans-ループに対応する。理論に束縛されることは望まないが、cis-ループの欠失は、細孔との酵素の相互作用を改善し、またtrans-ループの除去は、細孔のtrans側にあるDNA間の好ましくない相互作用を減少させると考えられる。
配列番号3のK94に対応する位置にKからQまたはKからNへの突然変異を含むCsgGモノマーを含む細孔は、標的ポリヌクレオチドを特徴付ける(または配列決定する)時に、K94に突然変異のない同一の細孔と比べて、雑音が多い細孔(すなわち、信号対雑音比を増加させる細孔)の数の減少を示す。位置94は、細孔の玄関口に見出され、電流信号の雑音に関連して特に敏感な位置であることが見いだされた。
T104KまたはT104R、N91R、E101K/N/Q/T/H、E44N/Q、Q114K、A99R、I95R、N91R、L90R、E44Q/Nおよび/またはQ42K、または対応する突然変異を含むCsgGモノマーを含む細孔はすべて、これらの位置に置換のない同一の細孔と比較して、標的ポリヌクレオチドを特徴付ける(配列決定する)時に、標的ポリヌクレオチドを捕捉する能力の増大を示す。
一実施形態では、CsgG細孔は、(a)I41、R93、A98、Q100、G103、T104、A106、I107、N108、L113、S115、T117、Y130、K135、E170、S208、D233、D238およびE244の位置にある一つ以上の突然変異体(すなわち、それらの位置の一つ以上にある突然変異体)および/または(b)D43S、E44S、F48S/N/Q/Y/W/I/V/H/R/K、Q87N/R/K、N91K/R、K94R/F/Y/W/L/S/N、R97F/Y/W/V/I/K/S/Q/H、E101I/L/A/H、N102K/Q/L/I/V/S/H、R110F/G/N、Q114R/K、R142Q/S、T150Y/A/V/L/S/Q/N、R192D/Q/F/S/TおよびD248S/N/Q/K/Rのうち一つ以上を含む、配列番号3の変異体である一つ以上のモノマーを含む。変異体は、(a)、(b)、または(a)および(b)を含んでもよい。一部の実施形態では、変異体はR97Wを含む。一部の実施形態において、変異体はR192D/Q/F/S/T(R192D/Qなど)を含む。(a)において変異体は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18または19個の位置など、任意の数および組み合わせの位置での修飾を含みうる。
(a)において、変異体は、I41N、R93F/Y/W/L/I/V/N/Q/S、A98K/R、Q100K/R、G103F/W/S/N/K/R、T104R/K、A106R/K、I107R/K/W/F/Y/L/V、N108R/K、L113K/R、S115R/K、T117R/K、Y130W/F/H/Q/N、K135L/V/N/Q/S、E170S/N/Q/K/R、S208V/I/F/W/Y/L/T、D233S/N/Q/K/R、D238S/N/Q/K/RおよびE244S/N/Q/K/Rのうち一つ以上を含むことが好ましい。
(a)では、変異体は、モノマーを含む膜貫通細孔などに関して(貫通するなど)標的ポリヌクレオチドのより一貫した移動を提供する一つ以上の修飾を含むことが好ましい。特に(a)では、変異体は、R93、G103、およびI107の位置に一つ以上の突然変異(すなわち、これらの位置の一つ以上に突然変異)を含むことが好ましい。変異体は、R93、G103、I107、R93およびG103、R93およびI107、G103およびI107、またはR93、G103およびI107を含みうる。変異体は、R93F/Y/W/L/I/V/N/Q/S、G103F/W/S/N/K/RおよびI107R/K/W/F/Y/L/Vのうち一つ以上を含むことが好ましい。これらは、R93、G103およびI107の位置について示される任意の組み合わせに存在しうる。
(a)において、変異体は、突然変異体モノマーから構成される細孔が、好ましくはヌクレオチドおよびポリヌクレオチドをより簡単に捕捉するようにする一つ以上の修飾を含むことが好ましい。特に(a)では、変異体は、I41、T104、A106、N108、L113、S115、T117、E170、D233、D238およびE244の位置に一つ以上の突然変異(すなわち、これらの位置の一つ以上に突然変異)を含むことが好ましい。変異体は、任意の数および組み合わせの位置(1、2、3、4、5、6、7、8、9、10または11など)での修飾を含みうる。変異体は、I41N、T104R/K、A106R/K、N108R/K、L113K/R、S115R/K、T117R/K、E170S/N/Q/K/R、D233S/N/Q/K/R、D238S/N/Q/K/RおよびE244S/N/Q/K/Rのうち一つ以上を含むことが好ましい。あるいはまたは別の方法として、変異体は、(c)Q42K/R、E44N/Q、L90R/K、N91R/K、I95R/K、A99R/K、E101H/K/N/Q/Tおよび/またはQ114K/Rを含みうる。
(a)では、変異体は、より一貫した移動を提供し、捕捉を増加させる一つ以上の修飾を含むことが好ましい。特に(a)では、変異体は、(i)A98、(ii)Q100、(iii)G103、および(iv)I107の位置に一つ以上の突然変異(すなわち、これらの位置の一つ以上に突然変異)を含むことが好ましい。変異体は、(i)A98R/K、(ii)Q100K/R、(iii)G103K/R、および(iv)I107R/Kのうちの一つ以上を含むことが好ましい。
ポリヌクレオチドなどの分析物の捕捉を提供する特に好ましい突然変異体モノマーは、位置Q42、E44、E44、L90、N91、I95、A99、E101およびQ114のうち一つ以上に突然変異を含み、ここで突然変異は、突然変異位置で負電荷を除去し、および/または正電荷を増加させる。特に、以下の突然変異を、分析物、好ましくはポリヌクレオチドを捕捉する能力が改善されたCsgG細孔を産生する本発明の突然変異体モノマーに含めることができる:Q42K、E44N、E44Q、L90R、N91R、I95R、A99R、E101H、E101K、E101N、E101Q、E101TおよびQ114K。その他の有益な突然変異体と組み合わせてこれらの突然変異体のうちの一つを含む特定の突然変異体モノマーの例は、以下のとおりである:
CsgG-(WT-Y51A/F56Q/K94Q/R97W/R192D-del(V105-I107)-Q42K
CsgG-(WT-Y51A/F56Q/K94Q/R97W/R192D-del(V105-I107)-E44N
CsgG-(WT-Y51A/F56Q/K94Q/R97W/R192D-del(V105-I107)-E44Q
CsgG-(WT-Y51A/F56Q/K94Q/R97W/R192D-del(V105-I107)-L90R
CsgG-(WT-Y51A/F56Q/K94Q/R97W/R192D-del(V105-I107)-N91R
CsgG-(WT-Y51A/F56Q/K94Q/R97W/R192D-del(V105-I107)-I95R
CsgG-(WT-Y51A/F56Q/K94Q/R97W/R192D-del(V105-I107)-A99R
CsgG-(WT-Y51A/F56Q/K94Q/R97W/R192D-del(V105-I107)-E101H
CsgG-(WT-Y51A/F56Q/K94Q/R97W/R192D-del(V105-I107)-E101K
CsgG-(WT-Y51A/F56Q/K94Q/R97W/R192D-del(V105-I107)-E101N
CsgG-(WT-Y51A/F56Q/K94Q/R97W/R192D-del(V105-I107)-E101Q
CsgG-(WT-Y51A/F56Q/K94Q/R97W/R192D-del(V105-I107)-E101T
CsgG-(WT-Y51A/F56Q/K94Q/R97W/R192D-del(V105-I107)-Q114K。
(a)では、変異体は、特徴付けの精度を増加させる一つ以上の修飾を含むことが好ましい。特に(a)では、変異体は、Y130、K135およびS208(Y130など)、K135、S208、Y130およびK135、Y130およびS208、K135およびS208、またはY130、K135およびS208の位置に一つ以上の突然変異(すなわち、これらの位置の一つ以上に突然変異)を含むことが好ましい。変異体は、Y130W/F/H/Q/N、K135L/V/N/Q/SおよびR142Q/Sのうちの一つ以上を含むことが好ましい。これらの置換は、Y130、K135およびS208に対して記載される任意の数および組み合わせで存在してもよい。
(b)では、変異体は、任意の数および組み合わせの置換(1、2、3、4、5、6、7、8、9、10、11または12など)を含みうる。(b)では、変異体は、モノマーを含む膜貫通細孔などに関して(貫通するなど)標的ポリヌクレオチドのより一貫した移動を提供する一つ以上の修飾を含むことが好ましい。特に、(b)では、変異体は、(i)Q87N/R/K、(ii)K94R/F/Y/W/L/S/N、(iii)R97F/Y/W/V/I/K/S/Q/H、(iv)N102K/Q/L/I/V/S/H and(v)R110F/G/Nのうち一つ以上を含むことが好ましい。変異体は、K94DまたはK94Qおよび/またはR97WまたはR97Yを含むことがより好ましい。モノマーを含む膜貫通細孔に対する(貫通するなど)標的ポリヌクレオチドのより一貫した移動を提供する修飾であるその他の好ましい変異体は、(vi)R93WおよびR93Yを含む。好ましい変異体は、R93WおよびR97W、R93YおよびR97W、R93WおよびR97W、またはより好ましくはR93YおよびR97Yを含みうる。
(b)において、変異体は、突然変異体モノマーから構成される細孔が、好ましくはヌクレオチドおよびポリヌクレオチドをより簡単に捕捉するようにする一つ以上の修飾を含むことが好ましい。特に、(b)では、変異体は、(i)D43S、(ii)E44S、(iii)N91K/R、(iv)Q114R/Kおよび(v)D248S/N/Q/K/Rのうちの一つ以上を含むことが好ましい。
(b)では、変異体は、より一貫した移動を提供し、捕捉を増加させる一つ以上の修飾を含むことが好ましい。特に、(b)では、変異体は、Q87R/K、E101I/L/A/HおよびN102K(Q87R/Kなど)、E101I/L/A/H、N102K、Q87R/KおよびE101I/L/A/H、Q87R/KおよびN102K、E101I/L/A/HおよびN102K、またはQ87R/K、E101I/L/A/HおよびN102Kのうち一つ以上を含むことが好ましい。
(b)では、変異体は、特徴付けの精度を増加させる一つ以上の修飾を含むことが好ましい。特に、(a)では、変異体は、F48S/N/Q/Y/W/I/Vを含むことが好ましい。
(b)では、変異体は、特徴付けの精度を増加させ、かつ捕捉を増加させる一つ以上の修飾を含むことが好ましい。特に、(a)では、変異体は、F48H/R/Kを含むことが好ましい。
変異体は、より一貫した移動を提供する(a)および(b)の両方の修飾を含みうる。変異体は、捕捉を増加させる(a)および(b)の両方での修飾を含んでもよい。
本発明は、変異体を含む細孔を使用して、ポリヌクレオチドなどの分析物を特徴付けるためのアッセイのスループットを増加させる配列番号3の変異体を提供する。こうした変異体は、K94、好ましくはK94QまたはK94Nでの突然変異、より好ましくはK94Qでの突然変異を含みうる。その他の有益な突然変異体と組み合わせてK94Q突然変異またはK94N突然変異を含む特定の突然変異体モノマーの例は以下のとおりである:
CsgG-(WT-Y51A/F56Q/R97W/R192D-StrepII)9-K94N
CsgG-(WT-Y51A/F56Q/R97W/R192D-StrepII)9-K94Q。
CsgG細孔を形成するための配列番号3の変異体であるモノマーを使用することで、ポリヌクレオチドなどの分析物を特徴付けるためのアッセイにおける特徴付けの精度が増加されうる。こうした変異体は、F191(好ましくはF191T)での突然変異、V105-I107の欠失、F193-L199またはD195-L199の欠失、および/またはR93および/またはR97(好ましくはR93Y、R97Y、あるいはより好ましくはR97W、R93WまたはR97YおよびR97Yの両方)での突然変異を含む。その他の有益な突然変異体と組み合わせてこれらの突然変異体のうちの一つ以上を含む特定の突然変異体モノマーの例は以下のとおりである:
CsgG-(WT-Y51A/F56Q/R97W/R192D-StrepII)9-del(D195-L199)
CsgG-(WT-Y51A/F56Q/R97W/R192D-StrepII)9-del(F193-L199)
CsgG-(WT-Y51A/F56Q/R97W/R192D-StrepII)9-F191T
CsgG-(WT-Y51A/F56Q/R97W/R192D-del(V105-I107)-StrepII)9
CsgG-(WT-Y51A/F56Q/K94Q/R97W/R192D-del(V105-I107)
CsgG-(WT-Y51A/F56Q/R192D-StrepII)9-R93W
CsgG-(WT-Y51A/F56Q/R192D-StrepII)9-R93W-del(D195-L199)
CsgG-(WT-Y51A/F56Q/R192D-StrepII)9-R93Y/R97Y。
別の実施形態では、配列番号3の変異体は、(A)位置R192、F193、I194、D195、Y196、Q197、R198、L199、L200およびE201の一つ以上の欠失および/または(B)V139/G140/D149/T150/V186/Q187/V204/G205(本明細書ではバンド1と呼ばれる)、G137/G138/Q151/Y152/Y184/E185/Y206/T207(本明細書ではバンド2と呼ばれる)およびA141/R142/G147/A148/A188/G189/G202/E203(本明細書ではバンド3と呼ばれる)のうち一つ以上の欠失を含む。
(A)では、変異体は、任意の数および組み合わせの位置(1、2、3、4、5、6、7、8、9または10など)の欠失を含みうる。(A)では、変異体は、以下の欠失を含むことが好ましい:
- D195、Y196、Q197、R198、およびL199、
- R192、F193、I194、D195、Y196、Q197、R198、L199、およびL200、
- Q197、R198、L199およびL200、
- I194、D195、Y196、Q197、R198およびL199、
- D195、Y196、Q197、R198、L199およびL200、
- Y196、Q197、R198、L199、L200およびE201、
- Q197、R198、L199、L200およびE201、
- Q197、R198、L199、または
- F193、I194、D195、Y196、Q197、R198、およびL199。
変異体は、D195、Y196、Q197、R198およびL199またはF193、I194、D195、Y196、Q197、R198およびL199の欠失を含むことがより好ましい。(B)では、バンド1、バンド2、バンド3、バンド1および2、バンド1および3、バンド2および3、またはバンド1、2および3など、バンド1~3の任意の数および組み合わせが欠失されうる。変異体は、(A)、(B)、または(A)および(B)による欠失を含みうる。
上記の(A)および/または(B)による一つ以上の位置の欠失を含む変異体は、上記および下記で考察される修飾または置換のいずれかをさらに含みうる。配列番号3の欠失位置の後に表示される一つ以上の位置で修飾または置換が行われる場合、修飾または置換の一つ以上の位置の番号付けは、それに応じて調整されなければならない。例えば、L199が欠失されると、E244はE243になる。同様に、バンド1が欠失されると、R192はR186になる。
別の実施形態では、配列番号3の変異体は、(C)位置V105、A106およびI107のうち一つ以上の欠失を含む。(C)による欠失は、(A)および/または(B)による欠失に加えて行うことができる。
上述の欠失は、典型的には、モノマーを含む膜貫通細孔などに関して(貫通するなど)、標的ポリヌクレオチドの移動に関連する雑音を減少させる。結果として、標的ポリヌクレオチドはより正確に特徴付けられうる。
特定の位置で異なるアミノ酸が/記号によって分離される段落では、/記号は「または」を意味する。例えば、Q87R/Kは、Q87RまたはQ87Kを意味する。
ポリヌクレオチドなどの分析物の捕捉の増大を提供する配列番号3の変異体は、T104(好ましくはT104RまたはT104K)での突然変異、N91(好ましくはN91R)での突然変異、E101(好ましくはE101K/N/Q/T/H)での突然変異、位置E44(好ましくはE44NまたはE44Q)での突然変異および/または位置Q42(好ましくはQ42K)での突然変異を含みうる。
配列番号3の異なる位置での突然変異は、任意の可能な方法で組み合わせうる。特に、CsgG細孔内のモノマーは、精度を改善する一つ以上の突然変異、雑音を低減する一つ以上の突然変異、および/または分析物の捕捉を強化する一つ以上の突然変異体を含みうる。
配列番号3の変異体は、以下の一つ以上を備えることが好ましい:(i)N40、D43、E44、S54、S57、Q62、R97、E101、E124、E131、R142、T150およびR192の位置での一つ以上の突然変異体(すなわち、それらの位置のうち一つ以上での突然変異)、例えば、N40、D43、E44、S54、S57、Q62、E101、E131およびT150、またはN40、D43、E44、E101およびE131などの位置での一つ以上の突然変異(すなわち、それらの位置のうち一つ以上での突然変異)、(ii)Y51/N55、Y51/F56、N55/F56またはY51/N55/F56での突然変異、(iii)Q42RまたはQ42K、(iv)K49R、(v)N102R、N102F、N102YまたはN102W、(vi)D149N、D149QまたはD149R、(vii)E185N、E185QまたはE185R、(viii)D195N、D195QまたはD195R、(ix)E201N、E201QまたはE201R、(x)E203N、E203QまたはE203R、および(xi)位置F48、K49、P50、Y51、P52、A53、S54、N55、F56およびS57のうち一つ以上の欠失。変異体は、(i)~(xi)の任意の組み合わせを含みうる。
変異体が、(i)および(iii)~(xi)のいずれか一つを含む場合、Y51、N55、F56、Y51/N55、Y51/F56、N55/F56またはY51/N55/F56など、Y51、N55およびF56のうちの一つ以上での突然変異をさらに含みうる。
(i)では、変異体は、N40、D43、E44、S54、S57、Q62、R97、E101、E124、E131、R142、T150およびR192の任意の数および組み合わせでの突然変異を含みうる。(i)では、変異体は、N40、D43、E44、S54、S57、Q62、E101、E131およびT150の位置に一つ以上の突然変異(すなわち、これらの位置の一つ以上に突然変異)を含むことが好ましい。(i)では、変異体は、N40、D43、E44、E101およびE131の位置に一つ以上の突然変異(すなわち、これらの位置の一つ以上に突然変異)を含むことが好ましい。(i)では、変異体は、S54および/またはS57に突然変異を含むことが好ましい。(i)では、変異体は、(a)S54および/またはS57、(b)Y51、N55、F56、Y51/N55、Y51/F56、N55/F56またはY51/N55/F56)など、Y51、N55およびF56のうち一つ以上での突然変異を含むことがより好ましい。S54および/またはS57が欠失された場合、(xi)では、それ/それらは、(i)では突然変異することができず、その逆も同様である。(i)では、変異体は、T150Iなど、T150での突然変異を含むことが好ましい。別の方法として、変異体は、(a)T150、(b)Y51、N55、F56、Y51/N55、Y51/F56、N55/F56、またはY51/N55/F56など、Y51、N55およびF56のうち一つ以上での突然変異を含むことが好ましい。(i)では、変異体は、Q62RまたはQ62Kなど、Q62での突然変異を含むことが好ましい。別の方法として、変異体は、(a)Q62、(b)Y51、N55、F56、Y51/N55、Y51/F56、N55/F56、またはY51/N55/F56など、Y51、N55およびF56のうち一つ以上での突然変異を含むことが好ましい。変異体は、D43、E44、Q62での突然変異、またはそれらの任意の組み合わせ、D43、E44、Q62、D43/E44、D43/Q62、E44/Q62またはD43/E44/Q62などを含みうる。別の方法として、変異体は、(a)D43、E44、Q62、D43/E44、D43/Q62、E44/Q62またはD43/E44/Q62、(b)Y51、N55、F56、Y51/N55、Y51/F56、N55/F56、またはY51/N55/F56など、Y51、N55およびF56のうち一つ以上での突然変異を含むことが好ましい。
(ii)およびその他の場所では、異なる位置が/記号によって分離されているこの用途の場合、/は「および」を意味し、Y51/N55がY51およびN55であることを意味する。(ii)では、変異体はY51/N55に突然変異を含むことが好ましい。CsgGの収縮は、残基Y51、N55およびF56の側鎖によって形成された3つの積層された同心環から成ることが提案されてきた(Goyal et al、2014、Nature、516、250-253)。従って、(ii)のこれらの残基の突然変異は、ポリヌクレオチドが細孔を通って移動し、それによって観察された電流(ポリヌクレオチドが細孔を通して移動する時)とポリヌクレオチドとの間の直接的関係を識別することを容易にするヌクレオチドの数を減少させうる。F56は、本発明の方法において有用な変異体および細孔を参照しながら、以下で考察した任意の方法で突然変異しうる。
(v)では、変異体は、N102R、N102F、N102YまたはN102Wを含みうる。(i)では、変異体は、(a)N102R、N102F、N102YまたはN102W、ならびに(b)Y51、N55およびF56のうち一つ以上での、例えばY51、N55、F56、Y51/N55、Y51/F56、N55/F56またはY51/N55/F56での突然変異体を含むことが好ましい。
(xi)では、K49、P50、Y51、P52、A53、S54、N55、F56およびS57の任意の数および組み合わせが欠失されうる。K49、P50、Y51、P52、A53、S54、N55およびS57のうちの一つ以上が削除されうることが好ましい。Y51、N55、およびF56のいずれかが(xi)で欠失された場合、それらを(ii)で突然変異させることはできず、その逆も同様である。
(i)では、変異体は、置換N40R、N40K、D43N、D43Q、D43R、D43K、E44N、E44Q、E44R、E44K、S54P、S57P、Q62R、Q62K、R97N、R97G、R97L、E101N、E101Q、E101R、E101K、E101F、E101Y、E101W、E124N、E124Q、E124R、E124K、E124F、E124Y、E124W、E131D、R142E、R142N、T150I、R192EおよびR192Nのうち一つ以上、例えばN40R、N40K、D43N、D43Q、D43R、D43K、E44N、E44Q、E44R、E44K、S54P、S57P、Q62R、Q62K、E101N、E101Q、E101R、E101K、E101F、E101Y、E101W、E131DおよびT150Iのうち一つ以上の、またはN40R、N40K、D43N、D43Q、D43R、D43K、E44N、E44Q、E44R、E44K、E101N、E101Q、E101R、E101K、E101F、E101Y、E101WおよびE131Dのうち一つ以上を含むことが好ましい。変異体は、これらの置換の任意の数および組み合わせを含みうる。(i)では、変異体はS54Pおよび/またはS57Pを含むことが好ましい。(i)では、変異体は、(a)S54Pおよび/またはS57Pならびに(b)Y51、N55およびF56のうち一つ以上での、例えばY51、N55、F56、Y51/N55、Y51/F56、N55/F56またはY51/N55/F56での突然変異体を含むことが好ましい。Y51、N55およびF56のうちの一つ以上での突然変異は、以下に考察されるもののいずれかであってもよい。(i)では、変異体はF56A/S57PまたはS54P/F56Aを含むことが好ましい。変異体はT150Iを含むことが好ましい。別の方法として、変異体は、(a)T150Iおよび(b)Y51、N55およびF56の一つ以上、例えばY51、N55、F56、Y51/N55、Y51/F56、N55/F56またはY51/N55/F56での突然変異を含むことが好ましい。
(i)では、変異体はQ62RまたはQ62Kを含むことが好ましい。あるいは、変異体は(a)Q62RまたはQ62K、および(b)Y51、N55、F56、Y51/F55、Y51/F56、N55/F56、またはY51/N55/F56などのY51、N55およびF56のうちの一つ以上での突然変異を含むことが好ましい。変異体は、D43N、E44N、Q62RまたはQ62Kまたはそれらの任意の組み合わせ、例えばD43N、E44N、Q62R、Q62K、D43N/E44N、D43N/Q62R、D43N/Q62K、E44N/Q62R、E44N/Q62K、D43N/E44N/Q62RまたはD43N/E44N/Q62Kを含みうる。あるいは、変異体は、(a)D43N、E44N、Q62R、Q62K、D43N/E44N、D43N/Q62R、D43N/Q62K、E44N/Q62R、E44N/Q62K、D43N/E44N/Q62RまたはD43N/E44N/Q62K、および(b)Y51、N55、F56、Y51/N55、Y51/F56、N55/F56またはY51/N55/F56など、Y51、N55およびF56のうち一つ以上での突然変異を含むことが好ましい。
(i)では、変異体はD43Nを含むことが好ましい。
(i)では、変異体は、E101R、E101S、E101FまたはE101Nを含むことが好ましい。
(i)では、変異体は、E124N、E124Q、E124R、E124K、E124F、E124Y、E124WまたはE124D(E124Nなど)を含むことが好ましい。
(i)では、変異体はR142EおよびR142Nを含むことが好ましい。
(i)では、変異体はR97N、R97GまたはR97Lを含むことが好ましい。
(i)では、変異体はR192EおよびR192Nを含むことが好ましい。
(ii)では、変異体は、F56N/N55Q、F56N/N55R、F56N/N55K、F56N/N55S、F56N/N55G、F56N/N55A、F56N/N55T、F56Q/N55Q、F56Q/N55R、F56Q/N55K、F56Q/N55S、F56Q/N55G、F56Q/N55A、F56Q/N55T、F56R/N55Q、F56R/N55R、F56R/N55K、F56R/N55S、F56R/N55G、F56R/N55A、F56R/N55T、F56S/N55Q、F56S/N55R、F56S/N55K、F56S/N55S、F56S/N55G、F56S/N55A、F56S/N55T、F56G/N55Q、F56G/N55R、F56G/N55K、F56G/N55S、F56G/N55G、F56G/N55A、F56G/N55T、F56A/N55Q、F56A/N55R、F56A/N55K、F56A/N55S、F56A/N55G、F56A/N55A、F56A/N55T、F56K/N55Q、F56K/N55R、F56K/N55K、F56K/N55S、F56K/N55G、F56K/N55A、F56K/N55T、F56N/Y51L、F56N/Y51V、F56N/Y51A、F56N/Y51N、F56N/Y51Q、F56N/Y51S、F56N/Y51G、F56Q/Y51L、F56Q/Y51V、F56Q/Y51A、F56Q/Y51N、F56Q/Y51Q、F56Q/Y51S、F56Q/Y51G、F56R/Y51L、F56R/Y51V、F56R/Y51A、F56R/Y51N、F56R/Y51Q、F56R/Y51S、F56R/Y51G、F56S/Y51L、F56S/Y51V、F56S/Y51A、F56S/Y51N、F56S/Y51Q、F56S/Y51S、F56S/Y51G、F56G/Y51L、F56G/Y51V、F56G/Y51A、F56G/Y51N、F56G/Y51Q、F56G/Y51S、F56G/Y51G、F56A/Y51L、F56A/Y51V、F56A/Y51A、F56A/Y51N、F56A/Y51Q、F56A/Y51S、F56A/Y51G、F56K/Y51L、F56K/Y51V、F56K/Y51A、F56K/Y51N、F56K/Y51Q、F56K/Y51S、F56K/Y51G、N55Q/Y51L、N55Q/Y51V、N55Q/Y51A、N55Q/Y51N、N55Q/Y51Q、N55Q/Y51S、N55Q/Y51G、N55R/Y51L、N55R/Y51V、N55R/Y51A、N55R/Y51N、N55R/Y51Q、N55R/Y51S、N55R/Y51G、N55K/Y51L、N55K/Y51V、N55K/Y51A、N55K/Y51N、N55K/Y51Q、N55K/Y51S、N55K/Y51G、N55S/Y51L、N55S/Y51V、N55S/Y51A、N55S/Y51N、N55S/Y51Q、N55S/Y51S、N55S/Y51G、N55G/Y51L、N55G/Y51V、N55G/Y51A、N55G/Y51N、N55G/Y51Q、N55G/Y51S、N55G/Y51G、N55A/Y51L、N55A/Y51V、N55A/Y51A、N55A/Y51N、N55A/Y51Q、N55A/Y51S、N55A/Y51G、N55T/Y51L、N55T/Y51V、N55T/Y51A、N55T/Y51N、N55T/Y51Q、N55T/Y51S、N55T/Y51G、F56N/N55Q/Y51L、F56N/N55Q/Y51V、F56N/N55Q/Y51A、F56N/N55Q/Y51N、F56N/N55Q/Y51Q、F56N/N55Q/Y51S、F56N/N55Q/Y51G、F56N/N55R/Y51L、F56N/N55R/Y51V、F56N/N55R/Y51A、F56N/N55R/Y51N、F56N/N55R/Y51Q、F56N/N55R/Y51S、F56N/N55R/Y51G、F56N/N55K/Y51L、F56N/N55K/Y51V、F56N/N55K/Y51A、F56N/N55K/Y51N、F56N/N55K/Y51Q、F56N/N55K/Y51S、F56N/N55K/Y51G、F56N/N55S/Y51L、F56N/N55S/Y51V、F56N/N55S/Y51A、F56N/N55S/Y51N、F56N/N55S/Y51Q、F56N/N55S/Y51S、F56N/N55S/Y51G、F56N/N55G/Y51L、F56N/N55G/Y51V、F56N/N55G/Y51A、F56N/N55G/Y51N、F56N/N55G/Y51Q、F56N/N55G/Y51S、F56N/N55G/Y51G、F56N/N55A/Y51L、F56N/N55A/Y51V、F56N/N55A/Y51A、F56N/N55A/Y51N、F56N/N55A/Y51Q、F56N/N55A/Y51S、F56N/N55A/Y51G、F56N/N55T/Y51L、F56N/N55T/Y51V、F56N/N55T/Y51A、F56N/N55T/Y51N、F56N/N55T/Y51Q、F56N/N55T/Y51S、F56N/N55T/Y51G、F56Q/N55Q/Y51L、F56Q/N55Q/Y51V、F56Q/N55Q/Y51A、F56Q/N55Q/Y51N、F56Q/N55Q/Y51Q、F56Q/N55Q/Y51S、F56Q/N55Q/Y51G、F56Q/N55R/Y51L、F56Q/N55R/Y51V、F56Q/N55R/Y51A、F56Q/N55R/Y51N、F56Q/N55R/Y51Q、F56Q/N55R/Y51S、F56Q/N55R/Y51G、F56Q/N55K/Y51L、F56Q/N55K/Y51V、F56Q/N55K/Y51A、F56Q/N55K/Y51N、F56Q/N55K/Y51Q、F56Q/N55K/Y51S、F56Q/N55K/Y51G、F56Q/N55S/Y51L、F56Q/N55S/Y51V、F56Q/N55S/Y51A、F56Q/N55S/Y51N、F56Q/N55S/Y51Q、F56Q/N55S/Y51S、F56Q/N55S/Y51G、F56Q/N55G/Y51L、F56Q/N55G/Y51V、F56Q/N55G/Y51A、F56Q/N55G/Y51N、F56Q/N55G/Y51Q、F56Q/N55G/Y51S、F56Q/N55G/Y51G、F56Q/N55A/Y51L、F56Q/N55A/Y51V、F56Q/N55A/Y51A、F56Q/N55A/Y51N、F56Q/N55A/Y51Q、F56Q/N55A/Y51S、F56Q/N55A/Y51G、F56Q/N55T/Y51L、F56Q/N55T/Y51V、F56Q/N55T/Y51A、F56Q/N55T/Y51N、F56Q/N55T/Y51Q、F56Q/N55T/Y51S、F56Q/N55T/Y51G、F56R/N55Q/Y51L、F56R/N55Q/Y51V、F56R/N55Q/Y51A、F56R/N55Q/Y51N、F56R/N55Q/Y51Q、F56R/N55Q/Y51S、F56R/N55Q/Y51G、F56R/N55R/Y51L、F56R/N55R/Y51V、F56R/N55R/Y51A、F56R/N55R/Y51N、F56R/N55R/Y51Q、F56R/N55R/Y51S、F56R/N55R/Y51G、F56R/N55K/Y51L、F56R/N55K/Y51V、F56R/N55K/Y51A、F56R/N55K/Y51N、F56R/N55K/Y51Q、F56R/N55K/Y51S、F56R/N55K/Y51G、F56R/N55S/Y51L、F56R/N55S/Y51V、F56R/N55S/Y51A、F56R/N55S/Y51N、F56R/N55S/Y51Q、F56R/N55S/Y51S、F56R/N55S/Y51G、F56R/N55G/Y51L、F56R/N55G/Y51V、F56R/N55G/Y51A、F56R/N55G/Y51N、F56R/N55G/Y51Q、F56R/N55G/Y51S、F56R/N55G/Y51G、F56R/N55A/Y51L、F56R/N55A/Y51V、F56R/N55A/Y51A、F56R/N55A/Y51N、F56R/N55A/Y51Q、F56R/N55A/Y51S、F56R/N55A/Y51G、F56R/N55T/Y51L、F56R/N55T/Y51V、F56R/N55T/Y51A、F56R/N55T/Y51N、F56R/N55T/Y51Q、F56R/N55T/Y51S、F56R/N55T/Y51G、F56S/N55Q/Y51L、F56S/N55Q/Y51V、F56S/N55Q/Y51A、F56S/N55Q/Y51N、F56S/N55Q/Y51Q、F56S/N55Q/Y51S、F56S/N55Q/Y51G、F56S/N55R/Y51L、F56S/N55R/Y51V、F56S/N55R/Y51A、F56S/N55R/Y51N、F56S/N55R/Y51Q、F56S/N55R/Y51S、F56S/N55R/Y51G、F56S/N55K/Y51L、F56S/N55K/Y51V、F56S/N55K/Y51A、F56S/N55K/Y51N、F56S/N55K/Y51Q、F56S/N55K/Y51S、F56S/N55K/Y51G、F56S/N55S/Y51L、F56S/N55S/Y51V、F56S/N55S/Y51A、F56S/N55S/Y51N、F56S/N55S/Y51Q、F56S/N55S/Y51S、F56S/N55S/Y51G、F56S/N55G/Y51L、F56S/N55G/Y51V、F56S/N55G/Y51A、F56S/N55G/Y51N、F56S/N55G/Y51Q、F56S/N55G/Y51S、F56S/N55G/Y51G、F56S/N55A/Y51L、F56S/N55A/Y51V、F56S/N55A/Y51A、F56S/N55A/Y51N、F56S/N55A/Y51Q、F56S/N55A/Y51S、F56S/N55A/Y51G、F56S/N55T/Y51L、F56S/N55T/Y51V、F56S/N55T/Y51A、F56S/N55T/Y51N、F56S/N55T/Y51Q、F56S/N55T/Y51S、F56S/N55T/Y51G、F56G/N55Q/Y51L、F56G/N55Q/Y51V、F56G/N55Q/Y51A、F56G/N55Q/Y51N、F56G/N55Q/Y51Q、F56G/N55Q/Y51S、F56G/N55Q/Y51G、F56G/N55R/Y51L、F56G/N55R/Y51V、F56G/N55R/Y51A、F56G/N55R/Y51N、F56G/N55R/Y51Q、F56G/N55R/Y51S、F56G/N55R/Y51G、F56G/N55K/Y51L、F56G/N55K/Y51V、F56G/N55K/Y51A、F56G/N55K/Y51N、F56G/N55K/Y51Q、F56G/N55K/Y51S、F56G/N55K/Y51G、F56G/N55S/Y51L、F56G/N55S/Y51V、F56G/N55S/Y51A、F56G/N55S/Y51N、F56G/N55S/Y51Q、F56G/N55S/Y51S、F56G/N55S/Y51G、F56G/N55G/Y51L、F56G/N55G/Y51V、F56G/N55G/Y51A、F56G/N55G/Y51N、F56G/N55G/Y51Q、F56G/N55G/Y51S、F56G/N55G/Y51G、F56G/N55A/Y51L、F56G/N55A/Y51V、F56G/N55A/Y51A、F56G/N55A/Y51N、F56G/N55A/Y51Q、F56G/N55A/Y51S、F56G/N55A/Y51G、F56G/N55T/Y51L、F56G/N55T/Y51V、F56G/N55T/Y51A、F56G/N55T/Y51N、F56G/N55T


/Y51Q、F56G/N55T/Y51S、F56G/N55T/Y51G、F56A/N55Q/Y51L、F56A/N55Q/Y51V、F56A/N55Q/Y51A、F56A/N55Q/Y51N、F56A/N55Q/Y51Q、F56A/N55Q/Y51S、F56A/N55Q/Y51G、F56A/N55R/Y51L、F56A/N55R/Y51V、F56A/N55R/Y51A、F56A/N55R/Y51N、F56A/N55R/Y51Q、F56A/N55R/Y51S、F56A/N55R/Y51G、F56A/N55K/Y51L、F56A/N55K/Y51V、F56A/N55K/Y51A、F56A/N55K/Y51N、F56A/N55K/Y51Q、F56A/N55K/Y51S、F56A/N55K/Y51G、F56A/N55S/Y51L、F56A/N55S/Y51V、F56A/N55S/Y51A、F56A/N55S/Y51N、F56A/N55S/Y51Q、F56A/N55S/Y51S、F56A/N55S/Y51G、F56A/N55G/Y51L、F56A/N55G/Y51V、F56A/N55G/Y51A、F56A/N55G/Y51N、F56A/N55G/Y51Q、F56A/N55G/Y51S、F56A/N55G/Y51G、F56A/N55A/Y51L、F56A/N55A/Y51V、F56A/N55A/Y51A、F56A/N55A/Y51N、F56A/N55A/Y51Q、F56A/N55A/Y51S、F56A/N55A/Y51G、F56A/N55T/Y51L、F56A/N55T/Y51V、F56A/N55T/Y51A、F56A/N55T/Y51N、F56A/N55T/Y51Q、F56A/N55T/Y51S、F56A/N55T/Y51G、F56K/N55Q/Y51L、F56K/N55Q/Y51V、F56K/N55Q/Y51A、F56K/N55Q/Y51N、F56K/N55Q/Y51Q、F56K/N55Q/Y51S、F56K/N55Q/Y51G、F56K/N55R/Y51L、F56K/N55R/Y51V、F56K/N55R/Y51A、F56K/N55R/Y51N、F56K/N55R/Y51Q、F56K/N55R/Y51S、F56K/N55R/Y51G、F56K/N55K/Y51L、F56K/N55K/Y51V、F56K/N55K/Y51A、F56K/N55K/Y51N、F56K/N55K/Y51Q、F56K/N55K/Y51S、F56K/N55K/Y51G、F56K/N55S/Y51L、F56K/N55S/Y51V、F56K/N55S/Y51A、F56K/N55S/Y51N、F56K/N55S/Y51Q、F56K/N55S/Y51S、F56K/N55S/Y51G、F56K/N55G/Y51L、F56K/N55G/Y51V、F56K/N55G/Y51A、F56K/N55G/Y51N、F56K/N55G/Y51Q、F56K/N55G/Y51S、F56K/N55G/Y51G、F56K/N55A/Y51L、F56K/N55A/Y51V、F56K/N55A/Y51A、F56K/N55A/Y51N、F56K/N55A/Y51Q、F56K/N55A/Y51S、F56K/N55A/Y51G、F56K/N55T/Y51L、F56K/N55T/Y51V、F56K/N55T/Y51A、F56K/N55T/Y51N、F56K/N55T/Y51Q、F56K/N55T/Y51S、F56K/N55T/Y51G、F56E/N55R、F56E/N55K、F56D/N55R、F56D/N55K、F56R/N55E、F56R/N55D、F56K/N55EまたはF56K/N55Dを含むことが好ましい。
(ii)では、変異体は、Y51R/F56Q、Y51N/F56N、Y51M/F56Q、Y51L/F56Q、Y51I/F56Q、Y51V/F56Q、Y51A/F56Q、Y51P/F56Q、Y51G/F56Q、Y51C/F56Q、Y51Q/F56Q、Y51N/F56Q、Y51S/F56Q、Y51E/F56Q、Y51D/F56Q、Y51K/F56QまたはY51H/F56Qを含むことが好ましい。
(ii)では、変異体は、Y51T/F56Q、Y51Q/F56QまたはY51A/F56Qを含むことが好ましい。
(ii)では、変異体は、Y51T/F56F、Y51T/F56M、Y51T/F56L、Y51T/F56I、Y51T/F56V、Y51T/F56A、Y51T/F56P、Y51T/F56G、Y51T/F56C、Y51T/F56Q、Y51T/F56N、Y51T/F56T、Y51T/F56S、Y51T/F56E、Y51T/F56D、Y51T/F56K、Y51T/F56HまたはY51T/F56Rを含むことが好ましい。
(ii)では、変異体は、Y51T/N55Q、Y51T/N55SまたはY51T/N55Aを含むことが好ましい。
(ii)では、変異体は、Y51A/F56F、Y51A/F56L、Y51A/F56I、Y51A/F56V、Y51A/F56A、Y51A/F56P、Y51A/F56G、Y51A/F56C、Y51A/F56Q、Y51A/F56N、Y51A/F56T、Y51A/F56S、Y51A/F56E、Y51A/F56D、Y51A/F56K、Y51A/F56HまたはY51A/F56Rを含むことが好ましい。
(ii)では、変異体は、Y51C/F56A、Y51E/F56A、Y51D/F56A、Y51K/F56A、Y51H/F56A、Y51Q/F56A、Y51N/F56A、Y51S/F56A、Y51P/F56AまたはY51V/F56Aを含むことが好ましい。
(xi)では、変異体は、Y51/P52、Y51/P52/A53、P50~P52、P50~A53、K49~Y51、K49~A53の欠失および単一のプロリン(P)での置換、K49~S54および単一のPでの置換、Y51~A53、Y51~S54、N55/F56、N55~S57、N55/F56および単一のPでの置換、N55/F56および単一のグリシン(G)での置換、N55/F56および単一のアラニン(A)での置換、N55/F56および単一のPおよびY51Nでの置換、N55/F56および単一のPおよびY51Qでの置換、N55/F56および単一のPおよびY51Sでの置換、N55/F56および単一のGおよびY51Nでの置換、N55/F56および単一のGおよびY51Qでの置換、N55/F56および単一のGおよびY51Sでの置換、N55/F56および単一のAおよびY51Nでの置換、N55/F56および単一のA/Y51Qでの置換、またはN55/F56および単一のAおよびY51Sでの置換を含むことが好ましい。
変異体は、D195N/E203N、D195Q/E203N、D195N/E203Q、D195Q/E203Q、E201N/E203N、E201Q/E203N、E201N/E203Q、E201Q/E203Q、E185N/E203Q、E185Q/E203Q、E185N/E203N、E185Q/E203N、D195N/E201N/E203N、D195Q/E201N/E203N、D195N/E201Q/E203N、D195N/E201N/E203Q、D195Q/E201Q/E203N、D195Q/E201N/E203Q、D195N/E201Q/E203Q、D195Q/E201Q/E203Q、D149N/E201N、D149Q/E201N、D149N/E201Q、D149Q/E201Q、D149N/E201N/D195N、D149Q/E201N/D195N、D149N/E201Q/D195N、D149N/E201N/D195Q、D149Q/E201Q/D195N、D149Q/E201N/D195Q、D149N/E201Q/D195Q、D149Q/E201Q/D195Q、D149N/E203N、D149Q/E203N、D149N/E203Q、D149Q/E203Q、D149N/E185N/E201N、D149Q/E185N/E201N、D149N/E185Q/E201N、D149N/E185N/E201Q、D149Q/E185Q/E201N、D149Q/E185N/E201Q、D149N/E185Q/E201Q、D149Q/E185Q/E201Q、D149N/E185N/E203N、D149Q/E185N/E203N、D149N/E185Q/E203N、D149N/E185N/E203Q、D149Q/E185Q/E203N、D149Q/E185N/E203Q、D149N/E185Q/E203Q、D149Q/E185Q/E203Q、D149N/E185N/E201N/E203N、D149Q/E185N/E201N/E203N、D149N/E185Q/E201N/E203N、D149N/E185N/E201Q/E203N、D149N/E185N/E201N/E203Q、D149Q/E185Q/E201N/E203N、D149Q/E185N/E201Q/E203N、D149Q/E185N/E201N/E203Q、D149N/E185Q/E201Q/E203N、D149N/E185Q/E201N/E203Q、D149N/E185N/E201Q/E203Q、D149Q/E185Q/E201Q/E203Q、D149Q/E185Q/E201N/E203Q、D149Q/E185N/E201Q/E203Q、D149N/E185Q/E201Q/E203Q、D149Q/E185Q/E201Q/E203N、D149N/E185N/D195N/E201N/E203N、D149Q/E185N/D195N/E201N/E203N、D149N/E185Q/D195N/E201N/E203N、D149N/E185N/D195Q/E201N/E203N、D149N/E185N/D195N/E201Q/E203N、D149N/E185N/D195N/E201N/E203Q、D149Q/E185Q/D195N/E201N/E203N、D149Q/E185N/D195Q/E201N/E203N、D149Q/E185N/D195N/E201Q/E203N、D149Q/E185N/D195N/E201N/E203Q、D149N/E185Q/D195Q/E201N/E203N、D149N/E185Q/D195N/E201Q/E203N、D149N/E185Q/D195N/E201N/E203Q、D149N/E185N/D195Q/E201Q/E203N、D149N/E185N/D195Q/E201N/E203Q、D149N/E185N/D195N/E201Q/E203Q、D149Q/E185Q/D195Q/E201N/E203N、D149Q/E185Q/D195N/E201Q/E203N、D149Q/E185Q/D195N/E201N/E203Q、D149Q/E185N/D195Q/E201Q/E203N、D149Q/E185N/D195Q/E201N/E203Q、D149Q/E185N/D195N/E201Q/E203Q、D149N/E185Q/D195Q/E201Q/E203N、D149N/E185Q/D195Q/E201N/E203Q、D149N/E185Q/D195N/E201Q/E203Q、D149N/E185N/D195Q/E201Q/E203Q、D149Q/E185Q/D195Q/E201Q/E203N、D149Q/E185Q/D195Q/E201N/E203Q、D149Q/E185Q/D195N/E201Q/E203Q、D149Q/E185N/D195Q/E201Q/E203Q、D149N/E185Q/D195Q/E201Q/E203Q、D149Q/E185Q/D195Q/E201Q/E203Q、D149N/E185R/E201N/E203N、D149Q/E185R/E201N/E203N、D149N/E185R/E201Q/E203N、D149N/E185R/E201N/E203Q、D149Q/E185R/E201Q/E203N、D149Q/E185R/ E201N/E203Q、D149N/E185R/E201Q/E203Q、D149Q/E185R/E201Q/E203Q、D149R/E185N/E201N/E203N、D149R/E185Q/E201N/E203N、D149R/E185N/E201Q/E203N、D149R/E185N/E201N/E203Q、D149R/E185Q/E201Q/E203N、D149R/E185Q/E201N/E203Q、D149R/E185N/E201Q/E203Q、D149R/E185Q/E201Q/E203Q、D149R/E185N/D195N/E201N/E203N、D149R/E185Q/D195N/E201N/E203N、D149R/E185N/D195Q/E201N/E203N、D149R/E185N/D195N/E201Q/E203N、D149R/E185Q/D195N/E201N/E203Q、D149R/E185Q/D195Q/E201N/E203N、D149R/E185Q/D195N/E201Q/E203N、D149R/E185Q/D195N/E201N/E203Q、D149R/E185N/D195Q/E201Q/E203N、D149R/E185N/D195Q/E201N/E203Q、D149R/E185N/D195N/E201Q/E203Q、D149R/E185Q/D195Q/E201Q/E203N、D149R/E185Q/D195Q/E201N/E203Q、D149R/E185Q/D195N/E201Q/E203Q、D149R/E185N/D195Q/E201Q/E203Q、D149R/E185Q/D195Q/E201Q/E203Q、D149N/E185R/D195N/E201N/E203N、D149Q/E185R/D195N/E201N/E203N、D149N/E185R/D195Q/E201N/E203N、D149N/E185R/D195N/E201Q/E203N、D149N/E185R/D195N/E201N/E203Q、D149Q/E185R/D195Q/E201N/E203N、D149Q/E185R/D195N/E201Q/E203N、D149Q/E185R/D195N/E201N/E203Q、D149N/E185R/D195Q/E201Q/E203N、D149N/E185R/D195Q/E201N/E203Q、D149N/E185R/D195N/E201Q/E203Q、D149Q/E185R/D195Q/E201Q/E203N、D149Q/E185R/D195Q/E201N/E203Q、D149Q/E185R/D195N/E201Q/E203Q、D149N/E185R/D195Q/E201Q/E203Q、D149Q/E185R/D195Q/E201Q/E203Q、D149N/E185R/D195N/E201R/E203N、D149Q/E185R/D195N/E201R/E203N、D149N/E185R/D195Q/E201R/E203N、D149N/E185R/D195N/E201R/E203Q、D149Q/E185R/D195Q/E201R/E203N、D149Q/E185R/D195N/E201R/E203Q、D149N/E185R/D195Q/E201R/E203Q、D149Q/E185R/D195Q/E201R/E203Q、E131D/K49R、E101N/N102F、E101N/N102Y、E101N/N102W、E101F/N102F、E101F/N102Y、E101F/N102W、E101Y/N102F、E101Y/N102Y、E101Y/N102W、E101W/N102F、E101W/N102Y、E101W/N102W、E101N/N102R、E101F/N102R、E101Y/N102RまたはE101W/N102Fを含むことがより好ましい。
ポリヌクレオチドが細孔を通して移動する際に、少なめのヌクレオチドが電流に寄与する細孔を形成する本発明の好ましい変異体は、Y51A/F56A、Y51A/F56N、Y51I/F56A、Y51L/F56A、Y51T/F56A、Y51I/F56N、Y51L/F56NまたはY51T/F56Nを含むか、またはより好ましくはY51I/F56A、Y51L/F56AまたはY51T/F56Aを含む。上述のように、これは、(ポリヌクレオチドが細孔およびポリヌクレオチドを通して移動する時に)観察される電流間の直接的な関係の識別を容易にする。
増加した範囲を表示する細孔を形成する好ましい変異体は、以下の位置での突然変異を含む:
Y51、F56、D149、E185、E201およびE203、
N55およびF56、
Y51およびF56、
Y51、N55およびF56、または
F56およびN102。
増加した範囲を表示する細孔を形成する好ましい変異体は、
Y51N、F56A、D149N、E185R、E201NおよびE203N、
N55SおよびF56Q、
Y51AおよびF56A、
Y51AおよびF56N、
Y51IおよびF56A、
Y51LおよびF56A、
Y51TおよびF56A、
Y51IおよびF56N、
Y51LおよびF56N、
Y51TおよびF56N、
Y51TおよびF56Q、
Y51A、N55SおよびF56A、
Y51A、N55S、およびF56N、
Y51T、N55SおよびF56Q、または
F56QおよびN102R。
ポリヌクレオチドが細孔を通って移動する際に、少ないヌクレオチドが電流に寄与する細孔を形成する好ましい変異体は、以下の位置での突然変異を含む:
N55およびF56(N55XおよびF56Qなど)、ここでXは任意のアミノ酸であり、
Y51およびF56(Y51XおよびF56Qなど)で、ここでXは任意のアミノ酸である。
特に好ましい変異体は、Y51AおよびF56Qを含む。
増加したスループットを表示する細孔を形成する好ましい変形体は、以下の位置での突然変異を含む:
D149、E185およびE203、
D149、E185、E201、およびE203、または
D149、E185、D195、E201、およびE203。
増加したスループットを表示する細孔を形成する好ましい変異体は、
D149N、E185NおよびE203N、
D149N、E185N、E201NおよびE203N、
D149N、E185R、D195N、E201NおよびE203N、または
D149N、E185R、D195N、E201RおよびE203N。
ポリヌクレオチドの捕捉が増大する細孔を形成する好ましい変異体は、以下の突然変異を含む:
D43N/Y51T/F56Q、
E44N/Y51T/F56Q、
D43N/E44N/Y51T/F56Q、
Y51T/F56Q/Q62R、
D43N/Y51T/F56Q/Q62R、
E44N/Y51T/F56Q/Q62R、または
D43N/E44N/Y51T/F56Q/Q62R。
好ましい変異体は以下の突然変異体を含む:
D149R/E185R/E201R/E203RまたはY51T/F56Q/D149R/E185R/E201R/E203R、
D149N/E185N/E201N/E203NまたはY51T/F56Q/D149N/E185N/E201N/E203N、
E201R/E203RまたはY51T/F56Q/E201R/E203R
E201N/E203RまたはY51T/F56Q/E201N/E203R、
E203RまたはY51T/F56Q/E203R、
E203NまたはY51T/F56Q/E203N、
E201RまたはY51T/F56Q/E201R、
E201NまたはY51T/F56Q/E201N、
E185RまたはY51T/F56Q/E185R、
E185NまたはY51T/F56Q/E185N、
D149RまたはY51T/F56Q/D149R、
D149NまたはY51T/F56Q/D149N、
R142EまたはY51T/F56Q/R142E、
R142NまたはY51T/F56Q/R142N、
R192EまたはY51T/F56Q/R192E、または
R192NまたはY51T/F56Q/R192N。
好ましい変異体は以下の突然変異体を含む:
Y51A/F56Q/E101N/N102R、
Y51A/F56Q/R97N/N102G、
Y51A/F56Q/R97N/N102R、
Y51A/F56Q/R97N、
Y51A/F56Q/R97G、
Y51A/F56Q/R97L、
Y51A/F56Q/N102R、
Y51A/F56Q/N102F、
Y51A/F56Q/N102G、
Y51A/F56Q/E101R、
Y51A/F56Q/E101F、
Y51A/F56Q/E101N、または
Y51A/F56Q/E101G
変異体はT150での突然変異をさらに含むことが好ましい。増加した挿入を表示する細孔を形成する好ましい変異体は、T150Iを含む。T150(T150Iなど)での突然変異は、上述の任意の突然変異または突然変異の組み合わせと組み合わされてもよい。
配列番号3の好ましい変異体は、(a)R97Wおよび(b)Y51および/またはF56での突然変異を含む。配列番号3の好ましい変異体は、(a)R97W、および(b)Y51R/H/K/D/E/S/T/N/Q/C/G/P/A/V/I/L/Mおよび/またはF56R/H/K/D/E/S/T/N/Q/C/G/P/A/V/I/L/Mを含む。配列番号3の好ましい変異体は、(a)R97W、および(b)Y51L/V/A/N/Q/S/Gおよび/またはF56A/Q/Nを含む。配列番号3の好ましい変異体は、(a)R97W、および(b)Y51Aおよび/またはF56Qを含む。配列番号3の好ましい変異体は、R97W、Y51AおよびF56Qを含む。
配列番号3の変異体は、R192での突然変異を含むことが好ましい。変異体は、R192D/Q/F/S/T/N/E、R192D/Q/F/S/TまたはR192D/Qを含むことが好ましい。配列番号3の好ましい変異体は、(a)R97W、(b)Y51および/またはF56での突然変異、および(c)R192での突然変異、R192D/Q/F/S/T/N/E、R192D/Q/F/S/TまたはR192D/Qなどを含む。配列番号3の好ましい変異体は、(a)R97W、(b)Y51R/H/K/D/E/S/T/N/Q/C/G/P/A/V/I/L/Mおよび/またはF56 R/H/K/D/E/S/T/N/Q/C/G/P/A/V/I/L/M、および(c)R192での突然変異、R192D/Q/F/S/T/N/E、R192D/Q/F/S/TまたはR192D/Qなどを含む。配列番号3の好ましい変異体は、(a)R97W、(b)Y51L/V/A/N/Q/S/Gおよび/またはF56A/Q/N、および(c)R192での突然変異、R192D/Q/F/S/T/N/E、R192D/Q/F/S/TまたはR192D/Qなどを含む。配列番号3の好ましい変異体は、(a)R97W、(b)Y51Aおよび/またはF56Q、および(c)R192での突然変異、R192 D/Q/F/S/T/N/E、R192D/Q/F/S/TまたはR192D/Qなどを含む。配列番号3の好ましい変異体は、R97W、Y51A、F56QおよびR192D/Q/F/S/TまたはR192D/Qを含む。配列番号3の好ましい変異体は、R97W、Y51A、F56QおよびR192Dを含む。配列番号3の好ましい変異体は、R97W、Y51A、F56QおよびR192Qを含む。特定の位置で異なるアミノ酸が/記号によって分離される段落では、/記号は「または」を意味する。例えば、R192D/Qは、R192DまたはR192Qを意味する。
配列番号3の上記の好ましい変異体のいずれかは、R93での突然変異をさらに含みうる。配列番号3の好ましい変異体は、(a)R93W、および(b)Y51および/またはF56での突然変異、好ましくはY51AおよびF56Qを含む。
配列番号3の上記の好ましい任意の変異体は、K94N/Q突然変異を含みうる。配列番号3の上記の好ましい任意の変異体は、F191T突然変異を含みうる。
CsgGモノマーは、CsgFペプチドへの付着を促進するように修飾されうる。例えば、システイン残基は、配列番号3の位置132、133、136、138、140、142、144、145、147、149、151、153、155、183、185、187、189、191、201、203、205、207および209に対応する一つ以上の位置に、および/またはCsgFと接触してCsgGへの共有結合を促進することが予測される、表4に記載された任意の一つの位置に導入されうる。システイン残基を介した共有結合に対する代替的または追加として、細孔は疎水性相互作用または静電相互作用によって安定化されうる。こうした相互作用を促進するために、配列番号3の位置132、133、136、138、140、142、144、145、147、149、151、153、155、183、185、187、189、191、201、203、205、207および209の一つ以上に対応する位置で、および/またはCsgFと接触することが予測される表4に記載された任意の一つの位置で、非ネイティブ反応性または光反応性アミノ酸が。
好ましい例示的な細孔には、配列番号3に対して以下の突然変異を有する少なくとも一つのCsgGモノマーが含まれる:Y51X/N55X/F56X/N91R/K94Q/R97W/R192D-del(V105-I107)、ここでXはI/V/S/T、XはN/I/V/S/Tおよび/またはXはQ/I/V/S/Tである。
天然のアミノ酸を導入または置換するための方法は、当技術分野で周知である。例えば、メチオニン(M)は、突然変異体モノマーをコードするポリヌクレオチドの関連位置で、メチオニンのコドン(ATG)をアルギニンのコドン(CGT)で置換することによって、アルギニン(R)で置換されうる。次に、ポリヌクレオチドは以下で考察するように発現することができる。
二重細孔
CsgG/CsgF細孔は、第一の細孔および第二の細孔を含む二重細孔であってもよい。少なくとも第一の細孔は、本明細書で開示されているCsgG/CsgF細孔である。第二の細孔は、CsgG細孔またはCsgG/CsgF細孔であってもよい。一実施形態では、第一の細孔および第二の細孔の両方は、本明細書で開示されるようなCsgG/CsgF細孔である。第一および第二の細孔は、同一であっても異なっていてもよい。本明細書に開示される突然変異のいずれかに加えて、二重細孔では、CsgGモノマーは、以下に記載される追加的な突然変異のうちの一つ以上を含みうる。
二重細孔では、第一の細孔は、疎水性の相互作用および/または一つ以上のジスルフィド結合によって、第二のCsgG細孔に付着されうる。第一の細孔および/または第二の細孔内のモノマーのうち一つ以上、2、3、4、5、6、8、9など、例えば、すべてが、こうした相互作用を強化するように修飾されうる。これは、任意の適切な方法で達成されうる。
第一の細孔と第二の細孔との間の界面にある第一の細孔のアミノ酸配列における少なくとも一つのシステイン残基は、第一の細孔と第二の細孔との間の界面における第二の細孔のアミノ酸配列における少なくとも一つのシステイン残基にジスルフィド結合されてもよい。第二の細孔内の第一の細孔および/またはシステイン残基のシステイン残基は、野生型CsgGモノマーに存在しないシステイン残基であってもよい。2、3、4、5、6、7、8または9~16、18、24、27、32、36、40、45、48、54、56または63など、複数のジスルフィド結合は、二つの細孔内の二つの細孔間に形成しうる。第一または第二の細孔の一方または両方は、配列番号3のR97、I107、R110、Q100、E101、N102および/またはL113に対応する位置で第一の細孔と第二の細孔間の界面にシステイン残基を含む、最大8、9または10のモノマーなどの少なくとも一つのモノマーを含んでもよい。
第一の細孔および/または第二の細孔内の少なくとも一つのモノマーにおける少なくとも一つのモノマーは、第一の細孔と第二の細孔間の界面に少なくとも一つの残基を含んでもよく、この残基は野生型CsgGモノマー内の対応する位置に存在する残基よりも疎水性である。例えば、2~10のように、3、4、5、6、7、8、または9の残基は、第一の細孔および/または第二の細孔の残基が、対応する野生型CsgGモノマー内の同じ位置での残基をより疎水性である場合がある。こうした疎水性残基は、二重細孔の二つの細孔間の相互作用を強化する。第一の細孔と第二の細孔との間の界面における少なくとも一つの残基は、配列番号3のR97、I107、R110、Q100、E101、N102およびL113に対応する位置にあってもよい。野生型CsgGモノマー内の界面にある残基がR、Q、NまたはEである場合、疎水性残基は一般的にI、L、V、M、F、WまたはYである。野生型CsgGモノマー内の界面にある残基がIである場合、疎水性残基は一般的にL、V、M、F、WまたはYである。野生型CsgGモノマー内の界面にある残基がLである場合、疎水性残基は一般的にI、V、M、F、WまたはYである。
二重細孔は、細孔間の界面に一つ以上のシステイン残基を含む一つ以上のモノマーを含みうるか、または細孔間の界面において一つ以上の疎水性残基を含むか、またはこうしたシステイン残基およびこうした疎水性残基を含む一つ以上のモノマーを含みうる。例えば、配列番号3のR97、I107、R110、Q100、E101、N102および/またはL113の位置に対応するモノマー内の位置のうち一つ以上(任意の2、3または4など)は、システイン(C)残基を含むことができ、配列番号3のR97、I107、R110、Q100、E101、N102および/またはL113の位置に対応するモノマー内の位置のうち一つ以上(任意の2、3または4など)は、I、L、V、M、F、WまたはYなどの疎水性残基を含みうる。
よって、二重細孔はテール領域内の一つ以上(2、3、4、5、6または7など)の位置にある嵩張る残基を含みうるが、この残基は一般に、第一および第二の細孔の間の界面にあり、野生型CsgGモノマー内の対応する位置にある残基よりも嵩張る。これらの残基の大きさが、二重細孔の第一の細孔と第二の細孔の間の界面で細孔の壁に孔が生じるのを阻止する。第一の細孔と第二の細孔との間の界面における少なくとも一つの嵩張る残基は、一般に、配列番号3のA98、A99、T104、V105、L113、Q114またはS115に対応する位置である。野生型CsgGモノマー内の界面にある残基がAである場合、嵩張る残基は一般にI、L、V、M、F、W、Y、N、Q、SまたはTである。野生型CsgGモノマー内の界面にある残基がTである場合、嵩張る残基は一般にL、M、F、W、Y、N、Q、R、DまたはEである。野生型CsgGモノマー内の界面にある残基がVである場合、嵩張る残基は一般にI、L、M、F、W、Y、N、Qである。野生型CsgGモノマー内の界面にある残基がLである場合、嵩張る残基は一般にM、F、W、Y、N、Q、R、DまたはEである。野生型CsgGモノマー内の界面にある残基がQである場合、嵩張る残基は一般にF、WまたはYである。野生型CsgGモノマー内の界面にある残基がSである場合、嵩張る残基は一般にM、F、W、Y、N、Q、EまたはRである。
第二の細孔が膜の外にある場合、第二の細孔、および随意に第一の細孔は、野生型CsgG細孔のバレル内の電荷と比較してバレル内の負電荷を減少させる、細孔のバレル領域内の残基を含むことが好ましい。これらの突然変異はバレルをより親水性にする。二重細孔の第一の細孔内にある少なくとも一つのモノマーおよび/または第二の細孔内にある少なくとも一つのモノマーは、細孔のバレル領域内の少なくとも一つの残基を含みうるが、この残基は、野生型CsgGモノマー内の対応する位置にある残基よりも負電荷が少ない。バレル内部の電荷は、ポリヌクレオチドなどの負荷電した分析物が、静電気電荷によって細孔に入ることがないように、十分にニュートラルまたは正電荷である。配列番号3のD149、E185、D195、E210および/またはE203に対応する位置にある細孔のバレル領域内の少なくとも一つの残基(2、3、4または5の残基など)は、ニュートラルまたは正荷電されたアミノ酸としうる。配列番号3のD149、E185、D195、E210および/またはE203に対応する位置にある細孔のバレル領域内の少なくとも一つの残基(2、3、4または5の残基など)は、N、Q、RまたはKであることが好ましい。
配列番号3での荷電を除去する突然変異の特定の例は、以下を含む: E185N/E203N、D149N/E185R/D195N/E201R/E203N、D149N/E185R/D195N/E201N/E203N、D149R/E185N/D195N/E201N/E203N、D149R/E185N/E201N/E203N、D149N/E185N/D195/E201N/E203N、D149N/E185N/E201N/E203N、D149N/E185N/E203N、D149N/E185N/E201N、D149N/E203N、D149N/E201N/D195N、D149N/E201N、D195N/E201N/E203N、E201N/E203N、D195N/E203、E203R、E203N、E201R、E201N、D195R、D195N、E185R、E185N、D149RおよびD149N。
第一の細孔内の少なくとも一つのCsgGモノマーは、第一の細孔のバレル領域の収縮部に少なくとも一つの残基を含んでもよく、この残基は、野生型CsgG細孔と比較して収縮部の長さを減らす、維持する、または増やし、および/または第二の細孔内の少なくとも一つのCsgGモノマーは、第二の細孔のバレル領域の収縮部に少なくとも一つの残基を含んでもよく、この残基は、野生型CsgG細孔と比較して収縮部の長さを減らす、維持する、または増やす。第一の細孔内の収縮部の長さおよび/または第二の細孔内の収縮部の長さは、少なくとも野生型細孔と同程度の長さであり、それより長いことがより好ましい。
細孔の長さは、配列番号3の位置K49とF56の間の領域に対応する領域に残基を挿入することによって増大されてもよい。 1~5個(2、3、または4個など)のアミノ酸残基を、配列番号3を参照することにより定義された以下の位置のうち任意の一つ以上の位置に挿入してもよい。K49およびP50、P50およびY51、Y51およびP52、P52およびA53、A53およびS54、S54およびN55および/またはN55およびF56。合計で1~10個(2~8個など)または3~5個のアミノ酸残基がモノマーの配列に挿入されることが好ましい。第一の細孔内のすべてのモノマーおよび/または第二の細孔内のすべてのモノマーは、この領域内に同一数の挿入を持つことが好ましい。挿入された残基は、配列番号3のY51およびN55に対応する残基間のループの長さを増加しうる。挿入された残基は、柔軟性を維持するためのA、S、GまたはT、ループに捻じれを追加するためのP、および/または適用された電位差のもとで分析物が細孔のバレルと相互作用する時に生成される信号に寄与するS、T、N、Q、M、F、W、Y、Vおよび/またはIの任意の組み合わせでもよい。挿入されたアミノ酸は、S、G、SG、SGG、SGS、GS、GSSおよび/またはGSGの任意の組み合わせであってもよい。
二重細孔では、第一の細孔および/または第二の細孔のバレルの収縮部は、分析物の検出または特徴付けに使用した時に、野生型収縮部を持つ第一の細孔または第二の細孔が使用された時と比較して、細孔の性質に影響を及ぼす、少なくとも一つの残基(2、3、4または5個の残基など)を含んでもよく、ここで細孔のバレル領域の収縮部内の少なくとも一つの残基は、配列番号3のY51、N55、Y51、P52および/またはA53に対応する位置にある。少なくとも一つの残基は、配列番号3のF56に対応する位置のQまたはV、配列番号3のY51に対応する位置のAまたはQ、および/または配列番号3のN55に対応する位置のVでもよい。
二重細孔は、第一のCsgG細孔内の少なくとも一つのモノマーおよび/または第二のCsgG細孔内の少なくとも一つのモノマーを含んでもよく、ここで、モノマーは上記に定義された二つ以上の突然変異体を含む。
二重細孔内のCsgGモノマーは、配列番号3のR97、I107、R110、Q100、E101、N102、またはL113に対応する位置にシステイン残基を含みうる。
二重細孔内のCsgGモノマーは、配列番号3のR97、Q100、I107、R110、E101、N102およびL113のうち任意の一つ以上に対応する位置の残基を含んでもよく、この残基は、配列番号3の対応する位置(配列番号68~88の任意の一つに対応する位置など)に存在する残基よりも疎水性であり、ここで、R97および/またはI107に対応する位置にある残基はMであり、R110に対応する位置にある残基はI、L、V、M、WまたはYであり、および/またはE101またはN102に対応する位置にある残基はVまたはMである。Q100に対応する位置にある残基は一般にI、L、V、M、F、WまたはYであり、および/またはL113に対応する位置にある残基は一般にI、V、M、F、WまたはYである。
特定のモノマーは、Y51A、F56Q置換およびR97I/V/L/M/F/W/Y、I107L/V/M/F/W/Y、R110I/V/L/M/F/W/Y、Q100I/V/L/M/F/W/Y、E101I/V/L/M/F/W/Y、N102I/V/L/M/F/W/YおよびL113CI/V/L/M/F/W/Yの組み合わせ、R97I/V/L/M/F/W/YおよびN102I/V/L/M/F/W/Yの組み合わせ、および/またはR97I/V/L/M/F/W/YおよびE101I/V/L/M/F/W/Yの組み合わせを含む、配列番号3に示す配列を有する。I107は、二つの細孔間に疎水性の相互作用をすでに形成している場合がある。
二重細孔内の少なくとも一つの細孔内のCsgGモノマーは、配列番号3のA98、A99、T104、V105、L113、Q114およびS115のうち任意の一つ以上に対応する位置(配列番号68~88のうち任意の一つの対応する位置など)に、配列番号3の対応する位置にある残基よりも嵩張る残基を含みうる。ここで、T104に対応する位置にある残基はL、M、F、W、Y、N、Q、DまたはEであり、L113に対応する位置にある残基はM、F、W、Y、N、G、DまたはEであり、および/またはS115に対応する位置にある残基はM、F、W、Y、N、QまたはEである。A98またはA99に対応する位置にある残基は、一般にI、L、V、M、F、W、Y、N、Q、SまたはTである。V105に対応する位置にある残基はI、L、M、F、W、Y、NまたはQである。Q114に対応する位置にある残基はF、WまたはYである。E210に対応する位置にある残基はN、Q、RまたはKである。
特定のモノマーは、Y51A、F56Q置換および1、2、3、4、5、6または以下の置換のすべてを含む配列番号3に示される配列を持ちうる。A98I/L/V/M/F/W/Y/N/Q/S/T、A99I/L/V/M/F/W/Y/N/Q/S/T、T104N/Q/L/R/D/E/M/F/W/Y、V105I/L/M/F/W/Y/N/Q、L113M/F/W/Y/N/Q/D/E/L/R、Q114Y/F/W、およびS115N/Q/M/F/W/Y/E/R。
二重細孔内にある細孔の少なくとも一つのCsgGモノマーは、配列番号3の対応する位置にある残基(配列番号68~88のうち任意の一つの対応する位置など)よりも少ない負電荷の、D149、E185、D195、E210およびE203のうち任意の一つ以上に対応する位置にある細孔のバレル領域の残基を含んでもよく、ここで、D149、E185、D195および/またはE203に対応する位置にある残基はKである。
二重細孔内にある細孔うちの少なくとも一つのCsgGモノマーは、細孔のバレル領域の収縮部内に少なくとも一つの残基を含んでもよく、この残基は野生型CsgG細孔と比較して収縮部の長さを増加させる。少なくとも一つの残基は、野生型CsgG細孔の収縮部に存在する残基に追加的なものである。
細孔の長さは、配列番号3の位置K49とF56の間の領域に対応する領域に残基を挿入することによって増大されてもよい。1~5個(2、3、または4個など)のアミノ酸残基を、配列番号3を参照することにより定義された以下の位置のうち任意の一つ以上の位置に挿入してもよい。K49およびP50、P50およびY51、Y51およびP52、P52およびA53、A53およびS54、S54およびN55および/またはN55およびF56。合計で1~10個(2~8個など)または3~5個のアミノ酸残基がモノマーの配列に挿入されることが好ましい。挿入された残基は、配列番号3のY51およびN55に対応する残基間のループの長さを増加しうる。挿入された残基は、柔軟性を維持するためのA、S、GまたはT、ループに捻じれを追加するためのP、および/または適用された電位差のもとで分析物が細孔のバレルと相互作用する時に生成される信号に寄与するS、T、N、Q、M、F、W、Y、Vおよび/またはIの任意の組み合わせでもよい。挿入されたアミノ酸は、S、G、SG、SGG、SGS、GS、GSSおよび/またはGSGの任意の組み合わせであってもよい。
二重細孔内の細孔のうち少なくとも一つにあるCsgGモノマーは、対応する野生型モノマー内に存在する残基とは異なる、配列番号3のN55、P52および/またはA53に対応する位置にある細孔のバレル領域の収縮部内の少なくとも一つの残基を含んでもよく、ここで、N55に対応する位置にある残基はVである。
上記の任意の二つ以上の残基は同一のモノマー内に存在してもよい。特に、モノマーは、少なくとも一つのシステイン残基、少なくとも一つの疎水性残基、少なくとも一つの嵩張る残基、少なくとも一つの前記中性または正荷電の残基、および/または収縮部の長さを増加させる少なくとも一つの前記残基を含みうる。
二重細孔内のCsgGモノマーは、第一の細孔および/または第二の細孔のバレルの収縮部は、分析物の検出または特徴付けに使用した時に、野生型収縮部を持つ第一の細孔または第二の細孔が使用された時と比較して、細孔の性質に影響を及ぼす、少なくとも一つ以上の残基(2、3、4または5個の残基など)を追加的に含んでもよく、ここで細孔のバレル領域の収縮部内の少なくとも一つの残基は、配列番号3のY51、N55、Y51、P52および/またはA53に対応する位置にある。少なくとも一つの残基は、配列番号3のF56に対応する位置のQまたはV、配列番号3のY51に対応する位置のAまたはQ、および/または配列番号3のN55に対応する位置のVでもよい。
修飾タンパク質を作製する方法
非天然のアミノ酸を導入または置換するための方法も、当技術分野で周知である。例えば、非天然のアミノ酸は、突然変異体モノマーを発現するために使用されるIVTTシステムに合成アミノアシル-TrNAを含めることによって導入されうる。別の方法として、非天然のアミノ酸は、それらの特定のアミノ酸の合成(すなわち、非天然型)類似体の存在下で、特定のアミノ酸に対する栄養要求性であるE. coli内に突然変異体モノマーを発現することによって導入されてもよい。突然変異体モノマーが部分的なペプチド合成を用いて生成される場合、それらは裸のライゲーションによって生成されうる。
CsgGに由来するモノマーは、例えば、ストレプトアビジンタグの追加により、またはモノマーがそのような配列を自然には含まない細胞からの分泌を促進するシグナル配列の追加により、それらの識別または精製を補助するように修飾されうる。その他の適切なタグについては、以下でより詳細に検討する。モノマーは、明らかなラベルで標識されうる。明らかなラベルは、モノマーが検出されるようにする任意の適切なラベルとしうる。適切なラベルを以下に記載する。
CsgGに由来するモノマーはD-アミノ酸を使用して生成されてもよい。例えば、CsgGに由来するモノマーは、L-アミノ酸とD-アミノ酸の混合物を含みうる。これは、当該タンパク質またはペプチドを産生するための当技術分野で慣習的である。
CsgGに由来するモノマーは、ヌクレオチド差別を促進するための一つ以上の特異的修飾を含有する。CsgGに由来するモノマーは、細孔形成に干渉しない限り、その他の非特異的修飾も含みうる。多数の非特異的側鎖修飾が当技術分野で周知であり、CsgGに由来するモノマーの側鎖になされてもよい。こうした修飾には、例えば、アルデヒドとの反応によるアミノ酸の還元性アルキル化、それに続くNaBHを用いた還元、アセトイミド酸メチルを用いたアミド化、または無水酢酸を用いたアシル化が含まれる。
CsgGに由来するモノマーは、当技術分野で周知の標準的な方法を使用して製造することができる。CsgGに由来するモノマーは、合成的にまたは組み換え型手段によって作製されうる。例えば、モノマーは、in vitro翻訳および転写(IVTT)により合成されうる。細孔およびモノマーを製造するための適切な方法は、国際出願WO 2010/004273、WO 2010/004265またはWO 2010/086603に記載されている。細孔を膜に挿入するための方法は周知である。
細孔内の二つ以上のCsgGモノマーは、互いに共有結合しうる。例えば、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個または少なくとも10個のモノマーが共有結合しうる。共有結合されたモノマーは、同一であっても異なっていてもよい。
モノマーは、随意にリンカーを介して遺伝学的に融合、または、例えば化学架橋剤を介して化学的に融合されてもよい。モノマーを共有結合する方法は、WO2017/149316、WO2017/149317およびWO2017/149318に開示されている。
一部の実施形態では、突然変異体モノマーは化学修飾される。突然変異体モノマーは、任意の方法および任意の部位で化学修飾されうる。突然変異体モノマーは、分子の一つ以上のシステイン(システイン結合)、一つ以上のリジンへの分子の付着、一つ以上の非天然アミノ酸への分子の付着、エピトープの酵素修飾、または末端の修飾によって化学修飾されることが好ましい。こうした修飾を実施するための適切な方法は、当技術分野で周知である。突然変異体モノマーは、任意の分子の付着によって化学修飾されてもよい。例えば、突然変異体モノマーは、染料または発蛍色素分子の付着によって化学修飾されうる。
一部の実施形態では、突然変異体モノマーは、モノマーと標的ヌクレオチド配列または標的ポリヌクレオチド配列とを含む細孔間の相互作用を促進する分子アダプターで化学修飾される。アダプターの存在は、細孔およびヌクレオチド配列またはポリヌクレオチド配列のホストゲスト化学を改善し、それによって突然変異体モノマーから形成される細孔の配列決定能力を改善する。ホストゲスト化学の原理は当技術分野で周知である。アダプターは、ヌクレオチドまたはポリヌクレオチド配列とのその相互作用を改善する細孔の物理的または化学的特性に対する効果を持つ。アダプターは、細孔のバレルまたはチャネルの電荷を変化させるか、またはヌクレオチドまたはポリヌクレオチド配列と特異的に相互作用するか、またはそれに結合して、それによって細孔とのその相互作用を促進しうる。
分子アダプターは、環状分子、シクロデキストリン、雑種形成能力のある種、DNA結合剤またはインターキレーター、ペプチドまたはペプチド類似体、合成ポリマー、芳香族平面分子、正電荷を持つ小さな分子、または水素結合の能力を持つ小分子であることが好ましい。
アダプターは環状であってもよい。環状アダプターは、細孔と同じ対称性を持つことが好ましい。アダプターは、CsgGが、典型的には中央軸の周りに8または9つのサブユニットを有するので、8倍または9倍の対称性を有することが好ましい。これについては、以下で詳細に説明する。
アダプターは一般に、ホストゲスト化学によってヌクレオチド配列またはポリヌクレオチド配列と相互作用する。アダプターは一般に、ヌクレオチド配列またはポリヌクレオチド配列と相互作用する能力を有する。アダプターは、ヌクレオチド配列またはポリヌクレオチド配列と相互作用する能力を有する一つ以上の化学基を含む。一つ以上の化学基は、疎水性相互作用、水素結合、Van der Waal力、π-カチオンの相互作用および/または静電力など、非共有結合相互作用によってヌクレオチドまたはポリヌクレオチド配列と相互作用することが好ましい。ヌクレオチド配列またはポリヌクレオチド配列と相互作用する能力を持つ一つ以上の化学基は、正電荷を帯びていることが好ましい。ヌクレオチド配列またはポリヌクレオチド配列と相互作用する能力を有する一つ以上の化学基は、アミノ基を含むことがより好ましい。アミノ基は、第一炭素原子、第二炭素原子または第三炭素原子に付着することができる。アダプターは、6、7または8アミノ基の環などのアミノ基の環を含むことがさらに好ましい。アダプターは、8個のアミノ基の環を含むことが最も好ましい。プロトン化アミノ基の環は、ヌクレオチド配列またはポリヌクレオチド配列内で負電荷のリン酸基と相互作用してもよい。
細孔内のアダプターの正しい位置決めは、アダプターと突然変異体モノマーを含む細孔との間のホストゲスト化学によって促進されうる。アダプターは、細孔内の一つ以上のアミノ酸と相互作用する能力を持つ一つ以上の化学基を含むことが好ましい。アダプターは、疎水性相互作用、水素結合、Van der Waal力、π-カチオンの相互作用および/または静電力など、非共有結合相互作用によって細孔内の一つ以上のアミノ酸と相互作用することができる一つ以上の化学基を含むことがより好ましい。細孔内の一つ以上のアミノ酸と相互作用することができる化学基は、典型的にはヒドロキシルまたはアミンである。ヒドロキシル基は、第一炭素原子、第二炭素原子または第三炭素原子に付着することができる。ヒドロキシル基は、細孔内の無電荷アミノ酸と水素結合を形成してもよい。細孔とヌクレオチド配列またはポリヌクレオチド配列との間の相互作用を促進する任意のアダプターを使用することができる。
適切なアダプターとしては、シクロデキストリン、環状ペプチド、およびククルビツリルが挙げられるが、これらに限定されない。アダプターは、シクロデキストリンまたはその誘導体であることが好ましい。シクロデキストリンまたはその誘導体は、次の文献に開示される任意のものとしうる:Eliseev, A. V., and Schneider, H-J. (1994) J. Am. Chem. Soc. 116, 6081-6088。アダプターは、ヘプタキス-6-アミノ-β-シクロデキストリン(am-βCD)、6-モノデオキシ-6-モノアミノ-β-シクロデキストリン(am- CD)またはヘプタキス-(6-デオキシ-6-グアニジノ)-シクロデキストリン(gu-βCD)であることがより好ましい。gu-βCD内のグアニジノ基は、am-βCD内の一次アミンよりもずっと高いpKaを有するため、より高く正荷電される。このgu-βCDアダプターは、細孔内のヌクレオチドのドゥエル時間を延長させる、測定された残留電流の精度を増加させる、また高温または低データ取得速度で塩基検出速度を増加させるために使用されうる。
スクシンイミジル3-(2-ピリジルジチオ)プロピオン酸(SPDP)架橋剤が、以下でより詳細に検討されるように使用される場合、アダプターは、ヘプタキス(6-デオキシ-6-アミノ)-6-N-モノ(2-ピリジル)ジチオプロパノイル-β-シクロデキストリンであることが好ましい(amamPDP-βCD)。
より適切なアダプターには、9個の糖単位を含むγ-シクロデキストリンが含まれる(従って、9倍対称性を有する)。γ-シクロデキストリンは、リンカー分子を含有してもよく、または上述のβ-シクロデキストリンの例で使用される修飾糖単位のすべてまたはそれ以上を含むように修飾されてもよい。
分子アダプターは、突然変異体モノマーに共有結合していてもよい。アダプターは、当技術分野で周知の任意の方法を使用して細孔に共有結合されうる。アダプターは通常、化学結合を介して付着される。分子アダプターがシステイン結合を介して付着される場合、一つ以上のシステインは、(例えば、バレル内で)置換によって、突然変異体に導入されることが好ましい。突然変異体モノマーは、突然変異体モノマー内の一つ以上のシステインへの分子アダプターの付着によって化学修飾されうる。一つ以上のシステインは、自然発生的、すなわち、配列番号3において、位置1および/または215であってもよい。別の方法として、突然変異体モノマーは、その他の位置に導入された一つ以上のシステインへの分子の付着によって化学修飾されうる。位置215のシステインは、分子アダプターが、位置1のシステイン、または別の位置に導入されたシステイン以外のその位置に付着しないよう確保するために、例えば、置換によって除去されてもよい。
システイン残基の反応性は、隣接した残基の修飾によって強化されうる。例えば、隣接するアルギニン、ヒスチジンまたはリジン残基の塩基性基は、システインチオール基のpKaをより反応性のS基に変化させる。システイン残基の反応性は、dTNBなどのチオール保護基によって保護されうる。これらは、リンカーが結合する前に、突然変異体モノマーの一つ以上のシステイン残基と反応しうる。
分子は、突然変異体モノマーに直接付着されてもよい。分子は、化学架橋剤またはペプチドリンカーなどのリンカーを使用して突然変異体モノマーに付着されることが好ましい。
適切な化学架橋剤は当技術分野で周知である。好ましい架橋剤には、2,5-ジオキソピロリジン-1-イル3-(ピリジン-2-イルジスルファニル)プロパン酸塩、2,5-ジオキソピロリジン-1-イル4-(ピリジン-2-イルジスルファニル)ブタン酸塩、および2,5-ジオキソピロリジン-1-イル8-(ピリジン-2-イルジスルファニル)オクタン酸塩が含まれる。最も好ましい架橋剤は、スクシンイミジル3-(2-ピリジルジチオ)プロピオン酸塩(SPDP)である。典型的には、分子/架橋剤複合体が突然変異体モノマーに共有結合される前に、分子は二官能性架橋剤に共有結合されるが、二官能性架橋剤/モノマー複合体が分子に結合される前に、二官能性架橋剤を共有結合してモノマーに共有結合することも可能である。
リンカーは、ジチオスレトール(DTT)に対して耐性があることが好ましい。適切なリンカーとしては、ヨードアセトアミドベースおよびマレイミドベースのリンカーが挙げられるが、これらに限定されない。
他の実施形態では、モノマーはポリヌクレオチド結合タンパク質に付着されてもよい。これは、本発明の配列決定の方法で使用されうるモジュール式配列決定システムを形成する。ポリヌクレオチド結合タンパク質については以下で考察する。
ポリヌクレオチド結合タンパク質は、突然変異体モノマーに共有結合していることが好ましい。タンパク質は、当技術分野で周知の任意の方法を使用してモノマーに共有結合されうる。モノマーおよびタンパク質は、化学的に融合または遺伝学的に融合されうる。構成体全体が単一ポリヌクレオチド配列から発現される場合、モノマーおよびタンパク質は遺伝学的に融合される。ポリヌクレオチド結合タンパク質に対するモノマーの遺伝子融合は、WO 2010/004265号で考察される。
ポリヌクレオチド結合タンパク質がシステイン結合を介して取り付けられる場合、一つ以上のシステインが置換によって突然変異体に導入されることが好ましい。一つ以上のシステインは、突然変異または挿入が許容されうることを示す相同体間で低い保存性を持つループ領域に導入されることが好ましい。従って、ポリヌクレオチド結合タンパク質を取り付けるために適切である。こうした実施形態では、位置251にある天然のシステインを取り除くことができる。システイン残基の反応性は、上述のように修飾によって強化されうる。
ポリヌクレオチド結合タンパク質は、突然変異体モノマーまたは一つ以上のリンカーを介して直接結合することができる。分子は、WO 2010/086602号に記載される雑種形成リンカーを使用して、突然変異体モノマーに付着されてもよい。あるいは、ペプチドリンカーを使用してもよい。ペプチドリンカーはアミノ酸配列である。ペプチドリンカーの長さ、柔軟性および親水性は典型的に、モノマーおよび分子の機能を妨害しないように設計される。好ましい可撓性のペプチドリンカーは、セリンアミノ酸、および/またはグリシンアミノ酸など、2~20個分の長さ(4、6、8、10または16個分など)である。より好ましい可撓性のリンカーには、(SG)、(SG)、(SG)、(SG)、(SG)および(SG)が含まれ、ここで、Sはセリンであり、Gはグリシンである。好ましい剛性リンカーは、プロリンアミノ酸2~30個分の長さ(4、6、8、16または24個分)である。より好ましい剛性リンカーは、(P)12を含み、ここで、Pはプロリンである。
化学修飾
突然変異体CsgGモノマーまたはCsgFペプチドは、分子アダプターおよびポリヌクレオチド結合タンパク質で化学修飾されてもよい。
分子(モノマーまたはペプチドが化学修飾されているもの)は、WO 2010/004273、WO 2010/004265、またはWO 2010/086603号に開示されているように、モノマーまたはペプチドに直接取り付けられてもよく、またはリンカーを介して取り付けられてもよい。
CsgGモノマーおよび/またはCsgFペプチドなど本明細書に記載される任意のタンパク質は、例えば、ヒスチジン残基(hisタグ)、アスパラギン酸残基(aspタグ)、ストレプトアビジンタグ、フラグタグ、SUMOタグ、GSTタグ、MBPタグを追加することにより、またはポリペプチドがシグナル配列を自然に含有しない細胞からの分泌を促進するシグナル配列の追加によって、それらの特定または精製を支援するよう修飾されうる。遺伝子タグを導入する代替は、タンパク質上の天然または改変された位置にタグを化学的に反応させることである。この一例は、ゲル-シフト試薬を、タンパク質の外側で改変されたシステインに反応させることである。これは、ヘモリシンヘテロオリゴマーを分離する方法として実証されている(Chem Biol. 1997 Jul、4(7):497-505)。
CsgGモノマーおよび/またはCsgFペプチドなど本明細書に記載される任意のタンパク質は、明らかなラベルで標識されうる。明らかなラベルは、タンパク質が検出されるようにする任意の適切なラベルとしうる。適切なラベルには、蛍光分子、放射性同位体、例えば125I、35S、酵素、抗体、抗原、ポリヌクレオチド、およびビオチンなどのリガンドなどがあるが、これらに限定されない。
CsgGモノマーおよび/またはCsgFペプチドなどの本明細書に記載される任意のタンパク質は、合成的にまたは組み換え型手段によって作製されうる。例えば、タンパク質は、in vitro翻訳および転写(IVTT)により合成されうる。タンパク質のアミノ酸配列は、非天然のアミノ酸を含むか、またはタンパク質の安定性を増加させるように修飾されてもよい。合成手段によってタンパク質が生成されると、こうしたアミノ酸が生成中に導入されうる。タンパク質はまた、合成または組み換えのいずれかの製造の後にも変更されうる。
タンパク質はD-アミノ酸を使用して生成されてもよい。例えば、タンパク質は、L-アミノ酸とD-アミノ酸の混合物を含みうる。これは、当該タンパク質またはペプチドを産生するための当技術分野で慣習的である。
タンパク質は、タンパク質の機能に干渉しない限り、その他の非特異的修飾も含みうる。多数の非特異的側鎖修飾が当技術分野で周知であり、タンパク質の側鎖になされてもよい。こうした修飾には、例えば、アルデヒドとの反応によるアミノ酸の還元性アルキル化、それに続くNaBHを用いた還元、アセトイミド酸メチルを用いたアミド化、または無水酢酸を用いたアシル化が含まれる。
CsgGモノマーおよび/またはCsgFペプチドなどの本明細書に記載される任意のタンパク質は、当技術分野で周知の標準的な方法を使用して製造することができる。タンパク質をコードするポリヌクレオチド配列は、当技術分野の標準的な方法を使用して誘導され、複製されてもよい。タンパク質をコードするポリヌクレオチド配列は、当技術分野の標準技術を使用して細菌宿主細胞内で発現されてもよい。タンパク質は、in situ組み換え型発現ベクターからのポリペプチドの発現によって、細胞内で生成されうる。発現ベクターは随意に、誘導性プロモーターを担持して、ポリペプチドの発現を制御する。これらの方法は、以下の文献に記載がある:Sambrook, J. and Russell, D. (2001). Molecular Cloning: A Laboratory Manual, 3rd Edition. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY。
タンパク質は、タンパク質生成生物体から、または組み換え型発現後に、任意のタンパク質液体クロマトグラフィーシステムによって精製された後で大規模に製造されうる。典型的なタンパク質液体クロマトグラフィーシステムには、FPLC、AKTAシステム、Bio-Cadシステム、Bio-Rad BioLogicシステム、およびGilson HPLCシステムが含まれる。
細孔を生成する方法
第三の態様では、本発明は、in vivoおよびin vitroで、二つ以上の収縮部位を保持するCsgG:修飾CsgG細孔複合体を製造する方法を提供する。一実施形態は、CsgG細孔またはその相同体もしくは突然変異体形態と、修飾CsgFペプチドまたはその相同体もしくは突然変異体とを含む膜貫通細孔複合体を共発現によって生成する方法を提供する。前記方法は、CsgGモノマー(配列番号2で提供される前タンパク質またはその相同体もしくは突然変異体として発現)を発現する工程と、修飾または切断されたCsgFモノマー(どちらも適切な宿主細胞内)を発現して、in vivo複合体細孔を形成させる工程とを含む。前記複合体は、CsgG細孔との複合体を形成する修飾CsgFペプチドを含み、その細孔を追加的なリーダーヘッドに提供する。修飾CsgFペプチドを使用して前記方法によって生成される結果的な細孔複合体は、分析物(特にポリヌクレオチド鎖)の通過を許容するため、核酸配列決定などの標的分析物の特徴付けで細孔複合体を使用するために十分な構造を提供し、また、前記用途で適切な設定で使用される時、前記ポリヌクレオチド配列の読取を改善するための二つ以上のリーダーヘッドを含む。
より具体的には、前記方法で発現される修飾CsgFペプチドは、配列番号8、10、12、または14、またはそれらの相同体に示される前タンパク質を含む。これらの配列は、方法を、細孔複合体内に収縮部位を導入して、CsgGタンパク質細孔に結合して生物学的細孔を獲得することができるCsgF断片に限定する。
CsgGタンパク質およびCsgFタンパク質またはこれに類するものによって形成された単離された細孔複合体を生成する別の方法は、前記モノマーをin vitro再構成して機能的細孔を獲得することに関する。前記方法は、複合体形成を可能にする適切なシステムで、配列番号3またはその相同体もしくは突然変異体で描写された成熟CsgGモノマーを、修飾CsgFペプチドまたはその相同体もしくは突然変異体と接触させる工程を含む。前記システムは、「in vitroシステム」であってもよく、これは前記方法を実行するために少なくとも必要な構成要素および環境を含み、かつ通常の天然の環境外にある生物学的分子、生物体、細胞(または細胞の部分)を使用して、生物体全体を用いて実行できるよりも、より詳細にわたり、より好都合で、またはより効率的な分析を許容するシステムを意味する。in vitroシステムはまた、試験管内に提供される適切な緩衝液組成物を含んでもよく、ここに複合体を形成するための前記タンパク質構成要素が追加される。当業者であれば、前記システムを提供するオプションを認識している。特定の実施形態でin vitro再構成のために、前記方法において適用される前記修飾CsgFペプチドまたはそれに類するものは、配列番号15または配列番号16、またはその突然変異体もしくは相同体を含むペプチドで、これは合成されるか、または組換え生成されうる。あるいは、配列番号40、39、38、または37、15、54、55またはそれらの相同体または突然変異体を含む修飾CsgFペプチドは、前記方法で、CsgGまたはCsgG様細孔と接触させて、細孔複合体を生成するために提供されている。
CsgG/CsgF細孔は、任意の適切な方法で作製することができる。こうした適切な方法の例が記載されている。
一実施形態では、CsgG/CsgF細孔は共発現によって生成されうる。この実施形態では、一つのベクター中でCsgGモノマーポリペプチド(突然変異体ポリペプチドでもよい)をコードする少なくとも一つの遺伝子と、第二のベクター中で少なくとも一つの全長または切断CsgFポリペプチド(突然変異体ポリペプチドでもよい)をコードする遺伝子とが、一緒に形質転換されてタンパク質を発現させ、形質転換された細胞内で複合体を作製しうる。これは、in vivoまたはor in vitroのどちらでもよい。別の方法として、CsgGおよびCsgFのポリペプチドをコードする二つの遺伝子を、単一のプロモーターの制御下、または異なる二つの別個のプロモーター(これらは同じでも異なってもよい)の制御下で一つのベクター内に配置することができる。
別の実施形態では、CsgG/CsgF細孔は、CsgFペプチドとは別個にCsgGモノマーを発現することによって生成される。CsgGモノマーまたはCsgG細孔は、少なくとも一つのCsgGモノマーをコードするベクターで、またはそれぞれがCsgGモノマーを発現する一つ以上のベクターで、形質転換された細胞から精製されてもよい。CsgFペプチドは、少なくとも一つのCsgFペプチドをコードするベクターで形質転換された細胞から精製されてもよい。次に、精製されたCsgGモノマー/細孔をCsgFペプチドと共に培養して、細孔複合体を作製してもよい。
別の実施形態では、CsgGモノマーおよび/またはCsgFペプチドは、in vitro翻訳および転写(IVTT)により別々に生成される。次に、CsgGモノマーをCsgFペプチドと共に培養して、細孔複合体を作製してもよい。この方法の使用は図14に図示されている。
上記の実施形態は、例えば、(i)CsgGがin vivoでかつCsgFがin vivoで産生、(ii)CsgGがin vitroでかつCsgFがin vivoで産生、(iii)CsgGがin vivoでかつCsgFがin vitroで産生、または(iv)CsgGがin vitroでかつCsgFがin vitroで産生されてもよい。
CsgGモノマーおよびCsgFペプチドの一方または両方は、精製を促進するためにタグ付けされうる。精製は、CsgGモノマーおよび/またはCsgFペプチドがタグ付けされていない場合にも実施されうる。当技術分野で知られている方法(例えば、イオン交換、ゲルろ過、疎水性相互作用カラムクロマトグラフィー)は、細孔の構成要素を精製するために単独でまたは異なる組み合わせで使用することができる。
任意の既知のタグを、二つのタンパク質のいずれかで使用することができる。一実施形態では、CsgG:CsgF複合体をCsgG細孔およびCsgFから精製するために二つのタグ精製を使用することができる。例えば、ストレップタグをCsgGで使用することができ、HisタグをCsgFで使用することができ、またはその逆でもよい。これは図13に例証されている。二つのタンパク質が個別に精製され、その後にまとめて混合されてから、ストレップ精製およびHis精製をもう一度行った時、類似した最終結果を得ることができる。
全長CsgFタンパク質がCsgGと複合体を形成する場合、CsgF(図4B)のネックドメインおよびヘッドドメインは、CsgG細孔のβバレルから突き出す。
従って、CsgG細孔および全長CsgFを含む細孔が単一チャネル記録実験で使用された場合、ヘッドドメインは膜への細孔の挿入を妨げるかまたは防止しうる。これらはまた、分析物が細孔を通過するのを妨害する可能性がある。従って、細孔を膜に挿入するとき、βバレルからぶら下がっている可撓性のポリペプチドの数を減らすことができればより良い。複合体のcryo EM構造内で解決されたFCP領域を模倣し、かつ構造上の完全性を維持する、CsgFタンパク質の切断バージョンが、本明細書に提供されている。
CsgG/CsgF細孔は、CsgG細孔を膜に挿入する前、または膜に挿入した後に作製することができる。膜に挿入する前に細孔複合体が作製される時、切断突然変異体が使用されることが好ましい。しかしながら、CsgGおよびCsgG複合体がin situで形成されるように、CsgG細孔を膜に挿入して、その後にCsgFペプチドを追加することもできる。例えば、一つの実施形態では、膜の貫通側にアクセス可能なシステム(例えば、電気生理学測定用のチップまたはチャンバー内)では、複合体がin-situで形成されるように、CsgG細孔が膜に挿入されてから、CsgFペプチドが膜の貫通側から追加されてもよい。CsgG細孔が原位置で形成される任意の実施形態では、より大きなCsgFペプチドを使用してもよい。例えば、CsgFペプチドは、CsgF(配列番号6のおよそ残基36に由来)のネックドメインすべてまたは一部を含んでもよい。一部の実施形態では、CsgFはすべてのネックドメインおよびヘッドドメインの一部(配列番号6の残基36~XX)を含みうる。
複合体を作製する方法および特定の切断のある複合体の安定性に応じて、CsgG:CsgFおよびCsgG:FCP複合体は異なる方法で作製することができる。
一実施形態では、必要な長さにおけるCsgFポリペプチドの切断バージョンが直接使用される。
別の実施形態では、CsgFの全長ポリペプチド、または要求される切断よりも長いもの(複合体を安定に保つのに十分な長さ)が使用され、ここで、プロテアーゼによる切断によって、要求される長さのCsgFペプチドが生成されるように、プロテアーゼ切断部位が挿入されている(例えば、TEV、HRV 3またはその他任意のプロテアーゼ切断部位)。この実施形態では、CsgG/CsgF複合体が形成されると、プロテアーゼが必要な部位でCsGFを切断するために使用される。あるいは、プロテアーゼは、複合体の組立前にCsgFペプチドを生成するために使用されてもよい。
一部のプロテアーゼ部位は、切断後に追加的タグを残す。例えば、TEVプロテアーゼ切断配列はENLYFQSである。TEVプロテアーゼは、QとSの間でタンパク質を切断し、CsgFペプチドのC末端にENLYFQを無傷で残す。図15は、複合体形成後にTEVプロテアーゼを使用して切断されたTEV切断部位を含む修飾CsgFを使用した実施例を示す。別の例として、HRV C3切断部位はLEVLFQGPであり、酵素はQとGの間で切断し、CsgFペプチドのC末端にLEVLFQを無傷で残す。
分析物を特徴付ける方法
さらなる態様では、本発明は、標的分析物の存在、不在、または一つ以上の特性を決定する方法を提供する。方法は、標的分析物が細孔チャネルと関連して(中に入る、または貫通するなど)、移動するように、標的分析物を単離された細孔複合体、または膜貫通細孔(本発明の細孔など)と接触させる工程と、分析物が細孔に関連して移動する時に一つ以上の測定値を取り、それによって分析物の存在、不在または一つ以上の特性を決定する工程とが関与する。標的分析物はまた、テンプレート分析物または対象分析物と呼ばれてもよい。単離された細孔複合体は一般に、7個、8個、9個、または10個のCsgGモノマーなど、少なくとも7個、少なくとも8個、少なくとも9個、または少なくとも10個のモノマーを含む。単離された細孔複合体は、8個または9個の同一のCsgGモノマーを含むことが好ましい。CsgGモノマーのうち一つ以上(2、3、4、5、6、7、8、9または10など)は、化学修飾されることが好ましく、またはCsgFペプチドが化学修飾される。CsgGモノマーまたはその相同体もしくは突然変異体と、修飾CsgFモノマーまたはその相同体もしくは突然変異体などの単離された細孔複合体モノマーは、任意の生物体に由来しうる。分析物はCsgG収縮部を通過した後、CsgF収縮を通過してもよい。別の実施形態では、分析物はCsgF収縮部を通過した後、膜内のCsgG/CsgF複合体の配向に応じてCsgG収縮部を通過してもよい。
方法は、標的分析物の存在、不在、または一つ以上の特性を決定することである。方法は、少なくとも一つの分析物の存在、不在、または一つ以上の特性を決定するためのものであってもよい。本方法は、二つ以上の分析物の存在、不在、または一つ以上の特性を決定することに関連しうる。本方法は、任意の数の分析物(2、5、10、15、20、30、40、50、100以上の分析物など)の存在、不在、または一つ以上の特性を決定することを含みうる。一つ以上の分析物の任意の数の特性(1、2、3、4、5、10以上の特性など)が決定されうる。
細孔複合体のチャネル内、またはチャネルの開口部のいずれかの開口部の近傍にあるの分子の結合は、細孔を通した開放チャネルイオン流に対する効果を有するが、これが細孔チャネルの「分子感知」の本質である。核酸配列決定用途と類似した様式で、開放チャネルイオン流の変化は、電流の変化によって適切な測定技術を用いて測定することができる(例えば、WO 2000/28312およびD. Stoddart et al., Proc. Natl. Acad. Sci., 2010, 106, 7702-7またはWO 2009/077734)。電流の減少によって測定されるイオン流の減少の程度は、細孔内の障害物のサイズ、または細孔の近接さに関する。よって、細孔の中または近くにある対象分子(「分析物」とも呼ばれる)の結合は、検出可能かつ測定可能な事象を提供し、それによって「生物学的センサー」の基礎を形成する。ナノ細孔感知のための適切な分子には、核酸、タンパク質、ペプチド、多糖類および小分子(例えば、医薬品、毒素、サイトカイン、および汚染物質など)などの低分子量または無機化合物(本明細書では、低分子量(例えば、< 900Daまたは< 500Da)の有機または無機の化合物を意味する)を含む。生物分子の存在を検出することは、個別化された薬物開発、医療、診断、ライフサイエンス研究、環境モニタリング、およびセキュリティおよび/または防衛産業における用途がある。
別の態様では、単離された細孔複合体、または野生型または修飾E. coli CsgGナノ細孔またはその相同体もしくは突然変異体と、チャネル収縮を複合体内の細孔に提供する修飾CsgFペプチドとを含む膜貫通細孔複合体は、分子センサーまたは生物学的センサーとして機能しうる。一部の実施形態では、CsgGナノ細孔は、細菌タンパク質(例えば、E. coli, Salmonella typhi)から誘導または単離されてもよい。一部の実施形態では、CsgGナノ細孔を組換え生成することができる。分析物検出の手順は、Howorka et al. Nature Biotechnology (2012) Jun 7、 30(6):506-7に記載がある。検出される分析物分子は、チャネルのいずれかの面に結合してもよく、またはチャネル自体の内腔内に結合してもよい。結合の位置は、感知される分子のサイズによって決定されうる。
標的分析物は、金属イオン、無機塩、ポリマー、アミノ酸、ペプチド、ペプチド、ポリペプチド、タンパク質、ヌクレオチド、オリゴヌクレオチド、ポリヌクレオチド、多糖類、染料、漂白剤、医薬品、診断用薬、娯楽用薬物、爆薬、有毒化合物、環境汚染物質が好ましい。本方法は、二つ以上のタンパク質、二つ以上のヌクレオチド、または二つ以上の医薬品など、同じタイプの二つ以上の分析物の存在、不在、または一つ以上の特性を決定することに関連しうる。別の方法として、方法は、一つ以上のタンパク質、一つ以上のヌクレオチド、および一つ以上の医薬品など、異なるタイプの二つ以上の分析物の存在、不在、または一つ以上の特性を決定することに関連しうる。
標的分析物は細胞から分泌されうる。あるいは、標的分析物は、方法を実行する前に分析物を細胞から抽出されなければならないように、細胞内に存在する分析物であってもよい。
野生型の細孔は、センサーとして作用してもよいが、感知される分子の結合強度、結合位置、または結合の特異性を増大させるために、組み換え方法または化学的方法を介して修飾されることがよくある。典型的な修飾には、感知される分子の構造に対して相補的な特異的結合部分の添加が含まれる。分析物分子が核酸を含む場合、この結合部分はシクロデキストリンまたはオリゴヌクレオチドを含んでもよく、小分子の場合には、これは補足的な結合領域、例えば、単一鎖可変断片(scFv)領域またはT細胞受容体(TCR)由来の抗原認識ドメインを含む、抗体分子または非抗体分子の抗原結合部分でもよく、またタンパク質の場合には、標的タンパク質の既知のリガンドでもよい。このようにして、野生型または修飾E. coli CsgGナノ細孔またはその相同体は、適切な抗原(エピトープを含む)の試料中の存在を検出する分子センサーとして作用する能力を与えることができ、抗原には、細胞表面抗原(受容体、固形腫瘍細胞、または血液がん細胞(例えば、リンパ腫もしくは白血病)のマーカー)、ウイルス性抗原、細菌性抗原、原生動物性抗原、アレルゲン、アレルギー関連分子、アルブミン(例えば、ヒト、齧歯類、またはウシ)、蛍光分子(フルオレセインを含む)、血液型抗原、小分子、薬物、酵素、酵素の触媒部位または酵素基質、および酵素基質の遷移状態の類似体が含まれうる。上述のように、修飾は、既知の遺伝子工学および組み換えDNA技術を使用して達成されうる。任意の適合の位置決めは、感知される分子の性質、例えば、サイズ、三次元構造、およびその生化学的性質に依存する。適合された構造の選択は、計算的構造設計を使用してもよい。タンパク質-タンパク質相互作用またはタンパク質-小分子相互作用の決定および最適化は、表面プラズモン共鳴を使用した分子相互作用を検出するBIAcore(登録商標)などの技術を使用して調査できる(BIAcore, Inc., Piscataway, NJ、www.biacore.comも参照)。
一実施形態では、分析物はアミノ酸、ペプチド、ポリペプチドまたはタンパク質である。アミノ酸、ペプチド、ポリペプチド、またはタンパク質は、天然のものでも非天然でもよい。ポリペプチドまたはタンパク質は、それらの合成アミノ酸または修飾アミノ酸内に含まれうる。アミノ酸に対するいくつかの異なるタイプの修飾が当技術分野で既知である。適切なアミノ酸およびその修飾は上記のとおりである。当然のことながら、標的分析物は当技術分野で利用可能な任意の方法によって修飾されうる。
別の実施形態では、分析物は核酸などのポリヌクレオチドであり、これは二つ以上のヌクレオチドを含む巨大分子として定義される。核酸はナノ細孔配列決定に特に適している。DNAおよびRNAにおける天然の核酸塩基は、その物理的サイズによって区別されうる。核酸分子または個別の塩基がナノ細孔のチャネルを通過する時、塩基間のサイズ差はチャネルを通るイオン流量の直接相関する減少を引き起こす。イオン流の変動は記録されてもよい。イオン流の変動を記録するための適切な電気測定技術は、例えば、WO 2000/28312 and D. Stoddart et al., Proc. Natl. Acad. Sci., 2010, 106, pp 7702-7(単一チャネル記録機器)、および例えば、WO 2009/077734(マルチチャネル記録技術)に記載がある。適切な較正をすることで、イオン流の特性減少を使用して、リアルタイムでチャネルを特定のヌクレオチドおよび関連する塩基を特定することができる。典型的なナノ細孔核酸配列決定では、対象の核配列の個別ヌクレオチドがヌクレオチドによるチャネルの部分的閉塞によってナノ細孔のチャネルを逐次的に通過する時、開放チャネルイオン流が減少する。上述の適切な記録技術を使用して測定されるのは、イオン流のこの減少である。イオン流の減少は、チャネルを通過する既知のヌクレオチドに対する測定されたイオン流の減少に対して較正されてもよく、これが、どのヌクレオチドがチャネルを通過しているかを決定する手段となり、従って、順次実行される時、ナノ細孔を通過する核酸のヌクレオチド配列を決定する方法となる。個別のヌクレオチドの正確な決定については、収縮部(または「リーディングヘッド」)を通過する個別のヌクレオチドのサイズが、チャネルを通るイオン流の減少と直接相関していることが一般的には必要とされる。当然のことながら、配列決定は、例えば、関連するポリメラーゼの作用を介して、細孔を通して「通された」無傷の核酸ポリマーによって実施されてもよい。あるいは、配列は、細孔に近接して標的核酸から逐次的に除去されたヌクレオチド三リン酸塩基の通過によって決定されてもよい(例えば、WO 2014/187924を参照)。
ポリヌクレオチドまたは核酸は、任意のヌクレオチドの任意の組み合わせを含みうる。ヌクレオチドは天然または人工でありうる。ポリヌクレオチドの一つ以上のヌクレオチドを酸化またはメチル化することができる。ポリヌクレオチドの一つ以上のヌクレオチドが損傷を受けうる。例えば、ポリヌクレオチドはピリミジン二量体を含みうる。こうした二量体は典型的には、紫外線による損傷と関連付けられ、皮膚黒色腫の主要原因である。ポリヌクレオチド内の一つ以上のヌクレオチドは、例えば、当業者によって知られている適切な例であるラベルまたはタグを用いて修飾されてもよい。ポリヌクレオチドは、一つ以上のスペーサーを含みうる。ヌクレオチドは典型的には、核酸塩基、糖および少なくとも一つのリン酸基を含む。核酸塩基および糖はヌクレオシドを形成する。核酸塩基は典型的には複素環式である。核酸塩基には、プリンおよびピリミジンおよびより具体的にはアデニン(A)、グアニン(G)、チミン(T)、ウラシル(U)およびシトシン(C)が含まれるが、これらに限定されない。糖は典型的にはペントース糖である。ヌクレオチド糖には、リボースおよびデオキシリボースが含まれるが、これらに限定されない。糖はデオキシリボースであることが好ましい。ポリヌクレオチドは、デオキシアデノシン(dA)、デオキシウリジン(dU)および/またはチミジン(dT)、デオキシグアニオシン(dG)およびデオキシシチジン(dC)を含むことが好ましい。ヌクレオチドは典型的にはリボヌクレオチドまたはデオキシリボヌクレオチドである。ヌクレオチドは典型的には、モノリン酸、二リン酸塩または三リン酸塩を含有する。ヌクレオチドは、3つ以上のリン酸(4または5個のリン酸など)を含んでもよい。リン酸は、ヌクレオチドの5’側または3’側に取り付けられてもよい。ポリヌクレオチド内のヌクレオチドは、任意の方法で互いに取り付けられてもよい。ヌクレオチドは典型的には、核酸の中のその糖およびリン酸基によって取り付けられる。ヌクレオチドは、ピリミジン二量体の中のその核酸塩基を介して接続されてもよい。ポリヌクレオチドは、一本鎖または二本鎖であってもよい。ポリヌクレオチドの少なくとも一部分は二本鎖であることが好ましい。ポリヌクレオチドは、リボ核酸(RNA)またはデオキシリボ核酸(DNA)であることが最も好ましい。特に、ポリヌクレオチドを分析物として使用する前記方法は、(i)ポリヌクレオチドの長さ、(ii)ポリヌクレオチドの同一性、(iii)ポリヌクレオチドの配列、(iv)ポリヌクレオチドの二次構造および(v)ポリヌクレオチドが修飾されているかどうかから選択される一つ以上の特性を決定する工程を含む。
ポリヌクレオチドは任意の長さ(i)とすることができる。例えば、ポリヌクレオチドの長さは、少なくとも10、少なくとも50、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも400、または少なくとも500個分のヌクレオチドまたはヌクレオチド対とすることができる。ポリヌクレオチドの長さは、1000以上のヌクレオチドまたはヌクレオチド対、5000以上のヌクレオチドまたはヌクレオチド対、または長さが100000以上のヌクレオチド対でありうる。任意の数のポリヌクレオチドを調査できる。例えば、方法は、2、3、4、5、6、7、8、9、10、20、30、50、100以上のポリヌクレオチドを特徴付けることに関連しうる。二つ以上のポリヌクレオチドが特徴付けられる場合、それらは異なるポリヌクレオチドまたは二つの同じポリヌクレオチドの例でありうる。ポリヌクレオチドは天然または人工でありうる。例えば、方法を使用して、製造されたオリゴヌクレオチドの配列を検証してもよい。この方法は通常、in vitroで実行される。
ヌクレオチドは、任意の同一性(ii)を有することができ、アデノシン一リン酸(AMP)、グアノシン一リン酸(GMP)、チミジン一リン酸(TMP)、ウリジン一リン酸(UMP)、5-メチルシチジン一リン酸、5-ヒドロキシメチルシトシン一リン酸、シチジン一リン酸(CMP)、環状アデノシン一リン酸(cAMP)、環状グアノシン一リン酸(cGMP)、デオキシアデノシン一リン酸(dAMP)、デオキシグアノシン一リン酸(dGMP)、デオキシチミジン一リン酸(dTMP)、デオキシウリジン一リン酸(dUMP)、デオキシシチジン一リン酸(dCMP)およびデオキシメチルシチジン一リン酸を含むが、これに限定されない。ヌクレオチドは、AMP、TMP、GMP、CMP、UMP、dAMP、dTMP、dGMP、dCMPおよびdUMPから選択されることが好ましい。ヌクレオチドは、脱塩基であってもよい(すなわち、核酸塩基を欠く)。ヌクレオチドはまた、核酸塩基および糖を欠いてもよい(すなわち、C3スペーサーである)。ヌクレオチド(iii)の配列は、鎖の5’から3’方向にポリヌクレオチド株を通して互いに結合した以下のヌクレオチドの連続した同一性によって決定される。
CsgG細孔およびCsgFペプチドを含む細孔は、ホモポリマー分析において特に有用である。例えば、細孔を使用して、同一の連続したヌクレオチドなど、二つ以上のポリヌクレオチド、例えば、少なくとも3、4、5、6、7、8、9または10などのポリヌクレオチドの配列を決定してもよい。例えば、細孔は、polyA、polyT、polyGおよび/またはpolyC領域を含むポリヌクレオチドを配列するために使用されてもよい。
CsgG細孔収縮は、配列番号3の51、55、および56位置での残基で作製される。CsgGのリーダーヘッドおよびその収縮突然変異体は一般的に鋭利である。DNAが収縮部を通過する時、任意の所与の時点での細孔のリーダーヘッドとおよそ5塩基の相互作用が電流信号を支配する。これらの鋭利なリーダーヘッドは、DNA(A、T、GおよびCが混合された時)の読み出し混合配列領域で非常に良好であるが、DNA(例えば、polyT、polyG、polyA、polyC)内にホモポリマー領域がある場合、信号は平坦になり、情報が欠如する。5つの塩基はCsgGおよびその収縮突然変異体の信号を支配するため、追加的なドウェル時間情報を使用せずに5より長い光ポリマーを差別するのが困難である。ところが、DNAが第2のリーダーヘッドを通過する場合、多くのDNA塩基が組み合わされたリーダーヘッドと相互作用し、差別され得るホモポリマーの長さを延長する。例および図面は、CsgG細孔およびCsgFペプチドを含む細孔を使用して、ホモポリマー配列決定精度のこうした増大が達成されることを示す。
キット
さらなる態様では、本発明は標的ポリヌクレオチドを特徴付けるためのキットも提供する。キットは、本発明による単離された細孔複合体と、膜構成要素または絶縁層を含む。膜は構成要素から形成されることが好ましい。単離された細孔複合体は、膜または絶縁層内に存在することが好ましく、まとめて膜貫通細孔複合体チャネルを形成する。キットは、両親媒性層またはトリブロック共重合体膜などの任意のタイプの膜の構成要素を含みうる。キットはポリヌクレオチド結合タンパク質をさらに含んでもよい。キットは、ポリヌクレオチドを膜に結合するための一つ以上のアンカーをさらに含みうる。キットは、上述の実施形態のいずれかを実行することを可能にする一つ以上の他の試薬または測定器を追加的に含みうる。こうした試薬または器具は、適切な緩衝液(水溶液)、対象から試料を獲得する手段(容器または針を含む器具など)、ポリヌクレオチドまたは電圧またはパッチクランプ装置を増幅および/または発現させる手段のうちの一つ以上を含む。試薬は、流体試料が試薬を再懸濁するように、乾燥状態でキット内に存在してもよい。キットはまた、随意に、キットが本発明の方法で使用されることを可能にする説明書、または方法でどの生物体が使用されうるのかに関する詳細を含みうる。最後に、キットはペプチド特徴付けに有用な追加的構成要素も含みうる。
一実施形態では、本発明により提供される単離された細孔複合体または膜貫通細孔複合体は、核酸配列決定に使用される。前記使用のために、Phi29 DNAポリメラーゼ(DNAP)を、膜内に位置するCsgG:CsgFナノ細孔複合体とともに用いて、細孔を通るオリゴマープローブDNA鎖の制御された移動を可能にしてもよい。電圧は、細孔およびナノ細孔の両側の塩溶液中のイオンの移動から生成される電流を横切って適用されうる。プローブDNAが細孔を通って移動するにつれて、細孔がDNAに関してイオン流が変化する。この情報は配列に依存することが示され、プローブの配列を現在の測定値から正確に読み取ることができるようにする。
特定の実施形態、特定の構成および/または分子は、本発明による操作された細胞および方法について本明細書に記載してきたが、本発明の範囲および趣旨から逸脱することなく、形態および詳細における様々な変更または修飾を行うことができることが理解されるべきである。以下の実施例は、特定の実施形態をよりよく説明するために提供されており、用途を限定すると考えられるべきではない。用途は特許請求の範囲によってのみ限定される。
はじめに
CsgG細孔は、多構成要素タイプVIII分泌システムの一部であり、これはcurli生合成システムとしても知られており、これはE. coliにおいてcurliとして知られる凝集繊維の形成を引き起こす。Curliは、細菌バイオフィルム形成および非生物性表面への付着に主に関与する細胞外タンパク質繊維である。curli生合成は、E. coli内のcsgBACおよびcsgDEFG(curli特異的遺伝子)(Hammar et al., 1995)と呼ばれる二つのオペロンの指示による。CurliのサブユニットCsgAおよびCsgBの分泌は、外膜内にオリゴマー分泌チャネルを形成することが分かっている専用のリポタンパク質であるCsgGに依存する。輸送のために、CsgGは、ペリプラズムアクセサリータンパク質および細胞外アクセサリータンパク質CsgEおよびCsgGと連携して作用する。CsgEは、CsgG媒介性輸送のための特異性因子を形成する一方、CsgFはCsgBテンプレート化された凝集へのCsgA分泌を細胞外繊維に結合させるようである。
CsgG分泌チャネルの結晶構造は、CsgGがOMを横断し、内径40 Åの36鎖のβ-バレルを貫通する直径120 Åおよび高さ85 Åの九量体輸送複合体を形成することを示した(Goyal et al., 2014、図1)。膜貫通β-バレルからアイリス様の隔膜によって分離されたチャネルのペリプラズムドメインは、24,000 Åの大きな溶媒アクセス可能な空洞を形成する。この隔膜は、各サブユニット内に存在する12残基「収縮ループ」(CL)によって形成され、CsgGオリゴマーの同心組織は溶剤を除外した直径約0.6 nmと高さ約1.5 nmのオリフィスを形成する(図1)。タンパク質分泌チャネルとして作用する時、CsgGチャネル内のこのオリフィスまたは収縮部は、転位ポリペプチドとの相互作用の主要部位を形成する。CsgGがナノ細孔感知プラットフォームとして使用される場合、このオリフィスは、チャネル内に存在するか、または流路を通過する分析物の主要リーダーヘッドの役割を果たす。オリフィスの直径ならびにその物理的および化学的特性は、配列番号3の残基46~61に対応するタンパク質の領域におけるアミノ酸置換、欠失、または挿入によって修飾されうる(図1D)。特に、配列番号3による位置51、55、および56の突然変異は、まとめてまたは独立して、ナノ細孔のコンダクタンス特性およびポリヌクレオチドを含む分析物とのその相互作用に有益な影響を有する。
集合因子CsgFは、curli分泌装置の構成要素を表す。CsgF前タンパク質は、SEC経路を介してペリプラズムに達し、その後、CsgGに依存する形で成熟CsgF(12.9 KDa)が表面が晒されたタンパク質として見出された。CsgGの存在下では、CsgFはOMで断片化し、共免疫沈降実験は、二つのタンパク質が直接接触状態にあることを示唆している。利用可能なデータは、CsgFは生産的サブユニット分泌に不可欠ではなく、むしろタンパク質が、CsgBサブユニットの各形成機能を調整または監視することにより、CsgA分泌と細胞外重合との間の結合因子をcurli繊維内に形成することを示唆している。
[実施例1]
CsgG:CsgF複合体タンパク質の産生(CsgF合成ペプチドを用いたCsgGの共発現、in vitro再構成、in-vitro転写および翻訳の結合、およびCsgF合成ペプチドとのCsgG再構成)
CsgG:CsgF複合体を産生するために、両方のタンパク質は、適切なグラム陰性宿主(E. coliなど)内で共発現して、外膜から複合体として抽出し、精製されうる。このCsgG細孔およびCsgG:CsgF複合体のin vivo形成は、外膜へのタンパク質の標的化を必要とする。そのためには、CsgGはリポタンパク質シグナルペプチド(Juncker et al. 2003, Protein Sci. 12(8): 1652-62)と、成熟タンパク質(配列番号3)のN末端位置にあるCys残基とを伴う、プレプロタンパク質として発現される。このようなリポタンパク質シグナルペプチドの例は、配列番号2に示す全長E. coli CsgGの1~15残基である。プレプロCsgGの処理は、シグナルペプチドの切断および成熟CsgGの脂質化をもたらし、その後、成熟リポタンパク質が外膜に移動し、そこで、オリゴマー細孔として挿入される(Goyal et al. 2014, Nature 516(7530):250-3)。CsgG:CsgF複合体を形成するために、CsgFは、CsgGと共発現して、配列番号5の残基1~19に対応するネイティブのシグナルペプチドなど、リーダー配列によって、ペリプラズムに標的化されうる。次に、CsgG:CsgF組み合わせ細孔は、洗浄剤を使用して外膜から抽出し、クロマトグラフィーによって均質な複合体に精製することができる(図2)。
別の方法として、CsgG:CsgF細孔複合体は、CsgG細孔およびCsgFを使用したin vitro再構成によって産生されうる。下記および図3を参照。
図2に示す例のin vivo CsgG:CsgF複合体形成について、ネイティブのシグナルペプチドを使用して、E. coli CsgF(配列番号5)およびCsgG(配列番号2)が共発現され、両方のタンパク質のペリプラズム標的化、およびCsgGのN末端脂質化を確保した。さらに、精製を容易にするために、CsgFは、C末端6xヒスチジンタグを導入し、CsgGをC末端でストレップ-IIタグに融合することにより修飾された。共発現および複合体精製は、方法に記載されるとおりに実施された。His親和性精製溶出物のSDS-PAGE分析により、CsgF-Hisの濃縮と、CsgG-Strepの共精製が明らかになり、後者はCsgFを伴う複合体内にあったことが示唆された(図2B)。さらに、SDS-PAGEは、タンパク質のN末端断片の損失のために、溶出されたCsgFの著しい画分が低分子量で実施されることを明らかにした(図2B、星印で示す)。第二の親和性精製のHisトラップ溶出物のプールされた画分のSDS-PAGE分析は、見かけの等モル濃縮物内のCsgGおよびCsgFの存在ならびにHis-トラップ溶出物で見られたCsgF切断断片の損失を明らかにした(図2B)。ストレップ-親和性精製におけるCsgFの共溶出は、タンパク質がCsgGと非共有結合複合体として存在することを示した。特筆すべきことに、CsgFのN末端切断断片がストレップ-親和性精製で失われ、CsgGを結合するにはCsgF N末端が必要があることが示唆されている(図2B)。
図13は、in vivo共発現によるCsgG:CsgF複合体形成の別の例を示す。この例では、CsgGAタンパク質はC末端ストレップ-IIタグで修飾され、CsgG全長タンパク質はC末端10Xヒスチジンタグで修飾される。共発現CsgG:CsgF複合体は、分析物の特徴付けについての材料および方法セクションに示すように、ストレップタグ精製により、続いてヒスチジンタグ精製により、その成分構成要素からその成分構成要素から分離されて精製された。分子量の差異により、CsgG:CsgF複合体は、SDS-PAGE分析内のCsgG細孔から明確に差別化されることができる(図13A)。図13Bに示すように、二つのタグ精製方法を首尾よく適用して、CsgG:CsgF複合体をその成分構成要素から分離して精製することができる。
in vitro再構成によってCsgG:CsgF複合体を製造するために、CsgGおよびCsgFが、それぞれpPG1およびpNA101を用いて形質転換された別々のE. coli培養内で発現され、精製された後、CsgG:CsgF複合体のin vitro再構成をした(方法を参照)。比較のために、精製されたCsgGは、複合体としてSuperose 6カラム上で同様に実施された。CsgG Superose 6の実行は、九量体CsgG細孔(図3A(a)および3C)と、九量体CsgG細孔の二量体(図3A(b)および3C)に対応する二つの不連続の集団の存在を明らかにした(Goyal et al.で前に説明したとおり)。(2014)。CsgG:CsgF再構成のSuperose 6実行は、過剰なCsgF(図3A(c))、九量体のCsgG:CsgF複合体(図3A(d))および九量体のCsgG:CsgFの二量体(図3A(e))に対応する3つの個別群の存在を明らかにした。CsgG:CsgF複合体の形成について独立的に確認をするために、様々なSuperose 6溶出ピークをネイティブPAGE(図3B)で分析した。
意外にも、CsgG:CsgF複合体は、分析物の特徴付けのための材料および方法セクションに記載のあるin vitro 転写および翻訳(IVTT)結合方法によっても作製されうる。複合体は、同じIVTT反応においてCsgGタンパク質およびCsgFタンパク質を発現するか、または二つの異なるIVTT反応で、CsgGおよびCsgFを別々に再構成するかのどちらかによって作製することができる。図14に示す実施例では、循環DNA用のE. coli T7-S30抽出システム(Promega社)を使用して、一つの反応混合物中でCsgG:CsgF複合体を作製し、タンパク質をSDS-PAGEで分析した。IVTTのタンパク質発現はタンパク質発現の天然分子機械を使用していないため、IVTTにおいてタンパク質を発現するために使用されるDNAは、シグナルペプチド領域をコードするDNAを欠いている。CsgFのDNAがCSTTの不在下でIVTT内で発現された場合、CsgGのモノマーのみが産生されうる。意外にも、これらの発現されたモノマーは、IVTT反応混合物中に存在する細胞抽出膜を使用することによってCsgGオリゴマー細孔にin situで組み立てることができる(図14、レーン1)。CsgGのオリゴマーはSDS安定性があるが、試料が100°Cに加熱された時にその成分モノマーに分解する(図14、レーン2)。CsgFのDNAが、CsgGのDNAの不在下でIVTT内で発現された時、CsgFモノマーのみを見ることができる(図、14、レーン3)。CsgGおよびCsgFのDNAが1:1の比で混合され、同一のIVTT反応混合物内同時に発現された場合、CsgFタンパク質は、CsgG:CsgF複合体を作製する高い効率を有する組み立てられたCsgG細孔と相互作用する(図14、レーン5)。IVTTで作製されたこのSDS安定複合体は、少なくとも70°Cまで熱安定性がある(図14、レーン6~12)。
切断CsgFを有するCsgG:CsgF複合体はまた、全長バージョンではなく切断CsgFをコードするDNAを使用することによって、上述した方法のいずれかによって作製することもできる。ただし、複合体の安定性は、CsgFがFCPドメインより下で切断されると損なわれうる。さらに、切断CsgFを有するCsgG:CsgF複合体は、全長CsgG:CsgF複合体が形成された後で、全長CsgFを適切な位置で切断することによって作製することができる。切断は、切断が必要な位置にプロテアーゼ切断部位を組み込むことによって、CsgFタンパク質をコードするDNAを修飾することによって行うことができる(図15A)。配列番号56~67は、切断CsgFを有するCsgG:CsgF複合体を生成するために、CsgFの様々な位置に組み込まれたTEVまたはHCV C3プロテアーゼ部位を示す。配列番号61で作製されたCsgG:CsgF複合体のTEV切断のSDS-PAGE分析を示す(図15B)。CsgG:CsgF複合体(全長CsgFを有する)が、分析物の特徴付けのための材料および方法セクションに記載されたTEVプロテアーゼ酵素で処理された場合、CsgFは位置35で切断される(図15B、レーン3および4)。ただし、TEV切断は、切断部位のC末端に過剰な6個のアミノ酸を残す。従って、CsgG細孔を有する複合体内の残りのCsgF切断タンパク質は42アミノ酸の長さである。この複合体とCsgG細孔(CsgFなし)の分子量差は、なおもSDS-PAGEで可視である(図15B、レーン7および8)。
意外にも、切断CsgFを有するCsgG:CsgF複合体はまた、精製されたCsgG細孔(in vivoまたはin vitroで製造)を、適切な長さの合成ペプチドを用いて再構成することによって作製することができる。再構成はin vitroで起こるため、CsgG:CsgF複合体を作製するためにCsgFのシグナルペプチドは必要とされない。さらに、この方法は、CsgFのC末端に過剰なアミノ酸を残さない。突然変異および修飾はまた、合成CsgFペプチドに容易に組み込まれうる。従って、この方法は、異なるCsgFペプチドまたはその突然変異体、または相同体を用いて、異なるCsgG細孔または突然変異体またはその相同体を再構成して、異なるCsgG:CsgF複合体変異体を生成するための非常に便利な方法である。複合体の安定性は、CsgFがFCPドメインを超えて切断されると損なわれうる。CsgG:CsgF複合体変異体を生成するために使用される切断CsgFおよびFCPペプチドの例を表3に示す。意外にも、この方法によってCsgF-(1-45)(図16.A)、CsgF-(1-35)(図16.B)およびCsgF-(1-30)(図16.C)を用いて作製されたCsgG:CsgF複合体の熱安定性のSDS-PAGEでは、少なくともCsgF-(1-45)およびCsgF-(1-35)ペプチドが少なくとも90°Cまで熱安定性のあるCsgGを有する複合体を作製することを示している。CsgG細孔は90°Cでその成分モノマーまで分解するため、90°Cを超える複合体の安定性を評価することは困難である。SDS-PAGE中のCsgG細孔バンドとCsgG:CsgF-(1~30)複合体バンドとの間の差はわずかであるため、この方法は、CsgG:CsgF-(1~30)複合体の熱安定性を分析するのに十分ではない(図16C)。ただし、CsgG:CsgF複合体は、3つすべての事例で観察され、電気生理学実験においてはCsgG:CsgF-(1~29)でさえも観察され、CsgF-(1~29)ペプチドが少なくともいくらかのCsgG:CsgF複合体を産生することを示している(図24)。
[実施例2]
Cryo-EMによるCsgG:CsgF構造解析
CsgG:CsgF複合体における構造的実態を得るために、共精製されたかin vitro再構成されたCsgG:CsgF粒子を透過型電子顕微鏡によって分析した。cryo-EM分析の準備において、二倍親和性精製CsgG:CsgF複合体のピーク分画500μLを、緩衝液D(25mM Tris Ph8、200mM Nacl、および0.03% DDM)で平衡化した、Superose 6 10/30カラム(GE Healthcare)上に注入し、0.5 mL/分で実施した。タンパク質濃度は、計算された吸光度280 nmに基づき、化学量論1:1を仮定して決定された。電子染色体検査用の試料を、「方法」に記載されるように分析した。CsgG:CsgF複合体のcryo-EM顕微鏡写真、ならびに選ばれたCsgG:CsgF粒子から選択された二つのクラス平均を図4に示す。顕微鏡写真は、九量体細孔および九量体細孔複合体の二量体の存在を示す。画像再構成については、九量体CsgG:CsgF粒子を選び、RELIONを用いて整列させた。側面図としてのCsgG:CsgF複合体のクラス平均、および3Dの再構成電子密度は、CsgG β-バレルの側面に位置するCsgG粒子からの突出部として見たCsgFに対応する追加的な密度の存在を示す(図4B、5)。追加的な密度は、球状のヘッドドメイン、中空のネックドメインおよびCsgG β-バレルと相互作用するドメインを包含する三つの識別可能な領域を明らかにする。CsgF収縮ペプチドまたはFCPと呼称される後者のCsgF領域は、CsgGβバレルの内腔内に挿入され、CsgG収縮部ループによって形成された収縮部(図4B、5のラベルG)の上約2 nmに位置する、CsgG細孔の追加的な収縮部(図4B、5のラベルF)を形成するものとして見られる。
[実施例3]
CsgFの切断によるCsgF相互作用および収縮ペプチドの識別
CsgG:CsgF細孔複合体における第二の収縮部の存在は、CsgGのみの細孔と比較して、ナノ細孔感知用途の機会を提供し、第二のリーダーヘッドとして、またはCsgG収縮ループによって提供される主要リーダーヘッドの延長部として使用可能な、ナノ細孔内の第二のオリフィスを提供する(図6、7)。ところが、複合体が全長CsgFを有する時、CsgG:CsgF組み合わせ細孔の出口側がCsgFネックドメインおよびヘッドドメインによってブロックされる。従って、CsgG β-バレルとの相互作用およびそれへの挿入に必要なCsgF領域を決定しようとした。当社のストレップ-タクチン親和性精製実験では、His-トラップ親和性精製内に存在するCsgFのN末端切断断片が失われ、CsgGと共精製されなかったため、CsgFのN末端領域が、CsgG相互作用にとって必要であるという手がかりが得られた(図2B)。CsgF相同体は、PFAMドメインPF03783の存在により特徴付けられる。グラム陰性細菌に見出されたCsgG相同体の多重配列アライメント(MSA)を実施する時(図8は選択されたCsgF相同体のMSAを示す)、配列保存領域(35~100%の一対配列同一性のMSAを示す)は成熟CsgF(配列番号6)の最初の約30~35アミノ酸に対応することが示された。組み合わされたデータに基づき、CsgFのこのN末端領域は、CsgG相互作用ペプチドまたはFCPを形成するという仮説が立てられた。既知のCsgF相同体におけるFCPの多重配列アライメントを図10に示す。
CsgF N末端がCsgG結合領域に対応し、CsgG β-バレル内腔内に存在するCsgF収縮ペプチドを形成するという仮説をテストするために、ストレップタグ付きCsgGおよびHisタグ付CsgF切断体をE. coli内で共過剰発現させた(「方法」を参照)。pNA97、pNA98、pNA99およびpNA100は、CsgF(配列番号5)の残基1~27、1~38、1-48および1~64に対応するN末端CsgF断片をコードする。これらのペプチドは、配列番号5の残基1~19に対応するCsgFシグナルペプチドを含み、従って、成熟CsgF(配列番号6、図9A)の最初の8、19、29および45個の残基に対応するペリプラズムペプチドを生成し、それぞれC末端の6x Hisタグを含む。細胞可溶化物全体のSDS-PAGE分析により、全ての試料中のCsgG、ならびに成熟CsgF(配列番号6、図9B)の最初の45残基に対応するCsgF断片の存在が明らかになった。短めのN末端CsgF断片については、細胞可溶化物全体でペプチドの検出可能な発現は見られなかった。二回の凍結/解凍サイクル後、さまざまなCsgG:CsgF断片の細胞質量を精製によってさらに濃縮した。細胞可溶化物全体およびストレップ親和性精製の溶出画分を、Hisタグ付CsgF断片の検出のために抗His抗体を使用して、ドットブロット解析用のニトロセルロース膜上にスポットを付けた(図9C)。ドットブロット法は、CsgF20:64ペプチドがCsgGと共精製し、CsgG断片がCsgGと安定した共有結合ではない複合体を形成するのに十分であることを示す。CsgG 20:48断片については、少量のペプチドがCsgGと共精製するのが見られ、一方、CsgF 20:27またはCsgF 20:38では、細胞可溶化物全体またはストレップ親和性精製(図9C)のいずれについても、検出可能なレベルが見られず、後者のペプチドはE. coli内では安定して発現されず、および/またはCsgGと安定した複合体を形成しないことを示唆している。
[実施例4]
原子解像度でのCsgG:CsgF相互作用の説明
CsgG:CsgFの相互作用について原子レベルの詳細を得るために、CsgG:CsgF複合体の高解像度cryoEM構造を決定した。この目的のために、CsgGおよびCsgFをE. coli内で共発現させ、CsgG:CsgF複合体を洗浄剤抽出によりE. coli外膜から単離し、タンデム親和性精製を使用して精製した。低温電子顕微鏡用の試料を、酸化グラフェンで被覆されたR2/1 Holeyグリッド(Quantifoil)上に3 μl試料をスポットすることにより調製し、データを、Gatan K2直接電子検出器を計数モードで使用して300Kv TITAN Kriosで収集した。62.000個の単一CsgG:CsgF粒子が使用され、最終電子密度マップを3.4Å解像度で計算した(図11A)。マップによって、CsgG結晶構造の明瞭な結合および局所的な再構成と、成熟CsgFのN末端35残基のde novo構築(すなわち配列番号5の残基20:54)が得られ、これは、CsgGを結合し、CsgG膜貫通β-バレルの高さで第二の収縮部を形成するFCPを包含する(図11C、D)。cryoEM構造は、CsgG:CsgFがC9対称性を有する9:9化学量論を含むことを示す(図11B)。FCPはCsgG β-バレルの内部で、CsgFのC末端がCsgG β-バレルの外を指し、CsgFのN末端がCsgG収縮部の近くに位置する状態で結合する。構造は、成熟CsgFのP35が、CsgG β-バレルの外にあり、CsgF FCPとネック領域との間の接続を形成することを示す。CsgG:CsgF複合体の本体に対する柔軟性により、CsgFネック領域およびヘッド領域は高解像度のcryoEMマップで分解されない。CsgG β-バレル内の三つの領域は、CsgG:CsgF相互作用を安定化させる:すなわち、成熟CsgG(配列番号3)の(IR1)残基Y130、D155、S183、N209およびT207は、四つのH結合および静電気的相互作用を含む、成熟CsgF(配列番号6)のN末端アミンおよび残基1~4との相互作用ネットワークを形成し、成熟CsgG(配列番号3)の(IR2)残基Q187、D149およびE203は、三つのH結合および二つの静電気的相互作用を含む、成熟CsgF(配列番号6)のR8およびN9との相互作用ネットワークを形成し、成熟CsgG(配列番号3)の(IR3)残基F144、F191、F193およびL199は、成熟CsgF(配列番号6)の残基F21、L22およびA26との疎水性相互作用表面を形成する。後者は、成熟CsgFの残基19~30によって形成されるα-らせん(helix 1)内に位置する。保存された配列N-P-X-F-G-G(配列番号6の残基9~14)は、CsgF helix 1で残基15~19によって形成されるループ領域をCsgF helix 1と接続する内向きの方向転換を形成する。まとめて、これらの要素はCsgG:CsgF複合体内に収縮部を生じさせ、そのうち残基17(成熟E. coli CsgF内のN17、配列番号6)は、最も狭いポイントを形成し、それにより直径15Åのオリフィスが得られる(図11C)。第二の収縮部(F締付またはFC)は、CsgG残基46~59(G収縮またはGC)によって形成される収縮部のそれぞれ上部および下部の上およそ15Å~30Åの位置にある。
[実施例5]
CcGg-CsgF複合体の安定性を改善するためのシミュレーション
CsgGおよびCsgGのどの残基が近接するかを確立するために分子動力学シミュレーションを実施した。この情報を使用して、複合体の安定性を高めることができるCsgGおよびCsgF突然変異体を設計した。
GROMASパッケージバージョン4.6.5を用いて、GROMOS 53a6強制フィールドおよびSPC水モデルと共に用いてシミュレーションを実施した。CsgG-CsgF複合体のcryo-EM構造をシミュレーションで使用した。複合体を溶媒和してから、最急降下アルゴリズムを使用してエネルギーを最小化した。シミュレーション全体を通して、複合体のバックボーンに抑制が適用されたが、残基側鎖は自由に移動した。このシステムは、BerendsenサーモスタットおよびBerendsenバロスタット300 Kを使用して、20nsのNPTアンサンブルでシミュレートされた。
CsgGとCsgFとの間の接触は、GROMACS分析ソフトウェアおよび現場で記述されたコードの両方を使用して分析された。二つの残基は、3オングストローム内に入った場合に接触したものと定義された。結果を以下の表4に示す。
Figure 0007282697000005
Figure 0007282697000006
Figure 0007282697000007
CsgG:CsgF複合体の構造決定のための材料および方法:
クローン化
外膜局在細孔としてのE. coli CsgGの発現のために、E. coli CsgGのコード配列(配列番号1)をpASK-Iba12にクローン化し、プラスミドpPG1を得た(Goyal et al. 2013)。
E. coli細胞質内のC末端での6x-Hisタグ付きCsgFの発現のために、成熟E. coli CsgF(配列番号6、すなわちシグナル配列のないCsgF)のコード配列を、プライマー「CsgF-His_pET22b_FW」(配列番号46)および「CsgF-His_pET22b_Rev」(配列番号47)を使用して生成されたPCR製品を用いて、NdeIおよびEcoRI部位を介してpET22bにクローン化し、CsgF-His発現プラスミドpNA101を得た。
csgF-HisおよびCsgG-strepを発現するpTrc99aベースのベクターであるpNA62プラスミドは、pGV5403(pDEST14 Gateway(登録商標)カセットが統合されたpTrc99a)に基づき作成された。PgV5403アンピシリン抵抗性カセットは、ストレプトマイシン/スペクチノマイシン抵抗性カセットで置き換えられた。csgE、csgFおよびCsgGのコード配列に対応するE. coli MC4100 csgDEFGオペロンの部分を包含するPCR断片が、プライマーcsgEFG_pDONR221_FW(配列番号48)およびcsgEFG_pDONR221_Rev(配列番号49)を用いて生成され、pDONR221(ThermoFisher Scientific)にBP Gateway(登録商標)組み換えを介して挿入された。次に、pDONR221ドナープラスミドに由来するこの組み換え型csgEFGオペロンが、LR Gateway(登録商標)組み換えを介して、ストレプトマイシン/スペクチノマイシン抵抗性カセットを用いてpGV5403に挿入された。PCRを介して、プライマーMut_csgF_His_FW(配列番号50)およびMut_csgF_His_Rev(配列番号51)を使用して、6×HisタグがCsgF C末端に追加された。最後に、csgEが、外向きPCR(プライマーDelCsgE_FW(配列番号52)およびDelCsgE_Rev(配列番号53))によって除去され、pNA62を取得した。
推定上の収縮ペプチド(図9A)に対応するC末端Hisタグ付CsgG断片のペリプラズム発現のための構成体は、CsgF-hisおよびCsgG-strepを発現するpTrc99aベースのベクターであるpNA62に対する外向きPCRによって作成された。プライマーの組み合わせは、以下のとおりである:順方向プライマーとしてpNa62_CsgF_histag_Fw(配列番号45)で、CsgF_d27_end(配列番号41)、CsgF_d38_end(配列番号42)、CsgF_d48_end(配列番号43)またはCsgF_d64_end(配列番号44)を逆方向プライマーとして伴い、それぞれpNA97、pNA98、pNA99およびpNA100を作成した。
pNA97では、csgFが配列番号7に切断されて、残基1~27(配列番号8)を含むCsgF断片をコードし、pNA98では、csgFが配列番号9に切断されて、残基1~38(配列番号10)を含むCsgF断片をコードし、pNA99では、csgFが配列番号11に切断されて、残基1~48(配列番号12)を含むCsgF断片をコードし、pNA100では、csgFが配列番号13に切断されて、残基1~64(配列番号14)を含むCsgF断片をコードする。E. coliにおけるpNA97、pNA98、pNA99およびpNA100の発現は、外膜におけるCsgG細孔(配列番号3)の産生と、以下の配列を有するCsgF由来ペプチドのペリプラズム標的化をもたら
それぞれ、「GTMTFQFRHHHHHH」(配列番号37+ 6xHis)、「GTMTFQFRNPNFGGNPNNGHHHHHH「(配列番号38 + 6xHis)、「GTMTFQFRNPNFGGNPNNGAFLLNSAQAQHHHHHH」(配列番号39+ 6xHis)、および「GTMTFQFRNPNFGGNPNNGAFLLNSAQAQNSYKDPSYNDDFGIETHHHHHH」(配列番号40+ 6xHis)。

E. coli Top10(F mcrA Δ( mrrhsdRMSmcrBC) Φ80lacZΔM15 Δ lacX74 recA1 araD139 Δ(araleu) 7697 galU galK rpsL (StrR) endA1 nupG)が、すべてのクローン化工程に使用された。E. coli C43(DE3)(F ompT hsdSB(rB mB)gal dcm(DE3))およびTop10がタンパク質産生に使用された。
共発現による組み換え型CsgG:CsgF複合体の産生
E. coli CsgF(配列番号5)およびCsgG(配列番号2)の共発現について、それらのネイティブShine Dalgarno配列を含む両方の組み換え型遺伝子が、pTrc99a由来プラスミド内で誘導性のtrcプロモーターの制御下に置かれ、プラスミドpNA62を形成した。CsgGおよびCsgFをプラスミドpNA62で形質転換し、Terrific Broth培地中37°Cで培養した、E. coli C43(DE3)細胞内で過剰発現させた。細胞培養物が600 nmで0.7の光学密度(OD)に達した時、組み換え型タンパク質発現を0.5 mM IPTGで誘発し、28℃で15時間放置して培養した後、5500 gでの遠心分離により収穫された。
in vitro再構成による組み換え型CsgG:CsgF複合体の産生
C末端ストレップII-タグで修飾された全長E. coli CsgG(配列番号2)は、プラスミドPpG1(Goyal et al. 2013)で形質転換されたE. coli BL21(DE3)細胞内で過剰発現させた。細胞を37℃で、Terrific Broth培地中でOD 600 nmが0.6になるまで培養した。組み換え型タンパク質の産生を0.0002%アンヒドロテトラサイクリン(Sigma社)で誘発し、細胞を25℃でさらに16時間培養した後、5500 gで遠心分離により収穫した。
6x HisタグによるC末端融合内のE. coli CsgF(配列番号6、すなわち、CsgFシグナル配列を欠く)を、プラスミドpNA101で形質転換したE. coli BL21(DE3)細胞の細胞質内で過剰発現させた。細胞を37°Cで600 nmのODまで培養し、続いて1mM IPTGにより誘発し、37℃で15時間放置してタンパク質を発現した後、5500 gで遠心分離して収穫した。
CsgG:CsgF複合体、CsgG、およびCsgFの組み換え型タンパク質精製
pNA62で形質転換され、CsgG-StrepおよびCsgF-Hisを共発現するE. coli細胞を、50 mM Tris-HCl pH 8.0、200 mM NaCl、1 mM EDTA、5mM MgCl、0.4 mM AEBSF、1 μg/mLロイペプチン、0.5 mg/mL DNase Iおよび0.1 mg/mLリゾチーム内で再懸濁した。細胞を、TSシリーズの細胞粉砕器(Constant Systems Ltd)を使用して20 kPsiで粉砕し、溶解した細胞懸濁液を1% n-ドデシル-β-d-マルトピラノシド(DDM、Inalco)を用いて30分間培養し、外膜構成要素のさらなる細胞溶解および抽出をした。次に、残りの細胞破片および膜を、超遠心分離により100.000gで40分間遠心分離した。上清を、緩衝液A(25mM Tris pH8、200mM Nacl、10mMイミダゾール、10%スクロース、および0.06% DDM)中で平衡化した5 mL HisTrapカラム上に装填した。カラムを>10CV 5%緩衝液B(25mM Tris pH8、200mM Nacl、500mMイミダゾール、10%スクロース、0.06% DDM)イオン緩衝液Aで洗浄し、60 mLに対して5~100%の緩衝液Bの勾配で溶出した。
溶出液を2倍に希釈し、緩衝液C(25mM Tris pH8、200mM Nacl、10%スクロース、および0.06% DDM)を用いて平衡化した5mLストレップ-タクチンカラム(IBA Gmbh)上に一晩装填した。カラムを、>10 CV緩衝液Cで洗浄し、タンパク質を2.5 mMデスチオビオチンの添加により溶出した。次に、二倍親和性精製複合体のピーク分画500 μLを、緩衝液D(25mM Tris pH8、200 mM Nacl、および0.03% DDM)で平衡化されたSuperose 6 10/30(GE Healthcare)上に注入し、電子顕微鏡用の試料を調製するために0.5 mL/分で実施した。タンパク質濃度は、280 nmでの吸光度計算値に基づき、1/1化学量論と仮定して決定された。緩衝液D(25mM Tris pH8、200 mM Nacl、0.03% DDM)
in vitro再構成用のCsgG-strep精製は、緩衝液中でスクロースを除外し、IMACおよびサイズ除外工程を迂回する時、CsgG:CsgF用のプロトコルと同一である。
in vitro再構成のためのCsgF-His精製は、50 mM Tris-Hcl pH 8.0、200 mM Nacl、1 mM EDTA、5mM MgCl2、0.4 mM AEBSF、1 μg/mLロイペプチン、0.5mg/mL DNase I、0.1 mg/mLリゾチーム中に細胞質量を再懸濁することにより実施された。細胞を、TSシリーズの細胞粉砕器(Constant Systems Ltd)を使用して20 kPsiで粉砕し、10.000gで30分間遠心分離して、無傷の細胞および細胞破片を除去した。上清を、緩衝液A(25mM Tris pH8、200mM NaCl、10mMイミダゾール)で平衡化した5Ml Ni-IMAC-ビーズ(Workbis 40 IDA、Bio-Works Technologies AB)に加え、放置して4℃で1時間培養した。Ni-NTAビーズを、重力流カラム内にプールし、100 mLの5%緩衝液B(25 mM Tris pH8、200 mM Nacl、緩衝液A中で希釈された500 mMイミダゾール)で洗浄した。結合されたタンパク質は、緩衝液Bの段階的増加によって溶出された(各5mLで10%のステップ)。
CsgG:CsgF複合体のIn vitro再構成
精製されたCsgGおよびCsgGはプールされ、複合体をin vitro再構成するのに使用された。従って、モル比1 CsgG:2 CsgFを混合して、CsgGバレルをCsgFで飽和させた。次に、再構成混合物を、緩衝液D(25mM Tris pH8、200mM Nacl、および0.03% DDM)で平衡化したSuperose 6 10/30カラム(GE Healthcare)上に注入し、電子顕微鏡用の試料を準備するために0.5 mL/分で実施した(図3)。タンパク質濃度は、280 nmでの吸光度計算値に基づき、1/1化学量論と仮定して決定された。
電子顕微鏡を使用した構造解析
サイズ排除率の試料挙動は、ネガティブ染色電子顕微鏡を使用してプローブされる。試料は、1%のギ酸ウラニルで染色され、LaB6フィラメントを装備した社内の120 kV JEM 1400(JEOL)顕微鏡を用いて撮像される。電子染色体検査用の試料は、2 μLの試料をR2/1連続炭素(2nm)被覆グリッド(Quantifoil)にスポットし、手動でブロットし、社内のプランジ装置を使用して液体エタン内にプランジすることによって調製した。試料の品質を、社内のJEOL JEM 1400でスクリーニングしてから、Falcon-3直接電子検出カメラを装備した200 kV TALOS ARCTICA(FEI)顕微鏡でデータセットを収集した。画像はMotionCor2.1を用いて動作補正され(Zheng et al. 2017)、デフォーカス値がctffind4を使用して決定され(Rohou and Grigorieff, 2015)、データは、RELION(Scheres、2012)およびEMAN2(Ludtke、2016)の組み合わせを使用してさらに分析された。C9対称性は、ヘッド基についての追加的な密度を特徴とする選択された2Dクラス平均に対する3Dモデル生成および精密化の間に課された。
高解像度cryoEM解析については、CsgG:CsgF試料は、酸化グラフェン(Sigma Aldrich)で被覆されたR2/1 Holeyグリッド(Quantifoil)上に3 μlの試料をスポットし、手動でブロットし、CP3プランジャー(Gatan)を使用して液体エタン内にプランジすることによって低温電子顕微鏡用に調製した。試料品質が社内のJEOL JEM 1400でスクリーニングされた後、K2 Summit電子検出器(Gatan)を装備した300kV TITAN KRIOS(FEI、Thermo-Scientific)顕微鏡でデータセットを回収した。検出器は、50フレーム以上にわたり、電子数56個/Åの累積電子用量を持つ計数モードで使用された。2045画像が、ピクセルサイズ1.07Åで収集された。画像はMotionCor2.1で動作補正され(Zheng et al. 2017)、デフォーカス値はctffind4を使用して決定された(Rohou and Grigorieff, 2015)。粒子はGautomatch(Dr. Kai Zhang)を使用して自動的に捕捉され、データはRELION2.0(Kimanius et al. 2016, Elife 5. pii: e18722)およびEMAN2(Ludtke, 2016)を使用してさらに分析された。C9対称性は、ヘッド基についての追加的な密度を特徴とする選択された2Dクラス平均に対する3Dモデル生成および精密化の間に課された。62.000粒子が使用され、3.4Å解像度での最終マップが計算された。CsgFのDe novoモデル構築は、COOT(Brown et al. 2015 Acta Crystallogr D Biol Crystallogr 71(Pt 1):136-53)を用いて実施され、また複合体全体のモデル構築および精密化の反復サイクルは、PHENIX(Afonine 2018, Acta Crystallogr D Struct Biol 74(Pt 6):531-544)実空間精密化をCOOTと組み合わせて使用して実施した。
CsgG:CsgF断片のタンパク質発現および精製
CsgF断片およびCsgGを共発現し、CsgF断片はC末端でHis-タグ付けされ、CsgGはC末端でストレップタグに融合された。CsgG:CsgF断片複合体は、プラスミドpNA97、pNA98、pNA99またはpNA100で形質転換されたE. coli Top10細胞内で過剰発現された。プレートを37℃ ONで培養し、ストレプトマイシン/スペクトマイシンを追加したLB培地中でコロニーを再懸濁した。細胞培養物が600 nmで0.7の光学密度(OD)に達した時、組み換え型タンパク質発現を0.5 mM IPTGで誘発し、28℃で15時間放置して培養した後、5500 gでの遠心分離により収穫した。ペレットを-20°Cで凍結した。
さまざまなCsgG:CsgF断片の細胞質量を、200Mlの50mM Tris-HCl pH 8.0、200 mM NaCl、1mM EDTA、5mM MgCl、0.4 mM AEBSF、1 μg/mLロイペプチン、0.5 mg/mL DNase Iおよび 0.1 mg/mLリゾチーム中で再懸濁し、超音波処理し、さらなる細胞溶解および外膜成分の抽出のために1% n-ドデシル-β-d-マルトピラノシド(DDM、Inalco)で培養した。次に、残りの細胞破片および膜を、遠心分離により15.000 gで40分間遠心分離した。上清を、100 μLのストレップ-タクチンビーズを用いて室温で30分間培養した。ストレップビーズを緩衝液(25 mMトリス pH8、200 mM Nacl、および1% DDM)を用いて遠心分離により洗浄し、25 mM Tris pH8、200 mM NaCl、0.01% DDMに2.5 mMデスチオビオチンを追加して結合したタンパク質を溶出した。
in vitro再構成によるCsgG:FCPの産生
成熟CsgF(配列番号6)のN末端34残基に対応する合成ペプチドを、緩衝液0.1M MES、0.5M Nacl、0.4mg/MlのEDC(1-エチル-3-(3-ジメチルアミノプロピル)カルボジイミド)、0.6 mg/mlのNHS(N-ヒドロキシアミノプロピル)カルボジイミド)中で1 mg/mlに希釈し、室温で15分間培養し、ペプチドカルボキシ末端を活性化させた。次に、2時間の培養中に1 mg/mlのカドベリンAlexa594のPBS溶液を添加して、室温で共有結合を許容した。Zeba Spinフィルターを使用して緩衝液を50 mM Tris、NaCl、1 mM EDTA、0.1% DDMに換えることにより反応をクエンチした。
標識化されたペプチドを、50 mM Tris、100 mM NaCl、1 mM EDTA、5 mM LDAO/C8D4中でストレップ親和性精製CsgGに室温で15分間にわたり2:1のモル比で加え、CsgG:FCP複合体を再構成させた。StrepTactinビーズに対してCsgG-strepをプルダウンした後、試料をネイティブPAGEで分析した。
[実施例6]
共有結合架橋によるCsgG:CsgF複合体のさらなる安定化
全長CsgFおよびいくつかの切断バージョンのCsgFは、CsgG細孔と安定したCsgG:CsgF複合体を形成するが、特定の条件下では、CsgFはなおもCsgG細孔のバレル領域から外れることがある。従って、CsgGサブユニットとCsgFサブユニットとの間で共有結合を形成することが望ましい。分子シミュレーション研究に基づき、相互に近接しているCsgGおよびCsgFの位置が識別された(実施例5および表4)。これらの特定された位置の一部は、CsgGおよびCsgFの両方にシステインを組み込むように修正されてきた。図19は、CsgGのQ153位置とCsgFのG1位置との間のチオール-チオール結合形成の実施例を示す。Q153C突然変異を含むCsgG細孔を、G1C突然変異を含むCsgFで再構成し、1時間培養してS-S結合形成をできるようにした。DTTが不在の時に複合体を100℃に加熱すると、CsgGモノマーとCsgFモノマーの間の二量体(CsgGm-CsgFm)に対応する45 kDaバンドを見ることができ、これは二つのモノマー(CsgGmは30 kDa、CsgFmは15 kDa)間のS-S結合形成を示す(図19A)。このバンドは、DTTの存在下で加熱されるときに消失する。DTTはS-S結合を分解する。CsgG:CsgF複合体が1時間ではなく一晩培養された時、CsgGm-CsgFm二量体形成の範囲が増大する(図19A)。二量体バンドをさらに識別するために、質量分析方法が実施された。ゲル精製タンパク質をタンパク質分解的に切断してトリプシンペプチドを生成した。LC-MS/MS配列決定法を実施すると、CsgGのQ153位置とCsgFのG1位置との間のS-S結合が特定された(図19B)。S-S結合形成を強化するために、銅-オルソフェナントロリンなどの酸化剤を使用することができる。N133C修飾を含むCsgG細孔が、方法セクションに記載される銅-オルソフェナントロリンの存在下で、T4C修飾を含むCsgFで再構成され、次に、DTTの不在下で100°Cに加熱されることによりその成分モノマーに分解される時、CsgGm-CsgFmに対応する強力な二量体バンドがSDS-PAGE上で観察されうる(図20、レーン3およびレーン4)。加熱がDTTの存在下で実施された時、二量体はその成分モノマーに分解する(図20、レーン1およびレーン2)。
[実施例7]
CsgG:CsgF複合体の電気生理学的特徴付け
DNA鎖がCsgGを通して転座するときに観察された信号は、細孔が共重合体膜内に挿入され、また実験がOxford Nanopore TechnologiesのMiniONを使用して実行される時に十分に特徴付けられる(図31)。CsgGの各サブユニットのY51、N55およびF56は、CsgG細孔の収縮部を形成する(図12)。この急な収縮部は、CsgG細孔のリーダーヘッドとしての役割を果たし(図31A)、細孔を通過するときにA、C、GおよびTの混合配列を正確に差別することができる。これは、測定された信号が、配列の同一性を導き出すことができる特徴的な電流の偏向を含むためである。しかしながら、DNAのホモポリマー領域では、測定された信号は、単一塩基の識別を可能にするのに十分な大きさの電流偏向を示さない場合があり、その結果、ホモポリマーの長さの正確な決定を測定された信号の大きさのみから行うことができない(図26Bおよび図26C)。CsgGリーダーヘッドの精度の低下は、ホモポリマー領域の長さと相関する(図29C)。CsgFがCsgG細孔と相互作用してCsgG:CsgF複合体を形成する場合、CsgFはCsgGバレル内に第二のリーダーヘッドを導入する。この第二のリーダーヘッドは、主に配列番号6のN17位置から成る。「方法」セクションおよび図27に記載された静的鎖実験は、CsgG:CsgF複合体の二つのリーダーヘッドを実験的にマップするために実施され、結果は、およそ5~6塩基で相互に分離された二つのリーダーヘッドの存在を示す(図27、B、CおよびD)。CsgG:CsgF複合体のリーダーヘッド差別プロットは、CsgFによって導入された第二のリーダーヘッドのベース差別への寄与は、CsgGリーダーヘッドの塩基識別への寄与よりも小さいことを示す(図27A)。意外にも、第二のリーダーヘッドがCsgGバレル内でCsgFによって導入される時、それまで平坦であったホモポリマー領域は、階段状の信号を示す(図30BおよびC)。これらの階段には、正確に配列を識別するために使用できる情報が含まれており、エラーが減少する。CsgG:CsgF複合体のDNA信号の精度は、CsgG細孔それ自体による精度プロファイルと比較して、長めのホモポリマー長さ全体にわたり比較的一定のままである(図29C)。
「方法」セクションで説明したいずれかの方法で作製されたCsgG:CsgF複合体は、DNA配列決定実験で複合体を特徴付けるために使用することができる。異なるCsgG突然変異体細孔と、異なる長さを有する異なるCsgFペプチドとから成る異なる方法で作製された様々なCsgG:CsgF複合体を通過するラムダDNA鎖の信号を、図21~24に示す。それらの細孔複合体およびそれらの塩基寄与プロファイルのリーダーヘッド差別を図28(A~H)に示す。意外にも、CsgG細孔およびCsgFペプチドの両方の収縮部での異なる修飾は、CsgG:CsgF細孔複合体の信号を著しく変化させうる。例えば、CsgG:CsgF複合体が同じCsgG細孔で作製されても、位置17(配列番号6)にAsnまたはSerのいずれかを含む同じ長さの二つの異なるCsgFペプチドが使われる時(全長CsgFタンパク質の同じ共発現方法の後、位置35および36でのCsgFのTEVプロテアーゼ切断によって作製される)は、生成される信号が互いに異なる(図21)。CsgFペプチドの位置17にSegを有するCsgG:CsgF複合体は、CsgFペプチドの位置17にAsnを有するCsgG:CsgF複合体と比較して、より低い雑音および高い信号対雑音比が示されている。同様に、同じCsgG細孔が同じ長さの二つの異なるペプチド(配列番号6の1~35)で再構成され、CsgG:CsgF複合体を作製するために位置17のValまたはSerが使用された場合、CsgFの位置17のValはCsgFの位置17にSerを持つ複合体よりも雑音の多い信号を示す(図22)。同じ長さの同じCsgFペプチドが、CsgGリーダーヘッド(位置51、55および56)に異なる突然変異を含む異なるCsgG細孔で再構成された場合、結果として得られるCsgG:CsgF複合体は、異なる信号対雑音比(図25)を持つ異なる信号(図23、A~F)を示した。意外にも、同じ収縮領域を含む異なる長さのCsgFペプチドが同じCsgG細孔で再構成されてCsgG:CsgF複合体を形成する時は、異なる範囲の信号が得られた(図24)。最も短いCsgFペプチド(配列番号6の1~29)を含むCsgG:CsgF複合体は、最も大きな範囲を示し、最も長いCsgFペプチド(配列番号6の1~45)を含むCsgG:CsgF複合体は、最小範囲を示した(図24)。
分析物の特徴付けのための材料および方法:
以下に記載される方法によって生成されたタンパク質は、構造決定に関して上述した方法によって生成されたものと互換的に使用することができる。
方法
共発現によるCsgG:CsgFまたはCsgG:FCP複合体の発現
CsgGタンパク質およびその突然変異体をコードする遺伝子は、アンピシリン抵抗性遺伝子を含むPt7ベクターで構築される。CsgFタンパク質またはFCPタンパク質をコードする遺伝子、およびその突然変異体は、カナマイシン抵抗性遺伝子を含有するpRhamベクターで構成される。両方の1uLのプラスミドは、氷上で10分間、50uLのLemo(DE3)ΔCsgEFGと混合される。次に、試料を42℃で45秒間加熱した後、さらに5分間氷に戻す。150uLのNEB SOC増殖培地を加え、試料を37℃で250rpmで1時間振盪しながら培養する。全容積を、カナマイシン(40ug/mL)、アンピシリン(100ug/mL)およびクロラムフェニコール(34ug/mL)を含む寒天プレート上に広げて、37℃で一晩培養する。プレートから単一コロニーを採取し、カナマイシン(40ug/mL)、アンピシリン(100ug/mL)およびクロラムフェニコール(34ug/mL)を含む100MlのLB培地に培養し、37℃で250rpmで振盪しながら一晩培養した。25mLの開始培養を、3mM ATP、15mM MgSO、カナマイシン(40ug/mL)、アンピシリン(100ug/mL)およびクロラムフェニコール(34ug/mL)を含む500MlのLB培地に加え、37℃で一晩培養した。この培養物を7時間増殖させ、その時点でOD600は3.0より大きかった。ラクトース(最終濃度1.0%)、グルコース(最終濃度0.2%)およびラムノース(最終濃度2mM)を加え、温度を18℃に下げ、一方で振盪は250rpmで16時間維持される。培養物を4℃で20分間、6000rpmで遠心分離した。上清を捨て、ペレットを保持した。精製まで、細胞を-80℃で保存した。
C末端ストレップタグおよびC末端ストレップまたはHisタグなしのCsgG細孔、またはC末端ストレップまたはHisタグなしでのCsgFの発現
すべてのCsgGタンパク質およびCsgGタンパク質またはCsgGタンパク質またはFCPタンパク質をコードする遺伝子はすべて、アンピシリン抵抗性遺伝子を含むpT7ベクターで構築される。カナマイシンが全ての媒介および緩衝液で省略されている場合を除き、発現手順は上記と同じである。
細胞溶解(共発現複合体または個別CsgG/CsgF/FCPタンパク質)
溶解緩衝液は、50mM Tris、pH8.0、150mM Nacl、0.1% DDM、1xブガスタータンパク質抽出試薬(Merck)、2.5uLベンゾナーゼヌクレアーゼ(ストック≧250単位/μL)/100mLの溶解緩衝剤、および1錠のシグマプロテアーゼインヒビターカクテル/100mL溶解緩衝液で作製される。5X容量の溶解緩衝液を使用して、1X重量の収穫細胞を溶解する。細胞は再懸濁され、均質な溶解物が生成されるまで、室温で4時間にわたって放置される。溶解物を4℃で35分間20,000rpmで回転させる。上清を注意深く抽出し、0.2 uM Acrodiscシリンジフィルターを通して濾過する。
CsgGがC末端ストレップタグを含む場合、およびCsgFまたはFCPがC末端Hisタグを含む場合の、CsgGまたはCsgF/FCPタンパク質または共発現複合体のストレップ精製
次に、濾過された試料が、5mL StrepTrapカラムに次のパラメータで装填される。装填速度:0.8mL/分、全試料装填量:10mL、未結合の洗浄:10CV(5mL/分)、追加洗浄:10CV(5mL/分)、溶出: 3CV(5mL/分)。親和性緩衝液:50mL Tris、pH8.0、150mM Nacl、0.1% DDM、洗浄緩衝液:50mL Tris、pH8.0、2M Nacl、0.1% DDM、溶出緩衝液:50mL Tris、pH8.0、150mM NaCl、0.1% DDM、10mMデスチオビオチン。溶出された試料が収集される。
CsgGがC末端ストレップタグを含む場合、およびCsgFまたはFCPがC末端Hisタグを含む場合の、CsgGまたはCsgF/FCPタンパク質または共発現複合体のHis精製
濾過した試料またはStrep精製からの溶出ピークをプールしたもの(複合体の場合)を、以下の緩衝液以外は上記のパラメータを使用して、5 mLのHisTrapカラムに装填した:親和性緩衝液および洗浄緩衝液:50mL Tris、pH 8.0、150mM NaCl、0.1% DDM、25mMイミダゾール、溶出:50Ml Tris、pH8.0、150mM Nacl、0.1% DDM、350mM イミダゾール。ピーク溶出し、30kDa MWCO Merck Milipore遠心分離装置で濃縮し、500uLの容積にした。
in vivoで精製された構成要素を用いたin vitroでの複合体形成。
発現し精製されたCsgGおよびCsgF/FCPタンパク質の両方を、さまざまな比で別個に混合して、正しい比率を特定する。ところが、常に過剰CsgG状態である。次に、複合体を25°Cで一晩培養した。過剰なCsgFを除去し、緩衝液からDTTを除去するために、混合物を50mMのTris、pH8.0、150mM Nacl、0.1% DDMで平衡化したSuperdex Increase 200 10/300に再度注入した。複合体は通常、このカラム上で9~10mLの間で溶出する。
複合体のためのゲル濾過による研磨工程(in vitroでの共発現または作製)
必要に応じて、ストレップ精製、またはHis精製、またはHis精製に続いてストレップ精製をしたCsgG:CsgFまたはCsgG:FCPに、ゲル濾過によってさらに研磨工程を施すことができる。500uLの試料を1mL試料ループに注入し、50mM Tris、pH 8.0、150mM NaCl、0.1% DDM中で平衡化したSuperdex Increase 200 10/300上に注入した。複合体に関連付けられたピークは、通常、1 mL/分の実行時にこのカラムで9~10 mLで溶出される。試料を60℃で15分間加熱し、21,000rcfで10分間遠心分離した。テスト用に上清を取った。試料をSDS-PAGEにかけ、複合体で溶出された画分を確認し、特定した。
TEVプロテアーゼ部位でのCsgFまたはFCPの切断
CsgFまたはFCPがTEV切断部位を含む場合、C末端ヒスチジンタグを用いたTEV-プロテアーゼが試料に、2mM DTTと共に追加される(追加量はタンパク質複合体のおおまかな濃度に基づいて特定)。試料を、25rpmのローラーミキサー上、4℃で一晩培養した。次に、混合物を5mL HiStrapカラムに戻し、貫流分が回収された。切断されていないものはすべてカラムに結合されたままで、切断されたタンパク質が溶出する。上述のHis精製で使用されたものと同一の緩衝液およびパラメータおよび最終加熱工程が使用される。
in vivo精製されたCsgG細孔および合成FCPによるCsgG:FCP複合体の精製
GenscriptおよびLifeteinからのFCPペプチドを凍結乾燥した。1mgのペプチドを1mLのヌクレアーゼ遊離ddHOに溶解し、1mg/mLの試料を得る。ペプチドが見えなくなるまで、試料はボルテックスされた。CsgG細孔および突然変異体の発現レベルの違いにより、濃度を正確に測定することは困難である。既知のマーカーに対するSDS-PAGE上のタンパク質バンドの強度を使用して、試料のおおまかな推定をすることができる。次に、CsgGおよびFCPを約1:50モル比で混合し、25℃で700rpmで一晩培養する。試料を60℃で15分間加熱し、21,000rcfで10分間遠心分離した。テスト用に上清を取った。必要に応じて、複合体を共発現で上述したように精製することができる。
システイン突然変異体を含むCsgG:CsgFまたはCsgG:FCPの精製
一方または両方の構成要素がシステインを含む場合に、His精製およびStrep精製での親和性緩衝液、洗浄緩衝液および溶出緩衝液、ならびにゲル濾過で使用される緩衝液の組成を除いて、上述と同じ手順が、CsgG:CsgFまたはCsgG:FCP複合体(下記のIまたはIIまたはIII)を精製するために使用されうる。システイン突然変異体を精製するために、これらの緩衝液はすべて、2mM DTTを含むべきである。2mM DTTも、システインを含む合成ペプチドがddH2O中で溶解される時に追加された。
I. CsgGおよびCsgFまたはFCPの共発現
II. in vivo精製された個別構成要素を用いたCsgG:CsgFまたはCsgG:FCP複合体のin vitro作製
III. in vivo精製されたCsgGおよび合成FCPを用いたCsgG:CsgFまたはCsgG:FCP複合体のin vitro作製
Cys結合形成の決定
最終溶出からそれぞれ50uLの二本のチューブをそれぞれ分離した。一方のチューブに、2mM DTTを還元剤として加え、他方のチューブに100μMのCu(II):1-10フェナンスロライン(33 mM:100 mM)を酸化剤として加えた。試料を4%のSDSを含むLaemmli緩衝液と1:1で混合した。試料の半分を100℃で10分間(変性条件)熱処理し、半分を未処置のままにした後、TGS緩衝液中で4~20%のTGXゲル(Bio-rad Criterio n)上で実施した。
インビトロ転写および翻訳(IVTT)の結合
すべてのタンパク質は、環状DNA(Promega)用のE. coli T7-S30抽出システムを使用して、in vitro転写および翻訳(IVTT)の結合により生成された。完全な1 mMのアミノ酸混合物からシステインを差し引いたものと、完全な1 mMのアミノ酸混合物からメチオニンを差し引いたものとを同量で混合して、高濃度のタンパク質を生成するために必要な作用アミノ酸溶液を得た。アミノ酸(10uL)を予混合溶液(40uL)、[35S]L-メチオニン(2uL、1175 Ci/mmol、10mCi/mL)、プラスミドDNA(16uL、400ng/uL)、およびT7 S30抽出物(30uL)およびリファンピシン(2uL、20 mg/mL)と混合し、IVTTタンパク質の100uL反応物を生成した。合成を30℃で4時間実施し、その後室温で一晩培養した。CsgG:CsgFまたはCsgG:FCP複合体を共発現で作製した場合、各構成要素をコードするプラスミドDNAを等量で混合し、混合物(16uL)の一部をIVTTに使用した。培養後、チューブを22000gで10分間遠心分離し、その上清を捨てた。得られたペレットを再懸濁し、MBSA(10mM MOPS、1mg/ml BSA pH7.4)で洗浄し、同じ条件下で再度遠心分離した。ペレット中に存在するタンパク質を1X Laemmli試料緩衝液中に再懸濁し、300Vで25分間、4~20%のTGXゲル中で実施した。次に、ゲルを乾燥し、Carestream(登録商標)Kodak(登録商標)BioMax(登録商標)MRフィルムに一晩露出させた。次いで、フィルムを処理し、ゲル中のタンパク質を視覚化した。
MinIONでの試験用の試料
試験前のすべての試料は、Brij58(最終濃度0.1%)で10分間、室温で培養してから、細孔挿入に必要なその後の細孔希釈を作製した。
静的鎖の準備および実行方法
一つの塩基がDNAバックボーン(ISpc3)から欠失している一組のpolyA DNA鎖(図27のSS20~SS38)は、これらの各鎖の、統合DNA技術(IDT)によって得られる。これらの鎖の各々の3’末端もビオチン修飾を含む。静的鎖は、一価ストレプトアビジンで室温で20分間培養され、その結果、ストレプトアビジンにビオチン結合が生じる。ストレプトアビジン-静的鎖複合体を、25 mM HEPES、430 mM KCl、30 mM ATP、30 mM MgCl2、2.15 mM EDTA、pH8(RBCとして知られる)中で、500 Nm(B、図27)および2 uM(C、図27)に希釈した。各静的鎖によって生成される残留電流は、MinIONセットアップに記録される。MinIOnフローセルを標準走行プロトコルに従ってフラッシュし、次いで、配列決定プロトコルを1分間の静的フリックで始めた。最初に10分の開放細孔記録を生成してから、150uLの第一のストレプトアビジン-静的鎖複合体を加えた。10分後、フローセルを通して800uLのRBCFMをフラッシュした後、次のストレプトアビジン-静的鎖複合体を加えた。このプロセスが、すべてのストレプトアビジン-静的鎖に対して繰り返された。最後のストレプトアビジン-静的鎖複合体がフローセル上で培養されると、800 uLのRBFMをフローセルを通してフラッシュし、10分間の開放細孔記録を生成してから実験を終了した。
差別プロファイルプロットを作成する方法
リーダーヘッド差別プロファイルは、各リーダーヘッド位置にある塩基が変化する時のモデル化された電流の平均変動を示す。長さnのアルファベットを有する長さkのモデルについての位置iでのリーダーヘッド差別を計算するために、リーダーヘッド位置iでの差別を、サイズnのそれぞれのnk-1群についての電流レベルの標準偏差の中央値として定義した。式中、位置iは変動し、一方でその他の位置は一定に保たれる。
本開示の態様
1.CsgG細孔またはその相同体もしくは突然変異体、および修飾CsgFペプチドまたはその相同体もしくは突然変異体を含む、単離された細孔複合体。
2.修飾CsgFペプチドまたはその相同体もしくは突然変異体が、CsgG細孔またはその相同体もしくは突然変異体の内腔に挿入される、態様1に記載の単離された細孔複合体。
3.細孔複合体がCsgGチャネル収縮およびCsgFチャネル収縮を含む二つ以上のチャネル収縮部を有する、態様2に記載された単離された細孔複合体。
4.CsgG細孔またはその相同体もしくは突然変異体が突然変異体CsgG細孔である、態様1~3のいずれか一項に記載の単離された細孔複合体。
5.CsgFチャネル収縮部が0.5 nm~2.0 nmの範囲の直径を持つ、態様3または4に記載の単離された細孔複合体。
6.修飾がCsgFタンパク質配列番号6またはその相同体もしくは突然変異体の切断を含む、修飾CsgFペプチド、またはCsgF相同体もしくは突然変異体の修飾ペプチド。
7.前記修飾CsgFペプチドが、配列番号39、または配列番号40またはその相同体もしくは突然修飾ペプチド。
8.前記修飾CsgFペプチドが、配列番号15またはその相同体もしくは突然変異体を含む、態様6に記載の、修飾CsgFペプチド、またはCsgF相同体もしくは突然変異体の修飾ペプチド。
9.配列番号15を含む領域内の一つ以上の位置が、配列番号15に対して最低でも35%のアミノ酸同一性で突然変異を起こす、態様8に記載の修飾CsgFペプチド、またはCsgF相同体もしくは突然変異体の修飾ペプチド。
10.態様6~9のいずれか一項に記載の修飾CsgFペプチドをコードするポリヌクレオチド。
11.前記修飾CsgFペプチドまたはその相同体もしくは突然変異体が、態様6~9のいずれか一項に記載のペプチドである、態様1~5のいずれか一項に記載の単離された細孔複合体。
12.修飾CsgFペプチドおよびCsgG細孔またはその相同体もしくは突然変異体が共有結合される、態様11に記載された単離された細孔複合体。
13.共有結合が以下による、態様12に記載の単離された細孔複合体:
(i)配列番号3の132、133、136、138、140、142、144、145、147、149、151、153、155、183、185、187、189、191、201、203、205、207または209またはその相同体に対応する位置にあるシステイン残基、
(ii)配列番号3の132、133、136、138、140、142、144、145、147、149、151、153、155、183、185、187、189、191、201、203、205、207または209またはその相同体に対応する位置にある非ネイティブ反応性または光反応性アミノ酸。
14.態様1~5または態様11~13のいずれか一項に記載の単離された細孔複合体と、膜の構成要素とを含む、単離された膜貫通細孔複合体。
15.細孔複合体が、CsgG細孔および修飾CsgFペプチドまたはその相同体もしくは突然変異体によって形成され、配列番号2に描写されているCsgGまたはその相同体もしくは突然変異体と、修飾CsgFペプチドまたはその相同体もしくは突然変異体とを、適切な宿主細胞内で共発現し、それによってin vivo膜貫通細孔複合体形成を行う工程を含む、膜貫通細孔複合体を生成するための方法。
16.修飾CsgFペプチドまたはその相同体もしくは突然変異体が、配列番号12または配列番号14またはその相同体もしくは突然変異体を含む、態様15に記載の方法。
17.単離された細孔が、CsgG細孔またはその相同体もしくは突然変異体と、修飾CsgFペプチドまたはその相同体もしくは突然変異体とによって形成され、配列番号3またはその相同体もしくは突然変異体のCsgGモノマーを、修飾CsgFペプチドまたはその相同体もしくは突然変異体と接触させ、それによって単離された細孔複合体のin vitro再構成を行う工程を含む、単離された細孔複合体を生成するための方法。
18.修飾CsgFペプチドまたはその相同体もしくは突然変異体が、配列番号15または配列番号16またはその相同体もしくは突然変異体を含む、態様17に記載の方法。
19.標的分析物の存在、不在または一つ以上の特性を決定するための方法であって、
(i)標的分析物を、標的分析物が細孔複合体内に移動するように、態様1~5または態様11~13のいずれか一項に記載の細孔複合体と、または態様14に記載の膜貫通細孔複合体と接触させる工程と、
(ii)分析物が細孔複合体の中を移動する時に一つ以上の測定値を取って、それによって分析物の存在、不在または一つ以上の特性を決定する工程を含む、方法。
20.分析物がポリヌクレオチドである、態様19に記載の方法。
21.分析物が(ポリ)ペプチドである、態様19に記載の方法。
22.分析物が多糖類である、態様19に記載の方法。
23.分析物が、薬理学的活性化合物、有毒化合物および汚染物質など、小さな有機化合物または無機化合物である、態様19に記載の方法。
24.(i)ポリヌクレオチドの長さ、(ii)ポリヌクレオチドの同一性、(iii)ポリヌクレオチドの配列、(iv)ポリヌクレオチドの二次構造および(v)ポリヌクレオチドが修飾されているかどうかから選択される一つ以上の特性を決定する工程を含む、態様20に記載の方法。
25.細孔複合体がCsgG細孔またはその相同体もしくは突然変異体と、修飾CsgFペプチドまたはその相同体もしくは突然変異体とを含む複合体である、単離された膜貫通細孔複合体を使用してポリヌクレオチドまたは(ポリ)ペプチドを特徴付ける方法。
26.CsgG細孔またはその相同体もしくは突然変異体が6~10個のモノマーを含む、態様25に記載の方法。
27.標的分析物の存在、不在または一つ以上の特性を決定するための、態様1~5または態様11~13のいずれか一項に記載の、または態様14に記載の膜貫通細孔複合体の単離された細孔複合体の使用。
28.(a)態様1~5または態様11~13のうちのいずれか一つに記載の単離された細孔複合体および(b)膜の構成要素を含む、標的分析物を特徴付けるためのキット。
配列
配列の説明:
配列番号1は、シグナル配列(遺伝子ID:945619)を含む、株K12由来の野生型E. coli CsgGのポリヌクレオチド配列を示す。
配列番号2は、シグナル配列(Uniprot受入番号P0AEA2)を含む野生型E. coli CsgGのアミノ酸配列を示す。
配列番号3は、成熟タンパク質(Uniprot受入番号P0AEA2)としての野生型E. coli CsgGのアミノ酸配列を示す。
配列番号4は、シグナル配列(遺伝子ID:945622)を含む、株K12由来の野生型E. coli CsgFのポリヌクレオチド配列を示す。
配列番号5は、シグナル配列(Uniprot受入番号P0AE98)を含む野生型E. coli CsgFのアミノ酸配列を示す。
配列番号6は、成熟タンパク質(Uniprot受入番号P0AE98)としての野生型E. coli CsgFのアミノ酸配列を示す。
配列番号7は、アミノ酸1~27およびC末端6 Hisタグをコードする、野生型E. coli CsgFの断片のポリヌクレオチド配列を示す。
配列番号8は、アミノ酸1~27およびC末端6 Hisタグを包含する、野生型E. coli CsgFの断片のアミノ酸配列を示す。
配列番号9は、アミノ酸1~38およびC末端6 Hisタグをコードする、野生型E. coli CsgFの断片のポリヌクレオチド配列を示す。
配列番号10は、アミノ酸1~38およびC末端6 Hisタグを包含する、野生型E. coli CsgFの断片のアミノ酸配列を示す。
配列番号11は、アミノ酸1~48およびC末端6 Hisタグをコードする、野生型E. coli CsgFの断片のポリヌクレオチド配列を示す。
配列番号12は、アミノ酸1~48およびC末端6 Hisタグを包含する、野生型E. coli CsgFの断片のアミノ酸配列を示す。
配列番号13は、アミノ酸1~64およびC末端6 Hisタグをコードする、野生型E. coli CsgFの断片のポリヌクレオチド配列を示す。
配列番号14は、アミノ酸1~64およびC末端6 Hisタグを包含する、野生型E. coli CsgFの断片のアミノ酸配列を示す。
配列番号15は、E. coli CsgFの残基20~53に対応するペプチドのアミノ酸配列を示す。
配列番号16は、E. coli CsgFの残基20~42(そのC末端にKDを含む)に対応するペプチドのアミノ酸配列を示す。
配列番号17は、CsgF相同体Q88H88の残基23~55に対応するペプチドのアミノ酸配列を示す。
配列番号18は、CsgF相同体A0A143HJA0の残基25~57に対応するペプチドのアミノ酸配列を示す。
配列番号19は、CsgF相同体Q5E245の残基21~53に対応するペプチドのアミノ酸配列を示す。
配列番号20は、CsgF相同体Q084E5の残基19~51に対応するペプチドのアミノ酸配列を示す。
配列番号21は、CsgF相同体F0LZU2の残基15~47に対応するペプチドのアミノ酸配列を示す。
配列番号22は、CsgF相同体A0A136HQR0の残基26~58に対応するペプチドのアミノ酸配列を示す。
配列番号23は、CsgF相同体A0A0W1SRL3の残基21~53に対応するペプチドのアミノ酸配列を示す。
配列番号24は、CsgF相同体B0UH01の残基26~59に対応するペプチドのアミノ酸配列を示す。
配列番号25は、CsgF相同体Q6NAU5の残基22~53に対応するペプチドのアミノ酸配列を示す。
配列番号26は、CsgF相同体G8PUY5の7~38残基に相当するペプチドのアミノ酸配列を示す。
配列番号27は、CsgF相同体A0A0S2ETP7の残基25~57に対応するペプチドのアミノ酸配列を示す。
配列番号28は、CsgF相同体E3I1Z1の残基19~51に対応するペプチドのアミノ酸配列を示す。
配列番号29は、CsgF相同体F3Z094の残基24~55に対応するペプチドのアミノ酸配列を示す。
配列番号30は、CsgF相同体A0A176T7M2の残基21~53に対応するペプチドのアミノ酸配列を示す。
配列番号31は、CsgF相同体D2QPP8の残基14~45に対応するペプチドのアミノ酸配列を示す。
配列番号32は、CsgF相同体N2IYT1の残基28~58に対応するペプチドのアミノ酸配列を示す。
配列番号33は、CsgF相同体W7QHV5の残基26~58に対応するペプチドのアミノ酸配列を示す。
配列番号34は、CsgF相同体D4ZLW2の残基23~55に対応するペプチドのアミノ酸配列を示す。
配列番号35は、CsgF相同体D2QT92の残基21~53に対応するペプチドのアミノ酸配列を示す。
配列番号36は、CsgF相同体A0A167UJA2の残基20~51に対応するペプチドのアミノ酸配列を示す。
配列番号37は、アミノ酸20~27を包含する野生型E. coli CsgF断片のアミノ酸配列を示す。
配列番号38は、アミノ酸20~38を包含する野生型E. coli CsgF断片のアミノ酸配列を示す。
配列番号39は、アミノ酸20~48を包含する野生型E. coli CsgF断片のアミノ酸配列を示す。
配列番号40は、アミノ酸20~64を包含する野生型E. coli CsgF断片のアミノ酸配列を示す。
配列番号41は、プライマーCsgF_d27_endのヌクレオチド配列を示す。
配列番号42は、プライマーCsgF_d38_endのヌクレオチド配列を示す。
配列番号43は、プライマーCsgF_d48_endのヌクレオチド配列を示す。
配列番号44は、プライマーCsgF_d64_endのヌクレオチド配列を示す。
配列番号45は、プライマーpNa62_CsgF_histag_Fwのヌクレオチド配列を示す。
配列番号46は、プライマーCsgF-His_Pet22b_FW のヌクレオチド配列を示す。
配列番号47は、プライマーCsgF-His_Pet22b_Rev のヌクレオチド配列を示す。
配列番号48は、プライマーcsGeFG_PdONR221_FW のヌクレオチド配列を示す。
配列番号49は、プライマーcsGeFG_PdONR221_Rev のヌクレオチド配列を示す。
配列番号50は、プライマーMut_csgF_His_FW のヌクレオチド配列を示す。
配列番号51は、プライマーMut_csgF_His_Rev のヌクレオチド配列を示す。
配列番号52は、プライマーDelCsgE_Rev のヌクレオチド配列を示す。
配列番号53は、プライマーDelCsgE FW のヌクレオチド配列を示す。
配列番号54は、成熟E. coli CsgFの残基1~30のアミノ酸配列を示す。
配列番号55は、成熟E. coli CsgFの残基1~35のアミノ酸配列を示す。
配列番号56は、シグナル配列を有する突然変異(T4C/N17S)CsgF配列のアミノ酸配列と、成熟タンパク質の配列の残基35と36の間に挿入されたTEVプロテアーゼ切断部位(ENLYFQS)を示す。
配列番号57は、シグナル配列を有する突然変異(N17S-Del)CsgF配列のアミノ酸配列と、成熟タンパク質の配列の残基35と36の間に挿入されたTEVプロテアーゼ切断部位(ENLYFQS)を示す。
配列番号58は、シグナル配列を有する突然変異(G1C/N17S)CsgF配列のアミノ酸配列と、成熟タンパク質の配列の残基35と36の間に挿入されたTEVプロテアーゼ切断部位(ENLYFQS)を示す。
配列番号59は、シグナル配列を有する突然変異(G1C)CsgF配列のアミノ酸配列と、成熟タンパク質の配列の残基35と36の間に挿入されたTEVプロテアーゼ切断部位(ENLYFQS)を示す。
配列番号60は、シグナル配列を有するCsgFのアミノ酸配列と、成熟タンパク質の配列の残基45および46の間に挿入されたTEVプロテアーゼ切断部位(ENLYFQS)と、C末端のHis10タグを示す。
配列番号61は、シグナル配列を有するCsgFのアミノ酸配列と、成熟タンパク質の配列の残基35および36の間に挿入されたTEVプロテアーゼ切断部位(ENLYFQS)と、C末端のHis10タグを示す。
配列番号62は、シグナル配列を有するCsgFのアミノ酸配列と、成熟タンパク質の配列の残基30および31の間に挿入されたTEVプロテアーゼ切断部位(ENLYFQS)と、C末端のHis10タグを示す。
配列番号63は、シグナル配列を有するCsgFのアミノ酸配列と、成熟タンパク質の配列の残基45および51の間に挿入されたTEVプロテアーゼ切断部位(ENLYFQS)と、C末端のHis10タグを示す。
配列番号64は、シグナル配列を有するCsgFのアミノ酸配列と、成熟タンパク質の配列の残基30および37の間に挿入されたTEVプロテアーゼ切断部位(ENLYFQS)と、C末端のHis10タグを示す。
配列番号65は、シグナル配列を有するCsgFのアミノ酸配列と、成熟タンパク質の配列の残基34および36の間に挿入されたHCV C3プロテアーゼ切断部位(LEVLFQGP)と、C末端のHis10タグを示す。
配列番号66は、シグナル配列を有するCsgFのアミノ酸配列と、成熟タンパク質の配列の残基42および43の間に挿入されたHCV C3プロテアーゼ切断部位(LEVLFQGP)と、C末端のHis10タグを示す。
配列番号67は、シグナル配列を有するCsgFのアミノ酸配列と、成熟タンパク質の配列の残基38および47の間に挿入されたHCV C3プロテアーゼ切断部位(LEVLFQGP)と、C末端のHis10タグを示す。
配列番号68は、仮説的タンパク質CKO_02032[Citrobacter koseri ATCC BAA-895] のYP_001453594.1:1-248のアミノ酸配列を示し、これは配列番号3と99%同一である。
配列番号69は、curli生産組立/輸送構成要素CsgG、部分的に[Salmonella enterica]のWP_001787128.1:16-238のアミノ酸配列を示し、これは配列番号3に対して98%である。
配列番号70は、curli生産組立/輸送タンパク質CsgG [Citrobacter amalonaticus]のKEY44978.1|:16-277のアミノ酸配列を示し、これは、配列番号3と98%同一である。
配列番号71は、curli生産組立/輸送構成要素 [Citrobacter rodentium ICC168]のYP_003364699.1:16-277のアミノ酸配列を示し、これは配列番号3と97%同一である。
配列番号72は、curli生産組立/輸送構成要素CsgG [Enterobacter asburiae LF7a]のYP_004828099.1:16-277のアミノ酸配列を示し、これは配列番号3と94%同一である。
配列番号73は、輸送体 [Yokenella regensburgei] のWP_006819418.1:19-280のアミノ酸配列を示し、これは配列番号3と91%同一である。
配列番号74は、curli生産組立/輸送タンパク質 CsgG [Cronobacter pulveris]の WP_024556654.1:16-277のアミノ酸配列を示し、これは配列番号3と89%同一である。
配列番号75は、curli生産組立/輸送タンパク質 CsgG [Rahnella aquatilis HX2] のYP_005400916.1 :16-277のアミノ酸配列を示し、これは配列番号3と84%同一である。
配列番号76は、CsgG family curli生産組立/輸送構成要素 [Kluyvera ascorbata ATCC 33433] のKFC99297.1:20-278のアミノ酸配列を示し、これは配列番号3と82%同一である。
配列番号77は、CsgG family curli生産組立/輸送構成要素 [Hafnia alvei ATCC 13337] のKFC86716.1|:16-274のアミノ酸配列を示し、これは配列番号3と81%同一である。
配列番号78は、curliポリマーの形成に関与する特徴付けされていないタンパク質 [Enterobacteriaceae bacterium strain FGI 57]のYP_007340845.1|:16-270のアミノ酸配列を示し、これは配列番号3と76%同一である。
配列番号79は、curli生産組立/輸送タンパク質CsgG [Plesiomonas shigelloides]のWP_010861740.1:17-274のアミノ酸配列を示し、これは配列番号3と70%同一である。
配列番号80は、curli生産組立/輸送外膜リポタンパク質構成要素CsgG [Vibrio fischeri ES114]の YP_205788.1 :23-270のアミノ酸配列を示し、これは配列番号3と60%同一である。
配列番号81は、curli生産組立タンパク質CsgG [Aliivibrio logei]の WP_017023479.1:23-270のアミノ酸配列を示し、これは配列番号3と59%同一である。
配列番号82は、curli生産組立/輸送構成要素CsgG [Photobacterium sp. AK15]のWP_007470398.1:22-275のアミノ酸配列を示し、これは 配列番号3と57%同一である。
配列番号83は、curli生産組立タンパク質CsgG [Aeromonas veronii]の WP_021231638.1:17-277のアミノ酸配列を示し、これは配列番号3と56%同一である。
配列番号84は、curli生産組立/輸送タンパク質CsgG [Shewanella sp. ECSMB14101]の WP_033538267.1:27-265のアミノ酸配列を示し、これは 配列番号3と56%同一である。
配列番号85は、curli生産組立タンパク質CsgG [Pseudomonas putida]のWP_003247972.1:30-262のアミノ酸配列を示し、これは配列番号3と54%同一である。
配列番号86は、curli生産組立/輸送構成要素CsgG [Shewanella violacea DSS12]のYP_003557438.1:1-234のアミノ酸配列を示し、これは配列番号3と53%同一である。
配列番号87は、curli生産組立/輸送タンパク質CsgG [Marinobacterium jannaschii]のWP_027859066.1:36-280のアミノ酸配列を示し、これは配列番号3と53%同一である。
配列番号88は、curli生産組立/輸送構成要素CsgG [Chryseobac
terium oranimense G311]のCEJ70222.1:29-26
2のアミノ酸配列を示し、これは配列番号3と50%同一である。

本発明の様々な実施形態を以下に示す。
1.CsgG細孔および修飾CsgFペプチドを含む細孔であって、前記修飾CsgFペプチドがCsgGに結合され、前記細孔内に収縮部を形成する、細孔。
2.前記CsgFペプチドが、CsgFのC末端ヘッドドメインおよびCsgFのネックドメインの少なくとも一部とを欠く、切断CsgFペプチドである、請求項1に記載の細孔。
3.前記CsgFペプチドが、25~50アミノ酸の長さを有する、請求項1または2に記載の細孔。
4.前記CsgFペプチドが、配列番号6の残基1から配列番号6の残基28~45のいずれか一つ、または配列番号6の相同体またはそのいずれかの変異体の対応する残基までのアミノ酸配列を含む、請求項1~3のいずれか一項に記載の細孔。
5.前記CsgFペプチドが、配列番号39(配列番号6の残基1~29)またはその相同体または変異体を含む、請求項1~4のいずれか1項に記載の細孔。
6.前記CsgFペプチドが、配列番号15(配列番号6の残基1~34)、配列番号40(配列番号6の残基1~45)、配列番号54(配列番号6の残基1~30)、または配列番号55(配列番号6の残基1~35)またはその相同体または変異体を含む、請求項5に記載の細孔。
7.請求項6に記載の細孔であって、前記CsgFペプチド内において、配列番号 15、配列番号 39、配列番号 40、配列番号54、または配列番号55のうち一つ以上の残基が修飾される、細孔。
8.前記CsgFペプチドが、以下の位置 G1、T4、F5、R8、N9、N11、F12、A26およびQ29のうちの一つ以上に修飾を含む、請求項7に記載の細孔。
9.前記修飾が、システイン、疎水性アミノ酸、荷電アミノ酸、非ネイティブ反応性アミノ酸、または光反応性アミノ酸の導入である、請求項7または8に記載の細孔。
10.前記CsgFペプチドが、以下の位置 N15、N17、A20、N24、A28およびD34のうちの一つ以上に修飾を含む、請求項7~9のいずれか一項に記載の細孔。
11.前記CsgFペプチドが、以下の置換 N15S/A/T/Q/G/L/V/I/F/Y/W/R/K/D/C、N17S/A/T/Q/G/L/V/I/F/Y/W/R/K/D/C、A20S/T/Q/N/G/L/V/I/F/Y/W/R/K/D/C、N24S/T/Q/A/G/L/V/I/F/Y/W/R/K/D/C、A28S/T/Q/N/G/L/V/I/F/Y/W/R/K/D/C、およびD34F/Y/W/R/K/N/Q/Cのうちの一つ以上を含む、請求項10に記載の細孔。
12.前記CsgFペプチドが、以下の置換 G1C、T4C、N17S、およびD34YまたはD34Nのうちの一つ以上を含む、請求項7~11のいずれか一項に記載の細孔。
13.前記CsgFペプチドが、前記C末端に酵素切断部位のすべてまたは一部をさらに含む、請求項7~12のいずれか一項に記載の細孔。
14.前記切断CsgFペプチドが前記CsgG細孔の内腔に挿入される、請求項1~13のいずれか一項に記載の細孔。
15.前記CsgG細孔が6~10個のCsgGモノマーを含む、請求項1~14のいずれか一項に記載の細孔。
16.前記細孔内の前記CsgGモノマー:切断CsgFペプチドの比が1:1である、請求項1~15のいずれか一項に記載の細孔。
17.前記CsgFペプチドと前記CsgG細孔が共有結合されている、請求項1~16のいずれか一項に記載の細孔。
18.請求項17に記載の細孔であって、前記共有結合が、
(i) 配列番号3またはその相同体の132、133、136、138、140、142、144、145、147、149、151、153、155、183、185、187、189、191、201、203、205、207または209に対応する位置にあるシステイン残基、
(ii) 配列番号3またはその相同体の132、133、136、138、140、142、144、145、147、149、151、153、155、183、185、187、189、191、201、203、205、207または209に対応する位置にある非ネイティブ反応性または光反応性アミノ酸、を介する細孔。
19.前記CsgFペプチドおよび前記CsgG細孔が、それぞれ配列番号6および配列番号3の1と153、4と133、5と136、8と187、8と203、9と203、11と142、11と201、12と149、12と203、26と191、および29と144位置の対のうち一つ以上に対応する位置にある残基を介して、共有結合されている、請求項17または18に記載の細孔。
20.前記共有結合性がジスルフィド結合、またはクリックケミストリーである、請求項17~19のいずれか一項に記載の細孔。
21.前記CsgFペプチドと前記CsgG細孔との間の相互作用が、それぞれ配列番号6および配列番号3の1と153、4と133、5と136、8と187、8と203、9と203、11と142、11と201、12と149、12と203、26と191、および29と144の位置の対のうち一つ以上に対応する位置での疎水性相互作用、または静電気的相互作用または共有結合相互作用により安定化される、請求項1~20のいずれか一項に記載の細孔。
22.前記CsgG細孔が、配列番号3の以下の修飾
(i) 位置Y51、N55およびF56の一つ以上での修飾、
(ii) R97WまたはR97YおよびR93WまたはR93Yから選択される少なくとも一つの置換、
(iii) 配列番号3のV105、A106、およびI107の欠失、
(iv) 配列番号3の位置R192、F193、I194、D105、Y196、Q197、R198、L199、およびE201のうちの一つ以上の欠失、
(v) K94N/Q/R/F/Y/W/L/S、D43S、E44S、F48S/N/Q/Y/W/I/V/H/R/K、Q87N/R/K、N91K/R、R97F/Y/W/V/I/K/S/Q/H、E101I/L/A/H、N102K/Q/L/I/V/S/H、R110F/G/N、Q114R/K、R142Q/S、T150Y/A/V/L/S/Q/Nから選択される少なくとも一つの置換、および/または
(vi) 位置I41、R93、A98、Q100、G103、T104、A106、I107、N108、L113、S115、T117、Y130、K135、E170、S208、D233、D238、E244、Q42、E44、L90、N91、I95、A99、E101およびQ114のうち一つ以上での修飾、に対応する一つ以上の修飾を含む少なくとも一つのモノマーを含む、請求項1~21のいずれか一項に記載の細孔。
23.前記CsgG細孔が、配列番号3の以下の修飾
(i) Y51A/I/V/S/T、N55A/I/V/S/TおよびF56/A/I/V/S/T/Qから選択される少なくとも一つの置換、
(ii) 前記置換R97W、
(iii) F193、I194、D195、Y196、Q197、R198およびL199の欠失、またはD195、Y196、Q197、R198およびL199の欠失、
(iv) V105、A106およびI107の欠失、
(v) K94QおよびK94Nから選択される置換、
(vi) Q42KまたはQ42R、E44NまたはE44Q、L90RまたはL90K、N91RまたはN91K、I95RまたはI95K、A99RまたはA99K、E101H、E101K、E101N、E101QまたはE101T、および/またはQ114Kから選択される少なくとも一つの置換、および/または
(vii) 前記置換N55V、に対応する一つ以上の修飾を含む少なくとも一つのモノマーを含む、請求項22に記載の細孔。
24.前記CsgG細孔が、配列番号3のR192に対応する位置に、RまたはKを含む少なくとも一つのモノマーを含む、請求項1~23のいずれか一項に記載の細孔。
25.二つのCsgG細孔を含む二重細孔であり、前記CsgFペプチドが前記CsgG細孔のうちの少なくとも一つの内腔に挿入される、請求項1~24のいずれか一項に記載の細孔。
26.膜内に含まれる、請求項1~25のいずれか一項に記載の細孔。
27.前記方法が、一つ以上のCsgGモノマーおよびCsgFペプチドを宿主細胞内で共発現し、それによって前記細胞内の膜貫通細孔複合体形成を許容する工程を含む、請求項1~26のいずれか一項に記載の細孔を生成する方法。
28.前記方法が、一つ以上の精製されたCsgGモノマーを修飾CsgFペプチドと接触させて、それによって前記細孔のin vitro形成を許容する工程を含む、請求項1~26のいずれか一項に記載の細孔を生成するための方法。
29.前記修飾CsgFペプチドが切断される、請求項27または28に記載の細孔を生成する方法。
30.前記方法が、前記CsgFペプチドの切断がCsgG結合領域と前記細孔内に収縮部を形成する領域とを含む切断CsgFペプチドを生成するように位置付けられた酵素切断部位を含む、修飾CsgFペプチドを発現する工程を含み、前記方法が、前記CsgFペプチドを切断する工程を含む、請求項27または28に記載の細孔を生成する方法。
31.前記修飾CsgFペプチドが配列番号15または配列番号16またはその相同体もしくは突然変異体を含む、請求項27~30のいずれか一項に記載の方法。
32.標的分析物の存在、不在または一つ以上の特性を決定するための方法であって、
(i) 前記標的分析物が前記細孔複合体内に移動するように、請求項1~26のいずれか一項に記載の細孔に前記標的分析物を接触させる工程と、
(ii) 前記分析物が前記細孔複合体を通って移動する時に、一つ以上の測定値を取り、それによって前記分析物の存在、不在または一つ以上の特性を決定する工程とを含む、方法。
33.前記分析物が、(ポリ)ペプチド、多糖類、小さな有機化合物または無機化合物(薬理学的活性化合物、有毒化合物および汚染物質など)である、請求項32に記載の方法。
34.前記分析物がポリヌクレオチドである、請求項32に記載の方法。
35.前記ポリヌクレオチドが少なくとも1つのホモポリマー領域を含む、請求項34に記載の方法。
36.(i)前記ポリヌクレオチドの長さ、(ii)前記ポリヌクレオチドの同一性、(iii)前記ポリヌクレオチドの配列、(iv)前記ポリヌクレオチドの二次構造および(v)前記ポリヌクレオチドが修飾されているかどうかのうち一つ以上の特性を決定する工程を含む、請求項34または35に記載の方法。
37.請求項1~26のいずれか一項に記載の細孔を使用してポリヌクレオチドまたは(ポリ)ペプチドを特徴付ける方法。
38.標的分析物の存在、不在または一つ以上の特性を決定するための、請求項1~26のいずれか一項に記載の細孔の使用。
39.請求項1~26のいずれか(a)項に記載の細孔と、(b)膜の構成要素とを含む標的分析物を特徴付けるためのキット。
40.CsgG結合領域を含む修飾CsgFペプチドと、細孔内に収縮部を形成する領域とを含む、CsgFペプチド。
41.CsgFのC末端ヘッドドメインを欠く切断CsgFペプチドである、請求項40に記載のCsgFペプチド。
42.CsgFの前記ネックドメインの少なくとも一部を欠く、請求項41に記載のCsgFペプチド。
43.前記CsgFのC末端ヘッドドメイン、および前記CsgFのネックドメインを欠く、請求項42に記載のCsgFペプチド。
44.25~50アミノ酸の長さを有する、請求項40~43のいずれか一項に記載のCsgFペプチド。
45.配列番号6の残基1から配列番号6または相同体またはその変異体の残基28~45のうちいずれか一つまでのアミノ酸配列を含む、請求項40~44のいずれか一項に記載のCsgFペプチド。
46.配列番号39(配列番号6の残基1~29)またはその相同体または変異体を含む、請求項40~45のいずれか一項に記載のCsgFペプチド。
47.配列番号15(配列番号6の残基1~34)、配列番号54(配列番号6の残基1~30)、配列番号40(配列番号6の残基1~45)、または配列番号55(配列番号6の残基1~35)またはその相同体または変異体を含む、請求項46に記載のCsgFペプチド。
48.請求項45~47のいずれか一項に記載のCsgFペプチドであって、配列番号 6、配列番号 15、配列番号 39、配列番号 40、配列番号54の残基1と残基28~45との間の領域または配列番号55(残基1~35)にある一つ以上の残基が修飾される、CsgFペプチド。
49.以下の位置 G1、T4、F5、R8、N9、N11、F12、A26およびQ29のうちの一つ以上における修飾を含む、請求項48に記載のCsgFペプチド。
50.前記修飾が、システイン、疎水性アミノ酸、荷電アミノ酸、非ネイティブ反応性アミノ酸、または光反応性アミノ酸の導入である、請求項45に記載のCsgFペプチド。
51.以下の位置 N15、N17、A20、N24、A28およびD34のうちの一つ以上における修飾を含む、請求項48~50のいずれか一項に記載のCsgFペプチド。
52.以下の置換 N15S/A/T/Q/G/L/V/I/F/Y/W/R/K/D/C、N17S/A/T/Q/G/L/V/I/F/Y/W/R/K/D/C、A20S/T/Q/N/G/L/V/I/F/Y/W/R/K/D/C、N24S/T/Q/A/G/L/V/I/F/Y/W/R/K/D/C、A28S/T/Q/N/G/L/V/I/F/Y/W/R/K/D/C、およびD34F/Y/W/R/K/N/Q/Cのうちの一つ以上を含む、請求項51に記載のCsgFペプチド。
53.以下の置換 G1C、T4C、N17S、およびD34YまたはD34Nのうちの一つ以上を含む、請求項48~52のいずれか一項に記載のCsgFペプチド。
54.前記C末端に酵素切断部位のすべてまたは一部をさらに含む、請求項40~53のいずれか一項に記載のCsgFペプチド。
55.シグナルペプチドをさらに含む、請求項40~54のいずれか一項に記載のCsgFペプチド。
56.請求項40~55のいずれか一項に記載のCsgFペプチドをコードするポリヌクレオチド。
57.細孔複合体であって、
(i) 第一の開口部と、βバレルを含む中間部分と、第二の開口部と、前記第一の開口部から前記中間部分を通って前記第二の開口部に延びる内腔とを含み、前記中間部分の内腔表面がCsgG収縮部を画定するCsgG細孔と、
(ii) それぞれがCsgF収縮領域およびCsgG結合領域を有する複数の修飾CsgFペプチドであって、前記修飾CsgFペプチドが、前記CsgG細孔内に前記βバレル内のCsgF収縮部を形成し、前記CsgG収縮部および前記CsgF収縮部が、前記CsgG細孔の前記βバレル内で同軸的に間隙を介しているものとを含む、細孔複合体。
58.前記内腔表面が前記CsgG収縮部を画定するCsgGモノマーの一つ以上のループ領域を含む、請求項57に記載の細孔複合体。
59.前記CsgF収縮領域および前記CsgG結合領域が、CsgF成熟ペプチドのN末端部分に対応する、請求項57に記載の細孔複合体。
60.前記細孔複合体がCsgA、CsgBおよびCsgEを含まない、請求項57に記載の細孔複合体。
61.前記CsgFペプチドが、前記CsgG細孔に共有結合されている、請求項57に記載の細孔複合体。
Figure 0007282697000008
Figure 0007282697000009
Figure 0007282697000010
Figure 0007282697000011
Figure 0007282697000012
Figure 0007282697000013
Figure 0007282697000014
タンパク質に作製されたプロテアーゼ切断部位を有するCsgF配列の例。シグナルペプチドは太字で、TEVプロテアーゼ切断部位は太字および下線で、およびHCV C3プロテアーゼ切断部位は下線で表示されている。StrepIIはC末端におけるストレップタグを示し、H10はC末端で10xHistidineタグを示し、**はSTOPコドンを示す。
Figure 0007282697000015
Figure 0007282697000016
Figure 0007282697000017
Figure 0007282697000018
Figure 0007282697000019
Figure 0007282697000020
Figure 0007282697000021
Figure 0007282697000022

Claims (18)

  1. CsgFのC末端ヘッドドメインを欠き、CsgFのネックドメインの少なくとも一部を欠く切断CsgFペプチドであって、CsgG結合領域と、CsgGおよび前記切断CsgFペプチドを含む細孔内に収縮部を形成する領域を含み、
    前記CsgFペプチドは25~50アミノ酸の長さを有し、
    前記CsgFペプチドは、
    (i)配列番号6の残基1から配列番号6の残基28~45のうちいずれか一つまでのアミノ酸配列、または配列番号6の残基1から配列番号6の残基28~45のうちいずれか一つまでのアミノ酸配列と少なくとも90%の配列同一性を有するその相同体またはその変異体、
    (ii)配列番号39(配列番号6の残基1~29)、または配列番号6と少なくとも90%の配列同一性を有するその相同体またはその変異体、
    (iii)配列番号15(配列番号6の残基1~34)、または配列番号6と少なくとも90%の配列同一性を有するその相同体またはその変異体
    (iv)配列番号54(配列番号6の残基1~30)、または配列番号6と少なくとも90%の配列同一性を有するその相同体またはその変異体、
    (v)配列番号40(配列番号6の残基1~45)、または配列番号6と少なくとも90%の配列同一性を有するその相同体またはその変異体、または
    (vi)配列番号55(配列番号6の残基1~35)、または配列番号6と少なくとも90%の配列同一性を有するその相同体またはその変異体
    を含み、
    前記(i)~(vi)に記載の相同体またはその変異体は、CsgGに結合し、細孔内に収縮部を形成することができる、
    切断CsgFペプチド。
  2. 配列番号6の残基1と残基28~45との間の領域、配列番号15、配列番号39、配列番号40、配列番号54または配列番号55(残基1~35)にある一つ以上の残基が修飾されている、請求項1に記載のCsgFペプチド。
  3. 前記修飾が以下の位置:G1、T4、F5、R8、N9、N11、F12、A26およびQ29のうちの一つ以上における修飾であり、前記修飾が、システイン、疎水性アミノ酸、荷電アミノ酸、非ネイティブ反応性アミノ酸、または光反応性アミノ酸の導入である、請求項2に記載のCsgFペプチド。
  4. 以下の位置:N15、N17、A20、N24、A28およびD34のうちの一つ以上における修飾を含み、以下の置換:N15S/A/T/Q/G/L/V/I/F/Y/W/R/K/D/C、N17S/A/T/Q/G/L/V/I/F/Y/W/R/K/D/C、A20S/T/Q/N/G/L/V/I/F/Y/W/R/K/D/C、N24S/T/Q/A/G/L/V/I/F/Y/W/R/K/D/C、A28S/T/Q/N/G/L/V/I/F/Y/W/R/K/D/C、およびD34F/Y/W/R/K/N/Q/Cのうちの一つ以上を含む、請求項2または3に記載のCsgFペプチド。
  5. 以下の置換:G1C、T4C、N17S、およびD34YまたはD34Nのうちの一つ以上を含む、請求項3または4に記載のCsgFペプチド。
  6. 前記C末端に酵素切断部位のすべてまたは一部および/またはシグナルペプチドをさらに含む、請求項1~5のいずれか一項に記載のCsgFペプチド。
  7. sgG細孔および請求項1~6のいずれか一項に記載の切断CsgFペプチドを含む細孔であって、前記切断CsgFペプチドがCsgGに結合され、前記細孔内に収縮部を形成する、細孔。
  8. 前記切断CsgFペプチドが前記CsgG細孔の内腔に挿入される、請求項7に記載の細孔。
  9. 前記CsgG細孔が6~10個のCsgGモノマーを含む、請求項7または8に記載の細孔。
  10. 前記細孔内の前記CsgGモノマー:切断CsgFペプチドの比が1:1である、請求項7~9のいずれか一項に記載の細孔。
  11. 前記CsgFペプチドと前記CsgG細孔が共有結合されている請求項7~10のいずれか一項に記載の細孔であって、前記共有結合が、
    (i) 配列番号3またはその相同体の132、133、136、138、140、142、144、145、147、149、151、153、155、183、185、187、189、191、201、203、205、207または209に対応する位置にあるシステイン残基、または
    (ii) 配列番号3またはその相同体の132、133、136、138、140、142、144、145、147、149、151、153、155、183、185、187、189、191、201、203、205、207または209に対応する位置にある非ネイティブ反応性または光反応性アミノ酸、
    を介する細孔。
  12. 前記CsgG細孔が、配列番号3の以下の修飾
    (i) 位置Y51、N55およびF56の一つ以上での修飾、
    (ii) R97WまたはR97YおよびR93WまたはR93Yから選択される少なくとも一つの置換、
    (iii) 配列番号3のV105、A106、およびI107の欠失、
    (iv) 配列番号3の位置R192、F193、I194、D195、Y196、Q197、R198、L199、およびE201のうちの一つ以上の欠失または配列番号3のD195、Y196、Q197、R198、およびL199の欠失、
    (v) K94N/Q/R/F/Y/W/L/S、D43S、E44S、F48S/N/Q/Y/W/I/V/H/R/K、Q87N/R/K、N91K/R、R97F/Y/W/V/I/K/S/Q/H、E101I/L/A/H、N102K/Q/L/I/V/S/H、R110F/G/N、Q114R/K、R142Q/S、T150Y/A/V/L/S/Q/Nから選択される少なくとも一つの置換、
    (vi) 位置I41、R93、A98、Q100、G103、T104、A106、I107、N108、L113、S115、T117、Y130、K135、E170、S208、D233、D238、E244、Q42、E44、L90、N91、I95、A99、E101およびQ114のうち一つ以上での修飾、
    (vii) V105、A106およびI107の欠失、
    (viii)Q42KまたはQ42R、E44NまたはE44Q、L90RまたはL90K、N91RまたはN91K、I95RまたはI95K、A99RまたはA99K、E101H、E101K、E101N、E101QまたはE101T、および/またはQ114Kから選択される少なくとも一つの置換、および/または
    (x) 置換N55V
    に対応する一つ以上の修飾を含む少なくとも一つのモノマーを含む、請求項7~11のいずれか一項に記載の細孔。
  13. 前記CsgG細孔が、Y51A/I/V/S/T、N55A/I/V/S/TおよびF56/A/I/V/S/T/Qから選択される少なくとも一つの置換を含む、請求項12に記載の細孔。
  14. 前記CsgG細孔が、配列番号3のR192に対応する位置に、RまたはKを含む少なくとも一つのモノマーを含む、請求項7~13のいずれか一項に記載の細孔。
  15. 一つ以上のCsgGモノマーおよびCsgFペプチドを宿主細胞内で共発現し、それによって前記細胞内の膜貫通細孔複合体形成をさせる工程、または一つ以上の精製されたCsgGモノマーを修飾CsgFペプチドと接触させて、それによって前記細孔のin vitro形成をさせる工程を含む、請求項7~14のいずれか一項に記載の細孔を生成する方法。
  16. 前記CsgFペプチドの切断がCsgG結合領域と前記細孔内に収縮部を形成する領域とを含む切断CsgFペプチドを生成するように位置付けられた酵素切断部位を含む、修飾CsgFペプチドを発現する工程を含み、前記CsgFペプチドを切断する工程を含む、請求項15に記載の細孔を生成する方法。
  17. 標的分析物の存在、不在または一つ以上の特性を決定するための方法であって、
    (i) 前記標的分析物が前記細孔複合体内に移動するように、請求項7~14のいずれか一項に記載の細孔に前記標的分析物を接触させる工程と、
    (ii) 前記分析物が前記細孔複合体を通って移動する時に、一つ以上の測定値を取り、それによって前記分析物の存在、不在または一つ以上の特性を決定する工程とを含む、方法。
  18. 請求項7~14のいずれか一項に記載の細孔と、(b)膜の構成要素とを含む、標的分析物を特徴付けるためのキット。
JP2019572644A 2017-06-30 2018-07-02 新規タンパク質細孔 Active JP7282697B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023081191A JP2023113692A (ja) 2017-06-30 2023-05-17 新規タンパク質細孔

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17179099.1 2017-06-30
EP17179099 2017-06-30
PCT/GB2018/051858 WO2019002893A1 (en) 2017-06-30 2018-07-02 NEW PROTEIN PORES

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023081191A Division JP2023113692A (ja) 2017-06-30 2023-05-17 新規タンパク質細孔

Publications (4)

Publication Number Publication Date
JP2020530276A JP2020530276A (ja) 2020-10-22
JP2020530276A5 JP2020530276A5 (ja) 2021-07-26
JPWO2019002893A5 JPWO2019002893A5 (ja) 2022-11-16
JP7282697B2 true JP7282697B2 (ja) 2023-05-29

Family

ID=59362906

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019572644A Active JP7282697B2 (ja) 2017-06-30 2018-07-02 新規タンパク質細孔
JP2023081191A Pending JP2023113692A (ja) 2017-06-30 2023-05-17 新規タンパク質細孔

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023081191A Pending JP2023113692A (ja) 2017-06-30 2023-05-17 新規タンパク質細孔

Country Status (9)

Country Link
US (3) US11572387B2 (ja)
EP (2) EP4273156A3 (ja)
JP (2) JP7282697B2 (ja)
KR (1) KR20200030070A (ja)
CN (3) CN117106037A (ja)
AU (1) AU2018294660B2 (ja)
CA (1) CA3066715A1 (ja)
SG (1) SG11201913174PA (ja)
WO (1) WO2019002893A1 (ja)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6271505B2 (ja) 2012-04-10 2018-01-31 オックスフォード ナノポール テクノロジーズ リミテッド 変異体ライセニンポア
GB201313477D0 (en) 2013-07-29 2013-09-11 Univ Leuven Kath Nanopore biosensors for detection of proteins and nucleic acids
CN111534504B (zh) 2014-01-22 2024-06-21 牛津纳米孔科技公开有限公司 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法
CN106459159B (zh) 2014-05-02 2021-11-30 牛津纳米孔技术公司 突变孔
WO2017149317A1 (en) 2016-03-02 2017-09-08 Oxford Nanopore Technologies Limited Mutant pore
CN118256605A (zh) 2016-04-06 2024-06-28 牛津纳米孔科技公开有限公司 突变体孔
GB201707122D0 (en) 2017-05-04 2017-06-21 Oxford Nanopore Tech Ltd Pore
SG11201913174PA (en) 2017-06-30 2020-01-30 Vib Vzw Novel protein pores
CA3118808A1 (en) * 2018-11-08 2020-05-14 Oxford Nanopore Technologies Limited Pore
CN113150073B (zh) * 2020-01-07 2022-06-17 清华大学 革兰氏阴性菌八型分泌系统抑制剂及其应用
IL299272A (en) 2020-07-02 2023-02-01 Illumina Inc Devices with field effect transistors
WO2022020461A1 (en) 2020-07-22 2022-01-27 Oxford Nanopore Technologies Inc. Solid state nanopore formation
US20220059187A1 (en) 2020-08-07 2022-02-24 Oxford Nanopore Technologies Limited Methods of detecting nucleic acid barcodes
EP4341433A1 (en) 2021-05-19 2024-03-27 Oxford Nanopore Technologies PLC Methods for complement strand sequencing
GB202107192D0 (en) 2021-05-19 2021-06-30 Oxford Nanopore Tech Ltd Method
EP4371998A1 (en) * 2021-08-18 2024-05-22 Qitan Technology Ltd., Chengdu Mutant of porin monomer, protein pore and application thereof
CN113480620B (zh) * 2021-08-18 2024-02-06 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
CN113651876B (zh) * 2021-08-18 2024-02-02 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
EP4371997A1 (en) * 2021-08-18 2024-05-22 Qitan Technology Ltd., Chengdu Mutant of pore protein monomer, protein pore, and use thereof
GB2610380A (en) 2021-08-23 2023-03-08 Cambridge Entpr Ltd Nucleic acid detection
WO2023050031A1 (zh) * 2021-09-28 2023-04-06 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
CN113735948B (zh) * 2021-09-28 2024-02-02 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
GB202113935D0 (en) 2021-09-29 2021-11-10 Cambridge Entpr Ltd Nucleic acid characterisation
CN113896776B (zh) * 2021-10-12 2024-02-06 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
WO2023060422A1 (zh) * 2021-10-12 2023-04-20 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
WO2023060419A1 (zh) * 2021-10-12 2023-04-20 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
CN113912683B (zh) * 2021-10-12 2024-02-06 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
CN113754743B (zh) * 2021-10-12 2024-02-02 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
WO2023060418A1 (zh) * 2021-10-12 2023-04-20 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
CN113773373B (zh) * 2021-10-12 2024-02-06 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
WO2023060421A1 (zh) * 2021-10-12 2023-04-20 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
WO2023060420A1 (zh) * 2021-10-12 2023-04-20 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
WO2023094806A1 (en) 2021-11-29 2023-06-01 Oxford Nanopore Technologies Plc Nanopore measurement signal analysis
GB202118906D0 (en) 2021-12-23 2022-02-09 Oxford Nanopore Tech Ltd Method
GB202118908D0 (en) 2021-12-23 2022-02-09 Oxford Nanopore Tech Ltd Method
GB202205617D0 (en) 2022-04-14 2022-06-01 Oxford Nanopore Tech Plc Novel modified protein pores and enzymes
CN114957412B (zh) * 2022-04-28 2024-09-17 清华大学 一种新型孔蛋白单体及其应用
WO2023222657A1 (en) 2022-05-17 2023-11-23 Oxford Nanopore Technologies Plc Method and adaptors
GB202211602D0 (en) 2022-08-09 2022-09-21 Oxford Nanopore Tech Plc Novel pore monomers and pores
GB202211607D0 (en) 2022-08-09 2022-09-21 Oxford Nanopore Tech Plc Novel pore monomers and pores
WO2024033447A1 (en) 2022-08-09 2024-02-15 Oxford Nanopore Technologies Plc De novo pores
WO2024033443A1 (en) 2022-08-09 2024-02-15 Oxford Nanopore Technologies Plc Novel pore monomers and pores
GB202215442D0 (en) 2022-10-19 2022-11-30 Oxford Nanopore Tech Plc Analysis of a polymer
WO2024089270A2 (en) 2022-10-28 2024-05-02 Oxford Nanopore Technologies Plc Pore monomers and pores
GB202216162D0 (en) 2022-10-31 2022-12-14 Oxford Nanopore Tech Plc Method
WO2024094966A1 (en) 2022-11-01 2024-05-10 Oxford Nanopore Technologies Plc Biochemical analysis system and method of controlling a biochemical analysis system
GB202216905D0 (en) 2022-11-11 2022-12-28 Oxford Nanopore Tech Plc Novel pore monomers and pores
WO2024138382A1 (zh) * 2022-12-27 2024-07-04 深圳华大生命科学研究院 孔蛋白单体、孔蛋白及其突变体和其应用
WO2024138472A1 (zh) * 2022-12-28 2024-07-04 青岛华大基因研究院 孔蛋白单体、孔蛋白及其突变体和其应用
WO2024138425A1 (zh) * 2022-12-28 2024-07-04 深圳华大生命科学研究院 一种新型纳米孔蛋白及其应用
WO2024138565A1 (zh) * 2022-12-29 2024-07-04 深圳华大生命科学研究院 纳米孔蛋白及其突变体和应用
GB202304324D0 (en) 2023-03-24 2023-05-10 Oxford Nanopore Tech Plc Method and kits
GB202307486D0 (en) 2023-05-18 2023-07-05 Oxford Nanopore Tech Plc Method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017527284A (ja) 2014-09-01 2017-09-21 ブイアイビー ブイゼットダブリュVib Vzw 変異体ポア
JP2019511217A (ja) 2016-03-02 2019-04-25 オックスフォード ナノポール テクノロジーズ リミテッド 変異体ポア

Family Cites Families (111)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5795782A (en) 1995-03-17 1998-08-18 President & Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
US6362002B1 (en) 1995-03-17 2002-03-26 President And Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
JP3891620B2 (ja) 1996-11-14 2007-03-14 株式会社アイシン・コスモス研究所 ヘアピン型構造の核酸プローブ分子、及び該核酸プローブ分子を利用した核酸検出方法
US20020197614A1 (en) 1997-05-16 2002-12-26 Mosaic Technologies, Inc. Electrophoretic analysis of target molecules using adapter molecules
WO1999005167A1 (en) 1997-07-25 1999-02-04 University Of Massachusetts Designed protein pores as components for biosensors
US6743605B1 (en) 1998-06-24 2004-06-01 Enzo Life Sciences, Inc. Linear amplification of specific nucleic acid sequences
US6150112A (en) 1998-09-18 2000-11-21 Yale University Methods for identifying DNA sequences for use in comparison of DNA samples by their lack of polymorphism using Y shape adaptors
US6267872B1 (en) 1998-11-06 2001-07-31 The Regents Of The University Of California Miniature support for thin films containing single channels or nanopores and methods for using same
US6426231B1 (en) 1998-11-18 2002-07-30 The Texas A&M University System Analyte sensing mediated by adapter/carrier molecules
NO986133D0 (no) 1998-12-23 1998-12-23 Preben Lexow FremgangsmÕte for DNA-sekvensering
US6627067B1 (en) 1999-06-22 2003-09-30 President And Fellows Of Harvard College Molecular and atomic scale evaluation of biopolymers
JP2003508054A (ja) 1999-08-31 2003-03-04 ニーデルバイス,ミヒャエル チャンネル形成性タンパク質の製造方法
US6916665B2 (en) 2000-02-11 2005-07-12 The Texas A&M University System Biosensor compositions and methods of use
US7078501B2 (en) 2000-02-25 2006-07-18 Invitrogen Corporation Topoisomerase linker-mediated amplification methods
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
AU2002239284A1 (en) 2000-11-27 2002-06-03 The Regents Of The University Of California Methods and devices for characterizing duplex nucleic acid molecules
US6863833B1 (en) 2001-06-29 2005-03-08 The Board Of Trustees Of The Leland Stanford Junior University Microfabricated apertures for supporting bilayer lipid membranes
EP1504114B1 (en) 2002-05-10 2017-07-12 The Texas A & M University System Stochastic sensing through covalent interactions
US20040209299A1 (en) 2003-03-07 2004-10-21 Rubicon Genomics, Inc. In vitro DNA immortalization and whole genome amplification using libraries generated from randomly fragmented DNA
DE602004025801D1 (de) 2003-03-25 2010-04-15 Stratagene California Dna-polymerasefusionen und deren verwendungen
US7163658B2 (en) 2003-04-23 2007-01-16 Rouvain Bension Rapid sequencing of polymers
AU2004289953B2 (en) * 2003-06-18 2008-09-25 Genelux Corporation Modified recombinant vaccina viruses and other microorganisms, uses thereof
AU2003904237A0 (en) 2003-08-08 2003-08-21 Garvan Institute Of Medical Research Novel translocation assay
EP1721283B1 (en) * 2004-02-06 2022-11-30 Council of Scientific and Industrial Research Computational method for identifying adhesin and adhesin-like proteins of therapeutic potential
JP2005253427A (ja) 2004-03-15 2005-09-22 Aisin Seiki Co Ltd 核酸検出方法及び核酸単離方法
WO2006028508A2 (en) 2004-03-23 2006-03-16 President And Fellows Of Harvard College Methods and apparatus for characterizing polynucleotides
US20060105461A1 (en) 2004-10-22 2006-05-18 May Tom-Moy Nanopore analysis system
WO2007084103A2 (en) 2004-12-21 2007-07-26 The Texas A & M University System High temperature ion channels and pores
GB0505971D0 (en) 2005-03-23 2005-04-27 Isis Innovation Delivery of molecules to a lipid bilayer
KR100730350B1 (ko) 2005-10-17 2007-06-19 삼성전자주식회사 표면처리된 나노포어를 이용한 dna 검출방법 및검출장치
GB0523282D0 (en) 2005-11-15 2005-12-21 Isis Innovation Methods using pores
EP1963530B1 (en) 2005-12-22 2011-07-27 Pacific Biosciences of California, Inc. Active surface coupled polymerases
US7849581B2 (en) 2006-05-05 2010-12-14 University Of Utah Research Foundation Nanopore electrode, nanopore membrane, methods of preparation and surface modification, and use thereof
US7638034B2 (en) 2006-09-21 2009-12-29 Los Alamos National Security, Llc Electrochemical detection of single molecules using abiotic nanopores having electrically tunable dimensions
US20110121840A1 (en) 2007-02-20 2011-05-26 Gurdial Singh Sanghera Lipid Bilayer Sensor System
CA2684801C (en) 2007-04-04 2017-10-10 The Regents Of The University Of California Compositions, devices, systems, and methods for using a nanopore
EP3543357A1 (en) 2007-05-08 2019-09-25 Trustees of Boston University Chemical functionalization of solid-state nanopores and nanopore arrays and applications thereof
GB0716264D0 (en) 2007-08-21 2007-09-26 Isis Innovation Bilayers
EP2195648B1 (en) 2007-09-12 2019-05-08 President and Fellows of Harvard College High-resolution molecular graphene sensor comprising an aperture in the graphene layer
GB2453377A (en) 2007-10-05 2009-04-08 Isis Innovation Transmembrane protein pores and molecular adapters therefore.
WO2009052214A2 (en) 2007-10-15 2009-04-23 Complete Genomics, Inc. Sequence analysis using decorated nucleic acids
GB0724736D0 (en) 2007-12-19 2008-01-30 Oxford Nanolabs Ltd Formation of layers of amphiphilic molecules
US8231969B2 (en) 2008-03-26 2012-07-31 University Of Utah Research Foundation Asymmetrically functionalized nanoparticles
CA2991818C (en) 2008-03-28 2022-10-11 Pacific Biosciences Of California, Inc. Compositions and methods for nucleic acid sequencing
US8772041B2 (en) 2008-05-22 2014-07-08 The Regents Of The University Of California Membrane precursors and membranes formed therefrom
US8652771B2 (en) 2008-05-28 2014-02-18 University of Souther California Measurement of succinate in urine samples as a biomarker of kidney damage in diabetic subjects
CN102245760A (zh) 2008-07-07 2011-11-16 牛津纳米孔技术有限公司 酶-孔构建体
CA2730068A1 (en) 2008-07-07 2010-01-14 Oxford Nanopore Technologies Limited Base-detecting pore
CA2774710C (en) 2008-09-22 2016-08-02 University Of Washington Msp nanopores and related methods
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
GB0820927D0 (en) 2008-11-14 2008-12-24 Isis Innovation Method
CN102482330A (zh) 2009-01-30 2012-05-30 牛津纳米孔技术有限公司 酶突变体
CA2750879C (en) 2009-01-30 2018-05-22 Oxford Nanopore Technologies Limited Adaptors for nucleic acid constructs in transmembrane sequencing
GB0905140D0 (en) 2009-03-25 2009-05-06 Isis Innovation Method
AU2010240670B2 (en) 2009-04-20 2015-08-20 Oxford Nanopore Technologies Limited Lipid bilayer sensor array
US8402071B2 (en) 2009-06-19 2013-03-19 Aptare, Inc. Catalog that stores file system metadata in an optimized manner
US9127313B2 (en) 2009-12-01 2015-09-08 Oxford Nanopore Technologies Limited Biochemical analysis instrument
EP3933402A1 (en) 2010-02-23 2022-01-05 University of Washington Method of making unsupported artificial mycolic acid membranes
WO2011125015A2 (en) 2010-04-05 2011-10-13 Bar-Ilan University Protease-activatable pore-forming polypeptides
EP2580588B1 (en) 2010-06-08 2014-09-24 President and Fellows of Harvard College Nanopore device with graphene supported artificial lipid membrane
EP2622343B1 (en) 2010-10-01 2016-01-20 Oxford Nanopore Technologies Limited Biochemical analysis apparatus using nanopores
CN102116783B (zh) 2010-12-31 2013-05-29 北京普源精电科技有限公司 一种波形显示方法
CN102174554A (zh) 2011-01-24 2011-09-07 内蒙古民族大学 双控双调节原核表达载体系统及其构建方法和用途
KR101939420B1 (ko) 2011-02-11 2019-01-16 옥스포드 나노포어 테크놀로지즈 리미티드 돌연변이체 세공
CN102175540B (zh) 2011-02-24 2012-09-26 西北工业大学 一种扭簧扭矩测试装置
CN114262690A (zh) * 2011-04-15 2022-04-01 吉恩勒克斯公司 减毒的痘苗病毒的克隆毒株及其使用方法
SG10201604316WA (en) 2011-05-27 2016-07-28 Oxford Nanopore Tech Ltd Coupling method
US9580480B2 (en) 2011-05-31 2017-02-28 Massachusetts Institute Of Technology Cell-directed synthesis of multifunctional nanopatterns and nanomaterials
KR20140050067A (ko) 2011-07-25 2014-04-28 옥스포드 나노포어 테크놀로지즈 리미티드 막횡단 포어를 사용한 이중 가닥 폴리뉴클레오티드 서열분석을 위한 헤어핀 루프 방법
EP2758545B1 (en) 2011-09-23 2017-07-26 Oxford Nanopore Technologies Limited Analysis of a polymer comprising polymer units
KR20140090633A (ko) 2011-10-21 2014-07-17 옥스포드 나노포어 테크놀로지즈 리미티드 포어 및 hel308 헬리카제를 사용하여 표적 폴리뉴클레오티드를 특성화하는 방법
US9617591B2 (en) 2011-12-29 2017-04-11 Oxford Nanopore Technologies Ltd. Method for characterising a polynucleotide by using a XPD helicase
AU2012360244B2 (en) 2011-12-29 2018-08-23 Oxford Nanopore Technologies Limited Enzyme method
EP2807476A4 (en) 2012-01-20 2015-12-09 Genia Technologies Inc MOLECULAR DETECTION AND SEQUENCING USING NANOPORES
US10739341B2 (en) 2012-02-15 2020-08-11 Oxford Nanopore Technologies Limited Aptamer method
JP6271505B2 (ja) 2012-04-10 2018-01-31 オックスフォード ナノポール テクノロジーズ リミテッド 変異体ライセニンポア
TWI655213B (zh) 2012-07-13 2019-04-01 目立康股份有限公司 自我組織化肽衍生物的製造方法
AU2013291765C1 (en) 2012-07-19 2019-08-08 Oxford Nanopore Technologies Limited Enzyme construct
WO2014013259A1 (en) 2012-07-19 2014-01-23 Oxford Nanopore Technologies Limited Ssb method
WO2014013260A1 (en) 2012-07-19 2014-01-23 Oxford Nanopore Technologies Limited Modified helicases
GB201313121D0 (en) 2013-07-23 2013-09-04 Oxford Nanopore Tech Ltd Array of volumes of polar medium
JP6375301B2 (ja) 2012-10-26 2018-08-15 オックスフォード ナノポール テクノロジーズ リミテッド 液滴界面
US9683230B2 (en) 2013-01-09 2017-06-20 Illumina Cambridge Limited Sample preparation on a solid support
CN105074458B (zh) 2013-02-07 2019-06-28 耶路撒冷希伯来大学伊森姆研究发展有限公司 杂化纳米孔及其用于检测分析物的用途
GB201314695D0 (en) 2013-08-16 2013-10-02 Oxford Nanopore Tech Ltd Method
CN105209634B (zh) 2013-03-08 2020-05-12 牛津纳米孔技术公司 酶停滞方法
WO2014142850A1 (en) 2013-03-13 2014-09-18 Illumina, Inc. Methods and compositions for nucleic acid sequencing
US10613076B2 (en) 2013-03-14 2020-04-07 The Trustees Of Boston University Optoelectronic control of solid-state nanopores
GB201313477D0 (en) 2013-07-29 2013-09-11 Univ Leuven Kath Nanopore biosensors for detection of proteins and nucleic acids
EP3825415B1 (en) * 2013-05-24 2024-08-28 Illumina Cambridge Limited Pyrophosphorolytic sequencing using nanopores
WO2015051378A1 (en) 2013-10-04 2015-04-09 University Of Washington Through Its Center For Commercialization Systems and methods for nanopore-based analysis of nucleic acids
GB201406151D0 (en) 2014-04-04 2014-05-21 Oxford Nanopore Tech Ltd Method
JP6677640B2 (ja) 2013-10-18 2020-04-08 オックスフォード ナノポール テクノロジーズ リミテッド 修飾酵素
LT3074534T (lt) 2013-11-26 2019-08-26 Illumina, Inc. Būdai, skirti polinukleotido sekoskaitai
US20160326220A1 (en) * 2013-12-24 2016-11-10 Vib Vzw Secretion and functional display of chimeric polypeptides
CN111534504B (zh) 2014-01-22 2024-06-21 牛津纳米孔科技公开有限公司 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法
GB201406155D0 (en) 2014-04-04 2014-05-21 Oxford Nanopore Tech Ltd Method
GB201403096D0 (en) 2014-02-21 2014-04-09 Oxford Nanopore Tech Ltd Sample preparation method
US10337060B2 (en) 2014-04-04 2019-07-02 Oxford Nanopore Technologies Ltd. Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid
CN106459159B (zh) 2014-05-02 2021-11-30 牛津纳米孔技术公司 突变孔
US10266885B2 (en) 2014-10-07 2019-04-23 Oxford Nanopore Technologies Ltd. Mutant pores
CN107109489B (zh) 2014-10-17 2021-11-30 牛津纳米孔技术公司 纳米孔rna表征方法
GB201502809D0 (en) 2015-02-19 2015-04-08 Oxford Nanopore Tech Ltd Mutant pore
GB201502810D0 (en) 2015-02-19 2015-04-08 Oxford Nanopore Tech Ltd Method
CN107735686B (zh) 2015-04-14 2021-06-11 鲁汶天主教大学 具有内部蛋白质衔接子的纳米孔
CA3011830A1 (en) 2015-12-08 2017-06-15 Katholieke Universiteit Leuven Ku Leuven Research & Development Modified nanopores, compositions comprising the same, and uses thereof
CN118256605A (zh) 2016-04-06 2024-06-28 牛津纳米孔科技公开有限公司 突变体孔
JP7383480B2 (ja) 2017-02-10 2023-11-20 オックスフォード ナノポール テクノロジーズ ピーエルシー 修飾ナノポア、それを含む組成物、およびそれらの使用
GB201707122D0 (en) * 2017-05-04 2017-06-21 Oxford Nanopore Tech Ltd Pore
SG11201913174PA (en) 2017-06-30 2020-01-30 Vib Vzw Novel protein pores
CA3118808A1 (en) 2018-11-08 2020-05-14 Oxford Nanopore Technologies Limited Pore

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017527284A (ja) 2014-09-01 2017-09-21 ブイアイビー ブイゼットダブリュVib Vzw 変異体ポア
JP2019511217A (ja) 2016-03-02 2019-04-25 オックスフォード ナノポール テクノロジーズ リミテッド 変異体ポア
JP2019516346A (ja) 2016-03-02 2019-06-20 オックスフォード ナノポール テクノロジーズ リミテッド 変異体ポア
JP2019516344A (ja) 2016-03-02 2019-06-20 オックスフォード ナノポール テクノロジーズ リミテッド 変異体ポア

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Nature Biotecnology, 2020, Vol.38, pp.1415-1420

Also Published As

Publication number Publication date
US11945840B2 (en) 2024-04-02
CN110914290A (zh) 2020-03-24
EP3645552A1 (en) 2020-05-06
US12084477B2 (en) 2024-09-10
WO2019002893A1 (en) 2019-01-03
US20220024985A9 (en) 2022-01-27
CN117106037A (zh) 2023-11-24
JP2023113692A (ja) 2023-08-16
CA3066715A1 (en) 2019-01-03
US20210284696A1 (en) 2021-09-16
AU2018294660B2 (en) 2022-05-19
CN117106038A (zh) 2023-11-24
US20210147486A1 (en) 2021-05-20
EP4273156A3 (en) 2024-01-17
US20220162264A9 (en) 2022-05-26
SG11201913174PA (en) 2020-01-30
US11572387B2 (en) 2023-02-07
AU2018294660A1 (en) 2020-01-16
EP4273156A2 (en) 2023-11-08
EP3645552B1 (en) 2023-06-28
KR20200030070A (ko) 2020-03-19
US20230079731A1 (en) 2023-03-16
JP2020530276A (ja) 2020-10-22

Similar Documents

Publication Publication Date Title
JP7282697B2 (ja) 新規タンパク質細孔
JP7499761B2 (ja) 細孔
US20230295715A1 (en) Mutant pores
CN106459159B (zh) 突变孔
KR102083695B1 (ko) 돌연변이체 리세닌 기공
US10266885B2 (en) Mutant pores
KR20230125853A (ko) 돌연변이체 csgg 포어
AU2022422300A1 (en) Pore
AU2023253169A1 (en) Novel modified protein pores and enzymes
WO2024089270A2 (en) Pore monomers and pores
WO2024033421A2 (en) Novel pore monomers and pores
WO2024033443A1 (en) Novel pore monomers and pores
WO2024033422A1 (en) Novel pore monomers and pores

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210601

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220802

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20221019

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20221102

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20221019

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230418

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230517

R150 Certificate of patent or registration of utility model

Ref document number: 7282697

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150