JP7185929B2 - タンパク質のスクリーニングおよび検出方法 - Google Patents

タンパク質のスクリーニングおよび検出方法 Download PDF

Info

Publication number
JP7185929B2
JP7185929B2 JP2019522559A JP2019522559A JP7185929B2 JP 7185929 B2 JP7185929 B2 JP 7185929B2 JP 2019522559 A JP2019522559 A JP 2019522559A JP 2019522559 A JP2019522559 A JP 2019522559A JP 7185929 B2 JP7185929 B2 JP 7185929B2
Authority
JP
Japan
Prior art keywords
tag
sequence
library
nucleic acid
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019522559A
Other languages
English (en)
Other versions
JP2020502493A (ja
JP2020502493A5 (ja
Inventor
シーガー、マルクス
エグロフ、パスカル
ジンマーマン、イヴァン
Original Assignee
ウニベルシテート チューリッヒ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ウニベルシテート チューリッヒ filed Critical ウニベルシテート チューリッヒ
Publication of JP2020502493A publication Critical patent/JP2020502493A/ja
Publication of JP2020502493A5 publication Critical patent/JP2020502493A5/ja
Application granted granted Critical
Publication of JP7185929B2 publication Critical patent/JP7185929B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/12Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6845Methods of identifying protein-protein interactions in protein mixtures
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/22Immunoglobulins specific features characterized by taxonomic origin from camelids, e.g. camel, llama or dromedary
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • C07K2317/569Single domain, e.g. dAb, sdAb, VHH, VNAR or nanobody®
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/21Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/22Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a Strep-tag
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/23Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a GST-tag
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/24Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a MBP (maltose binding protein)-tag
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/40Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
    • C07K2319/41Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation containing a Myc-tag
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/40Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
    • C07K2319/43Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation containing a FLAG-tag
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/119Nucleic acid detection characterized by the use of physical, structural and functional properties the label being proteinic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/185Nucleic acid dedicated to use as a hidden marker/bar code, e.g. inclusion of nucleic acids to mark art objects or animals

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Description

本発明は、タンパク質ライブラリーへの検出タグの結合方法、ならびにその後の定義された生物物理学的または薬理学的基準を満たすタンパク質を同定および定量するためのそのタグの使用に関する。
タンパク質スクリーニング方法およびタンパク質ディスプレイ方法は、ある特徴(例えば標的分子への高いアフィニティ結合)を示すタンパク質の同定または富化のための最新の方法である。
スクリーンにおいて、タンパク質は、一つずつ分析される。これには非常に時間と労力を必要とし、かつ比較的低い試験数に限定される。例えば、結合タンパク質のためのスクリーンにおいては、個々の結合剤候補は、ELISAにより同定され、ポジティブELISAヒットは、例えば、サイズ排除クロマトグラフィー、アンフォールディング試験により生物物理学的にさらに特徴づけられ、それらの治療能力は動物モデルにおいてインビボで検査される。
ディスプレイ法において、全タンパク質プール(ライブラリー由来)は、数選択ラウンドを経て富化される。プールの処理により、多くの労力を払わずに巨大なスループットが可能となる。しかし、ファージ、リボソームまたはイーストディスプレイ法などのディスプレイ法は、表現型(タンパク質)および遺伝子型(そのエンコーディング核酸)との間の物理的結合を必要とする。これは、ディスプレイを実行するために必要とされる物理的実体(すなわち、ファージ、リボソームおよびエンコーディングDNAまたはRNA)は、通常、実際の結合分子(例えば、抗体フラグメント)よりも100倍以上長いため、ほとんどの分析にとって深刻な欠点である。これは、選択バイアスを必然的に生じ、可能な選択圧を少数の亜群のイメージ化できる選択圧に制限する(ディスプレイ粒子の巨大分子により大きくは影響されない選択圧(例えば結合)のみが現行では適用することができる)。
上述の技術水準に基づき、本発明の目的は、物理的遺伝子型-表現型結合の存在なしに全タンパク質ライブラリーから定義された生物物理学的または薬理学的基準を満たす独立したタンパク質の同定のための手段および方法を提供することである。この目的は、本明細書の特許請求の範囲により達成される。
用語および定義
当業者は、本明細書の範囲内において、ライブラリーの大きさを示す数字がライブラリーメンバーの多様性に関連しているということに気付く。ライブラリーIIより大きいライブラリーIは、ライブラリーIIより多数の独自のライブラリーメンバーを含むライブラリーIに相当する。100,000メンバーを有する核酸ライブラリーは、数百万の核酸分子を含むことができるが、該ライブラリー内の核酸配列の独自のものによりそれぞれ特徴付けられるのは100,000個別ライブラリーメンバーのみである。同様に、1,000メンバーを有するポリペプチドライブラリーは、100万のポリペプチド分子を含むことができるが、独自のポリペプチドライブラリーメンバーは1,000のみである。「ライブラリーの1メンバー」との表現は、複数の同一のコピーとして存在し得る1つの特定のライブラリーメンバーに関する。
本明細書の文脈内で、「2つの核酸配列がフレーム内にある」との表現は、第1の核酸配列の最後のコドンと第2の核酸配列の最初のコドンとの間の塩基対の数が3で割り切れるということを意味する。
本明細書の文脈内で、「ポリペプチドが検出タグと結合されている」、それぞれ「ポリペプチド/検出タグがアフィニティタグと結合されている」との表現は、両前述のメンバーが1つの一時アミノ酸配列、すなわち1つの連続したポリペプチド鎖内に含まれるということを意味する。とりわけ、前記検出タグおよび前記ポリペプチドは、1つ以上のアミノ酸によって分離されてもよい。前記検出タグおよび前記アフィニティタグも、1つ以上のアミノ酸によって分離されてもよい。
本明細書の文脈内で、「分離可能なエレメント」との用語は、化学薬剤によりまたは酵素的手段、例えばプロテアーゼにより、切断しやすいペプチド配列を意味する。プロテアーゼは、配列特異的(例えばトロンビン)であってもよく、限定された配列特性(例えばトリプシン)を有してもよい。分離可能なエレメントIおよびIIは、特に検出タグまたはポリペプチドの最後のアミノ酸がKまたはRである場合に、検出タグまたはポリペプチドのアミノ酸配列内に含まれてもよい。
本明細書の文脈内で、「アフィニティタグ」という用語は、生物化学混合物からポリペプチドの生成を可能にするためにそのポリペプチドに結合する部分を意味する。精製(アフィニティ精製)は、アフィニティタグとアフィニティタグの結合パートナーとの間の高度に特異的な相互作用(解離定数≦10E-5)に基づく。アフィニティタグは、アミノ酸配列からなってもよく、あるいは化学的部分が翻訳後修飾により結合するアミノ酸配列を含んでいてもよい。非限定的な例により、アフィニティタグは、His-タグ、CBP-タグ(CBP:カルモジュリン結合タンパク質)、CYD-タグ(CYD:共有結合であるが解離可能なNorpDペプチド)、Strep-タグ、StrepII-タグ、FLAG-タグ、HPC-タグ(HPC:タンパク質Cの重鎖)、GST-タグ(GST:グルタチオンSトランスフェラーゼ)、Avi-タグ、ビオチン化タグ、Myc-タグ、3×FLAGタグおよびMBP-タグ(MBP:マルトース結合タンパク質)を含む群から選択される。アフィニティタグのさらなる例は、Kimple et al., Curr Protoc Protein Sci. 2013 Sep 24;73:Unit 9.9に見出すことができる。
本明細書の文脈内で、「ディープシークエンシング」という用語は、≧5×、特に≧40×の範囲での数千の異なる核酸分子のパラレルシークエンシングを意味する。「範囲」という用語は、所定のヌクレオチドがディープシークエンシングプロセス中に読み取られる回数の平均を意味する。
本明細書の文脈内で、抗体という用語は、細胞生物学および免疫学の分野において知られているその意味で使用される。全抗体は、少なくともジスルフィド結合により相互に結合した2つの重(H)鎖と2つの軽(L)鎖とを含む糖タンパク質である。各重鎖は、重鎖可変領域(VH)および重鎖定常領域(CH)から構成される。各軽鎖は、軽鎖可変領域(本明細書においてはVLと略称する。)および軽鎖定常領域(CL)から構成される。重鎖および軽鎖の可変領域は、抗原と相互作用する結合ドメインを含む。抗体の定常領域は、免疫グロブリンの宿主組織または因子(免疫系の種々の細胞(例えばエフェクター細胞)や古典的な補体系の第1成分など)への結合を仲介する。
本明細書の文脈内で、「ナノボディ」という用語は、「単一ドメイン抗体」、すなわち単一の可変抗体ドメインからなる抗体フラグメントと関係している。ナノボディは、特定の抗原に選択的に結合することができる。その分子量は、たった12~15kDaである(Harmsen et al., Appl. Microbiol. Biotechnol. 77(1): 13-22)。通常、ナノボディは、所望の抗原でヒトコブラクダ、ラクダ、ラマ、アルパカまたはサメを免疫し、その後、重鎖抗体をコードするmRNAを単離することにより得られる。ナノボディはまた、4つの鎖を有する一般的なマウスまたはヒトIgGから導かれ得る。
本明細書の文脈内で、「シボディ(sybody)」という用語は、合成ナノボディと関係している。シボディは、抗原による免疫を経て得られるものではなく、合成ライブラリーからビトロにおいて選択される。
本明細書の文脈内で、「富化」という用語は、化合物の混合物内におけるある化合物の相対的な量を増加させるプロセスと関係している。
本明細書の文脈内で、「フライコードライブラリー」という用語は、複数の配列変異体を含む本発明に係るアミノ酸配列ライブラリーに関係している。
本明細書の文脈内で、「NestLink」という用語は、検出タグがタンパク質ライブラリーに結合される方法に関係している。その後、タグは、ライブラリー内の定義された生物物理学的または薬理学的基準を満たす個々のタンパク質を同定および定量するために使用される。NestLinkは、スクリーンおよびディスプレイ方法の主要な利点を含む。
本明細書の文脈内で、「疎水性値」という用語は、ペプチドを特徴づける予測値に関係している。疎水性値は、Krokhin et al., Mol Cell Proteomics. 2004 Sep; 3(9):908-19に記載された方法により、以下の式に従って計算される。
H=KL *(ΣRc+0.42R1 cNt+0.22R2 cNt+0.05R3 cNt) H<38の場合
および
H=KL *(ΣRc+0.42R1 cNt+0.22R2 cNt+0.05R3 cNt)-0.3(KL *(ΣRc+0.42R1 cNt+0.22R2 cNt+0.05R3 cNt)-38) H≧38の場合;
H<38の場合、Hfinal=H;
H≧38の場合、Hfinal=H-0.3*(H-38);
式中、Hfinalは、疎水性値であり、Rcは、以下の表のようにアミノ酸型を特徴づける保持係数であり、
Figure 0007185929000001
アミノ酸XのRX cNtは、
X cNt=(ΣRc/20)-RX C
と定義されており、
NはN末端から1から始まる検出タグの残基番号に対応する。KLは、
N<10の場合、KL=1-0.027*(10-N)
N>20の場合、KL=1-0.014*(N-20)
それ以外はKL=1
と定義される。
アミノ酸配列は、アミノ末端からカルボキシ末端へとなる。配列位置に対する大文字は、一文字コードのL-アミノ酸を意味する(Stryer, Biochemistry, 3rd ed. P.21)。
以下のさらなる実施形態および利点を引き出すことができる実施例および図面により本発明をさらに説明する。これらの実施例は、本発明を説明するためのものであるが、その範囲を限定するものではない。
さらなる実施態様において、本発明は、以下、[1]~[42]により規定される。
[1]ポリペプチドのライブラリーからポリペプチドを選択するための方法であって、
a.第1の核酸ライブラリーを提供する工程であって、前記第1の核酸ライブラリーの各メンバーが、第1のポリペプチドライブラリーのメンバーをコードするポリペプチド-エンコーディング配列を含む工程;
b.第2の核酸ライブラリーを提供する工程であって、前記第2の核酸ライブラリーが複数のメンバーを含み、各メンバーが、検出タグをコードするタグ-エンコーディング配列を含み、前記検出タグが、
i.前記第2の核酸ライブラリーによりコードされたいずれの検出タグのアミノ酸配列とも相違するアミノ酸配列によって特徴付けられる;
ii.200から5000Daの間、特に500から2500Daの間、さらに特に約900から2200Daの間の分子量によって特徴づけられる;かつ
iii.第1の分離可能なエレメントを含む
工程;
c.前記第1の核酸ライブラリーの前記メンバーに含まれる前記ポリペプチド-エンコーディング配列を、前記第2の核酸ライブラリーのメンバーに挿入し、それにより、タグが付されたポリペプチドライブラリーをコードするタグが付された核酸ライブラリーを作製する工程であって、前記タグが付されたポリペプチドライブラリーの各メンバーが、ポリペプチドおよび前記ポリペプチドから前記第1の分離可能なエレメントにより分離された検出タグを含む工程;
d.前記タグが付された核酸ライブラリーから複数の核酸配列を得る工程であって、前記複数の核酸配列の各々が、ポリペプチド-エンコーディング配列およびタグ-エンコーディング配列を含む工程;
e.工程dにおいて得られたタグ-エンコーディング配列によりコードされた各検出タグについて質量分析フラグメンテーションパターンを予測する工程;
f.前記タグが付された核酸ライブラリーから前記タグが付されたポリペプチドライブラリーを発現する工程;
g.選択工程において前記タグが付されたポリペプチドライブラリーのメンバーを選択し、選択されたポリペプチドを得る工程;
h.前記第1の分離可能なエレメントを切断し、それにより前記検出タグを前記選択されたポリペプチドから分離し、単離された検出タグを得る工程;
i.前記単離された検出タグを、
i.質量分析により前記単離された検出タグのフラグメンテーションパターンを記録すること;
ii.工程iで得られた前記フラグメンテーションパターンを、工程eにおいて予測された前記フラグメンテーションパターンと組み合わせること
により前記単離された検出タグを同定する工程;
j.工程dにおいて得られた前記複数の核酸配列から、工程iにおいて同定された前記検出タグをコードするタグ-エンコーディング配列を含む核酸配列を選択し、それにより工程iにおいて同定された前記検出タグと結合した前記タグが付されたポリペプチドライブラリーのメンバーを同定する工程
を含む方法。
[2]前記単離された検出タグが、-27から128の間、特に-1から70の間の疎水性値により特徴付けられる上記[1]記載の方法。
[3]前記タグが付されたポリペプチドライブラリーの前記メンバーが、アフィニティタグ、特に、His-タグ、CBP-タグ、CYD-タグ、Strep-タグ、StrepII-タグ、FLAG-タグ、HPC-タグ、GST-タグ、Avi-タグ、ビオチン化タグ、Myc-タグ、3xFLAG-タグおよびMBP-タグを含む群より選択されるアフィニティタグと会合している上記[1]または[2]記載の方法。
[4]前記検出タグが、アフィニティタグ、特に、His-タグ、CBP-タグ、CYD-タグ、Strep-タグ、StrepII-タグ、FLAG-タグ、HPC-タグ、GST-タグ、Avi-タグ、ビオチン化タグ、Myc-タグ、3xFLAG-タグおよびMBP-タグを含む群より選択されるアフィニティタグと会合している上記[1]~[3]のいずれかに記載の方法。
[5]前記アフィニティタグが、第2の分離可能なエレメントにより前記検出タグから分離され、前記第2の分離可能なエレメントが工程iの前に切断されている上記[4]記載の方法。
[6]工程iが、前記単離された検出タグをエレクトロスプレーイオン化質量分析計と接続された液体クロマトグラフィーにより分析することを含む上記[1]~[5]のいずれかに記載の方法。
[7]工程dが、≧5倍の範囲で前記完全にタグが付された発現ライブラリーのシークエンシングを含む上記[1]~[6]のいずれかに記載の方法。
[8]前記単離された検出タグが、5~30、特に7~21、より特には11~15のアミノ酸からなり、正に荷電した側鎖を有するアミノ酸をただ1つ含む上記[1]~[7]のいずれかに記載の方法。
[9]前記単離された検出タグが、配列エレメントIの収集物から選択される配列エレメントIを含み、前記配列エレメントIが、A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10、特には7アミノ酸からなる上記[1]~[8]のいずれかに記載の方法。
[10]前記正に荷電した側鎖を有する1つのアミノ酸が、前記単離された検出タグのC-末端に位置し、特に、前記正に荷電した側鎖を有する1つのアミノ酸がC-末端アルギニンであり、単離された検出タグに含まれる残りのアミノ酸がA、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから独立して選択される上記[1]~[9]のいずれかに記載の方法。
[11]前記単離された検出タグが、
a.A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10、特には7アミノ酸からなる配列エレメントI;および
b.配列番号1(WR)、配列番号2(WLR)、配列番号3(WQSR)、配列番号4(WLTVR)および配列番号5(WQEGGR)から選択される配列エレメントII
を含む上記[1]~[10]のいずれかに記載の方法。
[12]前記単離された検出タグが、
a.GSである配列エレメントIII;
b.A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10、特には7アミノ酸からなる前記配列エレメントI;および
c.配列番号1(WR)、配列番号2(WLR)、配列番号3(WQSR)、配列番号4(WLTVR)および配列番号5(WQEGGR)から選択される配列エレメントII
を含み、
特に、前記配列エレメントのN-末端からC-末端への順番が、配列エレメントIII、配列エレメントI、配列エレメントIIである上記[1]~[11]のいずれかに記載の方法。
[13]前記第1の核酸ライブラリーに含まれる全ての配列エレメントIが一緒に、配列エレメントIの収集物を構築し、かつ前記配列エレメントIの収集物内で、各アミノ酸が表1に特定される頻度で存在する上記[9]~[12]のいずれかに記載の方法。
[14]前記第1のおよび/または第2の分離可能なエレメントがプロテアーゼ認識配列であるかまたはプロテアーゼ認識配列を含む上記[1]~[13]のいずれかに記載の方法。
[15]a.前記第1の分離可能なエレメントが、トロンビン認識配列であるかまたはトロンビン認識配列を含む、および/または
b.前記第2の分離可能なエレメントが、トリプシン認識配列であるかまたはトリプシン認識配列を含む、
上記[1]~[14]のいずれかに記載の方法。
[16]ポリペプチドの収集物であって、前記ポリペプチドの収集物の各メンバーは、検出タグと、特に少なくとも1つ、より特には少なくとも2つ、さらにより特には少なくとも5つ、さらにより特には少なくとも10個、なおより特にはおおよそ20個の検出タグと会合し、前記検出タグが、
a.前記複数の発現ベクターによりコードされたいかなる他の検出タグのアミノ酸配列とも異なるアミノ酸配列により特徴づけられ;
b.200から5000Daの間、特に500から2500Daの間、より特にはおおよそ900から2200Daの間の分子量により特徴づけられ;
c.第1の分離可能なエレメントにより前記ポリペプチドの収集物の前記メンバーから分離される
ポリペプチドの収集物。
[17]前記単離された検出タグが、-27から128の間、特に-1から70の間の疎水性値により特徴づけられる上記[16]記載のポリペプチドの収集物。
[18]前記ポリペプチドの収集物の各メンバーが、アフィニティタグ、特に、His-タグ、CBP-タグ、CYD-タグ、Strep-タグ、StrepII-タグ、FLAG-タグ、HPC-タグ、GST-タグ、Avi-タグ、ビオチン化タグ、Myc-タグ、3xFLAG-タグおよびMBP-タグを含む群より選択されるアフィニティタグと会合している上記[16]または[17]記載のポリペプチドの収集物。
[19]前記検出タグが、アフィニティタグ、特に、His-タグ、CBP-タグ、CYD-タグ、Strep-タグ、StrepII-タグ、FLAG-タグ、HPC-タグ、GST-タグ、Avi-タグ、ビオチン化タグ、Myc-タグ、3xFLAG-タグおよびMBP-タグを含む群より選択されるアフィニティタグと会合し、前記アフィニティタグが第2の分離可能なエレメントにより前記検出タグから分離される上記[16]~[18]のいずれかに記載のポリペプチドの収集物。
[20]前記検出タグが、4~20、特に7~18、より特には11~15のアミノ酸からなり、正に荷電した側鎖を有するアミノ酸をただ1つ含む上記[16]~[19]のいずれかに記載のポリペプチドの収集物。
[21]前記検出タグが、
a.A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10、特には7アミノ酸からなる配列エレメントI;および
b.配列番号1(WR)、配列番号2(WLR)、配列番号3(WQSR)、配列番号4(WLTVR)および配列番号5(WQEGGR)から選択される配列エレメントII
を含む上記[16]~[20]のいずれかに記載のポリペプチドの収集物。
[22]4~20、特に7~18、より特には11~15のアミノ酸からなる検出タグであって、
a.正に荷電した側鎖を有するアミノ酸をただ1つ含み;
b.200から5000Daの間、特に500から2500Daの間、より特にはおおよそ900から2200Daの間の分子量により特徴づけられる
検出タグ。
[23]前記検出タグが、本質的に
a.A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10、特には7アミノ酸からなる配列エレメントI;および
b.配列番号1(WR)、配列番号2(WLR)、配列番号3(WQSR)、配列番号4(WLTVR)および配列番号5(WQEGGR)から選択される配列エレメントII
からなる上記[22]記載の検出タグ。
[24]少なくとも96、より特には少なくとも500000、さらにより特には少なくとも10 7 の検出タグ、なおさらにより特にはおおよそ10 8 の請求項19または20記載の検出タグを含む検出タグの収集物であって、各検出タグは、4~20、特に7~18、より特には11~15のアミノ酸からなり、前記検出タグの収集物に含まれるいかなる他の検出タグのアミノ酸配列とも異なるアミノ酸配列により特徴づけられる検出タグの収集物。
[25]各検出タグが、正に荷電した側鎖を有するアミノ酸をただ1つ含み、残りのアミノ酸がA、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから選択される上記[24]記載の検出タグの収集物。
[26]各検出タグが、-27から128の間、特に-1から70の間の疎水性値により特徴づけられる上記[24]または[25]記載の検出タグの収集物。
[27]各検出タグが、アフィニティタグ、特に、His-タグ、CBP-タグ、CYD-タグ、Strep-タグ、StrepII-タグ、FLAG-タグ、HPC-タグ、GST-タグ、Avi-タグ、ビオチン化タグ、Myc-タグ、3xFLAG-タグおよびMBP-タグを含む群より選択されるアフィニティタグ、より特にはHis-タグと会合し、前記アフィニティタグが分離可能なエレメントにより前記検出タグから分離される上記[24]~[26]のいずれかに記載の検出タグの収集物。
[28]特に少なくとも96、より特には少なくとも500000、さらにより特には少なくとも10 7 のプラスミドベクター、なおさらにより特にはおおよそ10 8 のプラスミドベクターを含むプラスミドベクターの収集物であって、前記プラスミドベクターの収集物の各メンバーは、検出タグをコードするタグ-エンコーディング核酸配列を含み、各検出タグは、4~20、特に7~18、より特には11~15のアミノ酸からなり、前記プラスミドベクターの収集物によりコードされたいかなる他の検出タグのアミノ酸配列とも異なるアミノ酸配列によって特徴づけられる、プラスミドベクターの収集物。
[29]前記検出タグが、正に荷電した側鎖を有するアミノ酸をただ1つ含む上記[28]記載のプラスミドベクターの収集物。
[30]前記検出タグが、200から5000Daの間、特に500から2500Daの間、より特にはおおよそ900からおおよそ2200Daの間の分子量により特徴づけられる上記[28]または[29]記載のプラスミドベクターの収集物。
[31]前記コードされた検出タグが、-27から128の間、特に-1から70の間の疎水性値により特徴づけられる上記[28]~[30]のいずれかに記載のプラスミドベクターの収集物。
[32]各検出タグが、アフィニティタグ、特に、His-タグ、CBP-タグ、CYD-タグ、Strep-タグ、StrepII-タグ、FLAG-タグ、HPC-タグ、GST-タグ、Avi-タグ、ビオチン化タグ、Myc-タグ、3xFLAG-タグおよびMBP-タグを含む群より選択されるアフィニティタグ、より特にはHis-タグと会合し、前記アフィニティタグが分離可能なエレメントにより前記検出タグから分離される上記[28]~[31]のいずれかに記載のプラスミドベクターの収集物。
[33]前記検出タグが、本質的に
a.A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10、特には7アミノ酸からなる配列エレメントI;および
b.配列番号1(WR)、配列番号2(WLR)、配列番号3(WQSR)、配列番号4(WLTVR)および配列番号5(WQEGGR)から選択される配列エレメントII
からなる上記[28]~[32]のいずれかに記載のプラスミドベクターの収集物。
[34]前記プラスミドベクターの収集物の各メンバーが、
a.5’で第1のエンドヌクレアーゼ制限酵素部位に、かつ3’で第2エンドヌクレアーゼ制限酵素部位に隣接したネガティブ選択カセット;
b.前記第1のエンドヌクレアーゼ制限酵素部位の5’に位置するプロモータ
c.前記第2のエンドヌクレアーゼ制限酵素部位の3’に位置し、前記検出タグをコードする前記核酸タグ配列
を含む上記[28]~[33]のいずれかに記載のプラスミドベクターの収集物。
[35]前記プラスミドベクターの収集物の各メンバーが
a.前記検出タグをコードする前記核酸タグ配列(ポリペプチドをコードする核酸配列と同じリーディングフレーム内で会合)
b.ダイバーシティエレメント、特にシークエンシングの間のシグナル過負荷を防ぐための異なる塩基を含むダイバーシティエレメント
c.プライマー結合部位、特にシークエンシングプライマーの結合のためのプライマー結合部位
d.インデックスエレメント、特に多重化のための数個の規定された核酸配列の1つを含むプライマー結合部位
e.アダプターエレメント、特にシークエンシングの間DNA分子を固定するためのアダプターエレメント
f.2つのエンドヌクレアーゼ制限酵素部位、特にエレメントa~eに隣接する、プラスミドからDNAフラグメントを放出するための2つのエンドヌクレアーゼ制限酵素部位
を含む上記[28]~[33]のいずれかに記載のプラスミドベクターの収集物。
[36]a.ポリペプチドライブラリーをコードする核酸ライブラリーを提供する工程であって、
前記ポリペプチドライブラリーが複数のメンバーを含み、各メンバーが検出タグと会合し、前記検出タグが、
i.前記核酸ライブラリーによりコードされたいかなる他の検出タグのアミノ酸配列とも異なるアミノ酸配列により特徴づけられ;
ii.200から5000Daの間、特に500から2500Daの間、より特にはおおよそ900から2200Daの間の分子量により特徴づけられ;そして
iii.第1の分離可能なエレメントにより前記ポリペプチドの収集物の前記メンバーから分離され;
b.
i複数の核酸および/またはアミノ酸配列であって、前記複数の配列が前記核酸ライブラリーの全てのメンバーの配列を含み、前記配列の各々はポリペプチドを特定する配列および検出タグを特定する配列を含む複数の核酸および/またはアミノ酸配列;
ii.前記核酸ライブラリーによりコードされた各検出タグに対する予想された質量分析フラグメンテーションパターン
を含むデータベースを提供する工程;
c.前記核酸ライブラリーから前記ポリペプチドライブラリーを発現する工程;
d.選択工程において前記ポリペプチドライブラリーのメンバーを選択し、選択されたポリペプチドを得る工程、
e.前記第1の分離可能なエレメントを切断し、それにより前記検出タグを前記選択されたポリペプチドから分離し、単離された検出タグを得る工程;
f.前記単離された検出タグを
i.質量分析法により前記単離された検出タグのフラグメンテーションパターンを記録する工程;
ii.工程iで得られた前記フラグメンテーションパターンを前記データベースにおいて予想された前記フラグメンテーションパターンと組み合わせ、それにより前記単離された検出タグを同定する工程
により同定する工程;
g.前記データベースに含まれる前記複数の配列から、工程fで同定された前記検出タグを特定する配列を選択し、それにより、工程fで同定された前記検出タグと会合する前記ポリペプチドライブラリーのメンバーを同定する工程
を含むタンパク質検出方法。
[37]前記ポリペプチドライブラリーの各メンバーが、アフィニティタグと、特にHis-タグ、CBP-タグ、CYD-タグ、Strep-タグ、StrepII-タグ、FLAG-タグ、HPC-タグ、GST-タグ、Avi-タグ、ビオチン化タグ、Myc-タグ、3xFLAGタグ、およびMBP-タグを含む群から選択されるアフィニティタグと会合される上記[36]記載の方法。
[38]各検出タグが、アフィニティタグと、特にHis-タグ、CBP-タグ、CYD-タグ、Strep-タグ、StrepII-タグ、FLAG-タグ、HPC-タグ、GST-タグ、Avi-タグ、ビオチン化タグ、Myc-タグ、3xFLAGタグ、およびMBP-タグを含む群から選択されるアフィニティタグと会合される上記[36]記載の方法。
[39]前記アフィニティタグが、前記検出タグから第2の分離可能なエレメントにより分離され、前記第2の分離可能なエレメントが、工程fより前に分離される上記[38]記載の方法。
[40]ポリペプチドを固有の検出タグと会合する方法であって、
a.第1の核酸ライブラリーを提供する工程であって、前記第1の核酸ライブラリーの各メンバーが、第1のポリペプチドライブラリーのメンバーをコードするポリペプチド-エンコーディング配列を含む工程、
b.第2の核酸ライブラリーを提供する工程であって、前記第2の核酸ライブラリーの各メンバーが検出タグをコードするタグ-エンコーディング配列を含み、前記検出タグが:
i.前記第2の核酸ライブラリーによりコードされたいかなる他の検出タグのアミノ酸配列とも異なるアミノ酸配列により特徴づけられ;
ii.200から5000Daの間、特に500から2500Daの間、より特にはおおよそ900から2200Daの間の分子量により特徴づけられる工程、
c.前記第1の核酸ライブラリーの前記メンバーに含まれる前記ポリペプチド-エンコーディング配列を、前記第2の核酸ライブラリーのメンバーに挿入する工程であって、
i.前記第1の核酸ライブラリーが5~100,000、特には100~50,000、より特には500~5,000のサイズを有し、かつ
ii.前記第2の核酸ライブラリーが10 3 ~10 11 、特には10 5 ~10 10 、より特には10 6 ~10 9 、さらにより特にはおおよそ10 8 のサイズを有し、
それにより複数のポリペプチド/タグ組み合わせプラスミドを生成する工程;
d.前記複数のポリペプチド/タグ組み合わせプラスミドのサブセットを選択し、それにより、タグが付されたポリペプチドライブラリーをコードするタグが付された核酸ライブラリーを生成する工程
を含む方法。
[41]前記複数のポリペプチド/タグ組み合わせプラスミドの前記サブセットが、前記第1の核酸ライブラリーのメンバーの数の少なくとも3倍、特に少なくとも5倍、より特には少なくとも15倍、さらにより特には少なくとも25倍である上記[40]記載の方法。
[42]前記複数のポリペプチド/タグ組み合わせプラスミドの前記サブセットが、前記第2の核酸ライブラリーのメンバーの数の50%未満、特に5%未満、より特には0.5%未満、さらにより特には0.05%未満である上記[40]または[41]記載の方法。
NestLink技術の概観を示す図である。A)ナノボディライブラリーは、発現ベクター上にコード化されたフライコードライブラリー内にネスト化される。その後、フライコード化されたナノボディ配列は、制限酵素消化により切断され、pNLs中に挿入され、ディープシークエンシングに必要なアダプター配列が結合する。フライコード化されたナノボディに結合されたアダプターは、その後、制限酵素消化により切断され、線形でディープシークエンシングに付される。 NestLink技術の概観を示す図である。B)pNLxにコード化されたネスト化ライブラリーが発現され、精製される。選択圧が適用され(この特別なケースにおいて、ナノボディ単量体の見かけの分子量を有するタンパク質がサイズ排除クロマトグラフィーにより選択される)、選択されたナノボディのフライコードがプロテアーゼの開裂により単離される。 NestLink技術の概観を示す図である。C)ディープシークエンシングデータにより、データベースが生成され、すべてのフライコードがそれらの対応するナノボディに割り当てられる。各ナノボディのフライコードは連結される。事前に単離されたフライコード(B参照)は、LC-MSに付され、記録されたMS/MSデータのピークリストが作成された。MS/MSデータは、連結されたフライコードを含むデータベースについて調査され、選択されたナノボディの同定および相対的定量化がなされた。 ライブラリー挿入の前(上部文字列)および後(下部文字列)のNestLink技術のための関連プラスミドデザインを示す図である。A)標的分子に対するナノボディのファージディスプレイ選抜のために使用されたファージミド。ファージミドは、2つのSapl制限部位を担持し、ナノボディライブラリーの挿入と、ファージディスプレイによる富化の後、NestLink発現ベクターpNLxへのそれらの効率的トランスファーとを可能とする。 ライブラリー挿入の前(上部文字列)および後(下部文字列)のNestLink技術のための関連プラスミドデザインを示す図である。B)おおよそ108変異体というフライコードの多様性を含むNestLink発現ベクターpNLx。Sapl部位はナノボディライブラリー挿入の際に消滅するように設計される。フライコードナノボディは、Sfil制限を経て発現ベクターから特異的に切り出すことができる。Sfi-部位の配置は、それらの対応するフライコードに結合した全ナノボディのディープシークエンシングを保証するが、PelBおよびHis-タグなどの冗長配列の排除によりディープシークエンシング読み取り長さを最小化する。 ライブラリー挿入の前(上部文字列)および後(下部文字列)のNestLink技術のための関連プラスミドデザインを示す図である。C)多様な指標を有する一組のディープシークエンシングベクター(pLNs)が、各IIIumina MiSepシークエンシングのために必要な配列のすべてをそれぞれ含むように作成された。フライコードナノボディは、このベクター内にSfi制限およびライゲーションを経てこのベクターに挿入される。その後、それらは、BseRI制限により、すべてのMiSeqアダプター領域を含む線形フラグメントとして除去される。このように、MiSeq分析用DNA断片を作製するためにPCRを必要とせず、ナノボディ-フライコード配列において組み換え事象が生じ、それにより、フライコードとナノボディ配列との間の結合を破壊する。 ライブラリー挿入の前(上部文字列)および後(下部文字列)のNestLink技術のための関連プラスミドデザインを示す図である。D)ディープシークエンシングアダプターは、pNLxにコードされるSfil制限部位に相補的な適切な一本鎖突出を介して合成二本鎖アダプターオリゴヌクレオチドを介して結合され得る。 LC-MSを用いたフライコードを介したPLOI-メンバーの絶対量測定を示す図である。フライコード化されたシボディの7つの既知量(x-軸)をE.coliまたはM.smegmatisいずれか由来の溶菌物をそれぞれ含む2つの異なる試料中に混ぜた(バックグラウンド)。フライコード化されたシボディは、0.2、0.4、1.3、4.1、8.5、18.0および27.5吸光度単位(280nm)で混ぜられ、ディープシークエンシングによって決定されたように、28、56、112、56、112、84および112フライコードを含んだ。単離されたフライコードは、LC-MSにより分析された。各シボディのすべてのフライコードからMS1強度がソフトウェアプロジェネシスを用いて合計された。 NestLinkを介して1’080の候補結合剤から最高のオフレートを示すシボディの同定を示す図である。A:溶液におけるビオチン化標的タンパク質との単量体シボディ共溶出(SEC)を、2つの等価なストレプトアビジンセファロースカラム上に固定した。一方のカラムをバッファーで洗浄し、他方のカラムを過剰な非-ビオチン化標的により3分間洗浄した。その後、残った結合したシボディのフライコードを単離し、LC-MS1強度により定量化した。B:LC-MS1強度(すべてのフライコードの合計)を各プールメンバーについて決定し、2つのカラムの間の比率を各個々のシボディ(x軸)に対してy軸上にプロットした。発現しなかったシボディ、単量体でないシボディ、または溶液中で標的に結合しなかったシボディは、原理的な実験のプルーフに説明されているプレ-選択圧の結果として除去されたので、いずれのカラム上でも検出できなかった(シボディ320-1‘080)。弱く結合しているシボディは、バーファーでの洗浄後に検出可能であるのみならず、過剰な標的での競争下でも検出可能であった(シボディ187-320)。シボディ1-186は、両カラム上で検出され、それらのオフレートによりランク付けされた。下流適用に最も有望なシボディは、最も遅いオフレートのものであり、比率が1に近いものである。C:個々に選ばれたシボディのNestLink読み出しとSPR実験との相関。B)で分析された11個のシボディのDNA配列を合成し(遺伝子合成)、対応する結合剤を発現し、精製し、表面プラズモン共鳴により一つずつ分析した。SPRデータを、3分洗浄後の残余結合シグナルとして(オフレートの評価基準)、y軸上にB)において示されるNestLinkにより決定されるシボディの比率に対して、x軸上にプロットする。 免疫されたアルパカ由来の3’469ナノボディの分析、および溶液中で最も強い高原結合を示すそれらの同定。低い発現レベル(工程1)と溶解性(工程2、単量体ナノボディの選択)それらのプールメンバーの排除後、プールの単量体画分を3つの異なる化学量論比で膜タンパク質抗原とインキュベートし、SECにより分析した。LC-MSサンプルを工程1(各個々のプールメンバーの発現レベルについて報告する)の後、工程2(各個々のメンバーの溶解性について報告する)で、そして工程3ですべての標的/複合体ピークから集めた。円グラフは、各ナノボディについての全MS1強度の合計(100%=全ナノボディの全フライコードの全MS1強度の合計)によって決定されるように、選択手順の異なる段階におけるプール中の各ナノボディの相対量(非結合剤または弱い結合剤はまとめて薄い灰色とし、プールメンバーの総量は100%に相当する)を表す。工程3について予想されるように、抗原に対するプールの比率の増加は、限られた量の抗原に対する多くの結合プールメンバーの内部競合の増加をもたらす。したがって、最も強い親和性を有するプールメンバーの画分が、限られたエピトープに対するより高い競合で増加する。 A:生成された外膜タンパク質標的に対するインビトロ選択(工程1)により生成された、目的のグラム陰性菌での細胞表面結合について(工程2)のプール由来の1’456シボディの分析。工程2(NestLink)において、低い発現レベルと溶解性を有するそれらのプールメンバーは、最初に集団から排除され、その後、4つの異なるプルダウン実験が目的の4つの異なる細菌株を用いて行われた。洗浄により高いアフィニティで細胞に結合しなかったプールメンバーの除去後、プールのすべてのフライコードを単離し、LC-MSにより分析した。その後、シボディに対するすべてのフライコードのすべてのMS1強度の合計は、各標的細胞でプール中の各個々のシボディの相対濃度についての評価基準として使用できた。これは、各シボディ(x軸)について、4つの細胞型の各々でのその相対濃度(全プールと比較した)を報告する明白な細胞-特異的読み出し(B)を可能とした。明確にするため、すべての分析されたシボディのうち25%のみがBに示される。
ポリペプチドのライブラリーからポリペプチドを選択する方法
第1の実施態様によれば、ポリペプチドのライブラリーからポリペプチドを選択する方法が提供される。その方法は、以下の工程を含む。
a.第1の核酸ライブラリーが提供される。その第1の核酸ライブラリーの各メンバーは、第1のポリペプチドライブラリーのメンバーをコードするポリペプチド-エンコーディング配列を含む。その第1の核酸ライブラリーの各メンバーは、第1の核酸ライブラリーのいずれの他のメンバーとも異なる。
b.第2の核酸ライブラリーが提供される。その第2のライブラリーは複数のメンバーを含む。各メンバーは、検出タグをコードするタグ-エンコーディング配列を含む。各検出タグは、以下の特徴を有する。
i.タグは、第2の核酸ライブラリーによりコードされたいずれの他の検出タグのアミノ酸配列とも相違するアミノ酸配列によって特徴付けられる。
ii.タグは、200Daから5000Daの間の分子量によって特徴づけられる。特定の実施形態においては、タグは、500Daから2500Daの間の分子量によって特徴づけられる。特定の実施形態においては、タグは、900Daから2200Daの間の分子量によって特徴づけられる。特定の実施形態においては、タグは、903Daから2180Daの間の分子量によって特徴づけられる。
iii.タグは、第1の分離可能なエレメントを含む。
c.前記第1の核酸ライブラリーの前記メンバーに含まれる前記ポリペプチド-エンコーディング配列が、前記第2の核酸ライブラリーのメンバーに挿入される。それにより、タグが付されたポリペプチドライブラリーをコードするタグが付された核酸ライブラリーを作製する。前記タグが付されたポリペプチドライブラリーの各メンバーが、ポリペプチドおよび検出タグを含む。その検出タグは、前記第1の分離可能なエレメントにより前記ポリペプチドから分離される。
タグが付されたポリペプチドライブラリーは、第1の核酸ライブラリーのポリペプチド-エンコーディング配列が第2の核酸ライブラリーのメンバー内に「ネスト化」されるため、「ネスト化ライブラリー」である。第2の核酸ライブラリーは、タグが付された核酸ライブラリーよりも数倍大きい。タグが付された核酸ライブラリーは、第1の核酸ライブラリーよりも数倍大きい。
タグが付された核酸ライブラリー内において、第1の核酸ライブラリーの各ポリペプチド-エンコーディング配列は、第2の核酸ライブラリーのタグ-エンコーディング配列と結合される。結合はフレーム内で生じる。ポリペプチド-エンコーディング配列は、タグが付された核酸ライブラリーのメンバーが適切な宿主に導入された後、適切な宿主において転写およびその後の翻訳に付される位置に挿入される。細菌細胞への導入は、形質転換によって達成することができる。非細菌細胞への導入は、トランスフェクションによって達成することができる。当業者は、翻訳には宿主が必ずしも必要でないということは認識している。インビトロ翻訳技術も用いることができる。無細胞発現系についての総説については、Rosenblum, FEBS Lett. 2014 Jan21; 588(2):261-8およびZemella, Chembiochem. 2015 Nov; 16(17):2420-31を参照。ポリペプチド-エンコーディング配列およびタグ-エンコーディング配列は、同一の発現された配列内に形質転換される。
タグが付された核酸ライブラリーは、第1の核酸ライブラリーの全てのポリペプチド-エンコーディング配列を含むが、第2の核酸ライブラリーのタグ-エンコーディング配列のサブセットのみを含む。タグが付された核酸ライブラリーの各メンバーは、1つのポリペプチド-エンコーディング配列と1つのタグ-エンコーディング配列とのみを含む。各タグエンコーディング配列は、タグが付された核酸ライブラリーの1つのメンバーにのみ含まれる。言い換えれば、各タグ-エンコーディング配列は、タグが付された核酸ライブラリーのなかで唯一のものである。しかしながら、各ポリペプチド-エンコーディング配列は、タグが付された核酸ライブラリーの数個のメンバー内に含まれ得る(冗長タグ)。ある実施形態において、第1の核酸ライブラリーの各ポリペプチド-エンコーディング配列は、第2の核酸ライブラリーの少なくとも1つのタグ-エンコーディング配列と会合する。ある実施形態において、第1の核酸ライブラリーの各ポリペプチド-エンコーディング配列は、第2の核酸ライブラリーの少なくとも2つのタグ-エンコーディング配列と会合する。ある実施形態において、第1の核酸ライブラリーの各ポリペプチド-エンコーディング配列は、第2の核酸ライブラリーの少なくとも5つの異なるタグ-エンコーディング配列と会合する。ある実施形態において、第1核酸ライブラリーの各ポリペプチド-エンコーディング配列は、第2の核酸ライブラリーの少なくとも10の異なるタグ-エンコーディング配列と会合する。ある実施形態において、第1の核酸ライブラリーの各ポリペプチド-エンコーディング配列は、平均して、第2の核酸ライブラリーの10~30の異なるタグ-エンコーディング配列と会合する。ある実施形態において、第1の核酸ライブラリーの各ポリペプチド-エンコーディング配列は、平均して、第2の核酸ライブラリーのおおよそ20の異なるタグ-エンコーディング配列と会合する。
d.複数の核酸配列が、タグが付された核酸ライブラリーからを得られる。特に、核酸配列は、タグが付された核酸ライブラリーの全てのメンバーに対して得られる。上記複数の核酸配列の各々が、ポリペプチド-エンコーディング配列およびタグ-エンコーディング配列を含む。
工程dで得られた配列情報に基づいて、データベースが構築される。データベースは、タグが付された核酸ライブラリーに含まれる全てのポリペプチドおよび全ての検出タグの配列を含む。当業者は、技術的な理由からデータベースは、タグが付された核酸ライブラリーの全ての単一メンバーを含むものではないということを認識している。配列は、核酸配列および/またはアミノ酸配列の形態とすることができる。データベースは、第2の核酸ライブラリーのタグ-エンコーディング配列のどのサブセットが、タグが付された核酸ライブラリーに含まれるかの情報を含む。データベースはまた、どのタグ-エンコーディング配列(複数の場合はそれぞれ)が所定のポリペプチド-エンコーディング配列と会合するかの情報を含む。
e.質量分析フラグメンテーションパターンが、工程dにおいて得られたタグ-エンコーディング配列によりコードされた各検出タグについて予測される。当業者は、そのフラグメンテーションパターンが、単離された検出タグについて予測されるということ、第1の分離可能なエレメントを供することによりその会合されたポリペプチドから遊離される検出タグについて予測されるということを認識している。当業者は、フラグメンテーションパターンを予測することはまた、単離された検出タグの総質量を予測することを含むということを認識している。
f.タグが付されたポリペプチドライブラリーは、タグが付された核酸ライブラリーから発現される。工程cに記載される冗長タグ化アプローチの結果として、タグが付されたポリペプチドライブラリーは、数個の異なる検出タグ(しかし、分子につきただ1つのタグ)を有する上記第1のポリペプチドライブラリーの所定のメンバーを含むことができる。複数の検出タグを介した第1のポリペプチドライブラリーのメンバーの曖昧な検出を容易にし、タグが付されたポリペプチドライブラリーのメンバーの生物物理学的特性への検出タグの潜在的な影響を最小化するため、冗長タグ化が好ましい。技術的な理由から、冗長性がさらに必要とされ、いくつかの検出タグは、それらが発現レベルを低下させるために検出されないことがあり、それらはサンプル調製中に失われるか、または質量分析計により分析される逆相カラムの疎水性ウィンドウ内に溶出されない。
g.タグが付されたポリペプチドライブラリーのメンバーが選択工程において選択され、選択されたポリペプチドを得る。この選択工程は、規定の生物化学的基準を満たすタグが付されたポリペプチドライブラリーのそれらのメンバーを単離することを含む。言い換えれば、選択圧が、タグが付されたポリペプチドライブラリーにかけられる。この選択圧は、タンパク質の物理的分離を導かなければならず、それにより物理的に分離されたサブプールが生み出され、集められる。本発明の方法の重要な利点は、可能な選択基準の範囲が、タンパク質ディスプレイ法におけるよりも非常に高いことである。非限定的例によれば、基準は、標的分子に規定のアフィニティで結合する能力、規定の条件でのポリペプチドの安定性、規定の条件での特定の凝集挙動(例えば、モノマーとして優先的に存在など)、プロテアーゼへの耐性、組織浸透能力、血流からの速いまたは遅いクリアランス、血液脳関門を通過する能力、および主張における蓄積能力を含む。
h.第1の分離可能なエレメントが切断される。それにより検出タグが選択されたポリペプチドから分離され、単離された検出タグが産生される。
i.単離された検出タグが、次のやり方で同定、定量される。
i.単離された検出タグのフラグメンテーションパターンが質量分析により記録される。フラグメンテーションパターンは、単離された検出タグの質量および疎水性に関する情報を提供する。フラグメンテーションパターンは単離された検出タグのアミノ酸配列に関する情報を生み出す。
ii.工程iで得られた質量およびフラグメンテーションパターンは、工程eにおいて予測された質量およびフラグメンテーションパターンと組み合わされる。それにより、単離された検出タグが同定される。質量分析により得られる情報とタグが付された核酸ライブラリーのシークエンシングにより得られる情報との組み合わせにより、所定の検出タグの曖昧でない同定が可能となる。
予測されたフラグメンテーションパターンと記録されたフラグメンテーションパターンとのマッチング精度は得点化でき、ポリペプリドライブラリーメンバーをランク付けすることができる。異なる選択条件間のポリペプチドランキングの比較は、ポリペプチドの種々の特徴(例えば、オフレート、組織分布、コンフォメーション特異的結合など)の相対的な評価基準として使用することができる。その比較は、冗長的にタグが付されたポリペプチドライブラリーメンバーについて最も正確であり、個々のタグの効率性を記録するフラグメンテーションパターンにおける相違点が平均化される。
予測されたフラグメンテーションパターンと記録されたフラグメンテーションパターンとのマッチング精度のスコアは、選択後にポリペプチドライブラリーメンバーの相対量の評価基準として使用することができる。相対量は、冗長的にタグが付されたポリペプチドライブラリーメンバーについて最も正確であり、個々のタグの効率性を記録するフラグメンテーションパターンにおける相違点が平均化される。
j.工程iにおいて同定された検出タグをコードするタグ-エンコーディング配列を含む核酸配列は、工程dにおいて得られた複数の核酸配列から選択される。それにより工程iにおいて同定された検出タグと結合したタグが付されたポリペプチドライブラリーのメンバーを同定する工程
当業者は、工程g~工程jは、タグが付されたポリペプチドライブラリーの多数の異なるメンバーに対して並行して行われることを認識している。規定された基準を表示する数個のポリペプチドのプールは、工程gにおいて選択され、これらのポリペプチドの全てが、それらの検出タグの質量分析を経て同定される。当業者は、技術的な理由のために、すべての単一ポリペプチドがこの工程において同定され得るのではないことを認識している。
工程iにおいて行われる質量分析は定量的であり、したがって本発明の方法は、ポリペプチドの同定を可能とするのみならず、サンプルにおけるこのポリペプチドの量の定量も可能とする。
冗長的かつ独自のタグ化を確実にするために、以下の点が重要である。
i)第1のライブラリーは、制限され規定されたサイズを有する。ある実施形態において、第1の核酸ライブラリーは、5~100,000のサイズを有する。ある実施形態においては、第1の核酸ライブラリーは、100~50,000のサイズを有する。ある実施形態においては、第1の核酸ライブラリーは、500~5,000のサイズを有する。
ii)第2の核酸ライブラリーは、第1のライブラリーの挿入工程の前で103~1011、とりわけ105~1010、より特には106~109、なおより特にはおおよそ108のサイズを有する。
iii)挿入工程後には、複数のポリペプチド/タグ組み合わせプラスミドの選択されたサブセットが、上記第1の核酸ライブラリーのメンバーの数の少なくとも3倍、特に少なくとも5倍、より特に少なくとも15倍、なおより特に少なくとも25倍である。
iv)複数のポリペプチド/タグ組み合わせプラスミドの選択されたサブセットは、上記第2の核酸ライブラリーのメンバーの数の50%未満、特に5%未満、より特に0.5%未満、なおより特に0.05%未満である。
ライブラリーのサイズは、工程aに先立つ多様性制限工程により制御することができ、そこでは第1のライブラリーがより大きなプレーライブラリー由来のサブセットとして選択される。
本発明の方法は、タンパク質ディスプレイ法に要求される物理的遺伝型-表現型連鎖の非存在下でタンパク質ライブラリーの分析を可能とする。これは、タンパク質ライブラリーのメンバーに結合した大きな物理的実体(例えば、ファージやリボソームおよびエンコーディングDNAやRNA)を有するという不利益を排除する。タンパク質スクリーニングでは通常のように個々のタンパク質を試験する代わりに、タンパク質ライブラリー全体を選択基準のプールとしてスクリーニングすることができる。しかしながら、たとえ全タンパク質プールが処理されたとしても、あらゆる単一タンパク質が個々に特徴付けられるので、読み出しはスクリーニングと同様である。これは、結合タンパク質(薬物、診断薬、研究ツールなど)の開発の分野において特に関連がある。さまざまなタンパク質特性を一度に何千もの候補で分析することができる。例示的な質問は、どの結合剤候補が安定で、可溶性で、そして単量体であるかであろう。
本発明の方法は、タンパク質治療の開発チェーンのまさに最初の段階で、「どの結合剤がインビボで最大の治療可能性を有するか」という関連する疑問に取り組むことを可能にする。治療可能性に関する疑問とは、どの結合剤が経口投与時に腸内の過酷な条件に耐えられるか?、どの結合剤が血液脳関門を通過するか?、どの結合剤が血液からの最適な腎クリアランス特性を示すか?、何千ものうちのどの結合剤が関連組織において良好な組織浸透を示すのか?である。
特定の実施形態において、検出タグは、-27から128の間の疎水性値によって特徴付けられる。特定の実施形態において、検出タグは、-1から70の間の疎水性値によって特徴付けられる。疎水性値は、それが単離された後の、すなわち第1の分離可能なエレメントの切断後の検出タグの質量に関連する。疎水性値は、会合されたアフィニティタグを含まない。
特定の実施形態では、タグが付されたポリペプチドライブラリーのメンバーが、アフィニティタグと会合される。そのようなアフィニティタグは、質量分析に先立ち、タグが付されたポリペプチドライブラリーの選択されたメンバーの、および/または検出タグそれ自身の精製を平易にすることができる。アフィニティタグおよびタグが付されたポリペプチドライブラリーのメンバーは、1つの一次アミノ酸配列内に含まれる。タグが付されたポリペプチドライブラリーの各メンバーは、ポリペプチドおよび検出タグを含む。アフィニティタグは、ポリペプチドまたは検出タグのいずれと会合していてもよい。
特定の実施形態では、アフィニティタグは、His-タグ、CBP-タグ、CYD-タグ、Strep-タグ、StrepII-タグ、FLAG-タグ、HPC-タグ、GST-タグ、Avi-タグ、ビオチン化タグ、Myc-タグ、3xFLAG-タグおよびMBP-タグを含む群から選択される。
特定の実施形態では、検出タグはアフィニティタグと会合している。これらの例では、アフィニティタグは検出タグのC-末端に位置している。この配置は、検出タグがペプチダーゼによる分解から保護され、完全な検出タグと会合した分解していないポリペプチドのみがタンパク質精製中に確実に単離されるというさらなる利点を有する。当業者は、「アフィニティタグが検出タグのC-末端に位置する」という表現が必ずしもアフィニティタグが検出タグのC-末端に直接に位置することを意味するのではなく、アフィニティタグと検出タグとを分離するいくつかのアミノ酸のリンカーが存在し得ることを意味する。
特定の実施形態では、アフィニティタグは上記検出タグから第2の分理可能エレメントによって分離されており、上記第2の分理可能エレメントは、工程iの前に切断される。したがって、会合したアフィニティタグを含まない検出タグのみが質量分析法によって分析される。
検出タグの質量およびフラグメンテーションパターンの仕様は、会合したポリペプチドおよびアフィニティタグから分離された後、すなわち第1および第2の分離可能なエレメントの切断後のタグの質量およびフラグメンテーションパターンに関する。当業者は、質量分析に先立ち、検出タグが会合したアフィニティタグから遊離していない場合には、そのことが質量分析の結果に影響を与えることを認識している。すべての検出タグが同じアフィニティタグに会合されている場合、質量およびフラグメンテーションパターンの変化を考慮に入れることができるため、検出タグが第2の分離可能なエレメントの切断によりアフィニティタグから分離されている場合ほど効率的で明確ではないが、検出タグを同定することは依然として可能であろう。
特定の実施形態では、アフィニティタグはHis-タグである。
特定の実施形態において、工程hは、エレクトロスプレーイオン化質量分析に連結された液体クロマトグラフィー(LC-MS)を介して単離された検出タグを分析することを含む。特定の実施形態において、この工程は液体逆相クロマトグラフィーを含む。単離された検出タグは、サンプルの複雑さを軽減するために逆相クロマトグラフィーによってそれらの疎水性に従って分離される。続いて、それらの質量およびペプチドフラグメンテーションパターンを質量分析法によって記録する。
特定の実施形態では、工程dは、5倍以上の範囲で完全なタグが付された発現ライブラリーのシークエンシングを含む。特定の実施形態では、工程dはタグが付された発現ライブラリーのディープシークエンシングを含む。
特定の実施形態では、工程dは、タグが付された核酸ライブラリーに含まれるポリペプチド-エンコーディング配列およびタグ-エンコーディング配列を一緒にシークエンシングベクターに挿入することを含む。ディープシークエンシングは通常、PCR増幅工程を含む。本発明者らは、PCR増幅が、タグが付されたライブラリーのメンバーの遺伝子セグメント間に有意な数の組換え事象をもたらすことに気付いた。したがって、彼らは、制限酵素消化およびライゲーションによるディープシークエンシングに必要な配列エレメントの結合を可能にする一組のディープシークエンシングプラスミドを構築し、それによりディープシークエンシングに先立ちネスト化ライブラリーをPCR増幅する必要性を排除した。
特定の実施形態では、単離された検出タグは、5~30個の連続したアミノ酸からなり、そして正に荷電した側鎖を有するアミノ酸を1つ、かつただ1つ含む。特定の実施形態において、単離された検出タグは7~21個の連続したアミノ酸からなり、そして正に荷電した側鎖を有するアミノ酸を1つ、かつただ1つ含む。特定の実施形態では、単離された検出タグは11~15個の連続したアミノ酸からなり、そして正に荷電した側鎖を有するアミノ酸を1つ、かつただ1つ含む。
特定の実施形態では、正に荷電した側鎖を有するアミノ酸は、単離された検出タグのC-末端に位置する。特定の実施形態では、正に荷電した側鎖を有するアミノ酸は、アルギニン(R)およびリジン(K)から選択される。特定の実施形態では、正に荷電した側鎖を有するアミノ酸は、単離された検出タグのC-末端に位置するアルギニン(R)である。
当業者は、正に荷電した側鎖を有するアミノ酸に加えて、単離された検出タグが中性のpHで別の正電荷を帯び、それが単離された検出タグのN末端の第一級アミンであることを認識している。
特定の実施形態において、単離された検出タグは、配列エレメントIの収集物から選択される配列エレメントIを含み、上記配列エレメントIは、A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10、特には7アミノ酸からなる。
特定の実施形態では、1つ、かつただ1つの正に荷電した側鎖を有するアミノ酸は、単離された検出タグのC-末端に位置し、残りのアミノ酸はA、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから独立して選択される。特定の実施形態では、正に荷電した側鎖を有する唯一のアミノ酸は、単離された検出タグのC-末端に位置するRである。前記正に荷電した側鎖を有する1つのアミノ酸が、前記単離された検出タグのC-末端に位置し、特に、前記正に荷電した側鎖を有する1つのアミノ酸がC-末端アルギニンであり、単離された検出タグに含まれる残りのアミノ酸がA、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから独立して選択される
単離された検出タグは、質量分析法、特にLC-MS(ESI-MSと連結した液体逆相クロマトグラフィー)によって最適に検出可能である。アミノ酸CおよびMは、酸化されやすいので、検出タグの設計において除外された。アミノ酸K、RおよびHは、それらがタグに正に荷電した側鎖を有するさらなるアミノ酸を付加するであろうことから、配列エレメントIにおいて除外された。これは、タグがESI-MS検出中にさらなる電荷を帯び、最適な検出範囲を外れるため望ましくなかった。KおよびRは付加的なトリプシン切断部位をタグ配列に付加するであろうが、これは望ましくない。
検出タグのアミノ酸配列にKを付加すると、もう1つ第一級アミンが付加されることとなり、NHS化学を用いた質量分析による相対的および絶対的定量のための同重体タグによる検出タグの標識化を複雑にするであろう。
特定の実施形態では、単離された検出タグは、
a.A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10、特には7連続アミノ酸からなる配列エレメントI;および
b.配列番号1(WR)、配列番号2(WLR)、配列番号3(WQSR)、配列番号4(WLTVR)および配列番号5(WQEGGR)から選択される配列エレメントII
を含む。
特定の実施形態では、単離された検出タグは、
a.GSである配列エレメントIII;
b.A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10、特には7アミノ酸からなる前記配列エレメントI;および
c.配列番号1(WR)、配列番号2(WLR)、配列番号3(WQSR)、配列番号4(WLTVR)および配列番号5(WQEGGR)から選択される配列エレメントII
からなる。
N-末端からC-末端への配列エレメントの順番は、配列エレメントIII、配列エレメントI、配列エレメントIIである。これらの検出タグは、ESI-MSによる感度の高い検出に最適な903から2180Daの間の質量範囲内にあった。単離されたタグは、生理的pH以下で2つの正電荷、すなわち、C-末端およびN-末端第1級アミンにRを担持する。単離された検出タグのC-末端の正電荷は、質量分析検出のためのタグのイオン化を容易にし、特有のトリプシン切断部位として作用するC-末端にアルギニンまたはリジンを有するペプチドは、質量分析により特に良好に検出することができる(好ましいイオン化特性)。各単離された検出タグにおいて、N-末端アミンは、第1級アミンのみであり、NHS化学によりアミン結合に使用される。これは、例えばiTRAQ(相対的定量および絶対的定量に対する同重体タグ)を行うために量的質量分析のためのラベルを取り付けることを可能とする。検出タグを標準逆相クロマトグラフィーカラムによるペプチド分離に理想的に適した疎水性の範囲を表示するように設計した。
特定の実施形態では、第1の核酸ライブラリーに含まれる全ての配列エレメントIは一緒に配列エレメントIの収集物を構築する。配列エレメントIの収集物内で、各アミノ酸は表1に特定された頻度で存在する。
Figure 0007185929000002
特定の実施形態では、上記第1および/または第2の分離可能なエレメントの1つがプロテアーゼ認識配列であるかまたはプロテアーゼ認識配列を含む。特定の実施形態では、上記第1および上記第2の分離可能なエレメントの両方がプロテアーゼ認識配列であるかまたはプロテアーゼ認識配列を含む。
特定の実施形態では、第1の分離可能なエレメントは、トロンビン認識配列であるかまたはトロンビン認識配列を含み、および/または上記第2の分離可能なエレメントは、トリプシン認識配列であるかまたはトリプシン認識配列を含む、
ポリペプチドの収集物
第2の実施態様によれば、ポリペプチドの収集物が提供される。ポリペプチドの収集物の各メンバーは、検出タグと会合する。特定の実施形態では、ポリペプチドの収集物の各メンバーは、少なくとも1つの検出タグと会合する。「少なくとも1つの検出タグと会合」との表現は、ポリペプチドの収集物の各メンバーは1つよりも多い検出タグと会合することができるが、ポリペプチド分子につきただ1つのタグのみという事実を意味する。言い換えれば、ポリペプチドの収集物は、検出タグXと会合したポリペプチドA、および検出タグYと会合したポリペプチドAを含むが、検出タグXとYの両方と会合したポリペプチドは含まない。特定の実施形態では、ポリペプチドの収集物の各メンバーは少なくとも2つの検出タグと会合する。特定の実施形態では、ポリペプチドの収集物の各メンバーは、少なくとも5つの検出タグと会合する。特定の実施形態では、ポリペプチドの収集物の各メンバーは、少なくとも10個の検出タグと会合する。特定の実施形態では、ポリペプチドの収集物の各メンバーは、おおよそ20個の検出タグと会合する。各検出タグは、次の特徴を有する。
a.タグは、複数の発現ベクターによりコードされたいかなる他の検出タグのアミノ酸配列とも異なるアミノ酸配列により特徴づけられる。
b.タグは、200から5000Daの間の分子量により特徴付けられる。特定の実施形態では、タグは、500から2500Daの間の分子量により特徴付けられる。特定の実施形態では、タグは、おおよそ900からおおよび2200Daの間の分子量により特徴づけられる。特定の実施形態では、タグは、903から2180Daの間の分子量により特徴付けられる。
c.タグは、第1の分離可能なエレメントにより上記ポリペプチドの収集物の上記メンバーから分離される。
本発明の第2の実施態様の特定の実施形態では、検出タグは、-27から128の間の疎水性値により特徴付けられる。特定の実施形態では、-1から70の間の疎水性値により特徴付けられる。
本発明の第2の実施形態の特定の実施形態では、ポリペプチドの収集物のメンバーはアフィニティタグと会合される。
本発明の第2の実施形態の特定の実施形態では、検出タグはアフィニティタグと会合される。アフィニティタグおよび検出タグは、同一の一次アミノ酸配列内に含まれる。アフィニティタグは、第2の分離可能なエレメントにより検出タグから分離される。検出タグは、第2の分離可能なエレメントの切断によりアフィニティタグから遊離することができる。特定の実施形態では、アフィニティタグは、His-タグ、CBP-タグ、CYD-タグ、Strep-タグ、StrepII-タグ、FLAG-タグ、HPC-タグ、GST-タグ、Avi-タグ、ビオチン化タグ、Myc-タグ、3xFLAG-タグおよびMBP-タグを含む群より選択される。特定の実施形態では、アフィニティタグはHis-タグである。
特定の実施形態では、単離された検出タグは、5~30個の連続したアミノ酸からなり、そして正に荷電した側鎖を有するアミノ酸を1つ、かつただ1つ含む。特定の実施形態において、単離された検出タグは7~21個の連続したアミノ酸からなり、そして正に荷電した側鎖を有するアミノ酸を1つ、かつただ1つ含む。特定の実施形態では、単離された検出タグは11~15個の連続したアミノ酸からなり、そして正に荷電した側鎖を有するアミノ酸を1つ、かつただ1つ含む。
特定の実施形態では、正に荷電した側鎖を有するアミノ酸は、単離された検出タグのC-末端に位置する。特定の実施形態では、正に荷電した側鎖を有するアミノ酸は、アルギニン(R)およびリジン(K)から選択される。特定の実施形態では、正に荷電した側鎖を有するアミノ酸は、単離された検出タグのC-末端に位置するアルギニン(R)である。
本発明の第2の実施態様の特定の実施形態では、検出タグは、
a.A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10、特には7連続アミノ酸からなる配列エレメントI;および
b.配列番号1(WR)、配列番号2(WLR)、配列番号3(WQSR)、配列番号4(WLTVR)および配列番号5(WQEGGR)から選択される配列エレメントII
を含む。
検出タグ
第3の実施態様によれば、ペプチド検出タグが提供され、質量分析による最適な検出のために設計される。検出タグは、4~20のアミノ酸からなり、次の特徴を有する。
a.検出タグは、正に荷電した側鎖を有するアミノ酸をただ1つ含む。
b.検出タグは、200から5000Daの間の分子量により特徴付けられる。特定の実施形態では、検出タグは、500から2500Daの間の分子量により特徴付けられる。特定の実施形態では、検出タグは、おおよそ900からおおよび2200Daの間の分子量により特徴づけられる。特定の実施形態では、検出タグは、903から2180Daの間の分子量により特徴付けられる。
第3の実施態様の特定の実施形態では、検出タグは7~18アミノ酸からなる。第3の実施態様の特定の実施形態では、検出タグは、11~15アミノ酸からなる。
第3の実施態様の特定の実施形態では、検出タグは、本質的には、
a.A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10、特には7アミノ酸からなる配列エレメントI;および
b.配列番号1(WR)、配列番号2(WLR)、配列番号3(WQSR)、配列番号4(WLTVR)および配列番号5(WQEGGR)から選択される配列エレメントII
からなる。
検出タグの収集物
別の実施態様によれば、ペプチドタグの収集物が提供される。ペプチドタグの収集物は、本発明の第3の実施態様にしたがいペプチドタグを含む。ペプチドタグの収集物に含まれる各検出タグは、4~20アミノ酸からなり、上記検出タグの収集物に含まれるいかなる他の検出タグのアミノ酸配列とも異なるアミノ酸配列によって特徴づけられる。特定の実施形態では、各検出タグは、7~18アミノ酸からなる。特定の実施形態では、各検出タグは、11~15アミノ酸からなる。特定の実施形態では、ペプチドタグの収集物は、少なくとも96個のペプチドタグを含む。特定の実施形態では、ペプチドタグの収集物は、少なくとも500000個のペプチドタグを含む。特定の実施形態では、ペプチドタグの収集物は、少なくとも107個のペプチドタグを含む。特定の実施形態では、ペプチドタグの収集物はおおよそ108個のペプチドタグを含む。
本発明のこの特定の実施形態では、検出タグは、正に荷電した側鎖を有するアミノ酸をただ1つ含み、残りのアミノ酸はA、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから選択される。
本発明のこの実施態様の特定の実施形態では、検出タグは、-27から128の間の疎水性値により特徴付けられる。特定の実施形態では、検出タグは-1から70の間の疎水性値により特徴付けられる。
本発明のこの実施形態の特定の実施形態では、検出タグはアフィニティタグと会合される。特定の実施形態では、アフィニティタグは、His-タグ、CBP-タグ、CYD-タグ、Strep-タグ、StrepII-タグ、FLAG-タグ、HPC-タグ、GST-タグ、Avi-タグ、ビオチン化タグ、Myc-タグ、3xFLAG-タグおよびMBP-タグを含む群より選択される。特定の実施形態では、アフィニティタグはHis-タグである。アフィニティタグおよび検出タグは、同一の一次アミノ酸配列内に含まれる。アフィニティタグは、分離可能なエレメントにより検出タグから分離される。
本発明のこの実施形態の特定の実施形態では、検出タグは、本質的には、
a.A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10、特には7アミノ酸からなる配列エレメントI;および
b.配列番号1(WR)、配列番号2(WLR)、配列番号3(WQSR)、配列番号4(WLTVR)および配列番号5(WQEGGR)から選択される配列エレメントII
からなる。
プラスミドベクターの収集物
また別の実施態様によれば、プラスミドベクターの収集物が提供される。上記プラスミドベクターの収集物の各メンバーは、検出タグをコードする核酸配列を含む。プラスミドベクターの収集物に含まれる各検出タグは、4~20アミノ酸からなり、上記プラスミドベクターの収集物に含まれるいかなる他の検出タグのアミノ酸配列とも異なるアミノ酸配列によって特徴づけられる。特定の実施形態では、各検出タグは、7~18アミノ酸からなる。特定の実施形態では、各検出タグは、11~15アミノ酸からなる。特定の実施形態では、プラスミドベクターの収集物は、少なくとも96個のプラスミドベクターを含む。特定の実施形態では、プラスミドベクターの収集物は、少なくとも500000個のプラスミドベクターを含む。特定の実施形態では、プラスミドベクターの収集物は、少なくとも107個のプラスミドベクターを含む。特定の実施形態では、プラスミドベクターの収集物はおおよそ108個のプラスミドベクターを含む。
本発明のこの特定の実施形態では、検出タグは、正に荷電した側鎖を有するアミノ酸をただ1つ含む。
本発明のこの実施態様の特定の実施形態では、検出タグは200から5000Daの間の分子量により特徴付けられる。特定の実施形態では、検出タグは500から2500Daの間の分子量により特徴付けられる。特定の実施形態では、検出タグは900から2200Daの間の分子量により特徴づけられる。特定の実施形態では、検出タグは903から2180Daの分子量により特徴付けられる。
本発明のこの実施態様の特定の実施形態では、検出タグは、-27から128の間の疎水性値により特徴付けられる。特定の実施形態では、検出タグは-1から70の間の疎水性値により特徴付けられる。
本発明のこの実施形態の特定の実施形態では、検出タグはアフィニティタグと会合される。特定の実施形態では、アフィニティタグは、His-タグ、CBP-タグ、CYD-タグ、Strep-タグ、StrepII-タグ、FLAG-タグ、HPC-タグ、GST-タグ、Avi-タグ、ビオチン化タグ、Myc-タグ、3xFLAG-タグおよびMBP-タグを含む群より選択される。特定の実施形態では、アフィニティタグはHis-タグである。アフィニティタグおよび検出タグは、同一の一次アミノ酸配列内に含まれる。アフィニティタグは、第2の分離可能なエレメントにより検出タグから分離される。
本発明のこの実施形態の特定の実施形態では、検出タグは、本質的には、
a.A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10、特には7アミノ酸からなる配列エレメントI;および
b.配列番号1(WR)、配列番号2(WLR)、配列番号3(WQSR)、配列番号4(WLTVR)および配列番号5(WQEGGR)から選択される配列エレメントII
からなる。
本発明のこの実施形態の特定の実施形態では、プラスミドベクターの収集物の各メンバーは、
a.5’で第1のエンドヌクレアーゼ制限酵素部位に、かつ3’で第2エンドヌクレアーゼ制限酵素部位に隣接したネガティブ選択カセット;
b.第1のエンドヌクレアーゼ制限酵素部位の5’に位置するプロモータ
c.第2のエンドヌクレアーゼ制限酵素部位の3’に位置し、検出タグをコードする核酸タグ配列を含む。特定の実施形態では、検出タグおよび第2のエンドヌクレアーゼ制限酵素部位をコードする核酸配列は、100個未満の塩基により隔たれている。特定の実施形態では、検出タグおよび第2のエンドヌクレアーゼ制限酵素部位をコードする核酸配列は、50個未満の塩基対により隔たれている。特定の実施形態では、検出タグおよび第2のエンドヌクレアーゼ制限酵素部位をコードする核酸配列は、20個未満の塩基対により隔たれている。特定の実施形態では、検出タグおよび第2のエンドヌクレアーゼ制限酵素部位をコードする核酸配列の間に位置する塩基対は、第1の分離可能なエレメントをコードする。
本発明のこの実施形態の特定の実施形態では、プラスミドベクターの収集物の各メンバーは、
a.検出タグをコードする核酸タグ配列(ポリペプチドをコードする核酸配列と同じリーディングフレーム内で会合);
b.シークエンシングの間のシグナル過負荷を防ぐための異なる塩基を含むダイバーシティエレメント;
c.シークエンシングプライマーの結合のためのプライマー結合部位;
d.多重化のための数個の規定された核酸配列の1つを含むプライマー結合部位;
e.シークエンシングの間DNA分子を固定するためのアダプターエレメント;
f.シークエンシングに先立ちプラスミドベクターからDNAフラグメントを放出するための、エレメントa~eに隣接する2つのエンドヌクレアーゼ制限酵素部位
を含む。
上述の実施形態において説明されたプラスミドベクターは、ディープシークエンシングプラスミドとして供される。好ましくは、これらのベクターは、シークエンシングされるフラグメントの長さを短くするためアフィニティタグを含まない。
タンパク質検出方法
別の実施態様によれば、タンパク質検出の方法が提供される。この方法は、次の工程を含む。
a.ポリペプチドライブラリーをコードする核酸ライブラリーが提供される。ポリペプチドライブラリーに含まれる各ポリペプチドが検出タグと会合される。ポリペプチドおよび検出タグが、同一の一次アミノ酸配列内に含まれる。各検出タグは、以下の特徴を有する。
i.タグは、核酸ライブラリーによりコードされたいかなる他の検出タグのアミノ酸配列とも異なるアミノ酸配列により特徴づけられる。
ii.タグは、200から5000Daの間の分子量により特徴付けられる。特定の実施形態では、タグは、500および2500Daの間の分子量により特徴付けられる。特定の実施形態では、タグはおおよそ900からおおよそ2200Daの間の分子量により特徴づけられる。特定の実施形態では、タグは、903から2180Daの間の分子量により特徴付けられる。
iii.タグは、第1の分離可能なエレメントにより会合したポリペプチドから分離される。
核酸ライブラリーによりコードされた各検出タグは、核酸ライブラリーによりコードされたいかなる他の検出タグに関しても固有のものである。ポリペプチドライブラリーに含まれる各ポリペプチドは、少なくとも1つの検出タグと会合する。特定の実施形態では、ポリペプチドライブラリーに含まれる各ポリペプチドは、少なくとも2つの検出タグと会合する。特定の実施形態では、ポリペプチドライブラリーに含まれる各ポリペプチドは、少なくとも5つの検出タグと会合する。特定の実施形態では、ポリペプチドライブラリーに含まれる各ポリペプチドは、少なくとも10個の検出タグと会合する。特定の実施形態では、ポリペプチドライブラリーに含まれる各ポリペプチドは、おおよそ20この検出タグと会合する。各ポリペプチド分子は、ただ1つの検出タグを含む。
b.データベースが提供される。データベースは次の情報を含む。
i複数の核酸および/またはアミノ酸配列。複数の配列が核酸ライブラリーの全てのメンバーの配列を含む。配列の各々はポリペプチドを特定する配列および検出タグを特定する配列を含む。
ii.核酸ライブラリーによりコードされた各検出タグに対する質量分析フラグメンテーションパターン。
c.ポリペプチドライブラリーは酸ライブラリーから発現される。
d.ポリペプチドライブラリーのメンバーは、選択工程において選択され、選択されたポリペプチドを得る。
e.第1の分離可能なエレメントが切断される。検出タグは、選択されたポリペプチドから分離され、単離された検出タグが得られる。
f.単離された検出タグは、次の方法で同定される。
i.単離された検出タグのフラグメンテーションパターンは、質量分析法により記録される。
ii.工程iで得られた前記フラグメンテーションパターンは、提供されたデータベースにおいて予想された前記フラグメンテーションパターンとマッチングされた。それにより単離された検出タグは同定される。タグが付された核酸ライブラリーの質量分析により得られた情報とシークエンシングにより得られた情報とを組み合わせることにより、所定の検出タグの明白な同定が可能となる。
g.工程fで同定された検出タグを特定する配列は、データベースに含まれる前記複数の配列から選択される。それにより、工程fで同定された検出タグと会合するポリペプチドライブラリーのメンバーが同定される。
特定の実施形態では、ポリペプチドライブラリーの各メンバーはアフィニティタグと会合される。
特定の実施形態では、各検出タグはアフィニティタグと会合する。
特定の実施形態では、アフィニティタグは、His-タグ、CBP-タグ、CYD-タグ、Strep-タグ、StrepII-タグ、FLAG-タグ、HPC-タグ、GST-タグ、Avi-タグ、ビオチン化タグ、Myc-タグ、3xFLAGタグ、およびMBP-タグを含む群から選択される。
特定の実施形態では、アフィニティタグは、検出タグから第2の分離可能なエレメントにより分離され、上記第2の分離可能なエレメントが、工程fより前に分離される。したがって、会合したアフィニティタグのない検出タグのみが質量分析により分析される。
検出タグの質量およびフラグメンテーションパターンの仕様は、会合したポリペプチドおよびアフィニティタグから分離された後、すなわち第1および第2の分離可能なエレメントの切断後のタグの質量およびフラグメンテーションパターンに関する。当業者は、質量分析に先立ち、検出タグが会合したアフィニティタグから遊離していない場合には、そのことが質量分析の結果に影響を与えることを認識している。すべての検出タグが同じアフィニティタグに会合されている場合、質量およびフラグメンテーションパターンの変化を考慮に入れることができるため、検出タグが第2の分離可能なエレメントの切断によりアフィニティタグから分離されている場合ほど効率的で明確ではないが、検出タグを同定することは依然として可能であろう。
特定の実施形態では、アフィニティタグはHis-タグである。
当業者は、工程d~工程gは、ポリペプチドライブラリーの多数の異なるメンバーに対して並行して行われることを認識している。数個のポリペプチドのプールは、工程gにおいて選択され、これらのポリペプチドの全てが、それらの検出タグの質量分析を経て同定される。当業者は、技術的な理由のために、すべての単一ポリペプチドがこの工程において同定され得るのではないことを認識している。
工程fにおいて行われる質量分析は定量的であり、したがって本発明の方法は、ポリペプチドの同定を可能とするのみならず、サンプルにおけるこのポリペプチドの量の定量も可能とする。
ポリペプチドを固有の検出タグと会合する方法
また別の実施態様によれば、ポリペプチドを固有の検出タグと会合する方法が提供される。その方法は、次の工程を含む。
a.第1の核酸ライブラリーが提供される。第1の核酸ライブラリーの各メンバーは、第1のポリペプチドライブラリーのメンバーをコードするポリペプチド-エンコーディング配列を含む;
b.第2の核酸ライブラリーが提供される。第2の核酸ライブラリーの各メンバーは検出タグをコードするタグ-エンコーディング配列を含む。検出タグは次の特徴を有する。
i.タグは、第2の核酸ライブラリーによりコードされたいかなる他の検出タグのアミノ酸配列とも異なるアミノ酸配列により特徴づけられる。
ii.タグは200から5000Daの間の分子量により特徴付けられる。特定の実施形態では、タグは500から2500Daの間の分子量により特徴付けられる。特定の実施形態では、おおよそ900からおおよそ2200Daの間の分子量により特徴づけられる。特定の実施形態では、タグは、903から2180Daの間の分子量により特徴付けられる。
c.第1の核酸ライブラリーのメンバーに含まれるポリペプチド-エンコーディング配列は、第2の核酸ライブラリーのメンバーに挿入される。それにより、複数のポリペプチド-タグ組み合わせプラスミドが生成される。
第1の核酸ライブラリーは5~100000のサイズを有する。特定の実施形態では、第1の核酸ライブラリーは100~50000のサイズを有する。特定の実施形態では、第1の核酸ライブラリーは500~5000のサイズを有する。
第2の核酸ライブラリーは103~1011のサイズを有する、特定の実施形態では、第2の核酸ライブラリーは105~1010のサイズを有する。特定の実施形態では、第2の核酸ライブラリーは106~109のサイズを有する。特定の実施形態では、第2の核酸ライブラリーはおおよそ108のサイズを有する。
複数のポリペプチド/タグ組み合わせプラスミド内で、第1の核酸ライブラリーの各ポリペプチド-エンコーディング配列は、第2の核酸ライブラリーのタグ-エンコーディング配列に会合される。会合は、同じリーディングフレーム内で生じる。
d.複数のポリペプチド-タグ組み合わせプラスミドのサブセットが選択される。この選択工程は、規定の数のクローンを選択することを含み、各クローンは、複数のポリペプチド-タグ組み合わせプラスミドの1つのメンバーを含む。それにより、タグが付されたポリペプチドライブラリーをコードするタグが付された核酸ライブラリーを生成する。タグが付されたポリペプチドライブラリーの各メンバーは、ポリペプチドおよび検出タグを含む。各タグは、タグが付されたポリペプチドライブラリーのただ1つのメンバーに含まれる。言い換えれば、各検出タグは、タグが付されたポリペプチドライブラリー内にただ1つである。しかしながら、各ポリペプチドは、タグが付されたポリペプチドライブラリーの数個のメンバーを含む(冗長タグ化)。
特定の実施形態では、各ポリペプチドは、少なくとも1つの検出タグと会合する。特定の実施形態では、各ポリペプチドは、少なくとも2つの検出タグと会合する。特定の実施形態では、各ポリペプチドは、少なくとも5つの検出タグと会合する。特定の実施形態では、各ポリペプチドは、少なくとも10個の検出タグと会合する。特定の実施形態では、各ポリペプチドは、おおよそ20個の検出タグと会合する。
本発明のこの実施態様の特定の実施形態では、複数のポリペプチド-タグ組み合わせプラスミドの選択されたサブセットは、第1の核酸ライブラリーのメンバーの数の少なくとも10倍である。特定の実施形態では、複数のポリペプチド-タグ組み合わせプラスミドの選択されたサブセットは、第1の核酸ライブラリーのメンバーの数の少なくとも20倍である。
本発明のこの実施態様の特定の実施形態では、複数のポリペプチド-タグ組み合わせプラスミドの選択されたサブセットは、第2の核酸ライブラリーのメンバーの数の50%未満である。本発明のこの実施態様の特定の実施形態では、複数のポリペプチド-タグ組み合わせプラスミドの選択されたサブセットは、第2の核酸ライブラリーのメンバーの数の5%未満である。本発明のこの実施態様の特定の実施形態では、複数のポリペプチド-タグ組み合わせプラスミドの選択されたサブセットは、第2の核酸ライブラリーのメンバーの数の0.05%未満である。
複数のポリペプチド-タグ組み合わせプラスミドの選択されたサブセットの最適なサイズを選択することにより、タグが付されたポリペプチドライブラリーにおいて、各検出タグはただ1つである(1回だけ存在)が、各ポリペプチドは、数回存在し、各回は異なる検出タグと会合する。
単一の分離可能な特徴に対する代替物が本明細書において「実施形態」として配置される場合は常に、そのような代替物が自由に組み合わされて本明細書に開示される本発明の個別の実施形態を形成し得ることが理解されるべきである。
本発明は、以下の実施例および図面によってさらに説明され、これから、さらなる実施形態および利点を引き出すことができる。これらの実施例は本発明を説明するためのものであり、その範囲を限定するためのものではない。
フライコード配列ライブラリー
短いDNA-コードペプチドのランダム化ライブラリーは、質量分析(MS)、特にLC-MS(ESI-MS連結液体逆相クロマトグラフィー)により最適に検出可能となるように設計された。ペプチドは、903と2180Daとの質量範囲であり、ESI-MSによる敏感な検出に最適である。フライコードは、生理学的pHおよびそれ以下で、2つの正の電荷、すなわちC-末端およびN-末端第1級アミンにRを担持する。C-末端での正の電荷は、質量分析検出のためのペプチドのイオン化を容易にし、特有のトリプシン切断部位として作用する。各フライコードにおいて、N-末端アミンは、第1級アミンのみであり、単純なNHS化学によりアミン結合に使用される。これは、例えばiTRAQ(相対的定量および絶対的定量に対する同重体タグ)を行うために量的質量分析のためのラベルを取り付けることを可能とする。フライコードを標準逆相クロマトグラフィーカラムによるペプチド分離に理想的に適した疎水性の範囲を表示するように設計した。
フライコードライブラリーは、2つの部分に加えて、一定、すなわちN-末端にGS、C-末端にRである隣接アミノ酸からなる。N-末端「GS」配列は、トロンビンプロテアーゼ切断部位の一部であり、切断後にフライコードに残るものである。
第1部:バーコード領域は、7つの連続して任意抽出されたアミノ酸位置を含む。アミノ酸の平均頻度は、上記表1に示す(%で)。
12個の天然アミノ酸のすべてがバーコードに存在するとは限らない(C、M、K、R、HおよびIを欠いている)。CおよびMは酸化されやすいため除外した。K、RおよびHは、フライコード配列に追加の正電荷を付加するであろうことから除外した。付加は、そのような場合にペプチドがESI-MS検出の間に追加の電荷を帯び、最適な検出範囲を外れるため望ましくなかった。KおよびRは、フライコード配列にさらなるトリプシン切断部位を付加するであろうが、これは望ましくない。Kはもう1つの第一級アミンを加えるであろうが、それはNHS化学によるペプチド標識を複雑にするだろう。イソロイシンは、質量においてロイシンと区別できないため除外した。
第2部:フライコードライブラリーにおいて頻度が等しく、すべての末端にRを有する5つの異なる変異体においてC-末端を構築した。それらは、同様にC、M、K、HおよびIを欠いている。したがって、フライコードは最小で11個のアミノ酸および最大で15個のアミノ酸からなる(GS+7個のランダム化残基+2~6個のC-末端残基)。5つの異なるC-末端の終わりがここにリストされている。
配列番号1(WR)、配列番号2(WLR)、配列番号3(WQSR)、配列番号4(WLTVR)および配列番号5(WQEGGR)
フライコードを含むNestLink発現ベクターpLNx
NestLink発現ベクターpLNxは、多様な108配列変異体を有するフライコードライブラリー(図2)を抱え、目的のタンパク質ライブラリー(PLOI)を、フライコードを有するフレームに導入することができる。2つのライブラリー(PLOIおよびフライコードライブライ)が互いに入れ子になるので、この工程の結果は「ネスト化ライブライ」となる。発現ベクターは、ネスト化ライブラリー(フライコードに融合されたPLOI)の制限酵素による切り出しも可能とし、ディープシークエンシングプラスミドへの挿入を可能とし、また二本鎖オリゴヌクレオチド(アダプター)を用いて直接的なイルミナ MiSeqアダプターライゲーションを行うこともできる。PLOIは任意の遺伝的にコードされたライブラリーであっても良い点に注意。
PLOIは、ライブラリーをコードする供給源DNAを制限消化し、続いて発現ベクターにライゲーションすることにより発現ベクターに導入される。本発明者らはこの目的のためにIIS型制限酵素(SapI)を使用する。供給源DNAは、典型的には、ファージディスプレイ選択後に得られ、PLOIがPCR増幅なしでNestLink発現ベクター(このベクターの説明、下記参照)にサブクローニングすることができるように方向付けられたSapI部位を含むファージミドに由来する。PLOIが挿入されると、それはネガティブ選択カセット(ccdB)に置き換わり、挿入工程の効率を大いに向上させる。
フライコードはトロンビンによってPLOIから切り離され、His-タグがトリプシンによりフライコードから除去される。これらの開裂は、最適な質量、最適な疎水性および最適な電荷を有するペプチドが質量分析のために単離されることを確実にする(上記のフライコードの説明を参照)。プロテアーゼの他の任意の組み合わせが同じ目的のために使用され得ることもまた考えられる。
注目すべきは、フライコードのC-末端アルギニン(R)が重要な役割を果たすことである:第一に、リジンまたは他のアルギニンがフライコードライブラリーにおいて除外されているため、C-末端アルギニンはフライコードの唯一の正電荷アミノ酸である。このため、トリプシン(正に荷電した残基の後ろで開裂し、それ故にかなり非特異的であると考えられるプロテアーゼ)はアルギニンとHis-タグとの間のペプチド結合を特異的に開裂するために使用できる(フライコードは、質量分析についてHisタグでかなり重過ぎるであろうし、Hisタグは、質量分析の前の逆相クロマトグラフィーにおいて分離を低下させるであろう。)。質量分析用のHisタグおよびHisタグは、質量分析前の逆相クロマトグラフィーにおける分離を減少させるであろう)。第二に、C-末端アルギニンを有するペプチドは、質量分析法によって特に良好に検出可能であることが知られている(好ましいイオン化特性)。そして第三に、フライコード中に存在するこの単一の正に荷電したアミノ酸のために、総電荷は常に2+(N末端+アルギニン、他の全ての残基は検出の低いpHで中性である)であり、それはデータ分析を容易にする。
この技術の重要な側面は、目的のタンパク質ライブラリーの同一のメンバーに数個の固有のフライコードを付けることが可能である(そして必要である)という事実である。例えば、100種類のタンパク質のプールを分析するには、平均してプールの各タンパク質が異なるフライコードに20回リンクされるように、2000種類のフライコードをこれらの100種類のタンパク質に取り付ける(プールメンバーとフライコードとの比率は実際要望に応じて変えることができる)。冗長タグ付けは、多重フライコード配列を介したプールメンバーの明白な検出を容易にし、そして分析された目的のタンパク質の生物物理学的性質に対するフライコード配列の潜在的な影響を平均化する。冗長タグ付けはまた、選択されたサンプル内の異なるタンパク質ライブラリーメンバーの相対量、または異なる選択されたサンプル内の同じタンパク質ライブラリーメンバーの相対量の決定を可能にする。冗長性は技術的な理由からさらに必要とされる。フライコードは質量分析による最適検出用に設計されているが、一部のフライコードはサンプル調製中に失われるか、質量分析によって分析される逆相カラムの疎水性ウィンドウ内に溶出しないため検出されない。
さらに、NestLink発現ベクターは、ディープシークエンシングプラスミドに挿入できるように、またはイルミナ MiSeqアダプターを、二本鎖オリゴヌクレオチド(アダプター)を用いて直接連結することができるように、ネスト化ライブラリー(フライコードに融合したPLOI)の切り出しを可能にする2つのSfiI制限酵素認識部位を含む。この重要な工程の根拠を以下に示す。
注目すべきは、PLOI内もしくはPLOIとフライコードとの間のいずれかのSfiI制限部位および/または他の制限部位が、ネスト化ライブラリーにさらなる配列を加えるために使用できるということである。したがって、これらの追加の配列は、(フライコードとPLOIとの間、またはネスト化ライブラリーに隣接して)ネスト化ライブラリーへの融合として表現することができる。重要なことに、これらの追加の配列を導入する前に、ディープシークエンシングプラスミドへの移動(またはオリゴヌクレオチドによる直接のディープシークエンシングアダプターライゲーション)が行われるので、かかる配列はディープシークエンシングリード長(技術的理由により制限される)を増加させない。さらに、このように追加の配列を追加することは、フライコードとPLOIとの間の物理的連結を維持する。これは、PLOIメンバーへのフライコードの正しい割り当てにとって絶対に重要である。
ディープシークエンシングプラスミド
ディープシークエンシングプラスミドは、イルミナ MiSeqによるディープシークエンシングに必要なすべての配列を担持し、NestLink発現ベクターからのネスト化ライブラリーメンバーのプールの挿入を可能にするベクターのセットである。
ネスト化ライブラリーのディープシークエンシングプラスミドへの移動(図1および2)は、制限消化とライゲーションによって行われる。本発明者らは、制限酵素SfiIを十分に高い特異性を有するのでこの目的のために使用した。このことは、偶然制限部位をコードしている可能性のあるライブラリー全体を消化する場合に極めて重要である。さらに、選択されたSfiI認識部位は、発現構築物においてリンカーアミノ酸として使用することができる適度に柔軟で親水性のアミノ酸に翻訳される。
本発明者らは、NestLink発現ベクターからディープシークエンシングプラスミドへの移動工程がネスト化ライブラリーのPCR増幅工程を含まないことがNestLinkにとって極めて重要であることを実験により示すことができた。タンパク質-フライコード配列のPCR増幅は、必然的にライブラリーメンバー間の非相同領域(例えばCDR)とフライコードの組換えをもたらす(ある目的のタンパク質のフライコードの、NestLink発現ベクターにおいて結合されていないもう1つのタンパク質上への意図しない結合)。それによって、フライコードとタンパク質との間のリンケージが破壊される。
上記のように、ネスト化ライブラリーはSfiIを介して発現ベクターから切り出される。その後、それをディープシークエンシングプラスミドに連結する。これはネガティブ選択カセット(ccdB)に代わるもので、挿入工程の効率にとって非常に重要である。挿入後、イルミナ MiSeqによるディープシークエンシングに必要な(そして頻繁に使用される)配列に隣接する。シークエンシングは両側から中心に向かって行われる。したがって、関連領域は反対方向にインサートの両側に存在する(インデックスを除く逆相補配列)。
ここでは、内側部分(インサート)から外側領域への配列について説明する。
SfiI部位:ccdBをネスト化ライブラリーで置き換えるために使用される。
多様性:イルミナ MiSeq技術は、プライマー結合部位の隣の配列に基づいて最初のシークエンシングシグナルを生成する。最初の数塩基は、検出チャンネルのシグナル過負荷およびシークエンシング実行の中止を防ぐために多様(同一でない)でなければならない。
プライマー結合部位:シークエンシング用プライマーがここに結合する。
インデックス(番号501および701でラベル付けされている):イルミナ MiSeq技術は多重化を可能にする。すなわち、1回のシークエンシング実行で数個のサンプルを分析できる。どの読み取りがどのサンプルに属するかを決定するために、インデックス(可変8bpストレッチ)もまた読まれる。1回のディープシークエンシング実行において数個のNestLink実験をシークエンシングできるようにするために、本発明者らは、それぞれ異なるインデックスペアを担持する11個のディープシークエンシングプラスミドを作成した(インサートの両側にインデックス配列があることに留意)。
アダプター:イルミナ MiSeqフローセルでのディープシークエンシング用DNAテンプレートを固定するために使用される。
BseRI制限酵素部位:これは、イルミナ MiSeqディープシークエンシングに必要な直鎖状DNAフラグメントを作製するために使用される。BseRIがIIS型制限酵素(その認識配列の外側で切断する)であるという事実は、アダプターでの突出を最小限に抑えるのに特に有用である。
従来の方法では、これらすべてのイルミナ MiSeq配列エレメントは、PCR、イルミナアダプターのライゲーション、それに続くPCR増幅、またはTRuSeq DNA PCRフリーサンプルプレップキット(イルミナ)のいずれかによって配列決定されるDNAに結合される。本発明者らのプロトコルでは、配列決定されるDNA(ここではタンパク質-フライコード配列)を、制限および連結によってドナーベクター(ここではNestLink発現ベクター)からディープシークエンシングベクターにサブクローニングし、それによってPCRを回避する。最終段階において、ディープシークエンシングベクターはBseRIを用いて切断される。これにより、DNAアガロースゲルによってベクター骨格から分離され、ゲル抽出によって精製された完全なイルミナ MiSeqシークエンシングテンプレートが放出されます。
ディープシークエンシングのための二本鎖アダプターオリゴヌクレオチド
PLOIへのイルミナ MiSeqディープシークエンシングに必要なアダプター配列のPCR非依存的結合を可能にする第二の戦略は、ディープシークエンシングプラスミドについて記載したのと同じセットのアダプター配列を担持する二本鎖オリゴヌクレオチドに依存し、ディープシークエンシングプラスミドは、一本鎖オリゴヌクレオチドの合成とその後のアニーリング反応により作製できる。相補的一本鎖は、長さが異なるように合成され、その結果、アニールされたアダプターの付着突出が生じる。この突出は、切断されたSfiI制限部位の相補的配列に相当し、これはフライコード化されたPLOIがNestLink発現ベクターから切り出されるときに生成される。したがって、アニールされたオリゴヌクレオチドは、高効率でフライコードされたPLOIに連結されて、イルミナ MiSeqディープシークエンシングに必要なアダプター配列を結合することができる。連結産物は、ディープシークエンシングの前にアガロースゲルを介して精製される。
ここで、内側部分(インサート)から外側領域への最終的なディープシークエンシングテンプレートの配列について説明する。
フライコード化されたPLOI:フライコード化されたPLOIは、SfiI制限消化を介してNestLink発現ベクターから切り出される。
SfiI制限部位の残り:この酵素はNestLink発現ベクターからの切り出しを可能にし、生成された付着末端は深部シークエンシングアダプターを部位特異的に結合するために使用される。
多様性:イルミナ MiSeq技術は、プライマー結合部位の隣の配列に基づいて最初のシークエンシングシグナルを生成する。最初の数塩基は、検出チャンネルのシグナル過負荷およびシークエンシング実行の中止を防ぐために多様(同一でない)でなければならない。
プライマー結合部位:シークエンシング用プライマーがここに結合する。
インデックス(番号501および701でラベル付けされている):イルミナ MiSeq技術は多重化を可能にする。すなわち、1回のシークエンシング実行で数個のサンプルを分析できる。どの読み取りがどのサンプルに属するかを決定するために、インデックス(可変8bpストレッチ)もまた読まれる。1回のディープシークエンシング実行において数個のNestLink実験をシークエンシングできるようにするために、本発明者らは、7つのディープシークエンシングアダプター(一端に3つ、他端に4つ)を作製し、それにより12の異なるインデックス対を生成できる。
アダプター:イルミナ MiSeqフローセルでのディープシークエンシング用DNAテンプレートを固定するために使用される。
フライコードによるPLOIメンバーの定量化
多くのNestLink適用は、フライコード化PLOIメンバーの絶対的定量化を必要とする。LC-MSはプロテオミクスにおける個々のペプチドの定量では不正確であるが、NestLinkは各PLOIメンバーに付着している複数のフライコードと、質量分析による最適な検出のために設計された同種のフライコードライブラリーの恩恵を受ける。この考察に基づいて、本発明者らは、任意の所定のPLOIメンバーの全フライコードの合計MS1強度は、サンプル中のこのPLOIメンバーの量に比例しなければならないと仮定した。本発明者らは、可変数のフライコードに連結した既知量の8つのシボディを、それぞれ大腸菌(E. coli)およびスメグマ菌(M. smegmatis)由来のライセートを含む2つのサンプルに添加すること(spiking)によってこの仮説を検証した(図3)。各フライコード化シボディのすべてのフライコードの合計されたMS1強度とその添加された量との間の観察された線形関係は仮説の正しさを証明し、そして本明細書に記載のNestLink手法がプール内の個々のPLOIメンバーを定量するために使用できることを実証する。個々のPLOIメンバーの絶対量は、LC-MSのためのフライコード単離の前に、既知量の1つまたは複数のフライコードタンパク質(標準)がサンプル中に添加される場合に決定することができる。
ファージディスプレイ選択用のファージミド(NestLink以前)
本発明者らの現在の適用のほとんどにおいて、PLOIは、シボディと呼ばれる濃縮合成ナノボディのプールである。典型的には、大型のシボディライブラリーは、標的タンパク質に結合するためにファージディスプレイを用いて濃縮される。非相同領域(すなわちCDR)の組換えを回避するために、ファージディスプレイ選択後にPLOIをPCRによって増幅してはならない。この目的のために、ファージミドベクター(図2A)を、PLOIがSapI制限部位を介してNestLink発現ベクターにサブクローニングできるように構築した。注目すべきことに、SapI部位は翻訳産物の一部であり、それはファージ表面に表示される。本発明者らは、SapI部位に由来するこれらのさらなるアミノ酸がファージディスプレイ効率を妨害しないことを実験的に示すことができた。
SapI部位とは別に、ファージディスプレイベクターは、M13ファージ上にタンパク質をディスプレイするために使用されるファージミド中に典型的に存在する全てのエレメントを含み、そしてベクターpMESy4(genbank KF415192)の誘導体である。
本明細書に記載されているすべてのベクターに関連する追加の一般的な注意事項:あるベクターから別のベクターへのインサートの効率的な移動を可能にするために、ベクターが異なる抗生物質耐性を有することが重要である。したがって、NestLink発現ベクターはクロラムフェニコール耐性マーカーを、ディープシークエンシングベクターはカナマイシンマーカーを担持する。さらに、ファージディスプレイ選択用のファージミドは、アンピシリン耐性マーカーを含む。
概念実証実験
この実験において、本発明者らは、NestLinkを用いて前例のない方法でタンパク質候補の大きなプール内の個々のタンパク質を特徴付けることができ、そして選択の下流適用に最も有望な特徴を有するプールメンバーを同定できることを実証した。
より具体的には、以下に説明する概念実証実験は、i)良好に制御されたライブラリー多様性におけるライブラリーネスト化のための効率的な方法が開発されたこと、およびii)結合剤のプールに対する前例のない選択圧の基礎として役立ち得ることを実証する。
この実施例において、本発明者らは、マルトース結合タンパク質(MBP)に対してリボソームおよびファージディスプレイを介して予め濃縮された(記載されていない)シボディのプールからなるPLOIを用いて研究した。
本発明者らは、この特許に記載されたNestLink方法を使用して、以下の選択圧を一度にシボディの多様なプールに課した:i)最高発現シボディの選択、ii)最高溶解性シボディの選択、およびiii)溶液結合アッセイにおいて標的に結合するシボディの選択。
材料と方法のセクションに記載されているプロトコルを使用して、本発明者らは、約1200の異なるシボディプールメンバーを約17,000の固有のフライコードにリンクすることを意図し、いわゆる「ネスト化ライブラリー」をもたらした。これは、最初にシボディ-エンコーディングファージミドを含む細胞の適切なクローン数を1つの容器で培養し、続いてそれらのプラスミドDNAを単離することによって行った。個々のシボディクローンを選ぶ代わりに、寒天プレート上にプレーティングすることによる形質転換後に、回収された細菌の体積当たりのコロニー形成単位数(cfu)を推定した。それ故、適切な量の回収された細菌(約1200cfu)を培養物の接種のために使用し、その後これをプラスミドDNA単離のために回収した。次に、これらの多様性制限ファージミドのDNAインサートを、約108個の異なる変異体のフライコードライブラリーを含む発現ベクターpNLxに連結した。上記で概説したcfu推定値を使用して、クローンの数は約17000に制限された。108個の変異体のうち約17,000個のフライコード含有ベクター(cfu推定により決定される)しか使用されなかったので、本発明者らは、99.974%のフライコードが固有であり、それゆえ、フライコードの大部分は、ただ1つのシボディを標的化すると予測した。さらに、彼らは約17000のフライコード含有ベクター内に約1,200のシボディ遺伝子を入れ子にしているので、平均的なシボディは14の異なるフライコードでタグ付けされていると予想した。
ベクターpNLxにおけるネスト化ライブラリーを単一のフラスコ中の細菌中で発現させ、選択実験を実施するためにフライコード結合剤プールとして精製した(下記参照)。ネスト化ライブラリーをシークエンシングするために、フライコード化シボディを、MiSeq装置を用いるイルミナディープシークエンシングのための全ての関連配列を保有するディープシークエンシングベクターpNLに移した。ネスト化ライブラリーのディープシークエンシングは、全てのフライコードの対応するシボディへの明白な割り当てを与えた。データのフィルタリング後に、13,620個の固有のフライコードにリンクされた1080個の異なるシボディ配列が得られたため、ディープシークエンシングデータは、ネスト化ライブラリー内の予想されるシボディおよびフライコード番号と一致していた。したがって、平均して各シボディは12.61回、異なるフライコードにリンクされていた。本発明者らは、データフィルタリングをシークエンシングした後にシボディへのあいまいなフライコード結合を観察しなかった(すなわち、同じフライコードが2つ以上の異なるシボディに結合していた)。本発明者らの知る限りでは、よく制御された多様性を用いてライブラリーを互いに入れ子にするというこの成功した試みは前例のないことである。
ディープシークエンシングデータを使用して、ネスト化ライブラリーの全配列情報を含むデータベースを、各シボディの全てのフライコードを、対応するシボディを識別子として有する理論的連続タンパク質配列に連結することによって構築した。次いで、このデータベースは、後のMS/MSイオン検索で使用するためにMascotサーバーにアップロードされた。
この技術の新規な適用の例として、本発明者らはネスト化ライブラリーを使用し、特定の見かけの流体力学的半径を有するこれらのシボディおよび溶液中のMBPに対して高いアフィニティ相互作用を示すものを選択および同定した。これらの特徴は両方とも、サイズ排除クロマトグラフィー(SEC)によって決定され、遺伝子型は表示されるタンパク質のサイズを通常100倍以上増加させ、ディスプレイ粒子をタンパク質レベルでの小さなサイズの違いに対して鈍感にさせるので、遺伝子型-表現型連鎖を必要とする現在の最先端の表示システムを使用することには適していない。
この目的のため、ネスト化ライブラリーを発現させ、そしてフライコード化結合剤をNi-NTA樹脂を介して精製し、そしてSECに付した。単量体タンパク質に対応するシボディの溶出画分(最高の溶解度を有する結合剤候補)をプールし、そして2つの等価なアリコートに分けた。一方のアリコートをMBPとインキュベートし、他方を緩衝液のみとインキュベートした。2つのサンプルをSEC上で別々に分析し(MBPなしの実験を対照として使用した)、そしてシボディ-MBP複合体のサイズに対応する溶出画分を集めた。その後、MBPおよび対照実験の収集した画分のフライコードを単離し、2回の別々のLC-MS実行に供するか、または単離したフライコードの同重体タグ標識後の1回のLC-MS/MS実行に組み合わせた。次に、以前に生成されたディープシークエンシングデータベース(フライコードからシボディへの割り当て)を使用してMascot検索でフライコードを同定し、それによってシボディ-MBP複合体のサイズで溶出するシボディを明確に同定する。この実験により、本発明者らは、全てよく発現され、単量体であり、そして溶液中で標的タンパク質に結合する300を超える固有のシボディを同定することを可能にした。
オフレート決定のためのNestLinkの適用
上述の原理実証実験で同定されたMBP特異的シボディをそれらの結合オフレートに従ってスコア付けするために、本発明者らは、ビオチン化MBPを介して等量の単離されたMBP-シボディ複合体を2つのストレプトアビジン-セファロースカラムに固定化した(図4)。次に、過剰の非ビオチン化MBPを用いたオフレート選択(3分間洗浄)を一方のカラムで実施し、他方のカラムは緩衝液のみで洗浄した。洗浄後、両方のカラムから残ったシボディを溶出し、それらのフライコードを2回のLC-MS/MS分析にかけた。上記の溶液内結合実験(SEC実行)と同様に、ディープシークエンスデータベースは、フライコードによるシボディ同定のためのMascot検索において使用された。さらに、Progenesisソフトウェアを使用して、すべての同定されたフライコードのMS1強度を各シボディについて合計した。上記で決定されたMS1ピーク強度の量的性質のために、本発明者らは、2つのカラム間の各シボディに対するフライコード-強度-合計の間の比率は、過剰な非ビオチン化標的でのオフレート選択前後のそれらの相対濃度に対応すると予測した。各解離反応が単一指数関数的減衰に続くと仮定し、過剰な標的を用いた洗浄時間(3分)についての知識を使用して、著者らは一度に300超の結合剤についておおよそのオフレートを決定することができた。この分析は、表面プラズモン共鳴を用いて11個の個々の結合剤のオフレートを測定することによって確認された。1回の実験で結合剤候補のプール内のオフレートを決定することは、著者の知る限りでは前例のないことである。個々のタンパク質を処理する必要があるために以前には数週間を必要としたプロセスは、今回本明細書に記載の技術を使用して一度に実行することができる。
免疫ラクダ科動物からの結合剤同定のためのNestLinkの適用
免疫化アルパカ(ラクダ)のB細胞からのcDNA単離を介して得られた天然ナノボディのプールにNestLinkを適用した。免疫化に使用された抗原は、サーモトガマリティマ(Thermotoga maritima)由来のABCトランスポーター(内在性膜タンパク質)であるTM287/288であった。ラクダ科動物由来のナノボディ産生の伝統的なプロトコルとは反対に、このナノボディプールはファージディスプレイを用いた標的に対して強化されなかった。
ナノボディをPCR増幅し、多様性を制限し、フライコードライブラリーとインターレースして、イルミナ MiSeqディープシークエンシングによって決定されるように59,974の固有のフライコードに結合した3,469の固有のナノボディ配列を得た(材料および方法のセクション参照)。ネスト化ライブラリーを発現させ、Ni-NTAを介して精製し、続いてSECを介して単量体プールメンバーを単離した。原理実証実験(上記)と同様に、発現しなかったかまたは可溶性でなかった好ましくない結合剤候補は、これらの予備選択工程において排除された。溶出後、Ni-NTAカラムから、およびSEC実行の単量体画分から、LC-MSサンプルを収集した。続いて、漸増量のプールをTM287/288と共に約0.1:1、2:1および100:1の比率でインキュベートし、抗原/プール混合物を再び3回のSEC実行に供した(図5)。標的/ナノボディ複合体のサイズに対応する画分を集めた。収集したすべてのサンプルのフライコードを別々に単離し、LC-MS/MSによって分析した。これにより、発現レベル、溶解性(SEC上の単量体)、および溶液中の抗原に対する結合強度をすべての結合剤に対して一度に比較できた。
免疫ラクダ科動物由来の3,469の固有なナノボディのこの分析において、本発明者らは、安定性、発現レベルおよび溶解性が良好な27種の高親和性結合剤ファミリーを同定した。驚くべきことに、NestLinkは、ELISAおよびSanger配列が使用され、かつかなり長い処理時間の間に同じプールにおいてこれらのファミリーのたった5つが同定されるファージディスプレイの選択や過剰な従来のスクリーニングよりもはるかに効率的である。まとめると、NestLinkは免疫ラクダ科動物から最も有望な候補生体分子を同定するために使用することができ、現在の最先端の手法では達成されていないスループットと精度であると言える。
細胞表面のタンパク質を標的とする結合剤を同定するためのNestLinkの適用
上記の実験は、溶液中の精製された標的/抗原に対する結合タンパク質を同定する目的で行われ、結晶学のようなインビトロ用途のための好ましい研究ツールをもたらした。ここで、本発明者らは、細胞表面で高い特異性および親和性で標的タンパク質を認識する膜タンパク質結合剤の同定という、薬物開発の中心的ボトルネックを解決することを意図した。膜タンパク質標的に対して生体分子薬を開発することは、典型的には2つの連続した工程を必要とし、それらは根本的に異なる。第一に、結合剤候補の多様なプールがディスプレイ手法または免疫化を介して生成される。第二に、多様なプールを細胞アッセイにおける結合および機能についてスクリーニングする。後者は、個々の結合剤候補を一つずつ(典型的には小型化されたフォーマットで)分析する必要があるため、本質的に非効率的で遅い。この実験において、本発明者らは、個々の結合剤候補を1つずつ面倒に分析することなく、内在性膜タンパク質標的に対して特異的な細胞表面結合剤を同定するために、NestLinkにより第2の(スクリーニング)工程を置き換えた。
本発明者らは最初に、グラム陰性菌の純粋な界面活性剤可溶化外膜タンパク質抗原に対するシボディライブラリーのインビトロディスプレイを行った(工程1、結合剤候補の多様なプールの生成)。細胞表面結合についてこの多様なプールの個々の各結合剤候補を個々に試験する代わりに(通常は工程2)、本発明者らはNestLinkを行い、一度に大きな候補プールを試験した(図6A)。1,456のシボディがフライコードライブラリーとインターレースされ、31,500のフライコードがリンクされた(平均22のフライコード/シボディ)。上記のように、フライコード-結合剤の割り当てはディープシークエンシングによって得られ、ネスト化ライブラリーは発現され、精製され、そして単量体プールメンバーが単離された(カウンター-選択/望ましくない結合剤候補の排除)。したがって、発現レベルが低く、溶解度が低いプールメンバーを最初に排除し、各プールメンバーの発現レベルおよび溶解度特性をモニターした。よって、NestLinkプロセスは、もっぱら有望な結合剤候補を細胞表面選択に注ぎ込み、それは以下のように行われた:単量体プールメンバーを4つの等価画分に分け、各画分を別の細菌株と共にインキュベートした。ペレット化し、緩衝液を用いて再懸濁/洗浄することにより、非結合性のシボディ候補を除去した。続いて、細菌株のうちの1つに結合したシボディのすべてのフライコードを単離し、LC-MS分析にかけた。1シボディ当たりの全フライコードの全MS1強度の合計を、各標的細胞におけるプール中の各個別シボディの相対濃度の尺度として用いた。これは正確な細胞特異性の読み取りを可能にした(図6B)。
プール中の1,456個の結合剤候補から、目的のグラム陰性菌(株4)の外膜に埋め込まれた天然型のタンパク質標的を特異的に認識する6個の十分に発現された可溶性シボディが同定された。本発明者らは、(蛍光標識した後に)これら6つの同定されたシボディを4つの菌株に対してフローサイトメトリーによって個々に分析することによって確認した。試験された全ての候補はこの単一クローンアッセイにおいて、NestLinkを介して観察のと同じ特異性プロファイルを示した。注目すべきことに、同定された各結合剤は、イルミナ MiSeqディープシークエンシングによって決定されるように、ネスト化プール中に0.05%未満しか存在しなかった。最先端のスクリーニングは結合剤候補の一つの特性(例えば標的結合)のみを考慮に入れているが、発現レベルまたは溶解度/オリゴマー化傾向を報告するには不十分であることを考えると、これら6つの結合剤のいずれもが、古典的な単一クローンスクリーニングアプローチによって同定されるとは思われない。それゆえ、この実験は、遺伝子型-表現型連鎖の欠如および2つのライブラリーの交錯のおかげで、NestLinkがこれまでにない深さで結合剤ライブラリーをスクリーニングすることを可能にすることを実証する。
モデル生物における生体内分布および薬物動態学的パラメータを監視するためのNestLinkの適用
先の実施例において、本発明者らは、遺伝子型-表現型連鎖が存在しないことにより、NestLink選択が前例のない選択圧を可能にすることを示した(例えば、SEC上の単量体プール/ライブラリーメンバーの選択)。ここでは、物理的な遺伝子型-表現型連鎖の場合には達成することができない別の選択圧が導入される:特定の生体内分布および生体内での薬物動態学的性質を有するタンパク質の選択。生体分子治療候補のネスト化(フライコードタグ付き)プールを動物モデルに注入してもよく、各プールメンバーの相対濃度をLC-MSにより、身体の各位置で(例えば、異なる器官、組織または腫瘍で)一定の経過時間後に測定してもよい。このタイプの分析は、ある特定の時点で、体内の個々のプールメンバーに対し包括的/広範囲な生体内分布分析をもたらす。様々な異なる時点の後に同種の類似個体がこの分析にかけられた場合、NestLink生体内分布分析は時間次元に拡張され、したがって各候補について低いまたは中程度の時間分解能での薬物動態学的データ取得が可能になる。
本発明者らは、以前に異なる量のフライコードシボディを添加したホモジナイズマウス組織からのフライコード抽出手順を試験および最適化することにより、この種の分析の基礎を設定した。詳細には、いくつかのシボディが最初に少数のフライコード(20~30)にリンクされ、シボディからフライコードへの割り当て(assignment)がイルミナ MiSeqディープシークエンシングによって決定された。次に、フライコードタグ化シボディを個別に発現および精製し、それらの濃度を吸光度測定によって決定した。次いで個々のシボディを異なる濃度(一桁に渡る)で混合した。
並行して、マウスの凍結臓器(肝臓、肺、腎臓)および血液を解凍し、変性緩衝液条件およびポッターを用いてホモジナイズした。予め調製した滴定混合物をホモジネートに添加し、室温で30分間インキュベートして、潜在的なプロテアーゼまたはフライコード修飾酵素を作用させた。続いて、それらの残りのフライコードと共にシボディを抽出し、フライコードをプロテアーゼ切断により単離し、そしてLC-MSにより分析した。滴定混合物の個々のシボディの検出に基づいて、本発明者らは、そのような均質化された臓器および組織からのLC-MSによるシボディ検出は典型的には30~100ng(シボディ)の量まで信頼できることを見出した。1mgまでの治療薬が典型的にはマウスモデルに注射され得ることを考えると、体内の最も関連のある場所において、ネスト化プールの注射後に数十マイクログラムが存在することは明らかである。したがって、広範囲な生体内分布を監視し、結合剤プールの薬物動態分析を実施するのに十分な非分解型および非改変型のフライコードが存在する。
材料および方法
以下に、NestLink方法の一般的なプロトコルが提供される。それは、上に概説したように実験を実施するために必要とされる全ての工程を包含し、ライブラリーのネスト化、ディープシークエンシング、フライコード化結合剤プールの発現および精製、フライコード抽出、LC-MSおよびデータ分析に関する詳細を提供する。
ライブラリーネスト化によるフライコード化ナノボディのクローニング
1.シボディ/ナノボディプールの多様性制限
NestLink実験は、ファージディスプレイまたは免疫化によりインビトロの結合剤選択からそれぞれ得られた、シボディまたは天然のナノボディのプールを用いて行われた。ファージディスプレイを結合剤選択に使用した場合、ファージミドにコードされた200ngのインビトロ選択された潜在的結合剤プールを50μlの大腸菌MC1061化学的コンピテントセルに形質転換した(プロメガ社のプロトコル、Subcloning Notebook 2004により達成した能力(competence))120μg/mlのアンピシリンを含む寒天プレートに希釈系列を蒔き、30℃で一晩インキュベートした。所望のコロニー形成単位(上記の例では1000~1500cfuの範囲の数)を含むプレートのコロニーを100μg/mlのアンピシリンを含む2mlのLB培地に再懸濁し、懸濁液を100μg/mlのアンピシリンを含むLB培地の200mlの培養液に移した。この培養物を37℃で一晩増殖させ、DNA調製のために使用した(キット:#740412.10、マッハライ-ナーゲル)。調製したファージミド15μgを、緩衝液NEB3.1(ニュー・イングランド・バイオ・ラボ、#B7203S)中の100単位のBspQI(ニュー・イングランド・バイオ・ラボ、#B0712L)で、50℃で1時間、140μlの反応容量で消化し、その後、80℃で20分間、酵素を熱失活させた。2%(w/v)アガロースゲル上で電気泳動を行い、結合剤プールに対応するバンドを切り出し、抽出した(キット:#740609.250、マッハライ-ナーゲル(MACHERY-NAGEL))。免疫化アルパカの場合、ナノボディ配列を記載されているように(Pardon et al., Nat Protc., 2014 Mar; 9(3): 674-93)B細胞のcDNAから増幅し、BspQI制限部位を含むプライマーで増幅した。5μgの精製PCR産物を、緩衝液NEB3.1(ニュー・イングランド・バイオ・ラボ、#B7203S)中の100単位のBspQI(ニュー・イングランド・バイオ・ラボ、#B0712L)によって、140μlの反応容量で、50℃で1時間消化し、その後、80℃で20分間、酵素を熱失活させた。2%(w/v)アガロースゲル上で電気泳動を行い、結合剤プールに対応するバンドを切り出し、抽出した(キット:#740609.250、マッハライ-ナーゲル)。消化されたPCRフラグメントをカナマイシン耐性マーカー(Geertsma et al., Biochemistry, 2011 Apr 19;50(15):3272-8)を用いてFXクローニング初期ベクターにクローニングし、3,500cfuを、50μg/mlのカナマイシンを含む2mlのLB培地に再懸濁し、懸濁液を50μg/mlのカナマイシンを含むLB培地の200mlの培養液に移した。この培養物を37℃で一晩増殖させ、DNA調製のために使用した(キット:#740412.10、マッハライ-ナーゲル)。調製したファージミド15μgを、緩衝液NEB3.1(ニュー・イングランド・バイオ・ラボ、#B7203S)中の100単位のBspQI(ニュー・イングランド・バイオ・ラボ、#B0712L)で、50℃で1時間、140μlの反応容量で消化し、その後、80℃で20分間、酵素を熱失活させた。2%(w/v)アガロースゲル上で電気泳動を行い、そして結合剤プールに対応するバンドを切り出し、抽出した(キット:#740609.250、マッハライ-ナーゲル)。
フライコードのシボディ/ナノボディプールへの付加およびフライコード-多様性制限
フライコードライブラリーを含むベクターpNLxを、ファージミドについて上述したようにBspQ1により消化し、そして1%(w/v)アガロースゲル上での電気泳動を行った。開かれたベクターに対応するバンドを切り出しそして抽出した(キット:#740609.250、MACHERY-NAGEL)。200ngの結合剤プールを、T4リガーゼ緩衝液(Fermentas#B69)中の2.5単位のT4リガーゼ(Fermentas#EL0011)を用いて、28μlの反応容量で37℃で1時間、400ngの消化pNLxに連結し、65℃で10分間、加熱不活化した。25μlの連結反応物を150μlのエレクトロコンピテントE.coli MC1061細胞(Howard and Kaser 2007、抗体の作成および使用、170ページに従って調製)への形質転換に使用した。細胞をSOC培地中、37℃で30分間回収し、25μg/mlのクロラムフェニコールを含有する200mlの培養物に、希釈サンプルの25μg/mlのクロラムフェニコールを含む寒天プレート上へのプレーティングにより決定される、所望の数のコロニー形成単位に相当する回収された容量の細菌を接種した(上記の例では13,000~30,000の範囲のcfu数)。培養物を37℃で一晩増殖させた後、DNAの調製(キット:#740412.10、MACHEREY-NAGEL)および1mlの50%(v/v)グリセロールと混合した1mlの固定相培養物を含むグリセロールストックを生成した。
ディープシークエンシング
1.イルミナアダプター配列の結合
フライコード結合剤を含む15μgのpNLxを、緩衝液G(Fermentas#BG5)中の120単位のSfiI(Fermentas#ER1821)により、140μlの反応容量中、50℃で3時間消化し、続いて酵素を不活化するために0.5M EDTAを12μl加えた。2%アガロースゲル上での電気泳動を行い、フライコードに結合した結合剤プールに対応するバンドを切り出し、抽出した(キット:#740609.250、MACHERY-NAGEL)。抗MBPシボディを用いた最初の例として、適切なインデックス(この場合、502および703が二重インデックス作成のために使用された)を有するイルミナMiSeqによるDNAディープシークエンシングに関連するアダプターを含むベクターpNLsは、pNLxについて上述したように、Sfilにより消化され、(この場合、502および703をデュアルインデックスに使用した)、1%アガロースゲル上で電気泳動を行った。ベクター骨格に対応するバンドを切り出し、抽出した(キット:#740609.250、MACHERY-NAGEL)。T4リガーゼ緩衝液(Fermentas#B69)中の2.5単位のT4リガーゼ(Fermentas#EL0011)を用いて400ngのフライコード化された結合剤プールを300ngの消化されたpNLxに、反応容量28μl、37℃で1時間連結し、65℃で10分間、加熱不活化した。25μlの連結反応物を250μlのエレクトロコンピテントE.coli MC1061細胞(Howard and Kaser 2007、抗体の作成および使用、170ページに従って調製)への形質転換に使用した。細胞をSOC培地中37℃で45分間回収し、30μg/mlのカナマイシンを含有する200mlの培養物に全ての回収された細胞を接種した。ライゲーションおよび形質転換効率がネスト化ライブラリー全体の移行に十分であることを確認するために、試験サンプルをカナマイシン選択寒天プレート上にプレーティングした(合計で>200,000cfu)。培養物を37℃で一晩増殖させた後、DNAを調製した(キット:#27106、QUIAGEN)。フライコード化された結合剤プールを含む調製されたpNLs1μgの制限消化を、CutSmart緩衝液(ニュー・イングランド・バイオ・ラボ、#B7204S)中の5単位のBseRI(ニュー・イングランド・バイオ・ラボ、#B0581S)を用いて、合計反応容量20μl、37℃で2時間行い、続いて80℃で20分間、加熱不活化した。この時点で(BseRI消化の前に)さまざまな標的に対する複数のフライコードプールをプールでき、それぞれ異なるインデックスのpNLsに配置された。続いて、MiSeqアダプターに結合したフライコード結合剤プールを含むインサートを1%アガロースゲルから抽出した。
上記の他の実施例では、付着性SfiI突出を含む300~400ngのアニーリングオリゴヌクレオチドを、反応容量20μl、37℃で1時間、T4リガーゼ緩衝液(Fermentas#B69)中の5単位のT4リガーゼ(Fermentas#EL0011)を用いてSfiIによりpNLxから切り出した600ngのフライコード結合剤プールと混合し、その後65℃で10分間、加熱不活化した。続いて、MiSeqアダプターに結合したフライコード結合剤プールを2%アガロースゲル(キット:#740609.250、MACHERY-NAGEL)から抽出した。この時点で、様々な標的に対するいくつかのフライコードプールをプールすることができ、それぞれが異なる対の連結アダプターを含むことに留意されたい。
2.ナノボディ-フライコード連鎖の決定
ディープシークエンシングは、ペアエンドプロトコル(MiSeq試薬キットv2(300サイクル))を用いて、イルミナ製のMiSeqデバイス上で行った。分析の最初の工程では、ペアエンド読み取りは、標準ソフトウェア(イルミナ)を用いてペアエンドリードをつなぎ合わせた。所定のインデックスペアについて、合計800,000-8Mioの読み取りが得られた。これは、25~70の平均読み取り冗長度に相当する(この数は、読み取りの合計数を、所定のネスト化ライブラリーの合計予測フライコード数で割ったものである)。カスタムメイドのスクリプトを用い、得られた生の読み取りを、以下の正の基準を適用することによってフィルタリングした:i)フライコードの不変部分の正しい隣接パターン、ii)ナノボディの不変部分の正しい隣接パターン、iii)配列がNを含まない、iv)配列が可能なナノボディ-フライコード融合の予想されるサイズ範囲内にある、v)ナノボディ-フライコード融合の配列がインフレームである(すなわち3で割ることができる)、vi)配列に終止コドンがない。フィルタリングの後、固有のフライコードのリストが生成された。少なくとも5回読み取られたフライコードは正しいと見なされた。各正しいフライコードについて、すべての連結ナノボディ配列のコンセンサス配列が生成された。ナノボディ配列中のシークエンシングエラーを修正するためにコンセンサス配列アプローチが必要とされた。同一のフライコードに結合したナノボディ配列間の変動性をモニターするためにコンセンサススコアを導入した。同一のフライコードに付着した1つまたはいくつかのナノボディが他のものと明らかに異なる場合、スコアは大きなペナルティを与え、それによってさらなる分析から2つ以上の異なるナノボディにリンクされたフライコードを除外する。高いコンセンサススコアを有するナノボディ-フライコード対のみをさらに検討した。最終工程において、同一の(コンセンサス)ナノボディ配列およびそのすべての連結されたフライコード(上記の例ではナノボディあたり平均12~40のフライコード)が同定された。同一のナノボディに接続された全てのフライコードは、ナノボディ配列を識別子として使用して仮想タンパク質配列に連結され、このデータベースはfasta-fileフォーマットで保存された。
単量体フライコード化シボディ/ナノボディの発現および精製
フライコード結合剤プールを有するpNLxを含有するE.coli MC1061グリセロールストックを、50mlの1%グルコースを含有するLB前培養物の接種に使用し、これを37℃で一晩培養した。600mlのTB培養物を、0.05のODまでの前培養によって接種し、そして37℃で1.5時間培養し、続いて20℃で一晩培養した。誘導は、0.8のOD600、0.05%(w/v)のアラビノースで行った。細胞を5,000gで20分間回転させることによって回収した。上清をデカントし、そして細胞を、少量のDNaseI(SIGMA#DN25)を追加した25mlの50mM Tris-HCl、pH7.5(20℃)、150mM NaCl、15mMイミダゾール pH8.0(20℃)中に再懸濁した。氷上で冷却しながら、マイクロフルイダイザー(Microfluidics#110P)を用いて30,000psiで2回細胞を溶解した。細胞片を5,000gで30分間ペレット化し、上清を1.5mlのNi-NTAスーパーフローカラム(QUIAGEN#1018142)に重力流によって適用した。カラムを20mM Tris-HCl pH7.5(20℃)、150mM NaClおよび30mM イミダゾール pH8(20℃)を含有する30mlの洗浄緩衝液で洗浄した。これを6mlの20mM Tris-HCl pH7.5(20℃)、150mM NaClおよび300mM イミダゾール pH8(20℃)で溶出した。5mlの溶出液をHiLoad 16/600 Superdex200pg(GEヘルスケアライフサイエンス(Healthcare Life Sciences)#28989335)に注入し、単量体画分に対応する領域を回収し、そして上記実施例において概説したように、さらなる選択実験のための緩衝液に対して、Nanodrop 2000c(サーモサイエンティフィック(Thermo Scientific))の吸光度(280nm)2.1で、1.2mlの容量まで濃縮した。
フライコードの単離
フライコード化PLOI含有サンプルを緩衝液Ex(20mM Tris-HCl pH8.5、150mM NaCl、0.5%(v/v)Triton X-100、0.125%(w/v)デオキシコール酸ナトリウム、10mMイミダゾール pH8.0、4.5M GdmCl)によって10~20倍希釈した、濾過し(シリンジフィルター0.2μmカットオフ)、100μlのNi-NTAスーパーフロースラリー(QUIAGEN#1018142)と共に室温で2時間インキュベートした。続いて樹脂を500gで10分間ペレット化し、ミニバイオスピンクロマトグラフィーカラムに移し、続いて緩衝液Exを用いて3×500μl洗浄し、30mM イミダゾール pH8.0を含む緩衝液TH(20mM TEAB pH8.0、150mM NaCl、2.5mM CaCl2)を用いて3×500μl、そして緩衝液TH3×500μlで洗浄した。カラムの下端を閉じた後、樹脂を2.4Uのトロンビンを含む緩衝液TH(MILLIPORE#69671-3)100μl中に再懸濁し、続いて室温で一晩インキュベートした。次にカラムを排水し、30mM イミダゾール pH8.0を含む3×500μlの緩衝液TH、続いて3×500μlの緩衝液TRY(20mM TEAB pH8.0、50mM NaCl、2.5mM CaCl2)で洗浄し、そして300mM イミダゾール pH8.0を含む緩衝液TRYで溶出した。溶出液を、予め平衡化した(H2O)Microcon 10kDaカットオフ濃縮器(AMICON:YM-10)を通して回転させ(15,000g)、1μgのトリプシン(PROMEGA#V5113)をろ過物に添加し、続いて37℃で一晩インキュベートした。
続いて、溶出したフライコードサンプルをZipTip(MILLIPORE#ZTC18S960)クリーンアップ手順に付した。ZipTipsを200μlのメタノール、200μlの60%(v/v)アセトニトリル(ACN)および200μlの0.1%(v/v)トリフルオロ酢酸を含む3%(v/v)アセトニトリルで予備洗浄した。100μlのフライコードサンプルをロードし、続いて200μlの0.1%(v/v)のトリフルオロ酢酸を含む3%(v/v)アセトニトリルで洗浄し、2×40μlの0.1%(v/v)のトリフルオロ酢酸を含む60%(v/v)アセトニトリルで溶出した。続いて溶媒を蒸発させ(speedvac)、フライコードを15μlの0.1%(v/v)ギ酸を含む3%(v/v)アセトニトリルに再懸濁した。
LC-MS
Easy-nLC 1000 HPLCシステムを用い、2μlの再懸濁フライコード溶液を、逆相材料を充填した自家製のキャピラリーカラム(ReproSil-Pur 120 C18-AQ、1.9μm;カラム寸法150 mm×0.075mm)に注入した。カラムを溶媒A(水中0.1%ギ酸(FA))で平衡化した。次の勾配:0-60分;5-20%B(ACN中0.1%FA)、60-70分:20-97%Bを使用して、ペプチドを流速0.3μl/分で溶出した。97%Bで10分間洗浄した後、カラムを溶媒Aで5分間再平衡化した。次のパラメータを用いてOrbitrap Fusion質量分析計(サーモサイエンティフィック)で高精度質量スペクトルを取得した。走査範囲300~1500m/z、AGCターゲット5e5、分解能120,000(m/z190)、および最大注入時間100ms。四重極型分離(1.6m/zウィンドウ)、1e4のAGCターゲット、35msの最大注入時間、30%の衝突エネルギーでのHCDフラグメンテーション、3秒の最大サイクルタイムを用いて、データ依存型MS/MSスペクトルを線形イオントラップの最高速度モードで記録し、利用可能なすべての並列化可能時間が有効であった。単同位体前駆体シグナルは、2から6の間の荷電状態および5e4の最小シグナル強度を有するMS/MSについて選択された。動的排除は25秒に設定され、排除ウィンドウは10ppmであった。データ収集後、Proteome Discoverer 1.4(サーモサイエンティフィック)を用いてピークリストを作成した。
データ分析および定量化
LC-MS分析(フライコード抽出物/サンプルにつき1分析)をソフトウェアXcaliburにより事前検査し、Xcaliburの生ファイルをインポートし、Progenesisによりmznldファイルに変換した。続いてProgenesisを用いて目的のLC-MSランを整列させ(整列スコア>80%)、分析から+1および+ 5から+20の電荷のペプチドイオンを除去した。続いて、すべての整列されたLC-MSランの複合mgfファイルをProgenesisからエクスポートし(ランク閾値<5、イオンフラグメント数>1,000、脱同位体化および電荷デコンボリューション)、そしてPLOIメンバー割り当てに対する事前に決定されたフライコードと共にマスコットサーバにアップロードした(fastaファイルフォーマットのディープシークエンシングデータベース、上記参照)。Mascotの識別情報はソフトウェアScaffoldに直接インポートされ、続いてデータ変換とスペクトルレポートのエクスポートが行われ、その後、Progenesisにインポートされて、対応するフライコードに特徴を割り当てることができる。Progenesisを用い、特徴強度は通常スパイク標準に正規化され、各PLOIメンバーのすべての固有のフライコードが定量化に使用された。生強度および正規化強度を続いてエクスポートし(CSV形式)、さらにExcelで分析した。

Claims (13)

  1. ポリペプチドのライブラリーからポリペプチドを選択するための方法であって、
    a.第1の核酸ライブラリーを提供する工程であって、前記第1の核酸ライブラリーの各メンバーが、第1のポリペプチドライブラリーのメンバーをコードするポリペプチド-エンコーディング配列を含む工程;
    b.第2の核酸ライブラリーを提供する工程であって、前記第2の核酸ライブラリーが複数のメンバーを含み、各メンバーが、検出タグをコードするタグ-エンコーディング配列を含み、前記検出タグが、
    b-i)前記第2の核酸ライブラリーによりコードされたいずれの他の検出タグのアミノ酸配列とも相違するアミノ酸配列によって特徴付けられる;
    b-ii)500から2500Daの間の分子量によって特徴づけられる;
    b-iii)プロテアーゼ認識配列である第1の分離可能なエレメント(配列エレメントIII)と、A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10アミノ酸からなる配列エレメントIとを含み、前記配列エレメントのN-末端からの順番が、配列エレメントIII、配列エレメントIである;かつ
    b-iv)C-末端に正に荷電した側鎖を有するアミノ酸をただ1つ含み、該正に荷電した側鎖を有するアミノ酸がリジンまたはアルギニンである
    工程;
    c.前記第1の核酸ライブラリーの前記メンバーに含まれる前記ポリペプチド-エンコーディング配列を、前記第2の核酸ライブラリーのメンバーに挿入し、それにより、タグが付されたポリペプチドライブラリーをコードするタグが付された核酸ライブラリーを作製する工程であって、前記タグが付されたポリペプチドライブラリーの各メンバーが、ポリペプチドおよび前記ポリペプチドから前記第1の分離可能なエレメントにより分離される検出タグを含む工程;
    d.前記タグが付された核酸ライブラリーから複数の核酸配列を得る工程であって、前記複数の核酸配列の各々が、ポリペプチド-エンコーディング配列およびタグ-エンコーディング配列を含む工程;
    e.工程dにおいて得られたタグ-エンコーディング配列によりコードされた各検出タグについて質量分析フラグメンテーションパターンを予測する工程;
    f.前記タグが付された核酸ライブラリーから前記タグが付されたポリペプチドライブラリーを発現する工程;
    g.選択工程において前記タグが付されたポリペプチドライブラリーのメンバーを選択し、選択されたポリペプチドを得る工程;
    h.前記第1の分離可能なエレメントを切断し、それにより前記検出タグを前記選択されたポリペプチドから分離し、単離された検出タグを得る工程;
    i.前記単離された検出タグを、
    i-i)質量分析により前記単離された検出タグのフラグメンテーションパターンを記録すること;
    i-ii)工程i-i)で得られた前記フラグメンテーションパターンを、工程eにおいて予測された前記フラグメンテーションパターンと組み合わせること
    により前記単離された検出タグを同定する工程;
    j.工程dにおいて得られた前記複数の核酸配列から、工程iにおいて同定された前記検出タグをコードするタグ-エンコーディング配列を含む核酸配列を選択し、それにより工程iにおいて同定された前記検出タグと結合した前記タグが付されたポリペプチドライブラリーのメンバーを同定する工程
    を含む方法。
  2. 前記単離された検出タグが、-27から128の間の疎水性値により特徴付けられる請求項1記載の方法。
  3. 前記配列エレメントIが、A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される7アミノ酸からなる請求項1または2記載の方法。
  4. 前記単離された検出タグが、
    a.GSである配列エレメントIII;
    b.前記配列エレメントI;および
    c.配列番号1(WR)、配列番号2(WLR)、配列番号3(WQSR)、配列番号4(WLTVR)および配列番号5(WQEGGR)から選択される配列エレメントII
    を含み、
    前記配列エレメントのN-末端からC-末端への順番が、配列エレメントIII、配列エレメントI、配列エレメントIIである請求項1~3のいずれか1項に記載の方法。
  5. ポリペプチドの収集物であって、前記ポリペプチドの収集物の各メンバーは、検出タグと会合されており、前記検出タグが、
    a.前記ポリペプチドの収集物のいずれの他の各メンバーの検出タグのアミノ酸配列とも異なるアミノ酸配列により特徴づけられる;
    b.500から2500Daの間の分子量により特徴づけられる;
    c.第1の分離可能なエレメントにより前記ポリペプチドの収集物の前記メンバーから分離される、
    そして、前記検出タグが、該第1の分離可能なエレメントとしてのプロテアーゼ認識配列(配列エレメントIII)と、A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10アミノ酸からなる配列エレメントIとを含み;前記配列エレメントのN-末端からの順番が、配列エレメントIII、配列エレメントIであり;かつ前記検出タグがC-末端に正に荷電した側鎖を有するアミノ酸をただ1つ含み、該正に荷電した側鎖を有するアミノ酸がリジンまたはアルギニンである
    ポリペプチドの収集物。
  6. 前記ポリペプチドの収集物の前記各メンバーから単離された検出タグが、-27から128の間の疎水性値により特徴づけられる請求項5記載のポリペプチドの収集物。
  7. 前記配列エレメントIが7アミノ酸からなり;さらに配列番号1(WR)、配列番号2(WLR)、配列番号3(WQSR)、配列番号4(WLTVR)および配列番号5(WQEGGR)から選択される配列エレメントIIを含む請求項5または6記載のポリペプチドの収集物。
  8. 少なくとも96の検出タグを含む検出タグの収集物であって、各検出タグは、
    a.前記検出タグの収集物に含まれるいずれの他の検出タグのアミノ酸配列とも異なるアミノ酸配列により特徴づけられる;
    b.前記検出タグのC-末端に位置する正に荷電した側鎖を有するアミノ酸をただ1つ含み、該正に荷電した側鎖を有するアミノ酸がリジンおよびアルギニンから選択される;
    c.500から2500Daの間の分子量により特徴づけられる;
    そして、前記検出タグが、第1の分離可能なエレメントとしてのプロテアーゼ認識配列(配列エレメントIII)と、A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10アミノ酸からなる配列エレメントIとを含み;前記配列エレメントのN-末端からの順番が、配列エレメントIII、配列エレメントIである
    検出タグの収集物。
  9. 少なくとも96のプラスミドベクターを含むプラスミドベクターの収集物であって、前記プラスミドベクターの収集物の各メンバーは、検出タグをコードするタグ-エンコーディング核酸配列を含み、各検出タグは、
    a.前記プラスミドベクターの収集物によりコードされたいずれの他の検出タグのアミノ酸配列とも異なるアミノ酸配列によって特徴づけられる;
    b.前記検出タグのC-末端に位置する正に荷電した側鎖を有するアミノ酸をただ1つ含み、該正に荷電した側鎖を有するアミノ酸がリジンおよびアルギニンから選択される;
    c.500から2500Daの間の分子量により特徴づけられる;
    そして、前記検出タグが、第1の分離可能なエレメントとしてのプロテアーゼ認識配列(配列エレメントIII)と、A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10アミノ酸からなる配列エレメントIとを含み;前記配列エレメントのN-末端からC-末端への順番が、配列エレメントIII、配列エレメントIである、
    プラスミドベクターの収集物。
  10. 前記検出タグが、
    a.7アミノ酸からなる配列エレメントI;および
    b.配列番号1(WR)、配列番号2(WLR)、配列番号3(WQSR)、配列番号4(WLTVR)および配列番号5(WQEGGR)から選択される配列エレメントII
    からなる請求項9記載のプラスミドベクターの収集物。
  11. a.ポリペプチドライブラリーをコードする核酸ライブラリーを提供する工程であって、
    前記ポリペプチドライブラリーが複数のメンバーを含み、各メンバーが検出タグと会合し、前記検出タグが、
    a-i)前記核酸ライブラリーによりコードされたいずれの他の検出タグのアミノ酸配列とも異なるアミノ酸配列により特徴づけられる;
    a-ii)500から2500Daの間の分子量により特徴づけられる;
    a-iii)第1の分離可能なエレメントにより前記ポリペプチドライブラリーの前記メンバーから分離される;該第1の分離可能なエレメントとしてのプロテアーゼ認識配列(配列エレメントIII)と、A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10アミノ酸からなる配列エレメントIとを含み、前記配列エレメントのN-末端からの順番が、配列エレメントIII、配列エレメントIである;かつ
    a-iv)C-末端に正に荷電した側鎖を有するアミノ酸をただ1つ含み、該正に荷電した側鎖を有するアミノ酸がリジンまたはアルギニンである
    工程;
    b.
    b-i)複数の核酸および/またはアミノ酸配列であって、前記複数の核酸および/またはアミノ酸配列が前記核酸ライブラリーおよび/または前記ポリペプチドライブラリーの全てのメンバーの配列を含み、前記配列の各々はポリペプチドを特定する配列および検出タグを特定する配列を含む複数の核酸および/またはアミノ酸配列;
    b-ii)前記核酸ライブラリーによりコードされた各検出タグに対する予想された質量分析フラグメンテーションパターン
    を含むデータベースを提供する工程;
    c.前記核酸ライブラリーから前記ポリペプチドライブラリーを発現する工程;
    d.選択工程において前記ポリペプチドライブラリーのメンバーを選択し、選択されたポリペプチドを得る工程、
    e.前記第1の分離可能なエレメントを切断し、それにより前記検出タグを前記選択されたポリペプチドから分離し、単離された検出タグを得る工程;
    f.前記単離された検出タグを
    f-i)質量分析法により前記単離された検出タグのフラグメンテーションパターンを記録する工程;
    f-ii)工程f-i)で得られた前記フラグメンテーションパターンを前記データベースにおいて予想された前記フラグメンテーションパターンと組み合わせ、それにより前記単離された検出タグを同定する工程
    により同定する工程;
    g.前記データベースに含まれる前記複数の核酸および/またはアミノ酸配列から、工程fで同定された前記検出タグを特定する配列を選択し、それにより、工程fで同定された前記検出タグと会合する前記ポリペプチドライブラリーのメンバーを同定する工程
    を含むタンパク質検出方法。
  12. 前記ポリペプチドライブラリーの各メンバーまたは各検出タグが、アフィニティタグと会合され、および/または、前記アフィニティタグが、前記検出タグから第2の分離可能なエレメントにより分離され、前記第2の分離可能なエレメントが、工程fより前に分離される請求項11記載の方法。
  13. ポリペプチドを固有の検出タグと会合する方法であって、
    a.第1の核酸ライブラリーを提供する工程であって、前記第1の核酸ライブラリーの各メンバーが、第1のポリペプチドライブラリーのメンバーをコードするポリペプチド-エンコーディング配列を含む工程、
    b.第2の核酸ライブラリーを提供する工程であって、前記第2の核酸ライブラリーの各メンバーが検出タグをコードするタグ-エンコーディング配列を含み、前記検出タグが:
    b-i)前記第2の核酸ライブラリーによりコードされたいずれの他の検出タグのアミノ酸配列とも異なるアミノ酸配列により特徴づけられる;
    b-ii)500から2500Daの間の分子量により特徴づけられる;
    b-iii)プロテアーゼ認識配列である第1の分離可能なエレメント(配列エレメントIII)と、A、S、T、N、Q、D、E、V、L、I、F、Y、W、GおよびPから各々独立して選択される5~10アミノ酸からなる配列エレメントIとを含み、前記配列エレメントのN-末端からの順番が、配列エレメントIII、配列エレメントIである;かつ
    b-iv)C-末端に正に荷電した側鎖を有するアミノ酸をただ1つ含み、該正に荷電した側鎖を有するアミノ酸がリジンまたはアルギニンである
    工程、
    c.前記第1の核酸ライブラリーの前記メンバーに含まれる前記ポリペプチド-エンコーディング配列を、前記第2の核酸ライブラリーのメンバーに挿入する工程であって、
    c-i)前記第1の核酸ライブラリーが5~100,000のサイズを有し、かつ
    c-ii)前記第2の核酸ライブラリーが103~1011のサイズを有し、
    それにより複数のポリペプチド/タグ組み合わせプラスミドを生成する工程;
    d.前記複数のポリペプチド/タグ組み合わせプラスミドのサブセットを選択し、それにより、タグが付されたポリペプチドライブラリーをコードするタグが付された核酸ライブラリーを生成する工程
    を含む方法。
JP2019522559A 2016-10-31 2017-10-30 タンパク質のスクリーニングおよび検出方法 Active JP7185929B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP16196571.0 2016-10-31
EP16196571 2016-10-31
PCT/EP2017/077816 WO2018078167A1 (en) 2016-10-31 2017-10-30 Protein screening and detection method

Publications (3)

Publication Number Publication Date
JP2020502493A JP2020502493A (ja) 2020-01-23
JP2020502493A5 JP2020502493A5 (ja) 2020-08-20
JP7185929B2 true JP7185929B2 (ja) 2022-12-08

Family

ID=57280982

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019522559A Active JP7185929B2 (ja) 2016-10-31 2017-10-30 タンパク質のスクリーニングおよび検出方法

Country Status (16)

Country Link
US (2) US12054708B2 (ja)
EP (2) EP4123022A1 (ja)
JP (1) JP7185929B2 (ja)
KR (1) KR102264642B1 (ja)
CN (1) CN110225973B (ja)
AU (1) AU2017351810B2 (ja)
CA (1) CA3041406A1 (ja)
DK (1) DK3532612T3 (ja)
EA (1) EA201991019A1 (ja)
ES (1) ES2926548T3 (ja)
HU (1) HUE059755T2 (ja)
IL (1) IL266270B1 (ja)
PL (1) PL3532612T3 (ja)
PT (1) PT3532612T (ja)
SG (1) SG11201903550TA (ja)
WO (1) WO2018078167A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012024289A2 (en) 2010-08-16 2012-02-23 Smith & Nephew Inc. Systems and methods for altering the surface of a bone
WO2024026026A1 (en) * 2022-07-27 2024-02-01 Trustees Of Tufts College High throughput in vivo screening of lipid nanoparticles

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003536048A (ja) 1999-03-23 2003-12-02 バイオヴェイション リミテッド タンパク質の単離および分析

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPN480095A0 (en) * 1995-08-15 1995-09-07 Commonwealth Scientific And Industrial Research Organisation Epitope tagging system
AUPP727398A0 (en) * 1998-11-20 1998-12-17 Commonwealth Scientific And Industrial Research Organisation Methods of identifying antigen gene sequences
US20090233806A1 (en) * 1999-07-06 2009-09-17 Carr Francis J Protein isolation and analysis
GB0217402D0 (en) 2002-07-26 2002-09-04 Roslin Inst Edinburgh Multi-reporter gene model for toxicological screening
JP2004329040A (ja) * 2003-05-01 2004-11-25 Daiichi Fine Chemical Co Ltd ポリセラーゼ−i及びその利用
JP2007502417A (ja) * 2003-08-11 2007-02-08 モノグラム バイオサイエンシズ,インコーポレーテッド 分子複合体の検出および特徴づけ
EP1647600A3 (en) * 2004-09-17 2006-06-28 Affymetrix, Inc. (A US Entity) Methods for identifying biological samples by addition of nucleic acid bar-code tags
US8148085B2 (en) * 2006-05-15 2012-04-03 Sea Lane Biotechnologies, Llc Donor specific antibody libraries
EP2522678A1 (en) * 2006-05-15 2012-11-14 Sea Lane Biotechnologies, LLC Neutralizing antibodies to influenza viruses
EP2436766A1 (en) * 2010-09-29 2012-04-04 Deutsches Krebsforschungszentrum Means and methods for improved protein interaction screening
US20160145604A1 (en) * 2013-03-14 2016-05-26 Adagene Inc. An Integrated System for Library Construction, Affinity Binder Screening and Expression Thereof
US11339434B2 (en) * 2016-07-29 2022-05-24 The Regents Of The University Of California Methods for determining gene functions
CN108802162B (zh) * 2016-11-25 2020-08-18 北京毅新博创生物科技有限公司 通过内部标准物质谱检测微生物的方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003536048A (ja) 1999-03-23 2003-12-02 バイオヴェイション リミテッド タンパク質の単離および分析

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Kimple, M. E. et al.,Overview of affinity tags for protein purification,Curr. Protoc. Protein Sci.,2013年,Vol. 73,Unit 9.9

Also Published As

Publication number Publication date
CN110225973B (zh) 2024-02-13
EP3532612A1 (en) 2019-09-04
PL3532612T3 (pl) 2022-10-31
DK3532612T3 (da) 2022-09-19
PT3532612T (pt) 2022-07-26
WO2018078167A1 (en) 2018-05-03
JP2020502493A (ja) 2020-01-23
US12054708B2 (en) 2024-08-06
KR102264642B1 (ko) 2021-06-15
IL266270A (en) 2019-06-30
KR20190104312A (ko) 2019-09-09
AU2017351810B2 (en) 2023-07-20
IL266270B1 (en) 2024-09-01
SG11201903550TA (en) 2019-05-30
AU2017351810A1 (en) 2019-05-16
CN110225973A (zh) 2019-09-10
EP3532612B1 (en) 2022-06-29
US20240327825A1 (en) 2024-10-03
ES2926548T3 (es) 2022-10-26
HUE059755T2 (hu) 2022-12-28
EA201991019A1 (ru) 2020-01-22
US20190276819A1 (en) 2019-09-12
EP4123022A1 (en) 2023-01-25
CA3041406A1 (en) 2018-05-03

Similar Documents

Publication Publication Date Title
US11390653B2 (en) Amino acid-specific binder and selectively identifying an amino acid
CA2583009C (en) Ubiquitin or gamma-crystalline conjugates for use in therapy, diagnosis and chromatography
US20240327825A1 (en) Protein screening and detection method
AU773236B2 (en) Selection of proteins using RNA-protein fusions
US5874239A (en) Biotinylation of proteins
JP2021501576A (ja) 核酸エンコーディングおよび/または標識を使用する方法およびキット
CZ20013399A3 (cs) Způsob izolace proteinů a analýzy proteinů, zejména hmotnostní analýzou
JP2009509535A (ja) タンパク様薬剤およびその使用
JPH0776596A (ja) ペプチド、融合ペプチド、発現ベクター及び組換えタンパク質の製造方法
US20170044608A1 (en) Methods of selecting antibodies and antibody fragments
Eichmann et al. Selection of high producers from combinatorial libraries for the production of recombinant proteins in Escherichia coli and Vibrio natriegens
CN104059891A (zh) 8-羟基喹啉丙氨酸翻译系统及其应用
JP2020502493A5 (ja)
AU2023202668A1 (en) Display of molecules on silently genetically encoded nanoscale carriers for determining synergistic molecular interactions
JP6516382B2 (ja) アゾリン化合物及びアゾール化合物のライブラリー、並びにその製造方法
JPWO2020080490A1 (ja) ペプチドライブラリーの製造方法
EA044916B1 (ru) Способ скрининга и детекции белка
Egloff et al. Engineered Peptide Barcodes for In-Depth Analyses of Binding Protein Ensembles
WO2020210455A1 (en) Engineered chymotrypsins and uses thereof

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20190624

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20190624

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200708

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210817

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20211116

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220621

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220809

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221118

R150 Certificate of patent or registration of utility model

Ref document number: 7185929

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150