JP2022526939A - 修飾された切断酵素、その使用、および関連キット - Google Patents

修飾された切断酵素、その使用、および関連キット Download PDF

Info

Publication number
JP2022526939A
JP2022526939A JP2021557332A JP2021557332A JP2022526939A JP 2022526939 A JP2022526939 A JP 2022526939A JP 2021557332 A JP2021557332 A JP 2021557332A JP 2021557332 A JP2021557332 A JP 2021557332A JP 2022526939 A JP2022526939 A JP 2022526939A
Authority
JP
Japan
Prior art keywords
modified
amino acid
identity
polypeptide
enzyme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021557332A
Other languages
English (en)
Other versions
JPWO2020198264A5 (ja
Inventor
ケビン デサイ,
ケビン エル. ガンダーソン,
ロバート シー. ジェイムズ,
レイ シー,
スティーブン ザ サード ベレスピー,
Original Assignee
エンコディア, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エンコディア, インコーポレイテッド filed Critical エンコディア, インコーポレイテッド
Publication of JP2022526939A publication Critical patent/JP2022526939A/ja
Publication of JPWO2020198264A5 publication Critical patent/JPWO2020198264A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/485Exopeptidases (3.4.11-3.4.19)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/14Dipeptidyl-peptidases and tripeptidyl-peptidases (3.4.14)
    • C12Y304/14004Dipeptidyl-peptidase III (3.4.14.4)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本明細書において提供されるのは、ペプチド、ポリペプチド、およびタンパク質からアミノ酸を除去するための修飾された切断酵素である。ポリペプチドを処理するために修飾された切断酵素を使用する方法、およびこの修飾された切断酵素を含むキットも提供される。いくつかの実施形態において、方法およびキットはまた、巨大分子配列決定および/または分析のための他の成分を含む。【選択図】図1A

Description

関連出願
本出願は、2019年3月26日に出願された米国仮特許出願第62/823,927号、2019年3月26日に出願された同第62/824,157号、および2019年11月6日に出願された同第62/931,737号に対する優先権を主張し、これらの開示および内容は、参照によりそれらの全体がすべての目的のために本明細書に組み込まれる。
連邦政府資金による研究の記載
本発明は、助成金番号1R43GM130185-01の下で米国国立衛生研究所の国立総合医科学研究所によって授与された政府支援を受けてなされた。米国政府は、この助成金に従って、本発明に関して一定の権利を有する。
ASCIIテキストでの配列表
本特許または出願ファイルには、コンピュータで読み取り可能なASCIIテキスト形式で提出された配列表(ファイル名:4614-2001340_20200323_SeqList_ST25.txt、記録日:2020年3月23日、サイズ:184,980バイト)が含まれる。配列表ファイルの内容は、その全体が参照により本明細書に組み込まれる。
本開示は、修飾されたペプチド、ポリペプチド、およびタンパク質を含む、ペプチド、ポリペプチド、およびタンパク質からアミノ酸を切断するための修飾された切断酵素に関する。ポリペプチドを処理するために修飾された切断酵素を使用する方法、および修飾された切断酵素を含むキットも提供される。いくつかの実施形態において、方法およびキットはまた、巨大分子配列決定および/または分析のための他の成分を含む。
ペプチドおよびタンパク質の分解に関与する酵素、例えば、アミノペプチダーゼ、ジペプチジルペプチダーゼ、カルボキシペプチダーゼ、エンドペプチダーゼなどは、ペプチド結合を加水分解する(Sanderink et al.,J.Clin.Chem.Clin.Biochem.(1988)26:795-807)。さまざまなペプチダーゼが、多くの生物において、およびさまざまな組織から、単離および発見されている。アミノペプチダーゼは、単量体および多量体酵素として天然に存在し、金属またはATP依存性である可能性がある。一部の基質特異性ペプチダーゼは、ペプチドのアミノ末端から一度に1つまたは2つのアミノ酸残基を特異的に除去するが、他のペプチダーゼは、タンパク質またはペプチドのカルボキシ末端から除去する。一般に、天然のアミノペプチダーゼは特異性が限られており、アミノ酸を段階的に(in a processive manner)脱離させ、次々とアミノ酸を脱離させる。
いくつかの実施形態において、ペプチド分解のための方法は、タンパク質分析および/または配列決定における用途に有用である。例えば、ペプチド配列決定は、一連の化学修飾および下流のHPLC分析または質量分析を通じてペプチド上のN末端アミノ酸(NTAA)の段階的分解を実現するためのエドマン分解を含み得る。しかしながら、一般に、エドマン分解によるペプチド配列決定は、制限される可能性があり、例えば、典型的なエドマン分解では、長いインキュベーション時間の間、高温かつ過酷な化学的条件(例えば、強酸、TFA無水物)を導入する必要がある。場合によっては、エドマン分解は、核酸(例えば、DNA)を使用する分析方法など、過酷な化学的条件に敏感なタンパク質分析方法のためのプロセスと適合しない可能性がある。
したがって、アミノ酸を分解するための改善された試薬に対する必要性が依然として存在する。例えば、ポリペプチドからアミノ酸を除去する、脱離させる、または切断するための酵素的方法が所望され得る。さらに、所望のアミノ酸に結合し、それらをポリペプチドから除去することができるさらなる基質特異的酵素の利用可能性もまた所望される。場合によっては、アミノ酸を除去するためのそのような改善された試薬は、タンパク質の配列決定および/または分析に有用である。本開示は、これらおよび他の関連する必要性を満たす。
本発明のこれらおよび他の態様は、以下の発明を実施するための形態を参照することで明らかになるであろう。この目的のために、特定の背景情報、手順、化合物、および/または組成物をより詳細に説明するさまざまな参考文献が本明細書に記載されており、各々、それらの全体が参照により本明細書に組み込まれる。
Sanderink et al.,J.Clin.Chem.Clin.Biochem.(1988)26:795-807
本発明の概要は、特許請求される主題の範囲を制限するために使用されることを意図しない。特許請求される主題の他の特徴、詳細、有用性、および利点は、添付の図面および添付の特許請求の範囲に開示された態様を含む、発明を実施するための形態から明らかになるであろう。
本明細書において提供されるのは、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、修飾された切断酵素であって、修飾された切断酵素が、ジペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を除去するか、または除去するように構成される、修飾された切断酵素である。本明細書において提供されるのは、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、修飾された切断酵素であって、修飾された切断酵素が、トリペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を、もしくはポリペプチドから単一の標識末端ジペプチドを除去するか、または除去するように構成される、修飾された切断酵素である。いくつかの実施形態において、修飾された切断酵素は、ポリペプチドのC末端またはN末端から単一の標識末端アミノ酸を除去するように構成される。いくつかの実施形態において、修飾された切断酵素は、ポリペプチドのC末端またはN末端から単一の標識ジペプチド(末端および最後から2番目の末端アミノ酸)を除去するように構成される。いくつかの実施形態において、修飾された切断酵素は、野生型または未修飾の切断酵素(例えば、ジペプチド切断酵素またはトリペプチド切断酵素)に由来する。例えば、未修飾の切断酵素は、EC3.4.14、EC3.4.15、MEROPS S8、MEROPS S9、MEROPS S33、MEROPS S46、MEROPS M49、もしくはMEROPS S53、またはその機能的相同体もしくは断片に分類されるタンパク質である。
本明細書において提供されるのは、ポリペプチドを処理する方法であって、ポリペプチドを、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む修飾された切断酵素と接触させることを含み、当該修飾された切断酵素が、ジペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を除去する、方法である。本明細書において提供されるのは、ポリペプチドを処理する方法であって、ポリペプチドを、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む修飾された切断酵素と接触させることを含み、当該修飾された切断酵素が、トリペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を、もしくはポリペプチドから単一の標識末端ジペプチドを除去する、方法である。いくつかの実施形態において、修飾された切断酵素は、修飾された切断酵素で処理されたポリペプチドのC末端またはN末端から単一の標識末端アミノ酸を除去する。いくつかの実施形態において、修飾された切断酵素は、修飾された切断酵素で処理されたポリペプチドのC末端またはN末端から単一の標識ジペプチド(末端および最後から2番目の末端アミノ酸)を除去する。いくつかの実施形態において、修飾された切断酵素は、野生型または未修飾の切断酵素(例えば、ジペプチド切断酵素またはトリペプチド切断酵素)に由来する。例えば、未修飾の切断酵素は、EC 3.4.14、EC 3.4.15、MEROPS S8、MEROPS S9、MEROPS S33、MEROPS S46、MEROPS M49、もしくはMEROPS S53、またはその機能的相同体もしくは断片に分類されるタンパク質である。いくつかの実施形態において、この方法は、ポリペプチドを、ポリペプチドの末端アミノ酸を標識するための試薬と接触させることをさらに含む。いくつかの実施形態において、この方法は、ポリペプチドを、ポリペプチドの末端アミノ酸に結合することができる結合剤と接触させることをさらに含み、結合剤は、結合剤に関する識別情報を有するコーディングタグを含む。いくつかの実施形態において、この方法はまた、コーディングタグの識別情報をポリペプチドに付着した記録タグに転送し、それによってポリペプチド上に伸長記録タグ(複数可)を生成することをさらに含む。場合によっては、この方法は、結合剤を除去することをさらに含む。いくつかのさらなる実施形態において、この方法は、1つ以上の伸長記録タグを分析することをさらに含む。いくつかのさらなる実施形態において、この方法は、上記ステップのいくつかまたはすべてを1回以上繰り返すことをさらに含む。
また、本明細書において提供されるのは、ポリペプチドを分析するための方法であって、(a)ポリペプチドを、ポリペプチドの末端アミノ酸に結合することができる結合剤と接触させるステップであって、結合剤が、結合剤に関する識別情報を有するコーディングタグを含む、ステップと、(b)コーディングタグの識別情報をポリペプチドと関連付けられた記録タグに転送して、伸長記録タグを生成するステップと、(c)ポリペプチドを試薬と接触させて、ポリペプチドの末端アミノ酸を標識するステップと、(d)ポリペプチドを、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む修飾された切断酵素と接触させるステップと、を含み、修飾された切断酵素が、ジペプチド切断酵素に由来し、ステップ(c)において試薬によって標識された単一の末端アミノ酸をポリペプチドから除去するか、または除去するように構成されるか、あるいは、修飾された切断酵素が、トリペプチド切断酵素に由来し、ステップ(c)において試薬によって標識された単一の末端アミノ酸または単一の末端ジペプチドをポリペプチドから除去するか、または除去するように構成される、方法である。
本明細書において提供されるのは、ポリペプチドを処理するためのキットであって、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む修飾された切断酵素と、ポリペプチドの末端アミノ酸を標識するための試薬と、を含む、キットである。いくつかの態様において、修飾された切断酵素は、ジペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を除去するか、もしくまたは除去するように構成されるか、あるいは、修飾された切断酵素は、トリペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を、もしくはポリペプチドから単一の標識末端ジペプチドを除去するか、または除去するように構成される。いくつかの実施形態において、キットは、1つ以上の結合剤をさらに含み、各結合剤は、結合剤に関する識別情報を有するコーディングタグを含む。いくつかの実施形態において、キットは、コーディングタグの識別情報をポリペプチドに付着した記録タグに転送するための試薬をさらに含み、識別情報の記録タグへの転送により、ポリペプチド上に伸長記録タグが生成される。いくつかの実施形態において、キットは、伸長記録タグを増幅するための1つ以上の増幅試薬をさらに含む。いくつかの実施形態において、キットは、1つ以上の基質または支持体をさらに含む。いくつかの実施形態において、キットはまた、核酸配列決定分析のための試薬を含む。
添付の図面を参照して、本発明の非限定的な実施形態を例として説明する。図面は模式的であり、正確な縮尺は意図されない。例示目的上、すべての構成要素がすべての図面において標識されるとは限らず、また、当業者が本発明を理解することを可能にするために例示が必要とされない場合は、本発明の各実施形態のすべての構成要素が示されるとも限らない。
本明細書において提供される例示的な修飾された切断酵素による単一の修飾アミノ酸の除去を示す概略図である。図1Aの左側では、ジペプチド切断酵素に由来する例示的な未修飾の切断酵素が、ポリペプチドのN末端から2つのアミノ酸を除去し、最後から2番目のアミノ酸(P2)残基と最後から3番目のアミノ酸(P3)残基との間の結合を切断する。右側では、ジペプチド切断酵素に由来する例示的な修飾された切断酵素が、ポリペプチドのN末端から単一の標識アミノ酸を除去し、標識末端アミノ酸(P1;ひし形は標識を示す)と最後から2番目のアミノ酸残基(P2)との間の結合を切断する。図1Bの左側では、トリペプチド切断酵素に由来する例示的な未修飾の切断酵素が、ポリペプチドのN末端から3つのアミノ酸を除去し、C末端のN末端の最後から3番目のアミノ酸への(P3とP4との間)結合を切断する。図1Bの右側では、2つの例示的な修飾された切断酵素は、トリペプチド切断酵素に由来する。上部では、修飾されたトリペプチド切断酵素が、ポリペプチドのN末端から単一の標識アミノ酸を除去し、標識末端アミノ酸(P1;ひし形は標識を示す)と最後から2番目のアミノ酸残基(P2)との間の結合を切断する。下部では、修飾されたトリペプチド切断酵素が、ポリペプチドのN末端から標識ジペプチド(P1-P2)を除去し、最後から2番目の末端アミノ酸残基(P2)と最後から3番目のアミノ酸残基(P3)との間の結合を切断する。 同上。 修飾された切断酵素および末端アミノ酸標識を使用する末端アミノ酸除去のサイクルを描いた概略図である。図2A~2Bでは、標識N末端アミノ酸残基を有するポリペプチドが、修飾された切断酵素によって末端アミノ酸と最後から2番目のアミノ酸との間の結合で切断され、標識末端アミノ酸が放出される。図2Cでは、新たな末端アミノ酸が標識され、修飾された切断酵素は、さらなる切断および放出のために、新たな標識末端アミノ酸を認識することができる。 N末端アミノ酸を標識するための異なる例示的な試薬を用いるN末端アミノ酸(NTAA)変換効率を示す。2つの異なるペプチドを溶液中で試験した:N末端G(NT-G)=GRFSGIY(配列番号40);N末端W(NT-W)=WTQIFGA(配列番号41)。LC-MSを使用して変換効率を定量化した。 60%の配列類似性または同一性を有するDAP BII相同体の配列保存のWebLogo分析からの結果を示す。各スタックの高さは、その位置での配列保存を示し(ビット単位で測定)、スタック内の記号の高さは、示された位置での対応するアミノ酸の相対頻度を反映する(配列番号20を参照)。 同上。 同上。 同上。 同上。 同上。
本明細書において提供されるのは、突然変異(例えば、未修飾の切断酵素における1つ以上の修飾)を含む修飾された切断酵素、および修飾された切断酵素を選択、操作、および使用する関連方法である。本明細書において提供されるのは、ポリペプチドを(例えば化学試薬で)標識し、標識されたポリペプチドを修飾された切断酵素で処理して、標識末端アミノ酸をポリペプチドから除去するための方法である。修飾された切断酵素を含むキットも提供される。いくつかの実施形態において、修飾された切断酵素を含むキットは、配列決定および/または分析などのために、ペプチド、ポリペプチドおよびタンパク質を処理するために使用される。いくつかの実施形態において、修飾された切断酵素を使用するタンパク質分析は、分子認識事象のバーコーディングおよび核酸コーディング、ならびに/または検出可能な標識を使用する。いくつかの実施形態において、キットはまた、タグ(例えば、DNAタグまたはDNA記録タグ)、固体支持体、ならびにポリペプチドを調製するための他の試薬およびポリペプチド分析のための他の試薬を含む、ポリペプチドを処理するための他の成分を含む。
ペプチド結合を加水分解することによってペプチドおよびタンパク質を分解するさまざまな酵素(例えば、アミノペプチダーゼ、ジペプチジルペプチダーゼ、カルボキシペプチダーゼ、エンドペプチダーゼ)が、多くの生物において、さまざまな組織から単離および発見されてきた。しかしながら、天然のアミノペプチダーゼは特異性が限られている可能性があり、一般的にはN末端アミノ酸を段階的に脱離させ、次々とアミノ酸を脱離させる。一部の基質特異的ペプチダーゼは、ペプチドのアミノ末端またはカルボキシ末端から一度に1つまたは2つのアミノ酸残基を特異的に除去する。
いくつかの実施形態において、ペプチド分解のための方法は、タンパク質分析および/または配列決定における用途に有用である。例えば、ペプチド配列決定は、一連の化学修飾および下流のHPLC分析または質量分析を通じてペプチド上のN末端アミノ酸の段階的分解を実現するためのエドマン分解を含み得る。しかしながら、一般に、エドマン分解によるペプチド配列決定は、制限される可能性があり、例えば、典型的なエドマン分解では、長いインキュベーション時間の間、高温かつ過酷な化学的条件(例えば、強酸、TFA無水物)を導入する必要がある。場合によっては、エドマン分解は、核酸(例えば、DNAなど)を使用する分析方法など、過酷な化学的条件に敏感なタンパク質分析方法のためのプロセスと適合しない可能性がある。
したがって、ポリペプチドからアミノ酸を分解するための改良型試薬および技術に対する必要性が残っている。例えば、ポリペプチドからアミノ酸を除去する、脱離させる、または切断するための酵素的方法が所望され得る。本明細書において提供されるのは、そのような必要性を満たす修飾されたペプチダーゼである。いくつかの実施形態において、本明細書において提供されるのは、ポリペプチドからアミノ酸を除去するための酵素的方法および試薬である。場合によっては、提供される修飾された酵素(例えば、切断酵素)によるアミノ酸の除去を使用して、ポリペプチドからアミノ酸を段階的に分解する。いくつかの実施形態において、提供される修飾された切断酵素によるアミノ酸の除去は、ポリペプチドからアミノ酸を周期的に除去するのに好適である。いくつかの実施形態において、修飾された切断酵素は、ポリペプチドから単一の標識末端アミノ酸を除去するか、または除去するように構成される。いくつかの実施形態において、修飾された切断酵素は、ポリペプチドのC末端またはN末端から単一の標識末端アミノ酸を除去する。例えば、修飾された切断酵素は、ポリペプチドの末端標識アミノ酸残基と最後から2番目の末端アミノ酸残基との間のペプチド結合を切断するように構成される。いくつかの実施形態において、修飾された切断酵素は、ポリペプチドのC末端またはN末端から単一の標識ジペプチド(末端および最後から2番目の末端アミノ酸)を除去するように構成される。いくつかの実施形態において、修飾された切断酵素は、野生型または未修飾の切断酵素(例えば、ジペプチド切断酵素またはトリペプチド切断酵素)に由来する。例えば、未修飾の切断酵素は、EC3.4.14、EC3.4.15、MEROPS S8、MEROPS S9、MEROPS S33、MEROPS S46、MEROPS M49、もしくはMEROPS S53、またはその機能的相同体もしくは断片に分類されるタンパク質である。例えば、修飾された切断酵素は、野生型または未修飾の切断酵素(例えば、ジペプチジルペプチダーゼ、ジペプチジルアミノペプチダーゼ、ペプチジル-ジペプチダーゼ、またはジペプチジルカルボキシペプチダーゼ)に由来する。
いくつかの実施形態において、ペプチダーゼは、標識で修飾された場合にのみ、特定の末端アミノ酸への特異的結合または触媒活性を有するように操作され得る。例えば、切断酵素は、野生型または未修飾の切断酵素と比較して、化学標識によって標識される場合にのみ末端アミノ酸を除去するように、操作または修飾され得る。この例示的なアプローチを使用して、修飾された切断酵素は、ポリペプチドの末端から標識されたアミノ酸(複数可)のみを脱離させ、所望の方式で分解の制御を可能にする。いくつかの実施形態において、修飾された切断酵素は、ポリペプチドのC末端またはN末端から単一の標識末端アミノ酸を除去するように構成される。いくつかの実施形態において、修飾された切断酵素は、ポリペプチドのC末端またはN末端から単一の標識末端ジペプチド(末端および最後から2番目の末端アミノ酸)を除去するように構成される。いくつかの実施形態において、修飾された切断酵素は、標識に対して選択的である一方で、アミノ酸残基の同一性に関して非選択的である(例えば、任意の標識末端アミノ酸を除去する)。いくつかの他の実施形態において、修飾された切断酵素は、特定のアミノ酸残基またはアミノ酸クラス(例えば、ポリペプチドのP1および/またはP2末端位置)に対していくらかの優先性を示す。場合によっては、特定のアミノ酸(またはアミノ酸クラス)に対して異なる優先性を有する2つ以上の修飾された切断酵素を組み合わせて使用してもよい。いくつかの実施形態において、修飾された切断酵素は、ポリペプチドのN末端に結合し、そこからアミノ酸を除去する。いくつかの実施形態において、修飾された切断酵素は、ポリペプチドのC末端に結合し、そこからアミノ酸を除去する。
いくつかの実施形態において、既知のペプチダーゼは、結合および/または切断のための特定の特徴を達成するように修飾され得る。酵素的N末端アミノ酸(NTAA)分解の特異性を改変するモデルの例としては、ロイシンアミノペプチダーゼに変換されたメチオニンアミノペプチダーゼが含まれる(Borgo et al.,Protein Sci.(2014)23(3):312-320)。別の例では、アミノペプチダーゼ突然変異体を、標識された(ビオチン化された)NTAAの個々のまたは小さなグループに結合し、それらを脱離させるように操作された(PCT公開第WO2010/065322号を参照)。本明細書において提供されるのは、ポリペプチド上の化学的に修飾された(例えば、PTC/DNP/アセチル/Cbz修飾された)末端アミノ酸などの標識末端アミノ酸を除去するように選択または修飾される、修飾された切断酵素である。いくつかの実施形態において、野生型の切断酵素は、標識として存在するPTC/DNP/アセチル/Cbz基を有するN末端アミノ酸のみを切断または除去するように、(例えば、構造機能に基づく設計および/または指向性進化を使用して)操作される。いくつかの例では、除去されるべき末端アミノ酸は、Cbz標識された末端アミノ酸である。いくつかの実施形態において、除去された標識末端アミノ酸は、単一のアミノ酸として、またはジペプチドの一部として除去される。
特定の実施形態において、コンパクトな単量体金属酵素アミノペプチダーゼは、イソチオ尿素またはCbz標識NTAAを認識して脱離させるように操作される。場合によっては、修飾されたペプチダーゼは、メタロペプチダーゼであり、活性化のために金属イオンを必要とする。いくつかの実施形態において、単量体メタロアミノペプチダーゼの使用は、2つの重要な利点を有する:1)コンパクトな単量体タンパク質は、ファージディスプレイを使用して提示およびスクリーニングすることがより容易である;2)メタロアミノペプチダーゼは、好適な金属カチオンを追加または除去することにより、その活性を自由にオン/オフすることができるという独自の利点を有する。未修飾の切断酵素は、任意の好適な生物に由来し得る。いくつかの例において、野生型または未修飾の切断酵素は、哺乳類(例えば、Homo sapiens)、真菌もしくは酵母(例えば、Saccharomyces cerevisiae)、または細菌(例えば、Bacteroides thetaiotaomicron、Porphyromonas gingivalis、Pseudomonas sp.、Pseudoxanthomonas mexicanaもしくはCaldithrix abyssi)に由来する。場合によっては、これらの酵素は安定しており、堅牢で、室温およびpH値8.0付近で活性があるため、ペプチド分析に好ましい穏やかな条件に適合する。いくつかの実施形態において、標識された修飾または末端アミノ酸(複数可)を高温で除去してペプチドの二次構造を最小化することができる好熱性切断酵素を有することが好ましい。
別の実施形態において、アミノ酸の周期的脱離または除去は、末端アミノ酸標識の存在下でのみ活性であるようにペプチダーゼ(例えば、切断酵素)を操作することによって達成される。いくつかの実施形態において、標識は、化学標識である。場合によっては、標識は、ブロックアミノ酸もしくは標識アミノ酸であるか、またはそれを含む。いくつかの実施形態において、標識は、外因性の標識または修飾アミノ酸を含む。さらに、ペプチダーゼは、1つの特定のアミノ酸を別のアミノ酸よりも選択的に認識するのではなく、標識を有する末端の任意のアミノ酸を認識するように、非特異的であるように操作され得る。いくつかの実施形態において、修飾された切断酵素は、1つ以上、2つ以上、3つ以上、4つ以上、5つ以上、10個以上、15個以上、20個以上などのアミノ酸に対して選択的である。
いくつかの実施形態において、提供される修飾された切断酵素は、サンプルから得られたポリペプチドを処理するために使用される。場合によっては、サンプルおよび/またはサンプルから得られたポリペプチドを、ポリペプチドを消化するなど、ポリペプチドを処理するための他の試薬で処理する。いくつかの実施形態において、ポリペプチドは、サンプルから得られた複数のポリペプチドを含む。いくつかの実施形態において、サンプルは、対象から得られる。
本開示の完全な理解を提供するために、以下の説明には多くの具体的な詳細が記載される。これらの詳細は、例示目的で提供されており、特許請求される主題は、これらの特定の詳細の一部または全部がなくても、特許請求の範囲に従って実施することができる。特許請求される主題の範囲から逸脱することなく、他の実施形態を使用することができ、構造変更を行うことができることを理解されたい。個々の実施形態のうちの1つ以上で説明されるさまざまな特徴および機能は、それらが説明される特定の実施形態へのそれらの適用可能性に関して限定されないことを理解されたい。代わりに、それらは、そのような実施形態が説明されるかどうか、およびそのような特徴が説明される実施形態の一部として提示されるかどうかにかかわらず、単独で、またはある組み合わせで、本開示の他の実施形態の1つ以上に適用することができる。明確にするために、特許請求される主題に関連する技術分野で既知の技術項目(technical material)は、特許請求される主題が不必要に不明瞭とならない程詳細には説明されない。
本出願で言及される特許文書、科学論文およびデータベースを含むすべての出版物は、個々の出版物が参照により個別に組み込まれるのと同じ程度まで、あらゆる目的のためにそれらの全体が参照により組み込まれる。出版物または文書の引用は、これらのいずれかが関連する先行技術であることを承認することを意図しておらず、これらの出版物または文書の内容または日付に関するいかなる承認を構成するものではない。
すべての見出しは、読者の利便性のために提供されるものであり、特に明記しない限り、見出しに続く本文の意味を限定するために使用されるべきでない。
定義
別段の定義がない限り、本明細書で使用されるすべての技術用語および科学用語は、本開示が属する技術分野の当業者により通常理解されるものと同じ意味を有する。本章に記載される定義が、参照により本明細書に組み込まれる特許、出願、公開出願、および他の出版物に記載される定義に反するか、さもなければそれと矛盾する場合、本章に記載される定義は、参照により本明細書に組み込まれる定義よりも優先される。
本明細書で使用される場合、単数形「a」、「an」および「the」は、文脈が明確に別のことを指示する場合を除き、複数の指示対象を包含する。したがって、例えば、「ペプチド(a peptide)」への言及は、1つ以上のペプチド、またはペプチドの混合物を包含する。また、本明細書で使用される場合、具体的に述べられているか、または文脈から明らかである場合を除き、「または(or)」という用語は、包括的であると理解され、「または(or)」および「および(and)」の両方を包含する。
本明細書で使用される場合、「約(about)」という用語は、当業者に容易に知られている各値の通常の誤差範囲を指す。本明細書における「約」値またはパラメータへの言及は、その値またはパラメータ自体を対象とする実施形態を包含(および説明)する。例えば、「約X」について言及する記載は、「X」についての記載を包含する。
本明細書における「抗体」という用語は、最も広い意味で使用され、完全抗体を含むポリクローナルおよびモノクローナル抗体、ならびに断片抗原結合(Fab)断片、F(ab’)断片、Fab’断片、Fv断片、組換えIgG(rIgG)断片、一本鎖可変断片(scFv)などの一本鎖抗体断片、および単一ドメイン抗体(例えば、sdAb、sdFv、ナノボディ)断片を含む機能的(抗原結合)抗体断片を含む。この用語は、イントラボディ、ペプチボディ、キメラ抗体、完全ヒト抗体、ヒト化抗体、およびヘテロ共役抗体、多重特異性(例えば、二重特異性)抗体、ダイアボディ、トライアボディ、ならびにテトラボディ、タンデムdi-scFv、タンデムtri-scFvなどの遺伝子操作されたおよび/または他の方法で修飾された形態の免疫グロブリンを包含する。特に明記しない限り、「抗体」という用語は、その機能的抗体断片を包含すると理解されるべきである。この用語はまた、IgGおよびそのサブクラスなどの任意のクラスまたはサブクラスの抗体、IgM、IgE、IgAおよびIgDを含む、インタクトまたは完全長の抗体を包含する。
「個体」または「被験体」には哺乳類が含まれる。哺乳類には、家畜類(例えば、ウシ、ヒツジ、ネコ、イヌおよびウマ)、霊長類(例えば、ヒトおよびサルなどの非ヒト霊長類)、ウサギおよびげっ歯類(例えば、マウスおよびラット)が挙げられるが、これらに限定されない。「個体」または「対象」には、ニワトリなどの鳥類、魚類および哺乳類(例えば、マウス、ラット、ウサギ、ネズミ、イヌ、ブタ、雌牛、雄牛、ヒツジ、ヤギ、ウマ、サルおよび他の非ヒト霊長類)などの脊椎動物が含まれる。特定の実施形態において、個体または被験体は、ヒトである。
本明細書で使用される場合、「サンプル」という用語は、分析物アッセイが望まれる分析物を含有し得るいかなるものをも指す。本明細書で使用される場合、「サンプル」は、溶液、懸濁液、液体、粉末、ペースト、水性、非水性、またはそれらの任意の組み合わせであり得る。サンプルは、生物学的流体または生物学的組織などの生物学的サンプルであり得る。生物学的流体の例としては、尿、血液、血漿、血清、唾液、精液、便、痰、脳脊髄液、涙液、粘液、羊水などが挙げられる。生物学的組織は、結合組織、上皮組織、筋肉組織、および神経組織など、ヒト、動物、植物、細菌、真菌、またはウイルスの構造の構造材料のうちの1つを形成するそれらの細胞間物質と共に、通常は特定の種類の細胞の集合体である。生物学的組織の例としては、臓器、腫瘍、リンパ節、動脈、および個々の細胞(複数可)も挙げられる。
いくつかの実施形態において、サンプルは、生物学的サンプルである。本開示の生物学的サンプルは、溶液、懸濁液、液体、粉末、ペースト、水性サンプル、または非水性サンプルの形態のサンプルを包含する。本明細書で使用される場合、「生物学的サンプル」は、生体もしくはウイルス(もしくはプリオン)供給源または巨大分子および生体分子の他の供給源から得られる任意のサンプルを含み、核酸、タンパク質および/もしくは他の巨大分子を得ることができる対象の任意の細胞型または組織を含む。生物学的サンプルは、生物学的供給源から直接得られたサンプルまたは処理されたサンプルであり得る。例えば、増幅された単離核酸は、生物学的サンプルを構成する。生物学的サンプルとしては、血液、血漿、血清、脳脊髄液、滑液、尿および汗などの体液、動植物からの組織および器官のサンプル、ならびにそれらに由来する処理されたサンプルが挙げられるが、これらに限定されない。いくつかの実施形態において、サンプルは、組織もしくは体液、例えば、結合組織、上皮組織、筋肉組織もしくは神経組織;脳、肺、肝臓、脾臓、骨髄、胸腺、心臓、リンパ、血液、骨、軟骨、膵臓、腎臓、胆嚢、胃、腸、精巣、卵巣、子宮、直腸、神経系、腺、および内部血管;または、血液、尿、唾液、骨髄、精子、腹腔液、およびそれらの細画分、例えば、血清または血漿からなる群から選択される体液に由来することができる。
「レベル(level)」または「レベル(levels)」という用語は、標的、例えば、疾患もしくは障害の病因の一部であり、定性的もしくは定量的に決定することができる物質もしくは生物の存在および/または量を言及するのに使用される。標的のレベルの「定性的」変化とは、通常の対照から得られたサンプルにおいて検出可能でないか、または存在する標的の出現または消失を指す。1つ以上の標的のレベルの「定量的」変化とは、正常な対照と比較した場合の標的のレベルの測定可能な増加または減少を指す。
本明細書で使用される場合、「ポリペプチド」という用語は、ペプチドおよびタンパク質を包含し、ペプチド結合によって接合された2つ以上のアミノ酸の鎖を含む分子を指す。いくつかの実施形態において、ポリペプチドは、2~50個のアミノ酸を含み、例えば、20~30個を超えるアミノ酸を有する。いくつかの実施形態において、ペプチドは、二次、三次、またはより高次の構造を含まない。いくつかの実施形態において、ポリペプチドは、タンパク質である。いくつかの実施形態において、タンパク質は、30個以上のアミノ酸を含み、例えば、50個を超えるアミノ酸を有する。いくつかの実施形態において、タンパク質は、一次構造に加えて、二次、三次、またはより高次の構造を含む。ポリペプチドのアミノ酸は、最も典型的にはL-アミノ酸であるが、D-アミノ酸、修飾アミノ酸、アミノ酸類似体、アミノ酸模倣物、またはそれらの任意の組み合わせであり得る。ポリペプチドは、天然に存在するか、合成的に産生されるか、または組換え的に発現され得る。ポリペプチドは、合成的に産生されるか、単離されるか、組換え的に発現されるか、または上記のような方法論の組み合わせによって産生され得る。ポリペプチドはまた、アミノ酸鎖を修飾する追加の基、例えば、翻訳後修飾を介して追加される官能基を含み得る。ポリマーは、直鎖状または分岐鎖状であってもよく、修飾アミノ酸を含んでもよく、非アミノ酸によって中断されてもよい。この用語はまた、天然にまたは介入によって修飾されたアミノ酸ポリマーを包含し、例えば、ジスルフィド結合の形成、グリコシル化、脂質化、アセチル化、リン酸化、または標識成分との共役などの他の操作または修飾である。
本明細書で使用される場合、「アミノ酸」という用語は、ペプチドの単量体サブユニットとして機能する、アミン基、カルボン酸基、および各アミノ酸に特異的な側鎖を含む有機化合物を指す。アミノ酸としては、20個の標準的、天然または正準アミノ酸、および非標準的なアミノ酸が挙げられる。標準的な天然アミノ酸としては、アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リジン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、スレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)が挙げられる。アミノ酸は、L-アミノ酸またはD-アミノ酸であり得る。非標準的なアミノ酸は、天然に存在するか、化学的に合成される修飾アミノ酸、アミノ酸類似体、アミノ酸模倣物、非標準的タンパク質原性アミノ酸、または非タンパク質原性アミノ酸であり得る。非標準的なアミノ酸の例としては、セレノシステイン、ピロリシン、およびN-ホルミルメチオニン、β-アミノ酸、ホモアミノ酸、プロリンおよびピルビン酸誘導体、3-置換アラニン誘導体、グリシン誘導体、環-置換フェニルアラニンおよびチロシン誘導体、線状コアアミノ酸、N-メチルアミノ酸が挙げられるが、これらに限定されない。
本明細書で使用される場合、「翻訳後修飾」という用語は、その翻訳、例えばリボソームによる翻訳が完了した後にペプチド上で生じる修飾を指す。翻訳後修飾は、共有結合による化学修飾または酵素修飾であり得る。翻訳後修飾の例としては、アシル化、アセチル化、アルキル化(メチル化を含む)、ビオチン化、ブチリル化、カルバミル化、カルボニル化、脱アミド化、脱イミノ化(deiminiation)、ジフタミド形成、ジスルフィド架橋形成、脱離(eliminylation)、フラビン付着、ホルミル化、ガンマカルボキシル化、グルタミル化、グリシル化、グリコシル化、グリピエーション、ヘムC付着、ヒドロキシル化、ヒプシン形成、ヨウ素化、イソプレニル化、脂質化、リポイル化、マロニル化、メチル化、ミリストリル化(myristolylation)、酸化、パルミトイル化、ペグ化、ホスホパンテテイン化、リン酸化、プロピオニル化、レチニリデンシフ塩基形成、S-グルタチオン付加、S-ニトロシル化、S-スルフェニル化、セレン化、スクシニル化、スルフィン化、ユビキチン化、およびC末端アミド化が挙げられるが、これらに限定されない。翻訳後修飾としては、ペプチドのアミノ末端および/またはカルボキシル末端の修飾が挙げられる。末端アミノ基の修飾としては、デスアミノ、N-低級アルキル、N-ジ-低級アルキル、およびN-アシル修飾が挙げられるが、これらに限定されない。末端カルボキシ基の修飾としては、アミド、低級アルキルアミド、ジアルキルアミド、および低級アルキルエステル修飾(例えば、低級アルキルはC~Cアルキルである)が挙げられるが、これらに限定されない。翻訳後修飾としては、アミノ末端とカルボキシ末端との間にあるアミノ酸の修飾(例えば、上記のものであるが、これらに限定されない)も挙げられる。翻訳後修飾という用語はまた、1つ以上の検出可能な標識を含むペプチド修飾を含み得る。
本明細書で使用される場合、「結合剤」という用語は、結合標的、例えば、ポリペプチドまたはポリペプチドの成分もしくは機構に結合する、それと会合する(associates)、それと一体化する、それを認識する、またはそれと組み合わされる(combines with)核酸分子、ペプチド、ポリペプチド、タンパク質、炭水化物、または小分子を指す。結合剤は、ポリペプチドまたはポリペプチドの成分もしくは機構と共有結合または非共有結合を形成し得る。結合剤はまた、核酸分子-ペプチドキメラ結合剤または炭水化物-ペプチドキメラ結合剤などの2タイプ以上の分子から構成されるキメラ結合剤であり得る。結合剤は、天然に存在するか、合成的に産生されるか、または組換え的に発現される分子であり得る。結合剤は、ポリペプチドの単一の単量体またはサブユニット(例えば、ポリペプチドの単一アミノ酸)に結合するか、またはポリペプチドの複数の連結されたサブユニット(例えば、より長いペプチド、ポリペプチドまたはタンパク質分子のジペプチド、トリペプチド、またはより高次のペプチド)に結合し得る。結合剤は、線状分子または三次元構造(立体配座)とも呼ばれる)を有する分子に結合し得る。例えば、抗体結合剤は、線状ペプチド、ポリペプチド、もしくはタンパク質に結合するか、または立体配座ペプチド、ポリペプチド、もしくはタンパク質に結合し得る。結合剤は、ペプチド、ポリペプチド、もしくはタンパク質分子のN末端ペプチド、C末端ペプチド、または介在ペプチドに結合し得る。結合剤は、ペプチド分子のN末端アミノ酸、C末端アミノ酸、または介在アミノ酸に結合し得る。結合剤は、好ましくは、標識または修飾されていないアミノ酸よりも、化学的に修飾または標識されたアミノ酸(例えば、本明細書に記載の式(I)~(IV)のいずれか1つの化合物を含む試薬によって標識されたアミノ酸)に結合し得る。例えば、結合剤は、好ましくは、標識または修飾されていないアミノ酸よりも、標識または修飾されたアミノ酸に結合し得る。結合剤は、ペプチド分子の翻訳後修飾に結合し得る。結合剤は、ポリペプチドの成分または機構への選択的結合を示し得る(例えば、結合剤は、20個の可能な天然アミノ酸残基のうちの1つに選択的に結合し、他の19個の天然アミノ酸残基には非常に低い親和性で結合するか、または全く結合しない可能性がある)。結合剤は、ポリペプチドの複数の成分または機構に結合することができるか、または結合するように構成される場合、低い選択的結合を示し得る(例えば、結合剤は、2つ以上の異なるアミノ酸残基に同様の親和性で結合する可能性がある)。結合剤は、リンカーによって結合剤に接合され得るコーディングタグを含み得る。
本明細書で使用される場合、「リンカー」という用語は、2つの分子を接合するために使用されるヌクレオチド、ヌクレオチド類似体、アミノ酸、ペプチド、ポリペプチド、ポリマー、または非ヌクレオチド化学部分のうちの1つ以上を指す。リンカーを使用して、例えば、結合剤をコーディングタグと接合し、記録タグをポリペプチドと接合し、ポリペプチドを固体支持体と接合し、記録タグを固体支持体と接合する。特定の実施形態において、リンカーは、酵素反応または化学反応により、2つの分子を接合する(例えば、クリック化学)。
本明細書で使用される場合、「リガンド」という用語は、本明細書に記載の化合物に接続された任意の分子または部分を指す。「リガンド」は、化合物に付着した1つ以上のリガンドを指す場合がある。いくつかの実施形態において、リガンドは、ペンダント基または結合部位(例えば、結合剤が結合する部位)である。
本明細書で使用される場合、「プロテオーム」という用語は、任意の生物の、特定の時間にゲノム、細胞、組織、または生物によって発現されるタンパク質、ポリペプチドまたはペプチド(それらの共役体または複合体を含む)の全セットを含み得る。一態様において、プロテオームは、規定された条件下で、所与の時間に、所与のタイプの細胞または生物において発現されるタンパク質のセットである。プロテオミクスは、プロテオームの研究である。例えば、「細胞プロテオーム」は、ホルモン刺激への曝露など、特定の一連の環境条件下で特定の細胞型において見られるタンパク質の集合を含み得る。生物の完全なプロテオームには、さまざまな細胞プロテオームのすべてからのタンパク質の完全なセットが含まれ得る。プロテオームには、特定の細胞レベル下の生体系におけるタンパク質の集合も含まれ得る。例えば、ウイルス内のすべてのタンパク質は、ウイルスプロテオームと呼ばれる可能性がある。本明細書で使用される場合、「プロテオーム」という用語は、キノーム;セクレトーム;レセプトーム(例えば、GPCRome);免疫プロテオーム;ニュートリプロテオーム;翻訳後修飾(例えば、リン酸化、ユビキチン化、メチル化、アセチル化、グリコシル化、酸化、脂質化、および/もしくはニトロシル化)によって規定されるプロテオームサブセット、例えば、ホスホプロテオーム(例えば、ホスホチロシン-プロテオーム、チロシン-キノーム、およびチロシン-ホスファトーム)、グリコプロテオームなど;組織もしくは器官、発達段階、または生理学的もしくは病理学的状態に関連するプロテオームサブセット;細胞周期、分化(もしくは脱分化)、細胞死、老化、細胞移動、形質転換、または転移などの細胞プロセスに関連するプロテオームサブセット;あるいはそれらの任意の組み合わせを含むが、これに限定されないプロテオームのサブセットを含む。本明細書で使用される場合、「プロテオミクス」という用語は、細胞、組織、および体液内のプロテオームの定量分析、ならびに細胞内および組織内のプロテオームの対応する空間分布を指す。さらに、プロテオミクス研究には、生物学および規定された生物学的または化学的刺激の関数として経時的に継続変化するプロテオームの動的状態が含まれる。
遊離アミノ基を有するペプチドまたはポリペプチド鎖の一端の末端アミノ酸は、本明細書では「N末端アミノ酸」(NTAA)と呼ばれる。遊離カルボキシル基を有する鎖のもう一方の末端の末端アミノ酸は、本明細書では「C末端アミノ酸」(CTAA)と呼ばれる。ペプチドの長さが「n」個のアミノ酸である場合、ペプチドを構成するアミノ酸には、順に番号を付けることができる。本明細書で使用される場合、NTAAは、n番目のアミノ酸(本明細書では「nNTAA」とも呼ばれる)と見なされる。この命名法を使用すると、次のアミノ酸は、n-1個のアミノ酸、次いでn-2個のアミノ酸というように、ペプチドのN末端からC末端までの長さを下っていく。特定の実施形態において、NTAA、CTAA、またはその両方は、部分または化学部分で修飾または標識され得る。
本明細書で使用される場合、「バーコード」という用語は、ポリペプチド、結合剤、結合サイクルからの結合剤のセット、サンプルポリペプチド、サンプルのセット、コンパートメント(例えば、液滴、ビーズ、もしく分離された位置)内のポリペプチド、コンパートメントのセット内のポリペプチド、ポリペプチドの画分、ポリペプチド画分のセット、空間領域もしくは空間領域のセット、ポリペプチドのライブラリー、または結合剤のライブラリーについての固有の識別子タグまたは起源情報を提供する、約2~約30塩基(例えば、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29または30塩基)の核酸分子を指す。バーコードは、人工的な配列または天然に存在する配列であり得る。特定の実施形態において、バーコードの集団内の各バーコードは異なる。他の実施形態において、バーコードの集団におけるバーコードの一部分は異なり、例えば、バーコードの集団におけるバーコードの少なくとも約10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、または99%異なる。バーコードの集団は、ランダムに生成されるか、またはランダムではなく生成される可能性がある。特定の実施形態において、バーコードの集団は、エラー訂正バーコードである。バーコードを使用して、多重化された配列決定データを計算によりデコンボリューションし、個々のポリペプチド、サンプル、ライブラリーなどに由来する配列リードを識別することができる。また、バーコードを使用して、マッピングを強化するために小さなコンパートメントに分配されたポリペプチド集合のデコンボリューションすることもできる。例えば、ペプチドをプロテオームにマッピングし直すのではなく、ペプチドを元のタンパク質分子またはタンパク質複合体にマッピングし直す。
本明細書で使用される場合、「コーディングタグ」という用語は、その関連する結合剤に関する識別情報を含む、任意の好適な長さを有するポリヌクレオチド、例えば、2~100(2および100を含む)の任意の整数を含む、約2塩基~約100塩基の核酸分子を指す。「コーディングタグ」は、「配列決定可能なポリマー」から作製することもできる(例えば、Niu et al.,2013,Nat.Chem.5:282-292;Roy et al.,2015,Nat.Commun.6:7237;Lutz,2015,Macromolecules 48:4759-4767(その各々は参照によりその全体が組み込まれる)を参照)。コーディングタグは、エンコーダー配列を含み得、このエンコーダー配列には、任意選択的に、片側に1つのスペーサーが隣接するか、任意選択的に、両側にスペーサーが隣接する。コーディングタグはまた、任意選択的なUMIおよび/または任意の結合サイクル固有のバーコードで構成され得る。コーディングタグは、一本鎖または二本鎖であり得る。二本鎖コーディングタグは、平滑末端、突出末端、またはその両方を含み得る。コーディングタグは、結合剤に直接付着しているコーディングタグ、結合剤に直接付着しているコーディングタグにハイブリダイズした相補配列(例えば、二本鎖コーディングタグの場合)、または伸長記録タグに存在するコーディングタグ情報を指す場合がある。特定の実施形態において、コーディングタグは、結合サイクル固有のスペーサーまたはバーコード、固有の分子識別子、ユニバーサルプライミング部位、またはそれらの任意の組み合わせをさらに含み得る。
本明細書で使用される場合、「スペーサー」(Sp)という用語は、記録タグまたはコーディングタグの末端上に存在する、長さが約1塩基~約20塩基(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20塩基)の核酸分子を指す。特定の実施形態において、スペーサー配列は、一端または両端でコーディングタグのエンコーダー配列に隣接する。結合剤のポリペプチドへの結合に続いて、それらの関連するコーディングタグおよび記録タグ上の相補的スペーサー配列間のアニーリングは、それぞれ、プライマー伸長反応または記録タグ、コーディングタグ、またはジタグ構築物へのライゲーションを介した結合情報の伝達を可能にする。Sp’は、Spに相補的なスペーサー配列を指す。好ましくは、結合剤ライブラリー内のスペーサー配列は、同じ数の塩基を有する。共通の(共有または同一の)スペーサーを、結合剤ライブラリーで使用することができる。スペーサー配列は、特定の結合サイクルにおいて使用される結合剤を追跡するために、「サイクル特異的」配列を有し得る。スペーサー配列(Sp)は、すべての結合サイクルにわたって一定であるか、特定のクラスのポリペプチドに特異的であるか、または結合サイクル数に特異的である可能性がある。ポリペプチドクラス特異的スペーサーにより、完了した結合/伸長サイクルからの伸長記録タグに存在する同種結合剤のコーディングタグ情報が、後続の結合サイクルにおける同じクラスのポリペプチドを認識する別の結合剤のコーディングタグに、クラス特異的スペーサーを介してアニーリングすることができる。正確な同種の対の逐次的な結合によってのみ、相互作用するスペーサー要素および効果的なプライマー伸長がもたらされる。スペーサー配列は、記録タグ内の相補的スペーサー配列にアニーリングしてプライマー伸長(ポリメラーゼ伸長とも呼ばれる)反応を開始させるか、またはライゲーション反応用の「副木」を提供するか、または「粘着末端」ライゲーション反応を媒介するのに十分な数の塩基を含み得る。スペーサー配列は、コーディングタグ内のエンコーダー配列よりも少ない数の塩基を含み得る。
本明細書で使用される場合、「記録タグ」という用語は、コーディングタグの識別情報が転送され得るか、あるいは記録タグと関連付けられた巨大分子に関する識別情報(例えば、UMI情報)がコーディングタグに転送され得る、部分、例えば、化学カップリング部分、核酸分子、または配列決定可能なポリマー分子を指す(例えば、Niu et al.,2013,Nat.Chem.5:282-292;Roy et al.,2015,Nat.Commun.6:7237;Lutz,2015,Macromolecules 48:4759-4767(その各々は参照によりその全体が組み込まれる)を参照)。識別情報は、サンプル、画分、パーティション、空間位置、相互作用する隣接分子(複数可)、サイクル数などに関連する情報など、分子を特徴付ける任意の情報を含むことができる。さらに、UMI情報の存在も識別情報として分類することができる。特定の実施形態において、結合剤がポリペプチドに結合した後、結合剤に連結したコーディングタグからの情報を、結合剤がポリペプチドに結合している間に、ポリペプチドと関連付けられた記録タグに転送することができる。他の実施形態において、結合剤がポリペプチドに結合した後、ポリペプチドと関連付けられた記録タグからの情報を、結合剤がポリペプチドに結合している間に、結合剤に連結されたコーディングタグに転送することができる。記録タグは、ポリペプチドに直接連結されるか、多官能性リンカーを介してポリペプチドに連結されるか、または固体支持体上でのその近接性(または共局在化)によってポリペプチドと会合され得る。記録タグは、その連結が、コーディングタグ情報を記録タグに、またはその逆に転送するために使用される方法と適合性がある限り、その5’末端または3’末端を介して、または内部で連結され得る。記録タグは、他の機能的成分、例えば、ユニバーサルプライミング部位、固有の分子識別子、バーコード(例えば、サンプルバーコード、画分バーコード、空間バーコード、コンパートメントタグなど)、コーディングタグのスペーサー配列に相補的であるスペーサー配列、またはそれらの任意の組み合わせをさらに含み得る。記録タグのスペーサー配列は、好ましくは、ポリメラーゼ伸長を使用して、コーディングタグ情報を記録タグに転送する実施形態において、記録タグの3’末端にある。
本明細書で使用される場合、「ポリメラーゼ伸長」とも呼ばれる「プライマー伸長」という用語は、核酸ポリメラーゼ(例えば、DNAポリメラーゼ)によって触媒され、それにより、相補鎖にアニーリングする核酸分子(例えば、オリゴヌクレオチドプライマー、スペーサー配列)が、相補鎖を鋳型として使用してポリメラーゼによって伸長される反応を指す。
本明細書で使用される場合、「固有の分子識別子」または「UMI」という用語は、UMIが連結される各巨大分子、ポリペプチド、または結合剤に、固有の識別子タグを提供する、長さが約3~約40塩基(3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40塩基)の核酸分子を指す。ポリペプチドUMIを使用して、複数の伸長記録タグからの配列決定データを計算によりデコンボリューションして、個々のポリペプチドに由来する伸長記録タグを識別できる。ポリペプチドUMIを使用して、NGSリードを固有のUMIに折り畳むことにより、元のポリペプチド分子を正確に計数することができる。結合剤UMIを使用して、特定のポリペプチドに結合する個々の分子結合剤を識別することができる。例えば、UMIを使用して、特定のペプチド分子に対して発生する単一のアミノ酸に特異的な結合剤の個々の結合事象の数を特定することができる。UMIおよびバーコードを両方とも結合剤またはポリペプチドに関連して参照する場合、バーコードは、個々の結合剤またはポリペプチドに関するUMI以外の識別情報を指す(例えば、サンプルバーコード、コンパートメントバーコード、結合サイクルバーコード)ことが理解される。
本明細書で使用される場合、「ユニバーサルプライミング部位」または「ユニバーサルプライマー」または「ユニバーサルプライミング配列」という用語は、ライブラリーの増幅および/または配列決定反応に使用され得る核酸分子を指す。ユニバーサルプライミング部位には、PCR増幅用のプライミング部位(プライマー配列)、いくつかの次世代シーケンシングプラットフォームにおいてブリッジ増幅を可能にするフローセル表面上の相補的オリゴヌクレオチドにアニーリングするフローセルアダプター配列、シーケンシングプライミング部位、またはそれらの組み合わせが含まれるが、これらに限定されない。ユニバーサルプライミング部位は、次世代デジタルシーケンシングと組み合わせて一般的に使用されるものを含む、他のタイプの増幅に使用することができる。例えば、伸長記録タグ分子を環状化し、ユニバーサルプライミング部位をローリングサークル増幅に使用して、配列決定鋳型として使用することができるDNAナノボールを形成することができる(Drmanac et al.,2009,Science 327:78-81)。あるいは、記録タグ分子を環状化し、ユニバーサルプライミング部位からのポリメラーゼ伸長によって直接配列決定することができる(Korlach et al.,2008,Proc.Natl.Acad.Sci.105:1176-1181)。「ユニバーサルプライミング部位」または「ユニバーサルプライマー」に関連して使用される場合の「フォワード」という用語は、「5」または「センス」と呼ばれる場合もある。「ユニバーサルプライミング部位」または「ユニバーサルプライマー」に関連して使用される場合の「リバース」という用語は、「3」または「アンチセンス」と呼ばれる場合もある。
本明細書で使用される場合、「伸長記録タグ」という用語は、結合剤のポリペプチドへの結合に続いて、少なくとも1つの結合剤のコーディングタグ(またはその相補的配列)の情報が転送された記録タグを指す。コーディングタグの情報は、直接的に(例えば、ライゲーション)または間接的に(例えば、プライマー伸長)記録タグに転送され得る。コーディングタグの情報は、酵素的または化学的に記録タグに転送され得る。伸長記録タグは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200以上のコーディングタグの結合剤情報を含み得る。伸長記録タグの塩基配列は、それらのコーディングタグによって識別される結合剤の結合の時間的および連続的な順序を反映し得るか、コーディングタグによって識別される結合剤の結合の一部の連続的順序を反映し得るか、またはコーディングタグによって識別される結合剤の結合のいかなる順序も反映しない可能性がある。特定の実施形態において、伸長記録タグに存在するコーディングタグ情報は、分析されているポリペプチド配列を、少なくとも25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性で表す。伸長記録タグが分析されているポリペプチド配列を100%の同一性で表さない特定の実施形態において、エラーは、結合剤によるオフターゲットの結合、もしくは結合サイクルの「失敗」(例えば、結合サイクル中に結合剤がポリペプチドに結合できないことが原因で、プライマー伸長反応の失敗が原因で)、またはその両方に起因する可能性がある。
本明細書で使用される場合、「伸長コーディングタグ」という用語は、コーディングタグが接合する結合剤の、記録タグが関連付けられたポリペプチドへの結合後に、少なくとも1つの記録タグ(またはその相補的配列)の情報が転送されているコーディングタグを指す。記録タグの情報は、直接的に(例えば、ライゲーション)または間接的に(例えば、プライマー伸長)コーディングタグに転送され得る。記録タグの情報は、酵素的または化学的に転送され得る。特定の実施形態において、伸長コーディングタグは、1つの結合事象を反映する1つの記録タグの情報を含む。本明細書で使用される場合、「ジタグ」または「ジタグ構築物」または「ジタグ分子」という用語は、コーディングタグが接合する結合剤の、記録タグが関連付けられたポリペプチドへの結合後に、少なくとも1つの記録タグ(またはその相補的配列)および少なくとも1つのコーディングタグ(またはその相補配列)の情報が転送されている核酸分子を指す。記録タグおよびコーディングタグの情報は、間接的に(例えば、プライマー伸長)ジタグに転送され得る。記録タグの情報は、酵素的または化学的に転送され得る。特定の実施形態において、ジタグは、記録タグのUMI、記録タグのコンパートメントタグ、記録タグのユニバーサルプライミング部位、コーディングタグのUMI、コーディングタグのエンコーダー配列、結合サイクル特異的バーコード、コーディングタグのユニバーサルプライミング部位、またはそれらの任意の組み合わせを含む。
本明細書で使用される場合、「固体支持体」、「固体表面」、または「固体基質」、または「配列決定基質」、または「基質」という用語は、共有結合性の相互作用および非共有結合性の相互作用、またはそれらの任意の組み合わせを含む、当技術分野で既知の任意の手段によって、直接的または間接的にポリペプチドを関連付けることができる、多孔質材料および非多孔質材料を含めた任意の固体材料を指す。固体支持体は、二次元(例えば、平面)または三次元(例えば、ゲルマトリックスまたはビーズ)であり得る。固体支持体は、ビーズ、マイクロビーズ、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、PTFE膜、PTFE膜、ニトロセルロース膜、ニトロセルロースベースのポリマー表面、ナイロン、シリコンウェーハチップ、フロースルーチップ、フローセル、信号変換電子機器を含めたバイオチップ、チャネル、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク(spinning interferometry disc)、ニトロセルロース膜、ニトロセルロースベースのポリマー表面、ポリマーマトリックス、ナノ粒子、またはミクロスフェアを含むが、これらに限定されない任意の支持体表面であり得る。固体支持体の材料としては、アクリルアミド、アガロース、セルロース、デキストラン、ニトロセルロース、ガラス、金、石英、ポリスチレン、ポリエチレン酢酸ビニル、ポリプロピレン、ポリエステル、ポリメタクリレート、ポリアクリレート、ポリエチレン、ポリエチレンオキシド、ポリシリケート、ポリカーボネート、ポリビニルアルコール(PVA)、テフロン(登録商標)、フルオロカーボン、ナイロン、シリコンゴム、ポリ無水物、ポリグリコール酸、ポリ塩化ビニル、ポリ乳酸、ポリオルトエステル、官能化シラン、ポリプロピルフメレート、コラーゲン、グリコサミノグリカン、ポリアミノ酸、デキストラン、またはそれらの任意の組み合わせが挙げられるが、これらに限定されない。固体支持体はさらに、薄膜、膜、ボトル、皿、繊維、織繊維、チューブなどの成形ポリマー、粒子、ビーズ、ミクロスフェア、微粒子、またはそれらの任意の組み合わせを含む。例えば、固体表面がビーズである場合、ビーズは、セラミックビーズ、ポリスチレンビーズ、ポリマービーズ、ポリアクリレートビーズ、メチルスチレンビーズ、アガロースビーズ、セルロースビーズ、デキストランビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、制御多孔質ビーズ、シリカベースのビーズ、またはそれらの任意の組み合わせを含むことができるが、これらに限定されない。ビーズは、球形であっても不規則な形状であってもよい。ビーズまたは支持体は、多孔質であり得る。ビーズのサイズは、ナノメートル、例えば100nm~数ミリメートル、例えば1mmまでの範囲であり得る。特定の実施形態において、ビーズのサイズは、約0.2ミクロン~約200ミクロン、または約0.5ミクロン~約5ミクロンの範囲である。いくつかの実施形態において、ビーズは、直径約1、1.5、2、2、2.5、2.8、3、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、15、または20μmであり得る。特定の実施形態において、「ビーズ」固体支持体は、個々のビーズまたは複数のビーズを指す場合がある。いくつかの実施形態において、固体表面はナノ粒子である。特定の実施形態において、ナノ粒子のサイズは、直径が約1nm~約500nm、例えば、直径が約1nm~約20nm、約1nm~約50nm、約1nm~約100nm、約10nm~約50nm、約10nm~約100nm、約10nm~約200nm、約50nm~約100nm、約50nm~約150、約50nm~約200nm、約100nm~約200nm、または約200nm~約500nmの範囲である。いくつかの実施形態において、ナノ粒子は、直径が約10nm、約50nm、約100nm、約150nm、約200nm、約300nm、または約500nmであり得る。いくつかの実施形態において、ナノ粒子は、直径が約200nm未満である。
本明細書で使用される場合、「核酸分子」または「ポリヌクレオチド」という用語は、3’-5’ホスホジエステル結合によって連結されたデオキシリボヌクレオチドまたはリボヌクレオチドを含む一本鎖または二本鎖ポリヌクレオチド、およびポリヌクレオチド類似体を指す。核酸分子としては、DNA、RNA、およびcDNAが挙げられるが、これらに限定されない。ポリヌクレオチド類似体は、天然ポリヌクレオチドに見られる標準的なホスホジエステル結合以外の骨格、および、任意選択的に、リボースまたはデオキシリボース以外の修飾された糖部分(複数可)を有し得る。ポリヌクレオチド類似体は、ワトソンクリック塩基対形成による、標準的なポリヌクレオチド塩基への水素結合が可能な塩基を含み、類似体骨格は、オリゴヌクレオチド類似体分子と標準的なポリヌクレオチドの塩基との間の配列特異的な様式でのそのような水素結合を可能にする方式で塩基を提示する。ポリヌクレオチド類似体の例としては、異種核酸(XNA)、架橋核酸(BNA)、グリコール核酸(GNA)、ペプチド核酸(PNA)、γPNA、モルホリノポリヌクレオチド、ロックされた核酸(LNA)、トレオース核酸(TNA)、2’-O-メチルポリヌクレオチド、2’-O-アルキルリボシル置換ポリヌクレオチド、ホスホロチオエートポリヌクレオチド、およびボロノホスフェートポリヌクレオチドが挙げられるが、これらに限定されない。ポリヌクレオチド類似体は、例えば、7-デアザプリン類似体、8-ハロプリン類似体、5-ハロピリミジン類似体、またはヒポキサンチン、ニトロアゾール、イソカルボスチリル類似体、アゾールカルボキサミド、および芳香族トリアゾール類似体、または親和性結合のためのビオチン部分などの追加の官能基(functionality)を有する塩基類似体を含む任意の塩基と対になることができるユニバーサル塩基類似体を含む、プリンまたはピリミジン類似体を有し得る。いくつかの実施形態において、核酸分子またはオリゴヌクレオチドは、修飾されたオリゴヌクレオチドである。いくつかの実施形態において、核酸分子またはオリゴヌクレオチドは、偽相補的塩基を有するDNA、保護された塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、もしくはモルホリノDNA、またはそれらの組み合わせである。いくつかの実施形態において、核酸分子またはオリゴヌクレオチドは、骨格修飾、糖修飾、または核酸塩基修飾される。いくつかの実施形態において、核酸分子またはオリゴヌクレオチドは、Allocなどの核酸塩基保護基、チランなどの求電子性保護基、アセチル保護基、ニトロベンジル保護基、スルホネート保護基、または従来の塩基不安定性保護基を有する。
本明細書で使用される場合、「核酸シーケンシング」は、核酸分子または核酸分子のサンプル中のヌクレオチドの順序の決定を意味する。
本明細書で使用される場合、「次世代シーケンシング」は、数百万~数十億の分子の並行した配列決定を可能にするハイスループットシーケンシング方法を指す。次世代シーケンシング方法の例としては、合成によるシーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、ポロニーシーケンシング、イオン半導体シーケンシング、およびパイロシーケンシングが挙げられる。プライマーを固体基質に付着させ、相補配列を核酸分子に付着させることにより、プライマーを介して核酸分子を固体基質にハイブリダイズさせることができ、次いで、ポリメラーゼを使用して増幅することにより、固体基質上の別個の領域に複数のコピーを生成することができる(これらのグループ分けは、ポリメラーゼコロニーまたはポロニーと呼ばれる場合もある)。その結果、配列決定プロセス中に、特定の位置のヌクレオチドを複数回(例えば、数百回または数千回)配列決定することができる。このカバレッジの深度は「ディープシーケンシング」と呼ばれる。ハイスループット核酸シーケンシング技術の例としては、Illumina、BGI、Qiagen、Thermo-Fisher、Rocheが提供するプラットフォーム、例えば、パラレルビーズアレイ、合成によるシーケンシング、ライゲーションによるシーケンシング、キャピラリー電気泳動、電子マイクロチップ、「バイオチップ」、マイクロアレイ、並列マイクロチップ、および単一分子アレイ(例えば、Service,Science(2006)311:1544-1546を参照)などのフォーマットが挙げられる。
本明細書で使用される場合、「単一分子シーケンシング」または「第3世代シーケンシング」は、単一分子配列決定機器からの読み取りがDNAの単一分子の配列決定によって生成される次世代シーケンシング方法を指す。段階的アプローチでのシーケンシングのために多数のDNA分子を並行してクローン化するために増幅に依存する次世代シーケンシング方法とは異なり、単一分子シーケンシングはDNAの単一分子にインターロゲートし(interrogates)、増幅や同期を必要としない。単一分子シーケンシングには、各塩基の取り込み後にシーケンシング反応を一時停止する必要がある方法(「ウォッシュアンドスキャン」サイクル)と、読み取りステップ間で停止する必要がない方法が含まれる。単一分子シーケンシング方法の例としては、単一分子リアルタイムシーケンシング(Pacific Biosciences)、ナノポアベースのシーケンシング(Oxford Nanopore)、デュープレックスインタラプテッドナノポアシーケンシング、および高度な顕微鏡を使用するDNAの直接イメージングが挙げられる。
本明細書で使用される場合、ポリペプチドを「分析する」とは、ポリペプチドの成分の全部または一部分を識別、検出、定量化、特徴付け、区別、またはそれらの組み合わせを意味する。例えば、ペプチド、ポリペプチドまたはタンパク質の分析には、ペプチドのアミノ酸配列(連続または非連続)の全部または一部分を決定することが含まれる。ポリペプチドの分析には、ポリペプチドの成分の部分的な識別も含まれる。例えば、ポリペプチドタンパク質配列中のアミノ酸の部分的な識別は、可能なアミノ酸のサブセットに属するものとしてタンパク質中のアミノ酸を識別することができる。分析は通常、nNTAAの分析から始まり、ペプチドの次のアミノ酸(つまり、n-1、n-2、n-3など)に進む。これは、nNTAAを脱離させ、それによってペプチドのn-1個のアミノ酸をN末端アミノ酸(本明細書では「n-1NTAA」と呼ぶ)に変換することによって達成される。ペプチドの分析には、ペプチドの翻訳後修飾の存在および頻度決定も含まれ得る。これには、ペプチドの翻訳後修飾の順序に関する情報が含まれても、含まれなくてもよい。ペプチドの分析には、ペプチド中のエピトープの存在および頻度の決定も含まれ得る。これには、ペプチド内のエピトープの順序または位置に関する情報が含まれても、含まれなくてもよい。ペプチドの分析は、異なるタイプの分析の組み合わせ、例えば、エピトープ情報、アミノ酸配列情報、翻訳後修飾情報、またはそれらの任意の組み合わせの取得を含み得る。
本明細書で使用される場合、「未修飾」(「野生型」または「天然」でもある)という用語は、核酸分子およびタンパク質(例えば、切断酵素)などの生物学的材料に関連して使用され、自然界において見られ、人間の介入によって修飾されていないものを指す。
核酸分子およびタンパク質、例えば、ヒトの介入によって作製された、修飾された切断酵素に関して使用される場合の「修飾された」(または「変異体」または「突然変異体」)という用語。変異体、突然変異体、または修飾された切断酵素は、未修飾または野生型の切断酵素と比較して、アミノ酸配列が改変されたポリペプチドである。変異体または修飾された切断酵素は、1つ以上のアミノ酸の置換、欠失、付加、またはそれらの組み合わせによって、野生型の切断酵素配列とは異なるポリペプチドである。変異体、突然変異体、または修飾された切断酵素は、野生型の切断酵素と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30以上のアミノ酸の差異(例えば、突然変異)を含み得る。変異体または修飾された切断酵素ポリペプチドは、一般に、対応する野生型または未修飾の切断酵素に対して、少なくとも50%、60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上の配列同一性を示す。天然に存在しないアミノ酸ならびに天然に存在するアミノ酸は、許容される置換または付加の範囲に含まれる。変異体、突然変異体、または修飾された切断酵素は、特定の作製方法によって作製または生成された変異体、突然変異体、または修飾された切断酵素に限定されず、例えば、遺伝子選択、タンパク質工学、指向性進化、de novo組換えDNA技術、またはそれらの組み合わせを含む。変異体、突然変異体、または修飾された切断酵素ポリペプチドは、アミノ酸残基の置換、付加、または欠失によって一次アミノ酸配列が改変される。変異体または修飾された切断酵素との関連における「変異体」という用語は、変異体または修飾された切断酵素が作製される任意の特定の出発組成物または方法に条件を課すものとしては解釈されない。したがって、変異体または修飾された切断酵素は、組成物を示し、必ずしも任意の所与のプロセスによって産生された生成物ではない。遺伝子選択、タンパク質工学、組換え法、化学合成、またはそれらの組み合わせを含むさまざまな技術を使用することができる。
タンパク質、ポリペプチド、またはポリヌクレオチドの位置またはその中の位置に関連する「対応する」という用語、例えば、ヌクレオチドまたはアミノ酸の位置が、配列表に記載されるような、開示された配列中のヌクレオチドまたはアミノ酸の位置に「対応する」という記載は、構造配列アラインメントに基づいて、またはGAPアルゴリズムなどの標準アラインメントアルゴリズムを使用して、開示された配列とのアラインメント時に識別されるヌクレオチドまたはアミノ酸の位置を指す。例えば、対応する残基は、本明細書に記載の構造的アラインメント法により、配列番号5~8、10~16、20に記載されるような参照配列とのアラインメントによって決定することができる。配列をアラインメントすることにより、当業者は、例えば、保存された同一のアミノ酸残基をガイドとして使用して、対応する残基を識別することができる。
本明細書で使用される場合、ドメイン(アミノ酸残基の配列など)は、分子の他の部分と構造的および/または機能的に別個の識別可能なタンパク質またはコーディング核酸などの分子の一部分を指す。例えば、ドメインは、1つ以上の構造モチーフから構成されるタンパク質内で独立して折りたたまれた構造を形成することができる、および/または結合活性などの機能的活性によって認識される、ポリペプチド鎖の部分を含む。タンパク質は、1つ以上の別個のドメインを有し得る。例えば、ドメインは、モチーフに対する相同性など、関連するファミリーメンバーに対する一次配列または構造の相同性によって識別、定義、または区別され得る。別の例では、ドメインは、同族の結合相手などの分子と相互作用する能力などのその機能によって区別され得る。ドメインは、独立して生物学的機能または活性を示すことができ、その結果、ドメインは、独立して、または別の分子に融合して、例えば、結合などの活性を実行することができる。ドメインは、アミノ酸の線形配列またはアミノ酸の非線形配列であり得る。多くのポリペプチドは、複数のドメインを含んでいる。そのようなドメインは既知であり、当業者によって識別され得る。本明細書における例示のために、定義が提供されるが、特定のドメインを名称で認識することは十分に当業者の技術範囲内であることが理解される。必要に応じて、好適なソフトウェアを用いてドメインを識別することができる。
本明細書で使用される場合、「配列同一性」という用語は、それぞれヌクレオチドまたはアミノ酸レベルでの遺伝子またはタンパク質間の配列同一性を指す。「配列同一性」は、アミノ酸レベルでのタンパク質間の同一性の尺度であり、ヌクレオチドレベルでの核酸間の同一性の尺度である。タンパク質配列の同一性は、配列がアラインメントされたときに各配列の所与の位置にあるアミノ酸配列を比較することによって決定され得る。同様に、核酸配列の同一性は、配列がアラインメントされたときに各配列の所与の位置にあるヌクレオチド配列を比較することによって決定され得る。比較のために配列をアラインメントするための方法は当技術分野で周知であり、そのような方法には、GAP、BESTFIT、BLAST、FASTAおよびTFASTAが含まれる。BLASTアルゴリズムは、パーセント配列同一性を計算し、2つの配列間の類似性の統計分析を実行する。BLAST分析を実行するためのソフトウェアは、米国国立生物工学情報センター(NCBI)のWebサイトで公開されている。
本明細書で使用される場合、「アルキル」という用語は、指定された炭素原子の数(すなわち、C~C10またはC1~10は、1~10個の炭素を意味する)を有する、飽和した直鎖状または分岐鎖状の一価炭化水素構造およびそれらの組み合わせを指し、それらを含む。特定のアルキル基は、1~20個の炭素原子(「C~C20アルキル」)を有するものである。特に指定がない限り、より特定のアルキル基は、1~8の炭素原子(「C~Cアルキル」)、3~8個の炭素原子(「C~Cアルキル」)、1~6個の炭素原子(「C~Cアルキル」)、1~5個の炭素原子(「C~Cアルキル」)、または1~4個の炭素原子(「C~Cアルキル」)を有するものである。アルキルの例としては、メチル、エチル、n-プロピル、イソプロピル、n-ブチル、t-ブチル、イソブチル、sec-ブチルなどの基、例えば、n-ペンチル、n-ヘキシル、n-ヘプチル、n-オクチルなどの相同体および異性体が挙げられるが、これらに限定されない。
本明細書で使用される場合、本明細書で使用される「アルケニル」は、オレフィン性不飽和の少なくとも1つの部位を有し(すなわち、式C=Cの少なくとも1つの部分を有し)、指定された炭素原子の数(すなわち、C~C10は、2~10個の炭素原子を意味する)を有する、不飽和の直鎖状または分岐鎖状の一価炭化水素鎖またはそれらの組み合わせを指す。アルケニル基は、「シス」または「トランス」配置、あるいは「E」または「Z」配置であり得る。特定のアルケニル基は、2~20個の炭素原子を有する(「C~C20アルケニル」)、2~8個の炭素原子を有する(「C~Cアルケニル」)、2~6個の炭素原子を有する(「C~Cアルケニル」)、または2~4個の炭素原子を有する(「C~Cアルケニル」)ものである。アルケニルの例としては、エテニル(またはビニル)、プロプ-1-エニル、プロプ-2-エニル(またはアリル)、2-メチルプロプ-1-エニル、ブト-1-エニル、ブト-2-エニル、ブト-3-エニル、ブタ-1,3-ジエニル、2-メチルブタ-1,3-ジエニル、それらの相同体および異性体などが挙げられるが、これらに限定されない。
「アミノアルキル」という用語は、1つ以上の-NH基で置換されたアルキル基を指す。特定の実施形態において、アミノアルキル基は、1つ、2つ、3つ、4つ、5つ以上の-NH基で置換される。アミノアルキル基は、任意選択的に、本明細書に記載されるように、1つ以上の追加の置換基で置換されてもよい。
本明細書で使用される場合、「アリール」または「Ar」は、縮合環が芳香族であってもなくてもよい単一環(例えば、フェニル)または複数の縮合環(例えば、ナフチルまたはアントリル)を有する不飽和芳香族炭素環基を指す。一変形例では、アリール基は、6~14個の環状炭素原子を含む。少なくとも1つの環が非芳香族である2つ以上の環を有するアリール基は、芳香環位置または非芳香環位置のいずれかで親構造に結合され得る。一変形例では、少なくとも1つの環が非芳香族である2つ以上の環を有するアリール基が、芳香環位置で親構造に接続される。いくつかの実施形態において、フェニルは、好ましいアリール基である。
本明細書で使用される場合、「アリールアルキル」という用語は、本明細書で定義されるようなアルキル基を介して親分子部分に付加される、本明細書で定義されるようなアリール基を指す。アリールアルキルの代表的な例としては、ベンジル、2-フェニルエチル、3-フェニルプロピル、2-ナフト-2-イルエチルなどが挙げられるが、これらに限定されない。
本明細書で使用される場合、「シクロアルキル」という用語は、完全に飽和、一価または多価不飽和であり得るが、指定された炭素原子の数(例えば、C~C10は、1~10個の炭素を意味する)を有する非芳香族である環状の一価炭化水素構造を指し、それらを含む。シクロアルキルは、シクロヘキシルなどの1つの環、またはアダマンティルとしてなどの複数の環で構成することができるが、アリール基は除外される。2つ以上の環を含むシクロアルキルは、融合されるか、スピロまたは架橋されるか、あるいはそれらの組み合わせであり得る。いくつかの実施形態において、シクロアルキルは、3~13個の環状炭素原子を有する環状炭化水素である。いくつかの実施形態において、シクロアルキルは、3~8個の環状炭素原子を有する環状炭化水素(「C~Cシクロアルキル」)である。シクロアルキルの例としては、シクロプロピル、シクロブチル、シクロペンチル、シクロヘキシル、1-シクロヘキセニル、3-シクロヘキセニル、シクロヘプチル、ノルボルニルなどが挙げられるが、これらに限定されない。
本明細書で使用される場合、「ハロゲン」は、塩素、フッ素、臭素、またはヨウ素を表す。「ハロ」という用語は、クロロ、フルオロ、ブロモ、またはヨードを表す。
「ハロアルキル」という用語は、上記のようなアルキル基を指し、アルキル基上の1つ以上の水素原子がハロ基で置換される。そのような基の例としては、フルオロエチル、トリフルオロメチル、ジフルオロメチル、トリフルオロエチルなどのフルオロアルキル基が挙げられるが、これらに限定されない。
本明細書で使用される場合、「ヘテロアリール」という用語は、1~10個の環状炭素原子と、窒素、酸素および硫黄などのヘテロ原子を含むがこれらに限定されない少なくとも1つの環状ヘテロ原子と、を有する不飽和芳香族環状基であって、窒素および硫黄原子が任意選択的に酸化され、窒素原子(複数可)が任意選択的に四級化される不飽和芳香族環状基を指し、それらを含む。ヘテロアリール環におけるヘテロ原子の選択および順序は、標準的な原子価要件に適合し、芳香族環特性を提供しなければならず、また、本明細書に記載の反応で使用するのに十分安定な環を提供しなければならないことが理解される。通常、ヘテロアリール環は、5~6個の環原子と、1~4個のヘテロ原子と、を有し、特に指定がない限り、N、OおよびSから選択される。二環式ヘテロアリール基は、1つの結合を共有し、環員としてN、OおよびSから選択される少なくとも1つのヘテロ原子~最大5つのヘテロ原子を含む2つの5~6員環を含む。ヘテロアリール基は、環状炭素または環状ヘテロ原子で分子の残りの部分に付着することができ、その場合、ヘテロ原子は通常、窒素である。ヘテロアリール基は、追加の縮合アリール、ヘテロアリール、シクロアルキル、および/またはヘテロシクリル環を含む、追加の縮合環(例えば、1つ~3つの環)を含み得る。ヘテロアリール基の例としては、ピラゾリル、イミダゾリル、トリアゾリル、ピロリル、ピリジル、ピリミジル、ピラジニル、ピリダジニル、トリアジニル、チオフェニル、フラニル、チアゾリルなどが挙げられるが、これらに限定されない。
本明細書で使用される場合、「複素環」、「複素環式」、または「ヘテロシクリル」という用語は、1~10個の環状炭素原子と、窒素、硫黄もしくは酸素などの1~4個の環状ヘテロ原子と、を有する飽和または不飽和の非芳香族基であって、窒素および硫黄原子が任意選択的に酸化され、窒素原子(複数可)が任意選択的に四級化されている飽和または不飽和の非芳香族基を指す。ヘテロシクリル基は、単一の環または複数の縮合環を有し得るが、ヘテロアリール基は除外される。2つ以上の環を含む複素環は、融合されるか、スピロまたは架橋されるか、あるいはそれらの組み合わせであり得る。縮合環系において、縮合環の1つ以上は、アリールまたはヘテロアリールであり得る。ヘテロシクリル基の例としては、テトラヒドロピラニル、ジヒドロピラニル、ピペリジニル、ピペラジニル、ピロリジニル、チアゾリニル、チアゾリジニル、テトラヒドロフラニル、テトラヒドロチオフェニル、2,3-ジヒドロベンゾ[b]チオフェン-2-イル、4-アミノ-2-オキソピリミジン-1(2H)-イルなどが挙げられるが、これらに限定されない。
「置換」という用語は、特定の基または部分が、非置換基の水素原子の代わりに1つ以上の置換基を有することを意味し、これには、アルコキシ、アシル、アシルオキシ、カルボニルアルコキシ、アシルアミノ、アミノ、アミノアシル、アミノカルボニルアミノ、アミノカルボニルオキシ、シクロアルキル、シクロアルケニル、アリール、ヘテロアリール、アリールオキシ、シアノ、アジド、ハロ、ヒドロキシル、ニトロ、カルボキシル、チオール、チオアルキル、シクロアルキル、シクロアルケニル、アルキル、アルケニル、アルキニル、ヘテロシクリル、アラルキル、アミノスルホニル、スルホニルアミノ、スルホニル、オキソ、カルボニルアルキレンアルコキシなどの置換基などが含まれるが、これらに限定されない。「非置換」という用語は、特定の基が置換基を有しないことを意味する。「任意選択的に置換された」という用語は、特定の基が非置換であるか、1つ以上の置換基によって置換されており、したがって、基の置換および非置換バージョンの両方を包含することを意味する。「置換(された)」という用語が構造系を説明するために使用される場合、置換は、系上の任意の原子価許容位置(valency-allowed position)で起こることを意味する。
本明細書に記載または描写される構造は、当技術分野でよく理解されるように、複数の互変異性体を形成することができる可能性がある。存在する特定の互変異性体(複数可)は、多くの場合、溶媒、pH、およびその他の環境要因、ならびに構造自体に依存する。互変異性の例をここに示すが、少なくとも3つの異なる互変異性体が描画されて、1つの化合物を表すことができる:
Figure 2022526939000002
化合物が2つ以上の互変異性体の形態で存在し得る場合、典型的には1つの互変異性体が描写または記載され、その構造は、安定な各互変異性体ならびに互変異性体の混合物を表すと理解される。特に、ヒドロキシル基またはアミン基で置換されたグアニジン基およびヘテロアリール基は、多くの場合、複数の互変異性体に存在することができ、1つの互変異性体の説明または描写は、同じ化合物の他の互変異性体を包含すると理解される。
本明細書に記載される本発明の態様および実施形態は、態様および実施形態「からなる(consisting)」、ならびに/または態様および実施形態「から本質的になる」を包含することが理解される。
本開示を通じて、本発明のさまざまな態様が、範囲形式で提示される。範囲形式での記載は、単に便宜上および簡潔にするためのものであり、本発明の範囲に対する不動の限定として解釈されるべきではないことを理解されたい。したがって、範囲の記載は、すべての可能なサブ範囲、およびその範囲内の個々の数値を具体的に開示すると見なすべきである。例えば、1~6などの範囲の記載は、1~3、1~4、1~5、2~4、2~6、3~6などのサブ範囲、およびその範囲内の個々の数(例えば、1、2、3、4、5および6)を具体的に開示すると見なすべきである。これは、範囲の幅に関係なく適用される。
本発明の他の目的、利点および特徴は、添付の図面と結び付けられた以下の明細書から明らかになるであろう。
I.修飾された切断酵素
本明細書において提供されるのは、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、修飾された切断酵素であって、修飾された切断酵素が、ジペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を除去するか、または除去するように構成される、修飾された切断酵素である。本明細書において提供されるのは、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、修飾された切断酵素であって、修飾された切断酵素が、トリペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を、もしくはポリペプチドから単一の標識末端ジペプチドを除去するか、または除去するように構成される、修飾された切断酵素である。いくつかの実施形態において、修飾された切断酵素は、ポリペプチドのC末端またはN末端から単一の標識末端アミノ酸を除去するように構成される。いくつかの実施形態において、修飾された切断酵素は、ポリペプチドのC末端またはN末端から単一の標識ジペプチド(末端および最後から2番目の末端アミノ酸)を除去するように構成される。いくつかの実施形態において、修飾された切断酵素は、野生型または未修飾の切断酵素(例えば、ジペプチド切断酵素またはトリペプチド切断酵素)に由来する。場合によっては、末端標識アミノ酸残基は、N末端アミノ酸である。いくつかの実施形態において、末端標識アミノ酸残基は、C末端アミノ酸である。いくつかの実施形態において、除去された標識末端アミノ酸は、単一のアミノ酸として、またはジペプチドの一部として除去される。いくつかの態様において、標識アミノ酸は、化学試薬で処理することによって修飾される末端アミノ酸である。いくつかの特定の例において、除去された単一の標識末端アミノ酸または単一の標識末端ジペプチドは、アミド結合を含む。いくつかの態様において、修飾された切断酵素は、アミド結合(例えば、ポリペプチドの末端標識アミノ酸残基と最後から2番目の末端アミノ酸残基との間のアミド結合)と相互作用する活性部位を含む。いくつかの実施形態において、突然変異は、アミノ酸の置換、欠失、付加、またはそれらの任意の組み合わせであるか、またはそれらを含む。
いくつかの実施形態において、修飾された切断酵素は、未修飾または野生型の切断酵素の活性とは異なる活性を示す。本明細書で使用される場合、「未修飾の切断酵素」または「野生型の切断酵素」は、ポリペプチドの末端から(例えば、ポリペプチドのC末端またはN末端から)ジペプチドまたはトリペプチドを除去する触媒活性を有する任意の天然または野生型エキソペプチダーゼを指す。未修飾または野生型の切断酵素は、最後から2番目のペプチド結合の切断を触媒してペプチド鎖からジペプチドを放出するか、または最後から3番目のペプチド結合の切断を触媒してペプチド鎖からトリペプチドを放出するエキソペプチダーゼであり得る。未修飾または野生型の切断酵素は、アミノペプチダーゼまたはカルボキシペプチダーゼなどのタンパク質分解酵素であり得る。本明細書に記載される未修飾の切断酵素は、酵素委員会(EC)によってEC3.4.14、EC3.4.15、MEROPS S8、MEROPS S9、MEROPS S33、MEROPS S46、MEROPS M49、もしくはMEROPSS53、またはその機能的相同体もしくは断片として分類されるタンパク質を指すために使用され得る。本明細書に記載される未修飾の切断酵素は、ジペプチジルペプチダーゼ、ジペプチジルアミノペプチダーゼ、ペプチジル-ジペプチダーゼ、ジペプチジルカルボキシペプチダーゼ、セドリジン、またはトリペプチジルペプチダーゼを指すために使用され得る。
「修飾された切断酵素」または「変異体切断酵素」は、記載されるように、未修飾または野生型の切断酵素から修飾された任意のエキソペプチダーゼを指す。修飾された切断酵素または変異体切断酵素は、未修飾または野生型のジペプチド切断酵素(例えば、ジペプチジルペプチダーゼ、ジペプチジルアミノペプチダーゼ、ペプチジル-ジペプチダーゼ、ジペプチジルカルボキシペプチダーゼ)に、または未修飾または野生型のトリペプチド切断酵素(例えば、セドリジンもしくはトリペプチジルペプチダーゼ)に由来し得る。ジペプチドとしてペプチドからP1-P2末端アミノ酸を一度に除去する未修飾または野生型のジペプチド切断酵素と比較して、ジペプチド切断酵素に由来する修飾された切断酵素は、ペプチドから標識されたP1末端アミノ酸のみを一度に除去する。トリペプチドとしてペプチドからP1-P2-P3末端アミノ酸を一度に除去する未修飾または野生型のトリペプチド切断酵素と比較して、トリペプチド切断酵素に由来する修飾された切断酵素は、ペプチドから標識されたP1末端アミノ酸を一度に除去するか、またはペプチドから標識されたP1-P2ジペプチドを一度に除去する。(例えば、図1A~1Bを参照。)
いくつかの実施形態において、修飾された切断酵素は、標識末端アミノ酸、例えば、標識N末端アミノ酸(NTAA)を除去する。場合によっては、修飾された切断酵素が、標識C末端アミノ酸(CTAA)を除去する。いくつかの実施形態において、除去された標識末端アミノ酸は、単一のアミノ酸として、またはジペプチドの一部として除去される。いくつかの実施形態において、ジペプチド切断酵素またはトリペプチド切断酵素に由来する修飾された切断酵素は、ポリペプチドの末端標識アミノ酸残基と最後から2番目の末端アミノ酸残基との間のペプチド結合を切断するように構成される。いくつかの実施形態において、トリペプチド切断酵素に由来する修飾された切断酵素は、ポリペプチドの最後から2番目の末端標識アミノ酸残基と最後から3番目の末端アミノ酸残基との間のペプチド結合を切断するように構成される。
さまざまな既知の未修飾または野生型エキソペプチダーゼに関する情報は、MEROPSおよび/またはBRENDA酵素情報システムなどのデータベースから入手可能である(例えば、Schomburg et al.,J Biotechnol.(2017)261:194-206を参照)。タンパク質は、2つ以上の分類システムを使用して分類することができる。酵素委員会(EC)は、EC(酵素委員会)番号が付与される特徴付けされた酵素の各タイプを説明するために、国際生化学・分子生物学連合(IUBMB)の命名法委員会からの推奨事項を使用して、特異性に基づき酵素を分類するための番号付けシステムを示している(例えば、Bairoch A.,(2000)Nucleic Acids Res.28:304-305を参照)。いくつかの態様において、未修飾または野生型の切断酵素は、EC 3.4.14、EC 3.4.15、MEROPS S8、MEROPS S9、MEROPS S33、MEROPS S46、MEROPS M49、もしくはMEROPS S53、またはその相同体に分類されるタンパク質である。いくつかの態様において、未修飾または野生型の切断酵素は、表1、2、3、4、5、6、7、および8A~8Bに規定されるタンパク質である。いくつかの実施形態において、修飾された切断酵素は、(表1、2、3、4、5、6、7、および8A~8Bに規定されるような)EC3.4.14、EC3.4.15、MEROPS S8、MEROPS S9、MEROPS S33、MEROPS S46、MEROPS M49、またはMEROPS S53に分類されるタンパク質、またはその機能的相同体もしくは断片に由来する。
Figure 2022526939000003
Figure 2022526939000004
Figure 2022526939000005
Figure 2022526939000006
Figure 2022526939000007
Figure 2022526939000008
Figure 2022526939000009
Figure 2022526939000010
Figure 2022526939000011
オリゴペプチドの非置換N末端からジペプチドまたはトリペプチドを連続的に切断するさまざまなペプチダーゼ(例えば、切断酵素)が識別されている。一部のペプチダーゼは、ジペプチドをさまざまなトリペプチドからデカペプチドに切断する。本明細書に記載の切断酵素は、ヒドロラーゼの酵素(Enzyme Commission:EC)クラス3に分類される酵素を指す。ジペプチジルペプチダーゼおよびトリペプチジルペプチダーゼ(それぞれ、酵素番号3.4.14からのDPPおよびTPP;表1)は、ペプチドのN末端からジペプチド(2つのアミノ酸残基P1-P2)またはトリペプチド(3つのアミノ酸残基P1-P2-P3)を、典型的には段階的に消化するクラスのエキソペプチダーゼである。ジペプチジルカルボキシペプチダーゼ(EC 3.4.15;表2)としても知られるペプチジルジペプチダーゼは、C末端から作用してジペプチドを段階的に除去する。いくつかの実施形態において、未修飾または野生型の切断酵素は、エキソアミノペプチダーゼまたはエキソペプチダーゼである。いくつかの態様において、未修飾または野生型の切断酵素は、メタロペプチダーゼ、例えば、亜鉛依存性メタロペプチダーゼまたは亜鉛依存性ヒドロラーゼである。いくつかの態様において、未修飾または野生型の切断酵素は、セリンエキソペプチダーゼまたはセリンプロテアーゼである。DPPは通常、N末端のアルファアミンを認識し、ポリペプチド(P2-P3)の最後から2番目アミノ酸残基と最後から3番目のアミノ酸残基との間のペプチド結合を切断する。例えば、Sanderink et al.,J.Clin.Chem.Clin.Biochem.(1988)26:795-807)およびBaral et al.,J Biol Chem(2008)283(32):22316-22324を参照。ポリペプチド(例えば、TPP)の末端からトリペプチドを除去するさまざまなペプチダーゼも識別されている。例えば、トリペプチジルペプチダーゼA、B、およびCは、MEROPSファミリーS33(MEROPS S33.002、S33.006、S33.007)に分類される。セリン-カルボキシルペプチダーゼとしても知られるセドリシンは、タンパク質分解酵素MEROPSファミリーのペプチダーゼS53である(例えば、Wlodawer et al.,Acta Biochim Pol.2003;50(1):81-102を参照)。
いくつかの実施形態において、修飾された切断酵素は、ポリペプチドまたはタンパク質からの(例えば、N末端またはC末端からの)末端アミノ酸の除去を含む活性を示す。末端アミノ酸は、単一のアミノ酸として、またはジペプチドの一部として、ポリペプチドから除去され得る。一般的な方式では、ペプチダーゼ活性は、ペプチド、ポリペプチドまたはタンパク質の末端からアミノ酸Xaaおよび/またはXaaを除去することができ、Xaaは、Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、およびValからなる群から選択される任意のアミノ酸残基を表し得る。本開示の修飾された切断酵素は、切断されるペプチド、ポリペプチドまたはタンパク質のアミノ酸配列に関して非特異的であり得ることが理解される。いくつかの実施形態において、修飾された切断酵素は、部分的に特異的または選択的である。いくつかの態様において、修飾された切断酵素は、ペプチドのP1またはP2位置にあるいくつかのアミノ酸を他のものよりも優先的に切断または除去する。場合によっては、修飾された切断酵素は、あるクラスのアミノ酸を他のクラスよりも優先的に切断または除去し、例えば、他のクラスのアミノ酸よりも疎水性アミノ酸を優先的に除去する。いくつかの態様において、修飾された切断酵素はまた、末端アミノ酸からの第2、第3、第4、第5などの位置にある1つ以上のアミノ酸を優先し得る。場合によっては、修飾された切断酵素は、アミノ酸のサブセットに特異性を示し、1、2、3、4、5、6、7、8、9、10、15以上の特定の末端アミノ酸を他のものよりも優先的に除去する。
いくつかの実施形態において、修飾された切断酵素は、未修飾または野生型の切断酵素と比較して、アミノ酸配列が改変されたポリペプチドである。場合によっては、修飾された切断酵素は、1つ以上のアミノ酸の置換、欠失、付加、またはそれらの組み合わせによって、野生型の切断酵素配列とは異なるポリペプチドである。変異体または修飾された切断酵素は、野生型の切断酵素と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30以上の修飾または突然変異、例えばアミノ酸の差異を含むことができる。
いくつかの実施形態において、変異体または修飾された切断酵素ポリペプチドは、一般に、対応する野生型または未修飾の切断酵素に対して、少なくとも50%、60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上の配列同一性を示す。いくつかの実施形態において、野生型または未修飾の切断酵素は、配列番号5~8、10~16、20のうちのいずれか1つのアミノ酸配列、その成熟配列、または活性部位を含むその一部分を含む。いくつかの実施形態において、変異体または修飾された切断酵素ポリペプチドは、一般に、配列番号5~8、10~16、20に記載の野生型もしくは未修飾の切断酵素またはその相同体に対して、少なくとも50%、60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上の配列同一性を示す。
参照配列とのアラインメントなどによって、その一部分を含む、切断酵素ポリペプチドにおける突然変異または修飾、例えばアミノ酸置換の対応する位置を特定することは、当業者の水準の範囲内である。いくつかの実施形態において、未修飾のまたは参照切断酵素ポリペプチドは、一般に、配列番号5~8および10~16、20に記載の配列のうちのいずれかに対して、少なくとも50%、60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上の配列同一性を示す。例えば、対応する残基は、既知のアラインメント法を使用して、本明細書に規定される配列(例えば、配列番号5~8、10~16、20に記載される配列、またはその機能的相同体もしくは断片)と参照配列をアラインメントすることによって決定することができる。配列をアラインメントすることにより、当業者は、例えば、保存された同一のアミノ酸残基をガイドとして使用して、対応する残基を識別することができる。場合によっては、本明細書において提供される残基の番号付けは、参照配列とは異なる可能性があるが、アラインメント法を使用することにより、対応する残基の決定が可能になる。
いくつかの実施形態において、修飾された切断酵素は、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含み、未修飾の切断酵素は、ジペプチジルペプチダーゼ3である。ジペプチジルペプチダーゼ3(ジペプチジルペプチダーゼIII、ジペプチジルアミノペプチダーゼIII、ジペプチジルアリールアミダーゼIII、エンケファリナーゼB、赤血球アンギオテンシナーゼ、DPP3、またはDPPIIIとしても知られる)は、短いペプチドのN末端からジペプチド(2つのアミノ酸残基)を順次除去するメタロプロテイナーゼ(亜鉛依存性)である。野生型または未修飾のDPP3は、M49ファミリーに分類される(MEROPSデータベース識別子M49.001)。場合によっては、未修飾のジペプチジルペプチダーゼ3は、配列番号5に記載のUniProtアクセッション番号Q9NY33、配列番号6に記載のUniProtアクセッション番号Q08225、配列番号7に記載のUniProtアクセッション番号Q8A6N1、配列番号8に記載のUniProtアクセッション番号H1XW48、または配列番号15に記載のUniProtアクセッション番号O55096に対して、少なくとも50%、60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上の配列同一性を示す。例えば、Prajapati et al.,FEBS J.2011;278(18):3256-276;Fukasawa et al.,Biochem J.1998 Jan 15;329(Pt 2):275-282;Fukasawa et al.,J Amino Acids.2011;2011:574816)を参照。DPP3は、3~10アミノ酸の長さのペプチドを優先的に消化する。DPP3は、固有のHEXXGH触媒モチーフ(配列番号1)を有する。このモチーフの両方のヒスチジンは、2番目に保存されたEEXRAE/Dモチーフのグルタメート残基と共に、亜鉛配位に関与する(配列番号2)。場合によっては、C末端ペプチド修飾はDPP3酵素の活性に影響を与えない。Kumar et al.,Sci Rep.(2016)6:23787を参照のこと。N末端チロシンを有するペプチドとの複合体を含む、DPP3のいくつかの基質結合構造が解明されている。N末端チロシンは、フェニルイソチオシアネート(PITC)、ニトロ-PITC、スルホ-PITC、またはこれらの修飾因子のフェニルイソシアネートバージョンと構造的に類似しており、これらの基質結合構造は、標的活性部位設計アプローチに有用である可能性がある。いくつかの実施形態において、提供されるのは、標識末端アミノ酸残基、例えば、標識N末端アミノ酸残基を切断するジペプチジルペプチダーゼ3に由来する修飾された切断酵素である。
いくつかの実施形態において、修飾された切断酵素は、未修飾の切断酵素における突然変異、例えば、1つ以上のアミノ酸修飾を含み、未修飾の切断酵素は、ジペプチジルペプチダーゼ5である。ジペプチジルペプチダーゼ5は、アレルゲンTri m 4(Trichophyton mentagrophytes)、アレルゲンTri r 4(Trichophyton rubrum)、アレルゲンTri t 4(Trichophyton tonsurans)、ジペプチジル-ペプチダーゼV(DPP V)、および分泌型アラニルジペプチジルペプチダーゼ(Aspergillus oryzae)としても知られている。野生型または未修飾のジペプチジルペプチダーゼ5は、ペプチダーゼファミリーS9に分類される(MEROPSデータベース識別子S09.012)。野生型または未修飾のジペプチジルペプチダーゼ5は、最適な中性pHでX-Ala、His-Ser、およびSer-Tyrジペプチドの加水分解を触媒することが観察されている(例えば、Beauvais et al.,J Biol Chem.1997;272(10):6238-44を参照)。野生型または未修飾のジペプチジルペプチダーゼ5は、非古典的セリンプロテアーゼの触媒部位のコンセンサス配列を含む分泌型ジペプチジルペプチダーゼとして説明される。場合によっては、未修飾の切断酵素は、配列番号10に記載のUniProtアクセッション番号P0C959または配列番号16に記載のUniProtアクセッション番号B2RIT0に対して、少なくとも50%、60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上の配列同一性を示す。いくつかの実施形態において、修飾された切断酵素における突然変異、例えば、1つ以上のアミノ酸修飾(例えば、置換、欠失、付加)は、配列番号10または16の番号付けに関して記載されたアミノ酸配列に関する。
いくつかの実施形態において、修飾された切断酵素は、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含み、未修飾の切断酵素は、ジペプチジルペプチダーゼ7(DPP7)である。野生型または未修飾のDPP7は、S46プロテアーゼファミリーに分類される(MEROPSデータベース識別子S46.001)。野生型または未修飾のDPP7は、オリゴペプチドのN末端からのジペプチドの除去を触媒することが観察されており、P1位置の脂肪族残基と芳香族残基の両方に対する幅広い特異性を含み、グリシンまたはプロリンはこの位置では受け入れられない(例えば、Banbula et al.,J.Biol.Chem.2001,276:6299-6305を参照)。DPP7は、合成基質Met-Leu-メチルクマリル(methylcoumaryl)-7-アミド(Met-Leu-MCA)、Leu-Arg-MCA、およびLys-Ala-MCAを切断する活性を示すことが示されている(Rouf et al.,FEBS Open Bio.2013;3:177-83)。場合によっては、未修飾の切断酵素は、配列番号11に記載のUniProtアクセッション番号B2RKV3に対して、少なくとも50%、60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上の配列同一性を示す。いくつかの実施形態において、修飾された切断酵素における突然変異、例えば、1つ以上のアミノ酸修飾(例えば、置換、欠失、付加)は、配列番号11の番号付けに関して記載されたアミノ酸配列に関する。
いくつかの実施形態において、修飾された切断酵素は、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含み、未修飾の切断酵素は、ジペプチジルペプチダーゼ11である。ジペプチジルペプチダーゼ11は、Asp/Glu特異的ジペプチジルペプチダーゼまたはDPP11としても知られている。野生型または未修飾のジペプチジルペプチダーゼ11は、S46プロテアーゼファミリーに分類され(MEROPSデータベース識別子S46.002)、ジペプチジルペプチダーゼ7と38.7%の配列同一性を共有する。野生型または未修飾のジペプチジルペプチダーゼ11は、オリゴペプチドのN末端からのジペプチドの除去、例えば、最後から2番目のN末端のAspおよびGluを有するオリゴペプチドからのジペプチドの除去、を触媒することが観察されており、疎水性残基よりもP2位置が優先される(例えば、Ohara-Nemoto et al.,J Biol Chem.2011;286(44):38115-27を参照)。場合によっては、未修飾の切断酵素は、配列番号12および14それぞれに記載のUniProtアクセッション番号B2RID1またはF8WQK8に対して、少なくとも50%、60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上の配列同一性を示す。いくつかの実施形態において、修飾された切断酵素における突然変異、例えば、1つ以上のアミノ酸修飾(例えば、置換、欠失、付加)は、配列番号12の番号付けに関して記載されたアミノ酸配列に関する。いくつかの実施形態において、修飾された切断酵素における突然変異、例えば、1つ以上のアミノ酸修飾(例えば、置換、欠失、付加)は、配列番号14の番号付けに関して記載されたアミノ酸配列に関する。
いくつかの実施形態において、修飾された切断酵素は、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含み、未修飾の切断酵素は、ジペプチジルアミノペプチダーゼBII(DAP BIIまたはジペプチジルペプチダーゼBII)である。野生型または未修飾のDAP BIIは、ペプチドのアミノ末端からのジペプチドの除去を触媒する(例えば、Ogasawara et al.,J.Bacteriol.1996,178:6288-6295);Sakamoto et al.,Scientific Reports 2014,4:4977を参照)。DAP BIIは、セリンペプチダーゼファミリーS46に属するセリンプロテアーゼである(MEROPSデータベース識別子S46.003)。DAP BIIの触媒ユニットのアミノ酸配列は、PAエンドペプチダーゼ族(clan)に分類されるものと有意な類似性を示す。場合によっては、未修飾の切断酵素は、配列番号13に記載のUniProtアクセッション番号V5YM14に対して、少なくとも50%、60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上の配列同一性を示す。いくつかの実施形態において、修飾された切断酵素は、未修飾のDAP BIIの触媒ドメインにおいて1つ以上のアミノ酸修飾(例えば、配列番号13の残基1~252および残基550~698)を含む。いくつかの実施形態において、修飾された切断酵素における突然変異、例えば、1つ以上のアミノ酸修飾(例えば、置換、欠失、付加)は、配列番号13の番号付けに関して記載されたアミノ酸配列に関する。未修飾または野生型DAP BIIは、オリゴペプチドおよび小タンパク質のN末端からペプチドを加水分解し、2番目の(P1)残基がAla、Leu、Ile、Phe、Tyr、Arg、またはHisである(Proではない)場合にジペプチドユニット(NH2-P2-P1-)を切断することが示されている(例えば、Sakamoto et al.,Scientific Reports 2014,4:4977を参照)。
いくつかの実施形態において、修飾された切断酵素は、DAP BIIに由来し、ポリペプチドから単一の標識末端アミノ酸を除去するか、または除去するように構成される。いくつかの実施形態において、修飾された切断酵素は、配列番号13の番号付けに関して、位置126、188、189、190、191、192、196、238、302、306、307、310、525、528、546、604、650、651、665、および/または692のうちのいずれか1つ以上に対応する、未修飾のDAP BII切断酵素またはその断片における1つ以上のアミノ酸修飾(例えば、置換、欠失、付加、またはそれらの組み合わせ)を有する。いくつかの実施形態において、修飾された切断酵素は、配列番号13の番号付けに関して、位置126、188、189、190、191、192、196、238、302、306、307、310、525、528、546、604、650、651、665および/または692に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含み、配列番号17~19、23~28、もしくは31~39のうちのいずれかに対して少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を示すアミノ酸配列を含む。
いくつかの実施形態において、修飾された切断酵素は、配列番号13の番号付けに関して、位置183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、および/または202のうちのいずれか1つ以上に対応する、未修飾のDAP BII切断酵素またはその断片における1つ以上のアミノ酸修飾(例えば、置換、欠失、付加、またはそれらの組み合わせ)を有する。いくつかの実施形態において、修飾された切断酵素は、配列番号13の番号付けに関して、位置188、189、190、191、192、302、および/または310のうちのいずれか1つ以上に対応する、未修飾のDAP BII切断酵素またはその断片における1つ以上のアミノ酸修飾(例えば、置換、欠失、付加、またはそれらの組み合わせ)を有する。いくつかの実施形態において、修飾された切断酵素は、配列番号13の番号付けに関して、位置191、192、196、306、および/または650のうちのいずれか1つ以上に対応する、未修飾のDAP BII切断酵素またはその断片における1つ以上のアミノ酸修飾(例えば、置換、欠失、付加、またはそれらの組み合わせ)を有する。いくつかの実施形態において、修飾された切断酵素は、配列番号13の番号付けに関して、位置323~544のうちのいずれか1つ以上に対応する、未修飾のDAP BII切断酵素またはその断片における1つ以上のアミノ酸修飾(例えば、置換、欠失、付加、またはそれらの組み合わせ)を有する。いくつかの実施形態において、修飾された切断酵素は、配列番号13の番号付けに関して、位置310、651、655、および/または656のうちのいずれか1つ以上に対応する、未修飾のDAP BII切断酵素またはその断片における1つ以上のアミノ酸修飾(例えば、置換、欠失、付加、またはそれらの組み合わせ)を有する。いくつかの実施形態において、修飾された切断酵素は、配列番号13の番号付けに関して、位置627、628、630、648、651、655、および/または669のうちのいずれか1つ以上に対応する、未修飾のDAP BII切断酵素またはその断片における1つ以上のアミノ酸修飾(例えば、置換、欠失、付加、またはそれらの組み合わせ)を有する。
いくつかの実施形態において、修飾された切断酵素は、DAP BIIに由来し、ポリペプチドから単一の標識末端アミノ酸を除去するか、または除去するように構成される。いくつかの実施形態において、修飾された切断酵素は、配列番号13の番号付けに関して、位置126、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、238、302、306、307、310、525、528、546、604、627、628、630、648、650、651、655、656、665、669、および/または692のうちのいずれか1つ以上に対応する、未修飾のDAP BII切断酵素またはその断片における1つ以上のアミノ酸修飾(例えば、置換、欠失、付加、またはそれらの組み合わせ)を有する。
いくつかの実施形態において、修飾された切断酵素は、配列番号13の番号付けに関して、A126T、D188V、I189A、D190S、N191C、N191F、N191L、N191M、N191R、N191S、N191T、N191V、W192F、W192G、W192L、R196H、R196K、R196S、R196T、R196V、G238V、A302W、N306A、N306G、N306R、N306S、T307K、N310D、N310G、N310K、N310L、N525K、A528V、F546L、A604V、D650A、D650G、D650S、G651H、G651T、G651V、G651Y、S655G、S655T、V656E、V656G、V656S、K665I、およびK692N、またはその保存的アミノ酸置換からなる群から選択される1つ以上のアミノ酸置換を有する。いくつかの実施形態において、1つ以上のアミノ酸修飾は、N191M/W192G/R196V/N306R/D650A、D188V/I189A/D190S/N191L/W192G/R196S/A302W/N310K/D650A、N191M/W192G/R196T/N306R/T307K/D650A、N191M/W192G/R196T/N306R/N525K/A528V/A604V/D650A/K692N、A126T/N191M/W192G/R196T/G238V/N306R/D650A、N191M/W192G/R196T/N306R/F546L/D650A、N191M/W192G/R196T/N306R/D650A/G651V/K665I、N191M/W192G/R196T/N306R/D650A/G651V、N191C/W192L/R196K/N306R/N310D/G651Y/S655G/V656G、N191C/W192L/N306R/N310D/G651Y/S655G/V656G、N191F/W192F/N306R/N310G/G651H/V656E、N191R/W192L/N306S/N310L/G651T/S655T/V656S、N191S/R196H/N306A/D650G、N191T/R196H/N306A/D650G、N191M/R196H/N306A/D650G、N191V/N306A/D650S、またはN191S/N306G/D650Sである。
いくつかの実施形態において、修飾された切断酵素は、配列番号17~19、23~28、31~39のうちのいずれかに対して、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%同一性、少なくとも70%同一性、少なくとも80%同一性、もしくは少なくとも90%以上の同一性を有するアミノ酸配列、またはその特異的結合断片を有する。いくつかの実施形態において、特異的結合断片は、約10個のアミノ酸~約400個のアミノ酸、約10個のアミノ酸~約300個のアミノ酸、約10個のアミノ酸~約200個のアミノ酸、約10個のアミノ酸~約100個のアミノ酸、または約10個のアミノ酸~約50個のアミノ酸の範囲の長さを有する。いくつかの例において、修飾された切断酵素は、配列番号17~19、23~28、または31~39に規定されるアミノ酸置換のうちの1つ以上を含む。いくつかの特定の例において、修飾された切断酵素は、配列番号17~19、23~28、31~39のうちのいずれかに記載のアミノ酸の配列、もしくは配列番号17~19、23~28、31~39のうちのいずれかに対して少なくとも95%の配列同一性を示すアミノ酸の配列、またはその特異的結合断片を含む。いくつかの態様において、修飾された切断酵素は、配列番号13の番号付けに関して、位置188、189、190、191、192、196、302、306、310、および/または650に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含み、配列番号17~19、23~28、31~39のうちのいずれかに対して少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有するアミノ酸配列を有する。いくつかの態様において、修飾された切断酵素は、配列番号13の番号付けに関して、位置191、192、196、306、および/または650に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含み、配列番号17~19、23~28、もしくは31~39のうちのいずれかに対して少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有するアミノ酸配列を有する。いくつかの実施形態において、修飾された切断酵素は、配列番号17~19、23~28、または31~39の配列のうちのいずれか1つの基質特異性を有する。いくつかの実施形態において、修飾された切断酵素は、配列番号17~19、23~28、または31~39の配列のうちのいずれか1つの切断活性を有する。
いくつかの実施形態において、修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかの触媒ドメインと、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有する触媒ドメインを含むアミノ酸配列を有する。いくつかの実施形態において、修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかのアミン結合部位と、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有するアミン結合部位を含むアミノ酸配列を有する。いくつかの実施形態において、修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかのループドメインと、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有するループドメインを有する。
いくつかの特定の例において、所望の修飾された切断酵素は、ポリペプチドのP1またはP2位置の特定のアミノ酸に対して減少したバイアスを示し得る。いくつかの実施形態において、そのような修飾された切断酵素は、遺伝子選択において野生型または未修飾の酵素のP1またはP1ポケットを標的とすることによって得られ得る。場合によっては、配列番号13の番号付けに関して、残基N310、G651、S655、および/またはV656が、バイアスを低減するために標的とされ得る。場合によっては、配列番号13の番号付けに関して、残基N215、W216、R220、N330、および/またはD674が、バイアスを低減するために標的とされ得る。
表9はまた、例示的な修飾された切断酵素について、配列番号を参照して例示的な配列を提供する。いくつかの例において、修飾された切断酵素は、表9に規定されるアミノ酸置換のうちの1つ以上を含む。
Figure 2022526939000012
いくつかの実施形態において、除去されたアミノ酸は、化学試薬または酵素試薬によって標識または修飾される。例えば、標識されたアミノ酸は、単一の末端アミノ酸として、またはジペプチドの一部として除去される。いくつかの実施形態において、標識は、末端アミノ酸(例えば、N末端アミノ酸)のサイズ/形状を「模倣する」修飾因子または標識であるか、またはそれを含む。いくつかの実施形態において、除去されたアミノ酸は、アミノ酸(例えば、外因性アミノ酸)、修飾アミノ酸、アミノ酸の一部分、ブロックまたは保護されたアミノ酸、またはそれらの任意の組み合わせで標識される。いくつかの実施形態において、末端アミノ酸に付着した標識は、N末端ブロック(アルファアミンを欠いた)アミノ酸である。いくつかの実施形態において、ジペプチド切断酵素に由来する好適に操作または修飾された切断酵素を用いた好適な標識の選択は、単一の標識末端アミノ酸残基の除去を可能にする。いくつかの実施形態において、トリペプチド切断酵素に由来する好適に操作または修飾された切断酵素を用いた好適な標識の選択は、標識末端ジペプチドの切断を可能にする。いくつかの実施形態において、未修飾の切断酵素の活性部位および/またはアミノ酸結合部位(複数可)は、修飾される。いくつかの実施形態において、修飾された切断酵素は、その基質結合部位内、基質結合部位の境界、触媒ドメイン、P1もしくはP2ポケット、キモトリプシンフォールド、アミン結合部位、ループドメイン、またはそれらの組み合わせに、修飾または突然変異を含む。
いくつかの実施形態において、活性部位内で、標識-P1が、ペプチドの天然のP1-P2残基に取って代わり、その結果、修飾された切断酵素における切断は、P2とP3との間(天然のジペプチド切断酵素)ではなく、P1とP2との間(ジペプチド切断酵素に由来する修飾された切断酵素)で起こる(例えば、図1Aを参照)。いくつかの実施形態において、活性部位内で、標識-P1が、ペプチドまたはその一部分の天然のP1-P2-P3残基に取って代わり、その結果、修飾された切断酵素における切断は、P3とP4との間(天然のトリペプチド切断酵素)ではなく、P1とP2との間(トリペプチド切断酵素に由来する修飾された切断酵素)で起こる(例えば、図1Bを参照)。いくつかの実施形態において、活性部位内で、標識-P1-P2が、ペプチドまたはその一部分の天然のP1-P2-P3残基に取って代わり、その結果、修飾された切断酵素における切断は、P3とP4との間(天然のトリペプチド切断酵素)ではなく、P2とP3との間(トリペプチド切断酵素に由来する修飾された切断酵素)で起こる(例えば、図1Bを参照)。いくつかの実施形態において、修飾された切断酵素は、ジペプチド切断酵素(例えば、ジペプチジルペプチダーゼ、ジペプチジルアミノペプチダーゼ、ペプチジル-ジペプチダーゼ、またはジペプチジルカルボキシペプチダーゼ)に由来し、除去のためにジペプチドの1つの残基に適合する未修飾の切断酵素の空間のうちの1つは、代わりに標識(例えば、化学標識または化学修飾)に適合するように、修飾された切断酵素内に構成される。いくつかの実施形態において、修飾された切断酵素は、トリペプチド切断酵素(例えば、セドリジンまたはトリペプチジルペプチダーゼ)に由来し、除去のためにトリペプチドの1つまたは2つの残基に適合する未修飾の切断酵素の空間のうちの1つまたは2つは、代わりに標識(例えば、化学標識または化学修飾)に適合するように、修飾された切断酵素内に構成される。
いくつかの実施形態において、修飾された切断酵素は、切断酵素のキモトリプシンフォールドに、野生型の切断酵素ポリペプチドと比較して、アミノ酸突然変異(例えば、修飾、置換、欠失、付加、またはそれらの組み合わせ)を含む。いくつかの実施形態において、修飾された切断酵素は、アミン結合部位に、野生型の切断酵素ポリペプチドと比較して、アミノ酸突然変異(例えば、修飾、置換、欠失、付加、またはそれらの組み合わせ)を含む。いくつかの実施形態において、修飾された切断酵素は、ループドメインに、野生型の切断酵素ポリペプチドと比較して、アミノ酸突然変異(例えば、修飾、置換、欠失、付加、またはそれらの組み合わせ)を含む。いくつかの態様において、修飾された切断酵素は、修飾された切断酵素の活性部位へのアクセス可能性を改善するために、野生型の切断酵素ポリペプチドと比較して、アミノ酸突然変異(例えば、修飾、置換、欠失、付加、またはそれらの組み合わせ)を含む。場合によっては、修飾された切断酵素が示す活性部位への基質(例えば、ポリペプチド)のアクセス可能性は、未修飾の切断酵素と比べて大きい。例えば、修飾された切断は、より大きな基質が活性部位にアクセスすることを可能にし得る。
いくつかの実施形態において、修飾された切断酵素は、野生型の切断酵素ポリペプチドと比較して、切断酵素の活性部位もしくは触媒ドメイン、または切断酵素の結合ポケットに、アミノ酸突然変異(例えば、修飾、置換、欠失、付加、またはそれらの組み合わせ)を含む。いくつかの実施形態において、修飾された切断酵素は、野生型の切断酵素ポリペプチドと比較して、切断酵素のヒンジ領域にアミノ酸突然変異(例えば、修飾、置換、欠失、付加、またはそれらの組み合わせ)を含む。いくつかの実施形態において、修飾された切断酵素は、野生型の切断酵素ポリペプチドと比較して、切断酵素の結合溝にアミノ酸突然変異を含む。場合によっては、修飾された切断酵素は、野生型の切断酵素ポリペプチドと比較して、切断酵素の葉間溝(inter-lobe cleft)にアミノ酸変異を含む。いくつかの実施形態において、修飾された切断酵素は、野生型の切断酵素ポリペプチドと比較して、切断酵素のアルファアミン結合領域にアミノ酸突然変異を含む。例えば、修飾された切断酵素は、野生型の切断酵素ポリペプチドと比較して、アルファアミン結合が減少している。例えば、Kumar et al.,Sci Rep.(2016)6:23787を参照のこと。
いくつかの実施形態において、修飾された切断酵素は、未修飾の切断酵素と比較して、活性、基質結合能力、または切断特性が改変される。いくつかの実施形態において、修飾された切断酵素は、未修飾の切断酵素の触媒モチーフまたは触媒ドメイン(例えば、配列番号1に記載のHEXXGH触媒モチーフ)が修飾される。いくつかの実施形態において、突然変異、例えば、1つ以上のアミノ酸修飾(例えば、置換、欠失、付加)は、配列番号5の番号付けに関して、位置316、391、または394に対応する。いくつかの実施形態において、突然変異、例えば、1つ以上のアミノ酸修飾(例えば、置換、欠失、付加)は、配列番号5の番号付けに関して、アミノ酸残基の位置419、420、421、422、423、424、425、426、またはそれらの組み合わせに対応する。
いくつかの実施形態において、未修飾の切断酵素は、メタロペプチダーゼである。いくつかの実施形態において、修飾された切断酵素は、メタロペプチダーゼである。いくつかの実施形態において、修飾された切断酵素は、亜鉛依存性メタロペプチダーゼまたは亜鉛依存性ヒドロラーゼであるか、またはそれに由来する。いくつかの既知のメタロペプチダーゼは、従来の触媒シグネチャーモチーフHEXXHの存在を特徴とする。いくつかの態様において、HEXXHモチーフの2つのHis残基は、二価金属イオン(例えば、Zn2+、Mn2+、Co2+、Ni2+、Cu2+)の配位に寄与する。例えば、修飾された切断は、活性化のために特定の金属イオン(例えば、亜鉛イオン、塩化物イオン)の存在またはそれらとの接触を必要とする。いくつかの実施形態において、修飾された切断酵素の機能は、金属イオンの存在もしくは不在によって、または金属キレート剤と接触することによって調節または制御することができる。
いくつかの実施形態において、修飾された切断酵素は、未修飾の切断酵素と比較して、特定の基質に対する結合親和性および/または特異性が改変される。例えば、修飾された切断酵素は、未修飾の切断酵素と比較して、標識末端アミノ酸に対する結合親和性および/または特異性の増加を示す。いくつかの実施形態において、修飾された切断酵素は、未修飾の切断酵素と比較して、基質に対する結合親和性および/または特異性の低下を示す。いくつかの実施形態において、修飾された切断酵素は、結合速度、加水分解速度、放出速度などの1つ以上の所望の特徴を示す。いくつかの実施形態において、修飾された切断酵素は、所望の速度でポリペプチドから除去または放出され得る。
そのような実施形態のいくつかにおいて、修飾された切断酵素との反応は、修飾された切断酵素を標識末端アミノ酸に動員することによって増強することができる。例えば、1つ以上の修飾された切断酵素は、相補的なユニバーサルプライミング配列、修飾された切断酵素に関連するDNAタグまたは配列、および修飾された切断酵素で処理されるポリペプチドに関連するDNAタグまたは配列のハイブリダイゼーションによって、ポリペプチドの標識末端アミノ酸に動員され得る。このハイブリダイゼーションステップは、標識末端アミノ酸(例えば、NTAA)に対する、修飾された切断酵素の有効な親和性を改善し得る。場合によっては、標識末端アミノ酸は、除去された後、拡散する場合があり、ハイブリダイズしたDNAタグを剥がすことにより、関連する修飾された切断酵素を除去することができる。
いくつかの実施形態において、修飾された切断酵素は、アンカー配列に付着する。場合によっては、修飾された切断は、直接的または間接的にアンカー配列に結合する。場合によっては、アンカー配列は、ポリペプチドに付着した配列に相補的である。いくつかの実施形態において、アンカー配列は、ユニバーサル配列またはユニバーサルDNAタグである。いくつかの実施形態において、ポリペプチドはまた、普遍的な配列に付着する。いくつかの例では、修飾された切断酵素上のアンカー配列は、酵素をポリペプチドに近接させる。いくつかの実施形態において、アンカー配列は、酵素を近接させるか、または修飾された切断酵素をポリペプチドに共局在化させる。いくつかの実施形態において、修飾された切断酵素およびポリペプチドのこの共局在化は、前述のポリペプチドからの単一の標識アミノ酸もしくはジペプチドの結合および/または除去を助ける。
本明細書に規定される実施形態のいずれかにおいて、ポリペプチドの末端アミノ酸への1つ以上の修飾された切断酵素の動員は、キメラ修飾切断酵素およびキメラ末端アミノ酸修飾因子を介して増強され得る。キメラ修飾切断酵素およびキメラ末端アミノ酸(例えば、NTAA)修飾因子は各々、互いに結合反応することができる部分(例えば、ビオチン-ストレプトアビジン)を含む。例えば、修飾された切断酵素は、低親和性酵素(>μM Kd)であり得、ストレプトアビジン-キメラ修飾切断酵素を使用して、ビオチンに関連する標識NTAAに動員される。場合によっては、ビオチン-ストレプトアビジン相互作用の結果として有効な局所濃度が増加するため、修飾された切断酵素が標識末端アミノ酸(複数可)を除去する効率が改善され得る。場合によっては、このアプローチにより、親和性KDがμMからサブピコモルへと効果的に増加する。他の多くのバイオ共役募集戦略も採用することができる。アジド修飾PITCは市販されており(4-アジドフェニルイソチオシアネート、Sigma)、アルキン-ビオチンとのクリック化学反応を介して、アジド-PITCの、ビオチン-PITCなどの他のPITCのバイオ共役体への、多数の単純な変換を許容する。いくつかの態様において、標識末端アミノ酸は、除去された後、ポリペプチドからの関連する修飾された切断酵素と共に拡散する場合がある。
いくつかの実施形態において、修飾された切断酵素は、単一のポリペプチド鎖、または少なくとも2つのポリペプチド鎖の多量体(二量体またはより高次の多量体)であり得る。したがって、単量体、二量体、およびより高次の多量体修飾切断酵素ポリペプチドは、定義された用語の範囲内にある。多量体ポリペプチドは、(同一のポリペプチド鎖の)ホモ多量体または(同一でないポリペプチド鎖の)ヘテロ多量体であり得る。いくつかの実施形態において、修飾された切断酵素は、単量体酵素である。いくつかの実施形態において、修飾された切断酵素は、融合分子またはキメラ分子である。例えば、修飾された切断酵素は、リンカーを介して直接的または間接的にオリゴヌクレオチドに付着または会合され得る。いくつかの特定の場合において、修飾された切断酵素は、SpyTag/SpyCatcherまたはSnoopTag/SnoopCatcherなどの部分に接合され得る。
A.標識末端アミノ酸
いくつかの実施形態において、修飾された切断酵素によって除去されたペプチドの末端アミノ酸は、標識または修飾される。標識は、任意の好適な材料または部分を含むことができる。タンパク質、アミノ酸、核酸、炭水化物、化学部分、および小分子を含む、任意の好適な分子または材料を、この目的のために用いることができる。いくつかの実施形態において、好適な標識は、修飾された切断酵素の結合ポケットに適合することができる。いくつかの態様において、末端アミノ酸の標識は、核酸適合性である方式で実行される(例えば、標識は、核酸に損傷を与えない方式で実行される)。いくつかの実施形態において、好適な標識は、修飾された切断酵素が、ポリペプチドから単一の標識末端アミノ酸残基またはジペプチドを除去することを可能にする。ポリペプチドの末端アミノ酸は、任意の好適な方法によって標識することができる。いくつかの例では、末端アミノ酸は、化学的または酵素的に標識される。いくつかの実施形態において、末端アミノ酸は、化学薬品、酵素、および/または生物学的薬剤であるか、またはそれらを含む試薬によって標識される。場合によっては、末端アミノ酸は、化学標識または部分で標識される。いくつかの例では、末端アミノ酸は、ブロックアミノ酸または修飾アミノ酸で標識される。
いくつかの実施形態において、前駆体ポリペプチド(例えば、未標識ポリペプチド)は、前駆体ポリペプチドの末端アミノ酸を標識するための試薬と接触し、修飾された切断酵素での処理のために調製されたポリペプチドを提供する。場合によっては、前駆体ポリペプチドと末端アミノ酸を標識するための試薬との接触は、ポリペプチドを、修飾された切断酵素と接触させる前に行われる。いくつかの態様において、修飾された切断酵素を、標識または修飾されたポリペプチドと接触させる。場合によっては、前駆体ポリペプチドと末端アミノ酸を標識するための試薬との接触、およびポリペプチドと修飾された切断酵素との接触は、同時にまたは実質的に同時に実行される。
1.化学標識
いくつかの実施形態において、修飾された切断酵素による除去されるアミノ酸は、化学標識で標識される。いくつかの例では、修飾された切断酵素によって除去されるアミノ酸は、化学試薬で標識される。いくつかの態様において、化学試薬で処理することによる末端アミノ酸の標識は、核酸適合性である方式で実行される(例えば、標識は、核酸に損傷を与えない条件下で実行される)。
いくつかの実施形態において、修飾された切断酵素は、ポリペプチド上の化学的に修飾または標識された(例えば、PTC/DNP/アセチル/Cbz修飾または標識された)アミノ酸などの、標識アミノ酸を除去する。場合によっては、除去されたアミノ酸は、単一の標識末端アミノ酸である。場合によっては、除去されたアミノ酸は、末端ジペプチドの一部である。いくつかの実施形態において、修飾された切断酵素(例えば、ジペプチド切断酵素)は、標識として存在するPTC/DNP/アセチル/Cbz基を有するN末端アミノ酸を除去する。
いくつかの実施形態において、修飾された切断酵素によって除去されるアミノ酸は、単一の末端アミノ酸、または切断酵素によって除去されるジペプチドの末端アミノ酸であり得、フェニルイソチオシアネート(PITC)、ニトロ-PITC、スルホ-PITC、フェニルイソチオシア(PIC)、ニトロ-PIC、スルホ-PIC、ベンジルオキシカルボニルクロリドもしくはカルボベンゾキシクロリド(Cbz-Cl)、N-(ベンジルオキシカルボニルオキシ)スクシンイミド(Cbz-OSuもしくはCbz-O-NHS)、カルボキシル活性化アミノブロックアミノ酸(例えば、Cbz-アミノ酸-OSu)、1-フルオロ-2,4-ジニトロベンゼン(サンガー試薬、DNFB)、ダンシルクロリド(DNS-Cl、もしくは1-ジメチルアミノナフタレン-5-スルホニルクロリド)、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)、無水物、2-ピリジンカルボキサルデヒド、2-ホルミルフェニルボロン酸、2-アセチルフェニルボロン酸、1-フルオロ-2,4-ジニトロベンゼン、4-クロロ-7-ニトロベンゾフラザン、ペンタフルオロフェニルイソチオシアネート、4-(トリフルオロメトキシ)-フェニルイソチオシアネート、4-(トリフルオロメチル)-フェニルイソチオシアネート、3-(カルボン酸)-フェニルイソチオシアネート、3-(トリフルオロメチル)-フェニルイソチオシアネート、1-ナフチルイソチオシアネート、N-ニトロイミダゾール-1-カルボキシミダミド、N,N’-ビス(ピバロイル)-1H-ピラゾール-1-カルボキサミジン、N,N’-ビス(ベンジルオキシカルボニル)-1H-ピラゾール-1-カルボキサミド、アセチル化試薬、グアニジニル化試薬、チオアシル化試薬、チオアセチル化試薬、チオベンジル化試薬、二複素環メタニミン試薬、またはそれらの誘導体からなる群から選択される試薬で標識される。
いくつかの実施形態において、修飾された切断酵素によって除去される末端アミノ酸は、切断酵素によって除去されるジペプチドの末端アミンであり得、その無水物または誘導体で標識される。いくつかの実施形態において、修飾された切断酵素により除去されるアミノ酸を標識するための試薬は、S-アセチルメルカプトコハク酸無水物、シス-アコニチン酸無水物、4-アミノ-1,8-ナフタリン酸無水物、エンド-ビシクロ[2.2.2]オクト-5-エン-2,3-ジカルボン酸無水物、5-ブロモイサト酸無水物、ブロモマレイン酸無水物、4-ブロモ-1,8-ナフタル酸無水物、シトラコン無水物、クロトン酸無水物、トランス-1,2-シクロヘキサンジカルボン酸無水物、1-シクロペンテン-1,2-ジカルボン酸無水物、2,3-ジクロロマレイン酸無水物、3,6-ジクロロフタル酸無水物、3,6-ジフルオロフタル酸無水物、ジグリコール酸無水物、2,2-ジメチルグルタル酸無水物、3,3-ジメチルグルタル酸無水物、2,3-ジメチルマレイン酸無水物、2,2-ジメチルコハク酸無水物、(2-ドデセン-1-イル)コハク酸無水物、ドデセニルコハク酸無水物、グルタル酸無水物、ヘキサフルオログルタル酸無水物、ヘキサヒドロ-4-メチルフタル酸無水物、ホモフタル酸無水物、3-ヒドロキシフタル酸無水物、イタコン酸無水物、マレイン酸無水物、3-メチルグルタル酸無水物、N-メチルイサト酸無水物、メチルコハク酸無水物、1,8-ナフタル酸無水物、3-ニトロ-1,8-ナフタル酸無水物、4-ニトロ-1,8-ナフタル酸無水物、3-ニトロフタル酸無水物、4-ニトロフタル酸無水物、2-オクテン-1-イルコハク酸無水物、2,5-オキサゾリジンジオン、2-フェニルグルタル酸無水物、フェニルマレイン酸無水物、フェニルコハク酸無水物、N-フタロイル-DL-グルタミン酸無水物、2,3-ピラジンジカルボン酸無水物、3,4-ピリジンジカルボン酸無水物、コハク酸無水物、4-スルホ-1,8-ナフタル酸無水物、テトラブロモフタル酸無水物、テトラクロロフタル酸無水物、テトラフルオロフタル酸無水物、3,4,5,6-テトラヒドロフタル酸無水物、3,3-テトラメチレングルタル酸無水物、トリメリット酸無水物クロリド、および2-(トリフェニルホスホラニリデン)コハク酸無水物からなる群から選択される。例えば、Staiger et al.,J.Org.Chem.1959,24,9,1214-1219;Jiang et al.J.Org.Chem.2019,84,4,2022-2031;米国特許第9,867,883号を参照のこと。
いくつかの例では、本発明の修飾された切断酵素での処理のための調製において、ポリペプチドは、イサト酸無水物、イソニコチン酸無水物、アザイサト酸無水物、コハク酸無水物、またはこれらのうちの1つの誘導体を含む化学試薬で処理され、ポリペプチドの末端アミノ酸は、化学試薬によって修飾または標識される。本発明の修飾された切断酵素で処理されるポリペプチドの末端アミノ酸の標識の特定の例としては、以下が挙げられる:
Figure 2022526939000013
式中、
~Gは、CH、CX、およびNからそれぞれ独立して選択され、
各出現におけるXは、独立してC~Cアルキル、NO、C~Cハロアルキル、C~Cハロアルコキシ、ハロ、-OR、-N(R、-SR、SO、SO、-B(OR、C(=O)R、CN、CON(R、-COOR、-C(-O)Ar、およびテトラゾールから選択され、
Rは、アミノ酸の側鎖、例えば、20個の一般的なアミノ酸の側鎖のうちの1つを表し、
は、H、R、C(-O)R、-C(=O)N(R、-C(=O)Ar、および-SON(Rから選択され、
は、各出現において独立して、HおよびC~Cアルキルから選択され、
は、各出現において独立して、C~Cアルキルから選択され、
Arは、各出現で独立して、フェニル、ピリジニル、ピリミジニル、ピリダジニル、およびピラジニルから選択され、これらはそれぞれ、ハロ、CN、NO、C~Cアルキル、C~Cハロアルキル、C~Cハロアルコキシ、および-ORから選択される1つまたは2つの基によって置換されてもよく、
PPは、ポリペプチドの一部分、特に、N末端アミノ酸を除く本発明の修飾された切断酵素での処理のために調製されているポリペプチドの部分を表す。したがって、式(C)の化合物は、典型的には、本発明の方法で使用するためのポリペプチドであり、Rは、ポリペプチドの末端アミノ酸の側鎖を表す。
好ましい実施形態において、式(C)に示される末端アミノ酸は、RがHではない場合、L配置にある。
式(B)の化合物は、本明細書に記載の修飾された切断酵素反応で使用するために調製されているポリペプチド(標識ポリペプチドと呼ばれる場合もある)である。
いくつかの態様において、修飾された切断酵素による除去のためのアミノ酸は、イサト酸無水物、イソニコチン酸無水物またはアザイサト酸無水物、特に本明細書に記載の式(A)の化合物に由来する例示的な試薬で標識される。いくつかの実施形態において、修飾された切断酵素による除去のためのアミノ酸は、N-メチル-イサト酸無水物、N-アセチル-イサト酸無水物、4-カルボン酸イサト酸無水物、5-メトキシ-イサト酸無水物、5-ニトロ-イサト酸無水物、4-クロロ-イサト酸無水物、4-フルオロ-イサト酸無水物、6-フルオロ-イサト酸無水物、N-ベンジル-イサト酸無水物、4-トリフルオロメチル-イサト酸無水物、5-トリフルオロメチル-イサト酸無水物、4-ニトロ-イサト酸無水物、4-メトキシ-イサト酸無水物、および5-アミノ-2-フルオロ-イソニコチン無水物(6-フルオロ-1H-ピリド[3,4-d][1,3]オキサジン-2,4-ジオン)、またはそれらの誘導体からなるリストから選択される例示的な試薬で標識される。いくつかの例において、本発明の修飾された切断酵素の作用によって除去される標識アミノ酸またはジペプチドは、置換されてもよいベンズアミド、典型的には、本明細書に記載された式(B)の化合物を含む、本明細書に開示された置換されてもよいイサト酸無水物のうちのいずれかに由来するものを含む。
本発明の他の好ましい実施形態では、本発明の修飾された切断酵素での処理のための調製において、ポリペプチドは、コハク酸無水物、フタル酸無水物、ピラジンジカルボン酸無水物、またはこれらのうちの1つの誘導体を含む化学試薬で処理され、末端アミノ酸は、化学試薬によって修飾または標識される。
本発明の修飾された切断酵素で処理されるポリペプチドの末端アミノ酸を標識するための反応の追加の特定の例としては、以下が挙げられる:
Figure 2022526939000014
式中、
nは、0または1であり、
環Cyは、存在しなくても、存在してもよい5員もしくは6員の環、または8~10員の二環式環を表し、存在する場合、環Cyは、飽和、不飽和、または芳香族であってもよく、破線の結合は、単結合、二重結合、または芳香族結合であってもよく、
Cyが存在する場合、Cyは、炭素環であっても、環員としてN、O、およびSから選択される1つまたは2つのヘテロ原子を含有してもよく、
環Cyが存在する場合、環Cyは、ハロ、CN、NO、C~Cアルキル、C~Cハロアルキル、C~Cハロアルコキシ、および-ORから選択される1~6個の基(またはCyが芳香族の場合は1~4個の基)で置換されてもよく、
環Cyが存在しない場合、破線の結合は、単結合または二重結合であってもよく、破線の結合は、ハロ、CN、C~Cアルキル、C~Cハロアルキル、C~Cハロアルコキシ、CO、および-ORから選択される1つまたは2つの基で置換されてもよく、
Rは、アミノ酸の側鎖、例えば、20個の一般的なアミノ酸の側鎖のうちの1つを表し、
は、独立して、各出現において、H、C~Cアルキル、およびC~Cハロアルキルから選択され、
は、独立して、各出現において、H、ハロ、C~Cアルキル、C~Cハロアルキル、C~Cアルコキシ、およびC~Cハロアルコキシから選択され、
PPは、ポリペプチドの一部分、特に、N末端アミノ酸を除く本発明の修飾された切断酵素での処理のために調製されているポリペプチドの部分を表す。したがって、式(C)の化合物は、典型的には、本発明の方法で使用するためのポリペプチドであり、Rは、ポリペプチドの末端アミノ酸の側鎖を表す。
式(D)のこれらの試薬の好ましい実施形態において、nが1である場合、環Cyは存在しない。式(D)の化学試薬の追加の好ましい実施形態において、環Cyが存在し、フェニル環または2,3-ピラジン環であり、これらは各々、上記のように置換されてもよく、nは0である。
好ましい実施形態において、式(C)に示される末端アミノ酸は、RがHではない場合、L配置にある。
式(E)の化合物は、本明細書に記載の修飾された切断酵素反応で使用するために調製されているポリペプチド(標識ポリペプチドと呼ばれる場合もある)である。
いくつかの実施形態において、修飾された切断酵素による除去のためのアミノ酸は、コハク酸無水物に由来する例示的な試薬、または、環Cyが存在せず、破線の結合が単結合を表す式(D)の化合物で標識される。いくつかの実施形態において、試薬は、3,6,ジフルオロフタル酸無水物、2,3ピラジンジカルボン酸無水物、またはコハク酸無水物である。いくつかの例では、除去された標識アミノ酸またはジペプチドは、4-カルボキシブチルアミドを含む。
いくつかの実施形態において、本発明の修飾された切断酵素による処理のための調製において、ポリペプチドは、ポリペプチドのN末端のα-アミンとアミド結合を形成することができる任意の好適な化学試薬で処理される。多数の化学試薬がポリペプチドの末端アミンと反応して、ポリペプチドを修飾に連結するアミド結合を有する修飾ポリペプチドを形成する。このN末端修飾ポリペプチドは、修飾された切断酵素の基質となり得る。アミンと反応してアミド結合を形成する化学試薬は、ペプチドカップリングの分野から知られており、ハロゲン化アシル(塩化物、フッ化物、臭化物)、アシルイミダゾール、O-アシルイソ尿素、活性化エステル[N-ヒドロキシスクシンイミド(NHSまたはHOSu)、N-ヒドロキシスルホスクシンイミド(スルホ-NHS)p-ニトロフェニル(PNP)、ペンタフルオロフェニル(Pfp)、4-スルホ-2,3,5,6,-テトラフルオロフェニル、2,4,5-トリクロロフェノール、N-ヒドロキシ-5-ノルボルネン-2,3-ジカルボキシイミド(HONB)、3-ヒドロキシ-4-オキソ-3,4-ジヒドロ-1,2,3-ベンゾトリアジン(HODhbt)、ヒドロキシベンゾトリアゾール(HOBt)、1-ヒドロキシ-7-アザベンゾトリアゾール(HOAt)、1-ヒドロキシ-1H-1,2,3-トリアゾール-4-カルボキシレート(HOCt)]、エチル(2Z)-2-シアノ-2-ヒドロキシイミノアセテート(Oxyma)]、アルキルエステル、カルボジイミドなど(Bioconjugation Techniques,Academic Press;Montalbetti et al.,(2005)Tetrahedron 61:10827-10852;Montalbetti et al.,Wiley Encyclopedia of Chemical Biology:1-17.de Figueiredo et al.,(2016)Chem Rev 116(19):12029-12122(その各々は参照によりそれらの全体が本明細書に組み込まれる))を含むが、これらに限定されない。N末端修飾は、酵素的方法を介してポリペプチドに連結するアミド結合を用いて導入することもできる(Philpott et al.,(2018)Green Chemistry 20(15):3426-3431(その全体が参照により本明細書に組み込まれる))。ポリペプチドをPNPエステルで標識する例は、以下の条件下でポリペプチドを標識するために使用され得る4-ニトロフェニルアントラニレートを備える:4-ニトロフェノールアントラニレート(PNPA)を100mMでDMSOに溶解し、1XPBS(pH8.5)中1mMのペプチドまたは10%DMSO中100mMのNaHCO炭酸緩衝液(pH8.5)と共に、PNPAを10mMで、37℃にて1時間使用する。生成された結果のペプチド産物は、イサト酸無水物でペプチドを標識するのと同等であり、表11に示すように、修飾された切断酵素(例えば、DAP BIIに由来)の基質として好適な2-アミノベンズアミドで修飾されたペプチドを生成する。
いくつかの例では、本発明の修飾された切断酵素での処理のための調製において、ポリペプチドは、アミン保護された活性化エステルを含む化学試薬で処理されてアミド結合を形成し、ポリペプチドの末端アミノ酸は、化学試薬によって修飾または標識される。次に、この修飾ポリペプチドをさらに適切に処理して、指定された保護基を除去し、修飾された切断酵素で処理するための修飾ポリペプチドを得ることができる。
本発明の修飾された切断酵素で処理されるポリペプチドの末端アミノ酸の標識の特定の例としては、以下が挙げられる:
Figure 2022526939000015
式中、
~Gは、CH、CX、およびNから各々独立して選択され、
各出現におけるXは、独立してC~Cアルキル、NO、C~Cハロアルキル、C~Cハロアルコキシ、ハロ、-OR、-N(R、-SR、SO、SO、-B(OR、C(=O)R、CN、CON(R、-COOR、-C(-O)Ar、およびテトラゾールから選択され、
Rは、アミノ酸の側鎖、例えば、20個の一般的なアミノ酸の側鎖のうちの1つを表し、
は、H、R、C(-O)R、-C(=O)N(R、-C(=O)Ar、および-SON(Rから選択され、
は、各出現において独立して、HおよびC~Cアルキルから選択され、
は、各出現において独立して、C~Cアルキルから選択され、
Arは、各出現で独立して、フェニル、ピリジニル、ピリミジニル、ピリダジニル、およびピラジニルから選択され、これらは各々、ハロ、CN、NO、C~Cアルキル、C~Cハロアルキル、C~Cハロアルコキシ、および-ORから選択される1つまたは2つの基によって置換されてもよく、
Lは、ハロ、N-ヒドロキシスクシンイミド(NHS)、N-ヒドロキシベンゾトリアゾール、スルホN-ヒドロキシスクシンイミド(スルホNHS)、2,3,4,5,6-ペンタフルオロフェノール(pFP)、4-スルホ-2,3,5,6-テトラフルオロフェノール、クロロ、4-ニトロフェノール、および-O(C=)-O-(C1~6アルキル)から選択される脱離基であり、
任意選択的に、-NR-PGは、-Nで置き換えることができ、
PGは、Hまたは窒素保護基であり、tert-ブチルオキシカルボニル(Boc)、2,2,2-トリクロロエトキシカルボニル(Troc)、2-(トリメチルシリル)エトキシカルボニル(Teoc)、カルボキシルベンジル(Cbz)、パラ-ニトロカルボキシルベンジル(p-NOCbz)、アリルオキシカルボニル(Alloc)、9-フルオレニルメトキシカルボニル(Fmoc)、パラ-アジドカルボキシルベンジル(p-NCbz)、2,2,6,6-テトラメチルピペリジン-1-イルオキシカルボニル(Tempoc)、およびその他のN保護基から選択され得る。
いくつかの例では、本発明の修飾された切断酵素での処理のための調製において、ポリペプチドは、4-ニトロフェニルアントラニレートで処理される。
いくつかの実施形態において、修飾された切断酵素による除去のためにアミノ酸を修飾または標識するための化学試薬は、本明細書に記載の式(A)もしくは(D)の化合物のうちのいずれか1つ以上、またはその塩もしくは共役体である。
いくつかの実施形態において、修飾された切断酵素による除去のためにアミノ酸を修飾または標識するための化学試薬は、本明細書に記載の式(I)、(II)、(III)、(IV)もしくは(AB)の化合物のうちのいずれか1つ以上、またはその塩もしくは共役体である。
いくつかの実施形態において、修飾された切断酵素による除去のためにアミノ酸を修飾または標識するための試薬は、式(I):
Figure 2022526939000016
の化合物からなる群から選択される化合物、またはその塩もしくは共役体を含み、
式中、
およびRは、各々独立して、H、C1~6アルキル、シクロアルキル、-C(O)R、-C(O)OR、または-S(O)であり、
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリール、またはヘテロアリールであり、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリール、およびヘテロアリールは、各々非置換であるか、または置換されており、
は、ヘテロアリール、-NRC(O)OR、または-SRであり、ヘテロアリールは、非置換であるか、または置換されており、
、R、およびRは、各々独立して、HまたはC1~6アルキルである。
いくつかの実施形態において、R
Figure 2022526939000017
である場合、RおよびRは、いずれもHではない。式(I)のいくつかの実施形態において、RおよびRは、いずれもHである。いくつかの実施形態において、RもRも、Hではない。いくつかの実施形態において、RおよびRの一方は、C1~6アルキルである。いくつかの実施形態において、RおよびRの一方は、Hであり、他方は、C1~6アルキル、シクロアルキル、-C(O)R、-C(O)OR、または-S(O)である。いくつかの実施形態において、RおよびRの一方または両方は、C1~6アルキルである。いくつかの実施形態において、RおよびRの一方または両方は、シクロアルキルである。いくつかの実施形態において、RおよびRの一方または両方は、-C(O)Rである。いくつかの実施形態において、RおよびRの一方または両方は、-C(O)ORである。いくつかの実施形態において、RおよびRの一方または両方は、-S(O)である。いくつかの実施形態において、RおよびRの一方または両方は、-S(O)であり、Rは、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリール、またはヘテロアリールである。いくつかの実施形態において、Rは、
Figure 2022526939000018
である。いくつかの実施形態において、Rは、
Figure 2022526939000019
である。いくつかの実施形態において、RおよびRは、いずれも
Figure 2022526939000020
である。いくつかの実施形態において、RまたはRは、
Figure 2022526939000021
である。
式(I)の化合物のいくつかの実施形態において、Rは、単環式ヘテロアリール基である。式(I)のいくつかの実施形態において、Rは、5員または6員の単環式ヘテロアリール基である。式(I)のいくつかの実施形態において、Rは、1つ以上のNを含む5員または6員の単環式ヘテロアリール基である。好ましくは、Rは、ピラゾール、イミダゾール、トリアゾールおよびテトラゾールから選択され、ピラゾール、イミダゾール、トリアゾールまたはテトラゾール環の窒素原子を介して式(I)のアミジンに連結され、Rは、ハロ、C1~3アルキル、C1~3ハロアルキルおよびニトロから選択される基で置換されてもよい。いくつかの実施形態において、Rは、
Figure 2022526939000022
であり、式中、Gは、N、CHまたはCXであり、Xは、ハロ、C1~3アルキル、C1~3ハロアルキルまたはニトロである。いくつかの実施形態において、Xが、Me、F、Cl、CFまたはNOである場合、Rは、
Figure 2022526939000023
であるか、または。いくつかの実施形態において、Rは、
Figure 2022526939000024
であり、式中、Gは、NまたはCHである。いくつかの実施形態において、Rは、
Figure 2022526939000025
である。いくつかの実施形態において、Rは、二環式ヘテロアリール基である。いくつかの実施形態において、Rは、9員または10員の二環式ヘテロアリール基である。いくつかの実施形態において、Rは、
Figure 2022526939000026
である。
いくつかの実施形態において、式(I)の化合物は、
Figure 2022526939000027
である。いくつかの実施形態において、式(I)の化合物は、
Figure 2022526939000028
である。
いくつかの実施形態において、式(I)の化合物は、
Figure 2022526939000029
からなる群から選択され、任意選択的に、
Figure 2022526939000030
(N-Boc、N’-トリフルオロアセチル-ピラゾールカルボキサミジン、N,N’-ビスアセチル-ピラゾールカルボキサミジン、N-メチル-ピラゾールカルボキサミジン、N,N’-ビスアセチル-N-メチル-ピラゾールカルボキサミジン、N,N’-ビスアセチル-N-メチル-4-ニトロ-ピラゾールカルボキサミジン、およびN,N’-ビスアセチル-N-メチル-4-トリフルオロメチル-ピラゾールカルボキサミジン)、またはこれらのうちのいずれかの塩もしくは共役体を含む。
いくつかの実施形態において、化学試薬は、向山試薬(2-クロロ-1-メチルピリジニウムヨージド)をさらに含む。いくつかの実施形態において、試薬は、式(I)の少なくとも1つの化合物および向山試薬を含む。
いくつかの実施形態では、シアナミド誘導体を含む化学試薬を使用して、ポリペプチドの1つ以上のアミノ酸を標識する。(例えば、Kwon et al.,Org.Lett.2014,16,6048-6051(その全体が参照により組み込まれる)を参照)。
いくつかの実施形態において、化学試薬は、式(II):
Figure 2022526939000031
の化合物からなる群から選択される化合物、またはその塩もしくは共役体を含み、
式中、
は、H、C1~6アルキル、シクロアルキル、-C(O)R、または-C(O)ORであり、
は、H、C1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、またはアリールアルキルであり、C1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、およびアリールアルキルは、各々非置換であるか、または置換される。
いくつかの実施形態では、イソチオシアネート誘導体を含む試薬を使用して、ポリペプチドの末端アミノ酸(例えば、NTAA)を標識する。(例えば、Martin et al.,Organometallics.2006,34,1787-1801(その全体が参照により組み込まれる)を参照)。
いくつかの実施形態において、化学試薬は、式(III):
・N=C=S (III)
の化合物、またはその塩もしくは共役体からなる群から選択される化合物を含み、
式中、
は、C1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクリル、アリールまたはヘテロアリールであり、
1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクリル、アリールまたはヘテロアリールは、各々非置換であるか、またはハロ、-NR、-S(O)、またはヘテロシクリルからなる群から選択される1つ以上の基で置換されており、
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリール、またはヘテロアリールであり、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリール、およびヘテロアリールは、各々非置換であるか、または置換される。
式(III)のいくつかの実施形態においてRは、置換フェニルである。いくつかの実施形態において、Rは、ハロ、-NR、-S(O)、またはヘテロシクリルから選択される1つ以上の基で置換された置換フェニルである。いくつかの実施形態において、Rは、非置換C1~6アルキルである。いくつかの実施形態において、Rは、置換C1~6アルキルである。いくつかの実施形態において、Rは、ハロ、-NR、-S(O)またはヘテロシクリルから選択される1つ以上の基で置換された、置換C1~6アルキルである。いくつかの実施形態において、Rは、非置換C2~6アルケニルである。いくつかの実施形態において、Rは、C2~6アルケニルである。いくつかの実施形態において、Rは、ハロ、-NR、-S(O)またはヘテロシクリルから選択される1つ以上の基で置換された、置換C2~6アルケニルである。いくつかの実施形態において、Rは、非置換アリールである。いくつかの実施形態において、Rは、置換アリールである。いくつかの実施形態において、Rは、ハロ、-NR、-S(O)またはヘテロシクリルから選択される1つ以上の基で置換されたアリールである。いくつかの実施形態において、Rは、非置換シクロアルキルである。いくつかの実施形態において、Rは、置換シクロアルキルである。いくつかの実施形態において、Rは、ハロ、-NR、-S(O)またはヘテロシクリルから選択される1つ以上の基で置換されたシクロアルキルである。いくつかの実施形態において、Rは、非置換ヘテロシクリルである。いくつかの実施形態において、Rは、置換ヘテロシクリルである。いくつかの実施形態において、Rは、ハロ、-NR、-S(O)またはヘテロシクリルから選択される1つ以上の基で置換されたヘテロシクリルである。いくつかの実施形態において、Rは、非置換ヘテロアリールである。いくつかの実施形態において、Rは、置換ヘテロアリールである。いくつかの実施形態において、Rは、ハロ、-NR、-S(O)またはヘテロシクリルから選択される1つ以上の基で置換されたヘテロアリールである。
いくつかの実施形態において、式(III)の化合物は、トリメチルシリルイソチオシアネート(TMSITC)またはペンタフルオロフェニルイソチオシアネート(PFPITC)である。
いくつかの実施形態において、化合物は、トリフルオロメチルイソチオシアネート、アリルイソチオシアネート、ジメチルアミノアゾベンゼンイソチオシアネート、4-スルホフェニルイソチオシアネート、3-ピリジルイソチオシアネート、2-ピペリジノエチルイソチオシアネート、3-(4-モルホリノ)プロピルイソチオシアネート、または3-(ジエチルアミノ)プロピルイソチオシアネートではない。
いくつかの実施形態において、試薬は、アルキルアミンであるか、またはアルキルアミンを含む。いくつかの実施形態において、試薬は、DIPEA、トリメチルアミン、ピリジン、および/またはN-メチルピペリジンをさらに含む。いくつかの実施形態において、試薬は、アセトニトリル中のピリジンおよびトリエチルアミンをさらに含む。いくつかの実施形態において、試薬は、水および/またはメタノール中のN-メチルピペリジンをさらに含む。
いくつかの実施形態において、ポリペプチドを、カルボジイミド化合物とも接触させる。
いくつかの実施形態において、化学試薬は、カルボジイミド誘導体を含む(例えば、Chi et al.,2015,Chem.Eur.J.2015,21,10369-10378(それらの全体が参照により組み込まれる)を参照)。
いくつかの実施形態において、ポリペプチドのNTAAは、アシル化を介して標識される。(例えば、Protein Science(1992),I,582-589(それらの全体が参照により組み込まれる)を参照)。
いくつかの実施形態において、化学試薬は、式(IV):
Figure 2022526939000032
の化合物、またはその塩もしくは共役体からなる群から選択される化合物を含み、
式中、
は、ハロまたは-ORであり、
は、H、C1~6アルキルまたはヘテロシクリルであり、
は、水素、ハロまたはC1~6ハロアルキルである。
式(IV)のいくつかの実施形態においてRは、ハロである。いくつかの実施形態において、Rは、クロロである。いくつかの実施形態において、Rは、
Figure 2022526939000033
である。いくつかの実施形態において、Rは、水素である。いくつかの実施形態において、Rは、ブロモなどのハロである。いくつかの実施形態において、式(IV)の化合物は、塩化アセチル、無水酢酸およびアセチル-NHSから選択される。いくつかの実施形態において、化合物は、アセチル無水物またはアセチル-NHSではない。
いくつかの実施形態において、ポリペプチドはまた、ペプチドカップリング試薬と接触している。いくつかの実施形態において、ペプチドカップリング試薬は、カルボジイミド化合物である。いくつかの実施形態において、カルボジイミド化合物は、ジイソプロピルカルボジイミド(DIC)または1-エチル-3-(3-ジメチルアミノプロピル)カルボジイミド(EDC)である。いくつかの実施形態において、この方法は、式(I)の少なくとも1つの化合物およびDICまたはEDCなどのカルボジイミド化合物との接触を含む。
いくつかの実施形態において、化学試薬は、金属錯体を含む。(例えば、Bentley et al.,Biochem.J.1973(135),507-511;Bentley et al.,Biochem.J.1976(153),137-138;Huo et al.,J.Am.Chem.Soc.2007,139,9819-9822;Wu et al.,J.Am.Chem.Soc.2016,138(44),14554-14557(それらの全体が参照により組み込まれる)を参照)。いくつかの実施形態において、金属錯体は、金属配向/キレート基である。いくつかの実施形態において、金属錯体は、金属中心にキレートされた1つ以上のリガンドを含む。いくつかの実施形態において、リガンドは、単座リガンドである。いくつかの実施形態において、リガンドは、二座または多座リガンドである。いくつかの実施形態において、金属錯体は、Co、Cu、Pd、Pt、ZnおよびNiからなる群から選択される金属を含む。
いくつかの実施形態において、化学試薬は、式(I)、式(II)、式(III)または式(IV)の共役体を含む。いくつかの実施形態において、ポリペプチドの末端アミノ酸を修飾するために使用される試薬は、リガンドに共役された式(I)、式(II)、式(III)または式(IV)の化合物を含む。
いくつかの実施形態において、化学試薬は、式(I)-Q、式(II)-Q、式(III)-Qまたは式(IV)-Qの共役体を含み、式(I)~(IV)は、上で定義した通りであり、Qは、リガンドである。
いくつかの実施形態において、リガンドQは、ペンダント基または結合部位(例えば、結合剤が結合する部位)である。いくつかの実施形態において、ポリペプチドは、結合剤に共有結合する。いくつかの実施形態において、ポリペプチドは、結合剤に共有結合することができるリガンド基を含む末端アミノ酸を含む。特定の実施形態において、ポリペプチドは、式(I)-Q、式(II)-Q、式(III)-Qまたは式(IV)-Qの化合物で標識されたNTAAを含み、Qは、結合剤に共有結合する。いくつかの実施形態において、カップリング反応を実施して、ポリペプチドと結合剤との間に共有結合(例えば、リガンドQと結合剤上の官能基との間に共有結合)を作り出す。
いくつかの実施形態において、化学試薬は、式(I)-Q:
Figure 2022526939000034
(式中、R、RおよびRは、上記で定義された通りであり、Qは、リガンドである)の共役体を含む。
いくつかの実施形態において、化学試薬は、式(II)-Q:
Figure 2022526939000035
(式中、Rは、上記で定義された通りであり、Qは、リガンドである)の共役体を含む。
いくつかの実施形態において、化学試薬は、式(III)-Q:
Figure 2022526939000036
(式中、Rは、上記で定義された通りであり、Qは、リガンドである)の共役体を含む。
いくつかの実施形態において、化学試薬は、式(IV)-Q:
Figure 2022526939000037
(式中、RおよびRは、上記で定義された通りであり、Qは、リガンドである)の共役体を含む。
いくつかの実施形態において、Qは、-C1~6アルキル、-C2~6アルケニル、-C2~6アルキニル、アリール、ヘテロアリール、ヘテロシクリル、-N=C=S、-CN、-C(O)R、-C(O)OR、-SRまたは-S(O)からなる群から選択され、-C1~6アルキル、-C2~6アルケニル、-C2~6アルキニル、アリール、ヘテロアリールおよびヘテロシクリルは、各々非置換であるか、または置換されており、R、R、RおよびRは、各々独立して、-C1~6アルキル、-C1~6ハロアルキル、-C2~6アルケニル、-C2~6アルキニル、アリール、ヘテロアリールおよびヘテロシクリルからなる群から選択される。いくつかの実施形態において、Qは、
Figure 2022526939000038
からなる群から選択される。
いくつかの実施形態において、Qは、フルオロフォアである。いくつかの実施形態において、Qは、ランタニド、ユーロピウム、テルビウム、XL665、d2、量子ドット、緑色蛍光タンパク質、赤色蛍光タンパク質、黄色蛍光タンパク質、フルオレセイン、ローダミン、エオシン、テキサスレッド、シアニン、インドカルボシアニン、オカカルボシアニン、チアカルボシアニン、メロシアニン、ピリジルオキサドール、ベンゾオキサジアゾール、カスケードブルー、ナイルレッド、オキサジン170、アクリジンオレンジ、プロフラビン、オーラミン、マラカイトグリーンクリスタルバイオレット、ポルフィンフタロシアニン、およびビリルビンから選択される。
他の態様において提供されるのは、2つ以上の標識を有する修飾された切断酵素による除去のために末端アミノ酸またはアミノ酸を標識する際に使用される試薬である。
いくつかの実施形態において、修飾された切断酵素による除去のために末端アミノ酸(例えば、NTAA)またはアミノ酸を標識することは、第1の試薬および第2の試薬を使用することを含む。いくつかの実施形態において、末端アミノ酸は、第1の試薬および第2の試薬で同時にまたは連続して標識される。いくつかの実施形態において、第1の試薬は、本明細書に記載されるように、式(I)、(II)、(III)および(IV)の化合物からなる群から選択される化合物、またはその塩もしくは共役体を含む。
いくつかの実施形態において、第2の試薬は、式(Va)または(Vb):
Figure 2022526939000039
の化合物、またはその塩もしくは共役体を含み、

13は、H、C1~6アルキル、アリール、ヘテロアリール、シクロアルキルまたはヘテロシクリルであり、C1~6アルキル、アリール、ヘテロアリール、シクロアルキルおよびヘテロシクリルは、それぞれ非置換であるか、または置換されているか、あるいは
13-X (Vb)

13は、C1~6アルキル、アリール、ヘテロアリール、シクロアルキルまたはヘテロシクリルであり、その各々が非置換であるか、または置換されており、
Xは、ハロゲンである。
式(Va)のいくつかの実施形態においてR13は、Hである。いくつかの実施形態において、R13は、メチルである。いくつかの実施形態において、R13は、エチル、プロピル、イソプロピル、ブチル、イソブチル、セクブチル、ペンチルまたはヘキシルである。いくつかの実施形態において、R13は、置換されたC1~6アルキルである。いくつかの実施形態において、R13は、アリール、ヘテロアリール、シクロアルキルまたはヘテロシクリルで置換されたC1~6アルキルである。いくつかの実施形態において、R13は、アリールで置換されたC1~6アルキルである。いくつかの実施形態において、R13は、-CHCHPh、-CHPh、-CH(CH)Ph、または-CH(CH)Phである。
式(Vb)のいくつかの実施形態において、R13は、メチルである。いくつかの実施形態において、R13は、エチル、プロピル、イソプロピル、ブチル、イソブチル、セクブチル、ペンチルまたはヘキシルである。いくつかの実施形態において、R13は、置換されたC1~6アルキルである。いくつかの実施形態において、R13は、アリール、ヘテロアリール、シクロアルキルまたはヘテロシクリルで置換されたC1~6アルキルである。いくつかの実施形態において、R13は、アリールで置換されたC1~6アルキルである。いくつかの実施形態において、R13は、-CHCHPh、-CHPh、-CH(CH)Ph、または-CH(CH)Phである。
いくつかの実施形態において、修飾された切断酵素による除去のための末端アミノ酸またはアミノ酸を修飾または標識するための試薬は、ホルムアルデヒドを含む。いくつかの実施形態において、末端アミノ酸を修飾または標識するための試薬は、ヨウ化メチルを含む。
いくつかの実施形態において、ポリペプチドを、還元剤とも接触させる。いくつかの実施形態において、還元剤は、NaBH、KBH、ZnBH、NaBHCNまたはLiBuBHなどの水素化ホウ素を含む。いくつかの実施形態において、還元剤は、LiAlHまたはSnClなどのアルミニウムまたはスズ化合物を含む。いくつかの実施形態において、還元剤は、Bおよびジメチルアミンボランなどのボラン錯体を含む。いくつかの実施形態において、試薬は、NaBHCNをさらに含む。
いくつかの実施形態で、末端アミノ酸(例えば、NTAA)を標識するために使用され得る試薬には、4-スルホフェニルイソチオシアネート(スルホ-PITC)、4-ニトロフェニルイソチオシアネート(ニトロ-PITC)、3-ピリジルイソチオシアネート(PYITC)、フェニルイソシアネート(PIC)、ニトロ-PIC、スルホ-PIC、カルボキシル活性化アミノブロックアミノ酸、無水物(例えば、イサト酸無水物、イソニコチン酸無水物、アザイサト酸無水物、コハク酸無水物)、2-ピペリジノエチルイソチオシアネート(PEITC)、3-(4-モルホリノ)プロピルイソチオシアネート(MPITC)、3-(ジエチルアミノ)プロピルイソチオシアネート(DEPTIC)(Wang et al.,2009,Anal Chem 81:1893-1900)、(1-フルオロ-2,4-ジニトロベンゼン(サンガー試薬、DNFB)、ダンシルクロリド(DNS-Cl、または1-ジメチルアミノナフタレン-5-スルホニルクロリド)、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)、アセチル化試薬、アミド化(グアニジニル化)試薬(PCAおよびPCA誘導体を含む)、2-カルボキシ-4,6-ジニトロクロロベンゼン、7-メトキシクマリン酢酸、チオアシル化試薬、チオアセチル化試薬、ならびに/またはチオベンジル化試薬が含まれる。これらの試薬の多くは、PITC、ニトロ-PITC、スルホ-PITC、PYITC、およびグアニジニル化試薬(例えば、PCA化合物)を含むDNAと非反応性であるか、または最小限の反応性を示す。アミノ酸が、標識に対してブロックされる場合、アシルペプチドヒドロラーゼ(APH)でN-アセチルブロックを除去するなど、末端のブロックを解除するためのいくつかのアプローチがある(Farries,Harris et al.,1991,Eur.J.Biochem.196:679-685)。ペプチドのN末端のブロックを解除する方法は、当技術分野で既知である(例えば、Krishna et al.,1991,Anal.Biochem.199:45-50;Leone et al.,2011,Curr.Protoc.Protein Sci.,Chapter 11:Unit11.7;Fowler et al.,2001,Curr.Protoc.Protein Sci.,Chapter 11:Unit 11.7(その各々は参照によりその全体が本明細書に組み込まれる))。
ダンシルクロリドは、ペプチドの遊離アミン基と反応して、NTAAのダンシル誘導体を生成する。DNFBおよびSNFBは、ペプチドのα-アミン基を反応させて、それぞれDNP-NTAAおよびSNP-NTAAを生成する。さらに、DNFBおよびSNFBは、いずれもリジン残基のε-アミンとも反応する。DNFBは、チロシンおよびヒスチジンのアミノ酸残基とも反応する。いくつかの実施形態において、SNFBは、DNFBよりもアミン基に対してより良好な選択性を有する(Carty et al.,J Biol Chem(1968)243(20):5244-5253)。特定の実施形態において、リシンε-アミンは、ポリペプチドのペプチドへのプロテアーゼ消化の前に、有機無水物で事前にブロックされる。
イオン性液体の存在下で、イソチオシアネートは、第一級アミンに対する反応性が向上していることが示されている。イオン性液体は、有機化学反応における優れた溶媒であり(かつ、触媒として機能する)、イソチオシアネートとアミンとの反応を促進してチオ尿素を形成することができる。さらに、イオン性液体は、マイクロ波放射の吸収剤として作用して、反応性をさらに高めることができる(Martinez-Palou,J.Mex.Chem.Soc(2007)51(4):252-264)。一例は、フェニルイソチオシアネート(PITC)による芳香族および脂肪族アミンの迅速かつ効率的な官能化のためのイオン性液体1-ブチル-3-メチル-イミダゾリウムテトラフルオロボレート[Bmim][BF4]の使用である(Le,Chen et al.2005)。
いくつかの実施形態において、ペプチドは、以下のスキームに示されるように、式(AB)の化合物を含む化学試薬で処理することによって標識され得る。
Figure 2022526939000040
いくつかの実施形態において、ペプチドのN末端アミノ酸(NTAA)を修飾するために化学試薬で処理されたペプチドは、二複素環メタニミン試薬で処理される。いくつかの実施形態において、修飾された切断酵素による除去のための末端アミノ酸またはアミノ酸を修飾または標識するための試薬は、式(AB):
Figure 2022526939000041
式中、
は、H、R、OH、OR、NH、または-NHRであり、
は、ハロ、C1~3アルキル、C1~3アルコキシ、C1~3ハロアルキル、フェニル、5員ヘテロアリール、および6員ヘテロアリールから選択される1つまたは2つのメンバーで置換されたC1~6アルキルであり、各フェニル、5員ヘテロアリールおよび6員ヘテロアリールが、ハロ、-OH、C1~3アルキル、C1~3アルコキシ、C1~3ハロアルキル、NO、CN、COOR”、およびCON(R”)から選択される1つまたは2つのメンバーで置換されてもよく、
各R”は、独立して、HまたはC1~3アルキルであり、
環Aおよび環Bは、各々独立して、環員として最大3つのN原子を含む5員ヘテロアリール環であり、各々は、任意選択的に、追加のフェニルまたは5~6員ヘテロアリール環に融合され、5員ヘテロアリール環および任意の縮合フェニルまたは5~6員ヘテロアリール環は各々、C1~4アルキル、C1~4アルコキシ、-OH、ハロ、C1~4ハロアルキル、NO、COOR、CONR、-SOR*、-NR、フェニル、および5~6員ヘテロアリールから選択される1つまたは2つの基で置換されてもよく、
各Rは、独立して、H、およびOH、OR*、-NH、-NHR*または-NR*で置換されてもよいC1~3アルキルから選択され、
各R*は、OH、オキソ、C1~2アルコキシまたはCNで置換されてもよいC1~3アルキルであり、
ここで、同じN上の2つのR、または2つのR”、または2つのR*は、任意選択的に、一緒にされて4~7員の複素環を形成することができ、任意選択的に、環員としてN、OおよびSから選択される追加のヘテロ原子を含有し、および任意選択的に、ハロ、C1~2アルキル、OH、オキソ、C1~2アルコキシ、もしくはCNから選択される1つまたは2つの基で置換されてもよい、化合物、
またはその塩を含む。いくつかの実施形態において、環Aおよび環Bは、いずれも非置換イミダゾールではなく、環Aおよび環Bは、いずれも非置換ベンゾトリアゾールではない。
この実施形態の例では、Rは、HまたはRである。これらの実施形態において、これらの実施形態において、5員ヘテロアリール基は、存在する場合、環員としてN、OおよびSから選択される1~3個のヘテロ原子を含む5員環であり得、6員ヘテロアリール基は、存在する場合、環員として1~3個の窒素原子を含む6員環であり得る。これらの実施形態のいくつかでは、環Aも環Bも、非置換イミダゾールまたは非置換ベンゾトリアゾールではない。いくつかの実施形態において、RはHである。これらの実施形態のいくつかでは、環Aも環Bも、非置換イミダゾールまたは非置換ベンゾトリアゾールではない。
いくつかの実施形態において、環Aおよび環Bは、異なる。いくつかの実施形態において、環Aおよび環Bは、同じである。この実施形態の特定の化合物には、以下が含まれる。
Figure 2022526939000042
いくつかの態様において、各5~6員ヘテロアリール環は、独立して選択され、環員としてN、OおよびSから選択される1つまたは2つのヘテロ原子を含む。これらの実施形態において、存在する各5員ヘテロアリール基は、環員としてN、OおよびSから選択される1つまたは2つのヘテロ原子を含む5員環であり得、6員ヘテロアリール基は、環員として1つまたは2つの窒素原子を含む6員環であり得る。
いくつかの特定の実施形態において、環Aおよび環Bは、
Figure 2022526939000043
式中、
各R、RおよびRは、独立して、H、ハロ、C1~2アルキル、C1~2ハロアルキル、NO、SO(C1~2アルキル)、COOR、C(O)N(R、ならびにハロ、C1~2アルキル、C1~2ハロアルキル、NO、SO(C1~2アルキル)、COOR、およびC(O)N(Rから選択される1つまたは2つの基で置換されてもよいフェニルから選択され、
環の隣接する原子上の2つのR、RまたはRは、任意選択的に、一緒にされて、環に縮合したフェニル基、5員ヘテロアリール基または6員ヘテロアリール基を形成し、縮合したフェニル、5員ヘテロアリールまたは6員ヘテロアリール基は、ハロ、C1~2アルキル、C1~2ハロアルキル、NO、SO(C1~2アルキル)、COOR、およびC(O)N(Rから選択される1つまたは2つの基で置換されてもよく、
各Rは、独立して、HまたはC1~2アルキルであり、同じ窒素上の2つのR#は、任意選択的に、一緒にされて、環員としてN、OおよびSから選択される追加のヘテロ原子を任意選択的に含む4~7員の複素環を形成することができ、4~7員の複素環は、ハロ、OH、OMe、ME、オキソ、NH、NHMeおよびNMEから選択される1つまたは2つの基で置換されてもよい
またはそれらの塩から選択される。
これらの実施形態において、存在する各5員ヘテロアリール基は、環員としてN、OおよびSから選択される1~3個のヘテロ原子を含む5員環であり得、6員ヘテロアリール基は、環員として1~3個の窒素原子を含む6員環であり得る。
いくつかの実施形態において、環Aおよび環Bは、同じであり、以下から選択される。
Figure 2022526939000044
以下から選択される、実施形態30の化合物。
Figure 2022526939000045
2.その他の標識
いくつかの実施形態において、標識は、修飾された切断酵素によって認識または結合されることができる任意の標識である。いくつかの実施形態において、末端アミノ酸標識は、末端アミノ酸(例えば、N末端アミノ酸)のサイズ/形状を「模倣する」標識であるか、またはそれを含む。いくつかの実施形態において、標識は、修飾アミノ酸、アミノ酸の一部分、保護されたアミノ酸、ブロックアミノ酸、またはそれらの任意の組み合わせである。いくつかの実施形態において、末端アミノ酸に付着した標識は、N末端ブロック(アルファアミンを欠いた)アミノ酸である。
いくつかの実施形態において、標識は、天然に存在するか、または合成された任意のアミノ酸であるアミノ酸を含む。いくつかの実施形態において、標識は、合成されたブロックアミノ酸である。一般に、アミノ酸ブロック基を導入する任意の好適な方法を使用することができる。いくつかの実施形態において、ブロック基は、アミノ酸を試薬と反応させてブロック基を導入することによって導入される。任意の好適な活性化されたブロックアミノ酸を使用して、末端アミノ酸を標識することができる。例えば、Kruse et al.,J.Org.Chem.(1985)50(15):2792-2794を参照のこと。例えば、1つ以上の外因性アミノ酸(例えば、-Xaa-標識または-Xaa-Xaa-標識)を含む合成標識を標識として使用し、修飾された切断酵素で処理するためにポリペプチドに付着させることができる。
いくつかの実施形態において、アミノ酸ブロック基は、一価または二価の好適な基であり得、これには、アシル基、例えば、アセチルなどの低級アルカノイル、置換された低級アルカノイル、例えば、クロロアセチルなどの低級ハロアルカノイル、フェニルアセチルなどのアリール-低級アルカノイル、およびベンゾイルまたはフタロイルなどのアロイル;エトキシカルボニル、イソブチルオキシカルボニルまたはt-ブチルオキシカルボニルなどの低級アルコキシカルボニル基、および置換された低級アルコキシカルボニル基、例えば、2,2,2-トリクロロエトキシカルボニルなどの低級ハロアルコキシカルボニル;ベンジルオキシカルボニルなどのアリール-低級アルコキシカルボニル基;スルホニル基、例えばメタンスルホニルなどの低級アルキルスルホニル、およびベンゼンスルホニルまたはp-トルエンスルホニルなどのアリールスルホニル;シッフ塩基を形成するアルデヒドおよびケトンとの反応によって形成されるイリデン基、例えばベンズアルデヒド、サリックアルデヒド(salicaldehyde)またはアセト酢酸エステル;窒素原子がジヒドロピリジン環の一部を形成するような二価基(そのような保護基は、例えば、ホルムアルデヒドおよびβ-ケトエステル、例えば、アセト酢酸エステルとの反応によって得られる)が含まれる。
そのような実施形態のいくつかにおいて、除去のためのペプチドの標識(例えば、NTAAの標識)は、アミノ酸を含む標識を、標識と共に付着させることを含む。例えば、Cbz-アミノ酸(例えば、N-CBZ-DL-セリン、N-CBZ-L-アスパラギン酸)またはN-保護アミノ酸などの標識アミノ酸が市販されている。いくつかの実施形態において、除去のための末端アミノ酸の標識は、除去のための末端アミノ酸への標識としてのCbz-アミノ酸を付着させることを含む。いくつかの特定の実施形態において、標識は、2つのアミノ酸を含む標識を、標識と共に付着させることを含む。例えば、-Xaa-Xaa-標識(例えば、Z-gly-gly-osu)を含む合成標識を標識として使用し、修飾された切断酵素で処理するためにペプチドに付着させることができる。
いくつかの実施形態において、標識は、Acで保護されたアミンを有するアミノ酸を含む。いくつかの例では、標識は、Fmoc、Boc、またはCbzで保護されたアミノ酸を含む。他の例では、標識アミノ酸は、ジアルキルであるアミンを有するアミノ酸を含む。他の例では、標識のアミノ酸のカルボン酸は遊離しており、アミノ酸は、HATU+DIEAまたはEDC+DIEA+HOBtなどの標準的なペプチドカップリング試薬を使用してカップリングされる。他の例では、標識は、DまたはLキラリティーであり得るアミノ酸を含む。
1つ以上の外因性アミノ酸を含む合成標識(例えば、-Xaa-標識)が標識として使用され、ポリペプチドに付着したいくつかの実施形態において、修飾された切断酵素は、ポリペプチドの1つのアミノ酸と、標識の一部として追加された1つの外因性アミノ酸と、を含むポリペプチドからジペプチドを除去し得る。場合によっては、外因性アミノ酸Xaaは、Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、およびValからなる群から選択される任意のアミノ酸残基を表し得る。例えば、N末端のポリペプチドが-P3-P2-P1を有する場合、Xaa-標識を含む標識が、末端のポリペプチドに付加されて、-P3-P2-P1-Xaa-標識を形成する。次に、例示的な修飾された切断酵素を、標識ポリペプチドと接触させて、ポリペプチドから-P1-Xaa-標識を含むジペプチドを切断し、それにより、ポリペプチドのN末端からP1アミノ酸を除去する。いくつかの特定の実施形態において、未修飾または野生型トリペプチド切断酵素に由来する修飾された切断酵素は、ポリペプチドからP2-P1-Xaa標識を含むトリペプチドを除去し、それにより、ポリペプチドのN末端からP1およびP2アミノ酸を除去し得る。
2つの外因性アミノ酸を含む合成標識(例えば、-Xaa-Xaa-標識)が標識として使用され、ポリペプチドに付着したいくつかの実施形態において、修飾された切断酵素は、ポリペプチドの1つのアミノ酸と、標識の一部として追加された2つの外因性アミノ酸と、を含むポリペプチドからトリペプチドを除去し得る。例えば、N末端のポリペプチドが-P3-P2-P1を有する場合、Xaa-Xaa-標識を含む標識が、末端のポリペプチドに付加されて、-P3-P2-P1-Xaa-Xaa-標識を形成する。次に、例示的な修飾された切断酵素を、標識ポリペプチドと接触させて、ポリペプチドから-P1-Xaa-Xaa-標識を含むトリペプチドを切断し、それにより、ポリペプチドのN末端からP1アミノ酸を除去する。
B.操作および遺伝子選択
いくつかの実施形態において、本明細書において提供される修飾された切断酵素は、任意の好適な方法を使用して、作製、単離、操作、または選択することができる。場合によっては、変異体または修飾された切断酵素ポリペプチドは、アミノ酸残基の1つ以上の置換、付加、または欠失を導入することによって、野生型または未修飾の切断酵素と比較して、一次アミノ酸配列が改変される。いくつかの実施形態において、修飾された切断酵素は、操作および遺伝子選択を介して、野生型または未修飾の切断酵素(例えば、ジペプチジルペプチダーゼ、ジペプチジルアミノペプチダーゼ、ペプチジル-ジペプチダーゼ、ジペプチジルカルボキシペプチダーゼ、セドリジン、トリペプチジルペプチダーゼ、またはEC3.4.14、EC3.4.15、MEROPS S8、MEROPS S9、MEROPS S33、MEROPS S46、MEROPS M49、もしくはMEROPS S53に分類されるタンパク質、またはその機能的相同体もしくは断片)から誘導される。遺伝子選択、タンパク質工学、組換え法、化学合成、またはそれらの組み合わせを含むさまざまな技術を使用することができる。
いくつかの実施形態において、修飾された切断酵素は、選択活性、基質結合能力、または他の切断特性のための合理的な設計アプローチを使用して操作される。いくつかの実施形態において、合理的な設計アプローチは、未修飾の切断酵素の結晶構造に基づく。いくつかの例では、合理的な設計アプローチは、修飾の対象となるアミノ酸残基を特定するための基質を含む未修飾の切断酵素の結晶構造に基づく。場合によっては、修飾は、未修飾の切断酵素の特定のドメインの残基を標的とする場合がある(例えば、Sakamoto et al.,Scientific Reports 2014,4:4977を参照)。いくつかの実施形態において、合理的な設計を使用して、未修飾の切断酵素の基質結合ドメインに修飾アミノ酸を有する修飾された切断酵素を操作する。いくつかの実施形態において、突然変異、例えば、1つ以上のアミノ酸修飾(例えば、置換、付加、欠失)は、配列番号5またはヒトジペプチジルペプチダーゼ3(DPP3)もしくはその相同体の配列の番号付けに関して、位置316、391、394、またはそれらの組み合わせに対応する。いくつかの実施形態において、合理的な設計を使用して、未修飾の切断酵素と比較して長さが増加したポリペプチドを結合または切断することができる修飾された切断酵素を操作する。いくつかの実施形態において、突然変異、例えば、1つ以上のアミノ酸修飾(例えば、置換、付加、欠失)は、配列番号5の番号付けに関して、アミノ酸残基の位置419、420、421、422、423、424、425、426、またはそれらの組み合わせに対応する。いくつかの実施形態において、合理的な設計を使用して、未修飾の切断酵素のヒンジ領域に修飾アミノ酸を有する修飾された切断酵素を操作する。
いくつかの実施形態において、遺伝子選択または他の操作方法は、標識されたポリペプチド(例えば、化学的に標識されたポリペプチド)に対して活性である修飾された切断酵素を識別するように設計される。いくつかの実施形態において、遺伝子選択または他の操作方法は、標識されたN末端アミノ酸を有する修飾または標識されたポリペプチドに対して活性である修飾された切断酵素を識別するように設計される。場合によっては、標識されたポリペプチド上の部分または標識のサイズまたは他の特徴が、所望の修飾された切断酵素を得るための遺伝子選択または他の操作方法の設計において考慮される。
野生型または修飾された切断酵素のドメイン構成を説明するために使用される配列番号として示される特定の配列を含めたアミノ酸への言及は、例示のためのものであり、提供される実施形態の範囲を限定することを意味するものではないことが理解される。ポリペプチドおよびそのドメインの説明は、相同性分析および類似の分子とのアラインメントに基づいて理論的に導出されることが理解される。したがって、正確な遺伝子座は異なる可能性があり、各タンパク質で必ずしも同じであるとは限らない。したがって、特定の結合ドメイン、ループドメイン、または他の機能ドメイン)などの特定のドメインは、既知の分析およびアラインメント方法を使用して、別の種に由来する相同体または酵素において識別され得る。
いくつかの例では、野生型ジペプチド切断酵素(例えば、野生型DAP BII)およびその基質の結晶構造の分析を使用して、野生型ジペプチド切断酵素における修飾のためのアミノ酸を選択して、タンパク質相互作用界面における接触残基および他の残基を識別することができる。この分析は、例えば、巨大分子モデリング用のRosettaソフトウェアスイートを使用して実行され得る(Das et al.,Annu Rev Biochem(2008)77:363-382)。いくつかの実施形態において、修飾のために選択された標的残基を使用して、他の生物の野生型切断酵素配列のアラインメントを使用して、保存された残基を識別することができる(Crooks et al.,Genome Res(2004)14(6):1188-1190)。この分析に基づいて、保存された標的残基または相同体の対応する残基を修飾することができる。いくつかの実施形態では、識別された接触残基または他の目的の残基を修飾して、新たな機能を導入する。図4A~4Cに示されるように、60%の配列類似性または同一性を有するDAP BII相同体のWebLogo分析は、さまざまな残基にわたる配列保存を示した。例えば、配列保存は、配列番号20に記載の野生型DAP BII配列に関して、位置N215、W216、R220、N330、およびD674を含むDAP BIIのアミン結合部位の残基について観察された。別の例では、配列保存は、配列番号20に記載の野生型DAP BII配列に関して、位置G207、K208、F209、G210、G211、D212、I213、D214、N215、W216、M217、W218、P219、R220、H221、T222、G223、A224、F225、A226、A326、および/またはN334を含むDAP BIIのアミン結合部位の残基について観察された。
いくつかの態様において、DAP BIIを操作するための合理的な設計アプローチを使用して、ドメインまたは残基を標的とすることができ、結果として、生じた修飾切断酵素は、基質と複合体を形成するDAP BIIの結晶構造を使用して、標識N末端アミノ酸(NTAA)を除去するか、または除去するように構成される(Sakamoto et al.,Scientific Reports 2014,4:4977)。例えば、残基N191、W192、R196、N306、およびD650(配列番号13に記載のタンパク質の配列に基づく;UniProtアクセッション番号V5YM14)でペプチド基質と複合体を形成するDAP BII構造は、ペプチドのN末端アミン基と相互作用する。さらに、約20残基(配列番号13に関して、残基183~202)のループは、結合したペプチド基質のN末端残基および最後から2番目の残基と接触する。これらのアミン結合残基、ならびにNTAAおよび最後から2番目のNTAA結合残基が、個別にまたは組み合わせて、修飾の対象となり得る。
いくつかの態様において、未修飾または野生型の切断酵素の特異性を改変することが望ましい場合がある(例えば、Sakamoto et al.,Scientific Reports 2014,4:4977を参照)。いくつかの例では、DAP BIIのS1サブサイトまたはポケット内の残基を標的にして、好ましい特異性(例えば、修飾された切断酵素で処理されたポリペプチドのP1位置の特定のアミノ酸残基に対する低い特異性)を有する修飾された切断酵素を操作することができる。いくつかの実施形態において、修飾された切断酵素は、配列番号13の番号付けに関して、突然変異、例えば、位置D627、I628、G630、A648、G651、S655、M669、またはそれらの組み合わせに対応する1つ以上のアミノ酸修飾(例えば、置換、付加、欠失)を含む。
いくつかの実施形態において、修飾された切断酵素変異体は、遺伝子スクリーニングを使用して識別され得る。場合によっては、遺伝子スクリーニングは、細胞ベースのシステムを使用する。いくつかの実施形態において、遺伝子スクリーニングは、E.coli変異体または突然変異体を含むE.coli株などの原核細胞を使用する。いくつかの実施形態において、遺伝子スクリーニングは、酵母ツーハイブリッドシステムなどの真核細胞を使用する。いくつかの実施形態において、遺伝子選択は、基質の結合、切断、および/または標識末端アミノ酸の除去のための所望の特徴を有する修飾された切断酵素を選択するように設計される。
いくつかの実施形態において、遺伝子選択スクリーニングを実施することは、発現のためにさまざまな切断酵素遺伝子(例えば、ジペプチジルペプチダーゼ、ジペプチジルアミノペプチダーゼ、ペプチジル-ジペプチダーゼ、ジペプチジルカルボキシペプチダーゼ、セドリジン、またはトリペプチジルペプチダーゼ)を調製することを含む。突然変異体もしくは修飾された切断酵素ポリペプチドをコードする核酸配列を含むプラスミドまたはコスミドは、当技術分野で周知の標準的な技術を使用して容易に構築される。いくつかの実施形態において、切断酵素のうちのいずれか(例えば、配列番号5~8、10~16、20のうちのいずれか)の発現は、シグナル配列をさらに含み得る。場合によっては、シグナル配列の使用が、精製のために役立つ場合がある。例えば、PelBなどのペリプラズム標的配列を発現構築物に含めることができる。組換えベクターは、当技術分野で既知の組換え技術のうちのいずれかを使用して生成することができる。
いくつかの実施形態において、ベクターは、原核生物の複製起点および/またはその発現により原核生物系における増殖および/または選択のための検出可能または選択可能なマーカーが得られる遺伝子を含み得る。構築物を含むベクターまたはDNA配列を発現のために調製すると、DNA構築物を好適な宿主に導入することができる。いくつかの実施形態において、E.coli、Bacillus、Streptomyces、Pseudomonas、Salmonella、Serratiaなどの細菌を含む原核生物宿主を使用することができる。原形質融合、リン酸カルシウム沈殿、エレクトロポレーションまたは他の従来の技術などのさまざまな技術を使用してもよい。融合後、細胞を培地で増殖させ、好適な活性についてスクリーニングする。
いくつかの例では、変異体切断酵素遺伝子のライブラリーは、エラープローンPCR、もしくは切断酵素の結晶構造をガイドとして使用する合理的な突然変異誘発、またはそれらの組み合わせによって生成することができる。また、突然変異を生成するか、またはライブラリーを生成するための他の好適な方法を使用してもよい。その後、変異体切断酵素遺伝子のライブラリーは、ベクターにクローン化され、E.coli栄養要求性株に形質転換される(エール大学のCSSC E.coli遺伝子ストックセンター(Genetic Stock Center)から入手可能-https://cgsc2.biology.yale.edu/)。いくつかの実施形態において、スクリーニングは、選択培地上で増殖するコロニーを単離し、プラスミドDNAを抽出および分析して、ポリペプチドから標識末端アミノ酸または標識末端ジペプチドを除去する修飾された切断酵素ポリペプチドを識別することを含む。いくつかの実施形態において、標識アミノ酸(例えば、PITC標識NTAAまたはCbz標識NTAA)を有するポリペプチドを切断するか、または切断するように構成される修飾された切断酵素を識別および単離するために、スクリーニングを実行することができる。いくつかの実施形態において、遺伝子スクリーニングは、特定のアミノ酸ではなく、標識の結合を選択することを目的とする。したがって、スクリーニングは、さまざまな標識末端アミノ酸を有するポリペプチドを使用する。いくつかの実施形態において、修飾された切断酵素の選択は、修飾された切断酵素の活性の精製、特徴付け、評価および/または最適化をさらに含む。修飾された切断酵素は、抽出、沈殿、クロマトグラフィー、アフィニティークロマトグラフィー、電気泳動などの従来の方法に従って単離および精製することができる。
いくつかの実施形態において、遺伝学スクリーニングまたは他の選択方法を使用して、活性部位または結合ポケットが改変されている修飾された切断酵素を選択および取得することもできる。いくつかの実施形態において、遺伝学的スクリーニングまたは選択方法を使用して、ヒンジ領域が改変された修飾された切断酵素を選択および取得することもできる。いくつかの実施形態において、遺伝子スクリーニングまたは選択方法を使用して、結合溝が改変された修飾された切断酵素を選択および取得することもできる。場合によっては、遺伝子スクリーニングまたは選択方法を使用して、葉間溝が改変された修飾された切断酵素を選択および取得することもできる。いくつかの実施形態において、遺伝子スクリーニングまたは選択方法を使用して、アルファアミン結合領域が改変された修飾された切断酵素を選択および取得することもできる。例えば、修飾された切断酵素は、野生型の切断酵素ポリペプチドと比較して、アルファアミン結合が減少している。
いくつかの実施形態において、遺伝子スクリーニングまたは他の選択方法を使用して、さまざまな長さのポリペプチドから標識末端アミノ酸を除去するように構成される修飾された切断酵素を選択および取得することもできる。場合によっては、E.coli外膜のポリンサイズによって、取り込み可能なペプチドの長さが制限される。いくつかの実施形態において、この長さの制限は、Tris-EDTAまたはE.coli外膜を透過性にする小分子MAC13243でE.coliを簡潔に処理することにより解消され(例えば、Leive,L.(1974).Ann N Y Acad Sci 235(0):109-129;Muheim,C.(2017).Scientific Reports 7(1):17629)、ペリプラズム空間へのペプチドの取り込みを可能にする。いくつかの実施形態において、修飾された切断酵素は、長さが5個のアミノ酸を超える、長さが6個のアミノ酸を超える、長さが7個のアミノ酸を超える、長さが8個のアミノ酸を超える、長さが9個のアミノ酸を超える、長さが10個のアミノ酸を超える、長さが11個のアミノ酸を超える、長さが12個のアミノ酸を超える、長さが13個のアミノ酸を超える、長さが14個のアミノ酸を超える、長さが15個のアミノ酸を超える、長さが20個のアミノ酸を超える、長さが25個のアミノ酸を超える、もしくは長さが30個のアミノ酸を超えるポリペプチドからアミノ酸を切断することができるか、または除去するように構成される。いくつかの実施形態において、修飾されたジペプチジルペプチダーゼは、長さが30個未満のアミノ酸、長さが40個未満のアミノ酸、長さが50個未満のアミノ酸、長さが75個未満のアミノ酸、長さが100個未満のアミノ酸、長さが200個未満のアミノ酸、長さが300個未満のアミノ酸、長さが400個未満のアミノ酸、長さが500個未満のアミノ酸、長さが600個未満のアミノ酸、長さが700個未満のアミノ酸、長さが800個未満のアミノ酸、長さが900個未満のアミノ酸、もしくは長さが1000個未満のアミノ酸であるポリペプチドからアミノ酸を切断することができるか、または除去するように構成される。いくつかの実施形態において、修飾された切断酵素は、長さが10個~100個のアミノ酸、長さが20個~100個のアミノ酸、長さが30個~100個のアミノ酸、長さ5個~50個のアミノ酸、長さが10個~50個のアミノ酸、長さが20個~50個のアミノ酸、長さが30個~50個のアミノ酸、長さが5個~30個のアミノ酸長さ、長さが10個~30個のアミノ酸、長さが20個~30個のアミノ酸、長さが10個~20個のアミノ酸であるポリペプチドからアミノ酸を切断することができるか、または除去するように構成される。いくつかの実施形態において、修飾された切断酵素は、長さが50個~1000個のアミノ酸、長さが100個~1000個のアミノ酸、長さが300個~1000個のアミノ酸、長さが500個~1000個のアミノ酸、長さが10個~500個のアミノ酸、長さが50個~500個のアミノ酸、長さが100個~500個のアミノ酸、もしくは長さが200個~500個のアミノ酸であるポリペプチドからアミノ酸を切断することができるか、または除去するように構成される。
いくつかの実施形態において、修飾された切断酵素は、部分的なまたは消化されたタンパク質およびポリペプチド(例えば、タンパク質またはポリペプチド断片)からアミノ酸を除去することができるか、または除去するように構成される。いくつかの実施形態において、修飾された切断酵素は、全体のまたは未消化のタンパク質およびポリペプチドからアミノ酸を除去することができるか、または除去するように構成される。
いくつかの実施形態において、修飾された切断酵素は、ポリペプチドを、5分間未満、10分間未満、20分間未満、30分間未満、40分間未満、50分間未満、60分間未満、2時間未満、5時間未満、8時間未満、もしくは10時間未満、修飾された切断酵素と接触させることによって、単一の末端アミノ酸または末端ジペプチドを除去する。
いくつかの実施形態において、修飾された切断酵素は、修飾された切断酵素で、約15分間未満、ポリペプチドを処理することにより、>30%、>40%、>50%、>60%、>70%、>80%、>90%、>95%、>99%以上の、末端アミノ酸が除去されたポリペプチドの収率を達成する。いくつかの実施形態において、修飾された切断酵素は、修飾された切断酵素で、約30分間未満、ポリペプチドを処理することにより、>30%、>40%、>50%、>60%、>70%、>80%、>90%、>95%、>99%以上の、末端アミノ酸が除去されたポリペプチドの収率を達成する。いくつかの実施形態において、修飾された切断酵素は、修飾された切断酵素で、約45分間未満、ポリペプチドを処理することにより、>30%、>40%、>50%、>60%、>70%、>80%、>90%、>95%、>99%以上の、末端アミノ酸が除去されたポリペプチドの収率を達成する。いくつかの実施形態において、修飾された切断酵素は、修飾された切断酵素で、約1時間未満、ポリペプチドを処理することにより、>30%、>40%、>50%、>60%、>70%、>80%、>90%、>95%、>99%以上の、末端アミノ酸が除去されたポリペプチドの収率を達成する。いくつかの実施形態において、修飾された切断酵素は、修飾された切断酵素で、約2時間未満、ポリペプチドを処理することにより、>30%、>40%、>50%、>60%、>70%、>80%、>90%、>95%、>99%以上の、末端アミノ酸が除去されたポリペプチドの収率を達成する。いくつかの実施形態において、修飾された切断酵素は、修飾された切断酵素で、約5時間未満、ポリペプチドを処理することにより、>30%、>40%、>50%、>60%、>70%、>80%、>90%、>95%、>99%以上の、末端アミノ酸が除去されたポリペプチドの収率を達成する。
いくつかの実施形態において、修飾されたジペプチドまたはトリペプチド切断酵素は、約10℃より高い、約20℃より高い、約30℃より高い、または約40℃より高い温度で、末端アミノ酸を切断することができるか、または機能する。いくつかの実施形態において、修飾されたジペプチドまたはトリペプチド切断酵素は、約10℃~20℃、約10℃~30℃、約10℃~40℃、約10℃~50℃、約10℃~60℃、約10℃~70℃、約10℃~80℃、約10℃~90℃、または約10℃~100℃;約20℃~30℃、約20℃~40℃、約20℃~50℃、約20℃~60℃、約20℃~70℃、約20℃~80℃、約20℃~90℃、または約20℃~100℃;約30℃~40℃、約30℃~50℃、約30℃~60℃;約50℃~70℃、約50℃~80℃、約50℃~90℃、または約50℃~100℃の温度で末端アミノ酸を切断することができるか、または機能する。いくつかの実施形態において、修飾された切断酵素は、ポリペプチドの二次構造が破壊される温度で末端アミノ酸を切断することができる。いくつかの実施形態において、修飾された切断酵素は、約20~25℃で機能する。いくつかの実施形態において、この方法は、加熱を適用しながら、修飾された切断酵素をポリペプチドと接触させることを含む。いくつかの実施形態において、加熱は、マイクロ波エネルギーを印加することによって達成される。本明細書において提供される方法のうちのいずれかのいくつかの実施形態において、末端アミノ酸を除去するための、修飾された切断酵素のポリペプチドとの接触は、マイクロ波エネルギーの存在下で実行される。
本明細書において提供されるのは、セクションIに記載されるような、修飾された切断酵素のうちのいずれかをコードする単離されたDNA分子である。また、セクションIに記載されるような、修飾された切断酵素のうちのいずれかをコードするDNA分子を含む組換え発現ベクターも提供される。場合によっては、DNA分子および組換え発現ベクターは、記載される遺伝子操作および選択方法から単離される。場合によっては、DNA分子を含む宿主細胞も提供される。
いくつかの実施形態において、本明細書において提供されるのは、本明細書に記載される実施形態のうちのいずれか1つによる核酸分子、または本明細書に記載される実施形態のうちのいずれか1つによるベクターを、細胞内でタンパク質を発現させる条件下で、宿主細胞内に導入することを含む、修飾されたまたは変異体切断酵素を産生する方法である。また、本明細書において提供されるのは、修飾された切断酵素の発現に好適な条件下で形質転換された宿主細胞を培養することと、修飾された切断酵素を発現する突然変異体生物を分離、精製および/または回収することと、を含む、本明細書において提供される修飾された切断酵素のうちのいずれかを産生するための方法である。いくつかの実施形態において、本明細書において提供されるのは、修飾された切断酵素をコードするDNA分子を含む宿主細胞である。いくつかの実施形態において、宿主細胞は、修飾された切断酵素を発現するための組換え発現ベクターを含む。いくつかの実施形態において、この方法は、細胞から変異体もしくは修飾された切断酵素を単離または精製することをさらに含む。
いくつかの実施形態において、本明細書において提供されるのは、本明細書に記載される実施形態のうちのいずれか1つによる変異体もしくは修飾された切断酵素ポリペプチド、または本明細書に記載の変異体もしくは修飾された切断酵素をコードする核酸分子、または本明細書に記載される実施形態のうちのいずれか1つによるベクターを発現する、操作された細胞である。いくつかの実施形態において、変異体または修飾された切断酵素ポリペプチドは、シグナルペプチドを含む。
II.ポリペプチド
いくつかの実施形態において、本開示は、本明細書において提供される修飾された切断酵素のうちのいずれかによるポリペプチドの処理に関する。いくつかの実施形態において、標識末端アミノ酸は、ポリペプチド(部分的なポリペプチドまたは断片化されたポリペプチドを含む)から除去される。
いくつかの実施形態において、末端アミノ酸は、長さが4個超のアミノ酸、5個超のアミノ酸、6個超のアミノ酸、7個超のアミノ酸、8個超のアミノ酸、9個超のアミノ酸、10個超のアミノ酸、11個超のアミノ酸、12個超のアミノ酸、13アミノ酸超、14個超のアミノ酸、15個超のアミノ酸、20個超のアミノ酸、25個超のアミノ酸、または30個超のアミノ酸であるポリペプチドから除去される。場合によっては、ポリペプチドの長さは、10個のアミノ酸を超える。いくつかの実施形態において、末端アミノ酸は、長さが30個未満のアミノ酸、40個未満のアミノ酸、50個未満のアミノ酸、75個未満のアミノ酸、100個未満のアミノ酸、200個未満のアミノ酸、300個未満のアミノ酸、400個未満のアミノ酸、500個未満のアミノ酸、600個未満のアミノ酸、700個未満のアミノ酸、800個未満のアミノ酸、900個未満のアミノ酸、または1000個未満のアミノ酸であるポリペプチドから除去される。いくつかの実施形態において、末端アミノ酸は、長さが5個~100個のアミノ酸、10個~100個のアミノ酸、20個~100個のアミノ酸、長さが30個~100個のアミノ酸、5個~50個のアミノ酸、10個~50個のアミノ酸、20個~50個のアミノ酸、30個~50個のアミノ酸、長さが5個~30個のアミノ酸、10個~30個のアミノ酸、20個~30個のアミノ酸、10個~20個のアミノ酸であるポリペプチドから除去される。いくつかの実施形態において、末端アミノ酸は、長さが50個~1000個のアミノ酸、100個~1000個のアミノ酸、300個~1000個のアミノ酸、500個~1000個のアミノ酸、10個~500個のアミノ酸、50個~500個のアミノ酸、100個~500個のアミノ酸、または200個~500個のアミノ酸であるポリペプチドから除去される。
いくつかの実施形態において、末端アミノ酸は、部分的なまたは消化されたタンパク質およびポリペプチド(例えば、ポリペプチド断片)から除去される。いくつかの実施形態において、末端アミノ酸は、全体のまたは未消化のタンパク質およびポリペプチドから除去される。
本明細書で提供され、本明細書で開示される方法に従って修飾された切断酵素で処理されたポリペプチドは、細胞(初代細胞および培養細胞株の両方)、細胞溶解物もしくは抽出物、細胞小器官もしくは小胞(エキソソーム、組織および組織抽出物を含む)などの生物学的サンプル;生検;糞便物質;体液(血液、全血、血清、血漿、尿、リンパ液、胆汁、脳脊髄液、間質液、水性もしくは硝子体液、コロストラム、痰、羊水、唾液、肛門および膣の分泌物、発汗および精液、漏出液、滲出液(例えば、膿瘍もしくは他の感染もしくは炎症部位から得られた流体)もしくは事実上すべての生物(ミクロビオーム含有サンプルを含む哺乳動物由来のサンプルが好ましく、ミクロビオーム含有サンプルを含むヒト由来のサンプルが特に好ましい)の関節(正常な関節、または関節リウマチ、変形性関節症、痛風もしくは敗血症性関節炎などの疾患に冒された関節)から得られた流体など;環境サンプル(空気、農業、水、土壌サンプルなど);微生物バイオフィルムおよび/もしくは群集に由来するサンプル、ならびに微生物胞子を含む微生物サンプル;細胞外液、細胞培養からの細胞外上清、細菌における封入体、ミトコンドリアコンパートメントを含む細胞コンパートメント、および細胞ペリプラズムを含む研究サンプルを含むがこれらに限定されない好適な供給源またはサンプルから得ることができる。
特定の実施形態において、ポリペプチドは、タンパク質またはタンパク質複合体である。ポリペプチドのアミノ酸配列情報および翻訳後修飾は、次世代シーケンシング方法によって分析することができる核酸コーディングライブラリーに変換される。ポリペプチドは、L-アミノ酸、D-アミノ酸、またはその両方を含み得る。ポリペプチドは、標準的な天然に存在するアミノ酸、修飾アミノ酸(例えば、翻訳後修飾)、アミノ酸類似体、アミノ酸模倣物、またはそれらの任意の組み合わせを含み得る。いくつかの実施形態において、ポリペプチドは、天然に存在するか、合成的に産生されるか、または組換え的に発現される。前述の実施形態のうちのいずれかにおいて、ポリペプチドは、翻訳後修飾をさらに含み得る。
標準的な天然アミノ酸としては、アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リジン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、スレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)が挙げられる。非標準的なアミノ酸の例としては、セレノシステイン、ピロリシン、およびN-ホルミルメチオニン、β-アミノ酸、ホモアミノ酸、プロリンおよびピルビン酸誘導体、3-置換アラニン誘導体、グリシン誘導体、環-置換フェニルアラニンおよびチロシン誘導体、線状コアアミノ酸、N-メチルアミノ酸が挙げられる。
ポリペプチドの翻訳後修飾(PTM)は、共有結合修飾または酵素修飾であり得る。翻訳後修飾の例としては、アシル化、アセチル化、アルキル化(メチル化を含む)、ビオチン化、ブチリル化、カルバミル化、カルボニル化、脱アミド化、脱イミノ化、ジフタミド形成、ジスルフィド架橋形成、脱離(eliminylation)、フラビン付着、ホルミル化、ガンマカルボキシル化、グルタミル化、グリシル化、グリコシル化(例えば、N-連結型、O-連結型、C-連結型ホスホグリコシル化)、グリピエーション、ヘムC付着、ヒドロキシル化、ヒプシン形成、ヨウ素化、イソプレニル化、脂質化、リポイル化、マロニル化、メチル化、ミリストリル化(myristolylation)、酸化、パルミトイル化、ペグ化、ホスホパンテテイン化、リン酸化、プロピオニル化、レチニリデンシフ塩基形成、S-グルタチオン付加(glutathionylation)、S-ニトロシル化、S-スルフェニル化、セレン化、スクシニル化、スルフィン化、ユビキチン化、およびC末端アミド化が挙げられるが、これらに限定されない。翻訳後修飾としては、ペプチド、ポリペプチドもしくはタンパク質のアミノ末端および/またはカルボキシル末端の修飾が挙げられる。末端アミノ基の修飾としては、デスアミノ、N-低級アルキル、N-ジ-低級アルキル、およびN-アシル修飾が挙げられるが、これらに限定されない。末端カルボキシ基の修飾としては、アミド、低級アルキルアミド、ジアルキルアミド、および低級アルキルエステル修飾(例えば、低級アルキルはC~Cアルキルである)が挙げられるが、これらに限定されない。翻訳後修飾としては、ペプチド、ポリペプチドまたはタンパク質のアミノ末端とカルボキシ末端との間にあるアミノ酸の修飾(例えば、上記のものであるが、これらに限定されない)も挙げられる。翻訳後修飾は、細胞内のタンパク質の「生物学」、例えば、その活性、構造、安定性、または局在化を調節することができる。リン酸化は最も一般的な翻訳後修飾であり、タンパク質の調節、特に細胞シグナル伝達において重要な役割を果たす(Prabakaran et al.,(2012)Wiley Interdiscip Rev Syst Biol Med 4:565-583)。グリコシル化などのタンパク質への糖の付加は、タンパク質の折り畳みを促進し、安定性を改善し、調節機能を変更することが示されている。脂質がタンパク質に付着することにより、細胞膜を標的とすることができる。翻訳後修飾はまた、1つ以上の検出可能な標識を含むための修飾を含み得る。
特定の実施形態において、ポリペプチドを断片化することができる。例えば、断片化されたポリペプチドは、生物学的サンプルなどのサンプルからポリペプチド、タンパク質、またはタンパク質複合体を断片化することによって得ることができる。ポリペプチド、タンパク質またはタンパク質複合体は、プロテアーゼまたはエンドペプチダーゼによる断片化を含む、当技術分野で既知の任意の手段によって断片化することができる。いくつかの実施形態において、ポリペプチド、タンパク質またはタンパク質複合体の断片化は、特定のプロテアーゼまたはエンドペプチダーゼの使用によって標的とされる。特定のプロテアーゼまたはエンドペプチダーゼは、特定のコンセンサス配列(例えば、ENLYFQ\Sコンセンサス配列に特異的なTEVプロテアーゼ)に結合して切断する。他の実施形態において、ペプチド、ポリペプチドまたはタンパク質の断片化は、非特異的プロテアーゼまたはエンドペプチダーゼの使用による標的とされないか、またはランダムである。非特異的プロテアーゼは、コンセンサス配列ではなく、特定のアミノ酸残基に結合して切断する場合がある(例えば、プロテイナーゼKは、非特異的セリンプロテアーゼである)。プロテイナーゼおよびエンドペプチダーゼは当技術分野で周知であり、タンパク質またはポリペプチドをより小さなペプチド断片に切断するために使用され得るそのような例としては、プロテイナーゼK、トリプシン、キモトリプシン、ペプシン、サーモリシン、トロンビン、第Xa因子、フリン、エンドペプチダーゼ、パパイン、ペプシン、サブチリシン、エラスターゼ、エンテロキナーゼ、Genenase(商標)I、エンドプロテイナーゼLysC、エンドプロテイナーゼAspN、エンドプロテイナーゼGluCなどが挙げられる(Granvogl et al.,(2007)Anal Bioanal Chem 389:991-1002)。特定の実施形態において、ペプチド、ポリペプチドまたはタンパク質は、プロテイナーゼK、または任意選択的に、プロテイナーゼKの熱不安定性バージョンによって断片化されて、迅速な不活性化を可能にする。プロテイナーゼKは、尿素およびSDSなどの変性試薬で非常に安定しており、完全に変性したタンパク質の消化を可能にする。
いくつかの実施形態において、ポリペプチドを、修飾された切断酵素に加えて1つ以上の酵素と接触させて、NTAAを脱離させる(例えば、存在する場合、N末端プロリンを除去するためのプロリンアミノペプチダーゼ)。いくつかの実施形態において、追加の酵素は、プロリンであるポリペプチドからNTAAを脱離させる。いくつかの特定の例では、酵素は、プロリンアミノペプチダーゼ、プロリンイミノペプチダーゼ(PIP)、またはピログルタメートアミノペプチダーゼ(pGAP)である。いくつかの実施形態では、1つ以上の修飾された切断酵素を他の酵素と組み合わせて使用して、ポリペプチドを処理する。いくつかの実施形態では、存在する場合、N末端プロリンを除去するのに好適な条件下で、最初にポリペプチドをプロリンアミノペプチダーゼと接触させる。
化学試薬を使用して、タンパク質をペプチド断片に消化することもできる。化学試薬は、特定のアミノ酸残基で切断する可能性がある(例えば、臭化シアンは、メチオニン残基のC末端のペプチド結合を加水分解する)。ポリペプチドまたはタンパク質をより小さなペプチドに断片化するための化学試薬としては、臭化シアン(CNBr)、ヒドロキシルアミン、ヒドラジン、ギ酸、BNPS-スカトール[2-(2-ニトロフェニルスルフェニル)-3-メチルインドール]、ヨードソ安息香酸、・NTCB+Ni(2-ニトロ-5-チオシアノ安息香酸)などが挙げられる。
特定の実施形態において、いくつかのポリペプチドは、酵素的または化学的脱離のための試薬で処理することができる。特定の実施形態において、酵素的または化学的脱離に続いて、得られるポリペプチド断片は、ほぼ同じ所望の長さ、例えば、約10個のアミノ酸~約70個のアミノ酸、約10個のアミノ酸~約60個のアミノ酸、約10個のアミノ酸~約50個のアミノ酸、約10個~約40個のアミノ酸、約10個~約30個のアミノ酸、約20個のアミノ酸~約70個のアミノ酸、約20個のアミノ酸~約60個のアミノ酸、約20個のアミノ酸~約50個のアミノ酸、約20個~約40個のアミノ酸、約20個~約30個のアミノ酸、約30個のアミノ酸~約70個のアミノ酸、約30個のアミノ酸~約60個のアミノ酸、約30個のアミノ酸~約50個のアミノ酸、または約30個のアミノ酸~約40個のアミノ酸である。脱離反応は、タンパク質またはポリペプチドサンプルに、プロテイナーゼまたはエンドペプチダーゼ脱離部位を含むペプチド配列を含む短い試験FRET(蛍光共鳴エネルギー移動)ポリペプチドをスパイクすることによって、好ましくはリアルタイムで監視することができる。無傷のFRETペプチドでは、脱離部位を含むペプチド配列の両端に蛍光基および消光基が付着しており、消光剤とフルオロフォアとの間の蛍光共鳴エネルギー移動により、蛍光が低くなる。プロテアーゼまたはエンドペプチダーゼによって試験ペプチドが排除されると、消光剤およびフルオロフォアが分離され、蛍光が大幅に増加する。特定の蛍光強度が達成されたときに脱離反応を停止することができ、再現性のある脱離終点を達成することができる。
A.溶液中で支持体に接合された(Joined to a Support or in Solution)ポリペプチドの提供
いくつかの実施形態において、本開示のポリペプチドは、固体支持体の表面(「基質表面」とも呼ばれる)に接合される。場合によっては、ポリペプチドは、修飾された切断酵素と接触する前に、固体支持体に接合される。場合によっては、修飾された切断酵素は、固体支持体に(直接的または間接的に)接合しているポリペプチドから標識末端アミノ酸を除去する。いくつかの実施形態において、標識末端アミノ酸は、単一のアミノ酸として、またはジペプチドの一部として除去される。
固体支持体は、ビーズ、マイクロビーズ、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、PTFE膜、PTFE膜、ニトロセルロース膜、ニトロセルロースベースのポリマー表面、ナイロン、シリコンウェーハチップ、フローセル、フロースルーチップ、信号変換電子機器を含めたバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク(spinning interferometry disc)、ニトロセルロース膜、ニトロセルロースベースのポリマー表面、ナノ粒子、またはミクロスフェアを含むが、これらに限定されない任意の多孔質または非多孔質の支持体表面であり得る。固体支持体の材料としては、アクリルアミド、アガロース、セルロース、デキストラン、ニトロセルロース、ガラス、金、石英、ポリスチレン、ポリエチレン酢酸ビニル、ポリプロピレン、ポリエステル、ポリメタクリレート、ポリアクリレート、ポリエチレン、ポリエチレンオキシド、ポリシリケート、ポリカーボネート、ポリビニルアルコール(PVA)、テフロン(登録商標)、フルオロカーボン、ナイロン、シリコンゴム、ポリ無水物、ポリグリコール酸、ポリ塩化ビニル、ポリ乳酸、ポリオルトエステル、官能化シラン、ポリプロピルフメレート、コラーゲン、グリコサミノグリカン、ポリアミノ酸、またはそれらの任意の組み合わせが挙げられるが、これらに限定されない。固体支持体はさらに、薄膜、膜、ボトル、皿、繊維、織繊維、チューブなどの成形ポリマー、粒子、ビーズ、微粒子、またはそれらの任意の組み合わせを含む。例えば、固体表面がビーズである場合、ビーズは、ポリスチレンビーズ、ポリマービーズ、ポリアクリレートビーズ、メチルスチレンビーズ、アガロースビーズ、セルロースビーズ、デキストランビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、制御多孔質ビーズ、シリカベースのビーズ、またはそれらの任意の組み合わせを含むことができるが、これらに限定されない。
特定の実施形態において、固体支持体はビーズであり、個々のビーズまたは複数のビーズを指す場合がある。いくつかの実施形態において、ビーズは、下流分析に使用される選択された次世代シーケンシングプラットフォーム(例えば、SOLiDまたは454)と適合性がある。いくつかの実施形態において、固体支持体は、アガロースビーズ、常磁性ビーズ、ポリスチレンビーズ、ポリマービーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、ガラスビーズ、または制御された多孔質ビーズである。さらなる実施形態において、ビーズは、ポリペプチドへの結合を容易にするために、結合官能基(functionality)(例えば、アミン基、ビオチン標識ポリペプチドに結合するためのストレプトアビジンなどの親和性リガンド、抗体)でコーティングされ得る。
タンパク質、ポリペプチドまたはペプチドは、共有結合性の相互作用および非共有結合性の相互作用、またはそれらの任意の組み合わせを含む、当技術分野で既知の任意の手段によって、直接的または間接的に固体支持体に接合することができる(例えば、Chan et al.,2007,PLoS One 2:e1164;Cazalis et al.,Bioconj.Chem.15:1005-1009;Soellner et al.,2003,J.Am.Chem.Soc.125:11790-11791;Sun et al.,2006,Bioconjug.Chem.17-52-57;Decreau et al.,2007,J.Org.Chem.72:2794-2802;Camarero et al.,2004,J.Am.Chem.Soc.126:14730-14731;Girish et al.,2005,Bioorg.Med.Chem.Lett.15:2447-2451;Kalia et al.,2007,Bioconjug.Chem.18:1064-1069;Watzke et al.,2006,Angew Chem.Int.Ed.Engl.45:1408-1412;Parthasarathy et al.,2007,Bioconjugate Chem.18:469-476;and Bioconjugate Techniques,G.T.Hermanson,Academic Press(2013)(各々は参照によりそれらの全体が本明細書に組み込まれる)を参照)。例えば、ペプチドは、ライゲーション反応によって固体支持体に接合され得る。あるいは、固体支持体は、ペプチドを固体支持体に直接的または間接的に結合することを容易にするための薬剤またはコーティングを含むことができる。タンパク質、核酸、炭水化物、および小分子を含む、任意の好適な分子または材料を、この目的のために使用することができる。例えば、一実施形態において、薬剤は親和性分子である。別の例では、薬剤はアジド基であり、この基は、別の分子のアルキニル基と反応して、固体支持体と他の分子との会合または結合を容易にすることができる。
タンパク質、ポリペプチドまたはペプチドは、「クリック化学」と呼ばれる方法を使用して固体支持体に接合することができる。この目的のために、迅速かつ実質的に不可逆的な任意の反応を使用して、タンパク質、ポリペプチドまたはペプチドを固体支持体に付着させることができる。例示的な反応としては、アジドとアルキンの銅触媒反応によるトリアゾールの形成(ヒュスゲン1,3-双極環化付加)、歪み促進型アジドアルキン付加環化(SPAAC)、ジエンおよびジエノフィルの反応(ディールス-アルダー)、歪み促進型アルキン-ニトロン付加環化、歪みアルケンとアジド、テトラジンまたはテトラゾールとの反応、アルケンおよびアジド[3+2]環化付加、アルケンおよびテトラジン逆電子要求ディールス-アルダー(IEDDA)反応(例えば、m-テトラジン(mTet)もしくはフェニルテトラジン(pTet)およびトランス-シクロオクテン(TCO);またはpTetおよびアルケン)、アルケンおよびテトラゾール光反応、アジドおよびホスフィンのシュタウディンガーライゲーション、ならびに求電子性原子上の求核攻撃による脱離基の置換などのさまざまな置換反応が挙げられる(Horisawa,Front Physiol(2014).5:457;Knall,Hollauf et al.,Tetrahedron Lett(2014)55(34):4763-4766)。例示的な置換反応には、アミンと、活性化エステル、N-ヒドロキシスクシンイミドエステル、イソシアネート、イソチオシアネート、アルデヒド、エポキシドなどとの反応が含まれる。
いくつかの実施形態において、ポリペプチドおよび固体支持体は、2つの相補的反応性基の反応によって形成することができる官能基、例えば、前述の「クリック」反応のうちの1つの生成物である官能基によって接合される。さまざまな実施形態において、官能基は、アルデヒド、オキシム、ヒドラジド、アルキン、アミン、アジド、アシルアジド、アシルハライド、ニトリル、ニトロン、スルフヒドリル、ジスルフィド、スルホニルハライド、イソチオシアネート、イミドエステル、活性化エステル(例えば、N-ヒドロキシスクシンイミドエステル、ペンチン酸STPエステル)、ケトン、α,β-不飽和カルボニル、アルケン、マレイミド、α-ハロイミド、エポキシド、アジリジン、テトラジン、テトラゾール、ホスフィン、ビオチン、またはチイラン官能基と、相補的反応性基との反応によって形成され得る。例示的な反応は、アミン(例えば、一級アミン)とN-ヒドロキシスクシンイミドエステルまたはイソチオシアネートとの反応である。
いくつかの実施形態において、官能基は、アルケン、エステル、アミド、チオエステル、ジスルフィド、炭素環式、複素環式またはヘテロアリール基を含む。さらなる実施形態において、官能基は、アルケン、エステル、アミド、チオエステル、チオ尿素、ジスルフィド、炭素環式、複素環式またはヘテロアリール基を含む。他の実施形態において、官能基は、アミドまたはチオ尿素を含む。いくつかのより具体的な実施形態において、官能基は、トリアゾリル官能基、アミド、またはチオ尿素官能基である。
いくつかの実施形態において、iEDDAクリック化学は、迅速であり、かつ、低入力濃度で高収率を実現するという理由で、ポリペプチドを固体支持体に固定化するために使用される。別の実施形態において、m-テトラジンは結合安定性が改善されているので、テトラジンではなくm-テトラジンがiEDDAクリック化学反応において使用される。別の実施形態において、フェニルテトラジン(pTet)は、iEDDAクリック化学反応において使用される。
いくつかの実施形態において、基質表面をTCOで官能化し、記録タグ標識タンパク質、ポリペプチド、ペプチドを、付着したm-テトラジン部分を介して、TCOでコーティングされた基質表面に固定化する。
いくつかの実施形態において、ポリペプチドを、例えば、アミン、カルボキシルまたはスルフィドリル基を介して、そのC末端、N末端または内部アミノ酸によって固体支持体の表面に固定化する。アミン基へのカップリングに使用される標準的な活性化支持体には、CNBr活性化、NHS活性化、アルデヒド活性化、アズラクトン活性化およびCDI活性化支持体が含まれる。カルボキシルカップリングで使用される標準的な活性化支持体には、アミン支持体にカップリングするカルボジイミド活性化カルボキシル部分が含まれる。システインカップリングは、マレイミド、イドアセチルおよびピリジルジスルフィド活性化支持体を使用することができる。ペプチドカルボキシ末端固定化の代替様式は、トリプシンの触媒的に不活性な誘導体であるアンヒドロトリプシンを使用し、C末端にリジンまたはアルギニン残基を含むペプチドを切断せずに結合する。
特定の実施形態では、ポリペプチドを、タンパク質、ポリペプチドまたはペプチドのリジン基への固体表面結合リンカーの共有結合を介して、固体支持体に固定化する。
特定の実施形態において、最初に、ポリペプチドをDNAタグで標識し、キメラDNA-ポリペプチド分子を、核酸ハイブリダイゼーションおよび固体支持体に付着したDNA配列へのライゲーションを介して、固体支持体に固定化する。いくつかの実施形態において、ペプチドへのタンパク質およびポリペプチドの断片化は、DNAタグまたはDNA記録タグを付着させる前または後に実行することができる。
B.ポリペプチドの任意選択的な処理
ポリペプチドのサンプルは、固体支持体に付着する前にタンパク質分画法を受けることができ、タンパク質またはペプチドは、細胞位置、分子量、疎水性もしくは等電点などの1つ以上の特性、またはタンパク質濃縮法によって分離される。あるいは、またはさらに、タンパク質濃縮法を使用して、特定のタンパク質またはペプチドを選択することができる(例えば、Whiteaker et al.,(2007)Anal.Biochem.362:44-54)か、または特定の翻訳後修飾を選択することができる(例えば、Huang et al.,(2014)J.Chromatogr.A 1372:1-17)。あるいは、免疫グロブリンなどの1つ以上の特定クラスのタンパク質、またはIgGなどの免疫グロブリン(Ig)アイソタイプを、分析のためにアフィニティー濃縮または選択することができる。免疫グロブリン分子の場合、親和性結合に関与する超可変配列の配列および存在量または頻度の分析は、特にそれらが疾患の進行に応答して変化するか、または健康、免疫、および/もしくは疾患の表現型と相関するので、特に興味深い。標準的な免疫親和性法を使用して、過剰に豊富なタンパク質をサンプルから減算することもできる。豊富なタンパク質の除去は、タンパク質成分の80%超がアルブミンおよび免疫グロブリンである血漿サンプルに役立つ可能性がある。PROTIAおよびPROT20(Sigma-Aldrich)などの、過剰に豊富なタンパク質の血漿サンプルを除去する(depletion)ためのいくつかの市販製品が入手可能である。
いくつかの実施形態において、本明細書において提供される方法は、正準化されたポリペプチドに対して実行することができる。いくつかの実施形態において、サンプルからの特定のタンパク質種(例えば、非常に豊富なタンパク質)の減算が実行される。これは、例えば、SigmaのPROT20免疫除去キットなどの市販のタンパク質除去試薬を使用して達成することができる。これは、上位20個の血漿タンパク質を除去する。さらに、ダイナミックレンジを、さらに管理可能な3~4オーダーにまで大幅に縮小したアプローチがあると便利である。特定の実施形態において、タンパク質サンプルのダイナミックレンジは、電気泳動および液体クロマトグラフィーを含む標準的な分画法を使用してタンパク質サンプルを分画する(Zhou et al.,Anal Chem(2012)84(2):720-734)か、または限られた容量のタンパク質結合ビーズ/樹脂(例えば、ヒドロキシル化シリカ粒子)が充填されたコンパートメント(例えば、液滴)に画分を分割し(McCormick,Anal Biochem(1989)181(1):66-74)、結合タンパク質を溶出することよって調節することができる。区画化された各画分の過剰なタンパク質は、洗い流される。
電気泳動法の例としては、キャピラリー電気泳動(CE)、キャピラリー等電点電気泳動(CIEF)、キャピラリー等電点電気泳動(CITP)、フリーフロー電気泳動、ゲル溶出液体画分捕捉電気泳動(GELFrEE)が挙げられる。液体クロマトグラフィータンパク質分離法の例としては、逆相(RP)、イオン交換(IE)、サイズ排除(SE)、親水性相互作用などが挙げられる。コンパートメントパーティションの例としては、エマルジョン、液滴、マイクロウェル、平坦な基質上の物理的に分離された領域などが挙げられる。例示的なタンパク質結合ビーズ/樹脂には、フェノール基または親水性基で誘導体化されたシリカナノ粒子が挙げられる(例えば、StrataClean Resin from Agilent Technologies,RapidClean from LabTechなど)。ビーズ/樹脂の結合能力を制限することにより、所与の画分に溶出する非常に豊富なタンパク質が、ビーズに部分的にのみ結合し、過剰なタンパク質が除去される。
III.修飾された切断および関連方法の例示的な使用
本明細書において提供されるのは、ポリペプチドを、修飾された切断酵素と接触させることを含む、1つ以上のポリペプチドを処理する方法である。いくつかの実施形態において、修飾された切断酵素は、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含み、修飾された切断酵素は、ジペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を除去する。いくつかの実施形態において、修飾された切断酵素は、トリペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を、もしくはポリペプチドから単一の標識末端ジペプチドを除去する。いくつかの実施形態において、セクションIに記載されるように、ポリペプチドを、修飾された切断酵素のうちのいずれか1つ以上と接触させる。いくつかの実施形態において、この方法は、末端アミノ酸を標識するための試薬とポリペプチドを接触させることをさらに含む。いくつかの実施形態において、末端アミノ酸を標識するための試薬との接触は、セクションIAに記載される試薬のうちのいずれか1つ以上との接触である。いくつかの実施形態において、ポリペプチドを、修飾された切断酵素と接触させ、試薬と接触させて末端アミノ酸を標識する1つ以上のサイクルが、図2A~2Cに示されるような周期的な方式で行われる。いくつかの実施形態において、ポリペプチドは、支持体に結合する。いくつかの実施形態において、この方法は、ポリペプチドを固体支持体に(例えば、直接的または間接的に)接合することを含む。いくつかの実施形態において、提供される修飾された切断酵素を使用するペプチドからのNTAAの除去は、PCT公開第WO2019/089846号に記載されるような、ペプチドからNTAAを除去するための化学的方法と組み合わせることができる。いくつかの実施形態において、除去された標識末端アミノ酸は、単一のアミノ酸として、またはジペプチドの一部として除去される。
いくつかの実施形態において、本明細書において提供される修飾された切断酵素を使用して、分析および/または配列決定されるポリペプチドを処理することができる。いくつかの実施形態において、方法は、ポリペプチドの少なくとも一部分の配列を決定するためのものである。いくつかの実施形態において、提供される方法は、分解によるポリペプチド配列決定アッセイとの関連で使用することができる。場合によっては、この方法は、国際特許公開第WO2017/192633号に記載される方法のうちのいずれかを実行することを含み得る。場合によっては、ポリペプチドの配列は、伸長記録タグなどのポリペプチド配列を表す伸長記録タグ(例えば、DNA配列)の構築によって分析される。場合によっては、本明細書において提供される方法は、ProteoCodeアッセイに適用されるか、またはProteoCodeアッセイと組み合わせて使用することができる。環状分解によるポリペプチド分析法を採用するいくつかの実施形態において、提供される修飾された切断酵素は、特定の利点を付与する。例えば、標識アミノ酸の認識および除去は、アッセイの他のステップを実行し得る(例えば、結合剤によりNTAAを結合すること、およびNTAAの情報を記録タグへ記録すること)前に、ポリペプチドからアミノ酸を連続して除去し得る未標識のアミノ酸を除去する酵素と比較して、アミノ酸除去を中断させる場合がある。したがって、場合によっては、標識アミノ酸を認識して除去することにより、修飾された切断酵素は、標識ステップが行われた後にのみNTAAを除去する。それにより、修飾された切断酵素は、未標識のアミノ酸を除去する未修飾の切断酵素と比較して、アミノ酸除去に対する制御を行う。
いくつかの実施形態において、修飾された切断酵素を含む方法は、核酸(例えば、記録タグなどのDNA)を分解する条件の不在下で実施される。いくつかの実施形態において、修飾された切断酵素を含む方法は、核酸を分解する化学的条件の不在下で実施される。いくつかの実施形態において、修飾された切断酵素を含む方法は、分解によるポリペプチド配列決定アッセイ(例えば、国際特許公開第WO2007/192633号に記載される方法)と適合性のある条件下で実施される。場合によっては、修飾された切断酵素を含む方法は、核酸と適合性のある条件の存在下で実施される。いくつかの実施形態において、修飾された切断酵素を含む方法は、強酸または強塩基の不在下で実施される。いくつかの態様において、強酸は強酸無水物である。いくつかの例では、修飾された切断酵素を含む方法は、TFA無水物の不在下で行われる。
いくつかの実施形態において、この方法は、ポリペプチドを、2つ以上の修飾された切断酵素と接触させることを含む。場合によっては、さまざまな修飾された切断酵素は、異なる特徴、例えば、ポリペプチドに対する優先的な結合および/またはアミノ酸切断の差異を示し得る。いくつかの実施形態において、さまざまな修飾された切断酵素は、酵素の混合物として、または各々別々に、記載された方法のうちのいずれかにおいて使用され得る。いくつかの実施形態では、さまざまな修飾された切断酵素を、同時にまたは連続してポリペプチドと接触させる。
いくつかの実施形態では、ポリペプチドを、NTAAを脱離させるために1つ以上の追加の酵素(例えば、存在する場合、N末端プロリンを除去するためのプロリンアミノペプチダーゼ)と接触させる。本発明の方法は、任意選択的に、NTAAを標識するために提供される化学試薬のうちのいずれかで処理する前、処理中、または処理後に、1つ以上のNTAAを除去するための酵素(例えば、プロリンアミノペプチダーゼ)でポリペプチドを処理することを含み得る。本発明の方法は、任意選択的に、提供される修飾された切断酵素のうちのいずれかでの処理前、処理中、または処理後に、1つ以上のNTAAを除去するための酵素(例えば、プロリンアミノペプチダーゼ)でポリペプチドを処理することを含み得る。いくつかの実施形態において、酵素は、プロリンであるポリペプチドからNTAAを脱離させる。いくつかの特定の例では、酵素は、プロリンアミノペプチダーゼ、プロリンイミノペプチダーゼ(PIP)、またはピログルタメートアミノペプチダーゼ(pGAP)である。いくつかの実施形態では、1つ以上の修飾された切断酵素を他の酵素と組み合わせて使用して、ポリペプチドを処理する。いくつかの特定の場合において、修飾された切断酵素および/または他の酵素は、カクテルとして提供される。
いくつかの実施形態において、この方法は、ポリペプチドを、ポリペプチドの末端アミノ酸に結合することができる1つ以上の結合剤と接触させることをさらに含み、各結合剤は、結合剤に関する識別情報を有するコーディングタグを含む。場合によっては、結合剤は、ポリペプチドの標識末端アミノ酸に結合し得る。いくつかのさらなる実施形態において、この方法は、コーディングタグの識別情報をポリペプチドに付着した記録タグに転送し、それによってポリペプチド上に伸長記録タグを生成することをさらに含む。いくつかの特定の実施形態において、この方法は、ポリペプチドから、1つ以上の結合剤を除去または放出することをさらに含む。
いくつかの実施形態において、ポリペプチドをさまざまな試薬と接触させる1つ以上のステップは、例えば、修飾された切断酵素と、末端アミノ酸を標識するための試薬と、かつ/または結合試薬と接触することを含み、周期的に繰り返される。いくつかの実施形態において、本明細書において提供されるのは、ポリペプチドを分析するための方法であって、(a)ポリペプチドを、ポリペプチドの末端アミノ酸に結合することができる結合剤と接触させるステップであって、各結合剤が、結合剤に関する識別情報を有するコーディングタグを含む、ステップと、(b)コーディングタグの識別情報をポリペプチドと関連付けられた記録タグに転送して、伸長記録タグを生成するステップと、(c)ポリペプチドを試薬と接触させて、ポリペプチドの末端アミノ酸を標識するステップと、(d)ポリペプチドを、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む修飾された切断酵素と接触させるステップと、を含み、修飾された切断酵素が、ステップ(c)において試薬によって標識された単一の末端アミノ酸をポリペプチドから除去する、方法である。除去された末端アミノ酸は、単一のアミノ酸残基として、またはジペプチドの一部として除去され得る。いくつかの実施形態において、ステップ(a)~(d)は、「n」回の結合サイクルについて繰り返され、ポリペプチドに結合する各結合剤の各コーディングタグの情報は、前の結合サイクルから生成された伸長記録タグに転送されて、n次伸長記録タグを生成する。いくつかの特定の実施形態において、この方法は、(b1)複数のポリペプチドから、1つ以上の結合剤を除去または放出することをさらに含む。いくつかの実施形態において、ポリペプチドは、複数のポリペプチドを包含する。いくつかの実施形態では、ポリペプチドを、複数の結合剤と接触させる。いくつかの実施形態では、ポリペプチドを、2つ以上の結合剤と接触させる。
いくつかの例では、ステップ(a)はステップ(b)の前に実行され、ステップ(a)はステップ(c)の前に実行され、ステップ(a)はステップ(d)の前に実行され、ステップ(b)はステップ(c)の前に実行され、ステップ(b)はステップ(d)の前に実行され、ステップ(c)はステップ(a)の前に実行され、ステップ(c)はステップ(b)の前に実行され、および/またはステップ(c)はステップ(d)の前に実行される。いくつかの特定の実施形態において、ステップは、(a)、(b)、(c)および(d)の順序で実行される。いくつかの特定の実施形態において、ステップは、(c)、(a)、(b)および(d)の順序で実行される。いくつかの実施形態において、この方法は、(e)n次伸長記録タグを分析することをさらに含む。いくつかの実施形態において、この方法は、1つ以上の結合剤を除去することをさらに含む。いくつかの実施形態において、ステップ(b1)はステップ(a)の後に実行され、ステップ(b1)はステップ(b)の後に実行され、ステップ(b1)はステップ(c)の後に実行され、および/またはステップ(b1)はステップ(d)の後に実行される。
例示的なワークフローでは、ポリペプチドの処理および分析は以下の通りである:タンパク質分解消化物からのポリペプチドの大規模な集合(例えば、5000万~10億個またはそれ以上)を、単一の分子配列決定基質(例えば、ビーズ)上に好適な分子内間隔でランダムに固定化する。場合によっては、ポリペプチドを記録タグに付着させる。周期的に、各ペプチドの末端アミノ酸(例えば、N末端アミノ酸)を標識する(例えば、PTC、修飾PTC、Cbz、DNP、SNP、アセチル、グアニジニル、アミノグアニジニル、複素環式メタニミン)。場合によっては、末端アミノ酸の標識を後のステップとして実行することができる。各固定化されたペプチドの標識されたN末端アミノ酸(例えば、PITC-NTAA、Cbz-NTAA、DNP-NTAA、SNP-NTAA、アセチル-NTAA、グアニジニル化-NTAA、複素環式メタニミン-NTAA)を、コーディングタグに付着した同族のNTAA結合剤によって結合し、結合したNTAA結合剤と関連付けられたコーディングタグからの情報を、固定化したペプチドと関連付けられた記録タグに転送し、それによって伸長記録タグを生成する。いくつかの実施形態において、1つ以上の結合剤は、ポリペプチドから除去または放出される。標識されたNTAAは、標識された単一のアミノ酸をポリペプチドから除去することができる修飾された切断酵素と接触することによって除去される。標識、結合剤との接触、識別情報の転送、および単一アミノ酸の除去の1つ以上のサイクルを実行することができる。
いくつかの例では、下流の増幅および/またはDNA配列決定を容易にするために、最終的な伸長記録タグには、任意選択的に、ユニバーサルプライミング部位が隣接する。フォワードユニバーサルプライミング部位(例えば、IlluminaのP5-S1配列)は、元の記録タグ設計の一部であり得、リバースユニバーサルプライミング部位(例えば、IlluminaのP7-S2’配列)は、記録タグの伸長における最終ステップとして追加することができる。いくつかの実施形態において、フォワードおよびリバースプライミング部位の追加は、結合剤とは独立して行うことができる。
いくつかの実施形態において、分解によるペプチドまたはポリペプチド配列決定アッセイのプロセスにおけるステップの順序は、逆にするか、またはさまざまな順序で実行することができる。例えば、いくつかの実施形態において、末端アミノ酸標識は、ポリペプチドを結合剤に結合する前および/または後に実施することができる。いくつかの実施形態において、1つ以上の結合剤との接触は、ポリペプチドを、末端アミノ酸を標識するための試薬と接触させる前である。場合によっては、1つ以上の結合剤との接触は、ポリペプチドを、修飾された切断酵素と接触させて、標識末端アミノ酸を除去する前である。
いくつかの実施形態において、末端アミノ酸標識は、ポリペプチドを支持体に結合する前または後に実施することができる。いくつかの実施形態において、末端アミノ酸除去は、ポリペプチドを結合剤に結合する前および/または後に実施することができる。いくつかの実施形態において、末端アミノ酸を標識するための試薬とのポリペプチドの接触は、結合剤との接触の前であり、1つ以上の結合剤との接触は、修飾された切断酵素とポリペプチドとの接触の前である。いくつかの実施形態において、識別情報の伝達は、ポリペプチドを1つ以上の結合剤と接触させた後、およびポリペプチドを修飾された切断酵素と接触させる前に実行される。
任意のそのような実施形態のうちのいくつかにおいて、1つ以上の結合剤を除去することは、識別情報を、コーディングタグから、各ポリペプチドと関連付けられた記録タグに転送して、伸長記録タグを生成した後である。任意のそのような実施形態のうちのいくつかにおいて、1つ以上の結合剤を除去することは、ポリペプチドを試薬と接触させて、ポリペプチドの末端アミノ酸を標識する前である。いくつかの実施形態において、1つ以上の結合剤を除去することは、ポリペプチドを修飾された切断酵素と接触させる前である。
いくつかの実施形態において、タンパク質またはポリペプチドを処理するために提供される方法のステップのうちのいずれかの順序は、逆にするか、またはさまざまな順序で実行することができる。
A.ポリペプチドへの記録タグの付着
いくつかの実施形態において、提供される方法は、ポリペプチドを、修飾された切断酵素および任意選択的にポリペプチド分析のための他の試薬と接触させることを含む。一実施形態において、タンパク質またはポリペプチドを、標準的なアミンカップリング化学により、DNA記録タグで標識する。(例えば、リジン残基の)ε-アミノ基およびN末端アミノ基は、反応のpHに応じて、アミン反応性カップリング剤による標識に特に影響されやすい(Mendoza et al.,Mass Spectrom Rev(2009)28(5):785-815)。特定の実施形態において、記録タグは、反応性部分(例えば、固体表面への共役、多官能性リンカー、またはポリペプチド)、リンカー、ユニバーサルプライミング配列、バーコード(例えば、コンパートメントタグ、パーティションバーコード、サンプルバーコード、画分バーコード、またはそれらの任意の組み合わせ)、任意選択的なUMI、およびコーディングタグへの/からの情報転送を容易にするためのスペーサー(Sp)配列から構成される。ライゲーションが使用される場合、Sp配列は、1~8塩基のオーバーハングとして機能する場合がある。場合によっては、記録タグにはスペーサーが含まれない。別の実施形態では、最初にタンパク質をユニバーサルDNAタグで標識することができ、後でバーコードSp配列(サンプル、コンパートメント、スライド上の物理的位置などを表す)を、酵素的または酵素的または化学的カップリングステップを通じてタンパク質に付着させる。ユニバーサルDNAタグは、ポリペプチドを標識するために使用され、バーコード(例えば、コンパートメントタグ、記録タグなど)用の付着点として使用することができるヌクレオチドの短い配列を含む。例えば、記録タグは、その末端に、ユニバーサルDNAタグに相補的な配列を含み得る。特定の実施形態において、ユニバーサルDNAタグは、ユニバーサルプライミング配列である。標識タンパク質上のユニバーサルDNAタグを記録タグ内の相補配列(例えば、ビーズに結合)にハイブリダイゼーションすると、アニーリングされたユニバーサルDNAタグが、プライマー伸長を介して伸長され、記録タグ情報をDNAタグ付きタンパク質に転送し得る。特定の実施形態では、タンパク質を、ペプチドへのプロテイナーゼ消化の前に、ユニバーサルDNAタグで標識する。次に、消化物からの標識ペプチド上のユニバーサルDNAタグを、有益で効果的な記録タグに変換することができる。いくつかの実施形態において、ペプチドへのタンパク質およびポリペプチドの断片化は、DNAタグまたはDNA記録タグを付着させる前または後に実行することができる。
少なくとも1つの記録タグを、ポリペプチドと直接的または間接的に関連付けまたは共局在化させ、固体支持体に接合する。記録タグは、DNA、RNA、もしくははPNA、gPNA、GNA、HNA、BNA、XNA、TNAを含むポリヌクレオチド類似体、またはそれらの組み合わせを含み得る。記録タグは一本鎖、または部分的または完全に二本鎖であり得る。記録タグは、平滑末端または突出末端を有する場合がある。特定の実施形態では、結合剤がポリペプチドに結合すると、結合剤のコーディングタグの識別情報が記録タグに転送されて、伸長記録タグが生成される。伸長記録タグへのさらなる伸長は、後続の結合サイクルで行うことができる。
記録タグは、共有結合性の相互作用および非共有結合性の相互作用、またはそれらの任意の組み合わせを含む、当技術分野で既知である任意の手段によって、直接的または間接的に(例えば、リンカーを介して)固体支持体に接合することができる。例えば、記録タグは、ライゲーション反応によって固体支持体に接合され得る。あるいは、固体支持体は、記録タグの固体支持体への直接的または間接的接合を容易にするための薬剤またはコーティングを含むことができる。核酸分子を固体支持体(例えば、ビーズ)に固定化するための戦略は、米国特許第5,900,481号;Steinberg et al.(2004)Biopolymers 73:597-605;Lund et al.,(1988)Nucleic Acids Res.16:10861-10880)に記載されている。
特定の実施形態において、ポリペプチドおよび関連付けられた記録タグの共局在化は、ポリペプチドおよび記録タグを、固体支持体表面に直接付着した二官能性リンカーに共役することによって達成される(Steinberg et al.(2004)Biopolymers 73:597-605)。さらなる実施形態において、三官能性部分を使用して、固体支持体(例えば、ビーズ)を誘導体化し、得られる二官能性部分を、ポリペプチドおよび記録タグの両方にカップリングする。他の実施形態において、ポリペプチドおよび関連付けられた記録タグの共局在化は、関連付けられたDNA記録タグにポリペプチドをカップリングし、DNA装飾された固体支持体表面にキメラをライゲーションすることによって達成される。
ポリペプチドと固体支持体との付着に関して記載されたものなどの方法および試薬(例えば、クリック化学試薬および光親和性標識試薬)も、記録タグの付着に使用することができる。
特定の実施形態において、単一の記録タグは、好ましくは、ブロック解除されたN末端またはC末端アミノ酸への付着を介して、ポリペプチドに付着される。別の実施形態において、複数の記録タグは、ポリペプチド、好ましくはリジン残基またはペプチド骨格に付着する。いくつかの実施形態において、複数の記録タグで標識されたポリペプチドは、より小さなペプチドに断片化または消化され、各ペプチドは、平均して1つの記録タグで標識される。
特定の実施形態において、最初に、ポリペプチドをDNA記録タグで標識し、キメラDNA-ポリペプチド分子を、核酸ハイブリダイゼーションおよび固体支持体に付着したDNA配列へのライゲーションを介して、固体支持体に固定化する。
特定の実施形態において、記録タグは、固有分子識別子(UMI)が関連付けられた各ポリペプチドに固有の識別子タグを提供する、任意選択的なUMIを含む。UMIは、約3~約40の塩基、またはその部分範囲、例えば、約3個~約30個の塩基、約3個~約20個の塩基、もしくは約3個~約10個の塩基、もしくは約3個~約8個の塩基であり得る。いくつかの実施形態において、UMIは、約3の塩基、4個の塩基、5個の塩基、6個の塩基、7個の塩基、8個の塩基、9個の塩基、10個の塩基、11個の塩基、12個の塩基、13個の塩基、14個の塩基、15個の塩基、16個の塩基、17個の塩基、18個の塩基、19個の塩基、20個の塩基、25個の塩基、30個の塩基、35個の塩基、または40個の塩基の長さである。UMIを使用して、複数の伸長記録タグからの配列決定データをデコンボリューションして、個々のポリペプチドからの配列リードを識別することができる。いくつかの実施形態において、ポリペプチドのライブラリー内で、各ポリペプチドは、単一の記録タグと関連付けられ、各記録タグは、固有のUMIを含む。他の実施形態において、記録タグの複数のコピーは、単一のポリペプチドと関連付けられ、記録タグの各コピーは、同じUMIを含む。いくつかの実施形態において、UMIは、配列分析中にこれらの成分を区別することを容易にするために、結合剤のコーディングタグ内のスペーサーまたはエンコーダー配列とは異なる塩基配列を有する。
特定の実施形態において、記録タグは、例えば、存在する場合、UMI以外のバーコードを含む。バーコードは、長さが約3個~約30個の塩基、またはその部分範囲、例えば、約3個~約25個の塩基、約3個~約20個の塩基、約3個~約10個の塩基、約3個~約10個の塩基、約3個~約8個の塩基の核酸分子である。いくつかの実施形態において、バーコードは、約3個の塩基、4個の塩基、5個の塩基、6個の塩基、7個の塩基、8個の塩基、9個の塩基、10個の塩基、11個の塩基、12個の塩基、13個の塩基、14個の塩基、15個の塩基、20個の塩基、25個の塩基、または30個の塩基の長さである。一実施形態において、バーコードは、複数のサンプルまたはライブラリーの多重配列決定を可能にする。バーコードは、ポリペプチドが由来するパーティション、画分、コンパートメント、サンプル、空間的位置、またはライブラリーを識別するために使用され得る。バーコードを使用して、多重化された配列データをデコンボリューションし、個々のサンプルまたはライブラリーからの配列リードを識別することができる。例えば、バーコード付きビーズは、例えばプロテオームを分割する目的で、エマルジョンおよびサンプルの分配を含む方法に有用である。
バーコードは、液滴、マイクロウェル、固体支持体上の物理的領域などのコンパートメントに固有のバーコードが割り当てられるコンパートメントタグであり得る。コンパートメントと特定のバーコードとの関連付けは、コンパートメントに単一のバーコード付きビーズを封入することによって(例えば、バーコード付き液滴をコンパートメントに直接併合または追加することによって、バーコード試薬をコンパートメントに直接印刷または注入することによって)など、あらゆる方式で達成することができる。コンパートメント内のバーコード試薬は、コンパートメント内のポリペプチドまたはその断片にコンパートメント固有のバーコードを追加するために使用される。コンパートメントへのタンパク質の分割に適用されるバーコードは、分析されたペプチドをコンパートメント内の元のタンパク質分子にマッピングし直すために使用することができる。これにより、タンパク質の識別が大幅に容易になる。コンパートメントバーコードは、タンパク質複合体を識別するためにも使用することができる。
他の実施形態において、コンパートメントの集団のサブセットを表す複数のコンパートメントに、サブセットを表す固有のバーコードを割り当てることができる。
あるいは、バーコードは、サンプル識別バーコードであり得る。サンプルバーコードは、単一の反応容器内のサンプルのセットの多重分析に有用であるか、または単一の固体基質もしくは固体基質の集合(例えば、平面スライド、単一のチューブもしくは容器に含まれるビーズの集団など)に固定化される。多くの異なるサンプルからのポリペプチドを、サンプル固有のバーコードが付いた記録タグで標識し、次いで、すべてのサンプルを共にプールした後、固体支持体への固定化、周期的結合、および記録タグ分析を実行することができる。あるいは、DNAコードライブラリーの作製後までサンプルを分離しておき、サンプルバーコードをDNAコードライブラリーのPCR増幅中に付着させ、次いで、共に混合した後、配列決定を行うこともできる。このアプローチは、異なる豊度クラス(abundance classes)の分析物(例えば、タンパク質)をアッセイする際に役立ち得る。例えば、サンプルを分割してバーコードを付け、結合剤を使用して一部分を処理し低豊度分析物にし、結合剤を使用して他の部分を処理してより高い豊度の分析物にすることができる。特定の実施形態において、このアプローチは、特定のタンパク質分析物アッセイのダイナミックレンジを調整して、タンパク質分析物の標準的な発現レベルの「スイートスポット」内にあるようにするのに役立つ。
特定の実施形態において、複数の異なるサンプルからのポリペプチドは、サンプル固有のバーコードを含む記録タグで標識される。マルチサンプルのバーコード付きポリペプチドは、周期的な結合反応(cyclic binding reaction)前に、共に混合することができる。このようにして、デジタル逆相タンパク質アレイ(RPPA)の高度に多重化された代替物が効果的に作製される(Guo et al.,Proteome Sci(2012)10(1):56;Assadi,Lamerz et al.,Mol Cell Proteomics(2013)12(9):2615-2622;Akbani et al.2014;Mol Cell Proteomics(2014)13(7):1625-1643;Creighton et al.,Drug Des Devel Ther(2015)9:3519-3527)。デジタルRPPAのようなアッセイの作製は、トランスレーショナルリサーチ、バイオマーカーの検証、創薬、臨床、および精密医療において多くの用途がある。
特定の実施形態において、記録タグは、ユニバーサルプライミング部位、例えば、フォワードまたは5’ユニバーサルプライミング部位を含む。ユニバーサルプライミング部位は、ライブラリー増幅反応のプライミングおよび/または配列決定に使用することができる核酸配列である。ユニバーサルプライミング部位には、PCR増幅用のプライミング部位、フローセル表面上の相補的オリゴヌクレオチドにアニーリングするフローセルアダプター配列(例えば、Illuminaの次世代シーケンシング)、シーケンシングプライミング部位、またはそれらの組み合わせが含まれるが、これらに限定されない。ユニバーサルプライミング部位は、約10塩基~約60塩基であり得る。いくつかの実施形態において、ユニバーサルプライミング部位は、IlluminaのP5プライマー(5’-AATGATACGGCGACCACCGA-3’-配列番号3)またはIlluminaのP7プライマー(5’-CAAGCAGAAGACGGCATACGAGAT-3’-配列番号4)を含む。
特定の実施形態において、記録タグは、その末端、例えば3’末端にスペーサーを含む。本明細書で使用される場合、記録タグとの関連におけるスペーサー配列への言及は、その同族結合剤と関連付けられたスペーサー配列と同一のスペーサー配列、またはその同族結合剤と関連付けられたスペーサー配列に相補的なスペーサー配列を含む。記録タグ上の末端、例えば3’スペーサーは、(例えば、プライマー伸長または粘着末端ライゲーションのための相補的スペーサー配列のアニーリングにより)最初の結合サイクル中に同族結合剤の識別情報をそのコーディングタグから記録タグに転送することを可能にする。
一実施形態において、スペーサー配列は、長さが約1つ~20個の塩基またはその部分範囲、例えば、長さが約2つ~12個の塩基、もしくは長さが5~10個の塩基である。スペーサーの長さは、コーディングタグ情報を記録タグに転送するためのプライマー伸長反応の温度および反応条件などの要因に応じて変化し得る。いくつかの実施形態において、記録タグには、スペーサーが含まれない。
好ましい実施形態において、記録中のスペーサー配列は、記録タグ内の他の領域に対して最小限の相補性を有するように設計される。同様に、コーディングタグ内のスペーサー配列は、コーディングタグ内の他の領域に対して最小限の相補性を有する必要がある。言い換えれば、記録タグおよびコーディングタグのスペーサー配列は、記録タグまたはコーディングタグに存在する、固有分子識別子、バーコード(例えば、コンパートメント、パーティション、サンプル、空間位置)、ユニバーサルプライマー配列、エンコーダー配列、サイクル特異的配列などのコンポーネントに対して最小限の配列相補性を有する必要がある。
いくつかの実施形態において、ポリペプチドのライブラリーと関連付けられた記録タグは、共通のスペーサー配列を共有する。他の実施形態において、ポリペプチドのライブラリーと関連付けられた記録タグは、それらの同族結合剤の結合サイクル特異的スペーサー配列に相補的な結合サイクル特異的スペーサー配列を有し、これは、連結されていない伸長記録タグを使用する場合に有用であり得る。
場合によっては、伸長記録タグの集合は、連結可能である。例えば、結合サイクルが完了した後、ビーズ固体支持体、1個あたり平均して1つまたは1つ未満のポリペプチドを含む各ビーズ、ポリペプチドの部位に共局在化される伸長記録タグの集合を有する各ポリペプチドをエマルジョンに入れる。エマルジョンは、各液滴が平均して最大1つのビーズで占められるように形成される。任意選択的なアセンブリPCR反応をエマルジョン内で実行して、ビーズ上のポリペプチドと共局在化される伸長記録タグを増幅し、別々の伸長記録タグ上の異なるサイクル特異的配列間でプライミングすることにより、それらを同一直線上の順序で(in co-linear order)組み立てる(Xiong et al.,FEMS Microbiol Rev(2008)32(3):522-540)。その後、エマルジョンが破壊され、アセンブルされた伸長記録タグの配列が決定される。
別の実施形態において、DNA記録タグは、ユニバーサルプライミング配列(U1)、1つ以上のバーコード配列(BC)、および第1の結合サイクルに特異的なスペーサー配列(Sp1)から構成される。最初の結合サイクルでは、結合剤は、Sp1相補スペーサー、エンコーダーバーコード、任意選択的なサイクルバーコード、および2番目のスペーサー要素(Sp2)で構成されるDNAコーディングタグを使用する。少なくとも2つの異なるスペーサー要素を使用することの有用性は、最初の結合サイクルが潜在的にいくつかのDNA記録タグの1つを選択し、単一のDNA記録タグが伸長され、その結果、伸長されたDNA記録タグの最後に新たなSp2スペーサー要素が生じることである。2回目以降の結合サイクルでは、結合剤にはSp1’ではなくSp2’スペーサーのみが含まれる。このようにして、最初のサイクルからの単一の伸長記録タグのみが後続のサイクルで伸長される。別の実施形態において、2回目以降のサイクルは、結合剤特異的スペーサーを使用することができる。
いくつかの実施形態において、記録タグは、5’から3’方向、すなわち、ユニバーサルフォワード(または5’)プライミング配列、UMI、およびスペーサー配列を含む。いくつかの実施形態において、記録タグは、5’から3’方向、すなわち、ユニバーサルフォワード(または5’)プライミング配列、任意選択的なUMI、バーコード(例えば、サンプルバーコード、パーティションバーコード、コンパートメントバーコード、空間バーコード、または任意のそれらの組み合わせ)、およびスペーサー配列を含む。いくつかの実施形態において、記録タグは、5’から3’方向、すなわち、ユニバーサルフォワード(または5’)プライミング配列、バーコード(例えば、サンプルバーコード、パーティションバーコード、コンパートメントバーコード、空間バーコード、または任意のそれらの組み合わせ)、任意選択的なUMI、およびスペーサー配列を含む。
コンビナトリアルアプローチを使用して、修飾されたDNAおよびPNAからUMIを生成することができる。一例では、UMIは、互いに直交するように設計された短いワード配列(4~15mer)のセットを一緒に「化学的に連結」することによって構築され得る(Spiropulos and Heemstra 2012)。DNA鋳型は、「ワード」ポリマーの化学ライゲーションを指示するために使用される。DNA鋳型は、サブコンポーネントを溶液中で混合するだけで、コンビナトリアル鋳型構造を組み立てられるハイブリダイジングアームを用いて構成される。特定の実施形態において、この設計には「スペーサー」配列はない。ワードスペースのサイズは、数十ワード~10,000ワード以上、またはその部分範囲までさまざまであり得る。特定の実施形態において、ワードは、それらが互いに交雑しないように互いに異なり、それでも比較的均一なハイブリダイゼーション条件を有するように選択される。一実施形態において、ワードの長さは10個の塩基のオーダーであり、サブセットには約1000のワードが存在する(これは、合計10merのワード空間のわずか0.1%~410=100万ワードである)。これらのワード(サブセットでは1,000)のセットを一緒に連結して、複雑さ=1000乗(power)を有する最終コンビナトリアルUMIを生成することができる。一緒に4つのワードを連結した場合、これは、1012の異なる要素のUMI多様性を生成する。これらのUMI配列は、単一分子レベルでポリペプチドに付加される。一実施形態において、UMIの多様性は、UMIが付着するポリペプチドの分子の個数を超える。このようにして、UMIは目的のポリペプチドを一意に識別する。コンビナトリアルワードUMIを使用すると、長さが複数の塩基であるワードを読み取るのに単一の塩基分解能が不要となるため、エラー率が高いシーケンサー(例えば、ナノポアシーケンサー、ナノギャップトンネリングシーケンシングなど)での読み出しが容易になる。コンビナトリアルワードアプローチを使用して、コンパートメントタグ、パーティションバーコード、空間バーコード、サンプルバーコード、エンコーダー配列、サイクル特異的配列、およびバーコードなど、記録タグまたはコーディングタグの他のID情報コンポーネントを生成することもできる。エラー耐性のあるワード(コード)を含むDNAコード情報およびナノポアシーケンシングに関連する方法は、当技術分野で既知である(例えば、Kiah et al.,2015,Codes for DNA sequence profiles.IEEE International Symposium on Information Theory(ISIT);Gabrys et al.,2015,Asymmetric Lee distance codes for DNA-based storage.IEEE Symposium on Information Theory(ISIT);Laure et al.,2016,Coding in 2D:Using Intentional Dispersity to Enhance the Information Capacity of Sequence-Coded Polymer Barcodes.Angew.Chem.Int.Ed.doi:10.1002/anie.201605279;Yazdi et al.,2015,IEEE Transactions on Molecular,Biological and Multi-Scale Communications 1:230-248;and Yazdi et al.,2015,Sci Rep 5:14138(その各々は参照によりその全体が組み込まれる)を参照)。したがって、特定の実施形態において、本明細書に記載される実施形態のいずれかにおける伸長記録タグ、伸長コーディングタグ、またはジタグ構築物は、エラー訂正コードである識別コンポーネント(例えば、UMI、エンコーダー配列、バーコード、コンパートメントタグ、サイクル特異的配列など)から構成される。いくつかの実施形態において、エラー訂正コードは、Hammingコード、Lee距離コード、非対称Lee距離コード、Reed-Solomonコード、およびLevenshtein-Tenengoltsコードから選択される。ナノポアシーケンシングの場合、電流またはイオンフラックスプロファイルおよび非対称ベースコーリングエラーは、使用するナノポアおよび生化学のタイプに固有であり、この情報を使用して、前述のエラー訂正アプローチを用いて、より堅牢なDNAコードを設計することができる。堅牢なDNAナノポアシーケンシングバーコードを使用する代わりに、バーコード配列の電流またはイオンフラックスシグネチャを直接使用して(米国特許第7,060,507号(その全体が、参照により組み込まれる))、DNAベースコーリングを完全に回避し、Laszloら(2014,Nat.Biotechnol.32:829-833(その全体が参照により組み込まれる))によって記載されるように、予測された電流/フラックスシグネチャにマッピングし直すことにより、バーコード配列を即座に識別することができる。例えば、Laszloらは、異なるワード文字列をナノポアに通すときに生物学的ナノポアMspAによって生成される電流シグネチャ、および、結果として生じる電流シグネチャを、配列の領域(a universe of sequences)からの可能な電流シグネチャのインシリコ予測にマッピングし直すことによって、DNA鎖をマッピングして識別する能力について説明している(Laszlo et al.,(2014)Nat.Biotechnol.32:829-833)。同様の概念は、DNAコードおよびナノギャップトンネリング電流ベースのDNAシーケンシングによって生成される電気信号に適用することができる(Ohshiro et al.,2012,Sci Rep 2:501)。
したがって、特定の実施形態において、コーディングタグ、記録タグ、またはその両方の識別コンポーネントは、固有の電流もしくはイオンフラックスまたは光学的シグネチャを生成することができ、本明細書において提供される方法のうちのいずれかの分析ステップは、固有の電流もしくはイオンフラックスまたは光学的シグネチャを検出して、識別コンポーネントを識別することを含む。いくつかの実施形態において、識別コンポーネントは、エンコーダー配列、バーコード、UMI、コンパートメントタグ、サイクル特異的配列、またはそれらの任意の組み合わせから選択される。
特定の実施形態では、サンプル内のポリペプチドのすべてのまたは実質的な量(例えば、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、または100%)は、記録タグで標識される。ポリペプチドへの記録タグの付着は、ポリペプチドを固体支持体に固定化する前または後に行うことができる。
他の実施形態において、サンプル内のポリペプチドのサブセットは、記録タグで標識される。特定の実施形態において、サンプルからのポリペプチドのサブセットは、記録タグによる標的化された(分析物特異的)標識を受ける。タンパク質の標的化された記録タグ標識は、記録タグ内で相補的な標的特異的bait配列(例えば、分析物特異的バーコード)にアニーリングする短い標的特異的DNA捕捉プローブ(例えば分析物特異的バーコード)に連結された標的タンパク質特異的結合剤(例えば、抗体、アプタマーなど)を使用して達成される。記録タグは、標的タンパク質上に存在する同族の反応性部分に対する反応性部分を含む(例えば、クリック化学標識、光親和性標識)。例えば、記録タグは、アルキン誘導体化タンパク質と相互作用するためのアジド部分を含み得るか、または記録タグは、天然タンパク質などと相互作用するためのベンゾフェノンを含み得る。標的タンパク質特異的結合剤による標的タンパク質の結合時に、記録タグおよび標的タンパク質は、それらの対応する反応性を介してカップリングされる。標的タンパク質を記録タグで標識した後、標的タンパク質特異的結合剤を、標的タンパク質特異的結合剤に連結されたDNA捕捉プローブの消化によって除去してもよい。例えば、DNA捕捉プローブは、ウラシル塩基を含むように設計され得、次に、ウラシル特異的切除試薬(例えば、USER(商標))による消化の標的とされる。標的タンパク質特異的結合剤は、標的タンパク質から解離され得る。
一例では、標的タンパク質のセットに特異的な抗体を、相補的なbait配列で設計された記録タグとハイブリダイズするDNA捕捉プローブで標識することができる。タンパク質のサンプル特異的標識は、サンプル特異的バーコードで構成される記録タグ上で相補的なbait配列とハイブリダイズするDNA捕捉プローブ標識抗体を使用することで達成することができる。
別の例では、標的タンパク質特異的アプタマーは、サンプル内のタンパク質のサブセットの標的記録タグ標識に使用される。標的特異的アプタマーは、記録タグ内の相補的なbait配列でアニーリングするDNA捕捉プローブにリンクされる。記録タグは、対応する反応性部分を有する標的タンパク質にカップリングするための反応性化学または光反応性化学プローブ(例えば、ベンゾフェノン(BP))を含む。アプタマーはその標的タンパク質分子に結合し、記録タグを標的タンパク質に近接させ、その結果、記録タグが標的タンパク質にカップリングされる。
小分子タンパク質親和性リガンドに付着した光反応性化学プローブを使用する光親和性(PA)タンパク質標識は、以前に記載されている(Park,Koh et al.2016)。典型的な光反応性化学プローブには、ベンゾフェノン(反応性ジラジカル、365nm)、フェニルジアジリン(反応性炭素、365nm)、およびフェニルアジド(反応性ニトレンフリーラジカル、260nm)に基づくプローブが含まれ、以前に記載されたように照射波長で活性化される(Smith et al.,Future Med Chem.(2015)7(2):159-183)。好ましい実施形態において、タンパク質サンプル内の標的タンパク質は、Liらによって開示された方法を使用して、サンプルバーコードを含む記録タグで標識され、ベンゾフェノン標識記録タグにおけるbait配列は、同族結合剤に付着したDNA捕捉プローブにハイブリダイズされる(例えば、核酸アプタマー(Li et al.,Angew Chem Int Ed Engl(2013)52(36):9544-9549)。光親和性標識タンパク質標的の場合、光親和性部分が標的タンパク質ではなく抗体を自己標識することができるので、標的タンパク質特異的結合剤としてのDNA/RNAアプタマーの使用が抗体よりも好ましい。対照的に、光親和性標識は、タンパク質よりも核酸の効率が低く、アプタマーを、DNA指向性化学標識または光標識のためのより良い媒体にする。光親和性標識と同様に、Rosenらによって記載されるのと同様の方式で、アプタマー結合部位に近接する反応性リジン(または他の部分)のDNA指向性化学標識を使用することもできる。(Rosen et al,Nature Chemistry volume(2014)6:804-809;Kodal et al.,ChemBioChem(2016)17:1338-1342)。
前述の実施形態において、ハイブリダイゼーション以外の他のタイプの連結を使用して、標的特異的結合剤と記録タグを連結することができる。例えば、捕捉された標的タンパク質(または他のポリペプチド)が記録タグに共有結合されると、切断されて結合剤を放出するように設計されたリンカーを使用して、2つの部分を共有結合させることができる。好適なリンカーは、3’末端などの記録タグのさまざまな位置に、または記録タグの5’末端に付着したリンカー内に付着させることができる。
記録タグは、固体支持体への固定化の前または後に、タンパク質、ポリペプチドまたはペプチドに付着させることができる。例えば、タンパク質、ポリペプチドまたはペプチドを、最初に記録タグで標識し、次に、2つの官能性部分を含む記録タグを介して固体表面に固定化して、カップリングすることができる。記録タグの一方の官能性部分は、タンパク質に結合し、もう一方の官能性部分は、記録タグで標識されたタンパク質を固体支持体に固定化する。
他の実施形態において、ポリペプチドは、タンパク質、ポリペプチドまたはペプチドを記録タグで標識する前に、固体支持体に固定化される。例えば、最初に、タンパク質をクリック化学部分などの反応性基で誘導体化することができる。次に、活性化されたタンパク質分子を好適な固体支持体に付着させ、次に相補的なクリック化学部分を使用して記録タグで標識することができる。一例として、アルキンおよびmTet部分で誘導体化されたタンパク質を、アジドおよびTCOで誘導体化されたビーズに固定化し、アジドおよびTCOで標識された記録タグに付着してもよい。
特定の実施形態において、固体支持体の表面は、結合剤への非特異的吸収を最小限にするために不動態化(ブロック)される。「不動態化された」表面とは、結合剤の非特異的結合を最小限に抑えるために材料の外層で処理された表面を指す。表面を不動態化する方法には、ポリエチレングリコール(PEG)(Pan et al.,2015,Phys.Biol.12:045006)、ポリシロキサン(Pluronic F-127)、スターポリマー(例えば、スターPEG)(Groll et al.,2010,Methods Enzymol.472:1-18)、疎水性ジクロロジメチルシラン(DDS)+自己組織化Tween-20(Hua et al.,2014,Nat.Methods11:1233-1236)、ダイヤモンド様炭素(DLC)、DLC+PEG(Stavis et al.,2011,Proc.Natl.Acad.Sci.USA 108:983-988)、および両性イオン部分(例えば、米国特許出願公開第US2006/0183863号)が含まれる。共有表面修飾に加えて、Tween-20のような界面活性剤、溶液中のポリシロキサン(Pluronicシリーズ)、ポリビニルアルコール(PVA)、BSAおよびカゼインのようなタンパク質を含む多くの不動態化剤を使用することもできる。あるいは、タンパク質、ポリペプチドまたはペプチドの密度は、タンパク質、ポリペプチドまたはペプチドを固体基質に固定化するときに競合物質または「ダミー」反応性分子をスパイクすることによって、固体基質の表面上またはその体積内で滴定することができる。
複数のポリペプチドが同じ固体支持体上に固定化される特定の実施形態において、ポリペプチド同士の間隔を適切に設けることにより、例えば、結合剤が第1のポリペプチドに結合し、そのコーディングタグ情報が、最初のポリペプチドと関連付けられた記録タグではなく、隣接するポリペプチドと関連付けられた記録タグに転送される場合など、交差結合または分子間事象の発生を低減または防止することができる。固体支持体上のポリペプチド間隔を制御するために、官能性カップリング基(例えば、TCO)の密度を基質表面上で滴定することができる。いくつかの実施形態において、複数のポリペプチドは、約50nm~約500nmの距離、またはその部分範囲、例えば、約50nm~約400nm、もしくは約50nm~約300nm、もしくは約50nm~約200nm、もしくは約50nm~約100nmの距離で、固体支持体の表面上または体積内(例えば、多孔質支持体)に間隔を置いて配置される。いくつかの実施形態において、複数のポリペプチドは、少なくとも50nm、少なくとも60nm、少なくとも70nm、少なくとも80nm、少なくとも90nm、少なくとも100nm、少なくとも150nm、少なくとも200nm、少なくとも250nm、少なくとも300nm、少なくとも350nm、少なくとも400nm、少なくとも450nm、または少なくとも500nmの平均距離で、固体支持体の表面上に間隔を置いて配置される。いくつかの実施形態において、複数のポリペプチドは、少なくとも50nmの平均距離で、固体支持体の表面上に間隔を置いて配置される。いくつかの実施形態において、ポリペプチドは、経験的に、分子間から分子内事象の相対頻度が<1:10、<1:100、<1:1,000、または<1:10,000であるように、固体支持体の表面上または体積内に間隔を置いて配置される。好適な間隔頻度は、機能的アッセイを使用して経験的に決定することができ(国際特許公開第WO2017/192633号の実施例31を参照)、希釈することにより、および/または基質表面の付着部位をめぐって競合する「ダミー」スペーサー分子をスパイクすることにより達成することができる。
例えば、PEG-5000(分子量:約5000)は、基質表面(例えば、ビーズ表面)上のペプチド間の隙間をブロックするために使用される。さらに、ペプチドは、PEG-5000分子にも付着した官能性部分にカップリングする。いくつかの実施形態において、これは、NHS-PEG-5000-TCO+NHS-PEG-5000-メチルの混合物をアミン誘導体化ビーズにカップリングすることによって達成される。2つのPEG間の化学量論比(TCO対メチル)を滴定して、基質表面に好適な密度の機能的カップリング部分(TCO基)を生成する。メチルPEGはカップリングに対して不活性である。TCO基間の有効な間隔は、表面のTCO基の密度を測定することで計算することができる。特定の実施形態において、固体表面上のカップリング部分(例えば、TCO)間の平均間隔は、少なくとも50nm、少なくとも100nm、少なくとも250nm、または少なくとも500nmである。ビーズのPEG5000-TCO/メチル誘導体化後、表面の過剰なNH基を反応性無水物(コハク酸無水物またはコハク酸無水物など)でクエンチする。他のMWPEGも、分子量が約300Da~50kDaを超える不動態化に使用することができる。
いくつかの実施形態において、間隔は、基質表面上の利用可能な付着分子の比率を滴定することによって達成される。いくつかの例では、基質表面(例えば、ビーズ表面)は、活性化剤(例えば、活性化剤はEDCおよびスルホ-NHSである)で処理されるカルボキシル基(COOH)で官能化される。いくつかの例では、基質表面(例えば、ビーズ表面)は、NHS部分を含む。いくつかの実施形態において、mPEG-NHおよびNH-PEG-mTetの混合物が、活性化されたビーズに添加される(式中、nは、1~100などの任意の数値である)。mPEG-NH(カップリングには利用不可)とNH-PEG24-mTet(カップリングに利用可能)の比率を滴定して、分析物を基質表面に付着させるために利用可能な官能性部分の好適な密度を生成する。特定の実施形態において、固体表面上のカップリング部分(例えば、NH-PEG-mTet)間の平均間隔は、少なくとも50nm、少なくとも100nm、少なくとも250nm、または少なくとも500nmである。いくつかの特定の実施形態において、NH-PEG-mTet対mPEG-NHの比は、約1:1000以上、約1:10,000以上、約1:100,000以上、または約1:1,000,000以上である。いくつかのさらなる実施形態において、捕捉核酸は、NH2-PEG-mTetに付着する。
特定の実施形態において、ポリペプチド(複数可)および/または記録タグ(複数可)は、(i)第1のポリペプチドに結合したコーディング剤(特に、その結合したコーディング剤のコーディングタグ)と(ii)第2のポリペプチドおよび/またはその記録タグとの間の相互作用が、低減、最小化、または完全に排除されるような密度で基質または支持体上に固定化される。したがって、「分子間」エンゲージメントに起因する偽陽性アッセイシグナルを低減、最小化、または排除することができる。
特定の実施形態において、基質上のポリペプチドおよび/または記録タグの密度は、各タイプのポリペプチドについて決定される。例えば、変性ポリペプチド鎖が長いほど、「分子間」相互作用を低減、最小化、または防止するために密度を低くする必要がある。特定の態様において、ポリペプチド分子および/または記録タグ間の間隔を増加させること(すなわち、密度を低下させること)は、現在開示されるアッセイのシグナル対バックグラウンド比を増加させる。
いくつかの実施形態において、ポリペプチド分子および/または記録タグは、任意の好適な平均密度で、例えば、約0.0001個の分子/μm、0.001個の分子/μm、0.01個の分子/μm、0.1個の分子/μm、1個の分子/μm、約2個の分子/μm、約3個の分子/μm、約4個の分子/μm、約5個の分子μm、約6個の分子μm、約7個の分子μm、約8個の分子μm、約9個の分子μm、または約10個の分子μmの平均密度で、基質上に堆積または固定化される。他の実施形態において、ポリペプチド(複数可)および/または記録タグ(複数可)は、約15個、約20個、約25個、約30個、約35個、約40個、約45個、約50個、約55個、約60個、約65個、約70個、約75個、約80個、約85個、約90個、約95個、約100個、約105個、約110個、約115個、約120個、約125個、約130個、約135個、約140個、約145個、約150個、約155個、約160個、約165個、約170個、約175個、約180個、約185個、約190個、約195個、約200個、または約200個の分子/μmの平均密度で、基質上に堆積または固定化される。他の実施形態において、ポリペプチド(複数可)および/または記録タグ(複数可)は、約1個の分子/mm、約10個の分子/mm、約50個の分子/mm、約100個の分子/mm、約150個の分子/mm、約200個の分子/mm、約250個の分子/mm、約300個の分子/mm、約350個の分子/mm、400個の分子/mm、約450個の分子/mm、約500個の分子/mm、約550個の分子/mm、約600個の分子/mm、約650個の分子/mm、約700個の分子/mm、約750個の分子/mm、約800個の分子/mm、約850個の分子/mm、約900個の分子/mm、約950個の分子/mm、または約1000個の分子/mmの平均密度で、基質上に堆積または固定化される。さらに他の実施形態において、ポリペプチド(複数可)および/または記録タグ(複数可)は、約1×10~約0.5×10個の分子/mm、約0.5×10~約1×10個の分子/mm、約1×10~約0.5×10個の分子/mm、約0.5×10~約1×10個の分子/mm、約1×10~約0.5×10個の分子/mm、または約0.5×10~約1×10個の分子/mmの平均密度で、基質上に堆積または固定化される。他の実施形態において、基質上に堆積または固定化されるポリペプチド(複数可)および/または記録タグ(複数可)は、例えば、約1個の分子/cm~約5個の分子/cm、約5~約10個の分子/cm、約10~約50個の分子/cm、約50~約100個の分子/cm、約100~約0.5×10個の分子/cm、約0.5×10~約1×10個の分子/cm、1×10~約0.5×10個の分子/cm、約0.5×10~約1×10個の分子/cm、約1×10~約0.5×10個の分子/cm、約0.5×10~約1×10個の分子/cm、約1×10~約0.5×10個の分子/cm、または約0.5×10~約1×10個の分子/cmである。
B.コーディングタグ情報の記録タグへの周期的な転送
本明細書に記載の方法では、結合剤がポリペプチドに結合すると、その連結されたコーディングタグの識別情報が、ポリペプチドと関連付けられた記録タグに転送され、それによって「伸長記録タグ」が生成される。伸長記録タグは、実行された各結合サイクルを表す結合剤のコーディングタグからの情報を含み得る。しかしながら、伸長記録タグはまた、例えば、結合剤がポリペプチドに結合することができないために、コーディングタグが欠落しているか、損傷しているか、または欠陥があるために、プライマー伸長反応が失敗したために、「欠落した」結合サイクルを経験する場合がある。結合事象が発生した場合でも、コーディングタグから記録タグへの情報の転送が不完全であるか、100%未満の精度である可能性がある。例えば、これは、コーディングタグが損傷しているか、欠陥があるため、プライマー伸長反応においてエラーが発生したためである。したがって、伸長記録タグは、その関連付けられたポリペプチドで発生した結合事象の100%、または最大95%、90%、85%、80%、75%、70%、65%、60%、65%、55%、50%、45%、40%、35%、30%、もしくはその部分範囲を表し得る。さらに、伸長記録タグに存在するコーディングタグ情報は、対応するコーディングタグに対して少なくとも30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または100%の同一性を有し得る。
特定の実施形態において、結合剤は、NTAA、CTAA、介在アミノ酸、ジペプチド(2つのアミノ酸の配列)、トリペプチド(3つのアミノ酸の配列)、またはペプチド分子のより高次のペプチドに結合し得る。いくつかの実施形態において、結合剤のライブラリー中の各結合剤は、特定のアミノ酸、例えば、20個の標準的な天然に存在するアミノ酸のうちの1つに選択的に結合する。標準的な天然アミノ酸としては、アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リジン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、スレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)が挙げられる。いくつかの実施形態において、結合剤は、未修飾または天然のアミノ酸に結合する。いくつかの例では、結合剤は、未修飾または天然のジペプチド(2つのアミノ酸の配列)、トリペプチド(3つのアミノ酸の配列)、またはペプチド分子のより高次のペプチドに結合する。結合剤は、天然または未修飾のNTAAに対する高い親和性、天然または未修飾のNTAAに対する高い特異性、あるいはその両方のために設計され得る。いくつかの実施形態において、結合剤は、ファージディスプレイを使用する有望な親和性足場の指向性進化を通じて開発することができる。
結合剤は、ペプチド、ポリペプチド、もしくはタンパク質分子のN末端ペプチド、C末端ペプチド、または介在ペプチドに結合し得る。結合剤は、ペプチド分子のN末端アミノ酸、C末端アミノ酸、または介在アミノ酸に結合し得る。結合剤は、N末端またはC末端のジアミノ酸部分に結合し得る。結合剤は、好ましくは、化学的に修飾または標識されたアミノ酸に結合し得る。例えば、結合剤は、好ましくは、前述の部分を持たないアミノ酸上で、アセチル部分、Cbz部分、グアニル部分、ダンシル部分、PTC部分、DNP部分、SNP部分、複素環メタニミン部分などで官能化されたアミノ酸に結合し得る。
特定の実施形態において、伸長記録タグは、複数の連続する結合事象を表す複数のコーディングタグからの情報を含み得る。これらの実施形態において、単一の連結された伸長記録タグは、単一のポリペプチドを表すことができる。本明細書で言及されるように、記録タグへのコーディングタグ情報の転送はまた、複数の連続する結合事象を含む方法において起こるような、伸長記録タグへの転送を含む。
特定の実施形態において、結合事象情報は、周期的にコーディングタグから記録タグに転送される。交差反応性結合事象は、2つ以上の独立した結合事象を識別する少なくとも2つの異なるコーディングタグが同じクラスの結合剤(特定のタンパク質と同族)にマッピングされることを要求することにより、配列決定後に情報から(informatically)除外することができる。任意選択的なサンプルまたはコンパートメントバーコードは、任意選択的なUMI配列と同様に記録タグに含めることができる。コーディングタグには、エンコーダーおよびスペーサー配列と共に任意選択的なUMI配列を含めることもできる。ユニバーサルプライミング配列は、増幅およびNGSシーケンシング用の伸長記録タグに含めることもできる。
特定の結合剤に関連するコーディングタグ情報は、さまざまな方法を使用して記録タグに転送され得る。特定の実施形態において、コーディングタグの情報は、プライマー伸長を介して記録タグに転送される(Chan,McGregor et al.2015)。記録タグの3’末端のスペーサー配列または伸長記録タグは、コーディングタグの3’末端の相補的スペーサー配列とアニーリングし、ポリメラーゼ(例えば、鎖置換ポリメラーゼ)は、鋳型としてのアニーリングされたコーディングタグを使用して、記録タグ配列を伸長する。いくつかの実施形態において、コーディングタグエンコーダー配列および5’スペーサーに相補的なオリゴヌクレオチドをコーディングタグに事前にアニーリングして、伸長記録タグに存在する内部エンコーダーおよびスペーサー配列へのコーディングタグのハイブリダイゼーションを防ぐことができる。依然として一本鎖の状態であるコーディングタグ上の3’末端スペーサーは、好ましくは、記録タグ上の末端3’スペーサーに結合する。他の実施形態において、発生期の記録タグを一本鎖結合タンパク質でコーティングして、内部部位へのコーディングタグのアニーリングを防ぐことができる。あるいは、発生期の記録タグをRecA(またはuvsXなどの関連する相同体)でコーティングして、完全に二本鎖のコーディングタグへの3’末端の侵入を促進することもできる(Bell et al.,2012,Nature 491:274-278)。この構成は、二本鎖コーディングタグが内部記録タグ要素と相互作用するのを防ぐが、伸長記録タグのRecAコーティングされた3’テールによる鎖侵入の影響を受けやすくなる(Bell,et al.,2015,Elife 4:e08646)。一本鎖結合タンパク質の存在は、鎖置換反応を促進する可能性がある。
いくつかの実施形態において、プライマー伸長のために使用されるDNAポリメラーゼは、鎖置換活性を有し、3’-5エキソヌクレアーゼ活性が制限されたるか、または欠如する。このようなポリメラーゼの多くの例のいくつかには、クレノウエキソ-(DNA Pol 1のクレノウ断片)、T4 DNAポリメラーゼエキソ-、T7 DNAポリメラーゼエキソ(Sequenase 2.0)、Pfuエキソ-、Ventエキソ-、Deep Ventエキソ-、Bst DNAポリメラーゼラーゼ断片エキソ-、Bca Pol、9°N Pol、およびPhi29 Polエキソ-が含まれる。好ましい実施形態において、DNAポリメラーゼは、室温および45℃までで活性である。別の実施形態において、好熱性ポリメラーゼの「ウォームスタート」バージョンは、ポリメラーゼが活性化され、約40℃~50℃で使用されるように採用される。例示的なウォームスタートポリメラーゼは、Bst 2.0 Warm Start DNAポリメラーゼ(New England Biolabs)である。
鎖置換複製に有用な添加剤には、E.coliのSSBタンパク質、ファージT4遺伝子32産物、ファージT7遺伝子2.5タンパク質、ファージPf3 SSB、複製タンパク質ARPA32およびRPA14サブユニット(Wold,1997)などの、細菌、ウイルス、または真核生物由来の多数の一本鎖DNA結合タンパク質(SSBタンパク質)のうちのいずれか;アデノウイルスDNA結合タンパク質、単純ヘルペスタンパク質ICP8、BMRF1ポリメラーゼアクセサリーサブユニット、ヘルペスウイルスUL29SSB様タンパク質などの、他のDNA結合タンパク質;ファージT7ヘリカーゼ/プリマーゼ、ファージT4遺伝子41ヘリカーゼ、E.coli Repヘリカーゼ、E.coli recBCDヘリカーゼ、recA、E.coli、真核生物トポイソメラーゼ(Annu Rev Biochem.(2001)70:369-413)などの、DNA複製に関与することが知られている多くの複製複合体タンパク質のうちのいずれかが含まれる。
再コーディング(recoding)タグの末端スペーサー配列が伸長自己伸長をプライミングする場合などのミスプライミングまたは自己プライミング事象は、一本鎖結合タンパク質(T4遺伝子32、E.coli SSBなど)、DMSO(1~10%)、ホルムアミド(1~10%)、BSA(10~100ug/ml)、TMAC1(1~5mM)、硫酸アンモニウム(10~50mM)、ベタイン(1~3M)、グリセロール(5~40%)、またはエチレングリコール(5~40%)をプライマー伸長反応に含めることによって最小限に抑えることができる。
クレノウエキソ-、T7 DNAポリメラーゼエキソ-(Sequenase 2.0)などのほとんどのタイプAポリメラーゼは、3’エキソヌクレアーゼ活性(内因性または操作による除去)を欠いており、Taqポリメラーゼは、ヌクレオチド、好ましくはアデノシン塩基(配列との関連に応じて、程度は低いがG塩基)の、二重増幅産物の3’平滑末端への非鋳型的付加を触媒する。Taqポリメラーゼの場合、3’ピリミジン(C>T)は非鋳型的アデノシン付加を最小限に抑えるが、3’プリンヌクレオチド(G>A)は鋳型化されていないアデノシンの付加を優先する。いくつかの実施形態において、プライマー伸長のためにTaqポリメラーゼを使用して、結合剤から遠位のスペーサー配列と、隣接するバーコード配列(例えば、エンコーダー配列またはサイクル特異的配列)との間のコーディングタグにおけるチミジン塩基の配置は、記録タグのスペーサー配列の3’末端に鋳型化されていないアデノシンヌクレオチドが散発的に含まれることに対応する。このようにして、伸長記録タグ(鋳型化されていないアデノシン塩基の有無にかかわらず)は、コーディングタグにアニーリングし、プライマー伸長を受けることができる。
あるいは、鋳型化されていない塩基の添加は、特にO-ヘリックス領域において、鋳型化されていない末端トランスフェラーゼ活性が1つ以上の点突然変異によって大幅に減少した突然変異体ポリメラーゼ(中温性または好熱性)を使用することによって減らすことができる(米国特許第7,501,237号を参照)(Yang et al.,Nucleic Acids Res.(2002)30(19):4314-4320)。3’エキソヌクレアーゼ欠損であり、鎖置換能を有するPfuエキソ-も、鋳型化されていない末端トランスフェラーゼ活性を持たない。
別の実施形態において、ポリメラーゼ伸長緩衝液は、pH値6~9のTris-アセテート、Tris-HCl、HEPESなどの40~120mMの緩衝剤から構成される。
伸長記録タグの末端スペーサー配列と伸長記録タグの内部領域との自己アニーリングによって開始される自己プライミング/ミスプライミング事象は、記録/伸長記録タグに疑似相補的塩基を含めることによって最小限に抑えることができる(Lahoud et al.,Nucleic Acids Res.(2008)36:3409-3419)、(Hoshika et al.,Angew Chem Int Ed Engl(2010)49(32):5554-5557)。疑似相補的塩基は、化学修飾の存在により、互いに二重鎖を形成するためのハイブリダイゼーション親和性が大幅に低下することを示す。しかしながら、多くの疑似相補的修飾塩基は、天然のDNAまたはRNA配列と強い塩基対を形成する可能性がある。特定の実施形態において、コーディングタグスペーサー配列は、複数のAおよびT塩基から構成され、市販の疑似相補的塩基である2-アミノアデニンおよび2-チオチミンは、ホスホルアミダイトオリゴヌクレオチド合成を利用して記録タグに組み込まれる。追加の疑似相補的塩基は、疑似相補的ヌクレオチドを反応に加えることにより、プライマー伸長中に伸長記録タグに組み込むことができる(Gamper et al.,Biochemistry.(2006)45(22):6978-86)。
いくつかの実施形態において、溶液中のコーディングタグ標識結合剤と固定化タンパク質の記録タグとの非特異的相互作用を最小化するために、記録タグスペーサー配列に相補的な競合(ブロッキングとも呼ばれる)オリゴヌクレオチドを結合反応に加えて、非特異的な相互作用最小化することができる。いくつかの実施形態において、ブロッキングオリゴヌクレオチドは比較的短い。過剰な競合オリゴヌクレオチドは、プライマー伸長の前に結合反応から洗い流される。これにより、特にわずかに高い温度(30~50℃)にさらされた場合に、アニーリングされた競合オリゴヌクレオチドが記録タグから効果的に解離される。ブロッキングオリゴヌクレオチドは、プライマー伸長を防ぐために、その3’末端にターミネーターヌクレオチドを含み得る。
いくつかの実施形態において、コーディングタグは、ヘアピンを含み得る。特定の実施形態において、ヘアピンは、相互に相補的な核酸領域を含み、核酸鎖を介して接続される。いくつかの実施形態において、核酸ヘアピンはまた、二本鎖ステムセグメントから延びる3’および/または5’一本鎖領域(複数可)をさらに含み得る。いくつかの例では、ヘアピンは、一本鎖の核酸を含む。
特定の実施形態において、記録タグ上のスペーサー配列の、コーディングタグ上の相補的スペーサー配列へのアニーリングは、プライマー伸長反応条件下で準安定である(すなわち、アニーリングTmは、反応温度に類似する)。これにより、コーディングタグのスペーサー配列は、記録タグのスペーサー配列にアニーリングされたブロッキングオリゴヌクレオチドを置換することができる。
特定の結合剤に関連するコーディングタグ情報は、ライゲーションを介して記録タグに転送することもできる。ライゲーションは、平滑末端ライゲーションまたは粘着末端ライゲーションである可能性がある。ライゲーションは、酵素的ライゲーション反応である可能性がある。リガーゼの例としては、CV DNAリガーゼ(米国特許公開第US2014/0378315号を参照)、T4 DNAリガーゼ、T7 DNAリガーゼ、T3 DNAリガーゼ、Taq DNAリガーゼ、E.coli DNAリガーゼ、9°N DNAリガーゼ、Electroligase(登録商標)が含まれるが、これらに限定されない。あるいは、ライゲーションは、化学ライゲーション反応であり得る。この例証では、スペーサーのないライゲーションは、「記録ヘルパー」配列とコーディングタグ上のアームとのハイブリダイゼーションを使用することによって達成される。アニーリングされた補体配列は、標準的な化学ライゲーションまたは「クリック化学」を使用して化学的にライゲーションされる(Gunderson et al.,Genome Res(1998)8(11):1142-1153;Peng et al.,European J Org Chem(2010)(22):4194-4197;El-Sagheeret al.,Proc Natl Acad Sci U S A(2011)108(28):11338-11343;El-Sagheer et al.,Org Biomol Chem(2011)9(1):232-235;Sharma et al.,Anal Chem (2012)84(14):6104-6109;Roloff et al.,Bioorg Med Chem(2013)21(12):3458-3464;Litovchick et al.,Artif DNA PNA XNA(2014)5(1):e27896;Roloff et al.,Methods Mol Biol(2014)1050:131-141)。
別の実施形態において、PNAの転送は、公開された技術を使用する化学ライゲーションで達成することができる。PNAの構造は、5’N末端アミン基および非反応性3’C末端アミドを有するようなものである。PNAの化学ライゲーションでは、化学的に活性になるように末端を修飾する必要がある。これは通常、5’N末端をシステイニル部分で誘導体化し、3’C末端をチオエステル部分で誘導体化することによって行われる。このような修飾されたPNAは、標準の天然化学ライゲーション条件を使用して簡単にカップリングする(Roloff et al.,(2013)Bioorgan.Med.Chem.21:3458-3464)。
いくつかの実施形態において、コーディングタグ情報は、トポイソメラーゼを使用して転送することができる。トポイソメラーゼを使用して、記録タグ上のトポ荷電3’リン酸をコーディングタグ上の5’末端またはその補体にライゲーションすることができる(Shuman et al.,1994,J.Biol.Chem.269:32678-32684)。
本明細書に記載されるように、結合剤は、翻訳後修飾されたアミノ酸に結合し得る。したがって、特定の実施形態において、伸長記録タグは、ポリペプチドのアミノ酸配列および翻訳後修飾に関連するコーディングタグ情報を含む。いくつかの実施形態において、内部の翻訳後修飾アミノ酸(例えば、リン酸化、グリコシル化、スクシニル化、ユビキチン化、S-ニトロシル化、メチル化、N-アセチル化、脂質化など)の検出は、末端アミノ酸(例えば、NTAAまたはCTAA)の検出および脱離の前に達成される。一例では、ペプチドは、PTM修飾のために結合剤と接触され、関連するコーディングタグ情報は、記録タグに転送される。アミノ酸修飾に関連するコーディングタグ情報の検出および転送が完了すると、N末端またはC末端分解法を使用して一次アミノ酸配列のコーディングタグ情報を検出および転送する前に、PTM修飾基を除去することができる。したがって、結果として得られる伸長記録タグは、一次アミノ酸配列情報と共に、ペプチド配列における翻訳後修飾の存在を示すが、連続した順序ではない。
いくつかの実施形態において、内部の翻訳後修飾アミノ酸の検出は、一次アミノ酸配列の検出と同時に行われ得る。一例では、NTAA(またはCTAA)を、単独で、または結合剤のライブラリー(例えば、20個の標準アミノ酸および選択された翻訳後修飾アミノ酸のための結合剤から構成されるライブラリー)の一部として、翻訳後修飾アミノ酸に特異的な結合剤と接触させる。末端アミノ酸の脱離および結合剤(または結合剤のライブラリー)との接触の連続サイクルが続く。したがって、結果として得られる伸長記録タグは、一次アミノ酸配列との関連では、翻訳後修飾の存在および順序を示す。
特定の実施形態において、記録タグのアンサンブルをポリペプチドごとに使用して、コーディングタグ情報転送の全体的な堅牢性および効率を改善することができる。単一の記録タグではなく、所与のポリペプチドと関連付けられた記録タグのアンサンブルを使用すると、コーディングタグと記録タグのカップリング率が高くなり、ライブラリーの全体的な収率が高くなる可能性があるため、ライブラリー構築の効率が向上する。単一の連結された伸長記録タグの収率は、連結の段階的な収率に直接依存するが、コーディングタグ情報を受け入れることができる複数の記録タグを使用すると、連結の指数関数的な損失を被らない。
変性タンパク質、ポリペプチドおよびペプチドの分析を含む実施形態において、結合した結合剤およびアニーリングされたコーディングタグは、高度に変性する条件(例えば、0.1~0.2N NaOH、6M尿素、2.4Mグアニジニウムイソチオシアネート、95%ホルムアミドなど)を使用することにより、プライマー伸長後に除去することができる。
C.アミノ酸認識、記録タグ伸長、およびアミノ酸除去の循環ラウンドによるポリペプチドの特徴付け
特定の実施形態において、本開示で提供されるポリペプチドを分析するための方法は、ポリペプチドを複数の結合剤と接触させ、結合剤の連続的な結合により、核酸ベースのコーディングタグの形態における履歴的な結合情報を、ポリペプチドに関連付けられた少なくとも1つの記録タグに転送する複数の結合サイクルを含む。このようにして、複数の結合事象に関する情報を含むこれまでの記録が核酸形式で生成される。
特定の実施形態において、溶液中の結合剤の濃度は、アッセイのバックグラウンドおよび/または偽陽性の結果を低減するように制御される。
いくつかの実施形態において、結合剤の濃度は、任意の好適な濃度、例えば、約0.0001nM、約0.001nM、約0.01nM、約0.1nM、約1nM、約2nM、約5nM、約10nM、約20nM、約50nM、約100nM、約200nM、約500nM、または約1000nMであり得る。他の実施形態において、アッセイで使用される可溶性共役体の濃度は、約0.0001nM~約0.001nM、約0.001nM~約0.01nM、約0.01nM~約0.1nM、約0.1nM~約1nM、約1nM~約2nM、約2nM~約5nM、約5nM~約10nM、約10nM~約20nM、約20nM~約50nM、約50nM~約100nM、約100nM~約200nM、約200nM~約500nM、約500nM~約1000nM、または約1000nMを超える。
いくつかの実施形態において、可溶性結合剤分子と固定化ポリペプチドおよび/または記録タグとの比率は、任意の好適な範囲、例えば、約0.00001:1、約0.0001:1、約0.001:1、約0.01:1、約0.1:1、約1:1、約2:1、約5:1、約10:1、約15:1、約20:1、約25:1、約30:1、約35:1、約40:1、約45:1、約50:1、約55:1、約60:1、約65:1、約70:1、約75:1、約80:1、約85:1、約90:1、約95:1、約100:1、約10:1、約10:1、約10:1、もしくはそれ以上、または上記の比率の間の任意の比率であり得る。可溶性結合剤分子と固定化ポリペプチド(複数可)および/または記録タグ(複数可)とのより高い比率を使用して、結合および/またはコーディングタグ/記録タグ情報の転送を完了させることができる。これは、サンプル中の少量のポリペプチドを検出および/または分析するのに特に有用である可能性がある。
N末端分解によるアプローチを使用してペプチドまたはポリペプチドを分析する方法に関する実施形態では、第1の結合剤をn個のアミノ酸のペプチドのnNTAAに接触させて結合し、第1の結合剤のコーディングタグ情報をペプチドと関連付けられた記録タグに転送し、それによって一次伸長記録タグを生成する。nNTAAは、本明細書に記載されるように脱離させる。いくつかの実施形態において、ポリペプチド分析アッセイにおける修飾された切断酵素の使用は、標識されたNTAAを除去するためである。いくつかの態様において、セクションIに記載される修飾された切断酵素のうちのいずれか2つ以上を組み合わせて使用して、標識されたNTAAを除去することができる。例えば、サンプルを、修飾された切断酵素の混合物で処理して、サンプル中のペプチド中のさまざまなNTAAの除去を達成することができる。修飾された切断酵素と接触させることによるn個の標識NTAAの除去は、ペプチドのn-1個のアミノ酸をN末端アミノ酸に変換し、これは本明細書ではn-1NTAAと呼ばれる。第2の結合剤をペプチドと接触させ、n-1NTAAに結合し、二次結合剤のコーディングタグ情報を一次伸長記録タグに転送し、それにより二次伸長記録タグを生成する(例えば、ペプチドを表す連結されたn次伸長記録タグを生成するため)か、または別の記録タグ(例えば、ペプチドを集合的に表す複数の伸長記録タグを生成するため)に転送する。修飾された切断酵素によるn標識NTAAの脱離は、ペプチドのn-2個のアミノ酸をN末端アミノ酸に変換し、これは本明細書ではn-2NTAAと呼ばれる。追加の結合、転送、標識および除去は、上記のように最大n個のアミノ酸で起こり、n次伸長記録タグまたは集合的にペプチドを表すn個の別個の伸長記録タグを生成する。本明細書で使用される場合、結合剤、コーディングタグ、または伸長記録タグに関して使用される場合のn「次(order)」は、結合剤およびその関連付けられたコーディングタグが使用されるn回目の結合サイクル、または伸長記録タグが作製されるn回目の結合サイクルを指す。いくつかの実施形態において、記載された例示的なアプローチにおけるNTAAを含むステップは、代わりに、CTAAを用いて実行され得る。
いくつかの実施形態において、第1の結合剤および第2の結合剤のポリペプチドへの接触および任意選択的に、任意のさらなる結合剤(例えば、第3の結合剤、第4の結合剤、第5の結合剤など)の接触が同時に行われる。例えば、第1の結合剤および第2の結合剤、および任意選択的に、任意のさらに高次の結合剤を一緒にプールして、例えば、結合剤のライブラリーを形成することができる。別の例では、第1の結合剤および第2の結合剤、ならびに任意選択的に、任意のさらに高次の結合剤が、一緒にプールされるのではなく、ポリペプチドに同時に添加される。一実施形態において、結合剤のライブラリーは、20個の標準的な天然に存在するアミノ酸に選択的に結合する少なくとも20個の結合剤を含む。
他の実施形態において、第1の結合剤および第2の結合剤、および任意選択的に、任意のさらに高次の結合剤を、各々、別個の結合サイクルでポリペプチドと接触させ、連続した順序で加える。特定の実施形態において、複数の結合剤は、同時に並行して使用される。この並行アプローチは、時間を節約し、(結合剤が競合しているために)同族結合剤によって結合される部位に、同族ではない結合剤が非特異的に結合するのを減らす。
本明細書に記載の方法によって生成される最終的な伸長記録タグの長さは、コーディングタグの長さ(例えば、エンコーダー配列およびスペーサー)、記録タグの長さ(例えば、固有分子識別子、スペーサー、ユニバーサルプライミング部位、バーコード)、実行された結合サイクルの数、ならびに各結合サイクルからのコーディングタグが同じ伸長記録タグに転送されるか、複数の伸長記録タグに転送されるか、を含む複数の要因に依存する。いくつかの例では、コーディングタグの両側に5個の塩基のスペーサーが隣接する、5個の塩基のエンコーダー配列がある場合、ペプチドの結合剤の履歴を表す最終的な伸長記録タグのコーディングタグ情報は10個の塩基×劣化サイクルの数である。
最終結合サイクルおよび最終結合剤のコーディングタグ情報の伸長記録タグへの転送後、ライゲーション、プライマー伸長、または当技術分野で既知の他の方法を介してユニバーサルリバースプライミング部位を追加することにより、タグをキャップすることができる。いくつかの実施形態において、記録タグ内のユニバーサルフォワードプライミング部位は、最終的な伸長記録タグに付加されるユニバーサルリバースプライミング部位と適合性がある。いくつかの実施形態において、ユニバーサルリバースプライミング部位は、IlluminaのP7プライマー(5’-CAAGCAGAAGACGGCATACGAGAT-3’-配列番号4)またはIlluminaのP5プライマー(5’-AATGATACGGCGACCACCGA-3’-配列番号3)である。記録タグの鎖センスに応じて、センスまたはアンチセンスP7を付加することができる。伸長記録タグライブラリーは、固体支持体(例えば、ビーズ)から直接切断または増幅することができ、従来の次世代シーケンシングアッセイおよびプロトコルで使用することができる。
いくつかの実施形態において、プライマー伸長反応は、一本鎖伸長記録タグのライブラリー上で実行され、その相補鎖をコピーする。いくつかの実施形態において、ペプチド配列決定アッセイ(例えば、ProteoCodeアッセイ)は、周期的進行におけるいくつかの化学的および酵素的ステップを含む。場合によっては、単一分子アッセイの1つの利点は、さまざまな周期的な化学的/酵素的ステップにおける非効率性に対する堅牢性である。いくつかの実施形態において、コーディングタグ配列に存在するサイクル特異的バーコードの使用は、アッセイに利点を与える。
D.タグの処理および分析
伸長記録タグおよび目的のポリペプチド(複数可)を表すその他のタグは、さまざまな核酸配列決定法を使用して処理および分析することができる。配列決定方法の例としては、チェーンターミネーションシーケンシング(サンガーシーケンシング);合成によるシーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、ポロニーシーケンシング、イオン半導体シーケンシング、パイロシーケンシングなどの次世代シーケンシング方法;単一分子リアルタイムシーケンシング、ナノポアベースのシーケンシング、デュプレックスインタラプテッドシーケンシング、高度な顕微鏡を使用したDNAの直接イメージングなどの第3世代シーケンシング方法が含まれるが、これらに限定されない。
本発明で使用するのに好適な配列決定方法には、ハイブリダイゼーションによるシーケンシング、合成技術(例えば、HiSeq(商標)およびSolexa(商標)、Illumina)によるシーケンシング、SMRT(商標)(単一分子リアルタイム)技術(Pacific Biosciences)、真の単一分子シーケンシング(例えば、HeliScope(商標)、Helicos Biosciences)、大規模並列次世代シーケンシング(例えば、SOLiD(商標)、Applied Biosciences、SolexaおよびHiSeq(商標)、Illumina)、大規模並列半導体シーケンシング(例えば、Ion Torrent)、およびパイロシーケンシングテクノロジー(例えば、GSFLXおよびGSJunior Systems、Roche/454)、ならびにナノポアシーケンシング(例えば、Oxford Nanopore Technologies)が含まれるが、これらに限定されない。
伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーは、さまざまな方式で増幅することができる。伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーは、例えばPCRまたはエマルジョンPCRにより、指数関数的に増幅される可能性がある。エマルジョンPCRは、より均一な増幅をもたらすことが知られている(Hori,Fukano et al.,Biochem Biophys Res Commun(2007)352(2):323-328)。あるいは、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーは、例えば、T7RNAポリメラーゼを使用する鋳型DNAのインビトロ転写を介して、線形増幅を受けることができる。伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーは、そこに含まれるユニバーサルフォワードプライミング部位およびユニバーサルリバースプライミング部位と適合性のあるプライマーを使用して増幅することができる。伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーは、テールプライマーを使用して増幅し、伸長記録タグ、伸長コーディングタグ、またはジタグの5’末端もしくは3’末端、または両末端に配列を追加することもできる。伸長記録タグ、伸長コーディングタグ、またはジタグの終端に追加することができる配列には、ライブラリーに固有のインデックス配列が含まれ、1回の配列決定の実行で複数のライブラリー、アダプター配列、リードプライマー配列、またはその他の配列を多重化して、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーをシーケンシングプラットフォームと適合性のあるものにすることができる。次世代シーケンシングの調製におけるライブラリー増幅の例は次の通りである:約1mgのビーズ(約10ng)、200μMのdNTP、1μMの各フォワードおよびリバース増幅プライマー、0.5μl(1U)のPhusion Hot Start酵素(New England Biolabs)から溶出された伸長記録タグライブラリーを使用して20μlのPCR反応容量を設定し、サイクル条件:98°Cで30秒間、続いて98°Cで10秒間、60°Cで30秒間、72°Cで30秒間、72°Cで7分間を20サイクルにさらし、その後4°Cで保持する。
特定の実施形態において、増幅前、増幅中、または増幅後のいずれかで、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーは、標的濃縮を受けることができる。いくつかの実施形態において、標的濃縮を使用して、配列決定の前に、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーから目的のポリペプチドを表す伸長記録タグを選択的に捕捉または増幅することができる。いくつかの態様において、標的タンパク質に対して高度に特異的な結合剤を産生する際の費用が高く、かつ困難であるために、タンパク質配列決定のための標的濃縮は難解である。場合によっては、抗体は非特異的であり、何千ものタンパク質にまたがって生産を拡大することが難しいことで有名である。いくつかの実施形態において、本開示の方法は、タンパク質コードを核酸コードに変換することによってこの問題を回避し、核酸コードは、次に、DNAライブラリーに利用可能な広範囲の標的DNA濃縮戦略を利用することができる。場合によっては、対応する伸長記録タグを濃縮することにより、目的のペプチドをサンプルで濃縮することができる。標的濃縮の方法は当技術分野で既知であり、ハイブリッド捕捉アッセイ、TruSeqカスタムAmplicon(Illumina)などのPCRベースのアッセイ、パドロックプローブ(分子反転プローブとも呼ばれる)などが含まれる(Mamanova et al.,(2010)Nature Methods 7:111-118;Bodi et al.,J.Biomol.Tech.(2013)24:73-86;Ballester et al.,(2016)Expert Review of Molecular Diagnostics 357-372;Mertes et al.,(2011)Brief Funct.Genomics 10:374-386;Nilsson et al.,(1994)Science 265:2085-8(その各々は参照によりそれらの全体が本明細書に組み込まれる)を参照)。
一実施形態において、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーは、ハイブリッド捕捉ベースのアッセイにより濃縮される。ハイブリッド捕捉ベースのアッセイでは、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーが、アフィニティータグ(ビオチンなど)で標識された標的特異的オリゴヌクレオチドまたは「baitオリゴヌクレオチド」にハイブリダイズする。ターゲット特異的オリゴヌクレオチドにハイブリダイズした伸長記録タグ、伸長コーディングタグ、またはジタグを、親和性リガンド(ストレプトアビジンコーティングビーズなど)を使用して、親和性タグを介して「プルダウン」し、バックグラウンド(非特異的)伸長記録タグを洗い流す。次に、濃縮された伸長記録タグ、伸長コーディングタグ、またはジタグが、正の濃縮(例えば、ビーズから溶出される)のために得られる。
アレイベースの「源位置(in situ)」オリゴヌクレオチド合成およびそれに続くオリゴヌクレオチドプールの増幅によって合成されたbaitオリゴヌクレオチドの場合、所与のオリゴヌクレオチドアレイ内でユニバーサルプライマーのいくつかのセットを使用することにより、競合するbaitをプールに組み込むことができる。ユニバーサルプライマーのタイプごとに、ビオチン化プライマーと非ビオチン化プライマーの比率が濃縮比を制御する。いくつかのプライマータイプを使用することで、いくつかの濃縮比を最終的なオリゴヌクレオチドbaitのプールにおいて設計することができる。
baitオリゴヌクレオチドは、目的のポリペプチドを表す伸長記録タグ、伸長コーディングタグ、またはジタグに相補的であるように設計することができる。伸長記録タグ、伸長コーディングタグ、またはジタグのスペーサー配列に対するbaitオリゴヌクレオチドの相補性の程度は、0%~100%、およびその間の任意の整数であり得る。このパラメータは、いくつかの濃縮実験によって簡単に最適化することができる。いくつかの実施形態において、エンコーダー配列に対するスペーサーの長さは、コーディングタグ設計において最小化されるか、またはスペーサーは、それらがbait配列へのハイブリダイゼーションに利用不可であるように設計される。1つのアプローチは、補因子の存在下で二次構造を形成するスペーサーを使用することである。このような二次構造の例は、G-四重鎖であり、これは、2つ以上のグアニンカルテットが互いに積み重ねられて形成された構造である(Bochman et al.,Nat Rev Genet(2012)13(11):770-780)。グアニンカルテットは、フーグスティーン水素結合を介して結合する4つのグアニン塩基によって形成される正方形の平面構造である。G-四重鎖構造は、カチオン、例えばK+イオンとLi+イオンの存在下で安定化される。
使用するbaitオリゴヌクレオチドの個数を最小限に抑えるために、各タンパク質からの比較的固有のペプチドのセットを生物情報学的に識別することができ、目的のペプチドの対応する伸長記録タグライブラリー表現に相補的なbaitオリゴヌクレオチドのみがハイブリッド捕捉アッセイで使用される。いくつかの実施形態において、同じまたは異なるbaitセットを用いて、連続的なラウンドまたは濃縮を実施することもできる。
その断片(ペプチドなど)を表す伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリー内のポリペプチドの全長を濃縮するために、タンパク質の核酸表現全体にわたって「タイル状」のbaitオリゴヌクレオチドを設計することができる。
別の実施形態において、プライマー伸長およびライゲーションベースの媒介増幅濃縮(AmpliSeq、PCR、TruSeq TSCAなど)を使用して、ポリペプチドのサブセットを表すライブラリー要素の濃縮画分を選択およびモジュール化することができる。競合するオリゴヌクレオチドを使用して、プライマーの伸長、ライゲーション、または増幅の程度を調整することもできる。最も単純な実施において、これは、ユニバーサルプライマーテールを含む標的特異的プライマーと5’ユニバーサルプライマーテールを欠く競合プライマーとの混合物を有することによって達成することができる。最初のプライマー伸長後、5’ユニバーサルプライマー配列を持つプライマーのみを増幅することができる。ユニバーサルプライマー配列がある場合とない場合のプライマーの比率は、増幅される標的の割合を制御する。他の実施形態において、ハイブリダイズするが非伸長性であるプライマーを含めることを使用して、プライマー伸長、ライゲーション、または増幅を受けるライブラリー要素の割合を調節することができる。
ターゲットエンリッチメント法を負の選択モードで使用して、配列決定の前にライブラリーから伸長記録タグ、伸長コーディングタグ、またはジタグを選択的に削除することもできる。したがって、ビオチン化baitオリゴヌクレオチドおよびストレプトアビジンコーティングビーズを使用する上記の例では、ビーズに結合したbaitオリゴヌクレオチド:伸長記録タグ、伸長コーディングタグ、またはジタグハイブリッドが分析されていない間、上清を配列決定のために保持する。除去することができる望ましくない伸長記録タグ、伸長コーディングタグ、またはジタグの例は、例えば、タンパク質、アルブミン、免疫グロブリンなどのために、過剰に豊富なポリペプチド種を表すものである。
標的にハイブリダイズするがビオチン部分を欠く競合オリゴヌクレオチドbaitをハイブリッド捕捉ステップで使用して、濃縮された特定の遺伝子座の画分を調節することもできる。競合オリゴヌクレオチドbaitは、濃縮中にプルダウンされたターゲットの割合を効果的に調節する標準的なビオチン化baitと、ターゲットへのハイブリダイゼーションをめぐって競合する。タンパク質発現の10桁のダイナミックレンジは、特にアルブミンなどの過剰に豊富な種の場合、この競合抑制アプローチを使用して数桁圧縮することができる。したがって、標準的なハイブリッド捕捉と比較して、特定の遺伝子座に対して捕捉されたライブラリー要素の割合は、100%~0%の濃縮に下方調整することができる。
さらに、ライブラリーの正準化手法を使用して、伸長記録タグ、伸長コーディングタグ、またはジタグライブラリーから過剰に豊富な種を削除することができる。このアプローチは、トリプシン、LysC、GluCなどの部位特異的プロテアーゼ消化によって生成されたペプチドに由来する定義された長さのライブラリーに最適である。一例では、正準化は、二本鎖ライブラリーを変性させ、ライブラリー要素を再アニーリングさせることによって達成することができる。二分子ハイブリダイゼーション速度論の二次速度定数により、豊富なライブラリー要素は、豊富でない要素よりも迅速に再アニーリングする(Bochman,Paeschke et al.2012)。ssDNAライブラリー要素は、ヒドロキシアパタイトカラムでのクロマトグラフィー(VanderNoot,et al.,2012,Biotechniques 53:373-380)、またはdsDNAライブラリー要素を破壊するタラバガニ(Shagin et al.,(2002)Genome Res.12:1935-42)からの二重特異性ヌクレアーゼ(DSN)によるライブラリーの処理などの当技術分野で既知の方法を使用して、豊富なdsDNAライブラリー要素から分離することができる。
固体支持体に付着する前のポリペプチドおよび/または結果として得られる伸長記録タグライブラリーの分画、濃縮、および減算法の任意の組み合わせにより、シーケンシングリードを節約し、低豊度種の測定を改善することができる。
いくつかの実施形態において、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーは、ライゲーションまたは末端相補的PCRによって連結されて、複数の異なる伸長レコーダー(recorder)タグ、伸長コーディングタグ、またはジタグを含む長いDNA分子を作製する(Du et al.,(2003)BioTechniques 35:66-72;Muecke et al.,(2008)Structure 16:837-841;米国特許第5,834,252号(その各々は参照によりその全体が組み込まれる))。この実施形態は、DNAの長い鎖がナノポアシーケンシングデバイスによって分析されるナノポアシーケンシングにとって好ましい。
いくつかの実施形態において、直接単一分子分析は、伸長記録タグ、伸長コーディングタグ、またはジタグで実行される(例えば、Harris et al.,(2008)Science 320:106-109を参照)。伸長記録タグ、伸長コーディングタグ、またはジタグは、フローセルまたはフローセル表面へのロードに適合性のあるビーズ(任意選択的に、マイクロセルパターン化)などの固体支持体上で直接分析することができる。フローセルまたはビーズは、単一分子シーケンサーまたは単一分子デコード機器と統合され得る。単一分子のデコーディングの場合、デコーディングオリゴヌクレオチドのプールされた蛍光標識された数ラウンドのハイブリダイゼーション(Gunderson et al.,(2004)Genome Res.14:970-7)を使用して、伸長記録タグ内のコーディングタグの同一性および順序の両方を確認することができる。いくつかの実施形態において、結合剤は、上記のようにサイクル特異的コーディングタグで標識することができる(Gunderson et al.,(2004)Genome Res.14:970-7も参照)。サイクル固有のコーディングタグは、単一のポリペプチドを表す単一の連結された伸長記録タグ、または単一のポリペプチドを表す伸長記録タグの集合の両方に対して機能する。
伸長レポータータグ、伸長コーディングタグまたはジタグライブラリーの配列に続いて、結果として得られる配列は、UMIによって折りたたまれ、対応するポリペプチドと関連付けられ、プロテオーム全体にアラインメントされる。結果として生じる配列はまた、それらのコンパートメントタグによって折り畳まれ、それらの対応するコンパートメントプロテオームと関連付けられることができ、これは、特定の実施形態において、単一または非常に限られた数のタンパク質分子のみを含む。タンパク質の識別および定量化はいずれも、このデジタルペプチド情報から簡単に導き出すことができる。
いくつかの実施形態において、コーディングタグ配列は、特定の配列決定分析プラットフォームのために最適化することができる。特定の実施形態において、シーケンシングプラットフォームはナノポアシーケンシングである。いくつかの実施形態において、シーケンシングプラットフォームは、>1%、>5%、>10%、>15%、>20%、>25%、または>30%の1塩基あたりのエラー率を有する。例えば、ナノポアシーケンシング機器を使用して伸長記録タグを分析する場合、バーコード配列(例えば、エンコーダー配列)は、ナノポアを通過する際に最適に電気的に区別可能に設計することができる。ナノポアシーケンシングの単一塩基精度はまだかなり低い(75%~85%)ことを考えると、本明細書に記載の方法によるペプチドシーケンシングはナノポアシーケンシングに適している可能性があるが、「エンコーダー配列」の決定ははるかに正確であるはずである(>99%)。さらに、デュープレックスインタラプテッドナノポアシーケンシング(DI)と呼ばれる手法を、分子モーターを必要とせずにナノポアストランドシーケンシングで用いることができるため、システム設計が大幅に簡素化される(Derrington et al.,Proc Natl Acad Sci U S A (2010)107(37):16060-16065)。DIナノポアシーケンシングによる伸長記録タグの読み出しには、連結された伸長記録タグライブラリーのスペーサー要素を相補的なオリゴヌクレオチドでアニーリングする必要がある。本明細書で使用されるオリゴヌクレオチドは、得られる二本鎖の有効Tmを増加させるために、LNA、または他の修飾された核酸または類似体を含み得る。これらの二本鎖スペーサー領域で装飾された一本鎖伸長記録タグが細孔を通過すると、二本鎖領域は狭窄ゾーンで一時的に失速し、二本鎖領域に隣接する約3つの塩基の電流読み出しを可能にする。DIナノポアシーケンシングの特定の実施形態において、エンコーダー配列は、スペーサー要素に隣接する3つの塩基が最大限に電気的に識別可能なナノポアシグナルを生成するように設計される(Derrington et al.,Proc Natl Acad Sci U S A (2010)107(37):16060-16065)。モーターフリーDI配列の代わりに、スペーサー要素は、G-カルテットなどの二次構造を採用するように設計することができ、この構造は、隣接するエンコーダー配列の読み出しを可能にするナノポアを通過するときに、伸長記録タグ、伸長コーディングタグ、またはジタグを一時的に失速させる(Shim et al.,Nucleic Acids Res(2009)37(3):972-982;Zhang et al.,mAbs(2016)8,524-535)。ストールを通過した後、次のスペーサーは、再び一時的なストールを作製し、次のエンコーダー配列の読み出しなどを可能にする。
本明細書に開示される方法は、複数のポリペプチドの同時(多重化)の検出、定量化および/または配列決定を含む分析に使用することができる。本明細書で使用される多重化は、同じアッセイにおける複数のポリペプチドの分析を指す。複数のポリペプチドは、同じサンプルまたは異なるサンプルに由来し得る。複数のポリペプチドは、同じ対象または異なる対象に由来し得る。分析される複数のポリペプチドは、異なるポリペプチド、または異なるサンプルに由来する同じポリペプチドであり得る。複数のポリペプチドには、2つ以上のポリペプチド、5個以上のポリペプチド、10個以上のポリペプチド、50個以上のポリペプチド、100個以上のポリペプチド、500個以上のポリペプチド、1000個以上のポリペプチド、5,000個以上のポリペプチド、10,000個以上のポリペプチド、50,000個以上のポリペプチド、100,000個以上のポリペプチド、500,000個以上のポリペプチド、または1,000,000個以上のポリペプチドが含まれる。
サンプルの多重化は、タグで標識されたポリペプチドサンプルを記録する事前のバーコーディングによって実現することができる。各バーコードは異なるサンプルを表し、周期的結合アッセイまたは配列分析の前にサンプルをプールすることができる。このようにして、多くのバーコード標識サンプルを単一のチューブで同時に処理することができる。このアプローチは、逆相タンパク質アレイ(RPPA)で実施されるイムノアッセイを大幅に改良したものである(Akbani et al.,Mol Cell Proteomics(2014)13(7):1625-1643;Creighton et al.,Drug Des Devel Ther(2015)9:3519-3527;Nishizuka et al.,Drug Metab Pharmacokinet(2016)31(1):35-45)。このように、本開示は、本質的に、単純なワークフローで、RPPAアッセイに代わる高度にデジタル化されたサンプルおよび分析物の多重化された代替物を提供する。
IV.キットおよび関連製品
本明細書において提供されるのは、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む1つ以上の修飾された切断酵素と、ポリペプチドの末端アミノ酸を標識するための試薬と、を含む、キットである。いくつかの態様において、修飾された切断酵素は、ジペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を除去するか、または、修飾された切断酵素は、トリペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を、もしくはポリペプチドから単一の標識末端ジペプチドを除去する。いくつかの実施形態において、キットはまた、分析および/または配列決定のためにポリペプチドを処理するための試薬を使用するための説明書を含む。いくつかの実施形態において、(例えば、セクションIに記載されるような)1つ以上の修飾された切断酵素を含むキットは、配列決定および/または分析のためのペプチド、ポリペプチド、およびタンパク質を処理する際に使用するためのものである。いくつかの実施形態において、タンパク質分析は、分子認識事象のバーコーディングおよび核酸コーディング、ならびに/または検出可能な標識を使用する。いくつかの実施形態において、キットはまた、タグ(例えば、DNAタグまたはDNA記録タグ)、固体支持体、ならびにポリペプチドを調製するための他の試薬およびポリペプチド分析のための他の試薬を含む、ポリペプチドを処理して分析するための他の成分を含む。
いくつかの実施形態において、キットは、2つ以上の修飾された切断酵素を含む。場合によっては、さまざまな修飾された切断酵素は、異なる特徴、例えば、ポリペプチドの結合および/またはアミノ酸の切断に対する選好を示し得る。いくつかの実施形態において、2つ以上の修飾された切断酵素を、酵素の混合物として、または容器内の各修飾された切断酵素と別々に、キットに含めてもよい。いくつかの実施形態では、さまざまな修飾された切断酵素を、同時にまたは連続してポリペプチドと接触させる。
いくつかの実施形態において、キットはまた、NTAAを脱離させるための1つ以上の追加の酵素(例えば、プロリンアミノペプチダーゼ)を含む。いくつかの特定の例では、追加の酵素は、プロリンアミノペプチダーゼ、プロリンイミノペプチダーゼ(PIP)、またはピログルタメートアミノペプチダーゼ(pGAP)である。いくつかの実施形態では、1つ以上の修飾された切断酵素は、他の酵素と組み合わせてキットに含まれる。場合によっては、修飾された切断酵素および他の酵素は、カクテルとしてキットに含まれる。
いくつかの実施形態において、キットはまた、所望の反応が起こるのに必要な基質、イオン、および因子を含む1つ以上の緩衝液または反応流体を含む。洗浄緩衝液、反応緩衝液、および結合緩衝液、溶出緩衝液などを含む緩衝液は、当業者に知られている。いくつかの実施形態において、修飾された切断酵素はメタロペプチダーゼであり、キットは、修飾された切断酵素の活性化に必要な金属イオンを含む緩衝液を含む。いくつかの例では、キットは、修飾された切断酵素の活性化に必要な金属イオン、例えば、亜鉛イオンまたは塩化物イオンを含む。いくつかの実施形態において、キットは、修飾された切断酵素を不活性化するための金属キレート剤または他の試薬をさらに含む。いくつかの実施形態において、キットは、本明細書に記載の他の試薬に付随する緩衝液および他の成分をさらに含む。試薬、緩衝液、および他の成分は、バイアル(密封されたバイアルなど)、容器、アンプル、ボトル、ジャー、柔軟な包装(例えば、密封されたマイラー(Mylar)またはビニール袋)などで提供され得る。キットの構成要素はいずれも滅菌および/または密封することができる。
いくつかの実施形態において、キットは、1つ以上の結合剤をさらに含み、各結合剤は、結合剤に関する識別情報を有するコーディングタグを含む。場合によっては、キットは、2つ以上の結合剤を含む。いくつかの例では、キットは、結合剤のライブラリーを含む。いくつかの実施形態において、2つ以上の結合剤は、個々の容器に入れて、または容器内の混合物として、提供され得る。いくつかの実施形態において、キットは、コーディングタグの識別情報をポリペプチドに付着した記録タグに転送するための試薬をさらに含み、識別情報の記録タグへの転送により、ポリペプチド上に伸長記録タグが生成される。場合によっては、識別情報を転送するための試薬は、化学ライゲーション試薬または生物学的ライゲーション試薬である可能性がある。
いくつかの実施形態において、キットは、伸長記録タグを増幅するための増幅試薬をさらに含む。
いくつかの実施形態において、キットは、ビーズ、多孔質ビーズ、磁性ビーズ、常磁性ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、回転干渉測定ディスク、膜、ニトロセルロース膜、ニトロセルロースベースのポリマー表面、ナノ粒子(例えば、磁性ナノ粒子(Fe)、金ナノ粒子、および/または銀ナノ粒子などの金属を含む)、量子ドット、ナノシェル、ナノケージ、ミクロスフェア、ならびにそれらの任意の組み合わせからなる群から選択される固体支持体をさらに含む。いくつかの実施形態において、キットは、複数の基質を含む。
いくつかの実施形態において、キットは、核酸配列決定分析のための1つ以上の試薬を含む。いくつかの例では、配列分析用の試薬は、合成によるシーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、ポロニーシーケンシング、イオン半導体シーケンシング、パイロシーケンシング、単一分子リアルタイムシーケンシング、ナノポアベースのシーケンシング、または高度な顕微鏡を使用するDNAのダイレクトイメージング、またはそれらの任意の組み合わせにおいて使用されるためのものである。
いくつかの実施形態において、キットまたは製造品は、本明細書に記載の方法および使用に関する説明書(複数可)をさらに含み得る。いくつかの実施形態において、説明書は、本明細書において提供される修飾された切断酵素を含む、ポリペプチドを調製および処理する方法に向けられている。本明細書に記載のキットはまた、他の緩衝液、希釈剤、フィルター、注射器、および本明細書に記載の任意の方法を実行するための説明書を伴う添付文書を含む、商業的およびユーザーの観点から望ましい他の材料を含み得る。
上記のキット構成要素のうちのいずれか、および任意の分子、分子複合体もしくは共役体、試薬(例えば、修飾された切断酵素を含む化学的または生物学的試薬)、薬剤、構造(例えば、支持体、表面、粒子、もしくはビーズ)、反応中間体、反応生成物、結合複合体、または例示的なキットおよび方法で開示および/または使用される任意の他の製品は、キットを形成するために別個にまたは任意の好適な組み合わせで提供され得る。キットは、任意選択的に、修飾された切断酵素を使用するための説明書を含み得る。
V.例示的な実施形態
提供される実施形態の中には、以下のものがある。
1.突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、修飾された切断酵素であって、
修飾された切断酵素が、ジペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を除去するか、または除去するように構成されるか、あるいは
修飾された切断酵素が、トリペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を、もしくはポリペプチドから単一の標識末端ジペプチドを除去するか、または除去するように構成される、修飾された切断酵素。
2.ジペプチド切断酵素またはトリペプチド切断酵素に由来する修飾された切断酵素が、ポリペプチドの末端標識アミノ酸残基と最後から2番目の末端アミノ酸残基との間のペプチド結合を切断するように構成される、実施形態1の修飾された切断酵素。
3.トリペプチド切断酵素に由来する修飾された切断酵素が、ポリペプチドの最後から2番目の末端標識アミノ酸残基と最後から3番目の末端アミノ酸残基との間のペプチド結合を切断するように構成される、実施形態1の修飾された切断酵素。
4.修飾された切断酵素が、ポリペプチドの末端標識アミノ酸残基と最後から2番目の末端アミノ酸残基との間のアミド結合と相互作用する活性部位を含む、実施形態1~3のうちのいずれか1つの修飾された切断酵素。
5.未修飾の切断酵素が、メタロペプチダーゼ、亜鉛依存性メタロペプチダーゼ、または亜鉛依存性ヒドロラーゼからなる群から選択される、実施形態1~4のうちのいずれか1つの修飾された切断酵素。
6.未修飾の切断酵素が、EC3.4.14、EC3.4.15、MEROPS S8、MEROPS S9、MEROPS S33、MEROPS S46、MEROPS M49、もしくはMEROPS S53、またはその機能的相同体もしくは断片に分類されるタンパク質である、実施形態1~5のうちのいずれか1つの修飾された切断酵素。
7.未修飾の切断酵素が、ジペプチジルペプチダーゼ、ジペプチジルアミノペプチダーゼ、ペプチジル-ジペプチダーゼ、ジペプチジルカルボキシペプチダーゼ、セドリジン、またはトリペプチジルペプチダーゼである、実施形態1~6のうちのいずれか1つの修飾された切断酵素。
8.未修飾の切断酵素が、ジペプチジルペプチダーゼ3、ジペプチジルペプチダーゼ5、ジペプチジルペプチダーゼ7、ジペプチジルペプチダーゼ11、ジペプチジルアミノペプチダーゼBII、またはジペプチジルペプチダーゼBIIである、実施形態1~7のうちのいずれか1つの修飾された切断酵素。
9.標識末端アミノ酸またはジペプチドが、N末端アミノ酸(NTAA)を含む、実施形態1~8のうちのいずれか1つの修飾された切断酵素。
10.標識末端アミノ酸またはジペプチドが、C末端アミノ酸(CTAA)を含む、実施形態1~8のうちのいずれか1つの修飾された切断酵素。
11.末端アミノ酸が、化学もしくは酵素試薬または部分で標識されている、実施形態1~10のうちのいずれかの修飾された切断酵素。
12.標識が、ブロックアミノ酸を含む、実施形態1~11のうちのいずれかの修飾された切断酵素。
13.標識が、外因性アミノ酸を含む、実施形態1~12のうちのいずれかの修飾された切断酵素。
14.標識が、化学標識を含む、実施形態1~13のうちのいずれかの修飾された切断酵素。
15.化学試薬が、フェニルイソチオシアネート(PITC)、ニトロ-PITC、スルホ-PITC、フェニルイソシアネート(PIC)、ニトロ-PIC、スルホ-PIC、Cbz-Cl(クロロギ酸ベンジル)またはCbz-OSu(ベンジルオキシカルボニルN-スクシンイミド)、カルボキシル活性化アミノブロックアミノ酸、無水物、1-フルオロ-2,4-ジニトロベンゼン(サンガー試薬、DNFB)、ダンシルクロリド(DNS-Cl、または1-ジメチルアミノナフタレン-5-スルホニルクロリド)、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)、2-ピリジンカルボキシアルデヒド、2-ホルミルフェニルボロン酸、2-アセチルフェニルボロン酸、1-フルオロ-2,4-ジニトロベンゼン、4-クロロ-7-ニトロベンゾフラザン、ペンタフルオロフェニルイソチオシアネート、4-(トリフルオロメトキシ)-フェニルイソチオシアネート、4-(トリフルオロメチル)-フェニルイソチオシアネート、3-(カルボン酸)-フェニルイソチオシアネート、3-(トリフルオロメチル)-フェニルイソチオシアネート、1-ナフチルイソチオシアネート、N-ニトロイミダゾール-1-カルボキシミダミド、N,N’-ビス(ピバロイル)-1H-ピラゾール-1-カルボキサミジン、N,N’-ビス(ベンジルオキシカルボニル)-1H-ピラゾール-1-カルボキサミジン、アセチル化試薬、グアニジニル化試薬、チオアシル化試薬、チオアセチル化試薬、チオベンジル化試薬、および二複素環メタニミン試薬、またはそれらの誘導体からなる群から選択される、実施形態11の修飾された切断酵素。
16.化学試薬が、イサト酸無水物、イソニコチン酸無水物、アザイサト酸無水物、コハク酸無水物、またはそれらの誘導体である、実施形態11の修飾された切断酵素。
17.化学試薬がからなる群から選択され、化学試薬が、4-ニトロフェニルアントラニレート、N-メチル-イサト酸無水物、N-アセチル-イサト酸無水物、4-カルボン酸イサト酸無水物、5-メトキシ-イサト酸無水物、5-ニトロ-イサト酸無水物、4-クロロ-イサト酸無水物、4-フルオロ-イサト酸無水物、6-フルオロ-イサト酸無水物、N-ベンジル-イサト酸無水物、4-トリフルオロメチル-イサト酸無水物、5-トリフルオロメチル-イサト酸無水物、4-ニトロ-イサト酸無水物、4-メトキシ-イサト酸無水物、5-アミノ-2-フルオロ-イソニコチン無水物(6-フルオロ-1H-ピリド[3,4-d][1,3]オキサジン-2,4-ジオン)、3,6,ジフルオロフタル酸無水物、および2,3ピラジンジカルボン酸無水物、またはそれらの誘導体からなる群から選択される、実施形態16の修飾された切断酵素。
18.修飾された切断酵素が、未修飾の切断酵素と少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を示すアミノ酸配列を含む、実施形態1~17のうちのいずれか1つの修飾された切断酵素。
19.突然変異が、アミノ酸の置換、欠失、付加、またはそれらの組み合わせを含む、実施形態1~18のうちのいずれか1つの修飾された切断酵素。
20.ポリペプチドの長さが、4個のアミノ酸を超える、5個のアミノ酸を超える、6個のアミノ酸を超える、7個のアミノ酸を超える、8個のアミノ酸を超える、9個のアミノ酸を超える、10個のアミノ酸を超える、11個のアミノ酸を超える、12個のアミノ酸を超える、13個のアミノ酸を超える、14個のアミノ酸を超える、15個のアミノ酸を超える、20個のアミノ酸を超える、25個のアミノ酸を超える、または30個のアミノ酸を超える、実施形態1~19のうちのいずれか1つの修飾された切断酵素。
21.ポリペプチドの長さが、10個のアミノ酸を超える、実施形態1~20のうちのいずれか1つの修飾された切断酵素。
22.修飾された切断酵素が、その基質結合部位内に修飾を含む、実施形態1~21のうちのいずれか1つの修飾された切断酵素。
23.修飾された切断酵素が、その触媒ドメイン内に修飾を含む、実施形態1~22のうちのいずれか1つの修飾された切断酵素。
24.修飾された切断酵素が、そのキモトリプシンフォールド内に修飾を含む、実施形態1~23のうちのいずれか1つの修飾された切断酵素。
25.修飾された切断酵素が、アミン結合部位に修飾を含む、実施形態1~24のうちのいずれか1つの修飾された切断酵素。
26.修飾された切断酵素が、そのループドメインに修飾を含む、実施形態1~25のうちのいずれか1つの修飾された切断酵素。
27.修飾された切断酵素が、修飾された切断酵素の前記活性部位へのアクセス可能性を改善するための修飾を含む、実施形態1~26のうちのいずれか1つの修飾された切断酵素。
28.修飾された切断酵素が、配列番号13または20に規定されるようなジペプチジルアミノペプチダーゼBIIまたはジペプチジルペプチダーゼBIIに由来する、実施形態1~27のうちのいずれか1つの修飾された切断酵素。
29.修飾された切断酵素が、配列番号17~19、23~28、31~39のうちのいずれかに対して、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%同一性、少なくとも70%同一性、少なくとも80%同一性、もしくは少なくとも90%以上の同一性を示すアミノ酸配列、またはその特異的結合断片を含む、実施形態1~28のうちのいずれか1つの修飾された切断酵素。
30.修飾された切断酵素が、配列番号17~19、23~28のうちのいずれかに記載のアミノ酸の配列、もしくは配列番号17~19、23~28、31~39のうちのいずれかに対して少なくとも95%の配列同一性を示すアミノ酸の配列、またはその特異的結合断片を含む、実施形態1~29のうちのいずれか1つの修飾された切断酵素。
31.修飾された切断酵素が、配列番号13の番号付けに関して、位置126、188、189、190、191、192、196、238、302、306、307、310、525、528、546、604、650、651、655、656、665および/または692に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、実施形態1~30のうちのいずれか1つの修飾された切断酵素。
32.修飾された切断酵素が、配列番号13の番号付けに関して、位置126、188、189、190、191、192、196、238、302、306、307、310、525、528、546、604、650、651、655、656、665および/または692に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含み、配列番号17~19、23~28、31~39のうちのいずれかに対して少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を示すアミノ酸配列を含む、実施形態1~31のうちのいずれか1つの修飾された切断酵素。
33.1つ以上のアミノ酸置換が、A126T、D188V、I189A、D190S、N191C、N191F、N191L、N191M、N191R、N191S、N191T、N191V、W192F、W192G、W192L、R196H、R196K、R196S、R196T、R196V、G238V、A302W、N306A、N306G、N306R、N306S、T307K、N310D、N310G、N310K、N310L、N525K、A528V、F546L、A604V、D650A、D650G、D650S、G651H、G651T、G651V、G651Y、S655G、S655T、V656E、V656G、V656S、K665I、K692N、および/またはそれらの保存的アミノ酸置換である、実施形態1~32のうちのいずれか1つの修飾された切断酵素。
34.1つ以上のアミノ酸修飾が、N191M/W192G/R196V/N306R/D650A、D188V/I189A/D190S/N191L/W192G/R196S/A302W/N310K/D650A、N191M/W192G/R196T/N306R/T307K/D650A、N191M/W192G/R196T/N306R/N525K/A528V/A604V/D650A/K692N、A126T/N191M/W192G/R196T/G238V/N306R/D650A、N191M/W192G/R196T/N306R/F546L/D650A、N191M/W192G/R196T/N306R/D650A/G651V/K665I、N191M/W192G/R196T/N306R/D650A/G651V、N191C/W192L/R196K/N306R/N310D/G651Y/S655G/V656G、N191C/W192L/N306R/N310D/G651Y/S655G/V656G、N191F/W192F/N306R/N310G/G651H/V656E、N191R/W192L/N306S/N310L/G651T/S655T/V656S、N191S/R196H/N306A/D650G、N191T/R196H/N306A/D650G、N191M/R196H/N306A/D650G、N191V/N306A/D650S、またはN191S/N306G/D650Sである、実施形態1~33のうちのいずれか1つの修飾された切断酵素。
35.修飾された切断酵素が、配列番号17~19、23~28、または31~39の配列のうちのいずれかの基質特異性を示す、実施形態1~34のうちのいずれか1つの修飾された切断酵素。
36.修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかの触媒ドメインと、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有する触媒ドメインを含むアミノ酸配列を含む、実施形態1~35のうちのいずれか1つの修飾された切断酵素。
37.修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかのアミン結合部位と、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有するアミン結合部位を含むアミノ酸配列を含む、実施形態1~36のうちのいずれか1つの修飾された切断酵素。
38.修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかのループドメインと、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有するループドメインと、を含むアミノ酸配列を含む、実施形態1~37のうちのいずれか1つの修飾された切断酵素。
39.修飾された切断酵素が、配列番号13の番号付けに関して、位置183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、および/または202に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、実施形態1~38のうちのいずれか1つの修飾された切断酵素。
40.修飾された切断酵素が、配列番号13の番号付けに関して、位置188、189、190、191、192、302、および/または310に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、実施形態1~38のうちのいずれか1つの修飾された切断酵素。
41.修飾された切断酵素が、配列番号13の番号付けに関して、位置191、192、196、306、310、627、628、630、648、650、651、655、656、および/または669に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、実施形態1~38のうちのいずれか1つの修飾された切断酵素。
42.修飾された切断酵素が、配列番号13の番号付けに関して、位置323~544のうちのいずれかに対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、実施形態1~38のうちのいずれか1つの修飾された切断酵素。
43.ポリペプチドを処理する方法であって、ポリペプチドを、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む修飾された切断酵素と接触させることを含み、
修飾された切断酵素が、ジペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を除去するか、または除去するように構成されるか、あるいは
修飾された切断酵素が、トリペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を、もしくはポリペプチドから単一の標識末端ジペプチドを除去するか、または除去するように構成される、方法。
44.ジペプチド切断酵素またはトリペプチド切断酵素に由来する修飾された切断酵素が、ポリペプチドの末端標識アミノ酸残基と最後から2番目の末端アミノ酸残基との間のペプチド結合を切断するように構成される、実施形態43の方法。
45.修飾された切断酵素が、ポリペプチドの末端標識アミノ酸残基と最後から2番目の末端アミノ酸残基との間のアミド結合と相互作用する活性部位を含む、実施形態43または実施形態44の方法。
46.単一の標識末端アミノ酸または単一の標識末端ジペプチドの除去が、ポリペプチドの新たな末端アミノ酸を露出させる、実施形態43~45のうちのいずれか1つの方法。
47.未修飾の切断酵素が、メタロペプチダーゼ、亜鉛依存性メタロペプチダーゼ、または亜鉛依存性ヒドロラーゼからなる群から選択される、実施形態43~46のうちのいずれか1つの方法。
48.未修飾の切断酵素が、EC3.4.14、EC3.4.15、MEROPS S8、MEROPS S9、MEROPS S33、MEROPS S46、MEROPS M49、もしくはMEROPS S53、またはその機能的相同体もしくは断片に分類されるタンパク質である、実施形態43~47のうちのいずれか1つの方法。
49.未修飾の切断酵素が、ジペプチジルペプチダーゼ、ジペプチジルアミノペプチダーゼ、ペプチジル-ジペプチダーゼ、ジペプチジルカルボキシペプチダーゼ、セドリジン、またはトリペプチジルペプチダーゼである、実施形態43~48のうちのいずれか1つの方法。
50.未修飾の切断酵素が、ジペプチジルペプチダーゼ3、ジペプチジルペプチダーゼ5、ジペプチジルペプチダーゼ7、ジペプチジルペプチダーゼ11、ジペプチジルアミノペプチダーゼBII、またはジペプチジルペプチダーゼBIIである、実施形態43~49のうちのいずれか1つの方法。
51.標識末端アミノ酸またはジペプチドが、N末端アミノ酸(NTAA)を含む、実施形態43~50のうちのいずれか1つの方法。
52.標識末端アミノ酸またはジペプチドが、C末端アミノ酸(CTAA)を含む、実施形態43~50のうちのいずれか1つの方法。
53.修飾された切断酵素が、未修飾の切断酵素と少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を示すアミノ酸配列を含む、実施形態43~52のうちのいずれか1つの方法。
54.突然変異が、アミノ酸の置換、欠失、付加、またはそれらの組み合わせを含む、実施形態43~53のうちのいずれか1つの方法。
55.ポリペプチドの長さが、4個のアミノ酸を超える、5個のアミノ酸を超える、6個のアミノ酸を超える、7個のアミノ酸を超える、8個のアミノ酸を超える、9個のアミノ酸を超える、10個のアミノ酸を超える、11個のアミノ酸を超える、12個のアミノ酸を超える、13個のアミノ酸を超える、14個のアミノ酸を超える、15個のアミノ酸を超える、20個のアミノ酸を超える、25個のアミノ酸を超える、または30個のアミノ酸を超える、実施形態43~54のうちのいずれか1つの方法。
56.ポリペプチドの長さが、10個のアミノ酸を超える、実施形態43~55のうちのいずれか1つの方法。
57.修飾された切断酵素が、その基質結合部位内に修飾を含む、実施形態43~56のうちのいずれか1つの方法。
58.修飾された切断酵素が、その触媒ドメイン内に修飾を含む、実施形態43~57のうちのいずれか1つの方法。
59.修飾された切断酵素が、そのキモトリプシンフォールド内に修飾を含む、実施形態43~58のうちのいずれか1つの方法。
60.修飾された切断酵素が、アミン結合部位に修飾を含む、実施形態43~59のうちのいずれか1つの方法。
61.修飾された切断酵素が、そのループドメインに修飾を含む、実施形態43~60のうちのいずれか1つの方法。
62.修飾された切断酵素が、修飾された切断酵素の活性部位へのアクセス可能性を改善するための修飾を含む、実施形態43~61のうちのいずれか1つの方法。
63.修飾された切断酵素が、配列番号13または20に規定されるようなジペプチジルアミノペプチダーゼBIIまたはジペプチジルペプチダーゼBIIに由来する、実施形態43~62のうちのいずれか1つの方法。
64.修飾された切断酵素が、配列番号17~19、23~28、31~39のうちのいずれかに対して、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%同一性、少なくとも70%同一性、少なくとも80%同一性、もしくは少なくとも90%以上の同一性を示すアミノ酸配列、またはその特異的結合断片を含む、実施形態43~63のうちのいずれか1つの方法。
65.修飾された切断酵素が、配列番号17~19、23~28、31~39のうちのいずれかに記載のアミノ酸の配列、もしくは配列番号17~19、23~28、31~39のうちのいずれかに対して少なくとも95%の配列同一性を示すアミノ酸の配列、またはその特異的結合断片を含む、実施形態43~64のうちのいずれか1つの方法。
66.修飾された切断酵素が、配列番号13の番号付けに関して、位置126、188、189、190、191、192、196、238、302、306、307、310、525、528、546、604、650、651、655、656、665および/または692に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、実施形態43~65のうちのいずれか1つの方法。
67.修飾された切断酵素が、配列番号13の番号付けに関して、位置126、188、189、190、191、192、196、238、302、306、307、310、525、528、546、604、650、651、655、656、665および/または692に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含み、配列番号17~19、23~28、31~39のうちのいずれかに対して少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を示すアミノ酸配列を含む、実施形態43~66のうちのいずれか1つの方法。
68.1つ以上のアミノ酸置換が、A126T、D188V、I189A、D190S、N191C、N191F、N191L、N191M、N191R、N191S、N191T、N191V、W192F、W192G、W192L、R196H、R196K、R196S、R196T、R196V、G238V、A302W、N306A、N306G、N306R、N306S、T307K、N310D、N310G、N310K、N310L、N525K、A528V、F546L、A604V、D650A、D650G、D650S、G651H、G651T、G651V、G651Y、S655G、S655T、V656E、V656G、V656S、K665I、K692N、および/またはそれらの保存的アミノ酸置換である、実施形態43~67のうちのいずれか1つの方法。
69.1つ以上のアミノ酸修飾が、N191M/W192G/R196V/N306R/D650A、D188V/I189A/D190S/N191L/W192G/R196S/A302W/N310K/D650A、N191M/W192G/R196T/N306R/T307K/D650A、N191M/W192G/R196T/N306R/N525K/A528V/A604V/D650A/K692N、A126T/N191M/W192G/R196T/G238V/N306R/D650A、N191M/W192G/R196T/N306R/F546L/D650A、N191M/W192G/R196T/N306R/D650A/G651V/K665I、N191M/W192G/R196T/N306R/D650A/G651V、N191C/W192L/R196K/N306R/N310D/G651Y/S655G/V656G、N191C/W192L/N306R/N310D/G651Y/S655G/V656G、N191F/W192F/N306R/N310G/G651H/V656E、N191R/W192L/N306S/N310L/G651T/S655T/V656S、N191S/R196H/N306A/D650G、N191T/R196H/N306A/D650G、N191M/R196H/N306A/D650G、N191V/N306A/D650S、またはN191S/N306G/D650Sである、実施形態43~68のうちのいずれか1つの方法。
70.修飾された切断酵素が、配列番号17~19、23~28、または31~39の配列のうちのいずれかの配列の基質特異性を示す、実施形態43~69のうちのいずれか1つの方法。
71.修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかの触媒ドメインと、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有する触媒ドメインを含むアミノ酸配列を含む、実施形態43~70のうちのいずれか1つの方法。
72.修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかのアミン結合部位と、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有するアミン結合部位を含むアミノ酸配列を含む、実施形態43~71のうちのいずれか1つの方法。
73.修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかのループドメインと、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有するループドメインと、を含むアミノ酸配列を含む、実施形態43~72のうちのいずれか1つの方法。
74.修飾された切断酵素が、配列番号13の番号付けに関して、位置183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、および/または202に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、実施形態43~73のうちのいずれか1つの方法。
75.修飾された切断酵素が、配列番号13の番号付けに関して、位置188、189、190、191、192、302、および/または310に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、実施形態43~73のうちのいずれか1つの方法。
76.修飾された切断酵素が、配列番号13の番号付けに関して、位置191、192、196、306、310、627、628、630、648、650、651、655、656、および/または669に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、実施形態43~73のうちのいずれか1つの方法。
77.修飾された切断酵素が、配列番号13の番号付けに関して、位置323~544のうちのいずれかに対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、実施形態43~73のうちのいずれか1つの方法。
78.前駆体ポリペプチドを、前駆体ポリペプチドの末端アミノ酸を標識するための試薬と接触させて、修飾された切断酵素で処理するために調製されたポリペプチドを提供することをさらに含む、実施形態43~78のうちのいずれか1つの方法。
79.末端アミノ酸を標識するための試薬が、化学試薬または酵素試薬である、実施形態78の方法。
80.標識が、ブロックアミノ酸を含む、実施形態43~79のうちのいずれか1つの方法。
81.標識が、外因性標識アミノ酸を含む、実施形態43~80のうちのいずれか1つの方法。
82.標識が、化学標識を含む、実施形態43~81のうちのいずれか1つの方法。
83.末端アミノ酸を標識するための試薬との接触および修飾された切断酵素との接触が、連続した順序で行われる、実施形態78~82のうちのいずれか1つの方法。
84.末端アミノ酸を標識するための試薬との接触および修飾された切断酵素との接触が、1回以上繰り返される、実施形態78~83のうちのいずれか1つの方法。
85.化学試薬が、フェニルイソチオシアネート(PITC)、ニトロ-PITC、スルホ-PITC、フェニルイソシアネート(PIC)、ニトロ-PIC、スルホ-PIC、Cbz-Cl(クロロギ酸ベンジル)またはCbz-OSu(ベンジルオキシカルボニルN-スクシンイミド)、カルボキシル活性化アミノブロックアミノ酸、1-フルオロ-2,4-ジニトロベンゼン(サンガー試薬、DNFB)、ダンシルクロリド(DNS-Cl、または1-ジメチルアミノナフタレン-5-スルホニルクロリド)、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)、無水物、2-ピリジンカルボキシアルデヒド、2-ホルミルフェニルボロン酸、2-アセチルフェニルボロン酸、1-フルオロ-2,4-ジニトロベンゼン、4-クロロ-7-ニトロベンゾフラザン、ペンタフルオロフェニルイソチオシアネート、4-(トリフルオロメトキシ)-フェニルイソチオシアネート、4-(トリフルオロメチル)-フェニルイソチオシアネート、3-(カルボン酸)-フェニルイソチオシアネート、3-(トリフルオロメチル)-フェニルイソチオシアネート、1-ナフチルイソチオシアネート、N-ニトロイミダゾール-1-カルボキシミダミド、N,N’-ビス(ピバロイル)-1H-ピラゾール-1-カルボキサミジン、N,N’-ビス(ベンジルオキシカルボニル)-1H-ピラゾール-1-カルボキサミジン、アセチル化試薬、グアニジニル化試薬、チオアシル化試薬、チオアセチル化試薬、チオベンジル化試薬、および二複素環メタニミン試薬、またはそれらの誘導体からなる群から選択される、実施形態79~84のうちのいずれか1つの方法。
86.化学試薬が、イサト酸無水物、イソニコチン酸無水物、アザイサト酸無水物、コハク酸無水物、またはそれらの誘導体である、実施形態79~85のうちのいずれか1つの方法。
87.化学試薬が、4-ニトロフェニルアントラニレート、N-メチル-イサト酸無水物、N-アセチル-イサト酸無水物、4-カルボン酸イサト酸無水物、5-メトキシ-イサト酸無水物、5-ニトロ-イサト酸無水物、4-クロロ-イサト酸無水物、4-フルオロ-イサト酸無水物、6-フルオロ-イサト酸無水物、N-ベンジル-イサト酸無水物、4-トリフルオロメチル-イサト酸無水物、5-トリフルオロメチル-イサト酸無水物、4-ニトロ-イサト酸無水物、4-メトキシ-イサト酸無水物、5-アミノ-2-フルオロ-イソニコチン無水物(6-フルオロ-1H-ピリド[3,4-d][1,3]オキサジン-2,4-ジオン)、3,6,ジフルオロフタル酸無水物、および2,3ピラジンジカルボン酸無水物、またはそれらの誘導体からなる群から選択される、実施形態86の方法。
88.ポリペプチドを、ポリペプチドの末端アミノ酸に結合することができる結合剤と接触させることをさらに含み、結合剤が、結合剤に関する識別情報を有するコーディングタグを含む、実施形態43~87のうちのいずれか1つの方法。
89.結合剤が、2つ以上の結合剤を含む、実施形態88の方法。
90.結合剤が、N末端アミノ酸(NTAA)に結合する、実施形態88または実施形態89の方法。
91.結合剤が、C末端アミノ酸(CTAA)に結合する、実施形態88または実施形態89の方法。
92.結合剤が、標識または未標識末端アミノ酸に結合することができる、実施形態88~91のうちのいずれか1つの方法。
93.結合剤との接触が、
ポリペプチドを、末端アミノ酸を標識するための試薬と接触させる前、および/または
ポリペプチドを、修飾された切断酵素と接触させる前である、実施形態88~92のうちのいずれか1つの方法。
94.結合剤との接触が、ポリペプチドを、末端アミノ酸を標識するための試薬と接触させた後である、実施形態88~93のうちのいずれか1つの方法。
95.
末端アミノ酸を標識するための試薬との接触が、結合剤との接触の前であり、
結合剤との接触が、ポリペプチドと修飾された切断酵素との接触の前である、実施形態88~92のうちのいずれか1つの方法。
96.ポリペプチドと結合剤、末端アミノ酸を標識するための試薬、および修飾された切断酵素との接触が、1回以上繰り返される、実施形態88~95のうちのいずれか1つの方法。
97.コーディングタグの別情報をポリペプチドに付着した記録タグに転送し、それによってポリペプチド上に伸長記録タグを生成することをさらに含む、実施形態88~96のうちのいずれか1つの方法。
98.識別情報の転送が、
ポリペプチドと結合剤との結合の後、および
ポリペプチドと修飾された切断酵素との接触の前に実行される、実施形態97の方法。
99.
(a)ポリペプチドを結合剤と接触させるステップ、
(b)識別情報を記録タグに転送するステップ、
(c)ポリペプチドを、末端アミノ酸を標識するための試薬と接触させるステップ、および
(d)ポリペプチドを修飾された切断酵素と接触させるステップが、
順番に繰り返されて、1つ以上の追加の伸長記録タグを生成する、実施形態97または実施形態98の方法。
100.ステップ(b)の後およびステップ(c)の前に、結合剤を除去することをさらに含む、実施形態99の方法。
101.
(a)ポリペプチドを末端アミノ酸を標識するための試薬と接触させるステップ、
(b)ポリペプチドを、標識末端アミノ酸に結合することができる結合剤と接触させるステップ、
(c)識別情報を記録タグに転送するステップ、および
(d)ポリペプチドを修飾された切断酵素と接触させるステップが、
順番に繰り返されて、1つ以上の追加の伸長記録タグを生成する、実施形態97または実施形態98の方法。
102.ステップ(c)の後およびステップ(d)の前に結合剤を除去することをさらに含む、実施形態101の方法。
103.1つ以上の伸長記録タグを分析することをさらに含む、実施形態97~102のうちのいずれか1つの方法。
104.ポリペプチドを分析するための方法であって、
(a)ポリペプチドを、ポリペプチドの末端アミノ酸に結合することができる結合剤と接触させるステップであって、結合剤が、結合剤に関する識別情報を有するコーディングタグを含む、ステップと、
(b)コーディングタグの識別情報をポリペプチドと関連付けられた記録タグに転送して、伸長記録タグを生成するステップと、
(c)ポリペプチドを試薬と接触させて、ポリペプチドの末端アミノ酸を標識するステップと、
(d)ポリペプチドを、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む修飾された切断酵素と接触させるステップと、を含み、
修飾された切断酵素が、ジペプチド切断酵素に由来し、ステップ(c)において試薬によって標識された単一の末端アミノ酸をポリペプチドから除去するか、または除去するように構成されるか、あるいは、
修飾された切断酵素が、トリペプチド切断酵素に由来し、ステップ(c)において試薬によって標識された単一の末端アミノ酸または単一の末端ジペプチドをポリペプチドから除去するか、または除去するように構成される、方法。
105.ジペプチド切断酵素またはトリペプチド切断酵素に由来する修飾された切断酵素が、ポリペプチドの末端標識アミノ酸残基と最後から2番目の末端アミノ酸残基との間のペプチド結合を切断するように構成される、実施形態104の方法。
106.トリペプチド切断酵素に由来する修飾された切断酵素が、ポリペプチドの最後から2番目の末端標識アミノ酸残基と最後から3番目の末端アミノ酸残基との間のペプチド結合を切断するように構成される、実施形態104の方法。
107.未修飾の切断酵素が、メタロペプチダーゼ、亜鉛依存性メタロペプチダーゼ、または亜鉛依存性ヒドロラーゼからなる群から選択される、実施形態104~106のうちのいずれか1つの方法。
108.未修飾の切断酵素が、EC3.4.14、EC3.4.15、MEROPS S8、MEROPS S9、MEROPS S33、MEROPS S46、MEROPS M49、もしくはMEROPS S53、またはその機能的相同体もしくは断片に分類されるタンパク質である、実施形態104~107のうちのいずれか1つの方法。
109.未修飾の切断酵素が、ジペプチジルペプチダーゼ、ジペプチジルアミノペプチダーゼ、ペプチジル-ジペプチダーゼ、ジペプチジルカルボキシペプチダーゼ、セドリジン、またはトリペプチジルペプチダーゼである、実施形態104~108のうちのいずれか1つの方法。
110.未修飾の切断酵素が、ジペプチジルペプチダーゼ3、ジペプチジルペプチダーゼ5、ジペプチジルペプチダーゼ7、ジペプチジルペプチダーゼ11、ジペプチジルアミノペプチダーゼBII、またはジペプチジルペプチダーゼBIIである、実施形態104~109のうちのいずれか1つの方法。
111.結合剤が、2つ以上の結合剤を含む、実施形態104~110のうちのいずれか1つの方法。
112.ポリペプチドが、2つ以上のポリペプチドを含む、実施形態104~111のうちのいずれか1つの方法。
113.ステップ(a)~(d)が「n」回の結合サイクルについて繰り返され、ポリペプチドに結合する各結合剤の各コーディングタグの識別情報が、前の結合サイクルから生成された伸長記録タグに転送されて、n次伸長記録タグを生成する、実施形態104~112のうちのいずれか1つの方法。
114.
(b1)結合剤を除去することをさらに含む、実施形態104~113のうちのいずれか1つの方法。
115.
(e)n次伸長記録タグを分析することをさらに含む、実施形態113または実施形態114の方法。
116.
ステップ(a)が、ステップ(b)の前に実行され、
ステップ(a)が、ステップ(c)の前に実行され、
ステップ(a)が、ステップ(d)の前に実行され、
ステップ(b)が、ステップ(c)の前に実行され、
ステップ(b)が、ステップ(d)の前に実行され、
ステップ(b1)が、ステップ(a)の後に実行され、
ステップ(b1)が、ステップ(b)の後に実行され、
ステップ(b1)が、ステップ(c)の前に実行され、
ステップ(b1)が、ステップ(d)の前に実行され、
ステップ(c)が、ステップ(a)の前に実行され、
ステップ(c)が、ステップ(b)の前に実行され、かつ/または、
ステップ(c)が、ステップ(d)の前に実行される、実施形態104~115のうちのいずれか1つの方法。
117.末端アミノ酸が、N末端アミノ酸(NTAA)である、実施形態104~116のうちのいずれか1つの方法。
118.末端アミノ酸が、C末端アミノ酸(CTAA)である、実施形態104~116のうちのいずれか1つの方法。
119.記録タグが、DNA分子、RNA分子、PNA分子、BNA分子、XNA、分子、LNA分子、γPNA分子、またはそれらの組み合わせである、実施形態97~118のうちのいずれか1つの方法。
120.記録タグが、固有の分子識別子(UMI)を含む、実施形態97~119のうちのいずれか1つの方法。
121.記録タグが、ユニバーサルプライミング部位を含む、実施形態97~120のうちのいずれか1つの方法。
122.結合剤およびコーディングタグが、リンカーによって接合される、実施形態88~121のうちのいずれか1つの方法。
123.記録タグの識別情報をコーディングタグに転送することが、プライマー伸長によって行われる、実施形態97~122のうちのいずれか1つの方法。
124.記録タグの識別情報をコーディングタグに転送することが、ライゲーションによって行われる、実施形態97~122のうちのいずれか1つの方法。
125.コーディングタグが、UMIを含む、実施形態88~124のうちのいずれか1つの方法。
126.コーディングタグが、ユニバーサルプライミング部位を含む、実施形態88~125のうちのいずれか1つの方法。
127.ポリペプチドが固体支持体に直接的または間接的に接合されている、実施形態43~126のうちのいずれか1つの方法。
128.固体支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、回転干渉計ディスク、ニトロセルロース膜、ニトロセルロースベースのポリマー表面、ナノ粒子、またはミクロスフェアである、実施形態127の方法。
129.固体支持体が、ポリスチレンビーズ、ポリアクリレートビーズ、ポリマービーズ、アガロースビーズ、セルロースビーズ、デキストランビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、制御された多孔質ビーズ、シリカベースのビーズ、またはそれらの任意の組み合わせを含む、実施形態128の方法。
130.結合剤が、ポリペプチドまたはタンパク質である、実施形態88~129のうちのいずれか1つの方法。
131.結合剤が、アミノペプチダーゼ、またはその変異体、突然変異体もしくは修飾タンパク質;アミノアシルtRNAシンテターゼ、またはその変異体、突然変異体もしくは修飾タンパク質;アンチカリン、またはその変異体、突然変異体もしくは修飾タンパク質;ClpS、ClpS2、またはその変異体、突然変異体もしくは修飾タンパク質;UBRボックスタンパク質、またはその変異体、突然変異体もしくは修飾タンパク質;または、1つ以上のアミノ酸に結合する修飾された小分子、すなわちバンコマイシン、またはその変異体、突然変異体もしくは修飾分子;または、抗体もしくはその結合断片;あるいは、それらの任意の組み合わせである、実施形態130の方法。
132.結合剤が、ポリペプチドの単一のアミノ酸残基、ジペプチド、トリペプチド、または翻訳後修飾に結合する、実施形態88~131のうちのいずれか1つの方法。
133.結合剤が、N末端アミノ酸残基に結合する、実施形態104~133の方法。
134.結合剤が、C末端アミノ酸残基に結合する、実施形態104~133の方法。
135.1つ以上の伸長記録タグが、分析の前に増幅される、実施形態103~134のうちのいずれか1つの方法。
136.1つ以上の伸長記録タグを分析することが、核酸配列決定法を含む、実施形態103~135のうちのいずれか1つの方法。
137.核酸配列決定法が、合成によるシーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、実施形態136の方法。
138.核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアベースのシーケンシング、または高度な顕微鏡を使用したDNAのダイレクトイメージングである、実施形態136または実施形態137の方法。
139.ポリペプチドを修飾された切断酵素と接触させて単一の末端アミノ酸を除去することが、5分間未満、10分間未満、20分間未満、30分間未満、40分間未満、50分間未満、60分間未満、2時間未満、5時間未満、8時間未満、または10時間未満で行われる、実施形態43~138のうちのいずれか1つの方法。
140.核酸、例えば、DNA、RNA、またはそれらの混合物もしくは組み合わせを分解する条件の不在下で実施される、実施形態43~139のうちのいずれか1つの方法。
141.核酸を分解する条件が、化学的条件である、実施形態140の方法。
142.核酸と適合性のある条件の存在下で実施される、実施形態43~141のうちのいずれか1つの方法。
143.強酸または強塩基の不在下で実施される、実施形態140~142のうちのいずれか1つの方法。
144.強酸無水物の不在下で実施される、実施形態143の方法。
145.強酸無水物(strong anhydrous)が、TFA無水物である、実施形態144の方法。
146.ポリペプチドを処理するためのキットであって、
突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む修飾された切断酵素であって、
修飾された切断酵素が、ジペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を除去するか、または除去するように構成されるか、あるいは
修飾された切断酵素が、トリペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を、もしくはポリペプチドから単一の標識末端ジペプチドを除去するか、または除去するように構成される、修飾された切断酵素と、
ポリペプチドの末端アミノ酸を標識するための試薬と、を含む、キット。
147.ジペプチド切断酵素またはトリペプチド切断酵素に由来する修飾された切断酵素が、ポリペプチドの末端標識アミノ酸残基と最後から2番目の末端アミノ酸残基との間のペプチド結合を切断するように構成される、実施形態146のキット。
148.トリペプチド切断酵素に由来する修飾された切断酵素が、ポリペプチドの最後から2番目の末端標識アミノ酸残基と最後から3番目の末端アミノ酸残基との間のペプチド結合を切断するように構成される、実施形態146のキット。
149.修飾された切断酵素が、ポリペプチドの末端標識アミノ酸残基と最後から2番目の末端アミノ酸残基との間のアミド結合と相互作用する活性部位を含む、実施形態146~148のうちのいずれか1つのキット。
150.未修飾の切断酵素が、メタロペプチダーゼ、亜鉛依存性メタロペプチダーゼ、または亜鉛依存性ヒドロラーゼからなる群から選択される、実施形態146~149のうちのいずれか1つのキット。
151.未修飾の切断酵素が、EC3.4.14、EC3.4.15、MEROPS S8、MEROPS S9、MEROPS S33、MEROPS S46、MEROPS M49、もしくはMEROPS S53、またはその相同体に分類されるタンパク質である、実施形態146~150のうちのいずれか1つのキット。
152.未修飾の切断酵素が、ジペプチジルペプチダーゼ、ジペプチジルアミノペプチダーゼ、ペプチジル-ジペプチダーゼ、ジペプチジルカルボキシペプチダーゼ、セドリジン、またはトリペプチジルペプチダーゼである、実施形態146~151のうちのいずれか1つのキット。
153.未修飾の切断酵素が、ジペプチジルペプチダーゼ3、ジペプチジルペプチダーゼ5、ジペプチジルペプチダーゼ7、ジペプチジルペプチダーゼ11、ジペプチジルアミノペプチダーゼBII、またはジペプチジルペプチダーゼBIIである、実施形態146~152のうちのいずれか1つのキット。
154.標識末端アミノ酸またはジペプチドが、N末端アミノ酸(NTAA)を含む、実施形態146~153のうちのいずれか1つのキット。
155.標識末端アミノ酸またはジペプチドが、C末端アミノ酸(CTAA)を含む、実施形態146~153のうちのいずれか1つのキット。
156.修飾された切断酵素が、ポリペプチドの最後から2番目の末端アミノ酸残基と最後から3番目の末端アミノ酸残基との間のペプチド結合を切断しない、実施形態146~155のうちのいずれか1つのキット。
157.修飾された切断酵素が、未修飾の切断酵素と少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を示すアミノ酸配列を含む、実施形態146~156のうちのいずれか1つのキット。
158.突然変異が、アミノ酸の置換、欠失、付加、またはそれらの組み合わせを含む、実施形態146~157のうちのいずれか1つのキット。
159.ポリペプチドの長さが、4個のアミノ酸を超える、5個のアミノ酸を超える、6個のアミノ酸を超える、7個のアミノ酸を超える、8個のアミノ酸を超える、9個のアミノ酸を超える、10個のアミノ酸を超える、11個のアミノ酸を超える、12個のアミノ酸を超える、13個のアミノ酸を超える、14個のアミノ酸を超える、15個のアミノ酸を超える、20個のアミノ酸を超える、25個のアミノ酸を超える、または30個のアミノ酸を超える、実施形態146~158のうちのいずれか1つのキット。
160.ポリペプチドの長さが、10個のアミノ酸を超える、実施形態146~159のうちのいずれか1つのキット。
161.修飾された切断酵素が、その基質結合部位内に修飾を含む、実施形態146~160のうちのいずれか1つのキット。
162.修飾された切断酵素が、その触媒ドメイン内に修飾を含む、実施形態146~161のうちのいずれか1つのキット。
163.修飾された切断酵素が、そのキモトリプシンフォールド内に修飾を含む、実施形態146~162のうちのいずれか1つのキット。
164.修飾された切断酵素が、アミン結合部位に修飾を含む、実施形態146~163のうちのいずれか1つのキット。
165.修飾された切断酵素が、そのループドメインに修飾を含む、実施形態146~164のうちのいずれか1つのキット。
166.修飾された切断酵素が、修飾された切断酵素の活性部位へのアクセス可能性を改善するための修飾を含む、実施形態146~165のうちのいずれか1つのキット。
167.修飾された切断酵素が、配列番号13または20に規定されるようなジペプチジルアミノペプチダーゼBIIまたはジペプチジルペプチダーゼBIIに由来する、実施形態146~166のうちのいずれか1つのキット。
168.修飾された切断酵素が、配列番号17~19、23~28、31~39のうちのいずれかに対して、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも128%の同一性、少なくとも50%の同一性、少なくとも60%同一性、少なくとも70%同一性、少なくとも80%同一性、または少なくとも90%以上の同一性を示すアミノ酸配列、またはその特異的結合断片を含む、実施形態146~167のうちのいずれか1つのキット。
169.修飾された切断酵素が、配列番号17~19、23~28のうちのいずれかに記載のアミノ酸の配列、もしくは配列番号17~19、23~28、31~39のうちのいずれかに対して少なくとも95%の配列同一性を示すアミノ酸の配列、またはその特異的結合断片を含む、実施形態146~168のうちのいずれか1つのキット。
170.修飾された切断酵素が、配列番号13の番号付けに関して、位置126、188、189、190、191、192、196、238、302、306、307、310、525、528、546、604、650、651、655、656、665および/または692に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、実施形態146~169のうちのいずれか1つのキット。
171.修飾された切断酵素が、配列番号13の番号付けに関して、位置126、188、189、190、191、192、196、238、302、306、307、310、525、528、546、604、650、651、655、656、665および/または692に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含み、配列番号17~19、23~28、31~39のうちのいずれかに対して少なくとも30%の同一性、少なくとも128%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を示すアミノ酸配列を含む、実施形態146~170のうちのいずれか1つのキット。
172.1つ以上のアミノ酸置換が、A126T、D188V、I189A、D190S、N191C、N191F、N191L、N191M、N191R、N191S、N191T、N191V、W192F、W192G、W192L、R196H、R196K、R196S、R196T、R196V、G238V、A302W、N306A、N306G、N306R、N306S、T307K、N310D、N310G、N310K、N310L、N525K、A528V、F546L、A604V、D650A、D650G、D650S、G651H、G651T、G651V、G651Y、S655G、S655T、V656E、V656G、V656S、K665I、K692N、および/またはそれらの保存的アミノ酸置換である、実施形態146~171のうちのいずれか1つのキット。
173.1つ以上のアミノ酸修飾が、N191M/W192G/R196V/N306R/D650A、D188V/I189A/D190S/N191L/W192G/R196S/A302W/N310K/D650A、N191M/W192G/R196T/N306R/T307K/D650A、N191M/W192G/R196T/N306R/N525K/A528V/A604V/D650A/K692N、A126T/N191M/W192G/R196T/G238V/N306R/D650A、N191M/W192G/R196T/N306R/F546L/D650A、N191M/W192G/R196T/N306R/D650A/G651V/K665I、N191M/W192G/R196T/N306R/D650A/G651V、N191C/W192L/R196K/N306R/N310D/G651Y/S655G/V656G、N191C/W192L/N306R/N310D/G651Y/S655G/V656G、N191F/W192F/N306R/N310G/G651H/V656E、N191R/W192L/N306S/N310L/G651T/S655T/V656S、N191S/R196H/N306A/D650G、N191T/R196H/N306A/D650G、N191M/R196H/N306A/D650G、N191V/N306A/D650S、またはN191S/N306G/D650Sである、実施形態146~172のうちのいずれか1つのキット。
174.修飾された切断酵素が、配列番号17~19、23~28、または31~39の配列のうちのいずれかの基質特異性を示す、実施形態146~173のうちのいずれか1つのキット。
175.修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかの触媒ドメインと、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも128%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有する触媒ドメインを含むアミノ酸配列を含む、実施形態146~174のうちのいずれか1つのキット。
176.修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかのアミン結合部位と、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも128%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有するアミン結合部位を含むアミノ酸配列を含む、実施形態146~175のうちのいずれか1つのキット。
177.修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかのループドメインと、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも128%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有するループドメインと、を含むアミノ酸配列を含む、実施形態146~176のうちのいずれか1つのキット。
178.修飾された切断酵素が、配列番号13の番号付けに関して、位置183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、および/または202に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、実施形態146~177のうちのいずれか1つのキット。
179.修飾された切断酵素が、配列番号13の番号付けに関して、位置188、189、190、191、192、302、および/または310に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、実施形態146~177のうちのいずれか1つのキット。
180.修飾された切断酵素が、配列番号13の番号付けに関して、位置191、192、196、306、310、627、628、630、648、650、651、655、656、および/または669に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、実施形態146~177のうちのいずれか1つのキット。
181.修飾された切断酵素が、配列番号13の番号付けに関して、位置323~544のうちのいずれかに対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、実施形態146~177のうちのいずれか1つのキット。
182.末端アミノ酸が、化学もしくは酵素試薬または部分で標識されている、実施形態146~181のうちのいずれかのキット。
183.標識が、ブロックアミノ酸を含む、実施形態146~182のうちのいずれかのキット。
184.標識が、外因性標識アミノ酸を含む、実施形態146~183のうちのいずれかのキット。
185.標識が、化学標識を含む、実施形態146~184のうちのいずれかのキット。
186.化学試薬が、フェニルイソチオシアネート(PITC)、ニトロ-PITC、スルホ-PITC、フェニルイソシアネート(PIC)、ニトロ-PIC、スルホ-PIC、Cbz-Cl(クロロギ酸ベンジル)またはCbz-OSu(ベンジルオキシカルボニルN-スクシンイミド)、カルボキシル活性化アミノブロックアミノ酸、1-フルオロ-2,4-ジニトロベンゼン(サンガー試薬、DNFB)、ダンシルクロリド(DNS-Cl、または1-ジメチルアミノナフタレン-5-スルホニルクロリド)、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)、無水物、2-ピリジンカルボキシアルデヒド、2-ホルミルフェニルボロン酸、2-アセチルフェニルボロン酸、1-フルオロ-2,4-ジニトロベンゼン、4-クロロ-7-ニトロベンゾフラザン、ペンタフルオロフェニルイソチオシアネート、4-(トリフルオロメトキシ)-フェニルイソチオシアネート、4-(トリフルオロメチル)-フェニルイソチオシアネート、3-(カルボン酸)-フェニルイソチオシアネート、3-(トリフルオロメチル)-フェニルイソチオシアネート、1-ナフチルイソチオシアネート、N-ニトロイミダゾール-1-カルボキシミダミド、N,N’-ビス(ピバロイル)-1H-ピラゾール-1-カルボキサミジン、N,N’-ビス(ベンジルオキシカルボニル)-1H-ピラゾール-1-カルボキサミジン、アセチル化試薬、グアニジニル化試薬、チオアシル化試薬、チオアセチル化試薬、チオベンジル化試薬、および二複素環メタニミン試薬、またはそれらの誘導体からなる群から選択される、実施形態182のキット。
187.化学試薬が、イサト酸無水物、イソニコチン酸無水物、アザイサト酸無水物、コハク酸無水物、またはそれらの誘導体である、実施形態182のキット。
188.化学試薬が、4-ニトロフェニルアントラニレート、N-メチル-イサト酸無水物、N-アセチル-イサト酸無水物、4-カルボン酸イサト酸無水物、5-メトキシ-イサト酸無水物、5-ニトロ-イサト酸無水物、4-クロロ-イサト酸無水物、4-フルオロ-イサト酸無水物、6-フルオロ-イサト酸無水物、N-ベンジル-イサト酸無水物、4-トリフルオロメチル-イサト酸無水物、5-トリフルオロメチル-イサト酸無水物、4-ニトロ-イサト酸無水物、4-メトキシ-イサト酸無水物、5-アミノ-2-フルオロ-イソニコチン無水物(6-フルオロ-1H-ピリド[3,4-d][1,3]オキサジン-2,4-ジオン)、3,6,ジフルオロフタル酸無水物、および2,3ピラジンジカルボン酸無水物、またはそれらの誘導体からなる群から選択される、実施形態187のキット。
189.結合剤をさらに含み、結合剤が、結合剤に関する識別情報を有するコーディングタグを含む、実施形態146~188のうちのいずれか1つのキット。
190.キットが、2つ以上の結合剤を含む、実施形態189のキット。
191.結合剤が、未標識末端アミノ酸に結合するように構成される、実施形態189または実施形態190のキット。
192.結合剤が、標識末端アミノ酸に結合するように構成される、実施形態189または実施形態190のキット。
193.結合剤が、ポリペプチドの単一のアミノ酸残基、ジペプチド、トリペプチド、または翻訳後修飾に結合する、実施形態189~192のうちのいずれか1つのキット。
194.結合剤が、N末端アミノ酸残基に結合する、実施形態193のキット。
195.結合剤が、C末端アミノ酸残基に結合する、実施形態193のキット。
196.結合剤が、ポリペプチドまたはタンパク質である、実施形態189~195のうちのいずれか1つのキット。
197.結合剤が、アミノペプチダーゼ、またはその変異体、突然変異体もしくは修飾タンパク質;アミノアシルtRNAシンテターゼ、またはその変異体、突然変異体もしくは修飾タンパク質;アンチカリン、またはその変異体、突然変異体もしくは修飾タンパク質;ClpS(ClpS2など)、またはその変異体、突然変異体もしくは修飾タンパク質;UBRボックスタンパク質、またはその変異体、突然変異体もしくは修飾タンパク質;または、1つ以上のアミノ酸に結合する修飾された小分子、すなわちバンコマイシン、またはその変異体、突然変異体もしくは修飾分子;または、抗体もしくはその結合断片;あるいは、それらの任意の組み合わせである、実施形態189~196のうちのいずれか1つのキット。
198.コーディングタグの識別情報を前記ポリペプチドに付着した記録タグに転送するための試薬をさらに含み、前記識別情報の前記記録タグへの前記転送により、前記ポリペプチド上に伸長記録タグが生成される、実施形態146~197のうちのいずれか1つのキット。
199.識別情報を伝達するための試薬が、化学ライゲーション試薬または生物学的ライゲーション試薬である、実施形態198のキット。
200.識別情報を伝達するための試薬が、一本鎖核酸または二本鎖核酸のプライマー伸長のための試薬である、実施形態198のキット。
201.伸長記録タグを増幅するための増幅試薬をさらに含む、実施形態198~200のうちのいずれか1つのキット。
202.ビーズ、多孔質ビーズ、磁性ビーズ、常磁性ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、回転干渉測定ディスク、膜、ニトロセルロース膜、ニトロセルロースベースのポリマー表面、ナノ粒子(例えば、磁性ナノ粒子(Fe)、金ナノ粒子、および/または銀ナノ粒子などの金属を含む)、量子ドット、ナノシェル、ナノケージ、ミクロスフェア、ならびにそれらの任意の組み合わせからなる群から選択される固体支持体をさらに含む、実施形態146~201のうちのいずれかのキット。
203.固体支持体が、ポリスチレンビーズ、ポリアクリレートビーズ、ポリマービーズ、アガロースビーズ、セルロースビーズ、デキストランビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、制御された多孔質ビーズ、シリカベースのビーズ、またはそれらの任意の組み合わせを含む、実施形態202のキット。
204.核酸配列決定分析のための試薬をさらに含む、実施形態146~203のうちのいずれか1つのキット。
205.核酸配列決定分析が、合成によるシーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、ポロニーシーケンシング、イオン半導体シーケンシング、パイロシーケンシング、単一分子リアルタイムシーケンシング、ナノポアベースのシーケンシング、または高度な顕微鏡を使用したDNAのダイレクトイメージング、またはそれらの任意の組み合わせを含む、実施形態204のキット。
以下の実施例は、本明細書において提供される方法、組成物、および使用を説明するために提供されるが、これらを限定するものではない。
実施例1:修飾された切断酵素の選択、設計、および単離
本実施例では、修飾された切断酵素の選択および単離、ならびに合理的設計による選択された活性のためのジペプチジルペプチダーゼ3(DPP3)、ジペプチジルペプチダーゼ5(DPP5)およびジペプチジルアミノペプチダーゼBII(DAP BII)タンパク質の操作について説明する。
A.修飾されたNTAAペプチドに対して活性なDPP3、DPP5およびDAP BII変異体の遺伝子選択
DPP3、DPP5およびDAP BII変異体などの最適な操作された修飾切断酵素を識別するために、アミノ酸特異的な栄養要求性E.coli株(エール大学のCSSC E.coli遺伝子ストックセンターから入手可能-https://cgsc2.biology.yale.edu/)を使用して遺伝子選択を実施する。この株は、栄養要求性アミノ酸または栄養要求性アミノ酸を含む短いペプチドが供給された場合にのみ、最小培地プレートで生存する。例えば、Neuenschwander et al.,Nat Biotechnol.(2007)25(10):1145-1147)を参照のこと。この細胞ベースのアッセイシステムを使用して、次のように標識ポリペプチドで機能する変異体を選択する。切断酵素遺伝子(DPP3、DPP5およびDAP BIIなど)を、Cbz標識テトラペプチド(Cbz-AAAR、Cba-VSAR)を添加した栄養要求性株において個別に発現させる。ここでは、C末端のジアミノ酸が、細胞質ゾルでの天然のジペプチドの取り込みおよび切断の際に栄養要求性サプリメントとして機能する。短いオリゴペプチド基質は、外膜ポリンチャネルを介してペリプラズムに浸透するが、E.coliの3つの主要なオリゴペプチド/ジペプチド取り込み系であるOpp、TppおよびDppを介した細胞質への能動輸送を必要とする(Abouhamad et al.,Mol Microbiol.(1991)5(5):1035-1047)。細胞質に取り込まれた後、短いペプチドは、細胞質ゾル内の内因性エンドペプチダーゼによって消化される。これらの3つの系によるオリゴペプチドまたはジペプチドの輸送は、N末端修飾(例えば、Cbz)オリゴペプチド/ジペプチドによって阻害される(Smith et al.,Microbiology(1999)145(Pt 10):2891-901;Payne et al.,Arch Biochem Biophys.(2000)384(1):9-23;Fang et al.,J Bacteriol.2000 May;182(9):2530-2535)。Cbz標識原料での栄養要求性E.coliの増殖は抑制されるであろう。遺伝子選択は、適切なシグナルペプチド(例えば、pelB)を使用して、ペリプラズムにおける機能性タンパク質の発現および分泌によってこの阻害を緩和することにより達成される(Speck et al.,Protein Eng Des Sel.(2011)24(6):473-484;Thie et al.,N Biotechnol.(2008)25(1):49-54)。ペリプラズムに入ると、機能性タンパク質は、Cbz-オリゴペプチドを遊離の栄養要求性ジペプチドに変換し、細胞質に取り込まれる。
アミノ酸に対して栄養要求性のE.coli株(アルギニン、グルタミン、またはトリプトファンなど)が、遺伝子選択に採用される。他の好適な菌株も選択に使用することができる。遺伝子選択のための増殖培地は、MgSO、CaCl、グルコース、および寒天を添加したM9最小培地塩である。溶液をプレートに注いで固化させる前に、適切なCbz標識ペプチドも増殖培地に添加する。
切断酵素遺伝子のファミリー(例えば、DPP3、DPP5およびDAP BII)を試験するための一般的なアプローチは、それらのコードされたタンパク質の相同性に基づいて、NCBIデータベースクラスター内のファミリーを選択することである。各クラスターからの代表を含む遺伝子のプールを選択する。選択したタンパク質の遺伝子を、E.coliでの発現に最適化されたコドンを使用して合成する。さまざまな生物からのタンパク質をコードする遺伝子をプールし、突然変異遺伝子のライブラリーを、既知の構造を持つタンパク質の結晶構造を使用したエラープローンPCRまたは合理的な突然変異誘発によって生成する。さらに、エラープローンPCRおよび合理的な突然変異誘発の組み合わせを使用して、追加の突然変異ライブラリーを生成する。続いて、変異遺伝子のプールを、T5またはアラビノースプロモーターなどの栄養要求性株における遺伝子発現と適合性のあるプロモーターを有するベクターにクローン化する。変異遺伝子のライブラリーを、コードされたタンパク質のN末端にペリプラズムターゲティングシグナル(例えば、pelB)を追加するベクターにクローン化する。次に、クローン化されたライブラリーを、E.coli栄養要求性株に形質転換する。リッチな培地(例えば、SOC)で形質転換細胞を回収した後、細胞をM9最小液体培地で洗浄して、栄養要求株が偽陽性として提示することにより遺伝子選択を覆すことができるタンパク質の痕跡をすべて除去する。次に、細胞を、Cbz標識ペプチドを含む選択培地上に広げる。コロニーが観察されるまで、プレートを摂氏25~37度の範囲の温度でインキュベートする。選択培地で増殖しているコロニーを分離し、プラスミドDNAを抽出する。次に、切断酵素遺伝子の配列を決定して、Cbz標識ペプチドを除去することができるタンパク質配列を特定する。
さまざまな長さおよび配列を有するCbz標識ペプチドを遺伝子選択に使用して、ポリペプチド合成に使用される20個の修飾天然アミノ酸すべてを除去することができる特異性を持つ酵素を生成することができる。
B.修飾されたNTAAペプチドに対する活性についての、DPP3、DPP5およびDAP BIIの合理的設計
標識されたN末端アミノ酸(NTAA)を除去するためにDPP3を操作するための合理的な設計アプローチは、基質と複合体を形成したDPP3の結晶構造を使用して導かれる。基質と複合体を形成したヒトDPP3の構造では、残基Glu316、Asn391、およびAsn394(配列番号5に記載のタンパク質の配列に基づく;UniProtアクセッション番号Q9NY33)は、ペプチドのN末端アミン基と水素結合相互作用を行う。これらの残基は、個別にまたは組み合わせて、標識されたNTAAに対応する修飾ジペプチジルペプチダーゼを選択するように改変される。
基質を含むDPP5の結晶構造がないため、Rosetta巨大分子モデリングスイートなどの比較モデリングツールを使用して、DPP5のホモロジーモデルを生成する。モデルおよび配列分析に基づいて、Thr127~Thr180(NCBI参照配列WP_012457755.1に基づく;配列番号16)のループは、天然N末端アミノ酸に結合するための仮想領域および故に修飾アミノ酸を認識するための操作領域であると特定された。この領域のN末端アミンに結合することができる複数の酸性残基は、Asp142、Asp153およびAsp160など、高度に保存される。エラープローンPCR、部位飽和突然変異誘発、およびBlast検索からの相同ループへの置換など、複数のアプローチを使用してこのループ領域を探索することができる。これらのさまざまな多様化戦略は、PCRまたは商業的に合成されたオリゴによってインビトロで生成されたオリゴを使用するキュンケルベースのアプローチを介してライブラリーに組み込まれる。ループ領域の小さな変化を試験することに加えて、インビトロ組換えを使用して、大きな配列変化、および/または完全長のエラープローンPCRを組み合わせて、ループの外側の領域を探索することもできる。突然変異スキャンおよびランダムエラープローンベースのアプローチにより、ライブラリー作製およびスクリーニングの次のラウンドのホットスポット領域を特定することができる。
標識されたN末端アミノ酸(NTAA)を除去するためにDAP BIIを操作するための合理的な設計アプローチは、基質と複合体を形成したDAP BIIの結晶構造を使用して導かれる(Sakamoto et al.,Scientific Reports 2014,4:4977)。ペプチド基質と複合体を形成するDAP BII構造において、残基N191、W192、R196、N306、およびD650(配列番号13に記載のタンパク質の配列に基づく;UniProtアクセッション番号V5YM14)は、ペプチドのN末端アミン基と水素結合相互作用を行う。さらに、天然DAP BII結晶構造では、約20残基(残基183~202)のループが、結合したペプチド基質のN末端残基および最後から2番目の残基と接触する。これらのアミン結合残基ならびにNTAAおよび最後から2番目のNTAA結合残基を、個別にまたは組み合わせて、最小限のバイアスで標識されたNTAA残基の後に切断する修飾された切断酵素を選択するように改変する。キュンケルおよび関連する方法(Kunkel,T(1985).PNAS 82(2):488-492)によるこれらの残基のコンビナトリアル変異体ライブラリーを作製し、遺伝子選択ライブラリーを使用して、修飾されたN末端アミノ酸に対する活性が改変された変異体をスクリーニングする。エラープローンベースのライブラリーは、ライブラリーの作製およびスクリーニングの次のラウンドの最初のスクリーニングからのヒットに基づいて構築される。
C.より長いペプチドに対して活性なDPP3の操作された変異体
場合によっては、DPP3酵素の最大ペプチド基質長が制限される場合がある。例えば、ヒト酵素のペプチド基質長は、8個~10個のアミノ酸に制限される。遺伝子選択は、未修飾のジペプチジルペプチダーゼと比較して増加したペプチドのサイズまたは長さを切断することができる、修飾されたジペプチジルペプチダーゼ酵素を識別するために実施される。E.coli外膜のポリンサイズは、5個または6個のアミノ酸に取り込まれることができるペプチドの長さを制限する。このサイズ制限を覆すために、ビオチントランスポーターを介してE.coliに取り込まれ得る長さ31個のアミノ酸までのビオチン化ペプチドが、DPP3酵素のインビボ基質として使用される。
DPP3によって切断され得るペプチドの長さを長くするための合理的な設計アプローチは、基質と複合体を形成したDPP3の結晶構造を使用して実施される。8個のアミノ酸ペプチドであるDRVYIHPF(配列番号9)と複合体を形成したヒトDPP3の構造において、ペプチドの長さを制約するDPP3の領域が推定される。例えば、アミノ酸残基419~426(配列番号5に記載のヒトDPP3に従って番号付けされる)が、DPP3がより長いペプチドで活性であることを可能にするための突然変異誘発または除去の標的とされる。
D.精製および特徴付け条件
選択された切断酵素(例えば、DPP3、DPP5、DAP BII)は、6ヒスチジンタグなどの精製タグを伴って生成され、タグを使用して精製される。蛍光または比色基質は、分子に共役したCbz修飾用アミノ酸(Cbz modifying amino acids)によって生成され、Cbz修飾アミノ酸(Cbz modified amino acid)の切断時にシグナルを生成する。使用されるアミノ酸結合基質には、アミノ酸-ニトロアニリド、アミノ酸-β-ナフチルアミド、およびアミノ酸-アミドメチルクマリンが含まれる。これらの基質を使用して、選択された修飾酵素の活性を迅速にアッセイおよび最適化する。
実施例2:「アミノ酸」様プロファイルを模倣する化合物によるペプチドのN末端アミノ酸(NTAA)の標識
本実施例では、ポリペプチドをさまざまな化学試薬で処理することによるN末端アミノ酸の標識について説明する。ペプチドのN末端へのベンジルオキシカルボニル(Cbz)、フェニルイソチオシアネート(PITC)、またはPITC誘導体の付加は、DPP3、DPP5またはDAP BIIなどのジペプチジルペプチダーゼのための天然基質であるN末端アミノ酸へのチロシンまたはフェニルアラニンの付加に似ている。主な際立った特徴は、N末端アミン基がないことである。N末端アミノ酸を標識するためのいくつかの試薬を、N末端を効率的に標識する能力について試験した。アミノ酸を標識するための化学試薬も、天然DNAの修飾に対する効果について試験した。例えば、4つの異なるN末端修飾試薬を示す。
Figure 2022526939000046
ペプチドを標識するための修飾試薬には、3つのイソチオシアネート(ピリジル-ITC、ニトロ-PITC、およびスルホ-ITC)が含まれる。場合によっては、イソチオシアネートの代わりにイソシアネートを使用して、最終的な修飾NTAAに、チオ尿素(硫黄)ではなく尿素(酸素)を生成することができる。示される4番目の試薬は、独自のグアニジニル化誘導体である。ピリジル-ITCは、イソチオシアネートに基づく既知のエドマン修飾試薬のクラスに由来し、酸性条件下で自己脱離するN末端を生成する。ニトロ-PITCおよびスルホ-PITCは、フェニルイソチオシアネート(PITC)のより活性なエドマン誘導体である。すべてのイソチオシアネート試薬を、水性条件下で、2つの例示的なペプチド(N末端G(NT-G)=GRFSGIY(配列番号40)を有するペプチド;N末端W(NT-W)=WTQIFGA(配列番号41)を有するペプチド)のペプチドNTAA修飾について試験した。PITCに関連する誘導体化を、25mMの示された試薬を使用して、1×PBS緩衝液中で60℃にて15分間実行した。グアニジニル化(guandinylation)誘導体化を、15mMのグアニジニル化試薬を使用して、10%DMSOを含む1×PBS緩衝液(pH値7.4)中で60℃にて1時間実行した。合計50当量の試薬を溶液アッセイに使用した。LC-MSを使用して、さまざまな修飾試薬によるペプチドの変換効率を定量化した。
すべての場合において、示されたペプチドを標識するための修飾試薬について、定量的修飾がDNA修飾なしで観察された。PITCも対照として使用されたが、試験された条件下では完全な修飾は生成されなかった。図3に示すように、ピリジル-ITC、ニトロ-PITCおよびスルホ-ITCによるペプチドの高収率での標識および高収率でのグアニジニル化が、いずれのペプチドでも観察された。
実施例3:N末端の「保護された」アミノ酸によるペプチドのN末端アミノ酸(NTAA)の標識
本実施例では、N末端アミノ酸の標識にブロックアミノ酸または保護されたアミノ酸を使用する方法について説明する。
Figure 2022526939000047
N末端遊離ペプチドの混合物(合計0.1mmol)をアセトニトリル/TEAA(1mL、50mM TEAA、1:1(v/v)、pH値=8.5)に溶解し、Ac-Phe-Pfp(1mmol)を添加する。混合物を、室温で1時間撹拌する。アセトニトリルを減圧下で蒸発させ、ペプチド混合物をC18カラムで濾過して、Ac-Phe末端ペプチドを生成する。
別の例では、N末端遊離ペプチドの混合物(合計0.1mmol)をアセトニトリル/TEAA(1mL、50mM TEAA、1:1(v/v)、pH値=8.5)に溶解し、Cbz(Z)-Ala-OSu(1mmol、Bachem)を添加する。混合物を、室温で30分間撹拌する。アセトニトリルを減圧下で蒸発させ、ペプチド混合物をC18カラムで濾過して、Cbz(Z)-Ala末端ペプチドを生成する。
場合によっては、PfPは、NHSまたはスルホ-NHSに置き換えることができる。他の例では、アミノ酸のAc保護アミンを、Fmoc、Boc、またはCbz保護することができる。他の例では、アミノ酸のアミンは、ジアルキルである。他の例では、アミノ酸のカルボン酸は遊離しており、アミノ酸は、HATU+DIEAまたはEDC+DIEA+HOBtなどの標準的なペプチドカップリング試薬を使用してカップリングされる。他の例では、アミノ酸は、DまたはLキラリティーであり得る。アミノ酸は、天然または合成の任意のアミノ酸であり得る。
実施例4:DAP BII由来の修飾された切断酵素の選択、単離および評価
本実施例では、変異体DAP BII遺伝子のライブラリーの生成と、遺伝子選択からの活性な修飾切断酵素の識別について説明する。
DAP BIIライブラリーは、実質的に実施例1に記載されるように生成され、位置191、192、196、306、310、650、651、655、および656(配列番号13に記載のタンパク質の配列に基づく)から選択される残基のさまざまな組み合わせを標的とした。変異体DAP BIIライブラリーを、argA遺伝子に欠失があるE.coliのアルギニン栄養要求性株(JW2786-1株)に形質転換した。切断酵素遺伝子を、ペリプラズム標的配列であるPelBシグナル配列で発現させた。アルギニンN末端修飾ペプチドを添加したM9最小培地寒天プレートを使用して、形質転換されたE.coli上で遺伝子選択を行った。コロニーが出現するまで、プレートを35℃でインキュベートした。選択時には、N末端修飾アルギニンペプチド(AAAR(配列番号21)またはARAA(配列番号29))に対して活性である修飾(例えば、DAP BII)切断酵素を有する細胞は、ペプチドを切断し、アルギニンを放出する。このアルギニンの放出により、細胞は生存することができる。イサト酸無水物、5-ニトロイサト酸無水物、およびコハク酸無水物を含む、さまざまな例示的な化学試薬を使用して、アルギニン含有ペプチドのN末端を標識した。コロニーが出現するまで、プレートを35℃でインキュベートした。続いて、生存している細胞からプラスミドDNAを単離および配列決定して、標識アミノ酸を認識する活性な修飾切断酵素を生成する突然変異を識別した。
記載された遺伝子選択アプローチを使用して、DAP BIIの突然変異を、野生型DAP BII遺伝子に由来する例示的な活性修飾切断酵素で識別した。遺伝子選択で識別した候補を、溶液中アッセイに供した酵素変異体の精製によって確認した。切断酵素遺伝子は、タンパク質のC末端に融合したヘキサヒスチジンタグをコードする。これにより、固定化された金属アフィニティークロマトグラフィーによって切断酵素を精製することができる。精製された修飾切断酵素の候補を、HEPES(50mM、pH7.5)、EDTA(1mM)、切断酵素(100nM~1μM)、および配列番号22に記載されるような配列AAGVAMPGAEDDVVGSGSK(N)のN末端標識ペプチド(100μM)から構成される反応混合物においてアッセイした。反応物を、25℃~37℃の間で30分間~3時間インキュベートした。次に、反応混合物を、生成物の識別のためにLC-MSによって分析した。
単一の標識末端アミノ酸を除去した例示的な切断酵素が識別され、表10に示されるのと同様の切断活性を示すことが明らかにされた。確認した活性な修飾ジペプチド切断酵素は、表11に記載の突然変異を含み、例示的なアミノ酸置換は、配列番号13に記載されるそれぞれの参照未修飾DAP BII配列に対応するアミノ酸位置番号で表される。アミノ酸の位置は中央に示され、対応する未修飾(例えば、野生型)アミノ酸が番号の前に列挙され、識別した変異型アミノ酸置換が番号の後に列挙される。示されるように、LC-MSデータは、標識末端アミノ酸(A)の切断および除去後、C末端産物であるAGVAMPGAEDDVVGSGSK(N)の予想質量と一致する836.4の観測質量を有する生成物を識別した。これらのデータは、記載されたプロセスが、野生型ジペプチド切断酵素であるDAP BIIを修飾し、これが未標識ジペプチドを自然に除去して、単一の標識末端アミノ酸を除去することを実証する。
Figure 2022526939000048
Figure 2022526939000049
実施例5:外因性の活性化されたブロックアミノ酸によるペプチドのN末端アミノ酸(NTAA)の標識
本実施例では、ポリペプチドのN末端アミノ酸(NTAA)を標識するための試薬の合成、および遺伝子選択から単離された修飾切断酵素による標識ポリペプチドの処理について説明する。ポリペプチドのNTAAを修飾するために使用された標識には、化学的に標識されたアラニン残基(2-アジドベンズアミド-Ala-pFP)が含まれていた。
A.2-アジドベンズアミド-Ala-pFP(N-(2-アジドベンゾイル)-L-アラニン-ペンタフルオロフェノールエステル)の合成
Figure 2022526939000050
イサト酸無水物を含有する丸底フラスコをジクロロメタン(DCM)に溶解し、撹拌した。これに、DCMに溶解したL-アラニン-tert-ブチルエステル塩酸塩およびトリエチルアミンの溶液を撹拌溶液に滴下した。混合物を、25℃で18時間反応させた。完了したら(LCMSで監視)、溶液を真空で凝縮し、100mLの酢酸エチル(EtOAc)に再溶解した。有機層を水で、次にブラインで洗浄した。有機層を分離し、硫酸ナトリウム(NaSO)で乾燥させ、濾過し、凝縮した。得られた油を少量のDCMに溶解し、シリカゲル(SiO)に乾燥充填し、フラッシュクロマトグラフィー(n-ヘプタン中0~80%のEtOAc)を使用して所望の化合物N-(2-アミノベンゾイル-)L-アラニン-tert-ブチルエステル[1a]を分離した。所望の生成物を含む画分をプールし、凝縮して、87%の収率を得た。
Figure 2022526939000051
1aを含む丸底フラスコに撹拌棒を加え、次に10%HCl(水溶液)に溶解し、氷浴中で撹拌した。別のバイアルで、1.1モル当量の亜硝酸ナトリウム(NaNO)を水に溶解し、1aの冷却撹拌溶液にゆっくりと加えた。30分間撹拌した後、1.5モル当量のアジ化ナトリウム(NaN)の水溶液を、1aおよびNaNO2の溶液に滴下し、室温までゆっくりと上昇させながら、さらに30分~1時間撹拌した。結果としてオフホワイトの沈殿物が形成され、溶液を濾過し、追加の水およびn-ヘプタンで洗浄して、わずかに黄色の固体を得た(収率90%;N-(2-アジドベンゾイル-)L-アラニン-tert-ブチルエステル[1b])。
Figure 2022526939000052
固体1bを、撹拌棒を備える丸底フラスコに入れ、30mLの1:9トリフルオロ酢酸(TFA):DCMに溶解した。溶液を室温で3.5時間撹拌し、その時点で、TLCはtert-ブチルエステルのカルボン酸への完全な変換を示した。溶液を真空で凝縮してTFAを除去し、油をDCMに溶解し、SiOに充填して、カラム精製を行った(n-ヘプタン中0~100%のEtOAc)。所望の生成物であるN-(2-アミノベンゾイル-)L-アラニン[1c]を含む画分をプールし、凝縮した(99%の収率)。
Figure 2022526939000053
オフホワイトの固体[1c]を、撹拌棒を備える丸底フラスコに入れ、アルゴン雰囲気下に置いた。乾燥テトラヒドロフラン(THF)をフラスコに供給して、固体を溶解させた。続いて、1.1当量のペンタフルオロフェノール(pFP)をTHFに溶解し、[1c]を含むフラスコに加え、25℃で5分間撹拌した。次に、1.1当量のジシクロヘキサンカルボジイミドをTHFに溶解し、撹拌溶液にゆっくりと加えた。白色沈殿物が形成されるまで、反応物を18時間撹拌し続けた。反応が完了したら、固体を濾過し、THFで洗浄した。濾液を凝縮し、少量のTHFに再懸濁した。溶液を再度濾過して、固形物を除去した。THF溶液を再び凝縮し、最小量のDCMに溶解した。溶液をSiO上に乾燥充填して、カラムクロマトグラフィーを行った(n-ヘプタン中0~60%のEtOAc)。表題化合物を含む画分をプールし、凝縮して、白色固体(72%の収率)を得た[1d]。
B. DAP BII由来の修飾された切断酵素の選択および単離
ライブラリーの生成およびDAP BII遺伝子の選択を、実施例4に実質的に記載されるように実行した。DAP BIIライブラリーは、位置188、189、190、191、192、196、302、306、310、および650(配列番号13に記載のタンパク質の配列に基づく)から選択される残基のさまざまな組み合わせを標的とした。この実験では、選択に使用されるN末端修飾アルギニンペプチド(2-アミノベンズアミド-AAAR、配列番号21)を、化学試薬であるイサト酸無水物で処理して調製した。続いて、生存している細胞からプラスミドDNAを単離および配列決定して、標識アミノ酸を認識する活性な修飾切断酵素を生成する突然変異を識別した。記載された遺伝子選択アプローチを使用して、DAP BIIの突然変異を、野生型DAP BII遺伝子に由来する例示的な活性修飾切断酵素で識別した。遺伝子選択で識別した切断酵素の候補を、溶液中アッセイに供した酵素変異体の精製によって確認した。切断酵素遺伝子は、タンパク質のC末端に融合したヘキサヒスチジンタグをコードする。これにより、固定化された金属アフィニティークロマトグラフィーによって切断酵素を精製することができる。精製した修飾切断酵素の候補を、反応混合物中でアッセイした。
配列番号17、18および19に記載されるような配列を含む3つの例示的なジペプチド切断酵素が識別され、2-アミノベンズアミド標識ペプチドに対して活性を示すことが示された。確認した活性な修飾ジペプチド切断酵素は、突然変異D188V/I189A/D190S/N191L/W192G/R196S/A302W/N310K/D650A、N191M/W192G/R196T/N306R/D650A、またはN191M/W192G/R196V/N306R/D650Aを含み、例示的なアミノ酸置換は、配列番号13に記載されるそれぞれの参照未修飾DAP BII配列に対応するアミノ酸位置番号で表される。アミノ酸の位置は中央に示され、対応する未修飾(例えば、野生型)アミノ酸が番号の前に列挙され、識別した変異型アミノ酸置換が番号の後に列挙される。
C.修飾された切断酵素の認識および活性についての、修飾としての2-アジドベンズアミド-Ala-pFPの評価
突然変異N191M/W192G/R196T/N306R/D650Aを有する、配列番号18に記載されるようなアミノ酸配列を含む、セクションBに記載されるような遺伝子選択から識別された例示的な修飾切断酵素の1つを、上記のセクションAで説明したように合成された外因性アラニンで標識されたペプチドに対する認識および活性について評価した。選択的切断のために修飾アラニンを導入する表題化合物の能力の実行可能性を示すために、合成ペプチド(H-IHAGYAW-OH;配列番号30)を[1d]で官能化した。[1d]の溶液(500mMジメチルアセトアミド;DMAc)を新たに調製した。ペプチドもDMAcに溶解して、100mMの濃度にした。次に、1.5mLチューブに、50μLの0.4M MOPS緩衝液(pH7.6)および25μLのアセトニトリルを加えた。これに、100mMペプチド溶液10μLを加えて混合した。最後に、15μLの500mM [1d]を添加し、チューブ内の溶液を50℃のサーモミキサーに30分間入れた。インキュベーション中に、0.1M HEPES緩衝液(pH8.0)中の修飾切断酵素(配列番号18)の80μL、1.25uM溶液を作製することによって、別の1.5mLチューブ内の溶液を調製した。
IHAGYAWペプチドを30分間インキュベートした後、20μLのアリコートを取り出し、修飾された切断酵素を含む溶液に加えた。次に、修飾された切断酵素および標識ペプチドの溶液を、37℃で1~18時間インキュベートした。反応のアリコートを取り、LCMSに注入することにより、切断事象の進行を監視した。
Figure 2022526939000054
表12に示すように、ペプチドを[1d]で処理すると、予想分子量の生成物が得られた。ここで標識されたペプチド(2-アミノベンズアミド-AIHAGYAW)の切断を、18時間後に完了するまで観察した。2-アミノベンズアミド-AIの喪失は、LCMSで観察された唯一の切断事象であった。18時間のインキュベーション後、残っている2-アミノベンズアミド-AIHAGYAWは観察されなかった。これらのデータは、遺伝子選択からの試験された単離修飾切断酵素が、ジペプチド(2-アミノベンズアミド-AI)の一部として外因性の添加された化学標識アラニンを含む、処理されたポリペプチドから予想される標識ジペプチドを除去したことを示す。この例示的なアプローチを使用して、野生型ジペプチド切断酵素(DAP BII)に由来する試験された修飾切断酵素を修飾して、ポリペプチドから単一の標識アミノ酸(外因性N末端ブロックアミノ酸、2-アミノベンズアミド-Aで標識)を除去した。
D.エラープローンライブラリーからの修飾切断酵素の生成および選択
配列番号18に記載される、識別されたジペプチド切断酵素から始めて、キュンケル突然変異誘発と組み合わせたエラープローンPCRをさらに使用して、所望の突然変異頻度範囲にわたって正確に制御して、複雑さが約10であるライブラリーを生成した(Holland et al.,J Immunol Methods.(2013)394(1-2):55-61)。発現および選択を、実質的に遺伝子選択について上記したように実施した。識別および精製された修飾切断酵素の候補を、実質的に上記のように溶液中アッセイを使用して評価し、2-アミノベンズアミド-AAGVAMPGAEDDVVGSGSK(N)ペプチドの切断を試験し、LC-MSを実行して生成物を識別した。表13に示される確認された修飾ジペプチド切断酵素は、予想通りに、観察された切断生成物で切断活性を示すことが観察され、試験された2-アミノベンズアミド標識ペプチドから標識ジペプチドが除去された。表では、例示的なアミノ酸置換が、配列番号13に記載されるそれぞれの参照未修飾DAP BII配列に対応するアミノ酸位置番号で表される。アミノ酸の位置は中央に示され、対応する未修飾(例えば、野生型)アミノ酸が番号の前に列挙され、識別した変異型アミノ酸置換が番号の後に列挙される。場合によっては、記載された方法を使用して識別した修飾切断酵素を使用して、外因性アミノ酸を含むペプチドから標識ジペプチドを除去し、結果として、元のペプチドから単一アミノ酸(P1)を正味除去することができる。
Figure 2022526939000055
本開示は、例えば、本発明のさまざまな態様を説明するために提供される特定の開示された実施形態に範囲を限定することを意図するものではない。記載される組成物および方法に対するさまざまな変更が、本明細書の説明および教示から明らかになるであろう。そのような変形は、本開示の真の範囲および趣旨から逸脱することなく実施することができ、本開示の範囲内であることが意図される。これらおよび他の変更は、上記の詳細な説明に照らして実施形態に対して行うことができる。一般に、以下の特許請求の範囲において、使用される用語は、特許請求の範囲を、明細書および特許請求の範囲に開示された特定の実施形態に限定するものと解釈されるべきではなく、そのような特許請求の範囲が権利を持つ均等物の全範囲と共に、全ての可能な実施形態を含むように解釈されるべきである。したがって、特許請求の範囲は、本開示によって限定されない。
Figure 2022526939000056
Figure 2022526939000057
Figure 2022526939000058
Figure 2022526939000059
Figure 2022526939000060
Figure 2022526939000061
Figure 2022526939000062
Figure 2022526939000063
Figure 2022526939000064

Claims (205)

  1. 突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、修飾された切断酵素であって、
    前記修飾された切断酵素が、ジペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を除去するか、または除去するように構成されているか、あるいは
    前記修飾された切断酵素が、トリペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を、もしくはポリペプチドから単一の標識末端ジペプチドを除去するか、または除去するように構成されている、修飾された切断酵素。
  2. 前記ジペプチド切断酵素またはトリペプチド切断酵素に由来する前記修飾された切断酵素が、前記ポリペプチドの末端標識アミノ酸残基と最後から2番目の末端アミノ酸残基との間のペプチド結合を切断するように構成されている、請求項1に記載の修飾された切断酵素。
  3. 前記トリペプチド切断酵素に由来する前記修飾された切断酵素が、前記ポリペプチドの最後から2番目の末端標識アミノ酸残基と最後から3番目の末端アミノ酸残基との間の前記ペプチド結合を切断するように構成されている、請求項1に記載の修飾された切断酵素。
  4. 前記修飾された切断酵素が、前記ポリペプチドの前記末端標識アミノ酸残基と最後から2番目の末端アミノ酸残基との間のアミド結合と相互作用する活性部位を含む、請求項1~3のいずれか一項に記載の修飾された切断酵素。
  5. 前記未修飾の切断酵素が、メタロペプチダーゼ、亜鉛依存性メタロペプチダーゼ、または亜鉛依存性ヒドロラーゼからなる群から選択される、請求項1~4のいずれか一項に記載の修飾された切断酵素。
  6. 前記未修飾の切断酵素が、EC3.4.14、EC3.4.15、MEROPS S8、MEROPS S9、MEROPS S33、MEROPS S46、MEROPS M49、もしくはMEROPS S53、またはその機能的相同体もしくは断片に分類されるタンパク質である、請求項1~5のいずれか一項に記載の修飾された切断酵素。
  7. 前記未修飾の切断酵素が、ジペプチジルペプチダーゼ、ジペプチジルアミノペプチダーゼ、ペプチジル-ジペプチダーゼ、ジペプチジルカルボキシペプチダーゼ、セドリジン、またはトリペプチジルペプチダーゼである、請求項1~6のいずれか一項に記載の修飾された切断酵素。
  8. 前記未修飾の切断酵素が、ジペプチジルペプチダーゼ3、ジペプチジルペプチダーゼ5、ジペプチジルペプチダーゼ7、ジペプチジルペプチダーゼ11、ジペプチジルアミノペプチダーゼBII、またはジペプチジルペプチダーゼBIIである、請求項1~7のいずれか一項に記載の修飾された切断酵素。
  9. 前記標識末端アミノ酸またはジペプチドが、N末端アミノ酸(NTAA)を含む、請求項1~8のいずれか一項に記載の修飾された切断酵素。
  10. 前記標識末端アミノ酸またはジペプチドが、C末端アミノ酸(CTAA)を含む、請求項1~8のいずれか一項に記載の修飾された切断酵素。
  11. 前記末端アミノ酸が、化学もしくは酵素試薬または部分で標識されている、請求項1~10のいずれかに記載の修飾された切断酵素。
  12. 前記標識が、ブロックアミノ酸を含む、請求項1~11のいずれかに記載の修飾された切断酵素。
  13. 前記標識が、外因性アミノ酸を含む、請求項1~12のいずれかに記載の修飾された切断酵素。
  14. 前記標識が、化学標識を含む、請求項1~13のいずれかに記載の修飾された切断酵素。
  15. 前記化学試薬が、フェニルイソチオシアネート(PITC)、ニトロ-PITC、スルホ-PITC、フェニルイソシアネート(PIC)、ニトロ-PIC、スルホ-PIC、Cbz-Cl(クロロギ酸ベンジル)またはCbz-OSu(ベンジルオキシカルボニルN-スクシンイミド)、カルボキシル活性化アミノブロックアミノ酸、無水物、1-フルオロ-2,4-ジニトロベンゼン(サンガー試薬、DNFB)、ダンシルクロリド(DNS-Cl、または1-ジメチルアミノナフタレン-5-スルホニルクロリド)、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)、2-ピリジンカルボキシアルデヒド、2-ホルミルフェニルボロン酸、2-アセチルフェニルボロン酸、1-フルオロ-2,4-ジニトロベンゼン、4-クロロ-7-ニトロベンゾフラザン、ペンタフルオロフェニルイソチオシアネート、4-(トリフルオロメトキシ)-フェニルイソチオシアネート、4-(トリフルオロメチル)-フェニルイソチオシアネート、3-(カルボン酸)-フェニルイソチオシアネート、3-(トリフルオロメチル)-フェニルイソチオシアネート、1-ナフチルイソチオシアネート、N-ニトロイミダゾール-1-カルボキシミダミド、N,N’-ビス(ピバロイル)-1H-ピラゾール-1-カルボキサミジン、N,N’-ビス(ベンジルオキシカルボニル)-1H-ピラゾール-1-カルボキサミジン、アセチル化試薬、グアニジニル化試薬、チオアシル化試薬、チオアセチル化試薬、チオベンジル化試薬、および二複素環メタニミン試薬、またはそれらの誘導体からなる群から選択される、請求項11に記載の修飾された切断酵素。
  16. 前記化学試薬が、イサト酸無水物、イソニコチン酸無水物、アザイサト酸無水物、コハク酸無水物、またはそれらの誘導体である、請求項11に記載の修飾された切断酵素。
  17. 前記化学試薬がからなる群から選択され、前記化学試薬が、4-ニトロフェニルアントラニレート、N-メチル-イサト酸無水物、N-アセチル-イサト酸無水物、4-カルボン酸イサト酸無水物、5-メトキシ-イサト酸無水物、5-ニトロ-イサト酸無水物、4-クロロ-イサト酸無水物、4-フルオロ-イサト酸無水物、6-フルオロ-イサト酸無水物、N-ベンジル-イサト酸無水物、4-トリフルオロメチル-イサト酸無水物、5-トリフルオロメチル-イサト酸無水物、4-ニトロ-イサト酸無水物、4-メトキシ-イサト酸無水物、5-アミノ-2-フルオロ-イソニコチン無水物(6-フルオロ-1H-ピリド[3,4-d][1,3]オキサジン-2,4-ジオン)、3,6,ジフルオロフタル酸無水物、および2,3ピラジンジカルボン酸無水物、またはそれらの誘導体からなる群から選択される、請求項16に記載の修飾された切断酵素。
  18. 前記修飾された切断酵素が、前記未修飾の切断酵素と少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を示すアミノ酸配列を含む、請求項1~17のいずれか一項に記載の修飾された切断酵素。
  19. 前記突然変異が、アミノ酸の置換、欠失、付加、またはそれらの組み合わせを含む、請求項1~18のいずれか一項に記載の修飾された切断酵素。
  20. 前記ポリペプチドの長さが、4個のアミノ酸を超える、5個のアミノ酸を超える、6個のアミノ酸を超える、7個のアミノ酸を超える、8個のアミノ酸を超える、9個のアミノ酸を超える、10個のアミノ酸を超える、11個のアミノ酸を超える、12個のアミノ酸を超える、13個のアミノ酸を超える、14個のアミノ酸を超える、15個のアミノ酸を超える、20個のアミノ酸を超える、25個のアミノ酸を超える、または30個のアミノ酸を超える、請求項1~19のいずれか一項に記載の修飾された切断酵素。
  21. 前記ポリペプチドの前記長さが、10個のアミノ酸を超える、請求項1~20のいずれか一項に記載の修飾された切断酵素。
  22. 前記修飾された切断酵素が、その基質結合部位内に修飾を含む、請求項1~21のいずれか一項に記載の修飾された切断酵素。
  23. 前記修飾された切断酵素が、その触媒ドメイン内に修飾を含む、請求項1~22のいずれか一項に記載の修飾された切断酵素。
  24. 前記修飾された切断酵素が、そのキモトリプシンフォールド内に修飾を含む、請求項1~23のいずれか一項に記載の修飾された切断酵素。
  25. 前記修飾された切断酵素が、アミン結合部位に修飾を含む、請求項1~24のいずれか一項に記載の修飾された切断酵素。
  26. 前記修飾された切断酵素が、そのループドメインに修飾を含む、請求項1~25のいずれか一項に記載の修飾された切断酵素。
  27. 前記修飾された切断酵素が、前記修飾された切断酵素の前記活性部位へのアクセス可能性を改善するための修飾を含む、請求項1~26のいずれか一項に記載の修飾された切断酵素。
  28. 前記修飾された切断酵素が、配列番号13または20に規定されるようなジペプチジルアミノペプチダーゼBIIまたはジペプチジルペプチダーゼBIIに由来する、請求項1~27のいずれか一項に記載の修飾された切断酵素。
  29. 前記修飾された切断酵素が、配列番号17~19、23~28、31~39のうちのいずれかに対して、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%同一性、少なくとも70%同一性、少なくとも80%同一性、もしくは少なくとも90%以上の同一性を示すアミノ酸配列、またはその特異的結合断片を含む、請求項1~28のいずれか一項に記載の修飾された切断酵素。
  30. 前記修飾された切断酵素が、配列番号17~19、23~28のうちのいずれかに記載のアミノ酸の配列、もしくは配列番号17~19、23~28、31~39のうちのいずれかに対して少なくとも95%の配列同一性を示すアミノ酸の配列、またはその特異的結合断片を含む、請求項1~29のいずれか一項に記載の修飾された切断酵素。
  31. 前記修飾された切断酵素が、配列番号13の番号付けに関して、位置126、188、189、190、191、192、196、238、302、306、307、310、525、528、546、604、650、651、655、656、665および/または692に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、請求項1~30のいずれか一項に記載の修飾された切断酵素。
  32. 前記修飾された切断酵素が、配列番号13の番号付けに関して、位置126、188、189、190、191、192、196、238、302、306、307、310、525、528、546、604、650、651、655、656、665および/または692に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含み、配列番号17~19、23~28、31~39のうちのいずれかに対して少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を示すアミノ酸配列を含む、請求項1~31のいずれか一項に記載の修飾された切断酵素。
  33. 前記1つ以上のアミノ酸置換が、A126T、D188V、I189A、D190S、N191C、N191F、N191L、N191M、N191R、N191S、N191T、N191V、W192F、W192G、W192L、R196H、R196K、R196S、R196T、R196V、G238V、A302W、N306A、N306G、N306R、N306S、T307K、N310D、N310G、N310K、N310L、N525K、A528V、F546L、A604V、D650A、D650G、D650S、G651H、G651T、G651V、G651Y、S655G、S655T、V656E、V656G、V656S、K665I、K692N、および/またはそれらの保存的アミノ酸置換である、請求項1~32のいずれか一項に記載の修飾された切断酵素。
  34. 前記1つ以上のアミノ酸修飾が、N191M/W192G/R196V/N306R/D650A、D188V/I189A/D190S/N191L/W192G/R196S/A302W/N310K/D650A、N191M/W192G/R196T/N306R/T307K/D650A、N191M/W192G/R196T/N306R/N525K/A528V/A604V/D650A/K692N、A126T/N191M/W192G/R196T/G238V/N306R/D650A、N191M/W192G/R196T/N306R/F546L/D650A、N191M/W192G/R196T/N306R/D650A/G651V/K665I、N191M/W192G/R196T/N306R/D650A/G651V、N191C/W192L/R196K/N306R/N310D/G651Y/S655G/V656G、N191C/W192L/N306R/N310D/G651Y/S655G/V656G、N191F/W192F/N306R/N310G/G651H/V656E、N191R/W192L/N306S/N310L/G651T/S655T/V656S、N191S/R196H/N306A/D650G、N191T/R196H/N306A/D650G、N191M/R196H/N306A/D650G、N191V/N306A/D650S、またはN191S/N306G/D650Sである、請求項1~33のいずれか一項に記載の修飾された切断酵素。
  35. 前記修飾された切断酵素が、配列番号17~19、23~28、または31~39の配列のうちのいずれかの基質特異性を示す、請求項1~34のいずれか一項に記載の修飾された切断酵素。
  36. 前記修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかの前記触媒ドメインと、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有する触媒ドメインを含むアミノ酸配列を含む、請求項1~35のいずれか一項に記載の修飾された切断酵素。
  37. 前記修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかの前記アミン結合部位と、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有するアミン結合部位を含むアミノ酸配列を含む、請求項1~36のいずれか一項に記載の修飾された切断酵素。
  38. 前記修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかの前記ループドメインと、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有するループドメインと、を含むアミノ酸配列を含む、請求項1~37のいずれか一項に記載の修飾された切断酵素。
  39. 前記修飾された切断酵素が、配列番号13の番号付けに関して、位置183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、および/または202に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、請求項1~38のいずれか一項に記載の修飾された切断酵素。
  40. 前記修飾された切断酵素が、配列番号13の番号付けに関して、位置188、189、190、191、192、302、および/または310に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、請求項1~38のいずれか一項に記載の修飾された切断酵素。
  41. 前記修飾された切断酵素が、配列番号13の番号付けに関して、位置191、192、196、306、310、627、628、630、648、650、651、655、656、および/または669に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、請求項1~38のいずれか一項に記載の修飾された切断酵素。
  42. 前記修飾された切断酵素が、配列番号13の番号付けに関して、位置323~544のうちのいずれかに対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、請求項1~38のいずれか一項に記載の修飾された切断酵素。
  43. ポリペプチドを処理する方法であって、前記ポリペプチドを、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む修飾された切断酵素と接触させることを含み、
    前記修飾された切断酵素が、ジペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を除去するか、または除去するように構成されているか、あるいは
    前記修飾された切断酵素が、トリペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を、もしくはポリペプチドから単一の標識末端ジペプチドを除去するか、または除去するように構成されている、方法。
  44. 前記ジペプチド切断酵素またはトリペプチド切断酵素に由来する前記修飾された切断酵素が、前記ポリペプチドの末端標識アミノ酸残基と最後から2番目の末端アミノ酸残基との間の前記ペプチド結合を切断するように構成されている、請求項43に記載の方法。
  45. 前記修飾された切断酵素が、前記ポリペプチドの前記末端標識アミノ酸残基と最後から2番目の末端アミノ酸残基との間の前記アミド結合と相互作用する活性部位を含む、請求項43または44に記載の方法。
  46. 前記単一の標識末端アミノ酸または単一の標識末端ジペプチドの前記除去が、前記ポリペプチドの新たな末端アミノ酸を露出させる、請求項43~45のいずれか一項に記載の方法。
  47. 前記未修飾の切断酵素が、メタロペプチダーゼ、亜鉛依存性メタロペプチダーゼ、または亜鉛依存性ヒドロラーゼからなる群から選択される、請求項43~46のいずれか一項に記載の方法。
  48. 前記未修飾の切断酵素が、EC3.4.14、EC3.4.15、MEROPS S8、MEROPS S9、MEROPS S33、MEROPS S46、MEROPS M49、もしくはMEROPS S53、またはその機能的相同体もしくは断片に分類されるタンパク質である、請求項43~47のいずれか一項に記載の方法。
  49. 前記未修飾の切断酵素が、ジペプチジルペプチダーゼ、ジペプチジルアミノペプチダーゼ、ペプチジル-ジペプチダーゼ、ジペプチジルカルボキシペプチダーゼ、セドリジン、またはトリペプチジルペプチダーゼである、請求項43~48のいずれか一項に記載の方法。
  50. 前記未修飾の切断酵素が、ジペプチジルペプチダーゼ3、ジペプチジルペプチダーゼ5、ジペプチジルペプチダーゼ7、ジペプチジルペプチダーゼ11、ジペプチジルアミノペプチダーゼBII、またはジペプチジルペプチダーゼBIIである、請求項43~49のいずれか一項に記載の方法。
  51. 前記標識末端アミノ酸またはジペプチドが、N末端アミノ酸(NTAA)を含む、請求項43~50のいずれか一項に記載の方法。
  52. 前記標識末端アミノ酸またはジペプチドが、C末端アミノ酸(CTAA)を含む、請求項43~50のいずれか一項に記載の方法。
  53. 前記修飾された切断酵素が、前記未修飾の切断酵素と少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を示すアミノ酸配列を含む、請求項43~52のいずれか一項に記載の方法。
  54. 前記突然変異が、アミノ酸の置換、欠失、付加、またはそれらの組み合わせを含む、請求項43~53のいずれか一項に記載の方法。
  55. 前記ポリペプチドの前記長さが、4個のアミノ酸を超える、5個のアミノ酸を超える、6個のアミノ酸を超える、7個のアミノ酸を超える、8個のアミノ酸を超える、9個のアミノ酸を超える、10個のアミノ酸を超える、11個のアミノ酸を超える、12個のアミノ酸を超える、13個のアミノ酸を超える、14個のアミノ酸を超える、15個のアミノ酸を超える、20個のアミノ酸を超える、25個のアミノ酸を超える、または30個のアミノ酸を超える、請求項43~54のいずれか一項に記載の方法。
  56. 前記ポリペプチドの前記長さが、10個のアミノ酸を超える、請求項43~55のいずれか一項に記載の方法。
  57. 前記修飾された切断酵素が、その基質結合部位内に修飾を含む、請求項43~56のいずれか一項に記載の方法。
  58. 前記修飾された切断酵素が、その触媒ドメイン内に修飾を含む、請求項43~57のいずれか一項に記載の方法。
  59. 前記修飾された切断酵素が、そのキモトリプシンフォールド内に修飾を含む、請求項43~58のいずれか一項に記載の方法。
  60. 前記修飾された切断酵素が、アミン結合部位に修飾を含む、請求項43~59のいずれか一項に記載の方法。
  61. 前記修飾された切断酵素が、そのループドメインに修飾を含む、請求項43~60のいずれか一項に記載の方法。
  62. 前記修飾された切断酵素が、前記修飾された切断酵素の前記活性部位へのアクセス可能性を改善するための修飾を含む、請求項43~61のいずれか一項に記載の方法。
  63. 前記修飾された切断酵素が、配列番号13または20に規定されるようなジペプチジルアミノペプチダーゼBIIまたはジペプチジルペプチダーゼBIIに由来する、請求項43~62のいずれか一項に記載の方法。
  64. 前記修飾された切断酵素が、配列番号17~19、23~28、31~39のうちのいずれかに対して、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%同一性、少なくとも70%同一性、少なくとも80%同一性、もしくは少なくとも90%以上の同一性を示すアミノ酸配列、またはその特異的結合断片を含む、請求項43~63のいずれか一項に記載の方法。
  65. 前記修飾された切断酵素が、配列番号17~19、23~28、31~39のうちのいずれかに記載のアミノ酸の配列、もしくは配列番号17~19、23~28、31~39のうちのいずれかに対して少なくとも95%の配列同一性を示すアミノ酸の配列、またはその特異的結合断片を含む、請求項43~64のいずれか一項に記載の方法。
  66. 前記修飾された切断酵素が、配列番号13の番号付けに関して、位置126、188、189、190、191、192、196、238、302、306、307、310、525、528、546、604、650、651、655、656、665および/または692に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、請求項43~65のいずれか一項に記載の方法。
  67. 前記修飾された切断酵素が、配列番号13の番号付けに関して、位置126、188、189、190、191、192、196、238、302、306、307、310、525、528、546、604、650、651、655、656、665および/または692に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含み、配列番号17~19、23~28、31~39のうちのいずれかに対して少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を示すアミノ酸配列を含む、請求項43~66のいずれか一項に記載の方法。
  68. 前記1つ以上のアミノ酸置換が、A126T、D188V、I189A、D190S、N191C、N191F、N191L、N191M、N191R、N191S、N191T、N191V、W192F、W192G、W192L、R196H、R196K、R196S、R196T、R196V、G238V、A302W、N306A、N306G、N306R、N306S、T307K、N310D、N310G、N310K、N310L、N525K、A528V、F546L、A604V、D650A、D650G、D650S、G651H、G651T、G651V、G651Y、S655G、S655T、V656E、V656G、V656S、K665I、K692N、および/またはそれらの保存的アミノ酸置換である、請求項43~67のいずれか一項に記載の方法。
  69. 前記1つ以上のアミノ酸修飾が、N191M/W192G/R196V/N306R/D650A、D188V/I189A/D190S/N191L/W192G/R196S/A302W/N310K/D650A、N191M/W192G/R196T/N306R/T307K/D650A、N191M/W192G/R196T/N306R/N525K/A528V/A604V/D650A/K692N、A126T/N191M/W192G/R196T/G238V/N306R/D650A、N191M/W192G/R196T/N306R/F546L/D650A、N191M/W192G/R196T/N306R/D650A/G651V/K665I、N191M/W192G/R196T/N306R/D650A/G651V、N191C/W192L/R196K/N306R/N310D/G651Y/S655G/V656G、N191C/W192L/N306R/N310D/G651Y/S655G/V656G、N191F/W192F/N306R/N310G/G651H/V656E、N191R/W192L/N306S/N310L/G651T/S655T/V656S、N191S/R196H/N306A/D650G、N191T/R196H/N306A/D650G、N191M/R196H/N306A/D650G、N191V/N306A/D650S、またはN191S/N306G/D650Sである、請求項43~68のいずれか一項に記載の方法。
  70. 前記修飾された切断酵素が、配列番号17~19、23~28、または31~39の配列のうちのいずれかの配列の前記基質特異性を示す、請求項43~69のいずれか一項に記載の方法。
  71. 前記修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかの前記触媒ドメインと、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有する触媒ドメインを含むアミノ酸配列を含む、請求項43~70のいずれか一項に記載の方法。
  72. 前記修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかの前記アミン結合部位と、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有するアミン結合部位を含むアミノ酸配列を含む、請求項43~71のいずれか一項に記載の方法。
  73. 前記修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかの前記ループドメインと、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも40%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有するループドメインと、を含むアミノ酸配列を含む、請求項43~72のいずれか一項に記載の方法。
  74. 前記修飾された切断酵素が、配列番号13の番号付けに関して、位置183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、および/または202に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、請求項43~73のいずれか一項に記載の方法。
  75. 前記修飾された切断酵素が、配列番号13の番号付けに関して、位置188、189、190、191、192、302、および/または310に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、請求項43~73のいずれか一項に記載の方法。
  76. 前記修飾された切断酵素が、配列番号13の番号付けに関して、位置191、192、196、306、310、627、628、630、648、650、651、655、656、および/または669に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、請求項43~73のいずれか一項に記載の方法。
  77. 前記修飾された切断酵素が、配列番号13の番号付けに関して、位置323~544のうちのいずれかに対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、請求項43~73のいずれか一項に記載の方法。
  78. 前駆体ポリペプチドを、前記前駆体ポリペプチドの前記末端アミノ酸を標識するための試薬と接触させて、前記修飾された切断酵素で処理するために調製されたポリペプチドを提供することをさらに含む、請求項43~78のいずれか一項に記載の方法。
  79. 前記末端アミノ酸を標識するための前記試薬が、化学試薬または酵素試薬である、請求項78に記載の方法。
  80. 前記標識が、ブロックアミノ酸を含む、請求項43~79のいずれか一項に記載の方法。
  81. 前記標識が、外因性標識アミノ酸を含む、請求項43~80のいずれかに記載の方法。
  82. 前記標識が、化学標識を含む、請求項43~81のいずれか一項に記載の方法。
  83. 前記末端アミノ酸を標識するための前記試薬との前記接触および前記修飾された切断酵素との接触が、連続した順序で行われる、請求項78~82のいずれか一項に記載の方法。
  84. 前記末端アミノ酸を標識するための前記試薬との前記接触および前記修飾された切断酵素との接触が、1回以上繰り返される、請求項78~83のいずれか一項に記載の方法。
  85. 前記化学試薬が、フェニルイソチオシアネート(PITC)、ニトロ-PITC、スルホ-PITC、フェニルイソシアネート(PIC)、ニトロ-PIC、スルホ-PIC、Cbz-Cl(クロロギ酸ベンジル)またはCbz-OSu(ベンジルオキシカルボニルN-スクシンイミド)、カルボキシル活性化アミノブロックアミノ酸、1-フルオロ-2,4-ジニトロベンゼン(サンガー試薬、DNFB)、ダンシルクロリド(DNS-Cl、または1-ジメチルアミノナフタレン-5-スルホニルクロリド)、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)、無水物、2-ピリジンカルボキシアルデヒド、2-ホルミルフェニルボロン酸、2-アセチルフェニルボロン酸、1-フルオロ-2,4-ジニトロベンゼン、4-クロロ-7-ニトロベンゾフラザン、ペンタフルオロフェニルイソチオシアネート、4-(トリフルオロメトキシ)-フェニルイソチオシアネート、4-(トリフルオロメチル)-フェニルイソチオシアネート、3-(カルボン酸)-フェニルイソチオシアネート、3-(トリフルオロメチル)-フェニルイソチオシアネート、1-ナフチルイソチオシアネート、N-ニトロイミダゾール-1-カルボキシミダミド、N,N’-ビス(ピバロイル)-1H-ピラゾール-1-カルボキサミジン、N,N’-ビス(ベンジルオキシカルボニル)-1H-ピラゾール-1-カルボキサミジン、アセチル化試薬、グアニジニル化試薬、チオアシル化試薬、チオアセチル化試薬、チオベンジル化試薬、および二複素環メタニミン試薬、またはそれらの誘導体からなる群から選択される、請求項79~84のいずれか一項に記載の方法。
  86. 前記化学試薬が、イサト酸無水物、イソニコチン酸無水物、アザイサト酸無水物、コハク酸無水物、またはそれらの誘導体である、請求項79~85のいずれか一項に記載の方法。
  87. 前記化学試薬が、4-ニトロフェニルアントラニレート、N-メチル-イサト酸無水物、N-アセチル-イサト酸無水物、4-カルボン酸イサト酸無水物、5-メトキシ-イサト酸無水物、5-ニトロ-イサト酸無水物、4-クロロ-イサト酸無水物、4-フルオロ-イサト酸無水物、6-フルオロ-イサト酸無水物、N-ベンジル-イサト酸無水物、4-トリフルオロメチル-イサト酸無水物、5-トリフルオロメチル-イサト酸無水物、4-ニトロ-イサト酸無水物、4-メトキシ-イサト酸無水物、5-アミノ-2-フルオロ-イソニコチン無水物(6-フルオロ-1H-ピリド[3,4-d][1,3]オキサジン-2,4-ジオン)、3,6,ジフルオロフタル酸無水物、および2,3ピラジンジカルボン酸無水物、またはそれらの誘導体からなる群から選択される、請求項86に記載の方法。
  88. 前記ポリペプチドを、前記ポリペプチドの前記末端アミノ酸に結合することができる結合剤と接触させることをさらに含み、前記結合剤が、前記結合剤に関する識別情報を有するコーディングタグを含む、請求項43~87のいずれか一項に記載の方法。
  89. 前記結合剤が、2つ以上の結合剤を含む、請求項88に記載の方法。
  90. 前記結合剤が、N末端アミノ酸(NTAA)に結合する、請求項88または請求項89に記載の方法。
  91. 前記結合剤が、C末端アミノ酸(CTAA)に結合する、請求項88または請求項89に記載の方法。
  92. 前記結合剤が、標識または未標識末端アミノ酸に結合することができる、請求項88~91のいずれか一項に記載の方法。
  93. 前記結合剤との前記接触が、
    前記ポリペプチドを、前記末端アミノ酸を標識するための前記試薬と接触させる前、および/または
    前記ポリペプチドを、前記修飾された切断酵素と接触させる前である、請求項88~92のいずれか一項に記載の方法。
  94. 前記結合剤との前記接触が、前記ポリペプチドを、前記末端アミノ酸を標識するための前記試薬と接触させた後である、請求項88~93のいずれか一項に記載の方法。
  95. 前記末端アミノ酸を標識するための前記試薬との前記接触が、前記結合剤との前記接触の前であり、
    前記結合剤との前記接触が、前記ポリペプチドと前記修飾された切断酵素との前記接触の前である、請求項88~92のいずれか一項に記載の方法。
  96. 前記ポリペプチドと前記結合剤、前記末端アミノ酸を標識するための前記試薬、および前記修飾された切断酵素との前記接触が、1回以上繰り返される、請求項88~95のいずれか一項に記載の方法。
  97. 前記コーディングタグの前記識別情報を前記ポリペプチドに付着した記録タグに転送し、それによって前記ポリペプチド上に伸長記録タグを生成することをさらに含む、請求項88~96のいずれか一項に記載の方法。
  98. 前記識別情報の転送が、
    前記ポリペプチドと前記結合剤との前記結合の後、および
    前記ポリペプチドと前記修飾された切断酵素との前記接触の前に実行される、請求項97に記載の方法。
  99. (a)前記ポリペプチドを前記結合剤と接触させるステップ、
    (b)識別情報を前記記録タグに転送するステップ、
    (c)前記ポリペプチドを、前記末端アミノ酸を標識するための試薬と接触させるステップ、および
    (d)前記ポリペプチドを修飾された切断酵素と接触させるステップが、
    順番に繰り返されて、1つ以上の追加の伸長記録タグを生成する、請求項97または請求項98に記載の方法。
  100. ステップ(b)の後およびステップ(c)の前に、前記結合剤を除去することをさらに含む、請求項99に記載の方法。
  101. (a)前記ポリペプチドを、前記末端アミノ酸を標識するための試薬と接触させるステップ、
    (b)前記ポリペプチドを、前記標識末端アミノ酸に結合することができる前記結合剤と接触させるステップ、
    (c)識別情報を前記記録タグに転送するステップ、および
    (d)前記ポリペプチドを修飾された切断酵素と接触させるステップが、
    順番に繰り返されて、1つ以上の追加の伸長記録タグを生成する、請求項97または請求項98に記載の方法。
  102. ステップ(c)の後およびステップ(d)の前に前記結合剤を除去することをさらに含む、請求項101に記載の方法。
  103. 前記1つ以上の伸長記録タグを分析することをさらに含む、請求項97~102のいずれか一項に記載の方法。
  104. ポリペプチドを分析するための方法であって、
    (a)ポリペプチドを、前記ポリペプチドの末端アミノ酸に結合することができる結合剤と接触させるステップであって、前記結合剤が、前記結合剤に関する識別情報を有するコーディングタグを含む、ステップと、
    (b)前記コーディングタグの前記識別情報を前記ポリペプチドと関連付けられた記録タグに転送して、伸長記録タグを生成するステップと、
    (c)前記ポリペプチドを試薬と接触させて、前記ポリペプチドの前記末端アミノ酸を標識するステップと、
    (d)前記ポリペプチドを、突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む修飾された切断酵素と接触させるステップと、を含み、
    前記修飾された切断酵素が、ジペプチド切断酵素に由来し、ステップ(c)において前記試薬によって標識された単一の末端アミノ酸を前記ポリペプチドから除去するか、または除去するように構成されているか、あるいは、
    前記修飾された切断酵素が、トリペプチド切断酵素に由来し、ステップ(c)において前記試薬によって標識された単一の末端アミノ酸または単一の末端ジペプチドを前記ポリペプチドから除去するか、または除去するように構成されている、方法。
  105. 前記ジペプチド切断酵素またはトリペプチド切断酵素に由来する前記修飾された切断酵素が、前記ポリペプチドの末端標識アミノ酸残基と最後から2番目の末端アミノ酸残基との間の前記ペプチド結合を切断するように構成されている、請求項104に記載の方法。
  106. 前記トリペプチド切断酵素に由来する前記修飾された切断酵素が、前記ポリペプチドの最後から2番目の末端標識アミノ酸残基と最後から3番目の末端アミノ酸残基との間の前記ペプチド結合を切断するように構成されている、請求項104に記載の方法。
  107. 前記未修飾の切断酵素が、メタロペプチダーゼ、亜鉛依存性メタロペプチダーゼ、または亜鉛依存性ヒドロラーゼからなる群から選択される、請求項104~106のいずれか一項に記載の方法。
  108. 前記未修飾の切断酵素が、EC3.4.14、EC3.4.15、MEROPS S8、MEROPS S9、MEROPS S33、MEROPS S46、MEROPS M49、もしくはMEROPS S53、またはその機能的相同体もしくは断片に分類されるタンパク質である、請求項104~107のいずれか一項に記載の方法。
  109. 前記未修飾の切断酵素が、ジペプチジルペプチダーゼ、ジペプチジルアミノペプチダーゼ、ペプチジル-ジペプチダーゼ、ジペプチジルカルボキシペプチダーゼ、セドリジン、またはトリペプチジルペプチダーゼである、請求項104~108のいずれか一項に記載の方法。
  110. 前記未修飾の切断酵素が、ジペプチジルペプチダーゼ3、ジペプチジルペプチダーゼ5、ジペプチジルペプチダーゼ7、ジペプチジルペプチダーゼ11、ジペプチジルアミノペプチダーゼBII、またはジペプチジルペプチダーゼBIIである、請求項104~109のいずれか一項に記載の方法。
  111. 前記結合剤が、2つ以上の結合剤を含む、請求項104~110のいずれか一項に記載の方法。
  112. 前記ポリペプチドが、2つ以上のポリペプチドを含む、請求項104~111のいずれか一項に記載の方法。
  113. ステップ(a)~(d)が「n」回の結合サイクルについて繰り返され、前記ポリペプチドに結合する各結合剤の各コーディングタグの前記識別情報が、前の結合サイクルから生成された前記伸長記録タグに転送されて、n次伸長記録タグを生成する、請求項104~112のいずれか一項に記載の方法。
  114. (b1)前記結合剤を除去することをさらに含む、請求項104~113のいずれか一項に記載の方法。
  115. (e)前記n次伸長記録タグを分析することをさらに含む、請求項113または請求項114に記載の方法。
  116. ステップ(a)が、ステップ(b)の前に実行され、
    ステップ(a)が、ステップ(c)の前に実行され、
    ステップ(a)が、ステップ(d)の前に実行され、
    ステップ(b)が、ステップ(c)の前に実行され、
    ステップ(b)が、ステップ(d)の前に実行され、
    ステップ(b1)が、ステップ(a)の後に実行され、
    ステップ(b1)が、ステップ(b)の後に実行され、
    ステップ(b1)が、ステップ(c)の前に実行され、
    ステップ(b1)が、ステップ(d)の前に実行され、
    ステップ(c)が、ステップ(a)の前に実行され、
    ステップ(c)が、ステップ(b)の前に実行され、かつ/または、
    ステップ(c)が、ステップ(d)の前に実行される、請求項104~115のいずれか一項に記載の方法。
  117. 前記末端アミノ酸が、N末端アミノ酸(NTAA)である、請求項104~116のいずれか一項に記載の方法。
  118. 前記末端アミノ酸が、C末端アミノ酸(CTAA)である、請求項104~116のいずれか一項に記載の方法。
  119. 前記記録タグが、DNA分子、RNA分子、PNA分子、BNA分子、XNA、分子、LNA分子、γPNA分子、またはそれらの組み合わせである、請求項97~118のいずれか一項に記載の方法。
  120. 前記記録タグが、固有の分子識別子(UMI)を含む、請求項97~119のいずれか一項に記載の方法。
  121. 前記記録タグが、ユニバーサルプライミング部位を含む、請求項97~120のいずれか一項に記載の方法。
  122. 前記結合剤および前記コーディングタグが、リンカーによって接合される、請求項88~121のいずれか一項に記載の方法。
  123. 前記記録タグの前記識別情報を前記コーディングタグに転送することが、プライマー伸長によって行われる、請求項97~122のいずれか一項に記載の方法。
  124. 前記記録タグの前記識別情報を前記コーディングタグに転送することが、ライゲーションによって行われる、請求項97~122のいずれか一項に記載の方法。
  125. 前記コーディングタグが、UMIを含む、請求項88~124のいずれか一項に記載の方法。
  126. 前記コーディングタグが、ユニバーサルプライミング部位を含む、請求項88~125のいずれか一項に記載の方法。
  127. 前記ポリペプチドが、固体支持体に直接的または間接的に接合される、請求項43~126のいずれか一項に記載の方法。
  128. 前記固体支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、回転干渉計ディスク、ニトロセルロース膜、ニトロセルロースベースのポリマー表面、ナノ粒子、またはミクロスフェアである、請求項127に記載の方法。
  129. 前記固体支持体が、ポリスチレンビーズ、ポリアクリレートビーズ、ポリマービーズ、アガロースビーズ、セルロースビーズ、デキストランビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、制御された多孔質ビーズ、シリカベースのビーズ、またはそれらの任意の組み合わせを含む、請求項128に記載の方法。
  130. 前記結合剤が、ポリペプチドまたはタンパク質である、請求項88~129のいずれか一項に記載の方法。
  131. 前記結合剤が、アミノペプチダーゼ、またはその変異体、突然変異体もしくは修飾タンパク質;アミノアシルtRNAシンテターゼ、またはその変異体、突然変異体もしくは修飾タンパク質;アンチカリン、またはその変異体、突然変異体もしくは修飾タンパク質;ClpS、ClpS2、またはその変異体、突然変異体もしくは修飾タンパク質;UBRボックスタンパク質、またはその変異体、突然変異体もしくは修飾タンパク質;または、1つ以上のアミノ酸に結合する修飾された小分子、すなわちバンコマイシン、またはその変異体、突然変異体もしくは修飾分子;または、抗体もしくはその結合断片;あるいは、それらの任意の組み合わせである、請求項130に記載の方法。
  132. 前記結合剤が、前記ポリペプチドの単一のアミノ酸残基、ジペプチド、トリペプチド、または翻訳後修飾に結合する、請求項88~131のいずれか一項に記載の方法。
  133. 前記結合剤が、N末端アミノ酸残基に結合する、請求項104~132に記載の方法。
  134. 前記結合剤が、C末端アミノ酸残基に結合する、請求項104~133に記載の方法。
  135. 前記1つ以上の伸長記録タグが、分析の前に増幅される、請求項103~134のいずれか一項に記載の方法。
  136. 前記1つ以上の伸長記録タグを分析することが、核酸配列決定法を含む、請求項103~135のいずれか一項に記載の方法。
  137. 前記核酸配列決定法が、合成によるシーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、請求項136に記載の方法。
  138. 前記核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアベースのシーケンシング、または高度な顕微鏡を使用するDNAのダイレクトイメージングである、請求項136または請求項137に記載の方法。
  139. 前記ポリペプチドを前記修飾された切断酵素と前記接触させて前記単一の末端アミノ酸を除去することが、5分間未満、10分間未満、20分間未満、30分間未満、40分間未満、50分間未満、60分間未満、2時間未満、5時間未満、8時間未満、または10時間未満で行われる、請求項43~138のいずれか一項に記載の方法。
  140. 核酸、例えば、DNA、RNA、またはそれらの混合物もしくは組み合わせを分解する条件の不在下で実施される、請求項43~139のいずれか一項に記載の方法。
  141. 核酸を分解する前記条件が、化学的条件である、請求項140に記載の方法。
  142. 核酸と適合性のある条件の存在下で実施される、請求項43~141のいずれか一項に記載の方法。
  143. 強酸または強塩基の不在下で実施される、請求項140~142のいずれか一項に記載の方法。
  144. 強酸無水物(strong anhydrous)の不在下で実施される、請求項143に記載の方法。
  145. 前記強酸無水物が、TFA無水物である、請求項144に記載の方法。
  146. ポリペプチドを処理するためのキットであって、
    突然変異、例えば、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む修飾された切断酵素であって、
    前記修飾された切断酵素が、ジペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を除去するか、または除去するように構成されているか、あるいは
    前記修飾された切断酵素が、トリペプチド切断酵素に由来し、ポリペプチドから単一の標識末端アミノ酸を、もしくはポリペプチドから単一の標識末端ジペプチドを除去するか、または除去するように構成されている、修飾された切断酵素と、
    前記ポリペプチドの前記末端アミノ酸を標識するための試薬と、を含む、キット。
  147. 前記ジペプチド切断酵素またはトリペプチド切断酵素に由来する前記修飾された切断酵素が、前記ポリペプチドの末端標識アミノ酸残基と最後から2番目の末端アミノ酸残基との間のペプチド結合を切断するように構成されている、請求項146に記載のキット。
  148. 前記トリペプチド切断酵素に由来する前記修飾された切断酵素が、前記ポリペプチドの最後から2番目の末端標識アミノ酸残基と最後から3番目の末端アミノ酸残基との間のペプチド結合を切断するように構成されている、請求項146に記載のキット。
  149. 前記修飾された切断酵素が、前記ポリペプチドの前記末端標識アミノ酸残基と最後から2番目の末端アミノ酸残基との間の前記アミド結合と相互作用する活性部位を含む、請求項146~148のいずれか一項に記載のキット。
  150. 前記未修飾の切断酵素が、メタロペプチダーゼ、亜鉛依存性メタロペプチダーゼ、または亜鉛依存性ヒドロラーゼからなる群から選択される、請求項146~149のいずれか一項に記載のキット。
  151. 前記未修飾の切断酵素が、EC3.4.14、EC3.4.15、MEROPS S8、MEROPS S9、MEROPS S33、MEROPS S46、MEROPS M49、もしくはMEROPS S53、またはその相同体に分類されるタンパク質である、請求項146~150のいずれか一項に記載のキット。
  152. 前記未修飾の切断酵素が、ジペプチジルペプチダーゼ、ジペプチジルアミノペプチダーゼ、ペプチジル-ジペプチダーゼ、ジペプチジルカルボキシペプチダーゼ、セドリジン、またはトリペプチジルペプチダーゼである、請求項146~151のいずれか一項に記載のキット。
  153. 前記未修飾の切断酵素が、ジペプチジルペプチダーゼ3、ジペプチジルペプチダーゼ5、ジペプチジルペプチダーゼ7、ジペプチジルペプチダーゼ11、ジペプチジルアミノペプチダーゼBII、またはジペプチジルペプチダーゼBIIである、請求項146~152のいずれか一項に記載のキット。
  154. 前記標識末端アミノ酸またはジペプチドが、N末端アミノ酸(NTAA)を含む、請求項146~153のいずれか一項に記載のキット。
  155. 前記標識末端アミノ酸またはジペプチドが、C末端アミノ酸(CTAA)を含む、請求項146~153のいずれか一項に記載のキット。
  156. 前記修飾された切断酵素が、前記ポリペプチドの最後から2番目の末端アミノ酸残基と最後から3番目の末端アミノ酸残基との間の前記ペプチド結合を切断しない、請求項146~155のいずれか一項に記載のキット。
  157. 前記修飾された切断酵素が、前記未修飾の切断酵素と少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を示すアミノ酸配列を含む、請求項146~156のいずれか一項に記載のキット。
  158. 前記突然変異が、アミノ酸の置換、欠失、付加、またはそれらの組み合わせを含む、請求項146~157のいずれか一項に記載のキット。
  159. 前記ポリペプチドの前記長さが、4個のアミノ酸を超える、5個のアミノ酸を超える、6個のアミノ酸を超える、7個のアミノ酸を超える、8個のアミノ酸を超える、9個のアミノ酸を超える、10個のアミノ酸を超える、11個のアミノ酸を超える、12個のアミノ酸を超える、13個のアミノ酸を超える、14個のアミノ酸を超える、15個のアミノ酸を超える、20個のアミノ酸を超える、25個のアミノ酸を超える、または30個のアミノ酸を超える、請求項146~158のいずれか一項に記載のキット。
  160. 前記ポリペプチドの前記長さが、10個のアミノ酸を超える、請求項146~159のいずれか一項に記載のキット。
  161. 前記修飾された切断酵素が、その基質結合部位内に修飾を含む、請求項146~160のいずれか一項に記載のキット。
  162. 前記修飾された切断酵素が、その触媒ドメイン内に修飾を含む、請求項146~161のいずれか一項に記載のキット。
  163. 前記修飾された切断酵素が、そのキモトリプシンフォールド内に修飾を含む、請求項146~162のいずれか一項に記載のキット。
  164. 前記修飾された切断酵素が、アミン結合部位に修飾を含む、請求項146~163のいずれか一項に記載のキット。
  165. 前記修飾された切断酵素が、そのループドメインに修飾を含む、請求項146~164のいずれか一項に記載のキット。
  166. 前記修飾された切断酵素が、前記修飾された切断酵素の前記活性部位へのアクセス可能性を改善するための修飾を含む、請求項146~165のいずれか一項に記載のキット。
  167. 前記修飾された切断酵素が、配列番号13または20に規定されるようなジペプチジルアミノペプチダーゼBIIまたはジペプチジルペプチダーゼBIIに由来する、請求項146~166のいずれか一項に記載のキット。
  168. 前記修飾された切断酵素が、配列番号17~19、23~28、31~39のうちのいずれかに対して、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも128%の同一性、少なくとも50%の同一性、少なくとも60%同一性、少なくとも70%同一性、少なくとも80%同一性、または少なくとも90%以上の同一性を示すアミノ酸配列、またはその特異的結合断片を含む、請求項146~167のいずれか一項に記載のキット。
  169. 前記修飾された切断酵素が、配列番号17~19、23~28のうちのいずれかに記載のアミノ酸の配列、もしくは配列番号17~19、23~28、31~39のうちのいずれかに対して少なくとも95%の配列同一性を示すアミノ酸の配列、またはその特異的結合断片を含む、請求項146~168のいずれか一項に記載のキット。
  170. 前記修飾された切断酵素が、配列番号13の番号付けに関して、位置126、188、189、190、191、192、196、238、302、306、307、310、525、528、546、604、650、651、655、656、665および/または692に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、請求項146~169のいずれか一項に記載のキット。
  171. 前記修飾された切断酵素が、配列番号13の番号付けに関して、位置126、188、189、190、191、192、196、238、302、306、307、310、525、528、546、604、650、651、655、656、665および/または692に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含み、配列番号17~19、23~28、31~39のうちのいずれかに対して少なくとも30%の同一性、少なくとも128%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を示すアミノ酸配列を含む、請求項146~170のいずれか一項に記載のキット。
  172. 前記1つ以上のアミノ酸置換が、A126T、D188V、I189A、D190S、N191C、N191F、N191L、N191M、N191R、N191S、N191T、N191V、W192F、W192G、W192L、R196H、R196K、R196S、R196T、R196V、G238V、A302W、N306A、N306G、N306R、N306S、T307K、N310D、N310G、N310K、N310L、N525K、A528V、F546L、A604V、D650A、D650G、D650S、G651H、G651T、G651V、G651Y、S655G、S655T、V656E、V656G、V656S、K665I、K692N、および/またはそれらの保存的アミノ酸置換である、請求項146~171のいずれか一項に記載のキット。
  173. 前記1つ以上のアミノ酸修飾が、N191M/W192G/R196V/N306R/D650A、D188V/I189A/D190S/N191L/W192G/R196S/A302W/N310K/D650A、N191M/W192G/R196T/N306R/T307K/D650A、N191M/W192G/R196T/N306R/N525K/A528V/A604V/D650A/K692N、A126T/N191M/W192G/R196T/G238V/N306R/D650A、N191M/W192G/R196T/N306R/F546L/D650A、N191M/W192G/R196T/N306R/D650A/G651V/K665I、N191M/W192G/R196T/N306R/D650A/G651V、N191C/W192L/R196K/N306R/N310D/G651Y/S655G/V656G、N191C/W192L/N306R/N310D/G651Y/S655G/V656G、N191F/W192F/N306R/N310G/G651H/V656E、N191R/W192L/N306S/N310L/G651T/S655T/V656S、N191S/R196H/N306A/D650G、N191T/R196H/N306A/D650G、N191M/R196H/N306A/D650G、N191V/N306A/D650S、またはN191S/N306G/D650Sである、請求項146~172のいずれか一項に記載のキット。
  174. 前記修飾された切断酵素が、配列番号17~19、23~28、または31~39の配列のうちのいずれかの前記基質特異性を示す、請求項146~173のいずれか一項に記載のキット。
  175. 前記修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかの前記触媒ドメインと、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも128%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有する触媒ドメインを含むアミノ酸配列を含む、請求項146~174のいずれか一項に記載のキット。
  176. 前記修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかの前記アミン結合部位と、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも128%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有するアミン結合部位を含むアミノ酸配列を含む、請求項146~175のいずれか一項に記載のキット。
  177. 前記修飾された切断酵素が、配列番号17~19、23~28、もしくは31~39のうちのいずれかの前記ループドメインと、少なくとも20%の同一性、少なくとも30%の同一性、少なくとも128%の同一性、少なくとも50%の同一性、少なくとも60%の同一性、少なくとも70%の同一性、少なくとも80%の同一性、または少なくとも90%以上の同一性を有するループドメインと、を含むアミノ酸配列を含む、請求項146~176のいずれか一項に記載のキット。
  178. 前記修飾された切断酵素が、配列番号13の番号付けに関して、位置183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、および/または202に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、請求項146~177のいずれか一項に記載のキット。
  179. 前記修飾された切断酵素が、配列番号13の番号付けに関して、位置188、189、190、191、192、302、および/または310に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、請求項146~177のいずれか一項に記載のキット。
  180. 前記修飾された切断酵素が、配列番号13の番号付けに関して、位置191、192、196、306、310、627、628、630、648、650、651、655、656、および/または669に対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、請求項146~177のいずれか一項に記載のキット。
  181. 前記修飾された切断酵素が、配列番号13の番号付けに関して、位置323~544のうちのいずれかに対応する、未修飾の切断酵素における1つ以上のアミノ酸修飾を含む、請求項146~177のいずれか一項に記載のキット。
  182. 前記末端アミノ酸が、化学もしくは酵素試薬または部分で標識されている、請求項146~181のいずれかに記載のキット。
  183. 前記標識が、ブロックアミノ酸を含む、請求項146~182のいずれかに記載のキット。
  184. 前記標識が、外因性標識アミノ酸を含む、請求項146~183のいずれかに記載のキット。
  185. 前記標識が、化学標識を含む、請求項146~184のいずれかに記載のキット。
  186. 前記化学試薬が、フェニルイソチオシアネート(PITC)、ニトロ-PITC、スルホ-PITC、フェニルイソシアネート(PIC)、ニトロ-PIC、スルホ-PIC、Cbz-Cl(クロロギ酸ベンジル)またはCbz-OSu(ベンジルオキシカルボニルN-スクシンイミド)、カルボキシル活性化アミノブロックアミノ酸、1-フルオロ-2,4-ジニトロベンゼン(サンガー試薬、DNFB)、ダンシルクロリド(DNS-Cl、または1-ジメチルアミノナフタレン-5-スルホニルクロリド)、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)、無水物、2-ピリジンカルボキシアルデヒド、2-ホルミルフェニルボロン酸、2-アセチルフェニルボロン酸、1-フルオロ-2,4-ジニトロベンゼン、4-クロロ-7-ニトロベンゾフラザン、ペンタフルオロフェニルイソチオシアネート、4-(トリフルオロメトキシ)-フェニルイソチオシアネート、4-(トリフルオロメチル)-フェニルイソチオシアネート、3-(カルボン酸)-フェニルイソチオシアネート、3-(トリフルオロメチル)-フェニルイソチオシアネート、1-ナフチルイソチオシアネート、N-ニトロイミダゾール-1-カルボキシミダミド、N,N’-ビス(ピバロイル)-1H-ピラゾール-1-カルボキサミジン、N,N’-ビス(ベンジルオキシカルボニル)-1H-ピラゾール-1-カルボキサミジン、アセチル化試薬、グアニジニル化試薬、チオアシル化試薬、チオアセチル化試薬、チオベンジル化試薬、および二複素環メタニミン試薬、またはそれらの誘導体からなる群から選択される、請求項182に記載のキット。
  187. 前記化学試薬が、イサト酸無水物、イソニコチン酸無水物、アザイサト酸無水物、コハク酸無水物、またはそれらの誘導体である、請求項182に記載のキット。
  188. 前記化学試薬が、4-ニトロフェニルアントラニレート、N-メチル-イサト酸無水物、N-アセチル-イサト酸無水物、4-カルボン酸イサト酸無水物、5-メトキシ-イサト酸無水物、5-ニトロ-イサト酸無水物、4-クロロ-イサト酸無水物、4-フルオロ-イサト酸無水物、6-フルオロ-イサト酸無水物、N-ベンジル-イサト酸無水物、4-トリフルオロメチル-イサト酸無水物、5-トリフルオロメチル-イサト酸無水物、4-ニトロ-イサト酸無水物、4-メトキシ-イサト酸無水物、5-アミノ-2-フルオロ-イソニコチン無水物(6-フルオロ-1H-ピリド[3,4-d][1,3]オキサジン-2,4-ジオン)、3,6,ジフルオロフタル酸無水物、および2,3ピラジンジカルボン酸無水物、またはそれらの誘導体からなる群から選択される、請求項187に記載のキット。
  189. 結合剤をさらに含み、前記結合剤が、前記結合剤に関する識別情報を有するコーディングタグを含む、請求項146~188のいずれか一項に記載のキット。
  190. 前記キットが、2つ以上の結合剤を含む、請求項189に記載のキット。
  191. 前記結合剤が、未標識末端アミノ酸に結合するように構成されている、請求項189または請求項190に記載のキット。
  192. 前記結合剤が、標識末端アミノ酸に結合するように構成されている、請求項189または請求項190に記載のキット。
  193. 前記結合剤が、前記ポリペプチドの単一のアミノ酸残基、ジペプチド、トリペプチド、または翻訳後修飾に結合する、請求項189~192のいずれか一項に記載のキット。
  194. 前記結合剤が、N末端アミノ酸残基に結合する、請求項193に記載のキット。
  195. 前記結合剤が、C末端アミノ酸残基に結合する、請求項193に記載のキット。
  196. 前記結合剤が、ポリペプチドまたはタンパク質である、請求項189~195のいずれか一項に記載のキット。
  197. 前記結合剤が、アミノペプチダーゼ、またはその変異体、突然変異体もしくは修飾タンパク質;アミノアシルtRNAシンテターゼ、またはその変異体、突然変異体もしくは修飾タンパク質;アンチカリン、またはその変異体、突然変異体もしくは修飾タンパク質;ClpS(ClpS2など)、またはその変異体、突然変異体もしくは修飾タンパク質;UBRボックスタンパク質、またはその変異体、突然変異体もしくは修飾タンパク質;または、1つ以上のアミノ酸に結合する修飾された小分子、すなわちバンコマイシン、またはその変異体、突然変異体もしくは修飾分子;または、抗体もしくはその結合断片;あるいは、それらの任意の組み合わせである、請求項189~196のいずれか一項に記載のキット。
  198. 前記コーディングタグの前記識別情報を前記ポリペプチドに付着した記録タグに転送するための試薬をさらに含み、前記識別情報の前記記録タグへの前記転送により、前記ポリペプチド上に伸長記録タグが生成される、請求項146~197のいずれか一項に記載のキット。
  199. 前記識別情報を伝達するための前記試薬が、化学ライゲーション試薬または生物学的ライゲーション試薬である、請求項198に記載のキット。
  200. 前記識別情報を伝達するための前記試薬が、一本鎖核酸または二本鎖核酸のプライマー伸長のための試薬である、請求項198に記載のキット。
  201. 前記伸長記録タグを増幅するための増幅試薬をさらに含む、請求項198~200のいずれか一項に記載のキット。
  202. ビーズ、多孔質ビーズ、磁性ビーズ、常磁性ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、回転干渉測定ディスク、膜、ニトロセルロース膜、ニトロセルロースベースのポリマー表面、ナノ粒子(例えば、磁性ナノ粒子(Fe)、金ナノ粒子、および/または銀ナノ粒子などの金属を含む)、量子ドット、ナノシェル、ナノケージ、ミクロスフェア、ならびにそれらの任意の組み合わせからなる群から選択される固体支持体をさらに含む、請求項146~201のいずれかに記載のキット。
  203. 前記固体支持体が、ポリスチレンビーズ、ポリアクリレートビーズ、ポリマービーズ、アガロースビーズ、セルロースビーズ、デキストランビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、制御された多孔質ビーズ、シリカベースのビーズ、またはそれらの任意の組み合わせを含む、請求項202に記載のキット。
  204. 核酸配列決定分析のための試薬をさらに含む、請求項146~203のいずれか一項に記載のキット。
  205. 前記核酸配列決定分析が、合成によるシーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、ポロニーシーケンシング、イオン半導体シーケンシング、パイロシーケンシング、単一分子リアルタイムシーケンシング、ナノポアベースのシーケンシング、または高度な顕微鏡を使用するDNAのダイレクトイメージング、またはそれらの任意の組み合わせを含む、請求項204に記載のキット。
JP2021557332A 2019-03-26 2020-03-24 修飾された切断酵素、その使用、および関連キット Pending JP2022526939A (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201962823927P 2019-03-26 2019-03-26
US201962824157P 2019-03-26 2019-03-26
US62/824,157 2019-03-26
US62/823,927 2019-03-26
US201962931737P 2019-11-06 2019-11-06
US62/931,737 2019-11-06
PCT/US2020/024521 WO2020198264A1 (en) 2019-03-26 2020-03-24 Modified cleavases, uses thereof and related kits

Publications (2)

Publication Number Publication Date
JP2022526939A true JP2022526939A (ja) 2022-05-27
JPWO2020198264A5 JPWO2020198264A5 (ja) 2022-06-27

Family

ID=72612078

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021557332A Pending JP2022526939A (ja) 2019-03-26 2020-03-24 修飾された切断酵素、その使用、および関連キット

Country Status (9)

Country Link
EP (1) EP3947667A4 (ja)
JP (1) JP2022526939A (ja)
KR (1) KR102567902B1 (ja)
CN (1) CN113993997A (ja)
AU (1) AU2020247918B2 (ja)
CA (1) CA3134776A1 (ja)
MX (1) MX2021011726A (ja)
SG (1) SG11202110373WA (ja)
WO (1) WO2020198264A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11427814B2 (en) 2019-03-26 2022-08-30 Encodia, Inc. Modified cleavases, uses thereof and related kits
US20240011009A1 (en) * 2020-03-24 2024-01-11 Encodia, Inc. Modified dipeptide cleavases, uses thereof and related kits
EP4271997A1 (en) * 2020-12-31 2023-11-08 Encodia, Inc. Metalloenzymes for biomolecular recognition of n-terminal modified peptides
EP4382532A1 (en) * 2021-08-02 2024-06-12 Spiber Inc. Porous body and method for producing same
CN114460052B (zh) * 2022-01-11 2023-06-20 武汉理工大学 一种基于荧光碳量子点直接检测丙酮酸钠浓度的方法
CN116426509A (zh) * 2023-04-27 2023-07-14 上海佶凯星生物科技有限公司 一种碱性蛋白酶组合突变体及其应用

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW257792B (ja) * 1992-10-01 1995-09-21 Lilly Co Eli
US6875851B1 (en) * 1999-03-05 2005-04-05 University Of Georgia Research Foundation, Inc. Prolyl tripeptidyl peptidases nucleic acid of Porphyromonas gingivalis
JP2004528812A (ja) * 2000-10-12 2004-09-24 フェリング ベスローテン フェンノートシャップ Dppivに関連する新規セリンプロテアーゼ遺伝子
MX282672B (es) * 2002-10-10 2011-01-10 Diversa Corp Proteasas, acidos nucleicos que los codifican, y metodos de hacer y usar los mismos.
WO2005015239A2 (en) * 2003-08-07 2005-02-17 Cornell Research Foundation, Inc. Method for n-terminal labeling of proteins
EP1972349A1 (en) * 2007-03-21 2008-09-24 Biocompatibles UK Limited GLP-1 fusion peptides conjugated to polymer(s), their production and use
EP1975176A1 (en) * 2007-03-27 2008-10-01 Biocompatibles UK Limited Novel glp-1 fusion peptides, their production and use
EP2034020A1 (en) * 2007-08-30 2009-03-11 Procomcure Biotech GmbH Method for manufacturing a modified peptide
CA2745197A1 (en) * 2008-12-01 2010-06-10 Research Triangle Institute Concurrent identification of multitudes of polypeptides
SG10201602651YA (en) * 2011-04-05 2016-05-30 Cellectis Method for the generation of compact tale-nucleases and uses thereof
WO2013110766A1 (en) * 2012-01-26 2013-08-01 Novozymes A/S Use of polypeptides having protease activity in animal feed and detergents
US9435810B2 (en) * 2013-03-15 2016-09-06 Washington University Molecules and methods for iterative polypeptide analysis and processing
KR102379048B1 (ko) * 2016-05-02 2022-03-28 엔코디아, 인코포레이티드 암호화 핵산을 사용한 거대분자 분석

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SCIENTIFIC REPORT, vol. Vol. 4, 4977, JPN6022032172, 15 May 2014 (2014-05-15), ISSN: 0005096660 *
SCIENTIFIC REPORT, vol. Vol. 5, 11151, JPN6022032171, 9 June 2015 (2015-06-09), ISSN: 0005096659 *
鈴木義之: "Pseudoxanthomonas mexicana WO24株由来Dipeptidyl Aminopeptidase BIIの酵素学的・構造生物学的解析—Endo", 長岡技術科学大学学術情報リポジトリ, [ONLINE], JPN6022049799, 25 March 2014 (2014-03-25), ISSN: 0005096661 *

Also Published As

Publication number Publication date
EP3947667A1 (en) 2022-02-09
AU2020247918B2 (en) 2022-06-30
CA3134776A1 (en) 2020-10-01
CN113993997A (zh) 2022-01-28
WO2020198264A1 (en) 2020-10-01
AU2020247918A1 (en) 2021-10-21
KR20210143236A (ko) 2021-11-26
EP3947667A4 (en) 2022-12-28
WO2020198264A8 (en) 2021-01-07
MX2021011726A (es) 2021-10-22
SG11202110373WA (en) 2021-10-28
KR102567902B1 (ko) 2023-08-18

Similar Documents

Publication Publication Date Title
JP7333975B2 (ja) 核酸エンコーディングを使用した巨大分子解析
US20200348307A1 (en) Methods and compositions for polypeptide analysis
JP2022526939A (ja) 修飾された切断酵素、その使用、および関連キット
JP2021501577A (ja) 核酸エンコーディングおよび/または標識を使用する解析のためのキット
US11788080B2 (en) Modified cleavases, uses thereof and related kits
US11634709B2 (en) Methods for preparing analytes and related kits
CN114793437A (zh) 用于从多肽上切割n端氨基酸的方法和试剂
US11169157B2 (en) Methods for stable complex formation and related kits
US20240011009A1 (en) Modified dipeptide cleavases, uses thereof and related kits
US20220214350A1 (en) Methods for stable complex formation and related kits
US20230257727A1 (en) Modified cleavases, uses thereof and related kits
WO2021141924A1 (en) Methods for stable complex formation and related kits
CN113557299A (zh) 加速多肽分析反应的方法和组合物及相关用途

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220616

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220616

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220802

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221013

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221124

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230222

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230524

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230630