JP2022507516A - タンパク質シーケンシングのための方法及び組成物 - Google Patents

タンパク質シーケンシングのための方法及び組成物 Download PDF

Info

Publication number
JP2022507516A
JP2022507516A JP2021526514A JP2021526514A JP2022507516A JP 2022507516 A JP2022507516 A JP 2022507516A JP 2021526514 A JP2021526514 A JP 2021526514A JP 2021526514 A JP2021526514 A JP 2021526514A JP 2022507516 A JP2022507516 A JP 2022507516A
Authority
JP
Japan
Prior art keywords
amino acid
protein
terminal
molecule
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021526514A
Other languages
English (en)
Other versions
JPWO2020102741A5 (ja
Inventor
リード、ブライアン
ラッキー、ジェレミー
クリスチャン、トーマス
ナニ、ロジャー
ドッド、デイビッド
クローチェ、キャスレン
ゴリヤノフ、アレクサンダー
エム. ロスバーグ、ジョナサン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quantum Si Inc
Original Assignee
Quantum Si Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quantum Si Inc filed Critical Quantum Si Inc
Publication of JP2022507516A publication Critical patent/JP2022507516A/ja
Publication of JPWO2020102741A5 publication Critical patent/JPWO2020102741A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • G01N33/581Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances with enzyme label (including co-enzymes, co-factors, enzyme inhibitors or substrates)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6818Sequencing of polypeptides
    • G01N33/6824Sequencing of polypeptides involving N-terminal degradation, e.g. Edman degradation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/28Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • G01N33/582Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances with fluorescent label
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6818Sequencing of polypeptides
    • G01N33/6821Sequencing of polypeptides involving C-terminal degradation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • G01N2021/6439Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2458/00Labels used in chemical analysis of biological material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Abstract

本願の態様は、タンパク質、ポリペプチド、アミノ酸、及びそれらに有用な組成物を同定及びシーケンスする方法を提供する。いくつかの態様では、本願は、ポリペプチドの分解プロセス時のデータを得てポリペプチドに相当するアミノ酸配列を出力する方法を提供する。いくつかの態様では、本願は、ポリペプチドシーケンシング反応時の光安定性を増強するシールディングエレメントを含むアミノ酸認識分子を提供する。

Description

本発明は、タンパク質シーケンシングのための方法及び組成物に関する。
プロテオミクスは、生物学的系の研究においてゲノミクス及びトランスクリプトミクスに対する重要且つ必要な補完物として現われた。個別生物のプロテオミック解析は、改善された診断及び療法ストラテジーをもたらす細胞プロセス及び反応パターンについての洞察を提供可能である。タンパク質構造、組成、及び修飾を取り巻く複雑性は、生物学的サンプルに対する大規模タンパク質シーケンシング情報を決定するうえで課題を呈する。
いくつかの態様では、本願は、ポリペプチドからアミノ酸配列情報を決定するための(たとえば、1つ以上のポリペプチドをシーケンスするための)方法及び組成物を提供する。いくつかの実施形態では、アミノ酸配列情報は、単一ポリペプチド分子に対して決定可能である。いくつかの実施形態では、たとえば、単一ポリペプチド分子に対して、ポリペプチドの2つ以上のアミノ酸の相対位置が決定される。いくつかの実施形態では、ポリペプチドの1つ以上のアミノ酸が標識されて(たとえば、直接的又は間接的に)、ポリペプチドの標識アミノ酸の相対位置が決定される。
いくつかの態様では、本願は、ポリペプチドの分解プロセス時のデータを得ることを含む方法を提供する。いくつかの実施形態では、本方法は、分解プロセス時にポリペプチドの末端に逐次露出されるアミノ酸に対応するデータの部分を決定するようにデータを解析することをさらに含む。いくつかの実施形態では、本方法は、ポリペプチドに相当するアミノ酸配列を出力することをさらに含む。いくつかの実施形態では、データは、分解プロセス時のポリペプチドの末端のアミノ酸アイデンティティー(identity)の指標となる。いくつかの実施形態では、データは、分解プロセス時に末端の異なるタイプの末端アミノ酸に結合する1つ以上のアミノ酸認識分子により生成されるシグナルの指標となる。いくつかの実施形態では、データは、分解プロセス時に発生する発光シグナルの指標となる。いくつかの実施形態では、データは、分解プロセス時に発生する電気シグナルの指標となる。
いくつかの実施形態では、データを解析することは、一連の切断イベントを検出することと、逐次切断イベント間のデータの部分を決定することと、をさらに含む。いくつかの実施形態では、データを解析することは、個別部分の各々に対してアミノ酸のタイプを決定することをさらに含む。いくつかの実施形態では、個別部分の各々は、パルスパターン(たとえば特性パターン)を含み、且つデータを解析することは、そのそれぞれのパルスパターンに基づいて1つ以上の部分に対してアミノ酸のタイプを決定することをさらに含む。いくつかの実施形態では、アミノ酸のタイプを決定することは、データが閾値超であるときの部分内の時間量を同定することと、部分に対して時間量と持続時間とを比較することと、をさらに含む。いくつかの実施形態では、アミノ酸のタイプを決定することは、1つ以上の部分の各々に対して少なくとも1つのパルス持続時間を同定することをさらに含む。いくつかの実施形態では、アミノ酸のタイプを決定することは、1つ以上の部分の各々に対して少なくとも1つのパルス間持続時間を同定することをさらに含む。いくつかの実施形態では、アミノ酸配列は、部分に対応する一連のアミノ酸を含む。
いくつかの態様では、本願は、少なくとも1つのハードウェアプロセッサーと、少なくとも1つのハードウェアプロセッサーによる実行時に少なくとも1つのハードウェアプロセッサーに本願に係る方法を実施させるプロセッサー実行可能命令を記憶する少なくとも1つの非一時コンピュータ可読記憶媒体と、を含むシステムを提供する。いくつかの態様では、本願は、少なくとも1つのハードウェアプロセッサーによる実行時に少なくとも1つのハードウェアプロセッサーに本願に係る方法を実施させるプロセッサー実行可能命令を記憶する少なくとも1つの非一時コンピュータ可読記憶媒体を提供する。
いくつかの態様では、本願は、ポリペプチドシーケンシング方法を提供する。いくつかの実施形態では、本方法は、単一ポリペプチド分子と1つ以上の末端アミノ酸認識分子とを接触させることを含む。いくつかの実施形態では、本方法は、1つ以上の末端アミノ酸認識分子と分解されている間に単一ポリペプチド分子の末端に露出される逐次アミノ酸との会合(association)の指標となる一連のシグナルパルスを検出することにより単一ポリペプチド分子に関する配列情報を得ることをさらに含む。いくつかの実施形態では、単一ポリペプチド分子のほとんど又はすべてのアミノ酸配列が決定される。いくつかの実施形態では、一連のシグナルパルスは一連のリアルタイムシグナルパルスである。
いくつかの実施形態では、1つ以上の末端アミノ酸認識分子と末端に露出される各タイプのアミノ酸との会合は、末端に露出される他のタイプのアミノ酸とは異なる特性パターンを一連のシグナルパルスに生成する。いくつかの実施形態では、特性パターンのシグナルパルスは、末端アミノ酸認識分子と末端に露出されるアミノ酸との間の個別会合イベントに対応する。いくつかの実施形態では、特性パターンは、単一ポリペプチド分子の末端に露出されるアミノ酸との一連の可逆的末端アミノ酸認識分子結合相互作用に対応する。いくつかの実施形態では、特性パターンは、単一ポリペプチド分子の末端に露出されるアミノ酸及び隣接位置のアミノ酸(たとえば、同一タイプ又は異なるタイプのアミノ酸)の指標となる。
いくつかの実施形態では、単一ポリペプチド分子は、単一ポリペプチド分子の末端から1つ以上のアミノ酸を除去する切断試薬により分解される。いくつかの実施形態では、本方法は、切断試薬と末端との会合の指標となるシグナルを検出することをさらに含む。いくつかの実施形態では、切断試薬は、検出可能標識(たとえば、発光標識、伝導率(conductivity)標識)を含む。いくつかの実施形態では、単一ポリペプチド分子は、表面に固定される。いくつかの実施形態では、単一ポリペプチド分子は、1つ以上の末端アミノ酸認識分子が会合する末端の遠位にある末端を介して表面に固定される。いくつかの実施形態では、単一ポリペプチド分子は、リンカー(たとえば、バイオ分子を含む可溶化性リンカー)を介して表面に固定される。
いくつかの態様では、本願は、反応混合物中の単一ポリペプチド分子と、1つ以上の末端アミノ酸認識分子と切断試薬とを含む組成物と、を接触させることを含むポリペプチドのシーケンシング方法を提供する。いくつかの実施形態では、本方法は、切断試薬の存在下で1つ以上の末端アミノ酸認識分子と単一ポリペプチド分子の末端との会合の指標となる一連のシグナルパルスを検出することをさらに含む。いくつかの実施形態では、一連のシグナルパルスは、切断試薬による末端アミノ酸切断の結果として経時的に末端に露出される一連のアミノ酸の指標となる。
いくつかの態様では、本願は、(a)単一ポリペプチド分子の末端の第1のアミノ酸を同定することと、(b)第1のアミノ酸を除去して単一ポリペプチド分子の末端に第2のアミノ酸を露出させることと、(c)単一ポリペプチド分子の末端の第2のアミノ酸を同定することと、を含むポリペプチドのシーケンシング方法を提供する。いくつかの実施形態では、(a)~(c)は単一反応混合物中で実施される。いくつかの実施形態では、(a)~(c)は逐次行われる。いくつかの実施形態では、(c)は(a)及び(b)の前に行われる。いくつかの実施形態では、単一反応混合物は1つ以上の末端アミノ酸認識分子を含む。いくつかの実施形態では、単一反応混合物は切断試薬を含む。いくつかの実施形態では、第1のアミノ酸は切断試薬により除去される。いくつかの実施形態では、本方法は、単一ポリペプチド分子の末端の1つ以上のアミノ酸を除去及び同定する工程を繰り返すことにより単一ポリペプチド分子の配列(たとえば、部分配列又は完全配列)を決定することをさらに含む。
いくつかの態様では、本願は、単一ポリペプチド分子と単一ポリペプチド分子に結合する1つ以上のアミノ酸認識分子とを接触させることを含むポリペプチドのアミノ酸の同定方法を提供する。いくつかの実施形態では、本方法は、ポリペプチド分解条件下で1つ以上のアミノ酸認識分子と単一ポリペプチド分子との会合の指標となる一連のシグナルパルスを検出することをさらに含む。いくつかの実施形態では、本方法は、一連のシグナルパルスの第1の特性パターンに基づいて単一ポリペプチド分子の第1のタイプのアミノ酸を同定することをさらに含む。
いくつかの態様では、本願は、ポリペプチドの末端アミノ酸(たとえば、N末端又はC末端アミノ酸)の同定方法を提供する。いくつかの実施形態では、本方法は、ポリペプチドと、ポリペプチドの末端の1タイプ以上の末端アミノ酸に選択的に結合する1つ以上の標識アフィニティー試薬(たとえば、1つ以上のアミノ酸認識分子)と、を接触させることを含む。いくつかの実施形態では、本方法は、ポリペプチドと1つ以上の標識アフィニティー試薬との相互作用を検出することによりポリペプチドの末端の末端アミノ酸を同定することをさらに含む。
さらに他の態様では、本願は、エドマン型分解反応によるポリペプチドシーケンシング方法を提供する。いくつかの実施形態では、エドマン型分解反応は、検出又は切断のどちらかの目的でポリペプチドとさまざまな反応混合物とを接触させることにより実施されうる(たとえば、単一反応混合物を用いた検出及び切断を含みうる動的シーケンシング反応と比較される)。
それゆえ、いくつかの態様では、本願は、(i)ポリペプチドと、ポリペプチドの末端の1タイプ以上の末端アミノ酸に選択的に結合する1つ以上の標識アフィニティー試薬と、を接触させることを含むポリペプチドのアミノ酸配列の決定方法を提供する。いくつかの実施形態では、本方法は、(ii)ポリペプチドと1つ以上の標識アフィニティー試薬との相互作用を検出することによりポリペプチドの末端の末端アミノ酸(たとえば、N末端又はC末端アミノ酸)を同定することをさらに含む。いくつかの実施形態では、本方法は、(iii)末端アミノ酸を除去することをさらに含む。いくつかの実施形態では、本方法は、(iv)ポリペプチドのアミノ酸配列を決定するためにポリペプチドの末端で(i)~(iii)を1回以上繰り返すことをさらに含む。
いくつかの実施形態では、本方法は、(i)の後且つ(ii)の前に、末端アミノ酸に選択的に結合しない1つ以上の標識アフィニティー試薬をいずれも除去することをさらに含む。いくつかの実施形態では、本方法は、(ii)の後且つ(iii)の前に、末端アミノ酸に選択的に結合する1つ以上の標識アフィニティー試薬をいずれも除去することをさらに含む。
いくつかの実施形態では、末端アミノ酸を除去すること(たとえば(iii))は、末端アミノ酸とイソチオシアネート(たとえばフェニルイソチオシアネート)とを接触させることにより末端アミノ酸を修飾することと、修飾末端アミノ酸と修飾末端アミノ酸に特異的に結合してそれを除去するプロテアーゼとを接触させることと、を含む。いくつかの実施形態では、末端アミノ酸を切断すること(たとえば(iii))は、末端アミノ酸とイソチオシアネートとを接触させることにより末端アミノ酸を修飾することと、修飾末端アミノ酸を修飾末端アミノ酸を除去するのに十分な酸性又は塩基性条件に付すことと、を含む。
いくつかの実施形態では、末端アミノ酸を同定することは、1つ以上の標識アフィニティー試薬が結合する1タイプ以上の末端アミノ酸の1タイプであるとして末端アミノ酸を同定することを含む。いくつかの実施形態では、末端アミノ酸を同定することは、1つ以上の標識アフィニティー試薬が結合する1タイプ以上の末端アミノ酸以外のタイプであるとして末端アミノ酸を同定することを含む。
いくつかの態様では、本願は、たとえば、ポリペプチドシーケンシング反応時の光安定性増強のために、シールディング(shielding)エレメントを含むアミノ酸認識分子を提供する。いくつかの態様では、本願は、式(I):
A-(Y)-D
(I)
(式中、Aは、少なくとも1つのアミノ酸認識分子を含むアミノ酸結合成分であり;Yの各々は、共有結合性又は非共有結合性連結基を形成するポリマーであり;nは、1~10(両端の値を含む)の整数であり;且つ、Dは、少なくとも1つの検出可能標識を含む標識成分である)
のアミノ酸認識分子を提供する。いくつかの実施形態では、Dは200Å未満の直径である。いくつかの実施形態では、-(Y)-は、少なくとも2nmの長さ(たとえば、少なくとも5nm、少なくとも10nm、少なくとも20nm、少なくとも30nm、少なくとも50nm、又はそれ以上の長さ)である。いくつかの実施形態では、-(Y)-は、約2nm~約200nmの長さ(たとえば、約2nm~約100nm、約5nm~約50nm、又は約10nm~約100nmの長さ)である。いくつかの実施形態では、Yの各々は、独立して、バイオ分子又はデンドリティックポリマー(たとえば、ポリオール、デンドリマー)である。いくつかの実施形態では、本願は、式(I)のアミノ酸認識分子を含む組成物を提供する。いくつかの実施形態では、アミノ酸認識分子は組成物に可溶である。
いくつかの態様では、本願は、式(II):
A-Y-D
(II)
(式中、Aは、少なくとも1つのアミノ酸認識分子を含むアミノ酸結合成分であり;Yは、核酸又はポリペプチドであり;Dは、少なくとも1つの検出可能標識を含む標識成分である)
のアミノ酸認識分子を提供する。いくつかの実施形態では、Yが核酸であるとき、核酸は共有結合性又は非共有結合性連結基を形成する。いくつかの実施形態では、ただし、Yがポリペプチドであるとき、ポリペプチドは、50×10-9M未満の解離定数(K)により特徴付けられる非共有結合性連結基を形成する。いくつかの実施形態では、Kは、1×10-9M未満、1×10-10M未満、1×10-11M未満、又は1×10-12M未満である。
いくつかの態様では、本願は、核酸と、核酸上の第1の装着部位に装着された少なくとも1つのアミノ酸認識分子と、核酸上の第2の装着部位に装着された少なくとも1つの検出可能標識と、を含むアミノ酸認識分子であって、核酸が少なくとも1つのアミノ酸認識分子と少なくとも1つの検出可能標識との間に共有結合性又は非共有結合性連結基を形成する、アミノ酸認識分子を提供する。いくつかの実施形態では、核酸は、第1のオリゴヌクレオチド鎖を含む。いくつかの実施形態では、核酸は、第1のオリゴヌクレオチド鎖にハイブリダイズされた第2のオリゴヌクレオチド鎖をさらに含む。
いくつかの態様では、本願は、少なくとも2つのリガンド結合部位を含む多価タンパク質と、タンパク質上の第1のリガンド結合部位に結合された第1のリガンド部分を介してタンパク質に装着された少なくとも1つのアミノ酸認識分子と、タンパク質上の第2のリガンド結合部位に結合された第2のリガンド部分を介してタンパク質に装着された少なくとも1つの検出可能標識と、を含むアミノ酸認識分子を提供する。いくつかの実施形態では、多価タンパク質はアビジンタンパク質である。
いくつかの実施形態では、シールドアミノ酸認識分子は、本願に係るポリペプチドシーケンシング方法又は当技術分野で公知のいずれかの方法で使用されうる。それゆえ、いくつかの態様では、本願は、ポリペプチド分子と本願の1つ以上のシールドアミノ酸認識分子とを接触させることを含むポリペプチドシーケンシング方法を提供する(たとえば、エドマン型分解反応で、動的シーケンシング反応で、又は当技術分野で公知の他の方法で)。たとえば、いくつかの実施形態では、本方法は、ポリペプチド分子と、本願に係るシールド又はシールディングエレメントを含む少なくとも1つのアミノ酸認識分子と、を接触させることと、少なくとも1つのアミノ酸認識分子とポリペプチド分子との会合を検出することと、を含む。
いくつかの態様では、本願は、混合サンプル中の対象タンパク質の同定方法を提供する。いくつかの実施形態では、本方法は、混合タンパク質サンプルを切断して複数のポリペプチド断片を生成することを含む。いくつかの実施形態では、本方法は、本願の方法に係る方法で複数のポリペプチド断片の少なくとも1つのアミノ酸配列を決定することをさらに含む。いくつかの実施形態では、本方法は、アミノ酸配列が対象タンパク質にユニークに同定可能である場合に混合サンプル中の対象タンパク質を同定することをさらに含む。
いくつかの実施形態では、混合サンプル中の対象タンパク質の同定方法は、混合タンパク質サンプルを切断して複数のポリペプチド断片を生成することを含む。いくつかの実施形態では、本方法は、複数のポリペプチド断片中の1タイプ以上のアミノ酸を1つ以上の異なる発光標識で標識することをさらに含む。いくつかの実施形態では、本方法は、複数の標識ポリペプチドの少なくとも1つに対して経時的に発光を測定することをさらに含む。いくつかの実施形態では、本方法は、検出された発光に基づいて少なくとも1つの標識ポリペプチドのアミノ酸配列を決定することをさらに含む。いくつかの実施形態では、本方法は、アミノ酸配列が対象タンパク質にユニークに同定可能である場合に混合サンプル中の対象タンパク質を同定することをさらに含む。
それゆえ、いくつかの実施形態では、本願に係る分析される対象ポリペプチド分子又はタンパク質は、混合又は精製サンプルでありうる。いくつかの実施形態では、対象ポリペプチド分子又はタンパク質は、生物学的サンプル(たとえば、血液、組織、唾液、尿、又は他の生物源)から得られる。いくつかの実施形態では、対象ポリペプチド分子又はタンパク質は、患者サンプル(たとえばヒトサンプル)から得られる。
本発明のある特定の実施形態の詳細は、以下に記載のある特定の実施形態の詳細な説明に示される。本発明の他の特徴、目的、及び利点は、定義、実施例、図面、及び特許請求の範囲から明らかになるであろう。
本明細書に記載の図面が単に例示を目的としたものにすぎないことは、当業者であれば理解されよう。いくつかの場合には、本発明の各種態様は、本発明の理解を容易にするために誇張又は拡大されて示されうることが理解されるべきである。図面では、同じ参照文字は、各種図面全体を通して同じ特徴、機能的類似要素、及び/又は構造的類似要素を一般に意味する。図面は、必ずしも原寸通りとは限らず、その代わりに教示の原理を例示することに重点が置かれている。図面は、本教示の範囲を限定することがなんら意図されるものではない。
本発明の特徴及び利点は、図面と併せて考慮すれば以下に示される詳細な説明からより明らかになるであろう。
図面を参照して実施形態を説明するとき、方向参照(「上方(above)」、「下方(below)」、「トップ(top)」、「ボトム(bottom)」、「左」、「右」、「水平」、「垂直」など)が使用されうる。かかる参照は、正規の向きで図面を見る読者の助けとなるように単に意図されているにすぎない。これらの方向参照は、具現化されたデバイスの好ましい又は唯一の向きを記述することが意図されるものではない。デバイスは、他の向きで具現化されうる。
詳細な説明から明らかなように、本願全体を通して例示目的で図に描かれるとともにさらに説明される例は、非限定的実施形態を説明するものであり、いくつかの場合には、より明確な例示を目的としてある特定のプロセスを単純化したり又は特徴や工程を省略したりしうる。
単一分子結合相互作用の検出(図1A)及び解析(図1B)によるポリペプチドシーケンシングの例を示す。 単一分子結合相互作用の検出(図1A)及び解析(図1B)によるポリペプチドシーケンシングの例を示す。 本願に係る標識アフィニティー試薬及び使用方法の各種例を示す。図1Cは、1タイプ以上の末端アミノ酸に選択的に結合する標識酵素及び標識アプタマーをはじめとする標識アフィニティー試薬の構成例を描く。 本願に係る標識アフィニティー試薬及び使用方法の各種例を示す。図1Dは、標識アフィニティー試薬を用いたポリペプチドシーケンシングの分解ベースプロセスを一般的に描く。 本願に係る標識アフィニティー試薬及び使用方法の各種例を示す。図1Eは、末端アミノ酸検出、修飾、及び切断の繰返しサイクルによる標識アプタマーを用いたポリペプチドシーケンシングの例を示す。 異なるタイプの末端アミノ酸に各々選択的に結合してそれを切断する標識エキソペプチダーゼを用いたリアルタイムのポリペプチドシーケンシングの例を示す。 末端及び/又は内部アミノ酸と標識アフィニティー試薬及び標識切断試薬(たとえば標識非特異的エキソペプチダーゼ)との結合相互作用を評価することによるリアルタイムのポリペプチドシーケンシングの例を示す。図3Aは、シグナル出力で一連のパルスを検出することによるリアルタイムシーケンシングの例を示す。 末端及び/又は内部アミノ酸と標識アフィニティー試薬及び標識切断試薬(たとえば標識非特異的エキソペプチダーゼ)との結合相互作用を評価することによるリアルタイムのポリペプチドシーケンシングの例を示す。図3Bは、温度依存シーケンシングプロセスを模式的に描く。 末端及び内部アミノ酸と標識アフィニティー試薬及び標識非特異的エキソペプチダーゼとの結合相互作用を評価することによるリアルタイムのポリペプチドシーケンシングの例を示す。 シールディングエレメントを介して標識されたアフィニティー試薬の非限定的例を示す。図5Aは、従来の共有結合性連結を介して標識されたアフィニティー試薬による単一分子ペプチドシーケンシングを例示する。 シールディングエレメントを介して標識されたアフィニティー試薬の非限定的例を示す。図5Bは、シールディングエレメントを含むアフィニティー試薬による単一分子ペプチドシーケンシングを例示する。 シールディングエレメントを介して標識されたアフィニティー試薬の非限定的例を示す。図5C~5Eは、本願に係るシールディングエレメントの各種例を例示する。 シールディングエレメントを介して標識されたアフィニティー試薬の非限定的例を示す。図5C~5Eは、本願に係るシールディングエレメントの各種例を例示する。 シールディングエレメントを介して標識されたアフィニティー試薬の非限定的例を示す。図5C~5Eは、本願に係るシールディングエレメントの各種例を例示する。 標識ポリペプチド中に検出されたユニーク組合せのアミノ酸に基づいてポリペプチドを同定する例を示す。 末端アミノ酸修飾及び切断の繰返しサイクルに付される標識ポリペプチドの発光を検出することによるポリペプチドシーケンシングの例を示す。 プロセッシブ酵素切断による標識ポリペプチドのポリペプチドシーケンシングの例を示す。図8Aは、固定末端ペプチダーゼによる標識ポリペプチドのプロセッシブ酵素切断によるシーケンシングの例を示す。 プロセッシブ酵素切断による標識ポリペプチドのポリペプチドシーケンシングの例を示す。図8Bは、末端ペプチダーゼによる固定標識ポリペプチドのプロセッシブ酵素切断によるシーケンシングの例を示す。 プロセッシブ酵素切断による標識ポリペプチドのポリペプチドシーケンシングの例を示す。図8Cは、図8Bに従って実施されるリアルタイムシーケンシングプロセスの例を模式的に例示する。 ポリペプチド基質の固定ATP依存プロテアーゼ、ドナー標識ATP、及びアクセプター標識アミノ酸を用いた補因子ベースFRETによるシーケンシングの例を模式的に例示する。 本願に係るポリペプチド及びタンパク質の分析のためのサンプル及びサンプルウェル表面の各種調製例を示す。図10Aは、タンパク質サンプルから末端修飾ポリペプチドを調製するプロセス例を一般的に描く。 本願に係るポリペプチド及びタンパク質の分析のためのサンプル及びサンプルウェル表面の各種調製例を示す。図10Bは、可溶化性リンカーをポリペプチドにコンジュゲートするプロセス例を一般的に描く。 本願に係るポリペプチド及びタンパク質の分析のためのサンプル及びサンプルウェル表面の各種調製例を示す。図10Cは、ボトム表面への単一分子固定を促進するために使用されうる修飾表面を有するサンプルウェルの模式図例を示す。 本明細書に記載の技術のいくつかの実施形態に係るポリペプチド分解プロセス時に得られるデータを解析するための例示的配列データ処理パイプラインの図である。 本明細書に記載の技術のいくつかの実施形態に係るポリペプチド分子のアミノ酸配列を決定するための例示的プロセスのフローチャートである。 本明細書に記載の技術のいくつかの実施形態に係るポリペプチドに相当するアミノ酸配列を決定するための例示的プロセスのフローチャートである。 本明細書に記載の技術のいくつかの実施形態の実現に使用されうる例示的コンピュータシステムのブロック図である。 さまざまな可溶化性リンカーにより提供される溶解性増強のために調製及び評価された選ばれたペプチド-リンカーコンジュゲートの実験データを示す。図15Aは、合成及び評価されたペプチド-リンカーコンジュゲートの構造例を示す。 さまざまな可溶化性リンカーにより提供される溶解性増強のために調製及び評価された選ばれたペプチド-リンカーコンジュゲートの実験データを示す。図15Bは、N末端のペプチド切断を実証するLCMSの結果を示す。 さまざまな可溶化性リンカーにより提供される溶解性増強のために調製及び評価された選ばれたペプチド-リンカーコンジュゲートの実験データを示す。図15Cは、ローディング実験の結果を示す。 実験結果に基づいて選ばれたエキソペプチダーゼのアミノ酸切断活性の概要を示す。 末端アミノ酸の検出及び切断のための色素/ペプチドコンジュゲートアッセイの実験データを示す。図17Aは、色素/ペプチドコンジュゲートアッセイを実施するために使用されるスキーム例及び構造例を示す。 末端アミノ酸の検出及び切断のための色素/ペプチドコンジュゲートアッセイの実験データを示す。図17Bは、オンチップアッセイでのサンプルウェル中へのペプチド-リンカーコンジュゲートローディングのイメージング結果を示す。 末端アミノ酸の検出及び切断のための色素/ペプチドコンジュゲートアッセイの実験データを示す。図17Cは、ペプチドコンジュゲートローディング及び末端アミノ酸切断を検出したシグナルトレース例を示す。 末端アミノ酸の検出及び切断のためのFRET色素/ペプチドコンジュゲートアッセイの実験データを示す。図18Aは、FRET色素/ペプチドコンジュゲートアッセイを実施するために使用されるスキーム例及び構造例を示す。 末端アミノ酸の検出及び切断のためのFRET色素/ペプチドコンジュゲートアッセイの実験データを示す。図18Bは、さまざまな時点のFRETイメージング結果を示す。 末端アミノ酸の検出及び切断のためのFRET色素/ペプチドコンジュゲートアッセイの実験データを示す。図18Cは、さまざまな時点のカッティング効率を示す。 末端アミノ酸の検出及び切断のためのFRET色素/ペプチドコンジュゲートアッセイの実験データを示す。図18Dは、さまざまな時点の各々で表示されるカッティングを示す。 末端アミノ酸の検出及び切断のためのFRET色素/ペプチドコンジュゲートアッセイの実験データを示す。図18Eは、エルシニア・ペスティス(Yersinia pestis)由来のプロリンイミノペプチダーゼ(yPIP)によるさまざまな時点の追加のFRETイメージング結果を示す。 末端アミノ酸の検出及び切断のためのFRET色素/ペプチドコンジュゲートアッセイの実験データを示す。図18Fは、ビブリオ・プロテオリチカス(Vibrio proteolyticus)由来のアミノペプチダーゼ(VPr)によるさまざまな時点のFRETイメージング結果を示す。 標識アフィニティー試薬による末端アミノ酸識別の実験データを示す。図19Aは、これらの実験のために標識されたClpS2タンパク質の結晶構造を示す。 標識アフィニティー試薬による末端アミノ酸識別の実験データを示す。図19Bは、標識ClpS2タンパク質によるN末端アミノ酸識別を例示する単一分子強度トレースを示す。 標識アフィニティー試薬による末端アミノ酸識別の実験データを示す。図19Cは、さまざまな末端アミノ酸の平均パルス持続時間を示すプロットである。 標識アフィニティー試薬による末端アミノ酸識別の実験データを示す。図19Dは、さまざまな末端アミノ酸の平均パルス間持続時間を示すプロットである。 標識アフィニティー試薬による末端アミノ酸識別の実験データを示す。図19Eは、さまざまな末端アミノ酸間のディスクリミナントパルス持続時間をさらに例示するプロットを示す。 標識アフィニティー試薬による末端アミノ酸識別の実験データを示す。図19F、19G、及び19Hは、サーモシノコッカス・エロンガタス(Thermosynochoccus elongatus)由来のClpSタンパク質(teClpS)によるロイシン認識を実証する滞留時間解析の結果例を示す。 標識アフィニティー試薬による末端アミノ酸識別の実験データを示す。図19F、19G、及び19Hは、サーモシノコッカス・エロンガタス(Thermosynochoccus elongatus)由来のClpSタンパク質(teClpS)によるロイシン認識を実証する滞留時間解析の結果例を示す。 標識アフィニティー試薬による末端アミノ酸識別の実験データを示す。図19F、19G、及び19Hは、サーモシノコッカス・エロンガタス(Thermosynochoccus elongatus)由来のClpSタンパク質(teClpS)によるロイシン認識を実証する滞留時間解析の結果例を示す。 標識アフィニティー試薬による末端アミノ酸識別の実験データを示す。図19Iは、A.ツメファシエンス(A.tumefaciens)ClpS1によるフェニルアラニン、ロイシン、トリプトファン、及びチロシンの区別可能認識を実証する滞留時間解析の結果例を示す。 標識アフィニティー試薬による末端アミノ酸識別の実験データを示す。図19Jは、S.エロンガタス(elongatus)ClpS2によるロイシン認識を実証する滞留時間解析の結果例を示す。 標識アフィニティー試薬による末端アミノ酸識別の実験データを示す。図19K~19Lは、GID4によるプロリン認識を実証する滞留時間解析の結果例を示す。 標識アフィニティー試薬による末端アミノ酸識別の実験データを示す。図19K~19Lは、GID4によるプロリン認識を実証する滞留時間解析の結果例を示す。 同一反応混合物中の標識ClpS2認識タンパク質及びアミノペプチダーゼ切断試薬を用いてリアルタイムで行われたポリペプチドシーケンシング反応の結果例を示す。図20Aは、第1のシーケンシング反応のシグナルトレースデータを示す。 同一反応混合物中の標識ClpS2認識タンパク質及びアミノペプチダーゼ切断試薬を用いてリアルタイムで行われたポリペプチドシーケンシング反応の結果例を示す。図20Bは、図20Aに示されるシグナルトレースデータのパルス持続時間統計を示す。 同一反応混合物中の標識ClpS2認識タンパク質及びアミノペプチダーゼ切断試薬を用いてリアルタイムで行われたポリペプチドシーケンシング反応の結果例を示す。図20Cは、第2のシーケンシング反応のシグナルトレースデータを示す。 同一反応混合物中の標識ClpS2認識タンパク質及びアミノペプチダーゼ切断試薬を用いてリアルタイムで行われたポリペプチドシーケンシング反応の結果例を示す。図20Dは、図20Cに示されるシグナルトレースデータのパルス持続時間統計を示す。 標識エキソペプチダーゼによる末端アミノ酸同定及び切断の実験データを示す。図21Aは、これらの実験のために部位特異的に標識されたプロリンイミノペプチダーゼ(yPIP)の結晶構造を示す。 標識エキソペプチダーゼによる末端アミノ酸同定及び切断の実験データを示す。図21Bは、精製タンパク質産物の標識度を示す。 標識エキソペプチダーゼによる末端アミノ酸同定及び切断の実験データを示す。図21Cは、yPIPの部位特異的標識化を確認するSDS pageの画像である。 標識エキソペプチダーゼによる末端アミノ酸同定及び切断の実験データを示す。図21Dは、部位特異的標識化を確認するSDS pageゲルのオーバー露出画像である。 標識エキソペプチダーゼによる末端アミノ酸同定及び切断の実験データを示す。図21Eは、標識タンパク質産物の純度を確認するクーマシー染色ゲルの画像である。 標識エキソペプチダーゼによる末端アミノ酸同定及び切断の実験データを示す。図21Fは、標識エキソペプチダーゼの切断活性を実証するHPLCトレースである。配列YPYPYPKは配列番号82に対応する。配列PYPYPKは配列番号83に対応する。 特異的翻訳後修飾を含有するアミノ酸の認識を評価する実験のデータを示す。図22Aは、SH2ドメイン含有タンパク質によるホスホチロシン認識を実証した代表的トレースを示す。 特異的翻訳後修飾を含有するアミノ酸の認識を評価する実験のデータを示す。図22Bは、図22Aのトレースに対応するパルス持続時間データを示し、且つ図22Cは、トレースに対して決定された統計を示す。 特異的翻訳後修飾を含有するアミノ酸の認識を評価する実験のデータを示す。図22Bは、図22Aのトレースに対応するパルス持続時間データを示し、且つ図22Cは、トレースに対して決定された統計を示す。 特異的翻訳後修飾を含有するアミノ酸の認識を評価する実験のデータを示す。図22D~22Fは、陰性対照実験の代表的トレースを示す。 特異的翻訳後修飾を含有するアミノ酸の認識を評価する実験のデータを示す。図22D~22Fは、陰性対照実験の代表的トレースを示す。 特異的翻訳後修飾を含有するアミノ酸の認識を評価する実験のデータを示す。図22D~22Fは、陰性対照実験の代表的トレースを示す。 パルス持続時間に及ぼすペナルティメートアミノ酸の影響を評価する実験のメジアンパルス持続時間を示すプロットである。 差次的標識認識分子による同時アミノ酸認識を評価する実験のデータを示す。図24Aは、代表的トレースを示す。 差次的標識認識分子による同時アミノ酸認識を評価する実験のデータを示す。図24Bは、各認識分子に対してこれらの実験時に得られたパルス持続時間データを比較するプロットである。 差次的標識認識分子による同時アミノ酸認識を評価する実験のデータを示す。図24Cは、これらの実験のパルス持続時間統計を示す。 単一分子認識時のペプチドの光安定性を評価する実験のデータを示す。図25Aは、アミノ酸結合部位から約2nmに色素で標識されたatClpS2-V1を用いた認識の代表的トレースを示す。 単一分子認識時のペプチドの光安定性を評価する実験のデータを示す。図25Bは、これらの実験に使用されるClpS2タンパク質の構造の可視化を示す。 単一分子認識時のペプチドの光安定性を評価する実験のデータを示す。図25Cは、DNA/タンパク質リンカーを介してアミノ酸結合部位から>10nmに色素で標識されたClpS2を用いた認識の代表的トレースを示す。 アミノペプチダーゼ切断試薬の存在下でDNA/ストレプトアビジンリンカーを介して標識されたClpS2認識タンパク質を用いて相補型金属-酸化物-半導体(CMOS)チップ上でリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースを示す。 アミノペプチダーゼ切断試薬の存在下でDNA/ストレプトアビジンリンカーを介して標識されたClpS2認識タンパク質を用いて相補型金属-酸化物-半導体(CMOS)チップ上でリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースを示す。 アミノペプチダーゼ切断試薬の存在下でDNA/ストレプトアビジンリンカーを介して標識されたClpS2認識タンパク質を用いて相補型金属-酸化物-半導体(CMOS)チップ上でリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースを示す。 アミノペプチダーゼ切断試薬の存在下でDNA/ストレプトアビジンリンカーを介して標識されたClpS2認識タンパク質を用いて相補型金属-酸化物-半導体(CMOS)チップ上でリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースを示す。 パイロコッカス・ホリコシイ(Pyrococcus horikoshii)TETアミノペプチダーゼ切断試薬の存在下でDNA/ストレプトアビジンリンカーを介して標識されたatClpS2-V1認識タンパク質を用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースを示す。 差次的切断特異性を有する複数のタイプのエキソペプチダーゼを用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースデータを示す。図28Aは、図28Bに示される拡大パルスパターン領域と共にhTETエキソペプチダーゼで実施された反応の代表的トレースを示す。図28Aの配列YAAWAAFADDDWKは配列番号78に対応する。 差次的切断特異性を有する複数のタイプのエキソペプチダーゼを用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースデータを示す。図28Aは、図28Bに示される拡大パルスパターン領域と共にhTETエキソペプチダーゼで実施された反応の代表的トレースを示す。図28Aの配列YAAWAAFADDDWKは配列番号78に対応する。 差次的切断特異性を有する複数のタイプのエキソペプチダーゼを用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースデータを示す。図28Cは、図28Dに示される拡大パルスパターン領域及び図28Eに示される追加の代表的トレースと共にhTET及びyPIPの両方のエキソペプチダーゼで実施された反応の代表的トレースを示す。図28Cの配列FYPLPWPDDDYKは配列番号80に対応する。 差次的切断特異性を有する複数のタイプのエキソペプチダーゼを用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースデータを示す。図28Cは、図28Dに示される拡大パルスパターン領域及び図28Eに示される追加の代表的トレースと共にhTET及びyPIPの両方のエキソペプチダーゼで実施された反応の代表的トレースを示す。図28Cの配列FYPLPWPDDDYKは配列番号80に対応する。 差次的切断特異性を有する複数のタイプのエキソペプチダーゼを用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースデータを示す。図28Cは、図28Dに示される拡大パルスパターン領域及び図28Eに示される追加の代表的トレースと共にhTET及びyPIPの両方のエキソペプチダーゼで実施された反応の代表的トレースを示す。図28Cの配列FYPLPWPDDDYKは配列番号80に対応する。 図28Fは、図28Gに示される拡大パルスパターン領域及び図28Hに示される追加の代表的トレースと共にhTET及びyPIPの両方のエキソペプチダーゼで実施されたさらなる反応の代表的トレースを示す。図28F及び28Iの配列YPLPWPDDDYKは配列番号81に対応する。 図28Fは、図28Gに示される拡大パルスパターン領域及び図28Hに示される追加の代表的トレースと共にhTET及びyPIPの両方のエキソペプチダーゼで実施されたさらなる反応の代表的トレースを示す。図28F及び28Iの配列YPLPWPDDDYKは配列番号81に対応する。 図28Fは、図28Gに示される拡大パルスパターン領域及び図28Hに示される追加の代表的トレースと共にhTET及びyPIPの両方のエキソペプチダーゼで実施されたさらなる反応の代表的トレースを示す。図28F及び28Iの配列YPLPWPDDDYKは配列番号81に対応する。 差次的切断特異性を有する複数のタイプのエキソペプチダーゼを用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースデータを示す。図28Iは、図28Jに示される拡大パルスパターン領域と共にPfuTET及びyPIPの両方のエキソペプチダーゼで実施された反応の代表的トレースを示す。図28F及び28Iの配列YPLPWPDDDYKは配列番号81に対応する。 差次的切断特異性を有する複数のタイプのエキソペプチダーゼを用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースデータを示す。図28Iは、図28Jに示される拡大パルスパターン領域と共にPfuTET及びyPIPの両方のエキソペプチダーゼで実施された反応の代表的トレースを示す。図28F及び28Iの配列YPLPWPDDDYKは配列番号81に対応する。
本願の態様は、タンパク質シーケンシング及び同定の方法と、ポリペプチドシーケンシング及び同定の方法と、アミノ酸同定の方法と、かかる方法を実施するための組成物と、に関する。
いくつかの態様では、本願は、デバイス修正をほとんど又はまったく伴うことなく既存の分析機器を用いて実現されうるポリペプチドシーケンシング技術の発見に関する。たとえば、以前のポリペプチドシーケンシングストラテジーは、分析されるポリペプチドを含有する反応ベッセル(vessel)を介するさまざまな試薬混合物の繰返しサイクリングを含んでいた。かかるストラテジーは、試薬サイクリングが可能なフローセルや類似の装置を備えていないこともある核酸シーケンシング機器などの既存の分析機器の修正を必要とすることもある。本願のある特定のポリペプチドシーケンシング技術は繰返し試薬サイクリングを必要としないので、機器サイズを増加させるおそれのある有意な修正を伴うことなく既存の機器の使用を可能にすることを、本発明者らは認識し高く評価した。それゆえ、いくつかの態様では、本願は、より小型のシーケンシング機器の使用を可能にするポリペプチドシーケンシング方法を提供する。いくつかの態様では、本願は、同一シーケンシング機器を用いて実施されるゲノミック解析及びプロテオミック解析の両方を可能にするポリペプチドシーケンシング技術の発見に関する。
差次的結合相互作用(differential binding interactions)はポリペプチドシーケンシングの従来の標識化ストラテジーに対する追加又は代替のアプローチを提供可能であることを、本発明者らはさらに認識し高く評価した。従来のポリペプチドシーケンシングは、各タイプのアミノ酸をユニーク同定可能標識で標識することを含みうる。数多くの翻訳後変異に加えて少なくとも20の異なるタイプの天然に存在するアミノ酸があるので、こうしたプロセスは労力がかかるうえに誤りを起こしやすい可能性がある。いくつかの態様では、本願は、異なるタイプのアミノ酸に差次的に会合してポリペプチドのアミノ酸配列の指標となる検出可能特性シグネチャーを生成するアミノ酸認識分子の使用を含む技術の発見に関する。それゆえ、本願の態様は、ある特定の従来のポリペプチドシーケンシングに使用されるポリペプチド標識化及び/又は強烈な化学試薬を必要としない技術を提供するので、サンプルから得られる配列情報のスループット及び/又は確度を増加させる。
いくつかの態様では、本願は、単一反応混合物のみを用いて(たとえば、反応ベッセルを介する繰返し試薬サイクリングを必要とすることなく)ポリペプチドシーケンシング反応をリアルタイムでモニター可能であるという発見に関する。以上に詳述したように、従来のポリペプチドシーケンシング反応は、アミノ酸検出工程とアミノ酸切断工程との間でサイクルするようにポリペプチドをさまざまな試薬混合物に暴露することを含みうる。それゆえ、いくつかの態様では、本願は、進行中の分解反応全体にわたるリアルタイムのアミノ酸検出によりポリペプチド分析を可能にする次世代シーケンシングの進歩に関する。動的シーケンシングによるかかるポリペプチド分析のアプローチは以下に説明される。
本明細書に記載されるように、いくつかの態様では、本願は、ポリペプチド分解プロセス時のデータを得ることと、データを解析して分解プロセス時にポリペプチドの末端に逐次露出されるアミノ酸に対応するデータの部分を決定することと、によるポリペプチドのシーケンシング方法を提供する。いくつかの実施形態では、データの部分は、1つ以上のアミノ酸認識分子とポリペプチドの末端に露出される(たとえば分解時に)逐次アミノ酸との会合の指標となる一連のシグナルパルスを含む。いくつかの実施形態では、一連のシグナルパルスは、分解プロセス時のポリペプチドの末端での一連の可逆単一分子結合相互作用に対応する。
ポリペプチド分解プロセス時の単一分子結合相互作用を検出することによるポリペプチドシーケンシングの非限定的例は、図1Aに模式的に例示される。シグナルトレース例(I)は、シグナルの変化に対応するときのさまざまな会合イベント(association events)を描く一連のパネル(II)で示される。示されるように、アミノ酸認識分子(斑点形状)とポリペプチド(ビーズオンストリング(beads-on-a-string)として示される)の末端のアミノ酸との間の会合イベントは、ある持続時間にわたり持続するシグナルの大きさの変化を生成する。
パネル(A)及び(B)は、アミノ酸認識分子とポリペプチドの末端に露出される第1のアミノ酸(たとえば第1の末端アミノ酸)との間のさまざまな会合イベントを描く。各会合イベントは、会合イベントの持続時間にわたり持続するシグナルの大きさの変化により特徴付けられるシグナルトレース(I)の変化を生成する。それゆえ、パネル(A)及び(B)の会合イベント間の持続時間は、ポリペプチドがアミノ酸認識分子に検出可能に会合されない持続時間に対応する。
パネル(C)及び(D)は、アミノ酸認識分子とポリペプチドの末端に露出される第2のアミノ酸(たとえば第2の末端アミノ酸)との間のさまざまな会合イベントを描く。本明細書に記載されるように、ポリペプチドの末端に「露出」されるアミノ酸は、ポリペプチドに依然として装着されており且つ分解時に先行末端アミノ酸の除去により末端アミノ酸になる(たとえば、単独で又は1つ以上の追加のアミノ酸と共に、のいずれかで)アミノ酸である。それゆえ、一連のパネル(II)の第1及び第2のアミノ酸は、ポリペプチドの末端に露出される逐次アミノ酸の例示的例を提供し、この場合、第2のアミノ酸は、第1のアミノ酸の除去により末端アミノ酸になったものである。
一般的に描かれるように、パネル(C)及び(D)の会合イベントは、パネル(A)及び(B)のものよりも相対的に短い持続時間にわたり持続する大きさの変化により特徴付けられるシグナルトレース(I)の変化を生成し、且つパネル(C)及び(D)の会合イベント間の持続時間は、パネル(A)及び(B)のものよりも相対的に短い。本明細書に記載されるように、いくつかの実施形態では、シグナルのこれらの識別可能な変化の一方又は両方のどちらかは、異なるタイプのアミノ酸間の識別が可能なシグナルトレース(I)の特性パターンを決定するために使用されうる。いくつかの実施形態では、一方の特性パターンから他方の特性パターンへの遷移は、アミノ酸切断の指標となる。本明細書で用いられる場合、いくつかの実施形態では、アミノ酸切断とは、ポリペプチドの末端からの少なくとも1つのアミノ酸の除去(たとえば、ポリペプチドからの少なくとも1つの末端アミノ酸の除去)を意味する。いくつかの実施形態では、アミノ酸切断は、特性パターン間の持続時間に基づく推測により決定される。いくつかの実施形態では、アミノ酸切断は、標識切断試薬とポリペプチドの末端のアミノ酸との会合により生成されるシグナルの変化を検出することにより決定される。アミノ酸は分解時にポリペプチドの末端から逐次切断されるので、大きさの一連の変化又は一連のシグナルパルスが検出される。いくつかの実施形態では、シグナルパルスデータは、図1Bに例示されるように分析可能である。
いくつかの実施形態では、シグナルデータは、シグナルデータの1つ以上のパラメータに閾値レベルを適用することによりシグナルパルス情報を抽出するように解析可能である。たとえば、パネル(III)は、シグナルトレース例(I)のシグナルデータに適用される閾値大きさレベル(「M」)を描く。いくつかの実施形態では、Mは、ある時間点で検出されるシグナルと所与のデータセットに対して決定されるベースラインとの間の最小差である。いくつかの実施形態では、シグナルパルス(「sp」)は、Mを超える大きさの変化の指標となり且つある持続時間にわたり持続するデータの各部分に割り当てられる。いくつかの実施形態では、閾値持続時間は、Mを満たすデータの部分に適用されてシグナルパルスがその部分に割り当てられるかを決定しうる。たとえば、実験アーチファクトは、所望の信頼性でシグナルパルスを帰属するのに十分な持続時間にわたり持続しないMを超える大きさの変化を引き起こしうる(たとえば、アミノ酸タイプを識別できない可能性のある一過性会合イベント、観測領域中への拡散や観測領域内に固着する試薬などの非特異的検出イベント)。それゆえ、いくつかの実施形態では、シグナルパルスは、閾値大きさレベル及び閾値持続時間に基づいてシグナルデータから抽出される。
抽出されたシグナルパルス情報は、例示を目的として重ね合わせられたシグナルトレース例(I)と共にパネル(III)に示される。いくつかの実施形態では、シグナルパルスの大きさのピークは、M超を持続する持続時間にわたり検出された大きさを平均することにより決定される。いくつかの実施形態では、本明細書で用いられる「シグナルパルス」とは、ある持続時間にわたりベースライン超を持続するシグナルデータの変化(たとえば、シグナルトレース例(I)により例示される生のシグナルデータ)又はそれから抽出されたシグナルパルス情報(たとえば、パネル(IV)に例示される処理シグナルデータ)を意味しうることが認識されるべきである。
パネル(IV)は、シグナルトレース例(I)から抽出されたシグナルパルス情報を示す。いくつかの実施形態では、シグナルパルス情報は、一連のシグナルパルス中のさまざまな特性パターンに基づいて異なるタイプのアミノ酸を同定するように解析可能である。たとえば、パネル(IV)に示されるように、シグナルパルス情報は、第1の特性パターン(「CP」)に基づいて第1のタイプのアミノ酸及び第2の特性パターン(「CP」)に基づいて第2のタイプのアミノ酸の指標となる。例として、より早い時点で検出された2つのシグナルパルスは、CPに基づいてポリペプチドの末端の第1のアミノ酸の指標となる情報を提供し、且つより後の時点で検出された2つのシグナルパルスは、CPに基づいてポリペプチドの末端の第2のアミノ酸の指標となる情報を提供する。
また、パネル(IV)に示されるように、各シグナルパルスは、アミノ酸認識分子と特性パターンのアミノ酸との間の会合イベントに対応するパルス持続時間(「pd」)を含む。いくつかの実施形態では、パルス持続時間は、結合(binding)の解離速度に特有である。また、示されるように、特性パターンの各シグナルパルスは、パルス間持続時間(interpulse duration)(「ipd」)により特性パターンの他のシグナルパルスから分離される。いくつかの実施形態では、パルス間持続時間は、結合の会合速度に特有である。いくつかの実施形態では、大きさの変化(「ΔM」)は、ベースラインとシグナルパルスのピークとの間の差に基づいてシグナルパルスに対して決定可能である。いくつかの実施形態では、特性パターンは、パルス持続時間に基づいて決定される。いくつかの実施形態では、特性パターンは、パルス持続時間及びパルス間持続時間に基づいて決定される。いくつかの実施形態では、特性パターンは、パルス持続時間、パルス間持続時間、及び大きさの変化のいずれか1つ以上に基づいて決定される。
それゆえ、図1A~1Bにより例示されるように、いくつかの実施形態では、ポリペプチドシーケンシングは、1つ以上のアミノ酸認識分子と進行中の分解反応でポリペプチドの末端に露出される逐次アミノ酸との会合の指標となる一連のシグナルパルスを検出することにより実施される。一連のシグナルパルスは、一連のシグナルパルス中の特性パターンを決定するように解析可能であり、且つ特性パターンの経時変化は、ポリペプチドのアミノ酸配列を決定するために使用可能である。
いくつかの実施形態では、一連のシグナルパルスは、経時的に光学シグナルの大きさの一連の変化を含む。いくつかの実施形態では、光学シグナルの一連の変化は、会合イベント時に生成される発光の一連の変化を含む。いくつかの実施形態では、発光は、シーケンシング反応の1つ以上の試薬に関連付けられる検出可能標識により生成される。たとえば、いくつかの実施形態では、1つ以上のアミノ酸認識分子の各々は発光標識を含む。いくつかの実施形態では、切断試薬は発光標識を含む。本願に係る発光標識及びその使用の例は、本明細書の他の箇所に提供される。
いくつかの実施形態では、一連のシグナルパルスは、経時的に電気シグナルの大きさの一連の変化を含む。いくつかの実施形態では、電気シグナルの一連の変化は、会合イベント時に生成されるコンダクタンスの一連の変化を含む。いくつかの実施形態では、伝導率は、シーケンシング反応の1つ以上の試薬に関連付けられる検出可能標識により生成される。たとえば、いくつかの実施形態では、1つ以上のアミノ酸認識分子の各々は伝導率標識を含む。本願に係る伝導率標識及びその使用の例は、本明細書の他の箇所に提供される。伝導率標識を用いた単一分子の同定方法は記載されている(たとえば、米国特許出願公開第2017/0037462号明細書を参照されたい)。
いくつかの実施形態では、コンダクタンスの一連の変化は、ナノポアを介するコンダクタンスの一連の変化を含む。たとえば、ナノポアを用いたレセプター-リガンド相互作用の評価方法は記載されている(たとえば、タークル,A.K.(Thakur,A.K.)及びモビレアヌ,L.(Movileanu,L.)著、2019年、ネイチャー・バイオテクノロジー(Nature Biotechnology)、第37巻、第1号を参照されたい)。かかるナノポアは本願に係るポリペプチドシーケンシング反応をモニターするために使用されうることを、本発明者らは認識し高く評価した。それゆえ、いくつかの実施形態では、本願は、単一ポリペプチド分子と1つ以上のアミノ酸認識分子とを接触させることを含むポリペプチドシーケンシング方法を提供し、この場合、単一ポリペプチド分子はナノポアに固定される。いくつかの実施形態では、本方法は、1つ以上の末端アミノ酸認識分子と、単一ポリペプチドが分解されている間に単一ポリペプチドの末端に露出される逐次アミノ酸と、の会合の指標となるナノポアを介するコンダクタンスの一連の変化を検出することにより、単一ポリペプチド分子をシーケンスすることをさらに含む。
いくつかの態様では、本願は、混合物からポリペプチドの1タイプ以上のアミノ酸を同定することによるタンパク質の複合混合物中の個別タンパク質のシーケンシング及び/又は同定の方法を提供する。いくつかの実施形態では、ポリペプチドの1つ以上のアミノ酸(たとえば、末端アミノ酸及び/又は内部アミノ酸)が標識され(たとえば、直接的又は間接的に、たとえば、アミノ酸認識分子などの結合剤を用いて)、且つポリペプチド中の標識アミノ酸の相対位置が決定される。いくつかの実施形態では、ポリペプチド中のアミノ酸の相対位置は、一連のアミノ酸標識及び切断工程を用いて決定される。しかしながら、いくつかの実施形態では、ポリペプチド中の標識アミノ酸の相対位置は、ポリペプチドからアミノ酸を除去することなく、ポア(たとえばタンパク質チャネル)を介して標識ポリペプチドをトランスロケートすることと、ポリペプチド分子中の標識アミノ酸の相対位置を決定するためにポアを介するトランスロケーション時に標識アミノ酸からのシグナル(たとえばFRETシグナル)を検出することと、により決定可能である。
いくつかの実施形態では、末端アミノ酸(たとえば、N末端又はC末端アミノ酸)のアイデンティティーが評価され、その後で末端アミノ酸が除去され、そして末端のその次のアミノ酸のアイデンティティーが評価され、このプロセスがポリペプチド中の複数の逐次アミノ酸が評価されるまで繰り返される。いくつかの実施形態では、アミノ酸のアイデンティティーを評価することは、存在するアミノ酸のタイプを決定することを含む。いくつかの実施形態では、アミノ酸のタイプを決定することは、たとえば、天然に存在する20アミノ酸のどれであるかを決定することにより、実際のアミノ酸のアイデンティティーを決定することを含む(たとえば、個別末端アミノ酸に特異的な結合剤を用いて)。いくつかの実施形態では、アミノ酸のタイプは、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リシン、メチオニン、フェニルアラニン、プロリン、セレノシステイン、トレオニン、トリプトファン、チロシン、及びバリンから選択される。
しかしながら、いくつかの実施形態では、末端アミノ酸タイプのアイデンティティーを評価することは、ポリペプチドの末端に存在可能な潜在的アミノ酸のサブセットを決定することを含みうる。いくつかの実施形態では、これは、アミノ酸が1つ以上の特異的アミノ酸でないことを決定することにより達成可能である(したがって、他のアミノ酸のいずれかでありうる)。いくつかの実施形態では、これは、アミノ酸の特定サブセットのどれがポリペプチドの末端にありうるかを決定することにより(たとえば、サイズ、電荷、疎水性、翻訳後修飾、結合性に基づいて)達成可能である(たとえば、2つ以上の末端アミノ酸の特定サブセットに結合する結合剤を用いて)。
いくつかの実施形態では、末端アミノ酸タイプのアイデンティティーを評価することは、アミノ酸が翻訳後修飾を含むことを決定することを含む。翻訳後修飾の非限定的例としては、アセチル化、ADPリボシル化、カスパーゼ切断、シトルリン化、ホルミル化、N連結グリコシル化、O連結グリコシル化、ヒドロキシル化、メチル化、ミリストイル化、NEDD化(neddylation)、ニトロ化、酸化、パルミトイル化、リン酸化、プレニル化、S-ニトロシル化、硫酸化、SUMO化(sumoylation)、及びユビキチン化が挙げられる。
いくつかの実施形態では、末端アミノ酸タイプのアイデンティティーを評価することは、アミノ酸が1つ以上の生化学的性質により特徴付けられる側鎖を含むことを決定することを含む。たとえば、アミノ酸は、非極性脂肪族側鎖、正荷電側鎖、負荷電側鎖、非極性芳香族側鎖、又は極性非荷電側鎖を含みうる。非極性脂肪族側鎖を含むアミノ酸の非限定的例としては、アラニン、グリシン、バリン、ロイシン、メチオニン、及びイソロイシンが挙げられる。正荷電側鎖を含むアミノ酸の非限定的例としては、リシン、アルギニン、及びヒスチジンが挙げられる。負荷電側鎖を含むアミノ酸の非限定的例としては、アスパラギン酸及びグルタミン酸が挙げられる。非極性芳香族側鎖を含むアミノ酸の非限定的例としては、フェニルアラニン、チロシン、及びトリプトファンが挙げられる。極性非荷電側鎖を含むアミノ酸の非限定的例としては、セリン、トレオニン、システイン、プロリン、アスパラギン、及びグルタミンが挙げられる。
いくつかの実施形態では、タンパク質又はポリペプチドは、複数のより小さなポリペプチドに消化可能であり、且つ配列情報は、これらのより小さなポリペプチドの1つ以上から得ることが可能である(たとえば、ポリペプチドの末端アミノ酸を逐次評価することと、そのアミノ酸を除去してその次のアミノ酸を末端に露出することと、を含む方法を用いて)。
いくつかの実施形態では、ポリペプチドは、そのアミノ(N)末端からシーケンスされる。いくつかの実施形態では、ポリペプチドは、そのカルボキシ(C)末端からシーケンスされる。いくつかの実施形態では、ポリペプチドの第1の末端(たとえば、N又はC末端)は固定され、且つ他の末端(たとえば、C又はN末端)は本明細書に記載されるようにシーケンスされる。
本明細書で用いられる場合、ポリペプチドをシーケンスすることは、ポリペプチドの配列情報を決定することを意味する。いくつかの実施形態では、これは、ポリペプチドの一部分(又は全部)の各逐次アミノ酸のアイデンティティーを決定することを含みうる。しかしながら、いくつかの実施形態では、これは、ポリペプチド内のアミノ酸のサブセットのアイデンティティーを評価すること(たとえば、ポリペプチド中の各アミノ酸のアイデンティティーを決定することなく1つ以上のアミノ酸タイプの相対位置を決定すること)を含みうる。しかしながら、いくつかの実施形態では、ポリペプチド中のさまざまなタイプのアミノ酸の相対位置を直接決定することなく、ポリペプチドからアミノ酸含有率情報を得ることが可能である。アミノ酸含有率は単独で、存在するポリペプチドのアイデンティティーを推測するために使用されうる(たとえば、アミノ酸含有率とポリペプチド情報のデータベースとを比較することと、どのポリペプチドが同一アミノ酸含有率を有するかを決定することと、により)。
いくつかの実施形態では、(たとえば、酵素切断及び/又は化学切断を介して)より長いポリペプチド又はタンパク質から得られる複数のポリペプチド産物の配列情報は、より長いポリペプチド又はタンパク質の配列を再構築又は推測するように解析可能である。
それゆえ、いくつかの実施形態では、1タイプ以上のアミノ酸は、1タイプ以上のアミノ酸に選択的に結合する1つ以上の標識アフィニティー試薬の発光を検出することにより同定される。いくつかの実施形態では、1タイプ以上のアミノ酸は、標識ポリペプチドの発光を検出することにより同定される。
本明細書に記載のポリペプチドシーケンシング技術は、とくに従来のポリペプチドシーケンシング技術とは対照的に、新規なポリペプチドシーケンシングデータを発生することを含みうることを、本発明者らはさらに認識し高く評価した。そのため、ポリペプチドシーケンシングデータを解析する従来の技術は、本明細書に記載のポリペプチドシーケンシング技術を用いて発生されるデータに適用されるとき十分でないおそれがある。
たとえば、繰返し試薬サイクリングを含む従来のポリペプチドシーケンシング技術は、シーケンスされるポリペプチドの個別アミノ酸に関連付けられるデータを発生しうる。かかる場合には、検出されるデータが1つのアミノ酸のみに対応するので、発生されるデータを解析することは、特定時間でどのアミノ酸が検出されているかを決定することを単に含むにすぎないであろう。これとは対照的に、本明細書に記載のポリペプチドシーケンシング技術は、ポリペプチド分子の複数のアミノ酸が検出されている間にポリペプチド分解プロセス時のデータを発生しうるので、ポリペプチドのさまざまなアミノ酸に対応するデータのセクションを見分けることが困難なおそれのあるデータをもたらしうる。それゆえ、本発明者らは、個別アミノ酸に対応するデータのセクションを決定することを含む本明細書に記載のポリペプチドシーケンシング技術により、たとえば、それぞれのアミノ酸会合イベントに対応する部分にデータをセグメント化することにより、発生されるかかるデータを解析する新しい計算技術を開発した。次いで、それらのセクションは、それらの個別セクション時に検出されるアミノ酸を同定するようにさらに解析されうる。
他の一例として、各タイプのアミノ酸に対してユニーク同定可能標識を使用することを含む従来のシーケンシング技術は、どのように個別アミノ酸が他の分子と相互作用するかの動力学をなんら考慮することなくどの標識が特定時間に検出されているかを単に解析することを含みうるにすぎない。これとは対照的に、本明細書に記載のポリペプチドシーケンシング技術は、どのようにアミノ酸が認識分子と相互作用するかの指標となるデータを発生する。以上で考察されるように、データは、アミノ酸とそのそれぞれの認識分子との間の会合イベントに対応する一連の特性パターンを含みうる。それゆえ、本発明者らは、データのその部分に対応するアミノ酸のタイプを決定するように特性パターンを解析する新しい計算技術を開発し、一連のさまざまな特性パターンを解析することによりポリペプチドのアミノ酸配列の決定を可能にした。
標識アフィニティー試薬及び使用方法
いくつかの実施形態では、本明細書に提供される方法は、ポリペプチドと、1タイプの末端アミノ酸に選択的に結合するアミノ酸認識分子(本明細書では標識を含んでいても含んでいなくてもよいアミノ酸認識分子ともいう)と、を接触させることを含む。本明細書で用いられる場合、いくつかの実施形態では、末端アミノ酸とは、ポリペプチドのアミノ末端アミノ酸又はポリペプチドのカルボキシ末端アミノ酸を意味しうる。いくつかの実施形態では、標識アフィニティー試薬は、他のタイプの末端アミノ酸よりも1タイプの末端アミノ酸に選択的に結合する。いくつかの実施形態では、標識アフィニティー試薬は、同一タイプの内部アミノ酸よりも1タイプの末端アミノ酸に選択的に結合する。さらに他の実施形態では、標識アフィニティー試薬は、ポリペプチドのいずれかの位置の1タイプのアミノ酸、たとえば、末端アミノ酸や内部アミノ酸と同一タイプのアミノ酸に選択的に結合する。
本明細書で用いられる場合、いくつかの実施形態では、アミノ酸のタイプとは、20の天然に存在するアミノ酸の1つ又はそのタイプのサブセットを意味する。いくつかの実施形態では、アミノ酸のタイプとは、20の天然に存在するアミノ酸の1つの修飾変異体又はその非修飾及び/若しくは修飾変異体のサブセットを意味する。修飾アミノ酸変異体の例としては、限定されるものではないが、翻訳後修飾変異体(たとえば、アセチル化、ADPリボシル化、カスパーゼ切断、シトルリン化、ホルミル化、N連結グリコシル化、O連結グリコシル化、ヒドロキシル化、メチル化、ミリストイル化、NEDD化、ニトロ化、酸化、パルミトイル化、リン酸化、プレニル化、S-ニトロシル化、硫酸化、SUMO化、及びユビキチン化)、化学修飾変異体、非天然アミノ酸、及びタンパク質原性アミノ酸、たとえば、セレノシステイン及びピロリシンが挙げられる。いくつかの実施形態では、アミノ酸のタイプのサブセットは、1つ以上の類似の生化学的性質を有する1超且つ20未満のアミノ酸を含む。たとえば、いくつかの実施形態では、アミノ酸のタイプとは、荷電側鎖(たとえば、正及び/又は負荷電側鎖)を有するアミノ酸、極性側鎖(たとえば、極性非荷電側鎖)を有するアミノ酸、非極性側鎖(たとえば、非極性脂肪族及び/又は芳香族側鎖)を有するアミノ酸、及び疎水性側鎖を有するアミノ酸から選択される1タイプを意味する。
いくつかの実施形態では、本明細書に提供される方法は、ポリペプチドと、1タイプ以上の末端アミノ酸に選択的に結合する1つ以上の標識アフィニティー試薬と、を接触させることを含む。例示的且つ非限定的例として、4つの標識アフィニティー試薬が本願の方法で使用される場合、いずれか1つの試薬は、他の3つのいずれかが選択的に結合する他の1タイプのアミノ酸とは異なる1タイプの末端アミノ酸に選択的に結合する(たとえば、第1の試薬は第1のタイプに結合し、第2の試薬は第2のタイプに結合し、第3の試薬は第3のタイプに結合し、且つ第4の試薬は第4のタイプの末端アミノ酸に結合する。この考察の目的では、本明細書に記載の方法との関連での1つ以上の標識アフィニティー試薬は、標識アフィニティー試薬のセットと代替的にいいうる。
いくつかの実施形態では、標識アフィニティー試薬のセットは、少なくとも1つ且つ6つまでの標識アフィニティー試薬を含む。たとえば、いくつかの実施形態では、標識アフィニティー試薬のセットは、1つ、2つ、3つ、4つ、5つ、又は6つの標識アフィニティー試薬を含む。いくつかの実施形態では、標識アフィニティー試薬のセットは、10以下の標識アフィニティー試薬を含む。いくつかの実施形態では、標識アフィニティー試薬のセットは、8つ以下の標識アフィニティー試薬を含む。いくつかの実施形態では、標識アフィニティー試薬のセットは、6つ以下の標識アフィニティー試薬を含む。いくつかの実施形態では、標識アフィニティー試薬のセットは、4つ以下の標識アフィニティー試薬を含む。いくつかの実施形態では、標識アフィニティー試薬のセットは、3つ以下の標識アフィニティー試薬を含む。いくつかの実施形態では、標識アフィニティー試薬のセットは、2つ以下の標識アフィニティー試薬を含む。いくつかの実施形態では、標識アフィニティー試薬のセットは、4つの標識アフィニティー試薬を含む。いくつかの実施形態では、標識アフィニティー試薬のセットは、少なくとも2つ且つ20まで(たとえば、少なくとも2つ且つ10まで、少なくとも2つ且つ8つまで、少なくとも4つ且つ20まで、少なくとも4つ且つ10まで)の標識アフィニティー試薬を含む。いくつかの実施形態では、標識アフィニティー試薬のセットは、20超(たとえば、20~25、20~30)のアフィニティー試薬を含む。しかしながら、いずれの数のアフィニティー試薬も所望の使用に適応する本願の方法に従って使用されうることが認識されるべきである。
本願によれば、いくつかの実施形態では、1タイプ以上のアミノ酸は、標識アフィニティー試薬(たとえば、発光標識を含むアミノ酸認識分子)の発光を検出することにより同定される。いくつかの実施形態では、標識アフィニティー試薬は、1タイプのアミノ酸に選択的に結合するアフィニティー試薬と、アフィニティー試薬に関連付けられる発光を有する発光標識と、を含む。こうして、発光(たとえば、発光寿命、発光強度、及び本明細書の他の箇所に記載の他の発光性)は、ポリペプチドのアミノ酸を同定するようにアフィニティー試薬の選択的結合に関連付けられうる。いくつかの実施形態では、複数のタイプの標識アフィニティー試薬が本願に係る方法で使用されうるとともに、各タイプは、複数間でユニークに同定可能な発光を有する発光標識を含む。好適な発光標識は、フルオロフォア色素などの発光分子を含みうるとともに本明細書の他の箇所に記載されている。
いくつかの実施形態では、1タイプ以上のアミノ酸は、標識アフィニティー試薬の1つ以上の電気特性を検出することにより同定される。いくつかの実施形態では、標識アフィニティー試薬は、1タイプのアミノ酸に選択的に結合するアフィニティー試薬と、アフィニティー試薬に関連付けられる伝導率標識と、を含む。こうして、1つ以上の電気特性(たとえば、電荷、電流振動カラー、及び他の電気特性)は、ポリペプチドのアミノ酸を同定するようにアフィニティー試薬の選択的結合に関連付けられうる。いくつかの実施形態では、複数のタイプの標識アフィニティー試薬が本願に係る方法で使用されうるとともに、各タイプは、複数間でユニークに同定可能な電気シグナルの変化(たとえば、コンダクタンスの変化、たとえば、特性パターンの伝導率の大きさの変化及び伝導率の遷移)を生成する伝導率標識を含む。いくつかの実施形態では、複数のタイプの標識アフィニティー試薬は各々、異なる数の荷電基(たとえば、異なる数の負及び/又は正荷電基)を有する伝導率標識を含む。それゆえ、いくつかの実施形態では、伝導率標識は電荷標識である。電荷標識の例としては、デンドリマー、ナノ粒子、核酸、及び複数の荷電基を有する他のポリマーが挙げられる。いくつかの実施形態では、伝導率標識は、その正味電荷(net charge)(たとえば、正味正電荷又は正味負電荷)により、その電荷密度により、及び/又はその荷電基数によりユニークに同定可能である。
いくつかの実施形態では、アフィニティー試薬(たとえばアミノ酸認識分子)は、従来から公知の技術を用いて当業者により工学操作されうる。いくつかの実施形態では、望ましい性質は、ポリペプチドの末端(たとえば、N末端又はC末端)に位置するときのみ1タイプのアミノ酸に選択的に且つ高親和性で結合する能力を含みうる。さらに他の実施形態では、望ましい性質は、ポリペプチドの末端(たとえば、N末端又はC末端)に位置するとき及びポリペプチドの内部位置に位置するとき1タイプのアミノ酸に選択的に且つ高親和性で結合する能力を含みうる。いくつかの実施形態では、望ましい性質は、1タイプ超のアミノ酸に選択的に且つ低親和性で(たとえば、約50nM以上、たとえば、約50nM~約50μM、約100nM~約10μM、約500nM~約50μMのKで)結合する能力を含む。たとえば、いくつかの態様では、本願は、ポリペプチド分解プロセス時の可逆結合相互作用を検出することによるシーケンシング方法を提供する。有利には、かかる方法は、1タイプ超のアミノ酸(たとえば、アミノ酸タイプのサブセット)に低親和性で可逆結合するアフィニティー試薬を用いて実施されうる。
本明細書で用いられる場合、いくつかの実施形態では、「選択的」及び「特異的」(及びそれらの変化形、たとえば、選択的に、特異的に、選択性、特異性)という用語は、優先的結合相互作用を意味する。たとえば、いくつかの実施形態では、1タイプのアミノ酸に選択的に結合する標識アフィニティー試薬は、1タイプのアミノ酸に他の1タイプのアミノ酸よりも優先的に結合する。選択的結合相互作用は、1タイプのアミノ酸(たとえば1タイプの末端アミノ酸)と他のタイプのアミノ酸(たとえば他のタイプの末端アミノ酸)とを典型的には約10倍超~100倍以上(たとえば、約1,000倍超又は10,000倍超)で識別するであろう。それゆえ、選択的結合相互作用とは、1タイプのアミノ酸を他のタイプのアミノ酸よりもユニークに同定可能ないずれかの結合相互作用を意味しうることが認識されるべきである。たとえば、いくつかの態様では、本願は、1つ以上のアミノ酸認識分子とポリペプチド分子との会合の指標となるデータを得ることによるポリペプチドシーケンシング方法を提供する。いくつかの実施形態では、データは、ポリペプチド分子のアミノ酸との一連の可逆アミノ酸認識分子結合相互作用に対応する一連のシグナルパルスを含み、且つデータは、アミノ酸のアイデンティティーを決定するために使用されうる。したがって、いくつかの実施形態では、「選択的」又は「特異的」結合相互作用とは、1タイプのアミノ酸と他のタイプのアミノ酸とを識別する検出結合相互作用を意味する。
いくつかの実施形態では、標識アフィニティー試薬(たとえばアミノ酸認識分子)は、他のタイプのアミノ酸に有意に結合することなく約10-6M未満(たとえば、約10-7M未満、約10-8M未満、約10-9M未満、約10-10M未満、約10-11M未満、約10-12M未満、10-16M程度まで)の解離定数(K)で1タイプのアミノ酸に選択的に結合する。いくつかの実施形態では、標識アフィニティー試薬は、約100nM未満、約50nM未満、約25nM未満、約10nM未満、又は約1nM未満のKで1タイプのアミノ酸(たとえば1タイプの末端アミノ酸)に選択的に結合する。いくつかの実施形態では、標識アフィニティー試薬は、約50nM~約50μM(たとえば、約50nM~約500nM、約50nM~約5μM、約500nM~約50μM、約5μM~約50μM、又は約10μM~約50μM)のKで1タイプのアミノ酸に選択的に結合する。いくつかの実施形態では、標識アフィニティー試薬は、約50nMのKで1タイプのアミノ酸に選択的に結合する。
いくつかの実施形態では、標識アフィニティー試薬(たとえばアミノ酸認識分子)は、約10-6M未満(たとえば、約10-7M未満、約10-8M未満、約10-9M未満、約10-10M未満、約10-11M未満、約10-12M未満、10-16M程度まで)の解離定数(K)で2タイプ以上のアミノ酸に選択的に結合する。いくつかの実施形態では、標識アフィニティー試薬は、約100nM未満、約50nM未満、約25nM未満、約10nM未満、又は約1nM未満のKで2タイプ以上のアミノ酸に選択的に結合する。いくつかの実施形態では、標識アフィニティー試薬は、約50nM~約50μM(たとえば、約50nM~約500nM、約50nM~約5μM、約500nM~約50μM、約5μM~約50μM、又は約10μM~約50μM)のKで2タイプ以上のアミノ酸に選択的に結合する。いくつかの実施形態では、標識アフィニティー試薬は、約50nMのKで2タイプ以上のアミノ酸に選択的に結合する。
本明細書に提供される方法及び組成物に従って、図1Cは、標識アフィニティー試薬の各種構成例及び使用例を示す。いくつかの実施形態では、標識アフィニティー試薬100は、発光標識110(たとえば標識)と、ポリペプチド120の1タイプ以上の末端アミノ酸に選択的に結合するアフィニティー試薬(斑点形状として示される)と、を含む。いくつかの実施形態では、アフィニティー試薬は、末端位置又は末端位置及び内部位置の両方の1タイプのアミノ酸又はアミノ酸のタイプのサブセット(たとえば、20未満の通常のタイプのアミノ酸)に対して選択的である。
本明細書に記載されるように、アフィニティー試薬(「認識分子」としても知られる)は、1分子に他の1分子よりも(たとえば、本明細書で参照される「アミノ酸認識分子」と同様に、1タイプのアミノ酸に他の1タイプのアミノ酸よりも)選択的又は特異的に結合可能ないずれかのバイオ分子でありうる。いくつかの実施形態では、アフィニティー試薬は、ペプチダーゼでないか又はペプチダーゼ活性を有していない。たとえば、いくつかの実施形態では、本願のポリペプチドシーケンシング方法は、ポリペプチド分子と1つ以上のアフィニティー試薬及び切断試薬とを接触させることを含む。かかる実施形態では、1つ以上のアフィニティー試薬は、ペプチダーゼ活性を有しておらず、且つポリペプチド分子からの1つ以上のアミノ酸の除去(たとえば、ポリペプチド分子の末端からのアミノ酸除去)は、切断試薬により実施される。
アフィニティー試薬(たとえば認識分子)は、たとえば、合成又は組換えでありうるタンパク質及び核酸を含む。いくつかの実施形態では、アフィニティー試薬又は認識分子は、抗体若しくは抗体の抗原結合部分、SH2ドメイン含有タンパク質若しくはその断片、又は酵素バイオ分子、たとえば、ペプチダーゼ、アミノトランスフェラーゼ、リボザイム、アプタザイム、若しくはtRNAシンテターゼ(「繰返しポリペプチド分析及び処理のための分子及び方法(MOLECULES AND METHODS FOR ITERATIVE POLYPEPTIDE ANALYSIS AND PROCESSING)」という名称の2016年9月2日出願の米国特許出願第15/255,433号明細書に記載のアミノアシルtRNAシンテターゼ及び関連分子を含む)でありうる。
いくつかの実施形態では、本願のアフィニティー試薬又は認識分子は分解経路タンパク質である。認識分子として使用するのに好適な分解経路タンパク質の例としては、限定されるものではないが、N末端則経路タンパク質、たとえば、Arg/N末端則経路タンパク質、Ac/N末端則経路タンパク質、及びPro/N末端則経路タンパク質が挙げられる。いくつかの実施形態では、認識分子は、Gidタンパク質(たとえば、Gid4又はGid10タンパク質)、UBRボックスタンパク質(たとえば、UBR1、UBR2)又はそのUBRボックスドメイン含有タンパク質断片、p62タンパク質又はそのZZドメイン含有断片、及びClpSタンパク質(たとえば、ClpS1、ClpS2)から選択されるN末端則経路タンパク質である。
いくつかの実施形態では、本願のアフィニティー試薬又は認識分子は、ClpSタンパク質、たとえば、アグロバクテリウム・ツミファシエンス(Agrobacterium tumifaciens)ClpS1、アグロバクテリウム・ツミファシエンス(Agrobacterium tumifaciens)ClpS2、シネココッカス・エロンガタス(Synechococcus elongatus)ClpS1、シネココッカス・エロンガタス(Synechococcus elongatus)ClpS2、サーモシネココッカス・エロンガタス(Thermosynechococcus elongatus)ClpS、エシェリキア・コリ(Escherichia coli)ClpS、又はプラスモジウム・ファルシパラム(Plasmodium falciparum)ClpSである。いくつかの実施形態では、認識分子は、L/Fトランスフェラーゼ、たとえば、エシェリキア・コリ(Escherichia coli)ロイシル/フェニルアラニルtRNAタンパク質トランスフェラーゼである。いくつかの実施形態では、認識分子は、D/Eロイシルトランスフェラーゼ、たとえば、ビブリオ・バルニフィカス(Vibrio vulnificus)アスパラギン酸/グルタミン酸ロイシルトランスフェラーゼBptである。いくつかの実施形態では、認識分子は、UBRタンパク質又はUBRボックスドメイン、たとえば、UBRタンパク質又はヒトUBR1及びUBR2若しくはサッカロマイセス・セレビシエ(Saccharomyces cerevisiae)UBR1のUBRボックスドメインである。いくつかの実施形態では、認識分子は、p62タンパク質、たとえば、H.サピエンス(H.sapiens)p62タンパク質又はラタス・ノルベギカス(Rattus norvegicus)p62タンパク質又は最低限でもZZドメインを含むそれらのトランケーション変異体である。いくつかの実施形態では、認識分子は、Gid4タンパク質、たとえば、H.サピエンス(H.sapiens)GID4又はサッカロマイセス・セレビシエ(Saccharomyces cerevisiae)GID4である。いくつかの実施形態では、認識分子は、Gid10タンパク質、たとえば、サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)GID10である。いくつかの実施形態では、認識分子は、N-メリストイルトランスフェラーゼ(N-meristoyltransferase)、たとえば、リーシュマニア・メジャー(Leishmania major)N-メリストイルトランスフェラーゼ(N-meristoyltransferase)又はH.サピエンス(H.sapiens)N-メリストイルトランスフェラーゼ(N-meristoyltransferase)NMT1である。いくつかの実施形態では、認識分子は、BIR2タンパク質、たとえば、ドロソフィラ・メラノガステル(Drosophila melanogaster)BIR2である。いくつかの実施形態では、認識分子は、チロシンキナーゼ又はチロシンキナーゼのSH2ドメイン、たとえば、H.サピエンス(H.sapiens)FynSH2ドメイン、H.サピエンス(H.sapiens)SrcチロシンキナーゼSH2ドメイン、又はそれらの変異体、たとえば、H.サピエンス(H.sapiens)FynSH2ドメイン三重突然変異体スーパーバインダーである。いくつかの実施形態では、認識分子は、抗体又は抗体フラグメント、たとえば、ホスホチロシンに対する一本鎖抗体可変フラグメント(scFv)又は本明細書に記載の他の翻訳後修飾アミノ酸変異体である。
表1は、アミノ酸認識分子の配列例のリストを提供する。また、表1にとくに明記されていない限り、ポリペプチドの末端位置のアミノ酸アイデンティティーに対する各分子のアミノ酸結合優先度も示される。これらの配列及び本明細書に記載の他の例は、非限定的であることが意図され、且つ本願に係る認識分子は、最低限でもペプチド認識を担うドメイン又はサブドメインを含有するそのいずれかのホモログ、変異体、又はそれらの断片を含みうることが認識されるべきである。
Figure 2022507516000002
Figure 2022507516000003
Figure 2022507516000004
Figure 2022507516000005
Figure 2022507516000006
Figure 2022507516000007
それゆえ、いくつかの実施形態では、本願は、表1から選択されるアミノ酸配列を有する(又は表1から選択されるアミノ酸配列に対して少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、80~90%、90~95%、95~99%、若しくはそれ以上のアミノ酸配列同一性を有するアミノ酸配列を有する)アミノ酸認識分子を提供する。いくつかの実施形態では、アミノ酸認識分子は、表1に列挙されるアミノ酸認識分子に対して25~50%、50~60%、60~70%、70~80%、80~90%、90~95%、若しくは95~99%、又はそれ以上のアミノ酸配列同一性を有する。いくつかの実施形態では、アミノ酸認識分子は、修飾アミノ酸認識分子であり、且つ表1に示される配列に対して1つ以上のアミノ酸突然変異を含む。
いくつかの実施形態では、アミノ酸認識分子は、アミノ酸結合以外の1つ以上の機能を提供するタグ配列を含む。たとえば、いくつかの実施形態では、タグ配列は、認識分子のビオチン化(たとえば、ビオチン部分及びビスビオチン部分をはじめとする1つ以上のビオチン分子の取込み)を可能にするビオチンリガーゼ認識配列を含む。タグ配列中の機能配列の追加の例としては、認識分子の精製及び/又は修飾に有用な精製タグ、切断部位、及び他の部分が挙げられる。表2は、末端タグ配列の非限定的配列のリストを提供し、そのうちのいずれか1つ以上は、本願のアミノ酸認識分子のいずれか1つとの組合せで(たとえば、表1に示される配列との組合せで)使用されうる。表2に示されるタグ配列は、非限定的であることが意図され、且つ本願に係る認識分子は、認識分子ポリペプチドのN末端又はC末端にタグ配列(たとえば、Hisタグ及び/又はビオチン化タグ)のいずれか1つ以上を含みうるか、N末端とC末端との間がスプリットされうるか、さもなければ当技術分野で実用されるように他の形で再構成されうることが認識されるべきである。
Figure 2022507516000008
いくつかの実施形態では、本願の認識分子又はアフィニティー試薬はペプチダーゼである。プロテアーゼ又はプロテイナーゼともいわれるペプチダーゼは、ペプチド結合の加水分解を触媒する酵素である。ペプチダーゼは、ポリペプチドをより短い断片に消化するとともに、内部又は末端でそれぞれポリペプチド鎖を切断するエンドペプチダーゼ及びエキソペプチダーゼに一般に分類されうる。いくつかの実施形態では、標識アフィニティー試薬100は、エキソペプチダーゼ活性又はエンドペプチダーゼ活性を不活性化するように修飾されたペプチダーゼを含む。こうして、標識アフィニティー試薬100は、ポリペプチドからアミノ酸を切断することもなく選択的に結合する。さらに他の実施形態では、エキソペプチダーゼ又はエンドペプチダーゼ活性を不活性化するように修飾されていないペプチダーゼが使用されうる。たとえば、いくつかの実施形態では、標識アフィニティー試薬は標識エキソペプチダーゼ102を含む。
本願のある特定の実施形態によれば、タンパク質シーケンシング方法は、ポリペプチドの末端の繰返し検出及び切断を含みうる。いくつかの実施形態では、アミノ酸の検出及び切断の両工程を実施する単一試薬として標識エキソペプチダーゼ102が使用されうる。一般的に描かれるように、いくつかの実施形態では、標識エキソペプチダーゼ102は、ポリペプチドのN末端又はC末端のアミノ酸にそれぞれ選択的に結合してそれを切断するようにアミノペプチダーゼ活性又はカルボキシペプチダーゼ活性を有する。ある特定の実施形態では、標識エキソペプチダーゼ102は、本明細書に記載されるように標識エキソペプチダーゼ102を非切断標識アフィニティー試薬100として使用すべく選択的結合性を保持するように当業者により触媒的に不活性化されうることが認識されるべきである。
エキソペプチダーゼは、一般に、そのアミノ末端の遊離アミノ基又はそのカルボキシ末端の遊離カルボキシル基の少なくとも1つを含むポリペプチド基質を必要とする。いくつかの実施形態では、本願に係るエキソペプチダーゼは、ポリペプチドの末端又はその近くの結合を加水分解する。いくつかの実施形態では、エキソペプチダーゼは、ポリペプチド末端から3残基以下の結合を加水分解する。たとえば、いくつかの実施形態では、エキソペプチダーゼにより触媒される単一加水分解反応は、ポリペプチド末端から単一アミノ酸、ジペプチド、又はトリペプチドを切断する。
いくつかの実施形態では、本願に係るエキソペプチダーゼは、アミノ末端又はカルボキシ末端からそれぞれ単一アミノ酸を切断するアミノペプチダーゼ又はカルボキシペプチダーゼである。いくつかの実施形態では、本願に係るエキソペプチダーゼは、アミノ末端又はカルボキシ末端からそれぞれジペプチドを切断するジペプチジルペプチダーゼ又はペプチジルジペプチダーゼである。さらに他の実施形態では、本願に係るエキソペプチダーゼは、アミノ末端からトリペプチドを切断するトリペプチジルペプチダーゼである。各クラス又はそのサブクラスのペプチダーゼの分類及び活性は、周知であり且つ文献に記載されている(たとえば、グルプリヤ,V.S.(Gurupriya,V.S.)及びロイ,S.C.(Roy,S.C.)著、「男性生殖におけるプロテアーゼ及びプロテアーゼ阻害剤(Proteases and Protease Inhibitors in Male Reproduction)」、プロテアーゼ・イン・フィジオロジー・アンド・パソロジー(Proteases in Physiology and Pathology)、p.195~216、2017年、並びにブリックス,K.(Brix,K.)及びストッカー,W.(Stocker,W.)著、「プロテアーゼ:構造及び機能(Proteases:Structure and Function)」、第1章)を参照されたい)。いくつかの実施形態では、本願に係るペプチダーゼは、ポリペプチド末端から3アミノ酸超を除去する。それゆえ、いくつかの実施形態では、ペプチダーゼは、たとえば、特定位置(たとえば、特定アミノ酸の前又は後)で優先的に切断するエンドペプチダーゼである。いくつかの実施形態では、エンドペプチダーゼ活性のポリペプチド切断産物のサイズは、分析されるポリペプチド内の切断部位(たとえばアミノ酸)の分布に依存するであろう。
本願に係るエキソペプチダーゼは、シーケンシング反応の方向性に基づいて選択又は工学操作されうる。たとえば、ポリペプチドのアミノ末端からカルボキシ末端へのシーケンシングの実施形態では、エキソペプチダーゼはアミノペプチダーゼ活性を含む。逆に、ポリペプチドのカルボキシ末端からアミノ末端へのシーケンシングの実施形態では、エキソペプチダーゼはカルボキシペプチダーゼ活性を含む。特異的カルボキシ末端アミノ酸を認識するとともに標識エキソペプチダーゼとして使用されうるか又は本明細書に記載の非切断標識アフィニティー試薬として使用するように不活性化されうるカルボキシペプチダーゼの例は、文献に記載されている(たとえば、ガルシア-ゲレロ,M.C.(Garcia-Guerrero,M.C.)ら著、2018年、米国科学アカデミー紀要(PNAS)、第115巻、第17号を参照されたい)。
切断試薬及び/又はアフィニティー試薬(たとえば認識分子)として使用するのに好適なペプチダーゼとしては、1タイプ以上のアミノ酸に選択的に結合するアミノペプチダーゼが挙げられる。いくつかの実施形態では、アミノペプチダーゼ認識分子は、アミノペプチダーゼ活性を不活性化するように修飾される。いくつかの実施形態では、アミノペプチダーゼ切断試薬は、ポリペプチドの末端からほとんど又はすべてのタイプのアミノ酸を切断するように非特異的である。いくつかの実施形態では、アミノペプチダーゼ切断試薬は、ポリペプチドの末端の他のタイプのアミノ酸と比較してより効率良くポリペプチドの末端から1タイプ以上のアミノ酸を切断する。たとえば、本願に係るアミノペプチダーゼは、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リシン、メチオニン、フェニルアラニン、プロリン、セレノシステイン、セリン、トレオニン、トリプトファン、チロシン、及び/又はバリンを特異的に切断する。いくつかの実施形態では、アミノペプチダーゼはプロリンアミノペプチダーゼである。いくつかの実施形態では、アミノペプチダーゼはプロリンイミノペプチダーゼである。いくつかの実施形態では、アミノペプチダーゼはグルタミン酸/アスパラギン酸特異的アミノペプチダーゼである。いくつかの実施形態では、アミノペプチダーゼはメチオニン特異的アミノペプチダーゼである。いくつかの実施形態では、アミノペプチダーゼは表3に示されるアミノペプチダーゼである。いくつかの実施形態では、アミノペプチダーゼ切断試薬は表3に示されるペプチド基質を切断する。
いくつかの実施形態では、アミノペプチダーゼは非特異的アミノペプチダーゼである。いくつかの実施形態では、非特異的アミノペプチダーゼは亜鉛メタロプロテアーゼである。いくつかの実施形態では、非特異的アミノペプチダーゼは表4に示されるアミノペプチダーゼである。いくつかの実施形態では、非特異的アミノペプチダーゼは表4に示されるペプチド基質を切断する。
それゆえ、いくつかの実施形態では、本願は、表3若しくは表4から選択されるアミノ酸配列を有する(又は表3若しくは表4から選択されるアミノ酸配列に対して少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、80~90%、90~95%、95~99%、若しくはそれ以上のアミノ酸配列同一性を有するアミノ酸配列を有する)アミノペプチダーゼ(たとえば、アミノペプチダーゼ認識分子、アミノペプチダーゼ切断試薬)を提供する。いくつかの実施形態では、アミノペプチダーゼは、表3又は表4に列挙されるアミノペプチダーゼに対して25~50%、50~60%、60~70%、70~80%、80~90%、90~95%、若しくは95~99%、又はそれ以上のアミノ酸配列同一性を有する。いくつかの実施形態では、アミノペプチダーゼは、修飾アミノペプチダーゼであり、且つ表3又は表4に示される配列に対して1つ以上のアミノ酸突然変異を含む。
Figure 2022507516000009
Figure 2022507516000010
Figure 2022507516000011
Figure 2022507516000012
Figure 2022507516000013
Figure 2022507516000014
Figure 2022507516000015
2つ以上のアミノ酸配列を比較する目的では、第1のアミノ酸配列と第2のアミノ酸配列との間の「配列同一性(sequence identity)」(本明細書では「アミノ酸同一性」ともいう)のパーセントは、[第2のアミノ酸配列中の対応する位置のアミノ酸残基と同一の第1のアミノ酸配列中のアミノ酸残基の数]を[第1のアミノ酸配列中のアミノ酸残基の合計数]で除算して[100]を乗算することにより計算されうる。この場合、第1のアミノ酸配列と比較して第2のアミノ酸配列中のアミノ酸残基の各欠失、挿入、置換、又は付加は、単一アミノ酸残渣(位置)の差とみなされる。代替的に、2つのアミノ酸配列間の配列同一性の程度は、既知のコンピュータアルゴリズムを用いて計算されうる(たとえば、スミス(Smith)及びウォーターマン(Waterman)著、1970年、アドバンシズ・イン・アプライド・マセマティックス(Adv.Appl.Math.)、第2巻、p.482cの局所相同性アルゴリズムにより、ニードルマン(Needleman)及びブンシュ(Wunsch)著、ジャーナル・オブ・モレキュラー・バイオロジー(J.Mol.Biol.)、1970年、第48巻、p.443の相同性アライメントアルゴリズムにより、ピアソン(Pearson)及びリップマン(Lipman)著、米国科学アカデミー紀要(Proc.Natl.Acad.Sci.USA)、1998年、第85巻、p.2444の類似性検索法により、又はブラスト(Blast)、クラスタル(Clustal)、オメガ(Omega)として利用可能なアルゴリズム若しくは他の配列アライメントアルゴリズムをたとえば標準的設定値を用いてコンピュータで実行することにより)。通常、以上で概説した計算方法に従って2つのアミノ酸配列間の「配列同一性」のパーセントを決定する目的では、最大数のアミノ酸残基を有するアミノ酸配列は「第1」のアミノ酸配列とみなされ、他のアミノ酸配列は「第2」のアミノ酸配列とみなされるであろう。
追加的又は代替的に、配列間の同一性に関して2つ以上の配列が評価されうる。2つ以上の核酸配列又はアミノ酸配列との関連での「同一」又はパーセント「同一性」という用語は、同一の2つ以上の配列又はサブ配列を意味する。以上の配列比較アルゴリズムの1つを用いて又は手動アライメント及び目視検査により測定される比較ウィンドウ又は指定領域にわたり比較して最大の対応が得られるようにアライメントしたときに、2つの配列が指定領域にわたり又は全配列にわたり同一(たとえば、少なくとも80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、又は99.9%同一)の特定パーセントのアミノ酸残基又はヌクレオチドを有する場合、2つの配列は「実質的に同一」である。任意選択的に、同一性は、少なくとも約25、50、75、若しくは100アミノ酸長の領域にわたり、又は100~150、150~200、100~200、若しくは200アミノ酸長以上の領域にわたり存在する。
追加的又は代替的に、配列間のアライメントに関して2つ以上の配列が評価されうる。2つ以上の核酸配列又はアミノ酸配列との関連での「アライメント」又はパーセント「アライメント」という用語は、同一の2つ以上の配列又はサブ配列を意味する。以上の配列比較アルゴリズムの1つを用いて又は手動アライメント及び目視検査により測定される比較ウィンドウ又は指定領域にわたり比較して最大の対応が得られるようにアライメントしたときに、2つの配列が指定領域にわたり又は全配列にわたり同一(たとえば、少なくとも80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、又は99.9%同一)の特定パーセントのアミノ酸残基又はヌクレオチドを有する場合、2つの配列は「実質的にアラインメント」させる。任意選択的に、アライメントは、少なくとも約25、50、75、若しくは100アミノ酸長の領域にわたり、又は100~150、150~200、100~200、若しくは200アミノ酸長以上の領域にわたり存在する。
タンパク質分子のほか、核酸分子は、本願に係るアフィニティー試薬(たとえばアミノ酸認識分子)として使用するのに有利なさまざまな性質を有する。
核酸アプタマーは、高親和性且つ選択性で所望の標的に結合するように工学操作された核酸分子である。それゆえ、核酸アプタマーは、当技術分野で公知の選択及び/又は富化技術を用いて所望のタイプのアミノ酸に選択的に結合するように工学操作されうる。そのため、いくつかの実施形態では、アフィニティー試薬は、核酸アプタマー(たとえば、DNAアプタマー、RNAアプタマー)を含む。図1Cに示されるように、いくつかの実施形態では、標識アフィニティー試薬は、1タイプの末端アミノ酸に選択的に結合する標識アプタマー104である。たとえば、いくつかの実施形態では、標識アプタマー104は、本明細書に記載されるように、ポリペプチドの末端の1タイプのアミノ酸(たとえば、単一タイプのアミノ酸又はアミノ酸のタイプのサブセット)に選択的に結合する。示されていないが、標識アプタマー104は、本願の方法に従ってポリペプチドのいずれかの位置(たとえば、ポリペプチドの末端位置又は末端位置及び内部位置)の1タイプのアミノ酸に選択的に結合するように工学操作されうることが認識されるべきである。
いくつかの実施形態では、標識アフィニティー試薬は、結合誘起発光を有する標識を含む。たとえば、いくつかの実施形態では、標識アプタマー106は、ドナー標識112とアクセプター標識114とを含み、図1Cのパネル(I)及び(II)に例示されるように機能する。パネル(I)に描かれるように、遊離分子としての標識アプタマー106は、ドナー標識112及びアクセプター標識114が標識間の検出可能FRETを制限する距離(たとえば約10nm以上)だけ分離されるコンフォメーションをとる。パネル(II)に描かれるように、選択的結合分子としての標識アプタマー106は、ドナー標識112及びアクセプター標識114が標識間の検出可能FRETを促進する距離内(たとえば約10nm以下)にあるコンフォメーションをとる。さらに他の実施形態では、標識アプタマー106は、クエンチング部分を含むとともに分子ビーコンと同様に機能し、標識アプタマー106の発光は、遊離分子として内部クエンチされ、且つ選択的結合分子として回復させる(たとえば、ハマグチ(Hamaguchi)ら著、2001年、アナリティカル・バイオケミストリー(Analytical Biochemistry)、第294巻、p.126~131を参照されたい)。理論により拘束されることを望むものではないが、結合誘起発光のこれらの及び他のタイプの機構は、バックグラウンド発光を有利に低減又は排除して本明細書に記載の方法の全体的感度及び確度を増加させると考えられる。
ポリペプチドの末端アミノ酸の同定方法のほか、本願は、標識アフィニティー試薬を用いたポリペプチドのシーケンシング方法を提供する。いくつかの実施形態では、シーケンシング方法は、ポリペプチド末端を末端アミノ酸検出及び末端アミノ酸切断の繰返しサイクルに付すことを含みうる。たとえば、いくつかの実施形態では、本願は、ポリペプチドと本明細書に記載の1つ以上の標識アフィニティー試薬とを接触させることと、ポリペプチドをエドマン分解に付すことと、を含むポリペプチドのアミノ酸配列の決定方法を提供する。
従来のエドマン分解は、ポリペプチドの末端アミノ酸の修飾及び切断の繰返しサイクルを含み、各逐次切断アミノ酸を同定してポリペプチドのアミノ酸配列を決定する。従来のエドマン分解の例示的例として、ポリペプチドのN末端アミノ酸は、フェニルイソチオシアネート(PITC)を用いて修飾されてPITC誘導体化N末端アミノ酸を形成する。次いで、PITC誘導体化N末端アミノ酸は、酸性条件、塩基性条件、及び/又は昇温を用いて切断される。また、PITC誘導体化N末端アミノ酸を切断する工程は、原生動物トリパノソーマ・クルージ(Trypanosoma cruzi)由来の修飾システインプロテアーゼを用いるとともに中性又は中性に近いpHの相対的によりマイルドな切断条件を含んで酵素的に達成されうることも示されている。有用酵素の非限定的例は、「繰返しポリペプチド分析及び処理のための分子及び方法(MOLECULES AND METHODS FOR ITERATIVE POLYPEPTIDE ANALYSIS AND PROCESSING)」という名称の2016年9月2日出願の米国特許出願第15/255,433号明細書に記載されている。
本願に係る標識アフィニティー試薬を用いたエドマン分解によるシーケンシングの例は、図1Dに描かれる。いくつかの実施形態では、エドマン分解によるシーケンシングは、リンカー124を介して固形担体の表面130に固定される(たとえば、サンプルウェルのボトム又は側壁の表面に固定される)ポリペプチド122を提供することを含む。いくつかの実施形態では、本明細書に記載されるように、ポリペプチド122は、他方の末端が末端アミノ酸の検出及び切断のために遊離するように一方の末端(たとえば、アミノ末端アミノ酸又はカルボキシ末端アミノ酸)で固定される。それゆえ、いくつかの実施形態では、本明細書に記載のエドマン分解法に使用される試薬は、ポリペプチド122の非固定(たとえば遊離)末端の末端アミノ酸と優先的に相互作用する。こうして、ポリペプチド122は、検出及び切断の繰返しサイクルにわたり固定状態を維持する。この目的のために、いくつかの実施形態では、リンカー124は、たとえば、化学切断条件下で表面130からのポリペプチド122の脱離を制限するように、検出及び切断に使用される条件の所望のセットに従って設計されうる。表面にポリペプチドを固定するのに好適のリンカー組成物及び技術は、本明細書の他の箇所に詳細に記載されている。
本願によれば、いくつかの実施形態では、エドマン分解によるシーケンシング方法は、ポリペプチド122と、1タイプ以上の末端アミノ酸に選択的に結合する1つ以上の標識アフィニティー試薬と、を接触させる工程(1)を含む。示されるように、いくつかの実施形態では、標識アフィニティー試薬108は、末端アミノ酸に選択的に結合することによりポリペプチド122と相互作用する。いくつかの実施形態では、工程(1)は、ポリペプチド122の末端アミノ酸(たとえば遊離末端アミノ酸)に選択的に結合しない1つ以上の標識アフィニティー試薬をいずれも除去することをさらに含む。
いくつかの実施形態では、本方法は、標識アフィニティー試薬108を検出することによりポリペプチド122の末端アミノ酸を同定することをさらに含む。いくつかの実施形態では、検出は、標識アフィニティー試薬108からの発光を検出することを含む。本明細書に記載されるように、いくつかの実施形態では、発光は、標識アフィニティー試薬108にユニークに関連付けられ、それにより、発光は、標識アフィニティー試薬108が選択的に結合するアミノ酸のタイプに関連付けられる。したがって、いくつかの実施形態では、アミノ酸のタイプは、標識アフィニティー試薬108の1つ以上の発光性を決定することにより同定される。
いくつかの実施形態では、エドマン分解によるシーケンシング方法は、ポリペプチド122の末端アミノ酸を除去する工程(2)を含む。いくつかの実施形態では、工程(2)は、ポリペプチド122から標識アフィニティー試薬108(たとえば、末端アミノ酸に選択的に結合する1つ以上の標識アフィニティー試薬のいずれか)を除去することを含む。いくつかの実施形態では、工程(2)は、末端アミノ酸とイソチオシアネート(たとえばPITC)とを接触させることによりポリペプチド122の末端アミノ酸(たとえば遊離末端アミノ酸)を修飾してイソチオシアネート修飾末端アミノ酸を形成することを含む。いくつかの実施形態では、イソチオシアネート修飾末端アミノ酸は、非修飾末端アミノ酸よりも切断試薬(たとえば、化学切断試薬又は酵素切断試薬)による除去に対して感受性がある。
いくつかの実施形態では、工程(2)は、ポリペプチド122と、イソチオシアネート修飾末端アミノ酸に特異的に結合してそれを切断するプロテアーゼ140と、を接触させることにより末端アミノ酸を除去することを含む。いくつかの実施形態では、プロテアーゼ140は、修飾システインプロテアーゼを含む。いくつかの実施形態では、プロテアーゼ140は、トリパノソーマ・クルージ(Trypanosoma cruzi)由来のシステインプロテアーゼなどの修飾システインプロテアーゼを含む(たとえば、ボルゴ(Borgo)ら著、2015年、プロテイン・サイエンス(Protein Science)、第24巻、p.571~579を参照されたい)。さらに他の実施形態では、工程(2)は、ポリペプチド122をイソチオシアネート修飾末端アミノ酸を切断するのに十分な化学条件(たとえば、塩基性、酸性)に付すことにより末端アミノ酸を除去することを含む。
いくつかの実施形態では、エドマン分解によるシーケンシング方法は、末端アミノ酸切断後にポリペプチド122を洗浄する工程(3)を含む。いくつかの実施形態では、洗浄することは、プロテアーゼ140を除去することを含む。いくつかの実施形態では、洗浄することは、ポリペプチド122に対して中性pH条件を回復することを含む(たとえば、酸性又は塩基性条件による化学切断の後)。いくつかの実施形態では、エドマン分解によるシーケンシング方法は、複数サイクルにわたり工程(1)~(3)を繰り返すことを含む。
エドマン分解によるシーケンシング方法例は、図1Eに示される。いくつかの実施形態では、ポリペプチドの複合混合物(たとえば、タンパク質の混合物)を含有するサンプルは、通常の酵素を用いておおよそ6~40アミノ酸の短いポリペプチド断片に分解可能である。いくつかの実施形態では、本願の方法に係るこのポリペプチドライブラリーのシーケンシングは、元の複合混合物中に存在するポリペプチドの各々のアイデンティティー及び存在量を明らかにするであろう。本明細書及び文献に記載されるように、6~40アミノ酸のサイズ範囲内のほとんどのポリペプチドは、ポリペプチド鎖内のちょうど4アミノ酸の数及び位置を決定することによりユニークに同定可能である。
それゆえ、いくつかの実施形態では、エドマン分解によるシーケンシング方法は、各タイプが異なるN末端アミノ酸を認識する4つのDNAアプタマータイプを含む標識アプタマー150のセットを用いて実施されうる。各アプタマータイプは、異なるアプタマータイプを1つ以上の発光性に基づいて区別できるように異なる発光標識で標識されうる。例示を目的として、標識アプタマー150のセット例は、第1の発光標識(「色素1」)で標識されたシステイン特異的アプタマーと、第2の発光標識(「色素2」)で標識されたリシン特異的アプタマーと、第3の発光標識(「色素3」)で標識されたトリプトファン特異的アプタマーと、第4の発光標識(「色素4」)で標識されたグルタミン酸特異的アプタマーと、を含む。
いくつかの実施形態では、本願に係るエドマン分解によるシーケンシング方法は、図1Eに示されるプロセス152に従って進行する。いくつかの実施形態では、工程(1)の前、ポリペプチドライブラリーからの単一ポリペプチド分子は、固形担体の表面に、たとえば、サンプルウェルのアレイのサンプルウェルのボトム又は側壁の表面に固定される。いくつかの実施形態では、本明細書の他の箇所に記載されるように、表面固定を可能にする部分(たとえばビオチン)又は溶解性を改善する部分(たとえばオリゴヌクレオチド)は、ポリペプチドのC末端に化学的又は酵素的に装着されうる。各ポリペプチドの配列を決定するために、いくつかの実施形態では、固定ポリペプチドは、プロセス152により例示されるようにN末端アミノ酸検出及びN末端アミノ酸切断の繰返しサイクルに付される。いくつかの実施形態では、プロセス152は、自動流体システムを用いてフローセルの検出表面上への注入により実施される試薬添加及び洗浄の工程を含む。いくつかの実施形態では、工程(1)~(4)は、標識アプタマー150を用いた検出及び切断の1サイクルを例示する。
いくつかの実施形態では、プロセス152に係るエドマン分解によるシーケンシング方法は、4つの直交標識DNAアプタマーの混合物中で流動させてN末端に4つの適正アミノ酸の1つを含有するいずれかの固定ポリペプチド(たとえば、アレイのサンプルウェル内に固定されたポリペプチド)へのアプタマーの結合を可能にするようにインキュベートする工程(1)を含む。いくつかの実施形態では、本方法は、固定ポリペプチドを洗浄して非結合アプタマーを除去することをさらに含む。いくつかの実施形態では、本方法は、固定ポリペプチドをイメージングすること(「イメージング工程1」)をさらに含む。いくつかの実施形態では、取得画像は、アプタマー結合ポリペプチドの位置(たとえば、サンプルウェルのアレイ内の位置)及び4つのアプタマーのどれが各位置に結合されるかを決定するのに十分な情報を含有する。いくつかの実施形態では、本方法は、固定ポリペプチドからアプタマーを除去するために適切な緩衝液を用いて固定ポリペプチドを洗浄することをさらに含む。
いくつかの実施形態では、プロセス152に係るシーケンシング方法は、N末端アミン基を特異的に修飾する反応性分子(たとえば、示されるPITC)を含有する溶液中で流動させる工程(2)を含む。PITCなどのイソチオシアネート分子は、いくつかの実施形態では、トリパノソーマ・クルージ(Trypanosoma Cruzi)由来のシステインプロテアーゼクルザインなどの修飾プロテアーゼによる切断に対する基質になるようにN末端アミノ酸を修飾する。
いくつかの実施形態では、プロセス152に係るシーケンシング方法は、修飾N末端アミノ酸を認識してそれを固定ポリペプチドから切断する好適な修飾プロテアーゼ中で流動させる前に固定ポリペプチドを洗浄する工程(3)を含む。いくつかの実施形態では、本方法は、酵素切断の後に固定ポリペプチドを洗浄する工程(4)を含む。いくつかの実施形態では、工程(1)~(4)は、エドマン分解の1サイクルを描く。それゆえ、示される工程(1’)は、工程(1)~(4)に対して以上に記載されるように実施される工程(1’)~(4’)として進行するその次の反応サイクルの開始である。いくつかの実施形態では、工程(1)~(4)は、おおよそ20~40サイクル繰り返される。
いくつかの実施形態では、標識イソチオシアネート(たとえば色素標識PITC)は、サンプルローディングをモニターするために使用されうる。たとえば、いくつかの実施形態では、ポリペプチドサンプルをプロセス152に示されるシーケンシング方法に付す前、ポリペプチドサンプルは、色素標識PITCを用いて末端修飾により末端が発光標識でプレコンジュゲートされる。こうして、サンプルウェルのアレイへのポリペプチドサンプルのローディングは、プロセス152の開始前に標識からの発光を検出することによりモニターされうる。いくつかの実施形態では、発光は、アレイ中のサンプルウェルの単一占有(たとえば、単一ポリペプチド分子を含有するサンプルウェルの一部)を決定するために使用されるとともに、これにより所与のサンプルで確実に得られる情報量を有利に増加させうる。所望のサンプルローディング状態が発光により決定されたら、プロセス152は、工程(1)を進める前に記載のように化学切断又は酵素切断により開始されうる。
いくつかの実施形態では、標識イソチオシアネート(たとえば色素標識PITC)は、アレイ中のポリペプチドサンプルの反応進行をモニターするために使用されうる。たとえば、いくつかの実施形態では、工程(2)は、サンプル中のポリペプチドのN末端アミン基を特異的に修飾及び標識する色素標識PITCを含有する溶液中で流動させることを含む。いくつかの実施形態では、標識からの発光は、サンプル中のポリペプチドのN末端PITC修飾を評価する工程(2)時又はその後に検出されうる。それゆえ、いくつかの実施形態では、発光は、工程(2)から工程(3)に進むか又はいつ進むかを決定するために使用される。いくつかの実施形態では、標識からの発光は、工程(3)から工程(4)に進むか又はいつ進むかを決定するためにサンプル中のポリペプチドのN末端アミノ酸切断を評価する工程(3)時又はその後に検出されうる。
プロセス152に係るシーケンシング方法は、ポリペプチドの末端アミノ酸の検出及び切断のために個別試薬を利用する。それにもかかわらず、いくつかの態様では、本願は、ポリペプチドの末端アミノ酸を検出及び切断するためにペプチダーゼを含む単一試薬を使用しうるシーケンシング方法を提供する。図2は、各標識エキソペプチダーゼが異なるタイプの末端アミノ酸に選択的に結合してそれを切断する標識エキソペプチダーゼ200のセットを用いたポリペプチドシーケンシングの例を示す。
図2の例に一般的に例示されるように、標識エキソペプチダーゼ200は、第1の発光標識を含むリシン特異的エキソペプチダーゼと、第2の発光標識を含むグリシン特異的エキソペプチダーゼと、第3の発光標識を含むアスパラギン酸特異的エキソペプチダーゼと、第4の発光標識を含むロイシン特異的エキソペプチダーゼと、を含む。本明細書に記載のある特定の実施形態によれば、標識エキソペプチダーゼ200の各々は、そのそれぞれのアミノ酸にそのアミノ酸がポリペプチドのアミノ末端又はカルボキシ末端にあるときのみ選択的に結合してそれを切断する。それゆえ、このアプローチによるシーケンシングは一方の末端から他方の末端に進むので、標識エキソペプチダーゼ200は、セットのすべての試薬がアミノペプチダーゼ活性又はカルボキシペプチダーゼ活性のどちらかを有するように工学操作又は選択される。
図2にさらに示されるように、プロセス202は、標識エキソペプチダーゼ200を用いたリアルタイムシーケンシング反応を模式的に例示する。パネル(I)~(IX)は、各パネルに描かれるイベントに対応して下に示されるシグナル出力との関連でポリペプチドの末端での繰返し検出及び切断を含むイベントの進行を例示する。例示を目的として、「KLDG...」の任意に選択されたアミノ酸配列を有するポリペプチドが示される(一方の末端から他方の末端に向けて進む)。
パネル(I)は、ポリペプチドがサンプルウェルのボトムや側壁の表面などの固形担体の表面に固定されるシーケンシング反応の開始を描く。いくつかの実施形態では、本願に係るシーケンシング方法は、リアルタイムの単一分子シーケンシングを含む。いくつかの実施形態では、サンプルウェルのアレイで複数の単一分子シーケンシング反応が同時に実施される。かかる実施形態では、ポリペプチド固定は、単一分子分析のためにポリペプチドをサンプルウェル内にアンカーすることによりサンプルウェルからのポリペプチドの拡散を防止する。
パネル(II)は、標識アフィニティー試薬200のセットからのリシン特異的エキソペプチダーゼがポリペプチドの末端リシン残基に選択的に結合する検出イベントを描く。パネル(I)及び(II)の下のシグナルトレースに示されるように、シグナル出力は、シグナル強度の増加を表示することによりこの結合イベントに関して報告するとともに、リシン特異的エキソペプチダーゼの発光標識を同定することにより末端アミノ酸を同定するために使用されうる。パネル(III)は、末端アミノ酸に選択的に結合した後に標識ペプチダーゼが末端アミノ酸を切断することを例示する。結果として、この成分は、発光検出用観測領域から離れるように自由に拡散するとともに、パネル(III)の下のトレースに示されるようにシグナル強度の低下によりシグナル出力に報告される。パネル(IV)~(IX)は、パネル(I)~(III)に対して記載されるのと同様にプロセスを進行する。すなわち、標識エキソペプチダーゼは、対応する末端アミノ酸に結合してそれを切断することによりシグナル出力の対応する増加及び減少をそれぞれ生成する。
いくつかの態様では、本願は、末端アミノ酸と標識アミノ酸認識分子(たとえば標識アフィニティー試薬)及び標識切断試薬(たとえば標識非特異的エキソペプチダーゼ)との結合相互作用を評価することによるリアルタイムのポリペプチドシーケンシング方法を提供する。図3Aは、離散結合イベントがシグナル出力300のシグナルパルスを生成するシーケンシング方法の例を示す。図3Aのインセットパネルは、このアプローチによるリアルタイムシーケンシングの一般的スキームを例示する。示されるように、標識アフィニティー試薬310は、末端アミノ酸(ここではリシンとして示される)に選択的に会合(たとえば結合)するとともにそれから解離することにより、末端アミノ酸を同定するために使用されうるシグナル出力300中の一連のパルスを生成する。いくつかの実施形態では、一連のパルスは、対応する末端アミノ酸のアイデンティティーの診断でありうるパルシングパターン(たとえば特性パターン)を提供する。
理論により拘束されることを望むものではないが、標識アフィニティー試薬310は、結合の会合速度又は「オン」速度(kon)と結合の解離速度又は「オフ」速度(koff)とにより規定される結合アフィニティー(KD)に従って選択的に結合する。速度定数koff及びkonは、それぞれ、パルス持続時間(たとえば、検出可能結合イベントに対応する時間)及びパルス間持続時間(たとえば、検出可能結合イベント間の時間)のクリティカル決定因子である。いくつかの実施形態では、これらの速度は、最良シーケンシング確度を与えるパルス持続時間及びパルス速度(たとえばシグナルパルス周波数)を達成するように工学操作可能である。
インセットパネルに示されるように、シーケンシング反応混合物は、標識アフィニティー試薬310のものとは異なる発光標識を含む標識非特異的エキソペプチダーゼ320をさらに含む。いくつかの実施形態では、標識非特異的エキソペプチダーゼ320は、標識アフィニティー試薬310のもの未満の濃度で混合物中に存在する。いくつかの実施形態では、標識非特異的エキソペプチダーゼ320は、ほとんど又はすべてのタイプの末端アミノ酸を切断するように広範な特異性を呈する。それゆえ、動的シーケンシングアプローチは、エキソペプチダーゼ切断活性により触媒される分解反応の過程全体にわたりポリペプチドの末端に結合するアフィニティー試薬をモニターすることを含みうる。
シグナル出力300の進行により例示されるように、いくつかの実施形態では、標識非特異的エキソペプチダーゼ320による末端アミノ酸切断は、シグナルパルスを生成し、且つこれらのイベントは、標識アフィニティー試薬310の結合パルスよりも低い周波数で起こる。こうして、ポリペプチドのアミノ酸は、リアルタイムシーケンシングプロセスで計数及び/又は同定されうる。シグナル出力300にさらに例示されるように、いくつかの実施形態では、対応する末端アミノ酸を同定するために使用されうる診断パルシングパターン(たとえば特性パターン)を各々有する複数の標識アフィニティー試薬が使用されうる。たとえば、いくつかの実施形態では、異なる特性パターン(シグナル出力300中のリシン、フェニルアラニン、及びグルタミンの各々により例示される)は、1つ超の標識アフィニティー試薬と異なるタイプの末端アミノ酸との会合に対応する。本明細書に記載されるように、1タイプ超のアミノ酸に会合する単一アフィニティー試薬が本願に従って使用されうることが認識されるべきである。それゆえ、いくつかの実施形態では、異なる特性パターンは、1つの標識アフィニティー試薬と異なるタイプの末端アミノ酸との会合に対応する。
本明細書に記載されるように、シグナルパルス情報は、一連のシグナルパルス中の特性パターンに基づいてアミノ酸を同定するために使用されうる。いくつかの実施形態では、特性パターンは、各シグナルパルスがパルス持続時間を含む複数のシグナルパルスを含む。いくつかの実施形態では、複数のシグナルパルスは、特性パターン中のパルス持続時間の分布の要約統計(たとえば、平均、メジアン、時間減衰定数)により特徴付けられうる。いくつかの実施形態では、特性パターンの平均パルス持続時間は、約1ミリ秒間~約10秒間(たとえば、約1ms~約1s、約1ms~約100ms、約1ms~約10ms、約10ms~約10s、約100ms~約10s、約1s~約10s、約10ms~約100ms、又は約100ms~約500ms)である。いくつかの実施形態では、単一ポリペプチド中の異なるタイプのアミノ酸に対応する異なる特性パターンは、要約統計の統計的有意差に基づいて互いに識別されうる。たとえば、いくつかの実施形態では、1つの特性パターンは、少なくとも10ミリ秒間(たとえば、約10ms~約10s、約10ms~約1s、約10ms~約100ms、約100ms~約10s、約1s~約10s、又は約100ms~約1s)の平均パルス持続時間差に基づいて他の特徴パターンから識別可能でありうる。いくつかの実施形態では、異なる特性パターン間の平均パルス持続時間差が小さくなるほど、統計学的信頼度で互いを区別するために各特性パターン内により多数のパルス持続時間を必要としうることが認識されるべきである。
以上に詳述したように、図3Aにより例示されるリアルタイムシーケンシングプロセスは、一般に、末端アミノ酸認識及び末端アミノ酸切断のサイクルを含みうるとともに、認識及び切断の相対発生は、標識アフィニティー試薬310と標識非特異的エキソペプチダーゼ320との間の濃度差により制御可能である。いくつかの実施形態では、濃度差は、個別アミノ酸の認識時に検出されるシグナルパルス数が同定に関して所望の信頼区間を提供するように最適化可能である。たとえば、初期シーケンシング反応が切断イベント間のシグナルパルスの少なすぎるシグナルデータを提供して所望の信頼区間で特性パターンの決定ができない場合、シーケンシング反応は、アフィニティー試薬と比べて減少した濃度の非特異的エキソペプチダーゼを用いて繰返し可能である。
いくつかの実施形態では、本願に係るポリペプチドシーケンシングは、ポリペプチドと、1つ以上のアミノ酸認識分子(たとえばアフィニティー試薬)及び/又は1つ以上の切断試薬(たとえばエキソペプチダーゼ)を含むシーケンシング反応混合物と、を接触させることにより行われうる。いくつかの実施形態では、シーケンシング反応混合物は、約10nM~約10μMの濃度のアミノ酸認識分子を含む。いくつかの実施形態では、シーケンシング反応混合物は、約500nM~約500μMの濃度の切断試薬を含む。
いくつかの実施形態では、シーケンシング反応混合物は、約100nM~約10μM、約250nM~約10μM、約100nM~約1μMの、約250nM~約1μMの、約250nM~約750nM、又は約500nM~約1μMの濃度のアミノ酸認識分子を含む。いくつかの実施形態では、シーケンシング反応混合物は、約100nM、約250nM、約500nM、約750nM、又は約1μMの濃度のアミノ酸認識分子を含む。
いくつかの実施形態では、シーケンシング反応混合物は、約500nM~約250μM、約500nM~約100μM、約1μM~約100μM、約500nM~約50μM、約1μM~約100μM、約10μM~約200μM、又は約10μM~約100μMの濃度の切断試薬を含む。いくつかの実施形態では、シーケンシング反応混合物は、1μM、約5μM、約10μM、約30μM、約50μM、約70μM、又は約100μMの濃度の切断試薬を含む。
いくつかの実施形態では、シーケンシング反応混合物は、約10nM~約10μMの濃度のアミノ酸認識分子と、約500nM~約500μMの濃度の切断試薬と、を含む。いくつかの実施形態では、シーケンシング反応混合物は、約100nM~約1μMの濃度のアミノ酸認識分子と、約1μM~約100μMの濃度の切断試薬と、を含む。いくつかの実施形態では、シーケンシング反応混合物は、約250nM~約1μMの濃度のアミノ酸認識分子と、約10μM~約100μMの濃度の切断試薬と、を含む。いくつかの実施形態では、シーケンシング反応混合物は、約500nMの濃度のアミノ酸認識分子と、約25μM~約75μMの濃度の切断試薬と、を含む。
いくつかの実施形態では、シーケンシング反応混合物は、約500:1、約400:1、約300:1、約200:1、約100:1、約75:1、約50:1、約25:1、約10:1、約5:1、約2:1、又は約1:1の比でアミノ酸認識分子と切断試薬とを含む。いくつかの実施形態では、シーケンシング反応混合物は、約10:1~約200:1の比でアミノ酸認識分子と切断試薬とを含む。いくつかの実施形態では、シーケンシング反応混合物は、約50:1~約150:1の比でアミノ酸認識分子と切断試薬とを含む。
図3Aにより例示される例は、標識切断試薬を用いたシーケンシングプロセスに関するが、シーケンシングプロセスは、この点に限定されることが意図されるものではない。本明細書の他の箇所に記載されるように、本発明者らは、非標識切断試薬を用いた単一分子シーケンシングを実証した。いくつかの実施形態では、切断試薬が逐次末端アミノ酸を除去する近似周波数は、たとえば使用される酵素の公知の活性及び/又は濃度に基づいて分かる。いくつかの実施形態では、試薬による末端アミノ酸切断は、たとえばアミノ酸認識で検出されるシグナル又は検出されるシグナルの欠如に基づいて推測される。本発明者らは、記載の濃度差アプローチとの組合せで又はその代わりに使用されうるリアルタイムシーケンシング反応のさらなる制御技術を認識した。
温度依存リアルタイムシーケンシングプロセスの例は、図3Bに示される。パネル(I)~(III)は、温度依存末端アミノ酸認識及び末端アミノ酸切断のサイクルを含むシーケンシング反応を例示する。シーケンシング反応の各サイクルは、2つの温度範囲、すなわち、エキソペプチダーゼ活性よりもアフィニティー試薬活性に最適な(たとえば、末端アミノ酸認識を促進する)第1の温度範囲(「T」)及びアフィニティー試薬活性よりもエキソペプチダーゼ活性に最適な(たとえば、末端アミノ酸切断を促進する)第2の温度範囲(「T」)にわたり行われる。シーケンシング反応は、第1の温度範囲T(アミノ酸認識を開始する)と第2の温度範囲T(アミノ酸切断を開始する)との間で反応混合物温度を切り替えることにより進行する。それゆえ、温度依存シーケンシングプロセスの進行は、温度により制御可能であるとともに、異なる温度範囲間(たとえば、TとTとの間)で切り替えることは、手動又は自動プロセスを介して行われうる。いくつかの実施形態では、第1の温度範囲T内のアフィニティー試薬活性(たとえば、アミノ酸に対する結合アフィニティー(KD))は、第2の温度範囲Tと比較して少なくとも10倍、少なくとも100倍、少なくとも1,000倍、少なくとも10,000倍、少なくとも100,000倍、又はそれ以上に増加される。いくつかの実施形態では、第2の温度範囲T内のエキソペプチダーゼ活性(たとえば、切断産物への基質変換速度)は、第1の温度範囲Tと比較して少なくとも2倍、10倍、少なくとも25倍、少なくとも50倍、少なくとも100倍、少なくとも1,000倍、又はそれ以上に増加される。
いくつかの実施形態では、第1の温度範囲Tは第2の温度範囲T未満である。いくつかの実施形態では、第1の温度範囲Tは、約15℃~約40℃(たとえば、約25℃~約35℃、約15℃~約30℃、約20℃~約30℃)である。いくつかの実施形態では、第2の温度範囲Tは、約40℃~約100℃(たとえば、約50℃~約90℃、約60℃~約90℃、約70℃~約90℃)である。いくつかの実施形態では、第1の温度範囲Tは、約20℃~約40℃(たとえば、おおよそ30℃)であり、且つ第2の温度範囲Tは、約60℃~約100℃(たとえば、おおよそ80℃)である。
いくつかの実施形態では、第1の温度範囲Tは第2の温度範囲T超である。いくつかの実施形態では、第1の温度範囲Tは、約40℃~約100℃(たとえば、約50℃~約90℃、約60℃~約90℃、約70℃~約90℃)である。いくつかの実施形態では、第2の温度範囲Tは、約15℃~約40℃(たとえば、約25℃~約35℃、約15℃~約30℃、約20℃~約30℃)である。いくつかの実施形態では、第1の温度範囲Tは、約60℃~約100℃(たとえば、おおよそ80℃)であり、且つ第2の温度範囲Tは、約20℃~約40℃(たとえば、おおよそ30℃)である。
パネル(I)は、エキソペプチダーゼ活性よりもアフィニティー試薬活性に最適な第1の温度範囲T内の温度でのシーケンシング反応混合物を描く。例示を目的として、アミノ酸配列「KFVAG...」のポリペプチドが示される。反応混合物温度が第1の温度範囲T内にあるとき、混合物中の標識アフィニティー試薬は、活性化(たとえば復元)されてポリペプチド末端に会合することによりアミノ酸認識を開始する。また、第1の温度範囲T内では、混合物中の標識エキソペプチダーゼは、不活性化(たとえば変性)されて認識時のアミノ酸切断を防止する。パネル(I)では、第1のアフィニティー試薬は、ポリペプチド末端のリシンに可逆的に会合して示され、一方、標識エキソペプチダーゼ(たとえば、PfuアミノペプチダーゼI(Pfu API))は、変性されて示される。いくつかの実施形態では、アミノ酸認識は、アミノ酸の切断を開始する前にあらかじめ決められた持続時間にわたり行われる。いくつかの実施形態では、アミノ酸認識は、アミノ酸の切断を開始する前に同定に関して所望の信頼区間を達成するのに必要とされる持続時間にわたり行われる。アミノ酸認識後、反応は、混合物の温度を第2の温度範囲T内に変化させることにより進行する。
パネル(II)は、アフィニティー試薬活性よりもエキソペプチダーゼ活性に最適な第2の温度範囲T内の温度でのシーケンシング反応混合物を描く。この例の例示目的では、第2の温度範囲Tは、第1の温度範囲T超であるが、試薬活性は、いずれかの所望の温度範囲にも最適化されうることが認識されるべきである。それゆえ、パネル(I)からパネル(II)への進行は、好適な熱源を用いて反応混合物温度を上昇させることにより行われる。反応混合物が第2の温度範囲T内の温度に達するとき、混合物中の標識エキソペプチダーゼは、活性化(たとえば復元)されてエキソペプチダーゼ活性による末端アミノ酸切断を開始する。また、第2の温度範囲T内では、混合物中の標識アフィニティー試薬は、不活性化(たとえば変性)されて切断時のアミノ酸認識を防止する。パネル(II)では、標識エキソペプチダーゼは、末端リシン残基を切断するように示され、一方、標識アフィニティー試薬は変性される。いくつかの実施形態では、アミノ酸切断は、ポリペプチド末端での逐次アミノ酸の認識を開始する前にあらかじめ決められた持続時間にわたり行われる。いくつかの実施形態では、アミノ酸切断は、逐次アミノ酸の認識を開始する前に切断を検出するのに必要とされる持続時間にわたり行われる。アミノ酸切断後、反応は、混合物の温度を第1の温度範囲T内に変化させることにより進行する。
パネル(III)は、反応混合物温度が低減されて第1の温度範囲T内に戻ったシーケンシング反応時のその次のサイクルの始まりを描く。それゆえ、この例では、パネル(II)からパネル(III)への進行は、熱源から反応混合物を除去するか、さもなければ反応混合物を第1の温度範囲T内に冷却する(たとえば、能動的又は受動的に)ことにより、行うことが可能である。示されるように、ポリペプチド末端のフェニルアラニンに可逆的に会合する第2のアフィニティー試薬を含めて標識アフィニティー試薬は復元され、一方、標識エキソペプチダーゼは変性されて示される。シーケンシング反応は、この例により例示されるように、アミノ酸認識とアミノ酸切断との間で温度依存的にさらにサイクルすることにより継続する。
それゆえ、動的シーケンシングアプローチは、反応混合物中の1つ以上のタンパク質のタンパク質活性又は機能のレベルで制御される反応サイクリングを含みうる。図3Bに描かれ且つ以上に記載される温度依存ポリペプチドシーケンシングプロセスは、条件依存認識及び切断の制御可能サイクリングによるポリペプチドシーケンシングへの一般的アプローチを例示しうることが認識されるべきである。たとえば、いくつかの実施形態では、本願は、発光活性化試薬を用いた発光依存シーケンシングプロセスを提供する。いくつかの実施形態では、発光依存シーケンシングプロセスは、発光依存アミノ酸認識及び切断のサイクルを含む。シーケンシング反応の各サイクルは、シーケンシング反応混合物を2つの異なる発光条件、すなわち、エキソペプチダーゼ活性よりもアフィニティー試薬活性に最適な(たとえば、アミノ酸認識を促進する)第1の発光条件及びアフィニティー試薬活性よりもエキソペプチダーゼ活性に最適な(たとえば、アミノ酸切断を促進する)第2の発光条件に暴露することにより行われうる。シーケンシング反応は、反応混合物を第1の発光条件に暴露する(アミノ酸認識を開始する)ことと、反応混合物を第2の発光条件に暴露する(アミノ酸切断を開始する)ことと、を切り替えることにより進行する。限定されるものではないが例として、いくつかの実施形態では、2つの異なる発光条件は、第1の波長及び第2の波長を含む。
いくつかの態様では、本願は、1つ以上の標識アフィニティー試薬と末端及び内部アミノ酸との結合相互作用と、標識非特異的エキソペプチダーゼと末端アミノ酸との結合相互作用と、を評価することにより、リアルタイムのポリペプチドシーケンシング方法を提供する。図4は、図3A~3Bのアプローチで記載及び例示された方法が、末端位置及び内部位置の両方の1タイプのアミノ酸(ここではリシンとして示される)に選択的に結合してそれから解離する標識アフィニティー試薬410を用いることにより、修正されたシーケンシング方法の例を示す(図4のインセットパネル)。前のアプローチに記載のように、選択的結合は、シグナル出力400中に一連のパルスを生成する。しかしながら、この手法では、一連のパルスは、ポリペプチド全体にわたるアミノ酸のタイプの数により決定される速度で発生する。それゆえ、いくつかの実施形態では、結合イベントに対応しているパルシング速度は、ポリペプチド中にその時点で存在するコグネイトアミノ酸の数の診断になるであろう。
前のアプローチと同様に、標識非特異的ペプチダーゼ420は、たとえば、切断イベント間の最適時間ウィンドウを与えるように標識アフィニティー試薬410よりも相対的に低濃度で存在するであろう(図4のインセットパネル)。そのほか、ある特定の実施形態では、標識非特異的ペプチダーゼ420のユニーク同定可能発光標識は、切断イベントがいつ発生したかを表すであろう。ポリペプチドが繰返し切断を受けるので、標識アフィニティー試薬410による結合に対応するパルシング速度は、末端アミノ酸が標識非特異的ペプチダーゼ420によりいつ切断されてもステップワイズに低下するであろう。この概念は、矢印により表される時間で切断イベントを有して時間の関数としてパルス速度を一般に描くプロット402により例示される。そのため、いくつかの実施形態では、切断イベント間で検出されるパターン内に発生するパルシングパターン及び/又はパルシング速度に基づくこのアプローチにより、アミノ酸が同定されうるとともにそれによりポリペプチドがシーケンスされうる。
いくつかの実施形態では、末端ポリペプチド配列情報(たとえば、本明細書に記載されるように決定される)は、1つ以上の他の情報源から得られるポリペプチド配列情報と組合せ可能である。たとえば、末端ポリペプチド配列情報は、内部ポリペプチド配列情報と組合せ可能である。いくつかの実施形態では、内部ポリペプチド配列情報は、本明細書に記載されるように、内部アミノ酸に会合する1つ以上のアミノ酸認識分子を用いて得ることが可能である。内部又は他のポリペプチド配列情報は、ポリペプチド分解プロセスの前又はその時に得ることが可能である。いくつかの実施形態では、これらの方法から得られる配列情報は、他の技術を用いたポリペプチド配列情報、たとえば、1つ以上の内部アミノ酸認識分子を用いて得られる配列情報と組合せ可能である。
シールド認識分子(Shielded Recognition Molecules)
本明細書に記載の実施形態によれば、単一分子ポリペプチドシーケンシング方法は、励起光で表面固定ポリペプチドに照明することと、アミノ酸認識分子(たとえば標識アフィニティー試薬)に装着された標識により生成される発光を検出することと、により行うことが可能である。いくつかの場合には、標識により生成される放射及び/又は非放射減衰は、ポリペプチドに光損傷をもたらしうる。たとえば、図5Aは、表面に固定されたポリペプチドに認識分子が会合して示されるシーケンシング反応例を例示する。
励起照明の存在下で、標識は、検出可能会合イベントをもたらす放射減衰を介して蛍光を生成可能である。しかしながら、いくつかの場合には、標識は、反応性酸素種500の形成をもたらす可能性のある非放射減衰を生成する。反応性酸素種500は、最終的に固定ペプチドを損傷する可能性があり、その場合、ポリペプチドの完全配列情報を得る前に反応が終了することになる。この光損傷は、たとえば、露出ポリペプチド末端(トップの中抜き矢印)、内部位置(中間の中抜き矢印)、表面にポリペプチドを装着する表面リンカー(ボトムの中抜き矢印)で発生する可能性がある。
本発明者らは、光損傷を軽減可能であり且つアミノ酸認識分子へのシールディングエレメントの取込みにより認識時間を延長可能であることを見いだした。図5Bは、シールド502を含むシールド認識分子を用いたシーケンシング反応例を例示する。シールド502は、標識とポリペプチドとの間の距離の増加を提供する共有結合性又は非共有結合性連結基を形成するので、標識-ポリペプチド分離距離にわたるフリーラジカル減衰に起因して反応性酸素種500からの損傷作用を低減可能である。シールド502はまた、反応性酸素種500並びに放射及び/又は非放射減衰からの損傷を吸収することにより標識からポリペプチドをシールドする立体バリアを提供可能である。
理論により拘束されることを望むものではないが、認識成分と標識成分との間に位置決めされるシールドは、標識成分により放出される放射及び/又は非放射減衰を吸収、偏向、さもなければブロックできると考えられる。いくつかの実施形態では、シールドは、1つ以上の標識(たとえば発光標識)と1つ以上のアミノ酸認識分子との相互作用を防止又は制限する。いくつかの実施形態では、シールドは、1つ以上の標識とアミノ酸認識分子に会合する1つ以上の分子(たとえば、認識分子に会合するポリペプチド)との相互作用を防止又は制限する。それゆえ、いくつかの実施形態では、シールドという用語は、認識成分と標識成分との間に形成される連結基のいずれかの部分により提供される保護効果又はシールディング効果を一般に意味しうる。
いくつかの実施形態では、シールドは、1つ以上のアミノ酸認識分子(たとえば認識成分)と1つ以上の標識(たとえば標識成分)とに装着される。いくつかの実施形態では、認識成分及び標識成分は、シールド上の非近接部位に装着される。たとえば、1つ以上のアミノ酸認識分子は、シールドの第1の側に装着可能であり、且つ1つ以上の標識は、シールドの第2の側に装着可能であり、この場合、シールドの第1及び第2の側は互いに離れている。いくつかの実施形態では、装着部位は、シールドのおおよそ両側である。
シールドが認識分子に装着される部位とシールドが標識に装着される部位との間の距離は、スペースを介する線形測定又はシールドの表面全体にわたる非線形測定でありうる。シールド上の認識分子結合部位と標識結合部位との間の距離は、シールドの3次元構造のモデリングにより測定可能である。いくつかの実施形態では、この距離は、少なくとも2nm、少なくとも4nm、少なくとも6nm、少なくとも8nm、少なくとも10nm、少なくとも12nm、少なくとも15nm、少なくとも20nm、少なくとも30nm、少なくとも40nm、又はそれ以上でありうる。代替的に、シールド上の認識分子と標識との相対位置は、シールドの構造を二次曲面(たとえば、楕円体、楕円柱)として扱うことにより記述可能である。いくつかの実施形態では、認識分子結合部位及び標識結合部位は、シールドを表す楕円体形状の周りの距離の少なくとも1/8の距離だけ離れている。いくつかの実施形態では、認識分子及び標識は、シールドを表す楕円体形状の周りの距離の少なくとも1/4の距離だけ離れている。いくつかの実施形態では、認識分子及び標識は、シールドを表す楕円体形状の周りの距離の少なくとも1/3の距離だけ離れている。いくつかの実施形態では、認識分子及び標識は、シールドを表す楕円体形状の周りの距離の1/2の距離だけ離れている。
シールドのサイズは、アミノ酸認識分子がポリペプチドに会合するときに標識がポリペプチドに直接接触できないか又はその可能性が低くなるようにすべきである。シールドのサイズはまた、アミノ酸認識分子がポリペプチドに会合するときに装着標識が検出可能になるようにすべきである。たとえば、サイズは、装着発光標識が励起される照明体積内にあるようにすべきである。
実施者がシールディング効果を評価可能なさまざまなパラメータが存在することが認識されるべきである。一般に、シールディングエレメントの効果は、シールディングエレメントを有する組成物とシールディングエレメントの欠如した組成物との間の比較アセスメントを行うことにより評価可能である。たとえば、シールディングエレメントは、アミノ酸認識分子の認識時間を増加させることが可能である。いくつかの実施形態では、認識時間とは、本明細書に記載のポリペプチドシーケンシング反応時に認識分子とポリペプチドとの間の会合イベントが観測可能な時間の長さを意味する。いくつかの実施形態では、認識時間は、アミノ酸認識分子がシールディングエレメントを欠如しているがそれ以外は類似又は同一である点を除けば同一条件下で実施されるポリペプチドシーケンシング反応と比べて、約10~25%、25~50%、50~75%、75~100%、又は100%超、たとえば、約2倍、3倍、4倍、5倍、又はそれ以上に増加する。いくつかの実施形態では、シールディングエレメントは、シーケンシング確度(sequencing accuracy)及び/又は配列リード長を増加させることが可能である(たとえば、以上に記載の比較条件下で実施されるシーケンシング反応と比べて、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも25%、又はそれ以上に)。
それゆえ、いくつかの態様では、本願は、少なくとも1つのアミノ酸認識分子と、少なくとも1つの検出可能標識と、認識分子と標識との間に共有結合性又は非共有結合性連結基を形成するシールディングエレメント(たとえば「シールド」)と、を含むシールド認識分子を提供する。いくつかの実施形態では、シールディングエレメントは、少なくとも2nm、少なくとも5nm、少なくとも10nm、少なくとも12nm、少なくとも15nm、少なくとも20nm、又はそれ以上の長さである(たとえば、水性溶液中で)。いくつかの実施形態では、シールディングエレメントは、約2nm~約100nmの長さ(たとえば、約2nm~約50nm、約10nm~約50nm、約20nm~約100nm)である。
いくつかの実施形態では、シールド(たとえばシールディングエレメント)は、1つ以上のアミノ酸認識分子(たとえば認識成分)と1つ以上の標識(たとえば標識成分)との間に共有結合性又は非共有結合性連結基を形成する。本明細書で用いられる場合、いくつかの実施形態では、共有結合性及び非共有結合性の連結又は連結基とは、シールドへの認識成分及び標識成分の装着の性状を意味する。
いくつかの実施形態では、共有結合性連結又は共有結合性連結基とは、共有結合又は一連のコンティグ共有結合を介して認識成分及び標識成分の各々に装着されるシールドを意味する。一方又は両方の成分の共有結合性装着は、当技術分野で公知の共有結合性コンジュゲーション方法により達成可能である。たとえば、いくつかの実施形態では、一方又は両方の成分をシールドに装着するために、クリックケミストリー技術(たとえば、銅触媒、歪み促進、銅フリーのクリックケミストリーなど)を使用可能である。かかる方法は、一般に、反応性部分間に1つ以上の共有結合を形成するように一方の反応性部分を他方の反応性部分にコンジュゲートすることを含む。それゆえ、いくつかの実施形態では、シールドの第1の反応性部分は、共有結合性装着を形成するように認識成分又は標識成分の第2の反応性部分に接触される。反応性部分の例としては、限定されるものではないが、反応性のアミン、アジド、アルキン、ニトロン、アルケン(たとえばシクロアルケン)、テトラジン、テトラゾール、並びにクリック反応及び類似のカップリング技術に好適な他の反応性部分が挙げられる。
いくつかの実施形態では、非共有結合性連結又は非共有結合性連結基とは、1つ以上の非共有結合性カップリング手段、たとえば、限定されるものではないがレセプター-リガンド相互作用及びオリゴヌクレオチド鎖ハイブリダイゼーションを介して認識成分及び標識成分の一方又は両方に装着されるシールドを意味する。レセプター-リガンド相互作用の例は、本明細書に提供されており、限定されるものではないが、タンパク質-タンパク質複合体、タンパク質-リガンド複合体、タンパク質-アプタマー複合体、及びアプタマー-核酸複合体が挙げられる。オリゴヌクレオチド鎖ハイブリダイゼーションに対する種々の構成及びストラテジーは、本明細書に記載されており、当技術分野で公知である(たとえば、米国特許出願公開第2019/0024168号明細書を参照されたい)。
いくつかの実施形態では、シールド502は、バイオ分子やデンドリティックポリマーなどのポリマーを含む。図5Cは、ポリマーシールドの例及び本願のシールド認識分子の構成を示す。第1のシールド構築物504は、タンパク質シールド530の例を示す。いくつかの実施形態では、タンパク質シールド530は、認識分子と標識との間に共有結合性連結基を形成する。たとえば、いくつかの実施形態では、タンパク質シールド530は、1つ以上の共有結合を介して、たとえば、タンパク質シールド530の天然又は非天然アミノ酸の側鎖を介する共有結合性装着により、認識分子及び標識の各々に装着される。いくつかの実施形態では、タンパク質シールド530は、認識分子と標識との間に非共有結合性連結基を形成する。たとえば、いくつかの実施形態では、タンパク質シールド530は、1つ以上のリガンド結合部位を含むモノマー又はマルチマータンパク質である。いくつかの実施形態では、非共有結合性連結基は、1つ以上のリガンド結合部位に結合された1つ以上のリガンド部分を介して形成される。タンパク質シールドにより形成される非共有結合性連結の追加の例は、本明細書の他の箇所に記載されている。
第2のシールド構築物506は、第2のオリゴヌクレオチド鎖534にハイブリダイズされた第1のオリゴヌクレオチド鎖532を含む2本鎖核酸シールドの例を示す。示されるように、いくつかの実施形態では、2本鎖核酸シールドは、第1のオリゴヌクレオチド鎖532に装着された認識分子と、第2のオリゴヌクレオチド鎖534に装着された標識と、を含みうる。こうして、2本鎖核酸シールドは、オリゴヌクレオチド鎖ハイブリダイゼーションを介して認識分子と標識との間に非共有結合性連結基を形成する。いくつかの実施形態では、認識分子及び標識は、同一オリゴヌクレオチド鎖に装着可能であり、これは一本鎖核酸シールド又は他のオリゴヌクレオチド鎖とのハイブリダイゼーションを介して2本鎖核酸シールドを提供可能である。いくつかの実施形態では、鎖ハイブリダイゼーションは、認識分子と標識との間の分離をさらに増強するために連結基内の剛性の増加を提供可能である。
シールディングエレメント502が核酸を含む場合、標識と認識分子との間の分離距離は、核酸上の装着部位間の距離により測定可能である(たとえば、直接装着又は1つ以上の追加のシールドポリマーを介するなどによる間接装着)。いくつかの実施形態では、核酸上の装着部位間の距離は、標識と認識分子との間に存在する核酸内のヌクレオチドの数により測定可能である。ことを理解すべきである、ヌクレオチドの数とは、一本鎖核酸中のヌクレオチド塩基の数又は2本鎖核酸中のヌクレオチド塩基対の数のどちらかを意味しうる。
それゆえ、いくつかの実施形態では、認識分子の装着部位及び標識の装着部位は、5~200ヌクレオチド(たとえば、5~150ヌクレオチド、5~100ヌクレオチド、5~50ヌクレオチド、10~100ヌクレオチド)だけ分離可能である。核酸中のいずれの位置も、認識分子、標識、又は1つ以上の追加のポリマーシールドに対する装着部位として機能しうることが認識されるべきである。いくつかの実施形態では、装着部位は、5’末端若しくは3’末端又はおおよそその位置或いは核酸の鎖に沿った内部位置でありうる。
第2のシールド構築物506の非限定的構成は、鎖ハイブリダイゼーションを介して非共有結合性連結を形成するシールドの例を例示する。非共有結合性連結のさらなる例は、オリゴヌクレオチドシールド536を含む第3のシールド構築物508により例示される。いくつかの実施形態では、オリゴヌクレオチドシールド536は、認識分子に結合して非共有結合性連結を形成する核酸アプタマーである。いくつかの実施形態では、認識分子は、核酸アプタマーであり、且つオリゴヌクレオチドシールド536は、アプタマーにハイブリダイズして非共有結合性連結を形成するオリゴヌクレオチド鎖を含む。
第4のシールド構築物510は、デンドリティックポリマーシールド538の例を示す。本明細書で用いられる場合、いくつかの実施形態では、デンドリティックポリマーとは、一般にポリオール又はデンドリマーを意味する。ポリオール及びデンドリマーは、当技術分野に記載されており、特定構成に最適化された分岐状デンドリティック構造を含みうる。いくつかの実施形態では、デンドリティックポリマーシールド538は、ポリエチレングリコール、テトラエチレングリコール、ポリ(アミドアミン)、ポリ(プロピレンイミン)、ポリ(プロピレンアミン)、カルボシラン、ポリ(L-リシン)、又はそれらの1つ以上の組合せを含む。
デンドリマー又はデンドロンは、コアの周りが典型的には対称であり且つ球状3次元形態をとりうる繰返し分岐状分子である。たとえば、アストリュク(Astruc)ら著、2010年、ケミカル・レビューズ(Chem.Rev.)、第110巻、p.1857を参照されたい。本願のシールドへのかかる構造の取込みは、標識とそれに会合する1つ以上のバイオ分子(たとえば、認識分子及び/又は認識分子に会合するポリペプチド)との間の接触の立体阻害を介して保護効果を提供可能である。分子の1次構造の変動を介するデンドリマーの化学的性質及び物理的性質のリファインメントは、デンドリマー表面の潜在的機能化を含めて要望に応じたシールディング効果の調整を可能にする。デンドリマーは、当技術分野で公知の広範にわたる材料及び分岐反応を用いてさまざまな技術により合成されうる。かかる合成変動は、必要に応じたデンドリマーの性質のカスタマイズを可能にする。本願のシールドに従って使用可能なポリオール及びデンドリマー化合物の例としては、限定されるものではないが米国特許出願公開第20180346507号明細書に記載の化合物が挙げられる。
図5Dは、本願のシールド認識分子のさらなる構成例を示す。タンパク質-核酸構築物512は、タンパク質の形態の1つ超のポリマーと2本鎖核酸とを含むシールドの例を示す。いくつかの実施形態では、シールドのタンパク質部分は、共有結合性連結を介してシールドの核酸部分に装着される。いくつかの実施形態では、装着は、非共有結合性連結を介する。たとえば、いくつかの実施形態では、シールドのタンパク質部分は、1価又は多価タンパク質のリガンド結合部位に装着されたリガンド部分を介して少なくとも1つの非共有結合性連結を形成する1価又は多価タンパク質である。いくつかの実施形態では、シールドのタンパク質部分はアビジンタンパク質を含む。
いくつかの実施形態では、本願のシールド認識分子はアビジン核酸構築物514である。いくつかの実施形態では、アビジン核酸構築物514は、アビジンタンパク質540と2本鎖核酸とを含むシールドを含む。本明細書に記載されるように、直接的又は本明細書に記載の1つ以上の追加のシールドポリマーを介するなどにより間接的のどちらかで、1つ以上のアミノ酸認識分子と1つ以上の標識との間に非共有結合性連結を形成するために、アビジンタンパク質540が使用されうる。
アビジンタンパク質はビオチン結合タンパク質であり、一般にアビジンタンパク質の4つのサブユニットの各々にビオチン結合部位を有する。アビジンタンパク質としては、たとえば、アビジン、ストレプトアビジン、トラプタビジン、タマビジン、ブラダビジン、キセナビジン(xenavidin)、並びにそれらのホモログ及び変異体が挙げられる。いくつかの場合には、モノマー形、ダイマー形、又はテトラマー形のアビジンタンパク質を使用可能である。いくつかの実施形態では、アビジンタンパク質複合体のアビジンタンパク質は、テトラマー形(たとえばホモテトラマー)のストレプトアビジンである。いくつかの実施形態では、アビジンタンパク質のビオチン結合部位は、1つ以上のアミノ酸認識分子、1つ以上の標識、及び/又は本明細書に記載の1つ以上の追加のシールドポリマーに対する装着部位を提供する。
アビジンタンパク質複合体の例示的な図は、図5Dのインセットパネルに示される。インセットパネルに示されるように、アビジンタンパク質540は、ビオチン部分(白丸として示される)に結合可能なタンパク質の4つのサブユニットの各々に結合部位542を含みうる。アビジンタンパク質540の多価性は、例示目的で一般的に示される各種連結構成を可能にしうる。たとえば、いくつかの実施形態では、アビジンタンパク質540への単一装着点を提供するためにビオチン連結部分544を使用可能である。いくつかの実施形態では、アビジンタンパク質540への2つの装着点を提供するためにビスビオチン連結部分546を使用可能である。アビジン核酸構築物514により例示されるように、アビジンタンパク質複合体は、認識分子と標識との間の分離距離の増加を提供するためにトランス構成を形成する2つのビスビオチン連結部分により形成されうる。
アビジンタンパク質シールド構成の各種さらなる例が示される。第1のアビジン構築物516は、ビスビオチン連結部分を介して認識分子に及び個別ビオチン連結部分を介して2つの標識に装着されたアビジンシールドの例を示す。第2のアビジン構築物518は、個別ビオチン連結部分を介して2つ認識分子に及びビスビオチン連結部分を介して標識に装着されたアビジンシールドの例を示す。第3のアビジン構築物520は、個別ビオチン連結部分を介して2つ認識分子に及び核酸の各鎖のビオチン連結部分を介して標識核酸に装着されたアビジンシールドの例を示す。第4のアビジン構築物522は、個別ビスビオチン連結部分を介して認識分子及び標識核酸に装着されたアビジンシールドの例を示す。示されるように、標識は、標識と核酸との間のデンドリティックポリマーにより認識分子からさらにシールドされる。
図5A~5Dに示されるシールド認識分子の構成例は、例示する目的で提供されることが認識されるべきである。本発明者らは、シールド認識分子の認識分と標識成分との間に共有結合性又は非共有結合性の連結を形成する1つ以上の異なるポリマーを用いた各種他のシールド構成を構想した。例として、図5Eは、本願に係るシールド構成のモジュール性を例示する。
図5Eのトップに示されるように、シールド認識分子は、一般に認識成分550とシールディングエレメント552と標識成分554とを含む。例示を容易にするために、認識成分550は、1つのアミノ酸認識分子として描かれ、且つ標識成分554は、1つの標識として描かれる。本願のシールド認識分子は、1つ以上のアミノ酸認識分子と1つ以上の標識とに装着されたシールディングエレメント552を含みうることが認識されるべきである。認識成分550が1つ超の認識分子を含む場合、各認識分子は、シールディングエレメント552上の1つ以上の装着部位でシールディングエレメント552に装着可能である。標識成分554が1つ超の標識を含む場合、各標識は、シールディングエレメント552上の1つ以上の装着部位でシールディングエレメント552に装着可能である。
いくつかの実施形態では、シールディングエレメント552はタンパク質560を含む。いくつかの実施形態では、タンパク質560は1価又は多価タンパク質である。いくつかの実施形態では、タンパク質560は、モノマー又はマルチマータンパク質、たとえば、タンパク質ホモダイマー、タンパク質ヘテロダイマー、タンパク質オリゴマー、又は他のタンパク質分子である。いくつかの実施形態では、シールディングエレメント552は、少なくとも1つの他の分子に非共有結合されたタンパク質により形成されるタンパク質複合体を含む。たとえば、いくつかの実施形態では、シールディングエレメント552は、タンパク質-タンパク質複合体562を含む。いくつかの実施形態では、タンパク質-タンパク質複合体562は、他のタンパク質分子に特異的に結合された1つのタンパク質分子を含む。いくつかの実施形態では、タンパク質-タンパク質複合体562は、抗原に結合された抗体又は抗体フラグメント(たとえばscFv)を含む。いくつかの実施形態では、タンパク質-タンパク質複合体562は、タンパク質リガンドに結合されたレセプターを含む。タンパク質-タンパク質複合体の追加の例としては、限定されるものではないが、トリプシン-アプロチニン、バルナーゼ-バルスター、及びコリシンE9-Im9免疫タンパク質が挙げられる。
いくつかの実施形態では、シールディングエレメント552は、タンパク質-リガンド複合体564を含む。いくつかの実施形態では、タンパク質-リガンド複合体564は、1価タンパク質と非タンパク質リガンド部分とを含む。たとえば、いくつかの実施形態では、タンパク質-リガンド複合体564は、低分子阻害剤部分に結合された酵素を含む。いくつかの実施形態では、タンパク質-リガンド複合体564は、非タンパク質リガンド部分に結合されたレセプターを含む。
いくつかの実施形態では、シールディングエレメント552は、1つ以上のリガンド部分に非共有結合された多価タンパク質により形成される多価タンパク質複合体を含む。いくつかの実施形態では、シールディングエレメント552は、1つ以上のビオチン連結部分に非共有結合されたアビジンタンパク質により形成されるアビジンタンパク質複合体を含む。構築物566、568、570、及び572は、アビジンタンパク質複合体の例示的例を提供するとともに、そのうちのいずれか1つ以上は、シールディングエレメント552に取り込まれうる。
いくつかの実施形態では、シールディングエレメント552は、2つのビスビオチン連結部分に結合されたアビジンタンパク質を含むツーウェイアビジン複合体566を含む。いくつかの実施形態では、シールディングエレメント552は、2つのビオチン連結部分とビスビオチン連結部分とに結合されたアビジンタンパク質を含むスリーウェイアビジン複合体568を含む。いくつかの実施形態では、シールディングエレメント552は、4つのビオチン連結部分に結合されたアビジンタンパク質を含むフォーウェイアビジン複合体570を含む。
いくつかの実施形態では、シールディングエレメント552は、アビジンタンパク質に工学操作により導入された1つ又は2つの非機能性結合部位を含むアビジンタンパク質を含む。たとえば、いくつかの実施形態では、シールディングエレメント552は、2つのサブユニットの各々でビオチン連結部分に結合されたアビジンタンパク質を含む2価アビジン複合体572を含み、この場合、アビジンタンパク質は、2つの他のサブユニットの各々で非機能性リガンド結合部位548を含む。示されるように、いくつかの実施形態では、2価アビジン複合体572はトランス2価アビジンタンパク質を含むが、所望の実現形態に依存してシス2価アビジンタンパク質が使用されうる。いくつかの実施形態では、アビジンタンパク質は3価アビジンタンパク質である。いくつかの実施形態では、3価アビジンタンパク質は、1つのサブユニットに非機能性リガンド結合部位548を含むとともに、3つのビオチン連結部分に結合されるか又は1つのビオチン連結部分及び他のサブユニットでビスビオチン連結部分に結合される。
いくつかの実施形態では、シールディングエレメント552は、デンドリティックポリマー574を含む。いくつかの実施形態では、デンドリティックポリマー574は、本明細書の他の箇所に記載されるようにポリオール又はデンドリマーである。いくつかの実施形態では、デンドリティックポリマー574は、分岐状ポリオール又は分岐状デンドリマーである。いくつかの実施形態では、デンドリティックポリマー574は、単糖-TEG、二糖、N-アセチル単糖、TEMPO-TEG、トロロックス-TEG又はグリセロールデンドリマーを含む。本願のシールド認識分子に係る有用なポリオールの例としては、ポリエーテルポリオール及びポリエステルポリオール、たとえば、ポリエチレングリコール、ポリプロピレングリコール、及び当技術分野で周知の類似のかかるポリマーが挙げられる。いくつかの実施形態では、デンドリティックポリマー574は、次式:-(CHCHO)n-(式中、nは1~500(両端の値を含む)の整数である)の化合物を含む。いくつかの実施形態では、デンドリティックポリマー574は、次式:-(CHCHO)n-(式中、nは1~100(両端の値を含む)の整数である)の化合物を含む。
いくつかの実施形態では、シールディングエレメント552は核酸を含む。いくつかの実施形態では、核酸は一本鎖である。いくつかの実施形態では、標識成分554は、一本鎖核酸の一方の末端(たとえば、5’末端又は3’末端)に直接的又は間接的に装着され、且つ認識成分550は、一本鎖核酸の他方の末端(たとえば、3’末端又は5’末端)に直接的又は間接的に装着される。たとえば、一本鎖核酸は、核酸の5’末端に装着された標識と、核酸の3’末端に装着されたアミノ酸認識分子と、を含みうる。
いくつかの実施形態では、シールディングエレメント552は二本鎖核酸576を含む。示されるように、いくつかの実施形態では、二本鎖核酸576は、鎖ハイブリダイゼーションを介して認識成分550と標識成分554との間に非共有結合性連結を形成可能である。しかしながら、いくつかの実施形態では、二本鎖核酸576は、同一オリゴヌクレオチド鎖への装着を介して認識成分550と標識成分554との間に共有結合性連結を形成可能である。いくつかの実施形態では、標識成分554は、二本鎖核酸の一方の末端に直接的又は間接的に装着され、且つ認識成分550は、二本鎖核酸の他方の末端に直接的又は間接的に装着される。たとえば、二本鎖核酸は、一方の鎖の5’末端に装着された標識と、他方の鎖の5’末端に装着されたアミノ酸認識分子と、を含みうる。
いくつかの実施形態では、シールディングエレメント552は、シールドの立体バルクを増加させるのに有用でありうる1つ以上の構造モチーフを形成する核酸を含む。核酸構造モチーフの例としては、限定されるものではないが、ステム-ループ、スリーウェイジャンクション(たとえば、2つ以上のステム-ループモチーフにより形成される)、フォーウェイジャンクション(たとえばホリデイジャンクション)、及びバルジループが挙げられる。
いくつかの実施形態では、シールディングエレメント552は、ステム-ループ578を形成する核酸を含む。ステム-ループ又はヘアピンループは、オリゴヌクレオチド鎖がフォールドして同一鎖の他のセクションと塩基対を形成するときに形成されるオリゴヌクレオチド鎖上のヌクレオチドの不対ループである。いくつかの実施形態では、ステム-ループ578の不対ループは、3~10ヌクレオチドを含む。それゆえ、ステム-ループ578は、ハイブリダイズしてステムを形成する反転相補配列を有するオリゴヌクレオチド鎖の2つの領域による形成可能であり、この場合、2つの領域は、不対ループを形成する3~10ヌクレオチドにより分離される。いくつかの実施形態では、ステム-ループ578のステムは、A/Tヌクレオチドと比較して生じる追加の水素結合相互作用により安定性の増加を提供可能な1つ以上のG/Cヌクレオチドを有するように設計可能である。いくつかの実施形態では、ステム-ループ578のステムは、不対ループ配列に直接近接するG/Cヌクレオチドを含む。いくつかの実施形態では、ステム-ループ578のステムは、不対ループ配列に近接する最初の2、3、4、又は5ヌクレオチド内にG/Cヌクレオチドを含む。いくつかの実施形態では、ステム-ループ578の不対ループは、1つ以上の装着部位を含む。いくつかの実施形態では、装着部位は、不対ループ中の脱塩基部位に発生する。いくつかの実施形態では、装着部位は、不対ループの塩基に発生する。
いくつかの実施形態では、ステム-ループ578は、二本鎖核酸により形成される。本明細書に記載されるように、いくつかの実施形態では、二本鎖核酸は、第1及び第2のオリゴヌクレオチド鎖の鎖ハイブリダイゼーションを介して非共有結合性連結基を形成可能である。しかしながら、いくつかの実施形態では、シールディングエレメント552は、ステム-ループモチーフを形成する一本鎖核酸を含んで共有結合性連結基を提供する。いくつかの実施形態では、シールディングエレメント552は、2つ以上のステム-ループモチーフを形成する核酸を含む。たとえば、いくつかの実施形態では、核酸は2つのステム-ループモチーフを含む。いくつかの実施形態では、モチーフが一緒になってスリーウェイジャンクションを形成するように、1つのステム-ループモチーフのステムは他のステムに近接する。いくつかの実施形態では、シールディングエレメント552は、フォーウェイジャンクション578を形成する核酸を含む。いくつかの実施形態では、フォーウェイジャンクション578は、2つ以上のオリゴヌクレオチド鎖(たとえば、2、3、又は4つのオリゴヌクレオチド鎖)のハイブリダイゼーションを介して形成される。
いくつかの実施形態では、シールディングエレメント552は、図5Eの560、562、564、566、568、570、572、574、576、578、及び580から選択される1つ以上のポリマーを含む。560、562、564、566、568、570、572、574、576、578、及び580の各々に示される連結部分及び装着部位は、例示目的で示されており、好ましい連結部位又は装着部位の構成を描くことを意図するものではないことが認識されるべきである。
いくつかの態様では、本願は、式(I):
A-(Y)-D
(I)
(式中、Aは、少なくとも1つのアミノ酸認識分子を含むアミノ酸結合成分であり、Yの各々は、共有結合性又は非共有結合性連結基を形成するポリマーであり、nは、1~10(両端の値を含む)の整数であり、且つ、Dは、少なくとも1つの検出可能標識を含む標識成分である)
のアミノ酸認識分子を提供する。いくつかの実施形態では、本願は、式(I)の可溶性アミノ酸認識分子を含む組成物を提供する。
いくつかの実施形態では、Aは、複数のアミノ酸認識分子を含む。いくつかの実施形態では、複数の各アミノ酸認識分子は、Y上の異なる装着部位に装着される。いくつかの実施形態では、複数のアミノ酸認識分子の少なくとも2つは、Y上の単一装着部位に装着される。いくつかの実施形態では、アミノ酸認識分子は、認識タンパク質又は核酸アプタマー、たとえば、本明細書の他の箇所に記載のものである。
いくつかの実施形態では、検出可能標識は、発光標識又は伝導率標識である。いくつかの実施形態では、発光標識は、少なくとも1つのフルオロフォア色素分子を含む。いくつかの実施形態では、Dは、20以下のフルオロフォア色素分子を含む。いくつかの実施形態では、フルオロフォア色素分子の数とアミノ酸認識分子の数との比は、1:1~20:1である。いくつかの実施形態では、発光標識は、ドナー標識とアクセプター標識とを含む少なくとも1つのFRETペアを含む。いくつかの実施形態では、ドナー標識とアクセプター標識との比は、1:1、2:1、3:1、4:1、又は5:1である。いくつかの実施形態では、アクセプター標識とドナー標識との比は、1:1、2:1、3:1、4:1、又は5:1である。
いくつかの実施形態では、Dは200Å未満の直径である。いくつかの実施形態では、-(Y)-は少なくとも2nmの長さである。いくつかの実施形態では、-(Y)-は少なくとも5nmの長さである。いくつかの実施形態では、-(Y)-は少なくとも10nmの長さである。いくつかの実施形態では、Yの各々は、独立して、バイオ分子、ポリオール、又はデンドリマーである。いくつかの実施形態では、バイオ分子は、核酸、ポリペプチド、又は多糖である。
いくつかの実施形態では、アミノ酸認識分子は、次式:
A-Y-(Y)-D又はA-(Y)-Y-D
(式中、Yは、核酸又はポリペプチドであり、且つmは、0~10(両端の値を含む)の整数である)
の1つである。
いくつかの実施形態では、核酸は、第1のオリゴヌクレオチド鎖を含む。いくつかの実施形態では、核酸は、第1のオリゴヌクレオチド鎖にハイブリダイズされた第2のオリゴヌクレオチド鎖を含む。いくつかの実施形態では、核酸は、第1のオリゴヌクレオチド鎖を介して共有結合性連結を形成する。いくつかの実施形態では、核酸は、ハイブリダイズされた第1及び第2のオリゴヌクレオチド鎖を介して非共有結合性連結を形成する。
いくつかの実施形態では、ポリペプチドは、1価又は多価タンパク質である。いくつかの実施形態では、1価又は多価タンパク質は、1価又は多価タンパク質のリガンド結合部位に装着されたリガンド部分を介して少なくとも1つの非共有結合性連結を形成する。いくつかの実施形態では、A、Y、又はDは、リガンド部分を含む。
いくつかの実施形態では、アミノ酸認識分子は、次式:
A-(Y)-Y-D又はA-Y-(Y)-D
(式中、Yは、ポリオール又はデンドリマーであり、且つmは、0~10(両端の値を含む)の整数である)
の1つである。いくつかの実施形態では、ポリオール又はデンドリマーは、ポリエチレングリコール、テトラエチレングリコール、ポリ(アミドアミン)、ポリ(プロピレンイミン)、ポリ(プロピレンアミン)、カルボシラン、ポリ(L-リシン)、又はそれらの1つ以上の組合せを含む。
いくつかの態様では、本願は、式(II):
A-Y-D
(II)
(式中、Aは、少なくとも1つのアミノ酸認識分子を含むアミノ酸結合成分であり、Yは、核酸又はポリペプチドであり、Dは、少なくとも1つの検出可能標識を含む標識成分である)
のアミノ酸認識分子を提供する。いくつかの実施形態では、Yが核酸であるとき、核酸は、共有結合性又は非共有結合性連結基を形成する。いくつかの実施形態では、Yがポリペプチドであるとき、ポリペプチドは、50×10-9M未満の解離定数(K)により特徴付けられる非共有結合性連結基を形成する。
いくつかの実施形態では、Yは、第1のオリゴヌクレオチド鎖を含む核酸である。いくつかの実施形態では、核酸は、第1のオリゴヌクレオチド鎖にハイブリダイズされた第2のオリゴヌクレオチド鎖を含む。いくつかの実施形態では、Aは、第1のオリゴヌクレオチド鎖に装着され、且つDは、第2のオリゴヌクレオチド鎖に装着される。いくつかの実施形態では、Aは、第1のオリゴヌクレオチド鎖上の第1の装着部位に装着され、且つDは、第1のオリゴヌクレオチド鎖上の第2の装着部位に装着される。いくつかの実施形態では、核酸の各オリゴヌクレオチド鎖は、150未満、100未満、又は50未満のヌクレオチドを含む。
いくつかの実施形態では、Yは、1価又は多価タンパク質である。いくつかの実施形態では、1価又は多価タンパク質は、1価又は多価タンパク質のリガンド結合部位に装着されたリガンド部分を介して少なくとも1つの非共有結合性連結を形成する。いくつかの実施形態では、A及びDの少なくとも1つは、リガンド部分を含む。いくつかの実施形態では、ポリペプチドは、アビジンタンパク質(たとえば、アビジン、ストレプトアビジン、トラプタビジン、タマビジン、ブラダビジン、キセナビジン(xenavidin)、又はそれらのホモログ若しくは変異体)である。いくつかの実施形態では、リガンド部分はビオチン部分である。
いくつかの実施形態では、アミノ酸認識分子は、次式:
A-Y-(Y)-D又はA-(Y)-Y-D
(式中、Yの各々は、共有結合性又は非共有結合性連結基を形成するポリマーであり、且つnは、1~10(両端の値を含む)の整数である)
の1つである。いくつかの実施形態では、Yの各々は、独立して、バイオ分子、ポリオール、又はデンドリマーである。
他の態様では、本願は、核酸と、核酸上の第1の装着部位に装着された少なくとも1つのアミノ酸認識分子と、核酸上の第2の装着部位に装着された少なくとも1つの検出可能標識と、を含むアミノ酸認識分子を提供する。いくつかの実施形態では、核酸は、少なくとも1つのアミノ酸認識分子と少なくとも1つの検出可能標識との間に共有結合性又は非共有結合性連結基を形成する。
いくつかの実施形態では、核酸は、第2のオリゴヌクレオチド鎖にハイブリダイズされた第1のオリゴヌクレオチド鎖を含む二本鎖核酸である。いくつかの実施形態では、第1の装着部位は、第1のオリゴヌクレオチド鎖上にあり、且つ第2の装着部位は、第2のオリゴヌクレオチド鎖上にある。いくつかの実施形態では、少なくとも1つのアミノ酸認識分子は、少なくとも1つのアミノ酸認識分子と核酸との間に共有結合性又は非共有結合性連結基を形成するタンパク質を介して第1の装着部位に装着される。いくつかの実施形態では、少なくとも1つの検出可能標識は、少なくとも1つの検出可能標識と核酸との間に共有結合性又は非共有結合性連結基を形成するタンパク質を介して第2の装着部位に装着される。いくつかの実施形態では、第1及び第2の装着部位は、核酸上の5~100ヌクレオチド塩基又はヌクレオチド塩基対だけ分離される。
さらに他の態様では、本願は、少なくとも2つのリガンド結合部位を含む多価タンパク質と、タンパク質上の第1のリガンド結合部位に結合された第1のリガンド部分を介してタンパク質に装着された少なくとも1つのアミノ酸認識分子と、タンパク質上の第2のリガンド結合部位に結合された第2のリガンド部分を介してタンパク質に装着された少なくとも1つの検出可能標識と、を含むアミノ酸認識分子を提供する。
いくつかの実施形態では、多価タンパク質は、4つのリガンド結合部位を含むアビジンタンパク質である。いくつかの実施形態では、リガンド結合部位は、ビオチン結合部位であり、且つリガンド部分は、ビオチン部分である。いくつかの実施形態では、ビオチン部分の少なくとも1つは、ビスビオチン部分であり、且つビスビオチン部分は、アビジンタンパク質上の2つビオチン結合部位に結合される。いくつかの実施形態では、少なくとも1つのアミノ酸認識分子は、第1のリガンド部分を含む核酸を介してタンパク質に装着される。いくつかの実施形態では、少なくとも1つの検出可能標識は、第2のリガンド部分を含む核酸を介してタンパク質に装着される。
本明細書の他の箇所に記載されるように、本願のシールド認識分子は、本願に係るポリペプチドシーケンシング方法又は当技術分野で公知のいずれかの方法で使用されうる。たとえば、いくつかの実施形態では、本明細書に提供されるシールド認識分子は、本明細書に提供されるか又はポリペプチドシーケンシング反応で複数の反応混合物の繰返しサイクリングを含みうる当技術分野で従来から知られるエドマン型分解反応で使用されうる。いくつかの実施形態では、本明細書に提供されるシールド認識分子は、単一反応混合物でアミノ酸認識及び分解を含む本願の動的シーケンシング反応で使用されうる。
標識ポリペプチドの分解によるシーケンシング
いくつかの態様では、本願は、既知のポリペプチド配列に対応するユニーク組合せのアミノ酸を同定することによるポリペプチドのシーケンシング方法を提供する。たとえば、図6は、標識ポリペプチド600の標識アミノ酸を選択的に検出することによるシーケンシング方法を示す。いくつかの実施形態では、標識ポリペプチド600は、異なるアミノ酸タイプが異なる発光標識を含むように選択的に修飾されたアミノ酸を含む。本明細書で用いられる場合、とくに指定がない限り、標識ポリペプチドとは、1つ以上の選択的標識アミノ酸側鎖を含むポリペプチドを意味する。選択的標識化の方法並びに標識ポリペプチドの調製及び解析に関する詳細は、当技術分野で公知である(たとえば、スワミナサン(Swaminathan)ら著、プロス・コンピューテーショナル・バイオロジー(PLoS Comput Biol.)、2015年、第11巻、第2号、p.e1004080を参照されたい)。
示されるように、いくつかの実施形態では、標識ポリペプチド600は、固定されて励起源に暴露される。標識ポリペプチド600からのアグリゲート発光(aggregate luminescence)が検出され、いくつかの実施形態では、発光に対する経時的暴露は、発光標識分解(たとえば、光漂白に起因する分解)に起因して検出シグナルの損失をもたらす。いくつかの実施形態では、標識ポリペプチド600は、初期検出シグナルを生成するユニーク組合せの選択的標識アミノ酸を含む。一般的に例示されるように、経時的発光標識分解は、光漂白標識ポリペプチド602の対応する検出シグナル減少をもたらす。いくつかの実施形態では、シグナルは、1つ以上の発光性の解析によりデコンボリュート可能である(たとえば、発光寿命解析によるシグナルデコンボリューション)。いくつかの実施形態では、標識ポリペプチド600のユニーク組合せの選択的標識アミノ酸は、たとえば、プロテオームの既知ポリペプチド配列に基づいて、コンピュータであらかじめ計算され、経験的に検証された。いくつかの実施形態では、検出アミノ酸標識の組合せは、標識ポリペプチド600に対応するデータベースの特定ポリペプチドを同定するために生物のプロテオームの既知の配列のデータベースと比較される。
いくつかの実施形態では、図6に例示されるアプローチは、大規模パラレル解析でサンプリングを最大化するシーケンシング反応を実施するのに最適なサンプル濃度を決定することにより修正されうる。いくつかの実施形態では、濃度は、アレイのサンプルウェルの所望の部分(たとえば30%)がいずれかの所与の時間で占有されるように選択される。理論により拘束されることを望むものではないが、ポリペプチドがある時間にわたり漂白される(bleached)と同時に、同一ウェルは継続してさらなる解析のために利用可能であると考えられる。拡散を介して、アレイのサンプルウェルのおおよそ30%は、3分ごとに分析に使用可能である。例示的な例として、100万サンプルウェルチップでは、1時間当たり6,000,000ポリペプチド又は4時間にわたり24,000,000ポリペプチドがサンプリングされうる。
いくつかの態様では、本願は、末端アミノ酸修飾及び切断の繰返しサイクルに付される標識ポリペプチドの発光を検出することによるポリペプチドのシーケンシング方法を提供する。たとえば、図7は、本願に係るエドマン分解による標識ポリペプチドのシーケンシング方法を示す。いくつかの実施形態では、本方法は、一般に、エドマン分解による他のシーケンシング方法に対して本明細書に記載されるように進行する。たとえば、いくつかの実施形態では、図7に示される工程(1)及び(2)は、それぞれ、エドマン分解反応で末端アミノ酸修飾及び末端アミノ酸切断に対して本明細書の他の箇所に記載されるように実施されうる。
図7に描かれる例に示されるように、いくつかの実施形態では、本方法は、(1)標識ポリペプチドの末端アミノ酸を修飾する工程を含む。本明細書の他の箇所に記載されるように、いくつかの実施形態では、修飾することは、末端アミノ酸とイソチオシアネート(たとえばPITC)とを接触させてイソチオシアネート修飾末端アミノ酸を形成することを含む。いくつかの実施形態では、イソチオシアネート修飾710は、末端アミノ酸を切断試薬(たとえば、本明細書に記載される化学切断試薬又は酵素切断試薬)による除去に対してより感受性のある形態に変換する。それゆえ、いくつかの実施形態では、本方法は、(2)エドマン分解に対して本明細書の他の箇所に詳述される化学手段又は酵素手段を用いて修飾末端アミノ酸を除去する工程を含む。
いくつかの実施形態では、本方法は、複数サイクルにわたり工程(1)~(2)を繰り返すことを含み、その間、標識ポリペプチドの発光が検出されるとともに、末端からの標識アミノ酸の除去に対応する切断イベントが検出シグナルの減少として検出されうる。いくつかの実施形態では、図7に示される工程(2)に続いてシグナルが変化しなければ、未知タイプのアミノ酸が同定される。それゆえ、いくつかの実施形態では、部分配列情報は、各逐次ラウンド時に工程(2)に続いて検出されたシグナルを評価して、検出シグナルの変化に基づいて決定されたアイデンティティーによりアミノ酸タイプを帰属することにより、又は検出シグナルの無変化に基づいてアミノ酸タイプを未知として同定することにより、決定されうる。
いくつかの態様では、本願に係るポリペプチドのシーケンシング方法は、図8A~8Cに一般的に例示されるように、標識ポリペプチドのプロセッシブ酵素切断によるシーケンシングを含む。示されるように、いくつかの実施形態では、標識ポリペプチドは、一方の末端から他方の末端まで末端アミノ酸を連続的に切断する修飾プロセッシブエキソペプチダーゼを用いた分解に付される。エキソペプチダーゼは、本明細書の他の箇所に詳細に記載される。図8Aは、標識ポリペプチド800が固定プロセッシブエキソペプチダーゼ810による分解に付される例を描く。図8Bは、固定標識ポリペプチド820がプロセッシブエキソペプチダーゼ830による分解に付される例を描く。
図8Cは、図8Bに描かれる方法に従って実施されたリアルタイムシーケンシングプロセスの例を模式的に例示する。示されるように、パネル(I)~(IV)は、標識ポリペプチド分解の進行を示すとともに、各パネルの下には対応するシグナルトレースが経時的に示される。示されるように、標識アミノ酸に対応する各切断イベントは、シグナルの随伴低下を引き起こす。いくつかの実施形態では、プロセッシブエキソペプチダーゼ830のプロセッシビティー速度は既知であるので、検出されたシグナルの減少のタイミングを用いて各検出イベント間の非標識アミノ酸の数を計算しうる。たとえば、1秒ごとにアミノ酸が除去されるように40アミノ酸のポリペプチドが切断される場合、3シグナルを有する標識ポリペプチドは、最初は3シグナルすべて(パネル(I))、次いで2シグナル(パネル(II))次いで1シグナル(パネル(III))を示し、そして最後はシグナルを示さない。こうして、標識アミノ酸の順序を決定可能である。それゆえ、これらの方法は、部分配列情報を決定するために、たとえば、ポリペプチド断片シーケンシングに基づくプロテオミック解析に使用されうる。
いくつかの実施形態では、単一分子タンパク質シーケンシングは、たとえば、図9に例示されるように、ATPベースフェルスター共鳴エネルギー移動(FRET)スキームを用いて達成可能である(たとえば、1つ以上の標識補因子を用いて)。いくつかの実施形態では、補因子ベースFRETによるシーケンシングは、固定ATP依存プロテアーゼと、ドナー標識ATPと、ポリペプチド基質のアクセプター標識アミノ酸と、を用いて実施可能である。いくつかの実施形態では、アミノ酸はアクセプターで標識可能であり、且つ1つ以上の補因子はドナーで標識可能である。
たとえば、いくつかの実施形態では、抽出タンパク質は変性され、且つシステイン及びリシンは蛍光色素で標識される。いくつかの実施形態では、タンパク質トランスロカーゼ(たとえば細菌ClpX)の工学操作体を用いて、個別基質タンパク質に結合し、それをアンフォールドし、そしてそのナノチャネルに通してそれをトランスロケートする。いくつかの実施形態では、トランスロカーゼはドナー色素で標識され、基質がナノチャネルを通り抜けるときにトランスロカーゼ上のドナーと基質上の2つ以上の識別可能アクセプター色素との間でFRETが発生する。次いで、標識アミノ酸の順序はFRETシグナルから決定可能である。いくつかの実施形態では、表5に示される以下の非限定的標識ATPアナログの1つ以上を使用可能である。
Figure 2022507516000016
Figure 2022507516000017
Figure 2022507516000018
シーケンシング用サンプルの調製
ポリペプチドサンプルは、シーケンシング前に修飾可能である。いくつかの実施形態では、ポリペプチドのN末端アミノ酸又はC末端アミノ酸を修飾可能である。図10Aは、タンパク質サンプルから末端修飾ポリペプチドを調製するための末端修飾の非限定的例を例示する。工程(1)では、タンパク質サンプル1000は、断片化されてポリペプチド断片1002を生成する。ポリペプチドは、対象ポリペプチドを切断(たとえば化学的に)及び/又は消化(たとえば、トリプシンなどのペプチダーゼを用いて酵素的に)することにより断片化可能である。断片化は、標識化の前又は後に実施可能である。いくつかの実施形態では、断片化は、全タンパク質の標識化後に実施される。1つ以上のアミノ酸は、切断の前又は後に標識されて標識ポリペプチドを生成可能である。いくつかの実施形態では、ポリペプチドは、化学的又は酵素的断片化の後にサイズ選択される。いくつかの実施形態では、より小さなポリペプチド(たとえば<2kDa)は除去され、より大きなポリペプチドは配列解析のために保持される。サイズ選択は、ゲル濾過、SEC、透析、PAGEゲル抽出、マイクロ流体張力フローなどの技術又はいずれかの他の好適な技術を用いて達成可能である。工程(2)では、ポリペプチド断片1002のN末端又はC末端は、修飾されて末端修飾ポリペプチド1004を生成する。いくつかの実施形態では、修飾は、固定部分を付加することを含む。いくつかの実施形態では、修飾は、カップリング部分を付加することを含む。
それゆえ、本明細書に提供されるのは、表面(たとえば、タンパク質分析に使用されるチップ上のサンプルウェルの表面)への固定を可能にする部分でタンパク質及びポリペプチドの末端を修飾する方法である。いくつかの実施形態では、かかる方法は、本願に従って分析される標識ポリペプチドの末端を修飾することを含む。さらに他の実施形態では、かかる方法は、タンパク質又は本願に従ってポリペプチド基質を分解若しくはトランスロケートする酵素の末端を修飾することを含む。
いくつかの実施形態では、タンパク質又はポリペプチドのカルボキシ末端は、(i)タンパク質又はポリペプチドの遊離カルボン酸基をブロックすることと、(ii)タンパク質又はポリペプチドを変性することと(たとえば、熱及び/又は化学的手段により)、(iii)タンパク質又はポリペプチドの遊離チオール基をブロックすることと、(iv)タンパク質又はポリペプチドを消化して遊離C末端カルボン酸基を含む少なくとも1つのポリペプチド断片を生成することと、(v)遊離C末端カルボン酸基に機能部分をコンジュゲートすることと(たとえば化学的に)、を含む方法で修飾される。いくつかの実施形態では、本方法は、(i)の後且つ(ii)の前にタンパク質又はポリペプチドを含むサンプルを透析することをさらに含む。
いくつかの実施形態では、タンパク質又はポリペプチドのカルボキシ末端は、(i)タンパク質又はポリペプチドを変性することと(たとえば、熱及び/又は化学的手段により)、(ii)タンパク質又はポリペプチドの遊離チオール基をブロックすることと、(iii)タンパク質又はポリペプチドを消化して遊離C末端カルボン酸基を含む少なくとも1つのポリペプチド断片を生成することと、(iv)遊離C末端カルボン酸基をブロックしてブロックC末端カルボン酸基を含む少なくとも1つのポリペプチド断片を生成することと、(v)ブロックC末端カルボン酸基に機能部分をコンジュゲートすることと(たとえば酵素的に)、を含む方法で修飾される。いくつかの実施形態では、本方法は、(iv)の後且つ(v)の前にタンパク質又はポリペプチドを含むサンプルを透析することをさらに含む。
いくつかの実施形態では、遊離カルボン酸基をブロックすることは、非修飾カルボン酸と比べて化学反応性を変化させるこの基の化学修飾を意味する。好適なカルボン酸ブロッキング方法は、当技術分野で公知であり、官能基化されるポリペプチドのカルボキシ末端カルボン酸基とは化学的に異なるように側鎖カルボン酸基を修飾するべきである。いくつかの実施形態では、遊離カルボン酸基をブロックすることは、ポリペプチドの遊離カルボン酸基をエステル化又はアミド化することを含む。いくつかの実施形態では、遊離カルボン酸基をブロックすることは、たとえば、ポリペプチドとメタノール性HClとを反応させることにより、ポリペプチドの遊離カルボン酸基をメチルエステル化することを含む。遊離カルボン酸基をブロックするのに有用な試薬及び技術の追加の例としては、限定されるものではないが、4-スルホ-2,3,5,6-テトラフルオロフェノール(STP)及び/又はカルボジイミド、たとえば、N-(3-ジメチルアミノプロピル)-N’-エチルカルボジイミド塩酸塩(EDAC)、ウロニウム試薬、ジアゾメタン、フィッシャーエステル化用のアルコール及び酸、NHSエステルを形成するためのN-ヒドロキシルスクシンイミド(NHS)の使用(潜在的に後続のエステル形成又はアミン形成への中間体として)、又はカルボニルジイミダゾール(CDI)との反応、又は混合アンヒドリドの形成、又は潜在的にエステル若しくはアミドのどちらかの形成を介して、カルボン酸を修飾若しくはブロックするいずれかの他の方法が挙げられる。
いくつかの実施形態では、遊離チオール基をブロックすることは、非修飾チオールと比べて化学反応性を変化させるこの基の化学修飾を意味する。いくつかの実施形態では、遊離チオール基をブロックすることは、タンパク質又はポリペプチドの遊離チオール基を還元及びアルキル化することを含む。いくつかの実施形態では、還元及びアルキル化は、ポリペプチドと、ジチオトレイトール(DTT)並びにヨードアセトアミド及びヨード酢酸の一方又は両方と、を接触させることにより行われる。使用されうる追加及び代替のシステイン還元試薬の例は周知であり、限定されるものではないが、2-メルカプトエタノール、トリス(2-カルボキシエチル)ホスフィン塩酸塩(TCEP)、トリブチルホスフィン、ジチオブチルアミン(DTBA)、又はチオール基を還元可能ないずれかの試薬が挙げられる。使用されうる追加及び代替のシステインブロッキング(たとえば、システインアルキル化)試薬の例は周知であり、限定されるものではないが、アクリルアミド、4-ビニルピリジン、N-エチルマレイミド(NEM)、N-ε-マレイミドカプロン酸(EMCA)、又はジスルフィド結合形成を防止するようにシステインを修飾するいずれかの試薬が挙げられる。
いくつかの実施形態では、消化は酵素消化を含む。いくつかの実施形態では、消化は、消化条件下でタンパク質又はポリペプチドとエンドペプチダーゼ(たとえばトリプシン)とを接触させることにより行われる。いくつかの実施形態では、消化は化学消化を含む。化学消化及び酵素消化に好適な試薬の例は、当技術分野で公知であり、限定されるものではないが、トリプシン、ケモトリプシン(chemotrypsin)、Lys-C、Arg-C、Asp-N、Lys-N、BNPS-スカトール、CNBr、カスパーゼ、ギ酸、グルタミルエンドペプチダーゼ、ヒドロキシルアミン、ヨードソ安息香酸、好中球エラスターゼ、ペプシン、プロリン-エンドペプチダーゼ、プロテイナーゼK、ブドウ球菌ペプチダーゼI、サーモリシン、及びトロンビンが挙げられる。
いくつかの実施形態では、機能部分はビオチン分子を含む。いくつかの実施形態では、機能部分は、アルキニルなどの反応性化学部分を含む。いくつかの実施形態では、機能部分をコンジュゲートすることは、当技術分野で公知のように、カルボキシペプチダーゼYによるカルボキシ末端カルボキシメチルエステル基のビオチン化を含む。
いくつかの実施形態では、可溶化性部分がポリペプチドに付加される。図10Bは、たとえば、ポリペプチドに可溶化性リンカーをコンジュゲートするプロセスを用いて、ポリペプチドの末端アミノ酸に付加される可溶化性部分の非限定的例を例示する。
いくつかの実施形態では、リンカーコンジュゲーティング部分1012を含む末端修飾ポリペプチド1010は、ポリペプチドコンジュゲーティング部分1022を含む可溶化性リンカー1020にコンジュゲートされる。いくつかの実施形態では、可溶化性リンカーは、バイオ分子(たとえば、斑点形状として示される)などの可溶化性ポリマーを含む。いくつかの実施形態では、1012と1022との間に形成された連結1032を含む得られるリンカーコンジュゲートポリペプチド1030は、表面コンジュゲーティング部分1034をさらに含む。それゆえ、いくつかの実施形態では、本明細書に提供される方法及び組成物は、その溶解性を増加させる部分でポリペプチドの末端を修飾するのに有用である。いくつかの実施形態では、可溶化性部分は、断片化(たとえば、トリプシンを用いるなどの酵素的断片化)から生じる相対的に不溶性の小さなポリペプチドに有用である。たとえば、いくつかの実施形態では、ポリペプチドプール中の短いポリペプチドは、ポリマー(たとえば、短いオリゴ、糖、又は他の荷電ポリマー)をポリペプチドにコンジュゲートすることにより可溶化可能である。
いくつかの実施形態では、サンプルウェルの1つ以上の表面(たとえば、サンプルウェルの側壁)を修飾可能である。サンプルウェル側壁のパッシベーション及び/又はアンチファウリングの非限定的例は、ボトム表面への単一分子固定を促進するために使用されうる修飾表面を用いてサンプルウェルの模式図例が例示される図10Cに示される。いくつかの実施形態では、1040はSiOである。いくつかの実施形態では、1042は、ポリペプチドコンジュゲーティング部分(たとえば、TCO、テトラジン、N3、アルキン、アルデヒド、NCO、NHS、チオール、アルケン、DBCO、BCN、TPP、ビオチン、又は他の好適なコンジュゲーティング部分)である。いくつかの実施形態では、1050はTiO又はAlである。いくつかの実施形態では、1052は、疎水性C4~18分子、ポリテトラフルオロエチレン化合物(たとえば(CF4~12)、ポリオール、たとえば、ポリエチレングリコール(たとえばPEG3~100)、ポリプロピレングリコール、ポリオキシエチレングリコール、又はそれらの組合せ若しくは変化形、或いは双性イオンたとえばスルホベタインである。いくつかの実施形態では、1060はSiである。いくつかの実施形態では、1070はAlである。いくつかの実施形態では、1080はTiNである。
発光標識
本明細書で用いられる場合、発光標識とは、1つ以上の光子を吸収し且つ1つ以上の持続時間後に1つ以上の光子を後続的に放出しうる分子のことである。いくつかの実施形態では、この用語は、状況に依存して「標識」又は「発光分子」と同義的に用いられる。本明細書に記載されるある特定の実施形態に係る発光標識は、標識アフィニティー試薬の発光標識、標識ペプチダーゼ(たとえば、標識エキソペプチダーゼ、標識非特異的エキソペプチダーゼ)の発光標識、標識ペプチドの発光標識、標識補因子の発光標識、又は本明細書に記載の他の標識組成物を意味しうる。いくつかの実施形態では、本願に係る発光標識は、1つ以上の標識アミノ酸を含む標識ポリペプチドの標識アミノ酸を意味する。
いくつかの実施形態では、発光標識は、第1及び第2のクロモフォアを含みうる。いくつかの実施形態では、第1のクロモフォアの励起状態は、第2のクロモフォアへのエネルギー移動を介して緩和可能である。いくつかの実施形態では、エネルギー移動は、フェルスター共鳴エネルギー移動(FRET)である。かかるFRETペアは、たとえば、図1Cの標識アプタマー106に対して本明細書に例示及び記載されるように、混合物中の複数の発光標識間の標識ごとの区別をより容易にする性質を有する発光標識を提供するのに有用でありうる。さらに他の実施形態では、FRETペアは、たとえば、標識補因子を用いた標識ペプチドのシーケンシングに対して本明細書に例示及び記載されるように、第1の発光標識の第1のクロモフォアと第2の発光標識の第2のクロモフォアとを含む(たとえば、図9を参照されたい)。ある特定の実施形態では、FRETペアは、第1のスペクトル領域で励起エネルギーを吸収し、且つ第2のスペクトル領域で発光を放出しうる。
いくつかの実施形態では、発光標識とは、フルオロフォア又は色素を意味する。典型的には、発光標識は、芳香族又はヘテロ芳香族化合物を含むとともに、ピレン、アントラセン、ナフタレン、ナフチルアミン、アクリジン、スチルベン、インドール、ペンゾインドール、オキサゾール、カルバゾール、チアゾール、ベンゾチアゾール、ベンゾオキサゾール、フェナントリジン、フェノキサジン、ポルフィリン、キノリン、エチジウム、ベンズアミド、シアニン、カルボシアニン、サリチレート、アントラニレート、クマリン、フルオロセイン、ローダミン、キサンテン、又は他の類似化合物でありうる。
いくつかの実施形態では、発光標識は、下記:5/6-カルボキシローダミン6G、5-カルボキシローダミン6G、6-カルボキシローダミン6G、6-TAMRA、アベリア(Abberior)(登録商標)スター(STAR)440SXP、アベリア(Abberior)(登録商標)スター(STAR)470SXP、アベリア(Abberior)(登録商標)スター(STAR)488、アベリア(Abberior)(登録商標)スター(STAR)512、アベリア(Abberior)(登録商標)スター(STAR)520SXP、アベリア(Abberior)(登録商標)スター(STAR)580、アベリア(Abberior)(登録商標)スター(STAR)600、アベリア(Abberior)(登録商標)スター(STAR)635、アベリア(Abberior)(登録商標)スター(STAR)635P、アベリア(Abberior)(登録商標)スターレッド(STAR RED)、アレキサフルオル(Alexa Fluor)(登録商標)350、アレキサフルオル(Alexa Fluor)(登録商標)405、アレキサフルオル(Alexa Fluor)(登録商標)430、アレキサフルオル(Alexa Fluor)(登録商標)480、アレキサフルオル(Alexa Fluor)(登録商標)488、アレキサフルオル(Alexa Fluor)(登録商標)514、アレキサフルオル(Alexa Fluor)(登録商標)532、アレキサフルオル(Alexa Fluor)(登録商標)546、アレキサフルオル(Alexa Fluor)(登録商標)555、アレキサフルオル(Alexa Fluor)(登録商標)568、アレキサフルオル(Alexa Fluor)(登録商標)594、アレキサフルオル(Alexa Fluor)(登録商標)610×、アレキサフルオル(Alexa Fluor)(登録商標)633、アレキサフルオル(Alexa Fluor)(登録商標)647、アレキサフルオル(Alexa Fluor)(登録商標)660、アレキサフルオル(Alexa Fluor)(登録商標)680、アレキサフルオル(Alexa Fluor)(登録商標)700、アレキサフルオル(Alexa Fluor)(登録商標)750、アレキサフルオル(Alexa Fluor)(登録商標)790、AMCA、アトー(ATTO)390、アトー(ATTO)425、アトー(ATTO)465、アトー(ATTO)488、アトー(ATTO)495、アトー(ATTO)514、アトー(ATTO)520、アトー(ATTO)532、アトー(ATTO)542、アトー(ATTO)550、アトー(ATTO)565、アトー(ATTO)590、アトー(ATTO)610、アトー(ATTO)620、アトー(ATTO)633、アトー(ATTO)647、アトー(ATTO)647N、アトー(ATTO)655、アトー(ATTO)665、アトー(ATTO)680、アトー(ATTO)700、アトー(ATTO)725、アトー(ATTO)740、アトー(ATTO)Oxa12、アトー(ATTO)Rho101、アトー(ATTO)Rho11、アトー(ATTO)Rho12、アトー(ATTO)Rho13、アトー(ATTO)Rho14、アトー(ATTO)Rho3B、アトー(ATTO)Rho6G、アトー(ATTO)Thio12、BDホライゾン(Horizon)(商標)V450、ボディピー(BODIPY)(登録商標)493/501、ボディピー(BODIPY)(登録商標)530/550、ボディピー(BODIPY)(登録商標)558/568、ボディピー(BODIPY)(登録商標)564/570、ボディピー(BODIPY)(登録商標)576/589、ボディピー(BODIPY)(登録商標)581/591、ボディピー(BODIPY)(登録商標)630/650、ボディピー(BODIPY)(登録商標)650/665、ボディピー(BODIPY)(登録商標)FL、ボディピー(BODIPY)(登録商標)FL-X、ボディピー(BODIPY)(登録商標)R6G、ボディピー(BODIPY)(登録商標)TMR、ボディピー(BODIPY)(登録商標)TR、CALフルオル(Fluor)(登録商標)ゴールド540、CALフルオル(Fluor)(登録商標)グリーン510、CALフルオル(Fluor)(登録商標)オレンジ560、CALフルオル(Fluor)(登録商標)レッド590、CALフルオル(Fluor)(登録商標)レッド610、CALフルオル(Fluor)(登録商標)レッド615、CALフルオル(Fluor)(登録商標)レッド635、カスケード(Cascade)(登録商標)ブルー、CF(商標)350、CF(商標)405M、CF(商標)405S、CF(商標)488A、CF(商標)514、CF(商標)532、CF(商標)543、CF(商標)546、CF(商標)555、CF(商標)568、CF(商標)594、CF(商標)620R、CF(商標)633、CF(商標)633-V1、CF(商標)640R、CF(商標)640R-V1、CF(商標)640R-V2、CF(商標)660C、CF(商標)660R、CF(商標)680、CF(商標)680R、CF(商標)680R-V1、CF(商標)750、CF(商標)770、CF(商標)790、クロメオ(Chromeo)(商標)642、クロミス(Chromis)425N、クロミス(Chromis)500N、クロミス(Chromis)515N、クロミス(Chromis)530N、クロミス(Chromis)550A、クロミス(Chromis)550C、クロミス(Chromis)550Z、クロミス(Chromis)560N、クロミス(Chromis)570N、クロミス(Chromis)577N、クロミス(Chromis)600N、クロミス(Chromis)630N、クロミス(Chromis)645A、クロミス(Chromis)645C、クロミス(Chromis)645Z、クロミス(Chromis)678A、クロミス(Chromis)678C、クロミス(Chromis)678Z、クロミス(Chromis)770A、クロミス(Chromis)770C、クロミス(Chromis)800A、クロミス(Chromis)800C、クロミス(Chromis)830A、クロミス(Chromis)830C、Cy(登録商標)3、Cy(登録商標)3.5、Cy(登録商標)3B、Cy(登録商標)5、Cy(登録商標)5.5、Cy(登録商標)7、ディライト(DyLight)(登録商標)350、ディライト(DyLight)(登録商標)405、ディライト(DyLight)(登録商標)415-Co1、ディライト(DyLight)(登録商標)425Q、ディライト(DyLight)(登録商標)485-LS、ディライト(DyLight)(登録商標)488、ディライト(DyLight)(登録商標)504Q、ディライト(DyLight)(登録商標)510-LS、ディライト(DyLight)(登録商標)515-LS、ディライト(DyLight)(登録商標)521-LS、ディライト(DyLight)(登録商標)530-R2、ディライト(DyLight)(登録商標)543Q、ディライト(DyLight)(登録商標)550、ディライト(DyLight)(登録商標)554-R0、ディライト(DyLight)(登録商標)554-R1、ディライト(DyLight)(登録商標)590-R2、ディライト(DyLight)(登録商標)594、ディライト(DyLight)(登録商標)610-B1、ディライト(DyLight)(登録商標)615-B2、ディライト(DyLight)(登録商標)633、ディライト(DyLight)(登録商標)633-B1、ディライト(DyLight)(登録商標)633-B2、ディライト(DyLight)(登録商標)650、ディライト(DyLight)(登録商標)655-B1、ディライト(DyLight)(登録商標)655-B2、ディライト(DyLight)(登録商標)655-B3、ディライト(DyLight)(登録商標)655-B4、ディライト(DyLight)(登録商標)662Q、ディライト(DyLight)(登録商標)675-B1、ディライト(DyLight)(登録商標)675-B2、ディライト(DyLight)(登録商標)675-B3、ディライト(DyLight)(登録商標)675-B4、ディライト(DyLight)(登録商標)679-C5、ディライト(DyLight)(登録商標)680、ディライト(DyLight)(登録商標)683Q、ディライト(DyLight)(登録商標)690-B1、ディライト(DyLight)(登録商標)690-B2、ディライト(DyLight)(登録商標)696Q、ディライト(DyLight)(登録商標)700-B1、ディライト(DyLight)(登録商標)700-B1、ディライト(DyLight)(登録商標)730-B1、ディライト(DyLight)(登録商標)730-B2、ディライト(DyLight)(登録商標)730-B3、ディライト(DyLight)(登録商標)730-B4、ディライト(DyLight)(登録商標)747、ディライト(DyLight)(登録商標)747-B1、ディライト(DyLight)(登録商標)747-B2、ディライト(DyLight)(登録商標)747-B3、ディライト(DyLight)(登録商標)747-B4、ディライト(DyLight)(登録商標)755、ディライト(DyLight)(登録商標)766Q、ディライト(DyLight)(登録商標)775-B2、ディライト(DyLight)(登録商標)775-B3、ディライト(DyLight)(登録商標)775-B4、ディライト(DyLight)(登録商標)780-B1、ディライト(DyLight)(登録商標)780-B2、ディライト(DyLight)(登録商標)780-B3、ディライト(DyLight)(登録商標)800、ディライト(DyLight)(登録商標)830-B2、ディオミクス(Dyomics)-350、ディオミクス(Dyomics)-350XL、ディオミクス(Dyomics)-360XL、ディオミクス(Dyomics)-370XL、ディオミクス(Dyomics)-375XL、ディオミクス(Dyomics)-380XL、ディオミクス(Dyomics)-390XL、ディオミクス(Dyomics)-405、ディオミクス(Dyomics)-415、ディオミクス(Dyomics)-430、ディオミクス(Dyomics)-431、ディオミクス(Dyomics)-478、ディオミクス(Dyomics)-480XL、ディオミクス(Dyomics)-481XL、ディオミクス(Dyomics)-485XL、ディオミクス(Dyomics)-490、ディオミクス(Dyomics)-495、ディオミクス(Dyomics)-505、ディオミクス(Dyomics)-510XL、ディオミクス(Dyomics)-511XL、ディオミクス(Dyomics)-520XL、ディオミクス(Dyomics)-521XL、ディオミクス(Dyomics)-530、ディオミクス(Dyomics)-547、ディオミクス(Dyomics)-547P1、ディオミクス(Dyomics)-548、ディオミクス(Dyomics)-549、ディオミクス(Dyomics)-549P1、ディオミクス(Dyomics)-550、ディオミクス(Dyomics)-554、ディオミクス(Dyomics)-555、ディオミクス(Dyomics)-556、ディオミクス(Dyomics)-560、ディオミクス(Dyomics)-590、ディオミクス(Dyomics)-591、ディオミクス(Dyomics)-594、ディオミクス(Dy
omics)-601XL、ディオミクス(Dyomics)-605、ディオミクス(Dyomics)-610、ディオミクス(Dyomics)-615、ディオミクス(Dyomics)-630、ディオミクス(Dyomics)-631、ディオミクス(Dyomics)-632、ディオミクス(Dyomics)-633、ディオミクス(Dyomics)-634、ディオミクス(Dyomics)-635、ディオミクス(Dyomics)-636、ディオミクス(Dyomics)-647、ディオミクス(Dyomics)-647P1、ディオミクス(Dyomics)-648、ディオミクス(Dyomics)-648P1、ディオミクス(Dyomics)-649、ディオミクス(Dyomics)-649P1、ディオミクス(Dyomics)-650、ディオミクス(Dyomics)-651、ディオミクス(Dyomics)-652、ディオミクス(Dyomics)-654、ディオミクス(Dyomics)-675、ディオミクス(Dyomics)-676、ディオミクス(Dyomics)-677、ディオミクス(Dyomics)-678、ディオミクス(Dyomics)-679P1、ディオミクス(Dyomics)-680、ディオミクス(Dyomics)-681、ディオミクス(Dyomics)-682、ディオミクス(Dyomics)-700、ディオミクス(Dyomics)-701、ディオミクス(Dyomics)-703、ディオミクス(Dyomics)-704、ディオミクス(Dyomics)-730、ディオミクス(Dyomics)-731、ディオミクス(Dyomics)-732、ディオミクス(Dyomics)-734、ディオミクス(Dyomics)-749、ディオミクス(Dyomics)-749P1、ディオミクス(Dyomics)-750、ディオミクス(Dyomics)-751、ディオミクス(Dyomics)-752、ディオミクス(Dyomics)-754、ディオミクス(Dyomics)-776、ディオミクス(Dyomics)-777、ディオミクス(Dyomics)-778、ディオミクス(Dyomics)-780、ディオミクス(Dyomics)-781、ディオミクス(Dyomics)-782、ディオミクス(Dyomics)-800、ディオミクス(Dyomics)-831、eフルオル(eFluor)(登録商標)450、エオシン、FITC、フルオレセイン、ハイライト(HiLyte)(商標)フルオル(Fluor)405、ハイライト(HiLyte)(商標)フルオル(Fluor)488、ハイライト(HiLyte)(商標)フルオル(Fluor)532、ハイライト(HiLyte)(商標)フルオル(Fluor)555、ハイライト(HiLyte)(商標)フルオル(Fluor)594、ハイライト(HiLyte)(商標)フルオル(Fluor)647、ハイライト(HiLyte)(商標)フルオル(Fluor)680、ハイライト(HiLyte)(商標)フルオル(Fluor)750、IRダイ(IRDye)(登録商標)680LT、IRダイ(IRDye)(登録商標)750、IRダイ(IRDye)(登録商標)800CW、JOE、ライトサイクラー(LightCycler)(登録商標)640R、ライトサイクラー(LightCycler)(登録商標)レッド610、ライトサイクラー(LightCycler)(登録商標)レッド640、ライトサイクラー(LightCycler)(登録商標)レッド670、ライトサイクラー(LightCycler)(登録商標)レッド705、リサミンローダミンB、ナフトフルオレセイン、オレゴングリーン(Oregon Green)(登録商標)488、オレゴングリーン(Oregon Green)(登録商標)514、パシフィックブルー(Pacific Blue)(商標)、パシフィックグリーン(Pacific Green)(商標)、パシフィックオレンジ(Pacific Orange)(商標)、PET、PF350、PF405、PF415、PF488、PF505、PF532、PF546、PF555P、PF568、PF594、PF610、PF633P、PF647P、クエーサー(Quasar)(登録商標)570、クエーサー(Quasar)(登録商標)670、クエーサー(Quasar)(登録商標)705、ローダミン123、ローダミン6G、ローダミンB、ローダミングリーン、ローダミングリーン-X、ローダミンレッド、ROX、セタ(Seta)(商標)375、セタ(Seta)(商標)470、セタ(Seta)(商標)555、セタ(Seta)(商標)632、セタ(Seta)(商標)633、セタ(Seta)(商標)650、セタ(Seta)(商標)660、セタ(Seta)(商標)670、セタ(Seta)(商標)680、セタ(Seta)(商標)700、セタ(Seta)(商標)750、セタ(Seta)(商標)780、セタ(Seta)(商標)APC-780、セタ(Seta)(商標)PerCP-680、セタ(Seta)(商標)R-PE-670、セタ(Seta)(商標)646、セタウ(SeTau)380、セタウ(SeTau)425、セタウ(SeTau)647、セタウ(SeTau)405、スクエア(Square)635、スクエア(Square)650、スクエア(Square)660、スクエア(Square)672、スクエア(Square)680、スルホローダミン101、TAMRA、TET、テキサスレッド(Texas Red)(登録商標)、TMR、TRITC、ヤキマイエロー(Yakima Yellow)(商標)、ゼノン(Zenon)(登録商標)、Zy3、Zy5、Zy5.5、及びZy7の1つ以上から選択される色素を含む。
発光
いくつかの態様では、本願は、発光標識の1つ以上の発光性に基づくポリペプチドシーケンシング及び/又は同定に関する。いくつかの実施形態では、発光標識は、発光寿命、発光強度、輝度、吸収スペクトル、発光スペクトル、発光量子収率、又はそれらの2つ以上の組合せに基づいて同定される。いくつかの実施形態では、複数のタイプの発光標識は、異なる発光寿命、発光強度、輝度、吸収スペクトル、発光スペクトル、発光量子収率、又はそれらの2つ以上の組合せに基づいて互いに識別可能である。同定することは、発光標識に会合する1タイプのアミノ酸(たとえば、単一タイプ又はタイプのサブセット)の厳密なアイデンティティー及び/又は量を割り当てることを意味しうるとともに、他のタイプのアミノ酸と比べてポリペプチド中のアミノ酸位置を割り当てることも意味しうる。
いくつかの実施形態では、発光は、発光標識を一連の個別光パルスに暴露することと、標識から放出される各光子のタイミング又は他の性質を評価することと、により検出される。いくつかの実施形態では、標識から逐次放出される複数の光子の情報は、アグリゲートされ、且つ標識を同定することにより関連アミノ酸のタイプを同定するように評価される。いくつかの実施形態では、標識の発光寿命は、標識から逐次放出される複数の光子から決定され、且つ発光寿命は、標識を同定するために使用可能である。いくつかの実施形態では、標識の発光強度は、標識から逐次放出される複数の光子から決定され、且つ発光強度は、標識を同定するために使用可能である。いくつかの実施形態では、標識の発光寿命及び発光強度は、標識から逐次放出される複数の光子から決定され、且つ発光寿命及び発光強度は、標識を同定するために使用可能である。
本願のいくつかの態様では、単一ポリペプチド分子は、複数の個別光パルスに露出され、且つ一連の放出光子は、検出及び解析される。いくつかの実施形態では、一連の放出光子は、実験の時間にわたり反応サンプル中で変化しない存在する単一ポリペプチド分子に関する情報を提供する。しかしながら、いくつかの実施形態では、一連の放出光子は、反応サンプル中に異なる時間で存在する一連の異なる分子に関する情報を提供する(たとえば、反応又はプロセスが進行する際)。限定されるものではないが例として、かかる情報は、本願に従って化学分解又は酵素分解に付されたポリペプチドをシーケンス及び/又は同定するために使用されうる。
ある特定の実施形態では、発光標識は、一光子を吸収し且つある持続時間後に一光子を放出する。いくつかの実施形態では、標識の発光寿命は、持続時間を測定することにより決定又は推定可能である。いくつかの実施形態では、標識の発光寿命は、複数のパルスイベント及び放出イベントに対して複数の持続時間を測定することによりは決定又は推定可能である。いくつかの実施形態では、標識の発光寿命は、持続時間を測定することにより複数のタイプの標識の発光寿命間で区別可能である。いくつかの実施形態では、標識の発光寿命は、複数のパルスイベント及び放出イベントに対して複数の持続時間を測定することにより複数のタイプの標識の発光寿命間で区別可能である。ある特定の実施形態では、標識は、標識の発光寿命を決定又は推定することにより複数のタイプの標識間で同定又は区別される。ある特定の実施形態では、標識は、複数のタイプの標識の複数の発光寿命間で標識の発光寿命を区別することにより複数のタイプの標識間で同定又は区別される。
発光標識の発光寿命の決定は、いずれかの好適な方法を用いて実施可能である(たとえば、好適な技術を用いて寿命を測定することにより又は放出の時間依存特性を決定することにより)。いくつかの実施形態では、1つの標識の発光寿命を決定することは、他の標識と比べて寿命を決定することを含む。いくつかの実施形態では、標識の発光寿命を決定することは、参照と比べて寿命を決定することを含む。いくつかの実施形態では、標識の発光寿命を決定することは、寿命(たとえば蛍光寿命)を測定することを含む。いくつかの実施形態では、標識の発光寿命を決定することは、寿命の指標となる1つ以上の時間特性を決定することを含む。いくつかの実施形態では、標識の発光寿命は、励起パルスに対する1つ以上の時間ゲートウィンドウ全体にわたり発生する複数の放出イベント(たとえば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、又はそれ以上の放出イベント)の分布に基づいて決定可能である。たとえば、標識の発光寿命は、励起パルスに対して測定された光子到着時間の分布に基づいて異なる発光寿命を有する複数の標識から識別可能である。
発光標識の発光寿命は、標識が励起状態に達した後に放出される光子のタイミングの指標となり、標識は、光子のタイミングの指標となる情報により区別可能であることが認識されるべきである。いくつかの実施形態は、標識により放出される光子に関連付けられる時間を測定することにより標識の発光寿命に基づいて標識を複数の標識から区別することを含みうる。時間の分布は、分布から決定されうる発光寿命の指標を提供しうる。いくつかの実施形態では、標識は、たとえば、時間の分布と既知の標識に対応する参照分布とを比較することにより、時間の分布に基づいて複数の標識から区別可能である。いくつかの実施形態では、発光寿命の値は、時間の分布から決定された。
本明細書で用いられる場合、いくつかの実施形態では、発光強度とは、パルス励起エネルギーの送達により励起されている発光標識により放出される単位時間当たりの放出光子数を意味する。いくつかの実施形態では、発光強度とは、パルス励起エネルギーの送達により励起されている標識により放出され且つ特定センサー又はセンサーのセットにより検出される単位時間当たりの検出放出光子数を意味する。
本明細書で用いられる場合、いくつかの実施形態では、輝度とは、発光標識当たりの平均発光強度について報告するパラメータを意味する。そのため、いくつかの実施形態では、「発光強度」は、1つ以上の標識を含む組成物の輝度を一般に意味するように使用されうる。いくつかの実施形態では、標識の輝度は、その量子収率と吸光係数との積に等しい。
本明細書で用いられる場合、いくつかの実施形態では、発光量子収率とは、放出イベントをもたらす所与の波長又は所与のスペクトル領域内での励起イベントの割合を意味し、典型的には1未満である。いくつかの実施形態では、本明細書に記載の発光標識の発光量子収率は、0~約0.001、約0.001~約0.01、約0.01~約0.1、約0.1~約0.5、約0.5~0.9、又は約0.9~1である。いくつかの実施形態では、標識は、発光量子収率を同定又は推定することにより同定される。
本明細書で用いられる場合、いくつかの実施形態では、励起エネルギーは光源からの光パルスである。いくつかの実施形態では、励起エネルギーは可視スペクトル域にある。いくつかの実施形態では、励起エネルギーは紫外スペクトル域にある。いくつかの実施形態では、励起エネルギーは赤外スペクトル域にある。いくつかの実施形態では、励起エネルギーは、複数の放出光子が検出される発光標識の吸収極大又はその近くにある。ある特定の実施形態では、励起エネルギーは、約500nm~約700nm(たとえば、約500nm~約600nm、約600nm~約700nm、約500nm~約550nm、約550nm~約600nm、約600nm~約650nm、又は約650nm~約700nm)である。ある特定の実施形態では、励起エネルギーは、単色でありうるか又はあるスペクトル領域に閉じ込められうる。いくつかの実施形態では、スペクトル領域は、約0.1nm~約1nm、約1nm~約2nm、又は約2nm~約5nmの領域を有する。いくつかの実施形態では、スペクトル領域は、約5nm~約10nm、約10nm~約50nm、又は約50nm~約100nmの領域を有する。
シーケンシング
本願の態様は、ポリペプチドやタンパク質などの生体ポリマーのシーケンシングに関する。本明細書で用いられる場合、「シーケンシング」、「配列決定」、「配列を決定する」などの用語は、ポリペプチド又はタンパク質に関して、ポリペプチド又はタンパク質の部分配列情報さらには全配列情報の決定を含む。すなわち、この用語は、配列比較、フィンガープリンティング、確率的フィンガープリンティング、及び標的分子に関する同レベルの情報、さらには対象領域内の標的分子の各アミノ酸の明確な同定及び順序付けを含む。いくつかの実施形態では、この用語は、ポリペプチドの単一アミノ酸を同定することを含む。さらに他の実施形態では、ポリペプチドの1アミノ酸超が同定される。本明細書で用いられる場合、いくつかの実施形態では、「同定すること」、「アイデンティティーを決定すること」などの用語は、アミノ酸に関して、アミノ酸の明確なアイデンティティーの決定、さらにはアミノ酸の明確なアイデンティティーの確率の決定を含む。たとえば、いくつかの実施形態では、アミノ酸は、アミノ酸が特定のタイプである確率(たとえば0%~100%)を決定することにより、又は複数の特定のタイプの各々の確率を決定することにより、同定される。それゆえ、いくつかの実施形態では、本明細書で用いられる「アミノ酸配列」、「ポリペプチド配列」、及び「タンパク質配列」という用語は、ポリペプチド又はタンパク質の物質それ自体を意味しうるとともに、特定のポリペプチド又はタンパク質を生化学的に特徴付ける特定の配列情報(たとえば、一方の末端から他方の末端へのアミノ酸の順序を表す一連の文字)に制限されるものではない。
いくつかの実施形態では、ポリペプチド分子のシーケンシングは、ポリペプチド分子中の少なくとも2つ(たとえば、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、又はそれ以上)のアミノ酸を同定することを含む。いくつかの実施形態では、少なくとも2つのアミノ酸は連続アミノ酸である。いくつかの実施形態では、少なくとも2つのアミノ酸は非連続アミノ酸である。
いくつかの実施形態では、ポリペプチド分子のシーケンシングは、ポリペプチド分子中のすべてのアミノ酸の100%未満(たとえば、99%未満、95%未満、90%未満、85%未満、80%未満、75%未満、70%未満、65%未満、60%未満、55%未満、50%未満、45%未満、40%未満、35%未満、30%未満、25%未満、20%未満、15%未満、10%未満、5%未満、1%未満、又はそれ以下)の同定を含む。たとえば、いくつかの実施形態では、ポリペプチド分子のシーケンシングは、ポリペプチド分子中の1タイプのアミノ酸の100%未満の同定(たとえば、ポリペプチド分子中の1タイプのすべてのアミノ酸の一部分の同定)を含む。いくつかの実施形態では、ポリペプチド分子のシーケンシングは、ポリペプチド分子中の各タイプのアミノ酸の100%未満の同定を含む。
いくつかの実施形態では、ポリペプチド分子のシーケンシングは、ポリペプチド中の少なくとも1つ、少なくとも5つ、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70、少なくとも75、少なくとも80、少なくとも85、少なくとも90、少なくとも95、少なくとも100、又はそれ以上のタイプのアミノ酸の同定を含む。
いくつかの実施形態では、本願は、経時的にポリペプチドの末端に存在する一連のアミノ酸を同定することにより(たとえば、末端のアミノ酸の繰返し検出及び切断により)ポリペプチドをシーケンスするための組成物及び方法を提供する。さらに他の実施形態では、本願は、ポリペプチドの標識アミノ含有率を同定することと、参照配列データベースと比較することと、によりポリペプチドをシーケンスするための組成物及び方法を提供する。
いくつかの実施形態では、本願は、ポリペプチドの複数の断片をシーケンスすることによりポリペプチドをシーケンスするための組成物及び方法を提供する。いくつかの実施形態では、ポリペプチドをシーケンスすることは、複数のポリペプチド断片の配列情報を組み合わせてポリペプチドの配列を同定及び/又は決定する工程を含む。いくつかの実施形態では、配列情報を組み合わせることは、コンピュータハードウェア及びソフトウェアにより実施されうる。本明細書に記載の方法は、関連ポリペプチドのセット、たとえば、生物の全プロテオームのシーケンシングを可能にし得る。いくつかの実施形態では、本出願の態様に従って複数の単一分子シーケンシング反応がパラレルに実施される(たとえば、単一チップ上で)。たとえば、いくつかの実施形態では、複数の単一分子シーケンシング反応は、各々、単一チップ上の個別サンプルウェル中で実施される。
いくつかの実施形態では、本明細書に提供される方法は、タンパク質の複合混合物を含むサンプル中の個別タンパク質のシーケンシング及び同定に使用されうる。いくつかの実施形態では、本願は、タンパク質の複合混合物中の個別タンパク質をユニークに同定する方法を提供する。いくつかの実施形態では、個別タンパク質は、タンパク質の部分アミノ酸配列を決定することにより混合サンプルで検出される。いくつかの実施形態では、タンパク質の部分アミノ酸配列は、おおよそ5~50アミノ酸の連続ストレッチ内にある。
いかなる特定理論にも拘束されることを望むものではないが、ほとんどのヒトタンパク質は、プロテオミックデータベースを参照して不完全配列情報を用いて同定可能であると考えられる。たとえば、ヒトプロテオームの単純モデリングは、6~40アミノ酸のストレッチ内のちょうど4つのタイプのアミノ酸を検出することによりタンパク質のおおよそ98%をユニークに同定可能であることを示した(たとえば、スワミナサン(Swaminathan)ら著、プロス・コンピーテーショナル・バイオロジー(PLoS Comput Biol.)、2015年、第11巻、第2号、p.e1004080、及びヤオ(Yao)ら著、フィジカル・バイオロジー(Phys.Biol.)、2015年、第12巻、第5号、p.055003を参照されたい)。したがって、タンパク質の複合混合物は、おおよそ6~40アミノ酸の短いポリペプチド断片に分解(たとえば、化学分解、酵素分解)可能であり、且つこのポリペプチドライブラリーのシーケンシングは、元の複合混合物中に存在するタンパク質の各々のアイデンティティー及び存在量を明らかにするであろう。選択的アミノ酸標識化と部分配列情報を決定することによるポリペプチドの同定とを行うための組成物及び方法は、「単一分子ペプチドシーケンシング(SINGLE MOLECULE PEPTIDE SEQUENCING)」という名称の2015年9月15日出願の米国特許出願第15/510,962号明細書(その全体が参照により組み込まれる)に詳細に記載されている。
実施形態は、少なくとも約50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%、99.99%、99.999%、又は99.9999%の確度などの高確度で単一ポリペプチド分子をシーケンス可能である。いくつかの実施形態では、単一分子シーケンシングに使用される標的分子は、サンプルウェルのボトム表面や側壁表面などの固形担体の表面に固定されるポリペプチドである。サンプルウェルはまた、本願に係るシーケンシング反応に必要とされるいずれかの他の試薬、たとえば、1つ以上の好適な緩衝液、補因子、標識アフィニティー試薬、及び酵素(たとえば、発光標識又は非標識でありうる触媒活性又は不活性のエキソペプチダーゼ酵素)を含有可能である。
以上に記載されるように、いくつかの実施形態では、本願に係るシーケンシングは、アミノ酸が特定のタイプである確率を決定することによりアミノ酸を同定することを含む。従来のタンパク質同定システムは、ポリペプチドを同定するためにポリペプチド中の各アミノ酸の同定を必要とする。しかしながら、ポリペプチド中の各アミノ酸を正確に同定するのは困難である。たとえば、第1の認識分子が第1のアミノ酸に会合する相互作用から収集されるデータは、第2の認識分子が第2のアミノ酸に会合する相互作用から収集されるデータと2つのアミノ酸を区別するのに十分に程度に異ならないおそれがある。いくつかの実施形態では、本願に係るシーケンシングは、従来のタンパク質同定システムとは異なりタンパク質中の各アミノ酸の同定を必要としない(ただし、除外するものではない)タンパク質同定システムを用いることによりこの問題を回避する。
それゆえ、いくつかの実施形態では、本願に係るシーケンシングは、タンパク質を同定するために機械学習技術を使用するタンパク質同定システムを用いて行われうる。いくつかの実施形態では、システムは、(1)リアルタイムタンパク質シーケンシングデバイスを用いてタンパク質のポリペプチドに関するデータを収集することと、(2)機械学習モデル及び収集データを用いてある特定のアミノ酸がそれぞれの位置でポリペプチドの一部である確率を同定することと、(3)「確率的フィンガープリント」として同定確率を用いてタンパク質を同定することと、により動作する。いくつかの実施形態では、タンパク質のポリペプチドに関するデータは、アミノ酸に選択的に結合する試薬を用いて得られうる。例として、試薬及び/又はアミノ酸は、励起エネルギーの適用に反応して光を放出する発光標識で標識されうる。この例では、タンパク質シーケンシングデバイスは、試薬とサンプル中のアミノ酸との結合相互作用時にタンパク質(たとえばポリペプチド)のサンプルに励起エネルギーを適用しうる。いくつかの実施形態では、配列決定デバイスの1つ以上のセンサー(たとえば、光検出器、電気センサー、及び/又はいずれかの他の好適なタイプのセンサー)は、結合相互作用時に検出しうる。一方、検出光放出から収集及び/又は取得されるデータは、機械学習モデルに提供されうる。機械学習モデル並びに関連システム及び方法は、「機械学習で実行可能なタンパク質同定(MACHINE LEARNING ENABLED PROTEIN IDENTIFICATION)」という名称の2019年6月12日出願の米国仮特許出願第62/860,750号明細書(その全体が参照により組み込まれる)に詳細に記載されている。
本願に係るシーケンシングは、いくつかの態様では、ポリペプチドを基材(たとえば、固形担体、たとえば、チップ、たとえば、本明細書に記載のインテグレートデバイス)の表面上に固定することを含みうる。いくつかの実施形態では、ポリペプチドは、基材上のサンプルウェルの表面上(たとえば、サンプルウェルのボトム表面上)に固定されうる。いくつかの実施形態では、ポリペプチドのN末端アミノ酸が固定される(たとえば、表面に装着される)。いくつかの実施形態では、ポリペプチドのC末端アミノ酸が固定される(たとえば、表面に装着される)。いくつかの実施形態では、1つ以上の非末端アミノ酸が固定される(たとえば、表面に装着される)。固定アミノ酸は、たとえば、本願に記載されるように、いずれかの好適な共有結合性又は非共有結合性連結を用いて装着可能である。いくつかの実施形態では、複数のポリペプチドが複数のサンプルウェルに、たとえば、基材上のサンプルウェルのアレイ中に装着される(たとえば、各サンプルウェルの表面たとえばボトム表面に1つのポリペプチドが装着される)。
本願に係るシーケンシングは、いくつかの態様では、単一分子分析を可能にするシステムを用いて実施されうる。システムは、インテグレートデバイスと、インテグレートデバイスにインターフェースするように構成された機器と、を含みうる。インテグレートデバイスは、ピクセルのアレイを含みうるとともに、個別ピクセルは、サンプルウェルと少なくとも1つの光検出器とを含む。インテグレートデバイスのサンプルウェルは、インテグレートデバイスの表面上又は表面全体にわたり形成されうるとともに、インテグレートデバイスの表面上に配置されたサンプルを受け取るように構成されうる。全体として、サンプルウェルは、サンプルウェルのアレイとみなされうる。複数のサンプルウェルは、サンプルウェルの少なくとも一部分が単一サンプル(たとえば、ポリペプチドなどの単一分子)を受け取るように好適なサイズ及び形状を有しうる。いくつかの実施形態では、サンプルウェル内のサンプルの数は、いくつかのサンプルウェルが1つのサンプルを含有し、一方、他のものがゼロ、2、又はそれ以上のサンプルを含有するように、インテグレートデバイスのサンプルウェル内に分配されうる。
励起光は、インテグレートデバイスの外部の1つ以上の光源からインテグレートデバイスに提供される。インテグレートデバイスの光学コンポーネントは、光源から励起光を受け取り、光をインテグレートデバイスのサンプルウェルのアレイにダイレクトし、そしてサンプルウェル内の照射領域を照明しうる。いくつかの実施形態では、サンプルウェルは、サンプルウェルの表面に近接してサンプルを保持できるようにするとともにサンプルへの励起光の送達及びサンプルからの放出光の検出を容易にしうる構成を有しうる。照明領域内に位置決めされるサンプルは、励起光により照明されるとそれに反応して放出光を放出しうる。たとえば、サンプルは、励起光の照明を介して励起状態を達成するとそれに反応して光を放出する蛍光マーカーで標識されうる。次いで、サンプルにより放出される放出光は、分析されるサンプルを有するサンプルウェルに対応するピクセル内の1つ以上の光検出器により検出されうる。いくつかの実施形態によれば数がおおよそ10,000ピクセル~1,000,000ピクセルの範囲内でありうるサンプルウェルのアレイ全体にわたり実施されるとき、複数のサンプルはパラレルに分析可能である。
インテグレートデバイスは、励起光を受け取って励起光をサンプルウェルアレイ間にダイレクトするための光学システムを含みうる。光学システムは、インテグレートデバイスに励起光を結合して他の光学コンポーネントに励起光をダイレクトするように構成された1つ以上のグレーティングカプラーを含みうる。光学システムは、グレーティングカプラーからサンプルウェルアレイに向けて励起光をダイレクトする光学コンポーネントを含みうる。かかる光学コンポーネントは、光学スプリッターと光学コンバイナーとウェーブガイドとを含みうる。いくつかの実施形態では、1つ以上の光学スプリッターは、グレーティングカプラーからの励起光を結合して励起光をウェーブガイドの少なくとも1つに送達しうる。いくつかの実施形態によれば、光学スプリッターは、ウェーブガイドの各々が実質的に類似した量の励起光を受け取るようにすべてのウェーブガイドにわたり実質的に均一な励起光の送達を可能にする構成を有しうる。かかる実施形態は、インテグレートデバイスのサンプルウェルが受け取る励起光の均一性を改善することによりインテグレートデバイスの性能を改善しうる。たとえば、サンプルウェルに励起光を結合するために及び/又は光検出器に放出光をダイレクトするために、インテグレートデバイスに含めるのに好適なコンポーネントの例は、「分子をプローブ、検出、及び分析するためのインテグレートデバイス(INTEGRATED DEVICE FOR PROBING,DETECTING AND ANALYZING MOLECULES)」という名称の2015年8月7日出願の米国特許出願第14/821,688号明細書、及び「分子をプローブ、検出、及び分析するための外部光源付きインテグレートデバイス(INTEGRATED DEVICE WITH EXTERNAL LIGHT SOURCE FOR PROBING,DETECTING,AND ANALYZING MOLECULES)」という名称の2014年11月17日出願の米国特許出願第14/543,865号明細書(両方ともその全体が参照により組み込まれる)に記載されている。インテグレートデバイスに実装されうる好適なグレーティングカプラー及びウェーブガイドの例は、「光カプラー及びウェーブガイドシステム(OPTICAL COUPLER AND WAVEGUIDE SYSTEM)」という名称の2017年12月15日出願の米国特許出願第15/844,403号明細書(その全体が参照により組み込まれる)に記載されている。
追加のフォトニック構造は、サンプルウェルと光検出器との間に位置決めされうるとともに、放出光の検出時にシグナルノイズに寄与するおそれのある光検出器に達する励起光を低減又は予防するように構成されうる。いくつかの実施形態では、インテグレートデバイスの回路として作用しうる金属層はまた、空間フィルターとしても作用しうる。好適なフォトニック構造の例は、分光フィルターと偏光フィルターと空間フィルターとを含みうるとともに、「光拒絶フォトニック構造(OPTICAL REJECTION PHOTONIC STRUCTURES)」という名称の2018年7月23日出願の米国特許出願第16/042,968号明細書(その全体が参照により組み込まれる)に記載されている。
インテグレートデバイスから離れて位置決めされるコンポーネントは、インテグレートデバイスに励起源を位置決め及びアライメントするために使用されうる。かかるコンポーネントは、レンズ、ミラー、プリズム、ウィンドウ、アパーチャ、アテニュエータ、及び/又は光ファイバーをはじめとする光学コンポーネントを含みうる。追加の機械的コンポーネントは、1つ以上のアライメントコンポーネントの制御を可能にするために機器に含まれうる。かかる機械的コンポーネントは、アクチュエーター、ステッパーモータ、及び/又はノブを含みうる。好適な励起源及びアライメント機構の例は、「パルスレーザー及びシステム(PULSED LASER AND SYSTEM)」という名称の2016年5月20日出願の米国特許出願第15/161,088号明細書(その全体が参照により組み込まれる)に記載されている。ビームステアリングモジュールの他の一例は、「コンパクトビーム整形及びステアリングアセンブリー(COMPACT BEAM SHAPING AND STEERING ASSEMBLY)」という名称の2017年12月14日出願の米国特許出願第15/842,720号明細書(参照により本明細書に組み込まれる)に記載されている。好適な励起源の追加の例は、「分子をプローブ、検出、及び分析するためのインテグレートデバイス(INTEGRATED DEVICE FOR PROBING,DETECTING AND ANALYZING MOLECULES)」という名称の2015年8月7日出願の米国特許出願第14/821,688号明細書(その全体が参照により組み込まれる)に記載されている。
インテグレートデバイスの個別ピクセルと共に位置決めされる光検出器は、ピクセルの対応するサンプルウェルからの放出光を検出するように構成及び位置決めされうる。好適な光検出器の例は、「受け取った光子の時間ビニングのためのインテグレートデバイス(INTEGRATED DEVICE FOR TEMPORAL BINNING OF RECEIVED PHOTONS)」という名称の2015年8月7日出願の米国特許出願第14/821,656号明細書(その全体が参照により組み込まれる)に記載されている。いくつかの実施形態では、サンプルウェル及びそのそれぞれの光検出器は、共通軸に沿ってアライメントされうる。こうすると、光検出器は、ピクセル内のサンプルウェルにオーバーラップしうる。
検出放出光の特性は、放出光に関連付けられるマーカーを同定するための指標を提供しうる。かかる特性は、光検出器により検出される光子の到着時間、光検出器により経時的に蓄積される光子の量、及び/又は2つ以上の光検出器にわたる光子の分布をはじめとするいずれかの好適なタイプの特性を含みうる。いくつかの実施形態では、光検出器は、サンプルの放出光に関連付けられる1つ以上のタイミング特性(たとえば発光寿命)の検出を可能にする構成を有しうる。光検出器は、励起光のパルスがインテグレートデバイスを介して伝搬した後の光子到着時間の分布を検出しうるとともに、到着時間の分布は、サンプルの放出光のタイミング特性の指標(たとえば、発光寿命のプロキシ)を提供しうる。いくつかの実施形態では、1つ以上の光検出器は、マーカーにより放出される放出光の確率の指標(たとえば発光強度)を提供する。いくつかの実施形態では、複数の光検出器は、放出光の空間分布をキャプチャーするようにサイズ決め及び配置されうる。次いで、1つ以上の光検出器からの出力シグナルは、複数のマーカー間でマーカーを区別するために使用されうるとともに、複数のマーカーは、サンプル中のサンプルを同定するために使用されうる。いくつかの実施形態では、サンプルは、複数の励起エネルギーにより励起されうるとともに、複数の励起エネルギーに反応してサンプルにより放出される放出光及び/又は放出光のタイミング特性は、マーカーを複数のマーカーから区別しうる。
動作時、励起光を用いてウェル内のサンプルの一部又は全部を励起することと、サンプル放出からのシグナルを光検出器で検出することと、により、サンプルウェル内のサンプルのパラレル分析が行われる。サンプルからの放出光は、対応する光検出器により検出されて少なくとも1つの電気シグナルに変換されうる。電気シグナルは、インテグレートデバイスの回路内の伝導ラインに沿って伝達されうるとともに、インテグレートデバイスにインターフェースされた機器に接続されうる。電気シグナルは、後続処理及び/又は解析されうる。電気シグナルの処理又は解析は、機器上又は機器外のどちらかに位置する好適なコンピューティングデバイスで行われうる。
機器は、機器及び/又はインテグレートデバイスの動作を制御するためのユーザインターフェースを含みうる。ユーザインターフェースは、ユーザによる機器への情報の入力、たとえば、機器の機能を制御するために使用されるコマンド及び/又は設定値などの情報の入力を可能にするように構成されうる。いくつかの実施形態では、ユーザインターフェースは、ボタン、スイッチ、ダイヤル、及び音声コマンド用マイクロフォンを含みうる。ユーザインターフェースは、機器及び/又はインテグレートデバイスの性能に関するフィードバック、たとえば、適正アライメント及び/又はインテグレートデバイス上の光検出器からのリードアウトシグナルにより得られる情報、のユーザによる受取りを可能にしうる。いくつかの実施形態では、ユーザインターフェースは、オーディブルフィードバックを提供するためにスピーカーを用いたフィードバックを提供しうる。いくつかの実施形態では、ユーザインターフェースは、ユーザにビジュアルフィードバックを提供するためにインジケータライト及び/又はディスプレイスクリーンを含みうる。
いくつかの実施形態では、機器は、コンピューティングデバイスに接続するように構成されたコンピュータインターフェースを含みうる。コンピュータインターフェースは、USBインターフェース、ファイヤワイヤ(FireWire)(商標)インターフェース、又はいずれかの他の好適なコンピュータインターフェースでありうる。コンピューティングデバイスは、ラップトップコンピュータやデスクトップコンピュータなどのいずれかの汎用コンピュータでありうる。いくつかの実施形態では、コンピューティングデバイスは、好適なコンピュータインターフェースを経由してワイヤレスネットワークを介してアクセス可能なサーバ(たとえば、クラウドベースサーバ)でありうる。コンピュータインターフェースは、機器とコンピューティングデバイスとの間の情報の通信を促進しうる。コンピューティングデバイスへの機器を制御及び/又は構成するための入力情報は、提供され得、及びコンピュータインターフェースを介して機器に伝達され得る。機器により発生する出力情報は、コンピュータインターフェースを経由してコンピューティングデバイスにより受け取られうる。出力情報は、機器の性能に関するフィードバック、インテグレートデバイスの性能、及び/又は光検出器のリードアウトシグナルから発生するデータを含みうる。
いくつかの実施形態では、機器は、インテグレートデバイスの1つ以上の光検出器から受け取ったデータを解析するように及び/又は励起源に制御シグナルを伝達するように構成された処理デバイスを含みうる。いくつかの実施形態では、処理デバイスは、汎用プロセッサー、特化(specially-adapted)プロセッサー(たとえば、中央処理ユニット(CPU)、たとえば、1つ以上のマイクロプロセッサーコア若しくはマイクロコントローラコア、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、カスタム集積回路、ディジタルシグナルプロセッサー(DSP)、又はそれらの組合せ)を含みうる。いくつかの実施形態では、1つ以上の光検出器からのデータの処理は、機器の処理デバイス及び外部コンピューティングデバイスの両方により実施されうる。他の実施形態では、外部コンピューティングデバイスは省略されうるとともに、1つ以上の光検出器からのデータの処理は、インテグレートデバイスの処理デバイスのみにより実施されうる。
いくつかの実施形態によれば、発光放出特性に基づいてサンプルを解析するように構成された機器は、異なる発光分子間の発光寿命及び/若しくは強度の差並びに/又は異なる環境の同一発光分子の寿命及び/若しくは強度の差を検出しうる。発光放出寿命の差は、異なる発光分子の存在若しくは不在を見分けるために及び/又は発光分子が晒される異なる環境若しくは条件を見分けるために使用可能であることを、本発明者らは認識し高く評価した。いくつかの場合には、寿命(たとえば、発光波長ではない)に基づいて発光分子を見分けることは、システムの態様を単純化しうる。例として、波長識別光学素子(たとえば、波長フィルター、各波長の専用検出器、異なる波長の専用パルス光源、及び/又は回折光学素子)は、寿命に基づいて発光分子を見分けるときに数が低減されうるか又は排除されうる。いくつかの場合には、単一特性波長で動作する単一パルス光源は、光学スペクトルの同一波長領域内で放出するが測定可能に異なる寿命を有する異なる発光分子を励起するために使用されうる。同一波長領域に放出する異なる発光分子を励起して見分けるために、異なる波長で動作する複数の光源ではなく単一のパルス光源を使用する解析システムは、動作及び維持の複雑さが軽減され、よりコンパクトになりうるとともに、より低コストで製造されうる。
発光寿命解析に基づく解析システムはある特定の利益を有しうるが、解析システムにより得られる情報量及び/又は検出確度は、追加の検出技術を許容すれば増加させうる。たとえば、システムのいくつかの実施形態は、発光波長及び/又は発光強度に基づいてサンプルの1つ以上の性質を見分けるように追加的に構成されうる。いくつかの実現形態では、発光強度は、異なる発光標識を区別するために追加的又は代替的に使用されうる。たとえば、いくつかの発光標識は、それらの減衰率が類似しているおそれがあったとしても、有意に異なる強度で放出しうるか又はそれらの励起確率に有意差(たとえば、少なくとも約35%の差)を有しうる。測定励起光に対してビンシグナルを参照することにより、強度レベルに基づいて異なる発光標識を区別可能でありうる。
いくつかの実施形態によれば、異なる発光寿命は、発光標識の励起に続く発光放出イベントを時間ビンするように構成された光検出器を用いて区別されうる。時間ビニングは、光検出器に対する単一電荷蓄積サイクル時に発生しうる。電荷蓄積サイクルは、光発生キャリヤーが時間ビニング光検出器のビンに蓄積されるリードアウトイベント間のインターバルである。時間ビニング光検出器の例は、「受け取った光子の時間ビニングのためのインテグレートデバイス(INTEGRATED DEVICE FOR TEMPORAL BINNING OF RECEIVED PHOTONS)」という名称の2015年8月7日出願の米国特許出願第14/821,656号明細書(参照により本明細書に組み込まれる)に記載されている。いくつかの実施形態では、時間ビニング光検出器は、光子吸収/キャリヤー発生領域で電荷キャリヤーを発生して電荷キャリヤー貯蔵領域の電荷キャリヤー貯蔵ビンに電荷キャリヤーを直接移送しうる。かかる実施形態では、時間ビニング光検出器は、キャリヤー移動/キャプチャー領域を含まないこともありうる。かかる時間ビニング光検出器は、「直接ビニングピクセル」といいうる。直接ビニングピクセルを含む時間ビニング光検出器の例は、「直接ビニングピクセルを備えたインテグレート光検出器(INTEGRATED PHOTODETECTOR WITH DIRECT BINNING PIXEL)」という名称の2017年12月22日出願の米国特許出願第15/852,571号明細書(参照により本明細書に組み込まれる)に記載されている。
いくつかの実施形態では、各試薬が発光強度に基づいて同定されうるように、同一タイプの異数のフルオロフォアがサンプル中の異なる試薬に連結されうる。たとえば、2つのフルオロフォアは、第1の標識アフィニティー試薬に連結されうるとともに、4つ以上のフルオロフォアは、第2の標識アフィニティー試薬に連結されうる。異数のフルオロフォアであるため、異なるアフィニティー試薬に関連付けられる異なる励起確率及びフルオロフォア放出確率が存在しうる。たとえば、第2の標識アフィニティー試薬では、シグナル蓄積インターバル時、より多くの放出イベントが存在しうるので、ビンの見掛けの強度は、第1の標識アフィニティー試薬よりも有意に高くなる。
フルオロフォア減衰率及び/又はフルオロフォア強度に基づいてヌクレオチド又はいずれかの他の生物学的若しくは化学的サンプルを区別することは、光学励起及び検出システムの単純化を可能にしうることを、本発明者らは認識し高く評価した。たとえば、光学励起は、単一波長光源(たとえば、複数の光源ではなく1つの特性波長を生成する光源又は複数の異なる特性波長で動作する光源)で実施されうる。そのほか、波長識別光学素子及びフィルターは、検出システムに必要とされないこともありうる。また、異なるフルオロフォアからの放出を検出するために、各サンプルウェルに対して単一光検出器が使用されうる。「特性波長」又は「波長」という語句は、放射線の限定バンド幅内の中心波長又は主波長(たとえば、パルス光源による20nmバンド幅出力内の中心波長又はピーク波長)を意味するものとして用いられる。いくつかの場合には、「特性波長」又は「波長」は、光源による放射線出力の合計バンド幅内のピーク波長を意味するものとして用いられうる。
計算技術
本出願の態様は、本明細書に記載のポリペプチドシーケンシング技術により発生したデータを解析するための計算技術に関する。以上で考察されるように、たとえば、図1A及び1Bとの関連では、これらのシーケンシング技術を用いて発生したデータは、シーケンスされるポリペプチドの末端に露出されるアミノ酸にアミノ酸認識分子が会合するインスタンスの指標となる一連のシグナルパルスを含みうる。一連のシグナルパルスは、分解プロセスが逐次アミノ酸を除去して進行するにつれて経時的にその時点の末端のアミノ酸のタイプに依存して、さまざまな1つ以上のフィーチャー(たとえば、パルス持続時間、パルス間持続時間、大きさの変化)を有しうる。得られるシグナルトレースは、それぞれのアミノ酸に関連付けられるさまざまな1つ以上のフィーチャーから生じる特性パターンを含みうる。本明細書に記載の計算技術は、アミノ酸配列を同定するためにこれらのシーケンシング技術を用いて得られるかかるデータを解析する部分として実現されうる。
いくつかの実施形態は、ポリペプチドの分解プロセス時のデータを得ることと、分解プロセス時にポリペプチドの末端に逐次露出されるアミノ酸に対応するデータの部分を決定するようにデータを解析することと、ポリペプチドに相当するアミノ酸配列を出力すること、を含みうる。図11は、本明細書に記載のポリペプチドシーケンシング技術を用いて得られるデータを解析することによりアミノ酸配列を同定するための例示的処理パイプライン1100の図である。図11に示されるように、シーケンシングデータ1102を解析することは、会合イベント同定技術1104とアミノ酸同定技術1106とを用いてアミノ酸配列1108を出力することを含みうる。
本明細書で考察されるように、シーケンシングデータ1102は、ポリペプチドの分解プロセス時に得られうる。いくつかの実施形態では、シーケンシングデータ1102は、分解プロセス時のポリペプチドの末端のアミノ酸アイデンティティーの指標となる。いくつかの実施形態では、シーケンシングデータ1102は、分解プロセス時に末端の異なるタイプの末端アミノ酸に結合する1つ以上のアミノ酸認識分子により生成されるシグナルの指標となる。模範的シーケンシングデータは、以上で考察される図1A及び1Bに示される。
分解プロセス時にシグナルがどのように発生するかに依存して、シーケンシングデータ1102は、1つ以上の異なるタイプのシグナルの指標となりうる。いくつかの実施形態では、シーケンシングデータ1102は、分解プロセス時に発生する発光シグナルの指標となる。たとえば、発光標識は、アミノ酸認識分子を標識するために使用されうるとともに、発光標識により放出される発光は、アミノ酸認識分子が特定アミノ酸に会合して発光シグナルをもたらすときに検出されうる。いくつかの実施形態では、シーケンシングデータ1102は、分解プロセス時に発生する電気シグナルの指標となる。たとえば、シーケンスされるポリペプチド分子は、ナノポアに固定されうるとともに、電気シグナル(たとえば、コンダクタンスの変化)は、アミノ酸認識分子が特定アミノ酸に会合するときに検出されうる。
いくつかの実施形態は、分解プロセス時にポリペプチドの末端に逐次露出されるアミノ酸に対応するシーケンシングデータ1102の部分を決定するようにシーケンシングデータ1102を解析することを含む。図11に示されるように、会合イベント同定技術1104は、シーケンシングデータ1102にアクセスして会合イベントに対応するシーケンシングデータ1102の部分を同定するようにシーケンシングデータを解析しうる。会合イベントは、データ中では図1Bに示されるCPやCPなどの特性パターンに対応しうる。いくつかの実施形態では、会合イベント同定技術1104は、一連の切断イベントを検出することと、逐次切断イベント間のシーケンシングデータ1102の部分を決定することと、を含みうる。例として、図1Bに示されるCPとCPとの間の切断イベントは、CPに対応するデータの第1の部分が第1の会合イベントとして同定されうるとともに、CPに対応するデータの第2の部分が第2の会合イベントとして同定されうるように、検出されうる。
いくつかの実施形態は、シーケンシングデータ1102の決定部分の1つ以上に対してアミノ酸のタイプを同定することを含む。図11に示されるように、アミノ酸同定技術1106は、会合イベント同定技術1104により同定された会合イベントの1つ以上に対してアミノ酸のタイプを決定するために使用されうる。いくつかの実施形態では、会合イベント同定技術1104より同定されるデータの個別部分は、パルスパターンを含みうるとともに、アミノ酸同定技術の1106は、そのそれぞれのパルスパターンに基づいて1つ以上の部分に対してアミノ酸のタイプを決定しうる。図1Bを参照して、アミノ酸同定技術1106は、CPに対して第1のタイプのアミノ酸及びCPに対して第2のタイプのアミノ酸を同定しうる。いくつかの実施形態では、アミノ酸のタイプを決定することは、データが閾値超であるときの会合イベント同定技術1104を用いて同定される部分などのデータの部分内の時間量を同定することと、データの部分に対して時間量と持続時間とを比較することと、を含みうる。たとえば、CPに対してアミノ酸のタイプを同定することは、シグナルが閾値超である場合のCP内の時間量、たとえば、シグナルがM超である場合の時間帯pdを決定することと、CPに対してそれを合計持続時間と比較することと、を含みうる。いくつかの実施形態では、アミノ酸のタイプを決定することは、会合イベント同定技術1102により同定されたデータの1つ以上の部分に対して1つ以上のパルス持続時間を同定することを含みうる。たとえば、CPに対してアミノ酸のタイプを同定することは、CPに対して時間帯pdなどのパルス持続時間を決定することを含みうる。いくつかの実施形態では、アミノ酸のタイプを決定することは、会合イベント同定技術1104を用いて同定されたデータの1つ以上の部分に対して1つ以上のパルス間持続時間を同定することを含みうる。たとえば、CPに対してアミノ酸のタイプを同定することは、ipdなどのパルス間持続時間を同定することを含みうる。
シーケンシングデータ1102の逐次部分に対してアミノ酸のタイプを同定することにより、アミノ酸同定技術1106は、ポリペプチドに相当するアミノ酸配列1108を出力しうる。いくつかの実施形態では、アミノ酸配列は、会合イベント同定技術1104を用いて同定されたデータの部分に対応する一連のアミノ酸を含む。
図12は、本明細書に記載の技術のいくつかの実施形態に係るポリペプチド分子のアミノ酸配列を決定するための例示的プロセス1200のフローチャートである。プロセス1200は、本明細書に記載の技術の態様がこの態様に限定されないので、いずれかの好適なコンピューティングデバイス(たとえば、単一コンピューティングデバイス、単一物理的位置に共配置された又は互いに離れた複数の物理的位置に配置された複数のコンピューティングデバイス、クラウドコンピューティングシステムの1つ以上のコンピューティングデバイス部分など)で実施されうる。いくつかの実施形態では、会合イベント同定技術1104及びアミノ酸同定技術1106は、アミノ酸配列を決定するためにプロセス1200の一部又は全部を実施しうる。
プロセス1200は、単一ポリペプチド分子と1つ以上の末端アミノ酸認識分子とを接触させることを含む動作1202で始まる。次に、プロセス1200は、1つ以上の末端アミノ酸認識分子と、単一ポリペプチドが分解されている間に単一ポリペプチドの末端に露出される逐次アミノ酸と、の会合の指標となる一連のシグナルパルスを検出することを含む動作1104に進む。一連のパルスは、たとえば、会合イベント同定技術1104及びアミノ酸同定技術1106を用いることにより、単一ポリペプチド分子のシーケンシングを可能にしうる。
いくつかの実施形態では、プロセス1200は、たとえば、アミノ酸同定技術1106を用いることにより、一連のシグナルパルスの第1の特性パターンに基づいて単一ポリペプチド分子の第1のタイプのアミノ酸を同定することを含む動作1206を含みうる。
図13は、本明細書に記載の技術のいくつかの実施形態に係るポリペプチドに相当するアミノ酸配列を決定するための例示的プロセス1300のフローチャートである。プロセス1300は、本明細書に記載の技術の態様がこの態様に限定されないので、いずれかの好適なコンピューティングデバイス(たとえば、単一コンピューティングデバイス、単一物理的位置に共配置された又は互いに離れた複数の物理的位置に配置された複数のコンピューティングデバイス、クラウドコンピューティングシステムの1つ以上のコンピューティングデバイス部分など)で実施されうる。いくつかの実施形態では、会合イベント同定技術1104及びアミノ酸同定技術1106は、アミノ酸配列を決定するためにプロセス1300の一部又は全部を実施しうる。
プロセス1300は、ポリペプチドの分解プロセス時のデータが得られる動作1302で始まる。いくつかの実施形態では、データは、分解プロセス時のポリペプチドの末端のアミノ酸アイデンティティーの指標となる。いくつかの実施形態では、データは、分解プロセス時に末端の異なるタイプの末端アミノ酸に結合する1つ以上のアミノ酸認識分子により生成されるシグナルの指標となる。いくつかの実施形態では、データは、分解プロセス時に発生する発光シグナルの指標となる。いくつかの実施形態では、データは、分解プロセス時に発生する電気シグナルの指標となる。
次に、プロセス1300は動作1304に進み、そこでデータが解析されて、たとえば、会合イベント同定技術1104及びアミノ酸同定技術1106を用いることにより、分解プロセス時にポリペプチドの末端に逐次露出されるアミノ酸に対応するデータの部分が決定される。いくつかの実施形態では、データを解析することは、一連の切断イベントを検出することと、たとえば、会合イベント同定技術1104を用いることにより、逐次切断イベント間のデータの部分を決定することと、をさらに含む。
いくつかの実施形態では、データを解析することは、たとえば、アミノ酸同定技術1106を用いることにより、個別部分の各々に対してアミノ酸のタイプを決定することをさらに含む。いくつかの実施形態では、個別部分の各々は、パルスパターンを含み、且つデータを解析することは、そのそれぞれのパルスパターンに基づいて1つ以上の部分に対してアミノ酸のタイプを決定することをさらに含む。いくつかの実施形態では、アミノ酸のタイプを決定することは、データが閾値超であるときの部分内の時間量を同定することと、部分に対して時間量と持続時間とを比較することと、をさらに含む。いくつかの実施形態では、アミノ酸のタイプを決定することは、1つ以上の部分の各々に対して少なくとも1つのパルス持続時間を同定することをさらに含む。いくつかの実施形態では、アミノ酸のタイプを決定することは、1つ以上の部分の各々に対して少なくとも1つのパルス間持続時間を同定することをさらに含む。
次に、プロセス1300は動作1306に進み、そこでたとえば、ユーザインターフェースを介して、ポリペプチドに相当するアミノ酸配列が出力される。いくつかの実施形態では、アミノ酸配列は、部分に対応する一連のアミノ酸を含む。
本明細書に記載の技術の実施形態のいずれかと組み合わせて使用されうるコンピュータシステム1400の例示的実現形態が図14に示される。コンピュータシステム1400は、1つ以上のプロセッサー1410と、非一時コンピュータ可読記憶媒体(たとえば、メモリー1420及び1つ以上の不揮発性記憶媒体1430)を含む1つ以上の製造品と、を含む。プロセッサー1410は、メモリー1420及び不揮発性記憶デバイス1430に対するデータ書込み及びデータ読出しをいずれかの好適な方式で制御しうるが、本明細書に記載の技術の態様は、この点に限定されるものではない。本明細書に記載の機能性のいずれかを実施するために、プロセッサー1410は、プロセッサー1410により実行されるプロセッサー実行可能命令を記憶する非一時コンピュータ可読記憶媒体として機能しうる1つ以上の非一時コンピュータ可読記憶媒体(たとえば、メモリー1420)に記憶された1つ以上のプロセッサー実行可能命令を実行しうる。
コンピューティングデバイス1400はまた、コンピューティングデバイスと他のコンピューティングデバイスとの通信(たとえば、ネットワークを介して)を媒介しうるネットワーク入出力(I/O)インターフェース1440を含みうるとともに、コンピューティングデバイスによるユーザへの出力の提供及びユーザからの入力の受取りを媒介しうる1つ以上のユーザI/Oインターフェース1450も含みうる。ユーザI/Oインターフェースとしては、キーボード、マウス、マイクロフォン、ディスプレイデバイス(たとえば、モニター又はタッチスクリーン)、スピーカー、カメラ、及び/又は各種他のタイプのI/Oデバイスなどのデバイスが挙げられうる。
以上に記載の実施形態は、多くの手段のいずれかで実現可能である。たとえば、実施形態は、ハードウェア、ソフトウェア、又はそれらの組合せを用いて実現しうる。ソフトウェアで実現する場合、ソフトウェアコードは、単一コンピューティングデバイスに提供されるか又は複数のコンピューティングデバイスに分散されるかにかかわらず、いずれかの好適なプロセッサー(たとえば、マイクロプロセッサー)又は一群のプロセッサーで実行可能である。以上に記載の機能を実施する任意のコンポーネント又は一群のコンポーネントは、以上で考察された機能を制御する1つ以上のコントローラであると一般にみなしうることを認識すべきである。1つ以上のコントローラは、多くの方法で、たとえば、以上に述べた機能を実施するマイクロコード又はソフトウェアを用いてプログラムされた専用ハードウェアを用いて又は汎用ハードウェア(たとえば、1つ以上のプロセッサー)を用いて、実現可能である。
これに関連して、本明細書に記載の実施形態の一実現形態(implementation)は、1つ以上のプロセッサーで実行するときに1つ以上の実施形態の以上で考察される機能を実施するコンピュータプログラム(すなわち、複数の実行可能命令)によりコードされる少なくとも1つのコンピュータ可読記憶媒体(たとえば、RAM、ROM、EEPROM、フラッシュメモリー、又は他のメモリー技術、CD-ROM、ディジタル多用途ディスク(DVD)、又は他の光ディスク記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置、又は他の磁気記憶デバイス、又は他のタンジブル非一時コンピュータ可読記憶媒体)を含むことが認識されるべきである。コンピュータ可読媒体は、本明細書で考察される技術の態様を実現するために、記憶されたプログラムをいずれかのコンピューティングデバイスにロードできるようにトランスポート可能でありうる。そのほか、実行時に以上で考察された機能のいずれかを実施するコンピュータプログラムへの参照は、ホストコンピュータ上で実行されるアプリケーションプログラムに限定されるものではないことが認識されるべきである。むしろ、コンピュータプログラム及びソフトウェアという用語は、本明細書で考察される技術の態様を実現するように1つ以上のプロセッサーをプログラムするために利用可能ないずれかのタイプのコンピュータコード(たとえば、アプリケーションソフトウェア、ファームウェア、マイクロコード、又はいずれかの他の形態のコンピュータ命令)を参照するために一般的な意味で本明細書で用いられる。
実施例1.化学切断によるエドマン分解
Figure 2022507516000019
おおよそ3~おおよそ30アミノ酸(n=3~30)の表面装着オリゴペプチドが提供される。ただし、アミノ酸残基R~Rは、通常の20種のアミノ酸又は内因的に修飾されたアミノ酸(たとえば、翻訳後修飾により修飾されたもの)のいずれかでありうる。イソチオシアネートN末端反応の工程1では、表面装着オリゴペプチドを含有するベッセル(vessel)にイソチオシアネートX-NCSが添加される。ただし、Xは、フェニル(Ph)、4-NOPh、4-SOPh、ナプチル(napthyl)、ベンジル、アルキル、又はそれらの誘導体である。工程1は、次の条件:水性緩衝液pH4~10、MeOH又はEtOH又はIPAアルコール性共溶媒、有機溶媒(DCM、THF、MeCN、DMFなど)中のトリアルキルアミン、20℃~50℃の下で行われ、X-NCS誘導体化N末端アミノ酸を与える。チオウレア切断反応の工程2では、X-NCS誘導体化N末端アミノ酸を含有するベッセルに酸又は塩基が添加される。ただし、酸は、ニート若しくは水性溶液として、酢酸、ギ酸、トリクロロ酢酸、トリフルオロ酢酸、リン酸、若しくは塩酸であり、又は塩基は、トリアルキルアミン若しくは緩衝トリアルキルアミン(たとえば、EtNHAcO)である。工程2は、次の条件:ニートの酸又はいずれかの比の水性/有機性共溶媒を併用、20℃~50℃の下で行われ、n-1オリゴペプチド及びチオヒダントイン副生成物を与える。
実施例2.ペプチド表面固定用の可溶化性リンカー
水性緩衝液へのオリゴペプチドの溶解性の改善を試みて、ペプチド断片をオリゴヌクレオチドリンカーにコンジュゲートすることにより、水への溶解性を改善しうるとともに単一分子レベルでペプチドを表面固定するための機能部分も提供しうると判断された。さまざまなペプチド-リンカーコンジュゲートが合成され、ペプチド-DNAコンジュゲート及びペプチド-PEGコンジュゲートに関して構造例が図15Aに描かれる。リンカーコンジュゲーションは、評価されたさまざまなペプチド-リンカーコンジュゲートの各々で水性溶液へのペプチドの溶解性を大きく増強することが観測された。
N末端アミノペプチダーゼによるペプチドN末端のアミノ酸切断に関して、ペプチド-リンカーコンジュゲートを評価した(以下の表6)。
Figure 2022507516000020
表6に示されるペプチド-リンカーコンジュゲートは、プロリンイミノペプチダーゼ(「PIP」)又はラットアミノペプチダーゼN(「ラットAPN」)のどちらかと共にインキュベートされ、且つペプチド切断は、LCMSによりモニターされた。表6のエントリー5の切断を実証するLCMSの例は、図15Bに示される。すべての他の切断反応は、同様に測定された。表6に示されるように、正荷電ペプチド-DNAコンジュゲート(「オリゴ」及び「オリゴ-PEG」リンカー)は、試験アミノペプチダーゼにより切断されず、DNAオリゴヌクレオチドリンカーを有するすべての他のコンジュゲートクラス(負荷電、芳香族、疎水性)は切断された。比較により、正荷電ペプチド-PEGコンジュゲートは、アミノペプチダーゼの少なくとも1つにより切断されることが示された。
標識ペプチド-リンカーコンジュゲートを用いて、異なる組成のペプチドを単一分子分析のために個別サンプルウェル表面に固定可能であることが示された。これらの実験では、DNAリンカーは、色素で標識され(たとえば、ペプチド-DNAコンジュゲートの場合、図15Aに描かれる通りである)、且つ個別サンプルウェルへの異なるペプチド-DNAコンジュゲートのローディングは、色素蛍光により測定された。ローディング実験例は、図15Cに示される。標識ペプチド-DNAコンジュゲート(50pM)の蛍光放出を測定することにより、チップ上のサンプルウェルの少なくとも18%は、表面固定コンジュゲートを有してサンプルウェル当たり単一占有でロードされたと判断された。これらの実験は、ペプチド-リンカーコンジュゲートが非コンジュゲートペプチドカウンターパートと比較して増強された水への溶解性を呈すること、コンジュゲートリンカーが異なるアミノペプチダーゼによるペプチドの末端アミノ酸切断を防止しないこと、且つ異なる組成のペプチド-リンカーコンジュゲートが単一分子レベルでチップ表面に固定されうることを実証した。
実施例3.ポリペプチド基質のエキソペプチダーゼ切断
各種アミノペプチダーゼの切断能力を試験した。切断アッセイ実験のセットの条件及び結果は、ペプチド基質の濃度、酵素の濃度、緩衝液条件、温度、及びインキュベーション時間を含めて、表7に示される。高性能液体クロマトグラフィー(HPLC)を用いて、指示酵素によるペプチド基質の切断をアッセイした。表7の「HPLCアッセイ変換率」値は、切断産物に変換されたペプチド基質のパーセントを表す。「HPLCアッセイ変換率」値を決定するために、同一開始濃度のペプチドを含有する2つ溶液を調製した。一方の溶液は酵素消化に付され、他方の溶液はいずれの酵素も含有していなかったが、酵素を貯蔵するために使用した等価量の緩衝液で希釈された。反応は、指示された時間でクエンチされた。産物に変換された反応体の量は、酵素消化後に残留する出発材料のHPLCにより得られたピーク面積を未消化ペプチドの対照溶液のピーク面積で除算してからこの比に100を乗算することにより決定された。表7中、「NH2」はアミン基を表し、「yPIP」はY.ペスティス(pestis)プロリンイミノペプチダーゼを意味し、「NPEPPS」はピューロマイシン感受性アミノペプチダーゼを意味し、「VPr」はビブリオ・プロテオリティカス(Vibrio proteolyticus)アミノペプチダーゼを意味し、且つ「EDAPN」はL.ニューモフィラ(L.pneumophila)M1アミノペプチダーゼを意味する。
Figure 2022507516000021
Figure 2022507516000022
Figure 2022507516000023
Figure 2022507516000024
Figure 2022507516000025
Figure 2022507516000026
Figure 2022507516000027
Figure 2022507516000028
Figure 2022507516000029
Figure 2022507516000030
Figure 2022507516000031
Figure 2022507516000032
Figure 2022507516000033
Figure 2022507516000034
表7の選ばれたエキソペプチダーゼのアミノ酸切断活性の概要は、図16に示される。特異的切断活性は、次の酵素:「cVPr」(V.プロテオリティカス(V.proteolyticus)アミノペプチダーゼ)、「yPIP」(Y.ペスティス(Y.pestis)プロリンイミノペプチダーゼ)、「D/E APN」(L.ニューモフィラ(L.pneumophila)M1アミノペプチダーゼ)、hTET(パイロコッカス・ホリコシイ(Pyrococcus horikoshii)TETアミノペプチダーゼ)、及びPfu API(表7の「PfuTET」)に対して示される。末端アミノ酸に対する比活性は、アミノ酸に一文字略号を用いて、示されるように分類される(「XP-」は、隣接又はペナルティメートのプロリン(P)残基を有するいずれかの末端アミノ酸(X)を表す)。
実施例4.単一分子レベルの固定ペプチドの末端アミノ酸切断
固定ペプチドのオンチップアミノ酸切断のアッセイは、標識ペプチドコンジュゲートを用いて開発された。アッセイは、固定ペプチドに対するエキソペプチダーゼの酵素認識及び切断活性を決定する方法を提供するように設計された。これは速度論的結合パラメータ及び一般的結合アフィニティーの測定を可能にしうる。
ペプチドのN末端アミノ酸切断を評価するために、PEGスペーサーを介して色素に装着されたN末端アスパラギン酸を含有する色素標識ペプチドを設計及び合成した。このペプチドはまた、酵素プロリンイミノペプチダーゼ(エルシニア・ペスティス(Yersinia pestis)由来であり、他でも知られ、本明細書では「yPIP」といわれる)により特異的に認識される修飾アスパラギン酸に隣接するプロリン残基も含有していた。酵素yPIPは、プロリン残基の上流のN末端アミノ酸のみを切断するはずである。
この及び他の標識ペプチドがバルクでyPIPにより効率的にカットされることを示した後(たとえば、実施例2に記載の通り)、単一分子レベルでN末端アミノ酸切断を観測するために、オンチップ色素/ペプチドコンジュゲートアッセイを開発した。図17Aは、色素/ペプチドコンジュゲートアッセイの一般的スキームを示す(インセットパネル)。示されるように、スペーサーを介してN末端アミノ酸に装着された標識を有するペプチドは、リンカーを介して表面に固定される。ペプチダーゼに暴露された後、N末端アミノ酸切断は、検出可能観測容積からの標識残基の除去をもたらすとともに、標識からのシグナルの付随的損失により測定される。インセットパネルの右側の酵素-ペプチド複合体は、N末端切断部位を一般的に描く。
図17Aは、色素/ペプチドコンジュゲートアッセイに使用するように設計及び合成された標識ペプチド構築物を示す(ボトム)。これらの実験では、N末端にペナルティメート(penultimate)プロリン残基を有するペプチドのN末端アスパラギン酸残基にローダミン色素(アトー(ATTO)Rho6G)を装着した。示されるように、表面固定のためにビオチン部分を有する可溶化性DNAリンカーにペプチドをさらにコンジュゲートした。
標識ペプチドコンジュゲートは、サンプルウェルのアレイを有するガラスチップ上にロードされた。ローダミン蛍光により単一占有のサンプルウェルのパーセントローディングを決定するために、ローディングの前及び後でチップの画像を取得した。次いで、ロードされたチップ上に酵素yPIPを導入し、37℃で2時間インキュベートした。yPIPの導入に続いてチップの画像を取得して失われた緑色色素のパーセントを計算することにより、N末端アミノ酸切断を評価した。図17Bは、ローディングステージへの6~7%ローディングと、yPIPと共にインキュベートした後、事前にロードされたウェルで91%シグナル損失(これはN末端アミノ酸切断の指標となる)と、を呈した実験のイメージング結果を示す。図17Cは、これらの実験の代表的シグナルトレースを示しており、標識ペプチドのローディング時に色素シグナルの増加が検出されるとともに、yPIPへの暴露に続いて色素シグナルの損失が検出されることが実証される。
単一分子レベルでのN末端アミノ酸切断のさらなる確認として、エキソペプチダーゼ認識及び切断活性を評価するために、オンチップFRETアッセイを開発した。図18Aは、FRETペプチドコンジュゲートアッセイ(パネルA)及びFRET酵素コンジュゲートアッセイ(パネルB)を一般的に描く。FRETペプチドコンジュゲートアッセイ(パネルA)では、固定ペプチド構築物は、リンカーに装着されたFRETドナー標識と、N末端に装着されたFRETアクセプター標識と、を含む。N末端アミノ酸切断は、ペプチダーゼに暴露したときのFRETアクセプター標識からのシグナルの損失により検出される。そのほか、この設計は、FRETドナー標識からの放出を追跡することにより、実験全体を通してペプチドコンジュゲートのローディングのモニタリングを可能にする。
FRET酵素コンジュゲートアッセイ(パネルB)では、固定ペプチド構築物は、リンカーに装着されたFRETペアの第1の標識を含み、且つペプチダーゼは、FRETペアの第2の標識で標識される。N末端アミノ酸切断は、ペプチドへのペプチダーゼの近接が十分であり且つN末端での滞留時間が十分であるときに発生するFRET相互作用に帰属可能な蛍光の増強により検出される。そのほか、このアッセイは、プロセッシブ切断によるFRETシグナルの経時的増加を検出することにより、プロセッシブエキソペプチダーゼによるプロセッシブアミノ酸切断の評価を可能にする。
図18Aはまた、パネルAのFRETペプチドコンジュゲートアッセイに使用するために設計及び合成されたFRETペプチド構築物をパネルAに示す。示されるように、FRETペプチド構築物は、N末端ペナルティメートプロリン残基を有するペプチドのN末端アスパラギン酸残基に装着されたローダミン色素(アトー(ATTO)647N)を含んでいた。ペプチドは、FRETのためにシアニン色素(Cy3B)と表面固定のためにビオチン部分とに装着された可溶化性DNAリンカーにさらにコンジュゲートされた。
この実験では、FRETペプチド構築物は、サンプルウェルのアレイを有するガラスチップ上にロードされ、且つ捕集光は、最初に緑色フィルター及び次いで赤色フィルターによりフィルターされた。FRETペプチド構築物のローディングは、緑色及び赤色フィルターの両方を通り抜けるシグナルを測定することにより検出された。末端アミノ酸切断は、シグナルが緑色フィルターのみで測定可能であるときに検出されたことから、FRETペプチド構築物の赤色色素コンジュゲートN末端アミノ酸がyPIPにより切断されたことが示唆される。この検出パターンはパネルCに例示される。示されるように、yPIPの添加前に両方の色素が検出可能であり且つyPIPと共にインキュベートした後に緑色色素のみが視認可能である場合、こうした検出パターンの変化はペプチドの切断に起因するものであり全体的な光漂白にもペプチドの損失にも起因しないと、合理的に結論付け可能である。そのほか、単独の緑色色素からの蛍光の増加が予想されるであろう。なぜなら、その放出がもはや赤色色素により吸収されないからである。
ホスホン酸とシランとを用いて表面パッシベーションにより修飾されたチップへのFRETペプチド構築物のローディングに続いて、yPIPを導入していくつかの時間点で画像を得た。全体的切断トレンドを評価するために、各実験に対して(緑色)/(緑色+赤色)の比を計算した。この比は、発生する切断の程度と共に増加する。図18Bは、yPIPと共にインキュベートした異なる時間点のすべてのアパーチャにわたるFRET放出比のプロットである。示されるように、蛍光放出比への緑色色素の寄与が経時的に増加することから、yPIPと共にインキュベートしたとき、より多くのN末端アスパラギン酸残基がカットされて、緑色色素のみのトランケートペプチドが残ることが示唆される。
次いで、どの時間点で色素蛍光が観測されたかを決定することにより、異なる時間点でカッティング効率を評価した。これは単純な閾値化により行われた。たとえば、平均色素発光シグナルが励起時に>2.5であった場合、色素は存在すると決定された(各対応するフィルターを適用したとき)。次いで、カッティングを呈するアパーチャは、実験のローディングフェーズ時に緑色色素及び赤色色素の両方を呈するであろうが、yPIPに暴露された時間点で緑色色素のみを呈するであろう。図18Cに示されるように、チップがyPIPと共により長いインキュベーション時間に露出されると、徐々により多くのカッティングが観測された。3つのyPIP処理時間点の各々で呈するカッティングを示すシグナルトレース例を図18Dに示す。
デキストランを用いて表面パッシベーションにより修飾されたチップを用いてyPIP及び他のペプチダーゼにより追加の実験を実施したところ、チップ上へのペプチダーゼの導入に続いて経時的な末端アミノ酸切断の増加を示す類似の結果を生じた。図18Eは、yPIPと共にインキュベートした異なる時間点のロードされたアパーチャにわたるFRET放出比のプロットである。図18Fは、アミノペプチダーゼと共にインキュベートした異なる時間点のロードされたアパーチャにわたるFRET放出比のプロットである。全体として、ここでの実験は、異なるエキソペプチダーゼ及び異なる標識化ストラテジーを用いて単一分子レベルでリアルタイムにN末端アミノ酸切断を検出可能であることを実証する。
実施例5.標識アフィニティー試薬による末端アミノ酸識別
N末端芳香族残基を検出するために、標識アフィニティー試薬として使用するための潜在的候補として、タンパク質分解経路に関与するアダプタータンパク質を同定した。α-プロテオバクテリア(A.ツメファシエンス(A.tumefaciens))由来のアダプタータンパク質ClpS2を発現し、露出されたシステイン残基に標識した。図19Aは、スティックとして示される露出されたシステイン残基と共にClpS2タンパク質の結晶構造を示す。露出されたシステイン残基は、ローダミン色素(アトー(ATTO)532)で標識された。
標識ClpS2により単一分子レベルでN末端アミノ酸識別が可能であるかを試験するために、異なるN末端芳香族残基を有するペプチドを調製した。これらの実験の単一分子強度トレース例を図19Bに示す。示されるように、シグナルトレースは、N末端フェニルアラニン残基(F、トップのシグナルトレース)、N末端チロシン残基(Y、中間のシグナルトレース)、又はN末端トリプトファン残基(W、ボトムのシグナルトレース)のどれかを有するペプチドのN末端に可逆結合する標識アフィニティー試薬に対応する残基特異的オンオフ結合パターンを実証する。
図19C~19Eに示される結果を用いて、単一分子トラジェクトリーのさらなる解析を行った。図19Cは、標識ClpS2により可逆結合されたときの3つのN末端残基間のディスクリミナントパルス持続時間(シグナルピークの持続時間)を示すプロットである。図19Dは、3つのN末端残基間のディスクリミナント(discriminant)パルス間持続時間(シグナルパルス間の持続時間)を示すプロットである。図19Eは、ペプチドN末端のフェニルアラニン、チロシン、及びトリプトファン間のディスクリミナントパルス持続時間をさらに例示するプロットを示す。異なるN末端残基の平均パルス持続時間は、ヒストグラム(A)~(B)及びレイヤードヒストグラム(C)により可視化される。
ロイシン認識用の標識アフィニティー試薬として使用するために、サーモシノコッカス・エロンガタス(Thermosynochoccus elongatus)由来の他のアダプタータンパク質ClpSを評価した。図19F~19Hに示される滞留時間解析から得られるデータは、標識teClpSタンパク質が0.71秒間の平均パルス持続時間でポリペプチドの末端ロイシン残基との検出可能結合相互作用を生成することを実証した。これらの実験に使用されるteClpSタンパク質のアミノ酸配列は表1に示される。
ロイシン認識用の潜在的試薬としてA.ツメファシエンス(A.tumefaciens)ClpS1及びS.エロンガタス(elongatus)ClpS2並びにプロリン認識用の潜在的試薬としてGID4を評価するために、類似の実験を行った。図19Iは、A.ツメファシエンス(A.tumefaciens)ClpS1によるフェニルアラニン、ロイシン、トリプトファン、及びチロシンの区別可能認識を示した滞留時間解析の結果例を示す。図19Jは、S.エロンガタス(elongatus)ClpS2によるロイシン認識を実証する滞留時間解析の結果例を示す。図19K~19Lは、GID4によるプロリン認識を実証する滞留時間解析の結果例を示す。
実施例6.分解時の認識によるポリペプチドシーケンシング
進行中の分解反応時のN末端アミノ酸認識によるペプチドシーケンシングを評価するために実験を行った。これらの実験の結果例は、図20A~20Dに示されており、これらは、同一反応混合物で標識ClpS2タンパク質及びアミノペプチダーゼを用いてリアルタイムで行われた2つの独立したポリペプチドシーケンシング反応により得られた単一分子強度トレースを示す。各反応では、配列YAAWAAFADDDWK(配列番号78)のポリペプチドは、チップ上にペプチド組成物(10pM)を20分間ロードすることによりC末端リシン残基を介してチップ表面に固定され、且つ固定されたペプチドは、標識アフィニティー試薬(500nMのアトー(ATTO)542標識A.ツメファシエンス(A.tumefaciens)ClpS2-V1)及びアミノペプチダーゼ切断試薬(8μMのVPr)の存在下でモニターされた。
図20A及び20Cは、2つの異なるシーケンシングランのシグナルトレースデータを示し、トップのパネル(図20Aのパネル1、図20Cのパネル2)はフルトレースを示し、且つボトムのパネル(Y、W、F)はフルトレース内の強調領域の各々に対応する拡大領域を示す。図20B及び20Dは、それぞれ、図20A及び20Cに記された対応するパネルのトレースデータのパルス持続時間統計をヒストグラムで示す。各シーケンシングランのフルシグナルトレース(パネル1、2)に示されるように、反応過程全体にわたりシグナルパルスの3つの個別時間インターバルが観測された。拡大領域(パネルY、W、F)により強調されるように、3つのインターバルは、シグナルパルスのパターンの観測可能な差に基づいて互いに視覚的に区別可能である。
シグナルパルスデータをさらに解析するために、各時間インターバルでパルス持続時間統計を決定した(図20B及び20D)。ClpS2を用いた定常状態オンチップ結合アッセイでこれらのアミノ酸に対して個別に観測されたものに対応するようにパルス持続時間分布の差を決定したところ、シグナルパルス情報は、シーケンシングランからのインターバルと個別アミノ酸結合アッセイからのインターバルとの間で表現型に一貫性があった。
シグナルパルス情報の解析により確認されるように、各シーケンシングランの進行で観測されるシグナルパルスの3つの時間インターバルは、それぞれ、Y、W、及びFの認識パターンに対応する(パネル1、2)。シグナルパルスパターン間の介在時間帯は、N末端アラニン残基に結合しないClpS2-V1の選択性に起因する。フルシグナルトレースにより例示されるように、第1のインターバルはY認識に対応し、それに続いて、VPrペプチダーゼがY及び2つアラニン残基をカットするので休止があり、続いてW認識に対応する第2のインターバルがあり、それに続いて、VPrペプチダーゼがW及び2つアラニン残基をカットするので他の休止があり、最後にF認識に対応する第3のインターバルがあり、その後、VPrペプチダーゼがFをカットして除去し、残留するADDDWKペプチドで停止する。進行中の分解反応時に末端アミノ酸認識により得られるパルス持続時間情報は、異なるタイプの末端アミノ酸を識別する特性パターンを決定するために使用可能であることが、これらの結果から示される。
実施例7.標識エキソペプチダーゼによる末端アミノ酸の同定及び切断
ペプチドの末端アミノ酸を同定することと、ペプチドから末端アミノ酸を切断することと、の両方が可能な単一試薬の可能性を調べるために、試験を実施した。単一試薬として、エキソペプチダーゼは、末端残基に対する切断活性を保持しつつペプチドに結合可能でなければならない。それゆえ、異なるエキソペプチダーゼの天然の表面露出アミノ酸に的を絞ることにより、伝統的標識化ストラテジーを利用する初期のアプローチを行った。これらの実験では、エキソペプチダーゼ標識化のためのロバストな方法であることがと証明された蛍光色素で、表面露出システイン(-SH)又はリシン(-NH)残基を標識した。しかしながら、ある特定の場合には、このアプローチは、1つ以上の色素で標識されるタンパク質の不均一集団を生成した。
エキソペプチダーゼ上のどこで標識化を行うかをより精密に制御して各エキソペプチダーゼ分子が単一蛍光色素で確実に標識されるようにするために(さらには色素のオフターゲット反応性を排除するために)、新しい標識化ストラテジーを検討した。これらの実験では、反応性官能基を含有する非天然アミノ酸がエキソペプチダーゼに導入される部位特異的標識化ストラテジーを用いて、標識エキソペプチダーゼを調製した(たとえば、チン,J.W.(Chin,J.W.)ら著、ジャーナル・オブ・アメリカン・ケミカル・ソサイエティー(J Am Chem Soc.)、2002年8月7日、第124巻、第31号、p.9026~9027を参照されたい)。
287位のリシン残基からp-アジドフェニルアラニン(pAzF)側鎖を有する残基への突然変異により、エルシニア・ペスティス(Yersinia pestis)(yPIP)由来のプロリンイミノペプチダーゼを修飾した。図21Aは、スティックとして示されるK287側鎖で示されたpAzFの化学構造により示唆される突然変異を有するyPIPの結晶構造を示す。この突然変異部位は、この位置のαヘリックスにより提供される安定性に基づいて且つ新しいアジド官能基が確実に溶媒露出されるように選択される。
突然変異体アミノtRNAシンテターゼとアミノ酸鎖中にpAzFを取り込むのに必要な突然変異体tRNAとを含有するpEVOLプラスミドを得た。次いで、クイックチェンジ(QuickChange)II突然変異誘発キットを用いて、pAzFの特異的組込みに必要なアンバー停止コドン(TAG)をcDNAに導入した。次いで、cDNAをシーケンスしてTAGコドン位置を確認した。この後、yPIPアンバー突然変異体を含有するpET21b+プラスミドと、tRNAがアンバーコドンに対してpAzFを仕込む細胞機構を含有するpEVOLプラスミドと、の両方の共トランスフェクションを行った。次いで、共トランスフェクトされた細胞を0.8ODUまで成長させ、2LのLB中の2mM pAzFの存在下で0.02%アラビノース及び1mM IPTGにより誘導し、化学分解を用いて採取した。5mLアフィニティークロマトグラフィーカラムを用いて精製し、100mMイミダゾールでタンパク質を溶出した。次いで、得られるタンパク質を50mM HEPES pH8.0及び0.5M KClで透析して濃縮し、アリコートに分け、フラッシュ凍結し、その後、-20℃で貯蔵した。
精製タンパク質中のアジド基の存在を確認するために、DBCO-Cy3(2mM)とpAzF-yPIP変異体(220μM)とを反応させた(反応条件:50mM HEPES pH8.0、0.5mM KCl、及び20%DMSO、37℃で10時間、室温で48時間)。サイズ排除クロマトグラフィーによりタンパク質反応産物を精製したところ、得られたンパク質はアジド反応性DBCO-Cy3試薬で100%標識されたと判断されたことから(図21B)、非天然アミノ酸のロバストな取込みが示唆される。
非標識及び標識pAzF変異体のSDS-PAGE解析により、最終産物のタンパク質標識化及び純度を確認した。図21Cは、pAzF-yPIPのCy3標識化を確認するSDS-PAGEゲルの写真を示す(ラダーを示すためにゲルのオーバー露出画像が図21Dに示される)。図21Eは、色素及びタンパク質の両方がコマイグレートして(co-migrate)純粋であることを確認するクーマシー染色ゲルの写真を示す。
標識化及び精製の後に酵素が依然として活性であることを確認するために、色素標識pAzF-yPIP変異体を活性アッセイに使用した。図21Fに示されるように、Cy3-pAzF-yPIPは、HPLCにより測定したとき、1000倍過剰基質を用いて1時間でペプチド基質を100%加水分解可能であった。これらの実験は、天然タンパク質構造/機能の撹乱を最小限に抑えてエキソペプチダーゼの部位特異的修飾及び標識化を可能にする方法を実証する。
実施例8.ポリペプチドシーケンシングでの修飾アミノ酸の認識
特異的翻訳後修飾を含有するアミノ酸の認識を評価するために、実験を実施した。リン酸化チロシン残基に対する潜在的認識分子として、FynチロシンキナーゼのSrc相同性2(SH2)ドメインの三重突然変異型変異体(T8V、S10A、K15L)をペプチドシーケンシングで試験した。変異体タンパク質をサンプルウェルのボトムに固定し、N末端ホスホチロシンを含有する蛍光標識ペプチドを添加し、単一分子シグナルトレースを収集した。図22Aの代表的トレースより示されるように、これらの実験時、固定タンパク質によるペプチド結合が検出された。これらの実験時に収集されたパルス持続時間データは、図22Bに示される(トップ、中間、及びボトムのプロットは、それぞれ、図22Aのトップ、中間、及びボトムのトレースに対応する)。パルス持続時間及びパルス間持続時間の統計は、図22Cに示される(それぞれ、トップ及びボトムのパネル)。
Fynタンパク質がリン酸化チロシンに特異的であることを確認するために、対照実験を実施した。3つの異なるペプチド:N末端非修飾チロシンを含有する第1のペプチド(Y、図22D)、N末端ペナルティメート非修飾チロシンを含有する第2のペプチド(YY、図22E)、及びN末端ホスホセリンを含有する第3のペプチド(図22F)の各々に対して、実験を繰り返した。示されるように、陰性対照実験に使用されるペプチドのいずれを用いても、結合は検出されなかった。
実施例9.ポリペプチドシーケンシングでのペナルティメートアミノ酸の認識
A.ツメファシエンス(A.tumefaciens)ClpS2-V1のパルス持続時間に及ぼすペナルティメートアミノ酸の影響を決定するために、実験を実施した。N末端にユニークジペプチド配列を含有する49の異なる蛍光標識ペプチドを調製した。ただし、N末端アミノ酸は、F、W、又はYであり、且つペナルティメート位置は、20種の天然アミノ酸の1つであった。各実験では、ClpS2-V1をサンプルウェルのボトムに固定し、蛍光標識ペプチドの1つを添加して一分子シグナルトレースを10~20分間収集した。各ペプチドに対しては最小でも50のサンプルウェルで、パルス持続時間データを収集した。
図23は、50ペプチドの各々に対してメジアンパルス持続時間を示しており、データ点は、異なる記号を用いて表されたペナルティメートアミノ酸(x軸)とN末端アミノ酸とによりグループ化されている。
実施例10.複数の認識分子による同時アミノ酸認識
1つ超の標識認識分子による固定ペプチドの末端アミノ酸認識を実証するために、単一分子ペプチド認識実験を実施した。N末端フェニルアラニンを含有する単一ペプチド分子(FYPLPWPDDDY(配列番号79))をチップのサンプルウェル内に固定した。各500nMのatClpS1(アグロバクテリウム・ツミファシエンス(Agrobacterium tumifaciens)ClpS1、表1に提供される配列)及びatClpS2-V1(アグロバクテリウム・ツミファシエンス(Agrobacterium tumifaciens)ClpS2変異体1、表1に提供される配列)を含有する緩衝液を添加した。ただし、atClpS1及びatClpS2-V1は、それぞれ、Cy3及びCy3Bで標識された。Cy3Bの強度はCy3よりも高いので、atClpS2-V1結合イベントは、atClpS1結合イベントから容易に区別可であった。
図24A~24Cは、差次的標識認識分子による単一分子ペプチド認識を示す実験の結果を示す。代表的トレースは図24Aに提示される。パルス持続時間分布は、各バインダーに対して識別可能であり(図24B)、単一バインダーの実験で観測されるそれらの速度論的プロファイルに対応した。平均パルス持続時間は、atClpS1では1.3秒間及びatClpS2-V1では1.0秒間であった(図24C)。パルス速度もまた識別可能であり、atClpS1では8.1パルス/min及びatClp2-V1では14.1パルス/minであった(図24C)。そのため、1つ超の認識分子が固定ペプチドの動的認識のために含まれるとき、各認識分子の結合特性(パルス持続時間、パルス間持続時間、及びパルス速度を含む)は、ペプチド配列に関する情報を同時に提供可能である。
実施例11.認識分子リンカーによる光安定性の増強
単一分子シーケンシング時の固定ペプチドの光安定性を評価するために、実験を実施した。アトー(ATTO)532からの放出により認識をモニターするために、532nmの励起光の存在下で固定ペプチド基質を含有するサンプルウェルに実施例5に記載の色素標識atClpS2-V1を添加した。代表的トレースは図25Aに示される。トップパネルに示されるように、認識は、実験を始めてからおおよそ600秒間で中止されることが観測された。ボトムパネルは、反応を始めてからおおよそ180~430秒間のシグナルパルスを示す拡大図である。
図25Bは、これらの実験に使用されるClpS2タンパク質の結晶構造の可視化を示す。示されるように、色素コンジュゲーション部位として機能するシステイン残基は、末端アミノ酸結合部位からおおよそ2nmである。ペプチドに対する光損傷は、結合時にペプチドのN末端への色素の近接により引き起こされるという仮説を立てた。色素近接の潜在的光損傷作用を軽減するために、色素とペプチドのN末端との間の距離を10nm超に増加させるリンカーを介してClpS2タンパク質を色素標識した。リンカーは、ストレプトアビジンと二本鎖核酸とを含んでいた。2つのCy3B色素分子で二本鎖核酸を標識し、ビスビオチン部分を介してストレプトアビジンに装着し、ビオチン部分を介してストレプトアビジン上の残留する2つの結合部位の各々にClpS2タンパク質を装着した。この色素シールドClpS2分子を用いた代表的トレースは図25Cに示される。トップパネルに示されるように、認識時間は、実験を始めてからおおよそ6,000秒間に延長された。ボトムパネルは、反応を始めてからおおよそ750~930秒間のシグナルパルスを示す拡大図である。
2つのCy3B色素分子で標識され、且つビスビオチン部分を介してストレプトアビジンに装着された二本鎖核酸を含有するリンカーを用いてDNA-ストレプトアビジン認識分子を生成し、ビスビオチン部分を介してストレプトアビジン上の残留する2つの結合部位に単一ClpS2タンパク質を装着した。この構築物は、単一分子ペプチドシーケンシング反応に使用され、これらの実験の代表的トレースは、図26A~26Dに示される。
反応条件を次のように変更して、すなわち、DNA-ストレプトアビジンClpS2認識分子をhTETアミノ酸切断試薬との組合せで使用して、実施例6に記載のシーケンシング実験を繰り返した。代表的シグナルトレースは図27に示される。
実施例12.複数のエキソペプチダーゼによる分解時の認識によるシーケンシング
単一分子ペプチドシーケンシング反応混合物中での差次的切断特異性を有する複数のタイプのエキソペプチダーゼの使用を評価するために、実験を実施した。チップのサンプルウェル内にC末端リシン残基を介して単一ペプチド分子(YAAWAAFADDDWK(配列番号78))を固定した。アミノ酸認識用のatClpS2-V1とアミノ酸切断用のhTETとを含有する緩衝液を添加した。代表的トレースは図28Aに提示され、パルスパターン領域の拡大図が図28Bに示される。
差次的特異性を有する2タイプのエキソペプチダーゼの存在下でシーケンシング反応を評価するために、実験を行った。チップのサンプルウェル内にC末端リシン残基を介して単一ペプチド分子(FYPLPWPDDDYK(配列番号80))を固定した。アミノ酸認識用のatClpS2-V1とアミノ酸切断用のyPIP及びhTETの両方とを含有する緩衝液を添加した。代表的トレースは図28Cに提示され、パルスパターン領域の拡大図が図28Dに示される。これらの反応条件の追加の代表的トレースは図28Eに示される。
差次的特異性を有する2タイプのエキソペプチダーゼの存在下でシーケンシング反応を評価するために、さらなる実験を行った。チップのサンプルウェル内にC末端リシン残基を介して単一ペプチド分子(YPLPWPDDDYK(配列番号81))を固定した。一実験では、アミノ酸認識用のatClpS2-V1とアミノ酸切断用のyPIP及びhTETの両方とを含有する緩衝液を添加した。代表的トレースは図28Fに提示され、パルスパターン領域の拡大図が図28Gに示される。これらの反応条件の追加の代表的トレースは図28Hに示される。さらなる実験では、アミノ酸認識用のatClpS2-V1とアミノ酸切断用のPfuTET及びyPIPの両方とを含有する緩衝液(50mM MOPS、60mM KOAc、200μM Co(OAc))を添加した。代表的トレースは図28Iに提示され、パルスパターン領域の拡大図が図28Jに示される。
均等物及び範囲
請求項では、「a」、「an」、及び「the」などの冠詞は、相反する指示がない限り又はとくに文脈から自明でない限り、1つ又は2つ以上を意味しうる。グループの1つ以上のメンバー間に「or(又は)」を含む請求項又は説明は、相反する指示がない限り又はとくに文脈から自明でない限り、グループメンバーの1つ、2つ以上、又はすべてが所与のプロダクト又はプロセスに存在するか、利用されるか、又は他の形で関連する場合、満足されるとみなされる。本発明は、グループの厳密に1つのメンバーが所与のプロダクト又はプロセスに存在するか、利用されるか、又は他の形で関連する実施形態を含む。本発明は、グループメンバーの2つ以上又はすべてが所与のプロダクト又はプロセスに存在するか、利用されるか、又は他の形で関連する実施形態を含む。
さらに、本発明は、列挙された請求項の1つ以上から他の請求項に1つ以上の限定、要素、文節、及び記述語が導入された、変形形態、組合せ形態、及び入替え形態をすべて包含する。たとえば、他の請求項に依存するいずれかの請求項は、同一基本請求項に依存するいずれかの他の請求項に見いだされる1つ以上の限定を含むように修正可能である。要素がリストとして、たとえば、マーカッシュグループ形式で提示された場合、要素の各サブグループもまた開示され、且つ任意の要素をグループから除外可能である。一般に、本発明又は本発明の態様が、特定の要素及び/又は特徴を含んで参照される場合、本発明の特定の実施形態又は本発明の態様は、そのような要素及び/又は特徴からなるか又は本質的にそれらからなると理解されるべきである。簡単にするために、それらの実施形態は、本明細書では、とくにこの通りの言葉で明記されていない。
本明細書及び特許請求の範囲で用いられる「and/or(及び/又は)」という語句は、そのように結合された要素の「一方又は両方」、すなわち、いくつかの場合には連結して存在し且つ他の場合には分離して存在する要素を意味するものと理解すべきである。「and/or(及び/又は)」を用いて列挙された複数の要素は、同様に解釈されるべきである。すなわち、要素の「1つ以上」は、そのように結合される。任意選択的に、具体的に特定された要素に関連するかしないかにかかわらず、「and/or(及び/又は)」という句により具体的に特定された以外の他の要素が存在していてもよい。したがって、たとえば、「A及び/又はB」という参照語は、「comprising(~を含む)」などのオープンエンドの言語と組み合わせて用いられる場合、一実施形態では、Aのみ(任意選択的にB以外の要素を含めて)、他の実施形態では、Aのみ(任意選択的にA以外の要素を含めて)、さらに他の実施形態では、A及びBの両方(任意選択的に他の要素を含む)などを意味しうる。
本明細書及び特許請求の範囲で用いられる場合、「or(又は)」は、以上に定義された「and/or(及び/又は)」と同一の意味を有するものと理解すべきである。たとえば、リスト中の分離したアイテムの場合、「or(又は)」又は「and/or(及び/又は)」は、包括的なものと解釈されるものとする。すなわち、少なくとも1つを含むが、それだけでなく、いくつかの要素又は列挙された要素の2つ以上も含まれ、任意選択的に、追加の列挙されていないアイテムも含まれる。明らかに相反する指定がされている用語、たとえば、「only one of(~のうちの1つのみ)」又は「exactly one of(~のうちの厳密に1つ)」又は特許請求の範囲で用いられる場合の「consisting of(~からなる)」は、いくつかの要素又は列挙された要素のうち厳密に1つの要素の包含を意味するであろう。一般的には、本明細書で用いられる「or(又は)」という用語は、「either(いずれか一方)」、「one of(~の1つ)」、「only one of(~のうちの1つのみ)」、又は「exactly one of(~のうちの厳密に1つ)」などのように排他性の用語が先行する場合、排他的代替物(すなわち「一方又は他方ただし両方ではない」)を表すとのみ解釈されるものとする。特許請求の範囲で用いられる「consisting essentially of(~から本質的になる)」は、特許法の分野で用いられるその通常の意味を有するものとする。
本明細書及び特許請求の範囲で用いられる場合、1つ以上の要素のリストを参照する「少なくとも1つ」という語句は、要素のリスト中の任意の1つ以上の要素から選択される少なくとも1つの要素を意味すると理解すべきであるが、必ずしも、要素のリスト内に具体的に列挙されたあらゆる要素の少なくともの1つを含むとは限らず、要素のリスト中の要素の任意の組合せが除外されるとは限らない。また、この定義では、具体的に特定された要素に関連するかしないかにかかわらず、「少なくとも1つ」という語句が参照する要素のリスト内に具体的に特定された要素以外の要素が、任意選択的に存在してもよいことも許容される。そのため、限定されるものではないが例として、「at least one of A and B(A及びBの少なくとも1つ)」(又は等価的に「at least one of A or B(A又はBの少なくとも1つ)」又は等価的に「at least one of A and/or B(A及び/又はBの少なくとも1つ)」)は、一実施形態では、Bが存在せずに(任意選択的にB以外の要素を含めて)、任意選択的に2つ以上のAを含めて、少なくとも1つのA、他の実施形態では、Aは存在せずに(任意選択的にA以外の要素を含めて)、任意選択的に2つ以上のBを含めて、少なくとも1つのB、さらに他の実施形態では、任意選択的に2つ以上のAを含めて、少なくとも1つのA、及び任意選択的に2つ以上のBを含めて、少なくとも1つのB(任意選択的に他の要素を含めて)などを意味しうる。
また、明らかに相反する指定がされていない限り、2つ以上の工程又は行為を含む本明細書に特許請求されたいずれの方法でも、方法の工程又は行為の順序は、方法の工程又は行為が挙げられた順序に必ずしも限定されるとは限らないことを理解すべきである。
特許請求の範囲では、以上の明細書の場合と同様に、「comprising(~を含む)」、「including(~を含む)」、「carrying(~を担持する)」、「having(~を有する)」、「containing(~を含有する)」、「~を含む(involving)」、「~を保持する(holding)」、「composed of(~で構成される)」などの移行句はすべて、オープンエンドであることを理解すべきである。「consisting of(~からなる)」及び「consisting essentially of(~から本質的になる)」という移行句だけは、米国特許庁特許審査手順マニュアル(United States Patent Office Manual of Patent Examining Procedures)のセクション2111.03に示されるように、それぞれ、クローズ又はセミクローズの移行句であるものとする。オープンエンドの移行句(たとえば、「comprising(~を含む)」)を用いた本文書に記載の実施形態は、代替実施形態では、オープンエンドの移行句により記載される特徴について「consisting of(~からなる)」及び「consisting essentially of(~から本質的になる)」として企図されることが認識されるべきである。たとえば、適用が「AとBとを含む組成物」を記載する場合、適用はまた、代替実施形態の「AとBとからなる組成物」及び「AとBとから本質的になる組成物」も企図する。
範囲が与えられる場合、端点が含まれている。さらに、とくに指定がないかぎり又はとくに文脈及び当業者の理解から自明でないかぎり、範囲として表現された値は、文脈上明らかに異なる場合を除いて、範囲の下限の1/10単位まで、本発明のさまざまな実施形態で指定の範囲内の任意の特定の値又は部分範囲を仮定しうる。
本出願では、さまざまな発行特許、公開特許出願、雑誌論文、及び他の出版物(それらはすべて参照により本明細書に組み込まれる)が参照される。組み込まれた参照のいずれかと本明細書との間で矛盾がある場合、本明細書が優先するものとする。それに加えて、先行技術に包含される本発明の特定の実施形態はいずれも、請求項の任意の1項以上から明示的に除外されうる。そのような実施形態は、当業者に公知であるとみなされるので、たとえ本明細書で明示的に除外が明記されていないとしても、それらは除外されうる。先行技術の存在に関係するかしないかにかかわらず、任意の理由で、本発明の任意の特定の実施形態を任意の請求項から除外しうる。
当業者であれば、通常の実験の域を出ることなく、本明細書で説明した特定の実施形態に対する多くの等価形態が分かるであろう。又はそれらを確認できるであろう。本明細書に記載の実施形態の範囲は、以上の説明に限定されるものではなく、添付の特許請求の範囲に明記される通りである。以下の特許請求の範囲に規定される本発明の趣旨又は範囲から逸脱することなく、本明細書に各種変更及び修正を加えうることは当業者であれば分かるであろう。
本明細書の変数のいずれかの定義での化学基のリストの列挙は、列挙された基のいずれかの単一基又は組合せとしてのその変数の定義を含む。本明細書の変数に対する実施形態の列挙は、いずれかの単一実施形態又はいずれかの他の実施形態若しくはその一部分との組合せとしての実施形態を含む。本明細書の実施形態の列挙は、いずれかの単一実施形態又はいずれかの他の実施形態若しくはその一部分との組合せとして実施形態を含む。

Claims (283)

  1. ポリペプチドの分解プロセス時のデータを得ることと、
    前記分解プロセス時に前記ポリペプチドの末端に逐次露出されるアミノ酸に対応する前記データの部分を決定するように前記データを解析することと、
    前記ポリペプチドに相当するアミノ酸配列を出力することと、
    を含む方法。
  2. 前記データが、前記分解プロセス時の前記ポリペプチドの末端のアミノ酸アイデンティティーの指標である、請求項1に記載の方法。
  3. 前記データが、前記分解プロセス時に前記末端の異なるタイプの末端アミノ酸に結合する1つ以上のアミノ酸認識分子により生成されるシグナルの指標である、請求項2に記載の方法。
  4. 前記データが前記分解プロセス時に発生する発光シグナルの指標である、請求項1に記載の方法。
  5. 前記データが前記分解プロセス時に発生する電気シグナルの指標である、請求項1に記載の方法。
  6. 前記データを解析することが、一連の切断イベントを検出することと、逐次切断イベント間のデータの部分を決定することと、をさらに含む、請求項1に記載の方法。
  7. 前記データを解析することが、前記個別部分の各々に対してアミノ酸のタイプを決定することをさらに含む、請求項1に記載の方法。
  8. 前記個別部分の各々がパルスパターンを含み、且つ前記データを解析することが、そのそれぞれのパルスパターンに基づいて1つ以上の前記部分に対してアミノ酸のタイプを決定することをさらに含む、請求項1に記載の方法。
  9. 前記アミノ酸のタイプを決定することが、前記データが閾値超であるときの部分内の時間量を同定することと、前記部分に対して前記時間量と持続時間とを比較することと、をさらに含む、請求項8に記載の方法。
  10. 前記アミノ酸のタイプを決定することが、前記1つ以上の部分の各々に対して少なくとも1つのパルス持続時間を同定することをさらに含む、請求項8に記載の方法。
  11. 前記アミノ酸のタイプを決定することが、前記1つ以上の部分の各々に対して少なくとも1つのパルス間持続時間を同定することをさらに含む、請求項8に記載の方法。
  12. 前記アミノ酸配列が、前記部分に対応する一連のアミノ酸を含む、請求項1に記載の方法。
  13. 少なくとも1つのハードウェアプロセッサーと、
    前記少なくとも1つのハードウェアプロセッサーによる実行時に前記少なくとも1つのハードウェアプロセッサーに請求項1~12のいずれか一項に記載の方法を実施させるプロセッサー実行可能命令を記憶する少なくとも1つの非一時コンピュータ可読記憶媒体と、
    を含むシステム。
  14. 少なくとも1つのハードウェアプロセッサーによる実行時に前記少なくとも1つのハードウェアプロセッサーに請求項1~12のいずれか一項に記載の方法を実施させるプロセッサー実行可能命令を記憶する少なくとも1つの非一時コンピュータ可読記憶媒体。
  15. ポリペプチドシーケンシング方法であって、前記方法は、
    単一ポリペプチド分子と1つ以上の末端アミノ酸認識分子とを接触させることと、
    前記1つ以上の末端アミノ酸認識分子と、前記単一ポリペプチドが分解されている間に前記単一ポリペプチド分子の末端に露出される逐次アミノ酸と、の会合の指標となる一連のシグナルパルスを検出することにより、前記単一ポリペプチド分子をシーケンスすることと、
    を含む方法。
  16. 前記1つ以上の末端アミノ酸認識分子と前記末端に露出される各タイプのアミノ酸との会合が、前記末端に露出される他のタイプのアミノ酸とは異なる前記一連のシグナルパルスの特性パターンを生成する、請求項15に記載の方法。
  17. 前記特性パターンが前記一連のシグナルパルスの一部分を含む、請求項16に記載の方法。
  18. 前記特性パターンのシグナルパルスが、末端アミノ酸認識分子と前記末端に露出されるアミノ酸との間の個別会合イベントに対応する、請求項17に記載の方法。
  19. 前記特性パターンの前記シグナルパルスが、前記末端アミノ酸認識分子と前記末端に露出される前記アミノ酸との間の結合の解離速度に特有なパルス持続時間を含む、請求項18に記載の方法。
  20. 前記特性パターンの各シグナルパルスが、末端アミノ酸認識分子結合の会合速度に特有なパルス間持続時間により他のものから分離される、請求項19に記載の方法。
  21. 前記特性パターンが、前記単一ポリペプチド分子の末端に露出される前記アミノ酸との一連の可逆末端アミノ酸認識分子結合相互作用に対応する、請求項16~20のいずれか一項に記載の方法。
  22. 前記一連の可逆末端アミノ酸認識分子結合相互作用が、前記単一ポリペプチド分子の末端での1つの二元複合体種の可逆形成を含む、請求項21に記載の方法。
  23. 前記一連の可逆末端アミノ酸認識分子結合相互作用が、前記単一ポリペプチド分子の末端での異なる二元複合体種の可逆形成を含む、請求項21に記載の方法。
  24. 前記特性パターンが、前記単一ポリペプチド分子の末端に露出される前記アミノ酸及び連続位置のアミノ酸の指標となる、請求項16~23のいずれか一項に記載の方法。
  25. 前記末端に露出されるアミノ酸及び前記連続位置のアミノ酸が異なるタイプである、請求項24に記載の方法。
  26. シーケンシングが、前記単一ポリペプチドが分解されている間に前記単一ポリペプチドの末端に露出される各タイプの逐次アミノ酸を同定することを含む、請求項15~25のいずれか一項に記載の方法。
  27. シーケンシングが、前記単一ポリペプチドが分解されている間に前記単一ポリペプチドの末端に露出されるすべてのタイプの逐次アミノ酸の一部分を同定することを含む、請求項15~25のいずれか一項に記載の方法。
  28. シーケンシングが、前記単一ポリペプチドが分解されている間に前記単一ポリペプチドの末端に露出される逐次アミノ酸の相対位置を決定することを含む、請求項15~27のいずれか一項に記載の方法。
  29. シーケンシングが、前記単一ポリペプチド分子の少なくとも2つの連続アミノ酸を同定することを含む、請求項15~28のいずれか一項に記載の方法。
  30. シーケンシングが、前記単一ポリペプチド分子の少なくとも2つの非連続アミノ酸を同定することを含む、請求項15~29のいずれか一項に記載の方法。
  31. シーケンシングが、天然に存在するアミノ酸、非天然アミノ酸、又はそれらの修飾変異体として、前記末端に露出されるアミノ酸を同定することを含む、請求項15~30のいずれか一項に記載の方法。
  32. シーケンシングが、荷電、非荷電、極性、非極性、疎水性、芳香族、又はそれらの組合せの側鎖を有するものとして、前記末端に露出されるアミノ酸を同定することを含む、請求項15~31のいずれか一項に記載の方法。
  33. 前記側鎖が負荷電又は正荷電である、請求項32に記載の方法。
  34. シーケンシングが、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リシン、メチオニン、フェニルアラニン、プロリン、セレノシステイン、セリン、トレオニン、トリプトファン、チロシン、及びバリンから選択される1タイプとして、前記末端に露出されるアミノ酸を同定することを含む、請求項15~33のいずれか一項に記載の方法。
  35. シーケンシングが、翻訳後修飾を有するものとして、前記末端に露出されるアミノ酸を同定することとを含む、請求項15~34のいずれか一項に記載の方法。
  36. 前記翻訳後修飾が、アセチル化、ADPリボシル化、カスパーゼ切断、シトルリン化、ホルミル化、N連結グリコシル化、O連結グリコシル化、ヒドロキシル化、メチル化、ミリストイル化、NEDD化、ニトロ化、酸化、パルミトイル化、リン酸化、プレニル化、S-ニトロシル化、硫酸化、SUMO化及びユビキチン化から選択される、請求項35に記載の方法。
  37. 前記一連のシグナルパルスが、光学シグナルの大きさの一連の変化を経時的に含む、請求項15~36のいずれか一項に記載の方法。
  38. 前記一連の各シグナルパルスが複数の光子放出イベントを含む、請求項37に記載の方法。
  39. シーケンシングが、発光寿命、発光輝度、発光強度、発光波長、発光偏光、及び発光量子収率の1つ以上を決定することをさらに含む、請求項38に記載の方法。
  40. 前記一連のシグナルパルスが、電気シグナルの大きさの一連の変化を経時的に含む、請求項15~39のいずれか一項に記載の方法。
  41. 前記一連のシグナルパルスが、可逆単一分子結合相互作用に対応する伝導率遷移を含む、請求項40に記載の方法。
  42. 前記1つ以上の末端アミノ酸認識分子の各々が認識タンパク質又は認識核酸を含む、請求項15~41のいずれか一項に記載の方法。
  43. 前記認識タンパク質が、分解経路タンパク質、ペプチダーゼ、抗体、アミノトランスフェラーゼ、tRNAシンテターゼ、若しくはSH2ドメイン含有タンパク質、又はそれらの断片である、請求項42に記載の方法。
  44. 前記分解経路タンパク質が、N末端則経路タンパク質又はその突然変異体若しくは変異体である、請求項43に記載の方法。
  45. 前記N末端則経路タンパク質が、Arg/N末端則経路タンパク質、Ac/N末端則経路タンパク質、又はPro/N末端則経路タンパク質である、請求項44に記載の方法。
  46. 前記N末端則経路タンパク質が、Gidタンパク質、UBRボックスタンパク質若しくはそのUBRボックスドメイン含有断片、p62タンパク質若しくはそのZZドメイン含有断片、又はClpSタンパク質である、請求項45に記載の方法。
  47. 前記Gidタンパク質が、S.セレビシエ(S.cerevisiae)又はその相同種由来のGid4又はGid10である、請求項46に記載の方法。
  48. 前記UBRボックスタンパク質が、ヒト、S.セレビシエ(S.cerevisiae)、又はそれらの相同種由来のUBR1又はUBR2である、請求項46に記載の方法。
  49. 前記p62タンパク質が、ヒト、ラット、又はそれらの相同種由来のp62である、請求項46に記載の方法。
  50. 前記ClpSタンパク質が、A.ツミファシエンス(A.tumifaciens)、C.クレセンタス(C.crescentus)、E.コリ(E.coli)、S.エロンガタス(elongatus)、P.ファルシパルム(P.falciparum)、T.エロンガタス(elongatus)、又はそれらの相同種由来のClpS1又はClpS2である、請求項46に記載の方法。
  51. 前記認識タンパク質が合成タンパク質又は組換えタンパク質である、請求項42~50のいずれか一項に記載の方法。
  52. 前記認識核酸が核酸アプタマーである、請求項42に記載の方法。
  53. 前記1つ以上の末端アミノ酸認識分子の各々が検出可能標識を含む、請求項15~52のいずれか一項に記載の方法。
  54. 前記検出可能標識が発光標識又は伝導率標識である、請求項53に記載の方法。
  55. 前記単一ポリペプチド分子が表面に固定される、請求項15~54のいずれか一項に記載の方法。
  56. 前記単一ポリペプチド分子が、前記1つ以上の末端アミノ酸認識分子が会合する前記末端の遠位にある末端を介して表面に固定される、請求項55に記載の方法。
  57. 前記単一ポリペプチド分子がカルボキシ末端を介して固定される、請求項55に記載の方法。
  58. 前記単一ポリペプチド分子がアミノ末端を介して固定される、請求項55に記載の方法。
  59. 前記単一ポリペプチド分子がリンカーを介して前記表面に固定される、請求項55~58のいずれか一項に記載の方法。
  60. 前記リンカーがバイオ分子を含み、任意選択的に前記バイオ分子がオリゴヌクレオチドである、請求項59に記載の方法。
  61. 前記単一ポリペプチド分子が、前記単一ポリペプチド分子の末端から1つ以上のアミノ酸を除去する切断試薬により分解される、請求項15~60のいずれか一項に記載の方法。
  62. 前記切断試薬と前記末端との会合の指標となるシグナルを検出することをさらに含む、請求項61に記載の方法。
  63. 前記切断試薬が検出可能標識を含む、請求項61又は62に記載の方法。
  64. 前記検出可能標識が発光標識又は伝導率標識である、請求項63に記載の方法。
  65. 前記一連のシグナルパルスが一連のリアルタイムシグナルパルスである、請求項15~64のいずれか一項に記載の方法。
  66. 少なくとも1つのハードウェアプロセッサーと、
    前記少なくとも1つのハードウェアプロセッサーによる実行時に前記少なくとも1つのハードウェアプロセッサーに請求項15~65のいずれか一項に記載の方法を実施させるプロセッサー実行可能命令を記憶する少なくとも1つの非一時コンピュータ可読記憶媒体と、
    を含むシステム。
  67. 少なくとも1つのハードウェアプロセッサーによる実行時に前記少なくとも1つのハードウェアプロセッサーに請求項15~65のいずれか一項に記載の方法を実施させるプロセッサー実行可能命令を記憶する少なくとも1つの非一時コンピュータ可読記憶媒体。
  68. ポリペプチドのシーケンシング方法であって、前記方法は、
    反応混合物中の単一ポリペプチド分子と、1つ以上の末端アミノ酸認識分子と切断試薬とを含む組成物と、を接触させることと、
    前記切断試薬の存在下で前記1つ以上の末端アミノ酸認識分子と前記単一ポリペプチド分子の末端との会合の指標となる一連のシグナルパルスを検出することであって、前記一連のシグナルパルスが、前記切断試薬による末端アミノ酸切断の結果として経時的に末端に露出される一連のアミノ酸の指標となる、検出することと、
    を含む方法。
  69. 前記1つ以上の末端アミノ酸認識分子と前記末端に露出される各タイプのアミノ酸との会合が、前記末端に露出される他のタイプのアミノ酸とは異なる前記一連のシグナルパルスの特性パターンを生成する、請求項68に記載の方法。
  70. 前記特性パターンが前記一連のシグナルパルスの一部分を含む、請求項69に記載の方法。
  71. 前記特性パターンのシグナルパルスが、末端アミノ酸認識分子と前記末端に露出されるアミノ酸との間の個別会合イベントに対応する、請求項70に記載の方法。
  72. 前記特性パターンの前記シグナルパルスが、前記末端アミノ酸認識分子と前記末端に露出される前記アミノ酸との間の結合の解離速度に特有なパルス持続時間を含む、請求項71に記載の方法。
  73. 前記特性パターンの各シグナルパルスが、末端アミノ酸認識分子結合の会合速度に特有なパルス間持続時間により他のものから分離される、請求項72に記載の方法。
  74. 前記特性パターンが、前記単一ポリペプチド分子の末端に露出される前記アミノ酸との一連の可逆末端アミノ酸認識分子結合相互作用に対応する、請求項69~73のいずれか一項に記載の方法。
  75. 前記一連の可逆末端アミノ酸認識分子結合相互作用が、前記単一ポリペプチド分子の末端での1つの二元複合体種の可逆形成を含む、請求項74に記載の方法。
  76. 前記一連の可逆末端アミノ酸認識分子結合相互作用が、前記単一ポリペプチド分子の末端での異なる二元複合体種の可逆形成を含む、請求項74に記載の方法。
  77. 前記特性パターンが、前記単一ポリペプチド分子の末端に露出される前記アミノ酸及び連続位置のアミノ酸の指標となる、請求項69~76のいずれか一項に記載の方法。
  78. 前記末端に露出されるアミノ酸及び前記連続位置のアミノ酸が異なるタイプである、請求項77に記載の方法。
  79. シーケンシングが、前記単一ポリペプチドが分解されている間に前記単一ポリペプチドの末端に露出される各タイプの逐次アミノ酸を同定することを含む、請求項68~78のいずれか一項に記載の方法。
  80. シーケンシングが、前記単一ポリペプチドが分解されている間に前記単一ポリペプチドの末端に露出されるすべてのタイプの逐次アミノ酸の一部分を同定することを含む、請求項68~78のいずれか一項に記載の方法。
  81. シーケンシングが、前記単一ポリペプチドが分解されている間に前記単一ポリペプチドの末端に露出される逐次アミノ酸の相対位置を決定することを含む、請求項68~80のいずれか一項に記載の方法。
  82. シーケンシングが、前記単一ポリペプチド分子の少なくとも2つの連続アミノ酸を同定することを含む、請求項68~81のいずれか一項に記載の方法。
  83. シーケンシングが、前記単一ポリペプチド分子の少なくとも2つの非連続アミノ酸を同定することを含む、請求項68~82のいずれか一項に記載の方法。
  84. シーケンシングが、天然に存在するアミノ酸、非天然アミノ酸、又はそれらの修飾変異体として、前記末端に露出されるアミノ酸を同定することを含む、請求項68~83のいずれか一項に記載の方法。
  85. シーケンシングが、荷電、非荷電、極性、非極性、疎水性、芳香族、又はそれらの組合せの側鎖を有するものとして、前記末端に露出されるアミノ酸を同定することを含む、請求項68~84のいずれか一項に記載の方法。
  86. 前記側鎖が負荷電又は正荷電である、請求項85に記載の方法。
  87. シーケンシングが、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リシン、メチオニン、フェニルアラニン、プロリン、セレノシステイン、セリン、トレオニン、トリプトファン、チロシン、及びバリンから選択される1タイプとして、前記末端に露出されるアミノ酸を同定することを含む、請求項68~86のいずれか一項に記載の方法。
  88. シーケンシングが、翻訳後修飾を有するものとして、前記末端に露出されるアミノ酸を同定することとを含む、請求項68~87のいずれか一項に記載の方法。
  89. 前記翻訳後修飾が、アセチル化、ADPリボシル化、カスパーゼ切断、シトルリン化、ホルミル化、N連結グリコシル化、O連結グリコシル化、ヒドロキシル化、メチル化、ミリストイル化、NEDD化、ニトロ化、酸化、パルミトイル化、リン酸化、プレニル化、S-ニトロシル化、硫酸化、SUMO化及びユビキチン化から選択される、請求項88に記載の方法。
  90. 前記一連のシグナルパルスが、光学シグナルの大きさの一連の変化を経時的に含む、請求項68~89のいずれか一項に記載の方法。
  91. 前記一連の各シグナルパルスが複数の光子放出イベントを含む、請求項90に記載の方法。
  92. シーケンシングが、発光寿命、発光輝度、発光強度、発光波長、発光分極、及び発光量子収率の1つ以上を決定することをさらに含む、請求項91に記載の方法。
  93. 前記一連のシグナルパルスが、電気シグナルの大きさの一連の変化を経時的に含む、請求項68~92のいずれか一項に記載の方法。
  94. 前記一連のシグナルパルスが、可逆単一分子結合相互作用に対応する伝導率遷移を含む、請求項93に記載の方法。
  95. 前記1つ以上の末端アミノ酸認識分子の各々が認識タンパク質又は認識核酸を含む、請求項68~94のいずれか一項に記載の方法。
  96. 前記認識タンパク質が、分解経路タンパク質、ペプチダーゼ、抗体、アミノトランスフェラーゼ、tRNAシンテターゼ、若しくはSH2ドメイン含有タンパク質、又はそれらの断片である、請求項95に記載の方法。
  97. 前記分解経路タンパク質が、N末端則経路タンパク質又はその突然変異体若しくは変異体である、請求項96に記載の方法。
  98. 前記N末端則経路タンパク質が、Arg/N末端則経路タンパク質、Ac/N末端則経路タンパク質、又はPro/N末端則経路タンパク質である、請求項97に記載の方法。
  99. 前記N末端則経路タンパク質が、Gidタンパク質、UBRボックスタンパク質若しくはそのUBRボックスドメイン含有断片、p62タンパク質若しくはそのZZドメイン含有断片、又はClpSタンパク質である、請求項98に記載の方法。
  100. 前記Gidタンパク質が、S.セレビシエ(S.cerevisiae)又はその相同種由来のGid4又はGid10である、請求項99に記載の方法。
  101. 前記UBRボックスタンパク質が、ヒト、S.セレビシエ(S.cerevisiae)、又はそれらの相同種由来のUBR1又はUBR2である、請求項99に記載の方法。
  102. 前記p62タンパク質が、ヒト、ラット、又はそれらの相同種由来のp62である、請求項99に記載の方法。
  103. 前記ClpSタンパク質が、A.ツミファシエンス(A.tumifaciens)、C.クレセンタス(C.crescentus)、E.コリ(E.coli)、S.エロンガタス(elongatus)、P.ファルシパルム(P.falciparum)、T.エロンガタス(elongatus)、又はそれらの相同種由来のClpS1又はClpS2である、請求項99に記載の方法。
  104. 前記認識タンパク質が合成タンパク質又は組換えタンパク質である、請求項95~103のいずれか一項に記載の方法。
  105. 前記認識核酸が核酸アプタマーである、請求項95に記載の方法。
  106. 前記1つ以上の末端アミノ酸認識分子の各々が検出可能標識を含む、請求項68~105のいずれか一項に記載の方法。
  107. 前記検出可能標識が発光標識又は伝導率標識である、請求項106に記載の方法。
  108. 前記単一ポリペプチド分子が表面に固定される、請求項68~107のいずれか一項に記載の方法。
  109. 前記単一ポリペプチド分子が、前記1つ以上の末端アミノ酸認識分子が会合する前記末端の遠位にある末端を介して前記表面に固定される、請求項108に記載の方法。
  110. 前記単一ポリペプチド分子がカルボキシ末端を介して固定される、請求項108に記載の方法。
  111. 前記単一ポリペプチド分子がアミノ末端を介して固定される、請求項108に記載の方法。
  112. 前記単一ポリペプチド分子がリンカーを介して前記表面に固定される、請求項108~111のいずれか一項に記載の方法。
  113. 前記リンカーがバイオ分子を含み、任意選択的に前記バイオ分子がオリゴヌクレオチドである、請求項112に記載の方法。
  114. 前記切断試薬と前記末端との会合の指標となるシグナルを検出することをさらに含む、請求項68~113のいずれか一項に記載の方法。
  115. 前記切断試薬が検出可能標識を含む、請求項68~114のいずれか一項に記載の方法。
  116. 前記検出可能標識が発光標識又は伝導率標識である、請求項115に記載の方法。
  117. 前記一連のシグナルパルスが一連のリアルタイムシグナルパルスである、請求項68~116のいずれか一項に記載の方法。
  118. 少なくとも1つのハードウェアプロセッサーと、
    前記少なくとも1つのハードウェアプロセッサーによる実行時に前記少なくとも1つのハードウェアプロセッサーに請求項68~117のいずれか一項に記載の方法を実施させるプロセッサー実行可能命令を記憶する少なくとも1つの非一時コンピュータ可読記憶媒体と、
    を含むシステム。
  119. 少なくとも1つのハードウェアプロセッサーによる実行時に前記少なくとも1つのハードウェアプロセッサーに請求項68~117のいずれか一項に記載の方法を実施させるプロセッサー実行可能命令を記憶する少なくとも1つの非一時コンピュータ可読記憶媒体。
  120. ポリペプチドシーケンシング方法であって、
    a)単一ポリペプチド分子の末端の第1のアミノ酸を同定することと、
    b)前記第1のアミノ酸を除去して前記単一ポリペプチド分子の末端に第2のアミノ酸を露出させることと、
    c)前記単一ポリペプチド分子の末端の前記第2のアミノ酸を同定することと、
    を含み、
    (a)~(c)が単一反応混合物中で実施される、方法。
  121. (a)~(c)が逐次行われる、請求項120に記載の方法。
  122. (c)が(a)及び(b)の前に行われる、請求項120に記載の方法。
  123. 前記単一反応混合物が1つ以上の末端アミノ酸認識分子を含む、請求項120~122のいずれか一項に記載の方法。
  124. 前記第1及び第2のアミノ酸が、前記1つ以上の末端アミノ酸認識分子と前記単一ポリペプチド分子の末端との会合の指標となる一連のシグナルパルスを検出することにより同定される、請求項123に記載の方法。
  125. 前記1つ以上の末端アミノ酸認識分子と前記第1のアミノ酸との会合が、前記第2のアミノ酸とは異なる一連のシグナルパルスの特性パターンを生成する、請求項124に記載の方法。
  126. 前記1つ以上の末端アミノ酸認識分子の各々が認識タンパク質又は認識核酸を含む、請求項120~125のいずれか一項に記載の方法。
  127. 前記認識タンパク質が、分解経路タンパク質、ペプチダーゼ、抗体、アミノトランスフェラーゼ、tRNAシンテターゼ、若しくはSH2ドメイン含有タンパク質、又はそれらの断片である、請求項126に記載の方法。
  128. 前記分解経路タンパク質が、N末端則経路タンパク質又はその突然変異体若しくは変異体である、請求項127に記載の方法。
  129. 前記N末端則経路タンパク質が、Arg/N末端則経路タンパク質、Ac/N末端則経路タンパク質、又はPro/N末端則経路タンパク質である、請求項128に記載の方法。
  130. 前記N末端則経路タンパク質が、Gidタンパク質、UBRボックスタンパク質若しくはそのUBRボックスドメイン含有断片、p62タンパク質若しくはそのZZドメイン含有断片、又はClpSタンパク質である、請求項129に記載の方法。
  131. 前記Gidタンパク質が、S.セレビシエ(S.cerevisiae)又はその相同種由来のGid4又はGid10である、請求項130に記載の方法。
  132. 前記UBRボックスタンパク質が、ヒト、S.セレビシエ(S.cerevisiae)、又はそれらの相同種由来のUBR1又はUBR2である、請求項130に記載の方法。
  133. 前記p62タンパク質が、ヒト、ラット、又はそれらの相同種由来のp62である、請求項130に記載の方法。
  134. 前記ClpSタンパク質が、A.ツミファシエンス(A.tumifaciens)、C.クレセンタス(C.crescentus)、E.コリ(E.coli)、S.エロンガタス(elongatus)、P.ファルシパルム(P.falciparum)、T.エロンガタス(elongatus)、又はそれらの相同種由来のClpS1又はClpS2である、請求項130に記載の方法。
  135. 前記認識タンパク質が合成タンパク質又は組換えタンパク質である、請求項126~134のいずれか一項に記載の方法。
  136. 前記認識核酸が核酸アプタマーである、請求項126に記載の方法。
  137. 前記1つ以上の末端アミノ酸認識分子の各々が検出可能標識を含む、請求項120~136のいずれか一項に記載の方法。
  138. 前記検出可能標識が発光標識又は伝導率標識である、請求項137に記載の方法。
  139. 前記単一反応混合物が、前記単一ポリペプチド分子の末端から1つ以上のアミノ酸を除去する切断試薬を含む、請求項120~138のいずれか一項に記載の方法。
  140. 前記第1のアミノ酸が前記切断試薬により除去される、請求項139に記載の方法。
  141. 前記切断試薬が検出可能標識を含む、請求項139又は140に記載の方法。
  142. 前記検出可能標識が発光標識又は伝導率標識である、請求項141に記載の方法。
  143. 前記単一ポリペプチド分子が表面に固定される、請求項120~142のいずれか一項に記載の方法。
  144. 前記単一ポリペプチド分子が、前記第1のアミノ酸が除去される末端の遠位にある末端を介して前記表面に固定される、請求項143に記載の方法。
  145. 前記単一ポリペプチド分子がカルボキシ末端を介して固定される、請求項143に記載の方法。
  146. 前記単一ポリペプチド分子がアミノ末端を介して固定される、請求項143に記載の方法。
  147. 前記単一ポリペプチド分子がリンカーを介して前記表面に固定される、請求項143~146のいずれか一項に記載の方法。
  148. 前記リンカーがバイオ分子を含み、任意選択的に前記バイオ分子がオリゴヌクレオチドである、請求項147に記載の方法。
  149. 前記一連のシグナルパルスが一連のリアルタイムシグナルパルスである、請求項124~148のいずれか一項に記載の方法。
  150. 少なくとも1つのハードウェアプロセッサーと、
    前記少なくとも1つのハードウェアプロセッサーによる実行時に前記少なくとも1つのハードウェアプロセッサーに請求項120~149のいずれか一項に記載の方法を実施させるプロセッサー実行可能命令を記憶する少なくとも1つの非一時コンピュータ可読記憶媒体と、
    を含むシステム。
  151. 少なくとも1つのハードウェアプロセッサーによる実行時に前記少なくとも1つのハードウェアプロセッサーに請求項120~149のいずれか一項に記載の方法を実施させるプロセッサー実行可能命令を記憶する少なくとも1つの非一時コンピュータ可読記憶媒体。
  152. ポリペプチドのアミノ酸を同定する方法であって、前記方法は、
    単一ポリペプチド分子と前記単一ポリペプチド分子に結合する1つ以上のアミノ酸認識分子とを接触させることと、
    ポリペプチド分解条件下で前記1つ以上のアミノ酸認識分子と前記単一ポリペプチド分子との会合の指標となる一連のシグナルパルスを検出することと、
    前記一連のシグナルパルスの第1の特性パターンに基づいて前記単一ポリペプチド分子の第1のタイプのアミノ酸を同定することと、
    を含む方法。
  153. 前記第1の特性パターンが前記一連のシグナルパルスの少なくとも一部分を含む、請求項152に記載の方法。
  154. 前記第1の特性パターンのシグナルパルスが、アミノ酸認識分子と前記第1のタイプのアミノ酸との間の個別会合イベントに対応する、請求項153に記載の方法。
  155. 前記第1の特性パターンの前記シグナルパルスが、前記アミノ酸認識分子と前記第1のタイプのアミノ酸との間の結合の解離速度に特有なパルス持続時間を含む、請求項154に記載の方法。
  156. 前記第1の特性パターンの各シグナルパルスが、アミノ酸認識分子結合の会合速度に特有なパルス間持続時間により他から分離される、請求項155に記載の方法。
  157. 前記第1の特性パターンが、前記単一ポリペプチド分子の前記第1のタイプのアミノ酸との一連の可逆アミノ酸認識分子結合相互作用に対応する、請求項152~156のいずれか一項に記載の方法。
  158. 前記一連の可逆アミノ酸認識分子結合相互作用が、前記単一ポリペプチド分子の末端での1つの二元複合体種の可逆形成を含む、請求項157に記載の方法。
  159. 前記一連の可逆アミノ酸認識分子結合相互作用が、前記単一ポリペプチド分子の末端での異なる二元複合体種の可逆形成を含む、請求項157に記載の方法。
  160. 前記単一ポリペプチド分子が前記単一ポリペプチド分子の末端位置に前記第1のタイプのアミノ酸を含む、請求項152~159のいずれか一項に記載の方法。
  161. 前記第1の特性パターンが、前記末端位置の前記第1のタイプのアミノ酸と連続位置のアミノ酸タイプとの指標となっている、請求項160に記載の方法。
  162. 前記末端位置及び前記連続位置のアミノ酸が異なるタイプである、請求項161に記載の方法。
  163. 前記単一ポリペプチド分子が、前記単一ポリペプチド分子の内部位置に前記第1のタイプのアミノ酸を含む、請求項152~162のいずれか一項に記載の方法。
  164. 前記単一ポリペプチド分子が、前記末端位置及び前記単一ポリペプチド分子の非連続内部位置に前記第1のタイプのアミノ酸を含む、請求項160~163のいずれか一項に記載の方法。
  165. 前記第1の特性パターンが、前記末端位置の前記第1のタイプのアミノ酸と非連続内部位置のアミノ酸タイプとの指標となる、請求項164に記載の方法。
  166. 前記第1の特性パターンが、前記単一ポリペプチド分子の前記第1のタイプのアミノ酸の存在量の指標である、請求項164又は165に記載の方法。
  167. 同定することが、天然に存在するアミノ酸、非天然アミノ酸、又はそれらの修飾変異体として前記第1のタイプのアミノ酸を同定することを含む、請求項152~166のいずれか一項に記載の方法。
  168. 同定することが、荷電、非荷電、極性、非極性、疎水性、芳香族、又はそれらの組合せの側鎖を有するとして、前記第1のタイプのアミノ酸を同定することを含む、請求項152~167のいずれか一項に記載の方法。
  169. 前記側鎖が負荷電又は正荷電である、請求項168に記載の方法。
  170. 同定することが、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リシン、メチオニン、フェニルアラニン、プロリン、セレノシステイン、セリン、トレオニン、トリプトファン、チロシン、及びバリンから選択される1タイプとして、前記第1のタイプのアミノ酸を同定することを含む、請求項152~169のいずれか一項に記載の方法。
  171. 同定することが、翻訳後修飾を有するとして前記第1のタイプのアミノ酸を同定することを含む、請求項152~170のいずれか一項に記載の方法。
  172. 前記翻訳後修飾が、アセチル化、ADPリボシル化、カスパーゼ切断、シトルリン化、ホルミル化、N連結グリコシル化、O連結グリコシル化、ヒドロキシル化、メチル化、ミリストイル化、NEDD化、ニトロ化、酸化、パルミトイル化、リン酸化、プレニル化、S-ニトロシル化、硫酸化、SUMO化及びユビキチン化から選択される、請求項171に記載の方法。
  173. 前記一連のシグナルパルスが、光学シグナルの大きさの一連の変化を経時的に含む、請求項152~172のいずれか一項に記載の方法。
  174. 前記一連の各シグナルパルスが複数の光子放出イベントを含む、請求項173に記載の方法。
  175. 前記第1のタイプのアミノ酸を同定することが、発光寿命、発光輝度、発光強度、発光波長、発光偏光、及び発光量子収率の1つ以上を決定することをさらに含む、請求項174に記載の方法。
  176. 前記一連のシグナルパルスが、電気シグナルの大きさの一連の変化を経時的に含む、請求項152~175のいずれか一項に記載の方法。
  177. 前記第1の特性パターンが、可逆単一分子結合相互作用に対応する伝導率遷移を含む、請求項176に記載の方法。
  178. 前記1つ以上のアミノ酸認識分子の各々が認識タンパク質又は認識核酸を含む、請求項152~177のいずれか一項に記載の方法。
  179. 前記認識タンパク質が、分解経路タンパク質、ペプチダーゼ、抗体、アミノトランスフェラーゼ、tRNAシンテターゼ、若しくはSH2ドメイン含有タンパク質、又はそれらの断片である、請求項178に記載の方法。
  180. 前記分解経路タンパク質が、N末端則経路タンパク質又はその突然変異体若しくは変異体である、請求項179に記載の方法。
  181. 前記N末端則経路タンパク質が、Arg/N末端則経路タンパク質、Ac/N末端則経路タンパク質、又はPro/N末端則経路タンパク質である、請求項180に記載の方法。
  182. 前記N末端則経路タンパク質が、Gidタンパク質、UBRボックスタンパク質若しくはそのUBRボックスドメイン含有断片、p62タンパク質若しくはそのZZドメイン含有断片、又はClpSタンパク質である、請求項181に記載の方法。
  183. 前記Gidタンパク質が、S.セレビシエ(S.cerevisiae)又はその相同種由来のGid4又はGid10である、請求項182に記載の方法。
  184. 前記UBRボックスタンパク質が、ヒト、S.セレビシエ(S.cerevisiae)、又はそれらの相同種由来のUBR1又はUBR2である、請求項182に記載の方法。
  185. 前記p62タンパク質が、ヒト、ラット、又はそれらの相同種由来のp62である、請求項182に記載の方法。
  186. 前記ClpSタンパク質が、A.ツミファシエンス(A.tumifaciens)、C.クレセンタス(C.crescentus)、E.コリ(E.coli)、S.エロンガタス(elongatus)、P.ファルシパルム(P.falciparum)、T.エロンガタス(elongatus)、又はそれらの相同種由来のClpS1又はClpS2である、請求項182に記載の方法。
  187. 前記認識タンパク質が合成タンパク質又は組換えタンパク質である、請求項178~186のいずれか一項に記載の方法。
  188. 前記認識核酸が核酸アプタマーである、請求項178に記載の方法。
  189. 前記1つ以上のアミノ酸認識分子の各々が検出可能標識を含む、請求項152~188のいずれか一項に記載の方法。
  190. 前記検出可能標識が発光標識又は伝導率標識である、請求項189に記載の方法。
  191. 前記単一ポリペプチド分子が表面に固定される、請求項152~190のいずれか一項に記載の方法。
  192. 前記単一ポリペプチド分子が、一方の末端を介して前記表面に固定され、且つ前記1つ以上のアミノ酸認識分子が、他方の末端を介して前記単一ポリペプチド分子に結合する、請求項191に記載の方法。
  193. 前記単一ポリペプチド分子が、カルボキシ末端を介して固定され、且つ前記1つ以上のアミノ酸認識分子が、アミノ末端で前記単一ポリペプチド分子に結合する、請求項192に記載の方法。
  194. 前記単一ポリペプチド分子が、アミノ末端を介して固定され、且つ前記1つ以上のアミノ酸認識分子が、カルボキシ末端で前記単一ポリペプチド分子に結合する、請求項192に記載の方法。
  195. 前記単一ポリペプチド分子がリンカーを介して前記表面に固定される、請求項191~194のいずれか一項に記載の方法。
  196. 前記リンカーがバイオ分子を含み、任意選択的に前記バイオ分子がオリゴヌクレオチドである、請求項195に記載の方法。
  197. 前記単一ポリペプチド分子の分解を観測することをさらに含む、請求項152~196のいずれか一項に記載の方法。
  198. 前記分解条件が、前記単一ポリペプチド分子の末端から1つ以上の末端アミノ酸を除去可能な切断試薬の存在下で前記一連のシグナルパルスを検出することを含む、請求項152~197のいずれか一項に記載の方法。
  199. 前記切断試薬と前記単一ポリペプチド分子との会合の指標となるシグナルパルスの検出をさらに含む、請求項198に記載の方法。
  200. 前記切断試薬が検出可能標識を含む、請求項198又は199に記載の方法。
  201. 前記検出可能標識が発光標識又は伝導率標識である、請求項200に記載の方法。
  202. 前記一連のシグナルパルスの第2の特性パターンに基づいて前記単一ポリペプチド分子の第2のタイプのアミノ酸を同定することをさらに含む、請求項197~201のいずれか一項に記載の方法。
  203. シグナルパルスの前記第2の特性パターンが前記単一ポリペプチド分子からの前記第1のタイプのアミノ酸の除去の指標となる、請求項202に記載の方法。
  204. 前記一連のシグナルパルスが一連のリアルタイムシグナルパルスである、請求項152~203のいずれか一項に記載の方法。
  205. 少なくとも1つのハードウェアプロセッサーと、
    前記少なくとも1つのハードウェアプロセッサーによる実行時に前記少なくとも1つのハードウェアプロセッサーに請求項152~204のいずれか一項に記載の方法を実施させるプロセッサー実行可能命令を記憶する少なくとも1つの非一時コンピュータ可読記憶媒体と、
    を含むシステム。
  206. 少なくとも1つのハードウェアプロセッサーによる実行時に前記少なくとも1つのハードウェアプロセッサーに請求項152~204のいずれか一項に記載の方法を実施させるプロセッサー実行可能命令を記憶する少なくとも1つの非一時コンピュータ可読記憶媒体。
  207. 式(I):
    A-(Y)-D (I)
    (式中、
    Aは、少なくとも1つのアミノ酸認識分子を含むアミノ酸結合成分であり、
    Yの各々は、共有結合性又は非共有結合性連結基を形成するポリマーであり、
    nは、1~10(両端の値を含む)の整数であり、且つ
    Dは、少なくとも1つの検出可能標識を含む標識成分であり、Dは、200Å未満の直径である)
    の可溶性アミノ酸認識分子を含む組成物。
  208. -(Y)-が少なくとも2nmの長さである、請求項207に記載の組成物。
  209. -(Y)n-が少なくとも5nmの長さである、請求項207に記載の組成物。
  210. -(Y)-が少なくとも10nmの長さである、請求項207に記載の組成物。
  211. Yの各々が、独立して、バイオ分子、ポリオール、又はデンドリマーである、請求項207~210のいずれか一項に記載の組成物。
  212. 前記バイオ分子が、核酸、ポリペプチド、又は多糖である、請求項211に記載の組成物。
  213. 前記可溶性アミノ酸認識分子が、次式:
    A-Y-(Y)-D又はA-(Y)-Y-D
    (式中、
    は、核酸又はポリペプチドであり、且つ
    mは、0~10(両端の値を含む)の整数である)
    の1つである、請求項207~212のいずれか一項に記載の組成物。
  214. 前記核酸が第1のオリゴヌクレオチド鎖を含む、請求項212又は213に記載の組成物。
  215. 前記核酸が、前記第1のオリゴヌクレオチド鎖にハイブリダイズされた第2のオリゴヌクレオチド鎖を含む、請求項214に記載の組成物。
  216. 前記核酸が、前記第1のオリゴヌクレオチド鎖を介して共有結合性連結を形成する、請求項214又は215に記載の組成物。
  217. 前記核酸が、前記ハイブリダイズされた第1及び第2のオリゴヌクレオチド鎖を介して非共有結合性連結を形成する、請求項215に記載の組成物。
  218. 前記ポリペプチドが1価又は多価タンパク質である、請求項212~217のいずれか一項に記載の組成物。
  219. 前記1価又は多価タンパク質が、前記1価又は多価タンパク質のリガンド結合部位に装着されたリガンド部分を介して少なくとも1つの非共有結合性連結を形成する、請求項218に記載の組成物。
  220. A、Y、又はDがリガンド部分を含む、請求項219に記載の組成物。
  221. 前記可溶性アミノ酸認識分子が、次式:
    A-(Y)-Y-D又はA-Y-(Y)-D
    (式中、
    は、ポリオール又はデンドリマーであり、且つ
    mは、0~10(両端の値を含む)の整数である)
    の1つである、請求項207~212のいずれか一項に記載の組成物。
  222. 前記ポリオール又はデンドリマーが、ポリエチレングリコール、テトラエチレングリコール、ポリ(アミドアミン)、ポリ(プロピレンイミン)、ポリ(プロピレンアミン)、カルボシラン、ポリ(L-リシン)、又はそれらの1つ以上の組合せを含む、請求項221に記載の組成物。
  223. Aが複数のアミノ酸認識分子を含む、請求項207~222のいずれか一項に記載の組成物。
  224. 前記複数の各アミノ酸認識分子がY上の異なる装着部位に装着される、請求項223に記載の組成物。
  225. 前記複数のアミノ酸認識分子の少なくとも2つがY上の単一装着部位に装着される、請求項223に記載の組成物。
  226. 前記アミノ酸認識分子が認識タンパク質又は核酸アプタマーである、請求項207~225のいずれか一項に記載の組成物。
  227. 前記認識タンパク質が、分解経路タンパク質、ペプチダーゼ、抗体、アミノトランスフェラーゼ、tRNAシンテターゼ、若しくはSH2ドメイン含有タンパク質、又はそれらの断片である、請求項226に記載の組成物。
  228. 前記分解経路タンパク質がN末端則経路タンパク質又はその突然変異体若しくは変異体である、請求項227に記載の組成物。
  229. 前記N末端則経路タンパク質が、Arg/N末端則経路タンパク質、Ac/N末端則経路タンパク質、又はPro/N末端則経路タンパク質である、請求項228に記載の組成物。
  230. 前記N末端則経路タンパク質が、Gidタンパク質、UBRボックスタンパク質若しくはそのUBRボックスドメイン含有断片、p62タンパク質若しくはそのZZドメイン含有断片、又はClpSタンパク質である、請求項229に記載の組成物。
  231. 前記Gidタンパク質が、S.セレビシエ(S.cerevisiae)又はその相同種由来のGid4又はGid10である、請求項230に記載の組成物。
  232. 前記UBRボックスタンパク質が、ヒト、S.セレビシエ(S.cerevisiae)、又はそれらの相同種由来のUBR1又はUBR2である、請求項230に記載の組成物。
  233. 前記p62タンパク質が、ヒト、ラット、又はそれらの相同種由来のp62である、請求項230に記載の組成物。
  234. 前記ClpSタンパク質が、A.ツミファシエンス(A.tumifaciens)、C.クレセンタス(C.crescentus)、E.コリ(E.coli)、S.エロンガタス(elongatus)、P.ファルシパルム(P.falciparum)、T.エロンガタス(elongatus)、又はそれらの相同種由来のClpS1又はClpS2である、請求項230に記載の組成物。
  235. 前記検出可能標識が発光標識又は伝導率標識である、請求項207~234のいずれか一項に記載の組成物。
  236. 前記発光標識が少なくとも1つのフルオロフォア色素分子を含む、請求項235に記載の組成物。
  237. Dが20以下のフルオロフォア色素分子を含む、請求項236に記載の組成物。
  238. 前記フルオロフォア色素分子の数と前記アミノ酸認識分子の数との比が1:1~20:1である、請求項236又は237に記載の組成物。
  239. 前記発光標識が、ドナー標識とアクセプター標識とを含む少なくとも1つのFRETペアを含む、請求項235~238のいずれか一項に記載の組成物。
  240. 前記ドナー標識と前記アクセプター標識との比が1:1、2:1、3:1、4:1、又は5:1である、請求項239に記載の組成物。
  241. 前記アクセプター標識と前記ドナー標識との比が1:1、2:1、3:1、4:1、又は5:1である、請求項239に記載の組成物。
  242. 式(II):
    A-Y-D(II)
    (式中、
    Aは、少なくとも1つのアミノ酸認識分子を含むアミノ酸結合成分であり、
    は、核酸又はポリペプチドであり、
    Dは、少なくとも1つの検出可能標識を含む標識成分であり、
    ただし、Yが核酸であるとき、前記核酸は共有結合性又は非共有結合性連結基を形成し、且つ
    ただし、Yがポリペプチドであるとき、前記ポリペプチドは、50×10-9M未満の解離定数(K)により特徴付けられる非共有結合性連結基を形成する)
    のアミノ酸認識分子。
  243. -Y-が少なくとも2nmの長さである、請求項242に記載のアミノ酸認識分子。
  244. -Y-が少なくとも5nmの長さである、請求項242に記載のアミノ酸認識分子。
  245. -Y-が少なくとも10nmの長さである、請求項242に記載のアミノ酸認識分子。
  246. 前記核酸が第1のオリゴヌクレオチド鎖を含む、請求項242~245のいずれか一項に記載のアミノ酸認識分子。
  247. 前記核酸が、前記第1のオリゴヌクレオチド鎖にハイブリダイズされた第2のオリゴヌクレオチド鎖を含む、請求項246に記載のアミノ酸認識分子。
  248. Aが前記第1のオリゴヌクレオチド鎖に装着され、且つDが前記第2のオリゴヌクレオチド鎖に装着される、請求項247に記載のアミノ酸認識分子。
  249. Aが前記第1のオリゴヌクレオチド鎖上の第1の装着部位に装着され、且つDが前記第1のオリゴヌクレオチド鎖上の第2の装着部位に装着される、請求項246又は247に記載のアミノ酸認識分子。
  250. 前記核酸の各オリゴヌクレオチド鎖が、150未満、100未満、又は50未満のヌクレオチドを含む、請求項246~249のいずれか一項に記載のアミノ酸認識分子。
  251. 前記ポリペプチドが1価又は多価タンパク質である、請求項242~250のいずれか一項に記載のアミノ酸認識分子。
  252. 前記1価又は多価タンパク質が、前記1価又は多価タンパク質のリガンド結合部位に装着されたリガンド部分を介して少なくとも1つの非共有結合性連結を形成する、請求項251に記載のアミノ酸認識分子。
  253. A及びDの少なくとも1つがリガンド部分を含む、請求項252に記載のアミノ酸認識分子。
  254. 前記ポリペプチドはアビジンタンパク質である、請求項242~253のいずれか一項に記載のアミノ酸認識分子。
  255. 前記アビジンタンパク質が、アビジン、ストレプトアビジン、トラプタビジン、タマビジン、ブラダビジン、キセナビジン(xenavidin)、又はそれらのホモログ若しくは変異体である、請求項254に記載のアミノ酸認識分子。
  256. 前記リガンド部分がビオチン部分である、請求項252~255のいずれか一項に記載のアミノ酸認識分子。
  257. 前記Kが、1×10-9M未満、1×10-10M未満、1×10-11M未満、又は1×10-12M未満である、請求項242~256のいずれか一項に記載のアミノ酸認識分子。
  258. 前記アミノ酸認識分子が、次式:
    A-Y-(Y)-D又はA-(Y)-Y-D
    (式中、
    Yの各々は、共有結合性又は非共有結合性連結基を形成するポリマーであり、且つ
    nは、1~10(両端の値を含む)の整数である)
    の1つである、請求項242~257のいずれか一項に記載のアミノ酸認識分子。
  259. Yの各々が、独立して、バイオ分子、ポリオール、又はデンドリマーである、請求項258に記載のアミノ酸認識分子。
  260. 核酸と、
    前記核酸上の第1の装着部位に装着された少なくとも1つのアミノ酸認識分子と、
    前記核酸上の第2の装着部位に装着された少なくとも1つの検出可能標識と、
    を含むアミノ酸認識分子であって、
    前記核酸が前記少なくとも1つのアミノ酸認識分子と前記少なくとも1つの検出可能標識との間に共有結合性又は非共有結合性連結基を形成する、アミノ酸認識分子。
  261. 前記核酸が、第2のオリゴヌクレオチド鎖にハイブリダイズされた第1のオリゴヌクレオチド鎖を含む二本鎖核酸である、請求項260に記載のアミノ酸認識分子。
  262. 前記第1の装着部位が前記第1のオリゴヌクレオチド鎖上にあり、且つ前記第2の装着部位が前記第2のオリゴヌクレオチド鎖上にある、請求項261に記載のアミノ酸認識分子。
  263. 前記少なくとも1つのアミノ酸認識分子が、前記少なくとも1つのアミノ酸認識分子と前記核酸との間に共有結合性又は非共有結合性連結基を形成するタンパク質を介して前記第1の装着部位に装着される、請求項260~262のいずれか一項に記載のアミノ酸認識分子。
  264. 前記少なくとも1つの検出可能標識が、前記少なくとも1つの検出可能標識と前記核酸との間に共有結合性又は非共有結合性連結基を形成するタンパク質を介して前記第2の装着部位に装着される、請求項260~263のいずれか一項に記載のアミノ酸認識分子。
  265. 前記第1及び第2の装着部位が、前記核酸上の5~100のヌクレオチド塩基又はヌクレオチド塩基対により分離される、請求項260~264のいずれか一項に記載のアミノ酸認識分子。
  266. 少なくとも2つのリガンド結合部位を含む多価タンパク質と、
    前記タンパク質上の第1のリガンド結合部位に結合された第1のリガンド部分を介して前記タンパク質に装着された少なくとも1つのアミノ酸認識分子と、
    前記タンパク質上の第2のリガンド結合部位に結合された第2のリガンド部分を介して前記タンパク質に装着された少なくとも1つの検出可能標識と、
    を含むアミノ酸認識分子。
  267. 前記多価タンパク質が、4つのリガンド結合部位を含むアビジンタンパク質である、請求項266に記載のアミノ酸認識分子。
  268. 前記リガンド結合部位がビオチン結合部位であり、且つ前記リガンド部分がビオチン部分である、請求項266又は267に記載のアミノ酸認識分子。
  269. 前記ビオチン部分の少なくとも1つがビスビオチン部分であり、且つ前記ビスビオチン部分が前記アビジンタンパク質上の2つのビオチン結合部位に結合される、請求項268に記載のアミノ酸認識分子。
  270. 前記少なくとも1つのアミノ酸認識分子が、前記第1のリガンド部分を含む核酸を介して前記タンパク質に装着される、請求項266~269のいずれか一項に記載のアミノ酸認識分子。
  271. 前記少なくとも1つの検出可能標識が、前記第2のリガンド部分を含む核酸を介して前記タンパク質に装着される、請求項266~270のいずれか一項に記載のアミノ酸認識分子。
  272. ポリペプチドの末端アミノ酸を同定する方法であって、前記方法は、
    前記ポリペプチドと、前記ポリペプチドの末端の1タイプ以上の末端アミノ酸に選択的に結合する1つ以上の標識アフィニティー試薬と、を接触させることと、
    前記ポリペプチドと前記1つ以上の標識アフィニティー試薬との相互作用を検出することにより前記ポリペプチドの末端の末端アミノ酸を同定することと、
    を含む方法。
  273. ポリペプチドのアミノ酸配列を決定する方法であって、前記方法は、
    i.前記ポリペプチドと、前記ポリペプチドの末端の1タイプ以上の末端アミノ酸に選択的に結合する1つ以上の標識アフィニティー試薬と、を接触させることと、
    ii.前記ポリペプチドと前記1つ以上の標識アフィニティー試薬との相互作用を検出することにより前記ポリペプチドの末端の末端アミノ酸を同定することと、
    iii.前記末端アミノ酸を除去することと、
    iv.前記ポリペプチドの末端で(i)~(iv)を1回以上繰り返して前記ポリペプチドのアミノ酸配列を決定することと、
    を含む方法。
  274. 前記方法が、
    a.(i)の後且つ(ii)の前に、前記末端アミノ酸に選択的に結合しない前記1つ以上の標識アフィニティー試薬をいずれも除去することと、及び/又は
    b.(ii)の後且つ(iii)の前に、前記末端アミノ酸に選択的に結合する前記1つ以上の標識アフィニティー試薬をいずれも除去すること、
    をさらに含む、請求項273に記載の方法。
  275. (iii)が、前記末端アミノ酸とイソチオシアネートとを接触させることにより前記末端アミノ酸を修飾することと、
    a.前記修飾された末端アミノ酸と、前記修飾された末端アミノ酸に特異的に結合してそれを除去するプロテアーゼと、を接触させることと、
    又は
    b.前記修飾された末端アミノ酸を除去するのに十分な酸性又は塩基性条件に前記修飾された末端アミノ酸を付すことと、
    を含む、請求項273に記載の方法。
  276. 前記末端アミノ酸を同定することが、
    a.前記1つ以上の標識アフィニティー試薬が結合する前記1つ以上のタイプの末端アミノ酸の1つのタイプであるとして前記末端アミノ酸を同定することと、又は
    b.前記1つ以上の標識アフィニティー試薬が結合する前記1つ以上のタイプの末端アミノ酸以外のタイプであるとして前記末端アミノ酸を同定することと、
    を含む、請求項273に記載の方法。
  277. 前記1つ以上の標識アフィニティー試薬が、1つ以上の標識アプタマー、1つ以上の標識ペプチダーゼ、1つ以上の標識抗体、又はそれらの組合せを含む、請求項273に記載の方法。
  278. 前記1つ以上の標識ペプチダーゼが修飾されて切断活性を不活性化するか、又は前記1つ以上の標識ペプチダーゼが(iii)の除去のために切断活性を保持する、請求項277に記載の方法。
  279. 混合サンプル中の対象タンパク質を同定する方法であって、前記方法は、
    混合タンパク質サンプルを切断して複数のポリペプチド断片を生成することと、
    請求項273~278のいずれか1項に記載の方法で前記複数のポリペプチド断片の少なくとも1つのアミノ酸配列を決定することと、
    前記アミノ酸配列が対象タンパク質にユニークに同定可能である場合に前記混合サンプル中の対象タンパク質を同定することと、
    を含む方法。
  280. 混合サンプル中の対象タンパク質を同定する方法であって、前記方法は、
    混合タンパク質サンプルを切断して複数のポリペプチド断片を生成することと、
    前記複数のポリペプチド断片中の1つ以上のタイプのアミノ酸を1つ以上の異なる発光標識で標識することと、
    前記複数の標識されたポリペプチドの少なくとも1つに対して経時的に発光を測定することと、
    検出された発光に基づいて前記少なくとも1つの標識ポリペプチドのアミノ酸配列を決定することと、
    前記アミノ酸配列が対象タンパク質にユニークに同定可能である場合に前記混合サンプル中の対象タンパク質を同定することと、
    を含む方法。
  281. ポリペプチド中の2つ以上のアミノ酸の相対位置を同定する方法であって、前記方法は、
    ポリペプチドの2つ以上のアミノ酸を1タイプ以上の第1のFRET標識で標識することと、
    第2のFRET標識で標識された補因子の存在下で前記標識ポリペプチドのトランスロケーション反応からのFRETシグナルを検出することと、
    前記FRETシグナルに基づいて2つ以上のアミノ酸の相対位置を決定することと、
    を含む方法。
  282. 分析のためのタンパク質を調製する方法であって、前記方法は、
    i.タンパク質の遊離カルボン酸基をブロックすることと、
    ii.タンパク質を変性することと、
    iii.タンパク質の遊離チオール基をブロックすることと、
    iv.前記タンパク質を消化して遊離C末端カルボン酸基を含む少なくとも1つのポリペプチド断片を生成することと、
    v.機能部分を前記遊離C末端カルボン酸基に化学的にコンジュゲートすることと、
    を含む方法。
  283. 分析のためのタンパク質を調製する方法であって、前記方法は、
    i.タンパク質を変性することと、
    ii.タンパク質の遊離チオール基をブロックすることと、
    iii.前記タンパク質を消化して遊離C末端カルボン酸基を含む少なくとも1つのポリペプチド断片を生成することと、
    iv.遊離C末端カルボン酸基をブロックしてブロックC末端カルボン酸基を含む少なくとも1つのポリペプチド断片を生成することと、
    v.機能部分を前記ブロックC末端カルボン酸基に酵素的にコンジュゲートすることと、
    を含む方法。
JP2021526514A 2018-11-15 2019-11-15 タンパク質シーケンシングのための方法及び組成物 Pending JP2022507516A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862768076P 2018-11-15 2018-11-15
US62/768,076 2018-11-15
US201962907507P 2019-09-27 2019-09-27
US62/907,507 2019-09-27
PCT/US2019/061831 WO2020102741A1 (en) 2018-11-15 2019-11-15 Methods and compositions for protein sequencing

Publications (2)

Publication Number Publication Date
JP2022507516A true JP2022507516A (ja) 2022-01-18
JPWO2020102741A5 JPWO2020102741A5 (ja) 2022-11-22

Family

ID=68841224

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021526514A Pending JP2022507516A (ja) 2018-11-15 2019-11-15 タンパク質シーケンシングのための方法及び組成物

Country Status (11)

Country Link
US (7) US20200219590A1 (ja)
EP (1) EP3881078A1 (ja)
JP (1) JP2022507516A (ja)
KR (1) KR20210091243A (ja)
CN (1) CN113287020A (ja)
AU (1) AU2019380606A1 (ja)
BR (1) BR112021008098A2 (ja)
CA (1) CA3117889A1 (ja)
MX (1) MX2021005757A (ja)
TW (1) TW202032125A (ja)
WO (1) WO2020102741A1 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9625469B2 (en) 2011-06-23 2017-04-18 Board Of Regents, The University Of Texas System Identifying peptides at the single molecule level
US11435358B2 (en) 2011-06-23 2022-09-06 Board Of Regents, The University Of Texas System Single molecule peptide sequencing
US10545153B2 (en) 2014-09-15 2020-01-28 Board Of Regents, The University Of Texas System Single molecule peptide sequencing
MX2019013111A (es) 2017-05-05 2019-12-16 Quantum Si Inc Sustratos que tienen reactividad de superficie modificada y propiedades antiincrustantes en reacciones biologicas.
GB201715684D0 (en) * 2017-09-28 2017-11-15 Univ Gent Means and methods for single molecule peptide sequencing
TW202032125A (zh) 2018-11-15 2020-09-01 美商寬騰矽公司 用於蛋白質定序之方法及組合物
WO2020146325A1 (en) 2019-01-08 2020-07-16 Massachusetts Institute Of Technology Single-molecule protein and peptide sequencing
KR20220019778A (ko) * 2019-06-12 2022-02-17 퀀텀-에스아이 인코포레이티드 머신 학습을 이용한 단백질 식별을 위한 기법들 및 관련된 시스템들 및 방법들
US11346842B2 (en) 2019-06-20 2022-05-31 Massachusetts Institute Of Technology Single molecule peptide sequencing methods
JP2022551523A (ja) 2019-10-11 2022-12-09 クアンタム-エスアイ インコーポレイテッド 気相における表面修飾
US11885744B2 (en) 2020-01-14 2024-01-30 Quantum-Si Incorporated Sensor for lifetime plus spectral characterization
US11719639B2 (en) 2020-03-02 2023-08-08 Quantum-Si Incorporated Integrated sensor for multi-dimensional signal analysis
US20210396762A1 (en) * 2020-06-19 2021-12-23 Encodia, Inc. Methods for peptide analysis employing multi-component detection agent and related kits
AU2021345360A1 (en) * 2020-09-21 2023-05-18 Quantum-Si Incorporated Methods to minimize photodamage during nucleic acid and peptide sequencing
EP4271997A1 (en) * 2020-12-31 2023-11-08 Encodia, Inc. Metalloenzymes for biomolecular recognition of n-terminal modified peptides
WO2022212647A1 (en) * 2021-04-01 2022-10-06 Quantum-Si Incorporated Protein-wide modification of aspartates and glutamates
WO2022236190A1 (en) * 2021-05-07 2022-11-10 Government Of The United States Of America, As Represented By The Secretary Of Commerce Amino acid-specific binder and selectively identifying an amino acid
WO2022261607A1 (en) * 2021-06-09 2022-12-15 Quantapore, Inc. Polypeptide sequencing and fingerprinting
WO2023091961A2 (en) * 2021-11-17 2023-05-25 Erisyon Inc. Methods and systems for automated sample processing
CN114199848B (zh) * 2021-12-17 2023-01-17 无锡佰翱得生物科学有限公司 一种基于蛋白连接酶的高通量检测蛋白表达的方法
WO2023122769A2 (en) * 2021-12-22 2023-06-29 Quantum-Si Incorporated Compositions and methods for polypeptide analysis
US20230221330A1 (en) * 2022-01-12 2023-07-13 Quantum-Si Incorporated Labeled binding reagents and methods of use thereof
CN117423387B (zh) * 2023-12-18 2024-03-08 中国科学院水生生物研究所 基于数字驱动的水生生物群落时空差异的评估方法及系统

Family Cites Families (109)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4435728A1 (de) 1994-01-19 1995-07-20 Boehringer Mannheim Gmbh Biotinsilan-Verbindungen und diese Verbindungen enthaltende Bindematrix
US5654419A (en) 1994-02-01 1997-08-05 The Regents Of The University Of California Fluorescent labels and their use in separations
WO1998018965A1 (en) 1996-10-29 1998-05-07 University Of Nebraska At Lincoln Method for detecting point mutations in dna utilizing fluorescence energy transfer
US6153442A (en) 1998-05-20 2000-11-28 Dade Behring Inc. Reagents and methods for specific binding assays
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
DE69930310T3 (de) 1998-12-14 2009-12-17 Pacific Biosciences of California, Inc. (n. d. Ges. d. Staates Delaware), Menlo Park Kit und methode zur nukleinsäuresequenzierung einzelner moleküle durch polymerase synthese
US7056661B2 (en) 1999-05-19 2006-06-06 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
US6869764B2 (en) 2000-06-07 2005-03-22 L--Cor, Inc. Nucleic acid sequencing using charge-switch nucleotides
US6936702B2 (en) 2000-06-07 2005-08-30 Li-Cor, Inc. Charge-switch nucleotides
CA2314398A1 (en) 2000-08-10 2002-02-10 Edward Shipwash Microarrays and microsystems for amino acid analysis and protein sequencing
US20060014212A1 (en) * 2002-05-10 2006-01-19 Epitome Biosystems, Inc. Proteome epitope tags and methods of use thereof in protein modification analysis
WO2004035742A2 (en) * 2002-10-15 2004-04-29 Abmetrix, Inc. Sets of digital antibodies directed against short epitopes, and methods using same
US20100035254A1 (en) 2003-04-08 2010-02-11 Pacific Biosciences Of California, Inc. Composition and method for nucleic acid sequencing
US7745116B2 (en) 2003-04-08 2010-06-29 Pacific Biosciences Of California, Inc. Composition and method for nucleic acid sequencing
GB0324456D0 (en) 2003-10-20 2003-11-19 Isis Innovation Parallel DNA sequencing methods
US8637650B2 (en) 2003-11-05 2014-01-28 Genovoxx Gmbh Macromolecular nucleotide compounds and methods for using the same
JP4552023B2 (ja) 2003-11-07 2010-09-29 独立行政法人科学技術振興機構 多環縮環型π共役有機材料、その合成中間体、多環縮環型π共役有機材料の製造方法、および多環縮環型π共役有機材料の合成中間体の製造方法
CA2693280C (en) 2004-04-09 2017-09-12 Monsanto Technology Llc Compositions and methods for control of insect infestations in plants
US7462452B2 (en) 2004-04-30 2008-12-09 Pacific Biosciences Of California, Inc. Field-switch sequencing
CA2496294A1 (en) 2005-02-07 2006-08-07 The University Of British Columbia Apparatus and methods for concentrating and separating particles such as molecules
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
WO2007070572A2 (en) 2005-12-12 2007-06-21 The Government Of The United States Of America, As Represented By The Secretary Of The Department Of Health And Human Services Probe for nucleic acid sequencing and methods of use
US20100331200A1 (en) 2006-03-31 2010-12-30 Gordon Neal F Post translational modification pattern analysis
US8084734B2 (en) 2006-05-26 2011-12-27 The George Washington University Laser desorption ionization and peptide sequencing on laser induced silicon microcolumn arrays
WO2008021290A2 (en) 2006-08-09 2008-02-21 Homestead Clinical Corporation Organ-specific proteins and methods of their use
US8617811B2 (en) 2008-01-28 2013-12-31 Complete Genomics, Inc. Methods and compositions for efficient base calling in sequencing reactions
DE602008000796D1 (de) 2008-01-15 2010-04-22 Univ Utrecht Holding Bv Verfahren zur Bestimmung der Aminosäurensequenz von Peptiden
AU2009223702B2 (en) 2008-03-13 2013-08-22 Pacific Biosciences Of California, Inc. Labeled reactants and their uses
JP2011515102A (ja) 2008-03-28 2011-05-19 パシフィック バイオサイエンシーズ オブ カリフォルニア, インコーポレイテッド 核酸シーケンシング用組成物及び方法
CA2720247C (en) 2008-03-31 2020-07-14 Pacific Biosciences Of California, Inc. Single molecule loading methods and compositions
WO2009145820A2 (en) 2008-03-31 2009-12-03 Pacific Biosciences Of California, Inc. Generation of modified polymerases for improved accuracy in single molecule sequencing
US8999676B2 (en) 2008-03-31 2015-04-07 Pacific Biosciences Of California, Inc. Recombinant polymerases for improved single molecule sequencing
US8420366B2 (en) 2008-03-31 2013-04-16 Pacific Biosciences Of California, Inc. Generation of modified polymerases for improved accuracy in single molecule sequencing
WO2010044892A1 (en) 2008-10-17 2010-04-22 President And Fellows Of Harvard College Diagnostic method based on large scale identification of post-translational modification of proteins
WO2010059206A2 (en) 2008-11-19 2010-05-27 Pacific Biosciences Of California, Inc. Modular nucleotide compositions and uses therefor
WO2010065322A1 (en) * 2008-12-01 2010-06-10 Research Triangle Institute Concurrent identification of multitudes of polypeptides
WO2010065531A1 (en) 2008-12-01 2010-06-10 Robi David Mitra Single molecule protein screening
KR101063981B1 (ko) 2009-01-12 2011-09-14 서강대학교산학협력단 자유 라디칼 개시제 및 이를 이용한 펩타이드 서열의 동정방법
DE102009013653B4 (de) 2009-03-18 2014-09-18 Bruker Daltonik Gmbh Protein-Sequenzierung mit MALDI-Massenspektrometrie
US8603792B2 (en) 2009-03-27 2013-12-10 Life Technologies Corporation Conjugates of biomolecules to nanoparticles
WO2010117420A2 (en) 2009-03-30 2010-10-14 Pacific Biosciences Of California, Inc. Fret-labeled compounds and uses therefor
EP3211095B1 (en) 2009-04-03 2019-01-02 Sequenom, Inc. Nucleic acid preparation compositions and methods
US9566335B1 (en) * 2009-09-25 2017-02-14 The Governing Council Of The University Of Toronto Protein sequencing method and reagents
EP2566985A4 (en) 2010-05-06 2014-08-06 Ibis Biosciences Inc INTEGRATED SAMPLE PREPARATION SYSTEMS AND MIXTURES OF STABILIZED ENZYMES
EP2689028B1 (en) 2011-03-23 2017-08-30 Pacific Biosciences Of California, Inc. Isolation of polymerase-nucleic acid complexes and loading onto substrates
US20150087526A1 (en) 2012-01-24 2015-03-26 The Regents Of The University Of Colorado, A Body Corporate Peptide identification and sequencing by single-molecule detection of peptides undergoing degradation
WO2013123258A1 (en) 2012-02-15 2013-08-22 Pacific Biosciences Of California, Inc. Polymerase enzyme substrates with protein shield
CN117462693A (zh) * 2012-02-27 2024-01-30 阿穆尼克斯运营公司 Xten缀合组合物和制造其的方法
PT2882450T (pt) 2012-07-11 2020-02-19 Bioverativ Therapeutics Inc Complexo de fator viii com xten e a proteína fator de von willebrand, e utilizações do mesmo
NL2009191C2 (en) 2012-07-16 2014-01-20 Univ Delft Tech Single molecule protein sequencing.
US9435810B2 (en) 2013-03-15 2016-09-06 Washington University Molecules and methods for iterative polypeptide analysis and processing
US10544449B2 (en) 2013-06-14 2020-01-28 Pacific Biosciences Of California, Inc. Bis-biotinylation tags
WO2014201265A1 (en) 2013-06-14 2014-12-18 Pacific Biosciences Of California, Inc. Bis-biotinylation tags
AU2014284180B2 (en) 2013-06-21 2020-03-19 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2015021079A1 (en) 2013-08-05 2015-02-12 Pacific Biosciences Of California, Inc. Protected fluorescent reagent compounds
JP6573899B2 (ja) 2013-11-17 2019-09-11 クアンタム−エスアイ インコーポレイテッドQuantum−Si Incorporated 分子をプローブし、検出し、及び分析するための、外部光源を備えた集積デバイス
KR102384909B1 (ko) 2014-08-08 2022-04-11 퀀텀-에스아이 인코포레이티드 수신된 광자들의 시간 비닝을 위한 집적 디바이스
CN106796176B (zh) 2014-08-08 2021-02-05 宽腾矽公司 用于对分子进行探测、检测和分析的带外部光源的集成装置
US9287885B2 (en) * 2014-08-15 2016-03-15 Taiwan Semiconductor Manufacturing Company, Ltd. All digital phase locked loop with configurable multiplier having a selectable bit size
US10545153B2 (en) 2014-09-15 2020-01-28 Board Of Regents, The University Of Texas System Single molecule peptide sequencing
EP3258952A4 (en) 2015-02-04 2018-12-05 Pacific Biosciences Of California, Inc. Multimeric protected fluorescent reagents
WO2016164530A1 (en) 2015-04-07 2016-10-13 University Of Maryland, College Park Compositions and methods for high throughput protein sequencing
US10246742B2 (en) 2015-05-20 2019-04-02 Quantum-Si Incorporated Pulsed laser and bioanalytic system
WO2016193980A1 (en) 2015-06-03 2016-12-08 Bar Ilan University Methods and kits for detection and quantification of large-scale post translational modifications of proteins
WO2017024049A1 (en) * 2015-08-06 2017-02-09 Pacific Biosciences Of California, Inc. Single-molecule nanofet sequencing systems and methods
EP3371194B1 (en) 2015-10-16 2020-12-30 Andrew Emili Protein sequencing method
EP3377656A4 (en) 2015-11-18 2019-03-27 Pacific Biosciences of California, Inc. LOADING NUCLEIC ACIDS ON SUBSTRATES
US10676788B2 (en) 2015-11-20 2020-06-09 Pacific Biosciences Of California, Inc. Modified nucleotide reagents
AU2017259794B2 (en) * 2016-05-02 2023-04-13 Encodia, Inc. Macromolecule analysis employing nucleic acid encoding
CA2967752A1 (en) * 2016-05-18 2017-11-18 Bioinformatics Solutions Inc. Methods and systems for assembly of protein sequences
JP7057348B2 (ja) 2016-08-31 2022-04-19 プレジデント アンド フェローズ オブ ハーバード カレッジ 蛍光in situ配列決定を用いた単一アッセイに生体分子の検出を組み合わせる方法
KR20220084181A (ko) 2016-12-16 2022-06-21 퀀텀-에스아이 인코포레이티드 콤팩트한 빔 셰이핑 및 스티어링 어셈블리
EP3555591B1 (en) 2016-12-16 2022-07-06 Quantum-Si Incorporated Optical coupler and waveguide system
BR112019012540A2 (pt) 2016-12-22 2019-11-12 Quantum-Si Incorporated fotodetector integrado com pixel de acondicionamento direto
US11072816B2 (en) 2017-05-03 2021-07-27 The Broad Institute, Inc. Single-cell proteomic assay using aptamers
MX2019013111A (es) 2017-05-05 2019-12-16 Quantum Si Inc Sustratos que tienen reactividad de superficie modificada y propiedades antiincrustantes en reacciones biologicas.
TWI829642B (zh) 2017-07-24 2024-01-21 美商寬騰矽公司 高強度經標記之反應物組合物及用於定序之方法
US11237326B2 (en) 2017-07-24 2022-02-01 Quantum-Si Incorporated Optical rejection photonic structures using two spatial filters
WO2019040825A1 (en) 2017-08-24 2019-02-28 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services CONFORMATIONAL RESTRICTION OF CYANINE FLUOROPHORES IN A FAR RED RANGE AND CLOSE INFRARED
US10684071B2 (en) * 2017-08-25 2020-06-16 Praxair Technology, Inc. Annular divided wall column for an air separation unit
EP3676561B1 (en) * 2017-08-31 2023-10-04 Case Western Reserve University Systems and methods to apply markings
US10592121B2 (en) 2017-09-14 2020-03-17 Samsung Electronics Co., Ltd. Quasi-synchronous protocol for large bandwidth memory systems
GB201715684D0 (en) * 2017-09-28 2017-11-15 Univ Gent Means and methods for single molecule peptide sequencing
KR102556494B1 (ko) 2017-10-31 2023-07-18 엔코디아, 인코포레이티드 핵산 암호화 및/또는 표지를 이용한 분석용 키트
US20200348307A1 (en) 2017-10-31 2020-11-05 Encodia, Inc. Methods and compositions for polypeptide analysis
US11841371B2 (en) 2018-03-13 2023-12-12 The Broad Institute, Inc. Proteomics and spatial patterning using antenna networks
AU2019301750A1 (en) 2018-07-12 2021-01-28 Board Of Regents, The University Of Texas System Molecular neighborhood detection by oligonucleotides
WO2020023488A1 (en) 2018-07-23 2020-01-30 Board Of Regents, The University Of Texas System Single molecule sequencing identification of post-translational modifications on proteins
CA3107963A1 (en) 2018-08-17 2020-02-20 Regeneron Pharmaceuticals, Inc. Methods for de novo protein sequencing
GB2614128B (en) 2018-10-05 2024-02-28 Univ Texas Solid-phase N-terminal peptide capture and release
US10836798B2 (en) 2018-11-08 2020-11-17 Government Of The United States Of America, As Represented By The Secretary Of Commerce Amino acid-specific binder and selectively identifying an amino acid
TW202032125A (zh) 2018-11-15 2020-09-01 美商寬騰矽公司 用於蛋白質定序之方法及組合物
WO2020146325A1 (en) * 2019-01-08 2020-07-16 Massachusetts Institute Of Technology Single-molecule protein and peptide sequencing
EP3914727A4 (en) 2019-01-22 2022-11-30 Singular Genomics Systems, Inc. POLYNUCLEOTIDE BARCODES FOR MULTIPLEXED PROTEOMICS
US20200300861A1 (en) 2019-03-22 2020-09-24 Augmenta Bioworks, Inc. Isolation of Single Cells and Uses Thereof
GB201904697D0 (en) 2019-04-03 2019-05-15 Vib Vzw Means and methods for single molecule peptide sequencing
AU2020261334A1 (en) 2019-04-23 2021-11-18 Encodia, Inc. Methods for spatial analysis of proteins and related kits
US20220221467A1 (en) 2019-05-31 2022-07-14 President And Fellows Of Harvard College Systems and methods for ms1-based mass identification including super-resolution techniques
KR20220019778A (ko) 2019-06-12 2022-02-17 퀀텀-에스아이 인코포레이티드 머신 학습을 이용한 단백질 식별을 위한 기법들 및 관련된 시스템들 및 방법들
US11346842B2 (en) * 2019-06-20 2022-05-31 Massachusetts Institute Of Technology Single molecule peptide sequencing methods
CN114555810A (zh) 2019-09-13 2022-05-27 谷歌有限责任公司 用于蛋白质和肽测序的方法和组合物
AU2020376809A1 (en) 2019-10-28 2022-06-02 Quantum-Si Incorporated Methods, kits and devices of preparing samples for multiplex polypeptide sequencing
CA3159560A1 (en) 2019-10-28 2021-05-06 Quantum-Si Incorporated Methods of single-cell protein and nucleic acid sequencing
JP2023500477A (ja) 2019-10-28 2023-01-06 クアンタム-エスアイ インコーポレイテッド ポリペプチド配列決定のための高濃度化サンプルを調製する方法
BR112022007937A2 (pt) * 2019-10-28 2022-08-30 Quantum Si Inc Métodos de sequenciamento e reconstrução de um único polipeptídeo
GB201918108D0 (en) 2019-12-10 2020-01-22 Vib Vzw Improved aminopeptiadases for single molecule peptide sequencing
US20210354134A1 (en) 2020-04-22 2021-11-18 Quantum-Si Incorporated Sample preparation for sequencing
WO2021236983A2 (en) * 2020-05-20 2021-11-25 Quantum-Si Incorporated Methods and compositions for protein sequencing
US20210396762A1 (en) * 2020-06-19 2021-12-23 Encodia, Inc. Methods for peptide analysis employing multi-component detection agent and related kits

Also Published As

Publication number Publication date
BR112021008098A2 (pt) 2021-08-10
EP3881078A1 (en) 2021-09-22
US11959920B2 (en) 2024-04-16
US20200219590A1 (en) 2020-07-09
US20200209253A1 (en) 2020-07-02
US20200209249A1 (en) 2020-07-02
WO2020102741A8 (en) 2020-06-18
CA3117889A1 (en) 2020-05-22
US20200209256A1 (en) 2020-07-02
WO2020102741A1 (en) 2020-05-22
AU2019380606A1 (en) 2021-05-27
US20200209254A1 (en) 2020-07-02
CN113287020A (zh) 2021-08-20
TW202032125A (zh) 2020-09-01
US20200209257A1 (en) 2020-07-02
KR20210091243A (ko) 2021-07-21
US20200209255A1 (en) 2020-07-02
MX2021005757A (es) 2021-08-11

Similar Documents

Publication Publication Date Title
JP2022507516A (ja) タンパク質シーケンシングのための方法及び組成物
EP3298389B1 (en) Method of determining the sequence of a nucleic acid using time resolved luminescence
US20210364527A1 (en) Methods and compositions for protein sequencing
CN114929887A (zh) 单个多肽测序和重建的方法
US20210139973A1 (en) Methods of single-cell polypeptide sequencing
CN114929888A (zh) 制备用于多重多肽测序的样品的方法、试剂盒和装置
US20230221253A1 (en) Techniques for sequencing
EP3948297A1 (en) Means and methods for single molecule peptide sequencing
US20230221330A1 (en) Labeled binding reagents and methods of use thereof
JP2022536585A (ja) 蛍光輝度を増加させるためのリンカー及び酵素により遊離可能な蛍光部分を有する接合体での可逆的な細胞検出
US20240151729A1 (en) Luminescently labeled oligonucleotide structures and associated systems and methods
WO2023056414A1 (en) Structural profiling of native proteins using fluorosequencing, a single molecule protein sequencing technology
WO2023196642A9 (en) Methods and systems for processing polymeric analytes

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221114

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231017

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231020

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240417