JP7390027B2 - 核酸エンコーディングおよび/または標識を使用する解析のためのキット - Google Patents

核酸エンコーディングおよび/または標識を使用する解析のためのキット Download PDF

Info

Publication number
JP7390027B2
JP7390027B2 JP2020524114A JP2020524114A JP7390027B2 JP 7390027 B2 JP7390027 B2 JP 7390027B2 JP 2020524114 A JP2020524114 A JP 2020524114A JP 2020524114 A JP2020524114 A JP 2020524114A JP 7390027 B2 JP7390027 B2 JP 7390027B2
Authority
JP
Japan
Prior art keywords
tag
binding
kit
polypeptide
alkyl
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020524114A
Other languages
English (en)
Other versions
JP2021501577A (ja
JP2021501577A5 (ja
Inventor
マーク エス. チー,
ジョン エム. バイエルリ,
宣仁 村中
ケビン ガンダーソン,
マイケル フィリップ ワイナー,
レイ シー,
ロバート シー. ジェイムズ,
ルカ モンフレゴラ,
Original Assignee
エンコディア, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エンコディア, インコーポレイテッド filed Critical エンコディア, インコーポレイテッド
Publication of JP2021501577A publication Critical patent/JP2021501577A/ja
Publication of JP2021501577A5 publication Critical patent/JP2021501577A5/ja
Application granted granted Critical
Publication of JP7390027B2 publication Critical patent/JP7390027B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6842Proteomic analysis of subsets of protein mixtures with reduced complexity, e.g. membrane proteins, phosphoproteins, organelle proteins
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/10Libraries containing peptides or polypeptides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6402Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from non-mammals
    • C12N9/6405Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from non-mammals not being snakes
    • C12N9/6416Metalloendopeptidases (3.4.24)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6804Nucleic acid analysis using immunogens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • C40B30/04Methods of screening libraries by measuring the ability to specifically bind a target molecule, e.g. antibody-antigen binding, receptor-ligand binding
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B70/00Tags or labels specially adapted for combinatorial chemistry or libraries, e.g. fluorescent tags or bar codes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/543Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6845Methods of identifying protein-protein interactions in protein mixtures
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/60Detection means characterised by use of a special device
    • C12Q2565/619Detection means characterised by use of a special device being a video camera
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2570/00Omics, e.g. proteomics, glycomics or lipidomics; Methods of analysis focusing on the entire complement of classes of biological molecules or subsets thereof, i.e. focusing on proteomes, glycomes or lipidomes

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Pathology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Cell Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Food Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Peptides Or Proteins (AREA)

Description

関連出願の相互参照
本願は、発明の名称が「KITS FOR ANALYSIS USING NUCLEICACID ENCODING AND/OR LABEL」である2017年10月31日に出願した米国特許仮出願第62/579,844号、発明の名称が「KITS FORANALYSIS USING NUCLEIC ACID ENCODING AND/OR LABEL」である2017年11月6日に出願した米国特許仮出願第62/582,312号、および発明の名称が「KITSFOR ANALYSIS USING NUCLEIC ACID ENCODING AND/OR LABEL」である2017年11月8日に出願した米国特許仮出願第62/583,448号に対する優先権の利益を主張するものであり、これらの出願の各々の全内容は、あらゆる目的で参照により本明細書に組み込まれる。本願は、発明の名称が「MacromoleculeAnalysis Employing Nucleic Acid Encoding」である2016年5月2日に出願した米国特許仮出願第62/330,841号;発明の名称が「MacromoleculeAnalysis Employing Nucleic Acid Encoding」である2016年5月19日に出願した米国特許仮出願第62/339,071号、発明の名称が「MacromoleculeAnalysis Employing Nucleic Acid Encoding」である2016年8月18日に出願した米国特許仮出願第62/376,886号;発明の名称が「MacromoleculeAnalysis Employing Nucleic Acid Encoding」である2017年5月2日に出願した国際特許出願第PCT/US2017/030702号;発明の名称が「Kitsfor Analysis Using Nucleic Acid Encoding and/or Label」である2017年10月31日に出願した代理人整理番号776533000500を有する米国特許仮出願第62/579,844号;発明の名称が「Methodsand Compositions for Polypeptide Analysis」である2017年10月31日に出願した代理人整理番号776533000600を有する米国特許仮出願第62/579,870号;発明の名称が「Methodsand Kits Using Nucleic Acid Encoding and/or Label」である2017年10月31日に出願した代理人整理番号776533000700を有する米国特許仮出願第62/579,840号;発明の名称が「Kitsfor Analysis Using Nucleic Acid Encoding and/or Label」である2017年11月6日に出願した代理人整理番号776533000501を有する米国特許仮出願第62/582,312号;および発明の名称が「Methodsand Kits Using Nucleic Acid Encoding and/or Label」である2017年11月7日に出願した代理人整理番号776533000701を有する米国特許仮出願第62/582,916号に関連するものであり、これらの出願の開示は、あらゆる目的で参照により本明細書に組み込まれる。
ASCIIテキストファイルでの配列表の提出
ASCIIテキストファイルでの以下の提出内容は、その全体が参照により本明細書に組み込まれる:コンピュータ読み取り可能な形式(CRF)の配列表(ファイル名:4614-2000540_20181031_SeqList.txt、記録日:2018年10月31日、サイズ:52キロバイト)。
技術分野
本開示は、一般に、認識事象などの分子相互作用および/または反応の核酸エンコーディングおよび/または核酸記録を利用する試料解析キットに関する。一部の実施形態では、キットは、ハイスループット、多重化および/または自動化解析に使用することができ、プロテオームまたはそのサブセットの解析に好適である。
タンパク質は、多くの異なる生物学的機能を実行および促進し、細胞生物学および生理学において不可欠な役割を果たす。異なるタンパク質分子のレパートリーは広範囲にわたり、翻訳後修飾(PTM)によって導入される追加的な多様性に起因して、トランスクリプトームよりもはるかに複雑である。さらに、細胞内のタンパク質は、環境、生理的状況、および病態に応答して動的に変化する(発現レベルおよび修飾の状態)。したがって、タンパク質は、特にゲノム情報と比べて、莫大な量のほとんど明らかになっていない関連情報を含有する。一般に、プロテオミクス解析ではゲノミクス解析と比べて革新が遅れている。ゲノミクスの分野では、次世代シーケンシング(NGS)により、数十億のDNA配列を単一の計器における実行で解析することが可能になることによって当該分野が変容しているが、一方で、タンパク質解析およびペプチド配列決定では、スループットが今でも限られている。
それにもかかわらず、このタンパク質情報は、健康および疾患におけるプロテオームダイナミクスをよりよく理解するために、ならびに高精度の医療を可能にするのを補助するために差し迫って必要とされている。しかるが故に、このプロテオミクス情報の収集を小型化および高度に並行化するための「次世代」ツールの開発に大きな関心が寄せられている。本開示は、これらおよび他の要求に対処する。
本概要は、請求項記載の主題の範囲を限定するために使用することを意図したものではない。請求項記載の主題の他の特徴、詳細、有用性および利点は、付属の図面および添付の特許請求の範囲において開示される態様を含む詳細な説明から明らかになる。
本明細書のこの概要における実施形態のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
一態様では、(a)分析物と直接または間接的に会合するように構成されている記録タグ、(b)(i)分析物に結合することが可能な結合性部分に関する識別情報を含み、前記結合性部分と直接もしくは間接的に会合そて結合性物質を形成するように構成されている、コーディングタグ、および/または(ii)標識を含む、キットであって、前記記録タグおよび前記コーディングタグが、前記結合性物質と前記分析物との結合時に前記記録タグと前記コーディングタグの間での情報の移行を可能にするように構成されているキットであり、必要に応じて(c)前記結合性部分を含むキットが、本明細書で開示される。一実施形態では、記録タグおよび/または分析物は、支持体に直接または間接的に固定化されるように構成されている。さらなる実施形態では、記録タグは、支持体に固定化されるように構成されており、それにより、記録タグに付随する分析物が固定化される。別の実施形態では、分析物は、支持体に固定化されるように構成されており、それにより、分析物に付随する記録タグが固定化される。さらに別の実施形態では、記録タグおよび分析物の各々が、支持体に固定化されるように構成されている。さらに別の実施形態では、記録タグおよび分析物は、両方が支持体に固定化されたときに共局在するように構成されている。一部の実施形態では、(i)分析物と(ii)記録タグ間の、前記記録タグと前記分析物に結合されている結合性物質のコーディングタグとの間の情報移行のための、距離は、約10-6nm未満、約10-6nm、約10-5nm、約10-4nm、約0.001nm、約0.01nm、約0.1nm、約0.5nm、約1nm、約2nm、約5nmであるか、または約5nmより長いか、または前記範囲の間の任意の値の距離である。
前述の実施形態のいずれかでは、キットは、(i)支持体に直接もしくは間接的に固定化されるようにおよび(ii)前記記録タグおよび/または分析物と直接または間接的に会合するように構成されている、固定化リンカーをさらに含むことができる。一実施形態では、固定化リンカーは、記録タグおよび分析物と会合するように構成されている。
前述の実施形態のいずれかでは、固定化リンカーを支持体に直接固定化されるように構成することができ、それにより、前記固定化リンカーに付随する前記記録タグおよび/または前記分析物が固定化される。
前述の実施形態のいずれかでは、キットは、支持体をさらに含むことができる。
前述の実施形態のいずれかでは、キットは、結合性物質と分析物との結合時にコーディングタグと記録タグの間で情報を移行させるための1つまたは複数の試薬をさらに含むことができる。一実施形態では、1つまたは複数の試薬は、コーディングタグから記録タグに情報を移行させるように構成されており、それにより、伸長記録タグが生成される。別の実施形態では、1つまたは複数の試薬は、記録タグからコーディングタグに情報を移行させるように構成されており、それにより、伸長コーディングタグが生成される。さらに別の実施形態では、1つまたは複数の試薬は、コーディングタグからの情報および記録タグからの情報を含むジタグ構築物を生成するように構成されている。
前述の実施形態のいずれかでは、キットは、少なくとも2つの記録タグを含むことができる。前述の実施形態のいずれかでは、キットは、前記コーディングタグのうちの少なくとも2つを含むことができ、各々がそれに付随する結合性部分に関する識別情報を含む。特定の実施形態では、各分析物は、その分析物に結合されている結合性物質が利用可能な複数(例えば、少なくとも約2、約5、約10、約20、約50、約100、約200、約500、約1000、約2000、約5000、またはそれより多く)の記録タグを有する。特定の実施形態では、キットは、複数の記録タグ、例えば、少なくとも約2、約5、約10、約20、約50、約100、約200、約500、約1000、約2000、約5000、またはそれより多くの記録タグを含む。
前述の実施形態のいずれかでは、キットは、前記結合性物質のうちの少なくとも2つを含むことができる。一実施形態では、キットは、(i)第1の結合性物質と分析物との結合時に、前記第1の結合性物質の第1のコーディングタグから記録タグに情報を移行させて一次伸長記録タグを生成するための1つもしくは複数の試薬、および/または(ii)第2の結合性物質と前記分析物との結合時に、前記第2の結合性物質の第2のコーディングタグから前記一次伸長記録タグに情報を移行させて二次伸長記録タグを生成するための1つもしくは複数の試薬を含み、(i)の1つまたは複数の試薬と(ii)の1つまたは複数の試薬が同じであってもよく、または異なっていてもよい。特定の実施形態では、各分析物は、分析物についての記録タグが利用可能な複数の結合性物質および/またはコーディングタグ、例えば、少なくとも約2、約5、約10、約20、約50、約100、約200、約500、約1000、約2000、約5000、またはそれより多くの結合性物質および/またはコーディングタグを有し、前記複数の結合性物質は、逐次的に付加されることもあり、または並行して付加されることもある。特定の実施形態では、キットは、複数の結合性物質および/またはコーディングタグ、例えば、少なくとも約2、約5、約10、約20、約50、約100、約200、約500、約1000、約2000、約5000、またはそれより多くの結合性物質および/またはコーディングタグを含む。
前述の実施形態のいずれかでは、キットは、(iii)第3の(またはより高次の)結合性物質と分析物との結合時に、第3の(またはより高次の)結合性物質の第3の(またはより高次の)コーディングタグから二次伸長記録タグに情報を移行させて三次(またはより高次の)伸長記録タグを生成するための1つまたは複数の試薬をさらに含むことができる。一実施形態では、キットは、(i)第1の結合性物質と分析物との結合時に、前記第1の結合性物質の第1のコーディングタグから第1の記録タグに情報を移行させて第1の伸長記録タグを生成するための1つもしくは複数の試薬、(ii)第2の結合性物質と分析物との結合時に、前記第2の結合性物質の第2のコーディングタグから第2の記録タグに情報を移行させて第2の伸長記録タグを生成するための1つもしくは複数の試薬、および/または(iii)第3の(またはより高次の)結合性物質と分析物との結合時に、前記第3の(またはより高次の)結合性物質の第3の(またはより高次の)コーディングタグから第3の(またはより高次の)記録タグに情報を移行させて第3の(またはより高次の)伸長記録タグを生成するための1つまたは複数の試薬を含み、(i)、(ii)、および/または(iii)の1つまたは複数の試薬は、同じであってもよく、または異なっていてもよい。
前述の実施形態のいずれかでは、キットは、(iii)第3の(またはより高次の)結合性物質と分析物との結合時に、第3の(またはより高次の)結合性物質の第3の(またはより高次の)コーディングタグから第3の(またはより高次の)記録タグに情報を移行させて第3の(またはより高次の)伸長記録タグを生成するための1つまたは複数の試薬をさらに含むことができる。
前述の実施形態のいずれかでは、第1の記録タグ、第2の記録タグ、および/または第3の(もしくはより高次の)記録タグを、前記分析物と直接または間接的に会合するように構成することができる。
前述の実施形態のいずれかでは、第1の記録タグ、第2の記録タグ、および/または第3の(もしくはより高次の)記録タグを支持体上に固定化するように構成することができる。
前述の実施形態のいずれかでは、第1の記録タグ、第2の記録タグ、および/または第3の(もしくはより高次の)記録タグを、分析物と共局在するように、例えば、第1、第2または第3の(またはより高次の)結合性物質と分析物との結合時に、第1、第2または第3の(またはより高次の)コーディングタグと第1、第2または第3の(またはより高次の)記録タグとの間の情報の移行をそれぞれ可能にするように、構成することができる。
前述の実施形態のいずれかでは、第1のコーディングタグ、第2のコーディングタグ、および/または第3の(もしくはより高次の)コーディングタグの各々は、結合サイクル特異的バーコード、例えば、結合サイクル特異的スペーサー配列C、および/もしくはコーディングタグ特異的スペーサー配列C(ここで、nは整数であり、Cは、第nの結合性物質とポリペプチドとの結合を示す)を含むことができる。あるいは、結合サイクルタグCは、外因的に付加されることがあり、例えば、前記結合サイクルタグCは、前記コーディングタグにとって外来のものであり得る。
前述の実施形態のいずれかでは、分析物は、ポリペプチドを含むことができる。一実施形態では、キットの結合性部分は、ポリペプチドの1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することができ、または官能化試薬により修飾された前記1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である。
前述の実施形態のいずれかでは、キットは、前記官能化試薬のうちの1つまたは複数をさらに含むことができる。
前述の実施形態のいずれかでは、キットは、ポリペプチドの1つもしくは複数のN末端、内部もしくはC末端アミノ酸を(例えば、化学的切断もしくは酵素的切断により)除去するための、または官能化されたN末端、内部もしくはC末端アミノ酸を除去するための、消去試薬をさらに含むことができ、必要に応じて、前記消去試薬は、カルボキシペプチダーゼもしくはアミノペプチダーゼまたはそのバリアント、変異体もしくは修飾タンパク質;ヒドロラーゼまたはそのバリアント、変異体もしくは修飾タンパク質;穏やかなエドマン分解試薬;エドマナーゼ酵素;無水TFA、塩基;あるいはこれらの任意の組合せを含む。
前述の実施形態のいずれかでは、1つまたは複数のN末端、内部またはC末端アミノ酸は、(i)N末端アミノ酸(NTAA)、(ii)N末端ジペプチド配列、(iii)N末端トリペプチド配列;(iv)内部アミノ酸配列;(v)内部ジペプチド配列;(vi)内部トリペプチド配列;(vii)C末端アミノ酸(CTAA);(viii)C末端ジペプチド配列;もしくは(ix)C末端トリペプチド配列、またはこれらの任意の組合せを含むことができ、必要に応じて、(i)~(ix)のアミノ酸残基の任意の1つまたは複数が修飾または官能化されている。
別の態様では、少なくとも(a)(i)解析されるポリペプチドのN末端アミノ酸(NTAA)または官能化NTAAに結合することが可能な第1の結合性部分、および(ii)前記第1の結合性部分に関する識別情報を含む第1のコーディングタグを含む、第1の結合性物質と、必要に応じて(b)前記ポリペプチドと直接または間接的に会合するように構成されている記録タグと、さらに必要に応じて(c)第1の官能化NTAAを生成するために前記ポリペプチドの第1のNTAAを修飾することができる官能化試薬とを含むキットであって、前記記録タグおよび前記第1の結合性物質が、前記第1の結合性物質と前記ポリペプチドとの結合時に前記第1のコーディングタグと前記記録タグの間の情報の移行を可能にするように構成されている、キットが、本明細書で開示される。一実施形態では、キットは、第1のコーディングタグから記録タグに情報を移行させることによって一次伸長記録タグを生成するための1つまたは複数の試薬をさらに含む。
前述の実施形態のいずれかでは、官能化試薬は、化学薬剤、酵素、および/または生物学的薬剤、例えば、イソチオシアネート誘導体、2,4-ジニトロベンゼンスルホン酸(dinitrobenzenesulfonic)(DNBS)、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)1-フルオロ-2,4-ジニトロベンゼン、ダンシルクロリド、7-メトキシクマリン酢酸、チオアシル化試薬、チオアセチル化試薬、またはチオベンジル化試薬を含むことができる。
前述の実施形態のいずれかでは、キットは、第1の官能化NTAAを(例えば、化学的切断または酵素的切断により)除去して、直接隣接しているアミノ酸残基を第2のNTAAとして露出させるための消去試薬をさらに含むことができる。一実施形態では、第2のNTAAは、第1の官能化NTAAと同じであってもよくまたは異なっていてもよい第2の官能化NTAAを生成するように、同じまたは異なる官能化試薬により官能化され得る。別の実施形態では、キットは、(d)(i)第2の官能化NTAAに結合することが可能な第2の(またはより高次の)結合性部分と、(ii)第2の(またはより高次の)結合性部分に関する識別情報を含む第2の(またはより高次の)コーディングタグとを含む、第2の(またはより高次の)結合性物質をさらに含み、前記第1のコーディングタグと前記第2の(またはより高次の)コーディングタグは、同じであってもよく、または異なっていてもよい。さらに別の実施形態では、第1の官能化NTAAおよび第2の官能化NTAAは、官能化N末端アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リシン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、トレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)からなる群から、これらの任意の組合せで、互いに独立して選択される。
前述の実施形態のいずれかでは、キットは、第2の(またはより高次の)コーディングタグから一次伸長記録タグに情報を移行させることによって二次(またはより高次の)伸長記録タグを生成するための1つまたは複数の試薬をさらに含むことができる。
さらなる態様では、少なくとも(a)各々が(i)解析されるポリペプチドのN末端アミノ酸(NTAA)もしくは官能化NTAAに結合することが可能な結合性部分と、(ii)前記結合性部分に関する識別情報を含むコーディングタグとを含む、1つもしくは複数の結合性物質、および/または(b)前記ポリペプチドと直接もしくは間接的に会合するように構成されている1つもしくは複数の記録タグを含む、キットであって、前記1つまたは複数の記録タグおよび前記1つまたは複数の結合性物質が、各結合性物質と前記ポリペプチドとの結合時に前記コーディングタグと前記記録タグの間の情報の移行を可能にするように構成されているキットであり、必要に応じて(c)第1の官能化NTAAを生成するために前記ポリペプチドの第1のNTAAを修飾することができる官能化試薬を含む、キットが、本明細書で開示される。一実施形態では、キットは、第1の官能化NTAAを(例えば、化学的切断または酵素的切断により)除去して、直接隣接しているアミノ酸残基を第2のNTAAとして露出させるための消去試薬をさらに含む。別の実施形態では、第2のNTAAは、第1の官能化NTAAと同じであってもよくまたは異なっていてもよい第2の官能化NTAAを生成するように、同じまたは異なる官能化試薬により官能化され得る。さらに別の実施形態では、第1の官能化NTAAおよび第2の官能化NTAAは、官能化N末端アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リシン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、トレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)からなる群から、これらの任意の組合せで、互いに独立して選択される。
前述の実施形態のいずれかでは、キットは、(i)第1の結合性物質と前記ポリペプチドとの結合時に、前記第1の結合性物質の第1のコーディングタグから第1の記録タグに情報を移行させて第1の伸長記録タグを生成するための1つもしくは複数の試薬、および/または(ii)第2の結合性物質と前記ポリペプチドとの結合時に、前記第2の結合性物質の第2のコーディングタグから第2の記録タグに情報を移行させて第2の伸長記録タグを生成するための1つもしくは複数の試薬を含むことができ、(i)の1つまたは複数の試薬と(ii)の1つまたは複数の試薬は、同じであってもよく、または異なっていてもよい。一態様では、キットは、(iii)第3の(またはより高次の)結合性物質と前記ポリペプチドとの結合時に、前記第3の(またはより高次の)結合性物質の第3の(またはより高次の)コーディングタグから第3の(またはより高次の)記録タグに情報を移行させて第3の(またはより高次の)伸長記録タグを生成するための1つまたは複数の試薬をさらに含む。
前述の実施形態のいずれかでは、第1の記録タグ、第2の記録タグ、および/または第3の(もしくはより高次の)記録タグを、ポリペプチドと直接または間接的に会合するように構成することができる。
前述の実施形態のいずれかでは、第1の記録タグ、第2の記録タグ、および/または第3の(もしくはより高次の)記録タグを支持体上に固定化するように構成することができる。
前述の実施形態のいずれかでは、第1の記録タグ、第2の記録タグ、および/または第3の(もしくはより高次の)記録タグを、ポリペプチドと共局在するように、例えば、第1、第2または第3の(またはより高次の)結合性物質とポリペプチドとの結合時に、第1、第2または第3の(またはより高次の)コーディングタグと第1、第2または第3の(またはより高次の)記録タグとの間の情報の移行をそれぞれ可能にするように、構成することができる。
前述の実施形態のいずれかでは、第1の記録タグ、第2の記録タグ、および/または第3の(またはより高次の)記録タグのうちの2つのタグ間または3つ以上のタグ間の支持体上での距離は、約10nmに等しくてももしくはそれより長くてもよく、約15nmに等しくてももしくはそれより長くてもよく、約20nmに等しくてももしくはそれより長くてもよく、約50nmに等しくてももしくはそれより長くてもよく、約100nmに等しくてももしくはそれより長くてもよく、約150nmに等しくてももしくはそれより長くてもよく、約200nmに等しくてももしくはそれより長くてもよく、約250nmに等しくてももしくはそれより長くてもよく、約300nmに等しくてももしくはそれより長くてもよく、約350nmに等しくてももしくはそれより長くてもよく、約400nmに等しくてももしくはそれより長くてもよく、約450nmに等しくてももしくはそれより長くてもよく、または約500nmに等しくてももしくはそれより長くてもよいが、各記録タグおよびその対応する分析物は、両方が支持体に固定化されたときに共局在するように構成されるか、または各記録タグとその対応する分析物の間の距離は、約10-6nm未満、約10-6nm、約10-5nm、約10-4nm、約0.001nm、約0.01nm、約0.1nm、約0.5nm、約1nm、約2nm、約5nmであるか、もしくは約5nmより長いか、もしくは前記範囲の間の任意の値の距離である。
前述の実施形態のいずれかでは、第1のコーディングタグ、第2のコーディングタグ、および/または第3の(もしくはより高次の)コーディングタグの各々は、結合サイクル特異的バーコード、例えば、結合サイクル特異的スペーサー配列C、および/もしくはコーディングタグ特異的スペーサー配列C(ここで、nは整数であり、Cは、第nの結合性物質とポリペプチドとの結合を示す)を含むことができる。あるいは、結合サイクルタグCは、外因的に付加されることがあり、例えば、前記結合サイクルタグCは、前記コーディングタグにとって外来のものであり得る。
前述の実施形態のいずれかでは、分析物またはポリペプチドは、タンパク質もしくはポリペプチド鎖またはその断片、脂質、炭水化物、あるいは大環状分子、あるいはこれらの組合せもしくは複合体を含むことができる。
前述の実施形態のいずれかでは、分析物またはポリペプチドは、巨大分子またはその複合体、例えばタンパク質複合体、またはそのサブユニットを含むことができる。
前述の実施形態のいずれかでは、記録タグは、核酸、オリゴヌクレオチド、修飾オリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、もう1つの保護された塩基を有するDNAもしくはRNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはモルホリノ、あるいはこれらの組合せを含むことができる。
前述の実施形態のいずれかでは、記録タグは、ユニバーサルプライミング部位を含むことができる。
前述の実施形態のいずれかでは、記録タグは、増幅、配列決定、またはその両方のためのプライミング部位を含むことができ、例えば、ユニバーサルプライミング部位は、増幅、配列決定、またはその両方のためのプライミング部位を含む。
前述の実施形態のいずれかでは、記録タグおよび/またはコーディングタグは、一意の分子識別子(UMI)を含むことができる。
前述の実施形態のいずれかでは、記録タグおよび/またはコーディングタグは、バーコードおよび/またはヌクレアーゼ部位、例えば、ニッキングエンドヌクレアーゼ部位(例えば、dsDNAニッキングエンドヌクレアーゼ部位)を含むことができる。
前述の実施形態のいずれかでは、記録タグおよび/またはコーディングタグは、その3’末端および/またはその5’末端にスペーサーを含み、例えば、記録タグは、その3’末端にスペーサーを含む。
前述の実施形態のいずれかでは、記録タグおよび/またはコーディングタグは、1つまたは複数のヌクレアーゼ部位、例えば、エンドヌクレアーゼ部位、ホーミングエンドヌクレアーゼ部位、制限酵素消化部位、ニッキングエンドヌクレアーゼ部位、またはこれらの組合せを含むことができる。一部の実施形態では、ヌクレアーゼ部位を、コーディングタグに、例えば、スペーサー配列内に、またはスペーサー配列とエンコーダー配列の間に設けることができる。一部の実施形態では、ヌクレアーゼ部位を、記録タグに、例えば、ユニバーサルプライマー配列と支持体の間に(例えば、支持体から記録タグを切断除去するために)設けることができる。
前述の実施形態のいずれかでは、キットは、固体支持体、例えば、剛性固体支持体、可撓性固体支持体、または軟質固体支持体を含むことができ、多孔質支持体または非多孔質支持体を含む。
前述の実施形態のいずれかでは、キットは、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、スピン干渉ディスク、膜、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子(例えば、磁気ナノ粒子(Fe)、金ナノ粒子および/もしくは銀ナノ粒子などの、金属を含む)、量子ドット、ナノシェル、ナノケージ、マイクロスフェア、またはこれらの任意の組合せを含む、支持体を含むことができる。一実施形態では、支持体は、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、もしくは制御ポアビーズ、またはこれらの任意の組合せを含む。
前述の実施形態のいずれかでは、キットは、支持体を含むことができ、および/または複数の分析物(例えば、ポリペプチド)を逐次反応で、並列反応で、もしくは逐次反応と並列反応の組合せで解析するためのものであり得る。一実施形態では、分析物の間に前記支持体上で平均距離約10nmに等しいもしくはそれより長い、約15nmに等しいもしくはそれより長い、約20nmに等しいもしくはそれより長い、約50nmに等しいもしくはそれより長い、約100nmに等しいもしくはそれより長い、約150nmに等しいもしくはそれより長い、約200nmに等しいもしくはそれより長い、約250nmに等しいもしくはそれより長い、約300nmに等しいもしくはそれより長い、約350nmに等しいもしくはそれより長い、約400nmに等しいもしくはそれより長い、約450nmに等しいもしくはそれより長い、または約500nmに等しいもしくはそれより長い間隔をあける。
前述の実施形態のいずれかでは、結合性部分は、ポリペプチドまたはその断片、タンパク質もしくはポリペプチド鎖またはその断片、あるいはタンパク質複合体またはそのサブユニット、例えば、抗体またはその抗原結合断片を含むことができる。
前述の実施形態のいずれかでは、結合性部分は、カルボキシペプチダーゼもしくはアミノペプチダーゼまたはそのバリアント、変異体もしくは修飾タンパク質;アミノアシルtRNA合成酵素またはそのバリアント、変異体もしくは修飾タンパク質;アンチカリンまたはそのバリアント、変異体もしくは修飾タンパク質;ClpSまたはそのバリアント、変異体もしくは修飾タンパク質;UBRボックスタンパク質またはそのバリアント、変異体もしくは修飾タンパク質;アミノ酸に結合する修飾小分子、すなわちバンコマイシンまたはそのバリアント、変異体もしくは修飾分子;あるいはこれらの任意の組合せを含むことができる;または各結合性物質中の、結合性部分は、小分子を含み、コーディングタグは、前記小分子を識別するポリヌクレオチドを含み、それによって、複数の前記結合性物質が、DNAにコードされた小分子のライブラリーなどの、コードされた小分子のライブラリーを形成する。
前述の実施形態のいずれかでは、結合性部分は、前記分析物または前記ポリペプチドに選択的におよび/または特異的に結合することが可能である。
前述の実施形態のいずれかでは、コーディングタグは、核酸、オリゴヌクレオチド、修飾オリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、1つもしくは複数の保護された塩基を有するDNAもしくはRNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはモルホリノ、あるいはこれらの組合せを含むことができる。
前述の実施形態のいずれかでは、コーディングタグは、エンコーダー配列などのバーコード配列、例えば、前記結合性部分を識別するものを含むことができる。
前述の実施形態のいずれかでは、コーディングタグは、スペーサー、結合サイクル特異的配列、一意の分子識別子(UMI)、ユニバーサルプライミング部位、またはこれらの任意の組合せを含むことができる。一実施形態では、結合サイクル特異的配列は、各結合サイクル後に記録タグに付加される。
前述の実施形態のいずれかでは、結合性部分およびコーディングタグを、リンカーまたは結合対により接合させることができる。
前述の実施形態のいずれかでは、結合性部分と前記コーディングタグを、SpyTag/SpyCatcher、SpyTag-KTag/SpyLigase(この場合、接合される2つの部分がSpyTag/KTag対を有し、SpyLigaseがSpyTagをKTagに接合させ、かくして2つの部分が接合される)、SnoopTag/SnoopCatcherペプチド-タンパク質対、HaloTag/HaloTagリガンド対、もしくはソルターゼ、例えばLPXTG Tag/Sortase(例えば、Sortase A5、ActiveMotif、San Diego、もしくは参照により本明細書に組み込まれる米国特許第9,267,127(B2)号において開示されているような)、またはこれらの任意の組合せにより接合させることができる。
前述の実施形態のいずれかでは、キットは、鋳型または非鋳型反応においてコーディングタグと記録タグの間で情報を移行させるための試薬をさらに含むことができ、必要に応じて、前記試薬は、(i)化学的ライゲーション試薬もしくは生物学的ライゲーション試薬、例えば、一本鎖核酸もしくは二本鎖核酸をライゲーションするためのDNAリガーゼもしくはRNAリガーゼなどのリガーゼであるか、または(ii)一本鎖核酸もしくは二本鎖核酸のプライマー伸長のための試薬であり、必要に応じて、前記キットは、少なくとも2つのリガーゼもしくはそれらのバリアント(例えば、少なくとも2つのDNAリガーゼ、もしくは少なくとも2つのRNAリガーゼ、もしくは少なくとも1つのDNAリガーゼおよび少なくとも1つのRNAリガーゼ)を含むライゲーション試薬であって、前記少なくとも2つのリガーゼもしくはそれらのバリアントが、アデニル化リガーゼおよび構成的にアデニル化されていないリガーゼを含む、ライゲーション試薬をさらに含み、または必要に応じて、前記キットは、DNAもしくはRNAリガーゼおよびDNA/RNAデアデニレースを含むライゲーション試薬をさらに含む。
前述の実施形態のいずれかでは、キットは、コーディングタグと記録タグの間で情報を移行させるためのポリメラーゼ、例えばDNAポリメラーゼもしくはRNAポリメラーゼ、または逆転写酵素をさらに含むことができる。
前述の実施形態のいずれかでは、キットは、核酸配列解析のための1つまたは複数の試薬をさらに含むことができる。一実施形態では、前記核酸配列解析は、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、パイロシーケンシング、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、もしくは先端顕微鏡を使用したDNAのダイレクトイメージング、またはこれらの任意の組合せを含む。
前述の実施形態のいずれかでは、キットは、核酸増幅のための、例えば、1つまたは複数の伸長記録タグを増幅するための、1つまたは複数の試薬をさらに含むことができ、必要に応じて、前記核酸増幅は、指数関数的増幅反応(例えば、鋳型乗り換えを低減もしくは消去するためのエマルジョンPCRなどの、ポリメラーゼ連鎖反応(PCR))および/または線形増幅反応(例えば、in vitro転写による等温増幅、もしくはキメラプライマーにより開始される核酸の等温増幅(Isothermal Chimeric primer-initiated Amplification of Nucleic acids)(ICAN))を含む。例えば、Uemoriet al., (2007), "Investigation of the molecular mechanism of ICAN, a novelgene amplification method," J Biochem 142(2): 283-292;Mukai et al.,(2007), "Highly efficient isothermal DNA amplification system using threeelements of 5'-DNA-RNA-3' chimeric primers, RNaseH and strand-displacing DNApolymerase," J Biochem 142(2): 273-281;Ma et al., (2013), "Isothermalamplification method for next-generation sequencing," Proc Natl Acad Sci US A. 110(35): 14320-14323を参照されたく、これらの参考文献のすべては、あらゆる目的で参照により本明細書に組み込まれる。
前述の実施形態のいずれかでは、キットは、コーディングタグ情報を記録タグに移行させて伸長記録タグを形成するための1つまたは複数の試薬を含むことができ、伸長記録タグ上のコーディングタグ情報の順序および/または頻度は、結合性物質が分析物またはポリペプチドに結合する順序および/または頻度を示す。
前述の実施形態のいずれかでは、キットは、標的濃縮、例えば、1つまたは複数の伸長記録タグの濃縮のための1つまたは複数の試薬をさらに含むことができる。
前述の実施形態のいずれかでは、キットは、サブトラクション、例えば、1つまたは複数の伸長記録タグのサブトラクションのための1つまたは複数の試薬をさらに含むことができる。
前述の実施形態のいずれかでは、キットは、例えば、1つまたは複数の分析物またはポリペプチドなどの極めて豊富な種を低減させるための、正規化のための、1つまたは複数の試薬をさらに含むことができる。
前述の実施形態のいずれかでは、キットの少なくとも1つの結合性物質は、末端アミノ酸残基、末端ジアミノ酸残基、または末端トリプルアミノ酸残基に結合することが可能である。
前述の実施形態のいずれかでは、キットの少なくとも1つの結合性物質は、翻訳後修飾されたアミノ酸に結合することが可能である。
前述の実施形態のいずれかでは、キットは、試料中の複数の分析物またはポリペプチドを複数のコンパートメントに分配するための1つまたは複数の試薬または手段をさらに含むことができ、各コンパートメントは、支持体(例えば、固体支持体)に必要に応じて接合されている複数のコンパートメントタグを含み、前記複数のコンパートメントタグは、個々のコンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる。一実施形態では、キットは、複数の分析物またはポリペプチド(例えば、複数のタンパク質複合体、タンパク質および/またはポリペプチド)を複数のポリペプチド断片に断片化するための1つまたは複数の試薬または手段をさらに含む。
前述の実施形態のいずれかでは、キットは、複数のポリペプチド断片を、複数のコンパートメントの各々の中のコンパートメントタグとアニーリングまたは接合させることによって複数のコンパートメントタグ付きポリペプチド断片を生成するための、1つまたは複数の試薬または手段をさらに含むことができる。
前述の実施形態のいずれかでは、複数のコンパートメントは、マイクロ流体液滴、マイクロウェル、もしくは表面上の分離された領域、またはこれらの任意の組合せを含むことができる。
前述の実施形態のいずれかでは、複数のコンパートメントの各々は、平均して単一の細胞を含むことができる。
前述の実施形態のいずれかでは、キットは、試料中の複数の分析物またはポリペプチドを標識するための1つまたは複数のユニバーサルDNAタグをさらに含むことができる。
前述の実施形態のいずれかでは、キットは、試料中の複数の分析物またはポリペプチドを1つまたは複数のユニバーサルDNAタグで標識するための1つまたは複数の試薬をさらに含むことができる。
前述の実施形態のいずれかでは、キットは、プライマー伸長またはライゲーションのための1つまたは複数の試薬をさらに含むことができる。
前述の実施形態のいずれかでは、支持体は、ビーズ、例えば、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、もしくは制御ポアビーズ、またはこれらの任意の組合せを含むことができる。
前述の実施形態のいずれかでは、コンパートメントタグは、一本鎖または二本鎖核酸分子を含むことができる。
前述の実施形態のいずれかでは、コンパートメントタグは、バーコードおよび必要に応じてUMIを含むことができる。前述の実施形態のいずれかでは、支持体はビーズであることができ、コンパートメントタグは、バーコードを含むことができる。
前述の実施形態のいずれかでは、支持体は、ビーズを含むことができ、複数のコンパートメントタグが接合したビーズを、スプリット・アンド・プール(split-and-pool)合成、個々の合成、もしくは固定化、またはこれらの任意の組合せにより形成することができる。
前述の実施形態のいずれかでは、キットは、スプリット・アンド・プール合成、個々の合成、もしくは固定化、またはこれらの任意の組合せのための1つまたは複数の試薬をさらに含むことができる。
前述の実施形態のいずれかでは、コンパートメントタグは、記録タグ内の成分であることができ、前記記録タグは、必要に応じて、スペーサー、バーコード配列、一意の分子識別子、ユニバーサルプライミング部位、またはこれらの任意の組合せをさらに含むことができる。
前述の実施形態のいずれかでは、コンパートメントタグは、複数の分析物またはポリペプチド(例えば、タンパク質複合体、タンパク質、またはポリペプチド)の内部アミノ酸、ペプチド骨格またはN末端アミノ酸と反応することができる機能的部分をさらに含むことができる。一実施形態では、機能的部分は、アルデヒド、アジド/アルキン、マレイミド(malemide)/チオール、エポキシ/求核試薬、逆電子要請型ディールス-アルダー(iEDDA)基、クリック試薬、またはこれらの任意の組合せを含むことができる。
前述の実施形態のいずれかでは、コンパートメントタグは、タンパク質リガーゼ認識配列などのペプチドをさらに含むことができ、必要に応じて、前記タンパク質リガーゼは、ブテラーゼIまたはそのホモログであることもある。
前述の実施形態のいずれかでは、キットは、複数の分析物またはポリペプチドを断片化するための化学的または生物学的試薬、例えば、酵素、例えばプロテアーゼ(例えば、メタロプロテアーゼ)をさらに含むことができる。
前述の実施形態のいずれかでは、キットは、コンパートメントタグを支持体から遊離させるための1つまたは複数の試薬をさらに含むことができる。
前述の実施形態のいずれかでは、キットは、伸長コーディングタグまたはジタグ構築物を形成するための1つまたは複数の試薬をさらに含むことができる。一実施形態では、記録タグの3’末端は、ポリメラーゼによる記録タグの伸長を防止するためにブロッキングされる。前述の実施形態のいずれかでは、コーディングタグは、エンコーダー配列、UMI、ユニバーサルプライミング部位、その3’末端にスペーサー、結合サイクル特異的配列、またはこれらの任意の組合せを含むことができる。
前述の実施形態のいずれかでは、ジタグ構築物を、ギャップ充填、プライマー伸長、またはこれらの組合せにより生成することができる。
前述の実施形態のいずれかでは、ジタグ分子は、記録タグに由来するユニバーサルプライミング部位、記録タグに由来するコンパートメントタグ、記録タグに由来する一意の分子識別子、記録タグに由来する必要に応じたスペーサー、コーディングタグに由来するエンコーダー配列、コーディングタグに由来する一意の分子識別子、コーディングタグに由来する必要に応じたスペーサー、およびコーディングタグに由来するユニバーサルプライミング部位を含むことができる。
前述の実施形態のいずれかでは、結合性物質は、ポリペプチドまたはタンパク質であることができる。
前述の実施形態のいずれかでは、結合性物質は、アミノペプチダーゼまたはそのバリアント、変異体もしくは修飾タンパク質;アミノアシルtRNA合成酵素またはそのバリアント、変異体もしくは修飾タンパク質;アンチカリンまたはそのバリアント、変異体もしくは修飾タンパク質;ClpSまたはそのバリアント、変異体もしくは修飾タンパク質;あるいはアミノ酸に結合する修飾小分子、すなわちバンコマイシンまたはそのバリアント、変異体もしくは修飾分子(例えば、D-アラニル-Dアラニンに結合するバンコマイシン);あるいは抗体またはその結合断片;あるいはこれらの任意の組合せを含むことができる。
前述の実施形態のいずれかでは、結合性物質は、単一のアミノ酸残基(例えば、N末端アミノ酸残基、C末端アミノ酸残基、もしくは内部アミノ酸残基)、ジペプチド(例えば、N末端ジペプチド、C末端ジペプチド、もしくは内部ジペプチド)、トリペプチド(例えば、N末端トリペプチド、C末端トリペプチド、もしくは内部トリペプチド)、または前記分析物もしくはポリペプチドの翻訳後修飾に結合することが可能である。
前述の実施形態のいずれかでは、結合性物質は、N末端ポリペプチド、C末端ポリペプチド、または内部ポリペプチドに結合することが可能である。
前述の実施形態のいずれかでは、コーディングタグおよび/または記録タグは、1つもしくは複数のエラー訂正コード、1つもしくは複数のエンコーダー配列、1つもしくは複数のバーコード、1つもしくは複数のUMI、1つもしくは複数のコンパートメントタグ、1つもしくは複数のサイクル特異的配列、またはこれらの任意の組合せを含むことができる。一部の実施形態では、エラー訂正コードは、Hammingコード、Lee距離コード、非対称Lee距離コード、Reed-Solomonコード、およびLevenshtein-Tenengoltsコードから選択される。
前述の実施形態のいずれかでは、コーディングタグおよび/または記録タグは、サイクル標識を含むことができる。
前述の実施形態のいずれかでは、キットは、コーディングタグおよび/または記録タグから独立しているサイクル標識をさらに含むことができる。
前述の実施形態のいずれかでは、キットは、(a)細胞溶解物もしくはタンパク質試料を生成するための試薬;(b)システインのアルキル化またはリシンのブロッキングなどによって、アミノ酸側鎖をブロッキングするための試薬;(c)トリプシン、LysN、またはLysCなどの、プロテアーゼ;(d)核酸標識ポリペプチド(例えば、DNA標識タンパク質)を支持体に固定化するための試薬;(e)分解に基づくポリペプチド配列決定のための試薬;および/または(f)核酸配列決定のための試薬をさらに含むことができる。
前述の実施形態のいずれかでは、キットは、(a)細胞溶解物もしくはタンパク質試料を生成するための試薬;(b)システインのアルキル化またはリシンのブロッキングなどによって、アミノ酸側鎖をブロッキングするための試薬;(c)トリプシン、LysN、またはLysCなどの、プロテアーゼ;(d)固定化された記録タグを含む支持体にポリペプチド(例えば、タンパク質)を固定化するための試薬;(e)分解に基づくポリペプチド配列決定のための試薬;および/または(f)核酸配列決定のための試薬を含むことができる。
前述の実施形態のいずれかでは、キットは、(a)細胞溶解物もしくはタンパク質試料を生成するための試薬;(b)変性試薬;(c)システインのアルキル化またはリシンのブロッキングなどによって、アミノ酸側鎖をブロッキングするための試薬;(d)ユニバーサルDNAプライマー配列;(e)ポリペプチドをユニバーサルDNAプライマー配列で標識するための試薬;(f)標識されたポリペプチドをプライマーによってアニーリングするためのバーコード付きビーズ;(g)標識されたポリペプチドにビーズからのバーコードを書き込むためのポリメラーゼ伸長のための試薬;(h)トリプシン、LysN、またはLysCなどの、プロテアーゼ;(i)核酸標識ポリペプチド(例えば、DNA標識タンパク質)を支持体に固定化するための試薬;(j)分解に基づくポリペプチド配列決定のための試薬;および/または(k)核酸配列決定のための試薬を含むことができる。
前述の実施形態のいずれかでは、キットは、(a)架橋試薬;(b)細胞溶解物もしくはタンパク質試料を生成するための試薬;(c)システインのアルキル化またはリシンのブロッキングなどによって、アミノ酸側鎖をブロッキングするための試薬;(d)ユニバーサルDNAプライマー配列;(e)ポリペプチドをユニバーサルDNAプライマー配列で標識するための試薬;(f)標識されたポリペプチドをプライマーによってアニーリングするためのバーコード付きビーズ;(g)標識されたポリペプチドにビーズからのバーコードを書き込むためのポリメラーゼ伸長のための試薬;(h)トリプシン、LysN、またはLysCなどの、プロテアーゼ;(i)核酸標識ポリペプチド(例えば、DNA標識タンパク質)を支持体に固定化するための試薬;(j)分解に基づくポリペプチド配列決定のための試薬;および/または(k)核酸配列決定のための試薬を含むことができる。
キットの前述の実施形態のいずれかでは、溶液中または支持体、例えば、固体支持体上の1つまたは複数の成分を提供することができる。
キット成分は、下記の例示的な方法および/または態様で開示および/または使用される、任意の分子、分子複合体もしくはコンジュゲート、試薬(例えば、化学的もしくは生物学的)、薬剤、構造(例えば、支持体、表面、粒子もしくはビーズ)、反応中間体、反応生成物、結合性複合体または任意の他の製造物品も含み得る。本キットは、任意の適切な分析物、例えば巨大分子またはポリペプチドの解析に使用することができる。一部の実施形態では、本キットは、高度に並行な、ハイスループットなデジタル解析(例えば、巨大分子解析)、特にポリペプチド解析に使用することができる。一部の実施形態では、本キットは、分析物、例えば巨大分子またはポリペプチドを解析するための下記の例示的な方法において使用することができる。
第1の例は、分析物、例えば、巨大分子またはポリペプチドを解析するための方法であって、(a)固体支持体に接合した分析物および付随する記録タグを提供するステップと;(b)前記分析物を、前記分析物に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(c)前記第1のコーディングタグの情報を前記記録タグに移行させて、一次伸長記録タグを生成するステップと;(d)前記分析物を、前記分析物に結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディングタグを含む、ステップと;(e)前記第2のコーディングタグの情報を前記一次伸長記録タグに移行させて、二次伸長記録タグを生成するステップと;(f)前記二次伸長記録タグを解析するステップとを含む方法である。
第2の例は、接触させるステップ(b)および(d)を逐次的に実施する、第1の例に記載の方法である。
第3の例は、接触させるステップ(b)および(d)を同時に実施する、第1の例に記載の方法である。
第4の例は、ステップ(e)と(f)の間に、(x)前記第2の結合性物質を、前記分析物に結合することが可能な第3の(またはより高次の)結合性物質に置き換えることにより、ステップ(d)および(e)を1回または複数回繰り返すステップであって、前記第3の(またはより高次の)結合性物質が、前記第3の(またはより高次の)結合性物質に関する識別情報を有する第3の(またはより高次の)コーディングタグを含む、ステップと;(y)前記第3の(またはより高次の)コーディングタグの情報を第2の(またはより高次の)伸長記録タグに移行させて、第3の(またはより高次の)伸長記録タグを生成するステップとをさらに含み、ステップ(f)において前記第3の(またはより高次の)伸長記録タグを解析する、第1の例に記載の方法である。
第5の例は、分析物、例えば、巨大分子またはポリペプチドを解析するための方法であって、(a)固体支持体に接合した分析物、付随する第1の記録タグおよび付随する第2の記録タグを提供するステップと;(b)前記分析物を、前記分析物に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(c)前記第1のコーディングタグの情報を前記第1の記録タグに移行させて、第1の伸長記録タグを生成するステップと;(d)前記分析物を、前記分析物に結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディングタグを含む、ステップと;(e)前記第2のコーディングタグの情報を前記第2の記録タグに移行させて、第2の伸長記録タグを生成するステップと;(f)前記第1および第2の伸長記録タグを解析するステップとを含む方法である。
第6の例は、接触させるステップ(b)および(d)を逐次的に実施する、第5の例に記載の方法である。
第7の例は、接触させるステップ(b)および(d)を同時に実施する、第5の例に記載の方法である。
第8の例は、ステップ(a)が、前記固体支持体に接合した付随する第3の(またはより高次の)記録タグを提供するステップをさらに含む、第5の例に記載の方法である。
第9の例は、ステップ(e)と(f)の間に、(x)前記第2の結合性物質を、前記分析物に結合することが可能な第3の(またはより高次の)結合性物質に置き換えることにより、ステップ(d)および(e)を1回または複数回繰り返すステップであって、第3の(またはより高次の)結合性物質が、前記第3の(またはより高次の)結合性物質に関する識別情報を有する第3の(またはより高次の)コーディングタグを含む、ステップと;(y)前記第3の(またはより高次の)コーディングタグの情報を前記第3の(またはより高次の)記録タグに移行させて、第3の(またはより高次の)伸長記録タグを生成するステップとをさらに含み、ステップ(f)において前記第1、第2および第3の(またはより高次の)伸長記録タグを解析する、第8の例に記載の方法である。
第10の例は、前記第1のコーディングタグ、第2のコーディングタグ、および任意のより高次のコーディングタグが、結合サイクル特異的スペーサー配列を含む、第5~第9の例のいずれか1つに記載の方法である。
第11の例は、ペプチドを解析するための方法であって、(a)固体支持体に接合したペプチドおよび付随する記録タグを提供するステップと;(b)前記ペプチドのN末端アミノ酸(NTAA)を化学薬剤で修飾するステップと;(c)前記ペプチドを、修飾された前記NTAAに結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(d)前記第1のコーディングタグの情報を前記記録タグに移行させて、伸長記録タグ生成するステップと;(e)前記伸長記録タグを解析するステップとを含む方法である。
第12の例は、ステップ(c)が、前記ペプチドを、第2の(またはより高次の)結合性物質に関する識別情報を有する第2の(またはより高次の)コーディングタグを含む第2の(またはより高次の)結合性物質と接触させるステップであって、前記第2の(またはより高次の)結合性物質が、ステップ(b)の修飾された前記NTAA以外の修飾されたNTAAに結合することが可能である、ステップをさらに含む、第11の例に記載の方法である。
第13の例は、前記ペプチドの前記第2の(またはより高次の)結合性物質との接触を、前記ペプチドの前記第1の結合性物質との接触後に逐次的に行う、第12の例に記載の方法である。
第14の例は、前記ペプチドの前記第2の(またはより高次の)結合性物質との接触を、前記ペプチドの前記第1の結合性物質との接触と同時に行う、第12の例に記載の方法である。
第15の例は、前記化学薬剤が、イソチオシアネート誘導体、2,4-ジニトロベンゼンスルホン酸(DNBS)、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)1-フルオロ-2,4-ジニトロベンゼン、ダンシルクロリド、7-メトキシクマリン酢酸、チオアシル化試薬、チオアセチル化試薬、またはチオベンジル化試薬である、第11~第14の例のいずれか1つに記載の方法である。
第16の例は、ペプチドを解析するための方法であって、(a)固体支持体に接合したペプチドおよび付随する記録タグを提供するステップと;(b)前記ペプチドのN末端アミノ酸(NTAA)を化学薬剤で修飾して修飾されたNTAAを得るステップと;(c)前記ペプチドを、修飾された前記NTAAに結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(d)前記第1のコーディングタグの情報を前記記録タグに移行させて、第1の伸長記録タグを生成するステップと;(e)修飾された前記NTAAを除去して新しいNTAAを露出させるステップ;(f)前記ペプチドの新しいNTAAを化学薬剤で修飾して新しく修飾されたNTAAを得るステップと;(g)前記ペプチドを、前記新しく修飾されたNTAAに結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディングタグを含む、ステップと;(h)前記第2のコーディングタグの情報を前記第1の伸長記録タグに移行させて、第2の伸長記録タグ生成するステップと;(i)前記第2の伸長記録タグを解析するステップとを含む方法である。
第17の例は、ペプチドを解析するための方法であって、(a)固体支持体に接合したペプチドおよび付随する記録タグを提供するステップと;(b)前記ペプチドを、前記ペプチドのN末端アミノ酸(NTAA)に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(c)前記第1のコーディングタグの情報を前記記録タグに移行させて、伸長記録タグを生成するステップと;(d)前記伸長記録タグを解析するステップとを含む方法である。
第18の例は、ステップ(b)が、前記ペプチドを、第2の(またはより高次の)結合性物質に関する識別情報を有する第2の(またはより高次の)コーディングタグを含む第2の(またはより高次の)結合性物質と接触させるステップであって、前記第2の(またはより高次の)結合性物質が、前記ペプチドの前記NTAA以外のNTAAに結合することが可能である、ステップをさらに含む、第17の例に記載の方法である。
第19の例は、前記ペプチドの前記第2の(またはより高次の)結合性物質との接触を、前記ペプチドの前記第1の結合性物質との接触後に逐次的に行う、第18の例に記載の方法である。
第20の例は、前記ペプチドの前記第2の(またはより高次の)結合性物質との接触を、前記ペプチドの前記第1の結合性物質との接触と同時に行う、第18の例に記載の方法である。
第21の例は、ペプチドを解析するための方法であって、(a)固体支持体に接合したペプチドおよび付随する記録タグを提供するステップと;(b)前記ペプチドを、前記ペプチドのN末端アミノ酸(NTAA)に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(c)前記第1のコーディングタグの情報を前記記録タグに移行させて、第1の伸長記録タグを生成するステップと;(d)前記NTAAを除去して前記ペプチドの新しいNTAAを露出させるステップと;(e)前記ペプチドを、前記新しいNTAAに結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディングタグを含む、ステップと;(f)前記第2のコーディングタグの情報を前記第1の伸長記録タグに移行させて、第2の伸長記録タグを生成するステップと;(g)前記第2の伸長記録タグを解析するステップとを含む方法である。
第22の例は、前記分析物が、タンパク質、ポリペプチドまたはペプチドである、第1~第10の例のいずれか1つに記載の方法である。
第23の例は、前記分析物が、ペプチドである、第1~第10の例のいずれか1つに記載の方法である。
第24の例は、前記ペプチドが、生体試料由来のタンパク質を断片化することにより得られる、第11~第23の例のいずれか1つに記載の方法である。
第25の例は、前記分析物が、脂質、炭水化物、または大環状分子である、第1~第10の例のいずれか1つに記載の方法である。
第26の例は、前記記録タグが、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはこれらの組合せである、第1~第25の例のいずれか1つに記載の方法である。
第27の例は、前記記録タグが、ユニバーサルプライミング部位を含む、第1~第26の例のいずれか1つに記載の方法である。
第28の例は、前記ユニバーサルプライミング部位が、増幅、配列決定、またはその両方のためのプライミング部位を含む、第27の例に記載の方法である。
第29の例は、前記記録タグが、一意の分子識別子(UMI)を含む、第1~第28の例に記載の方法である。
第30の例は、前記記録タグが、バーコードを含む、第1~第29の例のいずれか1つに記載の方法である。
第31の例は、前記記録タグが、その3’末端にスペーサーを含む、第1~第30の例のいずれか1つに記載の方法である。
第32の例は、前記分析物および前記付随する記録タグが、前記固体支持体に共有結合により接合されている、第1~第31の例のいずれか1つに記載の方法である。
第33の例は、前記固体支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、第1~第32の例のいずれか1つに記載の方法である。
第34の例は、前記固体支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、第33の例に記載の方法である。
第35の例は、複数の分析物(例えば、同じ分析物のまたは異なる分析物の分子)および付随する記録タグが、固体支持体に接合されている、第1~第34の例のいずれか1つに記載の方法である。
第36の例は、前記複数の分析物(例えば、同じ分析物のまたは異なる分析物の分子)の間に固体支持体上で平均距離>50nmの間隔をあける、第35の例に記載の方法である。
第37の例は、前記結合性物質が、ポリペプチドまたはタンパク質である、第1~第36の例のいずれか1つに記載の方法である。
第38の例は、前記結合性物質が、修飾アミノペプチダーゼ、修飾アミノアシルtRNA合成酵素、修飾アンチカリン、または修飾ClpSである、第37の例に記載の方法である。
第39の例は、前記結合性物質が、前記分析物に選択的に結合することが可能である、第1~第38の例のいずれか1つに記載の方法である。
第40の例は、前記コーディングタグが、DNA分子、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはこれらの組合せである、第1~第39の例のいずれか1つに記載の方法である。
第41の例は、前記コーディングタグが、エンコーダー配列を含む、第1~第40の例のいずれか1つに記載の方法である。
第42の例は、前記コーディングタグが、スペーサー、結合サイクル特異的配列、一意の分子識別子、ユニバーサルプライミング部位、またはこれらの任意の組合せをさらに含む、第1~第41の例のいずれか1つに記載の方法である。
第43の例は、前記結合性物質および前記コーディングタグが、リンカーによって接合されている、第1~第42の例のいずれか1つに記載の方法である。
第44の例は、前記結合性部分および前記コーディングタグが、SpyTag/SpyCatcher、SpyTag-KTag/SpyLigase(この場合、接合される2つの部分がSpyTag/KTag対を有し、SpyLigaseがSpyTagをKTagに接合させ、かくして2つの部分が接合される)、ソルターゼ、またはSnoopTag/SnoopCatcherペプチド-タンパク質対によって接合されている、第1~第42の例のいずれか1つに記載の方法である。
第45の例は、前記コーディングタグの情報の前記記録タグへの移行が、DNAリガーゼによって媒介される、第1~第44の例のいずれか1つに記載の方法である。
第46の例は、前記コーディングタグの情報の前記記録タグへの移行が、DNAポリメラーゼによって媒介される、第1~第44の例のいずれか1つに記載の方法である。
第47の例は、前記コーディングタグの情報の前記記録タグへの移行が化学的ライゲーションによって媒介される、第1~第44の例のいずれか1つに記載の方法である。
第48の例は、前記伸長記録タグの解析が、核酸配列決定法を含む、第1~第47の例のいずれか1つに記載の方法である。
第49の例は、前記核酸配列決定法が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、第48の例に記載の方法である。
第50の例は、前記核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したDNAのダイレクトイメージングである、第48の例に記載の方法である。
第51の例は、前記伸長記録タグが、解析前に増幅される、第1~第50の例のいずれか1つに記載の方法である。
第52の例は、前記伸長記録タグに含有されるコーディングタグ情報の順序が、前記結合性物質による前記分析物への結合の順序に関する情報を提供する、第1~第51の例のいずれか1つに記載の方法である。
第53の例は、前記伸長記録タグに含有される前記コーディングタグ情報の頻度が、前記結合性物質による前記分析物への結合の頻度に関する情報を提供する、第1~第52の例のいずれか1つに記載の方法である。
第54の例は、複数の分析物(例えば、同じ分析物のまたは異なる分析物の分子)を表す複数の伸長記録タグが、並行して解析される、第1~第53の例のいずれか1つに記載の方法である。
第55の例は、複数の分析物(例えば、同じ分析物のまたは異なる分析物の分子)を表す前記複数の伸長記録タグが、多重化アッセイで解析される、第54の例に記載の方法である。
第56の例は、前記複数の伸長記録タグが、解析前に標的濃縮アッセイされる、第1~第55の例のいずれか1つに記載の方法である。
第57の例は、前記複数の伸長記録タグが、解析前にサブトラクションアッセイされる、第1~第56の例のいずれか1つに記載の方法である。
第58の例は、前記複数の伸長記録タグが、極めて豊富な種を低減させるために解析前に正規化アッセイされる、第1~第57の例のいずれか1つに記載の方法である。
第59の例は、前記NTAAが、修飾アミノペプチダーゼ、修飾アミノ酸tRNA合成酵素、穏やかなエドマン分解、エドマナーゼ酵素、または無水TFAによって除去される、第1~第58の例のいずれか1つに記載の方法である。
第60の例は、少なくとも1つの結合性物質が、末端アミノ酸残基に結合する、第1~第59の例のいずれか1つに記載の方法である。
第61の例は、少なくとも1つの結合性物質が、翻訳後修飾されたアミノ酸に結合する、第1~第60の例のいずれか1つに記載の方法である。
第62の例は、複数のタンパク質複合体、タンパク質またはポリペプチドを含む試料由来の1つまたは複数のペプチドを解析するための方法であって、(a)前記試料中の前記複数のタンパク質複合体、タンパク質、またはポリペプチドを複数のコンパートメントに分配するステップであって、各コンパートメントが、固体支持体に必要に応じて接合されている複数のコンパートメントタグを含み、前記複数のコンパートメントタグが、個々のコンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、ステップと;(b)前記複数のタンパク質複合体、タンパク質、および/またはポリペプチドを複数のペプチドに断片化するステップと;(c)前記複数のペプチドと前記複数のコンパートメント内の前記複数のコンパートメントタグとのアニーリングまたは接合を可能にするのに十分な条件下で前記複数のペプチドを前記複数のコンパートメントタグと接触させることによって複数のコンパートメントタグ付きペプチドを生成するステップと;(d)前記コンパートメントタグ付きペプチドを前記複数のコンパートメントから収集するステップと;(e)1つまたは複数のコンパートメントタグ付きペプチドを、第1~第21の例および第26~第61の例のいずれか1つに記載の方法に従って解析するステップとを含む方法である。
第63の例は、前記コンパートメントが、マイクロ流体液滴である、第62の例に記載の方法である。
第64の例は、前記コンパートメントが、マイクロウェルである、第62の例に記載の方法である。
第65の例は、前記コンパートメントが、表面上の分離された領域である、第62の例に記載の方法である。
第66の例は、各コンパートメントが、平均して単一の細胞を含む、第62~第65の例のいずれか1つに記載の方法である。
第67の例は、複数のタンパク質複合体、タンパク質またはポリペプチドを含む試料由来の1つまたは複数のペプチドを解析するための方法であって、(a)前記複数のタンパク質複合体、タンパク質、またはポリペプチドを複数のユニバーサルDNAタグで標識するステップと;(b)前記試料中の複数の標識されたタンパク質複合体、タンパク質またはポリペプチドを複数のコンパートメントに分配するステップであって、各コンパートメントが、複数のコンパートメントタグを含み、前記複数のコンパートメントタグが、個々のコンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、ステップと;(c)前記複数のタンパク質複合体、タンパク質、またはポリペプチドと前記複数のコンパートメント内の前記複数のコンパートメントタグとのアニーリングまたは接合を可能にするのに十分な条件下で前記複数のタンパク質複合体、タンパク質、またはポリペプチドを前記複数のコンパートメントタグと接触させることによって複数のコンパートメントタグ付きタンパク質複合体、タンパク質またはポリペプチドを生成するステップと;(d)前記コンパートメントタグ付きタンパク質複合体、タンパク質、またはポリペプチドを前記複数のコンパートメントから収集するステップと;(e)必要に応じて前記コンパートメントタグ付きタンパク質複合体、タンパク質、またはポリペプチドをコンパートメントタグ付きペプチドに断片化するステップと;(f)1つまたは複数のコンパートメントタグ付きペプチドを、第1~第21の例および第26~第61の例のいずれか1つに記載の方法に従って解析するステップとを含む方法である。
第68の例は、コンパートメントタグ情報が、ペプチドに付随する記録タグに、プライマー伸長またはライゲーションによって移行される、第62~第67の例のいずれか1つに記載の方法である。
第69の例は、前記固体支持体が、ビーズを含む、第62~第68の例のいずれか1つに記載の方法である。
第70の例は、前記ビーズが、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、第69の例に記載の方法である。
第71の例は、前記コンパートメントタグが、一本鎖または二本鎖核酸分子を含む、第62~第70の例のいずれか1つに記載の方法である。
第72の例は、前記コンパートメントタグが、バーコードおよび必要に応じてUMIを含む、第62~第71の例のいずれか1つに記載の方法である。
第73の例は、前記固体支持体がビーズであり、前記コンパートメントタグがバーコードを含み、さらに、前記複数のコンパートメントタグが接合されているビーズが、スプリット・アンド・プール合成により形成される、第72の例に記載の方法である。
第74の例は、前記固体支持体がビーズであり、前記コンパートメントタグがバーコードを含み、さらに、複数のコンパートメントタグが接合されているビーズが、個々の合成または固定化により形成される、第72の例に記載の方法である。
第75の例は、前記コンパートメントタグが、記録タグ内の成分であり、前記記録タグが、必要に応じて、スペーサー、一意の分子識別子、ユニバーサルプライミング部位、またはこれらの任意の組合せをさらに含む、第62~第74の例いずれか1つに記載の方法である。
第76の例は、前記コンパートメントタグが、前記複数のタンパク質複合体、タンパク質またはポリペプチドの内部アミノ酸またはN末端アミノ酸と反応することができる機能的部分をさらに含む、第62~第75の例のいずれか1つに記載の方法である。
第77の例は、前記機能的部分が、NHS基である、第76の例に記載の方法である。
第78の例は、前記機能的部分が、アルデヒド基である、第76の例に記載の方法である。
第79の例は、前記複数のコンパートメントタグが、前記コンパートメントタグを前記コンパートメントに印刷、スポッティング、インク噴射すること、またはその組合せにより形成される、第62~第78の例のいずれか1つに記載の方法である。
第80の例は、前記コンパートメントタグが、ペプチドをさらに含む、第62~第79の例のいずれか1つに記載の方法である。
第81の例は、前記コンパートメントタグペプチドが、タンパク質リガーゼ認識配列を含む、第80の例に記載の方法である。
第82の例は、前記タンパク質リガーゼが、ブテラーゼIまたはそのホモログである、第81の例に記載の方法である。
第83の例は、前記複数のポリペプチドが、プロテアーゼで断片化される、第62~第82の例のいずれか1つに記載の方法である。
第84の例は、前記プロテアーゼが、メタロプロテアーゼである、第83の例に記載の方法である。
第85の例は、前記メタロプロテアーゼの活性が、金属カチオンの光活性化放出によりモジュレートされる、第84の例に記載の方法である。
第86の例は、前記複数のポリペプチドを前記複数のコンパートメントに分配する前に1つまたは複数の豊富なタンパク質を前記試料からサブトラクションすることをさらに含む、第62~第85の例のいずれか1つに記載の方法である。
第87の例は、前記複数のペプチドと前記コンパートメントタグを接合させる前に前記コンパートメントタグを前記固体支持体から遊離させることをさらに含む、第62~第86の例のいずれか1つに記載の方法である。
第88の例は、ステップ(d)の後に、前記コンパートメントタグ付きペプチドを固体支持体に記録タグを伴って接合させることをさらに含む、第62の例に記載の方法である。
第89の例は、前記コンパートメントタグ付きペプチド上の前記コンパートメントタグの情報を前記付随する記録タグに移行させることをさらに含む、第88の例に記載の方法である。
第90の例は、ステップ(e)の前に前記コンパートメントタグを前記コンパートメントタグ付きペプチドから除去することをさらに含む、第89の例に記載の方法である。
第91の例は、前記解析されるペプチドが由来する前記単一の細胞の同一性を、前記解析されるペプチドのコンパートメントタグ配列に基づいて決定することをさらに含む、第62~第90の例のいずれか1つに記載の方法である。
第92の例は、前記解析されるペプチドが由来する前記タンパク質またはタンパク質複合体の同一性を、前記解析されるペプチドのコンパートメントタグ配列に基づいて決定することをさらに含む、第62~第90の例のいずれか1つに記載の方法である。
第93の例は、複数の分析物(例えば、同じ分析物のまたは異なる分析物の分子)を解析するための方法であって、(a)固体支持体に接合した複数の分析物および付随する記録タグを提供するステップと;(b)前記複数の分析物を、前記複数の分析物に結合することが可能な複数の結合性物質と接触させるステップであって、各結合性物質が前記結合性物質に関する識別情報を有するコーディングタグを含む、ステップと;(c)(i)前記分析物に付随する記録タグの情報を、前記分析物に結合している前記結合性物質の前記コーディングタグに移行させて、伸長コーディングタグを生成するステップ;または(ii)分析物に付随する記録タグおよび前記分析物に結合している前記結合性物質のコーディングタグの情報をジタグ構築物に移行するステップと;(d)前記伸長コーディングタグまたはジタグ構築物を収集するステップと;(e)必要に応じてステップ(b)~(d)を1回または複数回の結合サイクルにわたって繰り返すステップと;(f)伸長コーディングタグまたはジタグ構築物の収集物を解析するステップとを含む方法である。
第94の例は、前記分析物が、タンパク質である、第93の例に記載の方法である。
第95の例は、前記分析物が、ペプチドである、第93の例に記載の方法である。
第96の例は、前記ペプチドが、生体試料由来のタンパク質を断片化することにより得られる、第95の例に記載の方法である。
第97の例は、前記記録タグが、DNA分子、RNA分子、PNA分子、BNA分子、XNA分子、LNA分子、γPNA分子、またはこれらの組合せである、第93~第96の例のいずれか1つに記載の方法である。
第98の例は、前記記録タグが、一意の分子識別子(UMI)を含む、第93~第97の例のいずれか1つに記載の方法である。
第99の例は、前記記録タグが、コンパートメントタグを含む、例93~98に記載の方法である。
第100の例は、前記記録タグが、ユニバーサルプライミング部位を含む、例93~99のいずれか1つに記載の方法である。
第101の例は、前記記録タグが、その3’末端にスペーサーを含む、例93~100のいずれか1つに記載の方法である。
第102の例は、前記記録タグの3’末端が、ポリメラーゼによる前記記録タグの伸長を防止するためにブロッキングされ、分析物に付随する記録タグおよび前記分析物に結合している結合性物質のコーディングタグの情報が、ジタグ構築物に移行される、例93~101のいずれか1つに記載の方法である。
第103の例は、前記コーディングタグが、エンコーダー配列を含む、例93~102のいずれか1つに記載の方法である。
第104の例は、前記コーディングタグが、UMIを含む、例93~103のいずれか1つに記載の方法である。
第105の例は、前記コーディングタグが、ユニバーサルプライミング部位を含む、例93~104のいずれか1つに記載の方法である。
第106の例は、前記コーディングタグが、その3’末端にスペーサーを含む、例93~105のいずれか1つに記載の方法である。
第107の例は、前記コーディングタグが、結合サイクル特異的配列を含む、例93~106のいずれか1つに記載の方法である。
第108の例は、前記結合性物質および前記コーディングタグが、リンカーによって接合されている、例93~107のいずれか1つに記載の方法である。
第109の例は、前記記録タグの情報の前記コーディングタグへの移行が、プライマー伸長により果たされる、例93~108のいずれか1つに記載の方法である。
第110の例は、前記記録タグの情報の前記コーディングタグへの移行が、ライゲーションによって果たされる、例93~108のいずれか1つに記載の方法である。
第111の例は、前記ジタグ構築物が、ギャップ充填、プライマー伸長、またはその両方により生成される、例93~108のいずれか1つに記載の方法である。
第112の例は、ジタグ分子が、記録タグに由来するユニバーサルプライミング部位、記録タグに由来するコンパートメントタグ、記録タグに由来する一意の分子識別子、記録タグに由来する必要に応じたスペーサー、コーディングタグに由来するエンコーダー配列、コーディングタグに由来する一意の分子識別子、コーディングタグに由来する必要に応じたスペーサー、およびコーディングタグに由来するユニバーサルプライミング部位を含む、例93~97、107、108および111のいずれか1つに記載の方法である。
第113の例は、前記分析物および前記付随する記録タグが、前記固体支持体に共有結合により接合されている、例93~112のいずれか1つに記載の方法である。
第114の例は、前記固体支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、例113に記載の方法である。
第115の例は、前記固体支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、例114に記載の方法である。
第116の例は、前記結合性物質が、ポリペプチドまたはタンパク質である、例93~115のいずれか1つに記載の方法である。
第117の例は、前記結合性物質が、修飾アミノペプチダーゼ、修飾アミノアシルtRNA合成酵素、修飾アンチカリン、または抗体もしくはその結合断片である、例116に記載の方法である。
第118の例は、前記結合性物質が、単一のアミノ酸残基、ジペプチド、トリペプチドまたは前記ペプチドの翻訳後修飾に結合する、例95~117のいずれか1つに記載の方法である。
第119の例は、前記結合性物質が、N末端アミノ酸残基、C末端アミノ酸残基、または内部アミノ酸残基に結合する、例118に記載の方法である。
第120の例は、前記結合性物質が、N末端ペプチド、C末端ペプチド、または内部ペプチドに結合する、例118に記載の方法である。
第121の例は、前記結合性物質が、N末端アミノ酸残基に結合し、N末端アミノ酸残基が、各結合サイクル後に切断される、例119に記載の方法である。
第122の例は、前記結合性物質が、C末端アミノ酸残基に結合し、C末端アミノ酸残基が、各結合サイクル後に切断される、例119に記載の方法である。
例123.前記N末端アミノ酸残基が、エドマン分解によって切断される、例121に記載の方法。
例124.前記結合性物質が、アミノ酸または翻訳後修飾の部位特異的な共有結合性標識である、例93に記載の方法。
例125.ステップ(b)の後に、前記分析物と付随する結合性物質とを含む複合体が、前記固体支持体から解離され、液滴またはマイクロ流体液滴のエマルジョン中に分配される、例93~124のいずれか1つに記載の方法。
例126.各マイクロ流体液滴が、平均して、前記分析物と前記結合性物質とを含む複合体を1つ含む、例125に記載の方法。
例127.前記記録タグが、伸長コーディングタグまたはジタグ構築物の生成前に増幅される、例125または126に記載の方法。
例128.エマルジョン融合PCRが、前記記録タグの情報を前記コーディングタグに移行させるためにまたはジタグ構築物の集団を創出するために使用される、例125~127のいずれか1つに記載の方法。
例129.伸長コーディングタグまたはジタグ構築物の収集物が、解析前に増幅される、例93~128のいずれか1つに記載の方法。
例130.伸長コーディングタグまたはジタグ構築物の収集物の解析が、核酸配列決定法を含む、例93~129のいずれか1つに記載の方法。
例131.前記核酸配列決定法が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、例130に記載の方法。
例132.前記核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したDNAのダイレクトイメージングである、例130に記載の方法。
例133.前記分析物の部分的組成が、一意のコンパートメントタグおよび必要に応じてUMIを使用する複数の伸長コーディングタグまたはジタグ構築物の解析により決定される、例130に記載の方法。
例134.前記解析ステップが、塩基当たりのエラー率が>5%、>10%、>15%、>20%、>25%、または>30%である配列決定法を用いて実施される、例1~133のいずれか1つに記載の方法。
例135.コーディングタグ、記録タグ、またはその両方の識別成分が、エラー訂正コードを含む、例1~134のいずれか1つに記載の方法。
例136.前記識別成分が、エンコーダー配列、バーコード、UMI、コンパートメントタグ、サイクル特異的配列、またはこれらの任意の組合せから選択される、例135に記載の方法。
例137.前記エラー訂正コードが、Hammingコード、Lee距離コード、非対称Lee距離コード、Reed-Solomonコード、およびLevenshtein-Tenengoltsコードから選択される、例135または136に記載の方法。
例138.コーディングタグ、記録タグ、またはその両方の識別成分が、一意の電流またはイオンフラックスまたは光学的シグネチャを生成することができ、解析ステップが、識別成分を識別するための一意の電流またはイオンフラックスまたは光学的シグネチャの検出を含む、例1~134のいずれか1つに記載の方法。
例139.前記識別成分が、エンコーダー配列、バーコード、UMI、コンパートメントタグ、サイクル特異的配列、またはこれらの任意の組合せから選択される、例138に記載の方法。
例140.複数の分析物(例えば、同じ分析物のまたは異なる分析物の分子)を解析するための方法であって、(a)固体支持体に接合した複数の分析物および付随する記録タグを提供するステップと;(b)前記複数の分析物を、同類の分析物に結合することが可能な複数の結合性物質と接触させるステップであって、各結合性物質が前記結合性物質に関する識別情報を有するコーディングタグを含む、ステップと;(c)第1の結合性物質の第1のコーディングタグの情報を第1の分析物に付随する第1の記録タグに移行させて、一次伸長記録タグを生成するステップであって、前記第1の結合性物質が前記第1の分析物に結合する、ステップと;(d)前記複数の分析物を、同類の分析物に結合することが可能な前記複数の結合性物質と接触させるステップと;(e)第2の結合性物質の第2のコーディングタグの情報を前記一次伸長記録タグに移行させて、二次伸長記録タグを生成するステップであって、前記第2の結合性物質が前記第1の分析物に結合する、ステップと;(f)必要に応じてステップ(d)~(e)を「n」回の結合サイクルにわたって繰り返すステップであって、前記第1の分析物に結合する各結合性物質の各コーディングタグの情報を前の結合サイクルで生成した伸長記録タグに移行させて、前記第1の分析物を表すn次伸長記録タグを生成するステップと;(g)前記n次伸長記録タグを解析するステップとを含む方法。
例141.複数の分析物を表す複数のn次伸長記録タグが生成され、解析される、例140に記載の方法。
例142.前記分析物が、タンパク質である、例140または141に記載の方法。
例143.前記分析物が、ペプチドである、例142に記載の方法。
例144.前記ペプチドが、生体試料由来のタンパク質を断片化することにより得られる、例143に記載の方法。
例145.前記複数の分析物が、多数のプールされた試料由来の分析物(例えば、ポリペプチド、タンパク質、タンパク質複合体などの、巨大分子)を含む、例140~144のいずれか1つに記載の方法。
例146.前記記録タグが、DNA分子、RNA分子、PNA分子、BNA分子、XNA、分子、LNA分子、γPNA分子、またはこれらの組合せである、例140~145のいずれか1つに記載の方法。
例147.前記記録タグが、一意の分子識別子(UMI)を含む、例140~146のいずれか1つに記載の方法。
例148.前記記録タグが、コンパートメントタグを含む、例140~147に記載の方法。
例149.前記記録タグが、ユニバーサルプライミング部位を含む、例140~148のいずれか1つに記載の方法。
例150.前記記録タグが、その3’末端にスペーサーを含む、例140~149のいずれか1つに記載の方法。
例151.前記コーディングタグが、エンコーダー配列を含む、例140~150のいずれか1つに記載の方法。
例152.前記コーディングタグが、UMIを含む、例140~151のいずれか1つに記載の方法。
例153.前記コーディングタグが、ユニバーサルプライミング部位を含む、例140~152のいずれか1つに記載の方法。
例154.前記コーディングタグが、その3’末端にスペーサーを含む、例140~153のいずれか1つに記載の方法。
例155.前記コーディングタグが、結合サイクル特異的配列を含む、例140~154のいずれか1つに記載の方法。
例156.前記コーディングタグが、一意の分子識別子を含む、例140~155のいずれか1つに記載の方法。
例157.前記結合性物質および前記コーディングタグが、リンカーによって接合されている、例140~156のいずれか1つに記載の方法。
例158.前記記録タグの情報の前記コーディングタグへの移行が、プライマー伸長によって媒介される、例140~157のいずれか1つに記載の方法。
例159.前記記録タグの情報の前記コーディングタグへの移行が、ライゲーションによって媒介される、例140~158のいずれか1つに記載の方法。
例160.前記複数の分析物、前記付随する記録タグ、またはその両方が、前記固体支持体に共有結合により接合されている、例140~159のいずれか1つに記載の方法。
例161.前記固体支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、例140~160のいずれか1つに記載の方法。
例162.前記固体支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、例161に記載の方法。
例163.前記結合性物質が、ポリペプチドまたはタンパク質である、例140~162のいずれか1つに記載の方法。
例164.前記結合性物質が、修飾アミノペプチダーゼ、修飾アミノアシルtRNA合成酵素、修飾アンチカリン、または抗体もしくはその結合断片である、例163に記載の方法。
例165.前記結合性物質が、単一のアミノ酸残基、ジペプチド、トリペプチドまたは前記ペプチドの翻訳後修飾に結合する、例142~164のいずれか1つに記載の方法。
例166.前記結合性物質が、N末端アミノ酸残基、C末端アミノ酸残基、または内部アミノ酸残基に結合する、例165に記載の方法。
例167.前記結合性物質が、N末端ペプチド、C末端ペプチド、または内部ペプチドに結合する、例165に記載の方法。
例168.前記結合性物質が、修飾されたN末端アミノ酸残基、修飾されたC末端アミノ酸残基または修飾された内部アミノ酸残基の化学標識に結合する、例142~164のいずれか1つに記載の方法。
例169.前記結合性物質が、前記N末端アミノ酸残基、または前記修飾されたN末端アミノ酸残基の化学標識に結合し、前記N末端アミノ酸残基が、各結合サイクル後に切断される、例166または168に記載の方法。
例170.前記結合性物質が、前記C末端アミノ酸残基、または前記修飾されたC末端アミノ酸残基の化学標識に結合し、前記C末端アミノ酸残基が、各結合サイクル後に切断される、例166または168に記載の方法。
例171.前記N末端アミノ酸残基が、エドマン分解、エドマナーゼ、修飾アミノペプチダーゼまたは修飾アシルペプチドヒドロラーゼによって切断される、例169に記載の方法。
例172.前記結合性物質が、アミノ酸または翻訳後修飾の部位特異的な共有結合性標識である、例163に記載の方法。
例173.前記複数のn次伸長記録タグが、解析前に増幅される、例140~172のいずれか1つに記載の方法。
例174.前記n次伸長記録タグの解析が、核酸配列決定法を含む、例140~173のいずれか1つに記載の方法。
例175.複数の分析物を表す複数のn次伸長記録タグが並行して解析される、例174に記載の方法。
例176.前記核酸配列決定法が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、例174または175に記載の方法。
例177.前記核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したDNAのダイレクトイメージングである、例174または175に記載の方法。
例1’.(a)各タンパク質に記録タグが直接または間接的に付随しているタンパク質のセットを薬剤のライブラリーと接触させるステップであって、各薬剤が(i)小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマー(例えば、DNAアプタマーなどの核酸アプタマー、もしくはペプチドアプタマー)、および(ii)前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖またはアプタマーに関する識別情報を含むコーディングタグを含み、各タンパク質および/もしくはそれに付随する記録タグ、または各薬剤が、支持体に直接または間接的に固定化されている、ステップと;(b)(i)1つまたは複数の薬剤の前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーと結合および/または反応する各タンパク質に付随する前記記録タグと(ii)前記1つまたは複数の薬剤のコーディングタグとの間の情報の移行を可能にして、伸長記録タグおよび/または伸長コーディングタグを生成するステップと;(c)前記伸長記録タグおよび/または前記伸長コーディングタグを解析するステップとを含む方法。
例2’.各タンパク質と他のタンパク質との間に前記支持体上で平均距離約20nmに等しいもしくはそれより長い、約50nmに等しいもしくはそれより長い、約100nmに等しいもしくはそれより長い、約150nmに等しいもしくはそれより長い、約200nmに等しいもしくはそれより長い、約250nmに等しいもしくはそれより長い、約300nmに等しいもしくはそれより長い、約350nmに等しいもしくはそれより長い、約400nmに等しいもしくはそれより長い、約450nmに等しいもしくはそれより長い、約500nmに等しいもしくはそれより長い、約550nmに等しいもしくはそれより長い、約600nmに等しいもしくはそれより長い、約650nmに等しいもしくはそれより長い、約700nmに等しいもしくはそれより長い、約750nmに等しいもしくはそれより長い、約800nmに等しいもしくはそれより長い、約850nmに等しいもしくはそれより長い、約900nmに等しいもしくはそれより長い、約950nmに等しいもしくはそれより長い、または約1μmに等しいもしくはそれより長い間隔をあける、例1’に記載の方法。
例3’.各タンパク質およびそれに付随する記録タグと他のタンパク質およびそれらに付随する記録タグとの間に前記支持体上で平均距離約20nmに等しいもしくはそれより長い、約50nmに等しいもしくはそれより長い、約100nmに等しいもしくはそれより長い、約150nmに等しいもしくはそれより長い、約200nmに等しいもしくはそれより長い、約250nmに等しいもしくはそれより長い、約300nmに等しいもしくはそれより長い、約350nmに等しいもしくはそれより長い、約400nmに等しいもしくはそれより長い、約450nmに等しいもしくはそれより長い、約500nmに等しいもしくはそれより長い、約550nmに等しいもしくはそれより長い、約600nmに等しいもしくはそれより長い、約650nmに等しいもしくはそれより長い、約700nmに等しいもしくはそれより長い、約750nmに等しいもしくはそれより長い、約800nmに等しいもしくはそれより長い、約850nmに等しいもしくはそれより長い、約900nmに等しいもしくはそれより長い、約950nmに等しいもしくはそれより長い、または約1μmに等しいもしくはそれより長い間隔をあける、例1’または2’に記載の方法。
例4’.前記タンパク質および/またはそれらに付随する記録タグの1つまたは複数が、前記支持体に(例えばリンカーを介して)共有結合により固定化されているか、または前記支持体に(例えば、結合対を介して)非共有結合により固定化されている、例1’~3’のいずれか1つに記載の方法。
例5’.前記タンパク質および/またはそれらに付随する記録タグのサブセットが、前記支持体に共有結合により固定化されており、その一方で前記タンパク質および/またはそれらに付随する記録タグの別サブセットが、前記支持体に非共有結合により固定化されている、例1’~4’のいずれか1つに記載の方法。
例6’.前記記録タグの1つまたは複数が、前記支持体に固定化されおり、それにより、前記付随するタンパク質が固定化されている、例1’~5’のいずれか1つに記載の方法。
例7’.前記タンパク質の1つまたは複数が、前記支持体に固定化されおり、それにより、前記付随する記録タグが固定化されている、例1’~6’のいずれか1つに記載の方法。
例8’.少なくとも1つのタンパク質が、それに付随する記録タグと共局在し、さらに、各々が独立して前記支持体に固定化されている、例1~7のいずれか1つに記載の方法。
例9’.少なくとも1つのタンパク質および/またはそれに付随する記録タグが、固定化リンカーと直接または間接的に会合し、前記固定化リンカーが、前記支持体に直接または間接的に固定化されており、それにより、前記少なくとも1つのタンパク質および/またはそれに付随する記録タグが前記支持体に固定化されている、例1’~8’のいずれか1つに記載の方法。
例10’.固定化されている記録タグの密度が、固定化されているタンパク質の密度に等しいか、またはそれより高い、例1’~9’のいずれか1つに記載の方法。
例11’.固定化されている記録タグの密度が、固定化されているタンパク質の密度の少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約6倍、少なくとも約7倍、少なくとも約8倍、少なくとも約9倍、少なくとも約10倍、少なくとも約20倍、少なくとも約50倍、少なくとも約100倍であるか、またはそれより高い、例10’に記載の方法。
例12’.各薬剤と前記支持体上に固定化されている他の薬剤との間に平均距離約20nmに等しいもしくはそれより長い、約50nmに等しいもしくはそれより長い、約100nmに等しいもしくはそれより長い、約150nmに等しいもしくはそれより長い、約200nmに等しいもしくはそれより長い、約250nmに等しいもしくはそれより長い、約300nmに等しいもしくはそれより長い、約350nmに等しいもしくはそれより長い、約400nmに等しいもしくはそれより長い、約450nmに等しいもしくはそれより長い、約500nmに等しいもしくはそれより長い、約550nmに等しいもしくはそれより長い、約600nmに等しいもしくはそれより長い、約650nmに等しいもしくはそれより長い、約700nmに等しいもしくはそれより長い、約750nmに等しいもしくはそれより長い、約800nmに等しいもしくはそれより長い、約850nmに等しいもしくはそれより長い、約900nmに等しいもしくはそれより長い、約950nmに等しいもしくはそれより長い、または約1μmに等しいもしくはそれより長い間隔をあける、例1’に記載の方法。
例13’.前記薬剤の1つまたは複数が、前記支持体に(例えばリンカーを介して)共有結合により固定化されている、または前記支持体に(例えば、結合対を介して)非共有結合により固定化されている、例12’に記載の方法。
例14’.前記薬剤のサブセットが、前記支持体に共有結合により固定化されており、その一方で前記薬剤の別サブセットが、前記支持体に非共有結合により固定化されている、例12’または13’に記載の方法。
例15’.前記薬剤の1つまたは複数について、前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーが、前記支持体に固定化されており、それにより、前記コーディングタグが固定化されている、例12’~14’のいずれか1つに記載の方法。
例16’.前記薬剤の1つまたは複数について、前記コーディングタグが前記支持体に固定化されており、それにより、前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーが固定化されている、例12’~15’のいずれか1つに記載の方法。
例17’.情報が、少なくとも1つのコーディングタグから少なくとも1つの記録タグに移行され、それにより、少なくとも1つの伸長記録タグが生成される、例1’~16’のいずれか1つに記載の方法。
例18’.情報が、少なくとも1つの記録タグから少なくとも1つのコーディングタグに移行され、それにより、少なくとも1つの伸長コーディングタグが生成される、例1’~17’のいずれか1つに記載の方法。
例19’.前記コーディングタグからの情報および前記記録タグからの情報を含む、少なくとも1つのジタグ構築物が生成される、例1’~18’のいずれか1つに記載の方法。
例20’.前記タンパク質の少なくとも1つが、2つまたはそれより多くの薬剤の前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーと結合および/または反応する、例1’~19’のいずれか1つに記載の方法。
例21’.前記伸長記録タグまたは前記伸長コーディングタグが、前記2つまたはそれより多くの薬剤の前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖またはアプタマーに関する識別情報を含む、例20’に記載の方法。
例22’.前記タンパク質の少なくとも1つに2つまたはそれより多くの記録タグが付随しており、前記2つまたはそれより多くの記録タグが、同じであってもよく、または異なっていてもよい、例1’~21’のいずれか1つに記載の方法。
例23’.前記薬剤の少なくとも1つが、2つまたはそれより多くのコーディングタグを含み、前記2つまたはそれより多くのコーディングタグが、同じであってもよく、または異なっていてもよい、例1’~22’のいずれか1つに記載の方法。
例24’.前記情報の移行が、ライゲーション(例えば、酵素的もしくは化学的ライゲーション、副子ライゲーション、粘着末端ライゲーション、ssDNAライゲーションなどの一本鎖(ss)ライゲーション、またはこれらの任意の組合せ)、ポリメラーゼ媒介反応(例えば、一本鎖核酸もしくは二本鎖核酸のプライマー伸長)、またはこれらの任意の組合せにより実現される、例1’~23’のいずれか1つに記載の方法。
例25’.前記ライゲーションおよび/またはポリメラーゼ媒介反応が、前記タンパク質と前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖またはアプタマーとの結合の占有時間または反応時間と比較して速いカイネティクスを有し、必要に応じて、前記ライゲーションおよび/またはポリメラーゼ媒介反応のための試薬が、前記タンパク質と前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖またはアプタマーとの結合または反応と同じ反応体積で存在し、さらに必要に応じて、情報移行が、同時の結合/エンコーディングステップを使用することにより、および/または前記エンコーディングステップもしくは情報書き込みステップの、前記結合性物質の解離速度を緩徐化するために低下される温度を使用することにより、果たされる、例24’に記載の方法。
例26’.各タンパク質が、個々の付着によってその記録タグと会合し、および/または各小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーが、個々の付着によってそのコーディングタグと会合する、例1’~25’のいずれか1つに記載の方法。
例27’.前記付着が、リボソームまたはmRNA/cDNAディスプレイによって行われ、この場合、前記記録タグおよび/またはコーディングタグ配列情報がmRNA配列に含有される、例26’に記載の方法。
例28’.前記記録タグおよび/またはコーディングタグが、前記mRNA配列の3’末端におけるユニバーサルプライマー配列、バーコード、および/またはスペーサー配列を含む、例27’に記載の方法。
例29’.前記記録タグおよび/またはコーディングタグが、その3’末端に、制限酵素消化部位をさらに含む、例28’に記載の方法。
例30’.前記タンパク質のセットが、プロテオームまたはそのサブセットであり、必要に応じて、前記タンパク質のセットが、ゲノムもしくはそのサブセットのin vitro転写、続いてのin vitro翻訳を使用して産生される、またはトランスクリプトームもしくはそのサブセットのin vitro翻訳を使用して産生される、例1’~29’のいずれか1つに記載の方法。
例31’.前記プロテオームのサブセットが、キノーム;セクレトーム;レセプトーム(例えば、GPCRome);免疫プロテオーム;栄養プロテオーム;翻訳後修飾(例えば、リン酸化、ユビキチン化、メチル化、アセチル化、グリコシル化、酸化、脂質付加および/またはニトロシル化)により定義されるプロテオームサブセット、例えば、リン酸化プロテオーム(例えば、ホスホチロシン-プロテオーム、チロシン-キノーム、およびチロシン-ホスファトーム)、グライコプロテオームなど;組織もしくは臓器、発生期または生理もしくは病的状態に関連するプロテオームサブセット;細胞プロセス、例えば、細胞周期、分化(もしくは脱分化)、細胞死、老化、細胞遊走、形質転換、または転移に関連する、プロテオームサブセット;あるいはこれらの任意の組合せを含む、例30’に記載の方法。
例32’.前記タンパク質のセットが、哺乳動物、例えばヒト、非ヒト動物、魚、無脊椎動物、節足動物、昆虫、または植物、例えば酵母、細菌、例えばE.Coli、ウイルス、例えばHIVもしくはHCV、またはこれらの組合せに由来する、例1’~31’のいずれか1つに記載の方法。
例33’.前記タンパク質のセットが、タンパク質複合体またはそのサブユニットを含む、例1’~32’のいずれか1つに記載の方法。
例34’.前記記録タグが、核酸、オリゴヌクレオチド、修飾オリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、もしくはモルホリノ、またはこれらの組合せを含む、例1’~33’のいずれか1つに記載の方法。
例35’.前記記録タグが、ユニバーサルプライミング部位を含む、例1’~34’のいずれか1つに記載の方法。
例36’.前記記録タグが、増幅、配列決定、またはその両方のためのプライミング部位を含み、例えば、前記ユニバーサルプライミング部位が、増幅、配列決定、またはその両方のためのプライミング部位を含む、例1’~35’のいずれか1つに記載の方法。
例37’.前記記録タグが、一意の分子識別子(UMI)を含む、例1’~36’のいずれか1つに記載の方法。
例38’.前記記録タグが、バーコードを含む、例1’~37’のいずれか1つに記載の方法。
例39’.前記記録タグが、その3’末端にスペーサーを含む、例1’~38’のいずれか1つに記載の方法。
例40’.前記支持体が、固体支持体、例えば、剛性固体支持体、可撓性固体支持体、または軟質固体支持体であり、多孔質支持体または非多孔質支持体を含む、例1’~39’のいずれか1つに記載の方法。
例41’.前記支持体が、ビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、スピン干渉ディスク、膜、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子(例えば、磁気ナノ粒子(Fe)、金ナノ粒子および/もしくは銀ナノ粒子などの、金属を含む)、量子ドット、ナノシェル、ナノケージ、マイクロスフェア、またはこれらの任意の組合せを含む、例1’~40’のいずれか1つに記載の方法。
例42’.前記支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、ガラスビーズ、もしくは制御ポアビーズ、またはこれらの任意の組合せを含む、例41’に記載の方法。
例43’.小分子-タンパク質結合マトリックス、および/またはペプチド/ペプチドの模倣物-タンパク質結合マトリックス、および/またはペプチド模倣物-タンパク質結合マトリックス(例えば、ペプトイド-タンパク質結合マトリックス、β-ペプチド-タンパク質結合マトリックス、もしくはD-ペプチドペプチド模倣物-タンパク質結合マトリックス)、および/または多糖-タンパク質結合マトリックス、および/またはアプタマー-タンパク質結合マトリックスを創出するために、前記タンパク質のセットと、小分子および/またはペプチドもしくはペプチドの模倣物および/またはペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)および/または多糖および/またはアプタマーのライブラリーとの間の相互作用を並列解析するための、例1’~42’のいずれか1つに記載の方法。
例44’.前記マトリックスのサイズが、約10、約10、約10、約10、約10、約10、約10、約10、約1010、約1011、約1012、約1013、約1014のまたはそれより大きい、例えば、約2×1013のサイズである、例43’に記載の方法。
例45’.前記コーディングタグが、核酸、オリゴヌクレオチド、修飾オリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、もしくはモルホリノ、またはこれらの組合せを含む、例1’~44’のいずれか1つに記載の方法。
例46’.前記コーディングタグが、前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーを識別するエンコーダー配列を含む、例1’~45’のいずれか1つに記載の方法。
例47’.前記コーディングタグが、スペーサー、一意の分子識別子(UMI)、ユニバーサルプライミング部位、またはこれらの任意の組合せを含む、例1’~46’のいずれか1つに記載の方法。
例48’.前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーと、前記コーディングタグが、リンカーまたは結合対により接合されている、例1’~47’のいずれか1つに記載の方法。
例49’.前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーと、前記コーディングタグが、SpyTag-KTag/SpyLigase(この場合、接合される2つの部分がSpyTag/KTag対を有し、SpyLigaseがSpyTagをKTagに接合させ、かくして2つの部分が接合される)、SpyTag/SpyCatcher、SnoopTag/SnoopCatcherペプチド-タンパク質対、ソルターゼ、もしくはHaloTag/HaloTagリガンド対、またはこれらの任意の組合せによって接合されている、例1’~48’のいずれか1つに記載の方法。
例50’.ポリペプチドを解析するための方法であって、(a)(i)各断片に記録タグが直接または間接的に付随しているポリペプチドの断片のセットを(ii)各結合性物質が結合性部分および前記結合性部分に関する識別情報を含むコーディングタグを含む結合性物質のライブラリーと接触させるステップであって、前記結合性部分が、前記断片の1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することができ、または官能化試薬により修飾された前記1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することができ、各断片および/もしくはそれに付随する記録タグ、または各結合性物質が、支持体に直接または間接的に固定化されている、ステップと;(b)(i)各断片に付随する前記記録タグと(ii)前記コーディングタグとの間の情報の移行を、前記結合性部分と前記断片の1つまたは複数のN末端、内部またはC末端アミノ酸との結合時に可能にして、伸長記録タグおよび/または伸長コーディングタグを生成するステップと、(c)前記伸長記録タグおよび/または前記伸長コーディングタグを解析するステップとを含む方法。
例51’.前記1つまたは複数のN末端、内部またはC末端アミノ酸が、(i)N末端アミノ酸(NTAA)、(ii)N末端ジペプチド配列、(iii)N末端トリペプチド配列;(iv)内部アミノ酸;(v)内部ジペプチド配列;(vi)内部トリペプチド配列;(vii)C末端アミノ酸(CTAA);(viii)C末端ジペプチド配列;もしくは(ix)C末端トリペプチド配列、またはこれらの任意の組合せを含み、必要に応じて、(i)~(ix)の前記アミノ酸残基の任意の1つまたは複数が、修飾または官能化されている、例50’に記載の方法。
例52’.前記1つまたは複数のN末端、内部またはC末端アミノ酸が、各残基において独立して、アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リシン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、トレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)からなる群から、これらの任意の組合せで、選択される、例51’に記載の方法。
例53’.前記結合性部分が、ポリペプチドまたはその断片、タンパク質もしくはポリペプチド鎖またはその断片、あるいはタンパク質複合体またはそのサブユニット、例えば、抗体またはその抗原結合断片を含む、例50’~52’のいずれか1つに記載の方法。
例54’.前記結合性部分が、アンチカリンまたはそのバリアント、変異体もしくは修飾タンパク質;アミノアシルtRNA合成酵素またはそのバリアント、変異体もしくは修飾タンパク質;アンチカリンまたはそのバリアント、変異体もしくは修飾タンパク質;ClpSまたはそのバリアント、変異体もしくは修飾タンパク質;UBRボックスタンパク質またはそのバリアント、変異体もしくは修飾タンパク質;あるいはアミノ酸に結合する修飾小分子、すなわちバンコマイシンまたはそのバリアント、変異体もしくは修飾分子;あるいはこれらの任意の組合せを含む、例50’~53’のいずれか1つに記載の方法。
例55’.前記結合性部分が、官能化N末端アミノ酸(NTAA)、N末端ジペプチド配列、もしくはN末端トリペプチド配列、またはこれらの任意の組合せに選択的におよび/または特異的に結合することが可能である、例50’~54’のいずれか1つに記載の方法。
例56’.複数のポリペプチドを解析するための方法であって、(a)複数のポリペプチドの各分子を複数のユニバーサルタグで標識するステップと;(b)前記複数のポリペプチドと複数のコンパートメントタグとを、前記複数のユニバーサルタグと前記複数のコンパートメントタグとのアニーリングまたは接合に好適な条件下で接触させることによって、前記複数のポリペプチドを複数のコンパートメント(例えば、ビーズ表面、マイクロ流体液滴、マイクロウェル、または表面上の分離された領域、またはこれらの任意の組合せ)に分配するステップであって、前記複数のコンパートメントタグが、各コンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、ステップと;(c)各コンパートメント内の前記ポリペプチドを断片化することによって、少なくとも1つのユニバーサルポリヌクレオチドタグと少なくとも1つのコンパートメントタグとを含む記録タグが各々に付随しているポリペプチド断片のセットを生成するステップと;(d)前記ポリペプチド断片のセットを支持体に直接または間接的に固定化するステップと;(e)固定化されたポリペプチド断片のセットを、各結合性物質が結合性部分および前記結合性部分に関する識別情報を含むコーディングタグを含む結合性物質のライブラリーと接触させるステップであって、前記結合性部分が、前記断片の1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、または官能化試薬により修飾された前記1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、ステップと;(f)(i)各断片に付随する前記記録タグと(ii)前記コーディングタグとの間の情報の移行を、前記結合性部分と前記断片の1つまたは複数のN末端、内部またはC末端アミノ酸との結合時に可能にして、伸長記録タグおよび/または伸長コーディングタグを生成するステップと;(g)前記伸長記録タグおよび/または前記伸長コーディングタグを解析するステップとを含む方法。
例57’.同じコンパートメントタグを有する前記複数のポリペプチドが、同じタンパク質に属する、例56’に記載の方法。
例58’.前記同じコンパートメントタグを有する複数のポリペプチドが、異なるタンパク質、例えば、2、3、4、5、6、7、8、9、10、またはそれより多くのタンパク質に属する、例56’に記載の方法。
例59’.前記複数のコンパートメントタグが、各基板がコンパートメントを規定している、複数の基板に固定化されている、例56’~58’のいずれか1つに記載の方法。
例60’.前記複数の基板が、ビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、スピン干渉ディスク、膜、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子(例えば、磁気ナノ粒子(Fe)、金ナノ粒子および/もしくは銀ナノ粒子などの、金属を含む)、量子ドット、ナノシェル、ナノケージ、マイクロスフェア、またはこれらの任意の組合せからなる群から選択される、例59’に記載の方法。
例61’.前記複数の基板の各々が、バーコード付きビーズ、例えば、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、ガラスビーズ、もしくは制御ポアビーズ、またはこれらの任意の組合せなどの、バーコード付き粒子を含む、例59’または60’に記載の方法。
例62’.前記支持体が、ビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、スピン干渉ディスク、膜、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子(例えば、磁気ナノ粒子(Fe)、金ナノ粒子および/もしくは銀ナノ粒子などの、金属を含む)、量子ドット、ナノシェル、ナノケージ、マイクロスフェア、またはこれらの任意の組合せからなる群から選択される、例59’~61’のいずれか1つに記載の方法。
例63’.前記支持体が、シーケンシングビーズ、例えば、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、ガラスビーズ、もしくは制御ポアビーズ、またはこれらの任意の組合せを含む、例62’に記載の方法。
例64’.各断片およびそれに付随する記録タグと他の断片およびそれらに付随する記録タグとの間に前記支持体上で平均距離約20nmに等しいもしくはそれより長い、約50nmに等しいもしくはそれより長い、約100nmに等しいもしくはそれより長い、約150nmに等しいもしくはそれより長い、約200nmに等しいもしくはそれより長い、約250nmに等しいもしくはそれより長い、約300nmに等しいもしくはそれより長い、約350nmに等しいもしくはそれより長い、約400nmに等しいもしくはそれより長い、約450nmに等しいもしくはそれより長い、約500nmに等しいもしくはそれより長い、約550nmに等しいもしくはそれより長い、約600nmに等しいもしくはそれより長い、約650nmに等しいもしくはそれより長い、約700nmに等しいもしくはそれより長い、約750nmに等しいもしくはそれより長い、約800nmに等しいもしくはそれより長い、約850nmに等しいもしくはそれより長い、約900nmに等しいもしくはそれより長い、約950nmに等しいもしくはそれより長い、または約1μmに等しいもしくはそれより長い間隔をあける、例56’~63’のいずれか1つに記載の方法。
例65’.複数のポリペプチドを解析するための方法であって、(a)各基板がコンパートメントタグを各々が含む複数の記録タグを含み、必要に応じて、各コンパートメントがビーズ、マイクロ流体液滴、マイクロウェル、もしくは表面上の分離された領域、またはこれらの任意の組合せである、複数の基板に複数のポリペプチドを固定化するステップと;
(b)各基板上に固定化された前記ポリペプチドを(例えば、プロテアーゼ消化により)断片化することによって、基板に固定化されたポリペプチド断片のセットを生成するステップと;(c)前記固定化されたポリペプチド断片のセットを、各結合性物質が結合性部分および前記結合性部分に関する識別情報を含むコーディングタグを含む結合性物質のライブラリーと接触させるステップであって、前記結合性部分が、前記断片の1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、または官能化試薬により修飾された前記1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、ステップと;(d)(i)前記記録タグと(ii)前記コーディングタグとの間の情報の移行を、前記結合性部分と各断片の1つまたは複数のN末端、内部またはC末端アミノ酸との結合時に可能にして、伸長記録タグおよび/または伸長コーディングタグを生成するステップと;(e)前記伸長記録タグおよび/または前記伸長コーディングタグを解析するステップとを含む方法。
例66’.同じコンパートメントタグを有する前記複数のポリペプチドが、同じタンパク質に属する、例65’に記載の方法。
例67’.前記同じコンパートメントタグを有する複数のポリペプチドが、異なるタンパク質、例えば、2、3、4、5、6、7、8、9、10、またはそれより多くのタンパク質に属する、例65’に記載の方法。
例68’.各基板が、コンパートメントを規定する、例65’~67’のいずれか1つに記載の方法。
例69’.前記複数の基板が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、スピン干渉ディスク、膜、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子(例えば、磁気ナノ粒子(Fe)、金ナノ粒子および/もしくは銀ナノ粒子などの、金属を含む)、量子ドット、ナノシェル、ナノケージ、マイクロスフェア、またはこれらの任意の組合せからなる群から選択される、例65’~68’のいずれか1つに記載の方法。
例70’.前記複数の基板の各々が、バーコード付きビーズ、例えば、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、ガラスビーズ、もしくは制御ポアビーズ、またはこれらの任意の組合せなどの、バーコード付き粒子を含む、例65’~69’のいずれか1つに記載の方法。
例71’.前記官能化試薬が、化学薬剤、酵素および/または生物学的薬剤、例えば、イソチオシアネート誘導体、2,4-ジニトロベンゼンスルホン酸(DNBS)、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)1-フルオロ-2,4-ジニトロベンゼン、ダンシルクロリド、7-メトキシクマリン酢酸、チオアシル化試薬、チオアセチル化試薬、またはチオベンジル化試薬を含む、例50’~70’のいずれか1つに記載の方法。
例72’.前記記録タグが、核酸、オリゴヌクレオチド、修飾オリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、もしくはモルホリノ、またはこれらの組合せを含む、例50’~71’のいずれか1つに記載の方法。
例73’.前記記録タグが、ユニバーサルプライミング部位;増幅、配列決定もしくはその両方のためのプライミング部位;必要に応じて、一意の分子識別子(UMI):バーコード;必要に応じて、その3’末端にスペーサー;またはこれらの組合せを含む、例50’~72’のいずれか1つに記載の方法。
例74’.前記ポリペプチドまたは複数のポリペプチドの配列を決定するためのものである、例50’~73’のいずれか1つに記載の方法。
例75’.前記コーディングタグが、核酸、オリゴヌクレオチド、修飾オリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、もしくはモルホリノ、またはこれらの組合せを含む、例50’~74’のいずれか1つに記載の方法。
例76’.前記コーディングタグが、エンコーダー配列、必要に応じたスペーサー、必要に応じた一意の分子識別子(UMI)、ユニバーサルプライミング部位、またはこれらの任意の組合せを含む、例50’~75’のいずれか1つに記載の方法。
例77’.前記結合性部分および前記コーディングタグが、リンカーまたは結合対によって接合されている、例50’~76’のいずれか1つに記載の方法。
例78’.前記結合性部分と前記コーディングタグが、SpyTag-KTag/SpyLigase(この場合、接合される2つの部分がSpyTag/KTag対を有し、SpyLigaseがSpyTagをKTagに接合させ、かくして2つの部分が接合される)、SpyTag/SpyCatcher、SnoopTag/SnoopCatcherペプチド-タンパク質対、ソルターゼ、もしくはHaloTag/HaloTagリガンド対、またはこれらの任意の組合せによって接合されている、例50’~77’のいずれか1つに記載の方法。
例79’.前記コーディングタグおよび/または前記記録タグが、1つもしくは複数のエラー訂正コード、1つもしくは複数のエンコーダー配列、1つもしくは複数のバーコード、1つもしくは複数のUMI、1つもしくは複数のコンパートメントタグ、またはこれらの任意の組合せを含む、例1’~78’のいずれか1つに記載の方法。
例80’.前記エラー訂正コードが、Hammingコード、Lee距離コード、非対称Lee距離コード、Reed-Solomonコード、およびLevenshtein-Tenengoltsコードから選択される、例79’に記載の方法。
例81’.前記伸長記録タグおよび/または伸長コーディングタグの解析が、核酸配列解析を含む、例1’~80’のいずれか1つに記載の方法。
例82’.前記核酸配列解析が、核酸配列決定法、例えば、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、もしくはパイロシーケンシング、またはこれらの任意の組合せを含む、例81’に記載の方法。
例83’.前記核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したDNAのダイレクトイメージングである、例82’に記載の方法。
例84’.1または複数の洗浄ステップをさらに含む、例1’~83’のいずれか1つに記載の方法。
例85’.前記伸長記録タグおよび/または伸長コーディングタグが、解析前に増幅される、例1’~84’のいずれか1つに記載の方法。
例86’.前記伸長記録タグおよび/または伸長コーディングタグが、解析前に標的濃縮アッセイされる、例1’~85’のいずれか1つに記載の方法。
例87’.前記伸長記録タグおよび/または伸長コーディングタグが、解析前にサブトラクションアッセイされる、例1’~86’のいずれか1つに記載の方法。
一態様では、(a)各薬剤が(i)小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖および/またはアプタマーと(ii)前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖またはアプタマーに関する識別情報を含むコーディングタグとを含む、薬剤のライブラリーと;必要に応じて(b)各タンパク質に記録タグが直接または間接的に付随している、タンパク質のセットとを含むキットであって、各タンパク質および/もしくはそれに付随する記録タグ、または各薬剤が、支持体に直接または間接的に固定化されており、前記タンパク質のセット、前記記録タグ、および前記薬剤のライブラリーが、(i)1つまたは複数の薬剤の前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーと結合および/または反応する各タンパク質に付随する前記記録タグと(ii)前記1つまたは複数の薬剤のコーディングタグとの間の情報の移行を可能にして、伸長記録タグおよび/または伸長コーディングタグを生成するように構成されている、キットが、本明細書で開示される。
一態様では、ポリペプチドを解析するためのキットであって、(a)各結合性物質が、結合性部分、および前記結合性部分に関する識別情報を含むコーディングタグを含み、前記結合性部分が、断片の1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、または官能化試薬により修飾された前記1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、結合性物質のライブラリーと;必要に応じて、(b)各断片が記録タグに直接もしくは間接的に付随しているポリペプチドの断片のセット、または(b’)ポリペプチドを断片化するための手段、例えばプロテアーゼとを含み、各断片および/もしくはそれに付随する記録タグ、または各結合性物質が、支持体に直接または間接的に固定化されており、前記ポリペプチドの断片のセット、前記記録タグ、および前記結合性物質のライブラリーが、(i)各断片に付随する前記記録タグと(ii)前記コーディングタグとの間の情報の移行を、前記結合性部分と前記断片の1つまたは複数のN末端、内部またはC末端アミノ酸との結合時に可能にして、伸長記録タグおよび/または伸長コーディングタグを生成するように構成されている、キットが、本明細書で開示される。
一態様では、複数のポリペプチドを解析するためのキットであって、(a)各結合性物質が、結合性部分、および前記結合性部分に関する識別情報を含むコーディングタグを含み、前記結合性部分が、断片の1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、または官能化試薬により修飾された前記1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、結合性物質のライブラリーと;(b)複数のポリペプチドが必要に応じて固定化されている複数の基板であって、各基板が、コンパートメントタグを各々が含む複数の記録タグを含み、必要に応じて、各コンパートメントが、ビーズ、マイクロ流体液滴、マイクロウェル、もしくは表面上の分離された領域、またはこれらの任意の組合せであり、各基板上に固定化された前記ポリペプチドが、(例えば、プロテアーゼ切断により)断片化されて前記基板に固定化されたポリペプチド断片のセットを生成するように構成されている、複数の基板とを含む、キットであり;前記複数のポリペプチド、前記記録タグ、および前記結合性物質のライブラリーが、(i)前記記録タグと(ii)前記コーディングタグとの間の情報の移行を、前記結合性部分と前記各断片の1つまたは複数のN末端、内部またはC末端アミノ酸との結合時に可能にして、伸長記録タグおよび/または伸長コーディングタグを生成するように構成されている、キットが、本明細書で開示される。
以下の態様は、本開示のさらなる実例を提供するものである。
態様1.ポリペプチドを解析するための方法であって、(a)記録タグが必要に応じて直接または間接的に付随しているポリペプチドを提供するステップと;(b)前記ポリペプチドのN末端アミノ酸(NTAA)を化学試薬で官能化するステップであって、前記化学試薬が、
(i)式(I)の化合物:
Figure 0007390027000001
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、シクロアルキル、-C(O)R、-C(O)OR、または-S(O)であり;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されており;
は、ヘテロアリール、-NRC(O)OR、または-SRであり、ここでのヘテロアリールは、非置換であるか、または置換されており;
、R、およびRは、各々独立して、HまたはC1~6アルキルであり;ならびに
必要に応じて、R
Figure 0007390027000002
であるときにはRおよびRは両方ともHでない);
(ii)式(II)の化合物:
Figure 0007390027000003
またはその塩もしくはコンジュゲート
(式中、
は、H、C1~6アルキル、シクロアルキル、-C(O)R、または-C(O)ORであり;
は、H、C1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、またはアリールアルキルであり、ここでのC1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、およびアリールアルキルは、各々、非置換であるか、または置換されている);
(iii)式(III)の化合物:
-N=C=S (III)
またはその塩もしくはコンジュゲート
(式中、
は、C1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールであり;
ここでのC1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールは、各々、非置換であるか、またはハロ、-NR、-S(O)、もしくはヘテロシクリルからなる群から選択される1つもしくは複数の基で置換されており;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されている);
(iv)式(IV)の化合物:
Figure 0007390027000004
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、-CO1~4アルキル、-OR、アリール、またはシクロアルキルであり、ここでのC1~6アルキル、-CO1~4アルキル、-OR、アリール、およびシクロアルキルは、各々、非置換であるか、または置換されており;
は、H、C1~6アルキル、またはヘテロシクリルであり、ここでのC1~6アルキルおよびヘテロシクリルは、各々、非置換であるか、または置換されている);
(v)式(V)の化合物:
Figure 0007390027000005
またはその塩もしくはコンジュゲート
(式中、
は、ハロまたは-ORであり;
は、H、C1~6アルキル、またはヘテロシクリルであり;
は、水素、ハロ、またはC1~6ハロアルキルである);
(vi)式(VI)の金属錯体:
ML (VI)
またはその塩もしくはコンジュゲート
(式中、
Mは、Co、Cu、Pd、Pt、Zn、およびNiからなる群から選択される金属であり;
Lは、-OH、-OH、2,2’-ビピリジン(bpy)、1,5ジチアシクロオクタン(dtco)、1,2-ビス(ジフェニルホスフィノ)エタン(dppe)、エチレンジアミン(en)、およびトリエチレンテトラミン(trien)からなる群から選択される配位子であり;
nは、1および8を含む、1~8の整数であり;
各Lは、同じであってもよく、または異なっていてもよい);および
(vii)式(VII)の化合物:
Figure 0007390027000006
またはその塩もしくはコンジュゲート
(式中、
は、N、NR13、またはCR1314であり;
は、NまたはCHであり;
pは、0または1であり;
10、R11、R12、R13、およびR14は、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンからなる群から選択され、ここでのC1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミンおよびC1~6アルキルヒドロキシルアミンは、各々、非置換であるか、または置換されており、ならびにR10およびR11は、必要に応じて、一緒になって環を形成していることもあり;
15は、HまたはOHである)
からなる群から選択される化合物を含む、ステップと;
(c)前記ポリペプチドを、前記官能化NTAAに結合することが可能な第1の結合性部分および
(c1)前記第1の結合性部分に関する識別情報を有する第1のコーディングタグまたは
(c2)第1の検出可能な標識
を含む第1の結合性物質と、接触させるステップと;
(d)(d1)前記第1のコーディングタグの情報を前記記録タグに移行させて、伸長記録タグを生成し、前記伸長記録タグを解析するステップ、または
(d2)前記第1の検出可能な標識を検出するステップと;
を含み;
ステップ(b)が、ステップ(c)の前に行われるか、ステップ(c)後かつステップ(d)の前に行われるか、またはステップ(d)の後に行われる、方法。
一部の実施形態では、この配列決定法は、「エドマン様」N末端アミノ酸分解プロセスを利用する。エドマン様分解は、2つの重要なステップ:1)前記ペプチドの前記NTAAの□-アミンの官能化、および2)官能化されたNTAAの消去からなる。本明細書に記載の、標準的エドマン官能化化学、およびエドマン様官能化化学は、N末端プロリン残基のより不良な官能化および消去を示す。しかるが故に、N末端プロリンの存在は、周期的な配列決定反応の「ストール」につながることがある。それ故、本明細書に記載の方法の一部の実施形態では、N末端プロリンだけを特異的に切断するプロリンアミノペプチダーゼ(プロリンイミノペプチダーゼ)に標的ポリペプチドを曝露することにより各エドマン様分解サイクルの開始時に一切のN末端プロリンを除去することが有益である。したがって、一部の実施形態では、本明細書に記載の方法およびアッセイの各々は、分析されるポリペプチドをプロリンアミノペプチダーゼと接触させる追加のステップを必要に応じて含むことができる。同様に、これらの方法を実施するためのキットは、必要に応じて、少なくとも1つのプロリンアミノペプチダーゼを含むことができる。
この目的に使用することができるいくつかのプロリンアミノペプチダーゼ(PAP)が、文献で公知である。好ましい実施形態では、小さい単量体PAP(約25~35kDa)が、NTAAプロリンの除去に利用される。本明細書に記載の方法およびキットでの使用に好適な単量体PAPは、B.coagulans、L.delbrueckii、N.gonorrhoeae、F.meningosepticum、S.marcescens、T.acidophilum、およびL.plantarumからのファミリーメンバーを含む(MEROPS S33.001)(Nakajima, Ito et al. 2006)(Kitazono, Yoshimoto et al. 1992)。好適な多量体PAPも公知であり、D.hanseniiからの酵素(Bolumar,Sanz et al. 2003)を含む。ネイティブなPAPまたは操作されたPAPのどちらかを利用することができる。プロリン残基を欠く本明細書における方法およびアッセイにより生成されるペプチド配列の有効なマッピングは、ペプチド読み取りデータを「プロリンマイナス」プロテオームにマッピングし戻すことにより実現することができる。バイオインフォマティクスレベルでは、本質的に、これは、20ではなく19アミノ酸残基で構成されているタンパク質に変わる。
あるいは、プロリン情報を保持するために、プロリン除去前および除去後に2ステップの結合を利用してプロリン残基の検出を可能にすることができるが、これには、配列決定サイクルごとに余分な結合/エンコーディングサイクルの余分なコストがかかる。さらに、エドマン様化学をR基特異的アミノペプチダーゼと組み合わせるこの概念を使用して、NTF/NTEが困難な任意のアミノ酸を除去することができるが、好ましい実施形態では、単一の困難なアミノ残基、典型的にはプロリン、のみが、アミノペプチダーゼにより除去される。多数の残基の除去は、除去される配列の組合せ激増につながる(すなわち、PおよびWの除去は、Pの実行、Wの実行、およびPとWの実行での配列の除去につながる)。
態様2.ステップ(a)が、支持体(例えば、固体支持体)に接合されている前記ポリペプチドおよび付随する記録タグを提供することを含む、態様1に記載の方法。
態様3.ステップ(a)が、溶液中の付随する記録タグに接合されている前記ポリペプチドを提供することを含む、態様1に記載の方法。
態様4.ステップ(a)が、記録タグが間接的に付随する前記ポリペプチドを提供することを含む、態様1に記載の方法。
態様5.ステップ(a)では前記ポリペプチドに記録タグが付随していない、態様1に記載の方法。
態様6.ステップ(b)が、ステップ(c)の前に行われる、態様1~5のいずれか1つに記載の方法。
態様7.ステップ(b)が、ステップ(c)の後かつステップ(d)の前に行われる、態様1~5のいずれか1つに記載の方法。
態様8.ステップ(b)が、ステップ(c)とステップ(d)の両方の後に行われる、態様1~5のいずれか1つに記載の方法。
態様9.ステップ(a)、(b)、(c1)および(d1)を逐次的に行う、態様1~5のいずれか1つに記載の方法。
態様10.ステップ(a)、(c1)、(b)、および(d1)を逐次的に行う、態様1~5のいずれか1つに記載の方法。
態様11.ステップ(a)、(c1)、(d1)、および(b)を逐次的に行う、態様1~5のいずれか1つに記載の方法。
態様12.ステップ(a)、(b)、(c2)および(d2)を逐次的に行う、態様1~5のいずれか1つに記載の方法。
態様13.ステップ(a)、(c2)、(b)、および(d2)を逐次的に行う、態様1~5のいずれか1つに記載の方法。
態様14.ステップ(a)、(c2)、(d2)、および(b)を逐次的に行う、態様1~5のいずれか1つに記載の方法。
態様15.ステップ(c)が、前記ポリペプチドを、ステップ(b)の官能化NTAA以外の官能化NTAAに結合することが可能な第2の(またはより高次の)結合性部分を含む第2の(またはより高次の)結合性物質、および前記第2の(またはより高次の)結合性物質に関する識別情報を有するコーディングタグと接触させることをさらに含む、態様1~14のいずれか1つに記載の方法。
態様16.前記ポリペプチドの前記第2の(またはより高次の)結合性物質との接触が、前記ポリペプチドの前記第1の結合性物質との接触後に逐次的に行われる、態様15に記載の方法。
態様17.前記ポリペプチドの前記第2の(またはより高次の)結合性物質との接触が、前記ポリペプチドの前記第1の結合性物質との接触と同時に行われる、態様15に記載の方法。
態様18.ポリペプチドを解析するための方法であって、
(a)記録タグが必要に応じて直接または間接的に付随しているポリペプチドを提供するステップと;
(b)前記ポリペプチドのN末端アミノ酸(NTAA)を化学試薬で官能化して官能化NTAAを得るステップであって、前記化学試薬が、
(i)式(I)の化合物:
Figure 0007390027000007
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、シクロアルキル、-C(O)R、-C(O)OR、または-S(O)であり;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されており;
は、ヘテロアリール、-NRC(O)OR、または-SRであり、ここでのヘテロアリールは、非置換であるか、または置換されており;
、R、およびRは、各々独立して、HまたはC1~6アルキルであり;ならびに
必要に応じて、R
Figure 0007390027000008
であるときにはRおよびRは両方ともHでない);
(ii)式(II)の化合物:
Figure 0007390027000009
またはその塩もしくはコンジュゲート
(式中、
は、H、C1~6アルキル、シクロアルキル、-C(O)R、または-C(O)ORであり;
は、H、C1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、またはアリールアルキルであり、ここでのC1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、およびアリールアルキルは、各々、非置換であるか、または置換されている);
(iii)式(III)の化合物:
-N=C=S (III)
またはその塩もしくはコンジュゲート
(式中、
は、C1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールであり;
ここでのC1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、またはハロ、-NR、-S(O)、もしくはヘテロシクリルからなる群から選択される1つもしくは複数の基で置換されており;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されている);
(iv)式(IV)の化合物:
Figure 0007390027000010
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、-CO1~4アルキル、-OR、アリール、またはシクロアルキルであり、ここでのC1~6アルキル、-CO1~4アルキル、-OR、アリール、およびシクロアルキルは、各々、非置換であるか、または置換されており;
は、H、C1~6アルキル、またはヘテロシクリルであり、ここでのC1~6アルキルおよびヘテロシクリルは、各々、非置換であるか、または置換されている);
(v)式(V)の化合物:
Figure 0007390027000011
またはその塩もしくはコンジュゲート
(式中、
は、ハロまたは-ORであり;
は、H、C1~6アルキル、またはヘテロシクリルであり;
は、水素、ハロ、またはC1~6ハロアルキルである);
(vi)式(VI)の金属錯体:
ML (VI)
またはその塩もしくはコンジュゲート
(式中、
Mは、Co、Cu、Pd、Pt、Zn、およびNiからなる群から選択される金属であり;
Lは、-OH、-OH、2,2’-ビピリジン(bpy)、1,5ジチアシクロオクタン(dtco)、1,2-ビス(ジフェニルホスフィノ)エタン(dppe)、エチレンジアミン(en)、およびトリエチレンテトラミン(trien)からなる群から選択される配位子であり;
nは、1および8を含む、1~8の整数であり;
各Lは、同じであってもよく、または異なっていてもよい);および
(vii)式(VII)の化合物:
Figure 0007390027000012
またはその塩もしくはコンジュゲート
(式中、
は、N、NR13、またはCR1314であり;
は、NまたはCHであり;
pは、0または1であり;
10、R11、R12、R13、およびR14は、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンからなる群から選択され、ここでのC1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミンおよびC1~6アルキルヒドロキシルアミンは、各々、非置換であるか、または置換されており、ならびにR10およびR11は、必要に応じて、一緒になって環を形成していることもあり;
15は、HまたはOHである)
からなる群から選択される化合物を含む、ステップと;
(c)前記ポリペプチドを、前記官能化NTAAに結合することが可能な第1の結合性部分および(c1)第1の結合性物質に関する識別情報を有する第1のコーディングタグまたは(c2)第1の検出可能な標識を含む前記第1の結合性物質と、接触させるステップと;
(d)(d1)前記第1のコーディングタグの情報を前記記録タグに移行させて、第1の伸長記録タグを生成し、前記伸長記録タグを解析するステップ、または
(d2)前記第1の検出可能な標識を検出するステップと;
(e)前記官能化NTAAを消去して新しいNTAAを露出させるステップと
を含み;
ステップ(b)が、ステップ(c)の前に行われるか、ステップ(c)の後かつステップ(d)の前に行われるか、またはステップ(d)の後に行われる、方法。
本明細書で開示される方法およびキットのいずれかで使用するための式(I)の化合物の一部の実施形態では、Rは、単環式ヘテロアリール基である。式(I)の一部の実施形態では、Rは、5員または6員単環式ヘテロアリール基である。式(I)の一部の実施形態では、Rは、1つまたは複数のNを含有する5員または6員単環式ヘテロアリール基である。好ましくは、Rは、ピラゾール、イミダゾール、トリアゾールおよびテトラゾールから選択され、前記ピラゾール、イミダゾール、トリアゾールまたはテトラゾール環の窒素原子を介して式(I)のアミジンに連結されており、Rは、ハロ、C1~3アルキル、C1~3ハロアルキル、およびニトロから選択される基により、必要に応じて置換されている。一部の実施形態では、Rは、
Figure 0007390027000013
(式中、Gは、N、CH、またはCXであり、ここでのXは、ハロ、C1~3アルキル、C1~3ハロアルキル、またはニトロである)
である。一部の実施形態では、Rは、
Figure 0007390027000014
であるか、またはここでのXは、Me、F、Cl、CF、もしくはNOである。一部の実施形態では、Rは、
Figure 0007390027000015
(式中、Gは、NまたはCHである)である。一部の実施形態では、Rは、
Figure 0007390027000016
である。一部の実施形態では、Rは、二環式ヘテロアリール基である。一部の実施形態では、Rは、9員または10員二環式ヘテロアリール基である。一部の実施形態では、Rは、
Figure 0007390027000017
である。
態様19.ステップ(a)が、支持体(例えば、固体支持体)に接合されている前記ポリペプチドおよび付随する記録タグを提供することを含む、態様18に記載の方法。
態様20.ステップ(a)が、溶液中の付随する記録タグに接合されている前記ポリペプチドを提供することを含む、態様18に記載の方法。
態様21.ステップ(a)が、記録タグが間接的に付随する前記ポリペプチドを提供することを含む、態様18に記載の方法。
態様22.ステップ(a)では前記ポリペプチドに記録タグが付随していない、態様18に記載の方法。
態様23.ステップ(b)が、ステップ(c)の前に行われる、態様18~22のいずれか1つに記載の方法。
態様24.ステップ(b)が、ステップ(c)の後かつステップ(d)の前に行われる、態様18~22のいずれか1つに記載の方法。
態様25.ステップ(b)が、ステップ(c)とステップ(d)の両方の後に行われる、態様18~22のいずれか1つに記載の方法。
態様26.ステップ(a)、(b)、(c1)および(d1)を逐次的に行う、態様18~22のいずれか1つに記載の方法。
態様27.ステップ(a)、(c1)、(b)、および(d1)を逐次的に行う、態様18~22のいずれか1つに記載の方法。
態様28.ステップ(a)、(c1)、(d1)、および(b)を逐次的に行う、態様18~22のいずれか1つに記載の方法。
態様29.ステップ(a)、(b)、(c2)および(d2)を逐次的に行う、態様18~22のいずれか1つに記載の方法。
態様30.ステップ(a)、(c2)、(b)、および(d2)を逐次的に行う、態様18~22のいずれか1つに記載の方法。
態様31.ステップ(a)、(c2)、(d2)、および(b)を逐次的に行う、態様18~22のいずれか1つに記載の方法。
態様32.(f)前記ポリペプチドの新しいNTAAを化学試薬で官能化して新しく官能化されたNTAAを得るステップと;
(g)前記ポリペプチドを、前記新しく官能化されたNTAAに結合することが可能な第2の(またはより高次の)結合性部分と(g1)前記第2の(もしくはより高次の)結合性物質に関する識別情報を有する第2のコーディングタグまたは(g2)第2の検出可能な標識とを含む第2の(またはより高次の)結合性物質と、接触させるステップと;
(h)(h1)前記第2のコーディングタグの情報を前記第1の伸長記録タグに移行させて、第2の伸長記録タグを生成し、前記第2の伸長記録タグを解析するステップ、または
(h2)前記第2の検出可能な標識を検出するステップと;
(i)前記官能化NTAAを消去して新しいNTAAを露出させるステップと
をさらに含み;
ステップ(f)が、ステップ(g)の前に行われるか、ステップ(g)後かつステップ(h)の前に行われるか、またはステップ(h)の後に行われる、態様18~31のいずれか1つに記載の方法。
態様1~32のいずれかでは、方法は、前記ポリペプチドとプロリンアミノペプチダーゼとを、存在する一切のN末端プロリンを切断するのに好適な条件下で、通常は列挙されている方法ステップの前に、接触させるステップを、必要に応じてさらに含む。
態様33.前記化学試薬が、
(i)式(I)の化合物:
Figure 0007390027000018
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、シクロアルキル、-C(O)R、-C(O)OR、または-S(O)であり;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されており;
は、ヘテロアリール、-NRC(O)OR、または-SRであり、ここでのヘテロアリールは、非置換であるか、または置換されており;
、R、およびRは、各々独立して、HまたはC1~6アルキルであり;ならびに
必要に応じて、R
Figure 0007390027000019
であるときにはRおよびRは両方ともHでない);
(ii)式(II)の化合物:
Figure 0007390027000020
またはその塩もしくはコンジュゲート
(式中、
は、H、C1~6アルキル、シクロアルキル、-C(O)R、または-C(O)ORであり;
は、H、C1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、またはアリールアルキルであり、ここでのC1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、およびアリールアルキルは、各々、非置換であるか、または置換されている);
(iii)式(III)の化合物:
-N=C=S (III)
またはその塩もしくはコンジュゲート
(式中、
は、C1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールであり;
ここでのC1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールは、各々、非置換であるか、またはハロ、-NR、-S(O)、もしくはヘテロシクリルからなる群から選択される1つもしくは複数の基で置換されており;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されている);
(iv)式(IV)の化合物:
Figure 0007390027000021
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、-CO1~4アルキル、-OR、アリール、またはシクロアルキルであり、ここでのC1~6アルキル、-CO1~4アルキル、-OR、アリール、およびシクロアルキルは、各々、非置換であるか、または置換されており;
は、H、C1~6アルキル、またはヘテロシクリル(heterocycl)であり、ここでのC1~6アルキルおよびヘテロシクリルは、各々、非置換であるか、または置換されている);および
(v)式(V)の化合物:
Figure 0007390027000022
またはその塩もしくはコンジュゲート
(式中、
は、ハロまたは-ORであり;
は、H、C1~6アルキル、またはヘテロシクリルであり;
は、水素、ハロ、またはC1~6ハロアルキルである);および
(vi)式(VI)の金属錯体:
ML (VI)
またはその塩もしくはコンジュゲート
(式中、
Mは、Co、Cu、Pd、Pt、Zn、およびNiからなる群から選択される金属であり;
Lは、-OH、-OH、2,2’-ビピリジン(bpy)、1,5ジチアシクロオクタン(dtco)、1,2-ビス(ジフェニルホスフィノ)エタン(dppe)、エチレンジアミン(en)、およびトリエチレンテトラミン(trien)からなる群から選択される配位子であり;
nは、1および8を含む、1~8の整数であり;
各Lは、同じであってもよく、または異なっていてもよい);および
(vii)式(VII)の化合物:
Figure 0007390027000023
またはその塩もしくはコンジュゲート
(式中、
は、N、NR13、またはCR1314であり;
は、NまたはCHであり;
pは、0または1であり;
10、R11、R12、R13、およびR14は、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンからなる群から選択され、ここでのC1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンは、各々、非置換であるか、または置換されており、ならびにR10およびR11は、必要に応じて、一緒になって環を形成していることもあり;
15は、HまたはOHである)
からなる群から選択される化合物を含む、態様32に記載の方法。
態様34.ステップ(f)をステップ(g)の前に行う、態様32または態様33に記載の方法。
態様35.ステップ(f)をステップ(g)の後かつステップ(h)の前に行う、態様32または態様33に記載の方法。
態様36.ステップ(f)をステップ(g)とステップ(h)の両方の後に行う、態様32または態様33に記載の方法。
態様37.ステップ(f)、(g1)および(h1)を逐次的に行う、態様32または態様33に記載の方法。
態様38.ステップ(g1)、(f)、および(h1)を逐次的に行う、態様32または態様33に記載の方法。
態様39.ステップ(g1)、(h1)、および(f)を逐次的に行う、態様32または態様33に記載の方法。
態様40.ステップ(f)、(g2)および(h2)を逐次的に行う、態様32または態様33に記載の方法。
態様41.ステップ(g2)、(f)、および(h2)を逐次的に行う、態様32または態様33に記載の方法。
態様42.ステップ(g2)、(h2)および(f)を逐次的に行う、態様32または態様33に記載の方法。
態様43.前記ポリペプチドの前記第2の(またはより高次の)結合性物質との接触を、前記ポリペプチドの前記第1の結合性物質との接触後に逐次的に行う、態様32~42のいずれか1つに記載の方法。
態様44.前記ポリペプチドの前記第2の(またはより高次の)結合性物質との接触を、前記ポリペプチドの前記第1の結合性物質との接触と同時に行う、態様32~42のいずれか1つに記載の方法。
態様45.前記ポリペプチドが、生体試料由来のタンパク質を断片化することにより得られる、態様1~44のいずれか1つに記載の方法。
態様46.前記記録タグが、核酸、オリゴヌクレオチド、修飾オリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、保護された塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、もしくはモルホリノDNA、またはこれらの組合せを含む、態様1~45のいずれか1つに記載の方法。
態様47.前記DNA分子が、骨格修飾、糖修飾、または核酸塩基修飾されている、態様46に記載の方法。
態様48.前記DNA分子が、Allocなどの核酸塩基保護基、チイラン(thiarane)などの電子吸引性保護基、アセチル保護基、ニトロベンジル保護基、スルホン酸保護基、またはUltramild試薬を含む旧来の塩基不安定性保護基を有する、態様46に記載の方法。
態様49.前記記録タグが、ユニバーサルプライミング部位を含む、態様1~48のいずれか1つに記載の方法。
態様50.前記ユニバーサルプライミング部位が、増幅、配列決定、またはその両方のためのプライミング部位を含む、態様49に記載の方法。
態様51.前記記録タグが、一意の分子識別子(UMI)を含む、態様1~50に記載の方法。
態様52.前記記録タグが、バーコードを含む、態様1~51のいずれか1つに記載の方法。
態様53.前記記録タグが、その3’末端にスペーサーを含む、態様1~52のいずれか1つに記載の方法。
態様54.前記ポリペプチドおよび前記付随する記録タグが、前記支持体に共有結合により接合されている、態様1~53のいずれか1つに記載の方法。
態様55.前記支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、態様1~54のいずれか1つに記載の方法。
態様56.前記支持体が、金、銀、半導体または量子ドットを含む、態様55に記載の方法。
態様57.前記ナノ粒子が、金、銀、または量子ドットを含む、態様55に記載の方法。
態様58.前記支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、態様55に記載の方法。
態様59.複数のポリペプチドおよび付随する記録タグが、支持体に接合されている、態様1~58のいずれか1つに記載の方法。
態様60.前記複数のポリペプチドの間に支持体上で間隔をあけ、前記ポリペプチド間の平均距離が、約≧20nmである、態様59に記載の方法。
態様61.前記結合性物質の前記結合性部分が、ペプチドまたはタンパク質を含む、態様1~60のいずれか1つに記載の方法。
態様62.前記結合性物質の前記結合性部分が、アミノペプチダーゼまたはそのバリアント、変異体もしくは修飾タンパク質;アミノアシルtRNA合成酵素またはそのバリアント、変異体もしくは修飾タンパク質;アンチカリンまたはそのバリアント、変異体もしくは修飾タンパク質;ClpS(例えば、ClpS2)またはそのバリアント、変異体もしくは修飾タンパク質;UBRボックスタンパク質またはそのバリアント、変異体もしくは修飾タンパク質;あるいはアミノ酸に結合する修飾小分子、すなわちバンコマイシンまたはそのバリアント、変異体もしくは修飾分子;あるいは抗体またはその結合断片;あるいはこれらの任意の組合せを含む、態様1~61のいずれか1つに記載の方法。
態様63.前記結合性物質が、単一のアミノ酸残基(例えば、N末端アミノ酸残基、C末端アミノ酸残基、もしくは内部アミノ酸残基)、ジペプチド(例えば、N末端ジペプチド、C末端ジペプチド、もしくは内部ジペプチド)、トリペプチド(例えば、N末端トリペプチド、C末端トリペプチド、もしくは内部トリペプチド)、または前記ポリペプチドの翻訳後修飾に結合する、態様1~62のいずれか1つに記載の方法。
態様64.前記結合性物質が、NTAA官能化単一アミノ酸残基、NTAA官能化ジペプチド、NTAA官能化トリペプチド、またはNTAA官能化ポリペプチドに結合する、態様1~62のいずれか1つに記載の方法。
態様65.前記結合性物質の前記結合性部分が、前記ポリペプチドに選択的に結合することが可能である、態様1~64のいずれか1つに記載の方法。
態様66.前記コーディングタグが、DNA分子、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはこれらの組合せである、態様1~65のいずれか1つに記載の方法。
態様67.前記コーディングタグが、エンコーダーまたはバーコード配列を含む、態様1~66のいずれか1つに記載の方法。
態様68.前記コーディングタグが、スペーサー、結合サイクル特異的配列、一意の分子識別子、ユニバーサルプライミング部位、またはこれらの任意の組合せをさらに含む、態様1~67のいずれか1つに記載の方法。
態様69.前記結合性部分および前記コーディングタグが、リンカーにより接合されている、態様1~68のいずれか1つに記載の方法。
態様70.前記結合性部分および前記コーディングタグが、SpyTag/SpyCatcherペプチド-タンパク質対、SnoopTag/SnoopCatcherペプチド-タンパク質対、またはHaloTag/HaloTagリガンド対によって接合されている、態様1~69に記載の方法。
態様71.前記コーディングタグの情報の前記記録タグへの移行が、DNAリガーゼまたはRNAリガーゼによって媒介される、態様1~70のいずれか1つに記載の方法。
態様72.前記コーディングタグの情報の前記記録タグへの移行が、DNAポリメラーゼ、RNAポリメラーゼ、または逆転写酵素によって媒介される、態様1~70のいずれか1つに記載の方法。
態様73.前記コーディングタグの情報の前記記録タグへの移行が、化学的ライゲーションによって媒介される、態様1~70のいずれか1つに記載の方法。
態様74.前記化学的ライゲーションが、一本鎖DNAを使用して実施される、態様73に記載の方法。
75.前記化学的ライゲーションが、二本鎖DNAを使用して実施される、態様74に記載の方法。
76.前記伸長記録タグの解析が、核酸配列決定法を含む、態様1~72のいずれか1つに記載の方法。
77.前記核酸配列決定法が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、態様76に記載の方法。
78.前記核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したDNAのダイレクトイメージングである、態様76に記載の方法。
79.前記伸長記録タグが、解析前に増幅される、態様1~78のいずれか1つに記載の方法。
80.サイクル標識を付加するステップをさらに含む、態様1~79のいずれか1つに記載の方法。
81.前記サイクル標識が、前記結合性物質による前記ポリペプチドへの結合の順序に関する情報を提供する、態様80に記載の方法。
82.前記サイクル標識が、前記コーディングタグに付加される、態様80または態様81に記載の方法。
83.前記サイクル標識が、前記記録タグに付加される、態様80または態様81に記載の方法。
84.前記サイクル標識が、前記結合性物質に付加される、態様80または態様81に記載の方法。
85.前記サイクル標識が、前記コーディングタグ、記録タグ(recording tab)および結合性物質とは独立に付加される、態様80または態様81に記載の方法。
86.前記伸長記録タグに含有されるコーディングタグ情報の順序が、前記結合性物質による前記ポリペプチドへの結合の順序に関する情報を提供する、態様1~85のいずれか1つに記載の方法。
87.前記伸長記録タグに含有されるコーディングタグ情報の頻度が、前記結合性物質による前記ポリペプチドへの結合の頻度に関する情報を提供する、態様1~86のいずれか1つに記載の方法。
88.複数のポリペプチドを表す複数の伸長記録タグが、並行して解析される、態様1~87のいずれか1つに記載の方法。
89.複数のポリペプチドを表す前記複数の伸長記録タグが、多重化アッセイで解析される、態様88に記載の方法。
90.前記複数の伸長記録タグが、解析前に標的濃縮アッセイされる、態様88または89に記載の方法。
91.前記複数の伸長記録タグが、解析前にサブトラクションアッセイされる、態様88~90のいずれか1つに記載の方法。
92.前記複数の伸長記録タグが、極めて豊富な種を低減させるために解析前に正規化アッセイされる、態様88~91のいずれか1つに記載の方法。
93.前記NTAAが、化学的切断または酵素的切断により前記ポリペプチドから消去される、態様1~92のいずれか1つに記載の方法。
94.前記NTAAが、カルボキシペプチダーゼもしくはアミノペプチダーゼまたはそのバリアント、変異体、もしくは修飾タンパク質;ヒドロラーゼまたはそのバリアント、変異体、もしくは修飾タンパク質;穏やかなエドマン分解;エドマナーゼ酵素;TFA、塩基;あるいはこれらの任意の組合せにより消去される、態様93に記載の方法。
95.前記穏やかなエドマン分解が、ジクロロまたはモノクロロ酸を使用する、態様94に記載の方法。
96.前記穏やかなエドマン分解が、TFA、TCA、またはDCAを使用する、態様94に記載の方法。
97.前記穏やかなエドマン分解が、酢酸トリエチルアンモニウム(Et3NHOAc)を使用する、態様94に記載の方法。
98.前記塩基が、水酸化物、アルキル化アミン、環状アミン、炭酸緩衝剤、または金属塩である、態様94に記載の方法。
99.前記水酸化物が、水酸化ナトリウムである、態様98に記載の方法。
100.前記アルキル化アミンが、メチルアミン、エチルアミン、プロピルアミン、ジメチルアミン、ジエチルアミン、ジプロピルアミン、トリメチルアミン、トリエチルアミン、トリプロピルアミン、シクロヘキシルアミン、ベンジルアミン、アニリン、ジフェニルアミン、N,N-ジイソプロピルエチルアミン(DIPEA)、およびリチウムジイソプロピルアミド(LDA)から選択される、態様98に記載の方法。
101.前記環状アミンが、ピリジン、ピリミジン、イミダゾール、ピロール、インドール、ピペリジン、ピロリジン(prolidine)、1,8-ジアザビシクロ[5.4.0]ウンデカ-7-エン(DBU)、および1,5-ジアザビシクロ[4.3.0]ノナ-5-エン(DBN)から選択される、態様98に記載の方法。
102.前記炭酸緩衝剤が、炭酸ナトリウム、炭酸カリウム、炭酸カルシウム、炭酸水素ナトリウム、炭酸水素カリウム、または炭酸水素カルシウムを含む、態様98に記載の方法。
103.前記金属塩が、銀を含む、態様98に記載の方法。
104.前記金属塩が、AgClOである、態様103に記載の方法。
105.少なくとも1つの結合性物質が、末端アミノ酸残基、末端ジアミノ酸残基、または末端トリアミノ酸残基に結合する、態様1~104のいずれか1つに記載の方法。
106.少なくとも1つの結合性物質が、翻訳後修飾されたアミノ酸に結合する、態様1~105のいずれか1つに記載の方法。
107.前記化学試薬が、式(I)の化合物:
Figure 0007390027000024
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、シクロアルキル、-C(O)R、-C(O)OR、または-S(O)であり;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリール、またはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリール、およびヘテロアリールは、各々、非置換であるか、または置換されており;
は、ヘテロアリール、-NRC(O)OR、または-SRであり、ここでのヘテロアリールは、非置換であるか、または置換されており;
、R、およびRは、各々独立して、HまたはC1~6アルキルであり;ならびに
必要に応じて、R
Figure 0007390027000025
であるときにはRおよびRは両方ともHでない)
からなる群から選択される化合物を含む、態様1~106のいずれか1つに記載の方法。
108.Rが、
Figure 0007390027000026
である、態様107に記載の方法。
109.Rが、
Figure 0007390027000027
である、態様107または108に記載の方法。
110.RまたはRが、
Figure 0007390027000028
である、態様107~109のいずれか1つに記載の方法。
111.Rが、
Figure 0007390027000029
(式中、Gは、NまたはCHである)
である、態様107~110のいずれか1つに記載の方法。
112.Rが、
Figure 0007390027000030
Figure 0007390027000031
である、態様107~110のいずれか1つに記載の方法。
113.前記式(I)の化合物が、
Figure 0007390027000032
Figure 0007390027000033
からなる群であって、必要に応じて、以下のものから選択される化合物:
Figure 0007390027000034
(N-Boc,N’-トリフルオロアセチル-ピラゾールカルボキサミジン、N,N’-ビスアセチル-ピラゾールカルボキサミジン、N-メチル-ピラゾールカルボキサミジン、N,N’-ビスアセチル-N-メチル-ピラゾールカルボキサミジン、N,N’-ビスアセチル-N-メチル-4-ニトロ-ピラゾールカルボキサミジン、およびN,N’-ビスアセチル-N-メチル-4-トリフルオロメチル-ピラゾールカルボキサミジン)、またはその塩もしくはコンジュゲート
をさらに含む群から選択される、態様107に記載の方法。
114.前記化学試薬が、向山試薬(ヨウ化2-クロロ-1-メチルピリジニウム)をさらに含む、態様107~113のいずれか1つに記載の方法。
115.前記化学試薬が、式(II)の化合物:
Figure 0007390027000035
またはその塩もしくはコンジュゲート
(式中、
は、H、C1~6アルキル、シクロアルキル、-C(O)R、または-C(O)ORであり;
は、H、C1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、またはアリールアルキルであり、ここでのC1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、およびアリールアルキルは、各々、非置換であるか、または置換されている)
からなる群から選択される化合物を含む、態様1~106のいずれか1つに記載の方法。
116.Rが、カルボキシベンジルである、態様115に記載の方法。
117.Rが、-C(O)Rであり、Rが、アリール、ヘテロアリールまたはヘテロシクロアルキルで必要に応じて置換されている、C2~6アルケニルである、態様115に記載の方法。
118.前記化合物が、
Figure 0007390027000036
、またはその塩もしくはコンジュゲート、からなる群から選択される、態様115に記載の方法。
119.前記化学試薬が、TMS-Cl、Sc(OTf)、Zn(OTf)、またはランタニド含有試薬をさらに含む、態様115~118のいずれか1つに記載の方法。
120.前記化学試薬が、式(III)の化合物:
-N=C=S (III)
またはその塩もしくはコンジュゲート
(式中、
は、C1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールであり;
ここでのC1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、またはハロ、-NR、-S(O)、もしくはヘテロシクリルからなる群から選択される1つもしくは複数の基で置換されており;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリール、またはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリール、およびヘテロアリールは、各々、非置換であるか、または置換されている)
からなる群から選択される化合物を含む、態様1~106のいずれか1つに記載の方法。
121.Rが、置換フェニルである、態様120に記載の方法。
122.Rが、ハロ、-NR、-S(O)、およびヘテロシクリルからなる群から選択される1つまたは複数の基で置換されている、フェニルである、態様120または態様121に記載の方法。
123.前記式(III)の化合物が、トリメチルシリルイソチオシアネート(TMSITC)またはペンタフルオロフェニルイソチオシアネート(PFPITC)である、態様120に記載の方法。
124.前記化学試薬が、カルボジイミド化合物をさらに含む、態様120~123のいずれか1つに記載の方法。
125.前記NTAAが、トリフルオロ酢酸または塩酸を使用して消去される、態様120~124のいずれか1つに記載の方法。
126.前記NTAAが、穏やかなエドマン分解を使用して消去される、態様120~124のいずれか1つに記載の方法。
127.前記NTAAが、エドマナーゼまたは操作されたヒドロラーゼ、アミノペプチダーゼもしくはカルボキシペプチダーゼを使用して消去される、態様120~124のいずれか1つに記載の方法。
128.前記化学試薬が、式(IV)の化合物:
Figure 0007390027000037
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、-CO1~4アルキル、-OR、アリール、またはシクロアルキルであり、ここでのC1~6アルキル、-CO1~4アルキル、-OR、アリール、およびシクロアルキルは、各々、非置換であるか、または置換されており;
は、H、C1~6アルキル、またはヘテロシクリルであり、ここでのC1~6アルキルおよびヘテロシクリルは、各々、非置換であるか、または置換されている)
からなる群から選択される化合物を含む、態様1~106のいずれか1つに記載の方法。
129.RおよびRが、各々独立して、H、C1~6アルキルまたはシクロアルキルである、態様128に記載の方法。
130.前記化合物が、
Figure 0007390027000038
Figure 0007390027000039
、またはその塩もしくはコンジュゲート、からなる群から選択される、態様128に記載の方法。
131.前記式(IV)の化合物が、対応するチオ尿素の脱硫により調製される、態様128~130のいずれか1つに記載の方法。
132.前記化学試薬が、向山試薬(ヨウ化2-クロロ-1-メチルピリジニウム)をさらに含む、態様128~131のいずれか1つに記載の方法。
133.前記化学試薬が、ルイス酸をさらに含む、態様128~131のいずれか1つに記載の方法。
134.前記ルイス酸が、N-((アリール)イミノ-アセナフテノン(acenapthenone))ZnCl、Zn(OTf)、ZnCl、PdCl、CuCl、およびCuClから選択される、態様133に記載の方法。
135.前記化学試薬が、式(V)の化合物:
Figure 0007390027000040
またはその塩もしくはコンジュゲート
(式中、
は、ハロまたは-ORであり;
は、H、C1~6アルキル、またはヘテロシクリルであり;
は、水素、ハロ、またはC1~6ハロアルキルである)
からなる群から選択される化合物を含む、態様1~106のいずれか1つに記載の方法。
136.Rが、クロロである、態様135に記載の方法。
137.Rが、水素またはブロモである、態様135または態様136に記載の方法。
138.前記化学試薬が、ペプチドカップリング試薬をさらに含む、態様135~137のいずれか1つに記載の方法。
139.前記ペプチドカップリング試薬が、カルボジイミド化合物である、態様138に記載の方法。
140.前記カルボジイミド化合物が、ジイソプロピルカルボジイミド(DIC)または1-エチル-3-(3-ジメチルアミノプロピル)カルボジイミド(EDC)である、態様139に記載の方法。
141.前記NTAAが、アシルペプチドヒドロラーゼ(APH)を使用して消去される、態様135~140のいずれか1つに記載の方法。
142.前記化学試薬が、式(VI)の金属錯体:
ML (VI)
またはその塩もしくはコンジュゲート
(式中、
Mは、Co、Cu、Pd、Pt、Zn、およびNiからなる群から選択される金属であり;
Lは、-OH、-OH、2,2’-ビピリジン(bpy)、1,5ジチアシクロオクタン(dtco)、1,2-ビス(ジフェニルホスフィノ)エタン(dppe)、エチレンジアミン(en)、およびトリエチレンテトラミン(trien)からなる群から選択される配位子であり;
nは、1および8を含む、1~8の整数であり;
各Lは、同じであってもよく、または異なっていてもよい)
を含む、態様1~106のいずれか1つに記載の方法。
143.Mが、Coである、態様142に記載の方法。
144.前記化学試薬が、シス-β-ヒドロキシアクオ(トリエチレンテトラミン)コバルト(III)錯体を含む、態様142または態様143に記載の方法。
145.前記化学試薬が、β-[Co(trien)(OH)(OH)]2+を含む、態様142に記載の方法。
146.前記化学試薬が、式(VII)の化合物:
Figure 0007390027000041
またはその塩もしくはコンジュゲート
(式中、
は、N、NR13、またはCR1314であり;
は、NまたはCHであり;
pは、0または1であり;
10、R11、R12、R13、およびR14は、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンからなる群から選択され、ここでのC1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンは、各々、非置換であるか、または置換されており、ならびにR10およびR11は、必要に応じて、一緒になって環を形成していることもあり;
15は、HまたはOHである)
からなる群から選択される化合物を含む、態様1~106のいずれか1つに記載の方法。
147.GがCHであり、GがCHであるか、またはGがNHであり、GがNである、態様146に記載の方法。
148.R12が、Hである、態様146または147に記載の方法。
149.R10およびR11が、各々、Hである、態様146~148のいずれか1つに記載の方法。
150.前記式(VII)の化合物が、
Figure 0007390027000042
Figure 0007390027000043
、またはその塩もしくはコンジュゲート、からなる群から選択される、態様146に記載の方法。
151.前記NTAAが、塩基を使用して消去される、態様107~150のいずれか1つに記載の方法。
152.前記塩基が、水酸化物、アルキル化アミン、環状アミン、炭酸緩衝剤、または金属塩である、態様151に記載の方法。
153.前記水酸化物が、水酸化ナトリウムである、態様152に記載の方法。
154.前記アルキル化アミンが、メチルアミン、エチルアミン、プロピルアミン、ジメチルアミン、ジエチルアミン、ジプロピルアミン、トリメチルアミン、トリエチルアミン、トリプロピルアミン、シクロヘキシルアミン、ベンジルアミン、アニリン、ジフェニルアミン、N,N-ジイソプロピルエチルアミン(DIPEA)、およびリチウムジイソプロピルアミド(LDA)から選択される、態様152に記載の方法。
155.前記環状アミンが、ピリジン、ピリミジン、イミダゾール、ピロール、インドール、ピペリジン、ピロリジン(proolidine)、1,8-ジアザビシクロ[5.4.0]ウンデカ-7-エン(DBU)、および1,5-ジアザビシクロ[4.3.0]ノナ-5-エン(DBN)から選択される、態様152に記載の方法。
156.前記炭酸緩衝剤が、炭酸ナトリウム、炭酸カリウム、炭酸カルシウム、炭酸水素ナトリウム、炭酸水素カリウム、または炭酸水素カルシウムを含む、態様152に記載の方法。
157.前記金属塩が、銀を含む、態様152に記載の方法。
158.前記金属塩が、AgClOである、態様152に記載の方法。
159.前記化学試薬が、
Figure 0007390027000044
(式中、R、R、およびRは、態様1において式(I)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000045
(式中、Rは、態様1において式(II)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000046
(式中、Rは、態様1において式(III)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000047
(式中、RおよびRは、態様1において式(IV)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000048
(式中、RおよびRは、態様1において式(V)について定義されているとおりであり、Qは、配位子である);
(ML)-Q 式(VI)-Q
(式中、M、L、およびnは、態様1において式(VI)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000049
(式中、R10、R11、R12、R15、G、G、およびpは、態様1において式(VII)について定義されているとおりであり、Qは、配位子である)
からなる群から選択されるコンジュゲートを含む、態様1~158のいずれか1つに記載の方法。
160.前記Qが、-C1~6アルキル、-C2~6アルケニル、-C2~6アルキニル、アリール、ヘテロアリール、ヘテロシクリル、-N=C=S、-CN、-C(O)R、-C(O)OR、--SRまたは-S(O)からなる群から選択され、ここで、-C1~6アルキル、-C2~6アルケニル、-C2~6アルキニル、アリール、ヘテロアリール、およびヘテロシクリルが、各々、非置換であるか、置換されており、ならびにR、R、R、およびRが、各々独立して、-C1~6アルキル、-C1~6ハロアルキル、-C2~6アルケニル、-C2~6アルキニル、アリール、ヘテロアリール、およびヘテロシクリルからなる群から選択される、態様159に記載の方法。
161.前記Qが、
Figure 0007390027000050
からなる群から選択される、態様159に記載の方法。
162.Qが、フルオロフォアである、態様159に記載の方法。
163.態様1または態様5のステップ(b)が、前記NTAAの二官能化を含む、態様1~162のいずれか1つに記載の方法。
164.態様1または態様5のステップ(b)が、前記NTAAを、(1)式(I)、(II)、(III)、(IV)、(V)、(VI)および(VII)の化合物、またはその塩もしくはコンジュゲート、からなる群から選択される化合物を含む第1の化学試薬、および(2)第2の化学試薬で、二官能化することを含む、態様163に記載の方法。
165.前記第2の化学試薬が、式(VIIIa)または(VIIIb)の化合物:
Figure 0007390027000051
またはその塩もしくはコンジュゲート
(式中、
13は、H、C1~6アルキル、アリール、ヘテロアリール、シクロアルキル、またはヘテロシクロアルキルであり、ここでのC1~6アルキル、アリール、ヘテロアリール、シクロアルキル、およびヘテロシクロアルキルは、各々、非置換であるか、または置換されている);または
13-X (VIIIb)
(式中、
13は、C1~6アルキル、アリール、ヘテロアリール、シクロアルキル、またはヘテロシクロアルキルであり、これらの各々は、非置換であるか、または置換されており、
Xは、ハロゲンである)
を含む、態様164に記載の方法。
166.態様1または態様5のステップ(b)が、前記NTAAを、前記第1の化学試薬で官能化する前に、前記第2の化学試薬で官能化することを含む、164または165に記載の方法。
167.態様1または態様5のステップ(b)が、前記NTAAを、前記第2の化学試薬で官能化する前に、前記第1の化学試薬で官能化することを含む、164または165に記載の方法。
168.態様6のステップ(f)が、前記NTAAの二官能化を含む、態様32~167のいずれか1つに記載の方法。
169.態様6のステップ(f)が、前記NTAAを、(1)式(I)、(II)、(III)、(IV)、(V)、(VI)および(VII)の化合物からなる群から選択される化合物を含む第1の化学試薬、および(2)第2の化学試薬で、二官能化することを含む、態様168に記載の方法。
170.前記第2の化学試薬が、式(VIIIa)または(VIIIb)の化合物:
Figure 0007390027000052
またはその塩もしくはコンジュゲート
(式中、
13は、H、C1~6アルキル、アリール、ヘテロアリール、シクロアルキル、またはヘテロシクロアルキルであり、ここでのC1~6アルキル、アリール、ヘテロアリール、シクロアルキル、およびヘテロシクロアルキルは、各々、非置換であるか、または置換されている);または
13-X (VIIIb)
(式中、
13は、C1~6アルキル、アリール、ヘテロアリール、シクロアルキル、またはヘテロシクロアルキルであり、これらの各々は、非置換であるか、または置換されており、
Xは、ハロゲンである)
を含む、態様169に記載の方法。
171.態様1または態様5のステップ(b)が、前記NTAAを、前記第1の化学試薬で官能化する前に、前記第2の化学試薬で官能化することを含む、169または170に記載の方法。
172.態様1または態様5のステップ(b)が、前記NTAAを、前記第2の化学試薬で官能化する前に、前記第1の化学試薬で官能化することを含む、169または170に記載の方法。
173.前記式(VIIIa)の化合物が、ホルムアルデヒドである、態様165~167および170~172のいずれか1つに記載の方法。
174.前記式(VIIIb)の化合物が、ヨウ化メチルである、態様165~167および170~172のいずれか1つに記載の方法。
175.複数のタンパク質複合体、タンパク質またはポリペプチドを含む試料由来の1つまたは複数のポリペプチドを解析するための方法であって、
(a)前記試料中の前記複数のタンパク質複合体、タンパク質、またはポリペプチドを複数のコンパートメントに分配するステップであって、各コンパートメントが、支持体(例えば、固体支持体)に必要に応じて接合されている複数のコンパートメントタグを含み、前記複数のコンパートメントタグが、個々のコンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、ステップと;
(b)前記複数のタンパク質複合体、タンパク質、および/またはポリペプチドを複数のポリペプチドに断片化するステップと;
(c)前記複数のポリペプチドと前記複数のコンパートメント内の前記複数のコンパートメントタグとのアニーリングまたは接合を可能にするのに十分な条件下で前記複数のポリペプチドを前記複数のコンパートメントタグと接触させることによって複数のコンパートメントタグ付きポリペプチドを生成するステップと;
(d)前記コンパートメントタグ付きポリペプチドを前記複数のコンパートメントから収集するステップと;
(e)1つまたは複数のコンパートメントタグ付きポリペプチドを、態様1~174のいずれか1つに記載の方法に従って解析するステップと
を含む方法。
176.前記コンパートメントが、マイクロ流体液滴である、態様175に記載の方法。
177.前記コンパートメントが、マイクロウェルである、態様175に記載の方法。
178.前記コンパートメントが、表面上の分離された領域である、態様175に記載の方法。
179.各コンパートメントが、平均して単一の細胞を含む、態様175~178のいずれか1つに記載の方法。
180.複数のタンパク質複合体、タンパク質またはポリペプチドを含む試料由来の1つまたは複数のポリペプチドを解析するための方法であって、
(a)前記複数のタンパク質複合体、タンパク質、またはポリペプチドを複数のユニバーサルDNAタグで標識するステップと;
(b)前記試料中の前記複数の標識されたタンパク質複合体、タンパク質、またはポリペプチドを複数のコンパートメントに分配するステップであって、各コンパートメントが、複数のコンパートメントタグを含み、前記複数のコンパートメントタグが、個々のコンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、ステップと;
(c)前記複数のタンパク質複合体、タンパク質、またはポリペプチドと前記複数のコンパートメント内の前記複数のコンパートメントタグとのアニーリングまたは接合を可能にするのに十分な条件下で前記複数のタンパク質複合体、タンパク質、またはポリペプチドを前記複数のコンパートメントタグと接触させることによって複数のコンパートメントタグ付きタンパク質複合体、タンパク質またはポリペプチドを生成するステップと;
(d)前記コンパートメントタグ付きタンパク質複合体、タンパク質、またはポリペプチドを前記複数のコンパートメントから収集するステップと;
(e)必要に応じて前記コンパートメントタグ付きタンパク質複合体、タンパク質、またはポリペプチドをコンパートメントタグ付きポリペプチドに断片化するステップと;
(f)1つまたは複数のコンパートメントタグ付きポリペプチドを、態様1~174のいずれか1つに記載の方法に従って解析するステップと
を含む方法。
181.コンパートメントタグ情報が、ポリペプチドに付随する記録タグに、プライマー伸長またはライゲーションによって移行される、態様175~180のいずれか1つに記載の方法。
182.前記支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、態様175~181のいずれか1つに記載の方法。
183.前記支持体が、ビーズを含む、態様175~181のいずれか1つに記載の方法。
184.前記ビーズが、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、態様183に記載の方法。
185.前記コンパートメントタグが、一本鎖または二本鎖核酸分子を含む、態様175~184のいずれか1つに記載の方法。
186.前記コンパートメントタグが、バーコードおよび必要に応じてUMIを含む、態様175~185のいずれか1つに記載の方法。
187.前記支持体がビーズであり、前記コンパートメントタグがバーコードを含み、さらに、前記複数のコンパートメントタグが接合されているビーズが、スプリット・アンド・プール合成により形成される、態様186に記載の方法。
188.前記支持体がビーズであり、前記コンパートメントタグがバーコードを含み、さらに、複数のコンパートメントタグが接合されているビーズが、個々の合成または固定化により形成される、態様186に記載の方法。
189.前記コンパートメントタグが、記録タグ内の成分であり、前記記録タグが、必要に応じて、スペーサー、バーコード配列、一意の分子識別子、ユニバーサルプライミング部位、またはこれらの任意の組合せをさらに含む、態様175~188のいずれか1つに記載の方法。
190.前記コンパートメントタグが、前記複数のタンパク質複合体、タンパク質またはポリペプチドの内部アミノ酸、ペプチド骨格、またはN末端アミノ酸と反応することができる機能的部分をさらに含む、態様175~189のいずれか1つに記載の方法。
191.前記機能的部分が、アルデヒド、アジド/アルキン、またはマレイミド/チオール、またはエポキシド/求核試薬、または逆電子要請型ディールス-アルダー(iEDDA)基である、態様190に記載の方法。
192.前記機能的部分が、アルデヒド基である、態様190に記載の方法。
193.前記複数のコンパートメントタグが、前記コンパートメントタグを前記コンパートメントに印刷、スポッティング、インク噴射すること、またはその組合せにより形成される、態様175~192のいずれか1つに記載の方法。
194.前記コンパートメントタグが、ポリペプチドをさらに含む、態様175~193のいずれか1つに記載の方法。
195.前記コンパートメントタグポリペプチドが、タンパク質リガーゼ認識配列を含む、態様194に記載の方法。
196.前記タンパク質リガーゼが、ブテラーゼIまたはそのホモログである、態様195に記載の方法。
197.前記複数のポリペプチドが、プロテアーゼで断片化される、態様175~196のいずれか1つに記載の方法。
198.前記プロテアーゼが、メタロプロテアーゼである、態様197に記載の方法。
199.前記メタロプロテアーゼの活性が、金属カチオンの光活性化放出によりモジュレートされる、態様198に記載の方法。
200.前記複数のポリペプチドを前記複数のコンパートメントに分配する前に1つまたは複数の豊富なタンパク質を前記試料からサブトラクションすることをさらに含む、態様175~199のいずれか1つに記載の方法。
201.前記複数のポリペプチドと前記コンパートメントタグを接合させる前に前記コンパートメントタグを前記支持体から遊離させることをさらに含む、態様175~200に記載の方法。
202.ステップ(d)の後に、前記コンパートメントタグ付きポリペプチドを支持体に記録タグを伴って接合させることをさらに含む、態様175に記載の方法。
203.前記コンパートメントタグ付きポリペプチド上の前記コンパートメントタグの情報を前記付随する記録タグに移行させることをさらに含む、態様202に記載の方法。
204.ステップ(e)の前に前記コンパートメントタグを前記コンパートメントタグ付きポリペプチドから除去することをさらに含む、態様203に記載の方法。
205.解析されるポリペプチドが由来する前記単一の細胞の同一性を、前記解析されるポリペプチドのコンパートメントタグ配列に基づいて決定することをさらに含む、態様175~204のいずれか1つに記載の方法。
206.解析されるポリペプチドが由来する前記タンパク質またはタンパク質複合体の同一性を、前記解析されるポリペプチドのコンパートメントタグ配列に基づいて決定することをさらに含む、態様175~204のいずれか1つに記載の方法。
207.ステップ(f)、(g)、(h)、および(i)が、多数のアミノ酸を用いて繰り返される、態様32~206のいずれか1つに記載の方法。
208.ステップ(f)、(g)、(h)、および(i)が、2つまたはそれより多くのアミノ酸を用いて繰り返される、態様207に記載の方法。
209.ステップ(f)、(g)および(h)が、最大約100のアミノ酸を用いて繰り返される、態様207に記載の方法。
210.ポリペプチドを解析するためのキットであって、
(a)記録タグが必要に応じて直接または間接的に付随しているポリペプチドをもたらすための試薬と;
(b)前記ポリペプチドのN末端アミノ酸(NTAA)を官能化するための試薬であって、
(i)式(I)の化合物:
Figure 0007390027000053
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、シクロアルキル、-C(O)R、-C(O)OR、または-S(O)であり;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されており;
は、ヘテロアリール、-NRC(O)OR、または-SRであり、ここでのヘテロアリールは、非置換であるか、または置換されており;
、R、およびRは、各々独立して、HまたはC1~6アルキルであり;ならびに
必要に応じて、R
Figure 0007390027000054
であるときにはRおよびRは両方ともHでない);
(ii)式(II)の化合物:
Figure 0007390027000055
またはその塩もしくはコンジュゲート
(式中、
は、H、C1~6アルキル、シクロアルキル、-C(O)R、または-C(O)ORであり;
は、H、C1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、またはアリールアルキルであり、ここでのC1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、およびアリールアルキルは、各々、非置換であるか、または置換されている);
(iii)式(III)の化合物:
-N=C=S (III)
またはその塩もしくはコンジュゲート
(式中、
は、C1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールであり;
ここでのC1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールは、各々、非置換であるか、またはハロ、-NR、-S(O)、もしくはヘテロシクリルからなる群から選択される1つもしくは複数の基で置換されており;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されている);
(iv)式(IV)の化合物:
Figure 0007390027000056
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、-CO1~4アルキル、-OR、アリール、またはシクロアルキルであり、ここでのC1~6アルキル、-CO1~4アルキル、-OR、アリール、およびシクロアルキルは、各々、非置換であるか、または置換されており;
は、H、C1~6アルキル、またはヘテロシクリルであり、ここでのC1~6アルキルおよびヘテロシクリルは、各々、非置換であるか、または置換されている);
(v)式(V)の化合物:
Figure 0007390027000057
またはその塩もしくはコンジュゲート
(式中、
は、ハロまたは-ORであり;
は、H、C1~6アルキル、またはヘテロシクリルであり;
は、水素、ハロ、またはC1~6ハロアルキルである);
(vi)式(VI)の金属錯体:
ML (VI)
またはその塩もしくはコンジュゲート
(式中、
Mは、Co、Cu、Pd、Pt、Zn、およびNiからなる群から選択される金属であり;
Lは、-OH、-OH、2,2’-ビピリジン(bpy)、1,5ジチアシクロオクタン(dtco)、1,2-ビス(ジフェニルホスフィノ)エタン(dppe)、エチレンジアミン(en)、およびトリエチレンテトラミン(trien)からなる群から選択される配位子であり;
nは、1および8を含む、1~8の整数であり;
各Lは、同じであってもよく、または異なっていてもよい);および
(vii)式(VII)の化合物:
Figure 0007390027000058
またはその塩もしくはコンジュゲート
(式中、
は、N、NR13、またはCR1314であり;
は、NまたはCHであり;
pは、0または1であり;
10、R11、R12、R13、およびR14は、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンからなる群から選択され、ここでのC1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンは、各々、非置換であるか、または置換されており、ならびにR10およびR11は、必要に応じて、一緒になって環を形成していることもあり;
15は、HまたはOHである)
からなる群から選択される化合物を含む試薬と;
(c)前記官能化NTAAに結合することが可能な第1の結合性部分と(c1)前記第1の結合性物質に関する識別情報を有する第1のコーディングタグまたは(c2)第1の検出可能な標識とを含む第1の結合性物質と;
(d)前記第1のコーディングタグの情報を前記記録タグに移行させて伸長記録タグを生成するための試薬と;必要に応じて
(e)前記伸長記録タグを解析するための試薬、または前記第1の検出可能な標識を検出するための試薬と
を含むキット。
211.(a)の前記試薬が、支持体(例えば、固体支持体)に接合されている前記ポリペプチドおよび付随する記録タグをもたらすように構成されている、態様210に記載のキット。
212.(a)の前記試薬が、溶液中の記録タグが直接付随しているポリペプチドをもたらすように構成されている、態様210に記載のキット。
213.(a)の前記試薬が、記録タグが間接的に付随しているポリペプチドをもたらすように構成されている、態様210に記載のキット。
214.(a)の前記試薬が、記録タグが付随していないポリペプチドをもたらすように構成されている、態様210に記載のキット。
215.前記ポリペプチドのNTAAを官能化するための2つまたはそれより多くの異なる試薬を含む、態様210~214のいずれか1つに記載のキット。
216.態様125に記載の式(I)、(II)、(III)、(IV)、(V)、(VI)および(VII)の化合物、またはその塩もしくはコンジュゲート、からなる群から選択される化合物を含む第1の試薬と、第2の試薬とを含む、態様215に記載のキット。
217.前記第2の試薬が、式(VIIIa)または(VIIIb)の化合物:
Figure 0007390027000059
またはその塩もしくはコンジュゲート
(式中、
13は、H、C1~6アルキル、アリール、ヘテロアリール、シクロアルキル、またはヘテロシクロアルキルであり、ここでのC1~6アルキル、アリール、ヘテロアリール、シクロアルキル、およびヘテロシクロアルキルは、各々、非置換であるか、または置換されている);または
13-X (VIIIb)
(式中、
13は、C1~6アルキル、アリール、ヘテロアリール、シクロアルキル、またはヘテロシクロアルキルであり、これらの各々は、非置換であるか、または置換されており、
Xは、ハロゲンである)
を含む、態様216に記載のキット。
218.前記式(VIIIa)の化合物が、ホルムアルデヒドである、態様217に記載のキット。
219.前記式(VIIIb)の化合物が、ヨウ化メチルである、態様217に記載のキット。
220.2つまたはそれより多くの異なる結合性物質を含む、態様210~219のいずれか1つに記載のキット。
221.前記官能化NTAAを消去して新しいNTAAを露出させるための試薬をさらに含む、態様210~220のいずれか1つに記載のキット。
222.前記官能化NTAAを消去するための2つまたはそれより多くの異なる試薬を含む、態様211~221のいずれか1つに記載のキット。
223.前記官能化NTAAを消去するための試薬が、化学的切断試薬または酵素的切断試薬を含む、態様221または態様222に記載のキット。
224.前記官能化NTAAを消去するための試薬が、カルボキシペプチダーゼもしくはアミノペプチダーゼまたはそのバリアント、変異体、もしくは修飾タンパク質;ヒドロラーゼまたはそのバリアント、変異体、もしくは修飾タンパク質;穏やかなエドマン分解試薬;エドマナーゼ酵素;TFA;塩基;あるいはこれらの任意の組合せを含む、態様221または態様222に記載のキット。
225.前記化学試薬が、式(I)の化合物:
Figure 0007390027000060
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、シクロアルキル、-C(O)R、-C(O)OR、または-S(O)であり;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリール、またはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリール、およびヘテロアリールは、各々、非置換であるか、または置換されており;
は、ヘテロアリール、-NRC(O)OR、または-SRであり、ここでのヘテロアリールは、非置換であるか、または置換されており;
、R、およびRは、各々独立して、HまたはC1~6アルキルであり;ならびに
必要に応じて、R
Figure 0007390027000061
であるときにはRおよびRは両方ともHでない)
からなる群から選択される化合物を含む、態様210~224のいずれか1つに記載のキット。
226.Rが、
Figure 0007390027000062
である、態様225に記載のキット。
227.Rが、
Figure 0007390027000063
である、態様225または態様226に記載のキット。
228.RまたはRが、
Figure 0007390027000064
である、態様225~227のいずれか1つに記載のキット。
229.Rが、
Figure 0007390027000065
(式中、Gは、NまたはCHである)
である、態様225~228のいずれか1つに記載のキット。
230.Rが、
Figure 0007390027000066
Figure 0007390027000067
である、態様225~228のいずれか1つに記載のキット。
231.前記式(I)の化合物が、
Figure 0007390027000068
Figure 0007390027000069
、またはその塩もしくはコンジュゲート、からなる群から選択される、態様225に記載のキット。
232.前記化学試薬が、向山試薬(ヨウ化2-クロロ-1-メチルピリジニウム)をさらに含む、態様225~231のいずれか1つに記載のキット。
233.前記化学試薬が、式(II)の化合物:
Figure 0007390027000070
またはその塩もしくはコンジュゲート
(式中、
は、H、C1~6アルキル、シクロアルキル、-C(O)R、または-C(O)ORであり;
は、H、C1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、またはアリールアルキルであり、ここでのC1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、およびアリールアルキルは、各々、非置換であるか、または置換されている)
からなる群から選択される化合物を含む、態様210~224のいずれか1つに記載のキット。
234.Rが、カルボキシベンジルである、態様142に記載のキット。
235.Rが、-C(O)Rであり、Rが、アリール、ヘテロアリールまたはヘテロシクロアルキルで必要に応じて置換されている、C2~6アルケニルである、態様142に記載のキット。
236.前記化合物が、
Figure 0007390027000071
、またはその塩もしくはコンジュゲート、からなる群から選択される、態様142に記載のキット。
237.前記化学試薬が、TMS-Cl、Sc(OTf)、Zn(OTf)、またはランタニド含有試薬をさらに含む、態様142~145のいずれか1つに記載のキット。
238.前記化学試薬が、式(III)の化合物:
-N=C=S (III)
またはその塩もしくはコンジュゲート
(式中、
は、C1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールであり;
ここでのC1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールは、各々、非置換であるか、またはハロ、-NR、-S(O)、もしくはヘテロシクリルからなる群から選択される1つもしくは複数の基で置換されており;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリール、またはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリール、およびヘテロアリールは、各々、非置換であるか、または置換されている)
からなる群から選択される化合物を含む、態様210~224のいずれか1つに記載のキット。
239.Rが、置換フェニルである、態様238に記載のキット。
240.Rが、ハロ、-NR、-S(O)、およびヘテロシクリルからなる群から選択される1つまたは複数の基で置換されている、フェニルである、態様238または態様239に記載のキット。
241.前記式(III)の化合物が、トリメチルシリルイソチオシアネート(TMSITC)またはペンタフルオロフェニルイソチオシアネート(PFPITC)である、態様238に記載のキット。
242.前記化学試薬が、カルボジイミド化合物をさらに含む、態様238~240のいずれか1つに記載のキット。
243.前記官能化NTAAを消去するための試薬が、トリフルオロ酢酸または塩酸を含む、態様238~242のいずれか1つに記載のキット。
244.前記官能化NTAAを消去するための試薬が、穏やかなエドマン分解試薬を含む、態様238~243のいずれか1つに記載のキット。
245.前記官能化NTAAを消去するための試薬が、エドマナーゼまたは操作されたヒドロラーゼ、アミノペプチダーゼもしくはカルボキシペプチダーゼを含む、態様238~243のいずれか1つに記載のキット。
246.前記化学試薬が、式(IV)の化合物:
Figure 0007390027000072
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、-CO1~4アルキル、-OR、アリール、またはシクロアルキルであり、ここでのC1~6アルキル、-CO1~4アルキル、-OR、アリール、およびシクロアルキルは、各々、非置換であるか、または置換されており;
は、H、C1~6アルキル、またはヘテロシクリルであり、ここでのC1~6アルキルおよびヘテロシクリルは、各々、非置換であるか、または置換されている)
からなる群から選択される化合物を含む、態様210~224のいずれか1つに記載のキット。
247.RおよびRが、各々独立して、H、C1~6アルキルまたはシクロアルキルである、態様246に記載のキット。
248.前記化合物が、
Figure 0007390027000073
Figure 0007390027000074
、またはその塩もしくはコンジュゲート、からなる群から選択される、態様246に記載のキット。
249.前記式(IV)の化合物が、対応するチオ尿素の脱硫により調製される、態様246~248のいずれか1つに記載のキット。
250.前記化学試薬が、向山試薬(ヨウ化2-クロロ-1-メチルピリジニウム)をさらに含む、態様246~249のいずれか1つに記載のキット。
251.前記化学試薬が、ルイス酸をさらに含む、態様246~249のいずれか1つに記載のキット。
252.前記ルイス酸が、N-((アリール)イミノ-アセナフテノン)ZnCl、Zn(OTf)、ZnCl、PdCl、CuCl、およびCuClから選択される、態様251に記載のキット。
253.前記化学試薬が、式(V)の化合物:
Figure 0007390027000075
またはその塩もしくはコンジュゲート
(式中、
は、ハロまたは-ORであり;
は、H、C1~6アルキル、またはヘテロシクリルであり;
は、水素、ハロ、またはC1~6ハロアルキルである)
からなる群から選択される化合物を含む、態様210~224のいずれか1つに記載のキット。
254.Rが、クロロである、態様253に記載のキット。
255.Rが、水素またはブロモである、態様253または態様254に記載のキット。
256.前記化学試薬が、ペプチドカップリング試薬をさらに含む、態様253~255のいずれか1つに記載のキット。
257.前記ペプチドカップリング試薬が、カルボジイミド化合物である、態様256に記載のキット。
258.前記カルボジイミド化合物が、ジイソプロピルカルボジイミド(DIC)または1-エチル-3-(3-ジメチルアミノプロピル)カルボジイミド(EDC)である、態様257に記載のキット。
259.前記官能化NTAAを消去するための試薬が、アシルペプチドヒドロラーゼ(APH)を含む、態様253~258のいずれか1つに記載のキット。
260.前記化学試薬が、式(VI)の金属錯体:
ML (VI)
またはその塩もしくはコンジュゲート
(式中、
Mは、Co、Cu、Pd、Pt、Zn、およびNiからなる群から選択される金属であり;
Lは、-OH、-OH、2,2’-ビピリジン(bpy)、1,5ジチアシクロオクタン(dtco)、1,2-ビス(ジフェニルホスフィノ)エタン(dppe)、エチレンジアミン(en)、およびトリエチレンテトラミン(trien)からなる群から選択される配位子であり;
nは、1および8を含む、1~8の整数であり;
各Lは、同じであってもよく、または異なっていてもよい)
を含む、態様210~224のいずれか1つに記載のキット。
261.Mが、Coである、態様260に記載のキット。
262.前記化学試薬が、シス-β-ヒドロキシアクオ(トリエチレンテトラミン)コバルト(III)錯体を含む、態様260または261に記載のキット。
263.前記化学試薬が、β-[Co(trien)(OH)(OH)]2+を含む、態様260または261に記載のキット。
264.前記化学試薬が、式(VII)の化合物:
Figure 0007390027000076
またはその塩もしくはコンジュゲート
(式中、
は、N、NR13、またはCR1314であり;
は、NまたはCHであり;
pは、0または1であり;
10、R11、R12、R13、およびR14は、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンからなる群から選択され、ここでのC1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンは、各々、非置換であるか、または置換されており、ならびにR10およびR11は、必要に応じて、一緒になって環を形成していることもあり;
15は、HまたはOHである)
からなる群から選択される化合物を含む、態様210~224のいずれか1つに記載のキット。
265.GがCHであり、GがCHであるか、またはGがNHであり、GがNである、態様264に記載のキット。
266.R12が、Hである、態様264または265に記載のキット。
267.R10およびR11が、各々、Hである、態様264~266のいずれか1つに記載のキット。
268.前記式(VII)の化合物が、
Figure 0007390027000077
Figure 0007390027000078
、またはその塩もしくはコンジュゲート、からなる群から選択される、態様264に記載のキット。
269.前記官能化NTAAを消去するための試薬が、塩基を含む、態様225~268のいずれか1つに記載のキット。
270.前記塩基が、水酸化物、アルキル化アミン、環状アミン、炭酸緩衝剤、または金属塩である、態様269に記載のキット。
271.前記水酸化物が、水酸化ナトリウムである、態様270に記載のキット。
272.前記アルキル化アミンが、メチルアミン、エチルアミン、プロピルアミン、ジメチルアミン、ジエチルアミン、ジプロピルアミン、トリメチルアミン、トリエチルアミン、トリプロピルアミン、シクロヘキシルアミン、ベンジルアミン、アニリン、ジフェニルアミン、N,N-ジイソプロピルエチルアミン(DIPEA)、およびリチウムジイソプロピルアミド(LDA)から選択される、態様270に記載のキット。
273.前記環状アミンが、ピリジン、ピリミジン、イミダゾール、ピロール、インドール、ピペリジン、ピロリジン、1,8-ジアザビシクロ[5.4.0]ウンデカ-7-エン(DBU)、および1,5-ジアザビシクロ[4.3.0]ノナ-5-エン(DBN)から選択される、態様270に記載のキット。
274.前記炭酸緩衝剤が、炭酸ナトリウム、炭酸カリウム、炭酸カルシウム、炭酸水素ナトリウム、炭酸水素カリウム、または炭酸水素カルシウムを含む、態様270に記載のキット。
275.前記金属塩が、銀を含む、態様270に記載のキット。
276.前記金属塩が、AgClOである、態様270に記載のキット。
277.前記化学試薬が、
Figure 0007390027000079
(式中、R、R、およびRは、態様1において式(I)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000080
(式中、Rは、態様1において式(II)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000081
(式中、Rは、態様1において式(III)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000082
(式中、RおよびRは、態様1において式(IV)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000083
(式中、RおよびRは、態様1において式(V)について定義されているとおりであり、Qは、配位子である);
(ML)-Q 式(VI)-Q
(式中、M、L、およびnは、態様1において式(VI)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000084
(式中、R10、R11、R12、R15、G、G、およびpは、態様1において式(VII)について定義されているとおりであり、Qは、配位子である)
からなる群から選択されるコンジュゲートを含む、態様210~276のいずれか1つに記載のキット。
278.前記Qが、-C1~6アルキル、-C2~6アルケニル、-C2~6アルキニル、アリール、ヘテロアリール、ヘテロシクリル、-N=C=S、-CN、-C(O)R、-C(O)OR、--SRまたは-S(O)からなる群から選択され、ここで、-C1~6アルキル、-C2~6アルケニル、-C2~6アルキニル、アリール、ヘテロアリール、およびヘテロシクリルが、各々、非置換であるか、置換されており、ならびにR、R、R、およびRが、各々独立して、-C1~6アルキル、-C1~6ハロアルキル、-C2~6アルケニル、-C2~6アルキニル、アリール、ヘテロアリール、およびヘテロシクリルからなる群から選択される、態様277に記載のキット。
279.前記Qが、
Figure 0007390027000085
からなる群から選択される、態様277に記載のキット。
280.Qが、フルオロフォアである、態様277に記載のキット。
281.前記結合性物質が、末端アミノ酸残基、末端ジアミノ酸残基、または末端トリアミノ酸残基に結合する、態様210~280のいずれか1つに記載のキット。
282.前記結合性物質が、翻訳後修飾されたアミノ酸に結合する、態様210~280のいずれか1つに記載のキット。
283.前記記録タグが、核酸、オリゴヌクレオチド、修飾オリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、保護された塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、もしくはモルホリノDNA、またはこれらの組合せを含む、態様210~282のいずれか1つに記載のキット。
284.前記DNA分子が、骨格修飾、糖修飾、または核酸塩基修飾されている、態様283に記載のキット。
285.前記DNA分子が、Allocなどの核酸塩基保護基、チイラン(thirane)などの電子吸引性保護基、アセチル保護基、ニトロベンジル保護基、スルホン酸保護基、またはUltramild試薬を含む旧来の塩基不安定性保護基を有する、態様283に記載のキット。
286.前記記録タグが、ユニバーサルプライミング部位を含む、態様210~285のいずれか1つに記載のキット。
287.前記ユニバーサルプライミング部位が、増幅、配列決定、またはその両方のためのプライミング部位を含む、態様286に記載のキット。
288.前記記録タグが、一意の分子識別子(UMI)を含む、態様210~287のいずれか1つに記載のキット。
289.前記記録タグが、バーコードを含む、態様210~288のいずれか1つに記載のキット。
290.前記記録タグが、その3’末端にスペーサーを含む、態様210~288のいずれか1つに記載のキット。
291.支持体に接合されている前記ポリペプチドおよび付随する記録タグをもたらすための前記試薬が、前記支持体上の前記ポリペプチドと前記付随する記録タグの共有結合性連結をもたらす、態様210~290のいずれか1つに記載のキット。
292.前記支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、態様210~291のいずれか1つに記載のキット。
293.前記支持体が、金、銀、半導体または量子ドットを含む、態様292に記載のキット。
294.前記ナノ粒子が、金、銀、または量子ドットを含む、態様292に記載のキット。
295.前記支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、態様292に記載のキット。
296.支持体に接合されている前記ポリペプチドおよび付随する記録タグをもたらすための前記試薬が、前記支持体に連結されている複数のポリペプチドおよび付随する記録タグをもたらす、態様210~295のいずれか1つに記載のキット。
297.前記複数のポリペプチドの間に支持体上で間隔をあけ、前記ポリペプチド間の平均距離が、約≧20nmである、態様296に記載のキット。
298.前記結合性物質が、ペプチドまたはタンパク質である、態様210~297のいずれか1つに記載のキット。
299.前記結合性物質が、アミノペプチダーゼまたはそのバリアント、変異体もしくは修飾タンパク質;アミノアシルtRNA合成酵素またはそのバリアント、変異体もしくは修飾タンパク質;アンチカリンまたはそのバリアント、変異体もしくは修飾タンパク質;ClpSまたはそのバリアント、変異体もしくは修飾タンパク質;あるいはアミノ酸に結合する修飾小分子、すなわちバンコマイシンまたはそのバリアント、変異体もしくは修飾分子;あるいは抗体またはその結合断片;あるいはこれらの任意の組合せを含む、態様210~298のいずれか1つに記載のキット。
300.前記結合性物質が、単一のアミノ酸残基(例えば、N末端アミノ酸残基、C末端アミノ酸残基、もしくは内部アミノ酸残基)、ジペプチド(例えば、N末端ジペプチド、C末端ジペプチド、もしくは内部ジペプチド)、トリペプチド(例えば、N末端トリペプチド、C末端トリペプチド、もしくは内部トリペプチド)、または前記分析物もしくはポリペプチドの翻訳後修飾に結合する、態様210~299のいずれか1つに記載のキット。
301.前記結合性物質が、NTAA官能化単一アミノ酸残基、NTAA官能化ジペプチド、NTAA官能化トリペプチド、またはNTAA官能化ポリペプチドに結合する、態様210~300のいずれか1つに記載のキット。
302.前記結合性物質が、前記ポリペプチドに選択的に結合することが可能である、態様210~301のいずれか1つに記載のキット。
303.前記コーディングタグが、DNA分子、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはこれらの組合せである、態様210~302のいずれか1つに記載のキット。
304.前記コーディングタグが、エンコーダーまたはバーコード配列を含む、態様210~303のいずれか1つに記載のキット。
305.前記コーディングタグが、スペーサー、結合サイクル特異的配列、一意の分子識別子、ユニバーサルプライミング部位、またはこれらの任意の組合せをさらに含む、態様210~304のいずれか1つに記載のキット。
306.前記結合性物質中の前記結合性部分および前記コーディングタグが、リンカーにより接合されている、態様210~305のいずれか1つに記載のキット。
307.前記結合性部分および前記コーディングタグが、SpyTag/SpyCatcherペプチド-タンパク質対、SnoopTag/SnoopCatcherペプチド-タンパク質対、またはHaloTag/HaloTagリガンド対によって接合されている、態様210~305のいずれか1つに記載のキット。
308.前記コーディングタグの情報を前記記録タグに移行させるための試薬が、DNAリガーゼまたはRNAリガーゼを含む、態様210~307のいずれか1つに記載のキット。
309.前記コーディングタグの情報を前記記録タグに移行させるための試薬が、DNAポリメラーゼ、RNAポリメラーゼ、または逆転写酵素を含む、態様210~307のいずれか1つに記載のキット。
310.前記コーディングタグの情報を前記記録タグに移行させるための試薬が、化学的ライゲーション試薬を含む、態様210~307のいずれか1つに記載のキット。
311.前記化学的ライゲーション試薬が、一本鎖DNAに関して使用するためのものである、態様310に記載のキット。
312.前記化学的ライゲーション試薬が、二本鎖DNAに関して使用するためのものである、態様310に記載のキット。
313.2つのDNAまたはRNAリガーゼバリアント、アデニル化バリアントおよび構成的にアデニル化されていないバリアントで構成されている、ライゲーション試薬をさらに含む、態様210~312のいずれか1つに記載のキット。
314.DNAまたはRNAリガーゼおよびDNA/RNAデアデニレースで構成されている、ライゲーション試薬をさらに含む、態様210~312のいずれか1つに記載のキット。
315.核酸配列決定法のための試薬をさらに含む、態様210~314のいずれか1つに記載のキット。
316.前記核酸配列決定法が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、態様315に記載のキット。
317.前記核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したDNAのダイレクトイメージングである、態様315に記載のキット。
318.前記伸長記録タグを増幅するための試薬をさらに含む、態様210~317のいずれか1つに記載のキット。
319.サイクル標識を付加するための試薬をさらに含む、態様210~318のいずれか1つに記載のキット。
320.前記サイクル標識が、前記結合性物質による前記ポリペプチドへの結合の順序に関する情報を提供する、態様319に記載のキット。
321.前記サイクル標識を前記コーディングタグに付加することができる、態様319または態様320に記載のキット。
322.前記サイクル標識を前記記録タグに付加することができる、態様319または態様320に記載のキット。
323.前記サイクル標識を前記結合性物質に付加することができる、態様319または態様320に記載のキット。
324.前記サイクル標識を、前記コーディングタグ、記録タグ(recording tab)および結合性物質とは独立に付加することができる、態様319または態様320に記載のキット。
325.前記伸長記録タグに含有されるコーディングタグ情報の順序が、前記結合性物質による前記ポリペプチドへの結合の順序に関する情報を提供する、態様210~324のいずれか1つに記載のキット。
326.前記伸長記録タグに含有されるコーディングタグ情報の頻度が、前記結合性物質による前記ポリペプチドへの結合の頻度に関する情報を提供する、態様210~325のいずれか1つに記載のキット。
327.複数のタンパク質複合体、タンパク質またはポリペプチドを含む試料由来の1つまたは複数のポリペプチドを解析するために構成される、態様210~326のいずれか1つに記載のキット。
328.前記試料中の前記複数のタンパク質複合体、タンパク質、またはポリペプチドを複数のコンパートメントに分配するための手段であって、各コンパートメントが、支持体(例えば、固体支持体)に必要に応じて接合されている複数のコンパートメントタグを含み、前記複数のコンパートメントタグが、個々のコンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、手段をさらに含む、態様327に記載のキット。
329.前記複数のタンパク質複合体、タンパク質、および/またはポリペプチドを複数のポリペプチドに断片化するための試薬をさらに含む、態様327または態様328に記載のキット。
330.前記コンパートメントが、マイクロ流体液滴である、態様328に記載のキット。
331.前記コンパートメントが、マイクロウェルである、態様328に記載のキット。
332.前記コンパートメントが、表面上の分離された領域である、態様328に記載のキット。
333.各コンパートメントが、平均して単一の細胞を含む、態様328~332のいずれか1つに記載のキット。
334.前記複数のタンパク質複合体、タンパク質、またはポリペプチドを複数のユニバーサルDNAタグで標識するための試薬をさらに含む、態様327~333のいずれか1つに記載のキット。
335.前記コンパートメントタグ情報を、ポリペプチドに付随する前記記録タグに移行させるための試薬が、プライマー伸長またはライゲーション試薬を含む、態様328~334のいずれか1つに記載のキット。
336.前記支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、態様328~335のいずれか1つに記載のキット。
337.前記支持体が、ビーズを含む、態様328~335のいずれか1つに記載のキット。
338.前記ビーズが、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、態様337に記載のキット。
339.前記コンパートメントタグが、一本鎖または二本鎖核酸分子を含む、態様328~338のいずれか1つに記載のキット。
340.前記コンパートメントタグが、バーコードおよび必要に応じてUMIを含む、態様328~339のいずれか1つに記載のキット。
341.前記支持体がビーズであり、前記コンパートメントタグがバーコードを含み、さらに、前記複数のコンパートメントタグが接合されているビーズが、スプリット・アンド・プール合成により形成される、態様340に記載のキット。
342.前記支持体がビーズであり、前記コンパートメントタグがバーコードを含み、さらに、複数のコンパートメントタグが接合されているビーズが、個々の合成または固定化により形成される、態様340に記載のキット。
343.前記コンパートメントタグが、記録タグ内の成分であり、前記記録タグが、必要に応じて、スペーサー、バーコード配列、一意の分子識別子、ユニバーサルプライミング部位、またはこれらの任意の組合せをさらに含む、態様328~342のいずれか1つに記載のキット。
344.前記コンパートメントタグが、前記複数のタンパク質複合体、タンパク質またはポリペプチドの内部アミノ酸、ペプチド骨格、またはN末端アミノ酸と反応することができる機能的部分をさらに含む、態様328~343のいずれか1つに記載のキット。
345.機能的部分が、アルデヒド、アジド/アルキン、またはマレイミド(malemide)/チオール、またはエポキシド/求核試薬、または逆電子要請型(inverse electron demain)ディールス-アルダー(iEDDA)基である、態様344に記載のキット。
346.前記機能的部分が、アルデヒド基である、態様344に記載のキット。
347.前記複数のコンパートメントタグが、前記コンパートメントタグを前記コンパートメントに印刷、スポッティング、インク噴射すること、またはその組合せにより形成される、態様328~346のいずれか1つに記載のキット。
348.前記コンパートメントタグが、ポリペプチドをさらに含む、態様328~347のいずれか1つに記載のキット。
349.前記コンパートメントタグポリペプチドが、タンパク質リガーゼ認識配列を含む、態様348に記載のキット。
350.前記タンパク質リガーゼが、ブテラーゼIまたはそのホモログである、態様349に記載のキット。
351.前記複数のポリペプチドを断片化するための試薬が、プロテアーゼを含む、態様328~350のいずれか1つに記載のキット。
352.前記プロテアーゼが、メタロプロテアーゼである、態様351に記載のキット。
353.前記メタロプロテアーゼの活性をモジュレートするための試薬、例えば、メタロプロテアーゼの金属カチオンの光活性化放出のための試薬をさらに含む、態様352に記載のキット。
354.前記複数のポリペプチドを前記複数のコンパートメントに分配する前に1つまたは複数の豊富なタンパク質を前記試料からサブトラクションするための試薬をさらに含む、態様328~353のいずれか1つに記載のキット。
355.前記複数のポリペプチドと前記コンパートメントタグを接合させる前に前記コンパートメントタグを前記支持体から遊離させるための試薬をさらに含む、態様328~354のいずれか1つに記載のキット。
356.前記コンパートメントタグ付きポリペプチドを支持体に記録タグを伴って接合させるための試薬をさらに含む、態様328に記載のキット。
357.ポリペプチド官能化試薬、アミノ酸消去試薬および/または反応条件についてスクリーニングするための方法であって、
(a)ポリヌクレオチドとポリペプチド官能化試薬および/またはアミノ酸消去試薬とを反応条件下で接触させるステップと;
(b)前記ポリヌクレオチドに対するステップ(a)の効果を、必要に応じて、前記ポリヌクレオチドに対して全くまたはほとんど効果がないポリペプチド官能化試薬、アミノ酸消去試薬および/または反応条件を同定するために、評価するステップと
を含む方法。
358.前記ポリヌクレオチドが、少なくとも約4つのヌクレオチドを含む、態様357に記載の方法。
359.前記ポリヌクレオチドが、最大で約10kbのヌクレオチドを含む、態様357に記載の方法。
360.前記ポリヌクレオチドが、DNAポリヌクレオチドである、態様357~359のいずれか1つに記載の方法。
361.前記ポリヌクレオチドが、ゲノムDNAであるか、前記方法が、ゲノムDNAの存在下で行われる、態様357~360のいずれか1つに記載の方法。
362.前記ポリヌクレオチドが、単離されたポリヌクレオチドである、態様357~360のいずれか1つに記載の方法。
363.前記ポリヌクレオチドが、前記ポリペプチドの結合性物質の一部である、態様357~360のいずれか1つに記載の方法。
364.前記ポリヌクレオチドと前記ポリペプチド官能化試薬および/または前記アミノ酸消去試薬とを反応条件下、前記ポリペプチドの非存在下で接触させる、態様357~363のいずれか1つに記載の方法。
365.前記ポリヌクレオチドと前記ポリペプチド官能化試薬および/または前記アミノ酸消去試薬とを反応条件下、前記ポリペプチドの存在下で接触させる、態様357~363のいずれか1つに記載の方法。
366.前記ポリヌクレオチドが、前記ポリペプチドの結合性物質の一部である、態様365に記載の方法。
367. 前記ポリペプチド官能化試薬が、
(i)式(I)の化合物:
Figure 0007390027000086
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、シクロアルキル、-C(O)R、-C(O)OR、または-S(O)であり;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されており;
は、ヘテロアリール、-NRC(O)OR、または-SRであり、ここでのヘテロアリールは、非置換であるか、または置換されており;
、R、およびRは、各々独立して、HまたはC1~6アルキルであり;ならびに
必要に応じて、R
Figure 0007390027000087
であるときにはRおよびRは両方ともHでない);
(ii)式(II)の化合物:
Figure 0007390027000088
またはその塩もしくはコンジュゲート
(式中、
は、H、C1~6アルキル、シクロアルキル、-C(O)R、または-C(O)ORであり;
は、H、C1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、またはアリールアルキルであり、ここでのC1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、およびアリールアルキルは、各々、非置換であるか、または置換されている);
(iii)式(III)の化合物:
-N=C=S (III)
またはその塩もしくはコンジュゲート
(式中、
は、C1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールであり;
ここでのC1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールは、各々、非置換であるか、またはハロ、-NR、-S(O)、もしくはヘテロシクリルからなる群から選択される1つもしくは複数の基で置換されており;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されている);
(iv)式(IV)の化合物:
Figure 0007390027000089
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、-CO1~4アルキル、-OR、アリール、またはシクロアルキルであり、ここでのC1~6アルキル、-CO1~4アルキル、-OR、アリール、およびシクロアルキルは、各々、非置換であるか、または置換されており;
は、H、C1~6アルキル、またはヘテロシクリルであり、ここでのC1~6アルキルおよびヘテロシクリルは、各々、非置換であるか、または置換されている);
(v)式(V)の化合物:
Figure 0007390027000090
またはその塩もしくはコンジュゲート
(式中、
は、ハロまたは-ORであり;
は、H、C1~6アルキル、またはヘテロシクリルであり;
は、水素、ハロ、またはC1~6ハロアルキルである);
(vi)式(VI)の金属錯体:
ML (VI)
またはその塩もしくはコンジュゲート
(式中、
Mは、Co、Cu、Pd、Pt、Zn、およびNiからなる群から選択される金属であり;
Lは、-OH、-OH、2,2’-ビピリジン(bpy)、1,5ジチアシクロオクタン(dtco)、1,2-ビス(ジフェニルホスフィノ)エタン(dppe)、エチレンジアミン(en)、およびトリエチレンテトラミン(trien)からなる群から選択される配位子であり;
nは、1および8を含む、1~8の整数であり;
各Lは、同じであってもよく、または異なっていてもよい);および
(vii)式(VII)の化合物:
Figure 0007390027000091
またはその塩もしくはコンジュゲート
(式中、
は、N、NR13、またはCR1314であり;
は、NまたはCHであり;
pは、0または1であり;
10、R11、R12、R13、およびR14は、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンからなる群から選択され、ここでのC1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンは、各々、非置換であるか、または置換されており、ならびにR10およびR11は、必要に応じて、一緒になって環を形成していることもあり;
15は、HまたはOHである)
からなる群から選択される化合物を含む、態様357~366のいずれか1つに記載の方法。
368.前記アミノ酸消去試薬が、化学的切断試薬または酵素的切断試薬である、態様357~367のいずれか1つに記載の方法。
369.前記アミノ酸消去試薬が、カルボキシペプチダーゼもしくはアミノペプチダーゼまたはそのバリアント、変異体、もしくは修飾タンパク質;ヒドロラーゼまたはそのバリアント、変異体、もしくは修飾タンパク質;穏やかなエドマン分解試薬;エドマナーゼ酵素;TFA、塩基;あるいはこれらの任意の組合せである、態様368に記載の方法。
370.前記反応条件が、反応時間、反応温度、反応pH、溶媒のタイプ、共溶媒、触媒、およびイオン液体、および電気化学的ポテンシャルを含む、態様357~369のいずれか1つに記載の方法。
371.ステップ(a)が、溶液中で行われる、態様357~370のいずれか1つに記載の方法。
372.ステップ(a)が、固相で行われる、態様357~370のいずれか1つに記載の方法。
373.前記ポリヌクレオチドに対するステップ(a)の効果が、前記ポリペプチド官能化試薬、前記アミノ酸消去試薬および/または前記反応条件による前記ポリヌクレオチドの修飾の存在、非存在または量を評価することにより評価される、態様357~372のいずれか1つに記載の方法。
374.前記ポリヌクレオチドについての、反応条件下でポリペプチド官能化試薬および/またはアミノ酸消去試薬と接触させていない対応するポリヌクレオチドと比較して50%未満の修飾によって、前記ポリヌクレオチドに対して全くまたはほとんど効果がない前記ポリペプチド官能化試薬、前記アミノ酸消去試薬および/または前記反応条件が同定される、態様357~373のいずれか1つに記載の方法。
375.ポリペプチド官能化試薬、アミノ酸消去試薬および/または反応条件についてスクリーニングするためのキットであって、(a)ポリヌクレオチドと;(b)ポリペプチド官能化試薬および/またはアミノ酸消去試薬と;(c)前記ポリペプチド官能化試薬、前記アミノ酸消去試薬および/またはポリペプチド官能化もしくは消去のための反応条件の前記ポリヌクレオチドに対する効果を評価するための手段とを含むキット。
376. 前記ポリペプチド官能化試薬が、
(i)式(I)の化合物:
Figure 0007390027000092
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、シクロアルキル、-C(O)R、-C(O)OR、または-S(O)であり;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されており;
は、ヘテロアリール、-NRC(O)OR、または-SRであり、ここでのヘテロアリールは、非置換であるか、または置換されており;
、R、およびRは、各々独立して、HまたはC1~6アルキルであり;ならびに
必要に応じて、R
Figure 0007390027000093
であるときにはRおよびRは両方ともHでない);
(ii)式(II)の化合物:
Figure 0007390027000094
またはその塩もしくはコンジュゲート
(式中、
は、H、C1~6アルキル、シクロアルキル、-C(O)R、または-C(O)ORであり;
は、H、C1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、またはアリールアルキルであり、ここでのC1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、およびアリールアルキルは、各々、非置換であるか、または置換されている);
(iii)式(III)の化合物:
-N=C=S (III)
またはその塩もしくはコンジュゲート
(式中、
は、C1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールであり;
ここでのC1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールは、各々、非置換であるか、またはハロ、-NR、-S(O)、もしくはヘテロシクリルからなる群から選択される1つもしくは複数の基で置換されており;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されている);
(iv)式(IV)の化合物:
Figure 0007390027000095
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、-CO1~4アルキル、-OR、アリール、またはシクロアルキルであり、ここでのC1~6アルキル、-CO1~4アルキル、-OR、アリール、およびシクロアルキルは、各々、非置換であるか、または置換されており;
は、H、C1~6アルキル、またはヘテロシクリルであり、ここでのC1~6アルキルおよびヘテロシクリルは、各々、非置換であるか、または置換されている);
(v)式(V)の化合物:
Figure 0007390027000096
またはその塩もしくはコンジュゲート
(式中、
は、ハロまたは-ORであり;
は、H、C1~6アルキル、またはヘテロシクリルであり;
は、水素、ハロ、またはC1~6ハロアルキルである);
(vi)式(VI)の金属錯体:
ML (VI)
またはその塩もしくはコンジュゲート
(式中、
Mは、Co、Cu、Pd、Pt、Zn、およびNiからなる群から選択される金属であり;
Lは、-OH、-OH、2,2’-ビピリジン(bpy)、1,5ジチアシクロオクタン(dtco)、1,2-ビス(ジフェニルホスフィノ)エタン(dppe)、エチレンジアミン(en)、およびトリエチレンテトラミン(trien)からなる群から選択される配位子であり;
nは、1および8を含む、1~8の整数であり;
各Lは、同じであってもよく、または異なっていてもよい);および
(vii)式(VII)の化合物:
Figure 0007390027000097
またはその塩もしくはコンジュゲート
(式中、
は、N、NR13、またはCR1314であり;
は、NまたはCHであり;
pは、0または1であり;
10、R11、R12、R13、およびR14は、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンからなる群から選択され、ここでのC1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンは、各々、非置換であるか、または置換されており、ならびにR10およびR11は、必要に応じて、一緒になって環を形成していることもあり;
15は、HまたはOHである)
からなる群から選択される化合物を含む、態様375に記載のキット。
377.ポリペプチド官能化試薬およびアミノ酸消去試薬を含む、態様375または態様376に記載のキット。
378.ポリペプチドを配列決定する方法であって、
(a)前記ポリペプチドを支持体もしくは基板に取り付ける、または溶液中の前記ポリペプチドを提供するステップと;
(b)前記ポリペプチドのN末端アミノ酸(NTAA)を化学試薬で官能化するステップであって、前記化学試薬が、
(i)式(I)の化合物:
Figure 0007390027000098
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、シクロアルキル、-C(O)R、-C(O)OR、または-S(O)であり;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されており;
は、ヘテロアリール、-NRC(O)OR、または-SRであり、ここでのヘテロアリールは、非置換であるか、または置換されており;
、R、およびRは、各々独立して、HまたはC1~6アルキルであり;ならびに
必要に応じて、R
Figure 0007390027000099
であるときにはRおよびRは両方ともHでない);
(ii)式(II)の化合物:
Figure 0007390027000100
またはその塩もしくはコンジュゲート
(式中、
は、H、C1~6アルキル、シクロアルキル、-C(O)R、または-C(O)ORであり;
は、H、C1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、またはアリールアルキルであり、ここでのC1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、およびアリールアルキルは、各々、非置換であるか、または置換されている);
(iii)式(III)の化合物:
-N=C=S (III)
またはその塩もしくはコンジュゲート
(式中、
は、C1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールであり;
ここでのC1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールは、各々、非置換であるか、またはハロ、-NR、-S(O)、もしくはヘテロシクリルからなる群から選択される1つもしくは複数の基で置換されており;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されている);
(iv)式(IV)の化合物:
Figure 0007390027000101
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、-CO1~4アルキル、-OR、アリール、またはシクロアルキルであり、ここでのC1~6アルキル、-CO1~4アルキル、-OR、アリール、およびシクロアルキルは、各々、非置換であるか、または置換されており;
は、H、C1~6アルキル、またはヘテロシクリルであり、ここでのC1~6アルキルおよびヘテロシクリルは、各々、非置換であるか、または置換されている);
(v)式(V)の化合物:
Figure 0007390027000102
またはその塩もしくはコンジュゲート
(式中、
は、ハロまたは-ORであり;
は、H、C1~6アルキル、またはヘテロシクリルであり;
は、水素、ハロ、またはC1~6ハロアルキルである);
(vi)式(VI)の金属錯体:
ML (VI)
またはその塩もしくはコンジュゲート
(式中、
Mは、Co、Cu、Pd、Pt、Zn、およびNiからなる群から選択される金属であり;
Lは、-OH、-OH、2,2’-ビピリジン(bpy)、1,5ジチアシクロオクタン(dtco)、1,2-ビス(ジフェニルホスフィノ)エタン(dppe)、エチレンジアミン(en)、およびトリエチレンテトラミン(trien)からなる群から選択される配位子であり;
nは、1および8を含む、1~8の整数であり;
各Lは、同じであってもよく、または異なっていてもよい);および
(vii)式(VII)の化合物:
Figure 0007390027000103
またはその塩もしくはコンジュゲート
(式中、
は、N、NR13、またはCR1314であり;
は、NまたはCHであり;
pは、0または1であり;
10、R11、R12、R13、およびR14は、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンからなる群から選択され、ここでのC1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンは、各々、非置換であるか、または置換されており、ならびにR10およびR11は、必要に応じて、一緒になって環を形成していることもあり;
15は、HまたはOHである)
からなる群から選択される化合物を含む、ステップと;
(c)前記ポリペプチドを、官能化されたNTAAおよび検出可能な標識に結合することが可能な結合性部分を各々が含む複数の結合性物質と、接触させるステップと;
(d)前記ポリペプチドに結合した前記結合性物質の前記検出可能な標識を検出することによって、前記ポリペプチドのN末端アミノ酸を識別するステップと;
(e)前記官能化されたNTAAを消去して新しいNTAAを露出させるステップと;
(f)ステップ(b)~(d)を繰り返して、前記ポリペプチドの少なくとも一部分の配列を決定するステップと
を含む方法。
379.ステップ(b)が、ステップ(c)の前に行われる、態様378に記載の方法。
380.ステップ(b)が、ステップ(c)の後かつステップ(d)の前に行われる、態様378に記載の方法。
381.ステップ(b)が、ステップ(c)とステップ(d)の両方の後に行われる、態様378に記載の方法。
382.前記ポリペプチドが、生体試料由来のタンパク質を断片化することにより得られる、態様378~381のいずれか1つに記載の方法。
383.前記支持体または基材が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、態様378~382のいずれか1つに記載の方法。
384.前記NTAAが、化学的切断または酵素的切断により前記ポリペプチドから消去される、態様378~383のいずれか1つに記載の方法。
385.前記NTAAが、カルボキシペプチダーゼもしくはアミノペプチダーゼまたはそのバリアント、変異体、もしくは修飾タンパク質;ヒドロラーゼまたはそのバリアント、変異体、もしくは修飾タンパク質;穏やかなエドマン分解;エドマナーゼ酵素;TFA、塩基;あるいはこれらの任意の組合せにより消去される、態様378~384のいずれか1つに記載の方法。
386.前記ポリペプチドが、前記支持体または基板に共有結合により取り付けられる、態様378~385のいずれか1つに記載の方法。
387.前記支持体または基板が、光学的に透明である、態様378~386のいずれか1つに記載の方法。
388.前記支持体または基板が、複数の空間分解された付着点を含み、ステップa)が、空間分解された付着点に前記ポリペプチドを取り付けることを含む、態様378~387のいずれか1つに記載の方法。
389.前記結合性物質の前記結合性部分が、ペプチドまたはタンパク質を含む、態様378~388のいずれか1つに記載の方法。
390.前記結合性物質の前記結合性部分が、アミノペプチダーゼまたはそのバリアント、変異体もしくは修飾タンパク質;アミノアシルtRNA合成酵素またはそのバリアント、変異体もしくは修飾タンパク質;アンチカリンまたはそのバリアント、変異体もしくは修飾タンパク質;ClpS(例えば、ClpS2)またはそのバリアント、変異体もしくは修飾タンパク質;UBRボックスタンパク質またはそのバリアント、変異体もしくは修飾タンパク質;あるいはアミノ酸に結合する修飾小分子、すなわちバンコマイシンまたはそのバリアント、変異体もしくは修飾分子;あるいは抗体またはその結合断片;あるいはこれらの任意の組合せを含む、態様378~389のいずれか1つに記載の方法。
391.前記化学試薬が、
Figure 0007390027000104
(式中、R、R、およびRは、態様1において式(I)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000105
(式中、Rは、態様1において式(II)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000106
(式中、Rは、態様1において式(III)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000107
(式中、RおよびRは、態様1において式(IV)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000108
(式中、RおよびRは、態様1において式(V)について定義されているとおりであり、Qは、配位子である);
(ML)-Q 式(VI)-Q
(式中、M、L、およびnは、態様1において式(VI)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000109
(式中、R10、R11、R12、R15、G、G、およびpは、態様1において式(VII)について定義されているとおりであり、Qは、配位子である)
からなる群から選択されるコンジュゲートを含む、態様378~390のいずれか1つに記載の方法。
392.ステップ(b)が、前記NTAAを、式(VIIIa)および(VIIIb):
Figure 0007390027000110
またはその塩もしくはコンジュゲート
(式中、
13は、H、C1~6アルキル、アリール、ヘテロアリール、シクロアルキル、またはヘテロシクロアルキルであり、ここでのC1~6アルキル、アリール、ヘテロアリール、シクロアルキル、およびヘテロシクロアルキルは、各々、非置換であるか、または置換されている);および
13-X (VIIIb)
(式中、
13は、C1~6アルキル、アリール、ヘテロアリール、シクロアルキル、またはヘテロシクロアルキルであり、これらの各々は、非置換であるか、または置換されており、
Xは、ハロゲンである)
から選択される第2の化学試薬で官能化することを含む、態様378~391のいずれか1つに記載の方法。
393.前記ポリペプチドが、部分的にまたは完全に消化されたタンパク質である、態様378~392のいずれか1つに記載の方法。
394.試料中の複数のポリペプチド分子を配列決定する方法であって、
(a)前記試料中の前記ポリペプチド分子を支持体または基板上の複数の空間分解された付着点に取り付けるステップと;
(b)前記ポリペプチド分子のN末端アミノ酸(NTAA)を化学試薬で官能化するステップであって、前記化学試薬が、
(i)式(I)の化合物:
Figure 0007390027000111
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、シクロアルキル、-C(O)R、-C(O)OR、または-S(O)であり;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されており;
は、ヘテロアリール、-NRC(O)OR、または-SRであり、ここでのヘテロアリールは、非置換であるか、または置換されており;
、R、およびRは、各々独立して、HまたはC1~6アルキルであり;ならびに
必要に応じて、R
Figure 0007390027000112
であるときにはRおよびRは両方ともHでない);
(ii)式(II)の化合物:
Figure 0007390027000113
またはその塩もしくはコンジュゲート
(式中、
は、H、C1~6アルキル、シクロアルキル、-C(O)R、または-C(O)ORであり;
は、H、C1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、またはアリールアルキルであり、ここでのC1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、およびアリールアルキルは、各々、非置換であるか、または置換されている);
(iii)式(III)の化合物:
-N=C=S (III)
またはその塩もしくはコンジュゲート
(式中、
は、C1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールであり;
ここでのC1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールは、各々、非置換であるか、またはハロ、-NR、-S(O)、もしくはヘテロシクリルからなる群から選択される1つもしくは複数の基で置換されており;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されている);
(iv)式(IV)の化合物:
Figure 0007390027000114
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、-CO1~4アルキル、-OR、アリール、またはシクロアルキルであり、ここでのC1~6アルキル、-CO1~4アルキル、-OR、アリール、およびシクロアルキルは、各々、非置換であるか、または置換されており;
は、H、C1~6アルキル、またはヘテロシクリルであり、ここでのC1~6アルキルおよびヘテロシクリルは、各々、非置換であるか、または置換されている);
(v)式(V)の化合物:
Figure 0007390027000115
またはその塩もしくはコンジュゲート
(式中、
は、ハロまたは-ORであり;
は、H、C1~6アルキル、またはヘテロシクリルであり;
は、水素、ハロ、またはC1~6ハロアルキルである);
(vi)式(VI)の金属錯体:
ML (VI)
またはその塩もしくはコンジュゲート
(式中、
Mは、Co、Cu、Pd、Pt、Zn、およびNiからなる群から選択される金属であり;
Lは、-OH、-OH、2,2’-ビピリジン(bpy)、1,5ジチアシクロオクタン(dtco)、1,2-ビス(ジフェニルホスフィノ)エタン(dppe)、エチレンジアミン(en)、およびトリエチレンテトラミン(trien)からなる群から選択される配位子であり;
nは、1および8を含む、1~8の整数であり;
各Lは、同じであってもよく、または異なっていてもよい);および
(vii)式(VII)の化合物:
Figure 0007390027000116
またはその塩もしくはコンジュゲート
(式中、
は、N、NR13、またはCR1314であり;
は、NまたはCHであり;
pは、0または1であり;
10、R11、R12、R13、およびR14は、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンからなる群から選択され、ここでのC1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンは、各々、非置換であるか、または置換されており、ならびにR10およびR11は、必要に応じて、一緒になって環を形成していることもあり;
15は、HまたはOHである)
からなる群から選択される化合物を含む、ステップと;
(c)前記ポリペプチドを、官能化されたNTAAおよび検出可能な標識に結合することが可能な結合性部分を各々が含む複数の結合性物質と、接触させるステップと;
(d)空間分解されて前記支持体または基板に取り付けられている複数のポリペプチド分子について、必要に応じて、各ポリペプチドに結合しているプローブの蛍光レベルを光学的に検出するステップと;
(e)前記ポリペプチドの各々の前記官能化されたNTAAを消去するステップと;
(f)ステップb)~d)を繰り返して、空間分解されて前記支持体または基板に取り付けられている前記複数のポリペプチド分子のうちの1つまたは複数についての少なくとも一部分の配列を決定するステップと
を含む方法。
395.ステップ(b)が、ステップ(c)の前に行われる、態様394に記載の方法。
396.ステップ(b)が、ステップ(c)の後かつステップ(d)の前に行われる、態様394に記載の方法。
397.ステップ(b)が、ステップ(c)とステップ(d)の両方の後に行われる、態様394に記載の方法。
398.前記試料が、生体液、細胞抽出物または組織抽出物を含む、態様394~397のいずれか1つに記載の方法。
399.ステップe)において決定された少なくとも1つのポリペプチド分子の配列を参照タンパク質配列データベースと比較するステップをさらに含む、態様394~398のいずれか1つに記載の方法。
400.ステップe)において決定された各ポリペプチドの配列を比較するステップ、類似のポリペプチド配列を群分けするステップ、および類似のポリペプチド配列各々のインスタンス数を計数するステップをさらに含む、態様394~399のいずれか1つに記載の方法。
401.前記蛍光標識が、蛍光部分、色分けされたナノ粒子、または量子ドットである、態様394~400のいずれか1つに記載の方法。
402.ポリペプチドを配列決定するためのキットであって、
(a)前記ポリペプチドを支持体もしくは基板に取り付けるための試薬、または溶液中の前記ポリペプチドをもたらすための試薬;
(b)前記ポリペプチドのN末端アミノ酸(NTAA)を官能化するための試薬であって、
(i)式(I)の化合物:
Figure 0007390027000117
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、シクロアルキル、-C(O)R、-C(O)OR、または-S(O)であり;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されており;
は、ヘテロアリール、-NRC(O)OR、または-SRであり、ここでのヘテロアリールは、非置換であるか、または置換されており;
、R、およびRは、各々独立して、HまたはC1~6アルキルであり;ならびに
必要に応じて、R
Figure 0007390027000118
であるときにはRおよびRは両方ともHでない);
(ii)式(II)の化合物:
Figure 0007390027000119
またはその塩もしくはコンジュゲート
(式中、
は、H、C1~6アルキル、シクロアルキル、-C(O)R、または-C(O)ORであり;
は、H、C1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、またはアリールアルキルであり、ここでのC1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、およびアリールアルキルは、各々、非置換であるか、または置換されている);
(iii)式(III)の化合物:
-N=C=S (III)
またはその塩もしくはコンジュゲート
(式中、
は、C1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールであり;
ここでのC1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールは、各々、非置換であるか、またはハロ、-NR、-S(O)、もしくはヘテロシクリルからなる群から選択される1つもしくは複数の基で置換されており;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されている);
(iv)式(IV)の化合物:
Figure 0007390027000120
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、-CO1~4アルキル、-OR、アリール、またはシクロアルキルであり、ここでのC1~6アルキル、-CO1~4アルキル、-OR、アリール、およびシクロアルキルは、各々、非置換であるか、または置換されており;
は、H、C1~6アルキル、またはヘテロシクリルであり、ここでのC1~6アルキルおよびヘテロシクリルは、各々、非置換であるか、または置換されている);
(v)式(V)の化合物:
Figure 0007390027000121
またはその塩もしくはコンジュゲート
(式中、
は、ハロまたは-ORであり;
は、H、C1~6アルキル、またはヘテロシクリルであり;
は、水素、ハロ、またはC1~6ハロアルキルである);
(vi)式(VI)の金属錯体:
ML (VI)
またはその塩もしくはコンジュゲート
(式中、
Mは、Co、Cu、Pd、Pt、Zn、およびNiからなる群から選択される金属であり;
Lは、-OH、-OH、2,2’-ビピリジン(bpy)、1,5ジチアシクロオクタン(dtco)、1,2-ビス(ジフェニルホスフィノ)エタン(dppe)、エチレンジアミン(en)、およびトリエチレンテトラミン(trien)からなる群から選択される配位子であり;
nは、1および8を含む、1~8の整数であり;
各Lは、同じであってもよく、または異なっていてもよい);および
(vii)式(VII)の化合物:
Figure 0007390027000122
またはその塩もしくはコンジュゲート
(式中、
は、N、NR13、またはCR1314であり;
は、NまたはCHであり;
pは、0または1であり;
10、R11、R12、R13、およびR14は、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンからなる群から選択され、ここでのC1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンは、各々、非置換であるか、または置換されており、ならびにR10およびR11は、必要に応じて、一緒になって環を形成していることもあり;
15は、HまたはOHである)
からなる群から選択される化合物を含む試薬と;
(c)前記官能化されたNTAAおよび検出可能な標識に結合することが可能な結合性部分を含む結合性物質と
を含むキット。
403.前記官能化されたNTAAを消去して新しいNTAAを露出させるための試薬をさらに含む、態様402に記載のキット。
404.前記ポリペプチドが、生体試料由来のタンパク質を断片化することにより得られる、態様402または態様403に記載のキット。
405.前記支持体または基材が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、態様402~404のいずれか1つに記載のキット。
406.前記官能化されたNTAAを消去するための試薬が、カルボキシペプチダーゼもしくはアミノペプチダーゼまたはそのバリアント、変異体、もしくは修飾タンパク質;ヒドロラーゼまたはそのバリアント、変異体、もしくは修飾タンパク質;穏やかなエドマン分解;エドマナーゼ酵素;TFA;塩基;あるいはこれらの任意の組合せである、態様403~405のいずれか1つに記載のキット。
407.前記ポリペプチドが、前記支持体または基板に共有結合により取り付けられる、態様402~406のいずれか1つに記載のキット。
408.前記支持体または基板が、光学的に透明である、態様402~407のいずれか1つに記載のキット。
409.前記支持体または基板が、複数の空間分解された付着点を含み、ステップa)が、空間分解された付着点に前記ポリペプチドを取り付けることを含む、態様402~408のいずれか1つに記載のキット。
410.前記結合性物質の前記結合性部分が、ペプチドまたはタンパク質を含む、態様402~409のいずれか1つに記載のキット。
411.前記結合性物質の前記結合性部分が、アミノペプチダーゼまたはそのバリアント、変異体もしくは修飾タンパク質;アミノアシルtRNA合成酵素またはそのバリアント、変異体もしくは修飾タンパク質;アンチカリンまたはそのバリアント、変異体もしくは修飾タンパク質;ClpS(例えば、ClpS2)またはそのバリアント、変異体もしくは修飾タンパク質;UBRボックスタンパク質またはそのバリアント、変異体もしくは修飾タンパク質;あるいはアミノ酸に結合する修飾小分子、すなわちバンコマイシンまたはそのバリアント、変異体もしくは修飾分子;あるいは抗体またはその結合断片;あるいはこれらの任意の組合せを含む、態様402~410のいずれか1つに記載のキット。
412.前記化学試薬が、
Figure 0007390027000123
(式中、R、R、およびRは、態様1において式(I)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000124
(式中、Rは、態様1において式(II)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000125
(式中、Rは、態様1において式(III)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000126
(式中、RおよびRは、態様1において式(IV)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000127
(式中、RおよびRは、態様1において式(V)について定義されているとおりであり、Qは、配位子である);
(ML)-Q 式(VI)-Q
(式中、M、L、およびnは、態様1において式(VI)について定義されているとおりであり、Qは、配位子である);
Figure 0007390027000128
(式中、R10、R11、R12、R15、G、G、およびpは、態様1において式(VII)について定義されているとおりであり、Qは、配位子である)
からなる群から選択されるコンジュゲートを含む、態様402~411のいずれか1つに記載のキット。
態様413.式(VIIIa)および(VIIIb):
Figure 0007390027000129
またはその塩もしくはコンジュゲート
(式中、
13は、H、C1~6アルキル、アリール、ヘテロアリール、シクロアルキル、またはヘテロシクロアルキルであり、ここでのC1~6アルキル、アリール、ヘテロアリール、シクロアルキル、およびヘテロシクロアルキルは、各々、非置換であるか、または置換されている);および
13-X (VIIIb)
(式中、
13は、C1~6アルキル、アリール、ヘテロアリール、シクロアルキル、またはヘテロシクロアルキルであり、これらの各々は、非置換であるか、または置換されており、
Xは、ハロゲンである)
から選択される第2の化学試薬を含む、態様402~412のいずれか1つに記載のキット。
414.前記ポリペプチドが、部分的にまたは完全に消化されたタンパク質である、態様402~413のいずれか1つに記載の方法。
415.試料中の複数のポリペプチド分子を配列決定するためのキットであって、
(a)前記試料中の前記ポリペプチド分子を支持体または基板上の複数の空間分解された付着点に取り付けるための試薬と;
(b)前記ポリペプチド分子のN末端アミノ酸(NTAA)を官能化するための試薬であって、
(i)式(I)の化合物:
Figure 0007390027000130
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、シクロアルキル、-C(O)R、-C(O)OR、または-S(O)であり;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されており;
は、ヘテロアリール、-NRC(O)OR、または-SRであり、ここでのヘテロアリールは、非置換であるか、または置換されており;
、R、およびRは、各々独立して、HまたはC1~6アルキルであり;ならびに
必要に応じて、R
Figure 0007390027000131
であるときにはRおよびRは両方ともHでない);
(ii)式(II)の化合物:
Figure 0007390027000132
またはその塩もしくはコンジュゲート
(式中、
は、H、C1~6アルキル、シクロアルキル、-C(O)R、または-C(O)ORであり;
は、H、C1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、またはアリールアルキルであり、ここでのC1~6アルキル、C2~6アルケニル、C1~6ハロアルキル、およびアリールアルキルは、各々、非置換であるか、または置換されている);
(iii)式(III)の化合物:
-N=C=S (III)
またはその塩もしくはコンジュゲート
(式中、
は、C1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールであり;
ここでのC1~6アルキル、C2~6アルケニル、シクロアルキル、ヘテロシクロアルキル、アリールまたはヘテロアリールは、各々、非置換であるか、またはハロ、-NR、-S(O)、もしくはヘテロシクリルからなる群から選択される1つもしくは複数の基で置換されており;
、R、およびRは、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールまたはヘテロアリールであり、ここでのC1~6アルキル、C1~6ハロアルキル、アリールアルキル、アリールおよびヘテロアリールは、各々、非置換であるか、または置換されている);
(iv)式(IV)の化合物:
Figure 0007390027000133
またはその塩もしくはコンジュゲート
(式中、
およびRは、各々独立して、H、C1~6アルキル、-CO1~4アルキル、-OR、アリール、またはシクロアルキルであり、ここでのC1~6アルキル、-CO1~4アルキル、-OR、アリール、およびシクロアルキルは、各々、非置換であるか、または置換されており;
は、H、C1~6アルキル、またはヘテロシクリルであり、ここでのC1~6アルキルおよびヘテロシクリルは、各々、非置換であるか、または置換されている);
(v)式(V)の化合物:
Figure 0007390027000134
またはその塩もしくはコンジュゲート
(式中、
は、ハロまたは-ORであり;
は、H、C1~6アルキル、またはヘテロシクリルであり;
は、水素、ハロ、またはC1~6ハロアルキルである);
(vi)式(VI)の金属錯体:
ML (VI)
またはその塩もしくはコンジュゲート
(式中、
Mは、Co、Cu、Pd、Pt、Zn、およびNiからなる群から選択される金属であり;
Lは、-OH、-OH、2,2’-ビピリジン(bpy)、1,5ジチアシクロオクタン(dtco)、1,2-ビス(ジフェニルホスフィノ)エタン(dppe)、エチレンジアミン(en)、およびトリエチレンテトラミン(trien)からなる群から選択される配位子であり;
nは、1および8を含む、1~8の整数であり;
各Lは、同じであってもよく、または異なっていてもよい);および
(vii)式(VII)の化合物:
Figure 0007390027000135
またはその塩もしくはコンジュゲート
(式中、
は、N、NR13、またはCR1314であり;
は、NまたはCHであり;
pは、0または1であり;
10、R11、R12、R13、およびR14は、各々独立して、H、C1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンからなる群から選択され、ここでのC1~6アルキル、C1~6ハロアルキル、C1~6アルキルアミン、およびC1~6アルキルヒドロキシルアミンは、各々、非置換であるか、または置換されており、ならびにR10およびR11は、必要に応じて、一緒になって環を形成していることもあり;
15は、HまたはOHである)
からなる群から選択される化合物を含む試薬と;
(c)前記官能化されたNTAAおよび検出可能な標識に結合することが可能な結合性部分を含む結合性物質と
を含むキット。
416.前記官能化されたNTAAを消去して新しいNTAAを露出させるための試薬をさらに含む、態様415に記載のキット。
態様417.前記試料が、生体液、細胞抽出物または組織抽出物を含む、態様415または416に記載のキット。
態様418.前記蛍光標識が、蛍光部分、色分けされたナノ粒子、または量子ドットである、態様415~417のいずれか1つに記載のキット。
前述の実施形態のいずれかでは、記録タグおよび/またはコーディングタグは、小分子であることもあり、またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素であることもある。
前述の実施形態のいずれかでは、記録タグおよび/またはコーディングタグは、ポリヌクレオチドまたは非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーであることがある。
前述の実施形態のいずれかでは、記録タグおよび/またはコーディングタグは、小分子を含むこともあり、またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素を含むこともある。
前述の実施形態のいずれかでは、記録タグが、配列決定可能なポリマーである一方で、コーディングタグは、小分子であることもあり、またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素であることもある。一部の実施形態では、コーディングタグ(小分子、サブユニットまたは単量体など)を記録タグに付加させて、糸(例えば、伸長記録タグ)に通したビーズ(例えば、様々なコーディングタグ)のようなものである配列決定可能なポリマーを形成することができる。
前述の実施形態のいずれかでは、伸長記録タグおよび/または伸長コーディングタグは、ポリヌクレオチドまたは非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーであることがある。
一態様では、(a)分析物を、前記分析物に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディング部分を含み、前記分析物には支持体に接合した記録部分が付随しており、前記分析物および/または前記記録部分が支持体に固定化されている、ステップと;(b)前記第1のコーディング部分の情報を前記記録部分に移行させて、一次伸長記録部分を生成するステップと;(c)前記分析物を、前記分析物に結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディング部分を含む、ステップと;(d)前記第2のコーディング部分の情報を前記一次伸長記録部分に移行させて、二次伸長記録部分を生成するステップと;(e)前記二次伸長記録部分を解析するステップとを含む方法が、本明細書で開示される。一実施形態では、この方法は、ステップ(d)と(e)の間に、(x)前記第2の結合性物質を、前記分析物に結合することが可能な第3の(またはより高次の)結合性物質に置き換えることにより、ステップ(c)および(d)を1回または複数回繰り返すステップであって、第3の(またはより高次の)結合性物質が、前記第3の(またはより高次の)結合性物質に関する識別情報を有する第3の(またはより高次の)コーディング部分を含む、ステップと;(y)前記第3の(またはより高次の)コーディング部分の情報を第2の(またはより高次の)伸長記録部分に移行させて、第3の(またはより高次の)伸長記録部分を生成するステップとをさらに含み、ステップ(e)において前記第3の(またはより高次の)伸長記録部分を解析する。
前述の実施形態のいずれかでは、記録部分は、小分子であることもあり、またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素であることもある。
前述の実施形態のいずれかでは、記録部分は、ポリヌクレオチドまたは非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーであることがある。一部の実施形態では、第1、第2、第3、および/またはより高次のコーディング部分は、小分子、および/またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素を含む。
前述の実施形態のいずれかでは、第1、第2、第3、および/またはより高次のコーディング部分は、小分子であることもあり、またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素であることもある。
前述の実施形態のいずれかでは、一次伸長記録部分、二次伸長記録部分、三次伸長記録部分、および/またはより高次の伸長記録部分は、ポリヌクレオチドまたは非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーであることがある。
別の態様では、(a)ポリペプチドを前記ポリペプチドの1つまたは複数のN末端、内部またはC末端アミノ酸に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディング部分を含み、前記ポリペプチドには支持体に接合した記録部分が付随しており、前記ポリペプチドおよび/または前記記録部分が支持体に固定化されている、ステップと;(b)前記第1のコーディング部分の情報を前記記録部分に移行させて、一次伸長記録部分を生成するステップと;(c)前記分析物を、前記ポリペプチドの異なる1つまたは複数のN末端、内部またはC末端アミノ酸に結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディング部分を含む、ステップと;(d)前記第2のコーディング部分の情報を前記一次伸長記録部分に移行させて、二次伸長記録部分を生成するステップと;(e)前記二次伸長記録部分を解析するステップとを含む方法が、本明細書で開示される。一実施形態では、前記ポリペプチドの1つもしくは複数のN末端、内部もしくはC末端アミノ酸および/または異なる1つもしくは複数のN末端、内部もしくはC末端アミノ酸は、修飾されたN末端アミノ酸(NTAA)などの、修飾されたアミノ酸である。
別の態様では、(a)ポリペプチドを前記ポリペプチドの1つまたは複数のN末端またはC末端アミノ酸に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディング部分を含み、前記ポリペプチドには支持体に接合した記録部分が付随しており、前記ポリペプチドおよび/または前記記録部分が支持体に固定化されている、ステップと;(b)前記第1のコーディング部分の情報を前記記録部分に移行させて、一次伸長記録部分を生成するステップと;(c)前記ポリペプチドの1つまたは複数のN末端またはC末端アミノ酸を消失させて、前記ポリペプチドの異なる1つまたは複数のN末端またはC末端アミノ酸を露出させるステップと;(d)前記分析物を、前記ポリペプチドの異なる1つまたは複数のN末端またはC末端アミノ酸に結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディング部分を含む、ステップと;(e)前記第2のコーディング部分の情報を前記一次伸長記録部分に移行させて、二次伸長記録部分を生成するステップと;(f)前記二次伸長記録部分を解析するステップとを含む方法が、本明細書で開示される。一実施形態では、前記ポリペプチドの1つもしくは複数のN末端もしくはC末端アミノ酸および/または異なる1つもしくは複数のN末端もしくはC末端アミノ酸は、修飾されたN末端アミノ酸(NTAA)などの、修飾されたアミノ酸である。
前述の実施形態のいずれかでは、ステップ(a)の記録部分は、小分子であることもあり、またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素であることもある。
前述の実施形態のいずれかでは、ステップ(a)の記録部分は、ポリヌクレオチドまたは非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーであることがある。一部の実施形態では、一次または二次コーディング部分は、小分子、および/またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素を含む。
前述の実施形態のいずれかでは、一次または二次コーディング部分は、小分子であることもあり、またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素であることもある。
前述の実施形態のいずれかでは、一次伸長記録部分または二次伸長記録部分は、ポリヌクレオチドまたは非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーであることがある。
前述の実施形態のいずれかでは、配列決定可能なポリマーは、1つまたは複数の遮断基を含むことができる。一実施形態では、1つまたは複数の遮断基は、配列決定可能なポリマーがナノポアを通過するときにシグネチャ電流遮断シグナルを生成することができる。
前述の実施形態のいずれかでは、配列決定可能なポリマーは、ナノポアを通過するときに前記配列決定可能なポリマーをストールする結合性物質に結合することが可能な1つまたは複数の結合性部分を含むことができる。
前述の実施形態のいずれかでは、配列決定可能なポリマーは、ナノポアを通過するときに配列決定可能なポリマーをストールすることができる1つまたは複数の構造を含むことができる。一実施形態では、前記1つまたは複数の構造は、固有の準安定性二次構造などの、二次構造を含む。
前述の実施形態のいずれかでは、配列決定可能なポリマーは、ホスホロアミダイト化学構造、またはペプトイドポリマー、またはこれらの組合せを使用して構築されたポリマーを含むことができる。
別の態様では、前述の実施形態のいずれかに記載の方法で開示および/または使用される、任意の分子、分子複合体もしくはコンジュゲート、試薬(例えば、化学的もしくは生物学的)、薬剤、構造(例えば、支持体、表面、粒子もしくはビーズ)、反応中間体、反応生成物、結合性複合体または任意の他の製造物品あるいはこれらの任意の組合せを含むキットが、本明細書で開示される。
上述のいずれのキット成分も、ならびに例示的キットおよび方法で開示および/または使用される、任意の分子、分子複合体もしくはコンジュゲート、試薬(例えば、化学的もしくは生物学的試薬)、薬剤、構造(例えば、支持体、表面、粒子もしくはビーズ)、反応中間体、反応生成物、結合性複合体または任意の他の製造物品を、キットを形成するために、別々にまたは任意の好適な組合せで提供することができる。キットは、例えば、高度に並行な、ハイスループットなデジタル解析(例えば、巨大分子解析)、特に、ポリペプチド解析に使用するための説明書を、必要に応じて含むことができる。
本開示の非限定的実施形態は、添付の図面に関連して例として説明されることになるが、これらの図は、概略図であり、正確な縮尺率で描かれるように意図されたものではない。この説明では、必ずしもすべての図中のすべての構成要素に表示が付けられておらず、説明しなくても当業者が本開示を理解できる場合は必ずしも本発明の各実施形態のすべての構成要素が示されていない。
特定の実施形態では、例えば以下の項目が提供される。
(項目1)
巨大分子を解析するための方法であって、
(a)固体支持体に接合した巨大分子および付随する記録ポリマーを提供するステップと;
(b)前記巨大分子を、前記巨大分子に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングポリマーを含む、ステップと;
(c)前記第1のコーディングポリマーの情報を前記記録ポリマーに移行させて、一次伸長記録ポリマーを生成するステップと;
(d)前記巨大分子を、前記巨大分子に結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディングポリマーを含む、ステップと;
(e)前記第2のコーディングポリマーの情報を前記一次伸長記録ポリマーに移行させて、二次伸長記録ポリマーを生成するステップと;
(f)前記二次伸長記録ポリマーを解析するステップと
を含む方法。
(項目2)
接触させるステップ(b)および(d)を逐次的に実施する、項目1に記載の方法。
(項目3)
接触させるステップ(b)および(d)を同時に実施する、項目1に記載の方法。
(項目4)
ステップ(e)と(f)の間に、(x)前記第2の結合性物質を、前記巨大分子に結合することが可能な第3の(またはより高次の)結合性物質に置き換えることにより、ステップ(d)および(e)を1回または複数回繰り返すステップであって、前記第3の(またはより高次の)結合性物質が、前記第3の(またはより高次の)結合性物質に関する識別情報を有する第3の(またはより高次の)コーディングポリマーを含む、ステップ(d)および(e)を1回または複数回繰り返すステップと;(y)前記第3の(またはより高次の)コーディングポリマーの情報を前記第2の(またはより高次の)伸長記録ポリマーに移行させて、第3の(またはより高次の)伸長記録ポリマーを生成するステップとをさらに含み、
ステップ(f)において前記第3の(またはより高次の)伸長記録ポリマーを解析する、項目1に記載の方法。
(項目5)
巨大分子を解析するための方法であって、
(a)固体支持体に接合した巨大分子、付随する第1の記録ポリマーおよび付随する第2の記録ポリマーを提供するステップと;
(b)前記巨大分子を、前記巨大分子に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングポリマーを含む、ステップと;
(c)前記第1のコーディングポリマーの情報を前記第1の記録ポリマーに移行させて、第1の伸長記録ポリマーを生成するステップと;
(d)前記巨大分子を、前記巨大分子に結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディングポリマーを含む、ステップと;
(e)前記第2のコーディングポリマーの情報を前記第2の記録ポリマーに移行させて、第2の伸長記録ポリマーを生成するステップと;
(f)前記第1および第2の伸長記録ポリマーを解析するステップと
を含む方法。
(項目6)
接触させるステップ(b)および(d)を逐次的に実施する、項目5に記載の方法。
(項目7)
接触させるステップ(b)および(d)を同時に実施する、項目5に記載の方法。
(項目8)
ステップ(a)が、前記固体支持体に接合した付随する第3の(またはより高次の)記録ポリマーを提供するステップをさらに含む、項目5に記載の方法。
(項目9)
ステップ(e)と(f)の間に、
(x)前記第2の結合性物質を、前記巨大分子に結合することが可能な第3の(またはより高次の)結合性物質に置き換えることにより、ステップ(d)および(e)を1回または複数回繰り返すステップであって、前記第3の(またはより高次の)結合性物質が、前記第3の(またはより高次の)結合性物質に関する識別情報を有する第3の(またはより高次の)コーディングポリマーを含む、ステップと;
(y)前記第3の(またはより高次の)コーディングポリマーの情報を前記第3の(またはより高次の)記録ポリマーに移行させて、第3の(またはより高次の)伸長記録ポリマーを生成するステップと
をさらに含み、
ステップ(f)において前記第1、第2または第3の(またはより高次の)伸長記録ポリマーを解析する、項目8に記載の方法。
(項目10)
前記第1のコーディングポリマー、第2のコーディングポリマー、および任意のより高次のコーディングポリマーが、結合サイクル特異的スペーサーポリマー配列を含む、項目5~9のいずれか一項に記載の方法。
(項目11)
ペプチドを解析するための方法であって、
(a)固体支持体に接合したペプチドおよび付随する記録ポリマーを提供するステップと;
(b)前記ペプチドのN末端アミノ酸(NTAA)を化学薬剤で修飾するステップと;
(c)前記ペプチドを、修飾された前記NTAAに結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングポリマーを含む、ステップと;
(d)前記第1のコーディングポリマーの情報を前記記録ポリマーに移行させて、伸長記録ポリマーを生成するステップと;
(e)前記伸長記録ポリマーを解析するステップと
を含む方法。
(項目12)
ステップ(c)が、前記ペプチドを、第2の(またはより高次の)結合性物質に関する識別情報を有する第2の(またはより高次の)コーディングポリマーを含む第2の(またはより高次の)結合性物質と接触させることをさらに含み、第2の(またはより高次の)結合性物質が、ステップ(b)の前記修飾されたNTAA以外の修飾されたNTAAに結合することが可能である、項目11に記載の方法。
(項目13)
前記ペプチドの前記第2の(またはより高次の)結合性物質との接触を、前記ペプチドの前記第1の結合性物質との接触後に逐次的に行う、項目12に記載の方法。
(項目14)
前記ペプチドの前記第2の(またはより高次の)結合性物質との接触を、前記ペプチドの前記第1の結合性物質との接触と同時に行う、項目12に記載の方法。
(項目15)
前記化学薬剤が、イソチオシアネート誘導体、2,4-ジニトロベンゼンスルホン酸(DNBS)、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)1-フルオロ-2,4-ジニトロベンゼン、ダンシルクロリド、7-メトキシクマリン酢酸、チオアシル化試薬、チオアセチル化試薬、またはチオベンジル化試薬である、項目11~14のいずれか一項に記載の方法。
(項目16)
ペプチドを解析するための方法であって、
(a)固体支持体に接合したペプチドおよび付随する記録ポリマーを提供するステップと;
(b)前記ペプチドのN末端アミノ酸(NTAA)を化学薬剤で修飾して修飾NTAAを得るステップと;
(c)前記ペプチドを、前記修飾NTAAに結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングポリマーを含む、ステップと;
(d)前記第1のコーディングポリマーの情報を前記記録ポリマーに移行させて、第1の伸長記録ポリマーを生成するステップと;
(e)前記修飾NTAAを除去して新しいNTAAを露出させるステップと;
(f)前記ペプチドの前記新しいNTAAを化学薬剤で修飾して新しく修飾されたNTAAを得るステップと;
(g)前記ペプチドを、前記新しく修飾されたNTAAに結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディングポリマーを含む、ステップと;
(h)前記第2のコーディングポリマーの情報を前記第1の伸長記録ポリマーに移行させて、第2の伸長記録ポリマーを生成するステップと;
(i)前記第2の伸長記録ポリマーを解析するステップと
を含む方法。
(項目17)
ペプチドを解析するための方法であって、
(a)固体支持体に接合したペプチドおよび付随する記録ポリマーを提供するステップと;
(b)前記ペプチドを、前記ペプチドのN末端アミノ酸(NTAA)に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングポリマーを含む、ステップと;
(c)前記第1のコーディングポリマーの情報を前記記録ポリマーに移行させて、伸長記録ポリマーを生成するステップと;
(d)前記伸長記録ポリマーを解析するステップと
を含む方法。
(項目18)
ステップ(b)が、前記ペプチドを、第2の(またはより高次の)結合性物質に関する識別情報を有する第2の(またはより高次の)コーディングポリマーを含む第2の(またはより高次の)結合性物質と接触させることをさらに含み、前記第2の(またはより高次の)結合性物質が、前記ペプチドの前記NTAA以外のNTAAに結合することが可能である、項目17に記載の方法。
(項目19)
前記ペプチドの前記第2の(またはより高次の)結合性物質との接触を、前記ペプチドの前記第1の結合性物質との接触後に逐次的に行う、項目18に記載の方法。
(項目20)
前記ペプチドの前記第2の(またはより高次の)結合性物質との接触を、前記ペプチドの前記第1の結合性物質との接触と同時に行う、項目18に記載の方法。
(項目21)
ペプチドを解析するための方法であって、
(a)固体支持体に接合したペプチドおよび付随する記録ポリマーを提供するステップと;
(b)前記ペプチドを、前記ペプチドのN末端アミノ酸(NTAA)に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングポリマーを含む、ステップと;
(c)前記第1のコーディングポリマーの情報を前記記録ポリマーに移行させて、第1の伸長記録ポリマーを生成するステップと;
(d)前記NTAAを除去して前記ペプチドの新しいNTAAを露出させるステップと;
(e)前記ペプチドを、前記新しいNTAAに結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディングポリマーを含む、ステップと;
(h)前記第2のコーディングポリマーの情報を前記第1の伸長記録ポリマーに移行させて、第2の伸長記録ポリマーを生成するステップと;
(i)前記第2の伸長記録ポリマーを解析するステップと
を含む方法。
(項目22)
前記巨大分子が、タンパク質、ポリペプチドまたはペプチドである、項目1~10のいずれか一項に記載の方法。
(項目23)
前記巨大分子がペプチドである、項目1~10のいずれか一項に記載の方法。
(項目24)
前記ペプチドが、生体試料由来のタンパク質を断片化することにより得られる、項目11~23のいずれか一項に記載の方法。
(項目25)
前記巨大分子が、脂質、炭水化物、または大環状分子である、項目1~10のいずれか一項に記載の方法。
(項目26)
前記記録ポリマーが、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、非核酸の配列決定可能なポリマー、例えば、多糖、ポリペプチド、ペプチドもしくはポリアミド、またはこれらの組合せを含む、項目1~25のいずれか一項に記載の方法。
(項目27)
前記記録ポリマーが、ユニバーサルプライミング部位を含む、項目1~26のいずれか一項に記載の方法。
(項目28)
前記ユニバーサルプライミング部位が、増幅、配列決定、またはその両方のためのプライミング部位を含む、項目27に記載の方法。
(項目29)
前記記録ポリマーが、一意の分子識別子(UMI)を含む、項目1~28に記載の方法。
(項目30)
前記記録ポリマーが、バーコードを含む、項目1~29のいずれか一項に記載の方法。
(項目31)
前記記録ポリマーが、その3’末端にスペーサーポリマーを含む、項目1~30のいずれか一項に記載の方法。
(項目32)
前記巨大分子および前記付随する記録ポリマーが、前記固体支持体に共有結合により接合されている、項目1~31のいずれか一項に記載の方法。
(項目33)
前記固体支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、項目1~32のいずれか一項に記載の方法。
(項目34)
前記固体支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、項目33に記載の方法。
(項目35)
複数の巨大分子および付随する記録ポリマーが、固体支持体に接合されている、項目1~34のいずれか一項に記載の方法。
(項目36)
前記複数の巨大分子の間に前記固体支持体上で平均距離>50nmの間隔をあける、項目35に記載の方法。
(項目37)
前記結合性物質が、ポリペプチドまたはタンパク質である、項目1~36のいずれか一項に記載の方法。
(項目38)
前記結合性物質が、修飾アミノペプチダーゼ、修飾アミノアシルtRNA合成酵素、修飾アンチカリン、または修飾ClpSである、項目37に記載の方法。
(項目39)
前記結合性物質が、前記巨大分子に選択的に結合することが可能である、項目1~38のいずれか一項に記載の方法。
(項目40)
前記コーディングポリマーが、DNA分子、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、非核酸の配列決定可能なポリマー、例えば、多糖、ポリペプチド、ペプチドもしくはポリアミド、またはこれらの組合せを含む、項目1~39のいずれか一項に記載の方法。
(項目41)
前記コーディングポリマーが、エンコーダー配列を含む、項目1~40のいずれか一項に記載の方法。
(項目42)
前記コーディングポリマーが、スペーサーポリマー、結合サイクル特異的配列、一意の分子識別子、ユニバーサルプライミング部位、またはこれらの任意の組合せをさらに含む、項目1~41のいずれか一項に記載の方法。
(項目43)
前記結合性物質および前記コーディングポリマーが、リンカーによって接合されている、項目1~42のいずれか一項に記載の方法。
(項目44)
前記結合性物質と前記コーディングポリマーが、SpyTag/SpyCatcherまたはSnoopTag/SnoopCatcherペプチド-タンパク質対によって接合されている、項目1~42に記載の方法。
(項目45)
前記コーディングポリマーの情報の前記記録ポリマーへの移行が、DNAリガーゼによって媒介される、項目1~44のいずれか一項に記載の方法。
(項目46)
前記コーディングポリマーの情報の前記記録ポリマーへの移行が、DNAポリメラーゼによって媒介される、項目1~44のいずれか一項に記載の方法。
(項目47)
前記コーディングポリマーの情報の前記記録ポリマーへの移行が、化学的ライゲーションによって媒介される、項目1~44のいずれか一項に記載の方法。
(項目48)
前記伸長記録ポリマーの解析が、核酸配列決定法を含む、項目1~47のいずれか一項に記載の方法。
(項目49)
前記核酸配列決定法が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、項目48に記載の方法。
(項目50)
前記核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したDNAのダイレクトイメージングである、項目48に記載の方法。
(項目51)
前記伸長記録ポリマーが、解析前に増幅される、項目1~50のいずれか一項に記載の方法。
(項目52)
前記伸長記録ポリマーに含有されるコーディングポリマー情報の順序が、前記結合性物質による前記巨大分子への結合の順序に関する情報を提供する、項目1~51に記載の方法。
(項目53)
前記伸長記録ポリマーに含有される前記コーディングポリマー情報の頻度が、前記結合性物質による前記巨大分子への結合の頻度に関する情報を提供する、項目1~52に記載の方法。
(項目54)
複数の巨大分子を表す複数の伸長記録ポリマーが、並行して解析される、項目1~53に記載の方法。
(項目55)
複数の巨大分子を表す前記複数の伸長記録ポリマーが、多重化アッセイで解析される、項目54に記載の方法。
(項目56)
前記複数の伸長記録ポリマーが、解析前に標的濃縮アッセイされる、項目1~55のいずれか一項に記載の方法。
(項目57)
前記複数の伸長記録ポリマーが、解析前にサブトラクションアッセイされる、項目1~56のいずれか一項に記載の方法。
(項目58)
前記複数の伸長記録ポリマーが、極めて豊富な種を低減させるために解析前に正規化アッセイされる、項目1~57のいずれか一項に記載の方法。
(項目59)
前記NTAAが、修飾アミノペプチダーゼ、修飾アミノ酸tRNA合成酵素、穏やかなエドマン分解、エドマナーゼ酵素、または無水TFAによって除去される、項目1~58のいずれか一項に記載の方法。
(項目60)
少なくとも1つの結合性物質が、末端アミノ酸残基に結合する、項目1~59のいずれか一項に記載の方法。
(項目61)
少なくとも1つの結合性物質が、翻訳後修飾されたアミノ酸に結合する、項目1~60のいずれか一項に記載の方法。
(項目62)
複数のタンパク質複合体、タンパク質またはポリペプチドを含む試料由来の1つまたは複数のペプチドを解析するための方法であって、
(a)前記試料中の前記複数のタンパク質複合体、タンパク質、またはポリペプチドを複数のコンパートメントに分配するステップであって、各コンパートメントが、必要に応じて固体支持体に接合した複数のコンパートメントタグ(例えば、非核酸の配列決定可能なポリマーの形態のもの)を含み、前記複数のコンパートメントタグが、個々のコンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、ステップと;
(b)前記複数のタンパク質複合体、タンパク質、および/またはポリペプチドを複数のペプチドに断片化するステップと;
(c)前記複数のペプチドと前記複数のコンパートメント内の前記複数のコンパートメントタグとのアニーリングまたは接合を可能にするのに十分な条件下で前記複数のペプチドを前記複数のコンパートメントタグと接触させることによって複数のコンパートメントタグ付きペプチドを生成するステップと;
(d)前記コンパートメントタグ付きペプチドを前記複数のコンパートメントから収集するステップと;
(e)1つまたは複数のコンパートメントタグ付きペプチドを、項目1~21および26~61のいずれか一項に記載の方法に従って解析するステップと
を含む方法。
(項目63)
前記コンパートメントが、マイクロ流体液滴である、項目62に記載の方法。
(項目64)
前記コンパートメントが、マイクロウェルである、項目62に記載の方法。
(項目65)
前記コンパートメントが、表面上の分離された領域である、項目62に記載の方法。
(項目66)
各コンパートメントが、平均して単一の細胞を含む、項目62~65のいずれか一項に記載の方法。
(項目67)
複数のタンパク質複合体、タンパク質またはポリペプチドを含む試料由来の1つまたは複数のペプチドを解析するための方法であって、
(a)前記複数のタンパク質複合体、タンパク質、またはポリペプチドを複数のユニバーサルDNAタグで標識するステップと;
(b)前記試料中の前記複数の標識されたタンパク質複合体、タンパク質、またはポリペプチドを複数のコンパートメントに分配するステップであって、各コンパートメントが、複数のコンパートメントタグ(例えば、非核酸の配列決定可能なポリマーの形態のもの)を含み、前記複数のコンパートメントタグが、個々のコンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、ステップと;
(c)前記複数のタンパク質複合体、タンパク質、またはポリペプチドと前記複数のコンパートメント内の前記複数のコンパートメントタグとのアニーリングまたは接合を可能にするのに十分な条件下で前記複数のタンパク質複合体、タンパク質、またはポリペプチドを前記複数のコンパートメントタグと接触させることによって複数のコンパートメントタグ付きタンパク質複合体、タンパク質またはポリペプチドを生成するステップと;
(d)前記コンパートメントタグ付きタンパク質複合体、タンパク質、またはポリペプチドを前記複数のコンパートメントから収集するステップと;
(e)必要に応じて前記コンパートメントタグ付きタンパク質複合体、タンパク質、またはポリペプチドをコンパートメントタグ付きペプチドに断片化するステップと;
(f)1つまたは複数のコンパートメントタグ付きペプチドを、項目1~21および26~61のいずれか一項に記載の方法に従って解析するステップと
を含む方法。
(項目68)
コンパートメントタグ情報が、ペプチドに付随する記録ポリマーに、プライマー伸長またはライゲーションによって移行される、項目62~67のいずれか一項に記載の方法。
(項目69)
前記固体支持体が、ビーズを含む、項目62~68のいずれか一項に記載の方法。
(項目70)
前記ビーズが、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、項目69に記載の方法。
(項目71)
前記コンパートメントタグが、一本鎖または二本鎖核酸分子を含む、項目62~70のいずれか一項に記載の方法。
(項目72)
前記コンパートメントタグが、バーコードおよび必要に応じてUMIを含む、項目62~71のいずれか一項に記載の方法。
(項目73)
前記固体支持体がビーズであり、前記コンパートメントタグがバーコードを含み、さらに、前記複数のコンパートメントタグが接合されているビーズが、スプリット・アンド・プール合成により形成される、項目72に記載の方法。
(項目74)
前記固体支持体がビーズであり、前記コンパートメントタグがバーコードを含み、さらに、複数のコンパートメントタグが接合されているビーズが、個々の合成または固定化により形成される、項目72に記載の方法。
(項目75)
前記コンパートメントタグが、記録ポリマーの成分であり、前記記録ポリマーが、必要に応じて、スペーサーポリマー、一意の分子識別子、ユニバーサルプライミング部位、またはこれらの任意の組合せをさらに含む、項目62~74のいずれか一項に記載の方法。
(項目76)
前記コンパートメントタグが、前記複数のタンパク質複合体、タンパク質またはポリペプチドの内部アミノ酸またはN末端アミノ酸と反応することができる機能的部分をさらに含む、項目62~75のいずれか一項に記載の方法。
(項目77)
前記機能的部分が、NHS基である、項目76に記載の方法。
(項目78)
前記機能的部分が、アルデヒド基である、項目76に記載の方法。
(項目79)
前記複数のコンパートメントタグが、前記コンパートメントタグを前記コンパートメントに印刷、スポッティング、インク噴射すること、またはその組合せにより形成される、項目62~78のいずれか一項に記載の方法。
(項目80)
前記コンパートメントタグが、ペプチドをさらに含む、項目62~79のいずれか一項に記載の方法。
(項目81)
前記コンパートメントタグペプチドが、タンパク質リガーゼ認識配列を含む、項目80に記載の方法。
(項目82)
前記タンパク質リガーゼが、ブテラーゼIまたはそのホモログである、項目81に記載の方法。
(項目83)
前記複数のポリペプチドが、プロテアーゼで断片化される、項目62~82のいずれか一項に記載の方法。
(項目84)
前記プロテアーゼが、メタロプロテアーゼである、項目83に記載の方法。
(項目85)
前記メタロプロテアーゼの活性が、金属カチオンの光活性化放出によりモジュレートされる、項目84に記載の方法。
(項目86)
前記複数のポリペプチドを前記複数のコンパートメントに分配する前に1つまたは複数の豊富なタンパク質を前記試料からサブトラクションすることをさらに含む、項目62~85のいずれか一項に記載の方法。
(項目87)
前記複数のペプチドと前記コンパートメントタグを接合させる前に前記コンパートメントタグを前記固体支持体から遊離させることをさらに含む、項目62~86に記載の方法。
(項目88)
ステップ(d)の後に、前記コンパートメントタグ付きペプチドを固体支持体に記録ポリマーを伴って接合させることをさらに含む、項目62に記載の方法。
(項目89)
前記コンパートメントタグ付きペプチド上の前記コンパートメントタグの情報を前記付随する記録ポリマーに移行させることをさらに含む、項目88に記載の方法。
(項目90)
ステップ(e)の前に前記コンパートメントタグを前記コンパートメントタグ付きペプチドから除去することをさらに含む、項目89に記載の方法。
(項目91)
解析されるペプチドが由来する前記単一の細胞の同一性を前記解析されるペプチドのコンパートメントタグ配列に基づいて決定することをさらに含む、項目62~90のいずれか一項に記載の方法。
(項目92)
解析されるペプチドが由来する前記タンパク質またはタンパク質複合体の同一性を前記解析されるペプチドのコンパートメントタグ配列に基づいて決定することをさらに含む、項目62~90のいずれか一項に記載の方法。
(項目93)
複数の巨大分子を解析するための方法であって、
(a)固体支持体に接合した複数の巨大分子および付随する記録ポリマーを提供するステップと;
(b)前記複数の巨大分子を、前記複数の巨大分子に結合することが可能な複数の結合性物質と接触させるステップであって、各結合性物質が前記結合性物質に関する識別情報を有するコーディングポリマーを含む、ステップと;
(c)(i)前記巨大分子に付随する記録ポリマーの情報を、前記巨大分子に結合している前記結合性物質の前記コーディングポリマーに移行させて、伸長コーディングポリマーを生成するステップ;または(ii)巨大分子に付随する記録ポリマーおよび前記巨大分子に結合している前記結合性物質のコーディングポリマーの情報をジタグ構築物に移行するステップと;
(d)前記伸長コーディングポリマーまたはジタグ構築物を収集するステップと;
(e)必要に応じてステップ(b)~(d)を1回または複数回の結合サイクルにわたって繰り返すステップと;
(f)伸長コーディングポリマーまたはジタグ構築物の収集物を解析するステップと
を含む方法。
(項目94)
前記巨大分子が、タンパク質である、項目93に記載の方法。
(項目95)
前記巨大分子が、ペプチドである、項目93に記載の方法。
(項目96)
前記ペプチドが、生体試料由来のタンパク質を断片化することにより得られる、項目95に記載の方法。
(項目97)
前記記録ポリマーが、DNA分子、RNA分子、PNA分子、BNA分子、XNA、分子、LNA分子、γPNA分子、非核酸の配列決定可能なポリマー、例えば、多糖、ポリペプチド、ペプチドもしくはポリアミド、またはこれらの組合せを含む、項目93~96のいずれか一項に記載の方法。
(項目98)
前記記録ポリマーが、一意の分子識別子(UMI)(例えば、非核酸の配列決定可能なポリマーの形態のもの)を含む、項目93~97のいずれか一項に記載の方法。
(項目99)
前記記録ポリマーが、コンパートメントタグ(例えば、非核酸の配列決定可能なポリマーの形態のもの)を含む、項目93~98に記載の方法。
(項目100)
前記記録ポリマーが、ユニバーサルプライミング部位(例えば、非核酸の配列決定可能なポリマーの形態のもの)を含む、項目93~99のいずれか一項に記載の方法。
(項目101)
前記記録ポリマーが、その3’末端にスペーサーポリマーを、例えば、非核酸の配列決定可能なポリマーの形態で含む、項目93~100のいずれか一項に記載の方法。
(項目102)
前記記録ポリマーの3’末端が、ポリメラーゼによる前記記録ポリマーの伸長を防止するためにブロッキングされ、巨大分子に付随する記録ポリマーおよび前記巨大分子に結合している前記結合性物質のコーディングポリマーの情報が、ジタグ構築物(例えば、非核酸の配列決定可能なポリマーの形態のもの)に移行される、項目93~101のいずれか一項に記載の方法。
(項目103)
前記コーディングポリマーが、エンコーダー配列を含む、項目93~102のいずれか一項に記載の方法。
(項目104)
前記コーディングポリマーが、UMIを含む、項目93~103のいずれか一項に記載の方法。
(項目105)
前記コーディングポリマーが、ユニバーサルプライミング部位を含む、項目93~104のいずれか一項に記載の方法。
(項目106)
前記コーディングポリマーが、その3’末端にスペーサーポリマーを含む、項目93~105のいずれか一項に記載の方法。
(項目107)
前記コーディングポリマーが、結合サイクル特異的配列を含む、項目93~106のいずれか一項に記載の方法。
(項目108)
前記結合性物質および前記コーディングポリマーが、リンカーによって接合されている、項目93~107のいずれか一項に記載の方法。
(項目109)
前記記録ポリマーの情報の前記コーディングポリマーへの移行が、プライマー伸長により果たされる、項目93~108のいずれか一項に記載の方法。
(項目110)
前記記録ポリマーの情報の前記コーディングポリマーへの移行が、ライゲーションによって果たされる、項目93~108のいずれか一項に記載の方法。
(項目111)
前記ジタグ構築物が、ギャップ充填、プライマー伸長、またはその両方により生成される、項目93~108のいずれか一項に記載の方法。
(項目112)
前記ジタグ分子が、前記記録ポリマーに由来するユニバーサルプライミング部位、前記記録ポリマーに由来するコンパートメントタグ、前記記録ポリマーに由来する一意の分子識別子、前記記録ポリマーに由来する必要に応じたスペーサーポリマー、前記コーディングポリマーに由来するエンコーダー配列、前記コーディングポリマーに由来する一意の分子識別子、前記コーディングポリマーに由来する必要に応じたスペーサーポリマー、および前記コーディングポリマーに由来するユニバーサルプライミング部位を含む、項目93~97、107、108および111のいずれか一項に記載の方法。
(項目113)
前記巨大分子および前記付随する記録ポリマーが、前記固体支持体に共有結合により接合されている、項目93~112のいずれか一項に記載の方法。
(項目114)
前記固体支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、項目113に記載の方法。
(項目115)
前記固体支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、項目114に記載の方法。
(項目116)
前記結合性物質が、ポリペプチドまたはタンパク質である、項目93~115のいずれか一項に記載の方法。
(項目117)
前記結合性物質が、修飾アミノペプチダーゼ、修飾アミノアシルtRNA合成酵素、修飾アンチカリン、または抗体もしくはその結合断片である、項目116に記載の方法。
(項目118)
前記結合性物質が、単一のアミノ酸残基、ジペプチド、トリペプチドまたは前記ペプチドの翻訳後修飾に結合する、項目95~117のいずれか一項に記載の方法。
(項目119)
前記結合性物質が、N末端アミノ酸残基、C末端アミノ酸残基、または内部アミノ酸残基に結合する、項目118に記載の方法。
(項目120)
前記結合性物質が、N末端ペプチド、C末端ペプチド、または内部ペプチドに結合する、項目118に記載の方法。
(項目121)
前記結合性物質が、前記N末端アミノ酸残基に結合し、前記N末端アミノ酸残基が、各結合サイクル後に切断される、項目119に記載の方法。
(項目122)
前記結合性物質が、前記C末端アミノ酸残基に結合し、前記C末端アミノ酸残基が、各結合サイクル後に切断される、項目119に記載の方法。
(項目123)
前記N末端アミノ酸残基が、エドマン分解によって切断される、項目121に記載の方法。
(項目124)
前記結合性物質が、アミノ酸または翻訳後修飾の部位特異的な共有結合性標識である、項目93に記載の方法。
(項目125)
ステップ(b)の後に、前記巨大分子と付随する結合性物質とを含む複合体が、前記固体支持体から解離され、液滴またはマイクロ流体液滴のエマルジョン中に分配される、項目93~124のいずれか一項に記載の方法。
(項目126)
各マイクロ流体液滴が、平均して、前記巨大分子と前記結合性物質とを含む複合体を1つ含む、項目125に記載の方法。
(項目127)
前記記録ポリマーが、伸長コーディングポリマーまたはジタグ構築物の生成前に増幅される、項目125または126に記載の方法。
(項目128)
エマルジョン融合PCRが、前記記録ポリマーの情報を前記コーディングポリマーに移行させるためにまたはジタグ構築物の集団を創出するために使用される、項目125~127に記載の方法。
(項目129)
伸長コーディングポリマーまたはジタグ構築物の収集物が、解析前に増幅される、項目93~128のいずれか一項に記載の方法。
(項目130)
伸長コーディングポリマーまたはジタグ構築物の前記収集物の解析が、核酸配列決定法を含む、項目93~129のいずれか一項に記載の方法。
(項目131)
前記核酸配列決定法が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、項目130に記載の方法。
(項目132)
前記核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したDNAのダイレクトイメージングである、項目130に記載の方法。
(項目133)
前記巨大分子の部分的組成が、一意のコンパートメントタグおよび必要に応じてUMIを使用する複数の伸長コーディングポリマーまたはジタグ構築物の解析により決定される、項目130に記載の方法。
(項目134)
前記解析ステップが、塩基当たりのエラー率が>5%、>10%、>15%、>20%、>25%、または>30%である配列決定法を用いて実施される、項目1~133のいずれか一項に記載の方法。
(項目135)
コーディングポリマー、記録ポリマー、またはその両方の識別成分が、エラー訂正コードを含む、項目1~134のいずれか一項に記載の方法。
(項目136)
前記識別成分が、エンコーダー配列、バーコード、UMI、コンパートメントタグ、サイクル特異的配列、またはこれらの任意の組合せから選択される、項目135に記載の方法。
(項目137)
前記エラー訂正コードが、Hammingコード、Lee距離コード、非対称Lee距離コード、Reed-Solomonコード、およびLevenshtein-Tenengoltsコードから選択される、項目135または136に記載の方法。
(項目138)
コーディングポリマー、記録ポリマー、またはその両方の識別成分が、一意の電流またはイオンフラックスまたは光学的シグネチャを生成することができ、前記解析ステップが、前記識別成分を識別するための前記一意の電流またはイオンフラックスまたは光学的シグネチャの検出を含む、項目1~134のいずれか一項に記載の方法。
(項目139)
前記識別成分が、エンコーダー配列、バーコード、UMI、コンパートメントタグ、サイクル特異的配列、またはこれらの任意の組合せから選択される、項目138に記載の方法。
(項目140)
複数の巨大分子を解析するための方法であって、
(a)固体支持体に接合した複数の巨大分子および付随する記録ポリマーを提供するステップと;
(b)前記複数の巨大分子を、同類の巨大分子に結合することが可能な複数の結合性物質と接触させるステップであって、各結合性物質が前記結合性物質に関する識別情報を有するコーディングポリマーを含む、ステップと;
(c)第1の結合性物質の第1のコーディングポリマーの情報を第1の巨大分子に付随する第1の記録ポリマーに移行させて、一次伸長記録ポリマーを生成するステップであって、前記第1の結合性物質が前記第1の巨大分子に結合するステップと;
(d)前記複数の巨大分子を、同類の巨大分子に結合することが可能な前記複数の結合性物質と接触させるステップと;
(e)第2の結合性物質の第2のコーディングポリマーの情報を前記一次伸長記録ポリマーに移行させて、二次伸長記録ポリマーを生成するステップであって、前記第2の結合性物質が前記第1の巨大分子に結合するステップと;
(f)必要に応じてステップ(d)~(e)を「n」回の結合サイクルにわたって繰り返すステップであって、前記第1の巨大分子に結合する各結合性物質の各コーディングポリマーの情報を前の結合サイクルで生成した伸長記録ポリマーに移行させて、前記第1の巨大分子を表すn次伸長記録ポリマーを生成するステップと;
(g)前記n次伸長記録ポリマーを解析するステップと
を含む方法。
(項目141)
複数の巨大分子を表す複数のn次伸長記録ポリマーが生成され、解析される、項目140に記載の方法。
(項目142)
前記巨大分子が、タンパク質である、項目140または141に記載の方法。
(項目143)
前記巨大分子が、ペプチドである、項目142に記載の方法。
(項目144)
前記ペプチドが、生体試料由来のタンパク質を断片化することにより得られる、項目143に記載の方法。
(項目145)
前記複数の巨大分子が、多数のプールされた試料由来の巨大分子を含む、項目140~144のいずれか一項に記載の方法。
(項目146)
前記記録ポリマーが、DNA分子、RNA分子、PNA分子、BNA分子、XNA、分子、LNA分子、γPNA分子、非核酸の配列決定可能なポリマー、例えば、多糖、ポリペプチド、ペプチドもしくはポリアミド、またはこれらの組合せを含む、項目140~145のいずれか一項に記載の方法。
(項目147)
前記記録ポリマーが、一意の分子識別子(UMI)を含む、項目140~146のいずれか一項に記載の方法。
(項目148)
前記記録ポリマーが、コンパートメントタグを含む、項目140~147に記載の方法。
(項目149)
前記記録ポリマーが、ユニバーサルプライミング部位を含む、項目140~148のいずれか一項に記載の方法。
(項目150)
前記記録ポリマーが、その3’末端にスペーサーポリマーを含む、項目140~149のいずれか一項に記載の方法。
(項目151)
前記コーディングポリマーが、エンコーダー配列を含む、項目140~150のいずれか一項に記載の方法。
(項目152)
前記コーディングポリマーが、UMIを含む、項目140~151のいずれか一項に記載の方法。
(項目153)
前記コーディングポリマーが、ユニバーサルプライミング部位を含む、項目140~152のいずれか一項に記載の方法。
(項目154)
前記コーディングポリマーが、その3’末端にスペーサーポリマーを含む、項目140~153のいずれか一項に記載の方法。
(項目155)
前記コーディングポリマーが、結合サイクル特異的配列を含む、項目140~154のいずれか一項に記載の方法。
(項目156)
前記コーディングポリマーが、一意の分子識別子を含む、項目140~155のいずれか一項に記載の方法。
(項目157)
前記結合性物質および前記コーディングポリマーが、リンカーによって接合されている、項目140~156のいずれか一項に記載の方法。
(項目158)
前記記録ポリマーの情報の前記コーディングポリマーへの移行が、プライマー伸長によって媒介される、項目140~157のいずれか一項に記載の方法。
(項目159)
前記記録ポリマーの情報の前記コーディングポリマーへの移行が、ライゲーションによって媒介される、項目140~158のいずれか一項に記載の方法。
(項目160)
前記複数の巨大分子、前記付随する記録ポリマー、またはその両方が、前記固体支持体に共有結合により接合されている、項目140~159のいずれか一項に記載の方法。
(項目161)
前記固体支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、項目140~160のいずれか一項に記載の方法。
(項目162)
前記固体支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、項目161に記載の方法。
(項目163)
前記結合性物質が、ポリペプチドまたはタンパク質である、項目140~162のいずれか一項に記載の方法。
(項目164)
前記結合性物質が、修飾アミノペプチダーゼ、修飾アミノアシルtRNA合成酵素、修飾アンチカリン、または抗体もしくはその結合断片である、項目163に記載の方法。
(項目165)
前記結合性物質が、単一のアミノ酸残基、ジペプチド、トリペプチドまたは前記ペプチドの翻訳後修飾に結合する、項目142~164のいずれか一項に記載の方法。
(項目166)
前記結合性物質が、N末端アミノ酸残基、C末端アミノ酸残基、または内部アミノ酸残基に結合する、項目165に記載の方法。
(項目167)
前記結合性物質が、N末端ペプチド、C末端ペプチド、または内部ペプチドに結合する、項目165に記載の方法。
(項目168)
前記結合性物質が、修飾されたN末端アミノ酸残基、修飾されたC末端アミノ酸残基または修飾された内部アミノ酸残基の化学標識に結合する、項目142~164のいずれか一項に記載の方法。
(項目169)
前記結合性物質が、前記N末端アミノ酸残基、または前記修飾されたN末端アミノ酸残基の前記化学標識に結合し、前記N末端アミノ酸残基が、各結合サイクル後に切断される、項目166または168に記載の方法。
(項目170)
前記結合性物質が、前記C末端アミノ酸残基、または前記修飾されたC末端アミノ酸残基の前記化学標識に結合し、前記C末端アミノ酸残基が、各結合サイクル後に切断される、項目166または168に記載の方法。
(項目171)
前記N末端アミノ酸残基が、エドマン分解、エドマナーゼ、修飾アミノペプチダーゼまたは修飾アシルペプチドヒドロラーゼによって切断される、項目169に記載の方法。
(項目172)
前記結合性物質が、アミノ酸または翻訳後修飾の部位特異的な共有結合性標識である、項目163に記載の方法。
(項目173)
前記複数のn次伸長記録ポリマーが、解析前に増幅される、項目140~172のいずれか一項に記載の方法。
(項目174)
前記n次伸長記録ポリマーの解析が、核酸配列決定法を含む、項目140~173のいずれか一項に記載の方法。
(項目175)
複数の巨大分子を表す複数のn次伸長記録ポリマーが、並行して解析される、項目174に記載の方法。
(項目176)
前記核酸配列決定法が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、項目174または175に記載の方法。
(項目177)
前記核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したDNAのダイレクトイメージングである、項目174または175に記載の方法。
(項目178)
(a)分析物と直接または間接的に会合するように構成されている記録ポリマーと、
(b)(i)分析物に結合することが可能な結合性部分に関する識別情報を含み、前記結合性部分と直接もしくは間接的に会合して結合性物質を形成するように構成されている、コーディングポリマー、および/または(ii)標識
を含むキットであって、
前記記録ポリマーおよび前記コーディングポリマーが、前記結合性物質と前記分析物との結合時に前記記録ポリマーと前記コーディングポリマーの間での情報の移行を可能にするように構成されているキットであり、
必要に応じて、(c)前記結合性部分
を含む、キット。
(項目179)
少なくとも(a)(i)解析されるポリペプチドのN末端アミノ酸(NTAA)または官能化NTAAに結合することが可能な第1の結合性部分および(ii)前記第1の結合性部分に関する識別情報を含む第1のコーディングポリマーを含む、第1の結合性物質と、
必要に応じて(b)前記ポリペプチドと直接または間接的に会合するように構成されている記録ポリマーと、
さらに必要に応じて(c)第1の官能化NTAAを生成するために前記ポリペプチドの第1のNTAAを修飾することができる官能化試薬と
を含むキットであって、
前記記録ポリマーおよび前記第1の結合性物質が、前記第1の結合性物質と前記ポリペプチドとの結合時に前記第1のコーディングポリマーと前記記録ポリマーの間の情報の移行を可能にするように構成されている、キット。
(項目180)
少なくとも(a)(i)解析されるポリペプチドのN末端アミノ酸(NTAA)もしくは官能化NTAAに結合することが可能な結合性部分と(ii)前記結合性部分に関する識別情報を含むコーディングポリマーとを各々が含む、1つもしくは複数の結合性物質、および/または
(b)前記ポリペプチドと直接もしくは間接的に会合するように構成されている1つもしくは複数の記録ポリマー
を含むキットであって、
前記1つまたは複数の記録ポリマーおよび前記1つまたは複数の結合性物質が、各結合性物質と前記ポリペプチドとの結合時に前記コーディングポリマーと前記記録ポリマーの間の情報の移行を可能にするように構成され、
必要に応じて(c)第1の官能化NTAAを生成するために前記ポリペプチドの第1のNTAAを修飾することができる官能化試薬を含む、キット。
(項目181)
(a)各タンパク質に記録ポリマーが直接または間接的に付随しているタンパク質のセットを薬剤のライブラリーと接触させるステップであって、各薬剤が(i)小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマー(例えば、DNAアプタマーなどの核酸アプタマー、もしくはペプチドアプタマー)、および(ii)前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖またはアプタマーに関する識別情報を含むコーディングポリマーを含み、
各タンパク質および/もしくはそれに付随する記録ポリマー、または各薬剤が、支持体に直接または間接的に固定化されている、ステップと;
(b)(i)1つまたは複数の薬剤の前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーと結合および/または反応する各タンパク質に付随する前記記録ポリマーと(ii)前記1つまたは複数の薬剤のコーディングポリマーとの間の情報の移行を可能にして、伸長記録ポリマーおよび/または伸長コーディングポリマーを生成するステップと;
(c)前記伸長記録ポリマーおよび/または前記伸長コーディングポリマーを解析するステップと
を含む方法。
(項目182)
ポリペプチドを解析するための方法であって、
(a)(i)各断片に記録ポリマーが直接または間接的に付随しているポリペプチドの断片のセットを、(ii)各結合性物質が結合性部分および前記結合性部分に関する識別情報を含むコーディングポリマーを含む結合性物質のライブラリーと接触させるステップであって、
前記結合性部分が、前記断片の1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することができ、または官能化試薬により修飾された前記1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することができ、
各断片および/もしくはそれに付随する記録ポリマー、または各結合性物質が、支持体に直接または間接的に固定化されている、ステップと;
(b)(i)各断片に付随する前記記録ポリマーと(ii)前記コーディングポリマーとの間の情報の移行を、前記結合性部分と前記断片の1つまたは複数のN末端、内部またはC末端アミノ酸との結合時に可能にして、伸長記録ポリマーおよび/または伸長コーディングポリマーを生成するステップと;
(c)前記伸長記録ポリマーおよび/または前記伸長コーディングポリマーを解析するステップと
を含む方法。
(項目183)
複数のポリペプチドを解析するための方法であって、
(a)複数のポリペプチドの各分子を複数のユニバーサルタグで標識するステップと;
(b)前記複数のポリペプチドと複数のコンパートメントタグ(例えば、非核酸の配列決定可能なポリマーの形態のもの)とを、前記複数のユニバーサルタグと前記複数のコンパートメントタグとのアニーリングまたは接合に好適な条件下で接触させることによって、前記複数のポリペプチドを複数のコンパートメント(例えば、ビーズ表面、マイクロ流体液滴、マイクロウェル、または表面上の分離された領域、またはこれらの任意の組合せ)に分配するステップであって、前記複数のコンパートメントタグが、各コンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、ステップと;
(c)各コンパートメント内の前記ポリペプチドを断片化することによって、少なくとも1つのユニバーサルポリヌクレオチドタグと少なくとも1つのコンパートメントタグとを含む記録ポリマーが各々に付随しているポリペプチド断片のセットを生成するステップと;
(d)前記ポリペプチド断片のセットを支持体に直接または間接的に固定化するステップと;
(e)固定化されたポリペプチド断片のセットを、各結合性物質が結合性部分および前記結合性部分に関する識別情報を含むコーディングポリマーを含む結合性物質のライブラリーと接触させるステップであって、
前記結合性部分が、前記断片の1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、または官能化試薬により修飾された前記1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、ステップと;
(f)(i)各断片に付随する前記記録ポリマーと(ii)前記コーディングポリマーとの間の情報の移行を、前記結合性部分と前記断片の1つまたは複数のN末端、内部またはC末端アミノ酸との結合時に可能にして、伸長記録ポリマーおよび/または伸長コーディングポリマーを生成するステップと;
(g)前記伸長記録ポリマーおよび/または前記伸長コーディングポリマーを解析するステップと
を含む方法。
(項目184)
複数のポリペプチドを解析するための方法であって、
(a)各基板がコンパートメントタグを各々が含む複数の記録ポリマーを含み、必要に応じて各コンパートメントが、ビーズ、マイクロ流体液滴、マイクロウェル、もしくは表面上の分離された領域、またはこれらの任意の組合せである、複数の基板に複数のポリペプチドを固定化するステップと;
(b)各基板上に固定化された前記ポリペプチドを(例えば、プロテアーゼ消化により)断片化することによって、前記基板に固定化されたポリペプチド断片のセットを生成するステップと;
(c)前記固定化されたポリペプチド断片のセットを、各結合性物質が結合性部分および前記結合性部分に関する識別情報を含むコーディングポリマーを含む結合性物質のライブラリーと接触させるステップであって、
前記結合性部分が、前記断片の1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、または官能化試薬により修飾された前記1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、ステップと;
(d)(i)前記記録ポリマーと(ii)前記コーディングポリマーとの間の情報の移行を、前記結合性部分と各断片の前記1つまたは複数のN末端、内部またはC末端アミノ酸との結合時に可能にして、伸長記録ポリマーおよび/または伸長コーディングポリマーを生成するステップと;
(e)前記伸長記録ポリマーおよび/または前記伸長コーディングポリマーを解析するステップと
を含む方法。
(項目185)
(a)各薬剤が(i)小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖および/またはアプタマーと(ii)前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖またはアプタマーに関する識別情報を含むコーディングポリマーとを含む、薬剤のライブラリーと;
必要に応じて(b)各タンパク質に記録ポリマーが直接または間接的に付随しているタンパク質のセットと
を含むキットであって、
各タンパク質および/もしくはそれに付随する記録ポリマー、または各薬剤が、支持体に直接または間接的に固定化されており、
前記タンパク質のセット、前記記録ポリマーおよび前記薬剤のライブラリーが、(i)1つまたは複数の薬剤の前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーと結合および/または反応する各タンパク質に付随する前記記録ポリマーと(ii)前記1つまたは複数の薬剤のコーディングポリマーとの間の情報の移行を可能にして、伸長記録ポリマーおよび/または伸長コーディングポリマーを生成するように構成されている、キット。
(項目186)
ポリペプチドを解析するためのキットであって、
(a)各結合性物質が、結合性部分、および前記結合性部分に関する識別情報を含むコーディングポリマーを含み、前記結合性部分が、断片の1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、または官能化試薬により修飾された前記1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、結合物質のライブラリーと;
必要に応じて、(b)各断片が記録ポリマーに直接もしくは間接的に付随しているポリペプチドの断片のセット、または(b’)ポリペプチドを断片化するための手段、例えばプロテアーゼと
を含み、
各断片および/もしくはそれに付随する記録ポリマー、または各結合性物質が、支持体に直接または間接的に固定化されており、
前記ポリペプチドの断片のセット、前記記録ポリマー、および前記結合性物質のライブラリーが、(i)各断片に付随する前記記録ポリマーと(ii)前記コーディングポリマーとの間の情報の移行を、前記結合性部分と前記断片の1つまたは複数のN末端、内部またはC末端アミノ酸との結合時に可能にして、伸長記録ポリマーおよび/または伸長コーディングポリマーを生成するように構成されている、キット。
(項目187)
複数のポリペプチドを解析するキットであって、(a)各結合性物質が、結合性部分、および前記結合性部分に関する識別情報を含むコーディングポリマーを含み、前記結合性部分が、断片の1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、または官能化試薬により修飾された前記1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、結合性物質のライブラリーと;(b)複数のポリペプチドが必要に応じて固定化されている複数の基板であって、各基板が、コンパートメントタグ(例えば、非核酸の配列決定可能なポリマーの形態のもの)を各々が含む複数の記録ポリマーを含み、必要に応じて、各コンパートメントが、ビーズ、マイクロ流体液滴、マイクロウェル、もしくは表面上の分離された領域、またはこれらの任意の組合せであり、各基板上に固定化された前記ポリペプチドが、断片化されて(例えば、プロテアーゼ切断によって)前記基板に固定化されたポリペプチド断片のセットを生成するように構成されている、複数の基板とを含む、キットであり;前記複数のポリペプチド、前記記録ポリマー、および前記結合性物質のライブラリーが、(i)前記記録ポリマーと(ii)前記コーディングポリマーとの間の情報の移行を、前記結合性部分と前記各断片の1つまたは複数のN末端、内部またはC末端アミノ酸との結合時に可能にして、伸長記録ポリマーおよび/または伸長コーディングポリマーを生成するように構成されている、キット。
(項目188)
(a)分析物を、前記分析物に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディング部分を含み、前記分析物には支持体に接合した記録部分が付随しており、前記分析物および/または前記記録部分が支持体に固定化されている、ステップと;
(b)前記第1のコーディング部分の情報を前記記録部分に移行させて、一次伸長記録部分を生成するステップと;
(c)前記分析物を、前記分析物に結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディング部分を含む、ステップと;
(d)前記第2のコーディング部分の情報を前記一次伸長記録部分に移行させて、二次伸長記録部分を生成するステップと;
(e)前記二次伸長記録部分を解析するステップと
を含む方法。
(項目189)
(a)ポリペプチドを、前記ポリペプチドの1つまたは複数のN末端、内部またはC末端アミノ酸に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディング部分を含み、前記ポリペプチドには支持体に接合した記録部分が付随しており、前記ポリペプチドおよび/または前記記録部分が支持体に固定化されている、ステップと;
(b)前記第1のコーディング部分の情報を前記記録部分に移行させて、一次伸長記録部分を生成するステップと;
(c)前記分析物を、前記ポリペプチドの異なる1つまたは複数のN末端、内部またはC末端アミノ酸に結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディング部分を含む、ステップと;
(d)前記第2のコーディング部分の情報を前記一次伸長記録部分に移行させて、二次伸長記録部分を生成するステップと;
(e)前記二次伸長記録部分を解析するステップと
を含む方法。
(項目190)
(a)ポリペプチドを、前記ポリペプチドの1つまたは複数のN末端またはC末端アミノ酸に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディング部分を含み、前記ポリペプチドには支持体に接合した記録部分が付随しており、前記ポリペプチドおよび/または前記記録部分が支持体に固定化されている、ステップと;
(b)前記第1のコーディング部分の情報を前記記録部分に移行させて、一次伸長記録部分を生成するステップと;
(c)前記ポリペプチドの1つまたは複数のN末端またはC末端アミノ酸を消去して、前記ポリペプチドの異なる1つまたは複数のN末端またはC末端アミノ酸を露出させるステップと;
(d)分析物を、前記ポリペプチドの異なる1つまたは複数のN末端またはC末端アミノ酸に結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディング部分を含む、ステップと;
(e)前記第2のコーディング部分の情報を前記一次伸長記録部分に移行させて、二次伸長記録部分を生成するステップと;
(f)前記二次伸長記録部分を解析するステップと
を含む方法。
(項目191)
項目190に記載の方法で開示および/または使用される任意の分子、分子複合体もしくはコンジュゲート、試薬(例えば、化学的もしくは生物学的)、薬剤、構造(例えば、支持体、表面、粒子もしくはビーズ)、反応中間体、反応生成物、結合性複合体または任意の他の製造物品を含むキット。
図1Aは、図面に示されている機能的エレメントの凡例を示す。したがって、一実施形態では、1つもしくは複数のユニバーサルプライマー配列(または1つもしくは複数の対のユニバーサルプライマー配列、例えば、記録タグもしくは伸長記録タグの5’末端における対の一方のユニバーサルプライマー(prime)と3’末端における対の他方のもの)、複数の記録タグもしくは伸長記録タグの中からその記録タグもしくは伸長記録タグを識別することができる1つもしくは複数のバーコード配列、1つもしくは複数のUMI配列、1つもしくは複数のスペーサー配列、および/または1つもしくは複数のエンコーダー配列(コード配列、例えばコーディングタグのコード配列、とも呼ばれる)を含む、記録タグまたは伸長記録タグが本明細書で提示される。ある特定の実施形態では、伸長記録タグは、(i)1つのユニバーサルプライマー配列、1つのバーコード配列、1つのUMI配列、および1つのスペーサー(すべてが非伸長記録タグからのもの)と、(ii)各カセットが、結合性物質のエンコーダー配列と、UMI配列と、スペーサーとを含み、かつ各カセットが、コーディングタグからの配列情報を含む、タンデムに配列された1つまたは複数の「カセット」と、(iii)n回の結合サイクル(ここで、nは、アッセイ読み取りが所望される結合サイクル数を表す整数である)でコーディング物質のコーディングタグにより提供され得る別のユニバーサルプライマー配列とを含む。一実施形態では、ユニバーサルプライマー配列が伸長再コーディングタグに導入された後、結合サイクルは、継続することができ、伸長記録タグをさらに伸長することができ、1つまたは複数のさらなるユニバーサルプライマー配列を導入することができる。その場合、伸長記録タグの増幅および/または配列決定を、ユニバーサルプライマー配列の任意の組合せを使用して行うことができる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図1Bは、複数のタンパク質またはポリペプチドが複数のペプチドに断片化され、次いで、それらが、複数のペプチドを表わす伸長記録タグのライブラリーに変換される、タンパク質コードの核酸(例えば、DNA)コードへの転換または変換の全般的な概観を示す。伸長記録タグは、ペプチド配列を表すDNAにコードされるライブラリー(DNA Encoded Library)(DEL)を構成する。ライブラリーを適切に修飾して、任意の次世代シーケンシング(NGS)プラットフォームで配列決定することができる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図2A~2Dは、単一のもしくは複数の記録タグと共局在しているまたは単一のもしくは複数の記録タグで共標識されている固定化タンパク質と相互作用するコーディングタグを含む結合性物質(例えば、抗体、アンチカリン、N-レコグニンタンパク質(N-recognins protein)(例えば、ClpS、またはUBRボックスタンパク質など)、およびそれらのバリアント/ホモログ、ならびにアプタマーなど)の複数のサイクルを使用する、本明細書で開示されている方法によるポリペプチド(例えば、タンパク質)解析の例を示す。この例では、記録タグは、ユニバーサルプライミング部位、バーコード(例えば、分配バーコード、コンパートメントバーコードおよび/または画分バーコード)、必要に応じた一意の分子識別子(UMI)配列、および必要に応じて、コーディングタグと記録タグ(または伸長記録タグ)間の情報移行に使用されるスペーサー配列(Sp)を含む。スペーサー配列(Sp)は、すべての結合サイクルにわたって一定であることもあり、結合性物質特異的であることもあり、および/または結合サイクル数特異的(例えば、結合サイクルの「クロッキング」に使用される)であることもある。この例では、コーディングタグは、結合性物質(または結合性物質のクラス、例えば、図3に示されているような修飾N末端Qなどの末端アミノ酸にすべてが特異的に結合する、結合物質のクラス)の識別情報を提供するエンコーダー配列、必要に応じたUMI、および記録タグの相補的スペーサー配列にハイブリダイズし、コーディングタグ情報の記録タグへの移行を(例えば、本明細書ではポリメラーゼ伸長とも呼ばれる、プライマー伸長によって)容易にするスペーサー配列を含む。配列情報を移行するためにライゲーションが使用されることもあり、その場合、スペーサー配列が使用されることがあるが、必須ではない。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。図2Aは、同種結合性物質の分析物(例えば、タンパク質、またはタンパク質複合体)へのサイクル結合、およびその結合性物質のコーディングタグから分析物の記録タグへの対応する情報の移行によって、伸長記録タグを創出するプロセスを示す。一連の連続的な結合およびコーディングタグ情報移行ステップの後、結合性物質(例えば、抗体1(Ab1)、抗体2(Ab2)、抗体3(Ab3)、...抗体「n」(Abn))の識別情報を提供する、「n」結合サイクルからのエンコーダー配列を含む結合性物質コーディングタグ情報と、記録タグに由来するバーコード/必要に応じたUMI配列と、結合性物質のコーディングタグに由来する必要に応じたUMI配列と、デジタル次世代シーケンシングによる増幅および/または解析を容易にするための、ライブラリー構築物の各末端にある隣接ユニバーサルプライミング配列とを含有する、最終伸長記録タグが生成される。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図2Bは、DNAバーコード付き記録タグでタンパク質を標識するためのスキームの例を示す。上段パネルでは、N-ヒドロキシスクシンイミド(NHS)は、アミン反応性カップリング剤であり、ジベンゾシクロオクチル(DBCO)は、固形基材の表面への「クリック」カップリングに有用な歪みアルキンである。このスキームでは、記録タグは、タンパク質のリシン(K)残基(および任意選択でN末端アミノ酸)のεアミンに、NHS部分を介してカップリングされる。下段パネルでは、ヘテロ二機能性リンカーであるNHSアルキンを使用して、リシン(K)残基のεアミンを標識し、アルキン「クリック」部分を創出する。その後、アジド標識DNA記録タグを、標準的クリック化学によりこれら反応性アルキン基に容易に付着させることができる。さらに、DNA記録タグは、逆電子要請型ディールス-アルダー(iEDDA)反応によりtrans-シクロオクテン(TCO)誘導体化配列決定基材に下流でカップリングするための直交性メチルテトラジン(mTet)部分を用いて設計することができる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図2Cは、記録タグを使用するタンパク質分析方法の2つの例を示す。上段パネルでは、タンパク質巨大分子などの分析物は、捕捉剤により固体支持体に固定化され、必要に応じて架橋される。タンパク質または捕捉剤のどちらかを、記録タグと共局在させることまたは記録タグで標識することができる。下段パネルでは、付随する記録タグを有するタンパク質は、固体支持体に直接固定化される。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図2Dは、同種結合物質のDNAエンコーディング、および得られた伸長記録タグの配列決定を使用する単純なタンパク質イムノアッセイの全体的なワークフローの例を示す。タンパク質を記録タグにより試料バーコード化(すなわち、インデックス化)し、サイクル結合解析前にプールすることができ、その結果、試料スループットが大幅に増加され、結合試薬が節約される。事実上、この手法は、逆相タンパク質アッセイ(RPPA)を実施するためのデジタル式のより単純でより大規模化可能な手法であって、多数の生体試料におけるタンパク質レベル(例えば、発現レベル)を定量的方法で同時に測定することを可能にする手法である。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図3A~Dは、ポリペプチド配列を表わす伸長記録タグ(例えば、DNA配列)の構築による、分解に基づくポリペプチド配列決定アッセイのプロセスを示す。これは、サイクルプロセス、例えば、N末端アミノ酸(NTAA)結合、ポリペプチドに付着している記録タグへのコーディングタグ情報の移行、末端アミノ酸切断(例えば、NTAA切断)を使用し、このプロセスをサイクル様式で、例えばすべて固体支持体上で、繰り返す、エドマン分解様手法によって達成される。ペプチドのN末端分解に由来する伸長記録タグの例示的な構築の概観が提供されている:(A)ペプチドのN末端アミノ酸を(例えば、フェニルチオカルバモイル(PTC)、ジニトロフェニル(DNP)、スルホニルニトロフェニル(SNP)、アセチル、またはグアニジンジル(guanidindyl)部分で)標識する;(B)は、標識NTAAに結合された結合性物質および付随するコーディングタグを示す;(C)は、固体支持体(例えば、ビーズ)に結合しており、記録タグに(例えば、三機能性リンカーを介して)付随しているポリペプチドであって、結合性物質がポリペプチドのNTAAに結合すると、コーディングタグの情報が記録タグに(例えば、プライマー伸長によって、または一本鎖ライゲーションまたは二本鎖ライゲーションまたは平滑末端ライゲーションもしくは粘着末端ライゲーションを含む、ライゲーションによって)移行されて伸長記録タグが生成する、ポリペプチドを示す;(D)標識NTAAを化学的または生物学的(例えば、酵素的)手段によって切断して新しいNTAAを露出させる。矢印により示されているように、このサイクルを「n」回繰り返して、最終伸長記録タグを生成する。最終伸長記録タグは、必要に応じて、下流の増幅および/またはDNA配列決定を容易にするためのユニバーサルプライミング部位と隣接している。フォワードユニバーサルプライミング部位(例えば、IlluminaのP5-S1配列)は、元の記録タグ設計の一部であることができ、リバースユニバーサルプライミング部位(例えば、IlluminaのP7-S2’配列)を、記録タグの伸長の最終ステップとして付加させることができる。この最終ステップを結合性物質とは独立して行うことができる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図4A~4Bは、本明細書で開示されている方法による例示的なタンパク質配列決定ワークフローを示す。図4Aは、例示的なワークフローを示し、代替モードが明灰色の破線で概説されており、四角の中に示されている特定の実施形態が矢印で関連付けられている。ワークフローの各ステップの代替モードが、矢印下方の四角の中に示されている。図4Bは、サイクル結合およびコーディングタグ情報移行ステップを実施する際の、情報移行の効率を向上させるための選択肢を示す。1分子当たり複数の記録タグを用いることができる。さらに、所与の結合事象毎に、コーディングタグ情報の記録タグへの移行を複数回実施してもよく、またはその代わりに表面増幅ステップを用いて、伸長記録タグライブラリーなどのコピーを創出してもよい。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図4A~4Bは、本明細書で開示されている方法による例示的なタンパク質配列決定ワークフローを示す。図4Aは、例示的なワークフローを示し、代替モードが明灰色の破線で概説されており、四角の中に示されている特定の実施形態が矢印で関連付けられている。ワークフローの各ステップの代替モードが、矢印下方の四角の中に示されている。図4Bは、サイクル結合およびコーディングタグ情報移行ステップを実施する際の、情報移行の効率を向上させるための選択肢を示す。1分子当たり複数の記録タグを用いることができる。さらに、所与の結合事象毎に、コーディングタグ情報の記録タグへの移行を複数回実施してもよく、またはその代わりに表面増幅ステップを用いて、伸長記録タグライブラリーなどのコピーを創出してもよい。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図5A~Bは、プライマー伸長を使用して、結合性物質のコーディングタグの識別情報を巨大分子(例えば、ポリペプチド)などの分析物に付随する記録タグに移行して伸長記録タグを生成する、伸長記録タグの例示的な構築の概観を示す。結合性物質に関する識別情報を有する一意のエンコーダー配列を含むコーディングタグは、必要に応じて、各末端が共通スペーサー配列(Sp’)と隣接している。図5Aは、記録タグで標識されており、ビーズに連結されている、ポリペプチドのNTAAに結合するコーディングタグを含むNTAA結合性物質を示す。記録タグは、相補的スペーサー配列を介してコーディングタグにアニーリングし(SpがSp’にアニーリングし)、プライマー伸長反応は、スペーサー(Sp)をプライミング部位として使用するコーディングタグ情報の記録タグへの移行を媒介する。コーディングタグは、結合性物質に対して遠位側の末端に一本鎖スペーサー(Sp’)配列を有する二本鎖として示されている。この構成は、記録タグの内部部位とのコーディングタグのハイブリダイゼーションを最小限に抑え、記録タグの末端スペーサー(Sp)配列と、コーディングタグの一本鎖スペーサー突出(Sp’)とのハイブリダイゼーションに有利に働く。さらに、伸長記録タグを1つまたは複数のオリゴヌクレオチド(例えば、エンコーダーおよび/またはスペーサー配列に相補的な)と事前にアニーリングして、コーディングタグと内部記録タグ配列エレメントとのハイブリダイゼーションを阻止することができる。図5Bは、結合、およびコーディングタグ情報の移行、およびユニバーサルプライミング部位の3’末端への付加の、「n」回のサイクルの後に生成された最終伸長記録タグを示す(「***」は、伸長記録タグに示されていない介在結合サイクルを表わす)。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図6は、酵素的ライゲーションによって伸長記録タグに移行されるコーディングタグ情報を示す。それぞれの記録タグを有し、記録タグ伸長が並行して進行する、2つの異なる分析物が示されている。記録タグ上の相補的スペーサー(Sp)とアニーリングする「粘着末端」突出を一方の鎖にスペーサー配列(Sp’)が有するように二本鎖コーディングタグを設計することにより、ライゲーションを容易にすることができる。この「粘着末端」(「付着末端」としても公知)は、長さ0~8塩基、例えば、およそ2~4塩基であり得る。二本鎖コーディングタグの相補鎖は、記録タグへのライゲーション後、情報を記録タグに移行する。相補鎖は、別のスペーサー配列を含むこともあり、このスペーサー配列は、ライゲーション前の記録タグのSpと同じであることもあり、またはそれと異なることもある。ライゲーションを使用して記録タグを伸長させる場合、伸長の方向は、示されているように、5’から3’へであることもあり、または必要に応じて3’から5’へであることもある。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図7は、スペーサー配列を伸長記録タグに挿入せずに、記録タグまたは伸長記録タグの3’ヌクレオチドを、コーディングタグ(またはその相補体)の5’ヌクレオチドと連結させる化学的ライゲーションにより、コーディングタグ情報を記録タグへと移行させる、「無スペーサー」手法を示す。また、伸長記録タグおよびコーディングタグの向きを逆にして、記録タグの5’末端が、コーディングタグ(または相補体)の3’末端にライゲーションされるようにしてもよい。示されている例では、記録タグの相補的「ヘルパー」オリゴヌクレオチド配列(「記録ヘルパー」)とコーディングタグとのハイブリダイゼーションを使用して、複合体を安定させ、記録タグのコーディングタグ相補鎖への特異的な化学的ライゲーションを可能にさせる。得られた伸長記録タグは、スペーサー配列を欠いている。また、DNA、PNA、または類似の核酸ポリマーを用いることができる「クリック化学」型の化学的ライゲーション(例えば、アジドおよびアルキン部分(3本線記号として示されている)が使用される)が示されている。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図8A~Bは、N末端アミノ酸分解の前に、ポリペプチドの翻訳後修飾(PTM)情報を伸長記録タグに書き込むための例示的な方法を示す。図8A:結合性物質に関する識別情報を有するコーディングタグを含む結合性物質(例えば、ホスホチロシン抗体の識別情報を有するコーディングタグを含むホスホチロシン抗体)を、ポリペプチドに結合させることが可能である。ホスホチロシンが、図示されているように記録タグ標識ポリペプチドに存在する場合、ホスホチロシン抗体がホスホチロシンに結合すると、コーディングタグおよび記録タグが、相補的スペーサー配列を介してアニーリングし、コーディングタグ情報が、記録タグに移行されて、伸長記録タグを生成する。図8B:伸長記録タグは、一次アミノ酸配列(例えば、「aa」、「aa」、「aa」、...、「aa」)とペプチドの翻訳後修飾(例えば、「PTM」、「PTM」)の両方のコーディングタグ情報を含むこともある。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図9A~9Bは、結合性物質を分析物(例えば、ポリペプチドなどの巨大分子)に結合させ、結合性物質に付着しているコーディングタグの情報を、例えば、固体支持体(例えば、ビーズ)に付着している単一の分析物の部位に共局在している、複数の記録タグ中の個々の記録タグへと移行させ、それにより、分析物情報(例えば、試料中の存在もしくは非存在、レベルもしくは量、結合物質のライブラリーへの結合プロファイル、活性もしくは反応性、アミノ酸配列、翻訳後修飾、起源試料、またはそれらの任意の組合せ)を集合的に表す複数の伸長記録タグを生成する、複数サイクルのプロセスを示す。この図では、例示のために過ぎないが、分析物は、ポリペプチドであり、各サイクルは、結合性物質を、N末端アミノ酸(NTAA)に結合させること、コーディングタグ情報を記録タグに移行させることにより結合事象を記録すること、その後、そのNTAAを除去して、新しいNTAAを露出させることを含む。図9Aは、分析物に結合されている結合性物質が利用することができる複数の記録タグ(例えば、ユニバーサルフォワードプライミング配列およびUMIを含む)を固体支持体上に示す。個々の記録タグは、伸長反応をプライミングしてコーディングタグ情報を記録タグへと移行させるために使用することができる、結合性物質のコーディングタグ内の共通スペーサー配列に相補的な共通スペーサー配列(Sp)を有する。例えば、複数の記録タグが支持体上に分析物と共局在している可能性があり、それらの記録タグの一部は、他のものより分析物に近い可能性がある。一態様では、支持体上の分析物密度に対する記録タグ密度を、統計的に、各分析物が、その分析物に結合されている結合性物質が利用可能な複数(例えば、少なくとも約2、約5、約10、約20、約50、約100、約200、約500、約1000、約2000、約5000、またはそれより多く)の記録タグを有することになるように、制御することができる。この方法は、試料中の豊富さが低いタンパク質またはポリペプチドの分析に特に有用であり得る。図9Aは、異なる記録タグが、サイクル1~3の各々において伸長される(例えば、結合性物質中のサイクル特異的バーコード、または各結合/反応サイクルにおいて別々に付加されるサイクル特異的バーコードを使用して、結合/反応を「クロッキング」することができる)ことを示すが、伸長記録タグは、後続の結合サイクルのいずれか1または複数サイクルにおいてさらに伸長され得ること、および得られる伸長記録タグプールは、1回だけ、2回、3回、またはそれより多い回数、伸長されている記録タグのミックスであり得ることが予想される。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。図9Bは、連続的な結合サイクル各々に使用されるサイクル特異的NTAA結合性物質についての異なるプールであって、サイクル特異的スペーサー配列などの、サイクル特異的配列を各々が有するプールを示す。あるいは、サイクル特異的配列は、結合性物質とは別の試薬で提供されることもある。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図10A~Cは、結合性物質に付着しているコーディングタグの情報を、固体支持体(例えば、ビーズ)に付着している単一の分析物(例えば、ポリペプチドなどの巨大分子)の部位に共局在している複数の記録タグのうちの1つの記録タグに移行させ、それにより分析物を集合的に表す複数の伸長記録タグを生成する、複数のサイクルを含む例示的な方法を示す。この図では、例示のために過ぎないが、分析物は、ポリペプチドであり、各々の処理ラウンドは、NTAAと結合させること、結合事象を記録すること、その後、そのNTAAを除去して、新しいNTAAを露出させることを含む。図10Aは、固体支持体上の分析物、例えば1ビーズ当たり単一分子、に対して複数の記録タグ(例えば、ユニバーサルフォワードプライミング配列およびUMIを含む)を示す。個々の記録タグは、異なる「サイクル特異的」配列(例えば、C、C、C、...C)を有する異なるスペーサー配列をそれらの3’末端に有する。例えば、各ビーズ上の記録タグは、同じコンパートメントバーコードおよび/またはUMI配列を共有する。第1の結合サイクル(サイクル1)では、複数のNTAA結合性物質を分析物と接触させる。サイクル1で使用される結合性物質は、記録タグのサイクル1Cスペーサー配列に相補的である共通5’スペーサー配列(C’1)を有する。サイクル1で使用される結合性物質は、サイクル2スペーサーCに相補的である3’スペーサー配列(C’)も有する。結合サイクル1中に、第1のNTAA結合性物質は、分析物の遊離N末端に結合し、第1のコーディングタグの情報が、相補的C’スペーサー配列とハイブリダイズしているC配列から、プライマー伸長により、同種記録タグに移行される。NTAAを除去して新しいNTAAを露出させた後、結合サイクル2は、サイクル1結合性物質の3’スペーサー配列と同一であるサイクル2 5’スペーサー配列(C’)および共通のサイクル3 3’スペーサー配列(C’)を有する複数のNTAA結合性物質を、分析物と接触させる。第2のNTAA結合性物質は、分析物のNTAAに結合し、第2のコーディングタグの情報が、プライマー伸長により、相補的なCおよびC’スペーサー配列から同種記録タグに移行される。これらのサイクルを、最大「n」結合サイクル繰り返し、最後の伸長記録タグを、ユニバーサルリバースプライミング配列でキャッピングし、単一の分析物と共局在している複数の伸長記録タグを生成し、前記伸長記録タグの各々は、1結合サイクルに由来するコーディングタグ情報を有する。連続的な結合サイクル各々で使用される結合性物質の各々のセットは、コーディングタグ中にサイクル特異的スペーサー配列を有するため、結合サイクル情報を、得られる伸長記録タグの結合性物質情報と関連付けることができる。図10Bは、連続的な結合サイクル各々に使用されるサイクル特異的結合性物質についての異なるプールであって、サイクル特異的スペーサー配列を各々が有するプールを示す。図10Cは、サイクル特異的スペーサー配列を使用して伸長記録タグのPCRアセンブリに基づいて伸長記録タグ(例えば、分析物の部位に共局在しているもの)の収集物を逐次的にアセンブリし、それにより巨大分子などの分析物の順序付けられた配列を提供することができる方法を示す。好ましい方法は、連鎖の前に、増幅によって各伸長記録タグの複数のコピーを生成する。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図11A~Bは、記録タグからコーディングタグまたはジタグ構築物への情報移行を示す。結合情報を記録するための2つの方法が(A)および(B)に示されている。結合性物質は、本明細書に記載のいずれのタイプの結合性物質であってもよく、単に便宜上、抗ホスホチロシン結合性物質が示されている。伸長コーディングタグまたはジタグ構築物の場合、結合情報をコーディングタグから記録タグに移行させるのではなく、情報を記録タグからコーディングタグに移行させて伸長コーディングタグを生成する(図11A)か、または情報を記録タグとコーディングタグの両方から第3のジタグ形成構築物に移行させる(図11B)かのどちらかである。ジタグおよび伸長コーディングタグは、記録タグ(バーコード、必要に応じたUMI配列、および必要に応じたコンパートメントタグ(CT)配列を含有する(図示せず))およびコーディングタグの情報を含む。ジタグおよび伸長コーディングタグを記録タグから溶出し、収集し、必要に応じて増幅し、次世代シーケンサーで読み取ることができる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図12A~12Dは、PNAコンビナトリアルバーコード/UMI記録タグの設計、および結合事象のジタグ検出を示す。図12Aには、化学的ライゲーションによる、4つの基本PNAワード配列(A、A’-B、B’-C、およびC’)のコンビナトリアルPNAバーコード/UMIの構築が示されている。DNAアームのハイブリダイズは、PNAバーコード/UMIのコンビナトリアルアセンブリの無スペーサーコンビナトリアル鋳型を創出するために含まれている。化学的ライゲーションは、アニーリングされたPNA「ワード」を縫い合わせるために使用される。図12Bは、記録タグのPNA情報をDNA中間体へと移行させるための方法示す。DNA中間体は、情報をコーディングタグへと移行させることが可能である。すなわち、相補的DNAワード配列を、PNAにアニーリングさせ、化学的にライゲーションする(任意選択で、PNA鋳型を使用するリガーゼが発見された場合は、酵素的にライゲーションする)。図12Cでは、DNA中間体は、スペーサー配列Spを介して、コーディングタグと相互作用するように設計されている。鎖置換プライマー伸長ステップは、ライゲーションされたDNAを置換し、記録タグ情報をDNA中間体からコーディングタグへと移行させ、伸長コーディングタグを生成する。ターミネーターヌクレオチドを、DNA中間体の末端に組み込んで、プライマー伸長によるコーディングタグ情報のDNA中間体への移行を防止してもよい。図12D:あるいは、情報を、コーディングタグからDNA中間体へと移行させて、ジタグ構築物を生成してもよい。ターミネーターヌクレオチドを、コーディングタグの末端に組み込んで、DNA中間体からコーディングタグへの記録タグ情報の移行を防止してもよい。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図13A~Eは、ポリペプチド配列組成を表わすエレメントのライブラリーを生成するための、コンパートメントバーコード付きビーズへのプロテオーム分配、その後のエマルジョン融合PCRによるジタグアセンブリを示す。その後、ポリペプチドのアミノ酸の内容を、N末端配列決定法によって、またはその代わりに、アミノ酸特異的化学的標識のもしくはコーディングタグに付随する結合性物質の付着(共有結合性または非共有結合性)によって、特徴付けることができる。コーディングタグは、ユニバーサルプライミング配列、ならびにアミノ酸同一性のエンコーダー配列、コンパートメントタグ、およびアミノ酸UMIを含む。情報移行の後、ジタグを記録タグUMIによって元の分子にマッピングし戻す。図13Aでは、プロテオームを、バーコード付きビーズを有する液滴にコンパートメント化する。付随する記録タグ(コンパートメントバーコード情報を含む)を有するペプチドをビーズ表面に付着させる。液滴エマルジョンを破壊して、ペプチドが分配されているバーコード付きビーズを放出させる。図13Bでは、ペプチドの特定のアミノ酸残基を、部位特異的標識部分とコンジュゲートされているDNAコーディングタグで化学的に標識する。DNAコーディングタグは、アミノ酸バーコード情報および必要に応じてアミノ酸UMIを含む。図13C:標識ペプチド-記録タグ複合体をビーズから放出させる。図13D:標識ペプチド-記録タグ複合体を乳化させて、1コンパートメント当たり平均で1未満のペプチド-記録タグ複合体が存在するようなナノエマルジョンまたはマイクロエマルジョンにする。図13E:エマルジョン融合PCRは、記録タグ情報(例えば、コンパートメントバーコード)を、アミノ酸残基に付着しているDNAコーディングタグのすべてに移行させる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図14は、乳化されたペプチド記録タグ-コーディングタグ複合体からの伸長コーディングタグの生成を示す。図13Cのペプチド複合体を、1液滴当たり平均で単一のペプチド複合体となるように、PCR試薬と共に液滴内へと共乳化する。3プライマー融合PCR(three-primer fusion PCR)手法を使用して、ペプチドに付随されている記録タグを増幅し、増幅した記録タグを、複数の結合性物質コーディングタグまたは共有結合で標識されたアミノ酸のコーディングタグと融合し、プライマー伸長によりコーディングタグを伸長させて、ペプチドUMIおよびコンパートメントタグ情報を、記録タグからコーディングタグへと移行させ、得られた伸長コーディングタグを増幅する。1液滴当たり複数の伸長コーディングタグ種が存在し、存在する各アミノ酸エンコーダー配列-UMIコーディングタグ毎に種が異なる。このようにして、ペプチド内のアミノ酸の同一性および計数を両方とも決定することができる。U1ユニバーサルプライマーおよびSpプライマーは、U2trユニバーサルプライマーよりも高い融解Tmを有するように設計される。これにより、2段階PCRが可能になり、2段階PCRでは、最初の少数回のサイクルをより高いアニーリング温度で実施して記録タグを増幅し、その後、PCR中に記録タグおよびコーディングタグが互いにプライミングして伸長コーディングタグが産生されるように、より低いTmの段階へと進み、U1およびU2trユニバーサルプライマーを使用して、得られた伸長コーディングタグ産物の増幅にプライミングする。ある特定の実施形態では、U2trプライマーからの時期尚早ポリメラーゼ伸長は、光不安定性3’ブロッキング基を使用することにより防止することができる(Youngら、2008年、Chem. Commun. (Camb)4巻:462~464頁)。記録タグを増幅する第1のラウンドのPCR、およびコーディングタグSptrが、記録タグの増幅されたSp’配列のコーディングタグの伸長にプライミングする第2のラウンドの融合PCRステップの後、U2trの3’ブロッキング基を除去し、U1およびU2trプライマーを有する伸長コーディングタグを増幅するために、より高い温度でのPCRを開始させる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図15は、タンパク質のマッピング可能性およびフェージングの増強を容易にするプロテオーム分配およびバーコード付与の使用を示す。ポリペプチド配列決定では、典型的には、タンパク質を消化してペプチドにする。このプロセスでは、親タンパク質分子に由来する個々のポリペプチド間の関係性および親タンパク質分子に対するそれらの関係性に関する情報が失われる。この情報を再構築するために、個々のペプチド配列を、それらが由来する可能性のあるタンパク質配列の収集物にマッピングし戻す。そのようなセット内に一意の一致を見出すタスクは、短いおよび/または部分的なペプチド配列では、収集物のサイズおよび複雑性(例えば、プロテオーム配列複雑性)が増加するにつれて、より困難となる。バーコード付き(例えば、コンパートメントタグ付き)コンパートメントまたは区分へとプロテオームを分配し、その後、タンパク質をペプチドへと消化し、コンパートメントタグをペプチドに接合することにより、ペプチド配列をマッピングする必要のある「タンパク質」空間が低減され、複雑なタンパク質試料の場合のタスクが大幅に単純化される。ペプチドへと消化する前に、一意の分子識別子(UMI)を有するタンパク質を標識することにより、ペプチドを元のタンパク質分子にマッピングし戻すことが容易になり、同じタンパク質分子に由来する翻訳後修飾(PTM)バリアント間のフェージング情報の注釈、および個々のプロテオフォームの識別が可能になる。図15Aは、コンパートメントまたは分配バーコードを含む記録タグでタンパク質を標識し、その後、記録タグ標識ペプチドへと断片化することを含む、プロテオーム分配の例を示す。図15B:部分ペプチド配列情報またはさらには組成情報のみの場合、このマッピングは、高度に縮重性である。しかしながら、同じタンパク質に由来する複数のペプチドからの情報と結び付けられた部分ペプチド配列または組成情報は、元のタンパク質分子の一意の識別を可能にする。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図16は、コンパートメントタグ付きビーズ配列設計の例示的なモードを示す。コンパートメントタグは、個々のコンパートメントを識別するためのX5~20のバーコード、およびコンパートメントタグが接合されているペプチドを識別するためのN5~10の一意の分子識別子(UMI)を含み、XおよびNは、縮重した核酸塩基または核酸塩基ワードを表わす。コンパートメントタグは、一本鎖であってもよく(上段に図示)、または二本鎖であってもよい(下段に図示)。任意選択で、コンパートメントタグは、目的のペプチドと接合するためのタンパク質リガーゼ(例えば、ブテラーゼI(butelase I))の認識配列を有するペプチド配列を含むキメラ分子であってもよい(左側に図示)。あるいは、目的のペプチドとのカップリングのために、化学的部分が、コンパートメントタグに含まれていてもよい(例えば、右側の図に示されるようなアジド)。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図17A~17Bは、(A)複数のペプチドを表す複数の伸長記録タグおよび(B)標準的ハイブリッド捕捉技法による標的ペプチド濃縮の例示的な方法を示す。例えば、ハイブリッド捕捉濃縮では、ペプチドのライブラリーを表わす伸長記録タグのライブラリーから、1つまたは複数の目的のペプチド(「標的ペプチド」)を表わす伸長記録タグとハイブリダイズする1つまたは複数のビオチン化「ベイト」オリゴヌクレオチドを使用してもよい。ベイトオリゴヌクレオチド:標的とする伸長記録タグハイブリダイゼーション対を、ハイブリダイゼーション後にビオチンタグにより溶液からプルダウンして、1つまたは複数の目的のペプチドを表わす伸長記録タグの濃縮画分を生成する。伸長記録タグの分離(「プルダウン」)は、例えば、ストレプトアビジンコーティング磁気ビーズを使用して達成することができる。ビオチン部分を、ビーズのストレプトアビジンと結合させ、磁石を使用してビーズを局在化させ、溶液を除去または交換することにより分離を達成する。望ましくないかまたは過剰に豊富なペプチドを表わす伸長記録タグに競合的にハイブリダイズする非ビオチン化競合物質濃縮オリゴヌクレオチドを、任意選択で、ハイブリッド捕捉アッセイのハイブリダイゼーションステップに含めて、濃縮された標的ペプチドの量をモジュレートしてもよい。非ビオチン化競合オリゴヌクレオチドは、標的ペプチドとのハイブリダイゼーションを競合するが、ハイブリダイゼーション二本鎖は、ビオチン部分が存在しないため捕捉ステップ中に捕捉されない。したがって、競合オリゴヌクレオチドのビオチン化「ベイト」オリゴヌクレオチドに対する比を調整することにより、濃縮された伸長記録タグ画分を、広いダイナミックレンジにわたってモジュレートすることができる。このステップは、試料内のタンパク質存在量のダイナミックレンジ問題に対処するために重要になるであろう。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図18A~18Bは、単一細胞およびバルクプロテオームを個々の液滴内に分配するための例示的な方法を示し、各液滴は、ペプチドをそれらの元のタンパク質複合体と、または単一の細胞に由来するタンパク質と相関させるために、複数のコンパートメントタグが付着しているビーズを含む。コンパートメントタグは、バーコードを含む。液滴形成後の液滴構成成分の操作:(A)単一細胞を個々の液滴内に分配し、その後細胞溶解して細胞プロテオームを放出させ、タンパク質分解により細胞プロテオームをペプチドへと消化し、十分なタンパク質分解後にプロテアーゼを不活化する;(B)バルクプロテオームを、複数の液滴内に分配し、個々の液滴は、タンパク質複合体を含み、その後タンパク質分解によりタンパク質複合体をペプチドへと消化し、十分なタンパク質分解後にプロテアーゼを不活化する。熱不安定性メタロ-プロテアーゼを使用し、光ケージ化2価カチオンを光放出させてプロテアーゼを活性化した後、封入されているタンパク質をペプチドへと消化することができる。プロテアーゼは、十分なタンパク質分解後に加熱不活化してもよく、または2価カチオンをキレートしてもよい。液滴は、ペプチドのN-またはC-末端アミノ酸のいずれかにライゲートすることが可能な核酸バーコード(記録タグとは別の)を含む、ハイブリダイズされたまたは放出可能なコンパートメントタグを含む。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図19A~19Bは、単一細胞およびバルクプロテオームを個々の液滴内に分配するための例示的な方法を示し、各液滴は、ペプチドをそれらの元のタンパク質またはタンパク質複合体と、またはタンパク質を元の単一細胞と相関させるために、コンパートメントタグが付着している複数の二機能性記録タグを有するビーズを含む。液滴形成後の液滴構成成分の操作:(A)単一細胞を個々の液滴内に分配し、その後細胞溶解して細胞プロテオームを放出させ、タンパク質分解により細胞プロテオームをペプチドへと消化し、十分なタンパク質分解後にプロテアーゼを不活化する;(B)バルクプロテオームを、複数の液滴内に分配し、個々の液滴は、タンパク質複合体を含み、その後タンパク質分解によりタンパク質複合体をペプチドへと消化し、十分なタンパク質分解後にプロテアーゼを不活化する。熱不安定性メタロ-プロテアーゼを使用し、光ケージ化2価カチオン(例えば、Zn2+)を光放出させた後、封入されているタンパク質をペプチドへと消化することができる。プロテアーゼは、十分なタンパク質分解後に加熱不活化してもよく、または2価カチオンをキレートしてもよい。液滴は、ペプチドのN-またはC-末端アミノ酸のいずれかにライゲートすることが可能な核酸バーコード(記録タグとは別の)を含む、ハイブリダイズされたまたは放出可能なコンパートメントタグを含む。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図20A~Lは、ペプチドに付着したコンパートメントバーコード付き記録タグの生成を示す。コンパートメントバーコード付与技術(例えば、マイクロ流体液滴中のバーコード付きビーズなど)を使用して、コンパートメント特異的バーコードを、特定のコンパートメント内に封入されている分子内容物に移行させることができる。(A)特定の実施形態では、タンパク質分子を変性させ、リシン残基(K)のε-アミン基を、活性化されたユニバーサルDNAタグ分子(5’末端にNHS部分を有することが示されているユニバーサルプライミング配列(U1)を含むが、任意の他のバイオコンジュゲーション部分も利用することができる)と化学的にコンジュゲートさせる。ユニバーサルDNAタグをポリペプチドにコンジュゲーションした後、過剰なユニバーサルDNAタグを除去する。(B)ユニバーサルDNAタグ付きポリペプチドを、ビーズに結合されている核酸分子とハイブリダイズさせ、個々のビーズに結合されている前記核酸分子は、コンパートメントタグ(バーコード)配列の一意の集団を含む。コンパートメント化は、液滴などの異なる物理的コンパートメント(破線楕円により示されている)内に試料を分離することによって行うことができる。あるいは、コンパートメント化は、例えば、ポリペプチドのユニバーサルDNAタグを、ビーズのコンパートメントDNAタグにアニーリングさせることによって、標識ポリペプチドをビーズ表面に固定化することにより、追加の物理的分離を必要とせずに、直接的に達成することができる。単一のポリペプチド分子は、単一のビーズとのみ相互作用する(例えば、単一のポリペプチドは、複数のビーズにまたがっていない)。しかしながら、複数のポリペプチドが、同じビーズと相互作用することもある。コンパートメントバーコード配列(BC)に加えて、ビーズに結合されている核酸分子は、共通Sp(スペーサー)配列、一意の分子識別子(UMI)、およびポリペプチドDNAタグU1’に相補的な配列で構成されることもある。(C)ユニバーサルDNAタグ付きポリペプチドを、ビーズに結合されているコンパートメントタグとアニーリングさせた後、付着リンカーを切断することによってコンパートメントタグをビーズから放出させる。(D)アニーリングしたU1 DNAタグプライマーを、ビーズに由来するコンパートメントタグ核酸分子を鋳型として使用する、ポリメラーゼに基づくプライマー伸長によって、伸長させる。プライマー伸長ステップを、(C)に示されているようにコンパートメントタグをビーズから放出させた後に行ってもよく、または必要に応じてコンパートメントタグが依然としてビーズに付着している間に行ってもよい(図示せず)。これにより、ビーズのコンパートメントタグに由来するバーコード配列が、ポリペプチドのU1 DNAタグ配列に効果的に書き込まれる。この新しい配列が、記録タグを構成する。プライマー伸長後、プロテアーゼ、例えば、Lys-C(リシン残基のC末端側を切断する)、Glu-C(グルタミン酸残基のC末端側を、および程度は低いがグルタミン酸残基を切断する)、またはプロテイナーゼKなどのランダムプロテアーゼを使用して、ポリペプチドを切断してペプチド断片にする。(E)各ペプチド断片は、本明細書で開示されているように下流ペプチド配列決定のために、そのC末端リシンを、記録タグを構成する伸長DNAタグ配列で標識する。(F)記録タグ付きペプチドを、歪みアルキン標識であるDBCOを介してアジドビーズにカップリングする。アジドビーズは、必要に応じて、DBCO-アジド固定化の効率を促進するために、記録タグに相補的な捕捉配列も含有する。元のビーズからペプチドを除去し、新しい固体支持体(例えば、ビーズ)に再固定化することにより、ペプチド間の最適な分子間間隔が可能になり、本明細書で開示されているペプチド配列決定法が容易になることが留意されるべきである。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。 図20A~Lは、ペプチドに付着したコンパートメントバーコード付き記録タグの生成を示す。コンパートメントバーコード付与技術(例えば、マイクロ流体液滴中のバーコード付きビーズなど)を使用して、コンパートメント特異的バーコードを、特定のコンパートメント内に封入されている分子内容物に移行させることができる。(A)特定の実施形態では、タンパク質分子を変性させ、リシン残基(K)のε-アミン基を、活性化されたユニバーサルDNAタグ分子(5’末端にNHS部分を有することが示されているユニバーサルプライミング配列(U1)を含むが、任意の他のバイオコンジュゲーション部分も利用することができる)と化学的にコンジュゲートさせる。ユニバーサルDNAタグをポリペプチドにコンジュゲーションした後、過剰なユニバーサルDNAタグを除去する。(B)ユニバーサルDNAタグ付きポリペプチドを、ビーズに結合されている核酸分子とハイブリダイズさせ、個々のビーズに結合されている前記核酸分子は、コンパートメントタグ(バーコード)配列の一意の集団を含む。コンパートメント化は、液滴などの異なる物理的コンパートメント(破線楕円により示されている)内に試料を分離することによって行うことができる。あるいは、コンパートメント化は、例えば、ポリペプチドのユニバーサルDNAタグを、ビーズのコンパートメントDNAタグにアニーリングさせることによって、標識ポリペプチドをビーズ表面に固定化することにより、追加の物理的分離を必要とせずに、直接的に達成することができる。単一のポリペプチド分子は、単一のビーズとのみ相互作用する(例えば、単一のポリペプチドは、複数のビーズにまたがっていない)。しかしながら、複数のポリペプチドが、同じビーズと相互作用することもある。コンパートメントバーコード配列(BC)に加えて、ビーズに結合されている核酸分子は、共通Sp(スペーサー)配列、一意の分子識別子(UMI)、およびポリペプチドDNAタグU1’に相補的な配列で構成されることもある。(C)ユニバーサルDNAタグ付きポリペプチドを、ビーズに結合されているコンパートメントタグとアニーリングさせた後、付着リンカーを切断することによってコンパートメントタグをビーズから放出させる。(D)アニーリングしたU1 DNAタグプライマーを、ビーズに由来するコンパートメントタグ核酸分子を鋳型として使用する、ポリメラーゼに基づくプライマー伸長によって、伸長させる。プライマー伸長ステップを、(C)に示されているようにコンパートメントタグをビーズから放出させた後に行ってもよく、または必要に応じてコンパートメントタグが依然としてビーズに付着している間に行ってもよい(図示せず)。これにより、ビーズのコンパートメントタグに由来するバーコード配列が、ポリペプチドのU1 DNAタグ配列に効果的に書き込まれる。この新しい配列が、記録タグを構成する。プライマー伸長後、プロテアーゼ、例えば、Lys-C(リシン残基のC末端側を切断する)、Glu-C(グルタミン酸残基のC末端側を、および程度は低いがグルタミン酸残基を切断する)、またはプロテイナーゼKなどのランダムプロテアーゼを使用して、ポリペプチドを切断してペプチド断片にする。(E)各ペプチド断片は、本明細書で開示されているように下流ペプチド配列決定のために、そのC末端リシンを、記録タグを構成する伸長DNAタグ配列で標識する。(F)記録タグ付きペプチドを、歪みアルキン標識であるDBCOを介してアジドビーズにカップリングする。アジドビーズは、必要に応じて、DBCO-アジド固定化の効率を促進するために、記録タグに相補的な捕捉配列も含有する。元のビーズからペプチドを除去し、新しい固体支持体(例えば、ビーズ)に再固定化することにより、ペプチド間の最適な分子間間隔が可能になり、本明細書で開示されているペプチド配列決定法が容易になることが留意されるべきである。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図20G~Lは、アルキンで予め標識したポリペプチド(図2Bに記載のような)へのDNAタグのクリック化学コンジュゲーションを使用すること以外は、図20A~Fに示されているものと同様の概念を示す。アジドおよびmTet化学は、直交性であり、DNAタグへのクリックコンジュゲーション、および配列決定基材へのクリックiEDDAコンジュゲーション(mTetおよびTCO)を可能にする。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。 図20G~Lは、アルキンで予め標識したポリペプチド(図2Bに記載のような)へのDNAタグのクリック化学コンジュゲーションを使用すること以外は、図20A~Fに示されているものと同様の概念を示す。アジドおよびmTet化学は、直交性であり、DNAタグへのクリックコンジュゲーション、および配列決定基材へのクリックiEDDAコンジュゲーション(mTetおよびTCO)を可能にする。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図21は、流動フォーカスT字路を使用して、単一細胞を、コンパートメントタグ付き(例えば、バーコード)ビーズにコンパートメント化するための例示的な方法を示す。2つの水流を用いると、液滴形成時に、細胞溶解およびプロテアーゼ活性化(Zn2+混合)を容易に開始することができる。
図22A~22Bは、例示的なタグ化詳細を示す。(A)コンパートメントタグ(DNA-ペプチドキメラ)を、ブテラーゼIによるペプチドライゲーションを使用して、ペプチドに付着させる。(B)ペプチド配列決定の開始前に、コンパートメントタグ情報を、付随する記録タグへと移行させる。任意選択で、アスパラギン酸残基のN末端でペプチド結合を選択的に切断するエンドペプチダーゼAspNを使用して、記録タグへの情報移行後、コンパートメントタグを切断することができる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図23A~C:組織スライスの空間的プロテオミクスに基づく解析のためのアレイに基づくバーコード。(A)空間的にコードされたDNAバーコードのアレイ(BCijと表記されている特徴バーコード)を、組織スライス(FFPEまたは凍結されたもの)と組み合わせる。一実施形態では、組織スライスは、固定され、透過処理されている。好ましい実施形態では、アレイ特徴サイズは、細胞サイズ(ヒト細胞については約10μm)よりも小さい。(B)アレイにマウントした組織スライスを試薬で処理して架橋を元に戻し(例えば、シトラコン酸無水物での抗原賦活化プロトコール(Namimatsu, Ghazizadeh et al. 2005)、次いで、その中のタンパク質を、タンパク質分子すべてをDNA記録タグで効果的に標識する部位反応性DNA標識で標識する(例えば、抗原賦活化後に遊離される、リシン標識)。標識および洗浄後、アレイに結合されているDNAバーコード配列を切断し、マウントした組織スライスへの拡散を可能にし、その中にあるタンパク質に付着したDNA記録タグとハイブリダイズさせる。(C)アレイにマウントした組織を、次にポリメラーゼ伸長に供して、ハイブリダイズされたバーコードの情報を、タンパク質を標識しているDNA記録タグへと移行させる。バーコード情報の移行後、アレイにマウントした組織を、スライドからこすり落とし、必要に応じてプロテアーゼにより消化し、タンパク質またはペプチドを溶液に抽出する。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図24A~Bは、ビーズに固定化されており、コーディングタグに付着している結合性物質によってアッセイされる、2つの異なる例示的なDNA標的分析物(ABおよびCD)を示す。このモデル系は、結合されている物質から近位レポートタグへのコーディングタグ移行についての単一分子挙動を説明するのに役立つ。好ましい実施形態では、コーディングタグは、プライマー伸長によって伸長再コーディングタグに組み込まれる。図24Aは、AB巨大分子が、A特異的結合性物質(「A’」、AB巨大分子の「A’」成分に相補的なオリゴヌクレオチド配列)と相互作用して、付随するコーディングタグの情報がプライマー伸長によって記録タグに移行され、B特異的結合性物質(「B’」、AB巨大分子の「B’」成分に相補的なオリゴヌクレオチド配列)と相互作用して、付随するコーディングタグの情報がプライマー伸長によって再コーディングタグへと移行されることを示す。コーディングタグAおよびBは配列が異なり、この図では、容易に識別することができるように長さも異なっている。長さが異なることにより、ゲル電気泳動法によるコーディングタグ移行の解析が容易になるが、次世代シーケンシングによる解析では長さが異なる必要はない。A’およびB’結合性物質の結合は、単一結合サイクルの代替的な可能性として示されている。第2のサイクルが追加されれば、伸長記録タグはさらに伸長されることになる。第1および第2のサイクルにおいてA’またはB’結合性物質のどちらが付加されるのかに依存して、伸長記録タグは、形態AA、AB、BAおよびBBのコーディングタグ情報を含有することができる。したがって、伸長記録タグは、結合物質の同一性だけでなく、結合事象の順序に関する情報も含有する。同様に、図24Bは、CD巨大分子が、C特異的結合性物質(「C’」、CD巨大分子の「C’」成分に相補的なオリゴヌクレオチド配列)と相互作用して、付随するコーディングタグの情報がプライマー伸長によって記録タグへと移行され、D特異的結合性物質(「D’」、CD巨大分子の「D’」成分に相補的なオリゴヌクレオチド配列)と相互作用して、付随するコーディングタグの情報がプライマー伸長によって記録タグに移行されることを示す。コーディングタグCおよびDは配列が異なり、この図では、容易に識別することができるように長さも異なっている。長さが異なることにより、ゲル電気泳動法によるコーディングタグ移行の解析が容易になるが、次世代シーケンシングによる解析では長さが異なる必要はない。C’およびD’結合性物質の結合は、単一結合サイクルの代替的な可能性として示されている。第2のサイクルが追加されれば、伸長記録タグはさらに伸長されることになる。第1および第2のサイクルにおいてC’またはD’結合性物質のどちらが付加されるのかに依存して、伸長記録タグは、形態CC、CD、DCおよびDDのコーディングタグ情報を含有することができる。コーディングタグは、必要に応じてUMIを含むこともある。コーディングタグにUMIを含めることにより、結合事象に関する追加情報を記録することが可能になり、それにより、結合事象を個々の結合性物質のレベルで区別することが可能になる。これは、個々の結合性物質が、1つより多くの結合事象に関与し得る(例えば、その結合親和性が、1つより多くの事象に関与するのに十分な頻度で遊離および再結合できるような結合親和性である)場合、有用であり得る。それは、エラー訂正にも有用であり得る。例えば、いくつかの状況下では、コーディングタグは、同じ結合サイクルで2回またはそれよりも多くの頻度で情報を記録タグに移行させることがある。UMIの使用によって、これらが、すべて単一結合事象に関連付けられる繰り返し情報移行事象である可能性が高いことが明らかになる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図24A~Bは、ビーズに固定化されており、コーディングタグに付着している結合性物質によってアッセイされる、2つの異なる例示的なDNA標的分析物(ABおよびCD)を示す。このモデル系は、結合されている物質から近位レポートタグへのコーディングタグ移行についての単一分子挙動を説明するのに役立つ。好ましい実施形態では、コーディングタグは、プライマー伸長によって伸長再コーディングタグに組み込まれる。図24Aは、AB巨大分子が、A特異的結合性物質(「A’」、AB巨大分子の「A’」成分に相補的なオリゴヌクレオチド配列)と相互作用して、付随するコーディングタグの情報がプライマー伸長によって記録タグに移行され、B特異的結合性物質(「B’」、AB巨大分子の「B’」成分に相補的なオリゴヌクレオチド配列)と相互作用して、付随するコーディングタグの情報がプライマー伸長によって再コーディングタグへと移行されることを示す。コーディングタグAおよびBは配列が異なり、この図では、容易に識別することができるように長さも異なっている。長さが異なることにより、ゲル電気泳動法によるコーディングタグ移行の解析が容易になるが、次世代シーケンシングによる解析では長さが異なる必要はない。A’およびB’結合性物質の結合は、単一結合サイクルの代替的な可能性として示されている。第2のサイクルが追加されれば、伸長記録タグはさらに伸長されることになる。第1および第2のサイクルにおいてA’またはB’結合性物質のどちらが付加されるのかに依存して、伸長記録タグは、形態AA、AB、BAおよびBBのコーディングタグ情報を含有することができる。したがって、伸長記録タグは、結合物質の同一性だけでなく、結合事象の順序に関する情報も含有する。同様に、図24Bは、CD巨大分子が、C特異的結合性物質(「C’」、CD巨大分子の「C’」成分に相補的なオリゴヌクレオチド配列)と相互作用して、付随するコーディングタグの情報がプライマー伸長によって記録タグへと移行され、D特異的結合性物質(「D’」、CD巨大分子の「D’」成分に相補的なオリゴヌクレオチド配列)と相互作用して、付随するコーディングタグの情報がプライマー伸長によって記録タグに移行されることを示す。コーディングタグCおよびDは配列が異なり、この図では、容易に識別することができるように長さも異なっている。長さが異なることにより、ゲル電気泳動法によるコーディングタグ移行の解析が容易になるが、次世代シーケンシングによる解析では長さが異なる必要はない。C’およびD’結合性物質の結合は、単一結合サイクルの代替的な可能性として示されている。第2のサイクルが追加されれば、伸長記録タグはさらに伸長されることになる。第1および第2のサイクルにおいてC’またはD’結合性物質のどちらが付加されるのかに依存して、伸長記録タグは、形態CC、CD、DCおよびDDのコーディングタグ情報を含有することができる。コーディングタグは、必要に応じてUMIを含むこともある。コーディングタグにUMIを含めることにより、結合事象に関する追加情報を記録することが可能になり、それにより、結合事象を個々の結合性物質のレベルで区別することが可能になる。これは、個々の結合性物質が、1つより多くの結合事象に関与し得る(例えば、その結合親和性が、1つより多くの事象に関与するのに十分な頻度で遊離および再結合できるような結合親和性である)場合、有用であり得る。それは、エラー訂正にも有用であり得る。例えば、いくつかの状況下では、コーディングタグは、同じ結合サイクルで2回またはそれよりも多くの頻度で情報を記録タグに移行させることがある。UMIの使用によって、これらが、すべて単一結合事象に関連付けられる繰り返し情報移行事象である可能性が高いことが明らかになる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図25は、ビーズに固定化されており、コーディングタグに付着した結合性物質によりアッセイされる例示的なDNA標的巨大分子(AB)を示す。A特異的結合性物質(「A’」、AB巨大分子のA成分に相補的なオリゴヌクレオチド)は、AB巨大分子と相互作用し、付随するコーディングタグの情報が、ライゲーションにより記録タグへと移行される。B特異的結合性物質(「B’」、AB巨大分子のB成分に相補的なオリゴヌクレオチド)は、AB巨大分子と相互作用し、付随するコーディングタグの情報が、ライゲーションにより記録タグへと移行される。コーディングタグAおよびBは配列が異なり、この図では、容易に識別することができるように長さも異なっている。長さが異なることにより、ゲル電気泳動法によるコーディングタグ移行の解析が容易になるが、次世代シーケンシングによる解析には長さが異なる必要はない。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図26A~Bは、プライマー伸長による結合/コーディングタグ移行の例示的なDNA-ペプチド分析物(例えば、巨大分子)を示す。図26Aは、ビーズに固定化されている例示的なオリゴヌクレオチド-ペプチド標的巨大分子(「A」オリゴヌクレオチド-cMycペプチド)を示す。cMyc特異的結合性物質(例えば、抗体)は、巨大分子のcMycペプチド部分と相互作用し、付随するコーディングタグの情報が記録タグに移行される。cMycコーディングタグの情報の記録タグへの移行をゲル電気泳動法により解析することができる。図26Bは、ビーズに固定化されている例示的なオリゴヌクレオチド-ペプチド標的巨大分子(「C」オリゴヌクレオチド-赤血球凝集素(HA)ペプチド)を示す。HA特異的結合性物質(例えば、抗体)は、巨大分子のHAペプチド部分と相互作用し、付随するコーディングタグの情報が記録タグに移行される。コーディングタグの情報の記録タグへの移行をゲル電気泳動法により解析することができる。cMyc抗体-コーディングタグおよびHA抗体-コーディングタグの結合が、単一結合サイクルの代替的な可能性として示されている。第2の結合サイクルが実施されれば、伸長記録タグはさらに伸長されることになる。第1および第2の結合サイクルにおいてcMyc抗体-コーディングタグまたはHA抗体-コーディングタグのどちらが付加されるのかに依存して、伸長記録タグは、形態cMyc-HA、HA-cMyc、cMyc-cMyc、およびHA-HAのコーディングタグ情報を含有することができる。図示されていないが、追加の結合性物質を導入して、巨大分子のAおよびCオリゴヌクレオチド成分の検出を可能にすることもできる。したがって、情報を記録タグへと移行させ、結合性物質の同一性だけでなく結合事象の順序に関する情報も含有する伸長記録タグを読み出すことによって、異なるタイプの骨格を含むハイブリッド巨大分子を解析することができる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図27A~Dは、エラー訂正バーコードの生成の例を示す。(A)65個のエラー訂正バーコード(配列番号1~65)のサブセットを、Rソフトウェアパッケージ「DNABarcodes」(https://bioconductor.riken.jp/packages/3.3/bioc/manuals/DNABarcodes/man/DNABarcodes.pdf)から、コマンドパラメーター[create.dnabarcodes(n=15、dist=10)]を使用して導出した77個のバーコードのセットから選択した。このアルゴリズムは、4個の置換の距離まで置換エラーを訂正することができ、9個の置換までエラーを検出することができる、15mer「Hamming」バーコードを生成する。フィルターをかけて、様々なナノポア電流レベル(ナノポアに基づく配列決定の場合)を示さなかったバーコードまたはこのセットの他のメンバーとも相関していたバーコードを除去することにより、65個のバーコードのサブセットを生成した。(B)ポアを通り抜ける15merバーコードの予測ナノポア電流レベルのプロット。これらの予測電流は、各々の15merバーコードワードを、11個のオーバーラップしている5merワードの複合セットに分割し、5mer R9ナノポア電流レベル索引表(https://github.com/jts/nanopolish/tree/master/etc/r9-modelsで入手可能な、template_median68pA.5mers.model)を使用して、バーコードがナノポアを一度に一塩基ずつ通り抜ける際の対応する電流レベルを予測することによって計算した。(B)から理解することができるように、65個のバーコードのこのセットは、そのメンバーの各々について一意の電流シグネチャを示す。(C)DTRおよびDTRプライマーのオーバーラップセットを使用する、ナノポアシーケンシング用のモデル伸長記録タグとしてのPCR産物の生成が示されている。次いで、PCRアンプリコンをライゲーションして、連鎖状の伸長記録タグモデルを形成する。(D)図27Cに示されているように生成された、例示的な「伸長記録タグ」モデルのナノポアシーケンシングリード(リード長734塩基)。MinIon R9.4リードは、7.2(リード品質不良)の品質スコアを有する。しかしながら、低いリード品質(Qscore=7.2)であっても、lalignを使用してバーコード配列を容易に識別することができる。15merスペーサーエレメントには下線が引かれている。バーコードは、BCまたはBC’表示により示されるフォワード方向またはリバース方向のどちらかでアラインメントすることができる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。 図27A~Dは、エラー訂正バーコードの生成の例を示す。(A)65個のエラー訂正バーコード(配列番号1~65)のサブセットを、Rソフトウェアパッケージ「DNABarcodes」(https://bioconductor.riken.jp/packages/3.3/bioc/manuals/DNABarcodes/man/DNABarcodes.pdf)から、コマンドパラメーター[create.dnabarcodes(n=15、dist=10)]を使用して導出した77個のバーコードのセットから選択した。このアルゴリズムは、4個の置換の距離まで置換エラーを訂正することができ、9個の置換までエラーを検出することができる、15mer「Hamming」バーコードを生成する。フィルターをかけて、様々なナノポア電流レベル(ナノポアに基づく配列決定の場合)を示さなかったバーコードまたはこのセットの他のメンバーとも相関していたバーコードを除去することにより、65個のバーコードのサブセットを生成した。(B)ポアを通り抜ける15merバーコードの予測ナノポア電流レベルのプロット。これらの予測電流は、各々の15merバーコードワードを、11個のオーバーラップしている5merワードの複合セットに分割し、5mer R9ナノポア電流レベル索引表(https://github.com/jts/nanopolish/tree/master/etc/r9-modelsで入手可能な、template_median68pA.5mers.model)を使用して、バーコードがナノポアを一度に一塩基ずつ通り抜ける際の対応する電流レベルを予測することによって計算した。(B)から理解することができるように、65個のバーコードのこのセットは、そのメンバーの各々について一意の電流シグネチャを示す。(C)DTRおよびDTRプライマーのオーバーラップセットを使用する、ナノポアシーケンシング用のモデル伸長記録タグとしてのPCR産物の生成が示されている。次いで、PCRアンプリコンをライゲーションして、連鎖状の伸長記録タグモデルを形成する。(D)図27Cに示されているように生成された、例示的な「伸長記録タグ」モデルのナノポアシーケンシングリード(リード長734塩基)。MinIon R9.4リードは、7.2(リード品質不良)の品質スコアを有する。しかしながら、低いリード品質(Qscore=7.2)であっても、lalignを使用してバーコード配列を容易に識別することができる。15merスペーサーエレメントには下線が引かれている。バーコードは、BCまたはBC’表示により示されるフォワード方向またはリバース方向のどちらかでアラインメントすることができる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。 図27A~Dは、エラー訂正バーコードの生成の例を示す。(A)65個のエラー訂正バーコード(配列番号1~65)のサブセットを、Rソフトウェアパッケージ「DNABarcodes」(https://bioconductor.riken.jp/packages/3.3/bioc/manuals/DNABarcodes/man/DNABarcodes.pdf)から、コマンドパラメーター[create.dnabarcodes(n=15、dist=10)]を使用して導出した77個のバーコードのセットから選択した。このアルゴリズムは、4個の置換の距離まで置換エラーを訂正することができ、9個の置換までエラーを検出することができる、15mer「Hamming」バーコードを生成する。フィルターをかけて、様々なナノポア電流レベル(ナノポアに基づく配列決定の場合)を示さなかったバーコードまたはこのセットの他のメンバーとも相関していたバーコードを除去することにより、65個のバーコードのサブセットを生成した。(B)ポアを通り抜ける15merバーコードの予測ナノポア電流レベルのプロット。これらの予測電流は、各々の15merバーコードワードを、11個のオーバーラップしている5merワードの複合セットに分割し、5mer R9ナノポア電流レベル索引表(https://github.com/jts/nanopolish/tree/master/etc/r9-modelsで入手可能な、template_median68pA.5mers.model)を使用して、バーコードがナノポアを一度に一塩基ずつ通り抜ける際の対応する電流レベルを予測することによって計算した。(B)から理解することができるように、65個のバーコードのこのセットは、そのメンバーの各々について一意の電流シグネチャを示す。(C)DTRおよびDTRプライマーのオーバーラップセットを使用する、ナノポアシーケンシング用のモデル伸長記録タグとしてのPCR産物の生成が示されている。次いで、PCRアンプリコンをライゲーションして、連鎖状の伸長記録タグモデルを形成する。(D)図27Cに示されているように生成された、例示的な「伸長記録タグ」モデルのナノポアシーケンシングリード(リード長734塩基)。MinIon R9.4リードは、7.2(リード品質不良)の品質スコアを有する。しかしながら、低いリード品質(Qscore=7.2)であっても、lalignを使用してバーコード配列を容易に識別することができる。15merスペーサーエレメントには下線が引かれている。バーコードは、BCまたはBC’表示により示されるフォワード方向またはリバース方向のどちらかでアラインメントすることができる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。 図27A~Dは、エラー訂正バーコードの生成の例を示す。(A)65個のエラー訂正バーコード(配列番号1~65)のサブセットを、Rソフトウェアパッケージ「DNABarcodes」(https://bioconductor.riken.jp/packages/3.3/bioc/manuals/DNABarcodes/man/DNABarcodes.pdf)から、コマンドパラメーター[create.dnabarcodes(n=15、dist=10)]を使用して導出した77個のバーコードのセットから選択した。このアルゴリズムは、4個の置換の距離まで置換エラーを訂正することができ、9個の置換までエラーを検出することができる、15mer「Hamming」バーコードを生成する。フィルターをかけて、様々なナノポア電流レベル(ナノポアに基づく配列決定の場合)を示さなかったバーコードまたはこのセットの他のメンバーとも相関していたバーコードを除去することにより、65個のバーコードのサブセットを生成した。(B)ポアを通り抜ける15merバーコードの予測ナノポア電流レベルのプロット。これらの予測電流は、各々の15merバーコードワードを、11個のオーバーラップしている5merワードの複合セットに分割し、5mer R9ナノポア電流レベル索引表(https://github.com/jts/nanopolish/tree/master/etc/r9-modelsで入手可能な、template_median68pA.5mers.model)を使用して、バーコードがナノポアを一度に一塩基ずつ通り抜ける際の対応する電流レベルを予測することによって計算した。(B)から理解することができるように、65個のバーコードのこのセットは、そのメンバーの各々について一意の電流シグネチャを示す。(C)DTRおよびDTRプライマーのオーバーラップセットを使用する、ナノポアシーケンシング用のモデル伸長記録タグとしてのPCR産物の生成が示されている。次いで、PCRアンプリコンをライゲーションして、連鎖状の伸長記録タグモデルを形成する。(D)図27Cに示されているように生成された、例示的な「伸長記録タグ」モデルのナノポアシーケンシングリード(リード長734塩基)。MinIon R9.4リードは、7.2(リード品質不良)の品質スコアを有する。しかしながら、低いリード品質(Qscore=7.2)であっても、lalignを使用してバーコード配列を容易に識別することができる。15merスペーサーエレメントには下線が引かれている。バーコードは、BCまたはBC’表示により示されるフォワード方向またはリバース方向のどちらかでアラインメントすることができる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図28A~Dは、記録タグによるタンパク質の分析物特異的標識の例を示す。(A)そのネイティブなコンフォメーションをとっている目的のタンパク質分析物を標的とする結合性物質は、分析物特異的バーコード(BC’)を含み、これがDNA記録タグ上の相補的な分析物特異的バーコード(BC)とハイブリダイズする。あるいは、切断可能なリンカーを介してDNA記録タグを結合性物質に付着させることができ、そのDNA記録タグを直接タンパク質に「クリック」し、その後、結合性物質から(切断可能なリンカーによって)切断する。DNA記録タグは、反応性カップリング部分(例えば、目的のタンパク質にカップリングするためのクリック化学試薬(例えば、アジド、mTetなど)、および他の機能性成分(例えば、ユニバーサルプライミング配列(P1)、試料バーコード(BC)、分析物特異的バーコード(BC)、およびスペーサー配列(Sp))を含む。試料バーコード(BC)を使用して、異なる試料に由来するタンパク質を標識および区別することもできる。DNA記録タグはまた、後続の基材表面へのカップリングのための直交性カップリング部分(例えば、mTet)を含むこともある。目的のタンパク質に記録タグをクリック化学カップリングする場合、タンパク質を、DNA記録タグのクリック化学カップリング部分と同種のクリック化学カップリング部分で予め標識する(例えば、タンパク質のアルキン部分は、DNA記録タグのアジド部分と同種である)。クリック化学カップリング用のカップリング部分でDNA記録タグを標識するための試薬の例としては、リシン標識用のアルキン-NHS試薬、光親和性標識用のアルキン-ベンゾフェノン試薬などが挙げられる。(B)結合性物質が近位標的タンパク質に結合した後、記録タグの反応性カップリング部分(例えば、アジド)は、近位タンパク質の同種クリック化学カップリング部分(3本線記号として示されている)に共有結合により付着する。(C)標的タンパク質分析物を記録タグで標識した後、ウラシル特異的切除試薬(例えば、USER(商標))を使用してウラシル(U)を消化することにより、付着している結合性物質を除去する。したがって、本請求項記載のキットは、ニッキングエンドヌクレアーゼなどのニッキング試薬も含み得る。(D)DNA記録タグで標識した標的タンパク質分析物を、クリック化学(アルキン-アジド結合対、メチルテトラジン(mTET)-trans-シクロオクテン(TCO)結合対など)のような好適なバイオコンジュゲート化学反応を使用して、基材表面に固定化する。ある特定の実施形態では、標的タンパク質-記録タグ標識アッセイ全体を、結合性物質のプールおよび記録タグのプールを使用して、多数の異なる標的タンパク質分析物を含む単一チューブの中で実施する。試料バーコード(BC)を含む記録タグで試料中のタンパク質分析物を標的標識した後、複数のタンパク質分析物試料を、(D)の固定化ステップの前にプールすることができる。したがって、ある特定の実施形態では、数百個の試料にわたって最大数千個のタンパク質分析物を、単一チューブ次世代タンパク質アッセイ(NGPA)で標識および固定化することができ、その結果、高価な親和性試薬(例えば、抗体)が大幅に節約される。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図29A~Dは、DNA記録タグとポリペプチドとのコンジュゲーションの例を示す。(A)変性ポリペプチドを、アルキン-NHSエステル(アセチレン-PEG-NHSエステル)試薬またはアルキン-ベンゾフェノンなどの二機能性クリック化学試薬で標識して、アルキン標識(3本線記号)ポリペプチドを生成する。アルキンはまた、歪みアルキン、例えば、ジベンゾシクロオクチル(DBCO)などを含むシクロオクチンなどである場合もある。(B)アルキン標識ポリペプチドに化学的にカップリングされるDNA記録タグ設計の例が示されている。記録タグは、ユニバーサルプライミング配列(P1)、バーコード(BC)、およびスペーサー配列(Sp)を含む。記録タグを、基材表面にカップリングするためのmTet部分、および標識ポリペプチドのアルキン部分とカップリングするためのアジド部分で標識する。(C)アルキンで標識された変性タンパク質またはポリペプチドを、アルキンおよびアジド部分を介して記録タグで標識する。必要に応じて、記録タグ標識ポリペプチドを、コンパートメントバーコードで、例えば、コンパートメントビーズに付着している相補配列とのアニーリングおよびプライマー伸長(ポリメラーゼ伸長とも呼ばれる)によって、または図20H~Jに示されているように、さらに標識することができる。(D)記録タグ標識ポリペプチドをプロテアーゼ消化することにより、記録タグ標識ペプチドの集団が創出される。一部の実施形態では、一部のペプチドは、いかなる記録タグでも標識されないことになる。他の実施形態では、一部のペプチドには、1つまたは複数の記録タグが付着していることもある。(E)記録タグ標識ペプチドを、TCO基で機能化された基材表面とペプチドに付着している記録タグのmTet部分との間の逆電子要請型ディールス-アルダー(iEDDA)クリック化学反応を使用して、基材表面に固定化する。ある特定の実施形態では、示されている異なる段階間で、クリーンアップステップを用いることもある。直交性クリック化学(例えば、アジド-アルキンおよびmTet-TCO)を使用することによって、記録タグでのポリペプチドのクリック化学標識と、記録タグ標識ペプチドの基材表面へのクリック化学固定化との両方が可能になる(その全体が参照により組み込まれる、McKay et al., 2014, Chem. Biol. 21:1075-1101を参照されたい)。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図30A~Eは、ポリペプチドの最初のDNA標識後に記録タグに試料バーコードを書き込むための例示的なプロセスを示す。(A)変性ポリペプチドを、アルキン-NHS試薬またはアルキン-ベンゾフェノンなどの二機能性クリック化学試薬で標識して、アルキン標識ポリペプチドを生成する。(B)ポリペプチドのアルキン(またはその代わりにクリック化学部分)標識後、ユニバーサルプライミング配列(P1)を含み、アジド部分およびmTet部分で標識されているDNAタグを、アジド-アルキン相互作用によってポリペプチドにカップリングする。他のクリック化学相互作用を用いてもよいことは理解される。(C)試料バーコード情報(BC’)および他の記録タグ機能性成分(例えば、ユニバーサルプライミング配列(P1’)、スペーサー配列(Sp’))を含む記録タグDNA構築物は、相補的ユニバーサルプライミング配列(P1-P1’)を介してDNAタグ標識ポリペプチドとアニーリングする。記録タグ情報は、ポリメラーゼ伸長によりDNAタグに移行される。(D)記録タグ標識ポリペプチドをプロテアーゼ消化することにより、記録タグ標識ペプチドの集団が創出される。(E)記録タグ標識ペプチドを、TCO基で機能化された表面とペプチドに付着している記録タグのmTet部分との間の逆電子要請型ディールス-アルダー(iEDDA)クリック化学反応を使用して、基材表面に固定化する。ある特定の実施形態では、示されている異なる段階間で、クリーンアップステップを用いることもある。直交性クリック化学(例えば、アジド-アルキンおよびmTet-TCO)を使用することによって、記録タグでのポリペプチドのクリック化学標識と、記録タグ標識ポリペプチドの基材表面へのクリック化学固定化との両方が可能になる(その全体が参照により組み込まれる、McKay et al., 2014, Chem. Biol. 21:1075-1101を参照されたい)。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図31A~31Dは、ポリペプチドにバーコードを付与するためのビーズコンパートメント化の例を示す。(A)ポリペプチドを、標準的バイオコンジュゲーションまたは光親和性標識技法を使用して、ヘテロ二機能性クリック化学試薬を用いて、溶液中で標識する。可能性のある標識部位としては、リシン残基のε-アミン(例えば、示されているようなNHS-アルキンで)またはペプチドの炭素骨格(例えば、ベンゾフェノン-アルキンで)が挙げられる。(B)ユニバーサルプライミング配列(P1)を含むアジド標識DNAタグを、標識ポリペプチドのアルキン部分にカップリングする。(C)DNAタグ標識ポリペプチドを、DNA記録タグ標識ビーズに、相補的DNA配列(P1およびP1’)を介してアニーリングさせる。ビーズのDNA記録タグは、スペーサー配列(Sp’)、コンパートメントバーコード配列(BC’)、必要に応じた一意の分子識別子(UMI)、およびユニバーサル配列(P1’)を含む。DNA記録タグ情報は、ポリメラーゼ伸長によって(あるいは、ライゲーションを用いてもよい)、ポリペプチドのDNAタグに移行した。情報移行後、得られたポリペプチドは、コンパートメントバーコードを含むいくつかの機能的エレメントを含有する複数の記録タグを含む。(D)記録タグ標識ポリペプチドをプロテアーゼ消化することにより、記録タグ標識ペプチドの集団が創出される。記録タグ標識ペプチドをビーズから解離させ、(E)配列決定基材に(例えば、示されているようなmTet部分とTCO部分との間のiEDDAクリック化学を使用して)再固定化する。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図32A~Hは、次世代タンパク質アッセイ(NGPA)のワークフローの例を示す。タンパク質試料を、いくつかの機能性単位、例えば、ユニバーサルプライミング配列(P1)、バーコード配列(BC)、必要に応じたUMI配列、およびスペーサー配列(Sp)(結合性物質コーディングタグとの情報移行を可能にする)で構成されているDNA記録タグで標識する。(A)標識タンパク質を基材(例えば、ビーズ、多孔質ビーズ、または多孔質マトリックス)に(受動的に、または共有結合で)固定化する。(B)基材をタンパク質でブロッキングし、必要に応じて、スペーサー配列に相補的な競合オリゴヌクレオチド(Sp’)を添加して分析物記録タグ配列の非特異的相互作用を最小限に抑える。(C)分析物特異的抗体(付随するコーディングタグを有する)を、基質に結合されたタンパク質と共にインキュベートする。コーディングタグは、後続のウラシル特異的切断のためのウラシル塩基を含むこともある。(D)抗体結合後、添加した場合には過剰な競合オリゴヌクレオチド(Sp’)を洗い流す。コーディングタグが相補的スペーサー配列を介して記録タグと一時的にアニーリングし、コーディングタグ情報がプライマー伸長反応で記録タグへと移行されて伸長記録タグが生成される。固定化されたタンパク質が変性される場合、結合されている抗体およびアニーリングされたコーディングタグを0.1N NaOHなどのアルカリ洗浄条件下で除去することができる。固定化されたタンパク質が、ネイティブなコンフォメーションをとっている場合には、結合されている抗体およびコーディングタグをより穏やかな条件で除去する必要があり得る。より穏やかな抗体除去条件の例は、パネルE~Hに概説されている。(E)コーディングタグから記録タグへの情報移行後、ウラシル特異的切除試薬(例えば、USER(商標))酵素ミックスを使用して、コーディングタグをそのウラシル部位でニッキングする(切断する)。(F)結合されている抗体を、高塩濃度、低/高pHの洗浄液を使用してタンパク質から除去する。抗体に付着したままの切り詰められたDNAコーディングタグは、短いため溶出も迅速である。より長いDNAコーディングタグ断片は、記録タグにアニーリングされたままであることもあり、またはアニーリングされたままでないこともある。(G)第2の結合サイクルが、ステップ(B)~(D)と同様に開始し、第2のプライマー伸長ステップが、プライマー伸長によってコーディングタグ情報を第2の抗体から伸長記録タグに移行させる。(H)2つの結合サイクルの結果は、記録タグに付着している第1の抗体および第2の抗体からの結合情報の連鎖体である。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。 図32A~Hは、次世代タンパク質アッセイ(NGPA)のワークフローの例を示す。タンパク質試料を、いくつかの機能性単位、例えば、ユニバーサルプライミング配列(P1)、バーコード配列(BC)、必要に応じたUMI配列、およびスペーサー配列(Sp)(結合性物質コーディングタグとの情報移行を可能にする)で構成されているDNA記録タグで標識する。(A)標識タンパク質を基材(例えば、ビーズ、多孔質ビーズ、または多孔質マトリックス)に(受動的に、または共有結合で)固定化する。(B)基材をタンパク質でブロッキングし、必要に応じて、スペーサー配列に相補的な競合オリゴヌクレオチド(Sp’)を添加して分析物記録タグ配列の非特異的相互作用を最小限に抑える。(C)分析物特異的抗体(付随するコーディングタグを有する)を、基質に結合されたタンパク質と共にインキュベートする。コーディングタグは、後続のウラシル特異的切断のためのウラシル塩基を含むこともある。(D)抗体結合後、添加した場合には過剰な競合オリゴヌクレオチド(Sp’)を洗い流す。コーディングタグが相補的スペーサー配列を介して記録タグと一時的にアニーリングし、コーディングタグ情報がプライマー伸長反応で記録タグへと移行されて伸長記録タグが生成される。固定化されたタンパク質が変性される場合、結合されている抗体およびアニーリングされたコーディングタグを0.1N NaOHなどのアルカリ洗浄条件下で除去することができる。固定化されたタンパク質が、ネイティブなコンフォメーションをとっている場合には、結合されている抗体およびコーディングタグをより穏やかな条件で除去する必要があり得る。より穏やかな抗体除去条件の例は、パネルE~Hに概説されている。(E)コーディングタグから記録タグへの情報移行後、ウラシル特異的切除試薬(例えば、USER(商標))酵素ミックスを使用して、コーディングタグをそのウラシル部位でニッキングする(切断する)。(F)結合されている抗体を、高塩濃度、低/高pHの洗浄液を使用してタンパク質から除去する。抗体に付着したままの切り詰められたDNAコーディングタグは、短いため溶出も迅速である。より長いDNAコーディングタグ断片は、記録タグにアニーリングされたままであることもあり、またはアニーリングされたままでないこともある。(G)第2の結合サイクルが、ステップ(B)~(D)と同様に開始し、第2のプライマー伸長ステップが、プライマー伸長によってコーディングタグ情報を第2の抗体から伸長記録タグに移行させる。(H)2つの結合サイクルの結果は、記録タグに付着している第1の抗体および第2の抗体からの結合情報の連鎖体である。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図33A~Dは、複数の結合性物質および酵素媒介性連続情報移行を使用する1ステップ次世代タンパク質アッセイ(NGPA)の例を示す。2つの同種結合性物質(例えば、抗体)が同時に結合している固定化タンパク質分子でのNGPAアッセイ。複数の同種抗体結合事象の後、プライマー伸長とDNAニッキングの組合せステップを使用して、結合されている抗体のコーディングタグから記録タグに情報を移行させる。コーディングタグのキャレット記号(^)は、二本鎖DNAニッキングエンドヌクレアーゼ部位を表わす。図33Aでは、タンパク質のエピトープ1(Epi#1)に結合されている抗体のコーディングタグは、相補的スペーサー配列のハイブリダイゼーション後のプライマー伸長ステップにおいて、コーディングタグ情報(例えば、エンコーダー配列)を記録タグに移行させる。図33Bでは、伸長記録タグとコーディングタグの間に二本鎖DNAが形成されたら、37℃で活性である、Nt.BsmAIなどの、二本鎖DNA基質の一方のDNA鎖のみを切断するニッキングエンドヌクレアーゼを使用して、コーディングタグを切断する。ニッキングステップ後、切り詰められたコーディングタグ結合性物質と伸長記録タグとで形成された二本鎖は、熱力学的に不安定になり、解離する。より長いコーディングタグ断片は、記録タグにアニーリングされたままであることもあり、またはアニーリングされたままでないこともある。図33Cでは、これにより、タンパク質のエピトープ#2(Epi#2)に結合されている抗体からのコーディングタグが、相補的スペーサー配列を介して伸長記録タグにアニーリングすることが可能になり、プライマー伸長によってEpi#2抗体のコーディングタグから伸長記録タグに情報を移行させることにより伸長記録タグをさらに伸長させることが可能になる。図33Dでは、この場合も、伸長記録タグとEpi#2抗体のコーディングタグとの間に二本鎖DNAが形成された後、Nb.BssSIなどのニッキングエンドヌクレアーゼによりコーディングタグをニッキングする。ある特定の実施形態では、プライマー伸長(ポリメラーゼ伸長とも呼ばれる)中は非鎖置換ポリメラーゼの使用が好ましい。非鎖置換ポリメラーゼは、単一塩基より多くの塩基によって記録タグにアニーリングされたままである切断されたコーディングタグ残部の伸長を防止する。図33A~Dのプロセスは、近位の結合されている結合性物質のコーディングタグすべてが、ハイブリダイゼーションステップ、伸長記録タグへの情報移行ステップおよびニッキングステップにより「消費」されるまで、自発的に繰り返すことができる。コーディングタグは、所与の分析物(例えば、同種タンパク質)に特異的なすべての結合性物質(例えば、抗体)について同一であるエンコーダー配列を含むことができ、エピトープ特異的エンコーダー配列を含むことができ、または異なる分子事象を区別するための一意の分子識別子(UMI)を含むことができる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図34A~Cは、基材表面の反応性部分のタイトレーションを使用する記録タグ-ペプチド固定化の密度制御の例を示す。図34Aでは、基材表面のペプチド密度は、基材の表面の機能性カップリング部分の密度を制御することによりタイトレーションすることができる。これは、活性カップリング分子の「ダミー」カップリング分子に対する適切な比で基質の表面を誘導体化することにより達成することができる。示されている例では、NHS-PEG-TCO試薬(活性カップリング分子)とNHS-mPEG(ダミー分子)とを規定されている比で組み合わせて、アミン表面をTCOで誘導体化する。機能化PEGは、300から40,000を超える種々の分子量のものが入手可能である。図34Bでは、二機能性5’アミンDNA記録タグ(mTetは他方の機能的部分である)を、スクシンイミジル4-(N-マレイミドメチル)シクロヘキサン-1(SMCC)二機能性架橋剤を使用して、ペプチドのN末端Cys残基にカップリングする。記録タグの内部mTet-dT基を、mテトラジン-アジドを使用してアジド-dT基から創出する。図34Cでは、記録タグ標識ペプチドを、mTetとTCOとのiEDDAクリック化学反応を使用して図34Aからの活性化基材表面に固定化する。mTet-TCO iEDDAカップリング反応は、非常に迅速であり、効率的であり、安定している(mTet-TCOは、Tet-TCOよりも安定している)。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図35A~Cは、次世代タンパク質シーケンシング(NGPS)結合サイクル特異的コーディングタグの例を示す。(A)サイクル特異的N末端アミノ酸(NTAA)結合性物質コーディングタグを用いるNGPSアッセイ(ProteoCodeとも呼ばれる)の設計。NTAA結合性物質(例えば、N末端DNP標識チロシンに特異的な抗体)は、ユニバーサルプライミング配列(P1)と、バーコード(BC)と、スペーサー配列(Sp)とを含む記録タグに付随するペプチドのDNP標識NTAAに結合する。結合性物質がペプチドの同種NTAAに結合すると、NTAA結合性物質に付随するコーディングタグは、記録タグに接近し、相補的スペーサー配列を介して記録タグにアニーリングする。コーディングタグ情報は、プライマー伸長により記録タグに移行される。コーディングタグがどの結合サイクルを表わすのかを記録するために、コーディングタグは、サイクル特異的バーコードを含むことができる。ある特定の実施形態では、分析物に結合する結合性物質のコーディングタグは、一意の結合サイクル特異的バーコードと組み合わせられている、サイクル数に依存しない同じエンコーダーバーコードを有する。他の実施形態では、分析物に対する結合性物質のコーディングタグは、分析物-結合サイクルの組合せ情報についての一意のエンコーダーバーコードを含む。どちらの手法においても、共通スペーサー配列を、各結合サイクルで結合性物質のコーディングタグに使用することができる。(B)この例では、各結合サイクルからの結合性物質は、結合サイクルを識別するための短い結合サイクル特異的バーコードを有し、これが、結合性物質を識別するエンコーダーバーコードと一緒に、特定の結合性物質-結合サイクルの組合せを識別する一意の組合せバーコードを提供する。(C)結合サイクルの完了後、伸長記録タグを、キャッピングサイクルステップを使用して増幅可能なライブラリーに変換することができ、このキャッピングサイクルステップでは、例えば、ユニバーサルプライミング配列P2とスペーサー配列Sp’とに連結されたユニバーサルプライミング配列P1’を含むキャップが、まず相補的P1およびP1’配列を介して伸長記録タグとアニーリングして、キャップを伸長記録タグに接近させる。伸長記録タグおよびキャップにおける相補的SpおよびSp’配列がアニーリングし、プライマー伸長により、第2のユニバーサルプライマー配列(P2)が伸長記録タグに付加される。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図36A~Eは、コーディングタグから記録タグへの情報移行を実証するためのDNAに基づくモデル系の例を示す。例示的な結合および分子内書き込みを、オリゴヌクレオチドモデル系により実証した。コーディングタグにおける標的化物質A’およびB’を、記録タグの標的結合領域AおよびBとハイブリダイズするように設計した。saRT_Abc_v2(A標的)およびsaRT_Bbc_V2(B標的)という2つの再コーディングタグを等濃度でプールすることにより、記録タグ(RT)ミックスを調製した。記録タグは、5’末端がビオチン化されており、一意の標的結合領域と、ユニバーサルフォワードプライマー配列と、一意のDNAバーコードと、8塩基共通スペーサー配列(Sp)とを含有する。コーディングタグは、8塩基共通スペーサー配列(Sp’)と隣接している一意のエンコーダーバーコード塩基を含有し、8塩基共通スペーサー配列の1つは、ポリエチレングリコールリンカーを介してAまたはB標的物質と共有結合により連結されている。図36Aでは、ビオチン化記録タグオリゴヌクレオチド(saRT_Abc_v2およびsaRT_Bbc_V2)を、ビオチン化ダミーT10オリゴヌクレオチドと共に、ストレプトアビジンビーズに固定化した。AまたはB捕捉配列(同種結合性物質-A’およびB’により、それぞれ認識される)と、結合標的を識別するための対応するバーコード(rtA_BCおよびrtB_BC)とを用いて、記録タグを設計した。このモデル系のすべてのバーコードは、65個の15merバーコード(配列番号1~65)のセットから選択した。一部の場合には、ゲル解析を容易にするために、15merバーコードを組み合わせてより長いバーコードを構成した。詳細には、rtA_BC=BC_1+BC_2;rtB_BC=BC_3。記録タグのAおよびB配列と同種の結合性物質の2つのコーディングタグ、つまり、CT_A’-bc(エンコーダーバーコード=BC_5)およびCT_B’-bc(エンコーダーバーコード=BC_5+BC_6)も合成した。必要に応じて、ビーズに固定化された記録タグとのコーディングタグのアニーリング前に、コーディングタグ配列の一部分に相補的なブロッキングオリゴ(DupCT_A’BCおよびDupCT_AB’BC)を(一本鎖Sp’配列を残して)、コーディングタグに前以てアニーリングした。鎖置換ポリメラーゼは、ポリメラーゼ伸長中にブロッキングオリゴを除去する。バーコード凡例(挿入図)は、記録タグおよびコーディングタグの機能性バーコードへの15merバーコードの割り当てを示す。図36Bでの、記録タグバーコード設計およびコーディングタグエンコーダーバーコード設計は、記録タグとコーディングタグ間の「分子内」対「分子間」相互作用の容易なゲル解析を提供する。この設計では、望ましくない「分子間」相互作用(A記録タグとB’コーディングタグとの、およびB記録タグとA’コーディングタグとの)が、所望の「分子内」(A記録タグとA’コーディングタグとの;B記録タグとB’コーディングタグとの)相互作用産物よりも15塩基長いかまたは短い、どちらか(wither)である、ゲル産物を生成する。プライマー伸長ステップは、A’およびB’コーディングタグバーコード(ctA’_BC、ctB’_BC)をリバース相補的バーコード(reversecomplement barcode)(ctA_BCおよびctB_BC)に変更する。図36Cでは、プライマー伸長アッセイは、コーディングタグから記録タグへの情報移行、およびPCR解析のためのアニーリングされたEndCapオリゴに対するプライマー伸長によるアダプター配列の付加を実証した。図36Dは、ダミーT20オリゴを使用する記録タグの表面密度のタイトレーションによる「分子内」情報移行の最適化を示す。ビオチン化記録タグオリゴを、1:0から、1:10、下は1:10000に至るまでの様々な比で、ビオチン化ダミーT20オリゴと混合した。低下した記録タグ密度(1:10および1:10)では、「分子内」相互作用が、「分子間」相互作用よりも優勢である。図36Eには、DNAモデル系の単純な伸長として、Nano-Tag15ペプチド-ストレプトアビジン結合対を含む単純なタンパク質結合系が示されている(K 約4nM)(Perbandtet al., 2007, Proteins 67:1147-1153)が、任意の数のペプチド-結合性物質モデル系を用いることができる。Nano-Tag15ペプチド配列は、(fM)DVEAWLGARVPLVET(配列番号131)(fM=ホルミル-Met)である。Nano-Tag15ペプチドは、DNA記録タグにカップリングするための短い柔軟性リンカーペプチド(GGGGS)およびシステイン残基をさらに含む。他の例示的なペプチドタグ-同種結合性物質対としては、カルモジュリン結合ペプチド(CBP)-カルモジュリン(K 約2pM)(Mukherjeeet al., 2015, J. Mol. Biol. 427: 2707-2725)、アミロイドベータ(Aβ16~27)ペプチド-US7/Lcn2アンチカリン(0.2nM)(Rauthet al., 2016, Biochem. J. 473: 1563-1578)、PAタグ/NZ-1抗体(K 約400pM)、FLAG-M2 Ab(28nM)、HA-4B2 Ab(1.6nM)、およびMyc-9E10 Ab(2.2nM)(Fujiiet al., 2014, Protein Expr. Purif. 95:240-247)が挙げられる。プライマー伸長による結合性物質のコーディングタグから記録タグへの分子内情報移行の試験として、相補的DNA配列「A」に結合するオリゴヌクレオチド「結合性物質」を、試験および開発に使用することができる。このハイブリダイゼーション事象は、本質的にfM親和性よりも大きい親和性を有する。ストレプトアビジンを、Nano-tag15ペプチドエピトープの試験結合性物質として使用することができる。ペプチドタグ-結合性物質相互作用は、高親和性であるが、酸性および/または高塩濃度の洗浄液を用いてこの相互作用を容易に妨げることができる(Perbandtet al.、上掲)。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。 図36A~Eは、コーディングタグから記録タグへの情報移行を実証するためのDNAに基づくモデル系の例を示す。例示的な結合および分子内書き込みを、オリゴヌクレオチドモデル系により実証した。コーディングタグにおける標的化物質A’およびB’を、記録タグの標的結合領域AおよびBとハイブリダイズするように設計した。saRT_Abc_v2(A標的)およびsaRT_Bbc_V2(B標的)という2つの再コーディングタグを等濃度でプールすることにより、記録タグ(RT)ミックスを調製した。記録タグは、5’末端がビオチン化されており、一意の標的結合領域と、ユニバーサルフォワードプライマー配列と、一意のDNAバーコードと、8塩基共通スペーサー配列(Sp)とを含有する。コーディングタグは、8塩基共通スペーサー配列(Sp’)と隣接している一意のエンコーダーバーコード塩基を含有し、8塩基共通スペーサー配列の1つは、ポリエチレングリコールリンカーを介してAまたはB標的物質と共有結合により連結されている。図36Aでは、ビオチン化記録タグオリゴヌクレオチド(saRT_Abc_v2およびsaRT_Bbc_V2)を、ビオチン化ダミーT10オリゴヌクレオチドと共に、ストレプトアビジンビーズに固定化した。AまたはB捕捉配列(同種結合性物質-A’およびB’により、それぞれ認識される)と、結合標的を識別するための対応するバーコード(rtA_BCおよびrtB_BC)とを用いて、記録タグを設計した。このモデル系のすべてのバーコードは、65個の15merバーコード(配列番号1~65)のセットから選択した。一部の場合には、ゲル解析を容易にするために、15merバーコードを組み合わせてより長いバーコードを構成した。詳細には、rtA_BC=BC_1+BC_2;rtB_BC=BC_3。記録タグのAおよびB配列と同種の結合性物質の2つのコーディングタグ、つまり、CT_A’-bc(エンコーダーバーコード=BC_5)およびCT_B’-bc(エンコーダーバーコード=BC_5+BC_6)も合成した。必要に応じて、ビーズに固定化された記録タグとのコーディングタグのアニーリング前に、コーディングタグ配列の一部分に相補的なブロッキングオリゴ(DupCT_A’BCおよびDupCT_AB’BC)を(一本鎖Sp’配列を残して)、コーディングタグに前以てアニーリングした。鎖置換ポリメラーゼは、ポリメラーゼ伸長中にブロッキングオリゴを除去する。バーコード凡例(挿入図)は、記録タグおよびコーディングタグの機能性バーコードへの15merバーコードの割り当てを示す。図36Bでの、記録タグバーコード設計およびコーディングタグエンコーダーバーコード設計は、記録タグとコーディングタグ間の「分子内」対「分子間」相互作用の容易なゲル解析を提供する。この設計では、望ましくない「分子間」相互作用(A記録タグとB’コーディングタグとの、およびB記録タグとA’コーディングタグとの)が、所望の「分子内」(A記録タグとA’コーディングタグとの;B記録タグとB’コーディングタグとの)相互作用産物よりも15塩基長いかまたは短い、どちらか(wither)である、ゲル産物を生成する。プライマー伸長ステップは、A’およびB’コーディングタグバーコード(ctA’_BC、ctB’_BC)をリバース相補的バーコード(reversecomplement barcode)(ctA_BCおよびctB_BC)に変更する。図36Cでは、プライマー伸長アッセイは、コーディングタグから記録タグへの情報移行、およびPCR解析のためのアニーリングされたEndCapオリゴに対するプライマー伸長によるアダプター配列の付加を実証した。図36Dは、ダミーT20オリゴを使用する記録タグの表面密度のタイトレーションによる「分子内」情報移行の最適化を示す。ビオチン化記録タグオリゴを、1:0から、1:10、下は1:10000に至るまでの様々な比で、ビオチン化ダミーT20オリゴと混合した。低下した記録タグ密度(1:10および1:10)では、「分子内」相互作用が、「分子間」相互作用よりも優勢である。図36Eには、DNAモデル系の単純な伸長として、Nano-Tag15ペプチド-ストレプトアビジン結合対を含む単純なタンパク質結合系が示されている(K 約4nM)(Perbandtet al., 2007, Proteins 67:1147-1153)が、任意の数のペプチド-結合性物質モデル系を用いることができる。Nano-Tag15ペプチド配列は、(fM)DVEAWLGARVPLVET(配列番号131)(fM=ホルミル-Met)である。Nano-Tag15ペプチドは、DNA記録タグにカップリングするための短い柔軟性リンカーペプチド(GGGGS)およびシステイン残基をさらに含む。他の例示的なペプチドタグ-同種結合性物質対としては、カルモジュリン結合ペプチド(CBP)-カルモジュリン(K 約2pM)(Mukherjeeet al., 2015, J. Mol. Biol. 427: 2707-2725)、アミロイドベータ(Aβ16~27)ペプチド-US7/Lcn2アンチカリン(0.2nM)(Rauthet al., 2016, Biochem. J. 473: 1563-1578)、PAタグ/NZ-1抗体(K 約400pM)、FLAG-M2 Ab(28nM)、HA-4B2 Ab(1.6nM)、およびMyc-9E10 Ab(2.2nM)(Fujiiet al., 2014, Protein Expr. Purif. 95:240-247)が挙げられる。プライマー伸長による結合性物質のコーディングタグから記録タグへの分子内情報移行の試験として、相補的DNA配列「A」に結合するオリゴヌクレオチド「結合性物質」を、試験および開発に使用することができる。このハイブリダイゼーション事象は、本質的にfM親和性よりも大きい親和性を有する。ストレプトアビジンを、Nano-tag15ペプチドエピトープの試験結合性物質として使用することができる。ペプチドタグ-結合性物質相互作用は、高親和性であるが、酸性および/または高塩濃度の洗浄液を用いてこの相互作用を容易に妨げることができる(Perbandtet al.、上掲)。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。 図36A~Eは、コーディングタグから記録タグへの情報移行を実証するためのDNAに基づくモデル系の例を示す。例示的な結合および分子内書き込みを、オリゴヌクレオチドモデル系により実証した。コーディングタグにおける標的化物質A’およびB’を、記録タグの標的結合領域AおよびBとハイブリダイズするように設計した。saRT_Abc_v2(A標的)およびsaRT_Bbc_V2(B標的)という2つの再コーディングタグを等濃度でプールすることにより、記録タグ(RT)ミックスを調製した。記録タグは、5’末端がビオチン化されており、一意の標的結合領域と、ユニバーサルフォワードプライマー配列と、一意のDNAバーコードと、8塩基共通スペーサー配列(Sp)とを含有する。コーディングタグは、8塩基共通スペーサー配列(Sp’)と隣接している一意のエンコーダーバーコード塩基を含有し、8塩基共通スペーサー配列の1つは、ポリエチレングリコールリンカーを介してAまたはB標的物質と共有結合により連結されている。図36Aでは、ビオチン化記録タグオリゴヌクレオチド(saRT_Abc_v2およびsaRT_Bbc_V2)を、ビオチン化ダミーT10オリゴヌクレオチドと共に、ストレプトアビジンビーズに固定化した。AまたはB捕捉配列(同種結合性物質-A’およびB’により、それぞれ認識される)と、結合標的を識別するための対応するバーコード(rtA_BCおよびrtB_BC)とを用いて、記録タグを設計した。このモデル系のすべてのバーコードは、65個の15merバーコード(配列番号1~65)のセットから選択した。一部の場合には、ゲル解析を容易にするために、15merバーコードを組み合わせてより長いバーコードを構成した。詳細には、rtA_BC=BC_1+BC_2;rtB_BC=BC_3。記録タグのAおよびB配列と同種の結合性物質の2つのコーディングタグ、つまり、CT_A’-bc(エンコーダーバーコード=BC_5)およびCT_B’-bc(エンコーダーバーコード=BC_5+BC_6)も合成した。必要に応じて、ビーズに固定化された記録タグとのコーディングタグのアニーリング前に、コーディングタグ配列の一部分に相補的なブロッキングオリゴ(DupCT_A’BCおよびDupCT_AB’BC)を(一本鎖Sp’配列を残して)、コーディングタグに前以てアニーリングした。鎖置換ポリメラーゼは、ポリメラーゼ伸長中にブロッキングオリゴを除去する。バーコード凡例(挿入図)は、記録タグおよびコーディングタグの機能性バーコードへの15merバーコードの割り当てを示す。図36Bでの、記録タグバーコード設計およびコーディングタグエンコーダーバーコード設計は、記録タグとコーディングタグ間の「分子内」対「分子間」相互作用の容易なゲル解析を提供する。この設計では、望ましくない「分子間」相互作用(A記録タグとB’コーディングタグとの、およびB記録タグとA’コーディングタグとの)が、所望の「分子内」(A記録タグとA’コーディングタグとの;B記録タグとB’コーディングタグとの)相互作用産物よりも15塩基長いかまたは短い、どちらか(wither)である、ゲル産物を生成する。プライマー伸長ステップは、A’およびB’コーディングタグバーコード(ctA’_BC、ctB’_BC)をリバース相補的バーコード(reversecomplement barcode)(ctA_BCおよびctB_BC)に変更する。図36Cでは、プライマー伸長アッセイは、コーディングタグから記録タグへの情報移行、およびPCR解析のためのアニーリングされたEndCapオリゴに対するプライマー伸長によるアダプター配列の付加を実証した。図36Dは、ダミーT20オリゴを使用する記録タグの表面密度のタイトレーションによる「分子内」情報移行の最適化を示す。ビオチン化記録タグオリゴを、1:0から、1:10、下は1:10000に至るまでの様々な比で、ビオチン化ダミーT20オリゴと混合した。低下した記録タグ密度(1:10および1:10)では、「分子内」相互作用が、「分子間」相互作用よりも優勢である。図36Eには、DNAモデル系の単純な伸長として、Nano-Tag15ペプチド-ストレプトアビジン結合対を含む単純なタンパク質結合系が示されている(K 約4nM)(Perbandtet al., 2007, Proteins 67:1147-1153)が、任意の数のペプチド-結合性物質モデル系を用いることができる。Nano-Tag15ペプチド配列は、(fM)DVEAWLGARVPLVET(配列番号131)(fM=ホルミル-Met)である。Nano-Tag15ペプチドは、DNA記録タグにカップリングするための短い柔軟性リンカーペプチド(GGGGS)およびシステイン残基をさらに含む。他の例示的なペプチドタグ-同種結合性物質対としては、カルモジュリン結合ペプチド(CBP)-カルモジュリン(K 約2pM)(Mukherjeeet al., 2015, J. Mol. Biol. 427: 2707-2725)、アミロイドベータ(Aβ16~27)ペプチド-US7/Lcn2アンチカリン(0.2nM)(Rauthet al., 2016, Biochem. J. 473: 1563-1578)、PAタグ/NZ-1抗体(K 約400pM)、FLAG-M2 Ab(28nM)、HA-4B2 Ab(1.6nM)、およびMyc-9E10 Ab(2.2nM)(Fujiiet al., 2014, Protein Expr. Purif. 95:240-247)が挙げられる。プライマー伸長による結合性物質のコーディングタグから記録タグへの分子内情報移行の試験として、相補的DNA配列「A」に結合するオリゴヌクレオチド「結合性物質」を、試験および開発に使用することができる。このハイブリダイゼーション事象は、本質的にfM親和性よりも大きい親和性を有する。ストレプトアビジンを、Nano-tag15ペプチドエピトープの試験結合性物質として使用することができる。ペプチドタグ-結合性物質相互作用は、高親和性であるが、酸性および/または高塩濃度の洗浄液を用いてこの相互作用を容易に妨げることができる(Perbandtet al.、上掲)。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図37A~Bは、ポリペプチドのUMI標識NまたはC末端からDNAタグ標識体に情報を移行させるための、ナノ-またはマイクロ-エマルジョンPCRの使用の例を示す。図37Aでは、ポリペプチドのN末端またはC末端を、一意の分子識別子(UMI)を含む核酸分子で標識する。このUMIは、後続のPCRをプライミングするために使用される配列と隣接していることもある。次いで、ポリペプチドの内部部位を、UMIに隣接するプライミング配列に相補的な配列を含む別々のDNAタグで「本体標識」する。図37Bでは、得られた標識ポリペプチドを乳化し、エマルジョンPCR(ePCR)(あるいは、エマルジョンin vitro転写-RT-PCR(IVT-RT-PCR)反応または他の好適な増幅反応を実施することができる)を実施して、N末端UMIまたはC末端UMIを増幅する。マイクロエマルジョンまたはナノエマルジョンは、平均液滴直径が50~1000nmであるように、かつ1液滴当たり平均で1つ未満のポリペプチドが存在するように、形成される。PCR前およびPCR後の液滴内容物のスナップショットが、左パネルおよび右パネルにそれぞれ示されている。UMIアンプリコンを、相補的プライミング配列を介して内部ポリペプチド本体DNAタグとハイブリダイズさせ、UMI情報をプライマー伸長によってアンプリコンから内部ポリペプチド本体DNAタグに移行させる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図38は、単一細胞プロテオミクスの例を示す。細胞を、ポリマー形成サブユニット(例えば、アクリルアミド)を含有する液滴に封入し、溶解する。ポリマー形成サブユニットを重合し(例えば、ポリアクリルアミド)、タンパク質をポリマーマトリックスに架橋する。エマルジョン液滴を破壊し、透過性ポリマーマトリックスに付着した単一細胞タンパク質ライセートを含有する重合ゲルビーズを放出させる。タンパク質を、それらのネイティブなコンフォメーションで、または溶解および封入緩衝液中に尿素などの変性剤を含めることにより変性状態で、どちらかで、ポリマーマトリックスに架橋する。コンパートメントバーコードおよび他の記録タグ成分(例えば、ユニバーサルプライミング配列(P1)、スペーサー配列(Sp)、必要に応じた一意の分子識別子(UMI))を含む記録タグを、バーコード付きビーズとの乳化、またはコンビナトリアルインデックス化を含む、当技術分野で公知のおよび本明細書に開示の多数の方法を使用して、タンパク質に付着させる。単一細胞タンパク質を含有する重合ゲルビーズを、記録タグの付加後にプロテイナーゼ消化に供して、ペプチド配列決定に好適な記録タグ標識ペプチドを生成することもできる。ある特定の実施形態では、ポリマーマトリックスを、トリス(2-カルボキシエチル)ホスフィン(TCEP)またはジチオトレイトール(DTT)などの還元剤に曝露されると破壊するジスルフィド架橋ポリマーなどの適切な添加剤に溶解するように、設計することができる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図39A~Eは、二機能性N末端アミノ酸(NTAA)修飾因子およびキメラ切断試薬を使用する、アミノ酸切断反応の増強の例を示す。(A)および(B)固相基材に付着しているペプチドを、ビオチン-フェニルイソチオシアネート(PITC)などの二機能性NTAA修飾因子で修飾する。(C)低親和性エドマナーゼ(>μM Kd)を、ストレプトアビジン-エドマナーゼキメラタンパク質を使用してビオチン-PITC標識NTAAに動員する。(D)エドマナーゼ切断の効率は、ビオチン-ストレプトアビジン(strepavidin)相互作用の結果として有効局所濃度が増加するため、大幅に向上する。(E)切断されたビオチン-PITC標識NTAAおよび付随するストレプトアビジン-エドマナーゼキメラタンパク質は、切断後に遠方に拡散する。多数の他のバイオコンジュゲーション動員戦略を用いることもできる。アジド修飾PITCは、市販されており(4-アジドフェニルイソチオシアネート、Sigma)、アルキン-ビオチンとのクリック化学反応によって、ビオチン-PITCなどのPITCの他のバイオコンジュゲートへのアジド-PITCの多数の単純な変換を可能にする。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図40A~Iは、タンパク質ライセート(ゲルビーズに封入されていることもある)からのC末端記録タグ標識ペプチドの生成の例を示す。(A)変性ポリペプチドを酸無水物と反応させて、リシン残基を標識する。一実施形態では、アルキン(mTet)置換シトラコン酸無水物+プロピオン酸無水物のミックスを使用して、リシンをmTet(縞模様の長方形として示されている)で標識する。(B)その結果、リシンの何分の一かがプロピオン基(ポリペプチド鎖上に正方形として示されている)でブロッキングされている、アルキン(mTet)標識ポリペプチドとなる。アルキン(mTet)部分は、クリック化学に基づくDNA標識に有用である。(C)DNAタグ(黒抜き長方形として示されている)を、アルキンまたはmTet部分に対してそれぞれアジドまたはtrans-シクロオクテン(TCO)標識を使用してクリック化学により付着させる。(D)バーコードならびに機能的エレメント、例えばスペーサー(Sp)配列およびユニバーサルプライミング配列を、図31に示されているようなプライマー伸長ステップを使用してDNAタグに追加して、記録タグ標識ポリペプチドを生成する。バーコードは、試料バーコード、分配バーコード、コンパートメントバーコード、空間位置バーコードなど、またはそれらの任意の組合せであり得る。(E)得られた記録タグ標識ポリペプチドを、プロテアーゼでまたは化学的に記録タグ標識ペプチドに断片化する。(F)説明のために、2つの記録タグで標識されたペプチド断片が示されている。(G)記録タグのユニバーサルプライミング配列に相補的であるユニバーサルプライミング配列を含むDNAタグを、ペプチドのC末端にライゲーションする。C末端DNAタグは、ペプチドを表面にコンジュゲートするための部分も含む。(H)C末端DNAタグの相補的ユニバーサルプライミング配列と確率的に選択された記録タグとがアニーリングする。分子内プライマー伸長反応を使用して、記録タグからC末端DNAタグに情報を移行させる。(I)ペプチド上の内部記録タグを、無水マレイン酸を介してリシン残基にカップリングする。このカップリングは酸性pHで可逆的である。内部記録タグは、酸性pHでペプチドのリシン残基から切断され、その結果、C末端記録タグが残る。新たに露出したリシン残基を、プロピオン酸無水物などの非加水分解性無水物で、必要に応じて、ブロッキングすることができる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。 図40A~Iは、タンパク質ライセート(ゲルビーズに封入されていることもある)からのC末端記録タグ標識ペプチドの生成の例を示す。(A)変性ポリペプチドを酸無水物と反応させて、リシン残基を標識する。一実施形態では、アルキン(mTet)置換シトラコン酸無水物+プロピオン酸無水物のミックスを使用して、リシンをmTet(縞模様の長方形として示されている)で標識する。(B)その結果、リシンの何分の一かがプロピオン基(ポリペプチド鎖上に正方形として示されている)でブロッキングされている、アルキン(mTet)標識ポリペプチドとなる。アルキン(mTet)部分は、クリック化学に基づくDNA標識に有用である。(C)DNAタグ(黒抜き長方形として示されている)を、アルキンまたはmTet部分に対してそれぞれアジドまたはtrans-シクロオクテン(TCO)標識を使用してクリック化学により付着させる。(D)バーコードならびに機能的エレメント、例えばスペーサー(Sp)配列およびユニバーサルプライミング配列を、図31に示されているようなプライマー伸長ステップを使用してDNAタグに追加して、記録タグ標識ポリペプチドを生成する。バーコードは、試料バーコード、分配バーコード、コンパートメントバーコード、空間位置バーコードなど、またはそれらの任意の組合せであり得る。(E)得られた記録タグ標識ポリペプチドを、プロテアーゼでまたは化学的に記録タグ標識ペプチドに断片化する。(F)説明のために、2つの記録タグで標識されたペプチド断片が示されている。(G)記録タグのユニバーサルプライミング配列に相補的であるユニバーサルプライミング配列を含むDNAタグを、ペプチドのC末端にライゲーションする。C末端DNAタグは、ペプチドを表面にコンジュゲートするための部分も含む。(H)C末端DNAタグの相補的ユニバーサルプライミング配列と確率的に選択された記録タグとがアニーリングする。分子内プライマー伸長反応を使用して、記録タグからC末端DNAタグに情報を移行させる。(I)ペプチド上の内部記録タグを、無水マレイン酸を介してリシン残基にカップリングする。このカップリングは酸性pHで可逆的である。内部記録タグは、酸性pHでペプチドのリシン残基から切断され、その結果、C末端記録タグが残る。新たに露出したリシン残基を、プロピオン酸無水物などの非加水分解性無水物で、必要に応じて、ブロッキングすることができる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図41は、NGPSアッセイの実施形態の例示的なワークフローを示す。
図42A~Dは、NGPSシーケンシングアッセイの例示的なステップを示す。記録タグで標識された、表面に結合されているペプチドに関するN末端アミノ酸(NTAA)アセチル化またはアミジン化ステップは、NTAA結合性物質が、アセチル化NTAAに結合するように操作されているのか、またはネイティブなNTAAに結合するように操作されているのかに依存して、NTAA結合性物質による結合の前または後で行うことができる。第1の場合には、(A)最初に、無水酢酸を使用する化学的手段によって、またはN末端アセチルトランスフェラーゼ(NAT)を用いて酵素的に、ペプチドのNTAAをアセチル化する。(B)NTAAは、NTAA結合性物質、例えば、操作されたアンチカリン、アミノアシルtRNAシンテターゼ(aaRS)、ClpSなどにより、認識される。DNAコーディングタグは、結合性物質に付着しており、特定のNTAA結合性物質を識別するバーコードエンコーダー配列を含む。(C)アセチル化NTAAにNTAA結合性物質が結合した後、DNAコーディングタグは、相補配列を介して記録タグと一時的にアニーリングし、コーディングタグ情報がポリメラーゼ伸長によって記録タグに移行される。代替的な実施形態では、記録タグ情報は、ポリメラーゼ伸長によってコーディングタグに移行される。(D)アセチル化NTAAは、アセチル化ペプチドの末端アセチル化アミノ酸の加水分解を触媒する操作されたアシルペプチドヒドロラーゼ(APH)により、ペプチドから切断される。アセチル化NTAAの切断後、このサイクルは、新たに露出したNTAAのアセチル化で開始して自発的に繰り返される。N末端アセチル化がNTAA修飾/切断の例示的な方法として使用されているが、グアニル部分などの他のN末端部分を、その代わりに使用することができ、それに付随して切断の化学的性質が変わる。グアニジニル化を用いる場合、0.5~2%NaOH溶液を使用して穏やかな条件下でグアニル化NTAAを切断することができる(その全体が参照により組み込まれる、Hamada, 2016を参照されたい)。APHは、ブロッキングされたペプチドのNα-アセチル化アミノ酸の除去を触媒することができるセリンペプチダーゼであり、プロリルオリゴペプチダーゼ(POP)ファミリー(Clan SC、ファミリーS9)に属する。APHは、真核生物細胞、細菌細胞および古細菌細胞のN-末端アセチル化タンパク質の重要な調節因子である。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図43A~Bは、例示的な記録タグ-コーディングタグ設計特徴を示す。(A)例示的な記録タグ付随タンパク質(またはペプチド)のおよび付随するコーディングタグを有する結合されている結合性物質(例えば、アンチカリン)の構造。プライマー伸長反応での確率的な非鋳型3’末端アデノシン(A)付加に適応するために、チミジン(T)塩基がコーディングタグのスペーサー(Sp’)とバーコード(BC’)配列との間に挿入されている。(B)DNAコーディングタグは、SpyCatcher-SpyTagタンパク質-ペプチド相互作用によって結合性物質(例えば、アンチカリン)に付着している。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図44A~Eは、記録タグと切断剤のハイブリダイゼーションを使用するNTAA切断反応の増強の例を示す。図44A~Bでは、固相基材(例えば、ビーズ)に付着している記録タグ標識ペプチドのNTAAを、例えば、PITC、DNP、SNP、アセチル修飾因子、グアニジニル化などで、修飾または標識する(Mod)。図44Cでは、切断酵素(例えば、アシルペプチドヒドロラーゼ(APH)、アミノペプチダーゼ(AP)、エドマナーゼなど)を、記録タグのユニバーサルプライミング配列に相補的なユニバーサルプライミング配列を含むDNAタグに付着させる。切断酵素は、切断酵素のDNAタグおよび記録タグの相補的ユニバーサルプライミング配列のハイブリダイゼーションによって修飾NTAAに動員される。図44Dでは、ハイブリダイゼーションステップは、NTAAに対する切断酵素の有効親和性を大幅に向上させる。図44Eでは、切断されたNTAAは遠方に拡散し、付随する切断酵素は、ハイブリダイズされたDNAタグの剥離によって除去することができる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図45は、ペプチドリガーゼ+プロテアーゼ+ジアミノペプチダーゼを使用する、例示的なサイクル分解ペプチド配列決定を示す。ブテラーゼIは、TEV-ブテラーゼIペプチド基質(TENLYFQNHV、配列番号132)をクエリペプチドのNTAAにライゲーションする。ブテラーゼは、ペプチド基質のC末端にNHVモチーフを必要とする。ライゲーション後、タバコエッチウイルス(TEV)プロテアーゼを使用してグルタミン(Q)残基の後でキメラペプチド基質を切断し、その結果、クエリペプチドのN末端にアスパラギン(N)残基が付着したキメラペプチドが得られる。2つのアミノ酸残基をN末端から切断するジアミノペプチダーゼ(DAP)またはジペプチジルペプチダーゼは、Nに付加されたクエリペプチドを、クエリペプチドのそのアスパラギン残基(N)および元々のNTAAの効果的な除去により、アミノ酸2個分短縮する。新たに露出したNTAAを、本明細書で提示されるような結合性物質を使用して読み取り、次いで、サイクル全体を「n」回繰り返して、「n」個のアミノ酸を配列決定する。ストレプトアビジン-DAP金属酵素キメラタンパク質を使用することおよびビオチン部分をN末端アスパラギン残基に係留することにより、DAP処理能力の制御を可能にすることができる。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図46A~Cは、一本鎖DNA記録タグへの一本鎖DNAコーディングタグのライゲーションによる例示的な「無スペーサー」コーディングタグ移行を示す。一本鎖DNAコーディングタグを、記録タグにそのコーディングタグをライゲーションすることによって直接移行させて、伸長記録タグを生成する。(A)一本鎖DNAライゲーションによるDNAに基づくモデル系の概観。コーディングタグとコンジュゲートされている標的化物質B’配列を、記録タグにおけるB DNA標的を検出するために設計した。ssDNA記録タグ、saRT_Bbca_ssLigは、5’リン酸化および3’ビオチン化されており、6塩基DNAバーコードBCa、ユニバーサルフォワードプライマー配列、および標的DNA B配列で構成される。コーディングタグ、CT_B’bcb_ssLigは、ユニバーサルリバースプライマー配列、ウラシル塩基、および一意の6塩基エンコーダーバーコードBCbを含有する。コーディングタグは、ポリエチレングリコールリンカーを介してB’DNA配列に共有結合により連結されている。コーディングタグに付着しているB’配列の記録タグに付着しているB配列とのハイブリダイゼーションは、記録タグの5’リン酸基とコーディングタグの3’ヒドロキシル基を固体表面で極めて近接させ、その結果、CircLigase IIなどのリガーゼとの一本鎖DNAのライゲーションによって情報移行が生じる。(B)一本鎖DNAライゲーションを確認するためのゲル解析。一本鎖DNAライゲーションアッセイは、コーディングタグから記録タグへの結合情報移行を実証した。47塩基記録タグと49塩基コーディングタグのライゲーション産物のサイズは、96塩基である。同種saRT_Bbca_ssLig記録タグの存在下でライゲーション産物バンドが観察されたが、非同種saRT_Abcb_ssLig記録タグの存在下で産物バンドが観察されなかったということから、特異性が実証される。(C)コーディングタグの複数サイクル情報移行。第1のサイクルのライゲーション産物をUSER酵素で処理して、第2の情報移行サイクルで使用するための遊離5’リン酸化末端を生成した。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。 図46A~Cは、一本鎖DNA記録タグへの一本鎖DNAコーディングタグのライゲーションによる例示的な「無スペーサー」コーディングタグ移行を示す。一本鎖DNAコーディングタグを、記録タグにそのコーディングタグをライゲーションすることによって直接移行させて、伸長記録タグを生成する。(A)一本鎖DNAライゲーションによるDNAに基づくモデル系の概観。コーディングタグとコンジュゲートされている標的化物質B’配列を、記録タグにおけるB DNA標的を検出するために設計した。ssDNA記録タグ、saRT_Bbca_ssLigは、5’リン酸化および3’ビオチン化されており、6塩基DNAバーコードBCa、ユニバーサルフォワードプライマー配列、および標的DNA B配列で構成される。コーディングタグ、CT_B’bcb_ssLigは、ユニバーサルリバースプライマー配列、ウラシル塩基、および一意の6塩基エンコーダーバーコードBCbを含有する。コーディングタグは、ポリエチレングリコールリンカーを介してB’DNA配列に共有結合により連結されている。コーディングタグに付着しているB’配列の記録タグに付着しているB配列とのハイブリダイゼーションは、記録タグの5’リン酸基とコーディングタグの3’ヒドロキシル基を固体表面で極めて近接させ、その結果、CircLigase IIなどのリガーゼとの一本鎖DNAのライゲーションによって情報移行が生じる。(B)一本鎖DNAライゲーションを確認するためのゲル解析。一本鎖DNAライゲーションアッセイは、コーディングタグから記録タグへの結合情報移行を実証した。47塩基記録タグと49塩基コーディングタグのライゲーション産物のサイズは、96塩基である。同種saRT_Bbca_ssLig記録タグの存在下でライゲーション産物バンドが観察されたが、非同種saRT_Abcb_ssLig記録タグの存在下で産物バンドが観察されなかったということから、特異性が実証される。(C)コーディングタグの複数サイクル情報移行。第1のサイクルのライゲーション産物をUSER酵素で処理して、第2の情報移行サイクルで使用するための遊離5’リン酸化末端を生成した。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図47A~Bは、二本鎖DNA記録タグへの二本鎖DNAコーディングタグのライゲーションによる例示的なコーディングタグ移行を示す。二本鎖DNAライゲーションによるコーディングタグの複数の情報移行を、DNAに基づくモデル系により実証した。(A)二本鎖DNAライゲーションによるDNAに基づくモデル系の概観。コーディングタグとコンジュゲートされている標的化物質A’配列を、記録タグにおける標的結合性物質Aを検出するために調製した。記録タグとコーディングタグの両方は、4塩基突出を有する2本の鎖で構成されている。コーディングタグの標的化物質A’を固体表面に固定化された記録タグの標的結合性物質Aにハイブリダイズすると、両方のタグの近接突出末端がハイブリダイズし、その結果、T4 DNAリガーゼなどのリガーゼによる二本鎖DNAライゲーションによって情報移行が生じる。(B)二本鎖DNAライゲーションを確認するためのゲル解析。二本鎖DNAライゲーションアッセイは、コーディングタグから記録タグへのA/A’結合情報移行を実証した。76および54塩基記録タグと二本鎖コーディングタグのライゲーション産物のサイズは、それぞれ、116および111塩基である。第1のサイクルのライゲーション産物をUSER酵素(NEB)により消化し、第2のサイクルのアッセイに使用した。第2のサイクルのライゲーション産物バンドは、およそ150塩基で観察された。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。 図47A~Bは、二本鎖DNA記録タグへの二本鎖DNAコーディングタグのライゲーションによる例示的なコーディングタグ移行を示す。二本鎖DNAライゲーションによるコーディングタグの複数の情報移行を、DNAに基づくモデル系により実証した。(A)二本鎖DNAライゲーションによるDNAに基づくモデル系の概観。コーディングタグとコンジュゲートされている標的化物質A’配列を、記録タグにおける標的結合性物質Aを検出するために調製した。記録タグとコーディングタグの両方は、4塩基突出を有する2本の鎖で構成されている。コーディングタグの標的化物質A’を固体表面に固定化された記録タグの標的結合性物質Aにハイブリダイズすると、両方のタグの近接突出末端がハイブリダイズし、その結果、T4 DNAリガーゼなどのリガーゼによる二本鎖DNAライゲーションによって情報移行が生じる。(B)二本鎖DNAライゲーションを確認するためのゲル解析。二本鎖DNAライゲーションアッセイは、コーディングタグから記録タグへのA/A’結合情報移行を実証した。76および54塩基記録タグと二本鎖コーディングタグのライゲーション産物のサイズは、それぞれ、116および111塩基である。第1のサイクルのライゲーション産物をUSER酵素(NEB)により消化し、第2のサイクルのアッセイに使用した。第2のサイクルのライゲーション産物バンドは、およそ150塩基で観察された。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図48A~Eは、複数のサイクルを用いるコーディングタグから記録タグへの情報移行を実証するための、例示的なペプチドに基づくおよびDNAに基づくモデル系を示す。複数の情報移行が、逐次的ペプチドおよびDNAモデル系により実証された。(A)ペプチドに基づくモデル系における第1のサイクルの概観。コーディングタグとコンジュゲートされている標的化物質抗PA抗体を、第1のサイクルの情報移行で記録タグのPA-ペプチドタグを検出するために調製した。加えて、Nanotagペプチドまたはアミロイドベータ(Aβ)ペプチドを使用して、ペプチド-記録タグ複合体陰性対照も生成した。A配列標的物質と、ポリ-dTと、ユニバーサルフォワードプライマー配列と、一意のDNAバーコードBC1およびBC2と、8塩基共通スペーサー配列(Sp)とを含有するamRT_Abcである記録タグを、5’末端のアミン基および内部のアルキン基によってペプチドおよび固体支持体にそれぞれ共有結合により付着させる。8塩基共通スペーサー配列(Sp’)と隣接している一意のエンコーダーバーコードBC5’を含有するamCT_bc5であるコーディングタグの5’末端および3’末端を抗体およびC3リンカーにそれぞれ共有結合により連結させる。抗PA抗体がPA-タグペプチド-記録タグ(RT)複合体に結合すると、ポリメラーゼ伸長によってコーディングタグから記録タグへの情報移行が果たされる。(B)DNAに基づくモデルアッセイにおける第2のサイクルの概観。コーディングタグに連結されている標的化物質A’配列を、記録タグにおけるA配列標的物質を検出するために調製した。8塩基共通スペーサー配列(Sp’)と、一意のエンコーダーバーコードBC13’と、ユニバーサルリバースプライマー配列とを含有するCT_A’_bc13である、コーディングタグ。A’配列がA配列とハイブリダイズするとポリメラーゼ伸長によりコーディングタグから記録タグへの情報移行が果たされる。(C)PCR解析のための記録タグ増幅。固定化記録タグを、P1_F2およびSp/BC2プライマーセットを使用して18サイクルPCRにより増幅した。記録タグ密度依存性PCR産物がおよそ56bpで観察された。(D)第1のサイクルの伸長アッセイを確認するためのPCR解析。第1のサイクルの伸長記録タグを、P1_F2およびSp/BC5プライマーセットを使用して21サイクルのPCRにより増幅した。第1のサイクルの伸長産物からのPCR産物の強いバンドが、複合体の異なる密度タイトレーション全体にわたってPA-ペプチドRT複合体についておよそ80bpで観察された。小さいバックグラウンドバンドが、NanoおよびAβペプチド複合体についても最高複合体密度で観察され、これは、表面上、非特異的結合に起因する。(E)第2のサイクルの伸長アッセイを確認するためのPCR解析。第2の伸長記録タグを、P1_F2およびP2_R1プライマーセットを使用して21サイクルのPCRにより増幅した。PCR産物の相対的に強いバンドが、すべてのペプチド固定化ビーズについて117塩基対で観察された。これらは、元の記録タグ(BC1+BC2+BC13)に関する第2のサイクルの伸長産物のみに対応する。第1のサイクルの伸長記録タグ(BC1+BC2+BC5+BC13)に関する第2のサイクルの伸長産物に対応するバンドが、PA-タグ固定化ビーズをアッセイに使用したときにのみ93塩基対で観察された。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。 図48A~Eは、複数のサイクルを用いるコーディングタグから記録タグへの情報移行を実証するための、例示的なペプチドに基づくおよびDNAに基づくモデル系を示す。複数の情報移行が、逐次的ペプチドおよびDNAモデル系により実証された。(A)ペプチドに基づくモデル系における第1のサイクルの概観。コーディングタグとコンジュゲートされている標的化物質抗PA抗体を、第1のサイクルの情報移行で記録タグのPA-ペプチドタグを検出するために調製した。加えて、Nanotagペプチドまたはアミロイドベータ(Aβ)ペプチドを使用して、ペプチド-記録タグ複合体陰性対照も生成した。A配列標的物質と、ポリ-dTと、ユニバーサルフォワードプライマー配列と、一意のDNAバーコードBC1およびBC2と、8塩基共通スペーサー配列(Sp)とを含有するamRT_Abcである記録タグを、5’末端のアミン基および内部のアルキン基によってペプチドおよび固体支持体にそれぞれ共有結合により付着させる。8塩基共通スペーサー配列(Sp’)と隣接している一意のエンコーダーバーコードBC5’を含有するamCT_bc5であるコーディングタグの5’末端および3’末端を抗体およびC3リンカーにそれぞれ共有結合により連結させる。抗PA抗体がPA-タグペプチド-記録タグ(RT)複合体に結合すると、ポリメラーゼ伸長によってコーディングタグから記録タグへの情報移行が果たされる。(B)DNAに基づくモデルアッセイにおける第2のサイクルの概観。コーディングタグに連結されている標的化物質A’配列を、記録タグにおけるA配列標的物質を検出するために調製した。8塩基共通スペーサー配列(Sp’)と、一意のエンコーダーバーコードBC13’と、ユニバーサルリバースプライマー配列とを含有するCT_A’_bc13である、コーディングタグ。A’配列がA配列とハイブリダイズするとポリメラーゼ伸長によりコーディングタグから記録タグへの情報移行が果たされる。(C)PCR解析のための記録タグ増幅。固定化記録タグを、P1_F2およびSp/BC2プライマーセットを使用して18サイクルPCRにより増幅した。記録タグ密度依存性PCR産物がおよそ56bpで観察された。(D)第1のサイクルの伸長アッセイを確認するためのPCR解析。第1のサイクルの伸長記録タグを、P1_F2およびSp/BC5プライマーセットを使用して21サイクルのPCRにより増幅した。第1のサイクルの伸長産物からのPCR産物の強いバンドが、複合体の異なる密度タイトレーション全体にわたってPA-ペプチドRT複合体についておよそ80bpで観察された。小さいバックグラウンドバンドが、NanoおよびAβペプチド複合体についても最高複合体密度で観察され、これは、表面上、非特異的結合に起因する。(E)第2のサイクルの伸長アッセイを確認するためのPCR解析。第2の伸長記録タグを、P1_F2およびP2_R1プライマーセットを使用して21サイクルのPCRにより増幅した。PCR産物の相対的に強いバンドが、すべてのペプチド固定化ビーズについて117塩基対で観察された。これらは、元の記録タグ(BC1+BC2+BC13)に関する第2のサイクルの伸長産物のみに対応する。第1のサイクルの伸長記録タグ(BC1+BC2+BC5+BC13)に関する第2のサイクルの伸長産物に対応するバンドが、PA-タグ固定化ビーズをアッセイに使用したときにのみ93塩基対で観察された。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。 図48A~Eは、複数のサイクルを用いるコーディングタグから記録タグへの情報移行を実証するための、例示的なペプチドに基づくおよびDNAに基づくモデル系を示す。複数の情報移行が、逐次的ペプチドおよびDNAモデル系により実証された。(A)ペプチドに基づくモデル系における第1のサイクルの概観。コーディングタグとコンジュゲートされている標的化物質抗PA抗体を、第1のサイクルの情報移行で記録タグのPA-ペプチドタグを検出するために調製した。加えて、Nanotagペプチドまたはアミロイドベータ(Aβ)ペプチドを使用して、ペプチド-記録タグ複合体陰性対照も生成した。A配列標的物質と、ポリ-dTと、ユニバーサルフォワードプライマー配列と、一意のDNAバーコードBC1およびBC2と、8塩基共通スペーサー配列(Sp)とを含有するamRT_Abcである記録タグを、5’末端のアミン基および内部のアルキン基によってペプチドおよび固体支持体にそれぞれ共有結合により付着させる。8塩基共通スペーサー配列(Sp’)と隣接している一意のエンコーダーバーコードBC5’を含有するamCT_bc5であるコーディングタグの5’末端および3’末端を抗体およびC3リンカーにそれぞれ共有結合により連結させる。抗PA抗体がPA-タグペプチド-記録タグ(RT)複合体に結合すると、ポリメラーゼ伸長によってコーディングタグから記録タグへの情報移行が果たされる。(B)DNAに基づくモデルアッセイにおける第2のサイクルの概観。コーディングタグに連結されている標的化物質A’配列を、記録タグにおけるA配列標的物質を検出するために調製した。8塩基共通スペーサー配列(Sp’)と、一意のエンコーダーバーコードBC13’と、ユニバーサルリバースプライマー配列とを含有するCT_A’_bc13である、コーディングタグ。A’配列がA配列とハイブリダイズするとポリメラーゼ伸長によりコーディングタグから記録タグへの情報移行が果たされる。(C)PCR解析のための記録タグ増幅。固定化記録タグを、P1_F2およびSp/BC2プライマーセットを使用して18サイクルPCRにより増幅した。記録タグ密度依存性PCR産物がおよそ56bpで観察された。(D)第1のサイクルの伸長アッセイを確認するためのPCR解析。第1のサイクルの伸長記録タグを、P1_F2およびSp/BC5プライマーセットを使用して21サイクルのPCRにより増幅した。第1のサイクルの伸長産物からのPCR産物の強いバンドが、複合体の異なる密度タイトレーション全体にわたってPA-ペプチドRT複合体についておよそ80bpで観察された。小さいバックグラウンドバンドが、NanoおよびAβペプチド複合体についても最高複合体密度で観察され、これは、表面上、非特異的結合に起因する。(E)第2のサイクルの伸長アッセイを確認するためのPCR解析。第2の伸長記録タグを、P1_F2およびP2_R1プライマーセットを使用して21サイクルのPCRにより増幅した。PCR産物の相対的に強いバンドが、すべてのペプチド固定化ビーズについて117塩基対で観察された。これらは、元の記録タグ(BC1+BC2+BC13)に関する第2のサイクルの伸長産物のみに対応する。第1のサイクルの伸長記録タグ(BC1+BC2+BC5+BC13)に関する第2のサイクルの伸長産物に対応するバンドが、PA-タグ固定化ビーズをアッセイに使用したときにのみ93塩基対で観察された。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図49A~Bは、シーケンシングリード、例えば、単一分子手法を使用して得たもの、のプロテオフォームの重要性およびロバストなマッピング可能性を説明するための例として、p53タンパク質配列決定を使用する。図49Aの左パネルは、インタクトなプロテオフォームを断片に消化することができることを示し、これらの断片の各々は、1つもしくは複数のメチル化アミノ酸を含むこともあり、1つもしくは複数のリン酸化アミノ酸を含むこともあり、または翻訳後修飾を含まないこともある。翻訳後修飾情報をシーケンシングリードと一緒に分析することができる。右パネルは、タンパク質に沿って様々な翻訳後修飾を示す。図49Bは、分配を使用するリードのマッピングを示し、例えば、全ヒトプロテオームに対してBLASTを実行した後、リード「CPXQXWXDXT」(配列番号170、ここで、X=任意のアミノ酸)は、一意にp53(CPVQLWVDST配列、配列番号169における)位置にマッピングして戻る。シーケンシングリードは、長い必要はない-例えば、約10~15アミノ酸配列によって、プロテオーム内のタンパク質を識別するのに十分な情報を得ることができる。シーケンシングリードは、オーバーラップすることがあり、オーバーラップ配列における配列情報の重複性を使用して、全ポリペプチド配列を推定および/または検証することができる。 図49A~Bは、シーケンシングリード、例えば、単一分子手法を使用して得たもの、のプロテオフォームの重要性およびロバストなマッピング可能性を説明するための例として、p53タンパク質配列決定を使用する。図49Aの左パネルは、インタクトなプロテオフォームを断片に消化することができることを示し、これらの断片の各々は、1つもしくは複数のメチル化アミノ酸を含むこともあり、1つもしくは複数のリン酸化アミノ酸を含むこともあり、または翻訳後修飾を含まないこともある。翻訳後修飾情報をシーケンシングリードと一緒に分析することができる。右パネルは、タンパク質に沿って様々な翻訳後修飾を示す。図49Bは、分配を使用するリードのマッピングを示し、例えば、全ヒトプロテオームに対してBLASTを実行した後、リード「CPXQXWXDXT」(配列番号170、ここで、X=任意のアミノ酸)は、一意にp53(CPVQLWVDST配列、配列番号169における)位置にマッピングして戻る。シーケンシングリードは、長い必要はない-例えば、約10~15アミノ酸配列によって、プロテオーム内のタンパク質を識別するのに十分な情報を得ることができる。シーケンシングリードは、オーバーラップすることがあり、オーバーラップ配列における配列情報の重複性を使用して、全ポリペプチド配列を推定および/または検証することができる。
図50A~Cは、mRNAディスプレイを使用するDNA記録タグでのタンパク質またはペプチドの標識を示す。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図51A~Eは、バーコード標識ペプチドを分配するためのN末端ジペプチド結合による単一サイクルタンパク質識別を示す。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図52A~Eは、ペプチドに固定化された分配バーコード付きビーズに対するN末端ジペプチド結合物質による単一サイクルタンパク質識別を示す。この図で示される例のいずれにおいても、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグもしくは分配タグ)、またはそれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。
図53A~Bは、異なる細菌種にわたってのClpSホモログ/バリアント、ならびに本開示での使用のための例示的なClpSタンパク質、例えば、受託番号4YJM、A.tumefaciens:MSDSPVDLKPKPKVKPKLERPKLYKVMLLNDDYTPREFVTVVLKAVFRMSEDTGRRVMMTAHRFGSAVVVVCERDIAETKAKEATDLGKEAGFPLMFTTEPEE(配列番号198)からのClpS2;受託番号2W9R、E.coli:MGKTNDWLDFDQLAEEKVRDALKPPSMYKVILVNDDYTPMEFVIDVLQKFFSYDVERATQLMLAVHYQGKAICGVFTAEVAETKVAMVNKYARENEHPLLCTLEKAGA(配列番号199)からのClpS;および受託番号3DNJ、C.crescentus:TQKPSLYRVLILNDDYTPMEFVVYVLERFFNKSREDATRIMLHVHQNGVGVCGVYTYEVAETKVAQVIDSARRHQHPLQCTMEKD(配列番号200)からのClpSを示す。図53Aは、99%同一性までクラスタリングした612の異なる細菌種からのClpSアミノ酸配列についての階層的クラスタリングの樹状図を示す。図53Bは、図53Aにおける3つの種からのClpS間のアミノ酸配列同一性の表である。A.tumfaciens ClpS2は、E.coli ClpSと35%未満の配列同一性、およびC.crescentus ClpSと40%未満の配列同一性を有する。
図54は、一本鎖DNA/ポリマーキメラ記録タグへの一本鎖DNA/ポリマーキメラコーディングタグのライゲーションによるポリマーコーディングタグ移行の例を示す。一本鎖ポリマーコーディングタグを、DNAスペーサーを介して記録タグにそのコーディングタグをライゲーションすることによって直接移行させて、伸長記録タグを生成する。(A)一本鎖DNAスペーサーライゲーションによるNTAA検出系の概観。コーディングタグとコンジュゲートされているN末端アミノ酸(NTAA)結合物質を、記録タグのペプチドのNTAAを検出するために設計する。一本鎖DNA/ポリマーキメラ記録タグは、5’リン酸化されており、DNAスペーサー、ポリマーバーコード(例えば、保護されたDNA、PNA、ペプトイドなど)、ナノポアシーケンシング用ユニバーサルポリマーアダプター(例えば、コレステロール、ビオチン、テザーDNA配列など)で構成されている。スペーサーの長さは、酵素的ライゲーションを開始させるために1~6塩基であり得る。DNA/ポリマーキメラコーディングタグは、ユニバーサルポリマーアダプター、ポリマーバーコード(例えば、保護されたDNA、PNA、ペプトイドなど)、およびDNAスペーサーを含有する。コーディングタグは、ポリエチレングリコールリンカーを介してNTAA結合物質に共有結合により連結されている。コーディングタグに付着しているNTAA結合物質の記録タグに付着しているペプチドのNTAAへの結合は、記録タグの5’リン酸基とコーディングタグの3’ヒドロキシル基を固体表面で極めて近接させ、その結果、CircLigase IIとの一本鎖DNAのライゲーションによって情報移行が生じる。(B)二本鎖DNAスペーサーライゲーションによるNTAA検出系の概観。DNA/ポリマーキメラコーディングタグとコンジュゲートされているNTAA結合物質を、記録タグのペプチドのNTAAを検出するために調製する。一本鎖DNA/ポリマーキメラ記録タグは、5’リン酸化されており、DNAスペーサー、ポリマーバーコード(例えば、保護されたDNA、PNA、ペプトイドなど)、ナノポアシーケンシング用ユニバーサルポリマーアダプター(例えば、コレステロール、ビオチン、テザーDNA配列など)で構成されている。スペーサーの長さは、酵素的ライゲーションを開始させるために5~20塩基であり得る。DNA/ポリマーキメラコーディングタグは、ユニバーサルポリマーアダプター、ポリマーバーコード(例えば、保護されたDNA、PNA、ペプトイドなど)、およびDNAスペーサーを含有する。コーディングタグは、ポリエチレングリコールリンカーを介してNTAA結合物質に共有結合により連結されている。コーディングタグに付着しているNTAA結合物質の、記録タグに付着しているペプチドのNTAAへの結合は、記録タグの5’リン酸基とコーディングタグの3’ヒドロキシル基を固体表面で極めて近接させ、その結果、スプリットDNAハイブリダイゼーション、続いてのT4 DNAリガーゼとの二本鎖DNAのライゲーションによって情報移行が生じる。
図55は、単一分子電子シーケンシングの例示的な方法を示す。(A)イオン電流遮断、(B)トンネル電流、(C)NP/ナノリボンに関する面内相互コンダクタンス、(D)ナノリボンに関する面内相互コンダクタンス。電流遮断部分は、電子的読み取り方法に依存して、イオン電流を遮断することができ、またはトンネル電流を媒介することができ、または相互コンダクタンスをモジュレートすることができる(Heerema et al., 2016, Nat Nanotechnol, 11(2): 127-136)。
図56は、ナノポア/ナノギャップ解析のためのコードされたポリマー配列の例示的な設計を示す。(A)コードされたポリマーは、コードを含むコンビナトリアル電流遮断基(陰付き多角形により示されている)で構成されている。電流遮断基がナノポアを通過すると、電流遮断基はシグネチャ電流遮断シグナルを生成し、このシグナルを、多数のコンピュータおよび機械学習手法を使用してポリマーコードに関連付けることができる。「ビオチン」の丸は、結合性物質が結合することが可能な結合性部分を構成し、この結合性物質がDNAをナノポア内で「ストール」し、それによって、下流のポリマー遮断基についてのより正確な読み取りが可能になる。転位置をストールするこの特徴部がなければ、ポリマーは、ポアを速く通過し過ぎる可能性がある。示されている例では、ビオチンに、ストレプトアビジン(SA)、単量体ストレプトアビジン(mSA2)、アビジンなどが結合することが可能である。結合物質および結合条件は、結合が準安定性であり、結合物質が、結合してから数ミリ秒以内に解離することになるか、あるいは膜貫通電圧の増加に伴って除去され得るように、選択するべきである。(B)ポアを通っての転位置を「ストール」するための外因性結合性物質の代案として、ポリマーの固有の準安定性二次構造を使用して、ポリマーによるポアの通過をストールすることができる。この場合もやはり、二次構造のエネルギー論は、ストール時間がミリ秒オーダーになるように選択するべきである。(C)ナノポアを読み取る電子機器が十分高速であり、ノイズが十分に低い場合、ポアを通る転位置によってポリマーを直接読み取ることができる。
図57は、ナノポア技術を使用するポリマー読み取りの例を示す。(A)シス膜電圧に対して+100mVトランスで保持された脂質二重層膜にアルファ溶血素(aHly)ポアが挿入されている基本ナノポア構成の説明図。この膜電圧の極性が、シスからトランス側に負荷電ポリマーを転位置させる。正荷電ポリマーについては膜電圧を逆転させることができる。(B)単一遮断部分の典型遮断電流シグネチャ。(C)異なるナノポアタイプについての比較構造:生物学的ナノポアであるMspAおよびaHly、合成ナノポアであるグラフェンおよびSiN。遮断電流をあらゆるポアタイプに関して測定することができるが、ただし、ブロッキング基(陰付き多角形)の次元はポア直径のオーダーであるべきである。(Laszlo et al., 2014, Nature Biotech.,32, 829-833;Ying et al., 2014,The Analyst, 139, 3826-3835)。
図58は、結合特徴部で通過をストールすることによりポリマーによるナノポアの通過を制御する例示的な方法を示す。(A)この例での配列決定可能なポリマーは、ポリマーによるポアの通過を一過性にストールして正確な電流遮断(IB)測定を行うのに十分な時間をもたらす結合要素または固有の二次構造要素であるポリマー「キャッチ」(例えば、ビオチン(b)に結合している単量体ストレプトアビジン(mSA2))が散在している電流遮断部分(IB部分)を有するように設計されている。(B)ポアに当接している結合性物質であるmSA2は、膜電位(すなわち、180mV)のもとで最終的に解離する。理想的には、準安定性結合は、ミリ秒の時間規模で解離する。
図59A~B。3サイクル結合/エンコーディングおよびNGS読み取り。(A)3ステップの逐次的エンコーディングステップを示す。記録タグ(DNA RT)とコンジュゲートされ、磁気ビーズに固定化されたペプチドが示されている。ペプチドは、PAエピトープを含有する。3つの異なるサイクル特異的バーコード(BC4、BC5、BC13)で標識された抗PA抗体を使用して、逐次的な3サイクルのアッセイを行い、各バーコードを異なるサイクル(それぞれ第1、第2および第3のサイクル)に使用した。各サイクルの結果、それぞれのサイクルバーコードで伸長された記録タグが生じる。(B)各サイクル後の伸長記録タグのPCR産物についての解析を示すアガロースゲル。レーン1 = サイズ標準、レーン2~4は、第1、第2および第3のサイクルの産物にそれぞれ対応する。ゲルは、高収率エンコーディングを明確に示す。PCRは、KODポリメラーゼと24サイクルの増幅を用いた。(C)ゲル解析に加えて、最終「3サイクル」産物(ゲルの第3のレーン)をNGSシーケンシングにより解析した。ゲルの最大バンドに対応する主産物(産物の78%を超える)は、3つのバーコードすべてを有するライブラリーエレメントからなった。単一および二重バーコード産物も低い比率で(2つのBCについては20.7%で、および1つのBCについては1.1%で)観察された。
図60A~B。プライマー伸長エンコーディングアッセイにおけるブロッキングオリゴヌクレオチドの使用。いくつかのタイプのブロッキングオリゴヌクレオチドをプライマー伸長に基づくエンコーディングアッセイで試験した。(A)DNA「結合物質」モデル系、およびエンコーディングアッセイの成分をブロッキングするために使用した3タイプのブロッキングオリゴヌクレオチド:RTブロッカー、CTブロッカーおよびSp’ブロッカー、の設計を示す。各サイクルのコーディングタグバーコードは、サイクル特異的であるように、およびサイクル間で直交性(非相互作用性)であるように設計した。(B)3サイクルのエンコーディングおよびPCR増幅後のエンコーディング結果のゲル解析。示されている例では、各サイクルの入力コーディングタグと同種のCTブロッカー(*印の付いているレーン)が、矢印により示されている上方のバンドが示す通り、最高エンコーディング効率を提供した。
図61A~B。ProteoCodeライブラリー増幅中の鋳型乗り換えの最小化。(A)好熱性ポリメラーゼをPCR中の鋳型乗り換えの傾向についてスクリーニングした。共有バーコード(BC3、BC4、BC5およびBC13)とスペーサー(Sp)配列とを含有する、異なる長さの2つの合成擬似鋳型(TS_Ctrl1およびTS_Ctrl4)が示されている。PCRによる共増幅後、2つの元の鋳型バンドに加えてPAGEによるバンドの存在が鋳型乗り換えを示す。(B)PCR産物をPAGEにより解析した。鋳型乗り換えは、PCR条件およびポリメラーゼのタイプの関数であった。Taqポリメラーゼ(レーン2~5;レーン1=サイズマーカー)は、特に60℃アニーリングでDeep Vent exo-(レーン6~9)よりはるかに少ない鋳型乗り換えを示した。
図62。単一サイクルProteoCodeアッセイ。2つの異なるビーズタイプ(一方はアミノA末端ペプチド(AFA-ペプチド)を有し、他方は、アミノF末端ペプチド(FA-ペプチド)を有する)をアッセイで使用した。1サイクルのNTF/NTE化学作用サイクルと、操作されたフェニルアラニン(F)結合物質を用いる化学作用前および後エンコーディングステップで構成されている2サイクルのエンコーディングサイクルとからなる、フルサイクルProteoCodeアッセイにおいて、AFA-ペプチドおよびFA-ペプチドビーズを使用した。化学作用後エンコーディングアッセイに対して化学作用前エンコーディングアッセイではF-結合物質に異なるバーコードを使用した。2サイクルのエンコーディング(前および後)の後、伸長記録タグを、PCRおよびNGSライブラリー調製、続いて、Illumina MiSeq装置でのNGSシーケンシング読み取りに供した。「前」および「後」バーコード付きコーディングタグを含有するAFAおよびFA記録タグの正規化されたリード数が示されている。F-結合物質とともにインキュベートしたFAペプチドについて、化学作用後サイクルタグと比較して高い「化学作用前」コーディングタグリードカウントが観察された。これは、F残基の除去成功を示す。逆に、F-結合物質とともにインキュベートしたAFAペプチドについて、化学作用後サイクルタグと比較して低い化学作用前サイクルタグリードカウントが観察された。これは、A残基の除去成功を示す。
図63A~B。ペプチドキメラ表面密度の関数としての分子間クロストーク。異なる表面キメラ密度で同じビーズ上に固定化されている4-plexペプチド-記録タグキメラ(AA-ペプチド、AF-ペプチド、FA-ペプチド、およびペプチドなし)に関するF-結合物質アッセイクロストーク測定。(A)PA抗体結合/エンコーディングにより評価した4つのキメラタイプにわたってのキメラ固定化の均一性。各キメラ(配列決定または記録タグにより測定したとき)は、全キメラのおよそ20~30%に相当した。(B)4つのキメラタイプにわたってのF-結合物質に関する単一の結合およびエンコーディングサイクルのエンコーディング効率。1:10,000および1:100,000のキメラ表面希釈度で、FA-ペプチドの分子内エンコーディング効率は、オフターゲットのペプチドキメラ(AF、AA、およびペプチドなし)の分子間エンコーディングよりはるかに高い。
図64A~B。ssDNAリガーゼを使用する塩基保護DNAに関するDNAエンコーディング。(A)ssDNAライゲーションアッセイのための塩基保護記録タグ(RT)およびコーディングタグ(CT)の設計。用いた塩基保護基は、オリゴヌクレオチド合成で使用される標準的なホスホロアミダイト保護基:Bz-dA、ibu-dG、Ac-dCであった。合成後、これらの保護基を所定の位置に残した。CircLigase IIを使用して、RTオリゴの5’リン酸化末端をCTオリゴの3’OHとライゲーションした。(B)ssDNAリガーゼライゲーション反応成分および産物のPAGEゲル解析。レーン1 = RT完全長オリゴ;レーン2 = 5’Uで構成されるRT完全長からリン酸化RT配列を生成するためのUSER酵素処理後;レーン3 = ビーズに固定化されたRTオリゴへのCTオリゴのアニーリング後;レーン4 = CircLigase IIを使用する、B-B’相互作用によるRTの5’末端へのCTの3’末端のライゲーション後。CircLigase IIを使用したレーン5から分かるように、「塩基保護」DNAのライゲーションは、より高分子量のライゲーション産物の形成によって示される通り相対的に効率がよい。
図65A~E。DNAビーズへのハイブリダイゼーションおよびライゲーションを使用するDNAタグ付きペプチドの固定化。(A)DNAヘアピンの5’突出を使用してDNA-ペプチドキメラを捕捉する、DNAヘアピンビーズの設計。(B)ビーズ上のヘアピンとハイブリダイズされているDNA-ペプチドキメラ。(C)DNAリガーゼを使用して、ペプチドのリン酸化DNAタグの5’末端をヘアピンに共有結合により接合させる。ペプチドのDNAタグを、ペプチドが内部ヌクレオチドに化学的にコンジュゲートされるように設計する。ペプチドのDNAタグは、コーディングタグからの情報が移行され得る遊離3’末端を有する記録タグを構成する。(D)ビーズへのDNAタグ付きペプチドの固定化の効率を評価するためのqPCRプライマーの設計。(E)ヘアピン(突出)およびDNAタグ付きペプチド固定化(キメラおよびライゲーション産物)を評価するための3つの異なるプライマーセットを使用するqPCR定量化。Cq値が低いほど、示す増幅産物の豊富さが高い。
本明細書において具体的に定義されない用語には、本開示および文脈を踏まえて当業者により与えられるであろう意味が与えられるべきである。しかしながら、本明細書で使用される場合、相反する指定がなければ、用語は示される意味を有する。
本出願で言及される、特許文献、科学論文およびデータベースを含む全ての公表文献は、個々の公表文献の各々が参照により個々に組み込まれた場合と同程度に、あらゆる目的でそれら全体が参照により組み込まれる。本明細書に記載の定義が、参照により本明細書に組み込まれる特許、出願、公開出願および他の公表文献で述べられている定義と相容れないまたは別様に矛盾する場合、本明細書に記載の定義が、参照により本明細書に組み込まれる定義より優先する。
本明細書で使用される節の見出しは、構成を目的としたものに過ぎず、記載される主題を限定すると見なすべきでない。
I.序論および概観
ポリペプチド(例えば、タンパク質)の巨大分子の高度に並行した特徴付けおよび認識は、いくつかの理由で困難である。親和性に基づくアッセイの使用は、いくつかの重要な課題に起因して難しいことが多い。1つの有意な課題は、親和性作用物質の集合の読み取りデータを同類の巨大分子の集合に多重化することであり;もう1つの課題は、親和性作用物質とオフターゲットの巨大分子との交差反応性を最小限に抑えることであり;第3の課題は、効率的なハイスループットの読み取りプラットフォームを開発することである。この問題の例は、試料中のタンパク質の大部分または全てを識別および定量化することが1つの目標であるプロテオミクスにおいて生じる。加えて、タンパク質の様々な翻訳後修飾(PTM)を単一分子レベルで特徴付けることが望ましい。現在、これは、ハイスループット方式で果たされるべき非常に厄介な仕事である。
タンパク質またはポリペプチド分析物の分子認識および特徴付けは、一般には、イムノアッセイを使用して実施される。ELISA、マルチプレックスELISA(例えば、スポッテッド抗体アレイ、液体粒子ELISAアレイ)、デジタルELISA(例えば、Quanterix、Singulex)、逆相タンパク質アレイ(RPPA)、および多くの他のものを含む、多くの異なるイムノアッセイ形式が存在する。これらの異なるイムノアッセイプラットフォームは全て、高親和性かつ高特異的(または選択的)抗体(結合性物質)の開発、試料レベルにおいても分析物レベルにおいても多重化能力が限られていること、感度およびダイナミックレンジが限られていること、ならびに交差反応性およびバックグラウンドシグナルを含む、同様の課題に直面する。ペプチド配列決定(エドマン分解または質量分析)による直接的なタンパク質特徴付けなどの、結合性物質にとらわれない手法は、有用な代替的手法をもたらす。しかしながら、これらの手法はいずれも、然程並行したものでも、ハイスループットなものでもない。
エドマン分解に基づくペプチド配列決定は、1950年にPehr Edmanによって最初に提唱されたものであり、言い換えれば、ペプチドのN末端アミノ酸についての一連の化学修飾による段階的分解および下流のHPLC分析(後に質量分析による解析に取って代わられた)である。第1のステップでは、N末端アミノ酸を穏やかな塩基性条件下(NMP/メタノール/HO)で、フェニルイソチオシアネート(PITC)で修飾して、フェニルチオカルバモイル(PTC)誘導体を形成する。第2のステップでは、PTC修飾アミノ基を酸(無水トリフルオロ酢酸、TFA)で処理して、切断された環状ATZ(2-アニリノ-5(4)-チアゾリノン(thiozolinone))修飾アミノ酸を創出し、その結果、新たなN末端がペプチドに残る。切断された環状ATZアミノ酸をフェニルチオヒダントイン(PTH)-アミノ酸誘導体に変換し、逆相HPLCによって分析する。このプロセスを、ペプチド配列を構成するアミノ酸の全てまたは部分的な数がN末端から除去され識別され終わるまで、反復的に継続する。一般に、当技術分野のエドマン分解ペプチド配列決定法は、緩徐であり、1日にほんの数ペプチドという限られたスループットを有する。
ここ10~15年で、MALDI、エレクトロスプレー質量分析(MS)、およびLC-MS/MSを使用するペプチド解析が大きくエドマン分解に取って代わっている。MS器械使用(Riley et al., 2016, Cell Syst 2:142-143)の最近の進歩にもかかわらず、MSにはなお、高額な計器費用、洗練された使用者の必要性、不十分な定量能力、およびプロテオームの全ダイナミックレンジにわたって測定を行う能力が限られていることを含む、いくつかの欠点がある。例えば、タンパク質は異なる効率レベルでイオン化するので、試料間の絶対定量化およびさらには相対的定量化が困難である。質量タグのインプリメンテーションが相対的定量化の改善に役立ってきたが、プロテオームを標識する必要がある。試料中のタンパク質の濃度が非常に大きな範囲にわたって(血漿に関しては10桁にわたって)変動し得るダイナミックレンジが、さらなる複雑化要因である。一般には、MSではより豊富な種のみが分析され、そのため豊富さが低いタンパク質の特徴付けは困難になる。最後に、試料スループットは、一般には、実行1回当たり数千ペプチドに限られ、データ非依存性解析(DIA)の場合、このスループットは、真のボトムアップ式のハイスループットなプロテオーム解析には不十分である。さらに、各試料について記録された何千もの複雑なMSスペクトルをデコンボリューションするために著しいコンピュータ処理が要求される。
したがって、タンパク質配列決定および/または解析に適用される巨大分子配列決定および/または解析に関する、ならびにそれを実現するための製品、方法およびキットに関する改善された技法が、当技術分野において依然として必要とされている。高度に並行化されており、正確であり、高感度であり、ハイスループットである、プロテオミクス技術が、必要とされている。本発明のこれらおよび他の態様は、以下の詳細な説明を参照すれば明らかになろう。この目的のために、ある特定のバックグラウンド情報、手順、化合物および/または組成物がより詳細に記載されている様々な参考文献が本明細書に記載され、各々が、これによりそれら全体が参照により組み込まれる。
本開示は、一部において、タンパク質およびペプチドの特徴付けおよび配列決定に直接適用される、高度に並行な、ハイスループットなデジタル巨大分子特徴付けおよび定量化方法を提供する(例えば、図1B、図2Aを参照されたい)。本明細書に記載の方法では、核酸分子または配列決定可能なポリマーの形態の識別情報を有するコーディングタグを含む結合性物質であって、目的の巨大分子と相互作用する結合性物質を使用する。多数の連続的な結合サイクルを実施し、各サイクルは、固体支持体上に固定化された複数の巨大分子(これは、例えば、プールされた試料を意味する)を複数の結合性物質に曝露することを含む。各結合サイクル中、巨大分子に結合する各結合性物質の同一性、および必要に応じて結合サイクル数を、結合性物質コーディングタグから巨大分子と共局在している記録タグに情報を移行させることによって記録する。代替の実施形態では、付随する巨大分子に関する識別情報を含む記録タグからの情報を、結合した結合性物質のコーディングタグに(例えば、伸長コーディングタグを形成するために)または第3の「ジタグ」構築物に移行させることができる。多数サイクルの結合事象により、巨大分子と共局在している記録タグに関する歴史的な結合情報が構築され、それにより、多数のコーディングタグを含む伸長記録タグが、所与の巨大分子についての時間的な結合履歴を表す共直線的な順序で生じる。さらに、サイクル特異的コーディングタグを用いて各サイクルからの情報を追跡することができ、したがって、あるサイクルが何らかの理由でスキップされた場合に、伸長記録タグがその後のサイクルで情報を収集し続け、情報が欠けているサイクルを識別することができる。
あるいは、コーディングタグから記録タグに情報を書き込むまたは移行させる代わりに、付随する巨大分子に関する識別情報を含む記録タグから、伸長コーディングタグを形成するコーディングタグまたは第3のジタグ構築物に情報を移行させることができる。得られた伸長コーディングタグまたはジタグを、その後の配列解析のために各結合サイクル後に収集することができる。バーコード(例えば、分配タグ、コンパートメントタグ、試料タグ、画分タグ、UMI、またはそれらの任意の組合せ)を含む記録タグ上の識別情報を使用して、伸長コーディングタグまたはジタグ配列読み取りを元の巨大分子にマッピングし戻すことができる。このように、巨大分子の結合履歴の核酸コードライブラリー表示を生成する。この核酸コードライブラリーを、非常にハイスループットの次世代デジタルシーケンシング法を使用して増幅させ、解析し、それにより、実行当たり数百万~数十億の分子を解析することができる。結合情報に関する核酸コードライブラリーの創出は、ハイブリダイゼーションを使用するDNAに基づく技法による濃縮、サブトラクション、および正規化が可能になるという点で、別のように有用である。これらのDNAに基づく方法は、容易におよび迅速に大規模化可能かつカスタマイズ可能であり、タンパク質ライブラリーなどの他の種類の巨大分子ライブラリーの直接操作のために利用可能なものよりも費用効果が大きい。したがって、結合情報に関する核酸コードライブラリーを配列決定前に1つまたは複数の技法によって処理して、配列の表示を濃縮および/またはサブトラクションおよび/または正規化することができる。これにより、最大の目的の情報が、個々のメンバーの豊富さが多数の桁にわたって最初に変動し得る非常に大きなライブラリーから、はるかに効率的に、迅速に、かつ大きな費用効果で抽出される。重要なことに、ライブラリー表示を操作するためのこれらの核酸に基づく技法は、より慣習的な方法と直交性のものであり、それらと組み合わせて使用することができる。例えば、アルブミンなどの、一般的な、極めて豊富なタンパク質を、望ましくないタンパク質の全てではないが大多数を除去することができるタンパク質に基づく方法を使用してサブトラクションすることができる。その後、伸長記録タグライブラリーのアルブミン特異的メンバーもサブトラクションし、したがって、より徹底的な全体的サブトラクションを実現することができる。
一態様では、本開示は、DNA記録タグで標識されたペプチドの大きな集団(例えば、数百万~数十億)からの配列決定を可能にする、エドマン様分解手法を使用した、ペプチド配列決定のための高度に並行化された手法を提供する。これらの記録タグで標識されたペプチドは、タンパク質試料のタンパク質分解による消化または限定された加水分解に由来するものであり、記録タグで標識されたペプチドは、配列決定基板(例えば、多孔質ビーズ)に、基板上の適切な分子間間隔でランダムに固定化される。NTAA切断反応を触媒するまたは動員する、フェニルチオカルバモイル(PTC)、ジニトロフェノール(DNP)、スルホニルニトロフェノール(SNP)、ダンシル、7-メトキシクマリン、アセチル、またはグアニジニルなどの小さな化学的部分を用いたペプチドのN末端アミノ酸(NTAA)残基の修飾により、エドマン様分解プロセスの周期的制御が可能になる。修飾用化学的部分により、同類のNTAA結合性物質に対する結合親和性の増強をもたらすこともできる。各固定化ペプチドの修飾されたNTAAを、コーディングタグを含む同類のNTAA結合性物質の結合、および、コーディングタグ情報(例えば、結合性物質に関する識別情報をもたらすエンコーダー配列)のコーディングタグからペプチドの記録タグへの移行(例えば、プライマー伸長またはライゲーション)によって識別する。その後、修飾されたNTAAを化学的方法または酵素的手段によって除去する。ある特定の実施形態では、修飾されたNTAAの除去を触媒させるために酵素(例えば、エドマナーゼ)を操作する。他の実施形態では、アミノペプチダーゼまたはアシルペプチドヒドロラーゼなどの天然に存在するエキソペプチダーゼを、適切な化学修飾の存在下でのみ末端アミノ酸を切断するように操作することができる。必要に応じて、方法は、各NTAA除去ステップの前および/または後にポリペプチドをプロリンアミノペプチダーゼと接触させるステップを含む。これらのステップは、そうしなければ末端プロリンを切断することができないからである。
II.定義
以下の説明では、種々の実施形態の詳細な理解をもたらすために、ある特定の具体的詳細を記載する。しかし、これらの詳細を伴わずに本化合物を作製および使用できることが当業者には理解されよう。他の場合では、実施形態の説明が不必要に不明瞭になるのを回避するために、周知の構造は詳細に示されていないまたは記載されていない。文脈上異なる解釈を要する場合を除き、本明細書およびそれが従う特許請求の範囲全体を通して、「含む(comprise)」という単語および「含む(comprises)」および「含む(comprising)」などのその変形は、制限のない、包括的な意味で、すなわち、「含むが、これだけに限定されない(including,but not limited to)」と解釈されるべきである。さらに、「含む(comprising)」という用語(および「含む(comprise)」または「含む(comprises)」または「有する(having)」または「含む(including)」などの関連する用語)は、他のある特定の実施形態では、例えば、本明細書に記載の任意の組成物(composition of matter)、組成物(composition)、方法、またはプロセスなどのある実施形態が、記載されている特徴「からなる(consist of)」または「から本質的になる(consist essentially of)」ものであり得ることを排除するものではない。本明細書で提示される表題は単に便宜上のものであり、特許請求された実施形態の範囲または意味とは解釈されない。
本明細書全体を通して、「一実施形態」または「ある実施形態」への言及は、当該実施形態に関連して記載される特定の特徴、構造または特性が少なくとも1つの実施形態に含まれることを意味する。したがって、本明細書全体を通して各所での「一実施形態では」または「ある実施形態では」という句の出現は、必ずしも全てが同じ実施形態について言及しているのではない。さらに、特定の特徴、構造、または特性は、任意の適切な様式で組み合わせて1つまたは複数の実施形態にすることができる。
本明細書で使用される場合、単数形「1つの(a)」、「1つの(an)」および「その(the)」は、文脈により明確に別段の規定がなされない限り、複数の指示対象を包含する。したがって、例えば、「1つのペプチド(a peptide)」への言及は、1つもしくは複数のペプチド、またはペプチドの混合物を含む。また、特に明記されていないまたは文脈から明らかでない限り、本明細書で使用される場合、「または(or)」という用語は、包括的であり、「または(or)」と「および(and)」の両方を包含するものと理解される。
本明細書で使用される場合、「巨大分子」という用語は、より小さなサブユニットで構成される大きな分子を包含する。巨大分子の例としては、これだけに限定されないが、ペプチド、ポリペプチド、タンパク質、核酸、炭水化物、脂質、大環状分子が挙げられる。巨大分子は、共有結合により連結した2つまたはそれよりも多くの型の巨大分子の組合せで構成されるキメラ巨大分子(例えば、核酸と連結したペプチド)も含む。巨大分子は、2つまたはそれよりも多くの巨大分子の非共有結合性の複合体で構成される「巨大分子集合体」も含み得る。巨大分子集合体は、同じ型の巨大分子で構成されるもの(例えば、タンパク質-タンパク質)であってもよく、2つまたはそれよりも多くの異なる型の巨大分子で構成されるもの(例えば、タンパク質-DNA)であってもよい。
本明細書で使用される場合、「ポリペプチド」という用語は、ペプチドおよびタンパク質を包含し、ペプチド結合によって接合されている2つまたはそれよりも多くのアミノ酸の鎖を含む分子を指す。一部の実施形態では、ポリペプチドは、2~50個のアミノ酸を含み、例えば、20~30個より多くのアミノ酸を含む。一部の実施形態では、ペプチドは、二次、テリトリー、またはより高次の構造を含まない。一部の実施形態では、タンパク質は、30個またはそれよりも多くのアミノ酸を含み、例えば、50個よりも多くのアミノ酸を含む。一部の実施形態では、一次構造に加えて、タンパク質は、二次、テリトリー、またはより高次の構造を含む。ポリペプチドのアミノ酸は、最も典型的にはL-アミノ酸であるが、D-アミノ酸、非天然アミノ酸、修飾アミノ酸、アミノ酸類似体、アミノ酸模倣物、またはそれらの任意の組合せであってもよい。ポリペプチドは、天然に存在するものであってもよく、合成的に産生されたものであってもよく、組換え発現されたものであってもよい。ポリペプチドはまた、アミノ酸鎖を修飾する追加の基、例えば、翻訳後修飾によって付加された官能基を含んでいてもよい。ポリマーは、直鎖状であってもよく、または分岐していてもよく、ポリマーは、修飾されたアミノ酸を含んでいてもよく、ポリマーに非アミノ酸が割り込んでいてもよい。この用語は、天然にまたは介入により、例えば、ジスルフィド結合形成、グリコシル化、脂質付加、アセチル化、リン酸化、または任意の他の操作もしくは修飾、例えば標識成分とのコンジュゲーションにより、修飾されたアミノ酸ポリマーも包含する。
本明細書で使用される場合、「アミノ酸」という用語は、ペプチドの単量体サブユニットとして機能する、アミン基、カルボン酸基、および各アミノ酸に特異的な側鎖を有する有機化合物を指す。アミノ酸は、20種の標準の天然に存在するまたは正規のアミノ酸ならびに非標準アミノ酸を含む。標準の天然に存在するアミノ酸としては、アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リシン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、トレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)が挙げられる。アミノ酸は、L-アミノ酸であってもD-アミノ酸であってもよい。非標準アミノ酸は、天然に存在するまたは化学的に合成された修飾されたアミノ酸、アミノ酸類似体、アミノ酸模倣物、非標準タンパク質新生性アミノ酸、または非タンパク質新生性アミノ酸であり得る。非標準アミノ酸の例としては、これだけに限定されないが、セレノシステイン、ピロリジン、およびN-ホルミルメチオニン、β-アミノ酸、ホモアミノ酸、プロリンおよびピルビン酸誘導体、3-置換アラニン誘導体、グリシン誘導体、環置換フェニルアラニンおよびチロシン誘導体、直鎖コアアミノ酸、N-メチルアミノ酸が挙げられる。
本明細書で使用される場合、「翻訳後修飾」という用語は、リボソームによるペプチドの翻訳が完了した後に当該ペプチド上で生じる修飾を指す。翻訳後修飾は、共有結合性修飾または酵素的修飾であり得る。翻訳後修飾の例としては、これだけに限定されないが、アシル化、アセチル化、アルキル化(メチル化を含む)、ビオチン化、ブチリル化、カルバミル化、カルボニル化、脱アミド化、脱イミノ化、ジフタミド形成、ジスルフィド架橋形成、エリミニル化、フラビン付着、ホルミル化、ガンマ-カルボキシル化、グルタミル化、グリシル化、グリコシル化、グリコシルホスファチジルイノシトール付加(glypiation)、ヘムC付着、ヒドロキシル化、ハイプシン形成、ヨウ素化、イソプレニル化、脂質付加、リポイル化、マロニル化、メチル化、ミリストイル化、酸化、パルミトイル化、ペグ化、ホスホパンテテイニル化、リン酸化、プレニル化、プロピオニル化、レチニリデンシッフ塩基形成、S-グルタチオン化、S-ニトロシル化、S-スルフェニル化、セレン化、サクシニル化、スルフィン化、ユビキチン化、およびC末端アミド化が挙げられる。翻訳後修飾は、ペプチドのアミノ末端および/またはカルボキシル末端の修飾を含む。末端アミノ基の修飾としては、これだけに限定されないが、デスアミノ、N-低級アルキル、N-ジ低級アルキル、およびN-アシル修飾が挙げられる。末端カルボキシ基の修飾としては、これだけに限定されないが、アミド、低級アルキルアミド、ジアルキルアミド、および低級アルキルエステル修飾(例えば、低級アルキルはC~Cアルキルである)が挙げられる。翻訳後修飾は、例えば、これだけに限定されないが、アミノ末端とカルボキシ末端の間にあるアミノ酸の、上記のものなどの修飾も含む。翻訳後修飾という用語は、1つまたは複数の検出可能な標識を含むペプチド修飾も含み得る。
本明細書で使用される場合、「結合性物質」という用語は、分析物、例えば、巨大分子または巨大分子の成分もしくは特徴部に結合する、会合する、それと一体化する、それを認識する、またはそれと化合する核酸分子、ペプチド、ポリペプチド、タンパク質、炭水化物、または小分子を指す。結合性物質は、分析物、例えば、巨大分子または巨大分子の成分もしくは特徴部と共有結合性の会合または非共有結合性の会合を形成し得る。結合性物質はまた、2つまたはそれよりも多くのタイプの分子で構成されるキメラ結合性物質、例えば、核酸分子-ペプチドキメラ結合性物質、または炭水化物-ペプチドキメラ結合性物質であってもよい。結合性物質は、天然に存在するものであってもよく、合成的に産生されたものであってもよく、組換え発現された分子であってもよい。結合性物質は、巨大分子の単一の単量体またはサブユニット(例えば、ペプチドの単一のアミノ酸)に結合することもあり、または巨大分子の複数の連結したサブユニット(例えば、より長いペプチド、ポリペプチドもしくはタンパク質分子の、ジ-ペプチド、トリ-ペプチド、もしくはより高次のペプチド)に結合することもある。結合性物質は、直鎖状分子に結合することもあり、または三次元構造(コンフォメーションとも称される)を有する分子に結合することもある。例えば、抗体結合性物質は、直鎖状ペプチド、ポリペプチドもしくはタンパク質に結合することもあり、またはコンフォメーションペプチド、ポリペプチドもしくはタンパク質に結合することもある。結合性物質は、ペプチド、ポリペプチドまたはタンパク質分子の、N末端ペプチドに結合することもあり、C末端ペプチドに結合することもあり、または介在するペプチドに結合することもある。結合性物質は、ペプチド分子の、N末端アミノ酸に結合することもあり、C末端アミノ酸に結合することもあり、または介在するアミノ酸に結合することもある。結合性物質は、例えば、化学修飾されたまたは標識されたアミノ酸に、修飾されていないアミノ酸または非標識アミノ酸よりも優先的に結合することもある。例えば、結合性物質は、例えば、アセチル部分、グアニル部分、ダンシル部分、PTC部分、DNP部分、SNP部分などで修飾されたアミノ酸に、前記部分を有さないアミノ酸よりも優先的に結合することもある。結合性物質は、ポリペプチド分子の翻訳後修飾に結合することもある。結合性物質は、巨大分子などの分析物の成分もしくは特徴部への選択的結合を示すこともある(例えば、結合性物質は、可能性のある20の天然のアミノ酸残基のうちの1つに選択的に結合し、他の19の天然のアミノ酸残基には非常に低い親和性で結合するかまたは全く結合しないこともある)。結合性物質は、より低い選択的結合を示すこともあり、その場合、結合性物質は、巨大分子などの分析物の複数の成分もしくは特徴部に結合し得る(例えば、結合性物質は、2つまたはそれよりも多くの異なるアミノ酸残基に同様の親和性で結合することもある)。結合性物質は、コーディングタグを含み、このコーディングタグは、リンカーによって結合性物質に接合されていることもある。
一部の実施形態では、「物質」および「試薬」という用語は、同義で使用される。例えば、結合性物質は、物質と称されるが、そのコーディングタグは、情報を移行させるために記録タグのスペーサー配列または反応性末端と反応するための反応性部分、例えば、スペーサー配列または反応性末端を有することができる。前記反応は、ライゲーションおよび/またはアニーリング、その後のプライマー伸長を含み得る。
本明細書で使用される場合、「リンカー」という用語は、2つの分子を接合するために使用される、ヌクレオチド、ヌクレオチド類似体、アミノ酸、ペプチド、ポリペプチド、または非ヌクレオチド化学的部分の1つまたは複数を指す。リンカーは、結合性物質とコーディングタグを接合するため、記録タグと巨大分子(例えば、ペプチド)を接合するため、巨大分子と固体支持体を接合するため、記録タグと固体支持体などを接合するために使用することができる。ある特定の実施形態では、リンカーにより、2つの分子が酵素反応または化学反応(例えば、クリックケミストリー)を介して接合される。
本明細書で使用される場合、「プロテオミクス」という用語は、プロテオーム、例えば、細胞、組織および体液中のプロテオーム、ならびに細胞内および組織内のプロテオームの対応する空間的分布の分析(例えば、定量的分析)を指す。さらに、プロテオミクス研究は、生態および定義された生物学的または化学的刺激の関数として継続的に時間変動するプロテオームの動的状態を含む。
本明細書で使用される場合、「プロテオーム」という用語は、標的、例えば、任意の生物のゲノム、細胞、組織、またはある特定の時期の生物によって発現される、タンパク質、ポリペプチドまたはペプチド(それらのコンジュゲートまたは複合体を含む)の全セットを含むことができる。一態様では、プロテオームは、所与のタイプの細胞または生物において所与の時期に、定義された条件下で発現されるタンパク質のセットである。プロテオミクスは、プロテオームの研究である。例えば、「細胞プロテオーム」は、ホルモン刺激への曝露などの、環境条件の特定のセットのもとで特定の細胞型に見られるタンパク質の一群を含むことがある。生物の完全なプロテオームは、様々な細胞プロテオームの全てからのタンパク質の完全なセットを含み得る。プロテオームはまた、ある特定の細胞内生物システム内のタンパク質の一群を含むこともある。例えば、ウイルスのタンパク質の全てをウイルスプロテオームと呼ぶことができる。本明細書で使用される場合、「プロテオーム」という用語は、これだけに限定されないが、キノーム;セクレトーム;レセプトーム(例えば、GPCRome);免疫プロテオーム;栄養プロテオーム;翻訳後修飾(例えば、リン酸化、ユビキチン化、メチル化、アセチル化、グリコシル化、酸化、脂質付加および/またはニトロシル化)により定義されるプロテオームサブセット、例えば、リン酸化プロテオーム(例えば、ホスホチロシン-プロテオーム、チロシン-キノーム、およびチロシン-ホスファトーム)、グライコプロテオームなど;組織もしくは臓器、発生期、または生理もしくは病的状態に関連するプロテオームサブセット;細胞プロセス、例えば、細胞周期、分化(もしくは脱分化)、細胞死、老化、細胞遊走、形質転換、または転移に関連する、プロテオームサブセット;あるいはこれらの任意の組合せを含む、プロテオームのサブセットを含む。
本明細書で使用される場合、「非同類結合性物質」という用語は、特定の結合サイクル反応において調査される巨大分子の特徴、成分、またはサブユニットに、対応する巨大分子の特徴、成分、またはサブユニットに高親和性で結合する「同類結合性物質」と比較して、結合することができないまたは低親和性で結合する結合性物質を指す。例えば、ペプチド分子のチロシン残基を結合反応において調査する場合、非同類結合性物質は、チロシン残基に低親和性で結合するまたは全く結合しないものであり、したがって、非同類結合性物質では、コーディングタグ情報を同類結合性物質から記録タグに移行させるために適した条件下でコーディングタグ情報が記録タグに効率的に移行されない。あるいは、ペプチド分子のチロシン残基を結合反応において調査する場合、非同類結合性物質は、チロシン残基に低親和性で結合するまたは全く結合しないものであり、したがって、伸長記録タグではなく伸長コーディングタグを伴う実施形態に適した条件下で、記録タグ情報はコーディングタグに効率的に移行されない。
本明細書で使用される場合、「プロリンアミノペプチダーゼ」という用語は、ポリペプチドからN末端プロリンを特異的に切断することができる酵素を指す。この活性を有する酵素は当技術分野において周知であり、プロリンイミノペプチダーゼまたはPAPと称されることもある。公知の単量体PAPには、B.coagulans、L.delbrueckii、N.gonorrhoeae、F.meningosepticum、S.marcescens、T.acidophilum、L.plantarumからのファミリーメンバーが含まれる(MEROPS S33.001)(Nakajima, Ito et al. 2006)(Kitazono, Yoshimoto et al. 1992)。公知の多量体PAPには、D.hansenii(Bolumar,Sanz et al. 2003)が含まれる。ネイティブなPAPまたは操作されたPAPのどちらかを用いることができる。
本明細書で使用される場合、「特異的結合」という用語は、結合物質、例えば、抗体、ClpSタンパク質、またはアンチカリンについての、それがポリペプチド抗原などの標的に優先的に結合するような、特異性を指す。結合パートナー、例えば、タンパク質、核酸、抗体または他の親和性捕捉物質などに言及する場合、「特異的結合」は、指定アッセイ条件下で選択的ハイブリダイゼーションを確実にする高い親和性および/または相補性を有する2つまたはそれより多くの結合パートナーの結合反応を含むことができる。通常は、特異的結合は、バックグラウンドシグナルの標準偏差の少なくとも3倍であろう。したがって、指定条件下で、結合パートナーは、その特定の標的分子に結合し、試料中に存在する他の分子には有意な量で結合しない。他の潜在的干渉物質の存在下での結合物質または抗体による特定の標的の認識は、そのような結合の1つの特徴である。例えば、標的に特異的であるまたは特異的に結合する結合物質、抗体または抗体断片は、他の非標的物質への結合より高い親和性で標的と結合する。例えば、標的に特異的であるまたは特異的に結合する結合物質、抗体または抗体断片は、非標的物質、例えば、試験する試料中に存在する非標的物質の有意なパーセンテージへの結合を回避する。一部の実施形態では、本開示の結合物質、抗体または抗体断片は、非標的物質の約90%より高いパーセンテージへの結合を回避するが、より高いパーセンテージが明らかに考えられ、好ましい。例えば、本開示の結合物質、抗体または抗体断片は、非標的物質の約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%、および約99%またはそれより高いパーセンテージへの結合を回避する。他の実施形態では、本開示の結合物質、抗体または抗体断片は、非標的物質の約10%、20%、30%、40%、50%、60%、または70%より高いパーセンテージ、または約75%より高いパーセンテージ、または約80%より高いパーセンテージ、または約85%より高いパーセンテージへの結合を回避する。
本明細書で使用される場合、ポリヌクレオチド、タンパク質またはポリペプチドバリアント、変異体、ホモログ、または修飾バージョンは、参照ポリヌクレオチド、タンパク質またはポリペプチドとの核酸またはアミノ酸配列同一性、例えば、約10%配列同一性、約15%配列同一性、約20%配列同一性、約25%配列同一性、約30%配列同一性、約35%配列同一性、約40%配列同一性、約45%配列同一性、約50%配列同一性、約55%配列同一性、約60%配列同一性、約65%配列同一性、約70%配列同一性、約75%配列同一性、約80%配列同一性、約85%配列同一性、約90%、91%、92%、93%、94%、95%、96%、97%、98%もしくは99%配列同一性、または約100%配列同一性を共有する、タンパク質またはポリペプチドを含む。
参照ポリヌクレオチド配列に対する「核酸配列同一性パーセント(%)」は、配列をアラインメントし、最大の配列同一性パーセントを達成するために必要に応じてギャップを導入した後の、いかなる保存的置換も配列同一性の一部と見なさない、参照ポリヌクレオチド配列中の核酸残基と同一である候補配列中の核酸残基のパーセンテージと定義される。参照ポリペプチド配列に対する「アミノ酸配列同一性パーセント(%)」は、配列をアラインメントし、最大の配列同一性パーセントを達成するために必要に応じてギャップを導入した後の、いかなる保存的置換も配列同一性の一部と見なさない、参照ポリペプチド配列中のアミノ酸残基と同一である候補配列中のアミノ酸残基のパーセンテージと定義される。アミノ酸配列同一性パーセントおよび/または核酸配列パーセントを決定するためのアラインメントは、当技術分野における技能の範囲内である様々な方法で、例えば、BLAST、BLAST-2、ALIGNまたはMegalign(DNASTAR)ソフトウェアなどの公開されているコンピュータソフトウェアを使用して、達成することができる。当業者は、比較される配列の完全長にわたって最大のアラインメントを達成するために必要な任意のアルゴリズムを含む、配列のアラインメントのための適切なパラメータを決定することができる。
例えば、本明細書に開示されているClpSタンパク質またはポリペプチドは、参照ClpSタンパク質またはポリペプチド、例えば、A.tumefaciens ClpS2(例えば、配列番号198)、E.coli ClpS(例えば、配列番号199)、および/またはC.crescentus ClpS(例えば、配列番号200)と配列同一性を、約10%配列同一性、約15%配列同一性、約20%配列同一性、約25%配列同一性、約30%配列同一性、約35%配列同一性、約40%配列同一性、約45%配列同一性、約50%配列同一性、約55%配列同一性、約60%配列同一性、約65%配列同一性、約70%配列同一性、約75%配列同一性、約80%配列同一性、約85%配列同一性、約90%、91%、92%、93%、94%、95%、96%、97%、98%もしくは99%配列同一性、または約100%配列同一性で共有する、バリアント、変異体、ホモログまたは修飾バージョンを含む。
遊離アミノ基を有するペプチド鎖の一方の末端における末端アミノ酸は、本明細書では「N末端アミノ酸」(NTAA)と称される。遊離カルボキシル基を有する鎖の他方の末端における末端アミノ酸は、本明細書では「C末端アミノ酸」(CTAA)と称される。長さ「n」のアミノ酸であるペプチドに関して、ペプチドを構成するアミノ酸に、順番に番号を付すことができる。本明細書で使用される場合、NTAAは、n番目のアミノ酸と考えられる(本明細書では「n番目のNTAA」とも称される)。この命名法を使用すると、N末端からC末端へとペプチドの長さを下って、次のアミノ酸は(n-1)番目のアミノ酸、次いで(n-2)番目のアミノ酸などとなる。ある特定の実施形態では、NTAA、CTAA、または両方は、化学的部分で修飾または標識されていることもある。
本明細書で使用される場合、「バーコード」という用語は、巨大分子(例えば、タンパク質、ポリペプチド、ペプチド)、結合性物質、結合サイクルからの結合性物質のセット、試料巨大分子、試料のセット、コンパートメント(例えば、液滴、ビーズ、または分離された位置)内の巨大分子、コンパートメントのセット内の巨大分子、巨大分子の画分、巨大分子画分のセット、空間的領域または空間的領域のセット、巨大分子のライブラリー、または結合性物質のライブラリーについての一意の識別子タグまたは起源情報をもたらす約2~約30塩基(例えば、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29または30塩基)の核酸分子を指す。バーコードは、人工的な配列であっても天然に存在する配列であってもよい。ある特定の実施形態では、バーコードの集団内の各バーコードは異なるものである。他の実施形態では、バーコードの集団のバーコードの一部が異なる、例えば、バーコードの集団のバーコードの少なくとも約10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、または99%が異なる。バーコードの集団は、ランダムに生成することもでき、非ランダムに生成することもできる。ある特定の実施形態では、バーコードの集団は、エラー訂正バーコードである。バーコードは、多重化された配列決定データをコンピュータによりデコンボリューションし、個々の巨大分子、試料、ライブラリーなどに由来する配列読み取りを識別するために使用することができる。バーコードはまた、マッピングを増強するための小さなコンパートメント中に分布させた巨大分子の集合のデコンボリューションのために使用することもできる。例えば、ペプチドをプロテオームにマッピングし戻すのではなく、ペプチドをその起源であるタンパク質分子またはタンパク質複合体にマッピングし戻す。
「試料バーコード」は、「試料タグ」とも称され、巨大分子がいずれの試料に由来するかを識別するものである。
「空間バーコード」は、巨大分子が2Dまたは3D組織切片のいずれの領域に由来するかを識別するものである。空間バーコードは、組織切片に関する分子病理学のために使用することができる。空間バーコードにより、組織切片(複数可)由来の複数の試料またはライブラリーのマルチプレックス配列決定が可能になる。
本明細書で使用される場合、「コーディングタグ」という用語は、それに付随する結合性物質に関する識別情報を含む任意の好適な長さを有するポリヌクレオチド、例えば、約2塩基~約100塩基の、2および100ならびにその間のあらゆる整数を含む、核酸分子を指す。「コーディングタグ」はまた、「配列決定可能なポリマー」で作られたものであってよい(例えば、Niu et al., 2013, Nat. Chem. 5:282-292;Roy et al., 2015, Nat.Commun. 6:7237;Lutz, 2015, Macromolecules 48:4759-4767を参照されたく、これらの各々は、その全体が参照により組み込まれる)。コーディングタグは、必要に応じて片側が1つのスペーサーと隣接しているまたは両側がスペーサーと隣接している、エンコーダー配列(例えば、バーコード識別子)を含んでいてもよい。コーディングタグはまた、必要に応じたUMIおよび/または必要に応じた結合サイクル特異的バーコードで構成されていてもよい。コーディングタグは、一本鎖状であってもよく、または二本鎖状であってもよい。二本鎖コーディングタグは、平滑末端、突出末端、またはその両方を含んでいてもよい。コーディングタグは、結合性物質に直接付着しているコーディングタグを指すこともあり、結合性物質に直接付着しているコーディングタグとハイブリダイズした相補配列(例えば、二本鎖コーディングタグに関して)を指すこともあり、または伸長記録タグに存在するコーディングタグ情報を指すこともある。ある特定の実施形態では、コーディングタグは、結合サイクル特異的スペーサーもしくはバーコード、一意の分子識別子、ユニバーサルプライミング部位、またはそれらの任意の組合せをさらに含むこともある。
本明細書で使用される場合、「エンコーダー配列」または「エンコーダーバーコード」という用語は、それが付随する結合性物質に関する識別情報をもたらす、約2塩基~約30塩基(例えば、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29または30塩基)の長さの核酸分子を指す。エンコーダー配列は、それが付随する結合性物質を一意的に識別することができるものである。ある特定の実施形態では、エンコーダー配列により、それが付随する結合性物質および結合性物質が使用される結合サイクルに関する識別情報がもたらされる。他の実施形態では、エンコーダー配列をコーディングタグ内の別の結合サイクル特異的バーコードと組み合わせる。あるいは、エンコーダー配列により、それに付随する結合性物質を2種またはそれよりも多くの異なる結合性物質のセットのメンバーに属するものと識別することができる。一部の実施形態では、解析のためにはこの識別のレベルで十分である。例えば、アミノ酸に結合する結合性物質を伴う一部の実施形態では、ペプチドの特定の位置におけるアミノ酸残基を決定的に識別するのではなく、ペプチドがその位置において2つの可能性のあるアミノ酸のうちの1つを含むことを知ることで十分であり得る。別の例では、タンパク質標的の1種よりも多くのエピトープを認識し、様々な特異性を有する抗体の混合物を含むポリクローナル抗体に共通のエンコーダー配列を使用する。他の実施形態では、エンコーダー配列により可能性のある結合性物質のセットを識別する場合、逐次的な脱コーディング手法を使用して、各結合性物質の一意の識別をもたらすことができる。これは、繰り返される結合のサイクルにおいて所与の結合性物質に対するエンコーダー配列を変動させるによって実現される(Gundersonら、2004年、Genome Res.、14巻:870~7頁を参照されたい)。各結合サイクルからのコーディングタグ情報を部分的に識別することにより、他のサイクルからのコーディング情報と組み合わせると、結合性物質について一意の識別子がもたらされ、例えば、個々のコーディングタグ(またはエンコーダー配列)ではなく、コーディングタグの特定の組合せにより、結合性物質に関する一意的識別情報がもたらされる。例えば、結合性物質のライブラリー内のエンコーダー配列は同じまたは同様の数の塩基を有する。
本明細書で使用される場合、「結合サイクル特異的タグ」、「結合サイクル特異的バーコード」、または「結合サイクル特異的配列」という用語は、特定の結合サイクル内で使用される結合性物質のライブラリーを識別するために使用される一意の配列を指す。結合サイクル特異的タグは、約2塩基~約8塩基(例えば、2、3、4、5、6、7、または8塩基)の長さを含み得る。結合サイクル特異的タグは、結合性物質のコーディングタグ内に、スペーサー配列の一部として、エンコーダー配列の一部として、UMIの一部として、またはコーディングタグ内の別の成分として組み入れることができる。
本明細書で使用される場合、「スペーサー」(Sp)という用語は、記録タグまたはコーディングタグの末端に存在する長さ約0塩基~約20塩基(例えば、0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20塩基)の核酸分子を指す。スペーサーが0塩基である場合、アッセイは、例えば図7および図46に示されているような、「無スペーサー」形式のアッセイと称されることもある。ある特定の実施形態では、スペーサー配列は、一方の末端または両方の末端がコーディングタグのエンコーダー配列に隣接している。結合性物質の巨大分子への結合後、それらにそれぞれ付随するコーディングタグおよび記録タグの相補的なスペーサー配列間のアニーリングにより、結合情報は、プライマー伸長反応またはライゲーションによって記録タグ、コーディングタグ、またはジタグ構築物に移行することができる。Sp’は、Spに相補的なスペーサー配列を指す。例えば、結合性物質のライブラリー内のスペーサー配列は、同数の塩基を有する。共通する(共有されるまたは同一の)スペーサーを結合性物質のライブラリーにおいて使用することができる。スペーサー配列は、特定の結合サイクルで使用される結合性物質を追跡するために、「サイクル特異的」配列を有していてもよい。スペーサー配列(Sp)は、全結合サイクルにわたって一定であることもあり、巨大分子の特定のクラスに特異的であることもあり、または結合サイクル数特異的であることもある。巨大分子クラス特異的スペーサーは、完了した結合/伸長サイクルからの伸長記録タグに存在する同類結合性物質のコーディングタグ情報の、後続の結合サイクルにおける巨大分子の同じクラスを認識する別の結合性物質のコーディングタグへの、クラス特異的スペーサーを介したアニーリングを可能にする。正確な同類の対の逐次的な結合によってのみ、相互作用するスペーサーエレメントおよび有効なプライマー伸長がもたらされる。スペーサー配列は、記録タグ内の相補的なスペーサー配列とアニーリングしてプライマー伸長(ポリメラーゼ伸長とも称される)反応を開始させるのに十分な数の塩基を含むこともあり、またはライゲーション反応のための「副子」を提供するのに十分な数の塩基を含むこともあり、または「粘着末端」ライゲーション反応を媒介するのに十分な数の塩基を含むこともある。スペーサー配列は、コーディングタグ内のエンコーダー配列よりも少ない数の塩基を含むこともある。
本明細書で使用される場合、「記録タグ」という用語は、部分、例えば、化学カップリング部分、核酸部分、または配列決定可能なポリマー部分(例えば、Niu et al., 2013, Nat. Chem. 5:282-292;Roy et al., 2015, Nat.Commun. 6:7237;Lutz, 2015, Macromolecules 48:4759-4767を参照されたく、これらの各々は、その全体が参照により組み込まれる)であって、そこにコーディングタグの識別情報を移行することができる部分、またはそこから記録タグが付随する巨大分子に関する識別情報(例えば、UMI情報)をコーディングタグに移行させることができる部分を指す。識別情報は、分子を特徴付ける任意の情報、例えば、試料、画分、分配、空間位置、相互作用する近隣の分子、サイクル数などに関する情報を含むことができる。さらに、UMI情報の存在を識別情報として分類することもできる。ある特定の実施形態では、結合性物質がポリペプチドに結合した後、結合性物質に連結されているコーディングタグからの情報を、結合性物質がポリペプチドに結合されている間にポリペプチドに付随する記録タグに移行させることができる。他の実施形態では、結合性物質がポリペプチドに結合した後、ポリペプチドに付随する記録タグからの情報を、結合性物質がポリペプチドに結合されている間に、結合性物質に連結されているコーディングタグに移行させることができる。再コーディングタグは、ポリペプチドに直接連結されていてもよく、ポリペプチドに多機能性リンカーを介して連結されていてもよく、または固体支持体上でのその近接(または共局在)によってポリペプチドに付随していてもよい。記録タグは、その5’末端もしくは3’末端を介して連結されていてもよく、またはその内部の部位に連結されていてもよいが、ただし、その連結が、コーディングタグ情報を記録タグに移行させるために使用される方法または逆に記録タグの情報をコーディングタグに移行させるために使用される方法に適合することを条件とする。記録タグは、他の機能的成分、例えば、ユニバーサルプライミング部位、一意の分子識別子、バーコード(例えば、試料バーコード、画分バーコード、空間バーコード、コンパートメントタグなど)、コーディングタグのスペーサー配列と相補的であるスペーサー配列、またはそれらの任意の組合せをさらに含んでいてもよい。記録タグのスペーサー配列は、コーディングタグ情報を記録タグに移行させるためにポリメラーゼ伸長が使用される実施形態では、記録タグの3’末端にあるのが好ましい。
本明細書で使用される場合、「プライマー伸長」という用語は「ポリメラーゼ伸長」とも称され、核酸ポリメラーゼ(例えば、DNAポリメラーゼ)によって触媒される反応であって、相補鎖とアニーリングする核酸分子(例えば、オリゴヌクレオチドプライマー、スペーサー配列)を、相補鎖を鋳型として使用してポリメラーゼによって伸長させる反応を指す。
本明細書で使用される場合、「一意の分子識別子」または「UMI」という用語は、UMIが連結された各巨大分子(例えば、ペプチド)または結合性物質についての一意の識別子タグをもたらす、約3~約40塩基(3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40塩基の長さの核酸分子を指す。巨大分子UMIは、複数の伸長記録タグからの配列決定データをコンピュータによりデコンボリューションして個々の巨大分子を起源とする伸長記録タグを識別するために使用することができる。結合性物質UMIは、特定の巨大分子に結合する個々の結合性物質それぞれを識別するために使用することができる。例えば、UMIを使用して、特定のペプチド分子に存在する単一のアミノ酸に特異的な結合性物質についての個々の結合事象の数を識別することができる。結合性物質または巨大分子に関してUMIおよびバーコードの両方に言及される場合、バーコードは、個々の結合性物質または巨大分子についてのUMI以外の識別情報(例えば、試料バーコード、コンパートメントバーコード、結合サイクルバーコード)を指すことが理解される。
本明細書で使用される場合、「ユニバーサルプライミング部位」または「ユニバーサルプライマー」または「ユニバーサルプライミング配列」という用語は、ライブラリー増幅のためおよび/または配列決定反応のために使用することができる核酸分子を指す。ユニバーサルプライミング部位としては、これだけに限定されないが、PCR増幅のためのプライミング部位(プライマー配列)、一部の次世代シーケンシングプラットフォームにおいてブリッジ増幅を可能にする、フローセル表面上の相補的なオリゴヌクレオチドとアニーリングするフローセルアダプター配列、配列決定プライミング部位、またはこれらの組合せを挙げることができる。ユニバーサルプライミング部位は、次世代デジタルシーケンシングと併せて一般に使用されるものを含めた他の型の増幅のために使用することができる。例えば、伸長記録タグ分子を環状化し、ローリングサークル増幅にユニバーサルプライミング部位を使用して、配列決定鋳型として使用することができるDNAナノボールを形成することができる(Drmanacら、2009年、Science、327巻:78~81頁)。あるいは、記録タグ分子を環状化し、ユニバーサルプライミング部位からのポリメラーゼ伸長によって直接配列決定することができる(Korlachら、2008年、Proc. Natl. Acad. Sci.、105巻:1176~1181頁)。「フォワード」という用語は、「ユニバーサルプライミング部位」または「ユニバーサルプライマー」に関連して使用される場合、「5’」または「センス」と称される場合もある。「リバース」という用語は、ユニバーサルプライミング部位」または「ユニバーサルプライマー」に関連して使用される場合は、「3’」または「アンチセンス」と称される場合もある。
本明細書で使用される場合、「伸長記録タグ」という用語は、結合性物質が分析物、例えば巨大分子、に結合した後に少なくとも1つの結合性物質のコーディングタグ(またはその相補配列)の情報が移行された記録タグを指す。コーディングタグの情報は、記録タグに直接移行されること(例えば、ライゲーション)もあり、または間接的に移行されること(例えば、プライマー伸長)もある。コーディングタグの情報は、記録タグに酵素的に移行されることもあり、または化学的に移行されることもある。伸長記録タグは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200またはそれよりも多くのコーディングタグの結合性物質情報を含むことができる。伸長記録タグの塩基配列は、コーディングタグによって識別される結合性物質の結合の時間的および逐次的順序を反映することもあり、コーディングタグによって識別される結合性物質の結合の部分的な逐次的順序を反映することもあり、またはコーディングタグによって識別される結合性物質の結合のいかなる順序も反映しないこともある。ある特定の実施形態では、伸長記録タグ中に存在するコーディングタグ情報は、解析される巨大分子配列を少なくとも25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性で表す。伸長記録タグが、解析される巨大分子配列を100%の同一性で表さない、ある特定の実施形態では、エラーは、結合性物質によるオフターゲットの結合に起因することもあり、または「飛ばされた」結合サイクル(例えば、結合サイクル中に結合性物質が巨大分子に結合できないことが原因で、プライマー伸長反応の不成功が原因で)に起因することもあり、またはその両方に起因することもある。
本明細書で使用される場合、「伸長コーディングタグ」という用語は、コーディングタグが接合している結合性物質の、記録タグが付随している巨大分子への結合後に少なくとも1つの記録タグ(またはその相補配列)の情報が移行されたコーディングタグを指す。記録タグの情報は、コーディングタグに直接移行させることもでき(例えば、ライゲーション)、間接的に移行させることもできる(例えば、プライマー伸長)。記録タグの情報は、酵素的に移行させることもでき、化学的に移行させることもできる。ある特定の実施形態では、伸長コーディングタグは、1つの結合事象を反映する1つの記録タグの情報を含む。本明細書で使用される場合、「ジタグ」または「ジタグ構築物」または「ジタグ分子」という用語は、コーディングタグが接合している結合性物質の、記録タグが付随する巨大分子への結合後に少なくとも1つの記録タグ(またはその相補配列)の情報および少なくとも1つのコーディングタグ(またはその相補配列)が移行された核酸分子を指す(例えば図11Bを参照されたい)。記録タグの情報およびコーディングタグは、ジタグに間接的に移行させることができる(例えば、プライマー伸長)。記録タグの情報は、酵素的に移行させることもでき、化学的に移行させることもできる。ある特定の実施形態では、ジタグは、記録タグのUMI、記録タグのコンパートメントタグ、記録タグのユニバーサルプライミング部位、コーディングタグのUMI、コーディングタグのエンコーダー配列、結合サイクル特異的バーコード、コーディングタグのユニバーサルプライミング部位、またはそれらの任意の組合せを含む。
本明細書で使用される場合、「固体支持体」、「固体表面」、または「固体基板」または「基板」という用語は、共有結合性相互作用および非共有結合性相互作用またはそれらの任意の組合せを含む当技術分野において公知の任意の手段によって巨大分子(例えば、ペプチド)と直接または間接的に会合することができる、多孔質材料および非多孔質材料を含む任意の固体材料を指す。固体支持体は、2次元(例えば、平面)であってもよく、または3次元(例えば、ゲルマトリックスもしくはビーズ)であってもよい。固体支持体は、これだけに限定されないが、ビーズ、マイクロビーズ、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、フローセル、信号変換電子機器を含むバイオチップ、チャネル、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ポリマーマトリックス、ナノ粒子、またはマイクロスフェアを含む、任意の支持体表面であってよい。固体支持体用の材料としては、これだけに限定されないが、アクリルアミド、アガロース、セルロース、ニトロセルロース、ガラス、金、石英、ポリスチレン、ポリエチレン酢酸ビニル、ポリプロピレン、ポリメタクリレート、ポリエチレン、ポリエチレンオキシド、ポリシリケート、ポリカーボネート、テフロン(登録商標)、フルオロカーボン、ナイロン、シリコンゴム、ポリ酸無水物、ポリグリコール酸、ポリ乳酸(polyactic acid)、ポリオルトエステル、官能化シラン、ポリプロピルフメレート、コラーゲン、グリコサミノグリカン、ポリアミノ酸、デキストラン、またはそれらの任意の組合せが挙げられる。固体支持体は、薄膜、膜、ビン、ディッシュ、繊維、織られた繊維、チューブなどの成形ポリマー、粒子、ビーズ、マイクロスフェア、微小粒子、またはそれらの任意の組合せをさらに含む。例えば、固体表面がビーズである場合、ビーズは、これだけに限定されないが、セラミックビーズ、ポリスチレンビーズ、ポリマービーズ、メチルスチレンビーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズを含み得る。ビーズは、球状であってもよく、または不規則な形状であってもよい。ビーズのサイズは、ナノメートル、例えば100nmから、ミリメートル、例えば1mmまでにわたり得る。ある特定の実施形態では、ビーズのサイズは、約0.2ミクロンから約200ミクロンまで、または約0.5ミクロンから約5ミクロンまでにわたる。一部の実施形態では、ビーズは、直径約1、1.5、2、2.5、2.8、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、15または20μmであり得る。ある特定の実施形態では、「ビーズ」固体支持体は、個々のビーズを指すこともあり、または複数のビーズを指すこともある。本明細書で使用される場合、「基板」という用語は、機械的機能性か、生物学的機能性か、光学的機能性か、化学的機能性か、他の機能性かを問わず、機能性を提供するように材料をその上に配置することができる、機械的支持体を含む。基板は、パターン形成されていないこともあり、またはパターン形成されていることもあり、仕切られていることもあり、または仕切られていないこともある。基板上の分子は、特徴部内に配置されることもあり、または基板表面に均一に配置されることもある。
本明細書で使用される場合、「核酸分子」または「ポリヌクレオチド」という用語は、3’-5’リン酸ジエステル結合で連結されたデオキシリボヌクレオチドまたはリボヌクレオチドを含有する一本鎖または二本鎖ポリヌクレオチド、ならびにポリヌクレオチド類似体を指す。核酸分子としては、これだけに限定されないが、DNA、RNA、およびcDNAが挙げられる。ポリヌクレオチド類似体は、天然のポリヌクレオチドにおいて見出される標準のリン酸ジエステル連結以外の骨格、および任意選択で、修飾された糖部分またはリボースもしくはデオキシリボース以外の部分を有し得る。ポリヌクレオチド類似体は、標準のポリヌクレオチド塩基とワトソン・クリック塩基対合によって水素結合することが可能な塩基を含有し、ここで、類似体骨格は、当該塩基を、そのような水素結合がオリゴヌクレオチド類似体分子と標準のポリヌクレオチド内の塩基との間で配列特異的に可能になるように提示する。ポリヌクレオチド類似体の例としては、これだけに限定されないが、異種核酸(xeno nucleic acid)(XNA)、架橋核酸(BNA)、グリコール核酸(GNA)、ペプチド核酸(PNA)、γPNA、モルホリノポリヌクレオチド、ロックド核酸(LNA)、トレオース核酸(TNA)、2’-O-メチルポリヌクレオチド、2’-O-アルキルリボシル置換ポリヌクレオチド、ホスホロチオエートポリヌクレオチド、およびボロノホスフェートポリヌクレオチドが挙げられる。ポリヌクレオチド類似体は、例えば、7-デアザプリン類似体、8-ハロプリン類似体、5-ハロピリミジン類似体、または、ヒポキサンチン、ニトロアゾール、イソカルボスチリル類似体、アゾールカルボキサミド、および芳香族トリアゾール類似体を含めた、任意の塩基と対合することができるユニバーサル塩基類似体、または、親和性結合のためのビオチン部分などの追加的な機能性を有する塩基類似体を含めたプリンまたはピリミジン類似体を有し得る。
本明細書で使用される場合、「核酸配列決定」とは、核酸分子内または核酸分子の試料中のヌクレオチドの順序を決定することを意味する。
本明細書で使用される場合、「次世代シーケンシング」は、数百万~数十億の分子を並行して配列決定することを可能にするハイスループットな配列決定法を指す。次世代シーケンシング法の例としては、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、およびパイロシーケンシングが挙げられる。プライマーを固体基板および核酸分子に対する相補配列に付着させることにより、核酸分子を固体基板にプライマーを介してハイブリダイズさせることができ、次いで、固体基板上の別個の領域においてポリメラーゼを使用することによって多数のコピーを生成させて、増幅させることができる(これらの群分けは、時にはポリメラーゼコロニーまたはポロニーと称される)。したがって、配列決定プロセス中、特定の位置にあるヌクレオチドについて多数回配列決定することができる(例えば、数百回または数千回)-このカバレッジの深さは、「ディープシーケンシング」と称される。ハイスループットな核酸配列決定技術の例としては、Service(Science、311巻:1544~1546頁、2006年)によって概説されている通り、並行ビーズアレイ、合成による配列決定、ライゲーションによる配列決定、キャピラリー電気泳動、電子マイクロチップ、「バイオチップ」、マイクロアレイ、並行マイクロチップ、および単一分子アレイなどの形式を含めた、Illumina、BGI、Qiagen、Thermo-Fisher、およびRocheにより提供されるプラットフォームが挙げられる。
本明細書で使用される場合、「単一分子シーケンシング」または「第3世代シーケンシング」とは、単一分子シーケンシング装置からの読み取りがDNAの単一分子の配列決定によって生成される次世代シーケンシング法を指す。段階的な手法で配列決定するために増幅に依拠して多くのDNA分子を並行してクローニングする次世代シーケンシング法とは異なり、単一分子シーケンシングでは、DNAの単一分子を調査し、増幅または同期化の必要はない。単一分子シーケンシングは、各塩基の組み入れ後に配列決定反応を休止する(「wash-and-scan」サイクル)必要のある方法、および読み取りステップ間の停止を必要としない方法を含む。単一分子シーケンシング法の例としては、単一分子リアルタイムシーケンシング(Pacific Biosciences)、ナノポアに基づく配列決定(Oxford Nanopore)、DI(duplex interrupted)ナノポアシーケンシング、および先端顕微鏡を使用したDNAのダイレクトイメージングが挙げられる。
本明細書で使用される場合、分析物、例えば、巨大分子の「解析」とは、分析物または巨大分子の成分の全部または一部を定量化すること、特徴付けること、区別すること、またはこれらの組合せを意味する。例えば、ペプチド、ポリペプチドまたはタンパク質の解析は、ペプチドのアミノ酸配列(連続したまたは連続していない)の全部または一部を決定することを含む。巨大分子の解析は、巨大分子の成分の部分的な識別も含む。例えば、巨大分子タンパク質配列内のアミノ酸の部分的な識別により、タンパク質のアミノ酸を、可能性のあるアミノ酸のサブセットに属するものとして識別することができる。解析は、一般には、n番目のNTAAの解析で開始され、次いで、ペプチドの次のアミノ酸(すなわち、n-1、n-2、n-3など)へと進行する。これは、n番目のNTAAが切断され、それにより、ペプチドの(n-1)番目のアミノ酸がN末端アミノ酸(本明細書では、「(n-1)番目のNTAA」と称される)に変わることによって実現される。ペプチドの解析はまた、ペプチド上の翻訳後修飾の存在および頻度を決定することを含むことがあり、これは、ペプチド上の翻訳後修飾の逐次的順序に関する情報を含むこともあり、含まないこともある。ペプチドの解析はまた、ペプチド内のエピトープの存在および頻度を決定することを含むことがあり、これは、ペプチド内のエピトープの逐次的順序または位置に関する情報を含むこともあり、含まないこともある。ペプチドの解析は、異なる型の解析を組み合わせること、例えば、エピトープ情報、アミノ酸配列情報、翻訳後修飾情報、またはそれらの任意の組合せを得ることを含むこともある。
本明細書で使用される場合、「コンパートメント」という用語は、巨大分子のサブセットを巨大分子の試料から分離または隔離する物理的な領域または容積を指す。例えば、コンパートメントにより、個々の細胞を他の細胞から分離すること、または試料のプロテオームのサブセットを試料の残りのプロテオームから分離することができる。コンパートメントは、水性コンパートメント(例えば、マイクロ流体液滴)、固体コンパートメント(例えば、プレート上のピコタイターウェルまたはマイクロタイターウェル、チューブ、バイアル、ゲルビーズ)、または表面上の分離された領域であってよい。コンパートメントは、巨大分子を固定化することができる1つまたは複数のビーズを含んでよい。
本明細書で使用される場合、「コンパートメントタグ」または「コンパートメントバーコード」という用語は、1つまたは複数のコンパートメント(例えば、マイクロ流体液滴)内の、構成物(例えば、単一の細胞のプロテオーム)に関する識別情報を含む、約4塩基~約100塩基(4塩基、100塩基、およびその間の任意の整数を含む)の一本鎖または二本鎖核酸分子を指す。コンパートメントバーコードにより、試料中の巨大分子のサブセット、例えば、複数(例えば、数百万~数十億)のコンパートメントから同じ物理的コンパートメントまたはコンパートメントの群に分離されたタンパク質試料のサブセットが識別される。したがって、コンパートメントタグを使用して、同じコンパートメントタグを有する1つまたは複数のコンパートメントに由来する構成物と、異なるコンパートメントタグを有する別のコンパートメント内の構成物を、これらの構成物が一緒にプールされた後であっても区別することができる。各コンパートメント内または2つもしくはそれよりも多くのコンパートメントの群内のタンパク質および/またはペプチドを一意のコンパートメントタグで標識することにより、個々のコンパートメントまたはコンパートメントの群内の同じタンパク質、タンパク質複合体、または細胞に由来するペプチドを識別することができる。コンパートメントタグは、任意選択で片側またはその両側にスペーサー配列が隣接するバーコード、および任意選択のユニバーサルプライマーを含む。スペーサー配列は、記録タグのスペーサー配列に相補的なものであってよく、それにより、コンパートメントタグ情報の記録タグへの移行が可能になる。コンパートメントタグは、特に、コンパートメントタグが、本明細書に記載の下流のペプチド解析方法に使用される記録タグを含む実施形態に関しては、ユニバーサルプライミング部位、一意の分子識別子(それに付着したペプチドに関する識別情報をもたらす)、またはその両方も含んでよい。コンパートメントタグは、ペプチドとのカップリングのための機能的部分(例えば、アルデヒド、NHS、mTet、アルキンなど)を含んでよい。あるいは、コンパートメントタグは、コンパートメントタグと目的のペプチドのライゲーションを可能にするためのタンパク質リガーゼの認識配列を含むペプチドを含んでよい。コンパートメントは、単一のコンパートメントタグ、任意選択のUMI配列を保存する複数の同一のコンパートメントタグ、または2種またはそれよりも多くの異なるコンパートメントタグを含んでよい。ある特定の実施形態では、各コンパートメントは、一意のコンパートメントタグを含む(1対1のマッピング)。他の実施形態では、より大きなコンパートメントの集団からの多数のコンパートメントは、同じコンパートメントタグを含む(多対1のマッピング)。コンパートメントタグは、コンパートメント内の固体支持体(例えば、ビーズ)に接合していてもよく、コンパートメント自体の表面(例えば、ピコタイターウェルの表面)に接合していてもよい。あるいは、コンパートメントタグは、コンパートメント内の溶液中に遊離していてよい。
本明細書で使用される場合、「分配」という用語は、試料内の巨大分子の集団に由来する巨大分子の亜集団への一意のバーコードのランダムな割り当てを指す。ある特定の実施形態では、分配は、巨大分子をコンパートメントに区分することによって実現することができる。分配は、単一のコンパートメント内の巨大分子で構成されるものであってもよく、コンパートメントの集団に由来する多数のコンパートメント内の巨大分子で構成されるものであってもよい。
本明細書で使用される場合、「分配タグ」または「分配バーコード」とは、分配に関する識別情報を含む、約4塩基~約100塩基(4塩基、100塩基、およびその間の任意の整数を含む)の一本鎖または二本鎖核酸分子を指す。ある特定の実施形態では、巨大分子に関する分配タグは、巨大分子を同じバーコードで標識されたコンパートメント(複数可)に分配することにより生じる同一のコンパートメントタグを指す。
本明細書で使用される場合、「画分」という用語は、サイズ、疎水性、等電点、親和性などによる分画などの物理的または化学的分離方法を使用して残りの試料または細胞小器官から選別された試料内の巨大分子のサブセット(例えば、タンパク質)を指す。分離方法としては、HPLC分離、ゲル分離、アフィニティー分離、細胞分画、細胞小器官分画、組織分画などが挙げられる。流体の流れ、磁性、電流、質量、密度などの物理特性も分離のために使用することができる。
本明細書で使用される場合、「画分バーコード」という用語は、画分内の巨大分子に関する識別情報を含む、約4塩基~約100塩基(4塩基、100塩基、およびその間の任意の整数を含む)の一本鎖または二本鎖核酸分子を指す。
本明細書で使用される場合、本明細書での「多重化」または「マルチプレックスアッセイ」という用語は、少なくとも1つの異なる検出特性、例えば、蛍光特性(例えば、励起波長、発光波長、発光強度、FWHM(半値全幅のピーク高さ)もしくは蛍光寿命)または一意の核酸もしくはタンパク質配列特性を各々が有する1つより多くの捕捉用プローブコンジュゲートを使用することにより、複数の標的、例えば複数の核酸配列、の存在および/または量を同時にアッセイすることができる、アッセイまたは他の解析方法を含み得る。
III.巨大分子を含む分析物を解析するためのキット
A.製造物品およびキットの概観
本明細書に記載されるキットおよびキット成分は、分析物、例えば巨大分子、を解析するための高度に並行化された手法をもたらす。高度に多重化された分析物巨大分子結合アッセイは、次世代シーケンシングによる読み取りのために核酸分子ライブラリーに変換される。本明細書において提示されるキットおよびキット成分は、タンパク質またはペプチド配列決定に特に有用である。
好ましい実施形態では、タンパク質試料を、バーコード(例えば、試料バーコード、コンパートメントバーコード)および任意選択の一意の分子識別子を含む少なくとも1つの核酸記録タグを用いて単一分子レベルで標識する。タンパク質試料にタンパク質分解による消化を行って記録タグで標識されたペプチドの集団(例えば、数百万~数十億)を生成する。これらの記録タグで標識されたペプチドをプールし、固体支持体(例えば、多孔質ビーズ)上にランダムに固定化する。プールされ、固定化された、記録タグで標識されたペプチドを多数の連続的な結合サイクルに供し、各結合サイクルは、付随する結合性物質を識別するエンコーダー配列を含むコーディングタグで標識された複数の結合性物質(例えば、天然に存在するアミノ酸20種全てに対する結合性物質)に曝露することを含む。各結合サイクル中、結合性物質のペプチドへの結合に関する情報を、結合性物質のコーディングタグ情報を記録タグに移行させること(または記録タグ情報をコーディングタグに移行させることもしくは記録タグ情報およびコーディングタグ情報の両方を別のジタグ構築物に移行させること)によって捕捉する。結合サイクルが完了したら、アッセイされたペプチドの結合履歴を表す伸長記録タグ(または伸長コーディングタグまたはジタグ構築物)のライブラリーを生成し、これを、非常にハイスループットの次世代デジタルシーケンシング法を使用して解析することができる。記録タグに核酸バーコードを使用することにより、例えば、ペプチド配列の起源である試料、細胞、プロテオームのサブセット、またはタンパク質を識別するために、大量のペプチド配列決定データをデコンボリューションすることが可能になる。
一態様では、巨大分子を解析するための方法において使用するためのキットおよびキット成分であって、前記方法が、(a)固体支持体に接合した大分子および付随するまたは共局在する記録タグを提供するステップと;(b)前記巨大分子を、前記巨大分子に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(c)前記第1のコーディングタグの情報を前記記録タグに移行させて、一次伸長記録タグを生成するステップと;(d)前記巨大分子を、前記巨大分子に結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディングタグを含む、ステップと;(e)前記第2のコーディングタグの情報を前記一次伸長記録タグに移行させて、二次伸長記録タグを生成するステップと;(f)前記二次伸長タグを解析するステップとを含む(例えば、図2A~Dを参照されたい)、キットおよびキット成分が、本明細書で提示される。
ある特定の実施形態では、接触させるステップ(b)および(d)を逐次的に実施する、例えば、第1の結合性物質と第2の結合性物質を、別々の結合サイクル反応で巨大分子と接触させる。他の実施形態では、接触させるステップ(b)および(d)を同時に、例えば、第1の結合性物質、第2の結合性物質、および任意選択で追加的な結合性物質を含む単一の結合サイクル反応などで実施する。好ましい実施形態では、接触させるステップ(b)および(d)は、それぞれ、巨大分子を複数の結合性物質と接触させることを含む。キット成分は、これらのステップを実施するために提供される。
ある特定の実施形態では、方法は、ステップ(e)と(f)の間に、(x)第2の結合性物質を巨大分子に結合することが可能な第3の(またはより高次の)結合性物質に置き換えることにより、ステップ(d)および(e)を1回または複数回繰り返すステップであって、前記第3の(またはより高次の)結合性物質が、第3の(またはより高次の)結合性物質に関する識別情報を有する第3の(またはより高次の)コーディングタグを含む、ステップと;(y)第3の(またはより高次の)コーディングタグの情報を第2の(またはより高次の)伸長記録タグに移行させて、第3の(またはより高次の)伸長記録タグを生成するステップと;(z)第3の(またはより高次の)伸長記録タグを解析するステップとをさらに含む。キット成分は、これらのステップを実施するために提供される。
第3の(またはより高次の)結合性物質を、第1の結合性物質および第2の結合性物質とは別の結合サイクル反応で巨大分子と接触させることができる。一実施形態では、第nの結合性物質を第nの結合サイクルで分析物(例えば、巨大分子)と接触させ、情報を、第nのコーディングタグ(第nの結合性物質の)から第(n-1)の結合サイクルにおいて形成された伸長記録タグに移行させて、さらなる伸長記録タグ(第nの伸長記録タグ)を形成し、ここでのnは、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、または約50、約100、約150、約200、またはそれより大きい整数である。同様に、第(n+1)の結合性物質を第(n+1)の結合サイクルで分析物と接触させる、等々。
あるいは、第3の(またはより高次の)結合性物質を第1の結合性物質および第2の結合性物質と一緒に単一の結合サイクル反応で巨大分子と接触させることができる。この場合、結合サイクル特異的コーディングタグなどの結合サイクル特異的配列を使用することができる。例えば、コーディングタグは、結合サイクル特異的スペーサー配列を含むことができ、したがって、情報が第nのコーディングタグから第(n-1)の伸長記録タグに移行されて第nの伸長記録タグが形成された後のみに、第(n+1)の結合性物質(これは、分析物に既に結合していることもあり、していないこともある)は、第(n+1)の結合性タグの情報を第nの伸長記録タグに移行させることができることになる。
第2の態様では、(a)固体支持体に接合した巨大分子、付随する第1の記録タグおよび付随する第2の記録タグを提供するステップと;(b)前記巨大分子を、前記巨大分子に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(c)前記第1のコーディングタグの情報を前記第1の記録タグに移行させて、第1の伸長記録タグを生成するステップと;(d)前記巨大分子を、前記巨大分子に結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディングタグを含む、ステップと;(e)前記第2のコーディングタグの情報を前記第2の記録タグに移行させて、第2の伸長記録タグ生成するステップと;(f)前記第1および第2の伸長記録タグを解析するステップとを含む方法において使用するためのキットおよびキット成分が、本明細書で提示される。
ある特定の実施形態では、接触させるステップ(b)および(d)を逐次的に実施する、例えば、第1の結合性物質および第2の結合性物質を別々の結合サイクル反応で巨大分子と接触させる。他の実施形態では、接触させるステップ(b)および(d)を同時に、例えば、第1の結合性物質、第2の結合性物質、および任意選択で追加的な結合性物質を含む単一の結合サイクル反応などで実施する。キット成分は、これらのステップを実施するために提供される。
ある特定の実施形態では、ステップ(a)は、固体支持体に接合した付随する第3の(またはより高次の)記録タグを提供するステップをさらに含む。さらなる実施形態では、方法は、ステップ(e)と(f)の間に、(x)第2の結合性物質を巨大分子に結合することが可能な第3の(またはより高次の)結合性物質に置き換えることにより、ステップ(d)および(e)を1回または複数回繰り返すステップであって、前記第3の(またはより高次の)結合性物質が、第3の(またはより高次の)結合性物質に関する識別情報を有する第3の(またはより高次の)コーディングタグを含む、ステップと;(y)第3の(またはより高次の)コーディングタグの情報を第3の(またはより高次の)記録タグに移行させて、第3の(またはより高次の)伸長記録タグを生成するステップと;(z)第1の伸長記録タグ、第2の伸長記録タグおよび第3の(またはより高次の)伸長記録タグを解析するステップとをさらに含む。キット成分は、これらのステップを実施するために提供される。
第3の(またはより高次の)結合性物質を第1の結合性物質および第2の結合性物質とは別の結合サイクル反応で巨大分子と接触させることができる。あるいは、第3の(またはより高次の)結合性物質を第1の結合性物質、および第2の結合性物質と一緒に単一の結合サイクル反応で巨大分子と接触させることができる。
キットについてのある特定の実施形態では、第1のコーディングタグ、第2のコーディングタグ、および任意のより高次のコーディングタグは、各々、結合サイクル特異的配列を有する。
第3の態様では、(a)固体支持体に接合したペプチドおよび付随する記録タグを提供するステップと;(b)前記ペプチドのN末端アミノ酸(NTAA)を化学的部分で修飾して修飾NTAAを産生するステップと;(c)前記ペプチドを、前記修飾NTAAに結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(d)前記第1のコーディングタグの情報を前記記録タグに移行させて、伸長記録タグを生成するステップと;(e)前記伸長記録タグを解析するステップとを含む方法(例えば、図3を参照されたい)において使用するためのキットおよびキット成分が、本明細書で提示される。
ある特定の実施形態では、ステップ(c)が、前記ペプチドを、前記第2の(またはより高次の)結合性物質に関する識別情報を有する第2の(またはより高次の)コーディングタグを含む第2の(またはより高次の)結合性物質と接触させるであって、前記第2の(またはより高次の)結合性物質が、ステップ(b)の前記修飾されたNTAA以外の修飾されたNTAAに結合することが可能である、ステップをさらに含む。さらなる実施形態では、ペプチドの第2の(またはより高次の)結合性物質との接触を、ペプチドの第1の結合性物質との接触後に逐次的に行う、例えば、第1の結合性物質および第2の(またはより高次の)結合性物質を別々の結合サイクル反応でペプチドと接触させる。他の実施形態では、ペプチドの第2の(またはより高次の)結合性物質との接触を、ペプチドの第1の結合性物質との接触と同時に、例えば、第1の結合性物質および第2の(またはより高次の)結合性物質)を含む単一の結合サイクル反応などで行う。キット成分は、これらのステップを実施するために提供される。
ある特定の実施形態では、化学的部分を化学反応または酵素的反応によってNTAAに付加させる。
ある特定の実施形態では、NTAAを修飾するために使用される化学的部分は、フェニルチオカルバモイル(PTC)、ジニトロフェノール(DNP)部分;スルホニルオキシニトロフェニル(SNP)部分、ダンシル部分;7-メトキシクマリン部分;チオアシル部分;チオアセチル部分;アセチル部分;グアニジニル部分;またはチオベンジル部分である。
化学的部分は、化学薬剤を使用してNTAAに付加させることができる。ある特定の実施形態では、NTAAをPTC部分で修飾するための化学薬剤は、フェニルイソチオシアネートまたはその誘導体であり;NTAAをDNP部分で修飾するための化学薬剤は、2,4-ジニトロベンゼンスルホン酸(DNBS)、またはハロゲン化アリール、例えば1-フルオロ-2,4-ジニトロベンゼン(DNFB)であり;NTAAをスルホニルオキシニトロフェニル(SNP)部分で修飾するための化学薬剤は、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)であり;NTAAをダンシル基で修飾するための化学薬剤は、ダンシルクロリドなどのスルホニルクロリドであり;NTAAを7-メトキシクマリン部分で修飾するための化学薬剤は、7-メトキシクマリン酢酸(MCA)であり;NTAAをチオアシル部分で修飾するための化学薬剤は、チオアシル化試薬であり;NTAAをチオアセチル部分で修飾するための化学薬剤は、チオアセチル化試薬であり;NTAAをアセチル部分で修飾するための化学薬剤は、アセチル化試薬(例えば、無水酢酸)であり;NTAAをグアニジニル(アミジニル)部分で修飾するための化学薬剤は、グアニジニル化試薬であり、またはNTAAをチオベンジル部分で修飾するための化学薬剤は、チオベンジル化試薬である。これらの化学的部分および化学試薬のいずれかが、本明細書に開示されているキットの成分として提供され得る。
第4の態様では、本開示は、(a)固体支持体に接合したペプチドおよび付随する記録タグを提供するステップと;(b)前記ペプチドのN末端アミノ酸(NTAA)を化学的部分で修飾して修飾NTAAを産生するステップと;(c)前記ペプチドを、前記修飾NTAAに結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(d)前記第1のコーディングタグの情報を前記記録タグに移行させて、第1の伸長記録タグを生成するステップと;(e)前記修飾NTAAを除去して新しいNTAAを露出させるステップと;(f)前記ペプチドの新しいNTAAを化学的部分で修飾して新しく修飾されたNTAAを産生するステップと;(g)前記ペプチドを、前記新しく修飾されたNTAAに結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディングタグを含む、ステップと;(h)前記第2のコーディングタグの情報を前記第1の伸長記録タグに移行させて、第2の伸長記録タグを生成するステップと;(i)前記第2の伸長記録タグを解析するステップとを含む方法において使用するためのキットおよびキット成分を提供する。
ある特定の実施形態では、接触させるステップ(c)および(g)を逐次的に実施する、例えば、第1の結合性物質および第2の結合性物質を別々の結合サイクル反応でペプチドと接触させる。キット成分は、これらのステップを実施するために提供される。
ある特定の実施形態では、方法は、ステップ(h)と(i)の間に、(x)第2の結合性物質を修飾されたNTAAに結合することが可能な第3の(またはより高次の)結合性物質に置き換えることにより、ステップ(e)、(f)および(g)を1回または複数回繰り返すステップであって、前記第3の(またはより高次の)結合性物質が、第3の(またはより高次の)結合性物質に関する識別情報を有する第3の(またはより高次の)コーディングタグを含む、ステップと;(y)第3の(またはより高次の)コーディングタグの情報を第2の(またはより高次の)伸長記録タグに移行させて、第3の(またはより高次の)伸長記録タグを生成するステップと;(z)第3の(またはより高次の)伸長記録タグを解析するステップとをさらに含む。キット成分は、これらのステップを実施するために提供される。
ある特定の実施形態では、化学的部分を化学反応または酵素的反応によってNTAAに付加させる。
ある特定の実施形態では、化学的部分は、フェニルチオカルバモイル(PTC)、ジニトロフェノール(DNP)部分;スルホニルオキシニトロフェニル(SNP)部分、ダンシル部分;7-メトキシクマリン部分;チオアシル部分;チオアセチル部分;アセチル部分;グアニル部分;またはチオベンジル部分である。
化学的部分は、化学薬剤を使用してNTAAに付加することができる。ある特定の実施形態では、NTAAをPTC部分で修飾するための化学薬剤は、フェニルイソチオシアネートまたはその誘導体である;NTAAをDNP部分で修飾するための化学薬剤は、2,4-ジニトロベンゼンスルホン酸(DNBS)または1-フルオロ-2,4-ジニトロベンゼン(DNFB)などのハロゲン化アリールである;NTAAをスルホニルオキシニトロフェニル(SNP)部分で修飾するための化学薬剤は、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)である;NTAAをダンシル基で修飾するための化学薬剤は、ダンシルクロリドなどのスルホニルクロリドである;NTAAを7-メトキシクマリン部分で修飾するための化学試薬は、7-メトキシクマリン酢酸(MCA)である;NTAAをチオアシル部分で修飾するための化学薬剤は、チオアシル化試薬である;NTAAをチオアセチル部分で修飾するための化学薬剤は、チオアセチル化試薬である;NTAAをアセチル部分で修飾するための化学薬剤は、アセチル化剤(例えば、無水酢酸)である;NTAAをグアニル部分で修飾するための化学薬剤は、グアニジニル化試薬である、またはNTAAをチオベンジル部分で修飾するための化学薬剤は、チオベンジル化試薬である。これらの化学的部分および化学薬剤のいずれかが、本明細書に開示されているキットの成分として提供され得る。
第5の態様では、ポリペプチドを解析するための方法において使用するためのキットおよびキット成分であって、前記方法が、(a)固体支持体に接合したペプチドおよび付随する記録タグを提供するステップと;(b)前記ペプチドを、前記ペプチドのN末端アミノ酸(NTAA)に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(c)前記第1のコーディングタグの情報を前記記録タグに移行させて、伸長記録タグを生成するステップと;(d)前記伸長記録タグを解析するステップとを含む、キットおよびキット成分が提供される。
ある特定の実施形態では、ステップ(b)が、前記ペプチドを、前記第2の(またはより高次の)結合性物質に関する識別情報を有する第2の(またはより高次の)コーディングタグを含む第2の(またはより高次の)結合性物質と接触させるステップであって、前記第2の(またはより高次の)結合性物質が、前記ペプチドの前記NTAA以外のNTAAに結合することが可能である、ステップをさらに含む。さらなる実施形態では、ペプチドの第2の(またはより高次の)結合性物質との接触を、ペプチドの第1の結合性物質との接触後に逐次的に行う、例えば、第1の結合性物質および第2の(またはより高次の)結合性物質を別々の結合サイクル反応でペプチドと接触させる。他の実施形態では、ペプチドの第2の(またはより高次の)結合性物質との接触を、ペプチドを第1の結合性物質と接触させるのと同時に、例えば、第1の結合性物質および第2の(またはより高次の)結合性物質を含む単一の結合サイクル反応などで行う。
第6の態様では、(a)固体支持体に接合したペプチドおよび付随する記録タグを提供するステップと;(b)前記ペプチドを、前記ペプチドのN末端アミノ酸(NTAA)に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(c)前記第1のコーディングタグの情報を前記記録タグに移行させて、第1の伸長記録タグを生成するステップと;(d)前記NTAAを除去して前記ペプチドの新しいNTAAを露出させるステップと;(e)前記ペプチドを、前記新しいNTAAに結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディングタグを含む、ステップと;(f)前記第2のコーディングタグの情報を前記第1の伸長記録タグに移行させて、第2の伸長記録タグを生成するステップと;(g)前記第2の伸長記録タグを解析するステップとを含む方法において使用するためのキットおよびキット成分が提供される。
ある特定の実施形態では、方法は、ステップ(f)と(g)の間に、(x)第2の結合性物質を巨大分子に結合することが可能な第3の(またはより高次の)結合性物質に置き換えることにより、ステップ(d)、(e)および(f)を1回または複数回繰り返すステップであって、前記第3の(またはより高次の)結合性物質が、第3の(またはより高次の)結合性物質に関する識別情報を有する第3の(またはより高次の)コーディングタグを含む、ステップと;(y)第3の(またはより高次の)コーディングタグの情報を第2の(またはより高次の)伸長記録タグに移行させて第3の(またはより高次の)伸長記録タグを生成するステップとをさらに含み、ステップ(g)において第3の(またはより高次の)伸長記録タグを解析する。キット成分は、これらのステップを実施するために提供される。
ある特定の実施形態では、接触させるステップ(b)および(e)を逐次的に実施する、例えば、第1の結合性物質および第2の結合性物質を別々の結合サイクル反応でペプチドと接触させる。
本明細書において提示される実施形態のいずれかでは、方法は、複数の巨大分子を並行して解析することを含む。好ましい実施形態では、方法は、複数のペプチドを並行して解析することを含む。
本明細書において提示される実施形態のいずれかでは、巨大分子(またはペプチド)を結合性物質と接触させるステップは、巨大分子(またはペプチド)を複数の結合性物質と接触させることを含む。
本明細書において提示される実施形態のいずれかでは、巨大分子は、タンパク質、ポリペプチド、またはペプチドであってよい。さらなる実施形態では、ペプチドは、生体試料に由来するタンパク質またはポリペプチドを断片化することによって得ることができる。
本明細書において提示される実施形態のいずれかでは、巨大分子は、炭水化物、脂質、核酸、もしくは大環状分子であり得るか、またはそれを含み得る。
本明細書において提示される実施形態のいずれかでは、記録タグは、DNA分子、修飾塩基を有するDNA分子、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子(Dragulescu-Andrasiら、2006年、J. Am. Chem. Soc.、128巻:10258~10267頁)、GNA分子、またはそれらの任意の組合せであってよい。
本明細書において提示される実施形態のいずれかでは、記録タグは、ユニバーサルプライミング部位を含んでよい。さらなる実施形態では、ユニバーサルプライミング部位は、増幅、ライゲーション、配列決定、またはこれらの組合せのためのプライミング部位を含む。
本明細書において提示される実施形態のいずれかでは、記録タグは、一意の分子識別子、コンパートメントタグ、分配バーコード、試料バーコード、画分バーコード、スペーサー配列、またはそれらの任意の組合せを含んでよい。
本明細書において提示される実施形態のいずれかでは、コーディングタグは、一意の分子識別子(UMI)、エンコーダー配列、結合サイクル特異的配列、スペーサー配列、またはそれらの任意の組合せを含んでよい。
本明細書において提示される実施形態のいずれかでは、コーディングタグ内の結合サイクル特異的配列は、結合サイクル特異的スペーサー配列であってよい。
ある特定の実施形態では、結合サイクル特異的配列は、エンコーダー配列とは別のバーコードとしてコードされる。他の実施形態では、エンコーダー配列および結合サイクル特異的配列は、結合性物質に対しておよび各結合サイクルに対して一意である単一のバーコードに記載される。
ある特定の実施形態では、スペーサー配列は、多数の結合サイクルからの結合性物質の間で共有される共通の結合サイクル配列を含む。他の実施形態では、スペーサー配列は、同じ結合サイクルからの結合性物質の間で共有される一意の結合サイクル配列を含む。
本明細書において提示される実施形態のいずれかでは、記録タグは、バーコードを含んでよい。
本明細書において提示される実施形態のいずれかでは、巨大分子および付随する記録タグ(複数可)は、固体支持体に共有結合により接合していてよい。
本明細書において提示される実施形態のいずれかでは、固体支持体は、ビーズ、多孔質ビーズ、多孔質マトリックス、拡張可能なゲルビーズまたはマトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアであってよい。
本明細書において提示される実施形態のいずれかでは、固体支持体は、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズであってよい。
本明細書において提示される実施形態のいずれかでは、複数の巨大分子および付随する記録タグを固体支持体に接合させることができる。さらなる実施形態では、複数の分析物(例えば、巨大分子)の間に固体支持体上で平均距離>50nm、>100nm、または>200nmの間隔をあける。
本明細書において提示される実施形態のいずれかでは、結合性物質は、ポリペプチドまたはタンパク質であり得る。さらなる実施形態では、結合性物質は、改変もしくはバリアントアミノペプチダーゼ、改変もしくはバリアントアミノアシルtRNA合成酵素、改変もしくはバリアントアンチカリン、または改変もしくはバリアントClpSである。
本明細書において提示される実施形態のいずれかでは、結合性物質は、巨大分子に選択的に結合することが可能なものであってよい。
本明細書において提示される実施形態のいずれかでは、コーディングタグは、DNA分子、修飾塩基を有するDNA分子、RNA分子、BNA分子、XNA分子、LNA分子、GNA分子、PNA分子、γPNA分子、またはこれらの組合せであってよい。
本明細書において提示される実施形態のいずれかでは、結合性物質とコーディングタグは、リンカーによって接合されていてよい。
本明細書において提示される実施形態のいずれかでは、結合性物質とコーディングタグを、SpyTag/SpyCatcher、SpyTag-KTag/SpyLigase(この場合、接合される2つの部分がSpyTag/KTag対を有し、SpyLigaseがSpyTagをKTagに接合させ、かくして2つの部分が接合される)、ソルターゼ、および/またはSnoopTag/SnoopCatcherペプチド-タンパク質対(Zakeri, et al., 2012, Proc Natl Acad Sci U S A 109(12): E690-697;Veggianiet al., 2016, Proc. Natl. Acad. Sci. USA 113:1202-1207、これらの各々は、その全体が参照により組み込まれる)によって接合させることができる。
SpyLigaseは、不可逆的ペプチド間相互作用を生じさせるように2つのペプチドタグを互いにライゲーションするタンパク質ドメインである。その全体が参照により組み込まれる、Fierer et al., (2014), "SpyLigase peptide-peptide ligationpolymerizes affibodies to enhance magnetic cancer cell capture," PNAS111(13): E1176-E1181。
ソルターゼを使用して、結合性物質とコーディングタグを接合させることもできる。例えば、ソルターゼは、LPXTG Tag(ここで、Xは、任意のアミノ酸を表す)をGGGなどのポリG部分に選択的に接合させることができる。例えば、ActiveMotif、San Diegoからの、または米国特許第9,267,127(B2)号において開示されているような、ソルターゼA5を使用することができる。別の例では、Staphylococcus aureus(S.aureus)ソルターゼAのアミノ酸配列と少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%、または100%同一であるアミノ酸配列を含むソルターゼを使用することができる。
本明細書において提示される実施形態のいずれかでは、コーディングタグの情報の記録タグへの移行は、DNAリガーゼ、例えば一本鎖DNA(ssDNA)リガーゼなどの、リガーゼにより媒介される。一態様では、ライゲーションされる2つの一本鎖ポリヌクレオチドのうちの一方の5’末端をブロッキングしてその5’末端におけるライゲーションを防止する。前述の実施形態のいずれかでは、ssDNAリガーゼは、ThermusバクテリオファージRNAリガーゼ、例えば、バクテリオファージTS2126 RNAリガーゼ(例えば、CircLigase(商標)およびCircLigase II(商標))またはそのバリアント、ホモログ、変異体もしくは修飾バージョン、あるいは古細菌RNAリガーゼ、例えば、Methanobacterium thermoautotrophicum RNAリガーゼ1またはそのバリアント、ホモログ、変異体もしくは修飾バージョンであり得る。他の態様では、ssDNAリガーゼは、T4 RNAリガーゼ、例えば、T4 RNAリガーゼ2、T4 RNAリガーゼ2切断型、T4 RNAリガーゼ2切断型KQ、またはT4 RNAリガーゼ2切断型K227Qなどの、RNAリガーゼである。一態様では、PEG4000などのクラウディング剤を使用することにより、ライゲーション反応を最適化することができる。ライゲーションされるDNA末端を、相補的DNA配列上で互いに隣接してアニーリングする場合、T4 DNAリガーゼおよびAmpligase(登録商標)DNAリガーゼも使用することができる。
あるいは、コーディングタグの情報の記録タグへの移行は、DNAポリメラーゼまたは化学的ライゲーションにより媒介される。一部の実施形態では、化学的ライゲーションは、チオール-マレイミドカップリングなどのマイケル付加を含む。一部の実施形態では、化学的ライゲーションは、銅により触媒されるアジド-アルキン付加環化を含む。一部の実施形態では、化学的ライゲーションは、アミド結合形成を含む。一部の実施形態では、アミド結合形成は、ペプチドカップリング剤の存在下、NHSエステルとアミン間またはカルボン酸とアミン間で進行する。一部の実施形態では、化学的ライゲーションは、アミンおよびアルデヒドによるイミン形成、続いてのシアノ水素化ホウ素ナトリウムを使用する還元を含む。一部の実施形態では、化学的ライゲーションは、チオレンカップリングを含む。一部の実施形態では、化学的ライゲーションは、ネイティブな化学的ライゲーション(例えば、チオエステル(チオールエステル)とシステイン)を含む。一部の実施形態では、化学的ライゲーションのための試薬は、歪みアルキン(例えば、シクロオクチン)およびアジドを含む。一部の実施形態では、化学的ライゲーションは、無痕跡型および非無痕跡型シュタウディンガーライゲーションを含む。
本明細書において提示される実施形態のいずれかでは、伸長記録タグを解析するステップは、核酸配列決定を含んでよい。さらなる実施形態では、核酸配列決定は、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである。他の実施形態では、核酸配列決定は、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、ナノギャップトンネリングシーケンシング、または先端顕微鏡を使用したDNAのダイレクトイメージングである。
本明細書において提示される実施形態のいずれかでは、伸長記録タグを解析前に増幅させることができる。
本明細書において提示される実施形態のいずれかでは、伸長記録タグに含有されるコーディングタグ情報の順序が、結合性物質による巨大分子への結合の順序に関する情報、したがって、結合性物質によって検出される分析物の配列を提供することができる。
本明細書において提示される実施形態のいずれかでは、伸長記録タグに含有される特定のコーディングタグ情報(例えば、エンコーダー配列)の頻度は、特定の結合性物質による巨大分子への結合の頻度、したがって、結合性物質によって検出される巨大分子内の分析物の頻度に関する情報を提供することができる。
本明細書に開示されている実施形態のいずれかでは、多数の巨大分子(例えば、タンパク質)試料であって、各試料内の巨大分子の集団が試料特異的バーコードを含む記録タグで標識されている試料をプールすることができる。そのような巨大分子試料のプールを単一の反応チューブ内での結合サイクルに供することができる。
本明細書において提示される実施形態のいずれかでは、複数の巨大分子を表す複数の伸長記録タグを並行して解析することができる。
本明細書において提示される実施形態のいずれかでは、複数の巨大分子を表す複数の伸長記録タグを多重化アッセイで解析することができる。
本明細書において提示される実施形態のいずれかでは、複数の伸長記録タグに対して、解析前に標的濃縮アッセイを行うことができる。
本明細書において提示される実施形態のいずれかでは、複数の伸長記録タグに対して、解析前にサブトラクションアッセイを行うことができる。
本明細書において提示される実施形態のいずれかでは、複数の伸長記録タグに対して、極めて豊富な種を減少させるために解析前に正規化アッセイを行うことができる。
本明細書において提示される実施形態のいずれかでは、NTAAを、改変アミノペプチダーゼ、改変アミノ酸tRNA合成酵素、穏やかなエドマン分解、エドマナーゼ(Edmanase)酵素、または無水TFAによって除去することができる。
本明細書において提示される実施形態のいずれかでは、少なくとも1つの結合性物質は、末端アミノ酸残基に結合し得る。ある特定の実施形態では、末端アミノ酸残基は、N末端アミノ酸またはC末端アミノ酸である。
本明細書に記載の実施形態のいずれかでは、少なくとも1つの結合性物質は、翻訳後修飾されたアミノ酸に結合し得る。
一部の実施形態では、小分子-タンパク質結合マトリックスが本明細書において提示される。一部の実施形態では、これは、10の多様性の小分子ライブラリーを固定化ヒトプロテオーム全体(2×10)とインキュベートする場合であっても、かなり大きいマトリックスであり得る。マトリックスサイズは、2×1013の異なる測定で、10×2×10である。一部の実施形態では、洗浄ステップ後であっても、高親和性結合相互作用(<低nM)を上記の手法で容易に記録することができるが、中等度~低親和性相互作用は、失われる可能性が高いであろう。一部の実施形態では、低親和性相互作用(約μM)を記録するには、結合および同時情報移行が起こる均一反応が望ましい。一部の実施形態では、このことにより、重合またはライゲーションステップが、結合の占有時間と比較して速いカイネティクスを有する必要があることが求められる。重合の時間尺度は、秒のオーダーであり、μM濃度での結合の占有時間(約10~100秒)に適合する。ライゲーションの時間尺度も秒のオーダーであり得る(例えば、速い化学的ライゲーションについて、例えば、Abe et al., (2008), "Rapid DNA chemical ligation foramplification of RNA and DNA signal," Bioconjug Chem 19(1): 327-333を参照されたい)。一部の実施形態では、特に、低親和性相互作用を解析または検出するために、リガーゼまたはポリメラーゼを1つまたは複数の結合物質とともに反応ミックスに含めることができる。あるいは、リガーゼまたはポリメラーゼを物質部位に、記録タグ内の部位とのDNAタグ相互作用によるハイブリダイゼーションを使用して、共局在させることができる。結合ステップと「書き込む」(すなわち、情報移行)ステップを組み合わせることを行うことにより、低親和性相互作用を「記録する」ことがより容易になる。
一実施形態では、タンパク質標的またはペプチドもしくは小分子リガンド(またはペプチド模倣物リガンド、例えば、ペプトイドリガンド、β-ペプチドリガンドもしくはD-ペプチドペプチド模倣物リガンド、または多糖リガンド)のいずれかへのDNAタグの付着は、個別に産生されたタンパク質標的または個別に産生された小分子/ペプチド標的へのバーコード付きDNAタグの個別の付着によって果たすことができる。別の実施形態では、タンパク質へのDNAタグの付着は、DNAバーコードがmRNA配列に含有されている場合、リボソームまたはmRNA/cDNAディスプレイによって行われる。mRNA/cDNAディスプレイの過程で、in vitro翻訳反応を使用してmRNAがタンパク質に翻訳される。mRNAは、リンカーを介してmRNAの3’末端に付着しているピューロマイシン分子を有するように構成される(例えば、Liu et al., (2000), "Optimized synthesis of RNA-protein fusionsfor in vitro protein selection," In Methods in Enzymology, Academic Press,318:268-293を参照されたい)。チロシル-tRNAの類似体であるピューロマイシンは、mRNA転写物の3’末端に係留され、リボソームが3’末端に接近すると成長ポリペプチド鎖に組み込まれ、翻訳を停止させ、RNA/DNA転写物および付随するバーコードをその対応する翻訳タンパク質に連結させることにより有効にmRNA-タンパク質融合体を創出する(例えば、米国特許出願公開第2012/0258871(A1)号、米国特許出願公開第2017/0107566(A1)号、またはKozlovet al., (2012), PLoS One 7(6): e37441において開示されている通りであり、これらの参考文献の全てが参照により本明細書に組み込まれる)。
一実施形態では、下流の情報移行のためにバーコード配列および付随するDNA記録タグ機能的エレメント、例えば、ユニバーサルプライマー部位およびスペーサー配列を操作して、mRNA転写物の3’末端にする。一実施形態では、一意の制限部位も、DNAバーコードおよびDNA記録タグ機能的エレメントのすぐ5’に含める。in vitro翻訳およびmRNA-タンパク質融合体の創出後、mRNAをcDNAに逆翻訳する。cDNAを外因性オリゴのアニーリングおよび制限酵素とのインキュベーションによってバーコードの5’側で切断する。これにより、後続のアッセイのために記録タグとして役立つDNAタグが遊離される(例えば、図50を参照されたい)。
別の態様では、単一サイクルでの次世代タンパク質アッセイが本明細書において開示される。一部の実施形態では、アッセイは、NTAA結合物質(例えば、N末端におけるモノ-、ジ-またはトリ-アミノ酸)などのアミノ酸結合物質を使用する。
ボトムアップ質量分析(MS)による典型的なタンパク質識別は、各タンパク質からペプチド(約20~40ペプチド)のセットを生成するために、トリプシン消化などのプロテアーゼ消化ステップを使用する。単一ペプチド種をLC-MS/MSで解析して、全タンパク質種の識別をもたらすことができる。参照により本明細書に組み込まれるWO/2015/042506もまた、単一分子レベルでのタンパク質識別方法を開示している。WO/2015/042506の試薬および方法ステップを本開示と組み合わせることができる。
単一分子レベルでのタンパク質識別のための代替手法は、タンパク質分子を数百万~数十億の区分(例えば、コンパートメントバーコードを含む区分)に分配し、分配バーコードを有する試料中の全ての分子にバーコードを付与する手法である。一態様では、所与のコンパートメント(例えば、個々のビーズ表面)について、そのコンパートメント内の全ての分子を同じバーコードで標識する。別の態様では、区分は、同じバーコードを共有する全てのコンパートメントを含む。例えば、10個のビーズ上に10のバーコードがある場合、ビーズの一部は、同じバーコードを有することになる。この例では、個々のビーズ各々がコンパートメントであり得、同じバーコードを共有するコンパートメントは、バーコードの差異に基づいて他の区分と区別することができる区分を形成する。好ましい実施形態では、タンパク質を先ず変性させ、アルキル化し、次いで、ポリペプチド全体にわたって「クリック」ケミストリーハンドルで標識する。「クリック」ハンドルの付着後、クリックケミストリーを使用してユニバーサルDNAプライマーを「クリック」ハンドルに付着させる。このDNAプライマーは、DNA記録タグの最初の部分となる。ポリペプチドを過剰なDNAプライマーから精製する。ポリペプチドをDNAプライマーで標識した後、コンパートメントバーコードとポリペプチド上のものに相補的なユニバーサルプライマーとを有するDNAバーコード付きビーズの集団にポリペプチドを曝露する(例えば、図51を参照されたい)。個々のポリペプチド分子は、特定のビーズと相互作用し、基本的には、ユニバーサルプライマー配列によるハイブリダイゼーションによってビーズ上で「ジッパーを閉じる」。1つより多くの分子を任意の所与のビーズに付随させることができるが、理想的には、分子の数を最小に保つ。ポリペプチドをビーズ上に「ジッパー留めした」ら、プライマー伸長またはライゲーション反応を使用して、ビーズのバーコード情報を、ポリペプチドに付着している多数のユニバーサルプライマーに移行させる。このようにして、ポリペプチドは、今や、バーコードが付与された「コンパートメント」であり、これがプロテオームの分配の基礎をなす。ポリペプチド分子上の伸長DNAタグは、アッセイにおける後続のステップのための記録タグとなる。次に、ビーズ上のポリペプチド(最初に除去され得る)を、プロテアーゼ消化ステップ(例えば、トリプシン消化)を使用して断片化する。消化後、記録タグ標識ペプチドをビーズから溶出させる。標識ペプチドを基板に単一分子密度で固定化する(例えば、ペプチド間の距離は、固定化されたペプチド間の平均距離が主として分子内結合事象のみに情報移行を制限するような距離である)。間隔をあける例示的な距離は、約20nmに等しいもしくはそれより長い、約50nmに等しいもしくはそれより長い、約100nmに等しいもしくはそれより長い、約150nmに等しいもしくはそれより長い、約200nmに等しいもしくはそれより長い、約250nmに等しいもしくはそれより長い、約300nmに等しいもしくはそれより長い、約350nmに等しいもしくはそれより長い、約400nmに等しいもしくはそれより長い、約450nmに等しいもしくはそれより長い、約500nmに等しいもしくはそれより長い、約550nmに等しいもしくはそれより長い、約600nmに等しいもしくはそれより長い、約650nmに等しいもしくはそれより長い、約700nmに等しいもしくはそれより長い、約750nmに等しいもしくはそれより長い、約800nmに等しいもしくはそれより長い、約850nmに等しいもしくはそれより長い、約900nmに等しいもしくはそれより長い、約950nmに等しいもしくはそれより長い、または約1μmに等しいもしくはそれより長いこともある。
一実施形態では、ペプチドは、トリプシン消化から生じる。ヒトプロテオームについては、1タンパク質当たり約20~30トリプシンペプチドで、およそ500,000の異なるトリプシンペプチドがある。試料中のタンパク質分子を定量化し、特徴付けるために、タンパク質を、分配バーコード付き記録タグで標識されたペプチドのセットに変換する。所与の分子に由来するトリプシンペプチドへの結合からの全ての情報を分配バーコードにより分子(または分子の小サブセット)にマッピングし戻すことができる。好ましい実施形態では、結合物質を識別するバーコード情報で構成されるDNAコーディングタグで標識された、N末端ジペプチドおよび/またはトリペプチド(N末端ジアミノ/トリアミノ酸とも称される)結合性物質を、固定化されたペプチドと共にインキュベートする(その結果、N末端が遊離する)。結合時または結合後、ポリメラーゼ伸長またはライゲーションによってコーディングタグから記録タグへ(または逆に記録タグからコーディングタグへ)情報を移行させる。このプロセスを複数サイクル繰り返して、交差反応性結合事象からのエラーを低減させることができる。N末端ジペプチド結合物質の完全なセットは、異なる識別バーコードで各々が標識されている400の異なる結合物質のセットに相当する。単一の結合サイクルで、この分配概念を使用してヒトプロテオーム全体を識別するには十分過ぎるはずである。例えば、所与のタンパク質分子からの1セット20個のペプチドのうちの5個のトリプシンペプチドしか検出されない場合であっても、トリプシン消化情報と組み合わせたN末端ジアミノ酸情報で、そのタンパク質を一意に識別するには十分過ぎる。
最初に分配バーコード付きビーズにポリペプチドを固定化し、分析物基板に再固定化する代わりに、変性ペプチドを共有結合性または非共有結合性相互作用によってDNAバーコード付きビーズに直接固定化することができ、この場合、全ビーズを同一のバーコード付き記録タグの集団で被覆する(例えば、図52を参照されたい)。ポリペプチドは、ビーズ上で消化されてトリプシン消化物などの断片になる。プロテアーゼ消化後に続いて、バーコード付きビーズ上のポリペプチドの露出したN末端へのN末端ジペプチド結合物質の結合が起こる。情報移行が、ジペプチド結合物質上のコーディングタグと、ビーズに付着している記録タグのいずれかとの間で起こる。以前の「間隔の遠い」ペプチドモデル(例えば、図51を参照されたい)とは異なり、ペプチド複合体の間隔を、結合サイクルを1回しか実施しないのであれば、以前の実施形態でのように離す必要はない。結合および情報移行後、得られた伸長記録タグを、線形増幅またはPCRを使用してビーズ表面から直接溶液に増幅させることができる。
一部の実施形態では、上文にて開示のアッセイは、コーディングタグと記録タグの間の情報の周期的移行を必要としない。したがって、これらのアッセイを単一結合サイクルで行うことができる。
上述の実施形態の特徴を以下の節でさらに詳細に提示する。
B.巨大分子
一態様では、本開示は、巨大分子の解析に関する。巨大分子は、より小さなサブユニットで構成される大きな分子である。ある特定の実施形態では、巨大分子は、タンパク質、タンパク質複合体、ポリペプチド、ペプチド、核酸分子、炭水化物、脂質、大環状分子、またはキメラ巨大分子である。
本明細書に開示されているキットおよび方法に従って解析される巨大分子(例えば、タンパク質、ポリペプチド、ペプチド)は、これだけに限定されないが、細胞(初代細胞および培養細胞株の両方)、細胞溶解物または抽出物、エキソソームを含む細胞小器官または小胞、組織および組織抽出物などの生体試料;生検材料;糞便物質;事実上あらゆる生物体の体液(例えば、血液、全血、血清、血漿、尿、リンパ液、胆汁、脳脊髄液、間質液、眼房水または硝子体液、初乳、痰、羊水、唾液、肛門および膣分泌物、汗および精液、漏出液、滲出液(例えば、膿瘍もしくは任意の他の感染もしくは炎症の部位から得られる流体)または関節(正常な関節もしくは関節リウマチ、変形性関節症、痛風もしくは化膿性関節炎などの疾患に罹患している関節)から得られる流体)(マイクロバイオームを含有する試料を含む、哺乳動物由来試料であることが好ましく、マイクロバイオームを含有する試料を含む、ヒト由来試料であることが特に好ましい);環境試料(例えば、空気、農業、水および土壌試料など);微生物バイオフィルムおよび/または微生物群、ならびに微生物の胞子に由来する試料を含む、微生物試料;細胞外液、細胞培養物からの細胞外上清、細菌内の封入体、ミトコンドリア区画を含む細胞区画、および細胞ペリプラズムを含む、研究試料を含む、適切な供給源または試料から得ることができる。
ある特定の実施形態では、巨大分子は、タンパク質、タンパク質複合体、ポリペプチド、またはペプチドである。ペプチド、ポリペプチド、またはタンパク質のアミノ酸配列情報および翻訳後修飾を、次世代シーケンシング法によって解析することができる核酸コードライブラリーに変換する。ペプチドは、L-アミノ酸、D-アミノ酸、またはその両方を含んでよい。ペプチド、ポリペプチド、タンパク質、またはタンパク質複合体は、標準の、天然に存在するアミノ酸、修飾されたアミノ酸(例えば、翻訳後修飾)、アミノ酸類似体、アミノ酸模倣物、またはそれらの任意の組合せを含んでよい。一部の実施形態では、ペプチド、ポリペプチド、またはタンパク質は、天然に存在するもの、合成的に作製されたもの、または組換えによって発現させたものである。上述のペプチド実施形態のいずれかでは、ペプチド、ポリペプチド、タンパク質、またはタンパク質複合体は、翻訳後修飾をさらに含んでよい。
標準の、天然に存在するアミノ酸としては、アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リシン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、トレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)が挙げられる。非標準アミノ酸としては、セレノシステイン、ピロリジン、およびN-ホルミルメチオニン、β-アミノ酸、ホモアミノ酸、プロリンおよびピルビン酸誘導体、3-置換アラニン誘導体、グリシン誘導体、環置換フェニルアラニンおよびチロシン誘導体、直鎖コアアミノ酸、およびN-メチルアミノ酸が挙げられる。
ペプチド、ポリペプチド、またはタンパク質の翻訳後修飾(PTM)は、共有結合性修飾であっても酵素的修飾であってもよい。翻訳後修飾の例としては、これだけに限定されないが、アシル化、アセチル化、アルキル化(メチル化を含む)、ビオチン化、ブチリル化、カルバミル化、カルボニル化、脱アミド化、脱イミノ化、ジフタミド形成、ジスルフィド架橋形成、エリミニル化、フラビン付着、ホルミル化、ガンマ-カルボキシル化、グルタミル化、グリシル化、グリコシル化(例えば、N結合、O結合、C結合、ホスホグリコシル化)、グリコシルホスファチジルイノシトール付加(glypiation)、ヘムC付着、ヒドロキシル化、ハイプシン形成、ヨウ素化、イソプレニル化、脂質付加、リポイル化、マロニル化、メチル化、ミリストイル化、酸化、パルミトイル化、ペグ化、ホスホパンテテイニル化、リン酸化、プレニル化、プロピオニル化、レチニリデンシッフ塩基形成、S-グルタチオン化、S-ニトロシル化、S-スルフェニル化、セレン化、サクシニル化、スルフィン化、ユビキチン化、およびC末端アミド化が挙げられる。翻訳後修飾は、ペプチドのアミノ末端および/またはカルボキシル末端、ポリペプチド、またはタンパク質の修飾を含む。末端アミノ基の修飾としては、これだけに限定されないが、デスアミノ、N-低級アルキル、N-ジ-低級アルキル、およびN-アシル修飾が挙げられる。末端カルボキシ基の修飾としては、これだけに限定されないが、アミド、低級アルキルアミド、ジアルキルアミド、および低級アルキルエステル修飾(例えば、低級アルキルは、C~Cアルキルである)が挙げられる。翻訳後修飾は、例えば、これだけに限定されないが、ペプチド、ポリペプチド、またはタンパク質のアミノ末端とカルボキシ末端の間にあるアミノ酸の、上記のものなどの修飾も含む。翻訳後修飾により、細胞内のタンパク質の「生物学的性質」、例えば、その活性、構造、安定性、または局在を調節することができる。リン酸化は最も一般的な翻訳後修飾であり、タンパク質の調節、特に細胞シグナル伝達において重要な役割を果たす(Prabakaranら、2012年、Wiley Interdiscip Rev Syst Biol Med、4巻:565~583頁)。グリコシル化などの、タンパク質への糖の付加により、タンパク質のフォールディングが促進されること、安定性が改善されること、および調節機能が修飾されることが示されている。タンパク質に脂質を付着させるにより、細胞膜へのターゲティングが可能になる。翻訳後修飾は、1つまたは複数の検出可能な標識を含めるための、ペプチド、ポリペプチド、またはタンパク質の修飾も含み得る。
ある特定の実施形態では、ペプチド、ポリペプチド、またはタンパク質を断片化することができる。例えば、生体試料などの試料に由来するタンパク質を断片化することにより、断片化されたペプチドを得ることができる。ペプチド、ポリペプチド、またはタンパク質を、プロテアーゼまたはエンドペプチダーゼによる断片化を含めた当技術分野で公知の任意の手段によって断片化することができる。一部の実施形態では、ペプチド、ポリペプチド、またはタンパク質の断片化を、特異的なプロテアーゼまたはエンドペプチダーゼを使用することによって標的化する。特異的なプロテアーゼまたはエンドペプチダーゼは、特異的なコンセンサス配列に結合し、そこで切断する(例えば、ENLYFQ\Sコンセンサス配列に対して特異的なTEVプロテアーゼ)。他の実施形態では、ペプチド、ポリペプチド、またはタンパク質の断片化を、非特異的プロテアーゼまたはエンドペプチダーゼを使用することにより、標的化しないまたはランダムなものにする。非特異的プロテアーゼは、コンセンサス配列ではなく特定のアミノ酸残基に結合し、そこで切断することができる(例えば、プロテイナーゼKは、非特異的セリンプロテアーゼである)。プロテイナーゼおよびエンドペプチダーゼは当技術分野で周知であり、タンパク質またはポリペプチドを切断してより小さなペプチド断片にするために使用することができるものの例としては、プロテイナーゼK、トリプシン、キモトリプシン、ペプシン、サーモリシン、トロンビン、第Xa因子、フューリン、エンドペプチダーゼ、パパイン、ペプシン、スブチリシン、エラスターゼ、エンテロキナーゼ、Genenase(商標)I、エンドプロテアーゼLysC、エンドプロテアーゼAspN、エンドプロテアーゼGluCなどが挙げられる(Granvoglら、2007年、Anal Bioanal Chem、389巻:991~1002頁)。ある特定の実施形態では、ペプチド、ポリペプチド、またはタンパク質を、プロテイナーゼKによって、または、任意選択で、迅速な不活化を可能にするために熱不安定性型のプロテイナーゼKによって、断片化する。プロテイナーゼKは、尿素およびSDSなどの変性試薬中で非常に安定であり、それにより、完全に変性したタンパク質を消化することが可能になる。タンパク質およびポリペプチドのペプチドへの断片化は、DNAタグまたはDNA記録タグを付着させる前に実施することもでき、その後に実施することもできる。
化学試薬を使用してタンパク質をペプチド断片に消化することもできる。化学試薬により、特定のアミノ酸残基において切断することができる(例えば、臭化シアンにより、メチオニン残基のC末端においてペプチド結合が加水分解される)。ポリペプチドまたはタンパク質をより小さなペプチドに断片化するための化学試薬としては、臭化シアン(CNBr)、ヒドロキシルアミン、ヒドラジン、ギ酸、BNPS-スカトール[2-(2-ニトロフェニルスルフェニル)-3-メチルインドール]、ヨードソ安息香酸、・NTCB+Ni(2-ニトロ-5-チオシアノ安息香酸)などが挙げられる。
ある特定の実施形態では、酵素的切断または化学的切断の後、得られるペプチド断片は、ほぼ同じ所望の長さ、例えば、約10アミノ酸から約70アミノ酸まで、約10アミノ酸から約60アミノ酸まで、約10アミノ酸から約50アミノ酸まで、約10アミノ酸から約40アミノ酸まで、約10アミノ酸から約30アミノ酸まで、約20アミノ酸から約70アミノ酸まで、約20アミノ酸から約60アミノ酸まで、約20アミノ酸から約50アミノ酸まで、約20アミノ酸から約40アミノ酸まで、約20アミノ酸から約30アミノ酸まで、約30アミノ酸から約70アミノ酸まで、約30アミノ酸から約60アミノ酸まで、約30アミノ酸から約50アミノ酸まで、または約30アミノ酸から約40アミノ酸までである。切断反応は、タンパク質またはポリペプチド試料に、プロテイナーゼまたはエンドペプチダーゼ切断部位を含有するペプチド配列を含む短い試験FRET(蛍光共鳴エネルギー移動)ペプチドをスパイクすることにより、例えばリアルタイムで、モニターすることができる。インタクトなFRETペプチドでは、蛍光基およびクエンチャー基が切断部位を含有するペプチド配列のいずれかの末端に付着しており、クエンチャーとフルオロフォアの間の蛍光共鳴エネルギー移動により、低い蛍光が生じる。試験ペプチドがプロテアーゼまたはエンドペプチダーゼによって切断されると、クエンチャーおよびフルオロフォアが分離し、それにより、蛍光の大きな増大がもたらされる。切断反応は、ある特定の蛍光強度が実現された時に停止させることができ、これにより、再現性のある切断エンドポイントを実現することが可能になる。
巨大分子(例えば、ペプチド、ポリペプチド、またはタンパク質)の試料に対して、固体支持体に付着させる前にタンパク質分画法を行うことができ、ここで、タンパク質またはペプチドを細胞内の位置、分子量、疎水性、もしくは等電点などの1つもしくは複数の性質、またはタンパク質濃縮法によって分離する。その代わりにまたはそれに加えて、特定のタンパク質またはペプチドを選択するため(例えば、その全体が参照により組み込まれる、Whiteakerら、2007年、Anal. Biochem.、362巻:44~54頁を参照されたい)または特定の翻訳後修飾を選択するため(例えば、その全体が参照により組み込まれる、Huangら、2014年、J. Chromatogr. A、1372巻:1~17頁を参照されたい)に、タンパク質濃縮法を使用することができる。あるいは、免疫グロブリンなどの特定のクラス(複数可)のタンパク質、またはIgGなどの免疫グロブリン(Ig)アイソタイプを、解析のために親和性により濃縮または選択することができる。免疫グロブリン分子の場合では、親和性結合に関与する超可変配列の配列および豊富さまたは頻度を解析することが特に興味深く、これは、特に、これらが疾患の進行に応答して変動するまたは健康、免疫、および/もしくは疾患表現型と相関するからである。過度に豊富なタンパク質を、標準の免疫親和性方法を使用して試料からからサブトラクションすることもできる。豊富なタンパク質の枯渇は、タンパク質構成物の80%よりも多くがアルブミンおよび免疫グロブリンである血漿試料に関して有用であり得る。例えばPROTIAおよびPROT20(Sigma-Aldrich)など、血漿試料の過度に豊富なタンパク質の枯渇のために、いくつかの市販品が入手可能である。
ある特定の実施形態では、巨大分子は、タンパク質またはポリペプチドで構成される。一実施形態では、タンパク質またはポリペプチドを標準のアミンカップリング化学によってDNA記録タグで標識する(例えば、図2B、2C、28、29、31、40)を参照されたい。ε-アミノ基(例えばリシン残基の)およびN末端アミノ基は、反応のpHに応じて、アミン反応性カップリング剤で特に標識しやすい(MendozaおよびVachet、2009年)。特定の実施形態では(例えば、図2Bおよび図29を参照されたい)、記録タグは、反応性部分(例えば、固体表面、多機能性リンカー、または巨大分子へのコンジュゲーションのための部分)、リンカー、ユニバーサルプライミング配列、バーコード(例えば、コンパートメントタグ、分配バーコード、試料バーコード、画分バーコード、またはそれらの任意の組合せ)、任意選択のUMI、およびコーディングタグへの/からの情報移行を容易にするためのスペーサー(Sp)配列で構成される。別の実施形態では、タンパク質を、まず、ユニバーサルDNAタグで標識し、その後で、酵素的または化学的カップリングステップによってバーコード-Sp配列(試料、コンパートメント、スライド上の物理的位置を表すなど)をタンパク質に付着させることができる(例えば、図20、30、31、40を参照されたい)。ユニバーサルDNAタグは、タンパク質またはポリペプチド巨大分子を標識するために使用され、バーコード(例えば、コンパートメントタグ、記録タグなど)の付着点として使用することができるヌクレオチドの短い配列を含む。例えば、記録タグは、その末端に、ユニバーサルDNAタグと相補的な配列を含んでよい。ある特定の実施形態では、ユニバーサルDNAタグは、ユニバーサルプライミング配列である。標識されたタンパク質上のユニバーサルDNAタグが記録タグ(例えば、ビーズに結合させたもの)内の相補配列とハイブリダイズしたら、アニーリングされたユニバーサルDNAタグをプライマー伸長によって伸長させ、それにより、DNAタグが付されたタンパク質に記録タグ情報を移行させることができる。特定の実施形態では、タンパク質を、プロテイナーゼにより消化してペプチドにする前に、ユニバーサルDNAタグで標識する。次いで、消化物に由来する標識されたペプチド上のユニバーサルDNAタグを、情報価値があり、有効な記録タグに変換することができる。
ある特定の実施形態では、タンパク質巨大分子を親和性捕捉試薬によって固体支持体に固定化すること(および任意選択で共有結合により架橋結合させること)ができ、ここで、記録タグは、親和性捕捉試薬に直接付随している、あるいは、タンパク質を固体支持体に記録タグと共に直接固定化することができる(例えば、図2Cを参照されたい)。
C.固体支持体などの支持体
本開示の巨大分子を固体支持体の表面(「基板表面」とも称される)に接合する。固体支持体は、これだけに限定されないが、ビーズ、マイクロビーズ、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フローセル、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアを含めた任意の多孔質または非多孔質支持体表面であってよい。固体支持体用の材料としては、これだけに限定されないが、アクリルアミド、アガロース、セルロース、ニトロセルロース、ガラス、金、石英、ポリスチレン、ポリエチレン酢酸ビニル、ポリプロピレン、ポリメタクリレート、ポリエチレン、ポリエチレンオキシド、ポリシリケート、ポリカーボネート、テフロン(登録商標)、フルオロカーボン、ナイロン、シリコンゴム、ポリ酸無水物、ポリグリコール酸、ポリ乳酸、ポリオルトエステル、官能化シラン、ポリプロピルフメレート、コラーゲン、グリコサミノグリカン、ポリアミノ酸、またはそれらの任意の組合せが挙げられる。固体支持体は、薄膜、膜、ビン、ディッシュ、繊維、織られた繊維、チューブなどの成形ポリマー、粒子、ビーズ、微小粒子、またはそれらの任意の組合せをさらに含む。例えば、固体表面がビーズである場合、ビーズとしては、これだけに限定されないが、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズを挙げることができる。
ある特定の実施形態では、固体支持体は、フローセルである。フローセルの形態は、異なる次世代シーケンシングプラットフォームの間で変動し得る。例えば、Illuminaフローセルは、その表面に一連のオリゴヌクレオチドアンカーが結合した、顕微鏡スライドと同様の平面の光学的に透明な表面である。鋳型DNAは、末端にフローセル表面上のオリゴヌクレオチドと相補的なアダプターがライゲーションしている。アダプター付加した一本鎖DNAをフローセルに結合させ、固相「ブリッジ」PCRによって増幅した後、配列決定する。454フローセル(454 Life Sciences)は、75ピコリットルのウェルを約160万個有する光ファイバースライドである「ピコタイター」プレートを支持するものである。せん断された鋳型DNAの個々の分子をそれぞれ別々のビーズに捕捉し、各ビーズを油エマルジョン中の水性PCR反応混合物の個々の液滴中に区画化する。鋳型をビーズ表面上でPCRによってクローン的に増幅し、次いで、鋳型がローディングされたビーズを配列決定反応のためにピコタイタープレートのウェル中に、理想的には1ウェル当たり1個またはそれ未満のビーズに分布させる。Applied BiosystemsからのSOLiD(Supported Oligonucleotide Ligation and Detection)計器では、454システムと同様に、鋳型分子をエマルジョンPCRによって増幅する。増幅した鋳型を含有しないビーズを選別するステップの後、ビーズに結合した鋳型がフローセル上に蓄積する。フローセルは、TWIST(商標)DNA合成カラム(Glen Research)などの単純なフィルターフリットであってもよい。
ある特定の実施形態では、固体支持体はビーズであり、これは、個々のビーズを指す場合もあり複数のビーズを指す場合もある。一部の実施形態では、ビーズは、下流の解析のために使用される選択された次世代シーケンシングプラットフォーム(例えば、SOLiDまたは454)に適合するものである。一部の実施形態では、固体支持体は、アガロースビーズ、常磁性ビーズ、ポリスチレンビーズ、ポリマービーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、ガラスビーズ、または制御ポアビーズである。さらなる実施形態では、ビーズは、巨大分子への結合を容易にするために、結合機能性(例えば、アミン基、ビオチン標識された巨大分子、抗体との結合用のストレプトアビジンなどの親和性リガンド)でコーティングすることができる。
タンパク質、ポリペプチド、またはペプチドは、固体支持体に、直接または間接的に、共有結合性の相互作用および非共有結合性の相互作用またはそれらの任意の組合せを含めた当技術分野で公知の任意の手段によって接合させることができる(例えば、それぞれ、これによってその全体が参照により組み込まれる、Chanら、2007年、PLoS One、2巻:e1164頁;Cazalisら、Bioconj. Chem.、15巻:1005~1009頁;Soellnerら、2003年、J. Am. Chem. Soc.、125巻:11790~11791頁;Sunら、2006年、Bioconjug. Chem.、17巻、52~57頁;Decreauら、2007年、J. Org. Chem.、72巻:2794~2802頁;Camareroら、2004年、J. Am. Chem. Soc.、126巻:14730~14731頁;Girishら、2005年、Bioorg. Med. Chem. Lett.、15巻:2447~2451頁;Kaliaら、2007年、Bioconjug. Chem.、18巻:1064~1069頁;Watzkeら、2006年、Angew Chem. Int. Ed. Engl.、45巻:1408~1412頁;Parthasarathyら、2007年、Bioconjugate Chem.、18巻:469~476頁;およびBioconjugate Techniques、G. T. Hermanson、Academic Press(2013年)を参照されたい)。例えば、ペプチドを固体支持体にライゲーション反応によって接合させることができる。あるいは、固体支持体は、直接または間接的にペプチドを固体支持体に接合することを容易にするための作用物質またはコーティングを含んでよい。タンパク質、核酸、炭水化物および小分子を含めた任意の適切な分子または材料をこの目的のために使用することができる。例えば、一実施形態では、作用物質は、親和性分子である。別の例では、作用物質は、別の分子のアルキニル基と反応して固体支持体と他の分子の間の会合または結合を容易にすることができる、アジド基である。
タンパク質、ポリペプチド、またはペプチドは、固体支持体に、「クリックケミストリー」と称される方法を使用して接合させることができる。この目的のために、迅速かつ実質的に不可逆的である任意の反応を使用してタンパク質、ポリペプチド、またはペプチドを固体支持体に付着させることができる。例示的な反応としては、トリアゾールが形成される、アジドとアルキンの銅により触媒される反応(ヒュスゲン1,3-双極子付加環化)、歪み促進型アジド-アルキン付加環化(SPAAC)、ジエンと求ジエン体の反応(ディールス・アルダー)、歪み促進型アルキン-ニトロン付加環化、歪アルケンとアジド、テトラジンまたはテトラゾールの反応、アルケン-アジド[3+2]付加環化、アルケン-テトラジン逆電子要請型ディールス・アルダー(IEDDA)反応(例えば、m-テトラジン(mTet)-trans-シクロオクテン(TCO))、アルケン-テトラゾール光化学反応、アジド-ホスフィンのシュタウディンガーライゲーション、ならびに、求電子原子に対する求核攻撃による脱離基の置換(Horisawa 2014年、Knall、Hollaufら、2014年)などの種々の置換反応が挙げられる。例示的な置換反応としては、アミンと活性化エステルの反応;アミンとN-ヒドロキシスクシンイミドエステルの反応;アミンとイソシアネートの反応;アミンとイソチオシアネートの反応などが挙げられる。
一部の実施形態では、巨大分子および固体支持体を、2つの相補的な反応性基の反応によって形成することができる官能基、例えば、前述の「クリック」反応のうちの1つの生成物である官能基によって接合する。種々の実施形態では、官能基は、アルデヒド、オキシム、ヒドラゾン、ヒドラジド、アルキン、アミン、アジド、アシルアジド、ハロゲン化アシル、ニトリル、ニトロン、スルフヒドリル、ジスルフィド、ハロゲン化スルホニル、イソチオシアネート、イミドエステル、活性化エステル(例えば、N-ヒドロキシスクシンイミドエステル、ペンチン酸STPエステル)、ケトン、α,β-不飽和カルボニル、アルケン、マレイミド、α-ハロイミド、エポキシド、アジリジン、テトラジン、テトラゾール、ホスフィン、ビオチンまたはチイラン官能基と、相補的な反応性基との反応によって形成することができる。例示的な反応は、アミン(例えば、第一級アミン)とN-ヒドロキシスクシンイミドエステルまたはイソチオシアネートの反応である。
さらに他の実施形態では、官能基は、アルケン、エステル、アミド、チオエステル、ジスルフィド、炭素環式、複素環式またはヘテロアリール基を含む。さらなる実施形態では、官能基は、アルケン、エステル、アミド、チオエステル、チオ尿素、ジスルフィド、炭素環式、複素環式またはヘテロアリール基を含む。他の実施形態では、官能基は、アミドまたはチオ尿素を含む。一部のより具体的な実施形態では、官能基は、トリアゾリル官能基、アミド、またはチオ尿素官能基である。
好ましい実施形態では、迅速かつ低インプット濃度で高収率がもたらされるので、iEDDAクリックケミストリーを巨大分子(例えば、タンパク質、ポリペプチド、ペプチド)を固体支持体に固定化するために使用する。別の好ましい実施形態では、テトラジンではなくm-テトラジンをiEDDAクリックケミストリー反応に使用し、これは、m-テトラジンが改善された結合安定性を有するからである。
好ましい実施形態では、基板表面をTCOで官能化し、記録タグで標識したタンパク質、ポリペプチド、ペプチドを、TCOでコーティングした基板表面に、付着したm-テトラジン部分を介して固定化する(例えば図34を参照されたい)。
タンパク質、ポリペプチド、またはペプチドは、そのC末端、N末端、または内部アミノ酸により、例えば、アミン基、カルボキシル基、またはスルフィドリル基を介して、固体支持体の表面に固定化することができる。アミン基へのカップリングに使用される標準の活性化された支持体としては、CNBrで活性化された支持体、NHSで活性化された支持体、アルデヒドで活性化された支持体、アズラクトンで活性化された支持体、およびCDIで活性化された支持体が挙げられる。カルボキシルカップリングに使用される標準の活性化された支持体としては、アミン支持体にカップリングするカルボジイミドで活性化されたカルボキシル部分が挙げられる。システインカップリングでは、マレイミド、ヨードアセチル、およびピリジルジスルフィドで活性化された支持体を使用することができる。ペプチドカルボキシ末端固定化の代替方式では、C末端にリシンまたはアルギニン残基を含有するペプチドに、それらを切断することなく結合する、触媒として不活性なトリプシンの誘導体であるアンヒドロトリプシンを使用する。
ある特定の実施形態では、タンパク質、ポリペプチド、またはペプチドを固体支持体に、固体表面に結合させたリンカーをタンパク質、ポリペプチド、またはペプチドのリシン基に共有結合により付着させることによって固定化する。
固体支持体への固定化前または固定化後に、タンパク質、ポリペプチド、またはペプチドに記録タグを付着させることができる。例えば、タンパク質、ポリペプチド、またはペプチドを、まず記録タグで標識し、次いで、カップリングのための2つの機能的部分を含む記録タグを介して固体表面に固定化することができる(例えば図28を参照されたい)。記録タグの一方の機能的部分をタンパク質とカップリングさせ、他方の機能的部分により、記録タグで標識したタンパク質を固体支持体に固定化する。
あるいは、タンパク質、ポリペプチドまたはペプチドを記録タグで標識する前に、タンパク質、ポリペプチド、またはペプチドを固体支持体に固定化する。例えば、タンパク質をまずクリックケミストリー部分などの反応性基で誘導体化することができる。次いで、活性化されたタンパク質分子を適切な固体支持体に付着させ、次いで、相補的なクリックケミストリー部分を使用して記録タグで標識することができる。例として、アルキンおよびmTet部分で誘導体化したタンパク質を、アジドおよびTCOで誘導体化したビーズに固定化し、アジドおよびTCOで標識された記録タグに付着させることができる。
巨大分子(例えば、タンパク質、ポリペプチド、またはペプチド)を固体支持体に付着させるための本明細書において提示される方法はまた、記録タグを固体支持体に付着させるまたは記録タグを巨大分子(例えば、タンパク質、ポリペプチド、またはペプチド)に付着させるためにも使用することができることが理解される。
ある特定の実施形態では、結合性物質への非特異的吸収を最小限にするために、固体支持体の表面を不動態化(ブロッキング)する。「不動態化」された表面とは、結合性物質の非特異的結合を最小限にするために材料の外層で処理された表面を指す。表面を不動態化する方法としては、表面を、ポリエチレングリコール(PEG)(Panら、2015年、Phys. Biol.、12巻:045006頁)、ポリシロキサン(例えば、Pluronic F-127)、星型ポリマー(例えば、星型PEG)(Grollら、2010年、Methods Enzymol.、472巻:1~18頁)、疎水性ジクロロジメチルシラン(DDS)+自己組織化Tween(登録商標)-20(Huaら、2014年、Nat. Methods、11巻:1233~1236頁)、およびダイヤモンド様炭素(DLC)、DLC+PEG(Stavisら、2011年、Proc. Natl. Acad. Sci. USA、108巻:983~988頁)のようなポリマーで不動態化することを含めた、蛍光単一分子解析の文献からの標準の方法が挙げられる。共有結合性の表面修飾に加えて、Tween(登録商標)-20のような界面活性物質、溶液中ポリシロキサン(Pluronicシリーズ)、ポリビニルアルコール(PVA)、ならびにBSAおよびカゼインのようなタンパク質を含めたいくつもの不動態化剤を同様に使用することができる。あるいは、固体基板の表面上または容積内のタンパク質、ポリペプチド、またはペプチドの密度を、タンパク質、ポリペプチドまたはペプチドを固体基板に固定化する際に競合剤または「ダミー」反応性分子をスパイクすることによって調整することができる(例えば図36Aを参照されたい)。
ある特定の実施形態では、多数の巨大分子を同じ固体支持体上に固定化する場合、例えば、結合性物質が第1の巨大分子に結合し、そのコーディングタグ情報が第1の巨大分子に付随する記録タグではなく近隣の巨大分子に付随する記録タグに移行する交差結合または分子間事象の発生を低減するまたはそれを防止するために、巨大分子の間に適切に間隔をあけることができる。固体支持体上の巨大分子の間隔(例えば、タンパク質、ポリペプチド、またはペプチドの間隔)を制御するために、基板表面上の機能的カップリング基(例えば、TCO)の密度を調整することができる(例えば図34を参照されたい)。一部の実施形態では、固体支持体(例えば、多孔質支持体)の表面上または容積内で多数の巨大分子の間に約50nm~約500nm、または約50nm~約400nm、または約50nm~約300nm、または約50nm~約200nm、または約50nm~約100nmの距離で間隔をあける。一部の実施形態では、固体支持体の表面上で多数の巨大分子の間に少なくとも50nm、少なくとも60nm、少なくとも70nm、少なくとも80nm、少なくとも90nm、少なくとも100nm、少なくとも150nm、少なくとも200nm、少なくとも250nm、少なくとも300nm、少なくとも350nm、少なくとも400nm、少なくとも450nm、または少なくとも500nmの平均距離で間隔をあける。一部の実施形態では、固体支持体の表面上で多数の巨大分子の間に少なくとも50nmの平均距離で間隔をあける。一部の実施形態では、固体支持体の表面上または容積内で巨大分子の間に、経験的に分子内事象に対する分子間事象の相対的な頻度が<1:10;<1:100;<1:1,000;または<1:10,000になるように間隔をあける。適切な間隔頻度は、機能アッセイを使用して経験的に決定することができ(例えば実施例23を参照されたい)、希釈によっておよび/または基板表面上の部位への付着について競合する「ダミー」スペーサー分子をスパイクすることによって実現することができる。
例えば、図34に示されている通り、PEG-5000(MW 約5000)を使用して、基板表面(例えば、ビーズ表面)上のペプチド間の間隙の空間をブロッキングする。さらに、ペプチドを同じくPEG-5000分子に付着させた機能的部分とカップリングさせる。好ましい実施形態では、これは、NHS-PEG-5000-TCO+NHS-PEG-5000-メチルの混合物をアミン誘導体化ビーズにカップリングさせることによって実現される(例えば、図34を参照されたい)。2つのPEG間(TCO対メチル)の化学量論比をタイトレーションして、基板表面上の機能的カップリング部分(TCO基)の適切な密度を生じさせる;メチル-PEGはカップリングに対して不活性である。TCO基間の有効な間隔は、表面上のTCO基の密度を測定することによって算出することができる。ある特定の実施形態では、固体表面上のカップリング部分(例えば、TCO)間の平均間隔は、少なくとも50nm、少なくとも100nm、少なくとも250nm、または少なくとも500nmである。ビーズをPEG5000-TCO/メチルで誘導体化した後、表面上の過剰なNH基を反応性無水物(例えば、無水酢酸または無水コハク酸)阻害剤でクエンチする。
特定の実施形態では、分析物分子および/または記録タグを、基板または支持体に、(i)第1の分析物に結合しているコーディング物質(特に、その結合しているコーディング物質中のコーディングタグ)と(ii)第2の分析物および/もしくはその記録タグとの間の相互作用が低減される、最小限に抑えられる、または完全に消去されるような密度で、固定化する。したがって、「分子間」会合の結果として生じる偽陽性アッセイシグナルを低減させること、最小限に抑えること、または消去することができる。
ある特定の実施形態では、基板上の分析物分子および/または記録タグの密度を分析物の各タイプについて決定する。例えば、変性ポリペプチド鎖が長いほど、「分子間」相互作用を防止するために存在すべき密度は低い。ある特定の態様では、分析物分子および/または記録タグ間の間隔の増大(すなわち、密度の低下)は、本開示のアッセイのシグナル対バックグラウンド比を増大させる。
一部の実施形態では、分析物分子および/または記録タグを、約0.0001分子/μm、0.001分子/μm、0.01分子/μm、0.1分子/μm、1分子/μm、約2分子/μm、約3分子/μm、約4分子/μm、約5分子/μm、約6分子/μm、約7分子/μm、約8分子/μm、約9分子/μm、または約10分子/μmの平均密度で、基板上に堆積または固定化させる。他の実施形態では、分析物分子および/または記録タグを、約15、約20、約25、約30、約35、約40、約45、約50、約55、約60、約65、約70、約75、約80、約85、約90、約95、約100、約105、約110、約115、約120、約125、約130、約135、約140、約145、約150、約155、約160、約165、約170、約175、約180、約185、約190、約195、約200、または約200分子/μmの平均密度で基板上に堆積または固定化する。他の実施形態では、分析物分子および/または記録タグを、約1分子/mm、約10分子/mm、約50分子/mm、約100分子/mm、約150分子/mm、約200分子/mm、約250分子/mm、約300分子/mm、約350分子/mm、400分子/mm、約450分子/mm、約500分子/mm、約550分子/mm、約600分子/mm、約650分子/mm、約700分子/mm、約750分子/mm、約800分子/mm、約850分子/mm、約900分子/mm、約950分子/mm、または約1000分子/mmの平均密度で堆積または固定化する。さらに他の実施形態では、分析物分子および/または記録タグを、約1×10~約0.5×10分子/mmの間、約0.5×10~約1×10分子/mmの間、約1×10~約0.5×10分子/mmの間、約0.5×10~約1×10分子/mmの間、約1×10~約0.5×10分子/mmの間、または約0.5×10~約1×10分子/mmの間の平均密度で、基板上に堆積または固定化する。他の実施形態では、基板上に堆積または固定化される分析物分子および/または記録タグの平均密度は、例えば、約1分子/cm~約5分子/cmの間、約5~約10分子/cmの間、約10~約50分子/cmの間、約50~約100分子/cmの間、約100~約0.5×10分子/cmの間、約0.5×10~約1×10分子/cmの間、1×10および約0.5×10分子/cm、約0.5×10~約1×10分子/cmの間、約1×10~約0.5×10分子/cmの間、約0.5×10~約1×10分子/cmの間、約1×10~約0.5×10分子/cmの間、または約0.5×10~約1×10分子/cmの間であり得る。
ある特定の実施形態では、溶液中の結合性物質の濃度を、アッセイのバックグラウンドおよび/または偽陽性結果を低減させるように制御する。
一部の実施形態では、結合性物質の濃度は、約0.0001nM、約0.001nM、約0.01nM、約0.1nM、約1nM、約2nM、約5nM、約10nM、約20nM、約50nM、約100nM、約200nM、約500nM、または約1000nMである。他の実施形態では、アッセイに使用される可溶性コンジュゲートの濃度は、約0.0001nM~約0.001nMの間、約0.001nM~約0.01nMの間、約0.01nM~約0.1nMの間、約0.1nM~約1nMの間、約1nM~約2nMの間、約2nM~約5nMの間、約5nM~約10nMの間、約10nM~約20nMの間、約20nM~約50nMの間、約50nM~約100nMの間、約100nM~約200nMの間、約200nM~約500nMの間、約500nM~約1000nMの間であるか、または約1000nMより高い。
一部の実施形態では、可溶性結合性物質分子と固定化された分析物分子および/または記録タグとの間の比は、約0.00001:1、約0.0001:1、約0.001:1、約0.01:1、約0.1:1、約1:1、約2:1、約5:1、約10:1、約15:1、約20:1、約25:1、約30:1、約35:1、約40:1、約45:1、約50:1、約55:1、約60:1、約65:1、約70:1、約75:1、約80:1、約85:1、約90:1、約95:1、約100:1、約10:1、約10:1、約10:1であるか、もしくはそれより高いか、または上掲の比の間の任意の比である。可溶性結合性物質分子と固定化された分析物分子および/または記録タグとの間のより高い比を使用して、結合および/またはコーディングタグ/再コーディングタグ情報移行を完了に至らせることができる。これは、試料中の豊富さが低いタンパク質分析物の検出および/または解析に特に有用であり得る。
D.記録タグ
一部の実施形態では、少なくとも1つの記録タグを巨大分子と直接または間接的に付随または共局在させ、固体支持体に接合させる(例えば、図5を参照されたい)。記録タグは、DNA、RNA、PNA、γPNA、GNA、BNA、XNA、TNA、保護されたDNAもしくはRNA塩基、ポリヌクレオチド類似体、またはこれらの組合せを含み得る。記録タグは、一本鎖状であってもよく、または部分的にもしくは完全に二本鎖状であってもよい。記録タグは、平滑末端を有してもよく、または突出末端を有してもよい。ある特定の実施形態では、結合性物質が巨大分子に結合すると、結合性物質のコーディングタグの識別情報が記録タグに移行されて、伸長記録タグを生成する。伸長記録タグに対するさらなる伸長を後続の結合サイクルで生じさせることができる。
記録タグは、固体支持体に、共有結合性の相互作用および非共有結合性の相互作用、またはそれらの任意の組合せを含めた当技術分野で公知の任意の手段によって直接または間接的に(例えば、リンカーを介して)接合させることができる。例えば、記録タグを固体支持体にライゲーション反応によって接合させることができる。あるいは、固体支持体は、記録タグを固体支持体に直接または間接的に接合させることを容易にするための作用物質またはコーティングを含んでよい。核酸分子を固体支持体(例えば、ビーズ)に固定化するための戦略は、それぞれ、その全体が参照により本明細書に組み込まれる、米国特許第5,900,481号;Steinbergら(2004年、Biopolymers、73巻:597~605頁);Lundら、1988年(Nucleic Acids Res.、16巻:10861~10880頁);およびSteinbergら(2004年、Biopolymers、73巻:597~605頁)に記載されている。
ある特定の実施形態では、巨大分子(例えば、ペプチド)と付随する記録タグの共局在は、巨大分子および記録タグを、固体支持体表面に直接付着させた二機能性リンカーとコンジュゲートすることによって実現される。Steinbergら(2004年、Biopolymer、73巻:597~605頁)。さらなる実施形態では、三機能性部分を使用して固体支持体(例えば、ビーズ)を誘導体化し、得られた二機能性部分を巨大分子および記録タグの両方とカップリングさせる。
巨大分子および固体支持体の付着に関して記載されているものなどの方法および試薬(例えば、クリックケミストリー試薬および光親和性標識試薬)を記録タグの付着にも使用することができる。
特定の実施形態では、単一の記録タグを巨大分子(例えば、ペプチド)に、例えば脱ブロッキングしたN末端アミノ酸またはC末端アミノ酸に付着させることによって付着させる。別の実施形態では、多数の記録タグを巨大分子(例えば、タンパク質、ポリペプチド、またはペプチド)に、例えばリシン残基またはペプチド骨格に付着させる。一部の実施形態では、多数の記録タグで標識した巨大分子(例えば、タンパク質またはポリペプチド)を、それぞれが平均して1つの記録タグで標識された、より小さなペプチドに断片化または消化する。
ある特定の実施形態では、記録タグは、任意選択の、UMIが付随する各巨大分子(例えば、タンパク質、ポリペプチド、ペプチド)についての一意の識別子タグをもたらす一意の分子識別子(UMI)を含む。UMIは、約3~約40塩基、約3~約30塩基、約3~約20塩基、または約3~約10塩基、または約3~約8塩基であってよい。一部の実施形態では、UMIは、約3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基、10塩基、11塩基、12塩基、13塩基、14塩基、15塩基、16塩基、17塩基、18塩基、19塩基、20塩基、25塩基、30塩基、35塩基、または40塩基の長さである。UMIを使用して、複数の伸長記録タグからの配列決定データをデコンボリューションして個々の巨大分子からの配列読み取りを識別することができる。一部の実施形態では、巨大分子のライブラリー内で、各巨大分子に単一の記録タグを付随させ、各記録タグが一意のUMIを含む。他の実施形態では、記録タグの多数のコピーを単一の巨大分子に付随させ、記録タグの各コピーは同じUMIを含む。一部の実施形態では、UMIは、結合性物質のコーディングタグ内のスペーサーまたはエンコーダー配列と、これらの成分を配列解析中に区別することを容易にするために、異なる塩基配列を有する。
ある特定の実施形態では、記録タグは、例えば、存在する場合、UMI以外のバーコードを含む。バーコードは、約3~約30塩基、約3~約25塩基、約3~約20塩基、約3~約10塩基、約3~約10塩基、約3~約8塩基の長さの核酸分子である。一部の実施形態では、バーコードは、約3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基、10塩基、11塩基、12塩基、13塩基、14塩基、15塩基、20塩基、25塩基、または30塩基の長さである。一実施形態では、バーコードにより、複数の試料またはライブラリーのマルチプレックス配列決定が可能になる。バーコードを使用して、分配、画分、コンパートメント、試料、空間的位置、または巨大分子(例えば、ペプチド)が由来するライブラリーを識別することができる。バーコードを使用して、多重化された配列データをデコンボリューションし、個々の試料またはライブラリーからの配列読み取りを識別する。例えば、バーコードが付されたビーズは、試料のエマルジョンおよび分配を伴う方法に、例えば、プロテオームを分配するために、有用である。
バーコードは、例えば液滴、マイクロウェル、固体支持体上の物理的領域などのコンパートメントに一意のバーコードが割り当てられたコンパートメントタグを表し得る。コンパートメントと特異的なバーコードの会合は、例えば、単一のバーコードが付されたビーズをコンパートメントに封入することによって、例えば、バーコードが付された液滴をコンパートメントに直接混合させるまたは添加することによって、バーコード試薬をコンパートメントに直接プリントまたは注射することによってなどの任意の数のやり方で実現することができる。コンパートメント内のバーコード試薬を使用して、コンパートメント特異的バーコードをコンパートメント内の巨大分子またはその断片に付加する。コンパートメント内へのタンパク質の分配に適用すると、バーコードを使用して、解析されるペプチドをコンパートメント内のそれらの起源であるタンパク質分子にマッピングし戻すことができる。これにより、タンパク質識別が著しく容易になる。コンパートメントバーコードを使用してタンパク質複合体を識別することもできる。
他の実施形態では、コンパートメントの集団のサブセットを表す多数のコンパートメントにそのサブセットを表す一意のバーコードを割り当てることができる。
あるいは、バーコードは、試料識別バーコードであってよい。試料バーコードは、単一反応容器中のまたは単一の固体基板または固体基板の集合(例えば、平面スライド、単一のチューブまたは容器などに含有されるビーズの集団)に固定化された試料のセットの多重化解析に有用である。多くの異なる試料由来の巨大分子を、試料特異的バーコードを有する記録タグで標識することができ、次いで、全ての試料を、固体支持体への固定化、周期的結合、および記録タグ解析の前に一緒にプールすることができる。あるいは、DNAによりコードされるライブラリー作成後まで試料を別々に保持し、DNAによりコードされるライブラリーのPCR増幅中に試料バーコードを付着させ、次いで、配列決定前に混合することができる。この手法は、豊富さのクラスが異なる分析物(例えば、タンパク質)をアッセイする場合に有用であり得る。例えば、試料を分割し、バーコードを付し、一方の部分を豊富さが低い分析物に対する結合性物質を使用して処理し、他方の部分を豊富さがより高い分析物に対する結合性物質を使用して処理することができる。特定の実施形態では、この手法は、特定のタンパク質分析物アッセイのダイナミックレンジをタンパク質分析物の標準の発現レベルの「スイートスポット」に入るように調整するのに役立つ。
ある特定の実施形態では、多数の異なる試料に由来するペプチド、ポリペプチド、またはタンパク質を、試料特異的バーコードを含有する記録タグで標識する。多試料バーコードが付されたペプチド、ポリペプチド、またはタンパク質を周期的結合反応前に混合することができる。このように、デジタル逆相タンパク質アレイ(RPPA)に対する高度に多重化された代替物が有効に創出される(Guo、Liuら、2012年、Assadi、Lamerzら、2013年、Akbani、Beckerら、2014年、CreightonおよびHuang、2015年)。デジタルRPPA様アッセイの創出には、翻訳研究、バイオマーカー検証、薬物発見、臨床、および高精度の医療における多数の適用がある。
ある特定の実施形態では、記録タグは、ユニバーサルプライミング部位、例えば、フォワードまたは5’ユニバーサルプライミング部位を含む。ユニバーサルプライミング部位は、ライブラリー増幅反応をプライミングするためおよび/または配列決定のために使用することができる核酸配列である。ユニバーサルプライミング部位としては、これだけに限定されないが、PCR増幅のためのプライミング部位、フローセル表面上の相補的なオリゴヌクレオチドとアニーリングするフローセルアダプター配列(例えば、Illumina次世代シーケンシング)、配列決定プライミング部位、またはこれらの組合せを挙げることができる。ユニバーサルプライミング部位は、約10塩基~約60塩基であってよい。一部の実施形態では、ユニバーサルプライミング部位は、Illumina P5プライマー(5’-AATGATACGGCGACCACCGA-3’-配列番号133)またはIllumina P7プライマー(5’-CAAGCAGAAGACGGCATACGAGAT-3’-配列番号134)を含む。
ある特定の実施形態では、記録タグは、その末端、例えば3’末端にスペーサーを含む。本明細書で使用される場合、記録タグに関してスペーサー配列への言及は、その同類結合性物質に付随するスペーサー配列、またはその同類結合性物質に付随するスペーサー配列と相補的なスペーサー配列と同一のスペーサー配列を含む。記録タグ上の末端、例えば3’スペーサーにより、第1の結合サイクル中に同類結合性物質の識別情報をそのコーディングタグから記録タグに移行させることが可能になる(例えば、プライマー伸長または粘着末端ライゲーションのための相補的なスペーサー配列のアニーリングによって)。
一実施形態では、スペーサー配列は、約1~20塩基の長さ、約2~12塩基の長さ、または5~10塩基の長さである。スペーサーの長さは、コーディングタグ情報を記録タグに移行させるためのプライマー伸長反応の温度および反応条件などの因子に依存し得る。
好ましい実施形態では、記録タグ内のスペーサー配列を、記録タグ内の他の領域に対して最小の相補性を有するように設計する;同様に、コーディングタグ内のスペーサー配列はコーディングタグ内の他の領域に対して最小の相補性を有するべきである。言い換えれば、記録タグおよびコーディングタグのスペーサー配列は、記録タグまたはコーディングタグ内に存在する一意の分子識別子、バーコード(例えば、コンパートメント、分配、試料、空間的位置)、ユニバーサルプライマー配列、エンコーダー配列、サイクル特異的配列などの成分に対して最小の配列相補性を有するべきである。
結合性物質スペーサーについて記載されている通り、一部の実施形態では、巨大分子のライブラリーに付随する記録タグは、共通のスペーサー配列を共有する。他の実施形態では、巨大分子のライブラリーに付随する記録タグは、それらの同類結合性物質の結合サイクル特異的スペーサー配列と相補的な結合サイクル特異的スペーサー配列を有し、これは、非連鎖状伸長記録タグを使用する場合に有用であり得る(図10を参照されたい)。
伸長記録タグの収集物は、事後に連鎖状にすることができる(例えば、図10を参照されたい)。結合サイクルが完了した後、ビーズ固体支持体であって、各ビーズが平均してビーズ当たり1つまたは1つ未満の巨大分子を有し、各巨大分子が巨大分子の部位に共局在する伸長記録タグの収集物を有するビーズ固体支持体をエマルジョン中に入れる。エマルジョンは、各液滴が平均して最大で1ビーズによって占められるように形成する。任意選択のアセンブリPCR反応をエマルジョン中で実施してビーズ上の巨大分子と共局在する伸長記録タグを増幅し、それらを別の伸長記録タグの異なるサイクル特異的配列間のプライミングによって共直線的な順序でアセンブルさせる(Xiong、Pengら、2008年)。その後、エマルジョンを破壊し、アセンブルした伸長記録タグを配列決定する。
別の実施形態では、DNA記録タグは、第1の結合サイクルに特異的なユニバーサルプライミング配列(U1)、1つまたは複数のバーコード配列(BCs)、およびスペーサー配列(Sp1)で構成される。第1の結合サイクルでは、結合性物質はSp1相補的スペーサー、エンコーダーバーコード、および任意選択のサイクルバーコード、および第2のスペーサーエレメント(Sp2)で構成されるDNAコーディングタグを使用する。少なくとも2つの異なるスペーサーエレメントを使用することの有用性は、第1の結合サイクルにより潜在的に複数のDNA記録タグのうちの1つが選択され、単一のDNA記録タグが伸長し、その結果、伸長DNA記録タグの最後に新しいSp2スペーサーエレメントがもたらされることである。第2の結合サイクルおよびその後の結合サイクルでは、結合性物質は、Sp1’ではなくSp2’スペーサーだけを含有する。このように、第1のサイクルからの単一の伸長記録タグのみがその後のサイクルで伸長する。別の実施形態では、第2のサイクルおよびその後のサイクルに結合性物質特異的スペーサーを使用することができる。
一部の実施形態では、記録タグは、5’から3’の方向に、ユニバーサルフォワード(または5’)プライミング配列、UMI、およびスペーサー配列を含む。一部の実施形態では、記録タグは、5’から3’の方向に、ユニバーサルフォワード(または5’)プライミング配列、任意選択のUMI、バーコード(例えば、試料バーコード、分配バーコード、コンパートメントバーコード、空間バーコード、またはそれらの任意の組合せ)、およびスペーサー配列を含む。一部の他の実施形態では、記録タグは、5’から3’の方向に、ユニバーサルフォワード(または5’)プライミング配列、バーコード(例えば、試料バーコード、分配バーコード、コンパートメントバーコード、空間バーコード、またはそれらの任意の組合せ)、任意選択のUMI、およびスペーサー配列を含む。
改変DNAおよびPNAからUMIを生成するためにコンビナトリアル手法を使用することができる。一実施例では、UMIは、互いに直交性になるように設計された短いワード配列(4~15mer)のセットの「化学的ライゲーション」によって構築することができる(SpiropulosおよびHeemstra、2012年)。「ワード」ポリマーの化学的ライゲーションを導くためにDNA鋳型を使用する。DNA鋳型は、単に溶液中で副成分を一緒に混合することによってコンビナトリアル鋳型構造をアセンブルすることを可能にするハイブリダイズアームを用いて構築する(例えば図12Cを参照されたい)。ある特定の実施形態では、この設計には「スペーサー」配列は存在しない。ワードスペースのサイズは、10ワードから10,000またはそれよりも多くのワードまで変動し得る。ある特定の実施形態では、ワードは、交差ハイブリダイズはしないように互いとは異なるが、それでも比較的均一なハイブリダイゼーション条件が保たれるように選択する。一実施形態では、ワードの長さは、およそ10塩基であり、サブセット内に約1000ワードを有する(これは、全10merワードスペースのたった0.1%である、約410=百万ワード)。これらのワードのセット(サブセット内に1000)を連鎖状にして、複雑さ=1000パワーの最終的なコンビナトリアルUMIを生成することができる。連鎖状にした4つのワードに関しては、これにより、1012種の異なるエレメントのUMI多様性が生じる。これらのUMI配列を巨大分子(ペプチド、タンパク質など)に単一分子レベルで付加する。一実施形態では、UMIの多様性は、UMIを付着させる巨大分子の分子数を超える。このように、UMIにより、目的の巨大分子が一意的に識別される。コンビナトリアルワードUMIの使用により、多数塩基長のワードを読み取るために一塩基分解能は必要ないので、エラー率が高いシーケンサー(例えば、ナノポアシーケンサー、ナノギャップトンネリングシーケンシングなど)での読み取りが容易になる。コンビナトリアルワード手法は、コンパートメントタグ、分配バーコード、空間バーコード、試料バーコード、エンコーダー配列、サイクル特異的配列、およびバーコードなどの、他の同一性に関する情報価値のある記録タグまたはコーディングタグの成分を生成するためにも使用することができる。ナノポアシーケンシングに関する方法およびエラー許容性ワード(コード)を有する情報をコードするDNAは、当技術分野で公知である(例えば、それぞれ、その全体が参照により組み込まれる、Kiahら、2015年、Codes for DNA sequence profiles. IEEE International Symposium on Information Theory (ISIT);Gabrysら、2015年、Asymmetric Lee distance codes for DNA-based storage. IEEE Symposium on Information Theory (ISIT);Laureら、2016年、Coding in 2D: Using Intentional Dispersity to Enhance the Information Capacity of Sequence-Coded Polymer Barcodes. Angew. Chem. Int. Ed. doi:10.1002/anie.201605279;Yazdiら、2015年、IEEE Transactions on Molecular, Biological and Multi-Scale Communications、1巻:230~248頁;およびYazdiら、2015年、Sci Rep、5巻:14138頁を参照されたい)。したがって、ある特定の実施形態では、本明細書に記載の実施形態のいずれかにおける伸長記録タグ、伸長コーディングタグ、またはジタグ構築物は、エラー訂正コードである識別成分(例えば、UMI、エンコーダー配列、バーコード、コンパートメントタグ、サイクル特異的配列など)で構成される。一部の実施形態では、エラー訂正コードは、Hammingコード、Lee距離コード、非対称Lee距離コード、Reed-Solomonコード、およびLevenshtein-Tenengoltsコードから選択される。ナノポアシーケンシングに関しては、電流またはイオンフラックスプロファイルおよび非対称の塩基呼び出しエラーは使用されるナノポアの型および生化学的性質に内因するものであり、上述のエラー訂正手法を使用してよりロバストなDNAコードを設計するためにこの情報を使用することができる。ロバストなDNAナノポアシーケンシングバーコードの使用に対する代替として、バーコード配列の電流またはイオンフラックスシグネチャを直接使用し(その全体が参照により組み込まれる、米国特許第7,060,507号)、それによりDNA塩基呼び出しを完全に回避し、バーコード配列を、Laszloら(2014年、Nat. Biotechnol.、32巻:829~833頁、その全体が参照により組み込まれる)に記載されている通り、予測される電流/フラックスシグネチャにマッピングし戻すことによってすぐに識別することができる。この論文において、Laszloらは、生物学的ナノポア、MspAから、異なるワードのつながりをナノポアを通過させた時に生じる電流シグネチャ、ならびに、得られた電流シグネチャを配列のユニバースからの可能性のある電流シグネチャのin silico予測にマッピングし戻すことによってDNA鎖をマッピングおよび識別する能力について記載している(2014年、Nat. Biotechnol.、32巻:829~833頁)。同様の概念を、DNAコードおよびナノギャップトンネル電流に基づくDNA配列決定によって生じる電気信号に適用することができる(Ohshiroら、2012年、Sci Rep、2巻:501頁)。
したがって、ある特定の実施形態では、コーディングタグ、記録タグ、またはその両方の識別成分は、一意の電流またはイオンフラックスまたは光学的シグネチャを生成することが可能であり、本明細書において提示される方法のいずれかの解析ステップは、識別成分を識別するために一意の電流またはイオンフラックスまたは光学的シグネチャを検出することを含む。一部の実施形態では、識別成分は、エンコーダー配列、バーコード、UMI、コンパートメントタグ、サイクル特異的配列、またはそれらの任意の組合せから選択される。
ある特定の実施形態では、試料中の巨大分子(例えば、タンパク質、ポリペプチド、またはペプチド)の全量または実質的な量(例えば、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、または100%)を記録タグで標識する。巨大分子の標識は、巨大分子を固体支持体に固定化する前に行うこともでき、その後に行うこともできる。
他の実施形態では、試料中の巨大分子のサブセット(例えば、タンパク質、ポリペプチド、またはペプチド)を記録タグで標識する。特定の実施形態では、試料由来の巨大分子のサブセットに記録タグを用いて標的化(分析物特異的)標識を行う。タンパク質の標的化記録タグ標識は、相補的な標的特異的ベイト配列、例えば記録タグ内の分析物特異的バーコードとアニーリングする短い標的特異的DNA捕捉用プローブ、例えば分析物特異的バーコードと連結した標的タンパク質特異的結合性物質(例えば、抗体、アプタマーなど)を使用して実現することができる(例えば図28Aを参照されたい)。記録タグは、標的タンパク質上に存在する同類の反応性部分(例えば、クリックケミストリー標識、光親和性標識)に対する反応性部分を含む。例えば、記録タグは、アルキンで誘導体化されたタンパク質と相互作用させるためのアジド部分を含んでよい、または、記録タグは、ネイティブなタンパク質で相互作用させるためのベンゾフェノンを含んでよい、などである(例えば図28A~Bを参照されたい)。標的タンパク質に標的タンパク質特異的結合性物質を結合させたら、記録タグおよび標的タンパク質をそれらの対応する反応性部分を介してカップリングさせる(例えば図28B~Cを参照されたい)。標的タンパク質を記録タグで標識した後、標的タンパク質特異的結合性物質を、標的タンパク質特異的結合性物質に連結したDNA捕捉用プローブの消化によって除去することができる。例えば、DNA捕捉用プローブをウラシル塩基が含有されるように設計することができ、次いでこれを、ウラシル特異的切除試薬(例えば、USER(商標))を用いた消化の標的とし、標的タンパク質特異的結合性物質を標的タンパク質から解離させることができる。
一実施例では、標的タンパク質のセットに特異的な抗体を、相補的なベイト配列(例えば、図28の分析物バーコードBCの)を用いて設計した記録タグとハイブリダイズするDNA捕捉用プローブ(例えば、図28の分析物バーコードBC)で標識することができる。タンパク質の試料特異的標識は、試料特異的バーコードを含む記録タグ上の相補的なベイト配列とハイブリダイズするDNA捕捉用プローブで標識された抗体を使用することによって実現することができる。
別の例では、標的タンパク質特異的アプタマーを試料中のタンパク質のサブセットの標的化記録タグ標識のために使用する。標的特異的アプタマーを、記録タグ内の相補的なベイト配列とアニーリングするDNA捕捉用プローブに連結する。記録タグは、対応する反応性部分を有する標的タンパク質とカップリングするための反応性化学プローブまたは光反応性化学プローブ(例えば、ベンゾフェノン(BP))を含む。アプタマーがその標的タンパク質分子に結合し、記録タグが標的タンパク質の極めて近傍になり、その結果、記録タグと標的タンパク質がカップリングする。
小分子タンパク質親和性リガンドに付着させた光反応性化学プローブを使用した光親和性(PA)タンパク質標識は以前記載されている(Park, Kohら、2016年)。典型的な光反応性化学プローブとしては、以前に記載されている照射波長の下で活性化されたベンゾフェノンに基づくプローブ(反応性ジラジカル、365nm)、フェニルジアジリンに基づくプローブ(反応性炭素、365nm)、およびアジ化フェニルに基づくプローブ(反応性ニトレンフリーラジカル、260nm)が挙げられる(SmithおよびCollins、2015年)。好ましい実施形態では、タンパク質試料中の標的タンパク質を、Liらにより開示された、ベンゾフェノンで標識した記録タグ内のベイト配列を同類結合性物質(例えば、核酸アプタマー(例えば図28を参照されたい))に付着させたDNA捕捉用プローブとハイブリダイズさせる方法(Li、Liuら、2013年)を使用して試料バーコードを含む記録タグで標識する。光親和性標識されたタンパク質標的に関しては、光親和性部分により標的タンパク質ではなく抗体が自己標識される可能性があるので、抗体よりもDNA/RNAアプタマーを標的タンパク質特異的結合性物質として使用することが好ましい。対照的に、光親和性標識は、核酸に対してはタンパク質よりも効率が低く、それにより、DNA指向性化学標識または光標識についてはアプタマーがより良好なビヒクルになる。光親和性標識と同様に、Rosenら(Rosen、Kodalら、2014年、Kodal、Rosenら、2016年)記載されているものと同様に、アプタマー結合性部位の近傍にある反応性リシン(または他の部分)のDNA指向性化学標識を使用することもできる。
上述の実施形態では、標的特異的結合性物質と記録タグを連結するために、ハイブリダイゼーションに加えて他の型の連結を使用することができる(例えば図28Aを参照されたい)。例えば、図28Bに示されている通り、2つの部分を、捕捉された標的タンパク質(または他の巨大分子)が記録タグと共有結合したら、切断され、結合性物質を放出するように設計されたリンカーを使用して共有結合により連結することができる。適切なリンカーを記録タグの様々な位置、例えば、3’末端、または記録タグの5’末端に付着させたリンカー内などに付着させることができる。
E.結合性物質およびコーディングタグ
一態様では、本明細書に記載のキットは、分析物、例えば巨大分子、に結合することが可能な結合性物質を含む。結合性物質は、巨大分子の成分もしくは特徴部に結合することが可能な任意の分子(例えば、ペプチド、ポリペプチド、タンパク質、核酸、炭水化物、小分子など)であってよい。結合性物質は、天然に存在するものであってもよく、合成的に産生されたものであってもよく、組換え発現された分子であってもよい。結合性物質は、巨大分子の単一の単量体またはサブユニット(例えば、ペプチドの単一のアミノ酸)に結合することもあり、または巨大分子の多数の連結したサブユニット(例えば、より長いペプチド分子のジペプチド、トリペプチド、またはより高次のペプチド)に結合することもある。
ある特定の実施形態では、結合性物質を、共有結合により結合するように設計することができる。共有結合は、正確な部分への結合が条件付けられるまたはそれが有利になるように設計することができる。例えば、NTAAおよびその同類のNTAA特異的結合性物質はそれぞれ、NTAA特異的結合性物質が同類のNTAAに結合したらカップリング反応が行われてこれら2つの間に共有結合性の連結が生じるように、反応性基を用いて修飾することができる。同類の反応性基を欠く他の位置への結合性物質の非特異的結合では共有結合による付着はもたらされない。結合性物質とその標的の間の共有結合により、非特異的に結合した結合性物質を除去するためによりストリンジェントな洗浄を使用することが可能になり、したがって、アッセイの特異度が増大する。
ある特定の実施形態では、結合性物質は、選択的結合性物質であってよい。本明細書で使用される場合、選択的結合とは、結合性物質が、特異的なリガンド(例えば、アミノ酸またはアミノ酸のクラス)に、異なるリガンド(例えば、アミノ酸またはアミノ酸のクラス)への結合と比べて優先的に結合できることを指す。選択性は、一般に、結合性物質との複合体において1つのリガンドが別のリガンドで置換される反応についての平衡定数とされる。一般には、そのような選択性は、リガンドの空間的な幾何学的形状ならびに/またはリガンドが結合性物質に結合する様式および程度、例えば、水素結合またはファンデルワールス力(非共有結合性の相互作用)によるもしくは可逆的または非可逆的な共有結合による、結合性物質への付着などに関連付けられる。選択性は、絶対的なものとは対照的に相対的なものであってよいこと、および、リガンド濃度を含めた種々の因子が選択性に影響を及ぼし得ることも理解されるべきである。したがって、一実施例では、結合性物質は、20種の標準のアミノ酸のうちの1種に選択的に結合する。非選択的結合の例では、結合性物質は、20種の標準のアミノ酸のうちの2種またはそれよりも多くに結合し得る。
本明細書に開示されているキットおよび方法の実施において、巨大分子の特徴部または成分に選択的に結合する結合性物質の能力は、結合性物質のコーディングタグ情報の巨大分子に付随する記録タグへの移行、記録タグ情報のコーディングタグへの移行、またはコーディングタグ情報および記録タグ情報のジタグ分子への移行を可能にするために十分なものでありさえすればよい。したがって、選択的にとは、巨大分子が暴露される他の結合性物質と比較してそうでありさえすればよい。結合性物質の選択性が、特定のアミノ酸に対して絶対的なものである必要はなく、非極性側鎖もしくは極性でない側鎖を有するアミノ酸、または電気的に(正にもしくは負に)荷電した側鎖を有するアミノ酸、または芳香族側鎖を有するアミノ酸などのアミノ酸のクラスに、あるいは側鎖の何らかの特異的なクラスまたはサイズなどに選択的なものであってよいことも理解されるべきである。
特定の実施形態では、結合性物質は、目的の巨大分子に対して高い親和性および高い選択性を有する。特に、低い解離速度を伴う高い結合親和性がコーディングタグと記録タグの間の情報移行に効果的である。ある特定の実施形態では、結合性物質は、約50nMのもしくはそれ未満の、約10nMのもしくはそれ未満の、約5nMのもしくはそれ未満の、約1nMのもしくはそれ未満の、約0.5nMのもしくはそれ未満の、または約0.1nMのもしくはそれ未満のKを有する。ある特定の実施形態では、結合性物質をそのKの>10×、>100×、または>1000×の濃度で巨大分子に添加して結合を完了に至らせる。単一のタンパク質分子への抗体の結合カイネティクスに関する詳細な考察は、Changら(Chang, Rissin et al. 2012)に記載されている。
結合性物質の、ペプチドの小さなN末端アミノ酸(NTAA)に対する親和性を増大させるために、NTAAを、ジニトロフェノール(DNP)などの「免疫原性」ハプテンで修飾することができる。これは、DNP基をNTAAのアミン基に付着させるサンガー試薬であるジニトロフルオロベンゼン(DNFB)を使用して周期的な配列決定手法で実行することができる。商業的な抗DNP抗体は、低nM範囲(約8nM、LO-DNP-2)で親和性を有する(Bilgicer, Thomasら、2009年);そのように、DNPで(DNFBを介して)修飾されたいくつものNTAAに対して親和性が高いNTAA結合性物質を操作し、同時に特定のNTAAに対する良好な結合選択性を実現することが可能であるはずなのは当然である。別の例では、NTAAを、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)を使用してスルホニルニトロフェノール(SNP)で修飾することができる。アセチル基またはアミジニル(グアニジニル)基などの代替的なNTAA修飾因子を用いて同様の親和性の増強を実現することもできる。
ある特定の実施形態では、結合性物質は、ペプチド分子のNTAA、CTAA、介在するアミノ酸、ジペプチド(2つのアミノ酸の配列)、トリペプチド(3つのアミノ酸の配列)、またはより高次のペプチドに結合し得る。一部の実施形態では、結合性物質のライブラリー内の各結合性物質は、特定のアミノ酸、例えば、20種の標準の天然に存在するアミノ酸のうちの1種に選択的に結合する。標準の、天然に存在するアミノ酸としては、アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リシン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、トレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)が挙げられる。
ある特定の実施形態では、結合性物質は、アミノ酸の翻訳後修飾に結合し得る。一部の実施形態では、ペプチドは、1つまたは複数の翻訳後修飾を含み、これは、同じものであっても異なるものであってもよい。ペプチドのNTAA、CTAA、介在するアミノ酸、またはこれらの組合せを翻訳後に修飾することができる。アミノ酸に対する翻訳後修飾としては、アシル化、アセチル化、アルキル化(メチル化を含む)、ビオチン化、ブチリル化、カルバミル化、カルボニル化、脱アミド化、脱イミノ化、ジフタミド形成、ジスルフィド架橋形成、エリミニル化、フラビン付着、ホルミル化、ガンマ-カルボキシル化、グルタミル化、グリシル化、グリコシル化、グリコシルホスファチジルイノシトール付加(glypiation)、ヘムC付着、ヒドロキシル化、ハイプシン形成、ヨウ素化、イソプレニル化、脂質付加、リポイル化、マロニル化、メチル化、ミリストイル化、酸化、パルミトイル化、ペグ化、ホスホパンテテイニル化、リン酸化、プレニル化、プロピオニル化、レチニリデンシッフ塩基形成、S-グルタチオン化、S-ニトロシル化、S-スルフェニル化、セレン化、サクシニル化、スルフィン化、ユビキチン化、およびC末端アミド化が挙げられる(SeoおよびLee、2004年、J. Biochem. Mol. Biol.、37巻:35~44頁も参照されたい)。
ある特定の実施形態では、タンパク質、ポリペプチド、またはペプチドのグリコシル化の状態を検出するための結合性物質としてレクチンを使用する。レクチンは、遊離の炭水化物または糖タンパク質のグリカンエピトープを選択的に認識することができる炭水化物-結合性タンパク質である。種々のグリコシル化の状態(例えば、コア-フコース、シアル酸、N-アセチル-D-ラクトサミン、マンノース、N-アセチル-グルコサミン)を認識するレクチンの一覧は、A、AAA、AAL、ABA、ACA、ACG、ACL、AOL、ASA、BanLec、BC2L-A、BC2LCN、BPA、BPL、Calsepa、CGL2、CNL、Con、ConA、DBA、Discoidin、DSA、ECA、EEL、F17AG、Gal1、Gal1-S、Gal2、Gal3、Gal3C-S、Gal7-S、Gal9、GNA、GRFT、GS-I、GS-II、GSL-I、GSL-II、HHL、HIHA、HPA、I、II、Jacalin、LBA、LCA、LEA、LEL、Lentil、Lotus、LSL-N、LTL、MAA、MAH、MAL_I、Malectin、MOA、MPA、MPL、NPA、Orysata、PA-IIL、PA-IL、PALa、PHA-E、PHA-L、PHA-P、PHAE、PHAL、PNA、PPL、PSA、PSL1a、PTL、PTL-I、PWM、RCA120、RS-Fuc、SAMB、SBA、SJA、SNA、SNA-I、SNA-II、SSA、STL、TJA-I、TJA-II、TxLCI、UDA、UEA-I、UEA-II、VFA、VVA、WFA、WGAを含む(Zhangら、2016年、MABS、8巻:524~535頁を参照されたい)。
ある特定の実施形態では、結合性物質は、修飾または標識されたNTAAに結合し得る。修飾または標識されたNTAAは、PITC、1-フルオロ-2,4-ジニトロベンゼン(サンガー試薬、DNFB)、ダンシルクロリド(DNS-Cl、もしくは1-ジメチルアミノナフタレン-5-スルホニルクロリド)、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)、アセチル化試薬、グアニジニル化試薬、チオアシル化試薬、チオアセチル化試薬、またはチオベンジル化試薬で標識されているものであり得る。
ある特定の実施形態では、結合性物質は、アプタマー(例えば、ペプチドアプタマー、DNAアプタマー、またはRNAアプタマー)、抗体、アンチカリン、ATP依存性Clpプロテアーゼアダプタータンパク質(ClpS)、抗体結合性断片、抗体模倣物、ペプチド、ペプチド模倣物、タンパク質、またはポリヌクレオチド(例えば、DNA、RNA、ペプチド核酸(PNA)、γPNA、架橋核酸(BNA)、異種核酸(XNA)、グリセロール核酸(GNA)、またはトレオース核酸(TNA)、またはそのバリアント)であってよい。
本明細書で使用される場合、抗体(antibody)および抗体(antibodies)という用語は、広範な意味で使用され、インタクトな抗体分子、例えば、これだけに限定されないが、免疫グロブリンA、免疫グロブリンG、免疫グロブリンD、免疫グロブリンE、および免疫グロブリンMだけでなく、少なくとも1つのエピトープに免疫特異的に結合する抗体分子の任意の免疫反応性成分(複数可)も含む。抗体は、天然に存在するものであってもよく、合成的に作製されたものであってもよく、組換えによって発現させたものであってもよい。抗体は、融合タンパク質であってよい。抗体は、抗体模倣物であってよい。抗体の例としては、これだけに限定されないが、Fab断片、Fab’断片、F(ab’)断片、単鎖抗体断片(scFv)、ミニボディ(miniantibody)、ダイアボディ(diabody)、架橋結合した抗体断片、Affibody(商標)、ナノボディ、単一ドメイン抗体、DVD-Ig分子、アルファボディ、アフィマー(affimer)、アフィチン(affitin)、サイクロチド、分子などが挙げられる。抗体工学またはタンパク質工学技法を使用して得られる免疫反応性産物もまた、明白に抗体という用語の意味の範囲内に入る。関連するプロトコールを含めた抗体および/またはタンパク質工学の詳細な説明は、他の場所の中でも、J. MaynardおよびG. Georgiou、2000年、Ann. Rev. Biomed. Eng.、2巻:339~76頁;Antibody Engineering、R. KontermannおよびS. Dubel編、Springer Lab Manual、Springer Verlag(2001年);米国特許第5,831,012号;およびS. Paul、Antibody Engineering Protocols、Humana Press(1995年)において見いだすことができる。
抗体と同様に、ペプチドを特異的に認識する核酸およびペプチドアプタマーは、公知の方法を使用して作製することができる。アプタマーは、標的分子に、高度に特異的な、コンフォメーション依存性様式で結合し、一般には、非常に高い親和性を有するが、より低い結合親和性を有するアプタマーも所望であれば選択することができる。アプタマーは、標的間を、メチル基またはヒドロキシル基が存在するかしないかなどの非常に小さな構造的差異に基づいて区別することが示されており、また、ある特定のアプタマーは、D-鏡像異性体とL-鏡像異性体を区別することができる。薬物、金属イオン、および有機色素、ペプチド、ビオチン、ならびに、これだけに限定されないが、ストレプトアビジン、VEGF、およびウイルスタンパク質を含めたタンパク質を含めた小分子標的に結合するアプタマーが得られている。アプタマーは、ビオチン化の後、フルオレセイン標識の後、ならびにガラス表面およびマイクロスフェアに付着した際に機能活性を保持することが示されている(Jayasena、1999年、Clin Chem、45巻:1628~50頁;Kusser、2000年、J. Biotechnol.、74巻:27~39頁;Colas、2000年、Curr Opin Chem Biol、4巻:54~9頁を参照されたい)。アルギニンおよびAMPに特異的に結合するアプタマーも記載されている(PatelおよびSuri、2000年、J. Biotech.、74巻:39~60頁を参照されたい)。特定のアミノ酸に結合するオリゴヌクレオチドアプタマーがGoldら(1995年、Ann. Rev. Biochem.、64巻:763~97頁)に開示されている。アミノ酸に結合するRNAアプタマーも記載されている(AmesおよびBreaker、2011年、RNA Biol.、8巻;82~89頁;Mannironiら、2000年、RNA、6巻:520~27頁;Famulok、1994年、J. Am. Chem. Soc.、116巻:1698~1706頁)。
結合性物質は、天然に存在するまたは合成的に産生されたタンパク質を、アミノ酸配列内に1つまたは複数の変異が導入されるように遺伝子工学によって操作することにより修飾して、巨大分子の特定の成分もしくは特徴部(例えば、NTAA、CTAA、または翻訳後修飾されたアミノ酸またはペプチド)に結合する操作されたタンパク質を生じさせることによって、作製することができる。例えば、エキソペプチダーゼ(例えば、アミノペプチダーゼ、カルボキシペプチダーゼ)、エキソプロテアーゼ、変異エキソプロテアーゼ、変異アンチカリン、変異ClpS、抗体、またはtRNA合成酵素を修飾して、特定のNTAAに選択的に結合する結合性物質を創出することができる。別の例では、カルボキシペプチダーゼを修飾して、特定のCTAAに選択的に結合する結合性物質を創出することができる。結合性物質を、修飾されたNTAAまたは修飾されたCTAA、例えば、翻訳後修飾(例えば、リン酸化NTAAまたはリン酸化CTAA)を有するもの、または標識(例えば、PTC、1-フルオロ-2,4-ジニトロベンゼン(サンガー試薬、DNFBを使用して)で、ダンシルクロリドで(DNS-Cl、もしくは1-ジメチルアミノナフタレン-5-スルホニルクロリドを使用して)、またはチオアシル化試薬、チオアセチル化試薬、アセチル化試薬、アミジン化(グアニジニル化)試薬もしくはチオベンジル化試薬を使用して修飾されたものに特異的に結合するように設計または修飾し、利用することもできる。タンパク質の定向進化のための戦略は、当技術分野で公知であり(例えば、Yuan et al., 2005, Microbiol. Mol. Biol. Rev. 69:373-392によって概説されている)、ファージディスプレイ、リボソームディスプレイ、mRNAディスプレイ、CISディスプレイ、CADディスプレイ、エマルジョン、細胞表面ディスプレイ法、酵母表面ディスプレイ、細菌表面ディスプレイなどを含む。
一部の実施形態では、修飾されたNTAAに選択的に結合する結合性物質を利用することができる。例えば、NTAAをフェニルイソチオシアネート(PITC)と反応させてフェニルチオカルバモイル-NTAA誘導体を形成することができる。このように、結合性物質をフェニルチオカルバモイル部分のフェニル基ならびにNTAAのアルファ炭素R基のどちらにも選択的に結合するように適合させることができる。このように、PITCを使用することにより、以下に考察する通り、その後の、NTAAのエドマン分解による切断が可能になる。別の実施形態では、NTAAをサンガー試薬(DNFB)と反応させて、DNPで標識されたNTAAを生成することができる(例えば図3を参照されたい)。任意選択で、DNFBを、DNFBが高度に可溶性である1-エチル-3-メチルイミダゾリウムビス[(トリフルオロメチル)スルホニル]イミド([エミン][Tf2N])などのイオン性液体と共に使用する。このように、結合性物質を、DNPとNTAAのR基の組合せに選択的に結合するように操作することができる。DNP部分の付加により、結合性物質とNTAAの相互作用に対するより大きな「ハンドル」がもたらされ、より高い親和性相互作用が導かれるはずである。さらに別の実施形態では、結合性物質は、DNPで標識されたNTAAを認識し、それによりペプチドのアミノペプチダーゼ分解の周期的制御がもたらされるように操作されたアミノペプチダーゼであってよい。DNPで標識されたNTAAが切断されたら、新しく露出したNTAAへの結合およびその切断のためにDNFB誘導体化の別のサイクルを実施する。好ましい特定の実施形態では、アミノペプチダーゼは、単量体メタロ-プロテアーゼであり、そのようなアミノペプチダーゼは亜鉛によって活性化される(CalcagnoおよびKlein、2016年)。別の例では、結合性物質は、例えば4-スルホニル-2-ニトロフルオロベンゼン(SNFB)を使用することによってスルホニルニトロフェノール(SNP)で修飾されたNTAAに選択的に結合し得る。さらに別の実施形態では、結合性物質は、アセチル化されたまたはアミジン化されたNTAAに選択的に結合し得る。
NTAAを修飾するために使用することができる他の試薬としては、トリフルオロエチルイソチオシアネート、イソチオシアン酸アリル、およびジメチルアミノアゾベンゼンイソチオシアネートが挙げられる。
結合性物質を、修飾されたNTAAに対する高い親和性、修飾されたNTAAに対する高い特異性、またはその両方のために操作することができる。一部の実施形態では、結合性物質を、ファージディスプレイを使用して有望な親和性足場の定向進化によって開発することができる。中等度からより低い親和性の結合性物質については、同時の結合/エンコーディングステップを使用することにより効率的な情報移行を果たすことができ、または代替的に、エンコーディングもしくは情報書き込みステップの温度を低下させて、結合性物質の解離速度を緩徐化することができる。一部の実施形態では、同時の結合/エンコーディングステップを、エンコーディングもしくは情報書き込みステップの温度低下と組み合わせることができる。一部の実施形態では、分析物への結合性部分の最初の結合後、結合性物質の結合性部分を、例えば架橋剤により、分析物に(直接または間接的に)共有結合させて、結合性物質の解離速度を緩徐化することができる。これは、中等度からより低い親和性の結合性物質に有用であり得る。
個々のまたは小さな群の標識(ビオチン化)されたNTAAに結合し、それを切断する操作されたアミノペプチダーゼ変異体が記載されている(その全体が参照により組み込まれる、例えばPCT公開第WO2010/065322号を参照されたい)。アミノペプチダーゼは、タンパク質またはペプチドのN末端からアミノ酸を切断する酵素である。天然のアミノペプチダーゼは、非常に限られた特異性を有し、一般的に、N末端アミノ酸を前進的に切断し、アミノ酸を次々に切断する(Kishorら、2015年、Anal. Biochem.、488巻:6~8頁)。しかし、残基特異的アミノペプチダーゼが同定されている(Eriquezら、J. Clin. Microbiol.、1980年、12巻:667~71頁;Wilceら、1998年、Proc. Natl. Acad. Sci. USA、95巻:3472~3477頁;Liaoら、2004年、Prot. Sci.、13巻:1802~10頁)。アミノペプチダーゼを、特定の部分(例えば、PTC、DNP、SNPなど)で標識された、標準のアミノ酸を表す20種の異なるNTAAに特異的に結合するように操作することができる。ペプチドのN末端の段階的分解の制御は、標識の存在下でのみ活性な(例えば、結合活性または触媒活性)、操作されたアミノペプチダーゼを使用することによって実現される。別の例では、Havranakら(米国特許公開第2014/0273004号)が、アミノアシルtRNA合成酵素(aaRS)を特異的なNTAA結合物質として操作することに関して記載している。aaRSのアミノ酸結合ポケットは、同類のアミノ酸に結合する内因性の能力を有するが、一般に、不十分な結合親和性および特異性を示す。さらに、これらの天然のアミノ酸結合物質はN末端標識を認識しない。aaRS足場の定向進化を使用して、N末端標識に関してN末端アミノ酸を認識する、親和性がより高く、特異性がより高い結合性物質を生成することができる。
別の例では、高度に選択的な操作されたClpSも文献に記載されている。Emiliらは、NTAAにアスパラギン酸、アルギニン、トリプトファンおよびロイシン残基に対して選択的に結合する能力を有する4つの異なるバリアントが得られる結果となる、E.coli ClpSタンパク質のファージディスプレイによる定向進化を記載している(その全体が参照により組み込まれる、米国特許第9,566,335号)。一実施形態では、結合性物質の結合性部分は、天然のN末端タンパク質認識および結合に関与するアダプタータンパク質の進化的に保存されるClpSファミリーのメンバーまたはそのバリアントを含む。細菌におけるアダプタータンパク質のClpSファミリーは、Schuenemannet al., (2009), "Structural basis of N-end rule substrate recognition inEscherichia coli by the ClpAP adaptor protein ClpS," EMBO Reports 10(5)、およびRoman-Hernandezet al., (2009), "Molecular basis of substrate selection by the N-end ruleadaptor protein ClpS," PNAS 106(22):8888-93に記載されている。Guo et al., (2002),JBC 277(48): 46753-62、およびWang et al., (2008), "The molecular basis ofN-end rule recognition," Molecular Cell 32: 406-414も参照されたい。一部の実施形態では、Schuenemannet al.に規定されているClpS疎水性結合ポケットに対応するアミノ酸残基を、所望の選択性を有する結合性部分を生成するように修飾する。ClpSファミリーメンバーは、ClpS1 RPA1203、ClpS2 bll5154、ClpS2 RPA3148、ClpS BAV2091、ClpS BP2756、ClpS ECP_0896、ClpS ECSE_0939、ClpS SG1101、ClpS SCO2916、SCE19A.16c、ClpS Sputw3181_1781、ClpS VC_1143、ClpS WS0336、ClpS XCC1966、ClpS Tcr_1111、ClpS TDE_2123、ClpS ZMO1725、ClpS1 bll2636、ClpS BCAN_A1188、ClpS BamMC406_2437、ClpS Bamb_2567、ClpS BMA10247_2157、ClpS BMASAVP1_A0575、ClpS BURPS1106A_0963、ClpS Bcep1808_2597、ClpS CCNA_02552、およびその断片、バリアント、変異体、ホモログまたは修飾バージョンを含むが、これらに限定されない。
一実施形態では、結合性物質の結合性部分は、Stein et al., (2016),"Structural Basis of an N-Degron Adaptor with More StringentSpecificity," Structure 24(2): 232-242において開示されているものなどの、ClpS2タンパク質もしくはポリペプチドまたはその断片を含む。一部の実施形態では、本明細書に開示されているClpSタンパク質またはポリペプチドは、A.tumefaciens ClpS2(例えば、配列番号198)、E.coli ClpS(例えば、配列番号199)および/またはC.crescentus ClpS(例えば、配列番号200)などの参照ClpSタンパク質またはポリペプチドと配列同一性を共有する、バリアント、変異体、ホモログまたは修飾バージョンを含む。一態様では、結合性物質の結合性部分は、配列番号198と、配列番号199と、および/または配列番号200と約10%配列同一性、約15%配列同一性、約20%配列同一性、約25%配列同一性、約30%配列同一性、約35%配列同一性、約40%配列同一性、約45%配列同一性、約50%配列同一性、約55%配列同一性、約60%配列同一性、約65%配列同一性、約70%配列同一性、約75%配列同一性、約80%配列同一性、約85%配列同一性、約90%、91%、92%、93%、94%、95%、96%、97%、98%もしくは99%配列同一性、または約100%配列同一性を有するポリペプチド配列を含む。
一実施形態では、結合性部分は、UBRボックス認識配列ファミリーのメンバー、またはUBRボックス認識配列ファミリーのバリアントを含む。UBR認識ボックスは、Tasaki et al., (2009), JBC 284(3): 1884-95に記載されている。例えば、結合性部分は、UBR1、UBR2、またはその変異体、バリアントもしくはホモログを含み得る。
ある特定の実施形態では、結合性物質は、結合性部分に加えて、蛍光標識などの1つまたは複数の検出可能な標識をさらに含む。一部の実施形態では、結合性物質は、コーディングタグなどのポリヌクレオチドを含まない。必要に応じて、結合性物質は、合成または天然抗体を含む。一部の実施形態では、結合性物質は、アプタマーを含む。一実施形態では、結合性物質は、E.Coli ClpS結合性ポリペプチドのバリアントなどの、アダプタータンパク質のClpSファミリーの修飾されたメンバーなどの、ポリペプチドと、検出可能な標識とを含む。一実施形態では、検出可能な標識は、光学的に検出可能である。一部の実施形態では、検出可能な標識は、蛍光部分、色分けされたナノ粒子、量子ドットまたはこれらの任意の組合せを含む。一実施形態では、標識は、FluoSphere(商標)、Nile Red、フルオレセイン、ローダミン、誘導体化ローダミン色素、例えばTAMRA、リン光体、ポリメタジン色素、蛍光ホスホロアミダイト、TEXAS RED、緑色蛍光タンパク質、アクリジン、シアニン、シアニン5色素、シアニン3色素、5-(2’-アミノエチル)-アミノナフタレン-1-スルホン酸(EDANS)、BODIPY、120 ALEXAまたは前述のもののいずれかについての誘導体もしくは修飾体などの、コア色素分子を包含するポリスチレン色素を含む。一実施形態では、検出可能な標識は、光退色に対して耐性である上に、高いシグナル対ノイズ比で、一意の、容易に検出可能な波長で、沢山のシグナル(例えば、光子)を生じさせる。
特定の実施形態では、アンチカリンを、標識されたNTAA(例えば、DNP、SNP、アセチル化など)に対する高い親和性および高い特異性の両方について操作する。アンチカリン足場のある特定の変形は、ベータバレル構造に起因して、単一のアミノ酸への結合に適した形状を有する。N末端アミノ酸(修飾を伴うまたは伴わない)は、この「ベータバレル」バケットに潜在的に適合し、認識され得る。操作された新規の結合活性を有する親和性が高いアンチカリンが記載されている(Skerra、2008年、FEBS J.、275巻:2677~2683頁によって概説されている)。例えば、フルオレセインおよびジゴキシゲニンに対して親和性が高い結合性(低nM)を有するアンチカリンが操作されている(GebauerおよびSkerra、2012年)。新しい結合機能のために代替的足場を操作することについては、Bantaら(2013年、Annu. Rev. Biomed. Eng.、15巻:93~113頁)によっても概説されている。
所与の一価の結合性物質の機能的親和性(結合活性)を、一価の結合性物質の二価またはより高次の多量体を使用することによって少なくとも1桁分だけ増大させることができる(VauquelinおよびCharlton、2013年)。結合活性とは、多数の同時に存在する非共有結合性の相互作用の蓄積された強度を指す。個々の結合相互作用は容易に解離し得る。しかし、多数の結合相互作用が同時に存在する場合、単一の結合相互作用の一過性の解離では結合性タンパク質は発散せず、結合相互作用は回復する可能性がある。結合性物質の結合活性を増大させるための代替的方法は、結合性物質に付着させるコーディングタグと巨大分子に付随させる記録タグに相補配列を含めることである。
一部の実施形態では、修飾されたC末端アミノ酸(CTAA)に選択的に結合する結合性物質を利用することができる。カルボキシペプチダーゼは、遊離のカルボキシル基を含有する末端アミノ酸を切断するプロテアーゼである。いくつものカルボキシペプチダーゼがアミノ酸の優先性を示し、例えば、カルボキシペプチダーゼBは、アルギニンおよびリシンなどの塩基性アミノ酸において優先的に切断する。カルボキシペプチダーゼを改変して、特定のアミノ酸に選択的に結合する結合性物質を創出することができる。一部の実施形態では、カルボキシペプチダーゼを、修飾部分ならびにCTAAのアルファ炭素R基のどちらにも選択的に結合するように操作することができる。したがって、操作されたカルボキシペプチダーゼは、C末端標識に関連して標準のアミノ酸を表す20種の異なるCTAAを特異的に認識し得る。ペプチドのC末端からの段階的分解の制御は、標識の存在下でのみ活性な(例えば、結合活性または触媒活性)操作されたカルボキシペプチダーゼを使用することによって実現される。一実施例では、CTAAをパラ-ニトロアニリド基または7-アミノ-4-メチルクマリニル基によって修飾することができる。
本明細書に記載の方法において使用するための結合物質を生成するために操作することができる他の潜在的な足場としては、アンチカリン、アミノ酸tRNA合成酵素(aaRS)、ClpS、Affilin(登録商標)、Adnectin(商標)、T細胞受容体、ジンクフィンガータンパク質、チオレドキシン、GST A1-1、DARPin、アフィマー、アフィチン、アルファボディ(alphabody)、アビマー(avimer)、クニッツドメインペプチド、モノボディ(monobody)、単一ドメイン抗体、EETI-II、HPSTI、細胞内抗体、リポカリン、PHD-フィンガー、V(NAR)LDTI、エビボディ(evibody)、Ig(NAR)、ノッチン、マキシボティ(maxibody)、ネオカルジノスタチン、pVIII、テンダミスタット、VLR、プロテインA足場、MTI-II、エコチン、GCN4、Im9、クニッツドメイン、ミクロボディ、PBP、トランスボディ(trans-body)、テトラネクチン(tetranectin)、WWドメイン、CBM4-2、DX-88、GFP、iMab、Ldl受容体ドメインA、Min-23、PDZ-ドメイン、トリ膵臓ポリペプチド、カリブドトキシン/10Fn3、ドメイン抗体(Dab)、a2p8アンキリンリピート、昆虫防御Aペプチド、設計されたARタンパク質、C型レクチンドメイン、ブドウ球菌ヌクレアーゼ、Src相同性ドメイン3(SH3)、またはSrc相同性ドメイン2(SH2)が挙げられる。
結合性物質を、より高い温度および穏やかな変性条件(例えば、尿素、グアニジンチオシアネート、イオン溶液の存在など)に耐えるように操作することができる。変性剤の使用は、結合性物質の直鎖ペプチドエピトープへの結合に干渉する可能性がある、表面に結合したペプチドの二次構造、例えば、α-ヘリックス構造、β-ヘアピン、β-鎖、および他のこのような構造などを低減するのに役立つ。一実施形態では、結合サイクル中にペプチド二次構造を低減するために1-エチル-3-メチルイミダゾリウムアセテート([EMIM]+[ACE])などのイオン性液体を使用する(Lesch、Heuerら、2015年)。
記載されている任意の結合性物質はまた、結合性物質に関する識別情報を含有するコーディングタグも含む。コーディングタグは、それが付随する結合性物質に関する一意の識別情報をもたらす約3塩基~約100塩基の核酸分子である。コーディングタグは、約3~約90塩基、約3~約80塩基、約3~約70塩基、約3~約60塩基、約3塩基~約50塩基、約3塩基~約40塩基、約3塩基~約30塩基、約3塩基~約20塩基、約3塩基~約10塩基、または約3塩基~約8塩基を含み得る。一部の実施形態では、コーディングタグは、約3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基、10塩基、11塩基、12塩基、13塩基、14塩基、15塩基、16塩基、17塩基、18塩基、19塩基、20塩基、25塩基、30塩基、35塩基、40塩基、55塩基、60塩基、65塩基、70塩基、75塩基、80塩基、85塩基、90塩基、95塩基、または100塩基の長さである。コーディングタグは、DNA、RNA、ポリヌクレオチド類似体、またはこれらの組合せで構成されるものであってよい。ポリヌクレオチド類似体は、PNA、ガンマPNA、BNA、GNA、TNA、LNA、モルホリノポリヌクレオチド、2’-O-メチルポリヌクレオチド、アルキルリボシル置換ポリヌクレオチド、ホスホロチオエートポリヌクレオチド、および7-デアザプリン類似体を含む。
コーディングタグは、付随する結合性物質に関する識別情報をもたらすエンコーダー配列を含む。エンコーダー配列は、約3塩基~約30塩基、約3塩基~約20塩基、約3塩基~約10塩基、または約3塩基~約8塩基である。一部の実施形態では、エンコーダー配列は、約3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基、10塩基、11塩基、12塩基、13塩基、14塩基、15塩基、20塩基、25塩基、または30塩基の長さである。エンコーダー配列の長さにより、生成され得る一意のエンコーダー配列の数が決定される。コード配列が短いほど、生成される一意のコード配列の数が少なくなり、これは、少数の結合性物質を使用する場合に有用であり得る。巨大分子の集団を解析する場合にはより長いエンコーダー配列が望ましい可能性がある。例えば、5塩基のエンコーダー配列は式5’-NNNNN-3’(配列番号135)(式中、Nは任意の天然に存在するヌクレオチドまたは類似体であってよい)を有する。4種の天然に存在するヌクレオチドA、T、C、およびGを使用すると、5塩基の長さを有する一意のエンコーダー配列の総数は1,024になる。一部の実施形態では、例えば、塩基が全て同一であるか、少なくとも3つの連続した塩基が同一であるか、またはその両方であるエンコーダー配列を除くことにより、一意のエンコーダー配列の総数を減らすことができる。特定の実施形態では、≧50種の一意のエンコーダー配列のセットを結合性物質ライブラリーに使用する。
一部の実施形態では、コーディングタグまたは記録タグの識別成分、例えば、エンコーダー配列、バーコード、UMI、コンパートメントタグ、分配バーコード、試料バーコード、空間的領域バーコード、サイクル特異的配列またはそれらの任意の組合せを、Hamming距離、Lee距離、非対称Lee距離、Reed-Solomon、Levenshtein-Tenengolts、または同様のエラー訂正方法に供する。Hamming距離は、長さが等しい2つのつながりの間の異なる位置の数を指す。Hamming距離により、1つのつながりを他のつながりに変えるために必要な置換の最小数が測定される。Hamming距離は、妥当な距離があいたエンコーダー配列を選択することによってエラーを訂正するために使用することができる。したがって、エンコーダー配列が5塩基である例では、使用できるエンコーダー配列の数は256種の一意のエンコーダー配列に減少する(1→44エンコーダー配列のHamming距離=256種のエンコーダー配列)。別の実施形態では、エンコーダー配列、バーコード、UMI、コンパートメントタグ、サイクル特異的配列、またはそれらの任意の組合せを、周期的な脱コーディングプロセスによって容易に読み取られるように設計する(Gunderson、2004年、Genome Res.、14巻:870~7頁)。別の実施形態では、エンコーダー配列、バーコード、UMI、コンパートメントタグ、分配バーコード、空間バーコード、試料バーコード、サイクル特異的配列、またはそれらの任意の組合せを、一塩基分解能が必要なのではなく、多数の塩基のワード(約5~20塩基の長さ)を読み取る必要があるので、正確度の低いナノポアシーケンシングによって読み取られるように設計する。本開示の方法において使用することができる15merのエラー訂正Hammingバーコードのサブセットは配列番号1~65に記載されており、それらの対応する逆相補的な配列は配列番号66~130に記載されている。
一部の実施形態では、結合性物質のライブラリー内の一意の結合性物質のそれぞれが一意のエンコーダー配列を有する。例えば、20種の一意のエンコーダー配列を20種の標準のアミノ酸に結合する20種の結合性物質のライブラリーに使用することができる。修飾されたアミノ酸(例えば、翻訳後修飾されたアミノ酸)を識別するために追加的なコーディングタグ配列を使用することができる。別の例では、30種の一意のエンコーダー配列を20種の標準のアミノ酸および10種の翻訳後修飾されたアミノ酸(例えば、リン酸化アミノ酸、アセチル化アミノ酸、メチル化アミノ酸)に結合する30種の結合性物質のライブラリーに使用することができる。他の実施形態では、2種またはそれよりも多くの異なる結合性物質が同じエンコーダー配列を共有してよい。例えば、それぞれが異なる標準のアミノ酸に結合する2種の結合性物質が同じエンコーダー配列を共有してよい。
ある特定の実施形態では、コーディングタグは、一方の末端または両方の末端にスペーサー配列をさらに含む。スペーサー配列は、約1塩基~約20塩基、約1塩基~約10塩基、約5塩基~約9塩基、または約4塩基~約8塩基である。一部の実施形態では、スペーサーは、約1塩基、2塩基、3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基、10塩基、11塩基、12塩基、13塩基、14塩基、15塩基または20塩基の長さである。一部の実施形態では、コーディングタグ内のスペーサーは、エンコーダー配列よりも短い、例えば、エンコーダー配列よりも少なくとも1塩基、2塩基、3塩基、4塩基、5塩基、6、塩基、7塩基、8塩基、9塩基、10塩基、11塩基、12塩基、13塩基、14塩基、15塩基、20塩基、または25塩基短い。他の実施形態では、コーディングタグ内のスペーサーは、エンコーダー配列と同じ長さである。ある特定の実施形態では、スペーサーは、結合性物質特異的であり、したがって、前の結合サイクルからのスペーサーは現行の結合サイクルにおいて適切な結合性物質からのスペーサーとのみ相互作用する。例は、両方の抗体が巨大分子に逐次的に結合する場合にのみ情報移行を可能にするスペーサー配列を含有する同類の抗体の対である。スペーサー配列は、プライマー伸長反応のためのプライマーアニーリング部位、またはライゲーション反応における副子もしくは粘着末端として使用することができる。コーディングタグ上の5’スペーサー(例えば図5A、「*Sp’」を参照されたい)は、Tを上昇させるために、記録タグ上の3’スペーサーに対する偽性相補的塩基を任意選択で含有してよい(Lehoudら、2008年、Nucleic Acids Res.、36巻:3409~3419頁)。
一部の実施形態では、結合性物質の集合内のコーディングタグは、アッセイに使用される共通のスペーサー配列を共有する(例えば、多数の結合サイクル方法に使用される結合性物質のライブラリー全体がそれらのコーディングタグに共通のスペーサーを有する)。別の実施形態では、コーディングタグは、特定の結合サイクルを識別する結合サイクルタグで構成される。他の実施形態では、結合性物質のライブラリー内のコーディングタグは、結合サイクル特異的スペーサー配列を有する。一部の実施形態では、コーディングタグは、結合サイクル特異的スペーサー配列を1つ含む。例えば、第1の結合サイクルで使用される結合性物質に対するコーディングタグは「サイクル1」特異的スペーサー配列を含み、第2の結合サイクルで使用される結合性物質に対するコーディングタグは「サイクル2」特異的スペーサー配列を含み、「n」回の結合サイクルまで同様である。さらなる実施形態では、第1の結合サイクルで使用される結合性物質に対するコーディングタグは「サイクル1」特異的スペーサー配列および「サイクル2」特異的スペーサー配列を含み、第2の結合サイクルで使用される結合性物質に対するコーディングタグは「サイクル2」特異的スペーサー配列および「サイクル3」特異的スペーサー配列を含み、「n」回の結合サイクルまで同様である。この実施形態は、結合サイクルが完了した後の非連鎖状伸長記録タグのPCRアセンブリに有用である(例えば図10を参照されたい)。一部の実施形態では、スペーサー配列は、プライマー伸長反応または粘着末端ライゲーション反応を開始するために記録タグまたは伸長記録タグ内の相補的なスペーサー配列とアニーリングするのに十分な数の塩基を含む。
記録タグの集団が巨大分子に付随する場合、サイクル特異的スペーサー配列を使用してコーディングタグの情報を単一の記録タグ上に連鎖状にすることもできる。第1の結合サイクルでコーディングタグからランダムに選択された記録タグに情報を移行させ、その後の結合サイクルではサイクル依存性スペーサー配列を使用して伸長記録タグのみをプライミングすることができる。より詳細には、第1の結合サイクルで使用される結合性物質に対するコーディングタグは「サイクル1」特異的スペーサー配列および「サイクル2」特異的スペーサー配列を含み、第2の結合サイクルで使用される結合性物質に対するコーディングタグは「サイクル2」特異的スペーサー配列および「サイクル3」特異的スペーサー配列を含み、「n」回の結合サイクルまで同様である。第1の結合サイクルからの結合性物質のコーディングタグは、相補的なサイクル1特異的スペーサー配列を介して記録タグとアニーリングすることが可能である。コーディングタグ情報が記録タグに移行したら、結合サイクル1の最後に、サイクル2特異的スペーサー配列が伸長記録タグの3’末端に位置する。第2の結合サイクルからの結合性物質のコーディングタグは、相補的なサイクル2特異的スペーサー配列を介して伸長記録タグとアニーリングすることが可能である。コーディングタグ情報が伸長記録タグに移行したら、結合サイクル2の最後に、サイクル3特異的スペーサー配列が伸長記録タグの3’末端に位置し、「n」回の結合サイクルまで同様である。この実施形態は、多数の結合サイクルの中で特定の結合サイクルにおける結合情報の移行が前の結合サイクルを経た(伸長)記録タグ上でのみ起こるものとする。しかし、時には、結合性物質は同類の巨大分子に結合し損ねる。「追跡」ステップとして各結合サイクル後に結合サイクル特異的スペーサーを含むオリゴヌクレオチドを使用して、結合サイクルの事象が失敗したとしても結合サイクルを同期させたままにすることができる。例えば、同類結合性物質が結合サイクル1の間に巨大分子に結合し損ねた場合、結合サイクル1後に、サイクル1特異的スペーサー、サイクル2特異的スペーサーの両方、および「ヌル」エンコーダー配列を含むオリゴヌクレオチドを使用する追跡ステップを追加する。「ヌル」エンコーダー配列は、エンコーダー配列、または、例えば、「ヌル」結合サイクルを正に識別する特異的なバーコードが存在しないことであってよい。「ヌル」オリゴヌクレオチドは、記録タグとサイクル1特異的スペーサーを介してアニーリングすることが可能であり、サイクル2特異的スペーサーが記録タグに移行される。したがって、結合サイクル1事象の失敗にもかかわらず、結合サイクル2からの結合性物質が伸長記録タグとサイクル2特異的スペーサーを介してアニーリングすることが可能である。「ヌル」オリゴヌクレオチドにより、伸長記録タグ内で結合サイクル1に結合事象失敗の印が付けられる。
好ましい実施形態では、結合サイクル特異的エンコーダー配列をコーディングタグに使用する。結合サイクル特異的エンコーダー配列は、完全に一意の分析物(例えば、NTAA)-結合サイクルエンコーダーバーコードを使用することによって、または分析物(例えば、NTAA)エンコーダー配列とサイクル特異的バーコードを接合させた組合せ使用によってのいずれかで実現することができる(例えば図35を参照されたい)。組合せ手法を使用することの有利な点は、設計する必要がある総バーコードがより少なくなることである。10サイクルにわたって使用する20種の分析物結合性物質のセットに対しては、20種の分析物エンコーダー配列バーコードおよび10種の結合サイクル特異的バーコードのみを設計する必要がある。対照的に、結合サイクルが結合性物質エンコーダー配列に直接埋め込まれる場合には、合計200種の独立したエンコーダーバーコードを設計する必要があり得る。結合サイクル情報をエンコーダー配列に直接埋め込むことの利点は、ナノポア読み取りにエラー訂正バーコードを使用する場合にコーディングタグの全長を最小化することができることである。エラー耐性バーコードの使用により、配列決定プラットフォームおよびよりエラーが生じやすい手法を使用して高度に正確なバーコード識別が可能になるが、迅速な解析スピード、低費用、および/またはよりポータブルな器械使用などの他の利点がある。そのような例の1つは、ナノポアに基づく配列決定読み取りである。
一部の実施形態では、コーディングタグは、結合性物質の近位にある第2の(3’)スペーサー配列内の切断可能なまたはニッキング可能なDNA鎖を含む(例えば図32を参照されたい)。例えば、3’スペーサーは、ウラシル特異的切除試薬(USER)によってニッキングすることができる1つまたは複数のウラシル塩基を有してよい。USERにより、ウラシルの位置に一ヌクレオチドギャップが生成される。別の例では、3’スペーサーは、2重鎖の一方の鎖のみを加水分解するニッキングエンドヌクレアーゼの認識配列を含んでよい。例えば、3’スペーサー配列を切断またはニッキングするために使用する酵素は、一方のDNA鎖のみ(コーディングタグの3’スペーサー)に作用し、したがって、(伸長)記録タグに属する2重鎖内の他方の鎖はインタクトなまま残される。これらの実施形態は、プライマー伸長が起こった後に結合性物質を(伸長)記録タグから変性によらずに除去し、その後の結合サイクルに利用可能な一本鎖DNAスペーサー配列を伸長記録タグ上に残すことが可能になるので、タンパク質をそれらのネイティブなコンフォメーションで解析するアッセイにおいて特に有用である。
コーディングタグは、パリンドローム配列を含有するように設計することもできる。コーディングタグにパリンドローム配列を含めることにより、新生の成長している伸長記録タグが、コーディングタグ情報が移行するに従ってそれ自体でフォールディングすることが可能になる。伸長記録タグはより緻密な構造にフォールディングし、望ましくない分子間結合およびプライマー伸長事象が有効に減少する。
一部の実施形態では、コーディングタグは、同じ分析物を認識する結合性物質を用いて以前に伸長した記録タグ上でのみプライミング伸長することが可能な分析物特異的スペーサーを含む。伸長記録タグは、分析物特異的スペーサーおよびエンコーダー配列を含むコーディングタグを使用して一連の結合事象から組み立てることができる。一実施形態では、第1の結合事象では、一般的な3’スペーサープライマー配列および次の結合サイクルで使用するための5’末端の分析物特異的スペーサー配列で構成されるコーディングタグを伴う結合性物質を使用する;次いで、その後の結合サイクルでは、コードされる分析物特異的3’スペーサー配列を伴う結合性物質を使用する。この設計により、正確な一連の同類結合事象のみから創出される増幅可能なライブラリーエレメントがもたらされる。オフターゲットのおよび交差反応性結合相互作用により、増幅可能でない伸長記録タグが導かれる。一実施例では、同類結合性物質と特定の巨大分子分析物の対を2つの結合サイクルに使用して分析物を識別する。第1の同類結合性物質は、一般的な記録タグのスペーサー配列上でのプライミング伸長のための一般的なスペーサー3’配列および次の結合サイクルで使用される5’末端のコードされる分析物特異的スペーサーで構成されるコーディングタグを含有する。対応する同類結合性物質対に関しては、第2の結合性物質の3’分析物特異的スペーサーと第1の結合性物質の5’分析物特異的スペーサーを対応させる。このように、結合性物質の同類の対の正確な結合によってのみ、増幅可能な伸長記録タグがもたらされる。交差反応性結合性物質は記録タグ上でプライミング伸長することができず、増幅可能な伸長記録タグ産物は生成しない。この手法では、本明細書に開示されている方法の特異性が著しく増強される。同じ原理を、3つの結合サイクルを使用するトリプレット結合性物質セットに適用することができる。第1の結合サイクルでは、記録タグ上の一般的な3’Sp配列と結合性物質コーディングタグ上の一般的なスペーサーを相互作用させる。プライマー伸長により、分析物特異的5’スペーサーを含めたコーディングタグ情報を記録タグに移行させる。その後の結合サイクルでは、結合性物質のコーディングタグ上の分析物特異的スペーサーを使用する。
ある特定の実施形態では、コーディングタグは、コーディングタグが連結した結合性物質についての一意の分子識別子をさらに含んでよい。結合性物質についてのUMIは、配列決定読み取りのために伸長コーディングタグまたはジタグ分子を利用し、エンコーダー配列と組み合わせて、結合性物質の同一性および巨大分子に対する一意の結合事象の数に関する情報をもたらす実施形態において有用であり得る。
別の実施形態では、コーディングタグは、ランダム化配列(Nのセット、ここで、N=A、C、G、Tからのランダムな選択、またはワードのセットからのランダムな選択である)を含む。一連の「n」回の結合サイクルおよびコーディングタグ情報の(伸長)記録タグへの移行の後、最終的な伸長記録タグ産物は、一連のこれらのランダム化配列で構成され、これは、最終的な伸長記録タグについての「複合性の」一意の分子識別子(UMI)を集合的に形成する。例えば、各コーディングタグが(NN)配列(4*4=16の可能性のある配列)を含有する場合、10回の配列決定サイクル後に、分布した2merの組合せセットが10種形成され、可能性のある伸長記録タグ産物についての複合性のUMI配列1610~1012種という総多様性が創出される。ペプチド配列決定実験で約10個の分子を使用するとすれば、この多様性は、配列決定実験のための有効なUMIのセットを創出するために十分すぎるほどである。多様性の増大は、単にコーディングタグ内により長いランダム化領域(NNN、NNNNなど)を使用することによって実現することができる。
コーディングタグは、3’スペーサー配列の3’末端に組み入れられたターミネーターヌクレオチドを含んでよい。結合性物質が巨大分子およびそれらの対応するコーディングタグに結合し、記録タグが相補的なスペーサー配列を介してアニーリングした後、情報をコーディングタグから記録タグに移行させるため、または情報を記録タグからコーディングタグに移行させるためにプライマー伸長することが可能になる。コーディングタグの3’末端にターミネーターヌクレオチドを付加することにより、記録タグ情報のコーディングタグへの移行が防止される。伸長コーディングタグの生成を伴う本明細書に記載の実施形態に関しては、例えば、コーディングタグ情報の記録タグへの移行を防止するために、記録タグの3’末端にターミネーターヌクレオチドを含める場合があることが理解される。
コーディングタグは、一本鎖分子であってもよく、二本鎖分子であってもよく、部分的に二本鎖であってもよい。コーディングタグは、平滑末端、突出末端、またはその一方を含んでよい。一部の実施形態では、コーディングタグは、部分的に二本鎖であり、それにより、コーディングタグが成長している伸長記録タグの内部のエンコーダーおよびスペーサー配列にアニーリングすることが防止される。
コーディングタグは、結合性物質に、共有結合性の相互作用および非共有結合性の相互作用を含めた当技術分野で公知の任意の手段を使用して直接または間接的に接合される。一部の実施形態では、コーディングタグを結合性物質に酵素的にまたは化学的に接合することができる。一部の実施形態では、コーディングタグを結合性物質にライゲーションによって接合することができる。他の実施形態では、コーディングタグを結合性物質に親和性結合対(例えば、ビオチンおよびストレプトアビジン)を介して接合する。
一部の実施形態では、結合性物質をコーディングタグにSpyCatcher-SpyTag相互作用によって接合させる(例えば、図43Bを参照されたい)。SpyTagペプチドは、自発的なイソペプチド連結によってSpyCatcherタンパク質と不可逆的共有結合を形成し、それにより、力および厳しい条件に対して抵抗性であるペプチド相互作用を創出するための遺伝子によりコードされたやり方がもたらされる(Zakeri et al., 2012, Proc.Natl.Acad.Sci.109:E690-697;Li et al.,2014, J. Mol.Biol.426:309- 317)。結合性物質を、SpyCatcherタンパク質を含む融合タンパク質として発現させることができる。一部の実施形態では、SpyCatcherタンパク質またはそのバリアント(例えば、SpyTag002またはSpyCatcher002バリアント、例えば、Keebleet al, "Evolving accelerated amidation by SpyTag/SpyCatcher to analyzemembrane dynamics," Angew.Chem.Int.Ed.10.1002/anie.201707623において開示されているもの)を、結合性物質のN末端またはC末端に付加する。標準的なコンジュゲーション化学(BioconjugateTechniques, G. T. Hermanson, Academic Press (2013))を使用して、SpyTagペプチドをコーディングタグとカップリングすることができる。
他の実施形態では、結合性物質とコーディングタグをSnoopTag-SnoopCatcherペプチド-タンパク質相互作用によって接合する。SnoopTagペプチドは、SnoopCatcherタンパク質とイソペプチド結合を形成する(Veggianiら、Proc. Natl. Acad. Sci. USA、2016年、113巻:1202~1207頁)。結合性物質を、SnoopCatcherタンパク質を含む融合タンパク質として発現させることができる。一部の実施形態では、SnoopCatcherタンパク質を結合性物質のN末端またはC末端に付加する。SnoopTagペプチドとコーディングタグを標準のコンジュゲーション化学を使用してカップリングすることができる。
さらに他の実施形態では、結合性物質とコーディングタグをHaloTag(登録商標)タンパク質融合タグとその化学的リガンドによって接合する。HaloTagは、合成リガンド(HaloTagリガンド)と共有結合するように設計された改変ハロアルカンデハロゲナーゼである(Losら、2008年、ACS Chem. Biol.、3巻:373~382頁)。合成リガンドは、種々の有用な分子に付着したクロロアルカンリンカーを含む。HaloTagとクロロアルカンリンカーの間に、高度に特異的であり、生理的条件下で迅速に起こり、基本的に不可逆的である共有結合が形成される。
ある特定の実施形態では、巨大分子を非同類結合性物質とも接触させる。本明細書で使用される場合、非同類結合性物質は、考慮される特定の巨大分子とは異なる巨大分子特徴部または成分に対して選択的である結合性物質を指す。例えば、n NTAAがフェニルアラニンであり、ペプチドを、フェニルアラニン、チロシン、およびアスパラギンに対して選択的な3つの結合性物質とそれぞれ接触させる場合、フェニルアラニンに対して選択的な結合性物質は、n番目のNTAA(すなわち、フェニルアラニン)に選択的に結合することが可能な第1の結合性物質ということになり、一方、他の2つの結合性物質は、そのペプチドに対する非同類結合性物質ということになる(それらはフェニルアラニン以外のNTAAに対して選択的であるので)。しかし、チロシン結合性物質およびアスパラギン結合性物質は、試料中の他のペプチドに対する同類結合性物質であることもある。したがって、n番目のNTAA(フェニルアラニン)をペプチドから切断することによってペプチドの(n-1)番目のアミノ酸を(n-1)番目のNTAA(例えば、チロシン)に変換し、次いで、ペプチドを同じ3つの結合性物質と接触させた場合、チロシンに対して選択的な結合性物質が、(n-1)番目のNTAA(すなわち、チロシン)に選択的に結合することが可能な第2の結合性物質ということになり、一方、他の2つの結合性物質は、非同類結合性物質ということになる(それらは、チロシン以外のNTAAに対して選択的であるので)。
したがって、作用物質が結合性物質であるか非同類結合性物質であるかは、結合のために現在利用可能な特定の巨大分子の特徴または成分の性質に依存することが理解されるべきである。また、多数の巨大分子を多重化反応において解析する場合、1つの巨大分子に対する結合性物質は別の巨大分子に対しては非同類結合性物質であり得、逆もまた同じである。したがって、結合性物質に関する以下の説明は本明細書に記載されているあらゆる型の結合性物質(すなわち、同類結合性物質および非同類結合性物質のどちらにも)に適用可能であることが理解されるべきである。
F.コーディングタグ情報の記録タグへの周期的移行のためのキットおよびキット成分
本明細書に記載のキットおよび方法では、結合性物質が巨大分子に結合すると、その連結されているコーディングタグの識別情報が、巨大分子に付随する記録タグに移行されることによって、「伸長記録タグ」が生成される。伸長記録タグは、実施される各結合サイクルを表す、結合性物質のコーディングタグからの情報を含み得る。しかし、伸長記録タグは、例えば、結合性物質が巨大分子に結合し損ねたことが原因で、コーディングタグが見落とされた、損傷を受けた、または欠陥があることが原因で、プライマー伸長反応が失敗したことが原因で、「飛ばされた」結合サイクルを経る可能性もある。結合事象が起こったとしても、コーディングタグから記録タグへの情報の移行は、不完全または100%未満の正確さになる可能性がある(例えば、コーディングタグが損傷を受けたまたは欠陥があることが原因で、プライマー伸長反応にエラーが導入されたことが原因で)。したがって、伸長記録タグは、その付随する巨大分子で起こった結合事象の100%、または最大で95%、90%、85%、80%、75%、70%、65%、60%、65%、55%、50%、45%、40%、35%、30%を表す可能性がある。さらに、伸長記録タグ中に存在するコーディングタグ情報は、対応するコーディングタグに対して少なくとも30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または100%の同一性を有する可能性がある。
ある特定の実施形態では、伸長記録タグは、多数の連続的な結合事象を表す、多数のコーディングタグからの情報を含む可能性がある。これらの実施形態では、単一の連鎖状の伸長記録タグは単一の巨大分子を表す可能性がある(例えば図2Aを参照されたい)。本明細書で言及される通り、コーディングタグ情報の記録タグへの移行は、多数の連続的な結合事象を伴う方法において起こると思われる伸長記録タグへの移行も含む。
ある特定の実施形態では、結合事象情報をコーディングタグから記録タグに周期的に移行させる(例えば図2Aおよび2Cを参照されたい)。交差反応性結合事象を、配列決定後に、少なくとも2つの異なるコーディングタグを要求し、2つまたはそれよりも多くの独立した結合事象を識別し、同じ結合性物質のクラス(特定のタンパク質と同類)にマッピングすることにより、情報科学的にフィルターにかけて除去することができる。任意選択の試料バーコードまたはコンパートメントバーコードを記録タグに含めることができ、同じく任意選択のUMI配列も含めることができる。コーディングタグは、任意選択のUMI配列をエンコーダーおよびスペーサー配列と一緒に含有してもよい。ユニバーサルプライミング配列(U1およびU2)も増幅およびNGS配列決定のために伸長記録タグに含めることもできる(例えば図2Aを参照されたい)。
特定の結合性物質に付随するコーディングタグ情報を記録タグに種々の方法を使用して移行させることができる。ある特定の実施形態では、コーディングタグの情報を記録タグに、プライマー伸長によって移行させる(Chan、McGregorら、2015年)。記録タグまたは伸長記録タグの3’末端のスペーサー配列をコーディングタグの3’末端の相補的なスペーサー配列とアニーリングさせ、ポリメラーゼ(例えば、鎖置換ポリメラーゼ)により、アニーリングしたコーディングタグを鋳型として使用して記録タグ配列を伸長させる(例えば図5~7を参照されたい)。一部の実施形態では、コーディングタグと伸長記録タグに存在する内部のエンコーダーおよびスペーサー配列のハイブリダイゼーションを防止するために、コーディングタグエンコーダー配列および5’スペーサーと相補的なオリゴヌクレオチドをコーディングタグとプレアニーリングさせることができる。一本鎖のままのコーディングタグ上の3’末端スペーサーを、例えば、記録タグ上の末端3’スペーサーと結合させる。他の実施形態では、コーディングタグと内部の部位とのアニーリングを防止するために、新生記録タグを一本鎖結合性タンパク質でコーティングすることができる。あるいは、完全に二本鎖のコーディングタグへの3’末端の侵入を容易にするために、新生記録タグをRecA(またはuvsXなどの関連する相同体)でコーティングすることもできる(Bellら、2012年、Nature、491巻:274~278頁)。この形態により、二本鎖のコーディングタグが内部の記録タグエレメントと相互作用することが防止されるが、それでも、伸長記録タグのRecAコーティングされた3’尾部による鎖の侵入は起こりやすい(Bellら、2015年、Elife、4巻:e08646頁)。一本鎖結合性タンパク質が存在することにより、鎖置換反応が容易になり得る。
好ましい実施形態では、プライマー伸長のために使用されるDNAポリメラーゼは、鎖置換活性を有し、3’-5エキソヌクレアーゼ活性が限られているまたはそれを欠く。そのようなポリメラーゼの多数の例のいくつかとして、クレノウexo-(DNA Pol 1のクレノウ断片)、T4 DNAポリメラーゼexo-、T7 DNAポリメラーゼexo(シーケナーゼ2.0)、Pfu exo-、Vent exo-、Deep Vent exo-、Bst DNAポリメラーゼ大断片exo-、Bca Pol、9°N Pol、およびPhi29 Pol exo-が挙げられる。好ましい実施形態では、DNAポリメラーゼは、室温および最大45℃までで活性である。別の実施形態では、「ウォームスタート」バージョンの好熱性ポリメラーゼを使用し、したがって、ポリメラーゼを約40℃~50℃で活性化し、使用する。例示的なウォームスタートポリメラーゼは、Bst 2.0ウォームスタートDNAポリメラーゼ(New England Biolabs)である。
鎖置換複製に有用な添加剤としては、E.coliのSSBタンパク質、ファージT4遺伝子32産物、ファージT7遺伝子2.5タンパク質、ファージPf3 SSB、複製タンパク質A RPA32およびRPA14サブユニット(Wold、1997年)などの、細菌起源、ウイルス起源、または真核生物起源のいくつもの一本鎖DNA結合性タンパク質(SSBタンパク質)のいずれか;アデノウイルスDNA結合性タンパク質、単純ヘルペスタンパク質ICP8、BMRF1ポリメラーゼアクセサリーサブユニット、ヘルペスウイルスUL29 SSB様タンパク質などの他のDNA結合性タンパク質;ファージT7ヘリカーゼ/プライマーゼ、ファージT4遺伝子41ヘリカーゼ、E.coli Repヘリカーゼ、E.coli recBCDヘリカーゼ、recA、E.coliおよび真核生物トポイソメラーゼ(Champoux、2001年)などの、DNA複製に関与することが公知のいくつもの複製複合体タンパク質のいずれかが挙げられる。
記録タグの末端スペーサー配列により伸長自己伸長がプライミングされる場合などのミスプライミングまたは自己プライミング事象は、一本鎖結合性タンパク質(T4遺伝子32、E.coli SSBなど)、DMSO(1~10%)、ホルムアミド(1~10%)、BSA(10~100μg/ml)、TMACl(1~5mM)、硫酸アンモニウム(10~50mM)、ベタイン(1~3M)、グリセロール(5~40%)、またはエチレングリコール(5~40%)をプライマー伸長反応に含めることによって最小化することができる。
大多数のA型ポリメラーゼは、3’エキソヌクレアーゼ活性を欠き(内因的または操作的除去)、例えば、クレノウexo-、T7 DNAポリメラーゼexo-(シーケナーゼ2.0)、およびTaqポリメラーゼは、2重鎖増幅産物の3’平滑末端へのヌクレオチド、例えばアデノシン塩基(より低い程度でG塩基、配列の状況に依存する)の非鋳型付加を触媒する。Taqポリメラーゼに関しては、3’ピリミジン(C>T)により、非鋳型アデノシン付加が最小限になり、一方、3’プリンヌクレオチド(G>A)では非鋳型アデノシン付加が有利になる。プライマー伸長のためにTaqポリメラーゼを使用する実施形態では、コーディングタグにおいて、結合性物質から遠位のスペーサー配列と隣接するバーコード配列(例えば、エンコーダー配列またはサイクル特異的配列)との間にチミジン塩基を置くことにより、記録タグのスペーサー配列の3’末端上の非鋳型アデノシンヌクレオチドの散在的包含に適応させる(例えば図43Aを参照されたい)。このように、伸長記録タグ(非鋳型アデノシン塩基を有するまたは有さない)は、コーディングタグとアニーリングし、プライマー伸長を受けることが可能である。
あるいは、特にO-へリックス領域における1つまたは複数の点変異によって非鋳型ターミナルトランスフェラーゼ活性を著しく低下させた変異ポリメラーゼ(中温性または好熱性)を使用することにより、非鋳型塩基の付加を減少させることができる(例えば米国特許第7,501,237号を参照されたい)(Yang、Astatkeら、2002年)。3’エキソヌクレアーゼが欠損しており、鎖置換能を有するPfu exo-も非鋳型ターミナルトランスフェラーゼ活性を有さない。
別の実施形態では、最適なポリメラーゼ伸長緩衝液は、40~120mMの、例えばTris-酢酸、Tris-HCl、HEPESなどの緩衝剤、pH6~9で構成される。
伸長記録タグの末端スペーサー配列と伸長記録タグの内部の領域の自己アニーリングによって開始される自己プライミング/ミスプライミング事象は、記録/伸長記録タグに偽相補的塩基を含めることによって最小化することができる(Lahoud、Timoshchukら、2008年)、(Hoshika、Chenら、2010年)。偽相補的塩基は、化学修飾が存在することに起因する互いとの2重鎖の形成に対する有意に低下したハイブリダイゼーション親和性を示す。しかし、多くの偽相補的修飾塩基は、天然のDNAまたはRNA配列と強い塩基対を形成し得る。ある特定の実施形態では、コーディングタグスペーサー配列は、多数のA塩基およびT塩基で構成され、ホスホラミダイトオリゴヌクレオチド合成を使用して市販の偽相補的塩基2-アミノアデニンおよび2-チオチミンを記録タグに組み入れる。追加的な偽相補的塩基を、プライマー伸長中に、偽相補的ヌクレオチドを反応に添加することによって伸長記録タグに組み入れることができる(Gamper、Ararら、2006年)。
溶液中のコーディングタグで標識された結合性物質と固定化されたタンパク質の記録タグとの非特異的な相互作用を最小限にするために、記録タグスペーサー配列と相補的な競合剤オリゴヌクレオチド(遮断オリゴヌクレオチドとも称される)を結合反応に添加して、非特異的な相互作用を最小限にする(例えば図32A~Dを参照されたい)。遮断オリゴヌクレオチドは、比較的短いものである。プライマー伸長前に過剰な競合オリゴヌクレオチドを結合反応から洗い流し、これにより、特にわずかな温度の上昇(例えば、30~50℃)に曝露させると、アニーリングした競合オリゴヌクレオチドが記録タグから有効に解離する。遮断オリゴヌクレオチドは、プライマー伸長を防止するために3’末端にターミネーターヌクレオチドを含んでよい。
ある特定の実施形態では、記録タグ上のスペーサー配列とコーディングタグ上の相補的なスペーサー配列のアニーリングは、プライマー伸長反応条件下(すなわち、アニーリングTmが反応温度と同様である)で準安定である。これにより、コーディングタグのスペーサー配列で記録タグのスペーサー配列とアニーリングした任意の遮断オリゴヌクレオチドを置き換えることが可能になる。
特定の結合性物質に付随するコーディングタグ情報をライゲーションによって記録タグに移行させることもできる(例えば、図6および図7を参照されたい)。ライゲーションは、平滑末端ライゲーションであってもよく、または粘着末端ライゲーションであってもよい。ライゲーションは、酵素的ライゲーション反応であってもよい。リガーゼの例としては、これだけに限定されないが、T4 DNAリガーゼ、T7 DNAリガーゼ、T3 DNAリガーゼ、Taq DNAリガーゼ、E.coli DNAリガーゼ、9°N DNAリガーゼ、Electroligase(登録商標)が挙げられる。あるいは、ライゲーションは、化学的ライゲーション反応であってよい(例えば、図7を参照されたい)。説明図では、無スペーサーライゲーションは、「記録ヘルパー」配列とコーディングタグ上のアームのハイブリダイゼーションを使用することにより実現される。アニーリングした相補配列を、標準の化学的ライゲーションまたは「クリックケミストリー」を使用して化学的にライゲーションする(Gunderson, Huang et al. 1998、Peng, Li et al. 2010、El-Sagheer, Cheonget al. 2011、El-Sagheer, Sanzone et al. 2011、Sharma, Kent et al. 2012、Roloff andSeitz 2013、Litovchick, Clark et al. 2014、Roloff, Ficht et al. 2014)。一態様では、「無スペーサー」ライゲーションを、例えば図46に示されているような、CircLigase IまたはII(例えば、Lucigenからの)などの、ssDNAリガーゼを使用して実現することもできる。「無スペーサー」ライゲーションの使用は、大幅に、ライブラリーエレメントの全長を短縮させる場合および/またはライブラリー増幅中の鋳型乗り換えを低減させるもしくは最小限に抑える場合に有利である。
一実施形態では、キットは、一本鎖DNA(ssDNA)リガーゼを含む。ssDNAリガーゼは、相補配列の非存在下でssDNAの末端をライゲーションすることができる。例えば、CircLigase(商標)ssDNAリガーゼおよびCircLigase(商標)II ssDNAリガーゼは両方とも、5’-リン酸基と3’ヒドロキシル基とを有するssDNA鋳型の分子内ライゲーション(すなわち、環状化)を触媒するために典型的に使用される熱安定性リガーゼである。相補的DNA配列上で互いに隣接してアニーリングされているDNA末端をライゲーションする、T4 DNAリガーゼおよびAmpligase(登録商標)DNAリガーゼとは対照的に、ssDNAリガーゼは、相補配列の非存在下でssDNAの末端をライゲーションする。したがって、この酵素は、直鎖状ssDNAから環状ssDNA分子を作製するのに有用である。環状ssDNA分子は、ローリングサークル複製またはローリングサークル転写の基質として使用することができる。ssDNAに対するその活性に加えて、CircLigase酵素は、3’-ヒドロキシルリボヌクレオチドと5’-リン酸化リボヌクレオチドまたはデオキシリボヌクレオチドとを有する一本鎖核酸のライゲーションにおける活性も有する。
CircLigase(商標)ssDNAリガーゼまたはCircLigase(商標)II ssDNAリガーゼのどちらかを本開示において使用することができる。これら2つの酵素は、CircLigase Iが、CircLigase IIよりもはるかにアデニル化度が低く、最高の活性のためにATPを必要とする点で異なる。CircLigase Iは、ATPの存在下でssDNAを再環状化する。CircLigase IIは、ほぼ100%アデニル化され、したがって、ATPを反応緩衝液に添加する必要がない。CircLigase IIは、化学量論的反応の場合に作用し、そこでこの酵素は、酵素活性部位がアデニル化されているオリゴの5’末端に結合してそのオリゴをライゲーションし、停止する。この反応は、ATPを含まないので、CircLigase IIは、1:1の酵素:オリゴのコンフィグレーションで作用する。特定の実施形態では、本明細書におけるキットは、Thermus bacteriophage RNAリガーゼ、例えばバクテリオファージTS2126 RNAリガーゼ(例えば、CircLigase(商標)およびCircLigase II(商標))、または古細菌RNAリガーゼ、例えばMethanobacterium thermoautotrophicum RNAリガーゼ1を含む。前述の実施形態のいずれかでは、キットは、T4 RNAリガーゼ、例えば、T4 RNAリガーゼ2、T4 RNAリガーゼ2切断型、T4 RNAリガーゼ2切断型KQ、またはT4 RNAリガーゼ2切断型K227QなどのRNAリガーゼを含むことができる。
別の実施形態では、PNAの移行は、公開された技法を使用した化学的ライゲーションで実現することができる。PNAの構造は、5’N末端アミン基および非反応性3’C末端アミドを有するようなものである。PNAの化学的ライゲーションには、末端を化学的に活性になるように修飾することが必要である。これは、一般には、5’N末端をシステイニル部分で誘導体化し、3’C末端をチオエステル部分で誘導体化することによってなされる。そのような修飾されたPNAは、標準のネイティブな化学的ライゲーション条件を使用することで容易にカップリングする(Roloffら、2013年、Bioorgan. Med. Chem.、21巻:3458~3464頁)。
一部の実施形態では、コーディングタグ情報を、トポイソメラーゼを使用して移行させることができる。トポイソメラーゼを使用して、記録タグ上のトポ荷電3’リン酸とコーディングタグまたはその相補物の5’末端とライゲーションすることができる(Shumanら、1994年、J. Biol. Chem.、269巻:32678~32684頁)。
本明細書に記載の通り、結合性物質は、翻訳後修飾されたアミノ酸に結合し得る。したがって、ペプチド巨大分子を伴うある特定の実施形態では、伸長記録タグは、アミノ酸配列および翻訳後修飾に関するコーディングタグ情報を含む。一部の実施形態では、内部の翻訳後修飾されたアミノ酸(例えば、リン酸化、グリコシル化、サクシニル化、ユビキチン化、S-ニトロシル化、メチル化、N-アセチル化、脂質付加など)の検出は、末端アミノ酸(例えば、NTAAまたはCTAA)の検出および切断の前に実現される。一実施例では、ペプチドをPTM修飾のために結合性物質と接触させ、付随するコーディングタグ情報を上記の通り記録タグに移行する(例えば図8Aを参照されたい)。アミノ酸修飾に関するコーディングタグ情報の検出および移行が完了したら、一次アミノ酸配列に関するコーディングタグ情報の検出および移行の前に、N末端またはC末端分解法を使用してPTM修飾基を除去することができる。したがって、得られた伸長記録タグにより、ペプチド配列における翻訳後修飾の存在が、逐次的順序ではないが、一次アミノ酸配列情報と併せて示される(例えば図8Bを参照されたい)。
一部の実施形態では、内部の翻訳後修飾されたアミノ酸の検出は、一次アミノ酸配列の検出と並行して行うことができる。一実施例では、NTAA(またはCTAA)を、単独でまたは結合性物質のライブラリー(例えば、20種の標準のアミノ酸および選択された翻訳後修飾されたアミノ酸に対する結合性物質で構成されるライブラリー)の一部としての、翻訳後修飾されたアミノ酸に対して特異的な結合性物質と接触させる。末端アミノ酸切断および結合性物質(または結合性物質のライブラリー)との接触の連続的なサイクルを後に続ける。したがって、得られた伸長記録タグにより、一次アミノ酸配列に関して、翻訳後修飾の存在および順序が示される。
ある特定の実施形態では、コーディングタグ情報移行の全体的な頑強性および効率を改善するために、巨大分子ごとに記録タグのアンサンブルを使用することができる(例えば、図9を参照されたい)。単一の記録タグではなく、所与の巨大分子に付随する記録タグのアンサンブルを使用することにより、コーディングタグと記録タグのカップリング収率が潜在的に高いこと、およびライブラリーの全収率が高いことに起因して、ライブラリー構築の効率が改善される。単一の連鎖状の伸長記録タグの収率は、連鎖の段階的収率に直接依存し、一方、コーディングタグ情報を受容することが可能な多数の記録タグの使用では、指数関数的な連鎖の喪失を受けない。
そのような実施形態の例が図9および図10に示されている。図9Aおよび10Aでは、固体支持体上で単一の巨大分子に多数の記録タグが付随している(空間的共局在または単一の巨大分子の単一のビーズへの限局によって)。結合性物質を固体支持体に周期的に曝露させ、各サイクルにおいて、それらの対応するコーディングタグにより、共局在する多数の記録タグのうちの1つに情報が移行される。図9Aに示されている例では、結合サイクル情報は、コーディングタグ上に存在するスペーサーにコードされている。各結合サイクルについて、結合性物質のセットに設計されたサイクル特異的スペーサー配列で印をつける(例えば図9Aおよび9Bを参照されたい)。例えば、NTAA結合性物質の場合では、同じアミノ酸残基に対する結合性物質を異なるコーディングタグで標識する、またはサイクル特異的情報をスペーサー配列に含めて、両方の結合性物質の同一性およびサイクル数を示す。
図9Aにおいて例示されている通り、第1の結合サイクル(サイクル1)において、複数のNTAA結合性物質を巨大分子と接触させる。サイクル1で使用する結合性物質は、記録タグのスペーサー配列と相補的な共通のスペーサー配列を有する。サイクル1で使用する結合性物質は、サイクル1特異的配列を含む3’-スペーサー配列も有する。結合サイクル1の間に、第1のNTAA結合性物質が巨大分子の遊離末端に結合し、第1のコーディングタグおよび記録タグ内の共通のスペーサー配列の相補配列がアニーリングし、第1のコーディングタグの情報が同類の記録タグに共通のスペーサー配列からのプライマー伸長を介して移行する。NTAAを除去して、新しいNTAAを露出させた後、結合サイクル2により、記録タグのスペーサー配列と相補的な共通のスペーサー配列を有する複数のNTAA結合性物質を接触させる。サイクル2で使用する結合性物質は、サイクル2特異的配列を含む3’-スペーサー配列も有する。第2のNTAA結合性物質が巨大分子のNTAAに結合し、第2のコーディングタグの情報が記録タグにプライマー伸長を介して移行する。これらのサイクルを最大「n」回の結合サイクルまで繰り返し、単一の巨大分子と共局在する複数の伸長記録タグを生成し、ここで、各伸長記録タグは、1つの結合サイクルからのコーディングタグ情報を有する。連続的な結合サイクルのそれぞれで使用される結合性物質の各セットは、コーディングタグ内のサイクル特異的スペーサー配列を有するので、結合サイクル情報を、得られた伸長記録タグ内の結合性物質情報と関連づけることができる。
代替の実施形態では、図9Aと同様に、固体支持体(例えば、ビーズ)上で単一の巨大分子に多数の記録タグが付随しているが、この場合、特定の結合サイクルで使用される結合性物質は、今の結合サイクルに対するサイクル特異的スペーサーおよび次の結合サイクルに対するサイクル特異的スペーサーが隣接するコーディングタグを有する(例えば図10Aおよび10Bを参照されたい)。この設計は、伸長記録タグの集団を単一の共直線性の伸長記録タグに変換するための最終的なアセンブリPCRステップを支持するためのものである(例えば図10Cを参照されたい)。単一の共直線性の伸長記録タグのライブラリーを配列決定前に濃縮、サブトラクションおよび/または正規化方法に供すことができる。第1の結合サイクル(サイクル1)では、第1の結合性物質が結合すると、サイクル1特異的スペーサー(C’1)を含むコーディングタグの情報が、末端に相補的なサイクル1特異的スペーサー(C1)を含む記録タグに移行する。第2の結合サイクル(サイクル2)では、第2の結合性物質が結合すると、サイクル2特異的スペーサー(C’2)を含むコーディングタグの情報が、末端に相補的なサイクル2特異的スペーサー(C2)を含む異なる記録タグに移行する。このプロセスを第nの結合サイクルまで続ける。一部の実施形態では、伸長記録タグ内の第nのコーディングタグにユニバーサルリバースプライミング配列を用いてキャップ形成する、例えば、ユニバーサルリバースプライミング配列を第nのコーディングタグ設計の一部として組み入れることもでき、ユニバーサルリバースプライミング配列を第nの結合サイクルの後に続く反応、例えば尾部を有するプライマーを使用した増幅反応などに添加することもできる。一部の実施形態では、各結合サイクル時に、巨大分子を、それらの対応する結合性物質に関する識別情報および結合サイクル情報を含むコーディングタグと接合した結合性物質の集合に曝露させる(例えば図9および図10を参照されたい)。特定の実施形態では、第nの結合サイクルが完了した後、伸長記録タグでコーティングしたビーズ基板を油乳剤に平均して液滴当たり1ビーズ未満またはそれとほぼ同等になるように入れる。次いで、アセンブリPCRを使用して、伸長記録タグをビーズから増幅し、多数の別々の記録タグを、別々の伸長記録タグ内のサイクル特異的スペーサー配列を介してプライミングすることによって共直線的な順序でアセンブルさせる(例えば図10Cを参照されたい)(Xiongら、2008年、FEMS Microbiol. Rev.、32巻:522~540頁)。あるいは、結合性物質のコーディングタグを有するサイクル特異的スペーサーを使用する代わりに、各結合サイクル中または各結合サイクル後に、サイクル特異的スペーサーを別々に伸長記録タグに付加することができる。単一の巨大分子を集合的に表すものである伸長記録タグの集団を使用することの、単一の巨大分子を表すものである単一の連鎖状の伸長記録タグに対する1つの利点は、より高濃度の記録タグにより、コーディングタグ情報の移行の効率が上昇し得ることである。さらに、結合サイクルを数回繰り返して同類結合事象の完了を確実にすることができる。さらに、伸長記録タグの表面増幅により、情報移行の重複性をもたらすことができる(例えば図4Bを参照されたい)。コーディングタグ情報が必ずしも移行されない場合、ほとんどの場合、それでも、コーディングタグ情報の不完全な集合を、タンパク質などの、情報含有量が非常に高い巨大分子を識別するために使用することが可能であるはずである。短いペプチドであっても、非常に多数の可能性のあるタンパク質配列を具体化し得る。例えば、10merのペプチドは、2010種の可能性のある配列を有する。したがって、欠失および/または多義性を含有する可能性がある部分的または不完全な配列を、それでも、多くの場合、一意的にマッピングすることができる。
タンパク質のネイティブなコンフォメーションが照会される一部の実施形態では、結合性物質の近位のスペーサーエレメント内の切断可能なまたはニッキング可能なDNA鎖で構成されるコーディングタグを有する結合性物質を用いて周期的結合アッセイを実施する(例えば図32を参照されたい)。例えば、結合性物質の近位のスペーサーは、ウラシル特異的切除試薬(USER)によってニッキングすることができる1つまたは複数のウラシル塩基を有してよい。別の例では、結合性物質の近位のスペーサーは、2重鎖の一方の鎖のみを加水分解するニッキングエンドヌクレアーゼの認識配列を含んでよい。この設計により、結合性物質を伸長記録タグから変性によらずに除去し、その後のイムノアッセイサイクルのための遊離の一本鎖DNAスペーサーエレメントを創出することが可能になる。好ましい実施形態では、プライマー伸長ステップ後の結合性物質の酵素的USER除去を可能にするために、コーディングタグにウラシル塩基を組み入れる(例えば図32E~Fを参照されたい)。ウラシルによるUSER切除後、結合性物質および切り詰められたコーディングタグを、タンパク質-結合性物質相互作用を破壊するための、高塩濃度(4MのNaCl、25%ホルムアミド)および穏やかな熱を含めた種々の穏やかな条件下で除去することができる。記録タグとアニーリングしたままの他の切り詰められたコーディングタグDNAの残り(例えば図32Fを参照されたい)は、わずかに温度を上昇させると容易に解離する。
結合性物質の近位のスペーサーエレメント内の切断可能なまたはニッキング可能なDNA鎖で構成されるコーディングタグにより、多数の結合した結合性物質からコーディングタグ情報を移行させるための単一の均一なアッセイも可能になる(例えば図33を参照されたい)。好ましい実施形態では、結合性物質の近位のコーディングタグはニッキングエンドヌクレアーゼ配列モチーフを含み、これは、dsDNAに関して規定された配列モチーフにおいてニッキングエンドヌクレアーゼにより認識され、ニッキングされる。多数の結合性物質の結合後、複合ポリメラーゼ伸長(鎖置換活性を欠く)+ニッキングエンドヌクレアーゼ試薬混合物を使用して、コーディングタグの近位の記録タグまたは伸長記録タグへの反復移行を生じさせる。各移行ステップ後、得られた伸長記録タグ-コーディングタグ2重鎖をニッキングエンドヌクレアーゼによってニッキングし、それにより、結合性物質に付着した切り詰められたスペーサーを放出させ、追加的な近位の結合した結合性物質のコーディングタグとアニーリングすることが可能な伸長記録タグ3’スペーサー配列に曝露させる(例えば図33B~Dを参照されたい)。コーディングタグスペーサー配列内へのニッキングモチーフの配置は、切断されていないコーディングタグスペーサー配列と容易に交換することができる、準安定ハイブリッドが創出されるように設計する。このように、2種またはそれよりも多くの結合性物質が同じタンパク質分子に同時に結合する場合、多重に結合した結合性物質からのコーディングタグ情報の記録タグ上への連鎖による結合情報は、単一反応混合物において、いかなる周期的な試薬交換も伴わずに生じる(例えば図33C~Dを参照されたい)。この実施形態は、次世代タンパク質アッセイ(NGPA)、特に、タンパク質上の多価エピトープに対するポリクローナル抗体(またはモノクローナル抗体の混合集団)を用いるものに特に有用である。
変性したタンパク質、ポリペプチド、およびペプチドの解析を伴う実施形態に関しては、結合した結合性物質およびアニーリングしたコーディングタグを、プライマー伸長後に、高度変性条件(例えば、0.1~0.2NのNaOH、6Mの尿素、2.4Mのグアニジニウムイソチオシアネート、95%ホルムアミドなど)を使用することによって除去することができる。
G.コーディングタグまたはジタグ構築物への記録タグ情報の周期的移行のためのキットおよびキット成分
別の態様では、結合性物質が巨大分子に結合した後にコーディングタグから記録タグに情報を書き込むのではなく、任意選択のUMI配列(例えば、特定のペプチドまたはタンパク質分子を識別する)および少なくとも1つのバーコード(例えば、コンパートメントタグ、分配バーコード、試料バーコード、空間的位置バーコードなど)を含む記録タグからコーディングタグに情報を移行させ、それにより、伸長コーディングタグを生成することができる(例えば図11Aを参照されたい)。ある特定の実施形態では、結合性物質および付随する伸長コーディングタグを、各結合サイクル後、および任意選択でエドマン分解化学ステップの前に収集する。ある特定の実施形態では、コーディングタグは、結合サイクル特異的タグを含む。周期的なエドマン分解におけるNTAAの検出などの全ての結合サイクルが完了した後、伸長コーディングタグの完全な収集物を増幅し、配列決定し、ペプチド上の情報を、UMI(ペプチド同一性)、エンコーダー配列(NTAA結合性物質)、コンパートメントタグ(単一の細胞またはプロテオームのサブセット)、結合サイクル特異的配列(サイクル数)、またはそれらの任意の組合せの間の関連性から決定することができる。同じコンパートメントタグ/UMI配列を有するライブラリーエレメントを同じ細胞、プロテオームのサブセット、分子などにマッピングし戻し、ペプチド配列を再構築することができる。この実施形態は、記録タグがエドマン分解プロセス中に過度の損傷を保持する場合に有用であり得る。
複数の巨大分子を解析するための方法であって、(a)固体支持体に接合した複数の巨大分子および付随する記録タグを提供するステップと;(b)複数の巨大分子を複数の巨大分子に結合することが可能な複数の結合性物質と接触させるステップであって、各結合性物質が結合性物質に関する識別情報を有するコーディングタグを含む、ステップと;(c)(i)巨大分子に付随する記録タグの情報を巨大分子に結合した結合性物質のコーディングタグに移行させて、伸長コーディングタグを生成するステップ(例えば図11Aを参照されたい);または(ii)巨大分子に付随する記録タグおよび巨大分子に結合した結合性物質のコーディングタグの情報をジタグ構築物に移行するステップと(例えば図11Bを参照されたい);(d)伸長コーディングタグまたはジタグ構築物を収集するステップと;(e)任意選択でステップ(b)~(d)を1回または複数回の結合サイクルにわたって繰り返すステップと;(f)伸長コーディングタグまたはジタグ構築物の収集物を解析するステップとを含む方法が本明細書において提示される。
ある特定の実施形態では、記録タグからコーディングタグへの情報移行は、記録タグのプライマー伸長を防止するために記録タグの3’末端を任意選択でブロッキングする(例えば、図11Aを参照されたい)プライマー伸長ステップを使用して実現することができる。得られた伸長コーディングタグおよび付随する結合性物質を各結合事象の後および情報移行の完了後に収集することができる。図11Bに例示されている例では、記録タグは、ユニバーサルプライミング部位(U2’)、バーコード(例えば、コンパートメントタグ「CT」)、任意選択のUMI配列、および共通のスペーサー配列(Sp1)で構成される。ある特定の実施形態では、バーコードは、個々のコンパートメントを表すコンパートメントタグであり、また、UMIを使用して、配列読み取りを照会されている特定のタンパク質またはペプチド分子にマッピングし戻すことができる。図11Bの例において例示されている通り、コーディングタグは、共通のスペーサー配列(Sp2’)、結合性物質エンコーダー配列、およびユニバーサルプライミング部位(U3)で構成される。コーディングタグで標識した結合性物質の導入前に、記録タグのU2’ユニバーサルプライミング部位と相補的であり、ユニバーサルプライミング配列U1およびサイクル特異的タグを含むオリゴヌクレオチド(U2)を記録タグU2’とアニーリングさせる。さらに、アダプター配列Sp1’-Sp2を記録タグSp1とアニーリングさせる。このアダプター配列は、コーディングタグ上のSp2’配列とも相互作用することができ、それにより、記録タグとコーディングタグが互いと近傍になる。結合事象の前または後のいずれかにギャップ充填伸長ライゲーションアッセイを実施する。ギャップ充填を結合サイクルの前に実施する場合、結合サイクル後のプライマー伸長ステップを使用してジタグ形成を完了させる。いくつもの結合サイクルにわたってジタグを収集した後、ジタグの収集物を配列決定し、UMI配列を介して元のペプチド分子にマッピングし戻す。有効性を最大にするために、UMI配列の多様性はUMIでタグが付された単一分子の数の多様性を超えるものでなければならないことが理解される。
ある特定の実施形態では、巨大分子は、タンパク質またはペプチドである。ペプチドは生体試料由来のタンパク質を断片化することによって得ることができる。
記録タグは、DNA分子、RNA分子、PNA分子、BNA分子、XNA分子、LNA分子、γPNA分子、またはこれらの組合せであってよい。記録タグは、それが付随する巨大分子(例えば、ペプチド)を識別するUMIを含む。ある特定の実施形態では、記録タグは、コンパートメントタグをさらに含む。記録タグは、ユニバーサルプライミング部位も含んでよく、これを下流の増幅に使用することができる。ある特定の実施形態では、記録タグは、3’末端にスペーサーを含む。スペーサーは、コーディングタグ内のスペーサーと相補的であってよい。記録タグの3’末端をブロッキングして(例えば、光不安定性3’ブロッキング基)ポリメラーゼによる記録タグの伸長を防止し、それにより、巨大分子に付随する記録タグの情報のコーディングタグへの移行または巨大分子に付随する記録タグおよびコーディングタグの情報のジタグ構築物への移行を容易にすることができる。
コーディングタグは、コーディング物質が連結した結合性物質を識別するエンコーダー配列を含む。ある特定の実施形態では、コーディングタグは、コーディングタグが連結した各結合性物質に対する一意の分子識別子(UMI)をさらに含む。コーディングタグは、下流の増幅のために使用することができるユニバーサルプライミング部位を含んでよい。コーディングタグは、3’末端にスペーサーを含んでよい。スペーサーは、記録タグ内のスペーサーに相補的であってよく、記録タグ情報をコーディングタグに移行させるためのプライマー伸長反応を開始するために使用することができる。コーディングタグは、伸長コーディングタグまたはジタグの起源である結合サイクルを識別するための結合サイクル特異的配列も含んでよい。
記録タグの情報のコーディングタグへの移行は、プライマー伸長またはライゲーションによってもたらすことができる。記録タグおよびコーディングタグの情報のジタグ構築物への移行は、ギャップ充填反応、プライマー伸長反応、またはその両方で生じさせることができる。
ジタグ分子は、伸長記録タグのものと同様の機能的成分を含む。ジタグ分子は、記録タグに由来するユニバーサルプライミング部位、記録タグに由来するバーコード(例えば、コンパートメントタグ)、記録タグに由来する任意選択の一意の分子識別子(UMI)、記録タグに由来する任意選択のスペーサー、コーディングタグに由来するエンコーダー配列、コーディングタグに由来する任意選択の一意の分子識別子、結合サイクル特異的配列、コーディングタグに由来する任意選択のスペーサー、およびコーディングタグに由来するユニバーサルプライミング部位を含んでよい。
ある特定の実施形態では、記録タグを、バーコードのコンビナトリアル連鎖をコードするワードを使用して生成することができる。コンビナトリアルをコードするワードの使用により、アニーリングおよび化学的ライゲーションを使用して情報をPNA記録タグからコーディングタグまたはジタグ構築物に移行させることができる方法がもたらされる(例えば、図12A~Dを参照されたい)。本明細書に開示されているペプチドを解析する方法がエドマン分解による末端アミノ酸の切断を伴うある特定の実施形態では、PNAなどの、エドマン分解の厳しい条件に対して抵抗性の記録タグを使用することが望ましい可能性がある。エドマン分解プロトコールにおける1つの厳しいステップは、N末端アミノ酸を切断するための無水TFA処理である。このステップにより、一般には、DNAが破壊される。PNAは、DNAとは対照的に、酸加水分解に対して高度に抵抗性である。PNAでの問題は、情報移行の酵素的方法がより難しくなる、すなわち、好ましい様式が化学的ライゲーションによる情報移行になることである。図11Bにおいて、記録タグおよびコーディングタグ情報は酵素的ギャップ充填伸長ライゲーションステップによって書き込まれるが、これは、現在、PNA鋳型を用いると、PNAを使用するポリメラーゼが開発されなければ、都合がよくない。化学的ライゲーションが必要であり、その産物は容易には増幅されないので、PNA記録タグからコーディングタグへのバーコードおよびUMIの書き込みには問題がある。化学的ライゲーションの方法は、文献に広範囲にわたって記載されている(Gundersonら、1998年、Genome Res.、8巻:1142~1153頁;Pengら、2010年、Eur. J. Org. Chem.、4194~4197頁;El-Sagheerら、2011年、Org. Biomol. Chem.、9巻:232~235頁;El-Sagheerら、2011年、Proc. Natl. Acad. Sci. USA、108巻:11338~11343頁;Litovchickら、2014年、Artif. DNA PNA XNA、5巻:e27896頁;Roloffら、2014年、Methods Mol. Biol.、1050巻:131~141頁)。
コンビナトリアルPNAバーコードおよびUMI配列を創出するために、n-merのライブラリーからのPNAワードのセットをコンビナトリアルにライゲーションすることができる。各PNAワードが1,000ワードの空間に由来する場合、4つの組合せ配列により、1,000=1012コードのコーディング空間が生じる。このように、4,000種の異なるDNA鋳型配列の出発セットから、1012を超えるPNAコードを生成することができる(例えば図12Aを参照されたい)。連鎖状のワードの数を調整すること、または基本のワードの数を調整することにより、より小さなまたはより大きなコーディング空間を生成することができる。そのように、PNA記録タグとハイブリダイズさせたDNA配列を使用した情報移行は、DNAワードアセンブリハイブリダイゼーションおよび化学的ライゲーションを使用して完了させることができる(例えば図12Bを参照されたい)。PNA鋳型上のDNAワードのアセンブリおよびDNAワードの化学的ライゲーションの後、得られた中間体を使用して、情報をコーディングタグに/から移行させることができる(例えば図12Cおよび図12Dを参照されたい)。
ある特定の実施形態では、巨大分子および付随する記録タグは、固体支持体に共有結合により接合している。固体支持体は、ビーズ、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアであってよい。固体支持体は、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズであってよい。
ある特定の実施形態では、結合性物質は、タンパク質またはポリペプチドである。一部の実施形態では、結合性物質は、改変またはバリアントアミノペプチダーゼ、改変またはバリアントアミノアシルtRNA合成酵素、改変またはバリアントアンチカリン、改変またはバリアントClpS、または改変またはバリアント抗体またはその結合性断片である。ある特定の実施形態では、結合性物質は、単一のアミノ酸残基、ジペプチド、トリペプチド、またはペプチドの翻訳後修飾に結合する。一部の実施形態では、結合性物質は、N末端アミノ酸残基、C末端アミノ酸残基、または内部アミノ酸残基に結合する。一部の実施形態では、結合性物質は、N末端ペプチド、C末端ペプチド、または内部ペプチドに結合する。一部の実施形態では、結合性物質は、ペプチドの翻訳後修飾のアミノ酸の部位特異的な共有結合性標識である。
ある特定の実施形態では、ステップ(b)において複数の巨大分子を複数の結合性物質と接触させた後、巨大分子および付随する結合性物質を含む複合体を固体支持体から解離させ、液滴またはマイクロ流体液滴のエマルジョン中に分配する。一部の実施形態では、各マイクロ流体液滴は、巨大分子および結合性物質を含む複合体を最大で1つ含む。
ある特定の実施形態では、伸長コーディングタグまたはジタグ構築物を生成する前に前記記録タグを増幅する。巨大分子および付随する結合性物質を含む複合体を液滴またはマイクロ流体液滴に液滴当たりの複合体が最大で1つになるように分配する実施形態では、記録タグの増幅により、情報をコーディングタグまたはジタグ構築物に移行させるための鋳型として追加的な記録タグがもたらされる(例えば図13および図14を参照されたい)。エマルジョン融合PCRを使用して、記録タグ情報をコーディングタグに移行させるか、またはジタグ構築物の集団を創出することができる。
生成された伸長コーディングタグまたはジタグ構築物の収集物を解析前に増幅させることができる。伸長コーディングタグまたはジタグ構築物の収集物の解析は、核酸配列決定法を含んでよい。合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシング。核酸配列決定法は、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したDNAのダイレクトイメージングであってよい。
エドマン分解、およびPITC、サンガー薬剤(DNFB)、SNFB、アセチル化試薬、アミジン化(グアニジニル化)試薬などのN末端アミンを化学的に標識する方法により、標準の核酸またはPNA塩基の内部アミノ酸および環外アミン、例えば、アデニン、グアニン、およびシトシンを修飾することもできる。ある特定の実施形態では、ペプチドのリシン残基のε-アミンを、配列決定の前に酸無水物、グアニジン化剤、または同様のブロッキング試薬でブロッキングする。DNA塩基の環外アミンはペプチドのN末端第一級アミンよりもはるかに反応性が低いが、DNA塩基の内部アミノ酸および環外アミンに対する非標的活性を低下させる、アミン反応性作用物質のN末端アミンに対する反応性の制御が、配列決定アッセイにとって重要である。修飾反応の選択性は、pH、溶媒(水性対有機、非プロトン性、非極性、極性非プロトン性、イオン性液体など)、塩基および触媒、共溶媒、温度、および時間などの、反応条件を調整することによって、モジュレートすることができる。さらに、DNA塩基の環外アミンの反応性は、DNAがssDNAの形態であるかdsDNAの形態であるかによってモジュレートされる。修飾を最小限にするために、NTAA化学修飾の前に、記録タグを相補的DNAプローブ:P1’、{試料BC}’、{Sp-BC}’などとハイブリダイズさせることができる。別の実施形態では、保護された環外アミンを有する核酸の使用も使用することもできる(Ohkubo, Kasuya et al. 2008)。さらに別の実施形態では、SNFBなどの「反応性が低い」アミン標識化合物により、DNAの内部アミノ酸および環外アミンに対するオフターゲットの標識が軽減される(Cartyand Hirs 1968)。パラスルホニル基のほうがパラニトロ基よりも電子求引性であり、したがって、SNFBでのほうがDNFBよりもフッ素置換の活性が低くなるという事実のため、SNFBのほうがDNFBよりも反応性が低い。
NTAA α-アミン修飾を最適化し、オフターゲットのアミノ酸修飾またはDNA修飾を最小限にするためのカップリング条件およびカップリング試薬の調整は、化学および反応条件(濃度、温度、時間、pH、溶媒の型など)を慎重に選択することによって可能である。例えば、DNFBは、二級アミンと、水中よりもアセトニトリルなどの非プロトン性溶媒中の方が容易に反応することが公知である。環外アミンが軽度に修飾されてもなお相補的なプローブが配列とハイブリダイズすることが可能になるが、ポリメラーゼに基づくプライマー伸長を妨害する可能性がある。環外アミンを保護しながら、それでも水素結合を可能にすることも可能である。これは、保護された塩基がなお目的の標的とハイブリダイズすることが可能であるという最近の刊行物に記載された(Ohkubo、Kasuyaら、2008年)。一実施形態では、操作されたポリメラーゼを使用して、DNAコーディングタグ鋳型上の記録タグの伸長中に、保護された塩基を有するヌクレオチドを組み入れる。別の実施形態では、操作されたポリメラーゼを使用して、PNA記録タグ鋳型上のコーディングタグの伸長中に記録タグPNA鋳型(w/またはw/o保護された塩基)上のヌクレオチドを組み入れる。別の実施形態では、情報を、外因性オリゴヌクレオチドをPNA記録タグとアニーリングさせることによって記録タグからコーディングタグに移行させることができる。ハイブリダイゼーションの特異性は、n-merのワードのアセンブリに基づく設計などの配列空間が別個であるUMIを選択することによって容易にすることができる(Gerry、Witowskiら、1999年)。
エドマン様N末端ペプチド分解配列決定を使用してペプチドの直鎖状アミノ酸配列を決定することができるが、代替的な実施形態を使用して、伸長記録タグ、伸長コーディングタグ、およびジタグを利用する方法を用いたペプチドの部分的な組成分析を実施することができる。結合性物質または化学標識を使用してペプチド上のN末端および内部の両方のアミノ酸またはアミノ酸修飾を識別することができる。化学薬剤により、アミノ酸(例えば、標識)を部位特異的に共有結合により修飾することができる(SlettenおよびBertozzi、2009年、Basle、Joubertら、2010年)(SpicerおよびDavis、2014年)。部位特異的に標識されたアミノ酸のコーディングおよびその後の識別を容易にするために、単一のアミノ酸を標的とする化学標識剤にコーディングタグを付着させることができる(例えば図13を参照されたい)。
ペプチド組成分析にはペプチドの環状分解は必要なく、したがって、DNAを含有するタグを厳しいエドマン化学に曝露することの問題が回避される。環状結合様式では、組成情報(アミノ酸またはジペプチド/トリペプチド情報)、PTM情報、および一次アミノ酸配列をもたらすために伸長コーディングタグまたはジタグを使用することもできる。一実施形態では、この組成情報は、本明細書に記載の伸長コーディングタグまたはジタグ手法を使用して読み取ることができる。UMIおよびコンパートメントタグ情報と組み合わせると、伸長コーディングタグまたはジタグの収集物により、ペプチドおよびそれらの起源であるコンパートメントのタンパク質(複数可)に関する組成情報がもたらされる。同じコンパートメントタグ(および表面上起源であるタンパク質分子)にマッピングし戻された伸長コーディングタグまたはジタグの収集物は、部分的な組成情報を有するペプチドをマッピングするための強力なツールである。プロテオーム全体にマッピングし戻すのではなく、コンパートメントタグ付きペプチドの集合を限られたタンパク質分子のサブセットにマッピングし戻し、これにより、マッピングの一意性が著しく増大する。
本明細書で使用される結合性物質は、単一のアミノ酸、ジペプチド、トリペプチド、またはさらに長いペプチド配列モチーフを認識し得る。Tessler(2011年、Digital Protein Analysis: Technologies for Protein Diagnostics and Proteomics through Single Molecule Detection. Ph.D.、Washington University in St. Louis)は、荷電したジペプチドエピトープのサブセットに対して比較的選択的なジペプチド抗体を生成することができることを実証した(Tessler、2011年)。代替のタンパク質足場(例えば、aaRS、アンチカリン、ClpSなど)およびアプタマーへの定向進化の適用を使用して、ジペプチド/トリペプチド結合性物質のセットを増大させることができる。単一のタンパク質分子にマッピングし戻すことと併せたジペプチド/トリペプチド組成分析からの情報は、各タンパク質分子を一意的に識別し、定量化するために十分なものであり得る。最大で、合計400種の可能性のあるジペプチドの組合せがある。しかし、最も頻度が高く、かつ最も抗原性が高い(荷電、親水性、疎水性)ジペプチドのサブセットが、結合性物質を生成するために十分なものであるはずである。この数は、40~100種の異なる結合性物質のセットを構成し得る。40種の異なる結合性物質のセットに関して、平均10merのペプチドに少なくとも1種の結合性物質が結合する見込みは約80%である。この情報を同じタンパク質分子に由来する全てのペプチドと組み合わせることにより、タンパク質分子の識別が可能になり得る。ペプチドおよびその起源であるタンパク質に関するこの情報全てを組み合わせて、より正確かつ的確なタンパク質配列特徴付けをもたらすことができる。
部分的なペプチド配列情報を使用する最近のデジタルタンパク質特徴付けアッセイが提唱された(Swaminathanら、2015年、PLoS Comput. Biol.、11巻:e1004080頁)(Yao、Docterら、2015年)。すなわち、当該手法では、システイン、リシン、アルギニン、チロシン、アスパラギン酸/グルタミン酸などの、標準の化学を使用して容易に標識されるアミノ酸の蛍光標識を使用する(Basle、Joubertら、2010年)。部分的なペプチド配列情報を用いることの問題は、プロテオームにマッピングし戻すことが一対多数の関連であり、一意のタンパク質が識別されないことである。この一対多数のマッピング問題は、プロテオーム全体空間を、ペプチドがマッピングし戻される限られたタンパク質分子のサブセットに減少させることによって解決することができる。本質的に、単一の部分的なペプチド配列を100種または1000種の異なるタンパク質配列にマッピングし戻すことができるが、いくつかのペプチド(例えば、単一のタンパク質分子の消化に由来する10ペプチド)のセットを全て、コンパートメント内のタンパク質分子のサブセットに含有される単一のタンパク質分子にマッピングし戻した場合、タンパク質分子の同一性を推定することが容易であることが公知である。例えば、同じ分子に由来する全てのペプチドに関するペプチドプロテオームマップの交差により、可能性のあるタンパク質同一性のセットが著しく制限される(例えば図15を参照されたい)。
特に、部分的なペプチド配列または組成のマッピング可能性は、コンパートメントのタグおよびUMIの革新的使用を行うことによって有意に増強される。すなわち、プロテオームをバーコードが付されたコンパートメントに最初に分配し、ここでのコンパートメントバーコードは、UMI配列にも付着している。コンパートメントバーコードは、コンパートメントに一意の配列であり、UMIは、コンパートメント内のバーコードが付された分子それぞれに一意の配列である(例えば、図16を参照されたい)。一実施形態では、この分配は、その全体が参照により組み込まれる、PCT公開WO2016/061517に開示されているものと同様の方法を使用して、ビーズに付着しているDNAコンパートメントバーコードとのハイブリダイゼーションによる、DNAタグで標識されたポリペプチドとビーズの表面との直接相互作用によって、実現される(例えば、図31を参照されたい)。プライマー伸長ステップにより、ビーズに連結されたコンパートメントバーコードからポリペプチド上のDNAタグに情報を移行させる(例えば、図20を参照されたい)。別の実施形態では、この分配は、UMIを含有する、バーコードが付されたビーズおよびタンパク質分子をエマルジョンの液滴中に共封入することによって実現される。さらに、液滴は、タンパク質をペプチドに消化するプロテアーゼを必要に応じて含有する。いくつものプロテアーゼを、レポータータグが付されたポリペプチドを消化するために使用することができる(Switzar, Giera et al. 2013)。ブテラーゼIなどの酵素的リガーゼとプロテアーゼの共封入では、酵素をプロテアーゼ消化に対して抵抗性にするために、ペグ化などの酵素の修飾が必要になり得る(Frokjaerand Otzen 2005, Kang, Wang et al. 2010)。消化後、ペプチドをバーコード-UMIタグとライゲーションする。好ましい実施形態では、下流の生化学的操作を容易にするために、バーコード-UMIタグをビーズ上に保持する(例えば、図13を参照されたい)。
バーコード-UMIとペプチドのライゲーション後、エマルジョンを破壊し、ビーズを回収する。バーコードが付されたペプチドを、それらの一次アミノ酸配列、またはそれらのアミノ酸組成によって特徴付けることができる。ペプチドに関するどちらの型の情報も、プロテオームのサブセットにマッピングし戻すために使用することができる。一般に、配列情報は、組成情報よりもはるかに小さいプロテオームのサブセットにマッピングし戻される。それにもかかわらず、多数のペプチド(配列または組成)からの情報を同じコンパートメントバーコードと組み合わせることにより、ペプチドの起源であるタンパク質(複数可)を一意的に識別することが可能である。このように、プロテオーム全体を特徴付け、定量化することができる。ペプチド上の一次配列情報は、ペプチド配列を表すDNAにコードされるライブラリー(DNA Encoded Library)(DEL)の伸長記録タグ創出を伴うペプチド配列決定反応を実施することによって引き出すことができる。好ましい実施形態では、記録タグは、コンパートメントバーコードおよびUMI配列で構成される。この情報を、コーディングタグから移行された一次またはPTMアミノ酸情報と共に使用して、最終的なマッピングされたペプチド情報を生成する。
ペプチド配列情報に対する代替は、コンパートメントバーコードおよびUMIと連結したペプチドアミノ酸またはジペプチド/トリペプチド組成情報を生成することである。これは、UMI-バーコードが付されたペプチドを伴うビーズを、各ペプチド上の選択されたアミノ酸(内部)をアミノ酸コード情報および別のアミノ酸UMI(AA UMI)を含むDNAタグで部位特異的に標識するアミノ酸標識ステップに供することによって実現される(例えば図13を参照されたい)。最も化学標識しやすいアミノ酸(AA)は、リシン、アルギニン、システイン、チロシン、トリプトファン、およびアスパラギン酸/グルタミン酸であるが、他のAAに対する標識スキームを同様に展開することも実行可能であり得る(MendozaおよびVachet、2009年)。所与のペプチドは、同じ型のAAをいくつか含有し得る。同じ型の多数のアミノ酸の存在は、付着したAA UMI標識によって区別することができる。各標識分子は、DNAタグ内に異なるUMIを有し、それによりアミノ酸の計数が可能になる。化学標識に対する代替は、AAを結合性物質で「標識」することである。例えば、AAコード情報およびAA UMIを含むコーディングタグで標識されたチロシン特異的抗体を使用して、ペプチドの全てのチロシンに印を付けることができる。この手法に伴う注意事項は、大きなかさのある抗体では立体的な障害が生じることであり、この目的のためには、より小さなscFv、アンチカリン、またはClpSバリアントを使用することが理想的である。
一実施形態では、AAへのタグ付け後、情報を、記録タグと、ペプチド上の結合したまたは共有結合によりカップリングした結合性物質に付随する多数のコーディングタグとの間で、液滴当たり単一のペプチドが含有されるようにペプチド複合体を区画化し、エマルジョン融合PCRを実施して、区画化されたペプチドのアミノ酸組成を特徴付ける伸長コーディングタグまたはジタグのセットを構築することによって移行させる。ジタグの配列決定後、同じバーコードを有するペプチド上の情報を単一のタンパク質分子にマッピングし戻すことができる。
特定の実施形態では、タグが付されたペプチド複合体をビーズから解離させ(例えば図13を参照されたい)、小さなミニコンパートメント(例えば、マイクロエマルジョン)に、平均して単一の標識された/結合した結合性物質ペプチド複合体のみが所与のコンパートメント内に存在するように分配する。特定の実施形態では、この区画化は、マイクロエマルジョン液滴の生成によって実現される(Shim、Ranasingheら、2013年、Shembekar、Chaipanら、2016年)。ペプチド複合体に加えて、PCR試薬も、液滴中に3種のプライマー(U1、Sp、およびU2tr)と共封入することができる。液滴形成後、U1およびSpのみがアニーリングし、記録タグ産物が増幅するように、高いアニーリング温度でエマルジョンPCRを数サイクル実施する(約5~10サイクル)(例えば図13を参照されたい)。この最初の5~10サイクルのPCRの後、アミノ酸コードタグ上のU2trおよびSptrが増幅に加わるようにアニーリング温度を低下させ、さらに約10ラウンドを実施する。3プライマーエマルジョンPCRにより、ペプチドUMI-バーコードとAAコードタグの全てが有効に組み合わされ、それにより、ペプチドおよびそのアミノ酸組成のジタグライブラリー表示が生成する。3プライマーPCRおよびタグの連鎖を実施する他のモダリティを使用することもできる。別の実施形態は、光デブロッキング、または不安定なブロッキングされた3’ヌクレオチドの3’デブロッキングを開始するための油可溶性還元体の添加によって活性化される、3’ブロッキングされたU2プライマーの使用である。エマルジョンPCR後、NGS配列決定のためのライブラリーエレメントをフォーマットするための一般的なプライマーを用いて別のラウンドのPCRを実施することができる。
このように、ライブラリーエレメントの異なる配列成分を計数および分類のために使用する。所与のペプチド(コンパートメントバーコード-UMIの組合せによって識別される)について、多くのライブラリーエレメントが存在し、それぞれが識別用AAコードタグおよびAA UMIを有する(例えば図13を参照されたい)。AAコードおよび付随するUMIを使用して、所与のペプチド内の所与のアミノ酸型の存在を計数する。したがって、ペプチド(おそらくGluC、LysC、またはEndo AsnN消化物)を、そのアミノ酸組成(例えば、Cysが2つ、Lysが1つ、Argが1つ、Tyrが2つなど)によって、空間的順序は考慮せず、特徴付ける。それにもかかわらず、これにより、ペプチドをプロテオームのサブセットにマッピングするため、また、同じタンパク質分子に由来する他のペプチドと組み合わせて使用した場合には、タンパク質を一意的に識別および定量化するための、十分なシグネチャがもたらされる。
H.末端アミノ酸(TAA)標識のためのキットおよびキット成分
ある特定の実施形態では、ペプチドの末端アミノ酸(例えば、NTAAまたはCTAA)を、本明細書に記載の方法でペプチドを結合性物質と接触させる前に、修飾または標識する。そのような修飾および/または標識のためのキットおよびキット成分を本明細書で説明する。
一部の実施形態では、NTAAをフェニルイソチオシアネート(PITC)と反応させて、フェニルチオカルバモイル(PTC)-NTAA誘導体を生成する。エドマン分解では、一般には、フェニルイソチオシアネート(PITC)を使用してN末端を標識する。PITCは、本明細書に開示されている方法に十分に適する2つの性質を有する:(1)PITCはN末端アミン基を高い効率で標識する;および(2)得られるPTC誘導体化NTAAは、酸処理されると自己異性化を受け、それにより当該アミノ酸が残りのペプチドから切断される。
NTAAを標識するために使用することができる他の試薬としては、4-スルホフェニルイソチオシアネート、3-ピリジルイソチオシアネート(isothiocyante)(PYITC)、2-ピペリジノエチルイソチオシアネート(PEITC)、3-(4-モルホリノ)プロピルイソチオシアネート(MPITC)、3-(ジエチルアミノ)プロピルイソチオシアネート(DEPTIC)(Wanget al., 2009, Anal Chem 81: 1893-1900)、(1-フルオロ-2,4-ジニトロベンゼン(サンガー試薬、DNFB)、ダンシルクロリド(DNS-Cl、または1-ジメチルアミノナフタレン-5-スルホニルクロリド)、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)、アセチル化試薬、アミジン化(グアニジニル化)試薬、2-カルボキシ-4,6-ジニトロクロロベンゼン、7-メトキシクマリン酢酸、チオアシル化試薬、チオアセチル化試薬、およびチオベンジル化試薬が挙げられる。NTAAを標識のためにブロッキングする場合、例えば、N-アセチルブロッキングをアシルペプチドヒドロラーゼ(APH)で除去することなど、末端をアンブロッキングするための手法がいくつも存在する(Farries,Harris et al., 1991, Eur. J. Biochem. 196:679- 685)。ペプチドのN末端をアンブロッキングする方法は、当技術分野で公知である(例えば、Krishnaet al., 1991, Anal.Biochem.199:45-50;Leone et al., 2011, Curr. Protoc. ProteinSci., Chapter 11:Unit11.7;Fowler et al., 2001, Curr.Protoc.Protein Sci.,Chapter 11: Unit 11.7を参照されたく、これらの参考文献の各々は、これによりその全体が参照により組み込まれる)。
ダンシルクロリドは、ペプチドの遊離のアミン基と反応して、NTAAのダンシル誘導体をもたらす。DNFBおよびSNFBは、ペプチドのε-アミン基と反応して、それぞれDNP-NTAA、およびSNP-NTAAを生成する。さらに、DNFBおよびSNFBはどちらも、リシン残基のε-アミンとも反応する。DNFBは、チロシンおよびヒスチジンアミノ酸残基とも反応する。SNFBは、アミン基に対してDNFBよりも良好な選択性を有し、NTAA修飾に好ましい(Carty and Hirs 1968)。ある特定の実施形態では、ポリペプチドをプロテアーゼ消化してペプチドにする前に、リシンε-アミンを有機無水物でプレブロッキングする。
別の有用なNTAA修飾因子はアセチル基であり、その理由は、アセチル化NTAAを除去する公知の酵素、すなわち、N末端アセチル化アミノ酸を切断し、それによりペプチドを単一アミノ酸だけ有効に短縮するアシルペプチドヒドロラーゼ(APH)が存在するからである{Chang, 2015 #373; Friedmann, 2013 #374}。NTAAは、無水酢酸を用いて化学的にアセチル化することもでき、またはN末端アセチルトランスフェラーゼ(NAT)を用いて酵素的にアセチル化することもできる{Chang,2015 #373; Friedmann, 2013 #374}。さらに別の有用なNTAA修飾因子は、アミジニル(グアニジニル)部分であり、その理由は、アミジン化NTAAの証明された切断化学、すなわち、N末端アミジン化ペプチドを0.5~2%NaOHと一緒に穏やかにインキュベートすることにより、N末端アミノ酸の切断がもたらされることが文献で公知であるからである{Hamada,2016 #383}。これにより、穏やかなエドマン様化学的N末端分解ペプチド配列決定プロセスが有効にもたらされる。さらに、ある特定のアミジン化(グアニジニル化)試薬および下流のNaOH切断は、DNAエンコーディングに非常に適合性である。
NTAAにDNP/SNP基、アセチル基、またはアミジニル(グアニジニル)基が存在することにより、操作された結合性物質との相互作用のより良好な取り扱いがもたらされ得る。低nMの親和性を有する商業的なDNP抗体がいくつも存在する。他のNTAA標識方法としては、トリプリガーゼ(trypligase)を用いた標識(Liebscherら、2014年、Angew Chem Int Ed Engl、53巻:3024~3028頁)、およびアミノアシルトランスフェラーゼを用いた標識(Wagnerら、2011年、J Am Chem Soc、133巻:15139~15147頁)が挙げられる。
イソチオシアネートは、イオン性液体の存在下では、第一級アミンに対して増強された反応性を有することが示されている。イオン性液体は、有機化学反応における優れた溶媒であり(また、触媒として作用する)、チオ尿素を形成する、イソチオシアネートとアミンの反応を増強することができる。例は、フェニルイソチオシアネート(PITC)による芳香族および脂肪族アミンの迅速かつ効率的な標識のためにイオン性液体1-ブチル-3-メチル-イミダゾリウムテトラフルオロボレート[Bmim][BF4]を使用することである(Le、Chenら、2005年)。エドマン分解は、PITCなどのイソチオシアネートとペプチドのアミノN末端の反応を伴う。そのように、一実施形態では、より穏やかな標識および分解条件をもたらすことによってエドマン分解プロセスの効率を改善するためにイオン性液体を使用する。例えば、イオン性液体[Bmim][BF4]中5%(vol./vol.)PITCを25℃で10分間使用することは、ピリジン、エタノール、およびddH2Oを含有する溶液(1:1:1 vol./vol./vol.)中5%(vol./vol.)PITCを55℃で60分間使用する標準のエドマンPITC誘導体化条件下で標識することよりも効率的である(Wang、Fangら、2009年)。好ましい実施形態では、ポリペプチドの内部のリシン、チロシン、ヒスチジン、およびシステインアミノ酸を、ペプチドへの断片化の前にブロッキングする。このように、ペプチド配列決定反応中、ペプチドNTAAのα-アミン基のみが修飾に利用可能になるようにする。これは、特に、DNFB(サンガー試薬)およびダンシルクロリドを使用する場合に適切である。
ある特定の実施形態では、NTAAは、NTAA標識ステップの前にブロッキングされている(特にタンパク質の元のN末端)。その場合、例えば、N-アセチルブロッキングをアシルペプチドヒドロラーゼ(APH)で除去することなど、N末端をアンブロッキングするための手法がいくつも存在する(Farries、Harrisら、1991年)。ペプチドのN末端をアンブロッキングする他の方法がいくつも当技術分野で公知である(例えば、それぞれ、その全体が参照により本明細書に組み込まれる、Krishnaら、1991年、Anal. Biochem.、199巻:45~50頁;Leoneら、2011年、Curr. Protoc. Protein Sci.、第11章:ユニット11.7;Fowlerら、2001年、Curr. Protoc. Protein Sci.、第11章:ユニット11.7を参照されたい)。
CTAAは、Hermanson(Hermanson、2013年)に記載されている通り、いくつもの異なるカルボキシル反応性試薬を用いて修飾することができる。別の例では、CTAAを混合無水物およびイソチオシアネートで修飾して、チオヒダントインを生成する((LiuおよびLiang、2001年)および米国特許第5,049,507号)。チオヒダントインで修飾されたペプチドは、基剤中上昇した温度で切断されて、最後から2番目のCTAAが露出し、それにより、C末端に基づくペプチド分解配列決定手法を有効に生成することができる(LiuおよびLiang、2001年)。CTAAに対して行うことができる他の修飾としては、パラ-ニトロアニリド基の付加および7-アミノ-4-メチルクマリニル基の付加が挙げられる。
I.末端アミノ酸切断のためのキットおよびキット成分
ペプチドの解析に関するある特定の実施形態では、末端アミノ酸(N末端またはC末端)への結合性物質の結合、およびコーディングタグ情報の記録タグへの移行、記録タグ情報のコーディングタグへの移行、記録タグ情報およびコーディングタグ情報のジタグ構築物への移行の後、末端アミノ酸をペプチドから除去または切断して、新しい末端アミノ酸を露出させる。一部の実施形態では、末端アミノ酸は、NTAAである。他の実施形態では、末端アミノ酸は、CTAAである。
末端アミノ酸の切断は、化学的切断および酵素的切断を含めた、任意の数の公知の技法によって実現することができる。化学的切断の例は、エドマン分解である。ペプチドのエドマン分解中、n NTAAをフェニルイソチオシアネート(PITC)と弱アルカリ性条件下で反応させて、フェニルチオカルバモイル-NTAA誘導体を形成する。次に、酸性条件下で、フェニルチオカルバモイル-NTAA誘導体を切断し、それにより、遊離のチアゾリノン誘導体を生成し、それにより、ペプチドの(n-1)番目のアミノ酸をN末端アミノ酸((n-1)番目のNTAA)に変換する。このプロセスのステップを下で例示する。
典型的なエドマン分解では、上記の通り、長いインキュベーション時間にわたって厳しい高温の化学的条件(例えば、無水TFA)の発生が必要になる。これらの条件は、一般に、巨大分子の核酸エンコーディングには適合しない。
化学的エドマン分解を核酸エンコーディングに好都合の手法に変換するために、厳しい化学的ステップを穏やかな化学的分解または効率的な酵素的ステップで置き換える。一実施形態では、化学的エドマン分解を、元々記載された条件よりも穏やかな条件を使用して利用することができる。アセトニトリル中無水TFAを酢酸トリエチルアミンで置き換えること(例えば、その全体が参照により組み込まれる、Barrett、1985年、Tetrahedron Lett.、26巻:4375~4378頁を参照されたい)を含め、エドマン分解のための穏やかな切断条件がいくつか文献に記載されている。NTAAの切断は、エドマン分解と比較して穏やかな切断条件を使用するチオアシル化分解を使用することによって実現することもできる(米国特許第4,863,870号を参照されたい)。
別の実施形態では、無水TFAによる切断を、穏やかな条件下で切れやすいペプチド結合のカルボニル基のチオ尿素硫黄原子の求核攻撃によるPITC誘導体化N末端アミノ酸の除去を触媒する、操作された酵素である「エドマナーゼ(Edmanase)」で置き換えることができる(その全体が参照により組み込まれる、米国特許公開第US2014/0273004号を参照されたい)。エドマナーゼは、Trypanosoma cruziに由来するシステインプロテアーゼであるクルザイン(cruzain)を改変することによって作出された(Borgo、2014年)。C25G変異により触媒性システイン残基が除去されたと同時に、エドマン試薬(PITC)のフェニル部分との立体的な適合を創出するための3つの変異(G65S、A138C、L160Y)が選択された。
NTAAの酵素的切断は、アミノペプチダーゼによって実現することもできる。アミノペプチダーゼは、単量体酵素および多量体酵素として天然に存在し、金属またはATP依存性であり得る。天然のアミノペプチダーゼは、非常に限られた特異性を有し、一般的に、N末端アミノ酸を前進的に切断し、それにより、アミノ酸を次々に切断する。本明細書に記載の方法に関しては、アミノペプチダーゼを、NTAAに対して、N末端標識で修飾されている場合にのみ特異的な結合活性または触媒活性を有するように操作することができる。例えば、アミノペプチダーゼを、N末端アミノ酸がDNP/SNP、PTC、ダンシルクロリド、アセチル、アミジニルなどの基によって修飾されている場合にN末端アミノ酸のみを切断するように操作することができる。このように、アミノペプチダーゼは、一度にN末端から単一のアミノ酸だけ切断し、分解サイクルの制御を可能にする。一部の実施形態では、改変アミノペプチダーゼは、アミノ酸残基同一性に関しては非選択的である一方で、N末端標識に関しては選択的である。他の実施形態では、改変アミノペプチダーゼは、アミノ酸残基同一性とN末端標識の両方に関して選択的である。酵素的NTAA分解の修飾特異性のモデルの例は、BorgoおよびHavranekにより例示されており、そこでは、構造-機能補助設計を通じて、メチオニンアミノペプチダーゼがロイシンアミノペプチダーゼに変換された(BorgoおよびHavranek、2014年)。DNP/SNPで修飾されたNTAAなどの修飾されたNTAAに同様の手法をとることができ、ここで、アミノペプチダーゼを、DNP/SNP基が存在するN末端アミノ酸のみを切断するように操作する(構造-機能に基づく設計および定向進化の両方を使用する)。個々のまたは小さな群の標識した(ビオチン化した)NTAAに結合し、それを切断する操作されたアミノペプチダーゼ変異体が記載されている(PCT公開第WO2010/065322号を参照されたい)。
ある特定の実施形態では、緻密な単量体金属酵素的アミノペプチダーゼを、DNPで標識されたNTAAを認識し、切断するように操作する。単量体メタロ-アミノペプチダーゼの使用には、重要な利点が2つある:1)緻密な単量体タンパク質は、ファージディスプレイを使用してディスプレイおよびスクリーニングするのがはるかに容易である;2)メタロ-アミノペプチダーゼは、適切な金属カチオンを添加または除去することによってその活性をオン/オフにすることができるという点で、独特の利点を有する。例示的なアミノペプチダーゼとしては、Streptomyces sp.KK506(SKAP)(Yoo、Ahnら、2010年)、Streptomyces griseus(SGAP)、Vibrio proteolyticus(VPAP)、(SpunginおよびBlumberg、1989年、Ben-Meir、Spunginら、1993年)などの、アミノペプチダーゼのM28ファミリーが挙げられる。これらの酵素は、室温およびpH8.0で安定であり、ロバストであり、かつ活性であり、したがって、ペプチド解析に好ましい穏やかな条件に適合する。
別の実施形態では、アミノペプチダーゼを、N末端アミノ酸標識の存在下でのみ活性になるように操作することにより、周期的切断が達成される。さらに、アミノペプチダーゼを、非特異的になるように、したがって、1つの特定のアミノ酸を別のアミノ酸に対して選択的に認識するのではなく、単に標識されたN末端を認識するように、操作することができる。好ましい実施形態では、メタロペプチダーゼ単量体アミノペプチダーゼ(例えば、Vibroロイシンアミノペプチダーゼ)(Hernandez-Moreno、Villasenorら、2014年)を、修飾されたNTAA(例えば、PTC、DNP、SNP、アセチル化された、アシル化されたなど)のみを切断するように操作する。
さらに別の実施形態では、アセチル化NTAAを切断するように操作されたアシルペプチドヒドロラーゼ(APH)を使用することによって周期的切断を達成する。APHは、ブロッキングされたペプチドからのNα-アセチル化アミノ酸の除去を触媒することができるセリンペプチダーゼであり、真核細胞、細菌細胞および古細菌細胞において、N末端がアセチル化されたタンパク質の重要な調節因子である。ある特定の実施形態では、APHは、二量体であり、エキソペプチダーゼ活性のみを有する(Gogliettino、Balestrieriら、2012年、Gogliettino、Riccioら、2014年)。操作されたAPHは、内因性または野生型APHよりも高い親和性および低い選択性を有し得る。
さらに別の実施形態では、NTAAのアミジン化(グアニジニル化)を使用して、標識されたNTAAのNaOHを使用した穏やかな切断を可能にする(Hamada、2016年、その全体が参照により組み込まれる)。S-メチルイソチオ尿素、3,5-ジメチルピラゾール-1-カルボキサミジン、S-エチルチオウロニウムブロミド、S-エチルチオウロニウムクロリド、O-メチルイソ尿素、O-メチルイソウロニウム硫酸塩、O-メチルイソ尿素硫化水素塩、2-メチル-1-ニトロイソ尿素、アミノイミノメタンスルホン酸、シアナミド、シアノグアニド、ジシアンジアミド、3,5-ジメチル-1-グアニルピラゾール硝酸塩および3,5-ジメチルピラゾール、N,N’-ビス(オルト-クロロ-Cbz)-S-メチルイソチオ尿素およびN,N’-ビス(オルト-ブロモ-Cbz)-S-メチルイソチオ尿素を含めたいくつものアミジン化(グアニジニル化)試薬が当技術分野で公知である(Katritzky、2005年、その全体が参照により組み込まれる)。
NTAAの標識、結合、および分解ワークフローの例は以下の通りである(例えば図41および図42を参照されたい):タンパク質分解による消化に由来する、記録タグで標識されたペプチドの大きな集団(例えば、5千万~10億)を単一分子シーケンシング基板(例えば、多孔質ビーズ)に適切な分子内間隔でランダムに固定化する。周期的に、各ペプチドのN末端アミノ酸(NTAA)を小さな化学的部分(例えば、DNP、SNP、アセチル)で修飾して、NTAA分解プロセスの周期的制御をもたらし、同類結合性物質による結合親和性を増強する。各固定化ペプチドの修飾されたN末端アミノ酸(例えば、DNP-NTAA、SNP-NTAA、アセチル-NTAA)に同類のNTAA結合性物質を結合させ、結合したNTAA結合性物質に付随するコーディングタグからの情報を固定化されたペプチドに付随する記録タグに移行させる。NTAAの認識、結合、およびコーディングタグ情報の記録タグへの移行の後、標識されたNTAAを、標識の存在下でのみNTAAを切断することができる操作されたアミノペプチダーゼ(例えば、DNP-NTAAもしくはSNP-NTAAに対して)または操作されたAPH(例えば、アセチル-NTAAに対して)に曝露させることによって除去する。他のNTAA標識(例えば、PITC)も、適切に操作されたアミノペプチダーゼとともに使用することもできる。特定の実施形態では、単一の操作されたアミノペプチダーゼまたはAPHは、N末端アミノ酸標識を有する全ての可能性のあるNTAA(翻訳後修飾バリアントを含む)を普遍的に切断する。別の特定の実施形態では、2種、3種、4種、またはそれよりも多くの操作されたアミノペプチダーゼまたはAPHを使用して、標識されたNTAAのレパートリーを切断する。
DNPまたはSNPで標識されたNTAAに対する活性を有するアミノペプチダーゼは、ベンジルペニシリンに対するメタロ-ベータ-ラクタマーゼ酵素の操作におけるPonsardらにより記載されている手法(Ponsard、Galleniら、2001年、Fernandez-Gacio、Uguenら、2003年)のような、アポ酵素(金属補助因子の不在下では不活性)に対する密接結合の選択、その後の機能的触媒の選択ステップを組み合わせるスクリーニングを使用して選択することができる。この二段階選択は、Zn2+イオンの添加によって活性化されたメタロ-APの使用を伴う。固定化されたペプチド基板への密接結合選択の後、Zn2+を導入し、DNPまたはSNPで標識されたNTAAを加水分解することが可能な、触媒として活性なファージにより、結合したファージの上清中への放出が導かれる。DNPまたはSNPで標識されたNTAAを切断するための活性なAPを濃縮するために、選択ラウンドを繰り返し実施する。
本明細書において提示される実施形態のいずれかでは、NTAAの切断試薬のNTAAへの動員は、キメラ切断酵素およびキメラNTAA修飾因子によって増強することができ、ここで、キメラ切断酵素およびキメラNTAA修飾因子は、それぞれ、互いと密接結合反応することが可能な部分を含む(例えば、ビオチン-ストレプトアビジン)(例えば図39を参照されたい)。例えば、NTAAをビオチン-PITCで修飾し、キメラ切断酵素(ストレプトアビジン-エドマナーゼ)を修飾されたNTAAにストレプトアビジン-ビオチン相互作用によって動員し、それにより切断酵素の親和性および効率を改善することができる。修飾されたNTAAが切断され、付随する切断酵素と共にペプチドから発散する。キメラエドマナーゼの例では、この手法により、親和性KがμMからサブピコモルまで有効に増大する。記録タグと相互作用する切断剤上のDNAタグを使用した係留により、同様の切断の増強も実現することができる(例えば図44を参照されたい)。
NTAAの切断のための代替として、ジペプチジルアミノペプチダーゼ(DAP)を使用して、最後の2つのN末端アミノ酸をペプチドから切断することができる。ある特定の実施形態では、単一のNTAAを切断することができる(例えば、図45を参照されたい)。図45は、ブテラーゼIペプチド基質のN末端ライゲーションによりTEVエンドペプチダーゼ基質をペプチドのN末端に付着させる、N末端分解のための手法を示す。付着後、TEVエンドペプチダーゼにより、新しくライゲーションされたペプチドがクエリペプチド(配列決定されるペプチド)から切断され、NTAAに付着した単一のアスパラギン(N)が残る。N末端から2つのアミノ酸を切断するDAPと一緒にインキュベートすることにより、元のNTAAが最終的に除去されることになる。このプロセス全体をN末端分解プロセスとして周期的に繰り返すことができる。
CTAA結合性物質に関する実施形態に関しては、CTAAをペプチドから切断する方法も当技術分野で公知である。例えば、米国特許第6,046,053号には、ペプチドまたはタンパク質をアルキル酸無水物と反応させて、カルボキシ末端をオキサゾロンに変換させ、酸およびアルコールまたはエステルを用いた反応によってC末端アミノ酸を遊離させる方法が開示されている。CTAAの酵素的切断はまた、カルボキシペプチダーゼによっても実現することができる。いくつかのカルボキシペプチダーゼは、アミノ酸の優先性を示し、例えば、カルボキシペプチダーゼBは、アルギニンおよびリシンなどの塩基性アミノ酸において優先的に切断する。上記の通り、カルボキシペプチダーゼをアミノペプチダーゼと同じように改変して、C末端標識を有するCTAAに特異的に結合するカルボキシペプチダーゼを操作して作製することもできる。このように、カルボキシペプチダーゼは、C末端から一度に単一のアミノ酸のみを切断し、分解サイクルの制御を可能にする。一部の実施形態では、改変カルボキシペプチダーゼは、アミノ酸残基同一性に関しては非選択的であるが、C末端標識については選択的である。他の実施形態では、改変カルボキシペプチダーゼは、アミノ酸残基同一性およびC末端標識の両方に関して選択的である。
J.伸長記録タグ、伸長コーディングタグまたはジタグの処理および解析のためのキットおよびキット成分
目的の巨大分子(複数可)を表す伸長記録タグ、伸長コーディングタグ、およびジタグライブラリーを、種々の核酸配列決定法を使用して処理および解析することができる。配列決定法の例としては、これだけに限定されないが、連鎖停止配列決定(サンガー配列決定);合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、およびパイロシーケンシングなどの次世代シーケンシング法;および単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、DI(duplex interrupted)シーケンシング、および先端顕微鏡を使用したDNAのダイレクトイメージングなどの第3世代シーケンシング法が挙げられる。
伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーを様々なやり方で増幅することができる。伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーに、例えば、PCRまたはエマルジョンPCRによって、指数関数的な増幅を行うことができる。エマルジョンPCRにより、より均一な増幅がもたらされることが公知である(Hori, Fukano et al. 2007)。一部の実施形態では、反復バーコードまたはスペーサー配列を有する配列については、PCR鋳型乗り換えのリスクが高く、エマルジョンPCRまたは線形増幅を使用してそのリスクを低下させることができる。例えば、あらゆる目的で参照により本明細書に組み込まれる米国特許第9,593,375(B2)号において開示されているようなエマルジョンPCRを使用することができる。
あるいは、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーに、例えば、T7 RNAポリメラーゼおよびcDNAにコピーし戻すための逆転写(RT)ポリメラーゼを使用する鋳型DNAのin vitro転写によって、線形増幅を行うことができる。一態様では、線形増幅も鋳型乗り換えを低減または消去する。伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーは、それに含有されるユニバーサルフォワードプライミング部位およびユニバーサルリバースプライミング部位に適合するプライマーを使用して増幅することができる。伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーは、伸長記録タグ、伸長コーディングタグ、またはジタグの5’末端、3’末端または両末端のいずれかに配列を付加するための尾部を有するプライマーを使用して増幅することもできる。伸長記録タグ、伸長コーディングタグ、またはジタグの末端に付加することができる配列としては、単一の配列決定の実行で多数のライブラリーを多重化することを可能にするライブラリー特異的インデックス配列、アダプター配列、読み取りプライマー配列、または、配列決定プラットフォームに適合する、伸長記録タグ、伸長コーディングタグ、もしくはジタグのライブラリーを作出するための任意の他の配列が挙げられる。次世代シーケンシングのための調製におけるライブラリー増幅の例は以下の通りである:ビーズ(約10ng)約1mgから溶出した伸長記録タグライブラリー、200uMのdNTP、1μMの各フォワードおよびリバース増幅プライマー、0.5μl(1U)のPhusion Hot Start酵素(New England Biolabs)を使用してPCR反応体積20μlをセットアップし、以下のサイクル条件に供す:98℃で30秒、その後、98℃で10秒、60℃で30秒、72℃で30秒を20サイクル、その後、72℃で7分、次いで、4℃で保持。
ある特定の実施形態では、増幅前、増幅中または増幅後のいずれかにおいて、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーに標的濃縮を行うことができる。標的濃縮は、配列決定前に、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーから、目的の巨大分子を表す伸長記録タグを選択的に捕捉または増幅するために使用することができる。タンパク質配列に対する標的濃縮は、費用が高く、また、標的タンパク質に対して高度に特異的な結合性物質を作製することが難しいので、困難である。抗体は、非特異的であり、何千ものタンパク質にわたる規模生産が難しいことが周知である。本開示の方法では、タンパク質コードを核酸コードに変換し、次いで、DNAライブラリーに利用可能な広範囲の標的化DNA濃縮戦略を使用することによってこの問題を回避する。目的のペプチドを、それらの対応する伸長記録タグを濃縮することによって試料中で濃縮することができる。標的化濃縮の方法が当技術分野で公知であり、それらとして、ハイブリッド捕捉アッセイ、PCRに基づくアッセイ、例えば、TruSeq custom Amplicon(Illumina)、padlockプローブ(分子反転プローブとも称される)などが挙げられる(それぞれ、その全体が参照により本明細書に組み込まれる、Mamanovaら、2010年、Nature Methods、7巻:111~118頁;Bodiら、J. Biomol. Tech.、2013年、24巻:73~86頁;Ballesterら、2016年、Expert Review of Molecular Diagnostics、357~372頁;Mertesら、2011年、Brief Funct. Genomics、10巻:374~386頁;Nilssonら、1994年、Science、265巻:2085~8頁を参照されたい)。
一実施形態では、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーをハイブリッド捕捉に基づくアッセイによって濃縮する(例えば、図17Aおよび図17Bを参照されたい)。ハイブリッド-捕捉に基づくアッセイでは、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーを、アフィニティータグ(例えば、ビオチン)で標識した標的特異的オリゴヌクレオチドまたは「ベイトオリゴヌクレオチド」とハイブリダイズさせる。標的特異的オリゴヌクレオチドとハイブリダイズさせた伸長記録タグ、伸長コーディングタグ、またはジタグを、親和性リガンド(例えば、ストレプトアビジンでコーティングしたビーズ)を使用してそれらの親和性タグを介して「プルダウン」し、バックグラウンド(非特異的な)伸長記録タグを洗い流す(例えば、図17を参照されたい)。次いで、濃縮された伸長記録タグ、伸長コーディングタグ、またはジタグを正の濃縮のために得る(例えば、ビーズから溶出する)。
アレイに基づく「in situ」オリゴヌクレオチド合成およびその後のオリゴヌクレオチドプールの増幅によって合成されたベイトオリゴヌクレオチドに関しては、所与のオリゴヌクレオチドアレイ内でユニバーサルプライマーのいくつかのセットを使用することにより、競合するベイトを操作してプールにすることができる。それぞれの型のユニバーサルプライマーについて、ビオチン化プライマーと非ビオチン化プライマーの比により、濃縮比を制御する。いくつかのプライマー型の使用により、いくつかの濃縮比を設計して最終的なオリゴヌクレオチドベイトプールにすることができる。
ベイトオリゴヌクレオチドを目的の巨大分子を表す伸長記録タグ、伸長コーディングタグ、またはジタグと相補的になるように設計することができる。伸長記録タグ、伸長コーディングタグ、またはジタグ内のスペーサー配列に対するベイトオリゴヌクレオチドの相補性の程度は、0%から100%まで、およびその間の任意の整数にすることができる。このパラメーターは、少しの濃縮実験によって容易に最適化することができる。一部の実施形態では、コーディングタグ設計においてエンコーダー配列に対するスペーサーの長さを最小化する、または、スペーサーを、ベイト配列とのハイブリダイゼーションに利用できないように設計する。1つの手法は、補助因子の存在下で二次構造を形成するスペーサーを使用することである。そのような二次構造の例は、互いの上に積み重なった2つまたはそれよりも多くのグアニンカルテットによって形成される構造である、G-4重鎖である(Bochman、Paeschkeら、2012年)。グアニンカルテットは、フーグスティーン水素結合によって結びついた4つのグアニン塩基によって形成される平面正方形構造である。G-4重鎖構造は、カチオン、例えば、K+イオン対Li+イオンの存在下で安定化される。
使用するベイトオリゴヌクレオチドの数を最小限にするために、各タンパク質に由来する比較的一意のペプチドのセットをバイオインフォマティクスにより識別することができ、目的のペプチドの対応する伸長記録タグライブラリー表示と相補的なベイトオリゴヌクレオチドのみをハイブリッド捕捉アッセイに使用する。同じまたは異なるベイトセットを用いて逐次的なラウンドまたは濃縮を行うこともできる。
その断片(例えば、ペプチド)を表す伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリー中の巨大分子(例えば、タンパク質またはポリペプチド)の全長を濃縮するために、「タイルド」ベイトオリゴヌクレオチドをタンパク質の核酸表示全体にわたって設計することができる。
別の実施形態では、プライマー伸長およびライゲーションに基づき媒介される増幅濃縮(AmpliSeq、PCR、TruSeq TSCAなど)を使用して、巨大分子のサブセットを表すライブラリーエレメントを選択し、モジュール画分を濃縮することができる。競合するオリゴを使用して、プライマー伸長、ライゲーション、または増幅の程度を調整することもできる。最も単純な実行では、これは、ユニバーサルプライマー尾部を含む標的特異的プライマーと5’ユニバーサルプライマー尾部を欠く競合プライマーの混合物によって実現することができる。最初のプライマー伸長の後、5’ユニバーサルプライマー配列を有するプライマーのみを増幅することができる。ユニバーサルプライマー配列を有するプライマーとユニバーサルプライマー配列を有さないプライマーの比により、増幅する標的の分率を制御する。他の実施形態では、ハイブリダイズするが伸長しないプライマーを含めることを使用して、プライマー伸長、ライゲーション、または増幅を受けるライブラリーエレメントの分率をモジュレートすることができる。
配列決定前に伸長記録タグ、伸長コーディングタグ、またはジタグをライブラリーから選択的に除去するために標的化濃縮法を負の選択形式で使用することもできる。したがって、ビオチン化ベイトオリゴヌクレオチドおよびストレプトアビジンでコーティングしたビーズを使用する上記の例において、上清を配列決定のために保持する一方で、ビーズに結合したベイト-オリゴヌクレオチド:伸長記録タグ、伸長コーディングタグ、またはジタグハイブリッドは解析しない。除去することができる望ましくない伸長記録タグ、伸長コーディングタグ、またはジタグの例は、豊富な巨大分子種、例えば、タンパク質、アルブミン、免疫グロブリンなどを表すものである。
標的とハイブリダイズするがビオチン部分を欠く競合オリゴヌクレオチドベイトをハイブリッド捕捉ステップに使用して、濃縮しようとする任意の特定の遺伝子座の分率をモジュレートすることもできる。競合オリゴヌクレオチドベイトは、標的とのハイブリダイゼーションについて、濃縮中の標的プルダウンの分率を有効にモジュレートする標準のビオチン化ベイトと競合する(例えば図17を参照されたい)。特にアルブミンなどの過度に豊富な種に関して、この競合的な抑制手法を使用することで10桁のタンパク質発現のダイナミックレンジを何桁か圧縮することができる。したがって、所与の遺伝子座に関して、標準のハイブリッド捕捉に対する捕捉されるライブラリーエレメントの分率を100%から0%濃縮までモジュレートすることができる。
さらに、ライブラリー正規化技法を使用して、過度に豊富な種を伸長記録タグ、伸長コーディングタグ、またはジタグライブラリーから除去することができる。この手法は、トリプシン、LysC、GluCなどの部位特異的プロテアーゼ消化によって生成されたペプチドを起源とする定義された長さのライブラリーに対して最良に機能する。一実施例では、正規化は、二本鎖ライブラリーを変性させ、ライブラリーエレメントを再アニーリングさせることによって実現することができる。豊富なライブラリーエレメントは、2分子ハイブリダイゼーションカイネティクスの二次速度定数に起因して、豊富さがより低いエレメントよりも迅速に再アニーリングする(Bochman、Paeschkeら、2012年)。ヒドロキシアパタイトカラムでのクロマトグラフィー(VanderNootら、2012年、Biotechniques、53巻:373~380頁)またはライブラリーを、dsDNAライブラリーエレメントを破壊するタラバガニ由来の2重鎖特異的ヌクレアーゼ(DSN)で処理すること(Shaginら、2002年、Genome Res.、12巻:1935~42頁)などの当技術分野で公知の方法を使用して、ssDNAライブラリーエレメントを豊富なdsDNAライブラリーエレメントから分離することができる。
固体支持体に付着させる前の巨大分子および/または得られた伸長記録タグライブラリーの分画、濃縮、およびサブトラクション方法の任意の組合せにより、配列決定読み取りを節約し、豊富さが低い種の測定を改善することができる。
一部の実施形態では、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーをライゲーションまたは末端相補的PCRによって連鎖状にして、それぞれ多数の異なる伸長記録タグ、伸長コーディングタグ、またはジタグを含む長いDNA分子を創出する(それぞれ、その全体が参照により組み込まれる、Duら、2003年、BioTechniques、35巻:66~72頁;Mueckeら、2008年、Structure、16巻:837~841頁;米国特許第5,834,252号)。この実施形態は、例えば、長鎖のDNAをナノポアシーケンシングデバイスによって解析するナノポアシーケンシングである。
一部の実施形態では、伸長記録タグ、伸長コーディングタグ、またはジタグに対して直接単一分子解析を実施する(例えば、Harrisら、2008年、Science、320巻:106~109頁を参照されたい)。伸長記録タグ、伸長コーディングタグ、またはジタグを、フローセル表面(任意選択でマイクロセルパターン)へのローディングに適合するフローセルまたはビーズなどの固体支持体上で直接解析することができ、ここで、フローセルまたはビーズは、単一分子シーケンサーまたは単一分子脱コーディング計器に組み込むことができる。単一分子脱コーディングに関しては、プールした蛍光標識した脱コーディングオリゴヌクレオチドの数ラウンドのハイブリダイゼーション(Gundersonら、2004年、Genome Res.、14巻:970~7頁)を使用して、伸長記録タグ内のコーディングタグの同一性および順序の両方を確認することができる。コーディングタグの結合の順序をデコンボリューションするために、結合性物質を上記のサイクル特異的コーディングタグで標識することができる(Gundersonら、2004年、Genome Res.、14巻:970~7頁も参照されたい)。サイクル特異的コーディングタグは、単一の巨大分子を表す単一の連鎖状の伸長記録タグ、または単一の巨大分子を表す伸長記録タグの集合のどちらに対しても機能する。
伸長レポータータグ、伸長コーディングタグ、またはジタグライブラリーの配列決定後、得られた配列をそれらのUMIにより崩壊させ、次いで、それらの対応する巨大分子(例えば、ペプチド、タンパク質、タンパク質複合体)に付随させ、細胞内の巨大分子型全体(例えば、ペプチド、ポリペプチド、タンパク質巨大分子についてのプロテオーム)とアラインメントすることができる。得られた配列をそれらのコンパートメントタグにより崩壊させ、特定の実施形態では、単一のタンパク質分子のみまたは非常に限られた数のタンパク質分子を含有する、それらの対応するコンパートメントのプロテオームに付随させることもできる。タンパク質の識別および数量化はどちらも、このデジタルペプチド情報から容易に引き出すことができる。
一部の実施形態では、コーディングタグ配列を特定の配列決定解析プラットフォームに対して最適化することができる。特定の実施形態では、配列決定プラットフォームは、ナノポアシーケンシングである。一部の実施形態では、配列決定プラットフォームの塩基当たりのエラー率は、>5%、>10%、>15%、>20%、>25%、または>30%である。例えば、ナノポアシーケンシング装置を使用して伸長記録タグを解析する場合、バーコード配列(例えば、エンコーダー配列)を、ナノポアを通過時に最適に電気的に区別可能になるように設計することができる。本明細書に記載の方法に従ったペプチド配列決定は、ナノポアシーケンシングの一塩基正確度はまだ幾分低いが(75%~85%)、「エンコーダー配列」の決定は、はるかにより正確であるはずである(>99%)ことを考慮すると、ナノポアシーケンシングによく適し得る。さらに、DI(duplex interrupted)ナノポアシーケンシングと称される技法を、システム設計を著しく単純化する分子モーターを必要とせずに、ナノポア鎖シーケンシングと共に使用することができる(Derrington、Butlerら、2010年)。DIナノポアシーケンシングによる伸長記録タグの読み取りには、連鎖状の伸長記録タグライブラリー内のスペーサーエレメントを相補的なオリゴヌクレオチドとアニーリングする必要がある。本明細書で使用されるオリゴヌクレオチドは、得られる2重鎖の有効なTmを上昇させるために、LNA、または他の改変された核酸または類似体を含んでよい。これらの2重鎖スペーサー領域で装飾された一本鎖伸長記録タグがポアを通過するに従い、2本鎖領域が狭窄域で一過性にストールし、それにより、2重鎖領域に隣接する約3塩基の電流読み取りが可能になる。特定の実施形態では、DIナノポアシーケンシングのために、エンコーダー配列を、スペーサーエレメントに隣接する3塩基により最大限に電気的に区別可能なナノポアシグナルが生じるように設計する(Derringtonら、2010年、Proc. Natl. Acad. Sci. USA、107巻:16060~5頁)。モーターフリーDIシーケンシングの代替として、スペーサーエレメントを、ナノポアを通過するに従い、伸長記録タグ、伸長コーディングタグ、またはジタグを一過性にストールし、それにより、隣接するエンコーダー配列の読み取りを可能にするG-カルテットなどの二次構造をとるように設計することができる(Shim、Tanら、2009年、Zhang、Zhangら、2016年)。ストールを過ぎて進んだ後、次のスペーサーにより一過性のストールが創出され、それにより、次のエンコーダー配列の読み取りが可能になる、などである。
本明細書に開示されている方法は、複数の巨大分子(例えば、ペプチド)の同時(多重化)検出、定量化および/または配列決定を含めた解析のために使用することができる。多重化とは、本明細書で使用される場合、複数の巨大分子を同じアッセイで解析することを指す。複数の巨大分子は、同じ試料に由来するものであってもよく、異なる試料に由来するものであってもよい。複数の巨大分子は、同じ対象に由来するものであってもよく、異なる対象に由来するものであってもよい。解析される複数の巨大分子は、異なる巨大分子(例えば、ペプチド)であってもよく、異なる試料に由来する同じ巨大分子(例えば、ペプチド)であってもよい。複数の巨大分子は、2またはそれよりも多くの巨大分子、5またはそれよりも多くの巨大分子、10またはそれよりも多くの巨大分子、50またはそれよりも多くの巨大分子、100またはそれよりも多くの巨大分子、500またはそれよりも多くの巨大分子、1000またはそれよりも多くの巨大分子、5,000またはそれよりも多くの巨大分子、10,000またはそれよりも多くの巨大分子、50,000またはそれよりも多くの巨大分子、100,000またはそれよりも多くの巨大分子、500,000またはそれよりも多くの巨大分子、または1,000,000またはそれよりも多くの巨大分子を含む。
試料多重化は、記録タグで標識された巨大分子試料を予めバーコーディングすることによって実現することができる。各バーコードは異なる試料を表し、試料を周期的結合アッセイまたは配列解析前にプールすることができる。このように、多くのバーコードで標識した試料を単一のチューブ内で同時に処理することができる。この手法は、逆相タンパク質アレイ(RPPA)で実施するイムノアッセイに対する有意な改善である(Akbani、Beckerら、2014年、CreightonおよびHuang、2015年、NishizukaおよびMills、2016年)。このように、本開示は、基本的に、単純なワークフローを用いるRPPAアッセイの代わりに、多重化された高度にデジタルの試料および分析物を提供する。
K.NTAA認識、記録タグ伸長およびNTAA切断の周期的ラウンドによる巨大分子特徴付けのためのキットおよびキット成分
ある特定の実施形態では、本開示において提示される巨大分子を解析するための本キットを使用する方法は、多数の結合サイクルを有し、ここで、巨大分子を複数の結合性物質と接触させ、連続的な結合性物質の結合により、核酸に基づくコーディングタグの形態の履歴的な結合情報が、巨大分子に付随する少なくとも1つの記録タグに移行する。このようにして、多数の結合事象に関する情報を含有する履歴的記録を核酸形式で生成する。
N末端分解に基づく手法を使用してペプチド巨大分子を解析するための方法に関する実施形態(例えば、図3、図4、図41および図42を参照されたい)では、第1の結合性物質をnアミノ酸のペプチドのn番目NTAAに接触させて結合させ、第1の結合性物質のコーディングタグ情報をペプチドに付随する記録タグに移行させ、それにより一次伸長記録タグを生成した後、n番目のNTAAを本明細書に記載の通り切断する。n番目のNTAAの切断により、ペプチドの(n-1)番目のアミノ酸がN末端アミノ酸に変わり、これは、本明細書では(n-1)番目のNTAAと称される。本明細書に記載の通り、n番目のNTAAを必要に応じて部分(例えば、PTC、DNP、SNP、アセチル、アミジニルなど)で標識することができ、これは、標識された形態のNTAAに結合するように操作される切断酵素と併せて特に有用である。n番目のNTAAを標識したら、次いで、(n-1)番目のNTAAも同じ部分を用いて標識する。第2の結合性物質をペプチドと接触させ、(n-1)番目のNTAAに結合させ、第2の結合性物質のコーディングタグ情報を、一次伸長記録タグに移行させ、それによって二次伸長記録タグ(例えば、ペプチドを表す連鎖状のn次伸長記録タグを生成するため)を生成するか、または異なる記録タグ(例えば、ペプチドを集合的に表す多数の伸長記録タグを生成するため)に移行させる。(n-1)番目のNTAAの切断により、ペプチドの(n-2)番目のアミノ酸がN末端アミノ酸に変わり、これは、本明細書では(n-2)番目のNTAAと称される。追加的な結合、移行、切断、および必要に応じてNTAA標識を、上記の通り、最大nアミノ酸まで行って、ペプチドを集合的に表す、n次伸長記録タグまたはn個の別々の伸長記録タグを生成することができる。本明細書で使用される場合、結合性物質、コーディングタグ、または伸長記録タグに関して使用されるときのn「次」は、結合性物質およびそれに付随するコーディングタグを使用する第nの結合サイクル、または、伸長記録タグを創出するn回の結合サイクルを指す。
一部の実施形態では、第1の結合性物質および第2の結合性物質、ならびに任意選択で任意のさらなる結合性物質(例えば、第3の結合性物質、第4の結合性物質、第5の結合性物質など)の巨大分子への接触を同時に実施する。例えば、第1の結合性物質および第2の結合性物質、ならびに任意選択で任意のさらなる次数の結合性物質を、例えば結合性物質のライブラリーを形成するために、一緒にプールすることができる。別の例では、第1の結合性物質および第2の結合性物質、ならびに任意選択で任意のさらなる次数の結合性物質を、一緒にプールするのではなく、巨大分子に同時に添加する。一実施形態では、結合性物質のライブラリーは、20種の標準の天然に存在するアミノ酸に選択的に結合する少なくとも20種の結合性物質を含む。
他の実施形態では、第1の結合性物質および第2の結合性物質、ならびに任意選択で任意のさらなる次数の結合性物質をそれぞれ別々の結合サイクルで巨大分子をと接触させ、逐次的に添加する。ある特定の実施形態では、多数の結合性物質を同時に使用することが好ましく、その理由は、並行手法により時間が節約されるから、および、結合性物質が競合状態になり、それにより、同類結合性物質が結合する部位への非同類結合性物質による非特異的結合が低減するからである。
本明細書に記載の方法によって生成される最終的な伸長記録タグの長さは、コーディングタグ(例えば、エンコーダー配列およびスペーサー)の長さ、記録タグ(例えば、一意の分子識別子、スペーサー、ユニバーサルプライミング部位、バーコード)の長さ、実施される結合サイクルの数、および各結合サイクルからのコーディングタグが同じ伸長記録タグに移行されるか多数の伸長記録タグに移行されるかを含めた多数の因子に依存する。ペプチドを表し、エドマン分解様切断方法によって作製される連鎖状の伸長記録タグの例では、コーディングタグが、両側に5塩基のスペーサーが隣接する5塩基のエンコーダー配列を有する場合、ペプチドの結合性物質履歴を示す最終的な伸長記録タグ上のコーディングタグ情報は、10塩基×エドマン分解サイクルの数になる。20サイクルの実行に関しては、伸長記録は、少なくとも200塩基である(最初の記録タグ配列は含めない)。この長さは、標準の次世代シーケンシング計器に適合する。
最終的な結合サイクルおよび最終的な結合性物質のコーディングタグ情報の伸長記録タグへの移行の後、記録タグに、ユニバーサルリバースプライミング部位をライゲーション、プライマー伸長または当技術分野で公知の他の方法によって付加することによってキャップ形成することができる。一部の実施形態では、記録タグ内のユニバーサルフォワードプライミング部位は最終的な伸長記録タグに付属するユニバーサルリバースプライミング部位に適合する。一部の実施形態では、ユニバーサルリバースプライミング部位は、Illumina P7プライマー(5’-CAAGCAGAAGACGGCATACGAGAT-3’-配列番号134)またはIllumina P5プライマー(5’-AATGATACGGCGACCACCGA-3’-配列番号133)である。記録タグの鎖のセンスに応じてセンスまたはアンチセンスP7を付属させることができる。伸長記録タグライブラリーを固体支持体(例えば、ビーズ)からから直接切断または増幅し、従来の次世代シーケンシングアッセイおよびプロトコールに使用することができる。
一部の実施形態では、プライマー伸長反応を一本鎖伸長記録タグのライブラリーに対して実施して、その相補鎖をコピーする。
NGPSペプチドシーケンシングアッセイは、いくつかの化学的ステップおよび酵素的ステップを周期的進行で含む。NGPSシーケンシングは単一分子であるという事実により、いくつかの重要な利点がプロセスに付与される。単一分子アッセイの第1の重要な利点は、種々の周期的化学的/酵素的ステップにおける非能率に対する頑強性である。これは、コーディングタグ配列内に存在するサイクル特異的バーコードを使用することによって可能になる。
サイクル特異的コーディングタグを使用して、各サイクルからの情報を追跡する。これは単一分子シーケンシング手法であるので、配列決定プロセスの各結合/移行サイクルにおける70%の効率でさえ、マッピング可能な配列情報を生成するために十分すぎるほどである。例として、10塩基ペプチド配列「CPVQLWVDST」(配列番号169)は、我々の配列プラットフォームでは「CPXQXWXDXT」(配列番号170)と読み取られる可能性がある(X=任意のアミノ酸;アミノ酸の存在はサイクル数追跡によって推定される)。この部分的なアミノ酸配列読み取りは、BLASTPを使用してそれをヒトp53タンパク質に一意的にマッピングし戻すために十分すぎるほどである。そのように、我々のプロセスはいずれも完全にロバストにする必要はない。さらに、サイクル特異的バーコードを我々の分配概念と組み合わせれば、どのペプチドのセットが元のタンパク質分子にマッピングされるかが(コンパートメントバーコードによって)わかるので、10カ所の位置のうちの数アミノ酸を識別するだけでタンパク質の絶対的な識別を実現することができる。
分画、区画化、および結合能が限定された樹脂によるタンパク質正規化。
プロテオミクス解析の重要な課題の1つは、試料中のタンパク質の豊富さの大きなダイナミックレンジに取り組むことである。タンパク質は、血漿中で10桁を超えるダイナミックレンジにわたる(「上位20種」が枯渇した血漿でさえ)。ある特定の実施形態では、解析前に、試料からのある特定のタンパク質種(例えば、極めて豊富なタンパク質)のサブトラクションを実施する。これは、例えば、上位20種の血漿タンパク質を枯渇させるSigmaのPROT20免疫枯渇キットなどの市販のタンパク質枯渇試薬を使用して実現することができる。さらに、ダイナミックレンジを大きく低下させる、さらにもっと言えば扱いやすい3~4桁まで低下させる手法をとることが、有用であると思われる。ある特定の実施形態では、タンパク質試料のダイナミックレンジは、電気泳動および液体クロマトグラフィーを含む標準的分画法を使用してタンパク質試料を分画すること(Zhou, Ning et al. 2012)、または限られた能力のタンパク質結合性ビーズ/樹脂(例えば、ヒドロキシル化シリカ粒子)をローディングしたコンパートメント(例えば、液滴)に画分を分配し(McCormick1989)、結合したタンパク質を溶出することによって、モジュレートすることができる。各区画化された画分中の過剰なタンパク質を洗い流す。
電気泳動による方法の例としては、キャピラリー電気泳動(CE)、キャピラリー等電点電気泳動(CIEF)、キャピラリー等速電気泳動(CITP)、フリーフロー電気泳動、ゲル溶出分画液相封入電気泳動(GELFrEE)が挙げられる。液体クロマトグラフィータンパク質の分離方法の例としては、逆相(RP)、イオン交換(IE)、サイズ排除(SE)、親水性相互作用などが挙げられる。コンパートメント分配の例としては、エマルジョン、液滴、マイクロウェル、平らな基板上の物理的に分離された領域などが挙げられる。例示的なタンパク質結合性ビーズ/樹脂としては、フェノール基またはヒドロキシル基で誘導体化されたシリカナノ粒子(例えば、StrataClean Resin(Agilent Technologies製)、RapidClean(LabTech製)など)が挙げられる。ビーズ/樹脂の結合能を限定することにより、所与の画分中に溶出する高度に豊富なタンパク質は部分的にビーズに結合するだけになり、過剰なタンパク質は除去される。
L.単一細胞のプロテオームの分配または分子サブサンプリングのためのキットおよびキット成分
別の態様では、本開示は、バーコーディングおよび分配技法を使用して試料中のタンパク質を大規模並列解析するためのキットおよび方法を提供する。タンパク質解析の現行の手法は、タンパク質巨大分子をペプチド配列決定に適したより短いペプチド分子に断片化することを伴う。したがって、そのような手法を使用して得られる情報は、断片化ステップによって限定され、例えば、翻訳後修飾、各試料中に存在するタンパク質間相互作用、試料中に存在するタンパク質集団の組成、または特定の細胞もしくは細胞の集団に由来するなどのタンパク質巨大分子の起源を含む、タンパク質の広範な連続した情報は排除される。タンパク質分子内の翻訳後修飾に関する広範な情報(例えば、プロテオフォーム特徴付け)により、より完全的な生物学的像が得られ、どのペプチドがどのタンパク質分子に属するかに関する広範な情報により、基礎をなすタンパク質配列へのペプチド配列がよりロバストにマッピングされる(例えば、図15Aを参照されたい)。これは、ペプチド配列決定技術によってたった5つのアミノ酸型からの情報などの不完全なアミノ酸配列情報しか得られない場合に特に意義がある。本明細書に開示されている分配方法を使用することにより、同じタンパク質分子に由来するいくつものペプチドからの情報と組み合わせて、タンパク質分子の同一性(例えば、プロテオフォーム)をより正確に評価することができる。コンパートメントタグを同じコンパートメントに由来するタンパク質およびペプチドに付随させることにより、分子および細胞情報の再構成が容易になる。典型的なプロテオーム解析では、細胞が溶解され、タンパク質が短いペプチドに消化され、その結果、どのタンパク質がどの細胞または細胞型に由来するか、およびどのペプチドがどのタンパク質またはタンパク質複合体に由来するかに関する全体的な情報が破壊される。この全体的な情報は、細胞および組織内の生物学および生化学を理解するために重要である。
分配とは、試料内の巨大分子の集団に由来する巨大分子の亜集団への一意のバーコードのランダムな割り当てを指す。分配は、巨大分子をコンパートメントに区分することによって実現することができる。分配は、単一のコンパートメント内の巨大分子で構成されるものであってもよく、コンパートメントの集団に由来する多数のコンパートメント内の巨大分子で構成されるものであってもよい。
複数(例えば、数百万~数十億)のコンパートメントから同じ物理的コンパートメントまたはコンパートメントの群に、またはそれにおいて分離された巨大分子のサブセットまたはタンパク質試料のサブセットを一意のコンパートメントタグによって識別する。したがって、コンパートメントタグを使用して、同じコンパートメントタグを有する1つまたは複数のコンパートメントに由来する構成物と、異なるコンパートメントタグを有する別のコンパートメント(またはコンパートメントの群)内の構成物を、これらの構成物が一緒にプールされた後であっても区別することができる。
本開示は、複雑なプロテオーム試料(例えば、複数のタンパク質複合体、タンパク質、またはポリペプチド)または複雑な細胞試料を複数のコンパートメントに分配することによってタンパク質解析を増強する方法であって、各コンパートメントが、個々のコンパートメント内では同じであり(任意選択のUMI配列は除いて)、他のコンパートメントのコンパートメントタグとは異なる複数のコンパートメントタグを含む、方法を提供する(例えば図18~20を参照されたい)。コンパートメントは、任意選択で、複数のコンパートメントタグが接合した固体支持体(例えば、ビーズ)を含む。複数のタンパク質複合体、タンパク質、またはポリペプチドを複数のペプチドに断片化し、次いで、それを複数のコンパートメントタグと、複数のコンパートメント内で複数のペプチドと複数のコンパートメントタグとのアニーリングまたは接合を可能にするのに十分な条件下で接触させ、それにより、複数のコンパートメントタグ付きペプチドを生成する。あるいは、複数のタンパク質複合体、タンパク質、またはポリペプチドに、複数のコンパートメントタグを、複数のタンパク質複合体、タンパク質またはポリペプチドと複数のコンパートメント内の複数のコンパートメントタグのアニーリングまたは接合を可能にするために十分な条件下で接合し、それにより、複数のコンパートメントタグ付きタンパク質複合体、タンパク質、ポリペプチドを生成する。次いで、コンパートメントタグ付きタンパク質複合体、タンパク質、またはポリペプチドを複数のコンパートメントから収集し、任意選択で複数のコンパートメントタグ付きペプチドに断片化する。1つまたは複数のコンパートメントタグ付きペプチドを本明細書に記載の方法のいずれかに従って解析する。
ある特定の実施形態では、コンパートメントタグ情報を巨大分子(例えば、ポリペプチド)などの分析物に付随する記録タグにプライマー伸長(例えば、図5および図48を参照されたい)またはライゲーション(例えば、図6、図46および図47を参照されたい)によって移行させる。
一部の実施形態では、コンパートメントタグは、コンパートメント内で溶液中に遊離している。他の実施形態では、コンパートメントタグをコンパートメントの表面(例えば、マイクロタイタープレートもしくはピコタイタープレートのウェルの底)またはビーズもしくはコンパートメント内のビーズに直接接合させる。
コンパートメントは、水性コンパートメント(例えば、マイクロ流体液滴)であっても固体コンパートメントであってもよい。固体コンパートメントとしては、例えば、ナノ粒子、マイクロスフェア、マイクロタイターウェルもしくはピコタイターウェル、またはアレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フローセル、フロースルーチップ、信号変換電子機器を含むバイオチップ、ELISAプレート、スピン干渉ディスク、ニトロセルロース膜、もしくはニトロセルロースに基づくポリマー表面上の分離された領域が挙げられる。ある特定の実施形態では、各コンパートメントは、平均して、単一の細胞を含有する。
固体支持体は、これだけに限定されないが、ビーズ、マイクロビーズ、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フローセル、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアを含めた任意の支持体表面であってよい。固体支持体用の材料としては、これだけに限定されないが、アクリルアミド、アガロース、セルロース、ニトロセルロース、ガラス、金、石英、ポリスチレン、ポリエチレン酢酸ビニル、ポリプロピレン、ポリメタクリレート、ポリエチレン、ポリエチレンオキシド、ポリシリケート、ポリカーボネート、テフロン(登録商標)、フルオロカーボン、ナイロン、シリコンゴム、ポリ酸無水物、ポリグリコール酸、ポリ乳酸、ポリオルトエステル、官能化シラン、ポリプロピルフメレート、コラーゲン、グリコサミノグリカン、ポリアミノ酸、またはそれらの任意の組合せが挙げられる。ある特定の実施形態では、固体支持体は、ビーズ、例えば、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである。
コンパートメントタグを付けたビーズを伴うコンパートメントに試料を分配する種々の方法は、Shembekarらにより概説されている(Shembekar、Chaipanら、2016年)。一実施例では、プロテオームをエマルジョンにより液滴中に分配して、タンパク質分子およびタンパク質複合体に関する全体的な情報を本明細書に開示されている方法を使用して記録することを可能にする(例えば、図18および図19を参照されたい)。ある特定の実施形態では、プロテオームをコンパートメント(例えば、液滴)に、コンパートメントタグを付けたビーズ、活性化可能なプロテアーゼ(直接または間接的に熱、光などによって)、およびプロテアーゼ抵抗性になるように操作された(例えば、修飾リシン、ペグ化など)ペプチドリガーゼと一緒に分配する。ある特定の実施形態では、プロテオームを変性剤で処理して、タンパク質またはポリペプチドのペプチド構成物を評価することができる。タンパク質のネイティブな状態に関する情報が望まれる場合、相互作用するタンパク質複合体を、それに由来するペプチドのその後の分析のためにコンパートメントに分配することができる。
コンパートメントタグは、任意選択で片側または両側にスペーサーまたはユニバーサルプライマー配列が隣接するバーコードを含む。プライマー配列は、記録タグの3’配列に対して相補的であってよく、それにより、プライマー伸長反応によるコンパートメントタグ情報の記録タグへの移行が可能になる(例えば図22A~Bを参照されたい)。バーコードは、固体支持体もしくはコンパートメントに付着した一本鎖核酸分子または固体支持体もしくはコンパートメントとハイブリダイズしたその相補配列、または両方の鎖で構成されるものであってよい(例えば、図16を参照されたい)。コンパートメントタグは、ペプチドとのカップリングのための、例えばスペーサーに付着した、機能的部分を含んでよい。一実施例では、機能的部分(例えば、アルデヒド)は、複数のペプチド上のN末端アミノ酸残基と反応することが可能である。別の例では、機能的部分は、複数のペプチド上の内部アミノ酸残基(例えば、リシンまたは「クリック」反応性部分で標識されたリシン)と反応することが可能である。別の実施形態では、機能的部分は、単に、DNAタグで標識されたタンパク質とハイブリダイズすることが可能な相補DNA配列であってよい。あるいは、コンパートメントタグは、コンパートメントタグの目的のペプチドへのライゲーションを可能にするために、タンパク質リガーゼ(例えば、ブテラーゼIまたはそのホモログ)の認識配列を含むペプチドをさらに含むキメラ分子であってよい(例えば図22Aを参照されたい)。コンパートメントタグは、より大きな核酸分子内の成分であってよく、当該核酸分子は、それに接合したペプチドに関する識別情報をもたらすための一意の分子識別子、スペーサー配列、ユニバーサルプライミング部位、またはそれらの任意の組合せを任意選択でさらに含む。このUMI配列は、一般に、コンパートメント内のコンパートメントタグの集団の間で異なる。ある特定の実施形態では、コンパートメントタグは、記録タグ内の成分であり、したがって、個々のコンパートメント情報をもたらすために使用する同じタグを、それが付着したペプチドに関する個々のペプチド情報を記録するためにも使用する。
ある特定の実施形態では、コンパートメントタグは、コンパートメントタグをコンパートメントにプリント、スポッティング、インク噴射することによって形成することができる。ある特定の実施形態では、複数のコンパートメントタグを付けたビーズであって、ビーズ当たり1つのバーコード型が存在するビーズを、Kleinら、2015年、Cell、161巻:1187~1201頁;Macoskoら、2015年、Cell、161巻:1202~1214頁;およびFanら、2015年、Science、347巻:1258367頁に記載されている通り、スプリット・アンド・プール(split-and-pool)オリゴヌクレオチドライゲーションまたは合成によって形成する。コンパートメントタグを付けたビーズは、個々の合成または固定化によって形成することもできる。ある特定の実施形態では、コンパートメントタグを付けたビーズは、一方の部分が記録タグを含むコンパートメントタグを含み、他方の部分が消化されたペプチドをカップリングすることができる機能的部分を含む二機能性記録タグをさらに含む(例えば図19および図20を参照されたい)。
ある特定の実施形態では、複数のコンパートメント内の複数のタンパク質またはポリペプチドを、プロテアーゼを用いて複数のペプチドに断片化する。プロテアーゼは、メタロプロテアーゼであってよい。ある特定の実施形態では、メタロプロテアーゼの活性が金属カチオンの光活性化放出によってモジュレートされる。使用することができるエンドペプチダーゼの例としては、トリプシン、キモトリプシン、エラスターゼ、サーモリシン、ペプシン、クロストリパン、グルタミルエンドペプチダーゼ(GluC)、エンドペプチダーゼArgC、ペプチジル-aspメタロ-エンドペプチダーゼ(AspN)、エンドペプチダーゼLysCおよびエンドペプチダーゼLysNが挙げられる。それらの活性化の形式は、緩衝液および二価カチオンの必要性に応じて変動する。任意選択で、タンパク質またはポリペプチドをペプチド断片に十分に消化した後、プロテアーゼを不活性化する(例えば、熱、フルオロ油またはシリコーン油可溶性阻害剤、例えば、二価カチオンキレート化剤など)。
コンパートメントタグを用いたペプチドバーコーディングのある特定の実施形態では、タンパク質分子(任意選択で、変性ポリペプチド)を、DNAタグを用いて、DNAタグをタンパク質のリシン基のε-アミン部分とのコンジュゲーションによって、またはアルキンなどの反応性クリック部分で予め標識したタンパク質/ポリペプチドに付着させるクリックケミストリーによって間接的に標識する(例えば図2Bおよび図20Aを参照されたい)。次いで、DNAタグで標識したポリペプチドを、コンパートメントタグ(例えば、液滴内に含有されるビーズに結合したDNAバーコード)を含むコンパートメントに分配し(例えば図20Bを参照されたい)、ここで、コンパートメントタグは、各コンパートメントを識別するバーコードを含有する。一実施形態では、ビーズに付随する単一のタンパク質/ポリペプチド分子と単一の種のDNAバーコードを共封入する(例えば図20Bを参照されたい)。別の実施形態では、PCT公開第WO2016/061517号(その全体が参照により組み込まれる)に記載されているものと、DNAではなくタンパク質に適用されること以外は同様に、コンパートメントは、付着したコンパートメント(ビーズ)タグと共にビーズの表面を構成し得る。コンパートメントタグは、バーコード(BC)配列、ユニバーサルプライミング部位(U1’)、UMI配列、およびスペーサー配列(Sp)を含んでよい。一実施形態では、分配と同時にまたはその後に、コンパートメントタグをビーズから切断し、ポリペプチドに付着したDNAタグと、例えば、それぞれDNAタグおよびコンパートメントタグ上の相補的なU1配列およびU1’配列を介してハイブリダイズさせる。ビーズへの分配に関しては、DNAタグで標識したタンパク質をビーズ表面上のコンパートメントタグと直接ハイブリダイズさせることができる(例えば図20Cを参照されたい)。このハイブリダイゼーションステップ後、DNAタグとハイブリダイズしたポリペプチドをコンパートメントから抽出し(例えば、エマルジョン「分解」、またはビーズからのコンパートメントタグの切断)、ポリメラーゼに基づくプライマー伸長ステップを使用して、バーコードおよびUMI情報をポリペプチド上のDNAタグに書き込んでコンパートメントバーコードが付された記録タグをもたらす(例えば図20Dを参照されたい)。ポリペプチドを、C末端リシンにおいてユニバーサルプライミング配列を含有する記録タグ、コンパートメントタグ、およびUMIで標識されたペプチドに切断するために、LysCプロテアーゼ消化を使用することができる(例えば図20Eを参照されたい)。一実施形態では、LysCプロテアーゼを、DNAタグが付されたリシン残基が許容されるように操作する。得られる記録タグで標識されたペプチドを、固体基板(例えば、ビーズ)に、記録タグが付されたペプチド間の分子間相互作用を最小限にするために適した密度で固定化する(例えば図20Eおよび20Fを参照されたい)。
ペプチドのコンパートメントタグへの付着(または逆もまた同じ)は、固定化されたコンパートメントタグへの直接付着であってもよく、その相補配列(二本鎖の場合)への付着であってもよい。あるいは、コンパートメントタグを固体支持体またはコンパートメントの表面から引き離し、ペプチドおよび液相コンパートメントタグをコンパートメント内に接合させることができる。一実施形態では、コンパートメントタグ(例えば、オリゴヌクレオチドの末端)上の機能的部分は、ペプチドのN末端のアミンにシッフ塩基を通じて直接カップリングしたアルデヒドである(例えば図16を参照されたい)。別の実施形態では、コンパートメントタグを、タンパク質リガーゼに対するペプチドモチーフ(n-X・・・XXCGSHV-c)を含む核酸-ペプチドキメラ分子として構築する。核酸-ペプチドコンパートメントタグ構築物を、消化されたペプチドと、ブテラーゼIまたはそのホモログなどのペプチドリガーゼを使用してコンジュゲートする。ブテラーゼI、および他のアスパラギニルエンドペプチダーゼ(AEP)相同体を使用して、オリゴヌクレオチド-ペプチドコンパートメントタグ構築物のC末端と消化されたペプチドのN末端をライゲーションすることができる(Nguyen、Wangら、2014年、Nguyen、Caoら、2015年)。この反応は、速く、高度に効率的である。得られたコンパートメントタグ付きペプチドを、その後、本明細書に記載の核酸ペプチド解析のために固体支持体に固定化することができる。
ある特定の実施形態では、コンパートメントタグと複数の断片化されたペプチドを接合させる前に、固体支持体またはコンパートメントの表面に接合しているコンパートメントタグを放出させる(例えば図18を参照されたい)。一部の実施形態では、コンパートメントタグ付きペプチドを複数のコンパートメントから収集した後、コンパートメントタグ付きペプチドを、記録タグを伴って固体支持体に接合する。次いで、コンパートメントタグ情報をコンパートメントタグ付きペプチド上のコンパートメントタグから付随する記録タグに移行させることができる(例えば、記録タグおよびコンパートメントタグ内の相補的なスペーサー配列からプライミングされるプライマー伸長反応によって)。一部の実施形態では、次いで、本明細書に記載の方法に従ったペプチド解析の前に、コンパートメントタグをコンパートメントタグ付きペプチドから除去する。さらなる実施形態では、最初に複数のタンパク質を消化するために使用した配列特異的プロテアーゼ(例えば、Endo AspN)を、コンパートメントタグ情報を付随する記録タグに移行した後、ペプチドのN末端からのコンパートメントタグの除去にも使用する(例えば図22Bを参照されたい)。
コンパートメントに基づく分配のための手法は、Tジャンクションおよびフローフォーカシング、撹拌または小さな穴を有する膜(例えば、エッチング飛跡膜)を通じた押出しを使用したエマルジョン生成などを使用するマイクロ流体デバイスによる液滴形成などを含む(例えば図21を参照されたい)。区画化に伴う問題は、コンパートメントの内部の取扱いである。ある特定の実施形態では、コンパートメント内で一連の異なる生化学的ステップを行うことは、流体成分の交換が困難であるので、難しい場合がある。以前に記載されている通り、液滴内部の限られた特徴、例えば、pH、キレート化剤、還元剤などは、エマルジョンのフルオロ油に試薬を添加することによって改変することができる。しかし、水性相と有機相両方の溶解性を有する化合物の数は限られている。1つの手法は、コンパートメント内の反応を、基本的に目的の分子へのバーコードの移行に限定することである。
タンパク質/ペプチドをコンパートメントタグ(バーコード)で構成される記録タグで標識した後、タンパク質/ペプチドを、固体支持体に、結合した同類結合性物質のコーディングタグから結合したペプチドまたはタンパク質分子に付着した対応する記録タグ/タグへの情報の分子内移行を有利にするために適した密度で固定化する。分子間情報移行は、固体支持体の表面上の分子の分子間間隔を制御することによって最小化される。
ある特定の実施形態では、コンパートメントタグは、コンパートメントの集団内の各コンパートメントに対して一意である必要はない。コンパートメントの集団内のコンパートメントのサブセット(2つ、3つ、4つ、またはそれよりも多く)は、同じコンパートメントタグを共有してよい。例えば、各コンパートメントは、試料から巨大分子の亜集団を捕捉するように作用するビーズ表面の集団で構成されてよい(ビーズ当たり多くの分子が捕捉される)。さらに、ビーズは、捕捉される巨大分子に付着させることができるコンパートメントバーコードを含む。各ビーズは、単一のコンパートメントバーコード配列のみを含むが、このコンパートメントバーコードは、コンパートメント内の他のビーズ上で複製され得る(多くのビーズが同じバーコードにマッピングされる)。物理的コンパートメントとコンパートメントバーコードの間で多対1のマッピングをなすことができ(必要ではないが)、さらに、コンパートメント内の巨大分子間で多対1のマッピングをなすことができる(必要ではないが)。分配バーコードは、試料内の巨大分子の集団から巨大分子をサブサンプリングするための一意のバーコードの割り当てと定義される。この分配バーコードは、同じバーコードで標識されたコンパートメント内の巨大分子の分配から生じる同一のコンパートメントバーコードで構成されてよい。物理的コンパートメントの使用により、元の試料が有効にサブサンプリングされて、分配バーコードの割り当てがもたらされる。例えば、10,000種の異なるコンパートメントバーコードで標識されたビーズのセットがもたらされる。さらに、所与のアッセイにおいて、ビーズ百万個の集団をアッセイに使用されると仮定する。平均で、コンパートメントバーコード当たり100個のビーズが存在する(ポアソン分布)。さらに、ビーズにより巨大分子1千万個の凝集体が捕捉されると仮定する。平均で、ビーズ当たり10個の巨大分子が存在し、コンパートメントバーコード当たりのコンパートメントは100個であり、分配バーコード(100個の別個の物理的コンパートメント当たり100個のコンパートメントバーコードで構成される)当たり有効に1000個の巨大分子が存在する。
別の実施形態では、ポリペプチドの単一分子分配および分配バーコーディングは、ポリペプチドを、N末端またはC末端またはその両方において、増幅可能なDNA UMIタグ(例えば、記録タグ)を用いて標識すること(化学的にまたは酵素的に)によって実現される(例えば図37を参照されたい)。DNAタグをポリペプチドのボディ(内部アミノ酸)に非特異的な光標識または図2Bにおいて例示されている通りリシンなどの反応性アミノ酸への特異的な化学的付着によって付着させる。ペプチドの末端に付着させた記録タグからの情報をDNAタグに酵素的エマルジョンPCR(Williams、Peisajovichら、2006年、Schutze、Rubeltら、2011年)またはエマルジョンin vitro転写/逆転写(IVT/RT)ステップによって移行させる。好ましい実施形態では、ナノエマルジョンを使用し、その結果、平均して、50nm~1000nmのサイズのエマルジョン液滴当たり単一のポリペプチド未満が存在するようにする(Nishikawa、Sunamiら、2012年、Gupta、Eralら、2016年)。さらに、プライマー、dNTP、Mg2+、ポリメラーゼ、およびPCR緩衝液を含めたPCRの全ての成分を水性エマルジョン混合物に含める。IVT/RTを使用する場合には、記録タグを、T7/SP6 RNAポリメラーゼプロモーター配列を用い、ポリペプチドのボディに付着したDNAタグにハイブリダイズする転写物が生成されるように設計する(Ryckelynck、Baudreyら、2015年)。逆転写酵素(RT)により、ハイブリダイズしたRNA分子からDNAタグに情報がコピーされる。このように、エマルジョンPCRまたはIVT/RTを使用して、末端記録タグからポリペプチドのボディに付着させた多数のDNAタグに情報を有効に移行させることができる。
細胞内容物のビーズへのゲル化による封入は、単一の細胞を解析するために有用な手法である(TamminenおよびVirta 2015、Spencer、Tamminenら、2016年)。単一の細胞液滴のバーコーディングにより、単一の細胞に由来する成分を全て同じ識別子で標識することが可能になる(Klein、Mazutisら、2015年、Gunderson、Steemersら、2016年、Zilionis、Nainysら、2017年)。コンパートメントバーコーディングは、一意のバーコードを、各液滴に、液滴接合によって(Raindance)、バーコードが付されたビーズを液滴に導入することによって(10× Genomics)、または、その全体が参照により組み込まれる、Gundersonら(Gunderson、Steemersら、2016年)およびPCT公開第WO2016/130704号に記載されている通り、封入およびゲル化後にスプリット・プール(split-pool)コンビナトリアルバーコーディングを使用して液滴の成分をコンビナトリアルバーコーディングすることによって、直接組み入れることを含めた、いくつものやり方で実現することができる。Adeyら(Vitak、Torkenczyら、2017年)に記載されている通り、同様のコンビナトリアル標識スキームを核にも適用することができる。
上記の液滴バーコーディング手法は、DNA解析には使用されているが、タンパク質解析には使用されていない。上記の液滴バーコーディングプラットフォームをタンパク質を用いた研究に適合させるには、いくつかの革新的なステップが必要である。まず第1は、バーコードは主にDNA配列で構成され、このDNA配列情報をタンパク質分析物に付与する必要があることである。DNA分析物の場合では、DNA情報をDNA分析物に移行させることは比較的簡単である。対照的に、DNA情報をタンパク質に移行させることは、特に、下流の解析のためにタンパク質を変性させ、消化してペプチドにする場合には、より困難である。これにより、各ペプチドをコンパートメントバーコードで標識することが必要になる。問題は、細胞が液滴に封入されたら、タンパク質を変性させ、得られたポリペプチドをプロテアーゼ消化し、同時にペプチドをDNAバーコードで標識するのが難しいことである。細胞をポリマー形成液滴に封入し、それらを重合(ゲル化)して、水性緩衝液にすることができる多孔質ビーズにすることにより、液滴中の細胞とは異なり、多数の異なる反応ステップを実施するためのビヒクルがもたらされる(TamminenおよびVirta、2015年、Spencer、Tamminenら、2016年)(Gunderson、Steemersら、2016年)。例えば、封入されたタンパク質がその後ゲルビーズから拡散することを防止するために、封入されたタンパク質をゲルマトリックスと架橋結合させる。このゲルビーズ形式により、ゲル中に閉じ込められたタンパク質を化学的にまたは酵素的に変性させ、DNAタグで標識し、プロテアーゼ消化し、いくつもの他の介入に供すことが可能になる。図38は、例示的な単一の細胞のゲルマトリックスへの封入および溶解を示す。
M.組織および単一細胞空間プロテオミクスのためのキットおよびキット成分
バーコードの別の使用は、空間的に分布したDNAバーコード配列のアレイ表面上での組織の空間的分割である。組織タンパク質を、アレイ表面に乗せた細胞組織内のタンパク質の空間的位置を反映するバーコードを含むDNA記録タグで標識すれば、Stahlら(2016年、Science、353巻(6294号):78~82頁)およびCrosettoら(Corsetto、Bienkoら、2015年)に記載されている空間的トランスクリプトームと同様に、組織スライス内のタンパク質分析物の空間的分布を配列解析後に再構築することができる。空間バーコードの付着は、アレイに結合させたバーコードをアレイから放出させ、それらを組織切片中に拡散させることによって実現することができる、あるいは、組織切片中のタンパク質をDNA記録タグで標識し、次いで、タンパク質をプロテアーゼで消化して、拡散し、アレイ上の空間バーコードとハイブリダイズする標識されたペプチドを放出させることができる。次いで、バーコード情報をペプチドに付着させた記録タグに移行させることができる(酵素的にまたは化学的に)。
組織内のタンパク質の空間的バーコーディングは、DNA記録タグで化学的に標識された、固定/透過処理した組織スライスを、空間的にコードされたDNAアレイであって、アレイ上の各特徴が空間的に識別可能なバーコードを有する、DNAアレイに置くことによって実現することができる(例えば図23を参照されたい)。アレイバーコードをDNAタグに付着させるために、組織スライスをプロテアーゼで消化し、それにより、拡散し、組織スライスに隣接する近位のアレイ特徴にハイブリダイズすることができるDNAタグで標識されたペプチドを放出させることができる。アレイバーコード情報は、化学的/酵素的ライゲーションまたはポリメラーゼ伸長によってDNAタグに移行させることができる。あるいは、標識されたペプチドをアレイ表面に拡散させる代わりに、アレイ上のバーコード配列を切断し、組織スライス上の近位の領域に拡散させ、その中のDNAタグで標識されたタンパク質にハイブリダイズさせることができる。再度、バーコーディング情報は、化学的/酵素的ライゲーションまたはポリメラーゼ伸長によって移行させることができる。この第2の場合には、バーコード情報の移行後にプロテアーゼ消化を実施することができる。いずれの手法の結果も、記録タグで標識されたタンパク質またはペプチドの収集であり、ここで、記録タグは、元の組織内のタンパク質/ペプチドの位置に関する2-D空間的情報を有するバーコードを含む。さらに、翻訳後修飾の空間的分布を特徴付けることができる。この手法により、感度が高く、高度に多重化されたin situデジタル免疫組織化学的アッセイがもたらされ、また、現代の分子病理学の基礎が形成され、それによりはるかに正確な診断および予後判定が導かれるはずである。
別の実施形態では、細胞小器官および細胞区画内のタンパク質構成物/PTMを識別するために、細胞内に空間的バーコーディングを使用することができる(Christoforouら、2016年、Nat. Commun.、7巻:8992頁、その全体が参照により組み込まれる)。近位のタンパク質に付着させることができる細胞内空間バーコードをもたらすために、いくつもの手法を使用することができる。一実施形態では、細胞または組織を構成物細胞小器官中に細胞内分画し、異なるタンパク質細胞小器官画分バーコードを付すことができる。空間的な細胞標識の他の方法は、その全体が参照により組み込まれる、Marx、2015年、Nat Methods、12巻:815~819頁による総説に記載されている;同様の手法を本明細書で使用することができる。
N.ナノポアに基づく配列決定
前述の実施形態のいずれかでは、エンコーディングタグおよび/もしくは記録タグ(および/もしくは、利用可能な場合は、ジタグ、コンパートメントタグ、もしくは分配タグ)、またはこれらの任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)の配列情報の解析は、ナノポアに基づく配列決定技法などの、単一分子の配列決定法を使用して行うことができる。一態様では、単一分子配列決定法は、直接的な単一分子配列決定法である。WO2017125565A1には、例示的なナノポアに基づく配列決定についてのある特定の態様が開示されており、この内容は、その全体が参照により組み込まれる。
DNAおよびRNAのナノポアシーケンシングは、DNAおよびRNAのストランドシーケンシングおよび/またはエキソシーケンシングにより実現することができる。ストランドシーケンシングは、ポリヌクレオチド鋳型のヌクレオチドがナノポアを通り抜けると試料ポリヌクレオチド鎖のヌクレオチド塩基が直接決定される方法を含む。あるいは、ポリヌクレオチド鎖のストランドシーケンシングは、試料鋳型鎖のものと相補的である成長鎖に組み込まれるヌクレオチドを決定することにより、鋳型の配列を間接的に決定する。
一部の実施形態では、DNA、例えば一本鎖DNAは、酵素-ポリマー複合体中のポリメラーゼが付随している鋳型のものと相補的な鎖にポリメラーゼによってヌクレオチドが組み込まれるとヌクレオチド塩基から放出される、タグ付きヌクレオチドのタグを検出することにより、配列決定することができる。タグ付きヌクレオチドを使用する合成(Nano-SBS)技法による単一分子のナノポアに基づく配列決定は、例えば、その全体が参照により組み込まれるWO2014/074727に記載されている。したがって、一部の実施形態では、挿入されたナノポアに付着させることができる酵素-ポリヌクレオチド複合体は、DNAポリメラーゼ-DNA複合体であり得る。一部の実施形態では、DNAポリメラーゼ-DNA複合体を、野生型またはバリアント単量体ナノポアに付着させることができる。一部の実施形態では、DNAポリメラーゼ-DNA複合体を、野生型、バリアントまたは修飾バリアントホモオリゴマーナノポアに付着させることができる。一部の実施形態では、DNAポリメラーゼ-DNA複合体を、野生型、バリアントまたは修飾バリアントヘテロオリゴマーナノポアに付着させることができる。一部の実施形態では、DNAポリメラーゼ-DNA複合体を、野生型、バリアントまたは修飾バリアントaHLナノポアに付着させることができる。他の実施形態では、DNAポリメラーゼ-DNA複合体を、野生型OmpGナノポアまたはそのバリアントに付着させることができる。
他の実施形態では、酵素-ポリヌクレオチド複合体は、RNAポリメラーゼ-RNA複合体であり得る。RNAポリメラーゼ-RNA複合体を、野生型またはバリアントオリゴマーまたは単量体ナノポアに付着させることができる。一部の実施形態では、RNAポリメラーゼ-RNA複合体を、野生型またはバリアントOmpGナノポアに付着させることができる。他の実施形態では、RNAポリメラーゼ-RNA複合体を、野生型またはバリアントaHLナノポアに付着させる。さらに他の実施形態では、酵素-ポリヌクレオチド複合体は、逆転写酵素-RNA複合体であり得る。逆転写酵素-RNA複合体を、野生型またはバリアントオリゴマーまたは単量体ナノポアに付着させることができる。一部の実施形態では、逆転写酵素-RNA複合体を、野生型またはバリアントOmpGナノポアに付着させることができる。他の実施形態では、逆転写酵素-RNA複合体を、野生型またはバリアントaHLナノポアに付着させる。一部の実施形態では、ヌクレオシド5’一リン酸を、プロセッシブエキソヌクレアーゼによるそれらの放出時に識別することにより、個々の核酸を配列決定することができる(Astier et al., 2006, J Am Chem Soc 128:1705-1710)。したがって、一部の実施形態では、挿入されたナノポアに付着させることができる酵素-ポリヌクレオチド複合体は、エキソヌクレアーゼ-ポリヌクレオチド複合体であり得る。一部の実施形態では、エキソヌクレアーゼ-ポリヌクレオチド複合体を、野生型またはバリアント単量体ナノポアに付着させることができる。一部の実施形態では、エキソヌクレアーゼ-ポリヌクレオチド複合体を、野生型またはバリアントホモオリゴマーナノポアに付着させることができる。一部の実施形態では、エキソヌクレアーゼ-ポリヌクレオチド複合体を、野生型またはバリアントヘテロオリゴマーナノポアに付着させることができる。一部の実施形態では、エキソヌクレアーゼ-ポリヌクレオチド複合体を、野生型aHLナノポアまたはそのバリアントに付着させることができる。他の実施形態では、エキソヌクレアーゼ-ポリヌクレオチド複合体を、野生型OmpGナノポアまたはそのバリアントに付着させることができる。
一部の実施形態では、非核酸ポリマーも、ナノポアを通過させ、配列決定することができる。例えば、タンパク質およびポリペプチドは、ナノポアを通過することができ、ナノポアを使用するタンパク質またはポリヌクレオチドの配列決定を、タンパク質のアンフォールディングおよびナノポアを通っての転位置を制御することにより行うことができる。アンフォールディングおよび後続の転位置の制御は、配列決定することになるタンパク質にカップリングさせたアンフォルダーゼ酵素の作用により実現することができる(例えば、Nivala et al., 2013, Nature Biotechnol 31:247-250を参照されたい)。一部の実施形態では、膜のナノポアに付着させる酵素-ポリマー複合体は、酵素-ポリペプチド複合体、例えば、アンフォルダーゼ-タンパク質複合体であり得る。一部の実施形態では、アンフォルダーゼ-タンパク質複合体を、野生型またはバリアント単量体ナノポアに付着させることができる。一部の実施形態では、アンフォルダーゼ-タンパク質複合体を、野生型またはバリアントホモオリゴマーナノポアに付着させることができる。一部の実施形態では、アンフォルダーゼ-タンパク質複合体を、野生型またはバリアントヘテロオリゴマーナノポアに付着させることができる。一部の実施形態では、アンフォルダーゼ-タンパク質複合体を、野生型aHLナノポアまたはそのバリアントに付着させることができる。他の実施形態では、アンフォルダーゼ-タンパク質複合体を、野生型OmpGナノポアまたはそのバリアントに付着させることができる。
一部の実施形態では、他の非核酸ポリマーも、例えばナノポアを通過させることにより、配列決定することができる。例えば、WO1996013606A1には、ヘパラン硫酸(HS)およびヘパリンを含む多糖などの糖類材料のエキソシーケンシングが開示されており、米国特許第8,846,363(B2)号には、ヘパリン由来のオリゴ糖などの、多糖のエキソシーケンシングに(例えばタンデムに)適用することができる酵素(例えば、Flavobacterium heparinumからのスルファターゼ)が開示されている。両方の特許文献は、あらゆる目的で参照によりそれらの全体が本明細書に組み込まれる。
酵素-ポリマー複合体および酵素-ナノポア複合体の酵素としては、ポリヌクレオチドおよびポリペプチドプロセシング酵素、例えば、DNAおよびRNAポリメラーゼ、逆転写酵素、エキソヌクレアーゼ、アンフォルダーゼ、リガーゼおよびスルファターゼを挙げることができる。酵素-ポリマー複合体および酵素-ナノポア複合体の酵素は、野生型酵素であることもあり、またはそれは、野生型酵素のバリアント形態であることもある。バリアント酵素を、親酵素のものと比較して改変されている特性を有するように操作することができる。一部の実施形態では、改変される酵素-ポリマー複合体の酵素は、ポリメラーゼである。ポリメラーゼ酵素の改変される特性は、酵素活性、フィデリティー、処理能力、伸長速度、安定性または溶解度の変化を含む。ポリメラーゼがヌクレオチドを核酸鎖(例えば、成長核酸鎖)に組み込む速度を低下させるように、ポリメラーゼを変異させることができる。速度の低下(および感受性の向上)は、ナノポアタンパク質の部位特異的変異誘発と、ナノポアへのDNAプロセシング酵素、例えばDNAポリメラーゼ、の組込みとの組合せによって、達成することができる。
一部の場合には、ヌクレオチドを核酸鎖に組み込む速度は、立体障害をもたらすようにヌクレオチドおよび/または鋳型鎖を官能化することにより、例えば、鋳型核酸鎖のメチル化などによって、低下させることができる。一部の場合には、メチル化ヌクレオチドを組み込むことにより速度を低下させる。
酵素-ポリマー複合体および酵素-ナノポア複合体の酵素を、膜に挿入されたナノポアへの酵素-ポリマー複合体の連結に役立つ1つまたは複数の付着成分および/または付着部位を含むように、修飾することができる。同様に、酵素-ナノポア複合体のナノポア、および酵素-ポリマー複合体が付着しているナノポアも、酵素-ポリマー複合体にナノポアを連結させるための1つまたは複数の付着成分および/または付着部位を含むように修飾することができる。
ナノポアシーケンシング複合体のナノポアは、限定ではないが、生物学的ナノポア、固体ナノポア、およびハイブリッドの生物学的-固体ナノポアを含む。一部の実施形態では、ナノポアシーケンシング複合体は、固体ナノポア、例えば、グラフェン、(酸化インジウムスズ)ITO、カーボンナノチューブに伴うポアライン、もしくは他の無機固体層、または前述のもののいずれかについての組合せを含む。ナノポアシーケンシング複合体の生物学的ナノポアは、E.coli sp.、Salmonella sp.、Shigella sp.、およびPseudomonas sp.からのOmpG、S.aureus sp.からのアルファ溶血素、M.smegmatis sp.からのMspAを含む。ナノポアは、野生型ナノポアであってもよく、バリアントナノポアであってもよく、または修飾バリアントナノポアであってもよい。バリアントナノポアを、親酵素のものと比較して改変されている特性を有するように操作することができる。例えば、発明の名称が「alpha-Hemolysin Variants with Altered Characteristics」である、2015年10月28日に出願された米国特許出願公開第14/924,861号を参照されたい。一部の実施形態では、特性は、野生型酵素として比較して改変される。一部の実施形態では、ナノポアシーケンシング複合体のバリアントナノポアを、それが由来した親ナノポアのイオン電流ノイズを低下させるように操作する。特性が改変されたバリアントナノポアの例は、親OmpGのものと比較してイオンノイズレベルを低下させる、1つまたは複数の変異を狭窄部位に有するOmpGナノポア(その全体が参照により本明細書に組み込まれる、発明の名称が「OmpGVariants」である2015年9月22日に出願されたWO2017050722A1)である。イオン電流ノイズの低下により、これらのOmpGナノポアバリアントは、ポリヌクレオチドおよびタンパク質の単一分子感知に使用される。他の実施形態では、バリアントOmpGポリペプチドを分子アダプターに結合するようにさらに変異させることができ、これにより、ポア内にある間の分析物、例えばヌクレオチド塩基、のポア内の移動が緩徐化され、その結果として分析物の識別の精度が向上される。修飾バリアントナノポアは、多くの場合または通常は、サブユニット間相互作用に影響を及ぼすようにサブユニットが操作された多量体ナノポアである(その全体が参照により本明細書に組み込まれる、発明の名称が「Alpha-HemolysinVariants」である米国特許第2017-0088890(A1)号)。改変されたサブユニット相互作用を活用して、単量体がオリゴマー化して脂質二重層に多量体ナノポアを形成する配列および順序を特定することができる。この技法により、ナノポアを形成するサブユニットの化学量論組成が制御される。オリゴマー化中のサブユニットの相互作用の配列を決定するためにサブユニットを修飾することができる多量体ナノポアの例は、aHLナノポアである。
付着手段
酵素-ポリマー複合体を、任意の好適なやり方でナノポアに付着させることができる。ナノポアへの酵素-ポリマー複合体の付着は、SpyTag/SpyCatcherペプチド系(Zakeri et al., 2012, PNAS109:E690-E697)、ネイティブな化学的ライゲーション(Thapa etal., 2014, Molecules 19:14461-14483)、ソルターゼ系(Wu and Guo, 2012, J Carbohydr Chem31 :48-66;Heck et al., 2013, Appl Microbiol Biotechnol 97:461-475)、トランスグルタミナーゼ系(Dennleret al., 2014, Bioconjug Chem 25:569-578)、ホルミルグリシン連結(Rashidian et al., 2013,Bioconjug Chem 24:1277-1294)、または当技術分野において公知の他の化学的ライゲーション技法を使用して、達成することができる。
一部の場合には、Solulink(商標)ケミストリーを使用して酵素をナノポアに連結させる。例えば、WO2017/125565A1を参照されたい。Solulink(商標)は、HyNic(6-ヒドラジノ-ニコチン酸、芳香族ヒドラジン)と4FB(4-ホルミル安息香酸エステル、芳香族アルデヒド)との反応物である。一部の場合には、クリックケミストリーを使用してポリメラーゼをナノポアに連結させる(例えば、LifeTechnologiesから入手可能;例えば、WO2014/190322A2も参照されたい)。一部の場合には、ジンクフィンガー変異を溶血素分子に導入し、次いで、分子(例えば、DNA中間分子)を使用して酵素を溶血素のジンクフィンガー部位に連結させる。
O.非核酸ポリマー
前記実施例(例えば、上掲の節A~Nに記載のもの)のいずれかでは、エンコーディングタグおよび/もしくは記録タグ、またはその任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)は、非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーを含むことができ、またはそれらを配列決定可能なポリマーで置き換えることができる。一部の態様では、エンコーディングタグおよび/もしくは記録タグ、またはその任意の部分(例えば、ユニバーサルプライマー、スペーサー、UMI、記録タグバーコード、エンコーダー配列、結合サイクル特異的バーコードなど)により、例えばナノポアに基づく配列決定によって、明確に分解可能なシグナルが得られる。多種多様なポリマーを使用することができ、必要に応じてクリックケミストリーを用いて、エドマン型の分解に適合するタグを使用して、標的タンパク質および/またはポリペプチドの配列情報を読み取ることができる。一部の実施形態では、本明細書に開示されている方法は、増幅ステップを含む。他の実施形態では、増幅ステップを用いず、単一分子を何度もナノポアに通して処理して多数の読み取りデータを得て、分解可能なシグナルを得ることができる。
前述の実施形態のいずれかでは、コーディングタグ内のエンコーダーが、1つまたは複数の小分子部分、配列決定可能な非核酸ポリマーの1つまたは複数のサブユニット、配列決定可能な非核酸ポリマーの1つまたは複数の単量体を含むか、またはそのような小分子部分、サブユニット、単量体である場合、記録タグは、読み取られるポリマーを含む。この例では、エンコーダー部分は、糸(例えば、伸長記録タグ)に通したビーズのようなものである。
一部の実施形態では、配列決定可能なポリマーは、直鎖状である。他の実施形態では、配列決定可能なポリマーは、1つもしくは複数の直鎖、1つもしくは複数の分岐、1つもしくは複数のサークル、またはこれらの任意の組合せを含む。
一部の実施形態では、配列決定可能なポリマーは、架橋していない。他の実施形態では、配列決定可能なポリマーは、架橋している、例えば、弱く架橋している(例えば、架橋ポリマーは、約0.1%~約1%の間の架橋剤を含む)。
一部の実施形態では、配列決定可能なポリマーは、中性であり、例えば、全体的な中性電荷を有する。特定の実施形態では、配列決定可能なポリマーは、アクリルアミド、アクリレート、スチレン、ナイロン、カプトン、NiPAMポリマー、PEG、ポリラクタム、ポリラクトン、エポキシド、ポリシリコーン、ポリエステル、ポリカルボジイミド、ポリウレタン、ポリピロリドン(polypyroldinone)、ポリイソチオシアネート、またはこれらの任意の組合せを含む。
他の実施形態では、配列決定可能なポリマーは、荷電している。特定の実施形態では、配列決定可能なポリマーは、負に荷電しており、例えば、配列決定可能なポリマーは、ポリスルホネート、および/または負荷電アクリルアミド(例えば、アクリル酸と共重合したもの)を含み得る。他の実施形態では、配列決定可能なポリマーは、正に荷電しており、例えば、配列決定可能なポリマーは、置換されていることもありもしくは非置換であることもある、ポリアミン、ポリアニリン、ポリイミン、および/またはアミン官能基を有するアクリルアミドを含み得る。さらに他の実施形態では、配列決定可能なポリマーは、イオノマーを含み得る。
他の実施形態では、配列決定可能なポリマーは、ポリモルホリノおよび/または双性イオンポリマーを含む。
一部の実施形態では、配列決定可能なポリマーは、疎水性ポリマーおよび/または親水性ポリマーを含む。一部の態様では、配列決定可能なポリマーは、疎水性ポリマー、例えば、スチレン、カプトン、フルオロポリマー、もしくはイソプレン、またはこれらの任意の組合せを含む。他の態様では、配列決定可能なポリマーは、親水性ポリマー、例えば、ポリエチレングリコール、ポリリシン、ポリエンイミン、ポリイミン、アクリルアミド、もしくはアクリレート、またはこれらの任意の組合せを含む。
一部の実施形態では、配列決定可能なポリマーは、メタセシス生成物、例えば、開環または線状メタセシスにより形成されたポリマー生成物を含む。
一部の実施形態では、配列決定可能なポリマーは、コポリマー、ブロックコポリマー、ジブロックコポリマー、もしくはトリブロックコポリマー、またはこれらの任意の組合せを含む。一部の実施形態では、配列決定可能なポリマーは、連続重合またはポリマー生成物のライゲーションにより形成される。
他の実施形態では、配列決定可能なポリマーは、バイオポリマーを含む:特定の実施形態では、配列決定可能なポリマーは多糖、ポリペプチド、ペプチド、もしくはポリアミド、またはこれらの任意の組合せを含む。
一部の実施形態では、配列決定可能なポリマーは、天然に存在するバイオポリマー、バイオポリマー模倣物、または合成バイオポリマー、またはこれらのハイブリッドを含む。
一部の実施形態では、配列決定可能なポリマーは、ペプトイドなどのバイオポリマー模倣物を含む。一部の実施形態では、配列決定可能なポリマーは、スターポリマーまたはデンドリマーを含む。
一部の実施形態では、配列決定可能なポリマーは、刺激誘導型分解性ポリマーを含む。刺激の例としては、これだけに限定されないが、化学的刺激、生化学的刺激、酵素的刺激、光、時間、および温度が挙げられる。
一部の実施形態では、配列決定可能なポリマーは、ケージドポリマーまたは保護ポリマーを含む。
一部の実施形態では、配列決定可能なポリマーは、可逆的共有結合ポリマーを含む。一部の実施形態では、配列決定可能なポリマーは、ジスルフィド、チオ(チオール)エステル、TEMPO誘導ニトロキシドポリマー、もしくはポリイミン、またはこれらの任意の組合せを含む。
一部の実施形態では、配列決定可能なポリマーは、低い多分散指数(PDI)または高いPDIを有するポリマーを含む。多分散指数(PDI)、または不均一指数、または単に分散度(D)は、所与のポリマー試料中の分子質量の分布の測度である。典型的な分散度は、重合の機序によって異なり、様々な反応条件による影響を受け得る。合成ポリマーでは、分散度は、反応物比、完了のどれ程近くまで重合が進んだのかなどによって大きく変わり得る。典型的な付加重合の場合、Dは、およそ5~20の範囲であり得る。典型的な逐次重合の場合、Dの最確値は、およそ2またはそれ未満である。付加重合の特殊な場合であるリビング重合は、非常に1に近い値をもたらす。そのことは、生体ポリマーにも当てはまり、この場合の分散度は、1に非常に近いまたは等しいことがあり、これは、1つのポリマー長のみが存在することを示す。
一部の実施形態では、配列決定可能なポリマーは、リビング重合の生成物などの、低いPDIを有するポリマーを含む。他の実施形態では、配列決定可能なポリマーは、ATRPの生成物などの、より高いPDIを有するポリマー、または他の統計的に導出された(statistically driven)分布を有するポリマーを含む。
一部の実施形態では、配列決定可能なポリマーは、発色団または導体材料として作用することができる共役ポリマーを含む。
他の実施形態では、配列決定可能なポリマーは、構造化または非構造化(例えば、フォールディングされたまたはフォールディングされていない)ポリマー、例えば、フォルダマーを含む。一部の実施形態では、コーディングポリマーは、比較的短く、例えば、2個のサブユニットで構成される。他の実施形態では、ポリマーは、大きく、例えば、合計約100kDaのサブユニットで構成される。
いくつものポリマー骨格が、配列決定可能なポリマーを構成するのに適している。Ouahabiらにより記載されたポリホスフェート骨格は、ナノポアシーケンシングに有用である(AlOuahabi, Charles et al. 2015)。リン酸基が骨格に負電荷を付与し、その結果、ポアを通る転位置の電気的制御が可能になる。異なるR基を使用して、異なる電流遮断シグネチャを提供することができる。ペプトイドポリマーは、もう1つの有用なポリマーを提供する。ペプトイドは、ペプチドの場合のようなα炭素ではなくペプチド様骨格の窒素に接続されている側鎖R基を有するグリシン骨格からなる。ペプトイドの固相合成は、合成効率、高い収率、およびR基側鎖多様性(利用可能な何百もの異なるR基)をもたらし、その上、合成時間を短縮し、合成コストを低下させる(Knight,Zhou et al. 2015)。ペプトイド骨格は中性であるが、荷電R基をポリマーの長さに沿って利用して、転位置の電気的制御を促進することができる。例示的な(exemplar)荷電R基としては、N-(2-アミノエチル)グリシン(Nae)およびN-(2-カルボキシエチル)グリシン(Nce)が挙げられる。ペプトイドの概説については、例えば、参照により本明細書に組み込まれる、Setoet al., 2011, "Peptoids: Synthesis, Characterization, andNanostructures," Comprehensive Biomaterials, vol. 2, pp. 53-76を参照されたい。
電流遮断のためのR基は、多くの機能的部分から選択することができる(参照により組み込まれる米国特許第20160075734号)。機能的部分としては、置換基および/または官能性基、例えば、アルコキシ、ハロ、メルカプト、アジド、シアノ、ホルミル、カルボキシル、ヒドロキシル、ニトロ、アシル、アリールオキシ、アルキルチオ、アミノ、アルキルアミノ、アリールアルキルアミノ、置換アミノ、アシルアミノ、アシルオキシ、エステル、チオエステル、カルボン酸チオエステル、エーテル、アミド、アミジノ、硫酸、スルホキシル、スルホニル、スルホニル、スルホン酸、スルホンアミド、尿素、アルコキシアシルアミノ、アミノアシルオキシ、グアニジノ、アルデヒド、ケト、イミン、ニトリル、リン酸、チオール、エポキシド、ペルオキシド、チオシアン酸、アミジン、オキシム、ニトリル、ジアゾ、ヘテロシクロなどが挙げられ、これらの用語は、これらの基の組合せを含む。「ヘテロ環式の基」または「ヘテロシクロ」は、単独でまたは別の基の一部として本明細書で使用される場合、脂肪族(例えば、完全もしくは部分飽和ヘテロシクロ)または芳香族(例えば、ヘテロアリール)単環式または二環式の環系を指す。単環式の環系は、酸素、窒素および硫黄から独立して選択される1、2、3または4個のヘテロ原子を含有する任意の5または6員環によって例示される。5員環は、0~2個の二重結合を有し、6員環は、0~3個の二重結合を有する。単環式の環系の代表的な例としては、これだけに限定されないが、アゼチジン、アゼピン、アジリジン、ジアゼピン、1,3-ジオキソラン、ジオキサン、ジチアン、フラン、イミダゾール、イミダゾリン、イミダゾリジン、イソチアゾール、イソチアゾリン、イソチアゾリジン、イソオキサゾール、イソオキサゾリン、イソオキサゾリジン、モルホリン、オキサジアゾール、オキサジアゾリン、オキサジアゾリジン、オキサゾール、オキサゾリン、オキサゾリジン、ピペラジン、ピペリジン、ピラン、ピラジン、ピラゾール、ピラゾリン、ピラゾリジン、ピリジン、ピリミジン、ピリダジン、ピロール、ピロリン、ピロリジン、テトラヒドロフラン、テトラヒドロチオフェン、テトラジン、テトラゾール、チアジアゾール、チアジアゾリン、チアジアゾリジン、チアゾール、チアゾリン、チアゾリジン、チオフェン、チオモルホリン、チオモルホリンスルホン、チオピラン、トリアジン、トリアゾール、トリチアンなどが挙げられる。二環式の環系は、本明細書において定義されているアリール基と融合している、本明細書において定義されているシクロアルキル基と融合している、または本明細書において定義されている別の単環式の環系と融合している、上記の単環式の環系のいずれかにより例示される。二環式の環系の代表的な例としては、これだけに限定されないが、例えば、ベンゾイミダゾール、ベンゾチアゾール、ベンゾチアジアゾール、ベンゾチオフェン、ベンゾオキサジアゾール、ベンゾオキサゾール、ベンゾフラン、ベンゾピラン、ベンゾチオピラン、ベンゾジオキシン、1,3-ベンゾジオキソール、シンノリン、インダゾール、インドール、インドリン、インドリジン、ナフチリジン、イソベンゾフラン、イソベンゾチオフェン、イソインドール、イソインドリン、イソキノリン、フタラジン、プリン、ピラノピリジン、キノリン、キノリジン、キノキサリン、キナゾリン、テトラヒドロイソキノリン、テトラヒドロキノリン、チオピラノピリジンなどが挙げられる。これらの環は、それらの四級化誘導体を含み、ハロ、アルキル、ハロアルキル、アルケニル、アルキニル、シクロアルキル、シクロアルキルアルキル、アリール、アリールアルキル、ヘテロシクロ、ヘテロシクロアルキル、ヒドロキシル、アルコキシ、アルケニルオキシ、アルキニルオキシ、ハロアルコキシ、シクロアルコキシ、シクロアルキルアルキルオキシ、アリールオキシ、アリールアルキルオキシ、ヘテロシクロオキシ、ヘテロシクロアルキルオキシ、メルカプト、アルキル-S(O)m、ハロアルキル-S(O)m、アルケニル-S(O)m、アルキニル-S(O)m、シクロアルキル-S(O)m、シクロアルキルアルキル-S(O)m、アリール-S(O)m、アリールアルキル-S(O)m、ヘテロシクロ-S(O)m、ヘテロシクロアルキル-S(O)m、アミノ、アルキルアミノ、アルケニルアミノ、アルキニルアミノ、ハロアルキルアミノ、シクロアルキルアミノ、シクロアルキルアルキルアミノ、アリールアミノ、アリールアルキルアミノ、ヘテロシクロアミノ、ヘテロシクロアルキルアミノ、二置換アミノ、アシルアミノ、アシルオキシ、エステル、アミド、スルホンアミド、尿素、アルコキシアシルアミノ、アミノアシルオキシ、ニトロまたはシアノ(ここで、m=0、1、2または3)から選択される基で、必要に応じて置換されていてもよい。
前述の実施形態のいずれかでは、記録タグおよび/またはコーディングタグは、小分子であってもよく、またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素であってもよい。
前述の実施形態のいずれかでは、記録タグおよび/またはコーディングタグは、ポリヌクレオチドまたは非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーであってもよい。
前述の実施形態のいずれかでは、記録タグおよび/またはコーディングタグは、小分子を含むことができ、またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素を含むことができる。
前述の実施形態のいずれかでは、コーディングタグは、小分子であってもよく、またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素であってもよいが、記録タグは、配列決定可能なポリマーである。一部の実施形態では、コーディングタグ(小分子、サブユニットまたは単量体など)を記録タグに付加させて、糸(例えば、伸長記録タグ)に通したビーズ(例えば、様々なコーディングタグ)のようなものである配列決定可能なポリマーを形成することができる。
前述の実施形態のいずれかでは、伸長記録タグおよび/または伸長コーディングタグは、ポリヌクレオチドまたは非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーであってもよい。
IV.例示的実施形態
以下の実施形態は、本開示のさらなる実例を提供するものである。
実施形態1.(a)分析物と直接または間接的に会合するように構成されている記録タグ、(b)(i)分析物に結合することが可能な結合性部分に関する識別情報を含み、前記結合性部分と直接もしくは間接的に会合して結合性物質を形成するように構成されている、コーディングタグ、および/または(ii)標識を含む、キットであって、前記記録タグおよび前記コーディングタグが、前記結合性物質と前記分析物との結合時に前記記録タグと前記コーディングタグの間での情報の移行を可能にするように構成されているキットであり、必要に応じて、(c)前記結合性部分を含む、キット。
実施形態2.前記記録タグおよび/または前記分析物が、支持体に直接または間接的に固定化されるように構成されている、実施形態1に記載のキット。
実施形態3.前記記録タグが、前記支持体に固定化されるように構成されており、それにより、前記記録タグに付随する前記分析物が固定化される、実施形態2に記載のキット。
実施形態4.前記分析物が、前記支持体に固定化されるように構成されており、それにより、前記分析物に付随する前記記録タグが固定化される、実施形態2に記載のキット。
実施形態5.前記記録タグおよび前記分析物の各々が、前記支持体に固定化されるように構成されている、実施形態2に記載のキット。
実施形態6.前記記録タグおよび前記分析物が、両方が支持体に固定化されたときに共局在するように構成されている、実施形態5に記載のキット。
実施形態7.(i)支持体に直接もしくは間接的に固定化されるように、および(ii)前記記録タグおよび/または分析物と直接または間接的に会合するように、構成されている固定化リンカーをさらに含む、実施形態1~6のいずれかに記載のキット。
実施形態8.前記固定化リンカーが、前記記録タグおよび前記分析物と会合するように構成されている、実施形態7に記載のキット。
実施形態9.前記固定化リンカーが、前記支持体に直接固定化されるように構成されており、それにより、前記固定化リンカーに付随する前記記録タグおよび/または前記分析物が固定化される、実施形態7または8に記載のキット。
実施形態10.支持体をさらに含む、実施形態2~9のいずれか1つに記載のキット。
実施形態11.前記結合性物質と前記分析物との結合時に前記コーディングタグと前記記録タグの間で情報を移行させるための1つまたは複数の試薬をさらに含む、実施形態1~10のいずれか1つに記載のキット。
実施形態12.前記1つまたは複数の試薬が、前記コーディングタグから前記記録タグに情報を移行させるように構成されており、それにより、伸長記録タグが生成される、実施形態11に記載のキット。
実施形態13.前記1つまたは複数の試薬が、前記記録タグから前記コーディングタグに情報を移行させるように構成されており、それにより、伸長コーディングタグが生成される、実施形態11に記載のキット。
実施形態14.前記1つまたは複数の試薬が、前記コーディングタグからの情報および前記記録タグからの情報を含むジタグ構築物を生成するように構成されている、実施形態11に記載のキット。
実施形態15.前記記録タグのうちの少なくとも2つを含む、実施形態1~14のいずれか1つに記載のキット。
実施形態16.前記コーディングタグのうちの少なくとも2つを含み、各々がそれに付随する結合性部分に関する識別情報を含む、実施形態1~15のいずれか1つに記載のキット。
実施形態17.前記結合性物質のうちの少なくとも2つを含む、実施形態1~16のいずれか1つに記載のキット。
実施形態18.(i)第1の結合性物質と前記分析物との結合時に、前記第1の結合性物質の第1のコーディングタグから前記記録タグに情報を移行させて一次伸長記録タグを生成するための1つもしくは複数の試薬、および/または(ii)第2の結合性物質と前記分析物との結合時に、前記第2の結合性物質の第2のコーディングタグから前記一次伸長記録タグに情報を移行させて二次伸長記録タグを生成するための1つもしくは複数の試薬を含み、前記(i)の1つまたは複数の試薬と前記(ii)の1つまたは複数の試薬が同じであってもよく、または異なっていてもよい、実施形態17に記載のキット。
実施形態19.(iii)第3の(またはより高次の)結合性物質と前記分析物との結合時に、前記第3の(またはより高次の)結合性物質の第3の(またはより高次の)コーディングタグから前記二次伸長記録タグに情報を移行させて三次(またはより高次の)伸長記録タグを生成するための1つまたは複数の試薬をさらに含む、実施形態18に記載のキット。
実施形態20.(i)第1の結合性物質と前記分析物との結合時に、前記第1の結合性物質の第1のコーディングタグから第1の記録タグに情報を移行させて第1の伸長記録タグを生成するための1つもしくは複数の試薬、および/または(ii)第2の結合性物質と前記分析物との結合時に、前記第2の結合性物質の第2のコーディングタグから第2の記録タグに情報を移行させて第2の伸長記録タグを生成するための1つもしくは複数の試薬を含み、前記(i)の1つまたは複数の試薬と前記(ii)の1つまたは複数の試薬が同じであってもよく、または異なっていてもよい、実施形態17に記載のキット。
実施形態21.(iii)第3の(またはより高次の)結合性物質と前記分析物との結合時に、前記第3の(またはより高次の)結合性物質の第3の(またはより高次の)コーディングタグから第3の(またはより高次の)記録タグに情報を移行させて第3の(またはより高次の)伸長記録タグを生成するための1つまたは複数の試薬をさらに含む、実施形態20に記載のキット。
実施形態22.前記第1の記録タグ、前記第2の記録タグ、および/または前記第3の(もしくはより高次の)記録タグが、前記分析物と直接または間接的に会合するように構成されている、実施形態20または21に記載のキット。
実施形態23.前記第1の記録タグ、前記第2の記録タグ、および/または前記第3の(もしくはより高次の)記録タグが、支持体上に固定化されるように構成されている、実施形態20~22のいずれか1つに記載のキット。
実施形態24.前記第1の記録タグ、前記第2の記録タグ、および/または前記第3の(もしくはより高次の)記録タグが、前記分析物と共局在するように、例えば、前記第1、第2または第3の(またはより高次の)結合性物質と前記分析物との結合時に、前記第1、第2または第3の(またはより高次の)コーディングタグと前記第1、第2または第3の(またはより高次の)記録タグとの間の情報の移行をそれぞれ可能にするように、構成されている、実施形態20~23のいずれか1つに記載のキット。
実施形態25.前記第1のコーディングタグ、前記第2のコーディングタグ、および/または前記第3の(もしくはより高次の)コーディングタグの各々が、結合サイクル特異的バーコード、例えば、結合サイクル特異的スペーサー配列C、および/もしくはコーディングタグ特異的スペーサー配列C(ここで、nは整数であり、Cは、第nの結合性物質とポリペプチドとの結合を示す)を含む;または結合サイクルタグCが、外因的に付加される、例えば、前記結合サイクルタグCが、前記コーディングタグにとって外来のものであり得る、実施形態20~24のいずれか1つに記載のキット。
実施形態26.前記分析物がポリペプチドを含む、実施形態1~25のいずれか1つに記載のキット。
実施形態27.前記結合性部分が、前記ポリペプチドの1つもしくは複数のN末端もしくはC末端アミノ酸に結合することが可能である、または官能化試薬により修飾された前記1つもしくは複数のN末端もしくはC末端アミノ酸に結合することが可能である、実施形態26に記載のキット。
実施形態28.官能化試薬をさらに含む、実施形態26または27に記載のキット。
実施形態29.前記ポリペプチドの1つもしくは複数のN末端、内部もしくはC末端アミノ酸を(例えば、化学的切断もしくは酵素的切断により)除去するための、または官能化されたN末端、内部もしくはC末端アミノ酸を除去するための、消去試薬をさらに含み、必要に応じて、前記消去試薬が、カルボキシペプチダーゼもしくはアミノペプチダーゼまたはそのバリアント、変異体もしくは修飾タンパク質;ヒドロラーゼまたはそのバリアント、変異体もしくは修飾タンパク質;穏やかなエドマン分解試薬;エドマナーゼ酵素;無水TFA、塩基;あるいはこれらの任意の組合せを含む、実施形態26~28のいずれか1つに記載のキット。
実施形態30.前記1つまたは複数のN末端、内部またはC末端アミノ酸が、(i)N末端アミノ酸(NTAA)、(ii)N末端ジペプチド配列、(iii)N末端トリペプチド配列;(iv)内部アミノ酸;(v)内部ジペプチド配列;(vi)内部トリペプチド配列;(vii)C末端アミノ酸(CTAA);(viii)C末端ジペプチド配列;もしくは(ix)C末端トリペプチド配列、またはこれらの任意の組合せを含み、必要に応じて、(i)~(ix)の前記アミノ酸残基の任意の1つまたは複数が、修飾または官能化されている、実施形態26~29のいずれか1つに記載のキット。
実施形態31.少なくとも(a)(i)解析されるポリペプチドのN末端アミノ酸(NTAA)または官能化NTAAに結合することが可能な第1の結合性部分および(ii)前記第1の結合性部分に関する識別情報を含む第1のコーディングタグを含む、第1の結合性物質と、必要に応じて(b)前記ポリペプチドと直接または間接的に会合するように構成されている記録タグと、さらに必要に応じて(c)第1の官能化NTAAを生成するために前記ポリペプチドの第1のNTAAを修飾することができる官能化試薬とを含むキットであって、前記記録タグおよび前記第1の結合性物質が、前記第1の結合性物質と前記ポリペプチドとの結合時に前記第1のコーディングタグと前記記録タグの間の情報の移行を可能にするように構成されている、キット。
実施形態32.前記第1のコーディングタグから前記記録タグに情報を移行させることによって一次伸長記録タグを生成するための1つまたは複数の試薬をさらに含む、実施形態31に記載のキット。
実施形態33.前記官能化試薬が、化学薬剤、酵素および/または生物学的薬剤、例えば、イソチオシアネート誘導体、2,4-ジニトロベンゼンスルホン酸(DNBS)、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)1-フルオロ-2,4-ジニトロベンゼン、ダンシルクロリド、7-メトキシクマリン酢酸、チオアシル化試薬、チオアセチル化試薬、またはチオベンジル化試薬を含む、実施形態31または32に記載のキット。
実施形態34.前記第1の官能化NTAAを(例えば、化学的切断または酵素的切断により)除去して、直接隣接しているアミノ酸残基を第2のNTAAとして露出させるための消去試薬をさらに含む、実施形態31~33のいずれか1つに記載のキット。
実施形態35.前記第2のNTAAが、前記第1の官能化NTAAと同じであってもよくまたは異なっていてもよい第2の官能化NTAAを生成するように同じまたは異なる官能化試薬により官能化され得る、実施形態34に記載のキット。
実施形態36.(d)(i)前記第2の官能化NTAAに結合することが可能な第2の(またはより高次の)結合性部分と、(ii)前記第2の(またはより高次の)結合性部分に関する識別情報を含む第2の(またはより高次の)コーディングタグとを含む、第2の(またはより高次の)結合性物質をさらに含み、前記第1のコーディングタグと前記第2の(またはより高次の)コーディングタグが、同じであってもよく、または異なっていてもよい、実施形態35に記載のキット。
実施形態37.前記第1の官能化NTAAおよび前記第2の官能化NTAAが、官能化N末端アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リシン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、トレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)からなる群から、これらの任意の組合せで、互いに独立して選択される、実施形態36に記載のキット。
実施形態38.前記第2の(またはより高次の)コーディングタグから前記一次伸長記録タグに情報を移行させることによって二次(またはより高次の)伸長記録タグを生成するための1つまたは複数の試薬をさらに含む、実施形態36または37に記載のキット。
実施形態39.少なくとも(a)(i)解析されるポリペプチドのN末端アミノ酸(NTAA)もしくは官能化NTAAに結合することが可能な結合性部分と(ii)前記結合性部分に関する識別情報を含むコーディングタグとを各々が含む、1つもしくは複数の結合性物質、および/または(b)前記ポリペプチドと直接もしくは間接的に会合するように構成されている1つもしくは複数の記録タグを含む、キットであって、前記1つまたは複数の記録タグおよび前記1つまたは複数の結合性物質が、各結合性物質と前記ポリペプチドとの結合時に前記コーディングタグと前記記録タグの間の情報の移行を可能にするように構成されているキットであり、必要に応じて(c)第1の官能化NTAAを生成するために前記ポリペプチドの第1のNTAAを修飾することができる官能化試薬を含む、キット。
実施形態40.前記第1の官能化NTAAを(例えば、化学的切断または酵素的切断により)除去して、直接隣接しているアミノ酸残基を第2のNTAAとして露出させるための消去試薬をさらに含む、実施形態39に記載のキット。
実施形態41.前記第2のNTAAが、前記第1の官能化NTAAと同じであってもよくまたは異なっていてもよい第2の官能化NTAAを生成するように同じまたは異なる官能化試薬により官能化され得る、実施形態40に記載のキット。
実施形態42.前記第1の官能化NTAAおよび前記第2の官能化NTAAが、官能化N末端アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リシン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、トレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)からなる群から、これらの任意の組合せで、互いに独立して選択される、実施形態41に記載のキット。
実施形態43.(i)第1の結合性物質と前記ポリペプチドとの結合時に前記第1の結合性物質の第1のコーディングタグから第1の記録タグに情報を移行させて第1の伸長記録タグを生成するための1つもしくは複数の試薬、および/または(ii)第2の結合性物質と前記ポリペプチドとの結合時に前記第2の結合性物質の第2のコーディングタグから第2の記録タグに情報を移行させて第2の伸長記録タグを生成するための1つもしくは複数の試薬を含み、前記(i)の1つまたは複数の試薬と前記(ii)の1つまたは複数の試薬が同じであってもよく、または異なっていてもよい、実施形態39~42のいずれか1つに記載のキット。
実施形態44.(iii)第3の(またはより高次の)結合性物質と前記ポリペプチドとの結合時に前記第3の(またはより高次の)結合性物質の第3の(またはより高次の)コーディングタグから第3の(またはより高次の)記録タグに情報を移行させて第3の(またはより高次の)伸長記録タグを生成するための1つまたは複数の試薬をさらに含む、実施形態43に記載のキット。
実施形態45.前記第1の記録タグ、前記第2の記録タグ、および/または前記第3の(もしくはより高次の)記録タグが、前記ポリペプチドと直接または間接的に会合するように構成されている、実施形態43または44に記載のキット。
実施形態46.前記第1の記録タグ、前記第2の記録タグ、および/または前記第3の(もしくはより高次の)記録タグが、支持体上に固定化されるように構成されている、実施形態43~45のいずれか1つに記載のキット。
実施形態47.前記第1の記録タグ、前記第2の記録タグ、および/または前記第3の(もしくはより高次の)記録タグが、前記ポリペプチドと共局在するように、例えば、前記第1、第2または第3の(またはより高次の)結合性物質と前記ポリペプチドとの結合時に、前記第1、第2または第3の(またはより高次の)コーディングタグと前記第1、第2または第3の(またはより高次の)記録タグとの間の情報の移行をそれぞれ可能にするように、構成されている、実施形態43~46のいずれか1つに記載のキット。
実施形態48.前記第1のコーディングタグ、前記第2のコーディングタグ、および/または前記第3の(もしくはより高次の)コーディングタグの各々が、結合サイクル特異的バーコード、例えば、結合サイクル特異的スペーサー配列C、および/もしくはコーディングタグ特異的スペーサー配列C(ここで、nは整数であり、Cは、第nの結合性物質とポリペプチドとの結合を示す)を含む、実施形態43~47のいずれか1つに記載のキット。あるいは、結合サイクルタグCは、外因的に付加されることがあり、例えば、前記結合サイクルタグCは、前記コーディングタグにとって外来のものであり得る。
実施形態49.前記分析物または前記ポリペプチドが、タンパク質もしくはポリペプチド鎖またはその断片、脂質、炭水化物、あるいは大環状分子を含む、実施形態1~48のいずれか1つに記載のキット。
実施形態50.前記分析物または前記ポリペプチドが、巨大分子またはその複合体、例えばタンパク質複合体、またはそのサブユニットを含む、実施形態1~49のいずれか1つに記載のキット。
実施形態51.前記記録タグが、核酸、オリゴヌクレオチド、修飾オリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、保護された塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、もしくはモルホリノ、またはこれらの組合せを含む、実施形態1~50のいずれか1つに記載のキット。
実施形態52.前記記録タグが、ユニバーサルプライミング部位を含む、実施形態1~51のいずれか1つに記載のキット。
実施形態53.前記記録タグが、増幅、配列決定、またはその両方のためのプライミング部位を含み、例えば、前記ユニバーサルプライミング部位が、増幅、配列決定、またはその両方のためのプライミング部位を含む、実施形態1~52のいずれか1つに記載のキット。
実施形態54.前記記録タグが、一意の分子識別子(UMI)を含む、実施形態1~53のいずれか1つに記載のキット。
実施形態55.前記記録タグが、バーコードを含む、実施形態1~54のいずれか1つに記載のキット。
実施形態56.前記記録タグが、その3’末端にスペーサーを含む、実施形態1~55のいずれか1つに記載のキット。
実施形態57.固体支持体、例えば、剛性固体支持体、可撓性固体支持体、または軟質固体支持体を含み、多孔質支持体または非多孔質支持体を含む、実施形態1~56のいずれか1つに記載のキット。
実施形態58.ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、スピン干渉ディスク、膜、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子(例えば、磁気ナノ粒子(Fe)、金ナノ粒子および/もしくは銀ナノ粒子などの、金属を含む)、量子ドット、ナノシェル、ナノケージ、マイクロスフェア、またはこれらの任意の組合せを含む、支持体を含む、実施形態1~57のいずれか1つに記載のキット。
実施形態59.前記支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、もしくは制御ポアビーズ、またはこれらの任意の組合せを含む、実施形態58に記載のキット。
実施形態60.支持体を含み、複数の前記分析物または前記ポリペプチドを逐次反応で、並列反応で、または逐次反応と並列反応の組合せで解析するためのものである、実施形態1~59のいずれか1つに記載のキット。
実施形態61.前記分析物の間にまたは前記ポリペプチドの間に前記支持体上で平均距離約10nmに等しいもしくはそれより長い、約15nmに等しいもしくはそれより長い、約20nmに等しいもしくはそれより長い、約50nmに等しいもしくはそれより長い、約100nmに等しいもしくはそれより長い、約150nmに等しいもしくはそれより長い、約200nmに等しいもしくはそれより長い、約250nmに等しいもしくはそれより長い、約300nmに等しいもしくはそれより長い、約350nmに等しいもしくはそれより長い、約400nmに等しいもしくはそれより長い、約450nmに等しいもしくはそれより長い、または約500nmに等しいもしくはそれより長い間隔をあける、実施形態60に記載のキット。
実施形態62.前記結合性部分が、ポリペプチドまたはその断片、タンパク質もしくはポリペプチド鎖またはその断片、あるいはタンパク質複合体またはそのサブユニット、例えば、抗体またはその抗原結合断片を含む、実施形態1~61のいずれか1つに記載のキット。
実施形態63.前記結合性部分が、カルボキシペプチダーゼもしくはアミノペプチダーゼまたはそのバリアント、変異体もしくは修飾タンパク質;アミノアシルtRNA合成酵素またはそのバリアント、変異体もしくは修飾タンパク質;アンチカリンまたはそのバリアント、変異体もしくは修飾タンパク質;ClpSまたはそのバリアント、変異体もしくは修飾タンパク質;UBRボックスタンパク質またはそのバリアント、変異体もしくは修飾タンパク質;アミノ酸に結合する修飾小分子、すなわちバンコマイシンまたはそのバリアント、変異体もしくは修飾分子;あるいはこれらの任意の組合せを含む、または各結合性物質中の、前記結合性部分が、小分子を含み、前記コーディングタグが、前記小分子を識別するポリヌクレオチドを含み、それによって、複数の前記結合性物質が、DNAにコードされた小分子のライブラリーなどの、コードされた小分子のライブラリーを形成する、実施形態1~62のいずれか1つに記載のキット。
実施形態64.前記結合性部分が、前記分析物または前記ポリペプチドに選択的におよび/または特異的に結合することが可能である、実施形態1~63のいずれか1つに記載のキット。
実施形態65.前記コーディングタグが、核酸、オリゴヌクレオチド、修飾オリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、1つもしくは複数の保護された塩基を有するDNAもしくはRNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはモルホリノ、あるいはこれらの組合せを含む、実施形態1~64のいずれか1つに記載のキット。
実施形態66.前記コーディングタグが、エンコーダー配列などのバーコード配列、例えば、前記結合性部分を識別するものを含む、実施形態1~65のいずれか1つに記載のキット。
実施形態67.前記コーディングタグが、スペーサー、結合サイクル特異的配列、一意の分子識別子(UMI)、ユニバーサルプライミング部位、またはこれらの任意の組合せを含み、必要に応じて、結合サイクル特異的配列が、各結合サイクル後に前記記録タグに付加される、実施形態1~66のいずれか1つに記載のキット。
実施形態68.前記結合性部分および前記コーディングタグが、リンカーまたは結合対によって接合されている、実施形態1~67のいずれか1つに記載のキット。
実施形態69.前記結合性部分と前記コーディングタグが、SpyTag/SpyCatcher、SpyTag-KTag/SpyLigase(この場合、接合される2つの部分がSpyTag/KTag対を有し、SpyLigaseがSpyTagをKTagに接合させ、かくして2つの部分が接合される)、ソルターゼ、SnoopTag/SnoopCatcherペプチド-タンパク質対、もしくはHaloTag/HaloTagリガンド対、またはこれらの任意の組合せによって接合されている、実施形態1~68のいずれか1つに記載のキット。
実施形態70.鋳型または非鋳型反応において前記コーディングタグと前記記録タグの間で情報を移行させるための試薬をさらに含み、必要に応じて、前記試薬が、(i)化学的ライゲーション試薬もしくは生物学的ライゲーション試薬、例えば、一本鎖核酸もしくは二本鎖核酸をライゲーションするためのDNAリガーゼもしくはRNAリガーゼなどのリガーゼであるか、または(ii)一本鎖核酸もしくは二本鎖核酸のプライマー伸長のための試薬であり、必要に応じて、前記キットが、少なくとも2つのリガーゼもしくはそれらのバリアント(例えば、少なくとも2つのDNAリガーゼ、もしくは少なくとも2つのRNAリガーゼ、もしくは少なくとも1つのDNAリガーゼおよび少なくとも1つのRNAリガーゼ)を含むライゲーション試薬であって、前記少なくとも2つのリガーゼもしくはそれらのバリアントが、アデニル化リガーゼおよび構成的にアデニル化されていないリガーゼを含む、ライゲーション試薬をさらに含み、または必要に応じて、前記キットが、DNAもしくはRNAリガーゼおよびDNA/RNAデアデニレースを含むライゲーション試薬をさらに含む、実施形態1~69のいずれか1つに記載のキット。
実施形態71.前記コーディングタグと前記記録タグの間で情報を移行させるためのポリメラーゼ、例えば、DNAポリメラーゼもしくはRNAポリメラーゼ、または逆転写酵素をさらに含む、実施形態1~70のいずれか1つに記載のキット。
実施形態72.核酸配列解析のための1つまたは複数の試薬をさらに含む、実施形態1~71のいずれか1つに記載のキット。
実施形態73.前記核酸配列解析が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、パイロシーケンシング、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、もしくは先端顕微鏡を使用したDNAのダイレクトイメージング、またはこれらの任意の組合せを含む、実施形態72に記載のキット。
実施形態74.核酸増幅のための、例えば、1つまたは複数の伸長記録タグを増幅するための、1つまたは複数の試薬をさらに含み、必要に応じて、前記核酸増幅が、指数関数的増幅反応(例えば、鋳型乗り換えを低減もしくは消去するためのエマルジョンPCRなどの、ポリメラーゼ連鎖反応(PCR))および/または線形増幅反応(例えば、in vitro転写による等温増幅、もしくはキメラプライマーにより開始される核酸の等温増幅(Isothermal Chimeric primer-initiated Amplification of Nucleic acids)(ICAN))を含む、実施形態1~73のいずれか1つに記載のキット。
実施形態75.コーディングタグ情報を前記記録タグに移行させて伸長記録タグを形成するための1つまたは複数の試薬を含み、前記伸長記録タグ上のコーディングタグ情報の順序および/または頻度が、前記結合性物質が前記分析物または前記ポリペプチドに結合する順序および/または頻度を示す、実施形態1~74のいずれか1つに記載のキット。
実施形態76.標的濃縮、例えば、1つまたは複数の伸長記録タグの濃縮のための1つまたは複数の試薬をさらに含む、実施形態1~75のいずれか1つに記載のキット。
実施形態77.サブトラクション、例えば、1つまたは複数の伸長記録タグのサブトラクションのための1つまたは複数の試薬をさらに含む、実施形態1~76のいずれか1つに記載のキット。
実施形態78.例えば、1つまたは複数の分析物またはポリペプチドなどの極めて豊富な種を低減させるための、正規化のための1つまたは複数の試薬をさらに含む、実施形態1~77のいずれか1つに記載のキット。
実施形態79.少なくとも1つの結合性物質が、末端アミノ酸残基、末端ジアミノ酸残基、または末端トリプルアミノ酸残基に結合する、実施形態1~78のいずれか1つに記載のキット。
実施形態80.前記少なくとも1つの結合性物質が、翻訳後修飾されたアミノ酸に結合する、実施形態1~79のいずれか1つに記載のキット。
実施形態81.試料中の複数の前記分析物またはポリペプチドを複数のコンパートメントに分配するための1つまたは複数の試薬または手段をさらに含み、各コンパートメントが、支持体(例えば、固体支持体)に必要に応じて接合されている複数のコンパートメントタグを含み、前記複数のコンパートメントタグが、個々のコンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、実施形態1~80のいずれか1つに記載のキット。
実施形態82.前記複数の分析物またはポリペプチド(例えば、複数のタンパク質複合体、タンパク質および/またはポリペプチド)を複数のポリペプチド断片に断片化するための1つまたは複数の試薬または手段をさらに含む、実施形態81に記載のキット。
実施形態83.前記複数のポリペプチド断片を、前記複数のコンパートメントの各々の中のコンパートメントタグとアニーリングまたは接合させることによって複数のコンパートメントタグ付きポリペプチド断片を生成するための1つまたは複数の試薬または手段をさらに含む、実施形態81または82に記載のキット。
実施形態84.前記複数のコンパートメントが、マイクロ流体液滴、マイクロウェル、もしくは表面上の分離された領域、またはこれらの任意の組合せを含む、実施形態81~83のいずれか1つに記載のキット。
実施形態85.前記複数のコンパートメントの各々が、平均して単一の細胞を含む、実施形態81~84のいずれか1つに記載のキット。
実施形態86.前記試料中の前記複数の分析物またはポリペプチドを標識するための1つまたは複数のユニバーサルDNAタグをさらに含む、実施形態81~85のいずれか1つに記載のキット。
実施形態87.前記試料中の前記複数の分析物またはポリペプチドを1つまたは複数のユニバーサルDNAタグで標識するための1つまたは複数の試薬をさらに含む、実施形態81~86のいずれか1つに記載のキット。
実施形態88.プライマー伸長またはライゲーションのための1つまたは複数の試薬をさらに含む、実施形態81~87のいずれか1つに記載のキット。
実施形態89.前記支持体が、ビーズ、例えば、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、もしくは制御ポアビーズ、またはこれらの任意の組合せを含む、実施形態81~88のいずれか1つに記載のキット。
実施形態90.前記コンパートメントタグが、一本鎖または二本鎖核酸分子を含む、実施形態81~89のいずれか1つに記載のキット。
実施形態91.前記コンパートメントタグが、バーコードおよび必要に応じてUMIを含む、実施形態81~90のいずれか1つに記載のキット。
実施形態92.前記支持体が、ビーズであり、前記コンパートメントタグが、バーコードを含む、実施形態81~91のいずれか1つに記載のキット。
実施形態93.前記支持体がビーズを含み、複数のコンパートメントタグが接合されているビーズが、スプリット・アンド・プール(split-and-pool)合成、個々の合成、または固定化により形成される、実施形態81~92のいずれか1つに記載のキット。
実施形態94.スプリット・アンド・プール合成、個々の合成、または固定化のための1つまたは複数の試薬をさらに含む、実施形態81~93のいずれか1つに記載のキット。
実施形態95.前記コンパートメントタグが、記録タグ内の成分であり、前記記録タグが、必要に応じて、スペーサー、バーコード配列、一意の分子識別子、ユニバーサルプライミング部位、またはこれらの任意の組合せをさらに含む、実施形態81~94のいずれか1つに記載のキット。
実施形態96.前記コンパートメントタグが、前記複数の分析物またはポリペプチド(例えば、タンパク質複合体、タンパク質、またはポリペプチド)の内部アミノ酸、ペプチド骨格またはN末端アミノ酸と反応することができる機能的部分をさらに含む、実施形態81~95のいずれか1つに記載のキット。
実施形態97.前記機能的部分が、アルデヒド、アジド/アルキン、マレイミド/チオール、エポキシ/求核試薬、逆電子要請型ディールス-アルダー(iEDDA)基、クリック試薬、またはこれらの任意の組合せを含む、実施形態96に記載のキット。
実施形態98.前記コンパートメントタグが、タンパク質リガーゼ認識配列などのペプチドをさらに含み、必要に応じて、前記タンパク質リガーゼが、ブテラーゼIまたはそのホモログである、実施形態81~97のいずれか1つに記載のキット。
実施形態99.前記複数の分析物またはポリペプチドを断片化するための化学的または生物学的試薬、例えば、酵素、例えばプロテアーゼ(例えば、メタロプロテアーゼ)をさらに含む、実施形態81~98のいずれか1つに記載のキット。
実施形態100.前記コンパートメントタグを前記支持体から遊離させるための1つまたは複数の試薬をさらに含む、実施形態81~99のいずれか1つに記載のキット。
実施形態101.伸長コーディングタグまたはジタグ構築物を形成するための1つまたは複数の試薬をさらに含む、実施形態1~100のいずれか1つに記載のキット。
実施形態102.前記記録タグの3’末端が、ポリメラーゼによる前記記録タグの伸長を防止するためにブロッキングされる、実施形態101に記載のキット。
実施形態103.前記コーディングタグが、エンコーダー配列、UMI、ユニバーサルプライミング部位、その3’末端にスペーサー、結合サイクル特異的配列、またはこれらの任意の組合せを含む、実施形態101または102に記載のキット。
実施形態104.前記ジタグ構築物が、ギャップ充填、プライマー伸長、またはこれらの組合せにより生成される、実施形態101~103のいずれか1つに記載のキット。
実施形態105.前記ジタグ分子が、前記記録タグに由来するユニバーサルプライミング部位、前記記録タグに由来するコンパートメントタグ、前記記録タグに由来する一意の分子識別子、前記記録タグに由来する必要に応じたスペーサー、前記コーディングタグに由来するエンコーダー配列、前記コーディングタグに由来する一意の分子識別子、前記コーディングタグに由来する必要に応じたスペーサー、および前記コーディングタグに由来するユニバーサルプライミング部位を含む、実施形態101~104のいずれか1つに記載のキット。
実施形態106.前記結合性物質が、ポリペプチドまたはタンパク質である、実施形態101~105のいずれか1つに記載のキット。
実施形態107.前記結合性物質が、アミノペプチダーゼまたはそのバリアント、変異体もしくは修飾タンパク質;アミノアシルtRNA合成酵素またはそのバリアント、変異体もしくは修飾タンパク質;アンチカリンまたはそのバリアント、変異体もしくは修飾タンパク質;ClpSまたはそのバリアント、変異体もしくは修飾タンパク質;またはアミノ酸に結合する修飾小分子、すなわちバンコマイシンまたはそのバリアント、変異体もしくは修飾分子;または抗体もしくはその結合断片;あるいはこれらの任意の組合せを含む、実施形態101~106のいずれか1つに記載のキット。
実施形態108.前記結合性物質が、単一のアミノ酸残基(例えば、N末端アミノ酸残基、C末端アミノ酸残基、もしくは内部アミノ酸残基)、ジペプチド(例えば、N末端ジペプチド、C末端ジペプチド、もしくは内部ジペプチド)、トリペプチド(例えば、N末端トリペプチド、C末端トリペプチド、もしくは内部トリペプチド)、または前記分析物もしくはポリペプチドの翻訳後修飾に結合する、実施形態101~107のいずれか1つに記載のキット。
実施形態109.前記結合性物質が、N末端ポリペプチド、C末端ポリペプチド、または内部ポリペプチドに結合する、実施形態101~107のいずれか1つに記載のキット。
実施形態110.前記コーディングタグおよび/または前記記録タグが、1つもしくは複数のエラー訂正コード、1つもしくは複数のエンコーダー配列、1つもしくは複数のバーコード、1つもしくは複数のUMI、1つもしくは複数のコンパートメントタグ、1つもしくは複数のサイクル特異的配列、またはこれらの任意の組合せを含む、実施形態1~109のいずれか1つに記載のキット。
実施形態111.前記エラー訂正コードが、Hammingコード、Lee距離コード、非対称Lee距離コード、Reed-Solomonコード、およびLevenshtein-Tenengoltsコードから選択される、実施形態110に記載のキット。
実施形態112.前記コーディングタグおよび/または記録タグが、サイクル標識を含む、実施形態1~111のいずれか1つに記載のキット。
実施形態113.前記コーディングタグおよび/または前記記録タグから独立しているサイクル標識をさらに含む、実施形態1~112のいずれか1つに記載のキット。
実施形態114.(a)細胞溶解物もしくはタンパク質試料を生成するための試薬;(b)システインのアルキル化またはリシンのブロッキングなどによって、アミノ酸側鎖をブロッキングするための試薬;(c)トリプシン、LysN、またはLysCなどの、プロテアーゼ;(d)核酸標識ポリペプチド(例えば、DNA標識タンパク質)を支持体に固定化するための試薬;(e)分解に基づくポリペプチド配列決定のための試薬;および/または(f)核酸配列決定のための試薬を含む、実施形態1~113のいずれか1つに記載のキット。
実施形態115.(a)細胞溶解物もしくはタンパク質試料を生成するための試薬;(b)システインのアルキル化またはリシンのブロッキングなどによって、アミノ酸側鎖をブロッキングするための試薬;(c)トリプシン、LysN、またはLysCなどの、プロテアーゼ;(d)固定化された記録ポリマーを含む支持体にポリペプチド(例えば、タンパク質)を固定化するための試薬;(e)分解に基づくポリペプチド配列決定のための試薬;および/または(f)核酸配列決定のための試薬を含む、実施形態1~113のいずれか1つに記載のキット。
実施形態116.(a)細胞溶解物もしくはタンパク質試料を生成するための試薬;(b)変性試薬;(c)システインのアルキル化またはリシンのブロッキングなどによって、アミノ酸側鎖をブロッキングするための試薬;(d)ユニバーサルDNAプライマー配列;(e)ポリペプチドをユニバーサルDNAプライマー配列で標識するための試薬;(f)標識されたポリペプチドをプライマーによってアニーリングするためのバーコード付きビーズ;(g)前記標識されたポリペプチドに前記ビーズからのバーコードを書き込むためのポリメラーゼ伸長のための試薬;(h)トリプシン、LysN、またはLysCなどの、プロテアーゼ;(i)核酸標識ポリペプチド(例えば、DNA標識タンパク質)を支持体に固定化するための試薬;(j)分解に基づくポリペプチド配列決定のための試薬;および/または(k)核酸配列決定のための試薬を含む、実施形態1~113のいずれか1つに記載のキット。
実施形態117.(a)架橋試薬;(b)細胞溶解物もしくはタンパク質試料を生成するための試薬;(c)システインのアルキル化またはリシンのブロッキングなどによって、アミノ酸側鎖をブロッキングするための試薬;(d)ユニバーサルDNAプライマー配列;(e)ポリペプチドをユニバーサルDNAプライマー配列で標識するための試薬;(f)標識されたポリペプチドをプライマーによってアニーリングするためのバーコード付きビーズ;(g)前記標識されたポリペプチドに前記ビーズからのバーコードを書き込むためのポリメラーゼ伸長のための試薬;(h)トリプシン、LysN、またはLysCなどの、プロテアーゼ;(i)核酸標識ポリペプチド(例えば、DNA標識タンパク質)を支持体に固定化するための試薬;(j)分解に基づくポリペプチド配列決定のための試薬;および/または(k)核酸配列決定のための試薬を含む、実施形態1~113のいずれか1つに記載のキット。
実施形態118.溶液中または支持体、例えば、固体支持体上の1つまたは複数の成分が提供される、実施形態1~117のいずれか1つに記載のキット。
V.実施例
以下の実施例は例示の目的のみで含まれるものであり、本発明の範囲を限定することを意図するものではない。
(実施例1)
プロテイナーゼKによるタンパク質試料の消化
ペプチドのライブラリーを、トリプシン、プロテイナーゼKなどのプロテアーゼで消化することによりタンパク質試料から調製する。トリプシンは、例えば、リシンおよびアルギニンのような正電荷のアミノ酸のC末端側を切断するが、プロテイナーゼKは、タンパク質の全体にわたって非選択的に切断する。そのため、プロテイナーゼK消化は、短鎖ペプチド(約30個のアミノ酸)を生成するのに十分なタンパク質分解を提供するが、試料が過剰消化されないような好ましい酵素対ポリペプチドの比を使用して、注意深くタイトレーションすることが必要である。一般的に、所与のプロテイナーゼKロット毎に、機能活性のタイトレーションを実施することが必要である。この例では、タンパク質試料を、1×PBS/1mM EDTA/0.5mM CaCl/0.5%SDS(pH8.0)中で1:10~1:100(w/w)の酵素:タンパク質比にてプロテイナーゼKを用いて、1時間37℃にて消化する。インキュベーション後、PMSFを、終濃度が5mMになるように添加して、さらなる消化を阻害する。
プロテイナーゼKの特異的活性は、「化学的基質」ベンゾイルアルギニン-p-ニトロアニリドをプロテイナーゼKと共にインキュベートし、約410nmで吸収を示す黄色p-ニトロアニリン産物の発色を測定することにより、測定することができる。酵素活性は、1単位が毎分1μモルのp-ニトロアニリドの産生と等しい単位で測定し、特異的活性は、酵素活性/mg総タンパク質の単位で測定する。その後、溶液中のタンパク質の総量で酵素活性を除算することにより、特異的活性を算出する。
(実施例2)
SP3オンビーズプロテアーゼ消化および標識を使用した試料調製
Hughesら(2014年、Mol Syst Biol、10巻:757頁)により記載されているようなSP3試料調製プロトコールを使用して、タンパク質を抽出し、変性させる。抽出した後、タンパク質ミックス(およびビーズ)を、0.02%SDSで補完された1mM EDTAを有する50mMホウ酸緩衝液(pH8.0)中で1時間37℃で溶解した。タンパク質溶解後、ジスルフィド結合を、終濃度が5mMになるようにDTTを添加し、試料を50℃で10分間インキュベートすることにより還元する。終濃度が10mMになるようにヨードアセトアミドを添加することによりシステインをアルキル化し、室温で20分間、暗所でインキュベートする。反応を、50mMホウ酸緩衝液で2倍に希釈し、Glu-CまたはLys-Cを、1:50(w/w)の最終プロテイナーゼ:タンパク質比で添加する。試料を37℃で一晩(約16時間)インキュベートして、消化を完了した。Hughesら(上記)により記載されているように試料を消化した後、8分間のインキュベーション中、アセトニトリルの終濃度が95%になるように100%アセトニトリルを添加することによりペプチドをビーズに結合させ、アセトニトリルで洗浄する。洗浄した後、5分間のピペット混合ステップにより、10μlの2%DMSO中でビーズからペプチドを溶出する。
(実施例3)
記録タグとペプチドとのカップリング
DNA記録タグを、いくつかの方法でペプチドにカップリングする(Aslam etal., 1998, Bioconjugation: Protein Coupling Techniques for the BiomedicalSciences, Macmillan Reference LTD;Hermanson GT, 1996, Bioconjugate Techniques,Academic Press Inc., 1996を参照されたい)。1つの手法では、カルボジイミド化学を使用してペプチドのC末端とカップリングする5’アミンを用いて、およびクリック化学を使用してアジドビーズとカップリングする内部歪みアルキン、DBCO-dT(Glen Research、VA)、を用いて、オリゴヌクレオチド記録タグを構築する。カルボジイミドカップリングを完了に至らせ、ペプチド間カップリングを制限するために、大幅に過剰なモル濃度の記録タグを使用して、溶液中で記録タグをペプチドとカップリングする。あるいは、5’歪みアルキン(DBCO-dT)を用いてオリゴヌクレオチドを構築し、アジド誘導体化ペプチドと(ペプチドのC末端とカップリングするアジド-PEG-アミンおよびカルボジイミドにより)カップリングし、そしてアルデヒド反応性HyNicヒドラジンビーズとカップリングする。この目的のために、記録タグオリゴヌクレオチドを、内部アルデヒドホルミルインドール(Trilink)基で容易に標識することができる。あるいは、C末端アミンとカップリングするのではなく、その代わりに、記録タグを内部リシン残基と(例えば、Lys-C消化の後に、またはその代わりにGlu-C消化の後に)カップリングすることができる。1つの手法では、これは、NHS-アジド(または、NHS-PEG-アジド)基を用いてリシンアミンを活性化し、その後5’アミン標識記録タグとカップリングすることにより、達成することができる。別の手法では、5’アミン標識記録タグを、DSSなどの過剰なNHSホモ二機能性架橋試薬と反応させて、5’NHS活性化記録タグを創出することができる。この5’NHS活性化記録タグをペプチドのリシン残基のε-アミノ基と直接カップリングすることができる。
(実施例4)
ペプチドのアミノ酸の部位特異的標識
アミノ酸を、DNAタグで、直接または間接的に、どちらかで、部位選択的に修飾することができる。直接標識の場合、部位選択的化学でDNAタグを活性化することができ、または代替的に間接的標識の場合、ヘテロ二機能性化学を使用して特異的アミノ酸反応性部分をユニバーサルクリック化学に変換することができ、後にこれにDNAタグを付着させることができる(Lundblad 2014)。一例として、5つの異なるアミノ酸を部位選択的に標識する例を記載する - タンパク質またはペプチドのアミノ酸の5つの異なる例を、活性化DNAタグで直接修飾することができ(ヘテロ二機能性アミノ酸部位特異的試薬での活性化を使用する)、またはDNAタグの同種クリック部分を付着させるために後に使用されるクリック部分でアミノ酸を部位特異的に標識するクリック化学ヘテロ二機能性試薬によって間接的に修飾することができる。
典型的なタンパク質入力は、0.1%RapiGest(商標)SF界面活性剤および5mM TCEPを含む50μlの適切な水性緩衝液中に1μgのタンパク質を含む。RapiGest(商標)SDは、標識または消化を向上させるためにタンパク質をポリペプチドへと変性させるための酸分解性界面活性剤として有用である。以下のアミノ酸標識戦略を使用することができる:マレイミド化学を使用したシステイン---200μMのスルホ-SMCC活性化DNAタグを使用して、システインを、100mM MES緩衝液(pH6.5)+1%TX-100中で1時間、部位特異的に標識する;NHS化学を使用したリシン---200μMのDSSまたはBS活性化DNAタグを使用して、溶液相タンパク質またはビーズ結合ペプチドのリシンを、室温にて1時間、ホウ酸緩衝液(50mM、pH8.5)+1%TX-100中で部位特異的に標識する;チロシンは、4-フェニル-3H-1,2,4-トリアゾリン-3,5(4H)-ジオン(PTAD)で修飾する;またはジアゾニウム化学---ジアゾニウム化学の場合、DNAタグを、EDCおよび4-カルボキシルベンゼンジアゾニウムテトラフルオロボレート(Aikon International、China)で活性化する。タンパク質またはビーズ結合ペプチドを、ホウ酸緩衝液(50mM、pH8.5)+1%TX-100中で、200μMのジアゾニウム誘導体化DNAタグと共に1時間氷上にてインキュベートすることにより、チロシンとのジアゾ連結を創出する(Nguyen、Caoら、2015年)。EDC化学を使用してアスパラテート/グルタメートを修飾する---アミン標識DNAタグを、pH6.5のMES中でビーズ結合ペプチドおよび100mM EDC/50mMイミダゾールと共に、室温で1時間にわたってインキュベートする(Basleら、2010年、Chem. Biol.、17巻:213~227頁)。標識の後、過剰な活性化DNAタグを、C4レジンZipTips(Millipore)からのタンパク結合溶出を使用して除去する。溶出したタンパク質を、1×PBS緩衝液で50μlにする。
(実施例5)
歪みアルキン記録タグ標識ペプチドのアジド活性化ビーズへの固定化
市販のアミンDynabeads(登録商標)M-270を、アジドPEG NHSエステルヘテロ二機能性リンカー(JenKem Technology、Tx)と反応させることにより、アジド誘導体化Dynabeads(登録商標)M-270ビーズを生成する。さらに、メトキシまたはヒドロキシルPEG NHSエステルと適切な比で混合することにより、アジドの表面密度をタイトレーションすることができる。所与のペプチド試料毎に、1~2mgのアジド誘導体化Dynabeads(登録商標)M-270ビーズ(約1.3×10個のビーズ)を、100μlのホウ酸緩衝液(50mMホウ酸ナトリウム、pH8.5)で希釈し、1ngの記録タグペプチドを添加し、23~37℃で1時間インキュベートする。200μlのホウ酸緩衝液で3回洗浄する。
(実施例6)
ホルミルインドール反応性HyNicビーズの創出
アミンビーズのHyNic誘導体化により、ホルミルインドール反応性ビーズを創出する。20mgのDynabeads(登録商標)M-270アミンビーズ(2.8μm)のアリコートを、200μlのホウ酸緩衝液に懸濁する。短時間の超音波処理後、1~2mgのスルホ-S-HyNic(スクシンイミジル6-ヒドラジノニコチネートアセトンヒドラゾン、SANH)(カタログ#S-1002、Solulink、San Diego)を添加し、反応混合物を室温で1時間にわたって振とうする。その後、ビーズを、ホウ酸緩衝液で2回およびクエン酸緩衝液(200mMクエン酸ナトリウム)で1回洗浄する。ビーズを、終濃度が10mg/mlになるようにクエン酸緩衝液に懸濁する。
(実施例7)
記録タグホルミルインドール(formlindole)標識ペプチドの活性化ビーズへの固定化
1~2mgのHyNic活性化Dynabeads(登録商標)M-270ビーズのアリコート(約1.3×10個ビーズ)を、50mMアニリンで補完された100μlのクエン酸緩衝液で希釈し、約1ngの記録タグペプチドコンジュゲートを添加し、37℃で1時間にわたってインキュベートする。ビーズを、200μlのクエン酸緩衝液で3回洗浄し、100μlのホウ酸緩衝液に再懸濁した。
(実施例8)
オリゴヌクレオチドモデル系-コーディングタグの識別情報をサイクル様式で記録タグへと移行させることによる結合性物質履歴の記録
核酸コーディングタグおよび記録タグの場合、標準的核酸酵素学を使用したライゲーションまたはプライマー伸長により、結合されている結合性物質のコーディングタグから近位の記録タグへと、情報を移行させることができる。これは、結合性物質標的を表す5’部分および記録タグを表す3’部分を有するオリゴヌクレオチドで構成される単純なモデル系で実証することができる。オリゴヌクレオチドの内部部位を、dT-アルキン修飾(DBCO-dT、Glen Research)によるクリック化学を使用して固定化することができる。図24Aに示されている例では、固定化されたオリゴヌクレオチド(AB標的)は、同種オリゴヌクレオチド「結合性物質」であるAオリゴおよびBオリゴが結合することができる、AおよびBと標識されている2つの標的結合領域を含む。AオリゴおよびBオリゴヌクレオチドは、共通スペーサー(Sp)を介して記録タグと相互作用して、プライマー伸長(またはライゲーション)を開始するコーディングタグ(配列および長さが異なる)に連結されている。Spの長さは、結合性物質結合中の非特異的相互作用を最小限に抑えるために、短く(例えば、6~9塩基)しておくべきである。この特定の例では、コーディングタグの長さは、「A」オリゴ結合事象(10塩基エンコーダー配列)と「B」オリゴ結合事象(20塩基エンコーダー配列)がゲル解析で容易に区別されるように設計されている。
PAGEゲルを単に解析することにより、AまたはBコーディングタグ移行の効率を測定することが可能であり、実験パラメーターの容易な最適化が可能である。AB標的配列に加えて、CおよびDが、AおよびBと相互作用しない異なるハイブリダイゼーション配列であることを除いて、同様のオリゴヌクレオチドCD標的配列が用いられる(例えば図24Bを参照されたい)。さらに、CおよびDは、それぞれ30塩基DNAコードおよび40塩基DNAコードを含む、異なる配列および長さのコーディングタグを含む。第2の標的配列CDの目的は、ABおよびCD標的分子間の交差相互作用を評価することである。特定のハイブリダイゼーションを考慮すると、AB標的に結合されたオリゴに接続されているAまたはBコーディングタグ間に分子間交差が生じない限り、CD標的の伸長記録タグが、AまたはBコーディングタグ情報を含むことはない。同様に、AB標的の伸長記録タグは、CまたはDコーディングタグ情報を含むはずがない。ABおよびCD標的が物理的近傍に接近している状況では(つまり<50nm)、掛け合い応答が起こる可能性が高い。したがって、表面の標的巨大分子を適切に離間させることが重要である。
このオリゴヌクレオチドモデル系は、結合性物質履歴の記録能力の十分な特徴付けを可能にする。図25は、プライマー伸長ではなくライゲーションによる情報移行を示す。まずゲルで最適化した後、種々の結合およびアッセイプロトコールを実施し、配列決定により評価する。一意の分子識別子(UMI)配列は、計数のために使用され、単一の巨大分子に由来するリードの識別を可能にし、元の試料中の総合的で全体的な巨大分子複雑性の尺度を提供する。例示的な履歴結合プロトコールとしては、A-B-C-B-A、A-B-A-A-B-A、A-B-C-D-A-Cなどが挙げられる:得られる最終産物は、それぞれ、UMI-Sp-A-Sp-B-Sp-B-Sp-A-Sp+UMI-Sp-C-Sp;UMI-Sp-A-Sp-B-Sp-A-Sp-A-Sp-B-Sp-A;UMI-A-Sp-B-Sp-A+UMI-Sp-C-Sp-D-Sp-C-Spと読み取られるはずである。この解析の結果は、さらなる最適化を可能にする。
(実施例9)
オリゴヌクレオチド-ペプチドモデル系-コーディングタグの識別情報をサイクル様式で記録タグへと移行させることによる結合性物質履歴の記録
オリゴヌクレオチドモデル系を検証した後、例示的な標的オリゴヌクレオチド配列の5’末端にペプチドエピトープタグをコンジュゲートすることにより、オリゴヌクレオチド系からペプチドモデル系を構築する(例えば図26Aおよび26Bを参照されたい)。例示的なペプチドエピトープタグとしては以下のものが挙げられる:FLAG(DYKDDDDK)(配列番号171)、V5(GKPIPNPLLGLDST)(配列番号172)、c-Myc(EQKLISEEDL)(配列番号173)、HA(YPYDVPDYA)(配列番号174)、V5(GKPIPNPLLGLDST)(配列番号175)、StrepTag II(NWSHPQFEK)(配列番号176)など。ペプチドエピトープタグをオリゴヌクレオチドにカップリングするための、任意選択のCys-Ser-Glyリンカーが含まれていてもよい。実施例7のABオリゴヌクレオチド鋳型を、A_オリゴヌクレオチド-cMycペプチド構築物に取り替え、実施例7のCDオリゴヌクレオチド鋳型を、C_オリゴヌクレオチド-HAペプチド構築物に取り替える(例えば図26を参照されたい)。また、A_オリゴヌクレオチド-cMycペプチド構築物は、CSGリンカーおよびN末端ホスホチロシンを含む。同様に、同種ペプチド結合性物質であるcMyc抗体およびHA抗体を、それぞれBオリゴヌクレオチドコーディングタグおよびDオリゴヌクレオチドコーディングタグでタグ化する。ホスホチロシン特異的抗体は、別の「E」コーディングタグでタグ化する。このように、ペプチドモデル系は、オリゴヌクレオチド系と対応しており、オリゴ結合および抗体結合の両方が、このモデル系で試験される。
抗c-myc抗体(2G8D5、マウスモノクローナル、GenScript)、抗HA抗体(5E11D8、マウスモノクローナル、GenScript)、strep-タグII抗体(5A9F9、マウスモノクローナル、GenScript)、または抗FLAG抗体(5AE85、マウスモノクローナル、GenScript)を使用した固定化DNAペプチド構築物の抗体染色を、0.1~1μg/mlの1×PBST(PBS+0.1%Tween(登録商標)20)を使用して実施する。インキュベーションを、典型的には室温で30分間実施する。また、1×PBST中1%のPVPを使用した標準的プレブロッキングおよび染色後洗浄を実施する。抗体脱染色は、高濃度塩(1M NaCl)および低pH(グリシン、pH2.5)または高pH(トリエチルアミン、pH11.5)のいずれかで洗浄することにより効果的に達成される。
標的オリゴヌクレオチドは、アジドビーズに付着させるための内部アルキン標識を含み、5’末端は、Williamsら(2010年、Curr Protoc Nucleic Acid Chem. 第4章:4.41項)に記載されているように、ペプチドのC末端システインにSMCC媒介性付着させるためのアミノ基を含む。あるいは、標準的カルボジイミドカップリングを、オリゴヌクレオチドおよびペプチドのコンジュゲーション反応に使用する(Luら、2010年、Bioconjug. Chem.、21巻:187~202頁)。この場合、過剰なオリゴを使用して、カルボジイミド反応を駆動し、ペプチド間カップリングを最小限に抑える。コンジュゲーション後、PAGEゲルから切除し、溶出することにより、最終産物を精製する。
(実施例10)
DNA/PNAコーディングタグ相補体を記録タグにライゲーションさせることによるコーディングタグ移行
コーディングタグを、ライゲーションにより直接的または間接的のいずれかで記録タグに移行させて、伸長記録タグを生成する。一実行例では、アニーリングされたコーディングタグの相補体を、記録タグにライゲーションさせる(例えば図25を参照されたい)。このコーディングタグ相補体は、核酸(DNAまたはRNA)であってもよく、ペプチド核酸(PNA)であってもよく、または成長中の記録タグにライゲーションすることが可能ないくつかの他のコードディング分子であってもよい。ライゲーションは、DNAおよびRNAの場合、標準的なATP依存性およびNADH依存性リガーゼを使用して酵素的であってもよく、またはライゲーションは、DNA/RNAおよび特にペプチド核酸PNAの両方の場合、化学媒介性であってもよい。
DNAの酵素的ライゲーションの場合、アニーリングされたコーディングタグは、記録タグの3’ヒドロキシルとライゲーションするために、5’リン酸塩を必要とする。例示的な酵素的ライゲーション条件は、以下の通りである(Gunderson、Huangら、1998年)。標準的T4 DNAライゲーション反応は、50mM Tris-HCl(pH7.8)、10mM MgCl2、10mM DTT、1mM ATP、50μg/ml BSA、100mM NaCl、0.1%TX-100、および2.0U/μl T4 DNAリガーゼ(New England Biolabs)を含む。E.coli DNAリガーゼ反応は、40mM Tris-HCl(pH8.0)、10mM MgCl、5mM DTT、0.5mM NADH、50μg/ml BSA、0.1%TX-100、および0.025U/μl E.coli DNAリガーゼ(Amersham)を含む。Taq DNAライゲーション反応は、20mM Tris-HCl(pH7.6)、25mM酢酸カリウム、10mM酢酸マグネシウム、10mM DTT、1mM NADH、50μg/ml BSA、0.1%Triton X-100、10%PEG、100mM NaCl、および1.0U/μl Taq DNAリガーゼ(New England Biolabs)を含む。T4およびE.coli DNAリガーゼ反応は、室温で1時間にわたって実施し、Taq DNAリガーゼ反応は、40℃で1時間にわたって実施する。
DNA/PNAコーディングタグ移行の場合、鋳型化DNA/PNAの化学的ライゲーションのいくつかの方法を用いることができる。そうした方法としては、標準的な化学的ライゲーションおよびクリック化学手法が挙げられる。鋳型DNAライゲーションの例示的な化学的ライゲーション条件は、以下の通りである(Gunderson、Huangら、1998年):鋳型3’リン酸塩リポータータグと5’リン酸塩コーディングタグとのライゲーションは、50mM 2-[N-モルホリノ]エタンスルホン酸(MES)(KOHでpH6.0)、10mM MgCl、0.001%SDS、新しく調製した200mM EDC、50mMイミダゾール(HClでpH6.0)または50mM HOBt(HClでpH6.0)、および3.0~4.0M TMACl(Sigma)を含む反応中で、室温にて1時間以内に生じる。
PNAの鋳型依存性ライゲーションの例示的な条件は、NH-PNA-CHOポリマー(例えば、コーディングタグ相補体および伸長記録タグ)のライゲーションを含み、Brudnoら(Brudno, Birnbaum et al. 2010)によって記載されている。PNAは、5’アミン等価物および3’アルデヒド等価物を有しており、化学的ライゲーションにより2つの部分がカップリングされてシッフ塩基が創出され、このシッフ塩基を、その後、シアノ水素化ホウ素ナトリウムで還元する。このカップリングの典型的な反応条件は、100mM TAPS(pH8.5)、80mM NaCl、および80mMシアノ水素化ホウ素ナトリウム、室温で60分間である。5’アミノ末端1,2-アミノチオール修飾および3’C末端チオエステル修飾を含有する機能化PNAを使用するネイティブ化学的ライゲーションの例示的な条件は、Roloffら(2014,Methods Mol. Biol. 1050: 131- 141)によって記載されている。他のN末端およびC末端PNA部分もライゲーションに使用することができる。別の例は、クリック化学を使用するPNAの化学的ライゲーションを含む。Pengらの手法(2010,European J. Org.Chem.2010: 4194-4197)を使用して、PNAを、5’アジドおよび3’アルキンで誘導体化し、クリック化学を使用してライゲーションすることができる。「クリック」化学ライゲーションの例示的な反応条件は、10mMリン酸カリウム緩衝液と100mM KClと5mM THPTA(トリス-ヒドロキシプロピルトリゾリルアミン)と0.5mM CuSOと2.5mMアスコルビン酸Naとを含有する100μlの反応ミックス中の鋳型化PNA-PNAと、1~2mgビーズとである。化学的ライゲーション反応を室温で1時間インキュベートする。PNAライゲーションの他の例示的な方法は、Sakuraiら(Sakurai,Snyder et al. 2005)によって記載されている。
(実施例11)
DNAへのPNA変換
PNA鋳型にアニーリングされたDNAオリゴヌクレオチドのクリック化学媒介性重合を使用して、PNAをDNAへと変換する。DNAオリゴは、DNAポリメラーゼにより複製することが可能なヌクレオチド間トリアゾール連結を創出するために、反応性5’アジドおよび3’アルキンを含む(El-Sagheerら、2011年、Proc. Natl. Acad. Sci. USA 108巻:11338~11343頁)。PNAのあらゆる考え得るコーディングタグに相補的なDNAオリゴの完全なセット(10nM、1×ハイブリダイゼーション緩衝液中:10mM Na-ホウ酸塩(pH8.5)、0.2M NaCl)を、固相に結合されているPNA分子と共に30分間インキュベートする(23~50℃)。アニーリングの後、固相に結合されているPNA-DNA構築物を、アスコルビン酸ナトリウム緩衝液(10mMアスコルビン酸ナトリウム、200mM NaCl)で1回洗浄する。「クリック化学」反応条件は、以下の通りである:ビーズ上のPNA-DNAを、新たなアスコルビン酸ナトリウム緩衝液中でインキュベートし、10mM THPTA+2mM CuSOのミックスと1:1で組み合わせて、室温で1時間インキュベートする。その後、ビーズを、ハイブリダイゼーション緩衝液で1回、およびPCR緩衝液で2回洗浄する。化学的ライゲーションの後、得られたライゲーションDNA産物を、El-Sagheerら(2011年、Proc. Natl. Acad. Sci. USA 108巻:11338~11343頁)により記載されているような条件下でPCRにより増幅する。
(実施例12)
核酸記録およびコーディングタグと適合性の穏やかなN末端エドマン分解
N末端エドマン分解とDNAエンコーディングとの適合性により、この手法のペプチド配列決定への応用が可能になる。無水TFAを利用するN末端エドマン分解の標準的条件では、DNAが破壊される。しかしながら、この効果は、より穏やかな切断条件の開発、および耐酸性がより高い修飾DNAの開発により緩和される。フェニルチオカルバモイル(PTC)-ペプチドの切断の最適化と、切断条件下でのDNA/PNAコード付きライブラリーの安定性の測定との組合せを使用して、N末端エドマン分解のより穏やかな条件を開発する。さらに、低pHで脱プリンを低減させる7-デアザプリンなどの塩基修飾、および脱ピリミジン化を低減させる5’メチル修飾シトシンを使用することにより、ネイティブDNAを酸加水分解に対して安定させることができる(Schneider and Chait, 1995, Nucleic Acids Res. 23: 1570-1575)。チミンが酸断片化に対して最も安定性の高い塩基であることを考えると、Tリッチなコーディングタグも有用であり得る。穏やかなN末端エドマン分解の条件は、無水TFA切断の代わりに、Barrettら(その全体が参照により組み込まれる、1985,Tetrahedron Lett. 26:4375-4378)により記載されたような、60℃でアセトニトリル中の酢酸トリエチルアミンを使用する穏やかな10分の塩基切断を用いる。これらの穏やかな条件は、ほとんどのタイプのDNAレポートおよびコーディングタグと適合性である。代案として、PNAは完全に酸安定性であるため、PNAをコーディングタグに使用する(Rayand Norden, 2000, FASEB J. 14:1041-1060)。上述の手法に加えて、エドマン標識と切断の両方に耐えぬくDNAバーコードをスクリーニングにより実験的に選択することができる。
NTAA結合物質の同一性をコードするためにDNAコーディングタグ/記録タグを使用することと、穏やかなN末端エドマン分解反応を実施することとの適合性を、以下のアッセイを使用して実証する。抗ホスホチロシンおよび抗cMyc抗体の両方を使用して、モデルペプチドを読み取る。単一のエドマン分解ステップを使用した、C-MycおよびN末端ホスホチロシン検出、コーディングタグ書き込み、およびN末端ホスホチロシンの除去。このステップの後、ペプチドを、抗ホスホチロシンおよび抗cMyc抗体で再び染色する。N末端分解に対する記録タグの安定性を、qPCRにより評価する。ホスホチロシンの効果的な除去は、配列決定、qPCR、またはゲル電気泳動により解析して、最終記録タグ配列にE-オリゴヌクレオチドコーディングタグ情報が存在しないことにより示される。
(実施例13)
コンパートメントタグ付きビーズの調製。
コンパートメントタグ付きビーズを調製するには、ホスホラミダイト合成またはスプリット・アンド・プールライゲーションのいずれかが使用されるスプリット・アンド・プール合成手法を使用して、ビーズに固定化されているオリゴヌクレオチドにバーコードを組み込む。コンパートメントタグは、コンパートメントタグがそれに接合される各ペプチドまたはタンパク質分子を一義的に標識するための一意の分子識別子(UMI)をさらに含む。例示的なコンパートメントタグ配列は、以下の通りである:5’-NH-GCGCAATCAG-XXXXXXXXXXXX-NNNNN-TGCAAGGAT-3’(配列番号177)。XXXXXXXXXXXX(配列番号178)バーコード配列は、スプリット-プールオンビーズ合成により生成されるビーズ毎の核酸塩基配列の固定集団であり、この固定配列は、ビーズ毎に異なる。NNNNN(配列番号179)配列は、その後それに接合されるペプチド分子の一意の分子識別子(UMI)としての役目を果たすように、ビーズ内で無作為化される。バーコード配列は、Macoskoら(その全体が参照により組み込まれる、2015年、Cell、161巻:1202~1214頁)により記載されているようなスプリット・アンド・プール手法を使用して、ビーズ上で合成することができる。UMI配列は、縮重塩基混合物(各カップリングステップに存在する4つのホスホラミダイト塩基すべての混合物)を使用して、オリゴヌクレオチドを合成することにより創出することができる。5’-NHを、スクシンイミジル4-(N-マレイミドメチル)シクロヘキサン-1-カルボキシレート(SMCC)およびN末端からC末端への配列「CGGSSGSNHV」(配列番号180)を有するシステイン含有ブテラーゼIペプチド基質で活性化し、Williamsら(2010年、Curr Protoc Nucleic Acid Chem. 第4章:4.41項)により記載されているような修飾プロトコールを使用して、SMCC活性化コンパートメントタグ付きビーズにカップリングする。すなわち、200μlの磁気ビーズ(10mg/ml)を、1.5mlのEppendorfチューブに入れる。1mlのカップリング緩衝液(5mM EDTA、0.01%Tween(登録商標)20、pH7.4を有する100mM KHPO緩衝液、pH7.2)をチューブに添加し、短時間ボルテックスする。新たに調製した40μlのスルホ-SMCC(DMSO中50mg/ml、ThermoFisher)を、磁気ビーズに添加し、混合する。反応を、室温にて1時間、ロータリーミキサーでインキュベートする。インキュベーション後、磁石でビーズを上清から分離し、500μlのカップリング緩衝液で3回洗浄する。ビーズを、400μlのカップリング緩衝液に再懸濁する。1mLのCGGSSGSNHV(配列番号180)ペプチドを磁気ビーズに添加する(TCEP還元(5mM)および氷冷アセトン沈殿後、カップリング緩衝液中1mg/mL)。反応を、室温にて2時間、ロータリーミキサーでインキュベートする。反応を、カップリング緩衝液で1回洗浄する。400μlのクエンチング緩衝液(10mg/mLのメルカプトコハク酸、pH7.4を有する100mM KHPO緩衝液、pH7.2)を反応混合物に添加し、ロータリーミキサーで2時間インキュベートする。反応混合物を、カップリング緩衝液で3回洗浄する。得られたビーズを、保管緩衝液(0.02%NaN、0.01%Tween(登録商標)20、pH7.4を含む10mM KHPO緩衝液、pH7.2)に再懸濁し、4℃で保管する。
(実施例14)
封入ビーズおよびタンパク質の生成
コンパートメントタグ付きビーズおよびタンパク質を、エンドプロテアーゼAspN(Endo AspN)などの亜鉛メタロ-エンドペプチダーゼ、任意選択の光ケージ化Znキレート剤(例えば、ZincCleav I)、および遺伝子操作された耐熱性ブテラーゼIホモログ(Bandara、Kennedyら、2009年、Bandara、Walshら、2011年、Cao、Nguyenら、2015年)と組み合わせる。実施例12のコンパートメントタグ付きビーズをタンパク質と混合し、T字路型マイクロ流体または流動フォーカスデバイス(例えば図21を参照されたい)で乳化する。二水流構成では、一方の流動中のタンパク質およびZn2+を、他方の流動からのメタロ-エンドペプチダーゼと組み合わせて、液滴形成時に直ちに消化を開始させることができる。一流動構成では、すべての試薬を予め混合し、一緒に乳化する。これには、任意選択の光ケージ化Znキレート剤(例えば、ZincCleav I)を使用して、液滴形成後に、UV光への曝露によりタンパク質消化を開始させることが必要である。濃度および流動条件は、1液滴当たりのビーズが平均で1つ未満になるように調整する。最適化された実験では、10個のフェムト液滴を、液滴の約10%がビーズを含有する含有率で製作することができる(Shimら、2013年、ACS Nano、7巻:5955~5964頁)。一流動手法では、液滴を形成した後、エマルジョンをUV-365nmの光に曝露して光ケージ化Zn2+を放出させ、Endo AspNプロテアーゼを活性化することにより、プロテアーゼを活性化する。エマルジョンを、37℃で1時間インキュベートして、タンパク質をペプチドへと消化する。消化した後、エマルジョンを80℃で15分間加熱することにより、Endo AspNを不活化する。二流動調合では、2つの流動の組み合わせ中に、Zn2+を液滴内に導入する。この場合、Endo AspNは、キレート剤がUV光への曝露時に活性化される光活性化Zn2+ケージ分子を使用することにより、または2-アルキルマロン酸もしくはEDTA-MOなどの両親媒性Zn2+キレート作用剤を、油相に添加することにより不活化することができる。両親媒性EDTA分子の例としては、EDTA-MO、EDTA-BO、EDTA-BP、DPTA-MO、DPTA-BO、DPTA-BPなど(Ojha、Singhら 2010年、Moghaddam、de Campoら 2012年)が挙げられる。また、エマルジョン油に両親媒性の酸または塩基を添加することにより液滴のpHを変更することを含む、他のモダリティを使用して、液滴内部の反応を制御することができる。例えば、液滴pHは、水/油に可溶性である酢酸を使用して低下させることができる。フルオロ-エマルジョンへの酢酸の添加は、酢酸分子が両親媒性の性質を持つため、液滴コンパートメント内のpHの低下に結び付く(Mashaghiおよびvan Oijen、2015年、Sci Rep、5巻:11837頁)。同様に、塩基であるプロピルアミンを添加すると、液滴内部はアルカリ化される。同様の手法を、油/水に可溶性の酸化還元試薬、還元剤、キレート剤、および触媒などの他のタイプの両親媒性分子に使用することができる。
コンパートメント化されたタンパク質のペプチドへの消化の後、ブテラーゼIまたは化学的ライゲーション(例えば、アルデヒド-アミノなど)を使用して、ペプチドを、ビーズ上のコンパートメントタグにライゲーションする(オリゴヌクレオチドペプチドバーコードキメラ)(例えば、図16および図22Aを参照されたい)。必要に応じた手法では、オリゴ-チオデプシペプチド「化学的基質」を用いてブテラーゼIライゲーションを不可逆的にする(Nguyen, Cao et al. 2015)。ライゲーションの後、エマルジョンを「破砕」し、コンパートメントタグ付きペプチド構築物が固定化されているビーズをバルクで収集するか、またはコンパートメントタグ付きペプチドをビーズから切断し、バルクで収集する。ビーズに固定化されたコンパートメントタグ付きペプチドが記録タグを含む場合、これらのビーズを、本明細書に記載の核酸エンコーディングに基づくペプチド解析法に直接使用することができる。対照的に、コンパートメントタグ付きペプチドをビーズ基材から切断する場合には、コーディングタグ付き結合性物質を用いるその後の結合サイクルおよび本明細書に記載の配列決定解析のために、コンパートメントタグ付きペプチドのC末端へのコンジュゲーションによって記録タグをコンパートメントタグ付きペプチドに付随させ、これらを固体支持体に固定化する。コンパートメントタグ付きペプチドに記録タグを付随させることは、三機能性リンカー分子を使用して達成することができる。サイクルシーケンシング解析のためにコンパートメントタグ付きペプチドと付随する記録タグを固体支持体に固定化した後、プライマー伸長またはライゲーションを使用してコンパートメント情報を付随する記録タグに移行させる(例えば、図22Bを参照されたい)。コンパートメントタグ情報を記録タグに移行させた後、最初のペプチド消化で使用したものと同じ酵素を使用してコンパートメントタグをペプチドから切断することができる(例えば、図22Bを参照されたい)。これにより、ペプチドの元のN末端が回復されるため、本明細書に記載のN末端分解ペプチド配列決定法が可能になる。
(実施例15)
3プライマー融合エマルジョンPCRにより、アミノ酸特異的コーディングタグで共有結合的に修飾されたペプチドの記録タグを付随させることによるジタグ生成
コンパートメントタグと分子UMIとで構成されている記録タグを有するペプチドを、コーディングタグ部位特異的化学標識で化学的に修飾する。コーディングタグは、修飾ペプチド内の所与のタイプのアミノ酸の数を計数することを可能にするために、UMIも含有する。TysonおよびArmor(Tyson and Armour 2012)の改良プロトコールを使用して、エマルジョンPCRを、1×PHUSION(商標)GC反応緩衝液(Thermo Fisher Scientific)と、200μMの各dNTP(New England Biolabs)と、1μMのプライマーU1と、1μMのプライマーU2trと、25nMのプライマーSpと、14単位のPHUSION(商標)高フィデリティーDNAポリメラーゼ(Thermo Fisher Scientific)とを含有する100μlの総水性体積で提供する。10μlの水性相を、TurnerおよびHurles(2009,Nat. Protoc. 4:1771-1783)によって以前に記載されたように、2mlクライオバイアル中の軽油(Sigma)に溶解した200μlの油相(4.5% vol/vol)Span80、0.4% vol/volのTween(登録商標)80、および0.05%Triton X-100に、合計5分間にわたって1000rpmで撹拌しながら、5~10秒ごとに添加する。得られたエマルジョンの平均液滴サイズは、約5ミクロンだった。T字路および流動フォーカスの使用などのエマルジョンを生成するための他の方法も用いることができる(Brouzes,Medkova et al. 2009)。エマルジョン生成後、100μlの水性/油混合物を0.5mlのPCRチューブに移し、第1のラウンドの増幅を、以下の条件で実施する:98℃で30秒間;98℃で10秒間、70℃で30秒間、および72℃で30秒間を40サイクル;その後、72℃で5分間の伸長。第2ラウンドの増幅反応を、以下の条件で実施する:98℃で30秒間;98℃で10秒間、55℃で30秒間、および72℃で30秒間を40サイクル;その後、4℃で維持。PCRの最終サイクル後できるだけ早く、200μlのヘキサン(Sigma)をPCRチューブに直接添加し、20秒間ボルテックスし、13,000gで3分間遠心分離することにより、エマルジョンを崩壊させる。
(実施例16)
伸長記録タグ、伸長コーディングタグ、またはジタグ構築物の配列決定
記録タグまたはコーディングタグのスペーサー(Sp)またはユニバーサルプライミング部位は、配列の本体に3つの塩基のみ(例えばA、C、およびT)および配列の5’末端に第4の塩基(例えば、G)を使用して設計することができる。合成による配列決定(SBS)の場合、これにより、標準的非発光性(dark)(未標識および非終端化)ヌクレオチド(dATP、dGTP、およびdTTP)および単一ffC色素標識可逆的ターミネーター(例えば、完全に機能的なシトシン三リン酸塩)のミックスを使用して、スペーサー配列全体にわたって非発光性塩基を迅速に組み込むことが可能になる。このようにすると、関連するエンコーダー配列、一意の分子識別子、コンパートメントタグ、伸長リポータータグの結合サイクル配列、伸長コーディングタグ、またはジタグのみがSBS配列決定され、無関連のスペーサーまたはユニバーサルプライミング配列は「スキップ」される。スペーサーの塩基および配列の5’末端の第4の塩基の同一性は、変更してもよく、上記の同一性は、例示のために提供されているに過ぎない。
(実施例17)
タンパク質ライセートの調製。
様々な試料タイプからタンパク質ライセートを製作するための多種多様なプロトコールが、当技術分野で公知である。プロトコールの大抵の差異は、細胞型、およびライセート中の抽出されたタンパク質が未変性状態で解析されるかまたは変性状態で解析されるかによる。NGPAアッセイの場合、ネイティブなコンフォメーションのタンパク質または変性タンパク質のどちらかを固体基材に固定化することができる(例えば、図32を参照されたい)。さらに、ネイティブなタンパク質を固定化した後、基材の表面に固定化されたそれらのタンパク質を変性させることができる。変性タンパク質を用いる利点は2つある。まず第1に、多数の抗体試薬は、線形エピトープ(例えば、ウエスタンブロットAb)に結合し、変性タンパク質は、線形エピトープによりよく接近できるようにする。第2に、NGPAアッセイワークフローは、変性タンパク質を使用すると単純化される。固定化されているタンパク質が既に変性されているため、アニーリングされたコーディングタグを伸長記録タグからアルカリ性(例えば、0.1N NaOH)剥離条件を使用して剥離することができるからである。これは、結合事象および情報移行の後にアニーリングされているコーディングタグを酵素的に除去する必要がある、ネイティブなコンフォメーションのタンパク質を含むアッセイを使用するアニーリングされているコーディングタグの除去とは対照的である。
未変性タンパク質溶解緩衝液の例としては、50mm HEPES(pH7.4)、150mM NaCl、1%Triton X-100、1.5mM MgCl2、10%グリセロールで構成されるRPPA緩衝液;およびM-PER哺乳動物タンパク質抽出試薬(Thermo Fisher)などの市販の緩衝液が挙げられる。変性溶解緩衝液は、50mm HEPES(pH8.)、1%SDSを含む。尿素(1M~3M)またはグアニジンHCl(1~8M)の添加も、タンパク質試料の変性に使用することができる。溶解緩衝液の上記成分に加えて、一般的には、プロテアーゼおよびホスファターゼ阻害剤も含まれている。プロテアーゼ阻害剤および典型的な濃度の例としては、アプロチニン(aptrotinin)(2μg/ml)、ロイペプチン(5~10μg/ml)、ベンズアミジン(15μg/ml)、ペプスタチンA(1μg/ml)、PMSF(1mM)、EDTA(5mM)、およびEGTA(1mM)が挙げられる。ホスファターゼ阻害剤の例としては、Naピロリン酸塩(10mM)、フッ化ナトリウム(5~100mM)、およびオルトバナジン酸ナトリウム(1mM)が挙げられる。追加の添加剤としては、タンパク質試料からDNAを除去するためのDNAaseI、およびジスルフィド結合を還元するためのDTTなどの還元剤を挙げることができる。
組織培養細胞から調製される未変性タンパク質ライセートプロトコールの一例は、以下の通りである。接着細胞をトリプシン処理し(PBS中0.05%トリプシン-EDTA)、遠心分離(200gで5分間)により収集し、氷冷PBSで2回洗浄する。プロテアーゼ/ホスファターゼ阻害剤および添加剤(例えば、EDTA非含有完全阻害剤(Roche)およびPhosStop(Roche)で補完された氷冷M-PER哺乳動物抽出試薬(10細胞/100mm皿または150cmフラスコ当たり約1mL)を添加する。得られた細胞懸濁液を、4℃にて20分間にわたって回転振とう器でインキュベートし、その後、4℃にて20分間、約12,000rpm(細胞タイプに依存する)で遠心分離して、タンパク質上清を単離する。BCAアッセイを使用してタンパク質を定量化し、PBSに1mg/mlで再懸濁する。タンパク質ライセートは、直ちに使用してもよく、または液体窒素で瞬間凍結して、-80℃で保管してもよい。
HughsらのSP3プロトコールに基づく、組織培養細胞から調製される変性タンパク質ライセートプロトコールの一例は、以下の通りである:接着細胞をトリプシン処理し(PBS中の0.05%トリプシン-EDTA)、遠心分離(200gで5分間)により収集し、氷冷PBSで2回洗浄する。プロテアーゼ/ホスファターゼ阻害剤および添加剤(例えば、1×completeプロテアーゼ阻害剤カクテル(Roche))で補完された氷冷変性溶解緩衝液(10細胞/100mm皿または150cmフラスコ当たり約1mL)を添加する。得られた細胞懸濁液を、95℃で5分間インキュベートし、5分間氷上に置く。ベンゾナーゼヌクレアーゼ(500U/ml)をライセートに添加し、37℃で30分間インキュベートしてDNAおよびRNAを除去する。
ライセート100μl当たり5μLの200mM DTTを添加することによりタンパク質を還元し、45℃で30分間インキュベートする。タンパク質システイン基のアルキル化(alklylation)を、ライセート100μl当たり10μlの400mMヨードアセトアミドを添加することにより達成し、24°で30分間、暗所でインキュベートする。ライセート100μl当たり10μlの200mM DTTを添加することにより、反応をクエンチする。必要に応じて、ライセート100μl当たり2μlの酸無水物および100μlの1M Na2CO3(pH8.5)を添加することにより、タンパク質をアシル化する。室温で30分間インキュベートする。「in vivo」でアセチル化されたリシンを、アシル化によるリシン基の「in situ」ブロッキングと区別できるようにするために、無水酢酸ではなく、吉草酸無水物、安息香酸無水物、およびプロピオン酸無水物が推奨される(Sidoli,Yuan et al. 2015)。5mgのトリス(2-アミノエチル)アミン、ポリマー(Sigma)の添加、および室温で30分間のインキュベーションにより、反応をクエンチする。ポリマー樹脂を、0.45um酢酸セルロースSpin-Xチューブ(Corning)による2000gで1分間のライセートの遠心分離により除去する。BCAアッセイを使用してタンパク質を定量化し、PBSに1mg/mlで再懸濁する。
追加の例では、MWCO濾過デバイスがタンパク質の捕捉、アルキル化およびペプチダーゼ消化に使用される、Erdeらによって記載されたフィルター支援試料調製(FASP)プロトコール(Erde, Loo et al. 2014, Feist and Hummon 2015)を使用して、標識ペプチドを生成する。
(実施例18)
分配タグ付きペプチドの生成。
DNAタグ(必要に応じた試料バーコードおよび直交性付着部分を有する)を、標準的バイオコンジュゲーション法(Hermanson 2013)を使用して変性ポリペプチドのリシンのε-アミノ基を標識するために使用するか、またはその代わりにベンゾフェノンなどの光親和性標識(PAL)法(Li,Liu et al. 2013)を使用してポリペプチドに付着させる。ポリペプチドのリシン基をまたは無作為に(PALによって)CH基をDNAタグで標識し、アシル無水物でのアシル化によって未標識基をブロッキングした後、DNAタグで標識され、アシル化されたポリペプチドを、ユニバーサルプライミング配列とコンパートメントバーコードと必要に応じたUMIとそのポリペプチドに付着しているDNAタグの一部分に相補的なプライマー配列とを含むDNAオリゴヌクレオチドが付着しているコンパートメントビーズに、アニーリングさせる(例えば、図31を参照されたい)。複数のDNAハイブリダイゼーションタグには協同性があるため、単一のポリペプチド分子は、主に単一のビーズと相互作用し、それによって、同じコンパートメントバーコードをポリペプチド分子のすべてのDNAタグに書き込むことが可能になる。アニーリング後、ポリペプチド結合DNAタグは、アニーリングされたビーズ結合DNA配列のポリメラーゼ伸長反応をプライミングする。このようにして、コンパートメントバーコードおよび他の機能的エレメントが、結合ポリペプチドに付着しているDNAタグに書き込まれる。このステップの完了時には、複数の記録タグがポリペプチドに付着しており、記録タグは、共通スペーサー配列、バーコード配列(例えば、試料、画分、コンパートメント、空間など)、必要に応じたUMI、および他の機能的エレメントを有する。この標識ポリペプチドを、トリプシン、GluC、プロテイナーゼKなどの標準的エンドプロテアーゼを使用して、ペプチド断片に消化することができる。注:リシン標識ポリペプチドの消化にトリプシンを使用する場合、ポリペプチドは、Arg残基でのみ切断され、Lys残基では切断されない(Lys残基は標識されているため)。プロテアーゼ消化をビーズ上で直接行うこともでき、または標識ポリペプチドをバーコード付きビーズから除去した後に行うこともできる。
(実施例19)
モデル系のDNA記録タグ-ペプチドコンジュゲートの調製。
5’NH基、および後にビーズとカップリングする(mTet-PEG-Nヘテロ二機能性架橋剤によって、アルキン-dTをmテトラジン-dTに変換する)ための内部mテトラジン基を有する、記録タグオリゴヌクレオチドを合成する。オリゴヌクレオチドの5’NHを、Williamsら(Williams and Chaput 2010)によって記載されたように、LC-SMCC(ThermoFisher Scientific)などのNHS/マレイミドヘテロ二機能性架橋剤を使用してペプチドの反応性システインとカップリングする。詳細には、20nmolの5’NH標識オリゴヌクレオチドをエタノール沈殿させ、シリコーン処理チューブ内の180μlのリン酸カップリング緩衝液(0.1Mリン酸カリウム緩衝液、pH7.2)に再懸濁する。5mgのLC-SMCCを1mLのDMF(5mg/ml)に再懸濁する(アリコートで、-20で、保管する)。20μlのLC-SMCC(5mg/ml)のアリコートを180μlの再懸濁オリゴヌクレオチドに添加し、混合し、室温で1時間インキュベートする。混合物を2回エタノール沈殿させる。得られたマレイミド(malemide)誘導体化オリゴヌクレオチドを、200μlのリン酸カップリング緩衝液に再懸濁する。システイン残基を含有するペプチド(>95%純度、脱塩したもの)を1mg/ml(約0.5mM)でDMSOに再懸濁する。およそ50nmolのペプチド(100μl)を反応ミックスに添加し、室温で一晩インキュベートする。得られたDNA記録タグーペプチドコンジュゲートを、Williamら(Williamsand Chaput 2010)によって記載されたようなネイティブPAGEを使用して精製する。コンジュゲートを、シリコーン処理チューブ内のリン酸カップリング緩衝液に100uM濃度で再懸濁する。
(実施例20)
DNA-ペプチド固定化用の基材の開発。
一部の実験では、M-270アミン磁気Dynabeadsを、アルキンまたはメチルテトラジン標識オリゴ-ペプチドコンジュゲートとそれぞれカップリングすることができるアジド誘導体化ビーズまたはTCO誘導体化ビーズのいずれかに変換することにより、クリック化学固定化に好適な磁気ビーズを創出する(例えば、図29D~E;図30D~Eを参照されたい)。つまり、10mgのM-270ビーズを500μlのホウ酸緩衝液(100mMホウ酸ナトリウム、pH8.5)で洗浄し、500μlのホウ酸緩衝液(100mMホウ酸ナトリウム、pH8.5)に再懸濁する。TCO-PEG(12-120)-NHS(Nanocs)とメチル-PEG(12-120)-NHSの混合物を1mMでDMSOに再懸濁し、M-270アミンビーズと共に室温で一晩インキュベートする。メチルPEGのTCO PEGに対する比をタイトレーションして、ビーズ上の最終TCO表面密度を、1um当たり<100個のTCO部分が存在するように調整する(例えば、図31E、図34を参照されたい)。DMF中の0.1M無水酢酸と0.1M DIEAの混合物(ビーズ10mgに500μl)を用いて、室温で2時間、未反応アミン基をキャッピングする。キャッピングし、DMFで3回洗浄した後、ビーズをリン酸カップリング緩衝液に10mg/mlで再懸濁する。
一実験では、5’アミノ基および内部アルキン基の修飾を有する合計10nmolの記録タグを、0.1M Hepes、pH7.5、5mMメチルテトラジン-PEG4-アジド(BroadPharm)、2.5mM CuSO、5mMトリス(3-ヒドロキシプロピルトリアゾリルメチル)アミン(Glen Research)、8mMアスコルビン酸ナトリウム中で、室温でインキュベートした。16時間のインキュベーション後、記録タグをLiClOおよび83%アセトンで沈殿させ、次いで、50μlの150mM NaCl/NaPhos pH7.4、1mM EDTAに溶解した。記録タグ濃度をナノドロップ分光光度計(Thermo Fisher)によるA260の測定により推定し、100μMに調整した。
TCO(trans-シクロオクテン)ビーズをDynabeads M-270アミン(Thermo Fisher)から調製した。合計0.45mgのDynabeads M-270アミンを150μlの150mM NaCl/NaPhos pH7.4で2回洗浄し、150μlの150mM NaCl/NaPhos pH7.4に再懸濁した。その一方で、TCO-PEG12-NHS/mPEG-SCM混合物のDMF溶液を、TCO-PEG12-NHSエステル(BroadPharm)/DMFのmPEG-SCM、MW550(Creative PEGWorks)/DMFに対する1:10、1:10、および1:10の比でのタイトレーションにより調製した。個々のTCO-PEG12-NHS/mPEG-SCM混合物の合計10μlを150ulの予洗ビーズ懸濁液に添加し、室温で30分間インキュベートしてTCOでビーズを異なる分布でコーティングした。TCOコーティングビーズを150μLの150mM NaCl/NaPhos pH7.4で2回洗浄し、150ulの150mM NaCl/NaPhos pH7.4に再懸濁した。ビーズ上の残留アミン基を6.7μM NHS-アセテート(TCI)との室温で15分のインキュベーションによりブロッキングした。得られたビーズを150uLの150mM NaCl/NaPhos pH7.4で2回洗浄した。
個々のTCO修飾ビーズの合計0.45mgを10μlの100uMメチルテトラジン修飾記録タグ溶液に再懸濁し、室温で30分間インキュベートし、150μlの150mM NaCl/NaPhos pH7.4で2回洗浄した。記録タグ固定化ビーズを75μlの150mM NaCl/NaPhos pH7.4、1mM EDTAに再懸濁した。
システイン含有ペプチドを、ビーズ上の記録タグの5’アミン基に、SM(PEG)8(Thermo Fisher)によって付着させた。合計5μlの100mM SM(PEG)/DMF溶液を150μlのビーズ懸濁液に添加し、室温で30分間インキュベートした。得られたビーズを150μlの150mM NaCl/NaPhos pH7.4で2回洗浄し、20μlの150mM NaCl/NaPhos pH7.4、1mM EDTAに再懸濁した。合計6μlの8mMペプチド/DMF溶液を20μLのビーズ懸濁液に添加し、室温で2時間、次いで4℃で16時間インキュベートした。ビーズを150μlの150mM NaCl/NaPhos pH7.4で2回洗浄し、150μlの10μg/mlのL-システイン(Sigma-Aldrich)溶液に再懸濁し、室温で2時間インキュベートして残留マレイミド基を除去した。ビーズを150μlの150mM NaCl/NaPhos pH7.4で2回洗浄し、75μlの150mM NaCl/NaPhos pH7.4、1mM EDTAに再懸濁した。
(実施例21)
記録タグ標識ペプチドの基材への固定化。
解析のために、記録タグのmTet基および活性化ビーズまたは基材の表面のTCO基を使用してIEDDAクリック化学反応によって記録タグ標識ペプチドを基材に固定化する。この反応は、反応物のインプット濃度が低い場合でさえ、迅速かつ効率的である。さらに、メチルテトラジンを使用することにより、より大きな安定性が結合に付与される(Selvaraj and Fox 2013、Knall, Hollauf et al. 2014、Wu and Devaraj 2016)。約200μg~約500μgの間のM-270 TCOビーズを100μlのリン酸カップリング緩衝液に再懸濁する。記録タグのmTet部分を含む5pmolのDNA記録タグ標識ペプチドを、最終濃度が約50nMになるようにビーズに添加する。反応を室温で1時間インキュベートする。固定化した後、基材上の未反応TCO基を、室温で1時間、リン酸カップリング緩衝液中の1mMメチルテトラジン酸でクエンチする。
ペプチドビーズのバルク調製。5’アミノ基および内部アルキン基の修飾を有する合計10nmolの記録タグを、0.1M Hepes、pH7.5、5mM メチルテトラジン-PEG4-アジド(BroadPharm)、2.5mM CuSO、5mMトリス(3-ヒドロキシプロピルトリアゾリルメチル)アミン(Glen Research)、8mMアスコルビン酸ナトリウム中で、室温でインキュベートした。16時間のインキュベーション後、記録タグをLiClOおよび83%アセトンで沈殿させ、次いで、50μlの150mM NaCl/NaPhos pH7.4、1mM EDTAに溶解した。記録タグ濃度をナノドロップ分光光度計(Thermo Fisher)によるA260の測定により推定し、100μMに調整した。TCO(trans-シクロオクテン)ビーズをDynabeads M-270アミン(Thermo Fisher)から調製した。合計0.45mgのDynabeads M-270アミンを150μlの150mM NaCl/NaPhos pH7.4で2回洗浄し、150μlの150mM NaCl/NaPhos pH7.4に再懸濁した。その一方で、TCO-PEG12-NHS/mPEG-SCM混合物のDMF溶液を、TCO-PEG12-NHSエステル(BroadPharm)/DMFのmPEG-SCM、MW550(Creative PEGWorks)/DMFに対する1:10、1:10、および1:10の比でのタイトレーションにより調製した。個々のTCO-PEG12-NHS/mPEG-SCM混合物の合計10μlを150μlの予洗ビーズ懸濁液に添加し、室温で30分間インキュベートしてTCOでビーズを異なる分布でコーティングした。TCOコーティングビーズを150μLの150mM NaCl/NaPhos pH7.4で2回洗浄し、150μlの150mM NaCl/NaPhos pH7.4に再懸濁した。ビーズ上の残留アミン基を室温で6.7μM NHS-アセテート(TCI)との15分のインキュベーションによりブロッキングした。得られたビーズを150μLの150mM NaCl/NaPhos pH7.4で2回洗浄した。個々のTCO修飾ビーズの合計0.45mgを10μlの100μMメチルテトラジン修飾記録タグ溶液に再懸濁し、室温で30分間インキュベートし、150μlの150mM NaCl/NaPhos pH7.4で2回洗浄した。記録タグ固定化ビーズを75μlの150mM NaCl/NaPhos pH7.4、1mM EDTAに再懸濁した。システイン含有ペプチドを、ビーズ上の記録タグの5’アミン基に、SM(PEG)8(Thermo Fisher)によって付着させた。合計5μlの100mM SM(PEG)/DMF溶液を150μlのビーズ懸濁液に添加し、室温で30分間インキュベートした。得られたビーズを150μlの150mM NaCl/NaPhos pH7.4で2回洗浄し、20μlの150mM NaCl/NaPhos pH7.4、1mM EDTAに再懸濁した。合計6μlの8mMペプチド/DMF溶液を20μLのビーズ懸濁液に添加し、室温で2時間、次いで4℃で16時間インキュベートした。ビーズを150μlの150mM NaCl/NaPhos pH7.4で2回洗浄し、150μlの10μg/mlのL-システイン(Sigma-Aldrich)溶液に再懸濁し、室温で2時間インキュベートして残留マレイミド基を除去した。ビーズを150μlの150mM NaCl/NaPhos pH7.4で2回洗浄し、75μlの150mM NaCl/NaPhos pH7.4、1mM EDTAに再懸濁した。
(実施例22)
N末端アミノ酸(NTAA)修飾
化学的NTAAアセチル化:
ペプチドのNTAAを、有機または水性溶液(スルホ-NHS-アセテート)中で、無水酢酸またはNHS-アセテートのいずれかを使用してアセチル化する。無水酢酸誘導体化の場合、DMF中10mMの無水酢酸を、ペプチドと共に室温で30分間インキュベートする(Halpin、Leeら、2004年)。あるいは、100mMの2-(N-モルホリノ)エタンスルホネート(MES)緩衝液(pH6.0)中50mMの無水酢酸および1MのNaClを使用して、室温で30分間、ペプチドを水溶液中でアセチル化する(Tse、Snyderら、2008年)。NHS-アセテート誘導体化の場合、スルホ-NHS-アセテートのストック溶液(DMSO中100mM)を調製し、100mMリン酸ナトリウム緩衝液(pH8.0)または100mMホウ酸緩衝液(pH9.4)に、終濃度が5~10mMになるように添加し、室温で10~30分間インキュベートする(Goodnow、2014年)。
酵素的NTAAアセチル化:
以下の条件を使用して、N-アセチルトランスフェラーゼ(Sulfolobus solfataricusに由来するSsArd1)に曝露することにより、ペプチドのNTAAを酵素的にアセチル化する。ペプチドを、2μMのSsArd1と共に、NAT緩衝液(20mM Tris-HCl、pH8.0、100mM NaCl、1mM EDTA、1mMアセチル-CoA)中で、10分間60℃にてインキュベートする(ChangおよびHsu、2015年)。
化学的NTAAアミジン化(グアニジニル化):
ペプチドを、10mM N,N-ビス(tert-ブトキシカルボニル)チオ尿素、20mMトリメチルアミン、および12mM向山試薬(2-クロロ-1-メチルピリジニウムヨージド)のDMF溶液で、30分間室温にてインキュベートする。あるいは、ペプチドを、10mM 1H-ピラゾール-1-カルボキサミジン塩酸塩、10mM DIEAのDMF溶液で、30分間室温にてインキュベートする。標準的脱ブロッキング法を使用して、保護基を除去する。あるいは、ペプチドを、PBS緩衝液(pH8.0)または100mMホウ酸緩衝液(pH8.0)中10mM S-メチルイソチオ尿素で、30分間10℃にてインキュベートする(Tse、Snyderら、2008年)。
PITC標識:
ペプチドを、イオン性液体[Bmim][BF4]中5%(vol/vol)のPITCで、5分間室温にてインキュベートする。伸長DNA記録タグに存在するヌクレオチド塩基の環外アミンの異所標識を最小限に抑えつつ、NTAAが定量的にPITCで標識されるように、反応時間を最適化する。
DNFB標識:
2,4-ジニトロフルオロベンゼン(DNFB)を、メタノール中5mg/mlのストックとして調製する。溶液は、光から保護し、毎日新しく調製する。10mMホウ酸緩衝液(pH8.0)中0.5~5.0μg/mlのDNFBで、5~30分間37℃にてインキュベーションすることにより、ペプチドを標識する。
SNFB標識:
4-スルホニル-2-ニトロ-フルオロベンゼン(SNFB)を、メタノール中5mg/mlのストックとして調製する。溶液は、光から保護し、毎日新しく調製すべきである。10mMホウ酸緩衝液(pH8.0)中0.5~5.0μg/mlのDNFBで、5~30分間37℃にてインキュベーションすることにより、ペプチドを標識する。
アセチル化NTAAペプチドの切断:
25mM Tris-HCl(pH7.5)中で10uMのアシルペプチドヒドロラーゼ(APH)酵素(Sulfolobus solfataricus由来、SSO2693)と共に、10分間90℃にてインキュベーションすることにより、アセチル化NTAAをペプチドから切断する(Gogliettino、Balestrieriら、2012年)。
アミジン化(グアニジニル化)NTAAペプチドの切断:
アミジン化(グアニジニル化)NTAAを約0.1N~約0.5Nの間のNaOH中で10分間の37℃でのインキュベーションによりペプチドから切断する(Hamada 2016)。
(実施例23)
モデル系によるコーディングタグ情報の記録タグへの分子内移行の実証
DNAモデル系を使用して、ビーズに固定化されている記録タグへのコーディングタグ情報の「分子内」移行を試験した(例えば図36Aを参照されたい)。2つの異なるタイプの記録タグオリゴヌクレオチドを使用した。saRT_Abc_v2(配列番号141)は、「A」DNA捕捉配列(配列番号153)(「A’」結合性物質の模倣エピトープ)および対応する「A」バーコード(rtA_BC)を含んでいた。saRT_Bbc_V2(配列番号142)は、「B」DNA捕捉配列(配列番号154)(「B’」結合性物質の模倣エピトープ)および対応する「B」バーコード(rtB_BC)を含んでいた。これらバーコードは、基本的な65セットの15merバーコード(配列番号1~65)およびそれらのリバース相補的配列(配列番号66~130)の組合せだった。rtA_BCは、2つのバーコード、BC_1およびBC_2の同鎖上の組合せであり、rtB_BCは、1つのバーコード、BC_3のみである。同様に、コーディングタグのバーコード(エンコーダー配列)も、65個の15merバーコード(配列番号1~65)の基本的なセットに由来するバーコードで構成されていた。CT_A’-bc_1PEG(配列番号144)およびCT_B’-bc(配列番号147)コーディングタグは、それぞれ相補的捕捉配列A’およびB’で構成され、それぞれ15merバーコードBC_5、およびBC_5&BC_6と割り当てた。記録タグおよびコーディングタグのこの設計設定により、容易なゲル解析が可能になる。所望の「分子内」プライマー伸長は、類似サイズのオリゴヌクレオチド産物を生成するが、望ましくない「分子間」伸長は、「分子内」産物よりも15塩基大きな1つのオリゴ産物および15塩基短い別のオリゴ産物を生成する(例えば図36Bを参照されたい)。
「分子内」情報移行に対する記録タグ密度の効果を、「分子間」情報移行に対する記録タグ密度の効果と対比して評価した。正しい情報移行の場合、「分子内」情報移行(「A’」コーディングタグからA記録タグへ;B’コーディングタグからB記録タグへ)が、「分子間」情報移行(A’コーディングタグによるA記録タグへの結合、しかしB記録タグへの情報移行、およびその逆)ではなく、観察されるはずである。ビーズ表面で記録タグの間隔をあけることの効果を試験するために、ビオチン化記録タグオリゴヌクレオチド、saRT_Abc_v2(配列番号141)およびsaRT_Bbc_v2(配列番号142)、を1:1の比で混合し、その後、1:0、1:10、1:10、1:10、および1:10の比で、saDummy-T10オリゴヌクレオチド(配列番号143)に対してタイトレーションした。合計で20pmolの記録タグオリゴヌクレオチドを、50μlの固定化緩衝液(5mM Tris-Cl(pH7.5)、0.5mM EDTA、1M NaCl)中で5μlのM270ストレプトアビジンビーズ(Thermo)と共に、37℃で15分間インキュベートした。ビーズを、100μlの固定化緩衝液で3回、室温で洗浄した。ほとんどのその後の洗浄ステップは、100μlの体積を使用した。ビーズを25μlの5×アニーリング緩衝液(50mM Tris-Cl(pH7.5)、10mM MgCl)に再懸濁し、コーディングタグミックスを添加することにより、コーディングタグ(後のサイクルのためにDupCT配列との二本鎖アニーリングが必要とされる)を、ビーズに固定化されている記録タグにアニーリングさせた。65℃で1分間加熱し、その後室温へと徐々に冷却する(0.2℃/秒)ことにより、コーディングタグが記録タグにアニーリングした。あるいは、コーディングタグをPBST緩衝液中、37℃でアニーリングさせることができる。ビーズを、PBST(PBS+0.1%Tween(登録商標)-20)によって室温で洗浄し、PBSTによって5分間、37℃で2回洗浄し、PBSTによって室温で1回洗浄し、1×アニーリング緩衝液で最終洗浄した。ビーズを、19.5μlの伸長緩衝液(50mM Tris-Cl(pH7.5)、2mM MgSO、125uM dNTP、50mM NaCl、1mMジチオトレイトール(DTT)、0.1%Tween(登録商標)-20、および0.1mg/mlのBSA)に再懸濁し、37℃で15分間インキュベートした。クレノウexo-DNAポリメラーゼ(NEB、5U/μl)を、0.125U/ulの最終濃度になるようにビーズに添加し、37℃で5分間インキュベートした。プライマー伸長後、ビーズを、PBSTによって2回、50μlの0.1 NaOHによって5分間、室温で1回、PBSTによって3回、およびPBSによって1回洗浄した。下流PCRアダプター配列R1’を付加するために、EndCap2Tオリゴ(R1(配列番号152)で構成されている)を、コーディングタグオリゴヌクレオチドについて行ったようにビーズ上でハイブリダイズさせ、伸長させた。アダプター配列を付加した後、最終伸長記録タグオリゴヌクレオチドを95%ホルムアミド/10mM EDTA中の65℃で5分間のインキュベーションによりストレプトアビジンビーズから溶出した。溶出産物のおよそ1/100を、20μlで18サイクルにわたってPCR増幅し、PCR産物の1μlを10%変性PAGEゲルで解析した。得られたゲルは、ポリメラーゼ伸長によるコーディングタグ情報の記録タグへの書き込みの原理証明を実証し(例えば、図36Cを参照されたい)、ビーズ表面の記録タグ密度を希釈すると「分子間」伸長事象よりも主として「分子内」伸長事象を生じさせることができることを実証する。
このモデル系では、対応するエンコーダー配列およびユニバーサルリバースプライマー部位を含む記録タグRT_ABCおよびRT_BBCからのPCR産物のサイズは、100塩基対(例えば図36Cを参照のこと)であるが、saRT_ABC(配列番号141)/CT_B’BC(配列番号147)およびsaRT_BBC(配列番号142)/CT_A’BC(配列番号144)の誤対合による産物は、それぞれ115塩基対および85塩基対である。図36Dに示されているように、ビーズにsaRT_ABC(配列番号141)およびsaRT_BBC(配列番号142)が高密度で存在する場合、3つのバンドが観察された。高密度では、記録タグは、それ自体に結合する近位のコーディングタグ(分子内事象)または近隣の記録タグ(分子間事象)で伸長することが予想された。しかしながら、誤対合による産物のバンドは、ダミーオリゴヌクレオチドの記録タグを希釈することにより減少し、1:10000の比では消失した。この結果は、記録タグがビーズ表面に低密度で離間されていたため、分子間事象が減少したことを実証した。
Figure 0007390027000136
Figure 0007390027000137
/3SpC3/ = 3’ C3 (炭素3個)スペーサー
/5Biosg/ = 5’ビオチン
/iSP18/ = 18原子ヘキサ-エチレングリコールスペーサー
(実施例24)
ナノポアシーケンサーでの伸長記録タグ、伸長コーディングタグ、またはジタグ構築物の配列決定
DNAバーコードは、現在の塩基コールエラー率が10%台またはそれよりも高いナノポアに基づくシーケンサーなどの、非常にエラーを起こしやすいNGSシーケンサーでの使用に耐えるように設計することができる。いくつかのエラー訂正コード系が文献に記載されている。こうしたエラー訂正コード系としては、Hammingコード、Reed-Solomonコード、Levenshteinコード、Leeコードなどが挙げられる。エラー耐性バーコードは、選択した設計パラメーターに応じて、挿入エラー、欠失エラー、および置換エラーを訂正することが可能なR Bioconductorパッケージ「DNAbarcodes」を使用した、HammingおよびLevenshteinコードに基づいていた(BuschmannおよびBystrykh、2013年)。65個の異なる15mer Hammingバーコードのセットが、図27Aに示されている(配列番号1~65に示されており、それらのリバース相補的配列はそれぞれ配列番号66~130に示されている)。これらのバーコードは、最小Hamming距離が10であり、4つの置換エラーおよび2つのインデルエラーまでを自己訂正する。これは、10%のエラー率でのナノポアシーケンサーの正確な読み出しに十分過ぎる程である。さらに、これらのバーコードは、予測ナノポア電流シグネチャを使用して、77個のオリジナルバーコードのセットから濾過されている(例えば図27Bを参照されたい)。これらのバーコードは、バーコード全体にわたって大きな電流レベル差を示し、そのセットの他のバーコードと極力相関しないように濾過した。このようにすると、これらバーコードを使用したアッセイからの実際の生ナノポア電流レベルプロットを、塩基コールアルゴリズムを使用せずに、予測バーコードシグネチャに対して直接的にマッピングすることができる(Laszlo、Derringtonら、2014年)。
ナノポアシーケンシングを使用した伸長記録タグ、伸長コーディングタグ、またはジタグ構築物の解析を模倣するために、4つのフォワードプライマー(DTF1(配列番号157)、DTF2(配列番号158)、DTF3(配列番号159)、DTF4(配列番号160))および4つのリバースプライマー(DTR9(配列番号161)、DTR10(配列番号162)、DTR11(配列番号163)、DTR12(配列番号164))を使用した15merバーコードの小さなサブセットで構成されるPCR産物を生成した(例えば図27Cを参照されたい)。この8個プライマーのセットを、隣接するフォワードプライマーF1(配列番号165)およびリバースプライマーR1(配列番号166)と共にPCR反応に含めた。DTFおよびDTRプライマーは、相補的15merスペーサー配列(Sp15)(配列番号167)を介してアニーリングした。4つのDTFフォワードプライマーおよび4つのDTRリバースプライマーの組合せは、16個の考え得るPCR産物をもたらす。
Figure 0007390027000138
Figure 0007390027000139
Figure 0007390027000140
PCR後、アンプリコンを、平滑末端ライゲーション(例えば、図27Cを参照されたい)により以下の通り鎖状化した:20μlのPCR産物を20μlのQuick Ligase Mix(NEB)と直接混合し、室温で一晩インキュベートした。長さ約0.5~2kbの得られたライゲーション産物を、Zymo精製カラムを使用して精製し、20μlの水に溶出した。この精製ライゲーション産物の約7μlを、MinION Library Rapid Sequencing Prepキット(SQK-RAD002)に直接使用し、MinION Mk 1B(R9.4)デバイスで解析した。品質スコア7.2(正確度約80%)の734bpナノポアリードの一例を図27Dに示す。配列決定の正確度が不良であるにもかかわらず、MinIon配列リードとのバーコードのlalignに基づくアラインメントにより示されているように、配列中の多数のバーコードを容易に読み取ることができる(図27Dは、配列番号168、伸長記録タグ構築物の配列、を示す)。
(実施例25)
ゲルビーズへの単一細胞の封入
単一細胞を、標準的技法(Tamminen and Virta 2015、Spencer,Tamminen et al. 2016)を使用して液滴(約50μm)に封入する(例えば、図38を参照されたい)。ポリアクリルアミド(アクリルアミド:ビスアクリルアミド(29:1)(30% w/vol.))、ベンゾフェノンメタクリルアミド(BM)、およびAPSを、細胞と共に不連続相に含めて、TEMEDの連続油相への添加(液滴内への拡散)時に重合し得る液滴を創出する。ベンゾフェノンをポリアクリルアミドゲル液滴のマトリックスに架橋させる。これは、その後のタンパク質のポリアクリルアミドマトリックスへの光親和性架橋を可能にする(Hughes,Spelke et al. 2014、Kang, Yamauchi et al. 2016)。得られた単一細胞ゲルビーズ内に固定化されたタンパク質を、様々な方法を使用して単一細胞バーコード化することができる。一実施形態では、DNAタグを、単一細胞ゲルビーズ内に固定化されたタンパク質に、前に説明したようなアミン反応性作用物質または光活性ベンゾフェノンDNAタグを使用して、化学的にまたは光化学的に付着させる。単一細胞ゲルビーズを、バーコードを含有する液滴に、前に説明したようなバーコード付きビーズの共封入によって封入することができ、タンパク質に移行されたDNAバーコードタグまたはその代わりに単一細胞ゲルビーズ内のタンパク質を、Amini、CusanovichおよびGundersonら(Amini,Pushkarev et al. 2014, Cusanovich, Daza et al. 2015)(Gunderson, Steemers et al.2016)によって記載されたような一連のプール・アンド・スプリットステップによってコンビナトリアル的にインデックス化することができる。最も単純なインプリメンテーションでは、単一細胞ゲルビーズ内のタンパク質を、まず「クリック化学」部分で標識し(例えば、図40を参照されたい)、その後、プール・アンド・スプリット手法を使用してコンビナトリアルDNAバーコードをタンパク質試料にクリックする。
(実施例26)
DNAに基づくモデル系を使用する一本鎖DNAライゲーションによる情報移行の実証
DNAモデル系を使用して、ビーズに固定化されている記録タグへのコーディングタグ情報の移行を試験した(例えば、図46Aを参照されたい)。2つの異なるタイプの記録タグオリゴヌクレオチドを使用した:5’リン酸化されており、3’ビオチン化されており、一意の6塩基DNAバーコードと、BCaと、ユニバーサルフォワードプライマー配列と、標的結合「B」配列とを含有する、saRT_Bbca_ssLig(配列番号181)ssDNA構築物;5’リン酸化されており、3’ビオチン化されており、一意の6塩基DNAバーコードと、BCaと、ユニバーサルフォワードプライマー配列と、標的結合「A」配列とを含有する、saRT_Abca_ssLig(配列番号182)ssDNA構築物。コーディングタグオリゴヌクレオチド、CT_B’bcb_ssLig(配列番号183)は、B’配列を含有する。記録タグおよびコーディングタグおよび付随する結合エレメントのこの設計により、容易なゲル解析が可能になる。記録タグの5’リン酸基とコーディングタグの3’ヒドロキシル基が、固体表面に固定化された記録タグのB配列へのコーディングタグのB’配列のアニーリングによって極めて近接した場合、所望の一本鎖DNAライゲーション産物がCircLigase II(Lucigen)により生成される。
BコーディングタグとB記録タグ間の特異的相互作用による情報移行をゲル解析により評価した。表面の記録タグの密度を、mPEG-Biotin、MW550(Creative PEGWorks)のビオチン化記録タグオリゴヌクレオチドsaRT_Bbc_ssLigまたはsaRT_Abc_ssLigによる1:10の比でのタイトレーションにより調整した。合計2pmolの記録タグオリゴヌクレオチドを、50μlの固定化緩衝液(5mM Tris-Cl、pH7.5、0.5mM EDTA、1M NaCl)中で5μlのM270ストレプトアビジンビーズ(Thermo)と共に15分間、37℃でインキュベートし、150μlの固定化緩衝液で1回、150μlのPBST+40%ホルムアミドで1回洗浄した。モデルアッセイについては、合計40pmolのCT_B’bcb_ssLigを、50μlのPBST中で5μlの記録タグ固定化ビーズと共に15分間、37℃でインキュベートした。ビーズを、150μlのPBST+40%ホルムアミドによって室温で2回洗浄した。ビーズを10μlのCircLigase II反応ミックス(0.033M Tris-酢酸塩、pH7.5、0.066M酢酸カリウム、0.5mM DTT、2mM MnCl、0.5Mベタイン、および4U/μLのCircLigase II ssDNAリガーゼ)に再懸濁し、45℃で2時間インキュベートした。ライゲーション反応後、ビーズを固定化緩衝液+40%ホルムアミドで1回洗浄し、PBST+40%ホルムアミドで1回洗浄した。最終伸長記録タグオリゴヌクレオチドを10μlの95%ホルムアミド/10mM EDTA中の65℃で5分間のインキュベーションによりストレプトアビジンビーズから溶出し、2.5μlの溶出物を15%PAGE-尿素ゲルに負荷した。
このモデル系では、47塩基記録タグからのライゲーション産物のサイズは、96塩基である(例えば、図46Bを参照されたい)。ライゲーション産物バンドは、saRT_Bbca_ssLigの存在下では観察されたが、saRT_Abcb_ssLigの存在下では産物バンドが観察されなかった。この結果は、特異的B/B’配列結合事象がコーディングタグの記録タグへの情報移行によりコードされることを実証した。さらに、第1のサイクルのライゲーション産物をUSER酵素で処理し、第2の情報移行に使用した。これらの事象をゲル解析により観察した(例えば、図46Cを参照されたい)。
Figure 0007390027000141
/5Phos/= 5’リン酸化
/3Bio/= 3’ビオチン化
/iSP18/ = 18原子ヘキサ-エチレングリコールスペーサー
(実施例27)
DNAに基づくモデル系を使用する二本鎖DNAライゲーションによる情報移行の実証。
DNAモデル系を使用して、ビーズに固定化されている記録タグへのコーディングタグ情報の移行を試験した(図47Aを参照されたい)。記録タグオリゴヌクレオチドは、2本の鎖で構成されている。saRT_Abc_dsLig(配列番号184)は、標的結合性物質A配列と、ユニバーサルフォワードプライマー配列と、2つの一意の15塩基DNAバーコードBC1およびBC2と、4塩基突出とを含有する、5’がビオチン化されているDNAであり;Blk_RT_Abc_dsLig(配列番号185)は、2つの一意の15塩基DNAバーコードBC2’およびBC1’と、ユニバーサルフォワードプライマー配列とを含有する、5’がリン酸化されており、3’がC3スペーサー修飾されている、DNAである。二本鎖コーディングタグオリゴヌクレオチドは、2本の鎖で構成されている。一方の鎖である、dUと一意のBC5と突出とを含有するCT_A’bc5_dsLig(配列番号186)は、ポリエチレングリコールリンカーを介して標的化物質A’配列に連結する。コーディングタグのもう一方の鎖は、5’リン酸とdUと一意のバーコードBC5’とを含有するDup_CT_A’bc5(配列番号187)である。記録タグおよびコーディングタグのこの設計設定により、容易なゲル解析が可能になる。両方のタグの5’リン酸基と3’ヒドロキシル基が、固体表面に固定化された記録タグの標的結合性物質Aへのコーディングタグの標的結合性物質A’のハイブリダイゼーションによって互いに極めて近接したとき、所望の二本鎖DNAライゲーション産物がT4 DNAリガーゼ(NEB)によりライゲーションされる。
標的結合性物質Aと標的化物質A’間の特異的相互作用による情報移行を評価した。ビーズ表面で記録タグの間隔をあけるために、ビオチン化記録タグオリゴヌクレオチド、Blk_RT_Abc_dsLigにハイブリダイズしたsaRT_Abc_dsLigの合計2pmolをmPEG-SCM、MW550(Creative PEGWorks)に対して1:10の比でタイトレーションし、50μlの固定化緩衝液(5mM Tris-Cl、pH7.5、0.5mM EDTA、1M NaCl)中で5μlのM270ストレプトアビジンビーズ(Thermo)と共に15分間、37℃でインキュベートした。記録タグ固定化ビーズを150μlの固定化緩衝液で1回洗浄し、150μlの固定化緩衝液+40%ホルムアミドで1回洗浄した。第1のサイクルのアッセイについては、合計40pmolの二本鎖コーディングタグ、CT_A’bc5_dsLig:Dup_CT_A’bc5を、50μlのPBST中で5μlの記録タグ固定化ビーズと共に15分間、37℃でインキュベートした。ビーズを、150μlのPBST+40%ホルムアミドによって室温で2回洗浄した。ビーズを10μlのT4 DNAリガーゼ反応ミックス(50mM Tris-HCl、pH7.5、10mM MgCl2、1mM DTT、1mM ATP、7.5%PAG8000、0.1μg/μlのBSA、および20U/μlのT4 DNAリガーゼ)に再懸濁し、室温で60分間インキュベートした。ライゲーション反応後、ビーズを固定化緩衝液+40%ホルムアミドで1回洗浄し、PBST+40%ホルムアミドで1回洗浄した。ビーズをUSER酵素(NEB)で処理して二本鎖コーディングタグを除去し、CT_A’bc13-R_dsLig:Dup_CT_ A’bc13-R_dsLig(それぞれ、配列番号188および配列番号189)と共に第2のサイクルのライゲーションアッセイに使用した。各処理後に、二本鎖記録タグを10μlの95%ホルムアミド/10mM EDTA中の65℃で5分間のインキュベーションによりストレプトアビジンビーズから溶出し、2.5μlの溶出物を15%PAGE-尿素ゲルに負荷した。
このモデル系では、76塩基および54塩基記録タグと二本鎖コーディングタグのライゲーション産物のサイズは、それぞれ、116および111塩基である(例えば、図47Bを参照されたい)。第1のサイクルのライゲーション産物をUSER酵素(NEB)消化により完全に消失させ、第2のサイクルのアッセイに使用した。第2のサイクルのライゲーション産物バンドは、およそ150塩基で観察された。これらの結果は、特異的A配列/A’配列結合事象が第1のサイクルおよび第2のサイクルの二本鎖ライゲーションアッセイでコードされることを実証した。
Figure 0007390027000142
/5Biosg/ = 5’ビオチン
/3SpC3/ = 3’ C3 (炭素3個)スペーサー
/5Phos/= 5’リン酸化
/iSP18/ = 18原子ヘキサ-エチレングリコールスペーサー
(実施例28)
ペプチドおよびDNAに基づくモデル系を使用する逐次的情報移行サイクルの実証
ペプチドモデル系を使用して、ビーズに固定化された記録タグ複合体へのコーディングタグ情報の第1のサイクルでの移行を試験した(例えば、図48Aを参照されたい)。PAペプチド配列(配列番号195)を、ビーズに固定化されている記録タグオリゴヌクレオチド、amRT_Abc(配列番号190)に付着させた。amRT_Abc配列は、「A」DNA捕捉配列(「A’」結合性物質の模倣エピトープ)および対応する「A」バーコード(rtA-BC)を含有する。rtA_BC配列は、2つのバーコード、BC_1およびBC_2(配列番号1~65)の同鎖上の組合せである。結合性物質については、抗PA抗体を、15merバーコードBC5(配列番号66~130)で構成されているコーディングタグオリゴヌクレオチド、amCT_bc5(配列番号191)に付着させた。さらに、DNAモデル系を使用して、記録タグへのコーディングタグ情報の第2のサイクルでの移行を試験した(例えば、図48Bを参照されたい)。CT_A’_bc13は、相補的捕捉配列A’で構成されており、このCT_A’_bc13に15merバーコード、BC5(配列番号66~130)を割り当てた。この設計により、特異的プライマーセットでのPCR増幅後の容易なゲル解析が可能になる。
内部アルキン修飾記録タグオリゴヌクレオチド、amRT_Abc(配列番号190)を、メチルテトラジン-PEG4-アジド(BroadPharm)で修飾した。ビーズ表面の記録タグの密度を制御するために、機能的カップリング部位(trans-シクロオクテン、TCO)の様々な密度を有するビーズを、TCO-PEG12-NHSエステル(BroadPharm)のmPEG-SCM、MW550(Creative PEGWorks)に対する1:10、1:10、および1:10の比でのタイトレーションにより誘導体化したM-270アミンDynabeads(Thermo Fisher)から調製した。メチルテトラジン修飾amRT_Abc記録タグをtrans-シクロオクテン(TCO)誘導体化ビーズに付着させた。Cys含有ペプチドを、ビーズ上のamRT_Abcの5’アミン基にSM(PEG)8(Thermo Fisher)によって付着させた。Protein-Oligonucleotide Conjugationキット(Solulink)を使用して、抗PA抗体(Wako Chemicals)とamCT_bc5コーディングタグのコンジュゲーションを達成した。手短に述べると、amCT_bc5の5’アミン基をS-4FBで修飾し、その後0.5mL Zebaカラムにより脱塩した。抗PA抗体をS-HyNicで修飾し、その後0.5mL Zebaカラムにより脱塩した。最後に、4FB修飾amCT_bc5とHyNic修飾抗PA抗体を混合して抗体-コーディングタグコンジュゲートを調製し、その後、Bio-Gel P100(Bio-Rad)を使用してサイズ排除した。
第1のサイクルの結合アッセイについては、5μlのペプチド-記録タグ(RT)固定化ビーズをSuperBlock T20(TBS)ブロッキング緩衝液(Thermo Fisher)と共に室温で15分間インキュベートしてビーズをブロッキングした。合計2pmolの抗体-コーディングタグコンジュゲートを50μlのPBST中で5μlのペプチド-記録タグ固定化ビーズと共に30分間、37℃でインキュベートした。ビーズを、1000μlのPBST+30%ホルムアミドによって室温で2回洗浄した。ビーズを、50μlの伸長反応マスターミックス(50mM Tris-Cl(pH7.5)、2mM MgSO、125μM dNTP、50mM NaCl、1mMジチオトレイトール(DTT)、0.1%Tween(登録商標)-20、0.1mg/mlのBSA、および0.05U/μLのクレノウexo-DNAポリメラーゼ)に再懸濁し、37℃で5分間インキュベートした。プライマー伸長後、ビーズを固定化緩衝液(5mM Tris-Cl(pH7.5)、0.5mM EDTA、1M NaCl、30%ホルムアミド)によって1回、50μlの0.1N NaOHによって室温で5分間、1回、PBST+30%ホルムアミドによって1回、およびPBSによって1回洗浄した。第2の結合サイクルのアッセイについては、CT_A’_bc13を使用して、記録タグ内のその同種のA配列に結合させ、第1のサイクルの伸長記録タグの伸長が第2のサイクルのコーディングタグ配列上に及ぶことを可能にした。伸長後、最終伸長記録タグオリゴヌクレオチドを、特異的プライマーを用いて20μlのPCR混合物中でPCR増幅させ、1μlのPCR産物を10%PAGEゲルで解析した。得られたゲルは、ポリメラーゼ伸長によるコーディングタグ情報の記録タグへの書き込みの原理証明を実証する(図48C~E)。
図48Aに示されているモデル系では、プライマーセットP1_F2およびSp/BC2を使用する記録タグamRT_AbcからのPCR産物のサイズは、56塩基対である。図48Cに示されているように、amRT_Abcの密度依存性バンド強度が観察された。抗PA抗体-amCT_bc5コンジュゲートでの第1のサイクルの結合アッセイについては、同種PA-タグ固定化ビーズをアッセイに使用したとき80塩基対PCR産物の強いバンドが観察されたが、非同種アミロイドベータ(Aβ16~27)またはnano-Tag固定化ビーズを使用したときにはPCR産物がほとんど得られなかった(例えば、図48Dを参照されたい)。CT_A’_bc13コーディングタグに付着しているA’DNAタグを用いる第2の結合アッセイ(例えば、図48Bを参照されたい)については、3種類すべてのペプチド記録タグコンジュゲートが、アニーリングされているCT_A’_bc13配列上に及ぶ。図48Eに示されているように、PCR産物の比較的強いバンドが、すべてのペプチド固定化ビーズについて117塩基対で観察された。これらのバンドは、元の記録タグ(BC1+BC2+BC13)に関する第2のサイクルの伸長のみに対応する。第1の伸長記録タグ(BC1+BC2+BC5+BC13)に関する第2の伸長に対応するバンドが、PA-タグ固定化ビーズをアッセイに使用したときにのみ93塩基対で観察された。これらの結果は、特異的ペプチド/抗体およびA配列/A’配列結合事象が第1のサイクルおよび第2のサイクルのアッセイでそれぞれコードされることを実証した。
Figure 0007390027000143
/3SpC3/ = 3’ C3 (炭素3個)スペーサー
/i5OctdU/= 5’-オクタジイニルdU
/iSP18/ = 18原子ヘキサ-エチレングリコールスペーサー
(実施例29)
mRNAディスプレイを使用するDNA記録タグでのタンパク質またはペプチドの標識
タンパク質をコードする各DNAの3’末端にPCRによって個々のバーコードを組み込み、バーコード付きDNAをプールする。増幅されたDNAプールを、AmpliScribe T7 Flash(Lucigen)を使用して転写する。RNeasy Mini Kit(Qiagen)を使用して転写反応をクリーンアップし、NanoDrop 3000(Fisher Scientific)により定量化する。T4 DNAリガーゼ(NEB)を使用して、DNAアダプターをmRNAの3’末端に付着させる。ライゲーションされたmRNA分子を、10%TBE-尿素変性ゲルを使用して精製する。PURExpressキット(NEB)を使用して、mRNA-ピューロマイシン分子をin vitroで翻訳する。in vitro翻訳中に、ストールされたリボソームによって、ピューロマイシン残基がリボソームA部位に侵入してタンパク質のC末端に付着することが可能になり、その結果、タンパク質-mRNA融合体が創出される。タンパク質-mRNA融合体を、シリカビーズに付着している相補的オリゴヌクレオチドによって捕捉する。ProtoScript II逆転写酵素(NEB)を使用して、mRNA部分をcDNAに変換する。タンパク質-cDNA/RNAプールをRNase H(NEB)およびRNaseカクテル(Thermo Fisher)で処理してタンパク質-cDNAを生成し、その後カットアウトフィルターにより精製する。cDNAのII型制限部位の相補配列を付加させて二本鎖を形成し、制限酵素と共にインキュベートして、cDNAの3’末端にスペーサー配列(Sp)を生成する。プールの一部を配列決定に使用して、出発タンパク質-cDNAプールにおけるタンパク質表示を特徴付ける。
(実施例30)
リボソームディスプレイに基づくタンパク質のバーコーディング
比較的小さいサイズ(例えば、この研究では<200)のタンパク質ライブラリーの場合、バーコード付きプライマーとの個々のPCR反応を実施することにより、バーコーディング配列をDNA鋳型に導入することができる。バーコード付き直鎖状DNA鋳型をプールし、HiScribe T7キット(NEB)を使用してin vitro転写する。転写されたmRNAをDNA-freeキット(Ambion)で処理し、RNeasy Miniキット(Qiagen)で精製し、Nanodrop 1000(Thermo Scientific)により定量化する。mRNA-cDNAハイブリッドを生成するために、緩衝液(50mM Tris-HCl、pH8.3、75mM KCl、および5mM MgCl)中の0.10μM mRNA、1μM 5’-アクリダイトおよびデスチオビオチン修飾プライマー、0.5mMの各dNTP、10U/μLのSuperscript III、2U/μLのRNaseOUT(Invitrogen)および5mMジチオトレイトール(DTT)を50℃で30分間インキュベートすることにより、cDNAを合成する。得られたmRNA-cDNAハイブリッドをイソプロパノール沈殿法により濃縮し、ストレプトアビジンコーティング磁気ビーズ(Dynabeads M-270ストレプトアビジン、Life Technologies)で精製する。PURExpress Δ Ribosomeキット(NEB)を適用して、E.coliリボソーム上にタンパク質を提示する。典型的には、0.40μM mRNA-cDNAハイブリッドおよび0.30μMリボソームを用いる250μLのIVT反応を37℃で30分間インキュベートし、250μLの氷冷緩衝液HKM(50mM HEPES、pH7.0、250mM KOAc、25mM Mg(OAc)2、0.25U/mLのRNasin(Promega)、0.5mg/mLのクロラムフェニコール、5mM 2-メルカプトエタノール、および0.1%(v/v)Tween(登録商標) 20)の添加によりクエンチし、10分間、遠心分離(14,000g、4℃)して不溶性成分を除去する。常に氷上または低温室内に保持されているPRMC複合体を2ステップFlagタグおよびデスチオビオチンタグ親和性精製に供して、完全長およびバーコード付き標的タンパク質を濃縮する。したがって、抗Flag M2(Sigma-Aldrich)およびストレプトアビジン磁気ビーズを使用してタンパク質を逐次的に精製し、これらを、100μg/mLの酵母tRNAおよび10mg/mLのBSAで補完された緩衝液HKMを用いてブロッキングする。100g/mlのFlagペプチドまたは5mMビオチンを含有する緩衝液HKMで、結合タンパク質を溶出し、それらのバーコーディングDNAをリアルタイムPCRにより定量化する。
(実施例31)
NTAA検出系を使用する一本鎖DNAスペーサーライゲーションによる情報移行。
DNA/ポリマーキメラコーディングタグおよび記録タグの場合、標準的核酸酵素学を使用するライゲーションにより、情報を、結合されている結合性物質のコーディングタグから近位の記録タグに移行させることができる(図54)。NTAA検出系を使用して、ビーズに固定化されている記録タグへのポリマーコーディングタグ情報の移行を試験することができる(図1Aを参照されたい)。DNA/ポリマーキメラ記録タグを使用する:5’リン酸化されており、内部アルキン修飾されており、3’アミノ修飾されており、DNAスペーサー(例えば、1~6塩基)と、ポリマーバーコード(例えば、保護されたDNA、PNA、ペプトイド、非DNAポリマーなど)と、ユニバーサルポリマーアダプター(例えば、コレステロール、ビオチン、テザーDNA配列など)と、USER酵素(NEB)消化用のdUとを含有する、一本鎖DNA/ポリマーキメラ構築物。DNA/ポリマーキメラコーディングタグは、5’アミノ修飾されており、ユニバーサルポリマーアダプターと、ポリマーバーコード(例えば、保護されたDNA、PNA、ペプトイドなど)と、DNAスペーサー(例えば、1~6塩基)とを含有する。記録タグおよびコーディングタグおよび付随する結合エレメントのこの設計により、容易なゲル解析が可能になる。記録タグの5’リン酸基とコーディングタグの3’ヒドロキシル基が、固体表面に固定化された記録タグのペプチドのNTAAへのコーディングタグのNTAAの結合によって極めて近接した場合、所望の一本鎖DNAライゲーション産物がCircLigase II(Lucigen)により生成される。
NTAA結合物質コーディングタグとペプチド記録タグのNTAAの間の特異的相互作用による情報移行をゲル解析により評価することができる。表面の記録タグの密度を以下のように調整することができる。内部アルキン修飾DNA/ポリマーキメラ記録タグをメチルテトラジン-PEG4-アジド(BroadPharm)で修飾する。ビーズ表面の記録タグの密度を制御するために、機能的カップリング部位(trans-シクロオクテン、TCO)の様々な密度を有するビーズを、TCO-PEG12-NHSエステル(BroadPharm)のmPEG-SCM、MW550(Creative PEGWorks)に対する1:102、1:103、および1:104の比でのタイトレーションにより誘導体化したM-270アミンDynabeads(Thermo Fisher)から調製する。メチルテトラジン修飾記録タグをtrans-シクロオクテン(TCO)誘導体化ビーズに付着させる。Cys含有ペプチドを、ビーズ上の記録タグの3’アミン基に、SM(PEG)8(Thermo Fisher)によって付着させる。
合計2pmolの記録タグを、50ulの固定化緩衝液(5mM Tris-Cl、pH7.5、0.5mM EDTA、1M NaCl)中で5ulのM270ストレプトアビジンビーズ(Thermo)と共に15分間、37℃でインキュベートし、150ulの固定化緩衝液で1回洗浄し、150ulのPBST+30%ホルムアミドで1回洗浄する。モデル系については、合計30pmolのコーディングタグ付着NTAA結合物質を、50ulのPBST中で5ulの記録タグ固定化ビーズと共に15分間、37℃でインキュベートする。ビーズを、150ulのPBST+30%ホルムアミドによって室温で2回洗浄する。ビーズを10ulのCircLigase II反応ミックス(0.033M Tris-酢酸塩、pH7.5、0.066M酢酸カリウム、0.5mM DTT、2mM MnCl2、0.5Mベタイン、および4U/ulのCircLigase II ssDNAリガーゼ)に再懸濁し、45℃で2時間インキュベートする。ライゲーション反応後、ビーズを固定化緩衝液+30%ホルムアミドで1回洗浄し、PBST+30%ホルムアミドで1回洗浄する。最終伸長記録タグを37℃で5分間の5ulのUSER酵素処理によりビーズから溶出し、2.5ulの溶出物を15%PAGE-尿素ゲルに負荷する。ライゲーションされた記録タグをナノポアシーケンシングで使用することができる。
(実施例32)
NTAA検出系を使用する二本鎖DNAスペーサーライゲーションによる情報移行。
DNA/ポリマーキメラコーディングタグおよび記録タグの場合、標準的核酸酵素学を使用するライゲーションにより、情報を、結合されている結合性物質のコーディングタグから近位の記録タグに移行させることができる。NTAA検出系を使用して、ビーズに固定化されている記録タグへのポリマーコーディングタグ情報の移行を試験することができる(図54Bを参照されたい)。DNA/ポリマーキメラ記録タグを使用する:5’リン酸化されており、内部アルキン修飾されており、3’アミノ修飾されており、DNAスペーサー(例えば、5~20塩基)と、ポリマーバーコード(例えば、保護されたDNA、PNA、ペプトイドなど)と、ユニバーサルポリマーアダプター(例えば、コレステロール、ビオチン、テザーDNA配列など)と、USER酵素(NEB)消化用のdUとを含有する、一本鎖DNA/ポリマーキメラ構築物。DNA/ポリマーキメラコーディングタグは、5’アミノ修飾されており、ユニバーサルポリマーアダプターと、ポリマーバーコード(例えば、保護されたDNA、PNA、ペプトイドなど)と、DNAスペーサー(例えば、5~20塩基)とを含有する。
記録タグおよびコーディングタグおよび付随する結合エレメントのこの設計により、容易なゲル解析が可能になる。記録タグの5’リン酸基とコーディングタグの3’ヒドロキシル基が、固体表面に固定化された記録タグのペプチドのNTAAへのコーディングタグのNTAAの結合によって極めて近接した場合、所望の一本鎖DNAライゲーション産物が副子DNAハイブリダイゼーション、続いてのT4 DNAリガーゼ(NEB)により生成される。
NTAA結合物質コーディングタグとペプチド記録タグのNTAAの間の特異的相互作用による情報移行をゲル解析により評価することができる。表面の記録タグの密度を以下のように調整することができる。内部アルキン修飾DNA/ポリマーキメラ記録タグをメチルテトラジン-PEG4-アジド(BroadPharm)で修飾する。ビーズ表面の記録タグの密度を制御するために、機能的カップリング部位(trans-シクロオクテン、TCO)の様々な密度を有するビーズを、TCO-PEG12-NHSエステル(BroadPharm)のmPEG-SCM、MW550(Creative PEGWorks)に対する1:102、1:103、および1:104の比でのタイトレーションにより誘導体化したM-270アミンDynabeads(Thermo Fisher)から調製する。メチルテトラジン修飾記録タグをtrans-シクロオクテン(TCO)誘導体化ビーズに付着させる。Cys含有ペプチドを、ビーズ上の記録タグの3’アミン基に、SM(PEG)8(Thermo Fisher)によって付着させる。
合計2pmolの記録タグを、50ulの固定化緩衝液(5mM Tris-Cl、pH7.5、0.5mM EDTA、1M NaCl)中の5ulのM270ストレプトアビジンビーズ(Thermo)と共に15分間、37℃でインキュベートし、150ulの固定化緩衝液で1回洗浄し、150ulのPBST+30%ホルムアミドで1回洗浄する。モデル系については、合計30pmolのコーディングタグ付着NTAA結合物質を、50ulのPBST中の5ulの記録タグ固定化ビーズと共に15分間、37℃でインキュベートする。ビーズを、150ulのPBST+30%ホルムアミドによって室温で2回洗浄する。ビーズを10ulのT4 DNAリガーゼ反応ミックス(50mM Tris-HCl、pH7.5、10mM MgCl2、1mM DTT、1mM ATP、7.5%PAG8000、0.1ug/ulのBSA、30pmolの副子DNA、および20U/ulのT4 DNAリガーゼ)に再懸濁し、室温で60分間インキュベートする。ライゲーション反応後、ビーズを固定化緩衝液+30%ホルムアミドによって1回、0.1N NaOHによって5分間、室温で1回、およびPBST+30%ホルムアミドによって1回洗浄する。最終伸長記録タグを37℃で5分間の5ulのUSER酵素処理によりビーズから溶出し、2.5ulの溶出物を15%PAGE-尿素ゲルに負荷する。ライゲーションされた記録タグをナノポアシーケンシングで使用することができる。
(実施例33)
化学的ライゲーションによる記録ポリマーへのコーディングポリマー移行
コーディングポリマーを記録ポリマーへのライゲーションにより結合物質-コーディングポリマーコンジュゲートから直接または間接的に、どちらかで、移行させて、伸長記録ポリマーを生成する。1つのインプリメンテーションでは、このプロセスは、化学的ライゲーション法を使用して実施する。使用するコーディングポリマーは、直鎖状であってもよく、または分岐していてもよく、荷電してもよく、または非荷電であってもよく、疎水性であってもよく、または親水性であってもよい。使用するライゲーション化学は、マイケル付加(チオール-マレイミド)、銅により触媒されるアジド-アルキン付加環化、環歪みアジド-アルキン付加環化、活性化エステルおよびアミンによるアミド結合形成、または本明細書で詳述する他のライゲーション化学によって実施することができる。ポリマーライゲーションステップは、サイクルごとに同じライゲーション反応、1サイクルおきに交代するライゲーション反応(循環する副産物を防止するために)、またはサイクルごとに異なるライゲーション反応を使用して、実施することができる。
一例では、ビーズの溶液は、各々、解析すべきポリペプチド、およびビーズに繋留されているアルキン終端PEG鎖(約4000Da、PDI 2.1)記録ポリマーと共に存在する。ジイソプロピルシリルエーテル連結によって特異的コーディングポリマー鎖の骨格に各々がライゲーションされたNTAA特異的結合物質のカクテル(80uLの結合物質カクテル、リン酸緩衝液、pH=8.0)で、ビーズを処理する。結合物質は、アンチカリンであってもよく、ClpSであってもよく、または本明細書で述べる他の結合物質誘導体であってもよい。1つのそのような例では、結合物質ライゲーションコーディングポリマーの1つは、アダマンタンなどの嵩高い基およびカルボン酸などの荷電基で機能化されており、約1000Daの総分子量を有する、直鎖状のアクリルアミド(50%アクリルアミド、20%アダマンチルアクリルアミド、30%アクリル酸供給比、PDI=2.2)であり得る。前記直鎖状アクリルアミドコーディングポリマーは、各末端がアジドで終端している。結合物質によるNTAAの認識によって、アジド終端コーディングポリマーは、ビーズ上に存在するアルキン終端記録ポリマーと極めて近接する。硫酸銅(II)(10mMのストック溶液10uL)およびアスコルビン酸(500mMストック溶液10uL)を混合物に添加し、記録ポリマーにアジド-アルキン付加環化によってコーディングポリマーをライゲーションする。その後、フッ化テトラ-n-ブチルアンモニウム(TBAF、最終濃度1mM)などのフッ素試薬を使用して結合物質をポリマー骨格から切断し、その結果、このときにはアジドで終端しているこのときにはジブロックの記録ポリマー(PEG-アクリルアミド)コンジュゲートを得る。
解析するポリペプチドのNTAAを、エドマン分解条件を使用して切断する。NTAAをまずPITC(DMF中の5Mストック溶液10μL、これを40℃の90μLのビーズ溶液、リン酸緩衝液pH=8.5に添加する、2時間)で処理する。あるいは、NTAAをまずPITC(DMF中の5Mストック溶液10μL、これを40℃の90μLのビーズ溶液、ACN/水(およそ2:1 v/v)に添加する)で処理する。ACNは、アセトニトリルを指す。ビーズを洗浄する。その後、PITC終端NTAAをニートTFAで処理してNTAAを消去し、新しいNTAAを得る。
ビーズを洗浄した後、新しいNTAAを一連の結合物質-コーディングポリマーコンジュゲート(80uLの結合物質カクテル、リン酸緩衝液、pH=8.0)で再び処理する。このサイクルでは、ポリマー側鎖は、両端がアルキンで終端している。1つのそのような場合、コーディングポリマーは、ポリアクリレート(約5kDa、PDI=1.8)である。結合物質によるNTAAの認識によって、アルキン終端コーディングポリアクリレートポリマーは、ビーズ上に存在するアジド終端記録ポリマーと極めて近接する。硫酸銅(II)(10mMのストック溶液10uL)およびアスコルビン酸(500mMストック溶液10uL)を混合物に添加し、記録ポリマーにアジド-アルキン付加環化によってコーディングポリマーをライゲーションする。ビーズを緩衝液で入念に洗浄する。その後、フッ化テトラ-n-ブチルアンモニウム(TBAF、最終濃度THF中1mM)などのフッ素試薬を使用して結合物質をポリマー骨格から切断し、その結果、アルキンで終端しているこのときにはトリブロックの記録ポリマー(PEG-アクリルアミド-アクリレート)を得る。
(実施例34)
ナノポアシーケンシング用の配列決定可能なポリマーの構築
記録タグおよびコーディングタグは、配列決定可能なポリマーおよび/またはエンコーディングサブユニットで構成されていることがあり、最終伸長記録タグは、配列決定可能なポリマーで構成されている。ナノポアなどのナノエレクトロニクスシーケンシングの場合、この配列決定可能なポリマーは、エンコーディングユニットがナノポアに通されたときにまたはナノギャップもしくはナノリボンデバイスにより通されたときに電気シグネチャをモジュレートするエンコーディング特性を有する必要がある(Heerema and Dekker 2016)(図56を参照されたい)。エンコーディングユニットを異なる基本電流遮断(またはモジュレーション)部分のつながりから作製して、コンビナトリアル電流遮断シグネチャを生じさせることができる(図56を参照されたい)。コンビナトリアル電流遮断部分に、ポリマーによるナノポアの通過をストールする「ストール」領域を散在させることができる(図56AおよびBを参照されたい)。あるいは、電子技術が十分高速である場合、より良好なシグナルをもたらすために遮断部分の複数の繰り返しをおそらく有するポリマーを、ナノポアで直接読み取ることができる(図56C)。
(実施例35)
コードされたポリマーのナノポアシーケンシング
脂質二重層に埋め込まれたM2-NNN MspAで構成されているナノポアを使用して、転位置ポリマーの遮断電流を測定する(Laszlo, Derrington et al. 2014)(図57を参照されたい)。手短に言えば、本発明者らの動作用緩衝液が入っている2つの約60μLチャンバを隔てる水平な直径約20μmの開口部にわたって1,2-ジフィタノイル-sn-グリセロール-3-ホスホコリン脂質(Avanti Polar Lipids)を塗布することにより、脂質二重層を創出する。Axopatch 200B統合パッチクランプ増幅器(Axon Instruments)は、電圧180mVを二重層に印加し(trans側が正)、ポアを通るイオン電流を測定する。4極ベッセルフィルターを用いて10kHzでアナログ信号にローパスフィルターをかけ、ローパスフィルターの5倍の周波数でアナログ信号をデジタル化する。10mM HEPES/KOH(pH8.0)中の1M KClの塩溶液をcis側とtran側の両方に使用し、実験を室温(23±1℃)で行う。漂白した新しいAgワイヤから作製したAgCl電極を、イオン電流測定用のcis試料溜部とtrans試料溜部の両方に挿入した。生体タンパク質ナノポア、M2-NNN MspA、を接地cis区画に約2.5ng/mlの最終濃度になるように添加する。単一ポアが挿入され次第、コンダクタンスの特徴的増加から分かるので、緩衝液をMspA-free緩衝液で置換して追加のポア形成を防止する。コレステロールアダプターを付加したポリマー(ビオチン部分を有する)をcis区画に、1nMの最終濃度になるように添加する。単量体ストレプトアビジン(mSA2)、Kd約2~3nMをcis側に100nMで添加する(Demonte,Drake et al. 2013)。コレステロールアダプターは、膜へのコレステロール分配により膜表面でポリマーを捕捉する。負荷電ポリマーをポア内に捕捉し、転位置が続いて起こる。ポリマーは、最初のビオチン-mSA2複合体がポアの入口に到達するまで、ナノポアを通って転位置する(図58を参照されたい)。180mVの電圧で、ポリマーは、平均ストール時間がミリ秒オーダーになるような印加力のエネルギー論に起因してscSAが解離するまでポア内でストールする。
(実施例36)
複数サイクルの結合/エンコーディングアッセイ
ペプチドモデル系を使用して、コーディングタグからの情報をビーズに固定化されている記録タグに移行させる3サイクルのエンコーディングを試験した(図59)。PAペプチド配列(配列番号195)を、ビーズに固定化されている記録タグオリゴヌクレオチドamRT_Bbc(配列番号214)に付着させた。amRT_Bbc配列は、BC_3(配列番号66~130)を含有する。結合性物質については、抗PA抗体(Wako Chemical)を、15merバーコードBC4、BC5およびBC13R1(配列番号66~130)で構成されているコーディングタグオリゴヌクレオチドamCT_bc4、amCT_bc5およびamCT_bc13r1(配列番号209~211)にそれぞれ付着させた。この設計により、特異的プライマーセットでのPCR増幅後のゲル解析が容易になる。
磁気アッセイビーズの生成-2ステッププロセス。
キメラを単一ユニットとしてカップリングするのではなく記録タグ固定化後にペプチドをカップリングすることを除いて、図34に記載の1ステップアッセイビーズプロセスと同様の2ステップ固定化プロセスを使用して、DNA記録タグ-ペプチドキメラを磁気ビーズ上に制御された密度で固定化した。つまり、M-270アミンDynabeadsビーズ(Thermo Fisher)を、TCO-PEG12-NHSエステル(BroadPharm)のmPEG-SCM、MW550(Creative PEGWorks)による1:103の比でのタイトレーションにより、Trans-シクロオクテン(TCO)基でまばらに表面機能化した。過剰なアミン基をNHS-アセテートでキャッピングした。2ステップキメラ固定化プロセスでは、二機能性DNA記録タグは、内部アルキン修飾で構成されており、5’アミン修飾を、内部アルキンオリゴヌクレオチド修飾因子のmTetへの第1の変換、次いでTCOビーズへの直接カップリングにより、TCOビーズに固定化し、その後、そのペプチドを記録タグオリゴの5’アミンにカップリングした。具体的には、内部アルキン修飾記録タグオリゴヌクレオチドをmTet-PEG4-アジド(BroadPharm)で修飾し、その後TCO誘導体化ビーズに付着させた。ペプチドをビーズ上の5’アミン記録タグにカップリングするために、システイン含有ペプチドを、固定化されている記録タグの5’アミン基にNHS-PEG8-Mal(Thermo Fisher)によって付着させた。
コーディングタグ標識PA抗体の生成
Protein-Oligonucleotide Conjugationキット(Solulink)を使用して、抗PA抗体とコーディングタグ(amCT_bc4、またはamCT_bc5、またはamCT_bc13r1オリゴヌクレオチド)のコンジュゲーションを達成した。手短に述べると、コーディングタグの5’アミン基をS-4FBで修飾し、その後0.5mL Zebaカラムにより脱塩した。抗PA抗体をS-HyNicで修飾し、その後0.5mL Zebaカラムにより脱塩した。最後に、4FB修飾コーディングタグとHyNic修飾抗PA抗体を混合して抗体-コーディングタグコンジュゲートを調製し、その後、0.5mL Zebaカラムを使用して脱塩した。
抗体に基づく結合/エンコーディングアッセイ:
PAペプチド-記録タグamRT_Bbc(配列番号214)ビーズを上で説明したように調製した。第1のサイクルの結合のアッセイのために、100万個のビーズを、SuperBlock T20(TBS)ブロッキング緩衝液(Thermo Fisher)と共に室温(r.t.)で15分間インキュベートすることにより最初にブロッキングした。40nMのコーディングタグ(BC4)標識PA抗体を50ulのPBST(1×PBS、0.1%Tween(登録商標)-20)中で30分間、37℃でアッセイビーズと共にインキュベートした。ビーズを、10%ホルムアミドを含有する1mlのPBSTによって室温で1回洗浄した。ビーズを、50ulの伸長反応マスターミックス(50mM Tris-Cl(pH7.5)、2mM MgSO、125uM dNTP、50mM NaCl、1mMジチオトレイトール、0.1%Tween(登録商標)-20、0.1mg/mlのBSA、および0.05U/uLのクレノウexo-DNAポリメラーゼ)に再懸濁し、37℃で5分間インキュベートした。プライマー伸長後、ビーズを、150ulのPBST/10%ホルムアミドによって1回、150ulの0.1N NaOHによって5分間、1回、150ulのPBST/10%ホルムアミドによって1回、および50ulのPBSTによって1回、洗浄した(室温で)。第2および第3の結合サイクルアッセイ(図59を参照されたい)については、コーディングタグ(BC5)標識PA抗体、およびコーディングタグ(BC13)標識PA抗体を、結合/エンコーディングアッセイにそれぞれ使用した。第3のエンコーディングサイクル伸長後、最終伸長記録タグを、バーコード特異的プライマーを用いて20ulのPCR混合物中でPCR増幅させ、1ulのPCR産物を10%PAGEゲルで解析した。得られたゲルは、ポリメラーゼ伸長による3サイクルのコーディングタグ情報の記録タグへの結合および書き込みの原理証明を実証する(図59Bを参照されたい)。ゲル解析に加えて、第3の結合アッセイ後に生成された伸長記録タグをプライマーで増幅してNGSシーケンシングライブラリーを生成した。得られたライブラリーをIllumina MiSeq装置で配列決定し、結果を図59Cに示した。伸長記録タグの78%より多くが3つのバーコードを含有した。これは、比較的効率のよい段階的エンコーディングを示す。
(実施例37)
オリゴをブロッキングするアッセイでのエンコーディングの増強
(図3および図36Aも参照されたい)
エンコーディング効率に対する効果を評価するために3サイクルエンコーディングアッセイで異なるDNAブロッカーを使用して結合およびエンコーディングのオリゴモデル系を評価した(図60)。記録タグオリゴヌクレオチド、amRT_Bbc(配列番号214)を、前に説明したようにビーズに固定化した。この記録タグ配列は、「B」DNA捕捉配列(「B’」結合性物質の模倣エピトープ)およびBC_3バーコード(配列番号1~65)を含有する。このモデル系では、結合物質-コーディングタグは、DNAコーディングタグに追加されたB相補配列(B’)を有するオリゴヌクレオチドを用いる。3タイプのDNAブロッカーを試験した(図60A)。CTブロッカーは、コーディングタグ5’Sp’領域およびバーコード配列とハイブリダイズする。3’Sp’配列は、アニーリングのために遊離している。記録タグのSp’ブロッカーおよびRTブロッカーは、Spスペーサー配列、および記録タグのSp-バーコードと、それぞれ、ハイブリダイズする。エンコーディング後、伸長記録タグをPCR増幅し、PAGEを使用して解析した。図60Bに示されているように、第3のサイクルのコードされたバンドは、CTブロッカーの存在下での3サイクルからのPCR産物において観察されたが、単独でのSp’ブロッカーの存在下でも、単独でのRTブロッカーの存在下でも観察されなかった。このデータは、CTブロッカーがコーディングタグ情報の記録タグへの効率的移行を容易にすることを示した。
(実施例38)
伸長記録タグ増幅中の鋳型乗り換えを最小限に抑える。
2つの伸長記録タグオリゴヌクレオチドモデル鋳型TS_Ctrl1(配列番号212)およびTS_Ctrl4(配列番号213)(図61A)を使用して、PCR中の鋳型乗り換えを評価した。これらのモデル鋳型は、伸長記録タグ鋳型構造を模倣するために共通のSpおよびバーコード配列を共有するように設計した。図61Aに示されているモデル鋳型を1:1比で混合し、異なるポリメラーゼを用いる様々な温度でのPCRにより増幅した。鋳型乗り換え率を、10%PAGEゲルを使用するPCR産物の解析により評価し、NGS読み取り(図示せず)によっても評価した。
詳細には、上記2つの鋳型の1:1混合物 10fmolを、図61に示されているようにフォワードおよびリバースプライマーを使用する10ul PCR反応で増幅し、10%PAGEゲルにより解析し、MiSeq DNAシーケンサー(Illumina)を使用するNGSによっても解析した。以下のポリメラーゼについての鋳型乗り換え率を50~68℃のアニーリング温度範囲にわたってアッセイした:Q5 Hot Start(New England Biolabs)、Taq(New England Biolabs)、Deep Vent(exo-)(New England Biolabs)、KOD Xtreme Hot Start(EMD Millipore)およびHerculase II Fusion DNAポリメラーゼ(Agilent)。図61に示されているように、TS_Ctrl1およびTS_Ctrl4からのPCR産物に対応する2つの主バンド(125bpおよび173bp)が観察された。鋳型乗り換え副産物バンドは、ゲル上のより低い分子量のバンドから分かるようにDeep Vent exo-を含む多くのポリメラーゼで観察された(図61Bを参照されたい)が、Taq DNAポリメラーゼ(図61Bを参照されたい)およびKOD Xtreme Hot Start DNA ポリメラーゼ(データ図示せず)では最小限に抑えられたため、その後、これらのポリメラーゼをNGSによってより詳細に解析し、これにより、マッピングされたリード画分の5.6%および2.4%が、TaqおよびKOD Xtreme Hot Start DNAポリメラーゼでの鋳型乗り換えをそれぞれ示すことが明らかになった。
(実施例39)
フルサイクルProteoCodeペプチド配列決定アッセイの実証。
1サイクルProteoCode NGPSアッセイの実証を図62で説明する。本発明者らのN末端機能化およびN末端消去(NTF/NTE)試薬によるペプチドのN末端アミノ酸の除去を2サイクルのF-結合物質結合アッセイにより検出した(図62を参照されたい)。内部PAペプチド配列を伴うN末端FA、AFおよびAペプチド(配列番号201、202および203)を、ビーズ上に固定化された記録タグオリゴヌクレオチドamRT_Cbc(配列番号215)に、実施例1に記載の2ステッププロセスを使用して個々に付着させた。
F-結合物質とコーディングタグamCT_bc4およびamCT_bc5(配列番号209、210)のコンジュゲーションを、前に説明したようなSpyTag/SpyCatcherタンパク質カップリング法を使用して達成した。手短に述べると、SpyCatcherと融合したF-結合物質をE.coliにおいて発現させ、Ni-NTAカラムにより精製し、PBSで透析した。Cys含有ペプチドSpyTag(配列番号198)を、amCT_bc4およびamCT_bc5の5’アミンに、SM(PEG)24(Thermo Fisher)によって付着させた。最後に、SpyTag修飾コーディングタグとSpyCatcher融合F-結合物質を混合して、F-結合物質-コーディングタグコンジュゲートを調製した。
2サイクルのF結合およびエンコーディングを、NTF/NTE化学作用前およびNTF/NTE化学作用後に実施した。結合およびエンコーディングアッセイは、実施例1で説明したように実施した。第1のサイクルのF-結合物質結合/エンコーディングアッセイの後、アッセイビーズをNTF/NTE試薬での処理に供してNTAAを除去した。NTF処理のために、アッセイビーズを0.5M酢酸トリエチルアンモニウム、pH8.5/アセトニトリル(1:1)、0.05%F-127中で150ulの15mM N-Boc-N’-TFA-ピラゾール-1-カルボキサミジン(Sigma)と共に50℃で1時間インキュベートした。ビーズを200ulの0.5M酢酸トリエチルアンモニウム、pH8.5/アセトニトリル(1:1)、0.05%F-127で3回洗浄した。0.05%Tween(登録商標)20を含有する150ulの0.5M NaOHと共に40℃で1時間、アッセイビーズをインキュベートすることにより、NTE処理を実施した。10%ホルムアミドを含有する1mlのPBSTでビーズを洗浄し、F-結合物質-コーディングタグと共に第2のサイクルのF-結合物質結合アッセイに使用した。化学作用後の結合/エンコーディングサイクルと対比しての化学作用前の結合/エンコーディングサイクルのために、F-結合物質を異なるサイクル特異的バーコードコーディングタグとコンジュゲートさせた。アッセイの伸長記録タグをNGSにより解析した。NGS結果は、F-結合物質が、NTF/NTE処理後の第2のサイクルにおいてより高い効率でAFペプチドを検出する一方でFAペプチドを然程検出しないのとは対照的に、F-結合物質が、第1のサイクルにおいてFAペプチドを検出する一方でAFペプチドをほとんど検出しないことを示す。要するに、AFペプチド-記録タグで検出された化学作用前後のF-結合物質エンコーディングのおよそ4倍の増加、その一方で、化学作用前後のFAペプチドでのF-結合物質エンコーディングのおよそ1/4への減少は、DNAエンコーディングを使用する単一サイクルペプチド配列決定の原理証明を有効に実証する。
(実施例40)
クロストーク測定
図36は、ビーズ上のDNAモデル系キメラ密度および分子間クロストークの使用の効果を示す。本発明者らは、4-plexペプチド-記録タグ(RT)クロストークモデル系を、mTet誘導体化カルボキシルM270-Dynalビーズ上のペプチド-RTキメラの表面タイトレーションを使用して開発した。ビーズ表面のペプチド-RTキメラの密度を制御するために、機能的カップリング部位(メチルテトラジン、mTet)を有するビーズを、NH2-PEG4-メチルテトラジン(BroadPharm)のm-PEG4-アミン(BroadPharm)に対する1:100、1:1000、1:10000および1:100000の比でのタイトレーションにより誘導体化した活性M-270カルボキシルDynabeads(Thermo Fisher)から調製した。TCO/mTetカップリングにより、4-plex、非ペプチド、FA、AAおよびAFペプチド付着記録タグを1:100、1:1000、1:10000および1:100000の比でビーズ上に固定化した。
一連のペプチド-RTキメラを、TCO-PEG12-NHSエステル(Click Chemistry Tools)へのカップリングによりRTオリゴヌクレオチドの5’アミンをまず「活性化」することによって創出した。TCO活性化後、内部アルキン基を有するように設計したRTオリゴヌクレオチドを、アジド含有FA、AAおよびAFペプチドにカップリングした。N末端FA、AAおよびAFアミノ酸配列ならびに内部PAエピトープ(配列番号195)を有するペプチドを、記録タグオリゴヌクレオチドamRT_Cs2、amRT_Cs4、およびamRT_Cs5(配列番号217~219)それぞれに個々に付着させた。第4の記録タグamRT_Cs1(配列番号216)を、ペプチドなし対照として含めた。F-結合物質結合性物質を、8merバーコードBC_s7(配列番号221)で構成されているコーディングタグオリゴヌクレオチドamCT_s7(配列番号220)にコンジュゲートさせた。4つのキメラ(FAペプチド、AAペプチド、AFペプチド、およびペプチドなし)を組み合わせ、iEDDA TCO-mTet化学を使用してmTetビーズに固定化した。F-結合物質コーディングタグ構築物を実施例4で説明したように創出した。
記録タグ間のクロストークアッセイシグナルを、4-plexアッセイビーズでの1サイクルF-結合/エンコーディングアッセイにより検出した(図63を参照されたい)。アッセイ条件は、200nMのF-結合物質結合性物質を用いたことを除いて実施例1で説明した。4つの異なるキメラの絶対負荷量を、ユニバーサルPA抗体を用いる第2のサイクルの結合/エンコーディングにより測定し、ここでは、3つのペプチドタイプすべてが、PA抗原配列を含有した。図63Aは、4つのキメラすべてがビーズ上にほぼ等しい量で負荷されたことを示す。特異的エンコーディングを、伸長記録タグのバーコードのNGS読み取りにより判定して、N-末端F-ペプチド記録タグへのF-結合物質エンコーディングにより識別した。クロストークを、N末端非F(AAペプチド、AFペプチド、およびペプチドなし)ペプチド記録タグへのF-結合物質エンコーディングにより識別した。図63Bに示されているように、1:100および1:1000活性化部位ビーズではすべてのキメラ記録タグがF-結合物質バーコードを取得した一方で、1:10000および1:100000ビーズではFA記録タグのみがF-結合物質バーコードを取得した。データは、高記録タグ密度ビーズ(1:100および1:1000)では分子内エンコーディングばかりでなく分子間エンコーディングも起こり、より低密度のビーズ(1:10,000および1:100,000)では主として分子内エンコーディングのみが起こることを示した。結論として、このモデル系は、過疎ビーズで分子内単一分子結合およびエンコーディングを実証した。この実施例の密度タイトレーションが実施例36のDNAモデル系とは、異なるビーズ化学構造を用いたので、直接相関しないことに留意されたい。
(実施例41)
塩基保護DNAを用いるエンコーディング
本発明者らのNTF/NTEエドマン様化学の課題は、高反応性NTF試薬が、ペプチドのN末端アミンを修飾することに加えて、DNAの核酸塩基の環外および他のアミン基も修飾し得ることである。DNA修飾は、アッセイにおいてDNAのエンコーディング機能を損なわせることがある。核酸塩基保護DNAを用いることにより、DNAの修飾を大きく低減させることができる。この手法によって、一連のよりいっそう幅広い化学反応および反応条件の使用が可能になり、その結果、NTAA基の迅速な修飾が容易になる。
核酸塩基保護DNAを用いて上記手法を実行することの1つの課題は、核酸塩基のほとんどの保護基が、プライマー伸長および多くのライゲーションエンコーディングアッセイの有用な要件であるDNAのハイブリッド形成能力を低下させることである。
驚くべきことに、DNAエンコーディングプロセスにおける保護ssDNAの使用により、ssDNAリガーゼ、CircLigase、を使用して、完全保護オリゴヌクレオチド同士をライゲーションすることが可能になる。本発明者らは、完全保護オリゴヌクレオチドとライゲーション接合部のどちらかの側(3’または5’)の天然「T」オリゴヌクレオチドスペーサー配列とをライゲーションするCircLigaseの能力を試験した。本発明者らは、ライゲーション接合部に直接隣接している保護G塩基を使用して5’側のTスペーサーの非存在下で効率的ライゲーションを達成することができることを見出した。3’側には天然Tスペーサーを使用した。
オリゴモデル系を使用して、ビーズに固定化されている記録タグ複合体へのコーディングタグ情報の第1のサイクルの移行を試験した(図64)。ストレプトアビジン機能化ビーズにおける強いビオチン-ストレプトアビジン相互作用を使用して、PRT_0T_B’_bioをビーズ上に固定化した。PRT_0T_B’_bio配列は、「B’」DNA捕捉配列(「B」結合性物質の模倣エピトープ)と、保護dA、dGおよびdCで構成されている対応する「B’」バーコードとを含有する。結合性物質については、相補的「B」結合配列CT_B_thio(配列番号206)を、ヘテロ二機能性リンカーによってコーディングタグオリゴヌクレオチドにカップリングさせ、保護dA、dGおよびdCで構成されているPCT_1T(配列番号207)を用いた。CircLigase IIを使用して特異的B配列/B’配列結合事象を一本鎖ライゲーションによりコードし、ゲル解析により確認した。
チオール含有「B’」配列RT_thio_B’_bio(配列番号204)をSM(PEG)8(Thermo Fisher)によってPRT_0T(dU)(配列番号205)の5’アミン基に付着させ、得られた記録タグ、PRT_0T_B’bioを15%変性PAGEにより精製した。記録タグを、mPEG-ビオチン、MW1000(Creative PEGWorks)に対する1:10の比でのタイトレーションにより誘導体化したM-270ストレプトアビジンDynabeads(Thermo Fisher)上に固定化した。ビーズをUSER酵素(New England Biolabs)で処理して、記録タグの5’末端にリン酸化部位-5’リン酸G-を生成した。「B」結合配列B_thioとPCT_1TのコンジュゲーションをSM(PEG)8(Thermo Fisher)によって連結させ、コーディングタグコンジュゲートを15%変性PAGEにより精製した。
第1のサイクルについては、結合アッセイは、800nMのコーディングタグコンジュゲートを50ulのPBST中で30分間、37℃で5’リン酸化記録タグ固定化ビーズと共にインキュベートしたことを除いて、前に説明したものと同様であった。ビーズを、40%ホルムアミドを含有する50ulのPBSTで2回、50ulの33mM Tris-HCl緩衝液、pH7.5で1回、室温で洗浄した。ビーズを50ulのCircLigase IIライゲーション反応マスターミックス(33mM Tris-酢酸塩、pH7.5、66mM酢酸カリウム、0.5mM DTT、2.5mM MnCl2、1Mベタイン、および0.25U CircLigase II ssDNAリガーゼ(Illumina))に再懸濁し、37℃で30分間インキュベートした。ライゲーション反応後、ビーズを固定化緩衝液(5mM Tris-Cl(pH7.5)、0.5mM EDTA、1M NaCl、40%ホルムアミド)で1回、40%ホルムアミドを含有するPBSTで1回洗浄した。記録タグを、65℃で95%ホルムアミド/10mM EDTA中で5分間インキュベートすることによってビーズから溶出した。溶出したコンジュゲートをPAGEゲルにより解析した。図64のレーン4にバンドのシフトがある、得られたゲルは、一本鎖DNAライゲーションを使用する保護dA、dCおよびdG塩基で構成されている記録タグへのコーディングタグ情報の書き込みの原理証明を実証する(図64を参照されたい)。
(実施例42)
DNAビーズへのハイブリダイゼーションおよびライゲーションを使用するDNAタグ付きペプチドの固定化。
ビーズ上へのペプチド-記録タグDNAキメラの効率的固定化は、ProteoCodeアッセイの重要な成分であり、この効率的固定化を化学的に達成することができるが、ハイブリダイゼーション捕捉および酵素的または化学的ライゲーションによって行うこともできる。本発明者らは、ハイブリダイゼーションに基づく捕捉が、化学的カップリングより約10,000倍効率が高いことを見出す。ここで、本発明者らは、DNA捕捉ビーズ上へのDNAタグ付きペプチドのハイブリダイゼーションおよび酵素的ライゲーション固定化の有用性を実証する。
DNA-ペプチドキメラを、磁気ビーズに化学的に固定化したヘアピン捕捉DNAにハイブリダイズし、ライゲーションした(図65を参照されたい)。trans-シクロオクテン(TCO)およびメチルテトラジン(mTet)に基づくクリック化学を使用して、捕捉DNAをビーズにコンジュゲートさせた。TCOで修飾された短いヘアピンDNA(16塩基対のステム、24塩基の5’突出)を、mTetコーティング磁気ビーズと反応させた。リン酸化DNA-ペプチドキメラ(1nM)を5×SSC、0.02%SDS中でヘアピンDNAビーズにアニーリングし、30分間、37℃でインキュベートした。ビーズをPBSTで1回洗浄し、T4 DNAリガーゼを含有するまたは含有しない1×Quickライゲーション溶液(NEB)に再懸濁した。25℃での30分のインキュベーション後、ビーズをPBSTで1回洗浄し、20ulのPBSTに再懸濁した。全捕捉DNA、DNAタグ付きペプチドおよびライゲーションしたDNAタグ付きペプチドを、特異的プライマーセットを使用してqPCRにより定量化した(図65D)。図65Eに示されているように、低いCt値が、ビーズ/DNAペプチドハイブリッドでのqPCRにおいてリガーゼの存在下でのみ得られた。これは、DNAタグ付きペプチドがビーズに有効にライゲーションされ、固定化されたことを示す。
Figure 0007390027000144
Figure 0007390027000145
Figure 0007390027000146
Figure 0007390027000147
/3SpC3/ = 3’ C3 (炭素3個)スペーサー
/i5OctdU/= 5’-オクタジイニルdU
/iSP18/ = 18原子ヘキサ-エチレングリコールスペーサー
5ProtP = 5’シアノエチル保護ホスフェート
3ProtP = 3’シアノエチル保護ホスフェート
* =保護塩基(Bz-dA、ibu-dG、Ac-dC)
VI.さらなる例示的実施形態
以下の実施形態は、本開示のさらなる実例を提供するものである。
1A.(a)分析物と直接または間接的に会合するように構成されている記録ポリマーと、
(b)(i)分析物に結合することが可能な結合性部分に関する識別情報を含み、前記結合性部分と直接もしくは間接的に会合して結合性物質を形成するように構成されている、コーディングポリマー、および/または(ii)標識
を含むキットであって、
前記記録ポリマーおよび前記コーディングポリマーが、前記結合性物質と前記分析物との結合時に前記記録ポリマーと前記コーディングポリマーの間での情報の移行を可能にするように構成されているキットであり、
必要に応じて、(c)前記結合性部分
を含む、キット。
2A.前記記録ポリマーおよび/または前記分析物が、支持体に直接または間接的に固定化されるように構成されている、実施形態1Aに記載のキット。
3A.前記記録ポリマーが、前記支持体に固定化されるように構成されており、それにより、前記記録ポリマーに付随する前記分析物が固定化される、実施形態2Aに記載のキット。
4A.前記分析物が、前記支持体に固定化されるように構成されており、それにより、前記分析物に付随する前記記録ポリマーが固定化される、実施形態2Aに記載のキット。
5A.前記記録ポリマーおよび前記分析物の各々が、前記支持体に固定化されるように構成されている、実施形態2Aに記載のキット。
6A.前記記録ポリマーおよび前記分析物が、両方が支持体に固定化されたときに共局在するように構成されている、実施形態5Aに記載のキット。
7A.(i)支持体に直接または間接的に固定化されるように、ならびに
(ii)前記記録ポリマーおよび/または前記分析物と直接または間接的に会合するように
構成されている固定化リンカーをさらに含む、実施形態1A~6Aのいずれかに記載のキット。
8A.前記固定化リンカーが、前記記録ポリマーおよび前記分析物と会合するように構成されている、実施形態7Aに記載のキット。
9A.前記固定化リンカーが、前記支持体に直接固定化されるように構成されており、それにより、前記固定化リンカーに付随する前記記録ポリマーおよび/または前記分析物が固定化される、実施形態7Aまたは8Aに記載のキット。
10A.支持体をさらに含む、実施形態2A~9Aのいずれか1つに記載のキット。
11A.前記結合性物質と前記分析物との結合時に前記コーディングポリマーと前記記録ポリマーの間で情報を移行させるための1つまたは複数の試薬をさらに含む、実施形態1A~10Aのいずれか1つに記載のキット。
12A.前記1つまたは複数の試薬が、前記コーディングポリマーから前記記録ポリマーに情報を移行させるように構成されており、それにより、伸長記録ポリマーが生成される、実施形態11Aに記載のキット。
13A.前記1つまたは複数の試薬が、前記記録ポリマーから前記コーディングポリマーに情報を移行させるように構成されており、それにより、伸長コーディングポリマーが生成される、実施形態11Aに記載のキット。
14A.前記1つまたは複数の試薬が、前記コーディングポリマーからの情報および前記記録ポリマーからの情報を含むジタグ構築物を生成するように構成されている、実施形態11Aに記載のキット。
15A.前記記録ポリマーのうちの少なくとも2つを含む、実施形態1A~14Aのいずれか1つに記載のキット。
16A.各々がそれに付随する結合性部分に関する識別情報を含む、前記コーディングポリマーのうちの少なくとも2つを含む、実施形態1A~15Aのいずれか1つに記載のキット。
17A.前記結合性物質のうちの少なくとも2つを含む、実施形態1A~16Aのいずれか1つに記載のキット。
18A.(i)第1の結合性物質と前記分析物との結合時に、前記第1の結合性物質の第1のコーディングポリマーから前記記録ポリマーに情報を移行させて一次伸長記録ポリマーを生成するための1つもしくは複数の試薬、および/または
(ii)第2の結合性物質と前記分析物との結合時に、前記第2の結合性物質の第2のコーディングポリマーから前記一次伸長記録ポリマーに情報を移行させて二次伸長記録ポリマーを生成するための1つもしくは複数の試薬
を含み、
(i)の1つまたは複数の試薬と(ii)の1つまたは複数の試薬が、同じであってもよく、または異なっていてもよい、実施形態17Aに記載のキット。
19A.(iii)第3の(またはより高次の)結合性物質と前記分析物との結合時に、前記第3の(またはより高次の)結合性物質の第3の(またはより高次の)コーディングポリマーから前記二次伸長記録ポリマーに情報を移行させて三次(またはより高次の)伸長記録ポリマーを生成するための1つまたは複数の試薬をさらに含む、実施形態18Aに記載のキット。
20A.(i)第1の結合性物質と前記分析物との結合時に、前記第1の結合性物質の第1のコーディングポリマーから第1の記録ポリマーに情報を移行させて第1の伸長記録ポリマーを生成するための1つもしくは複数の試薬、および/または
(ii)第2の結合性物質と前記分析物との結合時に、前記第2の結合性物質の第2のコーディングポリマーから第2の記録ポリマーに情報を移行させて第2の伸長記録ポリマーを生成するための1つもしくは複数の試薬
を含み、
(i)の1つまたは複数の試薬と(ii)の1つまたは複数の試薬が、同じであってもよく、または異なっていてもよい、実施形態17Aに記載のキット。
21A.(iii)第3の(またはより高次の)結合性物質と前記分析物との結合時に、前記第3の(またはより高次の)結合性物質の第3の(またはより高次の)コーディングポリマーから第3の(またはより高次の)記録ポリマーに情報を移行させて第3の(またはより高次の)伸長記録ポリマーを生成するための1つまたは複数の試薬をさらに含む、実施形態20Aに記載のキット。
22A.前記第1の記録ポリマー、前記第2の記録ポリマー、および/または前記第3の(もしくはより高次の)記録ポリマーが、前記分析物と直接または間接的に会合するように構成されている、実施形態20Aまたは21Aに記載のキット。
23A.前記第1の記録ポリマー、前記第2の記録ポリマー、および/または前記第3の(もしくはより高次の)記録ポリマーが、支持体上に固定化されるように構成されている、実施形態20A~22Aのいずれか1つに記載のキット。
24A.前記第1の記録ポリマー、前記第2の記録ポリマー、および/または前記第3の(もしくはより高次の)記録ポリマーが、前記分析物と共局在するように、例えば、前記第1、第2または第3の(またはより高次の)結合性物質と前記分析物との結合時に、前記第1、第2または第3の(またはより高次の)コーディングポリマーと前記第1、第2または第3の(またはより高次の)記録ポリマーとの間の情報の移行をそれぞれ可能にするように、構成されている、実施形態20A~23Aのいずれか1つに記載のキット。
25A.前記第1のコーディングポリマー、前記第2のコーディングポリマー、および/または前記第3の(もしくはより高次の)コーディングポリマーの各々が、結合サイクル特異的バーコード、例えば、結合サイクル特異的スペーサーポリマー配列C、および/もしくはコーディングポリマー特異的スペーサーポリマー配列C(ここで、nは整数であり、Cは、第nの結合性物質とポリペプチドとの結合を示す)を含む;または結合サイクルタグCが、外因的に付加される、例えば、前記結合サイクルタグCが、前記コーディングポリマーにとって外来のものであり得る、実施形態20A~24Aのいずれか1つに記載のキット。
26A.前記分析物がポリペプチドを含む、実施形態1A~25Aのいずれか1つに記載のキット。
27A.前記結合性部分が、前記ポリペプチドの1つもしくは複数のN末端もしくはC末端アミノ酸に結合することが可能である、または官能化試薬により修飾された前記1つもしくは複数のN末端もしくはC末端アミノ酸に結合することが可能である、実施形態26Aに記載のキット。
28A.官能化試薬をさらに含む、実施形態26Aまたは27Aに記載のキット。
29A.前記ポリペプチドの1つもしくは複数のN末端、内部もしくはC末端アミノ酸を(例えば、化学的切断もしくは酵素的切断により)除去するための、または官能化されたN末端、内部もしくはC末端アミノ酸を除去するための、消去試薬をさらに含み、必要に応じて、前記消去試薬が、カルボキシペプチダーゼもしくはアミノペプチダーゼまたはそのバリアント、変異体もしくは修飾タンパク質;ヒドロラーゼまたはそのバリアント、変異体もしくは修飾タンパク質;穏やかなエドマン分解試薬;エドマナーゼ酵素;無水TFA、塩基;あるいはこれらの任意の組合せを含む、実施形態26~28のいずれか1つに記載のキット。
30A.前記1つまたは複数のN末端、内部またはC末端アミノ酸が、
(i)N末端アミノ酸(NTAA);
(ii)N末端ジペプチド配列;
(iii)N末端トリペプチド配列;
(iv)内部アミノ酸;
(v)内部ジペプチド配列;
(vi)内部トリペプチド配列;
(vii)C末端アミノ酸(CTAA);
(viii)C末端ジペプチド配列;もしくは
(ix)C末端トリペプチド配列、
またはこれらの任意の組合せ
を含み、
必要に応じて、(i)~(ix)のアミノ酸残基のいずれか1つまたは複数が修飾または官能化されている、実施形態26A~29Aのいずれか1つに記載のキット。
31A.少なくとも(a)(i)解析されるポリペプチドのN末端アミノ酸(NTAA)または官能化NTAAに結合することが可能な第1の結合性部分および(ii)前記第1の結合性部分に関する識別情報を含む第1のコーディングポリマーを含む、第1の結合性物質と、
必要に応じて(b)前記ポリペプチドと直接または間接的に会合するように構成されている記録ポリマーと、
さらに必要に応じて(c)第1の官能化NTAAを生成するために前記ポリペプチドの第1のNTAAを修飾することができる官能化試薬と
を含むキットであって、
前記記録ポリマーおよび前記第1の結合性物質が、前記第1の結合性物質と前記ポリペプチドとの結合時に前記第1のコーディングポリマーと前記記録ポリマーの間の情報の移行を可能にするように構成されている、キット。
32A.前記第1のコーディングポリマーから前記記録ポリマーに情報を移行させることによって一次伸長記録ポリマーを生成するための1つまたは複数の試薬をさらに含む、実施形態31Aに記載のキット。
33A.前記官能化試薬が、化学薬剤、酵素、および/または生物学的薬剤、例えば、イソチオシアネート誘導体、2,4-ジニトロベンゼンスルホン酸(DNBS)、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)1-フルオロ-2,4-ジニトロベンゼン、ダンシルクロリド、7-メトキシクマリン酢酸、チオアシル化試薬、チオアセチル化試薬、またはチオベンジル化試薬を含む、実施形態31Aまたは32Aに記載のキット。
34A.前記第1の官能化NTAAを(例えば、化学的切断または酵素的切断により)除去して、直接隣接しているアミノ酸残基を第2のNTAAとして露出させるための消去試薬をさらに含む、実施形態31A~33Aのいずれか1つに記載のキット。
35A.前記第2のNTAAが、前記第1の官能化NTAAと同じであってもよくまたは異なっていてもよい第2の官能化NTAAを生成するように同じまたは異なる官能化試薬により官能化され得る、実施形態34Aに記載のキット。
36A.(d)(i)第2の官能化NTAAに結合することが可能な第2の(またはより高次の)結合性部分と、(ii)第2の(またはより高次の)結合性部分に関する識別情報を含む第2の(またはより高次の)コーディングポリマーとを含む、第2の(またはより高次の)結合性物質をさらに含み、
前記第1のコーディングポリマーと前記第2の(またはより高次の)コーディングポリマーが、同じであってもよく、または異なっていてもよい、実施形態35Aに記載のキット。
37A.前記第1の官能化NTAAおよび前記第2の官能化NTAAが、官能化N末端アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リシン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、トレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)からなる群から、これらの任意の組合せで、互いに独立して選択される、実施形態36Aに記載のキット。
38A.前記第2の(またはより高次の)コーディングポリマーから前記一次伸長記録ポリマーに情報を移行させることによって二次(またはより高次の)伸長記録ポリマーを生成するための1つまたは複数の試薬をさらに含む、実施形態36Aまたは37Aに記載のキット。
39A.少なくとも(a)(i)解析されるポリペプチドのN末端アミノ酸(NTAA)もしくは官能化NTAAに結合することが可能な結合性部分と(ii)前記結合性部分に関する識別情報を含むコーディングポリマーとを各々が含む、1つもしくは複数の結合性物質、および/または
(b)前記ポリペプチドと直接もしくは間接的に会合するように構成されている1つもしくは複数の記録ポリマー
を含むキットであって、
前記1つまたは複数の記録ポリマーおよび前記1つまたは複数の結合性物質が、各結合性物質と前記ポリペプチドとの結合時に前記コーディングポリマーと前記記録ポリマーの間の情報の移行を可能にするように構成されているキットであり、
必要に応じて(c)第1の官能化NTAAを生成するために前記ポリペプチドの第1のNTAAを修飾することができる官能化試薬を含む、キット。
40A.前記第1の官能化NTAAを(例えば、化学的切断または酵素的切断により)除去して、直接隣接しているアミノ酸残基を第2のNTAAとして露出させるための消去試薬をさらに含む、実施形態39Aに記載のキット。
41A.前記第2のNTAAが、前記第1の官能化NTAAと同じであってもよくまたは異なっていてもよい第2の官能化NTAAを生成するように同じまたは異なる官能化試薬により官能化され得る、実施形態40Aに記載のキット。
42A.前記第1の官能化NTAAおよび前記第2の官能化NTAAが、官能化N末端アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リシン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、トレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)からなる群から、これらの任意の組合せで、互いに独立して選択される、実施形態41Aに記載のキット。
43A.(i)第1の結合性物質と前記ポリペプチドとの結合時に、前記第1の結合性物質の第1のコーディングポリマーから第1の記録ポリマーに情報を移行させて第1の伸長記録ポリマーを生成するための1つもしくは複数の試薬、および/または
(ii)第2の結合性物質と前記ポリペプチドとの結合時に、前記第2の結合性物質の第2のコーディングポリマーから第2の記録ポリマーに情報を移行させて第2の伸長記録ポリマーを生成するための1つもしくは複数の試薬
を含み、
(i)の1つまたは複数の試薬と(ii)の1つまたは複数の試薬が、同じであってもよく、または異なっていてもよい、実施形態39A~42Aのいずれか1つに記載のキット。
44A.(iii)第3の(またはより高次の)結合性物質と前記ポリペプチドとの結合時に、前記第3の(またはより高次の)結合性物質の第3の(またはより高次の)コーディングポリマーから第3の(またはより高次の)記録ポリマーに情報を移行させて第3の(またはより高次の)伸長記録ポリマーを生成するための1つまたは複数の試薬をさらに含む、実施形態43Aに記載のキット。
45A.前記第1の記録ポリマー、前記第2の記録ポリマー、および/または前記第3の(もしくはより高次の)記録ポリマーが、前記ポリペプチドと直接または間接的に会合するように構成されている、実施形態43Aまたは44Aに記載のキット。
46A.前記第1の記録ポリマー、前記第2の記録ポリマー、および/または前記第3の(もしくはより高次の)記録ポリマーが、支持体上に固定化されるように構成されている、実施形態43A~45Aのいずれか1つに記載のキット。
47A.前記第1の記録ポリマー、前記第2の記録ポリマー、および/または前記第3の(もしくはより高次の)記録ポリマーが、前記ポリペプチドと共局在するように、例えば、前記第1、第2または第3の(またはより高次の)結合性物質と前記ポリペプチドとの結合時に、前記第1、第2または第3の(またはより高次の)コーディングポリマーと前記第1、第2または第3の(またはより高次の)記録ポリマーとの間の情報の移行をそれぞれ可能にするように、構成されている、実施形態43A~46Aのいずれか1つに記載のキット。
48A.前記第1のコーディングポリマー、前記第2のコーディングポリマー、および/または前記第3の(もしくはより高次の)コーディングポリマーの各々が、結合サイクル特異的バーコード、例えば、結合サイクル特異的スペーサーポリマー配列C、またはコーディングポリマー特異的スペーサーポリマー配列C、または外因性結合サイクルタグC(ここで、nは整数であり、Cは、第nの結合性物質とポリペプチドとの結合を示す)を含む、実施形態43A~47Aのいずれか1つに記載のキット。
49A.前記分析物または前記ポリペプチドが、タンパク質もしくはポリペプチド鎖またはその断片、脂質、炭水化物、あるいは大環状分子を含む、実施形態1A~48Aのいずれか1つに記載のキット。
50A.前記分析物または前記ポリペプチドが、巨大分子またはその複合体、例えばタンパク質複合体、またはそのサブユニットを含む、実施形態1A~49Aのいずれか1つに記載のキット。
51A.前記記録ポリマーが、核酸、オリゴヌクレオチド、修飾オリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、1つまたは複数の保護された塩基を有するDNAもしくはRNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはモルホリノ、非核酸の配列決定可能なポリマー、例えば、多糖、ポリペプチド、ペプチド、もしくはポリアミド、あるいはこれらの組合せを含む、実施形態1A~50Aのいずれか1つに記載のキット。
52A.前記記録ポリマーが、ユニバーサルプライミング部位を含む、実施形態1A~51Aのいずれか1つに記載のキット。
53A.前記記録ポリマーが、増幅、配列決定、またはその両方のためのプライミング部位を含み、例えば、前記ユニバーサルプライミング部位が、増幅、配列決定、またはその両方のためのプライミング部位を含む、実施形態1A~52Aのいずれか1つに記載のキット。
54A.前記記録ポリマーおよび/または前記コーディングポリマーが、一意の分子識別子(UMI)を含む、実施形態1A~53Aのいずれか1つに記載のキット。
55A.前記記録ポリマーおよび/または前記コーディングポリマーが、バーコードおよび/またはヌクレアーゼ部位、例えば、ニッキングエンドヌクレアーゼ部位(例えば、dsDNAニッキングエンドヌクレアーゼ部位)を含む、実施形態1A~54Aのいずれか1つに記載のキット。
56A.前記記録ポリマーおよび/または前記コーディングポリマーが、その3’末端および/またはその5’末端にスペーサーポリマーを含み、例えば、前記記録ポリマーが、その3’末端にスペーサーポリマーを含む、実施形態1A~55Aのいずれか1つに記載のキット。
57A.固体支持体、例えば、剛性固体支持体、可撓性固体支持体、または軟質固体支持体を含み、多孔質支持体または非多孔質支持体を含む、実施形態1A~56Aのいずれか1つに記載のキット。
58A.ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、スピン干渉ディスク、膜、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子(例えば、磁気ナノ粒子(Fe)、金ナノ粒子および/もしくは銀ナノ粒子などの、金属を含む)、量子ドット、ナノシェル、ナノケージ、マイクロスフェア、またはこれらの任意の組合せを含む、支持体を含む、実施形態1A~57Aのいずれか1つに記載のキット。
59A.前記支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、もしくは制御ポアビーズ、またはこれらの任意の組合せを含む、実施形態58Aに記載のキット。
60A.支持体を含み、複数の前記分析物または前記ポリペプチドを逐次反応で、並列反応で、または逐次反応と並列反応の組合せで解析するためのものである、実施形態1A~59Aのいずれか1つに記載のキット。
61A.前記分析物の間にまたは前記ポリペプチドの間に前記支持体上で平均距離約10nmに等しいもしくはそれより長い、約15nmに等しいもしくはそれより長い、約20nmに等しいもしくはそれより長い、約50nmに等しいもしくはそれより長い、約100nmに等しいもしくはそれより長い、約150nmに等しいもしくはそれより長い、約200nmに等しいもしくはそれより長い、約250nmに等しいもしくはそれより長い、約300nmに等しいもしくはそれより長い、約350nmに等しいもしくはそれより長い、約400nmに等しいもしくはそれより長い、約450nmに等しいもしくはそれより長い、または約500nmに等しいもしくはそれより長い間隔をあける、実施形態60Aに記載のキット。
62A.前記結合性部分が、ポリペプチドもしくはその断片、タンパク質もしくはポリペプチド鎖もしくはその断片、またはタンパク質複合体もしくはそのサブユニット、例えば、抗体もしくはその抗原結合断片を含む、実施形態1A~61Aのいずれか1つに記載のキット。
63A.前記結合性部分が、カルボキシペプチダーゼもしくはアミノペプチダーゼまたはそのバリアント、変異体もしくは修飾タンパク質;アミノアシルtRNA合成酵素またはそのバリアント、変異体もしくは修飾タンパク質;アンチカリンまたはそのバリアント、変異体もしくは修飾タンパク質;ClpSまたはそのバリアント、変異体もしくは修飾タンパク質;UBRボックスタンパク質またはそのバリアント、変異体もしくは修飾タンパク質;アミノ酸に結合する修飾小分子、すなわちバンコマイシンまたはそのバリアント、変異体もしくは修飾分子;あるいはこれらの任意の組合せを含む、または
各結合性物質中の、前記結合性部分が、小分子を含み、前記コーディングポリマーが、前記小分子を識別するポリヌクレオチドを含み、それによって、複数の前記結合性物質が、DNAにコードされた小分子のライブラリーなどの、コードされた小分子のライブラリーを形成する、実施形態1A~62Aのいずれか1つに記載のキット。
64A.前記結合性部分が、前記分析物または前記ポリペプチドに選択的におよび/または特異的に結合することが可能である、実施形態1A~63Aのいずれか1つに記載のキット。
65A.前記コーディングポリマーが、核酸、オリゴヌクレオチド、修飾オリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、1つまたは複数の保護された塩基を有するDNAもしくはRNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはモルホリノ、または非核酸の配列決定可能なポリマー、例えば、多糖、ポリペプチド、ペプチド、もしくはポリアミド、これらの組合せを含む、実施形態1A~64Aのいずれか1つに記載のキット。
66A.前記コーディングポリマーが、エンコーダー配列などのバーコード配列、例えば、前記結合性部分を識別するものを含む、実施形態1A~65Aのいずれか1つに記載のキット。
67A.前記コーディングポリマーが、スペーサーポリマー、結合サイクル特異的配列、一意の分子識別子(UMI)、ユニバーサルプライミング部位、またはこれらの任意の組合せを含み、
必要に応じて、結合サイクル特異的配列が、各結合サイクル後に記録ポリマーに付加される、実施形態1A~66Aのいずれか1つに記載のキット。
68A.前記結合性部分および前記コーディングポリマーが、リンカーまたは結合対によって接合されている、実施形態1A~67Aのいずれか1つに記載のキット。
69A.前記結合性部分と前記コーディングポリマーが、SpyTag/SpyCatcher、SpyTag-KTag/SpyLigase(この場合、接合される2つの部分がSpyTag/KTag対を有し、SpyLigaseがSpyTagをKTagに接合させ、かくして2つの部分が接合される)、ソルターゼ、SnoopTag/SnoopCatcherペプチド-タンパク質対、もしくはHaloTag/HaloTagリガンド対、またはこれらの任意の組合せによって接合されている、実施形態1A~68Aのいずれか1つに記載のキット。
70A.鋳型または非鋳型反応において前記コーディングポリマーと前記記録ポリマーの間で情報を移行させるための試薬をさらに含み、必要に応じて、前記試薬が、(i)化学的ライゲーション試薬もしくは生物学的ライゲーション試薬、例えば、一本鎖核酸もしくは二本鎖核酸をライゲーションするためのDNAリガーゼもしくはRNAリガーゼなどのリガーゼであるか、または(ii)一本鎖核酸もしくは二本鎖核酸のプライマー伸長のための試薬であり;
必要に応じて、前記キットが、少なくとも2つのリガーゼもしくはそれらのバリアント(例えば、少なくとも2つのDNAリガーゼ、もしくは少なくとも2つのRNAリガーゼ、もしくは少なくとも1つのDNAリガーゼおよび少なくとも1つのRNAリガーゼ)を含むライゲーション試薬であって、前記少なくとも2つのリガーゼもしくはそれらのバリアントが、アデニル化リガーゼおよび構成的にアデニル化されていないリガーゼを含む、ライゲーション試薬をさらに含み、または
必要に応じて、前記キットが、DNAもしくはRNAリガーゼおよびDNA/RNAデアデニレースを含むライゲーション試薬をさらに含む、実施形態1A~69Aのいずれか1つに記載のキット。
71A.前記コーディングポリマーと前記記録ポリマーの間で情報を移行させるためのポリメラーゼ、例えばDNAポリメラーゼもしくはRNAポリメラーゼ、または逆転写酵素、[リガーゼを加える?]をさらに含む、実施形態1A~70Aのいずれか1つに記載のキット。
72A.核酸配列解析のための1つまたは複数の試薬をさらに含む、実施形態1A~71Aのいずれか1つに記載のキット。
73A.前記核酸配列解析が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、パイロシーケンシング、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、もしくは先端顕微鏡を使用したDNAのダイレクトイメージング、またはこれらの任意の組合せを含む、実施形態72Aに記載のキット。
74A.核酸増幅のための、例えば、1つまたは複数の伸長記録ポリマーを増幅するための、1つまたは複数の試薬をさらに含み、必要に応じて、前記核酸増幅が、指数関数的増幅反応(例えば、鋳型乗り換えを低減もしくは消去するためのエマルジョンPCRなどの、ポリメラーゼ連鎖反応(PCR))および/または線形増幅反応(例えば、in vitro転写による等温増幅、もしくはキメラプライマーにより開始される核酸の等温増幅(ICAN))を含む、実施形態1A~73Aのいずれか1つに記載のキット。
75A.コーディングポリマー情報を前記記録ポリマーに移行させて伸長記録ポリマーを形成するための1つまたは複数の試薬を含み、前記伸長記録ポリマー上のコーディングポリマー情報の順序および/または頻度が、前記結合性物質が前記分析物または前記ポリペプチドに結合する順序および/または頻度を示す、実施形態1A~74Aのいずれか1つに記載のキット。
76A.標的濃縮、例えば、1つまたは複数の伸長記録ポリマーの濃縮のための1つまたは複数の試薬をさらに含む、実施形態1A~75Aのいずれか1つに記載のキット。
77A.サブトラクション、例えば、1つまたは複数の伸長記録ポリマーのサブトラクションのための1つまたは複数の試薬をさらに含む、実施形態1A~76Aのいずれか1つに記載のキット。
78A.例えば、1つまたは複数の分析物またはポリペプチドなどの極めて豊富な種を低減させるための、正規化のための1つまたは複数の試薬をさらに含む、実施形態1A~77Aのいずれか1つに記載のキット。
79A.少なくとも1つの結合性物質が、末端アミノ酸残基、末端ジアミノ酸残基、または末端トリプルアミノ酸残基に結合する、実施形態1A~78Aのいずれか1つに記載のキット。
80A.少なくとも1つの結合性物質が、翻訳後修飾されたアミノ酸に結合する、実施形態1A~79Aのいずれか1つに記載のキット。
81A.試料中の複数の分析物またはポリペプチドを複数のコンパートメントに分配するための1つまたは複数の試薬または手段をさらに含み、各コンパートメントが、支持体(例えば、固体支持体)に必要に応じて接合されている複数のコンパートメントタグ(例えば、非核酸の配列決定可能なポリマーの形態のもの)を含み、前記複数のコンパートメントタグが、個々のコンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、実施形態1A~80Aのいずれか1つに記載のキット。
82A.前記複数の分析物またはポリペプチド(例えば、複数のタンパク質複合体、タンパク質および/またはポリペプチド)を複数のポリペプチド断片に断片化するための1つまたは複数の試薬または手段をさらに含む、実施形態81Aに記載のキット。
83A.前記複数のポリペプチド断片を、前記複数のコンパートメントの各々の中のコンパートメントタグとアニーリングまたは接合させることによって複数のコンパートメントタグ付きポリペプチド断片を生成するための1つまたは複数の試薬または手段をさらに含む、実施形態81Aまたは82Aに記載のキット。
84A.前記複数のコンパートメントが、マイクロ流体液滴、マイクロウェル、もしくは表面上の分離された領域、またはこれらの任意の組合せを含む、実施形態81A~83Aのいずれか1つに記載のキット。
85A.前記複数のコンパートメントの各々が、平均して単一の細胞を含む、実施形態81A~84Aのいずれか1つに記載のキット。
86A.前記試料中の前記複数の分析物またはポリペプチドを標識するための1つまたは複数のユニバーサルDNAタグをさらに含む、実施形態81A~85Aのいずれか1つに記載のキット。
87A.前記試料中の前記複数の分析物またはポリペプチドを1つまたは複数のユニバーサルDNAタグで標識するための1つまたは複数の試薬をさらに含む、実施形態81A~86Aのいずれか1つに記載のキット。
88A.プライマー伸長またはライゲーションのための1つまたは複数の試薬をさらに含む、実施形態81A~87Aのいずれか1つに記載のキット。
89A.前記支持体が、ビーズ、例えば、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、もしくは制御ポアビーズ、またはこれらの任意の組合せを含む、実施形態81A~88Aのいずれか1つに記載のキット。
90A.前記コンパートメントタグが、一本鎖または二本鎖核酸分子を含む、実施形態81A~89Aのいずれか1つに記載のキット。
91A.前記コンパートメントタグが、バーコードおよび必要に応じてUMIを含む、実施形態81A~90Aのいずれか1つに記載のキット。
92A.前記支持体が、ビーズであり、前記コンパートメントタグが、バーコードを含む、実施形態81A~91Aのいずれか1つに記載のキット。
93A.前記支持体がビーズを含み、複数のコンパートメントタグが接合されているビーズが、スプリット・アンド・プール合成、個々の合成、または固定化により形成される、実施形態81A~92Aのいずれか1つに記載のキット。
94A.スプリット・アンド・プール合成、個々の合成、または固定化のための1つまたは複数の試薬をさらに含む、実施形態81A~93Aのいずれか1つに記載のキット。
95A.前記コンパートメントタグが、記録ポリマー内の成分であり、前記記録ポリマーが、必要に応じて、スペーサーポリマー、バーコード配列、一意の分子識別子、ユニバーサルプライミング部位、またはこれらの任意の組合せをさらに含む、実施形態81A~94Aのいずれか1つに記載のキット。
96A.前記コンパートメントタグが、前記複数の分析物またはポリペプチド(例えば、タンパク質複合体、タンパク質、またはポリペプチド)の内部アミノ酸、ペプチド骨格またはN末端アミノ酸と反応することができる機能的部分をさらに含む、実施形態81A~95Aのいずれか1つに記載のキット。
97A.前記機能的部分が、アルデヒド、アジド/アルキン、マレイミド/チオール、エポキシ/求核試薬、逆電子要請型ディールス-アルダー(iEDDA)基、クリック試薬、またはこれらの任意の組合せを含む、実施形態96Aに記載のキット。
98A.前記コンパートメントタグが、タンパク質リガーゼ認識配列などのペプチドをさらに含み、必要に応じて、前記タンパク質リガーゼが、ブテラーゼIまたはそのホモログである、実施形態81A~97Aのいずれか1つに記載のキット。
99A.前記複数の分析物またはポリペプチドを断片化するための化学的または生物学的試薬、例えば、酵素、例えばプロテアーゼ(例えば、メタロプロテアーゼ)をさらに含む、実施形態81A~98Aのいずれか1つに記載のキット。
100A.前記コンパートメントタグを前記支持体から遊離させるための1つまたは複数の試薬をさらに含む、実施形態81A~99Aのいずれか1つに記載のキット。
101A.伸長コーディングポリマーまたはジタグ構築物を形成するための1つまたは複数の試薬をさらに含む、実施形態1A~100Aのいずれか1つに記載のキット。
102A.前記記録ポリマーの3’末端が、ポリメラーゼによる前記記録ポリマーの伸長を防止するためにブロッキングされる、実施形態101Aに記載のキット。
103A.前記コーディングポリマーが、エンコーダー配列、UMI、ユニバーサルプライミング部位、その3’末端にスペーサーポリマー、結合サイクル特異的配列、またはこれらの任意の組合せを含む、実施形態101Aまたは102Aに記載のキット。
104A.前記ジタグ構築物が、ギャップ充填、プライマー伸長、またはこれらの組合せにより生成される、実施形態101A~103Aのいずれか1つに記載のキット。
105A.前記ジタグ分子が、前記記録ポリマーに由来するユニバーサルプライミング部位、前記記録ポリマーに由来するコンパートメントタグ、前記記録ポリマーに由来する一意の分子識別子、前記記録ポリマーに由来する必要に応じたスペーサーポリマー、前記コーディングポリマーに由来するエンコーダー配列、前記コーディングポリマーに由来する一意の分子識別子、前記コーディングポリマーに由来する必要に応じたスペーサーポリマー、および前記コーディングポリマーに由来するユニバーサルプライミング部位を含む、実施形態101A~104Aのいずれか1つに記載のキット。
106A.前記結合性物質が、ポリペプチドまたはタンパク質である、実施形態101A~105Aのいずれか1つに記載のキット。
107A.前記結合性物質が、アミノペプチダーゼまたはそのバリアント、変異体もしくは修飾タンパク質;アミノアシルtRNA合成酵素またはそのバリアント、変異体もしくは修飾タンパク質;アンチカリンまたはそのバリアント、変異体もしくは修飾タンパク質;ClpS(例えば、ClpS2)またはそのバリアント、変異体もしくは修飾タンパク質;UBRボックスタンパク質またはそのバリアント、変異体もしくは修飾タンパク質;あるいはアミノ酸に結合する修飾小分子、すなわちバンコマイシンまたはそのバリアント、変異体もしくは修飾分子;あるいは抗体またはその結合断片;あるいはこれらの任意の組合せを含む、実施形態101A~106Aのいずれか1つに記載のキット。
108A.前記結合性物質が、単一のアミノ酸残基(例えば、N末端アミノ酸残基、C末端アミノ酸残基、もしくは内部アミノ酸残基)、ジペプチド(例えば、N末端ジペプチド、C末端ジペプチド、もしくは内部ジペプチド)、トリペプチド(例えば、N末端トリペプチド、C末端トリペプチド、もしくは内部トリペプチド)、または前記分析物もしくはポリペプチドの翻訳後修飾に結合する、実施形態101A~107Aのいずれか1つに記載のキット。
109A.前記結合性物質が、N末端ポリペプチド、C末端ポリペプチド、または内部ポリペプチドに結合する、実施形態101A~107Aのいずれか1つに記載のキット。
110A.前記コーディングポリマーおよび/または前記記録ポリマーが、1つもしくは複数のエラー訂正コード(例えば、非核酸の配列決定可能なポリマーの形態のもの)、1つもしくは複数のエンコーダー配列(例えば、非核酸の配列決定可能なポリマーの形態のもの)、1つもしくは複数のバーコード(例えば、非核酸の配列決定可能なポリマーの形態のもの)、1つもしくは複数のUMI(例えば、非核酸の配列決定可能なポリマーの形態のもの)、1つもしくは複数のコンパートメントタグ(例えば、非核酸の配列決定可能なポリマーの形態のもの)、1つもしくは複数のサイクル特異的配列(例えば、非核酸の配列決定可能なポリマーの形態のもの)、またはこれらの任意の組合せを含む、実施形態1A~109Aのいずれか1つに記載のキット。
111A.前記エラー訂正コードが、Hammingコード、Lee距離コード、非対称Lee距離コード、Reed-Solomonコード、およびLevenshtein-Tenengoltsコードから選択される、実施形態110Aに記載のキット。
112A.前記コーディングポリマーおよび/または記録ポリマーが、サイクル標識を含む、実施形態1A~111Aのいずれか1つに記載のキット。
113A.前記コーディングポリマーおよび/または前記記録ポリマーから独立しているサイクル標識をさらに含む、実施形態1A~112Aのいずれか1つに記載のキット。
114A.(a)細胞溶解物もしくはタンパク質試料を生成するための試薬;
(b)システインのアルキル化またはリシンのブロッキングなどによって、アミノ酸側鎖をブロッキングするための試薬;
(c)トリプシン、LysN、またはLysCなどの、プロテアーゼ;
(d)核酸標識ポリペプチド(例えば、DNA標識タンパク質)を支持体に固定化するための試薬;
(e)分解に基づくポリペプチド配列決定のための試薬;および/または
(f)核酸配列決定のための試薬
を含む、実施形態1A~113Aのいずれか1つに記載のキット。
115A.(a)細胞溶解物もしくはタンパク質試料を生成するための試薬;
(b)システインのアルキル化またはリシンのブロッキングなどによって、アミノ酸側鎖をブロッキングするための試薬;
(c)トリプシン、LysN、またはLysCなどの、プロテアーゼ;
(d)固定化された記録ポリマーを含む支持体にポリペプチド(例えば、タンパク質)を固定化するための試薬;
(e)分解に基づくポリペプチド配列決定のための試薬;および/または
(f)核酸配列決定のための試薬
を含む、実施形態1A~113Aのいずれか1つに記載のキット。
116A.(a)細胞溶解物もしくはタンパク質試料を生成するための試薬;
(b)変性試薬;
(c)システインのアルキル化またはリシンのブロッキングなどによって、アミノ酸側鎖をブロッキングするための試薬;
(d)ユニバーサルDNAプライマー配列;
(e)ポリペプチドをユニバーサルDNAプライマー配列で標識するための試薬;
(f)標識されたポリペプチドをプライマーによってアニーリングするためのバーコード付きビーズ;
(g)前記標識されたポリペプチドに前記ビーズからのバーコードを書き込むためのポリメラーゼ伸長のための試薬;
(h)トリプシン、LysN、またはLysCなどの、プロテアーゼ;
(i)核酸標識ポリペプチド(例えば、DNA標識タンパク質)を支持体に固定化するための試薬;
(j)分解に基づくポリペプチド配列決定のための試薬;および/または
(k)核酸配列決定のための試薬
を含む、実施形態1A~113Aのいずれか1つに記載のキット。
117A.(a)架橋試薬;
(b)細胞溶解物もしくはタンパク質試料を生成するための試薬;
(c)システインのアルキル化またはリシンのブロッキングなどによって、アミノ酸側鎖をブロッキングするための試薬;
(d)ユニバーサルDNAプライマー配列;
(e)ポリペプチドをユニバーサルDNAプライマー配列で標識するための試薬;
(f)標識されたポリペプチドをプライマーによってアニーリングするためのバーコード付きビーズ;
(g)前記標識されたポリペプチドに前記ビーズからのバーコードを書き込むためのポリメラーゼ伸長のための試薬;
(h)トリプシン、LysN、またはLysCなどの、プロテアーゼ;
(i)核酸標識ポリペプチド(例えば、DNA標識タンパク質)を支持体に固定化するための試薬;
(j)分解に基づくポリペプチド配列決定のための試薬;および/または
(k)核酸配列決定のための試薬
を含む、実施形態1A~113Aのいずれか1つに記載のキット。
118A.溶液中または支持体、例えば、固体支持体上の1つまたは複数の成分が提供される、実施形態1A~117Aのいずれか1つに記載のキット。
1B.(a)各タンパク質に記録ポリマーが直接または間接的に付随しているタンパク質のセットを薬剤のライブラリーと接触させるステップであって、各薬剤が(i)小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマー(例えば、DNAアプタマーなどの核酸アプタマー、もしくはペプチドアプタマー)、および(ii)前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖またはアプタマーに関する識別情報を含むコーディングポリマーを含み、
各タンパク質および/もしくはそれに付随する記録ポリマー、または各薬剤が、支持体に直接または間接的に固定化されている、ステップと;
(b)(i)1つまたは複数の薬剤の前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーと結合および/または反応する各タンパク質に付随する前記記録ポリマーと(ii)前記1つまたは複数の薬剤のコーディングポリマーとの間の情報の移行を可能にして、伸長記録ポリマーおよび/または伸長コーディングポリマーを生成するステップと;
(c)前記伸長記録ポリマーおよび/または前記伸長コーディングポリマーを解析するステップと
を含む方法。
2B.各タンパク質と他のタンパク質との間に前記支持体上で平均距離約20nmに等しいもしくはそれより長い、約50nmに等しいもしくはそれより長い、約100nmに等しいもしくはそれより長い、約150nmに等しいもしくはそれより長い、約200nmに等しいもしくはそれより長い、約250nmに等しいもしくはそれより長い、約300nmに等しいもしくはそれより長い、約350nmに等しいもしくはそれより長い、約400nmに等しいもしくはそれより長い、約450nmに等しいもしくはそれより長い、約500nmに等しいもしくはそれより長い、約550nmに等しいもしくはそれより長い、約600nmに等しいもしくはそれより長い、約650nmに等しいもしくはそれより長い、約700nmに等しいもしくはそれより長い、約750nmに等しいもしくはそれより長い、約800nmに等しいもしくはそれより長い、約850nmに等しいもしくはそれより長い、約900nmに等しいもしくはそれより長い、約950nmに等しいもしくはそれより長い、または約1μmに等しいもしくはそれより長い間隔を空ける、実施形態1Bに記載の方法。
3B.各タンパク質およびそれに付随する記録ポリマーと他のタンパク質およびそれらに付随する記録ポリマーとの間に前記支持体上で平均距離約20nmに等しいもしくはそれより長い、約50nmに等しいもしくはそれより長い、約100nmに等しいもしくはそれより長い、約150nmに等しいもしくはそれより長い、約200nmに等しいもしくはそれより長い、約250nmに等しいもしくはそれより長い、約300nmに等しいもしくはそれより長い、約350nmに等しいもしくはそれより長い、約400nmに等しいもしくはそれより長い、約450nmに等しいもしくはそれより長い、約500nmに等しいもしくはそれより長い、約550nmに等しいもしくはそれより長い、約600nmに等しいもしくはそれより長い、約650nmに等しいもしくはそれより長い、約700nmに等しいもしくはそれより長い、約750nmに等しいもしくはそれより長い、約800nmに等しいもしくはそれより長い、約850nmに等しいもしくはそれより長い、約900nmに等しいもしくはそれより長い、約950nmに等しいもしくはそれより長い、または約1μmに等しいもしくはそれより長い間隔をあける、実施形態1Bまたは2Bに記載の方法。
4B.前記タンパク質および/またはそれらに付随する記録ポリマーの1つまたは複数が、前記支持体に(例えばリンカーを介して)共有結合により固定化されているか、または前記支持体に(例えば、結合対を介して)非共有結合により固定化されている、実施形態1B~3Bのいずれか1つに記載の方法。
5B.前記タンパク質および/またはそれらに付随する記録ポリマーのサブセットが、前記支持体に共有結合により固定化されており、その一方で前記タンパク質および/またはそれらに付随する記録ポリマーの別サブセットが、前記支持体に非共有結合により固定化されている、実施形態1B~4Bのいずれか1つに記載の方法。
6B.前記記録ポリマーの1つまたは複数が、前記支持体に固定化されおり、それにより、前記付随するタンパク質が固定化されている、実施形態1B~5Bのいずれか1つに記載の方法。
7B.前記タンパク質の1つまたは複数が、前記支持体に固定化されおり、それにより、前記付随する記録ポリマーが固定化されている、実施形態1B~6Bのいずれか1つに記載の方法。
8B.少なくとも1つのタンパク質が、それに付随する記録ポリマーと共局在し、さらに、各々が独立して前記支持体に固定化されている、実施形態1B~7Bのいずれか1つに記載の方法。
9B.少なくとも1つのタンパク質および/またはそれに付随する記録ポリマーが、固定化リンカーと直接または間接的に会合し、前記固定化リンカーが、前記支持体に直接または間接的に固定化されており、それにより、前記少なくとも1つのタンパク質および/またはそれに付随する記録ポリマーが前記支持体に固定化されている、実施形態1B~8Bのいずれか1つに記載の方法。
10B.固定化されている記録ポリマーの密度が、固定化されているタンパク質の密度に等しいか、またはそれより高い、実施形態1B~9Bのいずれか1つに記載の方法。
11B.固定化されている記録ポリマーの密度が、固定化されているタンパク質の密度の少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約6倍、少なくとも約7倍、少なくとも約8倍、少なくとも約9倍、少なくとも約10倍、少なくとも約20倍、少なくとも約50倍、少なくとも約100倍であるか、またはそれより高い、実施形態10Bに記載の方法。
12B.各薬剤と前記支持体上に固定化されている他の薬剤との間に平均距離約20nmに等しいもしくはそれより長い、約50nmに等しいもしくはそれより長い、約100nmに等しいもしくはそれより長い、約150nmに等しいもしくはそれより長い、約200nmに等しいもしくはそれより長い、約250nmに等しいもしくはそれより長い、約300nmに等しいもしくはそれより長い、約350nmに等しいもしくはそれより長い、約400nmに等しいもしくはそれより長い、約450nmに等しいもしくはそれより長い、約500nmに等しいもしくはそれより長い、約550nmに等しいもしくはそれより長い、約600nmに等しいもしくはそれより長い、約650nmに等しいもしくはそれより長い、約700nmに等しいもしくはそれより長い、約750nmに等しいもしくはそれより長い、約800nmに等しいもしくはそれより長い、約850nmに等しいもしくはそれより長い、約900nmに等しいもしくはそれより長い、約950nmに等しいもしくはそれより長い、または約1μmに等しいもしくはそれより長い間隔を空ける、実施形態1Bに記載の方法。
13B.前記薬剤の1つまたは複数が、前記支持体に(例えばリンカーを介して)共有結合により固定化されているか、または前記支持体に(例えば、結合対を介して)非共有結合により固定化されている、実施形態12Bに記載の方法。
14B.前記薬剤のサブセットが、前記支持体に共有結合により固定化されており、その一方で前記薬剤の別サブセットが、前記支持体に非共有結合により固定化されている、実施形態12Bまたは13Bに記載の方法。
15B.前記薬剤の1つまたは複数について、前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーが、前記支持体に固定化されており、それにより、前記コーディングポリマーが固定化されている、実施形態12B~14Bのいずれか1つに記載の方法。
16B.前記薬剤の1つまたは複数について、前記コーディングポリマーが前記支持体に固定化されており、それにより、前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーが、固定化されている、実施形態12B~15Bのいずれか1つに記載の方法。
17B.情報が、少なくとも1つのコーディングポリマーから少なくとも1つの記録ポリマーに移行され、それにより、少なくとも1つの伸長記録ポリマーが生成される、実施形態1B~16Bのいずれか1つに記載の方法。
18B.情報が、少なくとも1つの記録ポリマーから少なくとも1つのコーディングポリマーに移行され、それにより、少なくとも1つの伸長コーディングポリマーが生成される、実施形態1B~17Bのいずれか1つに記載の方法。
19B.前記コーディングポリマーからの情報および前記記録ポリマーからの情報を含む、少なくとも1つのジタグ構築物が生成される、実施形態1B~18Bのいずれか1つに記載の方法。
20B.前記タンパク質の少なくとも1つが、2つまたはそれより多くの薬剤の前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーと結合および/または反応する、実施形態1B~19Bのいずれか1つに記載の方法。
21B.前記伸長記録ポリマーまたは前記伸長コーディングポリマーが、前記2つまたはそれより多くの薬剤の前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖またはアプタマーに関する識別情報を含む、実施形態20Bに記載の方法。
22B.前記タンパク質の少なくとも1つに2つまたはそれより多くの記録ポリマーが付随しており、前記2つまたはそれより多くの記録ポリマーが、同じであってもよく、または異なっていてもよい、実施形態1B~21Bのいずれか1つに記載の方法。
23B.前記少なくとも1つの薬剤が、2つまたはそれより多くのコーディングポリマーを含み、前記2つまたはそれより多くのコーディングポリマーが、同じであってもよく、または異なっていてもよい、実施形態1B~22Bのいずれか1つに記載の方法。
24B.前記情報の移行が、ライゲーション(例えば、酵素的もしくは化学的ライゲーション、副子ライゲーション、粘着末端ライゲーション、ssDNAライゲーションなどの一本鎖(ss)ライゲーション、またはこれらの任意の組合せ)、ポリメラーゼ媒介反応(例えば、一本鎖核酸もしくは二本鎖核酸のプライマー伸長)、またはこれらの任意の組合せにより実現される、実施形態1B~23Bのいずれか1つに記載の方法。
25B.前記ライゲーションおよび/またはポリメラーゼ媒介反応が、前記タンパク質と前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖またはアプタマーとの間の結合の占有時間または反応時間と比較して速いカイネティクスを有し、
必要に応じて、前記ライゲーションおよび/またはポリメラーゼ媒介反応のための試薬が、前記タンパク質と前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖またはアプタマーとの間の結合または反応と同じ反応体積で存在する、実施形態24Bに記載の方法。
26B.各タンパク質が、個々の付着によってその記録ポリマーと会合し、および/または各小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーが、個々の付着によってそのコーディングポリマーと会合する、実施形態1B~25Bのいずれか1つに記載の方法。
27B.前記付着が、リボソームまたはmRNA/cDNAディスプレイによって行われ、この場合、前記記録ポリマーおよび/または前記コーディングポリマー配列情報がmRNA配列に含有される、実施形態26Bに記載の方法。
28B.前記記録ポリマーおよび/またはコーディングポリマーが、前記mRNA配列の3’末端におけるユニバーサルプライマー配列、バーコード、および/またはスペーサーポリマー配列を含む、実施形態27Bに記載の方法。
29B.前記記録ポリマーおよび/またはコーディングポリマーが、その3’末端に、制限酵素消化部位をさらに含む、実施形態28Bに記載の方法。
30B.前記タンパク質のセットが、プロテオームまたはそのサブセットであり、
必要に応じて、前記タンパク質のセットが、ゲノムもしくはそのサブセットのin vitro転写、続いてのin vitro翻訳を使用して産生される、またはトランスクリプトームもしくはそのサブセットのin vitro翻訳を使用して産生される、実施形態1B~29Bのいずれか1つに記載の方法。
31B.前記プロテオームのサブセットが、キノーム;セクレトーム;レセプトーム(例えば、GPCRome);免疫プロテオーム;栄養プロテオーム;翻訳後修飾(例えば、リン酸化、ユビキチン化、メチル化、アセチル化、グリコシル化、酸化、脂質付加および/またはニトロシル化)により定義されるプロテオームサブセット、例えば、リン酸化プロテオーム(例えば、ホスホチロシン-プロテオーム、チロシン-キノーム、およびチロシン-ホスファトーム)、グライコプロテオームなど;組織もしくは臓器、発生期または生理もしくは病的状態に関連するプロテオームサブセット;細胞プロセス、例えば、細胞周期、分化(もしくは脱分化)、細胞死、老化、細胞遊走、形質転換、または転移に関連する、プロテオームサブセット;あるいはこれらの任意の組合せを含む、実施形態30Bに記載の方法。
32B.前記タンパク質のセットが、哺乳動物、例えばヒト、非ヒト動物、魚、無脊椎動物、節足動物、昆虫、または植物、例えば酵母、細菌、例えばE.Coli、ウイルス、例えばHIVもしくはHCV、またはこれらの組合せに由来する、実施形態1B~31Bのいずれか1つに記載の方法。
33B.前記タンパク質のセットが、タンパク質複合体またはそのサブユニットを含む、実施形態1B~32Bのいずれか1つに記載の方法。
34B.前記記録ポリマーが、核酸、オリゴヌクレオチド、修飾オリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、もしくはモルホリノ、非核酸の配列決定可能なポリマー、例えば、多糖、ポリペプチド、ペプチド、もしくはポリアミド、またはこれらの組合せを含む、実施形態1B~33Bのいずれか1つに記載の方法。
35B.前記記録ポリマーが、ユニバーサルプライミング部位を含む、実施形態1B~34Bのいずれか1つに記載の方法。
36B.前記記録ポリマーが、増幅、配列決定、またはその両方のためのプライミング部位を含み、例えば、前記ユニバーサルプライミング部位が、増幅、配列決定、またはその両方のためのプライミング部位を含む、実施形態1B~35Bのいずれか1つに記載の方法。
37B.前記記録ポリマーが、一意の分子識別子(UMI)を含む、実施形態1B~36Bのいずれか1つに記載の方法。
38B.前記記録ポリマーが、バーコードを含む、実施形態1B~37Bのいずれか1つに記載の方法。
39B.前記記録ポリマーが、その3’末端にスペーサーポリマーを含む、実施形態1B~38Bのいずれか1つに記載の方法。
40B.前記支持体が、固体支持体、例えば、剛性固体支持体、可撓性固体支持体、または軟質固体支持体であり、多孔質支持体または非多孔質支持体を含む、実施形態1B~39Bのいずれか1つに記載の方法。
41B.前記支持体が、ビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、スピン干渉ディスク、膜、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子(例えば、磁気ナノ粒子(Fe)、金ナノ粒子および/もしくは銀ナノ粒子などの、金属を含む)、量子ドット、ナノシェル、ナノケージ、マイクロスフェア、またはこれらの任意の組合せを含む、実施形態1B~40Bのいずれか1つに記載の方法。
42B.前記支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、ガラスビーズ、もしくは制御ポアビーズ、またはこれらの任意の組合せを含む、実施形態41Bに記載の方法。
43B.小分子-タンパク質結合マトリックス、および/またはペプチド/ペプチドの模倣物-タンパク質結合マトリックス、および/またはペプチド模倣物-タンパク質結合マトリックス、(例えば、ペプトイド-タンパク質結合マトリックス、β-ペプチド-タンパク質結合マトリックス、もしくはD-ペプチドペプチド模倣物-タンパク質結合マトリックス)、および/または多糖-タンパク質結合マトリックス、および/またはアプタマー-タンパク質結合マトリックスを創出するために、前記タンパク質のセットと、小分子および/またはペプチドもしくはペプチドの模倣物および/またはペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)および/または多糖および/またはアプタマーのライブラリーとの間の相互作用を並列解析するための、実施形態1B~42Bのいずれか1つに記載の方法。
44B.前記マトリックスのサイズが、約10、約10、約10、約10、約10、約10、約10、約10、約1010、約1011、約1012、約1013、約1014のまたはそれより大きい、例えば、約2×1013のサイズである、実施形態43Bに記載の方法。
45B.前記コーディングポリマーが、核酸、オリゴヌクレオチド、修飾オリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、もしくはモルホリノ、非核酸の配列決定可能なポリマー、例えば、多糖、ポリペプチド、ペプチド、もしくはポリアミド、またはこれらの組合せを含む、実施形態1B~44Bのいずれか1つに記載の方法。
46B.前記コーディングポリマーが、前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーを識別するエンコーダー配列を含む、実施形態1B~45Bのいずれか1つに記載の方法。
47B.前記コーディングポリマーが、スペーサーポリマー、一意の分子識別子(UMI)、ユニバーサルプライミング部位、またはこれらの任意の組合せを含む、実施形態1B~46Bのいずれか1つに記載の方法。
48B.前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーと、前記コーディングポリマーが、リンカーまたは結合対により接合されている、実施形態1B~47Bのいずれか1つに記載の方法。
49B.前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーと、前記コーディングポリマーが、SpyTag-KTag/SpyLigase(この場合、接合される2つの部分がSpyTag/KTag対を有し、SpyLigaseがSpyTagをKTagに接合させ、かくして2つの部分が接合される)、SpyTag/SpyCatcher、SnoopTag/SnoopCatcherペプチド-タンパク質対、ソルターゼ、もしくはHaloTag/HaloTagリガンド対、またはこれらの任意の組合せによって接合されている、実施形態1B~48Bのいずれか1つに記載の方法。
50B.ポリペプチドを解析するための方法であって、
(a)(i)各断片に記録ポリマーが直接または間接的に付随しているポリペプチドの断片のセットを、(ii)各結合性物質が結合性部分および前記結合性部分に関する識別情報を含むコーディングポリマーを含む結合性物質のライブラリーと接触させるステップであって、
前記結合性部分が、前記断片の1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することができ、または官能化試薬により修飾された前記1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することができ、
各断片および/もしくはそれに付随する記録ポリマー、または各結合性物質が、支持体に直接または間接的に固定化されている、ステップと;
(b)(i)各断片に付随する前記記録ポリマーと(ii)前記コーディングポリマーとの間の情報の移行を、前記結合性部分と前記断片の1つまたは複数のN末端、内部またはC末端アミノ酸との結合時に可能にして、伸長記録ポリマーおよび/または伸長コーディングポリマーを生成するステップと;
(c)前記伸長記録ポリマーおよび/または前記伸長コーディングポリマーを解析するステップと
を含む方法。
51B.前記1つまたは複数のN末端、内部またはC末端アミノ酸が、
(i)N末端アミノ酸(NTAA);
(ii)N末端ジペプチド配列;
(iii)N末端トリペプチド配列;
(iv)内部アミノ酸;
(v)内部ジペプチド配列;
(vi)内部トリペプチド配列;
(vii)C末端アミノ酸(CTAA);
(viii)C末端ジペプチド配列;もしくは
(ix)C末端トリペプチド配列、
またはこれらの任意の組合せを含み、
必要に応じて、(i)~(ix)の前記アミノ酸残基の任意の1つまたは複数が、修飾または官能化されている、実施形態50Bに記載の方法。
52B.前記1つまたは複数のN末端、内部またはC末端アミノ酸が、各残基において独立して、アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リシン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、トレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)からなる群から、これらの任意の組合せで、選択される、実施形態51Bに記載の方法。
53B.前記結合性部分が、ポリペプチドもしくはその断片、タンパク質もしくはポリペプチド鎖もしくはその断片、またはタンパク質複合体もしくはそのサブユニット、例えば、抗体もしくはその抗原結合断片を含む、実施形態50B~52Bのいずれか1つに記載の方法。
54B.前記結合性部分が、アンチカリンまたはそのバリアント、変異体もしくは修飾タンパク質;アミノアシルtRNA合成酵素またはそのバリアント、変異体もしくは修飾タンパク質;アンチカリンまたはそのバリアント、変異体もしくは修飾タンパク質;ClpS(例えば、ClpS2)またはそのバリアント、変異体もしくは修飾タンパク質;UBRボックスタンパク質またはそのバリアント、変異体もしくは修飾タンパク質;あるいはアミノ酸に結合する修飾小分子、すなわちバンコマイシンまたはそのバリアント、変異体もしくは修飾分子;あるいはこれらの任意の組合せを含む、実施形態50B~53Bのいずれか1つに記載の方法。
55B.前記結合性部分が、官能化N末端アミノ酸(NTAA)、N末端ジペプチド配列、もしくはN末端トリペプチド配列、またはこれらの任意の組合せに選択的におよび/または特異的に結合することが可能である、実施形態50B~54Bのいずれか1つに記載の方法。
56B.複数のポリペプチドを解析するための方法であって、
(a)複数のポリペプチドの各分子を複数のユニバーサルタグで標識するステップと;
(b)前記複数のポリペプチドと複数のコンパートメントタグ(例えば、非核酸の配列決定可能なポリマーの形態のもの)とを、前記複数のユニバーサルタグと前記複数のコンパートメントタグとのアニーリングまたは接合に好適な条件下で接触させることによって、前記複数のポリペプチドを複数のコンパートメント(例えば、ビーズ表面、マイクロ流体液滴、マイクロウェル、または表面上の分離された領域、またはこれらの任意の組合せ)に分配するステップであって、前記複数のコンパートメントタグが、各コンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、ステップと;
(c)各コンパートメント内の前記ポリペプチドを断片化することによって、少なくとも1つのユニバーサルポリヌクレオチドタグと少なくとも1つのコンパートメントタグとを含む記録ポリマーが各々に付随しているポリペプチド断片のセットを生成するステップと;
(d)前記ポリペプチド断片のセットを支持体に直接または間接的に固定化するステップと;
(e)固定化されたポリペプチド断片のセットを、各結合性物質が結合性部分および前記結合性部分に関する識別情報を含むコーディングポリマーを含む結合性物質のライブラリーと接触させるステップであって、
前記結合性部分が、前記断片の1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、または官能化試薬により修飾された前記1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、ステップと;
(f)(i)各断片に付随する前記記録ポリマーと(ii)前記コーディングポリマーとの間の情報の移行を、前記結合性部分と前記断片の1つまたは複数のN末端、内部またはC末端アミノ酸との結合時に可能にして、伸長記録ポリマーおよび/または伸長コーディングポリマーを生成するステップと;
(g)前記伸長記録ポリマーおよび/または前記伸長コーディングポリマーを解析するステップと
を含む方法。
57B.同じコンパートメントタグを有する前記複数のポリペプチドが、同じタンパク質に属する、実施形態56Bに記載の方法。
58B.前記同じコンパートメントタグを有する複数のポリペプチドが、異なるタンパク質、例えば、2、3、4、5、6、7、8、9、10、またはそれより多くのタンパク質に属する、実施形態56Bに記載の方法。
59B.前記複数のコンパートメントタグが、各基板がコンパートメントを規定している、複数の基板に固定化されている、実施形態56B~58Bのいずれか1つに記載の方法。
60B.前記複数の基板が、ビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、スピン干渉ディスク、膜、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子(例えば、磁気ナノ粒子(Fe)、金ナノ粒子および/もしくは銀ナノ粒子などの、金属を含む)、量子ドット、ナノシェル、ナノケージ、マイクロスフェア、またはこれらの任意の組合せからなる群から選択される、実施形態59Bに記載の方法。
61B.前記複数の基板の各々が、バーコード付きビーズ、例えば、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、ガラスビーズ、もしくは制御ポアビーズ、またはこれらの任意の組合せなどの、バーコード付き粒子を含む、実施形態59Bまたは60Bに記載の方法。
62B.前記支持体が、ビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、スピン干渉ディスク、膜、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子(例えば、磁気ナノ粒子(Fe)、金ナノ粒子および/もしくは銀ナノ粒子などの、金属を含む)、量子ドット、ナノシェル、ナノケージ、マイクロスフェア、またはこれらの任意の組合せからなる群から選択される、実施形態59B~61Bのいずれか1つに記載の方法。
63B.前記支持体が、シーケンシングビーズ、例えば、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、ガラスビーズ、もしくは制御ポアビーズ、またはこれらの任意の組合せを含む、実施形態62Bに記載の方法。
64B.各断片およびそれに付随する記録ポリマーと他の断片およびそれらに付随する記録ポリマーとの間に前記支持体上で平均距離約20nmに等しいもしくはそれより長い、約50nmに等しいもしくはそれより長い、約100nmに等しいもしくはそれより長い、約150nmに等しいもしくはそれより長い、約200nmに等しいもしくはそれより長い、約250nmに等しいもしくはそれより長い、約300nmに等しいもしくはそれより長い、約350nmに等しいもしくはそれより長い、約400nmに等しいもしくはそれより長い、約450nmに等しいもしくはそれより長い、約500nmに等しいもしくはそれより長い、約550nmに等しいもしくはそれより長い、約600nmに等しいもしくはそれより長い、約650nmに等しいもしくはそれより長い、約700nmに等しいもしくはそれより長い、約750nmに等しいもしくはそれより長い、約800nmに等しいもしくはそれより長い、約850nmに等しいもしくはそれより長い、約900nmに等しいもしくはそれより長い、約950nmに等しいもしくはそれより長い、または約1μmに等しいもしくはそれより長い間隔を空ける、実施形態56B~63Bのいずれか1つに記載の方法。
65B.複数のポリペプチドを解析するための方法であって、
(a)各基板がコンパートメントタグを各々が含む複数の記録ポリマーを含み、必要に応じて各コンパートメントが、ビーズ、マイクロ流体液滴、マイクロウェル、もしくは表面上の分離された領域、またはこれらの任意の組合せである、複数の基板に複数のポリペプチドを固定化するステップと;
(b)各基板上に固定化された前記ポリペプチドを(例えば、プロテアーゼ消化により)断片化することによって、基板に固定化されたポリペプチド断片のセットを生成するステップと;
(c)前記固定化されたポリペプチド断片のセットを、各結合性物質が結合性部分および前記結合性部分に関する識別情報を含むコーディングポリマーを含む結合性物質のライブラリーと接触させるステップであって、
前記結合性部分が、前記断片の1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、または官能化試薬により修飾された前記1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、ステップと;
(d)(i)前記記録ポリマーと(ii)前記コーディングポリマーとの間の情報の移行を、前記結合性部分と各断片の1つまたは複数のN末端、内部またはC末端アミノ酸との結合時に可能にして、伸長記録ポリマーおよび/または伸長コーディングポリマーを生成するステップと;
(e)前記伸長記録ポリマーおよび/または前記伸長コーディングポリマーを解析するステップと
を含む方法。
66B.同じコンパートメントタグを有する前記複数のポリペプチドが、同じタンパク質に属する、実施形態65Bに記載の方法。
67B.前記同じコンパートメントタグを有する複数のポリペプチドが、異なるタンパク質、例えば、2、3、4、5、6、7、8、9、10、またはそれより多くのタンパク質に属する、実施形態65Bに記載の方法。
68B.各基板が、コンパートメントを規定する、実施形態65B~67Bのいずれか1つに記載の方法。
69B.前記複数の基板が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、スピン干渉ディスク、膜、ニトロセルロース膜、ニトロセルロースに基づくポリマー表面、ナノ粒子(例えば、磁気ナノ粒子(Fe)、金ナノ粒子および/もしくは銀ナノ粒子などの、金属を含む)、量子ドット、ナノシェル、ナノケージ、マイクロスフェア、またはこれらの任意の組合せからなる群から選択される、実施形態65B~68Bのいずれか1つに記載の方法。
70B.前記複数の基板の各々が、バーコード付きビーズ、例えば、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、ガラスビーズ、もしくは制御ポアビーズ、またはこれらの任意の組合せなどの、バーコード付き粒子を含む、実施形態65B~69Bのいずれか1つに記載の方法。
71B.前記官能化試薬が、化学薬剤、酵素、および/または生物学的薬剤、例えば、イソチオシアネート誘導体、2,4-ジニトロベンゼンスルホン酸(DNBS)、4-スルホニル-2-ニトロフルオロベンゼン(SNFB)1-フルオロ-2,4-ジニトロベンゼン、ダンシルクロリド、7-メトキシクマリン酢酸、チオアシル化試薬、チオアセチル化試薬、またはチオベンジル化試薬を含む、実施形態50B~70Bのいずれか1つに記載の方法。
72B.前記記録ポリマーが、核酸、オリゴヌクレオチド、修飾オリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、もしくはモルホリノ、非核酸の配列決定可能なポリマー、例えば、多糖、ポリペプチド、ペプチド、もしくはポリアミド、またはこれらの組合せを含む、実施形態50B~71Bのいずれか1つに記載の方法。
73B.前記記録ポリマーが、ユニバーサルプライミング部位;増幅、配列決定もしくはその両方のためのプライミング部位;必要に応じて、一意の分子識別子(UMI);バーコード;必要に応じて、その3’末端にスペーサーポリマー;またはこれらの組合せを含む、実施形態50B~72Bのいずれか1つに記載の方法。
74B.前記ポリペプチドまたは複数のポリペプチドの配列を決定するためのものである、実施形態50B~73Bのいずれか1つに記載の方法。
75B.前記コーディングポリマーが、核酸、オリゴヌクレオチド、修飾オリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、もしくはモルホリノ、非核酸の配列決定可能なポリマー、例えば、多糖、ポリペプチド、ペプチド、もしくはポリアミド、またはこれらの組合せを含む、実施形態50B~74Bのいずれか1つに記載の方法。
76B.前記コーディングポリマーが、エンコーダー配列、必要に応じたスペーサーポリマー、必要に応じた一意の分子識別子(UMI)、ユニバーサルプライミング部位、またはこれらの任意の組合せを含む、実施形態50B~75Bのいずれか1つに記載の方法。
77B.前記結合性部分および前記コーディングポリマーが、リンカーまたは結合対によって接合されている、実施形態50B~76Bのいずれか1つに記載の方法。
78B.前記結合性部分と前記コーディングポリマーが、SpyTag-KTag/SpyLigase(この場合、接合される2つの部分がSpyTag/KTag対を有し、SpyLigaseがSpyTagをKTagに接合させ、かくして2つの部分が接合される)、SpyTag/SpyCatcher、SnoopTag/SnoopCatcherペプチド-タンパク質対、ソルターゼ、もしくはHaloTag/HaloTagリガンド対、またはこれらの任意の組合せによって接合されている、実施形態50B~77Bのいずれか1つに記載の方法。
79B.前記コーディングポリマーおよび/または前記記録ポリマーが、1つまたは複数のエラー訂正コード(例えば、非核酸の配列決定可能なポリマーの形態のもの)、1つまたは複数のエンコーダー配列(例えば、非核酸の配列決定可能なポリマーの形態のもの)、1つまたは複数のバーコード(例えば、非核酸の配列決定可能なポリマーの形態のもの)、1つまたは複数のUMI(例えば、非核酸の配列決定可能なポリマーの形態のもの)、1つまたは複数のコンパートメントタグ(例えば、非核酸の配列決定可能なポリマーの形態のもの)、またはこれらの任意の組合せを含む、実施形態1B~78Bのいずれか1つに記載の方法。
80B.前記エラー訂正コードが、Hammingコード、Lee距離コード、非対称Lee距離コード、Reed-Solomonコード、およびLevenshtein-Tenengoltsコードから選択される、実施形態79Bに記載の方法。
81B.前記伸長記録ポリマーおよび/または伸長コーディングポリマーの解析が、核酸配列解析を含む、実施形態1B~80Bのいずれか1つに記載の方法。
82B.前記核酸配列解析が、核酸配列決定法、例えば、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、もしくはパイロシーケンシング、またはこれらの任意の組合せを含む、実施形態81Bに記載の方法。
83B.前記核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したDNAのダイレクトイメージングである、実施形態82Bに記載の方法。
84B.1または複数の洗浄ステップをさらに含む、実施形態1B~83Bのいずれか1つに記載の方法。
85B.前記伸長記録ポリマーおよび/または伸長コーディングポリマーが、解析前に増幅される、実施形態1B~84Bのいずれか1つに記載の方法。
86B.前記伸長記録ポリマーおよび/または伸長コーディングポリマーが、解析前に標的濃縮アッセイされる、実施形態1B~85Bのいずれか1つに記載の方法。
87B.前記伸長記録ポリマーおよび/または伸長コーディングポリマーが、解析前にサブトラクションアッセイされる、実施形態1B~86Bのいずれか1つに記載の方法。
88B.(a)各薬剤が(i)小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖および/またはアプタマーと(ii)前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖またはアプタマーに関する識別情報を含むコーディングポリマーとを含む、薬剤のライブラリーと;
必要に応じて(b)各タンパク質に記録ポリマーが直接または間接的に付随しているタンパク質のセットと
を含むキットであって、
各タンパク質および/もしくはそれに付随する記録ポリマー、または各薬剤が、支持体に直接または間接的に固定化されており、
前記タンパク質のセット、前記記録ポリマーおよび前記薬剤のライブラリーが、(i)1つまたは複数の薬剤の前記小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β-ペプチドもしくはD-ペプチドペプチド模倣物)、多糖、またはアプタマーと結合および/または反応する各タンパク質に付随する前記記録ポリマーと(ii)前記1つまたは複数の薬剤のコーディングポリマーとの間の情報の移行を可能にして、伸長記録ポリマーおよび/または伸長コーディングポリマーを生成するように構成されている、キット。
89B.ポリペプチドを解析するためのキットであって、
(a)各結合性物質が、結合性部分、および前記結合性部分に関する識別情報を含むコーディングポリマーを含み、前記結合性部分が、断片の1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、または官能化試薬により修飾された前記1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、結合性物質のライブラリーと;
必要に応じて、(b)各断片が記録ポリマーに直接もしくは間接的に付随しているポリペプチドの断片のセット、または(b’)ポリペプチドを断片化するための手段、例えばプロテアーゼと
を含み、
各断片および/もしくはそれに付随する記録ポリマー、または各結合性物質が、支持体に直接または間接的に固定化されており、
前記ポリペプチドの断片のセット、前記記録ポリマー、および前記結合性物質のライブラリーが、(i)各断片に付随する前記記録ポリマーと(ii)前記コーディングポリマーとの間の情報の移行を、前記結合性部分と前記断片の1つまたは複数のN末端、内部またはC末端アミノ酸との結合時に可能にして、伸長記録ポリマーおよび/または伸長コーディングポリマーを生成するように構成されている、キット。
90B.複数のポリペプチドを解析するキットであって、(a)各結合性物質が、結合性部分、および前記結合性部分に関する識別情報を含むコーディングポリマーを含み、前記結合性部分が、断片の1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、または官能化試薬により修飾された前記1つもしくは複数のN末端、内部もしくはC末端アミノ酸に結合することが可能である、結合性物質のライブラリーと;(b)複数のポリペプチドが必要に応じて固定化されている複数の基板であって、各基板が、コンパートメントタグ(例えば、非核酸の配列決定可能なポリマーの形態のもの)を各々が含む複数の記録ポリマーを含み、必要に応じて、各コンパートメントが、ビーズ、マイクロ流体液滴、マイクロウェル、もしくは表面上の分離された領域、またはこれらの任意の組合せであり、各基板上に固定化された前記ポリペプチドが、(例えば、プロテアーゼ切断によって)断片化されて前記基板に固定化されたポリペプチド断片のセットを生成するように構成されている、複数の基板とを含む、キットであり;前記複数のポリペプチド、前記記録ポリマー、および前記結合性物質のライブラリーが、(i)前記記録ポリマーと(ii)前記コーディングポリマーとの間の情報の移行を、前記結合性部分と前記各断片の1つまたは複数のN末端、内部またはC末端アミノ酸との結合時に可能にして、伸長記録ポリマーおよび/または伸長コーディングポリマーを生成するように構成されている、キット。
1C.前記記録タグが、小分子、またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素である、前述の実施形態のいずれかに記載の方法またはキット。
2C.前記記録タグが、ポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーである、前述の実施形態のいずれかに記載の方法またはキット。
3C.前記コーディングタグが、小分子、またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素を含む、前述の実施形態のいずれかに記載の方法またはキット。
4C.前記コーディングタグが、小分子、またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素である、前述の実施形態のいずれかに記載の方法またはキット。
5C.前記記録タグが、配列決定可能なポリマーである、実施形態4Cに記載の方法またはキット。
6C.前記伸長記録タグおよび/または伸長コーディングタグが、ポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーである、前述の実施形態のいずれかに記載の方法またはキット。
1D.(a)分析物を、前記分析物に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディング部分を含み、前記分析物には支持体に接合した記録部分が付随しており、前記分析物および/または前記記録部分が支持体に固定化されている、ステップと;
(b)前記第1のコーディング部分の情報を前記記録部分に移行させて、一次伸長記録部分を生成するステップと;
(c)前記分析物を、前記分析物に結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディング部分を含む、ステップと;
(d)前記第2のコーディング部分の情報を前記一次伸長記録部分に移行させて、二次伸長記録部分を生成するステップと;
(e)前記二次伸長記録部分を解析するステップと
を含む方法。
2D.ステップ(d)と(e)の間に、
(x)前記第2の結合性物質を、前記分析物に結合することが可能な第3の(またはより高次の)結合性物質に置き換えることにより、ステップ(c)および(d)を1回または複数回繰り返すステップであって、第3の(またはより高次の)結合性物質が、前記第3の(またはより高次の)結合性物質に関する識別情報を有する第3の(またはより高次の)コーディング部分を含む、ステップと;
(y)前記第3の(またはより高次の)コーディング部分の情報を第2の(またはより高次の)伸長記録部分に移行させて、第3の(またはより高次の)伸長記録部分を生成するステップと
をさらに含み、
ステップ(e)において前記第3の(またはより高次の)伸長記録部分を解析する、実施形態1Dに記載の方法。
3D.ステップ(a)の前記記録部分が、小分子、またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素である、実施形態1Dまたは2Dに記載の方法。
4D.ステップ(a)の前記記録部分が、ポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーである、実施形態1Dまたは2Dに記載の方法。
5D.一次、二次、三次および/またはより高次のコーディング部分が、小分子、および/またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素を含む、実施形態4Dに記載の方法。
6D.前記一次、二次、三次および/またはより高次のコーディング部分が、小分子、またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素である、実施形態4Dまたは5Dに記載の方法。
7D.前記一次伸長記録部分、二次伸長記録部分、三次伸長記録部分、および/またはより高次の伸長記録部分が、ポリヌクレオチドまたは非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーである、実施形態1D~6Dのいずれか1つに記載の方法。
8D.(a)ポリペプチドを、前記ポリペプチドの1つまたは複数のN末端、内部またはC末端アミノ酸に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディング部分を含み、前記ポリペプチドには支持体に接合した記録部分が付随しており、前記ポリペプチドおよび/または前記記録部分が支持体に固定化されている、ステップと;
(b)前記第1のコーディング部分の情報を前記記録部分に移行させて、一次伸長記録部分を生成するステップと;
(c)前記分析物を、前記ポリペプチドの異なる1つまたは複数のN末端、内部またはC末端アミノ酸に結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディング部分を含む、ステップと;
(d)前記第2のコーディング部分の情報を前記一次伸長記録部分に移行させて、二次伸長記録部分を生成するステップと;
(e)前記二次伸長記録部分を解析するステップと
を含む方法。
9D.前記ポリペプチドの1つもしくは複数のN末端、内部もしくはC末端アミノ酸および/または異なる1つもしくは複数のN末端、内部もしくはC末端アミノ酸が、修飾されたN末端アミノ酸(NTAA)などの、修飾されたアミノ酸である、実施形態8Dに記載の方法。
10D.(a)ポリペプチドを、前記ポリペプチドの1つまたは複数のN末端またはC末端アミノ酸に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディング部分を含み、前記ポリペプチドには支持体に接合した記録部分が付随しており、前記ポリペプチドおよび/または前記記録部分が支持体に固定化されている、ステップと;
(b)前記第1のコーディング部分の情報を前記記録部分に移行させて、一次伸長記録部分を生成するステップと;
(c)前記ポリペプチドの1つまたは複数のN末端またはC末端アミノ酸を消去して、前記ポリペプチドの異なる1つまたは複数のN末端またはC末端アミノ酸を露出させるステップと;
(d)分析物を、前記ポリペプチドの異なる1つまたは複数のN末端またはC末端アミノ酸に結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディング部分を含む、ステップと;
(e)前記第2のコーディング部分の情報を前記一次伸長記録部分に移行させて、二次伸長記録部分を生成するステップと;
(f)前記二次伸長記録部分を解析するステップと
を含む方法。
11D.前記ポリペプチドの1つもしくは複数のN末端もしくはC末端アミノ酸および/または異なる1つもしくは複数のN末端もしくはC末端アミノ酸が、修飾されたN末端アミノ酸(NTAA)などの、修飾されたアミノ酸である、実施形態10Dに記載の方法。
12D.ステップ(a)の前記記録部分が、小分子、またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素である、実施形態8D~11Dのいずれか1つに記載の方法。
13D.ステップ(a)の前記記録部分が、ポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーである、実施形態8D~11Dのいずれか1つに記載の方法。
14D.前記一次または二次コーディング部分が、小分子、および/またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素を含む、実施形態13Dに記載の方法。
15D.前記一次または二次コーディング部分が、小分子、またはポリヌクレオチドもしくは非核酸の配列決定可能なポリマーなどの配列決定可能なポリマーのサブユニット、単量体、残基もしくは構成要素である、実施形態13Dまたは14Dに記載の方法。
16D.前記一次伸長記録部分または二次伸長記録部分が、ポリヌクレオチドまたは非核酸の配列決定可能なポリマーなどの、配列決定可能なポリマーである、実施形態8D~15Dのいずれか1つに記載の方法。
17D.前記配列決定可能なポリマーが、1つまたは複数の遮断基を含む、実施形態3D~16Dのいずれか1つに記載の方法。
18D.前記1つまたは複数の遮断基が、前記配列決定可能なポリマーがナノポアを通過するときにシグネチャ電流遮断シグナルを生成することができる、実施形態17Dに記載の方法。
19D.前記配列決定可能なポリマーが、ナノポアを通過しているときに前記配列決定可能なポリマーを停止させる結合性物質に結合することが可能な1つまたは複数の結合性部分を含む、実施形態3D~18Dのいずれか1つに記載の方法。
20D.前記配列決定可能なポリマーが、ナノポアを通過しているときに前記配列決定可能なポリマーを停止させることができる1つまたは複数の構造を含む、実施形態3D~19Dのいずれか1つに記載の方法。
21D.前記1つまたは複数の構造が、固有の準安定性二次構造などの、二次構造を含む、実施形態20Dに記載の方法。
22D.前記配列決定可能なポリマーが、ホスホロアミダイト化学構造、またはペプトイドポリマー、またはこれらの組合せを使用して構築されたポリマーを含む、実施形態3D~21Dのいずれか1つに記載の方法。
23D.実施形態1D~23Dのいずれかに記載の方法で開示および/または使用される任意の分子、分子複合体もしくはコンジュゲート、試薬(例えば、化学的もしくは生物学的)、薬剤、構造(例えば、支持体、表面、粒子もしくはビーズ)、反応中間体、反応生成物、結合性複合体もしくは任意の他の製造物品またはこれらの任意の組合せを含むキット。
本開示は、特定の開示されている実施形態に範囲を限定するように意図されたものではなく、例えば、本発明の様々な態様を説明するために提供されるものである。記載の組成物および方法の様々な修飾形態が、本明細書における記載および教示から明らかになるだろう。そのような変形形態は、本開示の真の範囲および趣旨を逸脱することなく実施することができ、本開示の範囲に入ると考えられる。上記の詳細な説明に照らして、これらおよび他の変更を実施形態に加えることができる。一般に、下記の特許請求の範囲において使用される用語は、本明細書および本特許請求の範囲において開示される特定の実施形態に本特許請求の範囲を限定すると解釈すべきでなく、そのような特許請求の範囲に権利がある均等物の全範囲とともに全ての可能な実施形態を含むと解釈すべきである。したがって、本特許請求の範囲は、本開示によって限定されない。
Figure 0007390027000148
Figure 0007390027000149
Figure 0007390027000150
Figure 0007390027000151
Figure 0007390027000152
Figure 0007390027000153
Figure 0007390027000154
Figure 0007390027000155
Figure 0007390027000156
上記の詳細な説明に照らして、これらおよび他の変更を実施形態に対して行うことができる。一般的に、以下の特許請求の範囲においては、使用されている用語は、特許請求の範囲を、本明細書および本特許請求の範囲で開示されている特定の実施形態に限定するものとは解釈されるべきでなく、考え得るすべての実施形態ならびにそのような特許請求の範囲が権利を有する等価物の完全な範囲を含むと解釈されるべきである。したがって、特許請求の範囲は、本開示により限定されない。上記の様々な実施形態を組み合わせて、さらなる実施形態を得ることができる。米国特許仮出願第62/330,841号、米国特許仮出願第62/339,071号、および米国特許仮出願第62/376,886号、国際特許出願第PCT/US2017/030702号、米国特許仮出願第62/579,844号、同第62/582,312号、同第62/583,448号、同第62/579,870号、同第62/579,840号および同第62/582,916号を含む、本明細書に引用されているおよび/または出願データシートに列挙されている米国特許、米国特許出願公開、米国特許出願、外国特許、外国特許出願、および非特許公表文献はすべて、それらの全体が参照により本明細書に組み込まれる。様々な特許、出願および公表文献の概念を利用するために必要に応じて本実施形態の態様を変更して、なおさらなる実施形態を得ることができる。

Claims (9)

  1. 固体支持体上に固定化されたポリペプチド分析物を解析するためのキットであって、
    (a)前記ポリペプチド分析物のN末端アミノ酸(NTAA)を修飾して、前記ポリペプチド分析物の官能化NTAAを生成することができる官能化試薬;
    (b)(i)前記固体支持体上に固定化された前記ポリペプチド分析物の前記官能化NTAAに結合することができる結合性部分、および(ii)前記結合性部分に付着され、前記結合性部分に関する識別情報を含むバーコード配列を含む核酸コーディングタグを各々が含む、1つまたは複数の結合性物質;および
    (c)前記ポリペプチド分析物に直接または間接的に付随するように構成される、1つまたは複数の核酸記録タグ
    を含み、前記1つまたは複数の核酸記録タグおよび前記1つまたは複数の核酸コーディングタグが、各結合性物質と前記固体支持体上に固定化された前記ポリペプチド分析物との結合時に、ライゲーションまたはプライマー伸長によって、前記核酸記録タグと前記核酸コーディングタグとの間で前記結合性部分に関する前記識別情報の移行を可能にするように構成される、キット。
  2. 前記ポリペプチド分析物の前記官能化NTAAを除去して、直接隣接しているアミノ酸残基を第2のNTAAとして露出させるための消去試薬をさらに含む、請求項に記載のキット。
  3. 3つまたは3つよりも多くの異なる結合性物質を含み、各結合性物質が(i)前記ポリペプチド分析物に結合することが可能な結合性部分と(ii)前記結合性部分に関する識別情報を含むバーコード配列を含む核酸コーディングタグとを含む、請求項に記載のキット。
  4. 翻訳後修飾を有する前記ポリペプチド分析物に結合する少なくとも1つの結合性物質をさらに含み、前記少なくとも1つの結合性物質が、(i)前記リペプチド分析物に結合することが可能な結合性部分と(ii)前記結合性部分に関する識別情報を含むバーコード配列を含む核酸コーディングタグとを含む、請求項に記載のキット。
  5. ライゲーションまたはプライマー伸長によって、前記1つまたは複数の核酸コーディングタグと前記1つまたは複数の核酸記録タグとの間で、前記結合性部分に関する前記識別情報の移行をさせるための試薬をさらに含む、請求項に記載のキット。
  6. 20または20よりも多くの異なる結合性物質を含み、各結合性物質が(i)前記ポリペプチド分析物に結合することが可能な結合性部分と(ii)前記結合性部分に関する識別情報を含むバーコード配列を含む核酸コーディングタグとを含む、請求項に記載のキット。
  7. 前記キットをハイスループットポリペプチド解析において使用するための説明書をさらに含む、請求項に記載のキット。
  8. 前記固体支持体をさらに含み、前記1つまたは複数の核酸記録タグが、前記固体支持体に直接または間接的に共有結合により固定化される、または前記固体支持体上に固定化された前記ポリペプチド分析物に付随するように構成される、請求項に記載のキット。
  9. 前記固体支持体が、前記固体支持体上に固定化された複数のDNAヘアピンを含み、前記複数のDNAヘアピンが前記ポリペプチド分析物に付随した前記1つまたは複数の核酸記録タグとハイブリダイズするように構成される、請求項に記載のキット。
JP2020524114A 2017-10-31 2018-10-31 核酸エンコーディングおよび/または標識を使用する解析のためのキット Active JP7390027B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201762579844P 2017-10-31 2017-10-31
US62/579,844 2017-10-31
US201762582312P 2017-11-06 2017-11-06
US62/582,312 2017-11-06
US201762583448P 2017-11-08 2017-11-08
US62/583,448 2017-11-08
PCT/US2018/058565 WO2019089836A1 (en) 2017-10-31 2018-10-31 Kits for analysis using nucleic acid encoding and/or label

Publications (3)

Publication Number Publication Date
JP2021501577A JP2021501577A (ja) 2021-01-21
JP2021501577A5 JP2021501577A5 (ja) 2021-12-09
JP7390027B2 true JP7390027B2 (ja) 2023-12-01

Family

ID=66333623

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020524114A Active JP7390027B2 (ja) 2017-10-31 2018-10-31 核酸エンコーディングおよび/または標識を使用する解析のためのキット

Country Status (10)

Country Link
US (3) US11513126B2 (ja)
EP (1) EP3704249A4 (ja)
JP (1) JP7390027B2 (ja)
KR (1) KR102556494B1 (ja)
CN (1) CN112272703A (ja)
AU (1) AU2018358057B2 (ja)
CA (1) CA3081441C (ja)
MX (1) MX2020004559A (ja)
SG (1) SG11202003924YA (ja)
WO (1) WO2019089836A1 (ja)

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9625469B2 (en) 2011-06-23 2017-04-18 Board Of Regents, The University Of Texas System Identifying peptides at the single molecule level
US11435358B2 (en) 2011-06-23 2022-09-06 Board Of Regents, The University Of Texas System Single molecule peptide sequencing
US10545153B2 (en) 2014-09-15 2020-01-28 Board Of Regents, The University Of Texas System Single molecule peptide sequencing
CN110199019B (zh) 2016-05-02 2024-09-10 Encodia有限公司 采用核酸编码的大分子分析
CN110249082B (zh) 2016-12-01 2023-07-07 诺迪勒思附属公司 测定蛋白质的方法
EP3704249A4 (en) 2017-10-31 2021-10-27 Encodia, Inc. ANALYSIS KITS USING A NUCLEIC ACID CODING AND / OR LABEL
WO2019195633A1 (en) * 2018-04-04 2019-10-10 Ignite Biosciences, Inc. Methods of generating nanoarrays and microarrays
US11302421B2 (en) * 2018-04-13 2022-04-12 The Hong Kong Polytechnic University Data storage using peptides
CN108866046A (zh) * 2018-07-25 2018-11-23 辽宁润基生物科技有限公司 一种分离、纯化样品中外泌体和/或游离核酸的方法
US10836798B2 (en) * 2018-11-08 2020-11-17 Government Of The United States Of America, As Represented By The Secretary Of Commerce Amino acid-specific binder and selectively identifying an amino acid
EP3881078A1 (en) 2018-11-15 2021-09-22 Quantum-Si Incorporated Methods and compositions for protein sequencing
US11427814B2 (en) 2019-03-26 2022-08-30 Encodia, Inc. Modified cleavases, uses thereof and related kits
WO2020223000A1 (en) 2019-04-30 2020-11-05 Encodia, Inc. Methods for preparing analytes and related kits
JP2022533226A (ja) * 2019-05-20 2022-07-21 エンコディア, インコーポレイテッド 空間分析のための方法および関連キット
CN115175998A (zh) * 2019-10-18 2022-10-11 Encodia 公司 分析用大分子的自动化处理及相关设备
EP4045684A1 (en) * 2019-10-28 2022-08-24 Quantum-Si Incorporated Methods of preparing an enriched sample for polypeptide sequencing
US20210148922A1 (en) * 2019-10-28 2021-05-20 Quantum-Si Incorporated Methods of single-polypeptide sequencing and reconstruction
WO2021141924A1 (en) * 2020-01-07 2021-07-15 Encodia, Inc. Methods for stable complex formation and related kits
US20230056532A1 (en) * 2020-01-07 2023-02-23 Encodia, Inc. Methods for information transfer and related kits
EP4073263A4 (en) 2020-01-07 2023-11-08 Encodia, Inc. METHODS FOR FORMING A STABLE COMPLEX AND ASSOCIATED KITS
KR20220136080A (ko) * 2020-02-03 2022-10-07 일루미나, 인코포레이티드 바이오틴-스트렙타비딘 절단 조성물 및 라이브러리 단편 절단
EP4143579A2 (en) 2020-05-20 2023-03-08 Quantum-si Incorporated Methods and compositions for protein sequencing
EP4231174A3 (en) 2020-06-11 2023-11-01 Nautilus Subsidiary, Inc. Methods and systems for computational decoding of biological, chemical, and physical entities
EP4196581A4 (en) * 2020-08-19 2024-05-29 Encodia, Inc. SEQUENTIAL CODING METHODS AND RELATED KITS
US20230220589A1 (en) * 2020-09-30 2023-07-13 Encodia, Inc. Polypeptide terminal binders and uses thereof
WO2022094148A1 (en) 2020-10-30 2022-05-05 Encodia, Inc. Conjugation reagents and methods using 1,2-cyclohexanediones
EP4244382A1 (en) 2020-11-11 2023-09-20 Nautilus Subsidiary, Inc. Affinity reagents having enhanced binding and detection characteristics
EP4281774A2 (en) 2021-01-20 2023-11-29 Nautilus Subsidiary, Inc. Methods for biomolecule quantitation
CA3203535A1 (en) 2021-01-21 2022-07-28 Gregory KAPP Systems and methods for biomolecule preparation
CN112899152B (zh) * 2021-02-02 2023-11-17 中国科学院苏州纳米技术与纳米仿生研究所 核酸快速扩增和检测的微流控芯片、检测方法及系统
US20240044908A1 (en) * 2021-02-09 2024-02-08 University Of Washington Methods for protein identification through combinatorial barcoding
AU2022232933A1 (en) 2021-03-11 2023-09-07 Nautilus Subsidiary, Inc. Systems and methods for biomolecule retention
CN113129996B (zh) * 2021-03-22 2022-04-12 复旦大学 一种基于分子动力学模拟的核酸适配体优化设计方法
EP4314820A1 (en) * 2021-03-25 2024-02-07 The University of Birmingham Analyte capture
EP4320274A1 (en) * 2021-04-09 2024-02-14 Ultima Genomics, Inc. Systems and methods for spatial screening of analytes
CN113281507B (zh) * 2021-05-23 2022-08-16 吉林大学 一种金黄色葡萄球菌快速检测方法及试剂盒
CA3222270A1 (en) 2021-06-24 2022-12-29 Vadim Lobanov Methods and systems for assay refinement
WO2023038859A1 (en) 2021-09-09 2023-03-16 Nautilus Biotechnology, Inc. Characterization and localization of protein modifications
CA3227592A1 (en) 2021-09-22 2023-03-30 Gregory KAPP Methods and systems for determining polypeptide interactions
WO2023081728A1 (en) 2021-11-03 2023-05-11 Nautilus Biotechnology, Inc. Systems and methods for surface structuring
EP4430206A1 (en) 2021-11-10 2024-09-18 Encodia, Inc. Methods for barcoding macromolecules in individual cells
CN113881753B (zh) * 2021-12-08 2022-02-18 南京邮电大学 一种非诊断目的的基因定位方法
EP4448789A1 (en) * 2021-12-15 2024-10-23 Biolegend, Inc. Compositions and methods for enhanced sample multiplexing
EP4206674A1 (en) 2021-12-28 2023-07-05 Encodia, Inc. High-throughput serotyping and antibody profiling assays
AU2023241893A1 (en) 2022-03-29 2024-09-26 Nautilus Subsidiary, Inc. Integrated arrays for single-analyte processes
WO2023201365A1 (en) * 2022-04-15 2023-10-19 Encodia, Inc. High throughput peptide identification using conjugated binders and kinetic encoding
US20230360732A1 (en) 2022-04-25 2023-11-09 Nautilus Subsidiary, Inc. Systems and methods for assessing and improving the quality of multiplex molecular assays
WO2023241720A1 (zh) * 2022-06-17 2023-12-21 上海高探生物科技有限公司 样本处理系统及其制备方法
WO2023250364A1 (en) 2022-06-21 2023-12-28 Nautilus Subsidiary, Inc. Method for detecting analytes at sites of optically non-resolvable distances
WO2024015875A2 (en) * 2022-07-12 2024-01-18 Abrus Bio, Inc. Determination of protein information by recoding amino acid polymers into dna polymers
WO2024030919A1 (en) * 2022-08-02 2024-02-08 Glyphic Biotechnologies, Inc. Protein sequencing via coupling of polymerizable molecules
WO2024058967A1 (en) 2022-09-13 2024-03-21 Nautilus Subsidiary, Inc. Systems and methods of validating new affinity reagents
US20240094215A1 (en) 2022-09-15 2024-03-21 Nautilus Subsidiary, Inc. Characterizing accessibility of macromolecule structures
WO2024073599A1 (en) 2022-09-29 2024-04-04 Nautilus Subsidiary, Inc. Preparation of array surfaces for single-analyte processes
US20240192202A1 (en) 2022-12-09 2024-06-13 Nautilus Subsidiary, Inc. Fluidic media for single-analtye arrays
WO2024130000A1 (en) 2022-12-15 2024-06-20 Nautilus Subsidiary, Inc. Inhibition of photon phenomena on single molecule arrays
US20240301469A1 (en) 2023-02-24 2024-09-12 Nautilus Subsidiary, Inc. Modifying, separating and detecting proteoforms
CN115976655A (zh) * 2023-03-20 2023-04-18 深圳市小分子新药创新中心有限公司 On-DNA酰肼化合物的合成方法、DNA编码化合物库
WO2024206122A1 (en) 2023-03-24 2024-10-03 Nautilus Subsidiary, Inc. Improved transfer of nanoparticles to array surfaces
CN117019248A (zh) * 2023-08-17 2023-11-10 杭州跃真生物科技有限公司 一种微孔芯片与单细胞分析方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014504880A (ja) 2011-01-31 2014-02-27 オリンク エービー エキソヌクレアーゼを用いた近接伸長アッセイ
US20160060687A1 (en) 2014-07-18 2016-03-03 Cdi Laboratories, Inc. Methods and compositions to identify, quantify, and characterize target analytes and binding moieties
WO2017117358A1 (en) 2015-12-30 2017-07-06 Bio-Rad Laboratories, Inc. Digital protein quantification

Family Cites Families (133)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4863870A (en) 1988-03-10 1989-09-05 Bio-Affinity Systems, Inc. Method of thioacylation peptide sequencing with alcoholysis of thiazolinones
US5049507A (en) 1989-12-21 1991-09-17 Applied Biosystems, Inc. Method of C-terminal peptide sequencing
ES2097925T3 (es) 1991-09-18 1997-04-16 Affymax Tech Nv Metodo para sintetizar diversas colecciones de oligomeros.
US5573905A (en) 1992-03-30 1996-11-12 The Scripps Research Institute Encoded combinatorial chemical libraries
SE9400088D0 (sv) 1994-01-14 1994-01-14 Kabi Pharmacia Ab Bacterial receptor structures
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
GB9421819D0 (en) 1994-10-29 1994-12-14 Cancer Res Campaign Tech Sequence analysis of saccharide material
CA2176414A1 (en) 1995-05-18 1996-11-19 S. David Kimball Acyl guanidine and amidine prodrugs
AU6632496A (en) 1995-08-03 1997-03-05 Rijksuniversiteit Te Leiden Cell derived antigen presenting vesicles
JP3124507B2 (ja) 1996-05-24 2001-01-15 セイコーインスツルメンツ株式会社 タンパク質あるいはペプチドのカルボキシ末端からのアミノ酸配列を決定する方法
US5900481A (en) 1996-11-06 1999-05-04 Sequenom, Inc. Bead linkers for immobilizing nucleic acids to solid supports
DE69835143T2 (de) * 1997-01-21 2007-06-06 The General Hospital Corp., Boston Selektion von proteinen mittels rns-protein fusionen
US6306588B1 (en) 1997-02-07 2001-10-23 Invitrogen Corporation Polymerases for analyzing or typing polymorphic nucleic acid fragments and uses thereof
US6465193B2 (en) 1998-12-11 2002-10-15 The Regents Of The University Of California Targeted molecular bar codes and methods for using the same
US6875851B1 (en) 1999-03-05 2005-04-05 University Of Georgia Research Foundation, Inc. Prolyl tripeptidyl peptidases nucleic acid of Porphyromonas gingivalis
AU772069B2 (en) 1999-03-23 2004-04-08 Merck Patent Gesellschaft Mit Beschrankter Haftung Protein isolation and analysis
AU5723700A (en) 1999-05-25 2000-12-12 Praelux Incorporated Method for sequency and characterizing polymeric biomolecules using aptamers anda method for producing aptamers
DK1870417T3 (da) * 1999-07-27 2012-07-16 Bristol Myers Squibb Co Peptidacceptor-ligeringsmetoder
GB9927320D0 (en) 1999-11-18 2000-01-12 Chiron Spa Exosome separation
US7306904B2 (en) 2000-02-18 2007-12-11 Olink Ab Methods and kits for proximity probing
US6511809B2 (en) 2000-06-13 2003-01-28 E. I. Du Pont De Nemours And Company Method for the detection of an analyte by means of a nucleic acid reporter
CA2314398A1 (en) 2000-08-10 2002-02-10 Edward Shipwash Microarrays and microsystems for amino acid analysis and protein sequencing
CA2434139C (en) 2001-01-23 2014-05-27 President And Fellows Of Harvard College Nucleic-acid programmable protein arrays
US20030087232A1 (en) 2001-01-25 2003-05-08 Fred Christians Methods for screening polypeptides
WO2002102820A1 (en) 2001-06-20 2002-12-27 Nuevolution A/S Nucleoside derivatives for library preparation
EP1404846B1 (en) * 2001-07-06 2013-09-11 Institut Pasteur Method for obtaining cells with new properties
US7169894B2 (en) 2001-11-14 2007-01-30 Mirari Biosciences, Inc. Methods and compositions for reverse translation
JP2005509444A (ja) 2001-11-23 2005-04-14 シモン・フレデリックソン 多価近接プローブにより近接プロービングするための方法およびキット
JP2006516889A (ja) 2002-10-10 2006-07-13 ダイヴァーサ コーポレイション プロテアーゼ、それをコードする核酸並びにその製造および使用方法
US20090246879A1 (en) 2002-12-20 2009-10-01 Callida Genomics Materials and Methods Relating to Nano-Tags and Nano-Brands
WO2005015239A2 (en) 2003-08-07 2005-02-17 Cornell Research Foundation, Inc. Method for n-terminal labeling of proteins
US7198900B2 (en) 2003-08-29 2007-04-03 Applera Corporation Multiplex detection compositions, methods, and kits
DE602004023960D1 (de) 2003-09-18 2009-12-17 Nuevolution As Methode zur Gewinnung struktureller Informationen kodierter Moleküle und zur Selektion von Verbindungen
US7579165B2 (en) 2003-10-16 2009-08-25 Shimadzu Corporation Methods for derivatizing protein or peptide with sulfonic acid groups
CN101864412A (zh) 2003-12-17 2010-10-20 普雷西斯药品公司 合成编码文库的方法
GB0404187D0 (en) 2004-02-25 2004-03-31 Biotransformations Ltd Binding agents
EP1730277B1 (en) 2004-03-22 2009-10-28 Nuevolution A/S Ligational encoding using building block oligonucleotides
CA2563168A1 (en) 2004-04-14 2005-11-17 President And Fellows Of Harvard College Nucleic-acid programmable protein arrays
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
US20060199279A1 (en) 2005-03-07 2006-09-07 Viorica Lopez-Avila Methods for identifying post-translationally modified polypeptides
US7229769B2 (en) 2005-03-25 2007-06-12 Illumina, Inc. Compositions and methods for detecting protease activity
US7883848B2 (en) 2005-07-08 2011-02-08 Olink Ab Regulation analysis by cis reactivity, RACR
US20070020640A1 (en) 2005-07-21 2007-01-25 Mccloskey Megan L Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis
US7611834B2 (en) 2005-09-30 2009-11-03 Sandia Corporation Methods and devices for protein assays
WO2007062664A2 (en) 2005-12-01 2007-06-07 Nuevolution A/S Enzymatic encoding methods for efficient synthesis of large libraries
US20070218503A1 (en) 2006-02-13 2007-09-20 Mitra Robi D Methods of polypeptide identification, and compositions therefor
DE102006015001A1 (de) 2006-03-31 2007-10-11 NMI Naturwissenschaftliches und Medizinisches Institut an der Universität Tübingen Verfahren zum Nachweis und/oder zur Anreicherung von Analytproteinen und/oder Analytpeptiden aus einer komplexen Proteinmischung
WO2007127848A1 (en) 2006-04-26 2007-11-08 University Of Louisville Research Foundation, Inc Isolation of membrane vesicles from biological fluids and methods of using same
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
AU2008205410B2 (en) 2007-01-05 2013-10-10 Massachusetts Institute Of Technology Compositions of and methods of using sulfatases from flavobacterium heparinum
WO2009019215A1 (en) 2007-08-03 2009-02-12 Dkfz Deutsches Krebsforschungszentrum Method for prenatal diagnosis using exosomes and cd24 as a marker
EP2210109A1 (en) 2007-10-19 2010-07-28 Pronota NV Preparation of samples for proteome analysis
WO2010065322A1 (en) 2008-12-01 2010-06-10 Research Triangle Institute Concurrent identification of multitudes of polypeptides
WO2010065531A1 (en) 2008-12-01 2010-06-10 Robi David Mitra Single molecule protein screening
US9085798B2 (en) 2009-04-30 2015-07-21 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
US9566335B1 (en) 2009-09-25 2017-02-14 The Governing Council Of The University Of Toronto Protein sequencing method and reagents
US9175340B2 (en) 2009-11-04 2015-11-03 President And Fellows Of Harvard College Reactivity-dependent and interaction-dependent PCR
US20110245101A1 (en) 2010-04-05 2011-10-06 Prognosys Biosciences, Inc. Co-localization affinity assays
PT2556171E (pt) 2010-04-05 2015-12-21 Prognosys Biosciences Inc Ensaios biológicos codificados espacialmente
AU2011237669B2 (en) 2010-04-06 2016-09-08 Caris Life Sciences Switzerland Holdings Gmbh Circulating biomarkers for disease
US20130059741A1 (en) 2010-05-13 2013-03-07 Illumina, Inc. Binding assays for markers
EP3399035B1 (en) 2010-09-27 2021-02-17 Vipergen A method for making an enriched library
JP6219721B2 (ja) 2010-11-10 2017-10-25 エキソソーム ダイアグノスティックス インコーポレイテッド 核酸含有粒子の単離および該粒子からの核酸の抽出のための方法
WO2012112804A1 (en) 2011-02-18 2012-08-23 Raindance Technoligies, Inc. Compositions and methods for molecular labeling
EP2694709B1 (en) 2011-04-08 2016-09-14 Prognosys Biosciences, Inc. Peptide constructs and assay systems
CN110016499B (zh) 2011-04-15 2023-11-14 约翰·霍普金斯大学 安全测序系统
AU2012253366A1 (en) 2011-05-11 2014-01-09 Exosome Diagnostics, Inc. Nucleic acid extraction from heterogeneous biological materials
US9625469B2 (en) 2011-06-23 2017-04-18 Board Of Regents, The University Of Texas System Identifying peptides at the single molecule level
WO2013028788A1 (en) 2011-08-22 2013-02-28 Exosome Diagnostics, Inc. Urine biomarkers
US20130052665A1 (en) 2011-08-25 2013-02-28 Bruce Xuefeng Ling Methods for diagnosis of systemic juvenile idiopathic arthritis
US9335292B2 (en) * 2011-10-13 2016-05-10 Auburn University Electrochemical proximity assay
WO2013071239A1 (en) 2011-11-10 2013-05-16 Exosome Diagnostics, Inc. Cerebrospinal fluid assay
WO2013101896A1 (en) 2011-12-30 2013-07-04 Quest Diagnostics Investments Incorporated Nucleic acid analysis using emulsion pcr
US20150087526A1 (en) 2012-01-24 2015-03-26 The Regents Of The University Of Colorado, A Body Corporate Peptide identification and sequencing by single-molecule detection of peptides undergoing degradation
LT3363901T (lt) 2012-02-17 2021-04-12 Fred Hutchinson Cancer Research Center Kompozicijos ir būdai, skirti tiksliam mutacijų nustatymui
US9862995B2 (en) 2012-03-13 2018-01-09 Abhijit Ajit Patel Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing
HUE051845T2 (hu) 2012-03-20 2021-03-29 Univ Washington Through Its Center For Commercialization Módszerek a tömegesen párhuzamos DNS-szekvenálás hibaarányának csökkentésére duplex konszenzus szekvenálással
US9005888B2 (en) 2012-06-14 2015-04-14 System Biosciences, Llc Methods for microvesicle isolation and selective removal
US9267127B2 (en) 2012-06-21 2016-02-23 President And Fellows Of Harvard College Evolution of bond-forming enzymes
NL2009191C2 (en) 2012-07-16 2014-01-20 Univ Delft Tech Single molecule protein sequencing.
US20140155295A1 (en) 2012-08-14 2014-06-05 10X Technologies, Inc. Capsule array devices and methods of use
US20150376609A1 (en) 2014-06-26 2015-12-31 10X Genomics, Inc. Methods of Analyzing Nucleic Acids from Individual Cells or Cell Populations
US20140378322A1 (en) 2012-08-14 2014-12-25 10X Technologies, Inc. Compositions and methods for sample processing
WO2014039715A1 (en) 2012-09-07 2014-03-13 University Of Rochester Methods and compositions for site-specific labeling of peptides and proteins
WO2014055775A1 (en) 2012-10-03 2014-04-10 Exosome Diagnostics, Inc. Use of microvesicles in diagnosis, prognosis, and treatment of medical diseases and conditions
CA2928520C (en) 2012-10-23 2023-03-14 Caris Life Sciences Switzerland Holdings, S.A.R.L. Aptamers and uses thereof
US9605309B2 (en) 2012-11-09 2017-03-28 Genia Technologies, Inc. Nucleic acid sequencing using tags
US9435810B2 (en) 2013-03-15 2016-09-06 Washington University Molecules and methods for iterative polypeptide analysis and processing
US10767221B2 (en) 2013-03-15 2020-09-08 Illumina, Inc. Enzyme-linked nucleotides
WO2014144713A2 (en) 2013-03-15 2014-09-18 Immumetrix, Inc. Methods of sequencing the immune repertoire
US10053725B2 (en) 2013-04-23 2018-08-21 President And Fellows Of Harvard College In situ interaction determination
WO2014190322A2 (en) 2013-05-24 2014-11-27 Quantapore, Inc. Nanopore-based nucleic acid analysis with mixed fret detection
US10065988B2 (en) 2013-05-31 2018-09-04 Stefano Menegatti Peptoid affinity ligands
DK3013984T3 (da) 2013-06-25 2023-06-06 Prognosys Biosciences Inc Metode til bestemmelse af spatiale mønstre i biologiske targets i en prøve
US10876177B2 (en) 2013-07-10 2020-12-29 President And Fellows Of Harvard College Compositions and methods relating to nucleic acid-protein complexes
JP2016533752A (ja) 2013-08-28 2016-11-04 カリス ライフ サイエンシズ スウィッツァーランド ホー オリゴヌクレオチドプローブおよびその使用
WO2015042506A1 (en) 2013-09-23 2015-03-26 The Trustees Of Columbia University In The City Of New York High-throughput single molecule protein identification
US10288608B2 (en) 2013-11-08 2019-05-14 Prognosys Biosciences, Inc. Polynucleotide conjugates and methods for analyte detection
NZ723336A (en) 2014-02-27 2017-04-28 Univ Texas Methods and compositions for isolating exosomes
US10858698B2 (en) 2014-03-25 2020-12-08 President And Fellows Of Harvard College Barcoded protein array for multiplex single-molecule interaction profiling
CA2946144A1 (en) 2014-04-21 2015-10-29 President And Fellows Of Harvard College Systems and methods for barcoding nucleic acids
US10590407B2 (en) 2014-04-24 2020-03-17 Nanyang Technological University Asx-specific protein ligase
WO2015166768A1 (ja) 2014-05-02 2015-11-05 国立大学法人金沢大学 単一細胞由来核酸の解析方法
WO2015176034A1 (en) * 2014-05-15 2015-11-19 Two Pore Guys, Inc. Scaffold data storage and target detection in a sample using a nanopore
AU2015279617A1 (en) 2014-06-26 2017-01-12 10X Genomics, Inc. Analysis of nucleic acid sequences
WO2016004068A1 (en) 2014-06-30 2016-01-07 Jae-Won Shin Hydrogel compositions comprising encapsulated cells and methods of use thereof
CA3084920C (en) 2014-07-09 2023-02-28 Exosome Diagnostics, Inc. Methods for isolating microvesicles and extracting nucleic acids from biological samples
WO2016019360A1 (en) 2014-08-01 2016-02-04 Dovetail Genomics Llc Tagging nucleic acids for sequence assembly
US10545153B2 (en) 2014-09-15 2020-01-28 Board Of Regents, The University Of Texas System Single molecule peptide sequencing
RU2709655C2 (ru) 2014-10-17 2019-12-19 Иллумина Кембридж Лимитед Транспозиция с сохранением сцепления генов
US9771412B2 (en) 2014-10-31 2017-09-26 Wisconsin Alumni Research Foundation Engineered intein for improved production of protein-intein fusions
EP3218477A4 (en) * 2014-11-10 2018-07-18 The Board of Trustees of The Leland Stanford Junior University Compositions and methods for expressing polypeptides on the surface of cells
KR20200020997A (ko) 2015-02-10 2020-02-26 일루미나, 인코포레이티드 세포 성분을 분석하기 위한 방법 및 조성물
EP3262192B1 (en) 2015-02-27 2020-09-16 Becton, Dickinson and Company Spatially addressable molecular barcoding
US20180284125A1 (en) * 2015-03-11 2018-10-04 The Broad Institute, Inc. Proteomic analysis with nucleic acid identifiers
WO2016164530A1 (en) 2015-04-07 2016-10-13 University Of Maryland, College Park Compositions and methods for high throughput protein sequencing
WO2016201064A1 (en) 2015-06-09 2016-12-15 The Board Of Regents Of The University Of Texas System Diagnostic test for early stage cancer
AU2016326867B2 (en) 2015-09-22 2018-09-13 F. Hoffmann-La Roche Ag OmpG variants
EP3766987B1 (en) 2015-09-24 2023-08-02 F. Hoffmann-La Roche AG Alpha-hemolysin variants
US20200216887A1 (en) 2016-01-21 2020-07-09 Genia Technologies, Inc. Nanopore sequencing complexes
US11286517B2 (en) 2016-02-17 2022-03-29 President And Fellows Of Harvard College Molecular programming tools
CN110199019B (zh) 2016-05-02 2024-09-10 Encodia有限公司 采用核酸编码的大分子分析
US11208676B2 (en) 2016-05-27 2021-12-28 President And Fellows Of Harvard College Conditional primer extension for single-molecule detection
WO2018005720A1 (en) 2016-06-30 2018-01-04 President And Fellows Of Harvard College Method of determining the molecular binding between libraries of molecules
EP3488018A4 (en) 2016-07-22 2020-02-12 President and Fellows of Harvard College METHODS AND COMPOSITIONS FOR THE IDENTIFICATION OF PROTEINS
WO2018140966A1 (en) 2017-01-30 2018-08-02 10X Genomics, Inc. Methods and systems for droplet-based single cell barcoding
FI3583214T3 (fi) 2017-02-02 2023-12-19 New York Genome Center Inc Menetelmiä ja koostumuksia biologisen näytteen sisältämien kohteiden tunnistamiseksi tai kvantifioimiseksi
US20200348307A1 (en) 2017-10-31 2020-11-05 Encodia, Inc. Methods and compositions for polypeptide analysis
EP3704249A4 (en) 2017-10-31 2021-10-27 Encodia, Inc. ANALYSIS KITS USING A NUCLEIC ACID CODING AND / OR LABEL
WO2019089851A1 (en) 2017-10-31 2019-05-09 Encodia, Inc. Methods and kits using nucleic acid encoding and/or label
MX2020006803A (es) 2017-12-29 2020-10-28 Nautilus Biotechnology Inc Estrategias de descodificacion para identificacion de proteinas.
WO2019144056A1 (en) 2018-01-18 2019-07-25 Nanosomix, Inc. Dectection of exosomes and exosomal biomarkers for the diagnosis and prognosis of diseases and disorders
US20190301985A1 (en) 2018-04-03 2019-10-03 Tymora Analytical Operations, Inc. Methods for affinity-based non-antibody capture and purification of extracellular vesicles

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014504880A (ja) 2011-01-31 2014-02-27 オリンク エービー エキソヌクレアーゼを用いた近接伸長アッセイ
US20160060687A1 (en) 2014-07-18 2016-03-03 Cdi Laboratories, Inc. Methods and compositions to identify, quantify, and characterize target analytes and binding moieties
WO2017117358A1 (en) 2015-12-30 2017-07-06 Bio-Rad Laboratories, Inc. Digital protein quantification

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Genome Biology,2016年,17:188,p. 1-15,DOI10.1186/s13059-016-1045-6

Also Published As

Publication number Publication date
EP3704249A4 (en) 2021-10-27
CA3081441A1 (en) 2019-05-09
KR20200093557A (ko) 2020-08-05
US11782062B2 (en) 2023-10-10
CN112272703A (zh) 2021-01-26
MX2020004559A (es) 2020-10-05
JP2021501577A (ja) 2021-01-21
US20230236198A1 (en) 2023-07-27
US20230168254A1 (en) 2023-06-01
US11513126B2 (en) 2022-11-29
AU2018358057A1 (en) 2020-05-21
CA3081441C (en) 2023-08-29
SG11202003924YA (en) 2020-05-28
US20200348308A1 (en) 2020-11-05
KR102556494B1 (ko) 2023-07-18
WO2019089836A1 (en) 2019-05-09
AU2018358057B2 (en) 2023-03-02
EP3704249A1 (en) 2020-09-09

Similar Documents

Publication Publication Date Title
JP7390027B2 (ja) 核酸エンコーディングおよび/または標識を使用する解析のためのキット
JP7253833B2 (ja) 核酸エンコーディングおよび/または標識を使用する方法およびキット
JP7333975B2 (ja) 核酸エンコーディングを使用した巨大分子解析
US20200348307A1 (en) Methods and compositions for polypeptide analysis
CN114127281A (zh) 邻近相互作用分析
US12123878B2 (en) Macromolecule analysis employing nucleic acid encoding
CN113557299A (zh) 加速多肽分析反应的方法和组合物及相关用途

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200717

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211101

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211101

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221012

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230112

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230410

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230802

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231113

R150 Certificate of patent or registration of utility model

Ref document number: 7390027

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150