TW202032125A

TW202032125A - 用於蛋白質定序之方法及組合物

Info

Publication number: TW202032125A
Application number: TW108141682A
Authority: TW
Inventors: 布萊恩瑞德; 傑瑞米雷克伊; 湯瑪士克里斯汀; 羅傑奈尼; 大衛達德; 凱瑟琳芬克; 亞立山德高里亞諾夫; 強納森 M 羅斯伯格
Original assignee: 美商寬騰矽公司
Priority date: 2018-11-15
Filing date: 2019-11-15
Publication date: 2020-09-01
Also published as: US20200209256A1; EP3881078A1; US20200209254A1; US11959920B2; KR20210091243A; US20240272169A1; WO2020102741A1; US20200209257A1; US12055548B2; US12000835B2; BR112021008098A2; CN113287020A; AU2019380606A1; US20200209255A1; CA3117889A1; US20200219590A1; US20200209253A1; MX2021005757A; WO2020102741A8; JP2022507516A

Abstract

本申請案之態樣提供對蛋白質、多肽及胺基酸進行鑑別及定序之方法，及適用於其之組合物。在一些態樣中，本申請案提供在多肽降解過程中獲得資料，及輸出表示該多肽之序列的方法。在一些態樣中，本申請案提供胺基酸識別分子，其包含增強多肽定序反應中之光穩定性的屏蔽元件。

Description

用於蛋白質定序之方法及組合物

在生物系統研究中，蛋白質組學已成為基因組學及轉錄組學之重要且必要補充。對個別生物體之蛋白質組分析可提供深入細胞過程及反應模式之洞察，其使診斷及治療策略得到改良。圍繞蛋白質結構、組成及修飾之複雜性為測定生物樣品之大規模蛋白質定序資訊帶來挑戰。

在一些態樣中，本申請案提供用於自多肽測定胺基酸序列資訊(例如，用於對一或多種多肽進行定序)之方法及組合物。在一些實施例中，可針對單一多肽分子測定胺基酸序列資訊。在一些實施例中，測定多肽中兩個或更多個胺基酸之相對位置，例如針對單一多肽分子進行測定。在一些實施例中，多肽之一或多個胺基酸經標記(例如，直接地或間接地)，且多肽中經標記胺基酸之相對位置經測定。

在一些態樣中，本申請案提供包含在多肽降解過程中獲得資料之方法。在一些實施例中，方法進一步包含分析資料，以確定對應於在降解過程中在多肽之末端處依序暴露之胺基酸的資料部分。在一些實施例中，方法進一步包含輸出表示多肽之胺基酸序列。在一些實施例中，資料指示在降解過程中多肽之末端處的胺基酸身分。在一些實施例中，資料指示在降解過程中由在末端處結合至不同類型之末端胺基酸的一或多種胺基酸識別分子產生之信號。在一些實施例中，資料指示在降解過程中產生之發光信號。在一些實施例中，資料指示在降解過程中產生之電信號。

在一些實施例中，分析資料進一步包含偵測切割事件系列，及確定連續切割事件之間的資料部分。在一些實施例中，分析資料進一步包含針對個別部分中之各者，確定一種類型之胺基酸。在一些實施例中，個別部分中之各者包含脈衝圖案(例如，特徵圖案)，且分析資料進一步包含針對該等部分中之一或多者，基於其各別脈衝圖案確定一種類型之胺基酸。在一些實施例中，確定胺基酸之類型進一步包含在資料超過臨限值時，鑑別一部分內之時間量，及將該時間量與該部分之持續時間進行比較。在一些實施例中，確定胺基酸之類型進一步包含針對一或多個部分中之各者，鑑別至少一個脈衝持續時間。在一些實施例中，確定胺基酸之類型進一步包含針對一或多個部分中之各者，鑑別至少一個脈衝間(interpulse)持續時間。在一些實施例中，胺基酸序列包括對應於該等部分之胺基酸系列。

在一些態樣中，本申請案提供系統，其包含至少一種硬體處理器，及至少一種儲存處理器可執行指令之非暫時性電腦可讀儲存媒體，該等處理器可執行指令在由該至少一種硬體處理器執行時，使該至少一種硬體處理器進行根據本申請案之方法。在一些態樣中，本申請案提供至少一種儲存處理器可執行指令之非暫時性電腦可讀儲存媒體，該等處理器可執行指令在由至少一種硬體處理器執行時，使該至少一種硬體處理器進行根據本申請案之方法。

在一些態樣中，本申請案提供多肽定序之方法。在一些實施例中，方法包含使單一多肽分子與一或多種末端胺基酸識別分子接觸。在一些實施例中，方法進一步包含偵測信號脈衝系列，該系列指示一或多種末端胺基酸識別分子與單一多肽分子降解時在單一多肽分子之末端處暴露之連續胺基酸締合，藉此獲得關於單一多肽分子之序列資訊。在一些實施例中，單一多肽分子之大部分或全部的胺基酸序列經測定。在一些實施例中，信號脈衝系列為即時信號脈衝系列。

在一些實施例中，一或多種末端胺基酸識別分子與在末端處暴露之各類型之胺基酸的締合在信號脈衝系列中產生不同於在末端處暴露之其他類型之胺基酸的特徵圖案。在一些實施例中，該特徵圖案之信號脈衝對應於末端胺基酸識別分子與在末端處暴露之胺基酸之間的個別締合事件。在一些實施例中，特徵圖案對應於與在單一多肽分子之末端處暴露之胺基酸的可逆末端胺基酸識別分子結合相互作用系列。在一些實施例中，特徵圖案指示在單一多肽分子之末端處暴露之胺基酸，及相鄰位置處之胺基酸(例如，相同類型或不同類型的胺基酸)。

在一些實施例中，單一多肽分子由將一或多個胺基酸自單一多肽分子末端移除之切割試劑降解。在一些實施例中，方法進一步包含偵測指示切割試劑與末端締合之信號。在一些實施例中，切割試劑包含可偵測標記(例如，發光標記、導電性標記)。在一些實施例中，單一多肽分子固定至表面。在一些實施例中，單一多肽分子經一或多種末端胺基酸識別分子所締合之末端的遠端端接末端(terminal end)固定至表面。在一些實施例中，單一多肽分子經連接子(例如，包含生物分子之增溶連接子)固定至表面。

在一些態樣中，本申請案提供對多肽進行定序之方法，該等方法包含使單一多肽分子在反應混合物中與包含一或多種末端胺基酸識別分子及切割試劑之組合物接觸。在一些實施例中，方法進一步包含在切割試劑存在下，偵測指示一或多種末端胺基酸識別分子與單一多肽分子之末端締合的信號脈衝系列。在一些實施例中，信號脈衝系列指示作為由切割試劑進行之末端胺基酸切割的結果，隨時間推移在末端處暴露之胺基酸系列。

在一些態樣中，本申請案提供對多肽進行定序之方法，其包含(a)鑑別單一多肽分子之末端處之第一胺基酸，(b)移除第一胺基酸以暴露單一多肽分子之末端處之第二胺基酸，及(c)鑑別單一多肽分子之末端處之第二胺基酸。在一些實施例中，(a)至(c)在單一反應混合物中進行。在一些實施例中，(a)至(c)依序發生。在一些實施例中，(c)在(a)及(b)之前發生。在一些實施例中，單一反應混合物包含一或多種末端胺基酸識別分子。在一些實施例中，單一反應混合物包含切割試劑。在一些實施例中，第一胺基酸由切割試劑移除。在一些實施例中，方法進一步包含重複以下步驟：移除及鑑別單一多肽分子之末端處之一或多個胺基酸，藉此確定單一多肽分子之序列(例如，部分序列或完整序列)。

在一些態樣中，本申請案提供鑑別多肽之胺基酸的方法，其包含使單一多肽分子與結合至單一多肽分子之一或多種胺基酸識別分子接觸。在一些實施例中，方法進一步包含在多肽降解條件下，偵測指示一或多種胺基酸識別分子與單一多肽分子締合之信號脈衝系列。在一些實施例中，方法進一步包含基於信號脈衝系列中之第一特徵圖案，鑑別單一多肽分子中第一類型之胺基酸。

在一些態樣中，本申請案提供鑑別多肽之末端胺基酸(例如，N末端或C末端胺基酸)之方法。在一些實施例中，方法包含使多肽與在多肽之末端處選擇性結合一或多種類型之末端胺基酸的一或多種經標記親和試劑(例如，一或多種胺基酸識別分子)接觸。在一些實施例中，方法進一步包含藉由偵測多肽與一或多種經標記親和試劑之相互作用，在多肽之末端處鑑別末端胺基酸。

在其他態樣中，本申請案提供藉由艾德曼(Edman)型降解反應進行之多肽定序之方法。在一些實施例中，出於偵測或切割之目的，艾德曼型降解反應可藉由使多肽與不同反應混合物接觸進行(例如，相比於可涉及使用單一反應混合物進行偵測及切割之動態定序反應)。

因此，在一些態樣中，本申請案提供確定多肽之胺基酸序列之方法，其包含(i)使多肽與在多肽之末端處選擇性結合一或多種類型之末端胺基酸的一或多種經標記親和試劑接觸。在一些實施例中，方法進一步包含(ii)藉由偵測多肽與一或多種經標記親和試劑之相互作用，在多肽之末端處鑑別末端胺基酸(例如，N末端或C末端胺基酸)。在一些實施例中，方法進一步包含(iii)移除末端胺基酸。在一些實施例中，方法進一步包含(iv)在多肽之末端處重複(i)至(iii)一或多次，以確定多肽之胺基酸序列。

在一些實施例中，方法進一步包含在(i)之後且(ii)之前，移除不選擇性結合末端胺基酸之一或多種經標記親和試劑中之任一者。在一些實施例中，方法進一步包含在(ii)之後且(iii)之前，移除選擇性結合末端胺基酸之一或多種經標記親和試劑中之任一者。

在一些實施例中，移除末端胺基酸(例如，(iii))包含藉由使末端胺基酸與異硫氰酸酯(例如，異硫氰酸苯酯)接觸修飾末端胺基酸，及使經修飾末端胺基酸與特異性結合且移除經修飾末端胺基酸之蛋白酶接觸。在一些實施例中，切割末端胺基酸(例如，(iii))包含藉由使末端胺基酸與異硫氰酸酯接觸修飾末端胺基酸，及使經修飾末端胺基酸經歷足以移除經修飾末端胺基酸之酸性或鹼性條件。

在一些實施例中，鑑別末端胺基酸包含將末端胺基酸鑑別為一或多種經標記親和試劑所結合之一或多種類型之末端胺基酸中的一種類型。在一些實施例中，鑑別末端胺基酸包含將末端胺基酸鑑別為除一或多種經標記親和試劑所結合之一或多種類型之末端胺基酸外的類型。

在一些態樣中，本申請案提供胺基酸識別分子，其包含屏蔽元件，例如用於增強多肽定序反應中之光穩定性。在一些態樣中，本申請案提供式(I )之胺基酸識別分子： A-(Y)_n -D (I )，其中：A係包含至少一種胺基酸識別分子之胺基酸結合組分；Y在各情況下係形成共價或非共價鍵聯基團之聚合物；n係1至10之整數(包括端點)；且D係包含至少一種可偵測標記之標記組分。在一些實施例中，D之直徑小於200 Å。在一些實施例中，-(Y)_n -之長度為至少2 nm (例如，長度為至少5 nm、至少10 nm、至少20 nm、至少30 nm、至少50 nm或更大)。在一些實施例中，-(Y)_n -之長度在約2 nm與約200 nm之間(例如，長度在約2 nm與約100 nm之間、約5 nm與約50 nm之間或約10 nm與約100 nm之間)。在一些實施例中，Y在各情況下獨立地係生物分子或樹狀聚合物(dendritic polymer) (例如，多元醇、樹狀體(dendrimer))。在一些實施例中，本申請案提供包含式(I )之胺基酸識別分子的組合物。在一些實施例中，在組合物中胺基酸識別分子可溶。

在一些態樣中，本申請案提供式(II )之胺基酸識別分子： A-Y¹ -D (II )，其中：A係包含至少一種胺基酸識別分子之胺基酸結合組分；Y¹ 係核酸或多肽；D係包含至少一種可偵測標記之標記組分。在一些實施例中，當Y¹ 係核酸時，核酸形成共價或非共價鍵聯基團。在一些實施例中，倘若當Y¹ 係多肽，則多肽形成特徵在於低於50 × 10^- ⁹ M之解離常數(K_D )的非共價鍵聯基團。在一些實施例中，K_D 低於1 × 10^- ⁹ M、低於1 × 10^- ¹⁰ M、低於1 × 10^- ¹¹ M或低於1 × 10^- ¹² M。

在一些態樣中，本申請案提供胺基酸識別分子，其包含：核酸；連接至核酸上之第一連接位點之至少一種胺基酸識別分子；及連接至核酸上之第二連接位點之至少一種可偵測標記，其中核酸在至少一種胺基酸識別分子與至少一種可偵測標記之間形成共價或非共價鍵聯基團。在一些實施例中，核酸包含第一寡核苷酸股。在一些實施例中，核酸進一步包含與第一寡核苷酸股雜交之第二寡核苷酸股。

在一些態樣中，本申請案提供胺基酸識別分子，其包含：多價蛋白，其包含至少兩個配位體結合位點；至少一種胺基酸識別分子，其經結合至蛋白質上之第一配位體結合位點的第一配位體部分連接至蛋白質；及至少一種可偵測標記，其經結合至蛋白質上之第二配位體結合位點的第二配位體部分連接至蛋白質。在一些實施例中，多價蛋白為抗生物素蛋白(avidin protein)。

在一些實施例中，經屏蔽胺基酸識別分子可用於根據本申請案之多肽定序方法，或此項技術中已知之任何方法。因此，在一些態樣中，本申請案提供多肽定序之方法(例如，在艾德曼型降解反應中、在動態定序反應中或此項技術中已知之其他方法)，其包含使多肽分子與本申請案之一或多種經屏蔽胺基酸識別分子接觸。舉例而言，在一些實施例中，方法包含使多肽分子與包含根據本申請案之屏蔽物或屏蔽元件的至少一種胺基酸識別分子接觸，及偵測至少一種胺基酸識別分子與多肽分子之締合。

在一些態樣中，本申請案提供在混合樣品中鑑別所關注蛋白質之方法。在一些實施例中，方法包含切割混合蛋白質樣品以產生複數個多肽片段。在一些實施例中，方法進一步包含在根據本申請案之方法的方法中，確定複數個多肽片段中之至少一個多肽片段的胺基酸序列。在一些實施例中，方法進一步包含若所關注蛋白質可唯一地鑑別胺基酸序列，則在混合樣品中鑑別所關注蛋白質。

在一些實施例中，鑑別混合樣品中之所關注蛋白質之方法包含切割混合蛋白質樣品以產生複數個多肽片段。在一些實施例中，方法進一步包含用一或多種不同發光標記標記複數個多肽片段中之一或多種類型之胺基酸。在一些實施例中，方法進一步包含針對複數個經標記多肽中之至少一個經標記多肽，隨時間推移量測發光。在一些實施例中，方法進一步包含基於所偵測到之發光確定至少一個經標記多肽的胺基酸序列。在一些實施例中，方法進一步包含若所關注蛋白質可唯一地鑑別胺基酸序列，則在混合樣品中鑑別所關注蛋白質。

因此，在一些實施例中，待根據本申請案分析之多肽分子或所關注蛋白質可為混合或純化樣品中之多肽分子或所關注蛋白質。在一些實施例中，多肽分子或所關注蛋白質自生物樣品(例如，血液、組織、唾液、尿液或其他生物來源)獲得。在一些實施例中，多肽分子或所關注蛋白質自患者樣品(例如，人類樣品)獲得。

本發明之某些實施例的細節闡述於如下文所描述之某些實施例之實施方式中。本發明之其他特徵、目標及優點將根據定義、實例、圖式及申請專利範圍而顯而易見。

相關申請案之交叉參考

本申請案依據35 U.S.C. § 119(e)主張2019年9月27日申請之美國臨時專利申請案第62/907,507號，及2018年11月15日申請之美國臨時專利申請案第62/768,076號的優先權，該等申請案中之各者以全文引用之方式併入本文中。

本申請案之態樣係關於蛋白質定序及鑑別之方法、多肽定序及鑑別之方法、胺基酸鑑別之方法及用於進行此類方法之組合物。

在一些態樣中，本申請案係關於多肽定序技術之發現，該等技術可使用現有分析儀器，幾乎不進行或不進行裝置修改來實施。舉例而言，先前多肽定序策略涉及不同試劑混合物通過含有所分析之多肽的反應容器迭代循環。此類策略可能需要對現有分析儀器，諸如核酸定序儀器進行修改，現有分析儀器可能未配備有能夠進行試劑循環之流槽或類似設備。諸位發明人已認識到且瞭解本申請案之某些多肽定序技術不需要迭代試劑循環，藉此允許使用現有儀器，而不需可能增加儀器大小的大量修改。因此，在一些態樣中，本申請案提供允許使用較小定序儀器之多肽定序方法。在一些態樣中，本申請案係關於多肽定序技術之發現，該等技術允許基因組分析及蛋白質組分析使用同一定序儀器進行。

諸位發明人已進一步認識到且瞭解在多肽定序中，差異性結合相互作用可提供相對於習知標記策略之另外或替代方法。習知多肽定序可涉及用可唯一鑑別的標記標記各類型之胺基酸。此過程費力且容易出錯，因為存在至少二十種不同類型的天然存在之胺基酸，此外還有其大量轉譯後變化形式。在一些態樣中，本申請案係關於涉及使用與不同類型之胺基酸差異性締合之胺基酸識別分子，以產生指示多肽之胺基酸序列的可偵測特徵標誌之技術的發現。因此，本申請案之態樣提供不需要某些習知多肽定序方法中所使用之多肽標記及/或苛刻化學試劑的技術，藉此提高獲自樣品之序列資訊的通量及/或準確度。

在一些態樣中，本申請案係關於可僅使用單一反應混合物(例如，而不需要迭代試劑循環通過反應容器)即時監測之多肽定序反應的發現。如上文所詳述，習知多肽定序反應可涉及將多肽暴露於不同試劑混合物，以在胺基酸偵測與胺基酸切割之步驟之間循環。因此，在一些態樣中，本申請案係關於次世代定序中之改進，其允許貫穿進行中的降解反應藉由胺基酸偵測即時進行多肽分析。藉由動態定序進行此類多肽分析之方法在下文描述。

如本文所描述，在一些態樣中，本申請案提供藉由以下對多肽進行定序之方法：在多肽降解過程中獲得資料，及分析資料，以確定對應於在降解過程中在多肽之末端處依序暴露之胺基酸的資料之部分。在一些實施例中，資料之部分包含指示一或多種胺基酸識別分子與在多肽之末端處暴露的連續胺基酸(例如，在降解期間)締合的信號脈衝系列。在一些實施例中，信號脈衝系列對應於在降解過程中在多肽之末端處的可逆單分子結合相互作用系列。

藉由偵測多肽降解過程中之單分子結合相互作用進行多肽定序的非限制性實例在圖1A中示意性地示出。示例性信號跡線(I)與圖(II)系列一起展示，圖(II)系列描繪對應於信號中之變化時的不同締合事件。如所展示，胺基酸識別分子(帶點(stippled)形狀)與多肽(展示為線珠結構(beads-on-a-string))之末端處的胺基酸之間的締合事件產生信號幅度之變化，該變化持續一定持續時間。

圖(A)及圖(B)描繪胺基酸識別分子與在多肽之末端處暴露的第一胺基酸(例如，第一末端胺基酸)之間的不同締合事件。各締合事件產生信號跡線(I)之變化，該變化之特徵在於持續締合事件之持續時間的信號幅度之變化。因此，圖(A)及圖(B)之締合事件之間的持續時間可對應於一持續時間，在該持續時間內，多肽未與胺基酸識別分子可偵測地締合。

圖(C)及圖(D)描繪胺基酸識別分子與在多肽之末端處暴露的第二胺基酸(例如，第二末端胺基酸)之間的不同締合事件。如本文所描述，在多肽之末端處「暴露」的胺基酸係仍連接至多肽，且在降解期間之前的末端胺基酸(例如，單獨或與一或多個額外胺基酸一起)移除後變為末端胺基酸的胺基酸。因此，圖(II)系列之第一及第二胺基酸提供在多肽之末端處暴露的連續胺基酸之說明性實例，其中第二胺基酸在第一胺基酸移除後變為末端胺基酸。

如大體上所描繪，圖(C)及圖(D)之締合事件產生信號跡線(I)之變化，該等變化之特徵在於與圖(A)及圖(B)相比，持續相對較短持續時間的幅度變化，且與圖(A)及圖(B)相比，圖(C)與圖(D)之締合事件之間的持續時間相對較短。如本文所描述，在一些實施例中，此等獨特信號變化中之一或兩者可用於確定信號跡線(I)中之特徵圖案，該等特徵圖案可區分不同類型之胺基酸。在一些實施例中，自一種特徵圖案轉變至另一特徵圖案指示胺基酸切割。如本文所用，在一些實施例中，胺基酸切割係指自多肽之末端移除至少一個胺基酸(例如，自多肽移除至少一個末端胺基酸)。在一些實施例中，胺基酸切割藉由基於特徵模式之間的持續時間之推斷確定。在一些實施例中，胺基酸切割藉由偵測藉由經標記切割試劑與多肽之末端處之胺基酸的締合產生之信號的變化確定。隨著在降解期間胺基酸自多肽之末端依序切割，偵測到幅度變化系列，或信號脈衝系列。在一些實施例中，信號脈衝資料可如圖1B中所示出來分析。

在一些實施例中，可藉由將臨限水準施加至信號資料之一或多個參數，分析信號資料以提取信號脈衝資訊。舉例而言，圖(III)描繪施加至示例性信號跡線(I)之信號資料的臨限幅度水準(「M _L 」)。在一些實施例中，M _L 為在一時間點處偵測到之信號與針對給定資料集確定之基線之間的最小差值。在一些實施例中，將信號脈衝(「sp」)指派給指示超出M _L 且持續一定持續時間之幅度變化的資料之各部分。在一些實施例中，可向滿足M _L 之資料之一部分施加臨限持續時間，以確定是否將信號脈衝指派給該部分。舉例而言，實驗偽影可導致不持續足以以所需信賴度指派信號脈衝之持續時間的超出M _L 之幅度變化(例如，可能對胺基酸類型為非區分性之短暫締合事件、諸如擴散至觀測區中或觀測區內試劑黏附之非特異性偵測事件)。因此，在一些實施例中，基於臨限幅度水準及臨限持續時間自信號資料提取信號脈衝。

提取出的信號脈衝資訊展示於圖(III)中，出於說明之目的疊加示例性信號跡線(I)。在一些實施例中，信號脈衝之幅度的峰值藉由對在M _L 上方持續之持續時間內所偵測到之幅度取平均來確定。應瞭解，在一些實施例中，如本文所用，「信號脈衝」可以指在基線(例如，原始信號資料，如由示例性信號跡線(I)所示出)上方持續一定持續時間之信號資料變化，或自其提取之信號脈衝資訊(例如，經處理之信號資料，如圖(IV)中所示出)。

圖(IV)展示自示例性信號跡線(I)提取之信號脈衝資訊。在一些實施例中，可分析信號脈衝資訊，以基於信號脈衝系列中之不同特徵圖案鑑別序列中不同類型之胺基酸。舉例而言，如圖(IV)中所展示，信號脈衝資訊基於第一特徵圖案(「CP₁ 」)指示第一類型之胺基酸，且基於第二特徵圖案(「CP₂ 」)指示第二類型之胺基酸。藉助於實例，在較早時間點處所偵測到之兩個信號脈衝基於CP₁ 提供指示多肽之末端處之第一胺基酸的資訊，且在較晚時間點處所偵測到之兩個信號脈衝基於CP₂ 提供指示多肽之末端處之第二胺基酸的資訊。

亦如圖(IV)中所展示，各信號脈衝包含對應於胺基酸識別分子與具有特徵圖案之胺基酸之間的締合事件之脈衝持續時間(「pd 」)。在一些實施例中，脈衝持續時間為結合之解離速率的特徵。亦如所展示，特徵圖案之各信號脈衝由脈衝間持續時間(「ipd 」)與特徵圖案之另一信號脈衝間隔開。在一些實施例中，脈衝間持續時間為結合之締合速率的特徵。在一些實施例中，可基於基線與信號脈衝之峰值之間的差值確定信號脈衝之幅度變化(「ΔM 」)。在一些實施例中，特徵圖案基於脈衝持續時間確定。在一些實施例中，特徵圖案基於脈衝持續時間及脈衝間持續時間確定。在一些實施例中，特徵圖案基於脈衝持續時間、脈衝間持續時間及幅度變化中之任何一或多者確定。

因此，如由圖1A至圖1B所示出，在一些實施例中，藉由在進行中的降解反應中偵測指示一或多種胺基酸識別分子與在多肽之末端處暴露之連續胺基酸的締合之信號脈衝系列，進行多肽定序。可分析信號脈衝系列以確定信號脈衝系列中之特徵模式，且特徵模式之時程可用於確定多肽之胺基酸序列。

在一些實施例中，信號脈衝系列包含光信號幅度隨時間推移之變化系列。在一些實施例中，光信號之變化系列包含在締合事件期間所產生之發光的變化系列。在一些實施例中，發光由與定序反應之一或多種試劑締合之可偵測標記產生。舉例而言，在一些實施例中，一或多種胺基酸識別分子中之各者包含發光標記。在一些實施例中，切割試劑包含發光標記。根據本申請案之發光標記及其用途之實例提供於本文別處。

在一些實施例中，信號脈衝系列包含隨時間推移電信號幅度之變化系列。在一些實施例中，電信號之變化系列包含在締合事件期間產生的電導之變化系列。在一些實施例中，導電性由與定序反應之一或多種試劑締合之可偵測標記產生。舉例而言，在一些實施例中，一或多種胺基酸識別分子中之各者包含導電性標記。根據本申請案之導電性標記及其用途之實例提供於本文別處。已描述用於使用導電性標記鑑別單一分子之方法(參見例如美國專利公開案第2017/0037462號)。

在一些實施例中，電導之變化系列包含通過奈米孔之電導的變化系列。舉例而言，已描述使用奈米孔評估受體-配位體相互作用之方法(參見例如Thakur, A.K.及Movileanu, L. (2019)Nature Biotechnology 37(1))。諸位發明人已認識到且瞭解此類奈米孔可用於監測根據本申請案之多肽定序反應。因此，在一些實施例中，本申請案提供多肽定序之方法，其包含使單一多肽分子與一或多種胺基酸識別分子接觸，其中單一多肽分子固定至奈米孔。在一些實施例中，方法進一步包含偵測通過奈米孔之電導的變化系列，該系列指示一或多種末端胺基酸識別分子與單一多肽降解時在單一多肽之末端處暴露之連續胺基酸締合，藉此對單一多肽分子進行定序。

在一些態樣中，本申請案提供藉由鑑別來自混合物之多肽的一或多種類型之胺基酸，對蛋白質之複雜混合物中之個別蛋白質進行定序及/或鑑別的方法。在一些實施例中，多肽之一或多個胺基酸(例如，末端胺基酸及/或內部胺基酸)經標記(例如，直接地或間接地，例如使用諸如胺基酸識別分子之結合劑)，且多肽中經標記胺基酸之相對位置經確定。在一些實施例中，多肽中胺基酸之相對位置使用胺基酸標記及切割步驟系列確定。然而，在一些實施例中，可無需自多肽移除胺基酸，但藉由使經標記多肽通過孔隙(例如，蛋白質通道)移位，且在通過孔隙移位期間偵測來自(多個)經標記胺基酸之信號(例如，FRET信號)以便確定多肽分子中經標記胺基酸之相對位置，來確定多肽分子中經標記胺基酸之相對位置。

在一些實施例中，評定末端胺基酸(例如，N末端或C末端胺基酸)之身分，其後移除末端胺基酸且評定末端處之下一胺基酸之身分，且重複此過程直至多肽中之複數個連續胺基酸得到評定。在一些實施例中，評定胺基酸之身分包含確定存在的胺基酸之類型。在一些實施例中，確定胺基酸之類型包含確定實際胺基酸身分，例如藉由確定末端胺基酸為天然存在之20種胺基酸中之哪一者(例如，使用對個別末端胺基酸具有特異性之結合劑)。在一些實施例中，胺基酸之類型選自丙胺酸、精胺酸、天冬醯胺酸、天冬胺酸、半胱胺酸、麩醯胺酸、麩胺酸、甘胺酸、組胺酸、異白胺酸、白胺酸、離胺酸、甲硫胺酸、苯丙胺酸、脯胺酸、硒半胱胺酸、絲胺酸、蘇胺酸、色胺酸、酪胺酸及纈胺酸。

然而，在一些實施例中，評定末端胺基酸類型之身分可包含確定可在多肽之末端處存在之潛在胺基酸的子集。在一些實施例中，此可藉由確定胺基酸並非一或多種特定胺基酸(且因此可為其他胺基酸中之任一者)實現。在一些實施例中，此可藉由確定胺基酸之哪一指定子集(例如，基於大小、電荷、疏水性、轉譯後修飾、結合特性)可處於多肽之末端(例如，使用結合至兩種或更多種末端胺基酸之指定子集的結合劑)來實現。

在一些實施例中，評定末端胺基酸類型之身分包含確定胺基酸包含轉譯後修飾。轉譯後修飾之非限制性實例包括乙醯化、ADP-核糖基化、凋亡蛋白酶(caspase)切割、瓜胺酸化(citrullination)、甲醯化、N鍵聯糖基化、O鍵聯糖基化、羥基化、甲基化、豆蔻醯化、類泛素化(neddylation)、硝化、氧化、棕櫚醯化、磷酸化、異戊烯化、S-亞硝基化、硫酸化、類小泛素化(sumoylation)及泛素化。

在一些實施例中，評定末端胺基酸類型之身分包含確定胺基酸包含特徵在於一或多種生物化學特性之側鏈。舉例而言，胺基酸可包含非極性脂族側鏈、帶正電側鏈、帶負電側鏈、非極性芳族側鏈或極性不帶電側鏈。包含非極性脂族側鏈之胺基酸的非限制性實例包括丙胺酸、甘胺酸、纈胺酸、白胺酸、甲硫胺酸及異白胺酸。包含帶正電側鏈之胺基酸的非限制性實例包括離胺酸、精胺酸及組胺酸。包含帶負電側鏈之胺基酸的非限制性實例包括天冬胺酸及麩胺酸。包含非極性芳族側鏈之胺基酸的非限制性實例包括苯丙胺酸、酪胺酸及色胺酸。包含極性不帶電側鏈之胺基酸的非限制性實例包括絲胺酸、蘇胺酸、半胱胺酸、脯胺酸、天冬醯胺酸及麩醯胺酸。

在一些實施例中，蛋白質或多肽可消化成複數個較小多肽，且可自此等較小多肽中之一或多者獲得序列資訊(例如，使用涉及依序評定多肽之末端胺基酸及移除該胺基酸以暴露末端處下一胺基酸之方法)。

在一些實施例中，多肽自其胺基(N)末端定序。在一些實施例中，多肽自其羧基(C)末端定序。在一些實施例中，多肽之第一末端(例如，N或C末端)固定，且另一末端(例如，C或N末端)如本文所描述定序。

如本文所用，對多肽進行定序係指確定多肽之序列資訊。在一些實施例中，此可涉及確定多肽之部分(或全部)之各順序胺基酸的身分。然而，在一些實施例中，此可涉及評定多肽內之胺基酸之子集的身分(例如，及在不確定多肽中各胺基酸之身分的情況下，確定一或多種胺基酸類型之相對位置)。然而，在一些實施例中，可在不直接確定多肽中不同類型之胺基酸之相對位置的情況下，自多肽獲得胺基酸內容資訊。單獨的胺基酸內容可用於推斷存在的多肽之身分(例如，藉由將胺基酸內容與多肽資訊之資料庫進行比較，且確定哪一(些)多肽具有相同胺基酸內容)。

在一些實施例中，可分析獲自較長多肽或蛋白質之複數種多肽產物(例如，經由酶及/或化學切割)之序列資訊，以重構或推斷較長多肽或蛋白質之序列。

因此，在一些實施例中，一或多種類型之胺基酸藉由偵測選擇性結合該一或多種類型之胺基酸的一或多種經標記親和試劑的發光鑑別。在一些實施例中，一或多種類型之胺基酸藉由偵測經標記多肽之發光鑑別。

諸位發明人已進一步認識到且瞭解，尤其相比於習知多肽定序技術，本文所描述之多肽定序技術可涉及產生新穎多肽定序資料。因此，當應用於使用本文所描述之多肽定序技術產生的資料時，用於分析多肽定序資料之習知技術可能不足夠。

舉例而言，涉及迭代試劑循環之習知多肽定序技術可產生與所定序之多肽之個別胺基酸相關的資料。在此類情況下，分析所產生之資料可僅僅涉及確定在特定時間時偵測到哪一胺基酸，因為所偵測到之資料僅對應於一種胺基酸。相比之下，本文所描述之多肽定序技術可在多肽降解過程中，在多肽分子之多個胺基酸經偵測時產生資料，得到其中可能難以在對應於多肽之不同胺基酸的資料段之間進行辨別的資料。因此，諸位發明人已開發用於分析藉由本文所描述之多肽定序技術產生之此類資料的新計算技術，該等技術涉及確定對應於個別胺基酸之資料段，諸如藉由將資料分段成對應於各別胺基酸締合事件之部分。隨後可進一步分析彼等段以鑑別在彼等個別段期間所偵測到之胺基酸。

作為另一實例，涉及對各類型之胺基酸使用可唯一鑑別的標記之習知定序技術可涉及僅僅分析在特定時間時偵測到哪一標記，而不考慮個別胺基酸如何與其他分子相互作用之任何動力學。相比之下，本文所描述之多肽定序技術產生指示胺基酸如何與識別分子相互作用之資料。如上文所論述，資料可包括對應於胺基酸與其各別識別分子之間的締合事件之特徵圖案系列。因此，諸位發明人已開發用於分析特徵圖案以確定對應於資料之該部分之一種類型的胺基酸之新計算技術，允許藉由分析不同特徵圖案系列測定多肽之胺基酸序列。 經標記親和試劑及使用方法

在一些實施例中，本文所提供之方法包含使多肽與選擇性結合一種類型之末端胺基酸的經標記親和試劑(在本文中亦被稱作識別分子，其可包含或可不包含標記)接觸。如本文所用，在一些實施例中，末端胺基酸可以指多肽之胺基末端胺基酸或多肽之羧基末端胺基酸。在一些實施例中，相比於其他類型之末端胺基酸，經標記親和試劑選擇性結合一種類型之末端胺基酸。在一些實施例中，相比於一種類型之內部胺基酸，經標記親和試劑選擇性結合相同類型之末端胺基酸。在其他實施例中，經標記親和試劑選擇性結合處於多肽之任何位置處的一種類型之胺基酸，例如呈末端胺基酸及內部胺基酸形式之相同類型之胺基酸。

如本文所用，在一些實施例中，一種類型之胺基酸係指二十種天然存在之胺基酸中之一者或其類型之子集。在一些實施例中，一種類型之胺基酸係指二十種天然存在之胺基酸中之一者的經修飾變異體，或其未經修飾及/或經修飾變異體之子集。經修飾胺基酸變異體之實例包括(但不限於)轉譯後修飾變異體(例如，乙醯化、ADP-核糖基化、凋亡蛋白酶切割、瓜胺酸化、甲醯化、N鍵聯糖基化、O鍵聯糖基化、羥基化、甲基化、豆蔻醯化、類泛素化、硝化、氧化、棕櫚醯化、磷酸化、異戊烯化、S-亞硝基化、硫酸化、類小泛素化及泛素化)、化學修飾變異體、非天然胺基酸及蛋白型(proteinogenic)胺基酸(諸如硒半胱胺酸及吡咯離胺酸)。在一些實施例中，胺基酸類型之子集包括具有一或多種類似生物化學特性之多於一種且少於二十種胺基酸。舉例而言，在一些實施例中，一種類型之胺基酸係指選自以下的一種類型：具有帶電側鏈(例如，帶正電及/或帶負電側鏈)之胺基酸、具有極性側鏈(例如，極性不帶電側鏈)之胺基酸、具有非極性側鏈(例如，非極性脂族及/或芳族側鏈)之胺基酸及具有疏水性側鏈之胺基酸。

在一些實施例中，本文所提供之方法包含使多肽與選擇性結合一或多種類型之末端胺基酸的一或多種經標記親和試劑接觸。作為說明性且非限制性實例，其中在本申請案之方法中使用四種經標記親和試劑，任一種試劑選擇性結合一種類型之末端胺基酸，其不同於另外三者中之任一者所選擇性結合的另一類型之胺基酸(例如，第一試劑結合第一類型，第二試劑結合第二類型，第三試劑結合第三類型且第四試劑結合第四類型之末端胺基酸)。出於此論述之目的，在本文所描述之方法的情形下，一或多種經標記親和試劑可被替代地稱作一組經標記親和試劑。

在一些實施例中，一組經標記親和試劑包含至少一種且至多六種經標記親和試劑。舉例而言，在一些實施例中，一組經標記親和試劑包含一種、兩種、三種、四種、五種或六種經標記親和試劑。在一些實施例中，一組經標記親和試劑包含十種或更少經標記親和試劑。在一些實施例中，一組經標記親和試劑包含八種或更少經標記親和試劑。在一些實施例中，一組經標記親和試劑包含六種或更少經標記親和試劑。在一些實施例中，一組經標記親和試劑包含四種或更少經標記親和試劑。在一些實施例中，一組經標記親和試劑包含三種或更少經標記親和試劑。在一些實施例中，一組經標記親和試劑包含兩種或更少經標記親和試劑。在一些實施例中，一組經標記親和試劑包含四種經標記親和試劑。在一些實施例中，一組經標記親和試劑包含至少兩種且至多二十種(例如，至少兩種且至多十種、至少兩種且至多八種、至少四種且至多二十種、至少四種且至多十種)經標記親和試劑。在一些實施例中，一組經標記親和試劑包含多於二十種(例如，20種至25種、20種至30種)親和試劑。然而，應瞭解，根據本申請案之方法可使用任何數目的親和試劑以適應所需用途。

根據本申請案，在一些實施例中，藉由偵測經標記親和試劑(例如，包含發光標記之胺基酸識別分子)之發光鑑別一或多種類型之胺基酸。在一些實施例中，經標記親和試劑包含選擇性結合一種類型之胺基酸的親和試劑，及具有發光的與親和試劑締合之發光標記。以此方式，可使發光(例如，發光壽命、發光強度及本文別處所描述之其他發光特性)與親和試劑之選擇性結合相關聯，以鑑別多肽之胺基酸。在一些實施例中，可在根據本申請案之方法中使用複數個類型之經標記親和試劑，其中各類型包含具有可自複數個當中唯一地鑑別之發光的發光標記。適合之發光標記可包括發光分子，諸如螢光團染料，且在本文別處描述。

在一些實施例中，藉由偵測經標記親和試劑之一或多種電特徵鑑別一或多種類型之胺基酸。在一些實施例中，經標記親和試劑包含選擇性結合一種類型之胺基酸的親和試劑，及與親和試劑締合之導電性標記。以此方式，可使一或多種電特徵(例如，電荷、電流振盪色彩及其他電特徵)與親和試劑之選擇性結合相關聯，以鑑別多肽之胺基酸。在一些實施例中，可在根據本申請案之方法中使用複數個類型之經標記親和試劑，其中各類型包含產生可自複數個當中唯一地鑑別之電信號變化(例如，電導變化，諸如導電率幅值變化及特徵圖案之導電性轉變)的導電性標記。在一些實施例中，複數個類型之經標記親和試劑各自包含導電性標記，其具有不同數目之帶電基團(例如，不同數目之帶負電及/或帶正電基團)。因此，在一些實施例中，導電性標記為電荷標記。電荷標記之實例包括樹狀體、奈米粒子、核酸及具有多個帶電基團之其他聚合物。在一些實施例中，導電性標記可由其淨電荷(例如，淨正電荷或淨負電荷)、由其電荷密度及/或由其帶電基團之數目唯一地鑑別。

在一些實施例中，親和試劑(例如，胺基酸識別分子)可由熟習此項技術者使用習知技術進行工程改造。在一些實施例中，所要特性可包括僅當一種類型之胺基酸位於多肽之末端(例如，N末端或C末端)處時，選擇性地且以高親和力結合至該類型之胺基酸的能力。在其他實施例中，所要特性可包括當一種類型之胺基酸位於多肽之末端(例如，N末端或C末端)處時，及當其位於多肽之內部位置處時，選擇性地且以高親和力結合至該類型之胺基酸的能力。在一些實施例中，所要特性包括選擇性地且以低親和力(例如，以約50 nM或更高，例如，在約50 nM與約50 μM之間、在約100 nM與約10 μM之間、在約500 nM與約50 μM之間的K_D )結合至多於一種類型之胺基酸的能力。舉例而言，在一些態樣中，本申請案提供藉由在多肽降解過程中偵測可逆結合相互作用進行定序之方法。有利地，此類方法可使用以低親和力可逆結合至多於一種類型之胺基酸(例如，胺基酸類型之子集)的親和試劑進行。

如本文所用，在一些實施例中，術語「選擇性(selective)」及「特異性(specific)」(及其變化形式，例如選擇性(selectively/selectivity)、特異性(specifically/specificity))係指優先結合相互作用。舉例而言，在一些實施例中，相比於另一類型之胺基酸，選擇性結合一種類型之胺基酸的經標記親和試劑優先結合一種類型之胺基酸。選擇性結合相互作用將區分一種類型之胺基酸(例如，一種類型之末端胺基酸)與其他類型之胺基酸(例如，其他類型之末端胺基酸)，通常高於約10至100倍或更高(例如，高於約1,000或10,000倍)。因此，應瞭解，選擇性結合相互作用可以指相比於其他類型之胺基酸，一種類型之胺基酸可唯一地鑑別之任何結合相互作用。舉例而言，在一些態樣中，本申請案提供藉由獲得指示一或多種胺基酸識別分子與多肽分子締合之資料進行多肽定序之方法。在一些實施例中，資料包含對應於與多肽分子之胺基酸之可逆胺基酸識別分子結合相互作用系列的信號脈衝系列，且資料可用於確定胺基酸之身分。如此，在一些實施例中，「選擇性」或「特異性」結合相互作用係指區分一種類型之胺基酸與其他類型之胺基酸的所偵測到之結合相互作用。

在一些實施例中，經標記親和試劑(例如，胺基酸識別分子)以低於約10^- ⁶ M (例如，低於約10^- ⁷ M、低於約10^- ⁸ M、低於約10^- ⁹ M、低於約10^- ¹⁰ M、低於約10^- ¹¹ M、低於約10^- ¹² M至低至10^- ¹⁶ M)之解離常數(K_D )選擇性結合一種類型之胺基酸，而不顯著結合至其他類型之胺基酸。在一些實施例中，經標記親和試劑以低於約100 nM、低於約50 nM、低於約25 nM、低於約10 nM或低於約1 nM之K_D 選擇性結合一種類型之胺基酸(例如，一種類型之末端胺基酸)。在一些實施例中，經標記親和試劑以在約50 nM與約50 μM之間(例如，在約50 nM與約500 nM之間、在約50 nM與約5 μM之間、在約500 nM與約50 μM之間、在約5 μM與約50 μM之間或在約10 μM與約50 μM之間)的K_D 選擇性結合一種類型之胺基酸。在一些實施例中，經標記親和試劑以約50 nM之K_D 選擇性結合一種類型之胺基酸。

在一些實施例中，經標記親和試劑(例如，胺基酸識別分子)以低於約10^- ⁶ M (例如，低於約10^- ⁷ M、低於約10^- ⁸ M、低於約10^- ⁹ M、低於約10^- ¹⁰ M、低於約10^- ¹¹ M、低於約10^- ¹² M至低至10^- ¹⁶ M)之解離常數(K_D )選擇性結合兩種或更多種類型之胺基酸。在一些實施例中，經標記親和試劑以低於約100 nM、低於約50 nM、低於約25 nM、低於約10 nM或低於約1 nM之K_D 選擇性結合兩種或更多種類型之胺基酸。在一些實施例中，經標記親和試劑以在約50 nM與約50 μM之間(例如，在約50 nM與約500 nM之間、在約50 nM與約5 μM之間、在約500 nM與約50 μM之間、在約5 μM與約50 μM之間或在約10 μM與約50 μM之間)的K_D 選擇性結合兩種或更多種類型之胺基酸。在一些實施例中，經標記親和試劑以約50 nM之K_D 選擇性結合兩種或更多種類型之胺基酸。

根據本文所提供之方法及組合物，圖1C展示經標記親和試劑之各種示例性組態及用途。在一些實施例中，經標記親和試劑100 包含發光標記110 (例如，標記)，及選擇性結合多肽120 之一或多種類型之末端胺基酸的親和試劑(展示為帶點形狀)。在一些實施例中，親和試劑具有針對處於末端位置或處於末端位置及內部位置兩者處的一種類型之胺基酸或一子集(例如，少於二十種常見類型之胺基酸)類型之胺基酸的選擇性。

如本文所描述，親和試劑(亦被稱作「識別分子」)可為相比於另一分子，能夠選擇性或特異性結合一種分子(例如，相比於另一類型之胺基酸，選擇性或特異性結合一種類型之胺基酸，如在本文所提及之「胺基酸識別分子」的情況下)的任何生物分子。在一些實施例中，親和試劑不為肽酶或不具有肽酶活性。舉例而言，在一些實施例中，本申請案之多肽定序之方法涉及使多肽分子與一或多種親和試劑及切割試劑接觸。在此類實施例中，一或多種親和試劑不具有肽酶活性，且由切割試劑進行一或多個胺基酸自多肽分子之移除(例如，自多肽分子之末端進行胺基酸移除)。

親和試劑(例如，識別分子)包括例如蛋白質及核酸，其可為合成或重組的。在一些實施例中，親和試劑或識別分子可為抗體或抗體之抗原結合部分、含SH2域蛋白或其片段或酶生物分子，諸如肽酶、胺基轉移酶、核酶、人工適體酶(aptazyme)或tRNA合成酶(包括胺基醯基-tRNA合成酶)，及描述於2016年9月2日申請之標題為「用於迭代多肽分析及加工之分子及方法(MOLECULES AND METHODS FOR ITERATIVE POLYPEPTIDE ANALYSIS AND PROCESSING)」的美國專利申請案第15/255,433號中之相關分子。

在一些實施例中，本申請案之親和試劑或識別分子為降解路徑蛋白。適用作識別分子之降解路徑蛋白的實例包括(但不限於) N端規則路徑蛋白，諸如Arg/N端規則路徑蛋白、Ac/N端規則路徑蛋白及Pro/N端規則路徑蛋白。在一些實施例中，識別分子為選自以下的N端規則路徑蛋白：Gid蛋白(例如，Gid4或Gid10蛋白)、UBR匣(UBR box)蛋白(例如，UBR1、UBR2)或其含UBR匣域之蛋白片段、p62蛋白或其含ZZ域之片段及ClpS蛋白(例如，ClpS1、ClpS2)。

在一些實施例中，本申請案之親和試劑或識別分子為ClpS蛋白，諸如根癌農桿菌ClpS1、根癌農桿菌ClpS2、細長聚球藻ClpS1、細長聚球藻ClpS2、細長嗜熱聚球藻ClpS、大腸桿菌(Escherichia coli ) ClpS或惡性瘧原蟲(Plasmodium falciparum ) ClpS。在一些實施例中，識別分子為L/F轉移酶，諸如大腸桿菌白胺醯基/苯丙胺醯基-tRNA-蛋白轉移酶。在一些實施例中，識別分子為D/E白胺酸轉移酶，諸如創傷弧菌(Vibrio vulnificus )天冬胺酸/麩胺酸白胺酸轉移酶Bpt。在一些實施例中，識別分子為UBR蛋白或UBR匣域，諸如人類UBR1及UBR2或釀酒酵母(Saccharomyces cerevisiae ) UBR1之UBR蛋白或UBR匣域。在一些實施例中，識別分子為p62蛋白，諸如智人(H . sapiens ) p62蛋白或褐家鼠(Rattus norvegicus ) p62蛋白，或其最少包括ZZ域之截短變異體。在一些實施例中，識別分子為Gid4蛋白，諸如智人GID4或釀酒酵母GID4。在一些實施例中，識別分子為Gid10蛋白，諸如釀酒酵母GID10。在一些實施例中，識別分子為N-豆蔻醯基轉移酶(N-meristoyltransferase)，諸如碩大利什曼原蟲(Leishmania major ) N-豆蔻醯基轉移酶或智人N-豆蔻醯基轉移酶NMT1。在一些實施例中，識別分子為BIR2蛋白，諸如黑腹果蠅(Drosophila melanogaster ) BIR2。在一些實施例中，識別分子為酪胺酸激酶或酪胺酸激酶之SH2域，諸如智人Fyn SH2域、智人Src酪胺酸激酶SH2域，或其變異體，諸如智人Fyn SH2域三重突變體超結合子(superbinder)。在一些實施例中，識別分子為抗體或抗體片段，諸如針對磷酸化酪胺酸或本文所描述之另一轉譯後修飾胺基酸變異體的單鏈抗體可變片段(scFv)。

表1提供胺基酸識別分子之示例性序列之清單。表1中亦展示除非另外規定，否則就多肽之末端位置處的胺基酸身分而言，各分子之胺基酸結合偏好。應瞭解，此等序列及本文所描述之其他實例意欲為非限制性的，且根據本申請案之識別分子可包括其任何同系物、變異體，或其最少含有負責肽識別之域或子域的片段。表1.胺基酸識別蛋白之非限制性實例。

名稱	結合偏好*	SEQ ID NO:	序列
根癌農桿菌ClpS2變異體1	F、W、Y	1	MSDSPVDLKPKPKVKPKLERPKLYKVMLLNDDYTPMSFVTVVLKAVFRMSEDTGRRVMMTAHRFGSAVVVVCERDIAETKAKEATDLGKEAGFPLMFTTEPEE
根癌農桿菌ClpS2	F、W、Y	2	MSDSPVDLKPKPKVKPKLERPKLYKVMLLNDDYTPREFVTVVLKAVFRMSEDTGRRVMMTAHRFGSAVVVVCERDIAETKAKEATDLGKEAGFPLMFTTEPEE
根癌農桿菌ClpS2 C71S	F、W、Y	3	MSDSPVDLKPKPKVKPKLERPKLYKVMLLNDDYTPREFVTVVLKAVFRMSEDTGRRVMMTAHRFGSAVVVVSERDIAETKAKEATDLGKEAGFPLMFTTEPEE
根癌農桿菌ClpS1	F、W、Y、L	4	MIAEPICMQGEGDGEDGGTNRGTSVITRVKPKTKRPNLYRVLLLNDDYTPMEFVIHILERFFQKDREAATRIMLHVHQHGVGECGVFTYEVAETKVSQVMDFARQHQHPLQCVMEKK
根癌農桿菌ClpS2變異體1 C72S	F、W、Y	5	MSDSPVDLKPKPKVKPKLERPKLYKVMLLNDDYTPMSFVTVVLKAVFRMSEDTGRRVMMTAHRFGSAVVVVSERDIAETKAKEATDLGKEAGFPLMFTTEPEE
根癌農桿菌ClpS1 C7S	F、W、Y、L	6	MIAEPISMQGEGDGEDGGTNRGTSVITRVKPKTKRPNLYRVLLLNDDYTPMEFVIHILERFFQKDREAATRIMLHVHQHGVGECGVFTYEVAETKVSQVMDFARQHQHPLQCVMEKK
根癌農桿菌ClpS1 C7S C84S C112S	F、W、Y、L	7	MIAEPISMQGEGDGEDGGTNRGTSVITRVKPKTKRPNLYRVLLLNDDYTPMEFVIHILERFFQKDREAATRIMLHVHQHGVGESGVFTYEVAETKVSQVMDFARQHQHPLQSVMEKK
根癌農桿菌ClpS2熱穩定變異體	F、W、Y	8	MSDSPVDLKPKPKVKPKLERPKLYKVILLNDDYTPMEFVVEVLKRVFNMSEEQARRVMMTAHKKGKAVVGVCPRDIAETKAKQATDLAREAGFPLMFTTEPEE
根癌農桿菌ClpS2熱穩定變異體C72S	F、W、Y	9	MSDSPVDLKPKPKVKPKLERPKLYKVILLNDDYTPMEFVVEVLKRVFNMSEEQARRVMMTAHKKGKAVVGVSPRDIAETKAKQATDLAREAGFPLMFTTEPEE
細長聚球藻ClpS1	F、W、Y	10	MAVETIQKPETTTKRKIAPRYRVLLHNDDFNPMEYVVMVLMQTVPSLTQPQAVDIMMEAHTNGTGLVITCDIEPAEFYCEQLKSHGLSSSIEPDD
細長聚球藻ClpS2	F、W、Y、L、V、I	11	MSPQPDESVLSILGVPRPCVKKRSRNDAFVLTVLTCSLQAIAAPATAPGTTTTRVRQPYPHFRVIVLDDDVNTFQHVAECLLKYIPGMTGDRAWDLTNQVHYEGAATVWSGPQEQAELYHEQLRREGLTMAPLEAA
細長嗜熱聚球藻ClpS	F、W、Y、L	12	MPQERQQVTRKHYPNYKVIVLNDDFNTFQHVAACLMKYIPNMTSDRAWELTNQVHYEGQAIVWVGPQEQAELYHEQLLRAGLTMAPLEPE
大腸桿菌ClpS	F、W、Y、L	13	MGKTNDWLDFDQLAEEKVRDALKPPSMYKVILVNDDYTPMEFVIDVLQKFFSYDVERATQLMLAVHYQGKAICGVFTAEVAETKVAMVNKYARENEHPLLCTLEKA
大腸桿菌ClpS M40A	F、W、Y、L	14	MGKTNDWLDFDQLAEEKVRDALKPPSMYKVILVNDDYTPAEFVIDVLQKFFSYDVERATQLMLAVHYQGKAICGVFTAEVAETKVAMVNKYARENEHPLLCTLEKA
惡性瘧原蟲ClpS	F、W、Y、L、I	15	MFKDLKPFFLCIILLLLLIYKCTHSYNIKNKNCPLNFMNSCVRINNVNKNTNISFPKELQKRPSLVYSQKNFNLEKIKKLRNVIKEIKKDNIKEADEHEKKEREKETSAWKVILYNDDIHNFTYVTDVIVKVVGQISKAKAHTITVEAHSTGQALILSTWKSKAEKYCQELQQNGLTVSIIHESQLKDKQKK
大腸桿菌白胺醯基/苯丙胺醯基-tRNA-蛋白轉移酶	K、R	16	MRLVQLSRHSIAFPSPEGALREPNGLLALGGDLSPARLLMAYQRGIFPWFSPGDPILWWSPDPRAVLWPESLHISRSMKRFHKRSPYRVTMNYAFGQVIEGCASDREEGTWITRGVVEAYHRLHELGHAHSIEVWREDELVGGMYGVAQGTLFCGESMFSRMENASKTALLVFCEEFIGHGGKLIDCQVLNDHTASLGACEIPRRDYLNYLNQMRLGRLPNNFWVPRCLFSPQELE
創傷弧菌天冬胺酸/麩胺酸白胺酸轉移酶Bpt	D、E	17	MSSDIHQIKIGLTDNHPCSYLPERKERVAVALEADMHTADNYEVLLANGFRRSGNTIYKPHCDSCHSCQPIRISVPDIELSRSQKRLLAKARSLSWSMKRNMDENWFDLYSRYIVARHRNGTMYPPKKDDFAHFSRNQWLTTQFLHIYEGQRLIAVAVTDIMDHCASAFYTFFEPEHELSLGTLAVLFQLEFCQEEKKQWLYLGYQIDECPAMNYKVRFHRHQKLVNQRWQ
釀酒酵母UBR1	K、R、H	18	MGSVHKHTGRNCGRKFKIGEPLYRCHECGCDDTCVLCIHCFNPKDHVNHHVCTDICTEFTSGICDCGDEEAWNSPLHCKAEEQ
智人GID4	P	19	MSGSKFRGHQKSKGNSYDVEVVLQHVDTGNSYLCGYLKIKGLTEEYPTLTTFFEGEIISKKHPFLTRKWDADEDVDRKHWGKFLAFYQYAKSFNSDDFDYEELKNGDYVFMRWKEQFLVPDHTIKDISGASFAGFYYICFQKSAASIEGYYYHRSSEWYQSLNLTHV
釀酒酵母GID4	P	20	MINNPKVDSVAEKPKAVTSKQSEQAASPEPTPAPPVSRNQYPITFNLTSTAPFHLHDRHRYLQEQDLYKCASRDSLSSLQQLAHTPNGSTRKKYIVEDQSPYSSENPVIVTSSYNHTVCTNYLRPRMQFTGYQISGYKRYQVTVNLKTVDLPKKDCTSLSPHLSGFLSIRGLTNQHPEISTYFEAYAVNHKELGFLSSSWKDEPVLNEFKATDQTDLEHWINFPSFRQLFLMSQKNGLNSTDDNGTTNAAKKLPPQQLPTTPSADAGNISRIFSQEKQFDNYLNERFIFMKWKEKFLVPDALLMEGVDGASYDGFYYIVHDQVTGNIQGFYYHQDAEKFQQLELVPSLKNKVESSDCSFEFA
針對磷酸化酪胺酸之單鏈抗體可變片段(scFv)**	磷酸化Y	21	MMEVQLQQSGPELVKPGASVMISCRTSAYTFTENTVHWVKQSHGESLEWIGGINPYYGGSIFSPKFKGKATLTVDKSSSTAYMELRSLTSEDSAVYYCARRAGAYYFDYWGQGTTLTVSSGGGSGGGSGGGSENVLTQSPAIMSASPGEKVTMTCRASSSVSSSYLHWYRQKSGASPKLWIYSTSNLASGVPARFSGSGSGTSYSLTISSVEAEDAATYYCQQYSGYRTFGGGTKLEIKR
智人Fyn SH2域**	磷酸化Y	22	MGAMDSIQAEEWYFGKLGRKDAERQLLSFGNPRGTFLIRESETTKGAYSLSIRDWDDMKGDHVKHYKIRKLDNGGYYITTRAQFETLQQLVQHYSERAAGLSSRLVVPSHK
智人Fyn SH2域三重突變體超結合子**	磷酸化Y	23	MGAMDSIQAEEWYFGKLGRKDAERQLLSFGNPRGTFLIRESETVKGAYALSIRDWDDMKGDHVKHYLIRKLDNGGYYITTRAQFETLQQLVQHYSERAAGLSSRLVVPSHK
智人Src酪胺酸激酶SH2域**	磷酸化Y	24	MGAMDSIQAEEWYFGKITRRESERLLLNAENPRGTFLVRESETTKGAYSLSVSDFDNAKGLNVKHYKIRKLDSGGFYITSRTQFNSLQQLVAYYSKHADGLCHRLTTVCPTSK
智人Src酪胺酸激酶SH2域三重突變體**	磷酸化Y	25	MGAMDSIQAEEWYFGKITRRESERLLLNAENPRGTFLVRESEVTKGAYALSVSDFDNAKGLNVKHYLIRKLDSGGFYITSRTQFNSLQQLVAYYSKHADGLCHRLTTVCPTSK
智人p62片段1-310	K、R、H、W、F、Y	26	MASLTVKAYLLGKEDAAREIRRFSFCCSPEPEAEAEAAAGPGPCERLLSRVAALFPALRPGGFQAHYRDEDGDLVAFSSDEELTMAMSYVKDDIFRIYIKEKKECRRDHRPPCAQEAPRNMVHPNVICDGCNGPVVGTRYKCSVCPDYDLCSVCEGKGLHRGHTKLAFPSPFGHLSEGFSHSRWLRKVKHGHFGWPGWEMGPPGNWSPRPPRAGEARPGPTAESASGPSEDPSVNFLKNVGESVAAALSPLGIEVDIDVEHGGKRSRLTPVSPESSSTEEKSSSQPSSCCSDPSKPGGNVEGATQSLAEQ
智人p62片段1-180	K、R、H、W、F、Y	27	MASLTVKAYLLGKEDAAREIRRFSFCCSPEPEAEAEAAAGPGPCERLLSRVAALFPALRPGGFQAHYRDEDGDLVAFSSDEELTMAMSYVKDDIFRIYIKEKKECRRDHRPPCAQEAPRNMVHPNVICDGCNGPVVGTRYKCSVCPDYDLCSVCEGKGLHRGHTKLAFPSPFGHLSEGFSHSRWLRKVKHGHFGWPGWEMGPPGNWSPRPPRAGEARPGPTAESASGPSEDPSVNFLKNVGESVAAALSPLGIEVDIDVEHGGKRSRLTPVSPESSSTEEKSSSQPSSCCSDPSKPGGNVEGATQSLAEQ
智人p62片段126-180	K、R、H、W、F、Y	28	MASLTVKAYLLGKEDAAREIRRFSFCCSPEPEAEAEAAAGPGPCERLLSRVAALFPALRPGGFQAHYRDEDGDLVAFSSDEELTMAMSYVKDDIFRIYIKEKKECRRDHRPPCAQEAPRNMVHPNVICDGCNGPVVGTRYKCSVCPDYDLCSVCEGKGLHRGHTKLAFPSPFGHLSEGFSHSRWLRKVKHGHFGWPGWEMGPPGNWSPRPPRAGEARPGPTAESASGPSEDPSVNFLKNVGESVAAALSPLGIEVDIDVEHGGKRSRLTPVSPESSSTEEKSSSQPSSCCSDPSKPGGNVEGATQSLAEQ
智人p62蛋白	K、R、H、W、F、Y	29	MASLTVKAYLLGKEDAAREIRRFSFCCSPEPEAEAEAAAGPGPCERLLSRVAALFPALRPGGFQAHYRDEDGDLVAFSSDEELTMAMSYVKDDIFRIYIKEKKECRRDHRPPCAQEAPRNMVHPNVICDGCNGPVVGTRYKCSVCPDYDLCSVCEGKGLHRGHTKLAFPSPFGHLSEGFSHSRWLRKVKHGHFGWPGWEMGPPGNWSPRPPRAGEARPGPTAESASGPSEDPSVNFLKNVGESVAAALSPLGIEVDIDVEHGGKRSRLTPVSPESSSTEEKSSSQPSSCCSDPSKPGGNVEGATQSLAEQMRKIALESEGRPEEQMESDNCSGGDDDWTHLSSKEVDPSTGELQSLQMPESEGPSSLDPSQEGPTGLKEAALYPHLPPEADPRLIESLSQMLSMGFSDEGGWLTRLLQTKNYDIGAALDTIQYSKHPPPL
褐家鼠p62蛋白	K、R、H、W、F、Y	30	MASLTVKAYLLGKEEAAREIRRFSFCFSPEPEAEAAAGPGPCERLLSRVAVLFPALRPGGFQAHYRDEDGDLVAFSSDEELTMAMSYVKDDIFRIYIKEKKECRREHRPPCAQEARSMVHPNVICDGCNGPVVGTRYKCSVCPDYDLCSVCEGKGLHREHSKLIFPNPFGHLSDSFSHSRWLRKLKHGHFGWPGWEMGPPGNWSPRPPRAGDGRPCPTAESASAPSEDPNVNFLKNVGESVAAALSPLGIEVDIDVEHGGKRSRLTPTSAESSSTGTEDKSGTQPSSCSSEVSKPDGAGEGPAQSLTEQMKKIALESVGQPEELMESDNCSGGDDDWTHLSSKEVDPSTGELQSLQMPESEGPSSLDPSQEGPTGLKEAALYPHLPPEADPRLIESLSQMLSMGFSDEGGWLTRLLQTKNYDIGAALDTIQYSKHPPPL
釀酒酵母GID10	P、M、V	31	MTSLNIMGRKFILERAKRNDNIEEIYTSAYVSLPSSTDTRLPHFKAKEEDCDVYEEGTNLVGKNAKYTYRSLGRHLDFLRPGLRFGGSQSSKYTYYTVEVKIDTVNLPLYKDSRSLDPHVTGTFTIKNLTPVLDKVVTLFEGYVINYNQFPLCSLHWPAEETLDPYMAQRESDCSHWKRFGHFGSDNWSLTERNFGQYNHESAEFMNQRYIYLKWKERFLLDDEEQENQMLDDNHHLEGASFEGFYYVCLDQLTGSVEGYYYHPACELFQKLELVPTNCDALNTYSSGFEIA
來自智人UBR1之UBR匣域	K、R、H	32	MGPLGSLCGRVFKSGETTYSCRDCAIDPTCVLCMDCFQDSVHKNHRYKMHTSTGGGFCDCGDTEAWKTGPFCVNHEP
來自智人UBR2之UBR匣域	K、R、H	33	MGPLGSLCGRVFKVGEPTYSCRDCAVDPTCVLCMECFLGSIHRDHRYRMTTSGGGGFCDCGDTEAWKEGPYCQKHE
碩大利什曼原蟲N-豆蔻醯基轉移酶	G	34	MSRNPSNSDAAHAFWSTQPVPQTEDETEKIVFAGPMDEPKTVADIPEEPYPIASTFEWWTPNMEAADDIHAIYELLRDNYVEDDDSMFRFNYSEEFLQWALCPPNYIPDWHVAVRRKADKKLLAFIAGVPVTLRMGTPKYMKVKAQEKGEGEEAAKYDEPRHICEINFLCVHKQLREKRLAPILIKEATRRVNRTNVWQAVYTAGVLLPTPYASGQYFHRSLNPEKLVEIRFSGIPAQYQKFQNPMAMLKRNYQLPSAPKNSGLREMKPSDVPQVRRILMNYLDSFDVGPVFSDAEISHYLLPRDGVVFTYVVENDKKVTDFFSFYRIPSTVIGNSNYNLLNAAYVHYYAATSIPLHQLILDLLIVAHSRGFDVCNMVEILDNRSFVEQLKFGAGDGHLRYYFYNWAYPKIKPSQVALVML
智人N-豆蔻醯基轉移酶NMT1	G	35	MADESETAVKPPAPPLPQMMEGNGNGHEHCSDCENEEDNSYNRGGLSPANDTGAKKKKKKQKKKKEKGSETDSAQDQPVKMNSLPAERIQEIQKAIELFSVGQGPAKTMEEASKRSYQFWDTQPVPKLGEVVNTHGPVEPDKDNIRQEPYTLPQGFTWDALDLGDRGVLKELYTLLNENYVEDDDNMFRFDYSPEFLLWALRPPGWLPQWHCGVRVVSSRKLVGFISAIPANIHIYDTEKKMVEINFLCVHKKLRSKRVAPVLIREITRRVHLEGIFQAVYTAGVVLPKPVGTCRYWHRSLNPRKLIEVKFSHLSRNMTMQRTMKLYRLPETPKTAGLRPMETKDIPVVHQLLTRYLKQFHLTPVMSQEEVEHWFYPQENIIDTFVVENANGEVTDFLSFYTLPSTIMNHPTHKSLKAAYSFYNVHTQTPLLDLMSDALVLAKMKGFDVFNALDLMENKTFLEKLKFGIGDGNLQYYLYNWKCPSMGAEKVGLVLQ
黑腹果蠅BIR2	A	36	MGDVQPETCRPSAASGNYFPQYPEYAIETARLRTFEAWPRNLKQKPHQLAEAGFFYTGVGDRVRCFSCGGGLMDWNDNDEPWEQHALWLSQCRFVKLMKGQLYIDTVAAKPVLAEEKEESTSIGGDT
結合偏好根據公開科學文獻推斷且/或由諸位發明人在如本文所描述之單分子實驗中進一步證明。 * 與磷酸化酪胺酸之結合可出現在肽末端處或內部位置處。

因此，在一些實施例中，本申請案提供胺基酸識別分子，其具有選自表1之胺基酸序列(或具有與選自表1之胺基酸序列具有至少50%、至少60%、至少70%、至少80%、80%至90%、90%至95%、95%至99%或更高胺基酸序列一致性之胺基酸序列)。在一些實施例中，胺基酸識別分子與表1中所列之胺基酸識別分子具有25%至50%、50%至60%、60%至70%、70%至80%、80%至90%、90%至95%或95%至99%或更高胺基酸序列一致性。在一些實施例中，胺基酸識別分子為經修飾胺基酸識別分子，且相對於表1中所列舉之序列，包括一或多種胺基酸突變。

在一些實施例中，胺基酸識別分子包含提供除胺基酸結合外之一或多個功能的標籤序列。舉例而言，在一些實施例中，標籤序列包含生物素連接酶識別序列，其准許對識別分子進行生物素標記(例如，併入一或多個生物素分子，包括生物素及雙生物素部分)。標籤序列中之官能性序列的額外實例包括純化標籤、切割位點及適用於識別分子之純化及/或修飾的其他部分。表2提供末端標籤序列之非限制性序列之清單，該等序列中之任何一或多者可與本申請案之胺基酸識別分子中之任一者組合(例如，與表1中所列舉之序列組合)使用。應瞭解，表2中所展示之標籤序列意欲為非限制性的，且根據本申請案之識別分子可包括在識別分子多肽之N末端或C末端處、在N末端與C末端之間分割或如此項技術中所實踐以其他方式重排的標籤序列(例如，His標籤及/或生物素標記標籤)中之任何一或多者。表2.末端標籤序列之非限制性實例。

名稱	SEQ ID NO:	序列
生物素標記標籤	37	GGGSGGGSGGGSGLNDFFEAQKIEWHE
雙生物素標記標籤	38	GGGSGGGSGGGSGLNDFFEAQKIEWHEGGGSGGGSGGGSGLNDFFEAQKIEWHE
雙生物素標記標籤	39	GSGGGSGGGSGGGSGLNDFFEAQKIEWHEGGGSGGGSGGGSGLNDFFEAQKIEWHE
His/生物素標記標籤	40	GHHHHHHHHHHGGGSGGGSGGGSGLNDFFEAQKIEWHE
His/雙生物素標記標籤	41	GHHHHHHHHHHGGGSGGGSGGGSGLNDFFEAQKIEWHEGGGSGGGSGGGSGLNDFFEAQKIEWHE
His/雙生物素標記標籤	42	GGSHHHHHHHHHHGGGSGGGSGGGSGLNDFFEAQKIEWHEGGGSGGGSGGGSGLNDFFEAQKIEWHE
His/雙生物素標記標籤	43	GSHHHHHHHHHHGGGSGGGSGGGSGLNDFFEAQKIEWHEGGGSGGGSGGGSGLNDFFEAQKIEWHE
雙生物素標記/His標籤	44	GGGSGGGSGGGSGLNDFFEAQKIEWHEGGGSGGGSGGGSGLNDFFEAQKIEWHEGHHHHHH

在一些實施例中，本申請案之識別分子或親和試劑為肽酶。肽酶，亦稱作蛋白酶(protease/proteinase)，係催化肽鍵之水解的酶。肽酶將多肽消化成較短片段，且一般可分類為內肽酶及外肽酶，其分別在內部及末端切割多肽鏈。在一些實施例中，經標記親和試劑100 包含已經修飾以使外肽酶或內肽酶活性不活化之肽酶。以此方式，經標記親和試劑100 選擇性結合來自多肽之胺基酸，而不亦將胺基酸自多肽切割。在其他實施例中，可使用尚未經修飾以使外肽酶或內肽酶活性不活化之肽酶。舉例而言，在一些實施例中，經標記親和試劑包含經標記外肽酶102 。

根據本申請案之某些實施例，蛋白質定序方法可包含在多肽之端接末端處迭代偵測及切割。在一些實施例中，經標記外肽酶102 可用作進行胺基酸偵測及切割之步驟兩者的單一試劑。如大體上所描繪，在一些實施例中，經標記外肽酶102 具有胺肽酶或羧肽酶活性，使得其選擇性結合且切割分別來自多肽之N末端或C末端胺基酸。應瞭解，在某些實施例中，如本文所描述，經標記外肽酶102 可由熟習此項技術者催化不活化，使得經標記外肽酶102 保留用作非切割經標記親和試劑100 的選擇性結合特性。

外肽酶一般需要多肽受質包含其胺基末端處之游離胺基或其羧基末端處之游離羧基中之至少一者。在一些實施例中，根據本申請案之外肽酶水解處於或接近於多肽之末端的鍵。在一些實施例中，外肽酶水解距多肽末端不超過三個殘基的鍵。舉例而言，在一些實施例中，由外肽酶催化之單一水解反應自多肽端接末端切割單一胺基酸、二肽或三肽。

在一些實施例中，根據本申請案之外肽酶為胺肽酶或羧肽酶，其分別自胺基末端或羧基末端切割單一胺基酸。在一些實施例中，根據本申請案之外肽酶為二肽基-肽酶或肽基-二肽酶，其分別自胺基末端或羧基末端切割二肽。在其他實施例中，根據本申請案之外肽酶為三肽基-肽酶，其自胺基末端切割三肽。肽酶分類及其各類別或子類別之活性為熟知的，且描述於文獻中(參見例如Gurupriya, V. S.及Roy, S. C.Proteases and Protease Inhibitors in Male Reproduction . Proteases in Physiology and Pathology 195-216 (2017)；及Brix, K.及Stöcker, W.Proteases : Structure and Function . 第1章)。在一些實施例中，根據本申請案之肽酶自多肽末端移除多於三個胺基酸。因此，在一些實施例中，肽酶為內肽酶，例如優先在特定位置處(例如，特定胺基酸之前或之後)切割之內肽酶。在一些實施例中，內肽酶活性之多肽切割產物的大小將視所分析之多肽內切割位點(例如，胺基酸)之分佈而定。

可基於定序反應之方向性選擇或工程改造根據本申請案之外肽酶。舉例而言，在自多肽之胺基末端至羧基末端定序的實施例中，外肽酶包含胺肽酶活性。相反，在自多肽之羧基末端至胺基末端定序的實施例中，外肽酶包含羧肽酶活性。識別特定羧基末端胺基酸之羧肽酶(其可用作經標記外肽酶，或經不活化以用作本文所描述之非切割經標記親和試劑)已描述於文獻中(參見例如Garcia-Guerrero, M.C.等人 (2018)PNAS 115(17))。

適用作切割試劑及/或親和試劑(例如，識別分子)之肽酶包括選擇性結合一或多種類型之胺基酸的胺肽酶。在一些實施例中，胺肽酶識別分子經修飾以使胺肽酶活性不活化。在一些實施例中，胺肽酶切割試劑為非特異性的，使得其自多肽之端接末端切割大部分或所有類型之胺基酸。在一些實施例中，相比於多肽之端接末端處之其他類型的胺基酸，胺肽酶切割試劑在自多肽之端接末端切割一或多種類型之胺基酸時更高效。舉例而言，根據本申請案之胺肽酶特異性切割丙胺酸、精胺酸、天冬醯胺酸、天冬胺酸、半胱胺酸、麩醯胺酸、麩胺酸、甘胺酸、組胺酸、異白胺酸、白胺酸、離胺酸、甲硫胺酸、苯丙胺酸、脯胺酸、硒半胱胺酸、絲胺酸、蘇胺酸、色胺酸、酪胺酸及/或纈胺酸。在一些實施例中，胺肽酶為脯胺酸胺肽酶。在一些實施例中，胺肽酶為脯胺酸亞胺基肽酶。在一些實施例中，胺肽酶為麩胺酸/天冬胺酸特異性胺肽酶。在一些實施例中，胺肽酶為甲硫胺酸特異性胺肽酶。在一些實施例中，胺肽酶為表3中所列舉之胺肽酶。在一些實施例中，胺肽酶切割試劑切割如表3中所列舉之肽受質。

在一些實施例中，胺肽酶為非特異性胺肽酶。在一些實施例中，非特異性胺肽酶為鋅金屬蛋白酶。在一些實施例中，非特異性胺肽酶為表4中所列舉之胺肽酶。在一些實施例中，非特異性胺肽酶切割如表4中所列舉之肽受質。

因此，在一些實施例中，本申請案提供胺肽酶(例如，胺肽酶識別分子、胺肽酶切割試劑)，其具有選自表3或表4之胺基酸序列(或具有與選自表3或表4之胺基酸序列具有至少50%、至少60%、至少70%、至少80%、80%至90%、90%至95%、95%至99%或更高胺基酸序列一致性之胺基酸序列)。在一些實施例中，胺肽酶與表3或表4中所列之胺肽酶具有25%至50%、50%至60%、60%至70%、70%至80%、80%至90%、90%至95%或95%至99%或更高胺基酸序列一致性。在一些實施例中，胺肽酶為經修飾胺肽酶，且相對於表3或表4中所列舉之序列，包括一或多種胺基酸突變。表3.胺肽酶之非限制性實例。

名稱	SEQ ID NO:	序列
嗜肺性退伍軍人桿菌(L . pneumophila ) M1胺肽酶 (Glu/Asp特異性)	45	MMVKQGVFMKTDQSKVKKLSDYKSLDYFVIHVDLQIDLSKKPVESKARLTVVPNLNVDSHSNDLVLDGENMTLVSLQMNDNLLKENEYELTKDSLIIKNIPQNTPFTIEMTSLLGENTDLFGLYETEGVALVKAESEGLRRVFYLPDRPDNLATYKTTIIANQEDYPVLLSNGVLIEKKELPLGLHSVTWLDDVPKPSYLFALVAGNLQRSVTYYQTKSGRELPIEFYVPPSATSKCDFAKEVLKEAMAWDERTFNLECALRQHMVAGVDKYASGASEPTGLNLFNTENLFASPETKTDLGILRVLEVVAHEFFHYWSGDRVTIRDWFNLPLKEGLTTFRAAMFREELFGTDLIRLLDGKNLDERAPRQSAYTAVRSLYTAAAYEKSADIFRMMMLFIGKEPFIEAVAKFFKDNDGGAVTLEDFIESISNSSGKDLRSFLSWFTESGIPELIVTDELNPDTKQYFLKIKTVNGRNRPIPILMGLLDSSGAEIVADKLLIVDQEEIEFQFENIQTRPIPSLLRSFSAPVHMKYEYSYQDLLLLMQFDTNLYNRCEAAKQLISALINDFCIGKKIELSPQFFAVYKALLSDNSLNEWMLAELITLPSLEELIENQDKPDFEKLNEGRQLIQNALANELKTDFYNLLFRIQISGDDDKQKLKGFDLKQAGLRRLKSVCFSYLLNVDFEKTKEKLILQFEDALGKNMTETALALSMLCEINCEEADVALEDYYHYWKNDPGAVNNWFSIQALAHSPDVIERVKKLMRHGDFDLSNPNKVYALLGSFIKNPFGFHSVTGEGYQLVADAIFDLDKINPTLAANLTEKFTYWDKYDVNRQAMMISTLKIIYSNATSSDVRTMAKKGLDKVKEDLPLPIHLTFHGGSTMQDRTAQLIADGNKENAYQLH
大腸桿菌甲硫胺酸胺肽酶 (Met特異性)	46	MGTAISIKTPEDIEKMRVAGRLAAEVLEMIEPYVKPGVSTGELDRICNDYIVNEQHAVSACLGYHGYPKSVCISINEVVCHGIPDDAKLLKDGDIVNIDVTVIKDGFHGDTSKMFIVGKPTIMGERLCRITQESLYLALRMVKPGINLREIGAAIQKFVEAEGFSVVREYCGHGIGRGFHEEPQVLHYDSRETNVVLKPGMTFTIEPMVNAGKKEIRTMKDGWTVKTKDRSLSAQYEHTIVVTDNGCEILTLRKDDTIPAIISHD
恥垢分枝桿菌(M . smegmatis )脯胺酸亞胺基肽酶 (Pro特異性)	47	MGTLEANTNGPGSMLSRMPVSSRTVPFGDHETWVQVTTPENAQPHALPLIVLHGGPGMAHNYVANIAALADETGRTVIHYDQVGCGNSTHLPDAPADFWTPQLFVDEFHAVCTALGIERYHVLGQSWGGMLGAEIAVRQPSGLVSLAICNSPASMRLWSEAAGDLRAQLPAETRAALDRHEAAGTITHPDYLQAAAEFYRRHVCRVVPTPQDFADSVAQMEAEPTVYHTMNGPNEFHVVGTLGDWSVIDRLPDVTAPVLVIAGEHDEATPKTWQPFVDHIPDVRSHVFPGTSHCTHLEKPEEFRAVVAQFLHQHDLAADARV
鼠疫耶氏桿菌脯胺酸亞胺基肽酶 (Pro特異性)	48	MTQQEYQNRRQALLAKMAPGSAAIIFAAPEATRSADSEYPYRQNSDFSYLTGFNEPEAVLILVKSDETHNHSVLFNRIRDLTAEIWFGRRLGQEAAPTKLAVDRALPFDEINEQLYLLLNRLDVIYHAQGQYAYADNIVFAALEKLRHGFRKNLRAPATLTDWRPWLHEMRLFKSAEEIAVLRRAGEISALAHTRAMEKCRPGMFEYQLEGEILHEFTRHGARYPAYNTIVGGGENGCILHYTENECELRDGDLVLIDAGCEYRGYAGDITRTFPVNGKFTPAQRAVYDIVLAAINKSLTLFRPGTSIREVTEEVVRIMVVGLVELGILKGDIEQLIAEQAHRPFFMHGLSHWLGMDVHDVGDYGSSDRGRILEPGMVLTVEPGLYIAPDADVPPQYRGIGIRIEDDIVITATGNENLTASVVKDPDDIEALMALNHAGENLYFQE
激烈火球菌(P . furiosus )甲硫胺酸胺肽酶	49	MDTEKLMKAGEIAKKVREKAIKLARPGMLLLELAESIEKMIMELGGKPAFPVNLSINEIAAHYTPYKGDTTVLKEGDYLKIDVGVHIDGFIADTAVTVRVGMEEDELMEAAKEALNAAISVARAGVEIKELGKAIENEIRKRGFKPIVNLSGHKIERYKLHAGISIPNIYRPHDNYVLKEGDVFAIEPFATIGAGQVIEVPPTLIYMYVRDVPVRVAQARFLLAKIKREYGTLPFAYRWLQNDMPEGQLKLALKTLEKAGAIYGYPVLKEIRNGIVAQFEHTIIVEKDSVIVTQDMINKSTLE
溫和氣單胞菌(Aeromonas sobria )脯胺酸胺肽酶	50	HMSSPLHYVLDGIHCEPHFFTVPLDHQQPDDEETITLFGRTLCRKDRLDDELPWLLYLQGGPGFGAPRPSANGGWIKRALQEFRVLLLDQRGTGHSTPIHAELLAHLNPRQQADYLSHFRADSIVRDAELIREQLSPDHPWSLLGQSFGGFCSLTYLSLFPDSLHEVYLTGGVAPIGRSADEVYRATYQRVADKNRAFFARFPHAQAIANRLATHLQRHDVRLPNGQRLTVEQLQQQGLDLGASGAFEELYYLLEDAFIGEKLNPAFLYQVQAMQPFNTNPVFAILHELIYCEGAASHWAAERVRGEFPALAWAQGKDFAFTGEMIFPWMFEQFRELIPLKEAAHLLAEKADWGPLYDPVQLARNKVPVACAVYAEDMYVEFDYSRETLKGLSNSRAWITNEYEHNGLRVDGEQILDRLIRLNRDCLE
激烈火球菌脯胺酸胺肽酶(X-/-Pro)	51	MKERLEKLVKFMDENSIDRVFIAKPVNVYYFSGTSPLGGGYIIVDGDEATLYVPELEYEMAKEESKLPVVKFKKFDEIYEILKNTETLGIEGTLSYSMVENFKEKSNVKEFKKIDDVIKDLRIIKTKEEIEIIEKACEIADKAVMAAIEEITEGKREREVAAKVEYLMKMNGAEKPAFDTIIASGHRSALPHGVASDKRIERGDLVVIDLGALYNHYNSDITRTIVVGSPNEKQREIYEIVLEAQKRAVEAAKPGMTAKELDSIAREIIKEYGYGDYFIHSLGHGVGLEIHEWPRISQYDETVLKEGMVITIEPGIYIPKLGGVRIEDTVLITENGAKRLTKTERELL
腦膜敗血伊莉莎白菌(Elizabethkingia meningoseptica )脯胺酸胺肽酶	52	MIPITTPVGNFKVWTKRFGTNPKIKVLLLHGGPAMTHEYMECFETFFQREGFEFYEYDQLGSYYSDQPTDEKLWNIDRFVDEVEQVRKAIHADKENFYVLGNSWGGILAMEYALKYQQNLKGLIVANMMASAPEYVKYAEVLSKQMKPEVLAEVRAIEAKKDYANPRYTELLFPNYYAQHICRLKEWPDALNRSLKHVNSTVYTLMQGPSELGMSSDARLAKWDIKNRLHEIATPTLMIGARYDTMDPKAMEEQSKLVQKGRYLYCPNGSHLAMWDDQKVFMDGVIKFIKDVDTKSFN
淋病奈瑟氏菌(N . gonorrhoeae )脯胺酸亞胺基肽酶	53	MYEIKQPFHSGYLQVSEIHQIYWEESGNPDGVPVIFLHGGPGAGASPECRGFFNPDVFRIVIIDQRGCGRSHPYACAEDNTTWDLVADIEKVREMLGIGKWLVFGGSWGSTLSLAYAQTHPERVKGLVLRGIFLCRPSETAWLNEAGGVSRIYPEQWQKFVAPIAENRRNRLIEAYHGLLFHQDEEVCLSAAKAWADWESYLIRFEPEGVDEDAYASLAIARLENHYFVNGGWLQGDKAILNNIGKIRHIPTVIVQGRYDLCTPMQSAWELSKAFPEAELRVVQAGHCAFDPPLADALVQAVEDILPRLL

表4.非特異性胺肽酶之非限制性實例。

名稱	SEQ ID NO:	序列
大腸桿菌胺肽酶N* (鋅金屬蛋白酶)	54	MTQQPQAKYRHDYRAPDYQITDIDLTFDLDAQKTVVTAVSQAVRHGASDAPLRLNGEDLKLVSVHINDEPWTAWKEEEGALVISNLPERFTLKIINEISPAANTALEGLYQSGDALCTQCEAEGFRHITYYLDRPDVLARFTTKIIADKIKYPFLLSNGNRVAQGELENGRHWVQWQDPFPKPCYLFALVAGDFDVLRDTFTTRSGREVALELYVDRGNLDRAPWAMTSLKNSMKWDEERFGLEYDLDIYMIVAVDFFNMGAMENKGLNIFNSKYVLARTDTATDKDYLDIERVIGHEYFHNWTGNRVTCRDWFQLSLKEGLTVFRDQEFSSDLGSRAVNRINNVRTMRGLQFAEDASPMAHPIRPDMVIEMNNFYTLTVYEKGAEVIRMIHTLLGEENFQKGMQLYFERHDGSAATCDDFVQAMEDASNVDLSHFRRWYSQSGTPIVTVKDDYNPETEQYTLTISQRTPATPDQAEKQPLHIPFAIELYDNEGKVIPLQKGGHPVNSVLNVTQAEQTFVFDNVYFQPVPALLCEFSAPVKLEYKWSDQQLTFLMRHARNDFSRWDAAQSLLATYIKLNVARHQQGQPLSLPVHVADAFRAVLLDEKIDPALAAEILTLPSVNEMAELFDIIDPIAIAEVREALTRTLATELADELLAIYNANYQSEYRVEHEDIAKRTLRNACLRFLAFGETHLADVLVSKQFHEANNMTDALAALSAAVAAQLPCRDALMQEYDDKWHQNGLVMDKWFILQATSPAANVLETVRGLLQHRSFTMSNPNRIRSLIGAFAGSNPAAFHAEDGSGYLFLVEMLTDLNSRNPQVASRLIEPLIRLKRYDAKRQEKMRAALEQLKGLENLSGDLYEKITKALA
惡性瘧原蟲M1胺肽酶**	55	PKIHYRKDYKPSGFIINQVTLNINIHDQETIVRSVLDMDISKHNVGEDLVFDGVGLKINEISINNKKLVEGEEYTYDNEFLTIFSKFVPKSKFAFSSEVIIHPETNYALTGLYKSKNIIVSQCEATGFRRITFFIDRPDMMAKYDVTVTADKEKYPVLLSNGDKVNEFEIPGGRHGARFNDPPLKPCYLFAVVAGDLKHLSATYITKYTKKKVELYVFSEEKYVSKLQWALECLKKSMAFDEDYFGLEYDLSRLNLVAVSDFNVGAMENKGLNIFNANSLLASKKNSIDFSYARILTVVGHEYFHQYTGNRVTLRDWFQLTLKEGLTVHRENLFSEEMTKTVTTRLSHVDLLRSVQFLEDSSPLSHPIRPESYVSMENFYTTTVYDKGSEVMRMYLTILGEEYYKKGFDIYIKKNDGNTATCEDFNYAMEQAYKMKKADNSANLNQYLLWFSQSGTPHVSFKYNYDAEKKQYSIHVNQYTKPDENQKEKKPLFIPISVGLINPENGKEMISQTTLELTKESDTFVFNNIAVKPIPSLFRGFSAPVYIEDQLTDEERILLLKYDSDAFVRYNSCTNIYMKQILMNYNEFLKAKNEKLESFQLTPVNAQFIDAIKYLLEDPHADAGFKSYIVSLPQDRYIINFVSNLDTDVLADTKEYIYKQIGDKLNDVYYKMFKSLEAKADDLTYFNDESHVDFDQMNMRTLRNTLLSLLSKAQYPNILNEIIEHSKSPYPSNWLTSLSVSAYFDKYFELYDKTYKLSKDDELLLQEWLKTVSRSDRKDIYEILKKLENEVLKDSKNPNDIRAVYLPFTNNLRRFHDISGKGYKLIAEVITKTDKFNPMVATQLCEPFKLWNKLDTKRQELMLNEMNTMLQEPQISNNLKEYLLRLTNK
嘌呤黴素敏感型胺肽酶(「NPEPPS」)	56	MWLAAAAPSLARRLLFLGPPPPPLLLLVFSRSSRRRLHSLGLAAMPEKRPFERLPADVSPINYSLCLKPDLLDFTFEGKLEAAAQVRQATNQIVMNCADIDIITASYAPEGDEEIHATGFNYQNEDEKVTLSFPSTLQTGTGTLKIDFVGELNDKMKGFYRSKYTTPSGEVRYAAVTQFEATDARRAFPCWDEPAIKATFDISLVVPKDRVALSNMNVIDRKPYPDDENLVEVKFARTPVMSTYLVAFVVGEYDFVETRSKDGVCVRVYTPVGKAEQGKFALEVAAKTLPFYKDYFNVPYPLPKIDLIAIADFAAGAMENWGLVTYRETALLIDPKNSCSSSRQWVALVVGHELAHQWFGNLVTMEWWTHLWLNEGFASWIEYLCVDHCFPEYDIWTQFVSADYTRAQELDALDNSHPIEVSVGHPSEVDEIFDAISYSKGASVIRMLHDYIGDKDFKKGMNMYLTKFQQKNAATEDLWESLENASGKPIAAVMNTWTKQMGFPLIYVEAEQVEDDRLLRLSQKKFCAGGSYVGEDCPQWMVPITISTSEDPNQAKLKILMDKPEMNVVLKNVKPDQWVKLNLGTVGFYRTQYSSAMLESLLPGIRDLSLPPVDRLGLQNDLFSLARAGIISTVEVLKVMEAFVNEPNYTVWSDLSCNLGILSTLLSHTDFYEEIQEFVKDVFSPIGERLGWDPKPGEGHLDALLRGLVLGKLGKAGHKATLEEARRRFKDHVEGKQILSADLRSPVYLTVLKHGDGTTLDIMLKLHKQADMQEEKNRIERVLGATLLPDLIQKVLTFALSEEVRPQDTVSVIGGVAGGSKHGRKAAWKFIKDNWEELYNRYQGGFLISRLIKLSVEGFAVDKMAGEVKAFFESHPAPSAERTIQQCCENILLNAAWLKRDAESIHQYLLQRKASPPTV
NPEPPS E366V	57	MWLAAAAPSLARRLLFLGPPPPPLLLLVFSRSSRRRLHSLGLAAMPEKRPFERLPADVSPINYSLCLKPDLLDFTFEGKLEAAAQVRQATNQIVMNCADIDIITASYAPEGDEEIHATGFNYQNEDEKVTLSFPSTLQTGTGTLKIDFVGELNDKMKGFYRSKYTTPSGEVRYAAVTQFEATDARRAFPCWDEPAIKATFDISLVVPKDRVALSNMNVIDRKPYPDDENLVEVKFARTPVMSTYLVAFVVGEYDFVETRSKDGVCVRVYTPVGKAEQGKFALEVAAKTLPFYKDYFNVPYPLPKIDLIAIADFAAGAMENWGLVTYRETALLIDPKNSCSSSRQWVALVVGHVLAHQWFGNLVTMEWWTHLWLNEGFASWIEYLCVDHCFPEYDIWTQFVSADYTRAQELDALDNSHPIEVSVGHPSEVDEIFDAISYSKGASVIRMLHDYIGDKDFKKGMNMYLTKFQQKNAATEDLWESLENASGKPIAAVMNTWTKQMGFPLIYVEAEQVEDDRLLRLSQKKFCAGGSYVGEDCPQWMVPITISTSEDPNQAKLKILMDKPEMNVVLKNVKPDQWVKLNLGTVGFYRTQYSSAMLESLLPGIRDLSLPPVDRLGLQNDLFSLARAGIISTVEVLKVMEAFVNEPNYTVWSDLSCNLGILSTLLSHTDFYEEIQEFVKDVFSPIGERLGWDPKPGEGHLDALLRGLVLGKLGKAGHKATLEEARRRFKDHVEGKQILSADLRSPVYLTVLKHGDGTTLDIMLKLHKQADMQEEKNRIERVLGATLLPDLIQKVLTFALSEEVRPQDTVSVIGGVAGGSKHGRKAAWKFIKDNWEELYNRYQGGFLISRLIKLSVEGFAVDKMAGEVKAFFESHPAPSAERTIQQCCENILLNAAWLKRDAESIHQYLLQRKASPPTV
土倫病法蘭西斯氏菌(Francisella tularensis )胺肽酶N	58	MIYEFVMTDPKIKYLKDYKPSNYLIDETHLIFELDESKTRVTANLYIVANRENRENNTLVLDGVELKLLSIKLNNKHLSPAEFAVNENQLIINNVPEKFVLQTVVEINPSANTSLEGLYKSGDVFSTQCEATGFRKITYYLDRPDVMAAFTVKIIADKKKYPIILSNGDKIDSGDISDNQHFAVWKDPFKKPCYLFALVAGDLASIKDTYITKSQRKVSLEIYAFKQDIDKCHYAMQAVKDSMKWDEDRFGLEYDLDTFMIVAVPDFNAGAMENKGLNIFNTKYIMASNKTATDKDFELVQSVVGHEYFHNWTGDRVTCRDWFQLSLKEGLTVFRDQEFTSDLNSRDVKRIDDVRIIRSAQFAEDASPMSHPIRPESYIEMNNFYTVTVYNKGAEIIRMIHTLLGEEGFQKGMKLYFERHDGQAVTCDDFVNAMADANNRDFSLFKRWYAQSGTPNIKVSENYDASSQTYSLTLEQTTLPTADQKEKQALHIPVKMGLINPEGKNIAEQVIELKEQKQTYTFENIAAKPVASLFRDFSAPVKVEHKRSEKDLLHIVKYDNNAFNRWDSLQQIATNIILNNADLNDEFLNAFKSILHDKDLDKALISNALLIPIESTIAEAMRVIMVDDIVLSRKNVVNQLADKLKDDWLAVYQQCNDNKPYSLSAEQIAKRKLKGVCLSYLMNASDQKVGTDLAQQLFDNADNMTDQQTAFTELLKSNDKQVRDNAINEFYNRWRHEDLVVNKWLLSQAQISHESALDIVKGLVNHPAYNPKNPNKVYSLIGGFGANFLQYHCKDGLGYAFMADTVLALDKFNHQVAARMARNLMSWKRYDSDRQAMMKNALEKIKASNPSKNVFEIVSKSLES
掘越氏火球菌TET胺肽酶	59	MEVRNMVDYELLKKVVEAPGVSGYEFLGIRDVVIEEIKDYVDEVKVDKLGNVIAHKKGEGPKVMIAAHMDQIGLMVTHIEKNGFLRVAPIGGVDPKTLIAQRFKVWIDKGKFIYGVGASVPPHIQKPEDRKKAPDWDQIFIDIGAESKEEAEDMGVKIGTVITWDGRLERLGKHRFVSIAFDDRIAVYTILEVAKQLKDAKADVYFVATVQEEVGLRGARTSAFGIEPDYGFAIDVTIAADIPGTPEHKQVTHLGKGTAIKIMDRSVICHPTIVRWLEELAKKHEIPYQLEILLGGGTDAGAIHLTKAGVPTGALSVPARYIHSNTEVVDERDVDATVELMTKALENIHELKI
水生棲熱菌(T . aquaticus )胺肽酶T	60	MDAFTENLNKLAELAIRVGLNLEEGQEIVATAPIEAVDFVRLLAEKAYENGASLFTVLYGDNLIARKRLALVPEAHLDRAPAWLYEGMAKAFHEGAARLAVSGNDPKALEGLPPERVGRAQQAQSRAYRPTLSAITEFVTNWTIVPFAHPGWAKAVFPGLPEEEAVQRLWQAIFQATRVDQEDPVAAWEAHNRVLHAKVAFLNEKRFHALHFQGPGTDLTVGLAEGHLWQGGATPTKKGRLCNPNLPTEEVFTAPHRERVEGVVRASRPLALSGQLVEGLWARFEGGVAVEVGAEKGEEVLKKLLDTDEGARRLGEVALVPADNPIAKTGLVFFDTLFDENAASHIAFGQAYAENLEGRPSGEEFRRRGGNESMVHVDWMIGSEEVDVDGLLEDGTRVPLMRRGRWVI
脂肪嗜熱芽孢桿菌(Bacillus stearothermophilus )肽酶M28	61	MAKLDETLTMLKALTDAKGVPGNEREARDVMKTYIAPYADEVTTDGLGSLIAKKEGKSGGPKVMIAGHLDEVGFMVTQIDDKGFIRFQTLGGWWSQVMLAQRVTIVTKKGDITGVIGSKPPHILPSEARKKPVEIKDMFIDIGATSREEAMEWGVRPGDMIVPYFEFTVLNNEKMLLAKAWDNRIGCAVAIDVLKQLKGVDHPNTVYGVGTVQEEVGLRGARTAAQFIQPDIAFAVDVGIAGDTPGVSEKEAMGKLGAGPHIVLYDATMVSHRGLREFVIEVAEELNIPHHFDAMPGVGTDAGAIHLTGIGVPSLTIAIPTRYIHSHAAILHRDDYENTVKLLVEVIKRLDADKVKQLTFDE
霍亂弧菌(Vibrio cholera )胺肽酶	62	MEDKVWISMGADAVGSLNPALSESLLPHSFASGSQVWIGEVAIDELAELSHTMHEQHNRCGGYMVHTSAQGAMAALMMPESIANFTIPAPSQQDLVNAWLPQVSADQITNTIRALSSFNNRFYTTTSGAQASDWLANEWRSLISSLPGSRIEQIKHSGYNQKSVVLTIQGSEKPDEWVIVGGHLDSTLGSHTNEQSIAPGADDDASGIASLSEIIRVLRDNNFRPKRSVALMAYAAEEVGLRGSQDLANQYKAQGKKVVSVLQLDMTNYRGSAEDIVFITDYTDSNLTQFLTTLIDEYLPELTYGYDRCGYACSDHASWHKAGFSAAMPFESKFKDYNPKIHTSQDTLANSDPTGNHAVKFTKLGLAYVIEMANAGSSQVPDDSVLQDGTAKINLSGARGTQKRFTFELSQSKPLTIQTYGGSGDVDLYVKYGSAPSKSNWDCRPYQNGNRETCSFNNAQPGIYHVMLDGYTNYNDVALKASTQ
耐鹽發光桿菌(Photobacterium halotolerans )胺肽酶	63	MEDKVWISIGSDASQTVKSVMQSNARSLLPESLASNGPVWVGQVDYSQLAELSHHMHEDHQRCGGYMVHSSPESAIAASNMPQSLVAFSIPEISQQDTVNAWLPQVNSQAITGTITSLTSFINRFYTTTSGAQASDWLANEWRSLSASLPNASVRQVSHFGYNQKSVVLTITGSEKPDEWIVLGGHLDSTIGSHTNEQSVAPGADDDASGIASVTEIIRVLSENNFQPKRSIAFMAYAAEEVGLRGSQDLANQYKAEGKQVISALQLDMTNYKGSVEDIVFITDYTDSNLTTFLSQLVDEYLPSLTYGFDTCGYACSDHASWHKAGFSAAMPFEAKFNDYNPMIHTPNDTLQNSDPTASHAVKFTKLGLAYAIEMASTTGGTPPPTGNVLKDGVPVNGLSGATGSQVHYSFELPAQKNLQISTAGGSGDVDLYVSFGSEATKQNWDCRPYRNGNNEVCTFAGATPGTYSIMLDGYRQFSGVTLKASTQ
鼠疫耶氏桿菌胺肽酶N	64	MTQQPQAKYRHDYRAPDYTITDIDLDFALDAQKTTVTAVSKVKRQGTDVTPLILNGEDLTLISVSVDGQAWPHYRQQDNTLVIEQLPADFTLTIVNDIHPATNSALEGLYLSGEALCTQCEAEGFRHITYYLDRPDVLARFTTRIVADKSRYPYLLSNGNRVGQGELDDGRHWVKWEDPFPKPSYLFALVAGDFDVLQDKFITRSGREVALEIFVDRGNLDRADWAMTSLKNSMKWDETRFGLEYDLDIYMIVAVDFFNMGAMENKGLNVFNSKYVLAKAETATDKDYLNIEAVIGHEYFHNWTGNRVTCRDWFQLSLKEGLTVFRDQEFSSDLGSRSVNRIENVRVMRAAQFAEDASPMAHAIRPDKVIEMNNFYTLTVYEKGSEVIRMMHTLLGEQQFQAGMRLYFERHDGSAATCDDFVQAMEDVSNVDLSLFRRWYSQSGTPLLTVHDDYDVEKQQYHLFVSQKTLPTADQPEKLPLHIPLDIELYDSKGNVIPLQHNGLPVHHVLNVTEAEQTFTFDNVAQKPIPSLLREFSAPVKLDYPYSDQQLTFLMQHARNEFSRWDAAQSLLATYIKLNVAKYQQQQPLSLPAHVADAFRAILLDEHLDPALAAQILTLPSENEMAELFTTIDPQAISTVHEAITRCLAQELSDELLAVYVANMTPVYRIEHGDIAKRALRNTCLNYLAFGDEEFANKLVSLQYHQADNMTDSLAALAAAVAAQLPCRDELLAAFDVRWNHDGLVMDKWFALQATSPAANVLVQVRTLLKHPAFSLSNPNRTRSLIGSFASGNPAAFHAADGSGYQFLVEILSDLNTRNPQVAARLIEPLIRLKRYDAGRQALMRKALEQLKTLDNLSGDLYEKITKALAA
鰻弧菌(Vibrio anguillarum )胺肽酶	65	MEEKVWISIGGDATQTALRSGAQSLLPENLINQTSVWVGQVPVSELATLSHEMHENHQRCGGYMVHPSAQSAMSVSAMPLNLNAFSAPEITQQTTVNAWLPSVSAQQITSTITTLTQFKNRFYTTSTGAQASNWIADHWRSLSASLPASKVEQITHSGYNQKSVMLTITGSEKPDEWVVIGGHLDSTLGSRTNESSIAPGADDDASGIAGVTEIIRLLSEQNFRPKRSIAFMAYAAEEVGLRGSQDLANRFKAEGKKVMSVMQLDMTNYQGSREDIVFITDYTDSNFTQYLTQLLDEYLPSLTYGFDTCGYACSDHASWHAVGYPAAMPFESKFNDYNPNIHSPQDTLQNSDPTGFHAVKFTKLGLAYVVEMGNASTPPTPSNQLKNGVPVNGLSASRNSKTWYQFELQEAGNLSIVLSGGSGDADLYVKYQTDADLQQYDCRPYRSGNNETCQFSNAQPGRYSILLHGYNNYSNASLVANAQ
鹽弧菌(Salinivibrio ) spYCSC6胺肽酶	66	MEDKKVWISIGADAQQTALSSGAQPLLAQSVAHNGQAWIGEVSESELAALSHEMHENHHRCGGYIVHSSAQSAMAASNMPLSRASFIAPAISQQALVTPWISQIDSALIVNTIDRLTDFPNRFYTTTSGAQASDWIKQRWQSLSAGLAGASVTQISHSGYNQASVMLTIEGSESPDEWVVVGGHLDSTIGSRTNEQSIAPGADDDASGIAAVTEVIRVLAQNNFQPKRSIAFVAYAAEEVGLRGSQDVANQFKQAGKDVRGVLQLDMTNYQGSAEDIVFITDYTDNQLTQYLTQLLDEYLPTLNYGFDTCGYACSDHASWHQVGYPAAMPFEAKFNDYNPNIHTPQDTLANSDSEGAHAAKFTKLGLAYTVELANADSSPNPGNELKLGEPINGLSGARGNEKYFNYRLDQSGELVIRTYGGSGDVDLYVKANGDVSTGNWDCRPYRSGNDEVCRFDNATPGNYAVMLRGYRTYDNVSLIVE
解蛋白弧菌胺肽酶I	67	MPPITQQATVTAWLPQVDASQITGTISSLESFTNRFYTTTSGAQASDWIASEWQALSASLPNASVKQVSHSGYNQKSVVMTITGSEAPDEWIVIGGHLDSTIGSHTNEQSVAPGADDDASGIAAVTEVIRVLSENNFQPKRSIAFMAYAAEEVGLRGSQDLANQYKSEGKNVVSALQLDMTNYKGSAQDVVFITDYTDSNFTQYLTQLMDEYLPSLTYGFDTCGYACSDHASWHNAGYPAAMPFESKFNDYNPRIHTTQDTLANSDPTGSHAKKFTQLGLAYAIEMGSATGDTPTPGNQLE
解蛋白弧菌胺肽酶I (A55F)	68	MPPITQQATVTAWLPQVDASQITGTISSLESFTNRFYTTTSGAQASDWIASEWQFLSASLPNASVKQVSHSGYNQKSVVMTITGSEAPDEWIVIGGHLDSTIGSHTNEQSVAPGADDDASGIAAVTEVIRVLSENNFQPKRSIAFMAYAAEEVGLRGSQDLANQYKSEGKNVVSALQLDMTNYKGSAQDVVFITDYTDSNFTQYLTQLMDEYLPSLTYGFDTCGYACSDHASWHNAGYPAAMPFESKFNDYNPRIHTTQDTLANSDPTGSHAKKFTQLGLAYAIEMGSATGDTPTPGNQLE
激烈火球菌胺肽酶I	69	MVDWELMKKIIESPGVSGYEHLGIRDLVVDILKDVADEVKIDKLGNVIAHFKGSAPKVMVAAHMDKIGLMVNHIDKDGYLRVVPIGGVLPETLIAQKIRFFTEKGERYGVVGVLPPHLRREAKDQGGKIDWDSIIVDVGASSREEAEEMGFRIGTIGEFAPNFTRLSEHRFATPYLDDRICLYAMIEAARQLGEHEADIYIVASVQEEIGLRGARVASFAIDPEVGIAMDVTFAKQPNDKGKIVPELGKGPVMDVGPNINPKLRQFADEVAKKYEIPLQVEPSPRPTGTDANVMQINREGVATAVLSIPIRYMHSQVELADARDVDNTIKLAKALLEELKPMDFTPLE
切割效率(自最高至最低)：精胺酸＞離胺酸＞疏水性殘基(包括丙胺酸、白胺酸、甲硫胺酸及苯丙胺酸)＞脯胺酸(參見例如Matthews Biochemistry 47, 2008, 5303-5311)。 *切割效率(自最高至最低)：白胺酸＞丙胺酸＞精胺酸＞苯丙胺酸＞脯胺酸；在麩胺酸及天冬胺酸後不切割。

出於比較兩種或更多種胺基酸序列之目的，可藉由以下計算第一胺基酸序列與第二胺基酸序列之間的「序列一致性」百分比：[第一胺基酸序列中與第二胺基酸序列中對應位置處之胺基酸殘基一致的胺基酸殘基之數目]除以[第一胺基酸序列中之胺基酸殘基之總數目]且乘以[100]，其中與第一胺基酸序列相比，第二胺基酸序列中胺基酸殘基之各缺失、插入、取代或添加視為單一胺基酸殘基(位置)處之差異。可替代地，兩種胺基酸序列之間的序列一致性程度可使用已知電腦演算法(例如，藉由Smith及Waterman (1970) Adv. Appl. Math. 2:482c之局部同源性演算法，藉由Needleman及Wunsch, J. Mol. Biol. (1970) 48:443之同源性比對演算法，藉由Pearson及Lipman. Proc. Natl. Acad. Sci. USA (1998) 85:2444之搜索相似度方法，或藉由可以Blast、Clustal Omega獲得的演算法或其他序列比對演算法之電腦化實施)，且例如使用標準設置計算。通常，出於根據上文概述之計算方法測定兩種胺基酸序列之間的「序列一致性」百分比之目的，具有最大胺基酸殘基數目之胺基酸序列將視為「第一」胺基酸序列，且另一胺基酸序列將視為「第二」胺基酸序列。

另外或替代地，可評定兩種或更多種序列的序列之間的一致性。在兩種或更多種核酸或胺基酸序列之情形下，術語「一致」或百分比「一致性」係指相同的兩種或更多種序列或子序列。當比較且比對比較窗或指明的區域上如使用以上序列比較演算法中之一者或藉由手動比對及目視檢驗量測之最大一致性時，若兩種序列在指定區域上或完整序列上具有指定百分比的相同(例如，至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%或99.9%一致)胺基酸殘基或核苷酸，則兩種序列「實質上一致」。視情況，一致性存在於長度為至少約25、50、75或100個胺基酸之區域上，或長度為100至150、150至200、100至200或200或更多個胺基酸之區域上。

另外或替代地，可評定兩種或更多種序列的序列之間的對準(alignment)。在兩種或更多種核酸或胺基酸序列之情形下，術語「對準」或百分比「對準」係指相同的兩種或更多種序列或子序列。當比較且比對比較窗或指明的區域上如使用以上序列比較演算法中之一者或藉由手動比對及目視檢驗量測之最大一致性時，若兩種序列在指定區域上或完整序列上具有指定百分比的相同(例如，至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%或99.9%一致)胺基酸殘基或核苷酸，則兩種序列「實質上對準」。視情況，對準存在於長度為至少約25、50、75或100個胺基酸之區域上，或長度為100至150、150至200、100至200或200或更多個胺基酸之區域上。

除蛋白質分子以外，核酸分子具有用作根據本申請案之親和試劑(例如，胺基酸識別分子)的多種有利特性。

核酸適體為已經工程改造以便以高親和力及選擇性結合所需目標之核酸分子。因此，核酸適體可使用此項技術中已知的選擇及/或富集技術進行工程改造，以選擇性結合所需類型之胺基酸。因此，在一些實施例中，親和試劑包含核酸適體(例如，DNA適體、RNA適體)。如圖1C中所展示，在一些實施例中，經標記親和試劑為選擇性結合一種類型之末端胺基酸的經標記適體104 。舉例而言，在一些實施例中，如本文所描述，經標記適體104 選擇性結合多肽之末端處之一種類型的胺基酸(例如，單一類型之胺基酸或一子集類型之胺基酸)。儘管未圖示，但應瞭解，根據本申請案之方法，經標記適體104 可經工程改造，以選擇性結合多肽之任何位置處(例如，多肽之末端位置處或末端及內部位置處)之一種類型的胺基酸。

在一些實施例中，經標記親和試劑包含具有結合誘導型發光的標記。舉例而言，在一些實施例中，經標記適體106 包含供體標記112 及受體標記114 ，且如圖1C之圖(I)及圖(II)中所示出起作用。如圖(I)中所描繪，呈游離分子形式之經標記適體106 採用一種構形，其中供體標記112 與受體標記114 間隔開限制標記之間的可偵測FRET的距離(例如，約10 nm或更大)。如圖(II)中所描繪，呈選擇性結合之分子的經標記適體106 採用一種構形，其中供體標記112 與受體標記114 在促進標記之間的可偵測FRET的距離(例如，約10 nm或更小)內。在其他實施例中，經標記適體106 包含淬滅部分，且類似於分子信標起作用，其中經標記適體106 之發光以游離分子形式在內部淬滅，且以選擇性結合之分子形式復原(參見例如Hamaguchi等人 (2001)Analytical Biochemistry 294, 126-131)。在不希望受理論束縛的情況下，認為用於結合誘導型發光之此等及其他類型的機制可有利地減少或消除背景發光，以提高本文所描述之方法的整體靈敏度及準確度。

除鑑別多肽之末端胺基酸的方法以外，本申請案提供使用經標記親和試劑對多肽進行定序之方法。在一些實施例中，定序之方法可涉及使多肽末端經歷末端胺基酸偵測及末端胺基酸切割之重複循環。舉例而言，在一些實施例中，本申請案提供確定多肽之胺基酸序列的方法，其包含使多肽與本文所描述之一或多種經標記親和試劑接觸，及使多肽經歷艾德曼降解。

習知艾德曼降解涉及修飾及切割多肽之末端胺基酸的重複循環，其中各連續切割之胺基酸經鑑別以確定多肽之胺基酸序列。作為習知艾德曼降解之說明性實例，使用異硫氰酸苯酯(PITC)修飾多肽之N末端胺基酸，以形成PITC衍生化N末端胺基酸。隨後使用酸性條件、鹼性條件及/或高溫切割PITC衍生化N末端胺基酸。亦已展示切割PITC衍生化N末端胺基酸之步驟可使用來自原蟲克氏錐蟲(Trypanosoma cruzi )之經修飾半胱胺酸蛋白酶以酶方式實現，其涉及在中性或接近於中性pH下之相對較溫和切割條件。適用酶之非限制性實例描述於2016年9月2日申請之標題為「用於迭代多肽分析及加工之分子及方法(MOLECULES AND METHODS FOR ITERATIVE POLYPEPTIDE ANALYSIS AND PROCESSING)」的美國專利申請案第15/255,433號中。

使用根據本申請案之經標記親和試劑藉由艾德曼降解定序之實例描繪於圖1D中。在一些實施例中，藉由艾德曼降解定序包含提供多肽122 ，其經連接子124 固定至固體載體之表面130 (例如，固定至樣品孔之底部或側壁表面)。在一些實施例中，如本文所描述，多肽122 在一個末端(例如，胺基末端胺基酸或羧基末端胺基酸)固定，使得另一末端對於進行末端胺基酸之偵測及切割而言游離。因此，在一些實施例中，本文所描述之艾德曼降解方法中所使用之試劑優先與多肽122 之非固定(例如，游離)末端處之末端胺基酸相互作用。以此方式，多肽122 在偵測及切割之重複循環內保持固定。為此目的，在一些實施例中，連接子124 可根據用於偵測及切割之所需條件組設計，例如以限制多肽122 在化學切割條件下自表面130 脫離。適用於將多肽固定至表面之連接子組合物及技術詳細描述於本文別處。

根據本申請案，在一些實施例中，藉由艾德曼降解定序之方法包含使多肽122 與選擇性結合一或多種類型之末端胺基酸之一或多種經標記親和試劑接觸的步驟(1)。如所展示，在一些實施例中，經標記親和試劑108 藉由選擇性結合末端胺基酸與多肽122 相互作用。在一些實施例中，步驟(1)進一步包含移除不選擇性結合多肽122 之末端胺基酸(例如，游離末端胺基酸)的一或多種經標記親和試劑中之任一者。

在一些實施例中，該方法進一步包含藉由偵測經標記親和試劑108 鑑別多肽122 之末端胺基酸。在一些實施例中，偵測包含偵測來自經標記親和試劑108 之發光。如本文所描述，在一些實施例中，發光與經標記親和試劑108 唯一關聯，且發光藉此與親和試劑108 所選擇性結合之胺基酸的類型相關聯。如此，在一些實施例中，胺基酸之類型藉由確定經標記親和試劑108 之一或多種發光特性鑑別。

在一些實施例中，藉由艾德曼降解定序之方法包含移除多肽122 之末端胺基酸的步驟(2)。在一些實施例中，步驟(2)包含自多肽122 移除經標記親和試劑108 (例如，選擇性結合末端胺基酸之一或多種經標記親和試劑中之任一者)。在一些實施例中，步驟(2)包含藉由使末端胺基酸與異硫氰酸酯(例如，PITC)接觸以形成經異硫氰酸酯修飾之末端胺基酸，修飾多肽122 之末端胺基酸(例如，游離末端胺基酸)。在一些實施例中，與未經修飾之末端胺基酸相比，經異硫氰酸酯修飾之末端胺基酸對由切割試劑(例如，化學或酶切割試劑)進行之移除較敏感。

在一些實施例中，步驟(2)包含藉由使多肽122 與特異性結合且切割經異硫氰酸酯修飾之末端胺基酸的蛋白酶140 接觸，移除末端胺基酸。在一些實施例中，蛋白酶140 包含經修飾半胱胺酸蛋白酶。在一些實施例中，蛋白酶140 包含經修飾半胱胺酸蛋白酶，諸如來自克氏錐蟲之半胱胺酸蛋白酶(參見例如Borgo等人 (2015)Protein Science 24:571-579)。在其他實施例中，步驟(2)包含藉由使多肽122 經歷足以切割經異硫氰酸酯修飾之末端胺基酸的化學(例如，酸性、鹼性)條件，移除末端胺基酸。

在一些實施例中，藉由艾德曼降解定序之方法包含在末端胺基酸切割之後洗滌多肽122 的步驟(3)。在一些實施例中，洗滌包含移除蛋白酶140 。在一些實施例中，洗滌包含使多肽122 復原至中性pH條件(例如，在由酸性或鹼性條件進行化學切割之後)。在一些實施例中，藉由艾德曼降解定序之方法包含重複步驟(1)至步驟(3)，持續複數個循環。

藉由艾德曼降解定序之示例性方法展示於圖1E中。在一些實施例中，含有多肽之複雜混合物(例如，蛋白質之混合物)的樣品可使用常用酶降解成大致6至40個胺基酸之短多肽片段。在一些實施例中，根據本申請案之方法對此多肽庫進行定序將展現初始複雜混合物中存在之多肽中之各者的身分及豐度。如本文及文獻中所描述，6至40個胺基酸之大小範圍內的大部分多肽可藉由確定多肽鏈內恰好四個胺基酸之數目及位置唯一地鑑別。

因此，在一些實施例中，藉由艾德曼降解定序之方法可使用包含四種DNA適體類型之一組經標記適體150 進行，各類型識別不同N末端胺基酸。各適體類型可經不同發光標記標記，使得可基於一或多種發光特性區別不同適體類型。出於說明之目的，示例性經標記適體150 組包括：經第一發光標記(「染料1」)標記之半胱胺酸特異性適體；經第二發光標記(「染料2」)標記之離胺酸特異性適體；經第三發光標記(「染料3」)標記之色胺酸特異性適體；及經第四發光標記(「染料4」)標記之麩胺酸特異性適體。

在一些實施例中，根據本申請案之藉由艾德曼降解定序之方法根據圖1E中所展示之過程152 進行。在一些實施例中，在步驟(1)之前，將來自多肽庫之單一多肽分子固定至固體載體之表面，例如在樣品孔陣列之樣品孔的底部或側壁表面處。在一些實施例中，如本文別處所描述，能夠實現表面固定之部分(例如，生物素)或提高溶解度之部分(例如，寡核苷酸)可以化學方式或酶方式連接至多肽之C末端。為了確定各多肽之序列，在一些實施例中，使固定多肽經歷N末端胺基酸偵測及N末端胺基酸切割之重複循環，如過程152 所示出。在一些實施例中，過程152 包含試劑添加及洗滌步驟，其藉由使用自動化流體系統注射至偵測表面上方之流槽進行。在一些實施例中，步驟(1)至(4)示出使用經標記適體150 進行偵測及切割之一個循環。

在一些實施例中，根據過程152 藉由艾德曼降解定序之方法包含流入四種正交標記之DNA適體之混合物，且培育以允許適體結合至在N末端處含有四種適當胺基酸中之一者之任何固定多肽(例如，在陣列之樣品孔內固定的多肽)的步驟(1)。在一些實施例中，方法進一步包含洗滌固定多肽以移除未結合適體。在一些實施例中，方法進一步包含對固定多肽進行成像(「成像步驟1」)。在一些實施例中，所獲取之影像含有足以確定適體結合之多肽的位置(例如，樣品孔陣列內之位置)及四種適體中之哪一者在各位置處結合的資訊。在一些實施例中，方法進一步包含使用適當緩衝液洗滌固定多肽，以將適體自固定多肽移除。

在一些實施例中，根據過程152 定序之方法包含流入含有特異性修飾N末端胺基之反應性分子(例如，PITC，如所展示)之溶液的步驟(2)。諸如PITC之異硫氰酸酯分子，在一些實施例中，將N末端胺基酸修飾成用於由經修飾蛋白酶(諸如來自克氏錐蟲之半胱胺酸蛋白酶克氏錐蟲半胱胺酸蛋白酶(cruzain))進行切割之受質。

在一些實施例中，根據過程152 之定序方法包含洗滌固定多肽，隨後流入識別經修飾N末端胺基酸且將其自固定多肽切割之適合經修飾蛋白酶的步驟(3)。在一些實施例中，方法包含在酶切割之後洗滌固定多肽的步驟(4)。在一些實施例中，步驟(1)至步驟(4)描繪艾德曼降解之一個循環。因此，如所展示之步驟(1')為下一反應循環的開始，該循環以如上文針對步驟(1)至步驟(4)所描述進行的步驟(1')至步驟(4')繼續進行。在一些實施例中，步驟(1)至步驟(4)重複大致20至40個循環。

在一些實施例中，經標記異硫氰酸酯(例如，染料標記之PITC)可用於監測樣品負載。舉例而言，在一些實施例中，在使多肽樣品經歷如過程152 中所展示之定序方法之前，藉由使用染料標記之PITC修飾端接末端，使多肽樣品與發光標記在端接末端處預先綴合。以此方式，可藉由在起始過程152 之前偵測來自標記之發光，監測多肽樣品向樣品孔陣列中之負載。在一些實施例中，發光用於確定陣列中樣品孔之單一佔有率(例如，含有單一多肽分子之樣品孔的分率)，其可有利地增加針對給定樣品可靠地獲得之資訊的量。一旦所需樣品負載狀態由發光確定，則可如所描述藉由化學或酶切割起始過程152 ，隨後以步驟(1)進行。

在一些實施例中，經標記異硫氰酸酯(例如，染料標記之PITC)可用於監測陣列中多肽樣品之反應進展。舉例而言，在一些實施例中，步驟(2)包含流入含有染料標記之PITC的溶液，該染料標記之PITC特異性修飾且標記樣品中多肽之N末端胺基。在一些實施例中，可在步驟(2)期間或之後偵測來自標記之發光，以評估樣品中多肽之N末端PITC修飾。因此，在一些實施例中，發光用於判定是否或何時自步驟(2)繼續進行至步驟(3)。在一些實施例中，可在步驟(3)期間或之後偵測來自標記之發光，以評估樣品中多肽之N末端胺基酸切割，例如以判定是否或何時自步驟(3)繼續進行至步驟(4)。

根據過程152 之定序方法利用用於偵測及切割多肽之末端胺基酸的單獨試劑。儘管如此，在一些態樣中，本申請案提供定序之方法，其中包含肽酶之單一試劑可用於偵測及切割多肽之末端胺基酸。圖2展示使用一組經標記外肽酶200 進行多肽定序之實例，其中各經標記外肽酶選擇性結合且切割不同類型之末端胺基酸。

如圖2之實例中大體上示出，經標記外肽酶200 包括包含第一發光標記之離胺酸特異性外肽酶、包含第二發光標記之甘胺酸特異性外肽酶、包含第三發光標記之天冬胺酸特異性外肽酶及包含第四發光標記之白胺酸特異性外肽酶。根據本文所描述之某些實施例，僅當胺基酸處於多肽之胺基或羧基末端時，經標記外肽酶200 中之每一者選擇性結合且切割其各別胺基酸。因此，由於藉由此方法進行之定序自肽之一個末端向另一末端進行，因此經標記外肽酶200 經工程改造或選擇，以使得組中所有試劑將具有胺肽酶或羧肽酶活性。

如圖2中進一步所展示，過程202 示意性地示出使用經標記外肽酶200 進行之即時定序反應。圖(I)至圖(IX)示出涉及與以下展示之信號輸出相關，且對應於各圖中所描繪之事件的多肽之端接末端處迭代偵測及切割的事件進展。出於說明之目的，展示具有「KLDG…」之任意選擇胺基酸序列的多肽(自一個末端向另一末端進行)。

圖(I)描繪定序反應的開始，其中多肽固定至固體載體之表面，諸如樣品孔之底部或側壁表面。在一些實施例中，根據本申請案之定序方法包含即時單分子定序。在一些實施例中，複數個單分子定序反應在樣品孔陣列中同時進行。在此類實施例中，多肽固定藉由將多肽錨定在用於單分子分析之樣品孔內，防止多肽擴散離開樣品孔。

圖(II)描繪偵測事件，其中來自經標記親和試劑200 之組的離胺酸特異性外肽酶選擇性結合多肽之末端離胺酸殘基。如圖(I)及圖(II)下方之信號跡線中所展示，信號輸出藉由顯示信號強度增加報告此結合作用，信號強度增加可用於鑑別離胺酸特異性外肽酶之發光標記，藉此鑑別末端胺基酸。圖(III)示出在選擇性結合末端胺基酸之後，經標記肽酶切割末端胺基酸。因此，此等組分可自由擴散遠離用於發光偵測之觀測區，其在信號輸出中由信號強度下降報告，如圖(III)下方之跡線中所展示。圖(IV)至圖(IX)類似於如針對圖(I)至圖(III)所描述之過程進行。亦即，經標記外肽酶結合且切割對應末端胺基酸，以分別在信號輸出中產生對應增加及減少。

在一些態樣中，本申請案提供藉由評估末端胺基酸與經標記胺基酸識別分子(例如，經標記親和試劑)及經標記切割試劑(例如，經標記非特異性外肽酶)之結合相互作用，進行即時多肽定序之方法。圖3A展示定序方法之實例，其中離散結合事件引起信號輸出300 之信號脈衝。圖3A之插圖示出藉由此方法即時定序之通用方案。如所展示，經標記親和試劑310 與末端胺基酸(此處展示為離胺酸)締合(例如，結合)且自末端胺基酸解離，其引起信號輸出300 中之脈衝系列，脈衝系列可用於鑑別末端胺基酸。在一些實施例中，脈衝系列提供脈衝圖案(例如，特徵圖案)，其可診斷對應末端胺基酸之身分。

在不希望受理論束縛的情況下，經標記親和試劑310 根據結合親和力(K_D )選擇性結合，結合親和力由結合之締合速率或「締合(on)」速率(k_on )，及結合之解離速率或「解離(off)」速率(k_off )界定。速率常數k_off 及k_on 分別為脈衝持續時間(例如，對應於可偵測結合作用之時間)及脈衝間持續時間(例如，可偵測結合事件之間的時間)的關鍵決定因素。在一些實施例中，此等速率可經工程改造以達成提供最佳定序準確度之脈衝持續時間及脈衝速率(例如，信號脈衝之頻率)。

如插圖中所展示，定序反應混合物進一步包含經標記非特異性外肽酶320 ，其包含不同於經標記親和試劑310 之發光標記的發光標記。在一些實施例中，經標記非特異性外肽酶320 以低於經標記親和試劑310 之濃度的濃度存在於混合物中。在一些實施例中，經標記非特異性外肽酶320 顯示寬特異性，使得其切割大部分或所有類型之末端胺基酸。因此，動態定序方法可涉及在由外肽酶切割活性催化之降解反應的過程中，在多肽之末端處監測親和試劑結合。

如由信號輸出300 之進展所示出，在一些實施例中，由經標記非特異性外肽酶320 進行之末端胺基酸切割引起信號脈衝，且與經標記親和試劑310 之結合脈衝相比，此等事件以較低頻率出現。以此方式，可在即時定序過程中對多肽之胺基酸進行計數及/或鑑別。如信號輸出300 中進一步示出，在一些實施例中，可使用複數種經標記親和試劑，其各自具有診斷性脈衝圖案(例如，特徵圖案)，診斷性脈衝圖案可用於鑑別對應末端胺基酸。舉例而言，在一些實施例中，不同特徵圖案(如在信號輸出300 中由離胺酸、苯丙胺酸及麩醯胺酸中之每一者示出)對應於多於一種經標記親和試劑與不同類型之末端胺基酸的締合。如本文所描述，應瞭解，根據本申請案可使用與多於一種類型之胺基酸締合的單一親和試劑。因此，在一些實施例中，不同特徵圖案對應於一種經標記親和試劑與不同類型之末端胺基酸的締合。

如本文所描述，基於信號脈衝系列中之特徵圖案，信號脈衝資訊可用於鑑別胺基酸。在一些實施例中，特徵圖案包含複數個信號脈衝，各信號脈衝包含脈衝持續時間。在一些實施例中，複數個信號脈衝之特徵可為特徵圖案中脈衝持續時間之分佈的概括統計量(summary statistic) (例如，均值、中值、時間衰變常數)。在一些實施例中，特徵圖案之均值脈衝持續時間在約1毫秒與約10秒之間(例如，在約1 ms與約1 s之間、在約1 ms與約100 ms之間、在約1 ms與約10 ms之間、在約10 ms與約10 s之間、在約100 ms與約10 s之間、在約1 s與約10 s之間、在約10 ms與約100 ms之間或在約100 ms與約500 ms之間)。在一些實施例中，對應於單一多肽中不同類型之胺基酸的不同特徵圖案可基於概括統計量中之統計顯著差異區別於彼此。舉例而言，在一些實施例中，可基於至少10毫秒(例如，在約10 ms與約10 s之間、在約10 ms與約1 s之間、在約10 ms與約100 ms之間、在約100 ms與約10 s之間、在約1 s與約10 s之間或在約100 ms與約1 s之間)之均值脈衝持續時間差異，區別一種特徵圖案與另一特徵圖案。應瞭解，在一些實施例中，不同特徵圖案之間均值脈衝持續時間中之較小差異可需要各特徵圖案內較大數目之脈衝持續時間，以便以統計信賴度區別一種特徵圖案與另一特徵圖案。

如上文所詳述，如由圖3A所示出之即時定序過程一般可涉及末端胺基酸識別及末端胺基酸切割之循環，其中識別及切割之相對發生率可受經標記親和試劑310 與經標記非特異性外肽酶320 之間的濃度差(concentration differential)控制。在一些實施例中，濃度差可經最佳化，以使得在個別胺基酸識別期間所偵測到之信號脈衝的數目提供鑑別之所需信賴區間。舉例而言，若初始定序反應提供在切割事件之間信號脈衝過少，以致於不允許以所需信賴區間確定特徵圖案的信號資料，則可使用相對於親和試劑濃度降低之非特異性外肽酶重複定序反應。

在一些實施例中，根據本申請案之多肽定序可藉由使多肽與定序反應混合物接觸進行，該定序反應混合物包含一或多種胺基酸識別分子(例如，親和試劑)及/或一或多種切割試劑(例如，外肽酶)。在一些實施例中，定序反應混合物以在約10 nM與約10 μM之間的濃度包含胺基酸識別分子。在一些實施例中，定序反應混合物以在約500 nM與約500 μM之間的濃度包含切割試劑。

在一些實施例中，定序反應混合物以以下濃度包含胺基酸識別分子：在約100 nM與約10 μM之間、在約250 nM與約10 μM之間、在約100 nM與約1 μM之間、在約250 nM與約1 μM之間、在約250 nM與約750 nM之間或在約500 nM與約1 μM之間。在一些實施例中，定序反應混合物以約100 nM、約250 nM、約500 nM、約750 nM或約1 μM之濃度包含胺基酸識別分子。

在一些實施例中，定序反應混合物以以下濃度包含切割試劑：在約500 nM與約250 μM之間、在約500 nM與約100 μM之間、在約1 μM與約100 μM之間、在約500 nM與約50 μM之間、在約1 μM與約100 μM之間、在約10 μM與約200 μM之間或在約10 μM與約100 μM之間。在一些實施例中，定序反應混合物以約1 μM、約5 μM、約10 μM、約30 μM、約50 μM、約70 μM或約100 μM之濃度包含切割試劑。

在一些實施例中，定序反應混合物以在約10 nM與約10 μM之間的濃度包含胺基酸識別分子，且以在約500 nM與約500 μM之間的濃度包含切割試劑。在一些實施例中，定序反應混合物以在約100 nM與約1 μM之間的濃度包含胺基酸識別分子，且以在約1 μM與約100 μM之間的濃度包含切割試劑。在一些實施例中，定序反應混合物以在約250 nM與約1 μM之間的濃度包含胺基酸識別分子，且以在約10 μM與約100 μM之間的濃度包含切割試劑。在一些實施例中，定序反應混合物以約500 nM之濃度包含胺基酸識別分子，且以在約25 μM與約75 μM之間的濃度包含切割試劑。

在一些實施例中，定序反應混合物以約500:1、約400:1、約300:1、約200:1、約100:1、約75:1、約50:1、約25:1、約10:1、約5:1、約2:1或約1:1之比率包含胺基酸識別分子及切割試劑。在一些實施例中，定序反應混合物以在約10:1與約200:1之間的比率包含胺基酸識別分子及切割試劑。在一些實施例中，定序反應混合物以在約50:1與約150:1之間的比率包含胺基酸識別分子及切割試劑。

儘管由圖3A示出之實例係關於使用經標記切割試劑之定序過程，但定序過程並不意欲在此態樣中受限。如本文別處所描述，諸位發明人已展現使用未經標記切割試劑之單分子定序。在一些實施例中，切割試劑移除連續末端胺基酸之大致頻率例如基於所使用之酶的已知活性及/或濃度已知。在一些實施例中，由試劑進行之末端胺基酸切割例如基於針對胺基酸識別偵測到之信號或缺少偵測到之信號推斷。諸位發明人已認識到用於控制即時定序反應之另外技術，其可與如所描述之濃度差方法組合使用，或可替代濃度差方法使用。

溫度依賴性即時定序過程之實例展示於圖3B中。圖(I)至圖(III)示出定序反應，其涉及溫度依賴性末端胺基酸識別及末端胺基酸切割之循環。定序反應之各循環在兩個溫度範圍內進行：第一溫度範圍(「T₁ 」)，相比於外肽酶活性，其對於親和試劑活性而言最佳(例如，以促進末端胺基酸識別)；及第二溫度範圍(「T₂ 」)，相比於親和試劑活性，其對於外肽酶活性而言最佳(例如，以促進末端胺基酸切割)。定序反應藉由使反應混合物溫度在第一溫度範圍T₁ (以起始胺基酸識別)與第二溫度範圍T₂ (以起始胺基酸切割)之間交替而進展。因此，溫度依賴性定序過程之進展可受溫度控制，且可經由手動或自動化過程進行在不同溫度範圍之間(例如，在T₁ 與T₂ 之間)交替。在一些實施例中，相比於第二溫度範圍T₂ ，第一溫度範圍T₁ 內之親和試劑活性(例如，對胺基酸之結合親和力(K_D ))提高至少10倍、至少100倍、至少1,000倍、至少10,000倍、至少100,000倍或更高。在一些實施例中，相比於第一溫度範圍T₁ ，第二溫度範圍T₂ 內之外肽酶活性(例如，受質轉化為切割產物之速率)提高至少2倍、10倍、至少25倍、至少50倍、至少100倍、至少1,000倍或更高。

在一些實施例中，第一溫度範圍T₁ 低於第二溫度範圍T₂ 。在一些實施例中，第一溫度範圍T₁ 在約15℃與約40℃之間(例如，在約25℃與約35℃之間、在約15℃與約30℃之間、在約20℃與約30℃之間)。在一些實施例中，第二溫度範圍T₂ 在約40℃與約100℃之間(例如，在約50℃與約90℃之間、在約60℃與約90℃之間、在約70℃與約90℃之間)。在一些實施例中，第一溫度範圍T₁ 在約20℃與約40℃之間(例如，大致30℃)，且第二溫度範圍T₂ 在約60℃與約100℃之間(例如，大致80℃)。

在一些實施例中，第一溫度範圍T₁ 高於第二溫度範圍T₂ 。在一些實施例中，第一溫度範圍T₁ 在約40℃與約100℃之間(例如，在約50℃與約90℃之間、在約60℃與約90℃之間、在約70℃與約90℃之間)。在一些實施例中，第二溫度範圍T₂ 在約15℃與約40℃之間(例如，在約25℃與約35℃之間、在約15℃與約30℃之間、在約20℃與約30℃之間)。在一些實施例中，第一溫度範圍T₁ 在約60℃與約100℃之間(例如，大致80℃)，且第二溫度範圍T₂ 在約20℃與約40℃之間(例如，大致30℃)。

圖(I)描繪在第一溫度範圍T₁ 內之溫度下的定序反應混合物，相比於外肽酶活性，第一溫度範圍對於親和試劑活性而言最佳。出於說明之目的，展示具有胺基酸序列「KFVAG…」之多肽。當反應混合物溫度在第一溫度範圍T₁ 內時，混合物中之經標記親和試劑經活化(例如，複性)以藉由與多肽末端締合起始胺基酸識別。此外在第一溫度範圍T₁ 內，混合物中之經標記外肽酶經不活化(例如，變性)以阻止識別期間之胺基酸切割。在圖(I)中，展示第一親和試劑與多肽末端處之離胺酸可逆締合，同時展示經標記外肽酶(例如，Pfu胺肽酶I (Pfu API))經變性。在一些實施例中，胺基酸識別進行預定持續時間，隨後起始胺基酸之切割。在一些實施例中，胺基酸識別進行到達用於鑑別之所需信賴區間所需要的持續時間，隨後起始胺基酸之切割。胺基酸識別之後，反應藉由將混合物之溫度改變為在第二溫度範圍T₂ 內繼續進行。

圖(II)描繪在第二溫度範圍T₂ 內之溫度下的定序反應混合物，相比於親和試劑活性，第二溫度範圍對於外肽酶試劑活性而言最佳。出於此實例之說明目的，第二溫度範圍T₂ 高於第一溫度範圍T₁ ，不過應瞭解，可針對任何所需溫度範圍最佳化試劑活性。因此，自圖(I)至圖(II)進展藉由使用適合之熱源升高反應混合物溫度進行。當反應混合物到達第二溫度範圍T₂ 內之溫度時，混合物中之經標記外肽酶經活化(例如，複性)以藉由外肽酶活性起始末端胺基酸切割。此外在第二溫度範圍T₂ 內，混合物中之經標記親和試劑經不活化(例如，變性)以阻止切割期間之胺基酸識別。在圖(II)中，展示經標記外肽酶切割末端離胺酸殘基，而經標記親和試劑經變性。在一些實施例中，胺基酸切割進行預定持續時間，隨後起始在多肽末端處之連續胺基酸的識別。在一些實施例中，胺基酸切割進行偵測切割所需要之持續時間，隨後起始連續胺基酸之識別。在胺基酸切割之後，反應藉由將混合物之溫度改變為在第一溫度範圍T₁ 內繼續進行。

圖(III)描繪定序反應中下一循環之開始，其中反應混合物溫度已降低回至第一溫度範圍T₁ 內。因此，在此實例中，自圖(II)至圖(III)進展可藉由自熱源移除反應混合物，或以其他方式使反應混合物冷卻(例如，主動地或被動地)至第一溫度範圍T₁ 內進行。如所展示，經標記親和試劑經複性，包括與多肽末端處之苯丙胺酸可逆締合之第二親和試劑，而展示經標記外肽酶經變性。藉由以如由此實例所示出之溫度依賴性方式進一步在胺基酸識別與胺基酸切割之間循環，定序反應繼續。

因此，動態定序方法可涉及反應循環，其在反應混合物內之一或多種蛋白質之蛋白質活性或功能的層級上受控。應瞭解，圖3B中所描繪且上文所描述之溫度依賴性多肽定序過程可說明藉由條件依賴性識別及切割之受控循環進行多肽定序的一般方法。舉例而言，在一些實施例中，本申請案提供使用發光活化試劑之發光依賴性定序過程。在一些實施例中，發光依賴性定序過程涉及發光依賴性胺基酸識別及切割之循環。定序反應之各循環可藉由使定序反應混合物暴露於兩種不同發光條件進行：第一發光條件，相比於外肽酶活性，其對於親和試劑活性而言最佳(例如，以促進胺基酸識別)；及第二發光條件，相比於親和試劑活性，其對於外肽酶活性而言最佳(例如，以促進胺基酸切割)。定序反應藉由在使反應混合物暴露於第一發光條件(以起始胺基酸識別)與使反應混合物暴露於第二發光條件(以起始胺基酸切割)之間交替而進展。藉助於實例而非限制，在一些實施例中，兩種不同發光條件包含第一波長及第二波長。

在一些態樣中，本申請案提供藉由評估一或多種經標記親和試劑與末端及內部胺基酸之結合相互作用，及經標記非特異性外肽酶與末端胺基酸之結合相互作用，進行即時多肽定序之方法。圖4展示定序方法之實例，其中針對圖3A至圖3B中之方法描述且說明之方法藉由使用經標記親和試劑410 修改，經標記親和試劑選擇性結合至以下且自以下解離：末端及內部位置兩者處之一種類型的胺基酸(此處展示為離胺酸) (圖4，插圖)。如先前方法中所描述，選擇性結合引起信號輸出400 中之脈衝系列。然而，在此方法中，脈衝系列以一比率出現，該比率由整個多肽中該類型之胺基酸的數目決定。因此，在一些實施例中，對應於結合事件之脈衝速率將診斷多肽中當前存在之同源胺基酸的數目。

如在先前方法中，與經標記親和試劑410 相比，經標記非特異性肽酶420 將以相對較低濃度存在，例如以提供在切割事件之間的最佳時間窗(圖4，插圖)。另外，在某些實施例中，經標記非特異性肽酶420 之可唯一鑑別的發光標記將指示切割事件何時發生。隨著多肽經歷迭代切割，每當末端胺基酸由經標記非特異性肽酶420 切割，對應於由經標記親和試劑410 結合之脈衝速率將以逐步方式下降。此概念由曲線圖402 說明，該曲線圖大體上描繪隨時間變化之脈衝速率，即時切割事件由箭頭表示。因此，在一些實施例中，可基於脈衝圖案及/或在切割事件之間所偵測到之圖案內存在的脈衝速率，以此方法鑑別胺基酸，且藉此對多肽進行定序。

在一些實施例中，末端多肽序列資訊(例如，如本文所描述確定)可與獲自一或多種其他來源之多肽序列資訊組合。舉例而言，末端多肽序列資訊可與內部多肽序列資訊組合。在一些實施例中，如本文所描述，可使用與內部胺基酸締合之一或多種胺基酸識別分子獲得內部多肽序列資訊。內部或其他多肽序列資訊可在多肽降解過程之前或過程中獲得。在一些實施例中，獲自此等方法之序列資訊可與使用其他技術之多肽序列資訊，例如使用一或多種內部胺基酸識別分子獲得之序列資訊組合。 經屏蔽識別分子

根據本文所描述之實施例，可藉由用激發光照射表面固定多肽，及偵測由連接至胺基酸識別分子(例如，經標記親和試劑)之標記產生的發光，進行單分子多肽定序方法。在一些情況下，由標記產生之輻射及/或非輻射衰變可導致對多肽之光損傷。舉例而言，圖5A示出示例性定序反應，其中展示識別分子與固定至表面之多肽締合。

在激發照射存在下，標記可經由輻射衰變產生螢光，其引起可偵測締合事件。然而，在一些情況下，標記產生非輻射衰變，其可導致反應性氧物種500 之形成。反應性氧物種500 可最終損傷固定肽，使得反應在獲得多肽之完整序列資訊之前結束。此光損傷可例如在暴露多肽末端(頂部空心箭頭)、在內部位置(中間空心箭頭)或在將多肽連接至表面之表面連接子(底部空心箭頭)處出現。

諸位發明人已發現可藉由將屏蔽元件併入至胺基酸識別分子中，減輕光損傷且延長識別時間。圖5B示出使用經屏蔽識別分子之示例性定序反應，該經屏蔽識別分子包括屏蔽物502 。屏蔽物502 形成共價或非共價鍵聯基團，其在標記與多肽之間提供增加的距離，使得來自反應性氧物種500 之損傷效應可歸因於在標記-多肽間隔距離上之自由基衰變而減小。屏蔽物502 亦可提供空間障壁，其藉由吸收來自反應性氧物種500 及輻射及/或非輻射衰變之損傷屏蔽多肽免受標記影響。

在不希望受理論束縛的情況下，認為定位於識別組分與標記組分之間的屏蔽物可吸收、偏轉或以其他方式阻斷由標記組分發射之輻射及/或非輻射衰變。在一些實施例中，屏蔽物阻止一或多種標記(例如，發光標記)與一或多種胺基酸識別分子相互作用，或限制相互作用之程度。在一些實施例中，屏蔽物阻止一或多種標記與胺基酸識別分子締合之一或多種分子(例如，與識別分子締和之多肽)相互作用，或限制相互作用之程度。因此，在一些實施例中，術語屏蔽一般可以指由形成於識別組分與標記組分之間的鍵聯基團之某一部分提供的保護或屏蔽效應。

在一些實施例中，屏蔽物連接至一或多種胺基酸識別分子(例如，識別組分)且連接至一或多種標記(例如，標記組分)。在一些實施例中，識別及標記組分在屏蔽物上不相鄰位點處連接。舉例而言，一或多種胺基酸識別分子可連接至屏蔽物之第一側，且一或多種標記可連接至屏蔽物之第二側，其中屏蔽物之第一側與第二側彼此遠離。在一些實施例中，連接位點在屏蔽物之大致對置側上。

屏蔽物連接至識別分子之位點與屏蔽物連接至標記之位點之間的距離可為穿過空間之線性量測值，或跨越屏蔽物之表面的非線性量測值。屏蔽物上識別分子連接位點與標記連接位點之間的距離可藉由對屏蔽物之三維結構建模量測。在一些實施例中，此距離可為至少2 nm、至少4 nm、至少6 nm、至少8 nm、至少10 nm、至少12 nm、至少15 nm、至少20 nm、至少30 nm、至少40 nm或更大。可替代地，屏蔽物上識別分子與標記之相對位置可藉由將屏蔽物之結構按二次表面(例如，橢球面、橢圓柱面)處理描述。在一些實施例中，識別分子連接位點與標記連接位點間隔開之距離為環繞表示屏蔽物之橢球形形狀之距離的至少八分之一。在一些實施例中，識別分子與標記間隔開之距離為環繞表示屏蔽物之橢球形形狀之距離的至少四分之一。在一些實施例中，識別分子與標記間隔開之距離為環繞表示屏蔽物之橢球形形狀之距離的至少三分之一。在一些實施例中，識別分子與標記間隔開之距離為環繞表示屏蔽物之橢球形形狀之距離的一半。

屏蔽物之大小應使得當胺基酸識別分子與多肽締合時，標記不能或不大可能直接接觸多肽。屏蔽物之大小亦應使得當胺基酸識別分子與多肽締合時，所連接之標記可偵測。舉例而言，大小應使得所連接之發光標記在受激照射體積內。

應瞭解，醫師可由多種參數評估屏蔽效應。一般而言，可藉由在具有屏蔽元件之組合物與不具有屏蔽元件之組合物之間進行比較性評定來評估屏蔽元件之作用。舉例而言，屏蔽元件可延長胺基酸識別分子之識別時間。在一些實施例中，識別時間係指在如本文所描述之多肽定序反應中，識別分子與多肽之間的締合事件可觀測之時間長度。在一些實施例中，相對於在相同條件下進行之多肽定序反應，除了胺基酸識別分子不具有屏蔽元件但在其他方面相似或相同，識別時間延長約10%至25%、25%至50%、50%至75%、75%至100%或超過100%，例如延長約2倍、3倍、4倍、5倍或更多。在一些實施例中，屏蔽元件可增加定序準確度及/或序列讀段長度(例如，相對於在如上文所描述之比較條件下進行的定序反應，增加至少5%、至少10%、至少15%、至少25%或更多)。

因此，在一些態樣中，本申請案提供經屏蔽識別分子，其包含至少一種胺基酸識別分子、至少一種可偵測標記，及在識別分子與標記之間形成共價或非共價鍵聯基團的屏蔽元件(例如，「屏蔽物」)。在一些實施例中，屏蔽元件之長度為至少2 nm、至少5 nm、至少10 nm、至少12 nm、至少15 nm、至少20 nm或更大(例如，在水溶液中)。在一些實施例中，屏蔽元件之長度在約2 nm與約100 nm之間(例如，在約2 nm與約50 nm之間、在約10 nm與約50 nm之間、在約20 nm與約100 nm之間)。

在一些實施例中，屏蔽物(例如，屏蔽元件)在一或多種胺基酸識別分子(例如，識別組分)與一或多種標記(例如，標記組分)之間形成共價或非共價鍵聯基團。如本文所用，在一些實施例中，共價及非共價鍵聯或鍵聯基團係指識別組分及標記組分與屏蔽物之連接的性質。

在一些實施例中，共價鍵聯或共價鍵聯基團係指經共價鍵或一系列相鄰共價鍵連接至識別組分及標記組分中之各者的屏蔽物。共價連接一或兩個組分可藉由此項技術中已知之共價綴合方法來達成。舉例而言，在一些實施例中，點擊化學(click chemistry)技術(例如，銅催化、應力促進(strain-promoted)、無銅點擊化學等)可用於將一或兩個組分連接至屏蔽物。此類方法一般涉及將一個反應性部分綴合至另一反應性部分，以在反應性部分之間形成一或多個共價鍵。因此，在一些實施例中，可使屏蔽物之第一反應性部分與識別或標記組分之第二反應性部分接觸，以形成共價連接。反應性部分之實例包括(但不限於)反應性胺、疊氮化合物、炔烴、硝酮、烯烴(例如，環烯烴)、四嗪、四唑及適於點擊反應及類似偶聯技術之其他反應性部分。

在一些實施例中，非共價鍵聯或非共價鍵聯基團係指經由一或多種非共價偶聯手段，包括(但不限於)受體-配位體相互作用及寡核苷酸股雜交，連接至識別組分及標記組分中之一或兩者的屏蔽物。本文提供受體-配位體相互作用之實例且其包括(但不限於)蛋白質-蛋白質複合物、蛋白質-配位體複合物、蛋白質-適體複合物及適體-核酸複合物。用於寡核苷酸股雜交之各種組態及策略描述於本文中且為此項技術中已知的(參見例如美國專利公開案第2019/0024168號)。

在一些實施例中，屏蔽物502 包含聚合物，諸如生物分子或樹狀聚合物。圖5C描繪本申請案之聚合物屏蔽物及經屏蔽識別分子之組態的實例。第一經屏蔽構築體504 展示蛋白質屏蔽物530 之實例。在一些實施例中，蛋白質屏蔽物530 在識別分子與標記之間形成共價鍵聯基團。舉例而言，在一些實施例中，蛋白質屏蔽物530 經一或多個共價鍵，例如藉由經蛋白質屏蔽物530 之天然或非天然胺基酸之側鏈共價連接，連接至識別分子及標記中之各者。在一些實施例中，蛋白質屏蔽物530 在識別分子與標記之間形成非共價鍵聯基團。舉例而言，在一些實施例中，蛋白質屏蔽物530 為包含一或多個配位體結合位點之單體或多聚蛋白。在一些實施例中，非共價鍵聯基團經結合至一或多個配位體結合位點之一或多個配位體部分形成。由蛋白質屏蔽物形成之非共價鍵聯的額外實例描述於本文別處。

第二經屏蔽構築體506 展示雙股核酸屏蔽物之實例，雙股核酸屏蔽物包含第一寡核苷酸股532 ，其與第二寡核苷酸股534 雜交。如所展示，在一些實施例中，雙股核酸屏蔽物可包含連接至第一寡核苷酸股532 之識別分子，及連接至第二寡核苷酸股534 之標記。以此方式，雙股核酸屏蔽物經由寡核苷酸股雜交在識別分子與標記之間形成非共價鍵聯基團。在一些實施例中，識別分子及標記可連接至相同寡核苷酸股，其可提供單股核酸屏蔽物，或經由與另一寡核苷酸股雜交提供雙股核酸屏蔽物。在一些實施例中，股雜交可在鍵聯基團內提供提高之剛性，以進一步增強識別分子與標記之間的間隔。

在屏蔽元件502 包含核酸時，標記與識別分子之間的間隔距離可由核酸上連接位點(例如，直接連接或間接連接，諸如經一或多種額外屏蔽聚合物連接)之間的距離量測。在一些實施例中，核酸上連接位點之間的距離可由在標記與識別分子之間出現的核酸內之核苷酸之數目量測。應理解，核苷酸之數目可以指單股核酸中之核苷酸鹼基之數目，或雙股核酸中之核苷酸鹼基對之數目。

因此，在一些實施例中，識別分子之連接位點與標記之連接位點可由在5個與200個之間的核苷酸(例如，在5個與150個之間的核苷酸、在5個與100個之間的核苷酸、在5個與50個之間的核苷酸、在10個與100個之間的核苷酸)間隔開。應瞭解，核酸中之任何位置可充當識別分子、標記或一或多種額外聚合屏蔽物之連接位點。在一些實施例中，連接位點可處於或大致處於5'或3'端，或處於沿核酸之股的內部位置。

第二經屏蔽構築體506 之非限制性組態示出屏蔽物之實例，其經由股雜交形成非共價鍵聯。非共價鍵聯之另一實例由第三經屏蔽構築體508 示出，其包含寡核苷酸屏蔽物536 。在一些實施例中，寡核苷酸屏蔽物536 為核酸適體，其結合識別分子以形成非共價鍵聯。在一些實施例中，識別分子為核酸適體，且寡核苷酸屏蔽物536 包含寡核苷酸股，其與適體雜交以形成非共價鍵聯。

第四經屏蔽構築體510 展示樹狀聚合物屏蔽物538 之實例。如本文所用，在一些實施例中，樹狀聚合物一般係指多元醇或樹狀體。多元醇及樹狀體已描述於此項技術中，且可包括針對特定組態最佳化之分支鏈樹狀結構。在一些實施例中，樹狀聚合物屏蔽物538 包含聚乙二醇、四乙二醇、聚(醯胺基胺)、聚(丙烯亞胺)、聚(丙烯胺)、碳矽烷、聚(L-離胺酸)或其一或多者之組合。

樹狀體或樹狀突(dendron)為重複分支鏈分子，其通常圍繞核對稱，且可採用球形三維形態。參見例如Astruc等人 (2010) Chem. Rev. 110:1857。將此類結構併入至本申請案之屏蔽物中可經由對標記與與其締合之一或多種生物分子(例如，識別分子及/或與識別分子締合之多肽)之間接觸的空間抑制，提供保護效應。經由分子之一級結構中之變化(包括樹狀體表面之潛在官能化)改進樹狀體之化學及物理特性，允許按需要調節屏蔽效應。如此項技術中已知，樹狀體可使用廣泛範圍之材料及分支鏈反應藉由多種技術合成。此類合成變化允許視需要定製樹狀體之特性。可根據本申請案之屏蔽物使用之多元醇及樹狀體化合物的實例包括(但不限於)美國專利公開案第20180346507號中所描述之化合物。

圖5D描繪本申請案之經屏蔽識別分子之另外示例性組態。蛋白質-核酸構築體512 展示屏蔽物之實例，其包含呈蛋白質及雙股核酸形式之多於一種聚合物。在一些實施例中，屏蔽物之蛋白質部分經由共價鍵聯連接至屏蔽物之核酸部分。在一些實施例中，連接係經由非共價鍵聯。舉例而言，在一些實施例中，屏蔽物之蛋白質部分為單價或多價蛋白，其經連接至單價或多價蛋白之配位體結合位點的配位體部分形式至少一個非共價鍵聯。在一些實施例中，屏蔽物之蛋白質部分包含抗生物素蛋白。

在一些實施例中，本申請案之經屏蔽識別分子為抗生物素-核酸構築體514 。在一些實施例中，抗生物素-核酸構築體514 包括屏蔽物，其包含抗生物素蛋白540 及雙股核酸。如本文中所描述，抗生物素蛋白540 可用於在一或多種胺基酸識別分子與一或多種標記之間，直接地或間接地(諸如經本文所描述之一或多種額外屏蔽聚合物)形成非共價鍵聯。

抗生物素蛋白為生物素結合蛋白，一般在抗生物素蛋白之四個次單元中之每一者處具有生物素結合位點。抗生物素蛋白包括例如抗生物素、抗生物素蛋白鏈菌素、突變抗生物素蛋白鏈菌素(traptavidin)、金頂側耳抗生物素(tamavidin)、慢生型根瘤菌抗生物素(bradavidin)、爪蟾抗生物素(xenavidin)及其同系物及變異體。在一些情況下，可使用抗生物素蛋白之單體、二聚或四聚形式。在一些實施例中，抗生物素蛋白複合物之抗生物素蛋白為呈四聚形式(例如，均四聚體)之抗生物素蛋白鏈菌素。在一些實施例中，抗生物素蛋白之生物素結合位點為本文所描述之一或多種胺基酸識別分子、一或多種標記及/或一或多種額外屏蔽聚合物提供連接位點。

抗生物素蛋白複合物之說明圖解展示於圖5D之插圖中。如插圖中所展示，抗生物素蛋白540 可在蛋白質之四個次單元中之每一者處包括結合位點542 ，其可結合至生物素部分(展示為白色圓形)。抗生物素蛋白540 之多價可允許各種鍵聯組態，其出於說明之目的大體上經展示。舉例而言，在一些實施例中，生物素鍵聯部分544 可用於提供與抗生物素蛋白540 之單一連接點。在一些實施例中，雙生物素鍵聯部分546 可用於提供兩個與抗生物素蛋白540 之連接點。如由抗生物素-核酸構築體514 所示出，抗生物素蛋白複合物可由兩個雙生物素鍵聯部分形成，兩個雙生物素鍵聯部分形成反式組態以在識別分子與標記之間提供增加的間隔距離。

展示抗生物素蛋白屏蔽物組態之各種另外的實例。第一抗生物素構築體516 展示抗生物素屏蔽物之實例，其經雙生物素鍵聯部分連接至識別分子，且經獨立生物素鍵聯部分連接至兩個標記。第二抗生物素構築體518 展示抗生物素屏蔽物之實例，其經獨立生物素鍵聯部分連接至兩個識別分子，且經雙生物素鍵聯部分連接至標記。第三抗生物素構築體520 展示抗生物素屏蔽物之實例，其經獨立生物素鍵聯部分連接至兩個識別分子，且經核酸之各股的生物素鍵聯部分連接至經標記核酸。第四抗生物素構築體522 展示抗生物素屏蔽物之實例，其經獨立雙生物素鍵聯部分連接至識別分子且連接至經標記核酸。如所展示，標記由標記與核酸之間的樹狀聚合物進一步與識別分子屏蔽。

應瞭解，圖5A至圖5D中所展示之經屏蔽識別分子之示例性組態出於說明之目的提供。諸位發明人已構想使用一或多種不同聚合物之各種其他屏蔽物組態，該等聚合物在經屏蔽識別分子之識別組分與標記組分之間形成共價或非共價鍵聯。藉助於實例，圖5E示出根據本申請案之屏蔽物組態的模組化。

如圖5E頂部處所展示，經屏蔽識別分子一般包含識別組分550 、屏蔽元件552 及標記組分554 。為了易於說明，識別組分550 描繪為一種胺基酸識別分子，且標記組分554 描繪為一種標記。應瞭解，本申請案之經屏蔽識別分子可包含屏蔽元件552 ，其連接至一或多種胺基酸識別分子及一或多種標記。在識別組分550 包含多於一種識別分子時，各識別分子可在屏蔽元件552 上之一或多個連接位點處連接至屏蔽元件552 。在標記組分554 包含多於一種標記時，各標記可在屏蔽元件552 上之一或多個連接位點處連接至屏蔽元件552 。

在一些實施例中，屏蔽元件552 包含蛋白質560 。在一些實施例中，蛋白質560 為單價或多價蛋白。在一些實施例中，蛋白質560 為單體或多聚蛋白，諸如蛋白質同二聚體、蛋白質異二聚體、蛋白質寡聚物或其他蛋白質(proteinaceous)分子。在一些實施例中，屏蔽元件552 包含蛋白質複合物，其由非共價結合至至少一種其他分子之蛋白質形成。舉例而言，在一些實施例中，屏蔽元件552 包含蛋白質-蛋白質複合物562 。在一些實施例中，蛋白質-蛋白質複合物562 包含一種特異性結合至另一蛋白質分子之蛋白質分子。在一些實施例中，蛋白質-蛋白質複合物562 包含結合至抗原之抗體或抗體片段(例如，scFv)。在一些實施例中，蛋白質-蛋白質複合物562 包含結合至蛋白質配位體之受體。蛋白質-蛋白質複合物之額外實例包括(但不限於)胰蛋白酶-抑肽酶(trypsin-aprotinin)、雄性不育基因-恢復基因(barnase-barstar)及大腸桿菌素(colicin) E9-Im9免疫蛋白。

在一些實施例中，屏蔽元件552 包含蛋白質-配位體複合物564 。在一些實施例中，蛋白質-配位體複合物564 包含單價蛋白質及非蛋白質配位體部分。舉例而言，在一些實施例中，蛋白質-配位體複合物564 包含結合至小分子抑制劑部分之酶。在一些實施例中，蛋白質-配位體複合物564 包含結合至非蛋白質配位體部分之受體。

在一些實施例中，屏蔽元件552 包含多價蛋白質複合物，其由非共價結合至一或多種配位體部分之多價蛋白質形成。在一些實施例中，屏蔽元件552 包含抗生物素蛋白複合物，其由非共價結合至一或多種生物素鍵聯部分之抗生物素蛋白形成。構築體566 、568 、570 及572 提供抗生物素蛋白複合物之說明性實例，其中之任何一或多者可併入至屏蔽元件552 中。

在一些實施例中，屏蔽元件552 包含雙向抗生物素複合物566 ，其包含結合至兩個雙生物素鍵聯部分之抗生物素蛋白。在一些實施例中，屏蔽元件552 包含三向抗生物素複合物568 ，其包含結合至兩個生物素鍵聯部分及雙生物素鍵聯部分之抗生物素蛋白。在一些實施例中，屏蔽元件552 包含四向抗生物素複合物570 ，其包含結合至四個生物素鍵聯部分之抗生物素蛋白。

在一些實施例中，屏蔽元件552 包含抗生物素蛋白，其包含工程改造至抗生物素蛋白中之一或兩個非官能性結合位點。舉例而言，在一些實施例中，屏蔽元件552 包含二價抗生物素複合物572 ，其包含在兩個次單元中之每一者處結合至生物素鍵聯部分的抗生物素蛋白，其中抗生物素蛋白在兩個其他次單元中之每一者處包含非官能性配位體結合位點548 。如所展示，在一些實施例中，二價抗生物素複合物572 包含反-二價抗生物素蛋白，不過可視所需實施方案而定使用順-二價抗生物素蛋白。在一些實施例中，抗生物素蛋白為三價抗生物素蛋白。在一些實施例中，三價抗生物素蛋白在一個次單元處包含非官能性配位體結合位點548 ，且在其他次單元處結合至三個生物素鍵聯部分，或一個生物素鍵聯部分及一個雙生物素鍵聯部分。

在一些實施例中，屏蔽元件552 包含樹狀聚合物574 。在一些實施例中，樹狀聚合物574 為多元醇或樹狀體，如文本別處所描述。在一些實施例中，樹狀聚合物574 為分支鏈多元醇或分支鏈樹狀體。在一些實施例中，樹狀聚合物574 包含單醣-TEG、二醣、N-乙醯基單醣、TEMPO-TEG、水溶性維生素E (trolox)-TEG或甘油樹狀體。根據本申請案之經屏蔽識別分子適用之多元醇的實例包括聚醚多元醇及聚酯多元醇，例如聚乙二醇、聚丙二醇及此項技術中熟知之類似的此類聚合物。在一些實施例中，樹狀聚合物574 包含以下式之化合物：−(CH₂ CH₂ O)_n −，其中n為1至500之整數(包括端點)。在一些實施例中，樹狀聚合物574 包含以下式之化合物：−(CH₂ CH₂ O)_n −，其中n為1至100之整數(包括端點)。

在一些實施例中，屏蔽元件552 包含核酸。在一些實施例中，核酸為單股的。在一些實施例中，標記組分554 直接地或間接地連接至單股核酸之一端(例如，5'端或3'端)，且識別組分550 直接地或間接地連接至單股核酸之另一端(例如，3'端或5'端)。舉例而言，單股核酸可包含連接至核酸之5'端的標記，及連接至核酸之3'端的胺基酸識別分子。

在一些實施例中，屏蔽元件552 包含雙股核酸576 。如所展示，在一些實施例中，雙股核酸576 可經由股雜交在識別組分550 與標記組分554 之間形成非共價鍵聯。然而，在一些實施例中，雙股核酸576 可經由與相同寡核苷酸股之連接在識別組分550 與標記組分554 之間形成共價鍵聯。在一些實施例中，標記組分554 直接地或間接地連接至雙股核酸之一端，且識別組分550 直接地或間接地連接至雙股核酸之另一端。舉例而言，雙股核酸可包含連接至一股之5'端的標記，及連接至另一股之5'端的胺基酸識別分子。

在一些實施例中，屏蔽元件552 包含核酸，其形成可適用於增加屏蔽物之空間體積(steric bulk)的一或多種結構基元。核酸結構基元之實例包括(但不限於)莖-環、三向連結體(例如，由兩個或更多個莖-環基元形成)、四向連結體(例如，霍利迪連結體(Holliday junction))及凸環(bulge loop)。

在一些實施例中，屏蔽元件552 包含形成莖-環578 之核酸。莖-環或髮夾環為當寡核苷酸股摺疊且與相同股之另一段形成鹼基對時形成之寡核苷酸股上之核苷酸之未配對環。在一些實施例中，莖-環578 之未配對環包含三至十個核苷酸。因此，莖-環578 可由具有雜交形成莖之反向互補序列之寡核苷酸股的兩個區域形成，其中兩個區域由形成未配對環之三至十個核苷酸間隔開。在一些實施例中，莖-環578 之莖可經設計以具有一或多個G/C核苷酸，其可藉由相比於A/T核苷酸形成之附加氫鍵結相互作用提供增加的穩定性。在一些實施例中，莖-環578 之莖包含緊鄰未配對環序列之G/C核苷酸。在一些實施例中，莖-環578 之莖在與未配對環序列相鄰之前2、3、4或5個核苷酸內包含G/C核苷酸。在一些實施例中，莖-環578 之未配對環包含一或多個連接位點。在一些實施例中，連接位點存在於未配對環中之無鹼基位點處。在一些實施例中，連接位點存在於未配對環之鹼基處。

在一些實施例中，莖-環578 由雙股核酸形成。如本文所描述，在一些實施例中，雙股核酸可經由第一寡核苷酸股與第二寡核苷酸股之股雜交形成非共價鍵聯基團。然而，在一些實施例中，屏蔽元件552 包含單股核酸，其形成莖-環基元，例如以提供共價鍵聯基團。在一些實施例中，屏蔽元件552 包含形成兩個或更多個莖-環基元之核酸。舉例而言，在一些實施例中，核酸包含兩個莖-環基元。在一些實施例中，一個莖-環基元之莖與另一莖-環基元之莖相鄰，使得基元共同形成三向連結體。在一些實施例中，屏蔽元件552 包含形成四向連結體580 之核酸。在一些實施例中，四向連結體580 經由兩個或更多個寡核苷酸股(例如，2、3或4個寡核苷酸股)之雜交形成。

在一些實施例中，屏蔽元件552 包含一或多種選自圖5E之560 、562 、564 、566 、568 、570 、572 、574 、576 、578 及580 的聚合物。應瞭解，560 、562 、564 、566 、568 、570 、572 、574 、576 、578 及580 中之每一者上所展示之鍵聯部分及連接位點出於說明之目的經展示，且並不意欲描繪較佳鍵聯或連接位點組態。

在一些態樣中，本申請案提供式(I )之胺基酸識別分子： A-(Y)_n -D (I )，其中：A係包含至少一種胺基酸識別分子之胺基酸結合組分；Y在各情況下係形成共價或非共價鍵聯基團之聚合物；n係1至10之整數(包括端點)；且D係包含至少一種可偵測標記之標記組分。在一些實施例中，本申請案提供包含式(I )之可溶性胺基酸識別分子的組合物。

在一些實施例中，A包含複數種胺基酸識別分子。在一些實施例中，複數種胺基酸識別分子中之各胺基酸識別分子連接至Y上之不同連接位點。在一些實施例中，複數種胺基酸識別分子中之至少兩種胺基酸識別分子連接至Y上之單一連接位點。在一些實施例中，胺基酸識別分子為識別蛋白或核酸適體，例如如本文別處所描述。

在一些實施例中，可偵測標記為發光標記或導電性標記。在一些實施例中，發光標記包含至少一種螢光團染料分子。在一些實施例中，D包含20種或更少螢光團染料分子。在一些實施例中，螢光團染料分子之數目與胺基酸識別分子之數目的比率在1:1與20:1之間。在一些實施例中，發光標記包含至少一個FRET對，其包含供體標記及受體標記。在一些實施例中，供體標記與受體標記之比率為1:1、2:1、3:1、4:1或5:1。在一些實施例中，受體標記與供體標記之比率為1:1、2:1、3:1、4:1或5:1。

在一些實施例中，D之直徑小於200 Å。在一些實施例中，-(Y)_n -之長度為至少2 nm。在一些實施例中，-(Y)_n -之長度為至少5 nm。在一些實施例中，-(Y)_n -之長度為至少10 nm。在一些實施例中，Y在各情況下獨立地係生物分子、多元醇或樹狀體。在一些實施例中，生物分子為核酸、多肽或多醣。

在一些實施例中，胺基酸識別分子係以下式中之一者： A-Y¹ -(Y)_m -D或A-(Y)_m -Y¹ -D，其中：Y¹ 係核酸或多肽；且m係0至10之整數(包括端點)。

在一些實施例中，核酸包含第一寡核苷酸股。在一些實施例中，核酸包含與第一寡核苷酸股雜交之第二寡核苷酸股。在一些實施例中，核酸經第一寡核苷酸股形成共價鍵聯。在一些實施例中，核酸經雜交之第一寡核苷酸股及第二寡核苷酸股形成非共價鍵聯。

在一些實施例中，多肽為單價或多價蛋白。在一些實施例中，單價或多價蛋白經連接至單價或多價蛋白之配位體結合位點的配位體部分形成至少一個非共價鍵聯。在一些實施例中，A、Y或D包含配位體部分。

在一些實施例中，胺基酸識別分子係以下式中之一者： A-(Y)_m -Y² -D或A-Y² -(Y)_m -D，其中：Y² 係多元醇或樹狀體；且m係0至10之整數(包括端點)。在一些實施例中，多元醇或樹狀體包含聚乙二醇、四乙二醇、聚(醯胺基胺)、聚(丙烯亞胺)、聚(丙烯胺)、碳矽烷、聚(L-離胺酸)或其一或多者之組合。

在一些態樣中，本申請案提供式(II )之胺基酸識別分子： A-Y¹ -D (II )，其中：A係包含至少一種胺基酸識別分子之胺基酸結合組分；Y¹ 係核酸或多肽；D係包含至少一種可偵測標記之標記組分。在一些實施例中，當Y¹ 係核酸時，核酸形成共價或非共價鍵聯基團。在一些實施例中，當Y¹ 係多肽時，多肽形成非共價鍵聯基團，其特徵在於低於50 × 10^- ⁹ M之解離常數(K_D )。

在一些實施例中，Y¹ 係包含第一寡核苷酸股之核酸。在一些實施例中，核酸包含與第一寡核苷酸股雜交之第二寡核苷酸股。在一些實施例中，A連接至第一寡核苷酸股，且其中D連接至第二寡核苷酸股。在一些實施例中，A連接至第一寡核苷酸股上之第一連接位點，且其中D連接至第一寡核苷酸股上之第二連接位點。在一些實施例中，核酸之各寡核苷酸股包含少於150、少於100或少於50個核苷酸。

在一些實施例中，Y¹ 係單價或多價蛋白。在一些實施例中，單價或多價蛋白經連接至單價或多價蛋白之配位體結合位點的配位體部分形成至少一個非共價鍵聯。在一些實施例中，A及D中之至少一者包含配位體部分。在一些實施例中，多肽為抗生物素蛋白(例如，抗生物素、抗生物素蛋白鏈菌素、突變抗生物素蛋白鏈菌素、金頂側耳抗生物素、慢生型根瘤菌抗生物素、爪蟾抗生物素或其同系物或變異體)。在一些實施例中，配位體部分為生物素部分。

在一些實施例中，胺基酸識別分子係以下式中之一者： A-Y¹ -(Y)_n -D或A-(Y)_n -Y¹ -D，其中：Y在各情況下係形成共價或非共價鍵聯基團之聚合物；且n係1至10之整數(包括端點)。在一些實施例中，Y在各情況下獨立地係生物分子、多元醇或樹狀體。

在其他態樣中，本申請案提供胺基酸識別分子，其包含：核酸；連接至核酸上之第一連接位點之至少一種胺基酸識別分子；及連接至核酸上之第二連接位點之至少一種可偵測標記。在一些實施例中，核酸在至少一種胺基酸識別分子與至少一種可偵測標記之間形成共價或非共價鍵聯基團。

在一些實施例中，核酸為雙股核酸，其包含與第二寡核苷酸股雜交之第一寡核苷酸股。在一些實施例中，第一連接位點在第一寡核苷酸股上，且其中第二連接位點在第二寡核苷酸股上。在一些實施例中，至少一種胺基酸識別分子經蛋白質連接至第一連接位點，該蛋白質在至少一種胺基酸識別分子與核酸之間形成共價或非共價鍵聯基團。在一些實施例中，至少一種可偵測標記經蛋白質連接至第二連接位點，該蛋白質在至少一種可偵測標記與核酸之間形成共價或非共價鍵聯基團。在一些實施例中，第一連接位點與第二連接位點由核酸上5個與100個之間的核苷酸鹼基或核苷酸鹼基對間隔開。

在其他態樣中，本申請案提供胺基酸識別分子，其包含：多價蛋白，其包含至少兩個配位體結合位點；至少一種胺基酸識別分子，其經結合至蛋白質上之第一配位體結合位點的第一配位體部分連接至蛋白質；及至少一種可偵測標記，其經結合至蛋白質上之第二配位體結合位點的第二配位體部分連接至蛋白質。

在一些實施例中，多價蛋白為包含四個配位體結合位點之抗生物素蛋白。在一些實施例中，配位體結合位點為生物素結合位點，且其中配位體部分為生物素部分。在一些實施例中，生物素部分中之至少一者為雙生物素部分，且其中雙生物素部分結合至抗生物素蛋白上之兩個生物素結合位點。在一些實施例中，至少一種胺基酸識別分子經包含第一配位體部分之核酸連接至蛋白質。在一些實施例中，至少一種可偵測標記經包含第二配位體部分之核酸連接至蛋白質。

如本文別處所描述，本申請案之經屏蔽識別分子可用於根據本申請案之多肽定序方法，或此項技術中已知之任何方法。舉例而言，在一些實施例中，本文所提供之經屏蔽識別分子可用於本文所提供或此項技術中習知之艾德曼型降解反應，其可涉及多肽定序反應中多個反應混合物之迭代循環。在一些實施例中，本文所提供之經屏蔽識別分子可用於本申請案之動態定序反應，其涉及單一反應混合物中之胺基酸識別及降解。 藉由經標記多肽之降解定序

在一些態樣中，本申請案提供藉由鑑別對應於已知多肽序列之胺基酸之獨特組合，對多肽進行定序之方法。舉例而言，圖6展示藉由偵測經標記多肽600 之經選擇性標記之胺基酸定序之方法。在一些實施例中，經標記多肽600 包含經選擇性修飾之胺基酸，使得不同胺基酸類型包含不同發光標記。如本文所用，除非另外指示，否則經標記多肽係指包含一或多種經選擇性標記之胺基酸側鏈的多肽。選擇性標記之方法及涉及經標記多肽之製備及分析的細節係此項技術中已知的(參見例如Swaminathan等人PLoS Comput Biol . 2015, 11(2):e1004080)。

如所展示，在一些實施例中，經標記多肽600 經固定且曝露於激發源。偵測到來自經標記多肽600 之聚集發光，且在一些實施例中，曝露於發光歷經時間導致所偵測到之信號中歸因於發光標記降解(例如，歸因於光漂白(photobleaching)之降解)的損失。在一些實施例中，經標記多肽600 包含引起初始偵測到之信號的經選擇性標記之胺基酸的獨特組合。如大體上所示出，隨時間推移之發光標記降解導致針對經光漂白之經標記多肽602 偵測到之信號的對應降低。在一些實施例中，信號可藉由對一或多種發光特性之分析解褶積(例如，藉由發光壽命分析進行之信號解褶積)。在一些實施例中，經標記多肽600 之經選擇性標記之胺基酸的獨特組合已在計算上預計算，且例如基於蛋白質組之已知多肽序列在經驗上驗證。在一些實施例中，將所偵測到之胺基酸標記的組合對照生物體之蛋白質組之已知序列的資料庫比較，以鑑別對應於經標記多肽600 之資料庫中之特定多肽。

在一些實施例中，圖6中所示出之方法可藉由確定用於進行使大規模並行分析中之取樣達至最大之定序反應的最佳樣品濃度來修改。在一些實施例中，選擇濃度以使得陣列之樣品孔的所需分率(例如，30%)在任何給定時間被佔據。在不希望受理論束縛的情況下，認為儘管多肽經一段時間經漂白，但相同孔繼續可用於進一步分析。經由擴散，陣列之樣品孔之大致30%可用於每3分鐘分析。作為說明性實例，在一百萬樣品孔晶片中，每小時可取樣6,000,000個多肽，或在4小時時段內取樣24,000,000個。

在一些態樣中，本申請案提供藉由偵測經歷末端胺基酸修飾及切割之重複循環之經標記多肽的發光，對多肽進行定序之方法。舉例而言，圖7展示根據本申請案之藉由艾德曼降解對經標記多肽進行定序之方法。在一些實施例中，該方法一般如本文針對藉由艾德曼降解定序之其他方法所描述進行。舉例而言，在一些實施例中，圖7中所展示之步驟(1)及步驟(2)可分別如本文針對末端胺基酸修飾及末端胺基酸切割所描述，在艾德曼降解反應中進行。

如圖7中所描繪之實例所展示，在一些實施例中，方法包含(1)修飾經標記多肽之末端胺基酸的步驟。如本文別處所描述，在一些實施例中，修飾包含使末端胺基酸與異硫氰酸酯(例如，PITC)接觸，以形成經異硫氰酸酯修飾之末端胺基酸。在一些實施例中，異硫氰酸酯修飾710 將末端胺基酸轉化為對由切割試劑(例如，化學或酶切割試劑，如本文所描述)移除更敏感之形式。因此，在一些實施例中，方法包含(2)使用本文別處針對艾德曼降解詳述之化學或酶手段移除經修飾末端胺基酸的步驟。

在一些實施例中，方法包含重複步驟(1)至步驟(2)，持續複數個循環，在其期間偵測經標記多肽之發光，且可將對應於經標記胺基酸自末端移除之切割事件按所偵測到之信號的降低來偵測。在一些實施例中，如圖7中所展示之步驟(2)之後信號無變化鑑別未知類型之胺基酸。因此，在一些實施例中，部分序列資訊可藉由以下確定：藉由基於所偵測到之信號的變化由確定身分指派胺基酸類型，或基於所偵測到之信號無變化將胺基酸類型鑑別為未知，在各依序輪期間評估在步驟(2)之後偵測到的信號。

在一些態樣中，根據本申請案對多肽進行定序之方法包含藉由經標記多肽之進行性酶切割定序，如圖8A至圖8C中大體上所示出。如所展示，在一些實施例中，經標記多肽經歷使用經修飾進行性外肽酶之降解，該外肽酶自一個末端至另一末端連續切割末端胺基酸。本文別處詳細描述外肽酶。圖8A描繪實例，其中經標記多肽800 經歷由固定進行性外肽酶810 進行之降解。圖8B描繪實例，其中固定經標記多肽820 經歷由進行性外肽酶830 進行之降解。

圖8C示意性地示出根據圖8B中所描繪之方法進行之即時定序過程的實例。如所展示，圖(I)至圖(IV)展示經標記多肽降解之進展，在各圖下方展示隨時間推移之對應信號跡線。如所展示，對應於經標記胺基酸之各切割事件引起信號中之伴隨下降。在一些實施例中，進行性外肽酶830 之進行(processivity)速率已知，使得所偵測到之信號降低之間的時序可用於計算各偵測事件之間未經標記胺基酸之數目。舉例而言，若40個胺基酸之多肽以使得每秒移除一個胺基酸之方式切割，則具有3個信號之經標記多肽將最初展示全部3個((圖(I))，隨後2個(圖(II))，隨後1個(圖(III))且最後無信號。以此方式，可確定經標記胺基酸之次序。因此，此等方法可用於確定部分序列資訊，例如用於基於多肽片段定序之蛋白質組分析。

在一些實施例中，可使用例如如圖9中所示出之基於ATP之福斯特共振能量轉移(Förster resonance energy transfer；FRET)方案(例如，利用一或多種經標記輔因子)實現單分子蛋白質定序。在一些實施例中，可使用固定ATP依賴型蛋白酶、供體標記ATP及多肽受質之受體標記胺基酸進行藉由基於輔因子之FRET進行的定序。在一些實施例中，胺基酸可經受體標記，且一或多種輔因子可經供體標記。

舉例而言，在一些實施例中，所提取之蛋白質經變性，且半胱胺酸及離胺酸經螢光染料標記。在一些實施例中，蛋白質移位酶(例如，細菌ClpX)之經工程改造形式用於結合至個別受質蛋白質，將蛋白質外展，且使蛋白質通過其奈米通道移位。在一些實施例中，移位酶經供體染料標記，且當受質通過奈米通道時，FRET在移位酶上之供體與受質上之兩種或更多種相異受體染料之間發生。隨後可根據FRET信號確定經標記胺基酸之次序。在一些實施例中，可使用表5中所展示之以下非限制性經標記ATP類似物中之一或多者。表5.經標記ATP類似物之非限制性實例。

經磷酸酯標記之 ATP ：

(γ-[(6-胺基)己基]-ATP)

(γ-[(6-胺基己基)醯亞胺基]-ATP)

(γ-(6-胺基己基)-ATP-Cy3)

(γ-[(6-胺基己基)醯亞胺基]-ATP-Cy3)

(BODIPY FL ATPγS)

經核糖標記之 ATP ：

(EDA-ATP)

(EDA-ATP - Cy3)

(EDA-ATP - Cy3)

經鹼基標記之 ATP ：

(N⁶ -(6-胺基)己基-ATP)

(N⁶ -(6-胺基己基)-ATP-Cy3)

用於定序之樣品的製備

在定序之前，多肽樣品可經修飾。在一些實施例中，多肽之N末端胺基酸或C末端胺基酸經修飾。圖10A示出用於由蛋白質樣品製備末端經修飾之多肽的端接末端修飾之非限制性實例。在步驟(1)中，將蛋白質樣品1000 片段化以產生多肽片段1002 。可藉由切割(例如，以化學方式)及/或消化(例如，以酶方式，例如使用肽酶，例如胰蛋白酶)所關注多肽，將多肽片段化。片段化可在標記之前或之後進行。在一些實施例中，在標記整個蛋白質之後進行片段化。可在切割之前或之後標記一或多個胺基酸以產生經標記多肽。在一些實施例中，多肽在化學或酶片段化之後經大小選擇。在一些實施例中，移除較小多肽(例如，＜ 2 kDa)且保留較大多肽以用於序列分析。大小選擇可使用諸如凝膠過濾、SEC、透析、PAGE凝膠提取、微流張力流或任何其他適合之技術的技術實現。在步驟(2)中，多肽片段1002 之N末端或C末端經修飾以產生末端經修飾之多肽1004 。在一些實施例中，修飾包含添加固定部分。在一些實施例中，修飾包含添加偶聯部分。

因此，本發明提供用使得能夠固定至表面(例如，用於蛋白質分析之晶片上之樣品孔的表面)之部分修飾蛋白質及多肽之端接末端的方法。在一些實施例中，此類方法包含修飾待根據本申請案分析之經標記多肽的端接末端。在其他實施例中，此類方法包含修飾使根據本申請案之蛋白質或多肽受質降解或移位之蛋白質或酶的端接末端。

在一些實施例中，蛋白質或多肽之羧基末端在包含以下之方法中經修飾：(i)阻斷蛋白質或多肽之游離羧酸基；(ii)使蛋白質或多肽變性(例如，藉由加熱及/或化學手段)；(iii)阻斷蛋白質或多肽之游離硫醇基；(iv)消化蛋白質或多肽以產生至少一個多肽片段，其包含游離C末端羧酸基；及(v)將官能性部分綴合(例如，以化學方式)至游離C末端羧酸基。在一些實施例中，該方法進一步包含在(i)之後且(ii)之前，透析包含蛋白質或多肽之樣品。

在一些實施例中，蛋白質或多肽之羧基末端在包含以下之方法中經修飾：(i)使蛋白質或多肽變性(例如，藉由加熱及/或化學手段)；(ii)阻斷蛋白質或多肽之游離硫醇基；(iii)消化蛋白質或多肽以產生至少一個多肽片段，其包含游離C末端羧酸基；(iv)阻斷游離C末端羧酸基以產生至少一個多肽片段，其包含經阻斷C末端羧酸基；及(v)將官能性部分綴合(例如，以酶方式)至經阻斷C末端羧酸基。在一些實施例中，該方法進一步包含在(iv)之後且(v)之前，透析包含蛋白質或多肽之樣品。

在一些實施例中，阻斷游離羧酸基係指對此等基團進行化學修飾，相對於未經修飾之羧酸，其改變化學反應性。適合之羧酸阻斷方法係此項技術中已知的，且應修飾側鏈羧酸基以在化學上不同於待官能化之多肽的羧基末端羧酸基。在一些實施例中，阻斷游離羧酸基包含將多肽之游離羧酸基酯化或醯胺化。在一些實施例中，阻斷游離羧酸基包含將多肽之游離羧酸基甲酯化，例如藉由使多肽與甲醇HCl反應進行。適用於阻斷游離羧酸基之試劑及技術的額外實例包括(但不限於) 4-磺基-2,3,5,6-四氟苯酚(STP)及/或碳化二亞胺(諸如N-(3-二甲胺基丙基)-N'-乙基碳化二亞胺鹽酸鹽(EDAC))、脲鎓試劑、重氮甲烷、用於費雪酯化(Fischer esterification)之醇及酸、使用N-羥基丁二醯亞胺(NHS)形成NHS酯(潛在地作為後續酯或胺形成之中間體)、或與羰基二咪唑(CDI)反應或形成混合酸酐，或潛在地經由形成酯或醯胺進行之修飾或阻斷羧酸的任何其他方法。

在一些實施例中，阻斷游離硫醇基係指對此等基團進行化學修飾，相對於未經修飾之硫醇，其改變化學反應性。在一些實施例中，阻斷游離硫醇基包含將蛋白質或多肽之游離硫醇基還原及烷化。在一些實施例中，還原及烷化藉由使多肽與二硫蘇糖醇(DTT)及碘乙醯胺與碘乙酸中之一或兩者接觸進行。可使用之額外及替代半胱胺酸還原性試劑的實例為人所熟知，且包括(但不限於) 2-巰基乙醇、參(2-羧乙基)膦鹽酸鹽(TCEP)、三丁基膦、二硫丁胺(DTBA)或能夠還原硫醇基之任何試劑。可使用之額外及替代半胱胺酸阻斷性(例如，半胱胺酸烷化)試劑的實例為人所熟知，且包括(但不限於)丙烯醯胺、4-乙烯基吡啶、N-乙基順丁烯二醯亞胺(NEM)、N-ε-順丁烯二醯亞胺基己酸(EMCA)或修飾半胱胺酸從而阻止二硫鍵形成之任何試劑。

在一些實施例中，消化包含酶消化。在一些實施例中，消化藉由在消化條件下使蛋白質或多肽與內肽酶(例如，胰蛋白酶)接觸進行。在一些實施例中，消化包含化學消化。適用於化學及酶消化之試劑的實例係此項技術中已知的，且包括(但不限於)胰蛋白酶、胰凝乳蛋白酶、Lys-C、Arg-C、Asp-N、Lys-N、BNPS-糞臭素(Skatole)、CNBr、凋亡蛋白酶、甲酸、麩胺醯基內肽酶、羥胺、亞碘醯基苯甲酸(iodosobenzoic acid)、嗜中性白血球彈性蛋白酶、胃蛋白酶、脯胺酸內肽酶、蛋白酶K、葡萄球菌肽酶I、嗜熱菌蛋白酶及凝血酶。

在一些實施例中，官能性部分包含生物素分子。在一些實施例中，官能性部分包含反應性化學部分，諸如炔基。在一些實施例中，綴合官能性部分包含由羧肽酶Y對羧基末端羧基甲酯基進行生物素標記，如此項技術中已知。

在一些實施例中，將增溶部分添加至多肽中。圖10B示出例如使用將增溶連接子綴合至多肽之過程，將增溶部分添加至多肽之末端胺基酸中的非限制性實例。

在一些實施例中，包含連接子綴合部分1012 之末端經修飾之多肽1010 綴合至包含多肽綴合部分1022 之增溶連接子1020 。在一些實施例中，增溶連接子包含增溶聚合物，諸如生物分子(例如，展示為帶點形狀)。在一些實施例中，包含形成於1012 與1022 之間的鍵聯1032 的所得連接子綴合多肽1030 進一步包含表面綴合部分1034 。因此，在一些實施例中，本文所提供之方法及組合物適用於用提高其溶解度之部分修飾多肽之端接末端。在一些實施例中，增溶部分適用於由片段化(例如，酶片段化，例如使用胰蛋白酶進行)產生且溶解度相對低之小多肽。舉例而言，在一些實施例中，可藉由將聚合物(例如，短寡核苷酸、糖或其他帶電聚合物)綴合至多肽，使多肽庫中之短多肽溶解。

在一些實施例中，樣品孔之一或多個表面(例如，樣品孔之側壁)可經修飾。對樣品孔側壁進行鈍化及/或防積垢之非限制性實例展示於圖10C中，其中示出樣品孔之示例性示意圖，其具有可用於促進單分子固定至底表面之經修飾表面。在一些實施例中，1040 為SiO₂ 。在一些實施例中，1042 為多肽綴合部分(例如，TCO、四嗪、N3、炔烴、醛、NCO、NHS、硫醇、烯烴、DBCO、BCN、TPP、生物素或其他適合之綴合部分)。在一些實施例中，1050 為TiO₂ 或Al₂ O₃ 。在一些實施例中，1052 為疏水性C₄ _- ₁₈ 分子；聚四氟乙烯化合物(例如，(CF₂ )₄ _- ₁₂ )；多元醇，諸如聚乙二醇(例如，PEG₃ _- ₁₀₀ )、聚丙二醇、聚氧乙烯二醇或其組合或變化形式；或兩性離子，諸如磺基甜菜鹼。在一些實施例中，1060 為Si。在一些實施例中，1070 為Al。在一些實施例中，1080 為TiN。 發光標記

如本文所用，發光標記為吸收一或多個光子且可隨後在一或多個持續時間之後發射一或多個光子的分子。在一些實施例中，視情形而定，該術語可與「標記」或「發光分子」互換使用。根據本文所描述之某些實施例之發光標記可以指經標記親和試劑之發光標記、經標記肽酶(例如，經標記外肽酶、經標記非特異性外肽酶)之發光標記、經標記肽之發光標記、經標記輔因子之發光標記或本文所描述之另一經標記組合物。在一些實施例中，根據本申請案之發光標記係指包含一或多種經標記胺基酸之經標記多肽的經標記胺基酸。

在一些實施例中，發光標記可包含第一及第二發色團。在一些實施例中，第一發色團之激發態能夠經由能量傳遞至第二發色團弛豫。在一些實施例中，能量傳遞為福斯特共振能量轉移(FRET)。此類FRET對可能適用於為發光標記提供特性，該等特性使得該標記更易於在混合物中在複數種發光標記當中進行區分，例如如本文針對圖1C之經標記適體106 示出且描述。在其他實施例中，FRET對包含第一發光標記之第一發色團及第二發光標記之第二發色團，例如如本文針對使用經標記輔因子對經標記肽進行定序示出且描述(參見例如圖9)。在某些實施例中，FRET對可吸收第一光譜範圍內之激發能量且發射第二光譜範圍內之發光。

在一些實施例中，發光標記係指螢光團或染料。通常，發光標記包含芳族或雜芳族化合物且可為芘、蒽、萘、萘胺、吖啶、茋、吲哚、苯并吲哚、噁唑、咔唑、噻唑、苯并噻唑、苯并噁唑、啡啶、吩惡嗪、卟啉、喹啉、乙錠、苯甲醯胺、花青、羰花青、水楊酸鹽、鄰胺基苯甲酸酯、香豆素、螢光素(fluoroscein)、若丹明(rhodamine)、二苯并哌喃或其他類似化合物。

在一些實施例中，發光標記包含選自以下中之一或多者的染料：5/6-羧基若丹明(Carboxyrhodamine) 6G、5-羧基若丹明6G、6-羧基若丹明6G、6-TAMRA、Abberior® STAR 440SXP、Abberior® STAR 470SXP、Abberior® STAR 488、Abberior® STAR 512、Abberior® STAR 520SXP、Abberior® STAR 580、Abberior® STAR 600、Abberior® STAR 635、Abberior® STAR 635P、Abberior® STAR RED、Alexa Fluor® 350、Alexa Fluor® 405、Alexa Fluor® 430、Alexa Fluor® 480、Alexa Fluor® 488、Alexa Fluor® 514、Alexa Fluor® 532、Alexa Fluor® 546、Alexa Fluor® 555、Alexa Fluor® 568、Alexa Fluor® 594、Alexa Fluor® 610-X、Alexa Fluor® 633、Alexa Fluor® 647、Alexa Fluor® 660、Alexa Fluor® 680、Alexa Fluor® 700、Alexa Fluor® 750、Alexa Fluor® 790、AMCA、ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO 532、ATTO 542、ATTO 550、ATTO 565、ATTO 590、ATTO 610、ATTO 620、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO 665、ATTO 680、ATTO 700、ATTO 725、ATTO 740、ATTO Oxa12、ATTO Rho101、ATTO Rho11、ATTO Rho12、ATTO Rho13、ATTO Rho14、ATTO Rho3B、ATTO Rho6G、ATTO Thio12、BD Horizon™ V450、BODIPY® 493/501、BODIPY® 530/550、BODIPY® 558/568、BODIPY® 564/570、BODIPY® 576/589、BODIPY® 581/591、BODIPY® 630/650、BODIPY® 650/665、BODIPY® FL、BODIPY® FL-X、BODIPY® R6G、BODIPY® TMR、BODIPY® TR、CAL Fluor® Gold 540、CAL Fluor® Green 510、CAL Fluor® Orange 560、CAL Fluor® Red 590、CAL Fluor® Red 610、CAL Fluor® Red 615、CAL Fluor® Red 635、Cascade® Blue、CF™350、CF™405M、CF™405S、CF™488A、CF™514、CF™532、CF™543、CF™546、CF™555、CF™568、CF™594、CF™620R、CF™633、CF™633-V1、CF™640R、CF™640R-V1、CF™640R-V2、CF™660C、CF™660R、CF™680、CF™680R、CF™680R-V1、CF™750、CF™770、CF™790、Chromeo™ 642、Chromis 425N、Chromis 500N、Chromis 515N、Chromis 530N、Chromis 550A、Chromis 550C、Chromis 550Z、Chromis 560N、Chromis 570N、Chromis 577N、Chromis 600N、Chromis 630N、Chromis 645A、Chromis 645C、Chromis 645Z、Chromis 678A、Chromis 678C、Chromis 678Z、Chromis 770A、Chromis 770C、Chromis 800A、Chromis 800C、Chromis 830A、Chromis 830C、Cy®3、Cy®3.5、Cy®3B、Cy®5、Cy®5.5、Cy®7、DyLight® 350、DyLight® 405、DyLight® 415-Co1、DyLight® 425Q、DyLight® 485-LS、DyLight® 488、DyLight® 504Q、DyLight® 510-LS、DyLight® 515-LS、DyLight® 521-LS、DyLight® 530-R2、DyLight® 543Q、DyLight® 550、DyLight® 554-R0、DyLight® 554-R1、DyLight® 590-R2、DyLight® 594、DyLight® 610-B1、DyLight® 615-B2、DyLight® 633、DyLight® 633-B1、DyLight® 633-B2、DyLight® 650、DyLight® 655-B1、DyLight® 655-B2、DyLight® 655-B3、DyLight® 655-B4、DyLight® 662Q、DyLight® 675-B1、DyLight® 675-B2、DyLight® 675-B3、DyLight® 675-B4、DyLight® 679-C5、DyLight® 680、DyLight® 683Q、DyLight® 690-B1、DyLight® 690-B2、DyLight® 696Q、DyLight® 700-B1、DyLight® 700-B1、DyLight® 730-B1、DyLight® 730-B2、DyLight® 730-B3、DyLight® 730-B4、DyLight® 747、DyLight® 747-B1、DyLight® 747-B2、DyLight® 747-B3、DyLight® 747-B4、DyLight® 755、DyLight® 766Q、DyLight® 775-B2、DyLight® 775-B3、DyLight® 775-B4、DyLight® 780-B1、DyLight® 780-B2、DyLight® 780-B3、DyLight® 800、DyLight® 830-B2、Dyomics-350、Dyomics-350XL、Dyomics-360XL、Dyomics-370XL、Dyomics-375XL、Dyomics-380XL、Dyomics-390XL、Dyomics-405、Dyomics-415、Dyomics-430、Dyomics-431、Dyomics-478、Dyomics-480XL、Dyomics-481XL、Dyomics-485XL、Dyomics-490、Dyomics-495、Dyomics-505、Dyomics-510XL、Dyomics-511XL、Dyomics-520XL、Dyomics-521XL、Dyomics-530、Dyomics-547、Dyomics-547P1、Dyomics-548、Dyomics-549、Dyomics-549P1、Dyomics-550、Dyomics-554、Dyomics-555、Dyomics-556、Dyomics-560、Dyomics-590、Dyomics-591、Dyomics-594、Dyomics-601XL、Dyomics-605、Dyomics-610、Dyomics-615、Dyomics-630、Dyomics-631、Dyomics-632、Dyomics-633、Dyomics-634、Dyomics-635、Dyomics-636、Dyomics-647、Dyomics-647P1、Dyomics-648、Dyomics-648P1、Dyomics-649、Dyomics-649P1、Dyomics-650、Dyomics-651、Dyomics-652、Dyomics-654、Dyomics-675、Dyomics-676、Dyomics-677、Dyomics-678、Dyomics-679P1、Dyomics-680、Dyomics-681、Dyomics-682、Dyomics-700、Dyomics-701、Dyomics-703、Dyomics-704、Dyomics-730、Dyomics-731、Dyomics-732、Dyomics-734、Dyomics-749、Dyomics-749P1、Dyomics-750、Dyomics-751、Dyomics-752、Dyomics-754、Dyomics-776、Dyomics-777、Dyomics-778、Dyomics-780、Dyomics-781、Dyomics-782、Dyomics-800、Dyomics-831、eFluor® 450、曙紅(Eosin)、FITC、螢光素、HiLyte™ Fluor 405、HiLyte™ Fluor 488、HiLyte™ Fluor 532、HiLyte™ Fluor 555、HiLyte™ Fluor 594、HiLyte™ Fluor 647、HiLyte™ Fluor 680、HiLyte™ Fluor 750、IRDye® 680LT、IRDye® 750、IRDye® 800CW、JOE、LightCycler® 640R、LightCycler® Red 610、LightCycler® Red 640、LightCycler® Red 670、LightCycler® Red 705、麗絲胺若丹明B (Lissamine Rhodamine B)、萘并螢光素、Oregon Green® 488、Oregon Green® 514、Pacific Blue™、Pacific Green™、Pacific Orange™、PET、PF350、PF405、PF415、PF488、PF505、PF532、PF546、PF555P、PF568、PF594、PF610、PF633P、PF647P、Quasar® 570、Quasar® 670、Quasar® 705、若丹明123、若丹明6G、若丹明B、若丹明綠、若丹明綠-X、若丹明紅、ROX、Seta™ 375、Seta™ 470、Seta™ 555、Seta™ 632、Seta™ 633、Seta™ 650、Seta™ 660、Seta™ 670、Seta™ 680、Seta™ 700、Seta™ 750、Seta™ 780、Seta™ APC-780、Seta™ PerCP-680、Seta™ R-PE-670、Seta™ 646、SeTau 380、SeTau 425、SeTau 647、SeTau 405、Square 635、Square 650、Square 660、Square 672、Square 680、磺醯若丹明101、TAMRA、TET、Texas Red®、TMR、TRITC、Yakima Yellow™、Zenon®、Zy3、Zy5、Zy5.5及Zy7。發光

在一些態樣中，本申請案係關於基於發光標記之一或多種發光特性的多肽定序及/或鑑別。在一些實施例中，發光標記基於發光壽命、發光強度、亮度、吸收光譜、發射光譜、發光量子產率或其兩者或多於兩者之組合鑑別。在一些實施例中，複數種類型之發光標記可基於不同發光壽命、發光強度、亮度、吸收光譜、發射光譜、發光量子產率或其兩者或多於兩者之組合彼此區別。鑑別可意謂指派與發光標記締合之一種類型的胺基酸(例如，單一類型或一子集類型)之準確身分及/或數量，且亦可意謂相對於其他類型之胺基酸，指派多肽中之胺基酸位置。

在一些實施例中，藉由使發光標記曝露於獨立光脈衝系列且評估自標記發射之各光子的時序或其他特性偵測發光。在一些實施例中，將自標記依序發射之複數個光子的資訊彙總且進行評估，以鑑別標記且藉此鑑別相關聯類型之胺基酸。在一些實施例中，由自標記依序發射之複數個光子確定標記之發光壽命，且發光壽命可用於鑑別標記。在一些實施例中，由自標記依序發射之複數個光子確定標記之發光強度，且發光強度可用於鑑別標記。在一些實施例中，由自標記依序發射之複數個光子確定標記之發光壽命及發光強度，且發光壽命及發光強度可用於鑑別標記。

在本申請案之一些態樣中，使單一多肽分子曝露於複數個獨立光脈衝且偵測且分析發射光子系列。在一些實施例中，發射光子系列提供關於單一多肽分子之資訊，該單一多肽分子存在且歷經實驗時間在反應樣品中未改變。然而，在一些實施例中，發射光子系列提供關於一系列不同分子之資訊，該等分子在不同時間存在於反應樣品中(例如，隨著反應或過程進展)。藉助於實例而非限制，此類資訊可用於對經歷根據本申請案之化學或酶降解的多肽進行定序及/或鑑別。

在某些實施例中，發光標記吸收一個光子且在持續時間之後發射一個光子。在一些實施例中，可藉由量測持續時間確定或估計標記之發光壽命。在一些實施例中，可藉由量測多個脈衝事件及發射事件之複數個持續時間來確定或估計標記之發光壽命。在一些實施例中，可藉由量測持續時間，在複數種類型之標記的發光壽命中區分標記之發光壽命。在一些實施例中，可藉由量測多個脈衝事件及發射事件之複數個持續時間，在複數種類型之標記的發光壽命中區分標記之發光壽命。在某些實施例中，藉由確定或估計標記之發光壽命，在複數種類型之標記中鑑別或區分標記。在某些實施例中，藉由在複數種類型之標記的複數個發光壽命中區分標記之發光壽命，在複數種類型之標記中鑑別或區分標記。

確定發光標記之發光壽命可使用任何適合之方法(例如，藉由使用適合之技術量測壽命，或藉由確定發射之時間相依特徵)進行。在一些實施例中，確定一種標記之發光壽命包含相對於另一標記確定壽命。在一些實施例中，確定標記之發光壽命包含相對於參考確定壽命。在一些實施例中，確定標記之發光壽命包含量測壽命(例如，螢光壽命)。在一些實施例中，確定標記之發光壽命包含確定指示壽命之一或多種時間特徵。在一些實施例中，可基於相對於激發脈衝，貫穿一或多個時間閘控窗發生之複數個發射事件(例如，1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100個或更多個發射事件)的分佈，確定標記之發光壽命。舉例而言，可基於相對於激發脈衝量測之光子出現次數的分佈，區別標記之發光壽命與具有不同發光壽命之複數種標記。

應瞭解，發光標記之發光壽命指示在標記達到激發態之後發射之光子之時序，且標記可由指示光子時序之資訊區別。一些實施例可包括藉由量測與由標記發射之光子相關的時間，基於標記之發光壽命，區別標記與複數種標記。時間分佈可提供發光壽命之指示，發光壽命可由分佈確定。在一些實施例中，可基於時間分佈，諸如藉由將時間分佈與對應於已知標記之參考分佈進行比較，區分標記與複數種標記。在一些實施例中，發光壽命之值由時間分佈確定。

如本文所用，在一些實施例中，發光強度係指每單位時間發射光子的數目，該等光子由受脈衝激發能量之遞送激發之發光標記發射。在一些實施例中，發光強度係指所偵測到之每單位時間發射光子的數目，該等光子由受脈衝激發能量之遞送激發之發光標記發射，且由特定感測器或感測器組偵測。

如本文所用，在一些實施例中，亮度係指報告每發光標記平均發射強度之參數。因此，在一些實施例中，「發射強度」可用於大體上指代包含一或多種標記之組合物的亮度。在一些實施例中，標記之亮度等於其量子產率與消光係數之乘積。

如本文所用，在一些實施例中，發光量子產率係指引起發射事件，在給定波長下或給定光譜範圍內之激發事件的分率，且通常小於1。在一些實施例中，本文所描述之發光標記的發光量子產率在0與約0.001之間、在約0.001與約0.01之間、在約0.01與約0.1之間、在約0.1與約0.5之間、在約0.5與0.9之間或在約0.9與1之間。在一些實施例中，藉由確定或估計發光量子產率鑑別標記。

如本文所用，在一些實施例中，激發能量為來自光源之光脈衝。在一些實施例中，激發能量在可見光譜中。在一些實施例中，激發能量在紫外線光譜中。在一些實施例中，激發能量在紅外線光譜中。在一些實施例中，激發能量處於或接近於發光標記之最大吸收，複數個發射光子待自該發光標記偵測。在某些實施例中，激發能量在約500 nm與約700 nm之間(例如，在約500 nm與約600 nm之間、在約600 nm與約700 nm之間、在約500 nm與約550 nm之間、在約550 nm與約600 nm之間、在約600 nm與約650 nm之間或在約650 nm與約700 nm之間)。在某些實施例中，激發能量可為單色的或受限於光譜範圍。在一些實施例中，光譜範圍具有在約0.1 nm與約1 nm之間、在約1 nm與約2 nm之間或在約2 nm與約5 nm之間的範圍。在一些實施例中，光譜範圍具有在約5 nm與約10 nm之間、在約10 nm與約50 nm之間或在約50 nm與約100 nm之間的範圍。定序

本申請案之態樣係關於對生物聚合物，諸如多肽及蛋白質進行定序。如本文所用，參考多肽或蛋白質，「定序」、「序列確定」、「確定序列」及類似術語包括確定多肽或蛋白質之部分序列資訊以及全序列資訊。亦即，術語包括序列比較、指紋識別、機率性指紋識別及關於目標分子之類似層級的資訊，以及感興趣區域內目標分子之各胺基酸的明確鑑別及排序。在一些實施例中，術語包括鑑別多肽之單一胺基酸。在其他實施例中，鑑別多肽之多於一種胺基酸。如本文所用，在一些實施例中，參考胺基酸，「鑑別」、「確定身分」及類似術語包括確定胺基酸之明確身分，以及確定胺基酸之明確身分的機率。舉例而言，在一些實施例中，藉由確定胺基酸具有特定類型之機率(例如，0%至100%)，或藉由確定複數種特定類型中之每一者的機率，鑑別胺基酸。因此，在一些實施例中，如本文所用，術語「胺基酸序列」、「多肽序列」及「蛋白質序列」可以指多肽或蛋白質材料自身，且不限於在生物化學上表徵特定多肽或蛋白質之特定序列資訊(例如，表示胺基酸自一個末端至另一末端之次序的一連串字母)。

在一些實施例中，對多肽分子進行定序包含鑑別多肽分子中之至少兩個(例如，至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、至少10個、至少11個、至少12個、至少13個、至少14個、至少15個、至少16個、至少17個、至少18個、至少19個、至少20個、至少25個、至少30個、至少35個、至少40個、至少45個、至少50個、至少60個、至少70個、至少80個、至少90個、至少100個或更多個)胺基酸。在一些實施例中，至少兩個胺基酸為相鄰胺基酸。在一些實施例中，至少兩個胺基酸為非相鄰胺基酸。

在一些實施例中，對多肽分子進行定序包含鑑別多肽分子中所有胺基酸之少於100% (例如，少於99%、少於95%、少於90%、少於85%、少於80%、少於75%、少於70%、少於65%、少於60%、少於55%、少於50%、少於45%、少於40%、少於35%、少於30%、少於25%、少於20%、少於15%、少於10%、少於5%、少於1%或更少)。舉例而言，在一些實施例中，對多肽分子進行定序包含鑑別多肽分子中一種類型之胺基酸的少於100% (例如，鑑別多肽分子中一種類型之所有胺基酸的一部分)。在一些實施例中，對多肽分子進行定序包含鑑別多肽分子中各類型之胺基酸的少於100%。

在一些實施例中，對多肽分子進行定序包含鑑別多肽中至少1種、至少5種、至少10種、至少15種、至少20種、至少25種、至少30種、至少35種、至少40種、至少45種、至少50種、至少55種、至少60種、至少65種、至少70種、至少75種、至少80種、至少85種、至少90種、至少95種、至少100種或更多種類型之胺基酸。

在一些實施例中，本申請案提供用於藉由隨時間推移鑑別在多肽之末端處存在的胺基酸系列(例如，藉由迭代偵測及切割末端處之胺基酸)，對多肽進行定序之組合物及方法。在其他實施例中，本申請案提供用於藉由鑑別多肽之經標記胺基內容且與參考序列資料庫進行比較，對多肽進行定序之組合物及方法。

在一些實施例中，本申請案提供用於藉由對多肽之複數個片段進行定序，對多肽進行定序之組合物及方法。在一些實施例中，對多肽進行定序包含將複數個多肽片段之序列資訊組合，以鑑別及/或確定多肽之序列。在一些實施例中，組合序列資訊可由電腦硬體及軟體進行。本文所描述之方法可允許一組相關多肽，諸如生物體之全部蛋白質組經定序。在一些實施例中，根據本申請案之態樣，並行(例如，在單一晶片上)進行複數個單分子定序反應。舉例而言，在一些實施例中，複數個單分子定序反應在單一晶片上之單獨樣品孔中各自進行。

在一些實施例中，本文所提供之方法可用於對包含蛋白質之複雜混合物之樣品中的個別蛋白質進行定序及鑑別。在一些實施例中，本申請案提供唯一地鑑別蛋白質之複雜混合物中之個別蛋白質的方法。在一些實施例中，藉由確定蛋白質之部分胺基酸序列，在混合樣品中偵測個別蛋白質。在一些實施例中，蛋白質之部分胺基酸序列在大致5至50個胺基酸之連續延伸段內。

在不希望受任何特定理論束縛的情況下，咸信大部分人類蛋白質可使用不完全序列資訊，參考蛋白質組資料庫鑑別。舉例而言，人類蛋白質組之簡單建模已展示大致98%之蛋白質可藉由在6至40個胺基酸的延伸段內偵測僅四種類型之胺基酸唯一地鑑別(參見例如Swaminathan等人PLoS Comput Biol . 2015, 11(2):e1004080；及Yao等人Phys . Biol . 2015, 12(5):055003)。因此，可將蛋白質之複雜混合物降解(例如，以化學方式降解、以酶方式降解)成大致6至40個胺基酸之短多肽片段，且對此多肽庫進行定序將展現初始複雜混合物中存在之蛋白質中之各者的身分及豐度。用於選擇性胺基酸標記及藉由確定部分序列資訊鑑別多肽之組合物及方法詳細描述於2015年9月15日申請之標題為「單分子肽定序(SINGLE MOLECULE PEPTIDE SEQUENCING)」之美國專利申請案第15/510,962號中，該申請案以全文引用之方式併入。

實施例能夠以高準確度對單一多肽分子進行定序，該準確度諸如至少約50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%、99.99%、99.999%或99.9999%之準確度。在一些實施例中，單分子定序中所使用之目標分子為固定至固體載體之表面的多肽，該表面諸如樣品孔之底表面或側壁表面。樣品孔亦可含有根據本申請案之定序反應所需的任何其他試劑，諸如一或多種適合之緩衝液、輔因子、經標記親和試劑及酶(例如，催化活性或無催化活性外肽酶，其可經發光標記之或未經標記)。

如上文所描述，在一些實施例中，根據本申請案之定序包含藉由確定胺基酸具有特定類型之機率鑑別胺基酸。習知蛋白質鑑別系統需要鑑別多肽中之各胺基酸以鑑別多肽。然而，難以準確鑑別多肽中之各胺基酸。舉例而言，自第一識別分子與第一胺基酸締合之相互作用收集之資料與自第二識別分子與第二胺基酸締合之相互作用收集之資料的差異可能不足以區分兩種胺基酸。在一些實施例中，根據本申請案之定序藉由使用蛋白質鑑別系統避免此問題，該蛋白質鑑別系統不同於習知蛋白質鑑別系統，不需要(但不排除)鑑別蛋白質中之各胺基酸。

因此，在一些實施例中，根據本申請案之定序可使用蛋白質鑑別系統進行，該系統使用機器學習技術來鑑別蛋白質。在一些實施例中，系統藉由以下操作：(1)使用即時蛋白質定序裝置收集關於蛋白質之多肽的資料；(2)使用機器學習模型及所收集之資料來鑑別各別位置處某些胺基酸為多肽之一部分的機率；及(3)使用所鑑別之機率作為「機率性指紋」來鑑別蛋白質。在一些實施例中，可使用選擇性結合胺基酸之試劑獲得關於蛋白質之多肽的資料。作為一實例，試劑及/或胺基酸可用回應於激發能量之施加發射光的發光標記來標記。在此實例中，蛋白質定序裝置可在試劑與樣品中之胺基酸的結合相互作用期間將激發能量施加至蛋白質(例如，多肽)之樣品。在一些實施例中，定序裝置中之一或多個感測器(例如，光偵測器、電感測器及/或任何其他適合類型之感測器)可偵測結合相互作用。繼而，可將自所偵測到之光發射收集及/或導出之資料提供至機器學習模型。機器學習模型及相關系統及方法詳細描述於2019年6月12日申請之標題為「啟用機器學習之蛋白質鑑別(MACHINE LEARNING ENABLED PROTEIN IDENTIFICATION)」之美國臨時專利申請案第62/860,750號，該申請案以全文引用之方式併入。

根據本申請案之定序在一些態樣中可涉及將多肽固定於基板(例如，固體載體，例如晶片，例如如本文所描述之積體裝置)的表面上。在一些實施例中，可將多肽固定於基板上之樣品孔之表面上(例如，樣品孔之底表面上)。在一些實施例中，多肽之N末端胺基酸經固定(例如，連接至表面)。在一些實施例中，多肽之C末端胺基酸經固定(例如，連接至表面)。在一些實施例中，一或多種非末端胺基酸經固定(例如，連接至表面)。(多種)固定胺基酸可使用例如如本申請案中所描述之任何適合之共價或非共價鍵聯連接。在一些實施例中，將複數種多肽連接至例如基板上之樣品孔陣列中之複數個樣品孔(例如，其中一種多肽連接至各樣品孔之表面，例如底表面)。

根據本申請案之定序在一些態樣中可使用准許單分子分析之系統進行。系統可包括積體裝置及經組態以與積體裝置介接之儀器。積體裝置可包括像素陣列，其中個別像素包括樣品孔及至少一個光偵測器。積體裝置之樣品孔可在積體裝置之表面上或通過積體裝置之表面形成，且經組態以接納置放於積體裝置之表面上的樣品。集合地，樣品孔可視為樣品孔陣列。複數個樣品孔可具有適合之大小及形狀，使得樣品孔之至少一部分接納單一樣品(例如，單分子，諸如多肽)。在一些實施例中，樣品孔內樣品之數目可分佈於積體裝置之樣品孔當中，使得一些樣品孔含有一種樣品，而其他樣品孔含有零、兩種或更多種樣品。

激發光自在積體裝置外部之一或多種光源提供至積體裝置。積體裝置之光學組件可接收來自光源之激發光，且將光朝積體裝置之樣品孔陣列導向，且照射樣品孔內之照射區域。在一些實施例中，樣品孔可具有允許樣品接近樣品孔之表面保留的組態，其可使遞送激發光至樣品及自樣品偵測發射光容易。定位於照射區域內之樣品可回應於由激發光照射發射發射光。舉例而言，樣品可經標記螢光標記物標記，其回應於經由激發光照射達成激發態發射光。隨後可由對應於具有所分析樣品之樣品孔的像素內之一或多個光偵測器偵測由樣品發射之發射光。當遍及樣品孔陣列(根據一些實施例，其範圍可在大致10,000個像素至1,000,000個像素之間的數目內)進行時，多個樣品可並行分析。

積體裝置可包括用於接收激發光且將激發光在樣品孔陣列當中導向之光學系統。光學系統可包括一或多個光柵耦合器，其經組態以將激發光耦合至積體裝置，且將激發光導向其他光學組件。光學系統可包括將激發光自光柵耦合器朝樣品孔陣列導向之光學組件。此類光學組件可包括光分路器(optical splitter)、光合路器(optical combiner)及波導。在一些實施例中，一或多個光分路器可耦合來自光柵耦合器之光，且將激發光遞送至波導中之至少一者。根據一些實施例，光分路器可具有一種組態，其允許激發光之遞送遍及所有波導實質上均一，使得波導中之各者接收實質上相似量之激發光。此類實施例可藉由提高由積體裝置之樣品孔接收之激發光的均一性，提高積體裝置之效能。積體裝置中包括的適用於例如將激發光耦合至樣品孔及/或將發射光導向至光偵測器之組件的實例描述於2015年8月7日申請之標題為「用於探測、偵測及分析分子之積體裝置(INTEGRATED DEVICE FOR PROBING, DETECTING AND ANALYZING MOLECULES)」之美國專利申請案第14/821,688號，及2014年11月17日申請之標題為「用於探測、偵測及分析分子之具有外部光源的積體裝置(INTEGRATED DEVICE WITH EXTERNAL LIGHT SOURCE FOR PROBING, DETECTING, AND ANALYZING MOLECULES)」之美國專利申請案第號14/543,865中，該等申請案均以全文引用之方式併入。可實施於積體裝置中之適合光柵耦合器及波導的實例描述於2017年12月15日申請之標題為「光學耦合器及波導系統(OPTICAL COUPLER AND WAVEGUIDE SYSTEM)」之美國專利申請案第15/844,403號中，該申請案以全文引用之方式併入。

額外光子結構可定位於樣品孔與光偵測器之間，且經組態以減少或阻止激發光到達光偵測器，否則其可在偵測發射光時促成信號雜訊。在一些實施例中，可充當積體裝置之電路系統的金屬層亦可充當空間濾光器。適合之光子結構的實例可包括光譜濾光器、偏振濾光器及空間濾光器，且描述於2018年7月23日申請之標題為「光學排斥光子結構(OPTICAL REJECTION PHOTONIC STRUCTURES)」之美國專利申請案第16/042,968號中，該申請案以全文引用之方式併入。

位於積體裝置外之組件可用於將激發源向積體裝置定位且對準。此類組件可包括光學組件，其包括透鏡、反射鏡、稜鏡、窗、孔口、衰減器及/或光纖。可在儀器中包括額外機械組件以允許控制一或多種對準組件。此類機械組件可包括致動器、步進馬達及/或把手。適合之激發源及對準機構之實例描述於2016年5月20日申請之標題為「脈衝雷射及系統(PULSED LASER AND SYSTEM)」之美國專利申請案第號15/161,088中，該申請案以全文引用之方式併入。光束引導模組之另一實例描述於2017年12月14日申請之標題為「緊湊光束整形及引導組合件(COMPACT BEAM SHAPING AND STEERING ASSEMBLY)」之美國專利申請案第15/842,720號中，該申請案以引用之方式併入本文中。適合之激發源的額外實例描述於2015年8月7日申請之標題為「用於探測、偵測及分析分子之積體裝置(INTEGRATED DEVICE FOR PROBING, DETECTING AND ANALYZING MOLECULES)」之美國專利申請案第14/821,688號中，該申請案以全文引用之方式併入。

伴隨積體裝置之個別像素定位之(多個)光偵測器可經組態及定位，以偵測來自像素之對應樣品孔的發射光。適合之光偵測器的實例描述於2015年8月7日申請之標題為「用於所接收之光子之時間分組的積體裝置(INTEGRATED DEVICE FOR TEMPORAL BINNING OF RECEIVED PHOTONS)」之美國專利申請案第14/821,656號中，該申請案以全文引用之方式併入。在一些實施例中，樣品孔及其各別(多個)光偵測器可沿公共軸對準。以此方式，(多個)光偵測器可與像素內之樣品孔重疊。

所偵測到之發射光的特徵可為鑑別與發射光相關之標記物提供指示。此類特徵可包括任何適合類型之特徵，包括由光偵測器偵測之光子到達時間、光偵測器隨時間推移所累積之光子的量及/或遍及兩個或更多個光偵測器之光子分佈。在一些實施例中，光偵測器可具有一種組態，其允許偵測與樣品之發射光相關的一或多種時序特徵(例如，發光壽命)。光偵測器可偵測激發光脈衝通過積體裝置傳播之後光子到達時間之分佈，且到達時間之分佈可提供樣品之發射光之時序特徵的指示(例如，發光壽命之代理)。在一些實施例中，一或多個光偵測器提供由標記物發射之發射光之機率(例如，發光強度)的指示。在一些實施例中，複數個光偵測器可經大小設定及佈置，以捕獲發射光之空間分佈。隨後可使用來自一或多個光偵測器之輸出信號以自複數種標記物當中區別標記物，其中該複數種標記物可用於鑑別樣品內之樣品。在一些實施例中，樣品可由多個激發能量激發，且由樣品回應於多個激發能量發射之發射光的發射光及/或時序特徵可區別標記物與複數種標記物。

在操作時，藉由使用激發光激發孔內樣品中之一些或全部，且用光偵測器偵測來自樣品發射之信號進行樣品孔內之樣品的並行分析。來自樣品之發射光可由對應光偵測器偵測且轉換為至少一個電信號。電信號可沿積體裝置之電路系統中之導線傳輸，導線可連接至與積體裝置介接之儀器。電信號隨後可經處理及/或分析。處理或分析電信號可在位於儀器上或儀器外之適合計算裝置上進行。

儀器可包括用於控制儀器及/或積體裝置之操作的使用者介面。使用者介面可經組態以允許使用者將資訊輸入至儀器中，諸如用於控制儀器之功能的命令及/或設置。在一些實施例中，使用者介面可包括按鈕、開關、撥號盤及用於話音命令之麥克風。使用者介面可允許使用者接收對儀器及/或積體裝置之效能的反饋，諸如正確對準及/或由來自積體裝置上之光偵測器之讀出信號獲得的資訊。在一些實施例中，使用者介面可使用揚聲器以提供可聽反饋來提供反饋。在一些實施例中，使用者介面可包括用於向使用者提供視覺反饋之指示燈及/或顯示螢幕。

在一些實施例中，儀器可包括經組態以與計算裝置連接之電腦介面。電腦介面可為USB介面、FireWire介面或任何其他適合之電腦介面。計算裝置可為任何通用電腦，諸如膝上型電腦或桌上型電腦。在一些實施例中，計算裝置可為伺服器(例如，基於雲端之伺服器)，其可經由適合之電腦介面經一無線網路接入。電腦介面可使儀器與計算裝置之間的資訊通信便利。可將用於控制及/或組態儀器之輸入資訊提供至計算裝置，且經電腦介面傳輸至儀器。計算裝置可經由電腦介面接收由儀器產生之輸出資訊。輸出資訊可包括關於儀器效能、積體裝置效能之反饋及/或由光偵測器之讀出信號產生的資料。

在一些實施例中，儀器可包括處理裝置，其經組態以分析自積體裝置之一或多個光偵測器接收到之資料及/或將控制信號傳輸至(多個)激發源。在一些實施例中，處理裝置可包含通用處理器、專門適配之處理器(例如，中央處理單元(CPU) (諸如一或多種微處理器或微控制器核心)、場可程式化閘陣列(FPGA)、特殊應用積體電路(ASIC)、定製積體電路、數位信號處理器(DSP)或其組合)。在一些實施例中，可由儀器之處理裝置及外部計算裝置兩者進行對來自一或多個光偵測器之資料的處理。在其他實施例中，外部計算裝置可省略，且可由積體裝置之處理裝置單獨進行對來自一或多個光偵測器之資料的處理。

根據一些實施例，經組態以基於發光發射特徵分析樣品之儀器可偵測不同發光分子之間的發光壽命及/或強度之差異，及/或不同環境中相同發光分子之壽命及/或強度之間的差異。諸位發明人已認識到且瞭解，發光發射壽命之差異可用於在存在或不存在不同發光分子之間進行辨別及/或在發光分子經歷之不同環境或條件之間進行辨別。在一些情況下，基於壽命(而非例如發射波長)辨別發光分子可簡化系統之態樣。作為一實例，在基於基於壽命辨別發光分子時，可減少區分波長之光學器件(諸如波長濾光器、各波長之專用偵測器、不同波長下之專用脈衝光學源及/或繞射光學器件)的數目或除去該等區分波長之光學裝置。在一些情況下，在單一特徵波長下操作之單一脈衝光學源可用於激發不同發光分子，該等發光分子在光譜之相同波長範圍內發射但具有可量測之不同壽命。使用單一脈衝光學源，而非在不同波長下操作之多個源，以激發且辨別在相同波長區域內發射之不同發光分子的分析系統可較易於操作及維護、較緊湊且可以較低成本製造。

儘管基於發光壽命分析之分析系統可具有某些益處，但由分析系統獲得的資訊之量及/或偵測準確度可藉由允許額外偵測技術而增加。舉例而言，系統之一些實施例可另外經組態以基於發光波長及/或發光強度辨別樣品之一或多個特性。在一些實施方案中，可另外或替代地使用發光強度區別不同發光標記。舉例而言，儘管一些發光標記之衰變速率可能類似，但其可以顯著不同強度發射或其激發機率具有顯著差異(例如，至少約35%之差異)。藉由將分組信號與所量測之激發光參比，或許有可能基於強度位準區別不同發光標記。

根據一些實施例，可用光偵測器區別不同發光壽命，該光偵測器經組態以對發光標記激發之後的發光發射事件進行時間分組。時間分組可發生在光偵測器之單一電荷積聚循環期間。電荷積聚循環為讀出事件之間的間隔，在此期間，光生載流子積聚於時間分組光偵測器之倉中。時間分組光偵測器之實例描述於2015年8月7日申請之標題為「用於對所接收之光子進行時間分組的積體裝置(INTEGRATED DEVICE FOR TEMPORAL BINNING OF RECEIVED PHOTONS)」之美國專利申請案第14/821,656號中，該申請案以引用之方式併入本文中。在一些實施例中，時間分組光偵測器可在光子吸收/載流子產生區域中產生電荷載流子，且將電荷載流子直接轉移至電荷載流子儲存區域中之儲倉中。在此類實施例中，時間分組光偵測器可不包括載流子行進/捕獲區域。此類時間分組光偵測器可稱作「直接分組像素」。時間分組光偵測器(包括直接分組像素)之實例描述於2017年12月22日申請之標題為「具有直接分組像素之積體光偵測器(INTEGRATED PHOTODETECTOR WITH DIRECT BINNING PIXEL)」之美國專利申請案第15/852,571號中，該申請案以引用之方式併入本文中。

在一些實施例中，不同數目個相同類型之螢光團可鍵聯至樣品中之不同試劑，使得各試劑可基於發光強度鑑別。舉例而言，兩個螢光團可鍵聯至第一經標記親和試劑，且四個或多於四個螢光團可鍵聯至第二經標記親和試劑。因為螢光團之數目不同，所以可存在與不同親和試劑相關之不同激發及螢光團發射機率。舉例而言，在信號積聚間隔期間可存在第二經標記親和試劑之更多發射事件，使得分組之表觀強度顯著高於第一經標記親和試劑之表觀強度。

諸位發明人已認識到且瞭解，基於螢光團衰變速率及/或螢光團強度區別核苷酸或任何其他生物或化學樣品可使得光學激發及偵測系統能夠簡化。舉例而言，可用單一波長源(例如，產生一種特徵波長之源而非多個源或在多個不同特徵波長下操作之源)進行光學激發。另外，偵測系統中可不需要區分波長之光學器件及濾光器。此外，各樣品孔可使用單一光偵測器以偵測來自不同螢光團之發射。片語「特徵波長」或「波長」用以指有限輻射頻寬內之中心或主導波長(例如，由脈衝光學源輸出之20 nm頻寬內之中心或峰值波長)。在一些情況下，「特徵波長」或「波長」可用以指藉由源輸出之總輻射頻寬內之峰值波長。 計算技術

本申請案之態樣係關於用於分析藉由本文所描述之多肽定序技術產生之資料的計算技術。如上文例如結合圖1A及圖1B所論述，藉由使用此等定序技術產生之資料可包括信號脈衝系列，其指示胺基酸識別分子與所定序之多肽之末端處暴露的胺基酸締合之情況。隨著降解過程繼續移除連續胺基酸，隨時間推移視當前處於末端處之胺基酸之類型而定，信號脈衝系列可具有變化之一或多種特徵(例如，脈衝持續時間、脈衝間持續時間、幅度之變化)。所得信號跡線可包括特徵圖案，其由與各別胺基酸相關之變化之一或多種特徵引起。本文所描述之計算技術可被實施為使用此等定序技術分析所獲得之此類資料以鑑別胺基酸序列的一部分。

一些實施例可涉及在多肽降解過程中獲得資料、分析資料以確定對應於在降解過程中在多肽之末端處依序暴露之胺基酸的資料之部分及輸出表示多肽之胺基酸序列。圖11為用於藉由分析使用本文所描述之多肽定序技術獲得之資料，鑑別胺基酸序列之說明性處理管線1100 的圖解。如圖11中所展示，分析定序資料1102 可涉及使用締合事件鑑別技術1104 及胺基酸鑑別技術1106 來輸出(多種)胺基酸序列1108 。

如本文所論述，可在多肽降解過程中獲得定序資料1102 。在一些實施例中，定序資料1102 指示在降解過程中多肽之末端處之胺基酸身分。在一些實施例中，定序資料1102 指示在降解過程中由在末端處結合至不同類型之末端胺基酸的一或多種胺基酸識別分子產生之信號。例示性定序資料展示於圖1A及圖1B中，其如上文所論述。

視信號在降解過程中如何產生而定，定序資料1102 可指示一或多種不同類型之信號。在一些實施例中，定序資料1102 指示在降解過程中產生之發光信號。舉例而言，發光標記可用於標記胺基酸識別分子，且由發光標記發射之發光可隨著胺基酸識別分子與特定胺基酸締合，產生發光信號而偵測到。在一些實施例中，定序資料1102 指示在降解過程中產生之電信號。舉例而言，所定序之多肽分子可固定至奈米孔，且電信號(例如，電導之變化)可隨著胺基酸識別分子與特定胺基酸締合而偵測到。

一些實施例涉及分析定序資料1102 ，以確定對應於在降解過程中在多肽之末端處依序暴露之胺基酸的定序資料1102 之部分。如圖11中所展示，締合事件鑑別技術1104 可存取定序資料1102 ，且分析定序資料以鑑別對應於締合事件的定序資料1102 之部分。締合事件可對應於資料中之特徵圖案，諸如圖1B中所展示之CP₁ 及CP₂ 。在一些實施例中，締合事件鑑別技術1104 可涉及偵測切割事件系列，及確定連續切割事件之間的定序資料1102 之部分。作為一實例，可偵測圖1B中所展示之CP₁ 與CP₂ 之間的切割事件，使得對應於CP₁ 之資料之第一部分可鑑別為第一締合事件，且對應CP₂ 之資料之第二部分可鑑別為第二締合事件。

一些實施例涉及針對定序資料1102 所確定的部分中之一或多者鑑別一種類型之胺基酸。如圖11中所展示，胺基酸鑑別技術1106 可用於針對藉由締合事件鑑別技術1104 鑑別之締合事件中之一或多者，確定一種類型之胺基酸。在一些實施例中，藉由締合事件鑑別技術1104 鑑別之資料之個別部分可包括脈衝圖案，且胺基酸鑑別技術1106 可針對該等部分中之一或多者，基於其各別脈衝圖案確定一種類型之胺基酸。參見圖1B，胺基酸鑑別技術1106 可鑑別CP₁ 之第一類型之胺基酸，及CP₂ 之第二類型之胺基酸。在一些實施例中，確定胺基酸之類型可包括在資料超過臨限值時，鑑別資料之一部分(諸如使用締合事件鑑別技術1104 鑑別之一部分)內的時間量，及將該時間量與資料之該部分的持續時間進行比較。舉例而言，鑑別CP₁ 之一種類型之胺基酸可包括確定CP₁ 內信號超過臨限值時之時間量，諸如時段pd ，其中信號在M_L 上方，及將其與CP₁ 之總持續時間進行比較。在一些實施例中，確定胺基酸之類型可涉及針對藉由締合事件鑑別技術1102 鑑別之資料之一或多個部分，鑑別一或多個脈衝持續時間。舉例而言，鑑別CP₁ 之一種類型之胺基酸可包括確定CP₁ 之脈衝持續時間，諸如時段pd 。在一些實施例中，確定胺基酸之類型可涉及針對使用締合事件鑑別技術1104 鑑別之資料之一或多個部分，鑑別一或多個脈衝間持續時間。舉例而言，鑑別CP₁ 之一種類型之胺基酸可包括鑑別脈衝間持續時間，諸如ipd 。

藉由鑑別定序資料1102 之連續部分的一種類型之胺基酸，胺基酸鑑別技術1106 可輸出表示多肽之(多種)胺基酸序列1108 。在一些實施例中，胺基酸序列包括對應於使用締合事件鑑別技術1104 鑑別之資料之部分的胺基酸系列。

圖12為根據本文所描述之技術的一些實施例，用於確定多肽分子之胺基酸序列的說明性過程1200 之流程圖。過程1200 可在任何適合之(多種)計算裝置(例如，單一計算裝置、共置於單一實體位置中或位於遠離彼此之多個實體位置中之多個計算裝置、雲端計算系統之一或多個計算裝置部分等)上進行，因為本文所描述之技術之態樣在此態樣中不受限制。在一些實施例中，締合事件鑑別技術1104 及胺基酸鑑別技術1106 可進行過程1200 中之一些或全部以確定(多種)胺基酸序列。

過程1200 在操作1202 處開始，其涉及使單一多肽分子與一或多種末端胺基酸識別分子接觸。接下來，過程1200 繼續進行至操作1104 ，其涉及偵測信號脈衝系列，該系列指示一或多種末端胺基酸識別分子與單一多肽降解時在單一多肽之末端處暴露之連續胺基酸的締合。脈衝系列可允許對單一多肽分子進行定序，諸如藉由使用締合事件鑑別技術1104 及胺基酸鑑別技術1106 。

在一些實施例中，過程1200 可包括操作1206 ，其涉及基於信號脈衝系列中之第一特徵圖案鑑別單一多肽分子中之第一類型之胺基酸，諸如藉由使用胺基酸鑑別技術1106 。

圖13為根據本文所描述之技術的一些實施例，用於確定表示多肽之胺基酸序列的說明性過程1300 之流程圖。過程1300 可在任何適合之(多種)計算裝置(例如，單一計算裝置、共置於單一實體位置中或位於遠離彼此之多個實體位置中之多個計算裝置、雲端計算系統之一或多個計算裝置部分等)上進行，因為本文所描述之技術之態樣在此態樣中不受限制。在一些實施例中，締合事件鑑別技術1104 及胺基酸鑑別技術1106 可進行過程1300 中之一些或全部以確定(多種)胺基酸序列。

過程1300 在操作1302 處開始，其中獲得多肽降解過程中之資料。在一些實施例中，資料指示在降解過程中多肽之末端處的胺基酸身分。在一些實施例中，資料指示在降解過程中由在末端處結合至不同類型之末端胺基酸的一或多種胺基酸識別分子產生之信號。在一些實施例中，資料指示在降解過程中產生之發光信號。在一些實施例中，資料指示在降解過程中產生之電信號。

接下來，過程1300 繼續進行至操作1304 ，其中分析資料以確定對應於在降解過程中在多肽之末端處依序暴露之胺基酸的資料之部分，諸如藉由使用締合事件鑑別技術1104 及胺基酸鑑別技術1106 。在一些實施例中，分析資料進一步包含偵測切割事件系列，及確定連續切割事件之間的資料之部分，諸如藉由使用締合事件鑑別技術1104 。

在一些實施例中，分析資料進一步包含針對個別部分中之各者確定一種類型之胺基酸，諸如藉由使用胺基酸鑑別技術1106 。在一些實施例中，個別部分中之各者包含脈衝圖案，且分析資料進一步包含針對該等部分中之一或多者，基於其各別脈衝圖案確定一種類型之胺基酸。在一些實施例中，確定胺基酸之類型進一步包含在資料超過臨限值時，鑑別一部分內之時間量，及將該時間量與該部分之持續時間進行比較。在一些實施例中，確定胺基酸之類型進一步包含針對一或多個部分中之各者，鑑別至少一個脈衝持續時間。在一些實施例中，確定胺基酸之類型進一步包含針對一或多個部分中之各者，鑑別至少一個脈衝間持續時間。

接下來，過程1300 繼續進行至操作1306 ，其中輸出表示多肽之胺基酸序列，諸如經由使用者介面。在一些實施例中，胺基酸序列包括對應於該等部分之胺基酸系列。

圖14中展示可與本文所描述之技術的實施例中之任一者結合使用的電腦系統1400 之說明性實施方案。電腦系統1400 包括一或多種處理器1410 及一或多種製品，其包含非暫時性電腦可讀儲存媒體(例如，記憶體1420 及一或多種非揮發性儲存媒體1430 )。處理器1410 可以任何適合方式控制向記憶體1420 及非揮發性儲存裝置1430 寫入資料及自其中讀取資料，因為本文所描述之技術之態樣在此態樣中不受限制。為了執行本文所描述之功能中之任一者，處理器1410 可執行儲存於一或多個非暫時性電腦可讀儲存媒體(例如，記憶體1420 )中之一或多種處理器可執行指令，其可充當儲存用於由處理器1410 執行之處理器可執行指令的非暫時性電腦可讀儲存媒體。

計算裝置1400 亦可包括網路輸入/輸出(I/O)介面1440 ，計算裝置可經由該介面與其他計算裝置通信(例如，在網路上)；且亦可包括一或多個使用者I/O介面1450 ，計算裝置可經由該介面提供向使用者之輸出及接收來自使用者之輸入。使用者I/O介面可包括諸如鍵盤、滑鼠、麥克風、顯示裝置(例如，監視器或觸控式螢幕)、揚聲器、相機之裝置及/或各種其他類型之I/O裝置。

上述實施例可以眾多方法中之任一者來實施。舉例而言，實施例可使用硬體、軟體或其組合實施。當實施於軟體中時，軟體程式碼可在任何適合處理器(例如，微處理器)或處理器集合(不管在單一計算裝置中提供或分佈於多個計算裝置當中)上執行。應瞭解，執行上文所描述之功能的任何組件或組件之集合可大體上視為控制上述功能之一或多個控制器。可以眾多方式實施一或多種控制器，諸如藉由專用硬體，或藉由使用微碼或軟體以執行上文所概述之功能的經程式化的通用硬體(例如，一或多種處理器)。

在此態樣中，應瞭解，本文所描述之實施例的一種實施方案包含編碼有電腦程式(亦即，複數個可執行指令)之至少一種電腦可讀儲存媒體(例如，RAM、ROM、EEPROM、快閃記憶體或其他記憶體技術、CD-ROM、數位多功能光碟(DVD)或其他光碟儲存器、匣式磁帶、磁帶、磁碟儲存器或其他磁儲存裝置，或其他有形非暫時性電腦可讀儲存媒體)，當在一或多種處理器上執行時，該電腦程式執行一或多個實施例之上述功能。電腦可讀媒體可為可輸送的，使得儲存於其上之程式可載入於任何計算裝置上以實施本文中所論述之技術的態樣。另外，應瞭解，對在執行時執行上述功能中之任一者的電腦程式之參考不限於在主電腦上執行的應用程式。實際上，術語電腦程式及軟體在本文中以通用含義使用，以指代可用於程式化一或多種處理器以實施本文所論述之技術的態樣之任何類型的電腦程式碼(例如，應用軟體、韌體、微碼或任何其他形式之電腦指令)。實例實例 1 . 藉由化學切割進行之艾德曼降解

提供大致3個至大致30個胺基酸(n =3-30)的經表面連接之寡肽，其中胺基酸殘基R₁ 至R₃ 可為常見的20種胺基酸中之任一者或經內源性修飾之胺基酸(例如，藉由轉譯後修飾來修飾)。在異硫氰酸酯N末端反應步驟 1 中，將異硫氰酸酯X-NCS添加至含有經表面連接之寡肽的容器中，其中X係苯基(Ph)、4-NO₂ Ph、4-SO₃ Ph、萘基、苄基、烷基或其衍生物。步驟 1 在以下條件下進行以獲得X-NCS衍生化N末端胺基酸：水性緩衝液pH 4-10、MeOH或EtOH或IPA醇共溶劑、三烷基胺於有機溶劑(DCM、THF、MeCN、DMF及其類似物)中，20℃至50℃。在硫脲切割反應步驟 2 中，將酸或鹼添加至含有X-NCS衍生化N末端胺基酸之容器中，其中酸為呈純或水溶液形式之乙酸、甲酸、三氯乙酸、三氟乙酸、磷酸或氫氯酸，或其中鹼為三烷基胺或經緩衝三烷基胺(例如，Et₃ NH⁺ AcO^- )。步驟 2 在以下條件下進行以獲得n -1寡肽及硫乙內醯脲副產物：純酸或含任何比率之水性/有機共溶劑，20℃至50℃。實例 2 . 用於肽表面固定之增溶連接子

試圖提高寡肽在水性緩衝液中之溶解度，確定可將肽片段與寡核苷酸連接子綴合，以同時提高水溶解度且提供用於在單分子層級上進行肽之表面固定的官能性部分。合成不同肽-連接子綴合物，其具有圖15A中針對肽-DNA綴合物及肽-PEG綴合物描繪之示例性結構。對於所評估之不同肽-連接子綴合物中之各者，觀測到連接子綴合極大地提高肽在水溶液中之溶解度。

針對肽N-末端處由N末端胺肽酶進行之胺基酸切割評估肽-連接子綴合物(表6，以下)。表6.肽-連接子綴合物之末端胺基酸切割。

條目	肽	SEQ ID NO.	類別	連接子	由大鼠APN切割	由PIP切割
1	KF	70	正電	寡核苷酸	否
2	KKMKKM{LYS(N3)}	71	正電	寡核苷酸	否
3	KKMKKM{LYS(N3)}	71	正電	寡核苷酸-PEG	否
4	KKMKKM{LYS(N3)}	71	正電	PEG4	是
5	DDMDDM{LYS(N3)}	72	負電	寡核苷酸	是
6	FFMFFM{LYS(N3)}	73	芳族	寡核苷酸	是
7	AAMAAM{LYS(N3)}	74	疏水	寡核苷酸	是
8	FPFPFP{LYS(N3)}	75	芳族	寡核苷酸		是
9	DPDPDP{LYS(N3)}	76	負電	寡核苷酸		是
10	KPKPKP{LYS(N3)}	77	正電	寡核苷酸		否
11	KPKPKP{LYS(N3)}	77	正電	PEG4		是

將表6中所展示之肽-連接子綴合物與脯胺酸亞胺基肽酶(「PIP」)或大鼠胺肽酶N (「大鼠APN」)一起培育，且藉由LCMS監測肽切割。圖15B中展示展現來自表6之條目5之切割的LCMS之實例。所有其他切割反應以類似方式量測。如表6中所展示，儘管帶正電之肽-DNA綴合物(「寡核苷酸」及「寡核苷酸-PEG連接子))不由所測試之胺肽酶切割，但具有DNA寡核苷酸連接子之其他綴合物類別(帶負電、芳族、疏水性)經切割。相比之下，展示帶正電之肽-PEG綴合物由胺基肽酶中之至少一者切割。

使用經標記肽-連接子綴合物，展示具有不同組成之肽可固定至個別樣品孔表面，以便進行單分子分析。對於此等實驗，用染料(例如，如圖15A中針對肽-DNA綴合物描繪)標記DNA連接子，且藉由染料螢光量測不同肽-DNA綴合物向個別樣品孔中之負載。圖15C中展示示例性負載實驗。藉由量測經標記肽-DNA綴合物(50 pM)之螢光發射，確定晶片上至少18%之樣品孔以每樣品孔單一佔有負載有經表面固定之綴合物。此等實驗展現與非綴合肽對應物相比，肽-連接子綴合物顯示提高之水溶解度；綴合連接子不阻止肽之末端胺基酸由不同胺肽酶切割；及具有不同組成之肽-連接子綴合物可在單分子層級上固定至晶片表面。實例 3 . 多肽受質之外肽酶切割

測試各種胺肽酶之切割能力。表7中展示一組切割分析實驗之條件及結果，包括肽受質濃度、酶濃度、緩衝液條件、溫度及培育時間。使用高效液相層析(HPLC)分析肽受質由指定酶切割。表7中之「HPLC分析轉化率」值指示轉化為切割產物之肽受質的百分比。為了確定「HPLC分析轉化率」值，製備含有相同起始肽濃度之兩種溶液。一種溶液經歷酶消化，而另一溶液不含任何酶，但用當量用於儲存酶之緩衝液稀釋。反應在指定時間淬滅。藉由將對在酶消化之後剩餘之起始材料的HPLC獲得之峰的面積除以未消化肽之對照溶液的峰面積，且隨後將此比率乘以100，確定轉化為產物的反應物之量。在表7中，「NH2」指示胺基，「yPIP」係指鼠疫耶氏桿菌脯胺酸亞胺基肽酶，「NPEPPS」係指嘌呤黴素敏感型胺肽酶，「VPr」係指解蛋白弧菌胺肽酶且「EDAPN」係指嗜肺性退伍軍人桿菌M1胺肽酶。表7.肽受質由胺肽酶進行之切割。

酶	肽受質	條件	溫度/時間	HPLC分析轉化率	產物
yPIP	GlyProArgPro (SEQ ID NO: 84)	5 mM肽，50 nM酶，10 mM MgCl₂ ，10 mM Tris，0.02% Tween-20 pH 8.0	30℃/1小時	100%	ProArgPro
yPIP	DDPDDP{LYSN3}NH2 (SEQ ID NO: 85)	1 mM肽，700 nM酶，10 mM MgCl₂ ，10 mM Tris，0.02% Tween-20 pH 8.0	30℃/6小時	0%	n/a
yPIP	AAMAAM{LYSN3}NH2 (SEQ ID NO: 74)	1 mM肽，700 nM酶，10 mM MgCl₂ ，10 mM Tris，0.02% Tween-20 pH 8.0	30℃/6小時	0%	n/a
yPIP	YPYPYP{LYSN3}NH2 (SEQ ID NO: 86)	600 mM肽，7 mM酶，10 mM MgCl₂ ，10 mM Tris，0.02% Tween-20 pH 8.0	30℃/1小時	100%	PYPYP{LYSN3}NH2 (SEQ ID NO: 87)
yPIP	FPFPFP{LYSN3}NH2 (SEQ ID NO: 75)	600 mM肽，7 mM酶，10 mM MgCl₂ ，10 mM Tris，0.02% Tween-20 pH 8.0	30℃/1小時	100%	PFPFP{LYSN3}NH2 (SEQ ID NO: 88)
NPEPPS	LeuTyr 5 mM	700 nM酶，25 mM HEPES，1 mM Mg(OAc)₂ ，1 mM DTT，pH 7.5	37℃/1小時	5%	Tyr
(Cy3B)n-yPIP	FPFPFP{LYSN3}NH2 (SEQ ID NO: 75)	1 mM肽，14 mM酶，10 mM MgCl₂ ，10 mM Tris，0.02% Tween-20 pH 8.0	30℃/15分鐘	100%	PFPFP{LYSN3}NH2 (SEQ ID NO: 88)
(Cy3B)n-yPIP	FPFPFP{LYSN3}NH2 (SEQ ID NO: 75)	1 mM肽，14 mM酶，200 mM Bis-tris丙烷，30 mM KOAc，25 mM Mg(OAc)₂ ，32 mM 3,4二羥基-苯甲酸及12 mM硝基苯甲酸	30℃/15分鐘	100%	PFPFP{LYSN3}NH2 (SEQ ID NO: 88)
惡性瘧原蟲M1	MetTyr	1 mM肽，1 mM酶，2.5 mM ZnCl₂ 25 mM Tris pH 8.0	30℃/1小時	7%	Tyr
(Atto647N)n-yPIP	FPFPFP{LYSN3}NH2 (SEQ ID NO: 75)	1 mM肽，14 mM酶，10 mM MgCl₂ ，10 mM Tris，0.02% Tween-20 pH 8.0	30℃/1小時	100%	PFPFP{LYSN3}NH2 (SEQ ID NO: 88)
大鼠APN	KKMKKMLys-三唑-PEG4生物素 (SEQ ID NO: 89)	1 mM肽，150 nM酶，2.5 mM ZnCl₂ 25 mM Tris pH 8.0	30℃/1小時	＞90%
yPIP	FPFPFP{LYSN3}NH2 (SEQ ID NO: 75)	1 mM肽，7 mM酶，10 mM MgCl₂ ，10 mM Tris，0.02% Tween-20 pH 8.0	30℃/1小時	100%	PFPFP{LYSN3}NH2 (SEQ ID NO: 88)
yPIP	BCN PEG23生物素綴合物	1 mM肽，7 mM酶，10 mM MgCl₂ ，10 mM Tris，0.02% Tween-20 pH 8.0	30℃/1小時	100%	PFPFP{LYS}BCN等 (SEQ ID NO: 88)
掘越氏火球菌Tet	DDMDDM{LYSN3}NH2 (SEQ ID NO: 72)	1 mM肽，1 mM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	70℃/1小時	60%
GluAsp-APN	DDMDDM{LYSN3}NH2 (SEQ ID NO: 72)	1 mM肽，1 mM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	30℃/1小時	100%
掘越氏火球菌Tet	AAPAAP{LYSN3}NH2 (SEQ ID NO: 90)	1 mM肽，1 mM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	70℃/1小時	100%	APAAP{LYSN3}NH2 (SEQ ID NO: 91)
掘越氏火球菌Tet	YYPYYP{LYSN3}NH2 (SEQ ID NO: 92)	1 mM肽，1 mM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	70℃/1小時	100%	YPYYP{LYSN3}NH2 (SEQ ID NO: 93)
掘越氏火球菌Tet	FFPFFP{LYSN3}NH2 (SEQ ID NO: 94)	1 mM肽，1 mM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	70℃/1小時	100%	FPFFP{LYSN3}NH2 (SEQ ID NO: 95)
大鼠APN	RRPRRP{LYSN3}NH2 (SEQ ID NO: 96)	1 mM肽，50 nM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	30℃/1小時	55%	RPRRP{LYSN3}NH2 (SEQ ID NO: 97)
大鼠APN	AAPAAP{LYSN3}NH2 (SEQ ID NO: 98)	1 mM肽，50 nM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	30℃/1小時	100%	APAAP{LYSN3}NH2 (SEQ ID NO: 99)
大鼠APN	KKPKKP{LYSN3}NH2 (SEQ ID NO: 100)	1 mM肽，50 nM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	30℃/1小時	85%	KPKKP{LYSN3}NH2 (SEQ ID NO: 101)
大鼠APN	KKMKKM{LYSN3}NH2 (SEQ ID NO: 71)	1 mM肽，50 nM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	30℃/1小時	50%	KMKKM{LYSN3}NH2 (SEQ ID NO: 102)
VPr	RRPRRP{LYSN3}NH2 (SEQ ID NO: 96)	1 mM肽，2 mM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	30℃/1小時	100%
VPr	AAPAAP{LYSN3}NH2 (SEQ ID NO: 98)	1 mM肽，2 mM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	30℃/1小時	100%	APAAP{LYSN3}NH2 (SEQ ID NO: 99)
VPr	KKPKKP{LYSN3}NH2 (SEQ ID NO: 100)	1 mM肽，2 mM酶，2.5 mM ZnCl₂ 25 mM Tris pH 8.0	30℃/1小時	100%	KPKKP{LYSN3}NH2 (SEQ ID NO: 101)
VPr	YYPYYP{LYSN3}NH2 (SEQ ID NO: 92)	1 mM肽，2 mM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	30℃/1小時	50%	YPYYP{LYSN3}NH2 (SEQ ID NO: 93)
VPr	FFPFFP{LYSN3}NH2 (SEQ ID NO: 94)	1 mM肽，2 mM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	30℃/1小時	100%	FPFFP{LYSN3}NH2 (SEQ ID NO: 95)
VPr	AAMAAM{LYSN3}NH2 (SEQ ID NO: 74)	1 mM肽，2 mM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	30℃/1小時	100%	多種產物
VPr	KKMKKM{LYSN3}NH2 (SEQ ID NO: 89)	1 mM肽，2 mM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	30℃/1小時	100%	多種產物
VPr	YYMYYM{LYSN3}NH2 (SEQ ID NO: 103)	1 mM肽，2 mM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	30℃/1小時	＞90%	多種產物
yPIP	Attor6g-1kPEG-DPAAAFK{LysN3}-1kPEG-生物素 (SEQ ID NO: 104)	44 mM肽，7 mM酶，200 mM Bis-tris丙烷，30 mM KOAc，25 mM Mg(OAc)₂ ，32 mM 3,4二羥基-苯甲酸及12 mM硝基苯甲酸+ PCD + TXV	30℃/0.5小時	＜10%	PAAAFK-1kPEG-生物素 (SEQ ID NO: 105)
PfuPIP	FPFPFP{LYSN3}NH2 (SEQ ID NO: 75)	1 mM肽，1 μM酶，1 mM CoCl₂ ，50 mM HEPES，50 mM KCl	80℃/0.5小時	100%	PFPFP{LYSN3}NH2 (SEQ ID NO: 88)
PfuPIP	Attor6g-1kPEG-DPAAAFK{LysN3}-1kPEG-生物素 (SEQ ID NO: 104)	1 mM肽，1 μM酶，1 mM CoCl₂ ，50 mM HEPES，50 mM KCl	80℃/0.5小時	40%	PAAAFK-1kPEG-生物素 (SEQ ID NO: 105)
yPIP	Attor6g-1kPEG-ODN-DD60-生物素	20 μM Q24綴合物，30 μM ypip，1× Mg緩衝劑	30℃/0.3小時	100%	PAAAFK-1kPEG-生物素 (SEQ ID NO: 105)
yPIP	FPFPFP{LYSN3}NH2 (SEQ ID NO: 75)	1 mM肽，7 μM酶，50 mM MOPS，10 mM Mg(OAc)₂ pH 8.0	37℃/0.5小時	100%	PFPFP{LYSN3}NH2 (SEQ ID NO: 88)
yPIP	Attor6g-1kPEG-ODN-DD60-生物素	10 μM肽，7 μM酶，50 mM MOPS，10 mM Mg(OAc)₂ pH 8.0	37℃/0.5小時	100%	PAAAFK-1kPEG-生物素 (SEQ ID NO: 105)
PfuPIP	FPFPFP{LYSN3}NH2 (SEQ ID NO: 75)	1 mM肽，1 μM酶，50 mM MOPS，10 mM Mg(OAc)₂ pH 8.0	80℃/0.5小時	40%	PFPFP{LYSN3}NH2 (SEQ ID NO: 88)
yPIP-Q24-Cy3B	FPFPFP{LYSN3}NH2 (SEQ ID NO: 75)	1 mM肽，2.1 μM酶，50 mM MOPS，10 mM Mg(OAc)₂ pH 8.0	37℃/0.5小時	100%	PFPFP{LYSN3}NH2 (SEQ ID NO: 88)
yPIP-Q24-Rho6G	YPYPYP{LYSN3}NH2 (SEQ ID NO: 86)	1 mM肽，100 nM酶，1×CB2	37℃/0.5小時	100%+	YPYYP{LYSN3}NH2 (SEQ ID NO: 93)
yPIP-Q24Dark	YPYPYP{LYSN3}NH2 (SEQ ID NO: 86)	1 mM肽，約5 μM酶，1×CB2	37℃/0.5小時	＜15%	YPYYP{LYSN3}NH2 (SEQ ID NO: 93)
大鼠APN	QP5-Atto649N (KAAAAAAFK{LYSN3}NH2) (SEQ ID NO: 106)	37 μM肽，100 nM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/0.5小時	＞95%
VPr	QP5-Atto649N (KAAAAAAFK{LYSN3}NH2) (SEQ ID NO: 106)	37 μM肽，8 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/0.5小時	100%
K287pAzF-Cy3 yPIP	YPYPYP{LYSN3}NH2 (SEQ ID NO: 86)	1 mM肽，1 μM酶，50 mM MOPS，10 mM Mg(OAc)₂ pH 8.0	37℃/1小時	100%	PYPYPK (SEQ ID NO: 83)
霍亂弧菌APT	AAPAAP{LYSN3}NH2 (SEQ ID NO: 98)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/1小時	~5%
Bst M28	AAPAAP{LYSN3}NH2 (SEQ ID NO: 98)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/1小時	100%
Taq APT	AAPAAP{LYSN3}NH2 (SEQ ID NO: 98)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/1小時	＞90%
霍亂弧菌APT	YYPYYP{LYSN3}NH2 (SEQ ID NO: 92)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/1小時	5%
Bst M28	YYPYYP{LYSN3}NH2 (SEQ ID NO: 92)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/1小時	10%
Taq APT	YYPYYP{LYSN3}NH2 (SEQ ID NO: 92)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/1小時	30%
霍亂弧菌APT	FFPFFP{LYSN3}NH2 (SEQ ID NO: 94)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/1小時	＞95%
Bst M28	FFPFFP{LYSN3}NH2 (SEQ ID NO: 94)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/1小時	30%
Taq APT	FFPFFP{LYSN3}NH2 (SEQ ID NO: 94)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/1小時	60%
霍亂弧菌APT	YYMYYM{LYSN3}NH2 (SEQ ID NO: 103)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/1小時	30%
Bst M28	YYMYYM{LYSN3}NH2 (SEQ ID NO: 103)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/1小時	＞50%	多種(N-1、-2、-3等)
Taq APT	YYMYYM{LYSN3}NH2 (SEQ ID NO: 103)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/1小時	85%	多種(N-1、-2、-3等)
Cy3B-Q24-pAzF-yPIP	YPYPYP{LYSN3}NH2 (SEQ ID NO: 86)	1 mM肽，7 μM酶，10 mM MgCl₂ ，50 mM MOPS	37℃/0.5小時	100%
Cy3B-BstTET	FFPFFP{LYSN3}NH2 (SEQ ID NO: 94)	1 mM肽，10 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/0.5小時	50%
Cy3B-taqAPT第2峰	FFPFFP{LYSN3}NH2 (SEQ ID NO: 94)	1 mM肽，20 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/0.5小時	100%
Cy3B-taqAPT第4峰	FFPFFP{LYSN3}NH2 (SEQ ID NO: 94)	1 mM肽，20 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/0.5小時	100%
PhaloM28	RRPRRP{LYSN3}NH2 (SEQ ID NO: 96)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/0.5小時	30%	多種，甚至更高質量
yPAP	RRPRRP{LYSN3}NH2 (SEQ ID NO: 96)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/0.5小時	100%
yPAP	AAPAAP{LYSN3}NH2 (SEQ ID NO: 98)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/0.5小時	100%
yPAP	KKPKKP{LYSN3}NH2 (SEQ ID NO: 100)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/0.5小時	100%
yPAP	YYPYYP{LYSN3}NH2 (SEQ ID NO: 92)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/0.5小時	100%
PhaloM28	FFPFFP{LYSN3}NH2 (SEQ ID NO: 94)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/0.5小時	＞80%
yPAP	FFPFFP{LYSN3}NH2 (SEQ ID NO: 94)	1 mM肽，1 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/0.5小時	＞80%
霍亂弧菌APT	QP5-Atto649N (KAAAAAAFK{LYSN3}NH2) (SEQ ID NO: 106)	1 mM肽，5 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/0.5小時	100%
yPAP	YYPYYP{LYSN3}NH2 (SEQ ID NO: 92)	1 mM肽，2 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/0.5小時	10%
鰻弧菌APN	RRPRRP{LYSN3}NH2 (SEQ ID NO: 96)	1 mM肽，2 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	30℃/1小時	＞90%
鰻弧菌APN	AAPAAP{LYSN3}NH2 (SEQ ID NO: 98)	1 mM肽，2 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	30℃/1小時	50%
鰻弧菌APN	KKPKKP{LYSN3}NH2 (SEQ ID NO: 100)	1 mM肽，2 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	30℃/1小時	＜5%
VPr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	300 μM肽，4 μM酶，10 mM MgCl₂ ，50 mM MOPS pH 8.0	37℃/0.5小時	100%
yPIP	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)	300 μM肽，7 μM酶，10 mM MgCl₂ ，50 mM MOPS pH 8.0	37℃/0.5小時	100%
VPr	PLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 109)	300 μM肽，4 μM酶，10 mM MgCl₂ ，50 mM MOPS pH 8.0	37℃/0.5小時	100%
yPIP	LPWPDDDY{LYSN3}NH2 (SEQ ID NO: 110)	300 μM肽，7 μM酶，10 mM MgCl₂ ，50 mM MOPS pH 8.0	37℃/0.5小時	100%
hTET	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	200 μM肽，2 μM酶，2.5 mM ZnCl₂ ，25 mM Tris pH 8.0	37℃/1小時	55%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
hTET	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	200 μM肽，2 μM酶，10 mM MgCl₂ ，50 mM MOPS pH 8.0	37℃/1小時	55%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
ProVPrAmbr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	200 μM肽，2.2 μM酶，10 mM MgCl₂ ，50 mM MOPS pH 8.0	37℃/1小時	6%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
ThrCut-ProVPrAmbr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	200 μM肽，2.1 μM酶，10 mM MgCl₂ ，50 mM MOPS pH 8.0	37℃/1小時	40%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	200 μM肽，4 μM酶，10 mM MgCl₂ ，50 mM MOPS pH 8.0	37℃/0.5小時	100%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
ProVPrAmbr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	200 μM肽，4 μM酶，10 mM MgCl₂ ，50 mM MOPS pH 8.0	37℃/0.5小時	50%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
ThrCut-ProVPrAmbr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	200 μM肽，4 μM酶，10 mM MgCl₂ ，50 mM MOPS pH 8.0	37℃/0.5小時	40%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	FWPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	200 μM肽，4 μM酶，10 mM MgCl₂ ，50 mM MOPS pH 8.0	37℃/1小時	100%
VPr pAzF	FWPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	200 μM肽，4 μM酶，10 mM MgCl₂ ，50 mM MOPS pH 8.0	37℃/1小時	96%
ThrCut-ProVPrAmbr Cy3點擊	FWPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	200 μM肽，6.4 μM酶，10 mM MgCl₂ ，50 mM MOPS pH 8.0	37℃/1小時	100%
hTET	PLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 109)	200 μM肽，4 μM酶，10 mM MgCl₂ ，50 mM MOPS pH 8.0	37℃/1小時	100%
VPr	FWPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	400 μM肽，8 μM酶，50 mM HEPES pH 8.0，300 mM NaCl，1 mM DTT，5%甘油，32 mM PCA	37℃/1小時	100%
VPr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	200 μM肽，8 μM酶，10 mM MgCl₂ ，50 mM MOPS pH 5.0	RT/1小時	100%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	200 μM肽，8 μM酶，10 mM MgCl₂ ，50 mM MOPS pH 5.0	RT/0.5小時	100%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	200 μM肽，8 μM酶，10 mM MgCl₂ ，50 mM MOPS pH 5.0	RT/1小時	100%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	200 μM肽，8 μM酶，10 mM MgCl₂ ，50 mM MOPS pH 5.0	RT/0.5小時	100%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	600 μM肽，0.8 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 5.5	RT/0.5小時	100%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	600 μM肽，0.8 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 6.5	RT/0.5小時	100%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	600 μM肽，0.8 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 7.5	RT/0.5小時	100%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	600 μM肽，0.8 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8.5	RT/0.5小時	100%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	1200 μM肽，0.08 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 5.5	RT/0.5小時	50%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	1200 μM肽，0.08 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 6.5	RT/0.5小時	100%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	1200 μM肽，0.08 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 7.5	RT/0.5小時	100%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: X)	1200 μM肽，0.08 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8.5	RT/0.5小時	100%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	QP15 FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	1200 μM肽，0.008 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 5.5	RT/0.5小時	1.40%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	QP15 FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	1200 μM肽，0.008 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 6.5	RT/0.5小時	56%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	1200 μM肽，0.008 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 7.5	RT/0.5小時	100%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	1200 μM肽，0.008 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8.5	RT/0.5小時	100%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	1200 μM肽，800 pM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 7.5	RT/0.5小時	2.70%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	FYPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 107)	1200 μM肽，800 pM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8.5	RT/0.5小時	6.80%	YPLPWPDDDY{LYSN3}NH2 (SEQ ID NO: 108)
VPr	FAAAWPDDDF1 (SEQ ID NO: 11)	600 μM肽，8 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8	RT/0.5小時	100%	WPDDF1 (SEQ ID NO: 112
VPr	WAAAFPDDDF1 (SEQ ID NO: 13)	600 μM肽，8 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8	RT/0.5小時	100%	FPDDF1 (SEQ ID NO: 114)
VPr	WAAAFPDDDF1 (SEQ ID NO:13)	300 μM肽，8 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8	RT/0.5小時	100%	FPDDF1 (SEQ ID NO: 114)
VPr	WAAAFPDDDF1 (SEQ ID NO: 13)	300 μM肽，8 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，0.2% Tween20	RT/0.5小時	100%	FPDDF1 (SEQ ID NO: 114)
VPr	WAAAFPDDDF1 (SEQ ID NO: 13)	300 μM肽，8 μM酶，50/50 MOPS Mg緩衝劑/RB1	RT/0.5小時	30%	70% -3，30% -4
VPr	WAAAFPDDDF1 (SEQ ID NO: 13)	300 μM肽，8 μM酶，RB2 + Mg	RT/0.5小時	5%	幾乎所有-1、-2及-3產物
VPr	WAAAFPDDDF1 (SEQ ID NO: 13)	300 μM肽，8 μM酶，RB4	RT/0.5小時	100%	FPDDF1 (SEQ ID NO:114)
VPr	WAAAFPDDDF1 (SEQ ID NO: 13)	300 μM肽，8 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	70%	30% -3，70% -4
VPr	WAAAFPDDDF1 (SEQ ID NO: 13)	300 μM肽，8 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/2小時	100%	FPDDF1 (SEQ ID NO: 114)
VPr	WAAAFPDDDF1 (SEQ ID NO: 13)	300 μM肽，8 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	37℃/2小時	100%	FPDDF1 (SEQ ID NO: 114)
VPr	FAAAYPDDDF1 (SEQ ID NO: 11)	600 μM肽，8 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%	YPDDF1 (SEQ ID NO: 115)
VPr	FAAAYPDDDF1 (SEQ ID NO: 11)	600 μM肽，0.8 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	50%	YPDDF1 (SEQ ID NO: 115)
VPr	FAAAYPDDDF1 (SEQ ID NO: 11)	600 μM肽，0.08 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	5%	YPDDF1 (SEQ ID NO: 115)
VPr	RRPFQQ (SEQ ID NO: 116)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	79%	RPFQQ (SEQ ID NO: 117)
VPr	AAPFQQ (SEQ ID NO: 118)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%	APFQQ (SEQ ID NO: 119)
VPr	KKPFQQ (SEQ ID NO: 120)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	32%	KPFQQ (SEQ ID NO: 121)
VPr	YYPFQQ (SEQ ID NO: 122)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	56%	YPFQQ (SEQ ID NO: 123)
VPr	FFPFQQ (SEQ ID NO: 124)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%	FPFQQ (SEQ ID NO: 125)
VPr	DDPFQQ (SEQ ID NO: 126)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	DPFQQ (SEQ ID NO: 127)
VPr	EEPFQQ (SEQ ID NO: 128)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	EPFQQ (SEQ ID NO: 129)
VPr	NNPFQQ (SEQ ID NO: 130)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	15%	NPFQQ (SEQ ID NO: 131)
VPr	QQPFQQ (SEQ ID NO: 132)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	66%	QPFQQ (SEQ ID NO: 133)
VPr	VVPFQQ (SEQ ID NO: 134)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%	VPFQQ (SEQ ID NO: 135)
VPr	IIPFQQ (SEQ ID NO: 136)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%	IPFQQ (SEQ ID NO: 137)
VPr	LLPFQQ (SEQ ID NO: 138)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%	LPFQQ (SEQ ID NO: 139)
VPr	SSPFQQ (SEQ ID NO: 140)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	48%	SPFQQ (SEQ ID NO: 141)
VPr	TTPFQQ (SEQ ID NO: 142)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%	TPFQQ (SEQ ID NO: 143)
VPr	CCPFQQ (SEQ ID NO: 144)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	70%	CPFQQ (SEQ ID NO: 145)
VPr	WWPFQQ (SEQ ID NO: 146)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	82%	WPFQQ (SEQ ID NO: 147)
VPr	MMPFQQ (SEQ ID NO: 148)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%	MPFQQ (SEQ ID NO: 149)
VPr	PPPFQQ (SEQ ID NO: 150)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	PPFQQ (SEQ ID NO: 151)
VPr	GGPFQQ (SEQ ID NO: 152)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	8%	GPFQQ (SEQ ID NO: 153)
VPr	HHPFQQ (SEQ ID NO: 154)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	12%	HPFQQ (SEQ ID NO: 155)
yPIP pAzF	RRPFQQ (SEQ ID NO: 116)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
yPIP pAzF	AAPFQQ (SEQ ID NO: 118)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
yPIP pAzF	KKPFQQ (SEQ ID NO: 120)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
yPIP pAzF	YYPFQQ (SEQ ID NO: 122)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
yPIP pAzF	FFPFQQ (SEQ ID NO: 124)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
yPIP pAzF	DDPFQQ (SEQ ID NO: 126)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
yPIP pAzF	EEPFQQ (SEQ ID NO: 128)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
yPIP pAzF	NNPFQQ (SEQ ID NO: 130)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
yPIP pAzF	QQPFQQ (SEQ ID NO: 132)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
yPIP pAzF	VVPFQQ (SEQ ID NO: 134)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
yPIP pAzF	IIPFQQ (SEQ ID NO: 136)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
yPIP pAzF	LLPFQQ (SEQ ID NO: 138)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
yPIP pAzF	SSPFQQ (SEQ ID NO: 140)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
yPIP pAzF	TTPFQQ (SEQ ID NO: 142)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
yPIP pAzF	CCPFQQ (SEQ ID NO: 144)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
yPIP pAzF	WWPFQQ (SEQ ID NO: 146)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
yPIP pAzF	MMPFQQ (SEQ ID NO: 148)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
yPIP pAzF	PPPFQQ (SEQ ID NO: 150)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	26%	多種
yPIP pAzF	GGPFQQ (SEQ ID NO: 152)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
yPIP pAzF	HHPFQQ (SEQ ID NO: 154)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%	N/A
hTET	RRPFQQ (SEQ ID NO: 116)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
hTET	AAPFQQ (SEQ ID NO: 118)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%
hTET	KKPFQQ (SEQ ID NO: 120)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
hTET	YYPFQQ (SEQ ID NO: 122)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	99%
hTET	FFPFQQ (SEQ ID NO: 124)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%
hTET	DDPFQQ (SEQ ID NO: 126)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	4%
hTET	EEPFQQ (SEQ ID NO: 128)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
hTET	NNPFQQ (SEQ ID NO: 130)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	69%
hTET	QQPFQQ (SEQ ID NO: 132)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	63%
hTET	VVPFQQ (SEQ ID NO: 134)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%
hTET	IIPFQQ (SEQ ID NO: 136)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%
hTET	LLPFQQ (SEQ ID NO: 138)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%
hTET	SSPFQQ (SEQ ID NO: 140)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%
hTET	TTPFQQ (SEQ ID NO: 142)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%
hTET	CCPFQQ (SEQ ID NO: 144)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	32%
hTET	WWPFQQ (SEQ ID NO: 146)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	4%
hTET	MMPFQQ (SEQ ID NO: 148)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
hTET	PPPFQQ (SEQ ID NO: 150)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
hTET	GGPFQQ (SEQ ID NO: 152)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	33%
hTET	HHPFQQ (SEQ ID NO: 154)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	26%
PfuTET	RRPFQQ (SEQ ID NO: 116)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%
PfuTET	AAPFQQ (SEQ ID NO: 118)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%
PfuTET	KKPFQQ (SEQ ID NO: 120)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%
PfuTET	YYPFQQ (SEQ ID NO: 122)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%
PfuTET	FFPFQQ (SEQ ID NO: 124)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	65%
PfuTET	DDPFQQ (SEQ ID NO: 126)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	86%
PfuTET	EEPFQQ (SEQ ID NO: 128)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	93%
PfuTET	NNPFQQ (SEQ ID NO: 130)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	81%
PfuTET	QQPFQQ (SEQ ID NO: 132)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%
PfuTET	VVPFQQ (SEQ ID NO: 134)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
PfuTET	IIPFQQ (SEQ ID NO: 136)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
PfuTET	LLPFQQ (SEQ ID NO: 138)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	99%
PfuTET	SSPFQQ (SEQ ID NO: 140)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	90%
PfuTET	TTPFQQ (SEQ ID NO: 142)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%
PfuTET	CCPFQQ (SEQ ID NO: 144)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	72%
PfuTET	WWPFQQ (SEQ ID NO: 146)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	37%
PfuTET	MMPFQQ (SEQ ID NO: 148)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%
PfuTET	PPPFQQ (SEQ ID NO: 150)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
PfuTET	GGPFQQ (SEQ ID NO: 152)	1 mM肽，1 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
PfuTET	HHPFQQ (SEQ ID NO: 154)	1 mM肽，1 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	19%
EDAPN (Glu/Asp APN)	RRPFQQ (SEQ ID NO: 116)	1 mM肽，1.3 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
EDAPN (Glu/Asp APN)	AAPFQQ (SEQ ID NO: 118)	1 mM肽，1.3 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
EDAPN (Glu/Asp APN)	KKPFQQ (SEQ ID NO: 120)	1 mM肽，1.3 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
EDAPN (Glu/Asp APN)	YYPFQQ (SEQ ID NO: 122)	1 mM肽，1.3 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
EDAPN (Glu/Asp APN)	FFPFQQ (SEQ ID NO: 124)	1 mM肽，1.3 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
EDAPN (Glu/Asp APN)	DDPFQQ (SEQ ID NO: 126)	1 mM肽，1.3 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	21%
EDAPN (Glu/Asp APN)	EEPFQQ (SEQ ID NO: 128)	1 mM肽，1.3 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	31%
EDAPN (Glu/Asp APN)	NNPFQQ (SEQ ID NO: 130)	1 mM肽，1.3 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
EDAPN (Glu/Asp APN)	QQPFQQ (SEQ ID NO: 132)	1 mM肽，1.3 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
EDAPN (Glu/Asp APN)	VVPFQQ (SEQ ID NO: 134)	1 mM肽，1.3 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
EDAPN (Glu/Asp APN)	IIPFQQ (SEQ ID NO: 136)	1 mM肽，1.3 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	42%
EDAPN (Glu/Asp APN)	LLPFQQ (SEQ ID NO: 138)	1 mM肽，1.3 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
EDAPN (Glu/Asp APN)	SSPFQQ (SEQ ID NO: 140)	1 mM肽，1.3 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
EDAPN (Glu/Asp APN)	TTPFQQ (SEQ ID NO: 142)	1 mM肽，1.3 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
EDAPN (Glu/Asp APN)	CCPFQQ (SEQ ID NO: 144)	1 mM肽，1.3 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
EDAPN (Glu/Asp APN)	WWPFQQ (SEQ ID NO: 146)	1 mM肽，1.3 uM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	0%
PfuTET	YAAFAAWADDDW1 (SEQ ID NO: 156)	1 mM肽，1.0 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	分佈	主要ADDDWK (SEQ ID NO: 157)
hTET	YAAFAAWADDDW1 (SEQ ID NO: 156)	1 mM肽，1.0 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	100%	WADDDWK (SEQ ID NO: 158)
VPr	YAAFAAWADDDW1 (SEQ ID NO: 156)	1 mM肽，1.2 μM酶，10 mM Mg(OAc)₂ ，50 mM MOPS pH 8，60 mM KOAc	RT/0.5小時	分佈	主要ADDDWK (SEQ ID NO: 157)

圖16中展示表7之所選外肽酶之胺基酸切割活性的概述。展示以下酶之特異性切割活性：「cVPr」(解蛋白弧菌胺肽酶)、「yPIP」(鼠疫耶氏桿菌脯胺酸亞胺基肽酶)、「D/E APN」(嗜肺性退伍軍人桿菌M1胺肽酶)、hTET (掘越氏火球菌TET胺肽酶)及Pfu API (表7中之「PfuTET」)。相對於末端胺基酸之特異活性如所展示分類，對胺基酸使用單字母縮寫(「XP-」表示具有相鄰或次末端脯胺酸(P)殘基之任何末端胺基酸(X))。實例 4 . 在單分子層級上固定肽之末端胺基酸切割

使用經標記肽綴合物開發對固定肽之晶片上胺基酸切割的分析。分析經設計以提供一種用於確定外肽酶對固定肽之酶識別及切割活性之方法，其可允許量測動力學結合參數及總體結合親和力。

為了評估肽之N末端胺基酸切割，設計且合成經染料標記之肽，其含有藉助於PEG間隔基連接至該染料的N末端天冬胺酸。此肽亦含有與經修飾天冬胺酸相鄰之脯胺酸殘基，其由酶脯胺酸亞胺基肽酶(來自鼠疫耶氏桿菌，別處已知且在本文中被稱作「yPIP」)特異性識別。酶yPIP應僅切割脯胺酸殘基上游之N末端胺基酸。

在展示此及其他經標記肽由yPIP批量有效剪切(例如，如實例2中所描述)之後，開發晶片上染料/肽綴合物分析以在單分子層級上觀測N末端胺基酸切割。圖17A展示染料/肽綴合物分析之通用方案(插圖)。如所展示，具有經間隔基連接至N末端胺基酸之標記的肽藉助於連接子固定至表面。在暴露於肽酶之後，N末端胺基酸切割引起經標記殘基自可偵測觀測體積移除，且由來自標記之信號的伴隨損失量測。插圖右側的酶-肽複合物大體上描繪N末端切割位點。

圖17A展示經標記肽構築體(在底部)，其經設計及合成以用於染料/肽綴合物分析。在此等實驗中，將若丹明染料(ATTO Rho6G)連接至在N末端具有次末端脯胺酸殘基之肽的N末端天冬胺酸殘基。如所展示，肽進一步綴合至具有生物素部分之增溶DNA連接子以便進行表面固定。

將經標記肽綴合物負載至具有樣品孔陣列之玻璃晶片上。在負載之前及之後獲取晶片之影像，以藉由若丹明螢光確定單一佔有時樣品孔之負載百分比。隨後將酶yPIP引入至負載晶片上且使其在37℃下培育兩小時。在引入yPIP之後取得晶片之影像，且計算損失的綠色染料之百分比以評估N末端胺基酸切割。圖17B展示來自實驗之成像結果，該等結果顯示負載階段中之6%至7%負載，及在與yPIP一起培育之後先前負載之孔中之91%信號損失，其指示N末端胺基酸切割。圖17C展示來自此等實驗之代表性信號跡線，其展現在經標記肽之負載後染料信號之偵測到的增加，及在暴露於yPIP之後染料信號之偵測到的損失。

開發晶片上FRET分析以評估外肽酶識別及切割活性，作為對單分子層級上N末端胺基酸切割之進一步確認。圖18A大體上描繪FRET肽綴合物分析(A圖)及FRET酶綴合物分析(B圖)。在FRET肽綴合物分析(A圖)中，固定肽構築體包括連接至連接子之FRET供體標記及在N末端處連接之FRET受體標記。當暴露於肽酶時，由來自FRET受體標記之信號的損失偵測N末端胺基酸切割。另外，此設計准許藉由追蹤來自FRET供體標記之發射，在整個實驗中監測肽綴合物之負載。

在FRET酶綴合物分析(B圖)中，固定肽構築體包括連接至連接子之FRET對的第一標記，且肽酶經FRET對之第二標記標記。由可歸因於FRET相互作用之螢光增強偵測N末端胺基酸切割，FRET相互作用將在肽酶與肽足夠接近且N末端處之滯留時間足夠的情況下發生。另外，此分析准許藉由偵測在進行性切割之情況下隨時間推移增加之FRET信號，評估由進行性外肽酶進行之進行性胺基酸切割。

圖18A亦在A圖下方展示FRET肽構築體，其經設計及合成以用於A圖之FRET肽綴合物分析。如所展示，FRET肽構築體包括若丹明染料(ATTO 647N)，其連接至在N末端處具有次末端脯胺酸殘基之肽的N末端天冬胺酸殘基。肽進一步綴合至增溶DNA連接子，其連接至用於FRET之花青染料(Cy3B)及用於表面固定之生物素部分。

在此實驗中，將FRET肽構築體負載至具有樣品孔陣列之玻璃晶片上，且首先由綠色濾光器且隨後由紅色濾光器對所收集之光進行濾光。藉由量測通過綠色濾光器及紅色濾光器兩者之信號偵測FRET肽構築體之負載。當信號僅在綠色濾光器中可量測時偵測到末端胺基酸切割，其指示來自FRET肽構築體之紅色染料綴合N末端胺基酸由yPIP切割。此偵測圖案在C圖中示出。如所展示，若在添加yPIP之前兩種染料可偵測，且在與yPIP一起培育之後僅綠色染料可見，則可合理地推斷偵測圖案中之此變化由肽之切割而非光漂白或肽整體上損失所致。另外，將預期來自單獨綠色染料之螢光增加，因為其發射不再由紅色染料吸收。

在將FRET肽構築體負載至已藉由使用膦酸及矽烷表面鈍化修飾之晶片上之後，引入yPIP且在數個時間點處獲得影像。為了評定整體切割趨勢，對各實驗計算(綠色)/(綠色+紅色)之比率。此比率隨發生之切割的程度提高。圖18B為在與yPIP一起培育之不同時間點處遍及所有孔口之FRET發射比率的曲線圖。如所展示，在與yPIP一起培育期間，綠色染料對螢光發射之比率的貢獻隨時間推移增加，表明較多N末端天冬胺酸殘基已經切割，留下僅具有綠色染料之截短肽。

隨後藉由確定在哪些時間點觀測到染料螢光，在不同時間點處評估剪切效率。此利用簡單定限進行，例如若在激發期間平均染料發射信號＞ 2.5，則確定染料存在(當施加各對應濾光器時)。展現剪切之孔口將隨後在實驗之負載階段期間顯示綠色染料及紅色染料兩者，但在暴露於yPIP之時間點處僅顯示綠色染料。如圖18C中所展示，隨著晶片暴露於與yPIP一起培育之時間變長，逐漸觀測到較多剪切。圖18D展示在三個經yPIP處理之時間點中之各者處顯示的展示剪切之示例性信號跡線。

使用已藉由使用葡聚糖表面鈍化修飾之晶片，用yPIP及其他肽酶進行額外實驗，其產生類似結果，展示在將肽酶引入至晶片上之後，隨時間推移末端胺基酸切割增加。圖18E為在與yPIP一起培育之不同時間點處遍及經負載孔口之FRET發射比率的曲線圖。圖18F為在與胺肽酶一起培育之不同時間點處遍及經負載孔口之FRET發射比率的曲線圖。總體而言，此處實驗展現使用不同外肽酶及不同標記策略，可在單分子層級上即時偵測N末端胺基酸切割。實例 5 . 藉由經標記親和試劑進行之末端胺基酸區分

將蛋白分解路徑中所涉及之接附蛋白(adaptor protein)鑑別為潛在候選物，其用作用於偵測N末端芳族殘基之經標記親和試劑。在暴露半胱胺酸殘基處表現且標記接附蛋白，來自α-變形菌(α-proteobacterium) (根癌農桿菌)之ClpS2。圖19A展示ClpS2蛋白之晶體結構，其中暴露半胱胺酸殘基展示為棍。暴露半胱胺酸殘基經若丹明染料(ATTO 532)標記。

製備具有不同N末端芳族殘基之肽，以測試經標記ClpS2是否能夠在單分子層級上進行N末端胺基酸區分。圖19B中展示來自此等實驗之示例性單分子強度跡線。如所展示，信號跡線展現殘基特異性締合-解離結合圖案，其對應於可逆結合具有以下之肽之N末端的經標記親和試劑：N末端苯丙胺酸殘基(F，頂部信號跡線)、N末端酪胺酸殘基(Y，中間信號跡線)或N末端色胺酸殘基(W，底部信號跡線)。

進行對單分子軌跡之進一步分析，結果展示於圖19C至圖19E中。圖19C為展示當由經標記ClpS2可逆結合時，三種N末端殘基當中之判別脈衝持續時間(信號峰之持續時間)的曲線圖。圖19D為展示三種N末端殘基當中之判別脈衝間持續時間(信號脈衝之間的持續時間)的曲線圖。圖19E展示進一步示出肽N末端處之苯丙胺酸、酪胺酸及色胺酸當中之判別脈衝持續時間的曲線圖。不同N末端殘基之均值脈衝持續時間由直方圖(A)至(B)及分層直方圖(C)視覺化。

針對用作用於白胺酸識別之經標記親和試劑，評估另一接附蛋白，來自細長嗜熱聚球藻之ClpS (teClpS)。圖19F至圖19H中所展示之獲自停留時間分析的資料展現經標記teClpS蛋白產生與多肽之末端白胺酸殘基的可偵測結合相互作用，其中均值脈衝持續時間為0.71秒。此等實驗中所使用之teClpS蛋白的胺基酸序列展示於表1中。

進行類似實驗，以評估作為用於白胺酸識別之潛在試劑的根癌農桿菌ClpS1及細長聚球藻ClpS2，及作為用於脯胺酸識別之潛在試劑的GID4。圖19I展示來自停留時間分析之示例性結果，其展示由根癌農桿菌ClpS1對苯丙胺酸、白胺酸、色胺酸及酪胺酸之可區分識別。圖19J展示來自停留時間分析之示例性結果，其展現由細長聚球藻ClpS2進行之白胺酸識別。圖19K至圖19L展示來自停留時間分析之示例性結果，其展現由GID4進行之脯胺酸識別。實例 6 . 在降解期間藉由識別進行之多肽定序

進行實驗以評估在進行中的降解反應期間藉由N末端胺基酸識別進行之肽定序。圖20A至圖20D中展示來自此等實驗之示例性結果，其展示在相同反應混合物中使用經標記ClpS2蛋白及胺肽酶即時進行兩個獨立多肽定序反應中所獲得之單分子強度跡線。在各反應中，藉由將肽組合物(10 pM)負載至晶片上20分鐘，將序列YAAWAAFADDDWK (SEQ ID NO: 78)之多肽經C末端離胺酸殘基固定至晶片表面，且在經標記親和試劑(在500 nM下之經ATTO 542標記之根癌農桿菌ClpS2-V1)及胺肽酶切割試劑(在8 μM下之VPr)存在下監測固定肽。

圖20A及圖20C展示兩種不同定序運作之信號跡線資料，其中頂部圖(圖20A中之圖1，圖20C中之圖2)展示全跡線，且底部圖(Y、W、F)展示對應於全跡線中突出顯示區域中之各者的放大區域。圖20B及圖20D分別以直方圖展示如圖20A及圖20C中所標記之對應圖之跡線資料的脈衝持續時間統計資料。如各定序運作之全信號跡線(圖1、圖2)所展示，在反應過程中觀測到信號脈衝之三個分開的時間間隔。如由放大區域(Y圖、W圖、F圖)突出顯示，可基於信號脈衝圖案中可觀測的差異將三個間隔在視覺上彼此區別。

為了進一步分析信號脈衝資料，對各時間間隔確定脈衝持續時間統計資料(圖20B及圖20D)。確定脈衝持續時間分佈中之差異對應於針對此等胺基酸分別在利用ClpS2之穩態晶片上結合分析中所觀測到之彼等，且信號脈衝資訊在來自定序運作及個別胺基酸結合分析之間隔之間在表型上一致。

如對信號脈衝資訊之分析所證實，在各定序運作之進展中觀測到之信號脈衝的三個時間間隔分別對應於Y、W及F之識別圖案(圖1、圖2)。信號脈衝圖案之間的中間時段由ClpS2-V1之選擇性所致，其不結合至N末端丙胺酸殘基。如由全信號跡線所示出，第一間隔對應於Y識別，其之後為在VPr肽酶剪切Y及兩個丙胺酸殘基時之暫停；之後為對應於W識別之第二間隔，其之後為在VPr肽酶剪切W及兩個丙胺酸殘基時之另一暫停；且最後第三間隔對應於F識別，隨後VPr肽酶剪切掉F且在剩餘的ADDDWK肽處停止。此等結果展示在進行中的降解反應期間藉由末端胺基酸識別獲得之脈衝持續時間資訊，可用於確定區分不同類型之末端胺基酸的特徵圖案。實例 7 . 由經標記外肽酶進行之末端胺基酸鑑別及切割

進行研究以研究能夠鑑別肽之末端胺基酸且同時自肽切割末端胺基酸之單一試劑的潛能。作為單一試劑，外肽酶必須能夠結合至肽，同時保留對末端殘基之切割活性。因此，藉由靶向不同外肽酶之原生表面暴露胺基酸，採用傳統標記策略進行初始方法。在此等實驗中，用螢光染料標記表面暴露半胱胺酸(-SH)或離胺酸(-NH₂ )殘基，其被證明為用於外肽酶標記之穩健方法。然而，在某些情況下，此方法產生經一或多種染料標記之蛋白質的異質群。

為了更精確地控制標記在外肽酶上存在之位置，且確保各外肽酶分子經單一螢光染料標記(以及消除該染料之脫靶反應性)，研究新標記策略。在此等實驗中，使用位點特異性標記策略製備經標記外肽酶，其中將含有反應性官能基之非天然胺基酸引入至外肽酶中(參見例如Chin, J.W.等人J Am Chem Soc. 2002年8月7日；124(31):9026-9027)。

藉由將位置287處之離胺酸殘基突變為具有對疊氮苯丙胺酸(pAzF)側鏈之殘基，修飾來自鼠疫耶氏桿菌之脯胺酸亞胺基肽酶(yPIP)。圖21A展示yPIP之晶體結構，其中由pAzF之化學結構指示之突變用展示為棍之K287側鏈展示。此突變位點基於由此位置處之α螺旋提供之穩定性而選擇，且其經選擇以確保新疊氮官能基係溶劑暴露的。

獲得含有將pAzF併入至胺基酸鏈中所必需的突變胺基tRNA合成酶及突變tRNA的pEVOL質體。隨後使用QuickChange II突變誘發套組，將對pAzF之特異性併入而言必需的琥珀終止密碼子(TAG)引入至cDNA中。隨後對cDNA進行定序，且確認TAG密碼子位置。此之後為共轉染含有yPIP琥珀突變體之pET21b+質體及含有用於將pAzF裝入琥珀密碼子之tRNA之細胞機構的pEVOL質體兩者。隨後使共轉染細胞生長至0.8 ODU，在於2 L LB中之2 mM pAzF存在下用0.02%阿拉伯糖及1 mM IPTG誘導，且使用化學分解收集。使用5 mL親和層析管柱進行純化，且在100 mM咪唑中溶離蛋白質。隨後將所得蛋白質透析且濃縮至50 mM HEPES pH 8.0及0.5 M KCl中，等分，且急驟冷凍，隨後儲存在-20℃下。

為了確認疊氮基存在於純化蛋白質中，使DBCO-Cy3 (2 mM)與pAzF-yPIP變異體(220 μM)反應(反應條件：50 mM HEPES pH 8.0，0.5 mM KCl，20% DMSO；37℃下10小時，室溫下48小時)。藉由尺寸排阻層析純化蛋白質反應產物，且確定所得蛋白質100%經疊氮化合物反應性DBCO-Cy3試劑標記(圖21B)，指示非天然胺基酸之穩健併入。

藉由對未經標記及經標記pAzF變異體之SDS-PAGE分析確認最終產物之蛋白質標記及純度。圖21C展示SDS-PAGE凝膠之圖片，其證實pAzF-yPIP之Cy3標記(圖21D中展示凝膠之過度曝光影像以展示梯狀條帶(ladder))。圖21E展示考馬斯染色凝膠之圖片，其證實染料及蛋白質兩者共同遷移且係純的。

在活性分析中使用經染料標記之pAzF-yPIP，以確認在標記及純化之後酶仍然具有活性。如圖21F中所展示，如藉由HPLC量測，使用1000倍過量受質，Cy3-pAzF-yPIP能夠在1小時內水解100%之肽受質。此等實驗展現允許在對天然蛋白質結構/功能擾動極小之情況下，對外肽酶進行位點特異性修飾及標記之方法。實例 8 . 在多肽定序中對經修飾胺基酸之識別

進行實驗以評估對含有特定轉譯後修飾之胺基酸的識別。測試來自酪胺酸激酶Fyn之Src同源2 (SH2)域之三重突變變異體(T8V、S10A、K15L)作為肽定序中磷酸化酪胺酸殘基之潛在識別分子。將變異蛋白固定至樣品孔底部，且在添加含有N末端磷酸化酪胺酸之螢光標記之肽後收集單分子信號跡線。如圖22A中之代表性跡線所展示，在此等實驗期間偵測由固定蛋白質進行之肽結合。圖22B中展示在此等實驗期間所收集之脈衝持續時間資料(頂部、中間及底部曲線圖分別對應於圖22A之頂部、中間及底部跡線)。圖22C中展示脈衝持續時間及脈衝間持續時間統計資料(分別頂部圖及底部圖)。

進行對照實驗以確認Fyn蛋白對磷酸化酪胺酸具有特異性。針對三種不同肽中之每一者重複實驗：第一肽，其含有N末端未經修飾酪胺酸(Y；圖22D)；第二肽，其含有N末端及次末端未經修飾酪胺酸(YY；圖22E)；及第三肽，其含有N末端磷酸化絲胺酸(圖22F)。如所展示，在陰性對照實驗中所使用之肽中之任一者的情況下，未偵測到結合。實例 9 . 在多肽定序中對次末端胺基酸之識別

進行實驗以確定次末端胺基酸對根癌農桿菌ClpS2-V1之脈衝持續時間的影響。製備在N末端處含有獨特二肽序列之四十九種不同螢光標記之肽，其中N末端胺基酸為F、W或Y，且次末端位置為20種天然胺基酸中之一種。對於各實驗，將ClpS2-V1固定在樣品孔底部，且在添加螢光標記之肽中之一者後收集單分子信號跡線10至20分鐘。對於各肽，針對最少50個樣品孔收集脈衝持續時間資料。

圖23展示50種肽中之各者的中值脈衝持續時間，其中資料點由次末端胺基酸(x軸)分組，且N末端胺基酸用不同符號表示。實例 10 . 利用多種識別分子之同時胺基酸識別

進行單分子肽識別實驗，以展現由多於一種經標記識別分子對固定肽之末端胺基酸識別。將含有N末端苯丙胺酸之單一肽分子(FYPLPWPDDDY (SEQ ID NO: 79))固定於晶片之樣品孔中。添加含有500 nM atClpS1 (根癌農桿菌ClpS1；序列提供於表1中)及atClpS2-V1 (根癌農桿菌ClpS2變異體1；序列提供於表1中)中之各者的緩衝液，其中atClpS1及atClpS2-V1分別經Cy3及Cy3B標記。由於Cy3B之強度高於Cy3，因此atClpS2-V1結合事件可容易地與atClpS1結合事件區別。

圖24A至圖24C展示實驗之結果，其展示利用差異性標記之識別分子的單分子肽識別。圖24A中顯示代表性跡線。對於各結合子，脈衝持續時間分佈相異(圖24B)，且對應於如單一結合子實驗中所觀測到之其動力學概況。對於atClpS1，均值脈衝持續時間為1.3秒；且對於atClpS2-V1，均值脈衝持續時間為為1.0秒(圖24C)。脈衝速率亦相異：對於atClpS1，8.1個脈衝/分鐘；且對於atClp2-V1，14.1個脈衝/分鐘(圖24C)。因此，當包括多於一種識別分子以便動態識別固定肽時，各識別分子之結合特徵(包括脈衝持續時間、脈衝間持續時間及脈衝速率)可同時提供關於肽序列之資訊。實例 11 . 用識別分子連接子增強光穩定性

進行實驗以評估在單分子定序期間固定肽之光穩定性。在532 nm下激發光之存在下將實例5中所描述之經染料標記之atClpS2-V1添加至含有固定肽受質的樣品孔中，以由來自ATTO 532之發射監測識別。圖25A中展示代表性跡線。如頂部圖中所展示，觀測到識別在進入實驗大致600秒時停止。底部圖為展示進入反應大致180秒至430秒時之信號脈衝的放大視圖。

圖25B展示此等實驗中所使用之ClpS2蛋白之晶體結構的視覺化。如所展示，充當染料綴合位點之半胱胺酸殘基距末端胺基酸結合位點大致2 nm。假設對肽之光損傷由在結合期間染料與肽之N末端接近引起。為了減輕染料接近之潛在光損傷效應，將ClpS2蛋白經連接子進行染料標記，該連接子使染料與肽之N末端之間的距離增加超過10 nm。連接子包括抗生物素蛋白鏈菌素及雙股核酸；該雙股核酸經兩個Cy3B染料分子標記且經雙生物素部分連接至抗生物素蛋白鏈菌素，且ClpS2蛋白經生物素部分連接至抗生物素蛋白鏈菌素上其餘兩個結合位點中之各者。圖25C中展示使用此染料屏蔽之ClpS2分子的代表性跡線。如頂部圖中所展示，識別時間延長至進入實驗大致6,000秒。底部圖為展示進入反應大致750秒至930秒時之信號脈衝的放大視圖。

用連接子產生DNA-抗生物素蛋白鏈菌素識別分子，該連接子含有經兩個Cy3B染料分子標記且經雙生物素部分連接至抗生物素蛋白鏈菌素之雙股核酸，及經雙生物素部分連接至抗生物素蛋白鏈菌素上其餘兩個結合位點之單一ClpS2蛋白。在單分子肽定序反應中使用此構築體，且來自此等實驗之代表性跡線展示於圖26A至圖26D中。

重複實例6中所描述之定序實驗，其中反應條件如下改變：將DNA-抗生物素蛋白鏈菌素ClpS2識別分子與hTET胺基酸切割試劑組合使用。代表性信號跡線展示於圖27中。實例 12 . 在由多種外肽酶降解期間藉由識別進行之定序

進行實驗以評估具有差異性切割特異性之多種類型的外肽酶在單分子肽定序反應混合物中之用途。將單一肽分子(YAAWAAFADDDWK (SEQ ID NO: 78))經C末端離胺酸殘基固定於晶片之樣品孔中。添加含有用於胺基酸識別之atClpS2-V1及用於胺基酸切割之hTET的緩衝液。代表性跡線顯示於圖28A中，脈衝圖案區域之展開圖展示於圖28B中。

進行實驗以評估在具有差異性特異性之兩種類型之外肽酶存在下的定序反應。將單一肽分子(FYPLPWPDDDYK (SEQ ID NO: 80))經C末端離胺酸殘基固定於晶片之樣品孔中。添加含有用於胺基酸識別之atClpS2-V1及用於胺基酸切割之hTET及yPIP兩者的緩衝液。代表性跡線顯示於圖28C中，脈衝圖案區域之展開圖展示於圖28D中。來自此等反應條件之額外代表性跡線展示於圖28E中。

進行進一步實驗以評估在具有差異性特異性之兩種類型之外肽酶存在下的定序反應。將單一肽分子(YPLPWPDDDYK (SEQ ID NO: 81))經C末端離胺酸殘基固定於晶片之樣品孔中。在一個實驗中，添加含有用於胺基酸識別之atClpS2-V1及用於胺基酸切割之hTET及yPIP兩者的緩衝液。代表性跡線顯示於圖28F中，脈衝圖案區域之展開圖展示於圖28G中。來自此等反應條件之額外代表性跡線展示於圖28H中。在進一步實驗中，添加含有用於胺基酸識別之atClpS2-V1及用於胺基酸切割之PfuTET及yPIP兩者的緩衝液(50 mM MOPS，60 mM KOAc，200 μM Co(OAc)₂ )。代表性跡線顯示於圖28I中，脈衝圖案區域之展開圖展示於圖28J中。等效物及範疇

在申請專利範圍中，除非相反地指示或另外自上下文顯而易見，否則諸如「一(a/an)」及「該」之冠詞可意謂一或超過一。除非相反地指示或以其他方式自上下文顯而易見，否則若一個、多於一個或所有群成員存在於給定產物或方法中、用於給定產物或方法中或以其他方式與給定產物或方法相關，則在該群的一或多個成員之間包括「或」之申請專利範圍或描述視為滿足。本發明包括群中恰好一個成員存在於給定產物或方法中、用於給定產物或方法中或以其他方式與給定產物或方法相關的實施例。本發明包括多於一個或所有群成員存在於給定產物或方法中、用於給定產物或方法中或以其他方式與給定產物或方法相關的實施例。

此外，本發明涵蓋其中來自一或多條所列請求項之一或多個限制、要素、條款及描述性用語經引入另一條請求項中的所有變化、組合及排列。舉例而言，依附於另一請求項之任何申請求項可經修改以包括在依附於同一基本請求項之任何其他請求項中可見的一或多個限制。在要素以清單形式，例如呈馬庫西(Markush)組形式呈現之情況下，亦揭示要素之各子組，且可自該組移除任何要素。應理解，一般而言，在本發明或本發明之態樣稱為包含具體要素及/或特徵時，本發明或本發明態樣之某些實施例由此類要素及/或特徵組成或主要由此類要素及/或特徵組成。出於簡單之目的，彼等實施例尚未具體地以詞語闡述在本文中。

如本文在說明書及申請專利範圍中使用，片語「及/或」應理解為意謂如此結合之要素的「任一者或兩者」，亦即，在一些情況下結合地存在且在其他情況下未結合地存在的要素。使用「及/或」列出的多個要素應以相同方式解釋，亦即，如此結合之「一或多個」要素。可視情況存在除了藉由「及/或」條項所確切地鑑別之要素以外之其他要素，無論與確切地鑑別之彼等要素相關抑或不相關。因此，作為非限制性實例，參考「A及/或B」在結合諸如「包含」之開放式措辭使用時，在一個實施例中，可僅指A (視情況包括除了B以外之要素)；在另一實施例中，可僅指B (視情況包括除了A以外之要素)；在另一實施例中，可指A及B兩者(視情況包括其他要素)；等。

如在本說明書及申請專利範圍中所用，「或」應理解為具有與如上文所定義之「及/或」相同的含義。舉例而言，當分離清單中之項目時，「或」或「及/或」應解釋為包括性的，亦即，包括一些或一列要素中之至少一個而且包括多於一個，及(視情況)其他未列出的項目。只有指示截然相反的術語，諸如「中之僅一者」或「中之恰好一者」或當用於申請專利範圍中時「由……組成」將指包括一些或一列要素中之恰好一個要素。一般而言，當置於排他性術語，諸如「任一者」、「中之一者」、「中之僅一者」或「中之恰好一者」之前時，如本文中所使用之術語「或」應僅解釋為表明排他性替代方式(亦即「一者或另一者但非二者皆」)。當用於申請專利範圍中時，「主要由……組成」應具有如其在專利法律領域中所使用之普通含義。

如本說明書及申請專利範圍中所用，參考一或多個要素之清單的片語「至少一個」應理解為意謂選自要素清單中之任何一或多個要素的至少一個要素，但未必包括要素清單內具體列出的每一個要素中之至少一者，且未必排除要素清單中之要素的任何組合。此定義亦允許可視情況存在除片語「至少一個」所指的要素清單內具體鑑別的要素以外的要素，而無論與具體鑑別的彼等要素相關抑或不相關。因此，作為非限制性實例，「A及B中之至少一者」(或等效地「A或B中之至少一者」或等效地「A及/或B中之至少一者」)在一個實施例中可指至少一個(視情況包括多於一個) A而不存在B (且視情況包括除了B以外的要素)；在另一實施例中，指至少一個(視情況包括多於一個) B而不存在A (且視情況包括除了A以外的要素)；在又一實施例中，指至少一個(視情況包括多於一個) A及至少一個(視情況包括多於一個) B (且視情況包括其他要素)；等。

亦應理解除非截然相反地指示，否則在本文中所主張之包括超過一個步驟或操作之任何方法中，該方法之步驟或操作之順序並非必需限制於列舉該方法之步驟或操作之順序。

在申請專利範圍中以及在上述說明書中，所有過渡性片語，諸如「包含」、「包括」、「攜有」、「具有」、「含有」、「涉及」、「擁有」、「由……構成」及其類似片語，應理解為開放的，亦即，意謂包括但不限於。僅過渡片語「由……組成」及「主要由……組成」應分別為封閉或半封閉過渡片語，如美國專利局專利審查程序手冊(United States Patent Office Manual of Patent Examining Procedures)第2111.03節中所闡述。應瞭解，在替代實施例中，亦涵蓋此文件中使用開放式過渡片語(例如「包含」)描述之實施例，如「由……組成」及「主要由……組成」由開放式過渡片語描述之特徵。舉例而言，若本申請案描述「包含A及B之組合物」，則本申請案亦涵蓋替代實施例「由A及B組成之組合物」及「主要由A及B組成之組合物」。

當給出範圍時，包括端點。此外，除非另外指示或另外自上下文及一般技術者的理解顯而易見，否則表示為範圍之值可在本發明之不同實施例中採用所述範圍內之任何特定值或子範圍，除非上下文另外明確規定，否則達到該範圍下限之單位的十分之一。

本申請案提及各種頒予的專利、公開的專利申請案、期刊文章及其他出版物，以上所有者均以引用之方式併入本文中。若任何併入之參考文獻與本說明書之間存在衝突，則應以本說明書為準。另外，本發明之屬於先前技術之任何特定實施例可明確地自申請專利範圍中之任一或多項排除。因為認為此類實施例為一般技術者所已知，所以其可經排除，即使未在本文中明確地闡述該排除。本發明之任何特定實施例可出於任何原因自任何請求項排除，無論是否與先前技術之存在相關。

熟習此項技術者最多使用常規實驗將認識到或能夠確定本文所描述之特定實施例之許多等效物。本文所描述之本發明實施例之範疇並不意欲限於以上描述，而是實際上如所附申請專利範圍中所闡述。一般技術者將瞭解，可在不脫離如以下申請專利範圍所定義之本發明之精神或範疇的情況下對本說明書進行各種改變及修改。

本文中之變數的任何定義下的化學基團清單之列舉包括呈任何單一基團或所列基團組合的該變數之定義。本文中之變數的實施例的列舉包括呈任何單一實施例或與任何其他實施例或其部分組合之形式的實施例。本文中之實施例的列舉包括呈任何單一實施例或與任何其他實施例或其部分組合之形式的實施例。

1:步驟 1':步驟 2:步驟 3:步驟 4:步驟 100:經標記親和試劑 102:經標記外肽酶 104:經標記適體 106:經標記適體 108:經標記親和試劑 110:發光標記 112:供體標記 114:受體標記 120:多肽 122:多肽 124:連接子 130:表面 140:蛋白酶 150:經標記適體 152:過程 200:經標記外肽酶 202:過程 300:信號輸出 310:經標記親和試劑 320:非特異性外肽酶 400:信號輸出 402:曲線圖 410:經標記親和試劑 420:經標記非特異性肽酶 500:反應性氧物種 502:屏蔽物 504:第一經屏蔽構築體 506:第二經屏蔽構築體 508:第三經屏蔽構築體 510:第四經屏蔽構築體 512:蛋白質-核酸構築體 514:抗生物素蛋白-核酸構築體 516:第一抗生物素蛋白構築體 518:第二抗生物素蛋白構築體 520:第三抗生物素蛋白構築體 522:第四抗生物素蛋白構築體 530:蛋白質屏蔽物 532:第一寡核苷酸股 534:第二寡核苷酸股 536:寡核苷酸屏蔽物 538:樹狀聚合物屏蔽物 540:抗生物素蛋白蛋白質 542:結合位點 544:生物素鍵聯部分 546:雙生物素鍵聯部分 548:非官能性配位體結合位點 550:識別組分 552:屏蔽元件 554:標記組分 560:蛋白質 562:蛋白質-蛋白質複合物 564:蛋白質-配位體複合物 566:雙向抗生物素蛋白複合物 568:三向抗生物素蛋白複合物 570:四向抗生物素蛋白複合物 572:二價抗生物素蛋白複合物 574:樹狀聚合物 576:雙股核酸 578:莖-環 580:聚合物 600:經標記多肽 602:經光漂白之經標記多肽 610:異硫氰酸酯修飾 800:經標記多肽 810:固定進行性外肽酶 820:固定經標記多肽 830:進行性外肽酶 1000:蛋白質樣品 1002:多肽片段 1004:末端經修飾之多肽 1010:末端經修飾之多肽 1012:連接子綴合部分 1020:增溶連接子 1022:多肽綴合部分 1030:連接子綴合多肽 1032:鍵聯 1034:表面綴合部分 1040:SiO₂ 1042:多肽綴合部分 1050:TiO₂或Al₂O₃ 1052:疏水性C_4-18分子；聚四氟乙烯化合物(例如，(CF₂)_4-12)；多元醇，諸如聚乙二醇(例如，PEG_3-100)、聚丙二醇、聚氧乙烯二醇或其組合或變化形式；或兩性離子，諸如磺基甜菜鹼 1060:Si 1070:Al 1080:TiN 1100:說明性處理管線 1102:定序資料 1104:締合事件鑑別技術 1106:胺基酸鑑別技術 1108:(多種)胺基酸序列 1200:說明性過程 1202:操作 1204:操作 1206:操作 1300:說明性過程 1302:操作 1304:操作 1306:操作 1400:電腦系統 1410:處理器 1420:記憶體 1430:非揮發性儲存媒體 1440:網路輸入/輸出(I/O)介面 1450:使用者I/O介面 CP₁:第一特徵圖案 CP₂:第二特徵圖案ipd:脈衝間持續時間M _L:臨限幅度水準pd:脈衝持續時間 sp:信號脈衝 ΔM:幅度變化

熟習此項技術者將理解，本文所描述之圖僅出於說明之目的。應理解，在一些情況下，為輔助理解本發明，本發明之各種態樣可能經放大或擴大展示。在圖式中，在通篇各種圖中，相同參考標號一般係指相同特徵、功能上類似及/或結構上類似之元件。圖式未必為按比例的，而實際上重點在於說明教示內容之原理。圖式不意欲以任何方式限制本教示內容之範疇。

本發明之特徵及優點將自下文結合圖式所闡述之實施方式而變得更顯而易見。

當參考圖式描述實施例時，可使用方向參考(「之上」、「之下」、「頂部」、「底部」、「左側」、「右側」、「水平」、「垂直」等)。此類參考僅意欲作為讀者在正常定向上觀看圖式之輔助。此等方向參考不意欲描述實施裝置之較佳或唯一定向。裝置可以其他定向實施。

如根據實施方式顯而易見，在本申請案通篇，圖中描繪及出於說明的目的進一步描述之實例描述非限制性實施例，且在一些情況下可出於更清楚說明的目的簡化某些方法或省略特徵或步驟。

圖 1A 至圖 1B 展示藉由單分子結合相互作用之偵測(圖1A)及分析(圖1B)進行多肽定序的實例。

圖 1C 至圖 1E 展示根據本申請案之經標記親和試劑及使用方法的各種實例。圖1C描繪經標記親和試劑之示例性組態，包括選擇性結合一或多種類型之末端胺基酸的經標記酶及經標記適體。圖1D大體上描繪使用經標記親和試劑進行之基於降解的多肽定序過程。圖1E展示藉由末端胺基酸偵測、修飾及切割之重複循環，使用經標記適體進行多肽定序之實例。

圖 2 展示使用各自選擇性結合且切割不同類型之末端胺基酸的經標記外肽酶進行即時多肽定序之實例。

圖 3A 至圖 3B 展示藉由評估末端及/或內部胺基酸與經標記親和試劑及經標記切割試劑(例如，經標記非特異性外肽酶)之結合相互作用，進行即時多肽定序之實例。圖3A展示藉由偵測信號輸出中之脈衝系列，進行即時定序之實例。圖3B示意性地描繪溫度依賴性定序過程。

圖 4 展示藉由評估末端及內部胺基酸與經標記親和試劑及經標記非特異性外肽酶之結合相互作用，進行即時多肽定序之實例。

圖 5A 至圖 5E 展示經屏蔽元件標記之親和試劑之非限制性實例。圖5A示出用經習知共價鍵聯標記之親和試劑進行的單分子肽定序。圖5B示出用包含屏蔽元件之親和試劑進行的單分子肽定序。圖5C至圖5E示出根據本申請案之屏蔽元件的各種實例。

圖 6 展示基於經標記多肽中所偵測到之胺基酸之獨特組合鑑別多肽的實例。

圖 7 展示藉由偵測經歷末端胺基酸修飾及切割之重複循環之經標記多肽的發光，進行多肽定序之實例。

圖 8A 至圖 8C 展示藉由經標記多肽之進行性(processive)酶切割，進行多肽定序之實例。圖8A展示藉由經標記多肽由固定末端肽酶之進行性酶切割進行定序之實例。圖8B展示藉由固定經標記多肽由末端肽酶之進行性酶切割進行定序之實例。圖8C示意性地示出根據圖8B進行之即時定序過程之實例。

圖 9 示意性地示出使用固定ATP依賴型蛋白酶、供體標記ATP及多肽受質之受體標記胺基酸，藉由基於輔因子之FRET進行定序之實例。

圖 10A 至圖 10C 展示針對根據本申請案之多肽及蛋白質之分析，製備樣品及樣品孔表面之各種實例。圖10A大體上描繪由蛋白質樣品製備末端經修飾多肽之示例性過程。圖10B大體上描繪將增溶連接子綴合至多肽之示例性過程。圖10C展示具有可用於促進單分子固定至底表面之經修飾表面之樣品孔的示例性示意圖。

圖 11 為根據本文所描述之技術的一些實施例，用於分析在多肽降解過程中獲得之資料之說明性序列資料處理管線的圖解。

圖 12 為根據本文所描述之技術的一些實施例，用於確定多肽分子之胺基酸序列之說明性過程的流程圖。

圖 13 為根據本文所描述之技術的一些實施例，用於確定表示多肽之胺基酸序列之說明性過程的流程圖。

圖 14 為可用於實施本文所描述之技術的一些實施例之說明性電腦系統的方塊圖。

圖 15A 至圖 15C 展示針對由不同增溶連接子提供之提高溶解度製備及評估之所選肽-連接子綴合物的實驗資料。圖15A展示經合成及評估之肽-連接子綴合物的示例性結構。圖15B展示來自LCMS之結果，其展現N末端處之肽切割。圖15C展示來自負載實驗之結果。

圖 16 展示基於實驗結果對所選外肽酶之胺基酸切割活性的概述。

圖 17A 至圖 17C 展示用於偵測及切割末端胺基酸之染料/肽共軛物分析的實驗資料。圖17A展示用於進行染料/肽共軛物分析之示例性方案及結構。圖17B展示在晶片上分析中負載至樣品孔中之肽-連接子綴合物的成像結果。圖17C展示偵測肽-綴合物負載及末端胺基酸切割之示例性信號跡線。

圖 18A 至圖 18F 展示用於偵測及切割末端胺基酸之FRET染料/肽綴合物分析的實驗資料。圖18A展示用於進行FRET染料/肽綴合物分析之示例性方案及結構。圖18B展示不同時間點之FRET成像結果。圖18C展示不同時間點處之剪切效率。圖18D展示不同時間點中之各者處所顯示的剪切。圖18E展示用來自鼠疫耶氏桿菌(Yersinia pestis )之脯胺酸亞胺基肽酶(yPIP)進行之不同時間點的額外FRET成像結果。圖18F展示用來自解蛋白弧菌(Vibrio proteolyticus )之胺肽酶(VPr)進行之不同時間點的FRET成像結果。

圖 19A 至圖 19H 展示由經標記親和試劑進行末端胺基酸區分之實驗資料。圖19A展示針對此等實驗標記之ClpS2蛋白的晶體結構。圖19B展示單分子強度跡線，其說明由經標記ClpS2蛋白進行之N末端胺基酸區分。圖19C為展示不同末端胺基酸之均值脈衝持續時間的曲線圖。圖19D為展示不同末端胺基酸之均值脈衝間持續時間的曲線圖。圖19E展示進一步示出不同末端胺基酸當中判別脈衝持續時間之曲線圖。圖19F、圖19G及圖19H展示來自表明白胺酸由來自細長嗜熱聚球藻(Thermosynochoccus elongatus )之ClpS蛋白(teClpS)識別之停留時間分析的示例性結果。圖19I展示來自表明苯丙胺酸、白胺酸、色胺酸及酪胺酸由根癌農桿菌(A . tumefaciens ) ClpS1可區分識別之停留時間分析的示例性結果。圖19J展示來自停留時間分析之示例性結果，其展現由細長聚球藻(S . elongatus ) ClpS2進行之白胺酸識別。圖19K至圖19L展示來自停留時間分析之示例性結果，其展現由GID4進行之脯胺酸識別。

圖 20A 至圖 20D 展示來自使用同一反應混合物中之經標記ClpS2識別蛋白及胺肽酶切割試劑，即時進行多肽定序反應之示例性結果。圖20A展示第一定序反應之信號跡線資料。圖20B展示圖20A中所展示之信號跡線資料的脈衝持續時間統計資料。圖20C展示第二定序反應之信號跡線資料。圖20D展示圖20C中所展示之信號跡線資料的脈衝持續時間統計資料。

圖 21A 至圖 21F 展示由經標記外肽酶進行之末端胺基酸鑑別及切割的實驗資料。圖21A展示針對此等實驗位點特異性標記之脯胺酸亞胺基肽酶(yPIP)之晶體結構。圖21B展示純化蛋白質產品之標記程度。圖21C為證實yPIP之位點特異性標記之SDS page的影像。圖21D為證實位點特異性標記之SDS page凝膠的過度曝光影像。圖21E為證實經標記蛋白質產品之純度之考馬斯(Coomassie)染色凝膠的影像。圖21F為表明經標記外肽酶之切割活性的HPLC跡線。序列YPYPYPK對應於SEQ ID NO: 82。序列PYPYPK對應於SEQ ID NO: 83。

圖 22A 至圖 22F 展示來自評估含有特定轉譯後修飾之胺基酸識別之實驗的資料。圖22A展示表明磷酸化酪胺酸由含SH2域之蛋白質識別的代表性跡線；圖22B展示對應於圖22A之跡線的脈衝持續時間資料；且圖22C展示針對跡線測定之統計資料。圖22D至圖22F展示來自陰性對照實驗之代表性跡線。

圖 23 為展示來自評估次末端(penultimate)胺基酸對脈衝持續時間之影響的實驗之中值脈衝持續時間的曲線圖。

圖 24A 至圖 24C 展示來自評估由差異性標記之識別分子進行的同時胺基酸識別之實驗的資料。圖24A展示代表性跡線。圖24B為比較在此等實驗期間針對各識別分子獲得之脈衝持續時間資料的曲線圖。圖24C展示此等實驗之脈衝持續時間統計資料。

圖 25A 至圖 25C 展示來自評估在單分子識別期間肽之光穩定性之實驗的資料。圖25A展示來自使用距胺基酸結合位點約2 nm用染料標記之atClpS2-V1進行識別的代表性跡線。圖25B展示此等實驗中所使用之ClpS2蛋白結構的視覺化。圖25C展示來自使用距胺基酸結合位點＞10 nm經DNA/蛋白質連接子用染料標記之ClpS2進行識別的代表性跡線。

圖 26A 至圖 26D 展示來自在胺肽酶切割試劑存在下，使用經DNA/抗生物素蛋白鏈菌素(streptavidin)連接子標記之ClpS2識別蛋白，在互補金氧半導體(CMOS)晶片上即時進行多肽定序反應之代表性跡線。

圖 27 展示來自在掘越氏火球菌(Pyrococcus horikoshii ) TET胺肽酶切割試劑存在下，使用經DNA/抗生物素蛋白鏈菌素連接子標記之atClpS2-V1識別蛋白即時進行多肽定序反應之代表性跡線。

圖 28A 至圖 28J 展示來自使用具有差異性切割特異性之多個類型的外肽酶即時進行多肽定序反應之代表性跡線資料。圖28A展示來自用hTET外肽酶進行之反應的代表性跡線，擴展脈衝圖案區域展示於圖28B中。圖28A中之序列YAAWAAFADDDWK對應於SEQ ID NO: 78。圖28C展示來自用hTET及yPIP外肽酶兩者進行之反應的代表性跡線，擴展脈衝圖案區域展示於圖28D中，且額外代表性跡線展示於圖28E中。圖28C中之序列FYPLPWPDDDYK對應於SEQ ID NO: 80。圖28F展示來自用hTET及yPIP外肽酶兩者進行之另一反應的代表性跡線，擴展脈衝圖案區域展示於圖28G中，且額外代表性跡線展示於圖28H中。圖28I展示來自用PfuTET及yPIP外肽酶兩者進行之反應的代表性跡線，擴展脈衝圖案區域展示於圖28J中。圖28F及圖28I中之序列YPLPWPDDDYK對應於SEQ ID NO: 81。

200:經標記外肽酶

202:過程

Claims

一種方法，其包含：在多肽之降解過程中獲得資料；分析該資料，以確定對應於在該降解過程中在該多肽之末端處依序暴露之胺基酸的該資料之部分；及輸出表示該多肽之胺基酸序列。
如請求項1之方法，其中該資料指示在該降解過程中在該多肽之該末端處之胺基酸身分。
如請求項2之方法，其中該資料指示在該降解過程中由在該末端處結合至不同類型之末端胺基酸的一或多種胺基酸識別分子產生之信號。
如請求項1之方法，其中該資料指示在該降解過程中產生之發光信號。
如請求項1之方法，其中該資料指示在該降解過程中產生之電信號。
如請求項1之方法，其中分析該資料進一步包含偵測切割事件系列，及確定在連續切割事件之間的該資料之部分。
如請求項1之方法，其中分析該資料進一步包含針對個別部分中之各者，確定一種類型之胺基酸。
如請求項1之方法，其中個別部分中之各者包含脈衝圖案，且分析該資料進一步包含針對該等部分中之一或多者，基於其各別脈衝圖案確定一種類型之胺基酸。
如請求項8之方法，其中確定胺基酸之該類型進一步包含在該資料超過臨限值時，鑑別一部分內之時間量，及將該時間量與該部分之持續時間進行比較。
如請求項8之方法，其中確定胺基酸之該類型進一步包含針對一或多個部分中之各者，鑑別至少一個脈衝持續時間。
如請求項8之方法，其中確定胺基酸之該類型進一步包含針對一或多個部分中之各者，鑑別至少一個脈衝間持續時間。
如請求項1之方法，其中胺基酸序列包括對應於該等部分之胺基酸系列。
一種系統，其包含：至少一種硬體處理器；及至少一種儲存處理器可執行指令之非暫時性電腦可讀儲存媒體，該等處理器可執行指令在由該至少一種硬體處理器執行時，使該至少一種硬體處理器進行如請求項1至12中任一項之方法。
至少一種儲存處理器可執行指令之非暫時性電腦可讀儲存媒體，該等處理器可執行指令在由至少一種硬體處理器執行時，使該至少一種硬體處理器進行如請求項1至12中任一項之方法。
一種多肽定序之方法，該方法包含：使單一多肽分子與一或多種末端胺基酸識別分子接觸；及偵測信號脈衝系列，該信號脈衝系列指示該一或多種末端胺基酸識別分子與該單一多肽降解時在該單一多肽之末端處暴露之連續胺基酸的締合，藉此對該單一多肽分子進行定序。
如請求項15之方法，其中該一或多種末端胺基酸識別分子與在該末端處暴露之各類型之胺基酸的締合在該信號脈衝系列中產生不同於在該末端處暴露之其他類型之胺基酸的特徵圖案。
如請求項16之方法，其中該特徵圖案包含該信號脈衝系列之一部分。
如請求項17之方法，其中該特徵圖案之信號脈衝對應於末端胺基酸識別分子與在該末端處暴露之胺基酸之間的個別締合事件。
如請求項18之方法，其中該特徵圖案之該信號脈衝包含脈衝持續時間，該脈衝持續時間係該末端胺基酸識別分子與在該末端處暴露之該胺基酸之間的結合之解離速率的特徵。
如請求項19之方法，其中該特徵圖案之各信號脈衝由脈衝間持續時間與另一信號脈衝間隔開，該脈衝間持續時間係末端胺基酸識別分子結合之締合速率的特徵。
如請求項16至20中任一項之方法，其中該特徵圖案對應於與在該單一多肽分子之該末端處暴露之該胺基酸的可逆末端胺基酸識別分子結合相互作用系列。
如請求項21之方法，其中該可逆末端胺基酸識別分子結合相互作用系列包含在該單一多肽分子之該末端處可逆形成一種二元複合物物種。
如請求項21之方法，其中該可逆末端胺基酸識別分子結合相互作用系列包含在該單一多肽分子之該末端處可逆形成不同二元複合物物種。
如請求項16至23中任一項之方法，其中該特徵圖案指示在該單一多肽分子之該末端處暴露之該胺基酸，及在相鄰位置處之胺基酸。
如請求項24之方法，其中在該末端處暴露之該胺基酸與在該相鄰位置處之該胺基酸具有不同類型。
如請求項15至25中任一項之方法，其中定序包含鑑別該單一多肽降解時在該單一多肽之該末端處暴露之各類型的連續胺基酸。
如請求項15至25中任一項之方法，其中定序包含鑑別該單一多肽降解時在該單一多肽之該末端處暴露之所有類型的連續胺基酸之一部分。
如請求項15至27中任一項之方法，其中定序包含確定該單一多肽降解時在該單一多肽之該末端處暴露之連續胺基酸的相對位置。
如請求項15至28中任一項之方法，其中定序包含在該單一多肽分子中鑑別至少兩個相鄰胺基酸。
如請求項15至29中任一項之方法，其中定序包含在該單一多肽分子中鑑別至少兩個非相鄰胺基酸。
如請求項15至30中任一項之方法，其中定序包含將在該末端處暴露之胺基酸鑑別為天然存在之胺基酸、非天然胺基酸或其經修飾變異體。
如請求項15至31中任一項之方法，其中定序包含將在該末端處暴露之胺基酸鑑別為具有帶電、不帶電、極性、非極性、疏水性、芳族或其組合之側鏈。
如請求項32之方法，其中該側鏈帶負電或帶正電。
如請求項15至33中任一項之方法，其中定序包含將在該末端處暴露之胺基酸鑑別為選自以下的一種類型：丙胺酸、精胺酸、天冬醯胺酸、天冬胺酸、半胱胺酸、麩醯胺酸、麩胺酸、甘胺酸、組胺酸、異白胺酸、白胺酸、離胺酸、甲硫胺酸、苯丙胺酸、脯胺酸、硒半胱胺酸、絲胺酸、蘇胺酸、色胺酸、酪胺酸及纈胺酸。
如請求項15至34中任一項之方法，其中定序包含將在該末端處暴露之胺基酸鑑別為具有轉譯後修飾。
如請求項35之方法，其中該轉譯後修飾選自以下：乙醯化、ADP-核糖基化、凋亡蛋白酶切割、瓜胺酸化、甲醯化、N鍵聯糖基化、O鍵聯糖基化、羥基化、甲基化、豆蔻醯化、類泛素化、硝化、氧化、棕櫚醯化、磷酸化、異戊烯化、S-亞硝基化、硫酸化、類小泛素化及泛素化。
如請求項15至36中任一項之方法，其中該信號脈衝系列包含光信號之幅度隨時間推移之變化系列。
如請求項37之方法，其中該系列之各信號脈衝包含複數個光子發射事件。
如請求項38之方法，其中定序進一步包含確定以下中之一或多者：發光壽命、發光亮度、發光強度、發光波長、發光偏振及發光量子產率。
如請求項15至39中任一項之方法，其中該信號脈衝系列包含電信號之幅度隨時間推移之變化系列。
如請求項40之方法，其中該信號脈衝系列包含對應於可逆單分子結合相互作用之導電性轉變。
如請求項15至41中任一項之方法，其中該一或多種末端胺基酸識別分子中之各者包含識別蛋白或識別核酸。
如請求項42之方法，其中該識別蛋白係降解路徑蛋白、肽酶、抗體、胺基轉移酶、tRNA合成酶或含SH2域之蛋白質或其片段。
如請求項43之方法，其中該降解路徑蛋白係N端規則路徑蛋白或其突變體或變異體。
如請求項44之方法，其中該N端規則路徑蛋白係Arg/N端規則路徑蛋白、Ac/N端規則路徑蛋白或Pro/N端規則路徑蛋白。
如請求項45之方法，其中該N端規則路徑蛋白係Gid蛋白、UBR匣蛋白或其含UBR匣域之片段、p62蛋白或其含ZZ域之片段或ClpS蛋白。
如請求項46之方法，其中該Gid蛋白係來自釀酒酵母或其同源物種之Gid4或Gid10。
如請求項46之方法，其中該UBR匣蛋白係來自人類、釀酒酵母或其同源物種之UBR1或UBR2。
如請求項46之方法，其中該p62蛋白係來自人類、大鼠或其同源物種之p62。
如請求項46之方法，其中該ClpS蛋白係來自根癌農桿菌、新月柄桿菌(C . crescentus )、大腸桿菌、細長聚球藻、惡性瘧原蟲、細長嗜熱聚球藻或其同源物種之ClpS1或ClpS2。
如請求項42至50中任一項之方法，其中該識別蛋白係合成蛋白或重組蛋白。
如請求項42之方法，其中該識別核酸係核酸適體。
如請求項15至52中任一項之方法，其中該一或多種末端胺基酸識別分子中之各者包含可偵測標記。
如請求項53之方法，其中該可偵測標記係發光標記或導電性標記。
如請求項15至54中任一項之方法，其中該單一多肽分子固定至表面。
如請求項55之方法，其中該單一多肽分子經該一或多種末端胺基酸識別分子所締合之末端的遠端端接末端固定至該表面。
如請求項55之方法，其中該單一多肽分子經羧基端接末端固定。
如請求項55之方法，其中該單一多肽分子經胺基端接末端固定。
如請求項55至58中任一項之方法，其中該單一多肽分子經連接子固定至該表面。
如請求項59之方法，其中該連接子包含生物分子，視情況其中該生物分子係寡核苷酸。
如請求項15至60中任一項之方法，其中該單一多肽分子由切割試劑降解，該切割試劑自該單一多肽分子之該末端移除一或多個胺基酸。
如請求項61之方法，其進一步包含偵測指示該切割試劑與該末端之締合的信號。
如請求項61或62之方法，其中該切割試劑包含可偵測標記。
如請求項63之方法，其中該可偵測標記係發光標記或導電性標記。
如請求項15至64中任一項之方法，其中該信號脈衝系列係即時信號脈衝系列。
一種系統，其包含：至少一種硬體處理器；及至少一種儲存處理器可執行指令之非暫時性電腦可讀儲存媒體，該等處理器可執行指令在由該至少一種硬體處理器執行時，使該至少一種硬體處理器進行如請求項15至65中任一項之方法。
至少一種儲存處理器可執行指令之非暫時性電腦可讀儲存媒體，該等處理器可執行指令在由至少一種硬體處理器執行時，使該至少一種硬體處理器進行如請求項15至65中任一項之方法。
一種對多肽進行定序之方法，該方法包含：使反應混合物中之單一多肽分子與組合物接觸，該組合物包含一或多種末端胺基酸識別分子及切割試劑；及在該切割試劑存在下，偵測指示該一或多種末端胺基酸識別分子與該單一多肽分子之末端締合的信號脈衝系列，其中該信號脈衝系列指示作為由切割試劑進行之末端胺基酸切割的結果，隨時間推移在該末端處暴露之胺基酸系列。
如請求項68之方法，其中該一或多種末端胺基酸識別分子與在該末端處暴露之各類型之胺基酸的締合在該信號脈衝系列中產生不同於在該末端處暴露之其他類型之胺基酸的特徵圖案。
如請求項69之方法，其中該特徵圖案包含該信號脈衝系列之一部分。
如請求項70之方法，其中該特徵圖案之信號脈衝對應於末端胺基酸識別分子與在該末端處暴露之胺基酸之間的個別締合事件。
如請求項71之方法，其中該特徵圖案之該信號脈衝包含脈衝持續時間，該脈衝持續時間係該末端胺基酸識別分子與在該末端處暴露之該胺基酸之間的結合之解離速率的特徵。
如請求項72之方法，其中該特徵圖案之各信號脈衝由脈衝間持續時間與另一信號脈衝間隔開，該脈衝間持續時間係末端胺基酸識別分子結合之締合速率的特徵。
如請求項69至73中任一項之方法，其中該特徵圖案對應於與在該單一多肽分子之該末端處暴露之該胺基酸的可逆末端胺基酸識別分子結合相互作用系列。
如請求項74之方法，其中該可逆末端胺基酸識別分子結合相互作用系列包含在該單一多肽分子之該末端處可逆形成一種二元複合物物種。
如請求項74之方法，其中該可逆末端胺基酸識別分子結合相互作用系列包含在該單一多肽分子之該末端處可逆形成不同二元複合物物種。
如請求項69至76中任一項之方法，其中該特徵圖案指示在該單一多肽分子之該末端處暴露之該胺基酸，及在相鄰位置處之胺基酸。
如請求項77之方法，其中在該末端處暴露之該胺基酸與在該相鄰位置處之該胺基酸具有不同類型。
如請求項68至78中任一項之方法，其中定序包含鑑別該單一多肽降解時在該單一多肽之該末端處暴露之各類型的連續胺基酸。
如請求項68至78中任一項之方法，其中定序包含鑑別該單一多肽降解時在該單一多肽之該末端處暴露之所有類型的連續胺基酸之一部分。
如請求項68至80中任一項之方法，其中定序包含確定該單一多肽降解時在該單一多肽之該末端處暴露之連續胺基酸的相對位置。
如請求項68至81中任一項之方法，其中定序包含在該單一多肽分子中鑑別至少兩個相鄰胺基酸。
如請求項68至82中任一項之方法，其中定序包含在該單一多肽分子中鑑別至少兩個非相鄰胺基酸。
如請求項68至83中任一項之方法，其中定序包含將在該末端處暴露之胺基酸鑑別為天然存在之胺基酸、非天然胺基酸或其經修飾變異體。
如請求項68至84中任一項之方法，其中定序包含將在該末端處暴露之胺基酸鑑別為具有帶電、不帶電、極性、非極性、疏水性、芳族或其組合之側鏈。
如請求項85之方法，其中該側鏈帶負電或帶正電。
如請求項68至86中任一項之方法，其中定序包含將在該末端處暴露之胺基酸鑑別為選自以下的一種類型：丙胺酸、精胺酸、天冬醯胺酸、天冬胺酸、半胱胺酸、麩醯胺酸、麩胺酸、甘胺酸、組胺酸、異白胺酸、白胺酸、離胺酸、甲硫胺酸、苯丙胺酸、脯胺酸、硒半胱胺酸、絲胺酸、蘇胺酸、色胺酸、酪胺酸及纈胺酸。
如請求項68至87中任一項之方法，其中定序包含將在該末端處暴露之胺基酸鑑別為具有轉譯後修飾。
如請求項88之方法，其中該轉譯後修飾選自以下：乙醯化、ADP-核糖基化、凋亡蛋白酶切割、瓜胺酸化、甲醯化、N鍵聯糖基化、O鍵聯糖基化、羥基化、甲基化、豆蔻醯化、類泛素化、硝化、氧化、棕櫚醯化、磷酸化、異戊烯化、S-亞硝基化、硫酸化、類小泛素化及泛素化。
如請求項68至89中任一項之方法，其中該信號脈衝系列包含光信號之幅度隨時間推移之變化系列。
如請求項90之方法，其中該系列之各信號脈衝包含複數個光子發射事件。
如請求項91之方法，其中定序進一步包含確定以下中之一或多者：發光壽命、發光亮度、發光強度、發光波長、發光偏振及發光量子產率。
如請求項68至92中任一項之方法，其中該信號脈衝系列包含電信號之幅度隨時間推移之變化系列。
如請求項93之方法，其中該信號脈衝系列包含對應於可逆單分子結合相互作用之導電性轉變。
如請求項68至94中任一項之方法，其中該一或多種末端胺基酸識別分子中之各者包含識別蛋白或識別核酸。
如請求項95之方法，其中該識別蛋白係降解路徑蛋白、肽酶、抗體、胺基轉移酶、tRNA合成酶或含SH2域之蛋白質或其片段。
如請求項96之方法，其中該降解路徑蛋白係N端規則路徑蛋白或其突變體或變異體。
如請求項97之方法，其中該N端規則路徑蛋白係Arg/N端規則路徑蛋白、Ac/N端規則路徑蛋白或Pro/N端規則路徑蛋白。
如請求項98之方法，其中該N端規則路徑蛋白係Gid蛋白、UBR匣蛋白或其含UBR匣域之片段、p62蛋白或其含ZZ域之片段或ClpS蛋白。
如請求項99之方法，其中該Gid蛋白係來自釀酒酵母或其同源物種之Gid4或Gid10。
如請求項99之方法，其中該UBR匣蛋白係來自人類、釀酒酵母或其同源物種之UBR1或UBR2。
如請求項99之方法，其中該p62蛋白係來自人類、大鼠或其同源物種之p62。
如請求項99之方法，其中該ClpS蛋白係來自根癌農桿菌、新月柄桿菌、大腸桿菌、細長聚球藻、惡性瘧原蟲、細長嗜熱聚球藻或其同源物種之ClpS1或ClpS2。
如請求項95至103中任一項之方法，其中該識別蛋白係合成蛋白或重組蛋白。
如請求項95之方法，其中該識別核酸係核酸適體。
如請求項68至105中任一項之方法，其中該一或多種末端胺基酸識別分子中之各者包含可偵測標記。
如請求項106之方法，其中該可偵測標記係發光標記或導電性標記。
如請求項68至107中任一項之方法，其中該單一多肽分子固定至表面。
如請求項108之方法，其中該單一多肽分子經該一或多種末端胺基酸識別分子所締合之末端的遠端端接末端固定至該表面。
如請求項108之方法，其中該單一多肽分子經羧基端接末端固定。
如請求項108之方法，其中該單一多肽分子經胺基端接末端固定。
如請求項108至111中任一項之方法，其中該單一多肽分子經連接子固定至該表面。
如請求項112之方法，其中該連接子包含生物分子，視情況其中該生物分子係寡核苷酸。
如請求項68至113中任一項之方法，其進一步包含偵測指示該切割試劑與該末端之締合的信號。
如請求項68至114中任一項之方法，其中該切割試劑包含可偵測標記。
如請求項115之方法，其中該可偵測標記係發光標記或導電性標記。
如請求項68至116中任一項之方法，其中該信號脈衝系列係即時信號脈衝系列。
一種系統，其包含：至少一種硬體處理器；及至少一種儲存處理器可執行指令之非暫時性電腦可讀儲存媒體，該等處理器可執行指令在由該至少一種硬體處理器執行時，使該至少一種硬體處理器進行如請求項68至117中任一項之方法。
至少一種儲存處理器可執行指令之非暫時性電腦可讀儲存媒體，該等處理器可執行指令在由至少一種硬體處理器執行時，使該至少一種硬體處理器進行如請求項68至117中任一項之方法。
一種多肽定序之方法，該方法包含： a)鑑別單一多肽分子之末端處之第一胺基酸； b)移除該第一胺基酸以暴露該單一多肽分子之該末端處之第二胺基酸；及 c)鑑別該單一多肽分子之該末端處之該第二胺基酸，其中(a)至(c)在單一反應混合物中進行。
如請求項120之方法，其中(a)至(c)依序發生。
如請求項120之方法，其中(c)在(a)及(b)之前發生。
如請求項120至122中任一項之方法，其中該單一反應混合物包含一或多種末端胺基酸識別分子。
如請求項123之方法，其中藉由偵測指示該一或多種末端胺基酸識別分子與該單一多肽分子之該末端之締合的信號脈衝系列，鑑別該等第一及第二胺基酸。
如請求項124之方法，其中該一或多種末端胺基酸識別分子與該第一胺基酸之締合在該信號脈衝系列中產生不同於該第二胺基酸之特徵圖案。
如請求項122至125中任一項之方法，其中該一或多種末端胺基酸識別分子中之各者包含識別蛋白或識別核酸。
如請求項126之方法，其中該識別蛋白係降解路徑蛋白、肽酶、抗體、胺基轉移酶、tRNA合成酶或含SH2域之蛋白質或其片段。
如請求項127之方法，其中該降解路徑蛋白係N端規則路徑蛋白或其突變體或變異體。
如請求項128之方法，其中該N端規則路徑蛋白係Arg/N端規則路徑蛋白、Ac/N端規則路徑蛋白或Pro/N端規則路徑蛋白。
如請求項129之方法，其中該N端規則路徑蛋白係Gid蛋白、UBR匣蛋白或其含UBR匣域之片段、p62蛋白或其含ZZ域之片段或ClpS蛋白。
如請求項130之方法，其中該Gid蛋白係來自釀酒酵母或其同源物種之Gid4或Gid10。
如請求項130之方法，其中該UBR匣蛋白係來自人類、釀酒酵母或其同源物種之UBR1或UBR2。
如請求項130之方法，其中該p62蛋白係來自人類、大鼠或其同源物種之p62。
如請求項130之方法，其中該ClpS蛋白係來自根癌農桿菌、新月柄桿菌、大腸桿菌、細長聚球藻、惡性瘧原蟲、細長嗜熱聚球藻或其同源物種之ClpS1或ClpS2。
如請求項126至134中任一項之方法，其中該識別蛋白係合成蛋白或重組蛋白。
如請求項126之方法，其中該識別核酸係核酸適體。
如請求項122至136中任一項之方法，其中該一或多種末端胺基酸識別分子中之各者包含可偵測標記。
如請求項137之方法，其中該可偵測標記係發光標記或導電性標記。
如請求項120至138中任一項之方法，其中該單一反應混合物包含切割試劑，其自該單一多肽分子之該末端移除一或多個胺基酸。
如請求項139之方法，其中該第一胺基酸由該切割試劑移除。
如請求項139或140之方法，其中該切割試劑包含可偵測標記。
如請求項141之方法，其中該可偵測標記係發光標記或導電性標記。
如請求項120至142中任一項之方法，其中該單一多肽分子固定至表面。
如請求項143之方法，其中該單一多肽分子經該末端之遠端端接末端固定至該表面，該第一胺基酸自該末端移除。
如請求項143之方法，其中該單一多肽分子經羧基端接末端固定。
如請求項143之方法，其中該單一多肽分子經胺基端接末端固定。
如請求項143至146中任一項之方法，其中該單一多肽分子經連接子固定至該表面。
如請求項147之方法，其中該連接子包含生物分子，視情況其中該生物分子係寡核苷酸。
如請求項124至148中任一項之方法，其中該信號脈衝系列係即時信號脈衝系列。
一種系統，其包含：至少一種硬體處理器；及至少一種儲存處理器可執行指令之非暫時性電腦可讀儲存媒體，該等處理器可執行指令在由該至少一種硬體處理器執行時，使該至少一種硬體處理器進行如請求項120至149中任一項之方法。
至少一種儲存處理器可執行指令之非暫時性電腦可讀儲存媒體，該等處理器可執行指令在由至少一種硬體處理器執行時，使該至少一種硬體處理器進行如請求項120至149中任一項之方法。
一種鑑別多肽之胺基酸之方法，該方法包含：使單一多肽分子與結合至該單一多肽分子之一或多種胺基酸識別分子接觸；在多肽降解條件下，偵測指示該一或多種胺基酸識別分子與該單一多肽分子之締合的信號脈衝系列；及基於該信號脈衝系列中之第一特徵圖案，鑑別該單一多肽分子中第一類型之胺基酸。
如請求項152之方法，其中該第一特徵圖案包含該信號脈衝系列之至少一部分。
如請求項153之方法，其中該第一特徵圖案之信號脈衝對應於胺基酸識別分子與該第一類型之胺基酸之間的個別締合事件。
如請求項154之方法，其中該第一特徵圖案之該信號脈衝包含脈衝持續時間，該脈衝持續時間係該胺基酸識別分子與該第一類型之胺基酸之間的結合之解離速率的特徵。
如請求項155之方法，其中該第一特徵圖案之各信號脈衝由脈衝間持續時間與另一信號脈衝間隔開，該脈衝間持續時間係胺基酸識別分子結合之締合速率的特徵。
如請求項152至156中任一項之方法，其中該第一特徵圖案對應於與該單一多肽分子中之該第一類型之胺基酸的可逆胺基酸識別分子結合相互作用系列。
如請求項157之方法，其中該可逆胺基酸識別分子結合相互作用系列包含在該單一多肽分子之該末端處可逆形成一種二元複合物物種。
如請求項157之方法，其中該可逆胺基酸識別分子結合相互作用系列包含在該單一多肽分子之該末端處可逆形成不同二元複合物物種。
如請求項152至159中任一項之方法，其中該單一多肽分子在該單一多肽分子之末端位置處包含該第一類型之胺基酸。
如請求項160之方法，其中該第一特徵圖案指示在該末端位置處之該第一類型之胺基酸，及在相鄰位置處之胺基酸類型。
如請求項161之方法，其中在該末端位置處之胺基酸與在相鄰位置處之胺基酸具有不同類型。
如請求項152至162中任一項之方法，其中該單一多肽分子在該單一多肽分子之內部位置處包含該第一類型之胺基酸。
如請求項160至163中任一項之方法，其中該單一多肽分子在該單一多肽分子之該末端位置處及非相鄰內部位置處包含該第一類型之胺基酸。
如請求項164之方法，其中該第一特徵圖案指示在該末端位置處之該第一類型之胺基酸，及在非相鄰內部位置處之胺基酸類型。
如請求項164或165之方法，其中該第一特徵圖案指示該單一多肽分子中該第一類型之胺基酸的豐度。
如請求項152至166中任一項之方法，其中鑑別包含將該第一類型之胺基酸鑑別為天然存在之胺基酸、非天然胺基酸或其經修飾變異體。
如請求項152至167中任一項之方法，其中鑑別包含將該第一類型之胺基酸鑑別為具有帶電、不帶電、極性、非極性、疏水性、芳族或其組合之側鏈。
如請求項168之方法，其中該側鏈帶負電或帶正電。
如請求項152至169中任一項之方法，其中鑑別包含將該第一類型之胺基酸鑑別為選自以下的一種類型：丙胺酸、精胺酸、天冬醯胺酸、天冬胺酸、半胱胺酸、麩醯胺酸、麩胺酸、甘胺酸、組胺酸、異白胺酸、白胺酸、離胺酸、甲硫胺酸、苯丙胺酸、脯胺酸、硒半胱胺酸、絲胺酸、蘇胺酸、色胺酸、酪胺酸及纈胺酸。
如請求項152至170中任一項之方法，其中鑑別包含將該第一類型之胺基酸鑑別為具有轉譯後修飾。
如請求項171之方法，其中該轉譯後修飾選自以下：乙醯化、ADP-核糖基化、凋亡蛋白酶切割、瓜胺酸化、甲醯化、N鍵聯糖基化、O鍵聯糖基化、羥基化、甲基化、豆蔻醯化、類泛素化、硝化、氧化、棕櫚醯化、磷酸化、異戊烯化、S-亞硝基化、硫酸化、類小泛素化及泛素化。
如請求項152至172中任一項之方法，其中該信號脈衝系列包含光信號之幅度隨時間推移之變化系列。
如請求項173之方法，其中該系列之各信號脈衝包含複數個光子發射事件。
如請求項174之方法，其中鑑別該第一類型之胺基酸進一步包含確定以下中之一或多者：發光壽命、發光亮度、發光強度、發光波長、發光偏振及發光量子產率。
如請求項152至175中任一項之方法，其中該信號脈衝系列包含電信號之幅度隨時間推移之變化系列。
如請求項176之方法，其中該第一特徵圖案包含對應於可逆單分子結合相互作用之導電性轉變。
如請求項152至177中任一項之方法，其中該一或多種胺基酸識別分子中之各者包含識別蛋白或識別核酸。
如請求項178之方法，其中該識別蛋白係降解路徑蛋白、肽酶、抗體、胺基轉移酶、tRNA合成酶或含SH2域之蛋白質或其片段。
如請求項179之方法，其中該降解路徑蛋白係N端規則路徑蛋白或其突變體或變異體。
如請求項180之方法，其中該N端規則路徑蛋白係Arg/N端規則路徑蛋白、Ac/N端規則路徑蛋白或Pro/N端規則路徑蛋白。
如請求項181之方法，其中該N端規則路徑蛋白係Gid蛋白、UBR匣蛋白或其含UBR匣域之片段、p62蛋白或其含ZZ域之片段或ClpS蛋白。
如請求項182之方法，其中該Gid蛋白係來自釀酒酵母或其同源物種之Gid4或Gid10。
如請求項182之方法，其中該UBR匣蛋白係來自人類、釀酒酵母或其同源物種之UBR1或UBR2。
如請求項182之方法，其中該p62蛋白係來自人類、大鼠或其同源物種之p62。
如請求項182之方法，其中該ClpS蛋白係來自根癌農桿菌、新月柄桿菌、大腸桿菌、細長聚球藻、惡性瘧原蟲、細長嗜熱聚球藻或其同源物種之ClpS1或ClpS2。
如請求項178至186中任一項之方法，其中該識別蛋白係合成蛋白或重組蛋白。
如請求項178之方法，其中該識別核酸係核酸適體。
如請求項152至188中任一項之方法，其中該一或多種胺基酸識別分子中之各者包含可偵測標記。
如請求項189之方法，其中該可偵測標記係發光標記或導電性標記。
如請求項152至190中任一項之方法，其中該單一多肽分子固定至表面。
如請求項191之方法，其中該單一多肽分子經一個末端固定至該表面，且其中該一或多種胺基酸識別分子在另一末端處結合該單一多肽分子。
如請求項192之方法，其中該單一多肽分子經羧基末端固定，且其中該一或多種胺基酸識別分子在胺基末端處結合該單一多肽分子。
如請求項192之方法，其中該單一多肽分子經胺基末端固定，且其中該一或多種胺基酸識別分子在羧基末端處結合該單一多肽分子。
如請求項191至194中任一項之方法，其中該單一多肽分子經連接子固定至該表面。
如請求項195之方法，其中該連接子包含生物分子，視情況其中該生物分子係寡核苷酸。
如請求項152至196中任一項之方法，其進一步包含觀測該單一多肽分子之降解。
如請求項152至197中任一項之方法，其中該等降解條件包含在切割試劑存在下偵測該信號脈衝系列，該切割試劑能夠自該單一多肽分子之末端移除一或多個末端胺基酸。
如請求項198之方法，其進一步包含偵測指示該切割試劑與該單一多肽分子之締合的信號脈衝。
如請求項198或199之方法，其中該切割試劑包含可偵測標記。
如請求項200之方法，其中該可偵測標記係發光標記或導電性標記。
如請求項197至201中任一項之方法，其進一步包含基於該信號脈衝系列中之第二特徵圖案，鑑別該單一多肽分子中第二類型之胺基酸。
如請求項202之方法，其中信號脈衝之該第二特徵圖案指示該第一類型之胺基酸自該單一多肽分子移除。
如請求項152至203中任一項之方法，其中該信號脈衝系列係即時信號脈衝系列。
一種系統，其包含：至少一種硬體處理器；及至少一種儲存處理器可執行指令之非暫時性電腦可讀儲存媒體，該等處理器可執行指令在由該至少一種硬體處理器執行時，使該至少一種硬體處理器進行如請求項152至204中任一項之方法。
至少一種儲存處理器可執行指令之非暫時性電腦可讀儲存媒體，該等處理器可執行指令在由至少一種硬體處理器執行時，使該至少一種硬體處理器進行如請求項152至204中任一項之方法。
一種組合物，其包含式(I )之可溶性胺基酸識別分子： A-(Y)_n -D (I )，其中： A係包含至少一種胺基酸識別分子之胺基酸結合組分； Y在各情況下係形成共價或非共價鍵聯基團之聚合物； n係1至10之整數(包括端點)；且 D係包含至少一種可偵測標記之標記組分，其中D之直徑小於200 Å。
如請求項207之組合物，其中-(Y)_n -之長度係至少2 nm。
如請求項207之組合物，其中-(Y)_n -之長度係至少5 nm。
如請求項207之組合物，其中-(Y)_n -之長度係至少10 nm。
如請求項207至210中任一項之組合物，其中Y在各情況下獨立地係生物分子、多元醇或樹狀體。
如請求項211之組合物，其中該生物分子係核酸、多肽或多醣。
如請求項207至212中任一項之組合物，其中該可溶性胺基酸識別分子係以下式中之一者： A-Y¹ -(Y)_m -D或A-(Y)_m -Y¹ -D，其中： Y¹ 係核酸或多肽；且 m係0至10之整數(包括端點)。
如請求項212或213之組合物，其中該核酸包含第一寡核苷酸股。
如請求項214之組合物，其中該核酸包含與該第一寡核苷酸股雜交之第二寡核苷酸股。
如請求項214或215之組合物，其中該核酸經該第一寡核苷酸股形成共價鍵聯。
如請求項215之組合物，其中該核酸經雜交之第一寡核苷酸股及第二寡核苷酸股形成非共價鍵聯。
如請求項212至217中任一項之組合物，其中該多肽係單價或多價蛋白。
如請求項218之組合物，其中該單價或多價蛋白經連接至該單價或多價蛋白之配位體結合位點的配位體部分形成至少一個非共價鍵聯。
如請求項219之組合物，其中A、Y或D包含該配位體部分。
如請求項207至212中任一項之組合物，其中該可溶性胺基酸識別分子係以下式中之一者： A-(Y)_m -Y² -D或A-Y² -(Y)_m -D，其中： Y² 係多元醇或樹狀體；且 m係0至10之整數(包括端點)。
如請求項221之組合物，其中該多元醇或樹狀體包含聚乙二醇、四乙二醇、聚(醯胺基胺)、聚(丙烯亞胺)、聚(丙烯胺)、碳矽烷、聚(L-離胺酸)或其一或多者之組合。
如請求項207至222中任一項之組合物，其中A包含複數種胺基酸識別分子。
如請求項223之組合物，其中該複數種胺基酸識別分子中之各胺基酸識別分子連接至Y上之不同連接位點。
如請求項223之組合物，其中該複數種胺基酸識別分子中之至少兩種胺基酸識別分子連接至Y上之單一連接位點。
如請求項207至225中任一項之組合物，其中該胺基酸識別分子係識別蛋白或核酸適體。
如請求項226之組合物，其中該識別蛋白係降解路徑蛋白、肽酶、抗體、胺基轉移酶、tRNA合成酶或含SH2域之蛋白質或其片段。
如請求項227之組合物，其中該降解路徑蛋白係N端規則路徑蛋白或其突變體或變異體。
如請求項228之組合物，其中該N端規則路徑蛋白係Arg/N端規則路徑蛋白、Ac/N端規則路徑蛋白或Pro/N端規則路徑蛋白。
如請求項229之組合物，其中該N端規則路徑蛋白係Gid蛋白、UBR匣蛋白或其含UBR匣域之片段、p62蛋白或其含ZZ域之片段或ClpS蛋白。
如請求項230之組合物，其中該Gid蛋白係來自釀酒酵母或其同源物種之Gid4或Gid10。
如請求項230之組合物，其中該UBR匣蛋白係來自人類、釀酒酵母或其同源物種之UBR1或UBR2。
如請求項230之組合物，其中該p62蛋白係來自人類、大鼠或其同源物種之p62。
如請求項230之組合物，其中該ClpS蛋白係來自根癌農桿菌、新月柄桿菌、大腸桿菌、細長聚球藻、惡性瘧原蟲、細長嗜熱聚球藻或其同源物種之ClpS1或ClpS2。
如請求項207至234中任一項之組合物，其中該可偵測標記係發光標記或導電性標記。
如請求項235之組合物，其中該發光標記包含至少一種螢光團染料分子。
如請求項236之組合物，其中D包含20種或更少螢光團染料分子。
如請求項236或237之組合物，其中螢光團染料分子之數目與胺基酸識別分子之數目的比率在1:1與20:1之間。
如請求項235至238中任一項之組合物，其中該發光標記包含至少一個FRET對，其包含供體標記及受體標記。
如請求項239之組合物，其中該供體標記與該受體標記之比率係1:1、2:1、3:1、4:1或5:1。
如請求項239之組合物，其中該受體標記與該供體標記之比率為1:1、2:1、3:1、4:1或5:1。
一種式(II )之胺基酸識別分子： A-Y¹ -D (II )，其中： A係包含至少一種胺基酸識別分子之胺基酸結合組分； Y¹ 係核酸或多肽； D係包含至少一種可偵測標記之標記組分；其限制條件為當Y¹ 係核酸時，該核酸形成共價或非共價鍵聯基團；且其限制條件為當Y¹ 係多肽時，該多肽形成非共價鍵聯基團，該非共價鍵聯基團之特徵在於低於50 × 10^- ⁹ M之解離常數(K_D )。
如請求項242之胺基酸識別分子，其中-Y¹ -之長度係至少2 nm。
如請求項242之胺基酸識別分子，其中-Y¹ -之長度係至少5 nm。
如請求項242之胺基酸識別分子，其中-Y¹ -之長度係至少10 nm。
如請求項242至245中任一項之胺基酸識別分子，其中該核酸包含第一寡核苷酸股。
如請求項246之胺基酸識別分子，其中該核酸包含與該第一寡核苷酸股雜交之第二寡核苷酸股。
如請求項247之胺基酸識別分子，其中A連接至該第一寡核苷酸股，且其中D連接至該第二寡核苷酸股。
如請求項246或247之胺基酸識別分子，其中A連接至該第一寡核苷酸股上之第一連接位點，且其中D連接至該第一寡核苷酸股上之第二連接位點。
如請求項246至249中任一項之胺基酸識別分子，其中該核酸之各寡核苷酸股包含少於150、少於100或少於50個核苷酸。
如請求項242至250中任一項之胺基酸識別分子，其中該多肽係單價或多價蛋白。
如請求項251之胺基酸識別分子，其中該單價或多價蛋白經連接至該單價或多價蛋白之配位體結合位點的配位體部分形成至少一個非共價鍵聯。
如請求項252之胺基酸識別分子，其中A及D中之至少一者包含該配位體部分。
如請求項242至253中任一項之胺基酸識別分子，其中該多肽係抗生物素蛋白。
如請求項254之胺基酸識別分子，其中該抗生物素蛋白係抗生物素、抗生物素蛋白鏈菌素、突變抗生物素蛋白鏈菌素、金頂側耳抗生物素、慢生型根瘤菌抗生物素、爪蟾抗生物素或其同系物或變異體。
如請求項252至255中任一項之胺基酸識別分子，其中該配位體部分係生物素部分。
如請求項242至256中任一項之胺基酸識別分子，其中K_D 低於1 × 10^- ⁹ M、低於1 × 10^- ¹⁰ M、低於1 × 10^- ¹¹ M或低於1 × 10^- ¹² M。
如請求項242至257中任一項之胺基酸識別分子，其中該胺基酸識別分子係以下式中之一者： A-Y¹ -(Y)_n -D或A-(Y)_n -Y¹ -D，其中： Y在各情況下係形成共價或非共價鍵聯基團之聚合物；且 n係1至10之整數(包括端點)。
如請求項258之胺基酸識別分子，其中Y在各情況下獨立地係生物分子、多元醇或樹狀體。
一種胺基酸識別分子，其包含：核酸；連接至該核酸上之第一連接位點之至少一種胺基酸識別分子；及連接至該核酸上之第二連接位點之至少一種可偵測標記，其中該核酸在該至少一種胺基酸識別分子與該至少一種可偵測標記之間形成共價或非共價鍵聯基團。
如請求項260之胺基酸識別分子，其中該核酸係雙股核酸，其包含與第二寡核苷酸股雜交之第一寡核苷酸股。
如請求項261之胺基酸識別分子，其中該第一連接位點在該第一寡核苷酸股上，且其中該第二連接位點在該第二寡核苷酸股上。
如請求項260至262中任一項之胺基酸識別分子，其中該至少一種胺基酸識別分子經蛋白質連接至該第一連接位點，該蛋白質在該至少一種胺基酸識別分子與該核酸之間形成共價或非共價鍵聯基團。
如請求項260至263中任一項之胺基酸識別分子，其中該至少一種可偵測標記經蛋白質連接至該第二連接位點，該蛋白質在該至少一種可偵測標記與該核酸之間形成共價或非共價鍵聯基團。
如請求項260至264中任一項之胺基酸識別分子，其中該第一連接位點與該第二連接位點由該核酸上5個與100個之間的核苷酸鹼基或核苷酸鹼基對間隔開。
一種胺基酸識別分子，其包含：多價蛋白，其包含至少兩個配位體結合位點；至少一種胺基酸識別分子，其經結合至該蛋白質上之第一配位體結合位點的第一配位體部分連接至該蛋白質；及至少一種可偵測標記，其經結合至該蛋白質上之第二配位體結合位點的第二配位體部分連接至該蛋白質。
如請求項266之胺基酸識別分子，其中該多價蛋白係包含四個配位體結合位點之抗生物素蛋白。
如請求項266或267之胺基酸識別分子，其中該等配位體結合位點係生物素結合位點，且其中該等配位體部分係生物素部分。
如請求項268之胺基酸識別分子，其中該等生物素部分中之至少一者係雙生物素部分，且該其中雙生物素部分結合至該抗生物素蛋白上之兩個生物素結合位點。
如請求項266至269中任一項之胺基酸識別分子，其中該至少一種胺基酸識別分子經包含該第一配位體部分之核酸連接至該蛋白質。
如請求項266至270中任一項之胺基酸識別分子，其中該至少一種可偵測標記經包含該第二配位體部分之核酸連接至該蛋白質。
一種鑑別多肽之末端胺基酸之方法，該方法包含：使多肽與在多肽之末端處選擇性結合一或多種類型之末端胺基酸的一或多種經標記親和試劑接觸；及藉由偵測該多肽與該一或多種經標記親和試劑之相互作用，在該多肽之該末端處鑑別末端胺基酸。
一種確定多肽之胺基酸序列之方法，該方法包含： i. 使多肽與在多肽之末端處選擇性結合一或多種類型之末端胺基酸的一或多種經標記親和試劑接觸； ii. 藉由偵測該多肽與該一或多種經標記親和試劑之相互作用，在該多肽之該末端處鑑別末端胺基酸； iii. 移除該末端胺基酸；及 iv. 在該多肽之該末端處重複(i)至(iii)一或多次，以確定該多肽之胺基酸序列。
如請求項273之方法，其中該方法進一步包含： a. 在(i)之後且(ii)之前，移除不選擇性結合該末端胺基酸之該一或多種經標記親和試劑中之任一者；及/或 b. 在(ii)之後且(iii)之前，移除選擇性結合該末端胺基酸之該一或多種經標記親和試劑中之任一者。
如請求項273之方法，其中(iii)包含藉由使該末端胺基酸與異硫氰酸酯接觸修飾該末端胺基酸，及： a. 使該經修飾末端胺基酸與特異性結合且移除該經修飾末端胺基酸之蛋白酶接觸；或 b. 使該經修飾末端胺基酸經歷足以移除該經修飾末端胺基酸之酸性或鹼性條件。
如請求項273之方法，其中鑑別該末端胺基酸包含： a. 將該末端胺基酸鑑別為該一或多種經標記親和試劑所結合之該一或多種類型之末端胺基酸中的一種類型；或 b. 將該末端胺基酸鑑別為除該一或多種經標記親和試劑所結合之該一或多種類型之末端胺基酸外的類型。
如請求項273之方法，其中該一或多種經標記親和試劑包含一或多種經標記適體、一或多種經標記肽酶、一或多種經標記抗體或其組合。
如請求項277之方法，其中該一或多種經標記肽酶已經修飾以使切割活性不活化；或其中該一或多種經標記肽酶保留用於(iii)之移除的切割活性。
一種在混合樣品中鑑別所關注蛋白質之方法，該方法包含：切割混合蛋白質樣品以產生複數個多肽片段；在如請求項273至278中任一項之方法中，確定該複數個多肽片段中之至少一個多肽片段的胺基酸序列；及若所關注蛋白質可唯一地鑑別該胺基酸序列，則在該混合樣品中鑑別該所關注蛋白質。
一種在混合樣品中鑑別所關注蛋白質之方法，該方法包含：切割混合蛋白質樣品以產生複數個多肽片段；用一或多種不同發光標記標記該複數個多肽片段中之一或多種類型之胺基酸；針對該複數個經標記多肽中之至少一個經標記多肽，隨時間推移量測發光；基於所偵測到之發光確定該至少一個經標記多肽的胺基酸序列；及若所關注蛋白質可唯一地鑑別該胺基酸序列，則在該混合樣品中鑑別該所關注蛋白質。
一種鑑別多肽中兩個或更多個胺基酸之相對位置之方法，該方法包含：用一或多種類型之第一FRET標記標記多肽之兩個或更多個胺基酸；在經第二FRET標記標記之輔因子存在下，偵測來自該經標記多肽之移位反應的FRET信號；及基於該FRET信號確定該等兩個或更多個胺基酸之相對位置。
一種製備用於分析之蛋白質之方法，該方法包含： i. 阻斷蛋白質之游離羧酸基； ii. 使該蛋白質變性； iii. 阻斷該蛋白質之游離硫醇基； iv. 消化該蛋白質以產生至少一個多肽片段，其包含游離C末端羧酸基；及 v. 將官能性部分以化學方式綴合至該游離C末端羧酸基。
一種製備用於分析之蛋白質之方法，該方法包含： i. 使蛋白質變性； ii. 阻斷該蛋白質之游離硫醇基； iii. 消化該蛋白質以產生至少一個多肽片段，其包含游離C末端羧酸基； iv. 阻斷該游離C末端羧酸基以產生至少一個多肽片段，其包含經阻斷C末端羧酸基；及 v. 將官能性部分以酶方式綴合至該經阻斷C末端羧酸基。