TW202300507A

TW202300507A - 包含變異多肽之組合物及其用途

Info

Publication number: TW202300507A
Application number: TW111108605A
Authority: TW
Inventors: 後補後補; 布蘭登傑喜爾博特; 昆丁諾曼威瑟斯; 勞倫Ｅ雅方司; 安東尼詹姆士葛瑞提
Original assignee: 美商阿伯生物技術公司
Priority date: 2021-03-09
Filing date: 2022-03-09
Publication date: 2023-01-01
Also published as: AU2022234325A1; CO2023013171A2; CA3211223A1; EP4305159A1; KR20230154064A; IL305747A; BR112023018165A2; WO2022192391A1; JP2024509928A

Abstract

本發明係關於變異多肽、製備該等變異多肽之方法、用於表徵該等變異多肽之方法、包含該等變異多肽之組合物及細胞以及使用該等變異多肽之方法。本發明進一步關於包含該等變異多肽之複合物、產生該等複合物之方法、用於表徵該等複合物之方法、包含該等複合物之細胞及使用該等複合物之方法。

Description

包含變異多肽之組合物及其用途

成簇規律間隔短回文重複序列(CRISPR)及CRISPR相關(Cas)基因統稱為CRISPR-Cas或CRISPR/Cas系統，係古菌(archaea)及細菌中保護特定物種抵禦外來基因元件之適應性免疫系統。

在上述背景下，本發明提供優於先前技術之某些優點及進展。

雖然本文揭示之本發明不限於特定優點或功能性，但本發明提供一種變異多肽，其相對於SEQ ID NO: 3之親本多肽包含改變，且其中該改變為表2之取代。在一些實施例中，取代為P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及/或D719R取代。

在某些實施例中，變異多肽包含a) P14R取代、E311R取代及D32R取代；b) P14R取代、E311R取代及G223R取代；c) P14R取代、E311R取代、D32R取代及I61R取代；或d) D32R取代、N109R取代、E311R取代及D719R取代。在一些實施例中，變異多肽包含c) P14R取代、E311R取代、D32R取代及I61R取代。

在一些實施例中，變異多肽進一步包含K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。

在一個態樣中，本發明提供一種變異多肽，其包含與SEQ ID NO: 3具有至少95%一致性且相對於SEQ ID NO: 3包含位置P14、E311、D32、I61、G223、N109及D719中之一或多處之取代的胺基酸序列。

在一個態樣中，本發明提供一種變異多肽，其包含與SEQ ID NO: 3具有至少95%一致性且包含以下取代中之一或多者的胺基酸序列：P14R、E311R、D32R、I61R、G223R、N109R及D719R。

在一個態樣中，本發明提供一種變異多肽，其包含與SEQ ID NO: 3具有至少95%一致性且相對於SEQ ID NO: 3包含位置K208、D302、D590、E154、D567、L38、D145、C13、T338、P14、D55、K221、K35及E736中之一或多處之取代的胺基酸序列。

在一個態樣中，本發明提供一種變異多肽，其包含與SEQ ID NO: 3具有至少95%一致性且包含以下取代中之一或多者的胺基酸序列：K208G、D302G、D590G、E154G、D567G、L38G、D145G、C13G、T338G、P14G、D55G、K221G、K35G及E736G。

在一些實施例中，變異多肽包含P14處之取代(例如，P14R取代)。在某些實施例中，變異多肽包含E311處之取代(例如，E311R取代)。在一些實施例中，變異多肽包含D32處之取代(例如，D32R取代)。在某些實施例中，變異多肽包含I61處之取代(例如，I61R取代)。在一些實施例中，變異多肽包含G223處之取代(例如，G223取代)。在某些實施例中，變異多肽包含N109處之取代(例如，N109R取代)。在一些實施例中，變異多肽包含D719處之取代(例如，D719R取代)。

在某些實施例中，變異多肽包含以下位置處之取代：P14 (例如，P14R取代)、E311 (例如，E311R取代)、D32 (例如，D32R取代)、I61 (例如，I61R取代)、G223 (例如，G223取代)、N109 (例如，N109R取代)、D719 (例如，D719R取代)或其任何組合。

在一些實施例中，變異多肽相對於SEQ ID NO: 3包含位置P14 (例如，P14R取代)、E311 (例如，E311R)及D32 (例如，D32R取代)處之取代(例如，P14R、E311R、D32R變異多肽)。

在一些實施例中，變異多肽相對於SEQ ID NO: 3包含位置P14 (例如，P14R取代)、E311 (例如，E311R)及G223 (例如，G223R取代)處之取代(例如，P14R、E311R、G223R變異多肽)。

在某些實施例中，變異多肽相對於SEQ ID NO: 3包含位置P14 (例如，P14R取代)、E311 (例如，E311R)、D32 (例如，D32R取代)及I61 (例如，I61R取代)處之取代(例如，P14R、E311R、D32R及I61R變異多肽)。

在一些實施例中，變異多肽相對於SEQ ID NO: 3包含位置D32R (例如，D32R取代)、N109 (例如，N109R)、E311 (例如，E311R取代)及D719 (例如，D719R取代)處之取代(例如，D32R、N109R、E311R及D719R變異多肽)。

在某些實施例中，變異多肽包含以下各處之取代：K208 (例如，K208G取代)、D302 (例如，D302G取代)、D590 (例如，D590G取代)、E154 (例如，E154G取代)、D567 (例如，D567G取代)、L38 (例如，L38G取代)、D145 (例如，D145G取代)、C13 (例如，C13G取代)、T338 (例如，T338G取代)、P14 (例如，P14G取代)、D55 (例如，D55G取代)、K221 (例如，K221G取代)、K35 (例如，K35G取代)及E736 (例如，E736G取代)或其任何組合。

在特定實施例中，相對於親本多肽，變異多肽展現增加之與RNA引導之二元複合物形成。在某些實施例中，相對於親本二元複合物，包含變異多肽之二元複合物展現增加之穩定性。

在一些實施例中，相對於親本多肽，變異多肽展現增加之核酸酶活性。

在一個態樣中，本發明提供一種組合物，其包含本文所述之變異多肽，其中該組合物進一步包含RNA引導或編碼該RNA引導之核酸，其中該RNA引導包含正向重複序列及間隔子序列。在某些實施例中，正向重複序列與SEQ ID NO: 4-13中之任一者至少90% (例如，90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)一致或包含與SEQ ID NO: 14或SEQ ID NO: 15具有至少90% (例如，90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)一致性的序列。在一些實施例中，正向重複序列與SEQ ID NO: 4-13中之任一者至少95% (例如，95%、96%、97%、98%、99%或100%)一致或包含與SEQ ID NO: 14或SEQ ID NO: 15具有至少95% (例如，95%、96%、97%、98%、99%或100%)一致性之序列。在一些實施例中，正向重複序列為SEQ ID NO: 4-13中之任一者或包含SEQ ID NO: 14或SEQ ID NO: 15之序列。

在一些實施例中，間隔子序列之長度包含約15個核苷酸至約35個核苷酸。

在某些實施例中，間隔子序列結合於目標核酸之目標股序列，且其中目標核酸序列之非目標股序列與原間隔子相鄰模體(PAM)序列相鄰。在一些實施例中，PAM序列為5'-TTR-3'、5'-NTTR-3'、5'-NTTN-3'、5'-RTTR-3'、5'-ATTR-3'或5'-RTTG-3'，其中N為任何核苷酸，Y為C或T，且R為A或G。在某些實施例中，PAM序列為5'-TTG-3'、5'-TTA-3'、5'-ATTG-3'、5'-TTTA-3'或5'-TTTG-3'。

在某些實施例中，變異多肽進一步包含核定位信號(NLS)。

在一些實施例中，變異多肽進一步包含肽標籤、螢光蛋白、鹼基編輯域、DNA甲基化域、組蛋白殘基修飾域、定位因子、轉錄修飾因子、光閘控控制因子、化學誘導因子或染色質目測因子。

在一個態樣中，本發明提供一種組合物，其包含編碼本文任何地方所述之變異多肽及/或RNA引導之核酸。在一些實施例中，核酸經密碼子優化以在細胞中表現。在某些實施例中，核酸可操作地連接於啟動子。在一些實施例中，核酸在載體中。在某些實施例中，載體包含反轉錄病毒載體、慢病毒載體、噬菌體載體、腺病毒載體、腺相關載體或單純疱疹載體。

在一些實施例中，變異多肽存在於包含奈米粒子(例如脂質奈米粒子)、脂質體、胞外體、微囊泡或基因槍之遞送系統中。

在一個態樣中，本發明提供一種細胞，其包含任何前述態樣或實施例之變異多肽或組合物。

在一些實施例中，細胞為真核細胞。在某些實施例中，細胞為哺乳動物細胞或植物細胞。在某些實施例中，細胞為人類細胞。

在一個態樣中，本發明提供一種組合物，其包含變異多肽或包含有變異多肽之複合物，其中該變異多肽相對於SEQ ID NO: 3之親本多肽包含改變，且其中相對於親本多肽或包含親本多肽之複合物，該變異多肽或該複合物展現增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性。

在一些實施例中，改變為表2之取代。

在某些實施例中，取代為P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及/或D719R取代。

在一些實施例中，變異多肽包含a) P14R取代、E311R取代及D32R取代；b) P14R取代、E311R取代及G223R取代；c) P14R取代、E311R取代、D32R取代及I61R取代；或d) D32R取代、N109R取代、E311R取代及D719R取代。

在某些實施例中，變異多肽進一步包含K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。

在一些實施例中，增強之酶活性為增強之核酸酶活性。

在某些實施例中，相對於親本多肽，變異多肽展現增強之與RNA引導之結合活性。

在一些實施例中，相對於親本多肽，變異多肽展現增強之與RNA引導之結合特異性。

在一些實施例中，包含變異多肽之複合物為進一步包含RNA引導之變異二元複合物，且相對於親本二元複合物，該變異二元複合物展現增強之與目標核酸之結合活性(例如正中目標結合活性)。

在另一實施例中，包含變異多肽之複合物為進一步包含RNA引導之變異二元複合物，且相對於親本二元複合物，該變異二元複合物展現增強之與目標核酸之結合特異性(例如正中目標結合特異性)。

在一些實施例中，包含變異多肽之複合物為進一步包含RNA引導之變異二元複合物，且相對於親本二元複合物，該變異二元複合物展現增強之穩定性。

在某些實施例中，變異二元複合物與目標核酸形成變異三元複合物，且相對於親本三元複合物，變異三元複合物展現增加之穩定性。

在一些實施例中，相對於親本多肽，變異多肽進一步展現增強之二元複合物形成、增強之蛋白質-RNA相互作用及/或減少之自RNA引導之解離。

在某些實施例中，相對於親本二元複合物，變異二元複合物進一步展現減少之自目標核酸之解離，及/或減少之與非目標核酸之偏離目標結合。

在一些實施例中，增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在例如20℃至65℃(例如20℃至30℃、30℃至40℃、40℃至50℃、50℃至60℃或60℃至65℃)之溫度範圍內發生。

在某些實施例中，增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在一定培育時間範圍內發生。

在一些實施例中，增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中發生。

在某些實施例中，當變異多肽、變異二元複合物或變異三元複合物之T _m值比親本多肽、親本二元複合物或親本三元複合物之T _m值大至少8℃時，發生增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性。

在一些實施例中，變異多肽包含RuvC域或分開RuvC域。

在某些實施例中，親本多肽包含SEQ ID NO: 3之序列。

在一些實施例中，RNA引導包含正向重複序列及間隔子序列。

在一些實施例中，正向重複序列與SEQ ID NO: 4-13中之任一者至少90% (例如，90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)一致或包含與SEQ ID NO: 14或SEQ ID NO: 15具有至少90% (例如，90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)一致性之序列。

在一些實施例中，正向重複序列與SEQ ID NO: 4-13中之任一者至少95% (例如，95%、96%、97%、98%、99%或100%)一致或包含與SEQ ID NO: 14或SEQ ID NO: 15具有至少95% (例如，95%、96%、97%、98%、99%或100%)一致性之序列。在一些實施例中，正向重複序列為SEQ ID NO: 4-13中之任一者或包含SEQ ID NO: 14或SEQ ID NO: 15之序列。

在某些實施例中，間隔子序列之長度包含15至35個核苷酸。

在某些實施例中，間隔子序列與目標核酸之目標股序列包含互補性。

在一些實施例中，目標核酸包含與原間隔子相鄰模體(PAM)序列相鄰之非目標股序列。在某些實施例中，PAM序列為5'-TTR-3'、5'-NTTR-3'、5'-NTTN-3'、5'-RTTR-3'、5'-ATTR-3'或5'-RTTG-3'，其中N為任何核苷酸，Y為C或T，且R為A或G。在一些實施例中，PAM序列為5'-TTG-3'、5'-TTA-3'、5'-ATTG-3'、5'-TTTA-3'或5'-TTTG-3'。

在某些實施例中，變異多肽進一步包含肽標籤、螢光蛋白、鹼基編輯域、DNA甲基化域、組蛋白殘基修飾域、定位因子、轉錄修飾因子、光閘控控制因子、化學誘導因子或染色質目測因子。

在一個態樣中，本發明提供一種組合物，其包含編碼前述態樣或其實施例之變異多肽的核酸，其中視情況核酸經密碼子優化以在細胞中表現。

在一些實施例中，細胞為真核細胞。

在一些實施例中，細胞為哺乳動物細胞或植物細胞。在某些實施例中，細胞為人類細胞。

在一些實施例中，編碼變異多肽之核酸可操作地連接於啟動子。

在某些實施例中，編碼變異多肽之核酸在載體中。

在一些實施例中，載體包含反轉錄病毒載體、慢病毒載體、噬菌體載體、腺病毒載體、腺相關載體或單純疱疹載體。

在某些實施例中，組合物存在於包含奈米粒子(例如脂質奈米粒子)、脂質體、胞外體、微囊泡或基因槍之遞送組合物中。

在一個態樣中，本發明提供一種用於在細胞中編輯基因之方法，該方法包含使該細胞與任一前述態樣或實施例之變異多肽或組合物接觸。

在一個態樣中，本發明提供一種核酸分子，其編碼任一前述態樣或實施例之變異多肽。

在某些實施例中，核酸分子之序列與選自由SEQ ID NO: 1、2或21-27組成之群的序列95%一致。在一些實施例中，核酸分子之序列包含選自由SEQ ID NO: 1、2或21-27組成之群的序列。在某些實施例中，核酸分子之序列與選自由SEQ ID NO: 22、23或25組成之群的序列95%一致。

雖然本文揭示之本發明不限於特定優點或功能性，但本發明提供一種變異多肽及/或包含變異多肽之組合物，其中該變異多肽相對於SEQ ID NO: 3之親本多肽包含改變，且其中相對於親本多肽或包含親本多肽之複合物，該變異多肽或包含該變異多肽之複合物展現增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性。

在一些態樣中，增強之酶活性為增強之核酸酶活性。

在一些態樣中，相對於親本多肽，變異多肽展現增強之與RNA引導之結合活性。

在一些態樣中，相對於親本多肽，變異多肽展現增強之與RNA引導之結合特異性。

在一些態樣中，變異多肽與RNA引導形成變異二元複合物，且相對於親本二元複合物，該變異二元複合物展現增強之與目標核酸之結合活性(例如正中目標結合活性)。

在一些態樣中，變異多肽與RNA引導形成變異二元複合物，且相對於親本二元複合物，該變異二元複合物展現增強之與目標核酸之結合特異性(例如正中目標結合特異性)。

在一些態樣中，變異多肽與RNA引導形成變異二元複合物，且相對於親本二元複合物，該變異二元複合物展現增強之穩定性。

在一些態樣中，變異二元複合物與目標核酸形成變異三元複合物，且相對於親本三元複合物，變異三元複合物展現增加之穩定性。

在一些態樣中，相對於親本多肽，變異多肽進一步展現增強之二元複合物形成、增強之蛋白質-RNA相互作用及/或減少之自RNA引導之解離。

在一些態樣中，相對於親本二元複合物，變異二元複合物進一步展現減少之自目標核酸之解離，及/或減少之與非目標核酸之偏離目標結合。

在一些態樣中，增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在例如20℃至65℃(例如20℃至30℃、30℃至40℃、40℃至50℃、50℃至60℃或60℃至65℃)之溫度範圍內發生。

在一些態樣中，增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在一定培育時間範圍內發生。

在一些態樣中，增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中發生。

在一些態樣中，當變異多肽、變異二元複合物或變異三元複合物之T _m值比親本多肽、親本二元複合物或親本三元複合物之T _m值大至少8℃時，發生增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性。

在其他態樣中，改變包含相對於具有SEQ ID NO: 3中所示之序列之親本多肽的胺基酸序列改變，其中與具有SEQ ID NO: 3中所示之序列之親本多肽相比，該改變包含一或多個(例如一個、兩個、三個、四個、五個或更多個)取代、插入、缺失及/或添加。

在一些態樣中，改變包含相對於具有SEQ ID NO: 3中所示之序列之親本多肽的胺基酸序列改變，其中該改變包含表2中所列之一或多個胺基酸取代。

在一些態樣中，改變包含精胺酸、離胺酸、麩醯胺酸、天冬醯胺、組胺酸、丙胺酸或甘胺酸取代。

在一些態樣中，改變為選自P14R、E311R、D32R、I61R、G223R、N109R及/或D719R之胺基酸取代。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14處之取代(例如，P14R取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置P14處之取代(例如，P14R取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置E311處之取代(例如，E311R取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置E311處之取代(例如，E311R取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D32處之取代(例如，D32R取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D32處之取代(例如，D32R取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置I61處之取代(例如，I61R取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置I61處之取代(例如，I61R取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置G223處之取代(例如，G223R取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置G223處之取代(例如，G223R取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置N109處之取代(例如，N109R取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置N109處之取代(例如，N109R取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D719處之取代(例如，D719R取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D719處之取代(例如，D719R取代)。

在一些態樣中，改變為表3中所列之胺基酸取代之組合。

在一些態樣中，胺基酸取代之組合包含以下闡述之取代：a) P14R、E311R、D32R；b) P14R、E311R、G223R；c) P14R、E311R、D32R、I61R；或d) D32R、N109R、E311R、D719R。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14 (例如，P14R取代)、E311 (例如，E311R)及D32 (例如，D32R取代)處之取代的胺基酸(例如，P14R、E311R、D32R變異多肽)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14 (例如，P14R取代)、E311 (例如，E311R)及G223 (例如，G223R取代)處之取代的胺基酸(例如，P14R、E311R、G223R變異多肽)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14 (例如，P14R取代)、E311 (例如，E311R)、D32 (例如，D32R取代)及I61 (例如，I61R取代)處之取代的胺基酸(例如，P14R、E311R、D32R及I61R變異多肽)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D32R (例如，D32R取代)、N109 (例如，N109R)、E311 (例如，E311R取代)及D719 (例如，D719R取代)處之取代的胺基酸(例如，D32R、N109R、E311R及D719R變異多肽)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置K208處之取代(例如，K208G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置K208處之取代(例如，K208G取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D302處之取代(例如，D302G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D302處之取代(例如，D302G取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D590處之取代(例如，D590G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D590處之取代(例如，D590G取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置E154處之取代(例如，E154G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置E154處之取代(例如，E154G取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D567處之取代(例如，D567G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D567處之取代(例如，D567G取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置L38處之取代(例如，L38G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置L38處之取代(例如，L38G取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D145處之取代(例如，D145G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D145處之取代(例如，D145G取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置C13處之取代(例如，C13G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置C13處之取代(例如，C13G取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置T338處之取代(例如，T338G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置T338處之取代(例如，T338G取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14處之取代(例如，P14G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置P14處之取代(例如，P14G取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D55處之取代(例如，D55G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D55處之取代(例如，D55G取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置K221處之取代(例如，K221G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置K221處之取代(例如，K221G取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置K35處之取代(例如，K35G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置K35處之取代(例如，K35G取代)。

在一些態樣中，本發明提供一種多肽，其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置E736處之取代(例如，E736G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置E736處之取代(例如，E736G取代)。

在一些態樣中，變異多肽包含RuvC域或分開RuvC域。

在一些態樣中，變異多肽包含一或多個催化殘基(例如天冬胺酸或麩胺酸)。在一些態樣中，一或多個催化殘基包含D328及E530。在一些態樣中，一或多個催化殘基進一步包含D684、D646或D621。

在一些態樣中，包含變異多肽之組合物或複合物進一步包含RNA引導，且該RNA引導包含正向重複序列及間隔子序列。

在一些態樣中，RNA引導包含正向重複序列及間隔子序列。

在一些態樣中，正向重複序列包含與SEQ ID NO: 4-13中之任一者具有至少95%序列一致性之核苷酸序列。

在一些態樣中，正向重複序列包含SEQ ID NO: 4-13中之任一者之核苷酸序列。

在一些態樣中，間隔子序列之長度包含15至35個核苷酸。

在一些態樣中，目標核酸包含與間隔子序列中之核苷酸序列互補之序列。

在一些態樣中，目標核酸與原間隔子相鄰模體(PAM)序列相鄰，其中該PAM序列包含闡述為5'-NTTR-3'、5'-NTTN-3'、5'-RTTR-3'、5'-ATTR-3'或5'-RTTG-3'之核苷酸序列，其中N為任何核苷酸且R為A或G。在一些態樣中，PAM序列包含闡述為5'-GTTA-3'、5'-TTTG-3'、5'-CTTG-3'、5'-GTTG-3'、5'-TTTA-3'、5'-CTTA-3'、5'-ATTG-3'、5'-ATTA-3'、5'-ACTG-3'、5'-CATA-3'、5'-TTGA-3'或5'-TATA-3'之核苷酸序列。

在一些態樣中，目標核酸為單股DNA或雙股DNA。

在一些態樣中，變異多肽進一步包含肽標籤、螢光蛋白、鹼基編輯域、DNA甲基化域、組蛋白殘基修飾域、定位因子、轉錄修飾因子、光閘控控制因子、化學誘導因子或染色質目測因子。

在一些態樣中，編碼變異多肽之核酸經密碼子優化以在細胞中表現。

在一些態樣中，編碼變異多肽之核酸可操作地連接於啟動子。

在一些態樣中，編碼變異多肽之核酸在載體中。

在一些態樣中，載體包含反轉錄病毒載體、慢病毒載體、噬菌體載體、腺病毒載體、腺相關載體或單純疱疹載體。

在一些態樣中，組合物存在於包含奈米粒子、脂質體、胞外體、微囊泡或基因槍之遞送組合物中。

本發明進一步提供一種細胞，其包含本文揭示之變異多肽及/或組合物。在一些態樣中，細胞為真核細胞或原核細胞。在一些態樣中，細胞為哺乳動物細胞或植物細胞。在一些態樣中，細胞為人類細胞。

本發明進一步提供一種製備本文揭示之變異多肽及/或組合物之方法。

本發明進一步提供一種使本文揭示之變異多肽與RNA引導複合之方法。

本發明進一步提供一種使本文揭示之變異二元複合物與目標核酸複合之方法。

本發明進一步提供一種遞送本文揭示之變異多肽及/或組合物之方法。

本發明進一步提供一種組合物，其包含變異多肽或包含有變異多肽及RNA引導之複合物，其中該變異多肽相對於SEQ ID NO: 3之親本多肽包含改變，且其中相對於親本多肽或包含親本多肽及RNA引導之複合物，該變異多肽或該複合物展現增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性。

在一些態樣中，增強之酶活性為增強之核酸酶活性。

在一些態樣中，增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在例如20℃至65℃之溫度範圍內發生。

在一些態樣中，變異多肽包含RuvC域或分開RuvC域。

在一些態樣中，RNA引導包含正向重複序列及間隔子序列。

在一些態樣中，間隔子序列之長度包含15至35個核苷酸。

在一些態樣中，目標核酸與PAM序列相鄰，其中該PAM序列包含闡述為5'-NTTR-3'、5'-NTTN-3'、5'-RTTR-3'、5'-ATTR-3'或5'-RTTG-3'之核苷酸序列，其中N為任何核苷酸且R為A或G。在一些態樣中，PAM序列包含闡述為5'-GTTA-3'、5'-TTTG-3'、5'-CTTG-3'、5'-GTTG-3'、5'-TTTA-3'、5'-CTTA-3'、5'-ATTG-3'、5'-ATTA-3'、5'-ACTG-3'、5'-CATA-3'、5'-TTGA-3'或5'-TATA-3'之核苷酸序列。

在一些態樣中，目標核酸為單股DNA或雙股DNA。

在一些態樣中，編碼變異多肽之核酸在載體中。

在一些態樣中，組合物或複合物存在於包含奈米粒子、脂質體、胞外體、微囊泡或基因槍之遞送組合物中。

本發明進一步提供一種細胞，其包含本文揭示之變異多肽及/或複合物。在一些態樣中，細胞為真核細胞或原核細胞。在一些態樣中，細胞為哺乳動物細胞或植物細胞。在一些態樣中，細胞為人類細胞。

本發明進一步提供一種製備本文揭示之變異多肽及/或複合物之方法。

本發明進一步提供一種遞送本文揭示之變異多肽及/或複合物之方法。

定義將關於特定實施例及參考某些圖式描述本發明，但本發明不限於此，而僅受申請專利範圍限制。除非另外指明，否則如下文所闡述之術語一般應按其常識來理解。

除非另外定義，否則本文所使用之科學及技術術語具有一般技術者通常所瞭解之含義。在存在任何潛在歧義的情況下，本文提供之定義優先於任何字典或外部定義。除非上下文另外需要，否則單數術語應包括複數且複數術語應包括單數。除非另外說明，否則本文中使用「或」意謂「及/或」。使用術語「包括(including)」以及其他形式(諸如「包括(includes)」及「包括(included)」)不具限制性。

通常，本文所述之與細胞及組織培養、分子生物學、免疫學、微生物學、遺傳學以及蛋白質及核酸化學及雜交結合使用之命名法為此項技術中熟知及常用的。除非另外指明，否則本文所提供之方法及技術一般根據此項技術中熟知之習知方法且如本說明書通篇引用及論述之各種一般及更特定參考文獻中所描述來進行。酶促反應及純化技術根據製造商之說明書，如通常在此項技術中所實現或如本文所述來進行。本文所述之與分析化學、合成有機化學以及藥物及醫藥化學結合使用的命名法及其實驗室程序與技術為此項技術中熟知及常用之命名法及實驗室程序與技術。標準技術用於化學合成、化學分析、醫藥製備、調配及遞送以及患者治療。

下文定義選擇術語以使得本發明可更容易得到理解。

冠詞「一(a及an)」在本文中用以指一個或超過一個(亦即，至少一個)的該冠詞之文法對象。藉助於實例，「一要素」意謂一個要素或超過一個要素。

如本文所用，當提及諸如量、時距及其類似者之可量測值時，術語「約」意謂涵蓋指定值±20%或±10%、更佳±5%、更佳±1%，且更佳±0.1%之變化，因為此類變化適於進行所揭示之方法。

如本文所用，術語「複合物」係指兩種或更多種分子成組。一些實施例中，複合物包含彼此相互作用(例如結合、接觸、黏附)之多肽及核酸分子。

如本文所用，術語「二元複合物」係指兩種分子(例如多肽及核酸分子)成組。在一些實施例中，二元複合物係指多肽及靶向部分(例如RNA引導)成組。在一些實施例中，二元複合物係指核糖核蛋白(RNP)。如本文所用，術語「變異二元複合物」係指變異多肽及RNA引導成組。如本文所用，術語「親本二元複合物」係指親本多肽及RNA引導或參考多肽及RNA引導成組。

如本文所用，術語「三元複合物」係指三種分子(例如多肽及兩種核酸分子)成組。在一些實施例中，「三元複合物」係指多肽、RNA分子及DNA分子成組。在一些實施例中，三元複合物係指多肽、靶向部分(例如RNA引導)及目標核酸(例如目標DNA分子)成組。在一些實施例中，「三元複合物」係指二元複合物(例如核糖核蛋白)及第三分子(例如目標核酸)成組。

如本文所用，術語「域」係指多肽之獨特功能及/或結構單元。在一些實施例中，域可包含保守胺基酸序列。

如本文所用，術語「親本」、「親本多肽」及「親本序列」係指發生改變而產生本發明之變異多肽的原始多肽(例如參考或起始多肽)。

如本文所用，術語「原間隔子相鄰模體」或「PAM」係指與包含效應子(例如核酸酶)及RNA引導之複合物所結合之目標序列相鄰的DNA序列。在一些實施例中，PAM係酶活性所需的。「目標核酸」為雙股分子：一股包含與PAM相鄰之目標序列且稱為「PAM股」(例如非目標股或非間隔子互補股)，且另一互補股稱為「非PAM股」(例如目標股或間隔子互補股)。如本文所用，術語「相鄰」包括複合物之RNA引導與緊鄰PAM之目標序列特異性結合、相互作用或締合的情況。在此類情況下，目標序列與PAM之間無核苷酸。術語「相鄰」亦包括靶向部分所結合之目標序列與PAM之間存在少數(例如1、2、3、4或5個)核苷酸的情況。

如本文所用，術語「參考組合物」、「參考分子」、「參考序列」及「參考」係指對照，諸如陰性對照或親本(例如親本序列、親本蛋白質或野生型蛋白質)。舉例而言，參考分子係指變異多肽進行比較之多肽。同樣，參考RNA引導係指經修飾之RNA引導進行比較之靶向部分。變異或經修飾之分子可基於序列(例如變異或經修飾之分子可與參考分子具有X%序列一致性或同源性)、熱穩定性或活性(例如變異或經修飾之分子可具有參考分子之活性之X%)與參考分子進行比較。例如，變異或經修飾之分子可表徵為具有參考多肽之活性之不超過10%，或可表徵為比參考多肽之活性大至少10%。參考多肽之實例包括天然存在之未修飾之多肽，例如來自古菌或細菌物種之天然存在之多肽。在某些實施例中，參考多肽為與進行比較之變異多肽具有最接近序列一致性或同源性的天然存在之多肽。在某些實施例中，參考多肽為發生突變而得到變異多肽的具有天然存在或已知序列之親本分子。

如本文所用，術語「RNA引導」或「RNA引導序列」係指有助於本文所述之多肽靶向目標核酸之任何RNA分子。例如，RNA引導可為識別(例如結合於)目標核酸之分子。RNA引導可經設計以與目標核酸序列之目標股(例如非PAM股)互補。RNA引導包含DNA靶向序列及正向重複(DR)序列。術語CRISPR RNA (crRNA)、前crRNA、成熟crRNA及gRNA在本文中亦用以指RNA引導。如本文所用，術語「前crRNA」係指包含DR-間隔子-DR序列之未加工RNA分子。如本文所用，術語「成熟crRNA」係指前crRNA之經加工形式；成熟crRNA可包含DR-間隔子序列，其中該DR為前crRNA之DR的截短形式及/或間隔子為前crRNA之間隔子之截短形式。如本文所用，術語「實質上一致」係指與參考序列具有一定程度一致性之序列、聚核苷酸或多肽。

如本文所用，術語「實質上一致」係指與參考序列具有一定程度一致性之序列、聚核苷酸或多肽。

如本文所用，術語「目標核酸」、「目標序列」及「目標受質」係指RNA引導特異性結合之核酸。在一些實施例中，RNA引導之DNA靶向序列結合於目標核酸。

如本文所用，術語「變異多肽」、「變異效應多肽」及「變異CRISPR核酸酶多肽」係指與親本多肽相比在一或多個殘基位置處包含改變，例如但不限於取代、插入、缺失、添加及/或融合的多肽。如本文所用，術語「變異多肽」、「變異效應多肽」及「變異CRISPR核酸酶多肽」係指與SEQ ID NO: 3之多肽相比包含改變的多肽。

相關申請案本申請案主張2021年3月9日申請之美國臨時申請案63/158741、2021年12月28日申請之美國臨時申請案63/294224之優先權，各臨時申請案之全部內容以引用的方式併入本文中。

序列表本申請案含有序列表，其已呈ASCII格式以電子方式提交且以全文引用的方式併入本文中。該ASCII複本創建於2022年3月7日，名為A2186-7046WO_SL.txt且大小為38,750位元組。

在一些態樣中，本發明提供SEQ ID NO: 3之效應子(例如CRISPR核酸酶)之新穎變異體、包含該等變異體之組合物及其製備及使用方法。在其他態樣中，本發明進一步提供包含SEQ ID NO: 3之效應子(例如CRISPR核酸酶)之變異體的複合物及組合物、其製備方法及使用。在一些態樣中，本文中描述包含具有一或多種特性之複合物的組合物。在一些態樣中，描述一種遞送包含複合物之組合物之方法。

組合物在一些實施例中，本發明之組合物包括相對於親本多肽展現增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性的變異多肽。在一些實施例中，本發明之組合物包括一種包含變異多肽之複合物，其相對於親本複合物展現增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性。

在一些實施例中，本發明之組合物包括變異多肽及RNA引導。在一些實施例中，本發明之組合物包括一種包含變異多肽及RNA引導之變異二元複合物。

在組合物之一些態樣中，與親本多肽相比，變異多肽具有增加的與RNA引導之複合物形成(例如增加之二元複合物形成)。在組合物之一些態樣中，與親本多肽及RNA引導相比，變異多肽及RNA引導具有更大結合親和力。在組合物之一些態樣中，與親本多肽及RNA引導相比，變異多肽及RNA引導具有更強之蛋白質-RNA相互作用(例如離子相互作用)。在組合物之一些態樣中，變異二元複合物比親本二元複合物更穩定。

在一些實施例中，本發明之組合物包括變異多肽、RNA引導及目標核酸。在一些實施例中，本發明之組合物包括一種包含變異多肽、RNA引導及目標核酸之變異三元複合物。

在組合物之一些態樣中，與親本多肽相比，變異多肽具有增加之與RNA引導及目標核酸之複合物形成(例如增加之三元複合物形成)。在組合物之一些態樣中，與親本多肽及RNA引導(例如親本二元複合物)相比，變異多肽及RNA引導(例如變異二元複合物)對目標核酸具有更大結合親和力。在組合物之一些態樣中，變異三元複合物比親本三元複合物更穩定。

在一些實施例中，本發明之組合物包括本文所述之變異多肽。

變異多肽在一個實施例中，變異多肽為經分離或經純化之多肽。

在一些實施例中，本發明之變異多肽(例如，變異CRISPR核酸酶多肽)為親本多肽(例如，親本CRISPR核酸酶)之變異體，其中該親本由包含諸如SEQ ID NO: 1、SEQ ID NO: 2、SEQ ID NO: 21、SEQ ID NO: 22、SEQ ID NO: 23、SEQ ID NO: 24、SEQ ID NO: 25、SEQ ID NO: 26或SEQ ID NO: 27之核苷酸序列的聚核苷酸編碼或包含諸如SEQ ID NO: 3之胺基酸序列。參見表1。表1. 對應於SEQ ID NO: 1-3及21-27之序列.

SEQ ID NO: 1 ATGATCAAGTCTATTCAGCTGAAGGTCAAGGGGGAGTGTCCGATCACGAAGGATGTAATCAACGAATACAAAGAATACTATAACAATTGCAGTGATTGGATTAAAAACAATCTGACGTCCATTACCATCGGGGAGATGGCAAAATTTCTGCAATCGTTGAGCGATAAAGAAGTGGCCTATATCTCAATGGGCCTGTCCGATGAGTGGAAAGACAAACCGTTATATCATCTGTTTACCAAAAAATATCACACCAAAAATGCGGATAACTTATTATACTACTACATTAAAGAAAAAAATCTGGACGGCTACAAAGGCAATACGCTTAATATCTCCAATACATCTTTCCGCCAGTTCGGTTATTTCAAACTCGTGGTGAGCAACTACCGCACTAAAATCCGTACGCTGAATTGTAAAATCAAGCGTAAGAAAATCGATGCCGATTCCACGTCTGAGGATATCGAAATGCAGGTGATGTACGAAATTATTAAATACAGTTTAAATAAAAAGTCTGATTGGGATAACTTCATTAGCTATATCGAAAACGTTGAAAATCCTAATATTGACAACATCAACCGCTACAAACTGCTGCGCGAATGCTTTTGCGAAAACGAAAACATGATTAAGAACAAACTTGAATTGCTGTCTGTGGAACAATTGAAAAAATTTGGCGGTTGCATCATGAAACCTCACATTAATAGCATGACCATTAACATTCAAGATTTTAAAATTGAGGAAAAAGAAAACTCTCTGGGGTTCATCCTCCACCTCCCACTGAACAAAAAACAGTATCAAATTGAACTCCTGGGCAATCGTCAGATTAAAAAAGGCACCAAAGAAATTCACGAAACGTTAGTTGACATTACTAACACCCATGGCGAAAACATTGTGTTTACTATTAAAAATGATAATCTGTATATCGTGTTCTCTTATGAGTCCGAATTTGAAAAAGAAGAAGTTAACTTCGCTAAAACGGTTGGCCTGGACGTAAACTTCAAACATGCCTTCTTTGTGACCTCTGAGAAAGATAACTGTCATCTCGACGGTTATATTAATCTCTACAAATACTTATTGGAGCACGACGAGTTTACTAACCTTCTCACCGAAGATGAACGTAAAGATTATGAGGAGCTGAGTAAAGTCGTTACTTTCTGCCCGTTTGAAAATCAGTTACTGTTTGCGCGTTACAACAAGATGAGCAAATTCTGCAAGAAAGAACAGGTCCTGAGCAAACTTCTCTATGCGCTGCAGAAAAAACTCAAAGACGAGAACCGCACGAAAGAATATATTTATGTCTCGTGCGTGAACAAATTACGTGCCAAATATGTGTCATATTTTATTCTGAAAGAAAAGTACTACGAGAAGCAGAAAGAATATGACATCGAAATGGGCTTTGTGGACGACTCAACGGAAAGCAAAGAATCAATGGATAAACGCCGTACTGAATATCCGTTTCGCAACACGCCGGTAGCCAACGAACTGTTGTCCAAACTGAATAACGTACAGCAGGACATCAACGGGTGCCTGAAGAACATCATCAACTACATTTATAAAATTTTCGAGCAGAACGGTTATAAAGTTGTCGCCCTCGAAAACCTGGAAAATTCTAATTTTGAAAAAAAACAGGTGTTGCCGACGATTAAAAGTCTGCTGAAATATCACAAACTGGAGAACCAGAACGTGAATGATATCAAGGCCTCTGACAAAGTTAAAGAATATATTGAAAACGGTTATTATGAACTCATGACCAACGAGAATAACGAAATCGTTGATGCAAAATATACAGAAAAGGGCGCAATGAAGGTGAAGAACGCCAATTTTTTTAACCTCATGATGAAAAGTTTGCATTTTGCCAGTGTGAAAGATGAGTTTGTGCTGCTGTCCAATAATGGCAAGACGCAGATTGCATTAGTGCCATCCGAGTTTACATCTCAGATGGACAGCACCGATCACTGTCTGTACATGAAGAAGAACGACAAAGGTAAACTGGTGAAAGCGGATAAAAAGGAAGTTCGTACAAAACAGGAACGTCACATCAACGGCCTCAACGCCGATTTCAACGCAGCGAATAATATTAAATATATCGTGGAAAATGAAGTGTGGCGTGGTATTTTTTGCACTCGCCCGAAGAAAACAGAATATAACGTACCCAGTCTGGATACCACGAAAAAAGGTCCGTCTGCGATTCTCAACATGCTGAAGAAAATTGAAGCCATCAAGGTCCTGGAAACGGAAAAA

SEQ ID NO: 2 ATGATCAAGAGCATCCAGCTGAAGGTGAAGGGCGAGTGCCCCATCACCAAGGACGTGATCAACGAGTACAAGGAGTACTACAACAACTGTTCTGATTGGATCAAGAACAATCTGACCAGCATCACAATCGGCGAGATGGCCAAGTTTCTGCAGAGCCTGTCCGACAAGGAGGTGGCCTACATCTCTATGGGCCTGAGCGACGAGTGGAAGGATAAGCCTCTGTATCACCTGTTCACCAAGAAGTACCACACAAAGAATGCCGACAACCTGCTGTACTATTACATCAAGGAGAAGAACCTGGATGGCTACAAGGGCAATACCCTGAACATCTCCAATACATCTTTCAGGCAGTTTGGCTATTTCAAGCTGGTGGTGTCCAATTACAGGACCAAGATCCGCACACTGAACTGCAAGATCAAGCGCAAGAAGATCGACGCCGATTCTACCAGCGAGGACATCGAGATGCAGGTCATGTATGAGATCATCAAGTACTCCCTGAACAAGAAGTCTGATTGGGATAATTTCATCTCTTATATCGAGAACGTGGAGAACCCCAATATCGATAACATCAATCGGTACAAGCTGCTGAGAGAGTGCTTTTGTGAGAACGAGAATATGATCAAGAACAAGCTGGAGCTGCTGAGCGTGGAGCAGCTGAAGAAGTTCGGCGGCTGTATCATGAAGCCTCACATCAACAGCATGACCATCAATATCCAGGACTTTAAGATCGAGGAGAAGGAGAATTCCCTGGGCTTCATCCTGCACCTGCCACTGAACAAGAAGCAGTACCAGATCGAGCTGCTGGGCAATCGGCAGATCAAGAAGGGCACCAAGGAGATCCACGAGACACTGGTGGACATCACCAACACACACGGCGAGAACATCGTGTTTACAATCAAGAACGATAATCTGTACATCGTGTTTAGCTACGAGTCCGAGTTCGAGAAGGAGGAAGTGAATTTTGCCAAGACCGTGGGCCTGGACGTGAACTTCAAGCACGCCTTCTTTGTGACATCCGAGAAGGACAATTGCCACCTGGATGGCTATATCAACCTGTATAAGTACCTGCTGGAGCACGATGAGTTCACCAACCTGCTGACAGAGGACGAGCGGAAGGATTACGAGGAGCTGTCTAAGGTGGTGACCTTTTGCCCTTTCGAGAATCAGCTGCTGTTTGCCAGATATAACAAGATGAGCAAGTTCTGTAAGAAGGAGCAGGTGCTGTCCAAGCTGCTGTACGCCCTGCAGAAGAAGCTGAAGGACGAGAACAGGACAAAGGAGTATATCTACGTGTCTTGCGTGAATAAGCTGCGCGCCAAGTATGTGAGCTACTTTATCCTGAAGGAGAAGTATTACGAGAAGCAGAAGGAGTATGACATCGAGATGGGCTTCGTGGACGATTCTACCGAGAGCAAGGAGTCCATGGATAAGCGGAGAACCGAGTACCCCTTTAGGAACACACCTGTGGCCAATGAGCTGCTGAGCAAGCTGAACAATGTGCAGCAGGATATCAACGGCTGTCTGAAGAACATCATCAATTACATCTACAAGATCTTCGAGCAGAACGGCTACAAGGTGGTGGCCCTGGAGAACCTGGAGAACTCCAATTTCGAGAAGAAGCAGGTGCTGCCAACAATCAAGTCTCTGCTGAAGTATCACAAGCTGGAGAACCAGAATGTGAACGACATCAAGGCCAGCGATAAGGTGAAGGAGTACATCGAGAATGGCTATTACGAGCTGATGACCAACGAGAACAATGAGATCGTGGACGCCAAGTATACAGAGAAGGGCGCCATGAAGGTGAAGAATGCCAACTTCTTTAACCTGATGATGAAGAGCCTGCACTTTGCCTCCGTGAAGGATGAGTTCGTGCTGCTGTCCAACAATGGCAAGACCCAGATCGCCCTGGTGCCATCCGAGTTCACCTCTCAGATGGACAGCACAGATCACTGCCTGTACATGAAGAAGAATGACAAGGGCAAGCTGGTGAAGGCCGATAAGAAGGAGGTGAGGACAAAGCAGGAGCGCCACATCAACGGCCTGAATGCCGACTTTAACGCCGCCAACAATATCAAGTATATCGTGGAGAATGAAGTGTGGCGGGGCATCTTCTGTACCAGACCAAAGAAGACAGAGTACAACGTGCCCTCCCTGGATACCACAAAGAAGGGCCCCTCTGCCATCCTGAATATGCTGAAGAAGATCGAGGCCATCAAGGTGCTGGAGACCGAGAAG

SEQ ID NO: 3 MIKSIQLKVKGECPITKDVINEYKEYYNNCSDWIKNNLTSITIGEMAKFLQSLSDKEVAYISMGLSDEWKDKPLYHLFTKKYHTKNADNLLYYYIKEKNLDGYKGNTLNISNTSFRQFGYFKLVVSNYRTKIRTLNCKIKRKKIDADSTSEDIEMQVMYEIIKYSLNKKSDWDNFISYIENVENPNIDNINRYKLLRECFCENENMIKNKLELLSVEQLKKFGGCIMKPHINSMTINIQDFKIEEKENSLGFILHLPLNKKQYQIELLGNRQIKKGTKEIHETLVDITNTHGENIVFTIKNDNLYIVFSYESEFEKEEVNFAKTVGLDVNFKHAFFVTSEKDNCHLDGYINLYKYLLEHDEFTNLLTEDERKDYEELSKVVTFCPFENQLLFARYNKMSKFCKKEQVLSKLLYALQKKLKDENRTKEYIYVSCVNKLRAKYVSYFILKEKYYEKQKEYDIEMGFVDDSTESKESMDKRRTEYPFRNTPVANELLSKLNNVQQDINGCLKNIINYIYKIFEQNGYKVVALENLENSNFEKKQVLPTIKSLLKYHKLENQNVNDIKASDKVKEYIENGYYELMTNENNEIVDAKYTEKGAMKVKNANFFNLMMKSLHFASVKDEFVLLSNNGKTQIALVPSEFTSQMDSTDHCLYMKKNDKGKLVKADKKEVRTKQERHINGLNADFNAANNIKYIVENEVWRGIFCTRPKKTEYNVPSLDTTKKGPSAILNMLKKIEAIKVLETEK

SEQ ID NO: 21 ATGATTAAATCCATCCAGCTTAAAGTGAAAGGCGAATGCCCCATCACCAAAGATGTTATTAACGAGTACAAGGAATACTATAATAACTGCAGCGATTGGATAAAAAACAATCTTACCTCGATCACTATTGGCGAGATGGCCAAGTTCCTGCAGAGCCTGTCTGATAAGGAGGTTGCTTACATTTCCATGGGCCTGAGCGACGAGTGGAAAGACAAGCCCTTGTACCACCTGTTCACTAAGAAATACCACACTAAGAATGCTGACAATCTGCTCTACTACTACATCAAGGAGAAAAACTTGGATGGCTACAAGGGGAACACGCTTAACATTTCTAACACCTCATTTCGTCAGTTCGGGTATTTCAAGCTCGTGGTGTCCAACTATCGCACTAAGATTCGGACACTCAACTGCAAGATTAAACGAAAGAAGATCGACGCAGATTCTACGAGCGAGGATATTGAAATGCAGGTCATGTATGAAATCATCAAGTACTCTCTGAATAAGAAGTCTGACTGGGACAATTTTATCAGCTACATCGAAAACGTAGAGAACCCTAACATAGACAATATCAACAGGTACAAACTGCTTAGGGAATGCTTCTGTGAAAACGAGAATATGATAAAAAACAAGCTGGAGCTGCTGAGCGTGGAGCAATTAAAGAAGTTTGGAGGGTGTATCATGAAACCCCACATTAACTCGATGACAATTAATATTCAAGACTTCAAGATAGAGGAGAAAGAAAACAGCTTGGGCTTTATTCTCCATCTCCCTCTGAATAAAAAACAGTACCAGATCGAGCTATTGGGAAATAGACAGATTAAGAAAGGGACCAAGGAAATTCACGAAACTCTCGTCGATATCACAAACACCCATGGAGAGAACATCGTGTTCACAATCAAGAACGATAATCTGTACATAGTGTTTAGTTATGAGAGCGAGTTCGAGAAGGAAGAGGTCAACTTTGCCAAGACTGTTGGGCTTGACGTCAATTTCAAACACGCGTTCTTCGTGACAAGCGAAAAGGACAACTGCCATCTCGATGGCTACATTAACCTATATAAGTATTTGCTCGAACACGACGAGTTTACAAACCTGCTGACAGAAGATGAGAGAAAGGACTACGAAGAACTCAGTAAGGTCGTTACGTTCTGTCCATTTGAAAATCAGCTGCTATTCGCCCGGTACAATAAAATGTCCAAATTCTGTAAGAAGGAACAGGTATTGTCTAAACTGCTGTATGCCCTGCAGAAAAAGTTGAAAGATGAGAATCGGACCAAAGAGTATATCTATGTCTCATGCGTGAACAAGCTAAGAGCTAAGTATGTTTCCTATTTCATACTGAAGGAGAAGTACTATGAGAAGCAAAAGGAGTACGACATTGAGATGGGCTTCGTCGATGACTCAACCGAATCTAAAGAATCCATGGACAAAAGGCGCACAGAGTATCCATTTAGAAATACACCGGTGGCTAACGAACTCCTGAGTAAACTCAACAATGTTCAACAAGATATCAACGGTTGTCTGAAGAATATAATTAATTATATCTATAAGATTTTTGAACAGAATGGCTACAAGGTGGTCGCACTGGAAAACTTAGAGAATTCCAACTTTGAGAAAAAGCAGGTGCTTCCTACAATCAAATCACTTCTGAAGTACCACAAACTTGAGAATCAGAACGTAAATGATATCAAAGCCAGTGATAAAGTCAAAGAATACATCGAGAATGGTTATTATGAACTGATGACTAATGAAAATAATGAAATAGTGGACGCAAAATATACGGAAAAGGGTGCCATGAAGGTAAAGAACGCAAACTTTTTTAATTTGATGATGAAGTCACTGCACTTTGCTTCTGTGAAGGATGAGTTTGTCCTGCTGAGCAACAACGGAAAGACACAGATTGCGCTAGTGCCTTCAGAGTTCACTAGTCAGATGGACAGTACCGACCATTGCCTCTACATGAAAAAAAATGACAAAGGGAAACTCGTGAAGGCTGACAAGAAAGAGGTGCGGACCAAGCAAGAGCGCCATATCAATGGATTAAACGCCGATTTTAACGCGGCAAATAACATCAAATACATCGTTGAAAATGAGGTGTGGAGGGGTATCTTCTGTACCCGACCAAAGAAGACTGAGTACAACGTACCATCCTTAGACACCACCAAAAAAGGACCCTCCGCCATTCTGAATATGTTAAAGAAAATCGAGGCCATAAAAGTGTTGGAGACCGAGAAG

SEQ ID NO: 22 ATGATCAAGAGCATTCAGCTGAAGGTGAAGGGCGAGTGCCCCATCACCAAGGACGTGATCAACGAGTACAAGGAGTACTACAACAACTGCAGCGACTGGATTAAAAACAATCTCACAAGCATCACCATCGGCGAGATGGCCAAGTTCCTGCAGAGCCTGAGCGACAAAGAGGTGGCCTACATCAGCATGGGCCTGAGCGACGAGTGGAAGGACAAGCCCCTGTACCACCTGTTCACCAAGAAGTACCACACCAAGAACGCCGACAACCTGCTGTACTACTACATCAAGGAGAAGAATCTGGATGGCTACAAGGGCAATACCCTGAACATCAGCAACACCAGCTTCAGACAGTTCGGCTACTTCAAGCTGGTGGTGAGCAACTACAGAACCAAGATCAGAACCCTGAACTGCAAGATCAAGAGAAAGAAGATCGACGCCGACAGCACAAGCGAGGACATAGAGATGCAAGTTATGTACGAGATCATCAAGTACAGCCTTAATAAAAAGAGCGACTGGGACAACTTCATCAGCTACATAGAAAACGTGGAGAACCCCAACATCGACAACATCAACAGATACAAGCTGCTGAGAGAGTGCTTCTGCGAGAACGAGAACATGATCAAAAACAAACTCGAACTGCTGAGTGTAGAACAGCTGAAGAAGTTCGGCGGCTGCATCATGAAGCCCCACATCAACAGCATGACCATCAACATCCAAGACTTCAAGATCGAGGAGAAGGAGAACAGCCTGGGCTTCATCCTGCACCTGCCCTTAAACAAGAAGCAGTATCAGATCGAGCTGCTGGGCAACAGACAGATCAAGAAGGGCACCAAGGAGATCCACGAGACCCTGGTGGACATCACCAACACCCACGGCGAGAATATCGTTTTCACTATCAAGAACGACAACCTGTACATCGTGTTTAGCTATGAGAGCGAGTTCGAGAAGGAAGAGGTGAACTTCGCCAAGACCGTGGGCCTGGACGTGAACTTCAAGCACGCCTTCTTCGTGACAAGCGAGAAGGACAACTGCCACCTGGACGGCTACATCAATCTGTACAAGTACCTGCTGGAGCACGACGAGTTCACCAACCTGCTGACCGAGGACGAGAGAAAGGACTACGAGGAGCTGAGCAAGGTGGTGACCTTCTGCCCCTTCGAGAATCAGCTGCTGTTCGCTAGATACAACAAGATGAGCAAGTTCTGCAAGAAGGAGCAAGTGCTGAGCAAACTGCTGTACGCCCTGCAGAAGAAGCTGAAGGACGAGAACAGAACCAAGGAGTATATCTACGTGAGCTGCGTGAACAAGCTGAGAGCCAAGTACGTGAGCTACTTCATCCTGAAGGAGAAGTACTACGAGAAGCAGAAGGAGTACGACATCGAGATGGGTTTTGTGGACGACAGCACCGAGAGCAAGGAGAGCATGGACAAGAGAAGAACCGAGTACCCCTTCAGAAACACCCCCGTGGCCAACGAATTACTGTCTAAACTGAATAACGTGCAGCAAGACATCAACGGCTGCCTGAAGAACATAATCAACTACATCTACAAGATCTTCGAGCAGAACGGCTACAAGGTGGTAGCCCTGGAGAACCTGGAGAACAGCAACTTCGAGAAGAAGCAAGTGCTGCCCACCATCAAGAGCCTGCTGAAGTACCACAAGCTGGAGAATCAGAACGTGAACGACATCAAGGCTAGCGACAAGGTGAAGGAGTACATCGAGAACGGATACTACGAGCTGATGACCAACGAGAACAACGAGATCGTGGACGCCAAGTACACCGAGAAGGGCGCCATGAAGGTGAAGAACGCCAACTTCTTCAACCTGATGATGAAGAGCCTGCACTTCGCTAGCGTGAAGGACGAGTTCGTGCTGCTGTCGAACAACGGCAAGACACAGATCGCCCTGGTGCCTAGCGAGTTCACATCTCAGATGGACAGCACCGACCACTGCCTGTACATGAAGAAGAACGACAAGGGCAAGCTGGTGAAGGCCGACAAGAAAGAGGTGAGAACCAAGCAAGAGAGACACATCAACGGCCTGAACGCCGACTTCAACGCCGCCAACAACATCAAGTACATCGTGGAGAACGAGGTGTGGAGAGGCATCTTCTGCACAAGACCCAAGAAGACCGAGTACAACGTGCCTAGCCTGGACACCACCAAGAAGGGCCCTAGCGCCATCCTGAACATGCTGAAGAAGATCGAGGCCATCAAGGTGCTGGAGACCGAGAAG

SEQ ID NO: 23 ATGATCAAGAGCATCCAGCTGAAGGTGAAGGGCGAGTGCCCCATCACCAAGGACGTGATCAACGAGTACAAGGAGTACTACAACAACTGCAGCGACTGGATCAAGAACAACCTGACCAGCATCACCATCGGCGAGATGGCCAAGTTCCTGCAGAGCCTGAGCGACAAGGAGGTGGCCTACATCAGCATGGGCCTGAGCGACGAGTGGAAGGACAAGCCCCTGTACCACCTGTTCACCAAGAAGTACCACACCAAGAACGCCGACAACCTGCTGTACTACTACATCAAGGAGAAGAACCTGGACGGCTACAAGGGCAACACCCTGAACATCAGCAACACCAGCTTCCGGCAGTTCGGCTACTTCAAGCTGGTGGTGAGCAACTACCGGACCAAGATCCGGACCCTGAACTGCAAGATCAAGCGGAAGAAGATCGACGCCGACAGCACCAGCGAGGACATCGAGATGCAGGTGATGTACGAGATCATCAAGTACAGCCTGAACAAGAAGAGCGACTGGGACAACTTCATCAGCTACATCGAGAACGTGGAGAACCCCAACATCGACAACATCAACCGGTACAAGCTGCTGCGGGAGTGCTTCTGCGAGAACGAGAACATGATCAAGAACAAGCTGGAGCTGCTGAGCGTGGAGCAGCTGAAGAAGTTCGGCGGCTGCATCATGAAGCCCCACATCAACAGCATGACCATCAACATCCAGGACTTCAAGATCGAGGAGAAGGAGAACAGCCTGGGCTTCATCCTGCACCTGCCCCTGAACAAGAAGCAGTACCAGATCGAGCTGCTGGGCAACCGGCAGATCAAGAAGGGCACCAAGGAGATCCACGAGACCCTGGTGGACATCACCAACACCCACGGCGAGAACATCGTGTTCACCATCAAGAACGACAACCTGTACATCGTGTTCAGCTACGAGAGCGAGTTCGAGAAGGAGGAGGTGAACTTCGCCAAGACCGTGGGCCTGGACGTGAACTTCAAGCACGCCTTCTTCGTGACCAGCGAGAAGGACAACTGCCACCTGGACGGCTACATCAACCTGTACAAGTACCTGCTGGAGCACGACGAGTTCACCAACCTGCTGACCGAGGACGAGCGGAAGGACTACGAGGAGCTGAGCAAGGTGGTGACCTTCTGCCCCTTCGAGAACCAGCTGCTGTTCGCCCGGTACAACAAGATGAGCAAGTTCTGCAAGAAGGAGCAGGTGCTGAGCAAGCTGCTGTACGCCCTGCAGAAGAAGCTGAAGGACGAGAACCGGACCAAGGAGTACATCTACGTGAGCTGCGTGAACAAGCTGCGGGCCAAGTACGTGAGCTACTTCATCCTGAAGGAGAAGTACTACGAGAAGCAGAAGGAGTACGACATCGAGATGGGCTTCGTGGACGACAGCACCGAGAGCAAGGAGAGCATGGACAAGCGGCGGACCGAGTACCCCTTCCGGAACACCCCCGTGGCCAACGAGCTGCTGAGCAAGCTGAACAACGTGCAGCAGGACATCAACGGCTGCCTGAAGAACATCATCAACTACATCTACAAGATCTTCGAGCAGAACGGCTACAAGGTGGTGGCCCTGGAGAACCTGGAGAACAGCAACTTCGAGAAGAAGCAGGTGCTGCCCACCATCAAGAGCCTGCTGAAGTACCACAAGCTGGAGAACCAGAACGTGAACGACATCAAGGCCAGCGACAAGGTGAAGGAGTACATCGAGAACGGCTACTACGAGCTGATGACCAACGAGAACAACGAGATCGTGGACGCCAAGTACACCGAGAAGGGCGCCATGAAGGTGAAGAACGCCAACTTCTTCAACCTGATGATGAAGAGCCTGCACTTCGCCAGCGTGAAGGACGAGTTCGTGCTGCTGAGCAACAACGGCAAGACCCAGATCGCCCTGGTGCCCAGCGAGTTCACCAGCCAGATGGACAGCACCGACCACTGCCTGTACATGAAGAAGAACGACAAGGGCAAGCTGGTGAAGGCCGACAAGAAGGAGGTGCGGACCAAGCAGGAGCGGCACATCAACGGCCTGAACGCCGACTTCAACGCCGCCAACAACATCAAGTACATCGTGGAGAACGAGGTGTGGCGGGGCATCTTCTGCACCCGGCCCAAGAAGACCGAGTACAACGTGCCCAGCCTGGACACCACCAAGAAGGGCCCCAGCGCCATCCTGAACATGCTGAAGAAGATCGAGGCCATCAAGGTGCTGGAGACCGAGAAG

SEQ ID NO: 24 ATGATTAAAAGTATACAGCTTAAGGTCAAGGGCGAGTGCCCGATTACCAAAGATGTAATTAACGAGTACAAGGAGTATTACAATAACTGTTCTGACTGGATCAAGAACAATCTGACTTCAATTACGATCGGTGAAATGGCCAAATTTCTCCAGTCCTTGAGTGATAAGGAGGTCGCATATATATCCATGGGACTCAGTGACGAGTGGAAGGACAAACCCCTGTACCATCTTTTTACTAAAAAATACCATACGAAAAACGCAGACAACCTGCTGTACTACTATATAAAAGAAAAAAACCTGGACGGTTACAAGGGCAACACCCTCAATATTAGCAACACTAGTTTCCGACAATTCGGGTACTTCAAGCTGGTCGTGAGCAACTATCGGACCAAAATCAGGACTTTGAATTGTAAGATAAAGAGAAAGAAGATAGACGCAGATTCTACTAGTGAGGATATCGAGATGCAGGTAATGTACGAGATCATTAAGTATTCACTGAACAAGAAGAGCGATTGGGATAACTTCATATCATACATCGAAAACGTTGAAAATCCAAACATCGACAATATTAATAGATACAAACTGTTGAGAGAATGCTTCTGCGAAAACGAAAATATGATAAAAAACAAACTCGAATTGTTGTCAGTTGAACAGCTGAAGAAATTCGGAGGGTGCATAATGAAGCCTCACATAAACTCAATGACAATAAACATCCAAGACTTCAAGATAGAAGAGAAGGAGAACAGTTTGGGTTTTATTCTTCACCTGCCTTTGAACAAGAAGCAATACCAAATCGAGCTGCTCGGAAATAGGCAGATAAAAAAGGGGACAAAAGAAATACACGAAACCCTTGTTGACATTACGAACACACACGGGGAAAATATCGTGTTCACAATTAAAAATGACAACCTTTACATTGTATTTTCTTATGAATCAGAGTTCGAAAAGGAAGAAGTGAACTTTGCCAAGACCGTTGGTTTGGACGTCAACTTTAAACACGCCTTCTTCGTTACATCAGAAAAGGATAACTGTCATCTTGATGGATACATAAACCTCTACAAGTATCTTCTTGAACACGACGAATTCACAAACCTGCTTACTGAAGACGAGCGAAAGGATTACGAGGAGTTGTCAAAGGTAGTCACATTCTGTCCATTCGAAAATCAGCTGTTGTTTGCCAGGTACAATAAGATGTCTAAATTCTGTAAAAAAGAACAAGTCCTCAGCAAACTGCTGTATGCACTGCAAAAGAAACTTAAGGACGAAAATAGGACTAAGGAGTATATATACGTTTCATGCGTTAATAAACTCCGGGCGAAATATGTGAGTTATTTTATTCTGAAGGAGAAGTATTATGAGAAGCAGAAAGAGTACGACATAGAAATGGGATTTGTGGATGACAGTACGGAGAGCAAAGAAAGCATGGACAAAAGAAGGACCGAATATCCATTTCGAAATACTCCAGTCGCGAATGAGCTGCTGAGCAAACTTAACAATGTCCAGCAGGACATTAACGGTTGCCTGAAGAACATAATCAACTACATATATAAGATATTTGAGCAAAACGGATACAAAGTGGTTGCACTTGAAAACCTCGAGAATTCAAATTTCGAAAAGAAGCAAGTTTTGCCCACGATTAAAAGTCTCTTGAAATACCATAAGCTCGAAAATCAGAATGTGAACGATATCAAGGCCTCAGATAAGGTCAAGGAGTACATCGAAAATGGATATTACGAGCTGATGACGAACGAGAATAACGAAATCGTCGATGCGAAGTACACAGAAAAGGGGGCTATGAAGGTGAAAAACGCCAATTTTTTTAATTTGATGATGAAGTCCTTGCATTTCGCCTCAGTCAAAGATGAGTTTGTTCTCCTGAGTAATAATGGGAAAACACAGATAGCCTTGGTTCCTTCAGAGTTCACGTCTCAGATGGACTCAACTGATCATTGTCTTTATATGAAGAAAAATGATAAAGGGAAACTGGTCAAGGCCGATAAGAAAGAGGTGCGCACGAAACAAGAAAGACACATCAACGGCCTCAACGCCGATTTTAACGCAGCTAACAATATTAAATATATCGTAGAGAATGAGGTCTGGAGGGGCATTTTTTGCACCCGACCCAAGAAGACTGAATACAATGTCCCTAGTCTCGATACGACCAAAAAGGGGCCATCAGCTATACTGAATATGTTGAAAAAGATTGAGGCGATTAAAGTCCTGGAAACCGAGAAA

SEQ ID NO: 25 ATGATCAAGAGCATCCAGCTGAAGGTGAAGGGAGAATGTCCTATCACAAAGGACGTGATCAACGAGTACAAGGAGTACTACAACAACTGCAGCGATTGGATCAAGAACAACCTGACCAGCATCACCATCGGCGAGATGGCCAAGTTCCTGCAGTCTCTGTCCGATAAGGAAGTCGCCTACATCAGCATGGGCTTGAGCGACGAATGGAAGGACAAACCCCTGTACCATCTGTTCACTAAGAAGTACCACACCAAGAACGCCGATAACCTGCTGTACTACTACATCAAGGAAAAGAACCTGGACGGCTACAAGGGCAATACCCTGAACATCAGTAACACCAGCTTCCGGCAGTTTGGCTATTTTAAACTGGTGGTCAGCAACTACAGAACCAAGATCAGAACACTGAACTGCAAGATCAAGAGGAAGAAAATCGACGCCGACTCCACCAGCGAAGATATAGAGATGCAGGTGATGTACGAGATCATTAAGTACTCCCTGAATAAGAAGTCTGACTGGGACAACTTCATCAGCTACATCGAGAACGTGGAAAACCCCAACATTGACAATATCAACAGATACAAGCTGCTGCGGGAATGCTTCTGCGAGAATGAAAACATGATCAAGAACAAGCTGGAGCTTCTGAGCGTGGAGCAGCTGAAGAAATTCGGCGGATGTATCATGAAGCCACACATCAATAGCATGACCATCAACATCCAGGACTTCAAAATTGAAGAAAAGGAGAATAGCCTAGGCTTCATCCTGCACCTGCCTCTGAACAAGAAACAGTACCAGATCGAGCTGCTGGGCAACCGGCAAATCAAGAAGGGCACCAAGGAGATCCACGAGACACTGGTCGACATCACAAACACACACGGCGAAAACATCGTGTTCACCATCAAGAACGACAACCTGTACATCGTGTTCAGCTACGAGTCTGAATTCGAGAAGGAAGAGGTCAACTTCGCTAAGACAGTGGGCCTGGACGTGAACTTCAAGCACGCCTTCTTCGTGACCAGCGAGAAAGACAACTGTCACCTGGACGGGTACATCAACCTGTACAAGTACCTGCTGGAACACGACGAGTTCACCAACCTCCTGACCGAAGATGAACGGAAGGATTACGAGGAGCTGTCTAAGGTGGTGACATTCTGCCCTTTCGAGAACCAGCTGCTCTTCGCCAGATATAACAAGATGAGCAAGTTTTGTAAAAAGGAGCAGGTGCTCAGCAAGCTACTGTACGCCCTGCAGAAGAAGCTGAAGGACGAGAACAGAACCAAGGAATACATCTACGTGAGCTGCGTGAACAAGCTGAGAGCCAAGTACGTGTCCTATTTCATCCTGAAGGAAAAATACTACGAGAAACAGAAAGAGTACGACATCGAGATGGGATTTGTGGACGACAGCACCGAAAGCAAGGAATCTATGGACAAGCGCAGAACCGAGTATCCATTTAGAAACACCCCTGTGGCCAATGAGCTGCTGTCCAAACTGAACAACGTGCAGCAGGATATCAATGGCTGCCTGAAAAACATCATCAACTACATTTACAAGATCTTTGAGCAAAACGGCTACAAAGTGGTGGCCCTGGAGAACCTGGAAAACTCCAACTTCGAGAAGAAGCAAGTGCTGCCCACAATCAAGAGCCTGCTGAAGTACCATAAGCTGGAAAATCAGAATGTGAACGACATAAAGGCCTCTGATAAGGTGAAGGAATACATCGAAAATGGCTATTACGAGCTGATGACCAACGAAAATAACGAGATTGTGGACGCTAAATACACCGAGAAGGGCGCTATGAAAGTGAAAAACGCTAACTTTTTTAACCTGATGATGAAGAGCCTGCACTTCGCCAGCGTGAAGGACGAGTTCGTGCTGCTGAGCAACAACGGCAAGACACAGATCGCCCTGGTGCCCAGCGAGTTCACCAGTCAGATGGATTCTACAGATCACTGCCTGTACATGAAAAAGAATGATAAGGGAAAGTTAGTGAAAGCCGATAAGAAGGAGGTGCGGACCAAACAGGAGAGACACATCAACGGCCTGAACGCTGACTTCAACGCCGCCAACAACATCAAATACATCGTTGAGAATGAGGTGTGGCGGGGCATCTTCTGCACCAGACCTAAGAAAACAGAGTATAATGTGCCTAGCCTGGACACCACCAAGAAGGGTCCTAGCGCCATCCTGAACATGCTGAAGAAGATCGAGGCCATCAAGGTTCTGGAAACCGAGAAG

SEQ ID NO: 26 ATGATCAAATCAATTCAGCTTAAGGTGAAGGGCGAGTGTCCCATTACTAAAGACGTCATTAACGAATACAAGGAGTATTACAATAACTGTAGCGACTGGATCAAGAACAATTTGACATCTATCACAATTGGGGAGATGGCCAAATTTTTGCAGAGCCTTAGCGACAAAGAGGTCGCCTACATCTCTATGGGGCTCTCCGACGAGTGGAAGGACAAGCCGTTGTACCACCTGTTCACAAAAAAGTATCACACAAAGAATGCAGACAATTTGCTGTACTACTACATTAAGGAGAAAAACCTTGATGGCTATAAAGGAAACACCCTCAACATCTCTAACACCTCTTTTAGACAGTTCGGCTACTTTAAGCTGGTGGTGAGCAACTATAGAACCAAGATTAGGACTCTGAATTGTAAGATCAAAAGGAAGAAAATCGACGCTGATTCTACCTCTGAAGATATTGAGATGCAAGTCATGTATGAGATCATCAAGTATTCACTGAACAAGAAGAGTGATTGGGACAACTTTATTTCCTACATAGAGAACGTGGAGAATCCCAATATCGATAATATAAACCGATATAAGTTGCTGCGGGAGTGCTTTTGTGAAAATGAGAACATGATTAAAAACAAGTTGGAACTCTTGTCAGTAGAACAGCTTAAAAAGTTCGGCGGCTGCATCATGAAGCCTCATATCAACAGCATGACAATTAATATCCAAGATTTTAAGATCGAGGAGAAGGAAAACAGTTTGGGGTTTATTTTGCACCTTCCACTCAATAAGAAACAGTACCAGATCGAGCTTCTGGGGAATCGGCAGATTAAGAAAGGGACCAAAGAGATACATGAAACTCTGGTTGATATCACAAATACCCATGGCGAAAATATTGTCTTTACCATCAAGAATGACAACCTGTATATCGTGTTTTCTTATGAGTCCGAATTCGAGAAGGAAGAGGTGAACTTTGCCAAGACAGTGGGGTTGGATGTCAATTTTAAGCATGCCTTCTTTGTTACCTCTGAAAAAGATAACTGCCATCTGGATGGATACATCAATCTCTATAAGTATCTGCTTGAGCACGATGAGTTCACAAATCTGCTGACCGAGGACGAGAGAAAGGACTACGAAGAATTGTCCAAGGTGGTTACTTTCTGCCCATTCGAAAATCAGCTGCTGTTCGCAAGATACAACAAAATGTCTAAATTCTGTAAAAAAGAGCAGGTCCTGTCTAAACTTCTGTATGCTCTGCAGAAAAAACTCAAAGACGAAAACCGCACAAAAGAGTACATTTACGTAAGCTGCGTCAATAAATTGAGGGCCAAGTATGTTTCTTATTTCATCCTTAAAGAGAAATACTACGAGAAGCAGAAGGAGTACGACATAGAGATGGGGTTTGTAGACGATTCTACGGAGTCTAAGGAATCTATGGACAAACGGCGCACAGAGTACCCCTTTAGGAATACCCCTGTCGCTAATGAGTTGCTCTCTAAGCTGAACAATGTCCAACAGGATATTAATGGCTGCTTGAAGAACATAATAAATTATATTTATAAAATCTTTGAGCAGAACGGCTACAAAGTTGTTGCTCTGGAGAACCTTGAGAACAGCAACTTTGAAAAGAAGCAGGTACTGCCTACTATTAAGTCTCTGCTGAAATATCATAAGCTGGAAAACCAAAATGTCAACGACATCAAGGCCTCCGACAAAGTGAAAGAGTACATCGAGAACGGATACTACGAGCTGATGACTAATGAGAATAACGAGATTGTCGACGCGAAATATACCGAAAAGGGCGCTATGAAGGTGAAGAATGCTAATTTCTTCAACTTGATGATGAAGAGCCTCCATTTTGCTTCTGTGAAGGATGAGTTTGTGCTGTTGAGTAACAACGGGAAGACCCAGATCGCACTGGTCCCGTCCGAGTTTACCTCCCAGATGGACTCTACAGATCACTGCTTGTACATGAAGAAAAACGATAAAGGTAAGTTGGTGAAAGCAGATAAGAAAGAGGTGCGAACAAAGCAGGAGAGACATATCAACGGACTGAACGCAGATTTTAACGCTGCTAATAATATTAAATATATTGTTGAGAACGAAGTGTGGCGGGGAATTTTCTGCACCAGACCGAAAAAAACAGAATATAATGTCCCGTCCCTCGACACTACTAAAAAAGGCCCTTCTGCGATCCTGAACATGCTTAAAAAGATTGAAGCGATCAAGGTGTTGGAGACTGAGAAG

SEQ ID NO: 27 ATGATCAAGAGCATTCAGCTGAAAGTGAAGGGCGAGTGTCCCATCACTAAGGACGTTATCAACGAGTACAAGGAGTACTATAACAACTGCTCTGACTGGATTAAGAATAACCTGACCAGTATCACCATCGGCGAGATGGCCAAGTTCCTGCAGAGCCTGAGCGACAAGGAGGTGGCCTACATCAGTATGGGGCTGTCCGATGAGTGGAAAGACAAGCCACTGTATCATCTGTTCACCAAAAAGTACCACACCAAAAATGCCGATAACCTGCTGTACTATTATATCAAAGAAAAAAACCTGGACGGGTACAAAGGCAACACCCTGAACATCAGCAATACAAGTTTCCGCCAGTTTGGATACTTCAAGCTGGTCGTGTCAAATTACAGAACCAAAATCAGAACCCTGAACTGCAAGATCAAAAGGAAGAAGATCGACGCTGACAGCACCAGCGAGGACATTGAGATGCAGGTGATGTACGAGATTATTAAATACTCCCTGAACAAGAAGAGTGATTGGGACAATTTCATTTCCTACATCGAGAATGTGGAGAACCCTAACATCGATAACATAAATCGGTACAAACTGCTGAGAGAGTGCTTTTGCGAGAACGAAAATATGATAAAGAACAAGCTGGAGCTGCTCAGCGTGGAACAGCTGAAAAAATTTGGAGGCTGCATTATGAAGCCCCACATCAACTCAATGACTATCAATATCCAGGACTTCAAGATCGAAGAGAAGGAGAACTCCCTGGGCTTCATTCTGCATCTGCCACTGAATAAGAAGCAGTATCAGATCGAACTGCTGGGAAATAGGCAGATCAAGAAGGGGACCAAAGAGATCCACGAAACTCTGGTGGACATTACTAATACTCACGGGGAGAACATTGTGTTCACCATTAAGAACGATAATCTGTACATCGTGTTCAGCTATGAAAGCGAGTTTGAGAAGGAAGAGGTGAACTTCGCCAAGACCGTCGGGCTGGATGTGAATTTTAAGCACGCCTTCTTTGTGACCAGCGAAAAGGATAACTGCCACCTGGACGGATACATCAATCTGTACAAGTATCTGCTGGAGCACGACGAATTTACCAATCTGCTGACCGAGGACGAGAGGAAGGACTACGAAGAGCTCTCCAAGGTGGTGACATTTTGTCCATTCGAGAACCAGCTGCTGTTCGCCAGATACAACAAGATGTCTAAATTTTGCAAAAAAGAACAGGTCCTGAGCAAGCTGCTGTACGCCCTGCAGAAGAAACTGAAGGACGAGAACAGAACTAAGGAGTACATCTATGTGAGCTGTGTGAATAAACTGAGAGCAAAATACGTGTCTTACTTTATTCTGAAGGAGAAGTATTACGAGAAGCAGAAGGAATACGACATCGAGATGGGCTTCGTGGACGATTCCACAGAGAGCAAGGAAAGCATGGATAAAAGGCGCACTGAATACCCCTTCAGAAACACACCTGTGGCCAATGAGCTGCTGTCCAAGCTGAACAACGTGCAGCAGGACATCAACGGCTGCCTGAAGAACATCATCAACTACATTTATAAGATCTTCGAGCAGAATGGCTACAAAGTGGTGGCACTGGAGAACCTGGAGAACTCCAATTTTGAAAAGAAACAGGTGCTGCCCACCATTAAGAGCCTGCTTAAATACCATAAGCTGGAGAACCAGAACGTGAATGATATCAAAGCCAGCGATAAGGTCAAAGAGTACATCGAGAACGGATATTATGAGCTGATGACCAACGAGAACAATGAGATCGTGGACGCCAAATATACCGAGAAGGGCGCCATGAAGGTGAAGAACGCCAACTTCTTTAACCTGATGATGAAGTCCCTTCACTTTGCCTCCGTGAAGGATGAGTTCGTGCTGCTGAGCAACAACGGCAAGACCCAGATCGCCCTGGTGCCCTCTGAATTCACCAGCCAGATGGATTCAACCGACCACTGTCTCTACATGAAGAAGAACGACAAGGGCAAGCTGGTGAAGGCCGACAAGAAAGAGGTGCGCACAAAGCAGGAGCGGCACATCAATGGCCTGAACGCTGATTTCAACGCCGCAAACAACATTAAGTACATCGTGGAGAATGAGGTGTGGAGAGGTATTTTCTGCACCCGCCCCAAGAAGACCGAGTATAATGTGCCCTCTCTGGACACCACCAAAAAAGGCCCAAGCGCTATCCTGAATATGTTGAAGAAAATCGAGGCCATCAAGGTGCTGGAAACCGAGAAG

編碼本文所述之親本多肽之核酸序列可與參考核酸序列，例如SEQ ID NO: 1、SEQ ID NO: 2、SEQ ID NO: 21、SEQ ID NO: 22、SEQ ID NO: 23、SEQ ID NO: 24、SEQ ID NO: 25、SEQ ID NO: 26或SEQ ID NO: 27實質上一致。在一些實施例中，變異多肽由包含與參考核酸序列，例如編碼親本多肽之核酸序列，例如SEQ ID NO: 1、SEQ ID NO: 2、SEQ ID NO: 21、SEQ ID NO: 22、SEQ ID NO: 23、SEQ ID NO: 24、SEQ ID NO: 25、SEQ ID NO: 26或SEQ ID NO: 27具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或至少約99.5%序列一致性之序列的核酸編碼。兩個此類核酸之間的一致性百分比可藉由檢查兩個最佳比對之核酸序列或藉由使用軟體程式或演算法(例如BLAST、ALIGN、CLUSTAL)使用標準參數手動確定。兩個核酸序列實質上一致之一個指示為該等核酸分子在嚴格條件(例如在中等至高嚴格度之範圍內)下與另一者之互補序列雜交。

在一些實施例中，變異多肽由與參考核酸序列，例如編碼親本多肽之核酸序列，例如SEQ ID NO: 1、SEQ ID NO: 2、SEQ ID NO: 21、SEQ ID NO: 22、SEQ ID NO: 23、SEQ ID NO: 24、SEQ ID NO: 25、SEQ ID NO: 26或SEQ ID NO: 27具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或更大序列一致性，但非100%序列一致性之核酸序列編碼。

在一些實施例中，本發明之變異多肽包含與SEQ ID NO: 3具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%，但非100%一致性之多肽序列。在一些實施例中，本發明之變異多肽包含與SEQ ID NO: 3具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%，但非100%一致性之多肽序列。

在一些實施例中，本發明描述一種變異多肽，其與一或多種參考多肽，例如親本多肽具有指定程度之胺基酸序列一致性，例如與SEQ ID NO: 3之胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%，但非100%序列一致性。同源性或一致性可如本文所述，藉由胺基酸序列比對，例如使用諸如BLAST、ALIGN或CLUSTAL之程式來確定。在一些實施例中，變異多肽維持區分該多肽與其相應親本/參考序列之胺基酸變化(或至少1、2、3、4、5個等此等變化)。

在一些實施例中，變異多肽包含親本多肽之一或多個(例如，若干)胺基酸處的改變，其中改變至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、162、164、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、193、194、195、196、197、198、199、200個或更多個。

在一些實施例中，變異多肽包含表2中所列之一或多個胺基酸取代。表2. SEQ ID NO: 3之變異體中之單個胺基酸取代.

表 2
位置	野生型殘基	取代
1	M
2	I	R、G、A、K、Q、N、H
3	K	R、G、A、Q、N、H
4	S	R、G、A、K、Q、N、H
5	I	R、G、A、K、Q、N、H
6	Q	R、G、A、K、N、H
7	L	R、G、A、K、Q、N、H
8	K	R、G、A、Q、N、H
9	V	R、G、A、K、Q、N、H
10	K	R、G、A、Q、N、H
11	G	R、A、K、Q、N、H
12	E	R、G、A、K、Q、N、H
13	C	R、G、A、K、Q、N、H
14	P	R、G、A、K、Q、N、H
15	I	R、G、A、K、Q、N、H
16	T	R、G、A、K、Q、N、H
17	K	R、G、A、Q、N、H
18	D	R、G、A、K、Q、N、H
19	V	R、G、A、K、Q、N、H
20	I	R、G、A、K、Q、N、H
21	N	R、G、A、K、Q、H
22	E	R、G、A、K、Q、N、H
23	Y	R、G、A、K、Q、N、H
24	K	R、G、A、Q、N、H
25	E	R、G、A、K、Q、N、H
26	Y	R、G、A、K、Q、N、H
27	Y	R、G、A、K、Q、N、H
28	N	R、G、A、K、Q、H
29	N	R、G、A、K、Q、H
30	C	R、G、A、K、Q、N、H
31	S	R、G、A、K、Q、N、H
32	D	R、G、A、K、Q、N、H
33	W	R、G、A、K、Q、N、H
34	I	R、G、A、K、Q、N、H
35	K	R、G、A、Q、N、H
36	N	R、G、A、K、Q、H
37	N	R、G、A、K、Q、H
38	L	R、G、A、K、Q、N、H
39	T	R、G、A、K、Q、N、H
40	S	R、G、A、K、Q、N、H
41	I	R、G、A、K、Q、N、H
42	T	R、G、A、K、Q、N、H
43	I	R、G、A、K、Q、N、H
44	G	R、A、K、Q、N、H
45	E	R、G、A、K、Q、N、H
46	M	R、G、A、K、Q、N、H
47	A	R、G、K、Q、N、H
48	K	R、G、A、Q、N、H
49	F	R、G、A、K、Q、N、H
50	L	R、G、A、K、Q、N、H
51	Q	R、G、A、K、N、H
52	S	R、G、A、K、Q、N、H
53	L	R、G、A、K、Q、N、H
54	S	R、G、A、K、Q、N、H
55	D	R、G、A、K、Q、N、H
56	K	R、G、A、Q、N、H
57	E	R、G、A、K、Q、N、H
58	V	R、G、A、K、Q、N、H
59	A	R、G、K、Q、N、H
60	Y	R、G、A、K、Q、N、H
61	I	R、G、A、K、Q、N、H
62	S	R、G、A、K、Q、N、H
63	M	R、G、A、K、Q、N、H
64	G	R、A、K、Q、N、H
65	L	R、G、A、K、Q、N、H
66	S	R、G、A、K、Q、N、H
67	D	R、G、A、K、Q、N、H
68	E	R、G、A、K、Q、N、H
69	W	R、G、A、K、Q、N、H
70	K	R、G、A、Q、N、H
71	D	R、G、A、K、Q、N、H
72	K	R、G、A、Q、N、H
73	P	R、G、A、K、Q、N、H
74	L	R、G、A、K、Q、N、H
75	Y	R、G、A、K、Q、N、H
76	H	R、G、A、K、Q、N
77	L	R、G、A、K、Q、N、H
78	F	R、G、A、K、Q、N、H
79	T	R、G、A、K、Q、N、H
80	K	R、G、A、Q、N、H
81	K	R、G、A、Q、N、H
82	Y	R、G、A、K、Q、N、H
83	H	R、G、A、K、Q、N
84	T	R、G、A、K、Q、N、H
85	K	R、G、A、Q、N、H
86	N	R、G、A、K、Q、H
87	A	R、G、K、Q、N、H
88	D	R、G、A、K、Q、N、H
89	N	R、G、A、K、Q、H
90	L	R、G、A、K、Q、N、H
91	L	R、G、A、K、Q、N、H
92	Y	R、G、A、K、Q、N、H
93	Y	R、G、A、K、Q、N、H
94	Y	R、G、A、K、Q、N、H
95	I	R、G、A、K、Q、N、H
96	K	R、G、A、Q、N、H
97	E	R、G、A、K、Q、N、H
98	K	R、G、A、Q、N、H
99	N	R、G、A、K、Q、H
100	L	R、G、A、K、Q、N、H
101	D	R、G、A、K、Q、N、H
102	G	R、A、K、Q、N、H
103	Y	R、G、A、K、Q、N、H
104	K	R、G、A、Q、N、H
105	G	R、A、K、Q、N、H
106	N	R、G、A、K、Q、H
107	T	R、G、A、K、Q、N、H
108	L	R、G、A、K、Q、N、H
109	N	R、G、A、K、Q、H
110	I	R、G、A、K、Q、N、H
111	S	R、G、A、K、Q、N、H
112	N	R、G、A、K、Q、H
113	T	R、G、A、K、Q、N、H
114	S	R、G、A、K、Q、N、H
115	F	R、G、A、K、Q、N、H
116	R	G、A、K、Q、N、H
117	Q	R、G、A、K、N、H
118	F	R、G、A、K、Q、N、H
119	G	R、A、K、Q、N、H
120	Y	R、G、A、K、Q、N、H
121	F	R、G、A、K、Q、N、H
122	K	R、G、A、Q、N、H
123	L	R、G、A、K、Q、N、H
124	V	R、G、A、K、Q、N、H
125	V	R、G、A、K、Q、N、H
126	S	R、G、A、K、Q、N、H
127	N	R、G、A、K、Q、H
128	Y	R、G、A、K、Q、N、H
129	R	G、A、K、Q、N、H
130	T	R、G、A、K、Q、N、H
131	K	R、G、A、Q、N、H
132	I	R、G、A、K、Q、N、H
133	R	G、A、K、Q、N、H
134	T	R、G、A、K、Q、N、H
135	L	R、G、A、K、Q、N、H
136	N	R、G、A、K、Q、H
137	C	R、G、A、K、Q、N、H
138	K	R、G、A、Q、N、H
139	I	R、G、A、K、Q、N、H
140	K	R、G、A、Q、N、H
141	R	G、A、K、Q、N、H
142	K	R、G、A、Q、N、H
143	K	R、G、A、Q、N、H
144	I	R、G、A、K、Q、N、H
145	D	R、G、A、K、Q、N、H
146	A	R、G、K、Q、N、H
147	D	R、G、A、K、Q、N、H
148	S	R、G、A、K、Q、N、H
149	T	R、G、A、K、Q、N、H
150	S	R、G、A、K、Q、N、H
151	E	R、G、A、K、Q、N、H
152	D	R、G、A、K、Q、N、H
153	I	R、G、A、K、Q、N、H
154	E	R、G、A、K、Q、N、H
155	M	R、G、A、K、Q、N、H
156	Q	R、G、A、K、N、H
157	V	R、G、A、K、Q、N、H
158	M	R、G、A、K、Q、N、H
159	Y	R、G、A、K、Q、N、H
160	E	R、G、A、K、Q、N、H
161	I	R、G、A、K、Q、N、H
162	I	R、G、A、K、Q、N、H
163	K	R、G、A、Q、N、H
164	Y	R、G、A、K、Q、N、H
165	S	R、G、A、K、Q、N、H
166	L	R、G、A、K、Q、N、H
167	N	R、G、A、K、Q、H
168	K	R、G、A、Q、N、H
169	K	R、G、A、Q、N、H
170	S	R、G、A、K、Q、N、H
171	D	R、G、A、K、Q、N、H
172	W	R、G、A、K、Q、N、H
173	D	R、G、A、K、Q、N、H
174	N	R、G、A、K、Q、H
175	F	R、G、A、K、Q、N、H
176	I	R、G、A、K、Q、N、H
177	S	R、G、A、K、Q、N、H
178	Y	R、G、A、K、Q、N、H
179	I	R、G、A、K、Q、N、H
180	E	R、G、A、K、Q、N、H
181	N	R、G、A、K、Q、H
182	V	R、G、A、K、Q、N、H
183	E	R、G、A、K、Q、N、H
184	N	R、G、A、K、Q、H
185	P	R、G、A、K、Q、N、H
186	N	R、G、A、K、Q、H
187	I	R、G、A、K、Q、N、H
188	D	R、G、A、K、Q、N、H
189	N	R、G、A、K、Q、H
190	I	R、G、A、K、Q、N、H
191	N	R、G、A、K、Q、H
192	R	G、A、K、Q、N、H
193	Y	R、G、A、K、Q、N、H
194	K	R、G、A、Q、N、H
195	L	R、G、A、K、Q、N、H
196	L	R、G、A、K、Q、N、H
197	R	G、A、K、Q、N、H
198	E	R、G、A、K、Q、N、H
199	C	R、G、A、K、Q、N、H
200	F	R、G、A、K、Q、N、H
201	C	R、G、A、K、Q、N、H
202	E	R、G、A、K、Q、N、H
203	N	R、G、A、K、Q、H
204	E	R、G、A、K、Q、N、H
205	N	R、G、A、K、Q、H
206	M	R、G、A、K、Q、N、H
207	I	R、G、A、K、Q、N、H
208	K	R、G、A、Q、N、H
209	N	R、G、A、K、Q、H
210	K	R、G、A、Q、N、H
211	L	R、G、A、K、Q、N、H
212	E	R、G、A、K、Q、N、H
213	L	R、G、A、K、Q、N、H
214	L	R、G、A、K、Q、N、H
215	S	R、G、A、K、Q、N、H
216	V	R、G、A、K、Q、N、H
217	E	R、G、A、K、Q、N、H
218	Q	R、G、A、K、N、H
219	L	R、G、A、K、Q、N、H
220	K	R、G、A、Q、N、H
221	K	R、G、A、Q、N、H
222	F	R、G、A、K、Q、N、H
223	G	R、A、K、Q、N、H
224	G	R、A、K、Q、N、H
225	C	R、G、A、K、Q、N、H
226	I	R、G、A、K、Q、N、H
227	M	R、G、A、K、Q、N、H
228	K	R、G、A、Q、N、H
229	P	R、G、A、K、Q、N、H
230	H	R、G、A、K、Q、N
231	I	R、G、A、K、Q、N、H
232	N	R、G、A、K、Q、H
233	S	R、G、A、K、Q、N、H
234	M	R、G、A、K、Q、N、H
235	T	R、G、A、K、Q、N、H
236	I	R、G、A、K、Q、N、H
237	N	R、G、A、K、Q、H
238	I	R、G、A、K、Q、N、H
239	Q	R、G、A、K、N、H
240	D	R、G、A、K、Q、N、H
241	F	R、G、A、K、Q、N、H
242	K	R、G、A、Q、N、H
243	I	R、G、A、K、Q、N、H
244	E	R、G、A、K、Q、N、H
245	E	R、G、A、K、Q、N、H
246	K	R、G、A、Q、N、H
247	E	R、G、A、K、Q、N、H
248	N	R、G、A、K、Q、H
249	S	R、G、A、K、Q、N、H
250	L	R、G、A、K、Q、N、H
251	G	R、A、K、Q、N、H
252	F	R、G、A、K、Q、N、H
253	I	R、G、A、K、Q、N、H
254	L	R、G、A、K、Q、N、H
255	H	R、G、A、K、Q、N
256	L	R、G、A、K、Q、N、H
257	P	R、G、A、K、Q、N、H
258	L	R、G、A、K、Q、N、H
259	N	R、G、A、K、Q、H
260	K	R、G、A、Q、N、H
261	K	R、G、A、Q、N、H
262	Q	R、G、A、K、N、H
263	Y	R、G、A、K、Q、N、H
264	Q	R、G、A、K、N、H
265	I	R、G、A、K、Q、N、H
266	E	R、G、A、K、Q、N、H
267	L	R、G、A、K、Q、N、H
268	L	R、G、A、K、Q、N、H
269	G	R、A、K、Q、N、H
270	N	R、G、A、K、Q、H
271	R	G、A、K、Q、N、H
272	Q	R、G、A、K、N、H
273	I	R、G、A、K、Q、N、H
274	K	R、G、A、Q、N、H
275	K	R、G、A、Q、N、H
276	G	R、A、K、Q、N、H
277	T	R、G、A、K、Q、N、H
278	K	R、G、A、Q、N、H
279	E	R、G、A、K、Q、N、H
280	I	R、G、A、K、Q、N、H
281	H	R、G、A、K、Q、N
282	E	R、G、A、K、Q、N、H
283	T	R、G、A、K、Q、N、H
284	L	R、G、A、K、Q、N、H
285	V	R、G、A、K、Q、N、H
286	D	R、G、A、K、Q、N、H
287	I	R、G、A、K、Q、N、H
288	T	R、G、A、K、Q、N、H
289	N	R、G、A、K、Q、H
290	T	R、G、A、K、Q、N、H
291	H	R、G、A、K、Q、N,
292	G	R、A、K、Q、N、H
293	E	R、G、A、K、Q、N、H
294	N	R、G、A、K、Q、H
295	I	R、G、A、K、Q、N、H
296	V	R、G、A、K、Q、N、H
297	F	R、G、A、K、Q、N、H
298	T	R、G、A、K、Q、N、H
299	I	R、G、A、K、Q、N、H
300	K	R、G、A、Q、N、H
301	N	R、G、A、K、Q、H
302	D	R、G、A、K、Q、N、H
303	N	R、G、A、K、Q、H
304	L	R、G、A、K、Q、N、H
305	Y	R、G、A、K、Q、N、H
306	I	R、G、A、K、Q、N、H
307	V	R、G、A、K、Q、N、H
308	F	R、G、A、K、Q、N、H
309	S	R、G、A、K、Q、N、H
310	Y	R、G、A、K、Q、N、H
311	E	R、G、A、K、Q、N、H
312	S	R、G、A、K、Q、N、H
313	E	R、G、A、K、Q、N、H
314	F	R、G、A、K、Q、N、H
315	E	R、G、A、K、Q、N、H
316	K	R、G、A、Q、N、H
317	E	R、G、A、K、Q、N、H
318	E	R、G、A、K、Q、N、H
319	V	R、G、A、K、Q、N、H
320	N	R、G、A、K、Q、H
321	F	R、G、A、K、Q、N、H
322	A	R、G、K、Q、N、H
323	K	R、G、A、Q、N、H
324	T	R、G、A、K、Q、N、H
325	V	R、G、A、K、Q、N、H
326	G	R、A、K、Q、N、H
327	L	R、G、A、K、Q、N、H
328	D	A、C、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W、Y
329	V	R、G、A、K、Q、N、H
330	N	R、G、A、K、Q、H
331	F	R、G、A、K、Q、N、H
332	K	R、G、A、Q、N、H
333	H	R、G、A、K、Q、N
334	A	R、G、K、Q、N、H
335	F	R、G、A、K、Q、N、H
336	F	R、G、A、K、Q、N、H
337	V	R、G、A、K、Q、N、H
338	T	R、G、A、K、Q、N、H
339	S	R、G、A、K、Q、N、H
340	E	R、G、A、K、Q、N、H
341	K	R、G、A、Q、N、H
342	D	R、G、A、K、Q、N、H
343	N	R、G、A、K、Q、H
344	C	R、G、A、K、Q、N、H
345	H	R、G、A、K、Q、N
346	L	R、G、A、K、Q、N、H
347	D	R、G、A、K、Q、N、H
348	G	R、A、K、Q、N、H
349	Y	R、G、A、K、Q、N、H
350	I	R、G、A、K、Q、N、H
351	N	R、G、A、K、Q、H
352	L	R、G、A、K、Q、N、H
353	Y	R、G、A、K、Q、N、H
354	K	R、G、A、Q、N、H
355	Y	R、G、A、K、Q、N、H
356	L	R、G、A、K、Q、N、H
357	L	R、G、A、K、Q、N、H
358	E	R、G、A、K、Q、N、H
359	H	R、G、A、K、Q、N
360	D	R、G、A、K、Q、N、H
361	E	R、G、A、K、Q、N、H
362	F	R、G、A、K、Q、N、H
363	T	R、G、A、K、Q、N、H
364	N	R、G、A、K、Q、H
365	L	R、G、A、K、Q、N、H
366	L	R、G、A、K、Q、N、H
367	T	R、G、A、K、Q、N、H
368	E	R、G、A、K、Q、N、H
369	D	R、G、A、K、Q、N、H
370	E	R、G、A、K、Q、N、H
371	R	G、A、K、Q、N、H
372	K	R、G、A、Q、N、H
373	D	R、G、A、K、Q、N、H
374	Y	R、G、A、K、Q、N、H
375	E	R、G、A、K、Q、N、H
376	E	R、G、A、K、Q、N、H
377	L	R、G、A、K、Q、N、H
378	S	R、G、A、K、Q、N、H
379	K	R、G、A、Q、N、H
380	V	R、G、A、K、Q、N、H
381	V	R、G、A、K、Q、N、H
382	T	R、G、A、K、Q、N、H
383	F	R、G、A、K、Q、N、H
384	C	R、G、A、K、Q、N、H
385	P	R、G、A、K、Q、N、H
386	F	R、G、A、K、Q、N、H
387	E	R、G、A、K、Q、N、H
388	N	R、G、A、K、Q、H
389	Q	R、G、A、K、N、H
390	L	R、G、A、K、Q、N、H
391	L	R、G、A、K、Q、N、H
392	F	R、G、A、K、Q、N、H
393	A	R、G、K、Q、N、H
394	R	G、A、K、Q、N、H
395	Y	R、G、A、K、Q、N、H
396	N	R、G、A、K、Q、H
397	K	R、G、A、Q、N、H
398	M	R、G、A、K、Q、N、H
399	S	R、G、A、K、Q、N、H
400	K	R、G、A、Q、N、H
401	F	R、G、A、K、Q、N、H
402	C	R、G、A、K、Q、N、H
403	K	R、G、A、Q、N、H
404	K	R、G、A、Q、N、H
405	E	R、G、A、K、Q、N、H
406	Q	R、G、A、K、N、H
407	V	R、G、A、K、Q、N、H
408	L	R、G、A、K、Q、N、H
409	S	R、G、A、K、Q、N、H
410	K	R、G、A、Q、N、H
411	L	R、G、A、K、Q、N、H
412	L	R、G、A、K、Q、N、H
413	Y	R、G、A、K、Q、N、H
414	A	R、G、K、Q、N、H
415	L	R、G、A、K、Q、N、H
416	Q	R、G、A、K、N、H
417	K	R、G、A、Q、N、H
418	K	R、G、A、Q、N、H
419	L	R、G、A、K、Q、N、H
420	K	R、G、A、Q、N、H
421	D	R、G、A、K、Q、N、H
422	E	R、G、A、K、Q、N、H
423	N	R、G、A、K、Q、H
424	T	R、G、A、K、Q、N、H
425	R	G、A、K、Q、N、H
426	K	R、G、A、Q、N、H
427	E	R、G、A、K、Q、N、H
428	Y	R、G、A、K、Q、N、H
429	I	R、G、A、K、Q、N、H
430	Y	R、G、A、K、Q、N、H
431	V	R、G、A、K、Q、N、H
432	S	R、G、A、K、Q、N、H
433	C	R、G、A、K、Q、N、H
434	V	R、G、A、K、Q、N、H
435	N	R、G、A、K、Q、H
436	K	R、G、A、Q、N、H
437	L	R、G、A、K、Q、N、H
438	R	G、A、K、Q、N、H
439	A	R、G、K、Q、N、H
440	K	R、G、A、Q、N、H
441	Y	R、G、A、K、Q、N、H
442	V	R、G、A、K、Q、N、H
443	S	R、G、A、K、Q、N、H
444	Y	R、G、A、K、Q、N、H
445	F	R、G、A、K、Q、N、H
446	I	R、G、A、K、Q、N、H
447	L	R、G、A、K、Q、N、H
448	K	R、G、A、Q、N、H
449	E	R、G、A、K、Q、N、H
450	K	R、G、A、Q、N、H
451	Y	R、G、A、K、Q、N、H
452	Y	R、G、A、K、Q、N、H
453	E	R、G、A、K、Q、N、H
454	K	R、G、A、Q、N、H
455	Q	R、G、A、K、N、H
456	K	R、G、A、Q、N、H
457	E	R、G、A、K、Q、N、H
458	Y	R、G、A、K、Q、N、H
459	D	R、G、A、K、Q、N、H
460	I	R、G、A、K、Q、N、H
461	E	R、G、A、K、Q、N、H
462	M	R、G、A、K、Q、N、H
463	G	R、A、K、Q、N、H
464	F	R、G、A、K、Q、N、H
465	V	R、G、A、K、Q、N、H
466	D	R、G、A、K、Q、N、H
467	D	R、G、A、K、Q、N、H
468	S	R、G、A、K、Q、N、H
469	T	R、G、A、K、Q、N、H
470	E	R、G、A、K、Q、N、H
471	S	R、G、A、K、Q、N、H
472	K	R、G、A、Q、N、H
473	E	R、G、A、K、Q、N、H
474	S	R、G、A、K、Q、N、H
475	M	R、G、A、K、Q、N、H
476	D	R、G、A、K、Q、N、H
477	K	R、G、A、Q、N、H
478	R	G、A、K、Q、N、H
479	R	G、A、K、Q、N、H
480	T	R、G、A、K、Q、N、H
481	E	R、G、A、K、Q、N、H
482	Y	R、G、A、K、Q、N、H
483	P	R、G、A、K、Q、N、H
484	F	R、G、A、K、Q、N、H
485	R	G、A、K、Q、N、H
486	N	R、G、A、K、Q、H
487	T	R、G、A、K、Q、N、H
488	P	R、G、A、K、Q、N、H
489	V	R、G、A、K、Q、N、H
490	A	R、G、K、Q、N、H
491	N	R、G、A、K、Q、H
492	E	R、G、A、K、Q、N、H
493	L	R、G、A、K、Q、N、H
494	L	R、G、A、K、Q、N、H
495	S	R、G、A、K、Q、N、H
496	K	R、G、A、Q、N、H
497	L	R、G、A、K、Q、N、H
498	N	R、G、A、K、Q、H
499	N	R、G、A、K、Q、H
500	V	R、G、A、K、Q、N、H
501	Q	R、G、A、K、N、H
502	Q	R、G、A、K、N、H
503	D	R、G、A、K、Q、N、H
504	I	R、G、A、K、Q、N、H
505	N	R、G、A、K、Q、H
506	G	R、A、K、Q、N、H
507	C	R、G、A、K、Q、N、H
508	L	R、G、A、K、Q、N、H
509	K	R、G、A、Q、N、H
510	N	R、G、A、K、Q、H
511	I	R、G、A、K、Q、N、H
512	I	R、G、A、K、Q、N、H
513	N	R、G、A、K、Q、H
514	Y	R、G、A、K、Q、N、H
515	I	R、G、A、K、Q、N、H
516	Y	R、G、A、K、Q、N、H
517	K	R、G、A、Q、N、H
518	I	R、G、A、K、Q、N、H
519	F	R、G、A、K、Q、N、H
520	E	R、G、A、K、Q、N、H
521	Q	R、G、A、K、N、H
522	N	R、G、A、K、Q、H
523	G	R、A、K、Q、N、H
524	Y	R、G、A、K、Q、N、H
525	K	R、G、A、Q、N、H
526	V	R、G、A、K、Q、N、H
527	V	R、G、A、K、Q、N、H
528	A	R、G、K、Q、N、H
529	L	R、G、A、K、Q、N、H
530	E	A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W、Y
531	N	R、G、A、K、Q、H
532	L	R、G、A、K、Q、N、H
533	E	R、G、A、K、Q、N、H
534	N	R、G、A、K、Q、H
535	S	R、G、A、K、Q、N、H
536	N	R、G、A、K、Q、H
537	F	R、G、A、K、Q、N、H
538	E	R、G、A、K、Q、N、H
539	K	R、G、A、Q、N、H
540	K	R、G、A、Q、N、H
541	Q	R、G、A、K、N、H
542	V	R、G、A、K、Q、N、H
543	L	R、G、A、K、Q、N、H
544	P	R、G、A、K、Q、N、H
545	T	R、G、A、K、Q、N、H
546	I	R、G、A、K、Q、N、H
547	K	R、G、A、Q、N、H
548	S	R、G、A、K、Q、N、H
549	L	R、G、A、K、Q、N、H
550	L	R、G、A、K、Q、N、H
551	K	R、G、A、Q、N、H
552	Y	R、G、A、K、Q、N、H
553	H	R、G、A、K、Q、N
554	K	R、G、A、Q、N、H
555	L	R、G、A、K、Q、N、H
556	E	R、G、A、K、Q、N、H
557	N	R、G、A、K、Q、H
558	Q	R、G、A、K、N、H
559	N	R、G、A、K、Q、H
560	V	R、G、A、K、Q、N、H
561	N	R、G、A、K、Q、H
562	D	R、G、A、K、Q、N、H
563	I	R、G、A、K、Q、N、H
564	K	R、G、A、Q、N、H
565	A	R、G、K、Q、N、H
566	S	R、G、A、K、Q、N、H
567	D	R、G、A、K、Q、N、H
568	K	R、G、A、Q、N、H
569	V	R、G、A、K、Q、N、H
570	K	R、G、A、Q、N、H
571	E	R、G、A、K、Q、N、H
572	Y	R、G、A、K、Q、N、H
573	I	R、G、A、K、Q、N、H
574	E	R、G、A、K、Q、N、H
575	N	R、G、A、K、Q、H
576	G	R、A、K、Q、N、H
577	Y	R、G、A、K、Q、N、H
578	Y	R、G、A、K、Q、N、H
579	E	R、G、A、K、Q、N、H
580	L	R、G、A、K、Q、N、H
581	M	R、G、A、K、Q、N、H
582	T	R、G、A、K、Q、N、H
583	N	R、G、A、K、Q、H
584	E	R、G、A、K、Q、N、H
585	N	R、G、A、K、Q、H
586	N	R、G、A、K、Q、H
587	E	R、G、A、K、Q、N、H
588	I	R、G、A、K、Q、N、H
589	V	R、G、A、K、Q、N、H
590	D	R、G、A、K、Q、N、H
591	A	R、G、K、Q、N、H
592	K	R、G、A、Q、N、H
593	Y	R、G、A、K、Q、N、H
594	T	R、G、A、K、Q、N、H
595	E	R、G、A、K、Q、N、H
596	K	R、G、A、Q、N、H
597	G	R、A、K、Q、N、H
598	A	R、G、K、Q、N、H
599	M	R、G、A、K、Q、N、H
600	K	R、G、A、Q、N、H
601	V	R、G、A、K、Q、N、H
602	K	R、G、A、Q、N、H
603	N	R、G、A、K、Q、H
604	A	R、G、K、Q、N、H
605	N	R、G、A、K、Q、H
606	F	R、G、A、K、Q、N、H
607	F	R、G、A、K、Q、N、H
608	N	R、G、A、K、Q、H
609	L	R、G、A、K、Q、N、H
610	M	R、G、A、K、Q、N、H
611	M	R、G、A、K、Q、N、H
612	K	R、G、A、Q、N、H
613	S	R、G、A、K、Q、N、H
614	L	R、G、A、K、Q、N、H
615	H	R、G、A、K、Q、N
616	F	R、G、A、K、Q、N、H
617	A	R、G、K、Q、N、H
618	S	R、G、A、K、Q、N、H
619	V	R、G、A、K、Q、N、H
620	K	R、G、A、Q、N、H
621	D	R、G、A、K、Q、N、H
622	E	R、G、A、K、Q、N、H
623	F	R、G、A、K、Q、N、H
624	V	R、G、A、K、Q、N、H
625	L	R、G、A、K、Q、N、H
626	L	R、G、A、K、Q、N、H
627	S	R、G、A、K、Q、N、H
628	N	R、G、A、K、Q、H
629	N	R、G、A、K、Q、H
630	G	R、A、K、Q、N、H
631	K	R、G、A、Q、N、H
632	T	R、G、A、K、Q、N、H
633	Q	R、G、A、K、N、H
634	I	R、G、A、K、Q、N、H
635	A	R、G、K、Q、N、H
636	L	R、G、A、K、Q、N、H
637	V	R、G、A、K、Q、N、H
638	P	R、G、A、K、Q、N、H
639	S	R、G、A、K、Q、N、H
640	E	R、G、A、K、Q、N、H
641	F	R、G、A、K、Q、N、H
642	T	R、G、A、K、Q、N、H
643	S	R、G、A、K、Q、N、H
644	Q	R、G、A、K、N、H
645	M	R、G、A、K、Q、N、H
646	D	R、G、A、K、Q、N、H
647	S	R、G、A、K、Q、N、H
648	T	R、G、A、K、Q、N、H
649	D	R、G、A、K、Q、N、H
650	H	R、G、A、K、Q、N
651	C	R、G、A、K、Q、N、H
652	L	R、G、A、K、Q、N、H
653	Y	R、G、A、K、Q、N、H
654	M	R、G、A、K、Q、N、H
655	K	R、G、A、Q、N、H
656	K	R、G、A、Q、N、H
657	N	R、G、A、K、Q、H
658	D	R、G、A、K、Q、N、H
659	K	R、G、A、Q、N、H
660	G	R、A、K、Q、N、H
661	K	R、G、A、Q、N、H
662	L	R、G、A、K、Q、N、H
663	V	R、G、A、K、Q、N、H
664	K	R、G、A、Q、N、H
665	A	R、G、K、Q、N、H
666	D	R、G、A、K、Q、N、H
667	K	R、G、A、Q、N、H
668	K	R、G、A、Q、N、H
669	E	R、G、A、K、Q、N、H
670	V	R、G、A、K、Q、N、H
671	R	G、A、K、Q、N、H
672	T	R、G、A、K、Q、N、H
673	K	R、G、A、Q、N、H
674	Q	R、G、A、K、N、H
675	E	R、G、A、K、Q、N、H
676	R	G、A、K、Q、N、H
677	H	R、G、A、K、Q、N
678	I	R、G、A、K、Q、N、H
679	N	R、G、A、K、Q、N、H
680	G	R、A、K、Q、N、H
681	L	R、G、A、K、Q、N、H
682	N	R、G、A、K、Q、H
683	A	R、G、K、Q、N、H
684	D	R、G、A、K、Q、N、H
685	F	R、G、A、K、Q、N、H
686	N	R、G、A、K、Q、H
687	A	R、G、K、Q、N、H
688	A	R、G、K、Q、N、H
689	N	R、G、A、K、Q、H
690	N	R、G、A、K、Q、H
691	I	R、G、A、K、Q、N、H
692	K	R、G、A、Q、N、H
693	Y	R、G、A、K、Q、N、H
694	I	R、G、A、K、Q、N、H
695	V	R、G、A、K、Q、N、H
696	E	R、G、A、K、Q、N、H
697	N	R、G、A、K、Q、H
698	E	R、G、A、K、Q、N、H
699	V	R、G、A、K、Q、N、H
700	W	R、G、A、K、Q、N、H
701	R	G、A、K、Q、N、H
702	G	R、A、K、Q、N、H
703	I	R、G、A、K、Q、N、H
704	F	R、G、A、K、Q、N、H
705	C	R、G、A、K、Q、N、H
706	T	R、G、A、K、Q、N、H
707	R	G、A、K、Q、N、H
708	P	R、G、A、K、Q、N、H
709	K	R、G、A、Q、N、H
710	K	R、G、A、Q、N、H
711	T	R、G、A、K、Q、N、H
712	E	R、G、A、K、Q、N、H
713	Y	R、G、A、K、Q、N、H
714	N	R、G、A、K、Q、H
715	V	R、G、A、K、Q、N、H
716	P	R、G、A、K、Q、N、H
717	S	R、G、A、K、Q、N、H
718	L	R、G、A、K、Q、N、H
719	D	R、G、A、K、Q、N、H
720	T	R、G、A、K、Q、N、H
721	T	R、G、A、K、Q、N、H
722	K	R、G、A、Q、N、H
723	K	R、G、A、Q、N、H
724	G	R、A、K、Q、N、H
725	P	R、G、A、K、Q、N、H
726	S	R、G、A、K、Q、N、H
727	A	R、G、K、Q、N、H
728	I	R、G、A、K、Q、N、H
729	L	R、G、A、K、Q、N、H
730	N	R、G、A、K、Q、H
731	M	R、G、A、K、Q、N、H
732	L	R、G、A、K、Q、N、H
733	K	R、G、A、Q、N、H
734	K	R、G、A、Q、N、H
735	I	R、G、A、K、Q、N、H
736	E	R、G、A、K、Q、N、H
737	A	R、G、K、Q、N、H
738	I	R、G、A、K、Q、N、H
739	K	R、G、A、Q、N、H
740	V	R、G、A、K、Q、N、H
741	L	R、G、A、K、Q、N、H
742	E	R、G、A、K、Q、N、H
743	T	R、G、A、K、Q、N、H
744	E	R、G、A、K、Q、N、H
745	K	R、G、A、Q、N、H

在一些實施例中，變異多肽包含增加變異多肽與RNA引導之相互作用的改變。在一些實施例中，增加與RNA引導之相互作用的改變為精胺酸、離胺酸、麩醯胺酸、天冬醯胺或組胺酸取代。在一些實施例中，變異多肽包含增加變異多肽與目標核酸之相互作用的改變。在一些實施例中，增加與目標核酸之相互作用的改變為精胺酸、離胺酸、麩醯胺酸、天冬醯胺或組胺酸取代。在一些實施例中，變異多肽包含丙胺酸取代。在一些實施例中，變異多肽包含甘胺酸取代。

在一些實施例中，變異多肽相對於SEQ ID NO: 3之親本多肽包含在P14、E311、D32、I61、G223、N109及/或D719處之取代。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14處之取代(例如，P14R取代)的胺基酸序列。在一些實施例中，變異多肽包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置P14處之取代(例如，P14R取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置E311處之取代(例如，E311R取代)的胺基酸序列。在一些實施例中，變異多肽包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置E311處之取代(例如，E311R取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D32處之取代(例如，D32R取代)的胺基酸序列。在一些實施例中，變異多肽包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D32處之取代(例如，D32R取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置I61處之取代(例如，I61R取代)的胺基酸序列。在一些實施例中，變異多肽包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置I61處之取代(例如，I61R取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置G223處之取代(例如，G223R取代)的胺基酸序列。在一些實施例中，變異多肽包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置G223處之取代(例如，G223R取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置N109處之取代(例如，N109R取代)的胺基酸序列。在一些實施例中，變異多肽包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置N109處之取代(例如，N109R取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D719處之取代(例如，D719R取代)的胺基酸序列。在一些實施例中，變異多肽包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D719處之取代(例如，D719R取代)。

在一些實施例中，變異多肽相對於SEQ ID NO: 3之親本多肽包含取代P14R、E311R、D32R、I61R、G223R、N109R及/或D719R。在一些實施例中，變異多肽相對於SEQ ID NO: 3之親本多肽包含取代P14R及一個、兩個、三個或四個額外取代。在一些實施例中，變異多肽相對於SEQ ID NO: 3之親本多肽包含取代E311R及一個、兩個、三個或四個額外取代。在一些實施例中，變異多肽相對於SEQ ID NO: 3之親本多肽包含取代D32R及一個、兩個、三個或四個額外取代。在一些實施例中，變異多肽相對於SEQ ID NO: 3之親本多肽包含取代I61R及一個、兩個、三個或四個額外取代。在一些實施例中，變異多肽相對於SEQ ID NO: 3之親本多肽包含取代G223R及一個、兩個、三個或四個額外取代。在一些實施例中，變異多肽相對於SEQ ID NO: 3之親本多肽包含取代N109R及一個、兩個、三個或四個額外取代。在一些實施例中，變異多肽相對於SEQ ID NO: 3之親本多肽包含取代D719R及一個、兩個、三個或四個額外取代。在一些實施例中，變異多肽相對於SEQ ID NO: 3之親本多肽包含如表3中所示之胺基酸取代。表3. 具有多個胺基酸取代之SEQ ID NO: 3之變異體.

取代數目	胺基酸取代
2	P14R、E311R
2	P14R、D32R
2	P14R、I61R
2	P14R、G223R
2	E311R、D32R
2	E311R、I61R
2	E311R、G223R
2	D32R、I61R
2	D32R、G223R
2	I61R、G223R
3	P14R、E311R、D32R
3	P14R、E311R、I61R
3	P14R、E311R、G223R
3	P14R、D32R、I61R
3	P14R、D32R、G223R
3	P14R、I61R、G223R
3	E311R、D32R、I61R
3	E311R、D32R、G223R
3	E311R、I61R、G223R
3	D32R、I61R、G223R
4	P14R、E311R、D32R、I61R
4	P14R、E311R、D32R、G223R
4	P14R、E311R、I61R、G223R
4	P14R、D32R、I61R、G223R
4	E311R、D32R、I61R、G223R
5	P14R、E311R、D32R、I61R、G223R
2	D32R、N109R
2	N109R、G223R
2	N109R、E311R
3	D32R、N109R、G223R
3	D32R、N109R、E311R
3	N109R、G223R、E311R
2	D32R、D719R
2	N109R、D719R
2	G223R、D719R
2	E311R、D719R
3	D32R、N109R、D719R
3	D32R、G223R、D719R
3	D32R、E311R、D719R
3	N109R、G223R、D719R
3	N109R、E311R、D719R
3	G223R、E311R、D719R
4	D32R、N109R、G223R、E311R
4	D32R、N109R、G223R、D719R
4	D32R、N109R、E311R、D719R
4	D32R、G223R、E311R、D719R
4	N109R、G223R、E311R、D719R
5	D32R、N109R、G223R、E311R、D719R

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14 (例如，P14R取代)、E311 (例如，E311R)及D32 (例如，D32R取代)處之取代的胺基酸(例如，P14R、E311R、D32R變異多肽)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14 (例如，P14R取代)、E311 (例如，E311R)及G223 (例如，G223R取代)處之取代的胺基酸(例如，P14R、E311R、G223R變異多肽)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14 (例如，P14R取代)、E311 (例如，E311R)、D32 (例如，D32R取代)及I61 (例如，I61R取代)處之取代的胺基酸(例如，P14R、E311R、D32R及I61R變異多肽)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D32R (例如，D32R取代)、N109 (例如，N109R)、E311 (例如，E311R取代)及D719 (例如，D719R取代)處之取代的胺基酸(例如，D32R、N109R、E311R及D719R變異多肽)。

在一些實施例中，在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置K208處之取代(例如，K208G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置K208處之取代(例如，K208G取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D302處之取代(例如，D302G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D302處之取代(例如，D302G取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D590處之取代(例如，D590G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D590處之取代(例如，D590G取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置E154處之取代(例如，E154G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置E154處之取代(例如，E154G取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D567處之取代(例如，D567G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D567處之取代(例如，D567G取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置L38處之取代(例如，L38G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置L38處之取代(例如，L38G取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D145處之取代(例如，D145G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D145處之取代(例如，D145G取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置C13處之取代(例如，C13G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置C13處之取代(例如，C13G取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置T338處之取代(例如，T338G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置T338處之取代(例如，T338G取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14處之取代(例如，P14G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置P14處之取代(例如，P14G取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D55處之取代(例如，D55G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D55處之取代(例如，D55G取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置K221處之取代(例如，K221G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置K221處之取代(例如，K221G取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置K35處之取代(例如，K35G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置K35處之取代(例如，K35G取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置E736處之取代(例如，E736G取代)的胺基酸序列。在一些態樣中，本發明提供一種多肽，其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列，其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置E736處之取代(例如，E736G取代)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且相對於SEQ ID NO: 3包含以下位置處之取代：K208 (例如，K208G取代)、D302 (例如，D302G取代)、D590 (例如，D590G取代)、E154 (例如，E154G取代)、D567 (例如，D567G取代)、L38 (例如，L38G取代)、D145 (例如，D145G取代)、C13 (例如，C13G取代)、T338 (例如，T338G取代)、P14 (例如，P14G取代)、D55 (例如，D55G取代)、K221 (例如，K221G取代)、K35 (例如，K35G取代)、E736 (例如，E736G取代)或其任何組合(例如，包含K208G、D302G、D590G、E154G、D567G、L38G、D145G、C13G、T338G、P14G、D55G、K221G、K35G、E736G中之2個、3個、4個、5個、6個、7個、8個、9個、10個、11個或全部的變異多肽)。

在一些實施例中，變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含： i)選自位置P14 (例如，P14R取代)、E311 (例如，E311R取代)、D32 (例如，D32R取代)、I61 (例如，I61R取代)、G223 (例如，G223R取代)、N109 (例如，N109R取代)及D719 (例如，D719R取代)處之取代中之一或多者(例如，1個、2個、3個、4個、5個、6個或全部)的取代；及 ii)選自位置K208 (例如，K208G取代)、D302 (例如，D302G取代)、D590 (例如，D590G取代)、E154 (例如，E154G取代)、D567 (例如，D567G取代)、L38 (例如，L38G取代)、D145 (例如，D145G取代)、C13 (例如，C13G取代)、T338 (例如，T338G取代)、P14 (例如，P14G取代)、D55 (例如，D55G取代)、K221 (例如，K221G取代)、K35 (例如，K35G取代)及E736 (例如，E736G取代)處之取代中之一或多者(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12或全部)的取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含P14處之取代(例如，P14R取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個或全部)的取代：K208 (例如，K208G取代)、D302 (例如，D302G取代)、D590 (例如，D590G取代)、E154 (例如，E154G取代)、D567 (例如，D567G取代)、L38 (例如，L38G取代)、D145 (例如，D145G取代)、C13 (例如，C13G取代)、T338 (例如，T338G取代)、D55 (例如，D55G取代)、K221 (例如，K221G取代)、K35 (例如，K35G取代)及E736 (例如，E736G取代)。舉例而言，在一些實施例中，變異多肽包含P14R取代及以下中之一或多者：K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含E311處之取代(例如，E311R取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：K208 (例如，K208G取代)、D302 (例如，D302G取代)、D590 (例如，D590G取代)、E154 (例如，E154G取代)、D567 (例如，D567G取代)、L38 (例如，L38G取代)、D145 (例如，D145G取代)、C13 (例如，C13G取代)、T338 (例如，T338G取代)、P14 (例如，P14G取代)、D55 (例如，D55G取代)、K221 (例如，K221G取代)、K35 (例如，K35G取代)及E736 (例如，E736G取代)。舉例而言，在一些實施例中，變異多肽包含E311R取代及以下中之一或多者：K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含D32處之取代(例如，D32R取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：K208 (例如，K208G取代)、D302 (例如，D302G取代)、D590 (例如，D590G取代)、E154 (例如，E154G取代)、D567 (例如，D567G取代)、L38 (例如，L38G取代)、D145 (例如，D145G取代)、C13 (例如，C13G取代)、T338 (例如，T338G取代)、P14 (例如，P14G取代)、D55 (例如，D55G取代)、K221 (例如，K221G取代)、K35 (例如，K35G取代)及E736 (例如，E736G取代)。舉例而言，在一些實施例中，變異多肽包含D32R取代及以下中之一或多者：K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含位置I61處之取代(例如，I61R取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：K208 (例如，K208G取代)、D302 (例如，D302G取代)、D590 (例如，D590G取代)、E154 (例如，E154G取代)、D567 (例如，D567G取代)、L38 (例如，L38G取代)、D145 (例如，D145G取代)、C13 (例如，C13G取代)、T338 (例如，T338G取代)、P14 (例如，P14G取代)、D55 (例如，D55G取代)、K221 (例如，K221G取代)、K35 (例如，K35G取代)及E736 (例如，E736G取代)。舉例而言，在一些實施例中，變異多肽包含I61R取代及以下中之一或多者：K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含位置G223處之取代(例如，G223R取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：K208 (例如，K208G取代)、D302 (例如，D302G取代)、D590 (例如，D590G取代)、E154 (例如，E154G取代)、D567 (例如，D567G取代)、L38 (例如，L38G取代)、D145 (例如，D145G取代)、C13 (例如，C13G取代)、T338 (例如，T338G取代)、P14 (例如，P14G取代)、D55 (例如，D55G取代)、K221 (例如，K221G取代)、K35 (例如，K35G取代)及E736 (例如，E736G取代)。舉例而言，在一些實施例中，變異多肽包含G223R取代及以下中之一或多者：K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含位置N109處之取代(例如，N109R取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：K208 (例如，K208G取代)、D302 (例如，D302G取代)、D590 (例如，D590G取代)、E154 (例如，E154G取代)、D567 (例如，D567G取代)、L38 (例如，L38G取代)、D145 (例如，D145G取代)、C13 (例如，C13G取代)、T338 (例如，T338G取代)、P14 (例如，P14G取代)、D55 (例如，D55G取代)、K221 (例如，K221G取代)、K35 (例如，K35G取代)及E736 (例如，E736G取代)。舉例而言，在一些實施例中，變異多肽包含N109R取代及以下中之一或多者：K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含位置D719處之取代(例如，D719R取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：K208 (例如，K208G取代)、D302 (例如，D302G取代)、D590 (例如，D590G取代)、E154 (例如，E154G取代)、D567 (例如，D567G取代)、L38 (例如，L38G取代)、D145 (例如，D145G取代)、C13 (例如，C13G取代)、T338 (例如，T338G取代)、P14 (例如，P14G取代)、D55 (例如，D55G取代)、K221 (例如，K221G取代)、K35 (例如，K35G取代)及E736 (例如，E736G取代)。舉例而言，在一些實施例中，變異多肽包含D719R取代及以下中之一或多者：K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含位置P14處之取代(例如，P14R取代)、位置E311處之取代(例如，E311R取代)、位置D32處之取代(例如，D32R取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個或全部)的取代：位置K208 (例如，K208G取代)、D302 (例如，D302G取代)、D590 (例如，D590G取代)、E154 (例如，E154G取代)、D567 (例如，D567G取代)、L38 (例如，L38G取代)、D145 (例如，D145G取代)、C13 (例如，C13G取代)、T338 (例如，T338G取代)、P14 (例如，P14G取代)、D55 (例如，D55G取代)、K221 (例如，K221G取代)、K35 (例如，K35G取代)及E736 (例如，E736G取代)。舉例而言，在一些實施例中，變異多肽包含P14R取代、E311R取代、D32R取代及選自以下中之一或多者(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個或全部)的取代：K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、D55G取代、K221G取代、K35G取代及E736G取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含位置P14處之取代(例如，P14R取代)、位置E311處之取代(例如，E311R取代)、位置G223處之取代(例如，G223R取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：K208 (例如，K208G取代)、D302 (例如，D302G取代)、D590 (例如，D590G取代)、E154 (例如，E154G取代)、D567 (例如，D567G取代)、L38 (例如，L38G取代)、D145 (例如，D145G取代)、C13 (例如，C13G取代)、T338 (例如，T338G取代)、P14 (例如，P14G取代)、D55 (例如，D55G取代)、K221 (例如，K221G取代)、K35 (例如，K35G取代)及E736 (例如，E736G取代)。舉例而言，在一些實施例中，變異多肽包含P14R取代、E311R取代、G223R取代及選自以下中之一或多者(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、D55G取代、K221G取代、K35G取代及E736G取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含位置P14處之取代(例如，P14R取代)、位置E311處之取代(例如，E311R取代)、位置D32處之取代(例如，D32R取代)、I61處之取代(例如，I61R取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：K208 (例如，K208G取代)、D302 (例如，D302G取代)、D590 (例如，D590G取代)、E154 (例如，E154G取代)、D567 (例如，D567G取代)、L38 (例如，L38G取代)、D145 (例如，D145G取代)、C13 (例如，C13G取代)、T338 (例如，T338G取代)、P14 (例如，P14G取代)、D55 (例如，D55G取代)、K221 (例如，K221G取代)、K35 (例如，K35G取代)及E736 (例如，E736G取代)。舉例而言，在一些實施例中，變異多肽包含P14R取代、E311R取代、D32R取代、I61R取代及選自以下中之一或多者(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、D55G取代、K221G取代、K35G取代及E736G取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含位置D32處之取代(例如，D32R取代)、位置N109處之取代(例如，N109R取代)、位置E311處之取代(例如，E311R取代)、D719處之取代(例如，D719R取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：K208 (例如，K208G取代)、D302 (例如，D302G取代)、D590 (例如，D590G取代)、E154 (例如，E154G取代)、D567 (例如，D567G取代)、L38 (例如，L38G取代)、D145 (例如，D145G取代)、C13 (例如，C13G取代)、T338 (例如，T338G取代)、P14 (例如，P14G取代)、D55 (例如，D55G取代)、K221 (例如，K221G取代)、K35 (例如，K35G取代)及E736 (例如，E736G取代)。舉例而言，在一些實施例中，變異多肽包含D32R取代、N109R取代、E311R取代、D719R取代及選自以下中之一或多者(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、D55G取代、K221G取代、K35G取代及E736G取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含K208處之取代(例如，K208G取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：P14 (例如，P14R取代)、E311 (例如，E311R取代)、D32 (例如，D32R取代)、I61 (例如，I61R取代)、G223 (例如，G223R取代)、N109 (例如，N109R取代)及D719 (例如，D719R取代)。舉例而言，在一些實施例中，變異多肽包含K208G取代及以下中之一或多者：P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含D302處之取代(例如，D302G取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：P14 (例如，P14R取代)、E311 (例如，E311R取代)、D32 (例如，D32R取代)、I61 (例如，I61R取代)、G223 (例如，G223R取代)、N109 (例如，N109R取代)及D719 (例如，D719R取代)。舉例而言，在一些實施例中，變異多肽包含K208G取代及以下中之一或多者：P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含D590處之取代(例如，D590G取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：P14 (例如，P14R取代)、E311 (例如，E311R取代)、D32 (例如，D32R取代)、I61 (例如，I61R取代)、G223 (例如，G223R取代)、N109 (例如，N109R取代)及D719 (例如，D719R取代)。舉例而言，在一些實施例中，變異多肽包含K208G取代及以下中之一或多者：P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含E154處之取代(例如，E154G取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：P14 (例如，P14R取代)、E311 (例如，E311R取代)、D32 (例如，D32R取代)、I61 (例如，I61R取代)、G223 (例如，G223R取代)、N109 (例如，N109R取代)及D719 (例如，D719R取代)。舉例而言，在一些實施例中，變異多肽包含K208G取代及以下中之一或多者：P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含D567處之取代(例如，D567G取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：P14 (例如，P14R取代)、E311 (例如，E311R取代)、D32 (例如，D32R取代)、I61 (例如，I61R取代)、G223 (例如，G223R取代)、N109 (例如，N109R取代)及D719 (例如，D719R取代)。舉例而言，在一些實施例中，變異多肽包含K208G取代及以下中之一或多者：P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含L38處之取代(例如，L38G取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：P14 (例如，P14R取代)、E311 (例如，E311R取代)、D32 (例如，D32R取代)、I61 (例如，I61R取代)、G223 (例如，G223R取代)、N109 (例如，N109R取代)及D719 (例如，D719R取代)。舉例而言，在一些實施例中，變異多肽包含K208G取代及以下中之一或多者：P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含D145處之取代(例如，D145G取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：P14 (例如，P14R取代)、E311 (例如，E311R取代)、D32 (例如，D32R取代)、I61 (例如，I61R取代)、G223 (例如，G223R取代)、N109 (例如，N109R取代)及D719 (例如，D719R取代)。舉例而言，在一些實施例中，變異多肽包含K208G取代及以下中之一或多者：P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含C13處之取代(例如，C13G取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：P14 (例如，P14R取代)、E311 (例如，E311R取代)、D32 (例如，D32R取代)、I61 (例如，I61R取代)、G223 (例如，G223R取代)、N109 (例如，N109R取代)及D719 (例如，D719R取代)。舉例而言，在一些實施例中，變異多肽包含K208G取代及以下中之一或多者：P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含T338處之取代(例如，T338G取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：P14 (例如，P14R取代)、E311 (例如，E311R取代)、D32 (例如，D32R取代)、I61 (例如，I61R取代)、G223 (例如，G223R取代)、N109 (例如，N109R取代)及D719 (例如，D719R取代)。舉例而言，在一些實施例中，變異多肽包含K208G取代及以下中之一或多者：P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含P14處之取代(例如，P14G取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個或全部)的取代：P14 (例如，P14R取代)、E311 (例如，E311R取代)、D32 (例如，D32R取代)、I61 (例如，I61R取代)、G223 (例如，G223R取代)、N109 (例如，N109R取代)及D719 (例如，D719R取代)。舉例而言，在一些實施例中，變異多肽包含K208G取代及以下中之一或多者：P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含D55處之取代(例如，D55G取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：P14 (例如，P14R取代)、E311 (例如，E311R取代)、D32 (例如，D32R取代)、I61 (例如，I61R取代)、G223 (例如，G223R取代)、N109 (例如，N109R取代)及D719 (例如，D719R取代)。舉例而言，在一些實施例中，變異多肽包含K208G取代及以下中之一或多者：P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含K221處之取代(例如，K221G取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：P14 (例如，P14R取代)、E311 (例如，E311R取代)、D32 (例如，D32R取代)、I61 (例如，I61R取代)、G223 (例如，G223R取代)、N109 (例如，N109R取代)及D719 (例如，D719R取代)。舉例而言，在一些實施例中，變異多肽包含K208G取代及以下中之一或多者：P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含K35處之取代(例如，K35G取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：P14 (例如，P14R取代)、E311 (例如，E311R取代)、D32 (例如，D32R取代)、I61 (例如，I61R取代)、G223 (例如，G223R取代)、N109 (例如，N109R取代)及D719 (例如，D719R取代)。舉例而言，在一些實施例中，變異多肽包含K208G取代及以下中之一或多者：P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。

在一些實施例中，變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含E736處之取代(例如，E736G取代)及選自以下位置處之取代中之一或多個(例如，1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代：P14 (例如，P14R取代)、E311 (例如，E311R取代)、D32 (例如，D32R取代)、I61 (例如，I61R取代)、G223 (例如，G223R取代)、N109 (例如，N109R取代)及D719 (例如，D719R取代)。舉例而言，在一些實施例中，變異多肽包含K208G取代及以下中之一或多者：P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。

在一些實施例中，變異多肽包含至少一個RuvC模體或RuvC域。

雖然本文所述之變化可為一或多個胺基酸變化，但變異多肽之變化亦可為實質性的，諸如作為胺基及/或羧基端延伸之多肽融合。舉例而言，變異多肽可含有額外肽，例如一或多種肽。額外肽之實例可包括用於進行標記之抗原決定基肽，諸如聚組胺酸標籤(His標籤)、Myc及FLAG。在一些實施例中，本文所述之變異多肽可與諸如螢光蛋白(例如綠色螢光蛋白(GFP)或黃色螢光蛋白(YFP))之可偵測部分融合。

在一些實施例中，變異多肽包含至少一種(例如兩種、三種、四種、五種、六種或更多種)核定位信號(NLS)。在一些實施例中，變異多肽包含至少一種(例如兩種、三種、四種、五種、六種或更多種)核輸出信號(NES)。在一些實施例中，變異多肽包含至少一種(例如兩種、三種、四種、五種、六種或更多種) NLS及至少一種(例如兩種、三種、四種、五種、六種或更多種) NES。

在一些實施例中，本文所述之變異多肽可自失活。參見Epstein等人, 「Engineering a Self-Inactivating CRISPR System for AAV Vectors」, Mol. Ther., 24 (2016): S50，其以全文引用的方式併入本文中。

在一些實施例中，編碼本文所述之變異多肽之核苷酸序列可經密碼子優化以用於特定宿主細胞或生物體。例如，核酸可經密碼子優化以用於任何非人類真核生物，包括小鼠、大鼠、兔、狗、家畜或非人類靈長類動物。密碼子使用表可容易獲得，例如可在www.kazusa.orjp/codon/獲得的「密碼子使用資料庫」，且此等表可以多種方式改寫。參見Nakamura等人 Nucl. Acids Res.28:292 (2000)，其以全文引用的方式併入本文中。亦可利用電腦演算法(諸如Gene Forge (Aptagen; Jacobus, PA))，對特定序列進行密碼子優化，以在特定宿主細胞中表現。

變異多肽之功能性如本文所用，「生物活性部分」為保留親本多肽之至少一種功能(例如完全、部分、最小)之部分(例如「最小」或「核心」域)。在一些實施例中，變異多肽保留至少與親本多肽一樣之活性的酶活性。因此，在一些實施例中，變異多肽具有大於親本多肽之酶活性。

在一些實施例中，變異多肽具有減少之核酸酶活性或為核酸酶死亡多肽。如本文所用，本文揭示之多肽之催化殘基包含D328及E530。在一些實施例中，包含D328及E530處之取代(例如D328A及E530A)之變異多肽相對於親本多肽展現減少之核酸酶活性或無核酸酶活性。在一些實施例中，包含D684、D646或D621處之取代(例如D684A、D646A或D621A)之變異多肽相對於親本多肽展現減少之核酸酶活性或無核酸酶活性。

在一態樣中，本發明提供用於將改變或突變引入至親本多肽序列中以增強二元複合物形成、RNA引導結合活性及/或RNA引導結合特異性之方法。

在一態樣中，本發明亦提供用於將改變或突變引入至親本多肽序列中以增強三元複合物形成、正中目標結合親和力、正中目標結合活性、正中目標結合及/或正中目標結合特異性之方法。在一態樣中，本發明亦提供用於將改變或突變引入至親本多肽序列中以增強二元複合物(例如核糖核蛋白)之正中目標結合親和力(例如與目標相互作用之親和力或所花費之時間)、正中目標結合活性、正中目標結合(例如與目標之相互作用之強度)及/或正中目標結合特異性(例如對特定目標之偏好)之方法。在一些實施例中，將改變或突變引入至親本多肽序列中以產生具有增加之正中目標結合及/或活性之變異多肽。此外，在此類實施例中，與親本多肽相比，變異多肽中之偏離目標結合及/或活性可減少。此外，對比偏離目標結合關於正中目標結合之特異性可增加或減少。在一些實施例中，將改變或突變引入至親本多肽序列中以產生當與RNA引導複合時具有增加之正中目標結合之變異多肽。此外，在此類實施例中，在包含變異多肽及RNA引導之複合物中偏離目標結合可減少。此外，對比偏離目標結合/活性關於正中目標結合/活性之特異性可增加或減少。在某些實施例中，將改變或突變引入至親本多肽序列中以產生增強穩定性及/或蛋白質-RNA相互作用之變異多肽。在某些實施例中，與親本多肽相比，變異多肽包括至少一個促進變異多肽之穩定性及/或RNA相互作用以及酶活性的改變。

在一些實施例中，本發明之變異多肽具有相當於或超過親本多肽之酶活性。在一些實施例中，本發明之變異多肽在約20℃至約90℃之溫度範圍內具有酶活性。在一些實施例中，本發明之變異多肽在約20℃至約25℃之溫度下或在約37℃之溫度下具有酶活性。

在一些實施例中，與親本多肽相比，變異多肽包含至少一個增強對RNA之親和力(例如RNA親和力)之改變。在一些實施例中，在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下，與親本多肽相比，變異多肽展現增強之RNA親和力。在一些實施例中，在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中，與親本多肽相比，變異多肽展現增強之RNA親和力。在一些實施例中，當變異多肽之T _m值比親本多肽之T _m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時，與親本多肽相比，變異多肽展現增強之RNA親和力。在一個實施例中，當變異多肽之T _m值比親本多肽之T _m值大至少8℃時，變異多肽展現增強之RNA親和力。

在一些實施例中，與親本多肽相比，變異多肽包含至少一個增強與RNA引導之複合物形成(例如二元複合物形成)之改變。在一些實施例中，在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下，與親本多肽相比，變異多肽展現增強之二元複合物形成。在一些實施例中，在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中，與親本多肽相比，變異多肽展現增強之二元複合物形成。在一些實施例中，當變異多肽之T _m值比親本多肽之T _m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時，與親本多肽相比，變異多肽展現增強之二元複合物形成。在一個實施例中，當變異多肽之T _m值比親本多肽之T _m值大至少8℃時，變異多肽展現增強之二元複合物形成。

在一些實施例中，與親本多肽相比，變異多肽包含至少一個增強對RNA引導之結合活性之改變。在一些實施例中，在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下，與親本多肽相比，變異多肽展現增強之RNA引導結合活性。在一些實施例中，在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中，與親本多肽相比，變異多肽展現增強之RNA引導結合活性。在一些實施例中，當變異多肽之T _m值比親本多肽之T _m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時，與親本多肽相比，變異多肽展現增強之RNA引導結合活性。在一個實施例中，當變異多肽之T _m值比親本多肽之T _m值大至少8℃時，變異多肽展現增強之RNA引導結合活性。

在一些實施例中，與親本多肽相比，變異多肽包含至少一個增強對RNA引導之結合特異性之改變。在一些實施例中，在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下，與親本多肽相比，變異多肽展現增強之RNA引導結合特異性。在一些實施例中，在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中，與親本多肽相比，變異多肽展現增強之RNA引導結合特異性。在一些實施例中，當變異多肽之T _m值比親本多肽之T _m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時，與親本多肽相比，變異多肽展現增強之RNA引導結合特異性。在一個實施例中，當變異多肽之T _m值比親本多肽之T _m值大至少8℃時，變異多肽展現增強之RNA引導結合特異性。

在一些實施例中，與親本多肽相比，變異多肽包含至少一個增強蛋白質-RNA相互作用之改變。在一些實施例中，在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下，與親本多肽相比，變異多肽展現增強之蛋白質-RNA相互作用。在一些實施例中，在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中，與親本多肽相比，變異多肽展現增強之蛋白質-RNA相互作用。在一些實施例中，當變異多肽之T _m值比親本多肽之T _m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時，與親本多肽相比，變異多肽展現增強之蛋白質-RNA相互作用。在一個實施例中，當變異多肽之T _m值比親本多肽之T _m值大至少8℃時，變異多肽展現增強之蛋白質-RNA相互作用。

在一些實施例中，與親本多肽相比，變異多肽包含至少一個增強蛋白質穩定性之改變。在一些實施例中，在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下，與親本多肽相比，變異多肽展現增強之蛋白質穩定性。在一些實施例中，在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中，與親本多肽相比，變異多肽展現增強之蛋白質穩定性。在一些實施例中，當變異多肽之T _m值比親本多肽之T _m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時，與親本多肽相比，變異多肽展現增強之蛋白質穩定性。在一個實施例中，當變異多肽之T _m值比親本多肽之T _m值大至少8℃時，變異多肽展現增強之蛋白質穩定性。

在一些實施例中，與親本多肽相比，變異多肽包含至少一個減少自RNA引導之解離(例如，二元複合物解離)之改變。在一些實施例中，在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下，與親本多肽相比，變異多肽展現減少之自RNA引導之解離。在一些實施例中，在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中，與親本多肽相比，變異多肽展現減少之自RNA引導之解離。在一些實施例中，當變異多肽之T _m值比親本多肽之T _m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時，與親本多肽相比，變異多肽展現減少之自RNA引導之解離。在一個實施例中，當變異多肽之T _m值比親本多肽之T _m值大至少8℃時，變異多肽展現減少之自RNA引導之解離。在一些實施例中，在至少約10分鐘、15分鐘、20分鐘、25分鐘、30分鐘、35分鐘、40分鐘、45分鐘、50分鐘、55分鐘、1小時、2小時、3小時、4小時或更多小時中之任一者之培育時期內，與親本多肽相比，變異多肽展現減少之自RNA引導之解離。在一些實施例中，變異核糖核蛋白(RNP)複合物不將RNA引導交換成不同RNA。

在一些實施例中，與親本多肽相比，變異多肽包含至少一個增強與RNA引導及目標核酸之三元複合物形成之改變。在一些實施例中，在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下，與親本多肽相比，變異多肽展現增強之三元複合物形成。在一些實施例中，在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中，與親本多肽相比，變異多肽展現增強之三元複合物形成。在一些實施例中，當變異多肽之T _m值比親本多肽之T _m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時，與親本多肽相比，變異多肽展現增強之三元複合物形成。在一個實施例中，當變異多肽之T _m值比親本多肽之T _m值大至少8℃時，變異多肽展現增強之三元複合物形成。

在一些實施例中，變異多肽包含至少一個改變，使得與親本二元複合物相比，包含變異多肽之二元複合物(例如，變異二元複合物)展現增強之對目標核酸之結合親和力。在一些實施例中，在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下，與親本二元複合物相比，變異二元複合物展現增強之對目標核酸之結合親和力。在一些實施例中，在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中，與親本二元複合物相比，變異二元複合物展現增強之對目標核酸之結合親和力。在一些實施例中，當變異二元複合物之T _m值比親本二元複合物之T _m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃，與親本二元複合物相比，變異二元複合物展現增強之對目標核酸之結合親和力。在一個實施例中，當變異二元複合物之T _m值比親本二元複合物之T _m值大至少8℃時，變異二元複合物展現增強之對目標核酸之結合親和力。

在一些實施例中，變異多肽包含至少一個改變，使得與親本二元複合物相比，包含變異多肽之二元複合物(例如，變異二元複合物)展現增強之正中目標結合活性。在一些實施例中，在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下，與親本二元複合物相比，變異二元複合物展現增強之正中目標結合活性。在一些實施例中，在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中，與親本二元複合物相比，變異二元複合物展現增強之正中目標結合活性。在一些實施例中，當變異二元複合物之T _m值比親本二元複合物之T _m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃，與親本二元複合物相比，變異二元複合物展現增強之正中目標結合活性。在一個實施例中，當變異二元複合物之T _m值比親本二元複合物之T _m值大至少8℃時，變異二元複合物展現增強之正中目標結合活性。

在一些實施例中，變異多肽包含至少一個改變，使得與親本二元複合物相比，包含變異多肽之二元複合物(例如，變異二元複合物)展現增強之正中目標結合特異性。在一些實施例中，在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下，與親本二元複合物相比，變異二元複合物展現增強之正中目標結合特異性。在一些實施例中，在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中，與親本二元複合物相比，變異二元複合物展現增強之正中目標結合特異性。在一些實施例中，當變異二元複合物之T _m值比親本二元複合物之T _m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃，與親本二元複合物相比，變異二元複合物展現增強之正中目標結合特異性。在一個實施例中，當變異二元複合物之T _m值比親本二元複合物之T _m值大至少8℃時，變異二元複合物展現增強之正中目標結合特異性。

在一些實施例中，變異多肽包含至少一個改變，使得與親本二元複合物相比，包含變異多肽之二元複合物(例如，變異二元複合物)展現減少之與非目標核酸之偏離目標結合。在一些實施例中，在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下，與親本二元複合物相比，變異二元複合物展現減少之與非目標核酸之偏離目標結合。在一些實施例中，在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中，與親本二元複合物相比，變異二元複合物展現減少之與非目標核酸之偏離目標結合。在一些實施例中，當變異多肽之T _m值比親本多肽之T _m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時，與親本二元複合物相比，變異二元複合物展現減少之與非目標核酸之偏離目標結合。在一個實施例中，當變異二元複合物之T _m值比親本多肽之T _m值大至少8℃時，變異二元複合物展現減少之與非目標核酸之偏離目標結合。

在一些實施例中，變異多肽包含至少一個改變，使得與親本二元複合物相比，包含變異多肽之二元複合物(例如，變異二元複合物)展現減少之自目標核酸之解離。在一些實施例中，在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下，與親本二元複合物相比，變異二元複合物展現減少之自目標核酸之解離。在一些實施例中，在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中，與親本二元複合物相比，變異二元複合物展現減少之自目標核酸之解離。在一些實施例中，當變異多肽之T _m值比親本多肽之T _m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時，與親本二元複合物相比，變異二元複合物展現減少之自目標核酸之解離。在一個實施例中，當變異二元複合物之T _m值比親本多肽之T _m值大至少8℃時，變異二元複合物展現減少之自目標核酸之解離。

在一些實施例中，變異多肽包含至少一個改變，使得與親本三元複合物相比，包含變異多肽之三元複合物(例如，變異三元複合物)展現增強之穩定性。在一些實施例中，在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下，與親本三元複合物相比，變異三元複合物展現增強之穩定性。在一些實施例中，在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中，與親本三元複合物相比，變異三元複合物展現增強之穩定性。在一些實施例中，當變異三元複合物之T _m值比親本三元複合物之T _m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時，與親本三元複合物相比，變異三元複合物展現增強之穩定性。在一個實施例中，當變異三元複合物之T _m值比親本三元複合物之T _m值大至少8℃時，變異三元複合物展現增強之穩定性。

在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)減少之酶活性及(b)增強之RNA親和力的變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)增加之酶活性及(b)增強之RNA親和力的變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)保留之酶活性及(b)增強之RNA親和力的變異多肽。在一些實施例中，具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。

在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)減少之酶活性及(b)增強之二元複合物形成的變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)增加之酶活性及(b)增強之二元複合物形成的變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)保留之酶活性及(b)增強之二元複合物形成的變異多肽。在一些實施例中，具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。

在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)減少之酶活性及(b)增強之RNA引導結合活性的變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)增加之酶活性及(b)增強之RNA引導結合活性的變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)保留之酶活性及(b)增強之RNA引導結合活性的變異多肽。在一些實施例中，具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。

在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)減少之酶活性及(b)增強之RNA引導結合特異性的變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)增加之酶活性及(b)增強之RNA引導結合特異性的變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)保留之酶活性及(b)增強之RNA引導結合特異性的變異多肽。在一些實施例中，具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。

在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)減少之酶活性及(b)增強之蛋白質-RNA相互作用的變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)增加之酶活性及(b)增強之蛋白質-RNA相互作用的變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)保留之酶活性及(b)增強之蛋白質-RNA相互作用的變異多肽。在一些實施例中，具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。

在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)減少之酶活性及(b)增強之蛋白質穩定性的變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)增加之酶活性及(b)增強之蛋白質穩定性的變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)保留之酶活性及(b)增強之蛋白質穩定性的變異多肽。在一些實施例中，具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。

在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)減少之酶活性及(b)減少之自RNA引導之解離的變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)增加之酶活性及(b)減少之自RNA引導之解離的變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)保留之酶活性及(b)減少之自RNA引導之解離的變異多肽。在一些實施例中，具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。

在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)減少之酶活性及(b)增強之三元複合物形成的變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)增加之酶活性及(b)增強之三元複合物形成的變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)保留之酶活性及(b)增強之三元複合物形成的變異多肽。在一些實施例中，具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。

在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物，形成展現(a)減少之酶活性及(b)增強之對目標核酸之結合親和力的變異二元複合物之變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物，形成展現(a)增加之酶活性及(b)增強之對目標核酸之結合親和力的變異二元複合物之變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物，形成展現(a)保留之酶活性及(b)增強之對目標核酸之結合親和力的變異二元複合物之變異多肽。在一些實施例中，具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。

在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物，形成展現(a)減少之酶活性及(b)增強之正中目標結合活性的變異二元複合物之變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物，形成展現(a)增加之酶活性及(b)增強之正中目標結合活性的變異二元複合物之變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物，形成展現(a)保留之酶活性及(b)增強之正中目標結合活性的變異二元複合物之變異多肽。在一些實施例中，具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。

在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物，形成展現(a)減少之酶活性及(b)增強之正中目標結合特異性的變異二元複合物之變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物，形成展現(a)增加之酶活性及(b)增強之正中目標結合特異性的變異二元複合物之變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物，形成展現(a)保留之酶活性及(b)增強之正中目標結合特異性的變異二元複合物之變異多肽。在一些實施例中，具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。

在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物，形成展現(a)減少之酶活性及(b)減少之與非目標核酸之偏離目標結合的變異二元複合物之變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物，形成展現(a)增加之酶活性及(b)減少之與非目標核酸之偏離目標結合的變異二元複合物之變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物，形成展現(a)保留之酶活性及(b)減少之與非目標核酸之偏離目標結合的變異二元複合物之變異多肽。在一些實施例中，具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。

在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物，形成展現(a)減少之酶活性及(b)減少之自目標核酸之解離的變異二元複合物之變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物，形成展現(a)增加之酶活性及(b)減少之自目標核酸之解離的變異二元複合物之變異多肽。在一些實施例中，將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物，形成展現(a)保留之酶活性及(b)減少之自目標核酸之解離的變異二元複合物之變異多肽。在一些實施例中，具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。

RNA 引導在一些實施例中，如本文所述之組合物或複合物包含結合目標核酸且與變異多肽相互作用之靶向部分(例如RNA引導、反義、寡核苷酸、肽寡核苷酸結合物)。靶向部分可結合目標核酸(例如以特異性結合親和力結合目標核酸)。

在一些實施例中，靶向部分包含或為RNA引導。在一些實施例中，RNA引導將本文所述之變異多肽導引至特定核酸序列。熟習此項技術者閱讀RNA引導之特定種類之以下實例，將瞭解在一些實施例中，RNA引導為位點特異性的。亦即，在一些實施例中，RNA引導與一或多種目標核酸序列(例如特定DNA或基因體DNA序列)特異性締合，且不與非目標核酸序列(例如非特定DNA或隨機序列)締合。

在一些實施例中，如本文所述之組合物包含與本文所述之變異多肽締合且將變異多肽導引至目標核酸序列(例如DNA)的RNA引導。

RNA引導可靶向(例如締合、針對、接觸或結合)目標序列之一或多個核苷酸，例如位點特異性序列或位點特異性目標。在一些實施例中，在結合於與RNA引導中之DNA靶向序列互補之目標核酸(例如序列特異性受質或目標核酸)之後，活化變異核糖核蛋白(例如變異CRISPR核酸酶多肽加RNA引導)。

在一些實施例中，RNA引導包含具有約11個核苷酸至約100個核苷酸之長度的間隔子。例如，DNA靶向區段之長度可為約11個核苷酸至約80個核苷酸、約11個核苷酸至約50個核苷酸、約11個核苷酸至約40個核苷酸、約11個核苷酸至約30個核苷酸、約11個核苷酸至約25個核苷酸、約11個核苷酸至約20個核苷酸或約11個核苷酸至約19個核苷酸。例如，間隔子之長度可為約19個核苷酸至約20個核苷酸、約19個核苷酸至約25個核苷酸、約19個核苷酸至約30個核苷酸、約19個核苷酸至約35個核苷酸、約19個核苷酸至約40個核苷酸、約19個核苷酸至約45個核苷酸、約19個核苷酸至約50個核苷酸、約19個核苷酸至約60個核苷酸、約19個核苷酸至約70個核苷酸、約19個核苷酸至約80個核苷酸、約19個核苷酸至約90個核苷酸、約19個核苷酸至約100個核苷酸、約20個核苷酸至約25個核苷酸、約20個核苷酸至約30個核苷酸、約20個核苷酸至約35個核苷酸、約20個核苷酸至約40個核苷酸、約20個核苷酸至約45個核苷酸、約20個核苷酸至約50個核苷酸、約20個核苷酸至約60個核苷酸、約20個核苷酸至約70個核苷酸、約20個核苷酸至約80個核苷酸、約20個核苷酸至約90個核苷酸或約20個核苷酸至約100個核苷酸。

在一些實施例中，RNA引導之間隔子通常可經設計以具有11個至50個核苷酸(例如，11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35個核苷酸)之長度且與特定目標核酸序列互補。在一些特定實施例中，RNA引導可經設計以與例如基因體之基因座的特定DNA股互補。在一些實施例中，DNA靶向序列經設計以與例如基因體之基因座的特定DNA股互補。

RNA引導可與參考核酸序列之互補股實質上一致。在一些實施例中，RNA引導包含與參考核酸序列，例如目標核酸之互補股具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或至少約99.5%序列一致性的序列。兩個此類核酸之間的一致性百分比可藉由檢查兩個最佳比對之核酸序列或藉由使用軟體程式或演算法(例如BLAST、ALIGN、CLUSTAL)使用標準參數手動確定。

在一些實施例中，RNA引導與目標核酸之互補股具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或至少約99.5%序列一致性。

在一些實施例中，RNA引導包含長度為11至50個核苷酸(例如，11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35個核苷酸)且與目標核酸至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補的間隔子。在一些實施例中，RNA引導包含與目標DNA序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補之序列。在一些實施例中，RNA引導包含與目標基因體序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補之序列。在一些實施例中，RNA引導包含長度為至多50且與目標核酸至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補的序列，例如RNA序列。在一些實施例中，RNA引導包含與目標DNA序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補之序列。在一些實施例中，RNA引導包含與目標基因體序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補之序列。

在某些實施例中，RNA引導包括連接於DNA靶向序列之正向重複序列、基本上由其組成或包含其。在一些實施例中，RNA引導包括正向重複序列及DNA靶向序列或正向重複-DNA靶向序列-正向重複序列。在一些實施例中，RNA引導包括截短之正向重複序列及DNA靶向序列，此為經加工或成熟crRNA典型的。在一些實施例中，本文所述之變異多肽與RNA引導形成複合物，且RNA引導導引複合物與位點特異性目標核酸締合，該位點特異性目標核酸與RNA引導之至少一部分互補。

在一些實施例中，正向重複序列與表4中所示之序列或表4中所示之序列之一部分至少90%一致。在一些實施例中，正向重複序列與表4中所示之序列或表4中所示之序列之一部分至少95%一致。在一些實施例中，正向重複序列與表4中所示之序列或表4中所示之序列之一部分一致。表4.正向重複序列

序列識別符	正向重複序列
SEQ ID NO: 4	CUUGUUGUAUAUGUCCUUUUAUAGGUAUUAAACAAC
SEQ ID NO: 5	CUUGUUGUAUAUACGCUUUUAUAGGUAUUAAACAAC
SEQ ID NO: 6	CUUGUUGUAUAUACGCUUUUAUAGGUAUUGAACAAC
SEQ ID NO: 7	CUUGUUGUAUAUAUCCUUUUAUAGAUAUUAAACAGC
SEQ ID NO: 8	CUUGUUGUAUAUAUCCUUUUAUAGAUGUUGAACAAC
SEQ ID NO: 9	CUUGUUGUAUAUAUCCUUUUAUAGGUGUUGAACAAC
SEQ ID NO: 10	CUUGUUGUAUAUAUCCUUUUAUGGGUGUAUAACAAC
SEQ ID NO: 11	CUUGUUGUAUAUGUCCUUUUAUAGGUAUUUGAACAAC
SEQ ID NO: 12	CUUGUUGUAUAUGUCUUUUUAUAGGUAUUGAACAAC
SEQ ID NO: 13	CUUGUUGUGUAUAUCCUUUUAUAGGUAUUGAACAAC

在一些實施例中，正向重複序列包含闡述為CUUGUUGUN ₁UAU之序列(SEQ ID NO: 14)，其中N ₁為A或G。在一些實施例中，正向重複序列包含闡述為UUUUAUN ₁GN ₂UN ₃U之序列(SEQ ID NO: 15)，其中N ₁為A或G，N ₂為A或G，且N ₃為A或G。

在一些實施例中，本文所述之組合物或複合物包括一或多種(例如兩種、三種、四種、五種、六種、七種、八種或更多種) RNA引導，例如複數種RNA引導。

在一些實施例中，RNA引導具有類似於例如國際公開案第WO 2014/093622號及第WO 2015/070083號(各者之全部內容以引用的方式併入本文中)之結構。

除非另外指出，否則本文提供之所有組合物及複合物及多肽均參考組合物或複合物或多肽之活性劑含量製得，且不包括可存在於市售來源中之雜質，例如殘餘溶劑或副產物。酶組分重量係基於總活性蛋白質。除非另有指示，否則所有百分比及比率係以重量計。除非另有指示，否則所有百分比及比率係基於總組合物計算。在例示組合物中，按總組合物之重量計，酶含量由純酶表示，且除非另外說明，否則成分按總組合物之重量計來表示。

修飾 RNA引導或編碼變異多肽之任一核酸序列可包括對參考序列，尤其親本聚核糖核苷酸之一或多種共價修飾，包括於本發明之範疇內。

示例性修飾可包括對糖、核鹼基、核苷間鍵聯(例如連接磷酸酯/磷酸二酯鍵聯/磷酸二酯主鏈)及其任何組合之任何修飾。以下詳細描述本文提供之一些示例性修飾。

RNA引導或編碼變異多肽之組分的任一核酸序列可包括諸如對糖、核鹼基或核苷間鍵聯(例如連接磷酸酯/磷酸二酯鍵聯/磷酸二酯主鏈)之任何適用修飾。嘧啶核鹼基之一或多個原子可經視情況經取代之胺基、視情況經取代之硫醇、視情況經取代之烷基(例如甲基或乙基)或鹵基(例如氯或氟)置換或取代。在某些實施例中，修飾(例如一或多個修飾)存在於糖及核苷間鍵聯中之每一者中。修飾可為核糖核酸(RNA)修飾成去氧核糖核酸(DNA)、蘇糖核酸(TNA)、二醇核酸(GNA)、肽核酸(PNA)、鎖核酸(LNA)或其混雜物。本文描述額外修飾。

在一些實施例中，修飾可包括化學或細胞誘導之修飾。舉例而言，細胞內RNA修飾之一些非限制性實例由Lewis及Pan在「RNA modifications and structures cooperate to guide RNA-protein interactions」, Nat Reviews Mol Cell Biol, 2017, 18:202-210中描述。

不同糖修飾、核苷酸修飾及/或核苷間鍵聯(例如主鏈結構)可存在於序列中之多個位置。一般技術者將瞭解，核苷酸類似物或其他修飾可位於序列之任何位置，使得實質上不減少序列之功能。序列可包括約1%至約100%經修飾之核苷酸(相對於總核苷酸含量，或相對於一或多種類型之核苷酸，亦即A、G、U或C中之任一者或多者)或任何中間百分比(例如，1%至20%＞、1%至25%、1%至50%、1%至60%、1%至70%、1%至80%、1%至90%、1%至95%、10%至20%、10%至25%、10%至50%、10%至60%、10%至70%、10%至80%、10%至90%、10%至95%、10%至100%、20%至25%、20%至50%、20%至60%、20%至70%、20%至80%、20%至90%、20%至95%、20%至100%、50%至60%、50%至70%、50%至80%、50%至90%、50%至95%、50%至100%、70%至80%、70%至90%、70%至95%、70%至100%、80%至90%、80%至95%、80%至100%、90%至95%、90%至100%及95%至100%)。

在一些實施例中，序列之一或多個核糖核苷酸的糖修飾(例如在2'位置或4'位置)或糖置換以及主鏈修飾可包括磷酸二酯鍵聯之修飾或置換。序列之特定實例包括但不限於包括經修飾之主鏈或無天然核苷間鍵聯(諸如核苷間修飾)，包括磷酸二酯鍵聯之修飾或置換的序列。具有經修飾主鏈之序列尤其包括主鏈中不具有磷原子者。出於本申請案之目的，且如此項技術中有時提及，在核苷間主鏈中不具有磷原子之經修飾之RNA亦可視為寡核苷。在特定實施例中，序列將包括在核苷間主鏈中具有磷原子之核糖核苷酸。

經修飾之序列主鏈可包括例如硫代磷酸酯；對掌性硫代磷酸酯；二硫代磷酸酯；磷酸三酯；胺基烷基磷酸三酯；甲基及其他烷基膦酸酯，諸如3'-伸烷基膦酸酯及對掌性膦酸酯；亞膦酸酯；胺基磷酸酯，諸如具有正常3'-5'鍵聯之3'-胺基胺基磷酸酯及胺基烷基胺基磷酸酯、硫代胺基磷酸酯、硫羰基烷基膦酸酯、硫羰基烷基磷酸三酯及硼烷磷酸酯、其2'-5'連接之類似物及具有反向極性之胺基磷酸酯，其中相鄰的核苷單元對以3'-5'至5'-3'或2'-5'至5'-2'連接。亦包括各種鹽、混合鹽及游離酸形式。在一些實施例中，該序列可帶負電荷或帶正電荷。

可併入序列中之經修飾之核苷酸可在核苷間鍵聯(例如磷酸酯主鏈)上進行修飾。在本文中，在聚核苷酸主鏈之上下文中，片語「磷酸酯」及「磷酸二酯」可互換使用。主鏈磷酸基可藉由用不同取代基置換一或多個氧原子來修飾。此外，經修飾之核苷及核苷酸可包括用如本文所述之另一核苷間鍵聯大規模置換未經修飾之磷酸酯部分。經修飾之磷酸基之實例包括但不限於硫代磷酸酯、硒代磷酸酯、硼烷磷酸酯(boranophosphate)、硼烷磷酸酯(boranophosphate ester)、氫膦酸酯、胺基磷酸酯、二胺基磷酸酯、烷基或芳基膦酸酯及磷酸三酯。二硫代磷酸酯之兩個非連接氧均經硫置換。磷酸酯連接子亦可藉由用氮(橋接胺基磷酸酯)、硫(橋接硫代磷酸酯)及碳(橋接亞甲基-膦酸酯)置換連接氧而修飾。

提供經α-硫基取代之磷酸酯部分以經由非天然硫代磷酸酯主鏈鍵聯賦予RNA及DNA聚合物穩定性。硫代磷酸酯DNA及RNA具有增加之核酸酶抗性，且隨後在細胞環境中之半衰期更長。

在特定實施例中，經修飾之核苷包括α-硫基-核苷(例如5'- O-(1-硫代磷酸酯)-腺苷、5'- O-(1-硫代磷酸酯)-胞苷(a-硫基-胞苷)、5'- O-(1-硫代磷酸酯)-鳥苷、5'- O-(1-硫代磷酸酯)-尿苷或5'- O-(1-硫代磷酸酯)-假尿苷)。

本文描述可根據本發明採用之其他核苷間鍵聯，包括不含磷原子之核苷間鍵聯。

在一些實施例中，序列可包括一或多種細胞毒性核苷。例如，細胞毒性核苷可併入至序列中，諸如雙官能修飾。細胞毒性核苷可包括(但不限於)阿糖腺苷、5-氮雜胞苷、4'-硫基-阿糖胞苷、環戊烯基胞嘧啶、克拉屈濱(cladribine)、氯法拉濱(clofarabine)、阿糖胞苷(cytarabine)、阿拉伯糖苷胞嘧啶、1-(2-C-氰基-2-去氧-β-D-阿拉伯-呋喃戊醣基)-胞嘧啶、地西他濱(decitabine)、5-氟尿嘧啶(5-fluorouracil)、氟達拉賓(fludarabine)、氟尿苷(floxuridine)、吉西他濱(gemcitabine)、喃氟啶(tegafur)與尿嘧啶之組合、喃氟啶((RS)-5-氟-1-(四氫呋喃-2-基)嘧啶-2,4(1H,3H)-二酮)、曲沙他濱(troxacitabine)、替紮他濱(tezacitabine)、2'-去氧-2'-亞甲基胞嘧啶核苷(DMDC)及6-巰基嘌呤(6-mercaptopurine)。額外實例包括磷酸氟達拉濱(fludarabine phosphate)、N4-二十二烷醯基-1-β-D-阿糖呋喃胞嘧啶、N4-十八烷基-1-β-D-阿糖呋喃胞嘧啶、N4-棕櫚醯基-1-(2-C-氰基-2-去氧-β-D-阿拉伯-呋喃戊醣基)胞嘧啶及P-4055 (阿糖胞苷5'-反油酸酯)。

在一些實施例中，序列包括一或多種轉錄後修飾(例如加帽、裂解、多腺苷酸化、剪接、多腺苷酸序列、甲基化、醯化、磷酸化、離胺酸及精胺酸殘基之甲基化、乙醯化及硫醇基及酪胺酸殘基之亞硝基化等)。一或多個轉錄後修飾可為任何轉錄後修飾，諸如已在RNA中鑑別之超過一百個不同核苷修飾中之任一者(Rozenski, J, Crain, P, 及McCloskey, J. (1999). The RNA Modification Database: 1999更新. Nucl Acids Res 27: 196-197)。在一些實施例中，第一分離之核酸包含信使RNA (mRNA)。在一些實施例中，mRNA包含至少一種選自由以下組成之群的核苷：吡啶-4-酮核苷、5-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫代尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基尿苷、3-甲基尿苷、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫基-1-甲基-假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷及4-甲氧基-2-硫基-假尿苷。在一些實施例中，mRNA包含至少一種選自由以下組成之群的核苷：5-氮雜-胞苷、假異胞苷、3-甲基-胞苷、N4-乙醯基胞苷、5-甲醯基胞苷、N4-甲基胞啶、5-羥甲基胞苷、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫基-胞苷、2-硫基-5-甲基-胞苷、4-硫基-假異胞苷、4-硫基-1-甲基-假異胞苷、4-硫基-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、澤布拉恩(zebularine)、5-氮雜-澤布拉恩、5-甲基-澤布拉恩、5-氮雜-2-硫基-澤布拉恩、2-硫基-澤布拉恩、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷及4-甲氧基-1-甲基-假異胞苷。在一些實施例中，mRNA包含至少一種選自由以下組成之群的核苷：2-胺基嘌呤、2,6-二胺基嘌呤、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基嘌呤、7-去氮-8-氮雜-2-胺基嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-異戊烯基腺苷、N6-(順式-羥基異戊烯基)腺苷、2-甲硫基-N6-(順式-羥基異戊烯基)腺苷、N6-甘胺醯基胺甲醯基腺苷、N6-蘇胺醯基胺甲醯基腺苷、2-甲硫基-N6-蘇胺醯基胺甲醯基腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲硫基-腺嘌呤及2-甲氧基-腺嘌呤。在一些實施例中，mRNA包含至少一種選自由以下組成之群的核苷：肌苷、1-甲基-肌苷、懷俄苷(wyosine)、懷俄丁苷(wybutosine)、7-去氮-鳥苷、7-去氮-8-氮雜-鳥苷、6-硫基-鳥苷、6-硫基-7-去氮-鳥苷、6-硫基-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷、6-硫基-7-甲基-鳥苷、7-甲基肌苷、6-甲氧基-鳥苷、1-甲基鳥苷、N2-甲基鳥苷、N2,N2-二甲基鳥苷、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫基-鳥苷、N2-甲基-6-硫基-鳥苷及N2,N2-二甲基-6-硫基-鳥苷。

序列可沿分子之整個長度統一修飾或可不統一修飾。例如，一或多種或所有類型之核苷酸(例如天然存在之核苷酸、嘌呤或嘧啶，或A、G、U、C、I、pU中之任一或多個或所有)可在序列中或在其給定預定序列區中統一修飾或可不統一修飾。在一些實施例中，序列包括假尿苷。在一些實施例中，序列包括肌苷，其可幫助免疫系統將序列表徵為內源性RNA與病毒RNA。肌苷之併入亦可介導改善之RNA穩定性/減少之降解。參見例如Yu, Z.等人(2015) RNA editing by ADAR1 marks dsRNA as 「self」. Cell Res. 25, 1283-1284，其以全文引用的方式併入本文中。

目標核酸本文揭示之方法適用於多種目標核酸。在一些實施例中，目標核酸為DNA，諸如DNA基因座。在一些實施例中，目標核酸為RNA，諸如RNA基因座或mRNA。在一些實施例中，目標核酸為單股(例如單股DNA)。在一些實施例中，目標核酸為雙股(例如雙股DNA)。在一些實施例中，目標核酸包含單股與雙股區域。在一些實施例中，目標核酸為線性的。在一些實施例中，目標核酸為環狀的。在一些實施例中，目標核酸包含一或多種經修飾之核苷酸，諸如甲基化核苷酸、受損核苷酸或核苷酸類似物。在一些實施例中，目標核酸未經修飾。

目標核酸可具有任何長度，諸如約以下中之至少任一者：100 bp、200 bp、500 bp、1000 bp、2000 bp、5000 bp、10 kb、20 kb、50 kb、100 kb、200 kb、500 kb、1 Mb或更長。目標核酸亦可包含任何序列。在一些實施例中，目標核酸富含GC，諸如具有至少約40%、45%、50%、55%、60%、65%或更高中之任一者的GC含量。在一些實施例中，目標核酸具有至少約70%、80%或更多之GC含量。在一些實施例中，目標核酸為非富含GC之目標核酸中的富含GC片段。在一些實施例中，目標核酸不富含GC。在一些實施例中，目標核酸具有一或多種二級結構或更高階結構。在一些實施例中，目標核酸不呈縮合狀態，諸如染色質，致使變異多肽/RNA引導複合物無法接近目標核酸。

在一些實施例中，目標核酸存在於細胞中。在一些實施例中，目標核酸存在於細胞之細胞核中。在一些實施例中，目標核酸為細胞內源性的。在一些實施例中，目標核酸為基因體DNA。在一些實施例中，目標核酸為染色體DNA。在一個實施例中，目標核酸為染色體外核酸。在一些實施例中，目標核酸為蛋白質編碼基因或其功能區域，諸如編碼區，或調控元件，諸如啟動子、強化子、5'或3'未轉譯區等。在一些實施例中，目標核酸為非編碼基因，諸如轉座子、miRNA、tRNA、核糖體RNA、核糖核酸酶或lincRNA。在一些實施例中，目標核酸為質體。

在一些實施例中，目標核酸為細胞外源性的。在一些實施例中，目標核酸為病毒核酸，諸如病毒DNA或病毒RNA。在一些實施例中，目標核酸為水平轉移質體。在一些實施例中，目標核酸整合於細胞之基因體中。在一些實施例中，目標核酸不整合於細胞之基因體中。在一些實施例中，目標核酸為細胞中之質體。在一些實施例中，目標核酸存在於染色體外陣列中。

在一些實施例中，目標核酸為經分離之核酸，諸如經分離之DNA或經分離之RNA。在一些實施例中，目標核酸存在於無細胞環境中。在一些實施例中，目標核酸為經分離之載體，諸如質體。在一些實施例中，目標核酸為超純質體。

目標核酸為與RNA引導雜交之目標核酸之區段。在一些實施例中，目標核酸僅具有目標核酸之一個複本。在一些實施例中，目標核酸具有目標核酸之超過一個複本，諸如至少約2、3、4、5、10、100或更多個複本中之任一者。例如，變異核糖核蛋白可靶向在病毒核酸或細菌之基因體中包含重複序列之目標核酸。

目標序列與如本文所述之本發明之原間隔子相鄰模體或PAM相鄰。PAM可緊鄰目標序列或例如在目標序列之少數(例如1、2、3、4或5個)核苷酸內。在雙股目標之情況下，靶向部分(例如RNA引導)結合於目標之第一股且如本文所述之PAM序列存在於第二互補股中。在此類情況下，PAM序列緊鄰(或在少數，例如1、2、3、4或5個核苷酸內)第二股中與結合部分結合之第一股中之序列互補的序列。

在一些實施例中，序列特異性要求RNA引導中之間隔子序列與目標核酸之非PAM股完整匹配。在其他實施例中，序列特異性要求RNA引導中之間隔子序列與目標核酸之非PAM股部分(相連或不相連)匹配。

在一些實施例中，RNA引導或包含RNA引導及本文所述之變異多肽之複合物在由RNA引導與目標核酸之間的互補區界定之序列結合於目標核酸。在一些實施例中，本文所述之PAM序列正好位於目標核酸之目標序列上游(例如正好目標序列之5')。在一些實施例中，本文所述之PAM序列正好位於目標核酸之非間隔子互補股(例如非目標股)上的目標序列之5'。

在一些實施例中，與本發明之變異多肽相對應之PAM包括5'-NTTR-3'、5'-NTTN-3'、5'-RTTR-3'、5'-ATTR-3'或5'-RTTG-3'。如本文所用，N可各自為任何核苷酸(例如，A、G、T或C)或其子集(例如，R (A或G)、Y (C或T)、K (G或T)、B (G、T或C)、H (A、C或T)。在一些實施例中，PAM包含5'-GTTA-3'、5'-TTTG-3'、5'-CTTG-3'、5'-GTTG-3'、5'-TTTA-3'、5'-CTTA-3'、5'-ATTG-3'、5'-ATTA-3'、5'-ACTG-3'、5'-CATA-3'、5'-TTGA-3'或5'-TATA-3'。在一些實施例中，包含本發明之變異多肽的二元複合物結合於與5'-NTTR-3'、5'-NTTN-3'、5'-RTTR-3'、5'-ATTR-3'或5'-RTTG-3'序列相鄰之目標核酸。在一些實施例中，包含本發明之變異多肽的二元複合物結合於與5'-GTTA-3'、5'-TTTG-3'、5'-CTTG-3'、5'-GTTG-3'、5'-TTTA-3'、5'-CTTA-3'、5'-ATTG-3'、5'-ATTA-3'、5'-ACTG-3'、5'-CATA-3'、5'-TTGA-3'或5'-TATA-3'序列相鄰之目標核酸。

在一些實施例中，目標核酸存在於目標核酸之容易接近區域中。在一些實施例中，目標核酸在目標基因之外顯子中。在一些實施例中，目標核酸跨越目標基因之外顯子-內含子接合處。在一些實施例中，目標核酸存在於非編碼區域，諸如基因之調控區域中。在目標核酸為細胞外源性之一些實施例中，目標核酸包含在細胞之基因體中未發現的序列。

適合DNA/RNA結合條件包括細胞中通常存在之生理條件。其他適合DNA/RNA結合條件(例如無細胞系統中之條件)係此項技術中已知的；參見例如Sambrook, 見上文。與RNA引導互補及雜交的目標核酸之股稱為「互補股」，且與「互補股」互補(且因此不與RNA引導互補)之目標核酸之股稱為「非互補股(noncomplementary strand)」或「非互補股(non-complementary strand)」。

製備在一些實施例中，本發明之變異多肽可藉由以下來製備：(a)培養細菌，產生本發明之變異多肽，分離變異多肽，視情況，純化變異多肽，且將變異多肽與RNA引導複合。變異多肽亦可藉由(b)已知之基因工程改造技術來製備，具體而言，自細菌分離編碼本發明之變異多肽之基因，構築重組表現載體，且接著將載體轉移至表現RNA引導之適當宿主細胞中以在宿主細胞中表現與RNA引導形成複合物之重組蛋白。或者，變異多肽可藉由(c)活體外偶合轉錄-轉譯系統製備且接著與RNA引導形成複合物。可用於製備本發明之變異多肽的細菌不受特別限制，只要其可產生本發明之變異多肽即可。細菌之一些非限制性實例包括本文所述之大腸桿菌細胞。

載體本發明提供用於表現本文所述之變異多肽的載體或編碼本文所述之變異體之核酸可併入至載體中。在一些實施例中，本發明之載體包括編碼變異多肽之核苷酸序列。在一些實施例中，本發明之載體包括編碼變異多肽之核苷酸序列。

本發明亦提供一種可用於製備如本文所述之變異多肽或包含變異多肽之組合物的載體。在一些實施例中，本發明包括細胞中之本文所述之組合物或載體。在一些實施例中，本發明包括一種在細胞中表現包含變異多肽之組合物或編碼變異多肽之載體或核酸的方法。該方法可包含提供組合物，例如載體或核酸且遞送組合物至細胞之步驟。

天然或合成聚核苷酸之表現通常藉由將編碼所關注之基因之聚核苷酸，例如編碼變異多肽之核苷酸序列可操作地連接於啟動子且將構築體併入至表現載體中來實現。表現載體不受特別限制，只要其包括編碼本發明之變異多肽之聚核苷酸且可適合於在真核細胞中複製及整合即可。

典型表現載體包括可用於所需聚核苷酸表現之轉錄及轉譯終止子、起始序列及啟動子。例如，可使用攜帶RNA聚合酶之識別序列的質體載體(pSP64、pBluescript等)。包括來源於反轉錄病毒(諸如慢病毒)之載體的載體為適於實現長期基因轉移之工具，此係因為其允許長期穩定地整合轉殖基因及其在子細胞中之傳播。載體之實例包括表現載體、複製載體、探針產生載體及定序載體。表現載體可呈病毒載體形式提供至細胞。

病毒載體技術係此項技術中熟知的且描述於多個病毒學及分子生物學手冊中。適用作載體之病毒包括但不限於噬菌體病毒、反轉錄病毒、腺病毒、腺相關病毒、疱疹病毒及慢病毒。一般而言，適合載體含有在至少一種生物體中發揮功能之複製起點、啟動子序列、適宜限制性核酸內切酶位點及一或多種可選擇標記物。

載體種類不受特別限制，且宜選擇可在宿主細胞中表現之載體。更特定而言，視宿主細胞之種類而定，宜選擇確保變異多肽自聚核苷酸表現之啟動子序列，且將此啟動子序列及聚核苷酸插入至各種質體等中之任一者中以製備表現載體。

額外啟動子元件(例如，強化序列)調控轉錄起始頻率。通常，此等元件位於起始位點上游30-110 bp區中，不過多個啟動子最近已展示含有亦位於起始位點下游之功能元件。視啟動子而定，個別元件似乎可合作地或獨立地起活化轉錄之功能。

此外，本發明不應限於使用組成性啟動子。亦考慮誘導性啟動子作為本發明之一部分。誘導性啟動子之使用提供分子開關，其能夠在需要此類表現時打開其可操作地連接之聚核苷酸序列之表現或在不需要表現時關閉表現。誘導性啟動子之實例包括(但不限於)金屬硫蛋白啟動子、糖皮質激素啟動子、孕酮啟動子及四環素啟動子。

待引入之表現載體亦可含有可選標記基因或報導基因或兩者以有助於自設法經由病毒載體轉染或感染之細胞群體鑑別及選擇表現細胞。在其他態樣中，可選標記物可攜載於單獨的DNA段上且用於共轉染程序。可選標記基因及報導基因皆可側接適當轉錄控制序列以使得能夠在宿主細胞中表現。此類標記物之實例包括用於真核細胞培養之二氫葉酸還原酶基因及新黴素抗性基因；及用於大腸桿菌及其他細菌培養之四環素抗性基因及安比西林(ampicillin)抗性基因。藉由使用此類選擇標記物，可證實編碼本發明之變異多肽之聚核苷酸是否已轉移至宿主細胞中且接著無故障地表現。

用於重組表現載體之製備方法不受特別限制，且其實例包括使用質體、噬菌體或黏質體之方法。

表現方法本發明包括一種用於表現蛋白質之方法，其包含將本文所述之變異多肽轉譯。

在一些實施例中，本文所述之宿主細胞用於表現變異多肽。宿主細胞不受特別限制，且較佳可使用各種已知細胞。宿主細胞之特定實例包括細菌，諸如大腸桿菌、酵母(出芽酵母、釀酒酵母( Saccharomyces cerevisiae)及裂變酵母、粟酒裂殖酵母( Schizosaccharomyces pombe))、線蟲(秀麗隱桿線蟲( Caenorhabditis elegans))、非洲爪蟾( Xenopus laevis)卵母細胞及動物細胞(例如CHO細胞、COS細胞及HEK293細胞)。用於將上述表現載體轉移至宿主細胞中之方法，亦即轉形方法，不受特別限制，且可使用諸如電穿孔、磷酸鈣法、脂質體法及DEAE聚葡萄糖法之已知方法。

在用表現載體轉形宿主之後，可培養、培植或培育宿主細胞以產生變異多肽。在表現變異多肽之後，可收集宿主細胞且根據習知方法(例如過濾、離心、細胞破壞、凝膠過濾層析、離子交換層析等)自培養物純化變異多肽等。

在一些實施例中，用於表現變異多肽之方法包含轉譯變異多肽之至少5個胺基酸、至少10個胺基酸、至少15個胺基酸、至少20個胺基酸、至少50個胺基酸、至少100個胺基酸、至少150個胺基酸、至少200個胺基酸、至少250個胺基酸、至少300個胺基酸、至少400個胺基酸、至少500個胺基酸、至少600個胺基酸、至少700個胺基酸、至少800個胺基酸、至少900個胺基酸或至少1000個胺基酸。在一些實施例中，用於表現蛋白質之方法包含轉譯變異多肽之約5個胺基酸、約10個胺基酸、約15個胺基酸、約20個胺基酸、約50個胺基酸、約100個胺基酸、約150個胺基酸、約200個胺基酸、約250個胺基酸、約300個胺基酸、約400個胺基酸、約500個胺基酸、約600個胺基酸、約700個胺基酸、約800個胺基酸、約900個胺基酸、約1000個胺基酸或更多。

可使用多種方法測定宿主細胞中成熟變異多肽之產生含量。此類方法包括(但不限於)例如利用對變異多肽具有特異性之多株或單株抗體或如本文別處所述之標記標籤的方法。示例性方法包括(但不限於)酶聯免疫吸附分析(ELISA)、放射免疫分析(MA)、螢光免疫分析(FIA)及螢光活化細胞分選(FACS)。此類及其他分析為此項技術中熟知(參見例如Maddox等人, J. Exp. Med. 158:1211 [1983])。

本發明提供在細胞中活體內表現變異多肽之方法，其包含將編碼變異多肽之聚核糖核苷酸提供至其中聚核糖核苷酸編碼變異多肽之宿主細胞，在細胞中表現變異多肽，且自細胞獲得變異多肽。

改變或突變之引入可藉由此項技術中已知之合成方法來產生編碼變異多肽之核酸序列或變異多肽。使用編碼親本多肽之核酸序列本身作為構架，可一次插入改變或突變一或多個以改變編碼親本多肽之核酸序列。同樣道理，可藉由在親本多肽以合成方式合成時將變化引入至多肽序列中來改變或突變親本多肽。此可藉由此項技術中熟知之方法實現。

可使用熟習此項技術者已知之任何方法產生親本多肽序列及將改變或突變引入至親本多肽序列中。詳言之，在一些實施例中，用於PCR之寡核苷酸引子可用於快速合成在編碼變異多肽之核酸序列中包括一或多個改變或突變之DNA模板。位點特異性突變誘發亦可用作經由潛在DNA之特定突變誘發，可用於製備個別肽或生物學上功能等效蛋白質或肽的技術。該技術藉由引入一或多種核苷酸序列變化至DNA中，併入前述考慮因素中之一或多者，進一步提供製備及測試變異體之預備能力。位點特異性突變誘發允許經由使用編碼所需突變之DNA序列的特定寡核苷酸序列以及足夠數目之相鄰核苷酸產生變異體，以提供具有足夠尺寸及序列複雜性之引子序列，從而在所穿過之缺失接合處之兩側上形成穩定雙鏈體。通常，長度為約17至25個核苷酸之引子為較佳，其中序列之接合處之兩側上的約5至10個殘基改變。

可以與改變或突變引入至親本多肽中類似之方式來引入結構變化，諸如多肽融合為及/或羧基端延伸。額外肽可藉由編碼額外肽之適當核酸序列包括至編碼親本多肽或變異多肽之核酸序列而添加至親本多肽或變異多肽。視情況，額外肽可經由合成多肽產生而直接附加至變異多肽。

在一態樣中，本發明亦提供用於將改變或突變引入至親本多肽序列中之方法，以產生與親本多肽相比，具有增加的與目標核酸之兩個或更多個基因座(例如2、3、4、5、6、7、8、9個或更多個)之正中目標結合的變異多肽。

在一態樣中，本發明亦提供用於將改變或突變引入至親本多肽序列中之方法，以產生當與複數個獨特RNA引導個別複合時，與複數個親本多肽及RNA引導相比，具有增加的與目標核酸之兩個或更多個基因座之正中目標結合的複數個變異多肽(例如具有相同胺基酸序列之獨立變異多肽)。

在一態樣中，本發明亦提供用於將改變或突變引入至親本多肽序列中之方法，以產生與親本多肽相比，具有增加的與目標核酸之兩個或更多個目標基因座之正中目標三元複合物形成的變異多肽。

在一態樣中，本發明亦提供用於將改變或突變引入至親本多肽序列中之方法，以產生當與複數個獨特RNA引導個別複合時，與複數個親本多肽及RNA引導相比，具有增加的與目標核酸之兩個或更多個基因座之三元複合物形成的複數個變異多肽(例如具有相同胺基酸序列之獨立變異多肽)。

在一態樣中，本發明亦提供用於將改變或突變引入至親本多肽序列中之方法，以產生與親本多肽相比，展現靶向增加數目之目標核酸或目標基因座的變異多肽。

在一態樣中，本發明亦提供用於將改變或突變引入至親本多肽序列中之方法，以產生當與複數個獨特RNA引導個別複合時，與複數個親本多肽及RNA引導相比，展現靶向增加數目之目標核酸或目標基因座的複數個變異多肽(例如具有相同胺基酸序列之獨立變異多肽)。

在一態樣中，本發明亦提供用於將改變或突變引入至親本多肽序列中之方法，以增強變異多肽之穩定性。變異多肽之穩定性可藉由以下技術測定或可包括不限於以下技術：熱變性分析、熱漂移分析、差示掃描熱量測定法(DSC)、差示掃描螢光測定法(DSF)、等溫滴定量熱法(ITC)、脈衝追蹤法、漂白追蹤法、環己醯亞胺追蹤法、圓二色譜(CD)光譜法、結晶及基於螢光之活性分析。

變異二元複合一般而言，變異多肽及RNA引導以約1:1之莫耳比彼此結合以形成變異二元複合物。變異多肽及RNA引導單獨或一起不會天然存在。

在一些實施例中，變異多肽可在宿主細胞中過度表現且如本文所述進行純化，隨後與RNA引導複合(例如在試管中)以形成變異核糖核蛋白(RNP) (例如變異二元複合物)。

在一些實施例中，變異二元複合物展現在一定培育時間範圍內增加之與目標核酸之結合親和力、增加之正中目標結合活性、增加之正中目標結合特異性、增加之與目標核酸之三元複合物形成及/或增加之穩定性。在一些實施例中，變異二元複合物展現在一定培育時間範圍內減少之與非目標核酸之偏離目標結合及/或減少之自目標核酸之解離。在一些實施例中，變異二元複合物展現在一定培育時間範圍內增加之目標核酸複合物形成、目標核酸活性及/或目標核酸特異性。

在一些實施例中，二元複合物之複合在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃或55℃中之任一者的溫度下發生。在一些實施例中，在約37℃下在至少約10分鐘、15分鐘、20分鐘、25分鐘、30分鐘、35分鐘、40分鐘、45分鐘、50分鐘、55分鐘、1小時、2小時、3小時、4小時或更多小時中之任一者的培育時期內變異多肽不自RNA引導解離或結合於游離RNA。在一些實施例中，在二元複合物形成之後，變異核糖核蛋白複合物不將RNA引導交換成不同RNA。

在一些實施例中，變異多肽及RNA引導在二元複合緩衝液中複合。在一些實施例中，變異多肽儲存於替換為二元複合緩衝液之緩衝液中以與RNA引導形成複合物。在一些實施例中，變異多肽儲存於二元複合緩衝液中。

在一些實施例中，二元複合緩衝液具有在約7.3至8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值。在一個實施例中，二元複合緩衝液之pH值為約7.3。在一個實施例中，二元複合緩衝液之pH值為約7.4。在一個實施例中，二元複合緩衝液之pH值為約7.5。在一個實施例中，二元複合緩衝液之pH值為約7.6。在一個實施例中，二元複合緩衝液之pH值為約7.7。在一個實施例中，二元複合緩衝液之pH值為約7.8。在一個實施例中，二元複合緩衝液之pH值為約7.9。在一個實施例中，二元複合緩衝液之pH值為約8.0。在一個實施例中，二元複合緩衝液之pH值為約8.1。在一個實施例中，二元複合緩衝液之pH值為約8.2。在一個實施例中，二元複合緩衝液之pH值為約8.3。在一個實施例中，二元複合緩衝液之pH值為約8.4。在一個實施例中，二元複合緩衝液之pH值為約8.5。在一個實施例中，二元複合緩衝液之pH值為約8.6。

變異多肽之熱穩定性可在諸如添加RNA引導，例如結合RNA引導之有利條件下增加。

在一些實施例中，變異多肽可在如本文所述進行純化之前在宿主細胞中過度表現且與RNA引導複合。在一些實施例中，將編碼變異多肽之mRNA或DNA引入至細胞中，使得變異多肽在細胞中表現。亦將引導變異多肽至期望目標核酸之RNA引導引入至細胞中，無論與單個mRNA或DNA構築體同時、分開或依次，使得在細胞中形成所需核糖核蛋白複合物。

評估變異二元複合物穩定性及功能性在某些實施例中，本文提供用於鑑別最佳變異多肽/RNA引導複合物(在本文中稱為變異二元複合物)之方法，其包括(a)將變異多肽及RNA引導組合在樣品中以形成變異二元複合物；(b)量測變異二元複合物之值；及(c)若變異二元複合物之值大於參考分子之值，則確定變異二元複合物優於參考分子。在一些實施例中，該值可包括但不限於穩定性量測值(例如T _m值、熱穩定性)、二元複合物形成速率、RNA引導結合特異性及/或複合物活性。

在一些實施例中，最佳變異多肽/RNA引導複合物(亦即，變異二元複合物)藉由以下步驟來鑑別：(a)將變異多肽及RNA引導組合在樣品中以形成變異二元複合物；(b)偵測變異二元複合物之T _m值；及(c)若變異二元複合物之T _m值比參考分子之T _m值或T _m參考值大至少8℃，則確定變異二元複合物為穩定的。

涉及量測變異多肽/RNA引導複合物(亦即，變異二元複合物)之熱穩定性之步驟的方法可包括不限於測定變異二元複合物之穩定性之方法、測定促進穩定變異二元複合物之條件之方法、篩選穩定變異二元複合物之方法及用於鑑別最佳gRNA以形成穩定變異二元複合物之方法。在某些實施例中，可量測變異二元複合物之熱穩定性值。

此外，在某些實施例中，亦可量測參考分子之熱穩定性值。在某些實施例中，如本文所述，若所量測之變異二元複合物之熱穩定性值大於所量測之參考分子之熱穩定性值或熱穩定性參考值(在相同實驗條件下量測)，則可確定變異二元複合物為穩定的。在某些實施例中，參考分子可為缺乏RNA引導之變異多肽。

在某些實施例中，量測之熱穩定性值可為變性溫度值。在此等實施例中，熱穩定性參考值為變性溫度參考值。在某些實施例中，量測之熱穩定性值可為T _m值。在此等實施例中，熱穩定性參考值可為T _m參考值。在某些實施例中，熱穩定性值可使用熱漂移分析來量測。在某些實施例中，用於量測熱穩定性之分析可涉及本文所述之技術，包括(但不限於)：熱變性分析、熱漂移分析、差示掃描熱量測定法(DSC)、差示掃描螢光測定法(DSF)、等溫滴定量熱法(ITC)、脈衝追蹤法、漂白追蹤法、環己醯亞胺追蹤法、圓二色譜(CD)光譜法、結晶及基於螢光之活性分析。

在某些實施例中，若變異多肽/RNA引導複合物形成之速率、RNA引導結合特異性及/或變異二元複合物之複合物活性大於參考分子之值或參考值(例如親本多肽/RNA引導複合物(在本文中稱為親本二元複合物)之值)，則可鑑別變異二元複合物。舉例而言，在某些實施例中，若變異多肽/RNA引導複合物形成之速率、RNA引導結合特異性及/或變異二元複合物之複合物活性的值比參考分子之值或參考值(例如親本二元複合物之值)大至少X%，則可鑑別變異二元複合物。在某些實施例中，本文所述之方法可進一步包含包括量測如本文所述之變異二元複合物之活性的步驟。

變異三元複合在一些實施例中，如本文所述，變異多肽、RNA引導及目標核酸形成變異三元複合物(例如在試管或細胞中)。一般而言，變異多肽、RNA引導及目標核酸以約1:1:1之莫耳比彼此締合以形成變異三元複合物。變異多肽、RNA引導及目標核酸單獨或一起不會天然存在。

在一些實施例中，如本文所述之變異二元複合物(例如變異多肽與RNA引導之複合物)進一步與目標核酸複合(例如在試管或細胞中)以形成變異三元複合物。

在一些實施例中，三元複合物之複合在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃或55℃中之任一者的溫度下發生。在一些實施例中，在約37℃下在至少約10分鐘、15分鐘、20分鐘、25分鐘、30分鐘、35分鐘、40分鐘、45分鐘、50分鐘、55分鐘、1小時、2小時、3小時、4小時或更多小時中之任一者的培育時期內變異二元複合物不自目標核酸解離或結合於游離核酸(例如游離DNA)。在一些實施例中，在三元複合物形成之後，變異二元複合物不將目標核酸交換成不同核酸。

在一些實施例中，變異多肽、RNA引導及目標核酸在三元複合緩衝液中複合。在一些實施例中，變異多肽儲存於替換為三元複合緩衝液之緩衝液中以與RNA引導及目標核酸形成複合物。在一些實施例中，變異多肽儲存於三元複合緩衝液中。

在一些實施例中，變異二元複合物及目標核酸在三元複合緩衝液中複合。在一些實施例中，變異二元複合物儲存於替換為三元複合緩衝液之緩衝液中以與目標核酸形成複合物。在一些實施例中，變異二元複合物儲存於三元複合緩衝液中。

在一些實施例中，三元複合緩衝液具有在約7.3至8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值。在一個實施例中，三元複合緩衝液之pH值為約7.3。在一個實施例中，三元複合緩衝液之pH值為約7.4。在一個實施例中，三元複合緩衝液之pH值為約7.5。在一個實施例中，三元複合緩衝液之pH值為約7.6。在一個實施例中，三元複合緩衝液之pH值為約7.7。在一個實施例中，三元複合緩衝液之pH值為約7.8。在一個實施例中，三元複合緩衝液之pH值為約7.9。在一個實施例中，三元複合緩衝液之pH值為約8.0。在一個實施例中，三元複合緩衝液之pH值為約8.1。在一個實施例中，三元複合緩衝液之pH值為約8.2。在一個實施例中，三元複合緩衝液之pH值為約8.3。在一個實施例中，三元複合緩衝液之pH值為約8.4。在一個實施例中，三元複合緩衝液之pH值為約8.5。在一個實施例中，三元複合緩衝液之pH值為約8.6。

變異多肽之熱穩定性可在諸如添加RNA引導及目標核酸之有利條件下增加。

評估變異三元複合物穩定性及功能性在某些實施例中，本文提供用於鑑別最佳變異三元複合物之方法，其包括(a)將變異多肽、RNA引導及目標核酸組合在樣品中以形成變異三元複合物；(b)量測變異三元複合物之值；及(c)若變異三元複合物之值大於參考分子之值，則確定變異三元複合物優於參考分子。在一些實施例中，該值可包括但不限於穩定性量測值(例如T _m值、熱穩定性)、三元複合物形成速率、DNA結合親和力量測值、DNA結合特異性量測值及/或複合物活性量測值(例如核酸酶活性量測值)。

在一些實施例中，最佳變異三元複合物藉由以下步驟來鑑別：(a)將變異多肽、RNA引導及目標核酸組合在樣品中以形成變異三元複合物；(b)偵測變異三元複合物之T _m值；及(c)若變異三元複合物之T _m值比參考分子之T _m值或T _m參考值大至少8℃，則確定變異三元複合物為穩定的。

涉及量測變異三元複合物之熱穩定性之步驟的方法可包括不限於測定變異三元複合物之穩定性之方法、測定促進穩定變異三元複合物之條件之方法、篩選穩定變異三元複合物之方法及用於鑑別最佳二元複合物以形成穩定變異三元複合物之方法。在某些實施例中，可量測變異三元複合物之熱穩定性值。

此外，在某些實施例中，亦可量測參考分子之熱穩定性值。在某些實施例中，如本文所述，若所量測之變異三元複合物之熱穩定性值大於所量測之參考分子之熱穩定性值或熱穩定性參考值(在相同實驗條件下量測)，則可確定變異三元複合物為穩定的。在某些實施例中，參考分子可為缺乏RNA引導及/或目標核酸之變異多肽。

在某些實施例中，量測之熱穩定性值可為變性溫度值。在此等實施例中，熱穩定性參考值為變性溫度參考值。在某些實施例中，量測之熱穩定性值可為T _m值。在此等實施例中，熱穩定性參考值可為T _m參考值。在某些實施例中，熱穩定性值可使用熱漂移分析來量測。在某些實施例中，用於量測熱穩定性之分析可涉及本文所述之技術，包括(但不限於)差示掃描螢光測定法(DSF)、差示掃描熱量測定法(DSC)或等溫滴定量熱法(ITC)。

在某些實施例中，若三元複合物形成之速率、DNA結合親和力、DNA結合特異性及/或變異三元複合物之複合物活性(例如核酸酶活性)大於參考分子之值或參考值(例如親本三元複合物之值)，則可鑑別變異三元複合物。舉例而言，在某些實施例中，若三元複合物形成之速率、DNA結合親和力、DNA結合特異性及/或變異三元複合物之複合物活性之值比參考分子之值或參考值(例如親本三元複合物之值)大至少X%，則可鑑別變異三元複合物。在某些實施例中，本文所述之方法可進一步包含包括量測如本文所述之變異三元複合物之活性的步驟。

遞送可調配本文所述之組合物或複合物，例如包括載劑，諸如載劑及/或聚合物載劑，例如脂質體，且藉由已知方法遞送至細胞(例如原核、真核、植物、哺乳動物等)。此類方法包括但不限於轉染(例如脂質介導、陽離子聚合物、磷酸鈣、樹枝狀聚合物)；電穿孔或破壞膜之其他方法(例如核轉染)、病毒遞送(例如慢病毒、反轉錄病毒、腺病毒、AAV)、顯微注射、微彈轟擊(「基因槍」)、fugene、直接音波裝載、細胞擠壓、光學轉染、原生質體融合、刺穿感染、磁轉染、胞外體介導之輸送、脂質奈米粒子介導之輸送及其任何組合。

在一些實施例中，方法包含遞送一或多種核酸(例如編碼變異多肽、RNA引導、供體DNA之核酸等)、其一或多種轉錄物及/或預先形成之變異多肽/RNA引導複合物(亦即，變異二元複合物)至細胞。示例性細胞內遞送方法包括(但不限於)：病毒或病毒樣試劑；基於化學物質之轉染方法，諸如使用磷酸鈣、樹枝狀聚合物、脂質體或陽離子聚合物(例如DEAE-聚葡萄糖或聚乙烯亞胺)之彼等轉染方法；非化學方法，諸如顯微注射、電穿孔、細胞擠壓、聲致穿孔、光學轉染、刺穿感染、原生質體融合、細菌結合、遞送質體或轉座子；基於粒子之方法，諸如使用基因槍、磁轉染或磁體輔助之轉染、粒子轟擊；及雜交法，諸如核轉染。在一些實施例中，本申請案進一步提供藉由此類方法產生之細胞，及包含此類細胞或由此類細胞產生之生物體(諸如動物、植物或真菌)。

細胞本文所述之多肽、組合物或複合物可遞送至多種細胞。在一些實施例中，細胞為分離之細胞。在一些實施例中，細胞在細胞培養物中。在一些實施例中，細胞為離體細胞。在一些實施例中，細胞自活生物體獲得，且維持在細胞培養物中。在一些實施例中，細胞為單細胞生物體。

在一些實施例中，細胞為原核細胞。在一些實施例中，細胞為細菌細胞或來源於細菌細胞。在一些實施例中，細菌細胞與親本多肽所源自之細菌物種無關。在一些實施例中，細胞為古菌細胞或來源於古菌細胞。在一些實施例中，細胞為真核細胞。在一些實施例中，細胞為植物細胞或來源於植物細胞。在一些實施例中，細胞為真菌細胞或來源於真菌細胞。在一些實施例中，細胞為動物細胞或來源於動物細胞。在一些實施例中，細胞為無脊椎細胞或來源於無脊椎細胞。在一些實施例中，細胞為脊椎動物細胞或來源於脊椎動物細胞。在一些實施例中，細胞為哺乳動物細胞或來源於哺乳動物細胞。在一些實施例中，細胞為人類細胞。在一些實施例中，細胞為斑馬魚細胞。在一些實施例中，細胞為嚙齒類動物細胞。在一些實施例中，細胞以合成方式製得，有時稱為人工細胞。

在一些實施例中，細胞來源於細胞株。用於組織培養之各種細胞株係此項技術中已知的。細胞株之實例包括(但不限於) 293T、MF7、K562、HeLa及其轉殖基因種類。細胞株可自熟習此項技術者已知之多種來源(參見例如美國菌種保存中心(American Type Culture Collection，ATCC) (Manassas, Va.))獲得。在一些實施例中，用本文所述之一或多種核酸(諸如編碼Ago之載體及gDNA)或Ago-gDNA複合物轉染的細胞用於建立包含一或多種載體來源之序列的新細胞株以建立包含對目標核酸之修飾的新細胞株。在一些實施例中，經或未經本文所述之一或多種核酸(諸如編碼變異多肽之載體及RNA引導)或變異多肽/RNA引導複合物(亦即，變異二元複合物)短暫轉染之細胞或來源於此類細胞之細胞株用於評估一或多種測試化合物。

在一些實施例中，方法包含將包含編碼靶向DNA之RNA (例如RNA引導)及/或變異多肽之核苷酸序列的一或多種核酸引入至宿主細胞中。在一個實施例中，包含目標DNA之細胞為活體外、活體內或離體的。在其他實施例中，包含編碼靶向DNA之RNA (例如RNA引導)及/或變異多肽之核苷酸序列的核酸包括重組表現載體，例如包括但不限於腺相關病毒構築體、重組腺病毒構築體、重組慢病毒構築體、重組反轉錄病毒構築體及其類似物。

在一些實施例中，細胞為初級細胞。例如，初級細胞之培養物可繼代0次、1次、2次、4次、5次、10次、15次或更多次。在一些實施例中，藉由任何已知方法自個體收穫初級細胞。舉例而言，可藉由血球分離術、白血球分離術、密度梯度分離等收穫白血球。可藉由生檢收穫來自諸如皮膚、肌肉、骨髓、脾臟、肝臟、胰臟、肺、腸、胃等組織之細胞。適當溶液可用於分散或懸浮所收穫之細胞。此類溶液通常可為平衡鹽溶液(例如生理食鹽水、磷酸鹽緩衝鹽水(PBS)、漢克氏平衡鹽溶液(Hank's balanced salt solution)等)，宜補充胎牛血清或其他天然存在之因子，以及低濃度的可接受之緩衝液。緩衝液可包括HEPES、磷酸鹽緩衝液、乳酸鹽緩衝液等。細胞可立即使用，或其可儲存(例如藉由冷凍)。冷凍細胞可融化且能夠再使用。細胞可冷凍在DMSO、血清、培養基緩衝液(例如10% DMSO、50%血清、40%緩衝培養基)及/或用於在冷凍溫度下保存細胞之一些其他此類常用溶液中。

在一些實施例中，變異多肽具有誘導目標核酸(例如基因體DNA)中之雙股斷裂或單股斷裂的核酸酶活性。雙股斷裂可刺激細胞內源性DNA修復路徑，包括同源定向重組(HDR)、非同源末端接合(NHEJ)或替代非同源末端接合(A-NHEJ)。NHEJ可修復裂解之目標核酸而不需要同源模板。此可引起一或多種核苷酸缺失或插入至目標核酸中。HDR可在同源模板(諸如供體DNA)下發生。同源模板可包含與側接目標核酸裂解位點之序列同源的序列。在一些情況下，HDR可將外源性聚核苷酸序列插入至裂解之目標核酸中。由NHEJ及/或HDR進行之對目標DNA之修飾可引起例如突變、缺失、改變、整合、基因校正、基因替代、基因標記、轉殖基因嵌入、基因破壞及/或基因剔除。

在一些實施例中，使細胞培養同步以增強方法之效率。在一些實施例中，S及G2期之細胞用於HDR介導之基因編輯。在一些實施例中，細胞可在任何細胞週期進行該方法。在一些實施例中，細胞過度塗鋪顯著降低該方法之功效。在一些實施例中，該方法在不超過約40%、45%、50%、55%、60%、65%或70%匯合中之任一者下施加至細胞培養物。

在一些實施例中，細胞中變異多肽/RNA引導複合物(亦即，變異二元複合物)與目標核酸之結合募集除DNA修復路徑外之一或多種內源性細胞分子或路徑以調節目標核酸。在一些實施例中，變異二元複合物之結合阻斷一或多種內源性細胞分子或路徑接近目標核酸，藉此修飾目標核酸。舉例而言，變異二元複合物之結合可阻斷內源性轉錄或轉譯機制，從而減少目標核酸之表現。

在一些實施例中，提供一種用於修飾細胞中之目標DNA分子之方法。該方法包含使細胞內部之目標DNA分子與以下接觸：本文所述之變異多肽；及單分子靶向DNA之RNA，其以5'至3'順序包含與目標DNA分子之目標序列雜交的第一核苷酸區段；核苷酸連接子；及與第一核苷酸區段雜交以形成雙股RNA雙鏈體之第二核苷酸區段。在細胞內部變異多肽與單分子靶向DNA之RNA形成複合物且修飾目標DNA分子。

套組本發明亦提供可用於例如進行本文所述之方法的套組。在一些實施例中，套組包括本發明之變異多肽，例如表2之變異體。在一些實施例中，套組包括編碼此類變異多肽之聚核苷酸，且視情況聚核苷酸包含在例如如本文所述之載體內。套組亦可視情況包括例如如本文所述之RNA引導。本發明之套組之RNA引導可經設計以靶向所關注之序列，如此項技術中已知。CRISPR核酸酶變異體及RNA引導可包裝在套組內之相同小瓶或其他容器內，或可包裝在獨立小瓶或其他容器中，其內含物可在使用之前混合。套組可另外包括視情況選用之緩衝液及/或關於使用CRISPR核酸酶變異體及/或RNA引導之說明書。

本文中引用之所有參考文獻及公開案均以引用之方式併入本文中。

實例提供以下實例以進一步說明本發明之一些實施例，但不意欲限制本發明之範疇；藉由其示例性之性質，應瞭解，可替代地使用熟習此項技術者已知之其他程序、方法或技術。

實例 1- 變異構築體之工程改造在此實例中，產生變異構築體。

經由兩個PCR步驟，使用自IDT™ (Integrated DNA Technologies, Inc.)訂購之突變誘發正向引子及突變誘發反向引子構築包含單個突變之DNA模板。在第一步驟中，在384盤中進行兩組PCR反應以產生兩個片段。兩個PCR片段之重疊區域含有所需單個突變且允許經由第二PCR組裝整個DNA模板。在第二步驟中，來自第一步驟之經純化之片段用作重疊PCR (OL PCR)之模板且退火至載體主鏈之Fw及Rv寡核苷酸用作OL PCR引子。所得到之線性DNA模板含有T7啟動子、T7終止子及多肽之開放閱讀框架。

此等線性DNA模板直接用於無細胞轉錄及轉譯系統以表現含有單個突變之多肽變異體。變異構築體進一步個別轉移至短暫轉染載體中。另外，包含組合突變之DNA模板藉由PCR製備且隨後轉移至短暫轉染載體中。

實例2-用於偵測變異二元複合物之螢光偏振分析在此實例中，經由螢光偏振分析評估野生型或變異核酸酶多肽及RNA引導形成二元複合物之能力。

藉由IDT™合成線性ssDNA片段，其包含正向重複序列上游之T7 RNA聚合酶啟動子序列之反向互補序列及期望之20 bp RNA引導目標。接著藉由將通用T7正向寡核苷酸退火(以5℃/分鐘95-4℃)至反向互補ssDNA來產生線性dsDNA活體外轉錄(IVT)模板，且在25℃下用克列諾片段(Klenow fragment) (New England Biolabs®)填充15分鐘。接著在37℃下使用HiScribe T7高產率RNA合成套組(New England Biolabs®)將所得到之IVT模板轉錄至RNA引導中，歷時4小時。在轉錄之後，使用RNA清潔及濃縮套組(Zymo)純化各RNA引導且儲存在-20℃下直至使用。

接著用6-羧基螢光素(6-FAM) (IDT™)標記RNA引導。將1X分析緩衝液(20 mM Tris-HCl (pH 7.5)、150 mM KCl、5 mM MgCl ₂、1 mM DTT)中25 nM核酸酶多肽(野生型或變異多肽)用遞增濃度之標記RNA引導(7.5-250 nM)滴定。將複合物在37℃下培育30分鐘，隨後使用微定量盤式讀取器(Infinite® 200 Pro，Tecan)量測螢光偏振。

亦研究在不同溫度下之二元複合物形成。如上所述之進一步結合實驗在25℃、50℃、60℃及70℃下等溫進行。

在滴定核酸酶多肽(野生型或變異多肽)之後與遞增濃度之RNA引導的二元複合物之形成(或在滴定RNA引導之後與遞增濃度之核酸酶多肽的二元複合物之形成)引起螢光偏振信號之變化，以微偏振(mP)單位為單位。藉由在一定RNA引導濃度範圍內繪製螢光偏振信號之變化來產生結合曲線。

此實例指示如何確定及比較核酸酶多肽(野生型或變異多肽)與RNA引導之結合親和力。

實例3-用於偵測變異二元複合物之RNA電泳遷移率變化分析此實例描述使用RNA EMSA確定核酸酶多肽(野生型或變異體)結合RNA引導之能力。

將來自IDT™之合成RNA引導用5' IRDye® 800CW (亦稱為IR800染料或IR800)使用5' EndTag標記套組(Vector® Laboratories)及IRDye® 800CW順丁烯二醯亞胺(LI-COR® Biosciences)標記，如先前在Yan等人, 2018中所詳述。在標記之後，清潔RNA引導且經由苯酚氯仿萃取進行濃縮。藉由Nanodrop™定量濃度。

對於RNA結合分析，將核酸酶多肽(野生型或變異多肽)在1X結合緩衝液(50 mM NaCl、10 mM Tris-HCl、10 mM MgCl ₂、1 mM DTT，pH 7.9)中稀釋至2.5 μM。接著將多肽在1X結合緩衝液中自2.5 μM連續稀釋至37.5 μM。再次將多肽在1X結合緩衝液加50 nM IR800標記之RNA引導中1:10稀釋且充分混合。此等反應可進一步包括0.5-5 μg tRNA，其充當競爭性抑制劑以減少多肽與RNA之非特異性結合且藉此有助於準確的特異性結合測定。將反應在37℃下培育1小時。將1 μL 100X溴酚藍添加至反應中以目測染料前沿，接著將整個反應裝載至6% DNA阻滯凝膠(ThermoFisher Scientific™)上，在80V下操作90分鐘。凝膠在Licor® Odyssey® CLx上成像。

此分析依賴於RNA遷移穿過凝膠之速率由其尺寸決定的原理。僅RNA之樣品能夠遷移特定距離。然而，若RNA結合於多肽，則出現代表較大之移動較少之RNA複合物的條帶，其在凝膠上「上移」。

因此，量測兩個條帶之強度：1)僅RNA之條帶及2)結合多肽之「上移」RNA條帶。若所有RNA均結合於多肽，則僅觀測到上移條帶。隨著多肽之濃度降低，上移條帶之強度降低，而僅RNA之條帶之強度增加。在比較RNA與核酸酶多肽(野生型或變異多肽)之結合親和力時，較高多肽/RNA親和力之特徵在於在較低濃度之多肽下的更特異性結合。

此實例指示可如何確定及比較野生型核酸酶多肽與RNA引導之結合親和力及變異多肽與RNA引導之結合親和力。

實例4-變異二元複合物之活體外裂解分析此實例描述用於製備RNP及測定RNP之活體外生化活性的方法。

將編碼野生型或變異多肽之載體轉形至大腸桿菌BL21 (DE3) (New England Biolabs®)中且在T7啟動子下表現。經轉形細胞最初在5 mL Luria Broth (TEKNOVA™) + 50 μg/mL卡那黴素(kanamycin)中生長隔夜，接著接種至1 L Terrific Broth培養基(TEKNOVA™) + 50 μg/mL卡那黴素中。細胞在37℃下生長直至OD ₆₀₀為0.6-0.8，接著用0.5 mM IPTG誘導蛋白質表現。隨後培養物在18℃下再生長14-18小時。收穫培養物且經由離心粒化，隨後再懸浮於每5 g細胞集結粒1 mL提取緩衝液(50 mM HEPES pH 7.5、500 mM NaCl、5%甘油、0.5 mM TCEP)中。細胞經由細胞破碎機(Constant System Limited)溶解，接著在4℃下在20,000×g下離心20分鐘以使溶解產物澄清。將0.2%聚乙烯亞胺(PEI)添加至澄清溶解產物且在4℃下在恆定底蓋翻轉下培育20分鐘。溶解產物隨後再在20,000×g下離心10分鐘。經由離子交換層析法純化溶解產物。在純化之後，溶離份在SDS-PAGE凝膠上操作，且彙集含有適當尺寸之蛋白質的溶離份且使用30 kD Amicon Ultra15離心單元濃縮。蛋白質緩衝液更換成12.5 mM HEPES pH 7.0、120 mM NaCl、0.5 mM TCEP及50%甘油。隨後使用Nanodrop (ThermoFisher Scientific™)來量測濃度，且蛋白質儲存於-20℃下。

使用2:1比率之合成crRNA (Integrated DNA Technologies)與蛋白質製備RNP。使RNP在37℃下在1X NEBuffer™ 2 (NEB2；New England Biolabs®；50 mM NaCl、10 mM Tris-HCl、10 mM MgCl ₂、1 mM DTT，pH 7.9)中複合30分鐘。在複合之後，使用1X NEB2作為稀釋緩衝液稀釋RNP。Apo反應(無RNA引導之蛋白質)以相同方式製備，用H ₂O補足crRNA體積。

將目標dsDNA受質(Integrated DNA Technologies)以20 nM添加至RNP及apo樣品。將反應充分混合，接著在37℃下培育1小時，接著用1 μL 20 mg/mL蛋白酶K (ThermoFisher Scientific™)淬滅。反應在50℃下再培育15分鐘，接著整個反應在2%瓊脂糖E-凝膠(ThermoFisher Scientific™)上操作。藉由溴化乙錠，在Gel Doc™ EZ凝膠成像器(BioRad®)上目測凝膠。

量測兩種類型條帶之強度：1)全長(未裂解) DNA條帶及2)一或多個下移之裂解DNA條帶。非活性RNP之特徵在於全長DNA條帶。活性RNP產生一或多個下移之裂解DNA帶。隨著活性RNP之濃度降低，全長條帶之強度增加，且裂解條帶之強度降低。在比較多個RNP之活性時，活性比另一者高之RNP之特徵在於在更低RNP濃度下更密集之裂解條帶。

此實例之方法允許比較野生型或變異RNP (二元複合物)對目標DNA之活體外裂解活性。

實例5-變異多肽及變異二元複合物之活體外穩定性分析在此實例中，評估變異RNP之穩定性。

對於加速穩定性研究，以與實例4中所描述相同之方式產生RNP (5 μM)，且隨後將樣品儲存在25℃下48小時。

對RNP樣品進行活體外裂解分析(如實例4中所描述)。此等結果與實例4之結果相比較，以確定儲存在25℃下48小時之變異RNP保留生化活性的程度。

Apo多肽(無RNA引導)亦在25℃下培育48小時。使用實例3中所描述之方法對apo樣品進行RNA EMSA分析。此等結果與實例3之結果相比較，以確定變異多肽能夠與RNA引導形成二元複合物之程度。

使用實例4中所描述之方法，在25℃下培育48小時之Apo樣品亦與RNA引導複合形成RNP。接著根據實例4之方法進行活體外裂解分析。將分析結果與實例4之結果相比較以評估用在25℃下培育之蛋白質形成之變異RNP的活性程度。

此實例之方法允許比較野生型及變異多肽以及野生型及變異RNP (二元複合物)之穩定性。展現與RNA引導之特異性結合大於另一核酸酶多肽與RNA引導之特異性結合的核酸酶多肽表明多肽更穩定。展現目標DNA之活體外裂解比另一RNP引起之裂解更穩固的RNP表明二元複合物更穩定。

實例6-用於偵測變異三元複合物之DNA電泳遷移率變化分析此實例描述使用DNA EMSA確定RNA引導、核酸酶多肽(野生型或變異多肽)及目標DNA受質形成三元複合物之能力。

將編碼野生型或變異多肽之載體轉形至大腸桿菌BL21 (DE3) (New England Biolabs®)及BL21(DE3)pLySS (Novagen®)中。經轉形細胞最初在5 mL Luria Broth (TEKNOVA™) + 50 μg/mL卡那黴素中生長隔夜，接著接種至1 L Terrific Broth培養基(TEKNOVA™) + 50 μg/mL卡那黴素中。細胞在37℃下生長直至OD ₆₀₀為0.6-0.8，接著用0.5 mM IPTG誘導蛋白質表現。隨後培養物在18℃下再生長14-18小時。收穫培養物且經由離心粒化，隨後再懸浮於每5 g細胞集結粒1 mL提取緩衝液(50 mM HEPES pH 7.5、500 mM NaCl、5%甘油、0.5 mM TCEP)中。細胞經由細胞破碎機(Constant System Limited)溶解，接著在4℃下在20,000×g下離心20分鐘以使溶解產物澄清。將0.2%聚乙烯亞胺(PEI)添加至澄清溶解產物且在4℃下在恆定底蓋翻轉下培育20分鐘。溶解產物隨後再在20,000×g下離心10分鐘。經由離子交換層析法純化溶解產物。在純化之後，溶離份在SDS-PAGE凝膠上操作，且彙集含有適當尺寸之蛋白質的溶離份且使用30 kD Amicon® Ultra15離心單元濃縮。蛋白質緩衝液更換成12.5 mM HEPES pH 7.0、120 mM NaCl、0.5 mM TCEP及50%甘油。隨後使用Nanodrop™ (ThermoFisher Scientific™)來量測濃度，且蛋白質儲存於-20℃下。

使用2:1比率之合成RNA引導(Integrated DNA Technologies, IDT™)與多肽製備RNP。選擇與本文揭示之PAM序列相鄰之目標，且使用如本文所述之正向重複序列設計RNA引導。使RNP在37℃下在1X NEBuffer™ (NEB2；New England Biolabs®；50 mM NaCl、10 mM Tris-HCl、10 mM MgCl ₂、1 mM DTT，pH 7.9)中複合30分鐘。在複合之後，使用1X NEB2作為稀釋緩衝液，自5 μM至37.5 μM進行5點1:2連續稀釋。Apo反應(無RNA引導之多肽)以相同方式製備，用H ₂O補足RNA引導體積。

藉由PCR自寡核苷酸(Integrated DNA Technologies)來產生dsDNA目標受質。在PCR之前，正向引子之5'末端用IR800染料標記，如Yan等人, 2018中所述。使用Amplitaq Gold® (ThermoFisher Scientific™)，接著將dsDNA受質用IR800標記之正向引子及未經標記之反向引子擴增。所得到之dsDNA經DNA清潔及濃縮套組(Zymo)純化且藉由Nanodrop™ (ThermoFisher Scientific™)定量。

將RNP樣品及Apo (對照)樣品在1X結合緩衝液(50 mM NaCl、10 mM Tris-HCl、1 mM TCEP、10%甘油、2 mM EDTA，pH 8.0)加20 nM IR800標記之目標DNA受質中1:10稀釋且充分混合。將反應在37℃下培育1小時。將溴酚藍添加至反應中以目測染料前沿，接著將整個反應裝載至6% DNA阻滯凝膠(ThermoFisher Scientific™)上，在80V下操作90分鐘。凝膠在Licor® Odyssey® CLx上成像。

在此分析中，DNA遷移穿過凝膠之速率由其尺寸決定。僅DNA之樣品能夠遷移特定距離。然而，若RNP結合於DNA，則出現代表較大之移動較少之DNA複合物的條帶，其在凝膠上「上移」。

此實例展示變異RNP (變異二元複合物)對DNA目標之親和力(以產生三元複合物)如何與野生型RNP (野生型二元複合物)對DNA目標之親和力相比較。

實例7-藉由組合變異多肽靶向哺乳動物基因此實例描述使用藉由短暫轉染引入至哺乳動物細胞中之野生型及變異效應子(例如CRISPR核酸酶變異體)對在多個目標上之插入/缺失評估。

將SEQ ID NO: 3之野生型效應子(WT)及SEQ ID NO: 3之CRISPR核酸酶變異體個別選殖至pcda3.1主鏈(Invitrogen)中。接著最大製備質體且稀釋。選擇與本文揭示之PAM序列相鄰之目標，且使用如本文所述之正向重複序列設計RNA引導。RNA引導及目標序列展示於表5中。將RNA引導選殖至pUC19主鏈(New England Biolabs®)中。接著最大製備質體且稀釋。表5. 哺乳動物目標及對應crRNA.

目標標識符	PAM序列	目標序列	crRNA序列
EMX1	5'-ATTG-3'	CCGCCGCTTCCTGAGCCATC (SEQ ID NO: 16)	CUUGUUGUAUAUGUCCUUUUAUAGGUAUUAAACAACCCGCCGCUUCCUGAGCCAUC (SEQ ID NO: 17)
VEGFA	5'-TTTA-3'	TCCAGACCACCAATGGGCAC (SEQ ID NO: 18)	CUUGUUGUAUAUGUCCUUUUAUAGGUAUUAAACAACUCCAGACCACCAAUGGGCAC (SEQ ID NO: 19)
AAVS1	5'-TTTG-3'	TGAGAATGGTGCGTCCTAGG (SEQ ID NO: 20)	CUUGUUGUAUAUGUCCUUUUAUAGGUAUUAAACAACUGAGAAUGGUGCGUCCUAGG (SEQ ID NO: 28)

在轉染之前大約16小時，將DMEM/10% FBS+Pen/Strep (D10培養基)中之25,000個HEK293T細胞塗鋪至96孔盤之各孔中。在轉染當天，細胞70-90%匯合。對於待轉染之各孔，製備脂染胺2000™及Opti-MEM™之混合物且在室溫下培育5分鐘(溶液1)。在培育之後，添加脂染胺2000™:Opti-MEM™混合物至含有核酸酶質體、RNA引導質體及Opti-MEM™之獨立混合物(溶液2)中。在陰性對照之情況下，RNA引導質體不包括於溶液2中。藉由上下吸液混合溶液1及2，隨後在室溫下培育25分鐘。在培育之後，將溶液1及2混合物逐滴添加至含有細胞之96孔盤之各孔中。轉染後大約72小時，藉由將TrypLE™添加至各孔之中心且在37℃下培育大約5分鐘對細胞進行胰蛋白酶處理。隨後將D10培養基添加至各孔且混合以使細胞再懸浮。將再懸浮之細胞在500 g下離心10分鐘以獲得集結粒，且棄去上清液。接著使細胞集結粒再懸浮於QuickExtract™緩衝液(Lucigen®)中，且將細胞在65℃下培育15分鐘，在68℃下培育15分鐘，且在98℃下培育10分鐘。

藉由兩輪PCR製備用於下一代定序之樣品。第一輪(PCR1)用於擴增特定基因體區域，視目標而定。進行第2輪PCR (PCR2)以添加Illumina銜接子及索引。隨後彙集反應物且藉由管柱純化來純化。使用15循環NextSeq 500/550中或高輸出v2.5套組進行定序操作。

在相對於SEQ ID NO: 3之親本多肽各由單個精胺酸取代組成之經工程改造之首批三十一種變異體中，二十六種變異體展現與親本多肽相比增加之插入/缺失活性。遵循上文所描述之相同方法，以兩者、三者、四者及五者之組合進一步篩選七種效能最佳之點突變體。圖1-3中之結果展示與SEQ ID NO: 3之親本多肽相比取代P14R、E311R、D32R、I61R、G223R、N109R及/或D719R提高核酸酶活性。

進一步測試以下變異多肽在額外三種AAVS1、三種VEGFA及三種EMX1目標之插入/缺失活性：包含P14R、E311R及D32R取代之變異多肽；包含P14R、E311R及G223R取代之變異多肽；包含P14R、E311R、D32R及I61R取代之變異多肽；及包含D32R、N109R、E311R及D719R取代之變異多肽。跨越十二種目標平均之每種變異多肽之插入/缺失活性與親本多肽之插入/缺失活性相比高大約6至7倍。包含P14R、E311R、D32R及I61R取代之變異體使四種測試變異體對十二目標集之插入/缺失活性獲得最大增加。

實例8-藉由點變異多肽靶向哺乳動物基因此實例描述使用藉由短暫轉染引入至哺乳動物細胞中之野生型及變異效應子對在多個目標上之插入/缺失評估。如實例7中所描述，將相對於SEQ ID NO: 3各包含單個甘胺酸取代之79種變異體個別選殖至pcDNA3.1主鏈(Invitrogen)中。RNA引導及細胞轉染方案如實例7中所述。

以下十四種變異體展現與SEQ ID NO: 3之親本多肽相比在所有目標上增加之插入/缺失活性：K208G、D302G、D590G、E154G、D567G、L38G、D145G、C13G、T338G、P14G、D55G、K221G、K35G及E736G。變異多肽之插入/缺失活性展示於圖 4中。跨越三種測試目標平均之每種變異體之插入/缺失活性與親本多肽之插入/缺失活性相比高大約1.2至2.1倍。除D590G之外，十四種變異體中之每一種展現三種目標之插入/缺失活性增加，其效能類似於親本多肽在VEGFA目標處。E736G使所有測試變異體之插入/缺失活性獲得最大增加。

圖 1A展示跨越EMX1目標序列(SEQ ID NO: 16)、AAVS1目標序列(SEQ ID NO: 20)及VEGFA目標序列(SEQ ID NO: 18)，與野生型CRISPR核酸酶(WT；SEQ ID NO: 3)相比包含兩個或三個精胺酸取代之CRISPR核酸酶變異體的插入/缺失活性(原始插入/缺失%)。所示資料為兩種技術重複各自之兩個生物重複實驗的平均值。圖 1B展示跨越EMX1目標序列(SEQ ID NO: 16)、AAVS1目標序列(SEQ ID NO: 20)及VEGFA目標序列(SEQ ID NO: 18)，與野生型CRISPR核酸酶(WT；SEQ ID NO: 3)相比包含兩個、三個或四個精胺酸取代之CRISPR核酸酶變異體的插入/缺失活性(原始插入/缺失%)。所示資料為兩種技術重複各自之兩個生物重複實驗的平均值。圖 1C展示跨越EMX1目標序列(SEQ ID NO: 16)、AAVS1目標序列(SEQ ID NO: 20)及VEGFA目標序列(SEQ ID NO: 18)，與野生型CRISPR核酸酶(WT；SEQ ID NO: 3)相比包含兩個、三個或四個精胺酸取代之CRISPR核酸酶變異體的插入/缺失活性(原始插入/缺失%)。所示資料為兩種技術重複各自之兩個生物重複實驗的平均值。圖 2展示跨越EMX1目標序列(SEQ ID NO: 16)、AAVS1目標序列(SEQ ID NO: 20)及VEGFA目標序列(SEQ ID NO: 18)，與野生型CRISPR核酸酶(WT；SEQ ID NO: 3)相比包含單個甘胺酸取代之CRISPR核酸酶變異體的插入/缺失活性(原始插入/缺失%)。點線描繪在三個目標每一者下SEQ ID NO: 3之親本多肽之平均插入/缺失活性。所示資料為兩種技術重複各自之兩個生物重複實驗的平均值。


          <![CDATA[<110> 美商阿伯生物技術公司(ARBOR BIOTECHNOLOGIES, INC.)]]>
          <![CDATA[<120> 包含變異多肽之組合物及其用途]]>
          <![CDATA[<130> A2186-7046TW]]>
          <![CDATA[<140> TW 111108605]]>
          <![CDATA[<141> 2022-03-09]]>
          <![CDATA[<150> 63/294,224]]>
          <![CDATA[<151> 2021-12-28]]>
          <![CDATA[<150> 63/158,741]]>
          <![CDATA[<151> 2021-03-09]]>
          <![CDATA[<160> 28    ]]>
          <![CDATA[<170> PatentIn version 3.5]]>
          <![CDATA[<210> 1]]>
          <![CDATA[<211> 2235]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 未知物]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知物之描述：親本序列]]>
          <![CDATA[<400> 1]]>
          atgatcaagt ctattcagct gaaggtcaag ggggagtgtc cgatcacgaa ggatgtaatc       60
          aacgaataca aagaatacta taacaattgc agtgattgga ttaaaaacaa tctgacgtcc      120
          attaccatcg gggagatggc aaaatttctg caatcgttga gcgataaaga agtggcctat      180
          atctcaatgg gcctgtccga tgagtggaaa gacaaaccgt tatatcatct gtttaccaaa      240
          aaatatcaca ccaaaaatgc ggataactta ttatactact acattaaaga aaaaaatctg      300
          gacggctaca aaggcaatac gcttaatatc tccaatacat ctttccgcca gttcggttat      360
          ttcaaactcg tggtgagcaa ctaccgcact aaaatccgta cgctgaattg taaaatcaag      420
          cgtaagaaaa tcgatgccga ttccacgtct gaggatatcg aaatgcaggt gatgtacgaa      480
          attattaaat acagtttaaa taaaaagtct gattgggata acttcattag ctatatcgaa      540
          aacgttgaaa atcctaatat tgacaacatc aaccgctaca aactgctgcg cgaatgcttt      600
          tgcgaaaacg aaaacatgat taagaacaaa cttgaattgc tgtctgtgga acaattgaaa      660
          aaatttggcg gttgcatcat gaaacctcac attaatagca tgaccattaa cattcaagat      720
          tttaaaattg aggaaaaaga aaactctctg gggttcatcc tccacctccc actgaacaaa      780
          aaacagtatc aaattgaact cctgggcaat cgtcagatta aaaaaggcac caaagaaatt      840
          cacgaaacgt tagttgacat tactaacacc catggcgaaa acattgtgtt tactattaaa      900
          aatgataatc tgtatatcgt gttctcttat gagtccgaat ttgaaaaaga agaagttaac      960
          ttcgctaaaa cggttggcct ggacgtaaac ttcaaacatg ccttctttgt gacctctgag     1020
          aaagataact gtcatctcga cggttatatt aatctctaca aatacttatt ggagcacgac     1080
          gagtttacta accttctcac cgaagatgaa cgtaaagatt atgaggagct gagtaaagtc     1140
          gttactttct gcccgtttga aaatcagtta ctgtttgcgc gttacaacaa gatgagcaaa     1200
          ttctgcaaga aagaacaggt cctgagcaaa cttctctatg cgctgcagaa aaaactcaaa     1260
          gacgagaacc gcacgaaaga atatatttat gtctcgtgcg tgaacaaatt acgtgccaaa     1320
          tatgtgtcat attttattct gaaagaaaag tactacgaga agcagaaaga atatgacatc     1380
          gaaatgggct ttgtggacga ctcaacggaa agcaaagaat caatggataa acgccgtact     1440
          gaatatccgt ttcgcaacac gccggtagcc aacgaactgt tgtccaaact gaataacgta     1500
          cagcaggaca tcaacgggtg cctgaagaac atcatcaact acatttataa aattttcgag     1560
          cagaacggtt ataaagttgt cgccctcgaa aacctggaaa attctaattt tgaaaaaaaa     1620
          caggtgttgc cgacgattaa aagtctgctg aaatatcaca aactggagaa ccagaacgtg     1680
          aatgatatca aggcctctga caaagttaaa gaatatattg aaaacggtta ttatgaactc     1740
          atgaccaacg agaataacga aatcgttgat gcaaaatata cagaaaaggg cgcaatgaag     1800
          gtgaagaacg ccaatttttt taacctcatg atgaaaagtt tgcattttgc cagtgtgaaa     1860
          gatgagtttg tgctgctgtc caataatggc aagacgcaga ttgcattagt gccatccgag     1920
          tttacatctc agatggacag caccgatcac tgtctgtaca tgaagaagaa cgacaaaggt     1980
          aaactggtga aagcggataa aaaggaagtt cgtacaaaac aggaacgtca catcaacggc     2040
          ctcaacgccg atttcaacgc agcgaataat attaaatata tcgtggaaaa tgaagtgtgg     2100
          cgtggtattt tttgcactcg cccgaagaaa acagaatata acgtacccag tctggatacc     2160
          acgaaaaaag gtccgtctgc gattctcaac atgctgaaga aaattgaagc catcaaggtc     2220
          ctggaaacgg aaaaa                                                      2235
          <![CDATA[<210> 2]]>
          <![CDATA[<211> 2235]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 未知物]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知物之描述：親本序列]]>
          <![CDATA[<400> 2]]>
          atgatcaaga gcatccagct gaaggtgaag ggcgagtgcc ccatcaccaa ggacgtgatc       60
          aacgagtaca aggagtacta caacaactgt tctgattgga tcaagaacaa tctgaccagc      120
          atcacaatcg gcgagatggc caagtttctg cagagcctgt ccgacaagga ggtggcctac      180
          atctctatgg gcctgagcga cgagtggaag gataagcctc tgtatcacct gttcaccaag      240
          aagtaccaca caaagaatgc cgacaacctg ctgtactatt acatcaagga gaagaacctg      300
          gatggctaca agggcaatac cctgaacatc tccaatacat ctttcaggca gtttggctat      360
          ttcaagctgg tggtgtccaa ttacaggacc aagatccgca cactgaactg caagatcaag      420
          cgcaagaaga tcgacgccga ttctaccagc gaggacatcg agatgcaggt catgtatgag      480
          atcatcaagt actccctgaa caagaagtct gattgggata atttcatctc ttatatcgag      540
          aacgtggaga accccaatat cgataacatc aatcggtaca agctgctgag agagtgcttt      600
          tgtgagaacg agaatatgat caagaacaag ctggagctgc tgagcgtgga gcagctgaag      660
          aagttcggcg gctgtatcat gaagcctcac atcaacagca tgaccatcaa tatccaggac      720
          tttaagatcg aggagaagga gaattccctg ggcttcatcc tgcacctgcc actgaacaag      780
          aagcagtacc agatcgagct gctgggcaat cggcagatca agaagggcac caaggagatc      840
          cacgagacac tggtggacat caccaacaca cacggcgaga acatcgtgtt tacaatcaag      900
          aacgataatc tgtacatcgt gtttagctac gagtccgagt tcgagaagga ggaagtgaat      960
          tttgccaaga ccgtgggcct ggacgtgaac ttcaagcacg ccttctttgt gacatccgag     1020
          aaggacaatt gccacctgga tggctatatc aacctgtata agtacctgct ggagcacgat     1080
          gagttcacca acctgctgac agaggacgag cggaaggatt acgaggagct gtctaaggtg     1140
          gtgacctttt gccctttcga gaatcagctg ctgtttgcca gatataacaa gatgagcaag     1200
          ttctgtaaga aggagcaggt gctgtccaag ctgctgtacg ccctgcagaa gaagctgaag     1260
          gacgagaaca ggacaaagga gtatatctac gtgtcttgcg tgaataagct gcgcgccaag     1320
          tatgtgagct actttatcct gaaggagaag tattacgaga agcagaagga gtatgacatc     1380
          gagatgggct tcgtggacga ttctaccgag agcaaggagt ccatggataa gcggagaacc     1440
          gagtacccct ttaggaacac acctgtggcc aatgagctgc tgagcaagct gaacaatgtg     1500
          cagcaggata tcaacggctg tctgaagaac atcatcaatt acatctacaa gatcttcgag     1560
          cagaacggct acaaggtggt ggccctggag aacctggaga actccaattt cgagaagaag     1620
          caggtgctgc caacaatcaa gtctctgctg aagtatcaca agctggagaa ccagaatgtg     1680
          aacgacatca aggccagcga taaggtgaag gagtacatcg agaatggcta ttacgagctg     1740
          atgaccaacg agaacaatga gatcgtggac gccaagtata cagagaaggg cgccatgaag     1800
          gtgaagaatg ccaacttctt taacctgatg atgaagagcc tgcactttgc ctccgtgaag     1860
          gatgagttcg tgctgctgtc caacaatggc aagacccaga tcgccctggt gccatccgag     1920
          ttcacctctc agatggacag cacagatcac tgcctgtaca tgaagaagaa tgacaagggc     1980
          aagctggtga aggccgataa gaaggaggtg aggacaaagc aggagcgcca catcaacggc     2040
          ctgaatgccg actttaacgc cgccaacaat atcaagtata tcgtggagaa tgaagtgtgg     2100
          cggggcatct tctgtaccag accaaagaag acagagtaca acgtgccctc cctggatacc     2160
          acaaagaagg gcccctctgc catcctgaat atgctgaaga agatcgaggc catcaaggtg     2220
          ctggagaccg agaag                                                      2235
          <![CDATA[<210> 3]]>
          <![CDATA[<211> 745]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 未知物]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知物之描述：親本序列]]>
          <![CDATA[<400> 3]]>
          Met Ile Lys Ser Ile Gln Leu Lys Val Lys Gly Glu Cys Pro Ile Thr 
          1               5                   10                  15      
          Lys Asp Val Ile Asn Glu Tyr Lys Glu Tyr Tyr Asn Asn Cys Ser Asp 
                      20                  25                  30          
          Trp Ile Lys Asn Asn Leu Thr Ser Ile Thr Ile Gly Glu Met Ala Lys 
                  35                  40                  45              
          Phe Leu Gln Ser Leu Ser Asp Lys Glu Val Ala Tyr Ile Ser Met Gly 
              50                  55                  60                  
          Leu Ser Asp Glu Trp Lys Asp Lys Pro Leu Tyr His Leu Phe Thr Lys 
          65                  70                  75                  80  
          Lys Tyr His Thr Lys Asn Ala Asp Asn Leu Leu Tyr Tyr Tyr Ile Lys 
                          85                  90                  95      
          Glu Lys Asn Leu Asp Gly Tyr Lys Gly Asn Thr Leu Asn Ile Ser Asn 
                      100                 105                 110         
          Thr Ser Phe Arg Gln Phe Gly Tyr Phe Lys Leu Val Val Ser Asn Tyr 
                  115                 120                 125             
          Arg Thr Lys Ile Arg Thr Leu Asn Cys Lys Ile Lys Arg Lys Lys Ile 
              130                 135                 140                 
          Asp Ala Asp Ser Thr Ser Glu Asp Ile Glu Met Gln Val Met Tyr Glu 
          145                 150                 155                 160 
          Ile Ile Lys Tyr Ser Leu Asn Lys Lys Ser Asp Trp Asp Asn Phe Ile 
                          165                 170                 175     
          Ser Tyr Ile Glu Asn Val Glu Asn Pro Asn Ile Asp Asn Ile Asn Arg 
                      180                 185                 190         
          Tyr Lys Leu Leu Arg Glu Cys Phe Cys Glu Asn Glu Asn Met Ile Lys 
                  195                 200                 205             
          Asn Lys Leu Glu Leu Leu Ser Val Glu Gln Leu Lys Lys Phe Gly Gly 
              210                 215                 220                 
          Cys Ile Met Lys Pro His Ile Asn Ser Met Thr Ile Asn Ile Gln Asp 
          225                 230                 235                 240 
          Phe Lys Ile Glu Glu Lys Glu Asn Ser Leu Gly Phe Ile Leu His Leu 
                          245                 250                 255     
          Pro Leu Asn Lys Lys Gln Tyr Gln Ile Glu Leu Leu Gly Asn Arg Gln 
                      260                 265                 270         
          Ile Lys Lys Gly Thr Lys Glu Ile His Glu Thr Leu Val Asp Ile Thr 
                  275                 280                 285             
          Asn Thr His Gly Glu Asn Ile Val Phe Thr Ile Lys Asn Asp Asn Leu 
              290                 295                 300                 
          Tyr Ile Val Phe Ser Tyr Glu Ser Glu Phe Glu Lys Glu Glu Val Asn 
          305                 310                 315                 320 
          Phe Ala Lys Thr Val Gly Leu Asp Val Asn Phe Lys His Ala Phe Phe 
                          325                 330                 335     
          Val Thr Ser Glu Lys Asp Asn Cys His Leu Asp Gly Tyr Ile Asn Leu 
                      340                 345                 350         
          Tyr Lys Tyr Leu Leu Glu His Asp Glu Phe Thr Asn Leu Leu Thr Glu 
                  355                 360                 365             
          Asp Glu Arg Lys Asp Tyr Glu Glu Leu Ser Lys Val Val Thr Phe Cys 
              370                 375                 380                 
          Pro Phe Glu Asn Gln Leu Leu Phe Ala Arg Tyr Asn Lys Met Ser Lys 
          385                 390                 395                 400 
          Phe Cys Lys Lys Glu Gln Val Leu Ser Lys Leu Leu Tyr Ala Leu Gln 
                          405                 410                 415     
          Lys Lys Leu Lys Asp Glu Asn Arg Thr Lys Glu Tyr Ile Tyr Val Ser 
                      420                 425                 430         
          Cys Val Asn Lys Leu Arg Ala Lys Tyr Val Ser Tyr Phe Ile Leu Lys 
                  435                 440                 445             
          Glu Lys Tyr Tyr Glu Lys Gln Lys Glu Tyr Asp Ile Glu Met Gly Phe 
              450                 455                 460                 
          Val Asp Asp Ser Thr Glu Ser Lys Glu Ser Met Asp Lys Arg Arg Thr 
          465                 470                 475                 480 
          Glu Tyr Pro Phe Arg Asn Thr Pro Val Ala Asn Glu Leu Leu Ser Lys 
                          485                 490                 495     
          Leu Asn Asn Val Gln Gln Asp Ile Asn Gly Cys Leu Lys Asn Ile Ile 
                      500                 505                 510         
          Asn Tyr Ile Tyr Lys Ile Phe Glu Gln Asn Gly Tyr Lys Val Val Ala 
                  515                 520                 525             
          Leu Glu Asn Leu Glu Asn Ser Asn Phe Glu Lys Lys Gln Val Leu Pro 
              530                 535                 540                 
          Thr Ile Lys Ser Leu Leu Lys Tyr His Lys Leu Glu Asn Gln Asn Val 
          545                 550                 555                 560 
          Asn Asp Ile Lys Ala Ser Asp Lys Val Lys Glu Tyr Ile Glu Asn Gly 
                          565                 570                 575     
          Tyr Tyr Glu Leu Met Thr Asn Glu Asn Asn Glu Ile Val Asp Ala Lys 
                      580                 585                 590         
          Tyr Thr Glu Lys Gly Ala Met Lys Val Lys Asn Ala Asn Phe Phe Asn 
                  595                 600                 605             
          Leu Met Met Lys Ser Leu His Phe Ala Ser Val Lys Asp Glu Phe Val 
              610                 615                 620                 
          Leu Leu Ser Asn Asn Gly Lys Thr Gln Ile Ala Leu Val Pro Ser Glu 
          625                 630                 635                 640 
          Phe Thr Ser Gln Met Asp Ser Thr Asp His Cys Leu Tyr Met Lys Lys 
                          645                 650                 655     
          Asn Asp Lys Gly Lys Leu Val Lys Ala Asp Lys Lys Glu Val Arg Thr 
                      660                 665                 670         
          Lys Gln Glu Arg His Ile Asn Gly Leu Asn Ala Asp Phe Asn Ala Ala 
                  675                 680                 685             
          Asn Asn Ile Lys Tyr Ile Val Glu Asn Glu Val Trp Arg Gly Ile Phe 
              690                 695                 700                 
          Cys Thr Arg Pro Lys Lys Thr Glu Tyr Asn Val Pro Ser Leu Asp Thr 
          705                 710                 715                 720 
          Thr Lys Lys Gly Pro Ser Ala Ile Leu Asn Met Leu Lys Lys Ile Glu 
                          725                 730                 735     
          Ala Ile Lys Val Leu Glu Thr Glu Lys 
                      740                 745 
          <![CDATA[<210> 4]]>
          <![CDATA[<211> 36]]>
          <![CDATA[<212> RNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成寡核苷酸]]>
          <![CDATA[<400> 4]]>
          cuuguuguau auguccuuuu auagguauua aacaac                                 36
          <![CDATA[<210> 5]]>
          <![CDATA[<211> 36]]>
          <![CDATA[<212> RNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成寡核苷酸]]>
          <![CDATA[<400> 5]]>
          cuuguuguau auacgcuuuu auagguauua aacaac                                 36
          <![CDATA[<210> 6]]>
          <![CDATA[<211> 36]]>
          <![CDATA[<212> RNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成寡核苷酸]]>
          <![CDATA[<400> 6]]>
          cuuguuguau auacgcuuuu auagguauug aacaac                                 36
          <![CDATA[<210> 7]]>
          <![CDATA[<211> 36]]>
          <![CDATA[<212> RNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成寡核苷酸]]>
          <![CDATA[<400> 7]]>
          cuuguuguau auauccuuuu auagauauua aacagc                                 36
          <![CDATA[<210> 8]]>
          <![CDATA[<211> 36]]>
          <![CDATA[<212> RNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成寡核苷酸]]>
          <![CDATA[<400> 8]]>
          cuuguuguau auauccuuuu auagauguug aacaac                                 36
          <![CDATA[<210> 9]]>
          <![CDATA[<211> 36]]>
          <![CDATA[<212> RNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成寡核苷酸]]>
          <![CDATA[<400> 9]]>
          cuuguuguau auauccuuuu auagguguug aacaac                                 36
          <![CDATA[<210> 10]]>
          <![CDATA[<211> 36]]>
          <![CDATA[<212> RNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成寡核苷酸]]>
          <![CDATA[<400> 10]]>
          cuuguuguau auauccuuuu auggguguau aacaac                                 36
          <![CDATA[<210> 11]]>
          <![CDATA[<211> 37]]>
          <![CDATA[<212> RNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成寡核苷酸]]>
          <![CDATA[<400> 11]]>
          cuuguuguau auguccuuuu auagguauuu gaacaac                                37
          <![CDATA[<210> 12]]>
          <![CDATA[<211> 36]]>
          <![CDATA[<212> RNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成寡核苷酸]]>
          <![CDATA[<400> 12]]>
          cuuguuguau augucuuuuu auagguauug aacaac                                 36
          <![CDATA[<210> 13]]>
          <![CDATA[<211> 36]]>
          <![CDATA[<212> RNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成寡核苷酸]]>
          <![CDATA[<400> 13]]>
          cuuguugugu auauccuuuu auagguauug aacaac                                 36
          <![CDATA[<210> 14]]>
          <![CDATA[<211> 12]]>
          <![CDATA[<212> RNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成寡核苷酸]]>
          <![CDATA[<400> 14]]>
          cuuguuguru au                                                           12
          <![CDATA[<210> 15]]>
          <![CDATA[<211> 12]]>
          <![CDATA[<212> RNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成寡核苷酸]]>
          <![CDATA[<400> 15]]>
          uuuuaurgru ru                                                           12
          <![CDATA[<210> 16]]>
          <![CDATA[<211> 20]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 未知物]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知物之描述：EMX1哺乳動物目標序列]]>
          <![CDATA[<400> 16]]>
          ccgccgcttc ctgagccatc                                                   20
          <![CDATA[<210> 17]]>
          <![CDATA[<211> 56]]>
          <![CDATA[<212> RNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成寡核苷酸]]>
          <![CDATA[<400> 17]]>
          cuuguuguau auguccuuuu auagguauua aacaacccgc cgcuuccuga gccauc           56
          <![CDATA[<210> 18]]>
          <![CDATA[<211> 20]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 未知物]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知物之描述：VEGFA哺乳動物目標序列]]>
          <![CDATA[<400> 18]]>
          tccagaccac caatgggcac                                                   20
          <![CDATA[<210> 19]]>
          <![CDATA[<211> 56]]>
          <![CDATA[<212> RNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成寡核苷酸]]>
          <![CDATA[<400> 19]]>
          cuuguuguau auguccuuuu auagguauua aacaacucca gaccaccaau gggcac           56
          <![CDATA[<210> 20]]>
          <![CDATA[<211> 20]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 未知物]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知物之描述：AAVS1哺乳動物目標序列]]>
          <![CDATA[<400> 20]]>
          tgagaatggt gcgtcctagg                                                   20
          <![CDATA[<210> 21]]>
          <![CDATA[<211> 2235]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 未知物]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知物之描述：親本序列]]>
          <![CDATA[<400> 21]]>
          atgattaaat ccatccagct taaagtgaaa ggcgaatgcc ccatcaccaa agatgttatt       60
          aacgagtaca aggaatacta taataactgc agcgattgga taaaaaacaa tcttacctcg      120
          atcactattg gcgagatggc caagttcctg cagagcctgt ctgataagga ggttgcttac      180
          atttccatgg gcctgagcga cgagtggaaa gacaagccct tgtaccacct gttcactaag      240
          aaataccaca ctaagaatgc tgacaatctg ctctactact acatcaagga gaaaaacttg      300
          gatggctaca aggggaacac gcttaacatt tctaacacct catttcgtca gttcgggtat      360
          ttcaagctcg tggtgtccaa ctatcgcact aagattcgga cactcaactg caagattaaa      420
          cgaaagaaga tcgacgcaga ttctacgagc gaggatattg aaatgcaggt catgtatgaa      480
          atcatcaagt actctctgaa taagaagtct gactgggaca attttatcag ctacatcgaa      540
          aacgtagaga accctaacat agacaatatc aacaggtaca aactgcttag ggaatgcttc      600
          tgtgaaaacg agaatatgat aaaaaacaag ctggagctgc tgagcgtgga gcaattaaag      660
          aagtttggag ggtgtatcat gaaaccccac attaactcga tgacaattaa tattcaagac      720
          ttcaagatag aggagaaaga aaacagcttg ggctttattc tccatctccc tctgaataaa      780
          aaacagtacc agatcgagct attgggaaat agacagatta agaaagggac caaggaaatt      840
          cacgaaactc tcgtcgatat cacaaacacc catggagaga acatcgtgtt cacaatcaag      900
          aacgataatc tgtacatagt gtttagttat gagagcgagt tcgagaagga agaggtcaac      960
          tttgccaaga ctgttgggct tgacgtcaat ttcaaacacg cgttcttcgt gacaagcgaa     1020
          aaggacaact gccatctcga tggctacatt aacctatata agtatttgct cgaacacgac     1080
          gagtttacaa acctgctgac agaagatgag agaaaggact acgaagaact cagtaaggtc     1140
          gttacgttct gtccatttga aaatcagctg ctattcgccc ggtacaataa aatgtccaaa     1200
          ttctgtaaga aggaacaggt attgtctaaa ctgctgtatg ccctgcagaa aaagttgaaa     1260
          gatgagaatc ggaccaaaga gtatatctat gtctcatgcg tgaacaagct aagagctaag     1320
          tatgtttcct atttcatact gaaggagaag tactatgaga agcaaaagga gtacgacatt     1380
          gagatgggct tcgtcgatga ctcaaccgaa tctaaagaat ccatggacaa aaggcgcaca     1440
          gagtatccat ttagaaatac accggtggct aacgaactcc tgagtaaact caacaatgtt     1500
          caacaagata tcaacggttg tctgaagaat ataattaatt atatctataa gatttttgaa     1560
          cagaatggct acaaggtggt cgcactggaa aacttagaga attccaactt tgagaaaaag     1620
          caggtgcttc ctacaatcaa atcacttctg aagtaccaca aacttgagaa tcagaacgta     1680
          aatgatatca aagccagtga taaagtcaaa gaatacatcg agaatggtta ttatgaactg     1740
          atgactaatg aaaataatga aatagtggac gcaaaatata cggaaaaggg tgccatgaag     1800
          gtaaagaacg caaacttttt taatttgatg atgaagtcac tgcactttgc ttctgtgaag     1860
          gatgagtttg tcctgctgag caacaacgga aagacacaga ttgcgctagt gccttcagag     1920
          ttcactagtc agatggacag taccgaccat tgcctctaca tgaaaaaaaa tgacaaaggg     1980
          aaactcgtga aggctgacaa gaaagaggtg cggaccaagc aagagcgcca tatcaatgga     2040
          ttaaacgccg attttaacgc ggcaaataac atcaaataca tcgttgaaaa tgaggtgtgg     2100
          aggggtatct tctgtacccg accaaagaag actgagtaca acgtaccatc cttagacacc     2160
          accaaaaaag gaccctccgc cattctgaat atgttaaaga aaatcgaggc cataaaagtg     2220
          ttggagaccg agaag                                                      2235
          <![CDATA[<210> 22]]>
          <![CDATA[<211> 2235]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 未知物]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知物之描述：親本序列]]>
          <![CDATA[<400> 22]]>
          atgatcaaga gcattcagct gaaggtgaag ggcgagtgcc ccatcaccaa ggacgtgatc       60
          aacgagtaca aggagtacta caacaactgc agcgactgga ttaaaaacaa tctcacaagc      120
          atcaccatcg gcgagatggc caagttcctg cagagcctga gcgacaaaga ggtggcctac      180
          atcagcatgg gcctgagcga cgagtggaag gacaagcccc tgtaccacct gttcaccaag      240
          aagtaccaca ccaagaacgc cgacaacctg ctgtactact acatcaagga gaagaatctg      300
          gatggctaca agggcaatac cctgaacatc agcaacacca gcttcagaca gttcggctac      360
          ttcaagctgg tggtgagcaa ctacagaacc aagatcagaa ccctgaactg caagatcaag      420
          agaaagaaga tcgacgccga cagcacaagc gaggacatag agatgcaagt tatgtacgag      480
          atcatcaagt acagccttaa taaaaagagc gactgggaca acttcatcag ctacatagaa      540
          aacgtggaga accccaacat cgacaacatc aacagataca agctgctgag agagtgcttc      600
          tgcgagaacg agaacatgat caaaaacaaa ctcgaactgc tgagtgtaga acagctgaag      660
          aagttcggcg gctgcatcat gaagccccac atcaacagca tgaccatcaa catccaagac      720
          ttcaagatcg aggagaagga gaacagcctg ggcttcatcc tgcacctgcc cttaaacaag      780
          aagcagtatc agatcgagct gctgggcaac agacagatca agaagggcac caaggagatc      840
          cacgagaccc tggtggacat caccaacacc cacggcgaga atatcgtttt cactatcaag      900
          aacgacaacc tgtacatcgt gtttagctat gagagcgagt tcgagaagga agaggtgaac      960
          ttcgccaaga ccgtgggcct ggacgtgaac ttcaagcacg ccttcttcgt gacaagcgag     1020
          aaggacaact gccacctgga cggctacatc aatctgtaca agtacctgct ggagcacgac     1080
          gagttcacca acctgctgac cgaggacgag agaaaggact acgaggagct gagcaaggtg     1140
          gtgaccttct gccccttcga gaatcagctg ctgttcgcta gatacaacaa gatgagcaag     1200
          ttctgcaaga aggagcaagt gctgagcaaa ctgctgtacg ccctgcagaa gaagctgaag     1260
          gacgagaaca gaaccaagga gtatatctac gtgagctgcg tgaacaagct gagagccaag     1320
          tacgtgagct acttcatcct gaaggagaag tactacgaga agcagaagga gtacgacatc     1380
          gagatgggtt ttgtggacga cagcaccgag agcaaggaga gcatggacaa gagaagaacc     1440
          gagtacccct tcagaaacac ccccgtggcc aacgaattac tgtctaaact gaataacgtg     1500
          cagcaagaca tcaacggctg cctgaagaac ataatcaact acatctacaa gatcttcgag     1560
          cagaacggct acaaggtggt agccctggag aacctggaga acagcaactt cgagaagaag     1620
          caagtgctgc ccaccatcaa gagcctgctg aagtaccaca agctggagaa tcagaacgtg     1680
          aacgacatca aggctagcga caaggtgaag gagtacatcg agaacggata ctacgagctg     1740
          atgaccaacg agaacaacga gatcgtggac gccaagtaca ccgagaaggg cgccatgaag     1800
          gtgaagaacg ccaacttctt caacctgatg atgaagagcc tgcacttcgc tagcgtgaag     1860
          gacgagttcg tgctgctgtc gaacaacggc aagacacaga tcgccctggt gcctagcgag     1920
          ttcacatctc agatggacag caccgaccac tgcctgtaca tgaagaagaa cgacaagggc     1980
          aagctggtga aggccgacaa gaaagaggtg agaaccaagc aagagagaca catcaacggc     2040
          ctgaacgccg acttcaacgc cgccaacaac atcaagtaca tcgtggagaa cgaggtgtgg     2100
          agaggcatct tctgcacaag acccaagaag accgagtaca acgtgcctag cctggacacc     2160
          accaagaagg gccctagcgc catcctgaac atgctgaaga agatcgaggc catcaaggtg     2220
          ctggagaccg agaag                                                      2235
          <![CDATA[<210> 23]]>
          <![CDATA[<211> 2235]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 未知物]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知物之描述：親本序列]]>
          <![CDATA[<400> 23]]>
          atgatcaaga gcatccagct gaaggtgaag ggcgagtgcc ccatcaccaa ggacgtgatc       60
          aacgagtaca aggagtacta caacaactgc agcgactgga tcaagaacaa cctgaccagc      120
          atcaccatcg gcgagatggc caagttcctg cagagcctga gcgacaagga ggtggcctac      180
          atcagcatgg gcctgagcga cgagtggaag gacaagcccc tgtaccacct gttcaccaag      240
          aagtaccaca ccaagaacgc cgacaacctg ctgtactact acatcaagga gaagaacctg      300
          gacggctaca agggcaacac cctgaacatc agcaacacca gcttccggca gttcggctac      360
          ttcaagctgg tggtgagcaa ctaccggacc aagatccgga ccctgaactg caagatcaag      420
          cggaagaaga tcgacgccga cagcaccagc gaggacatcg agatgcaggt gatgtacgag      480
          atcatcaagt acagcctgaa caagaagagc gactgggaca acttcatcag ctacatcgag      540
          aacgtggaga accccaacat cgacaacatc aaccggtaca agctgctgcg ggagtgcttc      600
          tgcgagaacg agaacatgat caagaacaag ctggagctgc tgagcgtgga gcagctgaag      660
          aagttcggcg gctgcatcat gaagccccac atcaacagca tgaccatcaa catccaggac      720
          ttcaagatcg aggagaagga gaacagcctg ggcttcatcc tgcacctgcc cctgaacaag      780
          aagcagtacc agatcgagct gctgggcaac cggcagatca agaagggcac caaggagatc      840
          cacgagaccc tggtggacat caccaacacc cacggcgaga acatcgtgtt caccatcaag      900
          aacgacaacc tgtacatcgt gttcagctac gagagcgagt tcgagaagga ggaggtgaac      960
          ttcgccaaga ccgtgggcct ggacgtgaac ttcaagcacg ccttcttcgt gaccagcgag     1020
          aaggacaact gccacctgga cggctacatc aacctgtaca agtacctgct ggagcacgac     1080
          gagttcacca acctgctgac cgaggacgag cggaaggact acgaggagct gagcaaggtg     1140
          gtgaccttct gccccttcga gaaccagctg ctgttcgccc ggtacaacaa gatgagcaag     1200
          ttctgcaaga aggagcaggt gctgagcaag ctgctgtacg ccctgcagaa gaagctgaag     1260
          gacgagaacc ggaccaagga gtacatctac gtgagctgcg tgaacaagct gcgggccaag     1320
          tacgtgagct acttcatcct gaaggagaag tactacgaga agcagaagga gtacgacatc     1380
          gagatgggct tcgtggacga cagcaccgag agcaaggaga gcatggacaa gcggcggacc     1440
          gagtacccct tccggaacac ccccgtggcc aacgagctgc tgagcaagct gaacaacgtg     1500
          cagcaggaca tcaacggctg cctgaagaac atcatcaact acatctacaa gatcttcgag     1560
          cagaacggct acaaggtggt ggccctggag aacctggaga acagcaactt cgagaagaag     1620
          caggtgctgc ccaccatcaa gagcctgctg aagtaccaca agctggagaa ccagaacgtg     1680
          aacgacatca aggccagcga caaggtgaag gagtacatcg agaacggcta ctacgagctg     1740
          atgaccaacg agaacaacga gatcgtggac gccaagtaca ccgagaaggg cgccatgaag     1800
          gtgaagaacg ccaacttctt caacctgatg atgaagagcc tgcacttcgc cagcgtgaag     1860
          gacgagttcg tgctgctgag caacaacggc aagacccaga tcgccctggt gcccagcgag     1920
          ttcaccagcc agatggacag caccgaccac tgcctgtaca tgaagaagaa cgacaagggc     1980
          aagctggtga aggccgacaa gaaggaggtg cggaccaagc aggagcggca catcaacggc     2040
          ctgaacgccg acttcaacgc cgccaacaac atcaagtaca tcgtggagaa cgaggtgtgg     2100
          cggggcatct tctgcacccg gcccaagaag accgagtaca acgtgcccag cctggacacc     2160
          accaagaagg gccccagcgc catcctgaac atgctgaaga agatcgaggc catcaaggtg     2220
          ctggagaccg agaag                                                      2235
          <![CDATA[<210]]>> 24]]&gt;
          <br/>&lt;![CDATA[&lt;211&gt; 2235]]&gt;
          <br/>&lt;![CDATA[&lt;212&gt; DNA]]&gt;
          <br/>&lt;![CDATA[&lt;213&gt; 未知物]]&gt;
          <br/>
          <br/>&lt;![CDATA[&lt;220&gt;]]&gt;
          <br/>&lt;![CDATA[&lt;223&gt; 未知物之描述：親本序列]]&gt;
          <br/>
          <br/>&lt;![CDATA[&lt;400&gt; 24]]&gt;
          <br/><![CDATA[atgattaaaa gtatacagct taaggtcaag ggcgagtgcc cgattaccaa agatgtaatt       60
          aacgagtaca aggagtatta caataactgt tctgactgga tcaagaacaa tctgacttca      120
          attacgatcg gtgaaatggc caaatttctc cagtccttga gtgataagga ggtcgcatat      180
          atatccatgg gactcagtga cgagtggaag gacaaacccc tgtaccatct ttttactaaa      240
          aaataccata cgaaaaacgc agacaacctg ctgtactact atataaaaga aaaaaacctg      300
          gacggttaca agggcaacac cctcaatatt agcaacacta gtttccgaca attcgggtac      360
          ttcaagctgg tcgtgagcaa ctatcggacc aaaatcagga ctttgaattg taagataaag      420
          agaaagaaga tagacgcaga ttctactagt gaggatatcg agatgcaggt aatgtacgag      480
          atcattaagt attcactgaa caagaagagc gattgggata acttcatatc atacatcgaa      540
          aacgttgaaa atccaaacat cgacaatatt aatagataca aactgttgag agaatgcttc      600
          tgcgaaaacg aaaatatgat aaaaaacaaa ctcgaattgt tgtcagttga acagctgaag      660
          aaattcggag ggtgcataat gaagcctcac ataaactcaa tgacaataaa catccaagac      720
          ttcaagatag aagagaagga gaacagtttg ggttttattc ttcacctgcc tttgaacaag      780
          aagcaatacc aaatcgagct gctcggaaat aggcagataa aaaaggggac aaaagaaata      840
          cacgaaaccc ttgttgacat tacgaacaca cacggggaaa atatcgtgtt cacaattaaa      900
          aatgacaacc tttacattgt attttcttat gaatcagagt tcgaaaagga agaagtgaac      960
          tttgccaaga ccgttggttt ggacgtcaac tttaaacacg ccttcttcgt tacatcagaa     1020
          aaggataact gtcatcttga tggatacata aacctctaca agtatcttct tgaacacgac     1080
          gaattcacaa acctgcttac tgaagacgag cgaaaggatt acgaggagtt gtcaaaggta     1140
          gtcacattct gtccattcga aaatcagctg ttgtttgcca ggtacaataa gatgtctaaa     1200
          ttctgtaaaa aagaacaagt cctcagcaaa ctgctgtatg cactgcaaaa gaaacttaag     1260
          gacgaaaata ggactaagga gtatatatac gtttcatgcg ttaataaact ccgggcgaaa     1320
          tatgtgagtt attttattct gaaggagaag tattatgaga agcagaaaga gtacgacata     1380
          gaaatgggat ttgtggatga cagtacggag agcaaagaaa gcatggacaa aagaaggacc     1440
          gaatatccat ttcgaaatac tccagtcgcg aatgagctgc tgagcaaact taacaatgtc     1500
          cagcaggaca ttaacggttg cctgaagaac ataatcaact acatatataa gatatttgag     1560
          caaaacggat acaaagtggt tgcacttgaa aacctcgaga attcaaattt cgaaaagaag     1620
          caagttttgc ccacgattaa aagtctcttg aaataccata agctcgaaaa tcagaatgtg     1680
          aacgatatca aggcctcaga taaggtcaag gagtacatcg aaaatggata ttacgagctg     1740
          atgacgaacg agaataacga aatcgtcgat gcgaagtaca cagaaaaggg ggctatgaag     1800
          gtgaaaaacg ccaatttttt taatttgatg atgaagtcct tgcatttcgc ctcagtcaaa     1860
          gatgagtttg ttctcctgag taataatggg aaaacacaga tagccttggt tccttcagag     1920
          ttcacgtctc agatggactc aactgatcat tgtctttata tgaagaaaaa tgataaaggg     1980
          aaactggtca aggccgataa gaaagaggtg cgcacgaaac aagaaagaca catcaacggc     2040
          ctcaacgccg attttaacgc agctaacaat attaaatata tcgtagagaa tgaggtctgg     2100
          aggggcattt tttgcacccg acccaagaag actgaataca atgtccctag tctcgatacg     2160
          accaaaaagg ggccatcagc tatactgaat atgttgaaaa agattgaggc gattaaagtc     2220
          ctggaaaccg agaaa                                                      2235
          <![CDATA[<210> 25]]>
          <![CDATA[<211> 2235]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 未知物]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知物之描述：親本序列]]>
          <![CDATA[<400> 25]]>
          atgatcaaga gcatccagct gaaggtgaag ggagaatgtc ctatcacaaa ggacgtgatc       60
          aacgagtaca aggagtacta caacaactgc agcgattgga tcaagaacaa cctgaccagc      120
          atcaccatcg gcgagatggc caagttcctg cagtctctgt ccgataagga agtcgcctac      180
          atcagcatgg gcttgagcga cgaatggaag gacaaacccc tgtaccatct gttcactaag      240
          aagtaccaca ccaagaacgc cgataacctg ctgtactact acatcaagga aaagaacctg      300
          gacggctaca agggcaatac cctgaacatc agtaacacca gcttccggca gtttggctat      360
          tttaaactgg tggtcagcaa ctacagaacc aagatcagaa cactgaactg caagatcaag      420
          aggaagaaaa tcgacgccga ctccaccagc gaagatatag agatgcaggt gatgtacgag      480
          atcattaagt actccctgaa taagaagtct gactgggaca acttcatcag ctacatcgag      540
          aacgtggaaa accccaacat tgacaatatc aacagataca agctgctgcg ggaatgcttc      600
          tgcgagaatg aaaacatgat caagaacaag ctggagcttc tgagcgtgga gcagctgaag      660
          aaattcggcg gatgtatcat gaagccacac atcaatagca tgaccatcaa catccaggac      720
          ttcaaaattg aagaaaagga gaatagccta ggcttcatcc tgcacctgcc tctgaacaag      780
          aaacagtacc agatcgagct gctgggcaac cggcaaatca agaagggcac caaggagatc      840
          cacgagacac tggtcgacat cacaaacaca cacggcgaaa acatcgtgtt caccatcaag      900
          aacgacaacc tgtacatcgt gttcagctac gagtctgaat tcgagaagga agaggtcaac      960
          ttcgctaaga cagtgggcct ggacgtgaac ttcaagcacg ccttcttcgt gaccagcgag     1020
          aaagacaact gtcacctgga cgggtacatc aacctgtaca agtacctgct ggaacacgac     1080
          gagttcacca acctcctgac cgaagatgaa cggaaggatt acgaggagct gtctaaggtg     1140
          gtgacattct gccctttcga gaaccagctg ctcttcgcca gatataacaa gatgagcaag     1200
          ttttgtaaaa aggagcaggt gctcagcaag ctactgtacg ccctgcagaa gaagctgaag     1260
          gacgagaaca gaaccaagga atacatctac gtgagctgcg tgaacaagct gagagccaag     1320
          tacgtgtcct atttcatcct gaaggaaaaa tactacgaga aacagaaaga gtacgacatc     1380
          gagatgggat ttgtggacga cagcaccgaa agcaaggaat ctatggacaa gcgcagaacc     1440
          gagtatccat ttagaaacac ccctgtggcc aatgagctgc tgtccaaact gaacaacgtg     1500
          cagcaggata tcaatggctg cctgaaaaac atcatcaact acatttacaa gatctttgag     1560
          caaaacggct acaaagtggt ggccctggag aacctggaaa actccaactt cgagaagaag     1620
          caagtgctgc ccacaatcaa gagcctgctg aagtaccata agctggaaaa tcagaatgtg     1680
          aacgacataa aggcctctga taaggtgaag gaatacatcg aaaatggcta ttacgagctg     1740
          atgaccaacg aaaataacga gattgtggac gctaaataca ccgagaaggg cgctatgaaa     1800
          gtgaaaaacg ctaacttttt taacctgatg atgaagagcc tgcacttcgc cagcgtgaag     1860
          gacgagttcg tgctgctgag caacaacggc aagacacaga tcgccctggt gcccagcgag     1920
          ttcaccagtc agatggattc tacagatcac tgcctgtaca tgaaaaagaa tgataaggga     1980
          aagttagtga aagccgataa gaaggaggtg cggaccaaac aggagagaca catcaacggc     2040
          ctgaacgctg acttcaacgc cgccaacaac atcaaataca tcgttgagaa tgaggtgtgg     2100
          cggggcatct tctgcaccag acctaagaaa acagagtata atgtgcctag cctggacacc     2160
          accaagaagg gtcctagcgc catcctgaac atgctgaaga agatcgaggc catcaaggtt     2220
          ctggaaaccg agaag                                                      2235
          <![CDATA[<210> 26]]>
          <![CDATA[<211> 2235]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 未知物]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知物之描述：親本序列]]>
          <![CDATA[<400> 26]]>
          atgatcaaat caattcagct taaggtgaag ggcgagtgtc ccattactaa agacgtcatt       60
          aacgaataca aggagtatta caataactgt agcgactgga tcaagaacaa tttgacatct      120
          atcacaattg gggagatggc caaatttttg cagagcctta gcgacaaaga ggtcgcctac      180
          atctctatgg ggctctccga cgagtggaag gacaagccgt tgtaccacct gttcacaaaa      240
          aagtatcaca caaagaatgc agacaatttg ctgtactact acattaagga gaaaaacctt      300
          gatggctata aaggaaacac cctcaacatc tctaacacct cttttagaca gttcggctac      360
          tttaagctgg tggtgagcaa ctatagaacc aagattagga ctctgaattg taagatcaaa      420
          aggaagaaaa tcgacgctga ttctacctct gaagatattg agatgcaagt catgtatgag      480
          atcatcaagt attcactgaa caagaagagt gattgggaca actttatttc ctacatagag      540
          aacgtggaga atcccaatat cgataatata aaccgatata agttgctgcg ggagtgcttt      600
          tgtgaaaatg agaacatgat taaaaacaag ttggaactct tgtcagtaga acagcttaaa      660
          aagttcggcg gctgcatcat gaagcctcat atcaacagca tgacaattaa tatccaagat      720
          tttaagatcg aggagaagga aaacagtttg gggtttattt tgcaccttcc actcaataag      780
          aaacagtacc agatcgagct tctggggaat cggcagatta agaaagggac caaagagata      840
          catgaaactc tggttgatat cacaaatacc catggcgaaa atattgtctt taccatcaag      900
          aatgacaacc tgtatatcgt gttttcttat gagtccgaat tcgagaagga agaggtgaac      960
          tttgccaaga cagtggggtt ggatgtcaat tttaagcatg ccttctttgt tacctctgaa     1020
          aaagataact gccatctgga tggatacatc aatctctata agtatctgct tgagcacgat     1080
          gagttcacaa atctgctgac cgaggacgag agaaaggact acgaagaatt gtccaaggtg     1140
          gttactttct gcccattcga aaatcagctg ctgttcgcaa gatacaacaa aatgtctaaa     1200
          ttctgtaaaa aagagcaggt cctgtctaaa cttctgtatg ctctgcagaa aaaactcaaa     1260
          gacgaaaacc gcacaaaaga gtacatttac gtaagctgcg tcaataaatt gagggccaag     1320
          tatgtttctt atttcatcct taaagagaaa tactacgaga agcagaagga gtacgacata     1380
          gagatggggt ttgtagacga ttctacggag tctaaggaat ctatggacaa acggcgcaca     1440
          gagtacccct ttaggaatac ccctgtcgct aatgagttgc tctctaagct gaacaatgtc     1500
          caacaggata ttaatggctg cttgaagaac ataataaatt atatttataa aatctttgag     1560
          cagaacggct acaaagttgt tgctctggag aaccttgaga acagcaactt tgaaaagaag     1620
          caggtactgc ctactattaa gtctctgctg aaatatcata agctggaaaa ccaaaatgtc     1680
          aacgacatca aggcctccga caaagtgaaa gagtacatcg agaacggata ctacgagctg     1740
          atgactaatg agaataacga gattgtcgac gcgaaatata ccgaaaaggg cgctatgaag     1800
          gtgaagaatg ctaatttctt caacttgatg atgaagagcc tccattttgc ttctgtgaag     1860
          gatgagtttg tgctgttgag taacaacggg aagacccaga tcgcactggt cccgtccgag     1920
          tttacctccc agatggactc tacagatcac tgcttgtaca tgaagaaaaa cgataaaggt     1980
          aagttggtga aagcagataa gaaagaggtg cgaacaaagc aggagagaca tatcaacgga     2040
          ctgaacgcag attttaacgc tgctaataat attaaatata ttgttgagaa cgaagtgtgg     2100
          cggggaattt tctgcaccag accgaaaaaa acagaatata atgtcccgtc cctcgacact     2160
          actaaaaaag gcccttctgc gatcctgaac atgcttaaaa agattgaagc gatcaaggtg     2220
          ttggagactg agaag                                                      2235
          <![CDATA[<210> 27]]>
          <![CDATA[<211> 2235]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 未知物]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 未知物之描述：親本序列]]>
          <![CDATA[<400> 27]]>
          atgatcaaga gcattcagct gaaagtgaag ggcgagtgtc ccatcactaa ggacgttatc       60
          aacgagtaca aggagtacta taacaactgc tctgactgga ttaagaataa cctgaccagt      120
          atcaccatcg gcgagatggc caagttcctg cagagcctga gcgacaagga ggtggcctac      180
          atcagtatgg ggctgtccga tgagtggaaa gacaagccac tgtatcatct gttcaccaaa      240
          aagtaccaca ccaaaaatgc cgataacctg ctgtactatt atatcaaaga aaaaaacctg      300
          gacgggtaca aaggcaacac cctgaacatc agcaatacaa gtttccgcca gtttggatac      360
          ttcaagctgg tcgtgtcaaa ttacagaacc aaaatcagaa ccctgaactg caagatcaaa      420
          aggaagaaga tcgacgctga cagcaccagc gaggacattg agatgcaggt gatgtacgag      480
          attattaaat actccctgaa caagaagagt gattgggaca atttcatttc ctacatcgag      540
          aatgtggaga accctaacat cgataacata aatcggtaca aactgctgag agagtgcttt      600
          tgcgagaacg aaaatatgat aaagaacaag ctggagctgc tcagcgtgga acagctgaaa      660
          aaatttggag gctgcattat gaagccccac atcaactcaa tgactatcaa tatccaggac      720
          ttcaagatcg aagagaagga gaactccctg ggcttcattc tgcatctgcc actgaataag      780
          aagcagtatc agatcgaact gctgggaaat aggcagatca agaaggggac caaagagatc      840
          cacgaaactc tggtggacat tactaatact cacggggaga acattgtgtt caccattaag      900
          aacgataatc tgtacatcgt gttcagctat gaaagcgagt ttgagaagga agaggtgaac      960
          ttcgccaaga ccgtcgggct ggatgtgaat tttaagcacg ccttctttgt gaccagcgaa     1020
          aaggataact gccacctgga cggatacatc aatctgtaca agtatctgct ggagcacgac     1080
          gaatttacca atctgctgac cgaggacgag aggaaggact acgaagagct ctccaaggtg     1140
          gtgacatttt gtccattcga gaaccagctg ctgttcgcca gatacaacaa gatgtctaaa     1200
          ttttgcaaaa aagaacaggt cctgagcaag ctgctgtacg ccctgcagaa gaaactgaag     1260
          gacgagaaca gaactaagga gtacatctat gtgagctgtg tgaataaact gagagcaaaa     1320
          tacgtgtctt actttattct gaaggagaag tattacgaga agcagaagga atacgacatc     1380
          gagatgggct tcgtggacga ttccacagag agcaaggaaa gcatggataa aaggcgcact     1440
          gaatacccct tcagaaacac acctgtggcc aatgagctgc tgtccaagct gaacaacgtg     1500
          cagcaggaca tcaacggctg cctgaagaac atcatcaact acatttataa gatcttcgag     1560
          cagaatggct acaaagtggt ggcactggag aacctggaga actccaattt tgaaaagaaa     1620
          caggtgctgc ccaccattaa gagcctgctt aaataccata agctggagaa ccagaacgtg     1680
          aatgatatca aagccagcga taaggtcaaa gagtacatcg agaacggata ttatgagctg     1740
          atgaccaacg agaacaatga gatcgtggac gccaaatata ccgagaaggg cgccatgaag     1800
          gtgaagaacg ccaacttctt taacctgatg atgaagtccc ttcactttgc ctccgtgaag     1860
          gatgagttcg tgctgctgag caacaacggc aagacccaga tcgccctggt gccctctgaa     1920
          ttcaccagcc agatggattc aaccgaccac tgtctctaca tgaagaagaa cgacaagggc     1980
          aagctggtga aggccgacaa gaaagaggtg cgcacaaagc aggagcggca catcaatggc     2040
          ctgaacgctg atttcaacgc cgcaaacaac attaagtaca tcgtggagaa tgaggtgtgg     2100
          agaggtattt tctgcacccg ccccaagaag accgagtata atgtgccctc tctggacacc     2160
          accaaaaaag gcccaagcgc tatcctgaat atgttgaaga aaatcgaggc catcaaggtg     2220
          ctggaaaccg agaag                                                      2235
          <![CDATA[<210> 28]]>
          <![CDATA[<211> 56]]>
          <![CDATA[<212> RNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成寡核苷酸]]>
          <![CDATA[<400> 28]]>
          cuuguuguau auguccuuuu auagguauua aacaacugag aauggugcgu ccuagg           56

Claims

一種變異多肽，其相對於SEQ ID NO: 3之親本多肽包含改變，且其中該改變為表2之取代。
如請求項1之變異多肽，其中該取代為P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及/或D719R取代。
如請求項1或2之變異多肽，其中該變異多肽包含a) P14R取代、E311R取代及D32R取代；b) P14R取代、E311R取代及G223R取代；c) P14R取代、E311R取代、D32R取代及I61R取代；或d) D32R取代、N109R取代、E311R取代及D719R取代。
如請求項1至3中任一項之變異多肽，其中該變異多肽進一步包含K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。
一種變異多肽，其包含與SEQ ID NO: 3具有至少95%一致性且相對於SEQ ID NO: 3包含位置P14、E311、D32、I61、G223、N109及D719中之一或多處之取代的胺基酸序列。
一種變異多肽，其包含與SEQ ID NO: 3具有至少95%一致性且包含以下取代中之一或多者的胺基酸序列：P14R、E311R、D32R、I61R、G223R、N109R及D719R。
一種變異多肽，其包含與SEQ ID NO: 3具有至少95%一致性且相對於SEQ ID NO: 3包含位置K208、D302、D590、E154、D567、L38、D145、C13、T338、P14、D55、K221、K35及E736中之一或多處之取代的胺基酸序列。
一種變異多肽，其包含與SEQ ID NO: 3具有至少95%一致性且包含以下取代中之一或多者的胺基酸序列：K208G、D302G、D590G、E154G、D567G、L38G、D145G、C13G、T338G、P14G、D55G、K221G、K35G及E736G。
如請求項1至8中任一項之變異多肽，其中該變異多肽包含P14處之取代(例如，P14R取代)。
如請求項1至9中任一項之變異多肽，其中該變異多肽包含E311處之取代(例如，E311R取代)。
如請求項1至10中任一項之變異多肽，其中該變異多肽包含D32處之取代(例如，D32R取代)。
如請求項1至11中任一項之變異多肽，其中該變異多肽包含I61處之取代(例如，I61R取代)。
如請求項1至12中任一項之變異多肽，其中該變異多肽包含G223處之取代(例如，G223取代)。
如請求項1至13中任一項之變異多肽，其中該變異多肽包含N109處之取代(例如，N109R取代)。
如請求項1至14中任一項之變異多肽，其中該變異多肽包含D719處之取代(例如，D719R取代)。
如請求項5之變異多肽，其中該變異多肽包含以下位置處之取代：P14 (例如，P14R取代)、E311 (例如，E311R取代)、D32 (例如，D32R取代)、I61 (例如，I61R取代)、G223 (例如，G223取代)、N109 (例如，N109R取代)、D719 (例如，D719R取代)或其任何組合。
如請求項16之變異多肽，其中該變異多肽相對於SEQ ID NO: 3包含位置P14 (例如，P14R取代)、E311 (例如，E311R)及D32 (例如，D32R取代)處之取代(例如，P14R、E311R、D32R變異多肽)。
如請求項16之變異多肽，其中該變異多肽相對於SEQ ID NO: 3包含位置P14 (例如，P14R取代)、E311 (例如，E311R)及G223 (例如，G223R取代)處之取代(例如，P14R、E311R、G223R變異多肽)。
如請求項16之變異多肽，其中該變異多肽相對於SEQ ID NO: 3包含位置P14 (例如，P14R取代)、E311 (例如，E311R)、D32 (例如，D32R取代)及I61 (例如，I61R取代)處之取代(例如，P14R、E311R、D32R及I61R變異多肽)。
如請求項16之變異多肽，其中該變異多肽相對於SEQ ID NO: 3包含位置D32R (例如，D32R取代)、N109 (例如，N109R)、E311 (例如，E311R取代)及D719 (例如，D719R取代)處之取代(例如，D32R、N109R、E311R及D719R變異多肽)。
如請求項5至20中任一項之變異多肽，其中該變異多肽包含以下各處之取代：K208 (例如，K208G取代)、D302 (例如，D302G取代)、D590 (例如，D590G取代)、E154 (例如，E154G取代)、D567 (例如，D567G取代)、L38 (例如，L38G取代)、D145 (例如，D145G取代)、C13 (例如，C13G取代)、T338 (例如，T338G取代)、P14 (例如，P14G取代)、D55 (例如，D55G取代)、K221 (例如，K221G取代)、K35 (例如，K35G取代)及E736 (例如，E736G取代)或其任何組合。
如請求項1至21中任一項之變異多肽，其中相對於親本多肽，該變異多肽展現增加之與RNA引導之二元複合物形成。
如請求項1至22中任一項之變異多肽，其中相對於親本二元複合物，包含該變異多肽之二元複合物展現增加之穩定性。
如請求項1至23中任一項之變異多肽，其中相對於親本多肽，該變異多肽展現增加之核酸酶活性。
一種組合物，其包含如請求項1至24中任一項之變異多肽，其中該組合物進一步包含RNA引導或編碼該RNA引導之核酸，其中該RNA引導包含正向重複序列及間隔子序列。
如請求項25之組合物，其中該正向重複序列與SEQ ID NO: 4-13中之任一者至少90%一致或包含與SEQ ID NO: 14或SEQ ID NO: 15具有至少90%一致性之序列。
如請求項25之組合物，其中該正向重複序列與SEQ ID NO: 4-13中之任一者至少95%一致或包含與SEQ ID NO: 14或SEQ ID NO: 15具有至少95%一致性之序列。
如請求項25之組合物，其中該正向重複序列為SEQ ID NO: 4-13中之任一者或包含SEQ ID NO: 14或SEQ ID NO: 15之序列。
如請求項25至28中任一項之組合物，其中該間隔子序列之長度包含約15個核苷酸至約35個核苷酸。
如請求項25至29中任一項之組合物，其中該間隔子序列結合於目標核酸之目標股序列，且其中該目標核酸序列之非目標股序列與原間隔子相鄰模體(PAM)序列相鄰。
如請求項30之組合物，其中該PAM序列為5'-TTR-3'、5'-NTTR-3'、5'-NTTN-3'、5'-RTTR-3'、5'-ATTR-3'或5'-RTTG-3'，其中N為任何核苷酸，Y為C或T，且R為A或G。
如請求項31之組合物，其中該PAM序列為5'-TTG-3'、5'-TTA-3'、5'-ATTG-3'、5'-TTTA-3'或5'-TTTG-3'。
如前述請求項中任一項之變異多肽或組合物，其中該變異多肽進一步包含核定位信號(NLS)。
如前述請求項中任一項之變異多肽或組合物，其中該變異多肽進一步包含肽標籤、螢光蛋白、鹼基編輯域、DNA甲基化域、組蛋白殘基修飾域、定位因子、轉錄修飾因子、光閘控控制因子、化學誘導因子或染色質目測因子。
一種組合物，其包含編碼如前述請求項中任一項之變異多肽及/或RNA引導之核酸。
如請求項35之組合物，其中該核酸經密碼子優化以在細胞中表現。
如請求項35或36之組合物，其中該核酸可操作地連接於啟動子。
如請求項35至37中任一項之組合物，其中該核酸在載體中。
如請求項38之組合物，其中該載體包含反轉錄病毒載體、慢病毒載體、噬菌體載體、腺病毒載體、腺相關載體或單純疱疹載體。
如前述請求項中任一項之變異多肽或組合物，其中該變異多肽存在於包含奈米粒子(例如脂質奈米粒子)、脂質體、胞外體、微囊泡或基因槍之遞送系統中。
一種細胞，其包含如前述請求項中任一項之變異多肽或組合物。
如請求項41之細胞，其中該細胞為真核細胞。
如請求項41或42之細胞，其中該細胞為哺乳動物細胞或植物細胞。
如請求項41至43中任一項之細胞，其中該細胞為人類細胞。
一種組合物，其包含變異多肽或包含有該變異多肽之複合物，其中該變異多肽相對於SEQ ID NO: 3之親本多肽包含改變，且其中相對於親本多肽或包含該親本多肽之複合物，該變異多肽或該複合物展現增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性。
如請求項45之組合物，其中該改變為表2之取代。
如請求項46之組合物，其中該取代為P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及/或D719R取代。
如請求項46或47之組合物，其中該變異多肽包含a) P14R取代、E311R取代及D32R取代；b) P14R取代、E311R取代及G223R取代；c) P14R取代、E311R取代、D32R取代及I61R取代；或d) D32R取代、N109R取代、E311R取代及D719R取代。
如請求項47或48之組合物，其中該變異多肽進一步包含K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。
如請求項45至49中任一項之組合物，其中該增強之酶活性為增強之核酸酶活性。
如請求項45至50中任一項之組合物，其中相對於該親本多肽，該變異多肽展現增強之與RNA引導之結合活性。
如請求項45至51中任一項之組合物，其中相對於該親本多肽，該變異多肽展現增強之與RNA引導之結合特異性。
如請求項45至52中任一項之組合物，其中包含該變異多肽之該複合物為進一步包含RNA引導之變異二元複合物，且相對於親本二元複合物，該變異二元複合物展現增強之與目標核酸之結合活性(例如正中目標結合活性)。
如請求項45至53中任一項之組合物，其中包含該變異多肽之該複合物為進一步包含RNA引導之變異二元複合物，且相對於親本二元複合物，該變異二元複合物展現增強之與目標核酸之結合特異性(例如正中目標結合特異性)。
如請求項45至54中任一項之組合物，其中包含該變異多肽之該複合物為進一步包含RNA引導之變異二元複合物，且相對於親本二元複合物，該變異二元複合物展現增強之穩定性。
如請求項45至55中任一項之組合物，其中該變異二元複合物與目標核酸形成變異三元複合物，且相對於親本三元複合物，該變異三元複合物展現增加之穩定性。
如請求項45至56中任一項之組合物，其中相對於該親本多肽，該變異多肽進一步展現增強之二元複合物形成、增強之蛋白質-RNA相互作用及/或減少之自RNA引導之解離。
如請求項45至57中任一項之組合物，其中相對於該親本二元複合物，該變異二元複合物進一步展現減少之自目標核酸之解離，及/或減少之與非目標核酸之偏離目標結合。
如請求項45至58中任一項之組合物，其中該增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在例如20℃至65℃之溫度範圍內發生。
如請求項45至59中任一項之組合物，其中該增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在一定培育時間範圍內發生。
如請求項45至60中任一項之組合物，其中該增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在具有在約7.3至約8.6範圍內之pH值的緩衝液中發生。
如請求項45至61中任一項之組合物，其中當該變異多肽、變異二元複合物或變異三元複合物之T _m值比該親本多肽、親本二元複合物或親本三元複合物之T _m值大至少8℃時，發生該增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性。
如請求項45至62中任一項之組合物，其中該變異多肽包含RuvC域或分開RuvC域。
如請求項45至63中任一項之組合物，其中該親本多肽包含SEQ ID NO: 3之序列。
如請求項45至64中任一項之組合物，其中該RNA引導包含正向重複序列及間隔子序列。
如請求項65之組合物，其中該正向重複序列與SEQ ID NO: 4-13中之任一者至少90%一致或包含與SEQ ID NO: 14或SEQ ID NO: 15具有至少90%一致性之序列。
如請求項65之組合物，其中該正向重複序列與SEQ ID NO: 4-13中之任一者至少95%一致或包含與SEQ ID NO: 14或SEQ ID NO: 15具有至少95%一致性之序列。
如請求項65之組合物，其中該正向重複序列為SEQ ID NO: 4-13中之任一者或包含SEQ ID NO: 14或SEQ ID NO: 15之序列。
如請求項65至68中任一項之組合物，其中該間隔子序列之長度包含15至35個核苷酸。
如請求項65至69中任一項之組合物，其中該間隔子序列與目標核酸之目標股序列包含互補性。
如請求項70之組合物，其中該目標核酸包含與原間隔子相鄰模體(PAM)序列相鄰之非目標股序列。
如請求項71之組合物，其中該PAM序列為5'-TTR-3'、5'-NTTR-3'、5'-NTTN-3'、5'-RTTR-3'、5'-ATTR-3'或5'-RTTG-3'，其中N為任何核苷酸，Y為C或T，且R為A或G。
如請求項72之組合物，其中該PAM序列為5'-TTG-3'、5'-TTA-3'、5'-ATTG-3'、5'-TTTA-3'或5'-TTTG-3'。
如請求項45至73中任一項之組合物，其中該變異多肽進一步包含肽標籤、螢光蛋白、鹼基編輯域、DNA甲基化域、組蛋白殘基修飾域、定位因子、轉錄修飾因子、光閘控控制因子、化學誘導因子或染色質目測因子。
一種組合物，其包含編碼如請求項45至74中任一項之變異多肽的核酸，其中視情況該核酸經密碼子優化以在細胞中表現。
如請求項75之組合物，其中該細胞為真核細胞。
如請求項75或76之組合物，其中該細胞為哺乳動物細胞或植物細胞。
如請求項75至77中任一項之組合物，其中該細胞為人類細胞。
如請求項75至78中任一項之組合物，其中編碼該變異多肽之該核酸可操作地連接於啟動子。
如請求項75至79中任一項之組合物，其中編碼該變異多肽之該核酸在載體中。
如請求項80之組合物，其中該載體包含反轉錄病毒載體、慢病毒載體、噬菌體載體、腺病毒載體、腺相關載體或單純疱疹載體。
如請求項45至81中任一項之組合物，其中該組合物存在於包含奈米粒子(例如脂質奈米粒子)、脂質體、胞外體、微囊泡或基因槍之遞送組合物中。
一種用於在細胞中編輯基因之方法，該方法包含使該細胞與如前述請求項中任一項之變異多肽或組合物接觸。
一種核酸分子，其編碼如請求項1至83中任一項之變異多肽。
如請求項84之核酸分子，其中該核酸分子之序列與選自由SEQ ID NO: 1、2或21-27組成之群的序列95%一致。
如請求項84之核酸分子，其中該核酸分子之序列包含選自由SEQ ID NO: 1、2或21-27組成之群的序列。
如請求項84之核酸分子，其中該核酸分子之序列與選自由SEQ ID NO: 22、23或25組成之群的序列95%一致。