TW202204382A

TW202204382A - 編輯目標rna之方法

Info

Publication number: TW202204382A
Application number: TW110112005A
Authority: TW
Inventors: 一瀬瑞穂; 伯納德古德曼; 八木祐介; 赤岩友美; 島尻恭香; 中村崇裕
Original assignee: 日商基因編輯力股份有限公司; 國立大學法人東海國立大學機構; 國立大學法人九州大學
Priority date: 2020-03-31
Filing date: 2021-03-31
Publication date: 2022-02-01
Also published as: WO2021201198A1; JPWO2021201198A1; EP4130274A4; US20230125942A1; CN115698296A; CA3179365A1; JP7698371B1; JP7668547B2; JP7698351B2; JP2024096897A; BR112022019571A2; AU2021248204A1; KR20220165747A; EP4130274A1; IL296955A

Abstract

本發明提供一種將目標RNA中包含之編輯目標C轉化為U、或將編輯目標U轉化為C之方法。本發明之編輯目標RNA之方法係將包含如下DYW域之人工DYW蛋白應用於目標RNA，上述DYW域包含下述a、b、c、及bc之任一多肽：a.具有x_a1 PGx_a2 SWIEx_a3 -x_a16 HP…Hx_aa E…Cx_a17 x_a18 CH…DYW，與序列編號：1之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽；b.具有x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_bb E…Cx_b17 x_b18 CH…DYW，與序列編號：2之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽；c.具有KPAx_c1 Ax_c2 IEx_c3 …Hx_cc E…Cx_c4 x_c5 CH…x_c6 x_c7 x_c8 ，與序列編號：3之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽；bc.具有x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_cc E…Cx_c4 x_c5 CH…Dx_bc1 x_bc2 ，與序列編號：2之90之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽(序列中，x表示任意之胺基酸，…表示任意之多肽片段)。

Description

編輯目標RNA之方法

本發明係關於一種使用能夠與目標RNA結合之蛋白質之RNA編輯技術。本發明可用於醫療(藥物開發之輔助、治療)、農業(農水畜產品之生產、育種)、化學(生物物質之生產)等廣泛領域。

已知於植物之線粒體及葉綠體中，頻繁發生以RNA級置換基因組中之特定鹼基之RNA編輯，作為RNA結合蛋白之三角狀五肽重複(PPR，Pentatricopeptide Repeat)蛋白參與該現象。

PPR蛋白根據構成該蛋白質之PPR模體結構之不同，被分類為P與PLS這2個家族(非專利文獻1)。P型PPR蛋白係由標準之35個胺基酸之PPR模體(P)之單純重複所構成，另一方面，PLS蛋白除P以外，還包含與其類似之被稱為L及S之2種模體。PLS蛋白之PPR陣列(PPR模體之排列)係由P1(約35個胺基酸)、L1(約35個胺基酸)、以及S1(約31個胺基酸)這3種PPR模體以P-L-S重複單元之形式構成，於其P1L1S1之C末端側連著序列略有不同之P-L-S、即P2(35個胺基酸)、L2(36個胺基酸)、以及S2(32個胺基酸)模體。又，有別於由P-L-S重複單元所構成者，亦存在重複出現SS(31個胺基酸)之情況。進而，有時於該尾端之P2L2S2模體之C末端側連著被稱為E1及E2之2種之類PPR模體、以及具有136個胺基酸之類胞苷去胺酶域序列之DYW域(非專利文獻2)。

PPR蛋白與RNA之相互作用係由根據各PPR模體中之數處胺基酸之組合來指定結合RNA鹼基之PPR密碼所規定，該等胺基酸經由氫鍵而與對應之核苷酸鍵結(專利文獻1、專利文獻2、非專利文獻3、非專利文獻4、非專利文獻5、非專利文獻6、非專利文獻7、非專利文獻8)。 [先前技術文獻] [專利文獻]

[專利文獻1]國際公開WO2013/058404 [專利文獻2]國際公開WO2014/175284 [非專利文獻]

[非專利文獻1]Lurin, C., Andrés, C., Aubourg, S., Bellaoui, M., Bitton, F., Bruyère, C., Caboche, M., Debast, C., Gualberto, J., Hoffmann, B., et al. (2004). Genome-wide analysis of Arabidopsis pentatricopeptide repeat proteins reveals their essential role in organelle biogenesis. Plant Cell 16: 2089-2103. [非專利文獻2]Cheng, S., Gutmann, B., Zhong, X., Ye, Y., Fisher, M. F., Bai, F., Castleden, I., Song, Y., Song, B., Huang, J., et al. (2016). Redefining the structural motifs that determine RNA binding and RNA editing by pentatricopeptide repeat proteins in land plants. Plant J. 85: 532-547. [非專利文獻3]Barkan, A., Rojas, M., Fujii, S., Yap, A., Chong, Y. S., Bond, C. S., and Small, I. (2012). A combinatorial amino acid code for RNA recognition by pentatricopeptide repeat proteins. PLoS Genet. 8: e1002910. [非專利文獻4]Shen, C., Zhang, D., Guan, Z., Liu, Y., Yang, Z., Yang, Y., Wang, X., Wang, Q., Zhang, Q., Fan, S., et al. (2016). Structural basis for specific single-stranded RNA recognition by designer pentatricopeptide repeat proteins. Nat. Commun. 7: 11285. [非專利文獻5]Yagi, Y., Hayashi, S., Kobayashi, K., Hirayama, T., and Nakamura, T. (2013). Elucidation of the RNA recognition code for pentatricopeptide repeat proteins involved in organelle RNA editing in plants. PLoS One 8: e57286. [非專利文獻6]Kobayashi, T., Yagi, Y., and Nakamura, T. (2019). Comprehensive Prediction of Target RNA Editing Sites for PLS-Class PPR Proteins in Arabidopsis thaliana. Plant Cell Physiol. 60: 862-874. [非專利文獻7]Yan, J., Yao, Y., Hong, S., Yang, Y., Shen, C., Zhang, Q., Zhang, D., Zou, T., and Yin, P. (2019). Delineation of pentatricopeptide repeat codes for target RNA prediction. Nucleic Acids Res. 47: 3728-3738. [非專利文獻8]Takenaka, M., Zehrmann, A., Brennicke, A., and Graichen, K. (2013). Improved computational target site prediction for pentatricopeptide repeat RNA editing factors. PLoS One 8: e65343. [非專利文獻9]Knie, N., Grewe, F., Fischer, S., and Knoop, V. (2016). Reverse U-to-C editing exceeds C-to-U RNA editing in some ferns - a monilophyte-wide comparison of chloroplast and mitochondrial RNA editing suggests independent evolution of the two processes in both organelles. BMC Evol. Biol. 16: 134. [非專利文獻10]Gerke, P., Szövényi, P., Neubauer, A., Lenz, H., Gutmann, B., McDowell, R., Small, I., Schallenberg-Rüdinger, M., and Knoop, V. (2020). Towards a plant model for enigmatic U-to-C RNA editing: the organelle genomes, transcriptomes, editomes and candidate RNA editing factors in the hornwort Anthoceros agrestis. New Phytologist 225: 1974-1992. [非專利文獻11]Gutmann B., Royan S., Schallenberg-Rüdinger M., Lenz H., Castleden I.R., McDowell R., Vacher M.A., Tonti-Filippini J., Bond C.S., Knoop V., and Small I.D. (2020). The Expansion and Diversification of Pentatricopeptide Repeat RNA-Editing Factors in Plants. Molecular Plant 13: 215-230 [非專利文獻12]Oldenkott, B., Yang, Y., Lesch, E., Knoop, V., and Schallenberg-Rüdinger, M. (2019). Plant-type pentatricopeptide repeat proteins with a DYW domain drive C-to-U RNA editing in Escherichia coli. Communications Biology 2: 85.

[發明所欲解決之問題]

陸地植物之胞器中通常發生RNA鹼基自胞苷置換為尿苷之C-to-U RNA編輯。然而，在一部分角苔類、或石松類及蕨類植物中，亦發現尿苷被置換為胞苷之U-to-C RNA編輯(非專利文獻9)。根據這兩種不同之生物資訊學研究，於具有U-to-C RNA編輯之植物中發現序列與標準DYW域不同之獨特之DYW域(非專利文獻10、非專利文獻11)。

有報告稱，源自小立碗蘚(Physcomitrella patens)之2種DYW：PG蛋白於大腸桿菌內顯示出從C到U之RNA編輯活性(非專利文獻12)。於陸地植物之進化初期所分支出之植物群中，DYW域大致被分為兩種群。第一群被稱為DYW：PG/WW群，其包含作為標準DYW域之DYW：PG型、及於PG盒中附加有1個色胺酸(W)之DYW：WW型。第二群被稱為DYW：KP，該DYW域具有PG盒及C末端之3個胺基酸序列與PG/WW群不同之序列，進而僅存在於具有U-to-C RNA編輯的植物中。將任意之RNA序列內之1個鹼基變更為特定鹼基之技術可用於基因治療、或產業利用方面之基因變異導入技術。迄今已開發出各種RNA結合分子，但尚未確立藉由使用DYW域與人工RNA結合蛋白而將任意之目標RNA之胞苷(C)轉化為尿苷(U)，或者其反向，即，將尿苷(U)轉化為胞苷(C)之分子設計方法。 [解決問題之技術手段]

我們於本研究中揭示出：PPR-DYW蛋白之包含C末端DYW域之部分能夠用作RNA編輯之模組域(modular editing domain(模組編輯域))。於使本研究中設計出之3種DYW域分別與PPR-P或PLS陣列融合之情形時，DYW：PG及DYW：WW域顯示出C-to-U之RNA編輯活性，DYW：KP顯示出U-to-C之RNA編輯活性。

本發明提供以下。 [1]一種編輯目標RNA之方法，其將包含如下DYW域之人工DYW蛋白應用於目標RNA，上述DYW域包含下述a、b、c、及bc之任一多肽； a.具有x_a1 PGx_a2 SWIEx_a3 -x_a16 HP…Hx_aa E…Cx_a17 x_a18 CH…DYW，與序列編號：1之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 b.具有x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_bb E…Cx_b17 x_b18 CH…DYW，與序列編號：2之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 c.具有KPAx_c1 Ax_c2 IEx_c3 …Hx_cc E…Cx_c4 x_c5 CH…x_c6 x_c7 x_c8 ，與序列編號：3之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 bc.具有x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_cc E…Cx_c4 x_c5 CH…Dx_bc1 x_bc2 ，與序列編號：2之90之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 (序列中，x表示任意之胺基酸，…表示任意之多肽片段)。 [2]一種DYW域，其包含下述a、b、c、及bc之任一多肽； a.具有x_a1 PGx_a2 SWIEx_a3 -x_a16 HP…Hx_aa E…Cx_a17 x_a18 CH…DYW，與序列編號：1之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 b.具有x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_bb E…Cx_b17 x_b18 CH…DYW，與序列編號：2之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 c.具有KPAx_c1 Ax_c2 IEx_c3 …Hx_cc E…Cx_c4 x_c5 CH…x_c6 x_c7 x_c8 ，與序列編號：3之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 bc.具有x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_cc E…Cx_c4 x_c5 CH…Dx_bc1 x_bc2 ，與序列編號：2之90之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽。 [3]一種DYW蛋白，其包含如下RNA結合域、及如2所記載之DYW域，上述RNA結合域包含至少一個PPR模體，且能夠與目標RNA具序列特異性地結合。 [4]如2所記載之DYW蛋白，其中RNA結合域為PLS型。 [5]一種編輯目標RNA之方法，其包括如下步驟：將包含下述c或bc之多肽之DYW域應用於目標RNA，而將編輯目標U轉化為C； c.具有KPAx_c1 Ax_c2 IEx_c3 …Hx_cc E…Cx_c4 x_c5 CH…x_c6 x_c7 x_c8 ，與序列編號：3之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 bc.具有x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_cc E…Cx_c4 x_c5 CH…Dx_bc1 x_bc2 ，與序列編號：2之90之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽。 [6]如5所記載之方法，其中DYW域融合於如下RNA結合域，上述RNA結合域包含至少一個PPR模體，且能夠依據PPR密碼規則與目標RNA具序列特異性地結合。 [7]一種組合物，其包含如2所記載之DYW域，且用於在真核細胞中編輯RNA。 [8]一種核酸，其編碼如2所記載之DYW域、或如3或4所記載之DYW蛋白。 [9]一種載體，其包含如8所記載之核酸。 [10]一種細胞(人類個體除外)，其包含如9所記載之載體。

[1]一種編輯目標RNA之方法，其將包含如下DYW域之人工DYW蛋白應用於目標RNA，上述DYW域包含下述a～c之任一多肽； a.具有x_a1 PGx_a2 SWIEx_a3 -x_a16 HP…HSE…Cx_a17 x_a18 CH…DYW，與序列編號：1之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 b.具有x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…HSE…Cx_b17 x_b18 CH…DYW，與序列編號：2之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 c.具有KPAx_c1 Ax_c2 IEx_c3 …HAE…Cx_c4 x_c5 CH…Dx_c6 x_c7 ，與序列編號：3之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 (序列中，x表示任意之胺基酸，…表示任意之多肽片段)。 [2]一種DYW域，其包含下述a～c之任一多肽； a.具有x_a1 PGx_a2 SWIEx_a3 -x_a16 HP…HSE…Cx_a17 x_a18 CH…DYW，與序列編號：1之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 b.具有x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…HSE…Cx_b17 x_b18 CH…DYW，與序列編號：2之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 c.具有KPAx_c1 Ax_c2 IEx_c3 …HAE…Cx_c4 x_c5 CH…Dx_c6 x_c7 ，與序列編號：3之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽。 [3]一種DYW蛋白，其包含如下RNA結合域、及如2所記載之DYW域，上述RNA結合域包含至少一個PPR模體，且能夠與目標RNA具序列特異性地結合。 [4]如2所記載之DYW蛋白，其中RNA結合域為PLS型。 [5]一種編輯目標RNA之方法，其包括如下步驟：將包含下述c之多肽之DYW域應用於目標RNA，而將編輯目標U轉化為C； c.具有KPAx_c1 Ax_c2 IEx_c3 …HAE…Cx_c4 x_c5 CH…Dx_c6 x_c7 ，與序列編號：3之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽。 [6]如5所記載之方法，其中DYW域融合於如下RNA結合域，上述RNA結合域包含至少一個PPR模體，且能夠依據PPR密碼規則與目標RNA具序列特異性地結合。 [7]一種組合物，其包含如2所記載之DYW域，且用於在真核細胞中編輯RNA。 [8]一種核酸，其編碼如2所記載之DYW域、或如3或4所記載之DYW蛋白。 [9]一種載體，其包含如8所記載之核酸。 [10]一種細胞(人類個體除外)，其包含如9所記載之載體。 [發明之效果]

根據本發明，可將目標RNA中包含之編輯目標C轉化為U、或將編輯目標U轉化為C。

本發明係關於一種編輯目標RNA之方法，其係將包含如下DYW域之DYW蛋白應用於目標RNA，上述DYW域包含下述a、b、c、及bc之任一多肽。 a.具有x_a1 PGx_a2 SWIEx_a3 -x_a16 HP…Hx_aa E…Cx_a17 x_a18 CH…DYW，與序列編號：1之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 b.具有x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_bb E…Cx_b17 x_b18 CH…DYW，與序列編號：2之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 c.具有KPAx_c1 Ax_c2 IEx_c3 …Hx_cc E…Cx_c4 x_c5 CH…x_c6 x_c7 x_c8 ，與序列編號：3之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 bc.具有x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_cc E…Cx_c4 x_c5 CH…Dx_bc1 x_bc2 ，與序列編號：2之90之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽

本發明中，C-to-U/U-to-C編輯活性係指將對象多肽連結於能夠與目標RNA具序列特異性地結合之RNA結合域之C末端側進行編輯檢定時，能夠將目標RNA中包含之編輯目標C轉化為U、或將編輯目標U轉化為C的活性。轉化只要於適當條件下將編輯目標鹼基之至少約3%、較佳為約5%置換為目標鹼基即可。

[DYW域] x_a1 PGx_a2 SWIEx_a3 -x_a16 HP…Hx_aa E…Cx_a17 x_a18 CH…DYW、x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_bb E…Cx_b17 x_b18 CH…DYW、及KPAx_c1 Ax_c2 IEx_c3 …Hx_cc E…Cx_c4 x_c5 CH…x_c6 x_c7 x_c8 均表示胺基酸序列。序列中，x分別獨立表示任意之胺基酸，…分別獨立表示包含任意長度之任意胺基酸序列之多肽片段。本發明中，DYW域可由該等3個胺基酸序列中之任一者表示。尤其是有時將包含x_a1 PGx_a2 SWIEx_a3 -x_a16 HP…Hx_aa E…Cx_a17 x_a18 CH…DYW之DYW域表示為DYW：PG，將包含x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_bb E…Cx_b17 x_b18 CH…DYW之DYW域表示為DYW：WW，且將包含KPAx_c1 Ax_c2 IEx_c3 …Hx_cc E…Cx_c4 x_c5 CH…x_c6 x_c7 x_c8 之DYW域表示為DYW：KP。

DYW域具有：N末端之含有包含約15個胺基酸之PG盒之區域、中心部之鋅結合域(HxEx_n CxxCH，x_n 為任意胺基酸連結任意個數n個之串聯)、及C末端之DYW這3個區域。鋅結合域進而可分為HxE區與CxxCH區。各DYW域之該等區域可如下表般表示。

[表1]

	含有PG盒之區域	HxE區	CxxCH區	DYW
DYW：PG	x_a1 PGx_a2 SWIEx_a3 -x_a16 HP	Hx_aa E	Cx_a17 x_a18 CH	DYW
DYW：WW	x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP	Hx_bb E	Cx_b17 x_b18 CH	DYW
DYW：KP	KPAx_c1 Ax_c2 IEx_c3	Hx_cc E	Cx_c4 x_c5 CH	x_c6 x_c7 x_c8

(DYW：PG) DYW：PG為包含x_a1 PGx_a2 SWIEx_a3 -x_a16 HP…Hx_aa E…Cx_a17 x_a18 CH…DYW之多肽。較佳為如下多肽，其具有x_a1 PGx_a2 SWIEx_a3 -x_a16 HP…Hx_aa E…Cx_a17 x_a18 CH…DYW，與序列編號：1之序列具有序列同一性(將在[用語]項中詳述)，且具有C-to-U/U-to-C編輯活性。DYW：PG具有將編輯目標C轉化為U之活性(C-to-U編輯活性)。序列編號：1中示出本說明書之實施例項中所示之實驗中使用的、包含全長136個胺基酸長度之DYW：PG之序列。該序列由本案首次揭示，為新穎之序列。

只要可發揮C-to-U編輯活性，DYW：PG之全長便無特別限定，例如長度為110～160個胺基酸，較佳為長度124～148個胺基酸，更佳為長度28～144個胺基酸，進而較佳為長度132～140個胺基酸。

於DYW：PG之含有PG盒之區域(x_a1 PGx_a2 SWIEx_a3 -x_a16 HP)中：只要作為DYW：PG可發揮C-to-U編輯活性，x_a1 便無特別限定，較佳為E(麩胺酸)或性質與其相似之胺基酸，更佳為G。只要作為DYW：PG可發揮C-to-U編輯活性，x_a2 便無特別限定，較佳為C(半胱胺酸)或性質與其相似之胺基酸，更佳為C。只要作為DYW：PG可發揮C-to-U編輯活性，x_a3 -x_a16 之各胺基酸便無特別限定，較佳為與序列編號：1之序列位置9～22對應之胺基酸相同、或者性質與對應之胺基酸相似者，更佳為與序列編號：1之序列位置9～22對應之胺基酸相同者。

於一較佳之形態中，DYW：PG之HxE區不論其他區域如何，均為HSE。

於DYW：PG之CxxCH區、即Cx_a17 x_a18 CH中：只要作為DYW：PG可發揮C-to-U編輯活性，x_a17 便無特別限定，較佳為G(甘胺酸)或性質與其相似之胺基酸，更佳為G。只要作為DYW：PG可發揮C-to-U編輯活性，x_a18 便無特別限定，較佳為D(天冬胺酸)或性質與其相似之胺基酸，更佳為D。

DYW：PG中，對將含有PG盒之區域與Hx_aa E結合之…部分、將Hx_aa E區與CxxCH區結合之…部分、以及將CxxCH區與DYW連結之…部分依序稱為第一連結部、第二連結部、及第三連結部(其他DYW域中亦相同)。

關於DYW：PG之第一連結部之全長，只要作為DYW：PG可發揮C-to-U編輯活性，便無特別限定，例如長度為39～47個胺基酸，較佳為長度40～46個胺基酸，更佳為長度41～45個胺基酸，進而較佳為長度42～44個胺基酸。關於第一連結部之胺基酸序列，只要作為DYW：PG可發揮C-to-U編輯活性，便無特別限定，較佳為與序列編號：1之序列位置25～67之部分相同、或於該部分序列中置換、缺失、或附加有1～22個胺基酸之序列、或與該部分序列具有序列同一性之序列，更佳為與該部分序列相同之序列。

關於DYW：PG之第一連結部之一較佳形態，不論DYW域之其他部分之序列如何，均為下式所表示之43個胺基酸長度之多肽。

N_a25 -N_a26 -N_a27 -…-N_a65 -N_a66 -N_a67

上述多肽較佳為如下者，其為與序列編號：1之序列位置25～67之部分相同、或於該部分序列中置換數個胺基酸而成之序列，且作為DYW：PG可發揮C-to-U編輯活性。此時，胺基酸之置換較佳為以如下方式進行：於圖4之對應位置，位元值大之胺基酸(例如N_a29 、N_a30 、N_a32 、N_a33 、N_a35 、N_a36 、N_a40 、N_a44 、N_a45 、N_a47 、N_a48 、N_a52 、N_a53 、N_a54 、N_a55 、N_a58 、N_a61 、N_a65 、N_a67 )與圖4相同，除此以外之胺基酸被置換。

關於DYW：PG之第二連結部之全長，只要作為DYW：PG可發揮C-to-U編輯活性，便無特別限定，例如長度為21～29個胺基酸，較佳為長度22～28個胺基酸，更佳為長度23～27個胺基酸，進而較佳為長度24～26個胺基酸。關於第二連結部之胺基酸序列，只要作為DYW：PG可發揮C-to-U編輯活性，便無特別限定，較佳為與序列編號：1之序列位置71～95之部分相同、或於該部分序列中置換、缺失、或附加有1～13個胺基酸之序列、或與該部分序列具有序列同一性之序列，更佳為與該部分序列相同之序列。

關於DYW：PG之第二連結部之一較佳形態，不論DYW域之其他部分之序列如何，均為下式所表示之25個胺基酸長度之多肽。

N_a71 -N_a72 -N_a73 -…-N_a93 -N_a94 -N_a95

上述多肽較佳為如下者，其為與序列編號：1之序列位置71～95之部分相同、或於該部分序列中置換數個胺基酸而成之序列，且作為DYW：PG可發揮C-to-U編輯活性。此時，胺基酸之置換較佳為以如下方式進行：於圖4之對應位置，位元值大之胺基酸(例如N_a71 、N_a72 、N_a73 、N_a76 、N_a77 、N_a78 、N_a79 、N_a81 、N_a82 、N_a86 、N_a88 、N_a89 、N_a91 、N_a92 、N_a93 、N_a94 )與圖4相同，除此以外之胺基酸被置換。

關於DYW：PG之第三連結部之全長，只要作為DYW：PG可發揮C-to-U編輯活性，便無特別限定，例如長度為29～37個胺基酸，較佳為長度30～36個胺基酸，更佳為長度31～35個胺基酸，進而較佳為長度32～34個胺基酸。關於第三連結部之胺基酸序列，只要作為DYW：PG可發揮C-to-U編輯活性，便無特別限定，較佳為與序列編號：1之序列位置101～133之部分相同、或於該部分序列中置換、缺失、或附加有1～17個胺基酸之序列、或與該部分序列具有序列同一性之序列，更佳為與該部分序列相同之序列。

關於DYW：PG之第三連結部之一較佳形態，不論DYW域之其他部分之序列如何，均為下式所表示之33個胺基酸長度之多肽。

N_a101 -N_a102 -N_a103 -…-N_a131 -N_a132 -N_a133

上述多肽較佳為如下者，其為與序列編號：1之序列位置101～133之部分相同、或於該部分序列中置換數個胺基酸而成之序列，且作為DYW：PG可發揮C-to-U編輯活性。此時，胺基酸之置換較佳為以如下方式進行：於圖4之對應位置，位元值大之胺基酸(例如N_a102 、N_a104 、N_a107 、N_a112 、N_a114 、N_a117 、N_a118 、N_a121 、N_a122 、N_a123 、N_a124 、N_a125 、N_a128 、N_a130 、N_a131 、N_a132 )與圖4相同，除此以外之胺基酸被置換。

藉由向包含序列編號：1之序列之PG域導入變異，可提高RNA編輯活性。此種導入有變異之域之較佳例為本說明書之實施例項中所示之PG11(包含序列編號：50之胺基酸序列之多肽)。

(DYW：WW) DYW：WW為包含x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_bb E…Cx_b17 x_b18 CH…DYW之多肽。較佳為具有x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_bb E…Cx_b17 x_b18 CH…DYW，與序列編號：2之序列具有序列同一性，且具有C-to-U/U-to-C編輯活性之多肽。DYW：WW具有將編輯目標C轉化為U之活性(C-to-U編輯活性)。序列編號：2中示出本說明書之實施例項中所示之實驗中使用的、包含全長137個胺基酸長度之DYW：WW之序列。該序列由本案首次揭示，為新穎之序列。

只要可發揮C-to-U編輯活性，DYW：WW之全長便無特別限定，例如長度為110～160個胺基酸，較佳為長度125～149個胺基酸，更佳為長度129～145個胺基酸，進而較佳為長度133～141個胺基酸。

於DYW：WW之含有PG盒之區域、即x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP中，包含WTD之部分亦可為WSD。

於DYW：WW之含有PG盒之區域中：只要作為DYW：WW可發揮C-to-U編輯活性，x_b1 便無特別限定，較佳為K(離胺酸)或性質與其相似之胺基酸，更佳為K。只要作為DYW：WW可發揮C-to-U編輯活性，x_b2 便無特別限定，較佳為Q(麩醯胺)或性質與其相似之胺基酸，更佳為Q。只要作為DYW：WW可發揮C-to-U編輯活性，x_b3 -x_b16 之各胺基酸便無特別限定，較佳為與序列編號：2之序列位置10～23對應之胺基酸相同、或性質與對應之胺基酸相似者，更佳為與序列編號：2之序列位置10～23對應之胺基酸相同者。

於一較佳之形態中，DYW：WW之HxE區不論其他部分之序列如何，均為HSE。

於DYW：WW之CxxCH區、即Cx_b17 x_b18 CH中：只要作為DYW：WW可發揮C-to-U編輯活性，x_b17 便無特別限定，較佳為D(天冬胺酸)或性質與其相似之胺基酸，更佳為D。只要作為DYW：WW可發揮C-to-U編輯活性，x_b18 便無特別限定，較佳為D或性質與其相似之胺基酸，更佳為D。

關於DYW：WW之第一連結部之全長，只要作為DYW：WW可發揮C-to-U編輯活性，便無特別限定，例如長度為39～47個胺基酸，較佳為長度40～46個胺基酸，更佳為長度41～45個胺基酸，進而較佳為長度42～44個胺基酸。關於第一連結部之胺基酸序列，只要作為DYW：WW可發揮C-to-U編輯活性，便無特別限定，較佳為與序列編號：2之序列位置25～67之部分相同、或於該部分序列中置換、缺失、或附加有1～22個胺基酸之序列、或與該部分序列具有序列同一性之序列，更佳為與該部分序列相同之序列。

關於DYW：WW之第一連結部之一較佳形態，不論DYW域之其他部分之序列如何，均為下式所表示之43個胺基酸長度之多肽。

N_b26 -N_b27 -N_b28 -…-N_b66 -N_b67 -N_b68

上述多肽較佳為如下者，其為與序列編號：2之序列位置26～68之部分相同、或於該部分序列中置換數個胺基酸而成之序列，且作為DYW：PG可發揮C-to-U編輯活性。此時，胺基酸之置換較佳為以如下方式進行：於圖4之對應位置，位元值大之胺基酸(例如N_b26 、N_b30 、N_b33 、N_b34 、N_b37 、N_b41 、N_b45 、N_b46 、N_b48 、N_b49 、N_b51 、N_b52 、N_b53 、N_b55 、N_b56 、N_b57 、N_b59 、N_b61 、N_b62 、N_b63 、N_b64 、N_b66 、N_b67 、N_b68 )與圖4相同，除此以外之胺基酸被置換。

關於DYW：WW之第二連結部之全長，只要作為DYW：WW可發揮C-to-U編輯活性，便無特別限定，例如長度為21～29個胺基酸，較佳為長度22～28個胺基酸，更佳為長度23～27個胺基酸，進而較佳為長度24～26個胺基酸。關於第二連結部之胺基酸序列，只要作為DYW：WW可發揮C-to-U編輯活性，便無特別限定，較佳為與序列編號：2之序列位置71～95之部分相同、或於該部分序列中置換、缺失、或附加有1～13個胺基酸之序列、或與該部分序列具有序列同一性之序列，更佳為與該部分序列相同之序列。

關於DYW：WW之第二連結部之一較佳形態，不論DYW域之其他部分之序列如何，均為下式所表示之25個胺基酸長度之多肽。

N_b72 -N_b73 -N_b74 -…-N_b94 -N_b95 -N_b96

上述多肽較佳為如下者，其為與序列編號：2之序列位置72～96之部分相同、或於該部分序列中置換數個胺基酸而成之序列，且作為DYW：WW可發揮C-to-U編輯活性。此時，胺基酸之置換較佳為以如下方式進行：於圖4之對應位置，位元值大之胺基酸(例如N_b72 、N_b73 、N_b74 、N_b75 、N_b77 、N_b78 、N_b79 、N_b81 、N_b82 、N_b84 、N_b88 、N_b89 、N_b90 、N_b91 、N_b92 、N_b93 、N_b94 、N_b95 、N_b96 )與圖4相同，除此以外之胺基酸被置換。

關於DYW：WW之第三連結部之全長，只要作為DYW：WW可發揮C-to-U編輯活性，便無特別限定，例如長度為29～37個胺基酸，較佳為長度30～36個胺基酸，更佳為長度31～35個胺基酸，進而較佳為長度32～34個胺基酸。關於第三連結部之胺基酸序列，只要作為DYW：WW可發揮C-to-U編輯活性，便無特別限定，較佳為與序列編號：2之序列位置101～133之部分相同、或於該部分序列中置換、缺失、或附加有1～17個胺基酸之序列、或與該部分序列具有序列同一性之序列，更佳為與該部分序列相同之序列。

關於DYW：WW之第三連結部之一較佳形態，不論DYW域之其他部分之序列如何，均為下式所表示之33個胺基酸長度之多肽。

N_b102 -N_b103 -N_b104 -…-N_b132 -N_b133 -N_b134

上述多肽較佳為如下者，其為與序列編號：2之序列位置102～134之部分相同、或於該部分序列中置換數個胺基酸而成之序列，且作為DYW：WW可發揮C-to-U編輯活性。此時，胺基酸之置換較佳為以如下方式進行：於圖4之對應位置，位元值大之胺基酸(例如N_b104 、N_b105 、N_b107 、N_b108 、N_b109 、N_b110 、N_b111 、N_b113 、N_b115 、N_b116 、N_b117 、N_b118 、N_b119 、N_b121 、N_b122 、N_b123 、N_b124 、N_b126 、N_b129 、N_b131 、N_b132 、N_b133 N_b134 )與圖4相同，除此以外之胺基酸被置換。

藉由向包含序列編號：2之序列之WW域導入變異，可提高RNA編輯活性。此種導入有變異之域之較佳例為本說明書之實施例項中所示之WW2～11及WW13，編輯活性尤高者為WW11(包含序列編號：63之胺基酸序列之多肽)。

(DYW：KP) DYW：KP為包含KPAx_c1 Ax_c2 IEx_c3 …Hx_cc E…Cx_c4 x_c5 CH…x_c6 x_c7 x_c8 之多肽。較佳為具有KPAx_c1 Ax_c2 IEx_c3 …Hx_cc E…Cx_c4 x_c5 CH…x_c6 x_c7 x_c8 ，與序列編號：3之序列具有序列同一性，且具有C-to-U/U-to-C編輯活性之多肽。DYW：KP具有將編輯目標U轉化為C之活性(U-to-C編輯活性)。序列編號：3中示出本說明書之實施例項中所示之實驗中使用的、包含全長133個胺基酸長度之DYW：KP之序列。該序列由本案首次揭示，為新穎之序列。

只要可發揮U-to-C編輯活性，DYW：KP之全長便無特別限定，例如長度為110～160個胺基酸，較佳為長度121～145個胺基酸，更佳為長度125～141個胺基酸，進而較佳為長度129～137個胺基酸。

於DYW：KP之含有PG盒之區域、即KPAx_c1 Ax_c2 IEx_c3 中：只要作為DYW：KP可發揮U-to-C編輯活性，x_c1 便無特別限定，較佳為S(絲胺酸)或性質與其相似之胺基酸，更佳為S。只要作為DYW：KP可發揮U-to-C編輯活性，x_c2 便無特別限定，較佳為L(白胺酸)或性質與其相似之胺基酸，更佳為L。只要作為DYW：KP可發揮U-to-C編輯活性，x_c3 便無特別限定，較佳為V(纈胺酸)或性質與其相似之胺基酸，更佳為V。

於一較佳之形態中，DYW：KP之HxE區不論其他部分之序列如何，均為HAE。

於DYW：KP之CxxCH區、即Cx_c4 x_c5 CH中：只要作為DYW：KP可發揮U-to-C編輯活性，x_c4 便無特別限定，較佳為N(天冬醯胺)或性質與其相似之胺基酸，更佳為N。只要作為DYW：KP可發揮U-to-C編輯活性，x_b5 便無特別限定，較佳為D(天冬胺酸)或性質與其相似之胺基酸，更佳為D。

於DYW：KP之相當於DYW之部分、即x_c6 x_c7 x_c8 中：只要作為DYW：KP可發揮U-to-C編輯活性，x_c6 便無特別限定，較佳為D(天冬胺酸)或性質與其相似之胺基酸，更佳為D。只要作為DYW：KP可發揮U-to-C編輯活性，x_c7 便無特別限定，較佳為M(甲硫胺酸)或性質與其相似之胺基酸，更佳為M。只要作為DYW：KP可發揮U-to-C編輯活性，x_b8 便無特別限定，較佳為F(苯丙胺酸)或性質與其相似之胺基酸，更佳為F。於一較佳之形態中，x_c6 x_c7 x_c8 不論其他部分之序列如何，均為Dx_c7 x_c8 。於另一較佳之形態中，x_c6 x_c7 x_c8 不論其他部分之序列如何，均為GRP。

關於DYW：KP之第一連結部之全長，只要作為DYW：KP可發揮U-to-C編輯活性，便無特別限定，例如長度為51～59個胺基酸，較佳為長度52～58個胺基酸，更佳為長度53～57個胺基酸，進而較佳為長度54～56個胺基酸。關於第一連結部之胺基酸序列，只要作為DYW：KP可發揮U-to-C編輯活性，便無特別限定，較佳為與序列編號：3之序列位置10～64之部分相同、或於該部分序列中置換、缺失、或附加有1～28個胺基酸之序列、或與該部分序列具有序列同一性之序列，更佳為與該部分序列相同之序列。

關於DYW：KP之第一連結部之一較佳形態，不論DYW域之其他部分之序列如何，均為下式所表示之55個胺基酸長度之多肽。

N_c10 -N_c11 -N_c12 -…-N_c62 -N_c63 -N_c64

上述多肽較佳為如下者，其為與序列編號：3之序列位置10～64之部分相同、或於該部分序列中置換數個胺基酸而成之序列，且作為DYW：KP可發揮U-to-C編輯活性。此時，胺基酸之置換較佳為以如下方式進行：於圖4之對應位置，位元值大之胺基酸(例如N_c10 、N_c13 、N_c14 、N_c15 、N_c16 、N_c17 、N_c18 、N_c19 、N_c25 、N_c26 、N_c29 、N_c30 、N_c33 、N_c34 、N_c36 、N_c38 、N_c41 、N_c42 、N_c44 、N_c45 、N_c47 、N₄₉ 、N_c55 、N_c58 、N_c59 、N_c62 、N_c63 、N_c64 )與圖4相同，除此以外之胺基酸被置換。

關於DYW：KP之第二連結部之全長，只要作為DYW：KP可發揮U-to-C編輯活性，便無特別限定，例如長度為21～29個胺基酸，較佳為長度22～28個胺基酸，更佳為長度23～27個胺基酸，進而較佳為長度24～26個胺基酸。關於第二連結部之胺基酸序列，只要作為DYW：KP可發揮U-to-C編輯活性，便無特別限定，較佳為與序列編號：3之序列位置68～92之部分相同、或於該部分序列中置換、缺失、或附加有1～13個胺基酸之序列、或與該部分序列具有序列同一性之序列，更佳為與該部分序列相同之序列。

關於DYW：KP之第二連結部之一較佳形態，不論DYW域之其他部分之序列如何，均為下式所表示之25個胺基酸長度之多肽。

N_c68 -N_c69 -N_c70 -…-N_c90 -N_c91 -N_c92

上述多肽較佳為如下者，其為與序列編號：3之序列位置68～92之部分相同、或於該部分序列中置換數個胺基酸而成之序列，且作為DYW：KP可發揮U-to-C編輯活性。此時，胺基酸之置換較佳為以如下方式進行：於圖4之對應位置，位元值大之胺基酸(例如N_c68 、N_c70 、N_c71 、N_c72 、N_c73 、N_c74 、N_c75 、N_c76 、N_c77 、N_c78 、N_c79 、N_c80 、N_c81 、N_c83 、N_c84 、N_c85 、N_c86 、N_c87 、N_c88 、N_c89 、N_c90 、N_c91 、N_c92 )與圖4相同，除此以外之胺基酸被置換。

關於DYW：KP之第三連結部之全長，只要作為DYW：KP可發揮U-to-C編輯活性，便無特別限定，例如長度為29～37個胺基酸，較佳為長度30～36個胺基酸，更佳為長度31～35個胺基酸，進而較佳為長度32～34個胺基酸。關於第三連結部之胺基酸序列，只要作為DYW：KP可發揮U-to-C編輯活性，便無特別限定，較佳為與序列編號：3之序列位置98～130之部分相同、或於該部分序列中置換、缺失、或附加有1～17個胺基酸之序列、或與該部分序列具有序列同一性之序列，更佳為與該部分序列相同之序列。

關於DYW：KP之第三連結部之一較佳形態，不論DYW域之其他部分之序列如何，均為下式所表示之33個胺基酸長度之多肽。

N_c98 -N_c99 -N_c100 -…-N_c128 -N_c129 -N_c130

上述多肽較佳為如下者，其為與序列編號：3之序列位置98～130之部分相同、或於該部分序列中置換數個胺基酸而成之序列，且作為DYW：KP可發揮U-to-C編輯活性。此時，胺基酸之置換較佳為以如下方式進行：於圖4之對應位置，位元值大之胺基酸(例如N_c98 、N_c ₁₀₀ 、N_c101 、N_c103 、N_c104 、N_c105 、N_c107 、N_c109 、N_c110 、N_c1 ₁₁ 、N_c112 、N_c114 、N_c115 、N_c117 、N_c118 、N_c119 、N_c120 、N_c121 、N_c122 、N_c123 、N_c124 、N_c125 、N_c127 、N_c129 、N_c130 )與圖4相同，除此以外之胺基酸被置換。

藉由向包含序列編號：3之序列之KP域導入變異，可提高編輯活性。此種導入有變異之區域之較佳例為本說明書之實施例項中所示之KP2～23(序列編號：68～89)。KP22(序列編號：88)之U to C編輯活性最高，且C to U編輯活性最低，與包含序列編號：3之序列之KP域相比，RNA編輯活性得到改善。

(嵌合DYW) DYW域可根據胺基酸序列之保守性，劃分為若干區域。藉由更換該等各區域而成之嵌合DYW，能夠提高C-to-U編輯活性或U-to-C編輯活性。一較佳之形態為使DYW：WW之含有PG盒之區域、即x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP及DYW融合於DYW：KP之其他區域(…Hx_cc E…Cx_c4 x_c5 CH…)而成者。此時之x_b1 、x_b2 、x_b3 -x_b16 如上文針對DYW：WW所作說明。又，第一連結部、第二連結部、第三連結部如上文針對DYW：KP所作說明。DYW部分亦可為Dx_bc1 x_bc2 。只要可發揮U-to-C編輯活性，全長便無特別限定，例如長度為110～160個胺基酸，較佳為長度125～149個胺基酸，更佳為長度129～145個胺基酸，進而較佳為長度133～141個胺基酸。

一較佳之嵌合域包含如下多肽，其具有x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_cc E…Cx_c4 x_c5 CH…Dx_bc1 x_bc2 ，與序列編號：2之90之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性。

一尤佳之嵌合域為如下多肽，其與序列編號：90之序列具有序列同一性，且具有U-to-C編輯活性。序列編號：90中示出本說明書之實施例項中所示之實驗中使用的嵌合域之序列。確認到該域具有較包含序列編號：3之序列之DYW：KP高之U to C編輯活性，進而，其幾乎不具有C to U編輯活性。

(與公知序列之比較) 如上所述，包含序列編號：1、2、3之序列之DYW域為新穎者。以下，展示使用PPR資料庫(https://ppr.plantenergy.uwa.edu.au/onekp/；上述非專利文獻11)所調查之結果。

[表2-1]

DYW：PG(序列編號：1)
序列名稱	來源	同一性
-PYHZ-2068577-R	水韮(Isoetes)，石松類	78%
-ENQF-2003735-R	杉葉蔓石松(Lycopodium annotinum)，石松類
DYW：WW(序列編號：2)
-ANON-2000164-R	平孢角苔(Leiosporoceros dussii)，角苔類	84%
-ANON-2000163-R
-ANON-2004532-F
-ANON-2001227-F
DYW：KP(序列編號：3)
-UWOD-2140463-R	華東瘤足蕨(Plagiogyria japonica)，蕨類植物	86%

因此，本發明又提供下述d～i之任一多肽： d.與序列編號：1之序列具有超過78%之序列同一性，具有較佳為80%以上、更佳為85%以上、進而較佳為90%之序列同一性，進而較佳為具有95%之序列同一性，進而較佳為具有97%之序列同一性，且具有C-to-U編輯活性之多肽； e.與序列編號：2之序列具有超過84%之序列同一性，具有較佳為85%以上、更佳為90%以上、進而較佳為95%之序列同一性，進而較佳為具有97%之序列同一性，且具有C-to-U編輯活性之多肽； f.與序列編號：3之序列具有超過86%之序列同一性，具有較佳為87%以上、更佳為90%以上、進而較佳為95%之序列同一性，進而較佳為具有97%之序列同一性，且具有U-to-C編輯活性之多肽； g.具有在序列編號：1之序列中置換、缺失、或附加1～29個、較佳為1～25個、更佳為1～21個、進而較佳為1～17個、進而較佳為1～13個、進而較佳為1～9個、進而較佳為1～5個胺基酸而成之序列，且具有C-to-U編輯活性之多肽； h.具有在序列編號：2之序列中置換、缺失、或附加1～21個、較佳為1～18個、更佳為1～15個、進而較佳為1～12個、進而較佳為1～9個、進而較佳為1～6個胺基酸而成之序列，且具有C-to-U編輯活性之多肽； i.具有在序列編號：3之序列中置換、缺失、或附加1～18個、較佳為1～16個、更佳為1～14個、進而較佳為1～12個、進而較佳為1～10個、進而較佳為1～8個胺基酸、進而較佳為1～6個胺基酸而成之序列，且具有U-to-C編輯活性之多肽。

又，以下表示該等序列之比對。比對係使用AliView製作(Larsson, A. (2014). AliView: a fast and lightweight alignment viewer and editor for large data sets. Bioinformatics30(22): 3276-3278. http://dx.doi.org/10.1093/bioinformatics/btu531)。再者，相同之胺基酸用點來表示。

[表2-2]

[RNA結合域] 於本發明中，使用DYW域對編輯目標進行轉化時，為了將編輯目標所包含之RNA靶向化，使用RNA結合蛋白作為RNA結合域。

關於用作RNA結合域之RNA結合蛋白之較佳例，為由PPR模體構成之PPR蛋白。

(PPR模體) PPR模體係指具有E值為特定值以下(理想為E-03)之胺基酸序列，且由30～38個胺基酸所構成之多肽，但有特別記載之情形除外；該E值係在利用網站(Web)上之蛋白質域檢索程式來分析胺基酸序列時，在Pfam以PF01535、在Prosite以PS51375獲得之值。構成本發明中定義之PPR模體之胺基酸之位置編號基本與PF01535含義相同，但另一方面，該位置編號相當於自PS51375之胺基酸之位置減去2獲得之數值(例如：本發明之位置1相當於PS51375之位置3)。其中，第''ii''(-2)號胺基酸係指從構成PPR模體之胺基酸之末端(C末端側)起第2號胺基酸、或相對於下一PPR模體之第1號胺基酸朝N末端側2個、即第-2號胺基酸。當未明確鑑定出下一PPR模體時，將位於下一螺旋結構之第1號胺基酸前2個之胺基酸設為''ii''。關於Pfam可參考http://pfam.sanger.ac.uk/，關於Prosite可參考http://www.expasy.org/prosite/。

PPR模體之保守胺基酸序列雖胺基酸級之保守性較低，但二級結構上2個α-螺旋被良好保留。典型之PPR模體係由35個胺基酸構成，但其長度可在30～38個胺基酸內變化。

更具體而言，PPR模體包含式1所表示之長度為30～38個胺基酸之多肽。

[化1] (螺旋A)-X-(螺旋B)-L (式1)

式中：螺旋A為12個胺基酸長度且能夠形成α螺旋結構之部分，其由式2表示，

[化2]

(式2)

式2中，A₁ ～A₁₂ 分別獨立地表示胺基酸； X不存在、或為包含1～9個胺基酸長度之部分；螺旋B為包含11～13個胺基酸長度且能夠形成α螺旋結構之部分； L為2～7個胺基酸長度且由式3表示之部分；

[化3]

(式3)

式3中，各胺基酸從C末端側起編號為''i''(-1)、''ii''(-2)，其中，有時L_iii ～L_vii 不存在。

(PPR密碼(code)) 為了實現與鹼基之特異性結合，PPR模體重要的是第1、4、ii號這3個胺基酸之組合，基於該等之組合，能夠決定所要結合之鹼基為何者。第1、4、ii號這3個胺基酸之組合與能夠結合之鹼基之關係作為PPR密碼為人所知(上述專利文獻2)，如下所述。

(1)當A₁ 、A₄ 、及L_ii 這3個胺基酸之組合依序為纈胺酸、天冬醯胺及天冬胺酸時，該PPR模體具有如下選擇性RNA鹼基結合能力：與U較強地結合，其次與C結合，再其次與A或G結合。 (2)當A₁ 、A₄ 、及L_ii 這3個胺基酸之組合依序為纈胺酸、蘇胺酸、天冬醯胺時，該PPR模體具有如下選擇性RNA鹼基結合能力：與A較強地結合，其次與G結合，再其次與C結合，但不與U結合。 (3)當A₁ 、A₄ 、及L_ii 這3個胺基酸之組合依序為纈胺酸、天冬醯胺、天冬醯胺時，該PPR模體具有如下選擇性RNA鹼基結合能力：與C較強地結合，其次與A或U結合，但不與G結合。 (4)當A₁ 、A₄ 、及L_ii 這3個胺基酸之組合依序為麩胺酸、甘胺酸、天冬胺酸時，該PPR模體具有如下選擇性RNA鹼基結合能力：與G較強地結合，但不與A、U及C結合。 (5)當A₁ 、A₄ 、及L_ii 這3個胺基酸之組合依序為異白胺酸、天冬醯胺、天冬醯胺時，該PPR模體具有如下選擇性RNA鹼基結合能力：與C較強地結合，其次與U結合，再其次與A結合，但不與G結合。 (6)當A₁ 、A₄ 、及L_ii 這3個胺基酸之組合依序為纈胺酸、蘇胺酸、天冬胺酸時，該PPR模體具有如下選擇性RNA鹼基結合能力：與G較強地結合，其次與U結合，但不與A及C結合。 (7)當A₁ 、A₄ 、及L_ii 這3個胺基酸之組合依序為離胺酸、蘇胺酸、天冬胺酸時，該PPR模體具有如下選擇性RNA鹼基結合能力：與G較強地結合，其次與A結合，但不與U及C結合。 (8)當A₁ 、A₄ 、及L_ii 這3個胺基酸之組合依序為苯丙胺酸、絲胺酸、天冬醯胺時，該PPR模體具有如下選擇性RNA鹼基結合能力：與A較強地結合，其次與C結合，再其次與G及U結合。 (9)當A₁ 、A₄ 、及L_ii 這3個胺基酸之組合依序為纈胺酸、天冬醯胺、絲胺酸時，該PPR模體具有如下選擇性RNA鹼基結合能力：與C較強地結合，其次與U結合，但不與A及G結合。 (10)當A₁ 、A₄ 、及L_ii 這3個胺基酸之組合依序為苯丙胺酸、蘇胺酸、天冬醯胺時，該PPR模體具有如下選擇性RNA鹼基結合能力：與A較強地結合，但不與G、U及C結合。 (11)當A₁ 、A₄ 、及L_ii 這3個胺基酸之組合依序為異白胺酸、天冬醯胺、天冬胺酸時，該PPR模體具有如下選擇性RNA鹼基結合能力：與U較強地結合，其次與A結合，但不與G及C結合。 (12)當A₁ 、A₄ 、及L_ii 這3個胺基酸之組合依序為蘇胺酸、蘇胺酸、天冬醯胺時，該PPR模體具有如下選擇性RNA鹼基結合能力：與A較強地結合，但不與G、U及C結合。 (13)當A₁ 、A₄ 、及L_ii 這3個胺基酸之組合依序為異白胺酸、甲硫胺酸、天冬胺酸時，該PPR模體具有如下選擇性RNA鹼基結合能力：與U較強地結合，其次與C結合，但不與A及G結合。 (14)當A₁ 、A₄ 、及L_ii 這3個胺基酸之組合依序為苯丙胺酸、脯胺酸、天冬胺酸時，該PPR模體具有如下選擇性RNA鹼基結合能力：與U較強地結合，其次與C結合，但不與A及G結合。 (15)當A₁ 、A₄ 、及L_ii 這3個胺基酸之組合依序為酪胺酸、脯胺酸、天冬胺酸時，該PPR模體具有如下選擇性RNA鹼基結合能力：與U較強地結合，但不與A、G及C結合。 (16)當A₁ 、A₄ 、及L_ii 這3個胺基酸之組合依序為白胺酸、蘇胺酸、天冬胺酸時，該PPR模體具有如下選擇性RNA鹼基結合能力：與G較強地結合，但不與A、U及C結合。

(P陣列) PPR蛋白根據所構成之PPR模體之結構，被分類為P與PLS這2個家族。 P型PPR蛋白係由標準之35個胺基酸之PPR模體(P)之單純重複(P陣列)所構成。本發明之DYW域可與P型PPR蛋白連結來使用。

(PLS陣列) PLS型PPR蛋白之PPR模體之排列係以P1、L1、及S1這3個PPR模體之重複單元之形式構成，於其重複之C末端側連著P2、L2、及S2模體。進而，有時於該尾端之P2L2S2模體之C末端側連著被稱為E1及E2這2個類PPR模體、及DYW域。

只要能夠與目標鹼基結合，P1之全長便無特別限定，例如長度為33～37個胺基酸，較佳為長度34～36個胺基酸，更佳為長度35個胺基酸。只要能夠與目標鹼基結合，L1之全長便無特別限定，例如長度為33～37個胺基酸，較佳為長度34～36個胺基酸，更佳為長度35個胺基酸。只要能夠與目標鹼基結合，S1之全長便無特別限定，例如長度為30～33個胺基酸，較佳為長度30～32個胺基酸，更佳為長度31個胺基酸。

只要能夠與目標鹼基結合，P2之全長便無特別限定，例如長度為33～37個胺基酸，較佳為長度34～36個胺基酸，更佳為長度35個胺基酸。只要能夠與目標鹼基結合，L2之全長便無特別限定，例如長度為34～38個胺基酸，較佳為長度35～37個胺基酸，更佳為長度36個胺基酸。只要能夠與目標鹼基結合，S2之全長便無特別限定，例如長度為30～34個胺基酸，較佳為長度31～33個胺基酸，更佳為長度32個胺基酸。序列編號：17、22、及27中示出本說明書之實施例項中使用之P2之序列。序列編號：18、23、及28中示出本說明書之實施例項中使用之L2之序列。序列編號：19、24、及29中示出本說明書之實施例項中使用之S2之序列。

只要能夠與目標鹼基結合，E1之全長便無特別限定，例如長度為32～36個胺基酸，較佳為長度33～35個胺基酸，更佳為長度34個胺基酸。序列編號：20、25、30中示出本說明書之實施例項中使用之E1之序列。

只要能夠與目標鹼基結合，E2之全長便無特別限定，例如長度為30～34個胺基酸，較佳為長度31～33個胺基酸，更佳為長度33個胺基酸。序列編號：21、26、31中示出本說明書之實施例項中使用之E2之序列。

於PLS型PPR蛋白中，P1L1S1之重複部分及P2之前之部分可依據上述PPR密碼規則，按照目標RNA之序列進行設計。

S2模體與第ii號胺基酸(序列編號19之第31號之N)所對應之核苷酸有關聯(上述非專利文獻8)。又，留意到S2模體之目標鹼基之右側第4個鹼基(C或U)為DYW域之編輯目標鹼基，可組入至PLS型PPR蛋白。

E1模體中，發現僅第4號(序列編號：20之第4號之G)胺基酸與核苷酸有關聯(Ruwe et al. (2019) New Phytol. 222 218-229.)。

E2模體中之第4號(序列編號：21之第4號之V)及尾端(序列編號：21之第33號之K)之胺基酸得以高度地保留，不參與特定之PPR-RNA識別(上述非專利文獻2)。

只要可與目標鹼基序列結合，P1L1S1之重複數目便無特別限定，例如為1～5，較佳為2～4，更佳為3。原理上，亦能夠使用1個單元(3個)。已知，PPR模體由5個構成之MEF8(L1-S1-P2-L2-S2-E-DYW)與約60處之編輯相關。

天然PPR蛋白中，發現位於首端與尾端之P1L1S1與處於特定位置之胺基酸殘基有明確之差異，不同於內部之P1L1S1。就設計出與天然存在者儘可能相近之人工PLS陣列之觀點而言，宜分為位於首位(N末端側)之P1L1S1、位於內部之P1L1S1、及位於P2L2S2之正前方之尾端(C末端側)P1L1S1，設計與PPR模體位置對應之3種P1L1S1。再者，有別於天然存在之由P-L-S之重複單元所構成者，亦存在重複出現SS(31個胺基酸)之情況，此種PPR蛋白亦能夠用於本發明。

[DYW蛋白] 本發明提供一種用以編輯目標RNA之DYW蛋白，其包含如下RNA結合域、及為上述DYW：PG、DYW：WW、或DYW：KP之任一者之DYW域，上述RNA結合域包含至少一個PPR模體，且能夠依據PPR密碼規則與目標RNA具序列特異性地結合。

此種DYW蛋白可為人工物。人工係指人為合成之蛋白而非天然蛋白。以下情形屬於人工：例如，具有非天然存在之序列之DYW域之情形，具有非天然存在之序列之PPR結合域之情形，具有RNA結合域與DYW域之非天然存在之組合之情形，進而附加有動物細胞中之RNA編輯用蛋白質、源自植物之天然DYW蛋白中不存在之部分、例如核定位訊號、人類線粒體定位訊號之情形。作為核定位訊號序列，例如可例舉源自SV40大T抗原之PKKKRKV(SEQ ID NO：32)、作為核質蛋白之NLS的KRPAATKKAGQAKKKK(SEQ ID NO：33)等。

PPR模體之個數可根據目標RNA之序列來適當設定。PPR模體之個數有至少一個即可，亦可為2個以上。已知，PPR模體為2個且能夠與RNA結合(Nucleic Acids Research, 2012, Vol. 40, No.6, 2712-2723)。

DYW蛋白之一較佳之形態如下所述。一種用以編輯目標RNA之人工DYW蛋白，其包含如下RNA結合域、及為上述DYW：PG、DYW：WW、或DYW：KP之任一者之DYW域，上述RNA結合域包含至少一個、較佳為2～25個、更佳為5～20個、進而較佳為10～18個PPR模體，且能夠依據PPR密碼規則與目標RNA具序列特異性地結合。

DYW蛋白之另一較佳之形態如下所述。一種用以編輯目標RNA之DYW蛋白，其包含如下RNA結合域(較佳為作為PLS型PPR蛋白的RNA結合域)、及為上述DYW：PG、DYW：WW、或DYW：KP之任一者之DYW域，上述RNA結合域包含至少一個、較佳為2～25個、更佳為5～20個、進而較佳為10～18個PPR模體，且能夠依據PPR密碼規則與動物之目標RNA具序列特異性地結合。

本發明之作為DYW域、RNA結合域之PPR蛋白、及DYW蛋白能夠利用業者熟知之方法來相對大量地製備。此種方法可包括如下步驟：根據目標域或蛋白質所具有之胺基酸序列來決定編碼其之核酸序列，進行選殖，製作生產目標域或蛋白質之轉形體。

[DYW蛋白之用途] (編碼DYW蛋白等之核酸、載體、細胞) 本發明亦提供上述PPR模體、DYW蛋白、或編碼DYW蛋白之核酸、包含核酸之載體(例如用以擴增之載體、表現載體)。載體亦包括病毒載體。用以擴增之載體可使用大腸桿菌或酵母作為宿主。於本說明書中，表現載體例如係指如下載體，其自上游起包含具有啟動子序列之DNA、編碼所需蛋白質之DNA、及具有終止子序列之DNA；只要發揮所需之功能，未必需要按照該順序排列。於本發明中，可將業者通常能夠使用之各種載體進行重組後使用。

具體而言，本發明提供一種編碼DYW蛋白之核苷酸序列，該DYW蛋白包含RNA結合域(較佳為作為PLS型PPR蛋白的RNA結合域)、及為上述DYW：PG、DYW：WW、或DYW：KP之任一者之DYW域，上述RNA結合域包含至少一個PPR模體，且能夠依據PPR密碼規則與目標RNA(較佳為動物之目標RNA)具序列特異性地結合。

又，具體而言，本發明提供一種用以編輯目標RNA之載體，其包含編碼DYW蛋白之核苷酸序列，該DYW蛋白包含RNA結合域(較佳為作為PLS型PPR蛋白的RNA結合域)、及為上述DYW：PG、DYW：WW、或DYW：KP之任一者之DYW域，上述RNA結合域包含至少一個PPR模體，且能夠依據PPR密碼規則與目標RNA(較佳為動物之目標RNA)具序列特異性地結合。

本發明之DYW蛋白能夠於真核生物(例如動物、植物、微生物(酵母等)、原生生物)之細胞中發揮功能。本發明之DYW蛋白尤其於動物細胞內(體外(in vitro)或體內(in vivo))發揮功能。作為能夠導入本發明之DYW蛋白、或表現DYW蛋白之載體之動物細胞，例如可例舉源自人類、猴、豬、牛、馬、狗、貓、小鼠、大鼠之細胞。又，作為能夠導入本發明之DYW蛋白、或表現DYW蛋白之載體之培養細胞，例如可例舉：中國倉鼠卵巣(CHO)細胞、COS-1細胞、COS-7細胞、VERO(Verda reno，非洲綠猴腎細胞)(ATCC(American Type Culture Collection，美國標準生物品收藏中心) CCL-81)細胞、BHK(Baby Hamster Syrian Kidney，幼倉鼠腎細胞)細胞、源自犬腎之MDCK細胞、倉鼠AV-12-664細胞、HeLa細胞、WI38細胞、HEK293細胞、HEK293T細胞、PER.C6細胞，但並不限定於該等。

(用途) 藉由本發明之DYW蛋白，可將目標RNA中包含之編輯目標C轉化為U，或將編輯目標U轉化為C。RNA結合性PPR蛋白與胞器中可見之全部RNA加工之步驟、切割、RNA編輯、轉譯、剪接、RNA穩定化相關。

又，藉由本發明之DYW蛋白，能夠實現線粒體之RNA 1個鹼基編輯。線粒體具有獨立之基因組，編碼與呼吸或ATP(adenosine triphosphate，腺苷三磷酸)生產相關之重要複合體之結構蛋白。已知因其等之變異而會引起各種疾病之發病。藉由使用本發明來修復變異，可期待對各種疾病進行處置。

另一方面，CRISPR-Cas系統藉由使Cas蛋白與經改型之ADAR域融合，而被開發成細胞質中之C-to-U RNA編輯工具(Abudayyeh et al.，2019年)。然而，CRISPR-Cas系統係由蛋白質與嚮導RNA構成，難以將嚮導RNA有效率地輸送至線粒體。另一方面，PPR蛋白能夠以1分子進行RNA編輯，一般，蛋白質藉由使線粒體定位訊號序列融合於N末端側，而能夠傳遞至線粒體。因此，為了確認本技術能否用於線粒體之RNA編輯，設計以MT-ND2與MT-ND5為目標之PPR，製作出融合有PG或WW域之基因(圖10a)。

為了不對HEK293T細胞造成不良影響，該等包含線粒體目標序列(MTS)與PPR-P序列之蛋白質係以MT-ND2與MT-ND5之第178組及第301組密碼子之第3號之位置作為目標(圖10a)。利用質體導入至HEK293T細胞後，於MT-ND2與MT-ND5之mRNA內確認到編輯(圖10b、c)。檢測出該等4個蛋白質對靶有最高70%之編輯活性，對於同一mRNA分子未檢測到脫靶變異(圖10b、c)。

因此，可期待本發明所提供之RNA鹼基之編輯方法有如下之於各種領域中之用途。

(1)醫療・識別與特定疾病相關之特定RNA並進行編輯。藉由利用本發明，能夠處置因1個鹼基變異引起之遺傳病。遺傳病中，大部分變異方向為從C到U之變異。因此，尤其可將U轉化為C之本發明之方法有用。

・製作RNA之抑制/表現得到控制之細胞。此種細胞包括：分化/未分化狀態受到監測之幹細胞(例如iPS細胞(induced Pluripotent Stem Cell，誘導性多能幹細胞))、化妝品之評價用模型細胞、以藥物開發之機制分析或藥理試驗為目的而能夠開啟/關閉(ON/OFF)功能性RNA表現之細胞。

(2)農林水產業・對於農作物、林產物、水產物等改善產量或品質。・育種抗病性提昇、環境抗力提高、具有得到改善之功能或新功能性之生物。

例如，關於雜種第一代(F1)作物，藉由利用DYW蛋白進行之線粒體RNA編輯，人工地創造出F1代作物，有能夠改善產率或品質之可能性。相較於先前技術，利用DYW蛋白之RNA編輯能夠精確且迅速地進行生物之品種改良、育種(以遺傳方式改良生物)。又，利用DYW蛋白之RNA編輯由於並非如基因重組般藉由外來基因來轉形，故可認為其類似於變異體選拔或回交這種以往之育種方法。因此，亦能夠確實且迅速地應對全球規模之糧食問題、環境問題。

(3)化學・於利用微生物、培養細胞、植物體、動物體(例如昆蟲體)之有用物質生產中，藉由RNA之操作來控制蛋白質之表現量。藉此，可提高有用物質之生產性。作為有用物質之例，除了抗體、疫苗、酵素等蛋白質性物質外，有醫藥品之中間物、香料、色素等相對低分子之化合物。

・藉由改變藻類或微生物之代謝路徑，來改善生物燃料之生產效率。

[用語] 數值範圍x～y除非有特別記載，否則包含兩端之值x及y。

關於蛋白質或多肽之胺基酸序列，有時將胺基酸殘基簡稱為胺基酸。

關於鹼基序列(亦有時稱為核苷酸序列)或胺基酸序列之「同一性」，係指於使2個序列以最佳形態排列之情形時，2個序列間所共有之一致之鹼基或胺基酸之個數之百分率，但有特別記載之情形除外。即，可由同一性＝(一致之位置個數/位置總數)×100來算出，可使用市售之演算法進行計算。又，此種演算法可導入至Altschul et al., J. Mol. Biol. 215(1990) 403-410中記載之NBLAST及XBLAST程式中。更詳細而言，與鹼基序列或胺基酸序列之同一性有關之檢索、分析可利用業者周知之演算法或程式(例如BLASTN、BLASTP、BLASTX、ClustalW)進行。使用程式時之參數可由業者適當設定，又，亦可使用各程式之預設參數。又，該等分析方法之具體方式亦被業者周知。

關於鹼基序列或胺基酸序列之序列同一性，除非有特別記載，否則較佳為較高。具體而言，較佳為40%以上，更佳為45%以上，進而較佳為50%以上，進而較佳為55%以上，進而較佳為60%以上，進而較佳為65%以上。又，較佳為70%以上，更佳為80%以上，進而較佳為85%以上，進而較佳為90%以上，進而較佳為95%以上，進而較佳為97.5%以上。

關於多肽或蛋白質，「置換、缺失、或附加而成之序列」時之被置換等之胺基酸個數只要於任一模體或蛋白質中包含此胺基酸序列之模體或蛋白質均具有所需功能，便無特別限定，可為1～9個或1～4個左右，或者當置換為性質相似之胺基酸時可有更多個數之置換等，但有特別記載之情形除外。用以製備與此種胺基酸序列相關之聚核苷酸或蛋白質之方法已被業者熟知。

性質相似之胺基酸係指親水性、帶電、pKa、溶解性等物性相似之胺基酸，例如指如下胺基酸。疏水性(非極性)胺基酸：丙胺酸、纈胺酸、甘胺酸、異白胺酸、白胺酸、苯丙胺酸、脯胺酸、色胺酸、酪胺酸；非疏水性胺基酸：精胺酸、天冬醯胺、天冬胺酸、麩胺酸、麩醯胺、離胺酸、絲胺酸、蘇胺酸、半胱胺酸、組胺酸、甲硫胺酸；親水性胺基酸：精胺酸、天冬醯胺、天冬胺酸、麩胺酸、麩醯胺、離胺酸、絲胺酸、蘇胺酸；酸性胺基酸：天冬胺酸、麩胺酸；鹼性胺基酸：離胺酸、精胺酸、組胺酸；中性胺基酸：丙胺酸、天冬醯胺、半胱胺酸、麩醯胺、甘胺酸、異白胺酸、白胺酸、甲硫胺酸、苯丙胺酸、脯胺酸、絲胺酸、蘇胺酸、色胺酸、酪胺酸、纈胺酸；含硫胺基酸：甲硫胺酸、半胱胺酸；含芳香環胺基酸：酪胺酸、色胺酸、苯丙胺酸。 [實施例]

[1.DYW域之設計及於大腸桿菌內之RNA編輯活性測定] [結果] (DYW域之設計) 由於目前能夠利用之植物基因組資訊絕大多數為被子植物之資訊，故人工DYW蛋白之開發被限定為DYW：PG型。另一方面，轉錄組資料亦包括具有C-to-U及U-to-C這兩種RNA編輯之早期陸地植物種之資訊，但為部分序列。因此，我們使用基於由1000 Plants(1KP)國際聯盟製作之轉錄組資料集所構建之PPR蛋白之資料庫(上述非專利文獻11)，設計出完整之人工DYW域。

設計人工DYW域時，除了類胞苷去胺酶DYW域以外，還在設計中增加PPR(P2及L2)模體以及類PPR(S2、E1及E2)模體。其原因在於，目前仍未獲知該等模體對於RNA編輯活性之重要性。我們製作出角苔類、石松類及蕨類植物之DYW域之系統樹，並分類為DYW：PG、DYW：WW及DYW：KP這3個群。繼而，對該等群每一群之DYW域分別再重新製作系統樹，選拔出能夠用於設計人工DYW域之蛋白質之系統群(圖1)。DYW：PG群由於序列間之差異較大，故難以選擇出用於設計之蛋白質系統群(圖1a)。石松類之蛋白質序列富於多樣性，且數量亦較多，故我們聚焦於該蛋白質(PG1)。設計DYW：WW域時，選擇僅見於角苔類之分枝短之蛋白質系統群(圖1b，WW1)。由於該系統群之分枝短，故推測蛋白質間之基因變異小。並且，DYW：KP域之設計時著眼於蕨類植物所特異性之DYW域之系統群。該系統群中所含之蛋白質序列雖然胺基酸之變異大，但長度方面得以保留(圖1c，KP1)。

(RNA結合域之設計) 我們使各DYW域與基於根據植物之基因組資訊所鑑定出之PPR模體序列(上述非專利文獻2)而設計的人工P或PLS陣列融合(圖2a)。P陣列之PPR模體係基於由35個胺基酸之P模體之比對獲得之共通序列來構建，為了提高RNA識別，對若干胺基酸進行了置換。設計PLS陣列時，選出標準長度之35個胺基酸之模體(P1及L1)及31個胺基酸之模體(S1)。天然PPR蛋白中，發現位於首端與尾端之P1L1S1與處於特定位置之胺基酸殘基有明確差異，不同於內部之P1L1S1。為了設計出與天然存在之PPR蛋白儘可能相近之人工PLS陣列，分為位於首位(N末端側)之P1L1S1、位於內部之P1L1S1、及位於P2L2S2之正前方之尾端(C末端側)P1L1S1，設計出與PPR模體位置對應之3種P1L1S1。此後，基於該等蛋白質之結構來命名蛋白質。例如，將使P陣列與DYW：WW域融合而得者稱為P-DYW：WW。

(人工DYW蛋白能夠特異性地編輯目標序列) 阿拉伯芥中，PPR蛋白CLB19識別位於葉綠體rpoA及clpP RNA上之RNA編輯部位。我們決定設計以rpoA編輯部位為目標之PPR蛋白。P1、L1、S1及P2模體中之第4號與第ii號胺基酸遵循PPR密碼。另一方面，由於尚未獲知關於C末端之類PPR模體(L2、S2、E1、E2)之PPR密碼，故L2、S2、E1及E2模體使用CLB19之第4號與第ii號胺基酸(圖2b)。

將編碼重組人工DYW蛋白之基因區選殖於表現載體，並於其終止密碼子之下游附加目標序列。基於先前開展之小立碗蘚之2種PPR蛋白(PPR56、PPR65)之相關研究(上述非專利文獻12)，開發出於大腸桿菌內對所設計之PPR蛋白之RNA編輯活性進行試驗之方法。未發現所設計之PLS-DYW：PG1及PLS-DYW：WW1對DNA有編輯活性，但另一方面，針對RNA，以超過90%之編輯效率將胞苷置換為尿苷(圖3a、b、d)。於使用P陣列代替PLS域之情形時，編輯效率降低了10～40%。另一方面，發現P-DYW：KP及PLS-DYW：KP兩者有U-to-C RNA編輯活性(圖3c、e)。然而，其編輯活性低於DYW：PG及DYW：WW。

[方法] (系統樹) 從PPR資料庫(https://ppr.plantenergy.uwa.edu.au/onekp/；上述非專利文獻11)中提取出包含DYW域(最短132個胺基酸)之P2-L2-S2-E1-E2-DYW區域。使用MAFFT L-INS-i(v7.407 自動化模式(automatic mode))(K. Katoh, D. M. Standley (2013). Mol Biol Evol. 30(4): 772-780.)製作所獲得之序列之比對，其後，使用trimAl(v.1.4.rev15)(Salvador Capella-Gutiérrez, et al. (2009). Bioinformatics. 25(15): 1972-1973.)進行修整。修整時，將參數設為gt 0.2 cons20。從比對中排除活性部位(HxEx_n CxxCH)具有變異之序列(圖4)。

使用FastTree(v2.1.10)(Price, M. N., et al. (2010). PloS One 5: e9490.)，由剩餘之序列製作系統樹，鑑定出DYW：PG、DYW：WW及DYW：KP。此時之參數設為wag及cat 8。

(Trx-PPR-DYW蛋白及目標序列之選殖) 使用EMBOSS: cons(v.6.6.0.0)，設計各DYW域(包含P2、L2、S2、E1、E2)之共通序列。關於蛋白質表現用載體，對pET21b＋PA進行改型而將原有之Esp3I與Bpi I限制酶部位去除，並附加作為選殖位點之2個Esp3I部位。基因係分為4個區(Trx、PPR陣列、DYW域及RNA編輯部位)並使用兩階段之Golden Gate法來構建。首先，於改型pET21b載體之Esp3I部位選殖如下3個部分：1)硫氧化還原蛋白-6×His-TEV基因區(於3'包含BpiI限制酶部位)、2)P2-L2-S2-E1-E2-DYW基因區(於5'包含BpiI限制酶部位)、及3)RNA編輯部位之編碼序列區。繼而，於BpiI部位選殖全長PLS域或P域，製作PLS：DYW(序列編號：35～37)或P：DYW(序列編號：38～40)蛋白。

(於大腸桿菌內之RNA編輯活性測定) 為了於大腸桿菌內對重組蛋白之RNA編輯活性進行分析，我們對Oldenkott等人開發之規程(上述非專利文獻12)進行變更。將上述製作之質體DNA導入至大腸桿菌Rosetta 2株，於1 mL之LB培養基(含有羧苄西林50 µg/mL及氯黴素17 µg/mL)中在37℃下培養一夜。準備5 mL之含適當抗生素之LB培養基置於24孔深孔板中，向其中接種預培養液100 µL。使該培養液於37℃、200 rpm之條件下生長，直至吸光度(OD₆₀₀ )達到0.4～0.6，其後，將培養板於4℃下冷卻10～15分鐘。繼而，添加0.4 mM之ZnSO₄ 與0.4 mM之IPTG(Isopropyl β-D-thiogalactoside，異丙基-β-D-硫代半乳糖苷)，進而於16℃、180 rpm之條件下培養18小時。取培養液750 µL進行離心分離後，使菌體顆粒於液態氮中冷凍，並於-80℃下保存。

使冷凍之細胞塊再懸浮於200 µL之1-硫代甘油/勻漿化溶液中，以40 W進行10秒超音波處理而使細胞分離後，添加200 µL之溶解緩衝液。使用Maxwell(註冊商標)RSC simplyRNA Tissue Kit(Promega公司)提取RNA。利用DNaseI(塔卡拉生物公司)對RNA進行處理，使用SuperScript(註冊商標)III反轉錄酶(Reverse Transcriptase)(Invitrogen公司)，並使用經處理之RNA 1 µg與1.25 µM之隨機引子(6 mer)來合成cDNA。使用NEBNext High-Fidelity 2x PCR Master Mix(New England Biolabs公司)、1 µL之cDNA、及硫氧化還原蛋白與T7終止子序列之引子，使包含編輯部位之區域進行擴增。利用NucleoSpin(註冊商標)Gel and PCR Cleanup(塔卡拉生物公司)對PCR產物進行純化，使用對DYW域序列具特異性之正向引子進行序列分析，決定RNA編輯部位之鹼基。RNA編輯效率之測定使用編輯部位之C與U之波峰高度比，C-to-U RNA編輯效率係根據U/(C＋U)×100算出，U-to-C編輯效率係根據C/(C＋U)×100算出。反覆進行3次獨立實驗。

[引用序列一覽]

[表3-1]

[表3-2]

[表3-4]

[2.於動物培養細胞中之實施例] [結果] 將融合有PLS型PPR與各DYW域(PG1(序列編號：1)、WW1(序列編號：2)、KP1(序列編號：3))之基因與含目標序列之質體轉染至HEK293T細胞，培養後回收RNA。藉由桑格定序法，對目標部位之胞苷(C)轉化為尿苷(U)、或尿苷(U)轉化為胞苷(C)之轉化效率進行分析(圖5)。當融合有PG1或WW1域時，有90%以上之C to U活性，但另一方面，未檢測到U to C活性(圖5a、c)。當融合有KP1域時，檢測到U to C活性有25%，但亦檢測到10%左右之C to U活性(圖5b、c)。據此得知，編輯酶亦於動物培養細胞中發揮功能。

[方法] (動物培養細胞試驗用PPR表現質體之製作) 利用PCR(Polymerase Chain Reaction，聚合酶鏈反應)，自圖3中使用之質體擴增6×His-PPR-DYW蛋白(與利用大腸桿菌之實驗中使用之蛋白質相同(序列編號：35～37))基因序列與包含編輯位點之區域(序列編號：34)，藉由Golden Gate Assembly法選殖於動物細胞表現載體。載體係以包含CMV啟動子與人類β-球蛋白嵌合內含子之啟動子控制化使PPR表現，由SV40(Simian virus 40，猴病毒40)多腺苷酸化訊號(polyadenylation signal)賦予poly A訊號。

(HEK293T細胞培養) HEK293T細胞係使用向包含高葡萄糖、麩醯胺、酚紅、丙酮酸鈉(富士膠片和光純藥股份有限公司)之杜氏改良伊格爾培養基(Dulbecco's Modified Eagle Medium，DMEM)中添加10%胎牛血清(Capricorn公司)與1%青黴素-鏈黴素(富士膠片和光純藥股份有限公司)而得者，於37℃、5%CO₂ 條件下進行培養。當細胞融合80～90%之時刻，每2～3天進行繼代。

(轉染) RNA編輯檢定中，向24孔平底細胞培養板之各孔中加入HEK293T細胞約8.0×10⁴ 個，於37ºC、5%CO₂ 條件下培養24小時。向各孔中添加500 ng之質體、以及18.5 µl之Opti-MEM(註冊商標)I減血清培養基(I Reduced Serum Medium)(ThermoFisher公司)與1.5 µl之FuGENE(註冊商標)HD轉染試劑(Transfection Reagent)(Promega公司)，最終定容為25 µl。混合液於添加至細胞之前，於室溫下培養10分鐘。轉染24小時後回收細胞。

(RNA提取、反轉錄、定序) 以與上述於大腸桿菌中之檢定相同之方式進行。再者，以下之實施例中除非有特別記載，否則利用與在大腸桿菌中之檢定及本實施例相同之方法進行實驗。

[3. 域交換引起之對RNA編輯活性之影響] DYW域根據胺基酸序列之保守性可劃分為若干區域，但尚未獲知該等與RNA編輯活性之相關性。此處，將KP1與WW1域之一部分交換，於HEK239T細胞中調查研究對RNA編輯活性造成之影響(圖6)。於使WW1域之PG盒與DYW融合於KP1域之包含活性位點(Active site)之中央部位而得者(chimKP1a 序列編號：90)中，確認到較KP1域高將近50%之U to C活性，進而得知C to U活性幾乎消失。藉由域交換，成功改善了KP域之U to C編輯之性能。

[4.由變異之導入獲得之KP域之RNA編輯活性之改善] 為了提高KP域之RNA編輯活性，對KP域導入各種變異。設計出KP2～KP23(序列編號：68～89)，於大腸桿菌(圖7a)及HEK293T細胞(圖7b、c)中調查研究C to U或U to C之RNA編輯活性。KP22(序列編號：88)之U to C編輯活性最高，C to U編輯活性最低，與KP1相比，成功改善了RNA編輯活性。

[5.由變異之導入獲得之PG域之RNA編輯活性之改善] 為了提高PG域之RNA編輯活性，對PG域導入各種變異。設計出PG2～PG13(序列編號：41～53)，於大腸桿菌(圖8a)及HEK293T細胞(圖8b、c)中調查研究C to U之RNA編輯活性。PG11(序列編號：50)之C to U編輯活性最高，成功改善了RNA編輯活性。

[6.由變異之導入獲得之WW域之RNA編輯活性之改善] 為了提高WW域之RNA編輯活性，對WW域導入各種變異。設計出WW2～WW14，於大腸桿菌(圖9a)及HEK293T細胞(圖9b、c)中調查研究C to U之RNA編輯活性。WW11(序列編號：63)之C to U編輯活性最高，與WW1相比，成功改善了RNA編輯活性。

[7.使用PPR蛋白之人類線粒體RNA編輯] [結果] 線粒體具有獨立之基因組，編碼與呼吸或ATP生產有關之重要複合體之結構蛋白。已知因其等之變異而會引起各種疾病之發病，業界正謀求變異修復之方法。

CRISPR-Cas系統係藉由使Cas蛋白與經改型之ADAR區融合，而被開發成細胞質中之C-to-U RNA編輯工具(Abudayyeh et al. 2019 Science Vol.365, Issue 6451, pp. 382-386)。然而，CRISPR-Cas系統係由蛋白質與嚮導RNA構成，難以將嚮導RNA有效率地輸送至線粒體。另一方面，PPR蛋白能夠以1分子進行RNA編輯，一般，蛋白質藉由使線粒體定位訊號序列融合於N末端側，而能夠傳遞至線粒體。因此，為了確認本技術能否用於線粒體之RNA編輯，設計以MT-ND2與MT-ND5為目標之PPR，製作出融合有PG1或WW1域之基因(圖10a)。

為了不對HEK293T細胞造成不良影響，該等包含線粒體目標序列(MTS)與P-DYW序列之蛋白質係以MT-ND2與MT-ND5之第178組及第301組密碼子之第3號位置作為目標(圖10a)。利用質體導入至HEK293T細胞後，於MT-ND2與MT-ND5 mRNA內確認到編輯(圖10b、c)。檢測出該等4個蛋白質對靶有最高70%之編輯活性，對於同一mRNA分子未檢測到脫靶變異(圖10b、c)。

[方法] (用以進行線粒體編輯之選殖) 藉由Golden Gate Assembly，將來自玉米(Zea mays)之LOC100282174蛋白之線粒體目標序列(Chin et al. 2018)、10個PPR-P及類PPR模體、及DYW域部分(DYW域使用PG1與WW1)選殖於CMV啟動子控制下之表現質體(序列編號：91～94)。

[引用序列一覽]

[表4-1]

[表4-2]

[表4-3]

[表4-4]

圖1表示DYW蛋白中之C末端區之近似最大似然系統樹。使用FastTree，製得(a)DYW：PG型、(b)DYW：WW型及(c)DYW：KP型域之系統樹。DYW：PG域係基於源自石松類之DYW：PG蛋白而設計。用黑線表示用以設計DYW：WW及DYW：KP域所選擇之蛋白質之系統群(演化支)。使用iTOL(Letunic, I. And Bork, P. (2016) Nucleic Acids Res. 44 W242-245)使系統樹可視化，紅色表示源自角苔類之蛋白質，綠色表示源自石松類之蛋白質，藍色表示源自蕨類植物之蛋白質。圖2表示本研究所設計之PPR蛋白之構成。(a)中，PPR蛋白包含：位於N末端側之硫氧化還原蛋白、His-標籤及TEV(Tobacco Etch Virus，菸草蝕紋病毒)部位、其後之包含P或PLS模體之PPR陣列、及位於最後之DYW域(DYW：PG、DYW：WW或DYW：KP)。PPR蛋白之目標序列(包含RNA編輯部位在內)插入至終止密碼子之下游。(b)表示P、P1、L1、S1及P2模體內之與RNA識別相關之第4號與第ii號胺基酸。L2、S2、E1及E2之第4號與第ii號胺基酸和CLB19相同(Chateigner-Boutin, A. L., et al. (2008) .Plant J. 56590-602.)。圖3表示使用大腸桿菌之RNA編輯檢定。(a)表示各PPR-DYW於DNA上之目標鹼基(C或T)。(b)表示PPR-DYW：PG及WW之C-to-U RNA編輯活性，(c)表示PPR-DYW：KP之U-to-C RNA編輯活性。例示獨立進行3次實驗之結果中之一例。(d)表示測定3次C-to-U RNA編輯效率所得之平均值，(e)表示測定3次U-to-C RNA編輯效率所得之平均值(其中，P-DYW：KP為2次)。誤差杠表示標準偏差。圖4-1表示選拔出之各DYW域系統群中之胺基酸之出現頻度。利用藉由WebLogo製作之序列標識圖(Sequence logo)而形象化。圖4-2及圖4-3中相同。(a)表示DYW：PG。圖4-2中，(b)表示DYW：WW。圖4-3中，(c)表示DYW：KP。圖5表示HEK293T細胞中之RNA編輯活性(C to U或U to C)。示出PLS型中融合有PG1或WW1域(a)、或者KP1域(b)時之目標部位之定序結果。亦示出3次獨立實驗中之RNA編輯活性(c)。條形圖表示平均值，各點表示3次實驗中之RNA編輯活性。左側條形圖表示C to U編輯活性，右側條形圖表示U to C編輯活性。圖6表示基於域交換(Domain swapping)獲得之KP域性能之提高。保留KP1之包含活性位點(Active site)(HxEx_n CxxCH)之中央部分，前後域與WW1域交換而獲得嵌合KP1a，對該嵌合KP1a之RNA編輯活性進行調查。示出域交換之模式圖(a)、及實際之RNA編輯活性(b、c)。圖7表示KP域變異體之RNA編輯活性之測定。示出KP1、KP2、KP3、KP4於大腸桿菌中之RNA編輯活性(a)、及於HEK293T中之RNA編輯活性(b)、KP5～KP23於HEK293T中之RNA編輯活性(c)。圖8表示PG域變異體之RNA編輯活性之測定。示出PG1、PG2於大腸桿菌中之RNA編輯活性(a)、及於HEK293T中之RNA編輯活性(b)。亦示出PG3～PG13於HEK293T中之RNA編輯活性(c)。圖9表示WW域變異體之RNA編輯活性之測定。示出WW1、WW2於大腸桿菌中之RNA編輯活性(a)、及於HEK293T中之RNA編輯活性(b)。亦示出WW3～WW14於HEK293T中之RNA編輯活性(c)。圖10表示人類線粒體RNA編輯。示出目標序列資訊(a)。亦示出RNA編輯活性(b、c)。

Claims

一種編輯目標RNA之方法，其將包含如下DYW域之人工DYW蛋白應用於目標RNA，上述DYW域包含下述a、b、c、及bc之任一多肽； a.具有x_a1 PGx_a2 SWIEx_a3 -x_a16 HP…Hx_aa E…Cx_a17 x_a18 CH…DYW，與序列編號：1之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 b.具有x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_bb E…Cx_b17 x_b18 CH…DYW，與序列編號：2之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 c.具有KPAx_c1 Ax_c2 IEx_c3 …Hx_cc E…Cx_c4 x_c5 CH…x_c6 x_c7 x_c8 ，與序列編號：3之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 bc.具有x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_cc E…Cx_c4 x_c5 CH…Dx_bc1 x_bc2 ，與序列編號：2之90之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 (序列中，x表示任意之胺基酸，…表示任意之多肽片段)。
一種DYW域，其包含下述a、b、c、及bc之任一多肽； a.具有x_a1 PGx_a2 SWIEx_a3 -x_a16 HP…Hx_aa E…Cx_a17 x_a18 CH…DYW，與序列編號：1之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 b.具有x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_bb E…Cx_b17 x_b18 CH…DYW，與序列編號：2之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 c.具有KPAx_c1 Ax_c2 IEx_c3 …Hx_cc E…Cx_c4 x_c5 CH…x_c6 x_c7 x_c8 ，與序列編號：3之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 bc.具有x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_cc E…Cx_c4 x_c5 CH…Dx_bc1 x_bc2 ，與序列編號：2之90之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽。
一種DYW蛋白，其包含如下RNA結合域、及如請求項2之DYW域，上述RNA結合域包含至少一個PPR模體，且能夠與目標RNA具序列特異性地結合。
如請求項2之DYW蛋白，其中RNA結合域為PLS型。
一種編輯目標RNA之方法，其包括如下步驟：將包含下述c或bc之多肽之DYW域應用於目標RNA，而將編輯目標U轉化為C； c.具有KPAx_c1 Ax_c2 IEx_c3 …Hx_cc E…Cx_c4 x_c5 CH…x_c6 x_c7 x_c8 ，與序列編號：3之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽 bc.具有x_b1 PGx_b2 SWWTDx_b3 -x_b16 HP…Hx_cc E…Cx_c4 x_c5 CH…Dx_bc1 x_bc2 ，與序列編號：2之90之序列具有至少40%之序列同一性，且具有C-to-U/U-to-C編輯活性之多肽。
如請求項5之方法，其中DYW域融合於如下RNA結合域，上述RNA結合域包含至少一個PPR模體，且能夠依據PPR密碼規則與目標RNA具序列特異性地結合。
一種組合物，其包含如請求項2之DYW域，用於在真核細胞中編輯RNA。
一種核酸，其編碼如請求項2之DYW域、或如請求項3或4之DYW蛋白。
一種載體，其包含如請求項8之核酸。
一種細胞(人類個體除外)，其包含如請求項9之載體。