TW202404993A

TW202404993A - 具經工程化蛋白殼之腺相關病毒

Info

Publication number: TW202404993A
Application number: TW112113370A
Authority: TW
Inventors: 成澤; 提摩西Ｃ侯伊; 克里斯多福Ａ萊德
Original assignee: 美商特納亞治療股份有限公司
Priority date: 2022-04-11
Filing date: 2023-04-10
Publication date: 2024-02-01
Also published as: WO2023201207A1

Abstract

本發明提供經工程化蛋白殼蛋白及具有經工程化蛋白殼蛋白之重組腺相關病毒(rAAV)病毒粒子。特定而言，本發明提供AAV9病毒粒子，該等病毒粒子具有經工程化AAV9蛋白殼、AAV5/9嵌合蛋白殼或組合型蛋白殼，以達成增加的心臟轉導效率、增加的心臟/肝臟比率及/或其他所需特性。

Description

具經工程化蛋白殼之腺相關病毒

本發明大體上係關於腺相關病毒載體。詳言之，本發明係關於經工程化蛋白殼蛋白及具有經工程化蛋白殼蛋白之重組腺相關病毒病毒粒子及其用途。

腺相關病毒(AAV)有望用於基因療法及其他生物醫藥應用。特定而言，AAV可用於在活體外與活體內將基因產物遞送至各種組織及細胞。AAV之蛋白殼蛋白在很大程度上確定AAV載體的免疫原性及趨向性。

就心臟組織而言，AAV亞型9 (AAV9)因其在全身遞送之後能夠轉導心臟而為較佳AAV載體。儘管AAV9可對心臟達成中度轉導，但大部分載體輸送至肝臟。此外，為了在心臟中達成治療程度的轉導，需要相對較高的全身劑量，此潛在地導致全身炎症且繼而導致中毒。

需要開發具有經工程化蛋白殼蛋白之腺相關病毒以達成改善的心臟向性，且視情況達成改善的對心臟組織而非對肝臟之選擇性。本發明提供AAV9蛋白殼及/或AAV5/AAV9嵌合蛋白殼的變異體，其形成的rAAV病毒粒子與包含野生型AAV9蛋白殼蛋白的rAAV病毒粒子相比，能夠以更大的效率及/或更大的選擇性轉導心臟組織及/或細胞類型，從而可用於安全且有效的心臟基因療法。

在一些態樣中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%、至少85%、至少90%、至少95%多肽序列一致性，且其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含本文所描述之修飾中的一或多者。

在一些實施例中，本文所描述之蛋白殼蛋白在VR-VIII位點中包含一個、兩個、三個、四個或更多個取代。在一些實施例中，本文所描述之蛋白殼蛋白在VR-VIII位點中包含一個、兩個、三個、四個或更多個插入。在一些實施例中，本文所描述之蛋白殼蛋白相對於參考SEQ ID NO:1包含在該VR-VIII位點中之584至590位置處之一個、兩個、三個、四個或更多個取代，或包含在該VR-VIII位點中之585至590位置處之一個、兩個、三個、四個或更多個取代。在一些實施例中，本文所描述之蛋白殼蛋白相對於參考SEQ ID NO:1包含在該VR-VIII位點中之584至590位置處之一個、兩個、三個、四個或更多個插入，或包含在該VR-VIII位點中之585至590位置處之一個、兩個、三個、四個或更多個插入。

在一些實施例中，本文所描述之蛋白殼蛋白包含在該VR-VIII位點中之至少兩個、三個、四個、五個或更多個取代。在一些實施例中，本文所描述之蛋白殼蛋白包含在該VR-VIII位點中之至少兩個、三個、四個或更多個插入。在一些實施例中，本文所描述之蛋白殼蛋白相對於參考SEQ ID NO:1包含在該VR-VIII位點中之584至590位置處之至少兩個、三個、四個、五個或更多個取代，或包含在該VR-VIII位點中之585至590位置處之至少兩個、三個、四個、五個或更多個取代。在一些實施例中，本文所描述之蛋白殼蛋白相對於參考SEQ ID NO:1包含在該VR-VIII位點中之584至590位置處之至少兩個、三個、四個或更多個插入，或包含在該VR-VIII位點中之585至590位置處之至少兩個、三個、四個或更多個插入。

在一些實施例中，本文所描述之該蛋白殼蛋白：(i)具有心臟向性；(ii)相較於親本序列，在心臟細胞中展現出增加的轉導效率；(iii)相較於親本序列，在肝臟細胞中展現出降低的轉導效率；及/或(iv)相較於親本序列，對心臟細胞而非對肝臟細胞展現出增加的選擇性。此等特徵可藉由此項技術中已知或本文所描述之任何方法在活體外細胞(例如，iPSC衍生之心臟細胞或心肌細胞)中，或活體內在小鼠或靈長類動物中評估。

該蛋白殼蛋白可包含在位置584 (相對於參考序列SEQ ID NO:1)處之胺基酸插入，其包含天冬醯胺酸(N)、蘇胺酸(T)、酪胺酸(Y)、苯丙胺酸(F)及丙胺酸(A)中之一或多者。

該蛋白殼蛋白可包含在位置585(相對於參考序列SEQ ID NO:1)處之胺基酸插入，其包含組胺酸(H)及甲硫胺酸(M)中之一或多者。

該蛋白殼蛋白可包含在位置586 (相對於參考序列SEQ ID NO:1)處之胺基酸插入，其包含組胺酸(H)、酪胺酸(Y)、纈胺酸(V)、蘇胺酸(T)、丙胺酸(A)、異白胺酸(I)、色胺酸(W)、甲硫胺酸(M)及白胺酸中之一或多者。

該蛋白殼蛋白可包含在位置587(相對於參考序列SEQ ID NO:1)處之胺基酸插入，其包含異白胺酸(I)及脯胺酸(P)中之一或多者。

該蛋白殼蛋白可包含在位置588(相對於參考序列SEQ ID NO:1)處之胺基酸插入，其包含異白胺酸(I)、蘇胺酸(T)及脯胺酸(P)中之一或多者。

該蛋白殼蛋白可包含一或多個選自由以下組成之群的胺基酸取代：N452K、N452A、N452V、G453A、G453N、S454T、S454D、G455N、Q456L、Q456K、N457L、N457V、Q458I及Q458H (相對於參考序列SEQ ID NO:1)。

該蛋白殼蛋白可包含一或多個選自由以下組成之群的胺基酸取代：T582D、T582L、T582E、T582A、T582F、T582R、T582P、N583V、N583T、H584R、H584Q、H584K、H584V、H584Y、H584M、H584T、H584W、H584E、H584D、Q585T、Q585C、Q585V、Q585L、Q585N、Q585S、Q585P、Q585A、Q585M、Q585E、Q585Y、Q585G、Q585H、Q585I、S586D、S586T、S586G、S586K、S586M、S586N、S586I、S586Q、S586L、S586P、S586F、S586R、A587F、A587S、A587T、A587N、A587L、A587P、A587V、A587K、A587I、A587R、A587H、A587G、A587M、A587D、A587W、Q588L、Q588S、Q588F、Q588N、Q588G、Q588R、Q588I、Q588V、Q588T、Q588Y、Q588H、Q588M、Q588K、Q588D、A589R、A589I、A589N、A589S、A589V、A589Q、A589F、A589T、A589K、A589H、A589E、A589W、A589L、A589Y、A589M、Q590I、Q590S、Q590N、Q590G、Q590D、Q590R、Q590H、Q590T、Q590M、Q590F、Q590Y、Q590L、A591I、G594Q及G594D (相對於參考序列SEQ ID NO:1)。

在一些態樣中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%胺基酸序列一致性或包含與該參考序列具有至少80%胺基酸序列一致性的序列，及其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置584處之胺基酸插入，其包含天冬醯胺酸(N)、蘇胺酸(T)、酪胺酸(Y)、苯丙胺酸(F)及丙胺酸(A)中之一或多者；在位置585處之胺基酸插入，其包含組胺酸(H)及甲硫胺酸(M)中之一或多者；在位置586處之胺基酸插入，其包含組胺酸(H)、酪胺酸(Y)、纈胺酸(V)、蘇胺酸(T)、丙胺酸(A)、異白胺酸(I)、色胺酸(W)、甲硫胺酸(M)及白胺酸中之一或多者；在位置587處之胺基酸插入，其包含異白胺酸(I)及脯胺酸(P)中之一或多者；在位置588處之胺基酸插入，其包含異白胺酸(I)、蘇胺酸(T)及脯胺酸(P)中之一或多者；在位置589處之胺基酸插入，其包含甘胺酸(G)及麩醯胺酸(Q)中之一或多者；一或多個選自由以下組成之群的胺基酸取代：N452K、N452A、N452V、G453A、G453N、S454T、S454D、G455N、Q456L、Q456K、N457L、N457V、Q458I及Q458H；及/或一或多個選自由以下組成之群的胺基酸取代：T582D、T582L、T582E、T582A、T582F、T582R、T582P、N583V、N583T、H584R、H584Q、H584K、H584V、H584Y、H584M、H584T、H584W、H584E、H584D、Q585T、Q585C、Q585V、Q585L、Q585N、Q585S、Q585P、Q585A、Q585M、Q585E、Q585Y、Q585G、Q585H、Q585I、S586D、S586T、S586G、S586K、S586M、S586N、S586I、S586Q、S586L、S586P、S586F、S586R、A587F、A587S、A587T、A587N、A587L、A587P、A587V、A587K、A587I、A587R、A587H、A587G、A587M、A587D、A587W、Q588L、Q588S、Q588F、Q588N、Q588G、Q588R、Q588I、Q588V、Q588T、Q588Y、Q588H、Q588M、Q588K、Q588D、A589R、A589I、A589N、A589S、A589V、A589Q、A589F、A589T、A589K、A589H、A589E、A589W、A589L、A589Y、A589M、Q590I、Q590S、Q590N、Q590G、Q590D、Q590R、Q590H、Q590T、Q590M、Q590F、Q590Y、Q590L、A591I、G594Q及G594D。

在一些態樣中，重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%胺基酸序列一致性或包含與該參考序列具有至少80%胺基酸序列一致性的序列，且其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置583及584之間的胺基酸插入，其包含天冬醯胺酸(N)、蘇胺酸(T)、酪胺酸(Y)、苯丙胺酸(F)及丙胺酸(A)中之一或多者；在位置584及585之間的胺基酸插入，其包含組胺酸(H)及甲硫胺酸(M)中之一或多者；在位置585及586之間的胺基酸插入，其包含組胺酸(H)、酪胺酸(Y)、纈胺酸(V)、蘇胺酸(T)、丙胺酸(A)、異白胺酸(I)、色胺酸(W)、甲硫胺酸(M)及白胺酸(L)中之一或多者；在位置586及587之間的胺基酸插入，其包含異白胺酸(I)及脯胺酸(P)中之一或多者；在位置587及588之間的胺基酸插入，其包含異白胺酸(I)、蘇胺酸(T)及脯胺酸(P)中之一或多者；在位置588及589之間的胺基酸插入，其包含甘胺酸(G)及麩醯胺酸(Q)中之一或多者；一或多個選自由以下組成之群的胺基酸取代：N452K、N452A、N452V、N452I、G453A、G453N、S454T、S454D、G455N、Q456L、Q456K、N457L、N457V、Q458I及Q458H；及/或一或多個選自由以下組成之群的胺基酸取代：T582D、T582L、T582E、T582A、T582F、T582R、T582P、N583V、N583T、H584R、H584Q、H584K、H584V、H584Y、H584M、H584T、H584W、H584E、H584D、Q585T、Q585C、Q585V、Q585L、Q585N、Q585S、Q585P、Q585A、Q585M、Q585E、Q585Y、Q585G、Q585H、Q585I、S586D、S586T、S586G、S586K、S586M、S586N、S586I、S586Q、S586L、S586P、S586F、S586R、A587F、A587S、A587T、A587N、A587L、A587P、A587V、A587K、A587I、A587R、A587H、A587G、A587M、A587D、A587W、Q588L、Q588S、Q588F、Q588N、Q588G、Q588R、Q588I、Q588V、Q588T、Q588Y、Q588H、Q588M、Q588K、Q588D、A589R、A589I、A589N、A589S、A589V、A589Q、A589F、A589T、A589K、A589H、A589E、A589W、A589L、A589Y、A589M、Q590I、Q590S、Q590N、Q590G、Q590D、Q590R、Q590H、Q590T、Q590M、Q590F、Q590Y、Q590L、A591I、G594Q及G594D。

蛋白殼蛋白可包含在位置584(相對於參考序列SEQ ID NO:1)處之胺基酸插入，其由TY、FN或AT組成。

蛋白殼蛋白可包含在位置585(相對於參考序列SEQ ID NO:1)處之胺基酸插入，其由MH組成。

蛋白殼蛋白可包含在位置586(相對於參考序列SEQ ID NO:1)處之胺基酸插入，其由HY、VT、AI、WM或ML組成。

蛋白殼蛋白可包含在位置587(相對於參考序列SEQ ID NO:1)處之胺基酸插入，其由PI組成。

蛋白殼蛋白可包含在位置588(相對於參考序列SEQ ID NO:1)處之胺基酸插入，其由IT或PT組成。

該蛋白殼蛋白可包含一或多個選自由以下組成之群的胺基酸取代：T582D、T582E、N583V、H584Q、S586K、A587P、A587S、Q588G、Q588M、A589S、A591I、G594Q及G594D (相對於參考序列SEQ ID NO:1)。

該蛋白殼蛋白可包含一或多個選自由以下組成之群的胺基酸取代：T582L、T582A、T582F、T582R、T582P、H584R、H584K、H584V、H584Y、H584M、H584Q、H584W、H584E、H584D、Q585T、Q585N、Q585M、Q585E、Q585V、Q585H、S586T、S586G、S586Q、S586I、S586L、S586F、S586D、S586R、S586M、A587F、A587I、A587H、A587M、A587N、A587W、Q588Y、Q588S、Q588T及Q588R (相對於參考序列SEQ ID NO:1)。

該蛋白殼蛋白可包含一或多個選自由以下組成之群的胺基酸取代：Q585C、Q585S及S586I (相對於參考序列SEQ ID NO:1)。

該蛋白殼蛋白可包含一或多個選自由以下組成之群的胺基酸取代：Q585C、Q585S、S586I、A587V及A587G (相對於參考序列SEQ ID NO:1)。

該蛋白殼蛋白可包含一或多個選自由以下組成之群的胺基酸取代：Q585V、Q585T、Q585L、Q585C、Q585N、Q585S、Q585M、Q585E、Q585P、Q585A、Q585G、Q585H、Q585I、S586D、S586G、S586T、S586M、S586N、S586L、S586R、S586I、S586K、A587S、A587T、A587N、A587L、A587V、A587K、A587I、A587F、A587P、A587R、A587D、Q588L、Q588S、Q588F、Q588N、Q588R、Q588I、Q588V、Q588T、Q588H、Q588Y、Q588M、Q588K、Q588D、Q588G、A589R、A589I、A589N、A589S、A589V、A589Q、A589F、A589T、A589K、A589H、A589E、A589W、A589L、A589Y、A589M、Q590I、Q590S、Q590N、Q590G、Q590D、Q590R、Q590H、Q590T、Q590M、Q590F、Q590Y及Q590L (相對於參考序列SEQ ID NO:1)。

該蛋白殼蛋白可包含一或多個選自由以下組成之群的胺基酸取代：A587V及A587G (相對於參考序列SEQ ID NO:1)。

蛋白殼蛋白可包含選自SEQ ID NO: 599-692之胺基酸序列，且其中蛋白殼蛋白與SEQ ID NO: 496-589具有至少80%、至少85%、至少90%、至少95%、至少98%或100%一致性。

蛋白殼蛋白可包含位置586-589或大致位置586-589的胺基酸序列ANYG (相對於參考序列SEQ ID NO:1)。

蛋白殼蛋白可包含兩個或更多個選自由以下組成之群的胺基酸取代：N452K、N452A、N452V、G453A、G453N、S454T、S454D、G455N、Q456L、Q456K、N457L、N457V、Q458I及Q458H (相對於參考序列SEQ ID NO:1)。

蛋白殼蛋白可包含胺基酸取代N452K、N452A或N452V (相對於參考序列SEQ ID NO:1)。

蛋白殼蛋白可包含胺基酸取代N452K (相對於參考序列SEQ ID NO: 1)。

蛋白殼蛋白可包含胺基酸取代G453A或G453N (相對於參考序列SEQ ID NO:1)。

蛋白殼蛋白可包含胺基酸取代S454T或S454D (相對於參考序列SEQ ID NO:1)。

蛋白殼蛋白可包含胺基酸取代G455N (相對於參考序列SEQ ID NO:1)。

蛋白殼蛋白可包含胺基酸取代Q456L或Q456K (相對於參考序列SEQ ID NO:1)。

蛋白殼蛋白可包含胺基酸取代N457L或N457V (相對於參考序列SEQ ID NO:1)。

蛋白殼蛋白可包含胺基酸取代Q458I或Q458H (相對於參考序列SEQ ID NO:1)。

蛋白殼蛋白可包含在位置452-458或在大致位置452-458處之選自KGSGQNQ (SEQ ID NO: 590)、NASGQNQ (SEQ ID NO: 591)、NGTGQNQ (SEQ ID NO: 592)、NGSGLNQ (SEQ ID NO: 593)、ANDNKLI (SEQ ID NO: 594)、VNDNKVI (SEQ ID NO: 595)、NGSGQNH (SEQ ID NO: 596)或ANDNKVI (SEQ ID NO: 597)的胺基酸序列(相對於參考序列SEQ ID NO:1)，且其中該蛋白殼蛋白與SEQ ID NOs: 488-495具有至少80%、至少85%、至少90%、至少95%、至少98%或100%一致性。

在一些實施例中，本文所描述之蛋白殼蛋白相對於參考序列SEQ ID NO: 1在位置452處包含選自由以下組成之群的胺基酸：K及N。在一些實施例中，本文所描述之蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代N452K。

在一些態樣中，本發明提供一種重組腺相關病毒(rAAV)蛋白殼蛋白，該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%胺基酸序列一致性或包含與該參考序列具有至少80%胺基酸序列一致性的序列，且其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含，胺基酸取代N452K。在一些實施例中，N452K為相對於親本或野生型AAV9之蛋白殼蛋白中之唯一取代。在一些實施例中，N452K不為相對於親本或野生型AAV9之蛋白殼蛋白中之唯一取代。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置585處之選自以下之胺基酸：E、N、G、M、C、V、T及Q；在位置586處之選自以下之胺基酸：N、T、M、G、D及S；在位置587處之選自以下之胺基酸：T、L、I、K、S、N、V及A；在位置588處之選自以下之胺基酸：V、F、Y、L、T、S、I、R及Q；在位置589處之選自以下之胺基酸：S、N、L、T、I、R及A；及/或在位置590處之選自以下之胺基酸：I、S、G、H、R及Q。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置585處之選自以下之胺基酸：E、N、G、M、C、V、T及Q；在位置586處之選自以下之胺基酸：N、T、M、G、D及S；在位置587處之選自以下之胺基酸：T、L、I、K、S、N、V及A；在位置588處之選自以下之胺基酸：V、F、Y、L、T、S、I、R及Q；在位置589處之選自以下之胺基酸：S、N、L、T、I、R及A；及在位置590處之選自以下之胺基酸：I、S、G、H、R及Q。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置585處之選自以下之胺基酸：E、N、G、M、C、V及T；在位置586處之選自以下之胺基酸：N、T、M、G及D；在位置587處之選自以下之胺基酸：T、L、I、K、S、N及V；在位置588處之選自以下之胺基酸：V、F、Y、L、T、S、I及R；在位置589處之選自以下之胺基酸：S、N、L、T、I及R；及/或在位置590處之選自以下之胺基酸：I、S、G、H及R。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置585處之選自以下之胺基酸：E、N、G、M、C、V及T；在位置586處之選自以下之胺基酸：N、T、M、G及D；在位置587處之選自以下之胺基酸：T、L、I、K、S、N及V；在位置588處之選自以下之胺基酸：V、F、Y、L、T、S、I及R；在位置589處之選自以下之胺基酸：S、N、L、T、I及R；及在位置590處之選自以下之胺基酸：I、S、G、H及R。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置584處選自由以下組成之群的胺基酸：R及H；在位置585處選自由以下組成之群的胺基酸：N、M、C、E、G、S、V、A、T、H、L及Q；在位置586處選自由以下組成之群的胺基酸：M、D、N、G、A、T、R、I及S；在位置587處選自由以下組成之群的胺基酸：T、N、V、L、I、S、R、P及A；在位置588處選自由以下組成之群的胺基酸：Y、T、S、I、V、F、L、R、N、D、G及Q；在位置589處選自由以下組成之群的胺基酸：L、I、R、S、G、N、T、V、Q、F、E、Y及A；及/或在位置590處選自由以下組成之群的胺基酸：G、R、S、I、H、N、Y、L、M及Q；及視情況在位置452處選自由以下組成之群的胺基酸：N及K。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；在位置584處選自由以下組成之群的胺基酸：R及H；在位置585處選自由以下組成之群的胺基酸：N、M、C、E、G、S、V、A、T、H、L及Q；在位置586處選自由以下組成之群的胺基酸：M、D、N、G、A、T、R、I及S；在位置587處選自由以下組成之群的胺基酸：T、N、V、L、I、S、R、P及A；在位置588處選自由以下組成之群的胺基酸：Y、T、S、I、V、F、L、R、N、D、G及Q；在位置589處選自由以下組成之群的胺基酸：L、I、R、S、G、N、T、V、Q、F、E、Y及A；及在位置590處選自由以下組成之群的胺基酸：G、R、S、I、H、N、Y、L、M及Q。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置584處之胺基酸R；在位置585處選自由以下組成之群的胺基酸：N、M、C、E、G、S、V、A、T、H及L；在位置586處選自由以下組成之群的胺基酸：M、D、N、G、A、T、R及I；在位置587處選自由以下組成之群的胺基酸：T、N、V、L、I、S、R及P；在位置588處選自由以下組成之群的胺基酸：Y、T、S、I、V、F、L、R、N、D及G；在位置589處選自由以下組成之群的胺基酸：L、I、R、S、G、N、T、V、Q、F、E及Y；及/或在位置590處選自由以下組成之群的胺基酸：G、R、S、I、H、N、Y、L及M；及視情況在位置452處選自由以下組成之群的胺基酸：N及K。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含以下任何至少兩個、三個、四個、五個、六個、七個或全部八個： (i)在位置452處之胺基酸K； (ii)在位置584處之胺基酸R； (iii)在位置585處選自由以下組成之群的胺基酸：N、M、C、E、G、S、V、A、T、H及L； (iv)在位置586處選自由以下組成之群的胺基酸：M、D、N、G、A、T、R及I； (v)在位置587處選自由以下組成之群的胺基酸：T、N、V、L、I、S、R及P； (vi)在位置588處選自由以下組成之群的胺基酸：Y、T、S、I、V、F、L、R、N、D及G； (vii)在位置589處選自由以下組成之群的胺基酸：L、I、R、S、G、N、T、V、Q、F、E及Y；及 (viii)在位置590處選自由以下組成之群的胺基酸：G、R、S、I、H、N、Y、L及M。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置585處選自由以下組成之群的胺基酸：E、N、G、M、C、V、T及Q；在位置586處選自由以下組成之群的胺基酸：N、T、M、G、D及S；在位置587處選自由以下組成之群的胺基酸：T、L、I、K、S、N、V及A；在位置588處選自由以下組成之群的胺基酸：V、F、Y、L、T、S、I、R及Q；在位置589處選自由以下組成之群的胺基酸：S、N、L、T、I、R及A；及/或在位置590處選自由以下組成之群的胺基酸：I、S、G、H、R及Q；及視情況在位置452處選自由以下組成之群的胺基酸：N及K。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；在位置585處選自由以下組成之群的胺基酸：E、N、G、M、C、V、T及Q；在位置586處選自由以下組成之群的胺基酸：N、T、M、G、D及S；在位置587處選自由以下組成之群的胺基酸：T、L、I、K、S、N、V及A；在位置588處選自由以下組成之群的胺基酸：V、F、Y、L、T、S、I、R及Q；在位置589處選自由以下組成之群的胺基酸：S、N、L、T、I、R及A；及在位置590處選自由以下組成之群的胺基酸：I、S、G、H、R及Q。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置585處選自由以下組成之群的胺基酸：E、N、G、M、C、V及T；在位置586處選自由以下組成之群的胺基酸：N、T、M、G及D；在位置587處選自由以下組成之群的胺基酸：T、L、I、K、S、N及V；在位置588處選自由以下組成之群的胺基酸：V、F、Y、L、T、S、I及R；在位置589處選自由以下組成之群的胺基酸：S、N、L、T、I及R；及/或在位置590處選自由以下組成之群的胺基酸：I、S、G、H及R；及視情況在位置452處選自由以下組成之群的胺基酸：N及K。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含以下任何至少兩個、三個、四個、五個、六個或所有七個： (i)在位置452處之胺基酸K； (ii)在位置585處選自由以下組成之群的胺基酸：E、N、G、M、C、V及T； (iii)在位置586處選自由以下組成之群的胺基酸：N、T、M、G及D； (iv)在位置587處選自由以下組成之群的胺基酸：T、L、I、K、S、N及V； (v)在位置588處選自由以下組成之群的胺基酸：V、F、Y、L、T、S、I及R； (vi)在位置589處選自由以下組成之群的胺基酸：S、N、L、T、I及R；及 (vii)在位置590處選自由以下組成之群的胺基酸：I、S、G、H及R。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置585處選自由以下組成之群的胺基酸：E、N、M、C及Q；在位置586處選自由以下組成之群的胺基酸：A、M、G、D、N及S；在位置587處選自由以下組成之群的胺基酸：T、N、V及A；在位置588處選自由以下組成之群的胺基酸：V、Y、T、S、I及Q；在位置589處選自由以下組成之群的胺基酸：S、G、L、I、R及A；及/或在位置590處選自由以下組成之群的胺基酸：I、S、G、R及Q；及視情況在位置452處選自由以下組成之群的胺基酸：N及K。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；在位置585處選自由以下組成之群的胺基酸：E、N、M、C及Q；在位置586處選自由以下組成之群的胺基酸：A、M、G、D、N及S；在位置587處選自由以下組成之群的胺基酸：T、N、V及A；在位置588處選自由以下組成之群的胺基酸：V、Y、T、S、I及Q；在位置589處選自由以下組成之群的胺基酸：S、G、L、I、R及A；及在位置590處選自由以下組成之群的胺基酸：I、S、G、R及Q。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置585處選自由以下組成之群的胺基酸：E、N、M及C；在位置586處選自由以下組成之群的胺基酸：A、M、G、D及N；在位置587處選自由以下組成之群的胺基酸：T、N及V；在位置588處選自由以下組成之群的胺基酸：V、Y、T、S及I；在位置589處選自由以下組成之群的胺基酸：S、G、L、I及R；及/或在位置590處選自由以下組成之群的胺基酸：I、S、G及R；及視情況在位置452處選自由以下組成之群的胺基酸：N及K。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含以下任何至少兩個、三個、四個、五個、六個或所有七個： (i)在位置452處之胺基酸K； (ii)在位置585處選自由以下組成之群的胺基酸：E、N、M及C； (iii)在位置586處選自由以下組成之群的胺基酸：A、M、G、D及N； (iv)在位置587處選自由以下組成之群的胺基酸：T、N及V； (v)在位置588處選自由以下組成之群的胺基酸：V、Y、T、S及I； (vi)在位置589處選自由以下組成之群的胺基酸：S、G、L、I及R；及 (vii)在位置590處選自由以下組成之群的胺基酸：I、S、G及R。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；及在位置587處之胺基酸取代A587T。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；及在選自由以下組成之群的一個、兩個或更多個位置處之胺基酸N或R：584、585、586、588、589及590。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；及在選自由以下組成之群的兩個或更多個位置處之胺基酸S：585、586、587、588、589及590。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；及在該VR-VIII位點之區域585-590中之三個、四個或更多個位置處之選自由以下組成之群的胺基酸：N、S、T、R及I。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在該VR-VIII位點之區域585-590中之三個、四個或更多個位置處之選自由以下組成之群的胺基酸：N、S、T及R。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；及在該VR-VIII位點之區域585-590中之三個、四個或更多個位置處之選自由以下組成之群的胺基酸：N、S、T、R及I (諸如此等胺基酸中之每一者之任何組合及數目)。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在該VR-VIII位點之區域585-590中之三個、四個或更多個位置處之選自由以下組成之群的胺基酸：N、S、T及R (諸如此等胺基酸中之每一者之任何組合及數目)。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；及在VR-VIII位點之區域585-590中之四個、五個或更多個位置處，選自由以下組成之群的胺基酸：N、S、T、R及I (諸如此等胺基酸中之每一者之任何組合及數目)。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在VR-VIII位點之區域585-590中之四個、五個或更多個位置處，選自由以下組成之群的胺基酸：N、S、T及R (諸如此等胺基酸中之每一者之任何組合及數目)。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含至少兩個、三個、四個或更多個胺基酸取代Q585E、S586N、A587T、Q588V、A589S、Q590I及/或N452K (或此等取代之任何組合)。在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585E、S586N、A587T、Q588V、A589S、Q590I及N452K。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含至少兩個、三個、四個或更多個胺基酸取代S586T、A587L、Q588F、A589N、Q590S及/或N452K (或此等取代之任何組合)。在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代S586T、A587L、Q588F、A589N、Q590S及N452K。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含至少兩個、三個、四個或更多個胺基酸取代Q585N、A587T、Q588Y、A589L、Q590G及/或N452K (或此等取代之任何組合)。在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585N、A587T、Q588Y、A589L、Q590G及N452K。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含至少兩個、三個、四個或更多個胺基酸取代Q585G、A587I、Q588L、A589T、Q590H及/或452K (或此等取代之任何組合)。在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585G、A587I、Q588L、A589T、Q590H及N452K。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含至少兩個、三個、四個或更多個胺基酸取代Q585M、S586M、A587T、Q588T及/或Q590R (或此等取代之任何組合)。在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585M、S586M、A587T、Q588T及Q590R。在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585M、S586M、A587T、Q588T及Q590R；及在位置452處之胺基酸N。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含至少兩個、三個、四個或更多個胺基酸取代Q585N、A587T、Q588Y、A589L及/或Q590G (或此等取代之任何組合)。在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585N、A587T、Q588Y、A589L及Q590G。在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585N、A587T、Q588Y、A589L及Q590G；及在位置452處之胺基酸N。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含至少兩個、三個、四個或更多個胺基酸取代Q585C、A587T、Q588S、A589I及/或Q590R (或此等取代之任何組合)。在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585C、A587T、Q588S、A589I及Q590R。在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585C、A587T、Q588S、A589I及Q590R；及在位置452處之胺基酸N。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含至少兩個、三個、四個或更多個胺基酸取代Q585E、S586D、A587N、Q588I、A589R及/或Q590S (或此等取代之任何組合)。在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585E、S586D、A587N、Q588I、A589R及Q590S。在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585E、S586D、A587N、Q588I、A589R及Q590S；及在位置452處之胺基酸N。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含至少兩個、三個、四個或更多個胺基酸取代Q585E、S586D、A587N、Q588I、A589R、Q590S及/或N452K (或此等取代之任何組合)。在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585E、S586D、A587N、Q588I、A589R、Q590S及N452K。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸S586G及/或Q588Y。在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代S586G及Q588Y；及在位置452處之胺基酸N。

在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含至少兩個、三個、四個或更多個胺基酸取代S586A、A587N、Q588Y、A589G及/或N452K (或此等取代之任何組合)。在一些實施例中，蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代S586A、A587N、Q588Y、A589G及N452K。

在一些實施例中，本文所描述之實施例中之任一者的蛋白殼蛋白相對於參考序列SEQ ID NO:1包含在位置581-583處之胺基酸ATN及在位置591-594處之胺基酸AQTG。

在一些實施例中，本文所描述之實施例中之任一者的蛋白殼蛋白相對於參考序列SEQ ID NO:1包含在位置581-584處之胺基酸ATNH及在位置591-594處之胺基酸AQTG。

在一些實施例中，本文所描述之蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含以下中之任一者： (i)在該VR-VIII位置581-594處之胺基酸序列ATNH ENTVSIAQTG，及在該VR-IV位置452處之胺基酸K； (ii)在該VR-VIII位置581-594處之胺基酸序列ATNH QTLFNSAQTG，及在該VR-IV位置452處之胺基酸K； (iii)在該VR-VIII位置581-594處之胺基酸序列ATNH NSTYLGAQTG，及在該VR-IV位置452處之胺基酸K； (iv)在該VR-VIII位置581-594處之胺基酸序列ATNH GSILTHAQTG，及在該VR-IV位置452處之胺基酸K； (v)在該VR-VIII位置581-594處之胺基酸序列ATNH MMTTARAQTG，及在該VR-IV位置452處之胺基酸N； (vi)在該VR-VIII位置581-594處之胺基酸序列ATNH NSTYLGAQTG，及在該VR-IV位置452處之胺基酸N； (vii)在該VR-VIII位置581-594處之胺基酸序列ATNH CSTSIRAQTG，及在該VR-IV位置452處之胺基酸N； (viii)在該VR-VIII位置581-594處之胺基酸序列ATNH EDNIRSAQTG，及在該VR-IV位置452處之胺基酸N； (ix)在該VR-VIII位置581-594處之胺基酸序列ATNH EDNIRSAQTG，及在該VR-IV位置452處之胺基酸K； (x)在該VR-VIII位置581-594處之胺基酸序列ATNH NNVISGAQTG，及在該VR-IV位置452處之胺基酸K； (xi)在該VR-VIII位置581-594處之胺基酸序列ATNHQ GA YAQAQTG，及在該VR-IV位置452處之胺基酸N； (xii)在該VR-VIII位置581-594處之胺基酸序列ATNHQ ANYGQAQTG，及在該VR-IV位置452處之胺基酸K； (xiii)在該VR-VIII位置581-594處之胺基酸序列ATNH NMNRVNAQTG，及在該VR-IV位置452處之胺基酸N； (xiv)在該VR-VIII位置581-594處之胺基酸序列ATNH NNVISGAQTG，及在該VR-IV位置452處之胺基酸N； (xv)在該VR-VIII位置581-594處之胺基酸序列ATNH SNSVQSAQTG，及在該VR-IV位置452處之胺基酸N； (xvi)在該VR-VIII位置581-594處之胺基酸序列ATNH SSTFQGAQTG，及在該VR-IV位置452處之胺基酸N； (xvii)在該VR-VIII位置581-594處之胺基酸序列ATNH VSSFTSAQTG，及在該VR-IV位置452處之胺基酸N； (xviii)在該VR-VIII位置581-594處之胺基酸序列ATNH STTNFRAQTG，及在該VR-IV位置452處之胺基酸N； (xix)在該VR-VIII位置581-594處之胺基酸序列ATNH SSIFNSAQTG，及在該VR-IV位置452處之胺基酸N； (xx)在該VR-VIII位置581-594處之胺基酸序列ATNH AGNYNNAQTG，及在該VR-IV位置452處之胺基酸N； (xxi)在該VR-VIII位置581-594處之胺基酸序列ATNH TSVISIAQTG，及在該VR-IV位置452處之胺基酸N； (xxii)在該VR-VIII位置581-594處之胺基酸序列ATNH HSRVEIAQTG，及在該VR-IV位置452處之胺基酸N； (xxiii)在該VR-VIII位置581-594處之胺基酸序列ATNH SSIIYSAQTG，及在該VR-IV位置452處之胺基酸N； (xxiv)在該VR-VIII位置581-594處之胺基酸序列ATNH SGRDSYAQTG，及在該VR-IV位置452處之胺基酸N； (xxv)在該VR-VIII位置581-594處之胺基酸序列ATNH SSSYNNAQTG，及在該VR-IV位置452處之胺基酸N； (xxvi)在該VR-VIII位置581-594處之胺基酸序列ATNH HNPSINAQTG，及在該VR-IV位置452處之胺基酸N； (xxvii)在該VR-VIII位置581-594處之胺基酸序列ATNH NRNGLLAQTG，及在該VR-IV位置452處之胺基酸N； (xxviii)在該VR-VIII位置581-594處之胺基酸序列ATNH ESTSVRAQTG，及在該VR-IV位置452處之胺基酸N； (xxix)在該VR-VIII位置581-594處之胺基酸序列ATNH NIRTEMAQTG，及在該VR-IV位置452處之胺基酸N； (xxx)在該VR-VIII位置581-594處之胺基酸序列ATNH QTLFNSAQTG，及在該VR-IV位置452處之胺基酸N； (xxxi)在該VR-VIII位置581-594處之胺基酸序列ATNH LSVSSIAQTG，及在該VR-IV位置452處之胺基酸N； (xxxii)在該VR-VIII位置581-594處之胺基酸序列ATNH EDIIRSAQTG，及在該VR-IV位置452處之胺基酸N； (xxxiii)在該VR-VIII位置581-594處之胺基酸序列ATN RQ TAQAQAQTG，及在該VR-IV位置452處之胺基酸N；或 (xxxiv)在該VR-VIII位置581-594處之胺基酸序列ATN RQ IAQAQAQTG，及在該VR-IV位置452處之胺基酸N。

在一些實施例中，本文所描述之實施例中之任一者的蛋白殼蛋白包含本文所描述之任何取代及/或插入模體，例如描述於本文提供之表及/或序列中之任一者中。在一些實施例中，本文所描述之實施例中之任一者的蛋白殼蛋白包含與本文所描述之任何取代模體具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、95%、96%、97%、98%、99%或100%序列一致性的取代模體，例如描述於本文提供之表及/或序列中之任一者中。在一些實施例中，本文所描述之實施例中之任一者的蛋白殼蛋白包含與本文所描述之任何插入模體具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、95%、96%、97%、98%、99%或100%序列一致性的插入模體，例如描述於本文提供之表及/或序列中之任一者中。

在一些實施例中，除指定修飾之外，本文所描述之實施例中之任一者的蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少99%或100%胺基酸序列一致性或包含與該AAV9 VP3序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少99%或100%胺基酸序列一致性的序列。

在一些實施例中，除指定修飾之外，本文所描述之實施例中之任一者的蛋白殼蛋白與根據SEQ ID NO: 486之AAV9 VP2序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少99%或100%胺基酸序列一致性或包含與該AAV9 VP2序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少99%或100%胺基酸序列一致性的序列。

在一些實施例中，除指定修飾之外，本文所描述之實施例中之任一者的蛋白殼蛋白與根據SEQ ID NO: 1之AAV9 VP1序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少99%或100%胺基酸序列一致性或包含與該AAV9 VP1序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少99%或100%胺基酸序列一致性的序列。

在一些實施例中，本文所描述之實施例中之任一者的蛋白殼蛋白包含與本文所揭示之經修飾之蛋白殼蛋白序列(例如，VP1、VP2或VP3)中之任一者具有至少85%、90%、95%、96%、97%、98%、99%或100%一致的胺基酸序列或其功能片段、基本上由該胺基酸序列或其功能片段組成或由該胺基酸序列或其功能片段組成。

在一些實施例中，本文所描述之蛋白殼蛋白包含本文所揭示之經修飾之蛋白殼蛋白序列中之任何一者的多肽序列(例如，VP1、VP2或VP3)、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，本文所描述之實施例中之任一者的蛋白殼蛋白包含與選自由以下組成之群的任何序列具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%序列一致性的胺基酸序列或其功能片段、基本上由該胺基酸序列或其功能片段組成或由該胺基酸序列或其功能片段組成：SEQ ID NOs:488、499、504、505、506、510、512、513、516、518、521、522、533、536、539、558、562、566、571、576、578、579、580、581、585、588、589、705、706、707、708、710、772及774。

在一些實施例中，蛋白殼蛋白包含與本文所提供之任何蛋白殼蛋白序列(例如，本文所提供之表及/或序列中之任一者的任何蛋白殼蛋白序列)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%序列一致性之胺基酸序列、基本上由該胺基酸序列組成或由該胺基酸序列組成。

在一些實施例中，本文所描述之蛋白殼蛋白包含與選自由以下組成之群的任一者之多肽序列、基本上由該多肽序列組成或由該多肽序列組成：SEQ ID NOs:488、499、504、505、506、510、512、513、516、518、521、522、533、536、539、558、562、566、571、576、578、579、580、581、585、588、589、705、706、707、708、710、772及774。

在一些實施例中，蛋白殼蛋白為本文所提供之表及/或序列中之任一者中所描述之任何蛋白殼蛋白。在一些實施例中，蛋白殼蛋白包含本文所提供之表及/或序列中之任一者中所描述之任何蛋白殼蛋白的胺基酸序列、基本上由該胺基酸序列組成或由該胺基酸序列組成。

在一些實施例中，蛋白殼不為嵌合蛋白殼及/或不為組合蛋白殼。

在一些態樣中，本發明提供包含本文所描述之蛋白殼蛋白中之任一者的重組腺相關病毒(rAAV)病毒粒子。在一些態樣中，本發明提供包含本文所描述之蛋白殼蛋白中之任一者及載體基因體的重組腺相關病毒(rAAV)病毒粒子。載體基因體可包含側接反向末端重複序列(ITR)之聚核苷酸卡匣。在一些實施例中，聚核苷酸卡匣編碼本文所描述之蛋白質(或基因產物)中之任何一或多者。在一些實施例中，聚核苷酸卡匣包含本文所描述之轉殖基因中之任一者。

在一些實施例中，rAAV病毒粒子特異性地轉導心臟細胞。

在一些實施例中，rAAV病毒粒子特異性地轉導心肌細胞。

在一些實施例中，rAAV病毒粒子輸送至心臟。

在一些實施例中，rAAV病毒粒子輸送至除肝臟之外的至少一種器官。

在一些實施例中，該rAAV病毒粒子展現的心臟轉導效率高於具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白的rAAV病毒粒子。

在一些實施例中，向個體投與該rAAV病毒粒子引起比投與具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白之rAAV病毒粒子更低的肝臟病毒負荷。在一些實施例中，向個體投與該rAAV病毒粒子引起比投與具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白之rAAV病毒粒子更低的靈長類動物或在靈長類動物中評估之肝臟病毒負荷。在一些實施例中，向個體投與該rAAV病毒粒子引起比投與具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白之rAAV病毒粒子低至少2、3、4、5、6、7、8、9或10倍的肝臟病毒負荷(例如，在靈長類動物中或在靈長類動物中評估)。

在一些實施例中，該rAAV病毒粒子展現的心臟/肝臟轉導比率高於具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白的rAAV病毒粒子。在一些實施例中，該rAAV病毒粒子展現的心臟/肝臟轉導比率高於具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白的rAAV病毒粒子至少2、3、4、5、6、7、8、9或10倍。

在一些實施例中，該rAAV病毒粒子展現的轉導效率高於在靈長類動物中評估之具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白的rAAV病毒粒子。

在一些實施例中，該rAAV病毒粒子展現的心臟轉導效率高於具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白的rAAV病毒粒子(例如，如在靈長類動物中評估)。

在一些實施例中，該rAAV病毒粒子展現的心臟/肝臟轉導比率高於在靈長類動物中評估之具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白的rAAV病毒粒子。

在一些實施例中，rAAV病毒粒子展現出與具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白的rAAV病毒粒子相比高至少2、3、4、5、6、7、8、9或10倍的心臟/肝臟轉導比率(例如，如在靈長類動物中評估)。

在一些實施例中，該聚核苷酸卡匣包含編碼以下之聚核苷酸序列：MYBPC3、DWORF、PKP2、KCNH2、TRPM4、DSG2、TGFBR2、TGFBR1、EMD、KCNQ1、TAZ、COL3A1、JUP、CASQ2、MLRP44、DNAJC19、LMNA、TNNI3、DSP、DSG2、RAF1、SOS1、FBN1、LAMP2、FXN、RAF1、BAG3、KCNQ1、MYLK3、CRYAB、ALPK3、ACTN2、JPH2、PLN、ATP2A2、CACNA1C、DMD、DMPK、EPG5、EVC、EVC2、FBN1、NF1、SCN5A、SOS1、NPR1、ERBB4、VIP、MYH6、MYH7、Cas9、RBM20、MYOCD、ASCL1、GATA4、MEF2C、TBX5、miR-133及/或MESP1。

在一些實施例中，該聚核苷酸卡匣包含編碼以下之聚核苷酸序列：MYBPC3、DWORF、KCNH2、TRPM4、DSG2、TGFBR2、TGFBR1、EMD、KCNQ1、TAZ、COL3A1、JUP、CASQ2、MLRP44、DNAJC19、LMNA、TNNI3、DSP、DSG2、RAF1、SOS1、FBN1、LAMP2、FXN、RAF1、BAG3、KCNQ1、MYLK3、CRYAB、ALPK3、ACTN2及/或ATP2A2。在一些實施例中，該聚核苷酸卡匣包含編碼JPH2及/或PLN之聚核苷酸序列。在一些實施例中，該聚核苷酸卡匣包含編碼以下之聚核苷酸序列：LMNA之核纖層蛋白A同功型、LMNA之核纖層蛋白C同功型、LAMP2a、LAMP2b、LAMP2c、DSP之DPI同功型或DSP之DPII同功型。在一些實施例中，該聚核苷酸卡匣包含編碼以下之聚核苷酸序列：MMP11、SYNPO2L (例如，SYNPO2LA或SYNPO2LA)或靶向MTSS1之抑制性寡核苷酸。

在一些實施例中，該聚核苷酸卡匣包含編碼選自由以下組成之群之蛋白質的聚核苷酸序列：MYBPC3、DWORF、PKP2、LMNA、LAMP2、BAG3、CRYAB、JPH2、PLN、TTNI3、MYOCD、ASCL1、DSP、JUP、DSP、MYH6、MYH7、RBM20、Cas9。在一些實施例中，該聚核苷酸卡匣包含編碼saCas9之聚核苷酸序列。在一些實施例中，該聚核苷酸卡匣包含編碼以下之聚核苷酸序列：BAG3多肽之C151R突變體形式。在一些實施例中，該聚核苷酸卡匣包含編碼以下之聚核苷酸序列：靶向突變體PLN之嚮導RNA (諸如PLN之缺失型突變體，例如PLN-R14Del)。

在一些實施例中，該聚核苷酸卡匣包含編碼以下之聚核苷酸序列：CACNA1C、DMD、DMPK、EPG5、EVC、EVC2、FBN1、NF1、SCN5A、SOS1、NPR1、ERBB4、VIP、MYH7及/或Cas9。

在一些實施例中，該聚核苷酸卡匣包含編碼以下之聚核苷酸序列：MYOCD、ASCL1、GATA4、MEF2C、TBX5、miR-133及/或MESP1。

在另一態樣中，本發明提供包含本文所描述之任何rAAV病毒粒子及醫藥學上可接受之載劑的醫藥組合物。

在另一態樣中，本發明提供編碼本文所描述之蛋白殼蛋白中之任一者的聚核苷酸。

在另一態樣中，本發明提供轉導細胞之方法，其包含使細胞與編碼本文所描述之蛋白殼蛋白中之任一者的聚核苷酸接觸。

在另一態樣中，本發明提供轉導心臟細胞之方法，其包含使心臟細胞與本文所描述之任何rAAV病毒粒子接觸，其中該rAAV病毒粒子轉導心臟細胞。

在一些實施例中，心臟細胞係心肌細胞。

細胞之效率高於具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白的rAAV病毒粒子。

在另一態樣中，本發明提供將一或多種基因產物遞送至心臟細胞之方法，其包含使心臟細胞與本文所描述之任何rAAV病毒粒子接觸。

在一些實施例中，心臟細胞係心肌細胞。

在另一態樣中，本發明提供治療有需要之個體之心臟病理的方法，其包含投與治療有效量之任何rAAV病毒粒子或本文所描述之任何醫藥組合物，其中該rAAV病毒粒子轉導心臟組織。

在另一態樣中，本發明提供治療有需要之個體之心臟疾病或病況的方法，其包含投與治療有效量之任何rAAV病毒粒子或本文所描述之任何醫藥組合物，視情況其中心臟疾病或病況為心肌病(例如，DCM或HCM)或心臟衰竭(例如，射出分率降低之心臟衰竭)。

在另一態樣中，本發明提供套組，其包含編碼本文所描述之任何AAV蛋白殼蛋白的載體或質體。

在另一態樣中，本發明提供包含本文所描述之任何醫藥組合物及使用說明書之套組。

相關申請之交叉引用

本申請案主張於2022年4月11日申請之美國臨時專利申請案第63/329,778號及2022年10月10日申請之美國臨時專利申請案第63/378,983號之權益，其各自以全文引用之方式併入本文中。序列表之參考

特此提交之電子序列表的內容(TENA_037_01WO_SeqList_ST26.xml；大小：1,210,478個位元組；及創建日期：2023年4月7日)之內容以全文引用的方式併入本文中。

本發明提供經工程化蛋白殼蛋白及重組腺相關病毒(rAAV)病毒粒子。特定而言，本發明提供工程化蛋白殼蛋白(包括嵌合蛋白殼蛋白)、其鑑別方法及其使用方法。鑑別本文所揭示之新穎蛋白殼蛋白的方法廣泛適用於AAV之任何血清型，包括嵌合蛋白殼蛋白。另外，利用此方法或其他方法，可應用其迭代地改進具有突變的蛋白殼蛋白。一般而言，本發明方法係關於製備呈 cap基因聚核苷酸形式之AAV蛋白殼的隨機化或半隨機化庫、製備包含此類蛋白殼的AAV病毒粒子(藉由將 cap基因庫倂入AAV基因體中或將其以反式提供，諸如在轉染至封裝株系中的質體上)、正向或負向選擇AAV病毒粒子，及回收 cap基因用於定序。在一些實施例中，回收及定序包括奈米孔定序。可使用其他高通量或下一代定序(NGS)方法。

在一些實施例中，本發明提供重組腺相關病毒(rAAV)病毒粒子，其包含： a)如本文所描述之蛋白殼蛋白；及 b)包含編碼一或多種基因產物之核苷酸序列的異源核酸。

在一些實施例中，本文所揭示之rAAV病毒粒子包含如本文所揭示之AAV9蛋白殼蛋白。在一些實施例中，本文所揭示之rAAV病毒粒子包含如本文所揭示之嵌合AAV5/AAV9蛋白殼蛋白。在一些實施例中，本文所揭示之rAAV病毒粒子包含如本文所揭示之組合型蛋白殼蛋白

在一些實施例中，本文所描述之AAV9蛋白殼蛋白包含如下文所示之與SEQ ID NO: 1具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5 %或100%一致性的序列。在一些實施例中，本文所描述之AAV9蛋白殼蛋白包含與SEQ ID NO: 487具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的序列。VP1、VP2及VP3之N端殘基以及VR位(VR-IV、VR-V、VR-VII及VR-VIII)指示(粗體及加下劃線)於以下全長VP1之序列(SEQ ID NO: 1)中。野生型AAV9 VP1具有SEQ ID NO: 1之胺基酸序列。野生型AAV9 VP2具有SEQ ID NO: 486之胺基酸序列。野生型AAV9 VP3具有SEQ ID NO: 487之胺基酸序列。 具有變異型多肽序列的蛋白殼蛋白

在一個態樣中，本發明提供AAV9蛋白殼蛋白，其中相對於親本序列，該蛋白殼蛋白在親本序列的一或多個位點包含變異型多肽序列。在一些實施例中，親本序列的一或多個位點係選自由以下組成之群：VR-IV位點、VR-V位點、VR-VII位點及VR-VIII位點。如上述SEQ ID NO: 1中所標識，VR-IV位介於親本序列中的殘基452與460之間(「NGSGQNQ」，SEQ ID NO: 2)；VR-V位介於親本序列中的殘基497與502之間(「NNSEFA」，SEQ ID NO: 3)；VR-VII位介於親本序列中的殘基549與553之間(「GRDNV」，SEQ ID NO: 4)；VR-VIII位介於親本序列中的殘基581與594之間(「ATNHQSAQAQAQTG」，SEQ ID NO: 5)。在一些實施例中，AAV9蛋白殼蛋白包含不包括VR-IV位點、VR-V位點、VR-VII位點及/或VR-VIII位點之與SEQ ID NO: 1具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性之序列。在一些實施例中，AAV9蛋白殼蛋白包含與SEQ ID NO: 1具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性、排除VR-VIII位的序列。在一些實施例中，AAV9蛋白殼蛋白包含不包括VR-IV位點、VR-V位點、VR-VII位點及/或VR-VIII位點之與SEQ ID NO: 487具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性之序列。在一些實施例中，AAV9蛋白殼蛋白包含與SEQ ID NO: 487具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性、排除VR-VIII位的序列。在一些實施例中，AAV9蛋白殼蛋白包含親本序列之VR-IV位點、VR-V位點、VR-VII位點及VR-VIII位點中之一或多者的變異型多肽序列，其中該親本序列包含與SEQ ID NO: 463具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%一致性的序列。(在SEQ ID NO: 463中，標識為「X」的胺基酸殘基自序列一致性計算排除在外)。

在一些實施例中，本文所描述之蛋白殼蛋白在VR-IV位(SEQ ID NO: 1或SEQ ID NO: 2序列中之殘基452與460之間(NGSGQNQ))中包含胺基酸取代或插入。在一些實施例中，本文所描述之蛋白殼蛋白在VR-IV位(SEQ ID NO: 1或SEQ ID NO: 2序列中之殘基452與460之間(NGSGQNQ))中包含胺基酸取代。在一些實施例中，VR-IV位點中的胺基酸取代或插入係本文所描述之任何胺基酸取代或插入。在一些實施例中，本文所描述之蛋白殼蛋白包含SEQ ID NO: 1之位置452的胺基酸取代或VR-IV位點中之SEQ ID NO: 2 (NGSGQNQ)的第一胺基酸。在一些實施例中，本文所描述之蛋白殼蛋白包含SEQ ID NO: 1中的胺基酸取代N452K或包含VR-IV位點中的序列KGSGQNQ。

在一些實施例中，本文所描述之蛋白殼蛋白包含VR-V位(SEQ ID NO: 1或SEQ ID NO: 3序列中之殘基497與502之間(NNSEFA))中的胺基酸取代或插入。在一些實施例中，本文所描述之蛋白殼蛋白包含VR-V位(SEQ ID NO: 1或SEQ ID NO: 3序列中之殘基497與502之間(NNSEFA))中的胺基酸取代。在一些實施例中，VR-V位點中之胺基酸取代或插入係本文所描述之任何胺基酸取代或插入。

在一些實施例中，本文所描述之蛋白殼蛋白包含VR-VII位(SEQ ID NO: 1或SEQ ID NO: 4序列中之殘基549與553之間(GRDNV))中的胺基酸取代或插入。在一些實施例中，本文所描述之蛋白殼蛋白包含VR-VII位(SEQ ID NO: 1或SEQ ID NO: 4序列中之殘基549與553之間(GRDNV))中的胺基酸取代。在一些實施例中，VR-VII位點中之胺基酸取代或插入係本文所描述之任何胺基酸取代或插入。

在一些實施例中，本文所描述之蛋白殼蛋白包含VR-VIII位(SEQ ID NO: 1或SEQ ID NO: 5序列中之殘基581與594之間(ATNHQSAQAQAQTG))中的胺基酸取代或插入。在一些實施例中，本文所描述之蛋白殼蛋白包含VR-VIII位(SEQ ID NO: 1或SEQ ID NO: 5序列中之殘基581與594之間(ATNHQSAQAQAQTG))中的胺基酸取代。在一些實施例中，VR-VIII位點中的胺基酸取代或插入係本文所描述之任何胺基酸取代或插入。

在一些實施例中，AAV9蛋白殼蛋白包含變異型多肽序列，該變異型多肽序列經合理地設計；藉由誘變而引入；或經由產生序列庫、經由在一或多個位點使用隨機密碼子而隨機化。本發明之蛋白殼蛋白包括經鑑別可藉由定向演化、接著定序而富集的任何變異型多肽序列，如但不限於實例中所示。不限於任何特定的取代位點，在一些實施例中，選自由VR-IV位點、VR-V位點、VR-VII位點及VR-VIII位組成之群的一或多個位點具有如本文所描述之胺基酸取代。

本文提供多種胺基酸取代、插入及缺失。此等修飾中之任一者可與其他修飾中之任一者組合，但在修飾重疊的情況下，必須選擇一種修飾或可利用插入使兩種修飾彼此鄰近或靠近。可使用本文所描述之方法(例如個別地，iPSC-CM的活體外測試、生物體模型的活體內測試，及彙集之rAAV病毒粒子的活體內再篩選)或用於鑑別具有所需裝填效率、向性或其他所需特性之組合的其他已知方法測試修飾組合。類似地，可恰好在本文所需的位置達成修飾，或相同的修飾可位於靠近所描述位置的任何位置。蛋白殼蛋白之結構模型化可用於選擇測試用的修飾。

在一些實施例中，本文提供之工程化蛋白殼係本文所描述之任一種蛋白殼。在一些實施例中，本文提供的工程化蛋白殼係本文所描述之任一種經VR-VIII修飾之蛋白殼。在一些實施例中，本文提供的工程化蛋白殼係本文所描述之任一種經VR-IV修飾之蛋白殼。在一些實施例中，本文提供的工程化蛋白殼係本文所描述之任一種經VR-VIII及VR-IV修飾之蛋白殼。在一些實施例中，本文提供的工程化蛋白殼係本文所提供之任一實例、表格或圖中所述的任一種蛋白殼。在一些實施例中，本文提供的工程化蛋白殼係圖17中所描述之任一種蛋白殼。 靈長類動物篩選時鑑別的修飾

在一個態樣中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%多肽序列一致性，及其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含本文所描述之修飾中的一或多者。

本文所描述之任一種修飾可單獨或與其他修飾組合使用(例如與本文所描述之其他修飾組合)。

僅僅出於清楚及非限制之目的，應注意，提及進行修飾之胺基酸位置編號係相對於SEQ ID NO:1中對應胺基酸之位置。在一些實施例中，蛋白殼蛋白不包含對應於SEQ ID NO: 1的全長序列，而是包含此序列的較短變異體(例如僅包含SEQ ID NO: 487之變異體或SEQ ID NO: 486之變異體)。在此類實施例中，本文所描述之修飾可以不發生於如SEQ ID NO: 1中的相同編號位置，而是發生於與參考序列SEQ ID NO: 1相同的位點或共有序列。在一些實施例中，蛋白殼蛋白係SEQ ID NO: 1之變異體，且本文所描述之修飾發生於與SEQ ID NO: 1相同的編號位置。

該蛋白殼蛋白可包含在位置584處之胺基酸插入，其包含天冬醯胺酸(N)、蘇胺酸(T)、酪胺酸(Y)、苯丙胺酸(F)及丙胺酸(A)中之一或多者。

該蛋白殼蛋白可包含在位置585處之胺基酸插入，其包含組胺酸(H)及甲硫胺酸(M)中之一或多者。

該蛋白殼蛋白可包含在位置586處之胺基酸插入，其包含組胺酸(H)、酪胺酸(Y)、纈胺酸(V)、蘇胺酸(T)、丙胺酸(A)、異白胺酸(I)、色胺酸(W)、甲硫胺酸(M)及白胺酸中之一或多者。

該蛋白殼蛋白可包含在位置587處之胺基酸插入，其包含異白胺酸(I)及脯胺酸(P)中之一或多者。

該蛋白殼蛋白可包含在位置588處之胺基酸插入，其包含異白胺酸(I)、蘇胺酸(T)及脯胺酸(P)中之一或多者。

該蛋白殼蛋白可包含一或多個選自由以下組成之群的胺基酸取代：N452K、N452A、N452V、G453A、G453N、S454T、S454D、G455N、Q456L、Q456K、N457L、N457V、Q458I及Q458H。

蛋白殼蛋白可包含胺基酸取代N452K。

該蛋白殼蛋白可包含一或多個選自由以下組成之群的胺基酸取代：T582D、T582L、T582E、T582A、T582F、T582R、T582P、N583V、N583T、H584R、H584Q、H584K、H584V、H584Y、H584M、H584T、H584W、H584E、H584D、Q585T、Q585C、Q585V、Q585L、Q585N、Q585S、Q585P、Q585A、Q585M、Q585E、Q585Y、Q585G、Q585H、Q585I、S586D、S586T、S586G、S586K、S586M、S586N、S586I、S586Q、S586L、S586P、S586F、S586R、A587F、A587S、A587T、A587N、A587L、A587P、A587V、A587K、A587I、A587R、A587H、A587G、A587M、A587D、A587W、Q588L、Q588S、Q588F、Q588N、Q588G、Q588R、Q588I、Q588V、Q588T、Q588Y、Q588H、Q588M、Q588K、Q588D、A589R、A589I、A589N、A589S、A589V、A589Q、A589F、A589T、A589K、A589H、A589E、A589W、A589L、A589Y、A589M、Q590I、Q590S、Q590N、Q590G、Q590D、Q590R、Q590H、Q590T、Q590M、Q590F、Q590Y、Q590L、A591I、G594Q及G594D。

蛋白殼蛋白可包含在位置584處之胺基酸插入，其由TY、FN或AT組成。

蛋白殼蛋白可包含在位置585處之胺基酸插入，其由MH組成。

蛋白殼蛋白可包含在位置586處之胺基酸插入，其由HY、VT、AI、WM或ML組成。

蛋白殼蛋白可包含在位置587處之胺基酸插入，其由PI組成。

蛋白殼蛋白可包含在位置588處之胺基酸插入，其由IT或PT組成。

該蛋白殼蛋白可包含一或多個選自由以下組成之群的胺基酸取代：T582D、T582E、N583V、H584Q、S586K、A587P、A587S、Q588G、Q588M、A589S、A591I、G594Q及G594D。

該蛋白殼蛋白可包含一或多個選自由以下組成之群的胺基酸取代：T582L、T582A、T582F、T582R、T582P、H584R、H584K、H584V、H584Y、H584M、H584Q、H584W、H584E、H584D、Q585T、Q585N、Q585M、Q585E、Q585V、Q585H、S586T、S586G、S586Q、S586I、S586L、S586F、S586D、S586R、S586M、A587F、A587I、A587H、A587M、A587N、A587W、Q588Y、Q588S、Q588T及Q588R。

該蛋白殼蛋白可包含一或多個選自由以下組成之群的胺基酸取代：Q585C、Q585S及S586I。

該蛋白殼蛋白可包含一或多個選自由以下組成之群的胺基酸取代：Q585V、Q585T、Q585L、Q585C、Q585N、Q585S、Q585M、Q585E、Q585P、Q585A、Q585G、Q585H、Q585I、S586D、S586G、S586T、S586M、S586N、S586L、S586R、S586I、S586K、A587S、A587T、A587N、A587L、A587V、A587K、A587I、A587F、A587P、A587R、A587D、Q588L、Q588S、Q588F、Q588N、Q588R、Q588I、Q588V、Q588T、Q588H、Q588Y、Q588M、Q588K、Q588D、Q588G、A589R、A589I、A589N、A589S、A589V、A589Q、A589F、A589T、A589K、A589H、A589E、A589W、A589L、A589Y、A589M、Q590I、Q590S、Q590N、Q590G、Q590D、Q590R、Q590H、Q590T、Q590M、Q590F、Q590Y及Q590L。

該蛋白殼蛋白可包含一或多個選自由以下組成之群的胺基酸取代：A587V及A587G。

蛋白殼蛋白可包含選自SEQ ID NOs: 599-692之胺基酸序列，且其中蛋白殼蛋白與以下具有至少80%、至少90%、至少95%、至少98%或100%一致性：SEQ ID NOs: 488、499、504、505、506、510、512、513、516、518、521、522、533、536、539、558、562、566、571、576、578、579、580、581、585、588、589、705、706、707、708及710。

蛋白殼蛋白可包含選自SEQ ID NO: 599-692之胺基酸序列，且其中蛋白殼蛋白與SEQ ID NO: 496-589具有至少80%、至少90%、至少95%、至少98%或100%一致性。

蛋白殼蛋白可包含位置586-589或大致位置586-589的胺基酸序列ANYG。

蛋白殼蛋白可包含兩個或更多個選自由以下組成之群的胺基酸取代：N452K、N452A、N452V、G453A、G453N、S454T、S454D、G455N、Q456L、Q456K、N457L、N457V、Q458I及Q458H。

蛋白殼蛋白可包含胺基酸取代N452K、N452A或N452V。

蛋白殼蛋白可包含胺基酸取代N452K。

蛋白殼蛋白可包含胺基酸取代G453A或G453N。

蛋白殼蛋白可包含胺基酸取代S454T或S454D。

蛋白殼蛋白可包含胺基酸取代G455N。

蛋白殼蛋白可包含胺基酸取代Q456L或Q456K。

蛋白殼蛋白可包含胺基酸取代N457L或N457V。

蛋白殼蛋白可包含胺基酸取代Q458I或Q458H。

蛋白殼蛋白可包含位置452-458或大致位置452-458的胺基酸序列，其選自KGSGQNQ (SEQ ID NO: 590)、NASGQNQ (SEQ ID NO: 591)、NGTGQNQ (SEQ ID NO: 592)、NGSGLNQ (SEQ ID NO: 593)、ANDNKLI (SEQ ID NO: 594)、VNDNKVI (SEQ ID NO: 595)、NGSGQNH (SEQ ID NO: 596)或ANDNKVI (SEQ ID NO: 597)，且其中蛋白殼蛋白與SEQ ID NO: 488-495具有至少80%、至少90%、至少95%、至少98%或100%一致性。

相對於參考序列SEQ ID NO: 1，蛋白殼蛋白可包含位置586-589或大致位置586-589的胺基酸序列，其選自NTVS (SEQ ID NO: 712)、TLFN (SEQ ID NO: 713)、STYL (SEQ ID NO: 714)、SILT (SEQ ID NO: 715)、MTTA (SEQ ID NO: 716)及STSI (SEQ ID NO: 717)。在一些此等實施例中，相對於參考序列SEQ ID NO: 1，蛋白殼蛋白包含N452K取代。

相對於參考序列SEQ ID NO: 1，蛋白殼蛋白可包含位置586-589或大致位置586-589的胺基酸序列，其選自GAYA (SEQ ID NO: 741)、TKLA (SEQ ID NO: 742)、SSFT (SEQ ID NO: 743)、DNIR (SEQ ID NO: 744)、NVIS (SEQ ID NO: 745)、GTSI (SEQ ID NO: 746)、ANYG (SEQ ID NO: 305)及DARA (SEQ ID NO: 747)。在一些此等實施例中，相對於參考序列SEQ ID NO: 1，蛋白殼蛋白包含N452K取代。

相對於參考序列SEQ ID NO: 1，蛋白殼蛋白可在位置586-589或大致位置586-589包含胺基酸序列SAQA (SEQ ID NO: 748)，或在相應位置包含與參考序列SEQ ID NO: 1相同的序列。在一些此等實施例中，相對於參考序列SEQ ID NO: 1，蛋白殼蛋白包含N452K取代。

相對於參考序列SEQ ID NO: 1，蛋白殼蛋白可在位置585-590或在大致位置585-590包含選自以下的胺基酸序列：ENTVSI (SEQ ID NO: 719)、QTLFNS (SEQ ID NO: 720)、NSTYLG (SEQ ID NO: 721)、GSILTH (SEQ ID NO: 722)、MMTTAR (SEQ ID NO: 723)及CSTSIR (SEQ ID NO: 724)。在一些此等實施例中，相對於參考序列SEQ ID NO: 1，蛋白殼蛋白包含N452K取代。

相對於參考序列SEQ ID NO: 1，蛋白殼蛋白可在位置585-590或在大致位置585-590包含選自以下的胺基酸序列：QGAYAQ (SEQ ID NO: 749)、NTKLAI (SEQ ID NO: 750)、VSSFTS (SEQ ID NO: 751)、EDNIRS (SEQ ID NO: 725)、NNVISG (SEQ ID NO: 752)、TGTSII (SEQ ID NO: 753)、QANYGQ (SEQ ID NO: 754)及QDARAQ (SEQ ID NO: 755)。在一些此等實施例中，相對於參考序列SEQ ID NO: 1，蛋白殼蛋白包含N452K取代。

相對於參考序列SEQ ID NO: 1，蛋白殼蛋白可在位置585-590或大致位置585-590包含胺基酸序列QSAQAQ (SEQ ID NO: 756)，或在相應位置包含與參考序列SEQ ID NO: 1相同的序列。在一些此等實施例中，相對於參考序列SEQ ID NO: 1，蛋白殼蛋白包含N452K取代。

蛋白殼蛋白可在位置581-584 (亦即，ATNH)及/或位置591-594 (亦即，AQTG)包含AAV9野生型胺基酸序列。蛋白殼蛋白可在位置581-583 (亦即，ATN)及/或位置591-594 (亦即，AQTG)包含AAV9野生型胺基酸序列。 VR-IV 、 VR-V 及 VR-VII 位的修飾

在一些實施例中，本發明之蛋白殼蛋白在VR-IV位點包含變異型多肽序列。在一些實施例中，整個VR-IV位(「NGSGQNQQT」，SEQ ID NO: 2)由下式之肽取代： -(X) _n - 其中 n為7至11，且X表示20個標準胺基酸(SEQ ID NO: 478)中之任一者。

在一些實施例中，VR-IV位點之變異型多肽序列為： -X ₁-X ₂-X ₃-X ₄-X ₅-X ₆-X ₇-X ₈-X ₉- (SEQ ID NO: 478)。

在一些實施例中，VR-IV位點之變異型多肽序列為： -X ₁-X ₂-X ₃-X ₄-X ₅-X ₆-X ₇-X ₈-X ₉- 其中X ₁為G、S或V；X ₂為Y、Q或I；X ₃為H、W、V或I；X ₄為K或N；X ₅為S、G或I；X ₆為G或R；X ₇為A、P或V；X ₈為A或R；及/或X ₉為Q或D (SEQ ID NO: 477)。

在一些實施例中，VR-IV位點之變異型多肽序列為： -X ₁-X ₂-X ₃-X ₄-X ₅-X ₆-X ₇-X ₈-X ₉- 其中X ₁為K、G、S或V；X ₂為Y、Q或I；X ₃為H、W、V或I；X ₄為K或N；X ₅為S、G或I；X ₆為G或R；X ₇為A、P或V；X ₈為A或R；及/或X ₉為Q或D (SEQ ID NO: 729)。

在一些實施例中，VR-IV位點之變異型多肽序列為： -X ₁-X ₂-X ₃-X ₄-X ₅-X ₆-X ₇-X ₈-X ₉- 其中X ₁為K (SEQ ID NO: 730)。

在一些實施例中，VR-IV位點之變異型多肽序列包含序列KGSGQNQQT (SEQ ID NO: 727)或由該序列組成。

在一些實施例中，本發明之蛋白殼蛋白在VR-IV位點包含具有N452K取代之變異型多肽序列。在一些實施例中，本發明之蛋白殼蛋白包含VR-IV位點具有N452K取代的變異型多肽序列(相對於參考SEQ ID NO: 1)或包含序列KGSGQNQQT (SEQ ID NO: 727)。在一些實施例中，此類取代為AAV9蛋白殼蛋白中的唯一取代。在一些實施例中，相對於參考SEQ ID NO: 1，此類取代為本發明之蛋白殼蛋白中的唯一取代。在一些實施例中，蛋白殼蛋白包含胺基酸取代N452K作為野生型AAV9蛋白殼蛋白(諸如SEQ ID NO: 487或SEQ ID NO: 1之親本序列)中的唯一取代。在一些實施例中，此類取代為AAV9蛋白殼蛋白的VR-IV及/或VR-III位點中的唯一取代。在一些實施例中，除本文所描述或此項技術中已知之任何其他取代或插入(包括但不限於VR-IV位點、VR-V位點、VR-VII位點及/或VR-VIII位點中的任何其他取代或插入)之外，本發明之蛋白殼蛋白(諸如，AAV9蛋白殼蛋白)亦在VR-IV位點包含胺基酸取代N452K。在一些實施例中，相對於參考SEQ ID NO: 1，本發明之蛋白殼蛋白在VR-IV位點包含胺基酸取代N452K，或除本文所描述或此項技術中已知之任何其他取代、插入或嵌合修飾之外，亦包含序列KGSGQNQQT (SEQ ID NO: 727)。在一些實施例中，除本文所描述或此項技術中已知之任何嵌合修飾之外，本發明之蛋白殼蛋白亦包含序列KGSGQNQQT (SEQ ID NO: 727)。在一些實施例中，N452K取代係與本文所描述之任何其他取代或插入(例如在VR-IV位點及/或VR-VIII位點中)組合及/或與本文所描述之任何嵌合修飾組合。在一些實施例中，此類取代係與本文所描述或此項技術中已知之VR-IV位點中的任何取代或插入組合。在一些實施例中，此類取代係與本文所描述或此項技術中已知之VR-V位點中的任何取代或插入組合。在一些實施例中，此類取代係與本文所描述或此項技術中已知之VR-VII位點中的任何取代或插入組合。在一些實施例中，此類取代係與本文所描述或此項技術中已知之VR-VIII位點中的任何取代或插入組合。在一些實施例中，除VR-VIII位點中之任一個、兩個、三個或更多個取代或插入之外，本發明之蛋白殼蛋白亦在VR-IV位點包含胺基酸取代N452K。在一些實施例中，除VR-VIII位點中之一個、兩個、三個或更多個取代或插入之外，本發明之蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代N452K。在一些實施例中，蛋白殼蛋白，諸如相對於參考序列SEQ ID NO: 1而在VR-IV位點具有N452K取代的蛋白殼蛋白，提高轉導效率(例如任何組織的轉導效率，諸如肌肉、心臟、骨骼肌、腦等)。在一些實施例中，本發明之蛋白殼蛋白，諸如相對於參考SEQ ID NO:1而在VR-IV位點具有N452K取代的蛋白殼蛋白，提高心臟的轉導效率。

在一些實施例中，相對於參考SEQ ID NO:1，本發明之蛋白殼蛋白在VR-IV位點之位置452包含野生型AAV9胺基酸(其為N)。

在一些實施例中，相對於參考SEQ ID NO:1，本發明之工程化蛋白殼蛋白在VR-IV位點之位置452包含N或K。

在一些實施例中，VR-IV位點之變異型多肽序列包含或由選自以下之序列組成：GYHKSGAAQ (SEQ ID NO: 6)、VIIKSGAAQ (SEQ ID NO: 7)、GYHKIGAAQ (SEQ ID NO: 8)、GYHKSGVAQ (SEQ ID NO: 9)、VYHKSGAAQ (SEQ ID NO: 10)、GYHKISAAQ (SEQ ID NO: 11)、TTVPSSSRY (SEQ ID NO: 12)、VIIRVVRLS (SEQ ID NO: 13)、TVLGQNQQT (SEQ ID NO: 14)、IYHKSGAAQ (SEQ ID NO: 15)、TVLDKNQQT (SEQ ID NO: 16)、YSGTDVRYK (SEQ ID NO: 17)、VTASGKEHR (SEQ ID NO: 18)、GYRKSGAAQ (SEQ ID NO: 19)、NRTVSNGSE (SEQ ID NO: 20)、TVLDRINKT (SEQ ID NO: 21)、TGVGHLTSA (SEQ ID NO: 22)、GYHKGGAAQ (SEQ ID NO: 23)、VIAKSGAAQ (SEQ ID NO: 24)、GYHKSGAAH (SEQ ID NO: 25)、FIIKSGAAQ (SEQ ID NO: 26)、GYHKVVRLS (SEQ ID NO: 27)、GATRSAVES (SEQ ID NO: 28)、TVSGQNQQT (SEQ ID NO: 29)、LSHKSGAAQ (SEQ ID NO: 30)、SSSGQNQQT (SEQ ID NO: 31)、SGSGQNQQT (SEQ ID NO: 32)、SQVNGRPRD (SEQ ID NO: 33)、GYHKEWCGS (SEQ ID NO: 34)、VVSSKSLNS (SEQ ID NO: 35)、GYHKSGAAP (SEQ ID NO: 36)、DASSREKVR (SEQ ID NO: 37)、SYHKSGAAQ (SEQ ID NO: 38)、TANGSQKYL (SEQ ID NO: 39)、VIIRVGAAQ (SEQ ID NO: 40)、SSTNKISTA (SEQ ID NO: 41)、TVLDRIQQT (SEQ ID NO: 42)、GYHKSGAVQ (SEQ ID NO: 43)、TVLDQNQQT (SEQ ID NO: 44)、VNMSSPIKT (SEQ ID NO: 45)、AAYNSNSAF (SEQ ID NO: 46)、GYHKSGAAR (SEQ ID NO: 47)、VIIRVVRLQ (SEQ ID NO: 48)、RFWTQNQQT (SEQ ID NO: 49)、SSPRASSAL (SEQ ID NO: 50)、IIIRVVRLS (SEQ ID NO: 51)、KSSNLTAMP (SEQ ID NO: 52)、NLNSDRHSA (SEQ ID NO: 53)、LSLKSGAAQ (SEQ ID NO: 54)、TVLDRNQQT (SEQ ID NO: 55)、GSERVSNSG (SEQ ID NO: 56)、VIAKIGAAQ (SEQ ID NO: 57)、VYHKIGAAQ (SEQ ID NO: 58)、LSYKSGAAQ (SEQ ID NO: 59)、STVSQPVRT (SEQ ID NO: 60)、GHHKSGAAQ (SEQ ID NO: 61)、YAGIDPRYH (SEQ ID NO: 62)、DRSRKSMCD (SEQ ID NO: 63)、VIIRSGAAQ (SEQ ID NO: 64)、GYHKSGGSA (SEQ ID NO: 65)、VIIKIGAAQ (SEQ ID NO: 66)、GYHKVVQLS (SEQ ID NO: 67)、VIIKLVAAQ (SEQ ID NO: 68)、KVSSHSVCD (SEQ ID NO: 69)、GYHKRVRLS (SEQ ID NO: 70)、GYHKSSAAQ (SEQ ID NO: 71)、GYRKIGAAQ (SEQ ID NO: 72)、GYHKSGAAC (SEQ ID NO: 73)、GYRQSGAAQ (SEQ ID NO: 74)、VIIKLIAAQ (SEQ ID NO: 75)、VIIRVVRAQ (SEQ ID NO: 76)、GYHKSGAAW (SEQ ID NO: 77)、GYHKSGAVS (SEQ ID NO: 78)、GYHKEWCSS (SEQ ID NO: 79)、SSSSNRLAD (SEQ ID NO: 80)、SNNSSSAKF (SEQ ID NO: 81)、VKLSSTSSS (SEQ ID NO: 82)、GYHKEWCAQ (SEQ ID NO: 83)、AGSGQNQQT (SEQ ID NO: 84)、NPHGTATYL (SEQ ID NO: 85)、NGSGQNQHT (SEQ ID NO: 86)、GYHKVGAAQ (SEQ ID NO: 87)、VIIRVVRLK (SEQ ID NO: 88)、NSIPSTSKW (SEQ ID NO: 89)、VIIRVVQLQ (SEQ ID NO: 90)、SQVNGRPQD (SEQ ID NO: 91)、NGSGQDQQT (SEQ ID NO: 92)、GLNSSDRRL (SEQ ID NO: 93)、IYHKIGAAQ (SEQ ID NO: 94)、YHKSGAAQL (SEQ ID NO: 95)、YSGTDVQYK (SEQ ID NO: 96)、LGSGQNQQT (SEQ ID NO: 97)、PVSSGADRR (SEQ ID NO: 98)、EHSTKLNAC (SEQ ID NO: 99)、NGSDRINKR (SEQ ID NO: 100)、VIIKGGAAQ (SEQ ID NO: 101)、GYHRVVRLS (SEQ ID NO: 102)、VIIRVVRLL (SEQ ID NO: 103)及VILKSGAAQ (SEQ ID NO: 104)。在一些此等實施例中之任一者中，第一胺基酸在此位置經K取代而非經任何其他胺基酸取代(或相對於參考序列SEQ ID NO: 1，具有N452K取代)。

在一些實施例中，在VR-IV位點處之變異型多肽序列包含與SEQ ID NOs: 6-104中之一者具有至少約60%、70%、80%、90%或100%一致性的多肽序列、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，VR-IV位點之變異型多肽序列包含與KGSGQNQQT (SEQ ID NO: 727)至少約60%、70%、77%、80%、88%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於KGSGQNQQT (SEQ ID NO: 727)，VR-IV位點之變異型多肽序列包含由至多1、2、3或4個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-IV位點處之變異型多肽序列包含由至多1、2、3或4個保守胺基酸取代相對KGSGQNQQT (SEQ ID NO:727)組成之序列、主要由該序列組成或由該序列組成。在一些實施例中，VR-IV位點之變異型多肽序列為KGSGQNQQT (SEQ ID NO: 727)。

在一些實施例中，VR-IV位點之變異型多肽序列包含與GYHKSGAAQ (SEQ ID NO: 6)至少約60%、70%、77%、80%、88%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於GYHKSGAAQ (SEQ ID NO: 6)，VR-IV位點之變異型多肽序列包含由至多1、2、3或4個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於GYHKSGAAQ (SEQ ID NO: 6)，VR-IV位點之變異型多肽序列包含由至多1、2、3或4個保守胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，VR-IV位點之變異型多肽序列為GYHKSGAAQ (SEQ ID NO: 6)。在一些此等實施例中之任一者中，第一胺基酸經K取代(KYHKSGAAQ；SEQ ID NO: 757)。

在一些實施例中，VR-IV位點之變異型多肽序列包含與SQVNGRPRD (SEQ ID NO: 33)至少約60%、70%、77%、80%、88%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於SQVNGRPRD (SEQ ID NO: 33)，VR-IV位點之變異型多肽序列包含由至多1、2、3或4個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於SQVNGRPRD (SEQ ID NO: 33)，VR-IV位點之變異型多肽序列包含由至多1、2、3或4個保守胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，VR-IV位點之變異型多肽序列為SQVNGRPRD (SEQ ID NO: 33)。在一些此等實施例中之任一例中，第一胺基酸經K取代(KQVNGRPRD；SEQ ID NO: 758)。

在一些實施例中，本發明之蛋白殼蛋白包含VR-V位點之變異型多肽序列。在一些實施例中，整個VR-V位(「NNSEFA」，SEQ ID NO: 3)由下式之肽取代： -(X) _n - 其中 n為4至8，且X表示20個標準胺基酸(SEQ ID NO: 479)中之任一者。

在一些實施例中，VR-V位點之變異型多肽序列為： -X ₁-X ₂-X ₃-X ₄-X ₅-X ₆- (SEQ ID NO: 479)

在一些實施例中，VR-V位點之變異型多肽序列為： -X ₁-X ₂-X ₃-X ₄-X ₅-X ₆- 其中X ₁為S、L、H、N或A；X ₂為T、M、K、G或N；X ₃為S、T、M或I；X ₄為S、P、F、M或N；X ₅為F、S、P或L；且X ₆為I、V或T (SEQ ID NO: 474)。

在一些實施例中，在VR-V位點處之變異型多肽序列包含或由選自以下之序列組成：LNSMLI (SEQ ID NO: 105)、NGMSFT (SEQ ID NO: 106)、HKTFSI (SEQ ID NO: 107)、SMSNFV (SEQ ID NO: 108)、ATIPPI (SEQ ID NO: 109)、SSTHFD (SEQ ID NO: 110)、NNQFSY (SEQ ID NO: 111)、NMGHYS (SEQ ID NO: 112)、SKQMFQ (SEQ ID NO: 113)、WPSAGV (SEQ ID NO: 114)、NGGYQC (SEQ ID NO: 115)、STSPIV (SEQ ID NO: 116)、SQSGLW (SEQ ID NO: 117)、VNSQFS (SEQ ID NO: 118)、SGIEFR (SEQ ID NO: 119)、SASKFT (SEQ ID NO: 120)、QLNWTS (SEQ ID NO: 121)、SMGFPV (SEQ ID NO: 122)、SSFMGL (SEQ ID NO: 123)、GSNFHV (SEQ ID NO: 124)、DMTLYA (SEQ ID NO: 125)、MGCLFT (SEQ ID NO: 126)、ALAFNS (SEQ ID NO: 127)、SKFLFA (SEQ ID NO: 128)、QDAGLL (SEQ ID NO: 129)、QDASLL (SEQ ID NO: 130)、RDDMFS (SEQ ID NO: 131)、LSRCFQ (SEQ ID NO: 132)、LSRDFQ (SEQ ID NO: 133)、QGLTPV (SEQ ID NO: 134)、QWDVFT (SEQ ID NO: 135)、PRVSFA (SEQ ID NO: 136)、QSYYNP (SEQ ID NO: 137)、RASHLG (SEQ ID NO: 138)、IILFVP (SEQ ID NO: 139)、IISFSY (SEQ ID NO: 140)、LDSMLI (SEQ ID NO: 141)、NIGHYS (SEQ ID NO: 142)、NRMSFT (SEQ ID NO: 143)、NGMSFA (SEQ ID NO: 144)、IILLLP (SEQ ID NO: 145)、RMRSLL (SEQ ID NO: 146)、RRRCRF (SEQ ID NO: 147)、PKQMFQ (SEQ ID NO: 148)、LMSNFV (SEQ ID NO: 149)、GASHLG (SEQ ID NO: 150)、CASISW (SEQ ID NO: 151)、SMTTFR (SEQ ID NO: 152)、AAIPPI (SEQ ID NO: 153)、PGCESL (SEQ ID NO: 154)、SMGFAC (SEQ ID NO: 155)、FLPSLM (SEQ ID NO: 156)、NGISFT (SEQ ID NO: 157)、ESSRWA (SEQ ID NO: 158)、QLYFVP (SEQ ID NO: 159)、SSNFHV (SEQ ID NO: 160)、LEFMLI (SEQ ID NO: 161)、QFDSFD (SEQ ID NO: 162)、SPVFAC (SEQ ID NO: 163)、VRLIFD (SEQ ID NO: 164)、NGMSFI (SEQ ID NO: 165)、LLFPPI (SEQ ID NO: 166)、GAGVTG (SEQ ID NO: 167)、QWMSFT (SEQ ID NO: 168)、SIGFPV (SEQ ID NO: 169)、RMQSLL (SEQ ID NO: 170)、TSALQV (SEQ ID NO: 171)、SLTHFD (SEQ ID NO: 172)、QELPFL (SEQ ID NO: 173)、LYFLLP (SEQ ID NO: 174)、LSFFFA (SEQ ID NO: 175)、LSRIFQ (SEQ ID NO: 176)、DEVILF (SEQ ID NO: 177)、RAGVAG (SEQ ID NO: 178)、NGMSLP (SEQ ID NO: 179)、PFEDFQ (SEQ ID NO: 180)、QYGSLF (SEQ ID NO: 181)、NYTFVL (SEQ ID NO: 182)、MSGYQC (SEQ ID NO: 183)、NYAFVP (SEQ ID NO: 184)、RAGVTG (SEQ ID NO: 185)、WNSMLI (SEQ ID NO: 186)、IRRFSI (SEQ ID NO: 187)、NGMSFY (SEQ ID NO: 188)、IIQFSY (SEQ ID NO: 189)、NGCLFT (SEQ ID NO: 190)、RDASLL (SEQ ID NO: 191)、ADSMLI (SEQ ID NO: 192)、VDSQFS (SEQ ID NO: 193)、SIGNFV (SEQ ID NO: 194)、NGMSLL (SEQ ID NO: 195)、NYTFVP (SEQ ID NO: 196)、IRRLVF (SEQ ID NO: 197)、PMSNFV (SEQ ID NO: 198)、LWVFPV (SEQ ID NO: 199)、VRLHFD (SEQ ID NO: 200)、SMSNLF (SEQ ID NO: 201)、STSLIV (SEQ ID NO: 202)及HKTFGI (SEQ ID NO: 203)。

在一些實施例中，在VR-V位點處之變異型多肽序列包含與SEQ ID NOs: 105-203中之一者具有至少約60%、70%、80%、90%、95%或100%一致性的多肽序列、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，在VR-V位點處之變異型多肽序列包含與LNSMLI (SEQ ID NO: 105)具有至少約60%、70%、80%、83%、90%或100%一致性的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於LNSMLI (SEQ ID NO: 105)，VR-V位點之變異型多肽序列包含由至多1、2、3或4個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-V位點處之變異型多肽序列包含由至多1、2、3或4個保守胺基酸取代相對LNSMLI (SEQ ID NO: 105)組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，VR-V位點之變異型多肽序列為LNSMLI (SEQ ID NO: 105)。

在一些實施例中，本發明之蛋白殼蛋白在VR-VII位點包含變異型多肽序列。在一些實施例中，整個VR-VII位(「GRDNV」，SEQ ID NO: 4)由下式之肽取代： -(X) _n - 其中 n為3至7，且X表示20個標準胺基酸(SEQ ID NO: 480)中之任一者。

在一些實施例中，VR-VII位點之變異型多肽序列為： -X ₁-X ₂-X ₃-X ₄-X ₅- (SEQ ID NO: 480)

在一些實施例中，VR-VII位點之變異型多肽序列為： -X ₁-X ₂-X ₃-X ₄-X ₅- 其中X ₁為V、L、Q、C或R；X ₂為S、H、G、C或D；X ₃為Y、S、L、G或N；X ₄為S、L、H、Q或N；且X ₅為V、I或R (SEQ ID NO: 475)。

在一些實施例中，VR-VII位點之變異型多肽序列包含或由選自以下之序列組成：RGNQV (SEQ ID NO: 204)、VSLNR (SEQ ID NO: 205)、CDYSV (SEQ ID NO: 206)、QHGHI (SEQ ID NO: 207)、LCSLV (SEQ ID NO: 208)、PTIYV (SEQ ID NO: 209)、DVIHI (SEQ ID NO: 210)、AEFYA (SEQ ID NO: 211)、NSVVC (SEQ ID NO: 212)、VRSNC (SEQ ID NO: 213)、LANNI (SEQ ID NO: 214)、NLQFM (SEQ ID NO: 215)、EFRDL (SEQ ID NO: 216)、DFGSL (SEQ ID NO: 217)、VTNYC (SEQ ID NO: 218)、WNTNA (SEQ ID NO: 219)、TESTC (SEQ ID NO: 220)、SGAAV (SEQ ID NO: 221)、GGCDI (SEQ ID NO: 222)、SGSVV (SEQ ID NO: 223)、SSNAC (SEQ ID NO: 224)、YNTTV (SEQ ID NO: 225)、SKCLA (SEQ ID NO: 226)、SAYTV (SEQ ID NO: 227)、VRDTV (SEQ ID NO: 228)、WRSMV (SEQ ID NO: 229)、AYHGV (SEQ ID NO: 230)、GMNTI (SEQ ID NO: 231)、AETSL (SEQ ID NO: 232)、TLVYV (SEQ ID NO: 233)、NHDWI (SEQ ID NO: 234)、TVGIV (SEQ ID NO: 235)、SLPTV (SEQ ID NO: 236)、TGILC (SEQ ID NO: 237)、TDTYI (SEQ ID NO: 238)、LPVTY (SEQ ID NO: 239)、GDVYI (SEQ ID NO: 240)、LYGTV (SEQ ID NO: 241)、GCEFI (SEQ ID NO: 242)、SAGLL (SEQ ID NO: 243)、IKSNI (SEQ ID NO: 244)、VTTSL (SEQ ID NO: 245)、AVTSV (SEQ ID NO: 246)、RDIHI (SEQ ID NO: 247)、SAISL (SEQ ID NO: 248)、VASTC (SEQ ID NO: 249)、IKGLL (SEQ ID NO: 250)、GSYHT (SEQ ID NO: 251)、RIGFV (SEQ ID NO: 252)、NDIYI (SEQ ID NO: 253)、AVSCV (SEQ ID NO: 254)、QHNLL (SEQ ID NO: 255)、VSSCV (SEQ ID NO: 256)、LNLDV (SEQ ID NO: 257)、LGATI (SEQ ID NO: 258)、PVLCV (SEQ ID NO: 259)、SARHI (SEQ ID NO: 260)、RATLI (SEQ ID NO: 261)、PYNHA (SEQ ID NO: 262)、IGDSI (SEQ ID NO: 263)、SPMLC (SEQ ID NO: 264)、YDSTL (SEQ ID NO: 265)、ALKHV (SEQ ID NO: 266)、ADLLT (SEQ ID NO: 267)、NNGHL (SEQ ID NO: 268)、INSEV (SEQ ID NO: 269)、SNKTT (SEQ ID NO: 270)、GSTGL (SEQ ID NO: 271)、DSDMI (SEQ ID NO: 272)、TSNFI (SEQ ID NO: 273)、RNFTT (SEQ ID NO: 274)、SHKYS (SEQ ID NO: 275)、VSDIV (SEQ ID NO: 276)、RVVQA (SEQ ID NO: 277)、AACAV (SEQ ID NO: 278)、RGRQI (SEQ ID NO: 279)、AVANI (SEQ ID NO: 280)、AGYDL (SEQ ID NO: 281)、LSEAA (SEQ ID NO: 282)、MSNYL (SEQ ID NO: 283)、NFSDN (SEQ ID NO: 284)、SCCDV (SEQ ID NO: 285)、LASSV (SEQ ID NO: 286)、PDHAV (SEQ ID NO: 287)、KFDII (SEQ ID NO: 288)、NSSSA (SEQ ID NO: 289)、HTMHV (SEQ ID NO: 290)、TLSYC (SEQ ID NO: 291)、ADTHR (SEQ ID NO: 292)、SMYSV (SEQ ID NO: 293)、SVNLV (SEQ ID NO: 294)、MSGHL (SEQ ID NO: 295)、KISDT (SEQ ID NO: 296)、TGLLA (SEQ ID NO: 297)、AWTTS (SEQ ID NO: 298)、GGALI (SEQ ID NO: 299)、SCIEV (SEQ ID NO: 300)、PPVIC (SEQ ID NO: 301)及GTYNL (SEQ ID NO: 302)。

在一些實施例中，在VR-VII位點處之變異型多肽序列包含與SEQ ID NOs: 204-302中之一者具有至少約60%、70%、80%、90%或100%一致性的多肽序列、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，VR-VII位點之變異型多肽序列包含與RGNQV (SEQ ID NO: 204)至少約60%、70%、80%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於RGNQV (SEQ ID NO: 204)，VR-VII位點之變異型多肽序列包含由至多1、2、3或4個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-VII位點處之變異型多肽序列包含由至多1、2、3或4個保守胺基酸取代相對RGNQV(SEQ ID NO: 204)組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，VR-VII位點之變異型多肽序列為RGNQV(SEQ ID NO: 204)。 VR-VIII 位點之 修飾

在一些實施例中，本發明之蛋白殼蛋白在VR-VIII位點處包含變異型多肽序列。

在一些實施例中，VR-VIII位點之位置586至589 (相對於參考序列SEQ ID NO: 1)的胺基酸(「SAQA」)係由下式之肽取代： -(X) _n - 其中 n為2至6，且X表示20個標準胺基酸(SEQ ID NO: 481)中之任一者。

在一些實施例中，VR-VIII位點之變異型多肽序列為： -X ₁-X ₂-X ₃-X ₄- (SEQ ID NO: 481)

在一些實施例中，VR-VIII位點之變異型多肽序列為： -X ₁-X ₂-X ₃-X ₄- 其中X ₁為S、N或A；X ₂為V、M、N或A；X ₃為Y、V、S或G；且X ₄為Y、T、M、G或N (SEQ ID NO: 476)。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含： -X ₁-X ₂-X ₃-X ₄- 其中X ₁為S、N、T、M、G或D；X ₂為A、T、L、I、K、S、N或V；X ₃為Q、V、F、Y、L、T、S、I、R或Q；且X ₄為A、S、N、L、T、I或R (SEQ ID NO: 731)。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含： -X ₁-X ₂-X ₃-X ₄- 其中X ₁為S、N、T、M、G或D；X ₂為T、L、I、K、S、N或V；X ₃為V、F、Y、L、T、S、I、R或Q；及X ₄為A、S、N、L、T、I或R (SEQ ID NO: 732)。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含： -X ₁-X ₂-X ₃-X ₄- 其中X ₁為S、N、M或T；X ₂為A、T、L或I；X ₃為Q、V、F、Y、T、S或L；且X ₄為A、S、N、L、I或T (SEQ ID NO: 733)。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含： -X ₁-X ₂-X ₃-X ₄- 其中X ₁為S、N、M或T；X ₂為T、L或I；X ₃為V、F、Y、T、S或L；且X ₄為A、S、N、L、I或T (SEQ ID NO: 734)。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含： -X ₁-X ₂-X ₃-X ₄- 其中X ₁為S、M、D、N、G、A、T、R或I；X ₂為T、N、V、A、L、I、S、R或P；X ₃為Y、T、S、I、V、F、L、R、N、D、G或Q；且X ₄為L、A、I、R、S、G、N、T、V、Q、F、E或Y (SEQ ID NO: 760)。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含： -X ₁-X ₂-X ₃-X ₄- 其中X ₁為S、M、D、N、G或A；X ₂為T、N、V或A；X ₃為Y、T、S、I或V；且X ₄為L、A、I、R、S或G (SEQ ID NO: 761)。

在一些實施例中，VR-VIII位點之變異型多肽序列包含或由選自以下之序列組成：NVSY (SEQ ID NO: 303)、SMVN (SEQ ID NO: 304)、ANYG (SEQ ID NO: 305)、NVGT (SEQ ID NO: 306)、SAYM (SEQ ID NO: 307)、EKVT (SEQ ID NO: 308)、TTPG (SEQ ID NO: 309)、GVYS (SEQ ID NO: 310)、SYVG (SEQ ID NO: 311)、LQYN (SEQ ID NO: 312)、DPAK (SEQ ID NO: 313)、THFS (SEQ ID NO: 314)、IGGV (SEQ ID NO: 315)、SSWN (SEQ ID NO: 316)、SVYV (SEQ ID NO: 317)、TLNG (SEQ ID NO: 318)、NTSN (SEQ ID NO: 319)、VQYA (SEQ ID NO: 320)、DQYR (SEQ ID NO: 321)、MPVS (SEQ ID NO: 322)、SAQA (SEQ ID NO: 323)、MTVA (SEQ ID NO: 324)、TVMG (SEQ ID NO: 325)、FSSI (SEQ ID NO: 326)、SLRL (SEQ ID NO: 327)、SAMG (SEQ ID NO: 328)、YIKL (SEQ ID NO: 329)、LMTM (SEQ ID NO: 330)、QVHL (SEQ ID NO: 331)、YNSV (SEQ ID NO: 332)、CVIS (SEQ ID NO: 333)、RLDG (SEQ ID NO: 334)、AIMV (SEQ ID NO: 335)、GTTG (SEQ ID NO: 336)、ASYT (SEQ ID NO: 337)、LHVG (SEQ ID NO: 338)、LQFA (SEQ ID NO: 339)、VRGD (SEQ ID NO: 340)、NVMI (SEQ ID NO: 341)、SLYG (SEQ ID NO: 342)、GTVG (SEQ ID NO: 343)、FNSV (SEQ ID NO: 344)、TRLG (SEQ ID NO: 345)、LKVL (SEQ ID NO: 346)、SIRV (SEQ ID NO: 347)、KIQG (SEQ ID NO: 348)、QILG (SEQ ID NO: 349)、QRDA (SEQ ID NO: 350)、EAVR (SEQ ID NO: 351)、AITV (SEQ ID NO: 352)、KESI (SEQ ID NO: 353)、LMVN (SEQ ID NO: 354)、INLS (SEQ ID NO: 355)、GQVS (SEQ ID NO: 356)、TSLL (SEQ ID NO: 357)、SSTL (SEQ ID NO: 358)、YEKF (SEQ ID NO: 359)、DGKL (SEQ ID NO: 360)、QVYS (SEQ ID NO: 361)、QKEG (SEQ ID NO: 362)、ARDM (SEQ ID NO: 363)、DNFR (SEQ ID NO: 364)、SHGL (SEQ ID NO: 365)、VSVN (SEQ ID NO: 366)、GLKD (SEQ ID NO: 367)、QPVF (SEQ ID NO: 368)、VYSM (SEQ ID NO: 369)、VMAQ (SEQ ID NO: 370)、FVGM (SEQ ID NO: 371)、WSTP (SEQ ID NO: 372)、SYPV (SEQ ID NO: 373)、TTYS (SEQ ID NO: 374)、TVTT (SEQ ID NO: 375)、KDKT (SEQ ID NO: 376)、YREL (SEQ ID NO: 377)、LSHF (SEQ ID NO: 378)、SPGT (SEQ ID NO: 379)、LMGT (SEQ ID NO: 380)、AASL (SEQ ID NO: 381)、FSNN (SEQ ID NO: 382)、QARL (SEQ ID NO: 383)、YHIA (SEQ ID NO: 384)、ARQD (SEQ ID NO: 385)、VAYT (SEQ ID NO: 386)、TPSY (SEQ ID NO: 387)、MILH (SEQ ID NO: 388)、LGNV (SEQ ID NO: 389)、TSIS (SEQ ID NO: 390)、TMVY (SEQ ID NO: 391)、LVVG (SEQ ID NO: 392)、SPLY (SEQ ID NO: 393)、YKSE (SEQ ID NO: 394)、FTRL (SEQ ID NO: 395)、VSYN (SEQ ID NO: 396)、ERTP (SEQ ID NO: 397)、FRSE (SEQ ID NO: 398)、NYTE (SEQ ID NO: 399)、QTIN (SEQ ID NO: 400)及DVHR (SEQ ID NO: 401)。在一些此等實施例中，相對於參考序列SEQ ID NO: 1，蛋白殼蛋白可進一步包含N452K取代(除本文所描述之變異型多肽序列之外)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，VR-VIII位點之變異型多肽序列包含或由選自以下之序列組成：NTVS (SEQ ID NO: 712)、TLFN (SEQ ID NO: 713)、STYL (SEQ ID NO: 714)、SILT (SEQ ID NO: 715)、MTTA (SEQ ID NO: 716)及STSI (SEQ ID NO: 717)。在一些此等實施例中，相對於參考序列SEQ ID NO: 1，蛋白殼蛋白可進一步包含N452K取代(除本文所描述之變異型多肽序列之外)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，VR-VIII位點之變異型多肽序列包含序列STYL (SEQ ID NO: 714)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列STYL (SEQ ID NO: 714)的變異型多肽序列且進一步在VR-IV位點包含N452K取代(相對於參考序列SEQ ID NO: 1)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列STYL (SEQ ID NO: 714)的變異型多肽序列且在VR-IV位不包含N452K取代(相對於參考序列SEQ ID NO: 1)。在一些實施例中，VR-VIII位點之變異型多肽序列包含序列STYL (SEQ ID NO: 714)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列NSTYLG (SEQ ID NO: 721)的變異型多肽序列且進一步在VR-IV位點包含N452K取代(相對於參考序列SEQ ID NO: 1)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列NSTYLG (SEQ ID NO: 721)的變異型多肽序列且在VR-IV位不包含N452K取代(相對於參考序列SEQ ID NO: 1)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，VR-VIII位點之變異型多肽序列包含序列MTTA (SEQ ID NO: 716)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列MTTA (SEQ ID NO: 716)的變異型多肽序列且進一步在VR-IV位點包含N452K取代(相對於參考序列SEQ ID NO: 1)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列MTTA (SEQ ID NO: 716)的變異型多肽序列且在VR-IV位不包含N452K取代(相對於參考序列SEQ ID NO: 1)。在一些實施例中，VR-VIII位點之變異型多肽序列包含序列MMTTAR (SEQ ID NO: 723)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列MMTTAR (SEQ ID NO: 723)的變異型多肽序列且進一步在VR-IV位點包含N452K取代(相對於參考序列SEQ ID NO: 1)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列MMTTAR (SEQ ID NO: 723)的變異型多肽序列且在VR-IV位不包含N452K取代(相對於參考序列SEQ ID NO: 1)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含序列STSI (SEQ ID NO: 717)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列STSI (SEQ ID NO: 717)的變異型多肽序列且進一步在VR-IV位點包含N452K取代(相對於參考序列SEQ ID NO: 1)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列STSI (SEQ ID NO: 717)的變異型多肽序列且在VR-IV位不包含N452K取代(相對於參考序列SEQ ID NO: 1)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含序列NVIS (SEQ ID NO: 745)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列NVIS (SEQ ID NO: 745)的變異型多肽序列且進一步在VR-IV位點包含N452K取代(相對於參考序列SEQ ID NO: 1)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列NVIS (SEQ ID NO: 745)的變異型多肽序列且在VR-IV位不包含N452K取代(相對於參考序列SEQ ID NO: 1)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含序列DNIR (SEQ ID NO: 744)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列DNIR (SEQ ID NO: 744)的變異型多肽序列且進一步在VR-IV位點包含N452K取代(相對於參考序列SEQ ID NO: 1)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列DNIR (SEQ ID NO: 744)的變異型多肽序列且在VR-IV位不包含N452K取代(相對於參考序列SEQ ID NO: 1)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含與SEQ ID NOs: 303-401中之一者具有至少約60%、70%、80%、90%、95%或100%一致性的多肽序列、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含與ANYG (SEQ ID NO: 305)至少約60%、70%、80%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於ANYG (SEQ ID NO: 305)，VR-VIII位點之變異型多肽序列包含由至多1、2或3個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-VIII位點處之變異型多肽序列包含由至多1、2或3個保守胺基酸取代相對ANYG (SEQ ID NO: 305)組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，VR-VIII位點之變異型多肽序列為ANYG (SEQ ID NO: 305)。

在一些實施例中，VR-VIII位點之變異型多肽序列包含與NVSY (SEQ ID NO: 303)至少約60%、70%、80%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於NVSY (SEQ ID NO: 303)，VR-VIII位點之變異型多肽序列包含由至多1、2或3個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-VIII位點處之變異型多肽序列包含由至多1、2或3個保守胺基酸取代相對NVSY (SEQ ID NO: 303)組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，VR-VIII位點之變異型多肽序列為NVSY (SEQ ID NO: 303)。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含與SEQ ID NOs: 712-717中之一者具有至少約60%、70%、80%、90%、95%或100%一致性的多肽序列、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，VR-VIII位點之變異型多肽序列包含與NTVS (SEQ ID NO: 712)至少約60%、70%、80%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於NTVS (SEQ ID NO: 712)，VR-VIII位點之變異型多肽序列包含由至多1、2或3個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-VIII位點處之變異型多肽序列包含由至多1、2或3個保守胺基酸取代相對NTVS (SEQ ID NO: 712)組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，VR-VIII位點之變異型多肽序列為NTVS (SEQ ID NO: 712)。

在一些實施例中，VR-VIII位點之變異型多肽序列包含與TLFN (SEQ ID NO: 713)至少約60%、70%、80%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於TLFN (SEQ ID NO: 713)，VR-VIII位點之變異型多肽序列包含由至多1、2或3個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-VIII位點處之變異型多肽序列包含由至多1、2或3個保守胺基酸取代相對TLFN (SEQ ID NO: 713)組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，VR-VIII位點之變異型多肽序列為TLFN (SEQ ID NO: 713)。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含與STYL (SEQ ID NO: 714)至少約60%、70%、80%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於STYL (SEQ ID NO: 714)，VR-VIII位點之變異型多肽序列包含由至多1、2或3個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-VIII位點處之變異型多肽序列包含由至多1、2或3個保守胺基酸取代相對STYL (SEQ ID NO: 714)。在一些實施例中，VR-VIII位點之變異型多肽序列為STYL (SEQ ID NO: 714)組成的序列、主要由該序列組成或由該序列組成。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含與SILT (SEQ ID NO: 715)至少約60%、70%、80%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於SILT (SEQ ID NO: 715)，VR-VIII位點之變異型多肽序列包含由至多1、2或3個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-VIII位點處之變異型多肽序列包含由至多1、2或3個保守胺基酸取代相對SILT (SEQ ID NO: 715)。在一些實施例中，VR-VIII位點之變異型多肽序列為SILT (SEQ ID NO: 715)組成的序列、主要由該序列組成或由該序列組成。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含與MTTA (SEQ ID NO: 716)至少約60%、70%、80%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於MTTA (SEQ ID NO: 716)，VR-VIII位點之變異型多肽序列包含由至多1、2或3個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-VIII位點處之變異型多肽序列包含由至多1、2或3個保守胺基酸取代相對MTTA (SEQ ID NO: 716)。在一些實施例中，VR-VIII位點之變異型多肽序列為MTTA (SEQ ID NO: 716)組成的序列、主要由該序列組成或由該序列組成。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含與STSI (SEQ ID NO: 717)至少約60%、70%、80%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於STSI (SEQ ID NO: 717)，VR-VIII位點之變異型多肽序列包含由至多1、2或3個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-VIII位點處之變異型多肽序列包含由至多1、2或3個保守胺基酸取代相對STSI (SEQ ID NO: 717)。在一些實施例中，VR-VIII位點之變異型多肽序列為STSI (SEQ ID NO: 717)組成的序列、主要由該序列組成或由該序列組成。

在一些實施例中，蛋白殼蛋白包含與SEQ ID NOs:712-717中之一者具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，蛋白殼蛋白包含與SEQ ID NOs:402-410及464-468中之一者具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。表 1 . 蛋白殼蛋白序列

名稱/ 替代名稱	SEQ ID NO:
CR9-01 / TN1	402
CR9-07	403
CR9-07-A / TN5	482
CR9-07-E / TN6	483
CR9-08	464
CR9-09	465
CR9-10 / TN3	404
CR9-11	466
CR9-13	405
CR9-14 / TN4	406
CR9-15	467
CR9-16	468
CR9-17	407
CR9-20	408
CR9-21	409
CR9-22	410
HV1 / TN7	484
HV2 / TN11	485

在一些實施例中，本發明之蛋白殼蛋白在VR-VIII位點處包含變異型多肽序列。在一些實施例中，整個VR-VIII位點處包含或由胺基酸ATNHQSAQAQAQTG (SEQ ID NO: 5)組成，其中胺基酸QSAQAQ (SEQ ID NO: 756)由下式之肽取代： -(X) _n - 其中 n為4至8，且X表示20個標準胺基酸(SEQ ID NO: 481)中之任一者。

在一些實施例中，VR-VIII位點之變異型多肽序列為或包含： -X ₁-X ₂-X ₃-X ₄- X ₅-X ₆- (SEQ ID NO: 481)

在一些實施例中，VR-VIII位點之變異型多肽序列為或包含： -X ₁-X ₂-X ₃-X ₄- X ₅-X ₆其中X ₁為N、M、C、E、G、S、V、A、T、H、L或Q；X ₂為M、D、N、G、A、T、R、I或S；X ₃為T、N、V、L、I、S、R、P或A；X ₄為Y、T、S、I、V、F、L、R、N、D、G或Q；X ₅為L、I、R、S、G、N、T、V、Q、F、E、Y或A且X ₆為G、R、S、I、H、N、Y、L、M或Q (SEQ ID NO: 762)。

在一些實施例中，VR-VIII位點之變異型多肽序列為或包含： -X ₁-X ₂-X ₃-X ₄- X ₅-X ₆-X ₇- 其中X ₁為R或H；X ₂為N、M、C、E、G、S、V、A、T、H、L或Q；X ₃為M、D、N、G、A、T、R、I或S；X ₄為T、N、V、L、I、S、R、P或A；X ₅為Y、T、S、I、V、F、L、R、N、D、G或Q；X ₆為L、I、R、S、G、N、T、V、Q、F、E、Y或A及X ₇為G、R、S、I、H、N、Y、L、M或Q (SEQ ID NO: 781)。

在一些實施例中，VR-VIII位點之變異型多肽序列為或包含： -X ₁-X ₂-X ₃-X ₄- X ₅-X ₆其中X ₁為N、M、C、E、G、S、V、A、T、H或L；X ₂為M、D、N、G、A、T、R或I；X ₃為T、N、V、L、I、S、R或P；X ₄為Y、T、S、I、V、F、L、R、N、D或G；X ₅為L、I、R、S、G、N、T、V、Q、F、E或Y且X ₆為G、R、S、I、H、N、Y、L或M (SEQ ID NO: 763)。

在一些實施例中，VR-VIII位點之變異型多肽序列為或包含： -X ₁-X ₂-X ₃-X ₄- X ₅-X ₆其中X ₁為Q、E、N、G、M、C、V或T；X ₂為S、N、T、M、G或D；X ₃為A、T、L、I、K、S、N或V；X ₄為Q、V、F、Y、L、T、S、I或R；X ₅為A、S、N、L、T、I或R且X ₆為Q、I、S、G、H或R (SEQ ID NO: 735)。

在一些實施例中，VR-VIII位點之變異型多肽序列為或包含： -X ₁-X ₂-X ₃-X ₄- X ₅-X ₆其中X ₁為Q、E、N、G、M、C、V或T；X ₂為S、N、T、M、G或D；X ₃為T、L、I、K、S、N或V；X ₄為V、F、Y、L、T、S、I、R或Q；X ₅為A、S、N、L、T、I或R且X ₆為I、S、G、H或R(SEQ ID NO: 736)。

在一些實施例中，VR-VIII位點之變異型多肽序列為或包含： -X ₁-X ₂-X ₃-X ₄- X ₅-X ₆其中X ₁為Q、E、N、M、C或G；X ₂為S、N、M或T；X ₃為A、T、L或I；X ₄為Q、V、F、Y、T、S或L；X ₅為A、S、N、L、I或T；且X ₆為I、S、G、R或H (SEQ ID NO: 737)。

在一些實施例中，VR-VIII位點之變異型多肽序列為或包含： -X ₁-X ₂-X ₃-X ₄- X ₅-X ₆其中X ₁為E、N、M、C或G；X ₂為S、N、M或T；X ₃為T、L或I；X ₄為V、F、Y、T、S或L；X ₅為A、S、N、L、I或T；且X ₆為I、S、G、R或H (SEQ ID NO: 738)。

在一些實施例中，VR-VIII位點之變異型多肽序列為或包含： -X ₁-X ₂-X ₃-X ₄-X ₅-X ₆其中X ₁為Q、E、N、G、M或C；X ₂為S、N、T或M；X ₃為A、T、L、I或S；X ₄為Q、V、F、Y、L或I；X ₅為A、S、N、L、T或I；且X ₆為I、S、Q、G、H或R (SEQ ID NO: 718)。

在一些實施例中，VR-VIII位點之變異型多肽序列為或包含： -X ₁-X ₂-X ₃-X ₄- X ₅-X ₆其中X ₁為E、N、G、M、C、V或T；X ₂為N、T、M、G或D；X ₃為T、L、I、K、S、N或V；X ₄為V、F、Y、L、T、S、I、R；X ₅為S、N、L、T、I或R且X ₆為I、S、G、H或R (SEQ ID NO: 764)。

在一些實施例中，VR-VIII位點之變異型多肽序列為或包含： -X ₁-X ₂-X ₃-X ₄-X ₅-X ₆其中X ₁為E、N、M、C或Q；X ₂為A、M、G、D、N或S；X ₃為T、N、V或A；X ₄為V、Y、T、S、I或Q；X ₅為S、G、L、I、R或A；且X ₆為I、S、G、R或Q (SEQ ID NO: 765)。

在一些實施例中，VR-VIII位點之變異型多肽序列為或包含： -X ₁-X ₂-X ₃-X ₄-X ₅-X ₆其中X ₁為E、N、M或C；X ₂為A、M、G、D或N；X ₃為T、N或V；X ₄為V、Y、T、S或I；X ₅為S、G、L、I或R；且X ₆為I、S、G或R (SEQ ID NO: 766)。

在一些實施例中，本發明之蛋白殼蛋白在VR-VIII位點處包含變異型多肽序列。在一些實施例中，整個VR-VIII位點處包含下式之肽： ATNH-(X) _n -AQTG 其中 n為4至8，且X表示20個標準胺基酸(SEQ ID NO: 740)中之任一者。

在一些實施例中，整個VR-VIII位點處包含下式之肽： ATNH-X ₁-X ₂-X ₃-X ₄-X ₅-X ₆-AQTG (SEQ ID NO: 740)。

在一些實施例中，X ₁-X ₂-X ₃-X ₄-X ₅-X ₆如上文所描述。舉例而言，在一些實施例中，X ₁為Q、E、N、G、M、C、V或T；X ₂為S、N、T、M、G或D；X ₃為A、T、L、I、K、S、N或V；X ₄為Q、V、F、Y、L、T、S、I、R或Q；X ₅為A、S、N、L、T、I或R且X ₆為Q、I、S、G、H或R (SEQ ID NO: 728)。在一些實施例中，X ₁為Q、E、N、G、M或C；X ₂為S、N、T或M；X ₃為A、T、L、I或S；X ₄為Q、V、F、Y、L或I；X ₅為A、S、N、L、T或I；且X ₆為I、S、Q、G、H或R (SEQ ID NO: 739)。

在此等實施例中之一些中，蛋白殼蛋白在位置452處相對於參考序列SEQ ID NO: 1包含N或K(除了本文所描述之變異型多肽序列以外)。

在一些此等實施例中，相對於參考序列SEQ ID NO: 1，蛋白殼蛋白可進一步包含N452K取代(除本文所描述之變異型多肽序列之外)。

在一些實施例中，VR-VIII位點之變異型多肽序列包含或由選自以下之序列組成：ENTVSI (SEQ ID NO: 719)、QTLFNS (SEQ ID NO: 720)、NSTYLG (SEQ ID NO: 721)、GSILTH (SEQ ID NO: 722)、MMTTAR (SEQ ID NO: 723)及CSTSIR (SEQ ID NO: 724)。在一些此等實施例中，相對於參考序列SEQ ID NO: 1，蛋白殼蛋白可進一步包含N452K取代(除變異型多肽序列之外)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，VR-VIII位點之變異型多肽序列包含或由選自以下之序列組成：NSTYLG (SEQ ID NO: 721)、MMTTAR (SEQ ID NO: 723)、CSTSIR (SEQ ID NO: 724)、EDNIRS (SEQ ID NO: 725)、NNVISG (SEQ ID NO: 752)、QGAYAQ (SEQ ID NO: 749)、VSSFTS (SEQ ID NO: 751)、TGTSII (SEQ ID NO: 753)及QHYSAQAQ (SEQ ID NO: 759)。在一些此等實施例中，相對於參考序列SEQ ID NO: 1，蛋白殼蛋白可進一步包含N452K取代(除本文所描述之變異型多肽序列之外)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，VR-VIII位點之變異型多肽序列包含或由選自以下之序列組成：NSTYLG (SEQ ID NO: 721)、MMTTAR (SEQ ID NO: 723)、CSTSIR (SEQ ID NO: 724)、EDNIRS (SEQ ID NO: 725)及NNVISG (SEQ ID NO: 752)。在一些此等實施例中，相對於參考序列SEQ ID NO: 1，蛋白殼蛋白可進一步包含N452K取代(除本文所描述之變異型多肽序列之外)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含序列NSTYLG (SEQ ID NO: 721)。在一些實施例中，VR-VIII位點之變異型多肽序列包含與NSTYLG (SEQ ID NO: 721)至少約60%、70%、80%、83%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列NSTYLG (SEQ ID NO: 721)的變異型多肽序列且進一步在VR-IV位點包含N452K取代(相對於參考序列SEQ ID NO: 1)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列NSTYLG (SEQ ID NO: 721)的變異型多肽序列且在VR-IV位不包含N452K取代(相對於參考序列SEQ ID NO: 1)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含序列MMTTAR (SEQ ID NO: 723)。在一些實施例中，VR-VIII位點之變異型多肽序列包含與MMTTAR (SEQ ID NO: 723)至少約60%、70%、80%、83%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列MMTTAR (SEQ ID NO: 723)的變異型多肽序列且進一步在VR-IV位點包含N452K取代(相對於參考序列SEQ ID NO: 1)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列MMTTAR (SEQ ID NO: 723)的變異型多肽序列且在VR-IV位不包含N452K取代(相對於參考序列SEQ ID NO: 1)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含序列CSTSIR (SEQ ID NO: 724)。在一些實施例中，VR-VIII位點之變異型多肽序列包含與CSTSIR (SEQ ID NO: 724)至少約60%、70%、80%、83%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列CSTSIR (SEQ ID NO: 724)的變異型多肽序列且進一步在VR-IV位點包含N452K取代(相對於參考序列SEQ ID NO: 1)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列CSTSIR (SEQ ID NO: 724)的變異型多肽序列且在VR-IV位不包含N452K取代(相對於參考序列SEQ ID NO: 1)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含序列NNVISG (SEQ ID NO: 752)。在一些實施例中，VR-VIII位點之變異型多肽序列包含與NNVISG (SEQ ID NO: 752)至少約60%、70%、80%、83%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列NNVISG (SEQ ID NO: 752)的變異型多肽序列且進一步在VR-IV位點包含N452K取代(相對於參考序列SEQ ID NO: 1)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列NNVISG (SEQ ID NO: 752)的變異型多肽序列且在VR-IV位不包含N452K取代(相對於參考序列SEQ ID NO: 1)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含序列EDNIRS (SEQ ID NO: 725)。在一些實施例中，VR-VIII位點之變異型多肽序列包含與EDNIRS (SEQ ID NO: 725)至少約60%、70%、80%、83%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列EDNIRS (SEQ ID NO: 725)的變異型多肽序列且進一步在VR-IV位點包含N452K取代(相對於參考序列SEQ ID NO: 1)。在一些實施例中，本文所描述之蛋白殼在VR-VIII位點處包含含有序列EDNIRS (SEQ ID NO: 725)的變異型多肽序列且在VR-IV位不包含N452K取代(相對於參考序列SEQ ID NO: 1)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含與SEQ ID NOs: 719-724中之一者具有至少約60%、70%、80%、90%、95%或100%一致性的多肽序列、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，VR-VIII位點之變異型多肽序列包含與ENTVSI (SEQ ID NO: 719)至少約60%、70%、80%、83%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於ENTVSI (SEQ ID NO: 719)，VR-VIII位點之變異型多肽序列包含由至多1、2或3個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-VIII位點處之變異型多肽序列包含由至多1、2或3個保守胺基酸取代相對ENTVSI (SEQ ID NO: 719)組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，VR-VIII位點之變異型多肽序列為NTVS ENTVSI (SEQ ID NO: 719)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，VR-VIII位點之變異型多肽序列包含與QTLFNS (SEQ ID NO: 720)至少約60%、70%、80%、83%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於QTLFNS (SEQ ID NO: 720)，VR-VIII位點之變異型多肽序列包含由至多1、2或3個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-VIII位點處之變異型多肽序列包含由至多1、2或3個保守胺基酸取代相對QTLFNS (SEQ ID NO: 720)組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，VR-VIII位點之變異型多肽序列為QTLFNS (SEQ ID NO: 720)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，VR-VIII位點之變異型多肽序列包含與NSTYLG (SEQ ID NO: 721)至少約60%、70%、80%、83%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於NSTYLG (SEQ ID NO: 721)，VR-VIII位點之變異型多肽序列包含由至多1、2或3個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-VIII位點處之變異型多肽序列包含由至多1、2或3個保守胺基酸取代相對NSTYLG (SEQ ID NO: 721)組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，VR-VIII位點之變異型多肽序列為NSTYLG (SEQ ID NO: 721)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，VR-VIII位點之變異型多肽序列包含與GSILTH (SEQ ID NO: 722)至少約60%、70%、80%、83%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於GSILTH (SEQ ID NO: 722)，VR-VIII位點之變異型多肽序列包含由至多1、2或3個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-VIII位點處之變異型多肽序列包含由至多1、2或3個保守胺基酸取代相對GSILTH (SEQ ID NO: 722)組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，VR-VIII位點之變異型多肽序列為GSILTH (SEQ ID NO: 722)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，VR-VIII位點之變異型多肽序列包含與MMTTAR (SEQ ID NO: 723)至少約60%、70%、80%、83%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於MMTTAR (SEQ ID NO: 723)，VR-VIII位點之變異型多肽序列包含由至多1、2或3個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-VIII位點處之變異型多肽序列包含由至多1、2或3個保守胺基酸取代相對MMTTAR (SEQ ID NO: 723)組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，VR-VIII位點之變異型多肽序列為MMTTAR (SEQ ID NO: 723)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，VR-VIII位點之變異型多肽序列包含與CSTSIR (SEQ ID NO: 724)至少約60%、70%、80%、83%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於CSTSIR (SEQ ID NO: 724)，VR-VIII位點之變異型多肽序列包含由至多1、2或3個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-VIII位點處之變異型多肽序列包含由至多1、2或3個保守胺基酸取代相對CSTSIR (SEQ ID NO: 724)組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，VR-VIII位點之變異型多肽序列為CSTSIR (SEQ ID NO: 724)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，VR-VIII位點之變異型多肽序列包含與QGAYAQ (SEQ ID NO: 749)至少約60%、70%、80%、83%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於QGAYAQ (SEQ ID NO: 749)，VR-VIII位點之變異型多肽序列包含由至多1、2或3個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-VIII位點處之變異型多肽序列包含由至多1、2或3個保守胺基酸取代相對QGAYAQ (SEQ ID NO: 749)。在一些實施例中，VR-VIII位點之變異型多肽序列為QGAYAQ (SEQ ID NO: 749)組成的序列、主要由該序列組成或由該序列組成。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，VR-VIII位點之變異型多肽序列包含與QANYGQ (SEQ ID NO: 754)至少約60%、70%、80%、83%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於QANYGQ (SEQ ID NO: 754)，VR-VIII位點之變異型多肽序列包含由至多1、2或3個胺基酸取代組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，在VR-VIII位點處之變異型多肽序列包含由至多1、2或3個保守胺基酸取代相對QANYGQ (SEQ ID NO: 754)組成的序列、主要由該序列組成或由該序列組成。在一些實施例中，VR-VIII位點之變異型多肽序列為QANYGQ (SEQ ID NO: 754)。在此等實施例中之一些中，蛋白殼蛋白包含與SEQ ID NO:487之VP3具有至少85%、90%、95%、98%、99%或100%一致性的序列，除VR-VIII位點及視情況本文所描述之位置452處的特異性取代之外。

在一些實施例中，蛋白殼蛋白包含與SEQ ID NOs:719-724中之一者具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，相對於參考序列SEQ ID NO: 1，VR-VIII位點之變異型多肽序列在位置584包含胺基酸R或H。在一些實施例中，VR-VIII位點之變異型多肽序列包含在位置584處之R。

在一些實施例中，相對於參考序列SEQ ID NO: 1，VR-VIII位點之變異型多肽序列包含A587T取代(亦即，位置587之T)。

在一些實施例中，在VR-VIII位點處之變異型多肽序列相對於參考序列SEQ ID NO: 1包含在選自由以下組成之群的一個、兩個、三個或更多個位置處的胺基酸N或R：584、585、586、588、589及590 (或在587位置-3至+3位置內之胺基酸N或R)。在一些實施例中，在VR-VIII位點處之變異型多肽序列相對於參考序列SEQ ID NO: 1包含在選自由以下組成之群的兩個、三個或更多個位置處的胺基酸N或R：584、585、586、588、589及590 (或在587位置-3至+3位置內之胺基酸N或R)。

在一些實施例中，相對於參考序列SEQ ID NO: 1，VR-VIII位點之變異型多肽序列包含A587T取代(亦即，位置587之T)，且在選自由584、585、586、588、589及590組成之群的一個、兩個、三個或更多個位置包含胺基酸N或R (或在相對於位置587之-3至+3位置內存在胺基酸N或R)。

在一些實施例中，相對於參考序列SEQ ID NO: 1，VR-VIII位點之變異型多肽序列包含在選自由585、586、587、588、589及590組成之群的兩個、三個或更多個位置包含胺基酸S (或在區域585-590中之位置處的兩個或更多個胺基酸S)。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含在區域585-590中之三個、四個或更多個位置處相對於參考序列SEQ ID NO: 1之一個、兩個或更多個選自由以下組成之群的胺基酸(呈任何組合)：N、S、T、R及I。在一些實施例中，在VR-VIII位點處之變異型多肽序列包含在區域585-590中之三個、四個或更多個位置處相對於參考序列SEQ ID NO: 1之一個、兩個或更多個選自由以下組成之群的胺基酸(呈任何組合)：N、S、T及R。

在一些實施例中，在VR-VIII位點處之變異型多肽序列包含在區域585-590中之三個、四個或更多個位置處(亦即，位置585、586、587、588、589及/或590)相對於參考序列SEQ ID NO: 1之任何一或多個選自由以下組成之群的胺基酸(例如任何2、3、4或更多個，呈任何組合)：N、S、T、R及I。在一些實施例中，在VR-VIII位點處之變異型多肽序列包含在區域585-590中之三個、四個或更多個位置處(亦即，位置585、586、587、588、589及/或590)相對於參考序列SEQ ID NO: 1之任何一或多個選自由以下組成之群的胺基酸(例如任何2、3、4或更多個，呈任何組合)：N、S、T及R。舉例而言且不受限制，在區域585-590中，可存在三個或更多個N、三個或更多個S、三個或更多個T等，或N、S及T中之所有三者，或一個所提及胺基酸(例如N)存在兩個或三個，及任何其他所提及之胺基酸(例如T)存在一或多個，或此等胺基酸(亦即，N、S、T、R及I中之所有五者)中之每一者存在一個，諸如此類，以及任何組合。

在一些實施例中，蛋白殼蛋白可相對於參考序列SEQ ID NO: 1包含之N452K取代(本身或除具有本文所描述之一或多個取代的變異型多肽之外，諸如在本文所描述之VR-VIII位點處之任何取代或取代模式)。

在一些實施例中，相對於參考序列SEQ ID NO: 1，蛋白殼蛋白包含N452K取代(且視情況在除452之外的位置包含與SEQ ID NO: 487之VP3及/或SEQ ID NO: 1之VP1 80%、85%、90%、95%、98%、99%或100%一致性)。

在一些實施例中，SEQ ID NO: 1之變異型VP1蛋白殼蛋白在下表所示之AAV9 VP1之VR-VIII位的位置581-594或585-590及/或位置452包含取代模式之一。在一些實施例中，SEQ ID NO: 1之變異體VP1蛋白殼蛋白包含與以下表中呈現之序列具有至少約75%、78.5%、80%、85%、90%、93%或100%序列一致性、在AAV9 VP1之VR-VIII位位置581-594處的取代模式。

位置452	VR-VIII 比對(581-594)	SEQ ID NO
N或K	ATNH ENTVSIAQTG	618
N或K	ATNH QTLFNSAQTG	684
N或K	ATNH NSTYLGAQTG	642
N或K	ATNH GSILTHAQTG	630
N或K	ATNH MMTTARAQTG	615
N或K	ATNH CSTSIRAQTG	692
N或K	ATNH QGAYAQAQTG	616
N或K	ATNH NTKLAIAQTG	668
N或K	ATNH VSSFTSAQTG	619
N或K	ATNH EDNIRSAQTG	726
K	ATNH QSAQAQAQTG	5
N或K	ATNH NNVISGAQTG	608
N或K	ATNH TGTSIIAQTG	603
N或K	ATNH QWMSAQAQAQTG	657
N或K	ATNH QDARAQAQTG	675
N或K	ATNH QHYSAQAQAQTG	622
N或K	ATNH QSAQAQAQTG	5
N或K	ATNH NIRTEMAQTG	683
N或K	ATNH STTNFRAQTG	621

位置585	位置586	位置587	位置588	位置589	位置590	位置452
Q585E	S586N	A587T	Q588V	A589S	Q590I	N或N452K
Q	S586T	A587L	Q588F	A589N	Q590S	N或N452K
Q585N	S	A587T	Q588Y	A589L	Q590G	N或N452K
Q585G	S	A587I	Q588L	A589T	Q590H	N或N452K
Q585E	S586N	A587T	Q588V	A589S	Q590I	N或N452K
Q	S586T	A587L	Q588F	A589N	Q590S	N或N452K
Q585N	S	A587T	Q588Y	A589L	Q590G	N或N452K
Q585G	S	A587I	Q588L	A589T	Q590H	N或N452K
Q585M	S586M	A587T	Q588T	A	Q590R	N或N452K
Q585C	S	A587T	Q588S	A589I	Q590R	N或N452K
Q	S586G	A	Q588Y	A	Q	N或N452K
Q585N	S586T	A587K	Q588L	A	Q590I	N或N452K
Q585V	S	A587S	Q588F	A589T	Q590S	N或N452K
Q585E	S586D	A587N	Q588I	A589R	Q590S	N或N452K
Q	S	A	Q	A	Q	N或N452K
Q585N	S586N	A587V	Q588I	A589S	Q590G	N或N452K
Q585T	S586G	A587T	Q588S	A589I	Q590I	N或N452K
Q	S586D	A	Q588R	A	Q	N或N452K
Q585N	S586I	A587R	Q588T	A589E	Q590M	N或N452K
Q585S	S586T	A587T	Q588N	A589F	Q590R	N或N452K
Q	S	A	Q	A	Q	N或N452K

在一些實施例中，上表中的蛋白殼具有：(i)分別位於位置581、582、583及584的ATNH，及/或(ii)分別位於位置591、592、593及594的AQTG。

在一些實施例中，SEQ ID NO: 1之變異型VP1蛋白殼蛋白在VR-VIII位的位置581-594或585-590包含以下胺基酸之一：

581	582	583	584	585	586	587	588	589	590	591	592	593	594
A	T	N	H	E、N、G、M、C、V、T、Q、 S	N、T、M、G、D、S、 I	T、L、I、K、S、N、V、A、 R	V、F、Y、L、T、S、I、R、Q、 N	S、N、L、 T、 I、R、A、 E、 F	I、S、G、H、R、Q、 M	A	Q	T	G

位置452	VR-VIII 比對(581-594)	SEQ ID NO
N或K	ATNH NSTYLGAQTG	642
N或K	ATNH MMTTARAQTG	615
N或K	ATNH CSTSIRAQTG	692
N或K	ATNH QGAYAQAQTG	616
N或K	ATNH VSSFTSAQTG	619
N或K	ATNH EDNIRSAQTG	726
N或K	ATNH NNVISGAQTG	608
N或K	ATNH TGTSIIAQTG	603
N或K	ATNH QHYSAQAQAQTG	622

位置585	位置586	位置587	位置588	位置589	位置590	位置452
Q585N	S	A587T	Q588Y	A589L	Q590G	N或N452K
Q585M	S586M	A587T	Q588T	A	Q590R	N或N452K
Q585C	S	A587T	Q588S	A589I	Q590R	N或N452K
Q	S586G	A	Q588Y	A	Q	N或N452K
Q585V	S	A587S	Q588F	A589T	Q590S	N或N452K
Q585E	S586D	A587N	Q588I	A589R	Q590S	N或N452K
Q585N	S586N	A587V	Q588I	A589S	Q590G	N或N452K
Q585T	S586G	A587T	Q588S	A589I	Q590I	N或N452K

581	582	583	584	585	586	587	588	589	590	591	592	593	594
A	T	N	H	E、N、M、C、V、T、Q	N、M、G、D、S	T、S、N、V、A	F、Y、T、S、I，	S、L、T、I、R、A	I、S、G、R、Q	A	Q	T	G

在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其包含：其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585E、S586N、A587T、Q588V、A589S、Q590I及N452K。

在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代S586T、A587L、Q588F、A589N、Q590S及N452K。

在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585N、A587T、Q588Y、A589L、Q590G及N452K。

在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585N、A587T、Q588Y、A589L及Q590G。

在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585G、A587I、Q588L、A589T、Q590H及N452K。

在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585M、S586M、A587T、Q588T、A589A及Q590R。

在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585C、A587T、Q588S、A589I及Q590R。

在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 488之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 499之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 504之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 505之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 506之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 510之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 512之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 513之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 516之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 518之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 521之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 522之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 533之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 536之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 539之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 558之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 562之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 566之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 571之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 576之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 578之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 579之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 580之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 581之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 585之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 588之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 589之胺基酸序列。

在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 705之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 706之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 707之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 708之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 710之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 767之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 768之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 769之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 770之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 771之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 772之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 773之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 774之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 775之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 776之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 777之胺基酸序列。在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白包含SEQ ID NO: 778之胺基酸序列。

在一些實施例中，蛋白殼蛋白包含與SEQ ID NOs: 488、499、504、505、506、510、512、513、516、518、521、522、533、536、539、558、562、566、571、576、578、579、580、581、585、588、589、705、706、707、708、710、772及774中之一者具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，蛋白殼蛋白包含與SEQ ID NOs: 767、768、769、770、771、772、773、774、775、776、777、778中之一者具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。在一些實施例中，蛋白殼蛋白包含與SEQ ID NOs: 705-708中之一者具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，蛋白殼蛋白包含與SEQ ID NO: 705具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，蛋白殼蛋白包含與SEQ ID NO: 706具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，蛋白殼蛋白包含與SEQ ID NO: 707具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，蛋白殼蛋白包含與SEQ ID NO: 708具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，蛋白殼蛋白包含與SEQ ID NO: 710具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，蛋白殼蛋白包含與SEQ ID NO: 772具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，蛋白殼蛋白包含與SEQ ID NO: 774具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，蛋白殼蛋白包含與SEQ ID NO: 488具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，蛋白殼蛋白包含與SEQ ID NO: 512具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，蛋白殼蛋白包含與SEQ ID NO: 513具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，蛋白殼蛋白包含與SEQ ID NO: 539具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，蛋白殼蛋白包含與SEQ ID NO: 589具有至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。

在一些實施例中，蛋白殼蛋白包含在胺基酸位置581-594處相對於參考序列SEQ ID NO:1之SEQ ID NOs: 618、684、642、630、615、692、616、668、726、608、603、657、675及622中之任一者的胺基酸序列，及視情況其中該蛋白殼蛋白進一步包含N452K之胺基酸取代。在一些實施例中，相對於參考序列SEQ ID NO: 1，蛋白殼蛋白在胺基酸位置581-594包含胺基酸序列SEQ ID NO: 618，且視情況其中蛋白殼蛋白進一步包含胺基酸取代N452K。在一些實施例中，相對於參考序列SEQ ID NO: 1，蛋白殼蛋白在胺基酸位置581-594包含胺基酸序列SEQ ID NO: 684，且視情況其中蛋白殼蛋白進一步包含胺基酸取代N452K。在一些實施例中，相對於參考序列SEQ ID NO: 1，蛋白殼蛋白在胺基酸位置581-594包含胺基酸序列SEQ ID NO: 642，且視情況其中蛋白殼蛋白進一步包含胺基酸取代N452K。在一些實施例中，相對於參考序列SEQ ID NO: 1，蛋白殼蛋白在胺基酸位置581-594包含胺基酸序列SEQ ID NO: 630，且視情況其中蛋白殼蛋白進一步包含胺基酸取代N452K。

在一些實施例中，蛋白殼蛋白包含在胺基酸位置581-594處相對於參考序列SEQ ID NO:1之SEQ ID NOs: 598、602、607、608、609、613、615、616、618、619、621、624、625、630、636、639,642、661、665、669、674、679、681、682、683、684、688、691、692及726中之任一者的胺基酸序列。在此等實施例中之一些中，蛋白殼在胺基酸位置452處包含相對於參考序列SEQ ID NO:1的胺基酸N或K。在一些實施例中，蛋白殼蛋白包含胺基酸取代N452K。

在一些實施例中，蛋白殼蛋白包含在胺基酸位置581-594處相對於參考序列SEQ ID NO:1之SEQ ID NOs: 598、608、615、616、618、642、692及726中之任一者的胺基酸序列。在此等實施例中之一些中，蛋白殼在胺基酸位置452處包含相對於參考序列SEQ ID NO:1的胺基酸N或K。在一些實施例中，蛋白殼蛋白包含胺基酸取代N452K。

在一些實施例中，本發明之蛋白殼蛋白包含在VR-VIII位點處之變異型多肽序列，其中該VR-VIII位(例如，整個VR-VIII位)包含與以下序列中之一者具有至少約60%、65%、70%、71%、74%、75%、78%、78.5%、79%、80%、83%、85%、86%、90%、92%、93%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成(例如，相對於以下序列中之任一者具有至多1、2或3個胺基酸取代)：

VR-VIII 比對(581-594)	SEQ ID NO
ATNH ENTVSIAQTG	618
ATNH QTLFNSAQTG	684
ATNH NSTYLGAQTG	642
ATNH GSILTHAQTG	630
ATNH MMTTARAQTG	615
ATNH CSTSIRAQTG	692
ATNH QGAYAQAQTG	616
ATNH NTKLAIAQTG	668
ATNH VSSFTSAQTG	619
ATNH EDNIRSAQTG	726
ATNH QSAQAQAQTG	5
ATNH NNVISGAQTG	608
ATNH TGTSIIAQTG	603
ATNH QWMSAQAQAQTG	657
ATNH QDARAQAQTG	675
ATNH QHYSAQAQAQTG	622
ATNH QSAQAQAQTG	5
ATNH NIRTEMAQTG	683
ATNH STTNFRAQTG	621
ATNHQ ANYGQAQTG	598
ATNH NMNRVNAQTG	607
ATNH SNSVQSAQTG	609
ATNH SSTFQGAQTG	613
ATNH STTNFRAQTG	621
ATNH SSIFNSAQTG	624
ATNH AGNYNNAQTG	625
ATNH TSVISIAQTG	636
ATNH HSRVEIAQTG	639
ATNH SSIIYSAQTG	661
ATNH SGRDSYAQTG	665
ATNH SSSYNNAQTG	669
ATNH HNPSINAQTG	674
ATNH NRNGLLAQTG	681
ATNH ESTSVRAQTG	682
ATNH LSVSSIAQTG	688
ATNH EDIIRSAQTG	691
ATN RQ TAQAQAQTG	602
ATN RQ IAQAQAQTG	679

在一些實施例中，本發明之蛋白殼蛋白包含VR-VIII位點之變異型多肽序列，其中整個VR-VIII位點處包含胺基酸ATNHQSAQAQAQTG (SEQ ID NO: 5)，且其中在此位點中存在一個、兩個或更多個胺基酸的插入。在一些實施例中，插入位於序列QSAQAQ (SEQ ID NO: 756)之變異型多肽內、SEQ ID NO: 5內。在一些實施例中，插入介於SEQ ID NO: 5之胺基酸ATNHQ與胺基酸SAQAQAQTG之間。換言之，在一些實施例中，相對於參考序列SEQ ID NO: 1，VR-VIII位點之插入介於位置585與位置586之間。在一些實施例中，插入係胺基酸WM的插入(例如，相對於參考序列SEQ ID NO: 1，介於位置585與586之間)。在一些實施例中，插入係胺基酸HY的插入(例如相對於參考序列SEQ ID NO: 1，介於位置585與586之間)。在一些此等實施例中，相對於參考序列SEQ ID NO: 1，蛋白殼蛋白可進一步包含N452K取代(除本文所描述之VR-VIII位的變異型多肽之外)。 AAV5/AAV9 嵌合蛋白殼

本發明亦提供重組腺相關病毒(rAAV)蛋白殼蛋白，其包含與SEQ ID NO: 463具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%一致性的序列。(在SEQ ID NO: 463中，標識為「X」的胺基酸殘基自序列一致性計算排除在外)。在一些實施例中，蛋白殼蛋白係AAV5/AAV9嵌合蛋白殼蛋白。在一些實施例中，AAV5/AAV9嵌合蛋白殼蛋白序列與AAV9蛋白殼蛋白序列(SEQ ID NO: 1)大於約50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或99.5%一致。在一些實施例中，AAV5/AAV9嵌合蛋白殼蛋白序列的C端500個殘基與AAV9蛋白殼蛋白序列(SEQ ID NO: 1)之C端500個殘基至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致。在一些實施例中，與AAV9蛋白殼蛋白序列(SEQ ID NO: 1)之Q688等效之位置的殘基係嵌合蛋白殼蛋白中的離胺酸(K)。

在一些實施例中，嵌合蛋白殼蛋白包含衍生自AAV5蛋白殼蛋白的至少1、2、3、4、5個或更多個多肽區段。在一些實施例中，嵌合蛋白殼蛋白包含衍生自AAV9蛋白殼蛋白的至少1、2、3、4、5個或更多個多肽區段。在一些實施例中，至少一個多肽區段衍生自AAV5蛋白殼蛋白且至少一個多肽區段衍生自AAV9蛋白殼蛋白。

在一些實施例中，嵌合蛋白殼蛋白之N端的前250個殘基包含一或多個AAV5蛋白殼衍生多肽區段。在一些實施例中，嵌合蛋白殼蛋白之N端的前225個殘基包含一或多個AAV5蛋白殼衍生多肽區段。在一些實施例中，嵌合蛋白殼蛋白之N端的前200個殘基包含一或多個AAV5蛋白殼衍生多肽區段。在一些實施例中，嵌合蛋白殼蛋白之N端的前150個殘基包含一或多個AAV5蛋白殼衍生多肽區段。在一些實施例中，嵌合蛋白殼蛋白之N端的前100個殘基包含一或多個AAV5蛋白殼衍生多肽區段。在一些實施例中，嵌合蛋白殼蛋白之N端的前50個殘基包含一或多個AAV5蛋白殼衍生多肽區段。在一些實施例中，一或多個AAV5蛋白殼衍生多肽區段中之每一者與相應AAV5蛋白殼序列具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%序列一致性。

在一些實施例中，嵌合蛋白殼蛋白之殘基50-250包含一或多個AAV5蛋白殼衍生多肽區段。在一些實施例中，嵌合蛋白殼蛋白之殘基50-200包含一或多個AAV5蛋白殼衍生多肽區段。在一些實施例中，嵌合蛋白殼蛋白之殘基50-150包含一或多個AAV5蛋白殼衍生多肽區段。在一些實施例中，嵌合蛋白殼蛋白之殘基100-250包含一或多個AAV5蛋白殼衍生多肽區段。在一些實施例中，嵌合蛋白殼蛋白之殘基100-200包含一或多個AAV5蛋白殼衍生多肽區段。在一些實施例中，嵌合蛋白殼蛋白之殘基150-250包含一或多個AAV5蛋白殼衍生多肽區段。在一些實施例中，一或多個AAV5蛋白殼衍生多肽區段中之每一者與相應AAV5蛋白殼序列具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%序列一致性。

在一些實施例中，嵌合蛋白殼蛋白之C端的最後100個殘基包含一或多個AAV5蛋白殼衍生之多肽區段。在一些實施例中，嵌合蛋白殼蛋白之C端的最後50個殘基包含一或多個AAV5蛋白殼衍生之多肽區段。在一些實施例中，一或多個AAV5蛋白殼衍生多肽區段中之每一者與相應AAV5蛋白殼序列具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%序列一致性。在一些實施例中，嵌合蛋白殼蛋白在嵌合蛋白殼蛋白之N端處或附近包含一或多個AAV5蛋白殼衍生多肽區段，如上文所描述，且在嵌合蛋白殼蛋白之C端處或附近包含一或多個AAV5蛋白殼衍生多肽區段，如本段落中所述。

在一些實施例中，嵌合蛋白殼蛋白包含按N端到C端之順序：具有與SEQ ID NO: 411具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性或與SEQ ID NO: 412具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5 %或100%一致性之序列的第一多肽片段；具有與SEQ ID NO: 413具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性或與SEQ ID NO: 414具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5 %或100%一致性之序列的第二多肽片段；具有與SEQ ID NO: 415具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性或與SEQ ID NO: 416具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5 %或100%一致性之序列的第三多肽片段；具有與SEQ ID NO: 417具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性或與SEQ ID NO: 418具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5 %或100%一致性之序列的第四多肽片段；及具有與SEQ ID NO: 419具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性或與SEQ ID NO: 420具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5 %或100%一致性之序列的第五多肽片段；在一些實施例中，至少一個多肽區段衍生自AAV5蛋白殼蛋白且至少一個多肽區段衍生自AAV9蛋白殼蛋白。

AAV9衍生的多肽區段1：

AAV5衍生多肽區段1之序列：

AAV9衍生多肽區段2之序列：

AAV5衍生多肽區段2之序列：

AAV9衍生多肽區段3之序列：

AAV5衍生多肽區段3之序列：

AAV9衍生多肽區段4之序列：

AAV5衍生多肽區段4之序列：

AAV9衍生多肽區段5之序列：

具有Q688K突變之AAV9衍生多肽區段5之序列：

在一些實施例中，嵌合蛋白殼蛋白包含與SEQ ID NOs:421-444中之一者具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性的多肽序列或其功能片段、基本上由該多肽序列組成或由該多肽序列組成。表 2 . 蛋白殼蛋白序列

名稱/ 替代名稱	SEQ ID NO:
ZC23	421
ZC24	422
ZC25	423
ZC26	424
ZC27	425
ZC28	426
ZC29	427
ZC30	428
ZC31	429
ZC32	430
ZC33	431
ZC34	432
ZC35	433
ZC40 / TN8	434
ZC41	435
ZC42	436
ZC43	437
ZC44 / TN10	438
ZC45	439
ZC46	440
ZC47 / TN14	441
ZC48	442
ZC49	443
ZC50	444

在一些實施例中，視情況除本文所描述之任何嵌合修飾之外，本發明之嵌合蛋白殼蛋白亦包含序列KGSGQNQQT (SEQ ID NO: 727)。在一些實施例中，相對於參考SEQ ID NO:1，N452K取代與本文所描述之任何其他嵌合修飾組合。 組合型蛋白殼蛋白

在一個態樣中，本發明提供組合型蛋白殼蛋白。如本文所用，「組合型蛋白殼蛋白」係指如本發明中所描述的AAV5/AAV9嵌合蛋白殼蛋白，相對於嵌合親本序列，其在一或多個位點進一步包含胺基酸變異體。在一些實施例中，嵌合親本序列的一或多個位點係選自與AAV9蛋白殼蛋白之VR-IV位點、VR-V位點、VR-VII位點及VR-VIII位點等效的位點。

本發明之組合型蛋白殼蛋白包括如(但不限於)實例所示鑑別的任何變異型多肽序列。不限於任何特定實例，在一些實施例中，組合型蛋白殼蛋白包含AAV5/AAV9嵌合蛋白殼蛋白骨架，且進一步在選自由以下組成之群的一或多個位點包含變異型多肽序列：與如本文所描述之AAV9蛋白殼蛋白之VR-IV位點、VR-V位點、VR-VII位點及VR-VIII位點等效的位點。

在一些實施例中，組合蛋白殼蛋白包含按N端到C端之順序：具有與SEQ ID NO: 411具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性或與SEQ ID NO: 412具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5 %或100%一致性之序列的第一多肽片段；具有與SEQ ID NO: 413具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性或與SEQ ID NO: 414具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5 %或100%一致性之序列的第二多肽片段；具有與SEQ ID NO: 415具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性或與SEQ ID NO: 416具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5 %或100%一致性之序列的第三多肽片段；具有與SEQ ID NO: 417具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性或與SEQ ID NO: 418具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5 %或100%一致性之序列的第四多肽片段；及具有與SEQ ID NO: 419具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致性或與SEQ ID NO: 420具有至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5 %或100%一致性之序列的第五多肽片段(在此，等效於AAV9蛋白殼蛋白之VR-IV位點、VR-V位點、VR-VII位點及VR-VIII位點之區域在第五多肽片段之序列一致性計算中排除)。在一些實施例中，組合型蛋白殼蛋白包含在親本序列之VR-IV位點、VR-V位點、VR-VII位點及VR-VIII位點中之一或多者處的變異型多肽序列，其中該親本序列包含與SEQ ID NO: 463具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%一致性的序列。(在SEQ ID NO:463中，標識為「X」的胺基酸殘基自序列一致性計算排除在外。)

在一些實施例中，至少一個多肽區段衍生自AAV5蛋白殼蛋白且至少一個多肽區段衍生自AAV9蛋白殼蛋白。

在一些實施例中，組合型蛋白殼蛋白進一步在選自與AAV9蛋白殼蛋白之VR-IV位點、VR-V位點、VR-VII位點及VR-VIII位點等效之位點的一或多個位點包含變異型多肽序列。

在一些實施例中，組合型蛋白殼蛋白在與AAV9蛋白殼蛋白之VR-IV位點等效的位點具有變異型多肽序列，該變異型多肽序列包含與GYHKSGAAQ (SEQ ID NO: 6)至少約60%、70%、80%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，在與AAV9蛋白殼蛋白之VR-IV位相同的位點處之變異型多肽序列包含由至多1、2、3或4個保守胺基酸取代相對GYHKSGAAQ (SEQ ID NO: 6)組成的序列、主要由該序列組成或由該序列組成。

在一些實施例中，組合型蛋白殼蛋白在與AAV9蛋白殼蛋白之VR-V位點等效的位點具有變異型多肽序列，該變異型多肽序列包含與LNSMLI (SEQ ID NO: 105)至少約60%、70%、80%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於LNSMLI (SEQ ID NO: 105)，與AAV9蛋白殼蛋白之VR-V位點等效之位點的變異型多肽序列包含由至多1、2、3或4個保守胺基酸取代組成的序列、主要由該序列組成或由該序列組成。

在一些實施例中，組合型蛋白殼蛋白在與AAV9蛋白殼蛋白之VR-VIII位點等效的位點具有變異型多肽序列，該變異型多肽序列包含與ANYG (SEQ ID NO: 305)或NVSY (SEQ ID NO: 303)至少約60%、70%、80%、90%或100%一致的序列、主要由該序列組成或由該序列組成。在一些實施例中，相對於ANYG (SEQ ID NO: 305)或NVSY (SEQ ID NO: 303)，與AAV9蛋白殼蛋白之VR-VIII位點等效之位點的變異型多肽序列包含由至多1、2、3或4個保守胺基酸取代組成的序列、主要由該序列組成或由該序列組成。

在一些實施例中，與AAV9蛋白殼蛋白序列(SEQ ID NO: 1)之Q688等效之位置的殘基係組合型蛋白殼蛋白中的離胺酸(K)。

在一些實施例中，組合型蛋白殼蛋白包含與SEQ ID NO: 445-462中之一者至少約80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%一致的多肽序列或其功能片段、主要由其組成或由其組成。表 3 . 蛋白殼蛋白序列

名稱/ 替代名稱	SEQ ID NO:
TN47-07	445
TN47-10 / TN12	446
TN47-13	447
TN47-14	448
TN47-17	449
TN47-22	450
TN40-07	451
TN40-10	452
TN40-13	453
TN40-14	454
TN40-17	455
TN40-22	456
TN44-07 / TN13	457
TN44-10	458
TN44-13	459
TN44-14	460
TN44-17	461
TN44-22	462

在一些實施例中，視情況除本文所描述之任何組合型修飾之外，本發明之組合型蛋白殼蛋白亦包含序列KGSGQNQQT (SEQ ID NO: 727)。在一些實施例中，相對於參考SEQ ID NO:1，N452K取代與本文所描述之任何其他組合型修飾組合。

在一些實施例中，本發明提供AAV9、AAV5/AAV9嵌合蛋白殼蛋白或組合型蛋白殼蛋白，其包含與選自SEQ ID NO: 402-410、421-462、464-468之經修飾蛋白殼至少80%、85%、90%、95%、99%或100%一致的序列，其中具有指定之一致性百分比水平的胺基酸取代(視情況為保守取代)為容許的。 其他突變

為了進一步改善轉導效率或組織選擇性，例如可併入其他胺基酸取代。

在基於AAV5或AAV9之蛋白殼中，相對於AAV5之序列，例示性非限制性取代包括(但不限於) S651A、T578A或T582A。

在一些實施例中，在基於AAV5或AAV9之蛋白殼中，相對於AAV5之序列，蛋白殼蛋白包含選自S651A、T578A、T582A、K251R、Y709F、Y693F或S485A之突變。在一些實施例中，在基於AAV5或AAV9之蛋白殼中，相對於AAV5之序列，蛋白殼蛋白包含選自K251R、Y709F、Y693F或S485A之突變。 轉導效率、向性及 NAb 逃逸

可使用此項技術中已知之方法或實例中所描述之方法確定轉導效率。在一些實施例中，相較於包含親本序列的AAV病毒粒子，含有工程化蛋白殼蛋白的rAAV病毒粒子在心臟細胞中展現增加的轉導效率。本章節中提及的rAAV病毒粒子為含有本文所描述之經修飾或工程化蛋白殼蛋白的任何rAAV病毒粒子。

在一些實施例中，該rAAV病毒粒子相較於包含親本序列的AAV病毒粒子，在人類心臟纖維母細胞(hCF)中展現增加的轉導效率。在一些實施例中，人類心臟纖維母細胞位於心臟的左心室中。

在一些實施例中，在100,000的感染倍率(MOI)下，rAAV病毒粒子在hCF細胞中的轉導效率增加至少2、3、4、5、6、7、8、9、10、11、12、13、14或15倍。在一些實施例中，在100,000的感染倍率(MOI)下，rAAV病毒粒子在hCF細胞中展現的轉導效率增加約2倍至約16倍、約2倍至約14倍、約2倍至約12倍、約2倍至約10倍、約2倍至約8倍、約2倍至約6倍、約2倍至約4倍，或約2倍至約3倍。在一些實施例中，在100,000的感染倍率(MOI)下，rAAV病毒粒子在hCF細胞中展現的轉導效率增加至少2、3、4、5、6、7、8、9、10、11、12、13、14或15倍。在一些實施例中，在100,000的感染倍率(MOI)下，rAAV病毒粒子在hCF細胞中展現的轉導效率增加約20%至30%、約30%至40%、約40%至50%、約50%至80%、約80%至100%、約100%至125%、約125%至150%、約150%至175%、或約175%至200%。

在一些實施例中，在1,000的感染倍率(MOI)下，rAAV病毒粒子在hCF細胞中展現的轉導效率增加至少2、3、4、5、6、7、8、9、10、11、12、13、14或15倍。在一些實施例中，在1,000的感染倍率(MOI)下，rAAV病毒粒子在hCF細胞中展現的轉導效率增加約2倍至約16倍、約2倍至約14倍、約2倍至約12倍、約2倍至約10倍、約2倍至約8倍、約2倍至約6倍、約2倍至約4倍，或約2倍至約3倍。在一些實施例中，在1,000的感染倍率(MOI)下，rAAV病毒粒子在hCF細胞中展現的轉導效率增加約20%至30%、約30%至40%、約40%至50%、約50%至80%、約80%至100%、約100%至125%、約125%至150%、約150%至175%、或約175%至200%。

在一些實施例中，相較於包含親本序列的AAV病毒粒子，rAAV病毒粒子在誘導性富潛能幹細胞衍生的心肌細胞(iPS-CM)中展現增加的轉導效率。因此，本章節中論述的改善倍數係相較於包含親本序列的AAV病毒粒子(例如AAV9)。

在一些實施例中，在100,000的感染倍率(MOI)下，rAAV病毒粒子在iPS-CM細胞中展現的轉導效率增加至少2、3、4、5、6、7、8、9、10、11、12、13、14或15倍。在一些實施例中，在100,000的感染倍率(MOI)下，rAAV病毒粒子在iPS-CM細胞中展現的轉導效率增加約2倍至約16倍、約2倍至約14倍、約2倍至約12倍、約2倍至約10倍、約2倍至約8倍、約2倍至約6倍、約2倍至約4倍，或約2倍至約3倍。在一些實施例中，在100,000的感染倍率(MOI)下，rAAV病毒粒子在iPS-CM細胞中展現的轉導效率增加約20%至30%、約30%至40%、約40%至50%、約50%至80%、約80%至100%、約100%至125%、約125%至150%、約150%至175%、或約175%至200%。

在一些實施例中，在75,000的感染倍率(MOI)下，rAAV病毒粒子在iPS-CM細胞中展現的轉導效率增加至少2、3、4、5、6、7、8、9、10、11、12、13、14或15倍。在一些實施例中，在75,000的感染倍率(MOI)下，rAAV病毒粒子在iPS-CM細胞中展現的轉導效率增加約2倍至約16倍、約2倍至約14倍、約2倍至約12倍、約2倍至約10倍、約2倍至約8倍、約2倍至約6倍、約2倍至約4倍，或約2倍至約3倍。在一些實施例中，在75,000的感染倍率(MOI)下，rAAV病毒粒子在iPS-CM細胞中展現的轉導效率增加約20%至30%、約30%至40%、約40%至50%、約50%至80%、約80%至100%、約100%至125%、約125%至150%、約150%至175%、或約175%至200%。

在一些實施例中，在1,000的感染倍率(MOI)下，rAAV病毒粒子在iPS-CM細胞中展現的轉導效率增加至少2、3、4、5、6、7、8、9、10、11、12、13、14或15倍。在一些實施例中，在1,000的感染倍率(MOI)下，rAAV病毒粒子在iPS-CM細胞中展現的轉導效率增加約2倍至約16倍、約2倍至約14倍、約2倍至約12倍、約2倍至約10倍、約2倍至約8倍、約2倍至約6倍、約2倍至約4倍，或約2倍至約3倍。在一些實施例中，在1,000的感染倍率(MOI)下，rAAV病毒粒子在iPS-CM細胞中展現的轉導效率增加約20%至30%、約30%至40%、約40%至50%、約50%至80%、約80%至100%、約100%至125%、約125%至150%、約150%至175%、或約175%至200%。

在一些實施例中，相較於包含親本序列的AAV病毒粒子，含有本發明之工程化蛋白殼蛋白的rAAV病毒粒子在心臟中展現增加的轉導效率。在一些實施例中，藉由將本發明之工程化蛋白殼蛋白所囊封的AAV9:CAG-GFP或CAG-GFP注射至C57BL/6J小鼠中來監測心臟中的轉導效率。在一些實施例中，注射劑量為每隻小鼠2.5E+11 vg。在一些實施例中，注射劑量為每隻小鼠2E+11 vg。在一些實施例中，注射劑量為每隻小鼠1E+11 vg。在一些實施例中，rAAV病毒粒子在心臟中展現的轉導效率增加至少2、3、4、5、6、7、8、9、10、11、12、13、14或15。在一些實施例中，相對於野生型AAV9，rAAV病毒粒子在心臟中展現的轉導效率增加至少2、3、4、5、6、7、8、9、10、11、12、13、14或15倍。在一些實施例中，rAAV病毒粒子在心臟中展現的轉導效率增加約2倍至約16倍、約2倍至約14倍、約2倍至約12倍、約2倍至約10倍、約2倍至約8倍、約2倍至約6倍、約2倍至約4倍，或約2倍至約3倍。在一些實施例中，相對於野生型AAV9，rAAV病毒粒子在心臟中展現的轉導效率增加約2倍至約16倍、約2倍至約14倍、約2倍至約12倍、約2倍至約10倍、約2倍至約8倍、約2倍至約6倍、約2倍至約4倍，或約2倍至約3倍。在一些實施例中，rAAV病毒粒子在心臟中展現的轉導效率增加約20%至30%、約30%至40%、約40%至50%、約50%至80%、約80%至100%、約100%至125%、約125%至150%、約150%至175%、或約175%至200%。在一些實施例中，相對於野生型AAV9，rAAV病毒粒子在心臟中展現的轉導效率增加約20%至30%、約30%至40%、約40%至50%、約50%至80%、約80%至100%、約100%至125%、約125%至150%、約150%至175%、或約175%至200%。

在一些實施例中，相較於包含親本序列的AAV病毒粒子，含有本發明之工程化蛋白殼蛋白的rAAV病毒粒子在肝臟細胞中展現出降低的轉導效率。在一些實施例中，藉由將本發明之工程化蛋白殼蛋白所囊封的AAV9:CAG-GFP或CAG-GFP注射至C57BL/6J小鼠中來監測肝臟轉導效率。在一些實施例中，注射劑量為每隻小鼠2.5E+11 vg。在一些實施例中，注射劑量為每隻小鼠2E+11 vg。在一些實施例中，注射劑量為每隻小鼠1E+11 vg。在一些實施例中，rAAV病毒粒子在肝臟中展現的轉導效率降低至少2、3、4、5、6、7、8、9、10、11、12、13、14或15。在一些實施例中，注射劑量為每隻小鼠1E+11 vg。在一些實施例中，相對於野生型AAV9，rAAV病毒粒子在肝臟中展現的轉導效率降低至少2、3、4、5、6、7、8、9、10、11、12、13、14或15倍。在一些實施例中，rAAV病毒粒子在肝臟中展現的轉導效率降低約2倍至約16倍、約2倍至約14倍、約2倍至約12倍、約2倍至約10倍、約2倍至約8倍、約2倍至約6倍、約2倍至約4倍，或約2倍至約3倍。在一些實施例中，相對於野生型AAV9，rAAV病毒粒子在肝臟中展現的轉導效率降低約2倍至約16倍、約2倍至約14倍、約2倍至約12倍、約2倍至約10倍、約2倍至約8倍、約2倍至約6倍、約2倍至約4倍，或約2倍至約3倍。在一些實施例中，rAAV病毒粒子在肝臟中展現的轉導效率降低約20%至30%、約30%至40%、約40%至50%、約50%至80%、或約80%至100%。在一些實施例中，相對於野生型AAV9，rAAV病毒粒子在肝臟中展現的轉導效率降低約20%至30%、約30%至40%、約40%至50%、約50%至80%、或約80%至100%。

當包含本發明之工程化蛋白殼蛋白之rAAV病毒粒子於一種細胞/組織/器官類型之轉導效率相對於另一種類型的比率相較於包含親本序列之AAV病毒粒子增加時，對一種細胞類型及/或組織/器官類型的選擇性增加。在一些實施例中，相較於肝臟細胞，包含工程化蛋白殼蛋白之rAAV病毒粒子對iPS-CM細胞展現出增加的選擇性。在一些實施例中，相較於肝臟，包含工程化蛋白殼蛋白之rAAV病毒粒子當活體內注射時對心臟展現出增加的選擇性。在一些實施例中，相較於肝臟，包含工程化蛋白殼蛋白之rAAV病毒粒子當活體內注射時對心臟之左心室展現增加的選擇性。

在一些實施例中，包含工程化蛋白殼蛋白的rAAV病毒粒子對iPS-CM細胞展現的選擇性相對於肝臟細胞增加及/或對心臟展現的選擇性相對於肝臟增加至少2、3、4、5、6、7、8、9、10、11、12、13、14或15倍。在一些實施例中，包含工程化蛋白殼蛋白的rAAV病毒粒子對iPS-CM細胞展現的選擇性相對於肝臟細胞增加及/或對心臟展現的選擇性相對於肝臟增加約2倍至約16倍、約2倍至約14倍、約2倍至約12倍、約2倍至約10倍、約2倍至約8倍、約2倍至約6倍、約2倍至約4倍，或約2倍至約3倍。在一些實施例中，包含工程化蛋白殼蛋白的rAAV病毒粒子對iPS-CM細胞展現的選擇性相對於肝臟細胞增加及/或對心臟展現的選擇性相對於肝臟增加約20%至30%、約30%至40%、約40%至50%、約50%至80%、約80%至100%、約100%至125%、約125%至150%、約150%至175%、或約175%至200%。

在一些實施例中，包含工程化蛋白殼蛋白的rAAV病毒粒子對心臟組織展現的選擇性相對於肝臟細胞增加至少2、3、4、5、6、7、8、9、10、11、12、13、14或15倍。在一些實施例中，包含工程化蛋白殼蛋白的rAAV病毒粒子對心臟組織展現的選擇性相對於肝臟組織增加約2倍至約16倍、約2倍至約14倍、約2倍至約12倍、約2倍至約10倍、約2倍至約8倍、約2倍至約6倍、約2倍至約4倍，或約2倍至約3倍。在一些實施例中，包含工程化蛋白殼蛋白的rAAV病毒粒子對心臟組織展現的選擇性相較於肝臟組織增加至少或超過30%、40%、50%、80%、100%、125%、150%、175%、200%、250%、300%、400%、500%、600%、700%、800%或1000%。在一些實施例中，包含工程化蛋白殼蛋白的rAAV病毒粒子對心臟組織展現的選擇性相對於肝臟細胞增加約20%至30%、約30%至40%、約40%至50%、約50%至80%、約80%至100%、約100%至125%、約125%至150%、約150%至175%、或約175%至200%。

在一些實施例中，相較於包含親本序列的AAV病毒粒子，含有本發明之工程化蛋白殼蛋白的rAAV病毒粒子展現改進的逃避人類NAb (中和抗體)的能力。在一些實施例中，逃避人類NAb之能力係經由NAb抑制分析加以量測。NAb抑制分析之非限制性實例描述於本發明之實例章節中。在一些實施例中，如下執行NAb抑制分析：將AAV病毒粒子與彙集的人類NAb (例如IgG)一起培育，隨後以預定的MOI處理目標細胞且相較於不與彙集之人類NAb一起培育的AAV病毒粒子，量測轉導效率的降低。較少的NAb抑制表示AAV病毒粒子逃避人類NAb的能力改善。在一些實施例中，包含工程化蛋白殼蛋白的rAAV病毒粒子逃避人類NAb的能力改善至少2、3、4、5、6、7、8、9、10、11、12、13、14或15倍。在一些實施例中，包含工程化蛋白殼蛋白的rAAV病毒粒子逃避人類NAb的能力改善約2倍至約16倍、約2倍至約14倍、約2倍至約12倍、約2倍至約10倍、約2倍至約8倍、約2倍至約6倍、約2倍至約4倍，或約2倍至約3倍。在一些實施例中，包含工程化蛋白殼蛋白的rAAV病毒粒子逃避人類NAb的能力改善約20%至30%、約30%至40%、約40%至50%、約50%至80%、約80%至100%、約100%至125%、約125%至150%、約150%至175%、或約175%至200%。

在一些實施例中，相對於野生型AAV9及/或相對於肝臟的轉導，如本文所描述之包含N452K突變的任何rAAV在心臟中展現的轉導效率增加至少2、3、4、5、6、7、8、9、10、11、12、13、14或15倍。在一些實施例中，相對於野生型AAV9及/或相對於肝臟的轉導，如本文所描述之包含N452K突變的任何rAAV在心臟中展現的轉導效率增加約2倍至約16倍、約2至約14倍、約2至約12倍、約2至約10倍、約2至約8倍、約2至約6倍、約2至約4倍、或約2倍至約3倍。在一些實施例中，相對於野生型AAV9及/或相對於肝臟的轉導，如本文所描述之包含N452K突變的任何rAAV病毒粒子在心臟中展現的轉導效率增加至少或超過30%、40%、50%、80%、100%、125%、150%、175%、200%、250%、300%、400%、500%、600%、700%、800%或1000%。在一些實施例中，相對於野生型AAV9及/或相對於肝臟之轉導，如本文所描述之包含N452K突變的任何rAAV在心臟中展現的轉導效率增加約20%至30%、約30%至40%、約40%至50%、約50%至80%、約80%至100%、約100%至125%、約125%至150%、約150%至175%、或約175%至200%。

在一些實施例中，相對於野生型AAV9，如本文所描述之包含N452K突變的任何rAAV在肝臟中展現的轉導效率降低至少2、3、4、5、6、7、8、9、10、11、12、13、14或15倍。在一些實施例中，相對於野生型AAV9，如本文所描述之包含N452K突變的任何rAAV在肝臟中展現的轉導效率降低約2倍至約16倍、約2至約14倍、約2至約12倍、約2至約10倍、約2至約8倍、約2至約6倍、約2至約4倍、或約2倍至約3倍。在一些實施例中，相對於野生型AAV9，如本文所描述之包含N452K突變的任何rAAV病毒粒子在肝臟中展現的轉導效率降低至少或超過30%、40%、50%、80%、100%、125%、150%、175%、200%、250%、300%、400%、500%、600%、700%、800%或1000%。在一些實施例中，相對於野生型AAV9，如本文所描述之包含N452K突變的任何rAAV病毒粒子在肝臟中展現的轉導效率降低約20%至30%、約30%至40%、約40%至50%、約50%至80%、或約80%至100%。 基因產物 / 轉殖基因

本文所描述之轉殖基因及基因產物不具有限制性。編碼任何基因產物的任何轉殖基因可用於本文所描述之rAAV病毒粒子。

在一些實施例中，本發明之rAAV病毒粒子包含含有轉殖基因之病毒載體。

轉殖基因可為編碼產物或其功能片段的基因或核苷酸序列。產物可為例如多肽或非編碼核苷酸。非編碼核苷酸意謂自轉殖基因或核苷酸序列轉錄的序列不轉譯成多肽。在一些實施例中，由可操作地連接至本文所描述之增強子之轉殖基因或核苷酸編碼的產物為非編碼聚核苷酸。非編碼聚核苷酸可為RNA，諸如微小RNA (miRNA或mIR)、短髮夾RNA (shRNA)、長非編碼RNA (lnRNA)及/或短干擾RNA (siRNA)。在一些實施例中，轉殖基因編碼由心臟細胞(例如心肌細胞)原生表現的產物。

在一些實施例中，轉殖基因編碼多肽。在一些實施例中，轉殖基因編碼非編碼聚核苷酸，諸如微小RNA (miRNA或mIR)。

在一些實施例中，轉殖基因包含編碼人類蛋白質之核苷酸序列。在一些實施例中，轉殖基因包含人類核苷酸序列(人類DNA序列)。在一些實施例中，轉殖基因包含已經密碼子最佳化的DNA序列。在一些實施例中，轉殖基因包含編碼野生型蛋白質或其功能活性片段的核苷酸序列。在一些實施例中，轉殖基因包含編碼野生型蛋白質之變異型(諸如其功能活性變異體)的核苷酸序列。

在一些實施例中，轉殖基因包含編碼選自以下之產物的序列：血管內皮生長因子(VEGF)、VEGF同功型、VEGF-A、VEGF-B、VEGF-C、VEGF-D、VEGF-D ^dNdC、VEGF-A _116A、VEGF-A ₁₆₅、VEGF-A ₁₂₁、VEGF-2、胎盤生長因子(PIGF)、纖維母細胞生長因子4 (FGF-4)、人類生長因子(HGF)、人類顆粒球群落刺激因子(hGCSF)及低氧可誘導因子1α (HIF-1α)。

在一些實施例中，轉殖基因包含編碼選自以下之產物的序列：SERCA2a、基質細胞衍生因子-1 (SDF-1)、6型腺苷酸環化酶、S100A1、miRNA-17-92、miR-302-367、抗miR-29a、抗miR-30a、抗miR-141、週期素A2、週期素依賴性激酶2、Tbx20、miRNA-590、miRNA-199、針對Lp(a)的反義寡核苷酸、針對PCSK9的干擾RNA、針對脂蛋白元C-III的反義寡核苷酸、脂蛋白脂酶 ^S447X、針對脂蛋白元B的反義寡核苷酸、針對c-myc的反義寡核苷酸及E2F寡核苷酸誘餌。

在一些實施例中，轉殖基因編碼其表現彌補引起遺傳病症之基因缺陷的基因產物。在一些實施例中，本發明提供(不限於)編碼以下中之一或多者的聚核苷酸：例如用於(不限於)圓括號中所示的病症，或由以下各者引起的其他病症：TAZ (巴氏症候群(Barth syndrome))；FXN (弗雷德里奇共濟失調(Freidrich's Ataxia))；CASQ2 (CPVT)；FBN1 (Marfan)；RAF1及SOS1 (Noonan)；SCN5A (Brugada)；KCNQ1及KCNH2s (長QT症候群)；DMPK (肌緊張性營養不良1)；LMNA (肢帶型營養不良1B型)；JUP (Naxos)；TGFBR2 (Loeys-Dietz)；EMD (X性聯EDMD)；以及ELN (SV主動脈瓣狹窄)。在一些實施例中，聚核苷酸編碼以下中之一或多者：心肌鈣蛋白T (TNNT2)；BAG家族分子伴隨蛋白調節因子3 (BAG3)；肌凝蛋白重鏈(MYH7)；原肌凝蛋白1 (TPM1)；肌凝蛋白結合蛋白C (MYBPC3)；5'-AMP活化蛋白激酶亞單元γ-2 (PRKAG2)；3型肌鈣蛋白I (TNNI3)；肌聯蛋白(titin)(TTN)；肌凝蛋白輕鏈2 (MYL2)；肌動蛋白，α心肌1 (ACTC1)；鉀電壓設門通道，KQT樣亞家族成員1 (KCNQ1)；肌細胞增強因子2c (MEF2C)；以及心臟LIM蛋白(CSRP3)。

在一些實施例中，轉殖基因包含編碼選自以下之蛋白質的核苷酸序列：DWORF，連接蛋白(junctophilin)(例如JPH2)；BAG家族分子伴隨蛋白調節因子3 (BAG3)；受磷蛋白(phospholamban)(PLN)；α-晶狀體球蛋白B鏈(alpha-crystallin B chain)(CRYAB)；LMNA (諸如核纖層蛋白A(Lamin A)及核纖層蛋白C同功型)；3型肌鈣蛋白I(troponin I type 3) (TNNI3)；溶酶體相關膜蛋白2 (LAMP2，諸如LAMP2a、LAMP2b及LAMP2c同功型)；橋粒斑蛋白(desmoplakin)(DSP，諸如DPI及DPII同功型)；橋粒醣蛋白2(desmoglein 2) (DSG2)；連接斑珠蛋白(junction plakoglobin)(JUP)及斑菲素蛋白-2 (plakophilin-2)(PKP2)。在一些實施例中，轉殖基因包含編碼基質金屬肽酶11 (MMP11)蛋白、突觸極蛋白2樣(synaptopodin 2 like)(SYNPO2L)蛋白(例如SYNPO2LA或SYNPO2LA)或RNA結合模體蛋白20 (RBM20)的核苷酸序列。在一些實施例中，轉殖基因包含編碼靶向轉移抑制蛋白1 (MTSS1)之抑制性寡核苷酸的核苷酸序列。

在一些實施例中，病毒載體(諸如本發明之rAAV病毒粒子)中的轉殖基因係選自DWORF、JPH2、BAG3、CRYAB、LMNA (例如LMNA之核纖層蛋白A同功型，或LMNA之核纖層蛋白C同功型)、TNNI3、PLN、LAMP2 (例如LAMP2a、LAMP2b或LAMP2c)、DSP (例如DSP之DPI同功型或DSP之DPII同功型)、DSG2及JUP。

在一些實施例中，轉殖基因包含編碼MYBPC3多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含編碼人類MYBPC3多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 811、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼MYBPC3，例如人類MYBPC3之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 811具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，MYBPC3多肽包含SEQ ID NO: 815、基本上由其組成或由其組成。在一些實施例中，MYBPC3多肽與SEQ ID NO: 815具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼MYBPC3-delC3變異體多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 812、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼MYBPC3-delC3之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 812具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，MYBPC3-delC3變異體多肽包含SEQ ID NO: 816、基本上由其組成或由其組成。在一些實施例中，MYBPC3-delC3變異體多肽與SEQ ID NO: 816具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼MYBPC3-delC4變異體多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 813、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼MYBPC3-delC4之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 813具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，MYBPC3-delC4變異體多肽包含SEQ ID NO: 817、基本上由其組成或由其組成。在一些實施例中，MYBPC3-delC4變異體多肽與SEQ ID NO: 817具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼MYBPC3-delC4b變異體多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 814、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼MYBPC3-delC4b之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 814具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，MYBPC3-delC4變異體多肽包含SEQ ID NO: 818、基本上由其組成或由其組成。在一些實施例中，MYBPC3-delC4變異體多肽與SEQ ID NO: 818具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼DWORF多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含編碼人類DWORF多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 827或SEQ ID NO:828、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼DWORF，例如人類DWORF之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 827或SEQ ID NO:828具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，DWORF多肽包含SEQ ID NO: 826、基本上由其組成或由其組成。在一些實施例中，DWORF多肽與SEQ ID NO: 826具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼連接蛋白2 (JPH2)多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含編碼全長JPH2多肽的聚核苷酸序列。在一些實施例中，轉殖基因包含編碼人類JPH2多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 782、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼JPH2，例如人類JPH2之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 782具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，JPH2多肽包含SEQ ID NO: 783、基本上由其組成或由其組成。在一些實施例中，JPH2多肽與SEQ ID NO: 783具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼JPH2多肽之N端片段的聚核苷酸序列。在一些實施例中，轉殖基因包含編碼JPH2多肽之N端片段的聚核苷酸序列，其保持JPH2活性。在一些實施例中，轉殖基因包含SEQ ID NO: 809、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼JPH2之N端片段的密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 809具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，JPH2多肽之N端片段包含SEQ ID NO: 808、基本上由其組成或由其組成。在一些實施例中，JPH2多肽之N端片段與SEQ ID NO: 808具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼BAG3多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含編碼人類BAG3多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 785、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼BAG3，例如人類BAG3之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 785具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，BAG3多肽包含SEQ ID NO: 784、基本上由其組成或由其組成。在一些實施例中，BAG3多肽與SEQ ID NO: 784具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼BAG3多肽之C151R突變體形式的聚核苷酸序列。在一些實施例中，聚核苷酸序列為編碼BAG3多肽之C151R突變體形式之密碼子最佳化序列。在一些實施例中，BAG3多肽之C151R突變體形式包含SEQ ID NO: 829、基本上由其組成或由其組成。在一些實施例中，BAG3多肽之C151R突變體形式與SEQ ID NO: 829具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼CRYAB多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含編碼人類CRYAB多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 787、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼CRYAB，例如人類CRYAB之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 787具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，CRYAB多肽包含SEQ ID NO: 786、基本上由其組成或由其組成。在一些實施例中，CRYAB多肽與SEQ ID NO: 786具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼LMNA多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含編碼人類LMNA多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含編碼LMNA之核纖層蛋白A同功型的聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 789、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼LMNA之核纖層蛋白A同功型，例如人類之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 789具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，LMNA多肽之核纖層蛋白A同功型包含SEQ ID NO: 788、基本上由其組成或由其組成。在一些實施例中，LMNA多肽與SEQ ID NO: 788具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼LMNA之核纖層蛋白C同功型的聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 791、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼LMNA之核纖層蛋白C同功型，例如人類之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 791具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，LMNA多肽之核纖層蛋白C同功型包含SEQ ID NO: 790、基本上由其組成或由其組成。在一些實施例中，LMNA多肽與SEQ ID NO: 790具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼TNNI3多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含編碼人類TNNI3多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 793、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼TNNI3，例如人類TNNI3之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 793具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，TNNI3多肽包含SEQ ID NO: 792、基本上由其組成或由其組成。在一些實施例中，TNNI3多肽與SEQ ID NO: 792具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼PLN多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含編碼人類PLN多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 810、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼PLN，例如人類PLN之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 810具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，PLN多肽包含SEQ ID NO: 830、基本上由其組成或由其組成。在一些實施例中，PLN多肽與SEQ ID NO: 830具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼靶向突變體PLN基因(諸如PLN之缺失突變體，例如PLN-R14Del)之嚮導RNA的聚核苷酸序列。

在一些實施例中，轉殖基因包含編碼LAMP2多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含編碼人類LAMP2多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含編碼LAMP2a同功型之聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 795、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼LAMP2a，例如人類LAMP2a之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 795具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，LAMP2a多肽包含SEQ ID NO: 794、基本上由其組成或由其組成。在一些實施例中，LAMP2a多肽與SEQ ID NO: 794具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼LAMP2b同功型的聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 797、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼LAMP2b，例如人類LAMP2b之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 797具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，LAMP2b多肽包含SEQ ID NO: 796、基本上由其組成或由其組成。在一些實施例中，LAMP2b多肽與SEQ ID NO: 796具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼LAMP2c同功型的聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 799、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼LAMP2c，例如人類LAMP2c之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 799具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，LAMP2c多肽包含SEQ ID NO: 798、基本上由其組成或由其組成。在一些實施例中，LAMP2c多肽與SEQ ID NO: 798具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼DSP多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含編碼人類DSP多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含編碼DSP之DPI同功型的聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 801、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼DSP之DPI同功型，例如人類之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 801具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，DSP多肽之DPI同功型包含SEQ ID NO: 800、基本上由其組成或由其組成。在一些實施例中，DSP多肽之DPI同功型與SEQ ID NO: 800具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼DSP之DPII同功型的聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 803、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼DSP之DPII同功型，例如人類之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 803具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，DSP多肽之DPII同功型包含SEQ ID NO: 802、基本上由其組成或由其組成。在一些實施例中，DSP多肽之DPII同功型與SEQ ID NO: 802具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼DSG2多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含編碼人類DSG2多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 805、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼DSG2，例如人類DSG2之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 805具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，DSG2多肽包含SEQ ID NO: 804、基本上由其組成或由其組成。在一些實施例中，DSG2多肽與SEQ ID NO: 804具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼JUP多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含編碼人類JUP多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 807、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼JUP，例如人類JUP之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 807具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，JUP多肽包含SEQ ID NO: 806、基本上由其組成或由其組成。在一些實施例中，JUP多肽與SEQ ID NO:806具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼MMP11之聚核苷酸序列。在一些實施例中，轉殖基因包含編碼人類MMP11多肽之聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 819、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼MMP11，例如人類MMP11之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 819具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，MMP11多肽包含SEQ ID NO: 822、基本上由其組成或由其組成。在一些實施例中，MMP11多肽與SEQ ID NO: 822具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼SYNPO2L (例如，SYNPO2LA或SYNPO2LA)之聚核苷酸序列。在一些實施例中，轉殖基因包含編碼人類SYNPO2L(例如，SYNPO2LA或SYNPO2LA)之聚核苷酸序列。在一些實施例中，聚核苷酸序列為編碼SYNPO2LA，例如人類之密碼子最佳化序列。在一些實施例中，轉殖基因包含SEQ ID NO: 820、基本上由該序列組成或由該序列組成。在一些實施例中，轉殖基因包含與SEQ ID NO: 820具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，SYNPO2LA多肽包含SEQ ID NO: 823、基本上由其組成或由其組成。在一些實施例中，SYNPO2LA多肽與SEQ ID NO: 823具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。在一些實施例中，聚核苷酸序列為編碼SYNPO2LB，例如人類之密碼子最佳化序列。在一些實施例中，轉殖基因包含SEQ ID NO: 821、基本上由該序列組成或由該序列組成。在一些實施例中，轉殖基因包含與SEQ ID NO: 821具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，SYNPO2LB多肽包含SEQ ID NO: 824、基本上由其組成或由其組成。在一些實施例中，SYNPO2LB多肽與SEQ ID NO: 824具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，轉殖基因包含編碼靶向MTSS1之抑制性寡核苷酸(例如，siRNA)之聚核苷酸序列。在一些實施例中，轉殖基因包含編碼靶向SEQ ID NO: 831之抑制性寡核苷酸(例如，siRNA)之聚核苷酸序列。

在一些實施例中，轉殖基因包含編碼saCas9之聚核苷酸序列。在一些實施例中，轉殖基因包含SEQ ID NO: 832、基本上由該序列組成或由該序列組成。在一些實施例中，聚核苷酸序列為編碼saCas9之密碼子最佳化序列。在一些實施例中，轉殖基因包含與SEQ ID NO: 832具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列一致性的聚核苷酸序列。在一些實施例中，saCas9多肽包含SEQ ID NO:833、基本上由其組成或由其組成。在一些實施例中，saCas9多肽與SEQ ID NO:833具有至少75%、80%、85%、90%、95%、98%、99%或100%序列一致性。

在一些實施例中，本發明之rAAV病毒粒子包含異源核酸，該異源核酸包含編碼一或多種基因產物的核苷酸序列，該等基因產物選自MYBPC3、KCNH2、TRPM4、DSG2、ATP2A2、CACNA1C、DMD、DMPK、EPG5、EVC、EVC2、FBN1、NF1、SCN5A、SOS1、NPR1、ERBB4、VIP、MYH6、MYH7或其突變體、變異體或片段。在一些實施例中，本發明之rAAV病毒粒子包含異源核酸，該異源核酸包含編碼一或多種基因產物的核苷酸序列，該等基因產物選自TGFBR2、TGFBR1、EMD、KCNQ1、TAZ、COL3A1、JUP、CASQ2、MLRP44、DNAJC19、LMNA、TNNI3、DSP、DSG2、RAF1、SOS1、FBN1、LAMP2、FXN、RAF1、BAG3、KCNQ1、MYLK3、CRYAB、ALPK3及ACTN2。在一些實施例中，本發明之rAAV病毒粒子包含異源核酸，該異源核酸包含編碼一或多種基因產物的核苷酸序列，該等基因產物選自MYBPC3、DWORF、JPH2、BAG3、CRYAB、LMNA之核纖層蛋白A同功型、LMNA之核纖層蛋白C同功型、TNNI3、PLN、LAMP2a、LAMP2b、LAMP2c、DSP之DPI同功型、DSP之DPII同功型、DSG2、MYH6、MYH7、RBM20及JUP。

在一些實施例中，本發明之rAAV病毒粒子包含異源核酸，該異源核酸包含編碼選自ASCL1、MYOCD、MEF2C及TBX5之一或多種基因產物的核苷酸序列。在一些實施例中，本發明之rAAV病毒粒子包含異源核酸，該異源核酸包含編碼一或多種基因產物的核苷酸序列，該等基因產物選自ASCL1、MYOCD、MEF2C、AND TBX5、CCNB1、CCND1、CDK1、CDK4、AURKB、OCT4、BAF60C、ESRRG、GATA4、GATA6、HAND2、IRX4、ISLL、MESP1、MESP2、NKX2.5、SRF、TBX20、ZFPM2及MIR-133。

在一些實施例中，本發明之rAAV病毒粒子包含異源核酸，該異源核酸包含編碼一或多種基因產物的核苷酸序列，該等基因產物選自MYBPC3、DWORF、KCNH2、TRPM4、DSG2及ATP2A2。

在一些實施例中，本發明之rAAV病毒粒子包含異源核酸，該異源核酸包含編碼一或多種基因產物的核苷酸序列，該等基因產物選自TGFBR2、TGFBR1、EMD、KCNQ1、TAZ、COL3A1、JUP、CASQ2、MLRP44、DNAJC19、LMNA、TNNI3、DSP、DSG2、RAF1、SOS1、FBN1、LAMP2、FXN、RAF1、BAG3、KCNQ1、MYLK3、CRYAB、ALPK3及ACTN2。

在一些實施例中，本發明之rAAV病毒粒子包含異源核酸，該異源核酸包含編碼一或多種基因產物的核苷酸序列，該等基因產物選自CACNA1C、DMD、DMPK、EPG5、EVC、EVC2、FBN1、NF1、SCN5A、SOS1、NPR1、ERBB4、VIP、MYH6、MYH7及Cas9。在一些實施例中，本發明之rAAV病毒粒子包含含有編碼saCas9之核苷酸序列的異源核酸。

在一些實施例中，本發明之rAAV病毒粒子包含異源核酸，該異源核酸包含編碼選自MYOCD、ASCL1、GATA4、MEF2C、TBX5、miR-133及MESP1之一或多種基因產物的核苷酸序列。

在一些實施例中，本發明之rAAV病毒粒子包含異源核酸，該異源核酸包含編碼選自MMP11、SYNPO2L (例如，SYNPO2LA或SYNPO2LA)之一或多種基因產物的核苷酸序列及靶向MTSS1之抑制性寡核苷酸。

在一些實施例中，本發明之rAAV病毒粒子中的轉殖基因編碼上文所鑑別之任一種基因產物。

在一些實施例中，本文所描述之蛋白殼改善攜載本文所描述之任一種轉殖基因(且編碼本文所描述之任一種基因產物且引起本文所描述之任一種基因產物表現)之rAAV病毒粒子的心臟轉導效率、肝臟病毒負荷及/或心臟/肝臟轉導比率。 蛋白殼、轉殖基因及病毒粒子之其他實施例

鑑別具有適用於基因療法之特性之蛋白殼變異體的嘗試包括如美國專利第9,233,131號中所描述對AAV2及AAV5 cap基因之DNA進行改組；以及如國際專利申請案第WO2012/145601A2及WO2018/222503A1號中所描述進行的定向演化。此等文件的揭示內容併入本文中用於所有目的，尤其是用於製備及使用AAV病毒粒子的方法以及其中所揭示的聚核苷酸序列及基因產物，以及適用於治療心臟疾病或病症之轉錄因子組合。

AAV蛋白殼係由AAV之 cap基因編碼，該基因亦稱為右開讀框(ORF)(與左ORF rep相比)。代表性AAV蛋白殼之結構描述於多個出版物中，包括Xie等人 .(2002) Proc. Natl. Acad. Sci USA99:10405-1040 (AAV2)；Govindasamy等人 .(2006) J. Virol.80:11556-11570 (AAV4)；Nam等人. (2007) J. Virol. 81:12260-12271 (AAV8)及Govindasamy等人 .(2013) J. Virol.87:11187-11199 (AAV5)。

AAV蛋白殼以1:1:10之預測比率含有三種病毒蛋白(VP) VP1、VP2及VP3之60個複本(總計)，且以T=1二十面體對稱性佈置。三種VP係由同一mRNA轉譯，其中除C端區域之整個VP2序列之外，VP1含有唯一N端域。除C端之VP3之外，VP2亦含有額外N端序列。在大部分晶體結構中，僅觀測到所有蛋白殼蛋白共有的C端多肽序列(約530個胺基酸)。VP1的N端唯一區域、VP1-VP2重疊區域及VP3的前14至16個N端殘基被認為以無序為主。低溫電子顯微法及影像重建資料表明，在完整AAV蛋白殼中，VP1及VP2蛋白的N端區域位於蛋白殼內部且對於受體與抗體結合而言為不可及的。因此，受體附著及轉導表型通常由VP1、VP2及VP3之共有C端域內的胺基酸序列決定。

在一些實施例中，一或多個胺基酸插入、取代或缺失存在於AAV蛋白殼蛋白之GH環或環IV中，例如AAV蛋白殼蛋白之GH環或環IV的溶劑可及部分中。關於AAV蛋白殼之GH環/環IV，參見例如van Vliet等人 .(2006) Mol. Ther.14:809；Padron等人 .(2005) Virol.79:5047；及Shen等人 .(2007) Mol. Ther.15: 1955。在一些實施例中，「親本」AAV蛋白殼蛋白為野生型AAV9蛋白殼蛋白。在一些實施例中，「親本」AAV蛋白殼蛋白為野生型AAV5蛋白殼蛋白。在一些實施例中，「親本」AAV蛋白殼蛋白為嵌合AAV蛋白殼蛋白。多種AAV蛋白殼蛋白的胺基酸序列已知於此項技術中。參見例如GenBank登錄號NP_049542 (AAV1)；GenBank登錄號NP_044927 (AAV4)；GenBank登錄號AAD13756 (AAV5)；GenBank登錄號AAB95450 (AAV6)；GenBank登錄號YP_077178 (AAV7)；GenBank登錄號YP_077180 (AAV 8)；GenBank登錄號AAS99264 (AAV9)及GenBank登錄號AAT46337 (AAV10)。關於預測的祖系AAV蛋白殼，參見例如Santiago-Ortiz等人(2015) Gene Ther. 22:934。

腺相關病毒(AAV)為複製缺陷細小病毒，其單股DNA基因體長度為約4.7 kb，包括兩種145個核苷酸反向末端重複(ITR)。有多種AAV血清型。已知AAV血清型之基因體的核苷酸序列。舉例而言，AAV5基因體係以GenBank登錄號AF085716提供。AAV之生命週期及遺傳學評述於Muzyczka, Current Topics in Microbiology and Immunology, 158: 97-129 (1992)中。假模式化rAAV之製造揭示於例如WO 01/83692中。亦涵蓋其他類型之rAAV變異體，例如具有殼體突變之rAAV。參見例如Marsic等人，《分子治療(Molecular Therapy)》，22(11): 1900-1909 (2014)。說明性AAV載體提供於US 7,105,345；US 15/782,980；US 7,259,151；US 6,962,815；US 7,718,424；US 6,984,517；US 7,718,424；US 6,156,303；US 8,524,446；US 7,790,449；US 7,906,111；US 9,737,618；US App 15/433,322；US 7,198,951中，該等文獻各自以全文引用的方式併入本文中用於所有目的。

本發明之rAAV病毒粒子包含含有編碼一或多種基因產物之核苷酸序列的異源核酸。基因產物可為多肽或RNA，或兩者。當基因產物為多肽時，核苷酸序列編碼視情況含有一或多個內含子的信使RNA，該信使RNA被轉譯成基因產物多肽。核苷酸序列可編碼一種、兩種、三種或更多種基因產物(但數目受限於rAAV病毒粒子的封裝容量，典型地約5.2 kb)。基因產物可操作地連接至一個啟動子(對於單一轉錄單元而言)或超過一個啟動子。亦可使用內部核糖體進入訊號(IRES)或自裂解肽(例如2A肽)產生多種基因產物。

在一些實施例中，基因產物係多肽。在一些實施例中，多肽基因產物係多肽，其誘導心臟纖維母細胞的再程式化，以產生經誘導的心肌細胞樣細胞(iCM)。在一些實施例中，多肽基因產物係增強心臟細胞功能的多肽。在一些實施例中，多肽基因產物係提供心臟細胞缺失或缺乏之功能的多肽。在一些實施例中，多肽基因產物係基因體編輯的核酸內切酶。

在一些實施例中，基因產物包含與異源多肽融合的融合蛋白。在一些實施例中，基因產物包含與達成亞細胞定域之胺基酸序列融合的基因體編輯核酸酶，亦即，融合搭配物為亞細胞定域序列(例如用於靶向細胞核的一或多個核定域信號(NLS)、兩個或更多個NLS、三個或更多個NLS等)。

一般而言，藉由將病毒DNA或RNA構築體引入「生產細胞」或「封裝細胞」株系中來產生病毒載體。封裝細胞株包括(但不限於)容易轉染的任何細胞株。封裝細胞株可基於HEK291、293T細胞、NIH3T3、COS、HeLa或Sf9細胞株。封裝細胞株之實例包括(但不限於)：Sf9 (ATCC® CRL-1711™)。用於產生rAAV病毒粒子的例示性封裝細胞株及方法提供於國際專利公開案第WO2017075627號、第WO2015/031686號、第WO2013/063379號、第WO2011/020710號、第WO2009/104964號、第WO2008/024998號、第WO2003/042361號及第WO1995/013392號；美國專利第US9441206B2號、第US8679837號及第US7091029B2號。

在一些實施例中，基因產物係功能性心臟蛋白質。在一些實施例中，基因產物係基因體編輯的核酸內切酶(視情況使用嚮導RNA、單嚮導RNA及/或修復模板)，其將非功能性心臟蛋白質置換或修復成功能性心臟蛋白質。功能性心臟蛋白質包括(但不限於)心肌鈣蛋白T；心臟肌原纖維蛋白質；β-肌凝蛋白重鏈；肌凝蛋白心室必需輕鏈1；肌凝蛋白心室調節性輕鏈2；心臟a-肌動蛋白；a-肌旋蛋白；心肌鈣蛋白I；心臟肌凝蛋白結合蛋白質C；四個半LIM蛋白質1；肌聯蛋白；5'-AMP-活化蛋白質激酶次單元γ-2；肌鈣蛋白I 3型、肌凝蛋白輕鏈2、肌動蛋白α心肌1；心臟LIM蛋白質；窖蛋白3 (CAV3)；半乳糖α (GLA)；溶酶體相關膜蛋白2 (LAMP2)；粒線體轉移RNA甘胺酸(MTTG)；粒線體轉移RNA異白胺酸(MTTI)；粒線體轉移RNA離胺酸(MTTK)；粒線體轉移RNA麩醯胺酸(MTTQ)；肌凝蛋白輕鏈3 (MYL3)；肌鈣蛋白C (TNNC1)；甲狀腺素運載蛋白(TTR)；肌漿網鈣-ATP酶2a (SERCA2a)；基質衍生之因子1 (SDF-1)；腺苷酸環化酶-6 (AC6)；β-ARKct (β-腎上腺素激導性受體激酶C端)；成纖維細胞生長因子(FGF)；血小板衍生生長因子(PDGF)；血管內皮生長因子(VEGF)；肝細胞生長因子；低氧誘導性生長因子；胸腺素β 4 (TMSB4X)；氧化氮合酶-3 (NOS3)；優諾卡汀3 (UCN3)；麥盧辛(melusin)；脂蛋白元-E (ApoE)；超氧化歧化酶(SOD)及S100A1 (小鈣結合蛋白質；參見例如，Ritterhoff and Most (2012) Gene Ther.19:613；Kraus等人 .(2009) Mol. Cell. Cardiol.47:445)。

在一些實施例中，基因產物為其表現彌補引起遺傳病症之基因缺陷的基因產物。本發明提供包含編碼以下中之一或多者之聚核苷酸的rAAV病毒粒子——例如用於(不限於)圓括號中所指示之病症，或由以下各者引起的其他病症：TAZ (巴氏症候群(Barth syndrome))；FXN (弗雷德里奇共濟失調(Freidrich's Ataxia))；CASQ2 (CPVT)；FBN1 (Marfan)；RAF1及SOS1 (Noonan)；SCN5A (Brugada)；KCNQ1及KCNH2s (長QT症候群)；DMPK (肌緊張性營養不良1)；LMNA (肢帶型營養不良1B型)；JUP (Naxos)；TGFBR2 (Loeys-Dietz)；EMD (X性聯EDMD)；以及ELN (SV主動脈瓣狹窄)。在一些實施例中，rAAV病毒粒子包含編碼以下中之一或多者的聚核苷酸：心肌鈣蛋白T (TNNT2)；BAG家族分子伴隨蛋白調節因子3 (BAG3)；肌凝蛋白重鏈(MYH7)；原肌凝蛋白1 (TPM1)；肌凝蛋白結合蛋白C (MYBPC3)；5'-AMP活化蛋白激酶亞單元γ-2 (PRKAG2)；3型肌鈣蛋白I (TNNI3)；肌聯蛋白(TTN)；肌凝蛋白輕鏈2 (MYL2)；肌動蛋白，α心肌1 (ACTC1)；鉀電壓設門通道，KQT樣亞家族成員1 (KCNQ1)；肌細胞增強因子2c (MEF2C)；以及心臟LIM蛋白(CSRP3)。

在一些實施例中，本發明之基因產物為多肽再程式化因子。需要再程式化因子作為將一種細胞類型轉化為另一細胞類型的方式。可使用熟習此項技術者可獲得的任何方法活體外或活體內將非心肌細胞分化成心肌細胞。舉例而言，參見以下中所描述方法：Ieda等人 .(2010) Cell142:375-386；Christoforou等人 .(2013) PLoS ONE8:e63577；Addis等人 .(2013) J. Mol. Cell Cardiol.60:97-106；Jayawardena等人 .(2012) Circ. Res.110: 1465-1473；Nam Y等人 .(2003) PNAS USA110:5588-5593；Wada R等人 .(2013) PNAS USA110: 12667-12672；及Fu J等人 .(2013) Stem Cell Reports1:235-247。

在心臟背景下，再程式化因子能夠直接或經由中間細胞類型將心臟纖維母細胞轉變為心臟肌細胞。特定而言，可直接再程式化，或藉由首先將纖維母細胞轉變為多能或分化全能幹細胞來達成再程式化。此類多能幹細胞稱為誘導多能幹(iPS)細胞。隨後轉變成心臟肌細胞(CM)細胞的iPS細胞稱為iPS-CM細胞。在實例中，活體外衍生自心臟纖維母細胞的iPS-CM在活體內用於選擇所關注的蛋白殼蛋白。本發明亦設想使用本發明的蛋白殼蛋白，繼而在活體外產生iPS-CM細胞，但特別是在活體內作為治療性基因治療方案之一部分產生。誘導的心肌細胞樣(iCM)細胞係指直接再程式化成心肌細胞的細胞。

誘導的心肌細胞表現一或多種心肌細胞特異性標記物，其中心肌細胞特異性標記物包括(但不限於)心肌鈣蛋白I、心肌鈣蛋白-C、原肌凝蛋白、小窩蛋白-3、肌凝蛋白重鏈、肌凝蛋白輕鏈-2a、肌凝蛋白輕鏈-2v、蘭尼鹼受體、肌原纖維a-輔肌動蛋白、Nkx2.5、連結蛋白43及心房利尿鈉因子。誘導的心肌細胞亦可展現出肌原纖維結構。誘導的心肌細胞對心肌細胞特異性基因ACTC1 (心臟a-肌動蛋白)、ACTN2 (輔肌動蛋白a2)、MYH6 (a-肌凝蛋白重鏈)、RYR2 (蘭尼鹼受體2)、MYL2 (肌凝蛋白調節性輕鏈2，心室同功型)、MYL7 (肌凝蛋白調節性輕鏈，心房同功型)、TNNT2 (心臟2型肌鈣蛋白T)及NPPA (A型利尿鈉肽前驅物)、PLN (受磷蛋白)展現增強的表現。相較於衍生iCM的纖維母細胞，纖維母細胞標記物(諸如Colla2 (膠原蛋白la2))於經誘導之心肌細胞中的表現下調。

涉及多肽再程式化因子(在一些情況下，補充小分子再程式化因子，該等小分子再程式化因子連同rAAV一起供應)的再程式化方法包括US2018/0112282A1、WO2018/005546、WO2017/173137、US2016/0186141、US2016/0251624、US2014/0301991及US2013/0216503A1中所述的彼等方法，該等文獻全文併入，尤其是所揭示的再程式化方法及因子。

在一些實施例中，使用一或多種再程式化因子將心臟細胞再程式化成經誘導的心肌細胞樣(iCM)細胞，該等再程式化因子調節所關注之一或多種聚核苷酸或蛋白質的表現，諸如Achaete-scute同源物1 (ASCL1)、心肌素(MYOCD)、肌細胞特異性增強因子2C (MEF2C)及/或T-box轉錄因子5 (TBX5)。在一些實施例中，一或多種再程式化因子作為編碼所關注之一或多種聚核苷酸或蛋白質的聚核苷酸(例如RNA、mRNA或DNA聚核苷酸)提供。在一些實施例中，一或多種再程式化因子作為蛋白質提供。

在一些實施例中，再程式化因子為能夠增強所關注之一或多種聚核苷酸或蛋白質表現的微小RNA或微小RNA拮抗劑、siRNA或小分子。在一些實施例中，藉由微小RNA或微小RNA拮抗劑的表現來增強所關注之聚核苷酸或蛋白質的表現。舉例而言，可藉由微小RNA-302 (miR-302)的引入或藉由增強的miR-302表現來增強Oct多肽的內源表現。參見例如Hu等人 ., Stem Cells31(2): 259-68 (2013)，其以全文引用之方式併入本文中。因此，miRNA-302可為Oct多肽內源表現的誘導因子。miRNA-302可單獨引入或與編碼Oct多肽的核酸一起引入。在一些實施例中，適合的核酸基因產物為微小RNA。適合的微小RNA包括例如mir-1、mir-133、mir-208、mir-143、mir-145及mir-499。

在一些實施例中，本發明方法包含在小分子再程式化因子投與之前、期間或之後投與本發明之rAAV病毒粒子。在一些實施例中，小分子再程式化因子為選自由以下組成之群的小分子：SB431542、LDN-193189、地塞米松(dexamethasone)、LY364947、D4476、楊梅皮黃素(myricetin)、IWR1、XAV939、二十二碳六烯酸(DHA)、S-亞硝基-TV-乙醯基青黴胺(SNAP)、Hh-Agl.5、前列地爾(alprostadil)、克羅卡林(cromakalim)、MNITMT、A769662、視黃酸對羥基苯胺、十甲烯胺二溴化物、硝苯地平(nifedipine)、吡羅昔康(piroxicam)、桿菌素(bacitracin)、安曲南(aztreonam)、鹽酸駱駝蓬酚(harmalol hydrochloride)、醯胺-C2(A7)、Ph-C12 (CIO)、mCF3-C-7 (J5)、G856-7272 (A473)、5475707或其任何組合。

在一些實施例中，基因產物包含調節所關注之一或多種蛋白質表現的再程式化因子，該等蛋白質選自ASCL1、MYOCD、MEF2C及TBX5。在一些實施例中，基因產物包含一或多種再程式化因子，該等再程式化因子選自ASCL1、MYOCD、MEF2C、AND TBX5、CCNB1、CCND1、CDK1、CDK4、AURKB、OCT4、BAF60C、ESRRG、GATA4、GATA6、HAND2、IRX4、ISLL、MESP1、MESP2、NKX2.5、SRF、TBX20、ZFPM2及miR-133。

在一些實施例中，基因產物包含GATA4、MEF2C及TBX5 (亦即，GMT)。在一些實施例中，基因產物包含MYOCD、MEF2C及TBX5 (亦即，MyMT)。在一些實施例中，基因產物包含MYOCD、ASCL1、MEF2C及TBX5 (亦即，MyAMT)。在一些實施例中，基因產物包含MYOCD及ASCL1 (亦即，MyA)。在一些實施例中，基因產物包含GATA4、MEF2C、TBX5及MYOCD(亦即，4F)。在其他實施例中，基因產物包含GATA4、MEF2C、TBX5、ESSRG、MYOCD、ZFPM2及MESP1 (亦即，7F)。在一些實施例中，基因產物包含ASCL1、MEF2C、GATA4、TBX5、MYOCD、ESRRG及MESPL中之一或多者。

在一些實施例中，rAAV病毒粒子在活體外或活體內產生心肌細胞。心肌細胞或心臟肌細胞為構成心肌的肌肉細胞。各心肌細胞含有肌原纖維，其為肌節(肌肉細胞的收縮單元)的長鏈。心肌細胞顯示的條紋類似於骨骼肌細胞的條紋，但不同於多核骨骼細胞，其僅含有一個細胞核。心肌細胞的粒線體密度高，從而允許其快速地產生ATP，使得其對疲乏的抗性高。成熟心肌細胞可表現以下心臟標記物中之一或多者：α-輔肌動蛋白、MLC2v、MY20、cMHC、NKX2-5、GATA4、cTNT、cTNI、MEF2C、MLC2a或其任何組合。在一些實施例中，成熟心肌細胞表現NKX2-5、MEF2C或其組合。在一些實施例中，心臟祖細胞表現早期心臟祖細胞標記物，諸如GATA4、ISL1或其組合。

在一些實施例中，基因產物係聚核苷酸。在如下文所描述之一些實施例中，基因產物為能夠結合至RNA導引之核酸內切酶的嚮導RNA。在一些實施例中，基因產物為抑制性核酸，其能夠減小例如心臟細胞中之mRNA及/或多肽基因產物的含量。舉例而言，在一些實施例中，聚核苷酸基因產物為干擾RNA，其能夠選擇性地使引起心臟疾病或病症之對偶基因所編碼的轉錄本不活化。舉例而言，對偶基因為心肌肌凝蛋白重鏈7 β (MYH7)對偶基因，其包含引起肥厚性心肌病的突變。其他實例包括例如干擾RNA，其選擇性地使引起肥厚性心肌病(HCM)、擴張型心肌病(DCM)或左心室緻密化不全(LVNC)之對偶基因所編碼的轉錄本不活化，其中該對偶基因為MYL3 (肌凝蛋白輕鏈3，鹼性，心室，骨骼緩慢型)、MYH7、TNNI3 (3型肌鈣蛋白I (心臟))、TNNT2 (2型肌鈣蛋白T (心臟))、TPM1 (原肌凝蛋白1 (α))或包含引起HCM之突變、引起DCM之突變或引起LVNC之突變的ACTCl對偶基因。關於引起心臟疾病之突變的實例，參見例如美國專利公開案第2016/0237430號。

在一些實施例中，基因產物係編碼多肽的RNA。在一些實施例中，基因產物為干擾RNA。在一些實施例中，基因產物為適體。在一些實施例中，基因產物係多肽。在一些實施例中，基因產物係治療多肽，例如提供臨床效益的多肽。在一些實施例中，基因產物係位點特異性核酸酶，其使基因功能達成位點特異性減弱。在一些實施例中，基因產物為RNA導引的核酸內切酶，其對目標核酸提供修飾。在一些實施例中，基因產物為：i) RNA導引的核酸內切酶，其對目標核酸提供修飾；以及ii)嚮導RNA，其包含結合至目標核酸中之目標序列的第一區段及結合至RNA導引之核酸內切酶的第二區段。在一些實施例中，基因產物為：i) RNA導引的核酸內切酶，其對目標核酸提供修飾；ii)第一嚮導RNA，其包含結合至目標核酸中之第一目標序列的第一區段及結合至RNA導引之核酸內切酶的第二區段；以及iii)第一嚮導RNA，其包含結合至目標核酸中之第二目標序列的第一區段及結合至RNA導引之核酸內切酶的第二區段。

編碼本發明之rAAV病毒粒子中之異源基因產物的核苷酸序列可操作地連接至啟動子。舉例而言，編碼本發明之rAAV病毒粒子中之異源基因產物的核苷酸序列可操作地連接至組成型啟動子、可調節啟動子或心臟細胞特異性啟動子。適合之組成型啟動子包括人類延伸因子1 α亞單元(EFlα)啟動子、β-肌動蛋白啟動子、α-肌動蛋白啟動子、β-葡萄糖醛酸苷酶啟動子、CAG啟動子、超核心啟動子及泛素啟動子。在一些實施例中，編碼本發明之rAAV病毒粒子中之異源基因產物的核苷酸序列可操作地連接至心臟特異性轉錄調節因子元件(TRE)，其中心臟特異性TRE包括啟動子及增強子。適合的心臟特異性TRE包括(但不限於)衍生自以下基因的TRE：肌凝蛋白輕鏈-2 (MLC-2)、a-肌凝蛋白重鏈(a-MHC)、結蛋白、AE3、心肌鈣蛋白C (cTnC)及心臟肌動蛋白。Franz等人 .(1997) Cardiovasc. Res.35:560-566；Robbins等人 .(1995) Ann. NY. Acad. Sci.752:492-505；Linn等人 .(1995) Circ. Res.76:584-591；Parmacek等人 .(1994) Mol. Cell. Biol.14: 1870-1885；Hunter等人 .(1993) Hypertension22:608-617；及Sartorelli等人 .(1992) Proc. Natl. Acad. Sci.USA 89:4047-4051。亦參見Pacak等人 .(2008) Genet Vaccines Ther.6:13。在一些實施例中，啟動子為α-MHC啟動子、MLC-2啟動子或cTnT啟動子。

編碼基因產物的聚核苷酸可操作地連接至啟動子及/或增強子以促進基因產物表現。視所用宿主/載體系統而定，rAAV病毒粒子中可使用多種適合轉錄及轉譯控制元件中之任一者，包括組成型及誘導型啟動子、轉錄增強子元件、轉錄終止子等(例如Bitter等人(1987) Methods in Enzymology, 153:516-544)。

各聚核苷酸可使用各別的啟動子及/或增強子。在一些實施例中，單一開讀框中的兩個或更多個聚核苷酸使用相同啟動子及/或增強子。採用遺傳元件之此組態的載體稱為「多順反子」。多順反子載體之一說明性實例包含可操作地連接至單一開讀框的增強子及啟動子，該單一開讀框包含藉由2A區域連接的兩個或更多個聚核苷酸，其中開讀框的表現使得多種多肽以共轉譯方式產生。咸信2A區域經由密碼子跳讀來介導多種多肽序列的產生；然而，本發明亦關於多順反子載體，其利用轉譯後裂解自同一聚核苷酸產生所關注之兩種或更多種蛋白質。說明性2A序列、載體及相關方法提供於US20040265955A1中，該文獻其以引用的方式併入本文中。

適合真核啟動子(在真核細胞中發揮功能之啟動子)之非限制性實例包括CMV、CMV即刻早期啟動子、HSV胸苷激酶、早期及晚期SV40、來自逆轉錄病毒之長末端重複(LTR)及小鼠金屬硫蛋白-I。在一些實施例中，使用能夠賦予心臟特異性表現的啟動子。適合心臟特異性啟動子之非限制性實例包括結蛋白(Des)、α-肌凝蛋白重鏈(a-MHC)、肌凝蛋白輕鏈2 (MLC-2)、心肌鈣蛋白T (cTnT)及心肌鈣蛋白C (cTnC)。適合神經元特異性啟動子之非限制性實例包括突觸蛋白I (SYN)、鈣/調鈣素依賴性蛋白激酶II、微管蛋白αI、神經元特異性烯醇酶及血小板源生長因子β鏈啟動子及藉由將細胞巨大病毒增強子(E)與彼等神經元特異性啟動子融合而獲得的雜交啟動子。

適用於驅動再程式化因子表現之啟動子的實例包括(但不限於)逆轉錄病毒長末端重複(LTR)元件；組成型啟動子，諸如CMV、HSV1-TK、SV40、EF-la、β-肌動蛋白、磷酸甘油激酶(PGK)；誘導型啟動子，諸如含有Tet操縱子元件的彼等啟動子；心臟特異性啟動子，諸如結蛋白(DES)、α-肌凝蛋白重鏈(a-MHC)、肌凝蛋白輕鏈2 (MLC-2)、心肌鈣蛋白T (cTnT)及心肌鈣蛋白C (cTnC)；神經特異性啟動子，諸如巢蛋白、神經元核(NeuN)、微管締合蛋白2 (MAP2)、βIII微管蛋白、神經元特異性烯醇酶(NSE)、寡樹突神經膠細胞譜系(Oligl/2)及膠質原纖維酸性蛋白(GFAP)；以及胰臟特異性啟動子，諸如Pax4、Nkx2.2、Ngn3、胰島素、升糖素及生長抑素。

在一些實施例中，聚核苷酸可操作地連接至細胞類型特異性轉錄調節因子元件(TRE)，其中TRE包括啟動子及強化子。適合TRE包括(但不限於)衍生自以下基因之TRE：肌凝蛋白輕鏈-2、a-肌凝蛋白重鏈、AE3、心肌鈣蛋白C及心肌動蛋白。Franz等人 .(1997) Cardiovasc. Res.35:560-566；Robbins等人 .(1995) Ann. N. Y. Acad. Sci.752:492-505；Linn等人 .(1995) Circ. Res.76:584-591；Parmacek等人 .(1994) Cell. Biol.14:1870-1885；Hunter等人 .(1993) Hypertension22:608-617；及Sartorelli等人 .(1992) PNAS USA89:4047-4051。

啟動子可為與基因或核酸區段天然締合的啟動子。類似地，對於RNA (例如，微小RNA)而言，啟動子可為與微小RNA基因(例如，miRNA-302基因)天然締合的啟動子。此類天然締合的啟動子可稱為「天然啟動子」且可藉由將位於編碼區段及/或外顯子上游之5'非編碼序列分離而獲得。類似地，增強子可為與核酸序列天然締合的增強子。然而，增強子可定位於該序列之下游或上游。

替代地，某些優勢將藉由將編碼核酸區段置放於重組或異源啟動子控制下來獲得，該重組或異源啟動子係指在其天然環境中通常不與核酸序列相關之啟動子。重組或異源強化子亦係指在其天然環境中通常不與核酸序列相關之強化子。此類啟動子或增強子通常包括其他基因之啟動子或增強子，及自任何其他原核、病毒或真核細胞分離之啟動子或增強子，及非「天然存在」之啟動子或增強子，亦即含有不同轉錄調節區之不同元件及/或改變表現之突變的啟動子或增強子。除以合成方式產生啟動子及增強子之核酸序列之外，可結合本文所揭示之組合物、使用重組選殖及/或核酸擴增技術(包括PCR™)產生序列(參見美國專利第4,683,202號、美國專利第5,928,906號，各文獻以引用的方式併入本文中)。

所用啟動子可為組成性的、誘導性的、發育特異性的、組織特異性的及/或在適於導引核酸區段之高量表現的條件下適用。舉例而言，啟動子可為組成型啟動子，諸如CMV啟動子、CMV細胞巨大病毒即刻早期啟動子、CAG啟動子、EF-1α啟動子、HSV1-TK啟動子、SV40啟動子、β-肌動蛋白啟動子、PGK啟動子或其組合。可使用的真核啟動子之非限制性實例包括(但不限於)組成型啟動子，例如病毒啟動子，諸如CMV、SV40及RSV啟動子，以及可調節啟動子，例如誘導性或可抑制啟動子，諸如tet啟動子、hsp70啟動子及藉由CRE調節之合成啟動子。在某些實施例中，細胞類型特異性啟動子係用於驅動特定細胞類型中之再程式化因子的表現。適用於本文所描述之方法之細胞類型特異性啟動子的實例包括(但不限於)He等人(2006), Human Gene Therapy 17:949-959中所述的合成巨噬細胞特異性啟動子；顆粒球及巨噬細胞特異性溶菌酶M啟動子(參見例如Faust等人(2000), Blood 96(2):719-726)；以及骨髓特異性CD11b啟動子(參見例如Dziennis等人(1995), Blood 85(2):319-329)。可使用之啟動子之其他實例包括人類EF1α延伸因子啟動子、CMV細胞巨大病毒即刻早期啟動子、CAG雞白蛋白啟動子、與本文所描述之任一種病毒載體締合的病毒啟動子，或與本文所描述之任一種啟動子(例如來自另一物種)同源的啟動子。可使用之原核啟動子之實例包括(但不限於) SP6、T7、T5、tac、bla、trp、gal、lac或麥芽糖啟動子。

在一些實施例中，內部核糖體進入位點(IRES)元件可用於產生多基因或多順反子訊息。IRES元件能夠繞過5'-甲基化帽依賴性轉譯之核糖體掃描模型且開始在內部位點轉譯(Pelletier及Sonenberg, Nature 334(6180):320-325 (1988))。來自小核糖核酸病毒家族之兩種成員(脊髓灰質炎及腦心肌炎)的IRES元件已有描述(Pelletier及Sonenberg, Nature 334 (6180):320-325 (1988))，且來自哺乳動物訊息的IRES已有描述(Macejak及Samow, Nature 353:90-94 (1991))。IRES元件可連接至異源開讀框。多個開讀框可一起轉錄，各自由IRES分開，產生多順反子訊息。藉助於IRES元件，各開讀框可接近核糖體以進行高效轉譯。可使用轉錄單一訊息的單一啟動子/增強子高效表現多種基因(參見美國專利第5,925,565號及第5,935,819號，該等文獻以引用的方式併入本文中)。

在一些實施例中，核苷酸序列可操作地連接至聚腺苷酸化序列。適合之聚腺苷酸化序列包括牛生長激素polyA訊號(bGHpolyA)及短poly A訊號。視情況，本發明之rAAV載體包含土撥鼠轉錄後調節元件(WPRE)。在一些實施例中，編碼基因產物的聚核苷酸藉由包括所謂自裂解肽(例如，P2A肽)的序列連接。

在一些實施例中，基因產物包含使基因功能達成位點特異性減弱的位點特異性核酸內切酶，例如其中核酸內切酶將與心臟疾病或病症有關的對偶基因敲出。舉例而言，在主要對偶基因編碼基因之缺陷複本(當為野生型時，為心臟結構蛋白及/或提供正常心臟功能)的情況下，位點特異性核酸內切酶可靶向缺乏型對偶基因且敲出缺乏型對偶基因。在一些實施例中，位點特異性核酸內切酶為RNA導引的核酸內切酶。

除基因剔除缺陷型對偶基因外，位點特異性核酸酶亦可用於刺激與編碼缺陷型對偶基因所編碼之蛋白質之功能複本的供體DNA之同源重組。舉例而言，主題rAAV病毒粒子可用於遞送位點特異性核酸內切酶以敲除缺乏型對偶基因(或其片段)之缺乏型對偶基因a功能複本、從而修復缺乏型對偶基因，藉此產生功能性心臟蛋白質(例如功能性肌鈣蛋白等)。在一些實施例中，主題rAAV病毒粒子包含編碼位點特異性核酸內切酶的異源核苷酸序列；及編碼缺乏型對偶基因之功能複本的異源核苷酸序列，其中該功能複本編碼功能性心臟蛋白質。功能性心臟蛋白質包括例如肌鈣蛋白、氯離子通道及其類似物。

適於使用之位點特異性核酸內切酶包括例如鋅指核酸酶(ZFN)；巨核酸酶；及轉錄活化因子樣效應子核酸酶(transcription activator-like effector nuclease；TALEN)，其中此類位點特異性核酸內切酶為非天然存在的且經修飾以靶向特定基因。此類位點特異性核酸酶可經工程改造以切割基因體內之特定位置，且非同源末端連接可隨後修復斷裂，同時插入或缺失若干核苷酸。此類位點特異性核酸內切酶(亦稱為「INDEL」)接著將蛋白質自框架擲出且有效地敲除基因。參見例如，美國專利公開案第2011/0301073號。適合之位點特異性核酸內切酶包括工程化巨核酸酶、再工程化歸巢核酸內切酶。適合核酸內切酶包括I-Tevl核酸酶。適合之巨核酸酶包括I-Scel (參見例如Bellaiche等人(1999) Genetics 152:1037)；以及I-Crel (參見例如Heath等人(1997) Nature Sructural Biology 4:468)。適合使用的位點特異性核酸內切酶包括CRISPRi系統及基於Cas9之SAM系統。

在一些實施例中，基因產物為RNA導引的核酸內切酶。在一些實施例中，基因產物包含RNA，該RNA包含編碼RNA導引之核酸內切酶的核苷酸序列。在一些實施例中，基因產物為嚮導RNA，例如單嚮導RNA。在一些實施例中，基因產物為：1)嚮導RNA；及2) RNA導引的核酸內切酶。嚮導RNA可包含：a)結合至RNA導引之核酸內切酶的蛋白質結合區域；及b)結合至目標核酸的區域。RNA導引的核酸內切酶在本文中亦稱為「基因體編輯核酸酶」。

適合之基因體編輯核酸酶之實例為CRISPR/Cas核酸內切酶(例如2類CRISPR/Cas核酸內切酶，諸如II型、V型或VI型CRISPR/Cas核酸內切酶)。適合的基因體編輯核酸酶為CRISPR/Cas核酸內切酶(例如2類CRISPR/Cas核酸內切酶，諸如II型、V型或VI型CRISPR/Cas核酸內切酶)。在一些實施例中，基因產物包含2類CRISPR/Cas核酸內切酶。在一些實施例中，基因產物包含2類II型CRISPR/Cas核酸內切酶(例如，Cas9蛋白，諸如saCas9)。在一些實施例中，基因產物包含2類V型CRISPR/Cas核酸內切酶(例如Cpfl蛋白、C2cl蛋白或C2c3蛋白)。在一些實施例中，基因產物包含2類VI型CRISPR/Cas核酸內切酶(例如C2c2蛋白；亦稱為「Cas13a」蛋白)。在一些實施例中，基因產物包含CasX蛋白。在一些實施例中，基因產物包含CasY蛋白。 核酸、載體、細胞及 rAAV 病毒粒子的產生

在一些實施例中，本發明提供編碼本文所描述之任何AAV蛋白殼蛋白的核酸(諸如包含本文所描述之一或多種修飾的AAV蛋白殼蛋白)。

編碼蛋白殼蛋白之聚核苷酸可包含含有野生型 cap基因之原生密碼子或經選擇以編碼相同蛋白質之替代密碼子的序列。可改變插入序列的密碼子使用。選擇適當核苷酸序列及衍生替代性核苷酸序列以編碼本發明之任何蛋白殼蛋白在熟習此項技術者之技能範圍內。可使用宿主生物體之密碼子使用表(亦即，人類的真核密碼子使用)對蛋白質序列進行逆轉譯。

在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 402-410及464-468中之任一者至少80%、85%、90%、95%、99%或100%一致的序列。

在一些實施例中，本發明提供編碼AAV5/AAV9嵌合蛋白殼蛋白的聚核苷酸，該嵌合蛋白殼蛋白包含與SEQ ID NO: 421-444中之任一者至少80%、85%、90%、95%、99%或100%一致的序列。

在一些實施例中，本發明提供編碼組合型蛋白殼蛋白的聚核苷酸，該組合型蛋白殼蛋白包含與SEQ ID NO: 445-462中之任一者至少80%、85%、90%、95%、99%或100%一致的序列。

在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與選自由SEQ ID NOs: 488-589、705-710及767-780組成之群中之任一者具有至少或超過75%、80%、85%、90%、95%、99%或100%一致的序列。

在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與選自由以下組成之群中之任一者具有至少或超過75%、80%、85%、90%、95%、99%或100%一致的序列：SEQ ID NOs: 512、589、772、774、705、513、710、488、707及539。

在一些實施例中，本發明提供編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，該蛋白殼蛋白包含與以下中之任一者具有至少或超過80%、85%、90%、95%、99%或100%序列一致性的序列：SEQ ID NOs: 705-708。

在一些實施例中，本發明提供編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，該蛋白殼蛋白包含與以下中之任一者具有至少80%、85%、90%、95%、99%或100%序列一致性的序列：SEQ ID NOs: 515、581、539及527。

在一些實施例中，本發明提供編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，該蛋白殼蛋白包含與以下中之任一者具有至少80%、85%、90%、95%、99%或100%序列一致性的序列：SEQ ID NOs: 707、512、539及589。

在一些實施例中，本發明提供編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，該蛋白殼蛋白包含與以下中之任一者具有至少80%、85%、90%、95%、99%或100%序列一致性的序列：SEQ ID NOs: 707、512、539及589。在一些實施例中，本發明提供編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，該蛋白殼蛋白包含與SEQ ID NO: 707具有至少80%、85%、90%、95%、99%或100%序列一致性的序列。在一些實施例中，本發明提供編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，該蛋白殼蛋白包含與SEQ ID NO: 512具有至少80%、85%、90%、95%、99%或100%序列一致性的序列。在一些實施例中，本發明提供編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，該蛋白殼蛋白包含與SEQ ID NO: 539具有至少80%、85%、90%、95%、99%或100%序列一致性的序列。在一些實施例中，本發明提供編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，該蛋白殼蛋白包含與SEQ ID NO: 589具有至少80%、85%、90%、95%、99%或100%序列一致性的序列。

在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與以下中之任一者至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列：SEQ ID NOs: 488、499、504、505、506、510、512、513、516、518、521、522、533、536、539、558、562、566、571、576、578、579、580、581、585、588、589、705、706、707、708及710。

在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 488至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 499至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 504至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 505至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 506至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 510至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 512至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 513至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 516至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 518至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 521至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 522至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 533至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 536至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 539至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 558至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 562至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 566至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 571至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 576至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 578至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 579至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 580至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 581至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 585至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 588至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 589至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 705至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 706至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 707至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 708至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。在一些實施例中，本發明提供一種編碼AAV9衍生之蛋白殼蛋白的聚核苷酸，其包含與SEQ ID NOs: 710至少80%、85%、90%、95%、97%、98%、99%或100%一致的序列。

在一些實施例中，本發明提供包含編碼本文所描述之任何AAV蛋白殼蛋白之核酸的載體或質體。在一些實施例中，該載體或質體進一步包含可操作地連接至編碼AAV蛋白殼蛋白之核酸的啟動子。在一些實施例中，啟動子為在待用於表現蛋白殼蛋白之細胞(例如，生產細胞或宿主細胞)中具有活性的任何啟動子。在一些實施例中，啟動子為P40啟動子。在一些實施例中，啟動子為多角體蛋白啟動子。

在一些實施例中，包含編碼本文所描述之任何AAV蛋白殼蛋白之核酸的載體或質體進一步包含編碼複製(Rep)蛋白質的核酸。在一些實施例中，Rep蛋白為來自與反向末端重複序列(ITR)相同之AAV血清型的Rep蛋白，該等反向末端重複序列用於側接轉殖基因(使用本文所描述之AAV蛋白殼蛋白中之任一者封裝於病毒粒子中)。在一些實施例中，Rep蛋白為AAV2 Rep蛋白。在一些實施例中，Rep蛋白為AAV8 Rep蛋白。在一些實施例中，包含編碼本文所描述之任何AAV蛋白殼蛋白之核酸的載體或質體進一步包含編碼Rep蛋白的核酸。

在一些實施例中，本發明提供一種細胞，其包含編碼任何本文所描述之任何AAV蛋白殼蛋白的核酸。在一些實施例中，本發明提供一種包含載體或質體的細胞，該載體或質體包含編碼本文所描述之任何AAV蛋白殼蛋白的核酸。在一些實施例中，細胞進一步包含編碼Rep蛋白質之核酸的載體或質體，其中該Rep蛋白質可由與本文所描述之AAV蛋白殼蛋白相同或不同的載體或質體表現。

在一些實施例中，本發明提供一種宿主細胞，其包含編碼本文所描述之任何AAV蛋白殼蛋白的核酸。在一些實施例中，本發明提供一種包含載體或質體的宿主細胞，該載體或質體包含編碼本文所描述之任何AAV蛋白殼蛋白的核酸。

在一些實施例中，包含編碼本文所描述之任何AAV蛋白殼蛋白之核酸的宿主細胞係用於產生本文所描述之rAAV病毒粒子(諸如包含如本文所描述之經修飾AAV蛋白殼蛋白的rAAV病毒粒子)。在一些實施例中，將編碼任何AAV蛋白殼蛋白的核酸短暫轉染至細胞中。在一些實施例中，將編碼任何AAV蛋白殼蛋白的核酸穩定地插入細胞基因體中。

在一些實施例中，宿主細胞為哺乳動物細胞。在一些實施例中，宿主細胞係選自由以下組成之群：HEK293、HEK293T、HeLa、Vero、MDCK、MRC-5、PER.C6、BHK21及CHO。在一些實施例中，宿主細胞為HEK293細胞。

在一些實施例中，宿主細胞為昆蟲細胞。在一些實施例中，宿主細胞為Sf9昆蟲細胞。在昆蟲細胞用作宿主細胞的一些實施例中，首先將本文所描述之載體或質體引入重組桿狀病毒中且接著藉由桿狀病毒感染而被帶入昆蟲細胞中。

在一些實施例中，宿主細胞進一步用一或多種載體或質體轉染，該等載體或質體包含為了使攜載轉殖基因之載體複製及/或蛋白殼化而必需的輔助功能及/或病毒結構蛋白。

在一些實施例中，宿主細胞進一步用攜載轉殖基因(諸如本文所描述之任何轉殖基因)的病毒載體轉染。在一些實施例中，轉殖基因側接反向末端重複序列(ITR)。在一些實施例中，ITR係與宿主細胞中所表現的Rep蛋白相同的血清型。在一些實施例中，ITR為AAV2 ITR。在一些實施例中，ITR為AAV8 ITR。此項技術中已知的Rep蛋白與ITR之任何組合可用於本文所描述之細胞及方法中。

在一些實施例中，宿主細胞(例如，哺乳動物或昆蟲細胞)進一步包含輔助質體表現腺病毒輔助基因。

在一些實施例中，宿主細胞包含穩定整合至細胞基因體中的一或多種封裝因子。在一些實施例中，宿主細胞包含一種核酸，該核酸編碼穩定整合至其基因體中之本文所描述之任一種AAV蛋白殼蛋白。在一些實施例中，宿主細胞包含一種核酸，該核酸編碼穩定整合至其基因體中之Rep蛋白。在一些實施例中，宿主細胞包含穩定整合至其基因體中的腺病毒輔助基因。在一些實施例中，宿主細胞包含編碼本文所描述之AAV蛋白殼蛋白的核酸、編碼Rep蛋白的核酸，及穩定整合至其基因體中的腺病毒輔助基因。

rAAV病毒粒子的產生方法在此項技術中為已知的。在一些實施例中，可使用如本文所描述之宿主細胞產生rAAV病毒粒子。

在一些實施例中，在細胞中產生rAAV病毒粒子的方法包含： i. 將編碼本文所描述之任一種AAV蛋白殼蛋白的核酸、編碼Rep蛋白(諸如此項技術中已知或本文所描述之任何AAV Rep蛋白)的核酸、腺病毒輔助基因(諸如此項技術中已知的任何腺病毒輔助基因)及/或包含由ITR側接之轉殖基因(例如其中轉殖基因表現治療蛋白)的轉殖基因卡匣引入(例如藉由暫時轉染或穩定整合技術)細胞中(例如經由DNA轉染、病毒感染及/或穩定整合)，其中所引入之核酸或基因中之每一者可操作地連接至在細胞中具有活性的啟動子； ii 在適於產生rAAV病毒粒子的條件(例如適於封裝蛋白表現及/或適於病毒封裝的條件)下培養細胞(例如使用懸浮細胞培養或貼附細胞培養)，及 iii. 收集所產生的rAAV病毒粒子(例如，自培養基上清液及/或自細胞溶解之後的細胞溶解物收集)，及 iv. 視情況進一步純化rAAV病毒粒子，例如藉由密度梯度超速離心及/或基於層析之方法純化。

在一些實施例中，載體、啟動子、封裝因子、封裝系統、宿主細胞及/或rAAV病毒粒子產生方法為此項技術中已知之彼等者中的任一者。 使用方法

在一些實施例中，本發明提供鑑別AAV蛋白殼蛋白的方法，該等AAV蛋白殼蛋白使得rAAV病毒粒子在目標細胞中的轉導效率增加。方法包含：提供rAAV基因體包含編碼變異型AAV蛋白殼蛋白之cap聚核苷酸庫的rAAV病毒粒子群；視情況使該群體與非目標細胞接觸足以容許非所要rAAV病毒粒子附著至非目標細胞的時間；使該群體與目標細胞接觸足以容許cap聚核苷酸藉由rAAV病毒粒子轉導至目標細胞中的時間；及對來自目標細胞的cap聚核苷酸定序，從而鑑別出使目標細胞中之轉導效率增加的AAV蛋白殼蛋白。在一些實施例中，方法進一步包含藉由使該群體與非目標細胞接觸足以容許rAAV病毒粒子附著至非目標細胞的時間來耗竭rAAV病毒粒子群。此類標識方法之非限制性實例提供於實例中。

本發明提供在活體外使用rAAV病毒粒子產生心肌細胞及/或心肌細胞樣細胞的方法。所選起始細胞用rAAV轉導且視情況在足以跨越譜系及/或分化界限而轉化起始細胞的條件下暴露於小分子再程式化因子(轉導之前、期間或之後)一段時間以形成心臟祖細胞及/或心肌細胞。在一些實施例中，起始細胞為纖維母細胞。在一些實施例中，起始細胞表現一或多種指示分化表型的標記物。起始細胞轉化成心臟祖細胞及心肌細胞的時間可變化。舉例而言，用所關注之一或多種聚核苷酸或蛋白質處理之後，可培育起始細胞，直至心臟或心肌細胞的細胞標記物得到表現。此類心臟或心肌細胞的細胞標記物可包括以下標記物中之任一者：α-GATA4、TNNT2、MYH6、RYR2、NKX2-5、MEF2C、ANP、輔肌動蛋白、MLC2v、MY20、cMHC、ISL1、cTNT、cTNI及MLC2a或其任何組合。在一些實施例中，所誘導的心肌細胞就一或多種神經元細胞標記物而言呈陰性。此類神經元細胞標記物可包括以下標記物中之任一者：DCX、TUBB3、MAP2及ENO2。

可繼續進行培育，直至起始細胞表現心臟祖細胞標記物。此類心臟祖細胞標記物包括GATA4、TNNT2、MYH6、RYR2或其組合。細胞用本文所描述之組合物初始培育之後，心臟祖細胞標記物(諸如GATA4、TNNT2、MYH6、RYR2或其組合)可表現約8天，或約9天，或約10天，或約11天，或約12天，或約14天，或約15天，或約16天，或約17天，或約18天，或約19天，或約20天。細胞可進行進一步培育，直至晚期心臟祖細胞標記物(諸如NKX2-5、MEF2C或其組合)發生表現。

量測依據心肌細胞標記物量測再程式化效率。此類多能標記物包括(但不限於)心肌細胞標記物蛋白及mRNA的表現、心肌細胞形態及電生理學表型。心肌細胞標記物之非限制性實例包括a-肌聚糖、心房利尿鈉肽(ANP)、骨形態生成蛋白4 (BMP4)、連結蛋白37、連結蛋白40、密鑰蛋白(crypto)、結蛋白、GATA4、GATA6、MEF2C、MYH6、肌凝蛋白重鏈、NKX2.5、TBX5及肌鈣蛋白T。

心肌細胞特有之各種標記物的表現可藉由習知生物化學或免疫化學方法(例如酶聯免疫吸附分析、免疫組織化學分析及其類似方法)偵測。或者，可評估編碼心肌細胞特異性標記物之核酸的表現。編碼心肌細胞特異性標記物的核酸於細胞中的表現可藉由逆轉錄酶聚合酶鏈反應(RT-PCR)或雜交分析、過去常用於擴增、偵測及分析編碼任何標記物蛋白之mRNA的分子生物學方法證實。編碼心肌細胞特異性標記物的核酸序列已知且可經由公用資料庫(諸如GenBank)獲得。因此，容易確定需用作引子或探針的標記物特異性序列。

心肌細胞展現出心臟特有的一些電生理學特性。一種電學特徵係作用電位，其為持續時間短的事件，其中各心臟細胞內部與外部之間的電位差沿著一致的軌跡升高及下降。心肌細胞的另一種電生理學特徵為胞溶質自由Ca ²⁺濃度的循環變化，稱為Ca ²⁺暫態，其用於調節心肌細胞的收縮及鬆弛。可偵測且評價此等特徵，以評估細胞群是否已再程式化成心肌細胞。

本發明提供一種將基因產物遞送至心臟細胞(例如，心臟纖維母細胞)的方法。該等方法一般涉及用rAAV病毒粒子感染心臟細胞(例如纖維母細胞)，其中由存在於rAAV病毒粒子中之異源核酸編碼的基因產物產生於心臟細胞(例如心臟纖維母細胞)中。基因產物遞送至心臟細胞(例如心臟纖維母細胞)可實現對心臟疾病或病症的治療。基因產物遞送至心臟細胞(例如心臟纖維母細胞)可使得心臟纖維母細胞產生經誘導的心肌細胞樣(iCM)細胞。基因產物遞送至心臟細胞(例如心臟纖維母細胞)可實現對心臟細胞(例如心臟纖維母細胞)之基因體的編輯。

在一些實施例中，感染或轉導心臟細胞(例如心臟纖維母細胞)係在活體外進行。在一些實施例中，感染或轉導心臟細胞(例如心臟纖維母細胞)係在活體外進行；且將經感染/轉導的心臟細胞(例如心臟纖維母細胞)引入(例如輸入或植入)有需要之個體中，例如直接引入有需要之個體的心臟組織中。對於活體外轉導而言，遞送至細胞之rAAV病毒粒子的有效量為約10 ⁵至約10 ¹³個rAAV病毒粒子。一般技術者經由確立劑量反應曲線的常規試驗可容易確立其他有效劑量。

在一些實施例中，感染心臟細胞(例如心臟纖維母細胞)係在活體內進行。舉例而言，在一些實施例中，本發明之rAAV病毒粒子的有效量直接投與有需要之個體的心臟組織。「有效量」落入相對較寬的範圍，該範圍可經由實驗及/或臨床試驗確定。舉例而言，活體內注射(亦即，直接注射至心臟組織中)時，治療有效劑量大致為約10 ⁶至約10 ¹⁵個本發明rAAV病毒粒子，例如約10 ⁵至10 ¹²個本發明rAAV病毒粒子。在一些實施例中，有效量的本發明之rAAV病毒粒子經由心肌內注射、經由心包膜投與。在一些實施例中，有效量的本發明之rAAV病毒粒子經由血管遞送、經由冠狀動脈投與。在一些實施例中，有效量的本發明之rAAV病毒粒子經由全身遞送、經由上腔靜脈投與。在一些實施例中，有效量的本發明之rAAV病毒粒子經由全身遞送、經由周邊靜脈投與。

舉例而言，將本發明之rAAV病毒粒子的約10 ⁴至約10 ⁵個、約10 ⁵至約10 ⁶個、約10 ⁶至約10 ⁷個、約10 ⁶至約10 ⁷個、約10 ⁷至約10 ⁸個、約10 ⁸至約10 ⁹個、約10 ⁹至約10 ¹⁰個、約10 ¹⁰至約10 ¹¹個、至約10 ¹¹個、約10 ¹¹至約10 ¹²個、約10 ¹²至約10 ¹³個、約10 ¹³至約10 ¹⁴個、約10 ¹⁴至約10 ¹⁵個基因體複本，或超過10 ¹⁵個基因體複本投與個體，例如直接投與個體的心臟組織，或經由另一種途徑投與。投與個體之rAAV病毒粒子的數目可用每公斤(kg)個體體重之病毒基因體(vg)表示。在一些實施例中，本發明之rAAV病毒粒子的有效量為約10 ²vg/kg至10 ⁴vg/kg、約10 ⁴vg/kg至約10 ⁶vg/kg、約10 ⁶vg/kg至約10 ⁸vg/kg、約10 ⁸vg/kg至約10 ¹⁰vg/kg、約10 ¹⁰vg/kg至約10 ¹²vg/kg、約10 ¹²vg/kg至約10 ¹⁴vg/kg、約10 ¹⁴vg/kg至約10 ¹⁶vg/kg、約10 ¹⁶vg/kg至約10 ¹⁸vg/kg，或超過10 ¹⁸vg/kg。在一些實施例中，rAAV病毒粒子係以在以下、在至少以下或在不超過以下投與：10 ²vg/kg、10 ³vg/kg、10 ⁴vg/kg、10 ⁵vg/kg、10 ⁶vg/kg、10 ⁸vg/kg、10 ⁹vg/kg、10 ¹⁰vg/kg、10 ¹¹vg/kg、10 ¹²vg/kg、10 ¹³vg/kg、2x10 ¹³vg/kg、3x10 ¹³vg/kg、4x10 ¹³vg/kg、5x10 ¹³vg/kg、6x10 ¹³vg/kg、7x10 ¹³vg/kg、8x10 ¹³vg/kg、9x10 ¹³vg/kg、10 ¹⁴vg/kg、2x10 ¹⁴vg/kg,3x10 ¹⁴vg/kg、4x10 ¹⁴vg/kg、5x10 ¹⁴vg/kg、6x10 ¹⁴vg/kg、7x10 ¹⁴vg/kg、8x10 ¹⁴vg/kg、9x10 ¹⁴vg/kg,10 ¹⁵vg/kg、10 ¹⁶vg/kg、10 ¹⁷vg/kg或10 ¹⁸vg/kg (或在此等值之間量的任何範圍內)。在一些實施例中，rAAV病毒粒子係以2x10 ¹³vg/kg投與。在一些實施例中，rAAV病毒粒子係以1.43x10 ¹³vg/kg投與。在一些實施例中，rAAV病毒粒子係以1.2x10 ¹⁴vg/kg投與。

在一些實施例中，有效量的本發明之rAAV病毒粒子局部投與至心臟。在一些實施例中，有效量的本發明之rAAV病毒粒子經由心肌內注射、經由心包膜投與。在一些實施例中，有效量的本發明之rAAV病毒粒子經由血管遞送、經由冠狀動脈投與。在一些實施例中，有效量的本發明之rAAV病毒粒子經由全身遞送，例如靜脈內投與。在一些實施例中，有效量的本發明之rAAV病毒粒子經由全身遞送、經由上腔靜脈投與。在一些實施例中，有效量的本發明之rAAV病毒粒子經由全身遞送、經由周邊靜脈投與。

在一些實施例中，超過一次投與(例如兩次、三次、四次或更多次投與)可用以達成所需的基因表現量。在一些實施例中，超過一次投與係依各種時間間隔投與，例如每日一次、每週一次、每月兩次、每月一次、每3個月一次、每6個月一次、每年一次等。在一些實施例中，多次投與係在1個月至2個月、2個月至4個月、4個月至8個月、8個月至12個月、1年至2年、2年至5年、或超過5年的時段內投與。

本發明提供一種使心臟纖維母細胞再程式化以產生經誘導之心肌細胞樣細胞(iCM)的方法。該方法一般涉及用本發明之rAAV病毒粒子感染心臟纖維母細胞，其中該rAAV病毒粒子包含異源核酸，該異源核酸包含編碼一或多種再程式化因子的核苷酸序列。

心肌細胞特有之各種標記物的表現藉由習知生物化學或免疫化學方法(例如，酶聯免疫吸附分析；免疫組織化學分析及其類似方法)偵測。或者，可評估編碼心肌細胞特異性標記物之核酸的表現。編碼心肌細胞特異性標記物的核酸於細胞中的表現可藉由逆轉錄酶聚合酶鏈反應(RT-PCR)或雜交分析、過去常用於擴增、偵測及分析編碼任何標記物蛋白之mRNA的分子生物學方法證實。編碼心肌細胞特異性標記物的核酸序列已知且可經由公用資料庫(諸如GenBank)獲得；從而，容易確定需用作引子或探針的標記物特異性序列。

所誘導之心肌細胞亦可展現出自發收縮。所誘導的心肌細胞是否展現自發收縮可利用標準電生理學方法(例如膜片箝)確定。

在一些實施例中，所誘導的心肌細胞可展現出自發的Ca ²⁺振盪。可使用標準方法偵測Ca ²⁺振盪，例如使用多種鈣敏感性染料、胞內Ca ²⁺離子偵測染料中之任一者，包括(但不限於) fura-2、雙-fura 2、indo-1、Quin-2、Quin-2 AM、苯并噻唑-1、苯并噻唑-2、indo-5F、Fura-FF、BTC、Mag-Fura-2、Mag-Fura-5、Mag-Indo-1、fluo-3、rhod-2、rhod-3、fura-4F、fura-5F、fura-6F、fluo-4、fluo-5F、fluo-5N、Oregon Green 488 BAPTA、鈣綠色、鈣黃綠素、Fura-C18、鈣綠色-C18、鈣橙色、鈣大紅色、鈣綠色-5N、鎂綠色、Oregon綠色488 BAPTA-1、Oregon綠色488 BAPTA-2、X-rhod-1、Fura紅色、Rhod-5F、Rhod-5N、X-Rhod-5N、Mag-Rhod-2、Mag-X- Rhod-1、Fluo-5N、Fluo-5F、Fluo-4FF、Mag-Fluo-4、發光蛋白質、聚葡萄糖共軛物或此等染料中之任一者的任何其他衍生物及其他(參見例如the catalog or Internet site for Molecular Probes, Eugene, 亦參見Nuccitelli, ed., Methods in Cell Biology, 第40卷: A Practical Guide to the Study of Calcium in Living Cells, Academic Press (1994)；Lambert, ed., Calcium Signaling Protocols (Methods in Molecular Biology 第114卷), Humana Press (1999)；W. T. Mason, ed., Fluorescent and Luminescent Probes for Biological Activity. A Practical Guide to Technology for Quantitative Real-Time Analysis, Second Ed, Academic Press (1999)；Calcium Signaling Protocols (Methods in Molecular Biology), 2005, D.G. Lamber, ed., Humana Press.)。

在一些實施例中，iCM係在活體外產生；且將iCM引入個體中，例如將iCM植入有需要之個體的心臟組織中。本發明之方法可包含在活體外感染心臟纖維母細胞群以產生iCM群體；且將iCM群體植入有需要之個體的心臟組織中。

在一些實施例中，iCM係活體內產生。舉例而言，在一些實施例中，包含含有編碼一或多個再程式化因子之核苷酸序列之異源核酸的本發明之rAAV病毒粒子投與個體。在一些實施例中，rAAV病毒粒子直接投與有需要之個體的心臟組織。在一些實施例中，將包含異源核酸之本發明rAAV病毒粒子的約10 ⁶至約10 ⁵、約10 ⁵至約10 ⁹、約10 ⁹至約10 ¹⁰、約10 ¹⁰至約10 ¹¹、約10 ¹¹至約10 ¹²、約10 ¹²至約10 ¹³、約10 ¹³至約10 ¹⁴、約10 ¹⁴至約10 ¹⁵個基因體複本或超過10 ¹⁵個基因體複本投與個體，例如直接投與個體之心臟組織或經由另一種投藥途徑投與，該異源核酸包含編碼一或多種再程式化因子的核苷酸序列。投與個體之rAAV病毒粒子的數目可用每公斤(kg)個體體重之病毒基因體(vg)表示。在一些實施例中，本發明之rAAV病毒粒子的有效量為約10 ²vg/kg至10 ⁴vg/kg、約10 ⁴vg/kg至約10 ⁶vg/kg、約10 ⁶vg/kg至約10 ⁸vg/kg、約10 ⁸vg/kg至約10 ¹⁰vg/kg、約10 ¹⁰vg/kg至約10 ¹²vg/kg、約10 ¹²vg/kg至約10 ¹⁴vg/kg、約10 ¹⁴vg/kg至約10 ¹⁴vg/kg、約10 ¹⁴vg/kg至約10 ¹⁶vg/kg，或超過10 ¹⁶vg/kg。在一些實施例中，有效量的本發明之rAAV病毒粒子經由心肌內注射、經由心包膜投與。在一些實施例中，有效量的本發明之rAAV病毒粒子經由血管遞送、經由冠狀動脈投與。在一些實施例中，有效量的本發明之rAAV病毒粒子經由全身遞送、經由上腔靜脈投與。在一些實施例中，有效量的本發明之rAAV病毒粒子經由全身遞送、經由周邊靜脈投與。

本發明提供一種修飾(「編輯」)心臟細胞之基因體的方法。本發明提供一種修飾(「編輯」)心臟纖維母細胞之基因體的方法。本發明提供一種修飾(「編輯」)心肌細胞之基因體的方法。方法一般涉及用本發明之rAAV病毒粒子感染心臟細胞(例如心臟纖維母細胞或心肌細胞)，其中rAAV病毒粒子包含異源核酸，該異源核酸包含編碼基因體編輯核酸內切酶的核苷酸序列。在一些實施例中，方法包含用本發明之rAAV病毒粒子感染心臟纖維母細胞或心肌細胞，其中rAAV病毒粒子包含異源核酸，該異源核酸包含編碼RNA導引之基因體編輯核酸內切酶的核苷酸序列。在一些實施例中，方法包含用本發明之rAAV病毒粒子感染心臟纖維母細胞或心肌細胞，其中rAAV病毒粒子包含含有核苷酸序列的異源核酸，該核苷酸序列編碼：i) RNA導引的基因體編輯核酸內切酶；及ii)一或多種嚮導RNA。在一些實施例中，方法包含用本發明之rAAV病毒粒子感染心臟纖維母細胞或心肌細胞，其中rAAV病毒粒子包含含有核苷酸序列的異源核酸，該核苷酸序列編碼：i) RNA導引的基因體編輯核酸內切酶；ii)嚮導RNA；及iii)供體模板DNA。適合的RNA導引之基因體編輯核酸內切酶描述如上。

在一些實施例中，感染心臟細胞(例如心臟纖維母細胞；心肌細胞)係在活體外進行。在一些實施例中，感染心臟細胞(例如心臟纖維母細胞；心肌細胞)係在活體外進行；且將經感染的心臟細胞(例如心臟纖維母細胞)引入(例如植入)有需要之個體中，例如直接引入有需要之個體的心臟組織中。對於活體外轉導而言，遞送至細胞之rAAV病毒粒子的有效量大致為約10 ⁵至約10 ¹³個rAAV病毒粒子。一般技術者經由確立劑量反應曲線的常規試驗可容易確立其他有效劑量。

在一些實施例中，感染心臟細胞(例如心臟纖維母細胞；心肌細胞)係在活體內進行。舉例而言，在一些實施例中，本發明之rAAV病毒粒子的有效量直接投與有需要之個體的心臟組織。「有效量」落入相對較寬的範圍，該範圍可經由實驗及/或臨床試驗確定。舉例而言，活體內注射(亦即，直接注射至心臟組織中)時，治療有效劑量大致為約10 ⁶至約10 ¹⁵個本發明rAAV病毒粒子，例如約10 ¹¹至10 ¹²個本發明rAAV病毒粒子。在一些實施例中，有效量的本發明之rAAV病毒粒子經由心肌內注射、經由心包膜投與。在一些實施例中，有效量的本發明之rAAV病毒粒子經由血管遞送、經由冠狀動脈投與。在一些實施例中，有效量的本發明之rAAV病毒粒子經由全身遞送、經由上腔靜脈投與。在一些實施例中，有效量的本發明之rAAV病毒粒子經由全身遞送、經由周邊靜脈投與。

舉例而言，將本發明之rAAV病毒粒子的約10 ⁶至約10 ⁷、約10 ⁷至約10 ⁸、約10 ⁸至約10 ⁹、約10 ⁹至約10 ¹⁰、約10 ¹⁰至約10 ¹¹、約l0 ¹¹至約10 ¹²、約10 ¹²至約10 ¹³、約10 ¹³至約10 ¹⁴、約10 ¹⁴至約10 ¹⁵個基因體複本或超過10 ¹⁵個基因體複本投與個體，例如直接投與個體的心臟組織。投與個體之rAAV病毒粒子的數目可用每公斤(kg)個體體重之病毒基因體(vg)表示。在一些實施例中，本發明之rAAV病毒粒子的有效量為約10 ²vg/kg至10 ⁴vg/kg、約10 ⁴vg/kg至約10 ⁶vg/kg、約10 ⁶vg/kg至約10 ⁸vg/kg、約10 ⁸vg/kg至約10 ¹⁰vg/kg、約10 ¹⁰vg/kg至約10 ¹²vg/kg、約10 ¹²vg/kg至約10 ¹⁴vg/kg、約10 ¹⁴vg/kg至約10 ¹⁶vg/kg、約10 ¹⁶vg/kg至約10 ¹⁸vg/kg，或超過10 ¹⁸vg/kg。在一些實施例中，有效量的本發明之rAAV病毒粒子經由心肌內注射、經由心包膜投與。在一些實施例中，有效量的本發明之rAAV病毒粒子經由血管遞送、經由冠狀動脈投與。在一些實施例中，有效量的本發明之rAAV病毒粒子經由全身遞送、經由上腔靜脈投與。在一些實施例中，有效量的本發明之rAAV病毒粒子經由全身遞送、經由周邊靜脈投與。

在一些實施例中，基因體編輯包含同源定向修復(HDR)。在一些實施例中，HDR校正心臟纖維母細胞或心肌細胞中之內源目標核酸的缺陷，其中該缺陷與心臟纖維母細胞或心肌細胞之結構及/或功能缺陷有關或導致心臟纖維母細胞或心肌細胞之結構及/或功能缺陷，或校正心臟纖維母細胞或心肌細胞之組分的缺陷。

在一些實施例中，基因體編輯包含非同源末端接合(NHEJ)。在一些實施例中，NHEJ將心臟纖維母細胞或心肌細胞中之內源目標核酸的缺陷刪除，其中該缺陷與心臟纖維母細胞或心肌細胞之結構及/或功能缺陷有關或導致心臟纖維母細胞或心肌細胞之結構及/或功能缺陷；或將心臟纖維母細胞或心肌細胞之組分的缺陷刪除。

用於編輯心臟細胞基因體的本發明方法可用於校正導致心臟疾病或病症之多種基因缺陷中的任一者。所關注之突變包括以下基因中之一或多者中之突變：心肌鈣蛋白T (TNNT2)；肌凝蛋白重鏈(MYH7)；原肌凝蛋白1 (TPM1)；肌凝蛋白結合蛋白C (MYBPC3)；5'-AMP活化蛋白激酶亞單元γ-2 (PRKAG2)；3型肌鈣蛋白I (TNNI3)；肌聯蛋白(TTN)；肌凝蛋白輕鏈2 (MYL2)；肌動蛋白，α心肌1 (ACTC1)；鉀電壓設門通道，KQT樣亞家族成員1 (KCNQ1)；肌細胞增強因子2c (MEF2C)；以及心臟LIM蛋白(CSRP3)。所關注之特定突變包括(但不限於) MYH7 R663H突變；TNNT2 R173W；及KCNQ1 G269S錯義突變。所關注之突變包括以下基因中之一或多者中的突變：MYH6、ACTN2、SERCA2、GATA4、TBX5、MYOCD、NKX2-5、NOTCH1、MEF2C、HAND2及HAND1。在一些實施例中，所關注之突變包括以下基因中的突變：MEF2C、TBX5及MYOCD。可用本發明之方法治療的心臟疾病及病症包括冠心病、心肌病、心內膜炎、先天性心血管缺陷及充血性心臟衰竭。可用本發明之方法治療的心臟疾病及病症包括肥厚性心肌病；心臟瓣膜病；心肌梗塞；充血性心臟衰竭；長QT症候群；心房心律不齊；心室心律不整；舒張性心臟衰竭；收縮性心臟衰竭；心臟瓣膜疾病；心臟瓣膜鈣化；左心室緻密化不全；心室中隔缺陷；及局部缺血。

在一些實施例中，本發明提供一種轉導心臟細胞的方法。在一些實施例中，本發明提供轉導心臟細胞之方法，其包含使心臟細胞與本文所描述之rAAV病毒粒子接觸，其中該rAAV病毒粒子轉導心臟細胞。在一些實施例中，心臟細胞係心肌細胞。

在一些實施例中，本發明提供一種轉導心臟細胞的方法，包含使心臟細胞與rAAV病毒粒子接觸，其中rAAV病毒粒子包含蛋白殼蛋白，其中該蛋白殼蛋白為本文所描述之任何蛋白殼蛋白。

在一些實施例中，本發明提供一種轉導心臟細胞的方法，其包含使心臟細胞與rAAV病毒粒子接觸，其中該rAAV病毒粒子包含蛋白殼蛋白，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%多肽序列一致性，及其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置584處之胺基酸插入，其包含天冬醯胺酸(N)、蘇胺酸(T)、酪胺酸(Y)、苯丙胺酸(F)及丙胺酸(A)中之一或多者；在位置585處之胺基酸插入，其包含組胺酸(H)及甲硫胺酸(M)中之一或多者；在位置586處之胺基酸插入，其包含組胺酸(H)、酪胺酸(Y)、纈胺酸(V)、蘇胺酸(T)、丙胺酸(A)、異白胺酸(I)、色胺酸(W)、甲硫胺酸(M)及白胺酸中之一或多者；位置585與586之間的胺基酸插入，包含組胺酸(H)、酪胺酸(Y)、色胺酸(W)及甲硫胺酸(M)中之一或兩者(例如WM或HY之插入)；在位置587處之胺基酸插入，其包含異白胺酸(I)及脯胺酸(P)中之一或多者；在位置588處之胺基酸插入，其包含異白胺酸(I)、蘇胺酸(T)及脯胺酸(P)中之一或多者；在位置589處之胺基酸插入，其包含甘胺酸(G)及麩醯胺酸(Q)中之一或多者；一或多個選自由以下組成之群的胺基酸取代：N452K、N452A、N452V、G453A、G453N、S454T、S454D、G455N、Q456L、Q456K、N457L、N457V、Q458I及Q458H；及/或一或多個選自由以下組成之群的胺基酸取代：T582D、T582L、T582E、T582A、T582F、T582R、T582P、N583V、N583T、H584R、H584Q、H584K、H584V、H584Y、H584M、H584T、H584W、H584E、H584D、Q585T、Q585C、Q585V、Q585L、Q585N、Q585S、Q585P、Q585A、Q585M、Q585E、Q585Y、Q585G、Q585H、Q585I、S586D、S586T、S586G、S586K、S586M、S586N、S586I、S586Q、S586L、S586P、S586F、S586R、A587F、A587S、A587T、A587N、A587L、A587P、A587V、A587K、A587I、A587R、A587H、A587G、A587M、A587D、A587W、Q588L、Q588S、Q588F、Q588N、Q588G、Q588R、Q588I、Q588V、Q588T、Q588Y、Q588H、Q588M、Q588K、Q588D、A589R、A589I、A589N、A589S、A589V、A589Q、A589F、A589T、A589K、A589H、A589E、A589W、A589L、A589Y、A589M、Q590I、Q590S、Q590N、Q590G、Q590D、Q590R、Q590H、Q590T、Q590M、Q590F、Q590Y、Q590L、A591I、G594Q及G594D。

在一些實施例中，本發明提供一種轉導心臟細胞的方法，其包含使心臟細胞與rAAV病毒粒子接觸，其中該rAAV病毒粒子包含蛋白殼蛋白，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%多肽序列一致性，及其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：胺基酸取代Q585E、S586N、A587T、Q588V、A589S、Q590I及N452K。

在一些實施例中，本發明提供一種轉導心臟細胞的方法，其包含使心臟細胞與rAAV病毒粒子接觸，其中該rAAV病毒粒子包含蛋白殼蛋白，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%多肽序列一致性，及其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：胺基酸取代S586T、A587L、Q588F、A589N、Q590S及N452K。

在一些實施例中，本發明提供一種轉導心臟細胞的方法，其包含使心臟細胞與rAAV病毒粒子接觸，其中該rAAV病毒粒子包含蛋白殼蛋白，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%多肽序列一致性，及其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：胺基酸取代Q585N、A587T、Q588Y、A589L、Q590G及N452K。

在一些實施例中，本發明提供一種轉導心臟細胞的方法，其包含使心臟細胞與rAAV病毒粒子接觸，其中該rAAV病毒粒子包含蛋白殼蛋白，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%多肽序列一致性，及其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：胺基酸取代Q585G、A587I、Q588L、A589T、Q590H及N452K。

在一些實施例中，本發明提供一種轉導心臟細胞的方法，其包含使心臟細胞與rAAV病毒粒子接觸，其中該rAAV病毒粒子包含蛋白殼蛋白，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%多肽序列一致性，及其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：胺基酸取代Q585M、S586M、A587T、Q588T、A589A及Q590R。

在一些實施例中，本發明提供一種轉導心臟細胞的方法，其包含使心臟細胞與rAAV病毒粒子接觸，其中該rAAV病毒粒子包含蛋白殼蛋白，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%多肽序列一致性，及其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：胺基酸取代Q585C、A587T、Q588S、A589I及Q590R。

在一些實施例中，本發明提供一種轉導心臟細胞的方法，其包含使心臟細胞與rAAV病毒粒子接觸，其中該rAAV病毒粒子包含蛋白殼蛋白，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%多肽序列一致性，及其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：胺基酸取代Q585N、A587T、Q588Y、A589L及Q590G。

在一些實施例中，本發明提供將一或多種基因產物遞送至心臟細胞之方法。在一些實施例中，將一或多種基因產物遞送至心臟細胞的方法包含使心臟細胞與本文所描述之rAAV病毒粒子接觸。在一些實施例中，心臟細胞係心肌細胞。

在一些實施例中，本發明提供將一或多種基因產物經由包含蛋白殼蛋白之rAAV病毒粒子遞送至心臟細胞的方法，其中該蛋白殼蛋白為本文所描述之任何蛋白殼蛋白。

在一些實施例中，本發明提供將一或多種基因產物經由包含蛋白殼蛋白之rAAV病毒粒子遞送至心臟細胞的方法，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%多肽序列一致性，及其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含： (a)胺基酸取代Q585E、S586N、A587T、Q588V、A589S、Q590I及N452K； (b)胺基酸取代S586T、A587L、Q588F、A589N、Q590S及N452K； (c)胺基酸取代Q585N、A587T、Q588Y、A589L、Q590G及N452K； (d)胺基酸取代Q585G、A587I、Q588L、A589T、Q590H及N452K； (e)胺基酸取代Q585M、S586M、A587T、Q588T、A589A及Q590R； (f)胺基酸取代Q585C、A587T、Q588S、A589I及Q590R，或 (g)胺基酸取代Q585N、A587T、Q588Y、A589L及Q590G。 治療方法

本發明提供治療有需要之個體之心臟病理的方法，其包含向該個體投與治療有效量之包含rAAV病毒粒子之醫藥組合物，其中該rAAV病毒粒子轉導心臟組織。

需要使用本發明之組合物及方法治療的個體包括(但不限於)患有先天性心臟缺陷的個體、罹患退化性肌肉疾病的個體、罹患導致心臟組織局部缺血之病狀的個體(例如患有冠狀動脈疾病的個體)及其類似者。在一些實例中，方法適用於治療肌肉退化疾病或病狀(例如家族性心肌病、擴張型心肌病、肥厚性心肌病、限制性心肌病，或冠狀動脈疾病伴所引起的缺血性心肌症)。在一些實例中，本發明方法適用於治療患有心臟或心血管疾病或病症之個體，例如心血管疾病、動脈瘤、絞痛症、心律不齊、動脈粥樣硬化、腦血管事故(中風)、腦血管疾病、先天性心臟病、充血性心臟衰竭、心肌炎、冠狀動脈瓣膜疾病、動脈擴張疾病、心舒功能障礙、心內膜炎、高血壓(high blood pressure)(高血壓(hypertension))、心肌病、肥厚性心肌病、限制性心肌病、冠狀動脈疾病伴所引起的缺血性心肌症、二尖瓣脫垂(mitral valve prolapse)、心肌梗塞(心臟病發作)或靜脈血管栓塞。

適於使用本發明之組合物、細胞及方法治療的個體包括個體(例如哺乳動物個體，諸如人類、非人類靈長類動物、馴養哺乳動物、實驗性非人類哺乳動物個體，諸如小鼠、大鼠等)，其患有心臟病狀，包括但不限於引起心臟組織局部缺血的病狀(例如患有冠狀動脈疾病的個體)及其類似病狀。

在一些實例中，適於治療的個體罹患心臟或心血管疾病或病狀，例如心血管疾病、動脈瘤、絞痛症、心律不齊、動脈粥樣硬化、腦血管事故(中風)、腦血管疾病、先天性心臟病、充血性心臟衰竭、心肌炎、冠狀動脈瓣膜疾病、動脈擴張疾病、心舒功能障礙、心內膜炎、高血壓(high blood pressure)(高血壓(hypertension))、心肌病、肥厚性心肌病、限制性心肌病、冠狀動脈疾病伴所引起的缺血性心肌症、二尖瓣脫垂、心肌梗塞(心臟病發作)或靜脈血管栓塞。在一些實例中，適於用本發明方法治療的個體包括患有肌肉退化疾病的個體，例如家族性心肌病、擴張型心肌病、肥厚性心肌病、限制性心肌病，或冠狀動脈疾病伴所引起的缺血性心肌症。

舉例而言，心臟病變可選自由以下組成之群：充血性心臟衰竭、心肌梗塞、心臟局部缺血、心肌炎及心律不齊。在一些實施例中，個體患有糖尿病。在一些實施例中，個體無糖尿病。在一些實施例中，個體罹患糖尿病性心肌病。

治療時，本發明之rAAV病毒粒子及/或其醫藥組合物可局部或全身性投與。rAAV病毒粒子可藉由注射、導管、可植入裝置或類似物引入。rAAV病毒粒子可於生理學上可接受之對細胞無有害影響的任何賦形劑或載劑中投與。舉例而言，本發明之rAAV病毒粒子及/或其醫藥組合物可靜脈內投與或經由心內途徑(例如心包膜或心肌內)投與。本發明之rAAV病毒粒子及/或其醫藥組合物投與個體(尤其是人類個體)的方法包括注射或輸注醫藥組合物(例如包含rAAV病毒粒子的組合物)。注射可包括直接肌肉注射且輸注可包括血管內輸注。rAAV病毒粒子或醫藥組合物可插入遞送裝置中，藉由注射至個體來促進引入。此類遞送裝置包括用於將細胞及流體注射至接受者個體之身體內的管，例如導管。管另外可包括針，例如注射器，本發明細胞可經由其在所需位置引入個體中。

在一些實施例中，藉由皮下、靜脈內、肌肉內、腹膜內或心內注射或藉由心內導管插入術來投與rAAV病毒粒子。在一些實施例中，藉由直接心肌內注射或經血管投與來投與rAAV病毒粒子。在一些實施例中，藉由直接心肌內注射、順行冠狀動脈內注射、逆行注射、經心內膜心肌注射，或心臟分子手術並再循環遞送(MCARD)來投與rAAV病毒粒子。

rAAV病毒粒子可以不同形式插入此類遞送裝置(例如注射器)中。rAAV病毒粒子可以醫藥組合物形式供應。此類組合物可包括針對人類投與而在充分無菌條件下製備的等張賦形劑。對於醫藥調配物中之通用原則，讀者參考「Cell Therapy: Stem Cell Transplantation, Gene Therapy, and Cellular Immunotherapy」由G. Morstyn及W. Sheridan編, Cambridge University Press, 1996；及「Hematopoietic Stem Cell Therapy」, E. D. Ball, J. Lister及P. Law, Churchill Livingstone, 2000。賦形劑及組合物中之任何伴隨成分的選擇可經調適以最佳化投藥途徑及/或所用裝置。

重組AAV可局部或全身性投與。藉由選擇本發明之適當蛋白殼蛋白，可對重組AAV進行工程改造以靶向特定細胞類型。為了確定AAV病毒粒子組合物之各種治療投藥方案及劑量的適合性，首先可在適合的動物模型中測試rAAV病毒粒子。在一個層面上評估重組AAV活體內感染目標細胞的能力。亦可評估重組AAV以確定其是否遷移至目標組織、其是否誘導宿主發生免疫反應，或確定rAAV病毒粒子投與的適當次數或劑量。視待治療之疾病而定，可能需要或不需要重組AAV產生免疫反應。一般而言，若需要重複投與病毒粒子，則病毒粒子無免疫原性為有利的。出於測試目的，可將rAAV病毒粒子組合物投與免疫缺乏動物(諸如裸小鼠，或因化學或輻射而導致免疫缺乏的動物)。在感染期之後，可收集目標組織或細胞且評估以確定組織或細胞是否已感染且是否已誘導目標組織或細胞出現所需表型(例如誘導的心肌細胞)。

重組AAV病毒粒子可藉由各種途徑投與，包括(但不限於)直接注射至心臟中或心臟導管插入術。或者，rAAV病毒粒子可全身性投與，諸如藉由靜脈內輸注。當使用直接注射時，其可藉由開心手術或藉由最低限度侵入性手術執行。在一些實施例中，重組病毒藉由注射或輸注遞送至心包空間。注射或輸注的重組病毒可藉由多種方法追蹤。舉例而言，經可偵測標記(諸如綠色螢光蛋白或β-半乳糖苷酶)標記或表現其的重組AAV可容易偵測。重組AAV可經工程改造以引起目標細胞表現標記物蛋白，諸如表面表現之蛋白質或螢光蛋白。或者，重組AAV感染目標細胞可根據細胞標記物的表現來偵測，用於測試的動物不表現該細胞標記物(例如當細胞注射至實驗動物時的人類特異性抗原)。目標細胞的存在及表型可藉由以下評估：螢光顯微法(例如根據綠色螢光蛋白或β-半乳糖苷酶)、免疫組織化學(例如使用針對人類抗原的抗體)、ELISA (使用針對人類抗原的抗體)，或使用引起擴增的引子及雜交條件進行RT-PCR分析，該擴增對於指示心臟表型之RNA而言具特異性。

在一些實施例中，本發明提供一種治療有需要之個體之心臟病變的方法，其包含投與治療有效量的本文所描述之rAAV病毒粒子。

在一些實施例中，本發明提供一種治療有需要之個體之心臟病變的方法，其包含投與治療有效量之含有蛋白殼蛋白的rAAV病毒粒子，其中蛋白殼蛋白為本文所描述之任何蛋白殼蛋白。

在一些實施例中，本發明提供一種治療有需要之個體之心臟病變的方法，其包含投與治療有效量之含有蛋白殼蛋白的rAAV病毒粒子，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%多肽序列一致性，及其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含： (a)胺基酸取代Q585E、S586N、A587T、Q588V、A589S、Q590I及N452K； (b)胺基酸取代S586T、A587L、Q588F、A589N、Q590S及N452K； (c)胺基酸取代Q585N、A587T、Q588Y、A589L、Q590G及N452K； (d)胺基酸取代Q585G、A587I、Q588L、A589T、Q590H及N452K； (e)胺基酸取代Q585M、S586M、A587T、Q588T、A589A及Q590R； (f)胺基酸取代Q585C、A587T、Q588S、A589I及Q590R，或 (g)胺基酸取代Q585N、A587T、Q588Y、A589L及Q590G。 醫藥組合物

本發明提供包含本發明之rAAV病毒粒子的醫藥組合物。醫藥組合物可包括醫藥學上可接受之載劑、稀釋劑、賦形劑及緩衝劑中之一或多者。在一些實施例中，醫藥學上可接受之載劑、稀釋劑、賦形劑或緩衝劑適用於人類。此類賦形劑、載劑、稀釋劑及緩衝劑包括可在無異常毒性的情況下投與的任何醫藥劑。醫藥學上可接受之賦形劑包括但不限於液體，諸如水、生理鹽水、甘油及乙醇。其中可包括醫藥學上可接受之鹽，例如無機酸鹽，諸如鹽酸鹽、氫溴酸鹽、磷酸鹽、硫酸鹽及其類似鹽；及有機酸鹽，諸如乙酸鹽、丙酸鹽、丙二酸鹽、苯甲酸鹽及其類似鹽。另外，此類媒劑中可存在助劑，諸如pH緩衝物質。醫藥學上可接受之多種賦形劑在此項技術中已知且在本文中不一定詳細論述。醫藥學上可接受之賦形劑已充分描述於多個出版物中，包括例如A. Gennaro (2000) Remington: The Science and Practice of Pharmacy, 第20版, Lippincott, Williams, & Wilkins ； Pharmaceutical Dosage Forms and Drug Delivery Systems(1999) H.C. Ansel等人 ., eds., 第7版, Lippincott, Williams, & Wilkins；and Handbook of Pharmaceutical Excipients(2000) A.H. Kibbe等人 ., eds., 第3版. Amer. Pharmaceutical Assoc。

為了製備組合物，產生rAAV病毒粒子且視需要或必要時加以純化。可將rAAV與醫藥學上可接受之載劑混合或懸浮於醫藥學上可接受之載劑中。此等rAAV可調節至適當濃度且視情況與其他藥劑組合。單位劑型中所包括之rAAV病毒粒子及/或其他藥劑的濃度可廣泛變化。投與的劑量及次數可由熟習此項技術者最佳化。舉例而言，可投與約10 ²至10 ¹⁰個載體基因體(vg)。在一些實施例中，劑量為至少約10 ²vg、約10 ³vg、約10 ⁴vg、約10 ⁵vg、約10 ⁶vg、約10 ⁷vg、約10 ⁸vg、約10 ⁹vg、約10 ¹⁰vg或更多個載體基因體。化合物之日劑量亦可變化。此類日劑量的範圍可為例如至少約10 ²vg/天、約10 ³vg/天、約10 ⁴vg/天至約10 ⁵vg/天、約10 ⁶vg/天、約10 ⁷vg/天、約10 ⁸vg/天、約10 ⁹vg/天、約10 ¹⁰vg/天或更多個載體基因體/天。

在某些實施例中，治療方法係藉由投與一或多種消炎劑(例如消炎類固醇或非類固醇消炎藥(NSAID))來增強。

用於本發明的消炎類固醇包括皮質類固醇，尤其是具有糖皮質激素活性的彼等物，例如地塞米松(dexamethasone)及普賴松(prednisone)。用於本發明之非類固醇消炎藥(NSAID)的作用一般為阻斷引起炎症及疼痛的前列腺素、環加氧酶-1 (COX-1)及/或環加氧酶-2 (COX-2)產生。傳統NSAID起著阻斷COX-1與COX-2的作用。COX-2選擇性抑制劑僅阻斷COX-2酶。在某些實施例中，NSAID為COX-2選擇性抑制劑，例如塞內昔布(celecoxib)(Celebrex ^®)、羅非昔布(rofecoxib)(Vioxx)及伐地昔布(valdecoxib)(B extra)。在某些實施例中，消炎劑為NSAID前列腺素抑制劑，例如吡羅昔康(Piroxicam)。

用於治療之rAAV病毒粒子的量不僅將隨著所選擇之特定載劑而變化，而且隨著投與途徑、所治療之病狀之性質及患者之年齡及狀況而變化。最終，巡診的健康照護提供者可確定適當劑量。可依各化合物於單一單位劑型中之適當比率來調配醫藥組合物，以便在細胞存在或不存在下投與。可分別提供細胞或載體且與化合物組合物之液態溶液混合或分開投與。

重組AAV可經調配以便非經腸投與(例如注射，例如推注注射或連續輸注)且可以單位劑型提供於安瓿、預填充注射器、小體積輸注容器或額外存在防腐劑之多劑量容器中。醫藥組合物可採取油性或水性媒劑中之懸浮液、溶液或乳液形式，且可含有調配劑，諸如懸浮劑、穩定劑及/或分散劑。適合的載劑包括生理鹽水溶液、磷酸鹽緩衝鹽水及此項技術中常用之其他物質。

組合物亦可含有其他成分，諸如適用於治療心臟疾病、病狀及損傷之藥劑，諸如抗凝血劑(例如達肝素(dalteparin)(法安明(fragmin))、達那肝素(danaparoid)(奧甲南(orgaran))、依諾肝素(enoxaparin)(洛維諾西(lovenox))、肝素、亭紮肝素(tinzaparin)(茵諾普(innohep))及/或華法林(warfarin)(可邁丁(coumadin)))；抗血小板劑(例如阿司匹靈(aspirin)、噻氯匹定(ticlopidine)、克羅匹多(clopidogrel)或雙吡大莫(dipyridamole))；血管收縮素轉化酶抑制劑(例如貝那普利(Benazepril)(洛汀新(Lotensin))、卡托普利(Captopril)(開博通(Capoten))、依那普利(Enalapril)(Vasotec)、福辛普利(Fosinopril) (蒙諾普利(Monopril))、賴諾普利(Lisinopril)(Prinivil、Zestril)、莫西普利(Moexipril)(Univasc)、培哚普利(Perindopril)(Aceon)、喹那普利(Quinapril)(Accupril)、雷米普利(Ramipril)(Altace)及/或群多普利(Trandolapril)(Mavik))；血管收縮素II受體阻斷劑(例如坎地沙坦(Candesartan)(Atacand)、依普羅沙坦(Eprosartan)(Teveten)、依貝沙坦(Irbesartan)(Avapro)、洛沙坦(Losartan)(Cozaar)、替米沙坦(Telmisartan)(Micardis)及/或纈沙坦(Valsartan)(Diovan))；β阻斷劑(例如醋丁洛爾(Acebutolol)(Sectral)、阿替洛爾(Atenolol)(Tenormin)、倍他洛爾(Betaxolol)(Kerlone)、比索洛爾/氫氯噻嗪(Bisoprolol/hydrochlorothiazide)(Ziac)、比索洛爾(Bisoprolol)(Zebeta)、卡替洛爾(Carteolol)(Cartrol)、美托洛爾(Metoprolol)(Lopressor；Toprol XL)、納多洛爾(Nadolol)(Corgard)、普萘洛爾(Propranolol)(Inderal)、索他洛爾(Sotalol)(Betapace)及/或噻嗎洛爾(Timolol)(Blocadren))；鈣離子通道阻斷劑(例如胺氯地平(Amlodipine)(Norvasc；Lotrel)、苄普地爾(Bepridil)(Vascor)、地爾硫卓(Diltiazem)(Cardizem；Tiazac)、非洛地平(Felodipine)(Plendil)、硝苯地平(Nifedipine)(Adalat；Procardia)、尼莫地平(Nimodipine)(Nimotop)、尼索地平(Nisoldipine)(Sular)、維拉帕米(Verapamil)(Calan；Isoptin；Verelan)；利尿劑(例如胺氯吡脒(Amiloride)(Midamor)、布美他尼(Bumetanide)(Bumex)、氯噻嗪(Chlorothiazide)(Diuril)、氯噻酮(Chlorthalidone)(Hygroton)、呋喃苯胺酸(Furosemide)(Lasix)、氫氯噻嗪(Hydro-chlorothiazide)(Esidrix；Hydrodiuril)、吲達帕胺(Indapamide)(Lozol)及/或螺內酯(Spironolactone)(Aldactone))；血管擴張劑(例如二硝酸異山梨醇(Isordil)、奈西立肽(Nesiritide)(Natrecor)、聯胺肼(Hydralazine)(Apresoline)、硝酸鹽及/或敏樂定(Minoxidil))；抑制素(statins)；菸鹼酸、吉非羅齊(gemfibrozil)、氯貝特(clofibrate)、地高辛(Digoxin)、洋地黃毒苷(Digitoxin)、拉諾辛(Lanoxin)或其任何組合。

亦可包括其他藥劑，諸如抗菌劑、抗微生物劑、抗病毒劑、生物反應調節劑、生長因子；免疫調節劑、單株抗體及/或防腐劑。本發明之組合物亦可結合其他治療形式使用。

本文所描述之rAAV病毒粒子可投與個體以治療疾病或病症。此類組合物可以單次劑量、多次劑量、以連續或間歇方式投與，此視例如以下因素而定：接受者之生理學狀況、投藥目的是否對創傷性損傷有反應或是否用於更持久的治療目的，及熟練從業者已知的其他因素。本發明之化合物及組合物的投與可在預選的時段內基本上為連續的或可呈一系列間隔劑量形式。考慮局部及全身投與兩者。在一些實施例中，rAAV病毒粒子實現局部遞送。在一些實施例中，rAAV病毒粒子的局部遞送係用於在心臟內產生細胞群。在一些實施例中，此類局部群體充當心臟之「節律器細胞」。在一些實施例中，rAAV病毒粒子係用於產生、再生、修復、置換及/或復蘇竇房(SA)結、房室(AV)結、希氏束(bindle of His)及/或浦金耶氏纖維(Purkinje fibers)中之一或多者。

為了控制張力，水性醫藥組合物可包含生理鹽，諸如鈉鹽。較佳為氯化鈉(NaCl)，其可以1 mg/ml至20 mg/ml存在。可存在的其他鹽包括氯化鉀、磷酸二氫鉀、磷酸氫二鈉脫水物、氯化鎂及氯化鈣。

組合物可包括一或多種緩衝劑。典型的緩衝劑包括：磷酸鹽緩衝劑；Tris緩衝劑；硼酸鹽緩衝劑；丁二酸鹽緩衝劑；組胺酸緩衝劑或檸檬酸鹽緩衝劑。緩衝劑典型地以5至20 mM範圍內的濃度包括在內。組合物的pH一般介於5與8之間，且更典型地介於6與8之間，例如6.5與7.5之間或7.0與7.8之間。

組合物較佳為無菌的。組合物較佳不含麩質。組合物較佳不熱解。

在一些實施例中，包含細胞的組合物可包括低溫保護劑。低溫保護劑之非限制性實例包括二醇(例如乙二醇、丙二醇及丙三醇)、二甲亞碸(DMSO)、甲醯胺、蔗糖、海藻糖、右旋糖及其任何組合。

含有rAAV病毒粒子之組合物中亦可存在一或多種以下類型的化合物：WNT促效劑、GSK3抑制劑、TGF-β傳訊抑制劑、表觀遺傳修飾劑、LSD1抑制劑、腺苷酸環化酶促效劑或其任何組合。套組

本文描述包括本文所描述之任一種組合物(例如rAAV病毒粒子)的多種套組。套組可包括本文所描述之組合物中之任一者，其混合在一起或個別地封裝且呈乾燥或水合形式。本文所描述之rAAV病毒粒子及/或其他藥劑可分別封裝於離散的小瓶、瓶子或其他容器中。或者，本文所描述之rAAV病毒粒子及/或藥劑中的任一者可以單一組合物形式封裝在一起，或作為可一起使用或分開使用的兩種或更多種組合物封裝。本文所描述之化合物及/或藥劑可以適當比率及/或量封裝，以促進跨越分化界限之所選細胞轉化，從而形成心臟祖細胞及/或心肌細胞。

套組可包括彼等組合物、化合物及/或藥劑之投與說明書。此類說明書可提供本申請案中所述的資訊。rAAV病毒粒子或醫藥組合物可提供於呈遞送裝置之形式的任何套組內。或者，遞送裝置可分開包括於套組中，且說明書可描述在投與個體之前如何組裝遞送裝置。

任何套組亦可包括注射器、導管、手術刀、用於收集樣品或細胞的無菌容器、稀釋劑、醫藥學上可接受之載劑及其類似物。套組可提供其他因子，諸如本文在申請案之以上章節或其他部分中關於組合物所描述的任一種補充因子或藥物。 例示性實施例

在一些實施例中，一種重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%、至少85%、至少90%或至少95%胺基酸序列一致性或包含與該參考序列具有至少80%、至少85%、至少90%或至少95%胺基酸序列一致性的序列，且其中該蛋白殼蛋白包含SEQ ID NO: 487之VR-III位點中之一或多個修飾及/或VR-IV位點中之一或多個修飾。

在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白。在一些實施例中，本發明提供包括本文所描述之rAAV蛋白殼蛋白的rAAV病毒粒子。在一些實施例中，rAAV蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%、至少85%、至少90%或至少95%胺基酸序列一致性，且相對於參考序列SEQ ID NO: 1包含胺基酸取代N452K。

在一些實施例中，本發明提供重組腺相關病毒(rAAV)蛋白殼蛋白。在一些實施例中，蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%、至少85%、至少90%、或至少95%胺基酸序列一致性，及其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585E、S586N、A587T、Q588V、A589S、Q590I及N452K。在一些實施例中，蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%、至少85%、至少90%或至少95%胺基酸序列一致性，且其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代S586T、A587L、Q588F、A589N、Q590S及N452K。在一些實施例中，蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%、至少85%、至少90%、或至少95%胺基酸序列一致性，及其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585N、A587T、Q588Y、A589L、Q590G及N452K。在一些實施例中，蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%、至少85%、至少90%、或至少95%胺基酸序列一致性，及其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585G、A587I、Q588L、A589T、Q590H及N452K。在一些實施例中，蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%、至少85%、至少90%、或至少95%胺基酸序列一致性，及其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585N、A587T、Q588Y、A589L及Q590G。在一些實施例中，蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%、至少85%、至少90%、或至少95%胺基酸序列一致性，及其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585M、S586M、A587T、Q588T、A589A及Q590R。在一些實施例中，蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%、至少85%、至少90%、或至少95%胺基酸序列一致性，及其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585C、Q586S、A587T、Q588S、A589I及Q590R。

在一些實施例中，蛋白殼蛋白包含與選自由SEQ ID NOs: 488-589、705-710及767-780組成之群的胺基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%序列一致性的胺基酸序列。在一些實施例中，蛋白殼蛋白包含與選自由SEQ ID NOs: 488-589、705-710及767-780組成之群的胺基酸序列具有至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%序列一致性的胺基酸序列，除各別序列中已提供之位點以外，VR-VIII位(或VR-VIII及VR-IV位)無任何變化。

在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 705。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 706。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 707。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 708。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 512。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 539。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 589。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 488。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 499。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 504。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 505。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 506。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 510。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 513。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 516。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 518。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 521。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 522。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 533。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 536。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 558。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 562。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 566。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 571。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 576。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 578。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 579。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 580。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 581。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 585。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 588。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 710。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 772。在一些實施例中，蛋白殼蛋白包含SEQ ID NO: 774。在一些實施例中，本文中提及之蛋白殼蛋白可進一步包含至多一、二、三、四、五、六、七、八、九、十、十五、二十、二十五、三十、三十五、四十或五十個取代或插入(例如，如本文所描述或保守性取代)。

在一些實施例中，蛋白殼蛋白包含與蛋白殼蛋白中之任一者相同的取代模體(例如，相同的VR-VIII及/或相同的VR-IV取代模體)，該等蛋白殼蛋白選自由以下組成之群：SEQ ID NOs: 512、589、772、774、705、513、710、488、707及539。在一些實施例中，蛋白殼蛋白包含與蛋白殼蛋白中之任一者相同的取代模體(例如，相同的VR-VIII及/或相同的VR-IV取代模體)，該等蛋白殼蛋白選自由以下組成之群：SEQ ID NOs: 488、499、504、505、506、510、512、513、516、518、521、522、533、536、539、558、562、566、571、576、578、579、580、581、585、588、589、705、706、707、708、710、772及774。

在一些實施例中，蛋白殼蛋白為如本文所提供之ZC377。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC388。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC393。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC394。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC395。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC399。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC401。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC402。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC405。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC407。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC410。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC411。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC422。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC425。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC428。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC447。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC451。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC455。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC460。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC465。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC467。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC468。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC469。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC470。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC474。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC477。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC478。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC373。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC374。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC375。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC376。在一些實施例中，蛋白殼蛋白為如本文所提供之ACE10。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC536。在一些實施例中，蛋白殼蛋白為如本文所提供之ZC538。在一些實施例中，本文中提及之蛋白殼蛋白可進一步包含至多一、二、三、四、五、六、七、八、九、十、十五、二十、二十五、三十、三十五、四十或五十個取代或插入(例如，如本文所描述或保守性取代)。

在一些實施例中，蛋白殼蛋白包含與蛋白殼蛋白中之任一者相同的取代模體(例如，相同的VR-VIII及/或相同的VR-IV取代模體)，該等蛋白殼蛋白選自由以下組成之群：ZC401、ZC478、ZC536、ZC538、ZC373、ZC402、ACE10、ZC377、ZC375及ZC428。在一些實施例中，蛋白殼蛋白包含與蛋白殼蛋白中之任一者相同的取代模體(例如，相同的VR-VIII及/或相同的VR-IV取代模體)，該等蛋白殼蛋白選自由以下組成之群：ZC401、ZC478、ZC536、ZC538、ZC373、ZC402、ACE10、ZC377、ZC375、ZC428、ZC374、ZC376、ZC393、ZC394、ZC395、ZC399、ZC405、ZC407、ZC410、ZC411、ZC422、ZC425、ZC447、ZC451、ZC455、ZC460、ZC467、ZC468、ZC469、ZC470、ZC474、ZC477、ZC388及ZC465。

在一些實施例中，蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%、至少85%、至少90%、或至少95%胺基酸序列一致性，及該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置585-590處之胺基酸取代SEQ ID NO: 719 (ENTVSI)。

在一些實施例中，蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%、至少85%、至少90%、或至少95%胺基酸序列一致性，及該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置585-590處之胺基酸取代SEQ ID NO: 720 (QTLFNS)。

在一些實施例中，蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%、至少85%、至少90%、或至少95%胺基酸序列一致性，及該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置585-590處之胺基酸取代SEQ ID NO: 721 (NSTYLG)。

在一些實施例中，蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%、至少85%、至少90%、或至少95%胺基酸序列一致性，及該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置585-590處之胺基酸取代SEQ ID NO: 722 (GSILTH)。

在一些實施例中，蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%、至少85%、至少90%、或至少95%胺基酸序列一致性，及該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置585-590處之胺基酸取代SEQ ID NO: 723 (MMTTAR)。

在一些實施例中，蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%、至少85%、至少90%、或至少95%胺基酸序列一致性，及該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置585-590處之胺基酸取代SEQ ID NO: 724 (CSTSIR)。

此例示性實施例部分及編號實施例部分中所描述之蛋白殼蛋白可用於任一實施例(例如，病毒粒子、組合物、細胞及方法中之任一者)及與本文中指定之任何其他特徵組合。 編號實施例 I

1.一種重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%胺基酸序列一致性或包含與該參考序列具有至少80%胺基酸序列一致性的序列，且其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置584處之胺基酸插入，其包含天冬醯胺酸(N)、蘇胺酸(T)、酪胺酸(Y)、苯丙胺酸(F)及丙胺酸(A)中之一或多者；在位置585處之胺基酸插入，其包含組胺酸(H)及甲硫胺酸(M)中之一或多者；在位置586處之胺基酸插入，其包含組胺酸(H)、酪胺酸(Y)、纈胺酸(V)、蘇胺酸(T)、丙胺酸(A)、異白胺酸(I)、色胺酸(W)、甲硫胺酸(M)及白胺酸中之一或多者；在位置587處之胺基酸插入，其包含異白胺酸(I)及脯胺酸(P)中之一或多者；在位置588處之胺基酸插入，其包含異白胺酸(I)、蘇胺酸(T)及脯胺酸(P)中之一或多者；在位置589處之胺基酸插入，其包含甘胺酸(G)及麩醯胺酸(Q)中之一或多者；一或多個選自由以下組成之群的胺基酸取代：N452K、N452A、N452V、G453A、G453N、S454T、S454D、G455N、Q456L、Q456K、N457L、N457V、Q458I及Q458H；及/或一或多個選自由以下組成之群的胺基酸取代：T582D、T582L、T582E、T582A、T582F、T582R、T582P、N583V、N583T、H584R、H584Q、H584K、H584V、H584Y、H584M、H584T、H584W、H584E、H584D、Q585T、Q585C、Q585V、Q585L、Q585N、Q585S、Q585P、Q585A、Q585M、Q585E、Q585Y、Q585G、Q585H、Q585I、S586D、S586T、S586G、S586K、S586M、S586N、S586I、S586Q、S586L、S586P、S586F、S586R、A587F、A587S、A587T、A587N、A587L、A587P、A587V、A587K、A587I、A587R、A587H、A587G、A587M、A587D、A587W、Q588L、Q588S、Q588F、Q588N、Q588G、Q588R、Q588I、Q588V、Q588T、Q588Y、Q588H、Q588M、Q588K、Q588D、A589R、A589I、A589N、A589S、A589V、A589Q、A589F、A589T、A589K、A589H、A589E、A589W、A589L、A589Y、A589M、Q590I、Q590S、Q590N、Q590G、Q590D、Q590R、Q590H、Q590T、Q590M、Q590F、Q590Y、Q590L、A591I、G594Q及G594D。

2.如實施例1之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置584處之胺基酸插入，其包含天冬醯胺酸(N)、蘇胺酸(T)、酪胺酸(Y)、苯丙胺酸(F)及丙胺酸(A)中之一或多者。

3.如實施例1或實施例2之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置585處之胺基酸插入，其包含組胺酸(H)及甲硫胺酸(M)中之一或多者。

4.如實施例1至3中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置586處之胺基酸插入，其包含組胺酸(H)、酪胺酸(Y)、纈胺酸(V)、蘇胺酸(T)、丙胺酸(A)、異白胺酸(I)、色胺酸(W)、甲硫胺酸(M)及白胺酸中之一或多者。

5.如實施例1-4中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置587處之胺基酸插入，其包含異白胺酸(I)及脯胺酸(P)中之一或多者。

6.如實施例1-5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置588處之胺基酸插入，其包含異白胺酸(I)、蘇胺酸(T)及脯胺酸(P)中之一或多者

7.如實施例1-6中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置589處之胺基酸插入，其包含甘胺酸(G)及麩醯胺酸(Q)中之一或多者。

8.如實施例1-7中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置584處之由以下組成的胺基酸插入：TY、FN或AT。

9.如實施例1-8中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置585處之由以下組成的胺基酸插入：MH。

10.如實施例1-9中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置586處之由以下組成的胺基酸插入：HY、VT、AI、WM或ML。

11.如實施例1-10中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置587處之由以下組成的胺基酸插入：PI。

12.如實施例1-11中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置588處之由以下組成的胺基酸插入：IT或PT。

13.如實施例1-12中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含一或多個選自由以下組成之群的胺基酸取代：N452K、N452A、N452V、G453A、G453N、S454T、S454D、G455N、Q456L、Q456K、N457L、N457V、Q458I及Q458H。

14.如實施例1-13中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含一或多個選自由以下組成之群的胺基酸取代：T582D、T582E、N583V、H584Q、S586K、A587P、A587S、Q588G、Q588M、A589S、A591I、G594Q及G594D。

15.如實施例1-14中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含一或多個選自由以下組成之群的胺基酸取代：T582L、T582A、T582F、T582R、T582P、H584R、H584K、H584V、H584Y、H584M、H584Q、H584W、H584E、H584D、Q585T、Q585N、Q585M、Q585E、Q585V、Q585H、S586T、S586G、S586Q、S586I、S586L、S586F、S586D、S586R、S586M、A587F、A587I、A587H、A587M、A587N、A587W、Q588Y、Q588S、Q588T及Q588R。

16.如實施例1-15中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含一或多個選自由以下組成之群的胺基酸取代：Q585C、Q585S、S586I、A587V及A587G。

17.如實施例1-16中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含一或多個選自由以下組成之群的胺基酸取代：Q585V、Q585T、Q585L、Q585C、Q585N、Q585S、Q585M、Q585E、Q585P、Q585A、Q585G、Q585H、Q585I、S586D、S586G、S586T、S586M、S586N、S586L、S586R、S586I、S586K、A587S、A587T、A587N、A587L、A587V、A587K、A587I、A587F、A587P、A587R、A587D、Q588L、Q588S、Q588F、Q588N、Q588R、Q588I、Q588V、Q588T、Q588H、Q588Y、Q588M、Q588K、Q588D、Q588G、A589R、A589I、A589N、A589S、A589V、A589Q、A589F、A589T、A589K、A589H、A589E、A589W、A589L、A589Y、A589M、Q590I、Q590S、Q590N、Q590G、Q590D、Q590R、Q590H、Q590T、Q590M、Q590F、Q590Y及Q590L。

18.如實施例1-17中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含選自SEQ ID NO: 599-692之胺基酸序列，且其中蛋白殼蛋白與SEQ ID NO: 496-589具有至少80%、至少90%、至少95%、至少98%或100%一致性。

19.如實施例1-18中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置586-589或在大致位置586-589處之胺基酸序列ANYG。

20.如實施例1-19中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含兩個或更多個選自由以下組成之群的胺基酸取代：N452K、N452A、N452V、G453A、G453N、S454T、S454D、G455N、Q456L、Q456K、N457L、N457V、Q458I及Q458H。

21.如實施例1-20中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代N452K、N452A或N452V。

22.如實施例21之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代N452K。

23.如實施例1-22中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代G453A或G453N。

24.如實施例1-23中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代S454T或S454D。

25.如實施例1-24中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代G455N。

26.如實施例1-25中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q456L或Q456K。

27.如實施例1-26中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代N457L或N457V。

28.如實施例1-27中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q458I或Q458H。

29.如實施例1-28中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置452-458或在大致位置452-458處之選自以下之胺基酸序列：KGSGQNQ (SEQ ID NO: 590)、NASGQNQ (SEQ ID NO: 591)、NGTGQNQ (SEQ ID NO: 592)、NGSGLNQ (SEQ ID NO: 593)、ANDNKLI (SEQ ID NO: 594)、VNDNKVI (SEQ ID NO: 595)、NGSGQNH (SEQ ID NO: 596)及ANDNKVI (SEQ ID NO: 597)，且其中該蛋白殼蛋白與SEQ ID NOs: 488-495具有至少80%、至少90%、至少95%、至少98%或100%一致性，且其中視情況該蛋白殼蛋白在位置586-589或在大致位置586-589處之胺基酸序列ANYG。

30.一種重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%胺基酸序列一致性或包含與該參考序列具有至少80%胺基酸序列一致性的序列，且其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代N452K。

31.如實施例1-30中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：

在位置585處之選自以下之胺基酸：E、N、G、M、C、V、T及Q；

在位置586處之選自以下之胺基酸：N、T、M、G、D及S；

在位置587處之選自以下之胺基酸：T、L、I、K、S、N、V及A；

在位置588處之選自以下之胺基酸：V、F、Y、L、T、S、I、R及Q；

在位置589處之選自以下之胺基酸：S、N、L、T、I、R及A；及/或

在位置590處之選自以下之胺基酸：I、S、G、H、R及Q。

32.如實施例1-31中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：

在位置585處之選自以下之胺基酸：E、N、G、M、C、V及T；

在位置586處之選自以下之胺基酸：N、T、M、G、D及N；

在位置587處之選自以下之胺基酸：T、L、I、K、S、N及V；

在位置588處之選自以下之胺基酸：V、F、Y、L、T、S、I及R；

在位置589處之選自以下之胺基酸：S、N、L、T、I及R；及/或

在位置590處之選自以下之胺基酸：I、S、G、H及R。

33.如實施例1-32中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585E、S586N、A587T、Q588V、A589S、Q590I及N452K。

34.如實施例1-32中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代S586T、A587L、Q588F、A589N、Q590S及N452K。

35.如實施例1-32中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585N、A587T、Q588Y、A589L、Q590G及N452K。

36.如實施例1-32中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585G、A587I、Q588L、A589T、Q590H及N452K。

37.如實施例1-32中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585M、S586M、A587T、Q588T及Q590R。

38.如實施例1-32中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585N、A587T、Q588Y、A589L及Q590G。

39.如實施例1-32中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585C、A587T、Q588S、A589I及Q590R。

40.一種重組腺相關病毒(rAAV)病毒粒子，其包含如實施例1至39中任一項之蛋白殼蛋白及載體基因體，該載體基因體包含側接有反向末端重複序列(ITR)之聚核苷酸卡匣。

41.如實施例40之rAAV病毒粒子，其中該rAAV病毒粒子轉導心臟細胞。

42.如實施例40或實施例41之rAAV病毒粒子，其中該rAAV病毒粒子轉導心肌細胞。

43.如實施例40至42中任一項之rAAV病毒粒子，其中該rAAV病毒粒子運輸至除肝臟以外之至少一個器官。

44.如實施例40-43中任一項之rAAV病毒粒子，其中該rAAV病毒粒子運輸至心臟。

45.如實施例40-44中任一項之rAAV病毒粒子，其中該rAAV病毒粒子展現的心臟轉導效率高於具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白的rAAV病毒粒子。

46.如實施例40-45中任一項之rAAV病毒粒子，其中該rAAV病毒粒子展現出比具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白的rAAV病毒粒子更高的心臟/肝臟轉導比率，視情況高至少2、3、4、5、6、7、8、9或10倍。

47.如實施例40-46中任一項之rAAV病毒粒子，其中向個體投與該rAAV病毒粒子引起比投與具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白之rAAV病毒粒子更低的肝臟病毒負荷，視情況低至少2、3、4、5、6、7、8、9或10倍。

48.如實施例40-47中任一項之rAAV病毒粒子，其中在靈長類動物中評估之該rAAV病毒粒子展現出與具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白的rAAV病毒粒子相比更高的轉導效率，視情況更高的心臟轉導效率。

49.如實施例40-48中任一項之rAAV病毒粒子，其中在靈長類動物中評估之該rAAV病毒粒子展現出與具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白的rAAV病毒粒子相比更高的心臟/肝臟轉導比率，視情況高至少2、3、4、5、6、7、8、9或10倍。

50.如實施例40-49中任一項之rAAV病毒粒子，其中在靈長類動物中評估之向個體投與該rAAV病毒粒子引起比投與具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白之rAAV病毒粒子更低的肝臟病毒負荷，視情況低至少2、3、4、5、6、7、8、9或10倍。

51.如實施例40-50中任一項之rAAV病毒粒子，其中該聚核苷酸卡匣包含編碼以下之聚核苷酸序列：MYBPC3、DWORF、KCNH2、TRPM4、DSG2、TGFBR2、TGFBR1、EMD、KCNQ1、TAZ、COL3A1、JUP、CASQ2、MLRP44、DNAJC19、LMNA、TNNI3、DSP、DSG2、RAF1、SOS1、FBN1、LAMP2、FXN、RAF1、BAG3、KCNQ1、MYLK3、CRYAB、ALPK3、ACTN2、JPH2、PLN及/或ATP2A2。

52.如實施例40-50中任一項之rAAV病毒粒子，其中該聚核苷酸卡匣包含編碼以下之聚核苷酸序列：CACNA1C、DMD、DMPK、EPG5、EVC、EVC2、FBN1、NF1、SCN5A、SOS1、NPR1、ERBB4、VIP、MYH7及/或Cas9。

53.如實施例40-50中任一項之rAAV病毒粒子，其中該聚核苷酸卡匣包含編碼以下之聚核苷酸序列：MYOCD、ASCL1、GATA4、MEF2C、TBX5、miR-133及/或MESP1。

54.一種醫藥組合物，其包含如實施例40至53中任一項之rAAV病毒粒子及醫藥學上可接受之載劑。

55.一種聚核苷酸，其編碼如實施例1至39中任一項之蛋白殼蛋白。

56.一種轉導心臟細胞之方法，其包含使該心臟細胞與如實施例40至53中任一項之rAAV病毒粒子接觸，其中該rAAV病毒粒子轉導該心臟細胞。

57.如實施例56之方法，其中該心臟細胞為心肌細胞。

58.如實施例56或實施例57之方法，其中該rAAV病毒粒子展現的細胞之轉導效率高於具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白的rAAV病毒粒子。

59.一種向心臟細胞遞送一或多種基因產物之方法，其包含使該心臟細胞與如實施例40至53中任一項之rAAV病毒粒子接觸。

60.如實施例59之方法，其中該心臟細胞為心肌細胞。

61.一種治療有需要之個體之心臟病理的方法，其包含向該個體投與治療有效量之如實施例40至53中任一項之rAAV病毒粒子，其中該rAAV病毒粒子轉導心臟組織。

62.一種套組，其包含如實施例54之醫藥組合物及使用說明書。 編號實施例 II

1.一種編碼腺相關病毒(rAAV)蛋白殼蛋白之經工程化聚核苷酸，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%胺基酸序列一致性或包含與該參考序列具有至少80%胺基酸序列一致性的序列，且其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置584或位置583及584之間處之胺基酸插入，其包含天冬醯胺酸(N)、蘇胺酸(T)、酪胺酸(Y)、苯丙胺酸(F)及丙胺酸(A)中之一或多者；在位置585或位置584及585之間處之胺基酸插入，其包含組胺酸(H)及甲硫胺酸(M)中之一或多者；在位置586或位置585及586之間處之胺基酸插入，其包含組胺酸(H)、酪胺酸(Y)、纈胺酸(V)、蘇胺酸(T)、丙胺酸(A)、異白胺酸(I)、色胺酸(W)、甲硫胺酸(M)及白胺酸(L)中之一或多者；在位置587或位置586及587之間處之胺基酸插入，其包含異白胺酸(I)及脯胺酸(P)中之一或多者；在位置588或位置587及588之間處之胺基酸插入，其包含異白胺酸(I)、蘇胺酸(T)及脯胺酸(P)中之一或多者；在位置589或位置588及589之間處之胺基酸插入，其包含甘胺酸(G)及麩醯胺酸(Q)中之一或多者；一或多個選自由以下組成之群的胺基酸取代：N452K、N452A、N452V、N452I、G453A、G453N、S454T、S454D、G455N、Q456L、Q456K、N457L、N457V、Q458I及Q458H；及/或一或多個選自由以下組成之群的胺基酸取代：T582D、T582L、T582E、T582A、T582F、T582R、T582P、N583V、N583T、H584R、H584Q、H584K、H584V、H584Y、H584M、H584T、H584W、H584E、H584D、Q585T、Q585C、Q585V、Q585L、Q585N、Q585S、Q585P、Q585A、Q585M、Q585E、Q585Y、Q585G、Q585H、Q585I、S586D、S586T、S586G、S586K、S586M、S586N、S586I、S586Q、S586L、S586P、S586F、S586R、A587F、A587S、A587T、A587N、A587L、A587P、A587V、A587K、A587I、A587R、A587H、A587G、A587M、A587D、A587W、Q588L、Q588S、Q588F、Q588N、Q588G、Q588R、Q588I、Q588V、Q588T、Q588Y、Q588H、Q588M、Q588K、Q588D、A589R、A589I、A589N、A589S、A589V、A589Q、A589F、A589T、A589K、A589H、A589E、A589W、A589L、A589Y、A589M、Q590I、Q590S、Q590N、Q590G、Q590D、Q590R、Q590H、Q590T、Q590M、Q590F、Q590Y、Q590L、A591I、G594Q及G594D。

2.如實施例1之聚核苷酸，其中該蛋白殼蛋白在VR-VIII位點處包含一個、兩個、三個、四個或更多個取代或插入。

3.如實施例2之聚核苷酸，其中該蛋白殼蛋白相對於參考SEQ ID NO:1包含在該VR-VIII位點中之584至590位置處之一個、兩個、三個、四個或更多個取代或插入，或包含在該VR-VIII位點中之585至590位置處之一個、兩個、三個、四個或更多個取代或插入。

4.如實施例1至3中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含： (i)一或多個選自由以下組成之群的胺基酸取代：T582D、T582E、N583V、H584Q、S586K、A587P、A587S、Q588G、Q588M、A589S、A591I、G594Q及G594D； (ii)一或多個選自由以下組成之群的胺基酸取代：T582L、T582A、T582F、T582R、T582P、H584R、H584K、H584V、H584Y、H584M、H584Q、H584W、H584E、H584D、Q585T、Q585N、Q585M、Q585E、Q585V、Q585H、S586T、S586G、S586Q、S586I、S586L、S586F、S586D、S586R、S586M、A587F、A587I、A587H、A587M、A587N、A587W、Q588Y、Q588S、Q588T及Q588R； (iii)一或多個選自由以下組成之群的胺基酸取代：Q585C、Q585S、S586I、A587V及A587G；或 (iv)一或多個選自由以下組成之群的胺基酸取代：Q585V、Q585T、Q585L、Q585C、Q585N、Q585S、Q585M、Q585E、Q585P、Q585A、Q585G、Q585H、Q585I、S586D、S586G、S586T、S586M、S586N、S586L、S586R、S586I、S586K、A587S、A587T、A587N、A587L、A587V、A587K、A587I、A587F、A587P、A587R、A587D、Q588L、Q588S、Q588F、Q588N、Q588R、Q588I、Q588V、Q588T、Q588H、Q588Y、Q588M、Q588K、Q588D、Q588G、A589R、A589I、A589N、A589S、A589V、A589Q、A589F、A589T、A589K、A589H、A589E、A589W、A589L、A589Y、A589M、Q590I、Q590S、Q590N、Q590G、Q590D、Q590R、Q590H、Q590T、Q590M、Q590F、Q590Y及Q590L。

5.如實施例1-4中任一項之聚核苷酸，其中該蛋白殼蛋白：(i)具有心臟向性；(ii)相較於親本序列，在心臟細胞中展現出增加的轉導效率；(iii)相較於親本序列，在肝臟細胞中展現出降低的轉導效率；及/或(iv)相較於親本序列，對心臟細胞而非對肝臟細胞展現出增加的選擇性。

6.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含一或多個選自由以下組成之群的胺基酸取代：N452K、N452A、N452V、N452I、G453A、G453N、S454T、S454D、G455N、Q456L、Q456K、N457L、N457V、Q458I及Q458H。

7.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置452處選自由以下組成之群的胺基酸：K及N。

8.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代N452K。

9.如實施例1-8中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置584處選自由以下組成之群的胺基酸：R及H；在位置585處選自由以下組成之群的胺基酸：N、M、C、E、G、S、V、A、T、H、L及Q；在位置586處選自由以下組成之群的胺基酸：M、D、N、G、A、T、R、I及S；在位置587處選自由以下組成之群的胺基酸：T、N、V、L、I、S、R、P及A；在位置588處選自由以下組成之群的胺基酸：Y、T、S、I、V、F、L、R、N、D、G及Q；在位置589處選自由以下組成之群的胺基酸：L、I、R、S、G、N、T、V、Q、F、E、Y及A；及/或在位置590處選自由以下組成之群的胺基酸：G、R、S、I、H、N、Y、L、M及Q。

10.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；在位置584處選自由以下組成之群的胺基酸：R及H；在位置585處選自由以下組成之群的胺基酸：N、M、C、E、G、S、V、A、T、H、L及Q；在位置586處選自由以下組成之群的胺基酸：M、D、N、G、A、T、R、I及S；在位置587處選自由以下組成之群的胺基酸：T、N、V、L、I、S、R、P及A；在位置588處選自由以下組成之群的胺基酸：Y、T、S、I、V、F、L、R、N、D、G及Q；在位置589處選自由以下組成之群的胺基酸：L、I、R、S、G、N、T、V、Q、F、E、Y及A；及在位置590處選自由以下組成之群的胺基酸：G、R、S、I、H、N、Y、L、M及Q。

11.如實施例1-8中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置584處之胺基酸R；在位置585處選自由以下組成之群的胺基酸：N、M、C、E、G、S、V、A、T、H及L；在位置586處選自由以下組成之群的胺基酸：M、D、N、G、A、T、R及I；在位置587處選自由以下組成之群的胺基酸：T、N、V、L、I、S、R及P；在位置588處選自由以下組成之群的胺基酸：Y、T、S、I、V、F、L、R、N、D及G；在位置589處選自由以下組成之群的胺基酸：L、I、R、S、G、N、T、V、Q、F、E及Y；及/或在位置590處選自由以下組成之群的胺基酸：G、R、S、I、H、N、Y、L及M。

12.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含以下任何至少兩個、三個、四個、五個、六個、七個或所有八個： (i)在位置452處之胺基酸K； (ii)在位置584處之胺基酸R； (iii)在位置585處選自由以下組成之群的胺基酸：N、M、C、E、G、S、V、A、T、H及L； (iv)在位置586處選自由以下組成之群的胺基酸：M、D、N、G、A、T、R及I； (v)在位置587處選自由以下組成之群的胺基酸：T、N、V、L、I、S、R及P； (vi)在位置588處選自由以下組成之群的胺基酸：Y、T、S、I、V、F、L、R、N、D及G； (vii)在位置589處選自由以下組成之群的胺基酸：L、I、R、S、G、N、T、V、Q、F、E及Y；及 (viii)在位置590處選自由以下組成之群的胺基酸：G、R、S、I、H、N、Y、L及M

13.如實施例1-8中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置585處選自由以下組成之群的胺基酸：E、N、G、M、C、V、T及Q；在位置586處選自由以下組成之群的胺基酸：N、T、M、G、D及S；在位置587處選自由以下組成之群的胺基酸：T、L、I、K、S、N、V及A；在位置588處選自由以下組成之群的胺基酸：V、F、Y、L、T、S、I、R及Q；在位置589處選自由以下組成之群的胺基酸：S、N、L、T、I、R及A；及/或在位置590處選自由以下組成之群的胺基酸：I、S、G、H、R及Q。

14.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；在位置585處選自由以下組成之群的胺基酸：E、N、G、M、C、V、T及Q；在位置586處選自由以下組成之群的胺基酸：N、T、M、G、D及S；在位置587處選自由以下組成之群的胺基酸：T、L、I、K、S、N、V及A；在位置588處選自由以下組成之群的胺基酸：V、F、Y、L、T、S、I、R及Q；在位置589處選自由以下組成之群的胺基酸：S、N、L、T、I、R及A；及在位置590處選自由以下組成之群的胺基酸：I、S、G、H、R及Q。

15.如實施例1-8中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置585處選自由以下組成之群的胺基酸：E、N、G、M、C、V及T；在位置586處選自由以下組成之群的胺基酸：N、T、M、G及D；在位置587處選自由以下組成之群的胺基酸：T、L、I、K、S、N及V；在位置588處選自由以下組成之群的胺基酸：V、F、Y、L、T、S、I及R；在位置589處選自由以下組成之群的胺基酸：S、N、L、T、I及R；及/或在位置590處選自由以下組成之群的胺基酸：I、S、G、H及R。

16.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含以下任何至少兩個、三個、四個、五個、六個或所有七個： (i)在位置452處之胺基酸K； (ii)在位置585處選自由以下組成之群的胺基酸：E、N、G、M、C、V及T； (iii)在位置586處選自由以下組成之群的胺基酸：N、T、M、G及D； (iv)在位置587處選自由以下組成之群的胺基酸：T、L、I、K、S、N及V； (v)在位置588處選自由以下組成之群的胺基酸：V、F、Y、L、T、S、I及R； (vi)在位置589處選自由以下組成之群的胺基酸：S、N、L、T、I及R；及 (vii)在位置590處選自由以下組成之群的胺基酸：I、S、G、H及R。

17.如實施例1-8中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置585處選自由以下組成之群的胺基酸：E、N、M、C及Q；在位置586處選自由以下組成之群的胺基酸：A、M、G、D、N及S；在位置587處選自由以下組成之群的胺基酸：T、N、V及A；在位置588處選自由以下組成之群的胺基酸：V、Y、T、S、I及Q；在位置589處選自由以下組成之群的胺基酸：S、G、L、I、R及A；及/或在位置590處選自由以下組成之群的胺基酸：I、S、G、R及Q。

18.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；在位置585處選自由以下組成之群的胺基酸：E、N、M、C及Q；在位置586處選自由以下組成之群的胺基酸：A、M、G、D、N及S；在位置587處選自由以下組成之群的胺基酸：T、N、V及A；在位置588處選自由以下組成之群的胺基酸：V、Y、T、S、I及Q；在位置589處選自由以下組成之群的胺基酸：S、G、L、I、R及A；及在位置590處選自由以下組成之群的胺基酸：I、S、G、R及Q。

19.如實施例1-8中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置585處選自由以下組成之群的胺基酸：E、N、M及C；在位置586處選自由以下組成之群的胺基酸：A、M、G、D及N；在位置587處選自由以下組成之群的胺基酸：T、N及V；在位置588處選自由以下組成之群的胺基酸：V、Y、T、S及I；在位置589處選自由以下組成之群的胺基酸：S、G、L、I及R；及/或在位置590處選自由以下組成之群的胺基酸：I、S、G及R。

20.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含以下任何至少兩個、三個、四個、五個、六個或所有七個： (i)在位置452處之胺基酸K； (ii)在位置585處選自由以下組成之群的胺基酸：E、N、M及C； (iii)在位置586處選自由以下組成之群的胺基酸：A、M、G、D及N； (iv)在位置587處選自由以下組成之群的胺基酸：T、N及V； (v)在位置588處選自由以下組成之群的胺基酸：V、Y、T、S及I； (vi)在位置589處選自由以下組成之群的胺基酸：S、G、L、I及R；及 (vii)在位置590處選自由以下組成之群的胺基酸：I、S、G及R。

21.如實施例1-20中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；及在位置587處之胺基酸取代A587T；且視情況包含在選自由以下組成之群的一個、兩個或更多個位置處之胺基酸N或R：584、585、586、588、589及590。

22.如實施例1-21中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；及在選自由以下組成之群的一個、兩個或更多個位置處之胺基酸N或R：584、585、586、588、589及590。

23.如實施例1-22中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；及在選自由以下組成之群的兩個或更多個位置處之胺基酸S：585、586、587、588、589及590。

24.如實施例1-23中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；及在該VR-VIII位點之區域585-590中之三個、四個或更多個位置處之選自由以下組成之群的胺基酸：N、S、T、R及I。

25.如實施例24之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在該VR-VIII位點之區域585-590中之三個、四個或更多個位置處之選自由以下組成之群的胺基酸：N、S、T及R。

26.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585E、S586N、A587T、Q588V、A589S、Q590I及N452K。

27.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代S586T、A587L、Q588F、A589N、Q590S及N452K。

28.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585N、A587T、Q588Y、A589L、Q590G及N452K。

29.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585G、A587I、Q588L、A589T、Q590H及N452K。

30.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585M、S586M、A587T、Q588T及Q590R；及在位置452處之胺基酸N。

31.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585N、A587T、Q588Y、A589L及Q590G；及在位置452處之胺基酸N。

32.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585C、A587T、Q588S、A589I及Q590R；及在位置452處之胺基酸N。

33.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585E、S586D、A587N、Q588I、A589R及Q590S；及在位置452處之胺基酸N。

34.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585E、S586D、A587N、Q588I、A589R、Q590S及N452K。

35.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585N、S586N、A587V、Q588I、A589S、Q590G及N452K。

36.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代S586G及Q588Y；及在位置452處之胺基酸N。

37.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代S586A、A587N、Q588Y、A589G及N452K。

38.如實施例1-37中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置581-583處之胺基酸ATN及位置591-594處之胺基酸AQTG。

39.如實施例1-37中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置581-584處之胺基酸ATNH及位置591-594處之胺基酸AQTG。

40.如實施例1-5中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含： (i)在該VR-VIII位置581-594處之胺基酸序列ATNHENTVSIAQTG，及在該VR-IV位置452處之胺基酸K； (ii)在該VR-VIII位置581-594處之胺基酸序列ATNHQTLFNSAQTG，及在該VR-IV位置452處之胺基酸K； (iii)在該VR-VIII位置581-594處之胺基酸序列ATNHNSTYLGAQTG，及在該VR-IV位置452處之胺基酸K； (iv)在該VR-VIII位置581-594處之胺基酸序列ATNHGSILTHAQTG，及在該VR-IV位置452處之胺基酸K； (v)在該VR-VIII位置581-594處之胺基酸序列ATNHMMTTARAQTG，及在該VR-IV位置452處之胺基酸N； (vi)在該VR-VIII位置581-594處之胺基酸序列ATNHNSTYLGAQTG，及在該VR-IV位置452處之胺基酸N； (vii)在該VR-VIII位置581-594處之胺基酸序列ATNHCSTSIRAQTG，及在該VR-IV位置452處之胺基酸N； (viii)在該VR-VIII位置581-594處之胺基酸序列ATNHEDNIRSAQTG，及在該VR-IV位置452處之胺基酸N； (ix)在該VR-VIII位置581-594處之胺基酸序列ATNHEDNIRSAQTG，及在該VR-IV位置452處之胺基酸K； (x)在該VR-VIII位置581-594處之胺基酸序列ATNHNNVISGAQTG，及在該VR-IV位置452處之胺基酸K； (xi)在該VR-VIII位置581-594處之胺基酸序列ATNHQGAYAQAQTG，及在該VR-IV位置452處之胺基酸N； (xii)在該VR-VIII位置581-594處之胺基酸序列ATNHQANYGQAQTG，及在該VR-IV位置452處之胺基酸K； (xiii)在該VR-VIII位置581-594處之胺基酸序列ATNHNMNRVNAQTG，及在該VR-IV位置452處之胺基酸N； (xiv)在該VR-VIII位置581-594處之胺基酸序列ATNHNNVISGAQTG，及在該VR-IV位置452處之胺基酸N； (xv)在該VR-VIII位置581-594處之胺基酸序列ATNHSNSVQSAQTG，及在該VR-IV位置452處之胺基酸N； (xvi)在該VR-VIII位置581-594處之胺基酸序列ATNHSSTFQGAQTG，及在該VR-IV位置452處之胺基酸N； (xvii)在該VR-VIII位置581-594處之胺基酸序列ATNHVSSFTSAQTG，及在該VR-IV位置452處之胺基酸N； (xviii)在該VR-VIII位置581-594處之胺基酸序列ATNHSTTNFRAQTG，及在該VR-IV位置452處之胺基酸N； (xix)在該VR-VIII位置581-594處之胺基酸序列ATNHSSIFNSAQTG，及在該VR-IV位置452處之胺基酸N； (xx)在該VR-VIII位置581-594處之胺基酸序列ATNHAGNYNNAQTG，及在該VR-IV位置452處之胺基酸N； (xxi)在該VR-VIII位置581-594處之胺基酸序列ATNHTSVISIAQTG，及在該VR-IV位置452處之胺基酸N； (xxii)在該VR-VIII位置581-594處之胺基酸序列ATNHHSRVEIAQTG，及在該VR-IV位置452處之胺基酸N； (xxiii)在該VR-VIII位置581-594處之胺基酸序列ATNHSSIIYSAQTG，及在該VR-IV位置452處之胺基酸N； (xxiv)在該VR-VIII位置581-594處之胺基酸序列ATNHSGRDSYAQTG，及在該VR-IV位置452處之胺基酸N； (xxv)在該VR-VIII位置581-594處之胺基酸序列ATNHSSSYNNAQTG，及在該VR-IV位置452處之胺基酸N； (xxvi)在該VR-VIII位置581-594處之胺基酸序列ATNHHNPSINAQTG，及在該VR-IV位置452處之胺基酸N； (xxvii)在該VR-VIII位置581-594處之胺基酸序列ATNHNRNGLLAQTG，及在該VR-IV位置452處之胺基酸N； (xxviii)在該VR-VIII位置581-594處之胺基酸序列ATNHESTSVRAQTG，及在該VR-IV位置452處之胺基酸N； (xxix)在該VR-VIII位置581-594處之胺基酸序列ATNHNIRTEMAQTG，及在該VR-IV位置452處之胺基酸N； (xxx)在該VR-VIII位置581-594處之胺基酸序列ATNHQTLFNSAQTG，及在該VR-IV位置452處之胺基酸N； (xxxi)在該VR-VIII位置581-594處之胺基酸序列ATNHLSVSSIAQTG，及在該VR-IV位置452處之胺基酸N； (xxxii)在該VR-VIII位置581-594處之胺基酸序列ATNHEDIIRSAQTG，及在該VR-IV位置452處之胺基酸N； (xxxiii)在該VR-VIII位置581-594處之胺基酸序列ATNRQTAQAQAQTG，及在該VR-IV位置452處之胺基酸N；或 (xxxiv)在該VR-VIII位置581-594處之胺基酸序列ATNRQIAQAQAQTG，及在該VR-IV位置452處之胺基酸N。

41.如實施例1-8中任一項之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含： (i)在位置584處之胺基酸插入，其包含天冬醯胺酸(N)、蘇胺酸(T)、酪胺酸(Y)、苯丙胺酸(F)及丙胺酸(A)中之一或多者； (ii)在位置585處之胺基酸插入，其包含組胺酸(H)及甲硫胺酸(M)中之一或多者； (iii)在位置586處之胺基酸插入，其包含組胺酸(H)、酪胺酸(Y)、纈胺酸(V)、蘇胺酸(T)、丙胺酸(A)、異白胺酸(I)、色胺酸(W)、甲硫胺酸(M)及白胺酸中之一或多者； (iv)在位置587處之胺基酸插入，其包含異白胺酸(I)及脯胺酸(P)中之一或多者； (v)在位置588處之胺基酸插入，其包含異白胺酸(I)、蘇胺酸(T)及脯胺酸(P)中之一或多者；及/或 (vi)在位置589處之胺基酸插入，其包含甘胺酸(G)及麩醯胺酸(Q)中之一或多者。

42.如實施例41之聚核苷酸，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含： (i)在位置584處之由以下組成的胺基酸插入：TY、FN或AT； (ii)在位置585處之由以下組成的胺基酸插入：MH； (iii)在位置586處之由以下組成的胺基酸插入：HY、VT、AI、WM或ML； (iv)在位置587處之由以下組成的胺基酸插入：PI；及/或 (v)在位置588處之由以下組成的胺基酸插入：IT或PT。

43.如實施例1-42中任一項之聚核苷酸，其中除指定修飾之外，該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3序列具有至少90%、至少95%、至少96%、至少97%、至少99%或100%胺基酸序列一致性或包含與該AAV9 VP3序列具有至少90%、至少95%、至少96%、至少97%、至少99%或100%胺基酸序列一致性的序列。

44.如實施例1-43中任一項之聚核苷酸，其中除指定修飾之外，該蛋白殼蛋白與根據SEQ ID NO: 486之AAV9 VP2序列具有至少90%、至少95%、至少96%、至少97%、至少99%或100%胺基酸序列一致性或包含與該AAV9 VP2序列具有至少90%、至少95%、至少96%、至少97%、至少99%或100%胺基酸序列一致性的序列。

45.如實施例1-44中任一項之聚核苷酸，其中除指定修飾之外，該蛋白殼蛋白與根據SEQ ID NO: 1之AAV9 VP1序列具有至少90%、至少95%、至少96%、至少97%、至少99%或100%胺基酸序列一致性或包含與該AAV9 VP1序列具有至少90%、至少95%、至少96%、至少97%、至少99%或100%胺基酸序列一致性的序列。

46.如實施例1-45中任一項之聚核苷酸，其中該蛋白殼蛋白包含與由以下組成之群中之任一者至少85%、90%、95%、96%、97%、98%、99%或100%一致的胺基酸序列或其功能片段、基本上由其組成或由其組成：SEQ ID NOs:488、499、504、505、506、510、512、513、516、518、521、522、533、536、539、558、562、566、571、576、578、579、580、581、585、588、589、705、706、707、708、710、772及774。

47.如實施例1中任一項之聚核苷酸，其中該蛋白殼蛋白包含由以下組成之群中之任一者之多肽序列、基本上由該多肽序列組成或由該多肽序列組成：SEQ ID NOs:488、499、504、505、506、510、512、513、516、518、521、522、533、536、539、558、562、566、571、576、578、579、580、581、585、588、589、705、706、707、708、710、772及774。

48.一種載體，其包含如實施例1至47中任一項之聚核苷酸。

49.如實施例48之質體或載體，其包含可操作地連接至聚核苷酸之啟動子，視情況其中該啟動子為適用於昆蟲細胞之表現的啟動子(例如，多角體蛋白啟動子)或適用於哺乳動物細胞之表現的啟動子。

50.如實施例48或49之質體或載體，其進一步包含編碼rep蛋白質之聚核苷酸。

51.一種產生生產細胞之方法，其包含將如實施例1至47中任一項之聚核苷酸或如實施例48至50中任一項之質體或載體引入細胞中(例如，藉由轉染細胞)，視情況其中該細胞為哺乳動物細胞或昆蟲細胞，視情況其中該生產細胞用於AAV病毒粒子生產。

52.如實施例51之方法，其包含向該細胞中引入聚核苷酸、質體或包含腺病毒輔助基因之載體。

53.如實施例51或52之方法，其包含向該細胞中引入包含聚核苷酸、質體或編碼Rep蛋白質之聚核苷酸的載體。

54.如實施例51至53中任一項之方法，其包含將聚核苷酸、質體或包含轉殖基因卡匣之載體引入細胞中，其中該轉殖基因卡匣包含轉殖基因及反向末端重複序列或ITR (例如，側接ITR之轉殖基因)，視情況其中該轉殖基因編碼治療性蛋白質。

55.如實施例54之方法，其中該等ITR為AAV2 ITR，且其中該細胞包含編碼AAV2 rep蛋白質之聚核苷酸。

56.一種細胞，其包含如實施例1-47中任一項之聚核苷酸或如實施例48-50中任一項之載體。

57.如實施例56之細胞，其為哺乳動物細胞，視情況其中該哺乳動物細胞為HEK293細胞。

58.如實施例56之細胞，其為昆蟲細胞，視情況其中該昆蟲細胞為Sf9細胞。

59.如實施例56-58中任一項之細胞，其進一步包含以下中之一或多者：(i)聚核苷酸、質體或編碼rep蛋白質之載體，(ii)聚核苷酸、質體或包含腺病毒輔助基因之載體，及(iii)聚核苷酸、質體或包含轉殖基因卡匣之載體，該轉殖基因卡匣包含由ITR側接之轉殖基因(視情況其中該轉殖基因編碼治療蛋白)。

60.一種產生AAV病毒粒子之方法，其包含在細胞中引入：(i)如實施例1至47中任一項之多肽或如實施例48至50中任一項之質體或載體，(ii)聚核苷酸、質體或編碼rep蛋白質之載體，(iii)聚核苷酸、質體或包含腺病毒輔助基因之載體，及(iv)聚核苷酸、質體或包含轉殖基因卡匣之載體，該轉殖基因卡匣包含由ITR側接之轉殖基因(視情況其中該轉殖基因編碼治療蛋白)；視情況其中該細胞為哺乳動物細胞或昆蟲細胞，視情況其中該細胞用於AAV病毒粒子產生。

61.如實施例59之方法，其中(i)-(iv)中之任一者藉由基因體整合、DNA轉染或病毒感染引入。

62.如實施例60或61之方法，其進一步包含在適合於AAV病毒粒子之生產及/或封裝的條件下培養細胞。

63.如實施例60至62中任一項之方法，其包含(i)自細胞上清液中收集所產生之AAV病毒粒子，及/或(ii)溶解細胞且自細胞溶解物收集所產生之AAV病毒粒子。

64.如實施例63之方法，其包含純化所產生之AAV病毒粒子，視情況其中該純化係藉由密度梯度離心及/或基於層析之方法。定義

除非上下文另有說明，否則本發明之特徵可以任何組合使用。所述任何特徵或特徵組合可排除或省去。各別實施例中所描述的本發明之某些特徵亦可在單個實施例中組合提供。單個實施例中所述的本發明特徵亦可分開提供或以任何適合的子組合提供。本文揭示實施例的所有組合，如同每一個組合個別地揭示一般。本文揭示實施例及元件的所有子組合，如同每個此類子組合個別地揭示一般。

除非另外規定，否則本文所用之所有技術及科學術語具有與本發明所屬之一般熟習此項技術者通常所理解相同之含義。本實施方式僅為了閱讀方便而分成各章節，且任何章節中所發現之揭示內容可與另一章節中之揭示內容組合。雖然類似或等效於本文所描述者之任何方法及材料可用於本發明之實施或測試中，但現描述例示性方法及材料。本文所提及之全部公開案均以引用之方式併入本文中，以揭示及描述與所引用之公開案相關的方法及/或材料。提及出版物並非承認該出版物為先前技術。

除非上下文另外明確規定，否則單數形式「一(a/an)」及「該」包括複數個指示物。舉例而言，提及「重組AAV病毒粒子」包括複數個此類病毒粒子且提及「心臟細胞」包括一或多個心臟細胞。

連接詞「及/或」意謂「及」與「或」，且藉由「及/或」連接的清單涵蓋一或多個所列項的所有可能組合。

術語「載體」係指包含待遞送至細胞之聚核苷酸或蛋白質的巨分子或分子複合物。

「AAV」為腺相關病毒之縮寫。該術語涵蓋AAV的所有亞型(除指定亞型之外)，以及天然存在之形式與重組形式。縮寫「rAAV」係指重組腺相關病毒。「AAV」包括AAV或任何亞型。「AAV5」係指AAV亞型5。「AAV9」係指AAV亞型9。AAV之各種血清型的基因體序列以及原生反向末端重複(ITR)、Rep蛋白及蛋白殼亞單元的序列可見於文獻或公用資料庫，諸如GenBank。參見例如GenBank登錄號NC_002077 (AAV1)、AF063497 (AAV1)、NC_001401 (AAV2)、AF043303 (AAV2)、NC_001729 (AAV3)、NC_001829 (AAV4)、U89790 (AAV4)、NC_006152 (AAV5)、AF513851 (AAV7)、AF513852 (AAV8)、NC_006261 (AAV8)及AY530579 (AAV9)。描述AAV的出版物包括Srivistava等人 .(1983) J. Virol.45:555；Chiorini等人 .(1998) J. Virol.71:6823；Chiorini等人 .(1999) J. Virol.73:1309；Bantel-Schaal等人 .(1999) J. Virol.73:939；Xiao等人 .(1999) J. Virol.73:3994；Muramatsu等人 .(1996) Virol.221:208；Shade等人 .(1986) J. Virol.58:921；Gao等人 .(2002) Proc. Nat. Acad. Sci. USA99: 11854；Moris等人 .(2004) Virology33:375-383；國際專利公開案第WO2018/222503A1號、第WO2012/145601A2號、第WO2000/028061A2號、第WO1999/61601A2號及第WO1998/11244A2號；美國專利申請第15/782,980號及第15/433,322號；及美國專利第10,036,016號、第9,790,472號、第9,737,618號、第9,434,928號、第9,233,131號、第8,906,675號、第7,790,449號、第7,906,111號、第7,718,424號、第7,259,151號、第7,198,951號、第7,105,345號、第6,962,815號、第6,984,517號及第6,156,303號。

如此項技術中所用，「AAV載體」或「rAAV載體」係指封裝於rAAV病毒粒子中的DNA或rAAV病毒粒子本身，此視上下文而定。如本文所用，除非另外自上下文顯而易見，否則rAAV載體係指包含能夠封裝於rAAV病毒粒子中之聚核苷酸序列、但具有rAAV病毒粒子之蛋白殼或其他蛋白質的核酸(典型地為質體)。一般而言，rAAV載體包含異源聚核苷酸序列(亦即，非AAV起源之聚核苷酸)及一或兩個側接異源聚核苷酸序列的AAV反向末端重複序列(ITR)。兩個ITR中僅一者可封裝於rAAV中且仍可維持所得rAAV病毒粒子的感染性。參見Wu等人 .(2010) Mol Ther.18:80。rAAV載體可經設計以產生單股rAAV載體(ssAAV)或自互補rAAV載體(scAAV)。參見McCarty D. (2008) Mo. Ther.16:1648-1656；WO2001/11034；WO2001/92551；WO2010/129021。

「rAAV病毒粒子」係指胞外病毒粒子，其包括至少一種病毒蛋白殼蛋白(例如VP1)及蛋白殼化rAAV載體(或其片段)，包括蛋白殼蛋白。

為簡潔及清晰起見，本發明係指「一或多種蛋白殼蛋白」。熟習此項技術者理解，此類提及物係指VP1、VP2或VP3，或VP1、VP2與VP3之組合。如同野生型AAV及大部分重組表現系統，VP1、VP2及VP3係自同一開讀框表現，對編碼VP3之序列進行工程改造不可避免地改變VP1及VP2之C端域序列。蛋白殼蛋白亦可自不同開讀框表現，在此情況下，所得rAAV病毒粒子的蛋白殼可含有野生型蛋白殼蛋白與工程化蛋白殼蛋白之混合物，及不同工程化蛋白殼蛋白之混合物。

序列比對位置一般根據參考序列表示。除非另外說明，本文所揭示之工程化蛋白殼蛋白中的胺基酸位置係根據作為SEQ ID NO: 1提供之AAV9的VP1序列編號。可利用所關注之序列與參考序列的最佳擬合比對來測定位置。「位於」一位置的插入意謂在比對中，該胺基酸位置與先前位置之間的插入序列。術語「約」允許靠近參考位置之位置的取代或插入。熟習此項技術者可利用諸如結構模型化之技術確定適合的鄰近位置(例如藉由鑑別蛋白殼表面上所暴露之環區域中的殘基)。

如本文所用，術語「反向末端重複序列」或「ITR」係指由於其對稱性而如此命名之AAV病毒順式元件。此等元件係AAV基因體高效增殖必不可少的。不受理論束縛，咸信ITR功能不可缺少的最少元件為Rep結合位點及末端解鏈位，以及允許形成髮夾的可變回文序列。本發明考慮了可存在或可有希望地開發出與本發明之蛋白殼蛋白相容的產生AAV基因體之替代方式。

「輔助病毒功能」係指輔助病毒基因體中所編碼的功能，其允許AAV複製及封裝。

「封裝」係指一系列細胞內事件，其引起rAAV病毒粒子的組裝，包括rAAV載體的蛋白殼化。AAV「rep」及「cap」基因係指編碼腺相關病毒之複製及殼體化蛋白質之聚核苷酸序列。AAV rep及cap在本文中稱為AAV「封裝基因」。封裝需要輔助病毒本身，或更通常存在於重組系統中的輔助病毒功能，該輔助病毒功能係由無輔助系統(亦即，一或多個輔助質體)供應。

AAV的「輔助病毒」係指允許AAV(例如野生型AAV)由哺乳動物細胞複製及封裝的病毒。輔助病毒可為腺病毒、疱疹病毒或痘病毒，諸如痘瘡。

「感染性」病毒粒子或病毒粒子為包含勝任組裝之病毒蛋白殼且能夠將聚核苷酸組分遞送至該病毒粒子對其具向性之細胞中的病毒粒子或病毒粒子。該術語未必暗示病毒之任何複製能力。

「感染性」係指病毒粒子感染細胞之能力的量度。感染性可用感染性病毒粒子相對於總病毒粒子的比率表示。感染性一般係相對於特定細胞類型測定。其可在活體內或在活體外量測。確定感染性病毒粒子相對於總病毒粒子之比率的方法為此項技術中已知的。參見例如Grainger等人(2005) Mol. Ther. 11:S337 (描述TCID ₅₀感染性效價分析)；及Zolotukhin等人(1999) Gene Ther. 6:973。

術語「親本蛋白殼」或「親本序列」係指衍生出粒子蛋白殼或序列的參考序列。除非另外說明，否則親本序列係指血清型與工程化蛋白殼蛋白相同的野生型蛋白殼蛋白之序列。

「複製勝任型」病毒(例如複製勝任型AAV)係指具有感染性且亦能夠在感染細胞中(亦即，在輔助病毒或輔助病毒功能存在下)複製的病毒。在一些實施例中，本發明之rAAV病毒粒子包含缺乏 rep基因、或 rep與 cap基因且因此不勝任複製的基因體。

除非另外指明，否則本發明之實踐將採用組織培養、免疫學、分子生物學、微生物學、細胞生物學及重組DNA之習知技術，其屬於此項技術之範圍內。參見例如Sambrook及Russell編,(2001) Molecular Cloning: A Laboratory Manual, 第3版；系列Ausubel等人編, (2007) Current Protocols in Molecular Biology；系列Methods in Enzymology (Academic Press, Inc., N.Y.)；MacPherson等人, (1991) PCR 1: A Practical Approach (IRL Press at Oxford University Press)；MacPherson等人, (1995) PCR 2: A Practical Approach；Harlow及Lane編, (1999) Antibodies, A Laboratory Manual；Freshney (2005) Culture of Animal Cells: A Manual of Basic Technique, 第5版；Gait編, (1984) Oligonucleotide Synthesis；美國專利第4,683,195號；Hames及Higgins編, (1984) Nucleic Acid Hybridization；Anderson (1999) Nucleic Acid Hybridization；Hames及Higgins eds. (1984) Transcription and Translation；IRL Press (1986) Immobilized Cells and Enzymes；Perbal (1984) A Practical Guide to Molecular Cloning；Miller及Calos編, (1987) Gene Transfer Vectors for Mammalian Cells (Cold Spring Harbor Laboratory)；Makrides編, (2003) Gene Transfer and Expression in Mammalian Cells；Mayer及Walker編, (1987) Immunochemical Methods in Cell and Molecular Biology (Academic Press, London)；Herzenberg等人編, (1996) Weir's Handbook of Experimental Immunology；Manipulating the Mouse Embryo: A Laboratory Manual, 第3版, (2002) Cold Spring Harbor Laboratory Press；Sohail (2004) Gene Silencing by RNA Interference: Technology and Application (CRC Press)；及Sell (2013) Stem Cells Handbook。

術語「核酸」與「聚核苷酸」可互換使用且係指任何長度之呈聚合形式之核苷酸(去氧核糖核苷酸或核糖核苷酸，或其類似物)。聚核苷酸之非限制性實例包括線性及環狀核酸、信使RNA (mRNA)、cDNA、重組聚核苷酸、載體、探針及引子。除非另有說明或要求，否則本文所描述的本發明之聚核苷酸的任何實施例涵蓋雙股形式及已知或預測構成該雙股形式之兩個互補單股形式中之各者。

術語「多肽」與「蛋白質」在本文中可互換地使用且指任何長度之呈聚合形式的胺基酸，其可包括基因編碼及非基因編碼之胺基酸、經化學或生物化學修飾或衍生之胺基酸及具有經修飾之肽主鏈之多肽。術語亦涵蓋已經修飾之胺基酸聚合物；例如二硫鍵形成、糖基化、脂質化、磷酸化或與標記組分結合。

術語「肽」係指一種短多肽，例如具有約4與30個胺基酸殘基之間的肽。

術語「分離」意謂與病毒粒子、細胞、組織、聚核苷酸、肽、多肽或蛋白質通常天然締合之成分、細胞物質及其他物質分離。舉例而言，經分離之細胞為與具有相異表現型或基因型之組織或細胞分離的細胞。

如本文所用，「序列一致性」或「一致性」係指所關注之序列與參考序列之間一致的胺基酸數目百分比。一般而言，如下測定一致性：將所關注的序列與參考序列對準；測定所比對序列之間一致的胺基酸數目；將該數目除以參考序列中之胺基酸總數目；且將結果乘以100以得到百分比。可使用多種電腦程式比對序列，諸如ncbi.nlm.nih.gov可獲得的BLAST。用於比對之其他技術描述於以下中：Methods in Enzymology, 第266卷: Computer Methods for Macromolecular Sequence Analysis (1996)；及 Meth. Mol. Biol.70: 173-187 (1997) ； J. Mol. Biol.48: 44。視多種因素(包括序列長度、發散度，及插入或缺失相對於參考序列的存在或不存在)而定，熟習此項技術者能夠選擇適當的比對方法。

「重組」應用於聚核苷酸時意謂，該聚核苷酸為選殖、限制或接合步驟與其他程序之各種組合的產物，從而產生與自然界中所發現之聚核苷酸不同的構築體，或該聚核苷酸由合成寡核苷酸組裝。「重組」蛋白質為由重組多肽產生的蛋白質。重組病毒粒子為包含重組聚核苷酸及/或重組蛋白(例如重組蛋白殼蛋白)的病毒粒子。

「基因」係指含有至少一個開讀框之聚核苷酸，其在轉錄及轉譯後能夠編碼特定的蛋白質。「基因產物」為由特定基因之表現產生之分子基因產物可包括(不限於)多肽、蛋白質、適體、干擾RNA或mRNA。基因編輯系統(例如CRISPR/Cas系統)可描述為一種基因產物或若干基因產物，此為產生系統所必需的(例如Cas蛋白及嚮導RNA)。

「短髮夾RNA」或shRNA為用於表現siRNA的聚核苷酸構築體。

「控制元件」或「控制序列」係參與分子相互作用之核苷酸序列，其對聚核苷酸的功能調節有貢獻，包括聚核苷酸之複製、倍增、轉錄、剪接、轉譯或降解。該調節可影響該過程之頻率、速度或特異性，且可為增強性或抑制性的。控制元件包括轉錄調節序列，諸如啟動子及/或增強子。

「啟動子」為在某些條件下能夠結合RNA聚合酶且起始編碼區轉錄的DNA序列，該編碼區通常位於啟動子下游(3'方向)。如本文所用，術語「組織特異性啟動子」係指在特定器官或組織(諸如心臟組織)之細胞中可操作的啟動子。

「可操作地連接」或「可操作連接」係指遺傳元件之併接，其中元件呈允許其以預期方式操作之關係。舉例而言，若啟動子有助於起始編碼序列之轉錄，則該啟動子係可操作地連接至編碼區。在啟動子與編碼區之間可存在介入殘基，只要維持此功能關係即可。

術語「聚核苷酸卡匣」係指反向末端重複序列(ITR)之間的載體基因體部分。聚核苷酸卡匣可包含編碼其遞送至目標細胞之任何遺傳元件的聚核苷酸序列，包括(但不限於)用於基因、啟動子或用於基因編輯之修復模板的編碼序列。除非另外說明，否則AAV載體的表現卡匣僅包括ITR之間的聚核苷酸(而不包括ITR)。

「表現載體」為包含編碼序列的載體，該編碼序列編碼所關注之基因產物，用於實現基因產物於目標細胞中的表現。表現載體包含可操作地連接至編碼序列的控制元件以促進基因產物的表現。

術語「表現卡匣」係指包含編碼序列的聚核苷酸卡匣，該編碼序列編碼所關注的基因產物，用於實現基因產物於目標細胞中的表現。除非另外說明，否則AAV載體之表現卡匣僅包括ITR之間的聚核苷酸(而不包括ITR)。

如本文所用，術語「基因遞送」或「基因轉移」係指可靠地將外來核酸序列(例如DNA)插入宿主細胞中的方法或系統。此類方法可引起非整合式轉移之DNA的短暫表現、所轉移複製子(例如游離基因體)之染色體外複製及表現，或所轉移之遺傳物質整合至宿主細胞之基因體DNA中。

「異源」意謂來源於基因型與所比較之其餘實體之基因型不同的實體。舉例而言，藉由基因工程技術引入至來源於不同物種之質體或載體中的聚核苷酸為異源聚核苷酸。自其天然編碼序列移除且以可操作方式連接於天然地發現不與其連接之編碼序列的啟動子為異源啟動子。因此，舉例而言，包括異源核酸的rAAV為包括通常不含於天然存在之AAV中之核酸的rAAV。

術語「基因變化」及「基因修飾」(及其文法變型)在本文中可互換地用於指其中除有絲分裂或減數分裂之外的將遺傳元件(例如聚核苷酸)引入細胞中之方法。元件對於細胞而言可為異源的，或其可為已存在於細胞中之元件的另一複本或改良形式。基因變化可如下實現：例如經由此項技術中已知的任何方法(諸如電穿孔、磷酸鈣沈澱，或與聚核苷酸-脂質體複合物接觸)，用重組質體或其他聚核苷酸轉染細胞。基因變化亦可例如藉由用載體轉導或感染來實現。

若一聚核苷酸序列在活體外、在延長的細胞培養期間可用於執行其功能，則稱該細胞「穩定地」被該序列改變、轉導、基因修飾或轉型。一般而言，此類細胞「可遺傳地」改變(經基因修飾)，因為所引入的基因變化亦可遺傳給所改變細胞的後代。

如本文所用，術語「轉染」係指外源核酸分子被細胞吸收。當外源性核酸已引入細胞膜內部時，細胞已被「轉染」。多種轉染技術係本領域中通常已知的。參見例如Graham等人(1973)，《病毒學(Virology)》, 52:456, Sambrook等人(1989)，《分子選殖：實驗室手冊(Molecular Cloning, a laboratory manual)》，冷泉港實驗室(Cold Spring Harbor Laboratories), New York, Davis等人(1986)，《分子生物學基礎方法(Basic Methods in Molecular Biology)》, Elsevier及Chu等人(1981)，《基因(Gene)》13:197。此類技術可用於將一或多個外源核酸分子引入適合宿主細胞中。

如本文所用，術語「轉導」係指與藉由野生型病毒粒子「感染」相比，藉由重組病毒粒子將外源核酸轉移至細胞中。當聯合重組病毒粒子使用感染時，術語「轉導」與「感染」同義，且因此，「感染性」與「轉導效率」等效且可使用類似方法測定。

片語「在靈長類動物中評估」係指藉由實例或其後之變型中所描述方法測試。可使用rAAV病毒粒子群進行評估，該病毒粒子群接受共同蛋白殼蛋白的篩選或藉由再篩選而彙集測試。

除非另外說明，否則所有醫學術語被賦予醫療專業人士所用術語的普通含義，例如Harrison's Principles of Internal Medicine第15版，該文獻以全文引用的方式併入本文中用於所有目的，尤其是關於心臟或心血管疾病、病症、病狀及功能障礙的章節。

「治療(Treatment)」、「治療(treating)」及「治療(treat)」定義為藥劑作用於疾病、病症或病狀，以減輕或改善疾病、病症、病狀及/或其症狀之有害或任何其他非所需影響。

「投藥」、「投與」及其類似術語當結合本發明之組合物使用時，係指直接投藥(由醫療專業人士投與個體或由個體自投藥)及/或間接投藥(向患者指定組合物)。通常，投與有效量，該量可藉由熟習此項技術者來測定。可使用任何投與方法。可藉由例如靜脈內、動脈內、肌肉內、血管內或心肌內遞送來實現向個體的投與。

如本文所用，提及組合物之量時，術語「有效量」及其類似術語係指足以誘導所需生理學結果(例如細胞的再程式化或疾病的治療)的量。有效量可以一或多次投藥與、施用或劑量形式來投與。此類遞送視許多變數而定，包括使用個別劑量單位之時段、組合物之生物可用性、投與途徑等。然而，應理解，對於任何特定個體而言，組合物(例如rAAV病毒粒子)之特定量視多種因素而定，包括所用特定藥劑之活性、個體之年齡、體重、一般健康狀況、性別及飲食、投與時間、排泄率、組合物組合、所治療之特定疾病之嚴重度及投與形式。

術語「個體」、「個體」及「患者」在本文中可互換地使用，且係指哺乳動物，包括(但不限於)人類及非人類靈長類動物(例如，猿猴)；哺乳動物運動型動物(例如馬)；哺乳動物農畜(例如綿羊、山羊等)；哺乳動物寵物(犬、貓等)；及嚙齒動物(例如小鼠、大鼠等)。

術語「心臟病變」或「心臟功能障礙」可互換使用且係指心臟泵抽功能的任何障礙。此包括例如收縮性減弱、鬆弛的能力減弱(有時稱為心舒功能障礙)、心臟瓣膜的功能異常或不當、心臟肌肉的疾病(有時稱為心肌病)；諸如心絞痛、心肌缺血及/或梗塞之疾病，其特徵為供應至心臟肌肉之血液不足；浸潤性疾病，諸如澱粉樣變性及血色素沉著症；全域或局部肥大(諸如可能發生於一些類別的心肌病或全身高血壓中)，及心臟腔室之間的異常連通。

如本文所用，術語「心肌症」係指直接影響心肌症之任何疾病或功能不全。疾病或病症之病因可為例如發炎、代謝、毒性、浸潤性、纖維形成、血液、遺傳或未知病因。公認兩種基本形式：(1)主要類型，其由未知病因之心臟病組成；及(2)次要類型，其由已知病因之心肌疾病組成或與涉及其他器官系統之疾病相關。「特定心肌病」係指與某些全身或心臟病症相關之心臟病；實例包括高血壓及代謝性心肌病。心肌病包括擴張型心肌症(DCM)，一種左心室及/或右心室收縮泵功能受損，引起進行性心臟擴大之病症；肥厚性心肌病，以左心室肥大為特徵，不具有明顯原因，如高血壓或主動脈瓣狹窄；及限制性心肌病，其特徵為舒張功能異常及心室壁過度僵硬，阻礙心室充盈。心肌病亦包括左心室緻密化不全、致心律失常性右心室心肌病及致心律失常性右心室發育不良。

「心臟衰竭」係指病理狀態，其中心臟功能異常引起心臟衰竭，從而以與代謝組織之要求相稱的速率泵出血液及/或使得心臟如此僅由異常升高之舒張體積提供。心臟衰竭包括收縮性及舒張性衰竭。患有心臟衰竭之患者分為具有低心臟輸出量(通常繼發於缺血性心臟病、高血壓、擴張型心肌症及/或瓣膜病或心包病)之患者及具有心臟輸出量升高之患者(通常歸因於甲狀腺高能症、貧血、妊娠、動靜脈瘺、腳氣病及佩吉特氏病)。心臟衰竭包括射出分率降低型心臟衰竭(HFrEF)及射出分率正常型心臟衰竭(HFpEF)。

醫藥學上可接受：片語「醫藥學上可接受」在本文中用於指在合理醫學判斷範疇內，適用於與人類及動物之組織接觸而無過度毒性、刺激、過敏反應或其他問題或併發症，與合理益處/風險比相匹配的彼等化合物、材料、組合物及/或劑型。

如本文所用，術語「純化」係指已在減少或排除不相關材料(亦即，雜質)存在之條件下分離的材料，包括製得該材料的原生材料。舉例而言，經純化之rAAV載體DNA較佳基本上不含細胞或培養組分，包括組織培養組分、污染物及其類似物。

如本文在心臟組織損傷之上下文中所用，術語「再生(regenerate)」、「再生(regeneration)」及其類似術語應被賦予其普通含義且亦應指在已損傷(例如因局部缺血、梗塞、再灌注或其他疾病而損傷)之心臟或心臟組織中生長及/或發展新心臟組織的過程。在一些實施例中，心臟組織再生包含心肌細胞的產生。

如本文所用，術語「治療性基因」係指一種基因，其當表現時對存在其之細胞或組織賦予有益作用，或對表現該基因之哺乳動物賦予有益作用。有益作用之實例包括病狀或疾病之徵象或症狀的改善、病狀或疾病的預防或抑制，或所需特徵的授予。治療性基因包括部分地或完全地校正細胞或哺乳動物之基因缺乏的基因。

如本文所用，術語「功能性心肌細胞」係指分化的心肌細胞，其能夠傳送或接收電信號。在一些實施例中，若心肌細胞展現電生理學特性，諸如動作電位及/或Ca ²⁺暫態，則稱該心肌細胞為功能性心肌細胞。

如本文所用，「分化的非心臟細胞」可指一種細胞，其不能夠分化成成年生物體的所有細胞類型(亦即，不為多能細胞)，且係除心臟譜系之外的細胞譜系(例如神經元譜系或結締組織譜系)。分化細胞包括(但不限於)富能細胞、寡能細胞、單能細胞、祖細胞及終末分化細胞。在特定實施例中，相對於高能細胞，低能細胞被視為「分化的」。

「體細胞」為形成生物體之身體的細胞。體細胞包括構成生物體之器官、皮膚、血液、骨骼及結締組織的細胞，但不包括生殖細胞。

如本文所用，術語「分化全能」意謂細胞能夠形成生物體的所有細胞譜系。舉例而言，在哺乳動物中，僅接合子及第一分裂階段的分裂球為分化全能的。

如本文所用，術語「多能」意謂細胞能夠形成身體或軀體的所有譜系。舉例而言，胚胎幹細胞為能夠由三個胚層，亦即外胚層、中胚層及內胚層中之各者形成細胞的富潛能幹細胞類型。多能細胞可根據其標記物(諸如Nanog及Rex1)的表現來識別。

如本文所用，術語「富能」係指成體幹細胞能夠形成一種譜系的多種細胞類型。舉例而言，造血幹細胞能夠形成血細胞譜系的所有細胞，例如淋巴及骨髓細胞。

如本文所用，術語「寡能」係指成體幹細胞僅能夠分化成幾種不同細胞類型。舉例而言，淋巴或骨髓幹細胞能夠分別形成淋巴或骨髓譜系的細胞。

如本文所用，術語「單能」意謂細胞能夠形成單一細胞類型。舉例而言，精原幹細胞僅能夠形成精子細胞。

如本文所用，術語「再程式化」或「轉分化」係指不經由細胞去分化成展現多能幹細胞特徵之細胞的中間過程，自不同類型的細胞(例如纖維母細胞)產生某種譜系的細胞(例如心臟細胞)。

如本文所用，術語「心臟細胞」係指心臟中存在之任何細胞，其提供心臟功能，諸如心臟收縮或血液供應，或以其他方式用以維持心臟結構。如本文所用，心臟細胞涵蓋存在於心臟之心包膜、心肌或心內膜中之細胞。心臟細胞亦包括例如心臟肌肉細胞或心肌細胞，及心臟血管結構之細胞，諸如冠狀動脈或靜脈之細胞。心臟細胞之其他非限制性實例包括構成心肌、血管及心臟細胞支援結構之上皮細胞、內皮細胞、纖維母細胞、心臟幹細胞或祖細胞、心臟傳導細胞及心臟起搏細胞。心臟細胞可來源於幹細胞，包括例如胚胎幹細胞或誘導性多能幹細胞。

如本文所用，術語「心肌細胞(cardiomyocyte)」或「心肌細胞(cardiomyocytes)」係指相較於骨胳肌細胞，天然存在於哺乳動物心臟中的含肌節之橫紋肌細胞。心肌細胞之特徵為特定分子，例如蛋白質，如肌凝蛋白重鏈、肌凝蛋白輕鏈、心臟α-輔肌動蛋白之表現。如本文所用，術語「心肌細胞」為總括術語，其包含任何心肌細胞亞群或心肌細胞亞型，例如心房、心室及起搏心肌細胞。

術語「心肌細胞樣細胞」意指與心肌細胞具有共同特徵、但可以不具有所有特徵的細胞。舉例而言，心肌細胞樣細胞與心肌細胞的不同之處可為某種心臟基因的表現。

術語「培養」或「細胞培養」意謂在人工活體外環境中維持細胞。「細胞培養系統」在本文中用於指其中細胞群可以單層形式或以懸浮形式培養的培養條件。本文中所使用之「培養基」係指用於細胞之培養、生長或增殖的培養液。培養基可藉由功能特性表徵，諸如(但不限於)將細胞維持在特定狀態(例如多能狀態、靜止狀態等)或使細胞成熟之能力；具體而言，在一些實施例中，促進祖細胞分化成特定譜系之細胞(例如心肌細胞)的能力。

如本文所用，術語「表現」係指聚核苷酸轉錄成mRNA的過程及/或經轉錄之mRNA隨後轉譯成肽、多肽或蛋白質的過程。若聚核苷酸衍生自基因體DNA，則表現可包括真核細胞中mRNA之剪接。基因之表現量可藉由量測細胞或組織樣品中mRNA或蛋白質之量來確定。

術語「經誘導的心肌細胞」或縮寫「iCM」係指已轉型為心肌細胞(及/或心肌細胞樣細胞)的非心肌細胞(及其後代)。本發明之方法可結合現已知或後來發現的用於產生經誘導之心肌細胞之任何方法使用，例如以增強其他技術。

如本文所用，術語「誘導多能幹細胞衍生的心肌細胞」係指已分化成心肌細胞樣細胞的人類誘導多能幹細胞。用於製備iPS-CM細胞的例示性方法提供於Karakikes等人, Circ Res. 2015 Jun 19；117(1): 80-88中。

如本文所用，術語「人類心臟纖維母細胞」及「小鼠心臟纖維母細胞」係指分別自人類或小鼠之成體心臟之心室分離且離體培養維持的原代細胞。

如本文所用，術語「非心肌細胞」係指不滿足如本文所定義及使用之「心肌細胞」準則之細胞製劑中的任何細胞或細胞群。非心肌細胞之非限制性實例包括體細胞、心臟纖維母細胞、非心臟纖維母細胞、心臟祖細胞及幹細胞。

如本文所用，「再程式化」包括轉分化、去分化及其類似者。

如本文所用，術語「再程式化效率」係指相對於樣品中的細胞總數目，樣品中之成功再程式化成心肌細胞之細胞的數目。

如本文所用，術語「再程式化因子」包括為了在細胞中表現而引入的因子，以有助於一種細胞類型的細胞再程式化成另一種細胞類型。舉例而言，再程式化因子可包括一種轉錄因子與其他轉錄因子及/或小分子的組合，其能夠將心臟纖維母細胞再程式化成經誘導的心肌細胞。除非上下文另有明確說明，否則再程式化因子係指可由AAV遞送之聚核苷酸編碼的多肽。再程式化因子亦可包括小分子。

術語「幹細胞」係指具有自我更新及產生分化後代之能力的細胞。術語「多能幹細胞」係指可產生所有三個胚層(內胚層、中胚層及外胚層)之細胞、但不具有產生完整生物體之能力的幹細胞。

如本文所用，關於多肽或核酸序列之術語「其等效物」係指與參考多肽或核酸序列不同，但保持基本特性(例如生物活性)的多肽或核酸。聚核苷酸之典型變異體與另一參考聚核苷酸在核苷酸序列方面不同。變異體之核苷酸序列之變化可能會或可能不會改變由參考聚核苷酸編碼之多肽的胺基酸序列。核苷酸變化可引起由參考序列編碼之多肽中的胺基酸取代、缺失、添加、融合及截斷。通常，差異係有限的，以致參考多肽之序列與變異體之序列總體上十分相似且在許多區中一致。

如本文所用，術語「祖細胞」係指以分化成特定細胞類型或形成特定組織類型為己任的細胞。祖細胞(如幹細胞)可進一步分化成一或多種類別的細胞，但比幹細胞更成熟，因此，其分化能力更有限/更受限制。

術語「基因修飾」係指在引入新核酸(亦即，對於細胞而言為外源性核酸)之後在細胞中誘導之永久性或短暫的基因變化。基因變化可藉由將新核酸併入心臟細胞之基因體中來實現，或短暫或穩定維持新核酸作為染色體外元件來實現。在細胞係真核細胞的情況下，可藉由將核酸引入細胞基因體中來實現永久基因變化。基因修飾之適合方法包括病毒感染、轉染、共軛接合、原生質體融合、電穿孔、粒子槍技術、磷酸鈣沈澱、直接顯微注射及其類似方法。

術語「幹細胞」係指具有自我更新及產生分化後代之能力的細胞。術語「多能幹細胞」係指可產生所有三個胚層(內胚層、中胚層及外胚層)之細胞，但不具有產生完整生物體之能力的幹細胞。在一些實施例中，用於誘導心肌細胞表型的組合物可用於細胞群以誘導再程式化。在其他實施例中，組合物誘導心肌細胞表型。

術語「誘導性多能幹細胞」應被賦予其普通含義且亦應指分化的哺乳動物體細胞(例如成體體細胞，諸如皮膚)，其已再程式化以展現至少一種多能特徵。參見例如Takahashi等人 .(2007) Cell131(5):861-872, Kim等人 .(2011) Proc. Natl. Acad. Sci.108(19): 7838-7843, Sell (2013) Stem Cells Handbook。

術語「轉導效率」係指經至少一種AAV基因體轉導的細胞百分比。舉例而言，若1×10 ⁶個細胞暴露於病毒且0.5×10 ⁶個細胞經測定而含有AAV基因體之至少一個複本，則轉導效率為50%。用於測定轉導效率的說明性方法係流式細胞術。舉例而言，當AAV基因體包含編碼綠色螢光蛋白(GFP)的聚核苷酸時，以GFP+細胞百分比為轉導效率的量度。

術語「選擇性」係指一種細胞類型之轉導效率相對於另一種細胞類型的比率，或相對於所有其他細胞類型的比率。

術語「感染性」係指AAV病毒粒子感染細胞(尤其是活體內細胞)的能力。因此，感染性至少與生物分佈及中和抗體逃避相關。

除非另外說明，否則在整個說明書中所用之縮寫具有以下含義： AAV，腺相關病毒， rAAV，重組腺相關病毒； AHCF，成人心臟成纖維細胞； APCF，成年豬心臟成纖維細胞， a-MHC-GFP ；α-肌凝蛋白重鏈綠色螢光蛋白； CF，心臟成纖維細胞；cm，公分； CO，心輸出量； EF，射出分率； F A CS，螢光活化細胞分選； GFP，綠色螢光蛋白； GMT，Gata4、Mef2c及Tbx5； GMTc，Gata4、Mef2c、Tbx5、TGF-βi、WNTi； GO，基因本體； hCF，人類心臟成纖維細胞； iCM，誘導之心肌細胞； kg，killigram； μg，微克； μl，微升； mg，毫克； ml，毫升； MI，心肌梗塞； msec，毫秒； min，分鐘； MyAMT，心肌素、Ascl1、Mef2c及Tbx5； MyA，心肌素及Ascl1； MyMT，心肌素、Mef2c及Tbx5； MyMTc，心肌素、Mef2c、Tbx5、TGF-βi， WNTi；MRI，磁共振成像； PBS，磷酸鹽緩衝鹽水； PBST，磷酸鹽緩衝鹽水，曲拉通； PFA，多聚甲醛； qPCR，定量聚合酶鏈反應； qRT-PCR，定量逆轉錄酶聚合酶連鎖反應； RNA，核糖核酸； RNA-seq，RNA定序； RT-PCR，逆轉錄酶聚合酶連鎖反應； sec，秒； SV，心搏出量； TGF-β，轉型生長因子β； TGF-βi，轉型生長因子β抑制劑； WNT，無翅-Int； WNTi，無翅-Int抑制劑； YFP，黃色螢光蛋白質； 4F，Gata4、Mef2c、TBX5及心肌素； 4Fc，Gata4、Mef2c、TBX5及心肌素+ TGF-βi及WNTi； 7F，Gata4、Mef2c及Tbx5，Essrg、心肌素、Zfpm2及Mesp1； 7Fc，Gata4、Mef2c及Tbx5，Essrg、心肌素、Zfpm2及Mesp1 + TGF-β及WNTi。

本文所用之胺基酸縮寫為此項技術中通常已知且所用的縮寫，且如下：丙胺酸- Ala - A 精胺酸- Arg - R 天冬醯胺酸- Asn - N 天冬胺酸 - Asp - D 半胱胺酸- Cys - C 麩胺酸 - Glu - E 麩醯胺酸- Gln - Q 甘胺酸- Gly - G 組胺酸- His - H 異白胺酸- Ile - I 白胺酸- Leu - L 離胺酸- Lys - K 甲硫胺酸- Met - M 苯丙胺酸- Phe - F 脯胺酸- Pro - P 絲胺酸- Ser - S 蘇胺酸- Thr - T 色胺酸- Trp - W 酪胺酸- Tyr - Y 纈胺酸- Val - V

提及胺基酸取代係採取此項技術中常用的形式。舉例而言，提及「N452K」取代表示在參考序列之第452號位置，該編號之前的野生型胺基酸(在此為「N」)已經後續編號之胺基酸(在此為「K」)取代。

術語「保守胺基酸取代」係指與經取代之殘基具有相似側鏈物理特性之胺基酸殘基的取代。保守取代包括極性殘基取代極性殘基、非極性殘基取代非極性殘基、疏水性殘基取代疏水性殘基、小殘基取代小殘基，及大殘基取代大殘基。保守取代進一步包含以下群組內的取代：{S, T}、{A, G}、{F, Y}、{R, H, K, N, E}、{S, T, N, Q}、{C, U, G, P, A}及{A, V, I, L, M, F, Y, W}。序列 某些重組 AAV 蛋白殼蛋白之序列： 其他序列

描述	序列	SEQ ID NO
重組AAV蛋白殼蛋白ZC373	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIKGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHENTVSIAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	705
重組AAV蛋白殼蛋白ZC374	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIKGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQTLFNSAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	706
重組AAV蛋白殼蛋白ZC375	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIKGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHNSTYLGAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	707
重組AAV蛋白殼蛋白ZC376	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIKGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHGSILTHAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	708
AAV蛋白殼蛋白ACE5	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIIGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQANYGQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	709
AAV蛋白殼蛋白ACE10	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHEDNIRSAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	710
重組AAV蛋白殼蛋白部分VR-VIII	X ₁-X ₂-X ₃-X ₄- 其中X ₁為S、T或N；X ₂為T、L或I；X ₃為V、F、Y或L；且X ₄為A、N、L或T	711
重組AAV蛋白殼蛋白部分ZC373 VR-VIII	NTVS	712
重組AAV蛋白殼蛋白部分ZC374 VR-VIII	TLFN	713
重組AAV蛋白殼蛋白部分ZC375 VR-VIII	STYL	714
重組AAV蛋白殼蛋白部分ZC376 VR-VIII	SILT	715
重組AAV蛋白殼蛋白部分ZC531 VR-VIII	MTTA	716
重組AAV蛋白殼蛋白部分ZC533 VR-VIII	STSI	717
重組AAV蛋白殼蛋白部分VR-VIII	-X ₁-X ₂-X ₃-X ₄-X ₅-X ₆其中X ₁為Q、E、N、G、M或C；X ₂為S、N、T或M；X ₃為A、T、L、I或S；X ₄為Q、V、F、Y、L或I；X ₅為A、S、N、L、T或I；且X ₆為I、S、Q、G、H或R	718
重組AAV蛋白殼蛋白部分ZC373 VR-VIII	ENTVSI	719
重組AAV蛋白殼蛋白部分ZC374 VR-VIII	QTLFNS	720
重組AAV蛋白殼蛋白部分ZC375 VR-VIII	NSTYLG	721
重組AAV蛋白殼蛋白部分ZC376 VR-VIII	GSILTH	722
重組AAV蛋白殼蛋白部分ZC531 VR-VIII	MMTTAR	723
重組AAV蛋白殼蛋白部分ZC532 VR-VIII	CSTSIR	724
重組AAV蛋白殼蛋白部分ZC536 VR-VIII	EDNIRS	725
重組AAV蛋白殼蛋白ZC536 VR-VIII	ATNHEDNIRSAQTG	726
重組AAV蛋白殼蛋白VR-IV	KGSGQNQQT	727
重組AAV蛋白殼蛋白部分VR-VIII	ATNH-X ₁-X ₂-X ₃-X ₄-X ₅-X ₆-AQTG X ₁為Q、E、N、G、M、C、V或T；X ₂為S、N、T、M、G或D；X ₃為A、T、L、I、K、S、N或V；X ₄為Q、V、F、Y、L、T、S、I、R或Q；X ₅為A、S、N、L、T、I或R且X ₆為Q、I、S、G、H或R	728
重組AAV蛋白殼蛋白VR-IV	-X ₁-X ₂-X ₃-X ₄-X ₅-X ₆-X ₇-X ₈-X ₉- 其中X ₁為K、G、S或V；X ₂為Y、Q或I；X ₃為H、W、V或I；X ₄為K或N；X ₅為S、G或I；X ₆為G或R；X ₇為A、P或V；X ₈為A或R；及/或X ₉為Q或D	729
重組AAV蛋白殼蛋白VR-IV	-X ₁-X ₂-X ₃-X ₄-X ₅-X ₆-X ₇-X ₈-X ₉- 其中X ₁為K且X ₂-X ₉為任何胺基酸	730
重組AAV蛋白殼蛋白部分VR-VIII	-X ₁-X ₂-X ₃-X ₄- 其中X ₁為S、N、T、M、G或D；X ₂為A、T、L、I、K、S、N或V；X ₃為Q、V、F、Y、L、T、S、I、R或Q；且X ₄為A、S、N、L、T、I或R	731
重組AAV蛋白殼蛋白部分VR-VIII	-X ₁-X ₂-X ₃-X ₄- 其中X ₁為S、N、T、M、G或D；X ₂為T、L、I、K、S、N或V；X ₃為V、F、Y、L、T、S、I、R或Q；且X ₄為A、S、N、L、T、I或R	732
重組AAV蛋白殼蛋白部分VR-VIII	-X ₁-X ₂-X ₃-X ₄- 其中X ₁為S、N、M或T；X ₂為A、T、L或I；X ₃為Q、V、F、Y、T、S或L；且X ₄為A、S、N、L、I或T (SEQ ID NO: 733)	733
重組AAV蛋白殼蛋白部分VR-VIII	-X ₁-X ₂-X ₃-X ₄- 其中X ₁為S、N、M或T；X ₂為T、L或I；X ₃為V、F、Y、T、S或L；且X ₄為A、S、N、L、I或T	734
重組AAV蛋白殼蛋白部分VR-VIII	-X ₁-X ₂-X ₃-X ₄- X ₅-X ₆其中X ₁為Q、E、N、G、M、C、V或T；X ₂為S、N、T、M、G或D；X ₃為A、T、L、I、K、S、N或V；X ₄為V、F、Y、L、T、S、I、R或Q；X ₅為A、S、N、L、T、I或R且X ₆為Q、I、S、G、H或R	735
重組AAV蛋白殼蛋白部分VR-VIII	-X ₁-X ₂-X ₃-X ₄- X ₅-X ₆其中X ₁為Q、E、N、G、M、C、V或T；X ₂為S、N、T、M、G或D；X ₃為T、L、I、K、S、N或V；X ₄為V、F、Y、L、T、S、I、R或Q；X ₅為A、S、N、L、T、I或R且X ₆為I、S、G、H或R	736
重組AAV蛋白殼蛋白部分VR-VIII	-X ₁-X ₂-X ₃-X ₄- X ₅-X ₆其中X ₁為Q、E、N、M、C或G；X ₂為S、N、M或T；X ₃為A、T、L或I；X ₄為Q、V、F、Y、T、S或L；X ₅為A、S、N、L、I或T；且X ₆為I、S、G、R或H	737
重組AAV蛋白殼蛋白部分VR-VIII	-X ₁-X ₂-X ₃-X ₄- X ₅-X ₆其中X ₁為E、N、M、C或G；X ₂為S、N、M或T；X ₃為T、L或I；X ₄為V、F、Y、T、S或L；X ₅為A、S、N、L、I或T；且X ₆為I、S、G、R或H	738
重組AAV蛋白殼蛋白VR-VIII	ATNH-X ₁-X ₂-X ₃-X ₄-X ₅-X ₆-AQTG 其中X ₁為Q、E、N、G、M或C；X ₂為S、N、T或M；X ₃為A、T、L、I或S；X ₄為Q、V、F、Y、L或I；X ₅為A、S、N、L、T或I；且X ₆為I、S、Q、G、H或R	739
重組AAV蛋白殼蛋白VR-VIII	ATNH-(X) _n -AQTG 其中 n為4至8，且X表示20個標準胺基酸中之任一者	740
AAV蛋白殼之部分蛋白質	GAYA	741
AAV蛋白殼之部分蛋白質	TKLA	742
AAV蛋白殼之部分蛋白質	SSFT	743
AAV蛋白殼之部分蛋白質	DNIR	744
AAV蛋白殼之部分蛋白質	NVIS	745
AAV蛋白殼之部分蛋白質	GTSI	746
AAV蛋白殼之部分蛋白質	DARA	747
AAV蛋白殼之部分蛋白質	SAQA	748
AAV蛋白殼之部分蛋白質	QGAYAQ	749
AAV蛋白殼之部分蛋白質	NTKLAI	750
AAV蛋白殼之部分蛋白質	VSSFTS	751
AAV蛋白殼之部分蛋白質	NNVISG	752
AAV蛋白殼之部分蛋白質	TGTSII	753
AAV蛋白殼之部分蛋白質	QANYGQ	754
AAV蛋白殼之部分蛋白質	QDARAQ	755
AAV蛋白殼之部分蛋白質	QSAQAQ	756
AAV蛋白殼之部分蛋白質	KYHKSGAAQ	757
AAV蛋白殼之部分蛋白質	KQVNGRPRD	758
AAV蛋白殼之部分蛋白質	QHYSAQAQ	759
重組AAV蛋白殼蛋白部分VR-VIII	-X ₁-X ₂-X ₃-X ₄- 其中X ₁為S、M、D、N、G、A,T、R或I；X ₂為T、N、V、A、L、I、S、R或P；X ₃為Y、T、S、I、V、F、L、R、N、D、G或Q；且X ₄為L、A、I、R、S、G、N、T、V、Q、F、E或Y	760
重組AAV蛋白殼蛋白部分VR-VIII	-X ₁-X ₂-X ₃-X ₄- 其中X ₁為S、M、D、N、G或A；X ₂為T、N、V或A；X ₃為Y、T、S、I或V；且X ₄為L、A、I、R、S或G	761
重組AAV蛋白殼蛋白部分VR-VIII	-X ₁-X ₂-X ₃-X ₄- X ₅-X ₆- 其中X ₁為N、M、C、E、G、S、V、A、T、H、L或Q；X ₂為M、D、N、G、A、T、R、I或S；X ₃為T、N、V、L、I、S、R、P或A；X ₄為Y、T、S、I、V、F、L、R、N、D、G或Q；X ₅為L、I、R、S、G、N、T、V、Q、F、E、Y或A且X ₆為G、R、S、I、H、N、Y、L、M或Q	762
重組AAV蛋白殼蛋白部分VR-VIII	-X ₁-X ₂-X ₃-X ₄- X ₅-X ₆- 其中X ₁為N、M、C、E、G、S、V、A、T、H或L；X ₂為M、D、N、G、A、T、R或I；X ₃為T、N、V、L、I、S、R或P；X ₄為Y、T、S、I、V、F、L、R、N、D或G；X ₅為L、I、R、S、G、N、T、V、Q、F、E或Y且X ₆為G、R、S、I、H、N、Y、L或M	763
重組AAV蛋白殼蛋白部分VR-VIII	-X ₁-X ₂-X ₃-X ₄- X ₅-X ₆- 其中X ₁為E、N、G、M、C、V或T；X ₂為N、T、M、G或D；X ₃為T、L、I、K、S、N或V；X ₄為V、F、Y、L、T、S、I、R；X ₅為S、N、L、T、I或R且X ₆為I、S、G、H或R	764
重組AAV蛋白殼蛋白部分VR-VIII	-X ₁-X ₂-X ₃-X ₄- X ₅-X ₆- 其中X ₁為E、N、M、C或Q；X ₂為A、M、G、D、N或S；X ₃為T、N、V或A；X ₄為V、Y、T、S、I或Q；X ₅為S、G、L、I、R或A；且X ₆為I、S、G、R或Q	765
重組AAV蛋白殼蛋白部分VR-VIII	-X ₁-X ₂-X ₃-X ₄- X ₅-X ₆- 其中X ₁為E、N、M或C；X ₂為A、M、G、D或N；X ₃為T、N或V；X ₄為V、Y、T、S或I；X ₅為S、G、L、I或R；且X ₆為I、S、G或R	766
重組AAV蛋白殼蛋白部分 ZC531	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIKGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHMMTTARAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	767
重組AAV蛋白殼蛋白部分 ZC532	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIKGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHCSTSIRAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	768
重組AAV蛋白殼蛋白部分 ZC533	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIKGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQGAYAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	769
重組AAV蛋白殼蛋白部分 ZC534	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIKGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHNTKLAIAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	770
重組AAV蛋白殼蛋白部分 ZC535	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIKGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHVSSFTSAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	771
重組AAV蛋白殼蛋白部分 ZC536	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIKGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHEDNIRSAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	772
重組AAV蛋白殼蛋白部分 ZC537	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIKGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	773
重組AAV蛋白殼蛋白部分 ZC538	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIKGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHNNVISGAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	774
重組AAV蛋白殼蛋白部分 ZC539	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIKGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHTGTSIIAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	775
重組AAV蛋白殼蛋白部分 ZC540	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIKGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQWMSAQAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	776
重組AAV蛋白殼蛋白部分 ZC541	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIKGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQDARAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	777
重組AAV蛋白殼蛋白部分 ZC542	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIKGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQHYSAQAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	778
重組AAV蛋白殼蛋白部分 ZC369	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIKGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHNIRTEMAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	779
重組AAV蛋白殼蛋白部分 ZC370	MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTIKGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHSTTNFRAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL	780
重組AAV蛋白殼蛋白部分VR-VIII	-X ₁-X ₂-X ₃-X ₄- X ₅-X ₆-X ₇- 其中X ₁為R或H；X ₂為N、M、C、E、G、S、V、A、T、H、L或Q；X ₃為M、D、N、G、A、T、R、I或S；X ₄為T、N、V、L、I、S、R、P或A；X ₅為Y、T、S、I、V、F、L、R、N、D、G或Q；X ₆為L、I、R、S、G、N、T、V、Q、F、E、Y或A及X ₇為G、R、S、I、H、N、Y、L、M或Q	781

描述	序列	SEQ ID NO
人類DWORF蛋白質	MAEKAGSTFSHLLVPILLLIGWIVGCIIMIYVVFS	826
人類 DWORF DNA	ATGGCTGAAAAAGCGGGGTCTACATTTTCACACCTTCTGGTTCCTATTCTTCTCCTGATTGGCTGGATTGTGGGCTGCATCATAATGATTTATGTTGTCTTCTCTTAG	827
人類 DWORF DNA 經密碼子最佳化	ATGGCCGAGAAGGCCGGATCTACCTTCAGCCACCTGCTGGTCCCTATTCTGCTGCTGATCGGCTGGATCGTGGGCTGCATCATCATGATCTACGTGGTGTTCAGCTGA	828
人類 JPH2 DNA (在一些情況下可獨立地使用之序列的N端部分作為全長JPH2之替代方案以粗體展示)	ATGAGTGGGGGCCGCTTCGACTTTGATGATGGAGGGGCGTACTGCGGGGGCTGGGAGGGGGGAAAGGCCCATGGGCATGGACTGTGCACAGGCCCCAAGGGCCAGGGCGAATACTCTGGCTCCTGGAACTTTGGCTTTGAGGTGGCAGGTGTCTACACCTGGCCCAGCGGAAACACCTTTGAGGGATACTGGAGCCAGGGCAAACGGCATGGGCTGGGCATAGAGACCAAGGGGCGCTGGCTCTACAAGGGCGAGTGGACACATGGCTTCAAGGGACGCTACGGAATCCGGCAGAGCTCAAGCAGCGGTGCCAAGTATGAGGGCACCTGGAACAATGGCCTGCAAGACGGCTATGGCACCGAGACCTATGCTGATGGAGGGACGTACCAAGGCCAGTTCACCAACGGCATGCGCCATGGCTACGGAGTACGCCAGAGCGTGCCCTACGGGATGGCCGTGGTGGTGCGCTCGCCGCTGCGCACGTCGCTGTCGTCCCTGCGCAGCGAGCACAGCAACGGCACGGTGGCCCCGGACTCTCCCGCCTCGCCGGCCTCCGACGGCCCCGCGCTGCCCTCGCCCGCCATCCCGCGTGGCGGCTTCGCGCTCAGCCTCCTGGCCAATGCCGAGGCGGCCGCGCGGGCGCCCAAGGGCGGCGGCCTCTTCCAGCGGGGCGCGCTGCTGGGCAAGCTGCGGCGCGCAGAGTCGCGCACGTCCGTGGGTAGCCAGCGCAGCCGTGTCAGCTTCCTTAAGAGCGACCTCAGCTCGGGCGCCAGCGACGCCGCGTCCACCGCCAGCCTGGGAGAGGCCGCCGAGGGCGCCGACGAGGCCGCACCCTTCGAGGCCGATATCGACGCCACCACCACCGAGACCTACATGGGCGAGTGGAAGAACGACAAACGCTCGGGCTTCGGCGTGAGCGAACGCTCCAGTGGCCTCCGCTACGAGGGCGAGTGGCTGGACAACCTGCGCCACGGCTATGGCTGCACCACGCTGCCCGACGGCCACCGCGAGGAGGGCAAGTACCGCCACAACGTGCTGGTCAAGGACACCAAGCGCCGCATGCTGCAGCTCAAGAGCAACAAGGTCCGCCAGAAAGTGGAGCACAGTGTGGAGGGTGCCCAGCGCGCCGCTGCTATCGCGCGCCAGAAGGCCGAGATTGCCGCCTCCAGGACAAGCCACGCCAAGGCCAAAGCTGAGGCAGCGGAACAGGCCGCCCTGGCTGCCAACCAGGAGTCCAACATTGCTCGCACTTTGGCCAGGGAGCTGGCTCCGGACTTCTACCAGCCAGGTCCGGAATATCAGAAGCGCCGGCTGCTGCAGGAGATCCTGGAGAACTCGGAGAGCCTGCTGGAGCCCCCCGACCGGGGCGCCGGCGCAGCGGGCCTCCCACAGCCGCCCCGCGAGAGCCCGCAGCTGCACGAGCGTGAGACCCCTCGGCCCGAGGGTGGCTCCCCGTCACCGGCCGGGACGCCCCCGCAGCCCAAGCGGCCCAGGCCCGGGGTGTCCAAGGACGGCCTGCTGAGCCCAGGCGCCTGGAACGGCGAGCCCAGCGGTGAGGGCAGCCGGTCAGTCACTCCGTCCGAGGGCGCGGGCCGCCGCAGCCCCGCGCGTCCAGCCACCGAGCGCATGGCCATCGAGGCTCTGCAGGCACCGCCTGCGCCGTCGCGGGAGCCGGAGGTGGCGCTTTACCAGGGCTACCACAGCTATGCTGTGCGCACCACGCCGCCCGAGCCCCCACCCTTTGAGGACCAGCCCGAGCCCGAGGTCTCCGGGTCCGAGTCCGCGCCCTCGTCCCCGGCCACCGCCCCGCTGCAGGCCCCCACGCTCCGAGGCCCCGAGCCTGCACGCGAGACCCCCGCCAAGCTGGAGCCCAAGCCCATCATCCCCAAAGCCGAGCCCAGGGCCAAGGCCCGCAAGACTGAGGCTCGAGGGCTGACCAAGGCGGGGGCCAAGAAGAAGGCGCGGAAGGAGGCCGCACTGGCGGCAGAGGCGGAGGTGGAGGTGGAAGAGGTCCCCAACACCATCCTCATCTGCATGGTGATCCTGCTGAACATCGGCCTGGCCATCCTCTTTGTTCACCTCCTGACCTGA	782
人類JPH2蛋白質 (在一些情況下可獨立地使用之序列的N端部分作為全長JPH2之替代方案以粗體展示)	MSGGRFDFDDGGAYCGGWEGGKAHGHGLCTGPKGQGEYSGSWNFGFEVAGVYTWPSGNTFEGYWSQGKRHGLGIETKGRWLYKGEWTHGFKGRYGIRQSSSSGAKYEGTWNNGLQDGYGTETYADGGTYQGQFTNGMRHGYGVRQSVPYGMAVVVRSPLRTSLSSLRSEHSNGTVAPDSPASPASDGPALPSPAIPRGGFALSLLANAEAAARAPKGGGLFQRGALLGKLRRAESRTSVGSQRSRVSFLKSDLSSGASDAASTASLGEAAEGADEAAPFEADIDATTTETYMGEWKNDKRSGFGVSERSSGLRYEGEWLDNLRHGYGCTTLPDGHREEGKYRHNVLVKDTKRRMLQLKSNKVRQKVEHSVEGAQRAAAIARQKAEIAASRTSHAKAKAEAAEQAALAANQESNIARTLARELAPDFYQPGPEYQKRRLLQEILENSESLLEPPDRGAGAAGLPQPPRESPQLHERETPRPEGGSPSPAGTPPQPKRPRPGVSKDGLLSPGAWNGEPSGEGSRSVTPSEGAGRRSPARPATERMAIEALQAPPAPSREPEVALYQGYHSYAVRTTPPEPPPFEDQPEPEVSGSESAPSSPATAPLQAPTLRGPEPARETPAKLEPKPIIPKAEPRAKARKTEARGLTKAGAKKKARKEAALAAEAEVEVEEVPNTILICMVILLNIGLAILFVHLLT	783
人類BAG3蛋白質	MSAATHSPMMQVASGNGDRDPLPPGWEIKIDPQTGWPFFVDHNSRTTTWNDPRVPSEGPKETPSSANGPSREGSRLPPAREGHPVYPQLRPGYIPIPVLHEGAENRQVHPFHVYPQPGMQRFRTEAAAAAPQRSQSPLRGMPETTQPDKQCGQVAAAAAAQPPASHGPERSQSPAASDCSSSSSSASLPSSGRSSLGSHQLPRGYISIPVIHEQNVTRPAAQPSFHQAQKTHYPAQQGEYQTHQPVYHKIQGDDWEPRPLRAASPFRSSVQGASSREGSPARSSTPLHSPSPIRVHTVVDRPQQPMTHRETAPVSQPENKPESKPGPVGPELPPGHIPIQVIRKEVDSKPVSQKPPPPSEKVEVKVPPAPVPCPPPSPGPSAVPSSPKSVATEERAAPSTAPAEATPPKPGEAEAPPKHPGVLKVEAILEKVQGLEQAVDNFEGKKTDKKYLMIEEYLTKELLALDSVDPEGRADVRQARRDGVRKVQTILEKLEQKAIDVPGQVQVYELQPSNLEADQPLQAIMEMGAVAADKGKKNAGNAEDPHTETQQPEATAAATSNPSSMTDTPGNPAAP	784
人類BAG3 DNA	ATGAGCGCCGCCACCCACTCGCCCATGATGCAGGTGGCGTCCGGCAACGGTGACCGCGACCCTTTGCCCCCCGGATGGGAGATCAAGATCGACCCGCAGACCGGCTGGCCCTTCTTCGTGGACCACAACAGCCGCACCACTACGTGGAACGACCCGCGCGTGCCCTCTGAGGGCCCCAAGGAGACTCCATCCTCTGCCAATGGCCCTTCCCGGGAGGGCTCTAGGCTGCCGCCTGCTAGGGAAGGCCACCCTGTGTACCCCCAGCTCCGACCAGGCTACATTCCCATTCCTGTGCTCCATGAAGGCGCTGAGAACCGGCAGGTGCACCCTTTCCATGTCTATCCCCAGCCTGGGATGCAGCGATTCCGAACTGAGGCGGCAGCAGCGGCTCCTCAGAGGTCCCAGTCACCTCTGCGGGGCATGCCAGAAACCACTCAGCCAGATAAACAGTGTGGACAGGTGGCAGCGGCGGCGGCAGCCCAGCCCCCAGCCTCCCACGGACCTGAGCGGTCCCAGTCTCCAGCTGCCTCTGACTGCTCATCCTCATCCTCCTCGGCCAGCCTGCCTTCCTCCGGCAGGAGCAGCCTGGGCAGTCACCAGCTCCCGCGGGGGTACATCTCCATTCCGGTGATACACGAGCAGAACGTTACCCGGCCAGCAGCCCAGCCCTCCTTCCACCAAGCCCAGAAGACGCACTACCCAGCGCAGCAGGGGGAGTACCAGACCCACCAGCCTGTGTACCACAAGATCCAGGGGGATGACTGGGAGCCCCGGCCCCTGCGGGCGGCATCCCCGTTCAGGTCATCTGTCCAGGGTGCATCGAGCCGGGAGGGCTCACCAGCCAGGAGCAGCACGCCACTCCACTCCCCCTCGCCCATCCGTGTGCACACCGTGGTCGACAGGCCTCAGCAGCCCATGACCCATCGAGAAACTGCACCTGTTTCCCAGCCTGAAAACAAACCAGAAAGTAAGCCAGGCCCAGTTGGACCAGAACTCCCTCCTGGACACATCCCAATTCAAGTGATCCGCAAAGAGGTGGATTCTAAACCTGTTTCCCAGAAGCCCCCACCTCCCTCTGAGAAGGTAGAGGTGAAAGTTCCCCCTGCTCCAGTTCCTTGTCCTCCTCCCAGCCCTGGCCCTTCTGCTGTCCCCTCTTCCCCCAAGAGTGTGGCTACAGAAGAGAGGGCAGCCCCCAGCACTGCCCCTGCAGAAGCTACACCTCCAAAACCAGGAGAAGCCGAGGCTCCCCCAAAACATCCAGGAGTGCTGAAAGTGGAAGCCATCCTGGAGAAGGTACAGGGGCTGGAGCAGGCTGTAGACAACTTTGAAGGCAAGAAGACTGACAAAAAGTACCTGATGATCGAAGAGTATTTGACCAAAGAGCTGCTGGCCCTGGATTCAGTGGACCCCGAGGGACGAGCCGATGTGCGTCAGGCCAGGAGAGACGGTGTCAGGAAGGTTCAGACCATCTTGGAAAAACTTGAACAGAAAGCCATTGATGTCCCAGGTCAAGTCCAGGTCTATGAACTCCAGCCCAGCAACCTTGAAGCAGATCAGCCACTGCAGGCAATCATGGAGATGGGTGCCGTGGCAGCAGACAAGGGCAAGAAAAATGCTGGAAATGCAGAAGATCCCCACACAGAAACCCAGCAGCCAGAAGCCACAGCAGCAGCGACTTCAAACCCCAGCAGCATGACAGACACCCCTGGTAACCCAGCAGCACCGTAG	785
人類CRYAB蛋白質	MDIAIHHPWIRRPFFPFHSPSRLFDQFFGEHLLESDLFPTSTSLSPFYLRPPSFLRAPSWFDTGLSEMRLEKDRFSVNLDVKHFSPEELKVKVLGDVIEVHGKHEERQDEHGFISREFHRKYRIPADVDPLTITSSLSSDGVLTVNGPRKQVSGPERTIPITREEKPAVTAAPKK	786
人類CRYAB DNA	ATGGACATCGCCATCCACCACCCCTGGATCCGCCGCCCCTTCTTTCCTTTCCACTCCCCCAGCCGCCTCTTTGACCAGTTCTTCGGAGAGCACCTGTTGGAGTCTGATCTTTTCCCGACGTCTACTTCCCTGAGTCCCTTCTACCTTCGGCCACCCTCCTTCCTGCGGGCACCCAGCTGGTTTGACACTGGACTCTCAGAGATGCGCCTGGAGAAGGACAGGTTCTCTGTCAACCTGGATGTGAAGCACTTCTCCCCAGAGGAACTCAAAGTTAAGGTGTTGGGAGATGTGATTGAGGTGCATGGAAAACATGAAGAGCGCCAGGATGAACATGGTTTCATCTCCAGGGAGTTCCACAGGAAATACCGGATCCCAGCTGATGTAGACCCTCTCACCATTACTTCATCCCTGTCATCTGATGGGGTCCTCACTGTGAATGGACCAAGGAAACAGGTCTCTGGCCCTGAGCGCACCATTCCCATCACCCGTGAAGAGAAGCCTGCTGTCACCGCAGCCCCCAAGAAATAG	787
人類LMNA核纖層蛋白A蛋白質	METPSQRRATRSGAQASSTPLSPTRITRLQEKEDLQELNDRLAVYIDRVRSLETENAGLRLRITESEEVVSREVSGIKAAYEAELGDARKTLDSVAKERARLQLELSKVREEFKELKARNTKKEGDLIAAQARLKDLEALLNSKEAALSTALSEKRTLEGELHDLRGQVAKLEAALGEAKKQLQDEMLRRVDAENRLQTMKEELDFQKNIYSEELRETKRRHETRLVEIDNGKQREFESRLADALQELRAQHEDQVEQYKKELEKTYSAKLDNARQSAERNSNLVGAAHEELQQSRIRIDSLSAQLSQLQKQLAAKEAKLRDLEDSLARERDTSRRLLAEKEREMAEMRARMQQQLDEYQELLDIKLALDMEIHAYRKLLEGEEERLRLSPSPTSQRSRGRASSHSSQTQGGGSVTKKRKLESTESRSSFSQHARTSGRVAVEEVDEEGKFVRLRNKSNEDQSMGNWQIKRQNGDDPLLTYRFPPKFTLKAGQVVTIWAAGAGATHSPPTDLVWKAQNTWGCGNSLRTALINSTGEEVAMRKLVRSVTVVEDDEDEDGDDLLHHHHGSHCSSSGDPAEYNLRSRTVLCGTCGQPADKASASGSGAQVGGPISSGSSASSVTVTRSYRSVGGSGGGSFGDNLVTRSYLLGNSSPRTQSPQNCSIM	788
人類LMNA核纖層蛋白A DNA	ATGGAGACCCCGTCCCAGCGGCGCGCCACCCGCAGCGGGGCGCAGGCCAGCTCCACTCCGCTGTCGCCCACCCGCATCACCCGGCTGCAGGAGAAGGAGGACCTGCAGGAGCTCAATGATCGCTTGGCGGTCTACATCGACCGTGTGCGCTCGCTGGAAACGGAGAACGCAGGGCTGCGCCTTCGCATCACCGAGTCTGAAGAGGTGGTCAGCCGCGAGGTGTCCGGCATCAAGGCCGCCTACGAGGCCGAGCTCGGGGATGCCCGCAAGACCCTTGACTCAGTAGCCAAGGAGCGCGCCCGCCTGCAGCTGGAGCTGAGCAAAGTGCGTGAGGAGTTTAAGGAGCTGAAAGCGCGCAATACCAAGAAGGAGGGTGACCTGATAGCTGCTCAGGCTCGGCTGAAGGACCTGGAGGCTCTGCTGAACTCCAAGGAGGCCGCACTGAGCACTGCTCTCAGTGAGAAGCGCACGCTGGAGGGCGAGCTGCATGATCTGCGGGGCCAGGTGGCCAAGCTTGAGGCAGCCCTAGGTGAGGCCAAGAAGCAACTTCAGGATGAGATGCTGCGGCGGGTGGATGCTGAGAACAGGCTGCAGACCATGAAGGAGGAACTGGACTTCCAGAAGAACATCTACAGTGAGGAGCTGCGTGAGACCAAGCGCCGTCATGAGACCCGACTGGTGGAGATTGACAATGGGAAGCAGCGTGAGTTTGAGAGCCGGCTGGCGGATGCGCTGCAGGAACTGCGGGCCCAGCATGAGGACCAGGTGGAGCAGTATAAGAAGGAGCTGGAGAAGACTTATTCTGCCAAGCTGGACAATGCCAGGCAGTCTGCTGAGAGGAACAGCAACCTGGTGGGGGCTGCCCACGAGGAGCTGCAGCAGTCGCGCATCCGCATCGACAGCCTCTCTGCCCAGCTCAGCCAGCTCCAGAAGCAGCTGGCAGCCAAGGAGGCGAAGCTTCGAGACCTGGAGGACTCACTGGCCCGTGAGCGGGACACCAGCCGGCGGCTGCTGGCGGAAAAGGAGCGGGAGATGGCCGAGATGCGGGCAAGGATGCAGCAGCAGCTGGACGAGTACCAGGAGCTTCTGGACATCAAGCTGGCCCTGGACATGGAGATCCACGCCTACCGCAAGCTCTTGGAGGGCGAGGAGGAGAGGCTACGCCTGTCCCCCAGCCCTACCTCGCAGCGCAGCCGTGGCCGTGCTTCCTCTCACTCATCCCAGACACAGGGTGGGGGCAGCGTCACCAAAAAGCGCAAACTGGAGTCCACTGAGAGCCGCAGCAGCTTCTCACAGCACGCACGCACTAGCGGGCGCGTGGCCGTGGAGGAGGTGGATGAGGAGGGCAAGTTTGTCCGGCTGCGCAACAAGTCCAATGAGGACCAGTCCATGGGCAATTGGCAGATCAAGCGCCAGAATGGAGATGATCCCTTGCTGACTTACCGGTTCC CACCAAAGTTCACCCTGAAGGCTGGGCAGGTGGTGACGATCTGGGCTGCAGGAGCTGGGGCCACCCACAGCCCCCCTACCGACCTGGTGTGGAAGGCACAGAACACCTGGGGCTGCGGGAACAGCCTGCGTACGGCTCTCATCAACTCCACTGGGGAAGAAGTGGCCATGCGCAAGCTGGTGCGCTCAGTGACTGTGGTTGAGGACGACGAGGATGAGGATGGAGATGACCTGCTCCATCACCACCACGGCTCCCACTGCAGCAGCTCGGGGGACCCCGCTGAGTACAACCTGCGCTCGCGCACCGTGCTGTGCGGGACCTGCGGGCAGCCTGCCGACAAGGCATCTGCCAGCGGCTCAGGAGCCCAGGTGGGCGGACCCATCTCCTCTGGCTCTTCTGCCTCCAGTGTCACGGTCACTCGCAGCTACCGCAGTGTGGGGGGCAGTGGGGGTGGCAGCTTCGGGGACAATCTGGTCACCCGCTCCTACCTCCTGGGCAACTCCAGCCCCCGAACCCAGAGCCCCCAGAACTGCAGCATCATGTAA	789
人類LMNA核纖層蛋白C蛋白質	METPSQRRATRSGAQASSTPLSPTRITRLQEKEDLQELNDRLAVYIDRVRSLETENAGLRLRITESEEVVSREVSGIKAAYEAELGDARKTLDSVAKERARLQLELSKVREEFKELKARNTKKEGDLIAAQARLKDLEALLNSKEAALSTALSEKRTLEGELHDLRGQVAKLEAALGEAKKQLQDEMLRRVDAENRLQTMKEELDFQKNIYSEELRETKRRHETRLVEIDNGKQREFESRLADALQELRAQHEDQVEQYKKELEKTYSAKLDNARQSAERNSNLVGAAHEELQQSRIRIDSLSAQLSQLQKQLAAKEAKLRDLEDSLARERDTSRRLLAEKEREMAEMRARMQQQLDEYQELLDIKLALDMEIHAYRKLLEGEEERLRLSPSPTSQRSRGRASSHSSQTQGGGSVTKKRKLESTESRSSFSQHARTSGRVAVEEVDEEGKFVRLRNKSNEDQSMGNWQIKRQNGDDPLLTYRFPPKFTLKAGQVVTIWAAGAGATHSPPTDLVWKAQNTWGCGNSLRTALINSTGEEVAMRKLVRSVTVVEDDEDEDGDDLLHHHHVSGSRR	790
人類LMNA核纖層蛋白C DNA	ATGGAGACCCCGTCCCAGCGGCGCGCCACCCGCAGCGGGGCGCAGGCCAGCTCCACTCCGCTGTCGCCCACCCGCATCACCCGGCTGCAGGAGAAGGAGGACCTGCAGGAGCTCAATGATCGCTTGGCGGTCTACATCGACCGTGTGCGCTCGCTGGAAACGGAGAACGCAGGGCTGCGCCTTCGCATCACCGAGTCTGAAGAGGTGGTCAGCCGCGAGGTGTCCGGCATCAAGGCCGCCTACGAGGCCGAGCTCGGGGATGCCCGCAAGACCCTTGACTCAGTAGCCAAGGAGCGCGCCCGCCTGCAGCTGGAGCTGAGCAAAGTGCGTGAGGAGTTTAAGGAGCTGAAAGCGCGCAATACCAAGAAGGAGGGTGACCTGATAGCTGCTCAGGCTCGGCTGAAGGACCTGGAGGCTCTGCTGAACTCCAAGGAGGCCGCACTGAGCACTGCTCTCAGTGAGAAGCGCACGCTGGAGGGCGAGCTGCATGATCTGCGGGGCCAGGTGGCCAAGCTTGAGGCAGCCCTAGGTGAGGCCAAGAAGCAACTTCAGGATGAGATGCTGCGGCGGGTGGATGCTGAGAACAGGCTGCAGACCATGAAGGAGGAACTGGACTTCCAGAAGAACATCTACAGTGAGGAGCTGCGTGAGACCAAGCGCCGTCATGAGACCCGACTGGTGGAGATTGACAATGGGAAGCAGCGTGAGTTTGAGAGCCGGCTGGCGGATGCGCTGCAGGAACTGCGGGCCCAGCATGAGGACCAGGTGGAGCAGTATAAGAAGGAGCTGGAGAAGACTTATTCTGCCAAGCTGGACAATGCCAGGCAGTCTGCTGAGAGGAACAGCAACCTGGTGGGGGCTGCCCACGAGGAGCTGCAGCAGTCGCGCATCCGCATCGACAGCCTCTCTGCCCAGCTCAGCCAGCTCCAGAAGCAGCTGGCAGCCAAGGAGGCGAAGCTTCGAGACCTGGAGGACTCACTGGCCCGTGAGCGGGACACCAGCCGGCGGCTGCTGGCGGAAAAGGAGCGGGAGATGGCCGAGATGCGGGCAAGGATGCAGCAGCAGCTGGACGAGTACCAGGAGCTTCTGGACATCAAGCTGGCCCTGGACATGGAGATCCACGCCTACCGCAAGCTCTTGGAGGGCGAGGAGGAGAGGCTACGCCTGTCCCCCAGCCCTACCTCGCAGCGCAGCCGTGGCCGTGCTTCCTCTCACTCATCCCAGACACAGGGTGGGGGCAGCGTCACCAAAAAGCGCAAACTGGAGTCCACTGAGAGCCGCAGCAGCTTCTCACAGCACGCACGCACTAGCGGGCGCGTGGCCGTGGAGGAGGTGGATGAGGAGGGCAAGTTTGTCCGGCTGCGCAACAAGTCCAATGAGGACCAGTCCATGGGCAATTGGCAGATCAAGCGCCAGAATGGAGATGATCCCTTGCTGACTTACCGGTTCC CACCAAAGTTCACCCTGAAGGCTGGGCAGGTGGTGACGATCTGGGCTGCAGGAGCTGGGGCCACCCACAGCCCCCCTACCGACCTGGTGTGGAAGGCACAGAACACCTGGGGCTGCGGGAACAGCCTGCGTACGGCTCTCATCAACTCCACTGGGGAAGAAGTGGCCATGCGCAAGCTGGTGCGCTCAGTGACTGTGGTTGAGGACGACGAGGATGAGGATGGAGATGACCTGCTCCATCACCACCACGTGAGTGGTAGCCGCCGCTGA	791
人類TNNI3蛋白質	MADGSSDAAREPRPAPAPIRRRSSNYRAYATEPHAKKKSKISASRKLQLKTLLLQIAKQELEREAEERRGEKGRALSTRCQPLELAGLGFAELQDLCRQLHARVDKVDEERYDIEAKVTKNITEIADLTQKIFDLRGKFKRPTLRRVRISADAMMQALLGARAKESLDLRAHLKQVKKEDTEKENREVGDWRKNIDALSGMEGRKKKFES	792
人類TNNI3 DNA	ATGGCGGATGGGAGCAGCGATGCGGCTAGGGAACCTCGCCCTGCACCAGCCCCAATCAGACGCCGCTCCTCCAACTACCGCGCTTATGCCACGGAGCCGCACGCCAAGAAAAAATCTAAGATCTCCGCCTCGAGAAAATTGCAGCTGAAGACTCTGCTGCTGCAGATTGCAAAGCAAGAGCTGGAGCGAGAGGCGGAGGAGCGGCGCGGAGAGAAGGGGCGCGCTCTGAGCACCCGCTGCCAGCCGCTGGAGTTGGCCGGGCTGGGCTTCGCGGAGCTGCAGGACTTGTGCCGACAGCTCCACGCCCGTGTGGACAAGGTGGATGAAGAGAGATACGACATAGAGGCAAAAGTCACCAAGAACATCACGGAGATTGCAGATCTGACTCAGAAGATCTTTGACCTTCGAGGCAAGTTTAAGCGGCCCACCCTGCGGAGAGTGAGGATCTCTGCAGATGCCATGATGCAGGCGCTGCTGGGGGCCCGGGCTAAGGAGTCCCTGGACCTGCGGGCCCACCTCAAGCAGGTGAAGAAGGAGGACACCGAGAAGGAAAACCGGGAGGTGGGAGACTGGCGCAAGAACATCGATGCACTGAGTGGAATGGAGGGCCGCAAGAAAAAGTTTGAGAGCTGA	793
人類LAMP2a 蛋白質	MVCFRLFPVPGSGLVLVCLVLGAVRSYALELNLTDSENATCLYAKWQMNFTVRYETTNKTYKTVTISDHGTVTYNGSICGDDQNGPKIAVQFGPGFSWIANFTKAASTYSIDSVSFSYNTGDNTTFPDAEDKGILTVDELLAIRIPLNDLFRCNSLSTLEKNDVVQHYWDVLVQAFVQNGTVSTNEFLCDKDKTSTVAPTIHTTVPSPTTTPTPKEKPEAGTYSVNNGNDTCLLATMGLQLNITQDKVASVININPNTTHSTGSCRSHTALLRLNSSTIKYLDFVFAVKNENRFYLKEVNISMYLVNGSVFSIANNNLSYWDAPLGSSYMCNKEQTVSVSGAFQINTFDLRVQPFNVTQGKYSTAQDCSADDDNFLVPIAVGAALAGVLILVLLAYFIGLKHHHAGYEQF	794
人類LAMP2a DNA	ATGGTGTGCTTCCGCCTCTTCCCGGTTCCGGGCTCAGGGCTCGTTCTGGTCTGCCTAGTCCTGGGAGCTGTGCGGTCTTATGCATTGGAACTTAATTTGACAGATTCAGAAAATGCCACTTGCCTTTATGCAAAATGGCAGATGAATTTCACAGTACGCTATGAAACTACAAATAAAACTTATAAAACTGTAACCATTTCAGACCATGGCACTGTGACATATAATGGAAGCATTTGTGGGGATGATCAGAATGGTCCCAAAATAGCAGTGCAGTTCGGACCTGGCTTTTCCTGGATTGCGAATTTTACCAAGGCAGCATCTACTTATTCAATTGACAGCGTCTCATTTTCCTACAACACTGGTGATAACACAACATTTCCTGATGCTGAAGATAAAGGAATTCTTACTGTTGATGAACTTTTGGCCATCAGAATTCCATTGAATGACCTTTTTAGATGCAATAGTTTATCAACTTTGGAAAAGAATGATGTTGTCCAACACTACTGGGATGTTCTTGTACAAGCTTTTGTCCAAAATGGCACAGTGAGCACAAATGAGTTCCTGTGTGATAAAGACAAAACTTCAACAGTGGCACCCACCATACACACCACTGTGCCATCTCCTACTACAACACCTACTCCAAAGGAAAAACCAGAAGCTGGAACCTATTCAGTTAATAATGGCAATGATACTTGTCTGCTGGCTACCATGGGGCTGCAGCTGAACATCACTCAGGATAAGGTTGCTTCAGTTATTAACATCAACCCCAATACAACTCACTCCACAGGCAGCTGCCGTTCTCACACTGCTCTACTTAGACTCAATAGCAGCACCATTAAGTATCTAGACTTTGTCTTTGCTGTGAAAAATGAAAACCGATTTTATCTGAAGGAAGTGAACATCAGCATGTATTTGGTTAATGGCTCCGTTTTCAGCATTGCAAATAACAATCTCAGCTACTGGGATGCCCCCCTGGGAAGTTCTTATATGTGCAACAAAGAGCAGACTGTTTCAGTGTCTGGAGCATTTCAGATAAATACCTTTGATCTAAGGGTTCAGCCTTTCAATGTGACACAAGGAAAGTATTCTACAGCTCAAGACTGCAGTGCAGATGACGACAACTTCCTTGTGCCCATAGCGGTGGGAGCTGCCTTGGCAGGAGTACTTATTCTAGTGTTGCTGGCTTATTTTATTGGTCTCAAGCACCATCATGCTGGATATGAGCAATTTTAG	795
人類LAMP2b蛋白質	MVCFRLFPVPGSGLVLVCLVLGAVRSYALELNLTDSENATCLYAKWQMNFTVRYETTNKTYKTVTISDHGTVTYNGSICGDDQNGPKIAVQFGPGFSWIANFTKAASTYSIDSVSFSYNTGDNTTFPDAEDKGILTVDELLAIRIPLNDLFRCNSLSTLEKNDVVQHYWDVLVQAFVQNGTVSTNEFLCDKDKTSTVAPTIHTTVPSPTTTPTPKEKPEAGTYSVNNGNDTCLLATMGLQLNITQDKVASVININPNTTHSTGSCRSHTALLRLNSSTIKYLDFVFAVKNENRFYLKEVNISMYLVNGSVFSIANNNLSYWDAPLGSSYMCNKEQTVSVSGAFQINTFDLRVQPFNVTQGKYSTAQECSLDDDTILIPIIVGAGLSGLIIVIVIAYVIGRRKSYAGYQTL	796
人類LAMP2b DNA	ATGGTGTGCTTCCGCCTCTTCCCGGTTCCGGGCTCAGGGCTCGTTCTGGTCTGCCTAGTCCTGGGAGCTGTGCGGTCTTATGCATTGGAACTTAATTTGACAGATTCAGAAAATGCCACTTGCCTTTATGCAAAATGGCAGATGAATTTCACAGTACGCTATGAAACTACAAATAAAACTTATAAAACTGTAACCATTTCAGACCATGGCACTGTGACATATAATGGAAGCATTTGTGGGGATGATCAGAATGGTCCCAAAATAGCAGTGCAGTTCGGACCTGGCTTTTCCTGGATTGCGAATTTTACCAAGGCAGCATCTACTTATTCAATTGACAGCGTCTCATTTTCCTACAACACTGGTGATAACACAACATTTCCTGATGCTGAAGATAAAGGAATTCTTACTGTTGATGAACTTTTGGCCATCAGAATTCCATTGAATGACCTTTTTAGATGCAATAGTTTATCAACTTTGGAAAAGAATGATGTTGTCCAACACTACTGGGATGTTCTTGTACAAGCTTTTGTCCAAAATGGCACAGTGAGCACAAATGAGTTCCTGTGTGATAAAGACAAAACTTCAACAGTGGCACCCACCATACACACCACTGTGCCATCTCCTACTACAACACCTACTCCAAAGGAAAAACCAGAAGCTGGAACCTATTCAGTTAATAATGGCAATGATACTTGTCTGCTGGCTACCATGGGGCTGCAGCTGAACATCACTCAGGATAAGGTTGCTTCAGTTATTAACATCAACCCCAATACAACTCACTCCACAGGCAGCTGCCGTTCTCACACTGCTCTACTTAGACTCAATAGCAGCACCATTAAGTATCTAGACTTTGTCTTTGCTGTGAAAAATGAAAACCGATTTTATCTGAAGGAAGTGAACATCAGCATGTATTTGGTTAATGGCTCCGTTTTCAGCATTGCAAATAACAATCTCAGCTACTGGGATGCCCCCCTGGGAAGTTCTTATATGTGCAACAAAGAGCAGACTGTTTCAGTGTCTGGAGCATTTCAGATAAATACCTTTGATCTAAGGGTTCAGCCTTTCAATGTGACACAAGGAAAGTATTCTACAGCCCAAGAGTGTTCGCTGGATGATGACACCATTCTAATCCCAATTATAGTTGGTGCTGGTCTTTCAGGCTTGATTATCGTTATAGTGATTGCTTACGTAATTGGCAGAAGAAAAAGTTATGCTGGATATCAGACTCTGTAA	797
人類LAMP2c蛋白質	MVCFRLFPVPGSGLVLVCLVLGAVRSYALELNLTDSENATCLYAKWQMNFTVRYETTNKTYKTVTISDHGTVTYNGSICGDDQNGPKIAVQFGPGFSWIANFTKAASTYSIDSVSFSYNTGDNTTFPDAEDKGILTVDELLAIRIPLNDLFRCNSLSTLEKNDVVQHYWDVLVQAFVQNGTVSTNEFLCDKDKTSTVAPTIHTTVPSPTTTPTPKEKPEAGTYSVNNGNDTCLLATMGLQLNITQDKVASVININPNTTHSTGSCRSHTALLRLNSSTIKYLDFVFAVKNENRFYLKEVNISMYLVNGSVFSIANNNLSYWDAPLGSSYMCNKEQTVSVSGAFQINTFDLRVQPFNVTQGKYSTAEECSADSDLNFLIPVAVGVALGFLIIVVFISYMIGRRKSRTGYQSV	798
人類LAMP2c DNA	ATGGTGTGCTTCCGCCTCTTCCCGGTTCCGGGCTCAGGGCTCGTTCTGGTCTGCCTAGTCCTGGGAGCTGTGCGGTCTTATGCATTGGAACTTAATTTGACAGATTCAGAAAATGCCACTTGCCTTTATGCAAAATGGCAGATGAATTTCACAGTACGCTATGAAACTACAAATAAAACTTATAAAACTGTAACCATTTCAGACCATGGCACTGTGACATATAATGGAAGCATTTGTGGGGATGATCAGAATGGTCCCAAAATAGCAGTGCAGTTCGGACCTGGCTTTTCCTGGATTGCGAATTTTACCAAGGCAGCATCTACTTATTCAATTGACAGCGTCTCATTTTCCTACAACACTGGTGATAACACAACATTTCCTGATGCTGAAGATAAAGGAATTCTTACTGTTGATGAACTTTTGGCCATCAGAATTCCATTGAATGACCTTTTTAGATGCAATAGTTTATCAACTTTGGAAAAGAATGATGTTGTCCAACACTACTGGGATGTTCTTGTACAAGCTTTTGTCCAAAATGGCACAGTGAGCACAAATGAGTTCCTGTGTGATAAAGACAAAACTTCAACAGTGGCACCCACCATACACACCACTGTGCCATCTCCTACTACAACACCTACTCCAAAGGAAAAACCAGAAGCTGGAACCTATTCAGTTAATAATGGCAATGATACTTGTCTGCTGGCTACCATGGGGCTGCAGCTGAACATCACTCAGGATAAGGTTGCTTCAGTTATTAACATCAACCCCAATACAACTCACTCCACAGGCAGCTGCCGTTCTCACACTGCTCTACTTAGACTCAATAGCAGCACCATTAAGTATCTAGACTTTGTCTTTGCTGTGAAAAATGAAAACCGATTTTATCTGAAGGAAGTGAACATCAGCATGTATTTGGTTAATGGCTCCGTTTTCAGCATTGCAAATAACAATCTCAGCTACTGGGATGCCCCCCTGGGAAGTTCTTATATGTGCAACAAAGAGCAGACTGTTTCAGTGTCTGGAGCATTTCAGATAAATACCTTTGATCTAAGGGTTCAGCCTTTCAATGTGACACAAGGAAAGTATTCTACAGCTGAAGAATGTTCTGCTGACTCTGACCTCAACTTTCTTATTCCTGTTGCAGTGGGTGTGGCCTTGGGCTTCCTTATAATTGTTGTCTTTATCTCTTATATGATTGGAAGAAGGAAAAGTCGTACTGGTTATCAGTCTGTGTAA	799
人類DSP_DPI蛋白質	MSCNGGSHPRINTLGRMIRAESGPDLRYEVTSGGGGTSRMYYSRRGVITDQNSDGYCQTGTMSRHQNQNTIQELLQNCSDCLMRAELIVQPELKYGDGIQLTRSRELDECFAQANDQMEILDSLIREMRQMGQPCDAYQKRLLQLQEQMRALYKAISVPRVRRASSKGGGGYTCQSGSGWDEFTKHVTSECLGWMRQQRAEMDMVAWGVDLASVEQHINSHRGIHNSIGDYRWQLDKIKADLREKSAIYQLEEEYENLLKASFERMDHLRQLQNIIQATSREIMWINDCEEEELLYDWSDKNTNIAQKQEAFSIRMSQLEVKEKELNKLKQESDQLVLNQHPASDKIEAYMDTLQTQWSWILQITKCIDVHLKENAAYFQFFEEAQSTEAYLKGLQDSIRKKYPCDKNMPLQHLLEQIKELEKEREKILEYKRQVQNLVNKSKKIVQLKPRNPDYRSNKPIILRALCDYKQDQKIVHKGDECILKDNNERSKWYVTGPGGVDMLVPSVGLIIPPPNPLAVDLSCKIEQYYEAILALWNQLYINMKSLVSWHYCMIDIEKIRAMTIAKLKTMRQEDYMKTIADLELHYQEFIRNSQGSEMFGDDDKRKIQSQFTDAQKHYQTLVIQLPGYPQHQTVTTTEITHHGTCQDVNHNKVIETNRENDKQETWMLMELQKIRRQIEHCEGRMTLKNLPLADQGSSHHITVKINELKSVQNDSQAIAEVLNQLKDMLANFRGSEKYCYLQNEVFGLFQKLENINGVTDGYLNSLCTVRALLQAILQTEDMLKVYEARLTEEETVCLDLDKVEAYRCGLKKIKNDLNLKKSLLATMKTELQKAQQIHSQTSQQYPLYDLDLGKFGEKVTQLTDRWQRIDKQIDFRLWDLEKQIKQLRNYRDNYQAFCKWLYDAKRRQDSLESMKFGDSNTVMRFLNEQKNLHSEISGKRDKSEEVQKIAELCANSIKDYELQLASYTSGLETLLNIPIKRTMIQSPSGVILQEAADVHARYIELLTRSGDYYRFLSEMLKSLEDLKLKNTKIEVLEEELRLARDANSENCNKNKFLDQNLQKYQAECSQFKAKLASLEELKRQAELDGKSAKQNLDKCYGQIKELNEKITRLTYEIEDEKRRRKSVEDRFDQQKNDYDQLQKARQCEKENLGWQKLESEKAIKEKEYEIERLRVLLQEEGTRKREYENELAKVRNHYNEEMSNLRNKYETEINITKTTIKEISMQKEDDSKNLRNQLDRLSRENRDLKDEIVRLNDSILQATEQRRRAEENALQQKACGSEIMQKKQHLEIELKQVMQQRSEDNARHKQSLEEAAKTIQDKNKEIERLKAEFQEEAKRRWEYENELSKVRNNYDEEIISLKNQFETEINITKTTIHQLTMQKEEDTSGYRAQIDNLTRENRSLSEEIKRLKNTLTQTTENLRRVEEDIQQQKATGSEVSQRKQQLEVELRQVTQMRTEESVRYKQSLDDAAKTIQDKNKEIERLKQLIDKETNDRKCLEDENARLQRVQYDLQKANSSATETINKLKVQEQELTRLRIDYERVSQERTVKDQDITRFQNSLKELQLQKQKVEEELNRLKRTASEDSCKRKKLEEELEGMRRSLKEQAIKITNLTQQLEQASIVKKRSEDDLRQQRDVLDGHLREKQRTQEELRRLSSEVEALRRQLLQEQESVKQAHLRNEHFQKAIEDKSRSLNESKIEIERLQSLTENLTKEHLMLEEELRNLRLEYDDLRRGRSEADSDKNATILELRSQLQISNNRTLELQGLINDLQRERENLRQEIEKFQKQALEASNRIQESKNQCTQVVQERESLLVKIKVLEQDKARLQRLEDELNRAKSTLEAETRVKQRLECEKQQIQNDLNQWKTQYSRKEEAIRKIESEREKSEREKNSLRSEIERLQAEIKRIEERCRRKLEDSTRETQSQLETERSRYQREIDKLRQRPYGSHRETQTECEWTVDTSKLVFDGLRKKVTAMQLYECQLIDKTTLDKLLKGKKSVEEVASEIQPFLRGAGSIAGASASPKEKYSLVEAKRKKLISPESTVMLLEAQAATGGIIDPHRNEKLTVDSAIARDLIDFDDRQQIYAAEKAITGFDDPFSGKTVSVSEAIKKNLIDRETGMRLLEAQIASGGVVDPVNSVFLPKDVALARGLIDRDLYRSLNDPRDSQKNFVDPVTKKKVSYVQLKERCRIEPHTGLLLLSVQKRSMSFQGIRQPVTVTELVDSGILRPSTVNELESGQISYDEVGERIKDFLQGSSCIAGIYNETTKQKLGIYEAMKIGLVRPGTALELLEAQAATGFIVDPVSNLRLPVEEAYKRGLVGIEFKEKLLSAERAVTGYNDPETGNIISLFQAMNKELIEKGHGIRLLEAQIATGGIIDPKESHRLPVDIAYKRGYFNEELSEILSDPSDDTKGFFDPNTEENLTYLQLKERCIKDEETGLCLLPLKEKKKQVQTSQKNTLRKRRVVIVDPETNKEMSVQEAYKKGLIDYETFKELCEQECEWEEITITGSDGSTRVVLVDRKTGSQYDIQDAIDKGLVDRKFFDQYRSGSLSLTQFADMISLKNGVGTSSSMGSGVSDDVFSSSRHESVSKISTISSVRNLTIRSSSFSDTLEESSPIAAIFDTENLEKISITEGIERGIVDSITGQRLLEAQACTGGIIHPTTGQKLSLQDAVSQGVIDQDMATRLKPAQKAFIGFEGVKGKKKMSAAEAVKEKWLPYEAGQRFLEFQYLTGGLVDPEVHGRISTEEAIRKGFIDGRAAQRLQDTSSYAKILTCPKTKLKISYKDAINRSMVEDITGLRLLEAASVSSKGLPSPYNMSSAPGSRSGSRSGSRSGSRSGSRSGSRRGSFDATGNSSYSYSYSFSSSSIGH	800
人類DSP_DPI DNA	ATGAGCTGCAACGGAGGCTCCCACCCGCGGATCAACACTCTGGGCCGCATGATCCGCGCCGAGTCTGGCCCGGACCTGCGCTACGAGGTGACCAGCGGCGGCGGGGGCACCAGCAGGATGTACTATTCTCGGCGCGGCGTGATCACCGACCAGAACTCGGACGGCTACTGTCAAACCGGCACGATGTCCAGGCACCAGAACCAGAACACCATCCAGGAGCTGCTGCAGAACTGCTCCGACTGCTTGATGCGAGCAGAGCTCATCGTGCAGCCTGAATTGAAGTATGGAGATGGAATACAACTGACTCGGAGTCGAGAATTGGATGAGTGTTTTGCCCAGGCCAATGACCAAATGGAAATCCTCGACAGCTTGATCAGAGAGATGCGGCAGATGGGCCAGCCCTGTGATGCTTACCAGAAAAGGCTTCTTCAGCTCCAAGAGCAAATGCGAGCCCTTTATAAAGCCATCAGTGTCCCTCGAGTCCGCAGGGCCAGCTCCAAGGGTGGTGGAGGCTACACTTGTCAGAGTGGCTCTGGCTGGGATGAGTTCACCAAACATGTCACCAGTGAATGTTTGGGGTGGATGAGGCAGCAAAGGGCGGAGATGGACATGGTGGCCTGGGGTGTGGACCTGGCCTCAGTGGAGCAGCACATTAACAGCCACCGGGGCATCCACAACTCCATCGGCGACTATCGCTGGCAGCTGGACAAAATCAAAGCCGACCTGCGCGAGAAATCTGCGATCTACCAGTTGGAGGAGGAGTATGAAAACCTGCTGAAAGCGTCCTTTGAGAGGATGGATCACCTGCGACAGCTGCAGAACATCATTCAGGCCACGTCCAGGGAGATCATGTGGATCAATGACTGCGAGGAGGAGGAGCTGCTGTACGACTGGAGCGACAAGAACACCAACATCGCTCAGAAACAGGAGGCCTTCTCCATACGCATGAGTCAACTGGAAGTTAAAGAAAAAGAGCTCAATAAGCTGAAACAAGAAAGTGACCAACTTGTCCTCAATCAGCATCCAGCTTCAGACAAAATTGAGGCCTATATGGACACTCTGCAGACGCAGTGGAGTTGGATTCTTCAGATCACCAAGTGCATTGATGTTCATCTGAAAGAAAATGCTGCCTACTTTCAGTTTTTTGAAGAGGCGCAGTCTACTGAAGCATACCTGAAGGGGCTCCAGGACTCCATCAGGAAGAAGTACCCCTGCGACAAGAACATGCCCCTGCAGCACCTGCTGGAACAGATCAAGGAGCTGGAGAAAGAACGAGAGAAAATCCTTGAATACAAGCGTCAGGTGCAGAACTTGGTAAACAAGTCTAAGAAGATTGTACAGCTGAAGCCTCGTAACCCAGACTACAGAAGCAATAAACCCATTATTCTCAGAGCTCTCTGTGACTACAAACAAGATCAGAAAATCGTGCATAAGGGGGATGAGTGTATCCTGAAGGACAACAACGAGCGCAGCAAGTGGTACGTGACGGGCCCGGGAGGCGTTGACATGCTTGTTCCCTCTGTGGGGCTGATCATCCCTCCTCCGAACCCACTGGCCGTGGACCTCTCTTGCAAGATTGAGCAGTACTACGAAGCCATCTTGGCTCTGTGGAACCAGCTCTACATCAACATGAAGAGCCTGGTGTCCTGGCACTACTGCATGATTGACATAGAGAAGATCAGGGCCATGACAATCGCCAAGCTGAAAACAATGCGGCAGGAAGATTACATGAAGACGATAGCCGACCTTGAGTTACATTACCAAGAGTTCATCAGAAATAGCCAAGGCTCAGAGATGTTTGGAGATGATGACAAGCGGAAAATACAGTCTCAGTTCACCGATGCCCAGAAGCATTACCAGACCCTGGTCATTCAGCTCCCTGGCTATCCCCAGCACCAGACAGTGACCACAACTGAAATCACTCATCATGGAACCTGCCAAGATGTCAACCATAATAAAGTAATTGAAACCAACAGAGAAAATGACAAGCAAGAAACATGGATGCTGATGGAGCTGCAGAAGATTCGCAGGCAGATAGAGCACTGCGAGGGCAGGATGACTCTCAAAAACCTCCCTCTAGCAGACCAGGGATCTTCTCACCACATCACAGTGAAAATTAACGAGCTTAAGAGTGTGCAGAATGATTCACAAGCAATTGCTGAGGTTCTCAACCAGCTTAAAGATATGCTTGCCAACTTCAGAGGTTCTGAAAAGTACTGCTATTTACAGAATGAAGTATTTGGACTATTTCAGAAACTGGAAAATATCAATGGTGTTACAGATGGCTACTTAAATAGCTTATGCACAGTAAGGGCACTGCTCCAGGCTATTCTCCAAACAGAAGACATGTTAAAGGTTTATGAAGCCAGGCTCACTGAGGAGGAAACTGTCTGCCTGGACCTGGATAAAGTGGAAGCTTACCGCTGTGGACTGAAGAAAATAAAAAATGACTTGAACTTGAAGAAGTCGTTGTTGGCCACTATGAAGACAGAACTACAGAAAGCCCAGCAGATCCACTCTCAGACTTCACAGCAGTATCCACTTTATGATCTGGACTTGGGCAAGTTCGGTGAAAAAGTCACACAGCTGACAGACCGCTGGCAAAGGATAGATAAACAGATCGACTTTAGGTTATGGGACCTGGAGAAACAAATCAAGCAATTGAGGAATTATCGTGATAACTATCAGGCTTTCTGCAAGTGGCTCTATGATGCTAAACGCCGCCAGGATTCCTTAGAATCCATGAAATTTGGAGATTCCAACACAGTCATGCGGTTTTTGAATGAGCAGAAGAACTTGCACAGTGAAATATCTGGCAAACGAGACAAATCAGAGGAAGTACAAAAAATTGCTGAACTTTGCGCCAATTCAATTAAGGATTATGAGCTCCAGCTGGCCTCATACACCTCAGGACTGGAAACTCTGCTGAACATACCTATCAAGAGGACCATGATTCAGTCCCCTTCTGGGGTGATTCTGCAAGAGGCTGCAGATGTTCATGCTCGGTACATTGAACTACTTACAAGATCTGGAGACTATTACAGGTTCTTAAGTGAGATGCTGAAGAGTTTGGAAGATCTGAAGCTGAAAAATACCAAGATCGAAGTTTTGGAAGAGGAGCTCAGACTGGCCCGAGATGCCAACTCGGAAAACTGTAATAAGAACAAATTCCTGGATCAGAACCTGCAGAAATACCAGGCAGAGTGTTCCCAGTTCAAAGCGAAGCTTGCGAGCCTGGAGGAGCTGAAGAGACAGGCTGAGCTGGATGGGAAGTCGGCTAAGCAAAATCTAGACAAGTGCTACGGCCAAATAAAAGAACTCAATGAGAAGATCACCCGACTGACTTATGAGATTGAAGATGAAAAGAGAAGAAGAAAATCTGTGGAAGACAGATTTGACCAACAGAAGAATGACTATGACCAACTGCAGAAAGCAAGGCAATGTGAAAAGGAGAACCTTGGTTGGCAGAAATTAGAGTCTGAGAAAGCCATCAAGGAGAAGGAGTACGAGATTGAAAGGTTGAGGGTTCTACTGCAGGAAGAAGGCACCCGGAAGAGAGAATATGAAAATGAGCTGGCAAAGGTAAGAAACCACTATAATGAGGAGATGAGTAATTTAAGGAACAAGTATGAAACAGAGATTAACATTACGAAGACCACCATCAAGGAGATATCCATGCAAAAAGAGGATGATTCCAAAAATCTTAGAAACCAGCTTGATAGACTTTCAAGGGAAAATCGAGATCTGAAGGATGAAATTGTCAGGCTCAATGACAGCATCTTGCAGGCCACTGAGCAGCGAAGGCGAGCTGAAGAAAACGCCCTTCAGCAAAAGGCCTGTGGCTCTGAGATAATGCAGAAGAAGCAGCATCTGGAGATAGAACTGAAGCAGGTCATGCAGCAGCGCTCTGAGGACAATGCCCGGCACAAGCAGTCCCTGGAGGAGGCTGCCAAGACCATTCAGGACAAAAATAAGGAGATCGAGAGACTCAAAGCTGAGTTTCAGGAGGAGGCCAAGCGCCGCTGGGAATATGAAAATGAACTGAGTAAGGTAAGAAACAATTATGATGAGGAGATCATTAGCTTAAAAAATCAGTTTGAGACCGAGATCAACATCACCAAGACCACCATCCACCAGCTCACCATGCAGAAGGAAGAGGATACCAGTGGCTACCGGGCTCAGATAGACAATCTCACCCGAGAAAACAGGAGCTTATCTGAAGAAATAAAGAGGCTGAAGAACACTCTAACCCAGACCACAGAGAATCTCAGGAGGGTGGAAGAAGACATCCAACAGCAAAAGGCCACTGGCTCTGAGGTGTCTCAGAGGAAACAGCAGCTGGAGGTTGAGCTGAGACAAGTCACTCAGATGCGAACAGAGGAGAGCGTAAGATATAAGCAATCTCTTGATGATGCTGCCAAAACCATCCAGGATAAAAACAAGGAGATAGAAAGGTTAAAACAACTGATCGACAAAGAAACAAATGACCGGAAATGCCTGGAAGATGAAAACGCGAGATTACAAAGGGTCCAGTATGACCTGCAGAAAGCAAACAGTAGTGCGACGGAGACAATAAACAAACTGAAGGTTCAGGAGCAAGAACTGACACGCCTGAGGATCGACTATGAAAGGGTTTCCCAGGAGAGGACTGTGAAGGACCAGGATATCACGCGGTTCCAGAACTCTCTGAAAGAGCTGCAGCTGCAGAAGCAGAAGGTGGAAGAGGAGCTGAATCGGCTGAAGAGGACCGCGTCAGAAGACTCCTGCAAGAGGAAGAAGCTGGAGGAAGAGCTGGAAGGCATGAGGAGGTCGCTGAAGGAGCAAGCCATCAAAATCACCAACCTGACCCAGCAGCTGGAGCAGGCATCCATTGTTAAGAAGAGGAGTGAGGATGACCTCCGGCAGCAGAGGGACGTGCTGGATGGCCACCTGAGGGAAAAGCAGAGGACCCAGGAAGAGCTGAGGAGGCTCTCTTCTGAGGTCGAGGCCCTGAGGCGGCAGTTACTCCAGGAACAGGAAAGTGTCAAACAAGCTCACTTGAGGAATGAGCATTTCCAGAAGGCGATAGAAGATAAAAGCAGAAGCTTAAATGAAAGCAAAATAGAAATTGAGAGGCTGCAGTCTCTCACAGAGAACCTGACCAAGGAGCACTTGATGTTAGAAGAAGAACTGCGGAACCTGAGGCTGGAGTACGATGACCTGAGGAGAGGACGAAGCGAAGCGGACAGTGATAAAAATGCAACCATCTTGGAACTAAGGAGCCAGCTGCAGATCAGCAACAACCGGACCCTGGAACTGCAGGGGCTGATTAATGATTTACAGAGAGAGAGGGAAAATTTGAGACAGGAAATTGAGAAATTCCAAAAGCAGGCTTTAGAGGCATCTAATAGGATTCAGGAATCAAAGAATCAGTGTACTCAGGTGGTACAGGAAAGAGAGAGCCTTCTGGTGAAAATCAAAGTCCTGGAGCAAGACAAGGCAAGGCTGCAGAGGCTGGAGGATGAGCTGAATCGTGCAAAATCAACTCTAGAGGCAGAAACCAGGGTGAAACAGCGCCTGGAGTGTGAGAAACAGCAAATTCAGAATGACCTGAATCAGTGGAAGACTCAATATTCCCGCAAGGAGGAGGCTATTAGGAAGATAGAATCGGAAAGAGAAAAGAGTGAGAGAGAGAAGAACAGTCTTAGGAGTGAGATCGAAAGACTCCAAGCAGAGATCAAGAGAATTGAAGAGAGGTGCAGGCGTAAGCTGGAGGATTCTACCAGGGAGACACAGTCACAGTTAGAAACAGAACGCTCCCGATATCAGAGGGAGATTGATAAACTCAGACAGCGCCCATATGGGTCCCATCGAGAGACCCAGACTGAGTGTGAGTGGACCGTTGACACCTCCAAGCTGGTGTTTGATGGGCTGAGGAAGAAGGTGACAGCAATGCAGCTCTATGAGTGTCAGCTGATCGACAAAACAACCTTGGACAAACTATTGAAGGGGAAGAAGTCAGTGGAAGAAGTTGCTTCTGAAATCCAGCCATTCCTTCGGGGTGCAGGATCTATCGCTGGAGCATCTGCTTCTCCTAAGGAAAAATACTCTTTGGTAGAGGCCAAGAGAAAGAAATTAATCAGCCCAGAATCCACAGTCATGCTTCTGGAGGCCCAGGCAGCTACAGGTGGTATAATTGATCCCCATCGGAATGAGAAGCTGACTGTCGACAGTGCCATAGCTCGGGACCTCATTGACTTCGATGACCGTCAGCAGATATATGCAGCAGAAAAAGCTATCACTGGTTTTGATGATCCATTTTCAGGCAAGACAGTATCTGTTTCAGAAGCCATCAAGAAAAATTTGATTGATAGAGAAACCGGAATGCGCCTGCTGGAAGCCCAGATTGCTTCAGGGGGTGTAGTAGACCCTGTGAACAGTGTCTTTTTGCCAAAAGATGTCGCCTTGGCCCGGGGGCTGATTGATAGAGATTTGTATCGATCCCTGAATGATCCCCGAGATAGTCAGAAAAACTTTGTGGATCCAGTCACCAAAAAGAAGGTCAGTTACGTGCAGCTGAAGGAACGGTGCAGAATCGAACCACATACTGGTCTGCTCTTGCTTTCAGTACAGAAGAGAAGCATGTCCTTCCAAGGAATCAGACAACCTGTGACCGTCACTGAGCTAGTAGATTCTGGTATATTGAGACCGTCCACTGTCAATGAACTGGAATCTGGTCAGATTTCTTATGACGAGGTTGGTGAGAGAATTAAGGACTTCCTCCAGGGTTCAAGCTGCATAGCAGGCATATACAATGAGACCACAAAACAGAAGCTTGGCATTTATGAGGCCATGAAAATTGGCTTAGTCCGACCTGGTACTGCTCTGGAGTTGCTGGAAGCCCAAGCAGCTACTGGCTTTATAGTGGATCCTGTTAGCAACTTGAGGTTACCAGTGGAGGAAGCCTACAAGAGAGGTCTGGTGGGCATTGAGTTCAAAGAGAAGCTCCTGTCTGCAGAACGAGCTGTCACTGGGTATAATGATCCTGAAACAGGAAACATCATCTCTTTGTTCCAAGCCATGAATAAGGAACTCATCGAAAAGGGCCACGGTATTCGCTTATTAGAAGCACAGATCGCAACCGGGGGGATCATTGACCCAAAGGAGAGCCATCGTTTACCAGTTGACATAGCATATAAGAGGGGCTATTTCAATGAGGAACTCAGTGAGATTCTCTCAGATCCAAGTGATGATACCAAAGGATTTTTTGACCCCAACACTGAAGAAAATCTTACCTATCTGCAACTAAAAGAAAGATGCATTAAGGATGAGGAAACAGGGCTCTGTCTTCTGCCTCTGAAAGAAAAGAAGAAACAGGTGCAGACATCACAAAAGAATACCCTCAGGAAGCGTAGAGTGGTCATAGTTGACCCAGAAACCAATAAAGAAATGTCTGTTCAGGAGGCCTACAAGAAGGGCCTAATTGATTATGAAACCTTCAAAGAACTGTGTGAGCAGGAATGTGAATGGGAAGAAATAACCATCACGGGATCAGATGGCTCCACCAGGGTGGTCCTGGTAGATAGAAAGACAGGCAGTCAGTATGATATTCAAGATGCTATTGACAAGGGCCTTGTTGACAGGAAGTTCTTTGATCAGTACCGATCCGGCAGCCTCAGCCTCACTCAATTTGCTGACATGATCTCCTTGAAAAATGGTGTCGGCACCAGCAGCAGCATGGGCAGTGGTGTCAGCGATGATGTTTTTAGCAGCTCCCGACATGAATCAGTAAGTAAGATTTCCACCATATCCAGCGTCAGGAATTTAACCATAAGGAGCAGCTCTTTTTCAGACACCCTGGAAGAATCGAGCCCCATTGCAGCCATCTTTGACACAGAAAACCTGGAGAAAATCTCCATTACAGAAGGTATAGAGCGGGGCATCGTTGACAGCATCACGGGTCAGAGGCTTCTGGAGGCTCAGGCCTGCACAGGTGGCATCATCCACCCAACCACGGGCCAGAAGCTGTCACTTCAGGACGCAGTCTCCCAGGGTGTGATTGACCAAGACATGGCCACCAGGCTGAAGCCTGCTCAGAAAGCCTTCATAGGCTTCGAGGGTGTGAAGGGAAAGAAGAAGATGTCAGCAGCAGAGGCAGTGAAAGAAAAATGGCTCCCGTATGAGGCTGGCCAGCGCTTCCTGGAGTTCCAGTACCTCACGGGAGGTCTTGTTGACCCGGAAGTGCATGGGAGGATAAGCACCGAAGAAGCCATCCGGAAGGGGTTCATAGATGGCCGCGCCGCACAGAGGCTGCAAGACACCAGCAGCTATGCCAAAATCCTGACCTGCCCCAAAACCAAATTAAAAATATCCTATAAGGATGCCATAAATCGCTCCATGGTAGAAGATATCACTGGGCTGCGCCTTCTGGAAGCCGCCTCCGTGTCGTCCAAGGGCTTACCCAGCCCTTACAACATGTCTTCGGCTCCGGGGTCCCGCTCCGGCTCCCGCTCGGGATCTCGCTCCGGATCTCGCTCCGGGTCCCGCAGTGGGTCCCGGAGAGGAAGCTTTGACGCCACAGGGAATTCTTCCTACTCTTATTCCTACTCATTTAGCAGTAGTTCTATTGGGCACTAG	801
人類DSP DPII同功型蛋白質	MSCNGGSHPRINTLGRMIRAESGPDLRYEVTSGGGGTSRMYYSRRGVITDQNSDGYCQTGTMSRHQNQNTIQELLQNCSDCLMRAELIVQPELKYGDGIQLTRSRELDECFAQANDQMEILDSLIREMRQMGQPCDAYQKRLLQLQEQMRALYKAISVPRVRRASSKGGGGYTCQSGSGWDEFTKHVTSECLGWMRQQRAEMDMVAWGVDLASVEQHINSHRGIHNSIGDYRWQLDKIKADLREKSAIYQLEEEYENLLKASFERMDHLRQLQNIIQATSREIMWINDCEEEELLYDWSDKNTNIAQKQEAFSIRMSQLEVKEKELNKLKQESDQLVLNQHPASDKIEAYMDTLQTQWSWILQITKCIDVHLKENAAYFQFFEEAQSTEAYLKGLQDSIRKKYPCDKNMPLQHLLEQIKELEKEREKILEYKRQVQNLVNKSKKIVQLKPRNPDYRSNKPIILRALCDYKQDQKIVHKGDECILKDNNERSKWYVTGPGGVDMLVPSVGLIIPPPNPLAVDLSCKIEQYYEAILALWNQLYINMKSLVSWHYCMIDIEKIRAMTIAKLKTMRQEDYMKTIADLELHYQEFIRNSQGSEMFGDDDKRKIQSQFTDAQKHYQTLVIQLPGYPQHQTVTTTEITHHGTCQDVNHNKVIETNRENDKQETWMLMELQKIRRQIEHCEGRMTLKNLPLADQGSSHHITVKINELKSVQNDSQAIAEVLNQLKDMLANFRGSEKYCYLQNEVFGLFQKLENINGVTDGYLNSLCTVRALLQAILQTEDMLKVYEARLTEEETVCLDLDKVEAYRCGLKKIKNDLNLKKSLLATMKTELQKAQQIHSQTSQQYPLYDLDLGKFGEKVTQLTDRWQRIDKQIDFRLWDLEKQIKQLRNYRDNYQAFCKWLYDAKRRQDSLESMKFGDSNTVMRFLNEQKNLHSEISGKRDKSEEVQKIAELCANSIKDYELQLASYTSGLETLLNIPIKRTMIQSPSGVILQEAADVHARYIELLTRSGDYYRFLSEMLKSLEDLKLKNTKIEVLEEELRLARDANSENCNKNKFLDQNLQKYQAECSQFKAKLASLEELKRQAELDGKSAKQNLDKCYGQIKELNEKITRLTYEIEDEKRRRKSVEDRFDQQKNDYDQLQKARQCEKENLGWQKLESEKAIKEKEYEIERLRVLLQEEGTRKREYENELAKASNRIQESKNQCTQVVQERESLLVKIKVLEQDKARLQRLEDELNRAKSTLEAETRVKQRLECEKQQIQNDLNQWKTQYSRKEEAIRKIESEREKSEREKNSLRSEIERLQAEIKRIEERCRRKLEDSTRETQSQLETERSRYQREIDKLRQRPYGSHRETQTECEWTVDTSKLVFDGLRKKVTAMQLYECQLIDKTTLDKLLKGKKSVEEVASEIQPFLRGAGSIAGASASPKEKYSLVEAKRKKLISPESTVMLLEAQAATGGIIDPHRNEKLTVDSAIARDLIDFDDRQQIYAAEKAITGFDDPFSGKTVSVSEAIKKNLIDRETGMRLLEAQIASGGVVDPVNSVFLPKDVALARGLIDRDLYRSLNDPRDSQKNFVDPVTKKKVSYVQLKERCRIEPHTGLLLLSVQKRSMSFQGIRQPVTVTELVDSGILRPSTVNELESGQISYDEVGERIKDFLQGSSCIAGIYNETTKQKLGIYEAMKIGLVRPGTALELLEAQAATGFIVDPVSNLRLPVEEAYKRGLVGIEFKEKLLSAERAVTGYNDPETGNIISLFQAMNKELIEKGHGIRLLEAQIATGGIIDPKESHRLPVDIAYKRGYFNEELSEILSDPSDDTKGFFDPNTEENLTYLQLKERCIKDEETGLCLLPLKEKKKQVQTSQKNTLRKRRVVIVDPETNKEMSVQEAYKKGLIDYETFKELCEQECEWEEITITGSDGSTRVVLVDRKTGSQYDIQDAIDKGLVDRKFFDQYRSGSLSLTQFADMISLKNGVGTSSSMGSGVSDDVFSSSRHESVSKISTISSVRNLTIRSSSFSDTLEESSPIAAIFDTENLEKISITEGIERGIVDSITGQRLLEAQACTGGIIHPTTGQKLSLQDAVSQGVIDQDMATRLKPAQKAFIGFEGVKGKKKMSAAEAVKEKWLPYEAGQRFLEFQYLTGGLVDPEVHGRISTEEAIRKGFIDGRAAQRLQDTSSYAKILTCPKTKLKISYKDAINRSMVEDITGLRLLEAASVSSKGLPSPYNMSSAPGSRSGSRSGSRSGSRSGSRSGSRRGSFDATGNSSYSYSYSFSSSSIGH	802
人類DSP DPII同功型DNA	ATGAGCTGCAACGGAGGCTCCCACCCGCGGATCAACACTCTGGGCCGCATGATCCGCGCCGAGTCTGGCCCGGACCTGCGCTACGAGGTGACCAGCGGCGGCGGGGGCACCAGCAGGATGTACTATTCTCGGCGCGGCGTGATCACCGACCAGAACTCGGACGGCTACTGTCAAACCGGCACGATGTCCAGGCACCAGAACCAGAACACCATCCAGGAGCTGCTGCAGAACTGCTCCGACTGCTTGATGCGAGCAGAGCTCATCGTGCAGCCTGAATTGAAGTATGGAGATGGAATACAACTGACTCGGAGTCGAGAATTGGATGAGTGTTTTGCCCAGGCCAATGACCAAATGGAAATCCTCGACAGCTTGATCAGAGAGATGCGGCAGATGGGCCAGCCCTGTGATGCTTACCAGAAAAGGCTTCTTCAGCTCCAAGAGCAAATGCGAGCCCTTTATAAAGCCATCAGTGTCCCTCGAGTCCGCAGGGCCAGCTCCAAGGGTGGTGGAGGCTACACTTGTCAGAGTGGCTCTGGCTGGGATGAGTTCACCAAACATGTCACCAGTGAATGTTTGGGGTGGATGAGGCAGCAAAGGGCGGAGATGGACATGGTGGCCTGGGGTGTGGACCTGGCCTCAGTGGAGCAGCACATTAACAGCCACCGGGGCATCCACAACTCCATCGGCGACTATCGCTGGCAGCTGGACAAAATCAAAGCCGACCTGCGCGAGAAATCTGCGATCTACCAGTTGGAGGAGGAGTATGAAAACCTGCTGAAAGCGTCCTTTGAGAGGATGGATCACCTGCGACAGCTGCAGAACATCATTCAGGCCACGTCCAGGGAGATCATGTGGATCAATGACTGCGAGGAGGAGGAGCTGCTGTACGACTGGAGCGACAAGAACACCAACATCGCTCAGAAACAGGAGGCCTTCTCCATACGCATGAGTCAACTGGAAGTTAAAGAAAAAGAGCTCAATAAGCTGAAACAAGAAAGTGACCAACTTGTCCTCAATCAGCATCCAGCTTCAGACAAAATTGAGGCCTATATGGACACTCTGCAGACGCAGTGGAGTTGGATTCTTCAGATCACCAAGTGCATTGATGTTCATCTGAAAGAAAATGCTGCCTACTTTCAGTTTTTTGAAGAGGCGCAGTCTACTGAAGCATACCTGAAGGGGCTCCAGGACTCCATCAGGAAGAAGTACCCCTGCGACAAGAACATGCCCCTGCAGCACCTGCTGGAACAGATCAAGGAGCTGGAGAAAGAACGAGAGAAAATCCTTGAATACAAGCGTCAGGTGCAGAACTTGGTAAACAAGTCTAAGAAGATTGTACAGCTGAAGCCTCGTAACCCAGACTACAGAAGCAATAAACCCATTATTCTCAGAGCTCTCTGTGACTACAAACAAGATCAGAAAATCGTGCATAAGGGGGATGAGTGTATCCTGAAGGACAACAACGAGCGCAGCAAGTGGTACGTGACGGGCCCGGGAGGCGTTGACATGCTTGTTCCCTCTGTGGGGCTGATCATCCCTCCTCCGAACCCACTGGCCGTGGACCTCTCTTGCAAGATTGAGCAGTACTACGAAGCCATCTTGGCTCTGTGGAACCAGCTCTACATCAACATGAAGAGCCTGGTGTCCTGGCACTACTGCATGATTGACATAGAGAAGATCAGGGCCATGACAATCGCCAAGCTGAAAACAATGCGGCAGGAAGATTACATGAAGACGATAGCCGACCTTGAGTTACATTACCAAGAGTTCATCAGAAATAGCCAAGGCTCAGAGATGTTTGGAGATGATGACAAGCGGAAAATACAGTCTCAGTTCACCGATGCCCAGAAGCATTACCAGACCCTGGTCATTCAGCTCCCTGGCTATCCCCAGCACCAGACAGTGACCACAACTGAAATCACTCATCATGGAACCTGCCAAGATGTCAACCATAATAAAGTAATTGAAACCAACAGAGAAAATGACAAGCAAGAAACATGGATGCTGATGGAGCTGCAGAAGATTCGCAGGCAGATAGAGCACTGCGAGGGCAGGATGACTCTCAAAAACCTCCCTCTAGCAGACCAGGGATCTTCTCACCACATCACAGTGAAAATTAACGAGCTTAAGAGTGTGCAGAATGATTCACAAGCAATTGCTGAGGTTCTCAACCAGCTTAAAGATATGCTTGCCAACTTCAGAGGTTCTGAAAAGTACTGCTATTTACAGAATGAAGTATTTGGACTATTTCAGAAACTGGAAAATATCAATGGTGTTACAGATGGCTACTTAAATAGCTTATGCACAGTAAGGGCACTGCTCCAGGCTATTCTCCAAACAGAAGACATGTTAAAGGTTTATGAAGCCAGGCTCACTGAGGAGGAAACTGTCTGCCTGGACCTGGATAAAGTGGAAGCTTACCGCTGTGGACTGAAGAAAATAAAAAATGACTTGAACTTGAAGAAGTCGTTGTTGGCCACTATGAAGACAGAACTACAGAAAGCCCAGCAGATCCACTCTCAGACTTCACAGCAGTATCCACTTTATGATCTGGACTTGGGCAAGTTCGGTGAAAAAGTCACACAGCTGACAGACCGCTGGCAAAGGATAGATAAACAGATCGACTTTAGGTTATGGGACCTGGAGAAACAAATCAAGCAATTGAGGAATTATCGTGATAACTATCAGGCTTTCTGCAAGTGGCTCTATGATGCTAAACGCCGCCAGGATTCCTTAGAATCCATGAAATTTGGAGATTCCAACACAGTCATGCGGTTTTTGAATGAGCAGAAGAACTTGCACAGTGAAATATCTGGCAAACGAGACAAATCAGAGGAAGTACAAAAAATTGCTGAACTTTGCGCCAATTCAATTAAGGATTATGAGCTCCAGCTGGCCTCATACACCTCAGGACTGGAAACTCTGCTGAACATACCTATCAAGAGGACCATGATTCAGTCCCCTTCTGGGGTGATTCTGCAAGAGGCTGCAGATGTTCATGCTCGGTACATTGAACTACTTACAAGATCTGGAGACTATTACAGGTTCTTAAGTGAGATGCTGAAGAGTTTGGAAGATCTGAAGCTGAAAAATACCAAGATCGAAGTTTTGGAAGAGGAGCTCAGACTGGCCCGAGATGCCAACTCGGAAAACTGTAATAAGAACAAATTCCTGGATCAGAACCTGCAGAAATACCAGGCAGAGTGTTCCCAGTTCAAAGCGAAGCTTGCGAGCCTGGAGGAGCTGAAGAGACAGGCTGAGCTGGATGGGAAGTCGGCTAAGCAAAATCTAGACAAGTGCTACGGCCAAATAAAAGAACTCAATGAGAAGATCACCCGACTGACTTATGAGATTGAAGATGAAAAGAGAAGAAGAAAATCTGTGGAAGACAGATTTGACCAACAGAAGAATGACTATGACCAACTGCAGAAAGCAAGGCAATGTGAAAAGGAGAACCTTGGTTGGCAGAAATTAGAGTCTGAGAAAGCCATCAAGGAGAAGGAGTACGAGATTGAAAGGTTGAGGGTTCTACTGCAGGAAGAAGGCACCCGGAAGAGAGAATATGAAAATGAGCTGGCAAAGGCATCTAATAGGATTCAGGAATCAAAGAATCAGTGTACTCAGGTGGTACAGGAAAGAGAGAGCCTTCTGGTGAAAATCAAAGTCCTGGAGCAAGACAAGGCAAGGCTGCAGAGGCTGGAGGATGAGCTGAATCGTGCAAAATCAACTCTAGAGGCAGAAACCAGGGTGAAACAGCGCCTGGAGTGTGAGAAACAGCAAATTCAGAATGACCTGAATCAGTGGAAGACTCAATATTCCCGCAAGGAGGAGGCTATTAGGAAGATAGAATCGGAAAGAGAAAAGAGTGAGAGAGAGAAGAACAGTCTTAGGAGTGAGATCGAAAGACTCCAAGCAGAGATCAAGAGAATTGAAGAGAGGTGCAGGCGTAAGCTGGAGGATTCTACCAGGGAGACACAGTCACAGTTAGAAACAGAACGCTCCCGATATCAGAGGGAGATTGATAAACTCAGACAGCGCCCATATGGGTCCCATCGAGAGACCCAGACTGAGTGTGAGTGGACCGTTGACACCTCCAAGCTGGTGTTTGATGGGCTGAGGAAGAAGGTGACAGCAATGCAGCTCTATGAGTGTCAGCTGATCGACAAAACAACCTTGGACAAACTATTGAAGGGGAAGAAGTCAGTGGAAGAAGTTGCTTCTGAAATCCAGCCATTCCTTCGGGGTGCAGGATCTATCGCTGGAGCATCTGCTTCTCCTAAGGAAAAATACTCTTTGGTAGAGGCCAAGAGAAAGAAATTAATCAGCCCAGAATCCACAGTCATGCTTCTGGAGGCCCAGGCAGCTACAGGTGGTATAATTGATCCCCATCGGAATGAGAAGCTGACTGTCGACAGTGCCATAGCTCGGGACCTCATTGACTTCGATGACCGTCAGCAGATATATGCAGCAGAAAAAGCTATCACTGGTTTTGATGATCCATTTTCAGGCAAGACAGTATCTGTTTCAGAAGCCATCAAGAAAAATTTGATTGATAGAGAAACCGGAATGCGCCTGCTGGAAGCCCAGATTGCTTCAGGGGGTGTAGTAGACCCTGTGAACAGTGTCTTTTTGCCAAAAGATGTCGCCTTGGCCCGGGGGCTGATTGATAGAGATTTGTATCGATCCCTGAATGATCCCCGAGATAGTCAGAAAAACTTTGTGGATCCAGTCACCAAAAAGAAGGTCAGTTACGTGCAGCTGAAGGAACGGTGCAGAATCGAACCACATACTGGTCTGCTCTTGCTTTCAGTACAGAAGAGAAGCATGTCCTTCCAAGGAATCAGACAACCTGTGACCGTCACTGAGCTAGTAGATTCTGGTATATTGAGACCGTCCACTGTCAATGAACTGGAATCTGGTCAGATTTCTTATGACGAGGTTGGTGAGAGAATTAAGGACTTCCTCCAGGGTTCAAGCTGCATAGCAGGCATATACAATGAGACCACAAAACAGAAGCTTGGCATTTATGAGGCCATGAAAATTGGCTTAGTCCGACCTGGTACTGCTCTGGAGTTGCTGGAAGCCCAAGCAGCTACTGGCTTTATAGTGGATCCTGTTAGCAACTTGAGGTTACCAGTGGAGGAAGCCTACAAGAGAGGTCTGGTGGGCATTGAGTTCAAAGAGAAGCTCCTGTCTGCAGAACGAGCTGTCACTGGGTATAATGATCCTGAAACAGGAAACATCATCTCTTTGTTCCAAGCCATGAATAAGGAACTCATCGAAAAGGGCCACGGTATTCGCTTATTAGAAGCACAGATCGCAACCGGGGGGATCATTGACCCAAAGGAGAGCCATCGTTTACCAGTTGACATAGCATATAAGAGGGGCTATTTCAATGAGGAACTCAGTGAGATTCTCTCAGATCCAAGTGATGATACCAAAGGATTTTTTGACCCCAACACTGAAGAAAATCTTACCTATCTGCAACTAAAAGAAAGATGCATTAAGGATGAGGAAACAGGGCTCTGTCTTCTGCCTCTGAAAGAAAAGAAGAAACAGGTGCAGACATCACAAAAGAATACCCTCAGGAAGCGTAGAGTGGTCATAGTTGACCCAGAAACCAATAAAGAAATGTCTGTTCAGGAGGCCTACAAGAAGGGCCTAATTGATTATGAAACCTTCAAAGAACTGTGTGAGCAGGAATGTGAATGGGAAGAAATAACCATCACGGGATCAGATGGCTCCACCAGGGTGGTCCTGGTAGATAGAAAGACAGGCAGTCAGTATGATATTCAAGATGCTATTGACAAGGGCCTTGTTGACAGGAAGTTCTTTGATCAGTACCGATCCGGCAGCCTCAGCCTCACTCAATTTGCTGACATGATCTCCTTGAAAAATGGTGTCGGCACCAGCAGCAGCATGGGCAGTGGTGTCAGCGATGATGTTTTTAGCAGCTCCCGACATGAATCAGTAAGTAAGATTTCCACCATATCCAGCGTCAGGAATTTAACCATAAGGAGCAGCTCTTTTTCAGACACCCTGGAAGAATCGAGCCCCATTGCAGCCATCTTTGACACAGAAAACCTGGAGAAAATCTCCATTACAGAAGGTATAGAGCGGGGCATCGTTGACAGCATCACGGGTCAGAGGCTTCTGGAGGCTCAGGCCTGCACAGGTGGCATCATCCACCCAACCACGGGCCAGAAGCTGTCACTTCAGGACGCAGTCTCCCAGGGTGTGATTGACCAAGACATGGCCACCAGGCTGAAGCCTGCTCAGAAAGCCTTCATAGGCTTCGAGGGTGTGAAGGGAAAGAAGAAGATGTCAGCAGCAGAGGCAGTGAAAGAAAAATGGCTCCCGTATGAGGCTGGCCAGCGCTTCCTGGAGTTCCAGTACCTCACGGGAGGTCTTGTTGACCCGGAAGTGCATGGGAGGATAAGCACCGAAGAAGCCATCCGGAAGGGGTTCATAGATGGCCGCGCCGCACAGAGGCTGCAAGACACCAGCAGCTATGCCAAAATCCTGACCTGCCCCAAAACCAAATTAAAAATATCCTATAAGGATGCCATAAATCGCTCCATGGTAGAAGATATCACTGGGCTGCGCCTTCTGGAAGCCGCCTCCGTGTCGTCCAAGGGCTTACCCAGCCCTTACAACATGTCTTCGGCTCCGGGGTCCCGCTCCGGCTCCCGCTCGGGATCTCGCTCCGGATCTCGCTCCGGGTCCCGCAGTGGGTCCCGGAGAGGAAGCTTTGACGCCACAGGGAATTCTTCCTACTCTTATTCCTACTCATTTAGCAGTAGTTCTATTGGGCACTAG	803
人類DSG2蛋白質	MARSPGRAYALLLLLICFNVGSGLHLQVLSTRNENKLLPKHPHLVRQKRAWITAPVALREGEDLSKKNPIAKIHSDLAEERGLKITYKYTGKGITEPPFGIFVFNKDTGELNVTSILDREETPFFLLTGYALDARGNNVEKPLELRIKVLDINDNEPVFTQDVFVGSVEELSAAHTLVMKINATDADEPNTLNSKISYRIVSLEPAYPPVFYLNKDTGEIYTTSVTLDREEHSSYTLTVEARDGNGEVTDKPVKQAQVQIRILDVNDNIPVVENKVLEGMVEENQVNVEVTRIKVFDADEIGSDNWLANFTFASGNEGGYFHIETDAQTNEGIVTLIKEVDYEEMKNLDFSVIVANKAAFHKSIRSKYKPTPIPIKVKVKNVKEGIHFKSSVISIYVSESMDRSSKGQIIGNFQAFDEDTGLPAHARYVKLEDRDNWISVDSVTSEIKLAKLPDFESRYVQNGTYTVKIVAISEDYPRKTITGTVLINVEDINDNCPTLIEPVQTICHDAEYVNVTAEDLDGHPNSGPFSFSVIDKPPGMAEKWKIARQESTSVLLQQSEKKLGRSEIQFLISDNQGFSCPEKQVLTLTVCECLHGSGCREAQHDSYVGLGPAAIALMILAFLLLLLVPLLLLMCHCGKGAKGFTPIPGTIEMLHPWNNEGAPPEDKVVPSFLPVDQGGSLVGRNGVGGMAKEATMKGSSSASIVKGQHEMSEMDGRWEEHRSLLSGRATQFTGATGAIMTTETTKTARATGASRDMAGAQAAAVALNEEFLRNYFTDKAASYTEEDENHTAKDCLLVYSQEETESLNASIGCCSFIEGELDDRFLDDLGLKFKTLAEVCLGQKIDINKEIEQRQKPATETSMNTASHSLCEQTMVNSENTYSSGSSFPVPKSLQEANAEKVTQEIVTERSVSSRQAQKVATPLPDPMASRNVIATETSYVTGSTMPPTTVILGPSQPQSLIVTERVYAPASTLVDQPYANEGTVVVTERVIQPHGGGSNPLEGTQHLQDVPYVMVRERESFLAPSSGVQPTLAMPNIAVGQNVTVTERVLAPASTLQSSYQIPTENSMTARNTTVSGAGVPGPLPDFGLEESGHSNSTITTSSTRVTKHSTVQHSYS	804
人類DSG2 DNA	ATGGCGCGGAGCCCGGGACGCGCGTACGCCCTGCTGCTTCTCCTGATCTGCTTTAACGTTGGAAGTGGACTTCACTTACAGGTCTTAAGCACAAGAAATGAAAATAAGCTGCTTCCTAAACATCCTCATTTAGTGCGGCAAAAGCGCGCCTGGATCACCGCCCCCGTGGCTCTTCGGGAGGGAGAGGATCTGTCCAAGAAGAATCCAATTGCCAAGATACATTCTGATCTTGCAGAAGAAAGAGGACTCAAAATTACTTACAAATACACTGGAAAAGGGATTACAGAGCCACCTTTTGGTATATTTGTCTTTAACAAAGATACTGGAGAACTGAATGTTACCAGCATTCTTGATCGAGAAGAAACACCATTTTTTCTGCTAACAGGTTACGCTTTGGATGCAAGAGGAAACAATGTAGAGAAACCCTTAGAGCTACGCATTAAGGTTCTTGATATCAATGACAACGAACCAGTGTTCACACAGGATGTCTTTGTTGGGTCTGTTGAAGAGTTGAGTGCAGCACATACTCTTGTGATGAAAATCAATGCAACAGATGCAGATGAGCCCAATACCCTGAATTCGAAAATTTCCTATAGAATCGTATCTCTGGAGCCTGCTTATCCTCCAGTGTTCTACCTAAATAAAGATACAGGAGAGATTTATACAACCAGTGTTACCTTGGACAGAGAGGAACACAGCAGCTACACTTTGACAGTAGAAGCAAGAGATGGCAATGGAGAAGTTACAGACAAACCTGTAAAACAAGCTCAAGTTCAGATTCGTATTTTGGATGTCAATGACAATATACCTGTAGTAGAAAATAAAGTGCTTGAAGGGATGGTTGAAGAAAATCAAGTCAACGTAGAAGTTACGCGCATAAAAGTGTTCGATGCAGATGAAATAGGTTCTGATAATTGGCTGGCAAATTTTACATTTGCATCAGGAAATGAAGGAGGTTATTTCCACATAGAAACAGATGCTCAAACTAACGAAGGAATTGTGACCCTTATTAAGGAAGTAGATTATGAAGAAATGAAGAATCTTGACTTCAGTGTTATTGTCGCTAATAAAGCAGCTTTTCACAAGTCGATTAGGAGTAAATACAAGCCTACACCCATTCCCATCAAGGTCAAAGTGAAAAATGTGAAAGAAGGCATTCATTTTAAAAGCAGCGTCATCTCAATTTATGTTAGCGAGAGCATGGATAGATCAAGCAAAGGCCAAATAATTGGAAATTTTCAAGCTTTTGATGAGGACACTGGACTACCAGCCCATGCAAGATATGTAAAATTAGAAGATAGAGATAATTGGATCTCTGTGGATTCTGTCACATCTGAAATTAAACTTGCAAAACTTCCTGATTTTGAATCTAGATATGTTCAAAATGGCACATACACTGTAAAGATTGTGGCCATATCAGAAGATTATCCTAGAAAAACCATCACTGGCACAGTCCTTATCAATGTTGAAGACATCAACGACAACTGTCCCACACTGATAGAGCCTGTGCAGACAATCTGTCACGATGCAGAGTATGTGAATGTTACTGCAGAGGACCTGGATGGACACCCAAACAGTGGCCCTTTCAGTTTCTCCGTCATTGACAAACCACCTGGCATGGCAGAAAAATGGAAAATAGCACGCCAAGAAAGTACCAGTGTGCTGCTGCAACAAAGTGAGAAAAAGCTTGGGAGAAGTGAAATTCAGTTCCTGATTTCAGACAATCAGGGTTTTAGTTGTCCTGAAAAGCAGGTCCTTACACTCACAGTTTGTGAGTGTCTGCATGGCAGCGGCTGCAGGGAAGCACAGCATGACTCCTATGTGGGCCTGGGACCCGCAGCAATTGCGCTCATGATTTTGGCCTTTCTGCTCCTGCTATTGGTACCACTTTTACTGCTGA TGTGCCATTGCGGAAAGGGCGCCAAAGGCTTTACCCCCATACCTGGCACCATAGAGATGCTGCATCCTTGGAATAATGAAGGAGCACCACCTGAAGACAAGGTGGTGCCATCATTTCTGCCAGTGGATCAAGGGGGCAGTCTAGTAGGAAGAAATGGAGTAGGAGGTATGGCCAAGGAAGCCACGATGAAAGGAAGTAGCTCTGCTTCCATTGTCAAAGGGCAACATGAGATGTCCGAGATGGATGGAAGGTGGGAAGAACACAGAAGCCTGCTTTCTGGTAGAGCTACCCAGTTTACAGGGGCCACAGGCGCTATCATGACCACTGAAACCACGAAGACCGCAAGGGCCACAGGGGCTTCCAGAGACATGGCCGGAGCTCAGGCAGCTGCTGTTGCACTGAACGAAGAATTCTTAAGAAATTATTTCACTGATAAAGCGGCCTCTTACACTGAGGAAGATGAAAATCACACAGCCAAAGATTGCCTTCTGGTTTATTCTCAGGAAGAAACTGAATCGCTGAATGCTTCTATTGGTTGTTGCAGTTTTATTGAAGGAGAGCTAGATGACCGCTTCTTAGATGATTTGGGACTTAAATTCAAGACACTAGCTGAAGTTTGCCTGGGTCAAAAAATAGATATAAATAAGGAAATTGAGCAGAGACAAAAACCTGCCACAGAAACAAGTATGAACACAGCTTCACATTCACTCTGTGAGCAAACTATGGTTAATTCAGAGAATACCTACTCCTCTGGCAGTAGCTTCCCAGTTCCAAAATCTTTGCAAGAAGCCAATGCAGAGAAAGTAACTCAGGAAATAGTCACTGAAAGATCTGTGTCTTCTAGGCAGGCGCAAAAGGTAGCTACACCTCTTCCTGACCCAATGGCTTCTAGAAATGTGATAGCAACAGAAACTTCCTATGTCACAGGGTCCACTATGCCACCAACCACTGTGATCCTGGGTCCTAGCCAGCCACAGAGCCTTATTGTGACAGAGAGGGTGTATGCTCCAGCTTCTACCTTGGTAGATCAGCCTTATGCTAATGAAGGTACAGTTGTGGTCACTGAAAGAGTAATACAGCCTCATGGGGGTGGATCGAATCCTCTGGAAGGCACTCAGCATCTTCAAGATGTACCTTACGTCATGGTGAGGGAAAGAGAGAGCTTCCTTGCCCCCAGCTCAGGTGTGCAGCCTACTCTGGCCATGCCTAATATAGCAGTAGGACAGAATGTGACAGTGACAGAAAGAGTTCTAGCACCTGCTTCCACTCTGCAATCCAGTTACCAGATTCCCACTGAAAATTCTATGACGGCTAGGAACACCACGGTGTCTGGAGCTGGAGTCCCTGGCC CTCTGCCAGATTTTGGTTTAGAGGAATCTGGTCATTCTAATTCTACCATAACCACATCTTCCACCAGAGTTACCAAGCATAGCACTGTACAGCATTCTTACTCCTAA	805
人類JUP蛋白質	MEVMNLMEQPIKVTEWQQTYTYDSGIHSGANTCVPSVSSKGIMEEDEACGRQYTLKKTTTYTQGVPPSQGDLEYQMSTTARAKRVREAMCPGVSGEDSSLLLATQVEGQATNLQRLAEPSQLLKSAIVHLINYQDDAELATRALPELTKLLNDEDPVVVTKAAMIVNQLSKKEASRRALMGSPQLVAAVVRTMQNTSDLDTARCTTSILHNLSHHREGLLAIFKSGGIPALVRMLSSPVESVLFYAITTLHNLLLYQEGAKMAVRLADGLQKMVPLLNKNNPKFLAITTDCLQLLAYGNQESKLIILANGGPQALVQIMRNYSYEKLLWTTSRVLKVLSVCPSNKPAIVEAGGMQALGKHLTSNSPRLVQNCLWTLRNLSDVATKQEGLESVLKILVNQLSVDDVNVLTCATGTLSNLTCNNSKNKTLVTQNSGVEALIHAILRAGDKDDITEPAVCALRHLTSRHPEAEMAQNSVRLNYGIPAIVKLLNQPNQWPLVKATIGLIRNLALCPANHAPLQEAAVIPRLVQLLVKAHQDAQRHVAAGTQQPYTDGVRMEEIVEGCTGALHILARDPMNRMEIFRLNTIPLFVQLLYSSVENIQRVAAGVLCELAQDKEAADAIDAEGASAPLMELLHSRNEGTATYAAAVLFRISEDKNPDYRKRVSVELTNSLFKHDPAAWEAAQSMIPINEPYGDDMDATYRPMYSSDVPLDPLEMHMDMDGDYPIDTYSDGLRPPYPTADHMLA	806
人類JUP DNA	ATGGAGGTGATGAACCTGATGGAGCAGCCTATCAAGGTGACTGAGTGGCAGCAGACATACACCTACGACTCGGGTATCCACTCGGGCGCCAACACCTGCGTGCCCTCCGTCAGCAGCAAGGGCATCATGGAGGAGGATGAGGCCTGCGGGCGCCAGTACACGCTCAAGAAAACCACCACTTACACCCAGGGGGTGCCCCCCAGCCAAGGTGATCTGGAGTACCAGATGTCCACAACAGCCAGGGCCAAACGGGTGCGGGAGGCCATGTGCCCTGGTGTGTCAGGCGAGGACAGCTCGCTTCTGCTGGCCACCCAGGTGGAGGGGCAGGCCACCAACCTGCAGCGACTGGCCGAGCCGTCCCAGCTGCTCAAGTCGGCCATTGTGCATCTCATCAACTACCAGGACGATGCCGAGCTGGCCACTCGCGCCCTGCCCGAGCTCACCAAACTGCTCAACGACGAGGACCCGGTGGTGGTGACCAAGGCGGCCATGATTGTGAACCAGCTGTCGAAGAAGGAGGCGTCGCGGCGGGCCCTGATGGGCTCGCCCCAGCTGGTGGCCGCTGTCGTGCGTACCATGCAGAATACCAGCGACCTGGACACAGCCCGCTGCACCACCAGCATCCTGCACAACCTCTCCCACCACCGGGAGGGGCTGCTCGCCATCTTCAAGTCGGGTGGCATCCCTGCTCTGGTCCGCATGCTCAGCTCCCCTGTGGAGTCGGTCCTGTTCTATGCCATCACCACGCTGCACAACCTGCTCCTGTACCAGGAGGGCGCCAAGATGGCCGTGCGCCTGGCCGACGGGCTGCAAAAGATGGTGCCCCTGCTCAACAAGAACAACCCCAAGTTCCTGGCCATCACCACCGACTGCCTGCAGCTCCTGGCCTACGGCAACCAGGAGAGCAAGCTGATCATCCTGGCCAATGGTGGGCCCCAGGCCCTCGTGCAGATCATGCGTAACTACAGTTATGAAAAGCTGCTCTGGACCACCAGTCGTGTGCTCAAGGTGCTATCCGTGTGTCCCAGCAATAAGCCTGCCATTGTGGAGGCTGGTGGGATGCAGGCCCTGGGCAAGCACCTGACCAGCAACAGCCCCCGCCTGGTGCAGAACTGCCTGTGGACCCTGCGCAACCTCTCAGATGTGGCCACCAAGCAGGAGGGCCTGGAGAGTGTGCTGAAGATTCTGGTGAATCAGCTGAGTGTGGATGACGTCAACGTCCTCACCTGTGCCACGGGCACACTCTCCAACCTGACATGCAACAACAGCAAGAACAAGACGCTGGTGACACAGAACAGCGGTGTGGAGGCTCTCATCCATGCCATCCTGCGTGCTGGTGACAAGGACGACATCACGGAGCCTGCCGTCTGCGCTCTGCGCCACCTCACTAGCCGCCACCCTGAGGCCGAGATGGCCCAGAACTCTGTGCGTCTCAACTATGGCATCCCAGCCATCGTGAAGCTGCTCAACCAGCCCAACCAGTGGCCACTGGTCAAGGCAACCATCGGCTTGATCAGGAATCTGGCCCTGTGCCCAGCCAACCATGCCCCGCTGCAGGAGGCAGCGGTCATCCCCCGCCTCGTCCAACTGCTGGTGAAGGCCCACCAGGATGCCCAGCGCCACGTAGCTGCAGGCACACAGCAGCCCTACACGGATGGTGTGAGGATGGAGGAGATTGTGGAGGGCTGCACCGGAGCACTGCACATCCTCGCCCGGGACCCCATGAACCGCATGGAGATCTTCCGGCTCAACACCATTCCCCTGTTTGTGCAGCTCCTGTACTCGTCGGTGGAGAACATCCAGCGCGTGGCTGCCGGGGTGCTGTGTGAGCTGGCCCAGGACAAGGAGGCGGCCGACGCCATTGATGCAGAGGGGGCCTCGGCCCCACTCATGGAGTTGCTGCACTCCCGCAACGAGGGCACTGCCACCTACGCTGCTGCCGTCCTGTTCCGCATCTCCGAGGACAAGAACCCAGACTACCGGAAGCGCGTGTCCGTGGAGCTCACCAACTCCCTCTTCAAGCATGACCCGGCTGCCTGGGAGGCTGCCCAGAGCATGATTCCCATCAATGAGCCCTATGGAGATGACATGGATGCCACCTACCGCCCCATGTACTCCAGCGATGTGCCCCTTGACCCGCTGGAGATGCACATGGACATGGATGGAGACTACCCCATCGACACCTACAGCGACGGCCTCAGGCCCCCGTACCCCACTGCAGACCACATGCTGGCCTAG	807
人類JPH2 N端片段蛋白質	MSGGRFDFDDGGAYCGGWEGGKAHGHGLCTGPKGQGEYSGSWNFGFEVAGVYTWPSGNTFEGYWSQGKRHGLGIETKGRWLYKGEWTHGFKGRYGIRQSSSSGAKYEGTWNNGLQDGYGTETYADGGTYQGQFTNGMRHGYGVRQSVPYGMAVVVRSPLRTSLSSLRSEHSNGTVAPDSPASPASDGPALPSPAIPRGGFALSLLANAEAAARAPKGGGLFQRGALLGKLRRAESRTSVGSQRSRVSFLKSDLSSGASDAASTASLGEAAEGADEAAPFEADIDATTTETYMGEWKNDKRSGFGVSERSSGLRYEGEWLDNLRHGYGCTTLPDGHREEGKYRHNVLVKDTKRRMLQLKSNKVRQKVEHSVEGAQRAAAIARQKAEIAASRTSHAKAKAEAAEQAALAANQESNIARTLARELAPDFYQPGPEYQKRRLLQEILENSESLLEPPDRGAGAAGLPQPPRESPQLHERETPRPEGGSPSPAGTPPQPKRPRPGVSKDGLLSPGAWNGEPSGEGSRSVTPSEGAGRRSPARPATERMAIEALQAPPAPSREPEVALYQGYHSYAVR	808
人類JPH2 N端片段DNA	ATGAGTGGGGGCCGCTTCGACTTTGATGATGGAGGGGCGTACTGCGGGGGCTGGGAGGGGGGAAAGGCCCATGGGCATGGACTGTGCACAGGCCCCAAGGGCCAGGGCGAATACTCTGGCTCCTGGAACTTTGGCTTTGAGGTGGCAGGTGTCTACACCTGGCCCAGCGGAAACACCTTTGAGGGATACTGGAGCCAGGGCAAACGGCATGGGCTGGGCATAGAGACCAAGGGGCGCTGGCTCTACAAGGGCGAGTGGACACATGGCTTCAAGGGACGCTACGGAATCCGGCAGAGCTCAAGCAGCGGTGCCAAGTATGAGGGCACCTGGAACAATGGCCTGCAAGACGGCTATGGCACCGAGACCTATGCTGATGGAGGGACGTACCAAGGCCAGTTCACCAACGGCATGCGCCATGGCTACGGAGTACGCCAGAGCGTGCCCTACGGGATGGCCGTGGTGGTGCGCTCGCCGCTGCGCACGTCGCTGTCGTCCCTGCGCAGCGAGCACAGCAACGGCACGGTGGCCCCGGACTCTCCCGCCTCGCCGGCCTCCGACGGCCCCGCGCTGCCCTCGCCCGCCATCCCGCGTGGCGGCTTCGCGCTCAGCCTCCTGGCCAATGCCGAGGCGGCCGCGCGGGCGCCCAAGGGCGGCGGCCTCTTCCAGCGGGGCGCGCTGCTGGGCAAGCTGCGGCGCGCAGAGTCGCGCACGTCCGTGGGTAGCCAGCGCAGCCGTGTCAGCTTCCTTAAGAGCGACCTCAGCTCGGGCGCCAGCGACGCCGCGTCCACCGCCAGCCTGGGAGAGGCCGCCGAGGGCGCCGACGAGGCCGCACCCTTCGAGGCCGATATCGACGCCACCACCACCGAGACCTACATGGGCGAGTGGAAGAACGACAAACGCTCGGGCTTCGGCGTGAGCGAACGCTCCAGTGGCCTCCGCTACGAGGGCGAGTGGCTGGACAACCTGCGCCACGGCTATGGCTGCACCACGCTGCCCGACGGCCACCGCGAGGAGGGCAAGTACCGCCACAACGTGCTGGTCAAGGACACCAAGCGCCGCATGCTGCAGCTCAAGAGCAACAAGGTCCGCCAGAAAGTGGAGCACAGTGTGGAGGGTGCCCAGCGCGCCGCTGCTATCGCGCGCCAGAAGGCCGAGATTGCCGCCTCCAGGACAAGCCACGCCAAGGCCAAAGCTGAGGCAGCGGAACAGGCCGCCCTGGCTGCCAACCAGGAGTCCAACATTGCTCGCACTTTGGCCAGGGAGCTGGCTCCGGACTTCTACCAGCCAGGTCCGGAATATCAGAAGCGCCGGCTGCTGCAGGAGATCCTGGAGAACTCGGAGAGCCTGCTGGAGCCCCCCGACCGGGGCGCCGGCGCAGCGGGCCTCCCACAGCCGCCCCGCGAGAGCCCGCAGCTGCACGAGCGTGAGACCCCTCGGCCCGAGGGTGGCTCCCCGTCACCGGCCGGGACGCCCCCGCAGCCCAAGCGGCCCAGGCCCGGGGTGTCCAAGGACGGCCTGCTGAGCCCAGGCGCCTGGAACGGCGAGCCCAGCGGTGAGGGCAGCCGGTCAGTCACTCCGTCCGAGGGCGCGGGCCGCCGCAGCCCCGCGCGTCCAGCCACCGAGCGCATGGCCATCGAGGCTCTGCAGGCACCGCCTGCGCCGTCGCGGGAGCCGGAGGTGGCGCTTTACCAGGGCTACCACAGCTATGCTGTGCGC	809
人類PLN蛋白質	MEKVQYLTRSAIRRASTIEMPQQARQKLQNLFINFCLILICLLLICIIVMLL	830
人類PLN DNA	ATGGAGAAAGTCCAATACCTCACTCGCTCAGCTATAAGAAGAGCCTCAACCATTGAAATGCCTCAACAAGCACGTCAAAAGCTACAGAATCTATTTATCAATTTCTGTCTCATCTTAATATGTCTCTTGCTGATCTGTATCATCGTGATGCTTCTCTGA	810
人類MYBPC3 DNA	ATGCCTGAGCCGGGGAAGAAGCCAGTCTCAGCTTTTAGCAAGAAGCCACGGTCAGTGGAAGTGGCCGCAGGCAGCCCTGCCGTGTTCGAGGCCGAGACAGAGCGGGCAGGAGTGAAGGTGCGCTGGCAGCGCGGAGGCAGTGACATCAGCGCCAGCAACAAGTACGGCCTGGCCACAGAGGGCACACGGCATACGCTGACAGTGCGGGAAGTGGGCCCTGCCGACCAGGGATCTTACGCAGTCATTGCTGGCTCCTCCAAGGTCAAGTTCGACCTCAAGGTCATAGAGGCAGAGAAGGCAGAGCCCATGCTGGCCCCTGCCCCTGCCCCTGCTGAGGCCACTGGAGCCCCTGGAGAAGCCCCGGCCCCAGCCGCTGAGCTGGGAGAAAGTGCCCCAAGTCCCAAAGGGTCAAGCTCAGCAGCTCTCAATGGTCCTACCCCTGGAGCCCCCGATGACCCCATTGGCCTCTTCGTGATGCGGCCACAGGATGGCGAGGTGACCGTGGGTGGCAGCATCACCTTCTCAGCCCGCGTGGCCGGCGCCAGCCTCCTGAAGCCGCCTGTGGTCAAGTGGTTCAAGGGCAAATGGGTGGACCTGAGCAGCAAGGTGGGCCAGCACCTGCAGCTGCACGACAGCTACGACCGCGCCAGCAAGGTCTATCTGTTCGAGCTGCACATCACCGATGCCCAGCCTGCCTTCACTGGCAGCTACCGCTGTGAGGTGTCCACCAAGGACAAATTTGACTGCTCCAACTTCAATCTCACTGTCCACGAGGCCATGGGCACCGGAGACCTGGACCTCCTATCAGCCTTCCGCCGCACGAGCCTGGCTGGAGGTGGTCGGCGGATCAGTGATAGCCATGAGGACACTGGGATTCTGGACTTCAGCTCACTGCTGAAAAAGAGAGACAGTTTCCGGACCCCGAGGGACTCGAAGCTGGAGGCACCAGCAGAGGAGGACGTGTGGGAGATCCTACGGCAGGCACCCCCATCTGAGTACGAGCGCATCGCCTTCCAGTACGGCGTCACTGACCTGCGCGGCATGCTAAAGAGGCTCAAGGGCATGAGGCGCGATGAGAAGAAGAGCACAGCCTTTCAGAAGAAGCTGGAGCCGGCCTACCAGGTGAGCAAAGGCCACAAGATCCGGCTGACCGTGGAACTGGCTGACCATGACGCTGAGGTCAAATGGCTCAAGAATGGCCAGGAGATCCAGATGAGCGGCAGCAAGTACATCTTTGAGTCCATCGGTGCCAAGCGTACCCTGACCATCAGCCAGTGCTCATTGGCGGACGACGCAGCCTACCAGTGCGTGGTGGGTGGCGAGAAGTGTAGCACGGAGCTCTTTGTGAAAGAGCCCCCTGTGCTCATCACGCGCCCCTTGGAGGACCAGCTGGTGATGGTGGGGCAGCGGGTGGAGTTTGAGTGTGAAGTATCGGAGGAGGGGGCGCAAGTCAAATGGCTGAAGGACGGGGTGGAGCTGACCCGGGAGGAGACCTTCAAATACCGGTTCAAGAAGGACGGGCAGAGACACCACCTGATCATCAACGAGGCCATGCTGGAGGACGCGGGGCACTATGCACTGTGCACTAGCGGGGGCCAGGCGCTGGCTGAGCTCATTGTGCAGGAAAAGAAGCTGGAGGTGTACCAGAGCATCGCAGACCTGATGGTGGGCGCAAAGGACCAGGCGGTGTTCAAATGTGAGGTCTCAGATGAGAATGTTCGGGGTGTGTGGCTGAAGAATGGGAAGGAGCTGGTGCCCGACAGCCGCATAAAGGTGTCCCACATCGGGCGGGTCCACAAACTGACCATTGACGACGTCACACCTGCCGACGAGGCTGACTACAGCTTTGTGCCCGAGGGCTTCGCCTGCAACCTGTCAGCCAAGCTCCACTTCATGGAGGTCAAGATTGACTTCGTACCCAGGCAGGAACCTCCCAAGATCCACCTGGACTGCCCAGGCCGCATACCAGACACCATTGTGGTTGTAGCTGGAAATAAGCTACGTCTGGACGTCCCTATCTCTGGGGACCCCGCTCCCACTGTGATCTGGCAGAAGGCTATCACGCAGGGGAATAAGGCCCCAGCCAGGCCAGCCCCAGATGCCCCAGAGGACACAGGTGACAGCGATGAGTGGGTGTTTGACAAGAAGCTGCTGTGTGAGACCGAGGGCCGGGTCCGCGTGGAGACCACCAAGGACCGCAGCATCTTCACGGTCGAGGGGGCAGAGAAGGAAGATGAGGGCGTCTACACGGTCACAGTGAAGAACCCTGTGGGCGAGGACCAGGTCAACCTCACAGTCAAGGTCATCGACGTGCCAGACGCACCTGCGGCCCCCAAGATCAGCAACGTGGGAGAGGACTCCTGCACAGTACAGTGGGAGCCGCCTGCCTACGATGGCGGGCAGCCCATCCTGGGCTACATCCTGGAGCGCAAGAAGAAGAAGAGCTACCGGTGGATGCGGCTGAACTTCGACCTGATTCAGGAGCTGAGTCATGAAGCGCGGCGCATGATCGAGGGCGTGGTGTACGAGATGCGCGTCTACGCGGTCAACGCCATCGGCATGTCCAGGCCCAGCCCTGCCTCCCAGCCCTTCATGCCTATCGGTCCCCCCAGCGAACCCACCCACCTGGCAGTAGAGGACGTCTCTGACACCACGGTCTCCCTCAAGTGGCGGCCCCCAGAGCGCGTGGGAGCAGGAGGCCTGGATGGCTACAGCGTGGAGTACTGCCCAGAGGGCTGCTCAGAGTGGGTGGCTGCCCTGCAGGGGCTGACAGAGCACACATCGATACTGGTGAAGGACCTGCCCACGGGGGCCCGGCTGCTTTTCCGAGTGCGGGCACACAATATGGCAGGGCCTGGAGCCCCTGTTACCACCACGGAGCCGGTGACAGTGCAGGAGATCCTGCAACGGCCACGGCTTCAGCTGCCCAGGCACCTGCGCCAGACCATTCAGAAGAAGGTCGGGGAGCCTGTGAACCTTCTCATCCCTTTCCAGGGCAAGCCCCGGCCTCAGGTGACCTGGACCAAAGAGGGGCAGCCCCTGGCAGGCGAGGAGGTGAGCATCCGCAACAGCCCCACAGACACCATCCTGTTCATCCGGGCCGCTCGCCGCGTGCATTCAGGCACTTACCAGGTGACGGTGCGCATTGAGAACATGGAGGACAAGGCCACGCTGGTGCTGCAGGTTGTTGACAAGCCAAGTCCTCCCCAGGATCTCCGGGTGACTGACGCCTGGGGTCTTAATGTGGCTCTGGAGTGGAAGCCACCCCAGGATGTCGGCAACACGGAACTCTGGGGGTACACAGTGCAGAAAGCCGACAAGAAGACCATGGAGTGGTTCACCGTCTTGGAGCATTACCGCCGCACCCACTGCGTGGTGCCAGAGCTCATCATTGGCAATGGCTACTACTTCCGCGTCTTCAGCCAGAATATGGTTGGCTTTAGTGACAGAGCGGCCACCACCAAGGAGCCCGTCTTTATCCCCAGACCAGGCATCACCTATGAGCCACCCAACTATAAGGCCCTGGACTTCTCCGAGGCCCCAAGCTTCACCCAGCCCCTGGTGAACCGCTCGGTCATCGCGGGCTACACTGCTATGCTCTGCTGTGCTGTCCGGGGTAGCCCCAAGCCCAAGATTTCCTGGTTCAAGAATGGCCTGGACCTGGGAGAAGACGCCCGCTTCCGCATGTTCAGCAAGCAGGGAGTGTTGACTCTGGAGATTAGAAAGCCCTGCCCCTTTGACGGGGGCATCTATGTCTGCAGGGCCACCAACTTACAGGGCGAGGCACGGTGTGAGTGCCGCCTGGAGGTGCGAGTGCCTCAGTAA	811
MYBPC3-delC3 DNA	ATGCCTGAGCCGGGGAAGAAGCCAGTCTCAGCTTTTAGCAAGAAGCCACGGTCAGTGGAAGTGGCCGCAGGCAGCCCTGCCGTGTTCGAGGCCGAGACAGAGCGGGCAGGAGTGAAGGTGCGCTGGCAGCGCGGAGGCAGTGACATCAGCGCCAGCAACAAGTACGGCCTGGCCACAGAGGGCACACGGCATACGCTGACAGTGCGGGAAGTGGGCCCTGCCGACCAGGGATCTTACGCAGTCATTGCTGGCTCCTCCAAGGTCAAGTTCGACCTCAAGGTCATAGAGGCAGAGAAGGCAGAGCCCATGCTGGCCCCTGCCCCTGCCCCTGCTGAGGCCACTGGAGCCCCTGGAGAAGCCCCGGCCCCAGCCGCTGAGCTGGGAGAAAGTGCCCCAAGTCCCAAAGGGTCAAGCTCAGCAGCTCTCAATGGTCCTACCCCTGGAGCCCCCGATGACCCCATTGGCCTCTTCGTGATGCGGCCACAGGATGGCGAGGTGACCGTGGGTGGCAGCATCACCTTCTCAGCCCGCGTGGCCGGCGCCAGCCTCCTGAAGCCGCCTGTGGTCAAGTGGTTCAAGGGCAAATGGGTGGACCTGAGCAGCAAGGTGGGCCAGCACCTGCAGCTGCACGACAGCTACGACCGCGCCAGCAAGGTCTATCTGTTCGAGCTGCACATCACCGATGCCCAGCCTGCCTTCACTGGCAGCTACCGCTGTGAGGTGTCCACCAAGGACAAATTTGACTGCTCCAACTTCAATCTCACTGTCCACGAGGCCATGGGCACCGGAGACCTGGACCTCCTATCAGCCTTCCGCCGCACGAGCCTGGCTGGAGGTGGTCGGCGGATCAGTGATAGCCATGAGGACACTGGGATTCTGGACTTCAGCTCACTGCTGAAAAAGAGAGACAGTTTCCGGACCCCGAGGGACTCGAAGCTGGAGGCACCAGCAGAGGAGGACGTGTGGGAGATCCTACGGCAGGCACCCCCATCTGAGTACGAGCGCATCGCCTTCCAGTACGGCGTCACTGACCTGCGCGGCATGCTAAAGAGGCTCAAGGGCATGAGGCGCGATGAGAAGAAGAGCACAGCCTTTCAGAAGAAGCTGGAGCCGGCCTACCAGGTGAGCAAAGGCCACAAGATCCGGCTGACCGTGGAACTGGCTGACCATGACGCTGAGGTCAAATGGCTCAAGAATGGCCAGGAGATCCAGATGAGCGGCAGCAAGTACATCTTTGAGTCCATCGGTGCCAAGCGTACCCTGACCATCAGCCAGTGCTCATTGGCGGACGACGCAGCCTACCAGTGCGTGGTGGGTGGCGAGAAGTGTAGCACGGAGCTCTTTGTGAAAGAGCCCCCTGTGTACCAGAGCATCGCAGACCTGATGGTGGGCGCAAAGGACCAGGCGGTGTTCAAATGTGAGGTCTCAGATGAGAATGTTCGGGGTGTGTGGCTGAAGAATGGGAAGGAGCTGGTGCCCGACAGCCGCATAAAGGTGTCCCACATCGGGCGGGTCCACAAACTGACCATTGACGACGTCACACCTGCCGACGAGGCTGACTACAGCTTTGTGCCCGAGGGCTTCGCCTGCAACCTGTCAGCCAAGCTCCACTTCATGGAGGTCAAGATTGACTTCGTACCCAGGCAGGAACCTCCCAAGATCCACCTGGACTGCCCAGGCCGCATACCAGACACCATTGTGGTTGTAGCTGGAAATAAGCTACGTCTGGACGTCCCTATCTCTGGGGACCCCGCTCCCACTGTGATCTGGCAGAAGGCTATCACGCAGGGGAATAAGGCCCCAGCCAGGCCAGCCCCAGATGCCCCAGAGGACACAGGTGACAGCGATGAGTGGGTGTTTGACAAGAAGCTGCTGTGTGAGACCGAGGGCCGGGTCCGCGTGGAGACCACCAAGGACCGCAGCATCTTCACGGTCGAGGGGGCAGAGAAGGAAGATGAGGGCGTCTACACGGTCACAGTGAAGAACCCTGTGGGCGAGGACCAGGTCAACCTCACAGTCAAGGTCATCGACGTGCCAGACGCACCTGCGGCCCCCAAGATCAGCAACGTGGGAGAGGACTCCTGCACAGTACAGTGGGAGCCGCCTGCCTACGATGGCGGGCAGCCCATCCTGGGCTACATCCTGGAGCGCAAGAAGAAGAAGAGCTACCGGTGGATGCGGCTGAACTTCGACCTGATTCAGGAGCTGAGTCATGAAGCGCGGCGCATGATCGAGGGCGTGGTGTACGAGATGCGCGTCTACGCGGTCAACGCCATCGGCATGTCCAGGCCCAGCCCTGCCTCCCAGCCCTTCATGCCTATCGGTCCCCCCAGCGAACCCACCCACCTGGCAGTAGAGGACGTCTCTGACACCACGGTCTCCCTCAAGTGGCGGCCCCCAGAGCGCGTGGGAGCAGGAGGCCTGGATGGCTACAGCGTGGAGTACTGCCCAGAGGGCTGCTCAGAGTGGGTGGCTGCCCTGCAGGGGCTGACAGAGCACACATCGATACTGGTGAAGGACCTGCCCACGGGGGCCCGGCTGCTTTTCCGAGTGCGGGCACACAATATGGCAGGGCCTGGAGCCCCTGTTACCACCACGGAGCCGGTGACAGTGCAGGAGATCCTGCAACGGCCACGGCTTCAGCTGCCCAGGCACCTGCGCCAGACCATTCAGAAGAAGGTCGGGGAGCCTGTGAACCTTCTCATCCCTTTCCAGGGCAAGCCCCGGCCTCAGGTGACCTGGACCAAAGAGGGGCAGCCCCTGGCAGGCGAGGAGGTGAGCATCCGCAACAGCCCCACAGACACCATCCTGTTCATCCGGGCCGCTCGCCGCGTGCATTCAGGCACTTACCAGGTGACGGTGCGCATTGAGAACATGGAGGACAAGGCCACGCTGGTGCTGCAGGTTGTTGACAAGCCAAGTCCTCCCCAGGATCTCCGGGTGACTGACGCCTGGGGTCTTAATGTGGCTCTGGAGTGGAAGCCACCCCAGGATGTCGGCAACACGGAACTCTGGGGGTACACAGTGCAGAAAGCCGACAAGAAGACCATGGAGTGGTTCACCGTCTTGGAGCATTACCGCCGCACCCACTGCGTGGTGCCAGAGCTCATCATTGGCAATGGCTACTACTTCCGCGTCTTCAGCCAGAATATGGTTGGCTTTAGTGACAGAGCGGCCACCACCAAGGAGCCCGTCTTTATCCCCAGACCAGGCATCACCTATGAGCCACCCAACTATAAGGCCCTGGACTTCTCCGAGGCCCCAAGCTTCACCCAGCCCCTGGTGAACCGCTCGGTCATCGCGGGCTACACTGCTATGCTCTGCTGTGCTGTCCGGGGTAGCCCCAAGCCCAAGATTTCCTGGTTCAAGAATGGCCTGGACCTGGGAGAAGACGCCCGCTTCCGCATGTTCAGCAAGCAGGGAGTGTTGACTCTGGAGATTAGAAAGCCCTGCCCCTTTGACGGGGGCATCTATGTCTGCAGGGCCACCAACTTACAGGGCGAGGCACGGTGTGAGTGCCGCCTGGAGGTGCGAGTGCCTCAGTAA	812
MYBPC3-delC4 DNA	ATGCCTGAGCCGGGGAAGAAGCCAGTCTCAGCTTTTAGCAAGAAGCCACGGTCAGTGGAAGTGGCCGCAGGCAGCCCTGCCGTGTTCGAGGCCGAGACAGAGCGGGCAGGAGTGAAGGTGCGCTGGCAGCGCGGAGGCAGTGACATCAGCGCCAGCAACAAGTACGGCCTGGCCACAGAGGGCACACGGCATACGCTGACAGTGCGGGAAGTGGGCCCTGCCGACCAGGGATCTTACGCAGTCATTGCTGGCTCCTCCAAGGTCAAGTTCGACCTCAAGGTCATAGAGGCAGAGAAGGCAGAGCCCATGCTGGCCCCTGCCCCTGCCCCTGCTGAGGCCACTGGAGCCCCTGGAGAAGCCCCGGCCCCAGCCGCTGAGCTGGGAGAAAGTGCCCCAAGTCCCAAAGGGTCAAGCTCAGCAGCTCTCAATGGTCCTACCCCTGGAGCCCCCGATGACCCCATTGGCCTCTTCGTGATGCGGCCACAGGATGGCGAGGTGACCGTGGGTGGCAGCATCACCTTCTCAGCCCGCGTGGCCGGCGCCAGCCTCCTGAAGCCGCCTGTGGTCAAGTGGTTCAAGGGCAAATGGGTGGACCTGAGCAGCAAGGTGGGCCAGCACCTGCAGCTGCACGACAGCTACGACCGCGCCAGCAAGGTCTATCTGTTCGAGCTGCACATCACCGATGCCCAGCCTGCCTTCACTGGCAGCTACCGCTGTGAGGTGTCCACCAAGGACAAATTTGACTGCTCCAACTTCAATCTCACTGTCCACGAGGCCATGGGCACCGGAGACCTGGACCTCCTATCAGCCTTCCGCCGCACGAGCCTGGCTGGAGGTGGTCGGCGGATCAGTGATAGCCATGAGGACACTGGGATTCTGGACTTCAGCTCACTGCTGAAAAAGAGAGACAGTTTCCGGACCCCGAGGGACTCGAAGCTGGAGGCACCAGCAGAGGAGGACGTGTGGGAGATCCTACGGCAGGCACCCCCATCTGAGTACGAGCGCATCGCCTTCCAGTACGGCGTCACTGACCTGCGCGGCATGCTAAAGAGGCTCAAGGGCATGAGGCGCGATGAGAAGAAGAGCACAGCCTTTCAGAAGAAGCTGGAGCCGGCCTACCAGGTGAGCAAAGGCCACAAGATCCGGCTGACCGTGGAACTGGCTGACCATGACGCTGAGGTCAAATGGCTCAAGAATGGCCAGGAGATCCAGATGAGCGGCAGCAAGTACATCTTTGAGTCCATCGGTGCCAAGCGTACCCTGACCATCAGCCAGTGCTCATTGGCGGACGACGCAGCCTACCAGTGCGTGGTGGGTGGCGAGAAGTGTAGCACGGAGCTCTTTGTGAAAGAGCCCCCTGTGCTCATCACGCGCCCCTTGGAGGACCAGCTGGTGATGGTGGGGCAGCGGGTGGAGTTTGAGTGTGAAGTATCGGAGGAGGGGGCGCAAGTCAAATGGCTGAAGGACGGGGTGGAGCTGACCCGGGAGGAGACCTTCAAATACCGGTTCAAGAAGGACGGGCAGAGACACCACCTGATCATCAACGAGGCCATGCTGGAGGACGCGGGGCACTATGCACTGTGCACTAGCGGGGGCCAGGCGCTGGCTGAGCTCATTGTGCAGGAAAAGAAGCTGGAGCCTCCCAAGATCCACCTGGACTGCCCAGGCCGCATACCAGACACCATTGTGGTTGTAGCTGGAAATAAGCTACGTCTGGACGTCCCTATCTCTGGGGACCCCGCTCCCACTGTGATCTGGCAGAAGGCTATCACGCAGGGGAATAAGGCCCCAGCCAGGCCAGCCCCAGATGCCCCAGAGGACACAGGTGACAGCGATGAGTGGGTGTTTGACAAGAAGCTGCTGTGTGAGACCGAGGGCCGGGTCCGCGTGGAGACCACCAAGGACCGCAGCATCTTCACGGTCGAGGGGGCAGAGAAGGAAGATGAGGGCGTCTACACGGTCACAGTGAAGAACCCTGTGGGCGAGGACCAGGTCAACCTCACAGTCAAGGTCATCGACGTGCCAGACGCACCTGCGGCCCCCAAGATCAGCAACGTGGGAGAGGACTCCTGCACAGTACAGTGGGAGCCGCCTGCCTACGATGGCGGGCAGCCCATCCTGGGCTACATCCTGGAGCGCAAGAAGAAGAAGAGCTACCGGTGGATGCGGCTGAACTTCGACCTGATTCAGGAGCTGAGTCATGAAGCGCGGCGCATGATCGAGGGCGTGGTGTACGAGATGCGCGTCTACGCGGTCAACGCCATCGGCATGTCCAGGCCCAGCCCTGCCTCCCAGCCCTTCATGCCTATCGGTCCCCCCAGCGAACCCACCCACCTGGCAGTAGAGGACGTCTCTGACACCACGGTCTCCCTCAAGTGGCGGCCCCCAGAGCGCGTGGGAGCAGGAGGCCTGGATGGCTACAGCGTGGAGTACTGCCCAGAGGGCTGCTCAGAGTGGGTGGCTGCCCTGCAGGGGCTGACAGAGCACACATCGATACTGGTGAAGGACCTGCCCACGGGGGCCCGGCTGCTTTTCCGAGTGCGGGCACACAATATGGCAGGGCCTGGAGCCCCTGTTACCACCACGGAGCCGGTGACAGTGCAGGAGATCCTGCAACGGCCACGGCTTCAGCTGCCCAGGCACCTGCGCCAGACCATTCAGAAGAAGGTCGGGGAGCCTGTGAACCTTCTCATCCCTTTCCAGGGCAAGCCCCGGCCTCAGGTGACCTGGACCAAAGAGGGGCAGCCCCTGGCAGGCGAGGAGGTGAGCATCCGCAACAGCCCCACAGACACCATCCTGTTCATCCGGGCCGCTCGCCGCGTGCATTCAGGCACTTACCAGGTGACGGTGCGCATTGAGAACATGGAGGACAAGGCCACGCTGGTGCTGCAGGTTGTTGACAAGCCAAGTCCTCCCCAGGATCTCCGGGTGACTGACGCCTGGGGTCTTAATGTGGCTCTGGAGTGGAAGCCACCCCAGGATGTCGGCAACACGGAACTCTGGGGGTACACAGTGCAGAAAGCCGACAAGAAGACCATGGAGTGGTTCACCGTCTTGGAGCATTACCGCCGCACCCACTGCGTGGTGCCAGAGCTCATCATTGGCAATGGCTACTACTTCCGCGTCTTCAGCCAGAATATGGTTGGCTTTAGTGACAGAGCGGCCACCACCAAGGAGCCCGTCTTTATCCCCAGACCAGGCATCACCTATGAGCCACCCAACTATAAGGCCCTGGACTTCTCCGAGGCCCCAAGCTTCACCCAGCCCCTGGTGAACCGCTCGGTCATCGCGGGCTACACTGCTATGCTCTGCTGTGCTGTCCGGGGTAGCCCCAAGCCCAAGATTTCCTGGTTCAAGAATGGCCTGGACCTGGGAGAAGACGCCCGCTTCCGCATGTTCAGCAAGCAGGGAGTGTTGACTCTGGAGATTAGAAAGCCCTGCCCCTTTGACGGGGGCATCTATGTCTGCAGGGCCACCAACTTACAGGGCGAGGCACGGTGTGAGTGCCGCCTGGAGGTGCGAGTGCCTCAGTAA	813
MYBPC3-delC4b DNA	ATGCCTGAGCCGGGGAAGAAGCCAGTCTCAGCTTTTAGCAAGAAGCCACGGTCAGTGGAAGTGGCCGCAGGCAGCCCTGCCGTGTTCGAGGCCGAGACAGAGCGGGCAGGAGTGAAGGTGCGCTGGCAGCGCGGAGGCAGTGACATCAGCGCCAGCAACAAGTACGGCCTGGCCACAGAGGGCACACGGCATACGCTGACAGTGCGGGAAGTGGGCCCTGCCGACCAGGGATCTTACGCAGTCATTGCTGGCTCCTCCAAGGTCAAGTTCGACCTCAAGGTCATAGAGGCAGAGAAGGCAGAGCCCATGCTGGCCCCTGCCCCTGCCCCTGCTGAGGCCACTGGAGCCCCTGGAGAAGCCCCGGCCCCAGCCGCTGAGCTGGGAGAAAGTGCCCCAAGTCCCAAAGGGTCAAGCTCAGCAGCTCTCAATGGTCCTACCCCTGGAGCCCCCGATGACCCCATTGGCCTCTTCGTGATGCGGCCACAGGATGGCGAGGTGACCGTGGGTGGCAGCATCACCTTCTCAGCCCGCGTGGCCGGCGCCAGCCTCCTGAAGCCGCCTGTGGTCAAGTGGTTCAAGGGCAAATGGGTGGACCTGAGCAGCAAGGTGGGCCAGCACCTGCAGCTGCACGACAGCTACGACCGCGCCAGCAAGGTCTATCTGTTCGAGCTGCACATCACCGATGCCCAGCCTGCCTTCACTGGCAGCTACCGCTGTGAGGTGTCCACCAAGGACAAATTTGACTGCTCCAACTTCAATCTCACTGTCCACGAGGCCATGGGCACCGGAGACCTGGACCTCCTATCAGCCTTCCGCCGCACGAGCCTGGCTGGAGGTGGTCGGCGGATCAGTGATAGCCATGAGGACACTGGGATTCTGGACTTCAGCTCACTGCTGAAAAAGAGAGACAGTTTCCGGACCCCGAGGGACTCGAAGCTGGAGGCACCAGCAGAGGAGGACGTGTGGGAGATCCTACGGCAGGCACCCCCATCTGAGTACGAGCGCATCGCCTTCCAGTACGGCGTCACTGACCTGCGCGGCATGCTAAAGAGGCTCAAGGGCATGAGGCGCGATGAGAAGAAGAGCACAGCCTTTCAGAAGAAGCTGGAGCCGGCCTACCAGGTGAGCAAAGGCCACAAGATCCGGCTGACCGTGGAACTGGCTGACCATGACGCTGAGGTCAAATGGCTCAAGAATGGCCAGGAGATCCAGATGAGCGGCAGCAAGTACATCTTTGAGTCCATCGGTGCCAAGCGTACCCTGACCATCAGCCAGTGCTCATTGGCGGACGACGCAGCCTACCAGTGCGTGGTGGGTGGCGAGAAGTGTAGCACGGAGCTCTTTGTGAAAGAGCCCCCTGTGCTCATCACGCGCCCCTTGGAGGACCAGCTGGTGATGGTGGGGCAGCGGGTGGAGTTTGAGTGTGAAGTATCGGAGGAGGGGGCGCAAGTCAAATGGCTGAAGGACGGGGTGGAGCTGACCCGGGAGGAGACCTTCAAATACCGGTTCAAGAAGGACGGGCAGAGACACCACCTGATCATCAACGAGGCCATGCTGGAGGACGCGGGGCACTATGCACTGTGCACTAGCGGGGGCCAGGCGCTGGCTGAGCTCATTGTGCAGGAAAAGAAGCTGGAGCCCAGGCAGGAACCTCCCAAGATCCACCTGGACTGCCCAGGCCGCATACCAGACACCATTGTGGTTGTAGCTGGAAATAAGCTACGTCTGGACGTCCCTATCTCTGGGGACCCCGCTCCCACTGTGATCTGGCAGAAGGCTATCACGCAGGGGAATAAGGCCCCAGCCAGGCCAGCCCCAGATGCCCCAGAGGACACAGGTGACAGCGATGAGTGGGTGTTTGACAAGAAGCTGCTGTGTGAGACCGAGGGCCGGGTCCGCGTGGAGACCACCAAGGACCGCAGCATCTTCACGGTCGAGGGGGCAGAGAAGGAAGATGAGGGCGTCTACACGGTCACAGTGAAGAACCCTGTGGGCGAGGACCAGGTCAACCTCACAGTCAAGGTCATCGACGTGCCAGACGCACCTGCGGCCCCCAAGATCAGCAACGTGGGAGAGGACTCCTGCACAGTACAGTGGGAGCCGCCTGCCTACGATGGCGGGCAGCCCATCCTGGGCTACATCCTGGAGCGCAAGAAGAAGAAGAGCTACCGGTGGATGCGGCTGAACTTCGACCTGATTCAGGAGCTGAGTCATGAAGCGCGGCGCATGATCGAGGGCGTGGTGTACGAGATGCGCGTCTACGCGGTCAACGCCATCGGCATGTCCAGGCCCAGCCCTGCCTCCCAGCCCTTCATGCCTATCGGTCCCCCCAGCGAACCCACCCACCTGGCAGTAGAGGACGTCTCTGACACCACGGTCTCCCTCAAGTGGCGGCCCCCAGAGCGCGTGGGAGCAGGAGGCCTGGATGGCTACAGCGTGGAGTACTGCCCAGAGGGCTGCTCAGAGTGGGTGGCTGCCCTGCAGGGGCTGACAGAGCACACATCGATACTGGTGAAGGACCTGCCCACGGGGGCCCGGCTGCTTTTCCGAGTGCGGGCACACAATATGGCAGGGCCTGGAGCCCCTGTTACCACCACGGAGCCGGTGACAGTGCAGGAGATCCTGCAACGGCCACGGCTTCAGCTGCCCAGGCACCTGCGCCAGACCATTCAGAAGAAGGTCGGGGAGCCTGTGAACCTTCTCATCCCTTTCCAGGGCAAGCCCCGGCCTCAGGTGACCTGGACCAAAGAGGGGCAGCCCCTGGCAGGCGAGGAGGTGAGCATCCGCAACAGCCCCACAGACACCATCCTGTTCATCCGGGCCGCTCGCCGCGTGCATTCAGGCACTTACCAGGTGACGGTGCGCATTGAGAACATGGAGGACAAGGCCACGCTGGTGCTGCAGGTTGTTGACAAGCCAAGTCCTCCCCAGGATCTCCGGGTGACTGACGCCTGGGGTCTTAATGTGGCTCTGGAGTGGAAGCCACCCCAGGATGTCGGCAACACGGAACTCTGGGGGTACACAGTGCAGAAAGCCGACAAGAAGACCATGGAGTGGTTCACCGTCTTGGAGCATTACCGCCGCACCCACTGCGTGGTGCCAGAGCTCATCATTGGCAATGGCTACTACTTCCGCGTCTTCAGCCAGAATATGGTTGGCTTTAGTGACAGAGCGGCCACCACCAAGGAGCCCGTCTTTATCCCCAGACCAGGCATCACCTATGAGCCACCCAACTATAAGGCCCTGGACTTCTCCGAGGCCCCAAGCTTCACCCAGCCCCTGGTGAACCGCTCGGTCATCGCGGGCTACACTGCTATGCTCTGCTGTGCTGTCCGGGGTAGCCCCAAGCCCAAGATTTCCTGGTTCAAGAATGGCCTGGACCTGGGAGAAGACGCCCGCTTCCGCATGTTCAGCAAGCAGGGAGTGTTGACTCTGGAGATTAGAAAGCCCTGCCCCTTTGACGGGGGCATCTATGTCTGCAGGGCCACCAACTTACAGGGCGAGGCACGGTGTGAGTGCCGCCTGGAGGTGCGAGTGCCTCAGTAA	814
人類MYBPC3蛋白質	MPEPGKKPVSAFSKKPRSVEVAAGSPAVFEAETERAGVKVRWQRGGSDISASNKYGLATEGTRHTLTVREVGPADQGSYAVIAGSSKVKFDLKVIEAEKAEPMLAPAPAPAEATGAPGEAPAPAAELGESAPSPKGSSSAALNGPTPGAPDDPIGLFVMRPQDGEVTVGGSITFSARVAGASLLKPPVVKWFKGKWVDLSSKVGQHLQLHDSYDRASKVYLFELHITDAQPAFTGSYRCEVSTKDKFDCSNFNLTVHEAMGTGDLDLLSAFRRTSLAGGGRRISDSHEDTGILDFSSLLKKRDSFRTPRDSKLEAPAEEDVWEILRQAPPSEYERIAFQYGVTDLRGMLKRLKGMRRDEKKSTAFQKKLEPAYQVSKGHKIRLTVELADHDAEVKWLKNGQEIQMSGSKYIFESIGAKRTLTISQCSLADDAAYQCVVGGEKCSTELFVKEPPVLITRPLEDQLVMVGQRVEFECEVSEEGAQVKWLKDGVELTREETFKYRFKKDGQRHHLIINEAMLEDAGHYALCTSGGQALAELIVQEKKLEVYQSIADLMVGAKDQAVFKCEVSDENVRGVWLKNGKELVPDSRIKVSHIGRVHKLTIDDVTPADEADYSFVPEGFACNLSAKLHFMEVKIDFVPRQEPPKIHLDCPGRIPDTIVVVAGNKLRLDVPISGDPAPTVIWQKAITQGNKAPARPAPDAPEDTGDSDEWVFDKKLLCETEGRVRVETTKDRSIFTVEGAEKEDEGVYTVTVKNPVGEDQVNLTVKVIDVPDAPAAPKISNVGEDSCTVQWEPPAYDGGQPILGYILERKKKKSYRWMRLNFDLIQELSHEARRMIEGVVYEMRVYAVNAIGMSRPSPASQPFMPIGPPSEPTHLAVEDVSDTTVSLKWRPPERVGAGGLDGYSVEYCPEGCSEWVAALQGLTEHTSILVKDLPTGARLLFRVRAHNMAGPGAPVTTTEPVTVQEILQRPRLQLPRHLRQTIQKKVGEPVNLLIPFQGKPRPQVTWTKEGQPLAGEEVSIRNSPTDTILFIRAARRVHSGTYQVTVRIENMEDKATLVLQVVDKPSPPQDLRVTDAWGLNVALEWKPPQDVGNTELWGYTVQKADKKTMEWFTVLEHYRRTHCVVPELIIGNGYYFRVFSQNMVGFSDRAATTKEPVFIPRPGITYEPPNYKALDFSEAPSFTQPLVNRSVIAGYTAMLCCAVRGSPKPKISWFKNGLDLGEDARFRMFSKQGVLTLEIRKPCPFDGGIYVCRATNLQGEARCECRLEVRVPQ	815
MYBPC3-delC3蛋白質	MPEPGKKPVSAFSKKPRSVEVAAGSPAVFEAETERAGVKVRWQRGGSDISASNKYGLATEGTRHTLTVREVGPADQGSYAVIAGSSKVKFDLKVIEAEKAEPMLAPAPAPAEATGAPGEAPAPAAELGESAPSPKGSSSAALNGPTPGAPDDPIGLFVMRPQDGEVTVGGSITFSARVAGASLLKPPVVKWFKGKWVDLSSKVGQHLQLHDSYDRASKVYLFELHITDAQPAFTGSYRCEVSTKDKFDCSNFNLTVHEAMGTGDLDLLSAFRRTSLAGGGRRISDSHEDTGILDFSSLLKKRDSFRTPRDSKLEAPAEEDVWEILRQAPPSEYERIAFQYGVTDLRGMLKRLKGMRRDEKKSTAFQKKLEPAYQVSKGHKIRLTVELADHDAEVKWLKNGQEIQMSGSKYIFESIGAKRTLTISQCSLADDAAYQCVVGGEKCSTELFVKEPPVYQSIADLMVGAKDQAVFKCEVSDENVRGVWLKNGKELVPDSRIKVSHIGRVHKLTIDDVTPADEADYSFVPEGFACNLSAKLHFMEVKIDFVPRQEPPKIHLDCPGRIPDTIVVVAGNKLRLDVPISGDPAPTVIWQKAITQGNKAPARPAPDAPEDTGDSDEWVFDKKLLCETEGRVRVETTKDRSIFTVEGAEKEDEGVYTVTVKNPVGEDQVNLTVKVIDVPDAPAAPKISNVGEDSCTVQWEPPAYDGGQPILGYILERKKKKSYRWMRLNFDLIQELSHEARRMIEGVVYEMRVYAVNAIGMSRPSPASQPFMPIGPPSEPTHLAVEDVSDTTVSLKWRPPERVGAGGLDGYSVEYCPEGCSEWVAALQGLTEHTSILVKDLPTGARLLFRVRAHNMAGPGAPVTTTEPVTVQEILQRPRLQLPRHLRQTIQKKVGEPVNLLIPFQGKPRPQVTWTKEGQPLAGEEVSIRNSPTDTILFIRAARRVHSGTYQVTVRIENMEDKATLVLQVVDKPSPPQDLRVTDAWGLNVALEWKPPQDVGNTELWGYTVQKADKKTMEWFTVLEHYRRTHCVVPELIIGNGYYFRVFSQNMVGFSDRAATTKEPVFIPRPGITYEPPNYKALDFSEAPSFTQPLVNRSVIAGYTAMLCCAVRGSPKPKISWFKNGLDLGEDARFRMFSKQGVLTLEIRKPCPFDGGIYVCRATNLQGEARCECRLEVRVPQ	816
MYBPC3-delC4蛋白質	MPEPGKKPVSAFSKKPRSVEVAAGSPAVFEAETERAGVKVRWQRGGSDISASNKYGLATEGTRHTLTVREVGPADQGSYAVIAGSSKVKFDLKVIEAEKAEPMLAPAPAPAEATGAPGEAPAPAAELGESAPSPKGSSSAALNGPTPGAPDDPIGLFVMRPQDGEVTVGGSITFSARVAGASLLKPPVVKWFKGKWVDLSSKVGQHLQLHDSYDRASKVYLFELHITDAQPAFTGSYRCEVSTKDKFDCSNFNLTVHEAMGTGDLDLLSAFRRTSLAGGGRRISDSHEDTGILDFSSLLKKRDSFRTPRDSKLEAPAEEDVWEILRQAPPSEYERIAFQYGVTDLRGMLKRLKGMRRDEKKSTAFQKKLEPAYQVSKGHKIRLTVELADHDAEVKWLKNGQEIQMSGSKYIFESIGAKRTLTISQCSLADDAAYQCVVGGEKCSTELFVKEPPVLITRPLEDQLVMVGQRVEFECEVSEEGAQVKWLKDGVELTREETFKYRFKKDGQRHHLIINEAMLEDAGHYALCTSGGQALAELIVQEKKLEPPKIHLDCPGRIPDTIVVVAGNKLRLDVPISGDPAPTVIWQKAITQGNKAPARPAPDAPEDTGDSDEWVFDKKLLCETEGRVRVETTKDRSIFTVEGAEKEDEGVYTVTVKNPVGEDQVNLTVKVIDVPDAPAAPKISNVGEDSCTVQWEPPAYDGGQPILGYILERKKKKSYRWMRLNFDLIQELSHEARRMIEGVVYEMRVYAVNAIGMSRPSPASQPFMPIGPPSEPTHLAVEDVSDTTVSLKWRPPERVGAGGLDGYSVEYCPEGCSEWVAALQGLTEHTSILVKDLPTGARLLFRVRAHNMAGPGAPVTTTEPVTVQEILQRPRLQLPRHLRQTIQKKVGEPVNLLIPFQGKPRPQVTWTKEGQPLAGEEVSIRNSPTDTILFIRAARRVHSGTYQVTVRIENMEDKATLVLQVVDKPSPPQDLRVTDAWGLNVALEWKPPQDVGNTELWGYTVQKADKKTMEWFTVLEHYRRTHCVVPELIIGNGYYFRVFSQNMVGFSDRAATTKEPVFIPRPGITYEPPNYKALDFSEAPSFTQPLVNRSVIAGYTAMLCCAVRGSPKPKISWFKNGLDLGEDARFRMFSKQGVLTLEIRKPCPFDGGIYVCRATNLQGEARCECRLEVRVPQ	817
MYBPC3-delC4b蛋白質	MPEPGKKPVSAFSKKPRSVEVAAGSPAVFEAETERAGVKVRWQRGGSDISASNKYGLATEGTRHTLTVREVGPADQGSYAVIAGSSKVKFDLKVIEAEKAEPMLAPAPAPAEATGAPGEAPAPAAELGESAPSPKGSSSAALNGPTPGAPDDPIGLFVMRPQDGEVTVGGSITFSARVAGASLLKPPVVKWFKGKWVDLSSKVGQHLQLHDSYDRASKVYLFELHITDAQPAFTGSYRCEVSTKDKFDCSNFNLTVHEAMGTGDLDLLSAFRRTSLAGGGRRISDSHEDTGILDFSSLLKKRDSFRTPRDSKLEAPAEEDVWEILRQAPPSEYERIAFQYGVTDLRGMLKRLKGMRRDEKKSTAFQKKLEPAYQVSKGHKIRLTVELADHDAEVKWLKNGQEIQMSGSKYIFESIGAKRTLTISQCSLADDAAYQCVVGGEKCSTELFVKEPPVLITRPLEDQLVMVGQRVEFECEVSEEGAQVKWLKDGVELTREETFKYRFKKDGQRHHLIINEAMLEDAGHYALCTSGGQALAELIVQEKKLEPRQEPPKIHLDCPGRIPDTIVVVAGNKLRLDVPISGDPAPTVIWQKAITQGNKAPARPAPDAPEDTGDSDEWVFDKKLLCETEGRVRVETTKDRSIFTVEGAEKEDEGVYTVTVKNPVGEDQVNLTVKVIDVPDAPAAPKISNVGEDSCTVQWEPPAYDGGQPILGYILERKKKKSYRWMRLNFDLIQELSHEARRMIEGVVYEMRVYAVNAIGMSRPSPASQPFMPIGPPSEPTHLAVEDVSDTTVSLKWRPPERVGAGGLDGYSVEYCPEGCSEWVAALQGLTEHTSILVKDLPTGARLLFRVRAHNMAGPGAPVTTTEPVTVQEILQRPRLQLPRHLRQTIQKKVGEPVNLLIPFQGKPRPQVTWTKEGQPLAGEEVSIRNSPTDTILFIRAARRVHSGTYQVTVRIENMEDKATLVLQVVDKPSPPQDLRVTDAWGLNVALEWKPPQDVGNTELWGYTVQKADKKTMEWFTVLEHYRRTHCVVPELIIGNGYYFRVFSQNMVGFSDRAATTKEPVFIPRPGITYEPPNYKALDFSEAPSFTQPLVNRSVIAGYTAMLCCAVRGSPKPKISWFKNGLDLGEDARFRMFSKQGVLTLEIRKPCPFDGGIYVCRATNLQGEARCECRLEVRVPQ	818
人類MMP11 DNA	ATGGCTCCGGCCGCCTGGCTCCGCAGCGCGGCCGCGCGCGCCCTCCTGCCCCCGATGCTGCTGCTGCTGCTCCAGCCGCCGCCGCTGCTGGCCCGGGCTCTGCCGCCGGACGCCCACCACCTCCATGCCGAGAGGAGGGGGCCACAGCCCTGGCATGCAGCCCTGCCCAGTAGCCCGGCACCTGCCCCTGCCACGCAGGAAGCCCCCCGGCCTGCCAGCAGCCTCAGGCCTCCCCGCTGTGGCGTGCCCGACCCATCTGATGGGCTGAGTGCCCGCAACCGACAGAAGAGGTTCGTGCTTTCTGGCGGGCGCTGGGAGAAGACGGACCTCACCTACAGGATCCTTCGGTTCCCATGGCAGTTGGTGCAGGAGCAGGTGCGGCAGACGATGGCAGAGGCCCTAAAGGTATGGAGCGATGTGACGCCACTCACCTTTACTGAGGTGCACGAGGGCCGTGCTGACATCATGATCGACTTCGCCAGGTACTGGCATGGGGACGACCTGCCGTTTGATGGGCCTGGGGGCATCCTGGCCCATGCCTTCTTCCCCAAGACTCACCGAGAAGGGGATGTCCACTTCGACTATGATGAGACCTGGACTATCGGGGATGACCAGGGCACAGACCTGCTGCAGGTGGCAGCCCATGAATTTGGCCACGTGCTGGGGCTGCAGCACACAACAGCAGCCAAGGCCCTGATGTCCGCCTTCTACACCTTTCGCTACCCACTGAGTCTCAGCCCAGATGACTGCAGGGGCGTTCAACACCTATATGGCCAGCCCTGGCCCACTGTCACCTCCAGGACCCCAGCCCTGGGCCCCCAGGCTGGGATAGACACCAATGAGATTGCACCGCTGGAGCCAGACGCCCCGCCAGATGCCTGTGAGGCCTCCTTTGACGCGGTCTCCACCATCCGAGGCGAGCTCTTTTTCTTCAAAGCGGGCTTTGTGTGGCGCCTCCGTGGGGGCCAGCTGCAGCCCGGCTACCCAGCATTGGCCTCTCGCCACTGGCAGGGACTGCCCAGCCCTGTGGACGCTGCCTTCGAGGATGCCCAGGGCCACATTTGGTTCTTCCAAGGTGCTCAGTACTGGGTGTACGACGGTGAAAAGCCAGTCCTGGGCCCCGCACCCCTCACCGAGCTGGGCCTGGTGAGGTTCCCGGTCCATGCTGCCTTGGTCTGGGGTCCCGAGAAGAACAAGATCTACTTCTTCCGAGGCAGGGACTACTGGCGTTTCCACCCCAGCACCCGGCGTGTAGACAGTCCCGTGCCCCGCAGGGCCACTGACTGGAGAGGGGTGCCCTCTGAGATCGACGCTGCCTTCCAGGATGCTGATGGCTATGCCTACTTCCTGCGCGGCCGCCTCTACTGGAAGTTTGACCCTGTGAAGGTGAAGGCTCTGGAAGGCTTCCCCCGTCTCGTGGGTCCTGACTTCTTTGGCTGTGCCGAGCCTG CCAACACTTTCCTC	819
人類SYNPO2LA DNA	ATGGGTGCTGAGGAGGAGGTGCTGGTCACACTATCAGGGGGAGCCCCCTGGGGCTTCCGACTTCATGGGGGGGCCGAGCAGAGGAAACCGTTACAGGTGTCTAAGATTCGAAGACGGAGCCAGGCTGGCAGAGCAGGACTCCGAGAGAGGGACCAGCTCTTGGCAATCAATGGGGTCTCTTGCACCAACCTCTCCCATGCCAGTGCCATGAGCCTCATCGATGCCTCAGGAAATCAGCTTGTCCTCACTGTGCAGCGGTTAGCAGACGAGGGTCCTGTGCAATCTCCATCTCCCCATGAGCTTCAGGTGCTGTCACCCTTATCTCCACTAAGTCCTGAGCCCCCTGGTGCTCCAGTTCCTCAGCCTCTTCAGCCTGGGAGCCTTCGTTCACCTCCTGATAGTGAGGCTTACTACGGAGAGACTGACAGTGATGCTGATGGCCCTGCCACCCAGGAGAAGCCCCGTCGACCTCGCCGCCGAGGCCCCACAAGGCCCACCCCTCCGGGTGCCCCACCTGATGAGGTCTACCTGTCTGACAGCCCTGCAGAGCCAGCACCTACTATCCCTGGCCCTCCCAGCCAGGGTGACAGCGTGTGAGCTCCCCGTCTTGGGAGGATGGGGCAGCCCTTCAGCCACCCCCAGCTGAGGCTCTGCTGTTACCCCATGGCCCCCTCCGACCTGGTCCTCATCTCATCCCTATGGTGGGGCCTGTTCCCCACCCAGTGGCAGAAGATCTTACTACCACCTACACCCAGAAGGCCAAGCAAGCCAAACTGCAACGTGCAGAGAGCCTCCAAGAGAAGAGCATAAAAGAGGCCAAGACCAAATGCAGGACAATTGCATCCCTGCTCACTGCAGCCCCCAACCCCCACTCCAAAGGGGTACTTATGTTTAAGAAACGGCGGCAGAGAGCCAAGAAGTACACCCTGGTGAGCTTCGGGGCTGCTGCTGGGACAGGCGCTGAGGAGGAGGACGGCGTTCCCCCCACGAGTGAGTCCGAGCTGGACGAAGAAGCCTTCTCTGACGCCCGCAGCCTCACCAATCAATCTGACTGGGACAGTCCCTATCTGGACATGGAGCTTGCCAGGGCGGGCTCAAGAGCATCAGAGGGCCAGGGCTCTGGGCTGGGAGGGCAGCTGAGTGAGGTCTCTGGGCGAGGGGTGCAGCTCTTTGAACAGCAGCGCCAGCGCGCAGACTCCAGCACCCAGGAACTGGCACGGGTCGAACCAGCAGCCATGCTCAACGGGGAAGGCCTGCAGTCACCACCTCGGGCCCAGAGTGCTCCCCCAGAGGCAGCTGTGCTCCCACCCAGCCCCTTGCCGGCGCCTGTAGCCAGCCCCAGACCCTTCCAACCAGGTGGTGGAGCCCCGACCCCAGCTCCAAGCATCTTTAACCGGTCAGCCAGGCCCTTTACCCCGGGCCTACAAGGGCAGCGGCCAACTACCACCTCGGTTATTTTCCGGCCTTTAGCCCCCAAAAGGGCGAACGACAGCCTGGGGGGCCTCAGCCCCGCCCCACCCCCCTTCTTGTCTTCGCAGGGGCCCACCCCTCTGCCCAGCTTCACTTCAGGGGTTCCCAGCCACGCGCCAGTCTCTGGTTCCCCCAGCACCCCACGCTCCTCGGGCCCTGTGACAGCCACCAGCTCCCTGTACATCCCAGCCCCTAGTCGGCCTGTCACCCCAGGTGGAGCTCCAGAGCCCCCCGCTCCTCCTAGCGCAGCTGCCATGACCTCCACCGCTTCTATCTTCCTATCTGCGCCTTTGCGACCCTCTGCGCGCCCAGAGGCGCCTGCCCCAGGCCCAGGGGCTCCTGAGCCCCCCAGCGCTCGCGAGCAGCGCATCTCTGTGCCAGCTGCCCGCACGGGTATCCTGCAGGAGGCCCGGCGCCGGGGGACCCGGAAGCAGATGTTCCGGCCGGGAAAGGAGGAGACGAAGAACTCGCCCAACCCCGAGCTGCTATCGCTGGTACAGAACCTGGATGAAAAGCCTCGGGCCGGGGGTGCAGAATCTGGTCCTGAAGAAGATGCTCTGAGCCTCGGGGCTGAAGCCTGCAACTTCATGCAGCCAGTAGGGGCCAGGAGTTACAAGACCCTGCCTCACGTGACACCTAAGACCCCCCCTCCAATGGCTCCCAAGACCCCGCCCCCTATGACTCCTAAGACTCCACCCCCAGTGGCTCCTAAGCCCCCATCTCGAGGGCTCCTTGATGGGCTCGTGAATGGGGCAGCCTCTTCGGCTGGAATCCCTGAGCCACCAAGGCTGCAGGGCAGGGGTGGGGAGCTGTTTGCTAAGCGGCAGAGCCGTGCGGACAGGTATGTGGTGGAAGGTACACCTGGTCCTGGTCTTGGCCCTCGGCCTAGAAGTCCTTCTCCTACCCCGTCTCTGCCCCCTTCCTGGAAATATTCACCCAACATCCGTGCCCCGCCTCCTATTGCTTACAACCCACTGCTCTCTCCCTTTTTCCCCCAGGCGGCCCGAACTCTCCCTAAGGCCCAATCCCAGGGGCCTCGGGCAACACCCAAGCAGGGCATCAAGGCTCTAGATTTTATGCGGCATCAGCCCTATCAACTTAAAACTGCCATGTTCTGTTTTGATGAGGTTCCCCCGACTCCTGGCCCTATCGCCTCAGGGTCCCCCAAAACTGCCCGAGTCCAGGAGATTCGCCGGTTTTCCACTCCGGCACCCCAGCCCACTGCAGAACCCCTGGCTCCCACTGTGCTTGCCCCCCGAGCAGCCACTACACTGGATGAGCCCATCTGGAGAACAGAACTGGCCTCAGCCCCTGTTCCTAGCCCAGCCCCTCCTCCAGAGGCTCCCAGGGGCCTTGGGGCTTCTCCCAGCTCCTGCGGTTTCCAGGTAGCCAGGCCCCGATTTTCAGCCACCAGAACAGGATTGCAAGCTCATGTGTGGAGGCCTGGGGCAGGGCACCAG	820
人類SYNPO2LBDNA	ATGGAGACCTTTGAGCCCATCAGCCAAGAGCCCCTCAGCCAAGCCAGCTATGACAAAGCCCCAGACCCAGTTCCTGAGCTCCAAGACTCGTTCTATGCAGAACTGCAACGTGCAGAGAGCCTCCAAGAGAAGAGCATAAAAGAGGCCAAGACCAAATGCAGGACAATTGCATCCCTGCTCACTGCAGCCCCCAACCCCCACTCCAAAGGGGTACTTATGTTTAAGAAACGGCGGCAGAGAGCCAAGAAGTACACCCTGGTGAGCTTCGGGGCTGCTGCTGGGACAGGCGCTGAGGAGGAGGACGGCGTTCCCCCCACGAGTGAGTCCGAGCTGGACGAAGAAGCCTTCTCTGACGCCCGCAGCCTCACCAATCAATCTGACTGGGACAGTCCCTATCTGGACATGGAGCTTGCCAGGGCGGGCTCAAGAGCATCAGAGGGCCAGGGCTCTGGGCTGGGAGGGCAGCTGAGTGAGGTCTCTGGGCGAGGGGTGCAGCTCTTTGAACAGCAGCGCCAGCGCGCAGACTCCAGCACCCAGGAACTGGCACGGGTCGAACCAGCAGCCATGCTCAACGGGGAAGGCCTGCAGTCACCACCTCGGGCCCAGAGTGCTCCCCCAGAGGCAGCTGTGCTCCCACCCAGCCCCTTGCCGGCGCCTGTAGCCAGCCCCAGACCCTTCCAACCAGGTGGTGGAGCCCCGACCCCAGCTCCAAGCATCTTTAACCGGTCAGCCAGGCCCTTTACCCCGGGCCTACAAGGGCAGCGGCCAACTACCACCTCGGTTATTTTCCGGCCTTTAGCCCCCAAAAGGGCGAACGACAGCCTGGGGGGCCTCAGCCCCGCCCCACCCCCCTTCTTGTCTTCGCAGGGGCCCACCCCTCTGCCCAGCTTCACTTCAGGGGTTCCCAGCCACGCGCCAGTCTCTGGTTCCCCCAGCACCCCACGCTCCTCGGGCCCTGTGACAGCCACCAGCTCCCTGTACATCCCAGCCCCTAGTCGGCCTGTCACCCCAGGTGGAGCTCCAGAGCCCCCCGCTCCTCCTAGCGCAGCTGCCATGACCTCCACCGCTTCTATCTTCCTATCTGCGCCTTTGCGACCCTCTGCGCGCCCAGAGGCGCCTGCCCCAGGCCCAGGGGCTCCTGAGCCCCCCAGCGCTCGCGAGCAGCGCATCTCTGTGCCAGCTGCCCGCACGGGTATCCTGCAGGAGGCCCGGCGCCGGGGGACCCGGAAGCAGATGTTCCGGCCGGGAAAGGAGGAGACGAAGAACTCGCCCAACCCCGAGCTGCTATCGCTGGTACAGAACCTGGATGAAAAGCCTCGGGCCGGGGGTGCAGAATCTGGTCCTGAAGAAGATGCTCTGAGCCTCGGGGCTGAAGCCTGCAACTTCATGCAGCCAGTAGGGGCCAGGAGTTACAAGACCCTGCCTCACGTGACACCTAAGACCCCCCCTCCAATGGCTCCCAAGACCCCGCCCCCTATGACTCCTAAGACTCCACCCCCAGTGGCTCCTAAGCCCCCATCTCGAGGGCTCCTTGATGGGCTCGTGAATGGGGCAGCCTCTTCGGCTGGAATCCCTGAGCCACCAAGGCTGCAGGGCAGGGGTGGGGAGCTGTTTGCTAAGCGGCAGAGCCGTGCGGACAGGTATGTGGTGGAAGGTACACCTGGTCCTGGTCTTGGCCCTCGGCCTAGAAGTCCTTCTCCTACCCCGTCTCTGCCCCCTTCCTGGAAATATTCACCCAACATCCGTGCCCCGCCTCCTATTGCTTACAACCCACTGCTCTCTCCCTTTTTCCCCCAGGCGGCCCGAACTCTCCCTAAGGCCCAATCCCAGGGGCCTCGGGCAACACCCAAGCAGGGCATCAAGGCTCTAGATTTTATGCGGCATCAGCCCTATCAACTTAAAACTGCCATGTTCTGTTTTGATGAGGTTCCCCCGACTCCTGGCCCTATCGCCTCAGGGTCCCCCAAAACTGCCCGAGTCCAGGAGATTCGCCGGTTTTCCACTCCGGCACCCCAGCCCACTGCAGAACCCCTGGCTCCCACTGTGCTTGCCCCCCGAGCAGCCACTACACTGGATGAGCCCATCTGGAGAACAGAACTGGCCTCAGCCCCTGTTCCTAGCCCAGCCCCTCCTCCAGAGGCTCCCAGGGGCCTTGGGGCTTCTCCCAGCTCCTGCGGTTTCCAGGTAGCCAGGCCCCGATTTTCAGCCACCAGAACAGGATTGCAAGCTCATGTGTGGAGGCCTGGGGCAGGGCACCAG	821
人類MMP11蛋白質	MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDAHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKIYFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADGYAYFLRGRLYWKFDPVKVKALEGFPRLVGPDFFGCAEPANTFL	822
人類MTSS1 mRNA	agagcgagcgccggggccgggcgcgcaggagtgaaaaggaggcggcggccgcagctgcgagcaacagatccggacgccgcgagctgacccgctctgctgttgggcgatttttttttaattgcagaaaaatttattaaattggaaaatcttgcgtttttcaatggcgctggccccgggtcagcgggcgattttctctgcatcaagatgggctttgccgtttccgtagtgggcaccagtggtggcctgattgtcagtcttctcccggcatttttaaggccaggagccgagcgctgcttgtaggcgaataccctacagagcggtttggctttttaaattactgttattattttgggcagagaacagtcggtctggtgcaccccgtcctcgctgcagaagaggctgcgagtccgaggtgggtctctcggaaggtgaaattccttctggggtgagcgagccccggccccgcgcgcagtccagcggccccgcgtgtgtgccctcgccctgccggagccgggaaaatggaggctgtgattgagaaggaatgcagcgcgctcggaggcctcttccagaccatcatcagcgacatgaaggggagctatccagtttgggaagatttcataaacaaagcaggaaagctgcagtcccagcttcggacaacagtagtagcagcagctgccttcttggacgcctttcagaaagtggctgacatggccaccaacacacgtggtgggaccagggagattggatctgctctcaccaggatgtgcatgaggcacagaagcattgaagccaagctgaggcagttttcgagcgctttaattgattgtctgataaacccacttcaagaacagatggaagaatggaagaaagtggccaaccagctggataaagaccacgcaaaagaatataagaaagcccgccaagagataaaaaagaagtcctcggatacgctgaaactgcagaagaaagcaaaaaaagggagaggtgatatccagcctcagttggacagtgctctccaagatgtcaatgataagtatctcttattggaagaaacagaaaagcaggctgtccggaaggctttgattgaagaacgtggccgattctgtaccttcatctctatgctgcggccagtgattgaagaagaaatctcaatgctaggggaaataacccaccttcagaccatctcggaagatctaaaaagcctgaccatggaccctcacaaactgccctcctcaagtgaacaggtgattctggacttgaaaggttctgattacagctggtcgtatcagacgccaccctcttcccccagcaccaccatgtccagaaagtccagtgtctgcagcagcctgaacagtgtcaacagcagtgactcccggtccagcggctcccactcgcattcccccagctcacattaccgctaccgcagctccaacctggcccagcaggctcctgtgaggctgtccagcgtgtcctcccatgactcaggattcatatcccaggatgccttccagtccaagtcaccatcccccatgccgccagaggcccccaaccagttgtctaacgggttttctcactatagtttatcaagtgagtcccacgtggggcccacgggtgcaggccttttccctcattgcctgcctgcctcccgcctgctccctcgggtcacctctgtccaccttccagactacgctcattattacaccattgggcccggcatgttcccgtcatctcagatccctagctggaaggactgggctaagcctgggccctatgaccagcctctggtgaacaccctgcagcgccgcaaagagaagcgagaaccggaccccaacgggggaggacccactaccgccagcggcccacctgcagcagctgaggaggctcagagaccacggagcatgactgtatcggctgccaccaggcctggtgaggagatggaggcttgtgaggagctggccctggccctgtctcggggcctgcagctggacacccagaggagcagccgggactcgcttcagtgctccagcggctacagcacccagacaaccaccccctgctgctctgaggacaccatcccttcccaagtttcagattatgattatttctctgtaagtggtgaccaggaggcagatcagcaggagttcgacaagtcctccaccattccaagaaacagcgacatcagccagtcctaccgacggatgttccaagccaagcgtccagcctcaactgctggcctccccaccaccctgggacctgctatggtcactccaggggttgcaactatccgacggaccccttccaccaagccttctgtccgccggggaaccattggagctggtcccatccccatcaagacacccgtgatccctgtcaagaccccaaccgtcccagacctcccaggggtgttgccagcccctccagatgggccagaagagcggggggagcacagccctgagtcgccatctgtgggtgagggcccccaaggtgtcaccagcatgccctcctcaatgtggagcggccaagcttccgttaaccctccacttccaggcccgaagcccagtatccctgaggagcacagacaggcaattccagaaagtgaagctgaagaccaggaacgggaacccccaagtgccactgtctccccaggccagattccagagagtgaccctgcagacctgagcccaagggatactccacaaggagaagacatgctgaacgccatccgaaggggcgtgaaactgaagaagaccacgacaaacgatcgctcagcccctcgcttttcttaggttcacaagaaatgcgccggtggggaatgaactgtttcattaataaaacctaatttgtcttgatccattccactctataataaaacaaaagattttgtaggcaactcggaatatagctcttttgaaagtactcgacacctttagataagaattaaaaccaacctatgtaactgacataatcttgatcttttaatttgtaaatattgacaattttctttctgcacattttaatcttagtttcccttttgatttttctgaaggtgccaaattccatttaacttttttacaagtctttgtaaaattttaaatgcataaagggggttggggcaggggaaccacgaagtagttaattttagaaaaggatttactatacttcactcttctttttttttccccacaagcttttgtagatgcattgtagtagtctagcttagaagcaaatgcaagttattttaatgtacaaactaaatgggtaagaggtaaaatcttcatttaaatatactatgttctggatgaaaagagcaggagtaacaattgatgagcaatattcagagtgaagtaaatctggaaatggtagactgtgttgggattggggggagggccatgggaggggtacatcgtcaacatagccgatcctgttacatttaagagtagcctcgtaggttgaatttcttctggtagcttcatggtaaatgcatccgaataagccatactggattgcagtgtttgtttctgtagggtgtttaaggacttgacttcctttctcccatgattcctctggactgcacacagcacccacaaccagccccatgcatgctgctgcctctgggcagtcgtagaatctcccacttcagtttctcgttgattgtactcacctttatggaatccaaatacatccaaaagggtaaggcagttttaaaaatgtgaaaacatttaaaaatgataatagcagggaattcttagattatagtaaatgccttttacttaactgtgcccagcaggctgggtgcgttaaaaagcccaagtattttgaaaaaactcgaacagatttgacaagggtagccagcttggagtctagcaacttgccaatgtgtttaccaatctgggggcttgtttttcttttcttctttcaaataaatggcagttaactggctttacagtaaacattgaagagaggaggatttgtttattgtcactgggaatctgaccactatactgtcctttttttgtattctgggtaaatgttttttggaaaagatttgtcttttctaagtggaagttaaatttgttatactgcccatcccctaaagccaacagagatttgtagatttaaagggatcacatttgaagacaatagtgtttaagaaagcaagcaagtcccttagcagtcaggtcataacagggcacatttctgaccgaaccctctcaaggcagaggaggagtttggtgggtttcatacaccctgcagattcctgttggctctaaccctcaattacctaatcttatgctttaacacataactgcattggatgtgagagtaacgtaccgtatggtcattgttctatatattaacattgaacactgctgcgattgctcaaggacattttatgttacggctttaaagcaaaggcatgattattagaaactatttaagcttttttctttgaaaaacaagctccttttacagaatataaacaacagtagtgcctgtggtttagcccaccaatcttgatgactaaaagtagctgatgcattgtgcatatgatgcttgagatggtttttgcaaaagcagaaatcgctgcaaggtaatcacaatagataaaagtggtattttaaacctttgaaataaatggatgtaactgtaccttggtacagcttttcacttgtttagtttttaaacgttagtataatctgaataaataaaatgttgccaaattcaatgtagaaagaatgtgacaacacaccttgggtagttctgcttgtgtttttgcatattgtaaaagcagtgtcacagctaaaaagaaagaaatcgtttctaacagtaaattattgtgctttagttgctagtttgtactgagagttgacctctccctgtgcagttttttgttctaaacttgtataaataacaattgtgtaatgtgtctccctcctacattgtaacaattgcttcagcctacgttataaataaagaaccactagattaaaaaa	831
人類SYNPO2LA 蛋白質	MGAEEEVLVTLSGGAPWGFRLHGGAEQRKPLQVSKIRRRSQAGRAGLRERDQLLAINGVSCTNLSHASAMSLIDASGNQLVLTVQRLADEGPVQSPSPHELQVLSPLSPLSPEPPGAPVPQPLQPGSLRSPPDSEAYYGETDSDADGPATQEKPRRPRRRGPTRPTPPGAPPDEVYLSDSPAEPAPTIPGPPSQGDSRVSSPSWEDGAALQPPPAEALLLPHGPLRPGPHLIPMVGPVPHPVAEDLTTTYTQKAKQAKLQRAESLQEKSIKEAKTKCRTIASLLTAAPNPHSKGVLMFKKRRQRAKKYTLVSFGAAAGTGAEEEDGVPPTSESELDEEAFSDARSLTNQSDWDSPYLDMELARAGSRASEGQGSGLGGQLSEVSGRGVQLFEQQRQRADSSTQELARVEPAAMLNGEGLQSPPRAQSAPPEAAVLPPSPLPAPVASPRPFQPGGGAPTPAPSIFNRSARPFTPGLQGQRPTTTSVIFRPLAPKRANDSLGGLSPAPPPFLSSQGPTPLPSFTSGVPSHAPVSGSPSTPRSSGPVTATSSLYIPAPSRPVTPGGAPEPPAPPSAAAMTSTASIFLSAPLRPSARPEAPAPGPGAPEPPSAREQRISVPAARTGILQEARRRGTRKQMFRPGKEETKNSPNPELLSLVQNLDEKPRAGGAESGPEEDALSLGAEACNFMQPVGARSYKTLPHVTPKTPPPMAPKTPPPMTPKTPPPVAPKPPSRGLLDGLVNGAASSAGIPEPPRLQGRGGELFAKRQSRADRYVVEGTPGPGLGPRPRSPSPTPSLPPSWKYSPNIRAPPPIAYNPLLSPFFPQAARTLPKAQSQGPRATPKQGIKALDFMRHQPYQLKTAMFCFDEVPPTPGPIASGSPKTARVQEIRRFSTPAPQPTAEPLAPTVLAPRAATTLDEPIWRTELASAPVPSPAPPPEAPRGLGASPSSCGFQVARPRFSATRTGLQAHVWRPGAGHQ	823
人類SYNPOP2B蛋白質	METFEPISQEPLSQASYDKAPDPVPELQDSFYAELQRAESLQEKSIKEAKTKCRTIASLLTAAPNPHSKGVLMFKKRRQRAKKYTLVSFGAAAGTGAEEEDGVPPTSESELDEEAFSDARSLTNQSDWDSPYLDMELARAGSRASEGQGSGLGGQLSEVSGRGVQLFEQQRQRADSSTQELARVEPAAMLNGEGLQSPPRAQSAPPEAAVLPPSPLPAPVASPRPFQPGGGAPTPAPSIFNRSARPFTPGLQGQRPTTTSVIFRPLAPKRANDSLGGLSPAPPPFLSSQGPTPLPSFTSGVPSHAPVSGSPSTPRSSGPVTATSSLYIPAPSRPVTPGGAPEPPAPPSAAAMTSTASIFLSAPLRPSARPEAPAPGPGAPEPPSAREQRISVPAARTGILQEARRRGTRKQMFRPGKEETKNSPNPELLSLVQNLDEKPRAGGAESGPEEDALSLGAEACNFMQPVGARSYKTLPHVTPKTPPPMAPKTPPPMTPKTPPPVAPKPPSRGLLDGLVNGAASSAGIPEPPRLQGRGGELFAKRQSRADRYVVEGTPGPGLGPRPRSPSPTPSLPPSWKYSPNIRAPPPIAYNPLLSPFFPQAARTLPKAQSQGPRATPKQGIKALDFMRHQPYQLKTAMFCFDEVPPTPGPIASGSPKTARVQEIRRFSTPAPQPTAEPLAPTVLAPRAATTLDEPIWRTELASAPVPSPAPPPEAPRGLGASPSSCGFQVARPRFSATRTGLQAHVWRPGAGHQ	824
人類MTSS1蛋白質	MEAVIEKECSALGGLFQTIISDMKGSYPVWEDFINKAGKLQSQLRTTVVAAAAFLDAFQKVADMATNTRGGTREIGSALTRMCMRHRSIEAKLRQFSSALIDCLINPLQEQMEEWKKVANQLDKDHAKEYKKARQEIKKKSSDTLKLQKKAKKGRGDIQPQLDSALQDVNDKYLLLEETEKQAVRKALIEERGRFCTFISMLRPVIEEEISMLGEITHLQTISEDLKSLTMDPHKLPSSSEQVILDLKGSDYSWSYQTPPSSPSTTMSRKSSVCSSLNSVNSSDSRSSGSHSHSPSSHYRYRSSNLAQQAPVRLSSVSSHDSGFISQDAFQSKSPSPMPPEAPNQLSNGFSHYSLSSESHVGPTGAGLFPHCLPASRLLPRVTSVHLPDYAHYYTIGPGMFPSSQIPSWKDWAKPGPYDQPLVNTLQRRKEKREPDPNGGGPTTASGPPAAAEEAQRPRSMTVSAATRPGEEMEACEELALALSRGLQLDTQRSSRDSLQCSSGYSTQTTTPCCSEDTIPSQVSDYDYFSVSGDQEADQQEFDKSSTIPRNSDISQSYRRMFQAKRPASTAGLPTTLGPAMVTPGVATIRRTPSTKPSVRRGTIGAGPIPIKTPVIPVKTPTVPDLPGVLPAPPDGPEERGEHSPESPSVGEGPQGVTSMPSSMWSGQASVNPPLPGPKPSIPEEHRQAIPESEAEDQEREPPSATVSPGQIPESDPADLSPRDTPQGEDMLNAIRRGVKLKKTTTNDRSAPRFS	825
人類BAG3 C151R突變體蛋白質	MSAATHSPMMQVASGNGDRDPLPPGWEIKIDPQTGWPFFVDHNSRTTTWNDPRVPSEGPKETPSSANGPSREGSRLPPAREGHPVYPQLRPGYIPIPVLHEGAENRQVHPFHVYPQPGMQRFRTEAAAAAPQRSQSPLRGMPETTQPDKQRGQVAAAAAAQPPASHGPERSQSPAASDCSSSSSSASLPSSGRSSLGSHQLPRGYISIPVIHEQNVTRPAAQPSFHQAQKTHYPAQQGEYQTHQPVYHKIQGDDWEPRPLRAASPFRSSVQGASSREGSPARSSTPLHSPSPIRVHTVVDRPQQPMTHRETAPVSQPENKPESKPGPVGPELPPGHIPIQVIRKEVDSKPVSQKPPPPSEKVEVKVPPAPVPCPPPSPGPSAVPSSPKSVATEERAAPSTAPAEATPPKPGEAEAPPKHPGVLKVEAILEKVQGLEQAVDNFEGKKTDKKYLMIEEYLTKELLALDSVDPEGRADVRQARRDGVRKVQTILEKLEQKAIDVPGQVQVYELQPSNLEADQPLQAIMEMGAVAADKGKKNAGNAEDPHTETQQPEATAAATSNPSSMTDTPGNPAAP	829
金黃色葡萄球菌( Staphylococcus aureus) saCas9 DNA	atggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccaagcggaactacatcctgggcctggacatcggcatcaccagcgtgggctacggcatcatcgactacgagacacgggacgtgatcgatgccggcgtgcggctgttcaaagaggccaacgtggaaaacaacgagggcaggcggagcaagagaggcgccagaaggctgaagcggcggaggcggcatagaatccagagagtgaagaagctgctgttcgactacaacctgctgaccgaccacagcgagctgagcggcatcaacccctacgaggccagagtgaagggcctgagccagaagctgagcgaggaagagttctctgccgccctgctgcacctggccaagagaagaggcgtgcacaacgtgaacgaggtggaagaggacaccggcaacgagctgtccaccaaagagcagatcagccggaacagcaaggccctggaagagaaatacgtggccgaactgcagctggaacggctgaagaaagacggcgaagtgcggggcagcatcaacagattcaagaccagcgactacgtgaaagaagccaaacagctgctgaaggtgcagaaggcctaccaccagctggaccagagcttcatcgacacctacatcgacctgctggaaacccggcggacctactatgagggacctggcgagggcagccccttcggctggaaggacatcaaagaatggtacgagatgctgatgggccactgcacctacttccccgaggaactgcggagcgtgaagtacgcctacaacgccgacctgtacaacgccctgaacgacctgaacaatctcgtgatcaccagggacgagaacgagaagctggaatattacgagaagttccagatcatcgagaacgtgttcaagcagaagaagaagcccaccctgaagcagatcgccaaagaaatcctcgtgaacgaagaggatattaagggctacagagtgaccagcaccggcaagcccgagttcaccaacctgaaggtgtaccacgacatcaaggacattaccgcccggaaagagattattgagaacgccgagctgctggatcagattgccaagatcctgaccatctaccagagcagcgaggacatccaggaagaactgaccaatctgaactccgagctgacccaggaagagatcgagcagatctctaatctgaagggctataccggcacccacaacctgagcctgaaggccatcaacctgatcctggacgagctgtggcacaccaacgacaaccagatcgctatcttcaaccggctgaagctggtgcccaagaaggtggacctgtcccagcagaaagagatccccaccaccctggtggacgacttcatcctgagccccgtcgtgaagagaagcttcatccagagcatcaaagtgatcaacgccatcatcaagaagtacggcctgcccaacgacatcattatcgagctggcccgcgagaagaactccaaggacgcccagaaaatgatcaacgagatgcagaagcggaaccggcagaccaacgagcggatcgaggaaatcatccggaccaccggcaaagagaacgccaagtacctgatcgagaagatcaagctgcacgacatgcaggaaggcaagtgcctgtacagcctggaagccatccctctggaagatctgctgaacaaccccttcaactatgaggtggaccacatcatccccagaagcgtgtccttcgacaacagcttcaacaacaaggtgctcgtgaagcaggaagaaaacagcaagaagggcaaccggaccccattccagtacctgagcagcagcgacagcaagatcagctacgaaaccttcaagaagcacatcctgaatctggccaagggcaagggcagaatcagcaagaccaagaaagagtatctgctggaagaacgggacatcaacaggttctccgtgcagaaagacttcatcaaccggaacctggtggataccagatacgccaccagaggcctgatgaacctgctgcggagctacttcagagtgaacaacctggacgtgaaagtgaagtccatcaatggcggcttcaccagctttctgcggcggaagtggaagtttaagaaagagcggaacaaggggtacaagcaccacgccgaggacgccctgatcattgccaacgccgatttcatcttcaaagagtggaagaaactggacaaggccaaaaaagtgatggaaaaccagatgttcgaggaaaagcaggccgagagcatgcccgagatcgaaaccgagcaggagtacaaagagatcttcatcaccccccaccagatcaagcacattaaggacttcaaggactacaagtacagccaccgggtggacaagaagcctaatagagagctgattaacgacaccctgtactccacccggaaggacgacaagggcaacaccctgatcgtgaacaatctgaacggcctgtacgacaaggacaatgacaagctgaaaaagctgatcaacaagagccccgaaaagctgctgatgtaccaccacgacccccagacctaccagaaactgaagctgattatggaacagtacggcgacgagaagaatcccctgtacaagtactacgaggaaaccgggaactacctgaccaagtactccaaaaaggacaacggccccgtgatcaagaagattaagtattacggcaacaaactgaacgcccatctggacatcaccgacgactaccccaacagcagaaacaaggtcgtgaagctgtccctgaagccctacagattcgacgtgtacctggacaatggcgtgtacaagttcgtgaccgtgaagaatctggatgtgatcaaaaaagaaaactactacgaagtgaatagcaagtgctatgaggaagctaagaagctgaagaagatcagcaaccaggccgagtttatcgcctccttctacaacaacgatctgatcaagatcaacggcgagctgtatagagtgatcggcgtgaacaacgacctgctgaaccggatcgaagtgaacatgatcgacatcacctaccgcgagtacctggaaaacatgaacgacaagaggccccccaggatcattaagacaatcgcctccaagacccagagcattaagaagtacagcacagacattctgggcaacctgtatgaagtgaaatctaagaagcaccctcagatcatcaaaaagggcaaaaggccggcggccacgaaaaaggccggccaggcaaaaaagaaaaagtaa	832
金黃色葡萄球菌saCas9蛋白質	MAPKKKRKVGIHGVPAAKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKGKRPAATKKAGQAKKKK	833

以下非限制性實例說明研發本發明中所涉及之一些實驗工作。實例實例1：經由NHP的定向演化進行AAV蛋白殼工程化

此實例揭示AAV9蛋白殼的定向演化，以鑑別心臟轉導率較高及/或心臟/肝臟遷移比率高(「肝臟脫靶」)的變異體。在臨床使用中，較高的心臟轉導率可使得治療性基因遞送更高效，且從而在相同劑量下產生更佳功效或使得達到所需功效的劑量要求更低。較高的心臟/肝臟比率可以減少與肝臟病毒負荷高有關的毒性及副作用，同時使心臟基因遞送不受影響或改善。 庫產生及 AAV 選擇

AAV9蛋白殼上的可變區(VR-IV及VR-VIII位點)顯示於圖 1中。利用庫篩選策略( 圖 2)鑑別出新穎AAV蛋白殼變異體以便經由全身投與達成更佳的心臟基因遞送。經由合成編碼隨機胺基酸殘基的寡核苷酸池或在AAV9蛋白殼之病毒蛋白(VP)中的所選位置設計插入及取代來產生超過2億種蛋白殼變異體的庫。將寡核苷酸池選殖入圖 3所描繪之重組載體基因體的蛋白殼( cap)基因中，從而將蛋白殼( cap)基因置放於P40啟動子的控制下以在活體外表現蛋白殼蛋白VP1、VP2及VP3，藉此產生含有經修飾之VP蛋白質的感染性病毒粒子。P40啟動子的上游包括US 2022/0031866 A1中所描述的短心肌鈣蛋白(TNNT2)啟動子，以在活體內驅動心肌細胞中之蛋白殼mRNA轉錄本表現，從而能夠偵測到心臟中的病毒mRNA。此設計有助於選擇僅遷移至所需器官(心臟)且在細胞中表現轉殖基因的彼等AAV病毒粒子。當注射至個體中時，若囊封的AAV病毒粒子遷移至心臟、進入細胞且將轉殖基因遞送至細胞核，則 cap基因表現於心臟中。因此，心臟中表現的mRNA應為與具有所需向性之AAV病毒粒子對應的mRNA。可藉由DNA偵測脫靶遷移。AAV病毒粒子遷移至目標使得載體基因體DNA存在於該組織中。

藉由彙集表 4中所列出之七個子庫來形成庫。在子庫1中，將變異型AAV9蛋白殼之蛋白殼序列中之VR-IV位的位置隨機化；變異型AAV9蛋白殼在其VR-VIII位點中具有人工序列ANYG (置換原生SAQA序列)。在子庫2至7中，將AAV9蛋白殼之VR-VIII位的位置隨機化。表 4. 變異體庫

子庫編號	描述
1	位置586-589 (VR-VIII位)之SAQA序列經ANYG置換位置452-458 (VR-IV位)經NNNNNNN置換，其中N表示隨機胺基酸
2	在位置582-588中之每一者插入的兩個胺基酸所有2800種可能的變異體 (七個位置×400種可能的雙胺基酸插入)
3	藉由機器學習算法預測到位置581-594經序列置換 200種變異體
4	位置582-584、583-585、584-586、585-587、586-588或587-589經NXN置換，其中N表示隨機胺基酸，且X表示參考序列中的胺基酸所有2394種可能變異體
5	位置581-594中之每一者處的單個胺基酸取代所有266種可能變異體
6	位置585-590經六殘基隨機序列置換
7	位置587之單個胺基酸取代及位置589之單個胺基酸插入

如圖 1 及圖 2中所示，使用習知HEK293T AAV產生系統封裝理論上包括超過2億 cap基因序列的此等初始庫，其中將腺病毒輔助質體、AAV2 REP質體及CAP庫質體轉染至HEK293T細胞中。72小時之後收集細胞溶解物且藉由碘克沙醇(iodixanol)梯度超速離心來純化AAV病毒粒子。將所得AAV病毒粒子池以每公斤體重5E+12個病毒基因體靜脈內注射至三隻食蟹獼猴中。注射後的第4週處死動物，且自心臟及肝臟獲取切片。自心臟樣品中分離出RNA且擴增病毒轉錄本且藉由下一代定序進行定序，以偵測轉導心臟的新穎變異體。自肝臟樣品中分離出DNA且擴增病毒基因體序列且藉由下一代定序(NGS)進行定序，以偵測感染肝臟的變異體。對定序結果使用計算分析，選出約7800種具有高心臟轉導率、高心臟/肝臟比率或兩者的變異體。

如下執行第二輪篩選：再合成且選殖編碼所選7800種變異體的DNA序列、表現AAV病毒粒子且將所得AAV池以每公斤體重1E+13個病毒基因體靜脈內注射至兩隻食蟹獼猴中。注射後的第4週處死動物，且自心臟及肝臟獲取切片。自心臟樣品中分離出RNA且擴增病毒轉錄本且藉由下一代定序進行定序，以偵測轉導心臟的新穎變異體。自肝臟樣品中分離出DNA且擴增病毒基因體序列且藉由下一代定序(NGS)進行定序，以偵測感染肝臟的變異體。NGS之後，對第二輪篩選進行計算分析，鑑別出102種新穎AAV蛋白殼在心臟轉導、心臟/肝臟比率方面或兩者優於AAV9。 篩選結果

圖 4標繪來自第二輪篩選的資料。將所有可偵測變異體(包括各種變異體的兩個或更多個同義密碼子複本)作圖。如下獲得心臟轉導及肝臟感染量測結果：對自心臟切片回收的病毒轉錄本或自肝臟切片回收的病毒基因體序列進行深度定序；基於下一代定序的各讀段鑑別變異體編碼序列；對各種獨特變異體的出現計數且將各種獨特變異體的讀段計數相對於該切片的讀段總數目標準化。吾等亦將各種獨特變異體的頻率相對於其在輸入病毒庫中的豐度標準化。吾等報導各種獨特變異體之頻率(相對於存在於樣品輸入病毒庫中之AAV9對照之頻率)且計算所得比率的log2值。將心臟mRNA豐度(心肌細胞之感染量度)相對於肝臟DNA豐度(遷移至肝臟的量度)作圖。

圖 5A 至圖 5C標繪因具有所需特性(相對於AAV9的較高心臟轉導率、相對於AAV9的較高心臟/肝臟比率，或兩者)而被選擇的102種變異體。

圖 5A在x軸上標繪102種所選擇變異體的心臟轉導率量測值且在y軸上標繪心臟/肝臟比率。藉由將各種變異體之心臟轉導率量測值除以肝臟感染量測值來計算心臟/肝臟比率。所有值均以相對於AAV9的變化倍數顯示。心臟轉導率改善的變異體以空心圓顯示。心臟/肝臟比率改善的變異體(「肝臟脫靶」)以空心三角形顯示。心臟轉導率改善與心臟/肝臟比率改善的變異體以實心圓顯示。

圖 5B顯示表 4中之1號子庫的變異體子集，其具有隨機化VR-IV (AAV9 VP1的胺基酸452至458)與經取代的VR-VIII (AAV9 VP1的胺基酸586至589)。量測值與圖 5A中的量測值相同。

圖 5C顯示具有經修飾之VR-VIII (AAV9 VP1之胺基酸581至594)的新穎變異體。量測值與圖 5A中的量測值相同。 在小鼠模型中再測試

在小鼠中測試所選AAV變異體以證實相對於AAV9的效能。

如圖 6中所示，使用五種所選蛋白殼序列ZC377、ZC399、ZC407、ZC425及ZC469以及參考AAV9蛋白殼序列產生具有載體基因體的AAV病毒粒子，該載體基因體編碼EGFP且由TNNT2啟動子驅動。所得AAV病毒粒子各自經由後眼窩投與、以每個動物一種蛋白殼、以每公斤體重6E+12個病毒基因體注射至6週齡小鼠中。第三週處死動物，且收集心臟及肝臟。藉由ELISA偵測心臟溶解物中之EGFP蛋白質來量測心臟轉導率且藉由qPCR、以自肝臟樣品回收之DNA中的EGFP編碼序列為目標來量測肝臟病毒負荷。

圖 7A 至圖 7C展示所選擇變異體及AAV9參考之心臟轉導( 圖 7A)、肝臟病毒負荷( 圖 7B)及心臟/肝臟比率( 圖 7C)量測值。所有數值均以相對於AAV9對照的變化倍數顯示。各點表示一隻動物的資料。ZC399顯示平均心臟轉導率為AAV9的約1.8倍。ZC399及ZC407顯示肝臟病毒負荷低於AAV9且心臟/肝臟比率為AAV9的約20倍。 所選擇蛋白殼變異體之序列分析

所選擇變異體的序列提供於表5及表6中。表 5 ： VR-IV 變異體

標識符編號	VP1 SEQ ID NO:	VR-IV (452-458)	VR-IV SEQ ID NO:	VR-VIII (581-594)	VR-VIII SEQ ID NO:
ZC377	488	KGSGQNQ	590	ATNHQ ANYG QAQTG	598
ZC378	489	NASGQNQ	591	ATNHQ ANYG QAQTG	598
ZC379	490	NGTGQNQ	592	ATNHQ ANYG QAQTG	598
ZC380	491	NGSGLNQ	593	ATNHQ ANYG QAQTG	598
ZC381	492	ANDNKLI	594	ATNHQ ANYG QAQTG	598
ZC382	493	VNDNKVI	595	ATNHQ ANYG QAQTG	598
ZC383	494	NGSGQNH	596	ATNHQ ANYG QAQTG	598
ZC384	495	ANDNKVI	597	ATNHQ ANYG QAQTG	598

表 6 ： VI-VIII 變異體

標識符編號	VP1 SEQ ID NO:	VR-VIII (581-594)	VR- VIII SEQ ID NO:
ZC385	496	ATNHTSFQAQAQTG	599
ZC386	497	ATNHCSAQAQAQTG	600
ZC387	498	ATNHVDSLRIAQTG	601
ZC388	499	ATNRQTAQAQAQTG	602
ZC389	500	ATNHTGTSIIAQTG	603
ZC390	501	ATNHLSNFNSAQTG	604
ZC391	502	ATNHCTLNSIAQTG	605
ZC392	503	ADVQQKPGSQIQTQ	606
ZC393	504	ATNHNMNRVNAQTG	607
ZC394	505	ATNHNNVISGAQTG	608
ZC395	506	ATNHSNSVQSAQTG	609
ZC396	507	ATNHQSPIAQAQAQTG	610
ZC397	508	ATNHLSKVFDAQTG	611
ZC398	509	ATNHQSAITQAQAQTG	612
ZC399	510	ATNHSSTFQGAQTG	613
ZC400	511	ATNHNSIQAQAQTG	614
ZC401	512	ATNHMMTTARAQTG	615
ZC402	513	ATNHQGAYAQAQTG	616
ZC403	514	ALNKQSAQAQAQTG	617
ZC404	515	ATNHENTVSIAQTG	618
ZC405	516	ATNHVSSFTSAQTG	619
ZC406	517	ATNHPSIHQGAQTG	620
ZC407	518	ATNHSTTNFRAQTG	621
ZC408	519	ATNHQHYSAQAQAQTG	622
ZC409	520	ATNKQTAQAQAQTG	623
ZC410	521	ATNHSSIFNSAQTG	624
ZC411	522	ATNHAGNYNNAQTG	625
ZC412	523	AEVQQSSMSQAQTD	626
ZC413	524	AANVQSAQAQAQTG	627
ZC414	525	ATNYQQAQAQAQTG	628
ZC415	526	ATNHQSVQGAQAQTG	629
ZC416	527	ATNHGSILTHAQTG	630
ZC417	528	ATNHQLFSKNAQTG	631
ZC418	529	AANMQSAQAQAQTG	632
ZC419	530	ATNQQIAQAQAQTG	633
ZC420	531	ATNTYHQSAQAQAQTG	634
ZC421	532	ATNHCDPLHIAQTG	635
ZC422	533	ATNHTSVISIAQTG	636
ZC423	534	ATNHQLASAQAQTG	637
ZC424	535	ATNHQVTSAQAQAQTG	638
ZC425	536	ATNHHSRVEIAQTG	639
ZC426	537	ATNHTSFTWTAQTG	640
ZC427	538	ATNHQSAPTQAQAQTG	641
ZC428	539	ATNHNSTYLGAQTG	642
ZC429	540	ATNHQIAQAQAQTG	643
ZC430	541	ATNHQAISAQAQAQTG	644
ZC431	542	ATNHLSVVYNAQTG	645
ZC432	543	ATNHMHQSAQAQAQTG	646
ZC433	544	ATNHETSRLNAQTG	647
ZC434	545	AFNWQSAQAQAQTG	648
ZC435	546	ATNHNTVMLGAQTG	649
ZC436	547	ATNHESSMLNAQTG	650
ZC437	548	ATNHASITSSAQTG	651
ZC438	549	ARNEQSAQAQAQTG	652
ZC439	550	ATNHANLYQMAQTG	653
ZC440	551	ATNHQFATAQAQTG	654
ZC441	552	ATNFNHQSAQAQAQTG	655
ZC442	553	ATNHMSHQAQAQTG	656
ZC443	554	ATNHQWMSAQAQAQTG	657
ZC444	555	ATNHQSGQQAQAQTG	658
ZC445	556	ATNHSSAQAQAQTG	659
ZC446	557	ATNHTTKTMFAQTG	660
ZC447	558	ATNHSSIIYSAQTG	661
ZC448	559	ATNHMLLKSNAQTG	662
ZC449	560	ATNHESMQAQAQTG	663
ZC450	561	ATNHQMLSAQAQAQTG	664
ZC451	562	ATNHSGRDSYAQTG	665
ZC452	563	ATNHINVISGAQTG	666
ZC453	564	ATNHVSNQAQAQTG	667
ZC454	565	ATNHNTKLAIAQTG	668
ZC455	566	ATNHSSSYNNAQTG	669
ZC456	567	ATNATHQSAQAQAQTG	670
ZC457	568	ATNHLRDNISAQTG	671
ZC458	569	ATNHSSFSVGAQTG	672
ZC459	570	ATNHVNRNLSAQTG	673
ZC460	571	ATNHHNPSINAQTG	674
ZC461	572	ATNHQDARAQAQTG	675
ZC462	573	ATNDQRAQAQAQTG	676
ZC463	574	ATNVQTAQAQAQTG	677
ZC464	575	APNRQSAQAQAQTG	678
ZC465	576	ATNRQIAQAQAQTG	679
ZC466	577	ATNHEDNIRRAQTG	680
ZC467	578	ATNHNRNGLLAQTG	681
ZC468	579	ATNHESTSVRAQTG	682
ZC469	580	ATNHNIRTEMAQTG	683
ZC470	581	ATNHQTLFNSAQTG	684
ZC471	582	ATNHHSWQAQAQTG	685
ZC472	583	ATNHSTKSLIAQTG	686
ZC473	584	ATNHQKLLVNAQTG	687
ZC474	585	ATNHLSVSSIAQTG	688
ZC475	586	ATNHVSNLYGAQTG	689
ZC476	587	ATNRQMAQAQAQTG	690
ZC477	588	ATNHEDIIRSAQTG	691
ZC478	589	ATNHCSTSIRAQTG	692

人工比對在VR-VIII位點中具有插入之變異體以展示插入。結果展示於表 7中。表 7

標識符編號	比對	SEQ ID NO:	插入位置( 之後)	插入
ZC396	N--H--Q--SPIA--Q	693	586	PI
ZC398	N--H--Q--S--AITQ	694	587	IT
ZC408	N--H--QHYS--A--Q	695	585	HY
ZC420	NTYH--Q--S--A--Q	696	583	TY
ZC424	N--H--QVTS--A--Q	697	585	VT
ZC427	N--H--Q--S--APTQ	698	587	PT
ZC430	N--H--QAIS--A--Q	699	585	AI
ZC432	N--HMHQ--S--A--Q	700	584	MH
ZC441	NFNH--Q--S--A--Q	701	583	FN
ZC443	N--H--QWMS--A--Q	702	585	WM
ZC450	N--H--QMLS--A--Q	703	585	ML
ZC456	NATH--Q--S--A--Q	704	583	AT

如下文所描述進一步測試所選擇變異序列。實例 2 ：靈長類動物之確認性重新篩選

在靈長類動物中測試所選擇AAV變異體以證實相對於AAV9的效能。為了使用其他動物執行實驗，使用類似於原始篩選方案的池注射及篩選策略。

使用攜載由TNNT2啟動子驅動之條碼化EGFP報導體的轉殖基因卡匣個別地封裝所有102種新穎蛋白殼。彙集所得AAV病毒粒子且經由靜脈內投與注射至食蟹獼猴中。注射後的第4週，處死動物，且自心臟及肝臟以及其他組織獲得切片。自心臟樣品中分離出RNA。擴增病毒轉錄本上的條碼化區域且下一代定序進行定序。利用相應條碼的標準化讀段計數來定量各種變異體的心臟轉導能力。自肝臟樣品中分離出DNA。病毒轉殖基因上的條碼化區域以與心臟RNA樣品相同的方式處理。利用相應條碼的標準化讀段計數來定量各種變異體的肝臟向性。

在小鼠中並行執行類似研究。實例 3 ：中和抗體流行率研究

針對所彙集的人類IgG樣品以及個別人類血清樣品分析所選蛋白殼。逃避所彙集之IgG中和的能力及血清陰性人類個體的百分比增加表示患者覆蓋率潛在地比AAV9寬。實例 4 ：在靈長類動物中進行的生物分佈研究

在食蟹獼猴的生物分佈研究中，測試所選擇蛋白殼及AAV9對照。各動物接受一種測試物且各種測試物用三隻動物測試。檢查不同器官及組織中的轉導及病毒基因體分佈。實例 5 ：轉導特性改善的新穎 AAV 蛋白殼

此研究之目的係鑑別具有優異特性(諸如改善的轉導)的新穎AAV蛋白殼變異體。具有經修飾之VR-VIII (胺基酸585至590，AAV9 VP1編號)的蛋白殼進一步在胺基酸452 (AAV9 VP1編號，天冬醯胺酸/Asn/N452)經修飾( 圖 8A ；表 8 及 9中之突變)。所得蛋白殼變異體個別地使用條碼化轉殖基因卡匣封裝，彙集在一起且在非人類靈長類動物(食蟹獼猴/食蟹獼猴/獼猴)、CD-1小鼠及人類iPSC衍生之心肌細胞(iPSC-CM)中加以測試。本文所提供之劑量表示池中之病毒之總量。經由靜脈內推注投與向食蟹獼猴及豬投與1E+13 vg/kg的病毒且在注射之後的第4週收集組織。經由眼窩後投與向兩組小鼠投與病毒：以1E+13 vg/kg投與三隻小鼠且以5E+13 vg/kg投與三隻小鼠，且在注射後的第18天收集組織。對於iPSC-CM來說，向兩個細胞群投與不同劑量(1.6E+4 vg/細胞及1.6E+5 vg/細胞)的病毒且在隨後第4天收集樣品。藉由下一代定序(NGS)定量條碼來量測蛋白殼變異體於不同器官(諸如心臟、肝臟、腦、骨骼肌)及iPSC-CM中的轉導/病毒負荷量( 圖 8B)。顯示小鼠及iPSC之兩種劑量水平組的平均值。

使用篩選之一些經鑑別突變蛋白殼的實驗顯示於圖 9中。特定而言，ZC404 (SEQ ID NO: 618)、ZC470 (SEQ ID NO: 684)、ZC428 (SEQ ID NO: 642)及ZC416 (SEQ ID NO: 630)為具有VR-VIII修飾的變異體。其在獼猴心臟、獼猴肝臟、小鼠心臟、小鼠肝臟及人類iPSC-CM中的轉導及病毒負荷水平以白色條杠顯示於圖 9中。將N452K突變引入此等蛋白殼中( 表 8 及 9)產生四種組合型蛋白殼：ZC373 (SEQ ID NO: 705)、ZC374 (SEQ ID NO: 706)、ZC375 (SEQ ID NO: 707)及ZC376 (SEQ ID NO: 708)，且量測其在獼猴心臟、獼猴肝臟、小鼠心臟、小鼠肝臟及人類iPSC-CM中的轉導/病毒負荷水平，結果以深色/陰影條杠顯示於圖 9中。相較於原始VR-VIII變異體，所有此等組合型蛋白殼顯示改善的轉導/病毒負荷(尤其在心臟中)，顯示N452K可增強基於AAV9之蛋白殼的轉導，不論已在蛋白殼之其他區域中產生何種修飾。

亦產生以N452K突變作為唯一修飾的蛋白殼(ZC537)。另外，產生蛋白殼ZC531、ZC532、ZC533、ZC534、ZC535、ZC536、ZC538、ZC539、ZC540、ZC541、ZC542，其中VR-VIII中除其他突變之外亦含有N452K突變。表 8.新穎VP1蛋白殼

蛋白殼標識符編號	位置452	VR-VIII 比對(581-594)	VR-VIII SEQ ID NO:	VP1 蛋白殼SEQ ID NO:
ZC373	K	ATNH ENTVSIAQTG	618	705
ZC374	K	ATNH QTLFNSAQTG	684	706
ZC375	K	ATNH NSTYLGAQTG	642	707
ZC376	K	ATNH GSILTHAQTG	630	708
ZC404	N	ATNH ENTVSIAQTG	618	515
ZC470	N	ATNH QTLFNSAQTG	684	581
ZC428	N	ATNH NSTYLGAQTG	642	539
ZC416	N	ATNH GSILTHAQTG	630	527
ZC531	K	ATNH MMTTARAQTG	615	767
ZC532	K	ATNH CSTSIRAQTG	692	768
ZC533	K	ATNH QGAYAQAQTG	616	769
ZC534	K	ATNH NTKLAIAQTG	668	770
ZC535	K	ATNH VSSFTSAQTG	619	771
ZC536	K	ATNH EDNIRSAQTG	726	772
ZC537	K	ATNH QSAQAQAQTG	5	773
ZC538	K	ATNH NNVISGAQTG	608	774
ZC539	K	ATNH TGTSIIAQTG	603	775
ZC540	K	ATNH QWMSAQAQAQTG	657	776
ZC541	K	ATNH QDARAQAQTG	675	777
ZC542	K	ATNH QHYSAQAQAQTG	622	778
AAV9		ATNH QSAQAQAQTG	5	1

VP1蛋白殼序列包含在581至594之間的位置修飾的SEQ ID NO: 1，如此表中所指示表 9.某種新穎VP1蛋白殼中的VR-VIII及N452取代*

蛋白殼標識符編號	位置585	位置586	位置587	位置588	位置589	位置590	位置452
ZC373	Q585E	S586N	A587T	Q588V	A589S	Q590I	N452K
ZC374		S586T	A587L	Q588F	A589N	Q590S	N452K
ZC375	Q585N		A587T	Q588Y	A589L	Q590G	N452K
ZC376	Q585G		A587I	Q588L	A589T	Q590H	N452K
ZC404	Q585E	S586N	A587T	Q588V	A589S	Q590I
ZC470		S586T	A587L	Q588F	A589N	Q590S
ZC428	Q585N		A587T	Q588Y	A589L	Q590G
ZC416	Q585G		A587I	Q588L	A589T	Q590H
ZC531	Q585M	S586M	A587T	Q588T		Q590R	N452K
ZC532	Q585C		A587T	Q588S	A589I	Q590R	N452K
ZC533		S586G		Q588Y			N452K
ZC534	Q585N	S586T	A587K	Q588L		Q590I	N452K
ZC535	Q585V		A587S	Q588F	A589T	Q590S	N452K
ZC536	Q585E	S586D	A587N	Q588I	A589R	Q590S	N452K
ZC537							N452K
ZC538	Q585N	S586N	A587V	Q588I	A589S	Q590G	N452K
ZC539	Q585T	S586G	A587T	Q588S	A589I	Q590I	N452K
ZC541		S586D		Q588R			N452K
ZC369	Q585N	S586I	A587R	Q588T	A589E	Q590M	N452K
ZC370	Q585S	S586T	A587T	Q588N	A589F	Q590R	N452K
AAV9

*表中無輸入=無取代注意：表9中之所有蛋白殼具有：(i)分別位於位置581、582、583及584的ATNH，及/或(ii)分別位於位置591、592、593及594的AQTG。

因此，經鑑別的蛋白殼在VR-VIII的指定位置包含指定的胺基酸(其中唯一胺基酸或最後一個胺基酸對應於未修飾的AAV9胺基酸)：

581	582	583	584	585	586	587	588	589	590	591	592	593	594
A	T	N	H	E、N、G、M、C、V、T、Q	N、T、M、G、D、S	T、L、I、K、S、N、V、A	V、F、Y、L、T、S、I、R、Q	S、N、L、T、I、R、A	I、S、G、H、R、Q	A	Q	T	G

表 11.某種新穎VP1蛋白殼中的VR-VIII插入

蛋白殼標識符編號	位置452	VR-VIII 比對(581-594)	VR-VIII SEQ ID NO:	評述
ZC540	K	ATNHQ WMSAQAQAQTG	657	WM插入位置586之前(SEQ ID NO: 1之位置585與586之間)
ZC542	K	ATNHQ HYSAQAQAQTG	622	HY插入位置586之前(SEQ ID NO: 1之位置585與586之間)
AAV9	N	ATNHQ SAQAQAQTG	5

實例 6 ： 利用多種哺乳動物模型表徵新穎 AAV 蛋白殼

此研究之目的係比較上述新穎AAV蛋白殼在多種模型(包括非人類靈長類動物、小鼠、豬及活體外人類iPSC-CM)中的效能。個別地封裝新穎AAV蛋白殼及對照蛋白殼，且使用條碼化轉殖基因卡匣，基於蛋白殼轉導分析能夠實現彙集式下一代定序( 圖 10)。以均等的病毒基因體比率為目標將病毒彙集在一起且活體內在食蟹獼猴、CD-1小鼠及豬中以及活體外對人類iPSC衍生之心肌細胞測試病毒池。向動物及細胞投與病毒，且收集組織，如實例 5中所描述。為了量測轉導效率及/或病毒負荷，收集心臟組織、肝臟組織及iPSC-CM，隨後進行RNA及DNA萃取。自RNA及DNA樣品擴增條碼化區域且藉由下一代定序進行定序。各條碼之RNA或DNA原始讀段計數相對於定序操作中的總讀段數標準化且相對於初始病毒池中的豐度標準化。計算屬於相同蛋白殼之多個條碼的平均量測值，以測定蛋白殼的轉導效率或病毒負荷。

根據心臟組織中的RNA訊號量測心臟轉導。根據肝臟組織中的DNA訊號量測肝臟病毒負荷。藉由將心臟轉導率除以肝臟病毒負荷來確定心臟/肝臟比率。根據RNA訊號來確定對iPSC-CM的轉導效率。根據HEK293T產生系統中的病毒產量來測定封裝評分。分別顯示食蟹獼猴、小鼠、豬及iPSC-CM之4隻動物、3隻動物、6隻動物或感染倍率2的平均量測值( 圖 11A 及圖 11B)。圖 11A 及圖 11B表示整個資料集熱圖。熱圖上的各行表示一種蛋白殼且各列表示一種樣品類型。白色意謂較高值且深色意謂較低值，其中中值灰階代表野生型AAV9對照。蛋白殼依據其在食蟹獼猴中的心臟/肝臟比率自左向右排序。AAV9-1、AAV9-2及AAV9-3皆為野生型AAV9蛋白殼，其充當對照複本。CR9-10、TN47-10及TN44-07揭示於WO 2021/216456 A2中(藉由提及相同蛋白殼名稱)，其揭示內容以引用的方式特定併入本文中。本文揭示其他蛋白殼之序列。

例示性新穎蛋白殼選自圖 11A及圖 11B中的篩選( 表 10)以評價跨越不同物種的轉導效率。相對於野生型AAV9對照的效能，評價四種新穎蛋白殼及AAV9對照於食蟹獼猴(淺灰色條杠)、小鼠(白色條杠)及豬(深色條杠)中的心臟/肝臟比率、心臟轉導率及肝臟病毒負荷量測值( 圖 12)。如上文所描述向動物投與病毒且收集組織。圖 13中具體地顯示非人類靈長類動物(NHP)的此等比率(食蟹獼猴)。新穎蛋白殼顯示所有三個物種的心臟/肝臟比率改善，證明物種一致性。另外，在NHP中，相對於AAV9，新穎蛋白殼顯示改善的心臟/肝臟比率、至少類似的心臟轉導率及較小的肝臟病毒負荷。表 10. 研究中使用的蛋白殼

標識符編號	VP1 蛋白殼SEQ ID NO
ZC373	705
ZC374	706
ZC375	707
ZC376	708
ACE5	709
ACE10	710
AAV9-1/2/3	1
CR9-10	404
TN44-07	457
TN47-10	458
ZC377	488
ZC378	489
ZC379	490
ZC380	491
ZC381	492
ZC382	493
ZC383	494
ZC384	495
ZC385	496
ZC386	497
ZC387	498
ZC388	499
ZC389	500
ZC390	501
ZC391	502
ZC392	503
ZC393	504
ZC394	505
ZC395	506
ZC396	507
ZC397	508
ZC398	509
ZC399	510
ZC400	511
ZC401	512
ZC402	513
ZC403	514
ZC404	515
ZC405	516
ZC406	517
ZC407	518
ZC408	519
ZC409	520
ZC410	521
ZC411	522
ZC412	523
ZC413	524
ZC414	525
ZC415	526
ZC416	527
ZC417	528
ZC418	529
ZC419	530
ZC420	531
ZC421	532
ZC422	533
ZC423	534
ZC424	535
ZC425	536
ZC427	538
ZC428	539
ZC429	540
ZC431	542
ZC432	543
ZC433	544
ZC434	545
ZC435	546
ZC436	547
ZC438	549
ZC439	550
ZC440	551
ZC441	552
ZC442	553
ZC443	554
ZC444	555
ZC445	556
ZC446	557
ZC447	558
ZC448	559
ZC449	560
ZC450	561
ZC451	562
ZC452	563
ZC453	564
ZC454	565
ZC455	566
ZC456	567
ZC457	568
ZC458	569
ZC459	570
ZC460	571
ZC461	572
ZC462	573
ZC463	574
ZC464	575
ZC465	576
ZC466	577
ZC467	578
ZC468	579
ZC469	580
ZC470	581
ZC471	582
ZC472	583
ZC473	584
ZC474	585
ZC475	586
ZC476	587
ZC477	588
ZC478	589

實例 7 ： 排序靠前的新穎蛋白殼當個別地投與時顯示優異的效能

為了研究所彙集的蛋白殼比較結果是否可預測個別動物注射(每個動物一種測試物)的效能，在CD-1小鼠中利用眼窩後注射測試排序靠前的四種新穎蛋白殼及AAV9。ZC375、ZC401及ZC428病毒以2E+13 vg/kg投與，且ZC478病毒以1.45E+13 vg/kg投與。包括劑量匹配的AAV9對照。注射後第18天處死動物。基於RT-qPCR定量心臟中之轉殖基因mRNA表現來量測心臟轉導。基於qPCR定量肝臟中之轉殖基因DNA複本來量測肝臟病毒負荷。藉由將心臟轉導率除以肝臟病毒負荷來確定心臟/肝臟比率。所有四種新穎蛋白殼在此個別測試中顯示改善的心臟/肝臟比率，與所彙集的測試結果一致( 圖 14)。

為了測試新穎蛋白殼之優異效能是否具有CD-1小鼠品系特異性，利用得自Charles River Laboratories的第二種小鼠品系C57BL/6NCrl評價ZC401及AAV9。藉由眼窩後注射投與2E+13 vg/kg的病毒。注射後第18天處死動物。如上文所描述量測轉導。新穎蛋白殼ZC401證明心臟/肝臟比率改善，與CD-1品系結果一致( 圖 15)。

標識符編號	VR-VIII 比對(581-594)	VR-VIII SEQ ID NO:	蛋白殼SEQ ID NO:
ZC375	ATNH NSTYLGAQTG	642	707
ZC401	ATNH MMTTARAQTG	615	512
ZC428	ATNH NSTYLGAQTG	642	539
ZC478	ATNH CSTSIRAQTG	692	589

實例 8 ： 新穎蛋白殼 ZC401 達成增加的心臟轉導率而不出現肝臟超負荷

儘管心臟/肝臟比率改善的新穎蛋白殼可減少肝臟負荷同時無損於心臟轉導，但其亦可在心臟轉導改善時實現較高安全劑量且肝臟病毒負荷仍然低於常規劑量的AAV9。為了測試後一種應用，執行概念驗證研究，利用CD-1小鼠比較ZC401與AAV9。藉由眼窩後注射投與2E+13 vg/kg (AAV9及ZC401)或1.2E+14 vg/kg (ZC401)的病毒。注射後第18天處死動物。基於RT-qPCR定量心臟中之轉殖基因mRNA表現來量測心臟轉導。基於qPCR定量肝臟中之轉殖基因DNA複本來量測肝臟病毒負荷。藉由將心臟轉導率除以肝臟病毒負荷來確定心臟/肝臟比率。量測值為相對於AAV9的變化倍數。1.2E+14 vg/kg劑量的新穎蛋白殼ZC401顯示的心臟轉導水平為2E+13 vg/kg之AAV9的8倍，同時肝臟病毒負荷僅為其21% ( 圖 16)。

本文所描述之資料利用NHP、小鼠、豬及人類iPSC衍生之心肌細胞(hiPSC-CM)表徵102種蛋白殼且鑑別出多種新穎AAV蛋白殼具有優異的特性，包括改善的心臟/肝臟比率、改善的心肌細胞轉導率及極佳的不同物種間一致性。總之，此等新穎AAV蛋白殼使得心臟病症的基因療法更有效且更安全。實例 9： 利用多種哺乳動物模型表徵具有 N452K 取代的 AAV9 蛋白殼

為了測試N452K取代與基於AAV9之蛋白殼變異體的相容性及表徵N452K如何影響轉導效率，產生14種含有N452K的其他變異體且藉由將其與野生型親本AAV9或基於AAV9之VR-VIII取代變異體比較進行測試。此研究之目的係比較具有N452K取代之AAV蛋白殼(其中一些描述於上述實例 5中，且進一步描述於圖 17中)與親本AAV9蛋白殼(包括野生型AAV9及具有VR-VIII取代之AAV9蛋白殼)在多種模型(包括非人類靈長類動物、小鼠及活體外人類iPSC-CM)中的效能。

如實例 5 及 6中所描述，活體內在食蟹獼猴及C57BL/6NCrl小鼠中以及活體外對人類iPSC衍生之心肌細胞投與且測試蛋白殼，但其中使用以下劑量：食蟹獼猴給予1.6E+13 vg/kg；小鼠給予3E+13 vg/kg，且iPSC-CM給予10E+4 vg/細胞及10E+5 vg/細胞。如實例 6中所描述量測心臟或肝臟轉導。分別顯示食蟹獼猴、小鼠及iPSC-CM之2隻動物、4隻動物或感染倍率2的平均量測值。投藥途徑、所收集之組織類型及組織收集時序與實例 5 及 6相同。

圖 18表示熱圖資料，其顯示不同組織樣品的轉導效率。熱圖上的各行表示一種蛋白殼且各列表示一種樣品類型。較淺顏色意謂較高值且較深顏色意謂較低值，其中中值灰階代表野生型AAV9對照。AAV9為充當對照之野生型蛋白殼。總之，此資料展現新穎蛋白殼之活體外及活體內存活率及轉導效率。

接著評價對iPSC-CM之轉導效率，以將不具有N452K突變之對照與具有N452K突變之其對應蛋白殼的轉導進行比較。圖 19顯示相較於對照，具有N452K突變之每種蛋白殼的轉導增加，表明心肌細胞的總體轉導效率改善。

相對於野生型AAV9對照的效能，評價新產生之四種蛋白殼在食蟹獼猴中的心臟/肝臟比率、心臟轉導率及肝臟病毒負荷量測值( 圖 20)。如上文所描述向動物投與病毒且收集組織。ZC536及ZC538蛋白殼顯示改善的心臟/肝臟比率且觀測到各種蛋白殼的心臟轉導相對於AAV9增加。實例 10 ：新產生之 AAV9 蛋白殼在非人類靈長類動物中的生物分佈及轉導

為了個別地表徵實例 7中所描述之蛋白殼在NHP中的效能(每個動物一種測試物)，經由單次注射6E+13 vg/kg的AAV9、ZC375或ZC428全身性投與NHP。將研究分成兩個階段(根據圖 21中所描繪之實驗設計)且在各階段中測試一種新穎蛋白殼及AAV9對照，每種測試物4隻食蟹獼猴。注射後第28天處死動物。自心臟及肝臟組織萃取RNA及DNA，隨後基於RT-qPCR定量病毒轉殖基因mRNA表現且基於qPCR定量病毒DNA基因體負荷。

心臟中之病毒轉殖基因表現量藉由對RNA樣品之RT-qPCR分析量測且標準化為所有AAV9資料點之平均值。ZC375與ZC428在心臟中均展現出類似於其匹配AAV9對照的轉殖基因表現( 圖 22)。量測的各樣品代表一個個別動物，分析其4個心臟切片樣品且取平均值。

藉由對RNA樣品進行RT-qPCR分析來量測NHP肝臟中的病毒轉殖基因表現量且相對於所有AAV9資料點的平均值標準化。藉由對DNA樣品進行qPCR分析來量測病毒基因體負荷量且相對於所有AAV9資料點的平均值標準化。ZC375及ZC428顯示在RNA與DNA層面上，肝臟中的轉導相較於其匹配的AAV9對照減少( 圖 23A 及 23B)。各所量測之樣品代表一個個別動物，對其分析2個肝臟切片樣品且取平均值。

計算來自上述NHP生物分佈及轉導研究的心臟轉導/肝臟轉導比率之間的比較。利用基於心臟RNA的量測值及基於肝臟RNA的量測值( 圖 24A)或基於心臟RNA的量測值及基於肝臟DNA的量測值( 圖 24B)，證明ZC375及ZC428相較於其匹配的AAV9對照具有改善的心臟/肝臟比率。總之，此資料證明ZC375與ZC428蛋白殼在NHP中的轉導效率及心臟/肝臟比率相較於野生型AAV9均得到改善。 參考文獻併入

本文中引用諸如專利、專利申請案及公開案之各種參考文獻，其揭示內容以全文引用的方式併入本文中。此外，本文所提及之所有參考文獻均以引用的方式特定併入以揭示及描述與所引用之公開案相關的方法及/或材料。

圖 1描繪AAV9蛋白殼，其中所選擇AAV9可變區(VR-IV及VR-VIII位)中之胺基酸突出顯示。

圖 2顯示定向演化選擇策略及變異體表徵的示意圖。產生庫之後，在靈長類動物中對各庫進行兩輪的選擇。

圖 3顯示用於篩選蛋白殼蛋白變異體的載體基因體之載體圖譜。

圖 4顯示得自第二輪篩選之資料圖。按照log ₂尺度，將肝臟病毒基因體豐度相對於心臟mRNA轉錄本豐度作圖(「心臟轉導」)。將各種情況下的值相對於參考AAV9病毒粒子的值標準化。

圖 5A 至圖 5C標繪因具有所需細胞特性(相對於AAV9的較高心臟轉導率、相對於AAV9的較高心臟/肝臟比率，或兩者)而被選擇的102種變異體。

圖 5A在x軸上標繪102種所選擇變異體的心臟轉導率量測值且在y軸上標繪心臟/肝臟比率。

圖 5B顯示表4中之1號子庫的變異體子集，其具有隨機化VR-IV (AAV9 VP1的胺基酸452至458)與經取代的VR-VIII (AAV9 VP1的胺基酸586至589)。

圖 5C顯示具有經修飾之VR-VIII (AAV9 VP1之胺基酸581至594)的新穎變異體。

圖 6顯示具有經工程化蛋白殼蛋白之rAAV病毒粒子於小鼠模型中再測試的示意圖。

圖 7A 至圖 7C展示所選擇變異體及AAV9參考之心臟轉導( 圖 7A)、肝臟病毒負荷( 圖 7B)及心臟/肝臟比率( 圖 7C)量測值。

圖 8A 至圖 8B顯示經修飾之病毒蛋白殼的示意圖( 圖 8A)及用於評價經修飾之條碼化病毒蛋白殼轉導之動物模型之多種器官及組織中之轉導效率的篩選策略示意圖( 圖 8B)。

圖 9顯示的圖量測不具有N452K突變之新穎蛋白殼(ZC404、ZC470、ZC428及ZC416)及具有N452K突變之新穎蛋白殼(ZC373、ZC374、ZC375及ZC376)於食蟹獼猴心臟及肝臟、小鼠心臟及肝臟以及人類iPSC中的轉導/病毒負荷量。

圖 10顯示用於評價經修飾之病毒蛋白殼轉導之動物模型之多種器官及組織中之轉導效率的篩選策略示意圖。

圖 11A 至圖 11B顯示經修飾之AAV蛋白殼之轉導效率的熱圖。各行表示一種蛋白殼，且各列為一種樣品類型。分別顯示食蟹獼猴、小鼠、豬及iPSC-CM之4隻動物、3隻動物、6隻動物或2隻動物感染倍率的平均量測值。蛋白殼依序排成行，依據其在食蟹獼猴中的心臟/肝臟比率自左向右排序。AAV9-1、AAV9-2及AAV9-3皆為野生型AAV9蛋白殼，其充當對照複本。

圖 12提供的圖顯示使用四種新穎AAV蛋白殼之食蟹獼猴、小鼠及豬的心臟轉導率、肝臟病毒負荷及心臟/肝臟轉導比率。結果顯示相對於野生型AAV9對照的變化倍數。

圖 13提供的圖顯示與AAV9野生型對照相比，四種新穎蛋白殼於食蟹獼猴中的心臟/肝臟比率、心臟轉導率及肝臟病毒負荷。經由靜脈內推注投與而向動物投與1E+13 vg/kg。注射後第4週收集組織。該圖顯示相對於野生型AAV9對照的變化倍數。

圖 14提供的圖顯示與AAV9野生型對照相比，ZC375、ZC401、ZC428及ZC478蛋白殼於CD-1小鼠中的心臟/肝臟比率、心臟轉導率及肝臟病毒負荷。經由眼窩後注射投與2E+13 vg/kg的ZC375、ZC401及ZC428病毒，且投與1.45E+13 vg/kg的ZC478病毒。包括劑量匹配的AAV9對照。注射後18天收集組織。結果顯示相對於AAV9對照的變化倍數。

圖 15提供的圖顯示與AAV9野生型對照相比，ZC401蛋白殼於C57BL/6NCrl小鼠中的心臟/肝臟比率、心臟轉導率及肝臟病毒負荷。經由眼窩後注射投與2E+13 vg/kg的病毒。注射後18天收集組織。結果顯示相對於AAV9之變化倍數。

圖 16提供的圖顯示與AAV9野生型對照相比，ZC401蛋白殼於CD-1小鼠中的心臟及肝臟轉導率。經由眼窩後注射投與2E+13 vg/kg (AAV9及ZC401)或1.2E+14 vg/kg (ZC401)的病毒。注射後18天收集組織。結果顯示相對於AAV9之變化倍數。

圖 17顯示N452K取代併入基於AAV9之蛋白殼變異體中。該圖提供蛋白殼結構的影像及表格，該影像繪示VR-VIII區域及N452 (Asn452)在野生型AAV9蛋白殼上的位置，且該等表格顯示基於AAV9之VR-VIII取代變異體之親本蛋白殼(左側)及新穎N452K蛋白殼(右側)的序列名稱。

圖 18顯示在多種模型中對N452K變異體的測試。該圖顯示來自圖 17之經修飾AAV蛋白殼的轉導效率熱圖。各行表示一種蛋白殼，且各列為一種樣品類型。使用基於彙集之條碼的方法，在食蟹獼猴、小鼠及人類iPSC-CM中測試N452K變異體。藉由對RNA樣品進行基於NGS之定量來量測心臟轉導率及iPSC-CM轉導率。藉由對DNA樣品進行基於NGS之定量來量測肝臟病毒負荷。藉由將心臟轉導率除以肝臟病毒負荷來計算心臟/肝臟比率。所有量測值皆相對於AAV9對照標準化。

圖 19圖示N452K變異體之iPSC-CM轉導效率相較於不具有N452取代之匹配親本蛋白殼改善(變化倍數)。N452K取代始終增強之轉導效率。

圖 20提供的圖顯示與AAV9野生型對照相比，來自圖 18之所選蛋白殼於食蟹獼猴(非人類靈長類動物或「NHP」)中的心臟/肝臟比率、心臟轉導率及肝臟病毒負荷。所有值皆相對於野生型AAV9對照的效能。相對於AAV9，ZC533、ZC536及ZC538在NHP中顯示改善的心臟/肝臟比率及/或改善的心臟轉導率。

圖 21顯示對新穎蛋白殼及AAV9於NHP中之生物分佈及轉導進行比較的實驗示意圖。在此實驗中，量測頂級蛋白殼在以治療相關劑量個別注射之NHP (每隻動物注射一種測試物)中的效能。全身性投與6E+13 vg/kg的AAV9、ZC375及ZC428。此研究分成兩個階段且在各階段中，測試一種新穎蛋白殼及AAV9對照，每種測試物使用4隻食蟹獼猴。注射後第28天處死動物。從心臟及肝臟組織中萃取出RNA及DNA，隨後對病毒進行基於RT-qPCR的定量。

圖 22圖示心臟中之病毒轉殖基因表現(「心臟RNA」)量，其得自圖 21中所描繪之NHP生物分佈及轉導研究。藉由對RNA樣品進行RT-qPCR分析來量測病毒轉殖基因表現量且相對於所有AAV9資料點的平均值標準化。該圖上的各點表示一隻個別動物，其4個心臟切片樣品已分析且取平均值。ZC375與ZC428在心臟中均顯示類似於其匹配AAV9對照的轉殖基因表現。

圖 23A 至圖 23B圖示肝臟向性相較於AAV9減少。該圖顯示肝臟中之病毒轉殖基因表現量(「肝臟RNA」；圖 23A)及病毒基因體負荷量(「肝臟DNA」；圖 23B)，其得自圖21的NHP生物分佈及轉導研究(其中動物全身性投與6E+13 vg/kg的ZC375、ZC428或野生型對照AAV9)。藉由對RNA樣品進行RT-qPCR分析來量測病毒轉殖基因表現量且相對於所有AAV9資料點的平均值標準化。藉由對DNA樣品進行qPCR分析來量測病毒基因體負荷量且相對於所有AAV9資料點的平均值標準化。該圖上的各點表示一隻個別動物，其2個心臟切片樣品已分析且取平均值。ZC375及ZC428顯示在RNA與DNA層面上，肝臟中的轉導相較於其匹配的AAV9對照減少。

圖 24A 至圖 24B圖示得自圖21中所描繪之NHP生物分佈及轉導研究的心臟轉導/肝臟轉導比率，其利用基於心臟RNA及基於肝臟RNA之量測值計算( 圖 24A)，或利用基於心臟RNA及基於肝臟DNA之量測值計算( 圖 24B)。個別地計算各動物的比率。ZC375及ZC428顯示心臟/肝臟比率相較於其匹配的AAV9對照改善。

TW202404993A_112113370_SEQL.xml

Claims

一種重組腺相關病毒(rAAV)蛋白殼蛋白，其中該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3參考序列具有至少80%胺基酸序列一致性或包含與該參考序列具有至少80%胺基酸序列一致性的序列，且其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置584處或位置583與584之間的胺基酸插入，其包含天冬醯胺酸(N)、蘇胺酸(T)、酪胺酸(Y)、苯丙胺酸(F)及丙胺酸(A)中之一或多者；在位置585處或位置584與585之間的胺基酸插入，其包含組胺酸(H)及甲硫胺酸(M)中之一或多者；在位置586處或位置585與586之間的胺基酸插入，其包含組胺酸(H)、酪胺酸(Y)、纈胺酸(V)、蘇胺酸(T)、丙胺酸(A)、異白胺酸(I)、色胺酸(W)、甲硫胺酸(M)及白胺酸(L)中之一或多者；在位置587處或位置586與位置587之間的胺基酸插入，其包含異白胺酸(I)及脯胺酸(P)中之一或多者；在位置588處或位置587與位置588之間的胺基酸插入，其包含異白胺酸(I)、蘇胺酸(T)及脯胺酸(P)中之一或多者；在位置589處或位置588與位置589之間的胺基酸插入，其包含甘胺酸(G)及麩醯胺酸(Q)中之一或多者；一或多個選自由以下組成之群的胺基酸取代：N452K、N452A、N452V、N452I、G453A、G453N、S454T、S454D、G455N、Q456L、Q456K、N457L、N457V、Q458I及Q458H；及/或一或多個選自由以下組成之群的胺基酸取代：T582D、T582L、T582E、T582A、T582F、T582R、T582P、N583V、N583T、H584R、H584Q、H584K、H584V、H584Y、H584M、H584T、H584W、H584E、H584D、Q585T、Q585C、Q585V、Q585L、Q585N、Q585S、Q585P、Q585A、Q585M、Q585E、Q585Y、Q585G、Q585H、Q585I、S586D、S586T、S586G、S586K、S586M、S586N、S586I、S586Q、S586L、S586P、S586F、S586R、A587F、A587S、A587T、A587N、A587L、A587P、A587V、A587K、A587I、A587R、A587H、A587G、A587M、A587D、A587W、Q588L、Q588S、Q588F、Q588N、Q588G、Q588R、Q588I、Q588V、Q588T、Q588Y、Q588H、Q588M、Q588K、Q588D、A589R、A589I、A589N、A589S、A589V、A589Q、A589F、A589T、A589K、A589H、A589E、A589W、A589L、A589Y、A589M、Q590I、Q590S、Q590N、Q590G、Q590D、Q590R、Q590H、Q590T、Q590M、Q590F、Q590Y、Q590L、A591I、G594Q及G594D。
如請求項1之蛋白殼蛋白，其中該蛋白殼蛋白在VR-VIII位點處包含一個、兩個、三個、四個或更多個取代或插入。
如請求項2之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考SEQ ID NO:1包含在該VR-VIII位點中之584至590位置處之一個、兩個、三個、四個或更多個取代或插入，或包含在該VR-VIII位點中之585至590位置處之一個、兩個、三個、四個或更多個取代或插入。
如請求項1至3中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含： (i)一或多個選自由以下組成之群的胺基酸取代：T582D、T582E、N583V、H584Q、S586K、A587P、A587S、Q588G、Q588M、A589S、A591I、G594Q及G594D； (ii)一或多個選自由以下組成之群的胺基酸取代：T582L、T582A、T582F、T582R、T582P、H584R、H584K、H584V、H584Y、H584M、H584Q、H584W、H584E、H584D、Q585T、Q585N、Q585M、Q585E、Q585V、Q585H、S586T、S586G、S586Q、S586I、S586L、S586F、S586D、S586R、S586M、A587F、A587I、A587H、A587M、A587N、A587W、Q588Y、Q588S、Q588T及Q588R； (iii)一或多個選自由以下組成之群的胺基酸取代：Q585C、Q585S、S586I、A587V及A587G；或 (iv)一或多個選自由以下組成之群的胺基酸取代：Q585V、Q585T、Q585L、Q585C、Q585N、Q585S、Q585M、Q585E、Q585P、Q585A、Q585G、Q585H、Q585I、S586D、S586G、S586T、S586M、S586N、S586L、S586R、S586I、S586K、A587S、A587T、A587N、A587L、A587V、A587K、A587I、A587F、A587P、A587R、A587D、Q588L、Q588S、Q588F、Q588N、Q588R、Q588I、Q588V、Q588T、Q588H、Q588Y、Q588M、Q588K、Q588D、Q588G、A589R、A589I、A589N、A589S、A589V、A589Q、A589F、A589T、A589K、A589H、A589E、A589W、A589L、A589Y、A589M、Q590I、Q590S、Q590N、Q590G、Q590D、Q590R、Q590H、Q590T、Q590M、Q590F、Q590Y及Q590L。
如請求項1至4中任一項之蛋白殼蛋白，其中該蛋白殼蛋白：(i)具有心臟向性(cardiotrophic)；(ii)相較於親本序列，在心臟細胞中展現出增加的轉導效率；(iii)相較於親本序列，在肝臟細胞中展現出降低的轉導效率；及/或(iv)相較於親本序列，對心臟細胞而非對肝臟細胞展現出增加的選擇性。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含一或多個選自由以下組成之群的胺基酸取代：N452K、N452A、N452V、N452I、G453A、G453N、S454T、S454D、G455N、Q456L、Q456K、N457L、N457V、Q458I及Q458H。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置452處之選自由K及N組成之群的胺基酸。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代N452K。
如請求項1至8中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置584處選自由以下組成之群的胺基酸：R及H；在位置585處選自由以下組成之群的胺基酸：N、M、C、E、G、S、V、A、T、H、L及Q；在位置586處選自由以下組成之群的胺基酸：M、D、N、G、A、T、R、I及S；在位置587處選自由以下組成之群的胺基酸：T、N、V、L、I、S、R、P及A；在位置588處選自由以下組成之群的胺基酸：Y、T、S、I、V、F、L、R、N、D、G及Q；在位置589處選自由以下組成之群的胺基酸：L、I、R、S、G、N、T、V、Q、F、E、Y及A；及/或在位置590處選自由以下組成之群的胺基酸：G、R、S、I、H、N、Y、L、M及Q。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；在位置584處選自由以下組成之群的胺基酸：R及H；在位置585處選自由以下組成之群的胺基酸：N、M、C、E、G、S、V、A、T、H、L及Q；在位置586處選自由以下組成之群的胺基酸：M、D、N、G、A、T、R、I及S；在位置587處選自由以下組成之群的胺基酸：T、N、V、L、I、S、R、P及A；在位置588處選自由以下組成之群的胺基酸：Y、T、S、I、V、F、L、R、N、D、G及Q；在位置589處選自由以下組成之群的胺基酸：L、I、R、S、G、N、T、V、Q、F、E、Y及A；及在位置590處選自由以下組成之群的胺基酸：G、R、S、I、H、N、Y、L、M及Q。
如請求項1至8中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置584處之胺基酸R；在位置585處選自由以下組成之群的胺基酸：N、M、C、E、G、S、V、A、T、H及L；在位置586處選自由以下組成之群的胺基酸：M、D、N、G、A、T、R及I；在位置587處選自由以下組成之群的胺基酸：T、N、V、L、I、S、R及P；在位置588處選自由以下組成之群的胺基酸：Y、T、S、I、V、F、L、R、N、D及G；在位置589處選自由以下組成之群的胺基酸：L、I、R、S、G、N、T、V、Q、F、E及Y；及/或在位置590處選自由以下組成之群的胺基酸：G、R、S、I、H、N、Y、L及M。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含以下任何至少兩個、三個、四個、五個、六個、七個或所有八個： (i)在位置452處之胺基酸K； (ii)在位置584處之胺基酸R； (iii)在位置585處選自由以下組成之群的胺基酸：N、M、C、E、G、S、V、A、T、H及L； (iv)在位置586處選自由以下組成之群的胺基酸：M、D、N、G、A、T、R及I； (v)在位置587處選自由以下組成之群的胺基酸：T、N、V、L、I、S、R及P； (vi)在位置588處選自由以下組成之群的胺基酸：Y、T、S、I、V、F、L、R、N、D及G； (vii)在位置589處選自由以下組成之群的胺基酸：L、I、R、S、G、N、T、V、Q、F、E及Y；及 (viii)在位置590處選自由以下組成之群的胺基酸：G、R、S、I、H、N、Y、L及M。
如請求項1至8中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置585處選自由以下組成之群的胺基酸：E、N、G、M、C、V、T及Q；在位置586處選自由以下組成之群的胺基酸：N、T、M、G、D及S；在位置587處選自由以下組成之群的胺基酸：T、L、I、K、S、N、V及A；在位置588處選自由以下組成之群的胺基酸：V、F、Y、L、T、S、I、R及Q；在位置589處選自由以下組成之群的胺基酸：S、N、L、T、I、R及A；及/或在位置590處選自由以下組成之群的胺基酸：I、S、G、H、R及Q。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；在位置585處選自由以下組成之群的胺基酸：E、N、G、M、C、V、T及Q；在位置586處選自由以下組成之群的胺基酸：N、T、M、G、D及S；在位置587處選自由以下組成之群的胺基酸：T、L、I、K、S、N、V及A；在位置588處選自由以下組成之群的胺基酸：V、F、Y、L、T、S、I、R及Q；在位置589處選自由以下組成之群的胺基酸：S、N、L、T、I、R及A；及在位置590處選自由以下組成之群的胺基酸：I、S、G、H、R及Q。
如請求項1至8中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置585處選自由以下組成之群的胺基酸：E、N、G、M、C、V及T；在位置586處選自由以下組成之群的胺基酸：N、T、M、G及D；在位置587處選自由以下組成之群的胺基酸：T、L、I、K、S、N及V；在位置588處選自由以下組成之群的胺基酸：V、F、Y、L、T、S、I及R；在位置589處選自由以下組成之群的胺基酸：S、N、L、T、I及R；及/或在位置590處選自由以下組成之群的胺基酸：I、S、G、H及R。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含以下任何至少兩個、三個、四個、五個、六個或所有七個： (i)在位置452處之胺基酸K； (ii)在位置585處選自由以下組成之群的胺基酸：E、N、G、M、C、V及T； (iii)在位置586處選自由以下組成之群的胺基酸：N、T、M、G及D； (iv)在位置587處選自由以下組成之群的胺基酸：T、L、I、K、S、N及V； (v)在位置588處選自由以下組成之群的胺基酸：V、F、Y、L、T、S、I及R； (vi)在位置589處選自由以下組成之群的胺基酸：S、N、L、T、I及R；及 (vii)在位置590處選自由以下組成之群的胺基酸：I、S、G、H及R。
如請求項1至8中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置585處選自由以下組成之群的胺基酸：E、N、M、C及Q；在位置586處選自由以下組成之群的胺基酸：A、M、G、D、N及S；在位置587處選自由以下組成之群的胺基酸：T、N、V及A；在位置588處選自由以下組成之群的胺基酸：V、Y、T、S、I及Q；在位置589處選自由以下組成之群的胺基酸：S、G、L、I、R及A；及/或在位置590處選自由以下組成之群的胺基酸：I、S、G、R及Q。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；在位置585處選自由以下組成之群的胺基酸：E、N、M、C及Q；在位置586處選自由以下組成之群的胺基酸：A、M、G、D、N及S；在位置587處選自由以下組成之群的胺基酸：T、N、V及A；在位置588處選自由以下組成之群的胺基酸：V、Y、T、S、I及Q；在位置589處選自由以下組成之群的胺基酸：S、G、L、I、R及A；及在位置590處選自由以下組成之群的胺基酸：I、S、G、R及Q。
如請求項1至8中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置585處選自由以下組成之群的胺基酸：E、N、M及C；在位置586處選自由以下組成之群的胺基酸：A、M、G、D及N；在位置587處選自由以下組成之群的胺基酸：T、N及V；在位置588處選自由以下組成之群的胺基酸：V、Y、T、S及I；在位置589處選自由以下組成之群的胺基酸：S、G、L、I及R；及/或在位置590處選自由以下組成之群的胺基酸：I、S、G及R。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含以下任何至少兩個、三個、四個、五個、六個或所有七個： (i)在位置452處之胺基酸； (ii)在位置585處選自由以下組成之群的胺基酸：E、N、M及C； (iii)在位置586處選自由以下組成之群的胺基酸：A、M、G、D及N； (iv)在位置587處選自由以下組成之群的胺基酸：T、N及V； (v)在位置588處選自由以下組成之群的胺基酸：V、Y、T、S及I； (vi)在位置589處選自由以下組成之群的胺基酸：S、G、L、I及R；及 (vii)在位置590處選自由以下組成之群的胺基酸：I、S、G及R。
如請求項1至20中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；及在位置587處之胺基酸取代A587T；且視情況包含在選自由以下組成之群的一個、兩個或更多個位置處之胺基酸N或R：584、585、586、588、589及590。
如請求項1至21中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；及在選自由以下組成之群的一個、兩個或更多個位置處之胺基酸N或R：584、585、586、588、589及590。
如請求項1至22中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；及在選自由以下組成之群的兩個或更多個位置處之胺基酸S：585、586、587、588、589及590。
如請求項1至23中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在位置452處選自由以下組成之群的胺基酸：K及N；及在該VR-VIII位點之區域585-590中之三個、四個、五個或六個位置處之選自由以下組成之群的胺基酸：N、S、T、R及I。
如請求項24之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含：在該VR-VIII位點之區域585-590中之三個、四個、五個或六個位置處之選自由以下組成之群的胺基酸：N、S、T及R。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585E、S586N、A587T、Q588V、A589S、Q590I及N452K。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代S586T、A587L、Q588F、A589N、Q590S及N452K。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585N、A587T、Q588Y、A589L、Q590G及N452K。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585G、A587I、Q588L、A589T、Q590H及N452K。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585M、S586M、A587T、Q588T及Q590R；及在位置452處之胺基酸N。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585N、A587T、Q588Y、A589L及Q590G；及在位置452處之胺基酸N。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585C、A587T、Q588S、A589I及Q590R；及在位置452處之胺基酸N。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585E、S586D、A587N、Q588I、A589R及Q590S；及在位置452處之胺基酸N。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585E、S586D、A587N、Q588I、A589R、Q590S及N452K。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代Q585N、S586N、A587V、Q588I、A589S、Q590G及N452K。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代S586G及Q588Y；及在位置452處之胺基酸N。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含胺基酸取代S586A、A587N、Q588Y、A589G及N452K。
如請求項1至37中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置581-583處之胺基酸ATN及位置591-594處之胺基酸AQTG。
如請求項1至37中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含在位置581-584處之胺基酸ATNH及位置591-594處之胺基酸AQTG。
如請求項1至5中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含： (i)在該VR-VIII位置581-594處之胺基酸序列ATNHENTVSIAQTG，及在VR-IV位置452處之胺基酸K； (ii)在該VR-VIII位置581-594處之胺基酸序列ATNHQTLFNSAQTG，及在該VR-IV位置452處之胺基酸K； (iii)在該VR-VIII位置581-594處之胺基酸序列ATNHNSTYLGAQTG，及在該VR-IV位置452處之胺基酸K； (iv)在該VR-VIII位置581-594處之胺基酸序列ATNHGSILTHAQTG，及在該VR-IV位置452處之胺基酸K； (v)在該VR-VIII位置581-594處之胺基酸序列ATNHMMTTARAQTG，及在該VR-IV位置452處之胺基酸N； (vi)在該VR-VIII位置581-594處之胺基酸序列ATNHNSTYLGAQTG，及在該VR-IV位置452處之胺基酸N； (vii)在該VR-VIII位置581-594處之胺基酸序列ATNHCSTSIRAQTG，及在該VR-IV位置452處之胺基酸N； (viii)在該VR-VIII位置581-594處之胺基酸序列ATNHEDNIRSAQTG，及在該VR-IV位置452處之胺基酸N； (ix)在該VR-VIII位置581-594處之胺基酸序列ATNHEDNIRSAQTG，及在該VR-IV位置452處之胺基酸K； (x)在該VR-VIII位置581-594處之胺基酸序列ATNHNNVISGAQTG，及在該VR-IV位置452處之胺基酸K； (xi)在該VR-VIII位置581-594處之胺基酸序列ATNHQGAYAQAQTG，及在該VR-IV位置452處之胺基酸N； (xii)在該VR-VIII位置581-594處之胺基酸序列ATNHQANYGQAQTG，及在該VR-IV位置452處之胺基酸K； (xiii)在該VR-VIII位置581-594處之胺基酸序列ATNHNMNRVNAQTG，及在該VR-IV位置452處之胺基酸N； (xiv)在該VR-VIII位置581-594處之胺基酸序列ATNHNNVISGAQTG，及在該VR-IV位置452處之胺基酸N； (xv)在該VR-VIII位置581-594處之胺基酸序列ATNHSNSVQSAQTG，及在該VR-IV位置452處之胺基酸N； (xvi)在該VR-VIII位置581-594處之胺基酸序列ATNHSSTFQGAQTG，及在該VR-IV位置452處之胺基酸N； (xvii)在該VR-VIII位置581-594處之胺基酸序列ATNHVSSFTSAQTG，及在該VR-IV位置452處之胺基酸N； (xviii)在該VR-VIII位置581-594處之胺基酸序列ATNHSTTNFRAQTG，及在該VR-IV位置452處之胺基酸N； (xix)在該VR-VIII位置581-594處之胺基酸序列ATNHSSIFNSAQTG，及在該VR-IV位置452處之胺基酸N； (xx)在該VR-VIII位置581-594處之胺基酸序列ATNHAGNYNNAQTG，及在該VR-IV位置452處之胺基酸N； (xxi)在該VR-VIII位置581-594處之胺基酸序列ATNHTSVISIAQTG，及在該VR-IV位置452處之胺基酸N； (xxii)在該VR-VIII位置581-594處之胺基酸序列ATNHHSRVEIAQTG，及在該VR-IV位置452處之胺基酸N； (xxiii)在該VR-VIII位置581-594處之胺基酸序列ATNHSSIIYSAQTG，及在該VR-IV位置452處之胺基酸N； (xxiv)在該VR-VIII位置581-594處之胺基酸序列ATNHSGRDSYAQTG，及在該VR-IV位置452處之胺基酸N； (xxv)在該VR-VIII位置581-594處之胺基酸序列ATNHSSSYNNAQTG，及在該VR-IV位置452處之胺基酸N； (xxvi)在該VR-VIII位置581-594處之胺基酸序列ATNHHNPSINAQTG，及在該VR-IV位置452處之胺基酸N； (xxvii)在該VR-VIII位置581-594處之胺基酸序列ATNHNRNGLLAQTG，及在該VR-IV位置452處之胺基酸N； (xxviii)在該VR-VIII位置581-594處之胺基酸序列ATNHESTSVRAQTG，及在該VR-IV位置452處之胺基酸N； (xxix)在該VR-VIII位置581-594處之胺基酸序列ATNHNIRTEMAQTG，及在該VR-IV位置452處之胺基酸N； (xxx)在該VR-VIII位置581-594處之胺基酸序列ATNHQTLFNSAQTG，及在該VR-IV位置452處之胺基酸N； (xxxi)在該VR-VIII位置581-594處之胺基酸序列ATNHLSVSSIAQTG，及在該VR-IV位置452處之胺基酸N； (xxxii)在該VR-VIII位置581-594處之胺基酸序列ATNHEDIIRSAQTG，及在該VR-IV位置452處之胺基酸N； (xxxiii)在該VR-VIII位置581-594處之胺基酸序列ATNRQTAQAQAQTG，及在該VR-IV位置452處之胺基酸N；或 (xxxiv)在該VR-VIII位置581-594處之胺基酸序列ATNRQIAQAQAQTG，及在該VR-IV位置452處之胺基酸N。
如請求項1至8中任一項之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含： (i)在位置584處之胺基酸插入，其包含天冬醯胺酸(N)、蘇胺酸(T)、酪胺酸(Y)、苯丙胺酸(F)及丙胺酸(A)中之一或多者； (ii)在位置585處之胺基酸插入，其包含組胺酸(H)及甲硫胺酸(M)中之一或多者； (iii)在位置586處之胺基酸插入，其包含組胺酸(H)、酪胺酸(Y)、纈胺酸(V)、蘇胺酸(T)、丙胺酸(A)、異白胺酸(I)、色胺酸(W)、甲硫胺酸(M)及白胺酸中之一或多者； (iv)在位置587處之胺基酸插入，其包含異白胺酸(I)及脯胺酸(P)中之一或多者； (v)在位置588處之胺基酸插入，其包含異白胺酸(I)、蘇胺酸(T)及脯胺酸(P)中之一或多者；及/或 (vi)在位置589處之胺基酸插入，其包含甘胺酸(G)及麩醯胺酸(Q)中之一或多者。
如請求項41之蛋白殼蛋白，其中該蛋白殼蛋白相對於參考序列SEQ ID NO: 1包含： (i)在位置584處之由以下組成的胺基酸插入：TY、FN或AT； (ii)在位置585處之由以下組成的胺基酸插入：MH； (iii)在位置586處之由以下組成的胺基酸插入：HY、VT、AI、WM或ML； (iv)在位置587處之由以下組成的胺基酸插入：PI；及/或 (v)在位置588處之由以下組成的胺基酸插入：IT或PT。
如請求項1至42中任一項之蛋白殼蛋白，其中除指定修飾之外，該蛋白殼蛋白與根據SEQ ID NO: 487之AAV9 VP3序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少99%或100%胺基酸序列一致性或包含與該AAV9 VP3序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少99%或100%胺基酸序列一致性的序列。
如請求項1至43中任一項之蛋白殼蛋白，其中除該等指定修飾之外，該蛋白殼蛋白與根據SEQ ID NO: 486之AAV9 VP2序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少99%或100%胺基酸序列一致性或包含與該AAV9 VP2序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少99%或100%胺基酸序列一致性的序列。
如請求項1至44中任一項之蛋白殼蛋白，其中除該等指定修飾之外，該蛋白殼蛋白與根據SEQ ID NO: 1之AAV9 VP1序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少99%或100%胺基酸序列一致性或包含與該AAV9 VP1序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少99%或100%胺基酸序列一致性的序列。
如請求項1至45中任一項之蛋白殼蛋白，其中該蛋白殼蛋白包含與選自由以下組成之群的任何序列具有至少85%、90%、95%、96%、97%、98%、99%或100%序列一致性的胺基酸序列或其功能片段、基本上由該胺基酸序列或其功能片段組成、或由該胺基酸序列或其功能片段組成：SEQ ID NOs:488、499、504、505、506、510、512、513、516、518、521、522、533、536、539、558、562、566、571、576、578、579、580、581、585、588、589、705、706、707、708、710、772及774。
如請求項1之蛋白殼蛋白，其中該蛋白殼蛋白包含選自由以下組成之群的多肽序列、基本上由該多肽序列組成、或由該多肽序列組成：SEQ ID NOs:488、499、504、505、506、510、512、513、516、518、521、522、533、536、539、558、562、566、571、576、578、579、580、581、585、588、589、705、706、707、708、710、772及774。
一種重組腺相關病毒(rAAV)病毒粒子，其包含如請求項1至47中任一項之蛋白殼蛋白及載體基因體，該載體基因體包含側接有反向末端重複序列(ITR)之聚核苷酸卡匣。
如請求項48之rAAV病毒粒子，其中該rAAV病毒粒子轉導心臟細胞。
如請求項48或請求項49之rAAV病毒粒子，其中該rAAV病毒粒子轉導心肌細胞。
如請求項48至50中任一項之rAAV病毒粒子，其中該rAAV病毒粒子運輸至除肝臟以外之至少一個器官。
如請求項48至50中任一項之rAAV病毒粒子，其中該rAAV病毒粒子運輸至心臟。
如請求項48至52中任一項之rAAV病毒粒子，其中該rAAV病毒粒子展現的心臟轉導效率高於具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白的rAAV病毒粒子。
如請求項48至53中任一項之rAAV病毒粒子，其中該rAAV病毒粒子展現出比具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白的rAAV病毒粒子更高的心臟/肝臟轉導比率，視情況高至少2、3、4、5、6、7、8、9或10倍。
如請求項48至54中任一項之rAAV病毒粒子，其中向個體投與該rAAV病毒粒子引起比投與具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白之rAAV病毒粒子更低的肝臟病毒負荷，視情況低至少2、3、4、5、6、7、8、9或10倍。
如請求項48至55中任一項之rAAV病毒粒子，其中在靈長類動物中評估之該rAAV病毒粒子展現出比具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白的rAAV病毒粒子更高的轉導效率，視情況更高的心臟轉導效率。
如請求項48至56中任一項之rAAV病毒粒子，其中在靈長類動物中評估之該rAAV病毒粒子展現出比具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白的rAAV病毒粒子更高的心臟/肝臟轉導比率，視情況高至少2、3、4、5、6、7、8、9或10倍。
如請求項48至57中任一項之rAAV病毒粒子，其中在靈長類動物中評估之向個體投與該rAAV病毒粒子引起比投與具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白之rAAV病毒粒子更低的肝臟病毒負荷，視情況低至少2、3、4、5、6、7、8、9或10倍。
如請求項48至58中任一項之rAAV病毒粒子，其中該聚核苷酸卡匣包含編碼以下之聚核苷酸序列：MYBPC3、DWORF、PKP2、KCNH2、TRPM4、DSG2、TGFBR2、TGFBR1、EMD、KCNQ1、TAZ、COL3A1、JUP、CASQ2、MLRP44、DNAJC19、LMNA、TNNI3、DSP、DSG2、RAF1、SOS1、FBN1、LAMP2、FXN、RAF1、BAG3、KCNQ1、MYLK3、CRYAB、ALPK3、ACTN2、JPH2、PLN、ATP2A2、CACNA1C、DMD、DMPK、EPG5、EVC、EVC2、FBN1、NF1、SCN5A、SOS1、NPR1、ERBB4、VIP、MYH6、MYH7、Cas9、RBM20、MYOCD、ASCL1、GATA4、MEF2C、TBX5、miR-133或MESP1。
如請求項48至59中任一項之rAAV病毒粒子，其中該聚核苷酸卡匣包含編碼選自由以下組成之群之蛋白質的聚核苷酸序列：MYBPC3、DWORF、PKP2、LMNA、LAMP2、BAG3、CRYAB、JPH2、PLN、TTNI3、MYOCD、ASCL1、DSP、JUP、DSP、MYH6、MYH7、RBM20及Cas9。
一種醫藥組合物，其包含如請求項48至60中任一項之rAAV病毒粒子及醫藥學上可接受之載劑。
一種聚核苷酸，其編碼如請求項1至47中任一項之蛋白殼蛋白。
一種轉導心臟細胞之方法，其包含使該心臟細胞與如請求項48至60中任一項之rAAV病毒粒子接觸，其中該rAAV病毒粒子轉導該心臟細胞。
如請求項63之方法，其中該心臟細胞為心肌細胞。
如請求項63或請求項64之方法，其中該rAAV病毒粒子對細胞展現的轉導效率高於具有根據SEQ ID NO: 1之AAV9 VP1蛋白殼蛋白的rAAV病毒粒子。
一種向心臟細胞遞送一或多種基因產物之方法，其包含使該心臟細胞與如請求項48至60中任一項之rAAV病毒粒子接觸。
如請求項66之方法，其中該心臟細胞為心肌細胞。
一種治療有需要之個體之心臟病理的方法，其包含向該個體投與治療有效量之如請求項48至60中任一項之rAAV病毒粒子，其中該rAAV病毒粒子轉導心臟組織。
一種治療有需要之個體之心臟疾病或病況的方法，其包含向該個體投與治療有效量之如請求項48至60中任一項之rAAV病毒粒子。
一種套組，其包含如請求項61之醫藥組合物及使用說明書。